ES2276671T3 - Procedimiento de control de la calidad de una señal audio numerica difundida con un programa audiovisual. - Google Patents
Procedimiento de control de la calidad de una señal audio numerica difundida con un programa audiovisual. Download PDFInfo
- Publication number
- ES2276671T3 ES2276671T3 ES00909432T ES00909432T ES2276671T3 ES 2276671 T3 ES2276671 T3 ES 2276671T3 ES 00909432 T ES00909432 T ES 00909432T ES 00909432 T ES00909432 T ES 00909432T ES 2276671 T3 ES2276671 T3 ES 2276671T3
- Authority
- ES
- Spain
- Prior art keywords
- signal
- value
- audio signal
- samples
- numerical
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04H—BROADCAST COMMUNICATION
- H04H20/00—Arrangements for broadcast or for distribution combined with broadcast
- H04H20/86—Arrangements characterised by the broadcast information itself
- H04H20/88—Stereophonic broadcast systems
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04H—BROADCAST COMMUNICATION
- H04H20/00—Arrangements for broadcast or for distribution combined with broadcast
- H04H20/12—Arrangements for observation, testing or troubleshooting
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Stereophonic System (AREA)
- Stereo-Broadcasting Methods (AREA)
Abstract
Procedimiento de control de la calidad de una señal audio numérica, caracterizado porque ese procedimiento consiste en detectar en esa señal audio numérica una al menos de las señales parásitas tales como breve corte, silbido, bordoneo y defasaje relativo a las vías izquierda y derecha de esa señal audio numérica, lo que permite engendrar una señal de alarma en presencia de una al menos de las señales parásitas.
Description
Procedimiento de control de la calidad de una
señal audio numérica difundida con un programa audiovisual.
La invención concierne a un procedimiento de
control de la calidad de una señal audio numérica distribuida por
difusión de un programa de vídeo o de audio.
Con la multiplicación de los intercambios y de
la difusión de informaciones, los métodos de codificación audio
numéricos empleados por los servicios de teledifusión han permitido
reducir la cantidad de informaciones a transmitir por programa, y
en consecuencia, aumentar el número de programas teledifundidos por
las vías de teledifusión. En contraparte, esta reducción puede
provocar una pérdida irremediable de la calidad de las
informaciones, es decir del sonido, con relación a la fuente. La
importancia de los defectos introducidos depende a la vez del flujo
asignado al codificador, de la complejidad de la señal sonora, así
como de los problemas unidos a la transmisión de la
señal.
señal.
Por razones técnicas y/o de responsabilidad
relativa a los procedimientos de teledifusión, es necesario, para
satisfacer las exigencias de los usuarios, evaluar el nivel de la
calidad de la señal audio.
En la actualidad, métodos de evolución
subjetivos de equipos, por apreciación o vigilancia humana, son
utilizados. Estos métodos son sin embargo pesados de llevar a la
práctica, y poco confiables. Además, la puesta en práctica de tales
métodos en continuo no es muy fácil, en razón de las implicaciones
subjetivas frente al personal llamado a asegurar la ejecución.
Métodos por análisis diferencial han sido
también desarrollados. Estos métodos están basados en un sistema
auditivo humano de percepción, que pone en juego una fuente sonora
de referencia y la fuente sonora a evaluar.
Tal solución se revela sin embargo poco práctica
ya que es necesario disponer de la fuente de referencia.
Otros modos de operación, basados en el
conocimiento a priori de los defectos engendrados por la
cadena de los procesos codificación/transmisión/decodificación,
pueden permitir, por métodos estadísticos, apreciar la calidad de
la señal audio numérica transmitida, midiendo la tasa de aparición
de esos defectos.
Tales modos de operación han sido descritos por
los documentos WO 98/06196, DE 30 34 582 o DE 33 11 645.
El documento WO 98/06196 describe un
procedimiento de evaluación de la calidad de una señal vocal
transmitida, a partir de un análisis de la función de transferencia
del sistema de comunicación y de las potencias espectrales de
señales a frecuencias determinadas. El procedimiento antes citado no
hace ningún llamado a la detección de ruidos específicos.
Los documentos DE 30 34 582 y DE 33 11 645
proponen un tratamiento del ruido de crujido, introducido por un
defecto de codificación, por tratamiento analógico previo al proceso
de conversión analógico-numérico.
La presente invención tiene como objeto remediar
los inconvenientes de las metodologías antes citadas para la puesta
en práctica de un procedimiento de control de la calidad de una
señal audio numérica enteramente automatizado, en ausencia de la
utilización de una fuente de referencia.
Otro objeto de la presente invención es
igualmente la puesta en práctica de un procedimiento de control
automatizado de la calidad de una señal audio numérica susceptible
de ser realizada de manera continua o
pseudo-continua, el carácter
pseudo-continuo de esta puesta en práctica
entendiéndose por una puesta en práctica periódica con un período
de repetición suficientemente bajo para asegurar a los usuarios la
percepción de una teledifusión con cualidades constantes en el
curso de la teledifusión de uno o varios programas sucesivos.
Otro objetivo de la presente invención es
igualmente la puesta en práctica de un procedimiento de control de
la calidad de una señal audio numérica en continuo que permite
además, a partir de procesos de control de calidad de esa señal
distinta, relativos a defectos distintos de esa señal, asegurar un
control de calidad global, traduciéndose por un confort de escucha
hasta hoy desigual de los programas teledifundidos.
El procedimiento de control de la calidad de una
señal audio numérica, objeto de la presente invención, es
destacable ya que el mismo consiste, en una señal audio numérica
mono- o estereofónica, en detectar en esa señal audio numérica una
al menos de las señales parásitas tales como breve corte, silbido,
bordoneo y defasaje relativo a las vías izquierda y derecha de esa
señal audio numérica, lo que permite engendrar una señal de alarma
en presencia de una al menos de las señales parásitas.
Según un aspecto del procedimiento, objeto de la
presente invención, la etapa que consiste en detectar en esa señal
audio numérica una señal parásita tal como un breve corte consiste
en detectar en una sucesión de muestras sucesivas de esa señal
numérica un decrecimiento rápido del nivel de energía de esa señal
audio numérica hacia una energía nula, revelando de esta forma una
ausencia de reverberación de esa señal audio numérica.
Según otro aspecto del procedimiento, objeto de
la presente invención, la etapa que consiste en detectar en esa
señal audio numérica una señal parásita tal como un silbido consiste
en detectar en esa señal numérica un aumento súbito y transitorio
de la energía espectral de esa señal audio numérica en una banda de
frecuencias donde la frecuencia baja está comprendida entre 4,5
kHz y 6,5 kHz y donde la frecuencia alta puede alcanzar hasta 20
kHz.
Según otro aspecto del procedimiento objeto de
la presente invención, la etapa que consiste en detectar, en esa
señal audio numérica, una señal parásita tal como un bordoneo
consiste en detectar en esa señal parásita un ruido rosa en una
banda de frecuencias comprendida entre 0 y 1100 Hz y de nivel
sensiblemente constante en esta banda de frecuencias.
Según otro aspecto del procedimiento, objeto de
la presente invención, la etapa que consiste en detectar, en esa
señal audio numérica, una señal parásita tal como un defasaje entre
las vías de la señal audio numérica consiste en calcular el valor
de defasaje entre las vías de la señal audio numérica a partir de la
función de inter-correlación de la señal audio
numérica presente en cada una de las vías y en comparar el valor de
defasaje calculado con un valor umbral.
Según otro aspecto del procedimiento, objeto de
la presente invención, la etapa que consiste en discriminar el modo
mono- o estereofónico de la señal transmitida consiste en detectar
cambios súbitos y breves de contexto de modo mono- o estereofónico
de la señal transmitida, o recíprocamente, a partir de una
comparación de las energías de las vías derecha e izquierda.
El procedimiento de control de la calidad de una
señal audio numérica objeto de la presente invención encuentra
aplicación en cualquier tipo de señal audio numérica sometida a un
proceso de codificación, de transmisión y luego de decodificación,
las operaciones de codificación/decodificación pudiendo ser
asimiladas en operaciones de compresión/descompresión, en
particular de señales de radio difusión numérica tal como el D.A.B.,
o en señales de la vía de audiofrecuencia de una señal de
televisión numérica por ejemplo.
Será mejor comprendido con la lectura de la
descripción y con la observación de los dibujos a continuación en
los cuales, además de la figura 1 relativa a las técnicas
anteriores:
- la figura 2a representa, a título de ejemplo
no limitativo, un organigrama general que ilustra las etapas que
permiten la puesta en práctica del procedimiento objeto de la
presente invención;
- la figura 2b representa, a título de ejemplo
no limitativo, un organigrama general que ilustra las etapas que
permiten la puesta en práctica del procedimiento objeto de la
presente invención, en una variante de la figura 2a en la cual una
detección del carácter monofónico o estereofónico de la señal audio
numérica transmitida es efectuada;
- la figura 3a representa, a título de ejemplo
no limitativo, un organigrama general que ilustra las etapas que
permiten la puesta en práctica del procedimiento objeto de la
presente invención, en una variante no limitativa en la cual una
calidad global de la señal es puesta en evidencia;
- la figura 3b representa, a título de ejemplo
no limitativo, un organigrama general que ilustra las etapas que
permiten la puesta en práctica del procedimiento objeto de la
presente invención, en una variante de aquella ilustrada en la
figura 3a y en la cual ordenes de prioridad distintos son
introducidos para las diferentes señales parásitas susceptibles de
afectar la señal audio numérica;
- la figura 3c representa, a título de ejemplo
no limitativo, un proceso de gestión específico de los ordenes de
prioridad asignados a las señales parásitas tales como el silbido,
el defasaje y el bordoneo, susceptible de ser llevado a la práctica
en el marco de la variante de realización presentada en la figura 3a
o 3b;
- la figura 4 representa, a título de ejemplo no
limitativo, un organigrama relativo al proceso de discriminación
del carácter monofásico o estereofónico de la señal audio numérica
transmitida;
- la figura 5a representa, a título de ejemplo
no limitativo, un proceso susceptible de ser puesto en práctica
para asegurar la detección de un breve corte de la señal audio
numérica;
- la figura 5b representa, a título de ejemplo
no limitativo, un organigrama relativo a las etapas que permiten
llevar a cabo la detección de un breve corte de la señal audio
numérica, de conformidad con el proceso ilustrado en la figura
5a;
- la figura 6a representa, a título de ejemplo
no limitativo, un proceso susceptible de ser puesto en práctica
para asegurar la detección de un silbido que afecta la señal audio
numérica;
- la figura 6b representa, a título de ejemplo
no limitativo, un organigrama relativo a las etapas que permiten la
puesta en práctica de la detección de un silbido que afecta la señal
audio numérica; de conformidad con el proceso ilustrado en la
figura 6a;
\newpage
- la figura 7a representa, a título de ejemplo
no limitativo, un proceso susceptible de ser puesto en práctica
para asegurar la detección de un bordoneo que afecta la señal audio
numérica;
- la figura 7b representa, a título de ejemplo
no limitativo, un organigrama relativo a las etapas que permiten la
puesta en práctica de la detección de un bordoneo que afecta la
señal audio numérica; de conformidad con el proceso ilustrado en la
figura 7a;
- la figura 8a representa, a título ilustrativo,
un organigrama relativo a las etapas que permiten la puesta en
práctica de la detección de un defasaje que afecta las vías derecha
e izquierda de la señal audio numérica;
- la figura 8b representa, a título de ejemplo
no limitativo, un detalle de la puesta en práctica de una etapa del
organigrama de la figura 8a;
- la figura 8c representa, a título puramente
ilustrativo, una etapa de cálculo puesto en práctica en el marco
del procedimiento, objeto de la presente invención, representado en
la figura 8b;
- la figura 9 representa un dispositivo conforme
al objeto de la invención.
Previamente a la descripción propiamente dicha
del procedimiento, objeto de la presente invención, diferentes
elementos relativos a las condiciones de transmisión y de
distribución de las señales audio numéricas serán descritos en
unión con la figura 1.
De una manera general, con referencia a la
figura antes citada, se indica que los programas, programa audio
numérico o canal de audio de programa vídeo o de TV numérico,
programas Pr_{1}, Pr_{2}, Pr_{3}, son sometidos a un proceso
de compresión y luego, después del multiplexaje MUX, a una
transmisión propiamente dicha por teledifusión por vía hertziana
por ejemplo.
Con la recepción, la señal audio numérica es en
primer lugar demultiplexada DMUX y luego sometida a un proceso de
descompresión que restablece los programas, los programas sometidos
a las operaciones sucesivas de compresión, multiplexaje,
transmisión, demultiplexaje, descompresión, es decir de hecho
programas audio numéricos codificados/decodificados, denotados
\tilde{P}r_{1}, \tilde{P}r_{2}, \tilde{P}r_{3}, son
entonces sometidos a la distribución ente los usuarios. En el marco
de una transmisión de tipo DAB, por Digital Audio Broadcasting, la
señal audio numérica está subdividida en tramas que comprenden por
ejemplo, para una compresión de tipo MPEG1 LII, 1152 muestras de la
longitud de la trama transmitida dependiendo de la tasa de
compresión o del flujo de codificación utilizado. La trama
codificada comprende bits de sincronización S_{inc} de los bits
de código de corrección de errores CRC y finalmente los bits de
datos audio numéricos propiamente dichos. De una manera general, la
señal audio numérica antes citada, para cada programa considerado
Pr_{1} a Pr_{3} es tanto una señal monofónica, como una señal
estereofónica. Cuando la señal es monofónica, esa señal está
presente de manera idéntica en las vías derecha e izquierda del
canal audio numérico, y llegado el caso a un valor de defasaje
cercano. Cuando por el contrario, la señal es estereofónica, cada
vía izquierda y derecha del canal audio numérico transmite una
señal audio numérica que le es propia a fin de restituir las
condiciones de registro en
estudio.
estudio.
El procedimiento de control de la calidad de una
señal audio numérica en distribución, conforme al objeto de la
presente invención, es puesto en práctica en una señal audio
numérica codificada/decodificada, es decir sometidas al conjunto de
los tratamientos sucesivos descritos en unión con la figura 1. Será
ahora descrito en primer lugar en unión con las figuras 2a y 2b.
Así como es representado en la figura 2a, el
procedimiento, objeto de la presente invención, es aplicado a la
señal audio numérica codificada/decodificada precedentemente citada,
designada par ADS, esa señal corresponde a los programas
\tilde{P}r_{1}, \tilde{P}r_{2}, \tilde{P}r_{3}, antes
citados.
Según una característica particularmente
ventajosa del procedimiento objeto de la presente invención, el
mismo consiste en detectar en esa señal audio numérica una al menos
de las señales parásitas tales como la señal de breve corte, de
silbido, de bordoneo, de defasaje relativo de las vías izquierda y
derecha de esa señal audio numérica. Se recuerda que la señal
parásita de breve corte es designada por "muda" en lenguaje
anglosajón.
En la figura 2a, se ha representado, a título
puramente ilustrativo, las operaciones de detección de una señal de
breve corte en la etapa 101, de detección de un silbido en la etapa
102, de detección de un bordoneo en la etapa 103 y de detección de
un defasaje en la etapa 104, el defasaje entendiéndose, claro está,
por un defasaje relativo entre las vías izquierda y derecha G, D,
del canal audio numérico.
La detección de esas señales parásitas
entendiéndose de preferencia una detección independiente de cada una
de ellas, la operación de detección pudiendo permitir el
establecimiento de una variable lógica representativa de la
presencia, respectivamente de la ausencia de esa señal parásita. En
la figura 2a, a título puramente ilustrativo, las variables lógicas
correspondientes son denotadas P_{1}, P_{2}, P_{3}, P_{4}
para las operaciones 101, 102, 103, 104 de detección de las señales
parásitas antes citadas, los valores complementados de estas
variables lógicas representando la ausencia de una señal parásita
por ejemplo.
Además, y de conformidad con un aspecto
particularmente remarcable del procedimiento, objeto de la presente
invención, tal como es ilustrado en la figura 2a, la detección de
una al menos de las señales antes citadas permite engendrar una
señal de alarma, esta operación estando representada en las etapas
105, 106 de la figura 2a.
A título de ejemplo no limitativo y en un modo
ilustrativo, la señal A, señal de accionamiento de una señal de
alarma de potencia, puede por ejemplo corresponder tal y como es
representado en la etapa 105, a une combinación lógica OU del
conjunto de las señales P_{1}, P_{2}, P_{3}, P_{4}, la señal
de alarma de potencia propiamente dicha, tal como una señal sonora,
visual u otra, siendo emitida en la etapa 106 siguiente.
Con referencia a la figura 2a, se indica que, de
conformidad con un aspecto particularmente remarcable del
procedimiento, objeto de la presente invención, la detección de una
de las señales antes citadas permite por ejemplo la emisión de la
señal de alarma considerada.
Se comprende en particular que durante la
emisión de esa señal de alarma, la explotación de la red de
teledifusión es entonces informada de la existencia de una señal
parásita que perturba de manera significativa las condiciones de la
teledifusión y puede en consecuencia tomar cualquier medida de forma
de modificar por ejemplo tanto la codificación del canal de
transmisión, como cualquier operación que juzgue necesaria.
Según otro aspecto particularmente remarcable
del procedimiento, objeto de la presente invención, tal como el
representado en la figura 2b, el mismo puede consistir además en
discriminar el modo de transmisión mono o estereofónico de la señal
audio numérica ADS.
Así como es representado de manera puramente
ilustrativa en la figura 2b, el procedimiento objeto de la presente
invención puede entonces comprender una etapa 100 que consiste en
discriminar el carácter mono o estereofónico de la señal ADS antes
citada. De preferencia, pero de manera no limitativa, esta etapa de
discriminación del carácter mono o estéreo de la señal ADS es
realizada previamente a la realización de las etapas 101, 102, 103,
104 de las señales parásitas. En efecto, en función del carácter
mono o estereofónico de la señal audio numérica transmitida ADS,
diferentes condiciones pueden ser aplicadas para la realización de
la detección de las señales parásitas, específicamente en la etapa
104 que consiste en detectar el defasaje relativo entre las vías
izquierda y derecha del canal audio numérico.
En esas condiciones, y así como es representado
en la figura 2b, la etapa 105 de constitución de una señal lógica
de accionamiento de alarma puede consistir en establecer una señal
que verifica la relación A1 = P_{1} O P_{2} O P_{3} O P_{4}
cuando la señal es monofónica o A2 = P_{1} O P_{2} O P_{3} O
P’_{4}, cuando la señal es estereofónica.
Se comprende por ejemplo que las señales P_{4}
y P’_{4} pueden ser señales lógicas sometidas a condiciones de
valor de defasaje diferentes según si la señal es mono- o
estereofónica. La señal de accionamiento de alarma A1, A2 permite
entonces engendrar la señal de potencia en la etapa 106 así como es
mencionado precedentemente en la descripción.
Claro está, el procedimiento, objeto de la
presente invención, debe permitir, de manera preferencial, la puesta
en práctica de un control de calidad global de la señal audio
numérica ADS. Por calidad global de la señal audio numérica, se
entiende una calidad que permite el mejor confort de escucha para
los usuarios, teniendo en cuenta la naturaleza de las señales
parásitas y claro está, llegado el caso, del carácter mono- o
estereofónico de la señal audio numérica ADS transmitida.
Se comprende en particular que las señales
parásitas antes citadas pueden, en función de las condiciones de
transmisión, no presentar la misma importancia relativamente a la
degradación introducida en las condiciones de escucha de la señal
audio numérica transmitida.
Con ese fin, y con referencia a la figura 3a, se
indica que el procedimiento, objeto de la presente invención, a fin
de establecer un control de calidad global de la señal audio
numérica, puede consistir, en una ventana temporal deslizante de
longitud determinada, es decir en una sucesión de muestras sucesivas
de la señal audio numérica observada en esta ventana deslizante,
para efectuar en combinación diferentes operaciones que apuntan a
ponderar el valor relativo a cada señal parásita detectada frente a
la degradación introducida en las condiciones de escucha antes
citadas.
Así como es representado en la figura 3a, el
procedimiento, objeto de de la presente invención, puede entonces
consistir en descontar el número de ocurrencias N_{M} de señales
parásitas de breve corte durante una duración T_{M} de
observación de esa señal audio numérica y en comparar el número de
ocurrencia N_{M} con un valor de umbral determinado S_{M}. En
la figura 3a, se ha representado la operación antes citada como
consistiendo, a partir de la etapa 101 precedentemente descrita en
unión con las figuras 2a y 2b de detección de un breve corte y de
una etapa 101a de inicialización del número de ocurrencias N_{M}
con el valor cero, durante la existencia de un breve corte en
respuesta a la etapa 101, en provocar el paso al valor N_{M} =
N_{M}+1 en la etapa 101b por incremento de una unidad seguido de
esta detección, esto durante toda la duración T_{M} de
observación de la señal audio numérica. Al final de esta duración,
una prueba de comparación del valor N_{M} incrementado final es
efectuada en la etapa 101c frente al valor de umbral S_{M} antes
citado. En respuesta positiva en la etapa de comparación 101c, una
señal de defecto P_{1}* es entonces engendrada, esa señal de
defecto corresponde a una degradación de la calidad global de la
señal audio numérica.
Además, así como es representado en la figura 3a
antes citada, el procedimiento según la invención consiste
igualmente en descontar el número de ocurrencias N_{s} de señales
parásitas de silbido durante una duración T_{s} de observación de
la señal audio numérica ADS y en comparar el número de ocurrencias
N_{s} con un valor de umbral determinado S_{s}. En la figura
3a, y de manera análoga al proceso de detección de breve corte,
para la señal parásita de silbido la etapa 102a designa la
inicialización de N_{s} en el valor cero, 102b designa el
incremento de N_{s} en el valor N_{s}+1 y 102c designa la
comparación de N_{s} con el valor de umbral S_{s}. Por
comparación positiva en la etapa 102c, una señal lógica P_{2}*
correspondiente a la degradación de la calidad global de la señal
por un ruido de silbido es entonces engendrada.
El procedimiento objeto de la presente
invención, consiste en operar de la misma forma para el ruido
parásito de bordoneo y el ruido de defasaje.
En esas condiciones, así como es representado en
la figura 3a, el mismo consiste en detectar durante una duración
\tau_{D} el valor de defasaje \varphi y el número de
ocurrencias que deben ser a lo mínimo igual a N_{D} de esos
valores de defasaje en un número determinado D de cálculos de
defasaje y luego en comparar el valor de defasaje \varphi
calculado con un valor de umbral determinado S_{D}.
Igualmente en lo que concierne a las señales
parásitas de bordoneo, el procedimiento objeto de la invención
consiste en descontar el número de ocurrencias N_{B} de señales
parásitas de bordoneo durante una duración \tau_{B} de
observación de esa señal audio numérica y en comparar el número de
ocurrencias N_{B} con un valor de umbral S_{B}.
En la figura 3a, de manera análoga a las señales
parásitas de breve corte y de silbido, para la señal parásita de
bordoneo, 103a designa la inicialización del valor N_{B} en el
valor cero, 103b el incremento de este valor N_{B} al valor
N_{B}+1, 103c designa la comparación del número de ocurrencias de
bordoneos N_{B} con el valor de umbral determinado S_{B}. Para
una respuesta positiva a la prueba 103c, un señal P_{3}* de
presencia de una señal de bordoneo que afecta la calidad global de
la señal audio numérica es engendrada. De igual forma, 104a designa
la inicialización de N_{D} en el valor cero, 104b designa el
incremento de N_{D} al valor N_{D+1}, 104c designando la
comparación del valor de defasaje calculado \varphi con el valor
de umbral determinado S_{D}. A una respuesta positiva a la prueba
104c, una señal P_{4}* es engendrada, la cual representa la
presencia de una señal parásita de defasaje que afecta la calidad
global de la señal ADS.
Claro está y de manera no limitativa, así como
es representado en la figura 3a, el conjunto de las señales
P_{1}*, P_{2}*, P_{3}* y P_{4}* puede, en la etapa 105, ser
combinado de la misma manera que en el caso de la figura 2a. La
señal de accionamiento de la alarma A verifica entonces la relación
A = P_{1}* O P_{2}* O P_{3}* O P_{4}*, la señal de alarma
de potencia siendo emitida en la etapa 106.
En el modo de realización del procedimiento
objeto de la presente invención, tal como es representado en la
figura 3a, cada señal salida de las pruebas de comparación 101c,
102c, 103c y 104c juega sensiblemente el mismo papel en lo que
concierne a la puesta en práctica de la señal de accionamiento de la
alarma A en la etapa 105. Sin embargo, es por supuesto posible
adaptar el papel de cada una de esas señales, tanto a partir de los
valores de ventana o duración de la observación de la señal audio
numérica ADS, como a partir de cada valor de umbral frente a la
cual la comparación es efectuada en las etapas antes citadas.
No obstante, y de conformidad con un aspecto
particularmente remarcable del procedimiento objeto de la presente
invención, para establecer un control de calidad global de la señal
ADS, la etapa que consiste en emitir la señal de alarma está
preferentemente condicionada a un orden de prioridad de los pasos de
los valores de umbral antes citados.
Tal modo de realización preferencial es ahora
descrito en unión con la figura 3b. En la figura 3b, las mismas
referencias designan por supuesto los mismos elementos que en el
caso de la figura 3a.
De una manera general, y así como es
representado de manera no limitativa en la figura 3b, el
acondicionamiento a un orden de prioridad de los pasos de cada una
de las señales parásitas antes citadas puede por ejemplo ser
efectuado privilegiando una de las señales parásitas en lo que
concierne a su contribución a la señal de accionamiento de alarma A
en la etapa 105 y, en definitiva, a la contribución de esa señal
parásita en la degradación de la calidad global de la señal audio
numérica ADS. En la figura 3b, a título de ejemplo, la señal
parásita de breve corte P_{1}* es considerada plus molesta que una
o la otra de las señales parásitas P_{2}*, P_{3}* o P_{4}*
relativas a los ruidos de silbido, de bordoneo, respectivamente de
defasaje. En esas condiciones, la señal de accionamiento de alarma
A puede verificar la relación lógica:
A = P_{1}*
ET(P_{2}* O P_{3}* O
P_{4}*)
Claro está, ordenes de prioridad decrecientes
pueden ser asignados al paso antes citado para los números de
ocurrencias de las señales parásitas en función de la importancia
relativa decreciente de esas señales relativamente a la degradación
de la calidad global de escucha de la señal audio numérica. Tal modo
de realización no limitativa será descrito ahora en unión con la
figura 3c relativamente por ejemplo a las señales parásitas de
silbido, de bordoneo y de defasaje, siendo entendido que la señal
parásita de breve corte es considerada como prioritaria por
ejemplo. En esas condiciones, el modo de realización de la figura 3c
puede corresponder, de manera no limitativa, a una gestión
específica de las señales parásitas de silbido P_{2}*, de bordoneo
P_{3}* o de defasaje P_{4}* en el modo de realización de la
figura 3b, la señal de breve corte siendo considerada como
presentando una prioridad máxima.
Así como es representado en la figura 3c, para
una sucesión de muestras corriente de la señal de audio numérica
ADS, el procedimiento puede consistir, en una etapa 200 para
observar los parásitos de silbido en una ventana temporal
deslizante de duración T_{s}, y luego, en una etapa 201, para
efectuar una detección de al menos S_{s} silbidos durante la
duración de la observación. Claro está, esas operaciones 200 y 201
pueden corresponder a las operaciones 102, 102a, 102b, 102c de la
figura 3b. A una respuesta positiva a la prueba 201, la señal
parásita P_{2}* es engendrada.
Sin embargo, así como es representado en la
figura 3c, la detección del defasaje en la etapa 203 puede estar
condicionada a la ausencia de una señal parásita de silbido, es
decir a la respuesta negativa a la prueba 201 antes citada. Así, en
la etapa 203, el defasaje es calculado D veces la duración T_{D}.
A una respuesta positiva en la etapa de comparación 203, una etapa
205 es efectuada en la cual un valor de defasaje \varphi aparece
N_{D} veces en el número determinado de cálculo D. A una respuesta
positiva en la etapa 205, la comparación del valor de \varphi con
el valor de umbral S_{D} es efectuada en la etapa 206. Las etapas
203, 205 y 206 pueden corresponder con las etapas 104, 104a, 104b y
104c de la figura 3b. A una respuesta positiva en la etapa de
comparación 206, la señal P_{4}* es entonces engendrada.
Por el contrario, a una respuesta negativa en la
etapa 203, una etapa 204 es realizada, la cual consiste en detectar
la señal parásita de bordoneo. La etapa 204 puede corresponder a las
etapas 103, 103a, 103b y 103c de la figura 3b. A una respuesta
negativa en la etapa 204 antes citada, el procedimiento es entonces
re-actualizado para la sucesión de muestras
siguiente a la señal audio numérica ADS.
Por el contrario, a una respuesta positiva en la
etapa 204, la señal parásita de bordoneo P_{3}* es engendrada,
esa señal siendo susceptible de engendrar la señal de accionamiento
de alarma A.
Con la observación de la figura 3c, se constata
cómo ordenes de prioridad decreciente son atribuidos sucesivamente
a la señal de silbido, de defasaje y de bordoneo.
Claro está, la gestión del bloque de las señales
parásitas antes citadas con sus prioridades relativas
correspondientes puede ser efectuada tanto de conformidad con la
etapa 105 representada en la figura 3b, como, llegado el caso, de
conformidad con la etapa 105 representada en la figura 3a.
En fin, se indica que en las figuras 3a y 3b,
no se ha representado la etapa 100 de detección del carácter mono-
o estereofónico de la señal audio numérica ADS a fin de no
sobrecargar el dibujo. Por supuesto en los ejemplos de realización
del procedimiento, objeto de la presente invención según las figuras
3b y 3c, la detección del carácter mono- o estereofónico de la
señal puede ser efectuada.
Diferentes modos de llevar a cabo los procesos
de detección de las señales parásitas y del carácter mono- o
estereofónico de la señal audio numérica ADS precedentemente
mencionados serán ahora descritos en unión con la figura 4 y las
figuras siguientes.
La figura 4 es relativa a un modo de operación
específico de detección del carácter mono- o estereofónico de la
señal audio numérica antes citada.
Cuando una señal audio numérica ADS es
transmitida en las dos vías de canal, vías derecha e izquierda, de
un canal audio numérico, y transmitida en modo monofónico, las
señales presentes en las vías de derecha y de izquierda son
idénticas al valor de un defasaje de bajo valor cercano. La
identidad de la señal en las dos vías es en general mantenida
durante un cierto tiempo. Una observación experimental de la
naturaleza de esas señales en esas dos vías ha podido mostrar que
cuando existe un cambio súbito y corto del modo de transmisión de
la señal audio numérica, tal como por ejemplo el paso del modo
monofónico al modo estereofónico y luego el regreso al modo
monofónico, tales cambios revelan la presencia de defectos. En caso
contrario, el contexto de la transmisión no está llamado a
evolucionar sin cese en el curso del tiempo. En consecuencia y con
referencia a la figura 4, la etapa que consiste en discriminar el
modo de transmisión mono- o estereofónico de la señal audio
numérica ADS consiste en detectar cambios súbitos y breves de
contexto de modo de transmisión mono- o estereofónico, o de manera
recíproca, comparando las variaciones de energía de las dos vías
izquierda y derecha.
En la figura 4, se ha representado una etapa que
consiste en un cálculo de contexto de transmisión mono- o
estereofónico seguido de una etapa de verificación de ese contexto
que permite atribuir tanto el carácter monofónico, como el carácter
estereofónico a la señal audio numérica transmitida.
En un modo de realización específico
particularmente ventajoso no limitativo, tal como es representado en
la figura 4, la discriminación del modo de transmisión mono- o
estereofónico puede comprender, para cada sucesión de muestras
sucesivas de rango n, cada sucesión de muestras siendo determinada
por un corte en sucesiones de N muestras en una etapa 300 en las
vías izquierda y derecha de la señal audio numérica ADS, una etapa
301 de cálculo de las energías respectivas de las vías derecha e
izquierda de la señal de transmisión, esas energías siendo
denotadas E_{n,g} para la vía izquierda y E_{n,d} para la vía
derecha. El índice n designa el rango de la sucesión de muestras
corriente considerada.
La etapa 301 antes citada es entonces seguida de
una etapa 302 que consiste en calcular la relación M_{n} de las
energías derecha e izquierda con M_{n} = E_{n,g}/E_{n,d}.
Esta etapa 302 es ella misma seguida por etapas
303, 304 y 305, las cuales permiten el cálculo de una variable
binaria C_{n}, variable de contexto representativa del contexto de
emisión en modo mono- o estereofónico.
La etapa 303 consiste en comparar el valor de la
relación de las energías M_{n} con un primer y un segundo valor
de umbral, denotados Umbral_{1} respectivamente Umbral_{2},
según la relación Umbral_{1} < Mn < Umbral_{2}. A una
respuesta positiva a la prueba de comparación 303 antes citada, a la
variable de contexto C_{n} es atribuida en la etapa 304 el valor
0 representativo de un contexto de modo monofónico, y a la variable
de contexto C_{n} es por el contrario atribuido el valor 1 de otro
modo, en la etapa 305. El valor 1 de la variable de contexto
C_{n} es representativo de un contexto de modo estereofónico. Las
etapas 300, 301, 302, 303, 304, 305 descritas en unión con la figura
4 constituyen la etapa de cálculo de contexto precedentemente
mencionado en la descripción.
La etapa de verificación de contexto
precedentemente citada es entonces constituida por ejemplo, así como
es representado en la figura 4, por una etapa 306 que consiste en
efectuar en un número determinado de muestras sucesivas el cálculo
de un cúmulo del valor de las variables binarias de contexto C_{n}
sucesivas en un número C de sucesiones de muestras consecutivas.
Ese cúmulo es representativo de la aritmética de las variables de
contexto sobre el número C de sucesiones de muestras. La etapa 306
es entonces seguida por la etapa 307 que consiste en comparar, por
comparación de superioridad, el valor de esta suma, es decir el
valor de ese cúmulo, en un valor límite, denotado Límite, que
constituye un valor de referencia. A una respuesta positiva a la
comparación de superioridad antes citada en la etapa 307, al modo
transmisión de la señal audio numérica ADS es atribuido el modo
estereofónico, mientas que a una respuesta negativa es atribuido a
ese modo de transmisión el modo monofónico. El modo de operación
del proceso descrito en unión con la figura 4 puede ser justificado
de la manera a continuación.
Cuando la señal está en modo estereofónico, la
diferencia entre las energías de las dos vías izquierda y derecha
no es nula. Así, para determinar el contexto mono- o estereofónico,
la distancia entre la energía de cada vía derecha e izquierda es
calculada. Las energías respectivas pueden entonces verificar la
relación:
En esas relaciones, D_{n,i} y G_{n,i}
representan el valor de la amplitud de cada muestra de rango i de
la sucesión de muestras de rango n de la señal audio numérica
ADS.
A fin de no considerar una señal estereofónica
que pasa por cero como una señal monofónica, la variable de
contexto C_{n} es entonces sumada a un número C de sucesiones de
muestras sucesivas durante la operación de verificación de
contexto. El modo de transmisión es entonces estereofónico si el
cúmulo de las variables de contexto es al menos igual al valor
límite que constituye el valor de referencia.
Un ejemplo de valor numérico será ahora dado
para una aplicación al código numérico de tipo MPEG1 LII transmitido
por medio de un canal de radiodifusión numérico. En tal ejemplo de
aplicación, el número de cada sucesión de muestras N puede estar
comprendido entre 256 y 1024 muestras, los valores de umbral,
Umbral_{1} y Umbral_{2} pueden estar comprendidos entre
- Umbral_{1} \in [0,95; 0,9999]
- Umbral_{2} \in [1,0001; 1,05]
- C \in [20; 60]
y el valor límite de comparación a la prueba
307:
- Límite\in [l5;45].
Un proceso preferencial de detección de una
señal parásita tal como un breve corte será ahora descrito en unión
con las figuras 5a y 5b.
En primer lugar, se recuerda que un breve corte
es una interrupción muy breve de la señal audio numérica que
constituye un silencio numérico, la señal audio numérica ADS siendo
en ese caso remplazada por ceros o de muy bajos valores en razón de
un problema de transmisión, tal como la pérdida de sincronización
por ejemplo, impidiendo el decodificador, es decir el operador de
descompresión, reconstruir la sucesión de muestras constitutiva de
la señal audio numérica.
En consecuencia, y con referencia a la figura
5a, la cual representa la amplitud de las muestras de la señal
audio numérica para una secuencia de música de jazz transmitida y
recibida en límite de zona de servicio, un breve corte, o
Mudo, está caracterizado por una ausencia total de sonido
durante varios milisegundos, 25 ms en la figura 5a.
Por el contrario, cualquier sonoridad destinada
a ser escuchada posee un mínimo de reverberación. El fenómeno de
reverberación es un fenómeno debido a las múltiples reflexiones del
sonido en las paredes tales como los muros y los techos que rodean
cualquier fuente sonora. Ese fenómeno de reverberación existe
siempre, incluso, pero en una menor medida, en campo libre.
De conformidad con un aspecto particularmente
remarcable del procedimiento objeto de la presente invención, la
etapa que consiste en detectar en la señal audio numérica ADS una
señal parásita tal como un breve corte, consiste en detectar en una
sucesión de muestras sucesivas de esa señal numérica un
decrecimiento rápido del nivel de energía de esa señal audio
numérica hacia una energía nula. Tal forma de señal revela de hecho
la ausencia de reverberación de esa señal audio numérica y, en
consecuencia, la introducción de un breve corte.
Así, y en una realización específica
particularmente ventajosa non limitativa del procedimiento objeto de
la presente invención, tal como es representado en la figura 5b, la
etapa que consiste en detectar en la señal audio numérica una señal
parásita tal como un breve corte comprende una etapa que consiste en
determinar separadamente en cada vía izquierda y derecha del canal
audio numérico, para una pluralidad de sucesiones de N muestras
sucesivas, la energía media E_{n} de la señal transportada por
esta vía, n designando el rango de cada sucesión de muestras.
Con referencia a la figura 5b, se indica que el
corte de cada vía sobre la señal audio numérica ADS es efectuado en
una etapa 400, la cual es seguida por una etapa 401 de cálculo de la
energía temporal E_{n} de la sucesión de muestras
considerada.
La energía media E_{n} en cada vía verifica
entonces la relación:
En la relación precedente, se indica que
x[i] representa la muestra temporal de rango i de la sucesión
de N muestras, n designando el rango de esta sucesión de muestras.
En este caso, las ventanas temporales, es decir las sucesiones de
muestras sucesivas, están sin recubrimiento.
La etapa 401 de la figura 5b es entonces seguida
por una etapa 402 que consiste en comparar la evolución de la
energía media para sucesiones de N muestras sucesivas, la etapa 402
pudiendo corresponder por ejemplo en una verificación de una
relación de inferioridad del valor de la energía media E_{n} al
valor Umbral_{1}.
La existencia de una señal parásita de breve
corte 405 es revelada si una al menos de las energías medias es
inferior al Umbral_{1} y si, así como es representado en la etapa
403, una o varias energías medias vecinas a esta energía media nula
son superiores a un valor de umbral determinado. La etapa 403
corresponde a una etapa de comparación de la energía media de la
sucesión de muestras de rango n-k, denotada
E_{n-k}, a un valor de umbral \Delta, \Delta
= 31 dB. E_{n-k} designa la o las energías medias
vecinas.
Si por el contrario, la respuesta en la etapa de
comparación 402 es negativa, el proceso es repetido mediante el
retorno a la etapa 401 para una sucesión de muestras de rango n+1
por el bucle de retorno 404. El valor de cada energía media E_{n}
es entonces memorizado para una pluralidad de sucesiones de muestras
sucesivas a fin de permitir la continuidad de los cálculos.
Un ejemplo de aplicación a la codificación audio
numérica de tipo MPEG1 LII es ahora dada a continuación.
En este tipo de codificación, los breves cortes
corresponden a silencios numéricos de longitud múltiple de 1152
muestras numéricas. En ese caso, el parámetro N, número de muestras
constitutivas de una sucesión de muestras, vale 256, lo que permite
asegurar la detección de la zona más pequeña de las muestras de
bajos valores, o sea Umbral_{1} = 3, \Delta = 31 dB con k = 2.
En ese caso, la comparación con la etapa 403 puede ser efectuada
por el cálculo del valor:
\DeltaE =
10.LOG_{10}
[E_{n-2}]-31,
Si el valor \DeltaE es superior a cero,
\DeltaE > 0, entonces existe una señal parásita de breve
corte.
Una descripción más detallada de un proceso
especifico de detección de una señal parásita tal como un silbido
será ahora dada en unión con las figuras 6a y 6b.
De una manera más particular, así como es
representado en la figura 6a. Se indica que la presencia de tal
señal parásita corresponde a un aumento súbito y transitorio de la
energía espectral de la señal audio numérica en una banda de
frecuencias relativamente ancha que no exceda sin embargo 15 a 16
kHz. De preferencia, y según un aspecto remarcable del
procedimiento objeto de la presente invención, la etapa que consiste
en detectar en la señal audio numérica ADS una señal parásita tal
como un silbido consiste en detectar en esa señal audio numérica un
aumento súbito y transitorio de la energía espectral de esa señal
audio numérica en una banda de frecuencia cuya frecuencia baja está
comprendida entre 4,5 y 6,5 kHz y cuya frecuencia alta puede
alcanzar hasta 20 kHz. Esa señal parásita de silbido es provocada
por errores del código corrector de errores en la reconstrucción de
la sucesión de muestras audio numéricas. Un modo de realización
específico de un proceso de detección de las señales parásitas de
silbido será ahora descrito en unión con la figura 6b, ese proceso
estando basado en la detección de las variaciones de energía
espectral de la señal audio numérica.
Así como es representado en la figura 6b antes
citada, la señal audio numérica ADS es ante todo cortada en
sucesiones sucesivas de N muestras, cada sucesión siendo una
sucesión de rango n dada sometida a una verificación de la energía
media de cada sucesión, así como es representado en la etapa 500 de
la figura 6b. Con ese fin, la etapa 500 es subdividida en una etapa
500a de corte de la señal en sucesiones de rango n comprendiendo
cada una N muestras, las muestras de cada sucesión siendo designadas
por e(i).
La etapa 500a es seguida por una etapa 500b que
consiste en calcular la energía temporal media de cada sucesión de
rango n, Emed_{n} = \sum\limits_{i=1}^{N}e(i). La energía
media de cada sucesión de muestras es comparada por relación de
superioridad con un primer valor de umbral, Umbral_{1},
relación:
Emed_{n} >
Umbral_{1}
en la etapa siguiente
500c.
A una respuesta negativa en la etapa 500c, el
proceso es conducido a la etapa 500b, la energía de al menos una
sucesión corriente de rango n siendo considerada como insuficiente.
Si no, a una respuesta positiva en la etapa 500c, una etapa 500d es
conducida, la cual consiste en comparar según una comparación de
superioridad la relación de la energía de la sucesión corriente y
la energía de una sucesión inmediatamente vecina, no adyacente, de
rango n-2, con un segundo valor de umbral,
Umbral_{2} según la relación:
\frac{Emed_{n}}{Emed_{n-2}}
>
Umbral_{2}
A una respuesta negativa a la comparación de la
prueba 500d, el proceso es conducido a la etapa de cálculo de la
energía temporal media, la energía de la sucesión corriente y de la
sucesión vecina siendo parecidas.
A una respuesta positiva a la comparación de la
prueba 500d, la energía media de dos tramas vecinas siendo
creciente, y la relación superior al segundo valor de umbral, el
proceso de detección de silbido es proseguido, la etapa 500
habiendo sido satisfecha. La etapa 500 antes citada es entonces
seguida por una etapa que consiste en calcular en una sucesión de
muestras de la señal audio numérica la composición espectral de esa
señal definida como el valor de componentes de frecuencias en
sub-bandas de frecuencia central f_{i}, el valor
de los componentes de frecuencias siendo designados por
S_{n}(i), n designando el rango de la sucesión de muestras
considerada. Los valores S_{n}(i) tienen un ancho de banda
\deltaf. La etapa antes citada es realizada y representada en la
figura 6b por las etapas 501 que consisten de hecho en calcular el
espectro de la señal por transformada de Fourier, los componentes
en sub-bandas siendo denotados S_{n}(i). En
la etapa 502, se limita en ese espectro el valor de la frecuencia a
un valor más allá del valor F kHz, o sea el valor 4,5 kHz y se
efectúa un corte del intervalo 4,5 kHz, hasta 20 kHz en intervalos
de frecuencias de amplitud múltiple de \deltaf kHz.
La etapa 502 es seguida por una etapa 503 que
consiste en buscar la sub-banda \deltaf de energía
máxima en cada uno de los intervalos antes citados, definidos
precedentemente en la etapa 502. Esta sub-banda
\deltaf es denotada S_{n}(imax) y permite centrar
nuevamente el conjunto de los intervalos definidos en la etapa 502
alrededor de la sub-banda de energía máximo
considerada.
La etapa 503 es seguida por una etapa 504 que
consiste en calcular la energía media de cada intervalo centrado
nuevamente alrededor de la banda de energía máxima para la sucesión
de muestras de rango n considerado.
En la etapa 504, la energía de cada intervalo es
denotada E_{n}(sb) y verifica la relación:
La etapa 504 es entonces seguida por una etapa
505 que consiste en calcular la relación entre la energía
E_{n}(sb) de los intervalos para la sucesión de muestras
corrientes y para una pluralidad de sucesiones precedentes,
E_{n-s}(sb) de muestras sucesivas. La
relación antes citada se escribe:
En la relación precedente, s indica el pasado
temporal relativo a s espectros de frecuencias relativas a un
número dado de sucesiones de muestras correspondientes.
La etapa 505 antes citada es seguida por una
etapa 506 que consiste en calcular un valor de contraste auditivo,
denotado C_{n,sb}. El valor del contraste auditivo verifica la
relación:
En esta relación, R_{n}(sb+i) con i =
-\nu y i \neq -p, -(p-1), ..., 0, ...,
p-1, p, p designando un valor arbitrario, designa
el valor de la relación para los intervalos vecinos de la misma
sucesión de muestras de rango n y del mismo espectro S_{n}.
En la etapa 506, el contraste auditivo
C_{n,sb} es comparado con un primer valor de umbral de silbido,
denotado S_{1}, por comparación de superioridad. A una respuesta
negativa a la comparación antes citada, una etapa de retorno 508
conduce a la sucesión de muestras de rango n+1 siguiente y en
particular a la etapa 501 de cálculo del espectro de la señal por
transformada de Fourier.
Por el contrario, a una respuesta positiva en la
etapa de comparación antes citada de la etapa 506, una etapa 507 es
prevista, la cual consiste en calcular un parámetro de proximidad
denotado P_{n,sb} que verifica la relación:
La etapa 507 comprende entonces una etapa de
comparación del parámetro de proximidad P_{n,sb} a un segundo
valor de umbral de silbido S_{2}, P_{n,sb} > S_{2}. A una
respuesta negativa a la comparación de la etapa 507 antes citada,
un bucle de retorno 509 permite volver a la etapa 501 de cálculo del
espectro de la señal por transformada de Fourier para la sucesión
de muestras siguiente de rango n+1.
Por el contrario, a una respuesta positiva a la
prueba de comparación de la etapa 507, la presencia de una señal
parásita de silbido es revelada. Se nota claro está que la presencia
de la señal parásita de silbido es revelada en la etapa 510 si las
comparaciones de superioridad del valor de contraste auditivo
C_{n,sb} y del parámetro de proximidad P_{n,sb} frente al
primer umbral S_{1} respectivamente del segundo umbral S_{2}
son los dos verificados.
Un justificativo del modo de realización de la
detección de los silbidos en el modo de realización de la figura 6b
será dado a continuación.
El cálculo del espectro de la señal en la etapa
501 puede ser realizado a partir de transformadas de Fourier
rápidas.
Los valores de los componentes de frecuencias
S_{n}(i) de la descomposición en sub-bandas
de la sucesión de muestras de rango n son observados en intervalos
de frecuencias de amplitud múltiple de \deltaf kHz y su evolución
temporal es así estudiada en un pasado temporal de s espectros. Esas
operaciones son realizadas en las étapas 502, 503, 504 y 505.
En cada uno de los intervalos salidos de la
descomposición, el máximo de la energía de una
sub-banda de rango dado es buscada. Los intervalos
son entonces centrados nuevamente alrededor de la frecuencia, es
decir el rango i que soporta ese máximo, y los medios de la energía
E_{n}(sb) son calculados por la sucesión de muestras de
rango n consideradas. La evolución de la energía para cada uno de
esos nuevos intervalos es observado a partir de la relación
R_{n}(sb) y el criterio de contraste auditivo C_{n,sb}
es entonces calculado observando el comportamiento de la relación
antes citada con relación a la cercanía. La presencia de un silbido
es verificada si el valor de contraste auditivo es superior al
primer valor de umbral y si el parámetro de proximidad es superior
al segundo valor de umbral.
En las relaciones precedentes, \nu indique el
índice de los intervalos vecinos de igual espectro Sn relativo a la
misma sucesión de muestras n, p designa el número de
sub-bandas de un lado al otro del máximo no tomadas
en cuenta en el cálculo del valor de contraste y k designa el número
de intervalos.
Para una codificación audio numérica de tipo
MPEG1 LII transmitida en radiodifusión numérica el cálculo de las
transformadas de Fourier puede ser efectuado en una longitud que va
de 256 a 4096 muestras, el recubrimiento mínimo estando de 25 a
75%. Los intervalos tienen una amplitud de frecuencia \Deltaf
\in [500 Hz, 1500 Hz], el pasado temporal de observación es S
\in [1,4] en número de espectros sucesivos, es decir de
sucesiones de muestras sucesivas.
En la cercanía \nu \in [1,6] y p \in
[0,4]. Los valores de umbral son S_{1} \in [50,1000] y S_{2}
\in [2,20].
Además y de manera no limitativa, para efectuar
el proceso de detección de silbido, el procedimiento objeto de la
presente invención, puede igualmente consistir en efectuar una etapa
de filtrado de los componentes espectrales en
sub-bandas no audibles al oído humano. En esas
condiciones, ese modo de operación permite tener en cuenta
propiedades psico-acústicas de la señal audio
numérica, los espectros de energía siendo previamente multiplicados
por el umbral absoluto de audición, según la formulación de la norma
francesa ISO 226 de 1987, prolongada más allá de 12,5 kHz.
Una descripción más detallada del proceso de
detección de una señal parásita tal como un bordoneo será ahora
dada en unión con las figuras 7a y 7b.
El defecto de bordoneo introducido en las
señales audio numéricas es debido a la diferencia de protección en
la trama audio numérica acordada para los bits sensibles tales como
los bits de sincronización y los bits de código de corrección de
error, mientras que los bits restantes de la trama están menos bien
protegidos. Así, cuando la trama es reconstruida después de la
descompresión, los datos audio numéricos pueden ser erróneos debido
al hecho de esa menos buena protección.
Durante la puesta en práctica del procedimiento
objeto de la presente invención, investigaciones conducidas en
presencia de ruidos o bordoneos han permitido constatar que durante
la aparición de ese defecto, al espectro de la señal se adiciona un
ruido rosa de baja frecuencia.
En consecuencia, y de conformidad con un aspecto
particularmente ventajoso del procedimiento, objeto de la presente
invención, y con referencia a la figura 7a, la etapa consistente en
detectar en la señal audio numérica una señal parásita tal como un
bordoneo consiste en detectar en esa señal parásita un ruido rosa en
una banda de frecuencias comprendida entre 0 y 1100 Hz y de nivel
sensiblemente constante en esta banda de frecuencias. Con
referencia a la figura 7a, se indica que el nivel sensiblemente
constante del ruido rosa introducido durante la aparición de este
defecto es del orden de 40 dB. La figura 7a representa así el
espectro de una señal audio numérica ante la aparición del ruido
rosa, en trazo mixto durante la aparición del ruido rosa, en trazo
por puntos, y después de la aparición del ruido rosa, en trazo
continuo. Un modo específico de detección del defecto de bordoneo
que permite la detección del ruido rosa antes citado será ahora
descrito a título ilustrativo, en unión con la figura 7b.
El proceso de detección antes citado es llevado
a la práctica en al menos una vía izquierda o derecha del canal
audio numérico. El mismo consiste en una etapa 700, así como es
representado en la figura precitada, en cortar en sucesiones de N
muestras la señal audio numérica ADS y luego, en una etapa 701, para
calcular en la sucesión de muestras considerada la composición
espectral de esa señal audio numérica definida como el valor
S_{n}(i) de componente de frecuencia en
sub-bandas de frecuencia central f_{i}, n
designando el rango de la sucesión de muestras. Se comprende en
particular que la etapa 701 representada en la figura 7b puede
ventajosamente ser realizada de la misma manera que la etapa 501 de
la figura 6b, una sola descomposición por transformada de Fourier
siendo entonces realizada para el conjunto de los dos procesos de
detección. La etapa 701 precedentemente mencionada es entonces
seguida de una etapa 702 que consiste en calcular, para un número
determinado k de frecuencia central f_{i} del campo de las bajas
frecuencias, es decir comprendida entre 0 y 1100 Hz, una primera
\alpha_{i,n} y una segunda \beta_{i,n} relación de los
valores de componentes de frecuencia en sub-bandas
para la sucesión de muestras corrientes y la sucesión de muestras
precedentes, respectivamente para la sucesión de muestras
corrientes y la sucesión de muestras siguientes. Así, la primera
relación \alpha_{i,n} verifica la relación \alpha_{i,n} =
\frac{S_{n}(i)}{S_{n-1} (i)} y la segunda
relación \beta_{i,n} verifica la relación \beta_{i,n} =
\frac{S_{n}(i)}{S_{n+1} (i)}.
En las relaciones precedentes,
S_{n-1}(i) es relativo a la sucesión de
muestras precedentes y S_{n+1} (i) es relativa a la sucesión de
muestras siguientes frente a la sucesión de muestras corrientes
S_{n}(i). En la etapa 702, la primera y la segunda
relación \alpha_{i,n} y \beta_{i,n} son entonces comparadas
con un primer valor de umbral de bordoneo, denotado S’_{1}. A una
respuesta negativa a la comparación de la etapa 702, un retorno 703
es efectuado a la puesta en práctica de la etapa 702 para la
componente en sub-bandas de rango i que corresponde
a la misma sucesión de rango n.
A una respuesta positiva a la prueba de
comparación de la etapa 702, una etapa 704 es realizada, esta etapa
consiste en someter la comparación de las primera y segunda
relaciones a un criterio de proporción p/k del número p de
comparaciones verificadas con relación a la totalidad de las k
comparaciones efectuadas para las k frecuencias centrales f_{i}
de los componentes en sub-bandas consideradas. La
relación p/k puede ser expresada en valores de P%. A una respuesta
negativa de la comparación de las primera y segunda relaciones al
criterio de proporción antes citado, un retorno por un bucle 708 es
efectuado a la etapa 701 de cálculo del espectro de la señal para
la sucesión de muestras de rango n+1 siguiente.
Por el contrario, a una respuesta positiva a la
comparación de la etapa 704, una etapa 705 es realizada, la cual
consiste en discriminar, entre los valores en
sub-bandas S_{n}(i) de los componentes de
frecuencia en sub-bandas, el valor máximo
S_{n}(i_{máx}) para los componentes en
sub-bandas de los valores de componentes de
frecuencia relativos a la sucesión de muestras corriente de rango n.
La etapa 705 es entonces seguida por una etapa 706 que consiste en
calcular la relación del valor máximo antes citado con el valor de
la raya de frecuencia situado en el mismo índice i_{máx} del
espectro de la sucesión n-1 de muestras, esa
relación verificando la relación:
La relación antes citada es entonces comparada
con un segundo valor de umbral de bordoneo, denotado S’_{2}. La
comparación con el segundo valor de umbral de bordoneo S’_{2} es
una comparación de inferioridad. A una respuesta negativa a la
comparación antes citada, un bucle de retorno 709 conduce a la etapa
701 para la sucesión de muestras de rango siguiente n+1.
De esta forma, las etapas 702, 704, 705 y 706, a
una respuesta positiva a las comparaciones frente a los umbrales de
bordoneos S’_{1} y S’_{2}, comparación de superioridad frente a
S’_{1} y comparación de inferioridad frente a S’_{2},
relaciones \alpha_{i,n} y \beta_{i,n}, respectivamente de la
relación M_{n,i}, permiten concluir una posible existencia de una
señal parásita de bordoneo. La etapa 706, en ese caso, es entonces
seguida por una etapa 707 de análisis estadístico que consiste por
ejemplo en determinar la ocurrencia múltiple de una señal parásita
de bordoneo posible en una duración de observación dada \tau_{b}
de s segundos.
Para realizar la etapa 707, la misma puede
consistir en repetir las operaciones precedentes de discriminación
de la existencia de una comparación de superioridad de las primera y
segunda relaciones al primer valor de umbral de bordoneo S’_{1} y
de existencia de una composición de inferioridad de la relación
M_{n,i} al segundo valor de umbral S’_{2}. En el curso de la
repetición de esas operaciones en la etapa 707, una variable
binaria de pre-detección de la existencia de una
señal parásita de bordoneo es memorizada. A esta variable binaria
es atribuido el valor 1 cuando los criterios de comparación de
superioridad y de inferioridad son satisfechos y si no el valor
0.
Además, un descuento en la duración \tau_{b}
= s segundos del número de ocurrencias de la variable binaria de
pre-detección al valor 1 es efectuado. Ese número,
denotado NV_{pd}, es comparado con un tercer valor de umbral de
bordoneo S’_{3} por comparación de superioridad. A una respuesta
negativa a esta comparación, NV_{pd} > S’_{3}, un retorno
710 por un bucle es realizado a la etapa 701 para la sucesión de
muestras de rango n+1 siguiente.
Por el contrario, a una respuesta positiva a la
prueba frente al tercer umbral de bordoneo S’_{3} y realizado en
la etapa 707, una señal parásita de bordoneo es revelada cuando esta
comparación en este tercer valor de umbral de bordoneo es
verificada. La presencia de la señal parásita de bordoneo es
obtenida en la etapa 711.
Un justificativo del proceso de detección de las
señales parásitas de bordoneo será dado a continuación.
En una primera parte, se indica que cuando la
proporción de rayas de frecuencia para los cuales las primeras
relaciones \alpha_{i,n} y \beta_{i,n} son superiores al
mismo valor de umbral de bordoneo S’_{1} y superiores al valor P%
antes citado, entonces puede existir un ruido parásito de bordoneo
en la sucesión de muestras de rango n considerado. Aunque esta
condición parece necesaria, la misma sin embargo no parece ser
suficiente.
Para que haya detección de una señal parásita de
bordoneo, otras condiciones deben ser verificadas, en particular la
comparación que interviene en la raya más energética de la porción
de espectro de frecuencias estudiadas. Esta segunda condición
concierne a la comparación de la relación M_{n,i} con el segundo
valor de umbral de bordoneo S’_{2}.
Finalmente, la propiedad de la señal unida al
modo estereofónico de esta última es puesta en práctica durante la
tercera comparación con el tercer valor de umbral. Así, solamente
puede haber detección de una señal parásita de bordoneo si las dos
comparaciones relativas a los umbrales de bordoneo S’_{1} y
S’_{2} son satisfechos en una sola de las dos vías de la señal
audio numérica para la sucesión de muestras corriente de rango
n.
El análisis estadístico es efectuado en la etapa
707 y las decisiones son memorizadas a lo largo de una ventana
temporal de amplitud \tau_{b} = s segundos. Si en esta ventana
temporal el número de detección de todas las vías confundidas
sobrepasa el valor de umbral S’_{3}, entonces hay efectivamente
una señal parásita de bordoneo. Los valores de los parámetros
precedentemente descritos son ahora dados en el caso de una
codificación audio numérica MPEG1 LII transmitida por un canal de
radiodifusión numérico.
En ese caso, el cálculo de las transformadas de
Fourier puede ser efectuado de la misma manera como se describió
precedentemente en la descripción. La amplitud del espectro
observado puede ser de 500 Hz hasta 1,5 kHz en bajas frecuencias,
el número de espectros memorizados siendo igual a 3, es decir para
la sucesión de muestras precedente de rango n-1, la
sucesión de muestras corriente de rango n y la sucesión de muestras
siguiente de rango n+1:
- la banda de frecuencias puede estar
comprendida entre [0 Hz, 1500 Hz]
- el primer valor de umbral de bordoneo S’_{1}
\in [1,2]
- P% \geq 25%
- el segundo valor de bordoneo S’_{2} \in
[1,2]
- \tau_{b} = s, s \in [1s,10s]
- el tercer valor de umbral de bordoneo
S’_{3} \in [1,10].
Una descripción más detallada de un procesos que
permite la detección de una seña parásita tal como un defasaje
entre vías de la señal numérica será ahora descrito en unión con las
figuras 8a a 8c.
La presencia de una señal parásita tal como un
defasaje entre las vías izquierda y derecha, defasaje relativo
entre las vías antes citadas de un canal audio numérico es provocado
por el deslizamiento de fase de la señal presente en cada una de
las vías. Tal defecto y la señal parásita correspondiente solo puede
aparecer previamente a la codificación audio numérica y a la
compresión de la señal, pero esta se encuentra sin embargo
repercutida a todo lo largo de la cadena de difusión.
Cuando la señal audio numérica ADS es
monofónica, una cierta separación de fase entre las vías derecha e
izquierda puede ser tolerado. Algunos suministradores de programas
pretenden de esta forma simular un efecto estereofónico. Sin
embargo, más allá de un cierto valor de separación de fase, el
efecto no es más aceptable para los oyentes. Cuando, por el
contrario, la señal es estereofónica, el valor de fase a no
sobrepasar puede ser diferente.
Así, con referencia a la figura 8a, la etapa que
consiste en detectar en la señal audio numérica una señal parásita
tal como un defasaje entre las vías derecha e izquierda de la señal
numérica puede consistir, en una etapa A, en calcular el valor de
defasaje entre las vías de la señal audio numérica a partir de la
función de inter-correlación de la señal audio
numérica presente en cada una de las vías derecha e izquierda del
canal audio numérico. La etapa A antes citada es seguida por una
etapa B que consiste en comparar el valor de defasaje calculado a
un valor de umbral. El defasaje relativo entre vías es denotado
\varphi y el valor de umbral es denotado \varphi_{max}, este
valor variando en función del modo de transmisión mono o
estereofónico de la señal.
Un modo de puesta en práctica específico no
limitativo del proceso de detección de la señal parásita de defasaje
será ahora dado en unión con las figuras 8b y 8c.
Con referencia a la figura 8b, se indica que el
procedimiento conforme al objeto de la presente invención consiste,
en una etapa 800, en cortar la señal audio numérica en sucesión de
muestras de N muestras, cada sucesión comprendiendo el rango n. Ese
corte es efectuado claro está en las vías izquierda y derecha de la
señal audio numérica ADS. La etapa 800 antes citada es seguida por
una etapa que consiste en calcular, en la sucesión de muestras
antes citada, número N de muestras dadas, la función de
inter-correlación entre la señal audio numérica
presente en la vía izquierda y en la vía derecha. La etapa de
cálculo de la función de inter-correlación
precedentemente citada puede ser realizada gracias a una etapa 801
de cálculo de los espectros complejos de las vías izquierda y
derecha por transformada de Fourier, valor de la componente de
frecuencia i de la sucesión de muestras de rango n. Esta etapa 801
es seguida por una etapa 802 de multiplicación de un espectro de
una vía por el conjugado del espectro de la otra vía, y luego por
una etapa 803 de cálculo propiamente dicho de la transformada de
Fourier inversa para obtener la función de
inter-correlación. Las operaciones efectuadas en
las etapas 801, 802, 803 no serán descritas en detalle ya que las
mismas corresponden a operaciones clásicas en tratamiento de señal
numérica. La etapa antes citada, a continuación de la etapa 803, es
seguida por una etapa 804 que consiste en determinar el rango i de
la muestra de la función de inter-correlación,
muestra denotada corr(i), correspondiente al valor máximo
corr(i) de esta función de inter-correlación.
Esta etapa de búsqueda de máximo puede ser realizada a partir de
una función de selección sobre el valor de las muestras de la
función de inter-correlación.
La etapa 804 es entonces seguida por una etapa
805 que consiste, a partir de un valor de atenuación A determinado,
en determinar el rango atenuado i_{inf}, i_{sup} de las muestras
corr(i_{inf}) y corr(i_{sup}) de la función de
inter-correlación distribuidas de un lado al otro
del rango i de la muestra máxima corr(i) y que corresponde a
un valor atenuado del valor A con relación al valor máximo de esta
función de inter-correlación.
La etapa 805 consiste igualmente en calcular una
primera relación del valor máximo al valor atenuado inferior, esta
primera relación escribiéndose
\frac{corr(i)}{corr(i_{inf})} y luego una segunda
relación del valor máximo al valor atenuado superior, esta segunda
relación verificando la relación
\frac{corr(i)}{corr(i_{sup})}.
La etapa 805 consiste finalmente en comparar el
valor de la primera y de la segunda relación antes citada con un
primer valor de umbral, denotado S''_{1}. Por comparación de
igualdad o de superioridad a este valor de umbral, el contraste
izquierda/derecha de la señal audio numérica entre la vía izquierda
y la vía derecha es entonces considerada como significativa. Ese
contraste es significativo porque los índices de valor inferior y
superior distribuidos de un lado al otro del máximo de la función de
inter-correlación existen así como el valor de su
relación, esos valores pudiendo ser entonces comparados con el
primer valor de umbral de defasaje S''_{1}. En el caso donde esos
índices no existen, en respuesta negativa a la prueba de comparación
realizada en la etapa 805, un bucle 806 de retorno conduce el
procedimiento a la etapa 801 para la sucesión de muestras
siguientes de rango n+1.
A una respuesta positiva a la comparación
realizada en la etapa 805, los índices inferiores y superiores
existen, esta etapa 805 es seguida por una etapa 807 que consiste
en buscar el rango denotado j del segundo máximo relativo
corr(j)
de la función de inter-correlación.
de la función de inter-correlación.
Con referencia a la figura 8c, en la cual se ha
representado la amplitud de la función de
inter-correlación en función del tiempo, es decir
de las muestras sucesivas que representan esta función de
inter-correlación. Se ha representado el primer
máximo correspondiente a la muestra i, o sea corr(i), los
valores atenuados del valor A y de índice i_{inf} y i_{sup} y
correspondientes, así como el segundo máximo de índice j. El valor
de la atenuación R corresponde a la diferencia entre el máximo
maximorum de la función de inter-correlación y ese
segundo máximo. El índice j del segundo máximo de la función de
inter-correlación es buscado en los intervalos [0;
i_{inf}] y [i_{sup}; i_{inf}].
La etapa 807 es entonces seguida por una etapa
808 consistente en calcular un parámetro de contraste
izquierdo/derecho C_{g,d} relación entre el valor máximo
corr(i) y el valor de segundo máximo corr(j). El valor
de contraste izquierdo/derecho verifica la relación:
C_{g,d} =
\frac{corr(i)}{corr(j)}
La etapa 808 comprende igualmente una
comparación del valor del parámetro de contraste C_{g,d} antes
citado con un segundo valor de umbral del defasaje, denotado
S''_{2}. A una respuesta negativa a la comparación antes citada,
un retorno por un bucle de retorno es efectuado en la etapa 801 para
la sucesión de muestras siguiente de rango n+1.
Por el contrario, a una respuesta positiva a la
comparación de la etapa 808 antes citada, las operaciones
precedentes sucesivas a la comparación de la primera y de la segunda
relación en el primer valor máximo de la función de
inter-correlación, es decir las etapas 805, 807 y
808, son repetidas de forma de determinar en los rangos sucesivos
el rango que presenta la mayoría de las ocurrencias. Esas
operaciones son realizadas, por ejemplo en una etapa 809, donde el
resultado relativo al valor i del máximo de la función de
inter-correlación es establecido en una tabla, y en
una etapa 810 donde un análisis estadístico es efectuado sobre el
número de ocurrencias en esa tabla. En la etapa 810, si un valor i
tiene una ocurrencia superior o igual A un tercer valor de umbral
de defasaje S''3, entonces, y en respuesta positiva a esta
comparación de superioridad, al defasaje relativo de las vías
izquierda y derecha del canal audio numérico es atribuido un valor
correspondiente a aquel del rango que presenta la mayoría de las
ocurrencias, es decir el valor del rango i. Esta atribución es
realizada en la etapa 811. Por el contrario, si ninguna ocurrencia
es superior o igual al tercer valor de umbral de defasaje S''3,
entonces, un bucle 812 conduce a la sucesión de muestras siguiente
de rango n±l. Un justificativo del proceso de operación descrito en
unión con las figuras 8b y 8c será ahora dado a continuación.
En lo que concierne al cálculo de la función de
inter-correlación, este puede ser estimado entre las
señales presentes en las vías izquierda y derecha por un medio
temporal que verifica la relación:
En esta relación, \Gamma(k) designa el
valor de la función de inter-correlación en el punto
k, G(q) y D(q+k) designa la muestra de la vía
izquierda respectivamente derecha de rango q y q+k correspondiente.
En esta relación, k varía de 0 a N-1.
La complejidad en tiempo de cálculo de este
estimador según la relación antes citada es proporcional a N^{2}.
El cálculo de la convolución circular por FFT complejo tal como es
descrito con las etapas 801, 802 y 803 permite llevar la
complejidad de cálculo al valor (2N) .Log_{2}(2N).
Para una codificación audio numérica de tipo
MPEG1 LII transmitida por un canal de radiodifusión numérico, las
longitudes de observación y de cálculo N y K pueden ambas ser
iguales a 32768, un valor mínimo siendo igual a 1024.
El valor de umbral de cálculo de defasaje
S''_{1} está comprendido entre S''_{1} \in [2,100].
El valor del segundo umbral de cálculo de
defasaje S''2 está comprendido entre S''_{2} \in [1,5].
El tamaño de la tabla de resultados realizada en
la etapa 810 para efectuar el análisis estadístico del rango i
correspondiente al máximo de la función de
inter-correlación puede ser 10 valores
sucesivos.
El valor del tercer umbral de cálculo de
defasaje S''_{3} puede por ejemplo ser tomado igual a 5.
Un dispositivo de control de la calidad de una
señal audio numérica que lleva a cabo el procedimiento objeto de la
presente invención precedentemente descrito en la descripción será
ahora descrito en unión con la figura 9.
\newpage
Con referencia a la figura antes citada, se
indica que el dispositivo de control de la calidad de una señal
audio numérica objeto de la presente invención comprende al menos un
módulo 1 de conversión de la señal audio numérica ADS en un señal
numérica de formato especializado. A título de ejemplo no
limitativo, se indica que el módulo 1 de conversión de la señal
audio numérica en un señal numérica de formato especializado puede
ser realizado por medio de un circuito IRD de calidad profesional
que recibe la señal audio numérica ADS a partir de una primera
entrada de tipo BIS, para banda inter-satélite, o a
partir de una entrada de tipo MPEG2 TS. Claro está, la puesta en
práctica de tal módulo no es indispensable en tanto que, ese módulo
puede ser reemplazado por un receptor DAB por ejemplo, por Digital
Audio Broadcasting. El módulo de conversión 1 de la señal audio
numérica en una señal numérica de formato especializado expide esa
señal al formato UER/AES.
Además, el dispositivo objeto de la presente
invención tal como es representado en la figura 9 comprende un
conjunto de tipo ordenador portátil que comprende al menos un módulo
2 de adquisición de los componentes de audio frecuencias izquierda
y derecha, ese módulo 2 de adquisición recibe la señal numérica de
formato especializado expedida por el módulo 1 de conversión de la
señal audio numérica en señal numérica de formato especializado. El
módulo 2 de adquisición de los componentes de audio frecuencias
izquierda y derecha expide entonces una señal audio numérica
especializada para cada una de las vías izquierda y derecha,
denotadas RL en la figura 9.
El módulo 2 de adquisición de los componentes de
audio frecuencias es seguido por un módulo 3 de detección de
defecto de codificación y de transmisión que recibe la señal audio
numérica especializada para cada una de las vías izquierda y
derecha expedidas por el módulo 2 antes citado. Este permite
detectar una al menos de las señales parásitas tales como breve
corte, silbido, bordoneo, defasaje relativo de las vías izquierda y
derecha y así expedir una señal de detección, de conformidad con el
procedimiento objeto de la presente invención.
Además, un módulo de gestión 4 del tipo
interfase hombre máquina recibe la señal de detección y permite
engendrar una señal de alarma en presencia de una al menos de las
señales parásitas antes citadas.
Así como es representado en la figura 9, se
indica que el dispositivo objeto de la presente invención puede
comprender un módulo 5 de cálculo y de detección de parámetros
complementarios, ese módulo de cálculo recibiendo la señal numérica
de formato especializado expedida por el módulo 1 y expidiendo una
señal representativa de parámetros complementarios tales como modo
mono o estéreo, valores del flujo de bits da la señal audio
numérica. Este es piloteado por el módulo 3 de detección de defectos
de codificación y de transmisión.
De una manera general, se indica que el conjunto
de los módulos 2, 3, 4 y 5 puede ser realizado por medio de un
micro ordenador, el cual por esta razón está representado en puntos
en la figura 9. En particular, el sistema de gestión del tipo
plataforma interfase hombre máquina permite asegurar un control a
distancia del módulo 1 de conversión de la señal audio numérica en
una señal numérica de formato especializado.
Así, el sistema constituido por el micro
ordenador realiza el tratamiento de los datos, suministra los
resultados y los ordena permitiendo la gestión de las diferentes
señales a tratar por el módulo 1 de conversión al formato
especializado.
Así, el módulo 2 de adquisición de los
componentes puede ser realizado por una tarjeta dedicada de tipo PCI
inter-conectada al módulo 1 de conversión de
formato. La adquisición de los componentes de audio de las vías
izquierda y derecha es así realizada a partir de la señal audio
numérica al formato especializado UER/AES. Los datos numéricos
suministrados por el módulo 2, y por lo tanto por la tarjeta de tipo
PCI, son tratados por el módulo 3 de detección de defectos, el cual
claro está permite implementar bajo forma lógica las diferentes
etapas del procedimiento objeto de la presente invención tal como es
descrito precedentemente en la descripción.
A título de ejemplo no limitativo, el conjunto
de los elementos lógicos correspondientes puede ser implantado en
memoria muerta, llamada a la memoria viva del
micro-ordenador y accionada a partir del módulo de
gestión 4 que constituye la interfase hombre máquina IHM antes
citada.
El conjunto de los elementos lógicos antes
citados permite detectar en la señal audio numérica una al menos de
las señales parásitas tales como breve corte, silbido, bordoneo,
defasaje relativo de las vías izquierda y derecha de esa señal
audio numérica y engendrar una señal de alarma en presencia de una
al menos de las señales parásitas.
Finalmente, el módulo 5 suministra resultados
complementarios tales como la detección del modo de transmisión
mono o estéreo, el flujo de bits de la señal audio numérica a partir
de los resultados expedidos por el módulo 3 así como señales
UER/AES expedidas por el módulo 1.
Claims (20)
1. Procedimiento de control de la calidad de una
señal audio numérica, caracterizado porque ese procedimiento
consiste en detectar en esa señal audio numérica una al menos de las
señales parásitas tales como breve corte, silbido, bordoneo y
defasaje relativo a las vías izquierda y derecha de esa señal audio
numérica, lo que permite engendrar una señal de alarma en presencia
de una al menos de las señales parásitas.
2. Procedimiento según la reivindicación 1,
caracterizado porque el mismo consiste además en discriminar
el modo de transmisión mono- o estereofónico de esa señal.
3. Procedimiento según la reivindicación 1 o 2,
caracterizado porque, con el fin de la puesta en práctica de
un control de la calidad global de dicha señal audio numérica, el
mismo consiste, en combinación, en una ventana temporal deslizante
que permite la observación de una sucesión de muestras sucesivas de
dicha señal audio numérica:
- en descontar el número de ocurrencias N_{M}
de señales parásitas de breve corte durante una duración T_{M} de
observación de esa señal audio numérica y a comparar el número de
ocurrencia N_{M} con un valor de umbral determinado S_{M};
- en descontar el número de ocurrencias N_{s}
de señales parásitas de silbido durante una duración T_{s} de
observación de esa señal audio numérica, y en comparar el número de
ocurrencias N_{s} con un valor de umbral determinado S_{s};
- en detectar durante una duración \tau_{D},
el valor de defasaje \varphi y el número de ocurrencias N_{D}
de esos valores de defasaje en un número determinado D de cálculos
de defasaje y en comparar el valor de defasaje \varphi calculado
con un valor de umbral S_{D} determinado;
- en descontar el número de ocurrencias N_{B}
de señales parásitas de bordoneo durante una duración \tau_{B}
de observación de esa señal audio numérica y en comparar el número
de ocurrencias N_{B} con un valor de umbral S_{B};
- en emitir una señal de alarma de degradación
de calidad de transmisión de dicha señal audio numérica en paso de
uno al menos de los valores de umbral determinado por el número de
ocurrencias correspondiente descontadas.
4. Procedimiento según la reivindicación 3,
caracterizado porque la etapa que consiste en emitir dicha
señal de alarma es condicionada a un orden de prioridad de dichos
pasos
5. Procedimiento según la reivindicación 4,
caracterizado porque ordenes de prioridad decreciente son
asignados a los pasos por los números de ocurrencias de las señales
parásitas de breve corte, de silbido, de defasaje y de bordoneo
respectivamente.
6. Procedimiento según la reivindicación 2 a 5,
caracterizado porque dicha etapa que consiste en discriminar
el modo mono- o estereofónico de la señal transmitida consiste en
detectar cambios súbitos y breves de contexto de modo mono- o
estereofónico, o de manera recíproca, de la señal transmitida.
7. Procedimiento según la reivindicación 6,
caracterizado porque la etapa que consiste en discriminar el
modo de transmisión mono- o estereofónico comprende, para una
transmisión de la señal audio numérica en modo mono o
estereofónico, para cada sucesión de muestras sucesiva de rango
n:
- una etapa de cálculo de las energías
respectivas de las vías derecha e izquierda del canal de
transmisión;
- una etapa de cálculo de la relación M_{n} de
las energías derecha e izquierda;
- una etapa de cálculo de una variable binaria
C_{n} de contexto, a la variable binaria C_{n} siendo atribuido
el valor 0 representativo de un contexto de modo monofónico si la
relación M_{n} de las energías está comprendido entre un primer y
un segundo valor de umbral, y si no un valor 1 representativo de un
contexto de modo estereofónico;
- una etapa de verificación del contexto que
consiste, en un número determinado de muestras sucesivas, a calcular
un cúmulo del valor de las variables binarias C_{n} sucesivas y
en comparar el valor de ese cúmulo con un valor de referencia, y
por comparación de superioridad de ese cúmulo con este valor de
referencia, a atribuir al modo de transmisión el modo estereofónico
y si no el modo monofónico.
8. Procedimiento según una de las
reivindicaciones precedentes, caracterizado porque que la
etapa que consiste en detectar, en esa señal audio numérica, una
señal parásita tal como un breve corte, consiste en detectar, en
una sucesión de muestras sucesivas de esa señal numérica, un
decrecimiento rápido del nivel de energía de esa señal audio
numérica hacia una energía sensiblemente nula, que revela una
ausencia be reverberación de esa señal audio numérica.
9. Procedimiento según la reivindicación 8,
caracterizado porque la etapa que consiste en detectar, en
esa señal audio numérica, una señal parásita tal como un breve
corte comprende:
- una etapa que consiste en determinar
separadamente en cada vía estereofónica, para una pluralidad de
sucesiones de N muestras sucesivas, la energía media E_{n} de la
señal transportada por esta vía, n designando el rango de cada
sucesión de muestras;
- una etapa que consiste en comparar la
evolución de la energía media para sucesiones de N muestras
sucesivas, la existencia de una señal parásita de corte breve
siendo revelada si una al menos de las energías medias es
sensiblemente nula y si una o varias energías medias vecinas a esta
energía media sensiblemente nula son superiores a un valor de
umbral determinado.
10. Procedimiento según una de las
reivindicaciones precedentes, caracterizado porque que la
etapa que consiste en detectar, en esa señal audio numérica, una
señal parásita tal como un silbido, consiste a detectar en esa
señal audio numérica un aumento súbito y transitorio de la energía
espectral de esa señal audio numérica en una banda de frecuencias
cuya frecuencia baja está comprendida entre 4,5 kHz y 6,5 kHz y cuya
frecuencia alta puede alcanzar hasta 20 kHz.
11. Procedimiento según la reivindicación 10,
caracterizado porque la etapa que consiste en detectar, en
esa señal audio numérica, una señal parásita tal como un silbido
comprende al menos:
- una etapa que consiste en calcular en una
sucesión de muestras de la señal audio numérica la composición
espectral de esa señal audio numérica definida como el valor
S_{n}(i) de componentes de frecuencias en
sub-bandas de frecuencia central f_{i} y de ancho
de banda \deltaf, n designando el rango de la sucesión de
muestras;
- una etapa que consiste en calcular el valor
medio de la energía E_{n}(sb) de un intervalo de dichas
sub-bandas para la sucesión de muestras de rango n
dada;
- una etapa de cálculo de un valor de contraste
auditivo C_{n,sb} a partir del valor de la relación
R_{n}(sb) = \frac{E_{n}(sb)}{E_{n-S}(sb)}
entre la energía E_{n}(sb) de este intervalo para la
sucesión corriente y para una pluralidad de sucesiones precedentes
E_{n-s}(sb) de muestras, el valor de
contraste auditivo C_{n,sb} verificando la relación:
donde R_{n}(sb+i), i =
-\nu designando el valor de la relación para las
sub-bandas vecinas de la misma sucesión de muestras
de rango n y del mismo espectro
S_{n};
- una etapa de comparación del valor de
contraste auditivo C_{n,sb} con un primer valor de umbral de
silbido S_{1},
C_{n,sb} > S_{1};
C_{n,sb} > S_{1};
- una etapa de cálculo de un parámetro de
proximidad P_{n,sb} verificando la relación:
- una etapa de comparación del parámetro de
proximidad P_{n,sb} con un segundo valor de umbral de silbido
S_{2},
P_{n,sb} > S_{2}, la presencia de una señal parásita de silbido siendo revelada si las comparaciones de superioridad del valor de contraste auditivo C_{n,sb} y del parámetro de proximidad P_{n,sb} son ambos verificados.
P_{n,sb} > S_{2}, la presencia de una señal parásita de silbido siendo revelada si las comparaciones de superioridad del valor de contraste auditivo C_{n,sb} y del parámetro de proximidad P_{n,sb} son ambos verificados.
12. Procedimiento según la reivindicación 11,
caracterizado porque el mismo comprende además, previamente
a la etapa de cálculo, en una sucesión de muestras de la señal audio
numérica, de la composición espectral de esa señal:
- una etapa de cálculo, en esta sucesión de
muestras e(i) de la energía temporal media,
Emed_{n} =
\sum\limits_{i=1}^{N}e(i);
\newpage
\global\parskip0.950000\baselineskip
- una primera etapa de comparación de
superioridad del valor calculado de esta energía temporal media con
un primer valor de umbral, Umbral_{1}, el proceso siendo conducido
a la etapa de cálculo de la energía temporal media, la energía de
al menos una sucesión corriente de rango n siendo considerada como
insuficiente, y, a una respuesta positiva a dicha primera etapa de
comparación,
- una segunda etapa de comparación de
superioridad de la relación de la energía de la sucesión corriente a
la energía de una sucesión inmediatamente vecina, no adyacente, de
rango n-2, con un segundo valor de umbral,
Umbral_{2}, el proceso a una respuesta negativa a esta segunda
etapa de comparación siendo conducido a la etapa de cálculo de la
energía temporal media, la energía de la sucesión corriente y de la
sucesión vecina siendo similares, el proceso a una respuesta
positiva a esta segunda etapa de comparación, siendo continuado, la
energía de dos sucesiones vecinas siendo creciente.
13. Procedimiento según la reivindicación 11,
caracterizado porque el mismo comprende además una etapa de
filtrado de los componentes espectrales en
sub-bandas non audibles al oído humano.
14. Procedimiento según una de las
reivindicaciones precedentes, caracterizado porque que la
etapa que consiste en detectar, en esa señal audio numérica, una
señal parásita tal como un bordoneo consiste en detectar en esa
señal parásita un ruido rosa en una banda de frecuencias comprendida
entre 0 y 1100 Hz y de nivel sensiblemente constante en esta banda
de frecuencias.
15. Procedimiento según la reivindicación 14,
caracterizado porque la etapa que consiste en detectar, en
esa señal audio numérica, una señal parásita tal como un bordoneo
comprende en al menos una vía izquierda o derecha de esa señal:
- una etapa que consiste en calcular en un
sucesión de muestras de la señal audio numérica la composición
espectral de esa señal audio numérica definida como el valor
S_{n}(i) de componentes de frecuencias en
sub-bandas de frecuencia central f_{i}, n
designando el rango de la sucesión de muestras;
- en calcular, para un número determinado k de
frecuencias centrales f_{i} del campo de las bajas frecuencias,
una primera y una segunda relación de los valores de componente de
frecuencias en sub-bandas para la sucesión de
muestras corriente y la sucesión de muestras precedente
\alpha_{i,n} = \frac{S_{n}(i)}{S_{n-1} (i)}
respectivamente la sucesión de muestras corriente y la sucesión de
muestras siguiente \beta_{i,n} = \frac{S_{n}(i)}{S_{n+1}
(i)};
- en comparar el valor de las primera y segunda
relaciones con un primer valor de umbral de bordoneo S’_{1};
- en someter la comparación de las primera y
segundas relaciones a un criterio de proporción p/k del número p de
comparaciones verificadas con relación a la totalidad de las k
comparaciones efectuadas para las k frecuencias centrales f_{i}
y, si ese criterio de proporción es verificado;
- en discriminar, entre los valores
S_{n}(i) de componentes de frecuencias en
sub-bandas, el valor máximo
S_{n}(i_{máx}) de los valores de componentes de
frecuencias relativas a la sucesión de muestras corriente;
- en calcular la relación de dicho valor máximo
con el valor correspondiente al índice i_{max} del espectro de la
sucesión precedente S_{n-1}(i_{máx}),
M_{i,n} = \frac{S_{n}(i_{máx})}{S_{n-1}(i_{máx})},
y en comparar el valor de esa relación con un segundo valor de
umbral de bordoneo S’_{2} ;
- en discriminar, en al menos una vía de
transmisión en modo estereofónico de la señal audio numérica, la
existencia de una comparación de superioridad de las primera y
segunda relaciones \alpha_{i,n} y \beta_{i,n} con el primer
valor de umbral de bordoneo S’_{1} y la existencia de una
comparación de inferioridad de la relación de los valores máximos
M_{n,i} con el segundo valor de umbral de bordoneo S’_{2};
- en repetir las operaciones precedentes y en
memorizar periódicamente en una duración s determinada una variable
binaria de pre-detección de la existencia de una
señal parásita de bordoneo, a la variable binaria de
pre-detección siendo atribuida al valor 1 cuando
dichos criterios de comparación de superioridad y de inferioridad
son satisfechos, y si no el valor 0;
- en descontar en la duración s
determinada el número NV_{pd} de la variable binaria de
pre-detección en el valor 1 y en comparar ese
número con un tercer valor de umbral de bordoneo S’_{3}, NV_{pd}
> S’_{3}, la presencia de una señal parásita de bordoneo
siendo revelada si la comparación de superioridad del número
NV_{pd} de la variable binaria de pre-detección en
este tercer valor de umbral de bordoneo es verificado.
16. Procedimiento según una de las
reivindicaciones precedentes, caracterizado porque que la
etapa que consiste en detectar, en esa señal audio numérica, una
señal parásita tal como un defasaje entre vías de la señal numérica
consiste:
\global\parskip0.990000\baselineskip
- en calcular el valor de defasaje entre vías de
la señal audio numérica a partir de la función de
inter-correlación de la señal audio numérica
presente en cada una de dichas vías;
- en comparar el valor de defasaje calculado con
un valor de umbral.
17. Procedimiento según la reivindicación 16,
caracterizado porque la etapa que consiste en detectar, en
esa señal audio numérica, una señal parásita tal como un defasaje
relativo de las vías izquierda y derecha de la señal audio numérica
comprende las etapas que consisten:
- en calcular en un número de muestras dado, la
función de inter-correlación entre la señal audio
numérica presente en la vía izquierda y en la vía derecha;
- en determinar el rango i de la muestra
corr(i) correspondiente al valor máximo corr(i) de
esta función de inter-correlación;
- en determinar a partir de un valor de
atenuación A determinado el rango atenuado (i_{inf}), (i_{sup})
de las muestras de la función de inter-correlación
distribuidas de un lado al otro del rango de la muestra máxima
corr(i) y correspondiendo a un valor atenuado
corr(i_{inf}), corr(i_{sup}) del valor A con
relación al valor máximo de la función de
inter-correlación;
- en calcular una primera relación
\frac{corr(i)}{corr(i_{inf})} y una segunda relación
\frac{corr(i)}{corr(i_{sup})}, del valor máximo con
el valor atenuado inferior respectivamente superior;
- a comparar el valor de la primera y de la
segunda relación con un primer valor de umbral de defasaje S''_{1}
y, por comparación de igualdad o de inferioridad a este valor de
umbral, el contraste de la señal audio numérica entre la vía de
izquierda y vía de derecha siendo significativa,
- en determinar el rango (j) del segundo máximo
relativo corr(j) de la función de
inter-correlación;
- en calcular un parámetro de contraste C, en
relación con el rango de valor máximo y con el rango de valor de
segundo máximo de la función de
inter-correlación;
- comparar el valor del parámetro de contraste C
con un segundo valor de umbral de defasaje S''2, y por criterio de
comparación de superioridad a este segundo valor de umbral,
- en repetir las operaciones precedentes
sucesivas a la comparación de la primera y de la segunda relación
con el primer valor máximo de la función de
inter-correlación y en determinar en los rangos
sucesivos el rango que presenta la mayoría de las ocurrencias, al
defasaje relativo de las vías izquierda y derecha siendo atribuido
un valor correspondiente a aquel del rango que presenta la mayoría
de las ocurrencias.
18. Dispositivo de control de la calidad de una
señal audio numérica, que comprende al menos:
- un módulo de conversión (1) de dicha señal
audio numérica en una señal numérica de formato especializado
- un módulo de adquisición (2) de componentes de
audio frecuencias izquierda y derecha que reciben dicha señal
numérica de formato especializado que expide una señal audio
numérica especializada para cada una de las vías izquierda y
derecha;
- un módulo de detección (3) de defecto de
codificación y de transmisión que recibe la señal audio numérica
especializada para cada una de las vías izquierda y derecha y que
permite detectar una al menos de las señales parásitas tales como
breve corte, silbido, bordoneo, defasaje relativo a las vías
izquierda y derecha, y expedir una señal de detección;
- un módulo de gestión (4) tipo interfase hombre
máquina que recibe la señal de detección y que permite engendrar
una señal de alarma en presencia de una al menos de las señales
parásitas.
19. Dispositivo según la reivindicación 18,
caracterizado porque el mismo comprende además un módulo de
cálculo y de detección de parámetros complementarios, ese módulo de
cálculo y de detección recibiendo dicha señal numérica de formato
especializado y dicha señal de detección y expidiendo una señal
representativa de parámetros complementarios tales como modo mono o
estéreo, valor del flujo de bits.
20. Programa que comprende instrucciones que
permite detectar en una señal audio numérica una al menos de las
señales parásitas tales como breve corte, silbido, bordoneo,
defasaje relativo de las vías izquierda y derecha de esa señal
audio numérica y engendrar una señal de alarma en presencia de uno
al menos de las señales parásitas.
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
FR9902821A FR2790845A1 (fr) | 1999-03-08 | 1999-03-08 | Procede de controle de la qualite d'un signal audionumerique distribue |
FR9902821 | 1999-03-08 | ||
FR9904179A FR2790900B3 (fr) | 1999-03-08 | 1999-04-02 | Procede de controle de la qualite d'un signal audionumerique distribue |
FR9904179 | 1999-04-02 |
Publications (1)
Publication Number | Publication Date |
---|---|
ES2276671T3 true ES2276671T3 (es) | 2007-07-01 |
Family
ID=26234851
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
ES00909432T Expired - Lifetime ES2276671T3 (es) | 1999-03-08 | 2000-03-06 | Procedimiento de control de la calidad de una señal audio numerica difundida con un programa audiovisual. |
Country Status (5)
Country | Link |
---|---|
EP (1) | EP1159795B1 (es) |
DE (1) | DE60031767T2 (es) |
ES (1) | ES2276671T3 (es) |
FR (1) | FR2790900B3 (es) |
WO (1) | WO2000054441A1 (es) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114125474A (zh) * | 2020-08-31 | 2022-03-01 | 西梅科技(北京)有限公司 | 视频片段生成方法、装置和电子设备 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE3034582C2 (de) * | 1980-09-13 | 1982-09-02 | Institut für Rundfunktechnik GmbH, 8000 München | Verfahren zum Erkennen von auf digitalen Übertragungswegen auftretenden Signalstörungen |
DE3311645A1 (de) * | 1983-03-30 | 1984-10-11 | Institut für Rundfunktechnik GmbH, 8000 München | Verfahren zum erkennen von knackstoerungen |
GB2260243A (en) * | 1991-10-03 | 1993-04-07 | British Broadcasting Corp | Signal monitoring apparatus |
DE4324292C1 (de) * | 1993-07-21 | 1995-02-02 | Detecon Gmbh | Verfahren zur Ermittlung einer die Qualität einer digitalen Sprachübertragung kennzeichnenden Größe |
DE59410225D1 (de) * | 1994-11-25 | 2003-02-06 | T Mobile Deutschland Gmbh | Verfahren zur Ermittlung einer die Qualität einer digitalen Sprachübertragung kennzeichnenden Grösse |
DE59712013D1 (de) * | 1996-08-02 | 2004-11-18 | Ascom Ag Bern | Verfahren und anordnung zum beurteilen der qualität eines übertragenen sprachsignals |
-
1999
- 1999-04-02 FR FR9904179A patent/FR2790900B3/fr not_active Expired - Lifetime
-
2000
- 2000-03-06 EP EP00909432A patent/EP1159795B1/fr not_active Expired - Lifetime
- 2000-03-06 ES ES00909432T patent/ES2276671T3/es not_active Expired - Lifetime
- 2000-03-06 WO PCT/FR2000/000551 patent/WO2000054441A1/fr active Search and Examination
- 2000-03-06 DE DE60031767T patent/DE60031767T2/de not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
FR2790900A1 (fr) | 2000-09-15 |
FR2790900B3 (fr) | 2001-04-27 |
DE60031767D1 (de) | 2006-12-21 |
WO2000054441A1 (fr) | 2000-09-14 |
EP1159795B1 (fr) | 2006-11-08 |
DE60031767T2 (de) | 2007-09-20 |
EP1159795A1 (fr) | 2001-12-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
ES2317297T3 (es) | Conformacion de envolvente de sonido difuso para esquemas de codificacion de indicacion binaural y similares. | |
KR970007661B1 (ko) | 스테레오포닉 오디오 신호의 입력세트 코딩방법 | |
Noll | Wideband speech and audio coding | |
FI115938B (fi) | Laite ja menetelmä koodien sisällyttämiseksi audiosignaaleihin ja niiden dekoodaus | |
ES2323275T3 (es) | Conformacion de envolvente temporal de canal individual para esquemas de codificacion de indicacion binaural y similares. | |
Thiede et al. | A new perceptual quality measure for bit-rate reduced audio | |
Colomes et al. | A perceptual model applied to audio bit-rate reduction | |
JP3418198B2 (ja) | オーディオ信号の聴覚に適応した品質評価方法および装置 | |
JPH0651795A (ja) | 信号量子化装置及びその方法 | |
US6421802B1 (en) | Method for masking defects in a stream of audio data | |
Morel et al. | A laboratory study on total noise annoyance due to combined industrial noises | |
Yu et al. | Preferred listening levels of mobile phone programs when considering subway interior noise | |
ES2276671T3 (es) | Procedimiento de control de la calidad de una señal audio numerica difundida con un programa audiovisual. | |
Estreder et al. | Improved Aures tonality metric for complex sounds | |
Jurgen | Broadcasting with digital audio | |
Davidson et al. | Low-complexity transform coder for satellite link applications | |
Brandenburg | Introduction to perceptual coding | |
ES2228914T3 (es) | Procedimiento para la cancelacion de errores de transmision en datos de audio digitales. | |
US11121721B2 (en) | Method of error concealment, and associated device | |
KR101426596B1 (ko) | 오디오 인코딩 방법 | |
Sheffield et al. | The effects of degraded audio on memory for speech passages | |
Baina et al. | Quality of MPEG2 signal on a simulated digital terrestrial television | |
Colomes et al. | A perceptual objective measurement system (POM) for the quality assessment of perceptual codecs | |
US20240196143A1 (en) | Systems and methods for assessing hearing health based on perceptual processing | |
Sheffield et al. | Results from subjective testing of the HD codec at 16-96 kbps |