ES2449476T3 - Aparato, procedimiento y programa de ordenador para procesar una señal de audio - Google Patents

Aparato, procedimiento y programa de ordenador para procesar una señal de audio Download PDF

Info

Publication number
ES2449476T3
ES2449476T3 ES11708446.7T ES11708446T ES2449476T3 ES 2449476 T3 ES2449476 T3 ES 2449476T3 ES 11708446 T ES11708446 T ES 11708446T ES 2449476 T3 ES2449476 T3 ES 2449476T3
Authority
ES
Spain
Prior art keywords
signal
subband
transient
overlap
add
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES11708446.7T
Other languages
English (en)
Inventor
Sascha Disch
Frederik Nagel
Stephan Wilde
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Original Assignee
Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV filed Critical Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Application granted granted Critical
Publication of ES2449476T3 publication Critical patent/ES2449476T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/04Time compression or expansion
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
    • G10L19/025Detection of transients or attacks for time/frequency resolution switching

Abstract

Un aparato para procesar una señal de audio, que comprende: un banco de filtros de análisis para g 5 enerar señales de subbanda de la señal de audio; un manipulador de tiempo para manipular el tiempo individualmente de una pluralidad de señales de subbanda querepresentan la señal de audio, el manipulador de tiempo comprende: una etapa de traslapar-agregar para superponer y adicionar bloques de al menos una de la pluralidad de señales desubbanda al usar un valor de traslapo-agregar-avance diferente a un valor del bloque-extracción-avance usado paraextraer los bloques de una señal de subbanda de la pluralidad de señales de subbanda; un detector de transitorios para detectar un proceso transitorio en la señal de audio o la al menos una señal desubbanda de la pluralidad de señales de subbanda, donde la etapa de traslapar-agregar se configura para reducir una influencia de un proceso transitorio detectado opara no usar los procesos transitorios detectados en una manera individual mediante subbanda al añadir mediante laetapa de traslapar-agregar; y un circuito sumador de transitorios para adicionar un proceso transitorio detectado a la al menos una señal desubbanda generada por la etapa de traslapar-agregar en una manera individual mediante subbanda.

Description

Aparato, procedimiento y programa de ordenador para procesar una señal de audio
Descripción de la Invención
[0001] La velocidad de la repetición de señales de audio puede cambiarse al mantener el tono, por ejemplo con la ayuda de un codificador de señales vocales en fases (ver por ejemplo J. L. Flanagan y R. M. Golden, “The Bell System Technical Journal”, Noviembre 1966, páginas 1394 a1509; Patente Estadounidense Núm. 6,549,884 Laroche, J. & Dolson, M.: “Phase-vocoder pitch-shifting”; Jean Laroche y Mark Dolson, “New Phase-Vocoder Techniques for Pitch-Shifting, Harmonizing And Other Exotic Effects", Proc. 1999 IEEE Workshop on Applications of Signal Processing to Audio and Acoustics, New Paltz, Nueva York, 17-20 de octubre, 1999). Del mismo modo, con tal transposición de procedimientos de la señal puede llevarse a cabo al mantener la duración de la repeticiónoriginal. Éste se obtiene al volver a jugar la señal estirada acelerada por el factor del estiramiento del tiempo. Representación de la señal a tiempo individual, esto corresponde al submuestreo de la señal por el factor que se estira al mantener la frecuencia de muestreo. Convencionalmente, esta vez el estiramiento ocurre en el dominio temporal. Alternativamente, lo mismo también puede ocurrir dentro de un banco de filtros, como un banco de filtros del espejo de la pseudocuadratura (pQMF, por sus siglas en inglés). El banco de filtros del espejo de la pseudocuadratura (pQMF) es a veces también llamado un banco de filtros QMF.
[0002] Los desafíos específicos en el estiramiento son episodios transitorios que "se enturbian" a tiempo durante la etapa que procesa del estiramiento del tiempo. Esto ocurre porque los procedimientos, como el codificador de señales vocales en fases, afectan las llamadas propiedades de la coherencia verticales (en cuanto a una representación del espectrograma de frecuencia del período de tiempo) de la señal.
[0003] Algunos procedimientos actuales estiran el período de tiempo más alrededor de los procesos transitorios, a fin de no tener que llevar a cabo cualquier o sólo poco estiramiento del tiempo durante la duración del proceso transitorio. Esto se ha descrito, por ejemplo, en:
-
Laroche L., Dolson M.: Improved phase vocoder timescale modification of audio", IEEE Trans. Speech and Audio Processing, vol. 7, no. 3, pp. 323-332
-
Emmanuel Ravelli, Mark Sandler y Juan P. Bello: Fast implementation for non-linear time-scaling of stereo audio; Proc. of the 8th Int. Conference on Digital Audio Effects (DAFx’05), Madrid, España, Septiembre 20-22, 2005
-
Duxbury, C., M. Davies, y M. Sandler (2001, Diciembre). Separation of transient information in musical audio using multi resolution analysis techniques. In Proceedings of the COST G-6 Conference on Digital Audio Effects (DAFX01), Limerick, Irlanda.
[0004] Otro documento sobre el tema se escribió por Röbel, A.: A NEW APPROACH TO TRANSIENT PROCESSING IN THE PHASE VOCODER ; Proc. of the 6a Int. Conference on Digital Audio Effects (DAFx-03), Londres, RU, 8-11 de septiembre, 2003.
[0005] En el estiramiento del tiempo de señales de audio por codificadores de señales vocales en fases, las porciones de la señal transitorias son "enturbiadas" por dispersiones, ya que la llamada coherencia vertical en la vista del espectrograma de la señal se afecta. Los procedimientos que funcionan con el llamado traslapo - adicionan que los procedimientos pueden generar falso pre resuena y los ecos postales de los episodios de sonido de transitorios. Estos problemas pueden manejarse al cambiar el estiramiento del tiempo en el ambiente de procesos transitorios, ningún estiramiento durante los procesos transitorios actuales y estiramiento más concentrado en rodear. Si, sin embargo, la transposición es que ocurren, el factor de transposición ya no será constante en el ambiente de los procesos transitorios, es decir el tono de sobrepuesto (posiblemente tonal) cambios de porciones de la señal de una manera falsamente audible. Cuando el estiramiento del tiempo ocurre dentro de un banco de filtros, como el pQMF, los problemas similares ocurren.
[0006] El campo de esta solicitud se relaciona con un procedimiento para el manejo perceptivamente motivado de episodios de sonido de transitorios dentro de tal proceso. En términos particulares, los episodios de sonido de transitorios pueden retirarse durante la manipulación de la señal del estiramiento del tiempo. Posteriormente, una adición que se ajusta exactamente puede llevarse a cabo de la porción de la señal transitoria no procesada a la señal (estirada) cambiada bajo la consideración del estiramiento.
[0007] NAGEL FREDERIK ET AL: "A Phase Vocoder Driven Bandwidth Extension Method with Novel Transient Handling for Audio Codecs", 126th AES CONVENTION, May 2009, describe un procedimiento de extension de ancho de banda llevado por un codificador de voz de fase en el que se realizan un único recorte de transitorio y una operación de grabación para toda la señal de audio.
[0008] WO 2009/112141 A1 (FRAUNHOFER GES FORSCHUNG [DE]; DISCH SASCHA [DE]; NAGEL FREDRIK [DE]), 17 Septiembre 2009 (2009-09-17), también describe un esquema de codificador de voz para una modificación de escala de tiempo/ extensión de ancho de banda mediante el cual también se detectan transitorios y se eliminan de toda la señal de audio antes de una etapa de procesamiento de señal de frecuencia selectiva. Entonces se realiza una reinserción de transitorio en toda la señal de audio procesada tras el procesamiento de frecuencia selectiva.
[0009] Según la invención, se proporcionan un aparato, un procedimiento y un programa de ordenador en las reivindicaciones 1, 15 y 16 respectivamente.
[0010] Según modalidades relacionadas, el aparato puede comprender además un eliminador para diezmar la señal de audio o la pluralidad de señales de audio. El manipulador de tiempo puede configurarse para llevar a cabo un estiramiento del tiempo de la pluralidad de señales de subbanda.
[0011] Según otra modalidad, el detector de transitorios puede configurarse para marcar bloques detectados conforme comprenden un proceso transitorio; y donde la pluralidad de etapas de traslapar-agregar se configura para ignorar los bloques marcados.
[0012] Según otra modalidad, la pluralidad de etapas de traslapar-agregar puede configurarse para aplicar un superponer-valor-agregado que es mayor que un valor de extracción del bloque para llevar a cabo un estiramiento del tiempo de la pluralidad de señales de subbanda.
[0013] Según otra modalidad, el manipulador de tiempo puede comprender además un extractor del bloque, un ajustador de fase/intervalo de tiempo y una calculadora de fases para calcular una fase, basada en que el ajustador de fase/intervalo de tiempo lleva a cabo el ajuste de un bloque extraído.
[0014] Según otra modalidad, el circuito sumador de transitorios puede configurarse adicionalmente para insertar una porción de la señal de subbanda que tiene al proceso transitorio, donde la longitud de la porción se selecciona de longitud suficiente, tal que una atenuación cruzada de la salida de la señal de la porción que tiene al proceso transitorio a la salida del traslapo-adición-procesamiento es posible.
[0015] Según una modalidad relacionada, el circuito sumador de transitorios puede configurarse para llevar a cabo la operación de atenuación cruzada.
[0016] Según otra modalidad, el detector de transitorios puede configurarse para detectar bloques extraídos por un extractor del bloque de la señal de subbanda que tiene una característica transitoria. La etapa de traslapar-agregar puede configurarse adicionalmente para reducir una influencia de los bloques detectados o para no usar los bloques detectados al añadir.
[0017] Según otra modalidad, el detector de transitorios puede configurarse para llevar a cabo un cálculo del movimiento del centro de gravedad de la energía a través de un período de tiempo predeterminado de una señal para introducirse en un banco de filtros de análisis o una señal de subbanda.
[0018] La determinación exacta de la posición del proceso transitorio para la selección de una sección apropiada, puede llevarse a cabo, por ejemplo, con la ayuda de un cálculo del centroide móvil de la energía a través de un período del tiempo adecuado. La determinación En términos particulares, transitoria puede llevarse a cabo en una manera selectiva por la frecuencia dentro de un banco de filtros. Además, el período de tiempo de la sección puede seleccionarse como un valor constante o en una manera variable basada en la información de la determinación transitoria.
[0019] Según otra modalidad, el aparato puede comprender además una delmación configurada en un lado del ingreso o un lado de salida del banco de filtros de análisis que comprende el aparato. El manipulador de tiempo puede configurarse para llevar a cabo un estiramiento del tiempo de la pluralidad de señales de subbanda.
[0020] Según otra modalidad, el aparato puede comprender además un segundo banco de filtros de análisis, un remuestreo río arriba del segundo banco de filtros de análisis, y una pluralidad de codificadores de señales vocales en fases para una segunda pluralidad de la salida de señales de subbanda por el segundo banco de filtros de análisis, la pluralidad de codificadores de señales vocales en fases que tiene un factor de extensión de la anchura de banda mayor que uno y una salida del codificador de señales vocales en fases que se proporciona a la pluralidad de etapas de traslapar-agregar.
[0021] Según otra modalidad, el aparato puede comprender además una etapa de conexión entre el primer banco de análisis y la pluralidad de codificadores de señales vocales en fases en un lado del ingreso de la etapa de conexión y la pluralidad de etapas de traslapar-agregar en una etapa de salida de la etapa de conexión, la etapa de conexión que se configura para controlar una condición de los bloques del correspondiente de la pluralidad de señales de subbanda y el codificador de señales vocales en fases procesó la señal a la etapa de traslapar-agregar.
[0022] Según otra modalidad, el aparato puede comprender además: una corrección de amplitud configurada para compensar efectos de afectación de amplitud de diferentes valores del traslapo.
[0023] La presente solicitud así proporciona diferentes aspectos de aparatos, procedimientos o programas informáticos para procesar señales de audio en el contexto de la extensión de la anchura de banda y en el contexto de otras solicitudes de audio que son no la extensión de la anchura de banda relacionada con. Las características de los aspectos individuales descritos y reivindicados pueden en parte o completamente combinarse, pero también pueden usarse por separado de entre sí, ya que los aspectos individuales ya proporcionan ventajas con respecto a calidad perceptual, complejidad computacional y recursos del procesador/memoria cuando puesto en práctica en un sistema informático o procesador micro.
[0024] Según las modalidades descritas aquí, y en contraste con procedimientos existentes, una sección con ventanaje que incluye al proceso transitorio puede retirarse de la señal de manipularse. Esto puede obtenerse al resumir sólo aquellas porciones del período de tiempo no incluyendo procesos transitorios, bloque por el bloque, durante el proceso (OLA) superponer-y-adicionar. Esto da como resultado la señal estirada de un período de tiempo no que incluye a ningunos procesos transitorios. Después de terminar el estiramiento del tiempo, los procesos transitorios no estirados que se han retirado de la señal original se agregan nuevamente.
[0025] La dispersión y los efectos del eco por lo tanto ya no afectan la calidad de audio subjetiva del proceso transitorio.
[0026] Al insertar la porción de la señal original, el cambio de timbre o tono resultará al cambiar la tasa de muestreo. En términos generales, sin embargo, el proceso transitorio psicoacústicamente disimula esto. Si, en particular, estirándose por un factor del número entero ocurre, el timbre se cambiará sólo ligeramente, ya que fuera del ambiente del proceso transitorio, sólo cada enésimo (n = estiramiento del factor) el armónico se corresponde.
[0027] Las figuras acompañantes se incluyen para proporcionar una comprensión adicional de modalidades y se incorporan en y constituyen una parte de esta especificación. Las figuras ilustran modalidades y, conjuntamente con la descripción, sirven para explicar los principios de las modalidades. Otras modalidades y muchas de las ventajas intencionadas de modalidades fácilmente se valorarán, ya que éstos se convierten mejores entendido en cuanto a la descripción detallada que sigue. Los números de referencia similares designan partes correspondientes o similares.
La Figura 1 muestra una forma de onda de la señal de una señal original que comprende ejemplificantemente una mezcla de entubación de tono y agudos repetidos.
La Figura 2 muestra un espectrograma de Transformación Discreta de Fourier (DFT, por sus siglas en inglés) de la forma de onda de la señal mostrada en la Figura 1.
La Figura 3 muestra un espectrograma con base QMF basado en una banda de 64 pQMF del banco de filtros de análisis similar a la Figura 2 del espectrograma DFT.
La Figura 4 muestra una matriz de detección transitoria.
La Figura 5 muestra una forma de onda de la señal de una señal que resulta a partir del estiramiento del tiempo sin usar las modalidades descritas aquí.
La Figura 6 muestra una forma de onda de la señal de una señal que resulta a partir del estiramiento del tiempo al usar las modalidades descritas aquí.
La Figura 7 muestra que un espectrograma con base FFT de un período de tiempo que estiró la señal sin el manejo transitorio según las modalidades descritas aquí.
La Figura 8 muestra que un espectrograma con base FFT de un período de tiempo que estiró la señal con el manejo transitorio según las modalidades descritas aquí.
La Figura 9 ilustra un diagrama esquemático de bloques de un sistema de procesamiento de audio que comprende un aparato según las modalidades descritas aquí.
La Figura 10 ilustra un diagrama esquemático de bloques de otro sistema de procesamiento de audio que comprende un aparato según las modalidades descritas aquí.
La Figura 11A ilustra un diagrama esquemático de bloques de una realización de procesos para procesar una señal de subbanda individual.
La Figura 11B ilustra un diagrama esquemático de bloques de otra realización de procesos para procesar una señal de subbanda individual.
Las Figuras 12A a 12E ilustran el bloque de la señal que procesa según las modalidades descritas.
La Figura 13 ilustra un diagrama esquemático de bloques de un aparato según una modalidad de las modalidades descritas aquí.
La Figura 14 ilustra un diagrama esquemático de bloques de un aparato según otra modalidad de las modalidades descritas aquí.
La Figura 15 ilustra un organigrama esquemático de un procedimiento para procesar una señal de audio según las modalidades descritas aquí.
[0028] La Figura 1 muestra una sección del período de tiempo de una forma de onda de la señal de una señal de audio que comprende ejemplarmente en una mezcla de entubación de tono y agudos repetidos. La señal de audio representada debe usarse como una señal original en la cual diversas acciones de estiramiento del período de tiempo se llevan a cabo sin o con aplicar las modalidades descritas aquí. El sonido de la entubación de tono corresponde a una señal sustancialmente periódica que tiene una amplitud de aproximadamente 0,08 unidades en la Figura 1. Cuatro latidos de la castañuela son visibles en la Figura 1 ya que cuatro impulsos cortos que tienen una amplitud de aproximadamente 0,45 unidades. La entubación de tono produce una señal sustancialmente tonal. Las agudos repetidos, sin embargo, producen una señal muy transitoria. En acústica y audio, un proceso transitorio por lo común se define como una señal de duración corta que representa una fase de ataque no armónica de una palabra hablada o de sonido musical. Puede contener un elevado grado de componentes no periódicos y una magnitud más elevada de altas frecuencias que el contenido armónico de ese sonido. Los procesos transitorios por lo común no dependen directamente de la frecuencia del tono que éstos inician.
[0029] La Figura 2 muestra un espectrograma de Discrete Fourier Transform (DFT) de la forma de onda de la señal de la Figura 1. La Figura 3 es similar a la Figura 2 y muestra un 64 espectrograma del banco de filtros del espejo de la pseudocuadratura (pQMF) de banda de la forma de onda de la señal de la Figura 1. Como se puede observar de las dos ilustraciones del espectrograma en Figuras 2 y 3, la señal de audio original incluye una estructura de sonido parcial armónica densa (estructuras horizontales) y latidos de la castañuela (estructuras verticales).
[0030] Derivado allí de, la Figura 4 muestra a una matriz de detección transitoria binaria la marca de porciones de la señal transitorias en una manera selectiva por la frecuencia. Las porciones de la señal transitorias detectadas se ilustran en el blanco. Lo mismo puede retirarse mediante codificador de señales vocales para la transposición y posteriormente añadió nuevamente basado en la señal original. Alternativamente, las porciones de la señal transitorias detectadas pueden excluirse a partir del estiramiento del tiempo y reemplazarse más tarde con respectivas porciones de la señal de la señal original.
[0031] Las Figuras 5 a 8 muestran el resultado del estiramiento del tiempo con y sin el nuevo manejo transitorio en la forma de dos vez señales y los espectrogramas asociados. Al comparar el período de tiempo hace señas y los espectrogramas para los casos con el manejo transitorio y sin el manejo transitorio, puede observarse que el aspecto borroso del período de tiempo indeseado de las porciones de la señal transitorias con eficacia se evita empleando las modalidades descritas aquí. Por ejemplo, la señal del período de tiempo mostrada en la Figura 5 y el espectrograma correspondiente mostrado en la Figura 7 revela que los latidos de la castañuela se han ensanchado, es decir su duración es más larga que en la señal del período de tiempo original mostrada en la Figura 1. A diferencia, la señal del período de tiempo mostrada en Figura 6 y el espectrograma correspondiente en Figura 8, que tenga emplear obtenido un manejo transitorio según las modalidades descritas aquí, demuestre que los latidos de la castañuela no han experimentado a un ensanchamiento considerable con respecto a su duración, pero sustancialmente se conservan durante el curso de la manipulación de la señal.
[0032] Con el aparato, procedimiento y programa informático según las modalidades descritas, artefactos (dispersiones, pre y ecos postales) resultante al procesar a procesos transitorios antes de estiramiento del tiempo y procedimientos de transposición, con eficacia se evitan. Anteriormente esto, se diferencia en una manera selectiva por la frecuencia o predominan las porciones inmóviles o transitorias en una subbanda, y el procedimiento de manejo transitorio se selecciona proporcionalmente. Además, el período de tiempo de la porción de la señal para insertarse puede formarse en unos parámetros de consideración de manera variables de la determinación transitoria para adaptar óptimamente el período de tiempo de la porción de la señal al proceso transitorio.
[0033] El procedimiento es adecuado para todas las solicitudes de audio donde debe cambiarse la velocidad de la repetición de señales de audio o su tono. Particularmente adecuado son solicitudes para la extensión de la anchura de banda o en el campo de efectos de audio.
[0034] La Figura 9 ilustra un sistema de procesamiento de audio que está en el campo de la extensión de la anchura de banda de audio. Sin embargo, la invención también puede aplicarse a otros campos también que no llevan a cabo una extensión de la anchura de banda. Un tren de bits se introduce en un decodificador principal 100. La salida de la señal por el decodificador principal, es decir, una señal de audio de la anchura de banda estrecha se introduce en respectivos eliminadores 102a, 102b, 102c. Las señales diezmadas que tienen un tiempo de duración reducido comparado con la salida de la señal por el decodificador principal 100 se introducen en las etapas 104a, 104b, 104c de análisis pQMF correspondientes. Las etapas 104a, 104b, 104c pueden ponerse en práctica por cualquier otro banco de filtros de análisis que no sea un banco de filtros pQMF. Muchas diferentes realizaciones del banco de filtros existen que todos pueden usarse para este fin.
[0035] Cada etapa 104a, 104b, 104c de análisis pQMF envía una pluralidad de diferentes señales de subbanda en diferentes canales de la subbanda, donde cada señal de subbanda tiene una anchura de banda reducida y, por lo común, una tasa de muestreo reducida. En este caso, el banco de filtros es el banco de filtros sobremuestreado de 2 períodos de tiempo que se prefiere para la presente invención. Sin embargo, también un banco de filtros críticamente muestreado se puede usar.
[0036] La señal de la banda estrecha correspondiente o la salida de la señal de subbanda en un canal de análisis pQMF se introducen en un codificador de señales vocales en fases. Aunque la Figura 9 sólo ilustre tres codificadores de señales vocales en fases 106a, 106b, 106c, es importante observar que cada canal de análisis pQMF individual puede tener un propio codificador de señales vocales en fases. El algoritmo del codificador de señales vocales en fases también puede ponerse en práctica por la interpolación de la banda baja o el primer parche. Los codificadores de señales vocales en fases para diferentes señales de subbanda generadas por el mismo banco de filtros de análisis, tenga una estructura similar, y son diferentes de los codificadores de señales vocales en fases para las señales de subbanda de otros bancos de filtros debido al factor de extensión de la anchura de banda ilustrado en la Figura 9. El factor de extensión de la anchura de banda es dos en el codificador de señales vocales en fases 106a. En el codificador de señales vocales en fases 106b, el factor de extensión de la anchura de banda es tres, y en el codificador de señales vocales en fases 106c, el factor de extensión de la anchura de banda es cuatro. Observe que esto por lo común no es necesario con los objetivos de las modalidades descritas aquí para llevar a cabo cualquier extensión de la anchura de banda o incluso varias diferentes extensiones de la anchura de banda. Así, los eliminadores 102a, 102b, 102c pueden omitirse. Las salidas de los diferentes codificadores de señales vocales en fases se introducen en un banco de filtros de síntesis pQMF 108. Cuando los bancos de filtros de análisis en bloques 104a-104c se pongan en práctica en una diferente tecnología, luego el banco de filtros de síntesis 108 también se pondrá en práctica en una diferente tecnología, de modo que la tecnología del banco de filtros de análisis y la tecnología del banco de filtros de síntesis hagan juego entre sí.
[0037] Un aparato según las modalidades descritas aquí puede ponerse en práctica en una manera distribuida en uno o más de las etapas 104a, 104b, 104c de análisis QMF y el banco de filtros de síntesis QMF 108. En la misma manera o una manera similar, un manipulador de tiempo que es una parte del aparato según las modalidades descritas puede distribuirse entre las etapas 104a, 104b, 104c de análisis QMF y el banco de filtros de síntesis QMF
108. En consecuencia, uno o más de las etapas 104a, 104b, 104c de análisis QMF puede omitir bloques que contienen a un proceso transitorio de la manipulación del período de tiempo y remitir los bloques originales al banco de filtros de síntesis 108. El banco de filtros de síntesis 108 puede proporcionar la funcionalidad de un circuito sumador de transitorios agregando un proceso transitorio detectado y por lo común no modificado a una señal generada por una etapa de traslapar-agregar del banco de filtros de síntesis 108. El diagrama esquemático de bloques de la Figura 9 no muestra explícitamente el detector de transitorios. El detector de transitorios podría ser la parte de las etapas 104a, 104b, 104c de análisis QMF. En la alternativa, el detector de transitorios podría ser una unidad de su propio.
[0038] La Figura 10 ilustra la diferente realización, donde la señal de la banda base en línea 110 se introduce en un banco de filtros de análisis 112. Así, la señal de frecuencias bajas se transforma en una pluralidad de señales de subbanda. Además, una etapa por conmutación o la etapa 114 que conecta se proporcionan, por que las diferentes señales de subbanda envían por un codificador de señales vocales en fases 106a, 106b o la salida por la banda base pQMF análisis 112 puede introducirse en cualquier banda de síntesis arbitrariamente seleccionada.
[0039] Los codificadores de señales vocales en fases individuales se relacionan con una banda pQMF individual. En la Figura 10, la primera banda pQMF y la última banda pQMF de un primer parche armónico al usar el factor de extensión de la anchura de banda de dos se ilustran como 106a. Para el otro parche armónico al usar el factor de extensión de la anchura de banda de tres, el primer y la última banda pQMF de este parche se ilustran como 106b.
[0040] La señal sintetizada puede generarse al usar una combinación arbitrariamente seleccionada de salidas del codificador de señales vocales en fases y banda base pQMF análisis 112 salidas. Debe observarse que la etapa 114 por conmutación puede ser una etapa por conmutación controlada que se controla por una señal de audio que tiene una cierta información conexa, o que se controla por una cierta característica de la señal. Alternativamente, la etapa 114 puede ser una etapa de unión simple sin cualquier capacidad por conmutación. Es así, cuando una cierta distribución de señales de salida de elementos 112 y 106a-106b fijamente se determina y fijamente se programa. En este caso, la etapa 114 no comprenderá ningún conmutador, pero comprenderá ciertas a-través-de-conexiones.
[0041] La Figura 11A ilustra una modalidad de una realización que procesa para procesar una señal de subbanda individual. La señal de subbanda individual puede haberse sometido a cualquier clase de la delmación antes o siendo filtrado por un banco de filtros de análisis no se muestra en la Figura 11A. Por si una delmación se haya llevado a cabo, el tiempo de duración de la señal de subbanda individual es por lo común más corto que el tiempo de duración antes de formar la delmación. La señal de subbanda individual se introduce en un extractor del bloque 1800. El extractor del bloque 1800 en la Figura 11A funciona al usar un valor del avance de la muestra/bloque ejemplarmente llamado e. El valor del avance de la muestra/bloque puede ser variable o puede fijamente determinarse y se ilustra en la Figura 11A como una flecha en el bloque del extractor del bloque 1800. en la salida del extractor del bloque 1800, allí existe una pluralidad de bloques extraídos. Estos bloques son muy superpuestos, ya que el valor del avance de la muestra/bloque e es considerablemente más pequeño que la longitud del bloque del extractor del bloque. Un ejemplo es que los bloques de extractos del extractor del bloque de 12 muestras. El primer bloque comprende muestras 0 a 11, el segundo bloque comprende muestras 1 a 12, el tercer bloque comprende muestras 2 a 13, etcétera. En esta modalidad, el valor del avance de la muestra/bloque e es igual a 1, y hay un traslapo de 11 veces. El ejemplo anterior tiene valores, que se proporcionan a manera de ejemplo y pueden cambiar de la solicitud a la solicitud.
[0042] Los bloques individuales se introducen en un organizador de ventanas de intervalo de tiempo 1802 para organizar ventanas de intervalos de tiempo los bloques al usar una función de la organización de ventanas de intervalos de tiempo para cada bloque. Además, una calculadora de fases 1804 se proporciona que calcula una fase para cada bloque. La calculadora de fases 1804 puede usar o el bloque individual antes de organizar ventanas de intervalos de tiempo o subsecuente al ventanaje. Luego, un valor de ajuste de la fase p x k se calcula e introducido en un ajustador de la fase 1806. El ajustador de la fase aplica el valor de ajuste a cada muestra en el bloque. Más aún, el factor k es igual al factor de extensión de la anchura de banda. Cuando, por ejemplo, la extensión de la anchura de banda por un factor 2 debe obtenerse, luego la fase p calculada para un bloque extraído por el extractor del bloque 1800 es multiplicado por el factor 2 y el valor de ajuste aplicado a cada muestra del bloque en el ajustador de la fase 1806 es p multiplicado por 2. Esto es un valor/reglamento proporcionado a manera de ejemplo. Alternativamente, la fase corregida para la síntesis es k * p, p + (k-1) *p. Así pues en este ejemplo el factor de corrección es 2, de ser multiplicados o 1*p de ser adicionado. Otros valores/reglamentos pueden aplicarse para calcular el valor de corrección de la fase.
[0043] En una modalidad, la señal de subbanda individual es una señal de subbanda compleja, y la fase de un bloque puede calcularse por una pluralidad de diferentes modos. Un modo es obtener la muestra en el medio o alrededor del medio del bloque y calcular la fase de esta muestra compleja.
[0044] Aunque ilustrado en la Figura 11A en el modo que un ajustador de la fase actúa subsecuente al organizador de ventanas de intervalo de tiempo, estos dos bloques también pueden intercambiarse, de modo que el ajuste de la fase se lleve a cabo a los bloques extraídos por el extractor del bloque y funcionamiento de ventanaje subsecuente se lleva a cabo. Ya que ambos funcionamientos, es decir, organizando ventanas de intervalos de tiempo y ajuste de la fase se valoran del modo real o multiplicaciones de valores complejos, estos dos funcionamientos pueden resumirse en funcionamiento individual al usar un factor de multiplicación complejo que, él mismo, es el producto de un factor de multiplicación de ajuste de la fase y un factor de ventanaje.
[0045] Los bloques ajustados por la fase se introducen en superponer/adicionar y bloque de corrección de amplitud 1808, donde los bloques con ventanaje y ajustados por la fase se adicionan al traslapo. Importantemente, sin embargo, el valor del avance de la muestra/bloque en el bloque 1808 es diferente del valor usado en el extractor del bloque 1800. Particularmente, el valor del avance de la muestra/bloque en el bloque 1808 es mayor que el valor e usado en el bloque 1800, de modo que se obtenga un período de tiempo estirando de la salida de la señal por el bloque 1808. Así, la salida de la señal de subbanda procesada por el bloque 1808 tiene una longitud que es más larga que el ingreso de la señal de subbanda en el bloque 1800. Cuando la extensión de la anchura de banda de dos debe obtenerse, luego el valor del avance de la muestra/bloque se usa que es dos veces el valor correspondiente en bloques 1800. Esto da como resultado un estiramiento del tiempo por un factor de dos. Cuando, sin embargo, otros factores de estiramiento del período de tiempo son necesarios, luego otros valores del avance de la muestra/bloque pueden usarse de modo que la salida de bloque 1808 tenga un tiempo de duración requerido.
[0046] Para encargarse a la cuestión del traslapo, una corrección de amplitud preferentemente se lleva a cabo a fin de encargarse a la cuestión de diferentes traslapos en el bloque 1800 y 1808. Esta corrección de amplitud podría también ser, sin embargo, introducida en el factor de multiplicación del ajustador de fase/intervalo de tiempo, pero la corrección de amplitud también puede llevarse a cabo subsecuente a superponer/procesar.
[0047] En el ejemplo anterior con una longitud del bloque de 12 y un valor del avance de la muestra/bloque en el extractor del bloque de uno, el valor del avance de la muestra/bloque para el bloque superponer/adicionar 1808 sería igual a dos, cuando una extensión de la anchura de banda por un factor de dos se lleva a cabo. Esto todavía daría como resultado un traslapo de seis bloques. Cuando una extensión de la anchura de banda por un factor de tres debe llevarse a cabo, luego el valor del avance de la muestra/bloque usado por el bloque 1808 sería igual a tres, y el traslapo se caería a un traslapo de cuatro. Cuando una extensión de la anchura de banda cuádruple debe llevarse a cabo, luego el bloque superponer/adicionar 1808 tendría que usar un valor del avance de la muestra/bloque de cuatro que todavía daría como resultado un traslapo de más de dos bloques.
[0048] El codificador de señales vocales en fases para una señal de subbanda individual ilustrada en la Figura 11A preferentemente comprende un detector de transitorios 200 para llevar a cabo una detección transitoria dentro de la señal de subbanda indicada por la conexión 201a o para llevar a cabo una detección transitoria de la señal antes del banco de filtros de análisis que procesa como se indica por el proceso de conexión 201b. Tan pronto como el detector de transitorios 200 detecta al proceso transitorio, la etapa de traslapar-agregar se controla no para usar los bloques que tienen al proceso transitorio en el procesamiento superponer/adicionar como ilustrado controlan la conexión 203. En una modalidad, la señal en línea 203 controles la etapa de traslapar-agregar para retirar todos los bloques que tienen el episodio transitorio. Esto dará como resultado una señal en la salida de esta etapa que se estira con respecto a la señal antes de esta etapa, pero que no incluye ningún proceso transitorio.
[0049] La señal estirada sin procesos transitorios se introduce en el circuito sumador de transitorios que se configura para adicionar al proceso transitorio a la señal estirada de modo que, en la salida, allí exista una señal estirada que tiene a procesos transitorios introducidos, pero estos procesos transitorios introducidos no han sido afectados por un múltiplo superponen/adicionan el procesamiento.
[0050] En una modalidad, la porción transitoria se inserta de la propia señal de subbanda como ilustrado por proceso de conexión 206 y proceso 201a. Alternativamente, la señal puede obtenerse de cualquier otra señal de subbanda o de la señal antes del análisis de la subbanda, ya que es característico para un proceso transitorio que el proceso transitorio ocurre en una manera completamente similar sobre las subbandas individuales. Por otra parte, sin embargo, al usar el episodio transitorio que ocurre en una subbanda es preferible en algunos casos, ya que la tasa de muestreo y otras consideraciones son las más cercanas posible a una señal estirada.
[0051] La Figura 11B ilustra otra posible modalidad de una realización que procesa para procesar una señal de subbanda individual. Río arriba del extractor del bloque 1800, un organizador de ventanas de intervalo de tiempo de supresión transitorio 1798 se inserta que actúa sobre la señal de subbanda individual. El organizador de ventanas de intervalo de tiempo de supresión transitorio 1798 retira muestras o bloques que contienen a un proceso transitorio. Una evaluación si una muestra contiene un proceso transitorio se lleva a cabo por el detector de transitorios 200. La señal de subbanda individual se rosca en un lado del ingreso del organizador de ventanas de intervalo de tiempo de supresión transitorio 1798 de modo que el detector de transitorios 200 reciba la señal de subbanda individual como un ingreso. Mediante la detección de un proceso transitorio, el detector de transitorios 200 salidas una señal correspondiente al organizador de ventanas de intervalo de tiempo de supresión transitorio 1798 y el organizador de ventanas de intervalo de tiempo de supresión transitorio 1798 reacciona al suprimir la muestra (s) que se ha indicado por el detector de transitorios 200 como conteniendo a un proceso transitorio. Por lo tanto, las muestras marcadas por el detector de transitorios 200 como conteniendo una muestra no introducen el extractor del bloque 1800. Las otras muestras que contienen no transitorios se mantienen en los bloques que se procesan por el extractor del bloque 1800, el organizador de ventanas de intervalo de tiempo 1802, la calculadora de fases 1804, el ajustador de la fase 1806, y el traslapo - adiciona el bloque 1808. El traslapo - adiciona el bloque 1.808 salidas una señal estirada sin procesos transitorios.
[0052] Las muestras que contienen del modo transitorio se agregan posteriormente nuevamente a la señal estirada sin procesos transitorios por el circuito sumador de transitorios 204. El circuito sumador de transitorios 204 recibe una señal de control del detector de transitorios 200 y la señal de subbanda individual original como entrada de datos. Con esta información, el circuito sumador de transitorios puede identificar las muestras que han sido suprimidas por el organizador de ventanas de intervalo de tiempo de supresión transitorio 1798 e insertan de nuevo estas muestras en la señal estirada sin procesos transitorios. en la salida del circuito sumador de transitorios 204 la señal de subbanda procesada (duración de mucho tiempo) que tiene a procesos transitorios introducidos se obtiene.
[0053] Las Figuras 12A a 12E ilustran cómo la señal de audio o una de la pluralidad de señales de subbanda pueden procesarse según procedimientos previamente puestos en práctica y según las modalidades descritas aquí. En la Figura 12A, una secuencia de muestras de audio 1202 se muestra. La secuencia 1202 puede pertenecer a una de la pluralidad de señales de subbanda. La letra "T" marca una muestra donde un proceso transitorio se ha detectado por un detector de transitorios.
[0054] Bajo la secuencia 1202 en la Figura 12A, una pluralidad de bloques extraídos 1206 se representan. La pluralidad de bloques extraídos 1206 es cada uno 12 muestras de longitud y comprende la muestra con T transitorio. Anteriormente y bajo la pluralidad de bloques extraídos 1206 un bloque precedente 1204 y un bloque subsecuente 1208 se muestra lo que no contiene T transitorio. Como se puede observar en la Figura 12A, la pluralidad completa de bloques extraídos 1204 extiende sobre 23 bloques.
[0055] La Figura 12B ilustra cómo, en procedimientos de la manipulación de la hora oficial, el bloque precedente 1204, los bloques de la pluralidad de bloques extraídos 1206 y el bloque subsecuente 1208 es desplazado cada uno por un bloque antes de traslapo y adición de los bloques individuales a fin de llevar a cabo un estiramiento del tiempo de la señal de audio. Las versiones desplazadas de los bloques o la pluralidad de bloques son 1204 marcado’, 1206’ y 1208’. El valor de traslapo-agregar-avance es dos en la Figura 12B, mientras que el valor del avance de extracción del bloque ilustrado en la Figura 12A es el que. A consecuencia del cambio de los bloques, las muestras comprenden T transitorio en los bloques de la pluralidad de bloques extraídos 1206 temporalmente no se alinea más, pero se extiende sobre un período de doce muestras.
[0056] La Figura 12C ilustra una eliminación de los bloques que contienen T transitorio en uno o más de sus muestras, de acuerdo con las modalidades descritas aquí. Los bloques retirados pertenecen a la pluralidad de bloques extraídos 1206’ y se extraen en la línea entrecortada. La eliminación de los bloques 1.206’ hojas una separación que es 14 muestras de longitud. Más aún, en un período de 10 muestras antes de la separación y un período de 10 muestras subsecuentes a la separación, sólo un número reducido de bloques en vez de los seis bloques habituales se considera en el traslapo - añade el proceso o por la etapa de traslapar-agregar de un aparato para procesar una señal de audio. Observe que las Figuras 12B y 12C sólo son ilustrativas y que los bloques de la pluralidad de bloques extraídos 1206 de la Figura 12A podría retirarse inmediatamente después de un proceso transitorio se han detectado, es decir sin llevar a cabo la acción de cambio del período de tiempo en estos bloques de la pluralidad de bloques extraídos 1206. En una posible realización de las modalidades descritas aquí, los bloques de la pluralidad de bloques extraídos 1206 se reencaminan para evitar la etapa de traslapar-agregar e insertarse río abajo de la etapa de traslapar-agregar.
[0057] En la Figura 12D una inserción de la sección transitoria original, es decir la pluralidad de bloques extraídos 1206, en el período de tiempo manipuló la señal de audio. La sección transitoria original se inserta en la separación que se ha dejado después de la eliminación de los bloques que contienen T transitorio. La sección transitoria original puede agregarse al resto manipulado del período de tiempo de la señal de audio. al principio o el borde izquierdo de la separación, la pluralidad de bloques extraídos 1206 se superplantea con seis bloques regulares (tres de los cuales se muestran en la Figura 12D, con un patrón de punto). En el ejemplo representado en la Figura 12D, los bloques regulares se procesan con un valor de traslapo-agregar-avance de dos. Como se puede observar en la Figura 12D, una separación residual permanece entre el extremo de la sección transitoria original y el bloque subsecuente 1208’. Sería posible, para desplazar la pluralidad de bloques extraídos 1206 unas muestras a la derecha, que es hacia instantes del período de tiempo posteriores de modo que la sección transitoria original más igualmente se distribuya y/o se ubique dentro de la separación entre el bloque precedente desplazado 1204’ y el bloque subsecuente desplazado 1208’.
[0058] La parte inferior de la Figura 12D muestra cuantos bloques se superplantean en cada muestra. Según la manipulación del período de tiempo regular con una longitud del bloque de doce muestras, un valor de extracción del bloque de uno y un valor de traslapo-agregar-avance de dos, seis bloques por lo común se consideran durante el traslapo - adicionan que el proceso para una muestra particular del período de tiempo manipuló la señal de audio. En otras palabras, en una muestra del período de tiempo manipuló señalan que hay contribuciones de seis diferentes bloques extraídos de la señal de audio original. La curva en la Figura 12D muestra que durante el procesamiento de la sección transitoria original inicialmente se consideran seis bloques. Como los bloques de la pluralidad de bloques extraídos 1206 es escalonado con una diferencia de la muestra, la cantidad de bloques para ser aumentos superplanteados para alcanzar el valor doce para la muestra son T transitorio se ha detectado. Posteriormente, la cuenta del bloque disminuye por una con cada nueva muestra para alcanzar el valor un al extremo de la sección transitoria original. La cuenta del bloque se puede usar para corregir una amplitud de la señal manipulada del período de tiempo en la sección, donde la cantidad de bloques superplanteados se diferencia del valor regular de seis. Con este fin, la cuenta del bloque puede determinarse basada en una detección del proceso transitorio y alimentada a una corrección de amplitud. La corrección de amplitud puede actuar o sobre los bloques antes de traslapo, adición, y/o el superplanteamiento, o durante el período de tiempo resultante manipuló la señal.
[0059] Como se menciona anteriormente, una separación residual de dos muestras permanece. Cuando los bloques regulares comienzan nuevamente, comenzando con el bloque subsecuente 1208’,
[0060] La Figura 12E muestra una realización opcional donde la separación ha sido acortada por dos muestras de modo que ninguna separación residual permanezca entre el extremo de la sección transitoria original y el bloque subsecuente desplazado 1208’. Aunque esta medida pueda dar como resultado a una leve corrupción de la señal manipulada del período de tiempo resultante (en particular, un leve acortamiento), el efecto puede ser insignificante. Como se menciona anteriormente, la sección transitoria original podría insertarse más centrada dentro de la separación entre el bloque anterior 1204’ y el bloque subsecuente 1208’.
[0061] Como una alternativa a retirar bloques completos que comprenden uno o más muestras que contienen del modo transitorio, como ilustrado en Figuras 12A a 12E, la muestra (s) individual que contiene del modo transitorio puede retirarse dentro del bloque, mientras se mantienen las muestras restantes en el bloque. La eliminación de las muestras que contienen del modo transitorio puede ponerse en práctica al determinar un valor de la muestra al cero. Por lo tanto, la muestra que contiene del modo transitorio no elaborará una contribución a la salida del traslapo - adiciona el bloque 1808. Una corrección de amplitud se puede usar en el orden que aumentan una contribución de las otras muestras que se adicionan al traslapo con la muestra enfocada. La acción de enfocar y concentrar las muestras que contienen transitorios puede acompañarse al desaparecer y al entrar la señal de subbanda antes de la muestra y subsecuente a la muestra, respectivamente. Por ejemplo, unas muestras antes de la muestra que contiene del modo transitorio y unas muestras subsecuentes al proceso transitorio que contiene muestrean la señal de subbanda puede multiplicarse con una señal del factor que se descolora a fin de poner en práctica p.ej una organización de ventanas de intervalos de tiempo de descoloración triangular alrededor de la(s) muestra(s) que contienen transitorios.
[0062] La Figura 13 muestra un diagrama esquemático de bloques de un manipulador de tiempo que podría ser una parte de un aparato para procesar una señal de audio según las modalidades descritas. El manipulador de tiempo recibe una pluralidad de señales de subbanda que conjuntamente forman la señal de audio. Dentro del manipulador de tiempo la pluralidad de señales de subbanda puede ser temporalmente almacenada por un extractor del bloque y amortiguador 1810. El extractor del bloque y los extractos de 1810 del amortiguador se obstruyen de cada uno de la pluralidad de señales de subbanda. Los bloques tienen longitud L del bloque específica y se extraen con e del valor del avance de extracción del bloque específico. Por ejemplo, longitud L del bloque puede ser doce y e del valor del avance de extracción del bloque puede ser el que. El extractor del bloque y el amortiguador 1810 recibe longitud L del bloque y el avance de extracción del bloque valoran e como parámetros del ingreso. En la alternativa, longitud L del bloque y el avance de extracción del bloque valoran e podría almacenarse en una manera fija en el extractor del bloque y almacenar 1810 en un buffer.
[0063] El extractor del bloque y las salidas de 1810 del amortiguador extrajeron bloques y los proporcionan a una etapa de traslapar-agregar 1808 donde los bloques extraídos se superponen con un valor de traslapo-agregaravance k * e diferente del avance de extracción del bloque valoran e y ascendió a formar el período de tiempo manipuló la señal de audio. La etapa de traslapar-agregar 1808 puede comprender una pluralidad de traslapo adiciona unidades, p.ej uno se superpone - añade la unidad para correspondiente de la pluralidad de señales de subbanda. Otra opción sería usar una etapa de traslapar-agregar individual o unos cuantos se superponen - añaden las unidades en un tiempo compartido o manera multiplexada de modo que las señales de subbanda se adicionen al traslapo individualmente y sucesivamente.
[0064] El manipulador de tiempo comprende además un detector de transitorios 200 que recibe la pluralidad de señales de subbanda. El detector de transitorios 200 puede analizar las señales de subbanda o la señal de audio con respecto a p.ej una fase de ataque no armónica de una palabra hablada o de sonido musical o un elevado grado de componentes no periódicos y/o una magnitud más elevada de altas frecuencias que el contenido armónico de ese sonido. Una salida del detector de transitorios 200 indica si un proceso transitorio se ha identificado en una sección actual de la señal de audio y se proporciona a la etapa de traslapar-agregar 1808 y un circuito sumador de transitorios 1812. Por si la salida del detector de transitorios 200 indique que un proceso transitorio se ha detectado, la etapa de traslapar-agregar 1808 se controla para ignorar aquellos bloques que contienen T transitorio al llevar a cabo el traslapo - adiciona la acción. 1812 del circuito sumador de transitorios, en su parte, inserta la sección transitoria original a la señal de audio otra cosa manipulada por el período de tiempo mediante la recepción de una indicación del detector de transitorios 200 que se ha detectado un proceso transitorio. La señal manipulada por el período de tiempo con las formas transitorias adicionadas una salida del manipulador de tiempo.
[0065] La Figura 14 muestra un diagrama esquemático de bloques de un manipulador de tiempo según otra realización según las modalidades descritas aquí. Además de los elementos del manipulador de tiempo mostrado en la Figura 13, el manipulador de tiempo de la Figura 14 comprende una corrección de amplitud 1814. La corrección de amplitud 1814 recibe la indicación sobre un proceso transitorio detectado del detector de transitorios 200. Sobre la base de esta información, la corrección de amplitud 1814 puede modificar la amplitud de bloques de la señal para representar una cantidad diversa de bloques que se usan en el traslapo - añade el proceso. La variación de la cantidad de bloques considerados es debido a la eliminación de la pluralidad de bloques extraídos 1204 y posiblemente debido a la inserción de la sección transitoria original. Por lo común, el patrón del período de tiempo cómo la cantidad de bloques varía se conoce y puede determinarse sobre la base del instante del período de tiempo del proceso transitorio detectado. Por lo tanto, puede ser suficiente proporcionar una señal de activación a la corrección de amplitud que luego ajusta las amplitudes de bloques subsecuentes según el patrón del período de tiempo. Un posible patrón del período de tiempo podría basarse en la forma de onda mostrando la evolución de la cantidad de bloques que se consideran en el traslapo - añade el proceso como ilustrado en Figuras 12D y 12E. Un valor de corrección de amplitud podría ser, por ejemplo, un recíproco de la cuenta del bloque.
[0066] La Figura 15 muestra un organigrama esquemático de un procedimiento para procesar una señal de audio según las modalidades descritas aquí. Después del inicio del procedimiento, una acción 1502 se lleva a cabo donde una pluralidad de señales de subbanda de una señal de audio se manipula el tiempo individualmente. La acción 1502 comprende subacciones 1504 a 1510.
[0067] En 1504 los bloques de una señal de subbanda correspondiente de la pluralidad de señales de subbanda se superponen y se adicionan. Un traslapo - adiciona que el valor del avance se usa lo que es diferente de un valor del avance de extracción del bloque. La acción 1504 representa el proceso normal fluye en ausencia de procesos transitorios y se lleva a cabo continuamente.
[0068] Una acción de detección transitoria se lleva a cabo en 1506 para detectar a un proceso transitorio en la señal de audio o en una señal de subbanda. La acción 1506 puede llevarse a cabo simultáneamente con la acción 1504 y otras acciones mostradas en el organigrama de Figura 15.
[0069] Una influencia de un proceso transitorio detectado o se reduce, o el proceso transitorio detectado se desecha, al llevar a cabo la acción 1504 de traslapo y adición.
[0070] Un proceso transitorio detectado se agrega posteriormente, en la acción 1510, a una pluralidad de señales generadas por la acción 1504 de traslapo y adición.
[0071] Aunque según las modalidades descritas aquí la sección transitoria de la señal de audio no haya experimentado por lo común a la misma manipulación del período de tiempo que el resto de la señal de audio, la señal resultante manipulada por el período de tiempo por lo común hace las secciones transitorias en una manera realista. Esto puede ser al menos en parte debido a que un proceso transitorio es muy insensible a muchos procedimientos de la manipulación de la señal, como el cambio de frecuencia.
[0072] Aunque algunos aspectos se hayan descrito en el contexto de un aparato, es traslúcido que estos aspectos también representan una descripción del procedimiento correspondiente, donde un bloque o el dispositivo corresponden a una etapa del procedimiento o una característica de una etapa del procedimiento. Análogamente, los aspectos descritos en el contexto de una etapa del procedimiento también representan una descripción de un bloque correspondiente o artículo o característica de un aparato correspondiente.
[0073] La señal de audio codificada inventiva puede almacenarse en un soporte de almacenamiento digital o puede transmitirse en un medio de transmisión como un medio de transmisión inalámbrico o un medio de transmisión conectado como Internet.
[0074] Según ciertos requerimientos de realización, las modalidades de la invención pueden ponerse en práctica en el hardware o en el software. La realización puede llevarse a cabo al usar un soporte de almacenamiento digital, por ejemplo un disco flexible, un DVD, un CD, un ROM, un PROM, un EPROM, un EEPROM o una Memoria no volátil (flash), que tiene señales de control legibles por medios electrónicos almacenadas sobre eso que cooperan (o tienen capacidad de la cooperación) con un sistema informático programable tal que el respectivo procedimiento se lleva a cabo.
[0075] Algunas modalidades según la invención comprenden a un portador de datos que tiene señales de control legibles por medios electrónicos que tienen capacidad de la cooperación con un sistema informático programable, tal que uno de los procedimientos descritos aquí se lleva a cabo.
[0076] En términos generales, las modalidades de la presente invención pueden ponerse en práctica como un producto de programa informático con un código de programación, el código de programación que es operativo para llevar a cabo uno de los procedimientos cuando el producto de programa informático ejecuta en una computadora. El código de programación puede almacenarse por ejemplo en un portador legible por máquina.
[0077] Otras modalidades comprenden el programa informático para llevar a cabo uno de los procedimientos descrito aquí, almacenado en un portador legible por máquina.
[0078] En otras palabras, una modalidad del procedimiento inventivo es, por lo tanto, un programa informático que tiene un código de programación para llevar a cabo uno de los procedimientos descrito aquí, cuando el programa informático ejecuta en una computadora.
[0079] Otra modalidad de los procedimientos inventivos es, por lo tanto, un portador de datos (o un soporte de almacenamiento digital o un medio legible por computadora) que comprende, registrado sobre eso, el programa informático para llevar a cabo uno de los procedimientos descrito aquí.
[0080] Otra modalidad del procedimiento inventivo es, por lo tanto, un tren de datos o una secuencia de señales que representan el programa informático para llevar a cabo uno de los procedimientos descrito aquí. El tren de datos o la secuencia de señales pueden configurarse por ejemplo para transferirse mediante una conexión de comunicación de datos, por ejemplo mediante Internet.
[0081] Otra modalidad comprende unos medios que procesan, por ejemplo una computadora o un dispositivo lógico programable, configurado a o adaptado para llevar a cabo uno de los procedimientos descrito aquí.
[0082] Otra modalidad comprende una computadora que tiene instalado sobre eso el programa informático para llevar a cabo uno de los procedimientos descrito aquí.
[0083] En algunas modalidades, un dispositivo lógico programable (por ejemplo una matriz del electrodo de control programable de campo) se puede usar para llevar a cabo a unos o todas las funcionalidades de los procedimientos descritos aquí. En algunas modalidades, una matriz del electrodo de control programable de campo puede cooperar con un microprocesador a fin de llevar a cabo uno de los procedimientos descrito aquí. En términos generales, los procedimientos son preferentemente llevados a cabo por cualquier aparato del hardware.
5 [0084] Las modalidades anteriormente descritas son simplemente ilustrativas para los principios de la presente invención. Se entiende que las modificaciones y las variaciones de las configuraciones y los detalles descritos aquí serán evidentes para otros expertos en la técnica. Es la intención, por lo tanto, sólo estar limitadas por el alcance de las reivindicaciones de patente inminentes y no por los detalles específicos presentados a través de la descripción y explicación de las modalidades de la presente descripción.

Claims (16)

  1. REIVINDICACIONES
    1. Un aparato para procesar una señal de audio, que comprende:
    un banco de filtros de análisis para generar señales de subbanda de la señal de audio; un manipulador de tiempo para manipular el tiempo individualmente de una pluralidad de señales de subbanda que representan la señal de audio, el manipulador de tiempo comprende:
    una etapa de traslapar-agregar para superponer y adicionar bloques de al menos una de la pluralidad de señales de subbanda al usar un valor de traslapo-agregar-avance diferente a un valor del bloque-extracción-avance usado para extraer los bloques de una señal de subbanda de la pluralidad de señales de subbanda; un detector de transitorios para detectar un proceso transitorio en la señal de audio o la al menos una señal de subbanda de la pluralidad de señales de subbanda, donde la etapa de traslapar-agregar se configura para reducir una influencia de un proceso transitorio detectado o para no usar los procesos transitorios detectados en una manera individual mediante subbanda al añadir mediante la etapa de traslapar-agregar; y un circuito sumador de transitorios para adicionar un proceso transitorio detectado a la al menos una señal de subbanda generada por la etapa de traslapar-agregar en una manera individual mediante subbanda.
  2. 2.
    Un aparato según la reivindicación 1, que comprende además una delmación para diezmar la señal de audio o la pluralidad de señales de subbanda, donde el manipulador de tiempo se configura para llevar a cabo un estiramiento del tiempo de la pluralidad de señales de subbanda.
  3. 3.
    Un aparato según la reivindicación 1, donde el detector de transitorios se configura para marcar bloques detectados conforme comprenden un proceso transitorio en una manera individual mediante subbanda; y donde la etapa de traslapar-agregar se configura para ignorar los bloques marcados.
  4. 4.
    Un aparato según una de las reivindicaciones precedentes, donde la etapa de traslapar-agregar se configura para aplicar un valor de traslapo-agregar-avance que es mayor que un valor del bloque-extracción-avance para llevar a cabo un estiramiento del tiempo de la pluralidad de señales de subbanda.
  5. 5.
    Un aparato según una de las reivindicaciones precedentes, donde el manipulador de tiempo comprende además:
    un extractor del bloque; un ajustador de fase/intervalo de tiempo; y una calculadora de fases para calcular una fase, basado en que el ajustador de fase/intervalo de tiempo lleva a cabo el ajuste de la fase de un bloque extraído.
  6. 6.
    Un aparato según una de las reivindicaciones precedentes, donde el detector de transitorios se configura para determinar una longitud de una porción de la señal de subbanda que contiene al proceso transitorio, la longitud iguala la longitud de la señal a insertarse mediante el circuito sumador de transitorios.
  7. 7.
    Un aparato según una de las reivindicaciones precedentes, donde el circuito sumador de transitorios se configura para insertar una porción de la señal de subbanda que tiene al proceso transitorio, donde la longitud de la porción se selecciona de longitud suficiente, tal que sea posible una atenuación cruzada de la salida de la señal del traslapoadición-procesamiento a la porción que tiene al proceso transitorio o de la porción que tiene al proceso transitorio a la salida del traslapo-adición-procesamiento.
  8. 8.
    Un aparato según la reivindicación 7, donde el circuito sumador de transitorios se configura para llevar a cabo la operación de atenuación cruzada.
  9. 9.
    Un aparato según una de las reivindicaciones precedentes, donde el detector de transitorios se configura para detectar bloques extraídos por un extractor del bloque de la señal de subbanda que tiene una característica transitoria.
  10. 10.
    Un aparato según una de las reivindicaciones precedentes, donde el detector de transitorios se configura para llevar a cabo un cálculo del movimiento del centro de gravedad de una energía a través de un período de tiempo predeterminado de una señal para introducirse en un banco de filtros de análisis o una señal de subbanda.
  11. 11.
    Un aparato según la reivindicación 1, que comprende además una delmación configurada en un lado del ingreso
    o a un lado de la salida del banco de filtros de análisis, donde el manipulador de tiempo se configura para llevar a cabo un estiramiento del tiempo de la pluralidad de señales de subbanda.
  12. 12.
    El aparato según una de las reivindicaciones 1 a 9, que comprende además:
    un segundo banco de filtros de análisis; un remuestreo río arriba del segundo banco de filtros de análisis; y una pluralidad de codificadores de señales vocales en fases para una segunda pluralidad de la salida de señales de subbanda por el segundo banco de filtros de análisis, la pluralidad de codificadores de señales vocales en fases tiene un factor de extensión de la anchura de banda mayor que uno, donde una salida del codificador de señales vocales en fases se proporciona a la etapa de traslapar-agregar.
  13. 13.
    Un aparato según la reivindicación 12, que comprende además una etapa de conexión entre el primer banco de filtros de análisis y la pluralidad de codificadores de señales vocales en un lado del ingreso de la etapa de conexión y la etapa de traslapar-agregar en un lado de salida de la etapa de conexión, la etapa de conexión que se configura para controlar una condición de los bloques de la correspondiente una pluralidad de señales de subbanda y codificador de señales de bloques procesados por sintetizado vocal en fases por la pluralidad de codificadores de señales vocales en fases a la etapa de traslapar-agregar.
  14. 14.
    Un aparato según una de las reivindicaciones precedentes, que comprende además: una corrección de amplitud configurada para compensar efectos de afectación de amplitud de diversos bloques incluye el contexto de la etapa de traslapar-agregar.
  15. 15.
    Procedimiento para procesar una señal de audio, que comprende:
    generar una pluralidad de señales de subbanda de la señal de audio; superponer y adicionar bloques de la correspondiente pluralidad de señales de subbanda que representan la señal de audio al usar un valor de traslapo-agregar-avance diferente de un valor del bloque-extracción-avance usado para extraer los bloques de una señal de subbanda de la pluralidad de señales de subbanda; detectar un proceso transitorio en la al menos una señal de subbanda de la pluralidad de señales de subbanda; ya sea reducir una influencia o desechar un proceso transitorio detectado al superponerse y añadir en una manera individual mediante subbanda; adicionar un proceso transitorio detectado a la al menos una señal de subbanda generada por la acción de traslapo y adición en una manera individual mediante subbanda.
  16. 16.
    Un programa informático para llevar a cabo un procedimiento para procesar una señal de audio cuando el programa informático se ejecute en una computadora, el procedimiento comprende:
    generar una pluralidad de señales de subbanda de la señal de audio; superponer y adicionar bloques correspondientes de la pluralidad de señales de subbanda que representan la señal de audio al usar un valor de traslapo-agregar-avance diferente a un valor del bloque-extracción-avance usado para extraer los bloques de una señal de subbanda de entre la pluralidad de señales de subbanda; detectar un proceso transitorio en la al menos una señal de subbanda de la pluralidad de señales de subbanda; ya sea reducir una influencia o desechar un proceso transitorio detectado al superponerse y añadir de manera individual mediante subbanda; adicionar un proceso transitorio detectado, a la al menos una señal de subbanda generada mediante la acción de traslapo y adición de una manera individual mediante subbanda.
ES11708446.7T 2010-03-09 2011-03-04 Aparato, procedimiento y programa de ordenador para procesar una señal de audio Active ES2449476T3 (es)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US312131P 2001-08-13
US31213110P 2010-03-09 2010-03-09
PCT/EP2011/053303 WO2011110496A1 (en) 2010-03-09 2011-03-04 Apparatus and method for handling transient sound events in audio signals when changing the replay speed or pitch

Publications (1)

Publication Number Publication Date
ES2449476T3 true ES2449476T3 (es) 2014-03-19

Family

ID=43844535

Family Applications (1)

Application Number Title Priority Date Filing Date
ES11708446.7T Active ES2449476T3 (es) 2010-03-09 2011-03-04 Aparato, procedimiento y programa de ordenador para procesar una señal de audio

Country Status (14)

Country Link
US (1) US9240196B2 (es)
EP (1) EP2532002B1 (es)
JP (1) JP5649084B2 (es)
KR (1) KR101412117B1 (es)
CN (1) CN102934164B (es)
AU (1) AU2011226208B2 (es)
BR (1) BR112012022577B1 (es)
CA (1) CA2792368C (es)
ES (1) ES2449476T3 (es)
HK (1) HK1177318A1 (es)
MX (1) MX2012010350A (es)
PL (1) PL2532002T3 (es)
RU (1) RU2591012C2 (es)
WO (1) WO2011110496A1 (es)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2963648A1 (en) 2014-07-01 2016-01-06 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio processor and method for processing an audio signal using vertical phase correction
EP3288031A1 (en) 2016-08-23 2018-02-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding an audio signal using a compensation value
JP7275711B2 (ja) * 2019-03-20 2023-05-18 ヤマハ株式会社 オーディオ信号の処理方法

Family Cites Families (40)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS55107313A (en) 1979-02-08 1980-08-18 Pioneer Electronic Corp Adjuster for audio quality
US5455888A (en) 1992-12-04 1995-10-03 Northern Telecom Limited Speech bandwidth extension method and apparatus
US6766300B1 (en) * 1996-11-07 2004-07-20 Creative Technology Ltd. Method and apparatus for transient detection and non-distortion time scaling
SE512719C2 (sv) 1997-06-10 2000-05-02 Lars Gustaf Liljeryd En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
US6549884B1 (en) 1999-09-21 2003-04-15 Creative Technology Ltd. Phase-vocoder pitch-shifting
SE0001926D0 (sv) * 2000-05-23 2000-05-23 Lars Liljeryd Improved spectral translation/folding in the subband domain
CN1279511C (zh) * 2001-04-13 2006-10-11 多尔拜实验特许公司 一种时间标度和/或音调偏移一个音频信号的方法
US6895375B2 (en) 2001-10-04 2005-05-17 At&T Corp. System for bandwidth extension of Narrow-band speech
US20030187663A1 (en) 2002-03-28 2003-10-02 Truman Michael Mead Broadband frequency translation for high frequency regeneration
JP4313993B2 (ja) 2002-07-19 2009-08-12 パナソニック株式会社 オーディオ復号化装置およびオーディオ復号化方法
JP4227772B2 (ja) 2002-07-19 2009-02-18 日本電気株式会社 オーディオ復号装置と復号方法およびプログラム
SE0202770D0 (sv) 2002-09-18 2002-09-18 Coding Technologies Sweden Ab Method for reduction of aliasing introduces by spectral envelope adjustment in real-valued filterbanks
KR100524065B1 (ko) 2002-12-23 2005-10-26 삼성전자주식회사 시간-주파수 상관성을 이용한 개선된 오디오 부호화및/또는 복호화 방법과 그 장치
US7337108B2 (en) * 2003-09-10 2008-02-26 Microsoft Corporation System and method for providing high-quality stretching and compression of a digital audio signal
BRPI0415464B1 (pt) 2003-10-23 2019-04-24 Panasonic Intellectual Property Management Co., Ltd. Aparelho e método de codificação de espectro.
JP4254479B2 (ja) 2003-10-27 2009-04-15 ヤマハ株式会社 オーディオ帯域拡張再生装置
CA2454296A1 (en) * 2003-12-29 2005-06-29 Nokia Corporation Method and device for speech enhancement in the presence of background noise
DE102004046746B4 (de) * 2004-09-27 2007-03-01 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Verfahren zum Synchronisieren von Zusatzdaten und Basisdaten
US8255231B2 (en) 2004-11-02 2012-08-28 Koninklijke Philips Electronics N.V. Encoding and decoding of audio signals using complex-valued filter banks
ATE421845T1 (de) 2005-04-15 2009-02-15 Dolby Sweden Ab Zeitliche hüllkurvenformgebung von entkorrelierten signalen
JP2007017628A (ja) 2005-07-06 2007-01-25 Matsushita Electric Ind Co Ltd 復号化装置
US7565289B2 (en) * 2005-09-30 2009-07-21 Apple Inc. Echo avoidance in audio time stretching
JP4760278B2 (ja) 2005-10-04 2011-08-31 株式会社ケンウッド 補間装置、オーディオ再生装置、補間方法および補間プログラム
CN101326853B (zh) * 2005-12-13 2011-11-23 Nxp股份有限公司 处理音频数据流的装置和方法
FR2910743B1 (fr) 2006-12-22 2009-02-20 Thales Sa Banque de filtres numeriques cascadable, et circuit de reception comportant une telle banque de filtre en cascade.
CN101903944B (zh) 2007-12-18 2013-04-03 Lg电子株式会社 用于处理音频信号的方法和装置
CN101471072B (zh) 2007-12-27 2012-01-25 华为技术有限公司 高频重建方法、编码装置和解码装置
DE102008015702B4 (de) * 2008-01-31 2010-03-11 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zur Bandbreitenerweiterung eines Audiosignals
ES2739667T3 (es) * 2008-03-10 2020-02-03 Fraunhofer Ges Forschung Dispositivo y método para manipular una señal de audio que tiene un evento transitorio
US9147902B2 (en) 2008-07-04 2015-09-29 Guangdong Institute of Eco-Environmental and Soil Sciences Microbial fuel cell stack
CA2729474C (en) 2008-07-11 2015-09-01 Frederik Nagel Apparatus and method for generating a bandwidth extended signal
MY155538A (en) 2008-07-11 2015-10-30 Fraunhofer Ges Forschung An apparatus and a method for generating bandwidth extension output data
EP2169665B1 (en) * 2008-09-25 2018-05-02 LG Electronics Inc. A method and an apparatus for processing a signal
US8831958B2 (en) * 2008-09-25 2014-09-09 Lg Electronics Inc. Method and an apparatus for a bandwidth extension using different schemes
PL4053838T3 (pl) 2008-12-15 2023-11-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Dekoder powiększania szerokości pasma audio, powiązany sposób oraz program komputerowy
PL3246919T3 (pl) * 2009-01-28 2021-03-08 Dolby International Ab Ulepszona transpozycja harmonicznych
EP2214165A3 (en) * 2009-01-30 2010-09-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus, method and computer program for manipulating an audio signal comprising a transient event
WO2011047887A1 (en) * 2009-10-21 2011-04-28 Dolby International Ab Oversampling in a combined transposer filter bank
WO2011054885A1 (en) 2009-11-04 2011-05-12 Universiteit Gent 1-substituted 2-azabicyclo [3.1.1] heptyl derivatives useful as nicotinic acetylcholine receptor modulators for treating neurologic disorders
US8321216B2 (en) * 2010-02-23 2012-11-27 Broadcom Corporation Time-warping of audio signals for packet loss concealment avoiding audible artifacts

Also Published As

Publication number Publication date
CN102934164B (zh) 2015-12-09
KR101412117B1 (ko) 2014-06-26
US20130060367A1 (en) 2013-03-07
WO2011110496A1 (en) 2011-09-15
CN102934164A (zh) 2013-02-13
HK1177318A1 (en) 2013-08-16
CA2792368C (en) 2016-04-26
BR112012022577B1 (pt) 2021-06-29
BR112012022577A2 (pt) 2020-09-01
JP2013521537A (ja) 2013-06-10
EP2532002B1 (en) 2014-01-01
US9240196B2 (en) 2016-01-19
JP5649084B2 (ja) 2015-01-07
MX2012010350A (es) 2012-10-05
KR20130014515A (ko) 2013-02-07
AU2011226208A1 (en) 2012-10-11
AU2011226208B2 (en) 2013-12-19
RU2591012C2 (ru) 2016-07-10
RU2012142241A (ru) 2014-04-20
PL2532002T3 (pl) 2014-06-30
CA2792368A1 (en) 2011-09-15
EP2532002A1 (en) 2012-12-12

Similar Documents

Publication Publication Date Title
ES2478871T3 (es) Dispositivo, procedimiento y programa de ordenador para manipular una señal de audio
ES2340608T3 (es) Aparato y procedimiento para codificar mediante banda dividida una señal de voz.
Owren et al. Measuring emotion-related vocal acoustics
ES2309969T3 (es) Procedimiento y dispositivo para la ampliacion artificial de la anchura de banda de señales de voz.
US8489404B2 (en) Method for detecting audio signal transient and time-scale modification based on same
ES2673319T3 (es) Control de coherencia de fase para señales armónicas en códecs de audio perceptual
ES2355240T3 (es) Procesamiento de señales de múltiples canales.
CA2792449A1 (en) Device and method for improved magnitude response and temporal alignment in a phase vocoder based bandwidth extension method for audio signals
US10176824B2 (en) Method and system for consonant-vowel ratio modification for improving speech perception
Morise Platinum: A method to extract excitation signals for voice synthesis system
ES2449476T3 (es) Aparato, procedimiento y programa de ordenador para procesar una señal de audio
EP3113180B1 (en) Method for performing audio inpainting on a speech signal and apparatus for performing audio inpainting on a speech signal
Degottex et al. A measure of phase randomness for the harmonic model in speech synthesis.
ES2841302T3 (es) Aparato y método para procesar una señal de audio multicanal
Tiwari et al. Real-time implementation of multi-band frequency compression for listeners with moderate sensorineural impairment
Bagchi et al. Extending instantaneous de-mixing algorithms to anechoic mixtures
Rehman et al. Analysis and Recognition of Vowels in SHAIYÂNG MIRI Language using Formants
CN107342074B (zh) 语音和声音的识别方法
CN115578999A (zh) 复制语音的检测方法、装置、电子设备及存储介质
Tiwari Implementation of Multi-band Frequency Compression for Listeners with Moderate Sensorineural Impairment
Kwon et al. Analysis of the Relationship Between Sasang Constitutional Groups and Speech Features Based on a Listening Evaluation of Voice Characteristics
Sonu et al. Vowel onset marker based objective evaluation of Japanese phonemic length contrast produced by non-native speakers
Paliwal et al. Usefulness of Phase in Human Speech Perception
JP2006323265A (ja) 明瞭度評価装置、明瞭度評価方法、及び明瞭度評価プログラム
BR112015010954B1 (pt) Método de codificação de um sinal de áudio.