ES2831407T3 - Selección automática de reducción o realzado de sonidos transitorios - Google Patents

Selección automática de reducción o realzado de sonidos transitorios Download PDF

Info

Publication number
ES2831407T3
ES2831407T3 ES14869332T ES14869332T ES2831407T3 ES 2831407 T3 ES2831407 T3 ES 2831407T3 ES 14869332 T ES14869332 T ES 14869332T ES 14869332 T ES14869332 T ES 14869332T ES 2831407 T3 ES2831407 T3 ES 2831407T3
Authority
ES
Spain
Prior art keywords
transient
channel
envelopes
speech
noise
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES14869332T
Other languages
English (en)
Inventor
Florian Frühauf
Ernst Aschbacher
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
MED EL Elektromedizinische Geraete GmbH
Original Assignee
MED EL Elektromedizinische Geraete GmbH
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by MED EL Elektromedizinische Geraete GmbH filed Critical MED EL Elektromedizinische Geraete GmbH
Application granted granted Critical
Publication of ES2831407T3 publication Critical patent/ES2831407T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61NELECTROTHERAPY; MAGNETOTHERAPY; RADIATION THERAPY; ULTRASOUND THERAPY
    • A61N1/00Electrotherapy; Circuits therefor
    • A61N1/18Applying electric currents by contact electrodes
    • A61N1/32Applying electric currents by contact electrodes alternating or intermittent currents
    • A61N1/36Applying electric currents by contact electrodes alternating or intermittent currents for stimulation
    • A61N1/36036Applying electric currents by contact electrodes alternating or intermittent currents for stimulation of the outer, middle or inner ear
    • A61N1/36038Cochlear stimulation
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61NELECTROTHERAPY; MAGNETOTHERAPY; RADIATION THERAPY; ULTRASOUND THERAPY
    • A61N1/00Electrotherapy; Circuits therefor
    • A61N1/18Applying electric currents by contact electrodes
    • A61N1/32Applying electric currents by contact electrodes alternating or intermittent currents
    • A61N1/36Applying electric currents by contact electrodes alternating or intermittent currents for stimulation
    • A61N1/3605Implantable neurostimulators for stimulating central or peripheral nerve system
    • A61N1/3606Implantable neurostimulators for stimulating central or peripheral nerve system adapted for a particular treatment
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2225/00Details of deaf aids covered by H04R25/00, not provided for in any of its subgroups
    • H04R2225/67Implantable hearing aids or parts thereof not covered by H04R25/606

Landscapes

  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Animal Behavior & Ethology (AREA)
  • Public Health (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Radiology & Medical Imaging (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Otolaryngology (AREA)
  • Veterinary Medicine (AREA)
  • Biomedical Technology (AREA)
  • Neurosurgery (AREA)
  • Neurology (AREA)
  • Prostheses (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Soundproofing, Sound Blocking, And Sound Damping (AREA)

Abstract

Método para generar señales de estimulación de electrodo para contactos de electrodo de una disposición de electrodos (110) asociada con un implante auditivo (108), comprendiendo dicho método lo siguiente: procesar una señal auditiva de entrada para generar una pluralidad de señales de canal de paso de banda, cada una de las cuales representa una banda asociada de frecuencias auditivas; aplicar una reducción de ruido estacionario para proporcionar una envolvente de canal con ruido estacionario reducido a partir de cada señal de canal; detectar un transitorio en una o más de las envolventes de canal; modificar las envolventes de canal en función de si el transitorio es ruido transitorio o habla transitoria, para formar envolventes con transitorio modificado; en el que, si el transitorio es ruido transitorio, se reduce el ruido transitorio en una o más de las envolventes de canal para formar las envolventes con transitorio modificado; y si el transitorio es habla transitoria, se realza el habla transitoria en una o más de las envolventes de canal para formar las envolventes con transitorio modificado, y usar las envolventes con transitorio modificado para generar señales de estimulación de electrodo para los contactos de electrodo.

Description

DESCRIPCIÓN
Selección automática de reducción o realzado de sonidos transitorios
Campo técnico
La presente invención se refiere a sistemas de implantes auditivos tales como implantes cocleares y, específicamente, al procesamiento de señales que se usa en los mismos asociado con los sonidos transitorios.
Técnica anterior
Un oído normal transmite sonidos, como se muestra en la figura 1, a través del oído externo 101 hasta la membrana timpánica (tímpano) 102, lo que mueve los huesecillos del oído medio 103 (martillo, yunque y estribo) que hacen vibrar las aberturas de la ventana oval y la ventana redonda de la cóclea 104). La cóclea 104 es un conducto largo y estrecho enrollado en espiral alrededor de su eje a lo largo de aproximadamente dos vueltas y media. Incluye un canal superior conocido como rampa vestibular y un canal inferior conocido como rampa timpánica, que están conectados por el conducto coclear. La cóclea 104 forma un cono erguido en espiral con un centro denominado columela donde residen las células del ganglio espiral del nervio acústico 113. En respuesta a sonidos recibidos, transmitidos por el oído medio 103, la cóclea 104, que está rellena de fluido, actúa como un transductor para generar pulsos eléctricos que son transmitidos al nervio coclear 113 y, en última instancia al cerebro.
La audición es deficitaria cuando hay problemas en la capacidad del oído para transducir sonidos externos como potenciales de acción significativos a lo largo del sustrato neural de la cóclea 104. Para mejorar la deficiencia auditiva, se han desarrollado prótesis auditivas. Por ejemplo, cuando la afección guarda relación con el funcionamiento del oído medio 103, se puede usar un audífono convencional para proporcionar una estimulación mecánico-acústica del sistema auditivo en forma de amplificación del sonido. O cuando la afección está asociada con la cóclea 104, un implante coclear con un electrodo de estimulación implantado puede estimular eléctricamente el tejido del nervio auditivo con pequeñas corrientes suministradas por múltiples contactos de electrodo distribuidos a lo largo del electrodo.
La figura 1 también muestra algunos componentes de un sistema típico de implante coclear que incluye un micrófono externo que proporciona una entrada de señal auditiva a un procesador de señales externo 111 donde se pueden implementar varios esquemas de procesamiento de señales. La señal procesada es convertida entonces a un formato de datos digital, tal como una secuencia de marcos (frames) de datos, para su transmisión al interior del implante 108. Además de recibir la información de audio procesada, el implante 108 también realiza un procesamiento de señales adicional tal como una corrección de errores, formación de pulsos, etc., y produce un patrón de estimulación (basado en la información de audio extraída) que se envía a través de un cable de electrodo 109 a una disposición de electrodos implantados 110. Habitualmente, esta disposición de electrodos 110 incluye múltiples electrodos en su superficie que proporcionan una estimulación selectiva de la cóclea 104.
En los implantes cocleares de hoy en día, un número relativamente pequeño de electrodos están asociados, cada uno, a bandas de frecuencia relativamente anchas, dirigiéndose cada electrodo a un grupo de neuronas a través de un pulso de estimulación cuya carga se deriva de la amplitud instantánea de la envolvente dentro de la banda de frecuencias. En algunas estrategias de codificación, los pulsos de estimulación se aplican con una frecuencia constante a través de todos los electrodos, mientras que, en otras estrategias de codificación, los pulsos de estimulación se aplican a frecuencias específicas de electrodo.
Se pueden implementar diversos esquemas de procesamiento de señales para producir las señales de estimulación eléctrica. Los esquemas de procesamiento de señales que son bien conocidos en el campo de los implantes cocleares incluyen un procesamiento de señales digitales por muestreo intercalado continuo (CIS, por sus siglas en inglés de "digital signal processing"), un procesamiento de señales digitales por secuencias de muestreo específico de canal (CSSS, por sus siglas en inglés de "channel specific sampling sequences") (como se describe en la patente de EE. UU. n.° 6.348.070), un procesamiento de señales digitales por pico espectral (SPEAK, por sus siglas en inglés de "spectral peak") y un procesamiento de señales de comprimido analógico (CA, por sus siglas en inglés de "compressed analog"). Por ejemplo, en el esquema CIS, el procesamiento de señales para el procesador de habla implica las siguientes etapas:
(1) división del rango de frecuencias auditivas en bandas espectrales por medio de un banco de filtros,
(2) detección de envolvente de cada señal de salida del filtro,
(3) compresión no lineal instantánea de la señal de la envolvente (ley de mapeo).
De acuerdo con la organización tonotópica de la cóclea, cada electrodo de estimulación en la rampa timpánica está asociado con un filtro de paso de banda del banco de filtros externo. Para la estimulación, se aplican pulsos simétricos de corriente bifásica. Las amplitudes de los pulsos de estimulación se obtienen directamente de las señales de envolvente comprimidas. Estas señales se muestrean secuencialmente y los pulsos de estimulación se aplican en una secuencia estrictamente no solapante. Por lo tanto, como elemento ClS típico, solo hay un canal de estimulación activo al mismo tiempo y la frecuencia de estimulación global es comparativamente alta. Por ejemplo, asumiendo una frecuencia de estimulación global de 18 kpps y un banco de 12 filtros de canal, la frecuencia de estimulación por canal es de 1,5 kpps. Tal frecuencia de estimulación por canal normalmente es suficiente para una representación temporal adecuada de la señal de envolvente. La frecuencia de estimulación global máxima está limitada por la duración de fase mínima por pulso. La duración de fase no se puede elegir arbitrariamente corta, porque cuanto más cortos son los pulsos, más altas tendrán que ser las amplitudes de corriente para provocar potenciales de acción en las neuronas, y las amplitudes de corriente están limitadas por diversas razones prácticas. Para una frecuencia de estimulación global de 18 kpps, la duración de fase es de 27 ps, que está cerca del límite inferior. Cada señal de salida de los filtros de paso de banda CIS pueden ser considerada aproximadamente como una sinusoide en la frecuencia central del filtro de paso de banda que está modulada por la señal de envolvente. Esto es debido al factor de calidad (Q “ 3) de los filtros. En caso de un segmento de habla entonada, esta envolvente es aproximadamente periódica y la frecuencia de repetición es igual a la frecuencia del tono.
En la estrategia CIS existente, solos se usan las señales de envolvente para un procesamiento adicional, es decir, contienen la totalidad de la información de estimulación. Para cada canal, la envolvente está representada como una secuencia de pulsos bifásicos a una frecuencia de repetición constante. Un rasgo característico del CIS es que esta frecuencia de repetición (habitualmente de 1,5 kpps) es igual para todos los canales y no hay relación con las frecuencias centrales de los canales individuales. Se pretende que la frecuencia de repetición no sea una marca temporal para el paciente, es decir, debería ser suficientemente alta, para que el paciente no perciba tonos con una frecuencia igual a la frecuencia de repetición. La frecuencia de repetición normalmente se elige mayor que el doble del ancho de banda de las señales de envolvente (teorema Nyquist).
Otra estrategia de estimulación de implante coclear que transmite información detallada sobre la estructura temporal es la estrategia de procesamiento de estructura fina (FSP, por sus siglas en inglés de "Fine structure processing") de Med-El. Los ceros de las señales de tiempo filtradas por el filtro de paso de banda se rastrean y para cada paso por cero de negativo a positivo se inicia una secuencia de muestreo específica de un canal (CSSS). Habitualmente, las secuencias CSSS solo se aplican en el primero o en los dos canales más apicales, cubriendo el rango de frecuencias hasta 200 o 330 Hz. La disposición FSP se describe adicionalmente en el documento de Hochmair I, Nopp P, Jolly C, Schmidt M, ScholJer H, Garnham C, Anderson I, MED-EL Cochlear Implants: State of the Art and a Glimpse into the Future, Trends in Amplification, vol. 10, 201-219, 2006.
La figura 2 muestra los principales bloques funcionales de la disposición habitual del procesamiento de señales de los sistemas de implante coclear (IC) existentes, en el que las señales de paso de banda que contienen una temporización de estimulación e información de amplitud son asignadas a electrodos de estimulación. El Banco de Filtros del Preprocesador 201 procesa previamente una señal auditiva acústica inicial, por ejemplo, control de ganancia automático, reducción de ruido, etc. Cada filtro de paso de banda del Banco de Filtros del Preprocesador 201 está asociado con una banda específica de frecuencias auditivas de manera que la señal auditiva acústica es filtrada a N señales de paso de banda, B1 a Bn donde cada señal corresponde a la banda de frecuencias para uno de los filtros de paso de banda.
Las señales de paso de banda B1 a Bn se introducen en un Generador de Pulsos de Estimulación 202 que extrae información de estimulación específica de cada señal, por ejemplo, información de la envolvente, información de fase, temporización de eventos de estimulación solicitados, etc., en un conjunto de N señales de eventos de estimulación S1 a Sn, que representa eventos de estimulación solicitados específicos de un electrodo. Por ejemplo, se pueden usar secuencias de muestreo específicas de un canal (CSSS) como se describe en la patente de EE. UU., 6.594.525.
El Módulo de Mapeo de Pulsos 203 aplica una función de mapeo no lineal (habitualmente logarítmica) a la amplitud de cada envolvente de paso de banda. Esta función de mapeo habitualmente está adaptada a las necesidades del individuo usuario del IC durante el ajuste del implante para obtener un aumento natural del volumen. Este puede estar en forma específica de funciones que se aplican a cada señal de evento de estimulación solicitado S1 a Sn que reflejan características de percepción específicas del paciente para producir un conjunto de señales de estimulación de electrodo A1 a Am que proporcionan una representación eléctrica óptima de la señal acústica.
El Módulo de Mapeo de Pulsos 203 controla las funciones de mapeo del volumen. Las amplitudes de los pulsos eléctricos se derivan de las envolventes de las señales de salida del filtro de paso de banda asignado. Habitualmente, se puede aplicar una función logarítmica con un factor de forma C a señales de eventos de estimulación S1 a Sn como una función de mapeo del volumen, que generalmente es idéntica para todos los canales de análisis de paso de banda. En diferentes sistemas, se pueden usar diferentes funciones de mapeo de volumen específicas distintas de una función logarítmica, aunque solo se aplique una función idéntica a todos los canales para producir las señales de estimulación de electrodo A1 a Am de salida del Módulo de Mapeo de Pulsos 203.
La estimulación específica para el paciente se obtiene mediante un mapeo de amplitud individual y una definición de forma de pulso en el Formador de Pulsos 204 que desarrolla el conjunto de señales de estimulación de electrodo A1 a Am en un conjunto de pulsos de electrodo de salida E1 a Em a los electrodos de la disposición de electrodos implantados que estimula el tejido nervioso adyacente.
El ruido de fondo reduce la inteligibilidad de las conversaciones para los usuarios de audífonos e implantes cocleares. De acuerdo con el documento de Hernandez et al., An Assessment Of Everyday Noises And Their Annoyance, Hearing Review, 2006, 13(7), 16-20, el 33 % del ruido de fondo sensorial está formado por sonidos transitorios tales como el tecleo de un teclado de ordenador, portazos, tintineo de vajilla, etc., todos ellos son desagradables y reducen la comodidad auditiva (Véase también, la patente alemana DE 102005043314, incorporada en el presente documento por referencia). Se ha descubierto que los algoritmos de reducción del ruido transitorio en los audífonos existentes, tal como AntiShock de Unitron Connect y SoundSmoothing de Siemens, producen una mejora de la experiencia auditiva. Véase el documento de DiGiovanni et al., Effects of Transient-Noise Reduction Algorithms on Speech Intelligibility and Ratings of Hearing Aid Users, American Journal of Audiology, publicado por primera vez el 22 de septiembre del 2011 como DOI:10.1044/1059-0889 (2011/10-007). También se busca la reducción de ruidos transitorios en otras aplicaciones. Por ejemplo, se puede mejorar la calidad del sonido para los pasajeros de un coche reduciendo los ruidos transitorios generados cuando las ruedas golpean un desnivel. Véase la patente de Estados Unidos 7.725.315.
Por otra parte, el realzado de los elementos de habla transitoria de corta duración, como consonantes o inicios/finalizaciones del habla, pueden mejorar la percepción del habla en determinadas condiciones de escucha, en particular, con respecto a bajas intensidades. Véase: Vandali A.E., Emphasis of Short-dufrecuencian Acoustic Speech Cues for Cochlear Implant Users, The Journal of the Acoustical Society of America, 2001, 109(5), 2049­ 2061, DOI: 10.1121/1.1358300; y Holden L.K., Vandali A.E., Skinner M.W., Fourakis M.S., Holden T.A., Speech Recognition With the Advanced Combination Encoder and Transient Emphasis Spectral Maxima Strategies in Nucleus 24 Recipients, Journal of Speech, Language, and Hearing Research, 2005, 48, 681-701. Esto también puede realzar el inicio de ciertos elementos de habla, produciendo en último extremo una mayor inteligibilidad. Véase el documento de Koning R., Wouters J., The Potential of Onset Enhancement for Increased Speech Intelligibility in Auditory Prostheses, J. Acoust. Soc. Am. 132(4), de octubre del 2012, 2569-2581; y el documento de Jing Chen y Brian C.J. Moore, Effect of Individually Tailored Spectral Change Enhancement on Speech Intelligibility and Quality for Hearing-Impaired Lsteners, Actas de la Conferencia Internacional sobre acústica, habla y procesamiento de señales, ICASSP del 2013, Vancouver, Canadá, mayo del 2013).
Análogamente, en equipos de sonido de alta gama que procesan datos de audio, es deseable la capacidad de modificar características transitorias como los de unas baquetas golpeando un tambor para satisfacer las diferentes preferencias individuales cuando se escucha música. Véase la patente de Estados Unidos 7.353.169. En la patente de Estados Unidos 7.353.169, se usa el flujo espectral para determinar indicadores específicos de una frecuencia de características transitorias en equipos de sonido de alta gama. De acuerdo con estos indicadores, se aplica una modificación de las características transitorias correspondientes para mejorar la experiencia musical. Le corresponde al usuario decidir la cantidad, los rangos de frecuencia y el tipo de modificación (supresión o realzado) que prefiere.
A continuación, se proporcionan algunos métodos que buscan una reducción y un realzado de transitorios por separado.
Reducción de ruido transitorio
En la solicitud de patente de Estados Unidos n.° 13/975.487, y en la publicación posterior relacionada con el derecho anterior WO 2014/035854 A1 titulada "Reduction of Transient Sounds in Hearing Implants", de Frühauf, presentada el 26 de agosto de 2013, la señal de sonido se transforma en K sub-señales y cada una de estas señales corresponde a un rango de frecuencias determinado. Se consideran las envolventes de estas sub-señales y se denominan envolventes de sub-banda. Una característica de una señal de ruido transitorio es que las envolventes tienen altos valores en cada canal sobre un amplio rango de frecuencias, donde el límite de frecuencia inferior está por encima de aproximadamente 1 kHz. Indicadores específicos de canal de un elemento de ruido transitorio son calculados usando la potencia de la señal de entrada y las envolventes en las sub-bandas. Estos indicadores tienen unos valores altos si todas las envolventes de sub-banda correspondientes tienen valores altos con relación a la potencia de toda la señal. Los valores altos de todos los indicadores en el rango de frecuencias por encima de aproximadamente 1 kHz caracterizan un elemento de ruido transitorio, mientras que las consonantes o fricativas solo tienen algunos indicadores con valores altos. Por tanto, los indicadores de los rangos de frecuencia por encima de aproximadamente 1 kHz se multiplican para obtener un indicador que tenga un gran valor para un elemento de ruido transitorio.
Otra característica de las señales transitorias es una rápida y pronunciada elevación de la envolvente de la señal de sonido. Por tanto, durante la aparición de un transitorio, la envolvente tiene valores mucho más grandes durante un breve intervalo de tiempo. En la patente alemana DE 102005043314, se tienen en cuenta la pendiente y/o amplitud de la envolvente de la señal de sonido. Si uno o ambos de estos valores superan ciertos umbrales, se atenúa la señal de sonido.
En la patente europea EP 1371263, la señal de sonido se transforma en K sub-señales en el dominio de la frecuencia. Entonces, para cada sub-señal, se calculan dos o más subíndices que se usan para clasificar la presente señal de sonido en las categorías "ruido estacionario", "ruido cuasiestacionario", "habla y música deseadas" y "ruido transitorio". Estos subíndices se refieren a los cambios de intensidad durante un intervalo de tiempo determinado, la frecuencia de modulación y la duración de intensidades muy similares de la señal, respectivamente. De acuerdo con la categoría clasificada, se calcula una función de ganancia, que se usa para suprimir sonidos transitorios o para realzar la SRR en caso de las categorías clasificadas "ruido estacionario" o "ruido cuasiestacionario".
En el documento WO 99/53615, un detector de transitorios divide la señal de entrada al menos en dos bandas de frecuencia. En cada una de estas bandas, se comparan la derivada y/o la amplitud de la envolvente con al menos una función umbral para indicar un transitorio en la banda respectiva. Si se detecta un transitorio en al menos una banda, se cambian los coeficientes de un filtro adaptativo de tal manera que los transitorios en la señal de entrada se reduzcan filtrando la señal de entrada demorada con este filtro adaptativo determinado. Después de que el detector ya no detecte ningún transitorio, los coeficientes de filtro vuelven a los valores anteriores a la aparición del transitorio.
En la patente de Estados Unidos 7.353.169, se usa el flujo espectral para determinar indicadores específicos de una frecuencia de características transitorias en equipos de sonido de alta gama. De acuerdo con estos indicadores, se aplica una modificación de los elementos transitorias correspondientes para mejorar la experiencia musical. Le corresponde al usuario decidir la cantidad, los rangos de frecuencia y el tipo de modificación (supresión o realzado) que prefiere.
La patente de Estados Unidos 7.725.315 describe el uso de modelos de ruido transitorio de carretera en base a un libro de códigos o una red neural para atenuar los sonidos transitorios.
La patente de Estados Unidos 7.869.994 describe una atenuación de ciertos coeficientes wavelet en base a un umbral para suprimir sonidos transitorios.
Una posibilidad para reducir características transitorias en un sistema de implante coclear es usar algoritmos de audífono como se propone en el documento U.S. 2005/0209657
En el documento de Stobich B., Zierhofer C. M., Hochmair E. S., Influence of Automatic Gain Control Parameter Settings on Speech Understanding of Cochlear Implant Users Employing the Continuous Interleaved Sampling Strategy" Ear & Hearing, 1999, 20, 104-116 Stobich 1999, se propone AGC (por sus siglas en inglés de "Automatic gain control", control automático de ganancia) de interfaz dual para reducir características transitorias.
Realzado de habla transitoria
La patente de Estados Unidos 7.219.065 describe que se genera una pluralidad de envolventes en los canales de frecuencia de la señal de sonido. Entonces, en cada canal, se investigan cambios de intensidad de la envolvente dentro de una corta ventana temporal (60 ms) para calcular una ganancia, que se usa para realzar la intensidad de la envolvente en caso de que se detecte un elemento de habla transitoria. Para pequeñas variaciones o valores decrecientes de las intensidades, se establece la ganancia en uno. Los valores de ganancia más altos (de hasta 14 dB) se alcanzan si las intensidades tienen valores bajos, altos y bajos al principio (0-20 ms), a la mitad (20-40 ms) y al final (40-60 ms) de la ventana temporal, respectivamente. Asimismo, se usa un pequeño realzado si hay una iniciación (“onset”), es decir, pequeños valores de las envolventes al principio, seguido de un valor alto a la mitad y al final de la ventana temporal.
El documento de Koning R., Wouters J., The Potential of Onset Enhancement for Increased Speech Intelligibility in Auditory Pros theses, J. Acoust. Soc. Am. Volumen 132, Edición 4, pp. 2569-2581 (2012); describe una señal de sonido separada en bandas de frecuencia y las iniciaciones de las correspondientes envolventes se realzan añadiendo señales de pico de envolvente. Las envolventes de pico específicas de banda son las diferencias rectificadas y ponderadas de la envolvente correspondiente y la envolvente ponderada filtrada con un filtro de paso bajo. Los estudios han demostrado que este realzado de las iniciaciones aumenta la inteligibilidad del habla.
El artículo de Chen, J., Moore, B. C. J., Effect of Individually Tailored Spectral Change Enhancement on Speech Intelligibility and Quality for Hearing-impaired Listeners, Actas de la Conferencia Internacional sobre acústica, habla y procesamiento de señales, ICASSP del 2013, Vancouver, Canadá, mayo del 2013, investiga la influencia del realzado de cambios espectrales para los oyentes con discapacidad auditiva. La señal de sonido de entrada se transforma en componentes espectrales mediante una transformada de Fourier de corta duración. Los cambios de esas amplitudes se realzan entonces y se vuelven a transformar en el dominio temporal. Estas señales realzadas son evaluadas por sujetos con pérdidas auditivas de leve a severa. El estudio muestra que la inteligibilidad del habla aumenta mientras que la calidad del sonido permanece prácticamente igual.
El documento US 2013/019 5302 A1 divulga un audífono configurado para ser llevado por un usuario con discapacidad auditiva. El audífono tiene un filtro de banda de división y medios para realzar el habla. Los medios para realzar el habla comprenden un detector de habla y un controlador de ganancia selectiva. El filtro de banda de división está configurado para separar una señal de entrada en una pluralidad de bandas de frecuencia. El detector de habla tiene medios para detectar un nivel de ruido, medios para detectar una señal de habla sonora y medios para detectar una señal de habla sorda en cada banda de frecuencias de la pluralidad de bandas de frecuencia de la señal de entrada. El controlador de ganancia selectiva está adaptado para aumentar el nivel de ganancia aplicado a la señal de salida una cantidad predeterminada en aquellas bandas de frecuencia de la pluralidad de bandas de frecuencia donde el nivel de la señal de habla sonora es más alto que el nivel de ruido detectado.
Resumen de las realizaciones
La invención está definida por las reivindicaciones independientes 1 y 7. De conformidad con una realización de la invención, se presenta un método de generación de señales de estimulación de electrodo para unos contactos de electrodo de una disposición de electrodos asociada con un implante auditivo. Una señal auditiva de entrada es procesada para generar una pluralidad de señales de canal de paso de banda, cada una de las cuales representa una banda asociada de frecuencias auditivas. Se aplica una reducción de ruido estacionario para proporcionar una envolvente de canal con ruido estacionario reducido a partir de cada señal de canal. Se detecta un transitorio en una o más de las envolventes de canal. Se modifican las envolventes de canal en función de si el transitorio es ruido transitorio o habla transitoria, para formar envolventes con transitorio modificado. Las envolventes con transitorio modificado se usan para generar señales de estimulación de electrodo para los contactos de electrodo.
El método incluye reducir el ruido transitorio en una o más de las envolventes de canal, si el transitorio es ruido transitorio, para formar las envolventes con transitorio modificado. Como alternativa, si el transitorio es habla transitoria, se realza el habla transitoria en una o más de las envolventes de canal para formar las envolventes con transitorio modificado. El implante auditivo puede ser un implante coclear totalmente implantable, un implante coclear tanto con un procesador de habla externo como con un estimulador implantado que incluya la disposición de electrodos o un implante auditivo de tronco encefálico.
De conformidad con otras realizaciones adicionales relacionadas de la invención, la detección del transitorio puede incluir determinar para cada envolvente de canal un indicador de ruido transitorio específico de cada canal que caracteriza un ruido transitorio presente en la señal de canal, y determinar para cada envolvente de canal un indicador de habla transitoria específico de cada canal que caracteriza un habla transitoria presente en la señal de canal. El indicador de ruido transitorio específico de cada canal se puede basar en una proporción de potencia de la envolvente de canal con respecto a la potencia de la señal auditiva de entrada. Determinar el indicador de ruido transitorio específico de cada canal puede incluir aplicar un filtrado de paso alto a la envolvente de canal. Determinar para cada envolvente de canal un indicador de habla transitoria específico de cada canal puede incluir: aplicar un filtrado de paso alto a la envolvente de canal; aplicar un filtrado de paso bajo a la envolvente de canal; determinar los rangos de la envolvente de canal filtrada con paso alto, la envolvente de canal filtrada con paso bajo y la envolvente de canal; y determinar para cada envolvente de canal un indicador de habla transitoria específico de cada canal en función de los rangos determinados. Modificar las envolventes de canal puede incluir aplicar una ganancia específica de canal a cada envolvente de canal en función de su indicador de ruido transitorio y de su indicador de habla transitoria asociados para producir las envolventes con transitorio modificado. Se puede introducir un retraso, que, al detectar el ruido transitorio, permita una modificación de la ganancia específica de canal aplicada hasta un tiempo predeterminado antes del ruido transitorio detectado. Modificar las envolventes de canal puede incluir limitar la amplitud de las envolventes de canal para reducir la distorsión resultante de un realzado grande.
De conformidad con otra realización de la invención, se proporciona una disposición de procesamiento de señales para generar señales de estimulación de electrodo para los contactos de electrodo de una disposición de electrodos asociada con un implante auditivo. La disposición incluye un preprocesador de banco de filtros configurado para procesar una señal auditiva de entrada para generar una pluralidad de señales de canal de paso de banda, cada una de las cuales representa una banda asociada de frecuencias auditivas. Un módulo de reducción de ruido (RR) estacionario está configurado para reducir el ruido estacionario en cada canal y proporcionar una envolvente de canal con ruido estacionario reducido a partir de cada señal de canal. Una estación de modificación de transitorios (EMT) está configurada para detectar un transitorio en una o más de las envolventes de canal y modificar las envolventes de canal en función de si el transitorio es ruido transitorio o habla transitoria, para formar envolventes con transitorio modificado. Un generador de señales de estimulación está configurado para usar las envolventes con transitorio modificado para generar señales de estimulación de electrodo para los contactos de electrodo.
La estación de modificación de transitorios está configurada de tal manera que, si el transitorio es ruido transitorio, se reduce el ruido transitorio en una o más de las envolventes de canal para formar las envolventes con transitorio modificado. Si el transitorio es habla transitoria, se realza el habla transitoria en una o más de las envolventes de canal para formar las envolventes con transitorio modificado. El implante auditivo puede ser un implante coclear totalmente implantable, un implante coclear tanto con un procesador de habla externo como con un estimulador implantado que incluya la disposición de electrodos o un implante auditivo de tronco encefálico.
La estación de modificación de transitorios puede determinar para cada envolvente de canal un indicador de ruido transitorio específico de cada canal que caracterice un ruido transitorio presente en la señal de canal, y un indicador de habla transitoria específico de cada canal que caracterice un habla transitoria presente en la señal de canal. La estación de modificación de transitorios puede determinar el indicador de ruido transitorio específico de cada canal en base a una proporción de potencia de la envolvente de canal con respecto a la potencia de la señal auditiva de entrada. La estación de modificación de transitorios puede determinar el indicador de ruido transitorio específico de cada canal en base a un filtrado de paso alto de la envolvente de canal. La estación de modificación de transitorios puede incluir un filtro de paso alto para filtrar la envolvente de canal y un filtro de paso bajo para filtrar la envolvente de canal, en el que la estación de modificación de transitorios además está configurada para determinar rangos de la envolvente de canal filtrada con un filtro de paso bajo, la envolvente de canal filtrada con un filtro de paso bajo y la envolvente de canal, y determinar para cada envolvente de canal un indicador de habla transitoria específico de cada canal en función de los rangos determinados. La estación de modificación de transitorios además puede estar configurada para aplicar una ganancia específica de canal a cada envolvente de canal en función de su indicador de ruido transitorio y de su indicador de habla transitoria asociados para producir las envolventes con transitorio modificado. La estación de modificación de transitorios puede estar configurada para proporcionar un retraso que, al detectar un ruido transitorio, permita una modificación de la ganancia específica de canal aplicada hasta un tiempo predeterminado antes del ruido transitorio detectado. La estación de modificación de transitorios puede estar configurada, cuando se modifican las envolventes de canal, para limitar la amplitud de las envolventes de canal para reducir la distorsión resultante de un realzado grande.
Breve descripción de los dibujos
Los elementos anteriores de las realizaciones se entenderán más fácilmente haciendo referencia a la siguiente descripción detallada, tomada junto con los dibujos adjuntos, en los que:
la figura 1 muestra la anatomía de un oído humano convencional y los componentes de un sistema de implante coclear;
la figura 2 muestra los principales bloques de procesamiento de señales de un sistema de implante coclear convencional;
la figura 3(a) muestra un ejemplo de señal de sonido de entrada que incluye tanto ruido transitorio como habla transitoria; mientras que la figura 3(b) muestra su espectrograma asociado;
la figura 4 muestra un esquema general de un sistema de procesamiento de señales para un audífono o un implante, de conformidad con una realización de la invención;
la figura 5 muestra un ejemplo de EMT con más detalle, de conformidad con una realización de la invención;
la figura 6 muestra un ejemplo de implementación del módulo detector de habla transitoria, de conformidad con una realización de la invención;
la figura 7 muestra un ejemplo de implementación de un módulo calculador de ganancia, de conformidad con una realización de la invención;
las figuras 8(a-d) muestran las envolventes y las correspondientes ganancias para diversas hablas transitorias, de conformidad con una realización de la invención. La figura 8(a) muestra las envolventes para un habla transitoria que incluye la consonante [s], mientras que en la figura 8(b), se muestran las ganancias correspondientes. La figura 8(c) muestra las envolventes para un habla transitoria que incluye la vocal [0:], mientras que en la figura 8(b), se muestran las ganancias correspondientes;
la figura 9(a) muestra las envolventes de ruido transitorio, mientras que la figura 9(b) muestra las ganancias correspondientes, de conformidad con una realización de la invención. Las figuras 9(c) y 9(d) muestran las correspondientes envolventes y ganancias, respectivamente, en las que se aplica una interpolación lineal de la ganancia entre el valor de ganancia 20 ms antes y en la ubicación de la detección del ruido transitorio, de conformidad con una realización de la invención;
la figura 10(a) muestra un espectrograma de los cambios de señal de la EMT, de conformidad con una realización de la invención. La figura 10(b) muestra un espectrograma de los cambios de señal de la EMTs, de conformidad con diversas realizaciones de la invención; y
la figura 11 (a) muestra la ganancia resultante dentro del rango de frecuencias de 5034,5-6811 Hz correspondiente a la señal de sonido s entrante, de conformidad con una realización de la invención. La figura 11 (b) muestra la ganancia resultante dentro del rango de frecuencias de 6811-9000 Hz correspondiente a la señal de sonido de entrada s, de conformidad con una realización de la invención.
La figura 12(a) muestra un espectrograma asociado con la señal de entrada s después del banco de filtros, de conformidad con una realización de la invención. La figura 12(b) muestra un espectrograma asociado con la señal de entrada s después de la reducción de ruido estacionario, de conformidad con una realización de la invención; la figura 12(c) muestra un espectrograma asociado con la señal de entrada s después de una modificación de los transitorios, de conformidad con una realización de la invención.
Descripción detallada de realizaciones específicas
En las realizaciones ilustradas, se proporciona un sistema y una metodología que está dirigida a mejorar la comodidad auditiva y la inteligibilidad del habla en usuarios de audífonos o implantes auditivos, tales como implantes cocleares. Más particularmente, en diversas realizaciones, un detector de sonidos transitorios puede caracterizar automáticamente transitorios como un elemento de ruido o como uno de habla. La asignación automática de características transitorias permite ventajosamente una reducción de ruidos transitorios desagradables como el tintineo de vajilla, crujidos de papel o portazos, y el realzado de elementos de sonido deseables como iniciaciones de conversaciones o música. Esto puede conllevar un aumento de la inteligibilidad del habla y de la comodidad auditiva de los usuarios del implante auditivo. Los detalles se exponen más adelante.
La figura 3(a) muestra un ejemplo de señal de sonido de entrada que incluye tanto ruido transitorio como habla transitoria; mientras que la figura 3(b) muestra su espectrograma asociado. La señal de sonido de entrada incluye habla, ruido de parloteo y dos sonidos de ruido transitorio debido a tintineo de vajilla. Estos sonidos de ruido transitorio están marcados por las zonas en gris oscuro y resultan desagradables para los usuarios de audífonos/implante por lo que deberían reducirse. Por otra parte, hay elementos de habla transitoria con bajas intensidades que están marcados por las zonas gris claro. En la figura 3(b) las transcripciones fonéticas están etiquetadas entre corchetes. En este caso, los elementos de habla transitoria son las consonantes [v] y [f] del nombre "Wolfgang" ([volfgang]), Q] de la palabra "schenkt" ([Jenkt]) y [t] y [s] de la palabra "Tasse" ([tase]), respectivamente. En la figura 3(b), las características de transitorios están marcadas con unas líneas gris oscuro (habla transitoria) y gris claro (ruido transitorio).
La figura 4 muestra un esquema general de un sistema de procesamiento de señales para un audífono o un implante, de conformidad con una realización de la invención. El implante auditivo puede ser, sin que suponga necesariamente una limitación, un implante coclear, en el que los electrodos de una disposición de electrodos de múltiples canales están situados de manera que estén, por ejemplo, divididos espacialmente dentro de la cóclea. El implante coclear puede estar implantado parcialmente e incluir, sin que suponga necesariamente una limitación, un procesador externo de habla/señal, un micrófono y/o una bobina, con un estimulador implantado y/o disposición de electrodos. En otras realizaciones, el implante coclear puede ser un implante coclear totalmente implantado. En realizaciones adicionales, el electrodo multicanal puede estar asociado con un implante de tronco encefálico, tal como un implante auditivo de tronco encefálico (ABI, por sus siglas en inglés de "auditory brainstem implant").
El sistema de procesamiento de señales mostrado en la figura 4 incluye un módulo de canal único de reducción de ruido estacionario (RR) 403 y una estación subsiguiente de modificación de transitorios (EMT) 405. En este caso, se empieza con una señal de sonido s digitalizada. Entonces, se divide s en K señales analíticas S1,...,sk mediante un banco de filtros (BF) 401, que asigna un rango de frecuencias correspondiente a cada una de ellas. El banco de filtros (BF) 401 puede implementarse como múltiples filtros de paso de banda con frecuencias de corte específicas o, como alternativa, y sin limitación, una transformada rápida de Fourier (FFT, por sus siglas en inglés de "fast Fourier transform") o una transformada de Fourier de corta duración (STFT, por sus siglas en inglés de "short-time Fourier transform"). A continuación, el módulo de reducción de ruido (RR) 403 reduce el ruido estacionario en cada canal. La señal de salida del módulo de reducción de ruido (RR) 403 son K envolventes X1 ,...,xk con un ruido estacionario reducido. Se puede encontrar una posible implementación de este módulo: en el documento de Y. Ephraim, D. Malah, Speech Enhancement Using a Mínimum Mean-Square Error Short-Time Spectral Amplitude Estimator, Transcripciones de la IEEE sobre Acústica, Habla y Procesamiento de Señales, Vol. ASSP-32, N.° 6, diciembre de 1984; y, S. F. Boll, Suppression of Acoustic Noise in Speech using Spectral Subtraction, Transcripciones de la IEEE, sobre Acústica, Habla y Procesamiento de Señales, Vol. ASSP 27, N.° 2, abril de 1979. Estas K envolventes son las señales de entrada en la estación de modificación de transitorios (EMT) 405. En la EMT 405, se modifican las características transitorias de cada envolvente según el tipo de transitorio detectado. Por ejemplo, se puede reducir un ruido transitorio detectado, mientras se puede realzar una característica de habla transitoria detectada u otra característica de sonido deseable, tal como, sin que suponga necesariamente una limitación, la iniciación de una pieza musical. Esto tiene como resultado una modificación adicional de las envolventes, que son las señales de entrada yv..,yK al módulo generador de pulsos 407. Los pulsos generados se transmiten entonces al audífono o implante.
La figura 5 muestra un ejemplo de estación de modificación de transitorios EMT 405 con más detalle, de conformidad con una realización de la invención. La EMT puede incluir, por ejemplo, un módulo detector de ruido transitorio 501, un módulo detector de habla transitoria 503, módulos de cálculo de ganancia 505 y módulos de aplicación de ganancia M1....MK 507 con los que se aplican las ganancias calculadas a las envolventes x i,...,xk. A continuación, se describe cada uno de los mismos.
Módulo Detector de Ruido Transitorio
Las señales de entrada del módulo detector de ruido transitorio 501 puede incluir las K envolventes x1,...,xk y la señal de sonido s. La señal de salida de este módulo puede incluir, por ejemplo, las señales del indicador DTR1 ,...,DTRk de ruido transitorio para cada canal. Si existe una característica de ruido transitorio en el instante t, los indicadores pueden tener, sin que suponga necesariamente una limitación, unos valores altos, mientras que, si no hay ruido transitorio, los indicadores pueden tener unos valores bajos. Anteriormente, en la sección de antecedentes, se han descrito ejemplos de métodos que se pueden usar para calcular los indicadores de ruido transitorio. De manera ilustrativa, los métodos pueden incluir lo siguiente.
A. Sean las envolventes normalizadas el valor de cada envolvente en comparación con todas las envolventes o la energía de la señal de entrada s, es decir, xk = , donde BP(s) es una estimación de potencia de toda la señal auditiva. Entonces, se puede usar una combinación de algunas de las envolventes normalizadas como indicador de ruido transitorio; dado que las envolventes tienen valores altos en la mayoría de las frecuencias en las localizaciones de un ruido transitorio en contraste con los elementos de habla transitoria (véase la figura 3(b)). Un posible cálculo viene dado por DTRk = n mEs%m donde S es el conjunto de canales con un límite inferior de frecuencias por encima de aproximadamente 1 kHz. Para una descripción más detallada de un algoritmo ilustrativo véase Frühauf.
B. Se puede usar una combinación de las envolventes como indicador en lugar de las envolventes normalizadas.
C. Se pueden usar combinaciones de envolventes filtradas con filtros de paso alto o envolventes normalizadas para determinar los indicadores.
Módulo Detector de Habla transitoria
El módulo detector de habla transitoria 503 puede incluir las mismas señales de entrada x i,...,xk que el módulo detector de ruido transitorio 501 y además puede incluir una señal s. Las señales de salida del módulo detector de habla transitoria 503 pueden incluir señales del indicador DTVi ,...,DTVk de habla transitoria. En la figura 6 se muestra un ejemplo de implementación del módulo detector de habla transitoria 503, de conformidad con una realización de la invención. El cálculo de los indicadores se puede realizar en cada canal por separado. Para simplificar, se prescindirá del subíndice k en la siguiente exposición.
En una primera etapa, la señal de entrada x se puede filtrar con un filtro de paso bajo en el módulo PB 601 y con un filtro de paso alto en el módulo PA 603. En una segunda etapa se determina un rango distinto para las señales PB( x), PA( x) y x con cualquier función adecuada, discreta o continua, limitada separadamente en los módulos de determinación de rangos 605, 607 y 609, respectivamente, con, por ejemplo, r(v) = máx(0,a -\m - v|), donde v puede ser PB(x ), PA(x) o x . Los parámetros a y m se pueden elegir de manera diferente para cada canal y las señales filtradas con un filtro de paso bajo (apB, mpB) y las señales filtradas con un filtro de paso alto (apA, mPA) y la señal x (ax,mX). En una tercera etapa, las tres señales r(PB(x)), r(PA(x)) y r(x) se combinan para obtener la señal de salida DTV. La combinación se puede realizar, sin que suponga necesariamente una limitación, mediante una multiplicación o una tabla de consulta o cuando la salida del rango distintivo es binaria, cualquier combinación lógica que comprenda puertas lógicas AND o puertas lógicas OR. Un elemento de habla transitoria puede ser una iniciación (“onset”) o finalización (“offset”) de un elemento de habla transitoria y se puede detectar si mpB - apB < PB( x) < mpB + apB y mpA - apA < PA( x) < mpA + apA y mx - ax < x < mx + ax. Esto produce un indicador que tiene valores grandes si se produce un elemento de habla transitoria (por ejemplo, una iniciación de habla) en el canal correspondiente, teniendo un indicador valores bajos si no hay ningún elemento de habla transitoria. Este es el caso dado que, por ejemplo:
o Las señales filtradas con un filtro de paso alto tienen pequeños valores absolutos para señales estacionarias. o Durante una vocal, un elemento de ruido transitorio o una consonante, x tiene un valor medio grande, es decir, PB(x) > mpB + apB.
o En general, el habla está en un rango dinámico de 50 a 70 dB de nivel de presión sonora (sp1). Por tanto, los elementos de habla transitoria están en determinado intervalo de x .
o La iniciación de un ruido transitorio es muy pronunciado y por tanto el valor absoluto de la señal filtrada con un filtro de paso alto es grande, es decir, PA( x) > mpA apA o PA( x) < mpA - apA.
En otra realización, la señal PB( x) de la etapa 2 además se puede filtrar con un filtro de paso alto para formar la señal PA(PB(x)) antes de alimentar con ella el módulo de determinación de rangos 605. Se detecta la iniciación de un elemento transitorio si PA(PB( x)) está dentro de un intervalo {v:r(v) > 0,v = PA(PB( x))} = ]m¡n¡ - a^, mn + a¡n¡ [ c ]0,+~[ y se detecta la finalización de un elemento de habla transitoria si PA(PB( x)) está dentro de un intervalo {v:r(v) > 0,v = PA(PB(x))} = ]mtin - afin, mn + an [c ]-~,0[ y además se cumple que mpB - apB < PB(x) < mpB + apB y mpA - apA < PA(x) < mpA + apA y mx - ax < x < mx + ax. Los parámetros a¡n¡, m n y arm, mrm definen los límites de los intervalos para la iniciación y finalización de un elemento de habla transitoria de la misma forma que para los parámetros apB,mpB y apA,mpA y ax,mx, respectivamente. Los parámetros a y m se pueden elegir de manera diferente para cada canal y las señales de iniciación (a¡n¡, m ¡n¡) y finalización (a®,, m/n). rn = r(PA(PB(x))) y rrm = r(PA(PB(x))) denota la señal emitida por el módulo de determinación de rangos 605 para la iniciación y la finalización del elemento de habla, respectivamente. En la tercera etapa, las cuatro señales máx(r¡ni,rf¡n), r(PB(x)), r(PA(x)) y r(x) se combinan para obtener la señal de salida DTV. La combinación se puede realizar, sin que suponga necesariamente una limitación, mediante una multiplicación.
Por lo tanto, generalmente durante las iniciaciones y las finalizaciones de los elementos de habla DTV presenta valores distintos de cero. Los parámetros ax, mx y spb, mpB y apA, mpA y ani, umbrales de habla determinados empíricamente de manera que el elemento de ruido transitorio se pueda distinguir con fiabilidad de la señal de habla. Estos umbrales dependen del lenguaje. Los parámetros también pueden depender de la frecuencia, es decir, varían según el canal, preferiblemente, teniendo valores más altos en canales de baja frecuencia que en los canales de alta frecuencia. Los parámetros además pueden depender de las señales de entrada, por ejemplo, pueden depender de si la señal de entrada comprende o no una envolvente normalizada.
Los parámetros pueden depender de cualquier combinación del lenguaje, del canal de frecuencia y/o de la señal de entrada. Los parámetros pueden programarse en el procesador de señales externo 111 y/o en el implante 108 del sistema de implante coclear durante la sesión de ajuste. Anteriormente, en la sección de antecedentes, se han descrito ejemplos de métodos que se pueden usar para calcular los indicadores de habla transitoria.
Módulo Calculador de Ganancia
El módulo calculador de ganancia 505 puede incluir los indicadores de ruido transitorio DTRk y de habla transitoria DTVk como señales de entrada. La salida puede ser una ganancia específica de canal Gk. La figura 7 muestra una implementación de un módulo calculador de ganancia 700 que puede estar separado en tres partes, de conformidad con una realización de la invención. Un primer módulo "gc1" 701 genera una función de ganancia actual h y el modo activo actual (mod e {rea, sup}) para el realzado o la supresión de la señal. El segundo módulo "gc2" 703 calcula una señal f e [0,1], que define la cantidad de supresión o de realzado. El tercer módulo "gc3" 705 determina, por último, la ganancia de salida G. Cada uno de estos módulos se describe con más detalle a continuación. En el presente documento n denota el índice de tiempo.
Módulo "gc1"
El módulo "gc1" 701 desempeña un papel crucial en el algoritmo, dado que la decisión de si la componente de la señal debería realzarse o suprimirse se toma aquí. Una posible implementación puede ser, sin que suponga necesariamente una limitación, de la siguiente manera: Asumiendo que se detecte un ruido transitorio, es decir, DTR[n] > 0. Entonces, la supresión del ruido transitorio debería empezar inmediatamente. Por tanto, el módulo "gc1" establece mod[n] = sup para una supresión, y h[n] = máx(L,1 - csup ■ DTR[n]), donde 0 < L < 1 es el límite inferior de la señal f, y el parámetro csup controla la cantidad del indicador DTR[n] para la supresión. Durante el intervalo de tiempo de la supresión de un ruido transitorio (f < 1), todos los elementos de habla transitoria detectados pueden ignorarse. La detección de un ruido transitorio adicional puede aumentar la supresión de nuevo. Si la supresión ha terminado y se detecta un elemento de habla transitoria (DTV[n] >0), entonces, el realzado puede empezar estableciendo mod[n] = rea y h[n] = máx(L,1 - Crea • DTV[n]) con el parámetro Crea. Los parámetros Csup diferir. Un ejemplo de pseudo código para el módulo "gc1" sería:
■ Si [DTR[n] == 0 & (f[n-1] == 1 | mod[n] == rea)] // si [no se detecta ruido transitorio Y (ha terminado la supresión O el modo de realzado está activo]
• h[n] = máx(L,1 - crea • DTV[n])
• mod[n] = rea
Si no // se detecta un ruido transitorio o la supresión no ha terminado, es decir, f[n-1 ] < 1
• h[n] = máx(L,1 - csup • DTR[n])
• mod[n] = sup
Módulo "gc2"
El módulo "gc2" 703 puede incluir parámetros asup, area, rsup y dea que controlan el tiempo de ataque y de liberación en el modo de supresión y de realzado. En cada modo el cálculo es el mismo, pero los valores del parámetro difieren. El cálculo se puede hacer ilustrativamente mediante
f\ 1 = K [n - 1] ■ (h[n] - f [n - 1]) si h[n] > f [n - 1]
' n th[n] amod ■ (f [n - 1] - h[n]) si h[n] < f [n - 1]'
Para el modo de supresión se desea un ataque rápido (h[n] < f[n-1]) para reducir la cantidad de ruido transitorio inmediatamente, es decir, asup <<1. Si h[n] > /[n-1], se aplica una ganancia exponencialmente incremental, donde el parámetro rsup controla el tiempo de liberación, que debería corresponder a la duración del ruido transitorio. Para el modo de realzado se desea un tiempo de ataque más lento para empezar el realzado con suavidad, es decir, 0 << area < 1. El tiempo de liberación está controlado de nuevo por el parámetro dea, que puede corresponder al tiempo de inicio de la respectiva habla transitoria.
Módulo "gc3"
El módulo "gc3" 705 determina la ganancia de salida. De manera ilustrativa, la ganancia de salida puede, sin que suponga necesariamente una limitación, calcularse mediante
f [n] si mod[n] = sup
G[n] =
.% i 1 - % ) f [n] si mod[n] = rea'
El parámetro qg > 1 define el realzado máximo.
Módulo de Aplicación de Ganancia
En los módulos de aplicación de ganancia M1,...,MK 507, las ganancias calculadas se aplican a las envolventes, es decir, yk = Xk • Gk.
Las figuras 8(a-d) muestran envolventes y las correspondientes ganancias para diversas hablas transitorias, de conformidad con diversas realizaciones de la invención. Más particularmente, Las figuras 8(a- b) muestran envolventes y las correspondientes ganancias para diversas hablas transitorias, de conformidad con diversas realizaciones de la invención, en el rango de frecuencias de 6811 Hz a 9000 Hz después del banco de filtros (sk), la estación/módulo de reducción de ruido estacionario (Xk), y la estación /módulo de modificación de transitorios EMT (yk), respectivamente. La figura 8(a) muestra las envolventes para un habla transitoria que incluye la consonante [s], mientras que en la figura 8(b), se muestran las ganancias correspondientes, de conformidad con una realización de la invención. La señal envsF se refiere a la envolvente de las señales emitidas por el banco de filtros (BF) 401, la señal envRR a las señales Xk emitidas por el módulo de reducción de ruido (RR) 403 y envjR a las señales yk emitidas por la estación de modificación de transitorios (EMT) 405. Hasta los 4,36 segundos, la reducción de ruido estacionario disminuye erróneamente la envolvente y difumina el inicio del habla, dado que el detector del módulo (RR) 403 identifica el habla con demasiada lentitud. Después de eso, se mantiene el valor de la envolvente, es decir, la ganancia aplicada, gananciaRR, del módulo de reducción de ruido (RR) 403 es igual a 1. En la EMT, la consonante se detecta antes. Algunas partes de la supresión aplicada por el módulo de reducción de ruido (RR) 403 se compensan y se realzan partes de la consonante. Al hacerlo, la modificación del transitorio corrige/contrarresta el procesamiento erróneo (lento). En las figuras 8(c) y 8(d), se pueden encontrar las mismas propiedades en las bajas frecuencias para la vocal [0:], de conformidad con una realización de la invención. En este caso, la EMT realza el inicio de la vocal. En la figura 8(c) se puede ver que el inicio durante el lapso de tiempo de 3,3 segundos a 3,35 segundos se realza. La señal envjR emitida por la EMT 405 es mayor que la señal envRR emitida por el módulo RR 403 y la señal envsF. La señal envRR es más baja que la envsF y muestra la supresión no deseada aplicada por el módulo de reducción de ruido (RR) 403. La EMT 405 corrige/contrarresta este comportamiento no deseado del módulo de reducción de ruido (RR) 403. Además, se puede observar que, la señal envjR es mayor durante el periodo de inicio en comparación con la señal envsF del banco de filtros, realzando de ese modo la señal de habla durante el periodo de inicio en comparación con la señal de sonido s digitalizada.
La figura 9(a) muestra un posible efecto secundario no deseado de este realzado del inicio cuando se produce un ruido transitorio, pero un elemento de habla transitoria es determinado erróneamente por la EMT, de conformidad con una realización de la invención. En particular, se muestran las envolventes envsF, junto con envRR y envjR. Hasta un tiempo aproximado de 3,025 segundos, la estación/módulo de reducción de ruido estacionario disminuye el inicio del ruido transitorio. Pero en la EMT, el inicio se determina erróneamente como un elemento de habla transitoria hasta 3,023 segundos y, por tanto, el ruido transitorio se realza. Después de que el detector de ruido transitorio identifique el ruido transitorio, se aplica la reducción. La figura 9(b) muestra las ganancias correspondientes, de conformidad con una realización de la invención. En diversas realizaciones, una modificación del módulo calculador de ganancia 505 puede tratar el realzado no deseado, de conformidad con una realización de la invención. Si se detecta un ruido transitorio, la ganancia hasta un tiempo determinado (en este caso, sin que suponga necesariamente una limitación, 20 ms) antes de que haya empezado el ruido transitorio detectado, puede modificarse. Para realizar esto podría ser ventajoso introducir un retraso, que preferiblemente es de 10 ms. En otras realizaciones, el retraso puede ser, por ejemplo, de 15 ms o 20 ms o cualquier otro retraso deseable. La ganancia modificada dentro de este tiempo (por ejemplo, 20 ms) se puede interpolar a partir del valor de ganancia por el retraso antes (por ejemplo, 20 ms) de que haya empezado el ruido transitorio respecto al valor de ganancia en el instante en el que se detecta el ruido transitorio. La interpolación puede ser lineal. En otra realización, la interpolación puede ser logarítmica o exponencial. Las figuras 9(c) y 9(d) muestran las correspondientes envolventes y ganancias, respectivamente, en las que se aplica una interpolación lineal de la ganancia de EMT entre el valor de ganancia 20 ms antes y en la localización de la detección del ruido transitorio. Adicionalmente o alternativamente, las ganancias calculadas en la EMT se pueden filtrar con un filtro de paso bajo. En lo sucesivo, esta modificación de la ganancia descrita anteriormente se denominará EMTs y la ganancia y las señales de envolvente gananciajRs y envjRs, respectivamente. De este modo se puede suprimir todo el ruido transitorio, pero, como se ha descrito anteriormente, se introduce un retraso adicional (por ejemplo, 20 ms). Cabe señalar, que el retraso adicional es suficientemente corto y no introduce ningún efecto secundario indeseado en, por ejemplo, la percepción del habla o localización de la fuente del sonido.
Los espectrogramas de los cambios de señal de la EMT se muestran en la figura 10(a) y de la EMTs en la figura 10(b), de conformidad con diversas realizaciones de la invención. Tanto en la figura 10(a) como en la 10(b), los realzados de las consonantes y de los inicios de las vocales son visibles. En la figura 10(a), el inicio del ruido transitorio también se realza, mientras que la modificación de la ganancia lo evita en la figura 10(b). Asimismo, se puede ver la influencia del filtro de paso bajo en las ganancias por el realzado más suave en el espectrograma inferior. Cabe destacar que en las figuras 10(a) y 10(b), la supresión del ruido transitorio está restringido a las frecuencias superiores a aproximadamente 1450 Hz. Asimismo, se ignora el retraso de 20 ms de la figura 10(b) para facilitar la comparación.
La figura 11 (a) muestra la ganancia resultante dentro del rango de frecuencias de 5034,5-6811 Hz correspondiente a la señal de sonido de entrada s, de conformidad con una realización de la invención. La figura 11 (b) muestra la ganancia resultante dentro del rango de frecuencias de 6811-9000 Hz correspondiente a la señal de sonido de entrada s, de conformidad con una realización de la invención. En este caso, es visible la atenuación de las dos señales de ruido transitorio y el realzado del habla transitoria. Cabe destacar que la supresión se aplica a ambas regiones de frecuencia, mientras que el realzado del habla transitoria está restringido a las frecuencias en las que se produce el elemento de habla. También se puede ver el realzado de los inicios de los elementos de habla. El retraso de tiempo de 20 ms se ignora de nuevo para facilitar la comparación con los otros gráficos.
La figura 12(a) muestra un espectrograma asociado con la señal de entrada s después del banco de filtros, de conformidad con una realización de la invención. La figura 12(b) muestra un espectrograma asociado con la señal de entrada s después de la reducción de ruido estacionario, de conformidad con una realización de la invención. La figura 12(c) muestra un espectrograma asociado con la señal de entrada s después de una modificación de los transitorios, de conformidad con una realización de la invención. La supresión del ruido transitorio y el realzado del habla transitoria son claramente visibles.
En diversas realizaciones, las envolventes después del módulo EMT pueden estar restringidas al valor de las envolventes después del banco de filtros para reducir la distorsión debido a un realzado demasiado grande. Las señales internas de la reducción de ruido estacionario pueden estar incluidas en el procesamiento EMT. Ejemplos de señales pueden incluir la señal de salida de un detector de actividad de habla que detecte periodos de ausencia de habla y de presencia de habla o la relación estimada entre señal y ruido. La aplicación de la ganancia calculada en el módulo EMT puede ser diferente, por ejemplo, una estrategia de codificación N-de-M podría controlarse mediante la ganancia, conllevando así una modificación en la selección y estimulación de canales. En lugar de la ganancia calculada, se pueden calcular los coeficientes de un filtro FIR (por sus siglas en inglés de "Finite Impulse response", respuesta finita al impulso), que se aplican a las envolventes.
Las realizaciones de la invención pueden implementarse en cualquier lenguaje de programación informático convencional. Por ejemplo, las realizaciones preferidas pueden implementarse en un lenguaje de programación procedural (por ejemplo, "C") o un lenguaje de programación orientado a objetos (por ejemplo, "C++", Python). Unas realizaciones alternativas de la invención pueden implementarse como elementos de hardware preprogramados, otros componentes relacionados o como una combinación de componentes de hardware y software.
Las realizaciones pueden implementarse en parte como un producto de programa informático para su uso con un sistema informático. Tal implementación puede incluir una serie de instrucciones informáticas fijas bien en un medio tangible, como un medio legible por ordenador (por ejemplo, un disquete, un CD-ROM, una ROM o un disco duro) o transmisibles a un sistema informático, a través de un módem u otro dispositivo de interfaz, tal como un adaptador de comunicaciones conectado a una red sobre un medio. El medio puede ser bien un medio tangible (por ejemplo, líneas de comunicación óptica o analógicas) o un medio implementado con técnicas inalámbricas (por ejemplo, microondas, infrarrojos u otras técnicas de transmisión). La serie de instrucciones informáticas materializa todas o parte de las funcionalidades descritas previamente en el presente documento con respecto al sistema. Los expertos en la materia apreciarán que tales instrucciones informáticas pueden escribirse en un número de lenguajes de programación para su uso con muchas arquitecturas informáticas o sistemas operativos. Asimismo, tales instrucciones pueden almacenarse en cualquier dispositivo de memoria, tal como en un dispositivo semiconductor, magnético, óptico u otros dispositivos de memoria, y pueden transmitirse usando cualquier tecnología de comunicaciones, como tecnologías de transmisión óptica, por infrarrojos, microondas u otras. Se espera que tal producto de programa informático pueda ser distribuido como un medio extraíble con documentación impresa o electrónica adjunta (por ejemplo, un programa listo para su empleo), precargado con un sistema informático (por ejemplo, en un sistema ROM o disco duro) o distribuido desde un servidor o un tablón de anuncios electrónico por la red (por ejemplo, Internet o la Red Informática Mundial (WWW). Evidentemente, algunas realizaciones de la invención pueden implementarse como una combinación tanto de software (por ejemplo, un producto de programa informático) como de hardware. Otras realizaciones adicionales de la invención se implementan totalmente en hardware o totalmente en software (por ejemplo, un producto de programa informático).
Aunque se han divulgado varias realizaciones ilustrativas de la invención, para los expertos en la materia debería ser evidente que se pueden realizar diversos cambios y modificaciones con los que se lograrán algunas ventajas de la invención sin desviarse del verdadero alcance de la invención.

Claims (13)

REIVINDICACIONES
1. Método para generar señales de estimulación de electrodo para contactos de electrodo de una disposición de electrodos (110) asociada con un implante auditivo (108), comprendiendo dicho método lo siguiente: procesar una señal auditiva de entrada para generar una pluralidad de señales de canal de paso de banda, cada una de las cuales representa una banda asociada de frecuencias auditivas;
aplicar una reducción de ruido estacionario para proporcionar una envolvente de canal con ruido estacionario reducido a partir de cada señal de canal;
detectar un transitorio en una o más de las envolventes de canal;
modificar las envolventes de canal en función de si el transitorio es ruido transitorio o habla transitoria, para formar envolventes con transitorio modificado;
en el que, si el transitorio es ruido transitorio, se reduce el ruido transitorio en una o más de las envolventes de canal para formar las envolventes con transitorio modificado; y
si el transitorio es habla transitoria, se realza el habla transitoria en una o más de las envolventes de canal para formar las envolventes con transitorio modificado,
y usar las envolventes con transitorio modificado para generar señales de estimulación de electrodo para los contactos de electrodo.
2. Método según la reivindicación 1, en el que detectar el transitorio incluye:
determinar para cada envolvente de canal un indicador de ruido transitorio específico de cada canal que caracteriza un ruido transitorio presente en la señal de canal; y
determinar para cada envolvente de canal un indicador de habla transitoria específica de cada canal que caracteriza un habla transitoria presente en la señal de canal.
3. Método según la reivindicación 2, en el que el indicador de ruido transitorio específico de cada canal se basa en una proporción de potencia de la envolvente de canal con respecto a la potencia de la señal auditiva de entrada, o
en el que determinar el indicador de ruido transitorio específico de cada canal incluye aplicar un filtrado de paso alto a la envolvente de canal.
4. Método según la reivindicación 2, en el que determinar para cada envolvente de canal un indicador de habla transitoria específica de cada canal incluye:
aplicar un filtrado de paso alto a la envolvente de canal;
aplicar un filtrado de paso bajo a la envolvente de canal;
determinar rangos de la envolvente de canal filtrada con paso alto, la envolvente de canal filtrada con filtro de paso bajo y la envolvente de canal; y
determinar para cada envolvente de canal un indicador de habla transitoria específico de cada canal en función de los rangos determinados.
5. Método según la reivindicación 2, en el que modificar las envolventes de canal incluye:
aplicar una ganancia específica de canal a cada envolvente de canal en función de su indicador de ruido transitorio y de su indicador de habla transitoria asociados para producir las envolventes con transitorio modificado,
en el que el método preferiblemente comprende además introducir un retraso que, al detectarse ruido transitorio, permite modificar la ganancia específica de canal aplicada hasta un tiempo predeterminado antes del ruido transitorio detectado, o
en el que modificar las envolventes de canal incluye limitar una amplitud de las envolventes de canal para reducir la distorsión resultante de un realzado grande.
6. Método según la reivindicación 1, en el que el implante auditivo (108) es alguno de los siguientes: un implante coclear totalmente implantable, un implante coclear que tiene tanto un procesador de habla externo (111) como un estimulador implantado que incluye la disposición de electrodos y un implante auditivo de tronco encefálico.
7. Sistema de procesamiento de señales para generar señales de estimulación de electrodo para contactos de electrodo de una disposición de electrodos (110) asociada con un implante auditivo (108), en el que el sistema comprende:
un preprocesador de banco de filtros (401) configurado para procesar una señal auditiva de entrada para generar una pluralidad de señales de canal de paso de banda, cada una de las cuales representa una banda asociada de frecuencias auditivas;
un módulo (403) de reducción de ruido estacionario (RR) configurado para reducir el ruido estacionario en cada canal y proporcionar una envolvente de canal con ruido estacionario reducido a partir de cada señal de canal; una estación de modificación de transitorios (EMT) (405) configurada para:
detectar un transitorio en una o más de las envolventes de canal; y
modificar las envolventes de canal en función de si el transitorio es ruido transitorio o habla transitoria, para formar envolventes con transitorio modificado; y
un generador de señales de estimulación (407) configurado para usar las envolventes con transitorio modificado para generar señales de estimulación de electrodo para los contactos de electrodo, en el que la estación de modificación de transitorios (405) está configurada para:
si el transitorio es ruido transitorio, reducir el ruido transitorio en una o más de las envolventes de canal para formar las envolventes con transitorio modificado; y
si el transitorio es habla transitoria, realzar el habla transitoria en una o más de las envolventes de canal para formar las envolventes con transitorio modificado.
8. Sistema según la reivindicación 7, en el que la estación de modificación de transitorios (405) está configurada para determinar para cada envolvente de canal un indicador de ruido transitorio específico de cada canal que caracteriza un ruido transitorio presente en la señal de canal, y determinar para cada envolvente de canal un indicador de habla transitoria específica de cada canal que caracteriza habla transitoria presente en la señal de canal.
9. Sistema según la reivindicación 8, en el que la estación de modificación de transitorios (405) está configurada para determinar el indicador de ruido transitorio específico de cada canal en base a una proporción de potencia de la envolvente de canal con respecto a potencia de la señal auditiva de entrada.
10. Sistema según la reivindicación 8, en el que la estación de modificación de transitorios (405) está configurada para determinar el indicador de ruido transitorio específico de cada canal en base a un filtrado de paso alto de la envolvente de canal.
11. Sistema según la reivindicación 8, en el que la estación de modificación de transitorios (405) incluye:
un filtro de paso alto (603) para filtrar la envolvente de canal; y
un filtro de paso bajo (601) para filtrar la envolvente de canal,
en el que la estación de modificación de transitorios (405) además está configurada para determinar rangos de la envolvente de canal filtrada con filtro de paso bajo, la envolvente de canal filtrada con filtro de paso bajo y la envolvente de canal, y determinar para cada envolvente de canal un indicador de habla transitoria específico de cada canal en función de los rangos determinados.
12. Sistema según la reivindicación 8, en el que la estación de modificación de transitorios (405) además está configurada para aplicar una ganancia específica de canal a cada envolvente de canal en función de su indicador de ruido transitorio y de su indicador de habla transitoria asociados para producir las envolventes con transitorio modificado,
en el que la estación de modificación de transitorios (405) está preferiblemente configurada para proporcionar un retraso que, al detectar un ruido transitorio, permite modificar la ganancia específica de canal aplicada hasta un tiempo predeterminado antes del ruido transitorio detectado, o
en el que la estación de modificación de transitorios (405) está preferiblemente configurada, cuando se modifican las envolventes de canal, para limitar la amplitud de las envolventes de canal para reducir la distorsión resultante de un realzado grande.
13. Sistema según la reivindicación 7, en el que el implante auditivo (108) es alguno de los siguientes: un implante coclear totalmente implantable, un implante coclear que tiene tanto un procesador de habla externo como un estimulador implantado que incluye la disposición de electrodos y un implante auditivo de tronco encefálico.
ES14869332T 2013-12-11 2014-12-09 Selección automática de reducción o realzado de sonidos transitorios Active ES2831407T3 (es)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US201361914653P 2013-12-11 2013-12-11
PCT/US2014/069323 WO2015089059A1 (en) 2013-12-11 2014-12-09 Automatic selection of reduction or enhancement of transient sounds

Publications (1)

Publication Number Publication Date
ES2831407T3 true ES2831407T3 (es) 2021-06-08

Family

ID=53272478

Family Applications (1)

Application Number Title Priority Date Filing Date
ES14869332T Active ES2831407T3 (es) 2013-12-11 2014-12-09 Selección automática de reducción o realzado de sonidos transitorios

Country Status (6)

Country Link
US (1) US9498626B2 (es)
EP (1) EP3079760B1 (es)
CN (1) CN105813688B (es)
AU (1) AU2014363973B2 (es)
ES (1) ES2831407T3 (es)
WO (1) WO2015089059A1 (es)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10149047B2 (en) * 2014-06-18 2018-12-04 Cirrus Logic Inc. Multi-aural MMSE analysis techniques for clarifying audio signals
WO2017062701A1 (en) 2015-10-09 2017-04-13 Med-El Elektromedizinische Geraete Gmbh Estimation of harmonic frequencies for hearing implant sound coding using active contour models
WO2017070138A1 (en) * 2015-10-23 2017-04-27 Med-El Elektromedizinische Geraete Gmbh Robust instantaneous frequency estimation for hearing prosthesis sound coding
JP7136702B2 (ja) * 2016-05-27 2022-09-13 エスアールアイ インターナショナル 神経信号を刺激するための方法およびシステム
EP3337186A1 (en) * 2016-12-16 2018-06-20 GN Hearing A/S Binaural hearing device system with a binaural impulse environment classifier
US10614788B2 (en) * 2017-03-15 2020-04-07 Synaptics Incorporated Two channel headset-based own voice enhancement
US10492007B2 (en) 2017-06-21 2019-11-26 Cochlear Limited Impulse-aware sound processing
EP3579081A1 (en) * 2018-06-07 2019-12-11 Lofelt GmbH Systems and methods for generating haptic output for enhanced user experience
KR20190096855A (ko) * 2019-07-30 2019-08-20 엘지전자 주식회사 사운드 처리 방법 및 장치
WO2023180855A1 (en) * 2022-03-22 2023-09-28 Cochlear Limited Multi-band channel coordination
CN114882912B (zh) * 2022-07-08 2022-09-23 杭州兆华电子股份有限公司 一种声信号时域瞬态缺陷的测试方法及装置

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DK46493D0 (da) * 1993-04-22 1993-04-22 Frank Uldall Leonhard Metode for signalbehandling til bestemmelse af transientforhold i auditive signaler
SE9801235L (sv) 1998-04-08 1999-10-09 Anders Gingsjoe Anordning och metod för reducering av transienter
US6348070B1 (en) 1998-04-17 2002-02-19 Med-El Elektromedizinische Gerate Ges.M.B.H Magnetic-interference-free surgical prostheses
ES2293921T3 (es) 1999-08-26 2008-04-01 Med-El Elektromedizinische Gerate Gmbh Estimulacion nerviosa electrica basada en secuencias de muestreo especificas del canal.
AUPQ366799A0 (en) 1999-10-26 1999-11-18 University Of Melbourne, The Emphasis of short-duration transient speech features
WO2002076148A2 (en) 2001-03-21 2002-09-26 Unitron Hearing Ltd. Apparatus and method for adaptive signal characterization and noise reduction in hearing aids and other audio devices
US7725315B2 (en) 2003-02-21 2010-05-25 Qnx Software Systems (Wavemakers), Inc. Minimization of transient noises in a voice signal
US7149583B1 (en) 2003-04-09 2006-12-12 Advanced Bionics Corporation Method of using non-simultaneous stimulation to represent the within-channel fine structure
US7353169B1 (en) 2003-06-24 2008-04-01 Creative Technology Ltd. Transient detection and modification in audio signals
US8023673B2 (en) * 2004-09-28 2011-09-20 Hearworks Pty. Limited Pitch perception in an auditory prosthesis
US8942815B2 (en) 2004-03-19 2015-01-27 King Chung Enhancing cochlear implants with hearing aid signal processing technologies
US7953490B1 (en) * 2004-04-02 2011-05-31 Advanced Bionics, Llc Methods and apparatus for cochlear implant signal processing
DE102005043314B4 (de) 2005-09-12 2009-08-06 Siemens Audiologische Technik Gmbh Verfahren zum Dämpfen von Störschall und entsprechende Hörvorrichtung
US7869994B2 (en) 2007-01-30 2011-01-11 Qnx Software Systems Co. Transient noise removal system using wavelets
WO2008116264A1 (en) * 2007-03-26 2008-10-02 Cochlear Limited Noise reduction in auditory prostheses
ATE456130T1 (de) * 2007-10-29 2010-02-15 Harman Becker Automotive Sys Partielle sprachrekonstruktion
WO2010088324A1 (en) 2009-01-28 2010-08-05 Med-El Elktromedizinische Geraete Gmbh Channel specific gain control including lateral suppression
US8019429B2 (en) * 2009-03-24 2011-09-13 Med-El Elektromedizinische Geraete Gmbh Carrier and envelope triggered cochlear stimulation
DK2649812T3 (da) * 2010-12-08 2014-08-04 Widex As Høreapparat og en fremgangsmåde til at forbedre talegengivelse
KR101676211B1 (ko) * 2012-08-27 2016-11-14 메드-엘 엘렉트로메디지니쉐 게라에테 게엠베하 청각 임플란트에서의 일과성 사운드의 감소

Also Published As

Publication number Publication date
WO2015089059A1 (en) 2015-06-18
US20150163604A1 (en) 2015-06-11
CN105813688B (zh) 2017-12-08
CN105813688A (zh) 2016-07-27
AU2014363973A1 (en) 2016-06-16
US9498626B2 (en) 2016-11-22
AU2014363973B2 (en) 2017-03-02
EP3079760A4 (en) 2017-08-16
EP3079760A1 (en) 2016-10-19
EP3079760B1 (en) 2020-08-12

Similar Documents

Publication Publication Date Title
ES2831407T3 (es) Selección automática de reducción o realzado de sonidos transitorios
US9126041B2 (en) Reduction of transient sounds in hearing implants
AU2014309167B2 (en) Auditory prosthesis using stimulation rate as a multiple of periodicity of sensed sound
US9511225B2 (en) Hearing system comprising an auditory prosthesis device and a hearing aid
AU2016341213B2 (en) Robust instantaneous frequency estimation for hearing prosthesis sound coding
AU2016285966A1 (en) Selective stimulation with cochlear implants
WO2013065010A1 (en) Sound processing with increased noise suppression
AU2017372699B2 (en) Interaural coherence based cochlear stimulation using adapted envelope processing