MXPA06002241A

MXPA06002241A - Metodo y aparato para controlar el funcionamiento de una senal de audio.

Info

Publication number: MXPA06002241A
Application number: MXPA06002241A
Authority: MX
Inventors: William S Meisel
Original assignee: Clearplay Inc
Priority date: 2003-08-26
Filing date: 2004-08-26
Publication date: 2006-08-31
Also published as: US20090204404A1; EP1665792A2; KR20060123072A; BRPI0413407A; JP2007504495A; CA2536260A1; WO2005020034A2; WO2005020034A3; EP1665792A4; AU2004267864A1; US20050086705A1; US9762963B2; US9066046B2; CN1871856A; AU2004267864B2; US20160029084A1

Abstract

Los aparatos y metodos que se conforman a la presente invencion comprenden un metodo para controlar la reproduccion de una senalada de audio a traves del analisis de una senal de subtitulacion para personas con discapacidad auditiva correspondiente, en conjunto con el analisis de la senala de audio correspondiente. Se identifica el texto de objecion u otro texto especificado en la senal de subtitulacion para personas con discapacidad auditiva a traves de la comparacion con el texto objetable identificado por el usuario. A la identificacion del texto objetable, la senal de audio se analiza para identificar la porcion de audio que corresponde al texto objetable. A la identificacion de la porcion de audio, la senal de audio puede controlarse para silenciar el texto objetable audible.

Description

MÉTODO Y APARATO PARA CONTROLAR EL FUNCIONAMIENTO DE UNA SEÑAL DE AUDIO Referencia Cruzada a Solicitudes relacionadas Esta solicitud es una solicitud no provisional que reivindica la prioridad de la solicitud provisional 60/497,769 titulada "Filtering of Media Content Based On the Analysis of the Associated Audio Signal; Using Associated Closed Captioning Signal to Aid in the Analysis" ("Filtración de Contenido de Medios con Base en el Análisis de la Señal de Audio Asociada; Utilizando la Señal Asociada de Subtitulación para Personas con Incapacidad Auditiva para Ayudar en el Análisis") presentada el 26 de Agosto, de 2003, la cual se incorpora en la presente mediante la referencia. Campo de la Invención Esta invención se refiere en general al funcionamiento y presentación de audio/visual y más particularmente a un método y aparato para filtrar palabras objetables de la señal de audio. Antecedentes de la Invención La programación de televisión y radio en vivo y grabada, cine y varias presentaciones de audio con frecuencia incluyen palabras obscenas, difamaciones y otras palabras o frases gue una persona particular puede encontrar objetable. En muchos casos, las personas evitan de manera activa una presentación debido a la presencia del lenguaje objetable.

Además, con frecuencia es el caso que los padres tratan de prohibir a sus niños que se expongan a tal lenguaje. Existen productos que pueden silenciar una frase completa que contenga una palabra objetable. Sin embargo, silenciar una frase completa con frecuencia da como resultado grandes secciones incompletas del dialogo - dando como resultado pobre comprensión del observador y frustración incrementada del observador. El resultado total con frecuencia degrada la calidad de la presentación de audio. Un aparato de televisión típico, el módulo de conexión o lo similar incluye varios elementos de procesamiento para recibir las señales de televisión, incluyendo tanto un componente de audio como un componente de video y reproducir el audio y desplegar las señales de vídeo. Sin embargo, los elementos de procesamiento se especializan en el procesamiento de las señales de audio/vídeo, y tienen poco exceso de ancho de banda para realizar otras operaciones . Los aspectos de la presente invención se concibieron con estos antecedentes en la mente. La presente invención involucra un aparato y método para controlar la reproducción de una señal de audio, ya sea sola o formando parte de una señal de audio/vídeo. Las modalidades que conforman la presente invención pueden configurarse para silenciar sólo las palabras objetables de una corriente de audio. Las modalidades adicionales de la presente invención pueden adaptarse para corren en equipo de procesamiento convencional de audio/vídeo, tal como procesadores de televisión, módulos de conexión, y lo similar, con poca o ninguna modificación de las plataformas físicas existentes, y pueden adaptarse para correr en tiempo real si es necesario para la aplicación particular. Los detalles de las modalidades de la presente invención se tratan con mayor detalle más adelante. Sumario de la Invención Un aspecto de la invención incluye un método para controlar la reproducción de una señal de audio que comprende recibir una señal de subtitulación para personas con discapacidad auditiva y analizar la señal de subtitulación para personas con discapacidad auditiva para un texto específico. A la identificación del texto especificado, se analiza una señal de audio como una función de la identificación del texto especificado a partir de la señal de subtitulación para personas con discapacidad auditiva. La reproducción de la señal de audio que corresponde al texto identificado puede entonces controlarse. La operación de controlar la reproducción puede comprender (1) atenuar una porción de la señal de audio que corresponde al texto especificado de la señal de subtitulación para personas con discapacidad auditiva; (2) cancelar sustancialmente la porción de la señal de audio que corresponde al texto especificado de la señal de subtitulación para personas con discapacidad auditiva; (3) emitir al menos un comando adaptado para causar la atenuación de una porción de la señal de audio que corresponde al texto especificado de la señal de subtitulación para personas con discapacidad auditiva; (4) e, insertar al menos un código de control en la señal de audio, adaptado el código de control para causar la atenuación de la porción de la señal de audio que corresponde al texto especificado de la señal de subtitulación para personas con discapacidad auditiva. El método puede comprender además la operación de convertir el texto especificado a una representación fonética del texto especificado. Además, el método puede comprender prolongar el tiempo de la representación fonética del texto especificado para definir una representación fonética de tiempo prolongado del texto especificado. Para la representación fonética, puede determinarse al menos un valor de energía para definir una forma comparativa del texto especificado. De manera similar, el método puede comprender determinar al menos un valor de energía para la señal de audio para definir una forma comparativa de la señal de audio . La operación de analizar una señal de audio puede comprender además la operación de comparar la forma comparativa del texto especificado con la forma comparativa de la señal de audio. Por lo cual, el método puede comprender además la operación de identificar la porción de la señal de audio que corresponde con el texto especificado. El texto especificado puede ser un espacio, una letra, una palabra, una frase, una oración, un código de control y un símbolo. Además, el texto especifico puede seleccionarse por un usuario. Finalmente, el texto especificado puede seleccionarse de un texto considerado objetable. En algunas implementaciones particulares, la operación de identificar el texto especificado comprende además la operación de identificar un texto precedente, el texto precedente que precede temporalmente al texto especificado. La operación de analizar una señal de audio como una función de la identificación del texto especificado de la señal de subtitulación para personas con discapacidad auditiva puede entonces comprender además analizar la señal de audio como función de la identificación del texto precedente a partir de la señal de subtitulación para personas con discapacidad auditiva. Además, la operación de controlar la reproducción de la señal de audio que corresponde al texto especificado puede entonces comprender además controlar la reproducción de la señal de audio que corresponde al texto precedente.

Otro aspecto de la invención incluye un método para controlar la reproducción de una señal de audio que comprende: convertir una porción específica de una señal de texto de subtitulación para personas con discapacidad auditiva a un audio equivalente de la porción especificada; comparar el equivalente de audio de la porción especificada de la señal de texto de subtitulación para personas con discapacidad auditiva a una señal de audio para identificar una porción de la señal de audio correspondiente a la porción especificada de la señal de subtitulación para personas con discapacidad auditiva; y controlar la reproducción de la porción de la señal de audio correspondiente a la porción especificada de la señal de subtitulación para personas con discapacidad auditiva. La operación para controlar la reproducción puede comprender además (1) atenuar la porción de la señal de audio correspondiente a la porción especificada de la señal de subtitulación para personas con discapacidad auditiva; (2) cancelar sustancialmente la porción de la señal de audio correspondiente a la porción especificada de la señal de subtitulación para personas con discapacidad auditiva; (3) emitir al menos un comando adaptado para causar atenuación de la porción de la señal de audio correspondiente a la porción especificada de la señal de subtitulación para personas con discapacidad auditiva; (4) e, insertar al menos un código de control en la señal de audio, adaptado el código de control para causar la atenuación de la señal de audio correspondiente a la porción especificada de la señal de subtitulación para personas con discapacidad auditiva. El segundo método puede incluir la operación de convertir la porción especificada de la señal de subtitulación para personas con discapacidad auditiva a una representación fonética de la porción especificada de la señal de subtitulación para personas con discapacidad auditiva. Adicionalmente, el método puede incluir la operación de prolongar el tiempo de la representación fonética de la porción especificada de la señal de subtitulación para personas con discapacidad auditiva para definir una representación fonética de tiempo prolongado. Para la representación fonética, que incluye la versión de tiempo prolongado, el método puede comprender determinar al menos un valor de energía para la representación fonética para definir una forma comparativa de la porción especificada de la señal de subtitulación para personas con discapacidad auditiva. Para comparación, el segundo método puede comprender determinar al menos un valor de energía para la señal de audio para definir una forma comparativa de la señal de audio. Como tal, la operación de comparar puede comprender además la operación de comparar la forma comparativa de la porción especificada de la señal de subtitulación para personas con discapacidad auditiva con la forma comparativa de la señal de audio. Además, la operación de comparar puede comprender además identificar la porción de la señal de audio correspondiente a la porción especificada de la señal de subtitulación para personas con discapacidad auditiva. Como con algunos métodos tratados en la presente, un procesador que comprende una pluralidad de instrucciones ejecutables en computadora puede configurarse para realizar los diversos métodos . Un tercer aspecto de la invención incluye un método para controlar la reproducción de una señal de audio que comprende : recibir una indicación de al menos una palabra objetable; identificar la al menos una palabra objetable en la señal de subtitulación para personas con discapacidad auditiva; e identificar la al menos una palabra objetable en una señal de audio como una función de la operación de identificar la al menos una palabra objetable en una señal de subtitulación para personas con discapacidad auditiva. A través del tercer método, u otros métodos, es posible controlar una presentación de audio de la señal de audio como una función de la operación de identificación. El tercer método puede comprender además silenciar la presentación de audio de una porción de la señal de audio correspondiente a al menos una palabra objetable. Adicionalmente, el tercer método puede involucrar identificar una porción de la señal de subtitulación para personas con discapacidad auditiva que precede a la palabra objetable. La porción precedente puede seleccionarse del grupo que comprende un espacio, una letra, una palabra, una frase, un símbolo y una señal de control de subtitulación para personas con discapacidad auditiva. El tercer método puede comprender identificar la al menos una palabra objetable en una señal de audio como una función de la operación de identificar la al menos una palabra objetable en una señal de subtitulación para personas con discapacidad auditiva y la operación de identificar una porción de la señal de subtitulación para personas con discapacidad auditiva que precede a la palabra objetable. La operación de controlar es una función de la identificación de una porción de la señal de subtitulación para personas con discapacidad auditiva que precede a la palabra objetable. El método puede incluir adicionalmente la operación de causar un silencio de la presentación de audio como una función de la identificación de la porción de la señal de subtitulación para personas con discapacidad auditiva que precede a la palabra objetable en la corriente de audio. También, el método puede comprender finalizar el silencio como una función de la identificación de al menos una palabra objetable en la señal de audio. Un cuarto aspecto de la invención involucra un método para controlar la reproducción de una presentación de audio que comprende: recibir una indicación de al menos una palabra objetable; recibir una señal de audio; almacenar la señal de audio en una memoria; procesar la señal de audio almacenada para determinar si la al menos una palabra objetable se encuentra presente en la señal de audio,- y controlar una presentación de audio de la señal de audio como una función de la operación de procesamiento. La operación de controlar puede comprender: (1) atenuar la porción de la señal de audio correspondiente a la al menos una palabra objetable; (2) cancelar sustancialmente la porción de la señal de audio correspondiente a la al menos una palabra objetable; (3) insertar al menos un código de control en la señal de audio, adaptado el código de control para causar la atenuación de la señal de audio correspondiente a la al menos una palabra objetable. Adicionalmente, la operación de procesamiento puede incluir analizar al menos un canal de la señal de audio. Breve Descripción de los Dibujos La Figura 1 es un diagrama de bloques que ilustra una instalación de procesamiento conforme a la presente invención; La Figura 2 es un diagrama de flujo que ilustra un método para controlar la reproducción de una señal de audio al monitorear una señal de subtitulación para personas con discapacidad auditiva correspondiente a un texto específico y después identificar una porción de la señal de audio correspondiente al texto especificado conforme a la presente invención; La Figura 3 es un diagrama de flujo que ilustra un método para monitorear la señal de subtitulación para personas con discapacidad auditiva para determinar si contiene el texto especificado conforme a la presente invención; La Figura 4 es un diagrama de flujo que ilustra un método para aplicar un algoritmo de letra-a-sonido al texto de la corriente de subtitulación para personas con discapacidad auditiva para definir una representación fonética del texto conforme a la presente invención; La Figura 5 es un diagrama de flujo que ilustra un método para analizar un segmento temporal de una señal de audio para asignar valores de energía conforme a la presente invención; La Figura 6 es un diagrama de flujo que ilustra un método para comparar una forma comparativa del texto de la señal de subtitulación para personas con discapacidad auditiva a una forma comparativa de la señal de audio a fin de controlar la reproducción de la señal de audio, tal como a través de silenciar alguna porción de la señal de audio, conforme a la presente invención; La Figura 7 es un diagrama de flujo que ilustra un método para comparar una forma comparativa del texto de la señal de subtitulación para personas con discapacidad auditiva a una forma comparativa de la señal de audio conforme a la presente invención; y La Figura 8 es una representación gráfica de un alineamiento de tiempo y rutina de puntuación para alinear y comparar una forma comparativa del texto de la señal de subtitulación para personas con discapacidad auditiva a una forma comparativa de la señal de audio conforme a la presente invención Descripción Detallada de las Modalidades de las Invenciones Los aspectos de la presente invención incluyen un receptor de televisión, módulo de conexión para cable o satélite, grabadora de cásete de vídeo, reproductor de DVD u otro aparato de procesamiento de señal de audio configurado para recibir o de otro modo procesar una corriente de audio. En una implementación particular, el aparato de procesamiento de señal de audio se configura para silenciar ciertas palabras, tales como las palabras consideradas objetables para un escucha/espectador particular, dentro de la corriente de audio. Un aparato o método conforme a la presente invención puede proporcionar un mecanismo mediante el cual un usuario puede indicar varias palabras como objetables. Una modalidad conforme a la presente invención analiza la corriente de subtitulación para personas con discapacidad auditiva para detectar la palabra o frase objetable, convierte la palabra de subtitulación para personas con discapacidad auditiva a una representación de audio, y después compara la representación de audio de la subtitulación para personas con discapacidad auditiva a la corriente de audio para identificar la palabra objetable en la corriente de audio. Cuando se identifica la palabra objetable, las modalidades de la invención silencian la presentación de audio de la palabra objetable. Las Figuras 1-8 y la siguiente exposición se proponen para proporcionar una breve, descripción general de un ambiente de computadora o de procesamiento de señal adecuado en el cual las modalidades de la invención pueden implementarse. Aunque no se requiere, las modalidades de la invención se describen en el contexto general de instrucciones ejecutables en computadora, tal como módulos de programa que se ejecutan por uno o más elementos de procesamiento, tal como un procesador de televisión. Generalmente, los módulos de programa incluyen rutinas, programas, objetivos, componentes, estructuras de datos, etc., que llevan a cabo tareas particulares o implementan tipos de datos abstractos particulares. Las instrucciones ejecutables por computadora, las estructuras de datos asociadas y los módulos de programas representan ejemplos del medio del código de programa para ejecutar las etapas de los métodos descritos en la presente. La secuencia particular de tales instrucciones ejecutables o estructuras de datos asociadas representa ejemplos de actos correspondientes para implementar las funciones descritas en tales etapas. Además, el medio de código del programa que se ejecuta por una unidad de procesamiento proporciona un ejemplo de un medio de procesador. La Figura 1 es un diagrama de bloques que ilustra una implementación particular de una plataforma de procesador 10 conforme la presente invención. La plataforma de procesador implementa un analizador de subtitulación para personas con discapacidad auditiva 12 y un analizador de corriente de audio 1 . El analizador de subtitulación para personas con discapacidad auditiva se configura para recibir y procesar una corriente de subtitulación para personas con discapacidad auditiva proveniente de una señal de televisión de audio/video convencional. Como se utiliza en la presente "subtitulación para personas con discapacidad auditiva" se refiere a una señal que define una representación textual de una señal de audio. La señal de audio puede ser análoga o digital, puede codificarse y puede acompañar a una señal de video. La subtitulación para personas con discapacidad auditiva puede comprender letras, espacios, palabras, frases y símbolos. En un ambiente digital, la subtitulación para personas con discapacidad auditiva puede incluir además paquetes de datos, comandos y enlaces de red y otros datos. En un ejemplo particular, la subtitulación para personas con discapacidad auditiva se refiere a una señal que se conforma a las EIA-608 o EIA-708B o estándares de subtitulación para personas con discapacidad auditiva relacionadas. La subtitulación para personas con discapacidad auditiva puede proporcionarse en transmisiones de radiodifusión de televisión análogas o digitales, cable, transmisiones por satélite así como, transmitirse a partir de fuentes de medios almacenados tales como DVDs y lo similar en coordinación con una señal de audio almacenada. Típicamente, para señales de televisión análogas, la corriente de subtitulación para personas con discapacidad auditiva se encuentra presente en la línea 21 del área de datos encontrada en el periodo de suspensión vertical ("VBI") de la señal de televisión. La plataforma del procesador 10 incluye un decodificador convencional de subtitulación para personas con discapacidad auditiva. El analizador de subtitulación para personas con discapacidad auditiva se configura para recibir la señal decodificada de subtitulación para personas con discapacidad auditiva. Sin embargo, el analizador de subtitulación para personas con discapacidad auditiva puede configurarse con un decodificador. Para las señales de televisión digitales, no se proporciona la subtitulación para personas con discapacidad auditiva en un VBI, ya que las señales de televisión digitales no tienen VBI. De preferencia, la señal de subtitulación para personas con discapacidad auditiva se multiplexa con la señal de televisión digital codificada. Para las señales de televisión digitales, la subtitulación para personas con discapacidad auditiva puede extraerse mediante una plataforma de receptor de televisión digital. El analizador de subtitulación para personas con discapacidad auditiva también se configura para recibir una lista de palabras objetables identificadas por un usuario particular. El usuario puede seleccionar las palabras objetables a través de un proceso de selección sobre la pantalla mediante el cual el usuario selecciona varias palabras objetables a partir de una lista de todas las palabras objetables posibles. En una modalidad en base a la televisión, los menús sobre la pantalla con listas de palabras objetables, pueden proporcionar que los usuarios manipulen y seleccionen palabras objetables particulares a través de un control remoto para la televisión, módulo de conexión, receptor, etc. configurado de acuerdo con la presente invención. Alternativamente, el usuario puede entrar directamente a las palabras objetables por medio de un teclado o algún otro dispositivo de entrada de texto similar a las claves de flecha en un control remoto utilizado en conjunto con una visualización del alfabeto sobre la pantalla. Además de "palabras objetables", las modalidades de la invención pueden configurarse para detectar y controlar la reproducción de cualquier texto. El analizador de subtitulación para personas con discapacidad auditiva 12 compara cada palabra en la corriente de subtitulación para personas con discapacidad auditiva con la lista de las palabras objetables identificadas por el usuario. En la identificación de una igualación entre las palabras de la corriente de subtitulación para personas con discapacidad auditiva y las palabras objetables, se transfiere una lista de palabras objetable hacia el analizador de la corriente de audio 14. La lista de palabras objetable, que depende de una implementación particular de la presente invención, puede incluir solo el texto objetable identificado, el texto objetable y el texto precedente o toda la corriente de subtitulación para personas con discapacidad auditiva con el texto objetable y el texto predecesor marcado. Como se utiliza en la presente, el término "texto" se refiere a cualquier componente de una corriente de subtitulación para personas con discapacidad auditiva, tal como letras, palabras, espacios, frases, símbolos y códigos de control. La lista de palabras se pasa hacia un audioprocesador de palabras de subtitulación para personas con discapacidad auditiva 16 que procesa adicionalmente el texto para generar una forma del texto capaz de comparación con la señal de audio o una forma comparativa de la señal de audio, también referida en algunas formas como un equivalente de audio, como se trata abajo. Como con otros elementos de procesamiento, el audioprocesador puede ser un elemento de procesamiento separado, una porción funcional del procesador de televisión, el analizador de subtitulación para personas con discapacidad auditiva o el analizador de la corriente de audio. Éste se muestra por separado para ilustrar mejor los componentes funcionales de la modalidad de la invención de la Figura 1. El analizador de corriente de audio 14 se configura para recibir una corriente de audio, tal como la porción de audio de una señal de televisión análoga o digital. El analizador de corriente de audio 14 puede incluir un elemento de conversión análogo-a-digital a fin de digitalizar la corriente de audio, si ésta todavía no se encuentra en una formato digital. El analizador de corriente de audio se configura para procesar varios algoritmos, tratados en más detalla abajo, para comparar la corriente de audio digitalizada con la lista de palabras objetables identificadas por el analizador de subtitulación para personas con discapacidad auditiva y controlar la reproducción de las palabras objetables en la corriente de audio. En algunas implementaciones, controlar la reproducción comprende silenciar las palabras objetables. Silenciar puede lograrse al definir una corriente de audio modificada en donde la señal de audio para las palabras objetables se suprime o la amplitud o la magnitud se atenúa de otro modo, identificando las palabras objetables con los comandos de silencio insertados en la corriente de audio que procesan subsecuentemente los elementos de lectura y mediante esto silencian el audio objetable y emiten comandos de silencio sincronizados con la presentación de audio a fin de no incluir una versión audible de la palabra objetable. La siguiente exposición describe varias formas de que el analizador de subtitulación para personas con discapacidad auditiva y el analizador de corriente de audio funcionan en conjunto para controlar la reproducción de las palabras objetables de una señal de audio. Es posible que el analizador de subtitulación para personas con discapacidad auditiva 12 y el analizador de corriente de audio puedan codificarse en el mismo procesador, en procesadores separados o pueden definirse en varias configuraciones de hardware. La Figura 2 es un diagrama de flujo que ilustra un método para controlar la reproducción de una presentación de audio, tal como silenciar palabras objetables de acuerdo con la presente invención. Como se mencionó anteriormente, el analizador de subtitulación para personas con discapacidad auditiva recibe la corriente de subtitulación para personas con discapacidad auditiva proveniente de una presentación de audio (operación 200) que puede ser una señal de televisión análoga estándar que incluye la subtitulación para personas con discapacidad auditiva en línea 21 del periodo de suspensión vertical. En una modalidad de la presente invención, la corriente de subtitulación para personas con discapacidad auditiva se recibe antes o contemporáneamente con la corriente de audio asociada. Después, el analizador de subtitulación para personas con discapacidad auditiva busca la corriente de subtitulación para personas con discapacidad auditiva para una lista de palabras objetables (operación 210) . Las palabras objetables se identifican por el usuario/espactador y se almacenan en una memoria que se encuentra en comunicación con el analizador de subtitulación para personas con discapacidad auditiva. Al identificar una palabra objetable en el texto de subtitulación para personas con discapacidad auditiva, el analizador de subtitulación para personas con discapacidad auditiva transmite la palabra objetable y la palabra precedente de la palabra objetable hacia el analizador de corriente de audio. Por ejemplo, en la película "Gone With The Wind" ("Lo que el Viento se Llevó") Clark Gable dice a Vivían Leigh "Frankly Scarlett, I don't give a damn" ("Francamente Scarlett, me importa un pito") . Si el usuario indica que la palabra "damn" ("pito") es objetable, entonces la palabra "damn" se almacena en la lista de palabras objetables. Cuando la señal de subtitulación para personas con discapacidad auditiva para la referencia arriba citada se recibe por el analizador de subtitulación para personas con discapacidad auditiva, identificará la palabra "damn" como objetable para el usuario actual y transmitirá la palabra "damn" así como la palabra precedente "a" ("un") hacia el analizador de corriente de audio . Para comparar adecuadamente las palabras objetables (inicialmente en la forma de texto) con la corriente de audio, el texto objetable y el texto predecesor se convierten a una forma para su comparación con la señal de audio (operación 20) . En una implementación, en el audioprocesador, el texto predecesor y el texto objetable se procesan con un algoritmo de letra-a-sonido que convierte el texto a una representación fonética. La representación fonética se caracteriza subsecuentemente por una duración promedio o típica del texto y una representación de la energía total típica y las energías específicas en varias bandas de frecuencia para la palabra a fin de proporcionar un equivalente de audio del texto. Al mismo tiempo, a medida que el texto de subtitulación para personas con discapacidad auditiva se procesa o preferentemente subsecuente al procesamiento del texto de subtitulación para personas con discapacidad auditiva, la corriente de audio también se procesa en la forma para la comparación (operación 230) . En un ejemplo tratado abajo, la corriente de audio se procesa para determinar la energía total y las energías particulares de las bandas de frecuencia particulares para los intervalos de tiempo discretos de la corriente de audio. El procesamiento del texto de subtitulación para personas con discapacidad auditiva y el procesamiento de la corriente de audio presentan el texto de subtitulación para personas con discapacidad auditiva y la corriente de audio en un formato que se somete a comparación. Una vez que el texto objetable y el predecesor y la corriente de audio se representan en formatos similares, pueden identificarse las palabras objetables en la corriente de audio (operación 240) . Como tal, el texto objetable se iguala con una secuencia de audio particular en la corriente de audio. Cuando se identifica una igualación entre el texto objetable y el texto precedente con la corriente de audio, los comandos de silencio u otros procesamientos de silencio ocurren de manera que la corriente de audio y el procesador de televisión asociado silencian el audio objetable (operación 250) . Así, el método descrito con respecto a la Figura 2, permite que un televisor u otro dispositivo de audio o audio/visual reproduzca una secuencia de audio con las palabras, frases o audio objetables generalmente silenciados. Como se utiliza en la presente, el término "silencio" se propone que se refiera a una condición en donde el volumen de una secuencia de audio se ha reducido, pero no necesariamente reducido a cero. En algunas modalidades de la presente invención, una palabra o frase silenciada en una secuencia de audio será audible, pero el volumen de la palabra silenciada será menor que el de las palabras adyacentes. La Figura 3 es un diagrama de flujo que ilustra un método particular para analizar el texto de subtitulación para personas con discapacidad auditiva para averiguar ya sea si incluye palabras o frases identificadas por el usuario como objetables. En una implementación particular de la presente invención, en el proceso de selección de palabra objetable, el usuario puede seleccionar palabras particulares para excluirlas de la presentación de audio así como palabras raíz para excluirlas de la presentación de audio. Las palabras raíz objetables se almacenan en una lista de filtro de palabra raíz . Las "Palabras raíz" generalmente se refieren a ciertas palabras objetables, tales como "damn" que puede ser una palabra raíz en un huésped de palabras y frases objetables, tal como "damnit" y "***damnit" . Con la lista de filtro de la palabra raíz, cualquier palabra que incluye la palabra raíz puede filtrarse y retirarse de la porción de audio de la presentación. Las palabras objetables completas se almacenan en una lista de palabras excluidas. Un usuario puede seleccionar palabras objetables a través de una variedad de mecanismos. En una implementación, un menú de selección sobre la pantalla se despliega sobre una pantalla, e.g., un monitor de televisión. El menú incluye numerosas palabras y frases potencialmente objetables que un usuario puede seleccionar solas o en combinación, utilizando un control remoto adaptado para comunicarse con el menú sobre la pantalla. El menú también puede incluir agrupamientos y niveles de palabras objetables. Refiriéndose a la Figura 3, el analizador de subtitulación para personas con discapacidad auditiva compara la corriente del texto de subtitulación para personas con discapacidad auditiva con la palabra raíz (operación 300) . La comparación puede llevarse a cabo en serie, sobre una base de palabra-por-palabra a mediada que se recibe cada una. La comparación también puede llevarse a cabo sobre una base de segmento-por-segmento de la corriente de subtitulación para personas con discapacidad auditiva. El inicio y el fin del texto de subtitulación para personas con discapacidad auditiva incluye los marcadores que indican cuándo desplegar un segmento de subtitulación para personas con discapacidad auditiva. Las modalidades de la invención pueden también configurarse para analizar segmentos de texto que ocurren entre los marcadores . Si el texto en la corriente de subtitulación para personas con discapacidad auditiva incluye una palabra raíz objetables, entonces el texto que incluye la palabra raíz se marca como objetable junto con la palabra precedente. Después, la corriente de subtitulación para personas con discapacidad auditiva se compara con la lista de filtro de palabras excluidas (operación 310) . Cualquier texto objetable y el texto precedente se marcan. Como se tratará en mayor detalle abajo, el texto que precede al texto objetable puede utilizarse para identificar el inicio de un silencio (i.e., el final de la secuencia de audio para la palabra que precede una palabra objetable puede ser el inicio de un silencio) . Además de la marcación, también es posible cargar la palabra precedente, entonces la palabra objetable se introduce en una memoria intermedia de primera-entrada-primera-salida (FIFO) . La palabra precedente entonces palabra objetable se procesa entonces en un orden FIFO para una forma de comparación. Cuando se hace una igualación al audio, con el texto precedente, este se desecha. Entonces cuando se hace una igualación al texto objetable este de desecha. Así, las operaciones ocurren en un orden FIFO a partir de la identificación de la palabra en la subtitulación para personas con discapacidad auditiva para silenciar el audio debido a la relación temporal secuencial entre la subtitulación para personas con discapacidad auditiva y el audio asociado. En algunas implementaciones, el texto objetable, ya sea de la palabra raíz o la lista de palabras excluidas, se analiza adicionalmente para determinar si es de hecho una palabra que es permisible u objetable dependiendo del contexto de su uso (operación 330) . Por ejemplo, la palabra "bitch" ("perra") puede permitirse si se utiliza en el contexto de una discusión concerniente a un perro, pero no de otro modo. Para determinar si esta es permisible, en una implementación se hace una comparación a todas las otras palabras en la frase de subtitulación para personas con discapacidad auditiva para intentar averiguar el contexto del uso de la palabra. Así, por ejemplo, si la palabra "dog" se menciona en la misma frase, entonces la palabra puede permitirse y no identificarse como objetable. Otros métodos se muestran como se describe en la solicitud de patente provisional de E.U. No. 60/481,548 titulada "Parental Control Filter Settings Based on Information Associated with the Media Content" ("Graduación del Filtro de Control Paterno con Base en la Información Asociada con el Contenido de los Medios") presentada en Octubre 23 de 2004 que se incorpora en la presente mediante esta referencia. Si no existen igualaciones, entonces el procesador determina si se ha detectado el final de la corriente de subtitulación para personas con discapacidad auditiva (operación 340) . Como se mencionó arriba, una corriente de subtitulación para personas con discapacidad auditiva típicamente incluye un indicador para el inicio de un segmento de subtitulación para personas con discapacidad auditiva y el final de un segmento de subtitulación para personas con discapacidad auditiva. En el ejemplo establecido arriba, un segmento de subtitulación para personas con discapacidad auditiva puede incluir la frase "Franklyn Scarlett, I don't give a damn". El texto de subtitulación para personas con discapacidad auditiva para ese segmento de audio incluiría un indicador que precede la palabra "Frankly" y un indicador después de la palabra "damn" . Si se detecta el final de la frase, entonces la memoria intermedia de texto y el analizador de corriente silenciada se vacían, siempre que la palabra objetable haya provenido de la presentación de audio. En un arreglo FIFO de palabra-por-palabra, la operación 340 no se implementa. Si el final de la frase no se detecta, entonces la siguiente palabra se analiza contra la lista de palabras raíz y la lista de palabras excluidas como se citó arriba. La Figura 4 es un diagrama de flujo que ilustra una implementación de la presente invención en donde el texto de subtitulación para personas con discapacidad auditiva objetable y el texto precedente se convierten a una representación fonética, como parte del proceso para proporcionar el texto objetable, sobre una base de letra-por-letra, como un equivalente de audio. En el ejemplo particular del diagrama de flujo de la Figura 4, se emplea un algoritmo de letra-a-sonido para convertir una representación textual del texto precedente y del texto objetable a una representación fonética. Se encuentran disponibles numerosos algoritmos de letra-a-sonido. En un ejemplo, la representación fonética se descompone en cinco categorías principales, incluyendo una categoría para los espacios; una categoría para las vocales, diptongos y semi-vocales; una categoría para detenciones; una categoría para nasales; y una categoría para fricativos, murmullos y africativos. En la primera operación, se analizó el texto para determinar si este incluye un espacio (operación 400) . Un espacio puede determinarse mediante el silencio prolongado o la falta de propiedades asociadas con sonidos vocales. Si el algoritmo letra-a-sonido determina que el texto incluye un espacio, entonces se asigna un "—" (operación 405) . Después se analiza el texto para determinar ya sea si incluye una vocal, diptongo o semi-vocal (operación 410) . Típicamente las vocales, diptongos y se i-vocales se caracterizan por niveles de alta energía en frecuencias bajas. Un ejemplo incluye las vocales a, e, i, o, u y las combinaciones de letras tales como "ou" , "ow" , "oi" así como semi-vocales w, 1, r y y. Además, las vocales, diptongos y semi-vocales pueden dividirse en vocales de frecuencia mayor, tales como "ee" encontrada en la palabra "beet" así como vocales de baja frecuencia como "oo" en la palabra "boot" . Si el algoritmo letra-a-sonido determina que las letras de una palabra incluyen una vocal, entonces se asigna una "V" (operación 415) . Después, el texto predecesor o texto objetable se analiza para determinar si incluye una detención (operación 420) . Una detención se caracteriza por un corto periodo durante el cual la boca se cierra completamente seguido por un estallido de sonido. En un ejemplo, las detenciones sin voz tales como p, t y k se distinguen de las detenciones de voz tales como b, d y g. Si el algoritmo letra-a-sonido determina que las letras de una palabra incluyen una detención, entonces se asigna una "S" (operación 425) . Después el texto predecesor o el texto objetable se analizan para determinar si incluye un sonido nasal (operación 430) . El sonido nasal se caracteriza típicamente con un sonido de frecuencia inferior que viene desde la cavidad nasal en lugar de la boca, tal como en la pronunciación de m, n y ng. Si el algoritmo letra-a-sonido determina que el texto incluye un nasal, entonces se asigna una "N" (operación 435) . Finalmente, el texto predecesor o el texto objetable se analizan para determinar si incluyen un fricativo, murmullo o africativo. Los fricativos, murmullos y africativos se caracterizan por la energía concentrada en frecuencias mayores y se producen por la fuerza de respiración a través de un pasaje constreñido, tal como en el sonido asociado con las letras v, ph, z, zh (como en "azure"), f, s, sh, j, ch y h. Si el algoritmo de letra-a-sonido determina que el texto incluye un fricativo, murmullo o africativo, entonces se asignará una "F" (operación 445) . Cada palabra se caracteriza completamente; así, en la operación 450, el algoritmo determina si la palabra es completa. Si no, el análisis continúa iniciando con la primera operación 400. Analizar el texto predecesor y el texto objetable a través de un algoritmo de letra-a-sonido asigna una frase o palabra a uno de los identificadores anteriores, i.e., --, V, S, N y F. Como tal, la frase Frankly Scarlett, I don't give a damn" se convierte a una cadena de símbolos . La palabra predecesora "a" incluiría el identificador "V" seguido por el identificador de espacio y después la palabra damn se identifica por los símbolos S, V y N, con S representando una detención para la letra "d", V representando la vocal "a" y N representando las letras nasales "mn" . La Figura 5 es un diagrama de flujo que ilustra un método para analizar o procesar la señal de audio en la preparación para la comparación contra la forma comparable del texto objetable identificado de la señal de subtitulación para personas con discapacidad auditiva. Primero, el analizador de corriente de audio recibe la señal de audio digitalizada y los segmentos de la señal de audio en una serie de porciones de 20 milisegundos (operación 500) . Cada porción de 20 milisegundos de la señal de tiempo análoga o digitalizada de aquí en adelante se refiere como un "módulo de sonidos vocales" . El analizador de corriente de audio computa la energía total para cada módulo de sonidos vocales (operación 510) . En un ejemplo, la energía total del intervalo de tiempo es la suma del cuadrado de las amplitudes normalizadas por el promedio de la energía a largo plazo a normalizarse para la de intensidad de señal promedio.

Adicionalmente, se determina además la energía de varias bandas de frecuencia del módulo de sonidos vocales (operaciones 520-540) . En un ejemplo, el analizador de audio determina la energía del módulo de sonidos vocales en la banda de frecuencia de 150-1500 Hz (operación 520) , la banda de frecuencia de 1500-3000 Hz (operación 530) y la banda de frecuencia por arriba de 3000 Hz (operación 540) . En un ejemplo, cada medición de banda de energía se normaliza para ser un porcentaje de la energía total. Tales determinaciones de energía pueden lograrse a través de filtración digital, tal como con una Fast Fourier Transform (Transformada de Fourier Rápida) , seguida por una suma para determinar las bandas de frecuencia. Alternativamente, pueda emplearse un procedimiento de coeficiente cepstral, en lugar de la energía de banda. Determinar la energía total y las energías de banda de frecuencia proporciona cuatro características distintas que capturan información suficiente para distinguir las categorías de sonidos de lenguaje (i.e., --, V, S, y F) definidos con respecto al texto de subtitulación para personas con respecto al texto de subtitulación para personas con discapacidad auditiva. Se reconocerá que un sonido de lenguaje no es una sola representación del número 4 de las energías, sino una serie de representaciones de energía de 4 números para cada intervalo de tiempo a través de un intervalo de tiempo que contiene el sonido. La Figura 6 es un diagrama de flujo que ilustra un método para comparar la forma comparativa del texto predecesor y el texto objetable con la forma comparativa de la corriente de audio para determinar cuándo debe ocurrir un silencio. A fin de comparar adecuadamente el texto con la señal de audio, el texto puede procesarse además para prolongar la(s) representación (es) del símbolo fonético del texto hasta la duración promedio del tipo de sonido y además asociarse con las características de energía adecuadas del sonido. Como se mencionó antes, la señal de audio se descompone en módulos de tiempo de 20 milisegundos y cada intervalo de tiempo de 20 milisegundos se caracteriza por la energía total y la energía en tres bandas de frecuencia particulares. Como tal, la señal de audio se caracteriza ampliamente por tiempo y energía. Así, la representación fonética del texto predecesor y el texto objetable se caracterizan además por el tiempo y la energía para propósitos de compararse a la señal de audio. Primero, la representación fonética del texto precursor y el texto objetable es el tiempo prolongado a asociarse con la duración promedio del tipo de sonido (operación 600) . La duración promedio de cada tipo de sonido puede determinarse a través de la experimentación. Por ejemplo, si un sonido vocal promedia 160 milisegundos, este se repite a través de ocho módulos de tiempo de 20 milisegundos. En la operación de prolongar el tiempo, cada símbolo se prolonga a través de la duración promedio para ese símbolo. Como tal, una vocal se prolonga 160 milisegundos. Así, por ejemplo, la "a" en "damn" fonéticamente representada como una "V" se prolongaría durante 160 milisegundos. Además de la duración del tiempo para cada representación fonética, cada representación fonética también se asocia con un valor de energía total y los valores de energía en las mismas bandas de frecuencia como la señal de audio (i.e., 150-1500 Hz, 1500-3000 Hz y por arriba de 3000 Hz) (operación 610) . En un ejemplo, para cada símbolo fonético, se proporciona una matriz de valores de energía típicos sobre un intervalo de tiempo dado. Así, por ejemplo, para un sonido vocal que promedia 160 milisegundos, se proporciona una matriz de energía para los valores de energía durante el rango de 160 milisegundos. La matriz o "modelo" pueden desarrollarse para cada símbolo fonético a través de la experimentación de diferentes pronunciaciones de los diversos símbolos y letras presentadas en los símbolos fonéticos. Como tal, la matriz puede incluir muchas diferentes representaciones de sonido para cada símbolo fonético. Las técnicas de matrizar se muestran como se describe en "Cluster Analysis and Unsupervised Learning" ("Análisis de Grupo y Aprendizaje no Supervisado") por Meisel, Computer-Oriented Approaches to Pattern Recognition, Academic Press, 1972, que se incorpora en la presente mediante esta referencia. Cuando el texto de subtitulación para personas con discapacidad auditiva se encuentra en su forma comparativa, éste se compara con la forma comparativa de la corriente de audio (con valores de energía) (operación 620) . Si existe una igualación (operación 630) , entonces un código o comando mudo se establece en la corriente de audio después del final del texto predecesor (operación 630) . El silencio en la indicación de un texto predecesor igualado puede lograrse en tres configuraciones diferentes de la presente invención. En una configuración, el analizador de audio emite un comando de silencio contemporáneamente con la detección del final del texto predecesor. El comando de silencio provoca que el audio se silencie momentáneamente. Si el comando tiene una cierta latencia en comparación a la corriente de audio, entonces pueden emplearse varios mecanismos de latencia para retardar el comando suficientemente de manera que se sincronice con la reproducción actual de la corriente de audio. En otra configuración, la corriente de audio se modifica de manera que los datos de audio después del final del lenguaje predecesor se suprimen o atenúan. La supresión o atenuación continúan hasta la detección del final del texto objetable. Finalmente, en una tercera alternativa, un comando digital puede insertarse en la corriente de audio entre el texto predecesor y el texto objetable. En la detección del comando de silencio en la corriente de audio, el audio se silenciará momentáneamente de acuerdo con el código de comando insertado en la corriente de audio digitalizada. Después de la comparación del texto predecesor, la forma de comparación de audio del texto objetable se compara con la forma de comparación de la corriente de audio (operación 650) . En la detección de una igualación (operación 660) , un segundo código o comando de silencio se emite al final del lenguaje objetable (operación 670) . En una modalidad que emite un comando para silenciar el audio, al final del lenguaje objetable se emite un comando para reproducir una vez más el audio a su volumen normal, i.e., deshabilitar el silencio. En una modalidad en donde la corriente de audio digitalizada se atenúa o suprime, en la detección del final de la palabra objetable, la operación de supresión o atenuación se descontinúa y la corriente de audio ya no se modifica. Finalmente, en las modalidades que emplean un comando integrado dentro de la corriente de audio digitalizada, puede insertarse un comando subsecuente de no silencio en la corriente de audio en una ubicación después del final de la palabra objetable. La Figura 7 es un diagrama de flujo que ilustra un método para comparar la forma comparativa del texto ya sea predecesor u objetable, con la forma comparativa de la corriente de audio. La primera operación involucra un alineamiento de tiempo entre la forma comparativa del texto (la "señal predicha") y la forma comparativa de la señal de audio (la "señal observada") (operación 700) . En una implementación particular, el alineamiento de tiempo se logra a través de un modelo ampliamente reconocido que iguala el sistema de reconocimiento de lenguaje referido generalmente como desviación dinámica de tiempo. La Figura 8 ilustra un ejemplo de un alineamiento de tiempo entre la señal observada y la señal predicha en base al algoritmo de desviación dinámica de tiempo. La señal predicha se genera de acuerdo con un método descrito en la presente de la Figura 4, y las operaciones 600 y 610 de la Figura 6. La señal observada se genera de acuerdo con el método descrito en la presente con respecto a la Figura 5. Como se trató arriba, la señal observada es una serie de cuatro vectores dimensionales que involucra la energía total y la energía de la banda de frecuencia de 150-1500 Hz, la banda de frecuencia de 1500-3000 Hz y la banda de frecuencia mayor a 3000 Hz. Además, cada uno de los cuatro vectores dimensionales comprende un intervalo de 20 mílisegundos . En el ejemplo de la Figura 8, existen catorce intervalos de tiempo de 20 milisegundos y cuatro vectores dimensionales asociados (xl-xl4) . El algoritmo de desviación dinámica de tiempo encuentra la mejor igualación de la secuencia de la señal predicha ( -FFFWVWVVNN) para la señal observada a través del uso de una "puntuación" para medir la igualación entre los valores predichos y los valores observados, utilizando la puntuación total para decidir la mejor forma de igualación. El algoritmo de desviación dinámica de tiempo también toma en cuenta el deseo de no "alargar" un valor predicho a través de demasiados valores actuales o viceversa. El resultado puede ser una mejor asignación que iguala los intervalos de valores predichos a los reales como arriba. Si es así, el algoritmo predice que la frase que se iguala, e.g., la frase predecesora, finaliza en el intervalo de la señal observada X14 y el silencio debe empezar después de ese intervalo de tiempo, cuando iguala el texto predecesor. Así, durante el procesamiento, cuando se detecta el final del texto predecesor, se inicia el silencio por cualquiera de los diversos métodos tratados en la presente . Si el audio no iguala el lenguaje razonablemente, tal como debido a un error, trascripción aproximada o ruido de fondo excesivo, entonces la puntuación indicará una igualación deficiente y no se tomará ninguna acción en base a la puntuación. Como parte del alineamiento de tiempo, se crea una puntuación a través de comparar la igualación de un solo segmento de tiempo observado (con cuatro valores característicos) con un segmento de tiempo predicho, caracterizado por una de las cinco categorías fonéticas, e.g., vocal (V). Como se anotó en la sección previa sobre convertir el texto a un equivalente de audio, una opción es tener valores "típicos" para cada característica, e.g., al promediar sobre ejemplos típicos de esa categoría durante la fase de desarrollo. La puntuación es entonces la mejor igualación de los valores típicos para los valores observados. La igualación puede medirse mediante una simple medición de "distancia" , la suma de las diferencias cuadradas en cada característica: en la anotación del vector ||X0bservado- Xobjeti-vol.2 , para dar el cuadrado de la distancia. Si la igualación es exacta, la puntuación es cero. La mejor igualación se categoriza por la puntuación total más baja.

Una variación es ponderar las características diferencialmente, e.g., para ponderar la energía total más que la energía en cada banda de frecuencia, si esto mejora el desempeño. Si existe más de un ejemplo típico (modelo) para cada categoría de lenguaje, como se sugirió previamente, la puntuación es la mínima sobre todos los modelos en la categoría. MlHi [||Xobservado '"Xobjetivo-i|| J En resumen, con la selección de la función de puntuación y un algoritmo tal como la desviación dinámica de tiempo para utilizar la función de puntuación, se especifica el algoritmo para determinar cuando la frase termina. Una modalidad alternativa de la presente invención no involucra el análisis de la señal de subtitulación para personas con discapacidad auditiva. De preferencia, se recibe la señal de audio y se almacena en una memoria. La señal de audio almacenada se procesa entonces con un algoritmo de reconocimiento de sonidos vocales . Tal algoritmo de reconocimiento de lenguaje puede tomar en cuenta la amplitud, frecuencia, longitud de onda y numerosos otros factores al analizar la señal de audio. Cada palabra, frase, etc. identificada por el algoritmo de reconocimiento de sonidos vocales se compara con las palabras objetables identificadas por el usuario y/o las palabras raíz objetables identificadas por el usuario. La secuencia de audio igualada se atenúa directamente en la memoria a través de manipular el segmento de la señal almacenada o un código de silencio incluido en la señal almacenada. En el caso de que la señal de audio incluya palabras habladas y otros sonidos, i.e., ruido de fondo, música, ruido ambiental, etc., entonces pueden emplearse varias técnicas de filtrado para separar las palabras habladas de los otros sonidos. Adicionalmente, para señales de audio de múltiples pistas, e.g., un canal central, canales frontales, canales posteriores, etc., entonces cada pista de audio puede analizarse por separado. Típicamente, el canal central incluye mucho o todo de las palabras habladas en una señal de audio multicanal. Como tal, esto puede ser suficiente para analizar solo el canal central. Las modalidades de la presente invención pueden comprender una computadora de propósito especial o de propósito general incluyendo varios hardware de computadora, un sistema de televisión, un sistema de audio y/o combinaciones de lo anterior. Estas modalidades se tratan en detalle abajo. Sin embargo, en todos los casos, las modalidades descritas deben observarse como ejemplificativas de la presente invención en lugar de limitar su alcance. Las modalidades dentro del alcance de la presente invención también incluyen medios legibles por computadora para llevar o tener instrucciones ejecutables por computadora o estructuras de datos almacenadas en los mismos . Tales medios legibles por computadora pueden ser cualquier medio disponible que pueda accesarse por una computadora de propósito general o de propósito especial tal como los elementos de procesamiento de una televisión, módulo de conexión, etc. A manera de ejemplo y sin limitación, tal medio legible por computadora puede comprender RAM, ROM, EEPROM, CD-ROM, DVD u otros almacenamientos de disco óptico, almacenamiento de disco magnético u otros dispositivos de almacenamiento magnético o cualquier otro medio que puede utilizarse para llevar o almacenar los medios de código del programa deseado en la forma de instrucciones ejecutables por computadora o estructuras de datos y que puedan accesarse mediante una computadora de propósito general o de propósito especial . Cuando se transfiere o proporciona la información a través de una red u otros enlaces o conexiones de comunicaciones (ya sea alambica o inalámbrica o una combinación de alambica e inalámbrica) hacia una computadora, la computadora observa adecuadamente la conexión como un medio legible por computadora. Así, cualquier conexión se llama adecuadamente medio legible por computadora. Las combinaciones de lo anterior deben también incluirse dentro del alcance de los medios legibles por computadora. Las instrucciones ejecutables por computadora comprenden por ejemplo, instrucciones y datos que ocasionan que una computadora de propósito general, computadora de propósito especial o dispositivo de procesamiento de propósito especial lleve a cabo una cierta función o grupo de funciones . La Figura 1 y la exposición asociada se proponen para proporcionar una breve descripción general de un ambiente de cómputo adecuado en el cual puede implementarse la invención. Aunque no se requiere, la invención se describe en el contexto general de las instrucciones ejecutables por computadora, tal como módulos de programa que se ejecutan por uno o más elementos de procesamiento, tal como un procesador de televisión. Generalmente, los módulos de programa incluyen rutinas, programas, objetivos, componentes, estructuras de datos, etc., que llevan a cabo las tareas particulares o implementan los tipos de datos abstractos particulares. Las instrucciones ejecutables por computadora, estructuras de datos asociadas y módulos de programa representan ejemplos de los medios de código del programa para ejecutar las etapas de los métodos descritos en la presente. La secuencia particular de tales instrucciones ejecutables o estructuras de datos asociadas representan ejemplos de acciones correspondientes para implementar las funciones descritas en tales etapas. Además, los medios de código del programa que se ejecutan por una unidad de procesamiento proporciona un ejemplos de un medio procesador.

Claims

REIVINDICACIONES 1. Un método para controlar la reproducción de una señal de audio que comprende : recibir una señal de subtitulación para personas • 5 con discapacidad auditiva; analizar la señal de subtitulación para personas con discapacidad auditiva para un texto especificado; identificar el texto especificado; analizar una señal de audio como una función de la 10 identificación del texto especificado a partir de la señal de subtitulación para personas con discapacidad auditiva; y controlar la reproducción de la señal de audio correspondiente al texto especificado.
2. El método de la reivindicación 1, en donde la 15 operación de controlar la reproducción comprende además atenuar una porción de la señal de audio correspondiente a el texto especificado de la señal de subtitulación para personas con discapacidad auditiva.
3. El método de la reivindicación 1, en donde la 20 operación de controlar la reproducción comprende además cancelar sustancialmente la porción de la señal de audio correspondiente al texto especificado de la señal de subtitulación para personas con discapacidad auditiva.
4. El método de la reivindicación 1, en donde la 25 operación de controlar la reproducción comprende además emitir al menos un comando adaptado para ocasionar la atenuación de una porción de la señal de audio correspondiente a el texto especificado de la señal de subtitulación para personas con discapacidad auditiva.
5. El método de la reivindicación 1, en donde la operación de controlar la reproducción comprende además insertar al menos un código de control en la señal de audio, adaptado el código de control para ocasionar la atenuación de una porción de la señal de audio correspondiente a el texto especificado de la señal de subtitulación para personas con discapacidad auditiva.
6. El método de la reivindicación 1, que comprende además la operación de convertir el texto especificado a una representación fonética del texto especificado.
7. El método de la reivindicación 6, que comprende además prolongar el tiempo de la representación fonética del texto especificado para definir una representación fonética de tiempo prolongado del texto especificado.
8. El método de la reivindicación 7, que comprende además determinar al menos un valor de energía para la representación fonética de tiempo prolongado del texto especificado para definir una forma comparativa del texto especificado.
9. El método de la reivindicación 8, que comprende además determinar al menos un valor de energía por la señal de audio para definir una forma comparativa de la señal de audio.
10. El método de la reivindicación 9, en donde la operación de analizar una señal de audio comprende además la operación de comparar la forma comparativa del texto especificado con la forma comparativa de la señal de audio.
11. El método de la reivindicación 10, en donde la operación de comparar comprende además identificar la porción de la señal de audio correspondiente a el texto especificado.
12. El método de la reivindicación 1, en donde el texto especificado se selecciona del grupo que comprende un espacio, una letra, una palabra, una frase, una oración, un código de control y un símbolo.
13. El método de la reivindicación 1, en donde el texto especificado se selecciona por un usuario.
14. El método de la reivindicación 1, en donde el texto especificado se selecciona a partir de un texto considerado objetable.
15. El método de la reivindicación 1, en donde la operación de identificar el texto especificado comprende además la operación de identificar un texto precedente, precediendo temporalmente el texto precedente al texto especificado.
16. El método de la reivindicación 15, en donde la operación de analizar una señal de audio como una función de la identificación del texto especificado de la señal de subtitulación para personas con discapacidad auditiva comprende además analizar la señal de audio como una función de la identificación del texto precedente de la señal de subtitulación para personas con discapacidad auditiva.
17. El método de la reivindicación 16, en donde la operación de controlar la reproducción de la señal de audio correspondiente al texto especificado comprende además controlar la reproducción de la señal de audio correspondiente al texto precedente .
18. El método de la reivindicación 6, en donde la operación de convertir el ' texto especificado a una representación fonética del texto especificado comprende aplicar un algoritmo de letra-a-sonido al texto especificado.
19. El método de la reivindicación 1, en donde la operación de analizar una señal de audio como una función de la identificación del texto especificado de la señal de subtitulación para personas con discapacidad auditiva comprende aplicar un algoritmo de desviación dinámica de tiempo .
20. Un procesador que comprende una pluralidad de instrucciones ejecutables por computadora configuradas para llevar a cabo el método de la reivindicación 1.
21. El método de la reivindicación 6, que comprende además determinar al menos un valor de energía para la representación fonética del texto especificado para definir una forma comparativa del texto especificado.
22. El método de la reivindicación 21, que comprende además determinar al menos un valor de energía para la señal de audio para definir una forma comparativa de la señal de audio.
23. El método de la reivindicación 22, en donde la operación de analizar una señal de audio comprende además la operación de comparar la forma comparativa del texto especificado con la forma comparativa de la señal de audio.
24. El método de la reivindicación 23, en donde la operación de comparar comprende además identificar la porción de la señal de audio correspondiente a el texto especificado.
25. Un método para controlar la reproducción de una señal de audio que comprende: convertir una porción especificada de una señal de texto de subtitulación para personas con discapacidad auditiva a un audio equivalente de la porción especificada; comparar el audio equivalente de la porción especificada de la señal de texto de subtitulación para personas con discapacidad auditiva a una señal de audio para identificar una porción de la señal de audio correspondiente a la porción especificada de la señal de subtitulación para personas con discapacidad auditiva; y controlar la reproducción de la porción de la señal de audio correspondiente a la porción especificada de la señal de subtitulación para personas con discapacidad auditiva.
26. El método de la reivindicación 25, en donde la operación de controlar la reproducción comprende además atenuar la porción de la señal de audio correspondiente a la porción especificada de la señal de subtitulación para personas con discapacidad auditiva.
27. El método de la reivindicación 25, en donde la operación de controlar la reproducción comprende además cancelar sustancialmente la porción de la señal de audío correspondiente a la porción especificada de la señal de subtitulación para personas con discapacidad auditiva.
28. El método de la reivindicación 25, en donde la operación de controlar la reproducción comprende además emitir al menos un comando adaptado para ocasionar la atenuación de la porción de la señal de audio correspondiente a la porción especificada de la señal de subtitulación para personas con discapacidad auditiva.
29. El método de la reivindicación 25, en donde la operación de controlar la reproducción comprende además insertar al menos un código de control en la señal de audio, estando adaptado el código de control para ocasionar la atenuación de la señal de audio correspondiente a la porción especificada de la señal de subtitulación para personas con discapacidad auditiva.
30. El método de la reivindicación 25, en donde la operación de convertir una porción especificada de una señal de texto de subtitulación para personas con discapacidad auditiva a un audio equivalente de la porción especificada comprende además la operación de convertir la porción especificada de la señal de subtitulación para personas con discapacidad auditiva a una representación fonética de la porción especificada de la señal de subtitulación para personas con discapacidad auditiva.
31. El método de la reivindicación 30, que comprende además prolongar el tiempo de la representación fonética de la porción especificada de la señal de subtitulación para personas con discapacidad auditiva para definir una representación fonética de tiempo prolongado.
32. El método de la reivindicación 31, que comprende además determinar al menos un valor de energía para la representación fonética de tiempo prolongado para definir una forma comparativa de la porción especificada de la señal de subtitulación para personas con discapacidad auditiva.
33. El método de la reivindicación 32, que comprende además determinar al menos un valor de energía para la señal de audio para definir una forma comparativa de la señal de audio .
34. El método de la reivindicación 33, en donde la operación de comparar comprende además la operación de comparar la forma comparativa de la porción especificada de la señal de subtitulación para personas con discapacidad auditiva con la forma comparativa de la señal de audio.
35. El método de la reivindicación 34, en donde la operación de comparar comprende además identificar la porción de la señal de audio correspondiente a la porción especificada de la señal de subtitulación para personas con discapacidad auditiva.
36. Un procesador que comprende una pluralidad de instrucciones ejecutables por computadora configurado para llevar a cabo el método de la reivindicación 25.
37. Un método para controlar la reproducción de una señal de audio que comprende: recibir una indicación de al menos una palabra objetable; identificar la al menos una palabra objetable en una señal de subtitulación para personas con discapacidad auditiva; e identificar la al menos una palabra objetable en una señal de audio como una función de la operación para identificar la al menos una palabra objetable en una señal de subtitulación para personas con discapacidad auditiva.
38. El método de la reivindicación 37 que comprende además controlar una presentación de audio de la señal de audio como una función de la operación de identificación.
39. El método de la reivindicación 38, que comprende además silenciar la presentación de audio de una porción de la señal de audio correspondiente a la al menos una palabra objetable.
40. El método de la reivindicación 38 que comprende además identificar una porción "de la señal de subtitulación para personas con discapacidad auditiva precedente a la palabra objetable.
41. El método de la reivindicación 40, en donde la porción precedente se selecciona del grupo que comprende un espacio, una letra, una palabra, una frase, un símbolo y una señal de control de subtitulación para personas con discapacidad auditiva.
42. El método de la reivindicación 40, que comprende además identificar la al menos una palabra objetable en una señal de audio como una función de la operación para identificar la al menos una palabra objetable en una señal de subtitulación para personas con discapacidad auditiva y la operación de identificar una porción de la señal de subtitulación para personas con discapacidad auditiva precedente a la palabra objetable.
43. El método de la reivindicación 42, en donde la operación de controlar es una función de la identificación de una porción de la señal de subtitulación para personas con discapacidad auditiva precedente a la palabra objetable.
44. El método de la reivindicación 43, que comprende además ocasionar un silencio de la presentación de audio como una función de la identificación de la porción de la señal de subtitulación para personas con discapacidad auditiva precedente a la palabra objetable en la corriente de audio.
45. El método de la reivindicación 44, que comprende además terminar el silencio como una función de la identificación de al menos una palabra objetable en la señal de audio.
46. Un procesador que comprende una pluralidad de instrucciones ejecutables por computadora configuradas para llevara a cabo el método de la reivindicación 37.
47. Un método para controlar la reproducción de una presentación de audio que comprende : recibir una indicación de al menos una palabra objetable; recibir una señal de audio; almacenar la señal de audio en una memoria; procesar la señal de audio almacenada para determinar si se encuentra presente en la señal de audio la al menos una palabra objetable; y controlar la presentación de audio de la señal de audio como una función de la operación del procesamiento.
48. El método de la reivindicación 47 en donde la operación de controlar comprende además atenuar la porción de la señal de audio correspondiente a la al menos una palabra objetable.
49. El método de la reivindicación 47, en donde la operación de controlar comprende además cancelar sustancialmente la porción de la señal de audio correspondiente a la al menos una palabra objetable.
50. El método de la reivindicación 47, en donde la operación de controlar comprende además insertar al menos un código de control en la señal de audio, estando adaptado el código de control para ocasionar la atenuación de la señal de audio correspondiente a la al menos una palabra objetable.
51. El método de la reivindicación 46 en donde la operación de procesamiento comprende además analizar al menos un canal de la señal de audio.
52. Un procesador que comprende una pluralidad de instrucciones ejecutables por computadora configurado para llevara a cabo el método de la reivindicación 47.