ES2307029T3 - Diccionario informativo o de medios de informacion en tiempo real. - Google Patents

Diccionario informativo o de medios de informacion en tiempo real. Download PDF

Info

Publication number
ES2307029T3
ES2307029T3 ES04744819T ES04744819T ES2307029T3 ES 2307029 T3 ES2307029 T3 ES 2307029T3 ES 04744819 T ES04744819 T ES 04744819T ES 04744819 T ES04744819 T ES 04744819T ES 2307029 T3 ES2307029 T3 ES 2307029T3
Authority
ES
Spain
Prior art keywords
words
multimedia
messaging
multimedia messaging
translation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES04744819T
Other languages
English (en)
Inventor
Alexander P.P. Vrijsen
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Original Assignee
Koninklijke Philips Electronics NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Koninklijke Philips Electronics NV filed Critical Koninklijke Philips Electronics NV
Application granted granted Critical
Publication of ES2307029T3 publication Critical patent/ES2307029T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/431Generation of visual interfaces for content selection or interaction; Content or additional data rendering
    • H04N21/4312Generation of visual interfaces for content selection or interaction; Content or additional data rendering involving specific graphical features, e.g. screen layout, special fonts or colors, blinking icons, highlights or animations
    • H04N21/4316Generation of visual interfaces for content selection or interaction; Content or additional data rendering involving specific graphical features, e.g. screen layout, special fonts or colors, blinking icons, highlights or animations for displaying supplemental content in a region of the screen, e.g. an advertisement in a separate window
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/237Lexical tools
    • G06F40/242Dictionaries
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/235Processing of additional data, e.g. scrambling of additional data or processing content descriptors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/433Content storage operation, e.g. storage operation in response to a pause request, caching operations
    • H04N21/4331Caching operations, e.g. of an advertisement for later insertion during playback
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/435Processing of additional data, e.g. decrypting of additional data, reconstructing software from modules extracted from the transport stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/472End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content
    • H04N21/4722End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content for requesting additional data associated with the content
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/488Data services, e.g. news ticker
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/81Monomedia components thereof
    • H04N21/8126Monomedia components thereof involving additional data, e.g. news, sports, stocks, weather forecasts
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/83Generation or processing of protective or descriptive data associated with content; Content structuring
    • H04N21/84Generation or processing of descriptive data, e.g. content descriptors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/85Assembly of content; Generation of multimedia applications
    • H04N21/858Linking data to content, e.g. by linking an URL to a video object, by creating a hotspot
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/85Assembly of content; Generation of multimedia applications
    • H04N21/858Linking data to content, e.g. by linking an URL to a video object, by creating a hotspot
    • H04N21/8586Linking data to content, e.g. by linking an URL to a video object, by creating a hotspot by using a URL
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/443OS processes, e.g. booting an STB, implementing a Java virtual machine in an STB or power management in an STB
    • H04N21/4438Window management, e.g. event handling following interaction with the user interface
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/485End-user interface for client configuration
    • H04N21/4856End-user interface for client configuration for language selection, e.g. for the menu or subtitles

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Acoustics & Sound (AREA)
  • Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Mathematical Physics (AREA)
  • Data Mining & Analysis (AREA)
  • Software Systems (AREA)
  • Machine Translation (AREA)
  • User Interface Of Digital Computer (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Magnetic Resonance Imaging Apparatus (AREA)
  • Medicines Containing Material From Animals Or Micro-Organisms (AREA)
  • Electrically Operated Instructional Devices (AREA)

Abstract

Un método para visionar mensajería multimedia, comprendiendo el método: - reconocer palabras en la mensajería multimedia; - indicar un deseo de acceder a una base de datos de diccionarios durante el visionado de la mensajería multimedia; - acceder a la base de datos de diccionarios tras la indicación; y - visualizar al menos uno de una definición, una traducción y un sinónimo de una o más palabras seleccionadas en la mensajería multimedia, caracterizado porque las palabras seleccionadas se eligen basándose en un número predeterminado de palabras reconocidas que fueron pronunciadas o visualizadas antes de la indicación.

Description

Diccionario informativo o de medios de información en tiempo real.
La presente invención se refiere, generalmente, a mensajería multimedia (MMS), y más particularmente, a un diccionario informativo o de medios de información en tiempo real para uso con mensajería multimedia.
La gente encuentra palabras con las que no está familiarizada mientras visiona contenido multimedia (denominado en esta memoria mensajería multimedia). La mensajería multimedia contiene típicamente partes de audio y vídeo, y puede incluir subtítulos y aplicaciones (OCAP, MHP, etc.). La mensajería multimedia puede ser cualquier contenido de vídeo que se vayan a visionar, tal como películas, espectáculos de televisión, material educativo, material de trabajo y similares.
Si se encuentra una palabra difícil durante el visionado de contenido multimedia, el usuario puede ir a por un diccionario o una enciclopedia para buscar el significado o sinónimo de la palabra, o a por un diccionario bilingüe para consultar la palabra en otro idioma. Si el dispositivo (tal como un ordenador) en el que se está visionando la mensajería multimedia soporta un diccionario, el usuario debe detener la reproducción de la mensajería multimedia, abrir la aplicación de diccionario y mecanografiar la palabra que no comprende (si se conoce cómo se
escribe).
La patente de EE.UU. número 5.543.851 propone incluir una memoria que tiene un diccionario almacenado en la misma, en el que se pueden consultar palabras en los subtítulos basados en texto visualizados con la reproducción de la mensajería multimedia. Sin embargo, cualquier palabra que no comprenda el usuario debe estar contenida en la memoria, por lo tanto, no es probable que estén almacenadas en la memoria palabras poco frecuentes, o palabras especializadas que se utilizan en ciertas profesiones o campos. Además, el sistema de la patente de EE.UU. número 5.543.851 es útil sólo para palabras que se visualizan como parte de los subtítulos basados en texto. Así, si no se usan subtítulos, o si se usan subtítulos basados en imágenes, el usuario debe recurrir a la consulta manual de palabras, como se ha descrito anteriormente.
El documento EP 1 318 672 A1 describe un método para generar información sobre palabras utilizadas en un programa de TV, que comprende las etapas de: detectar automáticamente las palabras utilizadas en dicho programa de TV; almacenar automáticamente una lista previa de las palabras detectadas con el número de veces que aparecen las mismas a medida que discurre el programa de TV; extraer automáticamente, de dicha lista previa, una enumeración de palabras relevantes en el programa de TV en base al número de veces que aparecen las mismas, actualizándose dicha extracción en tiempo real; visualizar la lista extraída de palabras relevantes en la pantalla de TV; esperar una selección de una de las palabras extraídas por un usuario; buscar automáticamente información sobre dichas palabras seleccionadas; y visualizar esta información en la pantalla.
La patente de EE.UU. número 5.708.960 describe un sistema para enviar un periódico a los hogares de los abonados mediante comunicación vía satélite, en la que un sistema de edición/envío de periódicos en la sede central de una casa editora de periódicos crea electrónicamente cada hoja de papel de la sección de noticias nacionales como primeros datos del periódico, y transmite los primeros datos del periódico a las sucursales de la casa editora mediante un satélite de telecomunicación. En un sistema de edición/emisión de periódicos instalado en cada una de las sucursales, los primeros datos del periódico recibidos y los segundos datos del periódico de una sección de noticias locales se combinan y se editan en forma de terceros datos del periódico, que están encriptados, y la clase de periódico y su fecha de emisión están fijadas a los datos del periódico encriptados. Tales datos del periódico se emiten mediante el satélite de telecomunicación. En cada terminal doméstico instalado en los hogares individuales de los abonados, se reciben los datos del periódico emitidos por el sistema de edición/emisión desde la sucursal, descifrados por el uso de una llave obtenida de antemano, y se almacenan temporalmente los datos del periódico con la clase de periódico y su fecha de emisión, que concuerdan con los contenidos de abono preestablecidos. Después de ello, se leen y visualizan los datos del periódico almacenados conforme a una petición del abonado.
El documento WO 01/72040 A2 describe un sistema de visualización informativa o de medios de información que mejora el contenido por reconocimiento de patrones en la señal informativa o de medios de información y por modificación de la señal informativa o de medios de información de modo sensible a los patrones reconocidos. Por ejemplo, en un entorno de emisión televisiva, la señal informativa o de medios de información podría ser un programa de televisión. En un cierto momento, la televisión podría incluir un logotipo de una empresa automovilística. El sistema reconocería el logotipo y lo pondría en correlación con el contenido mejorado que se ha almacenado localmente o usando una entrada adicional. Basándose en las preferencias de los usuarios (por ejemplo, si el usuario está interesado en esa empresa automovilística particular) y en el contenido mejorado que está en correlación, el sistema modificaría la señal de emisión de modo apropiado. Por ejemplo, el contenido mejorado podría ser un videoclip comercial o el número de teléfono de un concesionario de coches local. La modificación de la señal de emisión podría incluir, en tal caso, superponer el número del concesionario de coches local en la señal de vídeo o almacenar en memoria intermedia la señal de emisión y reproducir el videoclip comercial para conseguir una mejora del contenido.
Por lo tanto, un objeto de la presente invención es proporcionar un método y un aparato para visionar mensajería multimedia, que superan las desventajas de la técnica anterior.
En consecuencia, se proporciona un método para visionar mensajería multimedia, comprendiendo el método: reconocer palabras en la mensajería multimedia; indicar un deseo de acceder a una base de datos de diccionarios durante el visionado de la mensajería multimedia; acceder a la base de datos de diccionarios tras la indicación; y visualizar al menos uno de una definición, una traducción y un sinónimo de una o más palabras seleccionadas en la mensajería multimedia, caracterizado porque las palabras seleccionadas se eligen basándose en un número predeterminado de palabras que fueron pronunciadas o visualizadas antes de la indicación. Las palabras seleccionadas se pueden elegir basándose al menos en uno de los datos en la mensajería multimedia, los subtítulos visualizados en la mensajería multimedia y el audio reproducido en la mensajería multimedia. La base de datos de diccionarios puede estar contenida en la mensajería multimedia. Las palabras reconocidas pueden ser subtítulos no basados en texto. El reconocimiento puede comprender reconocer palabras de subtítulo basado en imágenes usando reconocimiento de imágenes. El reconocimiento puede comprender también reconocer palabras de audio usando reconocimiento del habla. El método puede comprender además elegir uno de la definición, la traducción y el sinónimo para al menos una de las palabras seleccionadas y visualizar la definición elegida, la traducción elegida o el sinónimo elegido. La indicación puede comprender apretar un botón dedicado a iniciar el acceso a la base de datos de diccionarios. El método puede comprender además poner en pausa el visionado de la mensajería multimedia mientras se accede a la base de datos de
diccionarios.
Se proporciona además un aparato para visionar mensajería multimedia. El aparato comprende: medios de entrada para dar entrada a la mensajería multimedia; una pantalla para visionar una parte de vídeo de la mensajería multimedia; un altavoz para reproducir una parte de audio de la mensajería multimedia; medios de reconocimiento para reconocer palabras en la mensajería multimedia; medios para indicar un deseo de acceder a una base de datos de diccionarios durante el visionado de la mensajería multimedia; un controlador para acceder a la base de datos de diccionarios tras la indicación, y para visualizar al menos uno de una definición, una traducción y un sinónimo de una o más palabras seleccionadas en la mensajería multimedia, caracterizado porque el controlador está adaptado además para elegir palabras seleccionadas basándose en un número predeterminado de palabras que fueron pronunciadas o visualizadas antes de la indicación.
Se proporcionan también un producto de programa informático para llevar a cabo los métodos de la presente invención y un dispositivo de almacenamiento de programas para almacenar el producto de programa informático en el mismo. El producto de programa informático puede estar realizado en un soporte legible por ordenador o contenido en la mensajería multimedia.
Estas y otras propiedades, aspectos y ventajas de los aparatos y métodos de la presente invención se llegarán a entender mejor en relación con la descripción siguiente, las reivindicaciones adjuntas y los dibujos que se acompañan, en los que:
la figura 1 ilustra una vista esquemática de una realización de un aparato para visionar mensajería multimedia.
Las figuras 2A y 2B ilustran la pantalla del aparato de la figura 1 según una realización en la que se elige una palabra para la que se desea información adicional.
Las figuras 3A a 3C ilustran la pantalla del aparato de la figura 1 según una realización en la que se elige una palabra para la que se desea información adicional.
\vskip1.000000\baselineskip
Haciendo referencia a continuación a la figura 1, se ha ilustrado un esquema de una realización de un aparato para visionar mensajería multimedia. Generalmente, se hace referencia al aparato por el número de referencia 100. El aparato 100 se muestra sólo a modo de ejemplo como una caja de conexión que tiene una pantalla de vídeo 102 y un altavoz 104 conectado de manera operativa a la misma. El aparato puede ser cualquier dispositivo que sea capaz de visualizar mensajería multimedia o hacer que la misma sea visualizada, tal como un teléfono móvil, un asistente personal digital, un ordenador tipo tablet para Internet, un ordenador portátil o un ordenador de sobremesa, o un monitor de televisión. Aunque la pantalla de vídeo 102 y el altavoz 104 se muestran separados del aparato 100, uno de ellos o ambos pueden también ser integrales con el mismo.
El aparato 100 tiene medios de entrada 106 para dar entrada a la mensajería multimedia. La mensajería multimedia puede ser cualquier contenido de vídeo o de audio y se la puede dar entrada por cualquier medio conocido en la técnica, tal como en un soporte de almacenamiento, por ejemplo un DV, un DVD, un CD, un D-VCR, o ser transmitida directamente al aparato 100, tal como por emisión, por satélite, por cable, por sistema celular, y similar. Si se da entrada a la mensajería multimedia por transmisión o por un soporte de almacenamiento, se puede almacenar en el aparato 100 en un dispositivo de almacenamiento interno (no mostrado), tal como un disco duro, encontrado típicamente en un PVR. Se accede entonces a la mensajería multimedia desde el dispositivo de almacenamiento. Así, los medios de entrada pueden ser medios para leer y reproducir el soporte de almacenamiento o medios para recibir y leer la mensajería de datos transmitidos. El aparato puede tener también un sistema de reconocimiento del habla 108 para reconocer palabras en la parte de audio de la mensajería multimedia y un sistema de reconocimiento de imágenes 110 para reconocer palabras en los subtítulos basados en imágenes en la mensajería multimedia. Los componentes del aparato 100, así como la pantalla 102 y el altavoz 104, están bajo control, preferiblemente, de un procesador 112 (denominado alternativamente un "controlador"). El procesador 112 puede estar dedicado al control de los componentes del aparato 100 descrito anteriormente o puede controlar también otras funciones del aparato 100. Por ejemplo, en el caso de que el aparato 100 sea una caja de conexión, el procesador puede controlar también otras funciones estándares de la caja de conexión, tal como el accionamiento de un sintonizador para recibir y visualizar canales de emisión televisiva o por cable.
El aparato 100 tiene también medios de indicación para indicar un deseo de acceder a una base de datos de diccionarios durante el visionado de la mensajería multimedia. Como se describirá a continuación, la mensajería multimedia tiene, preferiblemente, la base de datos de diccionarios contenida en la misma. La base de datos de diccionarios puede tener información correspondiente a palabras utilizadas en la mensajería multimedia, tales como definiciones, traducciones y/o sinónimos para al menos algunas de las palabras utilizadas en la mensajería multimedia. Los medios de indicación pueden ser un dispositivo de control remoto 114. El dispositivo de control remoto 114 puede estar conectado al aparato 100 o comunicado de modo inalámbrico con el aparato 100 a través de un medio inalámbrico, tal como infrarrojos de RF. En la configuración inalámbrica, el aparato incluye una antena 116 (receptor) conectada de manera operativa al procesador 112 para comunicarse con el dispositivo de control remoto 114, como se conoce en la técnica. El control remoto 114 no está dedicado, preferiblemente, a las funciones del aparato 100, como se describe en lo que sigue, pero se usa también para controlar otras funciones del dispositivo. En el caso de que el aparato 100 sea una caja de conexión, el control remoto 114 se puede usar también para cambiar canales, controlar el volumen y controlar otras propiedades estándares. El control remoto 114 tiene una pluralidad de botones 118 para tales funciones, así como un teclado de botones direccionales 120 para recorrer, entre otras funciones, una lista visualizada en una interfaz de usuario visualizada en la pantalla de vídeo 102. Preferiblemente, el teclado de botones direccionales 120 tiene también un botón "enter" 122 para introducir una función resaltada en la lista visualizada.
El funcionamiento del aparato 100 se describirá a continuación con referencia adicional a las figuras 2A, 2B, 3A, 3B y 3C. Como se ha descrito anteriormente, la mensajería multimedia contiene, preferiblemente, una base de datos de diccionarios. La base de datos de diccionarios incluye información adicional correspondiente a palabras en la mensajería multimedia, tales como definiciones, traducciones y/o sinónimos para una o más palabras utilizadas en la mensajería multimedia. Otros tipos de información pueden estar contenidos también en la base de datos de diccionarios, tal como un ejemplo gráfico o de vídeo de una o más palabras en la mensajería multimedia. De esta manera, cada conjunto de mensajería multimedia particular puede incluir una base de datos de diccionarios de palabras difíciles seleccionadas en la mensajería multimedia. Así, no es necesario tener una base de datos maestra de diccionarios almacenada en el dispositivo que tenga entradas por palabras generales, así como entradas por palabras técnicas y médicas para una variedad de áreas. La base de datos completa de diccionarios puede estar incluida en la mensajería multimedia al menos al comienzo de un programa/suceso. La base de datos de diccionarios se puede incluir entonces repetidamente si se requiere acceso aleatorio a la mensajería. Sin embargo, un enfoque alternativo es tener sólo una base de datos muy pequeña de diccionarios de un número determinado de palabras interesantes en la mensajería (por ejemplo, las últimas 8 palabras interesantes) que se actualiza constantemente. Cuando el usuario indica un deseo de acceder a la base de datos de diccionarios, se visualiza el último número predeterminado de palabras. Así, se puede evitar la necesidad de reconocimiento del habla/de los subtítulos.
Mientras se visiona la mensajería multimedia, se permite que el usuario acceda a la base de datos de diccionarios, preferiblemente, indicando un deseo de acceder así a la base de datos de diccionarios en el dispositivo de control remoto 114. Preferiblemente, el usuario aprieta un botón dedicado 124 en el control remoto (o alternativamente, en el aparato 100) para iniciar el acceso a la base de datos de diccionarios, si así lo desea. El botón dedicado puede estar etiquetado con un símbolo de diccionario, con "Ayuda" o con un signo de interrogación. Una vez apretado el botón dedicado 124, o indicando de otro modo un deseo de acceder a la base de datos de diccionarios, el procesador 112 accede a dicha base en la mensajería multimedia y visualiza una definición, una traducción y/o un sinónimo de una o más palabras seleccionadas en la mensajería multimedia de la pantalla 102.
Las palabras seleccionadas se pueden elegir basándose en los datos de la mensajería multimedia, los subtítulos visualizados en la mensajería multimedia y/o el audio reproducido en la mensajería multimedia. En el caso de que la mensajería multimedia tenga subtítulos basados en texto (por ejemplo, subtítulos para sordos o subtitulado basado en teletexto), el procesador puede reconocer y acceder directamente a las palabras en la base de datos de diccionarios. Para subtítulos basados en imágenes que sean parte del vídeo o que se emitan como subtítulos DVB (mapas de bits), el sistema de reconocimiento de imágenes 110 se usa para reconocer palabras en la mensajería multimedia. En el caso de que no haya subtítulos, el sistema de reconocimiento del habla 108 se usa para reconocer palabras en la parte de audio de la mensajería multimedia. Tanto los sistemas de reconocimiento del habla como los de imágenes son bien conocidos en la técnica y se omite, por brevedad, una descripción detallada de los mismos.
Una vez que las palabras son reconocidas a partir de la mensajería multimedia, las mismas se pueden seleccionar basándose en un número predeterminado de palabras que fueron pronunciadas o visualizadas antes de la indicación. Por ejemplo, el procesador puede acceder a la base de datos de diccionarios y visualizar la última palabra o las últimas diez palabras reproducidas en el altavoz (o visualizadas en los subtítulos) antes de que sea apretado el botón dedicado 124. Alternativamente, las palabras seleccionadas se pueden elegir basándose en un período de tiempo predeterminado antes de la indicación. Por ejemplo, el procesador puede acceder a la base de datos de diccionarios y visualizar las palabras reproducidas en el altavoz durante los últimos diez segundos antes de que sea apretado el botón dedicado 124. El aparato 100 puede ser programado, preferiblemente, por el usuario para elegir un método predeterminado a fin de seleccionar las palabras a visualizar, así como el número predeterminado de palabras o la duración del período de tiempo predeterminado. Los métodos de la presente invención pueden filtrar también palabras evidentes (tales como "yo", "el" y "una"). En el caso de que la base de datos de diccionarios esté en la mensajería multimedia, dicha base puede excluir tales palabras evidentes, sin embargo, el filtro puede ser importante cuando la base de datos de diccionarios está almacenada en el aparato 100.
Las figuras 2A y 2B ilustran un primer ejemplo de una interfaz gráfica de usuario visualizada por el aparato 100 en la pantalla 102. Una vez apretado el botón dedicado 124, la mensajería multimedia, por ejemplo, una película, se puede poner en pausa, el procesador 112 reconoce las palabras en la mensajería multimedia, posiblemente usando los sistemas de reconocimiento del habla y de imágenes 108, 110, y se visualiza una primera ventana 200 sobre la película en pausa. Alternativamente, el procesador 112 puede reconocer las palabras en la mensajería multimedia, mientras se está reproduciendo dicha mensajería y poner en caché, posiblemente, el número anterior de palabras según el período de tiempo predeterminado de número de palabras. La primera ventana contiene una lista de palabras 202 seleccionadas según unos criterios predeterminados, cuyos ejemplos se han descrito anteriormente. Cada palabra tiene además categorías 204 correspondientes a un tipo de información sobre cada palabra. Por ejemplo, cada palabra en la lista 202 tiene una "D" para la definición, una "T" para la traducción y una "S" para el sinónimo. Si se selecciona otra información adicional, tal como un ejemplo de vídeo de la palabra, se puede usar una ventana adicional (no mostrada) para reproducir el ejemplo de vídeo. El ejemplo de vídeo se puede añadir a las categorías como una "V". El usuario resaltaría entonces la palabra de la que necesita más información usando el teclado de botones direccionales 120. El usuario resaltaría de modo similar una de las categorías correspondientes a la palabra resaltada usando el teclado de botones direccionales 120. Después de que la elección del usuario está resaltada, el mismo puede apretar el botón "enter" 122 para introducir su selección. Una vez introducida la selección, se visualiza otra ventana 206 que tiene la definición, la traducción o los sinónimos de la palabra resaltada en la lista 202. En el caso de que se desee una traducción, se puede visualizar una ventana provisional 208, antes de la ventana 206, para seleccionar un idioma de la traducción, como se muestra en la figura 2B. Alternativamente, se puede fijar un idioma predeterminado usando el procesador, eliminando de esta manera la necesidad de la ventana adicional 208, 310. Después de visualizar la información adicional para la palabra seleccionada, el usuario puede seleccionar entonces otra palabra (por ejemplo, usando un botón trasero en el dispositivo de control remoto 114) o puede ocultar/detener la aplicación de base de datos de diccionarios. En el caso de que la mensajería multimedia haya sido puesta en pausa, una vez ocultada o detenida la aplicación de base de datos de diccionarios, dicha mensajería puede volver a comenzar automáticamente o se puede volver a hacer comenzar manualmente tras una indicación por el usuario.
Las figuras 3A-3C ilustran otro ejemplo de una interfaz gráfica visualizada por el aparato 100 en la pantalla 102. Una vez apretado el botón dedicado 124, se pone en pausa la mensajería multimedia y se visualiza una primera ventana 300 en la película en pausa. La primera ventana contiene una lista de palabras 302 seleccionadas según unos criterios predeterminados, cuyos ejemplos se han descrito anteriormente. Sin embargo, las categorías 304 correspondientes a un tipo de información sobre una palabra seleccionada en la primera ventana 300 se visualizan en una segunda ventana 306. Por ejemplo, cada palabra en la lista 302 tiene una elección de "Definición", una de "Traducción" y una de "Sinónimo" visualizadas en la segunda ventana 306. El usuario resalta primero la palabra de la que necesita más información usando el teclado de botones direccionales 120 y el botón "enter" 122. Se debería visualizar entonces la segunda ventana 306 y el usuario resaltaría de modo similar una de las categorías 304 correspondientes a la palabra resaltada usando, de nuevo, el teclado de botones direccionales 120 y el botón "enter" 122. Una vez introducida la selección, se visualiza otra ventana 308 (similar a la ventana 206 en el primer ejemplo) que tiene la definición, la traducción o los sinónimos de la palabra resaltada en la lista 302, como se muestra en la figura 3B. En el caso de que se desee una traducción, se visualizaría una ventana provisional 310 (similar a la ventana 208 en el primer ejemplo), antes de la ventana 306, para seleccionar un idioma de la traducción, como se muestra en la figura 3C.
No obstante, las palabras seleccionadas y las características correspondientes se muestran como que están visualizadas en ventanas, aunque los expertos en la técnica apreciarán que se pueden visualizar de otros modos, tales como a lo largo de una barra visualizada en la parte superior de la pantalla 102 o en un menú desplegable a lo largo de un lado de la pantalla. Además, aunque el contenido multimedia se puede poner en pausa mientras se visualizan las palabras seleccionadas, también se puede seguir reproduciendo mientras se visualizan las palabras seleccionadas. Además, si se sigue reproduciendo la mensajería multimedia, la visualización de la misma se puede volver a formatear de manera que se pueda visionar sin obstrucciones por la visualización de las palabras seleccionadas.
Los métodos de la presente invención son particularmente adecuados para ser llevados a cabo por un programa de software informático, conteniendo dicho programa de software informático, preferiblemente, módulos correspondientes a las etapas individuales de los métodos. Dicho software puede estar realizado, por supuesto, en un soporte legible por ordenador, tal como un chip integrado o un dispositivo periférico. El programa de software informático puede ser también parte de la mensajería multimedia (como aplicación MHP u OCAP). Por lo tanto, el programa de software informático puede usar conocimiento específico del audio, el vídeo, el contenido y la base de datos de diccionarios en la mensajería.
Los expertos en la técnica apreciarán que los métodos y aparatos de la presente invención eliminan las desventajas de los métodos de la técnica anterior. Por ejemplo, en contraste a los métodos de la técnica anterior, no se requiere que el usuario deje de visionar la mensajería multimedia y comience otra aplicación. No se requiere tampoco que el usuario mecanografíe manualmente una palabra que no comprende. Por lo tanto, no hay necesidad de un teclado completo, es suficiente un sencillo control remoto con teclas direccionales y una tecla "enter" (que es común en la mayoría de los productos electrónicos de consumo). Adicionalmente, los métodos y aparatos de la presente invención no están restringidos a mensajería multimedia que tiene subtítulos basados en texto, sino que se pueden usar también con contenido que tiene subtítulos basados en imágenes o que no tiene subtítulos en absoluto. Además, ya que la base de datos de diccionarios puede estar contenida en la mensajería multimedia, se puede adaptar específicamente al contenido de dicha mensajería. Esto es particularmente útil para mensajería multimedia que se usa en educación, en documentales y en cursos que tienen su propio vocabulario. No obstante, los métodos y aparatos tienen utilidad especial para tales tipos de contenido, y la tienen también como un servicio adicional para contenidos habituales, tales como películas.

Claims (16)

1. Un método para visionar mensajería multimedia, comprendiendo el método:
- reconocer palabras en la mensajería multimedia;
- indicar un deseo de acceder a una base de datos de diccionarios durante el visionado de la mensajería multimedia;
- acceder a la base de datos de diccionarios tras la indicación; y
- visualizar al menos uno de una definición, una traducción y un sinónimo de una o más palabras seleccionadas en la mensajería multimedia, caracterizado porque las palabras seleccionadas se eligen basándose en un número predeterminado de palabras reconocidas que fueron pronunciadas o visualizadas antes de la indicación.
2. El método según la reivindicación 1, en el que las palabras seleccionadas se eligen basándose al menos en uno de los datos en la mensajería multimedia, los subtítulos visualizados en la mensajería multimedia y el audio reproducido en la mensajería multimedia.
3. El método según la reivindicación 1, en el que la base de datos de diccionarios está contenida en la mensajería multimedia.
4. El método según la reivindicación 1, en el que las palabras reconocidas son subtítulos no basados en texto.
5. El método según la reivindicación 4, en el que el reconocimiento comprende reconocer palabras de subtítulo basado en imágenes usando reconocimiento de imágenes.
6. El método según la reivindicación 4, en el que el reconocimiento comprende reconocer palabras de audio usando reconocimiento del habla.
7. El método según la reivindicación 1, que comprende además elegir uno de la definición, la traducción y el sinónimo para al menos una de las palabras seleccionadas y visualizar la definición elegida, la traducción elegida o el sinónimo elegido.
8. El método según la reivindicación 1, en el que la indicación comprende apretar un botón (124) dedicado a iniciar el acceso a la base de datos de diccionarios.
9. El método según la reivindicación 1, que comprende además poner en pausa el visionado de la mensajería multimedia mientras se accede a la base de datos de diccionarios.
10. Un aparato (100) para visionar mensajería multimedia, comprendiendo el aparato:
- medios de entrada (106) para dar entrada a la mensajería multimedia;
- una pantalla (102) para visionar una parte de vídeo de la mensajería multimedia;
- un altavoz (104) para reproducir una parte de audio de la mensajería multimedia;
- medios de reconocimiento (108, 110) para reconocer palabras en la mensajería multimedia;
- medios (114, 116) para indicar un deseo de acceder a una base de datos de diccionarios durante el visionado de la mensajería multimedia; y
- un controlador (112) para acceder a la base de datos de diccionarios tras la indicación y para visualizar al menos uno de una definición, una traducción y un sinónimo de una o más palabras seleccionadas en la mensajería multimedia, caracterizado porque el controlador está adaptado además para elegir palabras seleccionadas basándose en un número predeterminado de palabras reconocidas que fueron pronunciadas o visualizadas antes de la indicación.
11. El aparato según la reivindicación 10, que comprende además medios para elegir uno de la definición, la traducción y el sinónimo para al menos una de las palabras seleccionadas y en el que el controlador está adaptado para visualizar la definición elegida, la traducción elegida o el sinónimo elegido.
12. El aparato según la reivindicación 10, en el que los medios de reconocimiento (108, 110) están adaptados para reconocer en la mensajería multimedia palabras que son subtítulos no basados en texto.
13. El aparato según la reivindicación 10, en el que la base de datos de diccionarios está contenida en la mensajería multimedia.
14. Un producto de programa informático para visionar mensajería multimedia, comprendiendo el producto de programa informático:
- medios de código de programa legible por ordenador para reconocer palabras en la mensajería multimedia;
- medios de código de programa legible por ordenador para indicar un deseo de acceder a una base de datos de diccionarios durante el visionado de la mensajería multimedia;
- medios de código de programa legible por ordenador para acceder a la base de datos de diccionarios tras la indicación, y
- medios de código de programa legible por ordenador para visualizar al menos uno de una definición, una traducción y un sinónimo de una o más palabras seleccionadas en la mensajería multimedia, caracterizado por
- medios de código de programa legible por ordenador para elegir las palabras seleccionadas basándose en un número predeterminado de palabras reconocidas que fueron pronunciadas o visualizadas antes de la indicación.
15. El producto de programa informático según la reivindicación 14, que está realizado en un soporte legible por ordenador.
16. El producto de programa informático según la reivindicación 14, que está contenido en la mensajería multimedia.
ES04744819T 2003-08-25 2004-08-23 Diccionario informativo o de medios de informacion en tiempo real. Active ES2307029T3 (es)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US49766203P 2003-08-25 2003-08-25
US497662P 2003-08-25

Publications (1)

Publication Number Publication Date
ES2307029T3 true ES2307029T3 (es) 2008-11-16

Family

ID=34216142

Family Applications (1)

Application Number Title Priority Date Filing Date
ES04744819T Active ES2307029T3 (es) 2003-08-25 2004-08-23 Diccionario informativo o de medios de informacion en tiempo real.

Country Status (9)

Country Link
US (1) US20070005338A1 (es)
EP (1) EP1661403B1 (es)
JP (1) JP2007503747A (es)
KR (1) KR20060135598A (es)
CN (1) CN1843036A (es)
AT (1) ATE395788T1 (es)
DE (1) DE602004013799D1 (es)
ES (1) ES2307029T3 (es)
WO (1) WO2005020579A1 (es)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100808991B1 (ko) * 2006-05-04 2008-03-07 삼성전자주식회사 이동통신 단말기에서 전자사전을 이용한 단어검색 방법 및장치
KR101382748B1 (ko) * 2008-01-25 2014-04-08 엘지전자 주식회사 무선통신 시스템에서 랜덤 액세스 과정을 수행하는 방법
US20090240667A1 (en) * 2008-02-22 2009-09-24 Edward Baker System and method for acquisition and distribution of context-driven defintions
CN101609600A (zh) * 2008-06-19 2009-12-23 鸿富锦精密工业(深圳)有限公司 遥控器
US8510317B2 (en) * 2008-12-04 2013-08-13 At&T Intellectual Property I, L.P. Providing search results based on keyword detection in media content
US8332206B1 (en) 2011-08-31 2012-12-11 Google Inc. Dictionary and translation lookup
CN103838715A (zh) * 2012-11-26 2014-06-04 英业达科技有限公司 具翻译提示功能的输入系统及其方法
CN103853704A (zh) * 2012-11-28 2014-06-11 上海能感物联网有限公司 计算机外语有声影像资料自动加注中外文字幕的方法
KR102354582B1 (ko) * 2014-08-12 2022-01-24 삼성전자 주식회사 전자 장치의 동작 방법 및 장치
US10002543B2 (en) * 2014-11-04 2018-06-19 Knotbird LLC System and methods for transforming language into interactive elements
WO2021091526A1 (en) * 2019-11-04 2021-05-14 Google Llc Using video clips as dictionary usage examples

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5810599A (en) * 1994-01-26 1998-09-22 E-Systems, Inc. Interactive audio-visual foreign language skills maintenance system and method
JPH07231309A (ja) * 1994-02-17 1995-08-29 Hitachi Ltd 情報配信システム
US5758257A (en) * 1994-11-29 1998-05-26 Herz; Frederick System and method for scheduling broadcast of and access to video programs and other data using customer profiles
US5543851A (en) * 1995-03-13 1996-08-06 Chang; Wen F. Method and apparatus for translating closed caption data
US5790753A (en) * 1996-01-22 1998-08-04 Digital Equipment Corporation System for downloading computer software programs
US6141488A (en) * 1997-09-05 2000-10-31 United Video Properties, Inc. Program guide system for recording television programs
US20010032070A1 (en) * 2000-01-10 2001-10-18 Mordechai Teicher Apparatus and method for translating visual text
TW518890B (en) * 2000-03-21 2003-01-21 Koninkl Philips Electronics Nv System and method for automatic content enhancement of multimedia output device
JP2004505563A (ja) * 2000-07-27 2004-02-19 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ ビデオ強調用のトランスクリプト・トリガー情報
DE10122597A1 (de) * 2001-05-10 2002-11-14 Philips Corp Intellectual Pty Anzeige weiterführender Informationen zu in einem Multimediagerät vorkommenden Informationselementen
US20030065503A1 (en) * 2001-09-28 2003-04-03 Philips Electronics North America Corp. Multi-lingual transcription system
ATE441284T1 (de) * 2001-12-07 2009-09-15 Accenture Global Services Gmbh Verfahren und vorrichtung zur anzeige von definitionen von ausgewählte begriffe in einem fernsehprogram
US20040152055A1 (en) * 2003-01-30 2004-08-05 Gliessner Michael J.G. Video based language learning system

Also Published As

Publication number Publication date
JP2007503747A (ja) 2007-02-22
EP1661403B1 (en) 2008-05-14
ATE395788T1 (de) 2008-05-15
EP1661403A1 (en) 2006-05-31
CN1843036A (zh) 2006-10-04
US20070005338A1 (en) 2007-01-04
KR20060135598A (ko) 2006-12-29
DE602004013799D1 (de) 2008-06-26
WO2005020579A1 (en) 2005-03-03

Similar Documents

Publication Publication Date Title
ES2323230T3 (es) Interfaz de usuario por voz global.
CN105009570B (zh) 通过解析描述性隐藏式说明数据来定制对信息的显示
US20100106482A1 (en) Additional language support for televisions
ES2307029T3 (es) Diccionario informativo o de medios de informacion en tiempo real.
CN105898517A (zh) 字幕显示控制方法及装置
US20050188412A1 (en) System and method for providing content list in response to selected content provider-defined word
US20100083314A1 (en) Information processing apparatus, information acquisition method, recording medium recording information acquisition program, and information retrieval system
US11748059B2 (en) Selecting options by uttered speech
US9686587B2 (en) Playback method and apparatus
KR20110040219A (ko) 텔레비전 수신기에 있어서의 자동 채널설정 방법과 이에 적합한 콘텐츠 재생 방법
US8130318B2 (en) Method and audio/video device for generating response data related to selected caption data
JP2016062560A (ja) 電子機器及びその制御方法
KR100481539B1 (ko) 캡션정보를 이용한 원 클릭 정보검색 시스템 및 방법
US20060140588A1 (en) Apparatus and method of inserting personal data using digital caption
KR20200121603A (ko) 텍스트를 제공하는 전자 장치 및 그 제어 방법.
KR20050109670A (ko) 네트워크 기반 외국어 학습 방법 및 시스템
KR100636782B1 (ko) 캡션정보 처리장치 및 그 처리 방법
US20060075458A1 (en) Method of displaying an interactive content
JP2006050215A (ja) 映像表示装置
KR20110007384A (ko) 동영상 추출 방식을 이용한 외국어 학습 시스템 및 그 방법
EP3554092A1 (en) Video system with improved caption display
KR20070087910A (ko) 음성 인식을 이용한 데이터 방송 컨텐츠 제어 장치 및 그방법
KR20000051894A (ko) 티브이 프로그램(TVprogram)의 상세 정보 표시장치 및 방법
JP2009004932A (ja) データ放送表示装置、データ放送表示方法およびデータ放送表示プログラム
JP2018112925A (ja) 大規模商業施設用多言語情報システム