MX2015003890A - Aparato de procesamiento de imagenes y metodo de control del mismo y sistema de procesamiento de imagenes. - Google Patents

Aparato de procesamiento de imagenes y metodo de control del mismo y sistema de procesamiento de imagenes.

Info

Publication number
MX2015003890A
MX2015003890A MX2015003890A MX2015003890A MX2015003890A MX 2015003890 A MX2015003890 A MX 2015003890A MX 2015003890 A MX2015003890 A MX 2015003890A MX 2015003890 A MX2015003890 A MX 2015003890A MX 2015003890 A MX2015003890 A MX 2015003890A
Authority
MX
Mexico
Prior art keywords
call sign
voice command
server
call
image processing
Prior art date
Application number
MX2015003890A
Other languages
English (en)
Other versions
MX341560B (es
Inventor
Joo-Yeong Lee
Sang-Shin Park
Original Assignee
Samsung Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Samsung Electronics Co Ltd filed Critical Samsung Electronics Co Ltd
Priority claimed from PCT/KR2013/000440 external-priority patent/WO2014051219A1/en
Publication of MX2015003890A publication Critical patent/MX2015003890A/es
Publication of MX341560B publication Critical patent/MX341560B/es

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/41Structure of client; Structure of client peripherals
    • H04N21/422Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS]
    • H04N21/4227Providing Remote input by a user located remotely from the client device, e.g. at work
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/14Digital output to display device ; Cooperation and interconnection of the display device with other functional units
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/41Structure of client; Structure of client peripherals
    • H04N21/422Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS]
    • H04N21/42204User interfaces specially adapted for controlling a client device through a remote control device; Remote control devices therefor
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/441Acquiring end-user identification, e.g. using personal code sent by the remote control or by inserting a card
    • H04N21/4415Acquiring end-user identification, e.g. using personal code sent by the remote control or by inserting a card using biometric characteristics of the user, e.g. by voice recognition or fingerprint scanning

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Acoustics & Sound (AREA)
  • Telephonic Communication Services (AREA)
  • Facsimiles In General (AREA)
  • Details Of Television Systems (AREA)

Abstract

Un aparato de procesamiento de imagen incluyendo: un procesador de imagen que procesa la señal de transmisión, para desplegar la imagen con base en la señal de transmisión procesada; una unidad de comunicación que está conectada a un servidor; una unidad de entrada de voz recibe un dialogo del usuario; un procesador de voz que procesa un desempeño de una operación correspondiente preestablecida de acuerdo con un comando de voz correspondiente al dialogo; y un controlador que procesa el comando de voz correspondiente al dialogo a través de uno del procesador de voz y el servidor en caso que el dialogo sea ingresado a través de la unidad de entrada de voz. Si el comando de voz incluye una palabra clave relacionada con un distintivo de llamada de un canal de transmisión, el controlador controla uno del procesador de voz y el servidor para seleccionar un distintivo de llamada recomendado correspondiente a la palabra clave de acuerdo con una condición de selección predeterminada, y ejecuta una operación correspondiente bajo el comando de voz con respecto al canal de transmisión del distintivo de llamada recomendado.

Description

APARATO DE PROCESAMIENTO DE IMÁGENES Y MÉTODO DE CONTROL DEL MISMO Y SISTEMA DE PROCESAMIENTO DE IMÁGENES CAMPO DE LA INVENCIÓN Aparatos y métodos consistentes con las modalidades ejemplares se refieren a un aparato de procesamiento de imágenes y un método de control del mismo y un sistema de procesamiento de imágenes que procesa una señal de imagen tal como una señal de transmisión suministrada desde el exterior para desplegar una imagen con base en la señal de imagen procesada, y de manera más particular a un aparato de procesamiento de imágenes y un método de control del mismo y un sistema de procesamiento de imágenes que reconoce el comando de voz de un usuario para ejecutar una función u operación.
ANTECEDENTES DE LA INVENCIÓN Un aparato de procesamiento de imágenes procesa señales de imagen y/o datos de imagen suministrados desde el exterior, de acuerdo con diversas operaciones de procesamiento de imagen. El aparato de procesamiento de imagen puede desplegar una imagen en su panel de despliegue con base en la señal de imagen procesada o emitir la señal de imagen procesada a otro aparato de despliegue que tiene un panel para desplegar una imagen en el mismo con base en la señal de imagen procesada. Es decir, siempre y cuando el aparato de procesamiento de imagen pueda procesar la señal de imagen, éste puede incluir o no incluir un panel para desplegar una imagen. El caso anterior se puede implementar como una TV y este último caso se puede implementar como un descodificador.
Al aparato de procesamiento de imagen continuamente se le agregan funciones para extender sus funciones en linea con el desarrollo de la teenología. En dicha tendencia, se proporcionan varias configuraciones y métodos para ingresar comandos de usuario según se desee al aparato de procesamiento de imagen. Por ejemplo, en un aparato de procesamiento de imagen convencional, si un usuario presiona una tecla/botón de un controlador remoto, una señal de control es transmitida al aparato de procesamiento de imagen para ejecutar una operación según lo desee un usuario. En años recientes, no obstante, el aparato de procesamiento de imagen detecta el movimiento o dialogo del usuario, analiza el contenido detectado, y ejecuta una operación correspondiente, es decir, el aparato de procesamiento de imagen es controlado de acuerdo con el intento del usuario.
BREVE DESCRIPCIÓN DE LA INVENCIÓN Solución al Problema Por consiguiente, una o más modalidades ejemplares proporcionan un dispositivo electrónico, un servidor y un método de control del mismo que reduce al mínimo el tiempo para reconocer el comando de un usuario y ejecutar una operación.
Lo anterior, y/u otros aspectos se pueden lograr proporcionando un aparato de procesamiento de imagen incluyendo: un procesador de imagen que procesa una señal de transmisión transmitida desde el exterior para desplegar una imagen con base en la señal de transmisión procesada; una unidad de comunicación gue está conectada a un servidor para comunicación; una unidad de entrada de voz que recibe un dialogo del usuario, un procesador de voz que procesa un desempeño de una operación correspondiente preestablecida de acuerdo con un comando de voz correspondiente al dialogo; y un controlador que procesa el comando de voz correspondiente al dialogo a través de uno del procesador de voz y el servidor en caso que el dialogo sea ingresado a través de la unidad de entrada de voz, en donde si el comando de voz incluye una palabra clave relacionada con un distintivo de llamada de un canal de transmisión, el controlador controla uno del procesador de voz y el servidor para seleccionar un distintivo de llamada recomendado correspondiente a la palabra clave de acuerdo con una condición de selección predeterminada, y ejecuta una operación correspondiente bajo el comando de voz con respecto al canal de transmisión del distintivo de llamada recomendado.
Un base de datos de al menos un candidato de distintivo de llamada correspondiente a la palabra clave se puede almacenar en el aparato de procesamiento de imagen y el servidor, y el distintivo de llamada recomendado puede ser seleccionado de entre una pluralidad de candidatos de distintivos de llamada buscados en la base de datos bajo la condición de selección.
La condición de selección puede incluir la selección de un candidato de distintivo de llamada, como el distintivo de llamada recomendado, cuya frecuencia de selección es una clasificación preestablecida o más entre la pluralidad de candidatos de distintivos de llamada, con base en la información del historial de uso del aparato de procesamiento de imagen.
La condición de selección puede incluir la selección de un candidato de distintivo de llamada, como el distintivo de llamada recomendado, cuya frecuencia de selección es una clasificación preestablecida o más dentro de una pluralidad de otros aparatos de procesamiento de imagen que se comunican con el servidor entre la pluralidad de candidatos de distintivo de llamada.
El distintivo de llamada recomendado puede ser uno o más, seleccionados de entre la pluralidad de candidatos de distintivos de llamada, y el controlador puede desplegar una interfaz de usuario (UI) que es proporcionada para seleccionar uno de una pluralidad de candidatos de distintivos de llamada seleccionados en caso que la pluralidad de candidatos de distintivos de llamada sea seleccionada.
Si una entrada de la selección de uno de los candidatos de distintivos de llamada no es ejecutada por un tiempo preestablecido después que la UI es desplegada, el controlador puede seleccionar uno de los distintivos de llamada recomendados bajo la condición de selección preestablecida.
La unidad de comunicación se puede comunicar con un servidor de voz-a-texto (STT) que convierte el dialogo en un comando de voz de un texto, y al momento de la entrada del dialogo a la unidad de entrada de voz, el controlador puede transmitir una señal de voz del dialogo al servidor STT, y puede recibir el comando de voz correspondiente al dialogo desde el servidor STT.
Si el comando de voz fuese una oración corta, el controlador puede controlar el procesador de voz para procesar el comando de voz, y si el comando de voz es una oración de conversación, el controlador puede controlar el servidor para procesar el comando de voz.
El aparato de procesamiento de imagen además puede incluir una pantalla que despliega una imagen en la misma con base en una señal de transmisión procesada por el procesador de imagen.
Otro aspecto de la presente modalidad ejemplar se puede lograr proporcionando un método de control de un aparato de procesamiento de imagen que se comunica con un servidor incluyendo: recibir un dialogo del usuario; y procesar un comando de voz correspondiente al dialogo a través de uno del aparato de procesamiento de imagen y el servidor, y ejecutar una operación correspondiente preestablecida bajo el comando de voz, en donde la ejecución de la operación correspondiente preestablecida bajo el comando de voz incluye controlar la selección de un distintivo de llamada recomendado correspondiente a una palabra clave a través de uno del aparato de procesamiento de imagen y el servidor bajo la condición de selección preestablecida en caso que el comando de voz incluya una palabra clave relacionada con un distintivo de llamada de un canal de transmisión; y ejecutar una operación correspondiente bajo el comando de voz con respecto a un canal de transmisión del distintivo de llamada recomendado.
Una base de datos de al menos un candidato de distintivo de llamada correspondiente a la palabra clave se puede almacenar en el aparato de procesamiento de imagen y el servidor, y el distintivo de llamada recomendado se puede seleccionar de entre una pluralidad de candidatos de distintivos de llamada buscados en la base de datos, bajo la condición de selección.
La condición de selección puede incluir la selección de un candidato de distintivo de llamada, como el distintivo de llamada recomendado, cuya frecuencia de selección es una clasificación preestablecida o más entre la pluralidad de candidatos de distintivos de llamada, con base en la información del historial de uso del aparato de procesamiento de imagen.
La condición de selección puede incluir la selección de un candidato de distintivo de llamada, como el distintivo de llamada recomendado, cuya frecuencia de selección es una clasificación preestablecida o más dentro de una pluralidad de otros aparatos de procesamiento de imagen que se comunican con el servidor entre la pluralidad de candidatos de distintivos de llamada.
El distintivo de llamada recomendado puede ser uno o más seleccionados de entre la pluralidad de candidatos de distintivos de llamada, y la ejecución de una operación correspondiente puede incluir el despliegue de una interfaz de usuario (UI) que es proporcionada para seleccionar uno de una pluralidad de candidatos seleccionados de distintivos de llamada en caso que la pluralidad de candidatos de distintivos de llamada sea seleccionada.
El despliegue de la UI puede incluir, seleccionar uno de los distintivos de llamada recomendados bajo la condición de selección preestablecida en caso que una entrada de la selección de uno de los candidatos de distintivos de llamada no sea ejecutada por un tiempo preestablecido después que la UI es desplegada.
El aparato de procesamiento de imagen se puede comunicar con un servidor STT que convierte el dialogo en un comando de voz de un texto, y la recepción del dialogo del usuario puede incluir transmitir una señal de voz del dialogo al servidor STT, y recibir el comando de voz correspondiente al dialogo desde el servidor STT.
La ejecución de la operación correspondiente preestablecidas bajo el comando de voz puede incluir, procesar el comando de voz a través del aparato de procesamiento de imagen en caso que el comando de voz sea una oración corta, y procesar el comando de voz a través del servidor en caso que el comando de voz sea una oración de conversación.
Otro aspecto de la presente modalidad ejemplar se puede lograr proporcionando un sistema de procesamiento de imagen incluyendo: un aparato de procesamiento de imagen que procesa una señal de transmisión transmitida desde el exterior, para desplegar una imagen con base en la señal de transmisión procesada; un servidor que se comunica con el aparato de procesamiento de imagen, en donde el aparato de procesamiento de imagen incluye una unidad de entrada de voz que recibe un dialogo del usuario, un procesador de voz que ejecuta una operación correspondiente preestablecida bajo un comando de voz correspondiente al dialogo; un controlador que controla uno del procesador de voz y el servidor para procesar el comando de voz correspondiente al dialogo, si el dialogo es ingresado, en donde el controlador controla uno del procesador de voz y el servidor para seleccionar un distintivo de llamada recomendado correspondiente a una palabra clave bajo la condición de selección preestablecida en caso que el comando de voz incluya la palabra clave con un distintivo de llamada de un canal de transmisión, y ejecuta una operación correspondiente bajo el comando de voz con respecto a un canal de transmisión del distintivo de llamada recomendado.
El sistema de procesamiento de imagen además puede incluir un servidor STT que convierte el dialogo en un comando de voz de un texto, en donde si el dialogo es ingresado a la unidad de entrada de voz, el controlador puede transmitir una señal de voz del dialogo al servidor STT, y recibe el comando de voz correspondiente al dialogo desde el servidor STT.
En una modalidad ejemplar, hay un aparato de procesamiento de imagen incluyendo: un procesador de imagen que procesa una señal de transmisión recibida desde un exterior para desplegar una imagen con base en la señal de transmisión procesada; un comunicador que opera para comunicarse con un servidor; un receptor de voz que recibe un dialogo de usuario; un procesador de voz que opera para procesar una ejecución de una operación de acuerdo con un comando de voz correspondiente al dialogo del usuario; y un controlador que procesa el comando de voz correspondiente al dialogo del usuario a través de uno del procesador de voz y el servidor en caso que el dialogo sea recibido a través del receptor de voz, en donde si el comando de voz incluye una palabra clave relacionada con un distintivo de llamada deseado de un canal de transmisión, el controlador controla uno del procesador de voz y el servidor para seleccionar un distintivo de llamada correspondiente a la palabra clave de acuerdo con una condición de selección predeterminada, como un distintivo de llamada recomendado, y ejecuta la operación de acuerdo con el comando de voz con respecto al canal de transmisión del distintivo de llamada recomendado.
En otra modalidad ejemplar todavía, hay un método de control de un aparato de procesamiento de imagen que se comunica con un servidor, el método incluye: recibir un dialogo de usuario; y procesar un comando de voz correspondiente al dialogo del usuario a través de uno del aparato de procesamiento de imagen y el servidor, y ejecutar una operación de acuerdo con el comando de voz, en donde la ejecución de la operación de acuerdo con el comando de voz incluye: controlar la selección de un distintivo de llamada correspondiente a una palabra clave, como un distintivo de llamada recomendado, a través de uno del aparato de procesamiento de imagen y el servidor bajo una condición de selección preestablecida en caso que el comando de voz incluye una palabra clave relacionada con un distintivo de llamada de un canal de transmisión, y ejecutar una operación de acuerdo con el comando de voz con respecto a un canal de transmisión del distintivo de llamada recomendado.
En otra modalidad ejemplar todavía, hay un sistema de procesamiento de imagen incluyendo: un aparato de procesamiento de imagen que procesa una señal de transmisión recibida desde un exterior, para desplegar una imagen con base en la señal de transmisión procesada; un servidor que se comunica con el aparato de procesamiento de imagen, en donde el aparato de procesamiento de imagen incluye un receptor de voz que opera para recibir el dialogo de un usuario, un procesador de voz que ejecuta una operación correspondiente preestablecida para un comando de voz correspondiente al dialogo del usuario; y un controlador que controla uno del procesador de voz y el servidor para procesar el comando de voz correspondiente al dialogo del usuario, en caso que el dialogo del usuario sea recibido, en donde el controlador controla uno del procesador de voz y el servidor para seleccionar un distintivo de llamada correspondiente a una palabra clave, como un distintivo de llamada recomendado, bajo la condición de selección preestablecida en caso que el comando de voz incluya la palabra clave relacionada con un distintivo de llamada de un canal de transmisión, y ejecuta una operación correspondiente bajo el comando de voz con respecto a un canal de transmisión del distintivo de llamada recomendado.
En una modalidad ejemplar, hay un método de reconocimiento de comando de voz incluyendo: recibir un comando de voz de usuario a través de un micrófono de un dispositivo de despliegue, para conmutar desde un canal de transmisión desplegado a otro canal de transmisión, el comando de voz de usuario incluyendo un identificador (ID) del otro canal de transmisión; digitalizar el comando de voz de usuario y procesar el comando de voz de usuario digitalizado; comparar el comando de voz de usuario procesado con modelos digitales previamente almacenados de IDs de una pluralidad de canales de transmisión y determinar uno de los modelos digitales previamente almacenados de los IDs de la pluralidad de canales de transmisión como siendo una coincidencia, la operación de comparación es ejecutada en al menos uno del dispositivo de despliegue o un servidor externo que está separado del dispositivo de despliegue; y conmutar del canal de transmisión desplegado a un canal de transmisión correspondiente al modelo determinado de los modelos digitales previamente almacenados de los IDs de la pluralidad de canales de transmisión que están siendo la coincidencia.
El ID puede se uno de entre un ID numérico, ID alfabético, y un ID alfanumérico.
Determinar uno de los modelos digitales previamente almacenados de IDs de la pluralidad de canales de transmisión como la coincidencia incluye determinar una pluralidad de los modelos digitales previamente almacenados de IDs de la pluralidad de canales de transmisión como coincidencias, el método además incluye: desplegar los IDs correspondientes a la pluralidad determinada de los modelos digitales previamente almacenados de los IDs de la pluralidad de canales de transmisión como las coincidencias.
El método de reconocimiento de comando de voz además incluye: seleccionar automáticamente uno de los IDs desplegados en caso que no se reciba una entrada de usuario para seleccionar uno de los IDs desplegados, el ID seleccionado de los IDs desplegados habiendo sido previamente seleccionado, la mayoría entre los IDs desplegados .
BREVE DESCRIPCIÓN DE LAS FIGURAS La figura 1 es un diagrama en bloques de un aparato de despliegue de acuerdo con una primera modalidad ejempiar; La figura 2 ilustra un ejemplo de una estructura de una base de datos relacionada con la palabra clave y los candidatos de distintivos de llamada; La figura 3 es un diagrama en bloques de una estructura de interacción del aparato de despliegue y un servidor en la figura 1; La figura 4 ilustra un ejemplo de un proceso de interacción entre el aparato de despliegue y el servidor en la figura 3; Las figuras 5 y 6 ilustran un ejemplo de una imagen de interfaz de usuario (UI) que es proporcionada para seleccionar uno de una pluralidad de distintivos de llamada recomendados en el aparato de despliegue en la figura 1; La figura 7 ilustra un ejemplo de un procesador de interacción entre un aparato de despliegue y un servidor de acuerdo con una segunda modalidad ejemplar; La figura 8 es un diagrama en bloques de una estructura de interacción de un aparato de despliegue y un servidor de acuerdo con una tercera modalidad ejemplar: La figura 9 ilustra un proceso de interacción entre el aparato de despliegue y el servidor en la figura 8; y La figura 10 es un diagrama en bloques que muestra una estructura de transmisión de señal de un procesador de voz de un aparato de despliegue de acuerdo con una cuarta modalidad ejemplar.
DESCRIPCIÓN DETALLADA DE LA INVENCIÓN A continuación se describirán a detalle modalidades ejemplares con referencia a las figuras acompañantes a fin de que sean realizadas fácilmente por un experto en la téenica. Las modalidades ejemplares se pueden incorporar en diversas formas sin quedar limitadas a las modalidades ejemplares aquí establecidas. Por claridad se omiten descripciones de las partes muy conocidas, y números de referencia similares se refieren a elementos similares en el documento.
La figura 1 es un diagrama en bloques de un aparato de procesamiento de imagen 100 de acuerdo con una primera modalidad ejemplar.
A continuación modalidades ejemplares explican el aparato de procesamiento de imagen 100 que puede desplegar una imagen por sí mismo, pero el concepto de la presente invención puede aplicar a otros dispositivos que no despliegan una imagen por sí mismos, y más bien emiten señales de imagen y/o señales de control a otros aparatos de despliegue. Por lo tanto, el concepto de la presente invención no se limita a las siguientes modalidades ejemplares. Aunque la presente modalidad ejemplar explica el aparato de procesamiento de imagen 100 que es implementado como una TV, otras modalidades ejemplares tendrían diferentes implementaciones.
Tal como se muestra en la figura 1, el aparato de procesamiento de imagen 100 o el aparato de despliegue 100, de acuerdo con la modalidad ejemplar presente, recibe una señal de imagen desde una fuente de suministro de imagen. La señal de imagen que puede ser recibida por el aparato de despliegue 100 no se limita en el tipo de naturaleza, o formato, por ejemplo, el aparato de despliegue 100 puede recibir una señal de transmisión transmitida por un aparato de transmisión de una estación de transmisión, puede sintonizar la señal de transmisión y puede desplegar una imagen de transmisión.
El aparato de despliegue 100 incluye un receptor de imagen 110 que recibe una señal de imagen desde una fuente de suministro de imagen, un procesador de imagen 120 que procesa una señal de imagen recibida por el receptor de imagen 110 de acuerdo con una operación de procesamiento de imagen preestablecida, una pantalla 130 que despliega una imagen en la misma con base en la señal de imagen procesada por el procesamiento de imagen 120, una unidad de comunicación 140 (por ejemplo, un comunicador) que se comunica con un dispositivo externo tal como un servidor 10, una unidad de entrada de usuario 150 que es manipulada por un usuario, una unidad de entrada de voz 160 (por ejemplo, un receptor de voz, un micrófono, etc.) que recibe una voz o sonido desde el exterior, un procesador de voz 170 que interpreta y procesa la voz o sonido ingresado en la unidad de entrada de voz 160, una unidad de almacenamiento 180 (por ejemplo, almacenamiento) que almacena datos y/o información en la misma, y un controlador 190 que controla las operaciones generales del aparato de despliegue 100.
El receptor de imagen recibe señales de imagen y/o datos de imagen en una forma cableada o inalámbrica, y transmite las señales de imagen y/o datos de imagen al procesador de imagen 120. El receptor de imagen 110 puede variar dependiendo de un estándar de una señal de imagen recibida y un tipo de modalidad ejemplar del aparato de despliegue 100. Por ejemplo, el receptor de imagen 110 puede recibir una señal de radiofrecuencia (RF) o una señal de imagen de acuerdo con diversos estándares tales como video compuesto, video de componente, súper video, SCART, interfaz multimedia de alta definición (HDMI), DisplayPort, interfaz de despliegue unificada (UDI), estándar HD inalámbrico, u otros estándares. Si la señal de imagen es una señal de transmisión, el receptor de imagen 110 incluye un sintonizador para sintonizar la señal de transmisión para un canal.
El procesador de imagen 120 procesa la señal de imagen recibida por el receptor de imagen 110, de acuerdo con diversas operaciones de procesamiento de imagen. El procesador de imagen 120 emite la señal de imagen procesada a la pantalla 130, en la cual se despliega una imagen con base en la señal de imagen procesada. Por ejemplo, si un sintonizador sintoniza la señal de transmisión para un canal particular en el receptor de imagen 110, el procesador de imagen 120 extrae la imagen, voz y datos adicionales de la señal de transmisión correspondiente al canal, ajusta la señal de imagen a una resolución preestablecida y despliega una imagen en la pantalla 130.
La operación de procesamiento de imagen del procesador de imagen 120 puede incluir, pero no se limita a, una operación de decodificación correspondiente a un formato de imagen de los datos de imagen, una operación de desintercalación para convertir los datos de imagen intercalados en datos de imagen progresivos, una operación de escalación para ajustar los datos de imagen a una resolución preestablecida, una operación de reducción de ruido para mejorar una calidad de imagen, una operación de mejora de detalle, una conversión de velocidad de refrescar cuadro, etc.
El procesador de imagen 120 es implementado como un sistema-en-chip (SOC) que integra algunas todas las funciones anteriores, o como un tablero de procesamiento de imagen que es formado mediante el montaje de elementos individuales en un tablero de circuitos impresos (PCB) para ejecutar algunas o todas las operaciones de procesamiento de imagen anteriores y se instala en el aparato de despliegue 100.
La pantalla 130 despliega una imagen en la misma con base en una señal de imagen emitida por el procesador de imagen 120. La pantalla 130 puede ser implementada como diversos paneles de despliegue incluyendo cristal liquido, plasma, proyección, diodo de emisión de luz (LED), diodo de emisión de luz orgánica (OLED), emisor de electrones de conducción en superficie, nanotubo de carbono, y nanocristal, pero no se limita a esto.
La pantalla 130 además puede incluir elementos adicionales dependiendo de su implementación. Por ejemplo, la pantalla 130 tal como una LCD puede incluir un panel LCD, una unidad de luz de fondo para emitir luz al panel LCD, y un substrato de accionamiento de panel para accionar el panel LCD.
La unidad de comunicación 140 transmite y recibe datos para comunicación entre el aparato de despliegue 100 y el servidor 10. En una modalidad ejemplar, la comunicación puede ser comunicación interactiva. La unidad de comunicación 140 es conectada al servidor 10 a través de una red de área local y/o amplia cableada y/o inalámbrica o conexión local a través de un protocolo de comunicación del servidor 10.
La unidad de entrada de usuario 150 transmite diversos comandos de control preestablecidos o información al controlador 190 de acuerdo con la entrada de usuario recibida. La unidad entrada de usuario 150 es implementada como una tecla de menú o como un panel de entrada instalado en una parte externa del aparato de despliegue 100, o un controlador remoto que está separado del aparato de despliegue 100. La unidad de entrada de usuario 150 de otra manera puede estar integralmente formada en la pantalla 130. Si la pantalla 130 es una pantalla táctil, un usuario puede tocar el menú de entrada desplegado en la pantalla 130 para la transmisión de un comando preestablecido al controlador 190.
La unidad de entrada de voz 160 es implementada como un micrófono, y detecta diversos sonidos generados desde el ambiente externo del aparato de despliegue 100. El sonido que es detectado por la unidad de entrada de voz 160 incluye un dialogo del usuario y otros sonidos que son generados por diversas fuentes diferentes al usuario.
El procesador de voz 170 procesa voces o sonidos ingresados a la unidad de entrada de voz 160, de entre los diversos procesos preestablecidos ejecutados por el aparato de despliegue 100. La "voz" que es procesada por el procesador de voz 170 significa una entrada de voz a la unidad de entrada de voz 160. La señal de imagen que es procesada por el procesador de imagen 120 puede incluir datos de voz, los cuales son procesados por el procesador de imagen 120.
Si voz o sonido es ingresado a la unidad de entrada de voz 160, el procesador de voz 170 determina si la voz o sonido entrante fue el resultado del dialogo del usuario o fue generado por otros factores. Dicha determinación puede utilizar diversas configuraciones, y no puede ser especificada, por ejemplo, incluye un método para determinar si la voz o sonido entrante cae bajo una longitud de onda o banda de frecuencia correspondiente a la voz humana, o un método para determinar si la voz o sonido entrante cae bajo o coincide con un perfil de voz de usuario que es almacenado por anticipado.
En caso que se determine que el dialogo de usuario ha sido ingresado, el procesador de voz 170 ejecuta una operación preestablecido para el comando de voz correspondiente al dialogo. En una modalidad ejemplar, el comando de voz es el contenido hablado por un usuario. Esto se describirá a detalle más adelante.
La unidad de almacenamiento 180 almacena datos en la misma a través de un control del controlador 190. La unidad de almacenamiento 180 es implementada como una memoria no volátil tal como una memoria Flash o una unidad de disco duro. Se puede tener acceso a la unidad de almacenamiento 180 mediante el controlador 190, el procesador de imagen 120 o el procesador de voz 170, y los datos ahí almacenados pueden ser leídos, escritos, modificados, eliminados o actualizados por el controlador 190, el procesador de imagen 120 o el procesador de voz 170.
Al momento de recibir un dialogo de usuario a través de la unidad de entrada de voz 160, el controlador 190 controla el procesador de voz 170 para procesar el dialogo de entrada. Cuando el procesador de imagen 120 procesa la señal de imagen recibida por el receptor de imagen 110 para desplegar una imagen de transmisión en la pantalla 130, el controlador 190 cambia un canal de acuerdo con el contenido del dialogo de un usuario en caso que el dialogo del usuario sea recibido para ordenar el cambio del canal a través de la unidad de entrada de voz 160.
El comando de voz relacionado con el "cambio de canal" puede incluir, decir en voz alta un número de canal de un canal de transmisión que desea el usuario o decir en voz alta un distintivo de llamada de un canal de transmisión deseado. El número de canal y el distintivo de llamada son expresiones que se establecen por anticipado para distinguir los canales entre sí. El número de canal es expresado en un número positivo tal como 6, 7, y 11.
El distintivo de llamada es un ID de un proveedor que proporciona un canal particular, y generalmente es un nombre de identificación de una estación de transmisión que transmite el canal, puede haber una pluralidad de distintivos de llamada para un solo canal, y si una sola estación de transmisión proporciona una pluralidad de canales, los canales respectivos tiene diferentes distintivos de llamada para distinguir entre los mismos. ID de formas alternativas son en formas numérica, alfabética o alfanumérica.
El ejemplo del caso anterior es de la siguiente forma: si un distintivo de llamada de un primer canal predeterminado es "KBS", entonces dicho distintivo de llamada "Sistema de Transmisión Coreano" se puede referir al primer canal idénticamente a "KBS". Un distintivo de llamada de un segundo canal predeterminado en una ubicación geográfica es "MBC" pero el distintivo de llamada del segundo canal en otra ubicación geográfica puede ser "TNN". Es decir, puede haber una pluralidad de distintivos de llamada para un canal particular.
El ejemplo de este último caso es de la siguiente forma: una estación de transmisión que tiene un distintivo de llamada "KBS" puede proporcionar una señal de transmisión a un tercer canal predeterminado y cuarto canal. En este caso, un distintivo de llamada del tercer canal es "KBS-1" y un distintivo de llamada del cuarto canal es "KBS-2", los cuales son diferentes uno de otro. "KBS" se puede considerar como un distintivo de llamada representativo de la estación de transmisión, y "KBS-1" y "KBS-2" son distintivos de llamada subordinados a "KBS". Es decir, el distintivo de llamada "KBS" se refiere tanto al tercer canal como al cuarto canal.
Por consiguiente, si el dialogo del usuario que es ingresado a través de la unidad de entrada de voz 160 es un comando de voz "reproducir KBS", puede no ser claro a cual del tercer canal de "KBS-1" y el cuarto canal de "KBS-2" se está refiriendo.
De acuerdo con la presente modalidad ejemplar, el controlador 190 determina si el comando de voz correspondiente al dialogo del usuario incluye una palabra clave relacionada con el distintivo de llamada del canal de transmisión .
Si se determina que el comando de voz incluye la palabra clave relacionada con el distintivo de llamada, el controlador 190 controla el procesador de voz 170 para buscar un distintivo de llamada correspondiente a la palabra clave de una base de datos incluyendo una pluralidad de distintivos de llamada. La base de datos es almacenada en la unidad de almacenamiento 180, y el distintivo de llamada buscado es denominado un candidato de distintivo de llamada. Si se ha buscado una pluralidad de candidatos de distintivos de llamada correspondientes a la palabra clave, el controlador 190 selecciona un distintivo de llamada como un distintivo de llamada recomendado de la pluralidad de candidatos de distintivos de llamada bajo condiciones de selección preestablecidas. En otras modalidades ejemplares, el distintivo de llamada seleccionado por el controlador puede ser un distintivo de llamada que mejor se ajuste, un distintivo de llamada estimado, o un distintivo de llamada reconocido.
De otra manera, el controlador 190 puede transmitir la palabra clave y el comando de voz al servidor 10 que almacena la base de datos. Después, el servidor 10, de acuerdo con el principio que es similar a aquel antes explicado, selecciona el distintivo de llamada recomendado, analiza una operación correspondiente en el comando de voz y transmite una señal de control al aparato de despliegue 100 de acuerdo con la selección y los resultados del análisis.
El controlador 190 ejecuta una operación correspondiente con respecto a la señal de transmisión del distintivo de llamada recomendado seleccionado para el comando de voz. En lo sucesivo, se describirán con referencia a la figura 2 una configuración de la base de datos 200 y un método para buscar un candidato de distintivo de llamada 230 de una base de datos 200.
La figura 2 ilustra un ejemplo de la base de datos 200.
Tal como se muestra ahí, el controlador 190 > determina si el comando de voz "reproducir KBS" cambiado a un texto a partir del dialogo de un usuario incluye una palabra clave relacionada con un distintivo de llamada. Si la unidad de almacenamiento 180 almacena ahi la base de datos de relación 200 que mapea la palabra clave y el distintivo de llamada, el controlador 190 puede buscar una palabra clave predeterminada a partir de la base de datos 200 y puede determinar si la palabra clave se relaciona con el distintivo de llamada.
La base de datos 200 mapea una pluralidad de palabras clave 220 y una pluralidad de distintivos de llamada 230, y se utilizan para buscar al menos un candidato de distintivo de llamada entre la pluralidad de distintivos de llamada 230 con base en una sola palabra clave de la pluralidad de palabras clave 220. El dibujo ilustra solamente la relación de elementos con relación a dos distintivos de llamada representativos, "KBS", y "FTV", de la base de datos 200.
Los distintivos de llamadas representativas 210 actúan como un enlace entre la pluralidad de palabras clave 220 y la pluralidad de distintivos de llamada 230. De manera más especifica, si se ingresa una palabra clave predeterminada de la pluralidad de palabras clave 220, un distintivo de llamada representativo correspondiente a la palabra clave predeterminada es buscado en la base de datos 200. Si se encuentra el distintivo de llamada representativo correspondiente 210, en segundo lugar se busca un candidato de distintivo de llamada subordinado o un distintivo de llamada relevante correspondiente al distintivo de llamada representativo 210 buscado.
En el caso de una palabra clave, diversos términos que incluyen sinónimos relacionados con el distintivo de llamada representativo son agrupados y/o categorizados para el distintivo de llamada representativo. Los candidatos de distintivos de llamada incluyen distintivos de llamada de al menos un canal relacionado con el distintivo de llamada representativo 210, y los distintivos de llamada son agrupados y/o categorizados para el distintivo de llamada representativo 210.
Por ejemplo, si se ingresa una palabra clave "canal de pesca", el distintivo de llamada representativo relacionado con "canal de pesca" es "FTV", y el candidato de distintivo de llamada relacionado con el distintivo de llamada representativo "FTV" 20 es únicamente uno, "FTV". Es decir, de acuerdo con los resultados de la búsqueda de la base de datos 200, el distintivo de llamada del canal correspondiente a la palabra clave "canal de pesca" 220 es "FTV" solo.
Si se ingresa la palabra clave "KBS", el distintivo de llamada representativo relacionado con "KBS" es "KBS", y los candidatos de distintivo de llamada relacionados con el distintivo de llamada representativo "KBS" son cuatro candidatos, es decir, "KBS-1", "KBS-2", "KBS-deportes" y "KBS-películas".
La base de datos 200 es buscada a través del método anterior para obtener al menos un candidato de distintivo de llamada relacionado con la palabra clave. El método anterior es únicamente un ejemplo para implementar la base de datos 200, y el método de implementación de la base de datos 200 puede variar y no se limita al ejemplo anterior.
La figura 3 es un diagrama en bloques que muestra una estructura de interacción del aparato de despliegue 100 y los servidores 20 y 30.
Tal como ahi se muestra, el aparato de despliegue 100 incluye una unidad de comunicación 140, una unidad de entrada de voz 160, un procesador de voz 170 y un controlador 190. Los elementos son los mismos que aquellos que se explicaron en la figura 1. La unidad de comunicación 140 está conectada a un servidor de voz-a-texto (STT) 20 que convierte el dialogo de un usuario en un comando de voz, y a un servidor de conversación 30 que analiza un comando de voz para determinar una operación correspondiente al comando de voz.
El servidor STT 20 analiza una forma de onda de una señal de voz recibida y genera un texto a partir del contenido de la señal de voz. El servidor STT 20 convierte una señal de voz del dialogo de un usuario transmitido por el aparato de despliegue 200 en un comando de voz.
El servidor de conversación 30 incluye una base de datos que mapea diversas operaciones del aparato de despliegue 100 correspondiente a un comando de voz. El servidor de conversación 30 analiza el comando de voz transmitido por el aparato de despliegue 100, y transmite al aparato de despliegue 100 una señal de control para ejecutar una operación correspondiente al comando de voz de acuerdo con los resultados del análisis.
Si un dialogo del usuario es ingresado o recibido en la unidad de entrada de voz 160, el controlador 190 transmite una señal de voz del dialogo al servidor STT 20, y recibe un comando de voz desde el servidor STT 20 correspondiente al dialogo.
El controlador 190 determina si el comando de voz transmitido por el servidor STT 20 es una oración corta o una oración de conversación. Si el comando de voz es una oración corta, el controlador 190 controla el procesador de voz 170 para procesar el comando de voz. Si el comando de voz es una oración de conversación, el controlador 190 controla el servidor de conversación 30 para procesar el comando de voz. En una modalidad ejemplar, la oración corta se puede distinguir de una oración de conversación con base en el número de palabras o el número de fonemas. En una modalidad ejemplar, la oración corta tiene N o menos palabras, donde NI puede ser uno de 1, 2, 3, 4, 56, 7, 8, y una oración de conversación tiene más de N palabras. En otra modalidad ejemplar, la oración corta tiene N2 o menos fonemas, donde N2 puede ser uno de 1, 2, 3, 4, 56, 7, 8, y una oración de conversación tiene más de N fonemas.
Esto se debe a que la oración de conversación es lenguaje natural, y la extracción mecánica de una operación correspondiente deseada desde el comando de voz como la oración de conversación no es relativamente fácil. Por ejemplo, si el comando de voz de un usuario es una oración corta "reproducir KBS", el procesador de voz 170 inmediatamente puede ejecutar la operación con la palabra clave de distintivo de llamada "KBS" y una palabra clave de operación "reproducir".
Sin embargo, si el comando de voz es una oración de conversación "cambiar el canal actual al Sistema de Transmisión Coreano" la cual tiene sustancialmente el mismo contenido que la oración corta anterior, se requiere el proceso de extraer la palabra clave del distintivo de llamada "KBS" correspondiente a "Sistema de Transmisión Coreano" y el proceso de extraer la palabra clave de operación "reproducir" correspondiente a "cambia a". Debido a los diversos factores tales como la carga del sistema o cantidad de la base de datos, el procesamiento de dicha oración de conversación mediante el procesador de voz 170 puede no ser fácil.
La figura 4 ilustra un ejemplo de un proceso de interacción entre el aparato de despliegue 100 y los servidores 20 y 30 de acuerdo con la modalidad ejemplar presente.
Tal como ahi se muestra, al momento de recibir una entrada de dialogo del usuario (600), el aparato de despliegue 100 transmite la señal de voz del dialogo al servidor STT 20 (610).
El servidor STT 20 convierte la señal de voz en un comando de voz (620), y transmite el comando de voz convertido al aparato de despliegue 100 (630).
El aparato de despliegue 100 analiza el comando de voz transmitido por el servidor STT 30, y extrae la palabra clave relacionada con el distintivo de llamada del comando de voz (640). El aparato de despliegue 100 determina si el comando de voz es una oración corta o una oración de conversación.
Si se determina que el comando de voz es una oración de conversación, el aparato de despliegue 100 transmite el comando de voz y la palabra clave relacionada con el distintivo de llamada al servidor de conversación 30 (650).
El servidor de conversación 30 ejecuta un proceso de análisis de distintivo de llamada en virtud del comando de voz y la palabra clave relacionada con el distintivo de llamada transmitido por el aparato de despliegue 100 (660). El proceso de análisis del distintivo de llamada incluye un proceso de búsqueda de un candidato de distintivo de llamada correspondiente a la palabra clave relacionada con el distintivo de llamada, un proceso de selección de un distintivo de llamada de entre los candidatos de distintivos de llamada buscados como un distintivo de llamada recomendado, y un proceso que consiste en determinar la operación del aparato de despliegue 100 correspondiente al distintivo de llamada recomendado dentro del texto. Esto se describirá con más detalle más adelante.
Si se completa la selección del distintivo de llamada recomendado y la determinación de la operación correspondiente del comando de voz, el servidor de conversación 30 transmite una señal de control al aparato de despliegue 100 de acuerdo con dichos resultados de la selección y determinación. El aparato de despliegue 100 puede ejecutar la operación correspondiente con respecto al distintivo de llamada recomendado de acuerdo con la señal de control.
Por ejemplo, si se analiza que el distintivo de llamada recomendado es "KBS-1" y la operación correspondiente es el cambio de canal, el servidor de conversación 30 transmite la señal de control que ordena dicho contenido, al aparato de despliegue 100, el cual cambia el canal a "KBS-1".
Si se determina que el comando de voz es una oración corta en la operación 640, el aparato de despliegue 100 ejecuta el proceso de análisis del distintivo de llamada con respecto al comando de voz recibido y a la palabra clave relacionada con el distintivo de llamada. Dicho proceso se ejecuta de acuerdo con sustancialmente el mismo principio que el proceso ejecutado por el servidor de conversación 30.
En lo sucesivo, se describirá el proceso del análisis del distintivo de llamada con respecto a la palabra clave relacionada con el distintivo de llamada.
El servidor de conversación 30 busca el candidato del distintivo de llamada correspondiente a la palabra clave relacionada con el distintivo de llamada, y determina si hay una pluralidad de candidatos de distintivos de llamada.
La determinación respecto a si el comando de voz incluye la palabra clave relacionada con el distintivo de llamada y la búsqueda del candidato del distintivo de llamada correspondiente a la palabra clave se puede ejecutar a través del mismo método que aquel que se explicó en la fiqura 2. Es decir, el servidor de conversación 30 busca las palabras extraídas del comando de voz, desde la base de datos 200 (hacer referencia a la figura 2) y determina si hay alguna palabra de emparejamiento 220 (hacer referencia a la figura 2), y en caso de haberla, puede obtener el candidato del distintivo de llamada (hacer referencia a la figura 2) del distintivo de llamada representativo (hacer referencia a la figura 2).
En el proceso de extraer la palabra clave del comando de voz, se puede ejecutar una corrección o filtración de un error en el comando de voz. Por ejemplo, si hay un comando de voz "Reproducir Sistema de Transmisión Orean", la palabra "Sistema de Transmisión Coreano" en la base de datos puede ser seleccionada incluso si la palabra "Sistema de Transmisión Orean" no está incluida en la base de datos pero determina que "Sistema de Transmisión Coreano" es similar a la palabra "Sistema de Transmisión Orean". El método de determinar similitudes de palabras puede variar, y no se limita al concepto de la presente invención.
Si únicamente hay un candidato de distintivo de llamada, el servidor de conversación 30 selecciona el candidato del distintivo de llamada como un distintivo de llamada recomendado.
Si hay una pluralidad de candidatos de distintivos de llamada, el servidor de conversación 30 selecciona un distintivo de llamada recomendado bajo condiciones de selección preestablecidas.
Las condiciones de selección para seleccionar el distintivo de llamada recomendado de entre los candidatos de distintivos de llamada se puede establecer por anticipado. Por ejemplo, el servidor de conversación 30 puede seleccionar una pluralidad de distintivos de llamada cuyas frecuencias de historial de selección son de un rango preestablecido o superior, como los distintivos de llamada recomendados, o puede seleccionar un solo distintivo de llamada cuya frecuencia de historial de selección es la más elevada, como el distintivo de llamada recomendado.
Si hay cuatro distintivos de llamada "KBS-1", "KBS-2", "KBS-deportes", y "KBS-peliculas" como los candidatos del distintivo de llamada, el controlador 190 determina la frecuencia de historial de selección de los canales en el aparato de despliegue 100 para un periodo predeterminado con base en la información del historial de uso. Por ejemplo, si los distintivos de llamada son ordenados de acuerdo con la frecuencia descendente del historial de selección, entonces el orden podría ser "KBS-deportes", "KBS películas", "KBS-2", y "KBS-1", el controlador 190 puede seleccionar una pluralidad de distintivos de llamada en el orden de la frecuencia de historial de selección o puede seleccionar un solo distintivo de llamada.
El controlador 190 puede desplegar una interfaz de usuario (UI) que se utiliza para que un usuario seleccione uno de la pluralidad de candidatos de distintivos de llamada.
Las figuras 5 y 6 ilustran un ejemplo de las UIs 310 y 320 que se proporcionan para seleccionar uno de una pluralidad de distintivos de llamada recomendados.
Tal como se muestra en la figura 5, el controlador 190 selecciona "KBS-deportes" y "KBS- películas", los cuales han sido seleccionados con mayor frecuencia en el aparato de despliegue 100, como el distintivo de llamada recomendado con base en la información de historial de uso, y proporciona la UI 310 para que un usuario seleccione un canal deseado de entre el distintivo de llamada recomendado seleccionado. Un usuario puede seleccionar un distintivo de llamada y canal de transmisión de "KBS-deportes" y "KBS-películas" a través de la UI 310.
Tal como se muestra en la figura 6, el controlador 190 puede proporcionar la UI 320 que es utilizada para seleccionar uno de todos los candidatos de distintivos de llamada "KBS-deportes" y "KBS-películas", "KBS-2", y "KBS-1". El controlador 190 puede desplegar todos los candidatos de distintivos de llamada buscados en la UI 320, pero puede determinar el orden de despliegue de los distintivos de llamada de acuerdo con la frecuencia del historial de selección. Por ejemplo, la UI 320 puede desplegar los candidatos de distintivos de llamada en el orden que inicia a partir de la frecuencia del historial de selección más elevada.
Si no se lleva a cabo una selección de usuario durante el tiempo preestablecido mientras se despliega las UIs 310 y 320, el controlador 190 puede seleccionar el canal clasificado más elevado, por ejemplo, "KBS-deportes" el cual ha sido seleccionado con mayor frecuencia de entre los candidatos de distintivos de llamada.
Las condiciones de selección para seleccionar el distintivo de llamada recomendado a partir de los candidatos de distintivos de llamada pueden ser diferentes del ejemplo anterior. El servidor 10 (hacer referencia a la figura 1) está conectado a varios aparatos de despliegue diferentes al aparato de despliegue 100. El servidor 10 puede ser idéntico o diferente del servidor STT 20 o el servidor de conversación 30. El servidor STT 20 y el servidor de conversación 30 se han descrito como diferentes, pero se pueden implementar como servidores idénticos.
Los otros aparatos de despliegue transmiten información del historial de uso al servidor 10. El servidor 10 determina la frecuencia de selección de "KBS-1", "KBS-2" "KBS-deportes" y "KBS-películas" dentro de los candidatos de distintivos de llamada con base en la información del historial de uso recopilada desde los otros aparatos de despliegue.
El controlador 190 transmite los candidatos de distintivos de llamada "KBS-1", "KBS-2" "KBS-deportes" y "KBS-películas" al servidor 10, y puede solicitar que el servidor 10 seleccione el candidato recomendado de entre los candidatos de distintivos de llamada.
El servidor 10 determina la clasificación de selección con base en la información del historial de uso de los otros aparatos de despliegue, dentro de los candidatos de distintivos de llamada. Si la clasificación de selección se muestra en el orden de "KBS-películas" "KBS-2" "KBS-deportes" y "KBS-1" y el número de candidato recomendado solicitado por el aparato de despliegue 100 es uno, el servidor 10 decide "KBS-películas" que ha sido seleccionado con mayor frecuencia, como un candidato recomendado, y notifica al aparato de despliegue 100 sobre lo anterior. El controlador 190 puede desplegar información relacionada con "KBS-películas", como una imagen.
Si únicamente se selecciona un distintivo de llamada recomendado, el controlador 190 automáticamente puede desplegar una imagen de un canal de transmisión del distintivo de llamada recomendado. Sin embargo, el número de canal correspondiente al distintivo de llamada puede no ser idéntico de acuerdo con la ubicación geográfica.
Por consiguiente, el controlador 190 obtiene información de ubicación geográfica referente a la ubicación geográfica donde está ubicado el aparato de despliegue 100, y determina un número de canal del distintivo de llamada para la ubicación geográfica. El método que consiste en determinar la ubicación geográfica del aparato de despliegue 100 puede variar, por ejemplo, extrayendo la ubicación geográfica y/o el ID del país incluido en una cabecera o metadatos de una señal de transmisión, determinado por el servidor 10 con base en una dirección mac de la unidad de comunicación 140 o bien que el usuario ingrese por anticipado la información de ubicación geográfica en el aparato de despliegue 100.
Tal como se describió anteriormente, si el comando de voz correspondiente al dialogo del usuario incluye una palabra clave relacionada con el distintivo de llamada, el aparato de despliegue 100 selecciona el distintivo de llamada recomendado correspondiente a la palabra clave y ejecuta una operación correspondiente de acuerdo con el comando de voz con respecto al canal de transmisión del distintivo de llamada recomendado seleccionado.
La figura 7 ilustra un ejemplo de un proceso de interacción de un aparato de despliegue 100 y servidores 20 y 30 de acuerdo con una segunda modalidad ejemplar.
Tal como ahi se muestra, al momento de recibir una entrada de un dialogo del usuario (700), el aparato de despliegue 100 transmite la señal de voz del dialogo al servidor STT 20 (710).
El servidor STT 20 convierte la señal de voz recibida en un comando de voz (720). Las operaciones 700 a 720 son las mismas que aquellas en la figura 4.
El servidor STT 20 transmite el comando de voz al servidor de conversación 30 (730).
El servidor de conversación 30 ejecuta el proceso de análisis del distintivo de llamada tal como la búsqueda de candidatos de distintivos de llamada, y la selección del distintivo de llamada recomendado (740). La descripción detallada puede ser similar a aquellas de la modalidad ejemplar anterior, y no se proporcionará nuevamente. Sin embargo, el proceso de análisis del distintivo de llamada, de acuerdo con la presente modalidad ejemplar, es ejecutado extrayendo una palabra del distintivo de llamada desde un comando de voz a través del servidor de conversación 30 a diferencia del caso en la figura 4.
El servidor de conversación 30 transmite el distintivo de llamada recomendado y una señal de control que ordena una operación correspondiente al aparato de despliegue 100, el cual opera de acuerdo con la señal de control (750).
En la modalidad ejemplar anterior, se ha explicado la configuración para convertir el dialogo del usuario ingresado al aparato de despliegue 100 en el comando de voz a través del servidor STT 20 y procesar la oración corta como el comando de voz, a través del aparato de despliegue 100 y procesar la oración de conversación como el comando de voz, a través del servidor de conversación 30.
Sin embargo, el concepto de la presente invención no se limita a lo anterior y la configuración para convertir el diálogo en el comando de voz y la configuración referente al tema que procesa el comando de voz dependiendo si el comando de voz es una oración corta o una oración de conversación puede ser diferente de la modalidad ejemplar anterior.
La figura 8 es un diagrama en bloques que muestra una estructura de interacción de un aparato de despliegue 100a y un servidor 40 de acuerdo con una tercera modalidad ejemplar. La figura 9 ilustra un ejemplo de un proceso de interacción entre el aparato de despliegue 100a y el servidor 40 en la figura 8.
Tal como se muestra en la figura 8, el aparato de despliegue 100a incluye una unidad de comunicación 140a, una unidad de entrada de voz 160a, un procesador de voz 170a y un controlador 190a.
El procesador de voz 170a incluye un convertidor STT 171a que convierte un dialogo transmitido por la unidad de entrada de voz 160a en un comando de voz, y un procesador de comando de oración corta 172a que procesa el comando de voz en caso que el comando de voz sea una oración corta.
Si se ingresa un dialogo del usuario, la unidad de entrada de voz 160a transmite una señal de voz del dialogo de entrada al convertidor STT 171a. El convertidor STT 171a analiza la señal de voz transmitida por la unidad de entrada de voz 160a, y convierte la señal de voz en un comando de voz incluyendo el contenido de la voz. El convertidor STT 17a transmite el comando de voz convertido al controlador 190a. Es decir, el convertidor STT 171a ejecuta una función del servidor STT 20 en la primera modalidad ejemplar.
El controlador 190a determina si el comando de voz es una oración corta o una oración de conversación. Si el comando de voz es una oración corta, el controlador 190a transmite el comando de voz al procesador de comando de oración corta 172a. El procesador de comando de oración corta 172a analiza el comando de voz mediante un control del controlador 190a, y ejecuta una operación correspondiente de acuerdo con los resultados del análisis. El análisis y la ejecución del comando de voz pueden emplear la modalidad ejemplar anterior y se omitirá la descripción detallada.
Si el comando de voz es un oración de conversación, el controlador 190a transmite el comando de voz al servidor de conversación 40 a través de unidad de comunicación 140a en lugar de transmitirlo al procesador de comando de oración corta 172a. El servidor de conversación 20 ejecuta la misma función que el servidor de conversación 30 de acuerdo con la primera modalidad ejemplar.
El aparato de despliegue 100a ejecuta una operación correspondiente a la señal de control trasmitida por el servidor de conversación 20.
Tal como se muestra en la figura 9, el aparato de despliegue 100a está conectado al servidor de conversación 40 para comunicación. Si se ingresa (810) un dialogo de usuario, el aparato de despliegue 100a determina si un comando de voz correspondiente al dialogo es una oración corta o una oración de conversación (820). Si de determina que el comando de voz es una oración de conversación, el aparato de despliegue 100a transmite el comando de voz al servidor de conversación 40 (830).
Al momento de recibir un comando de voz desde el aparato de despliegue 100 (910), el servidor de conversación 40 extrae la palabra clave relacionada con el distintivo de llamada, desde el comando de voz (920).
De otra manera, la palabra clave relacionada con el distintivo de llamada puede ser extraída mediante el aparato de despliegue 100a en lugar de hacerlo mediante el servidor de conversación 40. En este caso, el aparato de despliegue 100a transmite la palabra clave relacionada con el distintivo de llamada junto con el comando de voz, al servidor de conversación 40.
El servidor de conversación 40 busca el candidato del distintivo de llamada correspondiente a la palabra clave (930). Si se encuentra una pluralidad de candidatos de distintivos de llamada, el servidor de conversación 40 selecciona un distintivo de llamada de entre la pluralidad de candidatos de distintivos de llamada buscados como un distintivo de llamada recomendado, bajo las condiciones de selección que se describieron anteriormente (940). El servidor de conversación 40 analiza el comando de voz y determina una operación correspondiente bajo el comando de voz.
El servidor de conversación 40 transmite el distintivo de llamada recomendado y una señal de control que ordena la operación correspondiente, al aparato de despliegue 100a (950).
El aparato de despliegue 100a ejecuta la operación correspondiente con respecto a la señal de transmisión del distintivo de llamada recomendado, de acuerdo con la señal de control transmitida por el servidor de conversación 40 (840).
Si se determina que el comando de voz es una oración corta en la operación 820, el aparato de despliegue 100 analiza el distintivo de llamada recomendado y la operación correspondiente.
La figura 10 es un diagrama en bloques que muestra una estructura de transmisión de señal de un procesador de voz 171b de un aparato de despliegue 100b de acuerdo con una cuarta modalidad ejemplar.
Tal como ahí se muestra, el procesador de voz 170b incluye un convertidor STT 171b que convierte el dialogo de un usuario transmitido por la unidad de entrada de voz 160b en un comando de voz, un procesador de comando de oración corta 172b que procesa un comando de voz en caso que el comando de voz convertido por el convertidor STT 171b sea una oración corta, y un procesador de comando de conversación 173b que procesa un comando de voz convertido por el convertidor STT 171b en caso que el comando de voz sea una oración de conversación/lenguaje natural. La estructura del procesador de voz 170b no se limita al ejemplo anterior, y el presente ejemplo explica brevemente los puntos directamente relacionados con la presente modalidad ejemplar.
Si se ingresa un dialogo de usuario, la unidad de entrada de voz 160b transmite una señal de voz del dialogo de entrada al convertidos STT 171b. El convertidor STT 171b convierte el dialogo transmitido por la unidad de entrada de voz 160b, en un comando de voz incluyendo el contenido del dialogo. El convertidor STT 171b transmite el comando de voz convertido al controlador 190b.
El controlador 190b determina si el comando de voz es una oración corta o una oración de conversación. La determinación anterior se puede realizar mediante diversos algoritmos .
Si el comando de voz es una oración corta, el controlador 190b transmite el comando de voz al procesador de comando de oración corta 172b. Si el comando de voz es una oración de conversación, el controlador 190b transmite el comando de voz al procesador de comando de conversación 173b.
El procesador de comando de oración corta 172b ejecuta sustancialmente la misma función que el procesador de comando de oración corta 172b en la figura 8. El procesador del comando de conversación 173b ejecuta la función realizada por los servidores de conversación 30 y 40 de acuerdo con las modalidades anteriores.
Es decir, a diferencia de las modalidades ejemplares anteriores, el aparato de despliegue 100b de acuerdo con la presente modalidad ejemplar puede convertir el comando de voz del dialogo del usuario y analizar la operación correspondiente al comando de voz en lugar de intercambiar datos y/o señales con los servidores externos 20 a 40.
Si el aparato de despliegue está conectado a un servidor adicional que ejecuta el proceso del análisis del distintivo de llamada, el procesador de comandos de oración corta 172a o el procesador de comandos de conversación 173b puede trasmitir la palabra clave y el comando de voz al servidor, el cual ejecuta el proceso de análisis del distintivo de llamada.
Es decir, en las modalidades ejemplares anteriores, los servidores de conversación 30 y 40 o los procesadores de voz 170, 170a y 170b ejecutan el proceso del análisis de distintivo de llamada, pero el proceso de análisis del distintivo de llamada de otra manera puede ser ejecutado por un servidor adicional.
Aunque se han mostrado y descrito unas pocas modalidades ejemplares, aquellos expertos en la téenica apreciarán que se pueden realizar cambios a estas modalidades ejemplares sin apartarse de los principios y espíritu de la invención, cuyo rango queda definido en las reivindicaciones anexas y sus equivalentes. Además, aquellos expertos en la técnica apreciarán que todas las unidades antes mencionadas se pueden implementar en hardware.

Claims (15)

REIVINDICACIONES
1. Un aparato de procesamiento de imagen que comprende : un procesador de imagen que procesa una señal de transmisión recibida desde el exterior para desplegar una imagen con base en la señal de transmisión procesada; un comunicador que opera para comunicarse con un servidor; un receptor de voz que recibe un dialogo del usuario; un procesador de voz que opera para procesar un desempeño de una operación de acuerdo con un comando de voz correspondiente al dialogo del usuario; y un controlador que procesa el comando de voz correspondiente al dialogo del usuario a través de uno del procesador de voz y el servidor en caso que el dialogo sea recibido a través del receptor de voz, en donde si el comando de voz comprende una palabra clave relacionada con un distintivo de llamada deseado de un canal de transmisión, el controlador controla uno del procesador de voz y el servidor para seleccionar un distintivo de llamada correspondiente a la palabra clave de acuerdo con una condición de selección predeterminada, como un distintivo de llamada recomendado, y ejecuta una operación de acuerdo con el comando de voz con respecto al canal de transmisión del distintivo de llamada recomendado.
2. El aparato de procesamiento de imagen de conformidad con la reivindicación 1, caracterizado porque una base de datos que incluye una pluralidad de candidatos de distintivos de llamada correspondientes a las palabras clave está almacenada en el aparato de procesamiento de imagen y el servidor, y el distintivo de llamada recomendado es seleccionado a partir de la pluralidad de candidatos de distintivos de llamada en la base de datos, bajo la condición de selección predeterminada.
3. El aparato de procesamiento de imagen de conformidad con la reivindicación 2, caracterizado porque la condición de selección predeterminada comprende la selección de un candidato de distintivo de llamada, como el distintivo de llamada recomendado, con base en una frecuencia de selección del candidato de distintivo de llamada que es igual a o mayor que un rango preestablecido, entre la pluralidad de candidatos de distintivos de llamada.
4. El aparato de procesamiento de imagen de conformidad con la reivindicación 2, caracterizado porque la condición de selección predeterminada comprende la selección del candidato de distintivo de llamada, como el distintivo de llamada recomendado, con base en una frecuencia de selección del candidato de distintivo de llamada que es igual o mayor que un rango preestablecido, la frecuencia de selección se realiza a partir de una pluralidad de otros aparatos de procesamiento de imagen que se comunican con el servidor, entre la pluralidad de candidatos de distintivos de llamada.
5. El aparato de procesamiento de imagen de conformidad con la reivindicación 2, caracterizado porque el distintivo de llamada recomendado es uno o más seleccionados de entre la pluralidad de candidatos de distintivos de llamada, y el controlador despliega una interfaz de usuario (UI) que es proporcionada para seleccionar uno de una pluralidad de candidatos de distintivos de llamada en caso que se seleccione la pluralidad de candidatos de distintivos de llamada.
6. El aparato de procesamiento de imagen de conformidad con la reivindicación 5, caracterizado porque si uno de uno o más candidatos recomendados de distintivos de llamada no es seleccionado por un tiempo preestablecido después de se despliega la UI, el controlador selecciona uno de entre uno o más candidatos recomendados de distintivos de llamada bajo la condición de selección predeterminada.
7. El aparato de procesamiento de imagen de conformidad con la reivindicación 1, caracterizado porque la unidad de comunicación se comunica con un servidor de voz-a-texto (STT) que convierte el dialogo del usuario en un comando de voz de un texto, y al momento de ingresar el dialogo del usuario al receptor de voz, el controlador transmite una señal de voz del dialogo del usuario al servidor STT, y recibe el comando de voz correspondiente al dialogo del usuario desde el servidor STT.
8. El aparato de procesamiento de imagen de conformidad con la reivindicación 7, caracterizado porque si el comando de voz es una oración corta, el controlador controla el procesador de voz para procesar el comando de voz, y si el comando de voz es una oración de conversación, el controlador controla el servidor para procesar el comando de voz.
9. El aparato de procesamiento de imagen de conformidad con la reivindicación 1, que además comprende una pantalla que despliega una imagen en la misma con base en una señal de transmisión procesada por el procesador de imagen.
10. Un método de control de un aparato de procesamiento de imagen que se comunica con un servidor, el método comprende: recibir un dialogo del usuario; y procesar un comando de voz correspondiente al dialogo del usuario a través de uno del aparato de procesamiento de imagen y el servidor, y ejecutar una operación de acuerdo con el comando de voz, en donde la ejecución de la operación de acuerdo con el comando de voz incluye controlar la selección de un distintivo de llamada comprende: controlar para seleccionar un distintivo de llamada correspondiente a una palabra clave, como un distintivo de llamada recomendado, a través de uno del aparato de procesamiento de imagen y el servidor bajo una condición de selección preestablecida en caso que el comando de voz comprenda una palabra clave relacionada con un distintivo de llamada de un canal de transmisión; y ejecutar una operación de acuerdo con el comando de voz con respecto a un canal de transmisión del distintivo de llamada recomendado.
11. El método de control de conformidad con la reivindicación 10, caracterizado porque una base de datos que incluye una pluralidad de candidatos de distintivos de llamada correspondientes a palabras clave está almacenada en el aparato de procesamiento de imagen y el servidor, y el distintivo de llamada recomendado es seleccionado de entre la pluralidad de candidatos de distintivos de llamada en la base de datos, bajo la condición de selección preestablecida.
12. El método de control de conformidad con la reivindicación 11, caracterizado porque la condición de selección preestablecida comprende la selección del candidato de distintivo de llamada, como el distintivo de llamada recomendado, con base en una frecuencia de selección del candidato de distintivo de llamada que es igual o mayor que un rango preestablecido, entre la pluralidad de candidatos de distintivos de llamada.
13. El método de control de conformidad con la reivindicación 11, caracterizado porque la condición de selección preestablecida comprende la selección del candidato de distintivo de llamada, como el distintivo de llamada recomendado, con base en la frecuencia de selección del candidato de distintivo de llamada que es igual o mayor que un rango preestablecido, la frecuencia de selección es a partir de una pluralidad de otros aparatos de procesamiento de imagen que se comunican con el servidor, entre la pluralidad de candidatos de distintivo de llamada.
14. El método de control de conformidad con la reivindicación 11, caracterizado porque el distintivo de llamada recomendado es uno o más seleccionados de entre la pluralidad de candidatos de distintivos de llamada, y la ejecución de una operación correspondiente comprende desplegar una interfaz de usuario (UI) que es proporcionada para seleccionar uno de una pluralidad de candidatos seleccionados de distintivos de llamada en caso que se seleccione la pluralidad de candidatos de distintivos de llamada.
15. El método de control de conformidad con la reivindicación 14, caracterizado porque el despliegue de la UI comprende seleccionar uno de uno o más distintivos de llamada recomendados bajo la condición de selección preestablecida en caso que uno o más candidatos recomendados de distintivos de llamada no sea seleccionado por un tiempo preestablecido después que se despliega la UI.
MX2015003890A 2012-09-28 2013-01-18 Aparato de procesamiento de imágenes y método de control del mismo y sistema de procesamiento de imágenes. MX341560B (es)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
KR20120109454 2012-09-28
KR1020120115783A KR20140039946A (ko) 2012-09-28 2012-10-18 영상처리장치 및 그 제어방법, 영상처리 시스템
PCT/KR2013/000440 WO2014051219A1 (en) 2012-09-28 2013-01-18 Image processing apparatus and control method thereof and image processing system

Publications (2)

Publication Number Publication Date
MX2015003890A true MX2015003890A (es) 2015-07-06
MX341560B MX341560B (es) 2016-08-25

Family

ID=50650455

Family Applications (1)

Application Number Title Priority Date Filing Date
MX2015003890A MX341560B (es) 2012-09-28 2013-01-18 Aparato de procesamiento de imágenes y método de control del mismo y sistema de procesamiento de imágenes.

Country Status (5)

Country Link
JP (2) JP2022008691A (es)
KR (2) KR20140039946A (es)
BR (1) BR102013002349A2 (es)
MX (1) MX341560B (es)
RU (1) RU2571520C2 (es)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9922648B2 (en) * 2016-03-01 2018-03-20 Google Llc Developer voice actions system
JP6801539B2 (ja) * 2017-03-17 2020-12-16 株式会社リコー 情報処理システム、情報処理装置、情報処理プログラム及び情報処理方法

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6757718B1 (en) * 1999-01-05 2004-06-29 Sri International Mobile navigation of network-based electronic information using spoken input
JP2005249829A (ja) * 2004-03-01 2005-09-15 Advanced Media Inc 音声認識を行うコンピュータネットワークシステム
JP2007142840A (ja) * 2005-11-18 2007-06-07 Canon Inc 情報処理装置及び情報処理方法
KR20070087910A (ko) * 2006-02-01 2007-08-29 삼성전자주식회사 음성 인식을 이용한 데이터 방송 컨텐츠 제어 장치 및 그방법
JP5771002B2 (ja) * 2010-12-22 2015-08-26 株式会社東芝 音声認識装置、音声認識方法および音声認識装置を搭載したテレビ受像機

Also Published As

Publication number Publication date
RU2571520C2 (ru) 2015-12-20
BR102013002349A2 (pt) 2014-07-08
JP2014149548A (ja) 2014-08-21
JP2022008691A (ja) 2022-01-14
KR20140042637A (ko) 2014-04-07
RU2013103490A (ru) 2014-07-27
KR20140039946A (ko) 2014-04-02
KR101877430B1 (ko) 2018-07-12
MX341560B (es) 2016-08-25

Similar Documents

Publication Publication Date Title
US8838456B2 (en) Image processing apparatus and control method thereof and image processing system
US11854570B2 (en) Electronic device providing response to voice input, and method and computer readable medium thereof
US10009645B2 (en) Electronic device and method for controlling the same
US20140122089A1 (en) Image processing apparatus and control method thereof and image processing system
US20130041665A1 (en) Electronic Device and Method of Controlling the Same
US10140985B2 (en) Server for processing speech, control method thereof, image processing apparatus, and control method thereof
CN112163086B (zh) 多意图的识别方法、显示设备
KR20150089145A (ko) 음성 제어를 수행하는 디스플레이 장치 및 그 음성 제어 방법
US20130041666A1 (en) Voice recognition apparatus, voice recognition server, voice recognition system and voice recognition method
CN107155121B (zh) 语音控制文本的显示方法及装置
KR102210933B1 (ko) 음성 신호에 따라 컨텐츠 정보를 검색하여 제공하는 디스플레이 장치, 서버 장치 및 이들을 포함하는 음성 입력 시스템과, 그 방법들
CN110992937A (zh) 语言离线识别方法、终端及可读存储介质
CN114155855A (zh) 语音识别方法、服务器以及电子设备
KR102594022B1 (ko) 전자 장치 및 그의 채널맵 업데이트 방법
MX2015003890A (es) Aparato de procesamiento de imagenes y metodo de control del mismo y sistema de procesamiento de imagenes.
KR102175135B1 (ko) 서버 및 그 제어방법과, 영상처리장치 및 그 제어방법
CN114627864A (zh) 显示设备与语音交互方法
US20230119195A1 (en) Display apparatus
KR20200126357A (ko) 서버 및 그 제어방법과, 영상처리장치 및 그 제어방법
CN117809633A (zh) 显示设备和意图识别方法

Legal Events

Date Code Title Description
FG Grant or registration