DE202012104833U1 - Image processing apparatus and image processing system - Google Patents
Image processing apparatus and image processing system Download PDFInfo
- Publication number
- DE202012104833U1 DE202012104833U1 DE202012104833U DE202012104833U DE202012104833U1 DE 202012104833 U1 DE202012104833 U1 DE 202012104833U1 DE 202012104833 U DE202012104833 U DE 202012104833U DE 202012104833 U DE202012104833 U DE 202012104833U DE 202012104833 U1 DE202012104833 U1 DE 202012104833U1
- Authority
- DE
- Germany
- Prior art keywords
- utterance
- voice command
- voice
- user
- image processing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/41—Structure of client; Structure of client peripherals
- H04N21/422—Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS]
- H04N21/4227—Providing Remote input by a user located remotely from the client device, e.g. at work
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/41—Structure of client; Structure of client peripherals
- H04N21/422—Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS]
- H04N21/42203—Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS] sound input device, e.g. microphone
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/439—Processing of audio elementary streams
- H04N21/4394—Processing of audio elementary streams involving operations for analysing the audio stream, e.g. detecting features or characteristics in audio streams
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/47—End-user applications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/47—End-user applications
- H04N21/482—End-user interface for program selection
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/47—End-user applications
- H04N21/485—End-user interface for client configuration
- H04N21/4852—End-user interface for client configuration for modifying audio parameters, e.g. switching between mono and stereo
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
Abstract
Bildverarbeitungsvorrichtung (100), die umfasst: einen Bildprozessor (120), der ein Bildsignal verarbeiten kann, um auf der Grundlage des verarbeiteten Bildsignals ein Bild anzuzeigen; eine Spracheingabeeinheit (160), die eine Sprachäußerung eines Nutzers empfangen kann; einen Sprachprozessor (170), der in Übereinstimmung mit einem der Sprachäußerung entsprechenden Sprachbefehl eine entsprechende im Voraus festgelegte Operation ausführen kann; und eine Steuereinrichtung (190), die die entsprechende Operation des Sprachbefehls anpassen kann, falls die in die Spracheingabeeinheit (160) eingegebene Sprachäußerung nicht zu der entsprechenden Operation durch den Sprachprozessor (170) passt, und die in Übereinstimmung mit dem Anpassungsergebnis die entsprechende Operation ausführen kann, die zu der Sprachäußerung passt.Image processing apparatus (100) comprising: an image processor (120) capable of processing an image signal to display an image based on the processed image signal; a voice input unit (160) that can receive a voice utterance of a user; a voice processor (170) capable of executing a corresponding predetermined operation in accordance with a voice command corresponding to the voice utterance; and a controller (190) that can adjust the corresponding operation of the voice command if the voice utterance input to the voice input unit (160) does not match the corresponding operation by the voice processor (170) and execute the corresponding operation in accordance with the matching result can, which fits the speech.
Description
Die Erfindung betrifft das Gebiet der Bildverarbeitungsvorrichtungen und der Bildverarbeitungssysteme, die ein Bildsignal wie etwa ein von außen zugeführtes Rundfunksignal verarbeiten können, um auf der Grundlage des verarbeiteten Bildsignals ein Bild anzuzeigen, und insbesondere eine Bildverarbeitungsvorrichtung und ein Bildverarbeitungssystem, die einen Sprachbefehl eines Nutzers erkennen können, um eine dem Sprachbefehl entsprechende Funktion oder Operation auszuführen.The present invention relates to the field of image processing apparatuses and image processing systems which can process an image signal such as an externally supplied broadcast signal to display an image based on the processed image signal, and more particularly to an image processing apparatus and an image processing system which can recognize a voice command of a user to perform a function or operation corresponding to the voice command.
Die Anmeldung beansprucht die Priorität der Anmeldung
Eine Bildverarbeitungsvorrichtung verarbeitet Bildsignale bzw. Bilddaten, die von außen zugeführt werden, in Übereinstimmung mit verschiedenen Bildverarbeitungsoperationen. Die Bildverarbeitungsvorrichtung kann auf der Grundlage des verarbeiteten Bildsignals ein Bild auf ihrem Anzeigebildschirm anzeigen oder kann das verarbeitete Bildsignal an eine andere Anzeigevorrichtung mit einem Bildschirm ausgeben, damit diese auf der Grundlage des verarbeiteten Bildsignals darauf ein Bild anzeigt. Das heißt, solange die Bildverarbeitungsvorrichtung das Bildsignal verarbeiten kann, kann sie einen oder keinen Bildschirm zum Anzeigen des Bilds enthalten. Der erstere Fall ist in einem Fernsehgerät, der Letztere dagegen in einer Set-Top-Box implementiert.An image processing apparatus processes image signals supplied from the outside in accordance with various image processing operations. The image processing device may display an image on its display screen based on the processed image signal or may output the processed image signal to another display device having a screen to display an image thereon based on the processed image signal. That is, as long as the image processing device can process the image signal, it may include one or no screen for displaying the image. The former case is in a television set, whereas the latter is implemented in a set-top box.
Zu der Bildverarbeitungsvorrichtung werden ständig neue Funktionen hinzugefügt und bestehende Funktionen entsprechend der technologischen Entwicklung erweitert. In diesem Trend werden verschiedene Konfigurationen und Verfahren geschaffen, um wunschgemäß Nutzerbefehle in die Bildverarbeitungsvorrichtung einzugeben. Falls ein Nutzer z. B. in einer herkömmlichen Bildverarbeitungsvorrichtung eine Taste bzw. eine Schaltfläche auf einer Fernbedienung niederdrückt, wird ein Steuersignal an die Bildverarbeitungsvorrichtung gesendet, um eine von dem Nutzer gewünschte Operation auszuführen. In den letzten Jahren detektiert die Bildverarbeitungsvorrichtung dagegen die Bewegung oder Sprachäußerung eines Nutzers, analysiert sie den detektierten Inhalt und führt sie eine entsprechende Operation aus und wird dadurch entsprechend der Absicht eines Nutzers gesteuert.New functions are constantly added to the image processing apparatus and existing functions are expanded according to technological development. In this trend, various configurations and methods are provided for entering user commands into the image processing device as desired. If a user z. For example, in a conventional image processing apparatus, when a button on a remote control is depressed, a control signal is sent to the image processing apparatus to perform an operation desired by the user. In recent years, on the other hand, the image processing apparatus detects the motion or speech of a user, analyzes the detected content, and performs a corresponding operation, thereby being controlled according to a user's intention.
Der Erfindung liegt daher die Aufgabe zugrunde, eine Bildverarbeitungsvorrichtung zu schaffen, bei der die Zeit zur Erkennung eines Nutzerbefehls und zum Ausführen einer Operation minimiert sein kann.The invention is therefore based on the object to provide an image processing apparatus in which the time to recognize a user command and to perform an operation can be minimized.
Diese Aufgabe wird erfindungsgemäß gelöst durch eine Bildverarbeitungsvorrichtung nach Anspruch 1. Vorteilhafte Weiterbildungen der Erfindung sind in den abhängigen Ansprüchen angegeben.This object is achieved by an image processing apparatus according to
Ein Steuerverfahren einer Bildverarbeitungsvorrichtung kann Folgendes enthalten: Empfangen einer Sprachäußerung eines Nutzers, Ausführen einer in Voraus festgelegten Operation gemäß einem der Sprachäußerung entsprechenden Sprachbefehl; und Anpassen der entsprechenden Operation des Sprachbefehls, falls die entsprechende Operation nicht zu der Sprachäußerung passt, und Einstellen zum Ausführen der entsprechenden Operation, die zu der Sprachäußerung passt, in Übereinstimmung mit dem Anpassungsergebnis.A control method of an image processing apparatus may include: receiving a voice utterance of a user, executing a predetermined operation in accordance with a voice command corresponding to the utterance; and adjusting the corresponding operation of the voice command if the corresponding operation does not match the utterance, and setting to execute the corresponding operation that matches the utterance in accordance with the adjustment result.
Das Einstellen kann das Bereitstellen einer UI zum Anpassen eines Bestimmungszustands der entsprechenden Operation in Bezug auf den Sprachbefehl und das Einstellen zum Ausführen der zweiten Operation beim Empfang der Sprachäußerung, falls die entsprechende für einen Sprachbefehl einer vorgegebenen Sprachäußerung bestimmte Operation durch die UI von einer ersten Operation zu einer zweiten Operation angepasst wird, enthalten.The setting may include providing a UI for adjusting a determination state of the corresponding operation with respect to the voice command and setting for executing the second operation in receiving the utterance if the corresponding operation for a voice command of a given voice utterance by the UI of a first operation is adapted to a second operation.
Die UI kann einen Nutzer zum Sprechen führen und die Einstellung kann das Auswählen einer der mehreren im Voraus festgelegten Operationen als die zweite Operation entsprechend dem Sprachbefehl der Sprachäußerung durch die UI, falls die Sprachäußerung durch die Führung der UI eingegeben wird, enthalten.The UI may guide a user to speak and the setting may include selecting one of the plurality of predetermined operations as the second operation corresponding to the voice command of the utterance by the UI if the utterance is input by the guidance of the UI.
Die UI kann einen Nutzer zum Betätigen mehrerer in eine Nutzereingabeeinheit der Bildverarbeitungsvorrichtung integrierter Eingabeschaltflächen führen und das Einstellen kann das Auswählen einer im Voraus bestimmten Operation der mehreren im Voraus festgelegten Operationen für die durch die Führung betätigte Eingabeschaltfläche als die zweite Operation enthalten.The UI may guide a user to operate a plurality of input buttons integrated in a user input unit of the image processing device, and the setting may include selecting a predetermined operation of the plurality of predetermined operations for the guide-operated input button as the second operation.
Die UI kann eine Liste der mehreren im Voraus festgelegten Operationen enthalten und das Einstellen kann das Auswählen der aus der Liste ausgewählten Operation als die zweite Operation enthalten.The UI may include a list of the plurality of pre-determined operations, and the setting may include selecting the operation selected from the list as the second operation.
Die UI kann zum Einstellen einer Makroanweisung für das aufeinanderfolgende Ausführen der mehreren Sprachäußerungen und der den mehreren Sprachäußerungen entsprechen mehreren Operationen durch die Sprachäußerung bereitgestellt werden.The UI may be provided for setting a macro-instruction for successively executing the plurality of utterances and the plurality of operations corresponding to the plurality of utterances by the utterance.
Ferner kann das Steuerverfahren das Ausführen der Makroanweisung enthalten, falls die einer ersten Operation der mehreren in der Makroanweisung enthaltenen im Voraus festgelegten Operationen entsprechende Sprachäußerung eingegeben wird.Further, the control method may include executing the macroinstruction in case that of a first operation of the plurality of predetermined ones included in the macroinstruction Operations corresponding voice utterance is entered.
Die Bildverarbeitungsvorrichtung kann mit einem Server kommunizieren und das Ausführen der im Voraus festgelegten entsprechenden Operation kann das Verarbeiten des der Sprachäußerung entsprechenden Sprachbefehls durch die Bildverarbeitungsvorrichtung oder durch den Server enthalten.The image processing apparatus may communicate with a server, and performing the predetermined operation in advance may include processing the voice command corresponding voice command by the image processing apparatus or by the server.
Die Bildverarbeitungsvorrichtung kann mit einem STT-Server kommunizieren, der die Sprachäußerung in den Sprachbefehl eines Texts umsetzt, und das Eingeben der Sprachäußerung des Nutzers kann das Senden eines Sprachsignals der Sprachäußerung an den STT-Server und das Empfangen des der Sprachäußerung entsprechenden Sprachbefehls von dem STT-Server enthalten.The image processing device may communicate with an STT server that translates the utterance into the voice command of a text, and inputting the user's utterance may include sending a voice signal of the utterance to the STT server and receiving the voice command corresponding to the utterance from the STT Server included.
Das Steuern kann das Steuern der Bildverarbeitungsvorrichtung zum Verarbeiten des Sprachbefehls, falls der Sprachbefehl ein Kurzsatz ist, und das Steuern des Servers zum Verarbeiten des Sprachbefehls, falls der Sprachbefehl ein Gesprächssatz ist, enthalten.The controlling may include controlling the image processing device to process the voice command if the voice command is a short sentence, and controlling the server to process the voice command if the voice command is a conversation sentence.
Ein Bildverarbeitungssystem enthält Folgendes: eine Bildverarbeitungsvorrichtung, die ein Bildsignal zum Anzeigen eines Bilds auf der Grundlage des verarbeiteten Bildsignals verarbeiten kann; einen Server, der mit der Bildverarbeitungsvorrichtung kommunizieren kann, wobei die Bildverarbeitungsvorrichtung eine Spracheingabeeinheit enthält, die eine Sprachäußerung eines Nutzers empfangen kann; einen Sprachprozessor, der gemäß einem der Sprachäußerung entsprechenden Sprachbefehl eine entsprechende im Voraus festgelegte Operation ausführen kann; und eine Steuereinrichtung, die den Sprachprozessor oder den Server zum Verarbeiten des der Sprachäußerung entsprechenden Sprachbefehls steuern kann, falls die Sprachäußerung über die Spracheingabeeinheit eingegeben wird, wobei die Steuereinrichtung die entsprechende Operation des Sprachbefehls anpassen kann, falls die entsprechende Operation des Sprachprozessors nicht zu der Spracheingabe in die Spracheingabeeinheit passt, und in Übereinstimmung mit dem Anpassungsergebnis die entsprechende zu der Sprachäußerung passende Operation ausführen kann.An image processing system includes: an image processing device that can process an image signal for displaying an image based on the processed image signal; a server capable of communicating with the image processing device, the image processing device including a voice input unit that can receive a voice utterance of a user; a voice processor capable of executing a corresponding predetermined operation according to a voice command corresponding to the utterance; and a controller that can control the voice processor or the server to process the voice command corresponding to the voice utterance if the voice utterance is input through the voice input unit, wherein the controller can adjust the corresponding operation of the voice command if the corresponding operation of the voice processor does not correspond to the voice input fits into the speech input unit and, in accordance with the fitting result, can perform the corresponding operation matching the utterance.
Weitere Merkmale und Vorteile der Erfindung werden deutlich beim Lesen der folgenden Beschreibung bevorzugter Ausführungsformen, die auf die Zeichnungen Bezug nimmt; es zeigen:Other features and advantages of the invention will become apparent upon reading the following description of preferred embodiments, which refers to the drawings; show it:
Im Folgenden sind anhand der beigefügten Zeichnungen beispielhafte Ausführungsformen ausführlich beschrieben, sodass sie vom Durchschnittsfachmann auf dem Gebiet leicht verwirklicht werden können. Die beispielhaften Ausführungsformen können in verschiedenen Formen verkörpert werden und sind nicht auf die im Folgenden dargelegten beispielhaften Ausführungsformen beschränkt. Beschreibungen gut bekannter Teile sind der Klarheit halber weggelassen und gleiche Bezugszeichen beziehen sich überall auf gleiche Elemente.Hereinafter, exemplary embodiments will be described in detail with reference to the accompanying drawings so that they can be easily realized by one of ordinary skill in the art. The exemplary embodiments may be embodied in various forms and are not limited to the exemplary embodiments set forth below. Descriptions of well-known parts have been omitted for the sake of clarity, and like reference numerals refer to like elements throughout.
Die folgenden Ausführungsformen erläutern die Bildverarbeitungsvorrichtung
Wie in
Die Anzeigevorrichtung
Der Bildempfänger
Der Bildprozessor
Die Bildverarbeitungsoperation des Bildprozessors
Der Bildprozessor
Die Anzeigeeinheit
Ferner kann die Anzeigeeinheit
Die Kommunikationseinheit
Die Nutzereingabeeinheit
Die Spracheingabeeinheit
Ausgehend von den verschiedenen im Voraus festgelegten von der Anzeigevorrichtung
Falls eine Sprachäußerung bzw. Schall in die Spracheingabeeinheit
Falls bestimmt wird, dass eine Sprachäußerung eines Nutzers eingegeben worden ist, kann der Sprachprozessor
In der vorliegenden Ausführungsform sind der Sprachprozessor
In der Ablageeinheit
Beim Empfang einer Sprachäußerung eines Nutzers über die Spracheingabeeinheit
Wie darin gezeigt ist, enthält die Anzeigevorrichtung
Beim Empfang eines Sprachsignals kann der STT-Server
Der Gesprächsserver
Falls eine Sprachäußerung eines Nutzers in die Spracheingabeeinheit
Die Steuereinrichtung
Falls der Sprachbefehl ein Kurzsatz ist, kann der Sprachprozessor
Falls der Sprachbefehl ein Gesprächssatz ist, kann die Steuereinrichtung
Daraufhin kann die entsprechende im Voraus festgelegte Operation der Anzeigevorrichtung
Der Prozess zum Auswählen des Verarbeitungsgegenstands des Sprachbefehls je nachdem, ob der Sprachbefehl ein Kurzsatz oder ein Gesprächssatz ist, kann von der Systemlast und von der Verarbeitungsfähigkeit der Anzeigevorrichtung
Diese Konfiguration kann variieren, wobei der Prozess des STT-Servers
Bei der vorstehenden Konfiguration steuert die Steuereinrichtung
Wie darin gezeigt ist, ist in der Ablageeinheit
Die Steuereinrichtung
Die Datenbank
Falls z. B. ein einer Sprachäußerung eines Nutzers entsprechender Sprachbefehl ”Einschalten” lautet, kann die Steuereinrichtung
Daraufhin kann die Steuereinrichtung
Falls ein Nutzer als ein weiteres Beispiel ”Es ist laut” sagt, während ein Bild von der Anzeigevorrichtung
Falls ein Nutzer als ein weiteres Beispiel ”Ich höre nichts” sagt, während von der Anzeigevorrichtung
Durch das vorstehende Verfahren kann die Steuereinrichtung
Da Nutzer verschiedene Sprachgewohnheiten und -strukturen besitzen, kann die vorstehende Konfiguration zum Erkennen eines Sprachbefehls des Nutzers beim Interpretieren aller Sprachäußerungen eines Nutzers durch eine Spracherkennungslogik des STT-Servers
Falls ein Nutzer z. B. ”Einschalten” sagt, kann der STT-Server
Anderenfalls kann der umgesetzte Sprachbefehl in der Datenbank
Angesichts des Vorstehenden kann das folgende Verfahren vorgeschlagen werden:
Falls die in die Spracheingabeeinheit
If in the
Genauer kann die Steuereinrichtung
Falls in einem Anfangszustand, in dem für einen vorgegebenen ersten Befehl eine erste Operation bestimmt worden ist, die dem ersten Befehl entsprechende Operation durch die UI auf eine zweite Operation, die von der ersten Operation verschieden ist, angepasst wird, aktualisiert die Steuereinrichtung
Falls in einem Anfangszustand, bei dem die erste Operation für den ersten Befehl bestimmt wird, für die erste Operation ein zweiter Befehl als ein neuer Sprachbefehl bestimmt worden ist, kann die Steuereinrichtung
Daraufhin kann die Spracherkennungsoperation in der Weise angepasst werden, dass sie mit der Absicht des Nutzers übereinstimmt.Thereupon, the speech recognition operation may be adapted to match the user's intention.
Im Folgenden wird ein Verfahren zum Ändern einer Einstellung eines Sprachbefehls durch eine UI beschrieben.The following describes a method of changing a setting of a voice command by a UI.
Die
Wie in
Die UI
Falls eine Sprachäußerung eines Nutzers über die Spracheingabeeinheit
Wie in
Die UI
Es wird z. B. der Fall betrachtet, dass ein Nutzer ”Einschalten” sagt, während die UI
Da der Einschalter
Als ein weiteres Beispiel wird der Fall betrachtet, dass ein Nutzer einen Sprachbefehl ”Lautstärke verringern” sagt, während die UI
Das heißt, selbst wenn eine Sprachäußerung eines Nutzers in einen Sprachbefehl umgesetzt wird, der sich von dem tatsächlichen Inhalt unterscheidet, kann ein Nutzer die dem Sprachbefehl entsprechende Operation bestimmen oder anpassen, wobei im Ergebnis die zu der Absicht eines Nutzers passende Operation ausgeführt werden kann.That is, even when a user's utterance is converted into a voice command different from the actual content, a user can determine or adjust the operation corresponding to the voice command, and as a result, the operation matching the user's intention can be performed.
Wie in
Das Verfahren zum Anzeigen der Liste in der UI
Während durch das vorstehende Verfahren für die erste Operation in der Datenbank
Allerdings können die erste und die zweite Operation Operationen zum Anpassen der Figurenebene für dieselbe Funktion sein, wobei die Pegelnummer aber verschieden sein kann. However, the first and the second operations may be operations for adjusting the figure level for the same function, but the level number may be different.
Es wird z. B. der Fall betrachtet, in dem ein Sprachbefehl der Sprachäußerung eines Nutzers ”Verringere die Lautstärke” ist und eine entsprechende Operation eine Operation zum Verringern der gegenwärtigen Lautstärke auf einen Pegel 7 ist. Falls der Pegel 7 wie oben erläutert über eine UI auf einen Pegel 5 angepasst wird, aktualisiert die Steuereinrichtung
Falls später die Sprachäußerung eines Nutzers ”Verringere Lautstärke” eingegeben wird, verringert die Steuereinrichtung
Wie oben kann das Aktualisieren der Datenbank
Die Steuereinrichtung
Wie darin gezeigt ist, kann die Steuereinrichtung
Das Implementierungsverfahren der UI kann variieren, wobei die UI z. B. zum aufeinanderfolgenden Auswählen von Operationen aus der Liste verschiedener vorhandener Operationen bereitgestellt werden kann.The implementation method of the UI may vary, with the UI z. B. can be provided for sequentially selecting operations from the list of various existing operations.
Es wird ein Fall betrachtet, in dem ein Nutzer eine Makroanweisung zum automatischen Ausführen einer Schlafzustandsreservierung und einer Alarmeinstellung einstellen kann. In diesem Fall kann die Folge der Operationen das Auswählen
Die Steuereinrichtung
Die
Wie in
Wie in
Die UI
Wie in
Der Nutzer kann ”Fertig” auswählen, um das Einstellen der Makroanweisung abzuschließen, oder kann ”Fortsetzen” auswählen.The user can select "Done" to finish setting the macro statement, or select "Continue".
Falls ein Nutzer wie in
Durch die UI
Wie in
Ein Nutzer kann durch die Nutzereingabeeinheit
Falls die Einstelloperationen abgeschlossen sind, kann die Steuereinrichtung
Falls der Nutzer einen der ersten Operation von der Makroanweisung entsprechenden Sprachbefehl sagt, d. h. den Sprachbefehl ”Schlafzustandsreservierung” sagt, kann die Steuereinrichtung
Wie oben können die mehreren Operationen durch einen einfachen Sprachbefehl des Nutzers aufeinanderfolgend ausgeführt werden.As above, the multiple operations can be performed sequentially by a simple voice command of the user.
Obwohl einige beispielhafte Ausführungsformen gezeigt und beschrieben worden sind, wird der Fachmann auf dem Gebiet würdigen, dass an diesen beispielhaften Ausführungsformen Änderungen vorgenommen werden können, ohne von den Prinzipien und von dem Erfindungsgedanken der Erfindung, deren Umfang in den beigefügten Ansprüchen und ihren Äquivalenten definiert ist, abzuweichen.Although a few exemplary embodiments have been shown and described, it will be appreciated by those skilled in the art that changes may be made to these example embodiments without departing from the principles and spirit of the invention, the scope of which is defined in the appended claims and their equivalents to deviate.
ZITATE ENTHALTEN IN DER BESCHREIBUNG QUOTES INCLUDE IN THE DESCRIPTION
Diese Liste der vom Anmelder aufgeführten Dokumente wurde automatisiert erzeugt und ist ausschließlich zur besseren Information des Lesers aufgenommen. Die Liste ist nicht Bestandteil der deutschen Patent- bzw. Gebrauchsmusteranmeldung. Das DPMA übernimmt keinerlei Haftung für etwaige Fehler oder Auslassungen.This list of the documents listed by the applicant has been generated automatically and is included solely for the better information of the reader. The list is not part of the German patent or utility model application. The DPMA assumes no liability for any errors or omissions.
Zitierte PatentliteraturCited patent literature
- KR 10-2012-0119634 [0002] KR 10-2012-0119634 [0002]
Claims (11)
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020120119634A KR101284594B1 (en) | 2012-10-26 | 2012-10-26 | Image processing apparatus and control method thereof, image processing system |
KR10-2012-0119634 | 2012-10-26 |
Publications (1)
Publication Number | Publication Date |
---|---|
DE202012104833U1 true DE202012104833U1 (en) | 2013-01-30 |
Family
ID=47751802
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE202012104833U Expired - Lifetime DE202012104833U1 (en) | 2012-10-26 | 2012-12-12 | Image processing apparatus and image processing system |
Country Status (8)
Country | Link |
---|---|
US (2) | US20140122088A1 (en) |
EP (1) | EP2725576A1 (en) |
JP (1) | JP2014132370A (en) |
KR (1) | KR101284594B1 (en) |
CN (2) | CN103796053A (en) |
DE (1) | DE202012104833U1 (en) |
FR (1) | FR2997599B3 (en) |
WO (1) | WO2014065467A1 (en) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112243068A (en) * | 2019-07-18 | 2021-01-19 | 柯尼卡美能达株式会社 | Image forming system and image forming apparatus |
Families Citing this family (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102112742B1 (en) * | 2013-01-22 | 2020-05-19 | 삼성전자주식회사 | Electronic apparatus and voice processing method thereof |
KR102155482B1 (en) * | 2013-10-15 | 2020-09-14 | 삼성전자 주식회사 | Display apparatus and control method thereof |
CN104795067B (en) | 2014-01-20 | 2019-08-06 | 华为技术有限公司 | Voice interactive method and device |
JP2016046636A (en) * | 2014-08-21 | 2016-04-04 | 日本電気株式会社 | Operation control device, operation control method and operation control program |
EP3180660B1 (en) * | 2014-09-25 | 2020-09-02 | Siemens Aktiengesellschaft | Method and system for performing a configuration of an automation system |
CN105763929B (en) * | 2016-02-23 | 2018-10-23 | 广州酷狗计算机科技有限公司 | Audio switching method and device |
CN106791370A (en) * | 2016-11-29 | 2017-05-31 | 北京小米移动软件有限公司 | A kind of method and apparatus for shooting photo |
EP3563373B1 (en) * | 2016-12-30 | 2022-11-30 | Harman International Industries, Incorporated | Voice recognition system |
US10424297B1 (en) * | 2017-02-02 | 2019-09-24 | Mitel Networks, Inc. | Voice command processing for conferencing |
CN107248235A (en) * | 2017-05-26 | 2017-10-13 | 黄晓咏 | A kind of voice locker communication system |
CN109584864B (en) * | 2017-09-29 | 2023-11-24 | 上海寒武纪信息科技有限公司 | Image processing apparatus and method |
CN109584862B (en) * | 2017-09-29 | 2024-01-12 | 上海寒武纪信息科技有限公司 | Image processing apparatus and method |
CN108235185A (en) * | 2017-12-14 | 2018-06-29 | 珠海荣邦智能科技有限公司 | Source of sound input client device, remote controler and the system for playing music |
CN109218843B (en) * | 2018-09-27 | 2020-10-23 | 四川长虹电器股份有限公司 | Personalized intelligent voice prompt method based on television equipment |
CN109259800A (en) * | 2018-10-26 | 2019-01-25 | 深圳开立生物医疗科技股份有限公司 | Ultrasonic imaging control system |
JP7263919B2 (en) * | 2019-05-22 | 2023-04-25 | コニカミノルタ株式会社 | Image processing device and program |
KR102165084B1 (en) * | 2020-01-21 | 2020-10-13 | 주식회사 나인위드 | System for providing lucky draw service using intuitive user interface |
CN111597808B (en) * | 2020-04-24 | 2023-07-25 | 北京百度网讯科技有限公司 | Instrument panel drawing processing method and device, electronic equipment and storage medium |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20120119634A (en) | 2011-04-22 | 2012-10-31 | (주)광인사 | Plastic card with stereoscopic pattern |
Family Cites Families (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH07109560B2 (en) * | 1990-11-30 | 1995-11-22 | 富士通テン株式会社 | Voice recognizer |
KR970057020A (en) * | 1995-12-15 | 1997-07-31 | 배순훈 | Television control device by voice recognition |
DE69814181T2 (en) * | 1998-09-22 | 2004-03-04 | Nokia Corp. | METHOD AND DEVICE FOR CONFIGURING A VOICE RECOGNITION SYSTEM |
KR20000042731A (en) * | 1998-12-26 | 2000-07-15 | 전주범 | Channel switching apparatus based on voice recognition of television |
US6327566B1 (en) * | 1999-06-16 | 2001-12-04 | International Business Machines Corporation | Method and apparatus for correcting misinterpreted voice commands in a speech recognition system |
GB2368441A (en) * | 2000-10-26 | 2002-05-01 | Coles Joseph Tidbold | Voice to voice data handling system |
JP4789227B2 (en) * | 2001-04-04 | 2011-10-12 | Necディスプレイソリューションズ株式会社 | Video display device with built-in voice recognition function |
US7366673B2 (en) * | 2001-06-15 | 2008-04-29 | International Business Machines Corporation | Selective enablement of speech recognition grammars |
DE10313310A1 (en) * | 2003-03-25 | 2004-10-21 | Siemens Ag | Procedure for speaker-dependent speech recognition and speech recognition system therefor |
US20060075429A1 (en) * | 2004-04-30 | 2006-04-06 | Vulcan Inc. | Voice control of television-related information |
US8589156B2 (en) * | 2004-07-12 | 2013-11-19 | Hewlett-Packard Development Company, L.P. | Allocation of speech recognition tasks and combination of results thereof |
KR100672518B1 (en) * | 2005-02-15 | 2007-01-24 | 엘지전자 주식회사 | Television with voice recognition |
TWI298844B (en) * | 2005-11-30 | 2008-07-11 | Delta Electronics Inc | User-defines speech-controlled shortcut module and method |
JP4181590B2 (en) * | 2006-08-30 | 2008-11-19 | 株式会社東芝 | Interface device and interface processing method |
US8055502B2 (en) * | 2006-11-28 | 2011-11-08 | General Motors Llc | Voice dialing using a rejection reference |
US8676904B2 (en) * | 2008-10-02 | 2014-03-18 | Apple Inc. | Electronic devices with voice command and contextual data processing capabilities |
JP6317111B2 (en) * | 2011-02-22 | 2018-04-25 | スピーク・ウィズ・ミー・インコーポレイテッドSpeak With Me,Inc. | Hybrid client / server speech recognition |
-
2012
- 2012-10-26 KR KR1020120119634A patent/KR101284594B1/en not_active IP Right Cessation
- 2012-11-29 FR FR1261445A patent/FR2997599B3/en not_active Expired - Lifetime
- 2012-12-12 DE DE202012104833U patent/DE202012104833U1/en not_active Expired - Lifetime
- 2012-12-24 WO PCT/KR2012/011386 patent/WO2014065467A1/en active Application Filing
-
2013
- 2013-01-08 US US13/736,203 patent/US20140122088A1/en not_active Abandoned
- 2013-01-18 EP EP13151818.5A patent/EP2725576A1/en not_active Withdrawn
- 2013-01-21 CN CN201310020547.3A patent/CN103796053A/en active Pending
- 2013-01-21 CN CN2013200292585U patent/CN203151689U/en not_active Expired - Fee Related
- 2013-03-18 US US13/845,996 patent/US20140122089A1/en not_active Abandoned
-
2014
- 2014-04-17 JP JP2014085817A patent/JP2014132370A/en not_active Withdrawn
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20120119634A (en) | 2011-04-22 | 2012-10-31 | (주)광인사 | Plastic card with stereoscopic pattern |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112243068A (en) * | 2019-07-18 | 2021-01-19 | 柯尼卡美能达株式会社 | Image forming system and image forming apparatus |
Also Published As
Publication number | Publication date |
---|---|
US20140122089A1 (en) | 2014-05-01 |
WO2014065467A1 (en) | 2014-05-01 |
FR2997599A3 (en) | 2014-05-02 |
JP2014132370A (en) | 2014-07-17 |
KR101284594B1 (en) | 2013-07-10 |
US20140122088A1 (en) | 2014-05-01 |
CN103796053A (en) | 2014-05-14 |
EP2725576A1 (en) | 2014-04-30 |
CN203151689U (en) | 2013-08-21 |
FR2997599B3 (en) | 2015-05-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DE202012104833U1 (en) | Image processing apparatus and image processing system | |
JP6824316B2 (en) | Video processing equipment, its control method, and video processing system | |
DE202013100036U1 (en) | Image processing apparatus and image processing system | |
DE60122958T2 (en) | Display interface with a channel matrix | |
DE60012065T2 (en) | Method and apparatus for television channel selection using speech understanding | |
DE102008046493B4 (en) | Multimedia arrangement with a programmable universal remote control | |
CN107958668B (en) | Voice control broadcasting method and voice control broadcasting system of smart television | |
CN103248959A (en) | Man-machine interaction method and device for self adapting user identity | |
KR102227599B1 (en) | Voice recognition system, voice recognition server and control method of display apparatus | |
KR102622950B1 (en) | Display apparatus, method for controlling thereof and recording media thereof | |
DE202014011475U1 (en) | Electronic device | |
DE69915668T2 (en) | PORTABLE REMOTE CONTROL DEVICE | |
CN111385624B (en) | Voice-based data transmission control method, smart television and storage medium | |
CN108769827B (en) | Television program associated display method and device, mobile terminal and storage medium | |
US20150025893A1 (en) | Image processing apparatus and control method thereof | |
DE112005002130T5 (en) | Method for controlling an electronic device | |
KR102460927B1 (en) | Voice recognition system, voice recognition server and control method of display apparatus | |
CN113079400A (en) | Display device, server and voice interaction method | |
CN1413018A (en) | Method for operating electronic program guide | |
KR20140053760A (en) | Image processing apparatus and control method thereof, image processing system | |
MXPA02004279A (en) | Method for modifying a user interface of a consumer electronic apparatus, corresponding apparatus, signal and data carrier. | |
EP2141674B1 (en) | Assembly with device which can be controlled remotely | |
AU2018202888B2 (en) | Image processing apparatus, control method thereof, and image processing system | |
DE112019007646T5 (en) | ARTIFICIAL INTELLIGENCE DISPLAY AND SERVER | |
CN114302248A (en) | Display device and multi-window voice broadcasting method |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
R082 | Change of representative |
Representative=s name: GRUENECKER, KINKELDEY, STOCKMAIR & SCHWANHAEUS, DE Representative=s name: GRUENECKER PATENT- UND RECHTSANWAELTE PARTG MB, DE |
|
R207 | Utility model specification |
Effective date: 20130321 |
|
R163 | Identified publications notified | ||
R163 | Identified publications notified |
Effective date: 20130619 |
|
R150 | Utility model maintained after payment of first maintenance fee after three years | ||
R157 | Lapse of ip right after 6 years |