-
HINTERGRUND DER ERFINDUNG
-
Technisches Gebiet
-
Die vorliegende Erfindung bezieht sich auf ein Verfahren zum Steuern eines Anwendungsprogramms unter Verwendung einer Spracherkennungstechnologie. Insbesondere bezieht sich die vorliegende Erfindung auf eine Vorrichtung und ein Verfahren zum Steuern eines Anwendungsprogramms in einem intelligenten Endgerät unter Verwendung von Sprachbefehlen ausschließlich unter voreingestellten Bedingungen.
-
Hintergrund der Erfindung
-
Sofern nicht anders hierin festgestellt ist, stellen die Offenbarungen in diesem Abschnitt keinen Stand der Technik für die Ansprüche dieser Anwendung dar und sollten nicht allein aus dem Grund, dass die Offenbarungen in diesem Abschnitt beschrieben werden, als Stand der Technik ausgelegt werden.
-
Spracherkennung (auch Stimmerkennung genannt) bezieht sich auf eine Technologie zum Verstehen von menschlicher Sprache und zum Umwandeln derselben in computerlesbare Codeinformationen. Insbesondere handelt es sich um einen Prozess des Empfangens eines Schallsignals, das sich aus Schallwellenformen zusammensetzt, als Eingangsdaten, eines Identifizierens von Wörtern oder Wortsequenzen und eines Extrahierens der Bedeutung derselben. Spracherkennungstechnologie wird in intelligenten Endgeräten, Automobilen und in Technologien des Internets der Dinge (loT) usw. eingesetzt.
-
Studien zur Spracherkennung wurden seit den 1950er Jahren durchgeführt, aber selbst Spracherkennungsvorrichtungen (SRD), die durch die Führungsgruppe entwickelt wurden, weisen zahlreiche Einschränkungen hinsichtlich des Technologieniveaus auf.
-
Die Volumenklassen von Erkennungszielwörtern können eine Volumenklasse von mehreren Zehntausenden Wörtern, eine Volumenklasse von mehreren Hunderttausenden Wörtern und eine Volumenklasse einer unbegrenzten Wörterzahl umfassen. Im Fall von spontaner Sprache (natürlicher Sprache) treten bei der Spracherkennung im Vergleich zu anderen Sprachformen zahlreiche Schwierigkeiten auf, da normale spontane Sprache nicht der linguistischen Grammatik folgt und akustischen Phonationsmuster von Person zu Person variieren.
-
Tatsächlich verwenden viele Benutzer, da ein Sprachbefehlerkennungsfehler häufig in einem intelligenten Endgerät auftritt, das mit einer Spracherkennungsfunktion ausgestattet ist, die Spracherkennungsfunktion nicht, obwohl die Spracherkennungsfunktion in das intelligente Endgerät eingebaut ist.
-
Dokument im Stand der Technik
-
Patentdokument
-
Patentdokument
-
- (Patentdokument 1) Koreanische Patentanmeldung Nr. 10-2003-0079863 (eingereicht am 12. November 2003)
- (Patentdokument 2) Koreanische Patentanmeldung Nr. 10-2006-0109277 (eingereicht am 7. November 2006)
-
KURZDARSTELLUNG DER ERFINDUNG
-
Dementsprechend erfolgte die vorliegende Erfindung angesichts der Probleme, die im Stand der Technik auftreten, und die folgende Erfindung beabsichtigt, eine Anwendungsprogrammsteuervorrichtung und ein Verfahren zu schaffen, das es einem Benutzer ermöglicht, ein intelligentes Endgerät unter Verwendung eines Satzes von Sprachbefehlen ausschließlich unter voreingestellten Bedingungen genau zu steuern, wobei der Satz von Sprachbefehlen von Bedingung zu Bedingung variiert.
-
Gemäß einem Ausführungsbeispiel umfasst eine Vorrichtung zum Steuern eines Anwendungsprogramms in einem intelligenten Endgerät: ein Bedingungseinstellmodul zum Einstellen von Spracherkennungs-Steuerbedingungen, die eine Ereignisbedingung und eine Vorrichtungsstatusbedingung umfassen, so dass ein Spracherkennungsmodus unter einer spezifischen Bedingung aktiviert wird, wobei das intelligente Endgerät durch eine Spracheingabe oder eine Anzeigeberührungseingabe unter der spezifischen Bedingung gesteuert werden kann; ein Befehleinstellmodul zum Bezeichnen eines Satzes von Sprachbefehlen, die jeder der Spracherkennungssteuerbedingungen zugeordnet sind; ein Befehlerkennungsmodul zum Aktivieren eines Spracherkennungsmodus, wenn zumindest ein Ereignis auftritt, das in den Spracherkennungs-Steuerbedingungen beinhaltet ist, die durch das Bedienungseinstellmodul eingestellt sind, und zum Erkennen der bezeichneten Sprachbefehle; und ein Anwendungsprogrammsteuermodul zum Umwandeln eines Eingangssprachbefehls in ein Anwendungsprogrammsteuersignal eines intelligenten Endgeräts, um ein Anwendungsprogramm in dem intelligenten Endgerät zu steuern, wenn der Eingabesprachbefehl einer der bezeichneten Sprachbefehle ist, die für eine entsprechende Spracherkennungs-Steuerbedingungen bezeichnet werden.
-
Gemäß einem anderen Ausführungsbeispiel umfasst ein Verfahren zum Steuern eines Anwendungsprogramms in einem intelligenten Endgerät: (A) durch ein Bedingungseinstellmodul, Einstellen von Spracherkennungs-Steuerbedingungen, die eine Ereignisbedingung und eine Vorrichtungsstatusbedingung umfassen, derart, dass ein in dem intelligenten Endgerät bereitgestellter Spracherkennungsmodus lediglich unter den voreingestellten Spracherkennungs-Steuerbedingungen aktiviert wird, wodurch das Anwendungsprogramm in dem intelligenten Endgerät durch eine Spracheingabe oder eine Anzeigeberührungseingabe gesteuert werden kann; (B) durch ein Befehleinstellmodul, Bezeichnen eines Satzes von Sprachbefehlen, die einer aktuellen Spracherkennungs-Steuerbedingung unter den voreingestellten Spracherkennungs-Steuerbedingungen zugeordnet sind; (C) Erkennen eines Sprachbefehls, der zumindest mit einem Sprachbefehl übereinstimmt, der in dem Satz von Sprachbefehlen beinhaltet ist, die durch das Befehleinstellmodul bezeichnet werden, wenn eine Ereignisbedingung auftritt, die in den Spracherkennungs-Steuerbedingungen beinhaltet ist; (D) durch ein Anwendungssteuermodul, Steuern eines Anwendungsprogramms in einem intelligenten Endgerät durch Umwandeln des Eingabesprachbefehls in ein Anwendungsprogrammsteuersignal eines intelligenten Endgeräts.
-
Die Vorrichtung und das Verfahren zum Steuern eines Anwendungsprogramms in einem intelligenten Endgerät, die oben beschrieben sind, ermöglichen es einem Benutzer, zumindest eine spezifische Bedingung für eine Aktivierung einer Spracherkennung einzustellen, einen Satz von Sprachbefehlen, die jeder spezifischen Bedingung zugeordnet sind, für eine Aktivierung einer Spracherkennung herzustellen, und Sprachbefehle, die in dem Satz von Sprachbefehlen beinhaltet sind, unter einer beliebigen der spezifischen Bedingungen zu erkennen, wodurch die Vorrichtung und das Verfahren eine Sprachbefehlerkennungs-Fehlerrate, die bei einer Bedingung von spontaner Sprache (natürlicher Sprache) gewöhnlich hoch ist, dramatisch reduzieren, und somit können Benutzer ihr intelligentes Endgerät genau steuern, indem Sprachbefehle lediglich unter spezifischen Bedingungen, die durch den Benutzer festgelegt sind, verwendet werden.
-
Die seltene Verwendung von Sprachsteuerung auf intelligenten Endgeräten, die mit einer Sprachbefehlsteuerfunktion ausgestattet sind, wurde primär auf eine geringe Erfolgsrate der Sprachbefehlerkennung zurückgeführt. Jedoch kann gemäß der vorliegenden Offenbarung, da potenzielle Sprachbefehle, die unter einer spezifischen Bedingung erkannt und verwendet werden sollen, auf ein vorbestimmtes Volumen von Wörtern beschränkt sind, das vorab eingestellt ist, eine Erfolgsrate für Sprachsteuerung auf einem intelligenten Endgerät sich gegenüber einer herkömmlichen Sprachsteuerung auf Basis von natürlicher Sprache erhöhen.
-
Sprachbasierte Steuerung auf einem intelligenten Endgerät ist bei vielen Ereignissen höchst komfortabel, beispielsweise beim Antworten auf einen Weckruf oder auf einen Anruf beim Autofahren usw. Zu diesem Zweck verbessert die vorliegende Offenbarung den Benutzerkomfort beim Verwenden eines intelligenten Endgeräts, indem eine genaue Steuerung auf einem intelligenten Endgerät unter Verwendung von Sprachbefehlen bei einigen Bedingungen ermöglicht wird, bei denen es für einen Benutzer schwierig ist, das intelligente Endgerät zu erreichen oder zu berühren.
-
Es ist festzustellen, dass die Vorteile, Auswirkungen und Merkmale der vorliegenden Erfindung nicht auf diejenigen beschränkt sind, die weiter oben beschrieben werden, sondern alle Vorteile, Auswirkungen und Merkmale umfassen, die hier nicht explizit festgestellt werden, sondern von der ausführlichen Beschreibung der Erfindung oder der erneuten Bezugnahme auf die Ansprüche abgeleitet werden können.
-
Figurenliste
-
- 1 ist ein schematisches Blockdiagramm, das eine Anwendungssteuervorrichtung veranschaulicht, gemäß einem Ausführungsbeispiel der vorliegenden Erfindung;
- 2 ist ein Blockdiagramm, das die gesamte Konstruktion einer Anwendungssteuereinrichtung veranschaulicht, gemäß einem anderen Ausführungsbeispiel der vorliegenden Erfindung;
- 3 ist ein Diagramm, das den Betrieb einer Anwendungssteuervorrichtung veranschaulicht;
- 4 ist ein Flussdiagramm, das ein Anwendungssteuerverfahren gemäß einem Ausführungsbeispiel der vorliegenden Erfindung veranschaulicht; und
- 5 ist ein Diagramm, das einen beispielhaften Betrieb einer Anwendungssteuervorrichtung veranschaulicht.
-
AUSFÜHRLICHE BESCHREIBUNG DER ERFINDUNG
-
Vorteile und Merkmale der vorliegenden Erfindung und Wege zum Erreichen derselben werden mit Bezugnahme auf die Ausführungsbeispiele, die weiter unten ausführlich beschrieben werden, in Verbindung mit den angehängten Zeichnungen deutlich. Die vorliegende Erfindung kann jedoch in zahlreichen unterschiedlichen Formen verkörpert sein und sollte nicht als beschränkt auf die hierin dargelegten Ausführungsbeispiele aufgefasst werden. Vielmehr sind diese Ausführungsbeispiele dahin gehend bereitgestellt, dass diese Offenbarung gründlich und vollständig ausfällt, und vermitteln das Konzept der Erfindung in uneingeschränkter Weise an Fachleute auf dem Gebiet. Somit ist die vorliegende Erfindung lediglich durch den Umfang der Patentansprüche definiert. In der gesamten Beschreibung, die hierin bereitgestellt ist, beziehen ähnliche Bezugszeichen sich auf ähnliche Elemente.
-
Bei der folgenden Beschreibung der vorliegenden Erfindung wird eine ausführliche Beschreibung bekannter Funktionen und Konfigurationen, die hierin verkörpert sind, weggelassen, wenn dieselbe dazu führen kann, dass der Gegenstand der vorliegenden Erfindung eher unklar wird. Die folgenden Begriffe sind unter Berücksichtigung der Funktionen bei den Ausführungsbeispielen der vorliegenden Erfindung definiert, die abhängig von der Absicht des Benutzers, der Bedienungsperson oder der Gewohnheit variieren können. Deshalb sollte die Definition durch diese Spezifikation hindurch auf den Inhalten basieren.
-
1 ist ein schematisches Blockdiagramm einer Anwendungssteuervorrichtung gemäß einem Ausführungsbeispiel.
-
Mit Bezugnahme auf 1 umfasst eine Anwendungssteuervorrichtung gemäß einem Ausführungsbeispiel der vorliegenden Erfindung ein Bedingungseinstellmodul 110, ein Befehleinstellmodul 130, ein Befehlerkennungsmodul 150 und ein Anwendungssteuermodul 170. Der Begriff „~modul“, der hierin verwendet wird, ist als eine Software- oder Hardwarekomponente oder als eine Kombination derselben innerhalb des Kontexts zu verstehen. Die Software kann Maschinensprache, Firmware, eingebetteter Code und ein Anwendungsprogramm sein. Die Hardware kann eine Schaltung, ein Prozessor, ein Computer, eine integrierte Schaltung, ein integrierter Schaltungskern, ein Sensor, ein mikroelektromechanisches System (MEMS), eine passive Vorrichtung oder eine Kombination derselben sein.
-
Das Bedingungseinstellmodul 110 stellt eine spezifische Bedingung ein, bei der der Spracherkennungsmodus aktiviert werden soll. Zum Beispiel stellt das Bedingungseinstellmodul 110 mehrere Spracherkennungs-Steuerbedingungen ein, bei denen die Spracherkennung aktiviert werden soll, wobei die Spracherkennungs-Steuerbedingungen ein Auftreten eines Ereignisses, einen Vorrichtungsstatus und eine Vorrichtungsumgebung umfassen, sodass das intelligente Endgerät durch eine Spracheingabe oder eine Berührungseingabe lediglich in Spracherkennungs-Steuerbedingungen gesteuert werden kann, die durch das Bedingungseinstellmodul 110 eingestellt sind.
-
Wenn das intelligente Endgerät sich in einer der Spracherkennungs-Steuerbedingungen befindet, die durch das Bedingungseinstellmodul 110 eingestellt sind, erzeugt das Befehleinstellmodul 130 einen Satz von Sprachbefehlen, die unter einer aktuellen Spracherkennungs-Steuerbedingung unter den mehreren Spracherkennungs-Steuerbedingungen erkannt werden soll. Das heißt, der Satz von Sprachbefehlen variiert von Bedingung zu Bedingung. Wenn zum Beispiel die Spracherkennungs-Steuerbedingung auf „Aktivierung eines Kameraanwendungsprogramms“ eingestellt ist, bezeichnet das Befehleinstellmodul 130 die Worte oder Ausdrücke zum Steuern der Kamera, beispielsweise „Cheese“, „Kimchi“, „Aufnahme“, „eins, zwei, drei“, als Sprachbefehle, die bei der Bedingung „Aktivierung eines Kameraanwendungsprogramms“ verwendet werden sollen. In diesem Fall wird, wenn die Kamera des intelligenten Endgeräts aktiviert ist, der Spracherkennungsmodus automatisch aktiviert, und das Kameraanwendungsprogramm kann durch die Sprachebefehle gesteuert werden, die durch das Befehleinstellmodul 130 eingestellt sind.
-
Ferner kann bei dem Ausführungsbeispiel das Befehleinstellmodul 130 Sprachbefehle, die erkannt werden sollen, vorab lernen. Zum Beispiel lernt das Befehleinstellmodul 130 vorab Sprachbefehle „in fünf Minuten“ und „schlummern“, die der Benutzer höchstwahrscheinlich beim Steuern des intelligenten Endgeräts durch Spracherkennung verwenden wird. Deshalb kann eine Erkennungserfolgsrate für einen Sprachbefehl erhöht werden. Die Sprachbefehle, die durch das Befehleinstellmodul 130 eingestellt werden sollen, können gemäß dem Lebensrhythmus und dem Anwendungsverhalten der Benutzer von Benutzer zu Benutzer variieren.
-
Wenn das intelligente Endgerät in einer der Spracherkennungs-Steuerbedingungen ist, die mit dem Bedingungseinstellmodul 110 eingestellt sind, aktiviert das Befehlerkennungsmodul 150 den Spracherkennungsmodus und erkennt Sprachbefehle, die pro Bedingung mit dem Befehleinstellmodul 130 eingestellt werden.
-
Das Anwendungssteuermodul 170 steuert die Anwendung, indem ein Eingabesprachbefehl in ein Anwendungssteuersignal eines intelligenten Endgeräts umgewandelt wird, wenn sich das intelligente Endgerät in einer der Spracherkennungs-Steuerbedingungen befindet, die voreingestellt sind, und wenn ein beliebiger Sprachbefehl unter den Sprachbefehlen, die für die Spracherkennungs-Steuerbedingung eingestellt sind, eingegeben wird. Genauer gesagt wird, wenn die Kamera aktiviert ist, wodurch die Spracherkennungs-Steuerbedingung erfüllt ist, wenn ein beliebiger der Sprachbefehle, beispielsweise „Cheese“, „Kimchi“, „Aufnahme“, „eins, zwei, drei“, die für die spezifische Antriebsbedingung der Kamera eingestellt sind, die Spracheingabe in ein Fotografiersignal umgewandelt, so dass die Kamera getrieben wird, ein Bild aufzunehmen. Durch Herstellen eines Satzes von Sprachbefehlen im Voraus, der von Bedingung zu Bedingung variiert, kann eine Fehlerrate für eine Sprachbefehlerkennung, die in dem intelligenten Endgerät vorgesehen ist, reduziert werden, und ein Benutzer kann das eigene intelligente Endgerät genau steuern, insofern, dass die voreingestellten spezifischen Bedingungen erfüllt sind.
-
2 ist ein Blockdiagramm, das die gesamte Konstruktion einer Anwendungssteuervorrichtung veranschaulicht, gemäß einem Ausführungsbeispiel der vorliegenden Erfindung.
-
Mit Bezugnahme auf 2 umfasst das Bedingungseinstellmodul 110 ein Ereignisbedingung-Einstellmodul 111, ein Vorrichtungsstatusbedingung-Einstellmodul 113 und ein Umgebungsbedingung-Einstellmodul 115. Das Befehleinstellmodul 130 umfasst eine Befehlbezeichnungseinheit 131, eine Verwandter-Befehl-Einstelleinheit 133 und eine Sprachbefehldatenbank 135. Das Befehlerkennungsmodul 150 umfasst eine Steuerbedingung-Erkennungseinheit 151 und eine Pro-Bedingung-bezeichneter-Befehl-Erkennungseinheit 153.
-
Das Ereignisbedingung-Einstellmodul 111 des Bedingungseinstellmoduls 110 stellt ereignisbezogene Bedingungen unter den Spracherkennungs-Steuerbedingungen, bei denen der Spracherkennungsmodus aktiviert wird, in dem intelligenten Endgerät ein. Zum Beispiel kann das Ereignisbedingung-Einstellmodul 111 ein Starten von vorbestimmen Anwendungen als Ereignisbedingungen festlegen, wobei die vorbestimmten Anwendungen Anwendungsprogramme sein können, die sich auf einen Weckruf, einen Alarm, ein Telefon, eine Kamera usw. beziehen.
-
Die Vorrichtungsstatusbedingung-Einstelleinheit 113 stellt Bedingungen, bei denen der Spracherkennungsmodus aktiviert wird, aufgrund des Status des intelligenten Endgeräts als die Vorrichtungsstatusbedingungen ein. Zum Beispiel wird gemäß dem Batteriestand, dem Verbindungszustand mit einer anderen Vorrichtung, einer Innentemperatur oder einer Außentemperatur des intelligenten Endgeräts usw. die Spracherkennungsbedingung aktiviert. Bei dem Ausführungsbeispiel kann die Vorrichtungsstatusbedingung-Einstelleinheit 113 den Spracherkennungsmodus in einem Zustand, in dem es nicht erwünscht ist, den Spracherkennungsmodus zu aktivieren, automatisch deaktivieren, beispielsweise, wenn der Batteriestand unter einen vorbestimmten Pegel fällt oder wenn die Innentemperatur des intelligenten Endgeräts eine vorbestimmte Temperatur überschreitet, obwohl die anderen Spracherkennungs-Steuerbedingungen erfüllt sind.
-
Das Umgebungsbedingung-Einstellmodul 115 kann ein spezifisches Datum und eine Uhrzeit oder eine spezifische Position, die durch einen Benutzer eingestellt sind, als die Umgebungsbedingung einstellen, in der der Spracherkennungsmodus aktiviert werden soll. Beispielsweise kann in einem Fall, dass ein Benutzer ein Auto täglich zu einer bestimmten Zeit steuert, das Umgebungsbedingungs-Einstellmodul 115 den Spracherkennungsmodus während eines Zeitraums aktivieren, in dem der Benutzer ein Auto fährt.
-
Die Befehlbezeichnungseinheit 131 des Befehleinstellmoduls 130 bezeichnet Sprachbefehle, die von Bedingung zu Bedingung abweichen. Deshalb wird nur dann, wenn der bezeichnete Sprachbefehl unter einer spezifischen Bedingung ausgegeben wird, der Sprachbefehl in ein Anwendungsprogrammsteuersignal umgewandelt. Beispielsweise kann, wenn das Ereignisbedingung-Einstellmodul 111 ein Ereignis eines Weckrufs als die Spracherkennungs-Steuerbedingung einstellt, die Befehlbezeichnungseinheit 131 spezifische Sprachbefehle bezeichnen, beispielsweise „ablehnen“, „schlummern“ und „in fünf Minuten“, die sich auf die Steuerung eines Weckrufs beziehen. Deshalb wird, wenn das Weckrufereignis auftritt, der Spracherkennungsmodus aktiviert, und nur die bezeichneten Sprachbefehle können erkannt werden.
-
Die Verwandter-Befehl-Einstelleinheit
133 stellt verwandte Sprachbefehle für jede spezifische Bedingung auf der Basis der Sprachbefehldatenbank
135 ein, die in dem intelligenten Endgerät gespeichert ist oder durch eine Netzwerkkommunikation erhalten wird. Die Verwandter-Befehl-Einstelleinheit
133 kann Fremdsprachenübersetzungen, Synonyme und Ableitungen der bezeichneten Sprachbefehle, die durch die Befehlbezeichnungseinheit
131 bezeichnet sind, als die verwandten Sprachbefehle einstellen. Genauer gesagt können, zu dem oben genannten Beispiel zurückkehrend, die verwandten Sprachbefehle des Sprachbefehls „ablehnen‟, die bei dem Weckrufereignis verwendet werden können, Folgendes umfassen: „ablehnen‟, „
‟ welches die koreanische Entsprechung des Worts „ablehnen‟ ist, „stopp‟, „
‟, welches die koreanische Entsprechung des Worts „stopp‟ ist usw. Die verwandten Sprachbefehle können auch chinesische Wörter umfassen, die eine Entsprechung von „Alarm aus‟ sind.
-
Die Befehllerneinheit 155 kann Befehle lernen, die vorab durch einen Benutzer eingegeben werden. Zum Beispiel kann die Befehllerneinheit 155 Befehle lernen, die häufig in einem spezifischen Anwendungsprogramm, das von einem Benutzer verwendet wird, eingegeben werden. Die Befehle, die durch die Befehllerneinheit 155 gelernt werden, können häufig verwendete Befehle umfassen, beispielsweise „schlummern“ und „in fünf Minuten“, die gemäß dem Alltag des Benutzers oder dem Nutzungsverhalten des intelligenten Endgeräts durch den Benutzer variieren. Aufgrund des Vorliegens der Befehllerneinheit 155 weist die Vorrichtung gemäß dem vorliegenden Ausführungsbeispiel die Lernfunktion sowie die Spracherkennungsfunktion auf. Deshalb kann eine Erkennungserfolgsrate für Sprachbefehle, die häufig durch einen Benutzer verwendet werden, erheblich erhöht werden. Das heißt, da Sprachbefehle wie beispielsweise „in fünf Minuten“ vorab gelernt werden können, kann das intelligente Endgerät hinsichtlich der Sprachbefehlerkennungsrate verbessert werden.
-
Die Steuerbedingung-Erkennungseinheit 151 des Befehlerkennungsmoduls 150 bestimmt, ob das intelligente Endgerät die voreingestellte Spracherkennungsbedingung erfüllt. Wenn das intelligente Endgerät die vorliegende Spracherkennungsbedingung erfüllt, wenn ein Befehlssatz, der in einer spezifischen Bedingung erkannt werden soll, erfolgreich erkannt wird, übermittelt die Pro-Bedingung-bezeichneter-Befehl-Erkennungseinheit 153 den erkannten Befehl an das Anwendungssteuermodul 170, so dass der erkannte Sprachbefehl in ein Anwendungssteuersignal umgewandelt werden kann. Die seltene Verwendung der Spracherkennungsfunktion, die allgemein in den meisten intelligenten Endgeräten eingebaut ist, lag primär an einer deutlich niedrigen Erkennungsrate. Im Fall der vorliegenden Offenbarung kann jedoch, da das Volumen oder der Typ von Befehlen, die verwendet werden sollen, eingeschränkt ist, die Erkennungsrate im Vergleich zu einer Erkennung von natürlicher Sprache verbessert werden.
-
Außerdem kann die Anwendungssteuervorrichtung gemäß dem Ausführungsbeispiel Sprachbefehle, die erkannt werden sollen, vorab lernen. Beispielsweise kann auf eine Weise, dass ein Benutzer die Anwendungssteuervorrichtung veranlasst, Sprachbefehle wie „in fünf Minuten“ zu lernen, der Sprachbefehlerkennungsbereich erheblich verbessert werden.
-
3 ist ein Betriebsbeispiel der Anwendungssteuervorrichtung gemäß dem Ausführungsbeispiel.
-
Wie in 3 veranschaulicht ist, gilt für den Fall, dass ein Ereignis eines Antwortens auf einen Anruf als die Sprachbefehl-Erkennungsbedingung eingestellt ist und die Worte „annehmen“, „auflegen“, „ablehnen“, „Nachricht senden, dass Anruf nicht angenommen werden kann“ und dergleichen als Sprachbefehle bezeichnet sind, die bei einem Ereignis einer Anrufannahme erkannt werden sollen, dann, wenn das Ereignis einer Anrufannahme in dem intelligenten Endgerät des Benutzers auftritt, der Spracherkennungsmodus aktiviert wird, um die durch den Benutzer eingestellten Befehle zu erkennen. Auf diese Weise kann das intelligente Endgerät gesteuert werden. Das heißt, der Anruf kann unter Verwendung von Sprachbefehlen angenommen oder abgelehnt werden. Wie mit Bezugnahme auf 3 beschrieben ist, aktiviert die vorliegende Offenbarung automatisch den Spracherkennungsmodus, wenn ein spezifisches Ereignis in einer Bedingung auftritt (beispielsweise während des Trainings), in der es schwierig ist, das intelligente Endgerät mittels einer Berührungseingabe zu steuern, und bezeichnet unterschiedlich bezeichnete Sprachbefehle gemäß jedem Ereignistyp. Deshalb minimiert die vorliegende Offenbarung Spracherkennungsfehler, die häufig beim Verarbeiten von natürlicher Sprache auftreten, und ermöglicht eine genaue Steuerung auf einem intelligenten Endgerät unter Verwendung von Sprachbefehlen, wodurch der Benutzerkomfort beim Verwenden von intelligenten Endgeräten maximiert wird.
-
Nachfolgend wird ein Anwendungssteuerverfahren gemäß einem Ausführungsbeispiel der Erfindung beschrieben. Merkmale und Funktionen des Anwendungssteuerverfahrens sind im Wesentlichen dieselben wie diejenigen einer Anwendungssteuervorrichtung. Deshalb wird eine Beschreibung von 1 bis 3 hier weggelassen.
-
4 ist ein Flussdiagramm, das ein Anwendungssteuerverfahren gemäß einem Ausführungsbeispiel veranschaulicht.
-
Bei S410 stellt ein Bedingungseinstellmodul 110 eine spezifische Bedingung ein, bei der ein Spracherkennungsmodus in einem intelligenten Endgerät aktiviert werden soll. Beispielweise kann eine Ereignisbedingung, bei der ein spezifisches Anwendungsprogramm aktiviert wird, das sich auf einen Weckruf, einen Alarm, ein Telefon und eine Kamera bezieht, als eine von Spracherkennungsbedingungen eingestellt werden. Außerdem kann eine durch einen Benutzer eingestellte spezifische Zeit oder Position ebenfalls als eine von Spracherkennungsbedingungen eingestellt werden. Außerdem kann ein Vorrichtungsstatus, wie beispielsweise ein Batteriestand, ein Verbindungszustand mit einer anderen Vorrichtung und eine Innen- und Außentemperatur eines intelligenten Endgeräts, als die Spracherkennungsbedingung verwendet werden.
-
Bei dem Ausführungsbeispiel, wenn der Batteriestand unter einen vorbestimmten Pegel fällt oder wenn eine Innentemperatur des intelligenten Endgeräts aufgrund gleichzeitiger Aktivierung einer Mehrzahl von Anwendungsprogrammen eine Vorsichtsstufe erreicht oder überschreitet, das heißt, bei Bedingungen, bei denen es schwierig ist, den Spracherkennungsmodus auszuführen, oder wenn die Aktivierung der Spracherkennungsfunktion ein Faktor einer Überlastung des intelligenten Endgeräts ist, obwohl das intelligente Endgerät andere Spracherkennungsbedingungen erfüllt, kann der Spracherkennungsmodus automatisch deaktiviert werden. Bei S420 werden Sprachbefehle, die erkannt werden sollen, für jede Spracherkennungs-Steuerbedingung bezeichnet. Beispielsweise tritt ein Weckrufereignis als die Spracherkennungs-Steuerbedingung auf, Befehle wie „festlegen, dass Alarm in fünf Minuten klingelt“, „ablehnen“ können bezeichnet werden, um eine Weckrufanwendung zu steuern. Bei dem Ausführungsbeispiel können verwandte Befehle, die sich auf die Befehlen beziehen, die zur Verwendung in der Spracherkennungs-Steuerbedingung bezeichnet werden, ebenfalls bezeichnet werden. Die verwandten Befehle können Übersetzungssynonyme umfassen und Ableitungen der bezeichneten Befehle umfassen. Bei S430 werden Ereignisse erkannt, die in dem intelligenten Endgerät auftreten, und Vorrichtungsstatusinformationen des intelligenten Endgeräts erkannt.
-
Bei S440 wird bestimmt, ob die Ereignisse und die Vorrichtungsstatusinformationen die Spracherkennungs-Steuerbedingung erfüllen. Wenn die Ereignisse und die Vorrichtungsstatusinformationen die Spracherkennungs-Steuerbedingung nicht erfüllen, wird eine Rückkehr zu S430 durchgeführt. Wenn die Spracherkennungs-Steuerbedingung erfüllt wird, wird bei S450 der Spracherkennungsmodus aktiviert und die Befehle, die bezeichnet werden, um in der Spracherkennungs-Steuerbedingung erkannt zu werden, werden erkannt. Bei S460 wird der Befehl, der durch den Steuermodus 170 erkannt wird, in ein Anwendungssteuersignal eines intelligenten Endgeräts umgewandelt, so dass ein Anwendungsprogramm in dem intelligenten Endgerät gesteuert werden kann.
-
Kurz gesagt stellen die Anwendungssteuervorrichtung und das Verfahren, die oben beschrieben sind, Spracherkennungsbedingungen ein, bezeichnen Sprachbefehle, die von Bedingung zu Bedingung abweichen, und erkennen die bezeichneten Sprachbefehle in einer spezifischen Bedingung. Deshalb kann eine Spracherkennungsfehlerrate, die im Falle einer Verarbeitung von natürlicher Sprache (spontaner Sprache) gewöhnlich hoch ist, reduziert werden, und ein Benutzer kann sein intelligentes Endgerät in einer spezifischen Bedingung unter Verwendung von Sprachbefehlen genau steuern. Der primäre Grund für eine seltene Nutzung der Spracherkennung war eine äußerst niedrige Erkennungserfolgsrate. Bei der aktuellen Offenbarung sind jedoch die Sprachbefehle, von denen erwartet wird, dass sie bei einer spezifischen Bedingung verwendet werden, auf ein geringes Volumen beschränkt, und die Spracherkennungsrate in dem intelligenten Endgerät kann im Vergleich mit intelligenten Endgeräten, bei denen während der Spracherkennung natürliche Sprache verarbeitet wird, verbessert werden.
-
Außerdem ermöglicht es die vorliegende Offenbarung, bei Bedingungen, beispielsweise einem Weckrufereignis und einem Anrufannahmeereignis während des Fahrens, bei denen die Spracherkennungssteuerung komfortabel ist oder eine Berührungseingabe unmöglich ist, dem Benutzer, das intelligente Endgerät unter Verwendung von Sprachbefehlen genau zu steuern, was zu einer Verbesserung des Benutzerkomforts beim Verwenden des intelligenten Endgeräts führt.
-
Es ist für Fachleute auf dem Gebiet verständlich, dass verschiedene Änderungen erfolgen können, ohne von dem Wesen und dem Umfang der Erfindung abzuweichen, wie sie durch die angehängten Ansprüche definiert sind. Deshalb ist der Schutzumfang der vorliegenden Offenbarung nicht auf die oben beschriebenen Ausführungsbeispiele beschränkt.
-
ZITATE ENTHALTEN IN DER BESCHREIBUNG
-
Diese Liste der vom Anmelder aufgeführten Dokumente wurde automatisiert erzeugt und ist ausschließlich zur besseren Information des Lesers aufgenommen. Die Liste ist nicht Bestandteil der deutschen Patent- bzw. Gebrauchsmusteranmeldung. Das DPMA übernimmt keinerlei Haftung für etwaige Fehler oder Auslassungen.
-
Zitierte Patentliteratur
-
- KR 1020030079863 [0006]
- KR 1020060109277 [0006]