DE102017211340A1 - Method of operating a voice control system and voice control system - Google Patents
Method of operating a voice control system and voice control system Download PDFInfo
- Publication number
- DE102017211340A1 DE102017211340A1 DE102017211340.5A DE102017211340A DE102017211340A1 DE 102017211340 A1 DE102017211340 A1 DE 102017211340A1 DE 102017211340 A DE102017211340 A DE 102017211340A DE 102017211340 A1 DE102017211340 A1 DE 102017211340A1
- Authority
- DE
- Germany
- Prior art keywords
- memory
- speech
- stored
- control device
- expressions
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 39
- 230000015654 memory Effects 0.000 claims abstract description 65
- 230000014509 gene expression Effects 0.000 claims abstract description 51
- 230000009471 action Effects 0.000 claims abstract description 20
- 230000001960 triggered effect Effects 0.000 claims abstract description 8
- 230000006870 function Effects 0.000 claims description 9
- 238000012545 processing Methods 0.000 claims description 7
- 230000033001 locomotion Effects 0.000 claims description 3
- 238000011156 evaluation Methods 0.000 description 5
- 230000004913 activation Effects 0.000 description 3
- 230000001427 coherent effect Effects 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 230000003139 buffering effect Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000012854 evaluation process Methods 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- BUHVIAUBTBOHAG-FOYDDCNASA-N (2r,3r,4s,5r)-2-[6-[[2-(3,5-dimethoxyphenyl)-2-(2-methylphenyl)ethyl]amino]purin-9-yl]-5-(hydroxymethyl)oxolane-3,4-diol Chemical compound COC1=CC(OC)=CC(C(CNC=2C=3N=CN(C=3N=CN=2)[C@H]2[C@@H]([C@H](O)[C@@H](CO)O2)O)C=2C(=CC=CC=2)C)=C1 BUHVIAUBTBOHAG-FOYDDCNASA-N 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000001502 supplementing effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/167—Audio in a user interface, e.g. using voice commands for navigating, audio feedback
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
- G10L15/183—Speech classification or search using natural language modelling using context dependencies, e.g. language models
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Computational Linguistics (AREA)
- Theoretical Computer Science (AREA)
- Artificial Intelligence (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Navigation (AREA)
- Machine Translation (AREA)
Abstract
Die Erfindung betrifft ein Verfahren zum Betreiben eines Sprachbedienungssystems, bei dem durch ein Mikrofon (1) Sprachausdrücke erfasst und mittels einer ersten Steuervorrichtung (2) in ein speicherbares digitales Audioformat umgewandelt werden. Diese Audiodateien werden anschließend mit Hilfe einer zweiten Steuervorrichtung (3) in Sprachblöcke unterteilt, wobei die einzelnen Sprachblöcke insbesondere anhand eines Startzeitpunktes, eines Endzeitpunktes und einer Statusinformation indexiert werden. Die indexierten Sprachblöcke werden in einem zweiten Speicher (5), der als Ringspeicher ausgeführt ist, abgelegt und mit vordefinierten, hinterlegten Sprachblöcken, welche in einem dritten Speicher (7) gespeichert sind, verglichen. Wird eine Übereinstimmung zwischen den erfassten und den vordefinierten Sprachblöcken festgestellt, wird eine zugeordnete Aktion ausgelöst. Ferner betrifft die Erfindung eine Vorrichtung, mit deren Hilfe das erfindungsgemäße Verfahren ausgeführt werden kann.The invention relates to a method for operating a voice-operated system, in which voice expressions are detected by a microphone (1) and converted by means of a first control device (2) into a storable digital audio format. These audio files are then subdivided into speech blocks with the aid of a second control device (3), wherein the individual speech blocks are indexed in particular on the basis of a start time, an end time and status information. The indexed speech blocks are stored in a second memory (5), which is designed as a ring memory, and compared with predefined, stored speech blocks, which are stored in a third memory (7). If a match is detected between the captured and predefined speech blocks, an associated action is triggered. Furthermore, the invention relates to a device by means of which the method according to the invention can be carried out.
Description
Die Erfindung betrifft ein Verfahren zum Betreiben eines Sprachbedienungssystems sowie ein Sprachbedienungssystem.The invention relates to a method for operating a voice control system and a voice control system.
Moderne technische Einrichtungen weisen heutzutage eine immer größere Funktionsvielfalt auf. Um dennoch eine möglichst einfache und intuitive Bedienung zu ermöglichen, werden in zunehmendem Maße Sprachbedienungssysteme eingesetzt.Modern technical facilities nowadays have an ever greater variety of functions. Nevertheless, in order to enable as simple and intuitive operation as possible, voice control systems are increasingly being used.
Sprachbedienungssysteme bestehen typischerweise aus mindestens einem Mikrofon und mindestens einer Steuervorrichtung. Mit Hilfe des mindestens einen Mikrofons werden beliebige Sprachausdrücke erfasst. Diese Sprachausdrücke werden mit in einem Speicher hinterlegten Sprachausdrücken verglichen. Beim Erkennen einer Übereinstimmung, wird eine mit dem Sprachausdruck verknüpfte Aktion ausgelöst. Eine solche Aktion kann beispielsweise eine Funktionsausführung oder eine Sprachwiedergabe über ein Lautsprecher sein.Speech service systems typically consist of at least one microphone and at least one control device. With the help of the at least one microphone, any language expressions are detected. These language expressions are compared with language stored in a memory. When a match is detected, an action associated with the language expression is triggered. Such an action may be, for example, a function execution or a voice reproduction via a loudspeaker.
Die heute eingesetzten Sprachbedienungssysteme arbeiten vielfach auf Basis einer Einzelworterkennung, die durch einen manuellen Systemstart aktiviert werden muss. Die Sprachausdrücke sind in diesem Fall keine zusammenhängenden Sätze sondern einzelne Worte. Wird das Sprachbedienungssystem beispielsweise zur Bedienung eines Navigationssystems in einem Kraftfahrzeug eingesetzt, handelt es sich bei den Sprachausdrücken typischerweise um Städte- oder Straßennamen, mit denen die Adresseingabe erfolgt.The voice control systems used today often work on the basis of a single-word recognition, which must be activated by a manual system start. The language expressions in this case are not coherent sentences but individual words. If the voice-operated system is used, for example, for operating a navigation system in a motor vehicle, the language expressions are typically city or street names with which the address is input.
Die Sprachbedienung auf Einzelwortbasis hat zwar bereits einen hohen Reifegrad erreicht. Gewünscht ist jedoch vielfach eine dialogorientierte, auf natürlicher Sprache basierende Sprachbedienung. Hierzu müssen nicht nur explizite, einzelne Sprachausdrücke erfasst und ausgewertet werden, sondern auch Sprachausdrücke, die in längeren Sprachsequenzen enthalten sind.The voice operation on a single-word basis has already reached a high degree of maturity. In many cases, however, a dialog-oriented, natural language-based voice service is desired. For this purpose, not only explicit, individual language expressions must be recorded and evaluated, but also language expressions contained in longer language sequences.
Eine Lösung für das Erfassen, Speichern und Auswerten von Sprachbefehlen in einem Sprachbedienungssystem ist in der Schrift
In Schrift
Es besteht weiterhin die Aufgabe, ein leistungsfähiges Verfahren zur Erfassung, Speicherung und Verarbeitung von Sprache in einem Sprachbedienungssystem sowie eine zur Ausführung des Verfahrens geeignete Vorrichtung zu beschreiben.It is a further object to describe a high-performance method for acquiring, storing and processing speech in a voice-operated system and a device suitable for carrying out the method.
Erfindungsgemäß wird diese Aufgabe durch ein Verfahren gemäß des Anspruches
Der mit der offenbarten Lösung erzielbare technische Effekt besteht darin, Sprachausdrücke in einem deutlich erweiterten Umfang erfassen und auswerten zu können. Dadurch wird es möglich, die bisher häufig ausschließlich mit einer Einzelworterkennung arbeitenden Sprachbedienungssysteme hin zur Verarbeitung natürlicher Sprache zu ertüchtigen.The technical effect achievable with the disclosed solution is to be able to record and evaluate language expressions to a significantly expanded extent. This makes it possible, the previously often working exclusively with a single word recognition speech handling systems to process for the processing of natural language.
Das erfindungsgemäße Verfahren sieht vor, daß durch ein Mikrofon oder mehrere Mikrofone Sprachausdrücke zunächst erfasst werden. Unter einem Sprachausdruck wird dabei eine beliebige Wortsequenz in Form menschlicher Sprache verstanden, die von dem Bediener des Sprachbedienungssystems geäußert wird. Dem Wesen der menschlichen Sprache entsprechend, handelt es sich bei solchen Sprachausdrücken insbesondere um Worte, die in einem kausalen Zusammenhang stehen, d.h. üblicherweise in Form von Sätzen geäußert werden. Es ist aber auch der Fall denkbar, daß Phasen der Ruhe, in denen nicht gesprochen wird, oder unvollständige Sätze oder Satzteile erfasst werden. Zeiten des Nicht-Sprechens entstehen insbesondere zwischen einzelnen Worten oder Satzteilen. Aber auch Phasen, in denen aufgrund sonstiger Einflüsse, beispielsweise der notwendigen Konzentration auf das Verkehrsgeschehen, nicht gesprochen wird, sind im Sinne der offenbarten Erfindung Bestandteil eines Sprachausdruckes.The inventive method provides that by a microphone or multiple microphones speech terms are first detected. A speech expression is understood here to be an arbitrary word sequence in the form of human speech, which is uttered by the operator of the voice-operated system. In accordance with the nature of human speech, such language expressions are in particular words which are causally related, i. usually expressed in the form of sentences. But it is also conceivable the case that phases of silence in which is not spoken, or incomplete sentences or phrases are recorded. Times of non-speech arise in particular between individual words or phrases. But even phases in which is not spoken due to other influences, such as the necessary concentration on the traffic, are in the sense of the disclosed invention part of a language expression.
Unter einem Bediener wird jede Person verstanden, deren Sprachausdrücke im Verlauf des Verfahrens erfasst und ausgewertet werden. In einem Kraftfahrzeug können dieses insbesondere der Fahrer oder aber die übrigen Fahrzeuginsassen sein. Grundsätzlich soll das offenbarte Verfahren so gestaltet sein, daß alle Sprachausdrücke unabhängig von ihrer Herkunft als auszuwertende Sprachausdrücke verarbeitbar sind.An operator is understood to be any person whose speech expressions are detected and evaluated in the course of the procedure. In one Motor vehicle may be this particular the driver or the other vehicle occupants. In principle, the disclosed method should be designed so that all language expressions, irrespective of their origin, can be processed as language expressions to be evaluated.
Die von dem Mikrofon oder den Mikrofonen erfassten Sprachausdrücke liegen in einem ersten Schritt in analoger Form vor. Um diese auf einem digitalen Speichermedium ablegen zu können, müssen sie in ein digitales Format umgewandelt werden. Hierfür sieht das erfindungsgemäße Verfahren eine Umwandlung der analogen Sprachausdrücke in zusammenhängende, digitale Sprachblöcke vor. Ein solcher Sprachblock ist als ein zusammenhängender Sprachausdruck mit einer definierten Länge zu verstehen, der in digitalisierter Form vorliegt.The speech expressions detected by the microphone or the microphones are present in an analogous form in a first step. In order to store them on a digital storage medium, they must be converted into a digital format. For this purpose, the method according to the invention provides for conversion of the analog voice expressions into coherent digital speech blocks. Such a speech block is to be understood as a coherent speech expression with a defined length, which exists in digitized form.
Die Länge eines jeden Sprachblocks ist von der Steuervorrichtung vorzugeben. Im Sinne der Erfindung können diese Sprachblöcke eine feste Länge oder eine variable Länge aufweisen. Eine feste Länge der Sprachblöcke bietet sich insbesondere an, wenn längere Phasen der Ruhe aus den Sprachausdrücken herausgefiltert werden müssen. Dieses ist insbesondere unter dem Aspekt des zu begrenzenden Speicherplatzbedarfs von Bedeutung.The length of each speech block is to be specified by the control device. For the purposes of the invention, these speech blocks may have a fixed length or a variable length. A fixed length of the speech blocks is particularly useful when longer phases of silence need to be filtered out of the language expressions. This is particularly important in terms of the storage space requirement to be limited.
Im Verlauf der Umwandlung der analogen Sprachausdrücke in speicherbare digitale Sprachblöcke werden die einzelnen Blöcke indexiert. Hierunter ist zu verstehen, daß jedem Sprachblock Zusatzinformationen, insbesondere ein Startzeitpunkt, ein Endzeitpunkt sowie eine Statusinformation, hinzugefügt werden. Die dabei generierten Indexinformationen werden in vorteilhafter Ausgestaltung der Erfindung in eine tabellarische Form überführt und in einem ersten Speicher abgespeichert. Die digitalisierten Sprachinhalte, d.h. die Sprachblöcke, werden in einem zweiten Speicher abgelegt.As the analog speech expressions are being converted into storable digital speech blocks, the individual blocks are indexed. This is to be understood as meaning that additional information, in particular a start time, an end time and status information, is added to each speech block. The index information generated in this case are converted in an advantageous embodiment of the invention into a tabular form and stored in a first memory. The digitized speech content, i. the speech blocks are stored in a second memory.
Der zweite Speicher zur Speicherung der Sprachblöcke ist erfindungsgemäß als Ringspeicher ausgeführt. Unter einem Ringspeicher ist eine Speichertechnik zu verstehen, bei der der älteste Speicherinhalt nach einem anfänglichen Befüllen durch den jeweils neuesten Speicherinhalt ersetzt werden kann. Diese Logik wird über eine entsprechende Softwareanwendung in einer Steuervorrichtung sichergestellt.The second memory for storing the speech blocks is designed according to the invention as a ring memory. A ring memory is to be understood as a memory technology in which the oldest memory contents can be replaced after an initial filling by the respectively latest memory contents. This logic is ensured via a corresponding software application in a control device.
Die tabellarisch gespeicherten Zusatzinformationen sowie die gespeicherten Sprachblöcke werden in einem weiteren Schritt des erfindungsgemäßen Verfahrens ausgewertet. Hierzu werden die Inhalte der Sprachblöcke mit hinterlegten Sprachblöcken verglichen.The additional information stored in tabular form as well as the stored speech blocks are evaluated in a further step of the method according to the invention. For this purpose, the contents of the speech blocks are compared with stored speech blocks.
Der Start des Auswertevorgangs kann durch das Betätigen eines mechanischen Knopfes oder durch das Sprechen eines Schlüsselwortes, eines sogenannten Wake-Up-Wortes, initiiert werden. Auch eine permanente, im Hintergrund ablaufende automatische Auswertung der Sprachblöcke verbunden mit der Suche nach festgelegten Schlüsselworten ist eine mögliche Auswertelogik. So ist es beispielsweise denkbar, das Wort „Telefon“ und dessen Abwandlungen wie „Telefonieren“ oder „Telefongespräch“ aus den Sprachausdrücken herauszufiltern und als Startsignal für die weitere Abarbeitung des beschriebenen Verfahrens zu nutzen.The start of the evaluation process can be initiated by pressing a mechanical button or by speaking a keyword, a so-called wake-up word. Also, a permanent, running in the background automatic evaluation of the language blocks associated with the search for specified keywords is a possible Auswertelogik. For example, it is conceivable to filter out the word "telephone" and its modifications, such as "telephoning" or "telephone conversation", from the language expressions and to use it as a start signal for further processing of the method described.
In Anschluss an den Start des Auswertevorgangs werden die Sprachblöcke aus dem Speicher ausgelesen und mit in dem Sprachbedienungssystem hinterlegten Sprachblöcken verglichen. Wird eine Übereinstimmung festgestellt, wird eine dem jeweiligen Sprachblock zugeordnete Aktion ausgelöst.Following the start of the evaluation process, the speech blocks are read out of the memory and compared with speech blocks stored in the speech service system. If a match is found, an action associated with the particular speech block is triggered.
In vorteilhaften Ausgestaltungen des Verfahrens handelt es sich bei den ausgelösten Aktionen um Bedienfunktionen und/oder Informationsausgaben. In einem Kraftfahrzeug kann der Bedienwunsch „Bitte die Temperatur erhöhen“ beispielsweise durch die Ausführung der eigentlichen Funktion und die anschließende Informationsausgabe „Temperatur ist erhöht“ umgesetzt werden.In advantageous embodiments of the method, the triggered actions are operator functions and / or information outputs. In a motor vehicle, the control request "please increase the temperature", for example, by the execution of the actual function and the subsequent information output "temperature is increased" are implemented.
In einer weiteren vorteilhaften Ausgestaltung des beschriebenen Verfahrens kommt das Sprachbedienungssystem in einem Fortbewegungsmittel, z.B. einem Kraftfahrzeug, zum Einsatz. Bei den auslösbaren Aktionen kann es sich sowohl um eine das Fortbewegungsmittel betreffende Aktion als auch eine nicht das Fortbewegungsmittel betreffende Aktion handeln. Nicht das Fortbewegungsmittel betreffende Aktionen sind z.B. das Suchen einer Telefonnummer oder einer Einkaufsmöglichkeit in der näheren Umgebung.In a further advantageous embodiment of the described method, the voice control system comes in a means of locomotion, e.g. a motor vehicle, used. The actions that can be triggered may be both an action relating to the means of transportation and an action not involving the means of transportation. Non-locomotive actions are e.g. looking for a phone number or a supermarket in the vicinity.
In einer vorteilhaften Ausgestaltung des beschriebenen Verfahrens sind die zur Durchführung der beschriebenen Verfahrensschritte vorgesehenen Steuervorrichtungen zusammenfasst und als integrierte Steuervorrichtung ausgeführt.In an advantageous embodiment of the method described, the control devices provided for carrying out the method steps described are summarized and designed as an integrated control device.
In einer bevorzugten Ausprägung des beschriebenen Verfahrens sind die zur Speicherung der Informationen notwendigen Speicherelemente physikalisch zusammengefasst, wobei die Ansteuerung der einzelnen Speicherelemente unter Verwendung einer Softwareanwendung erfolgt.In a preferred embodiment of the method described, the storage elements necessary for storing the information are physically combined, wherein the activation of the individual storage elements takes place using a software application.
Sollte trotz Aktivierung des Sprachbedienungssystems keine Übereinstimmung gefunden werden, sieht eine vorteilhafte Ausgestaltung des erfindungsgemäßen Verfahrens die Möglichkeit einer systembasierten Nachfrage vor. So kann das System beispielsweise der Benutzer aufgefordert werden, seinen Wunsch zu wiederholen.Should no match be found despite activation of the voice-operated system, an advantageous embodiment of the method according to the invention provides for the possibility of system-based demand. That's how it works System, for example, the user will be asked to repeat his request.
In einer weiteren vorteilhaften Ausprägung des erfindungsgemäßen Verfahrens erfolgt die Speicherung der Sprachblöcke nicht lokal, z.B. in einem in dem Kraftfahrzeug befindlichen Speicher, sondern in einem Cloud-Speicher, der über eine Datenverbindung angesprochen wird. Vorteil dieser Ausgestaltung ist der möglicherweise größere Speicher.In a further advantageous embodiment of the method according to the invention, the storage of the speech blocks is not carried out locally, e.g. in a memory located in the motor vehicle, but in a cloud memory, which is addressed via a data connection. Advantage of this embodiment is the possibly larger memory.
Die Erfindung betrifft weiterhin eine Vorrichtung, mit deren Hilfe Sprache analysiert werden kann und in Abhängigkeit von dem erkannten Sprachinhalten vordefinierte Aktionen ausgeführt werden können. Die Vorrichtung besteht erfindungsgemäß aus mindestens einem Mikrofon, mindestens einer Steuervorrichtung und mindestens einem Speicher.The invention further relates to a device with the aid of which language can be analyzed and predefined actions can be carried out as a function of the recognized speech content. The device according to the invention consists of at least one microphone, at least one control device and at least one memory.
Mit Hilfe des mindestens einen Mikrofons lassen sich Sprachausdrücke erfassen, die insbesondere von einem Benutzer des Sprachbedienungssystem geäußert werden.With the aid of the at least one microphone, it is possible to record voice expressions which are in particular uttered by a user of the voice control system.
Des Weiteren ist erfindungsgemäß eine erste Steuervorrichtung vorhanden, in der eine Softwareanwendung zur Umwandlung der analogen Signale des Mikrofons in speicherbare, digitale Audioformate implementiert ist. Diese erste Steuervorrichtung kann als eigener Baustein in dem Sprachbedienungssystem realisiert sein. Auch ein Aufbau, bei dem eine solche Steuervorrichtung mit der dazugehörigen Software in einem der Mikrofone integriert ist, ist eine Lösung im Sinne der Erfindung.Furthermore, according to the invention there is a first control device in which a software application for converting the analog signals of the microphone into storable digital audio formats is implemented. This first control device can be implemented as a separate component in the voice control system. A construction in which such a control device is integrated with the associated software in one of the microphones is a solution in the sense of the invention.
Neben der ersten Steuervorrichtung ist eine zweite Steuervorrichtung Bestandteil der offenbarten Vorrichtung, wobei auch hier eine Lösung, bei der beide Steuervorrichtungen in einer Einheit zusammengefasst sind, eine geeignete Ausgestaltung im Sinne der Erfindung darstellt. In der zweiten Steuervorrichtung ist eine Softwarelösung implementiert, mit deren Hilfe die digitalisierten Sprachausdrücke indexiert werden können. Indexierte Sprachausdrücke werden im Sinne der Erfindung als Sprachblöcke bezeichnet.In addition to the first control device, a second control device is part of the disclosed device, wherein here too a solution in which both control devices are combined in one unit, a suitable embodiment according to the invention. In the second control device, a software solution is implemented with the aid of which the digitized language expressions can be indexed. Indexed language expressions are referred to as language blocks in the sense of the invention.
Unter dem Vorgang der Indexierung ist eine Ergänzung der Sprachausdrücke um beschreibende Eigenschaften zu verstehen. Hierbei handelt es sich insbesondere um den Start- und den Endzeitpunkt sowie eine Statusinformation.The process of indexing is to be understood as supplementing the language expressions with descriptive properties. These are in particular the start and the end time as well as a status information.
Zur Speicherung der Indexinformationen ist ein erster Speicher vorgesehen. Die Speicherung der digitalen Sprachblöcke erfolgt in einem zweiten Speicher, wobei dieser zweite Speicher auch mit dem ersten Speicher physikalisch in einer gemeinsamen Speichereinheit zusammengefasst sein kann.For storing the index information, a first memory is provided. The storage of the digital speech blocks takes place in a second memory, wherein this second memory can also be combined with the first memory physically in a common memory unit.
Der zweite Speicher zur Speicherung der Sprachblöcke ist in der offenbarten Vorrichtung als Ringspeicher ausgeführt. Hierunter ist eine Speichertechnik zu verstehen, bei der ein Speicher zunächst mit Informationen gefüllt wird. Nach Erreichen der Kapazitätsgrenze wird zum Speichern von weiteren Inhalten der jeweils älteste Speicherinhalt gelöscht. Sollte die Löschung eines Speicherinhaltes nicht ausreichen, werden weitere Inhalte gelöscht, bis ausreichend Speicherkapazität vorhanden ist.The second memory for storing the speech blocks is implemented in the disclosed apparatus as a ring memory. This is to be understood as a memory technology in which a memory is initially filled with information. Once the capacity limit has been reached, the oldest memory content is deleted for storage of further contents. If the deletion of a memory content is insufficient, further contents are deleted until sufficient memory capacity is available.
Um im Anschluss an die Speicherung die Auswertung der Sprachblöcke vornehmen zu können, sieht die erfindungsgemäße Vorrichtung eine dritte Steuervorrichtung vor. In ihr ist eine Softwareanwendung implementiert, mit deren Verwendung die gespeicherten Sprachblöcke mit Sprachblöcken, die in einem dritten Speicher hinterlegt sind, verglichen werden können. Erkennt die Steuervorrichtung bei einem solchen Vergleich eine Übereinstimmung, wird eine vordefinierte Aktion ausgeführt.In order to be able to carry out the evaluation of the speech blocks following the storage, the device according to the invention provides a third control device. In it, a software application is implemented, with the use of which the stored speech blocks can be compared with speech blocks stored in a third memory. If the controller detects a match in such a comparison, a predefined action is taken.
In einer vorteilhaften Ausgestaltung der offenbarten Erfindung kommt die Vorrichtung in einem Fortbewegungsmittel, insbesondere einem Kraftfahrzeug, zum Einsatz.In an advantageous embodiment of the disclosed invention, the device is used in a means of transportation, in particular a motor vehicle.
In einer weiteren vorteilhaften Ausgestaltung der offenbarten Erfindung handelt es sich bei der Aktion um eine Bedienfunktion und/oder eine Informationsausgabe. Dieses kann beispielsweise die Erhöhung der Innenraumtemperatur oder das von dem Bediener erfragte nächste Restaurant sein.In a further advantageous embodiment of the disclosed invention, the action is an operating function and / or an information output. This may be, for example, the increase in the interior temperature or the next restaurant requested by the operator.
In einer vorteilhaften Ausgestaltung des offenbarten Vorrichtung sind die erste und/oder zweite und/oder dritte Steuervorrichtung zusammenfasst und als integrierte Steuervorrichtung ausgeführt.In an advantageous embodiment of the disclosed device, the first and / or second and / or third control device are combined and designed as an integrated control device.
In einer weiteren vorteilhaften Ausgestaltung des offenbarten Vorrichtung sind der zur Speicherung der Informationen notwendige erste und/oder zweite und/oder dritte Speicher physikalisch zusammengefasst, wobei die Ansteuerung der einzelnen Speicher unter Einsatz einer Softwareanwendung erfolgt.In a further advantageous embodiment of the disclosed device, the first and / or second and / or third memory necessary for the storage of the information are physically combined, wherein the activation of the individual memories takes place using a software application.
In einer weiteren vorteilhaften Ausgestaltung der Vorrichtung ist für den Fall, daß bei dem Vergleich der erfassten und aufbereiteten Sprachausdrücke keine Übereinstimmung mit den vordefinierten, hinterlegten Sprachausdrücken festgestellt werden kann, die Ausführung einer vordefinierten Rückfrage vorgesehen. Hierbei kann es sich beispielsweise um die allgemeine Rückfrage „Ich habe Sie leider nicht verstanden, bitte wiederholen Sie Ihren Wunsch“ handeln. Aber auch eine spezifische Rückfrage wie „Leider kann ich den gewünschten Ort nicht finden. Meinten Sie vielleicht Hamburg als Navigationsziel?“ ist eine Lösung im Sinne der Erfindung.In a further advantageous embodiment of the device, the execution of a predefined inquiry is provided in the event that when comparing the detected and processed language expressions no match with the predefined, stored language expressions can be determined. For example, this may be the general query "I did not understand you, please repeat your request". But also a specific inquiry like "Unfortunately I can not find the desired location. Did you mean Hamburg as a navigation destination? "Is a solution within the meaning of the invention.
In einer vorteilhaften Ausgestaltung der offenbarten Vorrichtung erfolgt die Speicherung der erfassten Sprachblöcke, der hinterlegten Sprachblöcke und/oder der Indexinformationen wahlweise in einem Cloudspeicher. In an advantageous embodiment of the disclosed device, the storage of the acquired speech blocks, the stored speech blocks and / or the index information optionally takes place in a cloud memory.
Nachfolgend werden die Vorrichtung und das Verfahren anhand eines Ausführungsbeispiels mit Bezug zu den
In
Der Vorgang der Indexierung der Sprachausdrücke ist in
Als Speicherelement ist in der dargestellten Ausgestaltung der Erfindung ein erster Speicher 4 vorgesehen. In diesem ersten Speicher
In einem zweiten Speicher
In einer weiteren Steuervorrichtung
Der Ablauf des erfindungsgemäßen Verfahrens zum Betreiben eines Sprachbedienungssystems ist in
Bei dem Verfahren werden zunächst die Sprachausdrücke eines Bedieners unter Verwendung eines Mikrofons
Zur Auswertung werden in einem Verfahrensschritt
Wird zwischen den erfassten und gespeicherten Sprachblöcken und den hinterlegten Sprachblöcken eine Übereinstimmung festgestellt, wird in einem Verfahrensschritt
BezugszeichenlisteLIST OF REFERENCE NUMBERS
- 1.1.
- Mikrofonmicrophone
- 2.Second
- Erste SteuervorrichtungFirst control device
- 3.Third
- Zweite SteuervorrichtungSecond control device
- 4.4th
- Erster SpeicherFirst store
- 5.5th
- Zweiter Speicher (Ringspeicher)Second memory (ring memory)
- 6.6th
- Dritte SteuervorrichtungThird control device
- 7.7th
- Dritter SpeicherThird store
- 8.8th.
- Bediensystemoperating system
- 9.9th
- Lautsprecherspeaker
- 10.10th
- Sprachausdrückelanguage expressions
- 11.11th
- Indextabelleindex table
- 100100
- ErfassenTo capture
- 200200
- Digitalisierendigitizing
- 300300
- Umwandeln und IndexierenTransform and Index
- 400 400
- Speichernto save
- 500500
- Auslesenselect
- 600600
- Vergleichento compare
- 700700
- Auslösen eines SteuersignalsTriggering a control signal
ZITATE ENTHALTEN IN DER BESCHREIBUNG QUOTES INCLUDE IN THE DESCRIPTION
Diese Liste der vom Anmelder aufgeführten Dokumente wurde automatisiert erzeugt und ist ausschließlich zur besseren Information des Lesers aufgenommen. Die Liste ist nicht Bestandteil der deutschen Patent- bzw. Gebrauchsmusteranmeldung. Das DPMA übernimmt keinerlei Haftung für etwaige Fehler oder Auslassungen.This list of the documents listed by the applicant has been generated automatically and is included solely for the better information of the reader. The list is not part of the German patent or utility model application. The DPMA assumes no liability for any errors or omissions.
Zitierte PatentliteraturCited patent literature
- DE 10030369 [0006]DE 10030369 [0006]
- US 2016/0189716 [0007]US 2016/0189716 [0007]
Claims (14)
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE102016015355 | 2016-12-22 | ||
DE102016015355.5 | 2016-12-22 |
Publications (1)
Publication Number | Publication Date |
---|---|
DE102017211340A1 true DE102017211340A1 (en) | 2018-07-12 |
Family
ID=62636655
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE102017211340.5A Pending DE102017211340A1 (en) | 2016-12-22 | 2017-07-04 | Method of operating a voice control system and voice control system |
Country Status (1)
Country | Link |
---|---|
DE (1) | DE102017211340A1 (en) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE10030369A1 (en) | 2000-06-21 | 2002-01-03 | Volkswagen Ag | Voice recognition system |
US20160189716A1 (en) | 2013-10-11 | 2016-06-30 | Apple Inc. | Speech recognition wake-up of a handheld portable electronic device |
-
2017
- 2017-07-04 DE DE102017211340.5A patent/DE102017211340A1/en active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE10030369A1 (en) | 2000-06-21 | 2002-01-03 | Volkswagen Ag | Voice recognition system |
US20160189716A1 (en) | 2013-10-11 | 2016-06-30 | Apple Inc. | Speech recognition wake-up of a handheld portable electronic device |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DE60215272T2 (en) | Method and apparatus for inputting linguistic data under unfavorable conditions | |
EP1892700A1 (en) | Method for speech recognition and speech reproduction | |
EP1721245B1 (en) | Method for selecting a list item and information or entertainment system, especially for motor vehicles | |
WO2005013261A1 (en) | Speech recognition method, and communication device | |
DE102009017176A1 (en) | Navigation arrangement for a motor vehicle | |
DE102015213715A1 (en) | Speech recognition device and speech recognition method | |
EP2815396B1 (en) | Method for phoneticizing a data list and speech-controlled user interface | |
DE102014017384A1 (en) | Motor vehicle operating device with speech recognition correction strategy | |
DE102015106280B4 (en) | Systems and methods for compensating for speech artifacts in speech recognition systems | |
EP3108476A1 (en) | Method for acquiring at least two pieces of information to be acquired, comprising information content to be linked, using a speech dialogue device, speech dialogue device, and motor vehicle | |
EP3095114B1 (en) | Method and system for generating a control command | |
EP3152753B1 (en) | Assistance system that can be controlled by means of voice inputs, having a functional device and a plurality of voice recognition modules | |
DE112014007287B4 (en) | Speech recognition device and speech recognition method | |
DE102016204315A1 (en) | Means of transport, system and method for adjusting a length of a permitted speech break in the context of a voice input | |
EP1282897B1 (en) | Method for creating a speech database for a target vocabulary in order to train a speech recognition system | |
DE102018215293A1 (en) | Multimodal communication with a vehicle | |
EP3115886B1 (en) | Method for operating a voice controlled system and voice controlled system | |
DE10030369A1 (en) | Voice recognition system | |
DE102017211340A1 (en) | Method of operating a voice control system and voice control system | |
DE102018200746B4 (en) | Activation of a speech dialogue system in a motor vehicle | |
EP1457966A1 (en) | Method for determining the risk of confusability of vocabulary entries for phoneme-based speech recognition | |
DE102013216427B4 (en) | Device and method for means of transport-based speech processing | |
DE112016007158T5 (en) | Speech recognition device and speech recognition method | |
DE10017717B4 (en) | Voice input controlled controller | |
DE102013019208A1 (en) | Motor vehicle voice control |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
R012 | Request for examination validly filed | ||
R016 | Response to examination communication |