DE102013108627B4 - Sprachgesteuertes Kommunikationssystem - Google Patents

Sprachgesteuertes Kommunikationssystem Download PDF

Info

Publication number
DE102013108627B4
DE102013108627B4 DE102013108627.6A DE102013108627A DE102013108627B4 DE 102013108627 B4 DE102013108627 B4 DE 102013108627B4 DE 102013108627 A DE102013108627 A DE 102013108627A DE 102013108627 B4 DE102013108627 B4 DE 102013108627B4
Authority
DE
Germany
Prior art keywords
voice
communication system
unit
controlled communication
speech
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
DE102013108627.6A
Other languages
English (en)
Other versions
DE102013108627A1 (de
Inventor
Mario Daubner
Dennis Meyer
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to DE102013108627.6A priority Critical patent/DE102013108627B4/de
Publication of DE102013108627A1 publication Critical patent/DE102013108627A1/de
Application granted granted Critical
Publication of DE102013108627B4 publication Critical patent/DE102013108627B4/de
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2250/00Details of telephonic subscriber devices
    • H04M2250/74Details of telephonic subscriber devices with voice recognition means

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Telephone Function (AREA)

Abstract

Sprachgesteuertes Kommunikationssystem (10) umfassend ein Gerät (12) mit einer Spracheingabeeinheit (14) und Sprachausgabeeinheit (16) und wenigstens eine zentrale Rechnereinheit (44), wobei das Gerät (12) Mittel zur Datenübertragung (18) aufweist, und wobei mit der Spracheingabe- und Ausgabeeinheit (14, 16) eine Sprachsteuerung für auf dem Gerät (12) implementierte Funktionen erfolgt, welche unabhängig von den Positionen und/oder fest an das Gerät (12) gekoppelten Ein-/Ausgabeeinheiten (40, 42, 44) sind, wobei die Spracheingabeeinheit (14) ein Sprachüberwachungsmittel (20) umfasst, das unabhängig von dem Betriebszustand der Spracheingabe- und Ausgabeeinheit (14, 16) und der Rechnereinheit (44) betreibbar ist, und das bei Detektion zumindest eines vorbestimmbaren Sprachbefehls eine Aktivierung des Gerätes (12) vornehmen kann, dadurch gekennzeichnet, dass das Sprachüberwachungsmittel (20) an einer Energieversorgung einer Stromquelle (22) angeschlossen ist, die separat von der Energieversorgung des Kommunikationssystems (10) ist.

Description

  • Die Erfindung betrifft ein sprachgesteuertes Kommunikationssystem für ein Gerät mit Spracheingabe- und Ausgabeeinheit und einer Rechnereinheit.
  • STAND DER TECHNIK
  • Aus dem Stand der Technik sind Rechnersysteme mit Mitteln zur Spracheingabe prinzipiell bekannt. Generell ist bei derartigen Rechnersystemen nachteilig, dass der Benutzer an das Terminal als Ein-/Ausgabeeinheit gebunden ist, was Rechnersysteme auch mit den heute verfügbaren großen Funktionsumfängen relativ unflexibel macht. Des Weiteren benötigen eine Spracheingabeeinheit eines Kommunikationssystems aufgrund der Komplexität und Aufwand einer Spracherkennung eine hohe Menge an elektrischer Energie, so dass insbesondere bei transportablen Geräten eine Spracherkennung nur kurzfristig durchgeführt werden kann, da dies die Akkulaufzeit wesentlich verkürzt.
  • In der US 6 070 140 B ist ein Computersystem beschrieben, das einen Speech-Transducer als Spracheingabe- und -ausgabeeinheit und einen zentralen Prozesser umfasst, wobei das System eine Wake-Up-Erkennungsmittel aufweist, das mit dem Speech-Transducer gekoppelt ist. Der Speech-Transducer ist mit einer Spracherkennung gekoppelt, die von einem Power-Down Prozessor aktiviert wird, wenn ein Wake-Up-Signal erkannt wird. Das Wake-Up-Signal kann ein Sprachsignal über eine bestimmten Lautstärkeschwelle, oder ein vorbestimmbares Wort wie „wake-up” sein.
  • Aus der US 2010/0023204 A1 ist ein Fahrzeugkommunikationssystem bekannt, dass eine Sprachkommunikation mit einem Mobilgerät unterstützt. Durch die Sprachkommunikation können Telefonanrufe, Emails oder SMS-Kommunikation erledigt werden.
  • Die DE 40 29 717 A1 betrifft ein Fernbedienungssystem, das aufgrund eines eingegebenen Sprachbefehls ein Fernbedienungssignal übertragen kann. Im Fernbedienungssystem ist ein Detektor vorgesehen, der durch einen Schaltzustand einer Sprechschaltertaste erkennen kann, ob ein Sprachbefehl empfangen wird. Ein Detektorsignal des Detektors wird an eine Leistungsversorgungs-Steuerschaltung gegeben, die eine Zuführung elektrischer Energie an eine Spracherkennungsschaltung unterbricht, falls der Detektor feststellt, dass kein Sprachbefehlsempfang vorliegt.
  • Der Erfindung liegt die Aufgabe zugrunde, ein System bereitzustellen, bei welchem die Laufzeit der Stromversorgung eines sprachgesteuerten Kommunikationssystems verlängert wird.
  • Zur Lösung dieser Aufgabe sind die Merkmale des Anspruchs 1 vorgesehen. Vorteilhafte Ausführungsformen und zweckmäßige Weiterbildungen der Erfindung sind in den Unteransprüchen beschrieben.
  • OFFENBARUNG DER ERFINDUNG
  • In einem ersten Aspekt der Erfindung wird ein sprachgesteuertes Kommunikationssystem vorgeschlagen, das ein Gerät mit einer zugeordneten Spracheingabe- und Ausgabeeinheit sowie eine zentrale Rechnereinheit umfasst. Das Gerät und die Rechnereinheit weisen Mittel zur Datenübertragung auf, wobei mit der Spracheingabe- und Ausgabeeinheit eine Sprachsteuerung für auf dem Gerät und/oder der Rechnereinheit implementierte Funktionen erfolgt, welche unabhängig von den Positionen und/oder fest an die Rechnereinheiten gekoppelten Ein-/Ausgabeeinheiten sind. Es wird vorgeschlagen, dass die Spracheingabeeinheit ein Sprachüberwachungsmittel umfasst, das unabhängig von dem Betriebszustand der Spracheingabe- und Ausgabeeinheit und der Rechnereinheit betreibbar ist, und das bei Detektion zumindest eines vorbestimmbaren Sprachbefehls eine Aktivierung des Gerätes vornehmen kann. Somit wird eine Spracheingabeeinheit im Kommunikationssystem vorgeschlagen, wobei ein energiesparendes Spracheingabemittel permanent aktiv ist, und dass unabhängig von der Energieversorgung des übrigen Systems betreibbar ist. So können große Teile der Spracheingabeeinheit auf Stand-By Betrieb geschaltet werden, und ein rudimentäres Sprachüberwachungsmittel, dass lediglich in der Lage ist, wenige vorbestimmbare Sprachbefehle zu erkennen, ist aktiv und scannt die Umgebungsgeräusche nach einem Sprachbefehl. Bei Empfang des oder der Sprachbefehle aktiviert das Sprachüberwachungsmittel die übrige Spracheingabeeinheit bzw. das ganze Kommunikationssystem, so dass weitere Befehle verarbeitet werden können. Hierdurch wird eine intuitive Bedienung bei extrem langen Stand-By Zeiten und geringem Akkuverbrauch gewährleistet.
  • Das Sprachüberwachungsmittel ist erfindungsgemäß an eine separate Energieversorgung, insbesondere einem separaten Akkumulator, Batterie etc. angeschlossen. Ist das Sprachüberwachungsmittel an einer separaten Energieversorgung angeschlossen, so bleibt auch bei Erschöpfung dieses Akkumulators oder Batterie das übrige, im Stand-By-Modus befindliche Kommunikationssystem einsatzbereit und kann notfalls durch konventionelle Tastenbedienung oder Touchscreeneingabe bedient werden. Somit wird ein sprachgesteuertes Kommunikationssystem mit einer extrem langen Stand-By-Zeit bzw. hoher Energieeffizienz vorgeschlagen.
  • Die Sprachsteuerung und -bedienung erfolgt somit in sprachlicher Kommunikation mit einem Anwender, ohne dass eine Aktivierung mittels einer Geste auf einem Touchscreen oder Betätigen eines Schalters erforderlich wird. Das Kommunikationssystem überwacht lückenlos die menschliche Kommunikation nach Schlüsselwörtern, wonach eine Spracheerkennung- oder Interaktion aktiviert wird, wie sie aus bisherigen fortschrittlichen Smartphones oder Tablets bekannt ist. Erkennt das Sprachüberwachungsmittel einen Schlüsselbegriff bzw. ein vorbestimmbaren Sprachbefehl, so wird die übliche Spracheingabeeinheit des Kommunikationssystem aktiviert und übernimmt die weitere Spracheingabeanalyse und entsprechende Sprachsynthese, die im weiteren in einer Sprachausgabe gewünschter Information oder Verhaltensmuster des Systems mündet. Hierdurch wird ein Kommunikationssystem wie Smartphone, Tablet, Notebook oder PC zu einem Audiokommunikationspartner und verliert seine Technizitätshaptik durch haptische Aktivierung mittels Touchscreeneingabe, Knopf- oder Schalterbetätigung oder sonstiger mechanische Aktivierung.
  • Gemäß einer ersten Variante kann das sprachgesteuerte Kommunikationssystem als stationäres System, das heißt in Form einer Home-Version, ausgebildet sein. Eine Homeversion kann eine PC-Anwendung auf einem stationären PC oder Notebook sein, auch eine Implementation in einem HomeControl-System zur Steuerung einer Vielzahl elektrischer Geräte wie Klimaanlage, Heizung, Beleuchtung etc. kann mittels der Sprachsteuerung ausgestattet sein.
  • Das Gerät kann ein eingebautes Farbdisplay und einen Touchscreen, bevorzugt ein in einem Farbdisplay integrierten Touchscreen auf AMOLED oder LCD-Basis umfassen. Das Display kann bevorzugt eine Full-HD Auflösung größer als 450 ppi aufweisen, mit Pixeldichten von mehr als 1280 × 720 Pixeln.
  • In dem Farbdisplay und Touchscreen ist frei wählbar, ob man eine Frauen-, Männer- oder Kinderstimme als Kommunikation möchte. Zusätzlich kann man zur Sprachkommunikation Frauen-, Männer- und/oder Kindergesichter die zur Auswahl stehen als festen Kommunikationspartner wählen. Diese Gesichter sind am Farbdisplay ersichtlich.
  • In einer vorteilhaften Weiterbildung kann ein oder können mehrere Lautsprecher mit integriertem Mikrofon und/oder ein Headset kabelgebunden und/oder kabellos mit dem Kommunikationssystem zur Spracheingabe und Sprachausgabe verbunden sein. Ein Headset hat den Vorteil, dass eine Spracheingabe in sehr guter Qualität aufgenommen werden kann, wobei es keine Rückkopplungseffekte oder Störgeräusche durch Lautsprecherausgaben gibt. Boxen mit eingebautem Mikrofon als stationäre Rechnereinheiten können im ganzen Haushalt verteilt werden, sodass man immer per Sprachsteuerung mit dem Gerät verbunden ist. Diese Boxen oder ein Headset können mit dem Gerät kabellos verbunden durch NFC (Near Field Communication), Bluetooth, Infrarot und/oder WLAN, sodass man in jedem Raum, in dem sich eine oder mehrere Boxen befinden, ohne Tastenaktivierung mittels Sprachbefehl sagen kann, was man von dem Gerät möchte und somit nicht an eine nichtsprachgebundene Kommunikation, wie Touchbedienung des Bildschirms oder Knopfbedienung gebunden ist. Außerdem kann man sich über ein Headset mit dem Gerät verbinden. Die Lautsprecher mit Mikrofon können über Akkumulatoren, Knopfzelle oder erneuerbare Energiequellen, insbesondere Solarzellen mit Strom versorgt werden. Eine Aufladung ist mittels Netzgerät oder kabellos, z. B. induktiv möglich. Die vorhandenen Boxen beinhalten ein integriertes Mikrophon, welches Befehle entgegennehmen sowie Ausgaben wiedergeben kann.
  • In einer vorteilhaften Ausführung können zumindest das Sprachüberwachungsmittel und die speziell für das Sprachüberwachungsmittel vorgesehene Stromquelle in einer Baueinheit umfasst sein, die auswechselbar im Gerät aufgenommen ist. In dem Sprachüberwachungsmittel kann ein Speicher einen benutzerspezifischen Klang eines oder mehrerer Stimmenkommandos speichern, so dass nur ein oder eine geringe Anzahl von Benutzern das Gerät durch einen Sprachbefehl „aufwecken” können. Durch ein Auswechseln der Baueinheit, z. B. von einem in ein anderes Gerät kann das andere Gerät für diesen Benutzer bedienbar gemacht werden, ohne das Gerät neu einlernen zu müssen. Der Akku bzw. die Batterie für den Langzeitbetrieb des Sprachüberwachungsmittels sind ebenfalls in der Baueinheit, beispielsweise in Form einer Speicherkarte, eines auswechselbaren Chips oder ähnliches integriert und stellt die Stromversorgung sicher. Dementsprechend kann die Stromquelle hochwertig ausgeführt sein, da sie selbst bei einem Auswechseln des Gerätes in ein neues Gerät übernommen werden kann. Die Baueinheit kann ein Drahtlosinterface, beispielsweise Bluetooth oder ähnliches umfassen, und sich kontaktlos mit anderen sprachgesteuerten Geräten verbinden, um auch diese Geräte im Stand-By-Mode mittels Sprachsteuerung zu aktivieren. Hierdurch wird ein „Allround-Sprachchip” vorgeschlagen, durch das jedes sprachbedienbare Gerät in erfinderischer Weise fortgebildet werden kann.
  • Die Befehle werden durch Sprache mitgeteilt und die Ausgabe erfolgt durch eine Sprachsynthese (TTS – Text To Speech). Um einen Stromsparmodus (Stand-By-Modus) zu deaktivieren können Box und Headset durch einen vordefinierbaren Sprachbefehl bzw. eine Befehlssequenz wie „Hallo System” geweckt werden. Ein Headset kann als kabelloses Kommunikationsmittel dienen, das ebenfalls Lautsprecher und Mikrophon umfasst.
  • Nachdem man seine Wünsche geäußert hat, kann man eine Bestätigung vom Gerät durch Sprache mitgeteilt bekommen. Man kann allerdings auch alles von Hand eingeben durch die eingebaute Tastatur und dem Display. Man hat die Möglichkeit sich ein Passwort anzulegen durch z. B. einen bestimmten Satz, Zahlenkombination oder wie gewohnt mit einem oder mehreren Wörtern, um der Benutzung von Unbefugten vorzubeugen. Weiterhin ist vorgesehen, dass man sich auch per Fingerabdruck anmelden kann. Dies könnte evtl. Behörden dabei helfen Straftäter schneller zu identifizieren und zu fassen.
  • Beispielsatz zur Funktion:
    • • Benutzer: „Gerät habe ich neue Nachrichten?”
    • • Gerät: „Sie haben 3 neue Nachrichten auf...”;
    • • Benutzer: „Bitte lese mir diese Nachrichten vor!”
    • • Gerät: „Nachricht eins von... wird gelesen...” (z. B. „Hallo na wie geht es dir so?”).
    • • Benutzer: „Gerät, bitte verfasse Nachricht an...” (z. B. „Hallo es geht mir gut. Und wie geht es dir?” (alles durch Spracheingabe)).
    • • Benutzer: „Verfasste Nachricht zur Bestätigung nochmal vorlesen”
    • • Gerät: „Lese verfasste Nachricht..., bestätigen?”,
    • • Benutzer: „Bestätige. Bitte abschicken an... „
    • • Gerät: „Nachricht... wird gesendet; Nachricht gesendet an...”
  • Dies sind Beispiele einer Sprachbenutzung.
  • Man kann durch Sprachkommandos Internetseiten aufrufen und sich Teststellen auf einer Seite vorlesen lassen indem man einen ähnlichen Satzbau verwendet wie oben beschrieben.
  • Zusätzlich kann das Gerät mit folgenden Funktionen ausgestattet sein:
    Mit einem oder mehreren eingebauten Lautsprechern, Mikrofon, Ein/Aus-Schalter/Taster, Laut/Leise-Wipptaste, Menüfeld, Bestätigungs-Taste, Neustart-Funktion, Tastaturfeld, NFC/Bluetooth-Schnittstelle, WLAN-Schnittstelle, Infrarot-Schnittstelle Scrollfunktion, Multitouch-Eingabefeld, MP3/4/CD/USB/Mini USB/DVD/Blue-Ray/Mirko-CD/Mini-Discs abspielbarem Laufwerk, Kamera für Video und Foto, Interne Speicherfunktion, TV schauen durch Internet-Zugang, Strom- und Netzwerkkabel, Dolby Surround System anschließbar, Verbindbar mit Sprachboxen und/oder Headset, Menü-Funktion zur Einsicht und Speicherung von diversen Einstellungen, einer Erinnerungs- und Weckfunktion, Batterien-, Knopfzellen- und Akku-Aufnahme. Der wiederaufladbare Stromspeicher kann in Form einer Knopfzelle oder eines Li-Ionen-Akkupacks vorliegen und kann mittels erneuerbarer Energie oder beispielsweise durch einen handbetreibbaren Dynamo aufladbar sein. Des Weiteren kann eine kabellose Aufladung, beispielsweise durch eine induktive Energieübertragung vorher gesehen sein.
  • Das Innenleben dieses Gerätes kann vorteilhafterweise folgendermaßen aufgebaut sein: Das Gerät kann am Markt verfügbare Standardkomponenten nutzen. Eine Platine der elektronischen Spracherkennung findet man derzeit in diversen Smartphones, stellt also grundsätzlich keine Neuentwicklung dar. Diese Spracherkennung ist lernfähig und ausbaufähig. Die Frauen-, Kinder- und/oder Männerstimmen, sowie die zur Auswahl stehenden Gesichter findet man in den neuesten Navigationssystemen, also besteht die Technik auch schon, und kann als Paket genutzt werden. Das integrierte Mikrophon findet man im Bereich der kabellosen Telekommunikation, Abhörtechnik, Polizeibehörden, Überwachungstechnik. Im Teil des Farbdisplays kann ein Tastaturfeld geöffnet werden, wie bei der neusten Generation der Smartphone-Technologie. Es kann aber auch durch Sprache bedient werden, ohne dass eine mechanische Bedienung des Gerätes vorgenommen worden ist. Somit kann beispielsweise das Gerät auch Remote, z. B. durch einen Telefonanruf bedient werden, in dem das Gerät angerufen wird, und Funktionen des Gerätes durch ein Telefongespräch, d. h. durch Erkennung und Analyse von Sprachbefehlen aktiviert werden.
  • Eine moderne und sichere Passworteingabe durch Fingersteuerung, Zahlenkombination oder ebenfalls mittels Sprachsteuerung kann vorgesehen sein. Die Software ist bekannt und verfügbar in der Smartphone Technologie. Die anbringbaren kabellosen Hörboxen kann der Kunde individuell im Gebäude anbringen, durch z. B. eine Halterung, es können aber auch stehende Boxen zur Funktion dienen. Jede Hörbox hat ein Mikrophon zur Sprachsteuerung integriert, dieses Mikrophon wird per Bluetooth und/oder WLAN genutzt.
  • Das sprachgesteuerte Kommunikationssystem mit dem erfindungsgemäßen Gerät kann in sämtlichen Wohnbereichen des Hauses/Wohnung aufgestellt werden, da man nicht zwingend davor sitzen muss. Es ist für den privaten sowie geschäftlichen Bereich nutzbar. Allerdings kann man es auch mobil und während dem Führen eines Fahrzeugs nutzen. Das erfindungsgemäße sprachgesteuerte Kommunikationssystem kann als bequemes Hilfsmittel für PC, Handy, Radio sowie als Navigationssystem eingesetzt werden. Es soll aber kein Ersatz hierfür sein.
  • Folgende Beispiele zur Nutzung werden nachstehend genannt:
    • • Über YouTube lassen sich Lieder abspielen gegebenenfalls mit Musikvideo;
    • • Polizeibehörden, FBI, BKA und viele mehr können kostengünstig Täterfahndungen abspielen lassen;
    • • Kinowerbung kann abgehört werden;
    • • Automobilhersteller können neue Generationen incl. Vorstellungsvideo ablaufen lassen;
    • • Neueste Nachrichten wie Sportnachrichten, allgemeine Nachrichten können abgespielt werden. z. B. Social-Network-Nachrichten oder neuste Meldungen diverser Tageszeitungen etc.;
    • • Neuerscheinungen im Multimedia-Bereich werden angezeigt und vorgelesen, zum Beispiel Neuheiten im Bereich Smartphone;
    • • Nachrichten über neueste Studien im Gesundheitsbereich, zum Beispiel wenn Heilmittel gegen Demenz entdeckt werden, werden übermittelt und vorgelesen usw.;
    • • Regionale Geschäfte können die Nutzer des konventionellen intelligenten sprachgesteuerten Kommunikationssystems davon in Kenntnis setzen, dass eine große Werbeaktion bevor steht;
    • • Eine bargeldlose Bezahlung sowie Kontoführungsaktionen eines Bank- oder PayPal-Kontos kann unter exklusiver Verwendung der Sprachsteuerung mittels des Kommunikationssystems durchführbar sein;
    • • Geschäftlich: Einberufung eines Meetings kann neben anderen Tätigkeiten leicht und schnell über das konventionelle intelligente sprachgesteuerte Kommunikationssystem getätigt werden. Durch Sprachsteuerung, sämtliche betriebliche Einrichtungen sind mittels Hör- und Sprachboxen ausgestattet, kann aber auch über das betriebliche E-Mail-Programm sprachlich gesteuert und zur Anwendung gebracht werden;
    • • Sämtliche Produkthersteller aus der Industrie, Handwerk, Lebensmittel, Pharmaindustrie, Bereich der elektr. Kommunikation können Werbung auf dem Gerät schalten;
    • • Sämtliche Internet-Kommunikations- und Soziale Netzwerkaccounts können durch Sprachsteuerung abgehört und bearbeitet werden;
    • • Software für sämtliche Reparatur- und Bedienungsanleitungen (zum Beispiel für den Haushalt, KFZ, Elektrogeräte und Handwerk) sind über Internet-Suchmaschinen erreichbar und über das Gerät sprachlich abspielbar (realisierbar im Bereich der Blindenschrift);
    • • Die zu benutzende Software ist einsetzbar in TV-Geräten;
    • • Eingebautes Navigationsgerät;
    • • Eingebaute Lautsprecher sowie Mikrofon, Kamera für Video- und Fotoaufnahmen;
    • • In Zukunft kann das Gerät auch an einen eigenen Verteiler angeschlossen werden der erneuerbare Energien speichert. So werden Stromkosten gesenkt und evtl. der Haushalt mit eigen produzierter Energie betrieben;
    • • Beim Diktieren von Nachrichten bessert das Gerät eventuelle Schreibfehler gleich aus, da es zumindest phasenweise, vorzugsweise im bestimmungsgemäßen Gebrauch mit dem Internet verbunden ist, in dem sich Wörterbücher befinden;
    • • Maut kann durch eingebautes Mautkonto bezahlt werden;
    • • Durch einen eingebauten Beamer können Bilder, Videos usw. an die Wand oder Leinwand projiziert werden;
    • • Kann als mobile Spielekonsole verwendet werden oder anschließbar an TV oder PC;
    • • Werbung die vom Nutzer nicht gehört oder gelesen werden möchte, kann direkt sprachlich oder per Handeingabe in den Papierkorb weitergeleitet werden. Die Nutzer haben auch die Möglichkeit alle Werbungen zu sperren, sodass Sie keine Werbung mehr erhalten.
  • Mögliche Erweiterungen sind:
    • • Eine Bedienung bzw. Steuerung diverser Funktionen eines Kraftfahrzeugs, Nutzfahrzeugs, Lastkraftwagen, Schienenfahrzeug sowie Luft- und Raumfahrzeug kann mittels Sprachsteuerung vorgenommen werden, dies ist auch außerhalb des Fahrzeugs möglich, bspw. Mittels Funkkommunikation durch GSM, WLAN, Bluetooth oder ähnliches;
    • • Sämtliche Geräte, wie zum Beispiel Haushaltsgeräte etc, lassen sich mit diesem Gerät bequem, einfach und schnell steuern. Zum Beispiel Spülmaschinen-Hersteller geht mit diesem Gerät über das vorgenannte Interfache in Kommunikation, um dieses Haushaltsgerät sprachlich ohne mechanische oder visuelle Interaktion steuern zu können. Dies ist auch räumlich getrennt von den Geräten möglich, bspw. Mittels Funkkommunikation durch GSM, WLAN, Bluetooth oder ähnliches;
    • • Erstellung von 3D-Projektionen;
    • • Der Fingerabdruck, der für die Anmeldung gescannt wird, kann an Behörden weitergegeben werden, dadurch verbessern sie ihren Status bei staatlichen Institutionen und helfen dabei Verbrecher schneller zu fassen und zur Rechenschaft zu ziehen;
    • • Aufladbar auch durch erneuerbare Energien wie zum Beispiel durch anbringbare oder eingebaute Solarzellen, sowie Windrädchen oder per Nachtspeicher-Modus;
    • • Dieses Gerät kann in Zukunft über z. B. eine Armbanduhr gesteuert werden, eine Spracherkennung ohne mechanische Interaktion ist in der Uhr integriert.
  • Wie bereits oben angesprochen, kann in einer vorteilhaften Variante das sprachgesteuerte Kommunikationssystem ein I/O-Steuerungsinterface für diverse Geräte der Haushalts- und Unterhaltungselektronik umfassen. Somit kann mittels Sprachkommunikation mit dem Kommunikationssystem durch das Steuerungsinterface eine Steuerung der Haushalts- und Unterhaltungsgeräte durchgeführt werden, sowie eine Statusangabe der Geräte ausgegeben werden. Somit ist es möglich, mittels Sprachsteuerung beispielsweise eine Gebäudetelematik zu steuern und Angaben über den Status von Haushaltsgeräten wie Sonnenschutzsystemen, Heizung, Klimaanlage etc. zu erhalten. So kann beispielsweise ein Anwender durch Anruf an einen Anschluss des Kommunikationssystems von unterwegs Aktionen diverser Haushaltsgeräte veranlassen und sich über deren Status durch Sprachkommunikation informieren.
  • Das erfindungsgemäße sprachgesteuerte Kommunikationssystem kann nach einer vorteilhaften Version als ein mobiles System bilden (mobile Version). Die Funktionen sind gleich wie die der Home-Version. Das Gerät kann beispielsweise als Smartphone, Tablet-PC, Netbook oder Notebook ausgebildet sein, auch beispielsweise als tragbares Informationssystem wie eine tragbare Kleincomputerbrille wie Google Glass. Man kann das Gerät mit einem aufladbaren Akku und/oder Batterien ausstatten oder aufladbar durch erneuerbare Energien wie zum Beispiel Solarenergie oder Windenergie und Nachtspeicher Funktion, wie auch bereits bei der Homeversion und anderen Variationen des Gerätes.
  • Vorteilhafterweise kann das Gerät eine Stromquelle umfassen, die eine Mehrzahl von aufladbaren Akkumulatoren, regenerative Energiequellen wie Solarzellen und/oder Batterien beinhaltet, wobei ein Akkumulator vorzugsweise eine Kombination aus einer chemischen Stromquelle und einer Kondensatoranordnung umfasst, und die Sprachüberwachungseinheit wechselweise Energie von einem der Mehrzahl der Akkumulatoren, regenerativen Energiequellen und/oder Batterien bezieht, während die übrige Spracheingabeeinheit, sowie die Ausgabeeinheit, die Rechnereinheit und sonstige Teile des Gerätes von den übrigen Akkumulatoren und/oder Batterien des Gerätes versorgbar sind. Die Sprachüberwachungseinheit kann aktiv bleiben, und empfangene Audiosignale auf „Schlüsselwörter” überprüfen, während das übrige Gerät ausgeschaltet bzw. sich in einem Stromsparmodus befindet. Hierbei wird die Spracheingabeeinheit vorzugsweise von einer separaten Akkumulator oder einer Batterie gespeist, um die Stromversorgung des Restgerätes nicht zu belasten. Die Sprachüberwachungseinheit kann beispielsweise stufenweise das Gerät von einem ausgeschalteten Zustand in einem ersten, einem zweiten oder weiteren Stromsparmodi versetzen (z. B. hoch- und niedriggetakteter Prozessortakt, zugeschaltete Parallelprozessorkerne, Bildschirm und Funkschnittstellen deaktiviert, im Stromsparmodus oder im Hochleistungsmodus). Z. B. kann die Sprachüberwachungseinheit bei einem Geräuschpegel unter einer vordefinierbaren Schwelle das Gerät ausschalten, bei einem höheren Geräuschpegel eine Stromsparstufe des Gerätes aktivieren, die z. B. bei direkter Ansprache erhöht wird. Beim Empfang von „Schlüsselwörtern” kann das Gerät in einen Einschaltzustand versetzt werden.
  • Vorteilhafterweise kann die die Sprachüberwachungseinheit versorgende, wiederaufladbare Stromquelle ein Schnellladeakkumulator, insbesondere ein Akkumulator auf Basis einer dreidimensionalen LI-Ionen-Kathoden-Nanostruktur mit einer Metallfüllung sein. Eine Kombination aus elektrochemischer Akkumulator und Kondensator kann durch eine dreidimensionale Nanostruktur, ermöglicht werden, um Akkumulatoren in Minuten, gar Sekunden ohne Leistungseinbußen aufzuladen. Ermöglicht wird dies durch eine neue Struktur für die Batterie-Kathoden, die es erlauben, ohne Kapazitätsverlust bei der Energiespeicherung die Be- und Endladezeiten drastisch zu verringern. Das Problem bei herkömmlichen Akkus ist vor allem, dass sie zwar schnell entladen, aber nicht schnell beladen werden können. Batterien, die zwar große Energiemengen aufnehmen können, können diese wiederum nicht schnell liefern und auch nicht schnell wieder aufnehmen. Außerdem verschlechtert sich die Leistung von typischem Nickel-Metallhydrid-(NiMH) oder Lithium-Ionen-(Li-Ion)-Akkus mit jeder schnellen Be- und Endladung. Durch das Aufbringen eines dünnen Films aktiven Materials im Inneren der Batterie können die Lade- und Endladevorgänge extrem beschleunigt werden – bis zu 100 Mal schneller, als bei herkömmlichen Batterien. Um volumenmäßig die Energiedichte zu erhöhen kann ein Film in dreidimensionaler Struktur eingesetzt werden, der neben der Schnellladung auch die entsprechend hohe Kapazität mitbringt. Eine derartige dreidimensionale Struktur kann beispielsweise durch eine Oberflächenbeschichtung erreicht werden, die als winzige Kugel startet und sich dann zu einem Gitter ausbildet. Die Zwischenräume können mit Metall gefüllt werden, sodass aus den geschmolzenen Kugeln ein poröses, schwammartiges 3D-Gerüst entsteht. Durch ein „Elektropolieren”, wobei durch gleichmäßiges Ätzen der Gerüstoberfläche die Poren vergrößert werden, wird ein offenes Netz erzeugt. Vorzugsweise kann der Rahmen mit einer dünnen Schicht aktiven Materials überzogen werden. So entsteht eine bikontinuierliche Struktur der Elektroden mit kleinen Verbindungen, die es den Lithium-Ionen erlauben, sich schnell zu bewegen und zudem von der guten elektrischen Leitfähigkeit des Metallrahmens zu profitieren. Die Akkumulatorenbasis ist nicht auf Li-Ionen-Batterien beschränkt, sondern kann eine universell einsetzbare Technologie für sämtliche Akkumulatoren bereitstellen, die in derartigen Kommunikationssystemen einsetzbar sind. Insbesondere die Akkumulatoreinheit, die sehr schnell aufladbar sind, und die mittels geringer Energiekapazität nur das Sprachüberwachungsmittel und nicht das gesamte Kommunikationssystem oder die vollständige Spracheingabeeinheit versorgen.
  • Gemäß einer weiteren vorteilhaften Ausführungsform kann die Spracheingabeeinheit, insbesondere die Sprachüberwachungseinheit ein Umweltgeräuschunterdrückungsabschnitt umfassen, dass ein Umweltgeräuschunterdrückungsabschnitt umfasst, dass eingerichtet ist, Geräusche einer bestimmten Quelle zuzuordnen und Umweltgeräusche vor Detektion eines Sprachbefehls auszublenden. Unter Antischall (auch „aktive Lärmkompensation”, engl. Active Noise Reduction [ANR] oder Active Noise Cancellation [ANC]) versteht man umgangssprachlich Schall, der künstlich erzeugt wird, um mittels destruktiver Interferenz Schall auszulöschen. Dazu wird die Erzeugung eines Signals angestrebt, das dem des störenden Schalls mit entgegengesetzter Polarität exakt entspricht. Bei Kopfhörern mit aktiver Geräuschunterdrückung wird mit einem eingebauten Mikrofon das Umgebungsgeräusch gemessen und hieraus mit Hilfe der akustischen Übertragungsfunktion des Kopfhörers der Anteil berechnet, der am Ohr noch verbleiben würde. Für diesen Teil wird dann zur Kompensation ein gegenpoliges Signal im Kopfhörer erzeugt. Am Trommelfell treffen der Schall von außen und das Signal aus dem Hörer als Schall zusammen. Der Schalldruckpegel wird deutlich verringert. Zusätzlich kann parallel ein Nutzschall (Sprache, Musik) über den Kopfhörer wiedergegeben werden. Beispiele derartiger Geräuschunterdrückungssysteme sind Plantronics-Headsets der Discovery und Voyagerserie mit AudioIQ-Technologie. Diese passt die Lautstärke beim Gesprächspartner mit der Umgebungslautstärke des Sprechers an, gleichzeitig werden Hintergrundgeräusche herausgefiltert.
  • Vorteilhafte Funktionen des Kommunikationssystems können folgende sein: Die mobile Version ist ausgestattet mit Lautsprechern, Farbdisplay, sowie über MP3/4/CD/DVD/Blue-Ray/Mini-Disc/Mikro-CD-Laufwerk, USB Anschluss, Mini-USB-Anschluss, Speicherkarten-Slot sowie alle zukünftigen Abspielformate. Das Gerät verfügt auch über eine eingebaute Bluetooth-Funktion um z. B. Dokumente vom Handy auf das Gerät zu übertragen. Es kann sämtliche Funktionen wie die Horne-Version ausführen. Es ist mit dem Internet verbunden, um es auch unterwegs nutzen zu können, wenn kein WLAN-Anschluss oder Netzkabel oder zukünftige Internet zugängliche Verbindungen zur Verfügung stehen. Man kann dann wie gewohnt z. B. ins Internet und sich durch Sprachbefehle die neusten Nachrichten vorlesen lassen oder sich Musik anhören. Man kann auch soziale Netzwerke (Facebook, Google+, XING- oder ähnliches) oder die Emails aber auch sämtliche anderen Internetseiten aufrufen und zusätzlich andere kommunikative Apps nutzen durch Sprachkommandos und sich diese wie schon bei der Home-Version vorlesen lassen. Man kann auch wie gewohnt über z. B. Skype telefonieren. Oder man kann sich eine Messenger-App herunterladen wie beispielsweise „WhatsApp” und dann gratis oder kostenpflichtig/kostengünstig an andere der Mobile-Version-Nutzer Nachrichten verschicken. Die Vorteile der mobilen Version sind wie folgt: man spart sich den Handy-Akku auf für Notfälle oder wenn man jemanden anrufen möchte der noch keine Home-Version, Mobile oder Drive besitzt. Man hat mit der mobilen Version immer einen Musikapparat dabei und muss nicht mehr einen schweren CD-Spieler mit sich herumtragen. Man ist immer mit dem Internet verbunden und kann alles durch Sprachkommandos anhören, selbst verfassen und sämtliche Funktionen steuern. Die mobile Version verfügt darüber hinaus auch über eine eingebaute Webcam, kann aber auch über mehrere Webcams verfügen, damit man z. B. auch Video-Chats mit anderen Nutzern durchführen kann oder wie bei Face-Time sich gegenseitig sieht. Man kann per USB-Stick die Daten auch auf das Gerät übertragen und auf dem internen Speicherplatz speichern, sodass man nicht zwingend einen USB-Stick oder CD mitnehmen muss um Musik zu hören oder sich gespeicherte Dokumente durchlesen kann. Die Sprachkommandos kann man entweder über ein eingebautes Mikrofon und/oder mehrere Mikrofone aber auch über Headset, das per Bluetooth verbunden, ist eingeben. Man hat auch die Möglichkeit, seine Wünsche per eingebaute Tastatur, die im Touchscreen eingebaut ist, per Hand eingeben, sodass bei Mikrofon-Ausfall oder leerem Akku im Headset man trotzdem sämtliche Funktionen nutzen kann. Man wird in der Zukunft auch mit 3D-Projektionen z. B. Videos anschauen können. Die Mobilfunkkosten werden gesenkt, da man nicht mehr zwingend ein Handy mitnehmen muss um telefonieren zu können oder Nachrichten zu verschicken, da über einen geringeren Grundbetrag diese Funktionen mit dem Gerät kostenlos bzw. kostengünstig durchzuführen sind, wie z. B. da die Skype-App oder für Nachrichten über „WhatsApp”-Messenger oder ähnliches zur Verfügung steht. Diese ganzen Funktionen sind ebenfalls integriert in der Home, Mobile und Drive Version. Um sämtliche Arten unseres sprachgesteuerten Kommunikationssystems aufladen zu können, kann man dies Mittels erneuerbaren Energien Beispiel Solarenergien (integrierte Solarzellen) tätigen, sowie für sämtliche zukünftige Energie quellen. Die Mobile Version hat zusätzlich Eigenschaften eines Satellitentelefons.
  • Das erfindungsgemäße sprachgesteuerte Kommunikationssystem kann vorteilhaft in Fahrzeugen eingesetzt werden (Drive-Version). Die Drive-Version ist mit sämtlichen Funktionen ausgestattet, wie schon die Home- und Mobile-Version. Die Drive-Version ist vorwiegend für den Gebrauch in sämtlichen Fahrzeugen sowie in Flugzeugen und Schienenfortbewegungsmitteln gedacht. Die Drive-Version verfügt wie alle anderen über permanente Internetverbindung durch Satellit oder Vertragsabschluss. Außerdem hat die Drive-Version ein eingebautes Navigationssystem und kann entweder ins Fahrzeug eingebaut werden wie ein CD-Spieler oder man schließt ihn einfach entweder an das eingebaute Radio an oder über den Zigarettenanzünder. Die Drive-Version hat ebenfalls ein eingebautes CD/DVD-Laufwerk sowie ein USB/Mini, USB-Anschluss und eine Bluetooth-Schnittstelle und kann somit alle bestehenden Navigationssysteme sowie Radio ersetzen. Radiosender können durch Zuruf ohne manuelle Auswahl bzw. händische Bedienung abgespielt und gespeichert werden. Hierbei ist es vorteilhaft, dass Sprach-, Musik oder Tonausgaben des Kommunikationssystem bzw. daran angeschlossener Peripheriegeräte bei der Sprachanalyse berücksichtigt, gleichermaßen bei einer Sprachanalyse „subtrahiert” werden, um Sprachbefehle eines Anwenders zu verstehen. Man kann mit der Drive-Version wie schon bei den anderen Versionen alles durch Sprachsteuerung steuern und sich ebenfalls auch seine Nachrichten vorlesen lassen, auf YouTube zurückgreifen usw. alles wie gehabt per Sprachkommandos. Man kann auch wieder zum Beispiel via Skype oder anderen Versionen damit telefonieren, da es ein oder mehrere eingebaute Mikrofone sowie integrierte Lautsprecher hat. Die Lautsprecher muss man aber nicht zwingend an schalten, da diese nach Anschluss des Gerätes mit den schon eingebauten Boxen im Fahrzeug funktionieren. Sie dienen lediglich als Schutz, falls die Boxen im Fahrzeug ausfallen sollten. Man kann auch wie gewohnt sich nicht nur Nachrichten vorlesen lassen, sondern kann auch wieder selbst Nachrichten verfassen und abschicken. Selbstverständlich alles über Sprachsteuerung. Der Touchscreen dient auch wieder als Navigationshilfe. Da er auch über große interne Speicher verfügt, kann man Musiktitel und/oder andere Dokumente darauf speichern. In der Zukunft kann man dann auch wieder mit 3D-Projektionen arbeiten. Das Gerät lässt sich in der Zukunft so umgestalten, dass es zur Fahrhilfe dient, sodass dann das Fahrzeug entweder manuell gesteuert werden kann, oder das Gerät die Steuerung per Sprache übernimmt. Der Gedanke der nicht weit weg ist, ist, dass man das Gerät jetzt schon nutzen kann als elektronische Bremshilfe und/oder als Einparkhilfe. Durch die Drive-Version hat man sozusagen seinen Computer immer dabei mit allen Daten die für denjenigen wichtig sind und ist immer Internet nutzungsfähig. Wärmekameras integriert für Beispiel: Hilfe bei Nachtfahrt falls etwas auf die Straße rennt was man selbst nicht gleich erkennt. Das Gerät erkennt es durch Wärmebild und bremst das Fahrzeug selbständig. Die am Fahrzeug eingebauten Infrarotsensoren melden dem Gerät, wenn der gesetzliche Sicherheitsabstand nicht eingehalten wird. Gesetzliche Vorschriften für Sicherheitsabstand werden länderübergreifend per z. B. Satellit an das System übermittelt, eingespeichert und ausgeführt. Vorteil: niedrigere Unfallquote.
  • Musik kann vom Gerät automatisch leiser gestellt sobald die Navigation Anweisungen ausgibt. Sämtliche Benutzerdienste des Geräts sind anwendbar auf alle Varianten des intelligenten sprachgesteuerten Kommunikationssystems. Benutzung mit Gerät nur möglich durch vorherige Passworteingabe. Möglich durch z. B. Spracherkennung oder Tastatur. Satzbeispiel:
    • • Benutzer: „ikarus 987 hörst du mich?”
    • • Gerät: „ikarus 987 bestätigt wieder Inbetriebnahme.”
  • Die Sätze können variabel ausgestaltet sein. Das System schaltet nach selbst bestimmbarem Zeitraum wieder in Sicherheitsmodus und muss dann wieder durch gleichen Satz in Betriebsmodus geschaltet werden, da befugte Person anwesend und für Unbefugte somit gesperrt.
  • Vorteilhafterweise kann im Kommunikationssystem ein Bildaufnahmesensor, insbesondere eine CCD-Kamera auf einer nutzerzugewandten Eingabeseite eines Eingabetouchscreens umfasst sein, die die Spracherkennung der Spracheingabeeinheit mittels Gebärdenerkennung unterstützt. So kann mittels einer Frontkamera eines Smartphones, eines Tablets oder einer Skypekamera eines PCs eine Gesichtserkennung, insbesondere eine Mundbewegungserkennung durch die Spracherkennungseinrichtung durchgeführt werden, wobei neben den durch ein Mikrofon erkannten Sprachsignalen die Mundbewegung zur Verbesserung der Spracherkennung eingesetzt werden. Dies ist insbesondere günstig, wenn der Anwender aufgrund einer Krankheit wie Halsschmerzen oder beim Essen eine undeutliche Aussprache hat. Auch kann optisch erkannt werden, ob der Benutzer sich beim Sprechen in Richtung des Mikrofons richtet, oder mit anderen Personen spricht, so dass das Sprachüberwachungsmittel nicht nur auf eine Audioerkennung eines Sprachbefehls sondern sich auch auf eine visuelle Richtungserkennung des Anwenders stützen kann.
  • Zusätzlich kann eine Ausführungsform des sprachgesteuerten Kommunikationssystems nicht nur im Auto, Lkw usw. seinen Einsatz finden, sondern auch beim Motorradfahren. Dies funktioniert wie folgt: Halterung des Geräts kann am Lenker befestigt werden. Dies muss aber nicht sein. Da man im ständigen sprachlichen Kontakt zum Gerät steht, muss man nicht zwingend auf den Bildschirm schauen, da man es auch anderweitig im oder am Motorrad verstauen kann. Dies beugt der Ablenkung durch das Display vor. Vor dem Motorradfahren muss man auf Status MOTORRAD schalten. Das bedeutet, zur Verkehrssicherheit sind nur folgende Funktionen anwendbar: Sprachgesteuertes Navigationssystem, Durchsagen der neuesten Staumeldungen und Unfallmeldungen über zum Beispiel Satellit oder Internetradio, das nur diese Meldungen durchgibt und keine Musik abspielt.
  • Funktionsweise über Headset mit dem man hören und sprechen kann und diese Funktionen optimal zur Anwendung bringen kann. Die Aufladung des Headsets kann man mittels Ladestation von zuhause aus tätigen, bzw. erneuerbare Energien. Man kann aber auch nach Leerung der Aufladung auf Batteriebetrieb schalten. Routenplanung durch Spracheingabe und Speichermodus möglich.
  • Eine Routenplanung kann während der Fahrt über Headset abhörbar sein. Das heißt Fahrer bekommt von Gerät via Headset sprachliche Mitteilung wie die Strecke abzufahren ist, sowie neueste Staumeldungen, Tempobegrenzungen, Geschwindigkeitsüberschreitung wird Fahrer sprachlich mitgeteilt, Unfallmeldungen usw.
  • Das Kommunikationssystem kann einem Anwender Eingaben und Anweisungen zur Kontrolle bestätigen oder vor einer Ausführung nachfragen. So können Texte per Sprache verfasst sein (Speech-to-Text Funktion), und diese können wieder vorgelesen werden, um eventuelle Fehler zu korrigieren. Es kann beispielsweise eine Bestätigung ausgegeben werden, dass eine Nachricht versendet wurde. Eine Speech-to-Text-Funktion kann integriert sein, oder durch Zugriff auf eine Internetressource ermöglicht werden. Ein Standort kann durch Sprachbefehl ermittelt werden, um einer Navigationsanwendung genaue Standortangaben zu geben. Im Bereich Telefonie kann eine Telefonnummer durch Sprechen von Zahlen oder durch Angabe eines Namens und Suche in einer Kontaktdatenbank eingegeben werden. Bei Bedarf kann eine Zuhör- und Spracheingabemöglichkeit beispielsweise durch Ansage eines Sprachbefehls deaktiviert werden, so dass beispielsweise auf eine haptische Eingabe, z. B. Bedienung über Tastatur bzw. Touchscreen umgeschaltet wird. Ein weiterer Sprachbefehl kann die Spracheingabemöglichkeit wieder aktivieren.
  • ZEICHNUNGEN
  • Weitere Vorteile ergeben sich aus der folgenden Zeichnungsbeschreibung. In der Zeichnung sind Ausführungsbeispiele der vorliegenden Erfindung dargestellt. Die Zeichnung, die Beschreibung und die Ansprüche enthalten zahlreiche Merkmale in Kombination. Der Fachmann wird die Merkmale zweckmäßigerweise auch einzeln betrachten und zu sinnvollen weiteren Kombinationen zusammenfassen.
  • Es zeigen beispielhaft:
  • 1 eine erste Ausführungsform eines erfindungsgemäßen Kommunikationssystems;
  • 2 eine zweite Ausführungsform eines erfindungsgemäßen Kommunikationssystems.
  • AUSFÜHRUNGSFORMEN DER ERFINDUNG
  • In den Figuren sind gleiche oder gleichartige Komponenten mit gleichen Bezugsziffern bezeichnet.
  • Zur Erläuterung der Erfindung zeigt 1 ein erstes Ausführungsbeispiel 10 eines Kommunikationssystems der Erfindung. Das Kommunikationssystem 10 ist als mobile Einheit 28, beispielsweise als Smartphone oder Tabletcomputer ausgebildet und in einem Gehäuse eines Gerätes 12 umfasst. Das Gerät 12 umfasst eine Spracheingabeeinheit 14 und eine Sprachausgabeeinheit 16. Das Kommunikationssystem 10 wird durch eine Rechnereinheit 44 gesteuert, die die Funktion der Spracheingabeeinheit 14, insbesondere eine Spracherkennung durchführen kann. Die Rechnereinheit 44 ist mit einem Datenübertragungsmittel 18 in bidirektionaler Datenkommunikation verbunden, wobei das Datenübertragungsmittel 18 ein WLAN-Transceiver, ein 2G, 3G oder 4G-GSM-Funkmittel, ein Bluetoothmittel oder eine Kombination davon sein kann. An der Rechnereinheit 44 ist des Weiteren ein Touchscreen 46 angeschlossen, um grafische Ausgaben und haptische Eingaben vornehmen zu können. Des Weiteren können Knöpfe, Schalter etc. für eine haptische Eingabe mit der Rechnereinheit 44 verbunden sein.
  • Das Gerät 12 wird mittels einer Stromquelle 22, beispielsweise ein Netzgerät oder ein Akkumulator mit elektrischer Energie versorgt. Die Spracheingabeeinheit 14 ist mit einem Mikrofon 42 und die Sprachausgabeeinheit 16 ist mit einem Lautsprecher 44 verbunden. Die Spracheingabeeinheit 14 umfasst ein Sprachüberwachungsmittel 20, dass direkt mit der Stromquelle 22 verbunden ist, und unabhängig vom Aktivierungszustand des Gerätes 12 Audiosignale des Mikrofons 42 aufnehmen und nach vorbestimmbaren Sprachbefehlen wie beispielsweise „ikarus 987” überwachen kann. Bei Detektion eines vorbestimmbaren Sprachbefehls kann das Sprachüberwachungsmittel 20 ein Aktivierungsrelais 48 betätigen, der die übrigen Teile des Gerätes 12 bestromt und somit das Kommunikationssystem aktiviert. Hierdurch wird im Ruhezustand Energie gespart, so dass eine sehr lange Stand-By-Zeit des Gerätes 12 erreicht werden kann. Dennoch ist das Gerät 12 durch Zuruf eines vorbestimmbaren Sprachbefehls aktivierbar, wonach eine optimierte Spracheingabeeinheit eine Spracherkennung vornehmen und gewünschte Aktionen des Benutzers ausführen kann.
  • In der 2 ist ein weiteres Ausführungsbeispiel des Kommunikationssystems 12 Erfindung dargestellt. Dieses orientiert sich im grundsätzlichen Aufbau an dem in 1 dargestellten Ausführungsform. Das Gerät 12 umfasst des Weiteren einen Bildaufnahmesensor 34, der eine CCD-Kamera sein kann und der mit der Rechnereinheit 44 oder mit dem Sprachüberwachungsmittel 20 verbunden sein kann. Der Bildaufnahmesensor 34 ermöglicht insbesondere bei Umgebungsgeräuschen eine verbesserte Spracherkennung durch Analyse der Mundmimik eines Benutzers, und erkennt, ob der Benutzer in Richtung Gerät 12 oder in eine abgewandte Richtung spricht. Des Weiteren umfasst das Gerät 12 ein I/O-Steuerungsinterface 36, das mit der Rechnereinheit 44 verbunden ist und dass ein externes Haushalts- oder Unterhaltungselektronikgerät 38, beispielsweise eine Jalousie, Klimaanlage, Heizung, Stereoanlage, Multimediasystem mittels Sprachbedienung steuern kann. Des Weiteren umfasst das Sprachüberwachungsmittel 20 einen Umweltgeräuschunterdrückungsabschnitt 32, der Umgebungsgeräusche durch eine Audiodatenverarbeitung kompensieren kann. Schließlich ist in der Stromquelle 22 ein Akkumulator 24 zum Betrieb aller Einheiten des Gerätes 12 sowie eine Kondensatoranordnung 26 zum exklusiven Betrieb des Sprachüberwachungsmittel 20 im Stand-By-Mode des Gerätes 12 integriert. Des Weiteren umfasst die Stromquelle 22 eine regenerative Energiequelle in Form einer Solarzelle 30, mit der im Stand-By-Mode der Kondensator 26 bzw. der Akkumulator 24 aufgeladen werden kann.
  • Das Kommunikationssystem 10 ist vollständig durch Sprachsteuerung bedienbar, es ist hierzu weder eine Knopf- noch Touchscreenbedienung erforderlich. Somit ist es nicht notwendig, haptisch mit dem Kommunikationssystem 10 zu interagieren.
  • Bezugszeichenliste
  • 10
    Kommunikationssystem
    12
    Gerät
    14
    Spracheingabeeinheit
    16
    Sprachausgabeeinheit
    18
    Datenübertragungsmittel
    20
    Sprachüberwachungsmittel
    22
    Stromquelle
    24
    Akkumulator
    26
    Kondensator
    28
    Mobile Einheit
    30
    Solarzelle
    32
    Umweltgeräuschunterdrückungsabschnitt
    34
    Bildaufnahmesensor
    36
    I/O-Steuerungsinterface
    38
    Haushalts-/Unterhaltungselektronikgerät
    40
    Lautsprecher
    42
    Mikrofon
    44
    Rechnereinheit
    46
    Touchscreen
    48
    Aktivierungsrelais

Claims (10)

  1. Sprachgesteuertes Kommunikationssystem (10) umfassend ein Gerät (12) mit einer Spracheingabeeinheit (14) und Sprachausgabeeinheit (16) und wenigstens eine zentrale Rechnereinheit (44), wobei das Gerät (12) Mittel zur Datenübertragung (18) aufweist, und wobei mit der Spracheingabe- und Ausgabeeinheit (14, 16) eine Sprachsteuerung für auf dem Gerät (12) implementierte Funktionen erfolgt, welche unabhängig von den Positionen und/oder fest an das Gerät (12) gekoppelten Ein-/Ausgabeeinheiten (40, 42, 44) sind, wobei die Spracheingabeeinheit (14) ein Sprachüberwachungsmittel (20) umfasst, das unabhängig von dem Betriebszustand der Spracheingabe- und Ausgabeeinheit (14, 16) und der Rechnereinheit (44) betreibbar ist, und das bei Detektion zumindest eines vorbestimmbaren Sprachbefehls eine Aktivierung des Gerätes (12) vornehmen kann, dadurch gekennzeichnet, dass das Sprachüberwachungsmittel (20) an einer Energieversorgung einer Stromquelle (22) angeschlossen ist, die separat von der Energieversorgung des Kommunikationssystems (10) ist.
  2. Sprachgesteuertes Kommunikationssystem (10) nach Anspruch 1 dadurch gekennzeichnet, dass das Gerät (12) und die oder jede Rechnereinheit (44) stationäre Einheiten bilden.
  3. Sprachgesteuertes Kommunikationssystem (10) nach Anspruch 1 dadurch gekennzeichnet, dass das Gerät (12) eine mobile Einheit (28) ist oder das Gerät (12) in einem Fahrzeug installiert ist.
  4. Sprachgesteuertes Kommunikationssystem (10) nach einem der vorgenannten Ansprüche, dadurch gekennzeichnet, dass das Gerät (12) eine Stromquelle (22) umfasst, die eine Mehrzahl von aufladbaren Akkumulatoren (24), regenerative Energiequellen wie Solarzellen (30) und/oder Batterien beinhaltet, wobei ein Akkumulator (24) vorzugsweise eine Kombination aus einer chemischen Stromquelle und einer Kondensatoranordnung (26) umfasst, und das Sprachüberwachungsmittel (20) wechselweise Energie von einem der Mehrzahl der Akkumulatoren (24), regenerativen Energiequellen und/oder Batterien bezieht, während die übrige Spracheingabeeinheit (14), sowie die Sprachausgabeeinheit (16), die Rechnereinheit (44) und sonstige Teile des Gerätes (12) von den übrigen Akkumulatoren (24) und/oder Batterien des Gerätes (12) versorgbar sind.
  5. Sprachgesteuertes Kommunikationssystem (10) nach Anspruch 4, dadurch gekennzeichnet, dass zumindest die das Sprachüberwachungsmittel (20) versorgende, wiederaufladbare Stromquelle (22) ein Schnellladeakkumulator, insbesondere ein Akkumulator auf Basis einer dreidimensionalen LI-Ionen-Kathoden-Nanostruktur mit einer Metallfüllung ist.
  6. Sprachgesteuertes Kommunikationssystem (10) nach einem der vorgenannten Ansprüche, dadurch gekennzeichnet, dass die Spracheingabeeinheit (14), insbesondere das Sprachüberwachungsmittel (20) einen Umweltgeräuschunterdrückungsabschnitt (32) umfasst, der eingerichtet ist, Geräusche einer bestimmten Quelle zuzuordnen und Umweltgeräusche bei Detektion eines Sprachbefehls auszublenden.
  7. Sprachgesteuertes Kommunikationssystem (10) nach einem der vorgenannten Ansprüche, dadurch gekennzeichnet, dass ein Bildaufnahmesensor (34), insbesondere eine CCD-Kamera auf einer nutzerzugewandten Eingabeseite eines Eingabetouchscreens (46) umfasst ist, die die Spracherkennung der Spracheingabeeinheit (14) mittels Gebärdenerkennung unterstützt.
  8. Sprachgesteuertes Kommunikationssystem (10) nach einem der vorgenannten Ansprüche, dadurch gekennzeichnet, dass ein I/O-Steuerungsinterface (36) für diverse Geräte (38) der Haushalts- und Unterhaltungselektronik umfasst ist, so dass mittels Sprachkommunikation mit dem Kommunikationssystem (10) durch das Steuerungsinterface (36) eine Steuerung der Haushalts- und Unterhaltungsgeräte (38) durchführbar ist, sowie eine Statusangabe der Geräte (38) ausgebbar ist.
  9. Sprachgesteuertes Kommunikationssystem (10) nach einem der vorgenannten Ansprüche, dadurch gekennzeichnet, dass ein oder mehrere Lautsprecher (40) mit integriertem Mikrofon (42) und/oder ein Headset kabelgebunden und/oder kabellos mit dem Kommunikationssystem (10) zur Spracheingabe und Sprachausgabe verbunden ist.
  10. Sprachgesteuertes Kommunikationssystem (10) nach Anspruch 4, dadurch gekennzeichnet, dass zumindest das Sprachüberwachungsmittel (20) und die Stromquelle (22) in einer Baueinheit umfasst ist, die auswechselbar im Gerät (12) aufgenommen ist.
DE102013108627.6A 2012-10-08 2013-08-09 Sprachgesteuertes Kommunikationssystem Expired - Fee Related DE102013108627B4 (de)

Priority Applications (1)

Application Number Priority Date Filing Date Title
DE102013108627.6A DE102013108627B4 (de) 2012-10-08 2013-08-09 Sprachgesteuertes Kommunikationssystem

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
DE202012009638.9 2012-10-08
DE201220009638 DE202012009638U1 (de) 2012-10-08 2012-10-08 Sprachgesteuertes Kommunikationssystem
DE102013108627.6A DE102013108627B4 (de) 2012-10-08 2013-08-09 Sprachgesteuertes Kommunikationssystem

Publications (2)

Publication Number Publication Date
DE102013108627A1 DE102013108627A1 (de) 2014-04-10
DE102013108627B4 true DE102013108627B4 (de) 2015-07-23

Family

ID=47554472

Family Applications (2)

Application Number Title Priority Date Filing Date
DE201220009638 Expired - Lifetime DE202012009638U1 (de) 2012-10-08 2012-10-08 Sprachgesteuertes Kommunikationssystem
DE102013108627.6A Expired - Fee Related DE102013108627B4 (de) 2012-10-08 2013-08-09 Sprachgesteuertes Kommunikationssystem

Family Applications Before (1)

Application Number Title Priority Date Filing Date
DE201220009638 Expired - Lifetime DE202012009638U1 (de) 2012-10-08 2012-10-08 Sprachgesteuertes Kommunikationssystem

Country Status (1)

Country Link
DE (2) DE202012009638U1 (de)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018115036A1 (de) 2016-12-22 2018-06-28 Volkswagen Aktiengesellschaft Sprachausgabestimme eines sprachbediensystems
DE102017217746A1 (de) 2016-12-22 2018-06-28 Volkswagen Aktiengesellschaft Verfahren, Vorrichtung und computerlesbares Speichermedium mit Instruktionen zum Aktivieren einer Sprachverarbeitung, Kraftfahrzeug und Nutzerendgerät mit einer Sprachsteuerung

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102016002463A1 (de) 2016-03-01 2016-09-29 Daimler Ag Verfahren zum Betrieb einer Sprachsteuerung
US11631396B2 (en) 2018-06-12 2023-04-18 Siemens Mobility GmbH Method and device for logging an item of information relating to a rail vehicle
US20210269073A1 (en) 2018-06-21 2021-09-02 Siemens Mobility GmbH Method and device for controlling a rail vehicle
WO2023087039A1 (de) * 2021-11-18 2023-05-25 Markus Lenger Vorrichtung zur bedienung einer hardware

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE4029717A1 (de) * 1989-12-29 1991-07-04 Pioneer Electronic Corp Sprachgesteuertes fernbedienungssystem
US6070140A (en) * 1995-06-05 2000-05-30 Tran; Bao Q. Speech recognizer
US20100023204A1 (en) * 2008-07-24 2010-01-28 Basir Otman A Power management system

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE202007006640U1 (de) * 2007-05-09 2007-08-09 Lin, Pi-Fen Tragbarer Bluetooth-Lautsprecher

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE4029717A1 (de) * 1989-12-29 1991-07-04 Pioneer Electronic Corp Sprachgesteuertes fernbedienungssystem
US6070140A (en) * 1995-06-05 2000-05-30 Tran; Bao Q. Speech recognizer
US20100023204A1 (en) * 2008-07-24 2010-01-28 Basir Otman A Power management system

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018115036A1 (de) 2016-12-22 2018-06-28 Volkswagen Aktiengesellschaft Sprachausgabestimme eines sprachbediensystems
DE102017217746A1 (de) 2016-12-22 2018-06-28 Volkswagen Aktiengesellschaft Verfahren, Vorrichtung und computerlesbares Speichermedium mit Instruktionen zum Aktivieren einer Sprachverarbeitung, Kraftfahrzeug und Nutzerendgerät mit einer Sprachsteuerung
DE102017219596A1 (de) 2016-12-22 2018-06-28 Volkswagen Aktiengesellschaft Sprachausgabestimme eines Sprachbediensystems

Also Published As

Publication number Publication date
DE102013108627A1 (de) 2014-04-10
DE202012009638U1 (de) 2012-12-17

Similar Documents

Publication Publication Date Title
DE102013108627B4 (de) Sprachgesteuertes Kommunikationssystem
EP3598435B1 (de) Verfahren zur verarbeitung von informationen und elektronische vorrichtung
CN111630876B (zh) 音频设备和音频处理方法
CN105141506B (zh) 通信消息处理方法和装置
CN109348051A (zh) 自动接听手机通话的方法、装置、设备及介质
CN109525012B (zh) 充电装置、充电控制方法、充电控制系统及存储介质
DE102008015187A1 (de) Sprachgesteuertes Freisprech-Telefonsystem zum akustischen Verkünden von Fahrzeugkomponenten-Informationen für Fahrzeugbenutzer in Reaktion auf durch die Benutzer gesprochene Anforderungen
WO2014183517A1 (zh) 一种控制音频输出的方法及装置
CN201667653U (zh) 具备语音传输和语音识别触发功能的车用无线蓝牙装置
CN107786714B (zh) 基于车载多媒体设备的语音控制方法、装置及系统
CN108307271A (zh) 一种智能设备的音量调节方法、装置及智能设备
CN109080565A (zh) 一种应用于车辆的应急方法及系统
CN110140343A (zh) 一种基于车联的提示方法及装置
CN102883054B (zh) 一种移动终端基于人脸更换铃声提示类型的方法及系统
CN111586523B (zh) 会议声音采集方法和会议声音播放方法
CN106231133B (zh) 报警方法及装置
CN203358474U (zh) 一种车载蓝牙免提音响设备及汽车
US10997975B2 (en) Enhanced vehicle key
EP3583498A1 (de) Verfahren und vorrichtung zur unterstützung des fahrers eines kraftfahrzeuges
CN210327717U (zh) 一种车辆会议模式全方位语音交互系统
CN203278827U (zh) 智能蓝牙免提组件
CN112313601B (zh) 车辆、视觉域控制器、视频数据处理方法、设备和介质
CN116160970A (zh) 一种汽车智能睡眠控制系统及方法
CN212073940U (zh) 一种对讲车载调度屏
CN207637470U (zh) 一种电子信息显示门牌

Legal Events

Date Code Title Description
R012 Request for examination validly filed
R016 Response to examination communication
R016 Response to examination communication
R018 Grant decision by examination section/examining division
R020 Patent grant now final
R119 Application deemed withdrawn, or ip right lapsed, due to non-payment of renewal fee