-
Nachstehend
wird bevorzugt eine Vorrichtung beschrieben, deren Benutzeroberfläche (sog. „Man-machineinterface") vorrangig das gesprochene Wort
nutzt, bevorzugt im Zusammenhang mit einer Fernbedienung, wobei
der Benutzer in die Lage versetzt wird, die Funktionsweise der Benutzeroberfläche besser
zu verstehen, und sich diese ins Gedächtnis einzuprägen. Die
Vorrichtung beinhaltet eine Anzahl weiterer Merkmale, welche ihre
Nutzung erleichtern. Als bevorzugtes Ausführungsbeispiel wird ein neuartiges
audiovisuelles Terminal beschrieben, welches eine Anzahl von Unterhaltungs-,
Informations-, Überwachungs-
und Kommunikationsfunktionen bereitstellt und bevorzugt durch Senioren,
und/oder auch als intelligentes Küchen- oder Kinder-Radio genutzt
werden kann.
-
1. Stand der Technik
-
- 1.1 Bekannt sind Radios mit Aufzeichnungsfunktion,
wobei ein Radioprogramm digital gespeichert wird, und wobei dieses
Programm auch noch ausgewertet werden kann, indem z. B. dessen Struktur
erkannt wird, sodass Musik und Sprache voneinander abtrennbar werden,
und in getrennten Speicherbereichen abgelegt werden können. Während die
technische Bereitstellung hierfür ausreichender
Speichermengen praktisch gelöst ist,
ist die Frage nach der besten Bedieneroberfläche (in der Literatur auch „User Interface" genannt) noch völlig offen.
Die Verwaltung eines aufzeichnenden Radios kann ähnlich komplex sein wie die
eines entsprechenden Videorecorders und z. B. danach verlangen,
dass Kanal-Zuweisungstabellen gepflegt werden, Programme temporar
oder auch permanent archiviert werden, dass nicht jeder sie löschen kann,
etc. Bis zu einem gewissen Grade helfen hier automatisierte Prozesse,
welche der Benutzer aber zu einem gewissen Grad kennen muss, und
welche eine Bedienungsprozedur aufweisen, an welche er sich erinnern
muss.
- 1.2 Bekannt sind sprachgesteuerte Telefonanlagen, nach Art einer
Freisprechanlage für
Mobiltelefon der gehobenen Klasse, die es erlauben, weitgehend ohne
Berühren
eines Apparates z. B. in einem Auto zu telefonieren.
- 1.3 Der neuere Stand der Technik lehrt die rein akustisch geleistete
Ortung von Tonquellen (sog. Blindortung), z. B. mit PCs der gehobenen
Leistungsklasse, wobei mit einer Anzahl von Mikrofonen in einem
Raum eine Anzahl von Tonquellen erkannt und lokalisiert wird, sodass
Störgeräusche weitgehend
weggefiltert werden können,
um eben nur den direkt von den jeweiligen Quellen stammenden Schall
auszuwerten.
- 1.4 Bekannt sind Fernbedienungen, welche die Abläufe in einer
Video- oder HiFi-Anlage steuern. Als Standard haben sich hierfür Infrarot-Fernbedienungen
durchgesetzt. Moderne Fernbedienungen greifen auf die meisten Funktionen
derartiger Anlagen zu, und sind daher häufig ebenfalls kompliziert.
- 1.5 Bekannt ist die Fernwartung von Computersystemen, z. B.
das Einrichten eines Client-PCs durch einen Administrator, welcher über eine
Datenleitung auf diesen PC zugreift und bevorzugt an seinem Arbeitsplatz
die Benutzeroberfläche dieses
PCs sieht, wobei er auf sämtliche
Funktionen dieses PCs zugreifen kann.
- 1.6 Bekannt sind MIDI-Codes zur Steuerung von Soundkarten und
Sound-Synthesizern, welche es erlauben, mit einfachen Tastaturen
oder anderen Vorrichtungen, kostengünstig ein teures Musikinstrument
zu simulieren.
- 1.7 Bekannt sind Mobiltelefone mit Notfallknopf, wobei der Benutzer
durch Drücken
dieses Knopfes eine voreingestellte Telefonnummer anruft und einen
Notruf schaltet. Dabei müssen
diese Telefone stets vom Benutzer getragen werden.
- 1.8 Breit in der Literatur dargestellt ist die sog. Medienkonvergenz,
wonach z. B. PCs (oft auch als „Media Center" bezeichnet) so aufgerüstet werden,
dass sie alle vom jeweiligen Benutzer erwünschten Unterhaltungs-, Informations-, Überwachungs-
und Kommunikationsfunktionen bereitstellen, einzeln oder in Kombination,
und auch noch für
klassische Büro-
und technische Aufgaben brauchbar sind.
-
Derartige
Systeme sind einerseits teuer, anfällig, energiehungrig, und laut,
sowie anfällig
für Hacker,
Viren und Angriffe aller Art, wobei diese Merkmale historisch-technisch
nachvollziehbar sind; andererseits sind sie schlicht zu kompliziert:
- – die
zugrundeliegenden aktuellen PCs sind einfach zu mächtig, sodass
die Hersteller aufgrund des Konkurrenzdruckes zu viele Funktionen
hineinpacken und sich aus dem gleichen Grund nicht auf einen Standard
einigen können,
und sie sind
- – aus
historischen Gründen
mit Eingabevorrichtungen versehen, deren Funktionen sich teilweise überlappen:
z. B. Tastatur, Maus, Grafiktablett, Keyboard; und ebenso mit Programmen
ausgestattet, die gemäss
unterschiedlichen Konzepten bedient werden wollen, und sie sind
schliesslich
- – mit
einer Software versehen, die nicht langzeitstabil ist wie z. B.
bei einem mikroprozessorgesteuerten Radio; vielmehr hat der Kunde
in vergleichsweise kurzen Abständen
Updates zu gewärtigen.
Ferner wird der Kunde dazu ermutigt, Software zu installieren, deren
Einfluss auf sein System er weder angezeigt bekommt, noch bei Anzeige
verstehen würde.
-
Hier
wird ein fiktiver, kompetenter Individualbenutzer postuliert, der
im Grunde alleine zurecht kommt und bestenfalls gelegentlich und
dann oft widerwillig, gute Ratschlage bei einer zentralen Instanz nach
Art eines Call-Centers holt. Diese Call-Center muss der Benutzer
eigen-initiativ anrufen, er muss die Telefonnummer haben usf.; andererseits
kann der Call-Center-Agent in aller Regel nicht direkt auf das betroffene
System zugreifen, sondern er macht Vorschläge am Telefon und der Benutzer
setzt diese um. Dieses an sich völlig
unplausible Postulat ist in den vergangenen zwei Jahrzehnten, z.
B. im PC- und auch im Mobilfunkmarkt, ungeheuer erfolgreich gewesen,
und wir erleben aktuell den Versuch, dieses Modell auf den Markt
der Unterhaltungselektronik zu übertragen.
-
Nun
ist eine ganze Kohorte der zugehörigen Benutzer
aktuell zu Senioren geworden. Diese hätten für Zuhause, fürs Radiohören und
Telefonieren sowie gegebenenfalls für den Notruf, gerne auch eine
Art Multimedia-PC, aber eben ohne die vorstehend gelisteten Komplikationen,
und sie würden
unter den richtigen Voraussetzungen auch die lokale Intervention eines
Call-Center-Agenten an diesem Gerät tolerieren.
-
Es
ist also ein Umfeld entstanden, in dem man ein wirklich bequem zu
bedienendes Terminal bereitstellen könnte, welches bevorzugt den
Fernseher und/oder den Arbeits-PC ergänzt, und dabei bestimmte Informations-,
Unterhaltungs- und gegebenenfalls Lernbedürfnisse des Benutzers wesentlich besser
abdeckt als stationäre
Radios, Telefone und auch Zeitungen dieses vermögen. Das Terminal sollte Merkmale
beinhalten, welche auf spezielle Bedürfnisse eingehen, z. B. die
permanente Bereitstellung einer Notruf-Funktion, oder haptische
Elemente (z. B. Tasten oder Drehknöpfe) zur Nutzung einer elektronischen
Bedienungsanleitung und/oder Hilfefunktion, oder als Notfall-Knopf
zum Zurückversetzen
des Terminals in einen definierten Ausgangszustand.
-
Das
Terminal taugt aufgrund seiner Komplexität als Beispiel für eine erfindungsgemässe Vorrichtung,
die vorstehenden Bemerkungen zur Benutzeroberfläche können jedoch auf viele andere
Vorrichtungen abgebildet werden.
-
2. Beschreibung der Erfindung
-
Die
nachstehend beschriebene Erfindung löst ihre Aufgabe mittels einer
Vorrichtung nach Anspruch 1, welche geeignete Funktionalitäten in der Bedieneroberfläche realisiert,
und mit einem Verfahren nach Anspruch 10 zur Bereitstellung derartiger Funktionalitäten. Weitere
Merkmale der Erfindung sind in den abhängigen Ansprüchen niedergelegt.
-
Der
Anmelder behält
sich vor, bestimmte Merkmale der Erfindung im Rahmen gesonderter
Patentanmeldungen zu verfolgen.
-
Die
Erfindung beinhaltet eine Fernbedienung (13) zur Steuerung
einer Vorrichtung (1), wobei (1) in einer bevorzugten,
nachstehend beschriebenen und in 1 gezeigten
Variante, als Audio- und Text-Terminal realisiert ist. Bevorzugt
ist (1) mit Sprachbefehlen gem. 2.1.2 nachstehend steuerbar,
(1) beinhaltet also „Speech-to-Text" nach Stand der Technik;
bevorzugt kann (1) auch noch, mit sog. „Text-to-Speech" Verfahren, Text
als gesprochenes Wort synthetisieren und hörbar machen.
-
Bevorzugt
beinhaltet (1) die Elemente eines Analogradios, Internet-Radios,
eines Freisprech-Telefons, eines Notruftelefons sowie eines elektronischen
Briefkastens, und ist auch z. B. als MIDI-Abspielgerät sowie
als Interface für
Brettspiele und Spielzeug nutzbar, oder als Vorrichtung zur vereinfachten
virtuellen Begehung von dreidimensionalen Tonkulissen. (1)
mit (13) richten sich in dieser Variante z. B. an Benutzer,
die ein einfach bedienbares, intern aber mächtiges Informationsterminal
haben wollen, z. B. an Senioren, indem es einerseits den Zugang
zum klassischen Radioangebot erschliesst sowie zu Nischenprogrammen
aller Art, inklusive Internet-Radiostationen
und -Diensten welche den Senioren Kontakt zu Jüngeren und/oder die Bildung
von Gruppen ermöglichen.
Die Nutzung einer Infrastruktur nach Art des Internets hebt die
traditionellen Beschränkungen
für derartige
Angebote (Kanalknappheit, Auflagen aller Art) weitgehend auf. Der
häufigen Klage
der Benutzer, dass das von ihnen bevorzugte Programm immer zur Unzeit
komme, wird dabei durch eine eingeschränkte, aber besonders einfach zu
bedienende Timeshifting-Funktion Rechnung getragen.
-
Das
vorstehend grob skizzierte Plichtenheft von (1) führt aber
auch dazu, dass die Steuerung von (1) selbst bei maximaler
Vereinfachung der einzelnen Bedienfunktionen in nicht reduzierbarer
Form komplex bleibt, wenn alle Funktionen genutzt werden sollen.
Das gilt insbesondere für
sprachgesteuere Vorrichtungen, bei denen der bei Fehlfunktionen
im Benutzer induzierte Stress zu stimmlichen Veränderungen oder Fehlreaktionen
führt,
sodass der Bedienfehler zu einer Art Selbstäufer wird. Die hier vorgeschlagene
Lösung
besteht darin, weitere Elemente zur Steuerung von (1) bereit
zu stellen und mit der Spracherkennung/Sprachsynthese zu verknüpfen.
-
Bevorzugt
können
die einfacheren Funktionen in (1) auch mit haptischen Bedienelementen,
z. B. mit Drehknöpfen
(4), (5), (6) oder Schaltern (2),
(3) gesteuert werden. Bevorzugt sind eine Anzahl von Bedienelementen
in (1) mit Sensoren versehen, derart dass z. B. das Berühren des
Bedienelementes mit dem Finger von (1) erkannt wird, sodass
ein zugeordneter Prozess aufrufbar ist. Letzterer beinhaltet bevorzugt
eine spezifische Hilfefunktion, z. B. dass (1) in hörbarer,
maschinell versprachlichter Form, relevante Teile der Bedienungsanleitung
ausgibt, wobei dieser Prozess durch die Fernbedienung (13)
gesteuert werden kann, und wobei (1) oder (13)
den Benutzer dazu veranlassen können,
bestimmte Bedienelemente zu berühren.
Bevorzugt kann eine Anzahl von Berührungen eines Bedienelementes
in einer bestimmten zeitlichen Folge, nach Art eines Morse-Codes,
zusätzlich
von (1) oder (13) interpretiert werden, z. B.
indem dreimalige kurze, gefolgt von dreimal langer, und wieder dreimal
kurzer Berührung
von (1) als eine Aufforderung interpretiert wird, einen
Passus aus zugehörigem
Hilfetext zu versprachlichen.
-
Bevorzugt
sind diese Sensoren so beschaffen, dass der Ort, an dem das Bedienelement
berührt wird,
durch (1) erkennbar wird, sodass der Benutzer z. B. einen
bestimmten Ort auf dem Display (11) berühren und hierzu Informationen
abrufen kann.
-
Dabei
kann einer der von (1) genutzten Informationskanäle eine
ständig
aktualisierte, versprachlichbare Bedienungsanleitung beinhalten,
die bevorzugt von (1) aufgezeichnet wird.
-
Es
sind zwei weitere Modi vorgesehen, um (1) komplexere Befehle
zu übermitteln,
bevorzugt um neue Einstellungen zu setzen und/oder die Software in
(1) zu pflegen: erstens der lokale Zugriff über eine digitale
Schnittstelle, zweitens die Fernwartung über eine Breitbandleitung.
Bevorzugt wird die Fernwartung durch einen Datenkanal erleichtert,
der in einem Rundfunkmodus gem. 2.1.1 nachstehend, einer Anzahl
von Teilnehmern zeitgleich Informationen zur Verfügung stellt.
-
Vorstehende
Merkmale erlauben es dem Benutzer, erstens, sich im Regelbetrieb
auf nur wenige Funktionalitäten
zu beschränken;
zweitens sich selbständig
die weniger genutzten und/oder komplexeren Funktionen ins Gedächtnis zurückzurufen;
und drittens, von einem befreundeten Fachmann oder über ein
Call-Center Änderungen
oder Updates einspielen zu lassen. In diesem letzteren Fall – und im
Gegensatz z. B. zu PCs nach Stand der Technik – bleibt jedoch ein allen Terminals
gemeinsamer Grundzustand, bevorzugt gem. 2.2.1 nachstehend, unantastbar,
sodass (1) und (13) unter allen Umständen, auch untereinander,
kommunizieren können
und nutzbar bleiben.
-
Bevorzugt
kann der Benutzer die erfindungsgemässe Bedienung von (1)
mittels (13), während
eines Telefonates mittels (1) leisten, ihn ein anderer Benutzer,
oder ein Call-Center-Agent dabei anleiten kann. Bevorzugt nutzt
die Telefonfunktion in (1) das VoIP Protokoll, welches
solche Kooperation wirksam unterstützt.
-
2.1 Definitionen
-
Ist
nichts anderes vermerkt, so bedeutet „Terminal" nachstehend „erfindungsgemässes Terminal". „Breitbandleitung" umfasst drahtgebundene
und drahtlose Telefonverbindungen aller Art.
- 2.1.1
Die Vorrichtung (1) wird bevorzugt als Radio genutzt, und
stellt dabei, in einem in dieser Schrift als „Rundfunk" bezeichneten Modus mehreren getrennten
Benutzern derartiger Radios die exakt gleiche hörbare Information zeitgleich
zur Verfügung,
wobei geringe zeitliche Abweichungen (z. B. aufgrund ungenau gehender
Uhren in derartigen Radios) ggf. toleriert werden.
Das klassische
Analogradio erfüllt
diese Bedingung trivialerweise; es ist aber auch möglich, eine Audio-Datei
oder sonstige versprachlichbare oder vertonbare Datei z. B. aus
dem Internet in ein erfindungsgemässes Radio hochzuladen, wobei diese
Datei mit einer Zeit- oder äquivalenten
Information versehen sein kann, welche es einer Anzahl von erfindungsgemässen Radios
gestattet, derartige Daten abzurufen und unabhängig voneinander, jedoch im
obigen Sinne zeitgleich abzuspielen und auf diese Weise einen Radiobetrieb zu
simulieren. Bevorzugt ist dieses bei Textdateien möglich, die
so in Sprache verwandelt werden, dass sie in einem klassischen Rundfunkmodus wahrgenommen
werden, sodass man z. B. die entsprechenden Benutzer an einem Telefon-Quiz teilnehmen
lassen kann.
Dabei wird das erfindungsgemässe Terminal „nicht
mobil" genutzt:
es wird fix genutzt wie ein Standardradio, und arbeitet mit entsprechenden, zur
Beschallung auch grosser Räume
geeigneten Lautsprecher; es spannt bevorzugt ein dreidimensionales
Koordinatensystem auf, innerhalb dessen es mittels einer Anzahl
von Mikrofonen einen oder mehrere Benutzer akustisch mit geeigneten Algorithmen
zur Audioverarbeitung lokalisiert, wobei es mehrere unterschiedliche,
räumlich
voneinander getrennte Tonquellen unterscheiden kann, z. B. verschiedene
Benutzer oder einen Benutzer und einen Fernseher.
- 2.1.2 (1) beinhaltet eine Anzahl von Mikrofonen und
einen Spracherkennungsprozess, sodass eine Anzahl von Funktionen
in (1) per Sprache aufrufbar ist.
Dabei bildet eine
Anzahl geeigneter, genormter Codewörter einen Befehl, z. B. zum
Aufrufen einer erfindungsgemässen
Radiofunktion. Bevorzugt stammen Codewörter aus der Umgangssprache. Bevorzugt
sind Befehle hingegen so gewählt, dass
sie als Ganzes in der Umgangssprache nicht vorkommen, sodass das
versehentliche Auslösen von
Funktionen in (1) unwahrscheinlich ist.
Die nacheinander
hörbar
versprachlichten Codewörter
eines Befehls bilden einen von (1) unmittelbar interpretier-
und ausführbaren
Sprachbefehl. In dieser Schrift bedeutet „versprachlichen", wenn nichts Anderes
gesagt ist, das maschinelle Umsetzen von Text in eine vom Benutzer
unmittelbar hörbare
Information, welche das Vorlesen des Textes in natürlicher
Sprache approximiert.
- 2.1.3 Eine Sprachrückmeldung
ist ein von (1) versprachlichter Text, der bevorzugt Wörter aus
der Umgangssprache beinhaltet. Mit einer Sprachrückmeldung kann (1)
signalisieren, dass ein Sprachbefehl korrekt interpretiert wurde,
oder dass es einen weiteren Sprachbefehl erwartet, bevor es eine
Funktion ausführen
kann.
- 2.1.4 Die mit Mikrofonen versehene Vorrichtung (1)
kann über
geeignete Hard- und Software an eine Breitbandleitung angeschlossen
werden. Auf diese Weise wird ein sprachgesteuertes Telefon realisiert,
wobei die Kombination von Radio und Telefon in dieser Schrift auch
als Freisprechanlage bezeichnet wird.
- 2.1.5 Die Software in (1) kann per Fernwartung gepflegt
werden, wobei bevorzugt der Benutzer und das Call-Center sich über geeignete
Prozeduren authentifizieren, z. B. über ein Sprachprofil oder über geeignete
biometrische Prozeduren inklusive der Stimmenerkennung.
- 2.1.6 Die Benutzeroberfläche
von (1) beinhaltet bevorzugt einen gegen Zugriffe und Fehlbedienung
geschützten
Grundzustand, d. h. ein Minimum an Kernfunktionen welcher es bevorzugt
gestattet, ohne weitere Hilfsmittel eine Anzahl von Telefonnummern
anzurufen, bevorzugt die des vorstehend genannten Call-Centers.
Bevorzugt umfasst der Grundzustand Funktionen in (1) die mit
haptischen Bedienelementen, z. B. gem. 1 mit Knöpfen nach
Art von (4), (5), (6) oder den Schaltern & Tasten (2),
(17), (26) aufrufbar sind, sowie eine Anzahl von
Funktionen in der Fernbedienung (13). Z. B. kann in dieser
Weise in (1) nach beliebigen Updates oder Eingriffen eines Call-Centers,
das Analogradio-Angebot sowie der Zugriff auf Hilfe erhalten bleiben.
- 2.1.7 Komplexere Befehle werden über eine digitale Schnittstelle
nach Art einer Ethernet- oder Bluetooth-Verbindung an (1) übermittelt.
Derartige Befehle beinhalten z. B. in der hier bevorzugt beschriebenen
Variante die Zuweisung von Empfangsfrequenzen zu Kanalnummern, oder
das Aufrufen von Prozessen, welche Audio, oder zu versprachlichende
Daten aus dem Internet holen, und in einem Kanal in (1)
bereitstellen. Bevorzugt sind sowohl dieser Nutzungsmodus als auch
der Zugriff auf (1) durch ein Call-Center gem. 2.1.5 durch
entsprechende Zugriffsrechte eingeschränkt.
- 2.1.8 Bevorzugt ist ein Arbeitszustand definiert, welcher die
Funktionalität
des Grundzustandes beinhaltet, jedoch weitere Funktionen bereitstellt und
zunächst
ab Werk gesetzt ist. Dieser kann von einem Call-Center oder über die
vorstehende digitale Schnittstelle modifiziert werden, indem z. B.
die Spracherkennung angepasst oder erweitert wird, oder neue Internet-Informationsquellen
eingerichtet werden. Bevorzugt kann der Benutzer, bei späteren Updates
oder nach Eingriffen seitens des Call-Centers durch einfaches Drücken eines Knopfes
(3) in den vorherigen Arbeitszustand zurückkehren.
- 2.1.9 Bevorzugt empfängt
(1) Informationen aus dem Rundfunkspektrum oder per Breitbandleitung,
und gibt diese hörbar
wieder. Bei Nutzung der Breitbandleitung empfängt es bevorzugt die Informationen
von einer bestimmten Internet-Adresse. Sowohl die dabei entstehenden,
bevorzugt zum seriellen und hörbaren
Abspielen bestimmten Informationen, als auch die vorstehend erwähnten konventionellen
Audiokanäle,
werden hinfort als Kanäle
bezeichnet. Bevorzugt wird bei Kanälen nach Echtzeitkanälen und
Archivkanälen unterschieden.
Bevorzugt (z. B. entsprechend 1) beinhaltet
ein Archivkanal aufgezeichnetes Material für die vergangenen 24 Stunden.
- 2.1.10 Bevorzugt beinhaltet (1) einen internen Speicher
und generiert, bei Aufzeichnung der Daten eines Archivkanals, in
die gespeicherten Daten eingebettete Zeitstempel, welche eine Archivzeit
beinhalten. Im einfachsten Fall (z. B. bei der Aufzeichnung von
Analogradio) ist die erfindungsgemässe Archivzeit die Uhrzeit,
zu der ein bestimmtes Stuck Audio aufgezeichnet wurde. Im allgemeineren
Fall, z. B. bei als Text archivierten Nachrichten, ist die Archivzeit
die Uhrzeit, zu welcher (1) die entsprechenden Daten im
Echtzeitkanal-Betrieb hörbar
gemacht hatte.
Diese Archivzeit-Zeitstempel gestatten es dem Benutzer.
bevorzugt nach Auswahl eines Archivkanals mit (4), z. B.
mit (5) eine bestimmte Archivzeit als Einstiegspunkt in
das Abspielen dieses Kanals festzulegen. Dabei zeigt (1)
eine Zeitinformation (25) an, die bei Abspielen eines Echtzeitkanals
der normalen Uhrzeit entspricht, jedoch bei Abspielen der Archivkanäle der vom
Benutzer mittels (6) eingestellten, bzw. aktuell gültige Archivzeit.
In
einer alternativen Variante können
Archivzeit und Echtzeit separat in (11) gezeigt werden.
- 2.1.11 Eine Tonkulisse bezeichnet eine einen Anzahl von Tonquellen
in einem bevorzugt verhallten Raum, wobei die Tonkulisse durch einen
Benutzer oder eine Vorrichtung ortsgebunden wahrgenommen bzw. aufgezeichnet
wird. Beim Normalbenutzer entsteht dieser räumlichen Eindruck aus einer Kombination
von physischer Wahrnehmung und kognitiver Interpretation des Wahrgenommenen; während die
Vorrichtung nach Stand der Technik mittels einer Anzahl von räumlich verteilten
Mikrofonen die jeweiligen Töne
phasenrichtig aufzeichnet, und z. B. durch Verarbeitung der aufgezeichneten
Signale in der Lage ist, eine sog. Blindortung der Tonquellen vorzunehmen,
derart dass z. B. unerwünschte
Tonquellen unterdrückt
werden können,
und/oder ausgewählte
Tonquellen besser hörbar
gemacht werden. Der erfindungsgemässe Benutzer befindet sich
in einer solchen Tonkulisse; eine derartige Tonkulisse kann aber
auch andernorts aufgenommen und dem Benutzer zugänglich gemacht werden, z. B.
eine Familienfeier an welcher der Benutzer nicht physisch teilnehmen,
die er jedoch mithören
kann.
- 2.1.12 Icons sind kleine Bilder, die für den Benutzer leicht interpretierbar
sind, nach Art der Bildsymbole auf einer Benutzeroberfläche. Z.
B. kann ein Icon (20) in einem Display (11) anzeigen,
dass ein gewählter
Kanal (23) ein Archivkanal ist, welcher zeitversetzt oder
in Echtzeit abspielbar ist. Wird für diesen Archivkanal nun mit
(5) tatsächlich eine
Archivzeit eingestellt, ab welcher er abgespielt werden soll, so
zeigt bevorzugt ein weiteres, vor der Zeitanzeige (25)
angebrachtes Icon (24) an, dass die in (11) angezeigte
Zeit keine Echtzeit ist, sondern eine Archivzeit, welche den Tonabschnitt
des Kanals mit der Nummer (23) bezeichnet, der gerade gehört wird.
In 1 ist bevorzugt und beispielhaft gezeigt, dass „heute", am 12.10.07 der
Archivkanal 45 gerade Tonmaterial abspielt, welches in
Echtzeit gestern – am 11.10.07 – um 13:30
Uhr gehört
worden wäre.
Bevorzugt
sind Icons dynamisch, d. h. sie können sich verändern, um
einen Zustand anzuzeigen.
An (1) fix angebrachte Symbole
wie das Hilfesymbol (22) werden ebenfalls als Icons bezeichnet; auch
diese können
sich verändern,
z. B. aufleuchten.
-
2.2 Detailliertere Beschreibung eines
bevorzugten Beispiels
-
Bild
1, und die nachstehend detailliertere Beschreibung, betreffen ein
bevorzugtes Ausführungsbeispiel
für ein
Freisprech-Terminal (1) mit Radio- und Aufzeichnungsfunktionen,
welches zum einen mit 4 Knöpfen
versehen ist:
- – Notfallknopf (2),
mit dem eine voreingestellte Nummer gewählt wird, um Hilfe zu holen,
z. B. ärztliche
Hilfe
- – (4)
zur Kanalwahl – wobei
ein „Kanal" ein Echtzeitkanal
oder ein Archivkanal sein kann. Bei Wiedergabe eines Echtzeitkanals
werden die empfangenen Daten sofort in Ton umgewandelt, Archivkanälen können wie
Echtzeitkanäle
genutzt werden, jedoch werden dabei zusätzlich die in Töne umzuwandelnden
Informationen im Speicher von (1) eingepflegt. Bevorzugt
geschieht dies auch dann, wenn die Radio-Wiedergabefunktion in (1), z.
B. mittels (6) ausgeschaltet wurde (auf also (1) auf „OFF" gestellt wurde),
sodass (1) für
einen Archivkanal, in dieser Variante, immer die letzten 24 Stunden
Programm bereit halt. Bevorzugt kann (1) hierzu mehrere
Rundfunkkanäle
auf einmal empfangen, und/oder mehrere Internet-Sites auf einmal
auswerten
- – (5)
zur Wahl der Archivzeit zum Einstieg in das Abspielen eines Archivkanals.
In der in 1 bevorzugt gezeigten Variante
beinhaltet (5) eine mit der Zahl „0" (keine Zeitverschiebung erwünscht) bezeichnete
Ruhestellung, welche bewirkt, dass der eingestellte Kanal in Echtzeit
abgespielt wird. Bevorzugt werden Archivkanäle wie folgt gehandhabt: hat
der Benutzer einen Archivkanal ausgewählt – was bevorzugt in (11)
durch das Icon (20) vor der Kanal-Nummer angezeigt wird – so kann er
mittels (5) eine bis um 24 Stunden zurückliegende Archivzeit (ggf.
auch mit Datum in der Vergangenheit) einstellen. Bevorzugt ist (1)
so ausgebildet, dass wenn (5) losgelassen wird, wenige Sekunden
danach das Abspielen des Archivkanals zur eingestellten Archivzeit
beginnt, und es wird (5) von einem Stellglied in die Ruhestellung „0" zurückgefahren
Versucht der Benutzer, eine Archivzeit einzustellen, obwohl der
in (11) angezeigte Kanal kein Archivkanal ist, so erfolgt
bevorzugt eine versprachlichte Fehlermeldung und es wird (5)
ignoriert; bevorzugt wird binnen kurzer Zeit – z. B. weniger Sekunden – dann (5)
wieder in die Ruhestellung versetzt
- – (6)
zum Einstellen der Lautstärke
und bevorzugt zum Ausschalten der Audio-Abspielfunktion in (1) in
der Schalterstellung OFF;
und zum anderen mit einem, bevorzugt
schwer zugänglichen
Schalter (3) zum Zurücksetzen
den letzten Arbeitszustand.
-
Ferner
ist in 1 bevorzugt eine Fernbedienung (13) gezeigt,
mit welcher (1) ebenfalls steuerbar ist, und deren wesentliche
Funktion darin besteht, bei Bedarf dem Benutzer dabei zu helfen,
die Bedienung von (1) in den Griff zu bekommen. Bevorzugt
ist (13) mit diskreten Bedienungselementen versehen, z.
B. Tasten (14) oder einem Wippschalter (19).
-
Bevorzugt
ist (1) sowohl als Radio als auch als Freisprechanlage
nutzbar, indem (1) über
den Anschluss (16) ans Telefonnetz angeschlossen wird, und
indem z. B. an der Ober- und Vorderseite von (1) eine Anzahl
von Mikrofonen (7) und Lautsprechern (8) angebracht
sind. Beispielsweise könnte
das Terminal, wie in (1) andeutungsweise gezeigt, einen Lautsprecher
und 20 Mikrofone aufweisen. Bevorzugt wird mit diesen Mikrofonen
ein Benutzer nach Stand der Technik als Tonquelle lokalisiert. Bevorzugt wird
von dem jeweiligen Mikrofonsignal das von (8) abgegebene
Signal subtrahiert, sodass nur Tonquellen ausserhalb von (1)
ausgewertet werden; hierzu kann sich das Terminal automatisch – in regelmässigen Zeitabständen, oder
infolge eines verbalen Kommandos seitens des Benutzers – selber
eichen, bevorzugt indem es eine Anzahl definierter Tonpulse aussendet
und empfängt.
Bevorzugt wird der Telefon-Ansprechpartner als Name aufgerufen,
es können
aber auch Telefonnummern per Sprachbefehl, per Fernbedienung oder
gem. 2.2.1.7 per Tastatur (17), (26) eingegeben
werden.
-
Das
Radio (1) vereint bevorzugt eine Analog-Radio-Funktion
(AM/FM) mit derjenigen eines Internet-Radios und der im Obigen beschriebenen Freisprechanlage,
bevorzugt unter Nutzung von IP und VoIP Standards. Bevorzugt ist
dabei das Terminal über
einen Router (9) mit einem Breitbandanschluss (10)
verbunden, wobei diese Verbindung in 1 drahtgebunden über (16)
gezeigt ist, aber auch drahtlos sein kann.
-
(1)
wird durch einen zentralen Controller gesteuert; dessen Software
beinhaltet bevorzugt einen Kern, der nur bei physischem Eingriff
in (1) überschreibbar
oder veränderbar
ist, und der den Grundzustand sicherstellt. Bevorzugt beinhaltet
(1) ferner einen Massenspeicher der als Flash-Card realisiert ist,
der also leicht herausnehmbar und in einem anderen Gerät bespielbar
oder benutzbar ist.
-
Die
Benutzeroberfläche
ist bevorzugt in vier Ebenen gegliedert, die in 2.2.1 bis 2.2.4
nachstehend beschrieben werden.
- 2.2.1 Bevorzugt
ist für
(1) ein Grundzustand gem. 2.1.6 definiert, in dem (1)
noch nutzbar, und bevorzugt nach Drücken des Knopfes (2)
oder mittels Sprachbefehl, auch noch fernwartbar ist, wobei z. B.
die in 2.2.1.1 bis 2.2.1.7 nachstehend beschriebenen Funktionen
gegen Überschreiben oder
Updates geschützt
bleiben:
-
2.2.1.1 Freisprechfunktion zum Nutzen
der Hilfe
-
Bevorzugt
ist das Terminal als Freisprechanlage nutzbar. Bevorzugt hat der
Benutzer die Möglichkeit,
durch Drücken
eines Knopfes (2), auf den durch das Icon (22)
hingewiesen wird, eine im Terminal hinterlegte Nummer, z. B. eines
Call-Centers, anzurufen und dort z. B. um Support nachzusuchen. Bevorzugt
hinterfragt das Terminal noch einmal, ob das Call-Center wirklich
angerufen werden soll, sodass z. B. der Benutzer diesen Vorgang
rechtzeitig abbrechen kann, er allerdings dann den Knopf noch einmal
drücken
muss, um den Wahlvorgang auszulösen.
-
Bevorzugt
kann dieses Call-Center dann das Terminal fernwarten und dabei mit
dem Benutzer konferieren, wobei bevorzugt die Software, die den Grundzustand
realisiert, schreibgeschützt
ist. Bevorzugt können
die Zugriffsrechte des Call-Center-Agenten weiter eingeschränkt werden.
Weil aber dieser Vorgang immer mit Kosten behaftet ist, wird der
Benutzer sich selber dazu anhalten, oder vom Call-Center dazu angehalten
werden, andere Hilfefunktionen zu nutzen, z. B. gem. 2.2.1.6 nachstehend.
-
2.2.1.2 Zurückversetzen des Terminals in
den letzten Arbeitszustand
-
Mittels
eines bevorzugt schwer zugänglichen Schalters
(3) kann (1) gem. 2.1.8 in den Arbeitszustand
unmittelbar nach dem letzten Update zurückversetzt werden.
-
2.2.1.3 Kanalwahl und Archivierung
-
Bevorzugt
leistet ein Drehknopf (4) die Kanalwahl mittels einer absolut
geeichten Skala. Bevorzugt stehen bis zu 99 Kanäle zur Verfügung, die jeweils einer Analogfrequenz
entsprechen, oder einem Web-Radio, oder speziellen Textservern,
die z. B. laufend Agenturmeldungen liefern.
-
Erfindungsgemäss beinhaltet
(1) einen Datenspeicher, bevorzugt als in durch einen Schlitz
(18) einsteckbare Speicherkarte ausgeführt.
-
Bevorzugt
erfolgt die Einstellung von Echtzeit- und Archivkanälen, also
eine Zuordnung von Kanal-Nummern und Informationsbeschaffungsprozessen
in (1) durch das Call-Center oder über die digitale Schnittstelle
gem. 2.2.2. Bevorzugt wird zusätzlich
für jeden
Kanal ein Text abgelegt, welcher den Kanal beschreibt, und welcher
vom Benutzer – durch
einen geeigneten Sprachbefehl – im
Grundzustand als versprachlichte Erläuterung abgerufen werden kann.
Ist der durch (4) eingestellte Kanal ein Archivkanal, so
erscheint bevorzugt im Display (11) eine entsprechendes
Icon (20) vor der Kanalnummer (23).
-
Für die Archivkanäle wird
bevorzugt ein maximales Zeitintervall festgelegt, innerhalb dessen
sie archiviert werden können,
wobei bei Überschreitung dieses
Intervalls das älteste
Material aus dem Speicher gelöscht
wird, um den erforderlichen Platz für neues Material zu gewinnen.
Z. B. könnten
auf diese Weise eine Anzahl von Analog-Radiokanälen archiviert werden, derart
dass für
jeden diese Kanäle
das Audiomaterial für
die jeweils vor der aktuelle Uhrzeit vergangenen 24 Stunden als
Aufzeichnung verfügbar
sind. Bevorzugt nutzt (1) dabei Speicherkarten nach Stand
der Technik, wobei z. B. für
Fotoapparate taugliche SD-Cards mit 16 Gigabyte angekündigt sind.
Derartige Karten speichert 106 Sekunden MP3-Musik,
also rund 24 Stunden bei 10 Archivkanälen. Die Menge der abspeicherbaren
Töne ist
dabei im Wesentlichen von zwei Faktoren begrenzt: durch den verfügbaren Speicherplatz,
und durch die Effizienz, mit der die Toninformationen gespeichert
werden. Nutzt man z. B. die aktuellsten Codierungsverfahren nach
normalisiertem Stand der Technik (wie z. B. das AAC bei Digital
Radio Mondiale) so verlängern sich
die vorstehend genannten Spieldauern etwa um einen Faktor 6. Werden
laufende Textmeldungen zur Versprachlichung gespeichert, so verlängert sich
die speicherbare Zeit fast ins Beliebige. Zusätzlich zu den vorgenannten
Speichern kann das Terminal weitere interne Speicher aufweisen.
-
2.2.1.4 Wahl der Archivzeit für den Beginn
des Abspielens
-
Die
in 1 bevorzugt gezeigte Variante ermöglicht einen
Rücksprung
im Archivkanal um bis zu 24 Stunden. Dieses Zeitintervall ist willkürlich gewählt, es
sind andere Zeitintervalle denkbar, sowie Varianten welche eine
andere als die in 1 gezeigte Stundenskala (21)
beinhalten (siehe z. B. 4.2.3 nachstehend).
-
2.2.1.5 Spracheingabe in, und -ausgabe
durch das Terminal
-
Alle
vorstehend beschriebenen Grundfunktionen mit Ausnahme des Betätigens von
(3) sind erfindungsgemäss
per Sprachbefehl aufrufbar. Letztere werden bevorzugt mit einer
Anzahl von Mikrofonen (7) aufgenommen und es werden bevorzugt
die gesprochenen Codewörter
per digitaler Signalverarbeitung von Fremdgeräuschen befreit und verarbeitet.
-
Erfindungsgemäss beinhaltet
(1) Hard- und Software zur Sprachausgabe von nahezu beliebigem Text
(sog. „text-to-speech"); damit lassen sich
z. B. Videotext-Absätze
versprachlichen, indem der Videotext einer Anzahl von Fernsehprogrammen
empfangen, in einem geeigneten Server gegebenenfalls neu strukturiert
wird, von (1) abgerufen, und versprachlicht wird.
-
Bevorzugt
kann der von (1) versprachlichte Text auf das Hörvermögen eines
Seniors eingehen, indem er den Frequenzgang der gesprochenen Wörter optimiert,
die Geschwindigkeit anpasst, und die Versprachlichung der Wörter selber – u. U.
auf Kosten der Ästhetik – im Sinne
einer besseren Verständlichkeit
verfremdet.
-
2.2.1.6 Wahlweise Steuerung von (1)
durch Sprachbefehle des Benutzers, oder per Fernbedienung (13)
-
Falls
Sprachbefehle vom Benutzer vergessen wurden, oder neu erlernt werden
sollen, kann die vorstehende Sprachausgabe in (1) auch
in einem Dialog des Benutzers mit (1) und/oder (13)
genutzt werden, z. B. kann der Benutzer von (1) aufgefordert werden
die Aussprache eines bestimmten Befehls zu üben, oder er kann von (1)
gebeten werden, bestimmte Bedienelemente (14), (19) an
(13) zu betätigen.
-
Bevorzugt
werden dabei Befehle, die z. B. mittels eines Infrarot-Kanals von
(13) an (1) gerichtet sind, von (1) versprachlicht,
und bevorzugt dabei sprachlich oder durch Zusatztöne als von
(13) kommend gekennzeichnet.
-
Bevorzugt
kann die Fernbedienung (13) ebenfalls Befehle versprachlichen,
und gibt diese über
einen Lautsprecher (15) aus, derart dass sie sowohl von
(1) erkannt und verarbeitet, und vom Benutzer verstanden
werden. Dabei erkennt (1) bevorzugt, ob der Sprachbefehl
vom Benutzer oder von (13) ausgeht, und passt die Dialoge
entsprechend an: z. B. indem im ersten Fall um Antwort und/oder
weitere Befehle gebeten wird, im zweiten Fall um das Drücken einer
bestimmten Taste.
-
Bevorzugt
erkennt der Benutzer am Display (11) dass der Sprachbefehl
von (1) korrekt interpretiert wurde; bevorzugt können dabei
auch Sprachrückmeldungen
gem. 2.1.5 durch den Lautsprecher (8) erfolgen.
-
Bevorzugt
beinhaltet die vorstehende Anordnung zum Erlernen der Sprachbefehle
eine in (1) gespeicherte Bedienungsanleitung, welche mit
oder ohne (13) abrufbar ist.
-
Dabei
können
drei Effekte erzielt werden:
- a) der Benutzer
lernt bzw. lernt erneut, über
das hörbare
Zusammenspiel von (13) und (1), die Codewörter & Syntax der Kommandofolgen
- b) eine einfache Bereitstellung aktueller Bedienungsanleitungen
in (1) wird möglich;
diese kann bei Updates mit eingepflegt werden
- c) in der vorstehend beschriebenen Variante, in welcher Befehle
von (13) versprachlicht und über (15) ausgegeben werden,
kann der Benutzer feststellen, ob die Spracherkennung durch (1)
korrekt funktioniert. Bevorzugt kann er an der Fernbedienung die
Sprachbefehle laut oder leise stellen, und/oder er kann sich mit
(13) im Raum bewegen, um den Einfluss von Störquellen
nachzuweisen und diese ggf. auszuschalten. Bevorzugt kann er per
Sprache von (1) hierzu Rückmeldungen erhalten.
-
Bevorzugt
signalisiert die Fernbedienung (13) dem Terminal (1) über eine
separate, drahtlos übermittelte
Information, dass die Sprachbefehle von der Fernbedienung (13)
und nicht vom Benutzer stammen. Diese drahtlose Information kann
z. B. unhörbare
Audiosignale beinhalten. Letzterer Kanal auch dazu genutzt werden
kann, eine Zusatzinformation an (1) zu übermitteln, z. B. um sicherzustellen, dass
(1) auf bestimmte Sprachkommandos seitens (13)
unter allen Umständen
korrekt reagiert.
-
Bei
inkorrekter Nutzung kann (1) gesprochene Fehlermeldungen
ausgeben.
-
Weil
(1) alternativ durch Knöpfe
(2), (4), (5) und (6), oder
durch (13) bedienbar ist, werden bevorzugt diese Knöpfe entsprechend
den per Sprachkommandos oder den per (13) eingegebenen
eingestellten qStellgrössen
bewegt. Andere bevorzugte Varianten zur Nutzung derartiger Knöpfe werden
in 4.2.3 nachstehend aufgezeigt.
-
2.2.1.7 Telefonieren
-
Bevorzugt
wird eine Telefonverbindung per Sprachbefehl oder per verbalem Notruf
seitens des Benutzers aufgebaut.
-
Der
Aufbau einer Telefonverbindung erfolgt bevorzugt in drei Varianten:
- a) er beginnt mit einem geeigneten Sprachbefehl (z.
B. „Telefon") woraufhin der Benutzer
eine Nummer, oder einen Namen ausspricht, und endet mit einem geeigneten
Sprachbefehl (z. B. „Auflegen").
- b) er beginnt mit dem Drücken
einer Telefontaste (26), woraufhin der Benutzer die Telefonnummer mit
einem Tastenfeld (17) wählen
und z. B. im Display (11) sehen kann; bei Ende des Gesprächs legt
der Benutzer durch nochmaliges Drücken von (26) auf.
- c) er erfolgt per Fernbedienung (13), wobei der Benutzer
bevorzugt gem. 2.2.1.6 vorstehend, Tasten an (13) drückt, und
(13) gem. a) eine Telefonleitung mittels maschinell erzeugter
Sprachbefehle aufbaut.
-
Zur
Abdeckung von Notfällen
können Sprachbefehle
wie „Hilfe" oder "Notruf" oder einprogrammierte
Namen einen durch (1) vermittelten Notruf auslösen. Bevorzugt
kann eine weitere Auswertung der zugehörigen Tonsignale ergeben, dass
es sich möglicherweise
um ein zufällig
gesprochenes Wort und nicht um einen Notruf handeln könnte, wobei
von (1) noch eine Bestätigung
des Notrufes angefordert wird. Eine derartige Bestätigung wird
bevorzugt verlangt, wenn (2) gedrückt wird, wobei bevorzugt gefragt
wird, ob der Benutzer z. B. technischen Support oder aber ärztliche
Hilfe braucht.
-
2.2.2 Programmierung per drahtloser oder
drahtgebundener digitaler Schnittstelle
-
Eine
digitale Schnittstelle (12), bevorzugt als USB- oder Ethernet
oder WiFi Interface realisiert, erlaubt einen weiter gehenden Zugriff
auf die Software und Hardware in (1). Bevorzugt bleibt
dabei die den Grundzustand realisierende Kernsoftware schreibgeschützt.
-
2.2.3 Veränderung des Grundzustandes
-
Bevorzugt
ist der Grundzustand nur veränderbar,
wenn (1) geöffnet
und z. B. Jumper entsprechend gesetzt werden.
-
2.2.4 Fernwartung mit direkten Zugriff
auf die Betriebssoftware von einem CallCenter
-
Der
Benutzer kann über
eine in (1) abgelegte Nummer jederzeit per Sprachbefehl
ein vorbestimmtes Call-Center anrufen und diesem Zutritt zu seinem Terminal
gewähren.
Dabei kann der Agent im Call-Center dieselben Einstellungen vornehmen
wie sie über
die digitale Schnittstelle möglich
sind. Bevorzugt stellen Call-Center-Agent und Benutzer sicher, dass sie
wirklich die sind als die sie sich ausgeben, bevor in (1)
geändert
wird.
-
Bevorzugt
beinhaltet der Grundzustand Merkmale, die es erlauben, den Arbeitszustand
auf Missbrauch zu untersuchen, und das Ergebnis an ein Call-Center
oder über
die digitale Schnittstelle zu übermitteln.
Bevorzugt können
die Daten in einem Terminal von mehreren Call-Centern eingesehen werden,
sodass eine wechselseitige Überprüfung eines
gegebenen Terminals möglich
ist.
-
3. Vorteile der Erfindung
-
Das
sprachorientierte, durch eine separat abgesicherte Fernbedienung
abgesicherte Bedienkonzept erlaubt eine unmittelbare Interaktion
mit (1) und den von (1) angebotenen Diensten.
Die Nutzung von VoIP-ähnlichen
Telefondiensten, im Zusammenhang mit Rundfunkangeboten, welche derartige Dienste
erklären
und promoten, erlaubt den Benutzern eine einfache Kommunikation
in eigenen kleinen Gruppen, z. B. kleine Telefonkonferenzen mit mehreren
Familienmitgliedern, den formlosen Austausch von Zetteln, Fotos
etc.. Einige weitere Nutzungsmöglichkeiten
des VoIP werden in Abschnitt 4 nachstehend vorgeschlagen.
-
Dabei
stellt das Bedienkonzept nicht etwa auf Maximierung des Funktionsumfangs
ab, sondern erstens darauf, den Benutzer so selten wie irgend möglich in
eine Lage zu bringen, in der er (1) weder bedienen noch
um Hilfe ersuchen kann (wobei letzteres erfindungsgemäss bequem
zu sein hat), und zweitens, die Bedienung spielerisch, mittels der Fernbedienung,
gegebenenfalls wieder in sein Gedächtnis zurückzurufen.
-
Die
Erfindung stellt einen robusten Grundzustand zur Verfügung, bestehend
aus Radio-, Telefonie und interaktiven Diensten, sowie die Möglichkeit, auf
einfachste Weise in vergangenen Sendungen, Voice-Mails und zugemittelten
Audiosendungen zu stöbern.
Die Erfindung sichert diesen Grundzustand gegen Missbrauch und/oder
Bedienfehler, und erlaubt dessen Erweiterung. Die Erfindung erlaubt
eine Einschränkung
der Benutzerrechte derart, dass eine Anzahl von Terminals den gleichen
Ausgangszustand zur gleichen Zeit aufweisen, und ermöglicht daher
einen einfachen Informationsaustausch unter den Benutzern. Sie erlaubt
es ferner, eine Anzahl von Bedienungsanleitungen in (1)
vorzuhalten und diese dem Benutzer wirksam zu vermitteln.
-
Die
Rechenleistung, die durch den Verzicht auf Videofunktionen eingespart
wurde, lässt
sich nicht nur nutzen, um dem Benutzer ein möglichst bequemes Freisprechen
auch im Notfall zu ermöglichen.
Sie erlaubt auch, die Sprache (z. B. von Nachrichtensendungen) an
das Hörvermögen des
Benutzers anzupassen.
-
Der
in dieser Offenbarung bevorzugte direkte Zugriff eines Call-Centers
in das Benutzerterminal bildet zwar eine erhebliche Herausforderung
an den Datenschutz und an die Absicherung der angebotenen Dienste
gegen sonstigen Missbrauch. Er erlaubt aber eine umfassende Wartung,
und bietet speziell Senioren einen wirksamen Notruf an.
-
Weil
ein derartiges Gerät
den Benutzer aber auch in die Lage versetzen würde, eine Reihe völlig neuer
Dienste, auch kollektiver Art, sehr bequem und dennoch sehr intensiv
zu nutzen, schaffen erfindungsgemässige Terminals eine neuartige
Plattform für
Service-Innovationen, auch im Bereich der interfamiliären Kommunikation,
wobei es der mit vorstehendem Aufwand erreichte Bedienungskomfort
ist, welcher den Benutzer dazu verleitet, kompliziertere Funktionen
auch zu nutzen.
-
4. Weitere Ausgestaltungen
der Erfindung
-
4.1 VoIP und weitere Dienste
-
Denkbar
ist, dass (1) auch als Anrufbeantworter genutzt wird, in
einer weiteren Ausbaustufe als Briefkasten für versprachlichbare Emails.
-
Denkbar
ist, dass mit einem sprachgesteuerten Client (z. B. eine sprach-steuerbare
Variante eines Skype-Clients beinhaltend) eine Flat-Rate Telefonie
realisiert wird, mit der Möglichkeit
kleiner – bis zu
5 Teilnehmer – Konferenzschaltungen.
Auf der VoIP lassen sich noch andere Dienste aufsetzen, z. B. Privatstunden
im kleinen Kreis, oder gemeinsames Spielen, sowie das Versenden
oder Entgegennehmen von Dateien.
-
Bevorzugt
kann (1) dabei die Bereitstellung weiterer Dienste unterstützen, wie
z. B. einen einfachen gemeinschaftlichen Musikunterricht unter Nutzung
von MIDI Instrumenten, oder haptisch-elektronische (z. B. traditionell
an Papier/Pappe oder an klassisches Spielzeug gebundene, jedoch
zusätzlich
mit elektronischen Sensoren und Schnittstellen versehene) Spiele
nach Art eines elektronischen Schachbrettes oder Kartenspiels. Derartige
Angebote sind immer häufiger
partizipativ, d. h. dass während
eines derartigen Unterrichtes oder eines derartigen Spieles telefoniert
werden soll, z. B. derart, dass MIDI-Files im Musikunterricht, oder
Spielzüge
von einem zentralen Server, entgegengenommen und weiter verteilt werden.
Bevorzugt kann dabei die Kommunikation über eine lokale Basisstation
laufen, die das Spiel versorgt, und die mit (1) über Sprachbefehle
verkehrt derart, dass der Benutzer diesen Dialog unmittelbar verfolgen
kann, anstatt auf ein Display achten zu müssen.
-
4.2 Ausgestaltungen der Fernbedienung;
Integration von Fernbedienung und Bedienknöpfen an (1)
-
- 4.2.1 Denkbar ist, dass die Fernbedienung (13)
einen 4-fach Wippschalter enthält,
der es erlaubt, unter Nutzung von (11), und/oder oder in
einer Tonkulisse gem. 4.5 nachstehend, zu navigieren, sowie den
Benutzer äquivalente
Sprachbefehle zu lehren.
- 4.2.2 Denkbar ist dass die Fernbedienung dazu dient, einen Lernmodus
zu steuern, der dem Benutzer weitere Möglichkeiten von (1)
vorführt, oder
ihm hilft, einen Befehl leicht und reproduzierbar mehrfach auszuführen.
- 4.2.3 Denkbar ist, dass die Knöpfe (5), (6),
(4) nicht mehr eine absolute Einstellung der jeweiligen
Stellgrösse
bewirken, sondern so ausgeführt sind,
dass sie normalerweise in einer Ruhestellung verharren, in welcher
sie z. B. von einer Feder gehalten werden. Bevorzugt geben nun Drehungen
des Knopfes für
die Stellgrösse
eine Richtung und eine Geschwindigkeit vor, mit welcher sich diese ändern soll.
Bevorzugt wird diese Änderungsgeschwindigkeit
durch eine geeignete Skala am Knopf (5) visualisiert, welche
an die Stelle der absoluten Rücksprungs-Zeitskala
(21) tritt.
Ebenso kann (2) als reiner Umschalter
zwischen den beiden Zuständen „Betrieb" und „Anruf
beim CallCenter" ausgeführt sein.
Bevorzugt wird diese Variante durch eine Anzeige der jeweiligen
Stellgrössen,
z. B. eine Lautstärkeanzeige
in (11), unterstützt.
In dieser Variante müssen
die Knöpfe nicht
nachgestellt werden, um den neuen Status nach einem Sprachbefehl
oder einem Befehl seitens der Fernbedienung abzubilden.
- 4.2.4 Denkbar ist, dass die Funktionen der Fernbedienung (13) über einen
geeigneten Kommunikationskanal, bevorzugt zwischen (1)
und (13), erweiterbar sind, wobei auch in (13)
die dem Grundzustand zuzurechnenden Funktionen geschützt bleiben.
-
4.3 Hyperlinks in Audio und Text
-
Eine
Audioinformation kann ähnlich
wie eine Textinformation durch eine Adresse („Hyperlink") gekennzeichnet sein, wobei die Audioinformation
bevorzugt zusätzlich
eine Adresse enthält
und wobei ein Computerprozess nach Aufforderung durch den Benutzer
zu dieser Adresse springt und die dort aufgefundene Information
entweder direkt wiedergibt, oder sie versprachlicht.
-
Bevorzugt
können
einzelne Worte oder Töne in
dem Tonkanal hörbar
als Hyperlink gekennzeichnet sein, z. B. indem zeitgleich mit einem
bestimmten Wort ein leiser Dauerton erklingt. Denkbar ist z. B. dass
in (1) eine Bedienungsanleitung als Text gespeichert ist,
welcher Hyperlinks beinhaltet und wobei dem Benutzer die Möglichkeit
gegeben wird, durch einen entsprechenden Sprachbefehl in geeigneter Weise
zu verzweigen. Ein solcher Sprachbefehl kann z. B. realisiert werden,
indem der Benutzer die Wiederholung des gerade gesprochenen Abschnittes
befiehlt, und dann zeitnah zum akustischen Hyperlink die Verzweigung
zu der in demselben hinterlegten Adresse befiehlt.
-
4.4 Mit dem Terminal vernetzte weitere
Freisprechanlagen
-
In
einer Wohnung mit mehreren Zimmern kann pro Zimmer eine Anzahl von
Mikrofonen und Lautsprechern drahtlos mit (1) verbunden
sein, derart dass bestimmte Funktionen von (1) z. B. das
Hören von
Musik, das Telefonieren und bei Bedarf das Versenden eines Notrufes,
auch dann noch genutzt werden können,
wenn der Benutzer und/oder (13) keine direkte akustische
Verbindung zu (1) mehr haben.
-
4.5 Navigation in aufgezeichneten Tonkulissen
-
Denkbar
ist, dass der Benutzer die anderweitig und/oder andernorts erstellte
und ihm zugemittelte, digitale Aufzeichnung einer Tonkulisse – etwa aus einer
Familienfeier – mittels
geeigneter Signalverarbeitungssoftware in (1) derart nutzt,
dass er aus einer Anzahl von Tonquellen, welche die Tonkulisse beinhaltet,
eine bestimmte auswählen
kann. Dabei werden bevorzugt, bevor der Benutzer die Aufzeichnung erhält, die
einzelnen Tonquellen (Familienmitglieder) per digitaler Nachbearbeitung
durch eine sog. Blindortung lokalisiert und ihre akustischen Beitrage
zur Tonkulisse von Störgeräuschen befreit,
derart dass der Benutzer diese Tonkulisse in mit einem Terminal (1)
leichter auswerten kann.
- 4.5.1 Denkbar ist,
dass bei der Aufnahme der gefundene Ort der jeweiligen Audiodatei
hinzugefügt wird,
derart dass (11) eine Liste von Orten für Tonquelle anzeigen kann,
derart dass der Benutzer die Tonquellen wie in einem Menü anwählen kann.
- 4.5.2 Denkbar ist, dass der Benutzer, bevorzugt mittels mehrerer
Lautsprecher, die in (1) angebracht oder mit (1) über einen
Kommunikationskanal verbunden sind, die Tonkulisse räumlich hört, und
eine Tonquelle auswählt,
indem er über
geeignete Befehle einen Ort in der virtuellen Tonkulisse bestimmt.
In dieser bevorzugten Variante kann er mehrere Tonquellen simultan
und räumlich
hören und
sich in der Tonkulisse auf diese Weise orientieren.
Zur Realisierung
vorstehender Auswahlverfahren können
bevorzugt Sprachbefehle Verwendung finden, die aus einem Menü auswählen, oder
mit denen eine virtuelle Ortsveränderung
in der Tonkulisse simuliert wird, wobei im letzteren Falle die Sprachbefehle
z. B. Redewendungen wie „Schritt nach
vorne"; „Schritt
nach links"; „Schritt
nach hinten" oder „Schritt
nach rechts” beinhalten;
denkbar ist auch, dass hierzu ein 4-fach-Wippschalter (19) Verwendung
findet, dessen vier Tasten jeweils einer der vorstehenden Redewendungen entsprechen.
Denkbar
ist, dass das Display (11) dabei dem Benutzer die Positionen
der Tonquellen, sowie seine eigene virtuelle Position, anzeigt.
- 4.5.3 Denkbar ist, dass ein Benutzer, der nicht oder nicht mehr
räumlich
hören kann,
und mit vorstehenden Befehlen sich in der Tonkulisse orientiert,
indem er feststellt, ob bestimmte Tonquellen lauter oder leiser
werden.
- 4.5.4 Denkbar auch ist dass der Benutzer nur die aktuell von
ihm gewählte
Tonquelle hört,
bevorzugt indem er eine angezeigte Nummer ansagt oder in (13)
eingibt.
- 4.5.5 Die in 4.5.3 und 4.5.4 beschriebene Art der Navigation
ist bevorzugt auch mit einem Mono-Lautsprecher realisierbar. Bevorzugt
stellt sie lediglich darauf ab, möglichst sicherzustellen, dass
im Nachhinein jeder Teilnehmer gehört und verstanden werden kann,
dass also z. B. ein Senior eine Familienfeier nachvollziehen, und
sich z. B. nachträglich
bei den Verwandten melden.
- 4.5.6 Derartige Tonkulissen können aber auch genutzt werden,
um versprachlichten Text einfacher zugänglich zu machen. Bevorzugt
ist derartiger Text eine Bedienungsanleitung, welche stückweise
sequentiell gehört
wird, und in welcher der Benutzer z. B. gem. 4.3 zu einem Hyperlink
verzweigen kann. Nun werden Audio-Hyperlinks – im Gegensatz zum Hyperlink
in einer visualisierten HTML-Seite – nur kurz wahrgenommen. Der
hier beschriebene Mechanismus kann dazu dienen, neben einem versprachlichten
Hauptthema noch ein Nebenthema mit zu hören und gegebenenfalls dorthin
zu verzweigen.
Bevorzugt kann der vorstehend erwähnte, versprachlichte,
zu einer Tonkulisse aufbereitete Text auch den Status einer Maschine
wiedergeben.
Vorstehende Verarbeitungsmöglichkeiten erfordern einen
grossen Rechenaufwand, sodass sie nach derzeitigem Stand der Technik
mit einfachen Prozessoren und/oder PCs nur im Offline-Modus – also in
Nicht-Echtzeit – machbar
sind.
-
4.6 Audio-Telepräsenz: Echtzeitnavigation und
Kommunikation in einer Tonkulisse
-
Mit
leistungsfähigeren
Rechnern und einer Breitbandanbindung ist denkbar, dass der Benutzer eine
an ihn übertragene
Tonkulisse in Echtzeit, z. B. in der in 4.5 beschriebenen Art nutzen
kann.
-
Dabei
könnte
er z. B. per akustischer Breitbandverbindung akustisch und in Echtzeit
an einer Veranstaltung teilnehmen, und per Fernbedienung oder per
Sprachbefehl eine Audiobotschaft an einen von ihm gewählten Ort
in dieser Veranstaltung richten, an dem sich eine der in 4.5. beschriebenen
Tonquellen befindet. Bevorzugt wäre
am Ort der zugehörigen
Veranstaltung, z. B. in einem Kaffeekränzchen, eine Anzahl von Freisprechanlagen
verteilt, und das Terminal (1) würde den Benutzer mit derjenigen
Freisprechanlage verbinden, welche der Position der von ihm ausgewählten Tonquelle
an nächsten
ist. Z. B. könnte
der Benutzer auf diese Weise an einem Kaffeekränzchen teilnehmen, deren Teilnehmer
er erreichen könnte,
ohne die Versammlung allzusehr zu sturen, indem er leise mit ihm
sprechen könnte.
Dabei kann die betroffene Freisprechanlage optisch oder akustisch,
auch unter Anzeige/Aufruf eines Namens, signalisieren, dass gerade
ein Anruf eingeht.
-
Ebenso
könnte
die Tonkulisse für
den Benutzer in Echtzeit zusammengestellt werden, z. B. indem ein
Text derart versprachlicht werden, dass Tonquellen simultan und
virtuell nebeneinander hörbar
gemacht werden, und zwar abhängig
vom Nutzungsverhalten des Benutzers.
-
4.7 Musikunterricht mit MIDI-Instrumenten
-
Bevorzugt
kann (1) über
eine digitale Schnittstelle (12) die Daten z. B. eines
Keyboards empfangen und als Ton ausgeben. Werden derartige MIDI-Files
per Telefonleitung ausgetauscht, so ist ein Musikunterricht möglich. Dieser
Austausch kann über
einen erweiterten Befehlssatz, der vom Benutzer gesprochen und/oder
von der Fernbedienung ausgegeben (und ggf. versprachlicht) wird,
gesteuert werden.
-
4.8 Benennen von Kanälen und Tonquellen
-
Denkbar
ist, dass in (11) angezeigte Nummern für Kanäle und Tonquellen als Parameter
genutzt werden, denen vom Benutzer ein Name zugeteilt wird, welchen
er mit einem geeigneten Sprachbefehl vergibt, sodass (11)
hinfort diese Codes neben oder statt der Kanalnummer anzeigt. Bevorzugt
kann der Benutzer hinfort diesen Namen verwenden, um (1)
das Umschalten auf diesen Kanal zu befehlen.
-
4.9 Meldung medizinischer Zustandsgrössen per Fernbedienung
-
Denkbar
ist, dass die Fernbedienung bei der Messung einer medizinischen
Zustandsgrösse
(z. B. Temperatur, Blutzucker etc.) am Benutzer, diese Grössen in
versprachlichter Form an (1) weiter reicht. Das hat gegenüber anderen
Kommunikationsmethoden den Vorteil, dass der Benutzer diese Kommunikation
unmittelbar mitverfolgen kann.
-
4.10 Einfache Audiobearbeitung
-
Denkbar
ist, dass (1) zur Aufzeichnung und Bearbeitung von Audiobotschaften
genutzt wird, bevorzugt mit der Funktionalität eines Diktiergerätes, also
Start, Stopp, mit inkrementellem Anfahren bestimmter Stellen. Denkbar
ist eine fast beliebige Ausgestaltung derartiger Bearbeitungsfunktionen.
-
4.11 Mehrere Benutzer
-
Denkbar
ist, dass (1) mit einer Anzahl in einer Tonkulisse räumlich verteilter
Mikrofone vernetzt ist und diese aufzeichnet. Damit wird es möglich, dass
jeweils eine Anzahl von Benutzern, unter wechselseitiger Nutzung
einer Tonkulisse z. B. gem. 4.5, miteinander telefoniert.
-
4.12 Ausbau des Befehlssatzes
-
Denkbar
ist, dass Benutzer mit Hilfe der digitalen Schnittstelle das Terminal
mit neuen Befehlen versehen können.
Denkbar ist auch, dass Benutzer über
einen geeigneten Kanal derartige Befehle und Ideen für Befehle
diskutieren, und dass die brauchbarsten dieser Befehle in ein kollektives
Update der Terminal-Software einfliessen. Letzteres hätte den Vorteil,
dass eine Anzahl von Benutzern die exakt gleiche Terminalkonfiguration
benutzen und folglich leichter einander helfen könnten.
-
4.13 Erweiterung der Terminal- und Fernbedienungsbegriffes
-
Die
erfindungsgemässe
Funktionalität
der Fernbedienung (13) lässt sich auf beliebige Steuergeräte (13)
erweitern. E
-
Ebenso
ist denkbar, dass das erfindungsgemässe Terminal durch eine ganz
andere Vorrichtung (1) ersetzt wird. Z. B kann (1)
als ein beliebiges mit (13) bedienbares Haushaltsgerät ausgeführt sein.
Erhalten bleibt dabei das Merkmal der Versprachlichung (und damit
Verdeutlichung) der durch den Benutzer oder durch die Fernbedienung
ausgegebenen Befehle an (1), wobei (1) bevorzugt
Sprachbefehle ausführen
und Text versprachlichen kann.
-
Bevorzugt
bleiben auch die Bereitstellung einer Freisprechanlage und der Eingriff
in (1) durch ein Call-Center oder eine digitale Schnittstelle
erhalten.
-
Dabei
ist auch noch denkbar, dass (1) keine Spracherkennungs-
bzw. Ausgabefunktionen beinhaltet, sondern der Benutzer bei Bedarf
durch (13) auf nachprüfbare
Merkmale hingewiesen wird, welche die Ausführung eines Befehles durch
(13) belegen.
-
Denkbar
ist schliesslich, dass die Fernbedienung (13) als stand-alone
Gebrauchsanleitung für Geräte verwendet
wird.