DE102006058758B4 - Method and device for controlling a telecommunication terminal - Google Patents
Method and device for controlling a telecommunication terminal Download PDFInfo
- Publication number
- DE102006058758B4 DE102006058758B4 DE102006058758.8A DE102006058758A DE102006058758B4 DE 102006058758 B4 DE102006058758 B4 DE 102006058758B4 DE 102006058758 A DE102006058758 A DE 102006058758A DE 102006058758 B4 DE102006058758 B4 DE 102006058758B4
- Authority
- DE
- Germany
- Prior art keywords
- user
- input
- communication
- signals
- terminal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M1/00—Substation equipment, e.g. for use by subscribers
- H04M1/72—Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
- H04M1/724—User interfaces specially adapted for cordless or mobile telephones
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M2250/00—Details of telephonic subscriber devices
- H04M2250/12—Details of telephonic subscriber devices including a sensor for measuring a physical value, e.g. temperature or motion
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M2250/00—Details of telephonic subscriber devices
- H04M2250/74—Details of telephonic subscriber devices with voice recognition means
Abstract
Verfahren zum Steuern einer Telekommunikationsendeinrichtung (200, 201, 202) mit den Schritten a) Registrieren wenigstens zweier mittels unterschiedlicher erster Eingabeeinrichtungen (11–17) generierter Eingabesignale, b) Umwandeln der zwei mittels unterschiedlicher erster Eingabeeinrichtungen (11–17) generierter Eingabesignale in einen gemeinsamen ersten Datensatz, c) Automatisches Ermitteln eines Kommunikationsbereitschafts-Zustands eines Benutzers der Telekommunikationsendeinrichtung (200, 201, 202) durch Auswerten des ersten Datensatzes (10) in Abhängigkeit von vorgegebenen variablen Regeln (30), d) Überwachen des Kommunikationsbereitschafts-Zustands des Benutzers, um eine Änderung des Kommunikationsbereitschafts-Zustands feststellen zu können, e) Ausführen einer vorgegebenen Funktion der Telekommunikationsendeinrichtung (200, 201, 202) bei Feststellung einer Änderung des Kommunikationsbereitschafts-Zustands des Benutzers, dadurch gekennzeichnet, dass die Eingabesignale zum Erkennen eines Kommunikationswunsches zumindest eines der folgenden Signale umfassen: – eine Laufzeitdifferenz (43) von akustischen Signalen zu räumlich auf der Telekommunikationsendeinrichtung unterschiedlich angeordneten Mikrofonen, die innerhalb einer festgelegten Toleranz gleich oder nahe Null ist, oder – wenn nach einer vorbestimmten, durch einen Bewegungssensor erfassten Bewegung der Telekommunikationsendeinrichtung das Gesicht des Nutzers im Kamerabild erscheint, oder über das Auswerten von Sensoren und/oder Mikrofonen in intelligenter Kleidung die relative Lage des Endgerätes zum Nutzer erfasst wird.A method of controlling a telecommunication terminal (200, 201, 202) comprising the steps of a) registering at least two input signals generated by different first input means (11-17), b) converting the two input signals generated by different first input means (11-17) into one common first record, c) automatically determining a communication ready state of a user of the telecommunications terminal (200, 201, 202) by evaluating the first record (10) in response to predetermined variable rules (30), d) monitoring the communication readiness state of the user e) performing a predetermined function of the telecommunications terminal (200, 201, 202) upon detection of a change in the communication ready state of the user, characterized in that the input signals z for detecting a communication request at least one of the following signals comprise: - a transit time difference (43) from acoustic signals to microphones located spatially on the telecommunication terminal equipment that is equal to or near zero within a specified tolerance, or - if by a predetermined sensor - by a motion sensor detected movement of the telecommunications terminal the user's face appears in the camera image, or by evaluating sensors and / or microphones in smart clothing, the relative position of the terminal is detected to the user.
Description
Die Erfindung betrifft ein Verfahren und eine Vorrichtung zum Steuern einer Telekommunikationsendeinrichtung.The invention relates to a method and a device for controlling a telecommunication terminal.
In der Telekommunikation werden unterschiedliche Verfahren eingesetzt, um die Bedienung von Endgeräten sowie die Sprachqualität für den Benutzer zu vereinfachen bzw. zu verbessern. Zu diesem Zweck wird in Endgeräten beispielsweise eine Freisprechfunktion integriert oder es werden Maßnahmen zur Unterdrückung von Hintergrundgeräuschen vorgesehen.In telecommunications, different methods are used to simplify or improve the operation of terminals and the voice quality for the user. For this purpose, a hands-free function is integrated in terminals, for example, or measures are provided for suppressing background noise.
Aus
Die Bedienung von Endgeräten kann auch durch den Einsatz von Makro-Befehlen vereinfacht werden. Ein entsprechendes Verfahren zum Steuern von Mobilfunkendgeräten wird beispielsweise in
Um die Bedienung zu vereinfachen, werden auch Steuerungsfunktionen zunehmend in einer Weise bereitgestellt, dass diese berührungslos ausführbar sind, da beispielsweise in bestimmten Umgebungen wie in einem Fahrzeug die manuelle Bedienung eines Telekommunikationsgerätes durch einen Benutzer nicht möglich oder nicht erwünscht ist. Alternativ zur manuellen Bedienung kann die Bedienung beispielsweise mittels Sprachbefehlen erfolgen, wenn entsprechende Methoden zur Spracherkennung bereitgestellt werden.In order to simplify the operation, also control functions are increasingly provided in a manner that they are non-contact executable because, for example, in certain environments such as in a vehicle manual operation of a telecommunication device by a user is not possible or not desirable. As an alternative to manual operation, the operation can take place, for example, by means of voice commands if appropriate methods for speech recognition are provided.
In
Aus
In
In
Aus
In der Vergangenheit gab es auch bereits Versuche, Teile eines in einem System befindlichen Spracherkenners durch Definition eines zu sprechenden Aktivierungsausdruckes wie zum Beispiel ”Wach auf” dazu zu bringen, auch weitere Äußerungen für einen bestimmten Zeitraum auszuwerten. Ein solcher Aktivierungsausdruck wird überlicherweise auch als ”Hot Word” bezeichnet. Allerdings führten dabei fehlinterpretierte Hintergrundgeräusche sowie ähnliche Äußerungen des Nutzers oder fremder Personen oft zu ungewollten Aktivierungen oder Deaktivierungen entsprechender Teile des Spracherkenners.There have also been attempts in the past to interpret portions of a speech recognizer within a system by defining an activation term to be spoken, such as "wake up", to evaluate further utterances for a particular period of time. Such an activation expression is also commonly referred to as a "hot word". However, misinterpreted background noise as well as similar expressions of the user or other people often led to unwanted activations or deactivations of corresponding parts of the speech recognizer.
Für die Steuerung eines Endgerätes kann auch relevant sein, in welcher Position der Benutzer sich relativ zum Gerät befindet. Aus
Beispielsweise in
Aus
In
Aus
In
Aus
Ferner ist es bekannt, mobile Endgeräte mit Bewegungs- und Neigungssensoren auszurüsten, um die Orientierung des Gerätes in den Raumachsen, statisch und in der Bewegung dynamisch, zu erfassen. Es sind entsprechend ausgerüstete Mobiltelefone bekannt, bei denen solche Sensoren direkt zur Ausführung bestimmter Steuerfunktionen eingesetzt werden. Ferner ist aus der
Die aus dem Stand der Technik bekannten Methoden erlauben somit zwar die Bestimmung der Position eines Sprechers innerhalb eines Raumes oder der Orientierung eines Gerätes. Diese Informationen sind jedoch nicht geeignet, um mit ausreichender Sicherheit entscheiden zu können, ob bei einem Benutzer ein Kommunikationswunsch besteht.Although the methods known from the prior art thus allow the determination of the position of a speaker within a room or the orientation of a device. However, this information is not suitable for being able to decide with sufficient certainty whether a user wishes to communicate.
Der vorliegenden Erfindung liegt daher die Aufgabe zugrunde, ein Verfahren und eine Vorrichtung vorzuschlagen, mit deren Hilfe ein Zuwenden oder Abwenden eines Benutzers zu einem Telekommunikationsendgerät sicher erkannt werden kann.The present invention is therefore based on the object to propose a method and a device, with the aid of a turning or turning away a user to a telecommunication terminal can be reliably detected.
Diese Aufgabe wird durch ein Verfahren gemäß Anspruch 1, sowie eine Telekommunikationsvorrichtung nach Anspruch 13 gelöst. Vorteilhafte Ausführungsformen und Weiterbildungen sind in den jeweiligen Unteransprüchen umschrieben.This object is achieved by a method according to claim 1, and a telecommunication device according to
Dementsprechend umfasst ein erfindungsgemäßes Verfahren zum Steuern einer Telekommunikationsendeinrichtung das Registrieren wenigstens eines mittels einer ersten Eingabeeinrichtung generierten ersten Eingabesignals, das Erzeugen eines ersten Datensatzes aus diesem wenigstens einen ersten Eingabesignal, sowie das automatische Ermitteln eines Kommunikationsbereitschafts-Zustands eines Benutzers der Telekommunikationsendeinrichtung durch Auswerten des ersten Datensatzes in Abhängigkeit von vorgegebenen variablen Regeln. Um eine Änderung des Kommunikationsbereitschafts-Zustands feststellen zu können, wird dieser überwacht. Wird eine Änderung des Kommunikationsbereitschafts-Zustands des Benutzers festgestellt, so wird automatisch eine vorgegebene Funktion der Telekommunikationsendeinrichtung oder mindestens einer mit der Telekommunikationseinrichtung über ein Netzwerk assoziierten Einrichtung ausgeführt. Im einfachsten Fall besteht der Kommunikationsbereitschafts-Zustand eines Benutzers im Vorliegen oder Nicht-Vorliegen einer Kommunikationsbereitschaft eines Benutzers.Accordingly, a method according to the invention for controlling a telecommunication terminal device comprises registering at least one first input signal generated by a first input device, generating a first data record from this at least one first input signal, and automatically determining a communication readiness state of a user of the telecommunication terminal device by evaluating the first data record depending on given variable rules. To be able to detect a change in the communication readiness state, it is monitored. If a change in the communication readiness state of the user is detected, a predetermined function of the telecommunication terminal device or at least one device associated with the telecommunication device via a network is automatically executed. In the simplest case, the communication readiness state of a user consists in the presence or absence of communication readiness of a user.
Vorzugsweise erfolgt das Überwachen des Kommunikationsbereitschafts-Zustands dadurch, dass zu vorgegebenen Zeitpunkten wenigstens ein erstes Eingabesignal registriert, daraus ein erster Datensatz erzeugt und durch Auswerten dieses ersten Datensatzes automatisch ein Kommunikationsbereitschafts-Zustand ermittelt wird. Vorteilhaft werden diese Schritte zyklisch in einem vorgegebenen Zeitintervall ausgeführt, um eine kontinuierliche Überwachung zu gewährleisten.The monitoring of the readiness for communication state is preferably carried out by registering at least one first input signal at predefined times, generating a first data record therefrom, and by automatically evaluating this first data record, a ready-to-communicate state is determined. Advantageously, these steps are performed cyclically in a predetermined time interval to ensure continuous monitoring.
Die Telekommunikationsendeinrichtung, im Folgenden auch kurz als Endgerät bezeichnet, kann vorteilhaft als mobiles Telekommunikationsendgerät wie zum Beispiel als Mobiltelefon, Smartphone oder PDA ausgebildet sein. Je nach Einsatzzweck kann jedoch auch jedes andere zur Telekommunikation ausgebildete Gerät als Endgerät eingesetzt werden. In einer bevorzugten Ausführungsform des Verfahrens ist das Endgerät beispielsweise als fest installiertes, öffentliches Telefon oder als Internetstation ausgebildet, wobei die Internetstation zum Beispiel ein öffentlich zugängliches Zugangsterminal für den Zugriff auf das Internet umfasst.The telecommunication terminal device, hereinafter also referred to as terminal for short, can advantageously be designed as a mobile telecommunication terminal such as a mobile phone, smartphone or PDA. Depending on the purpose, however, any other telecommunication-trained device can be used as a terminal. In a preferred embodiment of the method, the terminal is designed, for example, as a permanently installed public telephone or as an Internet station, wherein the Internet station comprises, for example, a publicly accessible access terminal for access to the Internet.
Eine Änderung des Kommunikationsbereitschafts-Zustands eines Benutzers wird in der Regel immer dann erkannt, wenn ein Benutzer sich dem Endgerät zuwendet oder sich von diesem abwendet.A change in the communication readiness state of a user is usually detected whenever a user turns to the terminal or turns away from it.
Das Verfahren ermöglicht somit vorteilhaft die Gewinnung wenigstens eines Aktivierungs- oder Deaktivierungssignals, wenn ein Zuwenden oder Abwenden eines Benutzers zu oder von dem Endgerät erkannt wird, wobei das Signal zur Aktivierung oder Deaktivierung einer vorbestimmten Komponente der Telekommunikationsendeinrichtung dient.The method thus advantageously makes it possible to obtain at least one activation or deactivation signal when a user's turn to or from the terminal is detected, the signal serving to activate or deactivate a predetermined component of the telecommunication terminal.
Das automatische Ausführen der vorgegebenen Funktion der Telekommunikationsendeinrichtung entspricht insofern vorteilhaft dem Aktivieren oder Deaktivieren mindestens einer vorbestimmten Komponente der Telekommunikationsendeinrichtung. Dementsprechend wird ein Aktivierungs- bzw. Deaktivierungssignal an die entsprechende Komponente übermittelt, beispielsweise in Abhängigkeit von der Position und der Bewegung des Nutzers im Verhältnis zum Endgerät, und zwar dann, wenn der Nutzer durch Handlungen mit dem Endgerät und/oder sprachliche Äußerungen seinen Kommunikationswunsch bzw. den Abschluss der Kommunikation zum Ausdruck bringt. Ein Signal wird somit immer dann generiert, wenn sich der Nutzer dem Endgerät zuwendet und beginnt, mit mindestens einer lokalen oder über ein Netzwerk assoziierten Anwendung und/oder einem entfernten Kommunikationspartner über Sprache zu kommunizieren bzw. wenn sich der Nutzer vom Endgerät abwendet und die Kommunikation mit der Anwendung und/oder einem entfernten Kommunikationspartner beendet, wobei der Kommunikationspartner Mensch und/oder Maschine sein kann.The automatic execution of the predetermined function of the telecommunication terminal device advantageously corresponds to the activation or deactivation of at least one predetermined component of the telecommunication terminal device. Accordingly, an activation or deactivation signal is transmitted to the corresponding component, for example as a function of the position and the movement of the user in relation to the terminal, namely when the user by his actions with the terminal and / or linguistic utterances his communication request or . expresses the conclusion of the communication. A signal is thus always generated when the user turns to the terminal and starts with at least one local or via a network associated application and / or a remote communication partner to communicate via voice or when the user turns away from the terminal and terminates the communication with the application and / or a remote communication partner, the communication partner may be human and / or machine.
In einer bevorzugten Ausführungsform des Verfahrens wird das Endgerät durch den Benutzer mittels Sprachsteuerung gesteuert, wobei die bei Feststellen einer Änderung des Kommunikationsbereitschafts-Zustands des Benutzers auszuführende Funktion vorteilhaft das Aktivieren oder Deaktivieren mindestens einer Applikation der Endgerätes oder einer überein Netzwerk assoziierten Applikation umfasst, die der Kommunikation des Benutzers mit einem Anwendungsprogramm des Endgerätes dient oder diese unterstützt. Zu diesem Zweck umfasst die Applikation vorteilhaft mindestens eine Spracherkennungs-, Echokompensations-, Freisprech-, Sprecherverifizierungs-, Sprechererkennungs-, Sprecherklassifizierungs-, Sprachidentifizierungs-, Sprachsynthese-, Geräuschreduktionsfunktion und/oder mindestens eine Funktion zur Erfassung und Auswertung prosodischer Merkmale der Spracheingabe wie zum Beispiel Wortakzent, Silbenbetonung oder Satzmelodie.In a preferred embodiment of the method, the terminal is controlled by the user by means of voice control, wherein the function to be executed upon detection of a change in the communication readiness state of the user advantageously comprises activating or deactivating at least one application of the terminal or an application associated with the network Communication of the user with an application program of the terminal is used or supported. For this purpose, the application advantageously comprises at least one speech recognition, echo canceling, hands-free, speaker verification, speaker recognition, speaker classification, voice identification, speech synthesis, noise reduction function and / or at least one function for detecting and evaluating prosodic features of the speech input, such as Example word accent, syllabic emphasis or sentence melody.
Bei Einsatz berührungsloser Eingabeeinrichtungen wie beispielsweise Kameras oder Mikrofonen wird durch das Verfahren vorteilhaft die Benutzung von Endgeräten ohne direkten Kontakt von Nutzer und Endgerät, wie zum Beispiel das Abnehmen und Auflegen eines Hörers, ermöglicht. Zweckmäßigerweise sind auch entsprechende berührungslose Ausgabeeinrichtungen vorgesehen, wie zum Beispiel ein Bildschirm oder Lautsprecher.When using non-contact input devices such as cameras or microphones, the method advantageously allows the use of terminals without direct contact between the user and the terminal, such as the removal and placing of a handset. Appropriately, corresponding non-contact output devices are provided, such as a screen or speakers.
Die Erfassung eines Kommunikationswunsches eines Nutzers eines Endgerätes erfolgt somit prinzipiell mittels festgelegter, deterministischer Regeln, die im Endgerät oder auch beispielsweise in einem entfernten Serversystem abgespeichert sind, wobei die Regeln festlegen, welche Bedingungen vorliegen müssen, um ein ”Zuwendungs”- bzw. ”Abwendungs”-Signal zu generieren. Die Bedingungen werden dabei beschrieben durch den ersten Datensatz, welcher jeweils mittels ausgewählter Eingabeeinrichtungen registrierte Eingabesignale repräsentiert. Beispiele einsetzbarer Eingabeeinrichtungen sind Mikrofone, Mikrofon-Arrays, Kameras, Neigungssensoren, Bewegungssensoren, Griffel, berührungsempfindliche Bildschirme (engl. Touchscreen), Mäuse und/oder Tasten.The detection of a communication request of a user of a terminal is thus in principle by means of fixed, deterministic rules that are stored in the terminal or even in a remote server system, the rules specify which conditions must be present to a "Zuwendungs" - or "avoidance "Signal to generate. The conditions are described by the first data set, which represents input signals registered in each case by means of selected input devices. Examples of usable input devices are microphones, microphone arrays, cameras, tilt sensors, motion sensors, styluses, touch-sensitive screens, mice and / or buttons.
Vorteilhaft umfasst das Registrieren des wenigstens einen ersten Eingabesignals das Registrieren wenigstens zweier mittels unterschiedlicher Eingabeeinrichtungen generierter Eingabesignale, da durch Auswerten unterschiedlicher Arten von Eingabesignalen eine Kommunikationsbereitschaft des Nutzers aufgrund komplexerer Regeln sicherer erkannt werden kann. Das Umwandeln der registrierten Eingabesignale in einen gemeinsamen Datensatz stellt eine Vorverarbeitung dar, bei der Merkmalsvektoren gewonnen werden, die vorteilhaft der Bildung eines zu trainierenden, statistischen Verhaltensmodells oder Medienmodells dienen, mit dessen Hilfe nach einem Trainings- bzw. Adaptionsprozess beim Auftreten bestimmter statischer und/oder dynamischer Eingabesignale ein Kommunikationsbeginn- bzw. Kommunikationsende-Signal generiert werden kann.Advantageously, registering the at least one first input signal comprises registering at least two input signals generated by means of different input devices, since a communication readiness of the user can be detected more reliably by evaluating different types of input signals due to more complex rules. The conversion of the registered input signals into a common data set represents a preprocessing in which feature vectors are obtained which advantageously serve to form a statistical behavior model or media model to be trained, with the aid of which after a training or adaptation process when certain static and / or or dynamic input signals a Kommunikationsbeginn- or communication end signal can be generated.
Ein Medienmodell, beispielsweise ein Sprachmodell, beschreibt die Reihenfolge, in der Eingaben wie zum Beispiel Wörter und/oder Sensorsignale von einem Medienerkenner wie zum Beispiel einem Spracherkenner erwartet werden.A media model, such as a language model, describes the order in which inputs, such as words and / or sensor signals, are expected by a media recognizer, such as a speech recognizer.
Eine besonders bevorzugte Ausführungsform des Verfahrens sieht dementsprechend vor, den ersten, aus den ersten Eingabesignalen erstellten Datensatz zu speichern, sowie wenigstens ein zweites Eingabesignal mittels einer zweiten Eingabeeinrichtung zu registrieren und daraus einen zweiten Datensatz zu erzeugen. Durch Auswerten des zweiten Datensatzes in Abhängigkeit vorgegebener fester Regeln wird ein Kommunikationsbereitschafts-Zustand eines Benutzers der Telekommunikationsendeinrichtung ermittelt. In Abhängigkeit dieses Kommunikationsbereitschafts-Zustands und/oder einer Änderung dieses Kommunikationsbereitschafts-Zustands werden die variablen Regeln zur Auswertung des ersten Datensatzes auf Grundlage des gespeicherten ersten Datensatzes automatisch angepasst.A particularly preferred embodiment of the method accordingly provides to store the first data record created from the first input signals, and to register at least one second input signal by means of a second input device and to generate a second data record therefrom. By evaluating the second data set as a function of predetermined fixed rules, a state of communication readiness of a user of the telecommunication terminal device is determined. Depending on this communication readiness state and / or a change in this readiness for communication state, the variable rules for evaluating the first data record are automatically adapted on the basis of the stored first data record.
Das durch die variablen Regeln definierte Verhaltensmodell kann vor einem Trainings- bzw. Adaptionsprozess durch Werte vorbelegt werden, die für bestimmte Eingabesignale bereits eine Kommunikationsbereitschaft erkennen.The behavior model defined by the variable rules can be pre-assigned before a training or adaptation process by values which already recognize a willingness to communicate for certain input signals.
Wird ein Endgerät typischerweise immer von dem gleichen Benutzer bedient, werden durch wiederholtes automatisches Anpassen der variablen Regeln für diesen spezifischen Benutzer vorteilhaft im Wesentlichen benutzerspezifische Regeln zur Auswertung des ersten Datensatzes erzeugt.If a terminal is typically always operated by the same user, substantially repetitive automatic adaptation of the variable rules for that specific user advantageously produces user-specific rules for evaluating the first data record.
Andererseits kann es auch besonders vorteilhaft sein, im Wesentlichen benutzerunspezifische Regeln zu erzeugen, beispielsweise um diese als Voreinstellung in einem Endgerät für einen neuen Benutzer bereitzustellen. Zu diesem Zweck erfolgt vorteilhaft ein wiederholtes automatisches Anpassen der variablen Regeln für eine Vielzahl unterschiedlicher Benutzer.On the other hand, it may also be particularly advantageous to generate substantially user-unspecific rules, for example to provide them as a default in a terminal for a new user. For this purpose, there is advantageously a repeated automatic adaptation of the variable rules for a multiplicity of different users.
Nach Abschluss einzelner Trainingsprozesse für eine größere Anzahl von Nutzern eines Kommunikationsnetzes, die über einen Zugriff auf Endgeräte verfügen, welche zur Ausführung des beschriebenen Verfahrens ausgebildet sind, werden die trainierten Modelle der einzelnen Nutzer dementsprechend vorteilhaft dazu genutzt, um aus diesen ein nutzerunabhängiges Verhaltensmodell abzuleiten, welches als Anfangseinstellung oder Vorbelegung zum weiteren Training für neue Nutzer dient. Nach einem längeren Anwendungszeitraum mit einer großen Nutzerzahl kann damit für die meisten neuen Nutzer das Training des Verhaltensmodells zur Generierung des ”Kommunikationswunsch”-Signals entfallen. After completion of individual training processes for a larger number of users of a communication network who have access to terminals that are designed to carry out the described method, the trained models of the individual users are therefore advantageously used to derive from these a user-independent behavioral model, which serves as an initial setting or pre-assignment for further training for new users. After a longer period of use with a large number of users, the training of the behavioral model for generating the "communication request" signal can thus be dispensed with for most new users.
Wie bereits oben beschrieben wird das wenigstens eine erste Eingabesignal vorzugsweise mittels berührungslos wirkender Eingabeeinrichtungen generiert, um eine berührungslose Steuerung durch den Benutzer zu ermöglichen.As already described above, the at least one first input signal is preferably generated by means of non-contact input devices in order to enable non-contact control by the user.
Das Training oder Anpassen der variablen Regeln erfolgt in einer bevorzugten Ausführungsform des Verfahrens dadurch, dass bei Feststellen einer Änderung des Kommunikationsbereitschafts-Zustands des Nutzers auf Grundlage des ausgewerteten zweiten Datensatzes die variablen Regeln derart angepasst werden, dass in Abhängigkeit der angepassten Regeln durch Auswerten des ersten Datensatzes der gleiche Kommunikationsbereitschafts-Zustand ermittelt wird wie durch Auswerten des zweiten Datensatzes. Zu diesem Zweck kann es auch vorteilhaft sein, den ersten Datensatz aus Eingabesignalen zu erstellen, die kurz vor oder kurz nach Registrieren des zweiten Eingabesignals registriert wurden.The training or adaptation of the variable rules is performed in a preferred embodiment of the method in that upon detection of a change in the communication readiness state of the user based on the evaluated second data set, the variable rules are adapted such that in response to the adjusted rules by evaluating the first Record the same communication readiness state is determined as by evaluating the second record. For this purpose, it may also be advantageous to create the first data set from input signals which were registered shortly before or shortly after registering the second input signal.
Dementsprechend sieht das Verfahren vorteilhaft vor, dass der erste und zweite Datensatz aus Eingabesignalen erstellt werden, die über einen ersten beziehungsweise zweiten Zeitraum registriert werden, wobei der erste Zeitraum vor oder nach dem zweiten Zeitraum liegt oder der erste und zweite Zeitraum wenigstens teilweise übereinstimmen.Accordingly, the method advantageously provides that the first and second data sets are created from input signals registered over a first or second period, wherein the first period is before or after the second period or the first and second period at least partially coincide.
Zweckmäßigerweise beinhaltet das automatische Ermitteln eines Kommunikationsbereitschafts-Zustands das Ermitteln eines Wahrscheinlichkeitswertes oder eines ähnlichen Parameters, welcher die Zuverlässigkeit des ermittelten Zustandes widerspiegelt, für das Vorliegen einer Kommunikationsbereitschaft und das Vergleichen des ermittelten Wahrscheinlichkeitswertes oder Parameters mit einem vorgegebenen Grenzwert.Conveniently, automatically determining a communication ready state includes determining a probability value or similar parameter reflecting the reliability of the determined state for the presence of a communication readiness and comparing the determined probability value or parameter with a predetermined limit value.
Für das Training oder das Anpassen der variablen Regeln ist es von Vorteil, wenn aus dem zweiten Datensatz der Kommunikationsbereitschafts-Zustand mit hoher Sicherheit ermittelt werden kann. Zu diesem Zweck kann für das zweite Eingabesignal beispielsweise eine eng definierte, erfassbare Aktion wie das Drücken einer vorgegebenen Taste vorgesehen sein. Dementsprechend umfasst das Registrieren des wenigstens einen zweiten Eingabesignals vorteilhaft eine manuelle Benutzereingabe.For training or adapting the variable rules, it is advantageous if the communication readiness state can be determined with high reliability from the second data record. For this purpose, for example, a narrowly defined, detectable action, such as pressing a predetermined key, may be provided for the second input signal. Accordingly, registering the at least one second input signal advantageously includes manual user input.
In den Fällen, in denen gemeinsam mit einem Eingabeergebnis zusätzlich ein hoher Zuverlässigkeits- oder Konfidenzwert geliefert wird, wie dies z. B. bei bestimmten Spracheingaben möglich sein kann, und dieser Wert eine hohe Sicherheit des erkannten Ergebnisses widerspiegelt, kann das Registrieren des wenigstens einen zweiten Eingabesignals vorteilhaft auch einen anderen als sicher bewerteten Eingabemodus umfassen.In cases where, in addition to an input result, a high reliability or confidence value is additionally supplied, as described, for example, in US Pat. B. may be possible for certain voice inputs, and this value reflects a high level of security of the detected result, registering the at least one second input signal may advantageously also comprise another than safely evaluated input mode.
Um einen Kommunikationsbereitschafts-Zustand für unterschiedliche Situationen oder Bedingungen sicher zu ermitteln, wird der erste Datensatz vorteilhaft aus mehreren Eingabesignalen erstellt, die mittels unterschiedlicher Eingabeeinrichtungen registriert werden. Der erste Datensatz umfasst somit vorteilhaft unterschiedliche Eingabesignale in digitalisierter Form und weist damit eine Vielzahl auswertbarer Merkmale auf.In order to reliably determine a communication readiness state for different situations or conditions, the first data record is advantageously created from a plurality of input signals which are registered by means of different input devices. The first data set thus advantageously comprises different input signals in digitized form and thus has a multiplicity of analyzable features.
Das Auswerten des ersten und/oder zweiten Datensatzes umfasst vorteilhaft das Auswerten einer Maus-/Griffel- oder Tastatureingabe und/oder das Ermitteln einer Laufzeitdifferenz akustischer, von einem Mikrofon-Array generierter Signale und/oder eine Spracherkennung akustischer Signale und/oder eine Sprechererkennung akustischer Signale und/oder eine Auswertung prosodischer Merkmale von Spracheingaben und/oder eine Bilderkennung eines von einer Kamera aufgenommenen Bildes und/oder eine Gesichtserkennung eines von einer Kamera aufgenommenen Bildes und/oder das Auswerten von Signalen eines Näherungs- oder Neigungssensors. Das beschriebene Verfahren ist jedoch nicht auf die angeführten Auswertungsmethoden beschränkt, sondern kann je nach Einsatzzweck weitere, auch zukünftige, Auswertemethoden umfassen.The evaluation of the first and / or second data set advantageously comprises evaluating a mouse / stylus or keyboard input and / or determining a transit time difference of acoustic signals generated by a microphone array and / or voice recognition of acoustic signals and / or speaker recognition of acoustic signals Signals and / or an evaluation of prosodic features of speech inputs and / or an image recognition of an image taken by a camera and / or a face recognition of an image taken by a camera and / or the evaluation of signals of a proximity or inclination sensor. However, the method described is not limited to the listed evaluation methods, but may, depending on the intended use, include further, also future, evaluation methods.
Das Auswerten des ersten und/oder zweiten Datensatzes kann je nach Ausführung der Telekommunikationsendeinrichtung durch diese selbst oder durch eine separate Verarbeitungseinheit erfolgen. Beispielsweise bei mobilen Endgeräten kann die Rechenleistung unzureichend für das komplexe Auswerten des ersten und/oder zweiten Datensatzes sein, so dass die Auswertung vorteilhaft mittels eines entfernten Servers erfolgt, der über ein Kommunikationsnetz mit dem Endgerät verbindbar ist. Zu diesem Zweck wird der erste und/oder zweite Datensatz zu der vom Endgerät separaten Verarbeitungseinheit übertragen, die den ersten und/oder zweiten Datensatz auswertet, den durch Auswertung ermittelten Kommunikationsbereitschafts-Zustand überwacht und bei Ermitteln einer Änderung des Kommunikationsbereitschafts-Zustands des Benutzers zum Ausführen der vorgegebenen Funktion ein Steuersignal zum Endgerät überträgt.The evaluation of the first and / or second data record can be done by the latter itself or by a separate processing unit, depending on the design of the telecommunication terminal. For example, in mobile devices, the computing power may be insufficient for the complex evaluation of the first and / or second data set, so that the evaluation is advantageously carried out by means of a remote server that is connectable via a communication network with the terminal. For this purpose, the first and / or second data record is transmitted to the processing unit separate from the terminal, which evaluates the first and / or second data set, monitors the communication readiness state determined by evaluation and, upon determining a change in the communication readiness state of the user Executing the predetermined function transmits a control signal to the terminal.
Eine erfindungsgemäße Telekommunikationsvorrichtung umfasst eine Telekommunikationsendeinrichtung, wenigstens eine erste Eingabeeinrichtung zum Registrieren von ersten Eingabesignalen, eine Vorverarbeitungseinheit zum Umwandeln registrierter Eingabesignale in digitalisierte Daten, eine Auswerteeinheit zum Auswerten der digitalisierten Daten, eine Steuereinheit zum Steuern der Telekommunikationsendeinrichtung, und einen Speicher zum Speichern variabler Regeln, wobei die Auswerteeinheit dazu ausgebildet ist, durch Auswerten aus ersten Eingabesignalen gewonnenen digitalisierten Daten in Abhängigkeit von den im Speicher abgelegten variablen Regeln automatisch einen Kommunikationsbereitschafts-Zustand eines Benutzers der Telekommunikationsendeinrichtung zu ermitteln, den Kommunikationsbereitschafts-Zustand des Benutzers zu überwachen und bei Feststellug einer Änderung des Kommunikationsbereitschafts-Zustands des Benutzers ein Steuersignal zu der Steuereinheit zu übertragen, wobei die Steuereinheit dazu ausgebildet ist, in Antwort auf den Empfang des Steuersignals eine vorgegebene Funktion der Telekommunikationsendeinrichtung auszuführen.A telecommunication device according to the invention comprises a telecommunication terminal device, at least a first input device for registering first input signals, a preprocessing unit for converting registered input signals into digitized data, an evaluation unit for evaluating the digitized data, a control unit for controlling the telecommunication terminal device, and a memory for storing variable rules, wherein the evaluation unit is configured to automatically determine a communication readiness state of a user of the telecommunication terminal device, to monitor the communication readiness state of the user by evaluating digitized data obtained from first input signals in dependence on the variable rules stored in the memory and upon detection of a change in the Communication ready state of the user to transmit a control signal to the control unit, wherein the Control unit is designed to perform a predetermined function of the telecommunication terminal in response to the receipt of the control signal.
Zum Anpassen der in dem Speicher abgelegten variablen Regeln weist die Vorrichtung vorteilhaft eine zweite Eingabeeinrichtung zum Registrieren von zweiten Eingabesignalen auf. In dieser Ausführungsform ist die Auswerteeinheit ferner dazu ausgebildet, erste, aus ersten Eingabesignalen gewonnene digitalisierte Daten in dem Speicher abzulegen, durch Auswerten von zweiten, aus zweiten Eingabesignalen gewonnenen digitalisierten Daten in Abhängigkeit von in dem Speicher abgelegten festen Regeln automatisch einen Kommunikationsbereitschafts-Zustand eines Benutzers der Telekommunikationsendeinrichtung zu ermitteln und zu überwachen, und in Abhängigkeit der aus den ausgewerteten zweiten digitaliserten Daten erkannten Kommunikationsbereitschafts-Zustands und/oder einer Änderung des Kommunikationsbereitschafts-Zustands und der gespeicherten ersten digitalisierten Daten automatisch die variablen Regeln anzupassen und die angepassten Regeln in dem Speicher abzulegen.For adapting the variable rules stored in the memory, the device advantageously has a second input device for registering second input signals. In this embodiment, the evaluation unit is further configured to store first digitized data obtained from first input signals in the memory, by automatically evaluating a user's communication readiness state by evaluating second digitized data obtained from second input signals in dependence on fixed rules stored in the memory the telecommunications terminal to detect and monitor, and depending on the detected from the evaluated second digitized data communication readiness state and / or a change in communication readiness state and the stored first digitized data automatically adapt the variable rules and store the customized rules in the memory ,
Um beispielsweise akustische Signale auswerten zu können, ist die Vorverarbeitungseinheit vorteilhaft dazu ausgebildet, die ersten und/oder zweiten digitalisierten Daten aus Eingabesignalen zu erstellen, die über einen vorgegebenen Zeitraumregistriert werden.For example, in order to be able to evaluate acoustic signals, the preprocessing unit is advantageously designed to generate the first and / or second digitized data from input signals which are registered over a predetermined period of time.
Die zweite Eingabeeinrichtung dient vorzugsweise der Bestätigung einer Zuwendung oder Abwendung eines Benutzers zum Endgerät, um ein Anpassen der variablen Regeln zu ermöglichen und damit das Ermitteln eines Kommunikationsbereitschafts-Zustands auf Grundlage von Eingabesignalen der wenigstens einen ersten Eingabeeinrichtung zu verbessern. Zu diesem Zweck erfolgt das Anpassen der variablen Regeln vorteilhaft in Abhängigkeit von ersten Eingabesignalen, die mittels der ersten Eingabeeinrichtung kurz vor, kurz nach oder während einer Bestätigung durch den Benutzer mittels der zweiten Eingabeeinrichtung registriert werden.The second input device is preferably for confirming a donation or avoidance of a user to the terminal to enable adaptation of the variable rules and thereby to improve the determination of a communication ready state based on input signals of the at least one first input device. For this purpose, the adaptation of the variable rules advantageously takes place as a function of first input signals which are registered by means of the first input device shortly before, shortly after or during a confirmation by the user by means of the second input device.
Dementsprechend ist die Vorverarbeitungseinheit vorteilhaft dazu ausgebildet, die ersten und zweiten digitalisierten Daten aus ersten beziehungsweise zweiten Eingabesignalen zu erstellen, die über einen ersten beziehungsweise zweiten Zeitraum registriert werden, wobei der erste Zeitraum vor oder nach dem zweiten Zeitraum liegt oder der erste und zweite Zeitraum wenigstens teilweise übereinstimmen.Accordingly, the preprocessing unit is advantageously designed to generate the first and second digitized data from first and second input signals, respectively, registered over a first and second time period, the first time period before or after the second time period, or at least the first and second time periods partially agree.
Die Bestätigung einer Änderung eines Kommunikationsbereitschafts-Zustands mittels der zweiten Eingabeeinrichtung durch den Benutzer kann vorzugsweise optional erfolgen, beispielsweise wenn ausgehend von den ersten Eingabesignalen ein Wahrscheinlichkeitswert für das Vorliegen einer Kommunikationsbereitschaft ermittelt wird, der nah bei einem vorgegebenen Grenzwert liegt. In diesem Fall löst die Bestätigung mittels der zweiten Eingabeeinrichtung vorzugsweise das Anpassen der variablen Regeln aus. Dementsprechend bewirkt das Feststellen einer Änderung des durch Auswerten der zweiten digitalisierten Daten durch die Auswerteeinheit ermittelten Kommunikationsbereitschafts-Zustands des Benutzers vorteilhaft das Anpassen der variablen Regeln.The confirmation of a change of a communication readiness state by means of the second input device by the user may preferably be optional, for example if a probabilistic value for the presence of a communication readiness which is close to a predefined limit value is determined on the basis of the first input signals. In this case, the confirmation by means of the second input device preferably triggers the adaptation of the variable rules. Accordingly, determining a change in the communication readiness state of the user determined by evaluating the second digitized data by the evaluation unit advantageously effects the adaptation of the variable rules.
Vorzugsweise wird ein Kommunikationsbereitschafts-Zustand auf der Grundlage mehrerer mittels unterschiedlicher Eingabeeinrichtungen registrierter Eingabesignale ermittelt. Dementsprechend umfasst die wenigstens eine erste Eingabeeinrichtung vorteilhaft wenigstens zwei erste Eingabeeinrichtungen, die jeweils zum Registrieren unterschiedlicher Arten von Eingabesignalen ausgebildet sind, wobei diese mit Vorteil zumindest eine berührungslos wirkende Eingabeeinrichtung wie zum Beispiel ein Mikrofon, ein Mikrofon-Array, eine Kamera oder einen Bewegungs- oder Neigungssensor umfassen.Preferably, a communication ready state is determined on the basis of a plurality of input signals registered by different input devices. Accordingly, the at least one first input device advantageously comprises at least two first input devices, each of which is designed to register different types of input signals, which advantageously have at least one non-contact input device, such as a microphone, a microphone array, a camera, or a motion detector. or tilt sensor.
Die zur Bestätigung einer Änderung des Kommunikationsbereitschafts-Zustands vorgesehene zweite Eingabeeinrichtung ist vorteilhaft als manuell durch den Benutzer zu bedienende Eingabeeinrichtung ausgebildet, beispielsweise als Griffel, Maus, Taste oder Touchscreen, um eine sichere Auswertung der entsprechenden zweiten Eingabesignale zu gewährleisten. Auch kann die zweite Eingabeeinrichtung vorteilhaft als Mikrofon ausgebildet sein, um ein akustisches Signal wie beispielsweise ein ”Hot Word”, zu registrieren. Ferner kann die erste Eingabeeinrichtung gleichzeitig als zweite Eingabeeinrichtung verwendet werden.The second input device provided for confirming a change in the communication readiness state is advantageously designed as an input device to be operated manually by the user, for example as a stylus, mouse, key or touchscreen, in order to ensure reliable evaluation of the corresponding second input signals. Also, the second input device can be advantageously designed as a microphone to an acoustic signal such as a "Hot Word ", to register. Furthermore, the first input device can be used simultaneously as a second input device.
Die Auswerteeinheit ist vorteilhaft zur Auswertung einer Maus-/Griffel- oder Tastatureingabe und/oder zum Ermitteln einer Laufzeitdifferenz akustischer, von einem Mikrofon-Array generierter Signale und/oder zur Spracherkennung akustischer Signale und/oder zur Auswertung prosodischer Merkmale von Spracheingaben und/oder zur Sprechererkennung akustischer Signale in Abhängigkeit hinterlegter Sprecherprofile und/oder zur Bilderkennung eines von einer Kamera aufgenommenen Bildes und/oder zur Gesichtserkennung eines von einer Kamera aufgenommenen Bildes in Abhängigkeit hinterlegter Gesichtsprofile und/oder zum Auswerten von Signalen mindestens eines Näherungs- oder Neigungssensors ausgebildet.The evaluation unit is advantageous for evaluating a mouse / stylus or keyboard input and / or for determining a transit time difference of acoustic signals generated by a microphone array and / or for speech recognition of acoustic signals and / or for evaluation of prosodic features of speech inputs and / or Speaker recognition of acoustic signals as a function of deposited speaker profiles and / or for image recognition of an image taken by a camera and / or face recognition of an image taken by a camera depending deposited facial profiles and / or for evaluating signals of at least one proximity or inclination sensor formed.
Wie bereits oben beschrieben beinhaltet das Ermitteln eines Kommunikationsbereitschafts-Zustands vorteilhaft das Ermitteln eines Wahrscheinlichkeitswertes oder eines ähnlichen Parameters, welcher die Zuverlässigkeit des ermittelten Zustandes widerspiegelt. Zu diesem Zweck ist bevorzugt im Speicher ein Grenzwert für diesen Parameter hinterlegt, wobei die Auswerteeinheit zum Ermitteln eines Wahrscheinlichkeitswertes oder eines ähnlichen Parameters für das Vorliegen einer Kommunikationsbereitschaft und zum Vergleichen des ermittelten Wertes mit dem hinterlegten Grenzwert ausgebildet ist.As described above, determining a communication ready state advantageously involves determining a probability value or similar parameter that reflects the reliability of the determined state. For this purpose, a limit value for this parameter is preferably stored in the memory, wherein the evaluation unit is designed to determine a probability value or a similar parameter for the presence of a communication readiness and to compare the determined value with the stored limit value.
Je nach konkreter Ausgestaltung und Einsatzzweck des Endgerätes kann die Auswerteeinheit vorteilhaft in das Endgerät integriert sein. Alternativ ist die Auswerteeinheit in einer separaten Verarbeitungseinheit angeordnet, die mittels einer Kommunikationsverbindung mit dem Endgerät verbindbar ist.Depending on the specific design and intended use of the terminal, the evaluation unit can be advantageously integrated into the terminal. Alternatively, the evaluation unit is arranged in a separate processing unit, which can be connected to the terminal by means of a communication connection.
Ferner sind in einer vorteilhaften Ausführungsform die erste und/oder zweite Eingabeeinrichtung als von der Telekommunikationsendeinrichtung separate Eingabeeinheiten ausgebildet, wobei die Eingabeeinheiten vorzugsweise dazu ausgebildet sind, mit der Telekommunikationsendeinrichtung drahtlos zu kommunizieren, beispielsweise mittels Bluetooth.Furthermore, in an advantageous embodiment, the first and / or second input device are embodied as input units separate from the telecommunication terminal device, wherein the input units are preferably designed to communicate wirelessly with the telecommunication terminal device, for example by means of Bluetooth.
Eine bevorzugte Ausführungsform einer Telekommunikationsvorrichtung umfasst ein öffentliches Telefon als Endgerät, welches vorteilhaft mit berührungslos zu bedienenden Eingabeeinrichtungen und entsprechenden Ausgabeeinrichtungen ausgerüstet ist. Um eine Kommunikation zu ermöglichen, die von Umstehenden nicht mitgehört werden kann, umfasst die Vorrichtung in dieser Ausführungsform bevorzugt eine Ausgabeeinrichtung zur Ausgabe von gerichteten akustischen Signalen, beispielsweise ausgebildet als Ultraschall-Lautsprechersystem, mittels dessen durch ein moduliertes Ultraschallsignal ein akustischen Strahl auf einen vorgegebenen Raumbereich gerichtet werden kann.A preferred embodiment of a telecommunications device comprises a public telephone as a terminal, which is advantageously equipped with non-contact input devices and corresponding output devices. In order to enable communication that can not be overheard by bystanders, the device in this embodiment preferably includes an output device for outputting directional acoustic signals, for example formed as an ultrasonic speaker system, by means of a modulated ultrasonic signal, an acoustic beam to a predetermined spatial area can be directed.
Die Erfindung wird nachfolgend beispielhaft anhand bevorzugter Ausführungsformen und unter Bezugnahme auf die beigefügten Zeichnungen genauer beschrieben. Dabei bezeichnen gleiche Bezugszeichen in den Zeichnungen gleiche oder ähnliche Teile.The invention will now be described in more detail by way of example with reference to preferred embodiments and with reference to the accompanying drawings. The same reference numerals in the drawings designate the same or similar parts.
Es zeigen:Show it:
Mittels wenigstens einer ersten Eingabeeinrichtung wird wenigstens ein erstes Eingabesignal registriert. Als einsetzbare Eingabeeinrichtungen sind in
Der Datensatz
Zur Auswertung des ersten Datensatzes sind in der dargestellten Ausführungsform verschiedene Auswerte-Module
Die variablen Regeln
Zu diesem Zweck wird ein erster Datensatz
Wird mittels der Auswerteeinheit anhand des zweiten Datensatzes in Abhängigkeit der vorgegebenen festen Regeln
Ferner umfasst das Endgerät
Die Auswerteeinheit
In
Als Ausgabeeinrichtungen dienen ein Bildschirm
Optional kann das öffentliche Telefon eine Taste
Im Folgenden sind einige Beispiele aus Sensor- und Sprachsignalen ableitbarer variabler Regeln aufgeführt.Below are some examples of sensor and speech signals of derivable variable rules.
Ist zum Beispiel die Laufzeitdifferenz von Sprachsignalen zu räumlich auf dem Endgerät unterschiedlich angeordneten Mikrofonen innerhalb einer festgelegten Toleranz gleich oder nahe Null, so kann bereits in diesem einfachen Fall davon ausgegangen werden, dass der Nutzer mit einer lokalen und/oder netzbasierten Applikation und/oder einer anderen Person über das Endgerät kommunizieren möchte, so dass ein entsprechendes Aktivierungssignal generiert wird. Es können als Kriterium auch Entfernungsmessungen hinzugezogen werden, welche auf den Messungen der Winkel zum Nutzer über ein Kamera-Array basieren.If, for example, the propagation time difference between speech signals and microphones spatially arranged differently on the terminal within a specified tolerance is equal to or near zero, it can already be assumed in this simple case that the user is using a local and / or network-based application and / or a another person wants to communicate via the terminal, so that a corresponding activation signal is generated. It is also possible to use distance measurements as a criterion, which are based on the measurements of the angles to the user via a camera array.
Die Auswertung der Laufzeiten kann mit einer Auswertung eines Bildsignals derart gekoppelt werden, dass durch Auswertung dieses Signals auf dem Endgerät oder einem entfernten Serversystem festgestellt werden kann, ob das Gesicht des Nutzers in einem oder einem von mehreren möglichen vordefinierten Winkeln zur Kamera erscheint, so dass in diesem Fall ein entsprechendes Aktivierungssignal generiert wird. Über einen Neigungssensor kann im Rahmen voreingestellter Toleranzen festgestellt werden, ob das Endgerät mit der Vorderseite nach unten oder soweit angewinkelt ist, dass von einer Abwendung des Nutzers vom Endgerät ausgegangen werden kann, was einen Kommunikationswunsch wenig wahrscheinlich erscheinen lässt. Der Bewegungssensor dient dabei der dynamischen Erfassung der Bewegungen. Erscheint zum Beispiel das Gesicht des Nutzers nach einer bestimmten Bewegung im Kamerabild, so kann unter Umständen mit einer relativ hohen Wahrscheinlichkeit oder Wichtung auf einen Kommunikationswunsch geschlossen werden.The evaluation of the transit times can be coupled with an evaluation of an image signal such that it can be determined by evaluating this signal on the terminal or a remote server system, if the user's face appears in one or one of several possible predefined angles to the camera, so that In this case, a corresponding activation signal is generated. About an inclination sensor can be determined in the context of preset tolerances, whether the terminal is angled with the front side down or to the extent that it can be assumed that the user of the terminal, which makes a communication request less likely. The motion sensor serves to record the movements dynamically. If, for example, the user's face appears after a certain movement in the camera image, it may possibly be concluded with a relatively high probability or weighting on a communication request.
Wenn dann zusätzlich zu den mit hoher Wahrscheinlichkeit auf einen Kommunikationswunsch hindeutenden Sensorsignalen ein ”Hot Word” mit ebenfalls hoher Wahrscheinlichkeit erkannt wird, so wird das Aktivierungssignal generiert.If, in addition to the sensor signals indicating a communication request with a high probability, a "hot word" is also detected with a high degree of probability, the activation signal is generated.
Bei einer seitlich vertikalen Ausrichtung des Endgerätes mit Kamerabild ohne ein Gesicht kann zum Beispiel mit einer bestimmten Wahrscheinlichkeit davon ausgegangen werden, dass kein Kommunikationswunsch oder kein Kommunikationswunsch mehr besteht. Dementsprechend wird ein gegebenenfalls bestehender Aktivierungszustand deaktiviert oder ein Deaktivierungssignal übertragen.In a laterally vertical orientation of the terminal with a camera image without a face can be assumed, for example, with a certain probability that no communication request or no communication request is. Accordingly, an optionally existing activation state is deactivated or a deactivation signal is transmitted.
Auf diese Art kann unter Berücksichtigung von Sensorsignalen und Spracherkennung ein Satz von Regeln, die auch als Verhaltensgrammatik bezeichnet werden können, definiert werden, welcher als Voreinstellung im Endgerät und/oder auf einem an das Kommunikationsnetz angeschlossenen Server endgeräte- und/oder nutzerbezogen gespeichert ist. Zusätzlich zu den im Endgerät installierten Sensoren und/oder Mikrofonen können sich diese auch in intelligenter Kleidung befinden und mit dem Endgerät drahtlos, z. B. über Bluetooth-Verbindungen kommunizieren, wodurch ermöglicht wird, die relative Lage des Nutzers zum Endgerät zu erfassen, zum Beispiel stehend, angelehnt, sitzend oder seitlich liegend. So kann zum Beispiel als Regel definiert werden, dass nur bei einem seitlich liegenden Nutzer und einer seitlichen Position des Endgerätes und/oder weiteren Bedingungen ein Kommunikationswunschsignal generiert wird. Steht der Nutzer, und wird das Endgerät in seitlicher Position gehalten, so wird die Wahrscheinlichkeit für einen Kommunikationswunsch als gering bewertet.In this way, taking into account sensor signals and speech recognition, a set of rules, which can also be referred to as behavioral grammar, are defined, which is stored as default in the terminal and / or on a server connected to the communication network terminal and / or user-related. In addition to the sensors and / or microphones installed in the terminal, these can also be found in intelligent clothing and connected to the terminal wirelessly, for. B. communicate via Bluetooth connections, which allows to detect the relative position of the user to the terminal, for example, standing, leaning, sitting or lying on the side. Thus, for example, it can be defined as a rule that a communication request signal is generated only in the case of a user lying to the side and a lateral position of the terminal and / or other conditions. If the user is standing, and the terminal is held in a lateral position, then the probability of a communication request is rated as low.
Die Signale der im und/oder am Endgerät und/oder in intelligenter Kleidung installierten Eingabeeinrichtungen können auch zeitlich getaktet zur Bildung von Merkmalsvektoren dienen, welche wiederum als Grundlage zum Training von Wahrscheinlichkeitsmodellen wie zu Beispiel einem Hidden Markov Modell dienen, die in diesem Fall auch als Medienmodelle oder Verhaltensmodelle bezeichnet werden können.The signals of the input devices installed in and / or on the terminal and / or in smart clothing can also be timed to form feature vectors, which in turn serve as a basis for training probability models such as a Hidden Markov model, which in this case also serves as Media models or behavioral models can be called.
Mit diesem trainierten, nutzerabhängigen Verhaltensmodell wird bei eingeschaltetem Endgerät ständig das über die Eingabeeinrichtungen erfasste aktuelle Nutzerverhalten verglichen und ab einem bestimmten errechneten Zuverlässigkeitswert bzw. Wahrscheinlichkeit wird das Kommunikationswunschsignal oder Deaktivierungssignal generiert.With this trained, user-dependent behavioral model, the current user behavior detected via the input devices is constantly compared when the terminal is switched on, and the communication request signal or deactivation signal is generated at a certain calculated reliability value or probability.
Das Training des Verhaltensmodells kann sowohl durch eine Software auf dem Endgerät, als auch auf einem über ein Kommunikationsnetz erreichbaren Server erfolgen. Dazu kann zum Beispiel der Nutzer in der Anfangsphase veranlasst werden, bei jedem Kommunikationswunsch eine Taste zu betätigen und/oder eine andere vorgeschriebene und eng definierte, erfassbare Aktion durchzuführen. Ähnliches gilt analog für den Abschluss der Kommunikation. Die vorher und gegebenenfalls kurz nachher innerhalb eines gewissen Zeitraums über die Eingabeeinrichtungen in mehreren Trainingsprozessen erfassten Merkmalsvektoren dienen dann der Bildung eines Referenz-Verhaltensmodells eines Nutzers.The training of the behavioral model can be done both by a software on the terminal, as well as on a server accessible via a communication network. For this purpose, for example, the user in the initial phase can be made to actuate a key for each communication request and / or to perform another prescribed and narrowly defined, detectable action. The same applies analogously to the conclusion of the communication. The feature vectors previously detected and possibly shortly thereafter within a certain period of time via the input devices in a plurality of training processes then serve to form a reference behavioral model of a user.
Über ein Kommunikationsnetz können die über die Eingabeeinrichtungen während der Trainingsphasen erfassten Sensordaten bzw. Merkmalsvektoren einer großen Anzahl von Nutzern auch der Bildung eines gemittelten, nutzerunabhängigen Verhaltensmodells dienen. Zu diesem Zweck werden die Nutzer in der Anfangsphase beispielsweise wiederum veranlasst, bei jedem Kommunikationswunsch eine Taste zu betätigen und/oder eine andere vorgeschriebene und eng definierte, erfassbare Aktion durchzuführen. Die vorher und gegebenenfalls kurz nachher innerhalb eines gewissen Zeitraums über die Eingabeeinrichtungen in mehreren Trainingsprozessen erfassten Merkmalsvektoren bzw. Daten werden dann an mindestens ein am Kommunikationsnetz angeschlossenes Serversystem übermittelt. Ist eine hinreichende z. B. als Grenzwert definierte Anzahl von erfassten Daten einer großen Anzahl verschiedener Nutzer vorhanden, können diese zur Bildung eines nutzerunabhängigen Verhaltensmodells für einen Kommunikationswunsch genutzt werden.Via a communication network, the sensor data or feature vectors of a large number of users acquired via the input devices during the training phases can also serve to form an averaged, user-independent behavioral model. For this purpose, the users in the initial phase, for example, in turn, prompted to press a button with each communication request and / or perform another prescribed and narrowly defined, detectable action. The feature vectors or data acquired beforehand and possibly shortly thereafter within a certain period of time via the input devices in a plurality of training processes are then transmitted to at least one server system connected to the communication network. Is a sufficient z. B. defined as a limit number of recorded data of a large number of different users, they can be used to form a user-independent behavioral model for a communication request.
Es können auch vorteilhaft verschiedene Verhaltensmodelle für einen Kommunikationswunsch vorgesehen sein, die unterschiedlichen Applikationen zugeordnet sind, wobei diese dementsprechend applikationsabhängig gespeichert werden.It may also be advantageous to provide different behavioral models for a communication request, which are assigned to different applications, whereby these are stored accordingly depending on the application.
Zur Verbesserung der berührungslosen Bedienung stationärer und/oder quasistationärer, zum Beispiel in Fahrzeugen eingebauter, Endgeräte und dabei speziell öffentlicher Telefone ist neben der berührungslosen Aktivierung und/oder Deaktivierung der Signale, die einen Kommunikationswunsch zum Ausdruck bringen, noch ein Ausgabemodus, gegebenenfalls mit Freisprechfunktionalität mit gerichtetem Schall erforderlich, der verhindert, dass Umstehende die Ausgaben mindestens eines Endgerätelautsprechers mithören. Hierzu kann ein aus dem Stand der Technik bekanntes Ultraschallverfahren Anwendung finden.To improve the non-contact operation stationary and / or quasi-stationary, for example, built in vehicles, terminals and especially public telephones is in addition to the non-contact activation and / or deactivation of the signals that express a communication desire, nor an output mode, possibly with hands-free functionality directed sound, which prevents bystanders from overhearing the outputs of at least one terminal loudspeaker. For this purpose, an ultrasonic method known from the prior art can be used.
Ferner können in öffentlichen Telefonen vorteilhaft beweglich eingebaute und/oder über die Gerätehöhe verteilte Sensoren, wie Näherungssensoren, Kamerasysteme und Mikrofon-Arrays, sowohl der Ortung des Nutzers und der genauen Nachführung in Richtung des Nutzers, als auch der Steuerung eines ebenfalls beweglichen und/oder über die Gerätehöhe verteilten Lautsprechersystems dienen, um z. B. Anpassungen an die Nutzergröße durchzuführen (behindertengerechte Ausführung). Ebenfalls verteilt über die Gerätehöhe und/oder -fläche können Einrichtungen zur magnetischen Ankopplung von Hörgeräten verteilt werden, welche entsprechend der Nutzerlokalisierung angesteuert werden.Furthermore, in public telephones advantageously movably installed and / or distributed over the device height sensors, such as proximity sensors, camera systems and microphone arrays, both the location of the user and the accurate tracking in the direction of the user, as well as the control of a likewise movable and / or over the device height distributed speaker system serve z. B. Adjustments to the size of the user (handicapped execution). Also distributed over the device height and / or area devices for magnetic coupling of hearing aids can be distributed, which are controlled according to the user localization.
Ein Vorteil des beschriebenen Verfahrens besteht darin, dass nicht nur allein Sprachdaten oder allein andere Eingabemodi, sondern auch andere Daten der jeweils vorhandenen Eingabeeinrichtungen einer gemeinsamen Auswertung unterworfen werden, wodurch die Sicherheit zur Generierung bzw. Deaktivierung von Kommunikationswunschsignalen und damit die Nutzerakzeptanz wesentlich erhöht wird. Nutzer können sich, bei Bedarf nach Abschluss von Trainingsphasen, ohne zusätzliche Tastenbetätigungen über ein Endgerät einer Anwendung und/oder anderen Person als Kommunikationspartner ”zuwenden”. Ermöglicht werden auf diese Art öffentliche Telefone ohne über Kabel angeschlossene Hörer, die mit eingebautem Lautsprechersystem und Mikrofonarray und/oder Kamera und/oder Näherungssensoren ausgestattet sind, bei denen das Signal zur Kommunikation nicht mehr durch Abnehmen und Auflegen des Hörers aktiviert bzw. deaktiviert wird, sondern eine Aktivierung und Deaktivierung durch Überwachung der berührungslosen und/oder unimodalen und/oder multimodalen Eingabemöglichkeiten erfolgt. Die Geräte werden dadurch kompakter und weniger anfällig gegen Vandalismus. Auch ist eine separate Taste zum Beispiel zur Aktivierung und/oder Abbruch der Kommunikation, deren Betätigung ggf. scherzhaft vorgenommen oder vergessen werden kann, nicht unbedingt erforderlich.An advantage of the method described is that not only voice data alone or only other input modes, but also other data of the respective input devices are subjected to a common evaluation, whereby the security for generating or deactivating communication request signals and thus the user acceptance is substantially increased. Users can, if necessary after completion of training phases, without additional keystrokes via a terminal of an application and / or other person as a communication partner "turn". In this way, public telephones are made possible without cable-connected handsets equipped with a built-in loudspeaker system and microphone array and / or camera and / or proximity sensors, in which the signal for communication is no longer activated or deactivated by removing and hanging up the receiver, but an activation and deactivation by monitoring the non-contact and / or unimodal and / or multimodal input options is done. This makes the devices more compact and less susceptible to vandalism. Also, a separate key, for example, to activate and / or cancel the communication, the operation of which may jokingly be made or forgotten, not necessarily required.
Claims (27)
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE102006058758.8A DE102006058758B4 (en) | 2006-12-12 | 2006-12-12 | Method and device for controlling a telecommunication terminal |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE102006058758.8A DE102006058758B4 (en) | 2006-12-12 | 2006-12-12 | Method and device for controlling a telecommunication terminal |
Publications (2)
Publication Number | Publication Date |
---|---|
DE102006058758A1 DE102006058758A1 (en) | 2008-06-19 |
DE102006058758B4 true DE102006058758B4 (en) | 2018-02-22 |
Family
ID=39399547
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE102006058758.8A Expired - Fee Related DE102006058758B4 (en) | 2006-12-12 | 2006-12-12 | Method and device for controlling a telecommunication terminal |
Country Status (1)
Country | Link |
---|---|
DE (1) | DE102006058758B4 (en) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE102011117289B4 (en) * | 2011-10-31 | 2017-08-24 | Volkswagen Ag | Method for operating a mobile device in a vehicle, coupling device, vehicle and system |
DE102016118007A1 (en) | 2016-09-23 | 2018-03-29 | Gira Giersiepen Gmbh & Co. Kg | Method for operating at least one building intercom and a corresponding building intercom system |
Citations (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0141289A2 (en) * | 1983-10-22 | 1985-05-15 | Alcatel N.V. | Device for a telephone set |
US5255341A (en) * | 1989-08-14 | 1993-10-19 | Kabushiki Kaisha Toshiba | Command input device for voice controllable elevator system |
EP0930761A2 (en) * | 1998-01-20 | 1999-07-21 | Lucent Technologies Inc. | Telephone with adaptive speed dial method |
US6263216B1 (en) * | 1997-04-04 | 2001-07-17 | Parrot | Radiotelephone voice control device, in particular for use in a motor vehicle |
EP1117076A2 (en) * | 2000-01-13 | 2001-07-18 | Ncr International Inc. | Self-service terminal |
DE10130852A1 (en) * | 2000-06-29 | 2002-05-29 | Werner Maier | Voice-controled remote control system for electrical equipment has voice recognition stage in mobile telephone with adaptable association of voice recognition to coded control signals |
US20020152010A1 (en) * | 2001-04-17 | 2002-10-17 | Philips Electronics North America Corporation | Automatic access to an automobile via biometrics |
DE10117654A1 (en) * | 2001-04-09 | 2002-10-17 | T Mobile Deutschland Gmbh | Control procedure for mobile-phone terminals, involves storing and carrying out macro-commands |
US20020167392A1 (en) * | 2001-05-08 | 2002-11-14 | Gene Williams | Motion activated communication device |
DE10251112A1 (en) * | 2002-11-02 | 2004-05-19 | Philips Intellectual Property & Standards Gmbh | Voice recognition involves generating alternative recognition results during analysis with next highest probability of match to detected voice signal for use to correct output recognition result |
DE20221078U1 (en) * | 2001-02-28 | 2004-12-23 | Beckmann, Jürgen, Dr. | Input device, in particular for a mobile phone |
US20050134117A1 (en) * | 2003-12-17 | 2005-06-23 | Takafumi Ito | Interface for car-mounted devices |
DE10156954B9 (en) * | 2001-11-20 | 2005-07-14 | Daimlerchrysler Ag | Image-based adaptive acoustics |
DE102004029873B3 (en) * | 2004-06-16 | 2005-12-29 | Deutsche Telekom Ag | Method for intelligent input correction for automatic voice dialog system, involves subjecting user answer to confirmation dialog to recognition process |
-
2006
- 2006-12-12 DE DE102006058758.8A patent/DE102006058758B4/en not_active Expired - Fee Related
Patent Citations (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0141289A2 (en) * | 1983-10-22 | 1985-05-15 | Alcatel N.V. | Device for a telephone set |
US5255341A (en) * | 1989-08-14 | 1993-10-19 | Kabushiki Kaisha Toshiba | Command input device for voice controllable elevator system |
US6263216B1 (en) * | 1997-04-04 | 2001-07-17 | Parrot | Radiotelephone voice control device, in particular for use in a motor vehicle |
EP0930761A2 (en) * | 1998-01-20 | 1999-07-21 | Lucent Technologies Inc. | Telephone with adaptive speed dial method |
EP1117076A2 (en) * | 2000-01-13 | 2001-07-18 | Ncr International Inc. | Self-service terminal |
DE10130852A1 (en) * | 2000-06-29 | 2002-05-29 | Werner Maier | Voice-controled remote control system for electrical equipment has voice recognition stage in mobile telephone with adaptable association of voice recognition to coded control signals |
DE20221078U1 (en) * | 2001-02-28 | 2004-12-23 | Beckmann, Jürgen, Dr. | Input device, in particular for a mobile phone |
DE10117654A1 (en) * | 2001-04-09 | 2002-10-17 | T Mobile Deutschland Gmbh | Control procedure for mobile-phone terminals, involves storing and carrying out macro-commands |
US20020152010A1 (en) * | 2001-04-17 | 2002-10-17 | Philips Electronics North America Corporation | Automatic access to an automobile via biometrics |
US20020167392A1 (en) * | 2001-05-08 | 2002-11-14 | Gene Williams | Motion activated communication device |
DE10156954B9 (en) * | 2001-11-20 | 2005-07-14 | Daimlerchrysler Ag | Image-based adaptive acoustics |
DE10251112A1 (en) * | 2002-11-02 | 2004-05-19 | Philips Intellectual Property & Standards Gmbh | Voice recognition involves generating alternative recognition results during analysis with next highest probability of match to detected voice signal for use to correct output recognition result |
US20050134117A1 (en) * | 2003-12-17 | 2005-06-23 | Takafumi Ito | Interface for car-mounted devices |
DE102004029873B3 (en) * | 2004-06-16 | 2005-12-29 | Deutsche Telekom Ag | Method for intelligent input correction for automatic voice dialog system, involves subjecting user answer to confirmation dialog to recognition process |
Also Published As
Publication number | Publication date |
---|---|
DE102006058758A1 (en) | 2008-06-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DE60036931T2 (en) | USER LANGUAGE INTERFACE FOR VOICE-CONTROLLED SYSTEMS | |
EP1256936B1 (en) | Method for the training or the adaptation of a speech recognizer | |
EP0852051B1 (en) | Process for automatic control of one or more devices by voice commands or by real-time voice dialog and apparatus for carrying out this process | |
DE60217987T2 (en) | Mobile phone with audio-modulated vibration module | |
DE102018128006A1 (en) | NATURAL LANGUAGE GENERATION BASED ON THE USER LANGUAGE STYLE | |
DE102016103160B4 (en) | Method and device for a voice control user interface with a discrete operating mode | |
DE102019111529A1 (en) | AUTOMATED LANGUAGE IDENTIFICATION USING A DYNAMICALLY ADJUSTABLE TIME-OUT | |
DE102016103162A1 (en) | Method and device for gesture detection in an electronic device | |
DE10251113A1 (en) | Voice recognition method, involves changing over to noise-insensitive mode and/or outputting warning signal if reception quality value falls below threshold or noise value exceeds threshold | |
WO2002018897A1 (en) | Voice-controlled arrangement and method for voice data entry and voice recognition | |
DE60212725T2 (en) | METHOD FOR AUTOMATIC LANGUAGE RECOGNITION | |
DE10163213A1 (en) | Method for operating a speech recognition system | |
DE102018210534A1 (en) | Apparatus and method for controlling an application program using a voice command under a preset condition | |
EP3661797B1 (en) | Method, device, mobile user apparatus and computer program for controlling an audio system of a vehicle | |
DE102018103188A1 (en) | Improved task completion in speech recognition | |
DE112018007242T5 (en) | Data processing device, data processing method, program and data processing system | |
DE102013208506A1 (en) | Method for identifying vehicle driver, involves performing determination of whether sub-process of group in determination act to identify the vehicle driver, when another determination act is provided with negative result | |
EP2389753A1 (en) | Conference system and associated signalling method | |
CN101436404A (en) | Conversational biology-liked apparatus and conversational method thereof | |
DE102018128003A1 (en) | NEURONAL NETWORK FOR USE IN VOICE RECOGNITION ARBITRATION | |
DE102016217026A1 (en) | Voice control of a motor vehicle | |
EP3396978B1 (en) | Hearing aid and method for operating a hearing aid | |
EP3873108A1 (en) | Hearing system with at least one hearing instrument worn in or on the ear of the user and method for operating such a hearing system | |
DE102017213249A1 (en) | Method and system for generating an auditory message in an interior of a vehicle | |
DE102006058758B4 (en) | Method and device for controlling a telecommunication terminal |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
OM8 | Search report available as to paragraph 43 lit. 1 sentence 1 patent law | ||
R012 | Request for examination validly filed |
Effective date: 20131115 |
|
R016 | Response to examination communication | ||
R016 | Response to examination communication | ||
R016 | Response to examination communication | ||
R016 | Response to examination communication | ||
R018 | Grant decision by examination section/examining division | ||
R020 | Patent grant now final | ||
R119 | Application deemed withdrawn, or ip right lapsed, due to non-payment of renewal fee |