-
Die Erfindung betrifft eine Hausanlage mit
einer ersten Station mit einer ersten Sprech-Hör-Einrichtung,
einer zweiten Station mit einer zweiten Sprech-Hör-Einrichtung und
einer Einrichtung zum Erkennen von Sprachaktivitäten an der ersten und/oder der zweiten Station.
-
Hausanlagen der oben genannten Art sind bekannt. Dabei handelt es sich meist bei der ersten Station um eine Wohnungsstation und bei der zweiten Station um eine Türstation. Bei dem Betrieb derartiger Hausanlagen kommt es mitunter vor, daß nach Gesprächsende vergessen wird, an der Wohnungsstation den während des Gesprächs verwendeten Hörer aufzuhängen oder – im Falle einer Freisprechanlage – die Sprechverbindung beispielsweise durch Betätigen einer einschlägigen Taste zu beenden. Bleibt in einem solchen Falle die Sprechverbindung eingeschaltet, so ist dies zum einen unter Energiespar-Gesichtspunkten bedenklich. Zum anderen besteht die Gefahr des Abhörens, beispielsweise der Wohnung, indem man an der Türstation lauscht. Sind neben den beiden erwähnten Stationen noch weitere Stationen an der Hausanlage vorgesehen, die sich eine gemeinsame Übertragungseinrichtung teilen, wie beispielsweise einen Bus, sind dann, wenn vergessen wird, die Übertragungseinrichtung nach Gesprächsende auszuschalten, alle anderen Stationen von der Kommunikation ausgeschlossen.
-
Manche herkömmliche Hausanlagen verfügen daher über einen automatischen Ausschaltmechanismus, der die Übertragungseinrichtung nach einer vorgegebenen und meist individuell einstellbaren Zeit automatisch ausschaltet.
-
Soll aber ein längeres Gespräch geführt werden, so ist ein verfrühtes Ausschalten der Übertragungseinrichtung ärgerlich. Andererseits würde die Vorgabe einer allzu langen Wartezeit bis zum Ausschalten ein unnötiges Blockieren der Übertragungseinrichtung bedeuten.
-
Aus der
EP 0 395 771 A1 , von der die Erfindung ausweislich des Oberbegriffs von Anspruch 1 ausgeht, ist eine Notruf-, insbesondere Aufzugssprechstelle bekannt, die an eine Telefonvermittlungsstelle angeschaltet ist. Eine einmal hergestellte Verbindung wird nach Ausbleiben von Sprechsignalen automatisch getrennt. Die Trennung erfolgt dabei dadurch, daß die Gleichstrom-Verbindung zu der Vermittlungsstelle aufgetrennt wird. Dies wird von der Vermittlungsstelle erkannt, und die Vermittlungsstelle trennt daraufhin die Verbindung zu dem anderen Teilnehmer. Die bekannte Hausanlage funktioniert also nur dann, wenn eine Vermittlungsstelle vorgesehen ist. Eine solche Vermittlungsstelle macht aber den Gesamtaufbau kompliziert und wartungsanfällig.
-
Der Erfindung liegt daher die Aufgabe zugrunde, die Hausanlage der eingangs genannten Art derart weiterzubilden, daß eine Vermittlungsstelle nicht erforderlich ist.
-
Erfindungsgemäß wird die gestellte Aufgabe bei einer Hausanlage der eingangs genannten Art dadurch gelöst, daß die erste Station dazu ausgelegt ist, bei mangelnder Sprachaktivität an der ersten und/oder der zweiten Station ein Ausschaltsignal an die zweite Station abzugeben, und die zweite Station dazu ausgelegt ist, ansprechend auf das Ausschaltsignal die zweite Sprech-Hör-Einrichtung auszuschalten.
-
Mit anderen Worten bewirkt die erste Station selbst unmittelbar die Erzeugung des Ausschaltsignals, auf das die zweite Station entsprechend reagiert. Der Umweg über eine Vermittlungsstelle oder dergleichen ist nicht erforderlich. Vielmehr kommunizieren die beiden Stationen hinsichtlich des Ausschaltens bei mangelnder Sprachaktivität unmittelbar miteinander.
-
Dennoch wird diejenige Zeit, für die die Verbindung der beiden Sprech-Hör-Einrichtungen aufrechterhalten bleibt, nicht starr vorgegeben, sondern vielmehr individuell an die Gesprächslänge angepaßt. Die Verbindung bleibt nämlich bestehen, solange Sprachaktivitäten an der ersten und/oder der zweiten Station darauf schließen lassen, daß das Gespräch noch im Gange ist, wohingegen die Verbindung getrennt wird, sobald solche Aktivitäten nicht mehr festgestellt werden, das Gespräch also offensichtlich beendet ist.
-
Einrichtungen zum Erkennen von Sprachaktivitäten sind bekannt und müssen daher hier nicht mehr im einzelnen erläutert werden. So kommt beispielsweise die in dem
europäischen Patent 784 311 beschriebene Vorrichtung und das dort beschriebene Verfahren zur Sprachaktivitätserfassung bei der Verwirklichung der vorliegenden Erfindung in Betracht. Weitere Einzelheiten und Möglichkeiten der Realisierung sind darüber hinaus der
US 5,459,814 A sowie der
US 5,276,765 A zu entnehmen. Dabei beschreibt die
US 5,459,814 A ein Verfahren zur Sprachaktivitätserfassung, bei dem für das Sprachsignal ein mittlerer Signalpegel und Nulldurchgänge berechnet werden. Die
US 5,276,765 A sowie die
WO 95/08170 offenbaren ein Verfahren zur Sprachaktivitätserfassung, bei dem eine spektrale Differenz zwischen dem Sprachsignal und einer Störungsabschätzung unter Verwendung von LPC-Parametern (Linear Prediction Coding) berechnet wird. Die genannten Schriften offenbaren außerdem einen zusätzlichen Sprachaktivitätsdetektor (VAD, Voice Activity Detector), der das Aktualisieren der Störungsabschätzungen steuert, mit anderen Worten lernfähig ist.
-
Eine weitere Möglichkeit der Realisierung der Einrichtung zum Erkennen von Sprachaktivitäten im Rahmen der erfindungsgemäßen Hausanlage besteht in einem Filtern des Gesamtsignals, das sich aus einem Sprachsignal und einem Störsignal zusammensetzt, um das Störsignal zu minimieren. Diese Filterung geht gegebenenfalls mit der Begrenzung des Gesamtsignals auf das Sprachband einher. Als Filter kommen in der Regel Tief- und/oder Bandpaßfilter in Betracht.
-
In einem nächsten Schritt wird dann die Kurzzeitenergie des herausgefilterten Signals berechnet. Es erfolgt ein Aufrechnen aller Werte in Zeitabschnitten von ca. 10 bis 20 ms.
-
Schließlich erfolgt eine Bewertung dieses Signals durch Vergleich der einzelnen berechneten Werte der Kurzzeitenergie. Dabei kommen grundsätzlich folgende Kriterien bei dem Vergleich in Betracht:
- – Der Absolutwert der Kurzzeitenergie muß einen vorgegebenen Schwellenwert übersteigen. Die Größe des Schwellenwertes hängt dabei von den jeweiligen Gesamtverhältnissen ab. Dazu gehört beispielsweise die Empfindlichkeit des verwendeten Mikrophons, der voraussichtliche Abstand eines Sprechers vom Mikrophon und dergleichen.
- – Die Änderung der Kurzzeitenergie muß einen gewissen Wert übersteigen. Mit anderen Worten ist nicht nur der Absolutwert für das Erkennen von Sprachaktivität entscheidend, sondern vielmehr auch die Ableitung. Wiederum ist es nicht sinnvoll, allgemeingültige Regeln für den einschlägigen Grenzwert anzugeben. Vielmehr hängt er wiederum von den Gesamtgegebenheiten ab.
-
Abgesehen von den obigen Details können zusätzliche und ergänzende Mechanismen vorgesehen sein, insbesondere um die Sprachaktivitätserkennung sicherer zu machen. Dabei können die einzelnen Mechanismen miteinander kombiniert werden. Auch ist eine Bewertung einzelner Kriterien in Abhängigkeit von anderen Kriterien möglich. Solche Merkmale und Kriterien sind insbesondere die folgenden:
- – Es kann ein Selbstlern-Mechanismus für den absoluten Schwellenwert und den Grenzwert für die Änderung der Kurzzeitenergie implementiert sein. Eines der wichtigsten Kriterien bei der Erkennung von Sprache, nämlich die Dynamik, wird bei dieser Ausgestaltung berücksichtigt. Dadurch ergibt sich eine bessere Unterscheidung zwischen Sprache und Störung.
- – Es kann eine Tonerkennung implementiert sein, beispielsweise um störende Dauergeräusche zu erkennen und richtig zu bewerten.
- – Es kann das Vorhandensein einer Grundfrequenz im Sprachband mit ihren Vielfachen innerhalb des gefilterten Signals als Merkmal für das Vorhandensein von Sprache herangezogen werden.
- – Es können Nulldurchgänge als weiteres Sprachmerkmal erfaßt werden.
-
Insbesondere im Rahmen einer digitalen Sprachverarbeitung ist es möglich, Sprachpausen zu erkennen, und zwar beispielsweise unter Anwendung der Kriterien für Sprachaktivitätserkennung. In solcherlei Sprachpausen auftretende Signale kennen als Störsignale eingestuft und gespeichert werden. Diese gespeicherten Störsignale können dann später von erfaßten Werten abgezogen werden, wodurch eine weitere Filterung des Gesamtsignals möglich ist.
-
Erfindungsgemäß bevorzugt ist die Einrichtung zum Erkennen von Sprachaktivitäten der ersten Station zugeordnet und dazu ausgelegt, das Ausschaltsignal abzugeben, wenn sie für eine erste vorbestimmte Zeitspanne keine Sprachaktivität erkennt.
-
Mit anderen Worten erfolgt das Ausschalten nicht etwa gleich nach dem Ende des ersten gesprochenen Satzes. Vielmehr wartet die Erkennungseinrichtung die erste vorbestimmte Zeitspanne vor dem Abgeben des Ausschaltsignals ab, damit ein Gespräch nicht schon dann unterbrochen wird, wenn einer der beiden Gesprächspartner eine gewisse Zeit braucht, um weiterzusprechen, mit der Antwort auf eine Frage zu beginnen oder dergleichen.
-
Das von der Einrichtung zum Erkennen von Sprachaktivitäten an der ersten und/oder der zweiten Station abgegebene Ausgangssignal kann unmittelbar als Ausschaltsignal verwendet werden. Mit anderen Worten kann die zweite Sprech-Hör-Einrichtung unmittelbar ansprechend auf das Ausgangssignal der genannten Einrichtung ansprechen.
-
Erfindungsgemäß bevorzugt ist jedoch vorgesehen, daß die erste Station eine Schalteinrichtung aufweist, die an einem Ausgangsanschluß der Einrichtung zum Erkennen von Sprachaktivitäten an der ersten und/oder der zweiten Station angeschlossen und dazu ausgelegt ist, das Ausschaltsignal zu senden, wenn sie für eine vorbestimmte Zeitspanne kein eine Sprachaktivität anzeigendes Signal empfängt.
-
Mit anderen Worten wird nach dieser Ausgestaltung der Erfindung die Steuereinrichtung der Erkennungseinrichtung nachgeschaltet. In der Steuereinrichtung kann die für das Betreiben der Hausanlage erforderliche „Intelligenz” implementiert sein. Dadurch wird der Aufbau der Erkennungseinrichtung vereinfacht und es ist möglich, einen entsprechenden Standardbaustein zu verwenden.
-
Bevorzugt ist die Einrichtung zum Erkennen von Sprachaktivitäten dazu ausgelegt, ein der Sprachaktivität entsprechendes Signal an die Schalteinrichtung abzugeben, wobei die Schalteinrichtung dazu ausgelegt ist, das der Sprachaktivität entsprechende Signal auszuwerten und das Ausschaltsignal an die zweite Station abzugeben, wenn für eine vorbestimmte zweite Zeitspanne keine Sprachaktivität stattgefunden hat.
-
Bei dieser Ausgestaltung der Erfindung ist also wiederum zumindest ein Teil der „Intelligenz” in der Schalteinrichtung vorgesehen. Sie bekommt nämlich in diesem Falle quasi ein „Rohsignal” von der Erkennungseinrichtung für Sprachaktivitäten zugeleitet und muß es auswerten. Erst wenn diese Auswertung ergibt, daß für eine vorbestimmte zweite Zeitspanne keine Sprachaktivität stattgefunden hat, bewirkt die Schalteinrichtung das Ausschalten der zweiten Sprech-Hör-Einrichtung.
-
Erfindungsgemäß bevorzugt ist/sind die erste und/oder die zweite Zeitspanne einstellbar.
-
Selbstverständlich ist/sind die erste und die zweite Zeitspanne entsprechend dem jeweiligen Anwendungsfall zu wählen. Bevorzugt beträgt/betragen die erste und/oder die zweite Zeitspanne aber 0 bis 30 s, weiter bevorzugt 10 bis 20 s.
-
Neben der oben im einzelnen beschriebenen Hausanlage schafft die Erfindung auch ein Verfahren zum Betreiben einer Hausanlage, mit
einer ersten Station mit einer ersten Sprech-Hör-Einrichtung,
einer zweiten Station mit einer zweiten Sprech-Hör-Einrichtung und
einer Einrichtung zum Erkennen von Sprachaktivitäten an der ersten und/oder der zweiten Station.
-
Erfindungsgemäß ist vorgesehen, daß die erste Station bei mangelnder Sprachaktivität an der ersten und/oder der zweiten Station ein Ausschaltsignal abgibt und die zweite Station auf das Ausschaltsignal anspricht, indem sie die zweite Sprech-Hör-Einrichtung ausschaltet.
-
Wiederum ist also vorgesehen, daß die erste Station ohne Zwischenschaltung einer Vermittlungsstelle oder dergleichen unmittelbar Einfluß auf die zweite Station nimmt, indem sie das Ausschaltsignal abgibt, auf das die zweite Station durch Ausschalten der ihr zugeordneten zweiten Sprech-Hör-Einrichtung anspricht.
-
Bevorzugt gibt die erste Station das Ausschaltsignal erfindungsgemäß erst dann ab, wenn für eine vorbestimmte Zeitspanne keine Sprachaktivität ermittelt wird.
-
Die vorbestimmte Zeitspanne beträgt dabei erfindungsgemäß bevorzugt 0 bis 30 s, weiter bevorzugt 10 bis 20 s.
-
Im folgenden ist die Erfindung anhand eines bevorzugten Ausführungsbeispiels unter Bezugnahme auf die beiliegende Zeichnung mit weiteren Einzelheiten näher erläutert. Dabei zeigt
-
die einzige Figur schematisch eine Hausanlage nach einem bevorzugten Ausführungsbeispiel der Erfindung.
-
Zu der in der Zeichnung dargestellten Hausanlage gehört eine Wohnungsstation 100, eine Türstation 200, eine Wohnungsstation 300 und eine Türstation 400. Alle Stationen sind an einen gemeinsamen Zwei-Draht-Bus 500 angeschlossen.
-
Die Wohnungsstation 100 verfügt über eine Freisprecheinrichtung 102 mit einem Mikrophon und einem Lautsprecher, eine Erkennungseinrichtung 104 für Sprachaktivität, eine zentrale Steuerung 106, ein Tastenfeld 108, eine Türöffnertaste 110 und einen Codeerkenner 112.
-
In gleicher Weise verfügt die Wohnungsstation 300 über eine Freisprecheinrichtung 302 mit einem Mikrophon und einem Lautsprecher, eine Erkennungseinrichtung 304 für Sprachaktivität, eine zentrale Steuerung 306, ein Tastenfeld 308, eine Türöffnertaste 310 und einen Codeerkenner 312.
-
Zu der Türstation 200 gehören Ruftasten 202 und 204, eine zentrale Steuerung 206, eine Freisprecheinrichtung 208 mit einem Mikrophon und einem Lautsprecher sowie ein Codeerkenner 210. Ferner ist an die Türstation 200 ein Türöffner 212 angeschlossen.
-
In gleicher Weise verfügt die Türstation 400 über Ruftasten 402 und 404, eine zentrale Steuerung 406, eine Freisprecheinrichtung 408 mit einem Mikrophon und einem Lautsprecher und einen Codeerkenner 410. Darüber hinaus ist ein Türöffner 412 an die Türstation 400 angeschlossen.
-
Die Ruftasten 202 und 402 sind der Wohnungsstation 100 zugeordnet, wohingegen die Ruftasten 204 und 404 der Wohnungsstation 300 zugeordnet sind.
-
Die in der Zeichnung dargestellte Hausanlage funktioniert wie folgt:
Betätigt ein Besucher die Ruftaste 202, so gibt die Steuerung 206 ein Rufsignal an den Bus 500. Dieses Rufsignal wird von dem Codeerkenner 112 in der Wohnungsstation 100 als zugehörig erkannt. Daraufhin steuert die Steuerung 106 den Lautsprecher der Freisprecheinrichtung 102 an. Es ertönt ein Rufton.
-
Demgegenüber erkennen die Codeerkenner 312 und 410 der Stationen 300 und 400 das Rufsignal als ihnen nicht zugeordnet, weshalb sie es ignorieren.
-
Wird der Rufton an der Wohnungsstation 100 durch Betätigen einer einschlägigen Taste des Tastenfeldes 108 angenommen, so schaltet die Steuerung 106 die Freisprechanlage 102 und über den Bus 500 und den Codeerkenner 210 auch die Freisprechanlage 208 ein, so daß Sprachsignale zwischen den Stationen 100 und 200 ausgetauscht werden können. Mit anderen Worten kann ein Gespräch geführt werden.
-
Ab diesem Zeitpunkt überwacht die Erkennungseinrichtung 104 für Sprachaktivität die Umgebung der beiden Freisprecheinrichtungen 102 und 208 auf Sprachaktivität. D. h., sie analysiert die von den jeweiligen Mikrophonen empfangenen Schallsignale auf Sprachaktivität. Entsprechend dem Analyseergebnis gibt die Erkennungseinrichtung 104 einschlägige Signale an die Steuerung 106. So gibt sie beispielsweise ein Signal logisch „1” an die Steuerung 106, sofern sie Sprachaktivität erkennt, wohingegen sie dann, wenn sie keine Sprachaktivität erkennt, ein Signal entsprechend logisch „0” an die Steuerung 106 gibt.
-
Empfängt die Steuerung 106 für eine Zeitspanne von 15 s keine einer logischen „1” entsprechenden Signale, so schließt sie auf mangelnde Sprachaktivität sowohl an der Wohnungsstation 100 als auch an der Türstation 200 und schaltet die Freisprecheinrichtung 102 sowie die Freisprecheinrichtung 208 aus, indem sie ein Ausschaltsignal an die Türstation 200 abgibt.
-
Die genannte Zeitspanne von 15 s kann durch Betätigung einschlägiger Tasten an dem Tastenfeld 108 eingestellt werden.
-
Die Steuerung 106 reagiert allerdings nicht nur auf Signale von der Erkennungseinrichtung 104, sondern auch auf eine Betätigung des Türöffners 110 mit einem Ausschalten der Freisprecheinrichtungen 102 und 208. Darüber hinaus gibt sie bei Betätigung der Türöffnertaste 110 ein der Türstation 200 zugeordnetes Türöffnersignal an den Bus 500. Dieses Türöffnersignal wird von dem Codeerkenner 210 als für die Türstation 200 bestimmt erkannt, woraufhin die Steuerung 206 den Türöffner 212 ansteuert.
-
Demgegenüber erkennen die Codeerkenner 312 und 410 das Türöffnersignal nicht als ihnen zugeordnet und ignorieren es.
-
Die durch Betätigen des Tastenfeldes 108 etablierte Sprechverbindung zwischen der Wohnungsstation 100 und der Türstation 200 wird also zum einen gezielt dadurch getrennt, daß die Türöffnertaste 110 betätigt wird, woraus in der Regel nämlich zu schließen ist, daß das Gespräch beendet ist, weil der Besucher zum Eintreten aufgefordert worden ist. Zum anderen wird die Sprechverbindung aber auch dadurch (automatisch) getrennt, daß für 15 s keine Sprachaktivitäten mehr an den Stationen 100 und 200 festzustellen sind. Dies trifft beispielsweise dann zu, wenn ein Besucher nicht eingelassen wird.
-
Die Stationen 300 und 400 arbeiten analog zu den Stationen 100 und 200, d. h. entsprechend der obigen Funktionsbeschreibung. Eine nochmalige detaillierte Erörterung der Funktionsweise erübrigt sich daher.
-
Sprechverbindungen können nach der Erfindung aber nicht nur zwischen einer Wohnungsstation einerseits und einer Türstation andererseits etabliert werden. Vielmehr kann die Erfindung auch angewendet werden bei Gesprächen zwischen zwei Wohnungsstationen oder zwischen zwei Türstationen.
-
Die Tastenfelder 108 und 308 können noch über eine Trenntaste verfügen, mit der eine Sprechverbindung willkürlich getrennt werden kann. Darüber hinaus kann aus Sicherheitsgründen eine gezwungene Trennung einer Sprechverbindung nach einer vorgegebenen Zeitspanne von beispielsweise 10 Minuten vorgesehen sein, die unabhängig davon eine Trennung bewirkt, ob Sprachaktivität an einer der miteinander kommunizierenden Stationen festgestellt wird.
-
Die in der obigen Beschreibung, den Ansprüchen sowie der Zeichnung offenbarten Merkmale der Erfindung können sowohl einzeln als auch in beliebigen Kombinationen für die Verwirklichung der Erfindung in ihren verschiedenen Ausführungsformen wesentlich sein.