Verfahren und Vorrichtung zum Überwachen eines Zielbereichs von einem entfernten Standort aus
Beschreibung
Die vorliegende Erfindung bezieht sich auf Verfahren und Vorrichtungen zum Überwachen eines Zielbereichs und insbesondere auf Verfahren und Vorrichtungen zum Überwachen eines Zielbereichs von einem entfernten Standort aus.
Durch die allgemeine Verbreitung von digitalen Netzen, wie z. B. dem ISDN-Netz, ist die Möglichkeit entstanden, Videoüberwachungen über das Telephonnetz oder das Internet durchzuführen. Datennetze mit niedriger Bandbreite, wie z. B. das ISDN-Netz, erlauben jedoch nicht die Übertragung von Bewegtbildern mit hoher Auflösung. Typischerweise sind bei einer Übertragung von Videosequenzen über das ISDN-Netz nicht mehr als ein Bild pro zwei Sekunden übertragbar, wenn die Bilder die übliche Fernsehauflösung haben. Verschlechtert man jedoch die Auflösung um den Faktor 8 in der Größe, so kann man bis zu 25 Bilder pro Sekunde mit Videokonferenzing-Systemen übertragen. Wenn eine Videokamera beispielsweise mit einer Bildrate von 25 Einzelbildern pro Sekunde (24 Einzelbilder pro Sekunde im Kinobereich) arbeitet, so bedeutet dies, daß lediglich jedes vierte Einzelbild übertragen werden kann, um eine Echtzeitüberwachung über das ISDN-Netz durchführen zu können. Gerade zum Zweck der Videoüberwachung wird jedoch für strategische Entscheidungen, wie z. B. ob die Polizei oder Feuerwehr gerufen werden soll, bzw. ob ein Alarm ausgelöst werden soll und dergleichen, eine hohe Bildrate benötigt, um beispielsweise das Verhalten eines Eindringlings in einem überwachten Zielbereich zu verfolgen und zu beurteilen. Daher kann eine einfache Videokamera nicht direkt an ein Datennetz niedriger Bandbreite angeschlossen werden, da die Bandbreite des Datennetzes für die Fülle von Videoinformationen schlicht zu klein ist.
Die EP 0 496 607 AI offenbart ein Überwachungssystem, das u.a. eine Videokamera und einen nachgeschalteten Video- Codierer im Zielbereich, um eine verlustlose Videokomprimierung durchführen zu können, umfaßt. Bei dieser verwendeten Komprimierungsart wird in einem Videoeinzelbildspeicher, der ebenfalls im Zielbereich angeordnet ist, aufeinanderfolgend jedes Videoeinzelbild gespeichert, wobei im Codierer das aktuelle Einzelbild mit dem vorherigen Einzelbild verglichen wird, um die Pixel zu bestimmen, die sich von einem Einzelbild zum nächsten verändert haben. Es müssen somit nur Signale übertragen werden, die sich auf die Pixel beziehen, die sich verändert haben. Damit wird eine wesentliche Datenkompression erreicht, wobei diese Kompression zugleich eine verlustlose Kompression ist, da die Bilder nach einer Übertragung über eine Übertragungsleitung in einer Alarmzentrale verlustlos wiederhergestellt werden können. Am Zielbereich ist ferner ein permanent laufender Videorecorder angeordnet, der zu Archivierungszwecken vorgesehen ist. Aufgrund der verwendeten Codierungsart ist es erforderlich, das erste Einzelbild einer Sequenz vollständig zu übertragen, da die aufeinanderfolgenden Bilder in Analogie einer Differenzcodierung auf das erste Einzelbild bezogen sind. Daher kann und muß auch das Ausgangssignal des Videoeinzelbildspeichers zu der Alarmzentrale übertragen werden.
Die WO 094/03014 offenbart ein Videosicherheitsüberwachungs- system mit geringem Leistungsverbrauch. Der in dieser Schrift gezeigte Speicher ist jedoch lediglich vorgesehen, um vorübergehend komprimierte Bilddaten zu speichern, um die Zeit zu überbrücken, die zwischen der Signalisierung eines Alarms und einem Kommunikationsverbindungsaufbau vergeht. Damit erlaubt der Speicher keinen einzelbildweisen Zugriff und dient ferner zum Speichern von komprimierten Bildern.
Die DE 42 29 151 AI offenbart eine Vorrichtung zur Übertragung von Videosignalen und Audiosignalen über ein diensteintegrierendes Nachrichtennetz. Von einer Videokamera
gelieferte Einzelbilder werden vor der Übertragung komprimiert. Alternativ können Videosignale in nicht komprimiertem Zustand übertragen werden, wenn Standbilder mit hoher Auflösung benötigt werden.
Die Aufgabe der vorliegenden Erfindung besteht darin, Verfahren und Vorrichtungen zum Überwachen eines Zielbereichs von einem entfernten Standort aus zu schaffen, welche mit einem Datennetz niedriger Bandbreite auskommen und doch eine optimale Überwachung ermöglichen.
Diese Aufgabe wird durch ein Verfahren gemäß Anspruch 1 sowie durch eine Vorrichtung gemäß Anspruch 12 gelöst.
Der vorliegenden Erfindung liegt die Erkenntnis zugrunde, daß es für eine grobe Beurteilung der Situation in einem überwachten Zielbereich ausreichend ist, Videobilder mit niedriger Auflösung zur Verfügung zu haben. Die Einzelbilder mit niedriger Auflösung sind zwar nicht mehr in der Lage, alle Details des Zielbereichs genau darzustellen, sie liegen jedoch in einer hohen Bildwiederholrate der Videokamera vor, welche in der Nähe der maximalen Bildwiederholrate liegen kann, die die Videokamera an sich ermöglicht. Wird bestimmt, daß ein spezielles Einzelbild für eine bestimmte Entscheidung besonders wichtig ist, d. h. daß auf einem speziellen Einzelbild unter Umständen das Gesicht eines Eindringlings vorhanden ist, so kann erfindungsgemäß aus einem mit der Videokamera verbundenen lokalen Speicher am Zielbereich ein Einzelbild mit hoher Auflösung abgerufen werden, das bezüglich der Videosequenz in der Nähe des ausgewählten Einzelbildes liegt. Dieses ausgewählte Einzelbild mit hoher Auflösung kann nun über das Datennetz niedriger Bandbreite übertragen werden, um eine bestimmte Person oder einen bestimmten Gegenstand im Zielbereich genauer identifizieren zu können. Bei der Übertragung des Identifizierungsbildes ist es nicht entscheidend, wie schnell die Übertragung dauert, da im Vergleich zur im allgemeinen dauernden Übertragung der komprimierten Einzelbilder, d. h. der Bilder mit geringer
Auflösung, eine eher seltene Übertragung von Einzelbildern mit hoher Auflösung auftreten wird.
Somit ist es möglich, eine Videofernüberwachung über ein Datennetz mit niedriger Bandbreite durchzuführen, während gleichzeitig bestimmte Einzelbilder der Videosequenz mit hoher Auflösung abgefragt werden können, um speziell gewünschte Informationen aus dem Zielbereich zu erhalten.
Bevorzugte Ausführungsbeispiele der vorliegenden Erfindung werden nachfolgend bezugnehmend auf die beiliegenden Zeichnungen detaillierter erläutert. Es zeigen:
Fig. 1 eine schematische Darstellung eines ersten Ausführungsbeispiels gemäß der vorliegenden Erfindung; und
Fig. 2 ein schematische Darstellung eines zweiten Ausführungsbeispiels gemäß der vorliegenden Erfindung.
Fig. 1 stellt eine schematische Darstellung eines ersten Ausführungsbeispiels der vorliegenden Erfindung zum Überwachen eines Zielbereichs von einem entfernten Standort aus dar. Eine Video- oder Fernsehkamera 10 ist über einen Datenbus mit hoher Bandbreite mit einem Kompressionsmodul 12 verbunden, wobei der Ausgang des Kompressionsmoduls 12 mit einem Eingang einer am Zielbereich vorhandenen Schalteinrichtung 14 gekoppelt ist, deren anderer Ausgang mit einer Speichereinrichtung 16 verbunden ist. Der Ausgang der Schalteinrichtung steht über ein Telephonnetz 18 mit einem Rechner 20 in Verbindung, der als Personalcomputer, Workstation, etc. ausgeführt sein kann.
Im nachfolgenden wird die Funktion der Vorrichtung zum Überwachen eines Zielbereichs von einem entfernten Standort aus, welche in Fig. 1 schematisch dargestellt ist, erläutert. Die Videokamera 10 zeichnet vorzugsweise ständig eine Sequenz von aufeinanderfolgenden Einzelbildern eines Zielbereichs
auf, der derart bezüglich der Kamera angeordnet ist, daß derselbe von der Kamera erfaßt wird. Die Videokamera 10 gibt an ihrem Ausgang eine durchgehende Folge von Einzelbildern oder Frames aus . Die durchgehende Folge oder Sequenz von Einzelbildern gelangt in das Kompressionsmodul 12, das die Einzelbilder einerseits gar nicht oder nur gering komprimiert und über die Schalteinrichtung 14 in die Speichereinrichtung 16 schreibt und zum anderen die Einzelbilder der Sequenz komprimiert und die komprimierten Einzelbilder ebenfalls über die Schalteinrichtung 14 über das Telephonnetz 18 dem Rechner 20 zuführt. Die Hochkomprimierung und Übertragung findet vorzugsweise simultan zum Speichern der gering oder gar nicht komprimierten Einzelbilder in der Speichereinrichtung am Zielbereich statt.
Die Speichereinrichtung 16, die Schalteinrichtung 14 sowie das Kompressionsmodul 12 müssen nicht physisch direkt am Zielbereich positioniert sein. Die genannten Elemente müssen jedoch mit der Videokamera 10 über eine Datenübertragungseinrichtung verbunden sein, die eine ausreichend hohe Bandbreite hat, um gering oder überhaupt nicht komprimierte Videobilder übertragen zu können. Der Ausdruck "am Zielbereich" bedeutet daher im Sinne dieser Anmeldung, daß entsprechende Elemente mit der Videokamera 10 über eine Datenübertragungseinrichtung mit hoher Bandbreite verbunden sind. Der Zielbereich ist daher nicht ausschließlich der Bereich, den die Kamera tatsächlich filmt, sondern der gesamte Bereich, der durch den Übertragungskanal mit niedriger Bandbreite von dem entfernten Standort getrennt ist.
Typischerweise besitzt der Übertragungskanal 18, der in Fig. 1 als Telephonnetz dargestellt ist, eine derart niedrige Bandbreite, daß eine Echtzeitübertragung aller Einzelbilder der Videokamera in Fernsehqualität nicht möglich ist, wenn die Bilder mit voller Auflösung in den Übertragungskanal eingespeist werden. Das Kompressionsmodul komprimiert die Einzelbilder am Ausgang der Videokamera 10 daher derart, daß eine Echtzeitübertragung derselben über das Telephonnetz 18
möglich ist. Bei dem genannten Beispiel, bei dem eine Videokamera eine Datenrate von 24 Einzelbildern pro Sekunde liefert und der Übertragungskanal 18 lediglich eine Übertragung von sechs Vollbildern pro Sekunde ermöglicht, muß die Auflösung der Einzelbilder auf ein Viertel reduziert werden, um alle Einzelbilder über das Telephonnetz 18 übertragen zu können. Eine Kompression von Videobildern kann beispielsweise erreicht werden, wenn jede zweite Zeile und jede zweite Spalte der Pixel eliminiert wird, oder wenn beispielsweise nur jedes zweite oder auch dritte Einzelbild ausgewählt wird, oder indem eine Kombination der genannten Möglichkeiten angewendet wird. Die Kompression im Kompressionsmodul 12 wird typischerweise eine verlustbehaftete Kompression sein, wobei eine Fülle von verlustbehafteten Kompressionstechniken außer den genannten in der Technik bekannt sind.
Zum Rechner gelangt nun eine Folge von komprimierten Einzelbildern, deren Bildrate vorzugsweise der Bildrate am Ausgang der Videokamera entspricht, deren Auflösung jedoch derart reduziert worden ist, daß ihre Übertragung über das Telephonnetz 18 möglich war. Aufgrund der reduzierten Auflösung ist es einem Betrachter eines dem Rechner 20 zugeordneten Bildschirms, auf dem die übertragenen komprimierten Bilder angezeigt werden, lediglich möglich, grob einzuschätzen, was sich gerade im Zielbereich vor der Kamera 10 abspielt. Erkennt ein Beobachter des Rechners 20 eine für ihn interessante Situation, z. B. eine Person, ein Ziel, einen Gegenstand, etc., so kann er beispielsweise die laufende Videosequenz anhalten und einige Einzelbilder der Sequenz vor bzw. nach dem Augenblick des Anhaltens als Standbild betrachten. Der Beobachter wird dann auswählen, welches Einzelbild ihm den größten Informationsgehalt verspricht. Erfindungsgemäß wird er der Schalteinrichtung 14 über das Telephonnetz 18 eine Nachricht schicken, daß das dem ausgewählten Einzelbild entsprechende Einzelbild hoher Auflösung aus der Speichereinrichtung 16 wiedergewonnen werden soll, und über das Telephonnetz 18 zum Rechner 20 übertragen werden soll, um dasselbe dort zu betrachten.
Es sei darauf hingewiesen, daß sich sowohl die Kamera 10 als auch das Kompressionsmodul 12, die Schalteinrichtung 14 und die Speichereinrichtung 16 am Zielbereich befinden, während der Rechner 20 an einem entfernten Standort vorhanden ist. Der Zielbereich und der entfernte Standort werden daher im wesentlichen durch den Datenübertragungskanal, d. h. das Telephonnetz 18, miteinander verbunden.
Ist ein Beobachter mit dem von der Speichereinrichtung 16 erhaltenen Einzelbild hoher Auflösung noch nicht zufrieden, so kann er selbstverständlich zusätzlich mehrere in der Sequenz vorher oder nachher angeordnete Einzelbilder von der Speichereinrichtung 16 über die Schalteinrichtung 14 abrufen.
Wie es bereits erwähnt wurde, werden die Einzelbilder in dem Speichermodul vorzugsweise mit überhaupt keiner verwendeten Kompression, d. h. mit höchster Auflösung abgespeichert. Ist jedoch die Speicherkapazität der Speichereinrichtung 16 begrenzt, so kann das Kompressionsmodul 12 für die in der Speichereinrichtung 16 abgespeicherten Einzelbilder eine Kompression durchführen, die jedoch wesentlich weniger komprimiert als die Kompression für die über den Datenkanal 18 übertragenen Einzelbilder.
Fig. 2 zeigt ein zweites Ausführungsbeispiel für eine Vorrichtung zum Überwachen eines Zielbereichs von einem entfernten Standort aus gemäß der vorliegenden Erfindung. Gleiche Elemente wie in Fig. 1 sind mit den gleichen Bezugszeichen bezeichnet. Der Unterschied der in Fig. 2 gezeigten Vorrichtung zur in Fig. 1 gezeigten Vorrichtung besteht darin, daß der Ausgang der Videokamera 10 mit einer Schalteinrichtung 22 verbunden ist, welche bewirkt, daß jedes geradzahlige Einzelbild in der Sequenz von Einzelbildern einer Kompressionseinrichtung 12a zugeführt wird, die eine hohe Kompression durchführt. Jedes ungeradzahlige Einzelbild wird einer weiteren Kompressionseinrichtung 12b zugeführt, die
eine geringe oder gar keine Kompression durchführt. Die Bilder am Ausgang der weiteren Kompressionseinrichtung 12b werden ebenso wie beim ersten Ausführungsbeispiel in der Speichereinrichtung 16 abgespeichert.
Fig. 2 zeigt ferner eine detailliertere Darstellung des Rechners 20 und insbesondere des Monitors des Rechners 20. Der Monitor kann beispielsweise ein Workstationmonitor mit verschiedenen Fenstern sein. Ein Fenster 20a dient zur Anzeige der Videosequenz am Ausgang des Datenkanals 18, der hier als ISDN-Netz ausgeführt ist. In dem Fenster 20a wird daher das Live-Video des Zielbereichs mit geringer Auflösung dargestellt. Weitere Fenster 20b bis 20g dienen zum Anzeigen von Einzelbildern.
Stellt ein Betrachter des Live-Videos in dem Fenster 20a eine interessante Szene fest, so kann er dem Rechner 20 mitteilen, auf den Einzelbildfenstern 20b bis 20g die Einzelbilder des Live-Videos, d. h. der Videosequenz am Ausgang des Datenkanals 18, zu diesem Zeitpunkt bzw. in der Nähe dieses Zeitpunkts anzuzeigen. Durch Betrachten der Einzelbilder in den Einzelbildfenstern 20b bis 20g kann der Benutzer nun entscheiden, von welchem der Einzelbilder eine Ausgabe mit hoher Auflösung erwünscht ist.
Bei dem in Verbindung mit Fig. 1 beschriebenen ersten Ausführungsbeispiel der vorliegenden Erfindung kann der Benutzer dann genau das Einzelbild anfordern, das dem Einzelbild auf einem der Einzelbildfenster 20b bis 20g angezeigten Einzelbild mit niedriger Auflösung entspricht. Bei dem in Fig. 2 gezeigten Ausführungsbeispiel ist es nicht möglich, genau das Einzelbild vom Speicher 16 anzufordern, das dem auf dem Einzelbildfenster angezeigten Einzelbild entspricht, da jedes zweite Einzelbild (jedes Einzelbild mit einer geraden Nummer in der Sequenz von Einzelbildern) am Ausgang der Videokamera 10 komprimiert und zum Rechner übertragen wird und die restlichen Einzelbilder (die Einzelbilder mit einer ungeraden Nummer in der Sequenz von Einzelbildern) ohne oder
mit geringer Kompression im Speicher 16 abgespeichert werden. Es wird daher ein Einzelbild aus dem Speicher 16 angefordert, das zumindest in der Nähe des ausgewählten Einzelbildes auf einem Einzelbildfenster 20b bis 20g in der Videobildersequenz liegt.
An dieser Stelle sei darauf hingewiesen, daß der Ausdruck "zumindest in der Nähe des ausgewählten Einzelbilds in der Sequenz" bezüglich dieser Anmeldung ausdrücken soll, daß vorzugsweise genau das entsprechende Einzelbild aus dem Speicher 16 angefordert wird, wenn es vorhanden ist, und daß, wenn das genau entsprechende Einzelbild im Speicher 16 nicht vorhanden ist, beispielsweise das der Sequenz benachbarte Einzelbild ausgewählt wird. Dies sei anhand einer Bildsequenz von sechs Einzelbildern erläutert. Bei dem in Fig. 2 gezeigten Ausführungsbeispiel werden die Einzelbilder Nr. 2, 4 und 6 komprimiert und zu dem Rechner 20 übertragen, während die Einzelbilder Nr. 1, 3 und 5 in der Speichereinrichtung 16 unkomprimiert oder nur leicht komprimiert abgespeichert werden. Hat ein Benutzer aus irgendeinem Grund das hochkomprimierte Einzelbild Nr. 3 auf dem Bildschirm des Rechners 20 ausgewählt, so steht das unkomprimierte Einzelbild Nr. 3 in der Speichereinrichtung nicht zur Verfügung. Die Schalteinrichtung 14 wird daher in Verbindung mit dem Rechner die Speichereinrichtung 16 derart ansprechen, daß sie das Einzelbild Nr. 2 und/oder das Einzelbild Nr. 4 zu dem Rechner 20 überträgt. An dieser Stelle sei jedoch angemerkt, daß auch das Einzelbild Nr. 6 ausreichend sein könnte, wenn beispielsweise eine hin- und her-schwenkbare Kamera nur sehr langsam geschwenkt wird, oder wenn die Bewegungsgeschwindigkeit von Personen und/oder Objekten im Zielbereich relativ gering ist. Allgemeiner ausgedrückt könnte es daher auch möglich sein, wenn sowohl die Kamera als auch der Zielbereich relativ statisch sind, daß ein Einzelbild auf dem Speicher 16 ausgewählt wird, das um vielleicht 100 Einzelbilder von dem auf dem Rechner 20 angezeigten, komprimierten und übertragenen Einzelbild in der Sequenz von Einzelbildern entfernt ist. Wichtig ist, daß sich das von dem Speicher
abgerufene Einzelbild mit hoher Auflösung nicht wesentlich von dem auf dem Rechner 20 angezeigten Einzelbild mit niedriger Auflösung unterscheidet. Vorzugsweise wird daher, wenn es möglich ist, das gleiche Einzelbild in der Sequenz aus dem Speicher abgerufen, oder, wenn dies nicht möglich ist, das dem ausgewählten Einzelbild benachbarte Einzelbild mit hoher Auflösung.
In Abweichung vom beschriebenen Ausführungsbeispiel kann das erfindungsgemäß System nicht nur zur Sicherheitsüberwachung sondern auch zur Überwachung von Maschinen und Anlagen eingesetzt werden.
Ferner ist es nicht unbedingt notwendig, daß ein Benutzer ein komprimiertes übertragenes Einzelbild manuell auswählt. Der Rechner 20 könnte Bilderkennungsalgorithmen umfassen, welche alle Einzelbilder detektieren, auf denen Personenumrisse oder bestimmte Gegenstände auftauchen. Wenn eine nicht schwenkende Kamera eingesetzt wird, und wenn ein insgesamt statischer Zielbereich, wie z. B. ein Tresorraum einer Bank, überwacht wird, so könnte ein Bilderkennungsalgorithmus derart ausgestaltet sein, daß er Einzelbilder detektiert, bei denen sich im Vergleich zu den entsprechenden vorherigen Einzelbildern etwas bewegt hat.
Es ist außerdem möglich, daß die gesamte Vorrichtung bzw. das gesamte Verfahren zum Überwachen eines Zielbereichs von einem entfernten Standort aus lediglich dann aktiviert wird, wenn ein Alarmereignis vorhanden ist. Dieses Alarmereignis könnte beispielsweise durch einen Bewegungsmelder in einem statischen Zielbereich ausgelöst werden. Dieses Alarmsignal könnte direkt im Zielbereich oder auch am entfernten Ort aufgrund der übertragenen Videobilder ausgelöst werden.
Abhängig von den individuellen Umständen des Zielbereichs und der Videokamerapositionierung und -Führung kann es auch ausreichend sein, nicht nur jedes zweite Einzelbild abzuspeichern, sondern beispielsweise nur jedes dritte, vierte,
usw. Einzelbild. Genauso ist es denkbar, nicht nur jedes zweite Einzelbild zu komprimieren und über den Datenkanal zu übertragen, sondern beispielsweise nur jedes dritte, vierte, usw. Ferner ist es nicht unbedingt erforderlich, alle in dem Kompressionsmodul 12 bzw. in der Kompressionseinrichtung 12a komprimierten Bilder zu dem Rechner 20 zu übertragen. Es könnte beispielsweise auch ausreichen, nur lediglich jedes zweite, dritte, vierte, usw. komprimierte Bild zum Rechner 20 zu übertragen, was jedoch im extremen Fall zu einer zu geringen zeitlichen Auflösung führen kann. Wenn jedoch der Übertragungskanal 18 eine wesentlich geringere Bandbreite wie beispielsweise ein ISDN-Netz haben wird, so wird diese Alternative dennoch den Einsatz des erfindungsgemäßen Systems an sich ermöglichen können.