DE602004005520T2

DE602004005520T2 - Anordnung und Verfahren zur Bilderkennung

Info

Publication number: DE602004005520T2
Application number: DE602004005520T
Authority: DE
Inventors: Hyeok-Beom Lee
Original assignee: Samsung Electronics Co Ltd
Current assignee: Samsung Electronics Co Ltd
Priority date: 2003-03-06
Filing date: 2004-03-04
Publication date: 2007-08-16
Anticipated expiration: 2024-03-05
Also published as: US20040183951A1; US7359529B2; EP1455297A1; EP1455297B1; DE602004005520D1

Description

Die vorliegende Erfindung bezieht sich auf ein Bilderfassungssystem, speziell, aber nicht ausschließlich, auf ein Bilderfassungssystem eines menschlichen Antlitzes und auf ein Verfahren, das in der Lage ist Gesichtsbilder zu entdecken, zu vergrößern und zu erfassen, die Bilder zur Aufzeichnung und Speicherung zu komprimieren und danach die Suche und das wieder Finden der komprimierten und aufgezeichneten Bilder zu ermöglichen.
Das unterbrechungsfreie TV System (CCTV) der nächsten Generation ist ein Überwachungssystem mit zumindest einer Überwachungskamera, die in einem Überwachungsbereich installiert ist, in dem Sicherheit gefordert wird, und einem Bildschirm für die Ausgabe der Bilder, die von der installierten Überwachungskamera in Realzeit gemacht wurden. Der Bildschirm wird für Monitore zur Verfügung gestellt, die an bestimmten Stellen installiert sind, um weniger Überwachungspersonal zu ermöglichen, um sowohl normale, als auch ungewöhnliche Situationen in den Überwachungsbereichen zu beobachten.
Darüber hinaus zeichnet das CCTV System ein Bildsignal in einem Aufzeichnungsmedium auf, wie ein Videosignal, das durch das Aufzeichnungssystem aufgenommen wurde, und reproduziert das aufgezeichnete Videosignal und gibt es auf Monitore aus. Ein digitales Videorekorder- (DVR) System ist ein Beispiel einer solchen CCTV Komponente.
Das DVR System erfasst ein analoges Videoeingangssignal aus einer aufnehmenden Kamera und komprimiert das analoge Videosignal und zeichnet es auf einem Festplattenlaufwerk (HDD) als ein digitales Hochauflösungsvideosignal auf. Daher kann das erfasste Videosignal aufgezeichnet werden, und für eine größere Periode ohne Bildverschlechterung behalten werden, so dass es in Fällen verwendet werden kann, die eine Beweissicherung oder Suche danach für die Zukunft erfordern.
Ein herkömmliches CCTV System dieses Typs verwendet zumindest eine fixierte Überwachungskamera, um Positionen aufzunehmen und/oder aufzuzeichnen, in denen ein Aufnehmen notwendig ist. Jedoch ist die fixierte Überwachungskamera unbeweglich, so dass sie Bilder nur für einen speziellen Bereich an der installierten Position erfasst, und oft Bilder innerhalb eines weiten Bereichs abdeckt und erfasst, anstelle eines speziellen, engeren Teils des Überwachungsbereichs. Entsprechend leidet ein Videosignal für den weiten Bereich an schlechter Bildqualität, wenn es mit einem Videosignal verglichen wird, das für einen speziellen Teil des Überwachungsbereichs aufgenommen wurde, dabei Schwierigkeiten bei der Sicherung eines klarer Identifikationsnachweises für zukünftige Verwendung verursachend.
Darüber hinaus hat das herkömmliche CCTV System ein niedrigeres Aufzeichnungsraumeffizienzniveau, da es alle Videosignale aufzeichnet, die von Subjekten und Umgebungen gemacht wurden. Nachdem eine solche große Menge von Information aufgezeichnet wurde, erfordert das herkömmliche CCTV System eine lange Suchzeit für das gewünschte Videosignal.
Hongo et al., "Gesichts- und Handbewegungserkennung für Mensch-Computerinteraktion" beschreibt ein Mehrkamerasystem in dem Gesichter und Hände erfasst werden können und verfolgt werden können, um Gesichts- und Handbewegungen zu erkennen.
Acosta et al., " Ein automatisches Gesichtserfassungs- und Erkennungssystem für Videoregistrieranwendungen" beschreibt ein Gesichtserfassungs- und Erkennungssystem, das Hautpixelerfassung mit anschließender Gesichtserkennung unter Verwendung der Hauptkomponentenanalyse anwendet.
Krüger et al., "Gabor Elementarwellennetzwerke für effiziente Kopfstellungsabschätzung" beschreibt die Verwendung des Gabor Elementarwellennetzwerks als einen Modell basierenden Ansatz zur Objektpräsentation.
Garcia et al., "Gesichtserkennung in Farbbildern unter Verwendung der Elementarwellenanalyse" beschreibt die Erfassung des menschlichen Antlitzes unter Verwendung der Hautfarbbereichserfassung und der Elementarwellenanalyse.
Entsprechend existiert ein Bedarf für ein Überwachungssystem und -Verfahren, das in der Lage ist, Gesichtsbilder aus einer aufgenommenen Position zu erfassen und aufzuzeichnen, die Umgebung ausschließend, so dass die Bilder nützlicher sind und die Analyse, Speicherung und das Finden der Bilder auf eine effizientere Weise erreicht wird.
Daher ist es eine Aufgabe der vorliegenden Erfindung ein Überwachungssystem und -Verfahren zur Erfassung und Aufzeichnung spezieller Bilder zur Verfügung zu stellen, wie Gesichtsbilder, aus einer aufgenommenen Position und die Ausschließung der Bildumgebungen, so dass die Bilder für verschiedene Zwecke, wie zur Identifikation, nützlicher sind.
Eine weitere Aufgabe der vorliegenden Erfindung ist es, ein Überwachungssystem und -Verfahren zur Analyse, Speicherung und Findung der Bilder auf effiziente Weise zur Verfügung zu stellen.
Entsprechend der Erfindung wird ein Bilderfassungssystem gemäß dem Anspruch 1 zur Verfügung gestellt.
Entsprechend der Erfindung wird weiterhin ein Verfahren zur Bilderfassung gemäß dem Anspruch 17 zur Verfügung gestellt.
Die Ausführungen liefern ein Überwachungssystem und -Verfahren, das Gesichtsbilder in einer überwachten Position als ein Videosignal erkennen und erfassen kann, und als Reaktion, das analoge Videosignal in ein digitales Videosignal zur Vergrößerung, Analyse und Speicherung des Gesichtsbildes zu konvertieren. Das Überwachungssystem enthält eine Kandidatenbereichs-Erfassungseinheit zum Vergleichen eines Farbdifferenzsignalniveaus des konvertierten digitalen Videosignals mit einem vorbestimmten Referenzfarbendifferenz-Signalniveaubereichs, der für eine Hautfarbenentscheidung vorbestimmt ist, und als Reaktion, zumindest einen Farbkandidatenbereich erkennend.
Das ausgeführte Überwachungssystem enthält weiterhin eine Kontrolleinheit zur Ausgabe eines Zoomkontrollsignals an die Bilderfassungseinheit, um vergrößerte Bilder jedes erkannten Hautfarben-Kandidatenbereichs zu erfassen. Eine Konvertierungseinheit zum Konvertieren jedes Hautfarben-Kandidatenbereichs, der im vergrößerten Bild erfasst wurde, in ein vergrößertes digitales Bildvideosignal zur Verwendung mit einer Gesichtserkennungseinheit, um ein Gesichtsvideosignal aus dem konvertierten, vergrößerten digitalen Bildvideosignal zu ermitteln. Dann wird eine Kompression/Aufzeichnungseinheit zum Komprimieren und Aufzeichnen des ermittelten Gesichtsbildvideosignals zur Verfügung gestellt.
Das ausgeführte System sucht nach Kandidatenbereichen und sobald gefunden, dirigiert es die Erfassung der vergrößerten Bilder. Wenn ein Gesichtsbild in diesen vergrößerten Bildern ermittelt wird, wird das vergrößerte Gesichtsbild zur weiteren Verwendung aufgezeichnet. Entsprechend ermöglichen das System und das Verfahren es einem Benutzer, eine Suche nach dem Gesicht eines Subjekts leicht durchzuführen, wenn er die aufgezeichneten Videodaten durchsucht.
1 ist ein Blockdiagramm, das ein Beispiel eines Gesichtsbild-Überwachungssystems gemäß einer Ausführung der vorliegenden Erfindung zeigt;
2 ist ein Blockdiagramm, das ein Beispiel einer Kandidatenbereichs-Erfassungseinheit der 1 im Detail zeigt;
3 ist ein Blockdiagramm, das ein Beispiel einer Gesichtserfassungseinheit im Detail zeigt; und
4 ist ein Flussdiagramm, das ein Beispiel eines Gesichtsbild-Erfassungsverfahren für ein Aufzeichnungssystem, wie in 1 gezeigt, darstellt.
Im Folgenden wird die vorliegende Erfindung im Detail mit Bezug auf die beiliegenden Abbildungen beschrieben werden.
1 ist ein Blockdiagramm, das ein Beispiel eines Gesichtsbild-Aufzeichnungssystems entsprechend einer Ausführung der vorliegenden Erfindung zeigt, 2 ist ein Blockdiagramm, das ein Beispiel einer Kandidatenbereichs-Ermittlungseinheit der 1 im Detail zeigt und 3 ist ein Blockdiagramm, das ein Beispiel einer Gesichtsermittlungseinheit der 1 im Detail zeigt.
Mit Bezug auf die 1 hat ein Beispiel eines Gesichtsbild-Aufzeichnungssystems 100 gemäß einer Ausführung der vorliegenden Erfindung eine Bilderfassungseinheit 105, auch als eine ein Bild aufnehmende Einheit bezeichnet, eine Schwenk/Kipp/Zoom-Antriebseinheit (im Folgenden auch als "P/T/Z-Antriebseinheit" bezeichnet), ein analog zu digital Konvertierungseinheit (im Folgenden als "ADC" bezeichnet) 115, eine Schalteinheit 120, eine Kandidatenbereichs-Ermittlungseinheit 125, eine Kandidatenbereichs-Entscheidungseinheit 130, eine Kontrolleinheit 135, eine Kandidatenbereichs-Speicherungseinheit 140, eine Gesichtsermittlungseinheit 145, eine Kompressionseinheit 150, eine Datenbank- (im Folgenden als "DB" bezeichnet) Generierungseinheit 155, eine Aufzeichnungseinheit 160, eine Dekompressionseinheit 165, eine digital zu analog Konvertierungseinheit (im Folgenden als "DAC" bezeichnet) 170 und eine Schlüsselmanipulationseinheit 175. Ein Bus 180 wird zur Kopplung der Kontrolleinheit 135, der Kompressionseinheit 150, der Datenbankgenerierungseinheit 155, der Aufzeichnungseinheit 160 und der Dekompressionseinheit 165 zur Verfügung gestellt.
Die Bilderfassungseinheit 105 ist eine Kameravorrichtung, wie eine Ladungskopplungsspeicher- (CCD) Kamera, angetrieben von einer P/T/Z-Antriebseinheit 110, um Bilder der vordefinierten Aufzeichnungsbereiche zu erfassen. Die CCD Kamera kann in eine horizontalen Richtung schwenken, in eine vertikale Richtung kippen, herein und heraus zoomen, und ein analoges Videosignal ausgeben, das von der CCD Kamera aufgenommen wurde. Eine Vielzahl von Bilderfassungseinheiten 105 kann installiert werden, von denen jede eine Identifikationsnummer besitzt.
In der Ausführung der vorliegenden, in 1 gezeigten, Erfindung wird eine Bilderfassungseinheit 105 dazu verwendet, um Bilder von zumindest einem Aufzeichnungsbereich zu erfassen. Jedoch kann, im Falle von zwei oder mehr Aufzeichnungsbereichen, die eine Bilderfassungseinheit 105 die Bilderfassungsoperationen zuerst in einem vordefinierten Aufzeichnungsbereich für eine erste vordefinierte Zeitperiode wiederholen, und sich dann zu einem zweiten Aufzeichnungsbereich hinbewegen, um Bilder für eine zweite vorbestimmte Zeitperiode zu erfassen, und so weiter für jede Anzahl von Aufzeichnungsbereichen. Zum Beispiel, in dem das Aufzeichnungssystem 100 in einer Bank installiert ist und Bilder der drei Bankfenster mit einer Bilderfassungseinheit 105 erfasst, erfasst die Bilderfassungseinheit 105 Bilder eines Bankfensters bei einem fixierten Zustand für eine vorbestimmte Zeitperiode, bewegt sich in eine Position, in der sie Bilder des nächsten Bankfensters für eine zweite vorbestimmte Zeitperiode erfassen kann, und bewegt sich dann in eine Position, in der sie Bilder des nächsten Schalterbereichs für eine dritte vorbestimmte Zeitperiode erfassen kann. In diesem Beispiel wird bevorzugt, dass die erste, zweite und dritte Zeitperiode zur Erfassung der Bilder jedes Schalterbereichs dieselben sind. Sie kann jedoch wie von der Anwendung gefordert konfiguriert werden.
Zurückkehrend zur 1, treibt die P/T/Z-Antriebseinheit 110 die Bilderfassungseinheit 105 auf der Basis eines Antriebskontrollsignals an, z.B., eines Zoomkontrollsignals, eines Schwenk/Kipppositionskontrollsignals und so weiter, einer Ausgabe aus der Kontrolleinheit 135, die in größerem Detail weiter unten beschrieben wird.
Um die zu tun, enthält die P/T/Z-Antriebseinheit 110 eine Zoomantriebseinheit (nicht gezeigt) um die Zoomlinsen (nicht gezeigt) anzutreiben, vergrößerte Bilder eines Kandidatenbereichs basierend auf dem Zoomkontrollsignal zu erfassen. Die P7T7Z-Antriebseinheit 110 enthält weiterhin eine Schwenk/Kippantriebseinheit (nicht gezeigt) zum Antrieb der Bilderfassungseinheit 105, um sich zu Positionen zu bewegen, in denen sie Bilder der Kandidatenbereiche basierend auf einem Positionskontrollsignal erfassen kann.
Das ADC 115 konvertiert das analoge Videosignal, das von der Bilderfassungseinheit 105 geliefert wird, in ein digitales Videosignal.
Die Schaltereinheit 120 liefert selektiv die digitale Videosignalausgabe aus dem ADC 115 entweder an die Kandidatenbereichsermittlungseinheit 125 oder an die Gesichtsermittlungseinheit 145, und wird bevorzugt mit einem Multiplexer implementiert. Die Schaltereinheit 120 ist konfiguriert, um anfänglich die digitale Videosignalausgabe aus dem ADC 115 an die Kandidatenbereichsermittlungseinheit 125 zu liefern. Eine weitere Operation des System 100 resultiert in einem digitalen Videosignal eines vergrößerten Bildbereichs, das an die Gesichtsermittlungseinheit 145 geliefert wird, wie weiter unten in größerem Detail beschrieben wird.
Die Kandidatenbereichsermittlungseinheit 125 verwendet ein Farbdifferenzsignal, das von der digitalen Videosignalausgabe aus der Schalteinheit 120 geliefert wird, um zumindest einen Hautfarben-Kandidatenbereich zu ermitteln, der aus einem Farbdifferenzsignal besteht, das einem Farbdifferenzsignal für eine menschlichen Hautfarbe ähnlich ist.
Um dies auszuführen, besitzt die Kandidatenbereichs-Ermittlungseinheit 125 eine Farbdifferenzsignal-Berechnungseinheit 125a, einen Filter 125b und eine Hautfarbenkandidatenbereichs-Ermittlungseinheit 125c, wie in 2 gezeigt.
Die Farbdifferenzsignal-Berechnungseinheit 125a digitalisiert das Farbdifferenzsignalniveau einer digitalen Videosignaleingabe aus der Schaltereinheit 120 unter Verwendung der folgenden Gleichung (1) f(Cb, Cr) = 〈0, if(CbL ≺ Cb ≺ CbH |(CrL ≺ Cr ≺ CrH )〉 (1)255, otherwise
Mit Bezug auf die Gleichung (1), ist 'Cb_L < Cb < Cb_H' und 'Cr_L < Cr < Cr_H' ein vorher bestimmter Referenzfarbdifferenz-Signalniveaubereich, der mit einer besonderen Hautfarbe assoziiert ist. In Gleichung (1) bezeichnen Cb und Cr Farbdifferenzsignalniveaus von digitalen Signalen, die Eingabe aus der Schalteinheit 120 sind, Cb_L und Cr_H sind Minimalwerte des Referenzfarbdifferenz-Signalniveaus und Cb_H und Cr_H sind Maximalwerte des Referenzfarbdifferenz-Signalniveaus.
Die Farbdifferenzsignal-Berechnungseinheit 125a vergleicht das Farbdifferenzsignalniveau der digitalen Videosignaleingabe Einzelbild um Einzelbild, (d.h., Cb und Cr) mit dem für die besondere Hautfarbenentscheidung vorher bestimmten Referenzfarbdifferenz-Signalniveaubereich (d.h., Cb_L, Cr_L, Cb_H und Cr_H), und digitalisiert das auf den Resultaten basierende Videosignal.
Speziell digitalisiert die Farbdifferenzsignal-Berechnungseinheit 125a das digitale Videosignal aus der Schalteinheit 120 in ein Farbdifferenzsignalniveau von '0', wenn sich das Farbdifferenzsignalniveau des digitalen Videosignal innerhalb des vorher bestimmten Referenzfarbdifferenz-Signalniveaubereichs wie in Gleichung (1) befindet, und digitalisiert das digitale Videosignal in ein Farbdifferenzsignalniveau von '255', wenn das Farbdifferenzsignalniveau des digitalen Videosignals aus dem vorher bestimmten Referenzfarbdifferenz-Niveaubereich ausgeschlossen wurde.
Der Filter 125b filtert dann das digitalisierte digitale Videosignal, um Störungen zu entfernen, die im digitalisierten digitalen Videosignal enthalten sind.
Die Hautfarben-Kandidatenbereichs-Ermittlungseinheit 125c führt dann vertikale und horizontale Projektionen für das gefilterte digitale Videosignal durch, um zumindest einen Hautfarbenkandidatenbereich zu ermitteln.
Zum Beispiel wird die vertikale Projektion dazu verwendet, die Anzahl der Pixel zu zählen, d.h., die Anzahl der aufeinander folgenden ausgegeben Pixel, ausgedrückt im Farbdifferenzsignalniveau '0' in der vertikalen Richtung des gefilterten digitalen Videosignals, und um zu entscheiden, ob die Anzahl der gezählten Pixel größer ist, als ein vorher bestimmter erster Grenzwert für einen Hautfarbenbereich. In ähnlicher Weise wird die horizontale Projektion dazu verwendet, die Anzahl der Pixel zu zählen, d.h., die Anzahl der aufeinander folgenden ausgegebenen Pixel, ausgedrückt im Farbdifferenzsignalniveau '0' in die horizontale Richtung des gefilterten Videosignals, und um zu entscheiden, ob die Anzahl der gezählten Pixel größer ist, als ein vorher bestimmter zweiter Grenzwert für einen Hautfarbenkandidatenbereich.
Durch diese Handlungsweise kann zumindest ein Hautfarbenkandidatenbereich mit einer unterschiedlichen Größe aus dem digitalisierten digitalen Videosignal einer Bildeinheit ermittelt werden.
Zurückkehrend zur 1, normalisiert die Kandidatenbereichs-Entscheidungseinheit 130 die unterschiedlichen Größen der Hautfarbenbereiche, die von der Hautfarben-Kandidatenbereichs-Ermittlungseinheit 125c ermittelt wurden, auf eine vorher bestimmte Größe. Z.B., kann die Kandidatenbereichs-Entscheidungseinheit 130 alle ermittelte Hautfarben-Kandidatenbereiche auf eine (20 × 20) Pixelauflösung normalisieren.
Sobald die Größe jedes Hautfarben-Kandidatenbereichs normalisiert ist, kann die Kandidatenbereichs-Entscheidungseinheit 130 entscheiden, ob jeder normalisierte Hautfarben-Kandidatenbereich ein Bild eines menschlichen oder nicht menschlichen (d.h., Umgebung) Bildes ist. Diese Entscheidung kann z.B, unter Verwendung des Mahalanobis Entfernungs- (MD) Verfahren durchgeführt werden. Eine detaillierte Beschreibung des MD Verfahrens ist nicht enthalten, da sie den Fachleuten wohl bekannt ist.
Die Kandidatenbereichs-Speicherungseinheit 140 speichert dann sowohl Positionskoordinatenwerte des Hautfarben-Kandidatenbereichs, der als ein menschliches Abbild ermittelt wurde, als auch das digitale Videosignal für den Hautfarben-Kandidatenbereich, der von der Kandidatenbereichs-Entscheidungseinheit 130 auf die vorher bestimmte Größe normalisiert wurde.
Die Kontrolleinheit 135 kontrolliert die Gesamtoperation des Aufzeichnungssystems 100 entsprechend den Kontrollprogrammen, die in der Programmspeichereinheit (nicht gezeigt) gespeichert sind und mit der Kontrolleinheit verbunden sind.
Die Kontrolleinheit 135 verarbeitet die Positionskoordinatenwerte des Hautfarben-Kandidatenbereichs und das Videosignal für den auf die vorbestimmte Größe normalisierten Hautfarben-Kandidatenbereich, das von der Kandidatenbereichs-Entscheidungseinheit 130 geliefert wird, das in der Kandidatenbereichs-Speicherungseinheit 140 gespeichert ist.
Auf der Basis dieser Prozesse, speziell der Ermittlung des menschlichen Bildes, gibt die Kontrolleinheit 135 an die P/T/Z Antriebseinheit 110 ein Zoomkontrollsignal zur Erfassung vergrößerter Bilder von nur des Hautfarben-Kandidatenbereichs aus, der von der Kandidatenbereichs-Entscheidungseinheit 130 als menschliches Bild ermittelt wurde, und gibt ein den Positionskoordinatenwerten entsprechendes Positionskontrollsignal aus, durch Lesen der Positionskoordinatenwerte des Hautfarben-Kandidatenbereichs aus der Kandidatenbereichs-Speichereinheit 140.
Daher sucht die Bilderfassungseinheit 105 angepasst den Hautfarben-Kandidatenbereich ab und erfasst ein vergrößertes Bild des Bereichs. In größerem Detail beschrieben, bewegt die P/T/Z Antriebseinheit 110 die Bilderfassungseinheit 105 in eine Position, in der sie Bilder des Kandidatenbereichs, basierend auf dem Positionskontrollsignal, das eine Ausgabe aus der Kontrolleinheit 135 ist, erfassen kann und bewegt die Zoomlinsen der Bilderfassungseinheit 105, um mit einem vorher bestimmten Vergrößerungsfaktor einzuzoomen, um ein vergrößertes Bild des Hautfarben-Kandidatenbereichs auf der Basis des Zoomkontrollsignals zu erfassen.
Die Kontrolleinheit 135 benötigt jedoch eine bestimmte Zeitperiode, um das Zoomkontrollsignal auszugeben, das dem bestimmten Hautfarben-Kandidatenbereich entspricht. Entsprechend gibt die Kontrolleinheit 135, wenn ein spezieller Hautfarben-Kandidatenbereich von der Kandidatenbereichs-Entscheidungseinheit 130 ermittelt wird, ein Zoomkontrollsignal zum Aufbau von Anfangsvergrößerungen (d.h., eine Anfangszoomkontrollsignal) aus, das in einer Reduzierung der Antwortzeit resultiert, die zur Zoomoperation der Bilderfassungseinheit 105 erforderlich ist, wenn das dem speziellen Hautfarben-Kandidatenbereich entsprechende Zoomkontrollsignal zur Verfügung gestellt wird.
Das Anfangszoomkontrollsignal zum Aufbau von Anfangsvergrößerungen ist ein spezielles Signal, das aufgebaut wird, um schnell vergrößerte Bilder zu erfassen, dabei gewöhnlich einen Bereich ansteuernd, von dem angenommen wird, dass er eine bestimmte Größe enthält, oder der sehr nahe daran ist, den bestimmten Hautfarben-Kandidatenbereich zu enthalten, und der auch im Programmspeichereinheit gespeichert sein kann. Entsprechend kann jeder Hautfarben-Kandidatenbereich, der durch ein Anfangszoomkontrollsignal in einem vergrößerten Bild erfasst wurde, von einem Benutzer erkannt werden. D.h., durch die Erstellung eines Anfangszoomkontrollsignals abhängig von der Lage und den Aufzeichnungsbereichen, in denen die Bilderfassungseinheit 105 installiert ist, kann der in den Aufzeichnungsbereichen ermittelte Hautfarben-Kandidatenbereich schneller in einem vergrößerten Bild mit einer erkennbaren Größe erfasst werden.
Weiterhin kann in Beispielen, in denen eine Bilderfassungseinheit 105 sequentiell Bilder von zumindest zwei Aufzeichnungsbereichen erfasst, ein unterschiedliches oder ein identisches Anfangszoom-Kontrollsignal für vergrößerte Bilder jedes Aufzeichnungsbereichs aufgebaut werden.
Sobald ein Zoomkontrollsignal geliefert und ein vergrößertes Bild erfasst wird, wird ein analoges Videosignal für einen speziellen Hautfarben-Kandidatenbereich, der in einem vergrößerten Bild von der Bilderfassungseinheit 105 erfasst wurde, von ADC 115 in ein digitales Videoausgabesignal konvertiert.
Die Schalteinheit 120 liefert dann selektiv das digitale Videosignal, Ausgabe des vergrößerten Bildes aus der ADC 115, auf der Basis der Kontrollsignale der Kontrolleinheit 135 an die Gesichtsermittlungseinheit 145.
Die Gesichtsermittlungseinheit 145 wird dann dazu verwendet, um ein Gesichtsvideosignal aus der digitalen Videosignalausgabe des vergrößerten Bildes zu ermitteln.
Speziell hat die Gesichtsermittlungseinheit 145 eine erste Gesichtskandidatenbereichs-Ermittlungseinheit 145a, eine zweite Gesichtskandidatenbereichs-Ermittlungseinheit 145b und eine letzte Gesichtsermittlungseinheit 145c, wie in 3 gezeigt.
Die erste Gesichtskandidatenbereichs-Ermittlungseinheit 145a wendet ein spezielles Muster auf das digitale Videosignal, konvertiert von der ADC 115, des vergrößerten Bildes an und ermittelt einen Gesichtskandidatenbereich, in dem wahrscheinlich ein Gesicht existiert. In einem Beispiel, in dem ein M-Gitter Gabor Wavelet als das spezielle Muster angewendet wird, passt sich ein "M-artiges Formgitter" an ein normalisiertes Gesichtsbild an, und extrahiert dann (20 × 40) Antworten als Eigenschaftsvektoren. Diese (20 × 40) Antworten werden aus einer Fläche von 40 (5 Frequenzen × 8 Richtungen) Gabor Filtern an 20 Eigenschaftspunkten auf dem Gitter erhalten. Die Ermittlungseinheit 145a führt dann eine Lernprozedur durch, zur Berechnung einer Maximumsdistanz mit Bezug auf einen Durchschnitt von 5 Frequenzgruppen in einem Eigenschaftsvektorraum.
Wenn ein digitales Videosignal eines vergrößerten Bildes eines Einheitsrahmens die Eingabe ist, passt die erste Gesichtskandidatenbereichs-Ermittlungseinheit 145a das "M" -artige Formgitter an alle mögliche Positionen an, extrahiert Eigenschaftsvektoren und führt eine Ermittlungsprozedur für die Berechnung einer Distanz mit Bezug auf einen Durchschnittsvektor der 5 erfahrenen Frequenzgruppen durch. Wenn die Minimaldistanz, resultierend aus den in der Ermittlungsprozedur mit Bezug auf den Durchschnittsvektor berechneten Distanzen, kleiner ist, als die Maximaldistanz, erhalten in der lernenden Prozedur, entscheidet die erste Gesichtskandidatenbereichs-Ermittlungseinheit 145a, das der Bereich, der die Eigenschaftsvektoren mit der Minimaldistanz enthält, ein Gesichtkandidatenbereich ist.
Die zweite Gesichtskandidatenbereichs-Ermittlungseinheit 145b führt eine Hauptkomponentenanalyse (PCA) über eine Vielzahl von normalisierten Bildern durch, z.B., mit einer (20 × 20) Auflösung in der lernenden Prozedur und der Verwendung von 20 Eigen-Vektoren, um Eigenschaftsvektoren mit aufsteigender Ordnung der Eigen-Werte zu extrahieren. Weiterhin verwendet die zweite Kandidatenbereichs-Ermittlungseinheit 145b die 20 obigen Eigen-Vektoren, um die Eigenschaftsvektoren aus willkürlich gesammelten, normalisierten nicht Gesichtsbildern zu extrahieren, z.B. wie oben, mit einer (20 × 20) Auflösung. Sobald eine Vielzahl von Gesichtseigenschaftsvektoren und nicht Gesichtseigenschaftsvektoren extrahiert werden, wendet die zweite Gesichtskandidatenbereichs-Ermittlungseinheit 145b die extrahierten Vektoren auf das SVM an, um Entscheidungsgrenzen zu gewinnen, mit denen zwei Klassen, d.h. Gesichts- und nicht Gesichtsbilder, unterschieden werden können.
Die zweite Gesichtskandidatenbereichs-Ermittlungseinheit 145b führt auch einen Ermittlungsschritt zur Ermittlung eines speziellen Kandidatenbereichs eine Gesichts durch Prüfen durch, ob das Gesicht in den entsprechenden Beobachtungsfenstern enthalten ist, die von den Entscheidungsgrenzen verwendet werden, die mit Bezug auf alle möglichen Beobachtungsfenster des Gesichtkandidatenbereichs erlangt wurden, der von der ersten Gesichtskandidatenbereichs-Ermittlungseinheit 145a ermittelt wurde. Die letzte Gesichtermittlungseinheit 145c verwendet dann ein hoch auflösendes SVM über dem ermittelten, speziellen Kandidatenbereich, um schließlich das Gesicht zu ermitteln. Besonders die letzte Gesichtsermittlungseinheit 145c ermittelt ein Gesicht unter Verwendung eines Verfahrens, das der Entscheidungsgrenzenakquisition ähnlich ist, und einer speziellen Kandidatenbereichsermittlung der Eigenschaftskandidatenbereichs-Ermittlungseinheit 125, wie oben beschrieben.
Jedoch verwendet die letzte Gesichtsermittlungseinheit 145c ein Bild mit einer (40 × 40) Pixelauflösung in der lernenden Prozedur und verwendet 50 Eigen-Vektoren, um Eigenschaften zu extrahieren. Weiterhin verwendet dann die letzte Gesichtsermittlungseinheit 145c das hoch auflösende SVM über dem speziellen Kandidatenbereich, einen speziellen Teil des Gesichts einschließend, der von der zweiten Gesichtskandidatenbereichs-Ermittlungseinheit 125 ermittelt wurde, um schließlich das Gesicht zu ermitteln.
Eine Speicher- und Retrievaleinheit 100a enthält die Kompressionseinheit 150, die Datenbankgenerierungseinheit 155, die Aufzeichnungseinheit 160, die Dekompressionseinheit 165, das DAC 170 und den Monitor.
Die Kompressionseinheit 150, basierend auf der Kontrolle der Kontrolleinheit 135 und verbunden über einen Bus 180, komprimiert dann das digitale Videosignal jeder Rahmeneinheitsausgabe aus der Kandidatenbereichs-Ermittlungseinheit 125 und ein Gesichtsvideosignal, das von der letzten Gesichtsermittlungseinheit 145c ermittelt wurde, in ein vorher bestimmtes Kompressionsformat, wie z.B. MPEG-2.
Die DB Generierungseinheit 155, die auch auf der Kontrolle der über den Bus 180 verbundenen Kontrolleinheit 135 basiert, generiert dann eine DB für die Bilder von zumindest einem der digitalen Videosignale, die von der Kompressionseinheit 150 geliefert werden, eine Identifikationsziffer der Bilderfassungseinheit 105, die die digitalen Videosignale produziert, und eine Bilderfassungszeit für die Videosignale.
Weiterhin generiert die DB Generierungseinheit 155 eine DB für Gesichtsvideosignale für die komprimierten Gesichtsvideosignale, die von der Kompressionseinheit 150 geliefert werden, und zumindest eine der Identifikationsziffern und eine Erfassungszeit eines vergrößerten Bildes der Bilderfassungseinheit 105, die die komprimierten Gesichtsbildvideosignale erzeugt.
Die für die Bilder erzeugte DB und die DB für die Gesichtsvideosignale werden beide in der Aufzeichnungseinheit 160 unter der Kontrolle der Kontrolleinheit 135 aufgezeichnet. Für die Aufzeichnungseinheit 160, verwendet die Ausführung der vorliegenden Erfindung, die in 1 gezeigt wird, ein Aufzeichnungsmedium, wie z.B. ein Festplattengerät (HDD), das die Massenspeicherung von Datenblöcken erlaubt.
Die Dekompressionseinheit 165, basierend auf der Kontrolle der Kontrolleinheit 135 und verbunden über den Bus 180, kann das komprimierte digitale Videosignal, das in der Aufzeichnungseinheit 160 aufgezeichnet ist, in ein vorher vorbestimmtes Format zur Lieferung einer Ausgabe dekomprimieren, wenn es gefordert wird.
Die DAC 170 konvertiert das digitale Videosignal, das von der Dekompressionseinheit 165 dekomprimiert wurde, in ein analoges Videosignal. Das konvertierte analoge Videosignal wird dann auf einem Monitor ausgegeben (nicht gezeigt).
Zur Verwendung der oben beschriebenen Einheiten wird eine Schlüsselmanipulationseinheit 175 zur Verfügung gestellt, die eine Vielzahl von Manipulationsschlüsseln (nicht gezeigt) zur Lieferung einer Signalausgabe an die Kontrolleinheit, um eine vom Aufzeichnungssystem 100 unterstützte Funktion aufzubauen oder zu manipulieren. Die Schlüsselmanipulationseinheit 175 ist mit dem Aufzeichnungssystem 100 über eine Kommunikationsinterfaceeinheit (nicht gezeigt) verbunden, die im Hauptteil des Aufzeichnungssystems 100 zur Verfügung gestellt werden könnte.
In der Ausführung der in 1 gezeigten, vorliegenden Erfindung hat die Beispielschlüssel-Manipulationseinheit 175 ein Gesichtsaufzeichnungsschlüssel 175a, zur Ermittlung und Aufzeichnung von ausschließlich menschlichen Gesichtsbildern aus einem Aufzeichnungsbereich, der durch die Bilderfassungseinheit 105 abgedeckt wird, und einen Gesichtsucheschlüssel 175b zur Suche von ausschließlich Gesichtsvideosignalen aus diversen, in der Aufzeichnungseinheit 160 aufgezeichneten Videosignalen.
Wenn z.B. der Gesichtsaufzeichnungsschlüssel 175a ausgewählt wird, verarbeitet die Kontrolleinheit 135 die Erfassung von vergrößerten Bildern von menschlichen Gesichtsbildern aus dem Aufzeichnungsbereich und das Aufzeichnen der vergrößerten menschlichen Gesichtbilder in der Aufzeichnungseinheit 160, wie oben beschrieben.
Wenn der Gesichtssucheschlüssel 175b ausgewählt wird, sucht die Kontrolleinheit 135 nach Gesichtsvideosignalen ausschließlich aus der Aufzeichnungseinheit 160 und liefert die gesuchten Gesichtsvideosignale als Ausgaben an die Dekompressionseinheit 165. Suchbedingungen wie Identifikationsziffern, Bilderfassungszeiten, usw. können zur schnellen und reibungslosen Suche verwendet werden.
Besonders, wenn ein bestimmtes Videosignal durch eine Schlüsselmanipulation der Schlüsselmanipulationseinheit 175 ausgewählt wird, nachdem der Gesichtssucheschlüssel 175b ausgewählt wird und eine Vielzahl von Gesichtsvideosignalen auf einem Monitor reproduziert werden, kann die Kontrolleinheit 135 die Aufzeichnungseinheit 160 und die Dekompressionseinheit 165 steuern, alle die digitalen Videosignale zu reproduzieren, die zu einer speziellen Zeit aufgenommen wurden, wie zur selben Zeit wie der Zeit, zu der das ausgewählte Gesichtsvideosignal aufgenommen wurde, oder alle die digitalen Videosignale, die von derselben Bilderfassungseinheit 105 aufgenommen wurden, die auch das ausgewählte Gesichtsvideosignal erfasst hat.
Wenn ein bestimmtes Gesichtsvideosignal von der Schlüsselmanipulationseinheit 175 ausgewählt ist und die Schlüsselmanipulationseinheit 175 ein Kommandosignal zur Reproduktion der gesamten digitalen Videosignale ausgibt, die zur selben Zeit aufgenommen wurden, zu der das ausgewählte Gesichtsvideosignal aufgenommen wurde (d.h., unvergrößerte Weitwinkelbilder, die zu der Zeit aufgenommen wurden, während der das ausgewählte Gesichtsvideosignal, wie oben beschrieben, ermittelt wurde), kann die Kontrolleinheit 135 aus der Aufzeichnungseinheit 160 Information über die Zeit auslesen, zu der das ausgewählte Gesichtsvideosignal aufgenommen wurde (d.h., eine Auslesezeit). Weiterhin kann die Kontrolleinheit 135 die Aufzeichnungseinheit 160 steuern, die gesamten digitalen Videosignale auszugeben, die während derselben Zeit wie der Auslesezeit aufgenommen wurden. Die Kontrolleinheit 135 kann dann die Kompressionseinheit 165 steuern, die gesamten digitalen Videosignale aus der Aufzeichnungseinheit 160 zu dekomprimieren. Daher kann ein Monitor die gesamten digitalen Videosignale anzeigen, die während der Zeit aufgenommen wurden, als das ausgewählte Gesichtsvideosignal aufgenommen wurde, so dass der Benutzer bequem nach verwandten Umgebungssituationen in den unvergrößerten Weitwinkelbildern suchen kann.
Eine Backupeinheit (nicht gezeigt) kann auch im Aufzeichnungssystem 100 gemäß einer Ausführung der vorliegenden Erfindung zur Verfügung gestellt werden, die ermöglicht, die in der Aufzeichnungseinheit 160 aufgezeichneten digitale Videosignale als Backupdaten zu speichern. Ein Aufzeichnungsmedium wie ein digitales Audioband, eine Kompaktdisk, usw., könnte als Backupeinheit verwendet werden.
4 ist ein Flussdiagramm, das ein Beispiel eines Gesichtsbild-Ermittlungsverfahren für das Aufzeichnungssystem der 1 darstellt.
Mit Bezug auf die Abbildungen 1 incl. 4, konvertiert das ADC 115 in einem ersten Schritt nach dem Starten ein Videosignal, das mit einem vorher festgelegten Vergrößerungsfaktor von der Bilderfassungseinheit 105 aufgenommen wurde, in ein digitales Videosignal (Schritt S400).
Wenn das digitale Videosignal der Kandidatenbereichs-Ermittlungseinheit 125 von der Schalteinheit 120 zur Verfügung gestellt wird, vergleicht die Kandidatenbereichs-Ermittlungseinheit 125 ein Farbendifferenzsignalniveau des konvertierten digitalen Videosignals mit einem vorher festgelegten Referenzfarben-Differenzsignal-Niveaubereich, der mit einer speziellen Hautfarbe assoziiert ist, und entscheidet, ob zumindest ein Hautfarbenkandidatenbereich existiert, und ermittelt, wenn solch ein Hautfarbenkandidatenbereich existiert, zumindest einen Hautfarbenkandidatenbereich (Schritt S410).
Wenn im Schritt S410 Hautfarbenkandidatenbereiche ermittelt werden, normalisiert die Kandidatenbereichs-Entscheidungseinheit 130 jeden ermittelten Hautfarbenkandidatenbereich auf eine vorher festgelegte Pixelauflösung (Schritt S420) und entscheidet, ob jeder normalisierte Hautfarbenkandidatenbereich ein menschliches oder nicht menschliches (d.h., Umgebung) Bild ist (Schritt S430). Die Kandidatenbereichsspeicherungseinheit 140 speichert dann die Positionskoordinatenwerte und Videosignale für die normalisierten Haufarbenkandidatenbereiche.
Wenn im Schritt S430 entschieden wird, dass ein spezieller Hautfarbenkandidatenbereich ein menschliches Bild ist, bewegt sich die Bilderfassungseinheit 105 in eine Position, in der sie Bilder des Hautfarbenkandidatenbereichs erfassen kann, basierend auf den Kontrollmeldungen der P/T/Z Antriebseinheit 110 und erfasst vergrößerte Bilder des Hautfarbenkandidatenbereichs, und die ADC 115 konvertiert dann die Videosignale für die vergrößerten Bilder in ein digitales Videosignal des vergrößerten Bildes (Schritt S440).
Die Schalteinheit 120 liefert dann das Videosignal des vergrößerten Bildes, auch als digitales Vergrößerungsvideosignal bezeichnet, an die Gesichtermittlungseinheit 145.
Die Gesichtsermittlungseinheit 145 entscheidet, ob ein Gesichtsvideosignal basierend auf dem konvertierten digitalen Videosignal des vergrößerten Bildes existiert, und ermittelt, falls die Existenz entschieden wurde, das Gesichtsvideosignal (Schritt S450).
Wenn das Gesichtsvideosignal ermittelt ist, komprimiert die Kompressionseinheit 150 das ermittelte Videosignal in ein vorher festgelegtes Format (Schritt S460).
Wenn ein Gesichtbild im Schritt S450 ermittelt wird, generiert die DB Generierungseinheit 155 eine DB des komprimierten Gesichtsvideosignals und zumindest einer der Identifikationsziffern und der Bilderfassungszeit der Bilderfassungseinheit 105, die das komprimierte Gesichtbildsignal erfasst hat, und die generierte DB wird in der Aufzeichnungseinheit 160 aufgezeichnet (Schritt S470).
Wenn kein Hautfarbenkandidatenbereich im Schritt S410 ermittelt wird, komprimiert die Kompressionseinheit 150 das digitale Videosignal der Rahmeneinheit, die im Schritt S400 konvertiert wurde, in ein vorher festgelegtes Format, und die Aufzeichnungseinheit 160 speichert das komprimierte digitale Videosignal der Rahmeneinheit zur Aufbewahrung in den Datenbanken (Schritt S480).
Im Aufzeichnungssystem 100 und im Gesichtsbild-Ermittlungsverfahren gemäß der Ausführung der vorliegenden Erfindung wie oben beschrieben, kann die Gesichtsbildermittlung mit verschiedenen bekannten Verfahren, wie einer Gesichtsermittlung basierend auf Gesichtsforminformation, Eigenschaftspunkten eines Gesichts, Musteransatz-Gesichtsermittlung, Farbinformation, usw., ausgeführt werden, zusätzlich zur Gesichtsermittlung basierend auf dem in 3 präsentierten SVM.
Wie oben beschrieben ist das Aufzeichnungssystem und -Verfahren in der Lage Gesichtsbilder zu ermitteln. Wenn das Aufzeichnungssystem während des Fotografierens von Bildern eines Aufzeichnungsbereichs ermittelt, kann das System ein Gesichtsbild eines Subjektes ermitteln, vergrößern und aufzeichnen, so dass ein Benutzer leicht nach dem Gesicht des Objektes suchen kann, wenn er gespeichert Daten durchsucht.
Weiterhin generiert die vorliegende Erfindung eine Datenbank, wenn sie Subjektbilder aufzeichnet, so dass ein Benutzer effizient nach gewünschten Bildsignalen aus einem großen Volumen von aufgezeichneten Videosignalen suchen kann.
Es ist klar, dass Farbdifferenzsignalbereiche, die verschiedenen Hautfarben entsprechen, im Voraus zur Verwendung als Referenzfarben-Differenzsignal-Niveaubereiche festgelegt werden können.
Obwohl die bevorzugten Ausführungen der vorliegenden Erfindung beschrieben wurden, wird es den Fachleuten klar sein, dass die vorliegende Erfindung nicht auf die beschriebenen bevorzugten Ausführungen limitiert ist, sondern verschieden Änderungen und Modifikationen innerhalb des Rahmens der vorliegenden Erfindung, wie durch die beigefügten Ansprüche definiert, gemacht werden können.

Claims

Ein Bilderfassungssystem (100), enthaltend: eine Bilderfassungseinheit (105), zum Erfassen eines Bildes; Mittel (125), zur Erfassung eines Hautfarbbereichs innerhalb des Bildes; Mittel (139, 135, 110), reagierend auf die Erfassung des Hautfarbbereichs, um die Bilderfassungseinheit (105) zu veranlassen, ein vergrößertes Bild des Hautfarbbereiches zu erfassen; Mittel (145) zur Erfassung eines Gesichtsbildes innerhalb des vergrößerten Bildes, wobei die Gesichtsbild-Erfassungsmittel enthalten: eine erste Gesichtsbereich-Erfassungseinheit (145a), angepasst, um einen Bereich innerhalb des vergrößerten Bildes zu ermitteln, dabei erste vorher bestimmten Kriterien erfüllend; eine zweite Gesichtsbereich-Erfassungseinheit (145b), angepasst, um eine erste Vektorunterstützungsmaschine zu verwenden, um ein spezifisches Teilstück des festgelegten Bereichs zu ermitteln, wobei das spezielle Teilstück zweite vorher bestimmte Kriterien erfüllt; und eine letzte Gesichts-Erfassungseinheit (145c), angepasst um eine zweite Vektorunterstützungsmaschine zu verwenden, um eine Gesichtsbild innerhalb des spezifischen Teilstücks zu ermitteln, wobei die zweite Vektorunterstützungsmaschine eine höhere Auflösung als die erste Vektorunterstützungsmaschine besitzt.
Ein Bilderfassungssystem gemäß Anspruch 1, worin das System angeordnet ist, um ein erstes digitales Videosignal zu liefern, das Bild repräsentierend, und ein zweites digitales Videosignal, das vergrößerte Bild liefernd.
Ein Bilderfassungssystem gemäß Anspruch 2, worin die Hautfarbbereich-Erfassungsmittel (125) weiterhin enthalten: Mittel (125a) zum Vergleichen eines Farbdifferenzsignalniveaus des ersten digitalen Videosignals mit einem Referenzbereich und zum Digitalisieren des Farbdifferenzsignalniveaus in Abhängigkeit vom Ergebnis des Vergleichs.
Ein Bilderfassungssystem gemäß Anspruch 3, weiterhin Mittel (125c) enthaltend, zum Ermitteln eines Hautfarbbereichs basiert auf dem digitalisierten Farbdifferenzsignalniveau enthaltend.
Ein Bilderfassungssystem gemäß Anspruch 4, worin das digitalisierte Farbdifferenzsignalniveau ein erstes Niveau enthält, um anzuzeigen, dass das Farbdifferenzsignalniveau innerhalb eines Referenzbereichs liegt, und ein zweites Niveau, um anzuzeigen, dass sich das Farbdifferenzsignalniveau außerhalb des Referenzbereichs befindet.
Ein Bilderfassungssystem gemäß Anspruch 5, worin die Hautfarbbereich-Erfassungsmittel (125c) angeordnet sind, um festzustellen, ob die Anzahl der konsekutiv ausgegebenen Pixel mit einem digitalisierten Farbdifferenzsignalniveau beim ersten Niveau einen vorbestimmten Grenzwert übertreffen.
Ein Bilderfassungssystem gemäß jedem der vorhergehenden Ansprüche, worin die Hautfarbbereich-Erfassungsmittel (125c) weiterhin enthalten: Mittel, angepasst, um den Hautfarbbereich zu normalisieren und um festzustellen, wenn der normalisierte Hautfarbbereich ein menschlicher Hautfarbbereich ist.
Ein Bilderfassungssystem gemäß jedem der vorhergehenden Ansprüche, worin: die erste Gesichtsbereich-Erfassungseinheit ein Gabor Wavelet Muster verwendet, um den Bereich zu ermitteln, der die ersten vorbestimmten Kriterien erfüllt.
Ein Bilderfassungssystem gemäß jedem der vorhergehenden Ansprüche, worin: die zweite Gesichtsbereich-Erfassungseinheit eine Hauptkomponentenanalyse verwendet, um eine Vielzahl von Gesichts- und nicht Gesichtseigenschaftsvektoren zur Verwendung mit der ersten Vektorunterstützungsmaschine zu erzeugen.
Ein Bilderfassungssystem gemäß jedem der vorhergehenden Ansprüche, weiterhin eine Speicher- und Abfrageeinheit zum Empfangen, Speichern und Abfragen des ermittelten Gesichtsbildes enthaltend.
Ein Bilderfassungssystem gemäß Anspruch 2 oder jedem der Ansprüche 3 bis 10, wenn von Anspruch 2 abhängig, worin die Speicher- und Abfrageeinheit weiterhin enthält: eine Kompression/Dekompressionseinheit, um zumindest eines der folgenden, des ersten digitalen Videosignals, des zweiten digitalen Videosignals und des erfassten Gesichtsbildes zu komprimieren und zu dekomprimieren; eine Datenbankerzeugungseinheit, um eine Datenbank auf der Basis zumindest eines der folgenden, des ersten digitalen Videosignals, des zweiten digitalen Videosignals und erfassten Gesichtsbildes aufzubauen; eine Aufzeichnungseinheit, um zumindest eines der folgenden, das erste digitale Videosignal, das zweite digitale Videosignal und das erfasste Gesichtsbild zu speichern; und einen Monitor, um eine Ableitung von zumindest einem der folgenden, des ersten digitalen Videosignals, des zweiten digitalen Videosignals und des erfassten Gesichtsbildes auszugeben.
Ein Bilderfassungssystem gemäß Anspruch 2 und Anspruch 10, weiterhin enthaltend: eine Schlüsselmanipulationseinheit zum Kontrollieren der Erfassung, der Speicherung und der Abfrage von zumindest einem der folgenden, des ersten digitalen Signals, des zweiten digitalen Signals und des erfassten Gesichtsbildes.
Ein Bilderfassungssystem gemäß jedem der vorhergehenden Ansprüche, worin die Bilderfassungseinheit weiterhin einen Schwenk-, Senkrechtschwenk- und Zoommechanismus zum Erfassen des photographischen Bildes und des vergrößerten photographischen Bildes enthält.
Ein Bilderfassungssystem gemäß jedem der vorhergehenden Ansprüche, weiterhin eine Schalteinheit enthaltend, die angepasst ist, selektiv die Ausgabe der Bilderfassungseinheit einem der Hautfarbbereich-Erfassungsmittel (125) und den Gesichtsbild-Erfassungsmitteln (145) zur Verfügung zu stellen.
Ein Bilderfassungssystem gemäß Anspruch 2 oder jedem der Ansprüche 3 bis 14, wenn abhängig von Anspruch 2, weiterhin enthaltend einen Filter, angepasst Störungen aus dem ersten digitalen Videosignal zu filtern.
Ein Bilderfassungssystem gemäß jedem der vorhergehenden Ansprüche, weiterhin enthaltend: eine Datenbank erfasster Gesichtsbilder, angepasst, um einem Benutzer zu erlauben, nach einem gewünschten Bild, vergrößerten Bild und Gesichtsbild aus einer großen Zahl von aufgezeichneten Bildern zu suchen.
Ein Verfahren der Bilderfassung, enthaltend: Erfassen eines Bildes unter Verwendung einer Bilderfassungseinheit (105); Erfassen eines Hautfarbbereichs innerhalb des Bildes; in Reaktion auf die Erfassung des Hautfarbbereichs, die Bilderfassungseinheit (105) verursachend, ein vergrößertes Bild des Hautfarbbereichs zu erfassen; und Erfassen eines Gesichtsbildes innerhalb des vergrößerten Bildes, wobei der festgelegte Bereich erste vorbestimmte Kriterien erfüllt; Festlegen eines speziellen Teilstücks des festgelegten Bereichs unter Verwendung einer ersten Vektorunterstützungsmaschine, wobei das spezielle Teilstück zweite vorbestimmten Kriterien erfüllt; und Erfassen eines Gesichtsbildes innerhalb des speziellen Teilstücks unter Verwendung einer zweiten Vektorunterstützungsmaschine, wobei die zweite Vektorunterstützungsmaschine eine höhere Auflösung besitzt, als die erste Vektorunterstützungsmaschine.