WO2020169340A1

WO2020169340A1 - Analysevorrichtung, überwachungsanordnung mit der analysevorrichtung sowie verfahren zur bestimmung eines privatsphärenkonformen hintergrundbildes

Info

Publication number: WO2020169340A1
Application number: PCT/EP2020/052793
Authority: WO
Inventors: Michael Christern; Jan Karl Warzelhan
Original assignee: Robert Bosch Gmbh
Priority date: 2019-02-18
Filing date: 2020-02-05
Publication date: 2020-08-27
Also published as: US20220138958A1; US11875514B2; DE102019202103A1

Abstract

Analysevorrichtung (6) zur Analyse von Bilddaten einer Kamera (5), wobei die Bilddaten eine Mehrzahl von Einzelbildern B aufweisen, mit einer Personenanzahlbestimmungseinrichtung (7), wobei die Personenanzahlbestimmungseinrichtung (7) ausgebildet ist, eine Personenanzahl P in den Einzelbildern B zu bestimmen, mit einer Bildauswahleinrichtung (8), wobei die Bildauswahleinrichtung (8) ausgebildet ist, auf Basis der Personenzahl P Einzelbilder B auszuwählen und die ausgewählten Einzelbilder B und die zugehörige Personenanzahl P als Analysedaten A bereitzustellen, mit einer Personenidentifizierungseinrichtung (10), wobei die Personenidentifizierungseinrichtung (10) ausgebildet ist, auf Basis der Analysedaten A Personen P1, P2, P3 als Bildabschnitte A1, A2 in den Einzelbildern B zu markieren und als Maskenbilder M bereitzustellen, mit einer Bildkombinierungseinrichtung (10), wobei die Bildkombinierungseinrichtung (10) ausgebildet ist, die markierten Bildabschnitte A1, A2 durch korrespondierende Bildabschnitte A1', A2' ohne Personen zu ersetzen, wobei eine maximale Personenanzahl Pmax in der Bildauswahleinrichtung (8) hinterlegt ist, wobei die Bildauswahleinrichtung (8) ausgebildet ist, die Einzelbilder B auszuwählen bei denen die zugehörige Personenanzahl P kleiner oder gleich der hinterlegten maximalen Personenanzahl Pmax ist.

Description

Beschreibung

Titel

Analysevorrichtung, Überwachungsanordnung mit der Analysevorrichtung sowie

Verfahren zur Bestimmung eines privatsphärenkonformen Hintergrundbildes

Stand der Technik

Es wird eine Analysevorrichtung zur Analyse von Bilddaten einer Kamera mit den Merkmalen des Oberbegriffs des Anspruchs 1 vorgeschlagen. Ferner werden eine Überwachungsanordnung mit der Analysevorrichtung sowie ein Verfahren zur Bestimmung eines privatsphärenkonformen Hintergrundbildes

vorgeschlagen.

Die Druckschrift DE 10 2008 001 126 Al, die wohl den nächstkommenden Stand der Technik bildet, offenbart ein Inventarisierungsmodul für ein

Videoüberwachungssystem, wobei das Videoüberwachungssystem mindestens eine Überwachungskamera umfasst, welche auf einen Überwachungsbereich, insbesondere einen Lager- und/oder Verkaufsbereich, mit Produkten gerichtet und/oder richtbar ist, mit einer Detektionseinrichtung, welche zur Detektion der Produkte ausgebildet ist, wobei bei der Detektion eine Positionsinformation und eine Identifikationsinformation des detektierten Produkts ermittelt wird. Mit einer Zuordnungseinrichtung, die ausgebildet ist, über die Positionsinformation und die Identifikationsinformation aus einer Mehrzahl von detektierten Produkten eine räumliche Verteilung der Produkte in dem Überwachungsbereich zu modellieren.

Offenbarung der Erfindung

Es wird eine Analysevorrichtung mit den Merkmalen des Anspruchs 1

vorgeschlagen. Ferner wird eine Überwachungsanordnung mit den Merkmalen des Anspruchs 11 sowie ein Verfahren mit den Merkmalen des Anspruchs 13 vorgeschlagen. Bevorzugte und/oder vorteilhafte Ausführungsformen der Erfindung ergeben sich aus den Unteransprüchen, der Beschreibung und den beigefügten Figuren.

Ausgangspunkt der Erfindung ist der Umstand, dass eine Vielzahl an Geschäften und Läden videotechnisch und/oder produkttechnisch überwacht werde. Mittels der Überwachung soll die Performance des Geschäftes verbessert werden. Dazu werden Analysevorrichtungen eingesetzt, die eine Instore-Analytik, oder auch Retail-Analyse genannt, durchführen können. Mittels solcher Analysen kann ein Kundenverhalten im Einzelhandel oder im Ladengeschäft analysiert und ausgewertet werden. Die gewonnenen Daten können über die Zeit und/oder auch über Positionen aggregiert werden und einen Benutzer, beispielsweise einem Ladengeschäftmanager, einer Werbeabteilung oder Datenanalysten, bereitgestellt werden. Die Bereitstellung der Analysedaten kann mittels grafischer Ausgabe (Dashboard) und/oder anhand von Tabellen erfolgen. Basierend auf den Analysedaten kann der Benutzer dann die Produktanordnung, die

Regalanordnung oder andere Parameter so optimieren, dass das

Kundenverhalten nach Wunsch gesteuert wird.

Gegenstand der Erfindung ist eine Analysevorrichtung, welche zur Analyse von Bilddaten mindestens oder genau einer Kamera ausgebildet und/oder geeignet ist. Insbesondere ist die Analysevorrichtung ausgebildet, auf Basis der Bilddaten ein privatsphärenkonformes Hintergrundbild zu ermitteln und/oder

bereitzustellen. Insbesondere dient die Kamera zur bildtechnischen und/oder videotechnischen Überwachung eines Überwachungsbereichs. Bevorzugt ist der Überwachungsbereich ein Lager- und/oder Verkaufsraum. Dabei wird der von der und/oder den Kamera(s) aufgezeichnete Überwachungsbereich als die Bilddaten, insbesondere als Videodaten, bereitgestellt. Die Analysevorrichtung kann dabei als eine separate Recheneinheit ausgebildet sein. Alternativ kann die Analysevorrichtung jedoch auch zumindest teilweise einen integralen Bestandteil der Kamera bilden.

Die Bilddaten umfassen eine Mehrzahl von Bildern. Insbesondere umfassen die Bilddaten eine Mehrzahl von zeitlich aufeinander folgenden und/oder beabstandeten Einzelbildern auf. Insbesondere kann die Analysevorrichtung in Echtzeit und/oder auf eine Aufzeichnung der Bilddaten zugreifen.

Die Analysevorrichtung weist eine Personenanzahlbestimmungseinrichtung auf. Insbesondere weist die Personenanzahlbestimmungseinrichtung eine

Schnittstelle zur Übernahme der Bilddaten auf. Die

Personenanzahlbestimmungseinrichtung ist ausgebildet, eine Personenanzahl in den Bildern zu bestimmen. Insbesondere kann die

Personenanzahlbestimmungseinrichtung zu jedem einzelnen Bild die

dazugehörigen Personen durch deren Anzahl beschreiben und als Metadaten bereitstellen. Insbesondere können die Metadaten neben der Information über die Personenanzahl in dem Bild beispielsweise auch eine Positionsinformation und/oder ein Bewegungsverhalten/-muster zu den abgebildeten Personen umfassen. Bevorzugt kann die Personenanzahlbestimmungseinrichtung auf Basis von digitalen oder analogen Bildverarbeitungsalgorithmen die Anzahl der Personen in den Bildern auswerten.

Die Analysevorrichtung weist eine Bildauswahleinrichtung auf. Insbesondere weist die Bildauswahleinrichtung eine Schnittstelle zur Übernahme der

Einzelbilder sowie den dazugehörigen Metadaten auf. Die

Bildauswahleinrichtung ist dabei ausgebildet, auf Basis der durch die

Personenanzahlbestimmungseinrichtung ermittelten Personenzahl Bilder, insbesondere mindestens oder genau ein Einzelbild, aus den Bilddaten auszuwählen und diese zusammen mit den zugehörigen Metadaten als

Analysedaten bereitzustellen. Insbesondere besteht ein durch die

Bildauswahleinrichtung durchgeführtes Auswahlverfahren darin, eine Mehrzahl von Einzelbildern anhand der zugehörigen Personenanzahl miteinander zu vergleichen und anhand von festgelegten und in der Bildauswahleinrichtung hinterlegten Auswahlkriterien eine Auswahlentscheidung zu treffen.

Ferner weist die Analysevorrichtung eine Personenidentifizierungseinrichtung auf. Insbesondere weist die Personenidentifizierungseinrichtung eine

Schnittstelle zur Übernahme der Analysedaten auf. Die

Personenidentifizierungseinrichtung ist ausgebildet, Personen in den

Einzelbildern zu identifizieren und diese als Bildabschnitte in den Einzelbildern zu markieren. Die mit den Bildabschnitten markierten Einzelbilder werden anschließend als Maskenbilder bereitgestellt. Insbesondere kann die

Personenidentifizierungseinrichtung die Personen in der Bildebene des entsprechenden Einzelbildes durch eine grafische Begrenzung markieren.

Die Analysevorrichtung weist eine Bildkombinierungseinrichtung auf.

Insbesondere weist die Bildkombinierungseinrichtung eine Schnittstelle zur Übernahme der mit den Bildabschnitten markierten Maskenbilder auf. Die Bildkombinierungseinrichtung ist ausgebildet, die mit Personen markierten Bildabschnitte von mindestens oder genau einem der Maskenbilder durch korrespondierende Bildabschnitte ohne Personen zu ersetzen. Insbesondere erfolgt das Ersetzen der Bildabschnitte durch einen Vergleich von mehreren der Maskenbilder miteinander oder mit einem hinterlegten Einzelbild, wobei vorzugsweise sämtliche markierten Bildabschnitte mit Personen durch korrespondierenden Bildabschnitte ohne Personen ersetzt werden. Dadurch kann sichergestellt werden, dass das erzeugte Hintergrundbild tatsächlich keine Personen abbildet, sodass das privatsphärenkonforme Hintergrundbild erzeugt und zur weiteren Verwendung bereitgestellt wird. Das privatsphärenkonforme Hintergrundbild kann beispielsweise manuell oder automatisch einer

Datenbankeinrichtung und/oder einer Anzeigeeinrichtung zur Verfügung gestellt werden. Vorzugsweise dient das privatsphärenkonforme Hintergrundbild zur Überlagerung und/oder Verknüpfung mit einem zweidimensionalen Modell, z. B. ein Grundriss und/oder Lageplan.

Der Vorteil der Erfindung besteht dabei darin, dass durch eine geringe Auswahl an Einzelbildern, welche zudem ein reduziertes Personenaufkommen aufweisen, ein Minimum an zu übertragenden Daten realisiert werden kann. Dies ist besonders vorteilhaft bei einer cloudbasierten Anwendung der

Analysevorrichtung, da das zu übertragende Datenvolumen deutlich reduziert werden kann und somit die Datenübertragung beschleunigt und/oder

Speicherplatz eingespart werden kann. Zudem kann sichergestellt, dass die durch die Bildauswahleinrichtung bereitgestellten Analysedaten bereits keine oder zumindest nur eine geringe Anzahl an Personen aufweisen. In einer Weiterbildung der Erfindung wird vorgeschlagen, dass in der

Bildauswahleinrichtung eine maximale Personenanzahl hinterlegt ist.

Insbesondere entspricht die maximale Personenanzahl einer Anzahl an

Personen, welche maximal in einem Einzelbild der Bilddaten Vorkommen darf.

Die Bildauswahleinrichtung ist dabei ausgebildet, die Bilder auszuwählen bei denen die zugehörige Personenanzahl kleiner oder gleich der hinterlegten maximalen Personenanzahl ist. Insbesondere wählt die Bildauswahleinrichtung die Bilder in zeitlich festgelegten Abständen aus. Bevorzugt vergleicht die Bildauswahleinrichtung die Einzelbilder, insbesondere bezüglich ihrer

Personenanzahl miteinander, wobei die Bildauswahleinrichtung die Einzelbilder als Analysedaten zur Verfügung stellt, bei der die zugehörige Personenanzahl kleiner oder gleich der hinterlegten maximalen Personenanzahl ist und/oder im Vergleich zu den anderen Einzelbildern minimal ist. Besonders bevorzugt werden die Bilder bevorzugt als die Analysedaten bereitgestellt, welche keine Personen oder nur wenige detektierte Personen aufweisen.

Eine Ausgestaltung der Erfindung sieht vor, dass die Bildauswahleinrichtung ausgebildet ist, in mindestens oder genau einem festgelegten Zeitbereich in dem ein reduziertes Personenaufkommen zu erwarten ist, mindestens oder genau ein Einzelbild auszuwählen. Bevorzugt kann die Zeitspanne des Zeitbereichs und/oder die Anzahl der Zeitbereiche und/oder die zeitlichen Abstände zwischen mehreren Zeitbereichen variabel eingestellt werden. Insbesondere ist der mindestens eine Zeitbereich, vorzugsweise mindestens einmal pro Tag oder pro Woche oder pro Monat oder pro Jahr definiert. Alternativ oder optional ergänzend ist der mindestens eine Zeitbereit vor und/oder nach einem festgelegten Zeitraum oder Zeitpunkt definiert. Besonders bevorzugt ist der Zeitbereich direkt oder zeitlich beabstandet vor einer Öffnungszeit und/oder nach einer Schließzeit definiert. Im Speziellen ist der Zeitbereich so eingestellt, dass sich in dem Überwachungsbereich noch keine oder zumindest nur wenige Personen aufhalten, jedoch dieser bereits für die Aufnahme optimiert, z.B. beleuchtet, ist.

Somit kann sichergestellt werden, dass ein für die weitere Bildverarbeitung notwendiges, insbesondere ein visuell ansprechendes Bild durch die Kamera aufgenommen werden kann. Zudem kann durch die Festlegung des Zeitbereichs ein minimales Personenaufkommen in dem Überwachungsbereich sichergestellt werden.

In einer Weiterbildung ist vorgesehen, dass die Bildauswahleinrichtung ausgebildet ist, mehrere der Einzelbilder in dem festgelegten Zeitbereich zu unterschiedlichen Zeitpunkten, insbesondere bezüglich deren Personenanzahl, zu analysieren. Insbesondere ist die Bildauswahleinrichtung ausgebildet, innerhalb des Zeitbereichs zu verschiedenen, vorzugsweise zufälligen oder zeitlich festgelegten, Zeitpunkten jeweils ein oder mehrere der Einzelbilder bezüglich der zugehörigen Metadaten zu analysieren. Bevorzugt kann die Bildauswahleinrichtung die Zeitpunkte bezüglich der zugehörigen

Personenanzahl sortieren. Im Speziellen kann zu mindestens oder genau einem Zeitpunkt, welcher vorzugsweise die geringste Personenanzahl aufweist, das zugehörige Einzelbild zugeordnet und/oder geladen werden. Im Speziellen ist die Anzahl der zugeordneten und/oder zuordbaren Einzelbilder gleich der Anzahl der Zeitpunkte.

In der Bildauswahleinrichtung ist ein minimaler Zeitabstand zwischen den Zeitpunkten hinterlegt. Insbesondere ist die Bildauswahleinrichtung ausgebildet, die Analysedaten, insbesondere die Einzelbilder und/oder die Metadaten, zu Zeitpunkten auszuwählen bzw. zu analysieren, welche einen Zeitabstand aufweisen, der größer oder gleich als der minimale Zeitabstand ist. Insbesondere ist die Bildauswahleinrichtung ausgebildet, nach Zeitpunkten zu suchen, welche mindestens mit dem minimalen Zeitabstand voneinander beabstandet sind und/oder deren Personenanzahl in der abgebildeten Szene (Einzelbild) minimal ist und/oder kleiner oder gleich der maximalen Personenanzahl ist. Mit dem Wissen zu welchem Zeitpunkt wie viele Personen in dem zugehörigen Einzelbild vorhanden sind bzw. welche Zeitpunkte die wenigsten Personen enthalten, kann anschließend das dazugehörige Einzelbild geladen werden.

Durch den in der Bildauswahleinrichtung hinterlegten minimalen Zeitabstand sowie der hinterlegten maximalen Personenanzahl wird die Wahrscheinlichkeit für das Vorhandensein von ausreichend Hintergrunddaten gewährleistet. Falls sich Personen in der Szene befinden, diese aber nicht durch die

Personenidentifizierungseinrichtung erkannt wurden, kann durch die Bereitstellung weitere Einzelbilder mit größerem zeitlichen Abstand, die

Wahrscheinlichkeit erhöht werden, dass sich die Personen in der abgebildeten Szene wegbewegt haben und somit an der Stelle keine Person mehr befindet. Das Einzelbild bzw. der Bildabschnitt kann anschließend für die Bestimmung des privatsphärenkonformen Hintergrundbilds verwendet werden. Somit kann zwischen den Ergebnissen eine bestmögliche Verteilung und/oder Diversität gewährleitet werden.

In einer weiteren bevorzugten Ausgestaltung der Erfindung ist vorgesehen, dass die Bildkombinierungseinrichtung ausgebildet ist, die markierten Bildabschnitte in den Maskenbildern durch einen Mittelwert der Farbwerte der entsprechenden Bildabschnitte der weiteren Maskenbilder zu ersetzen. Insbesondere dient die Bildkombinierungseinrichtung zur Berechnung des privatsphärenkonformen Hintergrundbildes. Beispielsweise kann das Bildberechnungsmodul für jede Pixelposition alle Pixelwerte der verschiedenen Analysedaten nach ihrem Farbwert sortieren und dann einen Medianpixelwert zur Berechnung eines Medianbildes als das privatsphärenkonforme Hintergrundbild bestimmen.

Insbesondere erfolgt die Berechnung des Medianbildes mittels eines

Medianwert-Operators.

Da eine gewisse Anzahl an Personen immer im Bild vorhanden sind, z. B. bei einer Öffnungszeit von 24 Stunden, und/oder nicht jede Person als solche erkannt wird oder diese erst zu spät erkannt wird, kann trotz Vorhandensein von Personen in den einzelnen Maskenbildern ein Medianbild als das

privatsphärenkonforme Hintergrundbild ausgegeben werden.

In einer konkreten Weiterbildung ist vorgesehen, dass das

Bildberechnungsmodul ausgebildet ist, die mit Personen markierten

Bildabschnitte an der jeweiligen Bildposition der weiteren Maskenbilder bei einer Berechnung des Mittelwertes auszuschließen. Insbesondere ist die

Bildauswahleinrichtung ausgebildet, die mit Personen markierten Bildabschnitte bei der Berechnung des Mittelwerts aller Farbwerte pro Bildposition zu ignorieren. Da man jetzt von keinen Vordergrundobjekten (Personen) ausgehen kann, kann nun auch das Mittelwertbild anstelle des Medianbildes berechnet werden. Vorzugsweise erfolgt die Berechnung des Mittelwertbildes pro Pixel mittels eines Mittelwert-Operators.

In einer Weiterbildung ist vorgesehen, dass die

Personenidentifizierungseinrichtung ein Maskierungsmodul aufweist, wobei das Maskierungsmodul ausgebildet ist, basierend auf den Analysedaten die zugehörigen Personen in den zughörigen Einzelbildern zu markieren, sodass die Bildabschnitte gebildet werden. Insbesondere kann das Maskierungsmodul die Bildbereiche, in denen bewegte Personen identifiziert wurden, großzügig umranden. Vorzugsweise können die Personen aufweisenden Bildbereiche durch rechteckige oder polygonale Kästen umrandet werden. Je nach Darstellung können die Kästen in der Bildebene als zwei- oder dreidimensionale Kästen dargestellt sein. Besonders bevorzugt sind diese Kästen um einen definierten Prozentsatz größer als die abgebildete Person selbst. Dadurch kann eine Kompletteingrenzung der Personen in dem zugehörigen Einzelbild sichergestellt werden.

In einer alternativen oder optional ergänzenden Weiterbildung ist vorgesehen, dass die Personenidentifizierungseinrichtung ein Kl-Modul aufweist, wobei das Kl-Modul ausgebildet ist, die Detektion von Personen in den Einzelbildern zu erlernen und/oder zu verbessern. Insbesondere ist das Kl-Modul ausgebildet, Bildbereiche in den Einzelbildern an denen eine Person vermutet wird zu analysieren und/oder auszuwerten, wobei bei einer Detektion einer Person die entsprechenden Bereiche in den zughörigen Einzelbildern markiert werden. Im Speziellen ist das Kl-Modul ausgebildet, Merkmale von Personen zu erlernen und basierend auf den Merkmalen die Personen zu detektieren. Insbesondere ist das Kl-Modul ausgebildet die entsprechenden Einzelbilder mittels eines neuronalen Netzes (auch als sogenanntes„Deep Learning“ bekannt) zu prozessieren und die Stellen im Bild zu auszuwerten, an denen eine Person vermutet wird. Beispielsweise ist das Kl-Modul ausgebildet die Einzelbilder mittels eines Deep-Learning-Segmentierungsalgorithmus zu prozessieren, wobei als Ergebnis eine pixelweise Klassifizierung im Bild ausgegeben wird, wo sich Personen befinden. Anschließend werden diese Bildbereiche durch Masken, die die Personen umschließenden, markiert. In einer weiteren konkreten Ausgestaltung der Erfindung ist vorgesehen, dass die Personenidentifizierungseinrichtung ausgebildet ist, die durch das

Maskierungsmodul und durch das Kl-Modul markierten Bildabschnitte

zusammenzufassen und als das Maskenbild bereitzustellen. Insbesondere ist die Personenidentifizierungseinrichtung ausgebildet, sämtliche markierten

Bildabschnitte miteinander zu vergleichen, und eine Maskierung aller

Bildbereiche zu vollziehen, an denen eine Person identifiziert wurde. Dabei können mehrere Maskenbilder durch die Personenidentifizierungseinrichtung bereitgestellt werden und einem Puffer/Bildstapel hinzugefügt werden. Im Speziellen können so viele Maskenbilder bereitgestellt werden, bis alle oder genügend durch die Bildauswahleinrichtung bereitgestellten Einzelbilder bearbeitet wurden, um in den nachfolgenden Prozessschritten mögliche Fehler oder nicht erkannte Personen herausrechnen zu können.

In einer weiteren Umsetzung ist vorgesehen, dass die Analysevorrichtung eine Datenbank aufweist. Die Datenbank ist ausgebildet mindestens oder genau eines der Einzelbilder mit der zugehörigen Personenanzahl und/oder dem zugehörigen Zeitpunkt als Analysedaten zu speichern. Insbesondere ist die

Bildauswahleinrichtung ausgebildet zu jedem Zeitpunkt die zugehörigen

Einzelbilder und die zugehörigen Metadaten zusammenzufassen und in der Datenbank als Analysedaten abzulegen. Besonders bevorzugt kann zu jedem festgelegten Zeitpunkt das entsprechende Einzelbild und/oder die zugehörigen Metadaten von der Kamera, z.B. von der Aufzeichnung, geladen und in der Datenbank hinterlegt werden. Insbesondere können die in der Datenbank hinterlegten Analysedaten nun einzeln, insbesondere in einer Schleife, durch die Personenidentifizierungseinrichtung sowie die Bildkombinierungseinrichtung abgearbeitet werden.

Ein weiterer Gegenstand der Erfindung betrifft eine Überwachungsanordnung, welche zur Überwachung eines Überwachungsbereichs ausgebildet und/oder geeignet ist. Vorzugsweise weist die Überwachungsanordnung die

Analysevorrichtung nach einem der vorhergehenden Ansprüche bzw. wie diese bereits zuvor beschrieben wurde, auf. Die Überwachungsanordnung weist mindestens eine oder mehrere Kameras auf. Die Kamera ist ausgebildet, einen Überwachungsbereich zu erfassen und diesen als die Bilddaten bereitzustellen. Insbesondere ist die Analysevorrichtung zur Analyse des

Überwachungsbereiches mit der mindestens einen, vorzugsweise mit allen, Kameras signaltechnisch verbunden. Im Speziellen weist die

Überwachungsanordnung mehrere der Kameras auf, wobei jede der Kameras ausgebildet ist, den Überwachungsbereich optisch zu überwachen. Bevorzugt werden die optischen Aufnahmen der Kameras als die Bilddaten der

Analysevorrichtung bereitgestellt, wobei die Analyseeinrichtung ausgebildet ist, für jede der Aufnahmen ein zugehöriges privatsphärenkonformes Hintergrundbild zu ermitteln.

In einer weiteren Konkretisierung ist vorgesehen, dass der Überwachungsbereich als der Verkaufsraum ausgebildet ist. Insbesondere ist der Verkaufsraum ein Raumabschnitt eines Verkauf- und/oder Lageraumes, z.B. von einem Laden, Shoppingcenter oder Verkaufsgeschäft. Die Überwachungsanordnung ist ausgebildet, ein Verkaufsverhalten in dem Verkaufsraum zu analysieren.

Insbesondere kann die Überwachungsanordnung den Verkaufsraum hinsichtlich Produkte, Produktperformance, Kundenströme und/oder Verkaufsdaten analysieren und diese vorzugsweise als Verkaufs- und/oder Retail-Daten bereitzustellen.

Ein weiterer Gegenstand der Erfindung betrifft ein Verfahren zur Bestimmung eines privatsphärenkonformen Hintergrundbildes insbesondere mit der

Analysevorrichtung und/oder mit der Überwachungsanordnung wie diese bereits zuvor beschrieben wurden. Bevorzugt ist das Verfahren zur Durchführung der nachfolgenden Schritte ausgebildet, bei denen:

- Bilddaten von einer Kamera an die Analysevorrichtung übertragen werden, wobei die Bilddaten eine Mehrzahl von Bildern aufweisen;

- eine Personenanzahlbestimmungseinrichtung der Analysevorrichtung eine Personenanzahl in den Bildern bestimmt;

- eine Bildauswahleinrichtung der Analysevorrichtung die Bilder auswählt, bei denen insbesondere eine zugehörige Personenanzahl kleiner oder gleich als eine in der Bildauswahleinrichtung hinterlegten maximalen Personenanzahl ist, und die ausgewählten Bilder als Analysedaten bereitstellt, - eine Personenidentifizierungseinrichtung Personen in den Analysedaten identifiziert und als Bildabschnitte in den Analysedaten markiert,

- eine Bildkombinierungseinrichtung die mit Personen markierten Bildabschnitte durch korrespondierende Bildabschnitte ohne Personen ersetzt, sodass ein privatsphärenkonformes Hintergrundbild erzeugt wird.

Weitere Vorteile, Wirkungen und Ausgestaltungen ergeben sich aus den beigefügten Figuren und deren Beschreibung. Dabei zeigen:

Figur 1 eine stark schematisierte Darstellung einer Überwachungsanordnung zur Überwachung eines Überwachungsbereiches;

Figur 2 eine schematische Blockdarstellung der Überwachungsanordnung mit einer Analysevorrichtung als ein Ausführungsbeispiel der Erfindung;

Figur 3 ein schematisches Ablaufdiagramm zur Berechnung eines

privatsphärenkonformen Hintergrundbildes durch die Analysevorrichtung;

Figur 4 in gleicher Darstellung wie Figur 3 eine Fortsetzung des

Ablaufdiagramms.

Figur 1 zeigt in einer stark schematisierten Darstellung eine

Überwachungsanordnung 1, welche zur Überwachung eines

Überwachungsbereichs 2 dient. Die Überwachungsanordnung 1 ist

beispielsweise in einem Geschäft oder einem Kaufhaus installiert. In dem gezeigten Ausführungsbeispiel ist der Überwachungsbereich 2 als ein

Verkaufsraum des Geschäfts ausgebildet, wobei in dem Verkaufsraum eine Mehrzahl von Warenpräsentern 3, z.B. Regale, Tische, Ständer, Theken etc., zur Warenpräsentation aufgestellt sind. Zwischen den Warenpräsentern 3 ist ein Wegenetz in dem Verkaufsraum 2 vorgegeben, auf welchem sich Personen 4 bewegen können. Die mindestens eine Person 4 ist in Interaktion mit den Warenpräsentern 3 und den darin angeordneten Produkten. Die Person 4 wählt beispielsweise Produkte aus, nimmt diese mit und legt einen Weg in dem

Überwachungsbereich 2 zurück. Die Bewegung der Person 4, das Kaufverhalten und Zusatzinformationen werden von der Überwachungsanordnung 1 überwacht. Die Überwachungsanordnung 1 weist eine Mehrzahl an Kameras 5 auf, welche ausgebildet sind, den Überwachungsbereich 2 optisch zu überwachen. Mit den Kameras 5 wird die Person 4 in dem Überwachungsbereich 2 verfolgt und/oder erfasst. Ferner kann mittels der Kameras 5 das Vorhandensein, das Wegnehmen und/oder Umsortieren von Produkten und/oder Warenpräsentern 3

nachvollzogen und analysiert werden. Die optischen Aufnahmen der Kameras 5 werden als Bilddaten, insbesondere als Videodaten, einer Analysevorrichtung 6 bereitgestellt.

Die Analysevorrichtung 6 kann unter anderem ausgebildet sein, das Verhalten der Personen 4, die Produktperformance von Produkten und/oder weitere Informationen bezüglich des Überwachungsbereichs 2 zu analysieren, zu überwachen und/oder zu speichern. Bevorzugt jedoch ist die Analysevorrichtung 6 ausgebildet, die von den Kameras 5 übermittelten Bilddaten auszuwerten und ein privatsphärenkonformes Hintergrundbild zu generieren, welches für weitere Prozesse der Verkaufs- und/oder Produktanalyse zur Verfügung gestellt wird. Beispielsweise kann das privatsphärenkonforme Hintergrundbild auf einem Grundriss oder Lageplan des Verkaufsraums überlagert werden. Die

Analysevorrichtung 6 ist dabei ausgebildet, ein Verfahren durchzuführen, welches in mehreren Stufen sicherstellt, dass das erzeugte Hintergrundbild tatsächlich keine Personen 4 in den von den Kameras 5 aufgenommen Bilddaten abbildet und zugleich die Bandbreite bzw. das Datenvolumen pro Kamera 5 auf ein Minimum reduziert, wenn diese z.B. über eine cloudbasierte Lösung mit der Analysevorrichtung 6 in Verbindung stehen.

Figur 2 zeigt die Überwachsungsanordnung 1, deren Datenströme anhand einer schematisierten Blockdarstellung als ein Ausführungsbeispiel der Erfindung gezeigt werden. Bei einer Anfrage auf ein privatsphärenkonformes

Hintergrundbild, z.B.„PrivacyConformBackground“ via REST Call, kann ausgehend von den Kameras 5 die Bilddaten an die Analysevorrichtung 6 übermittelt werden. Dies kann, je nachdem wie aktuell das Hintergrundbild sein muss, beispielsweise jeden Tag, einmal pro Woche oder einmal pro Monat pro Kamera 5 automatisch erfolgen oder manuell getriggert werden. Die Bilddaten weisen eine Mehrzahl von zeitlich aufeinander folgenden und/oder beabstandeten Bildern (Einzelbilder) auf. Zusätzlich zu dem Bilddatenstrom können die Kameras 5 zusätzlich einen Metadatenstrom liefern, welcher zu jedem Zeitpunkt in der Aufzeichnung die dazugehörigen bewegten Objekte, insbesondere die Personen 4, durch Positionsdaten beschreibt.

Die Analysevorrichtung 6 weist eine Personenanzahlbestimmungseinrichtung 7 auf, welche ausgebildet ist, auf Basis der Metadaten, insbesondere der

Positionsdaten, zu jedem Zeitpunkt eine zugehörige Personenanzahl in dem entsprechenden Einzelbild zu berechnen. Hierzu kann die

Personenanzahlbestimmungseinrichtung 7 auf eine Aufzeichnung oder live auf die Bilddaten und die Metadaten der Kameras 5 zugreifen.

Die Analysevorrichtung 6 weist eine Bildauswahleinrichtung 8 auf, welche ausgebildet ist, auf Basis der Personenanzahl Bilder auszuwählen und zu laden, welche vorzugsweise eine minimale Personenanzahl aufweisen. Dabei kann die Bildauswahleinrichtung 8 die Metadaten hinsichtlich der Personenanzahl zu unterschiedlichen Zeitpunkten untersuchen, wobei die Bilder bevorzugt werden, deren Anzahl an vorhandenen Personen 4 in der abgebildeten Szene (Einzelbild) minimal ist.

Zusätzlich können die von den Kameras 5 bereitgestellten Bilddaten und/oder Metadaten innerhalb eines bestimmten Zeitbereiches teilweise oder vollständig heruntergeladen werden. Neben der freien Definierbarkeit des Zeitbereiches kann dabei auch die Art und Anzahl der Stückelungen in diesem Bereich festlegbar sein. Somit kann eine Reduzierung des Download-Volumens sowie eine größere Diversität in den Metadaten erreicht werden.

Es ist bevorzugt eine maximale Personenanzahl in der Bildauswahleinrichtung 8 hinterlegt, wobei die Bildauswahleinrichtung ausschließlich die Bilder

berücksichtig deren zugehörige Personenanzahl kleiner oder gleich als die festgelegte maximale Personenanzahl ist. Diese relevanten Bilder werden anschließend von der Bildauswahleinrichtung 8 mit den zugehörigen Metadaten zusammengefasst bzw. runtergeladen und als Analysedaten bereitgestellt. Dadurch wird die Wahrscheinlichkeit an Vorhandensein von genügend

Hintergrunddaten für einen anschließenden Prozessschritt gewährleistet.

Die Analysevorrichtung 6 weist des Weiteren eine Datenbank 9 auf, wobei die Datenbank 9 eine Schnittstelle zur Übernahme der Analysedaten aufweist. Die Analysedaten können beispielsweise nach deren zugehörigen Zeitpunkten der Aufnahme und/oder der zugehörigen Personenanzahl sortiert und in der

Datenbank 9 zusammengefasst werden.

Die Analysevorrichtung 6 weist eine Personenidentifizierungseinrichtung 10 auf, welche ausgebildet ist, einzelne Personen in den Einzelbildern zu identifizieren und zu markieren. Dabei werden unter Personen auch sämtliche durch die Personen mitgeführten Objekte, wie z.B. Kinderwagen, Koffer, Taschen etc., verstanden. Hierzu weist die Personenidentifizierungseinrichtung 10 ein

Maskierungsmodul 11 und ein Kl-Modul 12 auf. Das Maskierungsmodul 11 ist ausgebildet, auf Basis der Metadaten bzw. Analysedaten die durch die Kameras 5 detektierten bewegten Personen 4 und gegebenenfalls deren mitgeführten Objekte als Bildabschnitte in dem zugehörigen Einzelbild zu markieren. Das Kl- Modul 12 ist ausgebildet, parallel zu dem Maskierungsmodul 11 die

Analysedaten in einem Einzelbildverfahren basierend auf Deep-Learning, z.B. ein Deep-Learning-Segmentierungsalgorithmus, zu verwenden um nicht erkannte Personen, z.B. sitzende oder stillstehende Personen, in dem zugehörigen Einzelbild als weitere Bildabschnitte in dem zugehörigen Einzelbild zu markieren. Dabei werden die Analysedaten, mit einem neuronalen Netz prozessiert und die Stellen in den entsprechenden Bildern markiert, an denen eine Person vermutet wird. Die Personenidentifizierungseinrichtung 10 ist ausgebildet, die durch das Maskierungsmodul 11 und das Kl-Modul 12 markierten Bildabschnitte des entsprechenden Einzelbildes in einem gemeinsamen Maskenbild

zusammenzufassen und dieses dem weiteren Prozess bereitzustellen.

Die Analysevorrichtung 6 weist eine Bildkombinierungseinrichtung 13 auf, wobei die Bildkombinierungseinrichtung 13 ausgebildet ist, mehrere der Maskenbilder miteinander zu vergleichen und entsprechend markierte Bildabschnitte durch Bildabschnitte ohne Personen zu ersetzen. Dabei kann die

Bildkombinierungseinrichtung 13 beispielsweise für jede Pixelposition alle Pixelwerte aller der verschiedenen Maskenbilder erfassen und diese nach ihrem Farbwert sortieren. Anschließen kann ein Medianpixelwert zur Erzeugung eines Medianbildes als das privatsphärenkonforme Hintergrundbild berechnet werden. Alternativ oder optional kann auch vorgesehen sein, dass die markierten

Bildabschnitte großzügig ausgeschlossen bzw. ignoriert werden und ein

Mittelwert aller Farbwerte der restlichen Maskenbilder unter Berücksichtigung der ausgeschlossenen Bildabschnitte zur Erzeugung eines Mittelwertbildes als das privatsphärenkonforme Hintergrundbild berechnet wird. Die Erfindung beschreibt somit ein Verfahren, welches in mehreren Stufen sicherstellt, dass das erzeugte Hintergrundbild tatsächlich keine Personen abbildet und die Bandbreite bzw. das Datenvolumen pro Kamera 5 auf ein Minimum reduziert wird.

Die Analysevorrichtung 6 ist signaltechnisch mit einem Endgerät 14 verbunden, wobei das Endgerät eine Schnittstelle zur Übernahme des

privatsphärenkonformen Hintergrundbildes aufweist. Beispielsweise ist das Endgerät 14 als eine Anzeigeeinrichtung ausgebildet und dient der Anzeige von Anzeigedaten. Die Anzeigeeinrichtung 14 kann zur grafischen, Bild-, Video- und/oder Textanzeige ausgebildet sein. Beispielsweise ist die Anzeige als ein Display ausgebildet. Beispielsweise kann die Anzeigeeinrichtung 14 den

Grundriss des Verkaufsraums anzeigen, wobei die Positionen der Kameras 5 in dem Grundriss angezeigt und/oder anzeigbar sind. Die Kamerapositionen können einzeln angewählt werden, wobei das privatsphärenkonforme

Hintergrundbild als ein Kamerabild mit dem Grundriss überlagert wird.

Nachfolgend ist in den Figuren 3 und 4 der Ablauf des Verfahrens in einem schematischen Ablaufdiagramm veranschaulicht, wobei die Figur 3 die Schritte S1 bis S3 und die Figur 4 die Schritte S4 bis S9 umfasst.

In einem ersten Schritt S1 erfolgt ein Zugriff auf die Kamera(s) 5 durch die Analysevorrichtung 6. Dabei werden die von der Kamera 5 bereitgestellten Bild- und/oder Metadaten B, D innerhalb eines bestimmten Zeitbereiches T1<->T2 ausgewertet. Beispielsweise ist der Zeitbereich zum Zeitpunkt der Öffnungszeit des Geschäfts minus einer variablen Zeitspanne, z.B. 30 min, definiert. In dem gezeigten Ausführungsbeispiel öffnet das Geschäft beispielsweise um 8:00 Uhr morgens, somit erfolgt der Zugriff von TI = 7:30 Uhr bis T2 = 8:00 Uhr. Dies soll sicherstellen, dass in dem Geschäft noch keine Kunden sind, aber der

Ladenbesitzer/-personal bereits in dem Geschäft ist, um Vorbereitungen für den anstehenden Tag zu treffen. Somit kann sichergestellt werden, dass z.B. ein Licht in dem Überwachungsbereich 2 des Geschäfts eingeschaltet ist, wodurch visuell ansprechende Bilder B der Bilddaten durch die Kameras 5 aufgenommen werden können. Durch das Runterladen der Meta- bzw. Bilddaten in

Abhängigkeit der Öffnungszeiten wird die Wahrscheinlichkeit erhöht, auf Bilddaten in einem späteren Verfahrensschritt zugreifen zu können, auf welchen keine Personen 4 abgebildet sind.

Alternativ kann der Schritt S1 auch zu beliebigen Zeiten während des Tages verwendet werden, beispielsweise kann hierzu auf eine in der Vergangenheit liegende Aufzeichnung zugegriffen werden. Alternativ kann auch live, z.B. falls keine Aufzeichnung existiert, oder basierend auf Statistiken, zu welchen

Tageszeiten mit den wenigsten Personen 4 zu rechnen ist, auf die Kameras 5 zugegriffen werden.

Nach einer Aneinanderreihung aller in Schritt 1 heruntergeladenen Metadaten D, wird basierend auf den Metadaten D in einem zweiten Schritt S2 durch die Bildauswahleinrichtung 8 nach Zeitpunkten Z gesucht, welche eine durch die Personenanzahlbestimmungseinrichtung 7 erfasste minimale Personenanzahl P aufweisen. Hierzu ist in der Bildauswahleinrichtung 8 die maximale

Personenanzahl Pmax festgelegt, welche zu einem Zeitpunkt Z vorhanden sein dürfen. Optional kann als ein weiterer Parameter ein minimaler Zeitabstand tmin zwischen den Zeitpunkten Z in der Bildauswahleinrichtung 8 hinterlegt sein. Somit wird durch den minimalen Zeitabstand tmin zwischen den Zeitpunkten Z eine bestmögliche Verteilung und Diversität der runtergeladenen Bild- bzw. Metadaten B, D sichergestellt.

Mit dem Wissen, zu welchem Zeitpunkt Z wie viele Personen 4 vorhanden sind und/oder welche Zeitpunkte Z die wenigsten Personen 4 enthalten, kann bei einer Erfüllung aller Bedingungen (Pmax und tmin) das dazugehörige Einzelbild B von der Bildauswahleinrichtung 8 geladen werden. Basierend auf dem eingestellten Zeitbereich, wird vorgeschlagen zu verschiedenen - z.B. zufällig ausgewählt und/oder mit gleichen Abstand - Zeitpunkten Z, ein Frame jeweils an Metadaten D runtergeladen wird. Die Zeitpunkte Z werden von der

Bildauswahleinrichtung 8 anhand der zugehörigen Personenanzahl P sortiert und mindestens ein oder mehrere Bilder B (B <= Z) mit einer geringen

Personenanzahl P, vorzugweise 0 bewegte Personen 4 in dem zugehörigen Einzelbild B, abgegriffen. Die abgegriffenen Einzelbilder B haben vorzugweise keine oder wenige detektierte/bewegte Personen/Objekte.

In einem dritten Schritt S3 wird zu jedem Zeitpunkt Z (1 bis N) das

korrespondierende Einzelbild B von der Kamera 5 geladen und mit seinem bereits vorhandenen Metadaten D in der Datenbank 9 als Analysedaten A zusammengefasst. Dies kann beispielsweise iterativ erfolgen, da es nicht notwendig, dass alle entsprechenden Einzelbilder B gleich am Anfang geladen werden müssen.

In einem vierten Schritt S4 werden die in der Datenbank 9 hinterlegten

Datensätze in einer Schleife abgearbeitet. Dabei wird zu einem bestimmten Zeitpunkt Z das dazugehörige Einzelbild B und die dazugehörigen Metadaten D aus der Datenbank 9 geladen und dem weiteren Prozess bzw. der

Personenidentifizierungseinrichtung 10 zur Verfügung gestellt.

In einem fünften Schritt S5 werden durch eine Überlagerung des Einzelbildes B mit den zugehörigen Metadaten D die identifizierten Personen PI, P2 als die Bildabschnitte Al in dem Einzelbild B durch das Maskierungsmodul 11 markiert. Dabei werden die Bildabschnitte A beispielsweise als rechteckige Kästchen dargestellt, welche um einen definierten Prozentsatz, z. B. um 20% vergrößert, größer sind als die abgebildeten Personen PI, P2 selbst. Dadurch wird eine wahrscheinlichere Kompletteingrenzung eines Personenbereiches erreicht. Beispielsweise kann die Größe der Kästchen variabel eingestellt werden. Die Bildabschnitte Al werden anschließend im System vermerkt und dem

Folgeprozess zur Verfügung gestellt. Wie in diesem Beispiel ersichtlich, existieren für die sitzende Person P3 keine Metadaten D, sodass folglich das Maskierungsmodul 11 diese nicht markieren wird.

Hierzu ist ein parallelgeschalteter sechster Schritt S6 vorgesehen, wobei das aktuell Einzelbild B aus der Datenbank 9 parallel zu dem fünften Schritt S5 dem Kl-Modul 12 übergeben wird und mittels Deep-Learning prozessiert wird. Als Ergebnis erhält man eine pixelweise Klassifizierung in dem Einzelbild B, wo sich die Personen PI, P3 befinden. Diese werden als weitere Bildabschnitte A2 (weitere rechteckige Kästchen) in dem Einzelbild B markiert. Die weiteren Bildabschnitte A2 werden anschließend im System vermerkt und dem

Folgeprozess zur Verfügung gestellt. Wie in diesem Beispiel ersichtlich, wird im Vergleich zu dem fünften Schritt S5 die sitzende Person P3 erkannt jedoch die Person P2 im Randbereich des Einzelbildes B nicht. Beispielsweise können zu den Schritten S5 und S6 weitere parallele Schritte existieren, die Personen und/oder bestimmte Objektklassen in dem Einzelbild erkennen um später sicherzustellen, dass diese aus dem Hintergrundbild entfernt sind.

In einem siebten Schritt S7 wird eine Kopplung und/oder eine Überlagerung der markierten Bildabschnitte Al, A2 durch die Personenidentifizierungseinrichtung 10 durchgeführt. Dabei werden alle markierten Bildabschnitte Al, A2, wo sich sehr wahrschleich die Personen PI, P2, P3 befinden, in einem gemeinsamen Maskenbild M zusammengefasst.

In einem achten Schritt S8 wird das Maskenbild M einem Puffer bzw. Bildstapel BS hinzugefügt. Anschließend werden die Schritte S4 bis S8 solange wiederholt, bis alle oder genügend Einzelbilder B aus der Datenbank 9 bearbeitet wurden um im folgenden Schritt S9 mögliche Fehler oder nicht erkannte Personen/Objekte herauszurechnen. Falls nicht genügend Einzelbilder B ohne bewegte

Personen/Objekte in den Bildabschnitten Al, A2 vorhanden sind, muss Schritt S4 wiederholt werden und die Anzahl der Zeitpunkte Z in dem zweiten Schritt S2 erhöht und/oder der Zeitbereich vergrößert werden und somit die spätere Anzahl der Einzelbilder B erhöht werden.

In dem neunten Schritt S9 kann durch einen Vergleich aller Maskenbilder M des Bildstapels BS und durch Berechnung eines Median- oder Mittelwertbildes, wie bereits zuvor beschrieben, das privatsphärenkonforme Hintergrundbild H berechnet werden. Dabei werden die mit den Personen PI, P2, P3 markierten Bildabschnitte Al, A2 durch korrespondierende Bildabschnitte A , A2‘ ohne Personen ersetzt. Dieses Hintergrundbild kann mit hoher Wahrscheinlichkeit als ein privatsphärenkonformes Hintergrundbild der Szene angesehen werden da mittels mehreren Wiederholungen der Prozessschritte S4 bis S8 sehr wahrscheinlich keine Personen mehr in dem Hintergrundbild H dargestellt sind.

Das vorgeschlagene Verfahren verwendet somit die Öffnungszeiten des Geschäfts, die optischen Aufzeichnungen der Kameras 5, sowie ein oder mehrere cloudbasierte Einzelbildverfahren basierend auf einem Deep-Learning und/oder ein Medianbild- oder Mittelwertbild-Verfahren, um sicherzustellen, dass das ausgegebene Hintergrundbild H keine Personen enthält und somit privatsphärenkonform ist.

Claims

Ansprüche

1. Analysevorrichtung (6) zur Analyse von Bilddaten einer Kamera (5), wobei die Bilddaten eine Mehrzahl von Einzelbildern (B) aufweisen, mit einer Personenanzahlbestimmungseinrichtung (7), wobei die

Personenanzahlbestimmungseinrichtung (7) ausgebildet ist, eine

Personenanzahl (P) in den Einzelbildern (B) zu bestimmen, mit einer Bildauswahleinrichtung (8), wobei die Bildauswahleinrichtung (8) ausgebildet ist, auf Basis der Personenzahl (P) Einzelbilder (B) auszuwählen und die ausgewählten Einzelbilder (B) und die zugehörige Personenanzahl (P) als Analysedaten (A) bereitzustellen, mit einer Personenidentifizierungseinrichtung (10), wobei die

Personenidentifizierungseinrichtung (10) ausgebildet ist, Personen (PI, P2, P3) als Bildabschnitte (Al, A2) in den Einzelbildern (B) zu markieren und als

Maskenbilder (M) bereitzustellen, mit einer Bildkombinierungseinrichtung (10), wobei die

Bildkombinierungseinrichtung (10) ausgebildet ist, die markierten Bildabschnitte (Al, A2) durch korrespondierende Bildabschnitte (A , A2‘) ohne Personen zu ersetzen.

2. Analysevorrichtung (6) nach Anspruch 1, dadurch gekennzeichnet, dass eine maximale Personenanzahl (Pmax) in der Bildauswahleinrichtung (8) hinterlegt ist, wobei die Bildauswahleinrichtung (8) ausgebildet ist, die

Einzelbilder (B) auszuwählen, bei denen die zugehörige Personenanzahl (P) kleiner oder gleich der hinterlegten maximalen Personenanzahl (Pmax) ist.

3. Analysevorrichtung (6) nach Anspruch 1 oder 2, dadurch gekennzeichnet, dass die Bildauswahleinrichtung (8) ausgebildet ist, in mindestens einem festgelegten Zeitbereich (TI, T2) mindestens ein Einzelbild (B) auszuwählen.

4. Analysevorrichtung (6) nach Anspruch 2, dadurch gekennzeichnet, dass die Bildauswahleinrichtung (8) ausgebildet ist, mehrere Einzelbilder (B) in dem festgelegten Zeitbereich (TI, T2) zu unterschiedlichen Zeitpunkten (Z) auszuwählen, wobei in der Bildauswahleinrichtung (8) ein minimaler Zeitabstand (Tmin) zwischen den einzelnen Zeitpunkten (Z) hinterlegt ist.

5. Analysevorrichtung (6) nach einem der vorhergehenden Ansprüchen, dadurch gekennzeichnet, dass die Bildkombinierungseinrichtung (13) ausgebildet ist, die markierten Bildabschnitte (Al, A2) in den Maskenbildern (M) durch einen Mittelwert der Farbwerte der entsprechenden Bildabschnitte der weiteren Maskenbilder zu ersetzen.

6. Analysevorrichtung (6) nach Anspruch 5, dadurch gekennzeichnet, dass die Bildkombinierungseinrichtung (13) ausgebildet ist, die mit Personen (PI, P2, P3) markierten Bildabschnitte (Al, A2) bei einer Berechnung des Mittelwertes an der jeweiligen Bildposition der entsprechenden Bildabschnitte der weiteren

Maskenbilder auszuschließen.

7. Analysevorrichtung (6) nach einem der vorhergehenden Ansprüchen, dadurch gekennzeichnet, dass die Personenidentifizierungseinrichtung (10) ein

Maskierungsmodul (11) aufweist, wobei das Maskierungsmodul (11) ausgebildet ist, basierend auf den Analysedaten (A) die zugehörigen Personen (PI, P2, P3) in den zughörigen Einzelbildern (B) als die Bildabschnitte (Al) zu markieren.

8. Analysevorrichtung (6) nach einem der vorhergehenden Ansprüchen, dadurch gekennzeichnet, dass die Personenidentifizierungseinrichtung (10) ein Kl-Modul (12) aufweist, wobei das Kl-Modul (12) ausgebildet ist, die Detektion von Personen in den Einzelbildern (B) zu erlernen und/oder zu verbessern.

9. Analysevorrichtung (6) nach Anspruch 8, dadurch gekennzeichnet, dass die Personenidentifizierungseinrichtung (10) ausgebildet ist, die durch das Maskierungsmodul (11) und/oder durch das Kl-Modul (12) markierten

Bildabschnitte (Al, A2) zusammenzufassen und als das Maskenbild (M) bereitzustellen.

10. Analysevorrichtung (6) nach einem der vorhergehenden Ansprüchen, dadurch gekennzeichnet, dass die Analysevorrichtung (6) eine Datenbank (9) aufweist, wobei die Datenbank (9) ausgebildet ist mindestens eines der

Einzelbilder (B) mit der zugehörigen Personenanzahl (P) und/oder dem zugehörigen Zeitpunkt (Z) als die Analysedaten (A) zu speichern.

11. Überwachungsanordnung (1) zur Überwachung eines

Überwachungsbereichs (2) mit der Analysevorrichtung (6) nach einem der vorhergehenden Ansprüche, gekennzeichnet durch mindestens eine Kamera (5) zur Erfassung des Überwachungsbereiches (2), wobei die Kamera (5) den erfassten Überwachungsbereich (2) als die Bilddaten bereitstellt.

12. Überwachungsanordnung (1) nach Anspruch 11, dadurch gekennzeichnet, dass der Überwachungsbereich (2) als ein Verkaufsraum ausgebildet ist, wobei die Überwachungsanordnung (1) ausgebildet ist, ein Verkaufsverhalten in dem Verkaufsraum zu analysieren.

13. Verfahren zur Bestimmung eines privatsphärenkonformen Hintergrundbildes (H) insbesondere mit der Analysevorrichtung (6) nach einem der Ansprüche 1 bis 10 und/oder mit der Überwachungsanordnung (1) nach Anspruch 11 oder 12, bei dem:

- Bilddaten von mindestens einer Kamera (5) an die Analysevorrichtung (6) übertragen werden, wobei die Bilddaten eine Mehrzahl von Einzelbildern (B) aufweisen;

- eine Personenanzahlbestimmungseinrichtung (7) der Analysevorrichtung (6) eine Personenanzahl (P) in den Einzelbildern (B) bestimmt;

- eine Bildauswahleinrichtung (8) der Analysevorrichtung (6) die Einzelbilder (B) auswählt, bei denen insbesondere eine zugehörige Personenanzahl (P) kleiner oder gleich als eine in der Bildauswahleinrichtung (8) hinterlegte maximale Personenanzahl (Pmax) ist, und als Analysedaten (A) bereitstellt; - eine Personenidentifizierungseinrichtung (10) auf Basis der Analysedaten (A) Personen (PI, P2, P3) als Bildabschnitte (Al, A2) in den Einzelbildern (B) markiert und als Maskenbilder (M) bereitstellt;

- eine Bildkombinierungseinrichtung (10) die markierten Bildabschnitte (Al, A2) durch korrespondierende Bildabschnitte (A , A2‘) ohne Personen ersetzt, sodass ein privatsphärenkonformes Hintergrundbild (H) erzeugt wird.