DE102021117481A1 - Anonymisierung eines strukturierten Datums und Einlernen eines faltenden neuronalen Netzwerks ausgehend von einem anonymisierten strukturierten Datum - Google Patents

Anonymisierung eines strukturierten Datums und Einlernen eines faltenden neuronalen Netzwerks ausgehend von einem anonymisierten strukturierten Datum Download PDF

Info

Publication number
DE102021117481A1
DE102021117481A1 DE102021117481.3A DE102021117481A DE102021117481A1 DE 102021117481 A1 DE102021117481 A1 DE 102021117481A1 DE 102021117481 A DE102021117481 A DE 102021117481A DE 102021117481 A1 DE102021117481 A1 DE 102021117481A1
Authority
DE
Germany
Prior art keywords
structured
datum
neural network
anonymization
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
DE102021117481.3A
Other languages
English (en)
Inventor
Emilie Francis
Patrick Perez
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Valeo Schalter und Sensoren GmbH
Original Assignee
Valeo Schalter und Sensoren GmbH
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Valeo Schalter und Sensoren GmbH filed Critical Valeo Schalter und Sensoren GmbH
Priority to DE102021117481.3A priority Critical patent/DE102021117481A1/de
Publication of DE102021117481A1 publication Critical patent/DE102021117481A1/de
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/82Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/25Determination of region of interest [ROI] or a volume of interest [VOI]

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Evolutionary Computation (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computing Systems (AREA)
  • Databases & Information Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Image Analysis (AREA)

Abstract

Gegenstand der Erfindung ist ein Verfahren (100) zur Anonymisierung eines strukturierten Datums, umfassend: einen Schritt (110) des Einspeisens eines strukturierten Datums am Eingang eines voreingelernten tieffaltenden neuronalen Netzwerks, wobei das strukturierte Datum ein identifizierbares Teildatum umfasst; einen Schritt (120) des Extrahierens von mindestens einem Aktivierungsvolumen, welches von mindestens einer ersten Schicht erzeugt wird, welche das voreingelernte neuronale Netzwerk bildet; einen Schritt (130) des Modifizierens des strukturierten Datums, um ein anonymisiertes strukturiertes Datum zu erzeugen, bei welchem das identifizierbare Teildatum durch ein nicht identifizierbares Teildatum ersetzt wurde; und einen Schritt (140) des Speicherns eines Datensatzes (E), welcher mindestens das anonymisierte strukturierte Datum und das mindestens eine extrahierte Aktivierungsvolumen (50) umfasst.

Description

  • Technisches Gebiet
  • Die vorliegende Erfindung betrifft in allgemeiner Weise die Verarbeitung von strukturierten Daten durch tieffaltende neuronale Netzwerke und insbesondere ein Verfahren zur Anonymisierung eines strukturierten Datums und ein Verfahren zum Einlernen eines tieffaltenden neuronalen Netzwerks ausgehend von einem anonymisierten strukturierten Datum.
  • Allgemeiner Stand der Technik
  • Die tieffaltenden neuronalen Netzwerke sind bis heute sehr leistungsfähige Modelle, um komplexe Operationen an sogenannten strukturierten Daten im Raum und/oder in der Zeit (Bilder, Töne, Videos, medizinische Bildgebung, Positionsbestimmung...) zu erzielen.
  • Auf dem nicht einschränkenden Gebiet der Kraftfahrzeuge, welche mit Fahrassistenzsystemen oder ADAS (angelsächsische Abkürzung für Advanced Driver Assistance Systems) ausgerüstet sind, werden zum Beispiel tieffaltende neuronale Netzwerke verwendet, um die Klassifikation von Bildern oder die Detektion von Objekten (Fußgängern, Fahrzeugen...) oder auch die semantische Segmentierung ausgehend von strukturierten Eingangsdaten, zum Beispiel Bilder, welche von einer in den Kraftfahrzeugen mitgeführten Kamera aufgenommen werden, oder auch von einem mitgeführten Radar oder Lidar gemessene Daten vorzunehmen.
  • Ein neuronales Netzwerk ist ein aus Neuronen (oder Filtern in den etwaigen faltenden Teilen des Netzwerks) zusammengesetztes System, welche in Schichten verteilt sind, welche miteinander derartig verbunden sind, dass der Ausgang einer gegebenen Schicht dem Eingang der nächsten Schicht entspricht. Im Einsatz empfängt jeder Filter von jeder faltenden Schicht am Eingang Daten und wandelt sie um. Bei einer nicht faltenden Schicht ist jedes Neuron in einer verborgenen Schicht vollständig mit allen Neuronen der vorhergehenden Schicht verbunden, nutzen die Neuronen einer gleichen Schicht überhaupt keine Verbindung gemeinsam und arbeiten auf voneinander völlig unabhängige Weise. Ein herkömmliches neuronales Netzwerk kann somit nur einen Datenvektor am Eingang empfangen und ist so für die Verarbeitung von großformatigen Bildern nicht sehr geeignet, welche eine zu große Anzahl von Verbindungen zwischen einem Neuron einer gegebenen Schicht und den Neuronen einer vorhergehenden Schicht erfordern würde.
  • Anders im Fall eines tieffaltenden neuronalen Netzwerks weist jede verborgene faltende Schicht Neuronen auf, welche gemäß drei Dimensionen (Breite, Höhe und Tiefe) im Fall von zweidimensionalen Eingangsdaten angeordnet sind, wie beispielsweise Bilder, wobei die Neuronen von einer Schicht nur mit einem kleinen Bereich der Schicht verbunden sind, welche ihr vorangeht. Diese Art von neuronalem Netzwerk ist viel besser für die Verarbeitung eines Farbbildes geeignet, welches durch ein Eingangsvolumen dargestellt werden kann, dessen Breite und Höhe der Größe des Bildes entspricht und dessen Tiefe auf den Wert 3 festgelegt ist, welcher entsprechend den drei Farbkanälen Rot, Grün und Blau entspricht. Jede Schicht wird das Volumen, welches sie am Eingang empfängt, in ein Ausgangsvolumen zur sogenannten Aktivierung der Neuronen umwandeln (auch bekannt unter der angelsächsische Bezeichnung „feature maps“, was Aktivierungskarte oder Merkmalskarte bedeutet). In dem Fall, dass die Schicht der allerersten Schicht eines faltenden neuronalen Netzwerks entspricht, welches zur Verarbeitung eines Farbbildes geeignet ist, empfängt diese erste Schicht als Eingangsdaten das Eingangsvolumen der Tiefe 3, welches diesem Farbbild entspricht, und gibt am Ausgang ein Aktivierungsvolumen aus, welches für die Umwandlung repräsentativ ist, welche von der ersten Schicht erzielt wurde. In ähnlicher Weise empfängt jede faltende Zwischenschicht des Netzwerks am Eingang das Aktivierungsvolumen, welches von der vorhergehenden Schicht ausgegeben wird, und gibt am Ausgang sein eigenes Aktivierungsvolumen, welches für die durch diese Zwischenschicht erzielte Umwandlung repräsentativ ist, in Abhängigkeit von den durch diese Schicht erzielten linearen und nicht linearen Kombinationen (Aktivierungsfunktionen) aus. 1 veranschaulicht schematisch dieses Prinzip für ein tieffaltendes neuronales Netzwerk 1, welches eingelernt ist, um am Ausgang 2 eine Vorhersage (Klassifikation von Bildern oder Detektion von Objekten oder auch semantische Segmentierung) ausgehend von einem Bild 3 auszugeben, welches es am Eingang empfängt. 1 veranschaulicht insbesondere ein Beispiel für ein am Ausgang einer der (nicht dargestellten) Schichten des Netzwerks erlangtes Aktivierungsvolumen 4, dessen Tiefe gleich 5 ist (mit anderen Worten umfasst das Volumen hier einen Stapel von fünf zweidimensionalen Matrizen von Werten, welche für die Umwandlung repräsentativ sind, für welche die Schicht eingelernt worden ist).
  • Die Werte der den Neuronen jeder Schicht zugeordneten Gewichtigkeiten werden während einer sogenannten tiefen Einlern- oder Lernphase erlernt. Das Lernen kann unbeaufsichtigt oder beaufsichtigt sein. In diesem letzteren Fall werden die Werte der Gewichtigkeiten der Schichten nach dem Prinzip der Fehlerrückführung erlernt, bis eine Antwort des neuronalen Netzwerks erhalten wird, welche bestenfalls den gewünschten Antworten für die Gesamtheit der Einlernbeispiele entspricht.
  • In Anbetracht der Tatsache, dass ein tieffaltendes neuronales Netzwerk eine sehr große Anzahl von Neuronen umfasst, deren Gewichtigkeiten man am Ende der Einlernphase erstarren lassen muss, macht es die Einlernphase erforderlich, am Eingang eines einzulernenden Netzwerks eine große Anzahl von Eingangsdaten, zum Beispiel Bilder, einzuspeisen, bevor dieses faltende neuronale Netzwerk als einsatzbereit angesehen werden kann (in diesem Fall werden die Schichten des neuronalen Netzwerks eingefroren genannt, oder anders ausgedrückt sind die mit den Neuronen verknüpften Gewichtigkeiten ein für alle Mal festgelegt).
  • Es bestehen bereits zu Zwecken des Einlernens oder von Tests von tieffaltenden neuronalen Netzwerken Bibliotheken mit öffentlichem Zugang, welche eine große Anzahl von Eingangsdaten bereitstellen, zum Beispiel Bilder von Straßenszenen.
  • Diese Bereitstellung von Daten, sei es in Form einer Bibliothek mit Online-Zugang unter Verwendung einer Internetadresse oder in beliebiger anderer Form, muss darüber hinaus die Vorschriften bezüglich des Schutzes personenbezogener Daten einhalten. So schreibt zum Beispiel die europäische Verordnung RGPD EU 2016/679 vom 27. April 2016 vor, dass strukturierte Daten, welche Informationen umfassen, welche eine Identifikation (zum Beispiel das Gesicht von Personen oder Nummernschilder von Fahrzeugen, welche auf einer Fotografie erscheinen können, oder GPS-Standortdaten) ermöglichen, nicht ohne die ausdrückliche Zustimmung der Personen, welche identifiziert werden können, öffentlich verbreitet werden dürfen.
  • Um den Anforderungen dieser Vorschriften gerecht zu werden, haben sich bestimmte über das Internet zugängliche Plattformen entschlossen, die ursprünglichen strukturierten Daten zu übermitteln, während gleichzeitig jedem das Recht eingeräumt wird, jegliche Daten löschen zu lassen, für die er nicht seine Zustimmung gegeben hat. Diese Art von Vorgang erfordert allerdings ein Überprüfungsverfahren für jeden Löschungsantrag. Außerdem gibt es zu dem Zeitpunkt, zu dem eine Person von ihrem Widerrufsrecht Gebrauch macht, keine Garantie dafür, dass die betreffenden Daten nicht bereits verbreitet oder gar vervielfältigt worden sind.
  • Das Dokument mit dem Titel „Privacy-Preserving Machine Learning: Threats and solutions“ (Mohammad Al-Rubaie et al, IEEE Security & Privacy - March-April 2019, Seiten 49-58, Band 17) stellt eine umfassende Analyse der in Bezug auf das Privatleben verbundenen Herausforderungen und Risiken für das automatische Einlernen vor und schlägt einige Lösungen vor. Die vorgeschlagenen Lösungen sind jedoch sehr rechenintensiv oder beruhen auf komplexen Verschlüsselungsprotokollen.
  • Das Dokument mit dem Titel „Solving Artificial Intelligence's Privacy Problem“ (Yves-Alexandre de Montjoye et al., Field Actions Science Reports, Special Issue 17/2017, Seiten 80-83) ist eine Studie über Technologien zur Verbesserung des Datenschutzes für die KI und das automatische Einlernen. Insbesondere führt es die Idee ein, die Daten nicht zu verbreiten, sondern die Algorithmen lokal auszuführen. Allerdings sind die vorgeschlagenen Lösungen nicht offen für alle, benötigen eine für alle zugeschnittene und kostenlose Infrastruktur und können daher nur von den Regierungen unterstützt werden.
  • Schließlich nehmen andere Plattformen, welche strukturierte Daten verbreiten, eine Anonymisierung der strukturierten Daten vor, das heißt eine vorhergehende Modifikation des Inhalts der strukturierten Daten, welche darin besteht, die eine Identifizierung ermöglichenden Teile der einzelnen Daten zu löschen, zu verdecken oder zu zerhacken, bevor sie bereitgestellt werden. Zum Beispiel wird jedes Bild derartig modifiziert, dass jedes auf dem Bild erscheinende Gesicht oder Nummernschild unscharf gemacht wird. Nur die anonymisierten Daten werden dann bereitgestellt. Jede Phase zum Einlernen oder zur Einstellung eines tieffaltenden neuronalen Netzwerks ausgehend von dieser Art von beschädigten Daten ist jedoch nicht optimal. Wenn zum Beispiel erwünscht ist, ein neuronales Netzwerk zu entwickeln, welches in der Lage ist, Fußgänger zu detektieren, ist leicht zu verstehen, dass die Tatsache, dieses Netzwerk ausgehend von Bildern, auf welchen alle Gesichter unscharf gemacht oder verdeckt worden sind, einzulernen, die Optimierung der Antwort des Netzwerks, sobald es eingesetzt wird, als schwierig gestalten kann. Mit anderen Worten läuft jedes neuronale Netzwerk, welches ausgehend von dieser Art von anonymisierten strukturierten Daten eingelernt werden würde, später Gefahr, unzuverlässige Ergebnisse bei realen Daten zu liefern.
  • Zusammenfassung der Erfindung
  • Aufgabe der vorliegenden Erfindung ist es, die Beschränkungen des Standes der Technik zu beheben, indem eine Lösung vorgeschlagen wird, welche es ermöglicht, anonymisierte strukturierte Daten zu verbreiten, um den Anforderungen der Vorschriften hinsichtlich des Schutzes personenbezogener Daten gerecht zu werden, ohne die Phasen zum Lernen/Einlernen von faltenden neuronalen Netzen, welche auf der Benutzung dieser modifizierten strukturierten Daten basieren, zu verschlechtern.
  • Folglich ist der Gegenstand der vorliegenden Erfindung ein Verfahren zur Anonymisierung eines strukturierten Datums, wobei das Verfahren zur Anonymisierung umfasst:
    • - einen Schritt des Einspeisens eines strukturierten Datums am Eingang eines voreingelernten tieffaltenden neuronalen Netzwerks von bekannter Struktur, wobei das strukturierte Datum ein identifizierbares Teildatum umfasst;
    • - einen Schritt des Extrahierens von mindestens einem Aktivierungsvolumen, welches durch eine erste Schicht oder eine Folge von ersten Schichten, welche das voreingelernte tieffaltende neuronale Netzwerk bildet, erzeugt wird;
    • - einen Schritt des Modifizierens des strukturierten Datums, um ein anonymisiertes strukturiertes Datum zu erzeugen, bei welchem das identifizierbare Teildatum durch ein nicht identifizierbares Teildatum ersetzt worden ist;
    • - einen Schritt des Speicherns eines Datensatzes, welcher mindestens das anonymisierte strukturierte Datum und das mindestens eine extrahierte Aktivierungsvolumen umfasst.
  • Bei einer möglichen Umsetzung der Erfindung ist das strukturierte Datum ein von einer Kamera aufgenommenes Bild.
  • Bei einer möglichen Umsetzung der Erfindung umfasst der Schritt des Modifizierens ein Verdecken oder ein Unscharfmachen des identifizierbaren Teildatums.
  • Bei einer möglichen Umsetzung der Erfindung entspricht das mindestens eine extrahierte Aktivierungsvolumen dem durch die erste Schicht oder Folge von ersten Schichten erzeugten Aktivierungsvolumen, welches der Gesamtheit des strukturierten Datums entspricht.
  • Als Variante entspricht das mindestens eine extrahierte Aktivierungsvolumen dem durch die ersten Schicht oder Folge von ersten Schichten erzeugten Aktivierungsvolumen, welches lediglich dem identifizierbaren Teildatum entspricht.
  • In diesem letzteren Fall umfasst der im Schritt des Speicherns gespeicherte Datensatz außerdem eine Information, welche es ermöglicht, in dem anonymisierten strukturierten Datum die Position des nicht identifizierbaren Teildatums zu lokalisieren.
  • Bei einer möglichen Umsetzung der Erfindung umfasst der im Schritt des Speicherns gespeicherte Datensatz außerdem Informationen, welche für die für die Neuronen der ersten Schicht oder der Folge von ersten Schichten, welche das voreingelernte tieffaltende neuronale Netzwerk bildet, verwendeten Gewichtigkeiten repräsentativ sind.
  • Bei einer möglichen Umsetzung der Erfindung umfasst das Verfahren außerdem einen Schritt des Bereitstellens des Datensatzes.
  • Gegenstand der Erfindung ist auch ein Verfahren zum Einlernen eines tieffaltenden neuronalen Netzwerks, bei welchem ein strukturiertes Datum am Eingang des tieffaltenden neuronalen Netzwerks eingespeist wird, dadurch gekennzeichnet, dass es einen vorhergehenden Schritt umfasst, während dessen ein durch das Verfahren zur Anonymisierung nach einem der Ansprüche 1 bis 8 erhaltener Datensatz wiedererlangt wird, wobei der Datensatz mindestens ein anonymisiertes strukturiertes Datum und mindestens ein zugeordnetes extrahiertes Aktivierungsvolumen umfasst.
  • Figurenliste
  • Die Erfindung wird durch die nachfolgende Beschreibung unter Bezugnahme auf die beigefügten Figuren verdeutlicht, in welchen:
    • - 1, welche bereits vorstehend beschrieben wurde, ein Beispiel für ein Aktivierungsvolumen schematisch veranschaulicht, welches am Ausgang einer faltenden Schicht eines tieffaltenden neuronalen Netzwerks erhalten wird, welches am Eingang ein Bild empfängt;
    • - 2 bei einem Verfahren zur Anonymisierung gemäß der vorliegenden Erfindung umgesetzte mögliche Schritte zeigt;
    • - 3 ein Beispiel für die Erzeugung eines Teil-Aktivierungsvolumens durch ein voreingelerntes faltendes neuronales Netzwerk schematisch veranschaulicht, welches ein nicht anonymisiertes Bild empfängt;
    • - 4 ein Beispiel für ein nicht anonymisiertes strukturiertes Datum, auf welches das Verfahren zur Anonymisierung von 2 angewendet wird, und ein Beispiel für einen entsprechenden Satz anonymisierter Daten schematisch veranschaulicht, welcher am Ende dieses Verfahrens zur Anonymisierung erhalten wird;
    • - 5 mögliche Schritte für ein Verfahren zum Einlernen eines tieffaltenden neuronalen Netzwerks gemäß der Erfindung schematisch veranschaulicht;
    • - 6 die Verwendung eines neuronalen Netzwerks zum Einlernen der Komponenten des beispielhaft in 4 angegeben Satzes schematisch veranschaulicht.
  • Beschreibung einer Ausführungsform/von Ausführungsformen
  • Die Erfindung beruht stets auf dem Prinzip, jedes strukturierte Datum vorab zu anonymisieren, indem die Teile, welche geeignet sind, eine Identifizierung zu ermöglichen, gelöscht, verdeckt oder verschwommen gemacht werden (allgemeiner, anonymisiert werden) bevor sie bereitgestellt werden, schlägt jedoch außerdem vor, die Verbreitung dieser anonymisierten strukturierten Daten mit zusätzlichen Informationen zu verknüpfen, welche durch einen Menschen nicht interpretierbar sind und nicht verwendet werden können, um Identifizierungsinformationen wiederherzustellen, sondern welche stets direkt verwendet werden können, um ein tieffaltendes neuronales Netzwerk einzulernen.
  • Genauer gesagt schlägt die Erfindung vor, lokal ein bereits eingelerntes tieffaltendes neuronales Netzwerk (im Folgenden „voreingelerntes neuronales Netzwerk“ genannt) zu verwenden, dessen Struktur der Schichten bekannt ist (einschließlich der jedem Neuron zugeordneten Gewichtigkeiten). Die lokale Verwendung besteht darin, am Eingang dieses voreingelernten neuronalen Netzwerks jedes strukturierte Rohdatum (das heißt ohne vorherige Modifikation, welche darauf abzielt, die strukturierten Daten zu anonymisieren) einzuspeisen und für jedes strukturierte Rohdatum mindestens ein am Ausgang einer ersten Schicht oder einer Folge von ersten Schichten dieses voreingelernten neuronalen Netzwerks erhaltenes Aktivierungsvolumen zu extrahieren.
  • Es ist nun möglich, jedes mit dem mindestens einen extrahierten Aktivierungsvolumen verknüpfte anonymisierte strukturierte Datum mit jedem Mittel (zum Beispiel über eine über das Internet zugängliche Datenbank) öffentlich zu verbreiten, ohne gegen die Anforderungen der Vorschrift über den Schutz der individuellen Daten zu verstoßen. Tatsächlich sind das oder die mit dem voreingelernten neuronalen Netzwerk erhaltenen Aktivierungsvolumen keine Daten mehr, welche geeignet sind, zu Identifizierungszwecken interpretiert oder verwendet zu werden. Sie enthalten jedoch Informationen auf niedrigem Niveau, welche verwendet werden können, um ein anderes tieffaltendes neuronales Netz einzulernen, dessen erste Schicht oder Folge von ersten Schichten mit jenen des voreingelernten neuronalen Netzwerks kompatibel wäre.
  • Ein Beispiel für ein Verfahren 100 zur Anonymisierung eines strukturierten Datums gemäß einer möglichen Umsetzung der Erfindung wird nunmehr in Bezug auf die 2 bis 4 erläutert. Zur Vereinfachung wird die Erfindung in dem nicht einschränkenden Fall beschrieben, dass die strukturierten Daten von einer Kamera oder einem Fotoapparat aufgenommene Bilder sind.
  • 3 veranschaulicht schematisch ein voreingelerntes neuronales Netzwerk 5, welches am Eingang ein strukturiertes Datum in Form eines Bildes 3 empfängt (Schritt 110 in 2). Das Bild 3 ist ein Rohbild (d.h. nicht anonymisiert) und umfasst in dem Beispiel eine im Folgenden „identifizierbares Teildatum“ genannte Zone 30, in welcher ein Gesicht sichtbar ist. Das neuronale Netzwerk 5 ist ein tieffaltendes neuronales Netzwerk, welches bereits für eine gegebene Aufgabe (zum Beispiel die Detektion von Fußgängern) eingelernt worden ist. Mit anderen Worten sind zumindest die erste faltende Schicht oder eine Folge von ersten faltenden Schichten, welche dieses voreingelernte neuronale Netzwerk 5 bildet, festgelegt und eingefroren, das heißt insbesondere, dass die für die Neuronen dieser Schichten verwendeten Gewichtigkeiten bekannt und endgültig sind. Wenn das Bild 3 am Eingang dieses voreingelernten Netzwerks 5 eingespeist wird, erzeugt dieses letztere im Bereich der Schichten somit Aktivierungsvolumen. Im Mittelpunkt steht dabei mindestens ein Aktivierungsvolumen, welches unmittelbar am Ausgang einer ersten Schicht oder einer Folge von ersten Schichten des voreingelernten neuronalen Netzwerks 5 erzeugt wird, zum Beispiel das in 3 schematisch dargestellte Aktivierungsvolumen 50. In dem dargestellten Beispiel entspricht dieses Aktivierungsvolumen 50 vorteilhafterweise lediglich dem identifizierbaren Teildatum 30. In einer nicht dargestellten Variante könnte das Aktivierungsvolumen 50 dem erzeugten Aktivierungsvolumen entsprechen, welches dem gesamten Bild 3 entspricht.
  • Das Verfahren 100 zur Anonymisierung setzt sich gemäß der Erfindung mit dem Extrahieren dieses mindestens einen Aktivierungsvolumens 50 fort (Schritt 120). Das extrahierte Aktivierungsvolumen wird dann in einem (nicht dargestellten) Speicher gespeichert.
  • Das Verfahren 100 zur Anonymisierung setzt sich mit einem herkömmlichen Schritt 130 fort, welcher darin besteht, das strukturierte Datum 3 zu modifizieren, um ein anonymisiertes strukturiertes Datum 3' zu erzeugen, bei welchem das identifizierbare Teildatum 30 durch ein nicht identifizierbares Teildatum 31 ersetzt worden ist (siehe 4). In dem Fall, dass das strukturierte Datum 3 ein Bild ist, kann der Schritt 130 des Modifizierens ein Verdecken oder ein Unscharfmachen des identifizierbaren Teildatums 30 oder jeden bekannten Vorgang umfassen, welcher es ermöglicht, das Teildatum 31 nicht interpretierbar zu machen. Es ist darauf hinzuweisen, dass der Schritt 130 gleichermaßen vor den Schritten 110 und 1220 oder parallel zu diesen Schritten 110, 120 oder, wie es dargestellt ist, nach diesen Schritten 110, 120 ausgeführt werden kann.
  • Es ist dann möglich, während eines Schritts 140 einen Datensatz E zu speichern, welcher das aus dem Schritt 130 stammende anonymisierte strukturierte Datum 3', das bei dem Schritt 120 extrahierte mindestens eine Aktivierungsvolumen 50 und eine Information umfasst, welche es ermöglicht, die Position des nicht identifizierbaren Teildatums 31 in dem anonymisierten strukturierten Datum 3' zu lokalisieren.
  • Bei einer nicht dargestellten Variante kann der Satz E, wenn das erzeugte Aktivierungsvolumen 50 jenes ist, welches dem gesamten Bild 3 entspricht, lediglich dieses Aktivierungsvolumen und das aus Schritt 130 stammende anonymisierte strukturierte Datum 3' umfassen.
  • Der bei dem Schritt 140 des Speicherns gespeicherte Datensatz E kann auch vorzugsweise außerdem Informationen umfassen, welche für die für die Neuronen der ersten Schicht oder der Folge von ersten Schichten, welche das voreingelernte tieffaltende neuronale Netzwerk 5 bildet, verwendeten Gewichtigkeiten repräsentativ sind.
  • Bei dem dargestellten Beispiel umfasst das Bild 3 nur ein einziges identifizierbares Teildatum 30. Selbstverständlich kann das Verfahren auf eine beliebige Anzahl von in einem Bild 3 vorhandenen identifizierbaren Teildaten angewendet werden, so dass in Bezug auf Schritt 140 eine entsprechende Anzahl von Sätzen E für ein und dasselbe Originalbild 3 gespeichert werden kann.
  • Der oder die Datensätze E können jetzt in welcher Weise auch immer bereitgestellt werden, während gleichzeitig die Vorschriften über den Schutz der individuellen Daten beachtet werden (Schritt 150 der 2).
  • Dank dem Verfahren 100 zur Anonymisierung gemäß der Erfindung ist es nur ein einziges Mal erforderlich, auf die ursprünglichen Identifikationsinformationen zuzugreifen, um mit dem voreingelernten Netzwerk 5 das oder die relevanten Aktivierungsvolumen 50 lokal zu erzeugen. Die strukturierten Daten 3 können dann entweder vernichtet oder sicher aufbewahrt, jedoch nicht verbreitet werden.
  • Die bereitgestellten Sätze E können dann benutzt werden, um jedes beliebige tieffaltende neuronale Netzwerk mit einem geringen, ja sogar keinem Leistungsverlust einzulernen, vorausgesetzt jedoch, dass zum Zeitpunkt der Ausführung einer Lernphase mit Hilfe eines anonymisierten strukturierten Datums die erste Schicht oder eine Folge von ersten Schichten dieses Netzwerks mit der ersten Schicht oder der Folge von ersten Schichten des voreingelernten Netzwerks 5 kompatibel ist, welches dazu gedient hat, die oben genannten Sätze E zu produzieren.
  • So beginnt, wie es unter Bezugnahme auf 5 erläutert wird, ein Verfahren 200 zum Einlernen eines tieffaltenden neuronalen Netzwerks, wie beispielsweise jenes, welches schematisch mit dem Bezugszeichen 6 in 6 dargestellt ist, mit einem vorangehenden Schritt 210, bei welchem mindestens ein durch das Verfahren 100 zur Anonymisierung erhaltener Datensatz E wiedererlangt wird. Wie es vorstehend erläutert wurde, umfasst ein derartiger Satz E mindestens ein anonymisiertes strukturiertes Datum 3' und das entsprechende Aktivierungsvolumen 50. Wie es in 6 schematisch veranschaulicht ist, kann dann das anonymisierte strukturierte Eingangsdatum 3' am Eingang des einzulernenden Netzwerks 6 eingespeist werden (Schritt 220 in 5), während das Aktivierungsvolumen 50 am Eingang einer Zwischenschicht 7 des einzulernenden Netzwerks 6 eingespeist wird (Schritt 230). Diese Zwischenschicht 7 ist die erste Schicht einer Folge 8 von Schichten, welche in dem Netzwerk 6 einzulernen verbleibt. Ihr geht darüber hinaus eine Schicht oder Folge 9 von Schichten voraus, welche mit der von dem voreingelernten Netzwerk 5 verwendeten ersten Schicht oder Folge von ersten Schichten kompatibel sein muss und welche somit im Verlauf des Einlernens nicht modifiziert wird. Um die Kompatibilität zu gewährleisten, werden die Gewichtigkeiten der von dem voreingelernten Netzwerk 5 verwendeten ersten Schichten ebenfalls in den Satz E übertragen.
  • In Bezug auf die bekannten Lösungen, welche darin bestehen, nicht anonymisierte strukturierte Daten zu verbreiten und jedem zu erlauben, nachträglich die Löschung zu beantragen, machen die Verfahren 100 und 200 den Datenerfassungsvorgang sehr viel einfacher und längerfristig.
  • In Bezug auf Verschlüsselungs- oder staatliche Kontrollansätze ist die Lösung der Erfindung hinsichtlich Rechen- und Infrastrukturressourcen viel erschwinglicher.
  • Schließlich erfordert die Erfindung in Bezug auf die Lösungen, welche sich für eine begrenzte Bereitstellung der anonymisierten strukturierten Daten entschieden haben, keinen Kompromiss zwischen Leistung, Verbreitung einerseits und Datenschutz andererseits.
  • Der von der vorliegenden Erfindung vorgeschlagene Ansatz ist darüber hinaus sehr flexibel: zum Beispiel können je nach Art des voreingelernten Netzwerks 5, welches benutzt wird, um das Verfahren zur Anonymisierung 100 umzusetzen, unterschiedliche Arten von Aktivierungsvolumen für unterschiedliche Arten von Aufgaben (zum Beispiel die Detektion von Fußgängern, semantische Segmentierung, Abschätzung der Tiefe usw.) bereitgestellt werden, um sicherzustellen, dass die Beschränkung, welche dem Einfrieren der ersten Schicht (oder der Folge von ersten Schichten) entspricht, keinen zu großen Einfluss auf die Endleistung eines gemäß dem Verfahren 200 eingelernten neuronalen Netzwerks hat, welche etwas besser sein könnte, wenn sie nicht eingefroren wäre. Jeder externe Benutzer (derjenige, welcher das Verfahren 200 umsetzt) könnte darüber hinaus zu jedem Zeitpunkt bei dem Eigentümer der Daten (derjenige, welcher das Verfahren 100 zur Anonymisierung umsetzt) anfragen, neue Aktivierungsvolumen mittels anderer erstarrter Schichten für neue Aufgaben zu liefern.

Claims (9)

  1. Verfahren (100) zur Anonymisierung eines strukturierten Datums (3), wobei das Verfahren zur Anonymisierung umfasst: - einen Schritt (110) des Einspeisens eines strukturierten Datums (3) am Eingang eines voreingelernten tieffaltenden neuronalen Netzwerks (5) von bekannter Struktur, wobei das strukturierte Datum (3) ein identifizierbares Teildatum (30) umfasst; - einen Schritt (120) des Extrahierens von mindestens einem Aktivierungsvolumen (50), welches durch eine erste Schicht oder eine Folge von ersten Schichten, welche das voreingelernte tieffaltende neuronale Netzwerk (5) bildet, erzeugt wird; - einen Schritt (130) des Modifizierens des strukturierten Datums, um ein anonymisiertes strukturiertes Datum (3') zu erzeugen, bei welchem das identifizierbare Teildatum (30) durch ein nicht identifizierbares Teildatum (31) ersetzt worden ist; - einen Schritt (140) des Speicherns eines Datensatzes (E), welcher mindestens das anonymisierte strukturierte Datum (3') und das mindestens eine extrahierte Aktivierungsvolumen (50) umfasst.
  2. Verfahren (100) zur Anonymisierung nach Anspruch 1, bei welchem das strukturierte Datum (3) ein von einer Kamera aufgenommenes Bild ist.
  3. Verfahren (100) zur Anonymisierung nach Anspruch 2, wobei der Schritt (130) des Modifizierens ein Verdecken oder ein Unscharfmachen des identifizierbaren Teildatums (30) umfasst.
  4. Verfahren (100) zur Anonymisierung nach einem der vorhergehenden Ansprüche, bei welchem das mindestens eine extrahierte Aktivierungsvolumen (50) dem durch die erste Schicht oder Folge von ersten Schichten erzeugten Aktivierungsvolumen entspricht, welches der Gesamtheit des strukturierten Datums (3) entspricht.
  5. Verfahren (100) zur Anonymisierung nach einem der Ansprüche 1 bis 3, bei welchem das mindestens eine extrahierte Aktivierungsvolumen (50) dem durch die erste Schicht oder Folge von ersten Schichten erzeugten Aktivierungsvolumen entspricht, welches lediglich dem identifizierbaren Teildatum (30) entspricht.
  6. Verfahren (100) zur Anonymisierung nach Anspruch 5, bei welchem der im Schritt (140) des Speicherns gespeicherte Datensatz (E) außerdem eine Information umfasst, welche es ermöglicht, in dem anonymisierten strukturierten Datum (3') die Position des nicht identifizierbaren Teildatums (31) zu lokalisieren.
  7. Verfahren (100) zur Anonymisierung nach einem der vorhergehenden Ansprüche, bei welchem der im Schritt (140) des Speicherns gespeicherte Datensatz (E) außerdem Informationen umfasst, welche für die für die Neuronen der ersten Schicht oder der Folge von ersten Schichten, welche das voreingelernte tieffaltende neuronale Netzwerk (5) bildet, verwendeten Gewichtigkeiten repräsentativ sind.
  8. Verfahren (100) zur Anonymisierung nach einem der vorhergehenden Ansprüche, welches außerdem einen Schritt (150) des Bereitstellens des Datensatzes umfasst.
  9. Verfahren (200) zum Einlernen eines tieffaltenden neuronalen Netzwerks (6), bei welchem ein strukturiertes Datum am Eingang des tieffaltenden neuronalen Netzwerks (6) eingespeist wird, dadurch gekennzeichnet, dass es einen vorhergehenden Schritt (210) umfasst, während dessen ein durch das Verfahren (100) zur Anonymisierung nach einem der Ansprüche 1 bis 8 erhaltener Datensatz (E) wiedererlangt wird, wobei der Datensatz (E) mindestens ein anonymisiertes strukturiertes Datum (3') und mindestens ein zugeordnetes extrahiertes Aktivierungsvolumen (50) umfasst.
DE102021117481.3A 2021-07-07 2021-07-07 Anonymisierung eines strukturierten Datums und Einlernen eines faltenden neuronalen Netzwerks ausgehend von einem anonymisierten strukturierten Datum Pending DE102021117481A1 (de)

Priority Applications (1)

Application Number Priority Date Filing Date Title
DE102021117481.3A DE102021117481A1 (de) 2021-07-07 2021-07-07 Anonymisierung eines strukturierten Datums und Einlernen eines faltenden neuronalen Netzwerks ausgehend von einem anonymisierten strukturierten Datum

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DE102021117481.3A DE102021117481A1 (de) 2021-07-07 2021-07-07 Anonymisierung eines strukturierten Datums und Einlernen eines faltenden neuronalen Netzwerks ausgehend von einem anonymisierten strukturierten Datum

Publications (1)

Publication Number Publication Date
DE102021117481A1 true DE102021117481A1 (de) 2023-01-12

Family

ID=84534321

Family Applications (1)

Application Number Title Priority Date Filing Date
DE102021117481.3A Pending DE102021117481A1 (de) 2021-07-07 2021-07-07 Anonymisierung eines strukturierten Datums und Einlernen eines faltenden neuronalen Netzwerks ausgehend von einem anonymisierten strukturierten Datum

Country Status (1)

Country Link
DE (1) DE102021117481A1 (de)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180129900A1 (en) 2016-11-04 2018-05-10 Siemens Healthcare Gmbh Anonymous and Secure Classification Using a Deep Learning Network
DE102020007646A1 (de) 2020-12-14 2021-04-29 Daimler Ag Verfahren zur Anonymisierung von Straßenszenen für das Flottenlernen

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180129900A1 (en) 2016-11-04 2018-05-10 Siemens Healthcare Gmbh Anonymous and Secure Classification Using a Deep Learning Network
DE102020007646A1 (de) 2020-12-14 2021-04-29 Daimler Ag Verfahren zur Anonymisierung von Straßenszenen für das Flottenlernen

Similar Documents

Publication Publication Date Title
DE102017220898A1 (de) Verfahren und Vorrichtung zur Klassifizierung einer während der Sicherheitskontrolle zu kontrollierenden Person
EP3086251B1 (de) Benutzer-identifikation
DE60319449T2 (de) Abfangsystem von multimediadokumenten
DE102019005423A1 (de) Raum-Zeit-Speicher- bzw. Ablagenetzwerk zum Lokalisieren eines Zielobjektes in Videocontent
DE102017122655A1 (de) Verfahren zum datenaustausch zwischen einer ip-videokamera und einem server (varianten)
DE112021000392T5 (de) Leistungsfähiges kommentieren der grundwahrheit
DE102020103337A1 (de) Systeme und verfahren zur bereitstellung von zugang zu fahrzeugen unter verwendung biometrischer daten
DE112021005116T5 (de) Abstimmungsbasierter ansatz für differentiell privates föderiertes lernen
DE102020203475A1 (de) Anonymisierungseinrichtung, Überwachungsvorrichtung, Verfahren, Computerprogramm und Speichermedium
DE112021000689T5 (de) Attestierung von neuronalen abläufen
DE112021004808T5 (de) Erkennen von malware durch analyse verteilter telemetriedaten
DE112021005364T5 (de) Abwehr von gezielten datenbankangriffen durch dynamische generierung von honeypot-datenbankantworten
DE112020002155T5 (de) Einwilligung zu gemeinsamen personenbezogenen informationen
DE102017222898A1 (de) Automatisiertes Detektieren von Gefahrensituationen
EP3563261A1 (de) Bitsequenzbasiertes datenklassifikationssystem
DE112021002868T5 (de) Erzeugung von rich descriptor framework zu text unter verwendung vongraphen und strukturellen neuronalen codierern
DE102021117481A1 (de) Anonymisierung eines strukturierten Datums und Einlernen eines faltenden neuronalen Netzwerks ausgehend von einem anonymisierten strukturierten Datum
DE102019205221A1 (de) Anonymisierungseinrichtung, Überwachungsvorrichtung, Verfahren, Computerprogramm und Speichermedium
DE102022211513A1 (de) System und Verfahren zum Verarbeiten einer Datensubjekt-Rechteanforderung unter Verwendung von biometrischem Datenabgleich
DE112018007834T5 (de) Steuervorrichtung, datenanalysesystem, steuerverfahren und computerprogramm
CH716505B1 (de) System und Verfahren zum Bereitstellen von kryptographischer Asset-Transaktionen, Hardware-Genehmigungsterminal, Backend-Server und Computerprogrammprodukt.
DE112022001468T5 (de) Selektives unkenntlichmachen von bildern
DE112021003999T5 (de) Kontextsensitive anomalieerkennung
EP3734557A1 (de) Verfahren zur bereitstellung von trainingsdaten für adaptierbare situationserkennungsalgorithmen sowie verfahren zur automatisierten situationserkennung von betriebssituationen eines fahrzeugs zur öffentlichen personenbeförderung
DE112019002305T5 (de) Pseudonomysierung von positionsdaten

Legal Events

Date Code Title Description
R079 Amendment of ipc main class

Free format text: PREVIOUS MAIN CLASS: G06K0009660000

Ipc: G06V0030194000

R079 Amendment of ipc main class

Free format text: PREVIOUS MAIN CLASS: G06V0030194000

Ipc: G06V0010820000

R163 Identified publications notified