-
Die Erfindung betrifft ein Verfahren zur Anonymisierung von Positionsdaten eines Kraftfahrzeugs gemäß dem Patentanspruch 1.
-
Heutzutage sind Kraftfahrzeuge, wie beispielsweise Personenkraftwagen, Trucks und/oder Lkws, in der Regel mit Navigationssystemen, durch welche Positionsdaten, wie beispielsweise GPS-Daten, erfasst werden. Verarbeitung und Analyse solcher Positionsdaten sind aufgrund einer Zuordenbarkeit nicht anonym und insbesondere personenbezogen.
-
-
Bei bekannten Verfahren besteht häufig ein Restrisiko der Rückverfolgbarkeit.
-
Aufgabe der vorliegenden Erfindung ist es, ein Verfahren zur Anonymisierung von Positionsdaten eines Kraftfahrzeugs bereitzustellen, bei welchem personenbezogene Daten anonymisiert analysiert werden können, beziehungsweise sollen die Daten für eine Weiterverarbeitung nach dem Verfahren anonymisiert bereitgestellt werden können.
-
Diese Aufgabe wird erfindungsgemäß durch den Gegenstand des unabhängigen Patentanspruchs gelöst. Vorteilhafte Ausgestaltungen und Weiterbildungen der Erfindung sind in den abhängigen Patentansprüchen sowie in der Beschreibung und in der Zeichnung angegeben.
-
Ein erfindungsgemäßes Verfahren zur Anonymisierung von Positionsdaten eines Kraftwagens, welcher insbesondere als Personenkraftwagen ausgebildet ist und eine Positionserfassungseinrichtung zum Erfassen der Positionsdaten während einer Fahrt aufweist, umfasst mehrere Schritte.
In einem ersten Schritt erfolgt ein Erheben der einzelnen Positionsdaten durch die Positionserfassungseinrichtung mit einer vorgegebenen Frequenz. In einem zweiten Schritt erfolgt ein Zusammenfassen der einzelnen Positionsdaten zu einem Datensatz. In einem dritten Schritt erfolgt ein Entfernen von Anfangsdaten und/oder Enddaten aus dem Datensatz. In einem vierten Schritt erfolgt ein Einteilen beziehungsweise ein Konnotieren des Datensatzes in Teildatensätze, welche jeweils Positionsdaten einer Teilstrecke umfassen und eine jeweilige Sitzungs-ID beziehungsweise Sitzungs-Identifikationsnummer aufweisen beziehungsweise einer solchen zugeordnet sind. In einem fünften Schritt erfolgt ein Verschieben beziehungsweise Ändern von Zeitstempeln der Positionsdaten, insbesondere eines jeweiligen Teildatensatzes in Abhängigkeit der jeweils zugeordneten Sitzungs-ID. In einem sechsten Schritt erfolgt ein Abgleichen des Datensatzes mit weiteren Datensätzen weiterer Kraftwagen, wobei beim Vorhandensein mehrerer Teildatensätze für eine der Teilstrecken die Teildatensätze gespeichert werden. Sind nicht mehrere Teildatensätze, sondern nur wenige beziehungsweise ein einzelner Teildatensatz für die jeweilige Teilstrecke vorhanden, werden die entsprechenden Datensätze beziehungsweise Teildatensätze verworfen und somit nicht für eine weitere Verarbeitung gespeichert oder vorgehalten.
-
Bei dem Kraftwagen handelt es sich insbesondere um einen Personenkraftwagen, Van und/oder Truck. Die Positionsdaten sind beispielsweise Daten, welche durch ein Satellitennavigationssystem, wie beispielsweise GPS, GLONASS und/oder Galileo, erfasst werden können. Die Positionserfassungseinrichtung ist somit beispielsweise ein Navigationsgerät beziehungsweise Navigationssystem, welches zum Empfang von Satellitennavigationsdaten ausgebildet ist. Ein Datensatz erhält mehrere Positionsdaten, wobei einzelne Positionsdaten zumindest jeweils einen Aufenthaltsort und einen zugehörigen Zeitpunkt umfassen. Der Datensatz beschreibt somit als Sammlung der einzelnen Positionsdaten den zeitlichen Verlauf einer gefahrenen Strecke während der Fahrt des Kraftfahrzeugs. Die Anfangs- und/oder Enddaten sind ein Teilbereich des Datensatzes von Fahrtbeginn und/oder Fahrtende und können ein zeitliches und/oder räumliches Intervall umfassen. Beispielsweise können die ersten und letzten 500 gefahrenen Meter aus dem Datensatz entfernt werden. Der Datensatz, welcher um die Positionsdaten der Anfangs- und Enddaten entfernt wurde, wird im Folgenden in die Teildatensätze unterteilt, beziehungsweise werden einzelne Teile des Datensatzes für die jeweilige eine Sitzungs- beziehungsweise Session-Identifikationsnummer zugeordnet, sodass nicht der ganze Datensatz eine einzelne Sitzungs-Identifikationsnummer aufweist, sondern mehrere zugehörige Sitzungs-Identifikationsnummern. Die Frequenz des Erhebens der Positionsdaten beschreibt ein Zeitintervall, zu welcher jeweils eine Position erfasst wird, beispielsweise kann alle fünf Sekunden eine Position des Kraftfahrzeugs während der Fahrt erfasst werden.
-
Vorzugsweise erfolgen die Schritte 1 bis 5 beispielsweise auf einem Steuergerät des Kraftfahrzeugs beziehungsweise zumindest kraftfahrzeugintern durch eine geeignete elektronische Recheneinrichtung. Der sechste Schritt erfolgt vorteilhafterweise beispielsweise durch eine fahrzeugexterne elektronische Recheneinrichtung, wie beispielsweise ein Server-Backend beispielsweise des Fahrzeugherstellers. Somit ist ein insbesondere hybrides Verfahren zur Anonymisierung von Bewegungsdaten unter Nutzung von Onboard- und Backend-Datenverarbeitung ermöglicht.
-
Dabei ergibt sich bei dem erfindungsgemäßen Verfahren der Vorteil, dass eine Analyse der Positionsdaten datenschutzfreundlich gestaltet werden kann und Fahrten im Backend analysiert werden können, ohne einen Personenbezug herstellen zu können. Dadurch erfolgt eine besonders vorteilhafte Verminderung eines Reidentifikationsrisikos von Positionsdaten beispielsweise durch zeitliche und/oder räumliche Aggregation mittels Insight-Bildung.
-
In vorteilhafter Ausgestaltung der Erfindung sind für das Speichern wenigstens drei Datensätze für eine der Teilstrecken vorhanden. Mit anderen Worten muss, damit die Teildatensätze gespeichert werden, das Vorhandensein mehrerer Teildatensätze erfüllt sein, wobei wenigstens drei Teildatensätze die mehreren Teildatensätze darstellen.
-
In weiterer vorteilhafter Ausgestaltung der Erfindung erfolgt das Abgleichen des Datensatzes mit den weiteren Datensätzen durch eine fahrzeugexterne elektronische Recheneinrichtung, wie beispielsweise einen Backend-Server.
-
In weiterer vorteilhafter Ausgestaltung der Erfindung erfolgt das Entfernen der Anfangsdaten und/oder Enddaten aufgrund einer zurückgelegten Strecke und/oder einer verstrichenen Zeit.
-
In weiterer vorteilhafter Ausgestaltung der Erfindung erfolgt das Verschieben der Zeitstempel pro Teilabschnitt um ein zufälliges Zeitintervall.
-
In weiterer vorteilhafter Ausgestaltung der Erfindung erfolgt ein Übermitteln der Datensätze an die elektronische Recheneinrichtung erst nach Beenden der Fahrt.
-
Weitere Vorteile, Merkmale und Einzelheiten der Erfindung ergeben sich aus der nachfolgenden Beschreibung eines bevorzugten Ausführungsbeispiels sowie anhand der Zeichnung. Die vorstehend in der Beschreibung genannten Merkmale und Merkmalskombinationen sowie die nachfolgend in der Figurenbeschreibung genannten und/oder in den Figuren alleine gezeigten Merkmale und Merkmalskombinationen sind nicht nur in der jeweils angegebenen Kombination, sondern auch in anderen Kombinationen oder in Alleinstellung verwendbar, ohne den Rahmen der Erfindung zu verlassen.
-
Dabei zeigt:
- 1 eine schematische Ansicht eines Kraftwagens und einer elektronischen Recheneinrichtung;
- 2 eine schematische Darstellung einer Fahrstrecke des Kraftwagens aufbereitet für ein Verfahren zur Anonymisierung von Positionsdaten des Kraftwagens; und
- 3 weitere schematische Darstellung der Fahrstrecke.
-
1 zeigt in einer schematischen Ansicht einen Kraftwagen 10, welcher eine Positionserfassungseinrichtung 12 zum Erfassen von Positionsdaten während einer Fahrt aufweist und ferner eine Kommunikationseinrichtung 14 umfasst. Des Weiteren ist in 1 eine fahrzeugexterne elektronische Recheneinrichtung 16 gezeigt, welche über Kommunikationsmittel verfügt, um mit der Kommunikationseinrichtung 14 Daten, insbesondere Positionsdaten, auszutauschen.
-
Anhand des Kraftwagens 10, welcher insbesondere als Personenkraftwagen, Van und/oder Truck ausgebildet ist, und der fahrzeugexternen elektronischen Recheneinrichtung 16, welche insbesondere beispielsweise als Backend-Server ausgebildet sein kann, soll ein Verfahren zur Anonymisierung von Positionsdaten 18 des Kraftwagens 10 vorgestellt werden. Das Verfahren umfasst mehrere Schritte:
- In einem ersten Schritt erfolgt ein Erheben der einzelnen Positionsdaten 18 durch die Positionserfassungseinrichtung 12 mit einer vorgegebenen Frequenz. In einem zweiten Schritt erfolgt ein Zusammenfassen der einzelnen Positionsdaten 18 zu einem Datensatz 20. In einem dritten Schritt erfolgt ein Entfernen von Anfangsdaten 22 und/oder Enddaten 24 aus dem Datensatz 20. In einem vierten Schritt erfolgt ein Einteilen des Datensatzes 20 in Teildatensätze, welche jeweils Positionsdaten 18 einer Teilstrecke umfassen, mit einer jeweiligen Sitzungs-ID beziehungsweise Sitzungs-Identifikationsnummer. In einem fünften Schritt erfolgt ein Verschieben von Zeitstempeln der Positionsdaten 18 in Abhängigkeit der Sitzungs-ID. Vorteilhafterweise erfolgen die genannten Schritte S1 bis S5 in einer elektronischen Recheneinrichtung beziehungsweise onboard im Kraftfahrzeug 10 selbst. Im Anschluss wird vorteilhafterweise nach Beenden der Fahrt der Datensatz 20 an die fahrzeugexterne elektronische Recheneinrichtung 16 übermittelt. Dort erfolgt insbesondere der sechste Schritt, welcher ein Abgleichen des Datensatzes 20 mit weiteren Datensätzen 20 weiterer Kraftwägen erfolgt, wobei beim Vorhandensein mehrerer Teildatensätze für eine der Teilstrecken die Teildatensätze gespeichert werden.
-
Mit anderen Worten erfolgt eine Datenverarbeitung im Fahrzeug, dem Kraftwagen 10, wobei die Positionsdaten 18 im Fahrzeug mit einer bestimmten Frequenz erhoben werden. Daraufhin erfolgt ein Abschneiden des Fahrtanfangs und/oder des Fahrtendes anhand entweder einer minimal gefahrenen Zeit, beispielsweise drei Minuten, und/oder anhand einer minimal gefahrenen Strecke, beispielsweise 500 Meter. Anschließend erfolgt ein Konnotieren der Fahrtabschnitte mit einzigartiger, insbesondere zufälliger Session-ID beziehungsweise Sitzungs-ID. Daraufhin wird eine Verschiebung aller Zeitstempel der Datenpunkte innerhalb einer Session beziehungsweise mit gleicher Session-ID um eine insbesondere zufällige Zeit, beispielsweise um 15 Minuten, durchgeführt. Die Positionsdaten 18 beziehungsweise der Datensatz 20 werden so prozessiert nach dem Fahrtende aus dem Fahrzeug in das Backend, also die fahrzeugexterne elektronische Recheneinrichtung 16, übertragen.
-
Anschließend erfolgt die Datenverarbeitung im Backend. Dabei liegen die Daten mit verschiedenen Session-IDs vor. Diese können beispielsweise auf eine Karte und somit auf eine Straße gelegt werden. Die Daten werden über einen Zeitraum x, beispielsweise mindestens einmal eine Stunde und insbesondere vier Mal so lange wie beim Verschieben der Zeitstempel, verschoben auf einer Straße aggregiert. Das heißt, es werden für den sechsten Schritt Datensätze beziehungsweise Teildatensätze in einem bestimmten Zeitintervall, dem Zeitraum, gesammelt. Ergibt es sich, dass in dem Zeitraum beziehungsweise Zeitintervall mehrere Datensätze 20 beziehungsweise Teildatensätze für eine Teilstrecke vorliegen, werden die Datensätze 20 historisiert, das heißt gespeichert, insbesondere bei drei oder mehr vorhandenen Datensätzen. Sind zwei oder weniger Datensätze beziehungsweise Sessions vorhanden, werden die Daten gelöscht. So kann eine Reidentifikation ausgeschlossen werden.
-
2 zeigt schematisch anhand einer beispielhaften Fahrt des Kraftwagens 10 die einzelnen erfassten Positionsdaten 18 von Fahrtbeginn bis Fahrtende, wobei das Entfernen der Anfangsdaten 22 und der Enddaten 24 ersichtlich wird, sodass ein verkürzter Datensatz 20 überbleibt.
-
Der Datensatz 20 wird für das Konnotieren beziehungsweise für das Einteilen in die Teildatensätze derart bearbeitet, dass immer fünf Minuten Fahrt eine eigene Session-ID erhalten und somit als Teildatensatz gesehen werden können. Dabei sollte die Länge vorteilhafterweise einer Gaußschen Normalverteilung entsprechen. Innerhalb eines Teildatensatzes beziehungsweise der Positionsdaten 18, welche eine Sitzungs-ID erhalten haben, erfolgt eine gemeinsame Verschiebung der Zeitstempel um eine zufällige Zeit, beispielsweise 15 Minuten. Dabei sollte die Länge ebenfalls Gauß-normalverteilt sein.
-
3 zeigt nun einen Datensatz 20 des Kraftwagens 10 und zwei weitere Datensätze 20 zweiter weiterer Kraftwägen, wobei diese einen Überlappungsbereich aufweisen, das heißt mehrere Teildatensätze für eine Teilstrecke vorhanden sind. In diesem Fall sind somit drei unterschiedliche Sessions für eine Teilstrecke vorhanden, wobei diese vorteilhafterweise in einem vorgegebenen Zeitintervall aggregiert worden sind, sodass diese nun gespeichert werden können und nicht verworfen zu werden brauchen.
-
Durch das vorhandene Verfahren wird eine Analyse von Positionsdaten 18 datenschutzfreundlich ermöglicht. Ferner ist im Gegensatz zu bekannten Verfahren ein Reidentifikationsrisiko besonders gering.
-
Bezugszeichenliste
-
- 10
- Kraftwagen
- 12
- Positionserfassungseinrichtung
- 14
- Kommunikationseinrichtung
- 16
- fahrzeugexterne elektronische Recheneinrichtung
- 18
- Positionsdaten
- 20
- Datensatz
- 22
- Anfangsdaten
- 24
- Enddaten
-
ZITATE ENTHALTEN IN DER BESCHREIBUNG
-
Diese Liste der vom Anmelder aufgeführten Dokumente wurde automatisiert erzeugt und ist ausschließlich zur besseren Information des Lesers aufgenommen. Die Liste ist nicht Bestandteil der deutschen Patent- bzw. Gebrauchsmusteranmeldung. Das DPMA übernimmt keinerlei Haftung für etwaige Fehler oder Auslassungen.
-
Zitierte Patentliteratur
-
- DE 102021001378 B3 [0003]