RU2748966C1 - Method for synchronisation of anonymous identifiers - Google Patents
Method for synchronisation of anonymous identifiers Download PDFInfo
- Publication number
- RU2748966C1 RU2748966C1 RU2020108164A RU2020108164A RU2748966C1 RU 2748966 C1 RU2748966 C1 RU 2748966C1 RU 2020108164 A RU2020108164 A RU 2020108164A RU 2020108164 A RU2020108164 A RU 2020108164A RU 2748966 C1 RU2748966 C1 RU 2748966C1
- Authority
- RU
- Russia
- Prior art keywords
- data
- identifier
- anonymous
- source
- receiver
- Prior art date
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F12/00—Accessing, addressing or allocating within memory systems or architectures
- G06F12/14—Protection against unauthorised use of memory or access to memory
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/60—Protecting data
- G06F21/62—Protecting access to data via a platform, e.g. using keys or access control rules
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Computer Security & Cryptography (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Bioethics (AREA)
- General Health & Medical Sciences (AREA)
- Computer Hardware Design (AREA)
- Software Systems (AREA)
- Computer And Data Communications (AREA)
Abstract
Description
Область техникиTechnology area
Изобретение относится к способам анонимизации и системам защиты конфиденциальности пользовательских данных и обеспечения приватности.The invention relates to anonymization methods and systems for protecting the confidentiality of user data and ensuring privacy.
Уровень техникиState of the art
Индивидуальный подход всегда был лучшим способом донести информацию до потребителя. Такой подход давно стал решающим фактором самых успешных маркетинговых кампаний, а прямой маркетинг приобрел широкую популярность в конце XX века, потому что появлялось все больше и больше возможностей для индивидуального подхода к клиенту. Рост цифровых технологий предоставляет все новые и новые инструменты для этого. На данный момент многие опросы маркетологов за последние месяцы показывают, что улучшение персонализации - первоочередная задача на ближайшие годы.An individual approach has always been the best way to convey information to the consumer. This approach has long been a decisive factor in the most successful marketing campaigns, and direct marketing gained widespread popularity at the end of the 20th century, because there were more and more opportunities for an individual approach to the client. The growth of digital technologies provides more and more new tools for this. At the moment, many surveys of marketers in recent months show that improving personalization is the top priority for the coming years.
Поведенческая персонализация идентифицирует поведение человека благодаря сигналам, полученным через различные точки сбора данных, такие как посещение веб-сайта, переписка по электронной почте, поиски и потребление определенного контента или даже посещение определенных отделов магазина. Все эти сведения можно включить в предиктивную модель, позволяющую принимать решения в режиме реального времени. Но, развивая эти механизмы, рекламные сети постоянно сталкиваются с проблемой конфиденциальности. Количество сведений о клиентах, которые собирают компании, просто необъятно, и возникает немало вопросов в связи с хранением собранной персональной информации и гарантией анонимности.Behavioral personalization identifies human behavior through signals received through various data collection points, such as visits to a website, e-mails, searches for and consumption of certain content, or even visits to certain parts of the store. All of this information can be incorporated into a predictive model that enables real-time decision making. But by developing these mechanisms, ad networks are constantly faced with a privacy issue. The amount of information about customers that companies collect is simply immense, and many questions arise in connection with the storage of the collected personal information and the guarantee of anonymity.
Для сбора пользовательских данных могут использоваться различные аналитические утилиты и трекеры (от англ. tracker), которые представляют собой html- и js-код, внедренный на страницу сетевого ресурса. Каждый трекер имеет свой домен, поэтому идентификатором пользователя в рамках одного трекера является произвольный идентификатор, сохраняемый в куки (от англ cookie) на клиенте. В зависимости от функциональности трекера могут собираться данные различной полноты. Например, для зарегистрированного через электронную почту пользователя можно к идентификатору привязать почтовый адрес, а в случае поисковых запросов собрать набор интересов пользователя. Для увеличения полноты пользовательского профиля данные из различных трекеров собираются в общей базе данных - системе хранения и управления данными, например платформе управления данными (англ. Data Management Platform, далее DMP). Для связывания данных по различным идентификаторам из cookie от одного пользователя используется механизм синхронизации cookie файлов. В общем случаев синхронизация cookie осуществляется в обе стороны и в ней может участвовать множество систем управления данными. Системы управления данными выставляют переадресацию (жарг. редирект от англ. redirect) в другие системы, передавая содержимое своего cookie-файла в качестве параметра сетевого адреса. Это позволяет сопоставить два идентификатора, один - переданный в cookie-файле и второй - в параметре сетевого адреса в системе, в которую сделана переадресация. В результате процесса синхронизации в DMP оказывается профиль пользователя, собранный из нескольких источников и содержащий также идентификаторы пользователя из cookie в различных системах. Участвующие в синхронизации системы также могут получить идентификатор пользователя из DMP. Особенно актуальна синхронизация между системами управления данными типа Supply Side platform (далее SSP) и типа DMP, так как SSP на торги выставляет свой идентификатор, а данные в участвующих в аукционе Demand Side Platform (далее DSP) привязаны к идентификаторам DMP.To collect user data, various analytical utilities and trackers (from the English tracker) can be used, which are html and js code embedded on a web resource page. Each tracker has its own domain, therefore, the user identifier within one tracker is an arbitrary identifier stored in a cookie (from the English cookie) on the client. Depending on the functionality of the tracker, data of varying completeness may be collected. For example, for a user registered via e-mail, you can bind a postal address to the identifier, and in the case of search queries, collect a set of user interests. To increase the completeness of the user profile, data from various trackers are collected in a common database - a data storage and management system, for example, a Data Management Platform (hereinafter referred to as DMP). To associate data on different identifiers from cookies from one user, the cookie synchronization mechanism is used. In general, cookie synchronization is done both ways and can involve multiple data management systems. Data management systems expose redirects (jarg. Redirect from English. Redirect) to other systems, passing the content of their cookie-file as a parameter of the network address. This allows you to match two identifiers, one passed in the cookie and the other in the network address parameter on the system to which the redirect was made. As a result of the synchronization process, the DMP is a user profile that is collected from several sources and also contains user IDs from cookies on various systems. Systems participating in synchronization can also obtain a user ID from the DMP. Synchronization between data management systems of the Supply Side platform (hereinafter referred to as SSP) and the DMP type is especially relevant, since the SSP puts up its identifier for the auction, and the data in the Demand Side Platform (hereinafter DSP) participating in the auction is tied to the DMP identifiers.
Ввиду принятия новых законов в сфере персональных данных (например, Общий регламент защиты персональных данных, англ. General Data Protection Regulation, GDPR) возникает необходимость обеспечить конфиденциальность и сохранить описанные рекламные механизмы. Из анализа уровня техники следует, что уже известны некоторые механизмы, которые позволяют скрывать действительные идентификаторы, например:In view of the adoption of new laws in the field of personal data (for example, the General Data Protection Regulation, GDPR), it becomes necessary to ensure confidentiality and preserve the described advertising mechanisms. It follows from the analysis of the prior art that some mechanisms are already known that allow hiding valid identifiers, for example:
- US 20122866 описывает способ хранения данных в облачных хранилищах, в котором любой файл от устройства пользователя поступает на прокси-сервер, на котором шифруется и передается в облачное хранилище;- US 20122866 describes a method of storing data in cloud storage, in which any file from the user's device goes to a proxy server, where it is encrypted and transferred to the cloud storage;
- US 8739265 описывает способ обфускации и извлечения данных, где данные, содержащие конфиденциальные данные, отправляемые с устройства, перехватываются, изменяются и передаются далее в облачное хранилище. При этом изменяются не все данные, а определенные в соответствии с правилами, установленными в сети, и эти данные могут не передаваться в облако, а извлекаться и сохраняться локально, а передаваться будут поп sensitive data и токен вместо извлеченных данных.- US 8739265 describes a method for obfuscating and extracting data, where data containing confidential data sent from a device is intercepted, modified and transmitted further to the cloud storage. In this case, not all data is changed, but determined in accordance with the rules set in the network, and this data may not be transmitted to the cloud, but retrieved and stored locally, and pop sensitive data and a token will be transmitted instead of the retrieved data.
На основании анализа существующего уровня техники становится ясно, что описанные средства требуют установки на устройстве пользователя дополнительного агента, что затрудняет работу пользователя с удаленным сервером и делает взаимодействие непрозрачным.Based on the analysis of the state of the art, it becomes clear that the described means require the installation of an additional agent on the user's device, which makes it difficult for the user to work with the remote server and makes the interaction opaque.
Краткое описание чертежейBrief Description of Drawings
Сопровождающие чертежи включены для обеспечения дополнительного понимания изобретения и составляют часть этого описания, показывают варианты осуществления изобретения и совместно с описанием служат для объяснения принципов изобретения.The accompanying drawings are included to provide a further understanding of the invention and form part of this description, show embodiments of the invention, and together with the description serve to explain the principles of the invention.
Заявленное изобретение поясняется следующими чертежами, на которых:The claimed invention is illustrated by the following drawings, in which:
Фиг. 1 - изображают систему для анонимного обмена данными.FIG. 1 - depicts a system for anonymous data exchange.
Фиг. 2 - изображают способ получения данных приемником от источника.FIG. 2 depicts a method for receiving data by a receiver from a source.
Фиг. 3 - изображают пример осуществления способа получения данных приемником от источника.FIG. 3 shows an example of an embodiment of a method for receiving data by a receiver from a source.
Фиг. 4 - изображают систему для синхронизации анонимных идентификаторов.FIG. 4 depicts a system for synchronizing anonymous identifiers.
Фиг. 5 - изображают способ синхронизации анонимных идентификаторов.FIG. 5 depicts a method for synchronizing anonymous identifiers.
Фиг. 6 - изображают пример осуществления способа синхронизации анонимных идентификаторов.FIG. 6 shows an example of an implementation of a method for synchronizing anonymous identifiers.
Фиг. 7 - изображают систему для получения анонимных данных.FIG. 7 - depicts a system for obtaining anonymous data.
Фиг. 8 - изображают способ получения анонимных данных.FIG. 8 - depicts a method for obtaining anonymous data.
Фиг. 9 - изображают пример компьютерной системы общего назначения.FIG. 9 depicts an example of a general purpose computer system.
Раскрытие изобретениеDisclosure invention
Настоящее изобретение предназначено для синхронизации анонимных идентификаторов при обмене данными в системах управления данными. Технический результат настоящего изобретения заключается в обеспечении объединения анонимных идентификаторов в результате обеспечения способа, в котором получают идентификаторы одного пользователя по меньшей мере в двух системах управления данными. Системами управления данными могут быть SSP, DSP, DMP. Далее формируют средством преобразования анонимный идентификатор для каждого полученного идентификатора пользователя. Далее формируют средством преобразования случайный токен для каждой связки идентификатор пользователя-анонимный идентификатор. Токен формируют на основании данных от источника, в качестве данных могут использоваться идентификационные данные, например: идентификаторы, данные для создания уникальных отпечатков, уникальные отпечатки, идентификатор в платформе для управления данными, идентификатор от средства синхронизации. На основании данных от источника дополнительно формируют анонимный идентификатор, где сформированный случайный токен может однозначно, в частном случае, отображаться на анонимный идентификатор. Токены возвращают источнику и отправляют с источника полученные токены на приемник; средством преобразования по запросу приемник отображают каждый случайный токен на анонимный идентификатор и возвращают анонимные идентификаторы приемнику. Объединяют анонимные идентификаторы на приемнике, которые соответствуют токенам, полученным от одного источника.The present invention is intended to synchronize anonymous identifiers when exchanging data in data management systems. The technical result of the present invention is to provide the unification of anonymous identifiers as a result of providing a method in which identifiers of one user are obtained in at least two data management systems. Data management systems can be SSP, DSP, DMP. Next, an anonymous identifier is generated by the transforming means for each received user identifier. Next, the conversion means generates a random token for each linking user identifier-anonymous identifier. The token is formed on the basis of data from the source, identification data can be used as data, for example: identifiers, data for creating unique fingerprints, unique fingerprints, an identifier in the platform for data management, an identifier from a synchronization tool. Based on the data from the source, an anonymous identifier is additionally formed, where the generated random token can be unambiguously, in a particular case, mapped to an anonymous identifier. Tokens are returned to the source and the received tokens are sent from the source to the receiver; by the on-demand transformator, the receiver maps each random token to an anonymous identifier and returns the anonymous identifiers to the receiver. Combine anonymous identifiers on the sink that match tokens received from the same source.
Приемником и/или источником могут быть платформы для управления данными, где источник - отправитель данных, а приемник - получатель данных. Также источником в клиент-серверной архитектуре является клиент, а приемником - сервер. Средство преобразования располагается на узле сети, отличной от сети приемника и/или источника. В частном случае формирование токена инициируется источником.The sink and / or source can be data management platforms where the source is the sender of the data and the sink is the destination of the data. Also, the source in the client-server architecture is the client, and the sink is the server. The conversion tool is located on a network node other than the destination and / or source network. In a particular case, the generation of a token is initiated by the source.
Описание вариантов осуществления изобретенийDescription of embodiments of inventions
Объекты и признаки настоящего изобретения, способы для достижения этих объектов и признаков станут очевидными посредством отсылки к примерным вариантам осуществления. Однако настоящее изобретение не ограничивается примерными вариантами осуществления, раскрытыми ниже, оно может воплощаться в различных видах. Приведенное описание предназначено для помощи специалисту в области техники для исчерпывающего понимания изобретения, которое определяется в объеме приложенной формулы. Ниже дается раскрытие ключевых понятий, используемых в заявке.The objects and features of the present invention, methods for achieving these objects and features will become apparent by reference to exemplary embodiments. However, the present invention is not limited to the exemplary embodiments disclosed below, but may be embodied in various forms. The foregoing description is intended to assist a person skilled in the art for a comprehensive understanding of the invention, which is defined within the scope of the appended claims. Below is a disclosure of the key concepts used in the application.
Заявленное изобретение позволяет управлять собираемыми данными и разорвать связь между пользователем и системами управления данными, а также отказаться от традиционных механизмов установки cookie-файла и получения согласия пользователя на каждую установку. За пользователем законодательно закреплено право отозвать разрешение на обработку данных, настоящее изобретение обеспечивает техническую реализацию такого права "в один клик" для неограниченного числа трекеров. И заявленное изобретение может быть встроено в существующие механизмы RTB (real time bidding).The claimed invention makes it possible to manage the collected data and break the connection between the user and the data management systems, as well as to abandon the traditional mechanisms for setting a cookie and obtaining user consent for each installation. The user is legally assigned the right to revoke permission to process data, the present invention provides the technical implementation of this right "in one click" for an unlimited number of trackers. And the claimed invention can be built into existing RTB (real time bidding) mechanisms.
На Фиг. 1 изображена система для анонимного обмена данными. Система включает в себя источник данных 110, приемник данных 120 и средство преобразования данных 130. На источнике 110 располагаются данные, которые по запросу предоставляются приемнику 120. Средство преобразования данных 130 предназначено для создания связок:FIG. 1 depicts a system for anonymous data exchange. The system includes a data source 110, a
- идентификатор пользователя ↔ анонимный идентификатор,- user ID ↔ anonymous ID,
- критические данные ↔ анонимные данные.- critical data ↔ anonymous data.
Средство преобразования 130 также формирует случайные токены для указанных связок. Средство преобразования может преобразовывать в обе стороны идентификационные данные и критические данные, где результатом преобразования являются анонимные идентификаторы или анонимные данные. В частном случае способами преобразования данных являются:Transformer 130 also generates random tokens for these bundles. The transform tool can convert identities and critical data in both directions, where the transformation results in anonymous identifiers or anonymous data. In a particular case, the methods of data transformation are:
- квантование;- quantization;
- сортировка;- sorting;
- слияние (склеивание);- merging (gluing);
- группировка;- grouping;
- настройка набора данных;- setting up a dataset;
- табличная подстановка значений;- table substitution of values;
- вычисляемые значения;- calculated values;
- кодирование данных;- data coding;
- шифрование;- encryption;
- нормализация (масштабирование);- normalization (scaling);
- свертка.- convolution.
При этом преобразование в частном случае осуществляется без возможности обратного преобразования1 (1 под обратным преобразованием понимается преобразование, позволяющее восстановить исходную форму объекта преобразования (данных, подструктуры) до преобразования) любыми средствами кроме средства анонимизации узла. Под преобразованием в общем случае понимается отображение (функция) множества в себя, или, другими словами, преобразованиями называют отображения, переводящие некоторое множество в другое множество2 (2 Математический энциклопедический словарь. - М., 1988. - С. 487).In this case, the transformation in a particular case is carried out without the possibility of the inverse transformation 1 ( 1 , the inverse transformation is understood as a transformation that allows you to restore the original form of the transformation object (data, substructure) before the transformation) by any means other than the means of anonymizing the node. In the general case, a transformation means a mapping (function) of a set into itself, or, in other words, transformations are called mappings that transfer a set to another set 2 ( 2 Mathematical Encyclopedic Dictionary. - M., 1988. - S. 487).
В частном случае средство преобразования 130 располагается на узле сети отличной от сети приемника и/или источника. В частном случае узел со средством преобразования расположен в региональной сети3 (3 Географически рассредоточенная сеть, коммуникационными средствами объединяющая в единое целое компьютеры в разных пунктах, совокупность региональных сетей образует глобальную сеть), отличной от региональной сети, в которой расположен приемник4 (4 Это позволяет располагать элементы системы в независимых юрисдикциях), и/или не находится в одном Интранете5 (5 ГОСТ Р ИСО 9241-151-2014) с приемником или источником. При этом в рамках данного изобретения разные региональные сети не только географически разнесены, но и находятся в разных юрисдикциях, поэтому, очевидно, в рамках данного изобретения разными региональными сетями могут быть в том числе сети, объединяющие узлы стран (национальные сети). В терминологии GDPR, например, региональная сеть РФ, в которой расположен сервер, будет считаться региональной сетью третьей страны. В частном случае региональная сеть узла со средством преобразования отлична также и от региональной сети клиента.In a particular case, the conversion means 130 is located at a network node other than the receiver and / or source network. In a particular case, a node with a conversion tool is located in a regional network 3 ( 3 A geographically dispersed network that unites computers at different points into a single whole by means of communication means, a set of regional networks forms a global network), different from the regional network in which the receiver 4 is located ( 4 This allows you to locate system elements in independent jurisdictions), and / or is not in the same Intranet 5 ( 5 GOST R ISO 9241-151-2014) with a receiver or source. Moreover, within the framework of this invention, different regional networks are not only geographically dispersed, but also located in different jurisdictions, therefore, obviously, within the framework of this invention, different regional networks can be, among other things, networks connecting nodes of countries (national networks). In GDPR terminology, for example, the regional network of the Russian Federation, in which the server is located, will be considered the regional network of a third country. In a particular case, the regional network of the node with the transforming means is also different from the regional network of the client.
Источниками данных 110 могут быть клиенты, различные пользовательские устройства, IoT-устройства или системы управления данными, такие как банк данных пользователей, который агрегирует и хранит все данные о пользователе и которым пользователь управляет через интерфейс. В качестве приемников могу выступать серверы, системы управления данными, в том числе CDP, DMP, SSP, DSP и т.д. В частном случае возможна обратная ситуация, когда источники становятся приемниками, а приемники источниками. Например, в технологии RTB, когда устройство пользователя получает от SSP рекламный блок. В данном примере SSP -источник, а устройство пользователя - приемник.Data sources 110 can be clients, various user devices, IoT devices, or data management systems such as a user databank that aggregates and stores all user data and which the user controls through an interface. Servers, data management systems, including CDP, DMP, SSP, DSP, etc. can act as receivers. In a particular case, the opposite situation is possible, when sources become receivers, and receivers become sources. For example, in RTB technology, when the user's device receives an ad unit from the SSP. In this example, the SSP is the source and the user device is the sink.
На Фиг. 1 изображен пример модели взаимодействия между источником данных 110 и приемником данных 120, где:FIG. 1 depicts an example of an interaction model between a data source 110 and a
- приемник запрашивает данные от источника (210);- the receiver requests data from the source (210);
- источник отправляет идентификатор средству преобразования (220);- the source sends the identifier to the transforming means (220);
- средство преобразования возвращает случайный токен источнику (230);- the conversion tool returns a random token to the source (230);
- источник отправляет приемнику запрошенные данные, объединенные с токеном (240);- the source sends to the receiver the requested data, combined with the token (240);
- приемник отправляет случайный токен средству преобразования (250);- the receiver sends a random token to the conversion tool (250);
- средство преобразования возвращает анонимный идентификатор приемнику (260);- the conversion means returns the anonymous identifier to the receiver (260);
На Фиг. 2 изображен способ 200 получения данных приемником от источника, который использует описанную модель. На этапе 210 источник 110 получает запрос от приемника 120 на отправку данных. В частном случае запрос на отправку может быть инициирован не приемником 120, а инициироваться внутри самого источника 110. Например, когда на устройстве пользователя выполняется скрипт, который инициирует отправку данных вебсерверу или DMP. Получив запрос, источник готовит данные к отправке, для этого идентификатор пользователя или любые другие идентификационные данные (вместе с которым данные должны отправляться приемнику 120) не связываются с данными для отправки, а если связывание уже произошло, идентификационные данные отделяются средством модификации 140 (подробно ниже), и на этапе 220 отправляются средству преобразования 130. В частном случае, если идентификатор пользователя отсутствует (проверка осуществляется на этапе 211), например cookie не установлен или отсутствует, то данный идентификатор формируют на этапе 212. Формирование идентификатора пользователя может осуществляться как источником 110, так и третьей стороной (например: DMP, SSP, веб-сервером, банком данных и т.д.), и отправляться источнику на этапе 2126. Средством преобразования 130 на этапе 221 проверяют, связан ли с полученными идентификационными данными существующий анонимный идентификатор. В случае если связь отсутствует, на этапе 222 формируют анонимный идентификатор и создают пару идентификатор пользователя-анонимный идентификатор. В частном случае идентификационные данные пользователя однозначно связываются с анонимным идентификатором (связь один к одному - инъекция). В другом частном случае связь неоднозначная (один ко многим):FIG. 2 depicts a
- с одним анонимным идентификатором связано несколько идентификаторов одного пользователя (например, когда один пользователь имеет идентификаторы в нескольких системах);- several identifiers of the same user are associated with one anonymous identifier (for example, when one user has identifiers in several systems);
- с одним анонимным идентификатором связаны идентификаторы нескольких пользователей (например, когда анонимный идентификатор характеризует некоторую группу людей - семью/коллег или идентификатор характеризует потребительский сегмент);- identifiers of several users are associated with one anonymous identifier (for example, when an anonymous identifier characterizes a certain group of people - family / colleagues or an identifier characterizes a consumer segment);
- с одним идентификатором пользователя связано несколько анонимных идентификаторов (например, когда необходимо обеспечить управляемую коллизию идентификаторов для деперсонализации и невозможности обратного преобразования).- several anonymous identifiers are associated with one user identifier (for example, when it is necessary to provide a controlled collision of identifiers for depersonalization and the impossibility of reverse transformation).
На этапе 223 формируют случайный токен для пары идентификатор пользователя - анонимный идентификатор. И на этапе 230 источнику 110 возвращается этот случайный токен. Случайный токен объединяется с данными, предназначенными для приемника (этап 231), и данные с токеном на этапе 240 передаются приемнику 120. Токен от приемника 120 на этапе 250 передают средству преобразования 130, где токен отображается на анонимный идентификатор из пары идентификатор полъзователя-анонимный идентификатор, для которой токен был сформирован (этап 255). Данные объединяются с возвращенным (на этапе 260) анонимным идентификатором на этапе 265. В частном случае, если возвращенный анонимный идентификатор уже был известен приемнику, данные, полученные от источника 110, сохраняются в структуре, ранее созданной под этот анонимный идентификатор, иначе создается новая структура хранения для данных, связанных с анонимным идентификатором. Несколько анонимных идентификаторов под один пользовательский идентификатор создают, когда необходимо гарантировано обеспечить анонимность пользователя. В этом случае один пользовательский идентификатор отображен на несколько анонимных идентификаторов, что не позволяет на стороне приемника объединить данные под одним идентификатором и деанонимизировать пользователя.At step 223, a random token is generated for the user ID-anonymous ID pair. And at
На Фиг. 3 изображен вариант осуществления способа отправки данных на примере сбора данных DMP. На этапе 210а браузер получает html-страницу со скриптами от веб-сервера 310. По меньшей мере один из скриптов предназначен для сбора данных с устройства пользователя 150, на котором установлен браузер 110а, и отправку данных в DMP 120а. Для отправки данных нужно сформировать уникальный идентификатор пользователя, для этого на этапе 212а передается запрос DMP Middleware 320а DMP Middleware на этапе 212 формирует идентификатор пользователя dmpUserID и возвращает его браузеру на этапе 2126. На этапе 220 идентификатор dmpUserID отправляют средству преобразования 130. Средством преобразования 130 проверяют, связан ли с полученным идентификатором существующий анонимный идентификатор. Если связь отсутствует, формируют средством преобразования 130 анонимный идентификатор anonymUserID, иначе используют существующий. Далее формируют случайный токен dmpUserIDToken для пары dmpUserID-anonymUserID. И на этапе 230 возвращают сформированный токен dmpUserIDToken на устройство пользователя. Случайный токен dmpUserIDToken объединяется с данными DATA, предназначенными для DMP. Данные DATA с токеном dmpUserIDToken на этапе 240 передают DMP. Токен dmpUserIDToken от DMP на этапе 250 передают средству преобразования 130, где токен отображается на анонимный идентификатор anonymUserID из пары dmpUserID-anonymUserID, для которой токен был сформирован. И идентификатор anonymUserID на этапе 260 возвращается DMP. Данные DATA на DMP 120а объединяются с возвращенным анонимным идентификатором anonymUserID В частном случае, если возвращенный анонимный идентификатор уже был известен DMP, данные, полученные от веб-сервера, сохраняются в структуре, ранее созданной под этот анонимный идентификатор, иначе создается новая структура хранения для данных, связанных с анонимным идентификатором.FIG. 3 shows an embodiment of a method for sending data using the example of collecting DMP data. In step 210a, the browser receives the scripted html page from the web server 310. At least one of the scripts is designed to collect data from the user's device 150, where the browser 110a is installed, and send the data to the
На Фиг. 4 изображена система синхронизации идентификаторов 400. Средства системы 400 аналогичны средствам системы 100. Дополнительно система 400 содержит системы управления данными 320, которых для осуществления синхронизации по меньшей мере две. На Фиг. 4 изображен пример модели взаимодействия между источником данных и приемником данных, где:FIG. 4 shows a system for synchronizing
- источник 110 отправляет запрос на получение идентификатора к системе управления 320 (212а);- the source 110 sends a request to obtain an identifier to the control system 320 (212a);
- система 320 возвращает идентификатор источнику 110 (2126);- system 320 returns the identifier to the source 110 (2126);
- источник отправляет идентификатор средству преобразования (220);- the source sends the identifier to the transforming means (220);
- средство преобразования возвращает случайный токен источнику (230);- the conversion tool returns a random token to the source (230);
- источник отправляет приемнику токены (241);- the source sends tokens to the receiver (241);
- приемник отправляет токен средству преобразования (250);- the receiver sends the token to the conversion tool (250);
- средство преобразования возвращает анонимный идентификатор приемнику (260).- the transforming means returns the anonymous identifier to the receiver (260).
На Фиг. 5 изображен способ отправки данных, который использует описанную модель взаимодействия. Если у источника 110 нет идентификаторов для синхронизации, то источник 110 отправляет запрос 212а на получение идентификатора к системе управления 320, система 320 формирует идентификатор на этапе 212 и возвращает его источнику 110 (2126). Источник 110 передает идентификаторы средству преобразования 130 на этапе 220. Средством преобразования на этапе 221 проверяют, связан ли с полученными идентификационными данными существующий анонимный идентификатор. В случае если связь отсутствует, на этапе 222 формируют анонимный идентификатор и связывают его с идентификационными данными, как в способе 200. На этапе 223 формируют случайный токен для каждой пары идентификатор пользователя - анонимный идентификатор. И на этапе 230 источнику 110 возвращают этот случайный токен. Все токены источника 110 объединяют на этапе 231а и передают приемнику на этапе 241. Токены от приемника на этапе 250 передают средству преобразования 130, где токены отображаются (жарг. резолвятся от англ. resolve) на анонимные идентификаторы из пар идентификатор полъзователя-анонимный идентификатор, для которых токены были сформированы (этап 255). Анонимные идентификаторы возвращают приемнику 120 на этапе 260, а на этапе 266 связывают анонимные идентификаторы, соответствующие токенам, полученным от одного источника.FIG. 5 depicts a method for sending data using the described interaction model. If the source 110 does not have identifiers to synchronize, then the source 110 sends a
На Фиг. 6 изображен вариант осуществления изобретения на примере синхронизации идентификаторов от SSP и от DMP. Браузером 110а отправляются запросы 212а на получение идентификатора к SSP Middleware 3206 и DMP Middleware 320а. Система 320а формирует идентификатор dmpUserID, а система 3206 формирует идентификатор sspUserID. Сформированные идентификаторы на этапе 2126 возвращают устройству пользователя 150, браузером 110а которого был отправлен запрос. Идентификаторы отправляют средству преобразования 130 на этапе 220. Средством преобразования 130 формируют анонимные идентификаторы. Для dmpUserID формируют anonymDmpUserID, а для sspUserID формируют anonymSspUserID. Для каждой пары формируют случайный токен:FIG. 6 depicts an embodiment of the invention using the example of synchronization of identifiers from SSP and from DMP. Browser 110a sends
- dmpUserID-anonymDmpUserID ↔ dmpUserIDToken;- dmpUserID-anonymDmpUserID ↔ dmpUserIDToken;
- sspUserID- anonymSspUserID ↔ sspUserIDToken.- sspUserID- anonymSspUserID ↔ sspUserIDToken.
И на этапе 230 на устройство 150 возвращают токены sspUserIDToken и dmpUserIDToken. Полученные токены на устройстве объединяются и передаются DMP 120а на этапе 241. Токены от DMP на этапе 250 передают средству преобразования 130, где токены отображаются на анонимные идентификаторы. Анонимные идентификаторы anonymDmpUserID и anonymSspUserID возвращают DMP на этапе 260, а в DMP идентификаторы связываются (синхронизируются) как идентифицирующие один источник в разных системах 320.And at
На Фиг. 7 изображена система отправки анонимных данных 700. Средства системы 700 аналогичны средствам системы 100. Система 700 содержит средство модификации 140, предназначенное для разделения структур данных (которые формируются для отправки от источника 110 приемнику 120). Критерии разделения структуры данных на подструктуры могут быть различными, одним из таких критериев является наличие в отправляемых данных персональных данных (англ. Personal Identification Information) или их специальных категорий (по терминологии GDPR), при котором структура данных разделяется таким образом, что одна подструктура содержит персональные данные (далее ПДн, англ. PII) или их специальные категории, другая подструктура включает данные, не являющиеся персональными. Отношение данных к персональным определяется, например, законодательством страны, в юрисдикции которой находится пользователь, использующий устройство, являющееся в описываемой системе клиентом. Другими словами, по местоположению источника данных. Другим более общим критерием является наличие критических данных. К критическим данным (англ. critical data) относят данные, в отношении которых закон или уполномоченный субъект накладывает ограничения на сбор, хранение, доступ, распространение и обработку. Эти данные, как правило, чувствительны к разглашению, распространению, утечке, так как возникновение этих событий приводит к нарушению прав и охраняемых законом интересов субъектов и предусматривает ответственность для субъектов, допустивших нарушения правил сбора, хранения, доступа, обработки, предъявляемым к таким данным. Частным случаем критических данных являются конфиденциальные данные6 (6 или конфиденциальная информация, в рамках данной заявки конфиденциальные данные и конфиденциальная информация синонимы) (англ. sensitive data). Под конфиденциальными данными понимаются данные, которые охраняются в соответствии с законодательством страны, в юрисдикции которой находится пользователь, использующий устройство, являющееся в описываемой системе клиентом. К конфиденциальным данным в частном случае относятся персональные данные (ПДн) и данные содержащие:FIG. 7 depicts a system for sending
- коммерческую тайну;- commercial secrets;
- налоговую тайну;- tax secrets;
- банковскую тайну;- bank secrecy;
- врачебную тайну;- medical confidentiality;
- нотариальную тайну;- notarial secret;
- адвокатскую тайну;- attorney-client privilege;
- аудиторскую тайну;- audit secrecy;
- тайну связи;- communication secrecy;
- тайну страхования;- insurance secrecy;
- тайну завещания;- secret of the will;
- тайну усыновления;- the secret of adoption;
- тайну исповеди;- the secret of confession;
- тайну следствия;- the secrecy of the investigation;
- тайну судопроизводства;- secrecy of legal proceedings;
- сведения о защищаемых лицах;- information about the protected persons;
- государственную тайну.- state secrets.
На Фиг. 7 изображен пример модели отправки анонимных данных, где:FIG. 7 shows an example of a model for sending anonymous data, where:
- приемник запрашивает данные от источника (210)- the receiver requests data from the source (210)
- источник 110 отправляет запрос на получение идентификатора к системе управления 320 (212а)- the source 110 sends a request to obtain an identifier to the control system 320 (212a)
- система 320 возвращает идентификатор источнику 110 (2126).- system 320 returns the identifier to the source 110 (2126).
- источник отправляет идентификатор средству преобразования (220)- the source sends the identifier to the transforming means (220)
- источник отправляет критические данные (220а)- the source sends critical data (220a)
- средство преобразования возвращает случайный токен для идентификатора источнику (230)- the transforming tool returns a random token for the identifier to the source (230)
- средство преобразования возвращает случайный токен для данных источнику (230- the transform tool returns a random data token to the source (230
- источник отправляет приемнику токены и данные, не являющиеся критическими данными (242)- the source sends tokens and non-critical data to the receiver (242)
- приемник отправляет токены средству преобразования (250)- the receiver sends tokens to the conversion facility (250)
- средство преобразования возвращает анонимный идентификатор приемнику (260)- the transformer returns an anonymous identifier to the receiver (260)
- средство преобразования возвращает анонимные данные приемнику (261)- the transformer returns anonymous data to the receiver (261)
На Фиг. 8 изображен способ отправки анонимных данных 200, который использует описанную модель отправки. На этапе 210 источник 110 получает запрос от приемника 120 на отправку данных. В частном случае, если идентификатор пользователя отсутствует (проверка осуществляется на этапе 211), например cookie файл не установлен, то данный идентификатор формируют на этапе 212. Формирование идентификатора пользователя может осуществляться как источником 110, так и третьей стороной (например: DMP, SSP, веб-сервером, банком данных и т.д.), и отправляться источнику 110. Идентификатор от источника на этапе 220 отправляется средству преобразования 130. Данные, предназначенные для отправки, на этапе 213 проверяются на наличие критических данных. Если критические данные обнаружены, то на этапе 220а критические данные отправляют средству преобразования 130. Этапы 220 и 220а могут выполнятся как синхронно, так и асинхронно.FIG. 8 depicts a method for sending
Средством преобразования 130 на этапе 221 проверяют, связан ли с полученными идентификационными данными существующий анонимный идентификатор. В случае если связь отсутствует, на этапе 222 формируют анонимный идентификатор и создают пару идентификатор пользователя-анонимный идентификатор, аналогично способу 200. Средством преобразования на этапе 222а полученные критические данные анонимизируются и создается другая пара критические данные-анонимные данные. На этапе 223 формируют случайные токены для пары идентификатор пользователя - анонимный идентификатор и пары критические данные-анонимные данные.Conversion means 130 checks in
На этапе 230 источнику 110 возвращают случайный токен для пары идентификатор пользователя - анонимный идентификатор, а на этапе 230а возвращают случайный токен для пары критические данные-анонимные данные. Все токены источника 110 и в частном случае не критические данные передают приемнику на этапе 241. Токены от приемника на этапе 250 передают средству преобразования 130, где токен от пары идентификатор пользователя - анонимный идентификатор отображается на анонимный идентификатор (этап 255), а токен от пары критические данные-анонимные данные отображается на анонимные данные (этап 256). Анонимный идентификатор возвращают приемнику 120 на этапе 260, а анонимные данные возвращают приемнику 120 на этапе 261. На этапе 267 объединяют анонимный идентификатор, анонимные данные и, если передавались, не критические данные. В частном случае, если возвращенный анонимный идентификатор уже был известен приемнику, данные, полученные от источника 110, и анонимные данные, полученные от средства преобразования по токену, сохраняются в структуре, ранее созданной под этот анонимный идентификатор, иначе создается новая структура хранения для данных, связанных с анонимным идентификатором. Этапы 260 и 261 могут выполнятся как синхронно, так и асинхронно.At
Под средствами системы 100, 400 и 700 понимаются реальные устройства, системы, компоненты, группа компонентов, реализованные с использованием аппаратных средств, таких как интегральные микросхемы (англ. application-specific integrated circuit, ASIC) или программируемой вентильной матрицы (англ. field-programmable gate array, FPGA) или, например, в виде комбинации программных и аппаратных средств, таких как микропроцессорная система и набор программных инструкций, а также на нейроморфных чипах (англ. neurosynaptic chips), функциональность указанных модулей может быть реализована исключительно аппаратными средствами, а также в виде комбинации, где часть функциональности реализована программными средствами, а часть - аппаратными. В некоторых вариантах реализации средства могут быть исполнены на процессоре компьютера общего назначения (например, который изображен на Фиг. 9). Базы данных могут быть реализованы всеми возможными способами и содержаться как на одном физическом носителе, так и на разных, располагаться как локально, так и удаленно.
Фиг. 9 представляет пример компьютерной системы общего назначения, персональный компьютер или сервер 20, содержащий центральный процессор 21, системную память 22 и системную шину 23, которая содержит разные системные компоненты, в том числе память, связанную с центральным процессором 21. Системная шина 23 реализована, как любая известная из уровня техники шинная структура, содержащая в свою очередь память шины или контроллер памяти шины, периферийную шину и локальную шину, которая способна взаимодействовать с любой другой шинной архитектурой. Системная память содержит постоянное запоминающее устройство (ПЗУ) 24, память с произвольным доступом (ОЗУ) 25. Основная система ввода/вывода (BIOS) 26, содержит основные процедуры, которые обеспечивают передачу информации между элементами персонального компьютера 20, например, в момент загрузки операционной системы с использованием ПЗУ 24.FIG. 9 shows an example of a general-purpose computer system, a personal computer or
Персональный компьютер 20 в свою очередь содержит жесткий диск 27 для чтения и записи данных, привод магнитных дисков 28 для чтения и записи на сменные магнитные диски 29 и оптический привод 30 для чтения и записи на сменные оптические диски 31, такие как CD-ROM, DVD-ROM и иные оптические носители информации. Жесткий диск 27, привод магнитных дисков 28, оптический привод 30 соединены с системной шиной 23 через интерфейс жесткого диска 32, интерфейс магнитных дисков 33 и интерфейс оптического привода 34 соответственно. Приводы и соответствующие компьютерные носители информации представляют собой энергонезависимые средства хранения компьютерных инструкций, структур данных, программных модулей и прочих данных персонального компьютера 20.The
Настоящее описание раскрывает реализацию системы, которая использует жесткий диск 27, сменный магнитный диск 29 и сменный оптический диск 31, но следует понимать, что возможно применение иных типов компьютерных носителей информации 56, которые способны хранить данные в доступной для чтения компьютером форме (твердотельные накопители, флеш карты памяти, цифровые диски, память с произвольным доступом (ОЗУ) и т.п.), которые подключены к системной шине 23 через контроллер 55.The present description discloses an implementation of a system that uses a
Компьютер 20 имеет файловую систему 36, где хранится записанная операционная система 35, а также дополнительные программные приложения 37, другие программные модули 38 и данные программ 39. Пользователь имеет возможность вводить команды и информацию в персональный компьютер 20 посредством устройств ввода (клавиатуры 40, манипулятора «мышь» 42). Могут использоваться другие устройства ввода (не отображены): микрофон, джойстик, игровая консоль, сканнер и т.п. Подобные устройства ввода по своему обычаю подключают к компьютерной системе 20 через последовательный порт 46, который в свою очередь подсоединен к системной шине, но могут быть подключены иным способом, например, при помощи параллельного порта, игрового порта или универсальной последовательной шины (USB). Монитор 47 или иной тип устройства отображения также подсоединен к системной шине 23 через интерфейс, такой как видеоадаптер 48. В дополнение к монитору 47, персональный компьютер может быть оснащен другими периферийными устройствами вывода (не отображены), например, колонками, принтером и т.п.
Персональный компьютер 20 способен работать в сетевом окружении, при этом используется сетевое соединение с другим или несколькими удаленными компьютерами 49. Удаленный компьютер (или компьютеры) 49 являются такими же персональными компьютерами или серверами, которые имеют большинство или все упомянутые элементы, отмеченные ранее при описании существа персонального компьютера 20, представленного на Фиг. 9. В вычислительной сети могут присутствовать также и другие устройства, например, маршрутизаторы, сетевые станции, пиринговые устройства или иные сетевые узлы.The
Сетевые соединения могут образовывать локальную вычислительную сеть (LAN) 50 и глобальную вычислительную сеть (WAN). Такие сети применяются в корпоративных компьютерных сетях, внутренних сетях компаний и, как правило, имеют доступ к сети Интернет. В LAN- или WAN-сетях персональный компьютер 20 подключен к локальной сети 50 через сетевой адаптер или сетевой интерфейс 51. При использовании сетей персональный компьютер 20 может использовать модем 54 или иные средства обеспечения связи с глобальной вычислительной сетью, такой как Интернет. Модем 54, который является внутренним или внешним устройством, подключен к системной шине 23 посредством последовательного порта 46. Следует уточнить, что сетевые соединения являются лишь примерными и не обязаны отображать точную конфигурацию сети, т.е. в действительности существуют иные способы установления соединения техническими средствами связи одного компьютера с другим.Network connections can form a local area network (LAN) 50 and a wide area network (WAN). Such networks are used in corporate computer networks, internal networks of companies and, as a rule, have access to the Internet. In LAN or WAN networks,
В заключение следует отметить, что приведенные в описании сведения являются примерами, которые не ограничивают объем настоящего изобретения, определенного формулой. Специалисту в данной области становится понятным, что могут существовать и другие варианты осуществления настоящего изобретения, согласующиеся с сущностью и объемом настоящего изобретения.In conclusion, it should be noted that the information given in the description are examples, which do not limit the scope of the present invention defined by the claims. One skilled in the art will appreciate that there may be other embodiments of the present invention consistent with the spirit and scope of the present invention.
Claims (16)
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
RU2020108164A RU2748966C1 (en) | 2020-02-26 | 2020-02-26 | Method for synchronisation of anonymous identifiers |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
RU2020108164A RU2748966C1 (en) | 2020-02-26 | 2020-02-26 | Method for synchronisation of anonymous identifiers |
Publications (1)
Publication Number | Publication Date |
---|---|
RU2748966C1 true RU2748966C1 (en) | 2021-06-02 |
Family
ID=76301620
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
RU2020108164A RU2748966C1 (en) | 2020-02-26 | 2020-02-26 | Method for synchronisation of anonymous identifiers |
Country Status (1)
Country | Link |
---|---|
RU (1) | RU2748966C1 (en) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
RU2334362C2 (en) * | 2003-01-24 | 2008-09-20 | Коко Коммьюникейшнз Корп. | Method and device for safe data exchange and sharing of resources between anonymous parties which do not have trust relations, without central administration |
US20100064354A1 (en) * | 2006-12-01 | 2010-03-11 | David Irvine | Maidsafe.net |
US20100174911A1 (en) * | 2007-05-24 | 2010-07-08 | Nec Corporation | Anonymous authentication system and anonymous authentication method |
US20100199098A1 (en) * | 2009-02-02 | 2010-08-05 | Yahoo! Inc. | Protecting privacy of shared personal information |
US20110289322A1 (en) * | 2007-12-14 | 2011-11-24 | Rasti Mehran | Protected use of identity identifier objects |
-
2020
- 2020-02-26 RU RU2020108164A patent/RU2748966C1/en active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
RU2334362C2 (en) * | 2003-01-24 | 2008-09-20 | Коко Коммьюникейшнз Корп. | Method and device for safe data exchange and sharing of resources between anonymous parties which do not have trust relations, without central administration |
US20100064354A1 (en) * | 2006-12-01 | 2010-03-11 | David Irvine | Maidsafe.net |
US20100174911A1 (en) * | 2007-05-24 | 2010-07-08 | Nec Corporation | Anonymous authentication system and anonymous authentication method |
US20110289322A1 (en) * | 2007-12-14 | 2011-11-24 | Rasti Mehran | Protected use of identity identifier objects |
US20100199098A1 (en) * | 2009-02-02 | 2010-08-05 | Yahoo! Inc. | Protecting privacy of shared personal information |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN100390792C (en) | Uniform search system and method for selectively sharing distributed access-controlled documents | |
RU2766134C2 (en) | Method of anonymously sending data from a user device | |
US10986068B2 (en) | System and method for routing data when executing queries | |
US20100318782A1 (en) | Secure and private backup storage and processing for trusted computing and data services | |
US11397833B2 (en) | System and method for anonymously collecting malware related data from client devices | |
US11394764B2 (en) | System and method for anonymously transmitting data in a network | |
CN110324299B (en) | System and method for anonymously exchanging data between a server and a client | |
RU2748966C1 (en) | Method for synchronisation of anonymous identifiers | |
RU2755251C2 (en) | Method for obtaining anonymous data | |
RU2754967C1 (en) | Method of transferring anonymous data to an untrusted party | |
CN110324298B (en) | Systems, methods, and media for routing data when executing queries | |
RU2739862C2 (en) | Method for adaptive selection of user data transmission paths | |
EP3779758B1 (en) | System and method for anonymously transmitting data in a network | |
RU2707707C2 (en) | Method of transmitting data in client-server architecture when executing request | |
CN110324300B (en) | System and method for routing data during statistics collection | |
RU2773624C2 (en) | Method and system for data transmission to server using certifying center | |
EP3872668A1 (en) | System and method of anonymous sending of data from a user device to a recipient device | |
RU2749182C1 (en) | Method for transferring data to server using public key | |
RU2696227C1 (en) | Method of transmitting data in a client-server architecture | |
EP3971752B1 (en) | System and method for anonymously collecting malware related data from client devices | |
EP3757845A1 (en) | Systems and methods for anonymous and consistent data routing in a client-server architecture |