KR101652328B1 - Method and system for collecting data using anonymization method - Google Patents

Method and system for collecting data using anonymization method Download PDF

Info

Publication number
KR101652328B1
KR101652328B1 KR1020150143403A KR20150143403A KR101652328B1 KR 101652328 B1 KR101652328 B1 KR 101652328B1 KR 1020150143403 A KR1020150143403 A KR 1020150143403A KR 20150143403 A KR20150143403 A KR 20150143403A KR 101652328 B1 KR101652328 B1 KR 101652328B1
Authority
KR
South Korea
Prior art keywords
data
user
device
identifier
network
Prior art date
Application number
KR1020150143403A
Other languages
Korean (ko)
Inventor
정연돈
김수형
주재우
Original Assignee
고려대학교 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 고려대학교 산학협력단 filed Critical 고려대학교 산학협력단
Priority to KR1020150143403A priority Critical patent/KR101652328B1/en
Application granted granted Critical
Publication of KR101652328B1 publication Critical patent/KR101652328B1/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/62Protecting access to data via a platform, e.g. using keys or access control rules
    • G06F21/6218Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
    • G06F21/6245Protecting personal data, e.g. for financial or medical purposes
    • G06F21/6254Protecting personal data, e.g. for financial or medical purposes by anonymising data, e.g. decorrelating personal data from the owner's identification
    • GPHYSICS
    • G06COMPUTING; CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F15/00Digital computers in general; Data processing equipment in general
    • G06F15/16Combinations of two or more digital computers each having at least an arithmetic unit, a program unit and a register, e.g. for a simultaneous processing of several programs
    • GPHYSICS
    • G06COMPUTING; CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/62Protecting access to data via a platform, e.g. using keys or access control rules
    • G06F21/6218Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
    • G06F21/6245Protecting personal data, e.g. for financial or medical purposes
    • G06F21/6263Protecting personal data, e.g. for financial or medical purposes during internet communication, e.g. revealing personal data from cookies

Abstract

익명화 기법을 이용하나 데이터 수집 장치 및 이를 포함하는 데이터 수집 시스템에서의 데이터 수집 방법이 개시된다. One use of this technique anonymous data acquisition and data acquisition method in a data acquisition system including the same are disclosed. 데이터 수집 방법은 각각의 네트워크에 포함된 사용자 장치들 중 제1 사용자 장치가 상기 제1 사용자 장치를 제외한 사용자 장치들 각각으로부터 준-식별자(QI)를 수신하는 단계, 상기 제1 사용자 장치가 상기 준-식별자(QI)를 데이터 수집 장치로 송신하는 단계. Data collection method is a first user device of the user device included in each network, wherein the first semi-from each of the user devices other than the user device comprising: - receiving an identifier (QI), the first user device is the standard - sending the identifier (QI) to the data acquisition device. 상기 제1 사용자 장치가 k-익명화 기법을 이용하여 생성한 일반화된 준-식별자(GQI) 리스트를 데이터 수집 장치로부터 수신하는 단계, 상기 제1 사용자 장치가 상기 일반화된 준-식별자(GQI) 리스트를 상기 제1 사용자 장치를 제외한 사용자 장치들 각각으로 송신하는 단계; An identifier (GQI) List - steps, wherein the first semi-user device for receiving the common identifier (GQI) list from the data acquisition device, said first user device is a generalized semi-generated using the techniques k- anonymization transmitting to the user equipment other than the first user device, respectively; 각각의 네트워크에 포함된 사용자 장치들 중 제2 사용자 장치가 제2 사용자 장치를 제외한 사용자 장치들 각각으로부터 익명화된 데이터를 수신하는 단계, 및 상기 제2 사용자 장치가 상기 익명화된 데이터를 상기 데이터 수집 장치로 송신하는 단계를 포함하며, 상기 익명화된 데이터는 각각의 사용자 장치의 민감한 속성(SA)을 해당 사용자 장치의 일반화된 준-식별자(GQI)와 결합한 데이터이다. Each network user devices of the second user equipment and a second user other than the device receiving the data anonymous from the user equipment, respectively, and the second user device, wherein the data acquisition apparatus to said anonymous data contained in the data includes the step, the anonymous are transmitted to a standard generalization of the user equipment for sensitive attribute (SA) of each user device is coupled with a data identifier (GQI).

Description

익명화 기법을 이용한 데이터 수집 방법 및 시스템{METHOD AND SYSTEM FOR COLLECTING DATA USING ANONYMIZATION METHOD} Data collection method and system using the anonymizing techniques {METHOD AND SYSTEM FOR COLLECTING DATA USING ANONYMIZATION METHOD}

본 발명의 개념에 따른 실시 예는 익명화 기법을 이용한 데이터 수집 방법 및 시스템에 관한 것으로, 특히 익명화와 동시에 데이터를 수집함으로써 프라이버시가 보장되는 데이터 수집 방법 및 시스템에 관한 것이다. Embodiments in accordance with the concepts of the present invention relates to a data collection method and system that ensures privacy by collecting, and more particularly relates to a data at the same time as the anonymized data collection method and system using the anonymous method.

본 특허는 익명화 기법을 이용한 개인정보가 보호되는 데이터 수집 기법을 제시하고 있다. This patent presents a data acquisition technique that protects personal information using the anonymous method. 개인정보란 개인에 관한 정보 가운데 직ㆍ간접적으로 각 개인을 식별할 수 있는 정보를 가리키며, 해당 정보만으로는 특정 개인을 알아볼 수 없더라도 다른 정보와 쉽게 결합하여 알아볼 수 있는 것을 포함한다. Among personal information is information about an individual indicates the information that can identify an individual directly or indirectly, even if you can recognize a specific individual information alone that includes recognizable and easy to combine with other information.

개인정보가 포함된 데이터는 데이터 수집자(Data Collector, 예를 들어, 스마트 TV 제조사를 포함하는 기업, 병원, 정부 등의 여러 기관)에 의하여 수집되고 이용된다. The data includes personal information is collected by the data collector (the Data Collector, for example, several organizations, such as businesses, hospitals, and government, including smart TV manufacturers) are used. 데이터 수집자(특히, 기업)는 개인 맞춤형 서비스 등을 제공하기 위하여 고객 또는 사용자들의 방대한 개인정보를 수집하고 있다. Data collectors (especially businesses) has collected extensive personal information of the customer or user to provide such personalized service. 또한, 데이터 수집자는 수집된 데이터를 통합하여 제3의 기관(예를 들어, 데이터 분석 기관 등)에 데이터 분석을 의뢰할 수도 있다. In addition, the data collection The integrates the collected data of the engine 3 may be referred to in the data analysis (e. G., The data analysis engine, etc.). 이때, 수집된 개인정보는 정보주체의 민감한 정보를 포함하고 있기 때문에, 유출시 각종 범죄에 악용될 가능성이 있다. In this case, the personal information collected is likely to be exploited in various crimes City, spill because it contains sensitive information of the data subject.

일반적으로 통계적으로 수집된 데이터는 식별자(identifier), 준 식별자(quasi-identifier, QI), 민감한 속성(sensitive attribute, SA)으로 구분한다. Typically, statistically collected data is classified into ID (identifier), given identifier (quasi-identifier, QI), sensitive properties (sensitive attribute, SA). 개인의 신원을 명백히 나타내는 이름, 주민등록번호 등을 식별자라고 하며, 생년월일, 성별, 우편번호 등 개인의 특징을 나타내는 속성인 준 식별자는, 직접적으로 대상을 알 수는 없지만 조합을 통해 간접적으로 개인 식별이 가능한 속성이다. And that the individual's name, social security number, etc. clearly indicate the identity of the identifier attribute is given an identifier representing the individual characteristics such as birth date, gender, ZIP code, but you can directly tell the subject capable of indirectly personal identification through a combination a property. 또한, 민감한 속성은 데이터 테이블이 제공하고자 하는 개인의 민감한 정보를 나타낸다. In addition, sensitive attribute indicates the sensitive personal information to provide the data table.

일반적으로 민감한 속성에 대한 정보를 제공하기 위해, 식별자를 제거하고 준 식별자를 익명화함으로써 프라이버시 보호를 수행하는데, 종래의 익명화 기법을 이용한 데이터 수집 방법은 데이터 수집 이후에 익명화 기법을 적용하고 있다. To provide general information about the sensitive properties, to perform a privacy protection by removing the identifier and the anonymous identifier given, the data collection method using the conventional technique is anonymous and applying the anonymous method after the data acquisition.

등록 특허 10-1513769호에서는 개인정보 보호를 위한 데이터관리에서 익명성을 보장하는 별명 사용 기법을 개시하고 있지만, 상기 별명 사용 기법은 데이터를 수집한 후에 적용되므로, 최초 수집된 데이터가 노출될 경우 민감한 속성들이 식별자 또는 준 식별자와 함께 노출될 위험이 존재한다. In the Patent No. 10-1513769, but discloses a technique using an alias to ensure the anonymity in data management for privacy, because the alias used technique is applied after collecting data, when the first acquisition data is exposed sensitive this property will be exposed to risks with quasi-identifier or identifiers exist.

따라서, 민감한 개인 정보가 식별 정보와 함께 노출되는 것을 방지할 수 있는 데이터 수집 방법 및 장치가 요구된다. Thus, a data acquisition method and apparatus which can prevent the sensitive information to be exposed together with the identification information is required.

본 발명이 이루고자 하는 기술적인 과제는 익명화 기법을 이용하여 프라이버시를 보장하는 데이터 수집 방법 및 장치를 제공하는 것이다. Technical Problem The present invention is to provide a data collection method and apparatus to ensure the privacy by using the anonymous method.

특히, 익명화와 동시에 데이터 수집을 제공함으로써, 즉, 데이터 수집 장치가 사용자 장치로부터 익명화된 데이터를 수신함으로써, 사용자의 민감한 정보가 사용자의 식별 정보와 결합하여 노출되는 것을 방지하는 데이터 수집 방법 및 장치를 제공하는 것이다. In particular, by providing the data collected at the same time as the anonymous, that is, by receiving a data anonymized data collection device from the user device, the data acquisition method and apparatus for preventing sensitive information of the user and which is exposed in combination with the identity of the user to provide.

또한, 일반화된 준-식별자(GQI)를 이용하여 민감한 속성을 익명화함으로써, 데이터 수집자의 수집 목적에 맞도록 익명화된 데이터를 수집할 수 있다. Further, a generalized semi-by anonymizing sensitive property by using the identifier (GQI), it is possible to collect the data to match the anonymous collection object's data collection.

본 발명의 실시 예에 따른 데이터 수집 장치 및 적어도 둘 이상의 네트워크를 형성하는 복수의 사용자 장치를 포함하는 데이터 수집 시스템에 있어서, 데이터 수집 방법은 각각의 네트워크(i)에 포함된 적어도 k i (k i 는 2 이상의 자연수) 개의 사용자 장치들 중 제1 사용자 장치가 상기 적어도 k i 개의 사용자 장치들 중 상기 제1 사용자 장치를 제외한 사용자 장치들 각각으로부터 준-식별자(quasi-idenfifier ; QI)를 수신하는 단계, 상기 제1 사용자 장치가 수신된 상기 준-식별자(QI)를 데이터 수집 장치로 송신하는 단계, 상기 제1 사용자 장치가 데이터 수집 장치에서 k-익명화 기법을 이용하여 생성한 일반화된 준-식별자(generalized QI ; GQI) 리스트를 데이터 수집 장치로부터 수신하는 단계, 상기 제1 사용자 장치가 상기 일반화된 준-식별자(GQI) 리스트를 상기 적어 A data collection system comprising a plurality of user equipment that forms the data acquisition device and at least two or more networks in accordance with an embodiment of the present invention, the data collection method is at least k i (k i included in each of the networks (i) receiving a QI); identifier (quasi-idenfifier - is given from each of the user equipment that the first user equipment of the natural number of 2 or more) of the user device and the at least other than the first user device of the k i of the user equipment the first user equipment is received the semi-identifier (QI) steps, the first user device is a standard generalized generated using the techniques in the k- anonymized data collection device to be transmitted to the data acquisition device identifier ( note the identifiers (GQI) list - GQI) steps, the first user device is given the generalized for receiving from the data acquisition device list; generalized QI 도 k i 개의 사용자 장치들 중 상기 제1 사용자 장치를 제외한 사용자 장치들 각각으로 송신하는 단계, 상기 적어도 k i 개의 사용자 장치들 중 제2 사용자 장치가 상기 적어도 k i 개의 사용자 장치들 중 상기 제2 사용자 장치를 제외한 사용자 장치들 각각으로부터 익명화된 데이터를 수신하는 단계, 및 상기 제2 사용자 장치가 상기 익명화된 데이터를 상기 데이터 수집 장치로 송신하는 단계를 포함한다. Of FIG k i of the user devices of the first user, except for devices transmitting to the user equipment, respectively, the at least a second user device of the k i of the user device and the at least k i of the user equipment and the second the steps, and the data, the second user device is the anonymous for receiving the anonymous data from each of the user devices other than the user equipment comprises the step of transmitting to the data acquisition device.

본 발명의 실시예에 따른 데이터 수집 방법은 익명화와 동시에 데이터 수집이 가능하다. Data acquisition method according to an embodiment of the present invention is at the same time with anonymous data collection. 즉, 데이터 수집 장치가 익명화된 데이터를 수집함으로써, 익명화되지 않는 개인 정보 등이 유출되는 것을 방지할 수 있는 효과가 있다. That is, there is an effect that, by collecting the data acquisition device anonymous data, to prevent the personal information, such as leakage is not anonymous.

또한, 본 발명에 실시예에 따른 데이터 수집 방법은 네트워크 그룹별로 임의의 제1 리더 사용자 장치와 제2 리더 사용자 장치를 선출하고, 각각의 리더가 각 단계별 필요 데이터를 수집한 후 데이터 수집자에게 전송함으로써 사용자의 민감한 속성(SA) 정보가 준-식별자(QI) 등의 식별정보와 결합하여 유출되는 것을 방지할 수 있는 효과가 있다. In addition, the data acquisition method according to an embodiment of the present invention is transmitted to the election of any of the first reader user device and a second reader user devices, each reader is collected for each step requires the data after the data collector by each network group there is an effect that it is possible to prevent the outflow by coupling with the identification information such as the identifier (QI) - by the user of the sensitive nature (SA) information is given.

본 발명의 상세한 설명에서 인용되는 도면을 보다 충분히 이해하기 위하여 각 도면의 상세한 설명이 제공된다. A detailed description of each drawing is provided in order to fully understand the drawings referred to in detailed description of the invention.
도 1은 본 발명의 일 실시예에 따른 데이터 수집 시스템의 개략도이다. 1 is a schematic diagram of a data acquisition system in accordance with one embodiment of the present invention.
도 2는 도 1에 도시된 데이터 수집 장치의 기능 블럭도이다. 2 is a functional block diagram of the data acquisition device shown in Fig.
도 3은 도 1에 도시된 사용자 단말의 기능 블럭도이다. Figure 3 is a functional block diagram of the user terminal shown in Fig.
도 4는 본 발명의 일 실시예에 따른 데이터 수집 시스템을 이용한 프라이버시를 포장하는 데이터 수집 방법을 설명하기 위한 흐름도이다. 4 is a flowchart illustrating a data collection method for the packing of privacy using a data acquisition system in accordance with one embodiment of the present invention.
도 5는 본 발명의 일 실시예에 따른 사용자 장치가 개인정보를 포함하는 데이터를 수집하여 데이터 수집 장치로 전송하는 알고리즘을 도시한다. Figure 5 shows the algorithm for collecting and transmitting to the data acquisition unit the data that the user apparatus according to an embodiment of the present invention include personal information.
도 6은 본 발명의 일 실시예에 따른 데이터 수집 장치의 데이터 수집 알고리즘을 도시한다. Figure 6 illustrates a data acquisition algorithm of the data acquisition apparatus according to an embodiment of the present invention.
도 7은 데이터 사용자 장치가 스마트 TV인 경우 사용자의 TV 로그를 수집하는 방법을 설명하기 위한 흐름도이다. 7 is a flowchart illustrating a method of collecting a user's TV log data when the user equipment in the smart TV.

본 명세서에 개시되어 있는 본 발명의 개념에 따른 실시 예들에 대해서 특정한 구조적 또는 기능적 설명은 단지 본 발명의 개념에 따른 실시 예들을 설명하기 위한 목적으로 예시된 것으로서, 본 발명의 개념에 따른 실시 예들은 다양한 형태들로 실시될 수 있으며 본 명세서에 설명된 실시 예들에 한정되지 않는다. As being with respect to embodiments in accordance with the concepts of the invention disclosed herein certain structural or functional description is illustrated for the purpose of describing the embodiment according to only the concept of the invention, embodiments in accordance with the concept of the invention It can be embodied in various forms and is not limited to the embodiments described herein.

본 발명의 개념에 따른 실시 예들은 다양한 변경들을 가할 수 있고 여러 가지 형태들을 가질 수 있으므로 실시 예들을 도면에 예시하고 본 명세서에서 상세하게 설명하고자 한다. Embodiments in accordance with the concepts of the present invention may be added a variety of changes can be to illustrate in the drawings of the embodiments may have various forms, and described in detail herein. 그러나, 이는 본 발명의 개념에 따른 실시 예들을 특정한 개시 형태들에 대해 한정하려는 것이 아니며, 본 발명의 사상 및 기술 범위에 포함되는 모든 변경, 균등물, 또는 대체물을 포함한다. This, however, is by no means to restrict the embodiment in accordance with the concept of the invention to the particular form disclosed, and includes all included in the spirit and scope of the present invention changes, equivalents, or substitutes.

제1 또는 제2 등의 용어는 다양한 구성 요소들을 설명하는데 사용될 수 있지만, 상기 구성 요소들은 상기 용어들에 의해 한정되어서는 안 된다. Although the first term or the second, etc. may be used in describing various elements, but the above elements shall not be restricted to the above terms. 상기 용어들은 하나의 구성 요소를 다른 구성 요소로부터 구별하는 목적으로만, 예컨대 본 발명의 개념에 따른 권리 범위로부터 벗어나지 않은 채, 제1 구성 요소는 제2 구성 요소로 명명될 수 있고 유사하게 제2 구성 요소는 제1 구성 요소로도 명명될 수 있다. These terms are only to distinguish one component from another component, for example, without departing from the scope of the concept of the present invention, the first component is similarly could be termed a second element second component may be named as a first component.

본 명세서에서 사용한 용어는 단지 특정한 실시 예를 설명하기 위해 사용된 것으로서, 본 발명을 한정하려는 의도가 아니다. The term as used herein is merely used to describe particular embodiments, and are not intended to limit the present invention. 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다. Expression in the singular number include a plural forms unless the context clearly indicates otherwise. 본 명세서에서, "포함하다" 또는 "가지다" 등의 용어는 본 명세서에 기재된 특징, 숫자, 단계, 동작, 구성 요소, 부분품 또는 이들을 조합한 것이 존재함을 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성 요소, 부분품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다. In this specification, the "inclusive" or "gajida" terms, such as is that which you want to specify that it is present features, numbers, steps, operations, elements, parts or combinations thereof in combination as described herein, one or more other features , numbers, steps, actions, components, parts, or the presence or possibility of combinations thereof and are not intended to preclude.

다르게 정의되지 않는 한, 기술적이거나 과학적인 용어를 포함해서 여기서 사용되는 모든 용어들은 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 것과 동일한 가진다. Unless otherwise defined, including technical and scientific terms, all terms used herein have the same as commonly understood by one of ordinary skill in the art. 일반적으로 사용되는 사전에 정의되어 있는 것과 같은 용어들은 관련 기술의 문맥상 가지는 의미와 일치하는 의미를 갖는 것으로 해석되어야 하며, 본 명세서에서 명백하게 정의하지 않는 한, 이상적이거나 과도하게 형식적인 의미로 해석되지 않는다. Any term that is defined in a general used dictionary are to be interpreted as having the same meaning in the context of the relevant art, unless otherwise defined explicitly in the present specification, not be interpreted to have an idealistic or excessively formalistic meaning no.

이하, 본 명세서에 첨부된 도면들을 참조하여 본 발명의 실시 예들을 상세히 설명한다. With reference to the accompanying drawings in this specification will be described in detail the embodiments of the invention.

도 1 내지 도 3을 참조하여, 본 발명의 일 실시예에 따른 익명화 기법을 이용한 데이터 수집 장치 및 이를 포함하는 데이터 수집 시스템, 데이터 수집 장치에 대해 상술한다. 1 to 3 to be described for the data acquisition and the data collection system, data collection device including the same using the anonymous technique in accordance with an embodiment of the present invention.

도 1은 본 발명의 일 실시예에 따른 데이터 수집 시스템(10)을 도시한다. Figure 1 illustrates a data collection system 10 in accordance with one embodiment of the present invention. 도 1을 참조하면, 데이터 수집 시스템(10)은 데이터 수집 장치(100) 및 복수의 사용자 장치(210, 220, 230, 310, 320, 330)를 포함한다. 1, the data acquisition system 10 includes a data collection device 100 and a plurality of user devices (210, 220, 230, 310, 320, 330).

각각의 사용자 장치는 네트워크 망을 통하여 다른 사용자 장치 또는 데이터 수집 장치(300)와 통신할 수 있다. Each user device may communicate with other user devices or the data collection device 300 through the network access. 일 실시예에 따른 네트워크 망은, 개방형 인터넷, 폐쇄형 인트라넷을 포함한 유선 인터넷망, 이동 통신망과 연동된 무선 인터넷 통신망뿐만 아니라, 각종 데이터 통신이 가능한 컴퓨터 네트워크 등의 가능한 통신 수단을 포함하는 넓은 개념이다. Network network, in accordance with an embodiment, as well as the open Internet, the wireless Internet network in conjunction with a wired Internet network, a mobile communication network including a closed Intranet, a wide concept, including the possible communication means, such as various types of data communication is a computer network .

도 1에 도시된 바와 같이, 복수의 사용자 장치들은 복수의 네트워크 그룹(i)을 구성한다. 1, the plurality of user equipment are configured for a plurality of network groups (i). 일부 사용자 장치(210, 220, 230)들은 제1 그룹(200)을 형성하고, 나머지 사용자 장치(310, 320, 330)들은 제2 그룹(300)을 형성할 수 있다. Some user devices (210, 220, 230) include a first group 200 a and the other user equipment (310, 320, 330) and forming may form a second group (300). 바람직하게는 제1 그룹(200)과 제2 그룹(300)은 AD-HOC 네트워크일 수 있다. Preferably, the first group 200 and second group 300 may be AD-HOC network.

도 1에는 총 2개의 네트워크 그룹(200, 300)이 도시되어 있으나, 데이터 수집 시스템(10)에 포함되는 네트워크 그룹의 개수(m)는 2 이상일 수 있다. Figure 1 shows the number (m) of the network group comprises a total of two network groups (200, 300) is are illustrated, the data acquisition system 10 may be 2 or more. 또한, 도1에서는 각 네트워크 그룹에 총 3개의 사용자 장치가 포함되어 있으나, 각 네트워크 그룹을 구성하는 사용자 장치의 개수(k i )는 3 이상일 수 있다. In addition, in Figure 1, but includes a total of three user apparatus to each network group, the number (k i) of the user equipment to configure each network group may be three or more. 이때, 각 네트워크 그룹을 구성하는 사용자 장치의 개수(k i )의 최대값(n)을 미리 설정할 수 있다. At this time, it is possible to set the maximum number (n) of the number (k i) of the user equipment to configure each network group in advance.

도 2는 도 1에 도시된 데이터 수집 장치(100)의 기능 블럭도이다. 2 is a functional block diagram of the data collection device 100 shown in FIG.

데이터 수집 장치(300)는 데이터 수집자(예를 들어, 병원, 웹 서비스 공급자, 소셜 네트워크 서비스 공급자 등)의 장치를 의미한다. Data collection device 300 refers to a device for data collectors (for example, hospitals, web service providers, social networks, service providers, etc.). 데이터 수집 장치는 익명화되어 수집된 데이터를 통합하여 제3의 기관(예를 들어, 데이터 분석 전문기관 등)에 제공할 수 있다. Data acquisition apparatus can be integrated to the collected anonymous data to provide a third of the engine (e. G., Data Analyst, etc.).

도 2를 참조하면, 데이터 수집 장치(100)는 GQI 생성부(110), 통신부(170), 저장부(180), 및 제어부(190)를 포함한다. 2, the data collection device 100 comprises a GQI generation unit 110, communication unit 170, storage unit 180, and controller 190.

GQI 생성부(110)는 제어부(190)의 제어하에, k-익명화 기법을 이용하여 준-식별자(QI) 리스트로 일반화된 준-식별자(GQI)리스트를 생성한다. GQI generator 110 is given by, using a k- anonymization techniques under the control of a controller 190 - generates an identifier (GQI) List - a quasi generalized identifier (QI) list.

통신부(170)는 제어부(190)의 제어하에, 복수의 사용자 장치와 통신을 수행할 수 있다. The communication unit 170 under the control of the controller 190, may perform the plurality of user equipment and communication. 구체적으로 통신부(170)는 각각의 네트워크 그룹의 제1 리더 사용자 장치로부터 준-식별자(QI) 리스트를 수신할 수 있으며, 각각의 네트워크 그룹의 제1 리더 사용자 장치에 일반화된 준-식별자(GQI) 리스트를 전송할 수 있다. Specifically, the communication unit 170 is given from the first reader a user equipment in each network group-identifier, the first reader a standard generalized to a user equipment (QI) list can receive, and each network group-identifier (GQI) It can send the list. 또한, 통신부(170)는 각각의 네트워크 그룹의 제2 리더 사용자 장치로부터 일반화된 준-식별자(GQI)와 민감한 속성(SA)이 결합한 익명화된 데이터를 수신할 수 있다. Further, the communication unit 170 is a standard generalized from a second reader device, the user of each network group - can receive the anonymous data are combined identifier (GQI) and the sensitive nature (SA).

저장부(180)는 프로그램 저장부와 데이터 저장부를 포함할 수 있으며, 상기 프로그램 저장부에는 데이터 수집 장치(100)의 동작을 제어하기 위한 프로그램들이 저장될 수 있다. Storage unit 180 may include a program storage section and data storage, wherein the program storage unit has a program for controlling the operation of the data collection device 100 may be stored. 상기 데이터 저장부에는 상기 프로그램들을 수행하는 과정 중에 발생되는 데이터들이 저장될 수 있다. The data storage portion has a data to be stored is generated in the course of execution of the programs.

제어부(190)는 데이터 수집 장치(100)의 전반적인 동작을 제어한다. The controller 190 controls the overall operation of the data collection device 100. 즉, GQI 생성부(110), 통신부(170), 및 저장부(180)의 동작을 제어할 수 있다. That is, it is possible to control the operation of the GQI generation unit 110, communication unit 170, and storage unit 180.

도 3은 도 1에 도시된 제1 그룹의 제1 사용자 장치(210)의 기능 블럭도이다. 3 is a functional block diagram of the first group the first user device 210 shown in FIG.

사용자 장치들(210, 220, 230, 310, 320, 330)는 데이터 수집 장치(100)에 데이터를 제공하는 장치이며, 예를 들어, 스마트 TV, 휴대전화기, 스마트폰, 노트북 컴퓨터, 태블릿 PC, 전자책 단말기, 디지털 방송용 단말기, 또는 네비게이션 등 다양한 기기일 수 있다. The user equipment (210, 220, 230, 310, 320, 330) is a device that provides data to the data collection device 100, for example, a smart TV, a mobile phone, a smart phone, a laptop computer, a tablet PC, such as e-book terminal, a digital broadcast terminal, or navigation may be a variety of devices.

도 3을 참조하면, 제1 그룹의 제1 사용자 장치(210)는 익명화 모듈(211), 검증 모듈(212), 통신 모듈(217), 메모리(218), 및 제어 모듈(219)을 포함한다. 3, the first user equipment 210 in the first group includes the anonymizing module 211, verification module 212, a communication module 217, a memory 218, and control module 219 .

본 명세서에서 사용되는 모듈이라 함은 본 발명의 기술적 사상을 수행하기 위한 하드웨어 및 상기 하드웨어를 구동하기 위한 소프트웨어의 기능적, 구조적 결합을 의미할 수 있다. Module as used herein also may refer to a functional and structural combination of software for driving the hardware, and the hardware for performing the invention. 예컨대, 상기 모듈은 소정의 코드와 상기 소정의 코드가 수행되기 위한 하드웨어 리소스의 논리적인 단위를 의미할 수 있으며, 반드시 물리적으로 연결된 코드를 의미하거나 한 종류의 하드웨어를 의미하는 것은 아니다. For example, the module may refer to a logical unit of a hardware resource to be a predetermined code with the predetermined code does not necessarily means a means a physically connected code or a type of hardware.

제1 그룹의 제1 사용자 장치(210)는 제1 리더로 선출된 사용자 장치일 수 있다. The first user device 210 of the first group may be a user apparatus selected as the first reader. 제1 리더 사용자 장치(210)는 제1 그룹의 제1 리더 사용자 장치(210)를 제외한 나머지 사용자 장치들(220, 230)로부터 준-식별자(QI)를 수집하여 데이터 수집 장치(100)에 전달하는 역할을 할 수 있다. A first reader user device 210 has a first reader in a user equipment remaining user devices other than the (210) standard from 220 (230) of the first group-transferring the identifier to collect (QI) data collection device 100 It may serve to.

제1 그룹의 제1 사용자 장치(210)의 익명화 모듈(211)은 제어모듈(219)의 제어 하에, 사용자 장치(210)의 일반화된 준-식별자(GQI)와 민감한 속성(SA)을 결합하여 익명화된 데이터를 생성한다. Anonymization module 211 of a first user device 210 of the group of quasi-generalization of under control of the control module 219, a user equipment (210) to combine the identifier (GQI) and the sensitive nature (SA) to produce an anonymous data.

검증 모듈(212)은 제어모듈(219)의 제어 하에, 데이터 수집 장치(100)로부터 수신한 일반화된 준-식별자(GQI) 리스트가 정당하게 생성되고 전송된 리스트인지 여부를 검증한다. Validation module 212 is a standard generalized received from the data collection device 100 under the control of the control module (219) generates the identifiers (GQI) list parties is verified whether or not the transmission list.

통신 모듈(217)은 데이터 수집 장치(100) 또는 동일 네트워크 그룹(예를 들어, AD-HOC 네트워크)에 포함된 사용자 장치들(220, 230)과 데이터를 송·수신할 수 있다. Communication module 217 is a data collection device 100 or in the same network group (e. G., AD-HOC network) may receive the song data and the user devices 220 and 230 included in the. 구체적으로, 사용자 장치들(220, 230)로부터 준-식별자(QI)를 수집하고, 수집한 준-식별자(QI) 리스트를 데이터 수집 장치(100)에 전송할 수 있다. Specifically, the user equipment from the quasi-220 (230) may transmit the identifier (QI) lists the data acquisition device 100-identifier acquisition and the semi-collecting (QI). 또한, 데이터 수집 장치(100)로부터 일반화된 준-식별자(GQI) 리스트를 수신할 수 있다. Furthermore, the generalization given from the data collection device 100 - may receive an identifier (GQI) list.

메모리(218)는 프로그램 메모리와 데이터 메모리를 포함할 수 있으며, 제어 모듈(219)는 사용자 장치(210)의 전반적인 동작을 제어한다. Memory 218 may include a program memory and data memory, the control module 219 controls the overall operation of user device 210. The

나머지 사용자 장치의 경우, 제1 그룹의 제1 리더 사용자 장치(210)와 구성 및 기능이 동일 또는 유사하므로 구체적인 설명은 생략한다. For the rest of the user equipment, since in the first group the first user device reader 210 and configurations and functions are the same or similar detailed description thereof will be omitted.

다만, 각각의 그룹의 제2 리더 사용자 장치(220, 320)은 제2 리더로 선출된 사용자 장치일 수 있다. However, the second reader user equipment (220, 320) of each group may be a user apparatus selected as the second reader. 제2 리더 사용자 장치(220, 320)는 각각의 그룹의 제2 리더 사용자 장치(220, 320)를 제외한 나머지 사용자 장치들(210, 230, 310, 330)로부터 익명화 모듈에서 생성된 익명화된 데이터(GGI+SA)를 수집하여 데이터 저장 장치(100)에 전달하는 역할을 한다. A second reader user equipment (220, 320) is an anonymous data generated by anonymization module from the rest of the user devices other than the second reader user equipment (220, 320) of each group (210, 230, 310, 330) ( collects GGI + SA) serves to transfer the data storage device 100.

이하, 도 4 내지 도 7을 참조하여, 본 발명의 일 실시예에 따른 데이터 수집 시스템 이용한 익명화 기법을 사용하여 프라이버시를 보장하는 데이터 수집 방법에 대하여 자세히 살펴보도록 한다. With reference to figures 4 to 7, by using the anonymous method using a data acquisition system in accordance with one embodiment of the present invention will take a closer look to the data collection method for ensuring privacy.

도 4는 도 1에 도시한 데이터 수집 시스템을 이용한 프라이버시를 보장하는 데이터 수집 방법을 설명하기 위한 흐름도이다. Figure 4 is a flow diagram illustrating a data acquisition method that guarantees privacy using the data acquisition system shown in Fig. 도 5는 도 1에 도시한 사용자 장치가 데이터를 수집하여 데이터 수집 장치로 전송하는 알고리즘이고, 도 6은 도 1에 도시한 데이터 수집 장치의 데이터 수집 알고리즘이다. Figure 5 is an algorithm for transferring a data collection device by showing user equipment collects data in Figure 1, Figure 6 is a data acquisition algorithm of the data acquisition device shown in Fig. 도 7은 예를 들어, 데이터 사용자 장치가 스마트 TV인 경우 사용자의 TV 로그를 수집하는 방법을 설명하기 위한 흐름도이다. 7 is, for example, if the user data device is the smart TV is a flowchart illustrating a method of collecting a user's TV log.

도 4를 참조하면, 먼저 적어도 둘 이상의 사용자 장치들은 m(m은 2 이상의 자연수)개의 네트워크 그룹을 형성한다(S100). Referring to Figure 4, the at least two user devices to form a network group m (m is a natural number equal to or greater than 2) (S100). 상기 네트워크는 AD-HOC 네트워크일 수 있으며, 예를 들어, AD-HOC 네트워크를 구성하는 방법은 아래와 같다. The network may be an AD-HOC network, for example, how to configure the AD-HOC network is as follows.

AD-HOC 네트워크에 참가하고 있지 않은 사용자 장치는 자신의 존재를 브로드캐스트하여 주변 사용자 장치에 알린다. User devices that are not participating in the AD-HOC network informs around the user's device to broadcast their presence. 다음, 상기 브로드캐스트를 수신한 사용자 장치는 자신이 속한 AD-HOC 네트워크의 크기가 미리 설정된 n(n은 2 이상의 자연수) 이하인 경우, 상기 브로드캐스트를 전송한 사용자 장치와 AD-HOC 네트워크를 구성하기를 요청한다. Next, the user device receives the broadcast is not more than n (n is a natural number of 2 or more) the size of the AD-HOC network to which he belongs is previously set, configuring the broadcast by the user device and the AD-HOC network, transmitting a the requests.

상기 브로드캐스트를 전송한 사용자 장치가 아직 다른 AD-HOC 네트워크에 참가하고 있지 않은 경우, 요청을 수락하고 해당 AD-HOC 네트워크의 참가자가 되고, 해당 사용자 장치가 네트워크의 새로운 참가자가 되었다는 사실을 AD-HOC 네트워크의 모든 참가자에게 전파한다. If the user device transmits the broadcast are not yet participating in other AD-HOC network, accept the request, and the participants of the AD-HOC network, AD- the fact that the user equipment that a new participant in the network It propagates to all participants of the HOC network.

각각의 네트워크 그룹(200, 300)의 사용자 장치(들)는 해당 네트워크 그룹에 참여한 사용자 장치 중에서 랜덤하게 제1 리더 사용자 장치를 선출한다(S200). Each user device (s) of the network group (200, 300) shall select the first user device reader user equipment randomly from participating in the network group (S200). 예를 들어, 제1 그룹(200)에 포함된 사용자 장치들(210, 220, 230) 중에서 제1 그룹의 제1 리더 사용자 장치(210)를 선출하고, 제2 그룹(300)에 포함된 사용자 장치들(310, 320, 330) 중에서 제2 그룹의 제1 리더 사용자 장치(310)를 선출한다. For example, the users included in the first group 200, the user devices (210, 220, 230) from the first group of first reader user device 210 Election, and the second group 300, the included first of the second group from a device (310, 320, 330), elect a leader user device 310. the

이때, 제1 리더 또는 제2 리더를 선출하는 주체는 해당 네트워크 그룹에 속한 사용자 장치 전부 또는 일부 있으며, 본 실시예와 달리, 해당 네트워크 그룹에 속하지 않는 제3의 장치일 수도 있다. At this time, the subject of selecting the first or the second reader is a reader in whole or in part, a user equipment that are part of the network group, and, unlike the present embodiment, it may be a third party device does not belong to the network group.

각각의 네트워크 그룹에 참여한 사용자 장치들 중 상기 제1 리더(210, 310)를 제외한 사용자 장치들은 각각의 그룹의 제1 리더 사용자 장치(210, 310)에 해당 장치의 사용자의 준-식별자(QI)를 전송하고(S310), 각 그룹의 제1 리더 사용자 장치(210, 310)들은 제1 리더를 제외한 사용자 장치(220, 320)들 각각으로부터 준-식별자(QI)를 수신한다(S320). Each except one of the user devices participating in the network group, the first reader (210, 310) the user equipment are who the user of the device to the first reader user equipment (210, 310) of each group-identifier (QI) transport and (S310), a first reader user equipment (210, 310) in each group are first given from each of the user equipment (220, 320) except the first reader-receives the identifier (QI) (S320).

상기 각 그룹의 제1 리더 사용자 장치(210, 310)는 해당 그룹에 속하는 사용자 장치들로부터 수집한 준-식별자(QI)들, 즉 해당 그룹의 준-식별자(QI) 리스트를 데이터 수집 장치(100)로 전송한다(S330). Wherein in each group the first reader user equipment (210, 310) is collected from the user equipment belonging to the group of quasi-identifier (QI), that is in the group quasi-identifier (QI) lists the data acquisition device (100 ) and transmits it to (S330). 이때, 준-식별자(QI) 리스트는 제1 리더 사용자 장치(210, 310)의 준 식별자(QI)를 포함한다. The identifier (QI) list comprises a semi identifier (QI) of the first reader user equipment (210, 310) In this case, the quasi.

예를 들어, 사용자 장치가 스마트 TV이고, 민감한 속성(SA)은 TV 로그(Logs, 예를 들어 Adult, Sport, News, Drama 등)인 경우, 도 7(a)를 참조하면, 그룹의 제1 리더인 A(또는 C)가 해당 그룹의 참가자 B(또는 D)로부터 민감한 속성(SA)를 제외한 준-식별자(QI)를 수신하여, 해당 그룹의 준-식별자(QI) 리스트를 생성하고, 이를 데이터 수집자(Data collector)에 전송한다. For example, if the user device is a smart TV, sensitive attribute (SA) is a TV log (Logs, for example, Adult, Sport, News, Drama, and so on) in the case, Referring to Figure 7 (a), the first of the group receiving an identifier (QI), gave the group-leader a (or C) is given except for the sensitive nature (SA) from participant B (or D) in the group and to generate the identifier (QI) list, which and it transmits to the data collector (data collector).

데이터 수집 장치(100)는 각 그룹의 제1 리더 사용자 장치(210, 310)들로부터 수집한 준-식별자(QI) 리스트를 수신하고(S340), k-익명화 기법을 이용하여 일반화된 준-식별자(GQI) 리스트를 생성하여(S410), 각 그룹의 제1 리더 사용자 장치(210, 310)들에게 전송한다(S420). Data collection device 100 includes a first reader user equipment (210, 310) of a given collected from each group-identifier (QI), and list received (S340), k- anonymous generalized using the techniques give a - ID to generate (GQI) list (S410), and transmits to the reader a first user equipment (210, 310) in each group (S420).

예를 들어, 사용자 장치가 스마트 TV인 경우, 도 7(b)를 참조하면, 데이터 수집자는 제1 리더(A, C)들로부터 전송받은 QI 리스트를 이용하여 GQI 리스트를 생성하고, 이를 각각의 네트워크 그룹의 제1 리더(A, C)들에게 전송한다. For example, the user equipment when the case Smart TV of, with reference to FIG. 7 (b), data collection The first reader using QI list transmitted from the (A, C) generating a GQI list, each of them and it transmits to the reader a first (a, C) of the network group.

각 그룹의 제1 리더 사용자 장치(210, 310)들은 데이터 수집 장치(100)로부터 해당 네트워크 그룹 참가자의 일반화된 준-식별자(GQI) 리스트를 수신하고(S430), 수신한 일반화된 준-식별자(GQI) 리스트의 정당성을 검증한다(S500). A first reader user equipment (210, 310) have a common level of the network group participants from the data collection unit 100 of each group received an identifier (GQI) list, and (S430), receiving a generalized semi-identifier ( GQI) to verify the validity of the list (S500).

사용자 장치가 일반화된 준-식별자(GQI) 리스트가 데이터 수집 장치(100)로부터 정당하게 생성되고 전송된 일반화된 준-식별자(GQI) 리스트인지 여부를 검증하는 방법에 대하여 자세히 살펴보도록 한다. The user equipment is generalized quasi-identifier (GQI) lists the data acquisition device with a generalized generated from duly 100 are transmitted quasi-to look at in detail with respect to the method for verifying whether the identifiers (GQI) list.

먼저, 일반화된 준-식별자(GQI) 리스트를 검증하고자 하는 제1 리더 사용자 장치, 예를 들어 제1 그룹의 제1 리더 사용자 장치(210)는 전송받은 일반화된 준-식별자(GQI) 리스트에 포함된 각각의 일반화된 준-식별자(GQI)를 자신을 제외한 나머지 m-1개의 그룹의 제1 리더 사용자 장치(310)도 보유하고 있는지 여부를 확인한다. First, a generalized semi-identifier first reader user equipment, that (GQI) to verify the list, for example the first reader user equipment 210 in the first group of the given common received-included in the identifier (GQI) list each of the generalized quasi-identifiers (GQI) with the exception of their m-1 groups of the first user device reader 310 to determine whether the road holding. 자신을 제외한 나머지 네트워크 그룹의 모든 제1 리더 사용자 장치들이 해당 일반화된 준-식별자(GQI)를 보유하고 있는 경우, 해당 일반화된 준-식별자(GQI)는 유효한 것으로 간주한다. If you have an identifier (GQI), the corresponding generalized semi-all of the first user device to the reader a generalized level of the rest of the network group except their own identifier (GQI) is considered to be valid.

일반화된 준-식별자(GQI) 리스트에 포함된 각각의 일반화된 준-식별자(GQI)를 순차적으로 검증할 수 있다. Each generalized gave included in the identifier (GQI) list-generalized given an identifier (GQI) can be verified by one. 이와는 달리, 전체 리스트를 동시에 검증하는 것도 가능하다. Alternatively, it is also possible to verify the complete list at the same time.

검증이 완료된 후, 각 그룹의 제1 리더 사용자 장치(210, 310)들은 해당 그룹에 참여한 사용자 장치(220, 230, 320, 330)들에게 일반화된 준-식별자(GQI)를 전송한다(S610, S620). After verification is complete, the first reader user equipment (210, 310) of each group are a standard generalized to the users participating in the group of devices (220, 230, 320, 330) transmits the identifier (GQI) (S610, S620).

본 실시예와는 달리, 각 그룹의 제1 리더 사용자 장치(210, 310)가 아닌, 각 그룹의 다른 사용자 장치(220, 230, 320, 330)를 임의로 선출하여 해당 장치가 제1 사용자 장치(210, 310) 또는 데이터 수집 장치(100)로부터 일반화된 준-식별자(GQI) 리스트를 수신하고 상기 검증 단계(S500)를 별도로 수행하는 것도 가능하다. Unlike the present embodiment, each group of the first reader user equipment (210, 310) is not, to elect the respective other user equipment in the group (220, 230, 320, 330), optionally the first user that the device unit ( 210, 310) or the quasi generalized from the data collection device 100 - receiving an identifier (GQI) list, and it is also possible to perform the verification step (S500) separately.

본 실시예와 달리, 각 그룹의 제1 리더 사용자 장치(210, 310)가 각 그룹의 참가한 사용자 장치들(220, 230, 320, 330)에 일반화된 준-식별자(GQI) 리스트를 전송하는 단계(S610, S620)를 먼저 수행한 후, 각각의 사용자 장치들이 다른 사용자 장치들과 일반화된 준-식별자(GQI) 리스트를 공유하며 상기 일반화된 준-식별자(GQI) 리스트의 정당성을 검증할 수도 있다. Unlike this embodiment, the first reader user equipment (210, 310) is a quasi generalized to the participating user equipment in each group (220, 230, 320, 330) of each group-identifier (GQI) transmitting the list may verify the validity of the identifier (GQI) list - a quasi-the common share the identifiers (GQI) list, each of the user devices to a standard generalized to other user device after performing a (S610, S620) first, .

다음, 각각의 네트워크 그룹에 참여한 사용자 장치 중에서 랜덤하게 제2 리더 사용자 장치(220, 320)를 선출한다(S700). Next, at random from each of the user devices participating in the network group elect a leader second user equipment (220, 320) (S700). 제2 리더 선출 단계는 도 4에 도시된 흐름도에 한정되지 아니하며, 네트워크 그룹 형성(S100) 이후, 제2 리더 사용자 장치가 익명화된 데이터(GQI+SA)를 수집(S810, S820)단계 사이에 수행할 수 있다. A second leader election step is carried out between Fig shall not be limited to the flow chart shown in Figure 4, data group formation (S100) Then, the second reader user equipment, the data anonymous (GQI + SA) collecting (S810, S820) step can do. 예를 들어, 제1 리더 선출(S100)과 동시에 제2 리더(S700)를 선출하는 것도 가능하다. For example, first it is possible to at the same time as the leader election (S100) elect a second reader (S700).

정보 주체의 민감한 속성(SA)이 준-식별자(QI)와 직접 연결되어 유출되는 것을 방지하기 위하여, 바람직하게는 제1 리더 사용자 장치(210, 310)와 제2 리더 사용자 장치(220, 320)는 서로 다르다. So as to prevent the identifier is directly connected to outflow and (QI), preferably from the first reader a user equipment (210, 310) and the second reader user equipment (220, 320) data subject sensitive attribute (SA) is given in They are different from each other.

각각의 네트워크 그룹에 참여한 사용자 장치들 중 상기 제2 리더(220, 320)를 제외한 사용자 장치들(210, 230, 310, 330)은 각각의 그룹의 제2 리더 사용자 장치(220, 320)에 해당 장치의 사용자의 익명화된 데이터(GQI+SA)를 전송한다(S810, S820). The second reader user devices other than the (220, 320) (210, 230, 310, 330) of a user equipment involved in each network group corresponds to the second reader user equipment (220, 320) of each group It transmits the anonymous data of the user device (GQI + SA) (S810, S820). 즉, 각각의 사용자 장치들은 정보주체인 사용자의 민감한 속성(SA)을 사용자의 일반화된 준-식별자(GQI)와 결합한 익명화된 데이터(GQI+SA)를 각각의 사용자 장치가 속한 네트워크 그룹의 제2 리더 사용자 장치(220, 320)에 전송(S810)하고, 제2 리더 사용자 장치(220, 320)는 자신의 익명화된 데이터(GQI+SA)와 함께 해당 그룹의 나머지 사용자 장치들의 익명화된 데이터(GQI+SA)를 수집(S820)한다. That is, each of the user equipment are common in the user information subject is the user sensitive attribute (SA) gave - the identifier (GQI) combined with anonymous data (GQI + SA) to a second of the network groups in which each user apparatus leaders sent to the user device (220, 320) (S810), and the second reader user equipment (220, 320) is the of his in the group together with the anonymous data (GQI + SA) remaining user equipment anonymous data (GQI a + SA) is collected (S820).

상기 각 그룹의 제2 리더 사용자 장치(220, 320)는 해당 그룹에 속하는 사용자 장치들로부터 수집한 익명화된 데이터(GQI+SA)들, 즉, 익명화된 데이터(GQI+SA) 리스트를 데이터 수집 장치(100)로 전송한다(S830, S840). Wherein each group of the second reader user equipment (220, 320) is one anonymous data collected from the user equipment belonging to the group (GQI + SA), that is, data collection device the anonymous data (GQI + SA) list and transmits it to (100) (S830, S840).

예를 들어, 사용자 장치가 스마트 TV인 경우, 도 7(c)를 참조하면, 각 네트워크 그룹의 제2 리더들(B, D)은 해당 네트워크에 참가한 스마트 TV(A, C)들로부터 해당 사용자의 일반화된 준-식별자(GQI)와 해당 사용자의 민감한 속성(SA)인 TV 로그를 결합한 익명화된 민감한 속성 정보(GQI+SA), 즉, 익명화된 데이터를 수신하고, 해당 그룹의 익명화된 데이터 리스트를 생성하여 데이터 수집자에 전송할 수 있다. For example, if the user device is a smart TV, Referring to Figure 7 (c), the second leader for each network group (B, D) are those from the smart TV (A, C) that participated in the network users the semi generalization of-identifier (GQI) and the user's sensitive attribute (SA) the anonymized sensitive attribute information that combine TV log (GQI + SA), i.e., received, and the anonymous data of the group to the anonymous data list the transfer can be produced by the party collecting the data.

본 발명의 일 실시예에 따른 데이터 수집 장치(100) 및 이를 포함하는 데이터 수집 시스템(10)은 데이터 수집 장치(100)가 각각의 사용자 장치들로부터 1:1로 데이터를 수집하지 아니하고 임의로 선출된 사용자 장치를 통하여 데이터를 수집한 후 수집된 데이터를 수신하므로, 사용자 장치의 IP주소 등이 식별자로 사용되어 민감한 속성이 유출되는 것을 방지할 수 있다. A data acquisition system 10, including data collection device 100 and the same according to one embodiment of the present invention, data acquisition device 100 1 from the respective user equipment: nor collecting data in one randomly chosen Since receiving the collected data and then collects the data through a user device, such as the IP address of a user equipment identifier is used as it is possible to prevent the sensitive nature to leak.

또한, 준-식별자(QI) 수집 단계와 민감한 속성 수집 단계를 분리하고, k-익명화 기법을 이용함으로써, 익명화와 동시에 데이터 수집을 수행할 수 있으며, 이를 통하여 정보주체인 각각의 사용자의 민감한 속성(SA)이 준-식별자(QI) 등의 식별 정보와 함께 유출되는 것을 방지할 수 있다. In addition, quasi-identifier (QI) collection phase and the separation sensitive property acquisition step, and, by using a k- anonymization techniques, it is possible to perform data acquisition at the same time as the anonymization, through which data subject of each user of the sensitive nature ( can be prevented from flowing out together with the identification information such as the identifier (QI) - SA) is given.

본 발명은 도면에 도시된 실시 예를 참고로 설명되었으나 이는 예시적인 것에 불과하며, 본 기술 분야의 통상의 지식을 가진 자라면 이로부터 다양한 변형 및 균등한 타 실시 예가 가능하다는 점을 이해할 것이다. The present invention has been described for the embodiment shown in the drawings as it will be understood that it is the only, and those skilled in the art from available various modifications and equivalent other embodiments this being exemplary. 따라서, 본 발명의 진정한 기술적 보호 범위는 첨부된 등록청구범위의 기술적 사상에 의해 정해져야 할 것이다. Therefore, the true technical protection scope of the invention as defined by the technical spirit of the appended claims registration.

10 : 데이터 수집 시스템 10: Data Acquisition System
100 : 데이터 수집 장치 100: data collection devices
200 : 제1 그룹 200: a first group
210, 220, 230 : 제1 그룹의 사용자 장치 210, 220, and 230: the user equipment of the first group
300 : 제2 그룹 300: second group
310, 320, 330 : 제2 그룹의 사용자 장치 310, 320, 330: the user equipment of the second group

Claims (8)

  1. 데이터 수집 장치 및 적어도 둘 이상의 네트워크를 형성하는 복수의 사용자 장치를 포함하는 데이터 수집 시스템에 있어서, A data collection device and a data collection system including at least a plurality of user devices to form more than one network,
    각각의 네트워크(i)에 포함된 적어도 k i (k i 는 2 이상의 자연수) 개의 사용자 장치들 중 제1 사용자 장치가 상기 적어도 k i 개의 사용자 장치들 중 상기 제1 사용자 장치를 제외한 사용자 장치들 각각으로부터 준-식별자(quasi-idenfifier ; QI)를 수신하는 단계; The at least k i (k i is a natural number of 2 or more) number of the user devices of the first user device is at least k i of the user devices of the user devices other than the first user device included in each network, (i), respectively receiving a;; identifier (QI quasi-idenfifier) ​​- quasi from
    상기 제1 사용자 장치가 상기 준-식별자(QI)를 데이터 수집 장치로 송신하는 단계; And transmitting the identifier (QI) to the data acquisition device, said first user device is the standard;
    상기 제1 사용자 장치가 데이터 수집 장치에서 k-익명화 기법을 이용하여 생성한 일반화된 준-식별자(generalized QI ; GQI) 리스트를 데이터 수집 장치로부터 수신하는 단계; Receiving a; (GQI generalized QI) list from the data acquisition device; identifier of the first user device is k- anonymous generalized generated using the techniques given in the data acquisition device
    상기 제1 사용자 장치가 상기 일반화된 준-식별자(GQI) 리스트를 상기 각각의 네트워크(i)에 포함된 적어도 k i 개의 사용자 장치들 중 상기 제1 사용자 장치를 제외한 사용자 장치들 각각으로 송신하는 단계; Sending to the identifier (GQI) lists the exception of at least the k i of the user devices of the first user device included in each network, (i) the user equipment respectively, said first user device is the generalized gave .;
    상기 각각의 네트워크(i)에 포함된 상기 적어도 k i 개의 사용자 장치들 중 제2 사용자 장치가 상기 적어도 k i 개의 사용자 장치들 중 상기 제2 사용자 장치를 제외한 사용자 장치들 각각으로부터 익명화된 데이터를 수신하는 단계; Receiving data anonymous from the said at least k i of the user devices of the second user device, the at least k i of the user equipment to the first user device other than the second user equipment of the included in the respective network (i), respectively the method comprising; And
    상기 제2 사용자 장치가 상기 익명화된 데이터를 상기 데이터 수집 장치로 송신하는 단계를 포함하되, Comprising the step of second transmitting the user device the anonymous data to the data acquisition device,
    상기 익명화된 데이터는 상기 복수의 사용자 장치 각각의 민감한 속성(SA)을 상기 복수의 사용자 장치 각각의 일반화된 준-식별자(GQI)와 결합한 데이터인, The identifier (GQI) and the combined data, wherein the anonymous data of the plurality of user equipment each sensitive attribute (SA) of the generalized each of the plurality of user equipment gave
    데이터 수집 시스템의 데이터 수집 방법. Data collection methods of data collection systems.
  2. 제1항에 있어서, According to claim 1,
    상기 각각의 네트워크에 포함된 적어도 하나의 사용자 장치가 상기 데이터 수집 장치로부터 수신한 일반화된 준-식별자(GQI) 리스트를 검증하는 단계;를 더 포함하는 데이터 수집 시스템의 데이터 수집 방법. Data collection method of the data acquisition system further comprising: a; verifying the identifier (GQI) list at least one user equipment that the received generalized from the data collection device who are included in the respective network.
  3. 제2항에 있어서, 3. The method of claim 2,
    상기 일반화된 준-식별자(GQI) 리스트를 검증하는 단계는, Generalized semi-verifying the identifier (GQI) list,
    상기 복수의 네트워크 중 어느 하나의 네트워크의 상기 제1 사용자 장치가 상기 데이터 수집 장치로부터 수신한 일반화된 준-식별자(GQI)를 상기 제1 사용자 장치가 속한 네트워크를 제외한 네트워크의 제1 사용자 장치 각각에 송신하는 단계; A first user device of the network, excluding the identifier (GQI) the first network belongs to a first user device respectively any one of a network of the first user device is a generalization of the standard is received from the data collection device of the plurality of network transmitting; And
    상기 제1 사용자 장치가 속한 네트워크를 제외한 네트워크의 제1 사용자 장치 각각으로부터 상기 일반화된 준-식별자(GQI)의 보유 여부를 수신하고, 상기 일반화된 준-식별자(GQI)의 유효 여부를 판단하는 단계;를 포함하는, Determining the validity of the identifier (GQI) - first the generalized given from the first user device, each of the network other than the user device, the network belonging-receiving existence of the identifier (GQI), and wherein the generalized gave containing;
    데이터 수집 시스템의 데이터 수집 방법. Data collection methods of data collection systems.
  4. 제1항에 있어서, According to claim 1,
    상기 복수의 네트워크는 AD-HOC 네트워크인, The plurality of network is the AD-HOC network,
    데이터 수집 시스템의 데이터 수집 방법. Data collection methods of data collection systems.
  5. 익명화 기법을 이용하여 데이터를 수집하는 데이터 수집 장치에 있어서, Using an anonymous method in a data acquisition device for gathering data,
    상기 데이터 수집 장치가 각각의 네트워크(i)에 포함된 적어도 k i (k i 는 2 이상의 자연수) 개의 사용자 장치들 중 제1 사용자 장치들 각각으로부터 준-식별자(QI) 리스트를 수신하는 단계 - 상기 준-식별자(QI) 리스트는 상기 제1 사용자 장치가 상기 제1 사용자 장치가 속하는 네트워크에 포함된 상기 적어도 k i 개의 사용자 장치들 중 상기 제1 사용자 장치를 제외한 사용자 장치들 각각으로부터 준-식별자(QI)를 수신하여 생성한 리스트임; Receiving an identifier (QI) list-the data acquisition apparatus is at least k i given from the first user equipment in each of the (k i is a natural number of 2 or more) of the user device included in each network, (i) the quasi-identifier (QI) list is given from the first user device is a user equipment, except for the at least k i of the user above of the device of the first user device included in the network belonging to a first user device respectively identifiers ( list that is generated by receiving the QI) Im;
    상기 데이터 수집 장치가 k-익명화 기법을 이용하여 일반화된 준-식별자(GQI) 리스트를 생성하는 단계; Generating an identifier (GQI) List - a quasi generalized by which the data acquisition device using a k- anonymization techniques;
    상기 데이터 수집 장치가 상기 일반화된 준-식별자(GQI) 리스트를 상기 각각의 네트워크의 제1 사용자 장치들에게 송신하는 단계; And transmitting the identifier (GQI) list for the first user device of said each network, the data acquisition device is the generalized semi;
    상기 데이터 수집 장치가 상기 각각의 네트워크(i)에 포함된 상기 적어도 k i 개의 사용자 장치들 중 제2 사용자 장치들 각각으로부터 익명화된 데이터를 수신하는 단계;를 포함하되, Comprising: a,; the data collection device comprising: receiving data from each of said anonymous each network (i) k i of the at least one user of the second user equipment device comprises a
    상기 익명화된 데이터는 상기 적어도 k i 개의 사용자 장치들 중 제2 사용자 장치가 상기 적어도 k i 개의 사용자 장치들 중 상기 제2 사용자 장치를 제외한 사용자 장치들 각각으로부터 수집한 데이터이며, 각각의 사용자 장치의 민감한 속성(SA)을 해당 사용자 장치의 일반화된 준-식별자(GQI)와 결합한 데이터인, It said anonymous data of said is at least one data collection from the k i of the user devices of the second user device is a user equipment at least the exception of the second user device of the k i of the user equipment, respectively, and each user apparatus the identifier (GQI) and combines the data, - sensitive properties (SA) to a generalization of the standard user device,
    데이터 수집 장치를 이용한 데이터 수집 방법. Data collection method using a data acquisition system.
  6. 제5항에 있어서, 6. The method of claim 5,
    상기 제1 사용자 장치와 상기 제2 사용자 장치는 서로 다른 장치인, The first user device and the second user device is a different device,
    데이터 수집 장치를 이용한 데이터 수집 방법. Data collection method using a data acquisition system.
  7. 데이터 수집 장치에 익명화된 데이터를 제공하는 사용자 장치에 있어서, In the user equipment to provide an anonymous data to the data acquisition device,
    상기 사용자 장치가 인접한 적어도 하나 이상의 사용자 장치와 AD-HOC 네트워크를 형성하는 단계; Step in which the user equipment is formed adjacent the at least one user equipment and the AD-HOC network;
    상기 사용자 장치가 상기 네트워크의 제1 리더 사용자 장치가 아닌 경우 상기 사용자 장치는 상기 네트워크의 상기 제1 리더 사용자 장치에 준-식별자(QI)를 송신하고, 상기 사용자 장치가 상기 네트워크의 제1 리더 사용자 장치인 경우 상기 사용자 장치는 상기 네트워크를 형성하는 사용자 장치 중 상기 제1 리더 사용자 장치를 제외한 사용자 장치들 각각으로부터 준-식별자(QI)를 수집하여 상기 네트워크의 준-식별자(QI) 리스트를 상기 데이터 수집 장치로 전송하고 상기 데이터 수집 장치로부터 일반화된 준-식별자(GQI) 리스트를 수신하여 상기 네트워크를 형성하는 사용자 장치 중 상기 제1 리더 사용자 장치를 제외한 사용자 장치들 각각에 전송하는 단계; The user equipment if the user equipment is not the first reader user device of the network is the first reader conform to the user equipment in the network - a first reader user transmits the identifier (QI), and the user device and the network If the device is a user equipment of the first reader who from each of the user devices other than the user device of the user equipment to form the network, the data identifier (QI) list-identifier given in the network to collect (QI) transmitting to each of the user devices of the user devices other than the first user device reader for receiving a list identifier (GQI) forming the network-transferred to the collecting device and the semi generalized from the data acquisition device;
    상기 사용자 장치가 상기 네트워크의 제2 리더 사용자 장치가 아닌 경우 상기 사용자 장치는 상기 네트워크의 상기 제2 리더 사용자 장치에 익명화된 데이터를 송신하고, 상기 사용자 장치가 상기 네트워크의 제2 리더 사용자 장치인 경우 상기 사용자 장치는 상기 네트워크를 형성하는 사용자 장치 중 상기 제2 리더 사용자 장치를 제외한 사용자 장치들 각각으로부터 익명화된 데이터를 수집하여 상기 데이터 수집 장치로 전송하는 단계;를 포함하되, The user, the device is the user device is a second reader user equipment transmits the data anonymous to the second reader user equipment in the network, and the user device and the network is not a second reader user equipment in the network comprising: a,; the user equipment comprises the steps of: by a user equipment to form the network collects the anonymous data from each of the user devices other than the second reader user device sent to the data acquisition system
    상기 익명화된 데이터는 상기 네트워크를 형성하는 복수의 사용자 장치 각각의 민감한 속성(SA)을 상기 사용자 장치 각각의 일반화된 준-식별자(GQI)와 결합한 데이터인, The anonymized sensitive data is each attribute (SA) to the user equipment each generalized gave a plurality of user devices forming the network, the identifier (GQI) and the combined data,
    사용자 장치의 데이터 제공 방법. Data providing method of a user equipment.
  8. 익명화 기법을 이용한 데이터 수집 장치에 있어서, A data collection device using the anonymizing techniques,
    각각의 네트워크(i)에 포함된 적어도 k i (k i 는 2 이상의 자연수) 개의 사용자 장치들 중 제1 사용자 장치로부터 수신한 준-식별자(QI) 리스트를 이용하여 일반화된 준-식별자(GQI) 리스트를 생성하는 GQI 생성부, At least k i who received from the first user device of the (k i is a natural number of 2 or more) of the user device included in each network, (i) - generalized by using the identifier (QI) list quasi-identifier (GQI) GQI generator for generating a list,
    상기 제1 사용자 장치로부터 상기 준-식별자(QI) 리스트를 수신하고 상기 제1 사용자 장치에 상기 일반화된 준-식별자(GQI) 리스트를 송신하며, 상기 각각의 네트워크(i)에 포함된 적어도 k i (k i 는 2 이상의 자연수) 개의 사용자 장치들 중 제2 사용자 장치로부터 익명화된 데이터를 수신하는 통신부, 및 The first semi wherein the user device receives the identifier (QI) list and the quasi-The common to the first user device transmits the identifier (GQI) list and the at least k i included in each of the networks (i) the second of the (k i is a natural number of 2 or more) of the user communication device for receiving data from the anonymous user device, and
    상기 준-식별자(QI) 리스트, 상기 일반화된 준-식별자(GQI) 리스트, 및 상기 익명화된 데이터를 저장하는 저장부를 포함하되, Comprising an identifier (GQI) list, and a storage unit for storing the anonymous data, wherein the quasi-identifier (QI) of the list, the common semi-
    상기 제1 사용자 장치로부터 수신한 상기 준-식별자(QI) 리스트는 상기 제1 사용자 장치가 상기 적어도 k i 개의 사용자 장치들 중 상기 제1 사용자 장치를 제외한 사용자 장치들 각각으로부터 수집하여 생성한 리스트이며, Wherein the receiving from a first user device, a quasi-identifier (QI) list of the first user device is said is at least a list created by collecting from each of the user equipment of the k i of the user devices other than the first user device ,
    상기 익명화된 데이터는 상기 제2 사용자 장치가 상기 적어도 k i 개의 사용자 장치들 중 상기 제2 사용자 장치를 제외한 사용자 장치들 각각으로부터 수집한 데이터이고, 각각의 사용자 장치의 민감한 속성(SA)을 해당 사용자 장치의 상기 일반화된 준-식별자(GQI)와 결합한 데이터인, 데이터 수집 장치. Said anonymous data corresponding to the sensitive nature (SA) of the second and the user device is the at least one data collection from each of said first user device other than the second user equipment of the k i of user devices, each user device user the device of the generalized quasi-identifier (GQI) and the data, data collection devices combined.
KR1020150143403A 2015-10-14 2015-10-14 Method and system for collecting data using anonymization method KR101652328B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020150143403A KR101652328B1 (en) 2015-10-14 2015-10-14 Method and system for collecting data using anonymization method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020150143403A KR101652328B1 (en) 2015-10-14 2015-10-14 Method and system for collecting data using anonymization method

Publications (1)

Publication Number Publication Date
KR101652328B1 true KR101652328B1 (en) 2016-08-31

Family

ID=56877492

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020150143403A KR101652328B1 (en) 2015-10-14 2015-10-14 Method and system for collecting data using anonymization method

Country Status (1)

Country Link
KR (1) KR101652328B1 (en)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20070028942A (en) * 2005-09-08 2007-03-13 삼성전자주식회사 Method and apparatus for collecting data
KR20120023836A (en) * 2009-05-29 2012-03-13 노키아 코포레이션 Method and apparatus for engaging in a service or activity using an ad-hoc mesh network
KR20130118959A (en) * 2011-02-15 2013-10-30 얀마 가부시키가이샤 Data collection device and system communicating therewith
KR20140099539A (en) * 2011-12-07 2014-08-12 액세스 비지니스 그룹 인터내셔날 엘엘씨 Behavior tracking and modification system

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20070028942A (en) * 2005-09-08 2007-03-13 삼성전자주식회사 Method and apparatus for collecting data
KR20120023836A (en) * 2009-05-29 2012-03-13 노키아 코포레이션 Method and apparatus for engaging in a service or activity using an ad-hoc mesh network
KR20130118959A (en) * 2011-02-15 2013-10-30 얀마 가부시키가이샤 Data collection device and system communicating therewith
KR20140099539A (en) * 2011-12-07 2014-08-12 액세스 비지니스 그룹 인터내셔날 엘엘씨 Behavior tracking and modification system

Similar Documents

Publication Publication Date Title
Laurila et al. The mobile data challenge: Big data for mobile computing research
Strufe Safebook: A privacy-preserving online social network leveraging on real-life trust
Fire et al. Online social networks: threats and solutions
US9141823B2 (en) Abstraction layer for default encryption with orthogonal encryption logic session object; and automated authentication, with a method for online litigation
Perera et al. Big data privacy in the internet of things era
US20090055267A1 (en) Internet advertising brokerage apparatus, systems, and methods
US8474017B2 (en) Identity management and single sign-on in a heterogeneous composite service scenario
US9721086B2 (en) Methods and systems for secure and reliable identity-based computing
US8291474B2 (en) Using opaque groups in a federated identity management environment
Dorri et al. Blockchain in internet of things: challenges and solutions
US20120215898A1 (en) Applications of a Network-Centric Information Distribution Platform on the Internet
Jin et al. Towards active detection of identity clone attacks on online social networks
US9807100B2 (en) System and method for private social networking
US20100100967A1 (en) Secure collaborative environment
CN103140890A (en) Method and apparatus for voice signature authentication
US8589372B2 (en) Method and system for automated document registration with cloud computing
US20140287723A1 (en) Mobile Applications For Dynamic De-Identification And Anonymity
JP2012529715A (en) Integration of updates to social networking services
US20140089062A1 (en) Voting systems and voting methods based on smart mobile communication devices
US7913291B2 (en) Means and method for control of personal data
US20130097308A1 (en) Collecting asymmetric data and proxy data on a communication network
US20080105742A1 (en) Device and method of electronic voting using mobile terminal
US8832795B2 (en) Using a communications network to verify a user searching data
CN104641591B (en) A method and apparatus for providing access to shared data based on the trust level of the control
Seigneur Trust, security and privacy in global computing

Legal Events

Date Code Title Description
E701 Decision to grant or registration of patent right
GRNT Written decision to grant