KR102507480B1 - Method and Apparatus for De-identifying Location Information - Google Patents

Method and Apparatus for De-identifying Location Information Download PDF

Info

Publication number
KR102507480B1
KR102507480B1 KR1020210091098A KR20210091098A KR102507480B1 KR 102507480 B1 KR102507480 B1 KR 102507480B1 KR 1020210091098 A KR1020210091098 A KR 1020210091098A KR 20210091098 A KR20210091098 A KR 20210091098A KR 102507480 B1 KR102507480 B1 KR 102507480B1
Authority
KR
South Korea
Prior art keywords
identification
location information
regions
unit
area
Prior art date
Application number
KR1020210091098A
Other languages
Korean (ko)
Other versions
KR20230010485A (en
Inventor
유정범
김명환
정진우
Original Assignee
주식회사 메쉬코리아
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 메쉬코리아 filed Critical 주식회사 메쉬코리아
Priority to KR1020210091098A priority Critical patent/KR102507480B1/en
Priority to PCT/KR2022/003170 priority patent/WO2023286968A1/en
Publication of KR20230010485A publication Critical patent/KR20230010485A/en
Application granted granted Critical
Publication of KR102507480B1 publication Critical patent/KR102507480B1/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/62Protecting access to data via a platform, e.g. using keys or access control rules
    • G06F21/6218Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
    • G06F21/6245Protecting personal data, e.g. for financial or medical purposes
    • G06F21/6254Protecting personal data, e.g. for financial or medical purposes by anonymising data, e.g. decorrelating personal data from the owner's identification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/62Protecting access to data via a platform, e.g. using keys or access control rules
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/20Image enhancement or restoration using local operators
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/11Region-based segmentation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W12/00Security arrangements; Authentication; Protecting privacy or anonymity
    • H04W12/02Protecting privacy or anonymity, e.g. protecting personally identifiable information [PII]

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computer Security & Cryptography (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Bioethics (AREA)
  • Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Signal Processing (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Software Systems (AREA)
  • Computer Hardware Design (AREA)
  • Databases & Information Systems (AREA)
  • Medical Informatics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

위치 정보의 비식별화 방법 및 장치가 개시된다. 본 발명의 일실시예에 따른 위치 정보의 비식별화 방법은 사용자들의 위치 정보를 포함하는 전체 영역 및 익명성 임계치를 식별하는 단계; 상기 전체 영역을 복수의 단위 영역들로 구분하는 단계; 상기 단위 영역들 각각에 포함된 위치 정보의 수를 결정하는 단계; 및 상기 익명성 임계치 및 상기 단위 영역들 각각에 포함된 위치 정보의 수에 기초하여, 상기 단위 영역들을 그룹핑(grouping)함으로써 비식별화 영역들을 생성하는 단계를 포함할 수 있다. A method and apparatus for de-identifying location information are disclosed. A method for de-identifying location information according to an embodiment of the present invention includes identifying an entire region including location information of users and an anonymity threshold; Dividing the entire area into a plurality of unit areas; determining the number of location information included in each of the unit areas; and generating non-identified regions by grouping the unit regions based on the anonymity threshold and the number of location information included in each of the unit regions.

Description

위치 정보의 비식별화 방법 및 장치 {Method and Apparatus for De-identifying Location Information} Method and Apparatus for De-identifying Location Information {Method and Apparatus for De-identifying Location Information}

본 발명은 위치 정보의 비식별화 방법 및 장치에 관한 것으로, 보다 구체적으로는, 개인의 위치 정보들을 비식별화함에 있어, 비식별화된 데이터의 익명성과 사용성을 최대화하기 위한 기술에 관한 것이다. The present invention relates to a method and apparatus for de-identifying location information, and more particularly, to a technique for maximizing anonymity and usability of de-identified data in de-identifying individual location information.

최근, 빅데이터를 분석한 결과를 이용하여 제공되는 서비스가 늘어나고 있다. 예를 들어, 등 빅데이터를 이용한 서비스의 종류는 사용자들에게 편의를 제공할 수 있으며, 그 종류도 무한할 수 있다. Recently, services provided using the results of analyzing big data are increasing. For example, the types of services using big data can provide convenience to users, and the types can be infinite.

다만, 빅데이터로 사용되는 사용자들의 주소 정보, 의료 기록, 신상 정보와 같은 정보는 개인 정보이기 때문에, 활용함에 있어 개인의 동의 등 법적 제한이 따를 수 있다. 따라서, 개인 정보들을 비식별화(de-identification)하는 기술이 요구된다. However, since information such as address information, medical records, and personal information of users used as big data is personal information, legal restrictions such as individual consent may follow when using it. Therefore, a technique for de-identifying personal information is required.

개인 정보들을 비식별화하는 기술에서, 비식별화되는 정도가 과도하게 커질 경우, 비식별화된 데이터의 활용도가 떨어질 수 있고, 비식별화되는 정도가 과도하게 낮을 경우, 개인 정보가 식별될 수 있는 가능성이 있어, 이러한 사용성(usability) 및 익명성(anonymity)을 적절히 고려되어야 한다. In the technology of de-identifying personal information, if the degree of de-identification becomes excessively large, the utilization of de-identified data may decrease, and if the degree of de-identification is excessively low, personal information may not be identified. possibility, such usability and anonymity should be properly considered.

본 발명은 사용자들의 개인 정보 중 사용자의 주소와 같은 위치 정보들을 비식별화함에 있어, 전체 영역을 복수의 단위 영역들로 구분하고, 익명성 임계치에 따라 인접한 단위 영역들을 그룹핑함으로써, 사용성과 익명성을 최대화할 수 있는 비식별화 방법 및 장치를 제공한다. In the present invention, in de-identifying location information such as a user's address among personal information of users, the entire area is divided into a plurality of unit areas, and adjacent unit areas are grouped according to an anonymity threshold, thereby improving usability and anonymity. Provides a de-identification method and device that can maximize

또한, 본 발명은 다른 종류의 개인 정보가 맵핑된 위치 정보들을 비식별화하여 다차원의 비식별화 영역을 생성함으로써, 다차원적 분석이 가능하도록 하는 비식별화 방법 및 장치를 제공한다.In addition, the present invention provides a de-identification method and apparatus that enable multi-dimensional analysis by de-identifying location information to which different types of personal information are mapped to create a multi-dimensional de-identification area.

또한, 본 발명은 단위 영역이나, 익명성 임계치를 실시예들에 따라 다르게 설정함으로써, 사용성과 익명성을 조절할 수 있는 비식별화 방법 및 장치를 제공한다. In addition, the present invention provides a de-identification method and apparatus capable of adjusting usability and anonymity by setting a unit area or an anonymity threshold differently according to embodiments.

본 발명의 일실시예에 따른 위치 정보의 비식별화 방법은 사용자들의 위치 정보를 포함하는 전체 영역 및 익명성 임계치를 식별하는 단계; 상기 전체 영역을 복수의 단위 영역들로 구분하는 단계; 상기 단위 영역들 각각에 포함된 위치 정보의 수를 결정하는 단계; 및 상기 익명성 임계치 및 상기 단위 영역들 각각에 포함된 위치 정보의 수에 기초하여, 상기 단위 영역들을 그룹핑(grouping)함으로써 비식별화 영역들을 생성하는 단계를 포함할 수 있다. A method for de-identifying location information according to an embodiment of the present invention includes identifying an entire region including location information of users and an anonymity threshold; Dividing the entire area into a plurality of unit areas; determining the number of location information included in each of the unit areas; and generating non-identified regions by grouping the unit regions based on the anonymity threshold and the number of location information included in each of the unit regions.

상기 생성되는 비식별화 영역의 수는, 상기 익명성 임계치가 낮을수록 증가하고, 상기 익명성 임계치가 높을수록 감소할 수 있다. The number of generated de-identification regions may increase as the anonymity threshold is lower, and may decrease as the anonymity threshold is higher.

상기 비식별화 영역들을 생성하는 단계는, 상기 단위 영역들 중 임의의 단위 영역에 포함되는 위치 정보들의 수가 상기 익명성 임계치 보다 낮은 경우, 상기 임의의 단위 영역에 인접하는 단위 영역과 그룹핑하여 상기 비식별화 영역을 결정할 수 있다. The generating of the non-identification areas may include grouping with a unit area adjacent to the random unit area when the number of pieces of location information included in any one of the unit areas is lower than the anonymity threshold. Identification area can be determined.

상기 비식별화 영역들을 생성하는 단계는, 상기 비식별화 영역에 포함된 위치 정보들의 수가 상기 익명성 임계치보다 낮은 경우, 상기 비식별화 영역에 인접한 단위 영역과 상기 비식별화 영역을 그룹화할 수 있다. In the generating of the non-identification regions, when the number of location information included in the non-identification region is lower than the anonymity threshold, a unit region adjacent to the non-identification region and the non-identification region may be grouped. there is.

상기 생성된 비식별화 영역들 각각에 포함된 위치 정보들의 수는, 상기 익명성 임계치 보다 크거나 같을 수 있다. The number of location information included in each of the generated non-identification areas may be greater than or equal to the anonymity threshold.

상기 비식별화 영역들을 생성하는 단계는, 상기 단위 영역들을 서로 다른 복수의 방식으로 그룹핑하여 복수의 비식별화 영역들의 조합들을 생성하고, 상기 생성되는 비식별화 영역들의 조합들 중 사용성 평가 결과가 가장 높은 비식별화 영역들의 조합을 최종적인 비식별화 결과로 결정하는 단계를 더 포함할 수 있다. The generating of the non-identification regions may include grouping the unit regions in a plurality of different ways to create combinations of a plurality of non-identification regions, and a usability evaluation result of the combinations of the generated non-identification regions The method may further include determining a combination of highest de-identification regions as a final de-identification result.

상기 비식별화 영역들을 생성하는 단계는, 상기 단위 영역들을 서로 다른 복수의 방식으로 그룹핑하여 복수의 비식별화 영역들의 조합들을 생성하고, 상기 생성되는 비식별화 영역들의 조합들 중 상기 비식별화 영역들의 수가 미리 설정된 기준 개수 이하인 비식별화 영역들의 조합을 최종적인 비식별화 결과로 결정하는 단계를 포함할 수 있다. The generating of the non-identification regions may include generating combinations of a plurality of non-identification regions by grouping the unit regions in a plurality of different ways, and generating the non-identification regions among the combinations of the generated non-identification regions. The method may include determining a combination of de-identification regions whose number of regions is equal to or less than a predetermined reference number as a final de-identification result.

본 발명의 일실시예에 따른 위치 정보의 비식별화 방법은 임의의 범주에 속하는 사용자들의 위치 정보를 포함하는 지리적 영역을 식별하는 단계; 상기 지리적 영역을 각 차원 별로 복수의 단위 영역들로 분리하는 단계; 상기 단위 영역들 각각에 포함된 위치 정보들의 수와 미리 설정된 익명성 임계치를 비교하는 단계; 상기 비교한 결과에 기초하여, 상기 단위 영역들을 그룹핑(grouping)함으로써, 비식별화 영역을 생성하는 단계; 및 i) 상기 비식별화 영역과 ii) 상기 임의의 범주와 다른 범주에 속하는 사용자들의 위치 정보들을 포함하는 지리적 영역으로부터 생성된 비식별화 영역을 결합하여, 다차원의 비식별화 영역을 획득하는 단계를 포함할 수 있다. A method for de-identifying location information according to an embodiment of the present invention includes identifying a geographic area including location information of users belonging to a certain category; dividing the geographic area into a plurality of unit areas for each dimension; comparing the number of pieces of location information included in each of the unit areas with a preset anonymity threshold; generating a non-identification area by grouping the unit areas based on the comparison result; and i) combining the de-identification area and ii) a de-identification area generated from a geographic area including location information of users belonging to the arbitrary category and other categories to obtain a multi-dimensional non-identification area. can include

상기 생성되는 비식별화 영역의 수는, 상기 익명성 임계치가 낮을수록 증가하고, 상기 익명성 임계치가 높을수록 감소할 수 있다. The number of generated de-identification regions may increase as the anonymity threshold is lower, and may decrease as the anonymity threshold is higher.

상기 비식별화 영역들을 생성하는 단계는, 상기 단위 영역들 중 임의의 단위 영역에 포함되는 위치 정보들의 수가 상기 익명성 임계치 보다 낮은 경우, 상기 임의의 단위 영역에 인접하는 단위 영역과 그룹핑하여 상기 비식별화 영역을 결정할 수 있다. The generating of the non-identification areas may include grouping with a unit area adjacent to the random unit area when the number of pieces of location information included in any one of the unit areas is lower than the anonymity threshold. Identification area can be determined.

상기 비식별화 영역들을 생성하는 단계는, 상기 비식별화 영역에 포함된 위치 정보들의 수가 상기 익명성 임계치보다 낮은 경우, 상기 비식별화 영역에 인접한 단위 영역과 상기 비식별화 영역을 그룹화할 수 있다. In the generating of the non-identification regions, when the number of location information included in the non-identification region is lower than the anonymity threshold, a unit region adjacent to the non-identification region and the non-identification region may be grouped. there is.

상기 생성된 비식별화 영역들 각각에 포함된 위치 정보들의 수는, 상기 익명성 임계치 보다 크거나 같을 수 있다. The number of location information included in each of the generated non-identification areas may be greater than or equal to the anonymity threshold.

본 발명의 일실시예에 따른 위치 정보의 비식별화 장치에 있어서, 상기 비식별화 장치는 프로세서를 포함하고, 상기 프로세서는, 사용자들의 위치 정보를 포함하는 전체 영역 및 익명성 임계치를 식별하고, 상기 전체 영역을 복수의 단위 영역들로 구분하고, 상기 단위 영역들 각각에 포함된 위치 정보의 수를 결정하고, 상기 익명성 임계치 및 상기 단위 영역들 각각에 포함된 위치 정보의 수에 기초하여, 상기 단위 영역들을 그룹핑(grouping)함으로써 비식별화 영역들을 생성할 수 있다. In the de-identification device for location information according to an embodiment of the present invention, the de-identification device includes a processor, the processor identifies an entire region including location information of users and an anonymity threshold; Dividing the entire area into a plurality of unit areas, determining the number of location information included in each of the unit areas, and based on the anonymity threshold and the number of location information included in each of the unit areas, Non-identification regions may be created by grouping the unit regions.

상기 생성되는 비식별화 영역의 수는, 상기 익명성 임계치가 낮을수록 증가하고, 상기 익명성 임계치가 높을수록 감소할 수 있다. The number of generated de-identification regions may increase as the anonymity threshold is lower, and may decrease as the anonymity threshold is higher.

상기 프로세서는, 상기 단위 영역들 중 임의의 단위 영역에 포함되는 위치 정보들의 수가 상기 익명성 임계치 보다 낮은 경우, 상기 임의의 단위 영역에 인접하는 단위 영역과 그룹핑하여 상기 비식별화 영역을 결정할 수 있다. The processor, when the number of pieces of location information included in any unit area among the unit areas is lower than the anonymity threshold, may determine the non-identification area by grouping with a unit area adjacent to the arbitrary unit area. .

상기 프로세서는, 상기 비식별화 영역에 포함된 위치 정보들의 수가 상기 익명성 임계치보다 낮은 경우, 상기 비식별화 영역에 인접한 단위 영역과 상기 비식별화 영역을 그룹화할 수 있다. The processor may group the non-identification region with a unit region adjacent to the non-identification region when the number of pieces of location information included in the non-identification region is lower than the anonymity threshold.

상기 생성된 비식별화 영역들 각각에 포함된 위치 정보들의 수는, 상기 익명성 임계치 보다 크거나 같을 수 있다. The number of location information included in each of the generated non-identification areas may be greater than or equal to the anonymity threshold.

상기 프로세서는, 상기 단위 영역들을 서로 다른 복수의 방식으로 그룹핑하여 복수의 비식별화 영역들의 조합들을 생성하고, 상기 생성되는 비식별화 영역들의 조합들 중 사용성 평가 결과가 가장 높은 비식별화 영역들의 조합을 최종적인 비식별화 결과로 결정할 수 있다. The processor groups the unit regions in a plurality of different ways to generate combinations of a plurality of non-identification regions, and selects non-identification regions having the highest usability evaluation result among the generated combinations of non-identification regions. The combination can be determined as the final de-identification result.

상기 프로세서는, 상기 단위 영역들을 서로 다른 복수의 방식으로 그룹핑하여 복수의 비식별화 영역들의 조합들을 생성하고, 상기 생성되는 비식별화 영역들의 조합들 중 상기 비식별화 영역들의 수가 미리 설정된 기준 개수 이하인 비식별화 영역들의 조합을 최종적인 비식별화 결과로 결정하는 단계를 포함할 수 있다. The processor groups the unit regions in a plurality of different ways to generate a plurality of combinations of non-identification regions, and the number of non-identification regions among the generated combinations of non-identification regions is a preset reference number. and determining a combination of the following de-identification regions as a final de-identification result.

본 발명의 일실시예에 따른 위치 정보의 비식별화 장치에 있어서, 상기 비식별화 장치는 프로세서를 포함하고, 상기 프로세서는, 임의의 범주에 속하는 사용자들의 위치 정보를 포함하는 지리적 영역을 식별하고, 상기 지리적 영역을 각 차원 별로 복수의 단위 영역들로 분리하고, 상기 단위 영역들 각각에 포함된 위치 정보들의 수와 미리 설정된 익명성 임계치를 비교하고, 상기 비교한 결과에 기초하여, 상기 단위 영역들을 그룹핑(grouping)함으로써, 비식별화 영역을 생성하고, i) 상기 비식별화 영역과 ii) 상기 임의의 범주와 다른 범주에 속하는 사용자들의 위치 정보들을 포함하는 지리적 영역으로부터 생성된 비식별화 영역을 결합하여, 다차원의 비식별화 영역을 획득할 수 있다. In an apparatus for de-identifying location information according to an embodiment of the present invention, the de-identification device includes a processor, wherein the processor identifies a geographic area including location information of users belonging to an arbitrary category; , Dividing the geographic area into a plurality of unit areas for each dimension, comparing the number of location information included in each of the unit areas with a preset anonymity threshold, and based on the result of the comparison, the unit area By grouping them, a de-identification area is created, i) the de-identification area and ii) a de-identification area created from a geographic area including location information of users belonging to the category different from the arbitrary category. By combining, it is possible to obtain a multi-dimensional non-identified area.

본 발명의 일실시예에 따르면 사용자들의 개인 정보 중 사용자의 주소와 같은 위치 정보들을 비식별화함에 있어, 전체 영역을 복수의 단위 영역들로 구분하고, 익명성 임계치에 따라 인접한 단위 영역들을 그룹핑함으로써, 사용성과 익명성을 최대화할 수 있다.According to an embodiment of the present invention, in de-identifying location information such as the user's address among personal information of users, the entire area is divided into a plurality of unit areas and adjacent unit areas are grouped according to an anonymity threshold. , can maximize usability and anonymity.

또한, 본 발명의 일실시예에 따르면 다른 종류의 개인 정보가 맵핑된 위치 정보들을 비식별화하여 다차원의 비식별화 영역을 생성함으로써, 위치 정보에 대한 다차원적 분석이 가능하도록 할 수 있다. In addition, according to an embodiment of the present invention, location information to which different types of personal information is mapped is de-identified to create a multi-dimensional de-identification area, thereby enabling multi-dimensional analysis of location information.

또한, 본 발명의 일실시예에 따르면 단위 영역이나, 익명성 임계치를 실시예들에 따라 다르게 설정함으로써, 사용성과 익명성을 조절하여 개인 정보의 비식별화를 수행할 수 있다. 또한, 본 발명의 일실시예에 따르면, 배송 거리 별 소요 시간을 분석함에 있어, 비식별화된 사용자들의 위치 정보들을 이용할 수 있다. Further, according to an embodiment of the present invention, personal information may be de-identified by adjusting usability and anonymity by setting a unit area or an anonymity threshold differently according to embodiments. In addition, according to one embodiment of the present invention, location information of non-identified users may be used in analyzing the required time for each delivery distance.

도 1은 본 발명의 일실시예에 따른 비식별화 장치를 도시한 도면이다.
도 2는 본 발명의 일실시예에 따른 전체 영역과 비식별화 대상이 되는 위치 정보들의 예를 나타낸 것이다.
도 3는 본 발명의 일실시예에 따른 단위 영역들의 예를 나타낸 것이다.
도 4는 본 발명의 일실시예에 따른 단위 영역들을 그룹핑하는 과정을 나타낸 것이다.
도 5는 본 발명의 일실시예에 따른 서로 다른 범주에 속하는 사용자들의 위치 정보를 비식별화한 결과를 나타낸 것이다.
도 6는 본 발명의 일실시예에 따른 비식별화 방법을 플로우 차트로 도시한 도면이다.
1 is a diagram illustrating a de-identification device according to an embodiment of the present invention.
2 illustrates an example of the entire region and location information subject to de-identification according to an embodiment of the present invention.
3 illustrates an example of unit areas according to an embodiment of the present invention.
4 illustrates a process of grouping unit regions according to an embodiment of the present invention.
5 shows a result of de-identifying location information of users belonging to different categories according to an embodiment of the present invention.
6 is a flowchart illustrating a de-identification method according to an embodiment of the present invention.

이하에서, 첨부된 도면을 참조하여 실시예들을 상세하게 설명한다. 그러나, 실시예들에는 다양한 변경이 가해질 수 있어서 특허출원의 권리 범위가 이러한 실시예들에 의해 제한되거나 한정되는 것은 아니다. 실시예들에 대한 모든 변경, 균등물 내지 대체물이 권리 범위에 포함되는 것으로 이해되어야 한다.Hereinafter, embodiments will be described in detail with reference to the accompanying drawings. However, since various changes can be made to the embodiments, the scope of the patent application is not limited or limited by these embodiments. It should be understood that all changes, equivalents or substitutes to the embodiments are included within the scope of rights.

실시예에서 사용한 용어는 단지 설명을 목적으로 사용된 것으로, 한정하려는 의도로 해석되어서는 안된다. 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다. 본 명세서에서, "포함하다" 또는 "가지다" 등의 용어는 명세서 상에 기재된 특징, 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것이 존재함을 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.Terms used in the examples are used only for descriptive purposes and should not be construed as limiting. Singular expressions include plural expressions unless the context clearly dictates otherwise. In this specification, terms such as "include" or "have" are intended to designate that there is a feature, number, step, operation, component, part, or combination thereof described in the specification, but one or more other features It should be understood that the presence or addition of numbers, steps, operations, components, parts, or combinations thereof is not precluded.

다르게 정의되지 않는 한, 기술적이거나 과학적인 용어를 포함해서 여기서 사용되는 모든 용어들은 실시예가 속하는 기술 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 것과 동일한 의미를 가지고 있다. 일반적으로 사용되는 사전에 정의되어 있는 것과 같은 용어들은 관련 기술의 문맥 상 가지는 의미와 일치하는 의미를 가지는 것으로 해석되어야 하며, 본 출원에서 명백하게 정의하지 않는 한, 이상적이거나 과도하게 형식적인 의미로 해석되지 않는다.Unless defined otherwise, all terms used herein, including technical or scientific terms, have the same meaning as commonly understood by a person of ordinary skill in the art to which the embodiment belongs. Terms such as those defined in commonly used dictionaries should be interpreted as having a meaning consistent with the meaning in the context of the related art, and unless explicitly defined in the present application, they should not be interpreted in an ideal or excessively formal meaning. don't

또한, 첨부 도면을 참조하여 설명함에 있어, 도면 부호에 관계없이 동일한 구성 요소는 동일한 참조부호를 부여하고 이에 대한 중복되는 설명은 생략하기로 한다. 실시예를 설명함에 있어서 관련된 공지 기술에 대한 구체적인 설명이 실시예의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우 그 상세한 설명을 생략한다.In addition, in the description with reference to the accompanying drawings, the same reference numerals are given to the same components regardless of reference numerals, and overlapping descriptions thereof will be omitted. In describing the embodiment, if it is determined that a detailed description of a related known technology may unnecessarily obscure the gist of the embodiment, the detailed description will be omitted.

도 1은 본 발명의 일실시예에 따른 비식별화 장치를 도시한 도면이다. 1 is a diagram illustrating a de-identification device according to an embodiment of the present invention.

본 발명은, 사용자들의 개인 정보 중 사용자의 주소와 같은 위치 정보(105)들을 비식별화함에 있어, 전체 영역(103)을 복수의 단위 영역들로 구분하고, 익명성 임계치에 따라 인접한 단위 영역들을 그룹핑함으로써, 비식별화된 위치 정보(105)의 사용성(usability) 및 익명성(anonymity)을 최대화할 수 있는 기술에 관한 것이다. In the present invention, in de-identifying location information 105 such as the user's address among personal information of users, the entire area 103 is divided into a plurality of unit areas, and adjacent unit areas are divided according to an anonymity threshold. By grouping, it relates to a technique capable of maximizing usability and anonymity of de-identified location information (105).

도 1을 참조하면, 비식별화 장치(101)는 프로세서(102)를 포함할 수 있다. 비식별화 장치(101)의 프로세서(102)는 본 발명의 다양한 실시예에 따른 비식별화 방법들을 수행할 수 있다. 도 1을 참조하면, 프로세서(102)는, 개인들의 위치 정보(105)가 포함된 전체 영역(103)을 비식별화함으로써 비식별화 영역들을 생성할 수 있다. Referring to FIG. 1 , the de-identification device 101 may include a processor 102 . The processor 102 of the de-identification device 101 may perform de-identification methods according to various embodiments of the present invention. Referring to FIG. 1 , the processor 102 may generate de-identification areas by de-identifying the entire area 103 including location information 105 of individuals.

위치 정보(105)는 지도 상에서 사용자의 위치에 대한 정보를 의미한다. 일례로, 위치 정보(105)는, 사용자의 주소를 포함할 수 있고, 사용자의 3차원 공간상 위치에 대한 위도, 경도 및 높이를 포함할 수 있다. 위치 정보(105)는, 서비스의 종류나 실시예에 따라 다른 의미를 포함할 수 있다. The location information 105 means information about a user's location on a map. For example, the location information 105 may include the user's address, and may include latitude, longitude, and height of the user's location in 3D space. The location information 105 may have different meanings depending on the type or embodiment of the service.

일례로, 배달 및 배송 서비스와 관련하여 수집된 사용자의 위치 정보(105)는 주소를 포함할 수 있다. 배달을 처리하는 라이더가 이용하는 어플리케이션에서 수집된 사용자의 위치 정보(105)는, 배달 주소에 대한 주차 위치의 위도 및 경도를 포함할 수 있다. 따라서, 위치 정보(105)는, 특정한 예로 제한되지 않으며, 2차원 지도 또는 3차원 공간 상에서 사용자의 위치를 의미할 수 있다. For example, the user's location information 105 collected in relation to delivery and delivery services may include an address. The user's location information 105 collected from the application used by the rider handling the delivery may include the latitude and longitude of the parking location relative to the delivery address. Accordingly, the location information 105 is not limited to a specific example, and may mean a user's location on a 2D map or 3D space.

사용자는, 어플리케이션 또는 웹에서 제공되는 서비스를 이용하는 사람들을 의미할 수 있다. 임의의 범주에 속하는 사용자들의 위치 정보(105)가 일실시예에 따른 비식별화 방법으로 비식별화될 수 있다. Users may refer to people who use services provided by an application or web. Location information 105 of users belonging to a certain category may be de-identified by a de-identification method according to an embodiment.

일례로, 임의의 범주에 속하는 사용자들이란, 20대 남자, 30대 여자와 같이 개인 정보에서 일부 사항들이 공통되는 범주에 속하는 사용들을 의미할 수 있다. 여러 범주에 대한 위치 정보(105)들이 비식별화될 경우, 각 범주 별 비식별화 영역들이 결합된 다차원의 비식별화 영역이 생성될 수 있다. For example, users belonging to a certain category may mean users belonging to a category in which some items of personal information are common, such as men in their 20s and women in their 30s. When the location information 105 for several categories is de-identified, a multi-dimensional de-identification area in which de-identification areas for each category are combined may be created.

전체 영역(103)은 일정한 범위의 2차원 또는 3차원의 지리적 영역을 의미할 수 있다. 전체 영역(103)의 범위는 비식별화 대상이 되는 위치 정보(105)들의 범위에 기초하여 결정되며, 전체 영역(103)의 범위는 특정한 예로 제한되지 않을 수 있다. 전체 영역(103)의 구체적인 예는 도 2에서 후술한다. The entire area 103 may mean a 2-dimensional or 3-dimensional geographical area of a certain range. The range of the entire area 103 is determined based on the range of location information 105 to be de-identified, and the range of the entire area 103 may not be limited to a specific example. A specific example of the entire area 103 will be described later with reference to FIG. 2 .

도 1을 참조하면, 전체 영역(103)은 여러 사용들의 위치 정보(105)를 포함할 수 있다. 비식별화 장치(101)는, 사용자들의 위치 정보(105)를 비식별화하여 비식별화 영역을 생성할 수 있다. 비식별화 영역은, 도 1의 전체 영역(104)에서, 구역 1, 구역 2와 같이 사용자들의 위치 정보(105)가 전체 영역(104) 상에서 일정한 범위를 가지는 영역을 의미할 수 있다. Referring to FIG. 1 , an entire area 103 may include location information 105 of various uses. The de-identification device 101 may de-identify location information 105 of users to create a de-identification area. The non-identification area may refer to an area in which location information 105 of users has a certain range on the entire area 104, such as Zone 1 and Zone 2, in the entire area 104 of FIG. 1 .

각 비식별화 영역에는, 여러 사용자들의 위치 정보(105)가 포함될 수 있으나, 각 사용자의 위치 정보(105)가 특정될 수 없다. 일실시예에 따르면, 비식별화 영역에 포함되는 위치 정보(105)들의 수가 커질수록 각 사용자가 특정되는 것이 어려워지므로 익명성이 높아질 수 있다. In each non-identification area, location information 105 of several users may be included, but location information 105 of each user cannot be specified. According to one embodiment, as the number of location information 105 included in the non-identification area increases, it becomes difficult to identify each user, so anonymity may increase.

일실시예에 따르면, 비식별화 영역에는, 미리 설정된 익명성 임계치 보다 같거나 많은 수의 위치 정보(105)들이 포함될 수 있다. 익명성 임계치는, 비식별화되는 정도를 나타내는 수치를 의미할 수 있다. 일례로, 익명성 임계치는, 양의 자연수로 설정될 수 있다. According to one embodiment, the non-identification area may include location information 105 equal to or greater than a preset anonymity threshold. The anonymity threshold may mean a numerical value representing the degree of de-identification. As an example, the anonymity threshold may be set to a positive natural number.

즉, 익명성 임계치가 높을수록 비식별화되는 위치 정보(105)의 익명성이 높아질 수 있으며, 비식별과 강도가 낮을수록 비식별화되는 위치 정보(105)의 익명성이 낮아질 수 있다. 따라서, 익명성 임계치는 실시예나 활용 목적에 따라 다르게 설정될 수 있으며, 특정한 예로 제한되지 않는다. That is, the higher the anonymity threshold, the higher the anonymity of the de-identified location information 105, and the lower the de-identification and intensity, the lower the anonymity of the de-identified location information 105. Accordingly, the anonymity threshold may be set differently according to embodiments or utilization purposes, and is not limited to a specific example.

예를 들어, 익명성 임계치가 4인 경우, 비식별화 영역에 포함되는 위치 정보(105)들의 수가 4가 되도록 비식별화 영역이 생성될 수 있다. 비식별화 장치(101)가 비식별화 영역을 생성하는 구체적인 과정은 도 3에서 후술한다. For example, when the anonymity threshold is 4, the non-identification area may be created such that the number of pieces of location information 105 included in the non-identification area is 4. A detailed process of generating the non-identification area by the de-identification device 101 will be described later with reference to FIG. 3 .

일례로, 비식별화된 위치 정보(105)들은, 빅데이터 분석에 이용될 수 있다. 예를 들어, 배송 서비스를 제공함에 있어, 배송 서비스를 이용한 사용자들의 주소들을 비식별화한 데이터와 배송 시간들을 분석하여, 새로운 배송 업무가 발생할 때 배송 거리에 따른 소요 시간을 예측할 수 있다. As an example, the de-identified location information 105 may be used for big data analysis. For example, in providing a delivery service, it is possible to predict the required time according to the delivery distance when a new delivery service occurs by analyzing de-identified data and delivery times of the addresses of users who have used the delivery service.

즉, 위 예시에서, 사용자들의 주소가 동 단위로 비식별될 경우, 구체적인 소요 시간을 예측하기 어렵고, 사용자의 주소를 그대로 비식별화할 경우, 위치가 특정되므로 사용자가 식별될 수 있어, 개인 정보에 관한 문제가 발생할 수 있다. 따라서, 사용성과 익명성을 최대화할 수 있는 본 발명의 비식별화 방법이 이용될 수 있다. In other words, in the above example, if the addresses of users are de-identified by the same unit, it is difficult to predict the specific time required, and if the user's address is de-identified as it is, the user can be identified because the location is specified, and personal information issues may arise. Therefore, the non-identification method of the present invention, which can maximize usability and anonymity, can be used.

도 2는 본 발명의 일실시예에 따른 전체 영역과 비식별화 대상이 되는 위치 정보들의 예를 나타낸 것이다. 2 illustrates an example of the entire region and location information subject to de-identification according to an embodiment of the present invention.

도 2는 위치 정보(201)들을 포함하는 전체 영역(200)의 예를 도시한 도면이다. 전체 영역(200)은, 2차원 또는 3차원의 지리적 영역을 의미할 수 있다. 도 2의 경우, 전체 영역(200)은, 2차원의 지도로 표현될 수 있다.2 is a diagram showing an example of the entire area 200 including location information 201 . The entire area 200 may mean a 2-dimensional or 3-dimensional geographical area. In the case of FIG. 2 , the entire region 200 may be expressed as a two-dimensional map.

일례로, 도 2에서, 위치 정보(201)는, 사용자들의 주소를 포함할 수 있고, 사용자의 3차원 공간상 위치에 대한 위도, 경도 및 높이를 포함할 수 있다. 위치 정보(201)는, 서비스의 종류나 실시예에 따라 다른 의미를 포함할 수 있다. 위치 정보(201)는, 주소와 같은 사용자의 개인 정보가 노출될 수 있기 때문에, 본 발명의 다양한 실시예에 따라 비식별화될 수 있다. For example, in FIG. 2 , the location information 201 may include addresses of users, and may include latitude, longitude, and height of the user's location in 3D space. The location information 201 may have different meanings depending on the type or embodiment of the service. The location information 201 may be de-identified according to various embodiments of the present invention because the user's personal information such as address may be exposed.

비식별화 장치는, 사용자들의 위치 정보(201)를 포함하는 전체 영역(200)을 식별하고, 전체 영역(200)을 복수의 단위 영역들로 분리할 수 있다. 분리된 단위 영역의 예는 도 3에서 후술한다. The de-identification device may identify the entire area 200 including the location information 201 of users and divide the entire area 200 into a plurality of unit areas. An example of the separated unit area will be described later with reference to FIG. 3 .

도 3는 본 발명의 일실시예에 따른 단위 영역들의 예를 나타낸 것이다. 3 illustrates an example of unit areas according to an embodiment of the present invention.

일례로, 도 3의 (a)-(c)는, 2차원 지도(300) 상에서, 다양한 실시예에 따라 전체 영역(301-303)이 다른 형태의 단위 영역(311-313)들로 구분된 것을 도시한 도면일 수 있다. 다양한 실시예에 따르면, 비식별화 장치는, 위치 정보들을 포함하는 전체 영역(301-303)을 다양한 형태의 단위 영역들로 구분할 수 있다. As an example, in (a)-(c) of FIG. 3 , on the 2D map 300, the entire area 301-303 is divided into unit areas 311-313 of different shapes according to various embodiments. It may be a drawing showing that. According to various embodiments, the non-identification device may divide the entire area 301 to 303 including location information into unit areas of various types.

도 3의 (a)는, 정사각형 형태의 단위 영역(311)들로 전체 영역(301)이 분리된 경우를 나타낸 것일 수 있다. 도 3의 (b)는 정육각형 형태의 단위 영역(312)들로 전체 영역(302)이 구분된 경우를 나타낸 것일 수 있다. 도 3의 (c)는 다각형 형태의 단위 영역(313)들로 전체 영역(303)이 분리된 경우를 나타낸 것일 수 있다. (a) of FIG. 3 may show a case in which the entire area 301 is divided into unit areas 311 having a square shape. (b) of FIG. 3 may show a case in which the entire area 302 is divided into unit areas 312 having regular hexagonal shapes. (c) of FIG. 3 may show a case in which the entire area 303 is divided into polygonal unit areas 313 .

일례로, 비식별화 장치는, 전체 영역(301-303)의 모든 범위를 단위 영역(311-313)으로 분리할 수 있다. 즉, 비식별화 장치는, 전체 영역(301-303)을 빈틈없이 단위 영역(311-313)들로 분리할 수 있다. 다만, 모든 단위 영역(311-313)들의 너비나 부피가 같지 않을 수 있다. For example, the de-identification device may separate all ranges of the entire area 301-303 into unit areas 311-313. That is, the de-identification device may divide the entire area 301-303 into unit areas 311-313 without gaps. However, the widths or volumes of all unit areas 311 to 313 may not be the same.

비식별화 장치는, 인접한 단위 영역(311-313)들 간에 하나 이상의 모서리 또는 면을 공유하도록, 전체 영역(301-303)을 단위 영역(311-313)들로 구분할 수 있다. 실시예에 따라, 인접한 단위 영역(311-313)들 간에 하나 이상의 모서리 또는 면을 공유하는 조건 내에서, 다양한 형태의 단위 영역(311-313)들이 이용될 수 있다. 다른 예로, 3차원 공간 상의 전체 영역이 식별되는 경우, 비식별화 장치는, 3차원 다면체의 단위 영역으로 전체 영역을 분리할 수 있다. The de-identification device may divide the entire region 301 to 303 into unit regions 311 to 313 so that the adjacent unit regions 311 to 313 share one or more edges or faces. Depending on embodiments, unit regions 311 to 313 of various shapes may be used within the condition that one or more edges or faces are shared between adjacent unit regions 311 to 313 . As another example, when the entire area in the 3D space is identified, the de-identification device may separate the entire area into unit areas of 3D polyhedrons.

각 단위 영역(311-313)들은 여러 사용자들에 대한 위치 정보들을 포함할 수 있다. 각 단위 영역(311-313)에 포함된 위치 정보들은, 비식별화 영역으로 비식별화될 수 있다. 비식별화 장치는, 익명성 임계치 및 단위 영역(311-313)들 각각에 포함된 위치 정보의 수에 기초하여, 단위 영역(311-313)들을 그룹핑(grouping)함으로써 비식별화 영역들을 생성할 수 있다. 위치 정보의 구체적인 비식별화 과정은 도 4에서 후술한다. Each of the unit areas 311 to 313 may include location information about several users. Location information included in each unit area 311 to 313 may be de-identified as a non-identification area. The de-identification device generates non-identification areas by grouping the unit areas 311 to 313 based on the anonymity threshold and the number of location information included in each of the unit areas 311 to 313. can A detailed de-identification process of location information will be described later with reference to FIG. 4 .

도 4는 본 발명의 일실시예에 따른 단위 영역들을 그룹핑하는 과정을 나타낸 것이다. 4 illustrates a process of grouping unit regions according to an embodiment of the present invention.

일례로, 도 4를 참조하면, 비식별화 장치는, 2차원 지도(400) 상에서, 사용자들의 위치 정보를 포함하는 전체 영역(410)을 식별할 수 있다. 일례로, 비식별화 장치의 프로세서는, 전체 영역(410)에 대응하는 지도 데이터와 사용자들의 위치 정보에 대한 데이터를 비식별화 장치의 메모리로부터 로드(load)할 수 있다. As an example, referring to FIG. 4 , the non-identification device may identify the entire region 410 including location information of users on the 2D map 400 . As an example, the processor of the de-identification device may load map data corresponding to the entire region 410 and data about location information of users from the memory of the de-identification device.

비식별화 장치는, 전체 영역(410)을 복수의 단위 영역(411)들로 분리할 수 있다. 일례로, 도 4를 참조하면, 비식별화 장치는, 전체 영역(410)을 정사각형 형태의 단위 영역(411)들로 구분할 수 있다. The de-identification device may divide the entire area 410 into a plurality of unit areas 411 . As an example, referring to FIG. 4 , the de-identification device may divide the entire area 410 into square unit areas 411 .

비식별화 장치는, 각 단위 영역(411)에 포함되는 위치 정보들의 수를 결정할 수 있다. 일례로, 비식별화 장치는, 각 단위 영역(411)의 경계와 위치 정보들에 포함된 위도, 경도를 고려하여, 각 단위 영역(411)에 속하는 위치 정보들의 수를 결정할 수 있다. The non-identification device may determine the number of pieces of location information included in each unit area 411 . For example, the non-identification device may determine the number of pieces of location information belonging to each unit area 411 by considering the boundary of each unit area 411 and the latitude and longitude included in the pieces of location information.

일례로, 아파트나 주택가와 같이 사용자들이 밀집될 수 있는 주거 구역이 속하는 단위 영역(411)에 포함된 위치 정보들의 수는, 강이나, 산과 같은 자연 구역이 속하는 단위 영역(411)에 포함된 위치 정보들의 수보다 클 수 있다. For example, the number of pieces of location information included in the unit area 411 to which a residential area, such as an apartment or a residential area, where users may be concentrated is included, is the location included in the unit area 411 to which a natural area, such as a river or a mountain, belongs. It can be greater than the number of pieces of information.

도 4를 참조하면, 전체 영역(420)의 각 단위 영역(411)에 포함되는 위치 정보들의 수가 결정될 수 있다. 비식별화 장치는, 미리 설정된 익명성 임계치(401)를 식별할 수 있다. 비식별화 장치는, 익명성 임계치(401) 및 단위 영역(411)들 각각에 포함된 위치 정보의 수에 기초하여, 단위 영역(411)들을 그룹핑함으로써 비식별화 영역(431-441)들을 생성할 수 있다.Referring to FIG. 4 , the number of pieces of location information included in each unit area 411 of the entire area 420 may be determined. The non-identification device may identify a preset anonymity threshold 401 . The de-identification device generates non-identified regions 431-441 by grouping the unit regions 411 based on the anonymity threshold 401 and the number of location information included in each of the unit regions 411. can do.

비식별화 장치는, 단위 영역(411)들 중 임의의 단위 영역(411)에 포함되는 위치 정보들의 수가 익명성 임계치(401) 보다 낮은 경우, 임의의 단위 영역(411)에 인접하는 단위 영역(411)과 그룹핑하여 비식별화 영역(431-441)을 결정할 수 있다. When the number of location information included in any unit area 411 among the unit areas 411 is lower than the anonymity threshold 401, the unit area adjacent to the arbitrary unit area 411 ( 411) and non-identification areas 431 to 441 may be determined.

비식별화 장치는, 비식별화 영역(431-441)에 포함된 위치 정보들의 수가 익명성 임계치(401)보다 낮은 경우, 비식별화 영역(431-441)에 인접한 단위 영역(411)과 비식별화 영역(431-441)을 그룹화할 수 있다. When the number of location information included in the non-identification area 431-441 is lower than the anonymity threshold 401, the non-identification device identifies the unit area 411 adjacent to the non-identification area 431-441 and the non-identification area 431-441. Identification areas 431-441 can be grouped.

즉, 비식별화 장치는, 그룹핑된 단위 영역(411)들에 포함되는 위치 정보들의 수가 익명성 임계치(401) 보다 같거나 높은 경우에, 그룹핑된 단위 영역(411)을 비식별화 영역(431-441)을 결정할 수 있다. That is, when the number of location information included in the grouped unit areas 411 is equal to or higher than the anonymity threshold 401, the non-identification device sets the grouped unit area 411 to the non-identification area 431. -441) can be determined.

일례로, 비식별화 장치는, 단위 영역(411)들 각각에 포함된 위치 정보들의 수와 미리 설정된 익명성 임계치(401)를 비교할 수 있다. 일례로, 비식별화 장치는, 임의의 단위 영역(411)을 먼저 선택하고, 임의의 단위 영역(411)에 포함되는 위치 정보의 수를 익명성 임계치(401)와 비교할 수 있다. For example, the non-identification device may compare the number of location information included in each of the unit areas 411 with a preset anonymity threshold 401 . For example, the non-identification device may first select an arbitrary unit area 411 and compare the number of location information included in the arbitrary unit area 411 with the anonymity threshold 401 .

일례로, 비식별화 장치는, 단위 영역(411) 중 위치 정보들을 가장 많이 포함하는 단위 영역(411)을 선택하고, 선택된 단위 영역(411)에 포함되는 위치 정보의 수를 익명성 임계치(401)와 비교할 수 있다. For example, the non-identification device selects the unit area 411 that includes the most location information among the unit areas 411, and sets the number of location information included in the selected unit area 411 to the anonymity threshold 401. ) can be compared with

선택된 단위 영역(411)에 포함된 위치 정보의 수가 익명성 임계치(401)보다 크거나 같은 경우, 비식별화 장치는, 별도의 그룹핑없이 선택된 단위 영역(411)을 비식별화 영역(431-441)으로 결정할 수 있다. When the number of location information included in the selected unit area 411 is greater than or equal to the anonymity threshold 401, the de-identification device divides the selected unit area 411 into non-identified areas 431-441 without separate grouping. ) can be determined.

일례로, 선택된 단위 영역(411)에 포함된 위치 정보의 수가 익명성 임계치(401)보다 작은 경우, 비식별화 장치는, 선택된 단위 영역(411)과 인접한 단위 영역(411)들 또는 비식별화 영역(431-441) 중 어느 하나의 단위 영역(411) 또는 비식별화 영역(431-441)을 결정할 수 있다. For example, when the number of location information included in the selected unit area 411 is smaller than the anonymity threshold 401, the de-identification device determines whether unit areas 411 adjacent to the selected unit area 411 or non-identification Any one of the unit regions 411 or non-identified regions 431 to 441 of the regions 431 to 441 may be determined.

일례로, 선택된 단위 영역(411)에 포함된 위치 정보의 수가 익명성 임계치(401)보다 작은 경우, 비식별화 장치는, 선택된 단위 영역(411)과 인접한 단위 영역(411)들 또는 비식별화 영역(431-441) 중 포함된 위치 정보들의 수가 가장 많은 단위 영역(411) 또는 비식별화 영역(431-441)을 결정할 수 있다. For example, when the number of location information included in the selected unit area 411 is smaller than the anonymity threshold 401, the de-identification device determines whether unit areas 411 adjacent to the selected unit area 411 or non-identification Among the regions 431 to 441 , a unit region 411 or a non-identified region 431 to 441 having the largest number of location information may be determined.

비식별화 장치는, 선택된 단위 영역(411)과 결정된 단위 영역(411) 또는 비식별화 영역(431-441)을 그룹화하여 새로운 비식별화 영역(431-441)을 생성할 수 있다. 그리고, 비식별화 장치는, 그룹화된 단위 영역(411)들에 포함되는 위치 정보들의 수가 익명성 임계치(401) 보다 크거나 같을 때까지, 생성한 비식별화 영역(431-441)을, 인접한 단위 영역(411) 또는 비식별화 영역(431-441)과 결합할 수 있다. The de-identification device may create a new non-identified area 431-441 by grouping the selected unit area 411 and the determined unit area 411 or non-identified areas 431-441. Then, the de-identification device, until the number of location information included in the grouped unit areas 411 is greater than or equal to the anonymity threshold 401, the generated de-identification areas 431-441, adjacent It can be combined with the unit area 411 or non-identified areas 431-441.

일례로, 너비 우선 탐색(Breadth-First Search)이 단위 영역(411)들의 그룹핑에 이용될 수 있다. 일례로, 비식별화 장치는, 임의의 단위 영역(411)을 기준으로, 위치 정보들의 수가 익명성 임계치(401) 보다 같거나 높을 때까지, 인접한 단위 영역(411) 또는 비식별화 영역(431-441)과 그룹화할 수 있다. For example, a breadth-first search may be used for grouping the unit areas 411 . For example, the non-identification device, based on a random unit area 411, until the number of location information is equal to or higher than the anonymity threshold 401, the adjacent unit area 411 or non-identification area 431 -441).

단위 영역(411)의 그룹화를 결정함에 있어, 그리디 알고리즘(greedy algorithm)이 이용될 수 있다. 즉, 단위 영역(411)의 그룹화 과정에서, 익명성 임계치(401) 보다 그룹화된 단위 영역(411)들에 포함되는 위치 정보들의 수가 크거나 같아진 경우, 비식별화 장치는, 익명성 임계치(401)를 만족하는 것으로 결정하고, 그룹화된 단위 영역(411)들을 비식별화 영역(431-441)으로 결정할 수 있다. In determining the grouping of the unit area 411, a greedy algorithm may be used. That is, in the process of grouping the unit area 411, when the number of location information included in the grouped unit areas 411 is greater than or equal to the anonymity threshold 401, the non-identification device sets the anonymity threshold ( 401) may be satisfied, and the grouped unit regions 411 may be determined as non-identified regions 431 to 441.

그리고, 비식별화 장치는, 비식별화 영역(431-441)으로 결정되지 않은 단위 영역(411)들 중 임의의 단위 영역(411)에 대하여 다시 너비 우선 탐색을 수행하여 단위 영역(411)들을 그룹화할 수 있다. Then, the de-identification device performs a breadth-first search again on an arbitrary unit area 411 among the unit areas 411 not determined as non-identified areas 431 to 441 to find the unit areas 411. can be grouped.

따라서, 비식별화 영역(431-441)은 모든 단위 영역(411)이 비식별화 영역(431-441)들 중 어느 하나에 속하도록 단위 영역(411)들을 그룹화할 수 있다. 생성된 비식별화 영역(431-441)들 각각에 포함된 위치 정보들의 수는, 익명성 임계치(401) 보다 크거나 같을 수 있다. 도 4를 참조하면, 전체 영역(430)은 복수의 비식별화 영역(431-441)들로 구성될 수 있다. Accordingly, the non-identified regions 431 to 441 may group the unit regions 411 such that all unit regions 411 belong to one of the non-identified regions 431 to 441 . The number of location information included in each of the generated non-identification areas 431 to 441 may be greater than or equal to the anonymity threshold 401 . Referring to FIG. 4 , the entire area 430 may include a plurality of non-identified areas 431-441.

일례로, 비식별화 장치는, 각 단위 영역(411)을 버텍스(vertex), 인접한 단위 영역(411)들의 간 공유되는 모서리를 엣지(edge)로 하는 그래프를 생성할 수 있다. 각 버텍스의 값은, 그 버텍스에 대응하는 단위 영역(411)에 포함된 위치 정보의 수로 결정될 수 있다. For example, the non-identification device may generate a graph in which each unit region 411 is a vertex and a corner shared between adjacent unit regions 411 is an edge. The value of each vertex may be determined by the number of location information included in the unit area 411 corresponding to the vertex.

비식별화 장치는, 생성되는 그래프에서, 임의의 버텍스를 기준으로, 선택된 버텍스들의 값의 합이 익명성 임계치(401) 보다 클때까지, 너비 우선 탐색을 수행하여 상기 조건을 만족하는 버텍스들을 그룹화할 수 있다. The de-identification device performs a breadth-first search on the basis of a random vertex in the generated graph until the sum of the values of the selected vertices is greater than the anonymity threshold 401 to group vertices that satisfy the condition. can

비식별화 장치는, 익명성 임계치(401)가 낮을수록 비식별화 영역(431-441)의 수가 증가하도록 비식별화 영역(431-441)을 생성할 수 있다. 즉, 최종적으로 결정되는 비식별화 영역(431-441)의 수는, 익명성 임계치(401)가 낮을수록 증가할 수 있다. The de-identification device may generate de-identification areas 431-441 such that the number of de-identification areas 431-441 increases as the anonymity threshold 401 decreases. That is, the number of finally determined non-identified regions 431 to 441 may increase as the anonymity threshold 401 decreases.

비식별화 장치는, 익명성 임계치(401)가 높을수록 비식별화 영역(431-441)의 수가 감소하도록 비식별화 영역(431-441)을 생성할 수 있다. 즉, 최종적으로 결정되는 비식별화 영역(431-441)의 수는, 익명성 임계치(401)가 높을수록 감소할 수 있다.The de-identification device may generate de-identification areas 431-441 such that the number of de-identification areas 431-441 decreases as the anonymity threshold 401 increases. That is, the number of finally determined non-identified regions 431 to 441 may decrease as the anonymity threshold 401 increases.

일례로, 단위 영역(411)들의 그룹화는 초기에 선택되는 단위 영역(411)의 시작 위치나, 너비 우선 탐색의 방향 등에 따라, 서로 다른 조합의 비식별화 영역(431-441)들이 생성될 수 있다. 즉, 모든 비식별화 영역(431-441)에 포함되는 위치 정보들의 수가 익명성 임계치(401) 보다 크거나 같다는 조건에서, 다양한 조합의 비식별화 영역(431-441)들이 생성될 수 있다. For example, in the grouping of the unit areas 411, different combinations of non-identified areas 431 to 441 may be generated according to the starting position of the initially selected unit area 411 or the direction of breadth-first search. there is. That is, under the condition that the number of location information included in all de-identification areas 431-441 is greater than or equal to the anonymity threshold 401, various combinations of de-identification areas 431-441 may be generated.

비식별화 장치는, 단위 영역(411)들을 서로 다른 복수의 방식으로 그룹핑하여 복수의 비식별화 영역(431-441)들의 조합들을 생성하고, 생성되는 비식별화 영역(431-441)들의 조합들 중 사용성 평가 결과가 가장 높은 비식별화 영역(431-441)들의 조합을 최종적인 비식별화 결과로 결정할 수 있다. The de-identification device groups the unit regions 411 in a plurality of different ways to generate combinations of a plurality of non-identification regions 431-441, and combinations of the generated non-identification regions 431-441. Among them, a combination of de-identification regions 431 to 441 having the highest usability evaluation result may be determined as the final de-identification result.

일례로, 사용성 평가에 데이터 활용성 지표 함수가 이용될 수 있다. 일례로, 비식별화 장치는 복수의 비식별화 영역(431-441)들의 조합 각각에 대한 데이터 활용성 지표 함수의 값을 결정하고, 데이터 활용성 지표 함수의 값이 가장 큰 비식별화 영역(431-441)들의 조합을 최종적인 비식별화 결과로 결정할 수 있다. For example, a data usability index function may be used for usability evaluation. As an example, the de-identification device determines the value of the data usability index function for each combination of a plurality of non-identification regions 431-441, and the non-identification region having the largest value of the data usability index function ( 431-441) can be determined as the final de-identification result.

또는, 일례로, 사용성 평가에 데이터 활용성 지표 함수가 이용될 수 있다. 일례로, 비식별화 장치는 복수의 비식별화 영역(431-441)들의 조합 각각에 대한 데이터 활용성 지표 함수의 값을 결정하고, 데이터 활용성 지표 함수의 값의 argmax 값이 가장 큰 경우의 비식별화 영역(431-441)들의 조합을 최종적인 비식별화 결과로 결정할 수 있다.Alternatively, as an example, a data usability index function may be used for usability evaluation. As an example, the non-identification device determines the value of the data availability index function for each combination of a plurality of non-identification regions 431-441, and the case where the argmax value of the value of the data availability index function is the largest. A combination of the de-identification regions 431 to 441 may be determined as a final de-identification result.

또는, 비식별화 장치는, 단위 영역(411)들을 서로 다른 복수의 방식으로 그룹핑하여 복수의 비식별화 영역(431-441)들의 조합들을 생성하고, 생성되는 비식별화 영역(431-441)들의 조합들 중 비식별화 영역(431-441)들의 수가 미리 설정된 기준 개수 이하인 비식별화 영역(431-441)들의 조합을 최종적인 비식별화 결과로 결정할 수 있다. Alternatively, the de-identification device groups the unit regions 411 in a plurality of different ways to generate combinations of a plurality of non-identification regions 431 to 441, and generates combinations of the non-identification regions 431 to 441. A combination of non-identified regions 431 to 441 in which the number of non-identified regions 431 to 441 is equal to or less than a predetermined reference number among combinations of , may be determined as a final de-identified result.

비식별화 장치는, 비식별화 영역(431-441)들의 개수가 미리 설정된 기준 개수 이하가 되도록, 비식별화 영역(431-441)들을 생성할 수 있다. 즉, 개수 제한으로 인하여 비식별화된 데이터의 해상도가 보장될 수 있다. The de-identification device may generate non-identification regions 431 to 441 such that the number of non-identification regions 431 to 441 is less than or equal to a preset reference number. That is, the resolution of de-identified data can be guaranteed due to the number limitation.

도 5는 본 발명의 일실시예에 따른 서로 다른 범주에 속하는 사용자들의 위치 정보를 비식별화한 결과를 나타낸 것이다. 5 shows a result of de-identifying location information of users belonging to different categories according to an embodiment of the present invention.

일례로, 범주에 속하는 사용자들이란, 20대 남자, 30대 여자와 같이 개인 정보에서 일부 사항들이 공통되는 범주에 속하는 사용들을 의미할 수 있다. 여러 범주에 대한 사용자들의 위치 정보가 비식별화될 경우, 각 범주 별 비식별화 영역들(501-503)이 결정될 수 있다. 그리고, 비식별화 장치는, 각 범주 별 비식별화 영역들(501-503)을 결합하여 다차원의 비식별화 영역(504)을 생성할 수 있다. For example, users belonging to a category may refer to users belonging to a category in which some items of personal information are common, such as a man in his twenties and a woman in her thirties. When location information of users for several categories is de-identified, de-identification areas 501 to 503 for each category may be determined. Also, the de-identification device may generate a multi-dimensional de-identification area 504 by combining the de-identification areas 501 to 503 for each category.

본 발명의 일실시예에 따르면, 다양한 종류의 개인 정보가 위치 정보와 함께 포괄적으로 이용될 수 있다. 각 범주 별 비식별화 과정은 상술한 비식별화 과정과 동일할 수 있다. 본 발명의 일실시예에 따른 다차원의 비식별화 영역(504)은, 여러 서비스를 위한 빅데이터 분석으로 활용될 수 있다. According to one embodiment of the present invention, various types of personal information can be comprehensively used together with location information. The de-identification process for each category may be the same as the de-identification process described above. The multi-dimensional non-identification area 504 according to an embodiment of the present invention can be used for big data analysis for various services.

도 6는 본 발명의 일실시예에 따른 비식별화 방법을 플로우 차트로 도시한 도면이다. 6 is a flowchart illustrating a de-identification method according to an embodiment of the present invention.

단계(601)에서, 비식별화 장치는, 위치 정보들을 포함하는 전체 영역 및 익명성 임계치를 식별할 수 있다. 단계(602)에서, 비식별화 장치는, 전체 영역을 복수의 단위 영역들로 구분할 수 있다. In step 601, the de-identification device may identify the entire area including location information and an anonymity threshold. In step 602, the non-identification device may divide the entire area into a plurality of unit areas.

비식별화 장치는, 전체 영역을 빈틈없이 단위 영역들로 분리할 수 있다. 다만, 모든 단위 영역들의 너비나 부피가 같지 않을 수 있다. 비식별화 장치는, 인접한 단위 영역들 간에 하나 이상의 모서리 또는 면을 공유하도록, 전체 영역을 단위 영역들로 구분할 수 있다. 실시예에 따라, 인접한 단위 영역들 간에 하나 이상의 모서리 또는 면을 공유하는 조건 내에서, 다양한 형태의 단위 영역들이 이용될 수 있다.The de-identification device may divide the entire area into unit areas without gaps. However, the width or volume of all unit areas may not be the same. The de-identification device may divide the entire area into unit areas so that adjacent unit areas share one or more edges or faces. Depending on embodiments, unit regions of various shapes may be used within the condition that one or more edges or faces are shared between adjacent unit regions.

단계(603)에서, 비식별화 장치는, 단위 영역들 각각에 포함된 위치 정보의 수를 결정할 수 있다. 단계(604)에서, 비식별화 장치는, 익명성 임계치 및 단위 영역들 각각에 포함된 위치 정보의 수에 기초하여, 단위 영역들을 그룹핑함으로써 비식별화 영역들을 생성할 수 있다. In step 603, the non-identification device may determine the number of location information included in each of the unit areas. In step 604, the de-identification device may generate non-identification areas by grouping the unit areas based on the anonymity threshold and the number of location information included in each unit area.

비식별화 장치는, 단위 영역들 중 임의의 단위 영역에 포함되는 위치 정보들의 수가 익명성 임계치 보다 낮은 경우, 임의의 단위 영역에 인접하는 단위 영역과 그룹핑하여 비식별화 영역을 결정할 수 있다. When the number of location information items included in any unit area among unit areas is lower than the anonymity threshold, the de-identification device may determine the non-identification area by grouping the unit area adjacent to the arbitrary unit area.

비식별화 장치는, 비식별화 영역에 포함된 위치 정보들의 수가 익명성 임계치보다 낮은 경우, 비식별화 영역에 인접한 단위 영역과 비식별화 영역을 그룹화할 수 있다. When the number of location information included in the non-identification area is lower than the anonymity threshold, the non-identification device may group the unit area adjacent to the non-identification area and the non-identification area.

즉, 비식별화 장치는, 그룹핑된 단위 영역들에 포함되는 위치 정보들의 수가 익명성 임계치 보다 같거나 높은 경우에, 그룹핑된 단위 영역을 비식별화 영역을 결정할 수 있다. That is, the de-identification device may determine the grouped unit area as a non-identification area when the number of location information included in the grouped unit area is equal to or higher than the anonymity threshold.

일례로, 비식별화 장치는, 단위 영역들 각각에 포함된 위치 정보들의 수와 미리 설정된 익명성 임계치를 비교할 수 있다. 일례로, 비식별화 장치는, 임의의 단위 영역을 먼저 선택하고, 임의의 단위 영역에 포함되는 위치 정보의 수를 익명성 임계치와 비교할 수 있다. For example, the de-identification device may compare the number of pieces of location information included in each of the unit areas with a preset anonymity threshold. For example, the non-identification device may first select an arbitrary unit area and compare the number of location information included in the arbitrary unit area with an anonymity threshold.

일례로, 비식별화 장치는, 단위 영역 중 위치 정보들을 가장 많이 포함하는 단위 영역을 선택하고, 선택된 단위 영역에 포함되는 위치 정보의 수를 익명성 임계치와 비교할 수 있다. 선택된 단위 영역에 포함된 위치 정보의 수가 익명성 임계치보다 크거나 같은 경우, 비식별화 장치는, 별도의 그룹핑없이 선택된 단위 영역을 비식별화 영역으로 결정할 수 있다. For example, the non-identification device may select a unit area including the most location information among unit areas and compare the number of location information included in the selected unit area with an anonymity threshold. When the number of location information included in the selected unit area is greater than or equal to the anonymity threshold, the de-identification device may determine the selected unit area as a non-identification area without separate grouping.

비식별화 장치는, 단위 영역들을 서로 다른 복수의 방식으로 그룹핑하여 복수의 비식별화 영역들의 조합들을 생성하고, 생성되는 비식별화 영역들의 조합들 중 사용성 평가 결과가 가장 높은 비식별화 영역들의 조합을 최종적인 비식별화 결과로 결정할 수 있다. The de-identification device groups the unit areas in a plurality of different ways to generate combinations of a plurality of de-identification areas, and selects non-identification areas having the highest usability evaluation result among the generated combinations of de-identification areas. The combination can be determined as the final de-identification result.

일례로, 사용성 평가에 데이터 활용성 지표 함수가 이용될 수 있다. 일례로, 비식별화 장치는 복수의 비식별화 영역들의 조합 각각에 대한 데이터 활용성 지표 함수의 값을 결정하고, 데이터 활용성 지표 함수의 값이 가장 큰 비식별화 영역들의 조합을 최종적인 비식별화 결과로 결정할 수 있다. For example, a data usability index function may be used for usability evaluation. For example, the de-identification device determines the value of the data usability index function for each combination of a plurality of non-identification regions, and determines the combination of the non-identification regions having the largest value of the data usability index function as the final ratio. It can be determined as a result of identification.

한편, 본 발명에 따른 방법은 컴퓨터에서 실행될 수 있는 프로그램으로 작성되어 마그네틱 저장매체, 광학적 판독매체, 디지털 저장매체 등 다양한 기록 매체로도 구현될 수 있다.Meanwhile, the method according to the present invention is written as a program that can be executed on a computer and can be implemented in various recording media such as magnetic storage media, optical reading media, and digital storage media.

본 명세서에 설명된 각종 기술들의 구현들은 디지털 전자 회로조직으로, 또는 컴퓨터 하드웨어, 펌웨어, 소프트웨어로, 또는 그들의 조합들로 구현될 수 있다. 구현들은 데이터 처리 장치, 예를 들어 프로그램가능 프로세서, 컴퓨터, 또는 다수의 컴퓨터들의 동작에 의한 처리를 위해, 또는 이 동작을 제어하기 위해, 컴퓨터 프로그램 제품, 즉 정보 캐리어, 예를 들어 기계 판독가능 저장 장치(컴퓨터 판독가능 매체) 또는 전파 신호에서 유형적으로 구체화된 컴퓨터 프로그램으로서 구현될 수 있다. 상술한 컴퓨터 프로그램(들)과 같은 컴퓨터 프로그램은 컴파일된 또는 인터프리트된 언어들을 포함하는 임의의 형태의 프로그래밍 언어로 기록될 수 있고, 독립형 프로그램으로서 또는 모듈, 구성요소, 서브루틴, 또는 컴퓨팅 환경에서의 사용에 적절한 다른 유닛으로서 포함하는 임의의 형태로 전개될 수 있다. 컴퓨터 프로그램은 하나의 사이트에서 하나의 컴퓨터 또는 다수의 컴퓨터들 상에서 처리되도록 또는 다수의 사이트들에 걸쳐 분배되고 통신 네트워크에 의해 상호 연결되도록 전개될 수 있다.Implementations of the various techniques described herein may be implemented in digital electronic circuitry, or in computer hardware, firmware, software, or combinations thereof. Implementations may be a computer program product, i.e., an information carrier, e.g., a machine-readable storage, for processing by, or for controlling, the operation of a data processing apparatus, e.g., a programmable processor, computer, or plurality of computers. It can be implemented as a computer program tangibly embodied in a device (computer readable medium) or a radio signal. A computer program, such as the computer program(s) described above, may be written in any form of programming language, including compiled or interpreted languages, and may be written as a stand-alone program or in a module, component, subroutine, or computing environment. It can be deployed in any form, including as other units suitable for the use of. A computer program can be deployed to be processed on one computer or multiple computers at one site or distributed across multiple sites and interconnected by a communication network.

컴퓨터 프로그램의 처리에 적절한 프로세서들은 예로서, 범용 및 특수 목적 마이크로프로세서들 둘 다, 및 임의의 종류의 디지털 컴퓨터의 임의의 하나 이상의 프로세서들을 포함한다. 일반적으로, 프로세서는 판독 전용 메모리 또는 랜덤 액세스 메모리 또는 둘 다로부터 명령어들 및 데이터를 수신할 것이다. 컴퓨터의 요소들은 명령어들을 실행하는 적어도 하나의 프로세서 및 명령어들 및 데이터를 저장하는 하나 이상의 메모리 장치들을 포함할 수 있다. 일반적으로, 컴퓨터는 데이터를 저장하는 하나 이상의 대량 저장 장치들, 예를 들어 자기, 자기-광 디스크들, 또는 광 디스크들을 포함할 수 있거나, 이것들로부터 데이터를 수신하거나 이것들에 데이터를 송신하거나 또는 양쪽으로 되도록 결합될 수도 있다. 컴퓨터 프로그램 명령어들 및 데이터를 구체화하는데 적절한 정보 캐리어들은 예로서 반도체 메모리 장치들, 예를 들어, 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(Magnetic Media), CD-ROM(Compact Disk Read Only Memory), DVD(Digital Video Disk)와 같은 광 기록 매체(Optical Media), 플롭티컬 디스크(Floptical Disk)와 같은 자기-광 매체(Magneto-Optical Media), 롬(ROM, Read Only Memory), 램(RAM, Random Access Memory), 플래시 메모리, EPROM(Erasable Programmable ROM), EEPROM(Electrically Erasable Programmable ROM) 등을 포함한다. 프로세서 및 메모리는 특수 목적 논리 회로조직에 의해 보충되거나, 이에 포함될 수 있다.Processors suitable for processing a computer program include, by way of example, both general and special purpose microprocessors, and any one or more processors of any kind of digital computer. Generally, a processor will receive instructions and data from read only memory or random access memory or both. Elements of a computer may include at least one processor that executes instructions and one or more memory devices that store instructions and data. In general, a computer may include, receive data from, send data to, or both, one or more mass storage devices that store data, such as magnetic, magneto-optical disks, or optical disks. It can also be combined to become. Information carriers suitable for embodying computer program instructions and data include, for example, semiconductor memory devices, for example, magnetic media such as hard disks, floppy disks and magnetic tapes, compact disk read only memory (CD-ROM) ), optical media such as DVD (Digital Video Disk), magneto-optical media such as Floptical Disk, ROM (Read Only Memory), RAM (RAM) , Random Access Memory), flash memory, EPROM (Erasable Programmable ROM), EEPROM (Electrically Erasable Programmable ROM), and the like. The processor and memory may be supplemented by, or included in, special purpose logic circuitry.

또한, 컴퓨터 판독가능 매체는 컴퓨터에 의해 액세스될 수 있는 임의의 가용매체일 수 있고, 컴퓨터 저장매체 및 전송매체를 모두 포함할 수 있다.In addition, computer readable media may be any available media that can be accessed by a computer, and may include both computer storage media and transmission media.

본 명세서는 다수의 특정한 구현물의 세부사항들을 포함하지만, 이들은 어떠한 발명이나 청구 가능한 것의 범위에 대해서도 제한적인 것으로서 이해되어서는 안되며, 오히려 특정한 발명의 특정한 실시형태에 특유할 수 있는 특징들에 대한 설명으로서 이해되어야 한다. 개별적인 실시형태의 문맥에서 본 명세서에 기술된 특정한 특징들은 단일 실시형태에서 조합하여 구현될 수도 있다. 반대로, 단일 실시형태의 문맥에서 기술한 다양한 특징들 역시 개별적으로 혹은 어떠한 적절한 하위 조합으로도 복수의 실시형태에서 구현 가능하다. 나아가, 특징들이 특정한 조합으로 동작하고 초기에 그와 같이 청구된 바와 같이 묘사될 수 있지만, 청구된 조합으로부터의 하나 이상의 특징들은 일부 경우에 그 조합으로부터 배제될 수 있으며, 그 청구된 조합은 하위 조합이나 하위 조합의 변형물로 변경될 수 있다.Although this specification contains many specific implementation details, they should not be construed as limiting on the scope of any invention or what is claimed, but rather as a description of features that may be unique to a particular embodiment of a particular invention. It should be understood. Certain features that are described in this specification in the context of separate embodiments may also be implemented in combination in a single embodiment. Conversely, various features that are described in the context of a single embodiment can also be implemented in multiple embodiments individually or in any suitable subcombination. Further, while features may operate in particular combinations and are initially depicted as such claimed, one or more features from a claimed combination may in some cases be excluded from that combination, and the claimed combination is a subcombination. or sub-combination variations.

마찬가지로, 특정한 순서로 도면에서 동작들을 묘사하고 있지만, 이는 바람직한 결과를 얻기 위하여 도시된 그 특정한 순서나 순차적인 순서대로 그러한 동작들을 수행하여야 한다거나 모든 도시된 동작들이 수행되어야 하는 것으로 이해되어서는 안 된다. 특정한 경우, 멀티태스킹과 병렬 프로세싱이 유리할 수 있다. 또한, 상술한 실시형태의 다양한 장치 컴포넌트의 분리는 그러한 분리를 모든 실시형태에서 요구하는 것으로 이해되어서는 안되며, 설명한 프로그램 컴포넌트와 장치들은 일반적으로 단일의 소프트웨어 제품으로 함께 통합되거나 다중 소프트웨어 제품에 패키징 될 수 있다는 점을 이해하여야 한다.Similarly, while actions are depicted in the drawings in a particular order, it should not be construed as requiring that those actions be performed in the specific order shown or in the sequential order, or that all depicted actions must be performed to obtain desired results. In certain cases, multitasking and parallel processing can be advantageous. Further, the separation of various device components in the embodiments described above should not be understood as requiring such separation in all embodiments, and the program components and devices described may generally be integrated together into a single software product or packaged into multiple software products. You have to understand that you can.

한편, 본 명세서와 도면에 개시된 본 발명의 실시 예들은 이해를 돕기 위해 특정 예를 제시한 것에 지나지 않으며, 본 발명의 범위를 한정하고자 하는 것은 아니다. 여기에 개시된 실시 예들 이외에도 본 발명의 기술적 사상에 바탕을 둔 다른 변형 예들이 실시 가능하다는 것은, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 자명한 것이다.On the other hand, the embodiments of the present invention disclosed in this specification and drawings are only presented as specific examples to aid understanding, and are not intended to limit the scope of the present invention. In addition to the embodiments disclosed herein, it is obvious to those skilled in the art that other modified examples based on the technical idea of the present invention can be implemented.

101: 비식별화 장치101: de-identification device

Claims (20)

위치 정보의 비식별화 방법에 있어서,
사용자들의 위치 정보를 포함하는 전체 영역 및 익명성 임계치를 식별하는 단계;
상기 전체 영역을 복수의 단위 영역들로 구분하는 단계;
상기 단위 영역들 각각에 포함된 위치 정보의 수를 결정하는 단계; 및
상기 익명성 임계치 및 상기 단위 영역들 각각에 포함된 위치 정보의 수에 기초하여, 상기 단위 영역들을 그룹핑(grouping)함으로써 비식별화 영역들을 생성하는 단계를 포함하고,
상기 생성된 비식별화 영역들 각각에 포함된 위치 정보들의 수는, 상기 익명성 임계치 보다 크거나 같고,
상기 비식별화 영역들을 생성하는 단계는,
상기 단위 영역들을 서로 다른 복수의 방식으로 그룹핑하여 복수의 비식별화 영역들의 조합들을 생성하고, 상기 생성되는 비식별화 영역들의 조합들 중에서 최종적인 비식별화 결과를 결정하는 단계
를 포함하는 비식별화 방법.
In the non-identification method of location information,
identifying a total region containing location information of users and an anonymity threshold;
Dividing the entire area into a plurality of unit areas;
determining the number of location information included in each of the unit areas; and
Generating non-identification regions by grouping the unit regions based on the anonymity threshold and the number of location information included in each of the unit regions;
The number of location information included in each of the generated non-identification areas is greater than or equal to the anonymity threshold,
The step of creating the non-identified areas,
Grouping the unit regions in a plurality of different ways to generate combinations of a plurality of de-identification regions, and determining a final de-identification result among the generated combinations of de-identification regions.
Non-identification method comprising a.
제1항에 있어서,
상기 생성되는 비식별화 영역의 수는,
상기 익명성 임계치가 낮을수록 증가하고, 상기 익명성 임계치가 높을수록 감소하는, 비식별화 방법.
According to claim 1,
The number of generated non-identification regions is
The method of de-identification, which increases as the anonymity threshold is lower and decreases as the anonymity threshold is higher.
제1항에 있어서,
상기 비식별화 영역들을 생성하는 단계는,
상기 단위 영역들 중 임의의 단위 영역에 포함되는 위치 정보들의 수가 상기 익명성 임계치 보다 낮은 경우, 상기 임의의 단위 영역에 인접하는 단위 영역과 그룹핑하여 상기 비식별화 영역을 결정하는, 비식별화 방법.
According to claim 1,
The step of creating the non-identified areas,
When the number of pieces of location information included in an arbitrary unit area among the unit areas is lower than the anonymity threshold, determining the non-identification area by grouping with a unit area adjacent to the arbitrary unit area, the de-identification method .
제1항에 있어서,
상기 비식별화 영역들을 생성하는 단계는,
상기 비식별화 영역에 포함된 위치 정보들의 수가 상기 익명성 임계치보다 낮은 경우, 상기 비식별화 영역에 인접한 단위 영역과 상기 비식별화 영역을 그룹화하는, 비식별화 방법.
According to claim 1,
The step of creating the non-identified areas,
When the number of location information included in the non-identification region is lower than the anonymity threshold, grouping the non-identification region with a unit region adjacent to the non-identification region.
삭제delete 제1항에 있어서,
상기 최종적인 비식별화 결과를 결정하는 단계는,
상기 생성되는 비식별화 영역들의 조합들 중 사용성 평가 결과가 가장 높은 비식별화 영역들의 조합을 최종적인 비식별화 결과로 결정하는, 비식별화 방법.
According to claim 1,
The step of determining the final de-identification result,
The de-identification method of determining a combination of de-identification regions having the highest usability evaluation result among the generated combinations of de-identification regions as a final de-identification result.
제1항에 있어서,
상기 최종적인 비식별화 결과를 결정하는 단계는,
상기 생성되는 비식별화 영역들의 조합들 중 상기 비식별화 영역들의 수가 미리 설정된 기준 개수 이하인 비식별화 영역들의 조합을 최종적인 비식별화 결과로 결정하는, 비식별화 방법.
According to claim 1,
The step of determining the final de-identification result,
De-identifying a combination of de-identification regions in which the number of de-identification regions is less than or equal to a predetermined reference number among the generated combinations of de-identification regions is determined as a final de-identification result.
위치 정보의 비식별화 방법에 있어서,
임의의 범주에 속하는 사용자들의 위치 정보를 포함하는 지리적 영역을 식별하는 단계;
상기 지리적 영역을 각 차원 별로 복수의 단위 영역들로 분리하는 단계;
상기 단위 영역들 각각에 포함된 위치 정보들의 수와 미리 설정된 익명성 임계치를 비교하는 단계;
상기 비교한 결과에 기초하여, 상기 단위 영역들을 그룹핑(grouping)함으로써, 비식별화 영역을 생성하는 단계; 및
i) 상기 비식별화 영역과 ii) 상기 임의의 범주와 다른 범주에 속하는 사용자들의 위치 정보들을 포함하는 지리적 영역으로부터 생성된 비식별화 영역을 결합하여, 다차원의 비식별화 영역을 획득하는 단계를 포함하고,
상기 생성된 비식별화 영역들 각각에 포함된 위치 정보들의 수는, 상기 익명성 임계치 보다 크거나 같고,
상기 비식별화 영역을 생성하는 단계는,
상기 단위 영역들을 서로 다른 복수의 방식으로 그룹핑하여 복수의 비식별화 영역들의 조합들을 생성하고, 상기 생성되는 비식별화 영역들의 조합들 중에서 최종적인 비식별화 결과를 결정하는 단계
를 포함하는 비식별화 방법.
In the non-identification method of location information,
identifying a geographic area containing location information of users belonging to a certain category;
dividing the geographic area into a plurality of unit areas for each dimension;
comparing the number of pieces of location information included in each of the unit areas with a preset anonymity threshold;
generating a non-identification area by grouping the unit areas based on the comparison result; and
obtaining a multi-dimensional non-identification area by combining i) the de-identification area and ii) a de-identification area generated from a geographic area including location information of users belonging to the arbitrary category and other categories. include,
The number of location information included in each of the generated non-identification areas is greater than or equal to the anonymity threshold,
The step of creating the non-identification area,
Grouping the unit regions in a plurality of different ways to generate combinations of a plurality of de-identification regions, and determining a final de-identification result among the generated combinations of de-identification regions.
Non-identification method comprising a.
제8항에 있어서,
상기 생성되는 비식별화 영역의 수는,
상기 익명성 임계치가 낮을수록 증가하고, 상기 익명성 임계치가 높을수록 감소하는, 비식별화 방법.
According to claim 8,
The number of generated non-identification regions is
The method of de-identification, which increases as the anonymity threshold is lower and decreases as the anonymity threshold is higher.
제8항에 있어서,
상기 비식별화 영역들을 생성하는 단계는,
상기 단위 영역들 중 임의의 단위 영역에 포함되는 위치 정보들의 수가 상기 익명성 임계치 보다 낮은 경우, 상기 임의의 단위 영역에 인접하는 단위 영역과 그룹핑하여 상기 비식별화 영역을 결정하는, 비식별화 방법.
According to claim 8,
The step of creating the non-identified areas,
When the number of pieces of location information included in an arbitrary unit area among the unit areas is lower than the anonymity threshold, determining the non-identification area by grouping with a unit area adjacent to the arbitrary unit area, the de-identification method .
제8항에 있어서,
상기 비식별화 영역들을 생성하는 단계는,
상기 비식별화 영역에 포함된 위치 정보들의 수가 상기 익명성 임계치보다 낮은 경우, 상기 비식별화 영역에 인접한 단위 영역과 상기 비식별화 영역을 그룹화하는, 비식별화 방법.
According to claim 8,
The step of creating the non-identified areas,
When the number of location information included in the non-identification region is lower than the anonymity threshold, grouping the non-identification region with a unit region adjacent to the non-identification region.
삭제delete 위치 정보의 비식별화 장치에 있어서,
상기 비식별화 장치는 프로세서를 포함하고,
상기 프로세서는,
사용자들의 위치 정보를 포함하는 전체 영역 및 익명성 임계치를 식별하고, 상기 전체 영역을 복수의 단위 영역들로 구분하고, 상기 단위 영역들 각각에 포함된 위치 정보의 수를 결정하고, 상기 익명성 임계치 및 상기 단위 영역들 각각에 포함된 위치 정보의 수에 기초하여, 상기 단위 영역들을 그룹핑(grouping)함으로써 비식별화 영역들을 생성하고,
상기 생성된 비식별화 영역들 각각에 포함된 위치 정보들의 수는, 상기 익명성 임계치 보다 크거나 같고,
상기 프로세서는,
상기 단위 영역들을 서로 다른 복수의 방식으로 그룹핑하여 복수의 비식별화 영역들의 조합들을 생성하고, 상기 생성되는 비식별화 영역들의 조합들 중에서 최종적인 비식별화 결과를 결정하는
비식별화 장치.
In the non-identification device of location information,
The de-identification device includes a processor,
the processor,
Identifying an entire area including location information of users and an anonymity threshold, dividing the entire area into a plurality of unit areas, determining the number of location information included in each of the unit areas, and determining the anonymity threshold and generating non-identification regions by grouping the unit regions based on the number of location information included in each of the unit regions;
The number of location information included in each of the generated non-identification areas is greater than or equal to the anonymity threshold,
the processor,
Grouping the unit regions in a plurality of different ways to create combinations of a plurality of de-identification regions, and determining a final de-identification result among the generated combinations of de-identification regions
de-identification device.
제13항에 있어서,
상기 생성되는 비식별화 영역의 수는,
상기 익명성 임계치가 낮을수록 증가하고, 상기 익명성 임계치가 높을수록 감소하는, 비식별화 장치.
According to claim 13,
The number of generated non-identification regions is
The de-identification device increases as the anonymity threshold is lower and decreases as the anonymity threshold is higher.
제13항에 있어서,
상기 프로세서는,
상기 단위 영역들 중 임의의 단위 영역에 포함되는 위치 정보들의 수가 상기 익명성 임계치 보다 낮은 경우, 상기 임의의 단위 영역에 인접하는 단위 영역과 그룹핑하여 상기 비식별화 영역을 결정하는, 비식별화 장치.
According to claim 13,
the processor,
When the number of pieces of location information included in an arbitrary unit area among the unit areas is lower than the anonymity threshold, the de-identification device determines the non-identification area by grouping with a unit area adjacent to the arbitrary unit area. .
제13항에 있어서,
상기 프로세서는,
상기 비식별화 영역에 포함된 위치 정보들의 수가 상기 익명성 임계치보다 낮은 경우, 상기 비식별화 영역에 인접한 단위 영역과 상기 비식별화 영역을 그룹화하는, 비식별화 장치.
According to claim 13,
the processor,
When the number of location information included in the non-identification region is lower than the anonymity threshold, grouping the non-identification region with a unit region adjacent to the non-identification region, the non-identification device.
삭제delete 제13항에 있어서,
상기 프로세서는,
상기 생성되는 비식별화 영역들의 조합들 중 사용성 평가 결과가 가장 높은 비식별화 영역들의 조합을 최종적인 비식별화 결과로 결정하는, 비식별화 장치
According to claim 13,
the processor,
De-identification device for determining a combination of de-identification regions having the highest usability evaluation result among the generated combinations of de-identification regions as a final de-identification result.
제13항에 있어서,
상기 프로세서는,
상기 생성되는 비식별화 영역들의 조합들 중 상기 비식별화 영역들의 수가 미리 설정된 기준 개수 이하인 비식별화 영역들의 조합을 최종적인 비식별화 결과로 결정하는 단계를 포함하는, 비식별화 장치.
According to claim 13,
the processor,
And determining a combination of de-identification regions in which the number of de-identification regions is equal to or less than a predetermined reference number among the generated combinations of de-identification regions as a final de-identification result.
위치 정보의 비식별화 장치에 있어서,
상기 비식별화 장치는 프로세서를 포함하고,
상기 프로세서는,
임의의 범주에 속하는 사용자들의 위치 정보를 포함하는 지리적 영역을 식별하고, 상기 지리적 영역을 각 차원 별로 복수의 단위 영역들로 분리하고, 상기 단위 영역들 각각에 포함된 위치 정보들의 수와 미리 설정된 익명성 임계치를 비교하고, 상기 비교한 결과에 기초하여, 상기 단위 영역들을 그룹핑(grouping)함으로써, 비식별화 영역을 생성하고, i) 상기 비식별화 영역과 ii) 상기 임의의 범주와 다른 범주에 속하는 사용자들의 위치 정보들을 포함하는 지리적 영역으로부터 생성된 비식별화 영역을 결합하여, 다차원의 비식별화 영역을 획득하고,
상기 생성된 비식별화 영역들 각각에 포함된 위치 정보들의 수는, 상기 익명성 임계치 보다 크거나 같고,
상기 프로세서는,
상기 단위 영역들을 서로 다른 복수의 방식으로 그룹핑하여 복수의 비식별화 영역들의 조합들을 생성하고, 상기 생성되는 비식별화 영역들의 조합들 중에서 최종적인 비식별화 결과를 결정하는
비식별화 장치.
In the non-identification device of location information,
The de-identification device includes a processor,
the processor,
A geographic area including location information of users belonging to a certain category is identified, the geographic area is divided into a plurality of unit areas for each dimension, the number of location information items included in each of the unit areas and a preset anonymity A gender threshold is compared, and based on the result of the comparison, the unit regions are grouped to generate a non-identified region, i) the non-identified region and ii) a category different from the arbitrary category Obtaining a multi-dimensional non-identification area by combining de-identification areas generated from geographical areas including location information of belonging users;
The number of location information included in each of the generated non-identification areas is greater than or equal to the anonymity threshold,
the processor,
Grouping the unit regions in a plurality of different ways to create combinations of a plurality of de-identification regions, and determining a final de-identification result among the generated combinations of de-identification regions
de-identification device.
KR1020210091098A 2021-07-12 2021-07-12 Method and Apparatus for De-identifying Location Information KR102507480B1 (en)

Priority Applications (2)

Application Number Priority Date Filing Date Title
KR1020210091098A KR102507480B1 (en) 2021-07-12 2021-07-12 Method and Apparatus for De-identifying Location Information
PCT/KR2022/003170 WO2023286968A1 (en) 2021-07-12 2022-03-07 Method and device for de-identifying location information

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020210091098A KR102507480B1 (en) 2021-07-12 2021-07-12 Method and Apparatus for De-identifying Location Information

Publications (2)

Publication Number Publication Date
KR20230010485A KR20230010485A (en) 2023-01-19
KR102507480B1 true KR102507480B1 (en) 2023-03-09

Family

ID=84920396

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020210091098A KR102507480B1 (en) 2021-07-12 2021-07-12 Method and Apparatus for De-identifying Location Information

Country Status (2)

Country Link
KR (1) KR102507480B1 (en)
WO (1) WO2023286968A1 (en)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5846548B2 (en) * 2010-12-27 2016-01-20 日本電気株式会社 Information protection apparatus and information protection method
JP2016162271A (en) * 2015-03-03 2016-09-05 Kddi株式会社 Anonymization device, method and program
JP2016206896A (en) * 2015-04-21 2016-12-08 トヨタ自動車株式会社 Position information anonymization method, movement information anonymization method, and device
JP6125153B2 (en) * 2012-04-27 2017-05-10 Kddi株式会社 Position information anonymization device, position information anonymization method and program

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20160066661A (en) * 2014-12-02 2016-06-13 한양대학교 에리카산학협력단 Method and system for achieving anonymity in location based services

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5846548B2 (en) * 2010-12-27 2016-01-20 日本電気株式会社 Information protection apparatus and information protection method
JP6125153B2 (en) * 2012-04-27 2017-05-10 Kddi株式会社 Position information anonymization device, position information anonymization method and program
JP2016162271A (en) * 2015-03-03 2016-09-05 Kddi株式会社 Anonymization device, method and program
JP2016206896A (en) * 2015-04-21 2016-12-08 トヨタ自動車株式会社 Position information anonymization method, movement information anonymization method, and device

Also Published As

Publication number Publication date
WO2023286968A1 (en) 2023-01-19
KR20230010485A (en) 2023-01-19

Similar Documents

Publication Publication Date Title
JP6007969B2 (en) Anonymization device and anonymization method
US9395194B2 (en) System and method for providing tile-map using electronic navigation chart
CN108492124A (en) Store information recommends method, apparatus and client
CN107402955A (en) The method and apparatus for determining the index grid of geography fence
CN111143685B (en) Commodity recommendation method and device
Wang et al. Network optimization approach to delineating health care service areas: Spatially constrained Louvain and Leiden algorithms
CN110516476B (en) Geographical indistinguishable location privacy protection method based on frequent location classification
Azri et al. Voronoi classified and clustered data constellation: A new 3D data structure for geomarketing strategies
CN114490656A (en) Data query method, device, equipment and storage medium
McKenzie et al. Geo-privacy beyond coordinates
KR102507480B1 (en) Method and Apparatus for De-identifying Location Information
Chua et al. Binsq: Visualizing geographic dot density patterns with gridded maps
Schiavina et al. Ghsl-oecd functional urban areas
JP6015777B2 (en) Confidential data generation method and apparatus
Yilmaz et al. Predicting optimal facility location without customer locations
Lee et al. An evaluation of kernel smoothing to protect the confidentiality of individual locations
US20150220545A1 (en) Indexing system of spatial information for combined soi object and content
Croft et al. Location-based anonymization: comparison and evaluation of the Voronoi-based aggregation system
CN111382220A (en) POI data dividing method and device
Lin et al. A local polycategorical approach to areal interpolation
CN110895703A (en) Legal document routing identification method and device
Schnell et al. Locational privacy-preserving distance computations with intersecting sets of randomly labeled grid points
Henson et al. The anatomy of the TNM for colon cancer
CN113590535A (en) Efficient data migration method and device for deduplication storage system
Ball et al. Comparison of different methods for spatial analysis of cancer data in Utah

Legal Events

Date Code Title Description
N231 Notification of change of applicant
E701 Decision to grant or registration of patent right