KR102615618B1 - Medical information de-identification system - Google Patents

Medical information de-identification system Download PDF

Info

Publication number
KR102615618B1
KR102615618B1 KR1020210168760A KR20210168760A KR102615618B1 KR 102615618 B1 KR102615618 B1 KR 102615618B1 KR 1020210168760 A KR1020210168760 A KR 1020210168760A KR 20210168760 A KR20210168760 A KR 20210168760A KR 102615618 B1 KR102615618 B1 KR 102615618B1
Authority
KR
South Korea
Prior art keywords
information
hex
medical
medical information
unit
Prior art date
Application number
KR1020210168760A
Other languages
Korean (ko)
Other versions
KR20230081063A (en
Inventor
이태우
Original Assignee
(주)휴먼스케이프
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by (주)휴먼스케이프 filed Critical (주)휴먼스케이프
Priority to KR1020210168760A priority Critical patent/KR102615618B1/en
Publication of KR20230081063A publication Critical patent/KR20230081063A/en
Application granted granted Critical
Publication of KR102615618B1 publication Critical patent/KR102615618B1/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/62Protecting access to data via a platform, e.g. using keys or access control rules
    • G06F21/6218Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
    • G06F21/6245Protecting personal data, e.g. for financial or medical purposes
    • G06F21/6254Protecting personal data, e.g. for financial or medical purposes by anonymising data, e.g. decorrelating personal data from the owner's identification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/602Providing cryptographic facilities or services
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/60ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records

Abstract

서울특별시 서울산업진흥원 (2021년도 제4회 서울혁신챌린지 결선) (IC210004) (블록체인 기반 희귀질환 데이터 포털 개발 및 사업화)을 통해 개발된 기술이다. 본 발명은 의료 정보 비식별화 시스템을 개시한다. 상기 의료 정보 비식별화 시스템은, 제공자로부터 의료 정보를 수신하고, 개인 정보를 식별하는 식별부, 상기 개인 정보에 추가 정보를 결합하여 결합 정보를 생성하는 결합부, 상기 결합 정보를 암호화하여 암호 정보를 생성하는 암호화부 및 상기 의료 정보에 상기 암호 정보를 추가하여 재구성하여 비식별화 정보를 생성하는 재구성부를 포함한다.This is a technology developed through the Seoul Business Agency (2021 4th Seoul Innovation Challenge Final) (IC210004) (Development and commercialization of blockchain-based rare disease data portal). The present invention discloses a medical information de-identification system. The medical information de-identification system includes an identification unit that receives medical information from a provider and identifies personal information, a combining unit that combines additional information with the personal information to generate combined information, and encrypts the combined information to create password information. It includes an encryption unit that generates and a reconstruction unit that adds the encryption information to the medical information and reconstructs it to generate de-identified information.

Description

의료 정보 비식별화 시스템{Medical information de-identification system}Medical information de-identification system}

본 발명은 의료 정보 비식별화 시스템에 관한 것이다. 구체적으로, 본 발명은 개인 정보를 암호화할 때 다른 부가 정보를 통해서 비식별화 효과를 극대화하는 의료 정보 비식별화 시스템에 관한 것이다.The present invention relates to a medical information de-identification system. Specifically, the present invention relates to a medical information de-identification system that maximizes the de-identification effect through other additional information when encrypting personal information.

서울특별시 서울산업진흥원 (2021년도 제4회 서울혁신챌린지 결선) (IC210004) (블록체인 기반 희귀질환 데이터 포털 개발 및 사업화)을 통해 개발된 기술이다. 의료 정보의 경우 개인 정보를 포함하고 있고, 이러한 개인 정보가 타인에게 유출되는 경우 그 개인에게 피해를 끼칠 수 있어 이를 방지하기 위한 법적 제재가 존재한다. 일명 데이터 3법이라 불리는 3가지 법은 각각 「개인정보 보호법」,「정보통신망 이용촉진 및 정보보호 등에 관한 법률(약칭 : 정보통신망법)」,「신용정보의 이용 및 보호에 관한 법률(약칭 : 신용정보법)」을 의미한다.This is a technology developed through the Seoul Business Agency (2021 4th Seoul Innovation Challenge Final) (IC210004) (Development and commercialization of blockchain-based rare disease data portal). Medical information contains personal information, and if such personal information is leaked to others, it can cause harm to the individual, so legal sanctions exist to prevent this. The three laws, so-called the three data laws, are the Personal Information Protection Act, the Act on Promotion of Information and Communications Network Utilization and Information Protection, etc. (abbreviated name: Information and Communications Network Act), and the Act on Use and Protection of Credit Information (abbreviated name: Credit Information Act). Information Act)”.

이러한 데이터 3법은 개인을 식별할 수 있는 정보를 다루기 위해서는 각 개인의 동의를 받거나 비식별화 처리를 수행해야 한다고 규정하였다. 그러나, 비식별화 처리의 경우 너무 강하게 수행되면 데이터의 활용에 크게 제한이 오고, 너무 약하게 수행되면 개인 정보의 유출 사고가 발생할 수도 있다. These three data laws stipulate that in order to handle personally identifiable information, the consent of each individual must be obtained or de-identified processing must be performed. However, in the case of de-identification processing, if it is performed too strongly, it will greatly limit the use of data, and if it is performed too weakly, a leak of personal information may occur.

따라서, 비식별화의 적절한 수준의 유지는 매우 중요한 사항 중에 하나이다.Therefore, maintaining an appropriate level of de-identification is one of the most important matters.

본 발명의 과제는, 높은 효율의 의료 정보 비식별화 시스템을 제공하는 것이다.The object of the present invention is to provide a highly efficient medical information de-identification system.

본 발명의 목적들은 이상에서 언급한 목적으로 제한되지 않으며, 언급되지 않은 본 발명의 다른 목적 및 장점들은 하기의 설명에 의해서 이해될 수 있고, 본 발명의 실시예에 의해 보다 분명하게 이해될 것이다. 또한, 본 발명의 목적 및 장점들은 특허 청구 범위에 나타낸 수단 및 그 조합에 의해 실현될 수 있음을 쉽게 알 수 있을 것이다.The objects of the present invention are not limited to the objects mentioned above, and other objects and advantages of the present invention that are not mentioned can be understood by the following description and will be more clearly understood by the examples of the present invention. Additionally, it will be readily apparent that the objects and advantages of the present invention can be realized by the means and combinations thereof indicated in the patent claims.

상기 과제를 해결하기 위한 본 발명의 몇몇 실시예에 따른 의료 정보 비식별화 시스템은 제공자로부터 의료 정보를 수신하고, 개인 정보를 식별하는 식별부, 상기 개인 정보에 추가 정보를 결합하여 결합 정보를 생성하는 결합부, 상기 결합 정보를 암호화하여 암호 정보를 생성하는 암호화부 및 상기 의료 정보에 상기 암호 정보를 추가하여 재구성하여 비식별화 정보를 생성하는 재구성부를 포함한다.To solve the above problems, a medical information de-identification system according to some embodiments of the present invention receives medical information from a provider, creates an identification unit that identifies personal information, and combines additional information with the personal information to generate combined information. It includes a combining unit that encrypts the combined information to generate encryption information, and a reconstruction unit that adds the encryption information to the medical information and reconstructs it to generate de-identified information.

본 발명의 의료 정보 비식별화 시스템은, 비식별화가 필요한 정보에 다른 추가정보를 더욱 추가하여 암호화를 수행하여 비식별화의 정도를 높일 수 있다.The medical information de-identification system of the present invention can increase the degree of de-identification by performing encryption by adding additional information to the information that needs to be de-identified.

상술한 내용과 더불어 본 발명의 구체적인 효과는 이하 발명을 실시하기 위한 구체적인 사항을 설명하면서 함께 기술한다.In addition to the above-described content, specific effects of the present invention are described below while explaining specific details for carrying out the invention.

도 1은 본 발명의 몇몇 실시예들에 따른 의료 정보 비식별화 시스템을 설명하기 위한 개념도이다.
도 2는 도 1의 서버의 구조를 세부적으로 설명하기 위한 블록도이다.
도 3은 도 1의 의료 정보를 세부적으로 설명하기 위한 블록도이다.
도 4는 도 2의 추출부를 세부적으로 설명하기 위한 블록도이다.
도 5는 도 2의 결합부를 세부적으로 설명하기 위한 블록도이다.
도 6은 도 1의 비식별화 정보를 세부적으로 설명하기 위한 블록도이다.
도 7은 본 발명의 몇몇 실시예들에 따른 의료 정보 비식별화 시스템을 설명하기 위한 블록도이다.
도 8은 도 7의 결합부를 세부적으로 설명하기 위한 블록도이다.
도 9는 본 발명의 몇몇 실시예들에 따른 의료 정보 비식별화 시스템을 설명하기 위한 블록도이다.
도 10은 도 9의 랜덤 추출부를 세부적으로 설명하기 위한 블록도이다.
1 is a conceptual diagram illustrating a medical information de-identification system according to some embodiments of the present invention.
FIG. 2 is a block diagram for explaining in detail the structure of the server of FIG. 1.
FIG. 3 is a block diagram to explain the medical information of FIG. 1 in detail.
Figure 4 is a block diagram for explaining the extraction unit of Figure 2 in detail.
Figure 5 is a block diagram for explaining the coupling part of Figure 2 in detail.
FIG. 6 is a block diagram for explaining in detail the de-identified information of FIG. 1.
Figure 7 is a block diagram illustrating a medical information de-identification system according to some embodiments of the present invention.
FIG. 8 is a block diagram for explaining the coupling portion of FIG. 7 in detail.
Figure 9 is a block diagram for explaining a medical information de-identification system according to some embodiments of the present invention.
FIG. 10 is a block diagram for explaining the random extraction unit of FIG. 9 in detail.

본 명세서 및 특허청구범위에서 사용된 용어나 단어는 일반적이거나 사전적인 의미로 한정하여 해석되어서는 아니된다. 발명자가 그 자신의 발명을 최선의 방법으로 설명하기 위해 용어나 단어의 개념을 정의할 수 있다는 원칙에 따라, 본 발명의 기술적 사상과 부합하는 의미와 개념으로 해석되어야 한다. 또한, 본 명세서에 기재된 실시예와 도면에 도시된 구성은 본 발명이 실현되는 하나의 실시예에 불과하고, 본 발명의 기술적 사상을 전부 대변하는 것이 아니므로, 본 출원시점에 있어서 이들을 대체할 수 있는 다양한 균등물과 변형 및 응용 가능한 예들이 있을 수 있음을 이해하여야 한다.Terms or words used in this specification and patent claims should not be construed as limited to their general or dictionary meaning. According to the principle that the inventor can define terms or word concepts in order to explain his or her invention in the best way, it should be interpreted with a meaning and concept consistent with the technical idea of the present invention. In addition, the embodiments described in this specification and the configurations shown in the drawings are only one embodiment of the present invention and do not completely represent the technical idea of the present invention, so they cannot be replaced at the time of filing the present application. It should be understood that there may be various equivalents, variations, and applicable examples.

본 명세서 및 특허청구범위에서 사용된 제1, 제2, A, B 등의 용어는 다양한 구성요소들을 설명하는데 사용될 수 있지만, 상기 구성요소들은 상기 용어들에 의해 한정되어서는 안 된다. 상기 용어들은 하나의 구성요소를 다른 구성요소로부터 구별하는 목적으로만 사용된다. 예를 들어, 본 발명의 권리 범위를 벗어나지 않으면서 제1 구성요소는 제2 구성요소로 명명될 수 있고, 유사하게 제2 구성요소도 제1 구성요소로 명명될 수 있다. '및/또는' 이라는 용어는 복수의 관련된 기재된 항목들의 조합 또는 복수의 관련된 기재된 항목들 중의 어느 항목을 포함한다.Terms such as first, second, A, and B used in the present specification and claims may be used to describe various components, but the components should not be limited by the terms. The above terms are used only for the purpose of distinguishing one component from another. For example, a first component may be named a second component, and similarly, the second component may also be named a first component without departing from the scope of the present invention. The term 'and/or' includes any of a plurality of related stated items or a combination of a plurality of related stated items.

본 명세서 및 특허청구범위에서 사용된 용어는 단지 특정한 실시 예를 설명하기 위해 사용된 것으로, 본 발명을 한정하려는 의도가 아니다. 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다. 본 출원에서 "포함하다" 또는 "가지다" 등의 용어는 명세서상에 기재된 특징, 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.The terms used in the specification and claims are merely used to describe specific embodiments and are not intended to limit the invention. Singular expressions include plural expressions unless the context clearly dictates otherwise. In this application, terms such as "include" or "have" should be understood as not precluding the existence or addition possibility of features, numbers, steps, operations, components, parts, or combinations thereof described in the specification. .

다르게 정의되지 않는 한, 기술적이거나 과학적인 용어를 포함해서 여기서 사용되는 모든 용어들은 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에 의해서 일반적으로 이해되는 것과 동일한 의미를 가지고 있다.Unless otherwise defined, all terms used herein, including technical or scientific terms, have the same meaning as generally understood by a person of ordinary skill in the technical field to which the present invention pertains.

일반적으로 사용되는 사전에 정의되어 있는 것과 같은 용어들은 관련 기술의 문맥상 가지는 의미와 일치하는 의미를 가지는 것으로 해석되어야 하며, 본 출원에서 명백하게 정의하지 않는 한, 이상적이거나 과도하게 형식적인 의미로 해석되지 않는다.Terms defined in commonly used dictionaries should be interpreted as having a meaning consistent with the meaning in the context of the related technology, and unless clearly defined in the present application, should not be interpreted in an ideal or excessively formal sense. No.

또한, 본 발명의 각 실시예에 포함된 각 구성, 과정, 공정 또는 방법 등은 기술적으로 상호 간 모순되지 않는 범위 내에서 공유될 수 있다. Additionally, each configuration, process, process, or method included in each embodiment of the present invention may be shared within the scope of not being technically contradictory to each other.

이하, 도 1 내지 도 6을 참조하여, 본 발명의 몇몇 실시예들에 따른 의료 정보 비식별화 시스템을 설명한다.Hereinafter, with reference to FIGS. 1 to 6, a medical information de-identification system according to some embodiments of the present invention will be described.

도 1은 본 발명의 몇몇 실시예들에 따른 의료 정보 비식별화 시스템을 설명하기 위한 개념도이다.1 is a conceptual diagram illustrating a medical information de-identification system according to some embodiments of the present invention.

도 1을 참조하면, 본 발명의 몇몇 실시예들에 따른 의료 정보 비식별화 시스템은 제1 서버(200)를 포함하고, 제공자(100)로부터 의료 정보(Ipm)를 받아 연구자(300)에게 비식별화 정보(Idm)를 제공할 수 있다.Referring to FIG. 1, the medical information de-identification system according to some embodiments of the present invention includes a first server 200, receives medical information (Ipm) from the provider 100, and transmits the medical information (Ipm) to the researcher 300. Identification information (Idm) can be provided.

제공자(100)는 의료 정보(Ipm)를 생성할 수 있다. 구체적으로, 제공자(100)는 본인의 건강에 대한 정보인 의료 정보(Ipm)를 획득할 수 있다. 즉, 제공자(100)가 의료 기관에서 테스트를 받거나 이미 보유하고 있는 정보들이 모두 의료 정보(Ipm)에 포함될 수 있다. 또한, 의료 정보(Ipm)는 제공자(100)의 치료 이력, 투약 이력, 입원 이력 등등 의료 기관과 관계된 모든 정보를 포함할 수 있다.Provider 100 may generate medical information (Ipm). Specifically, the provider 100 can obtain medical information (Ipm), which is information about the person's health. That is, all information that the provider 100 receives from a medical institution or already possesses may be included in the medical information (Ipm). Additionally, the medical information (Ipm) may include all information related to the medical institution, such as the provider 100's treatment history, medication history, hospitalization history, etc.

제1 서버(200)는 제공자(100)로부터 의료 정보(Ipm)를 수신할 수 있다. 제1 서버(200)는 의료 정보(Ipm)를 가공하여 비식별화 정보(Idm)를 생성할 수 있다. 제1 서버(200)는 비식별화 정보(Idm)를 연구자(300)에게 제공할 수 있다.The first server 200 may receive medical information (Ipm) from the provider 100. The first server 200 may process medical information (Ipm) to generate de-identified information (Idm). The first server 200 may provide de-identified information (Idm) to the researcher 300.

이때, 제1 서버(200)는 워크스테이션(workstation), 데이터 센터, 인터넷 데이터 센터(internet data center(IDC)), DAS(direct attached storage) 시스템, SAN(storage area network) 시스템, NAS(network attached storage) 시스템 및 RAID(redundant array of inexpensive disks, or redundant array of independent disks) 시스템 중 적어도 하나로 구현될 수 있으나, 본 실시예가 이에 제한되는 것은 아니다.At this time, the first server 200 is a workstation, a data center, an internet data center (IDC), a direct attached storage (DAS) system, a storage area network (SAN) system, and a network attached (NAS) system. storage) system and a RAID (redundant array of inexpensive disks, or redundant array of independent disks) system, but the present embodiment is not limited thereto.

제1 서버(200)는 네트워크를 통해서 데이터를 전송할 수 있다. 네트워크는 유선 인터넷 기술, 무선 인터넷 기술 및 근거리 통신 기술에 의한 네트워크를 포함할 수 있다. 유선 인터넷 기술은 예를 들어, 근거리 통신망(LAN, Local area network) 및 광역 통신망(WAN, wide area network) 중 적어도 하나를 포함할 수 있다.The first server 200 may transmit data through a network. Networks may include networks based on wired Internet technology, wireless Internet technology, and short-distance communication technology. Wired Internet technology may include, for example, at least one of a local area network (LAN) and a wide area network (WAN).

무선 인터넷 기술은 예를 들어, 무선랜(Wireless LAN: WLAN), DLNA(Digital Living Network Alliance), 와이브로(Wireless Broadband: Wibro), 와이맥스(World Interoperability for Microwave Access: Wimax), HSDPA(High Speed Downlink Packet Access), HSUPA(High Speed Uplink Packet Access), IEEE 802.16, 롱 텀 에볼루션(Long Term Evolution: LTE), LTE-A(Long Term Evolution-Advanced), 광대역 무선 이동 통신 서비스(Wireless Mobile Broadband Service: WMBS) 및 5G NR(New Radio) 기술 중 적어도 하나를 포함할 수 있다. 단, 본 실시예가 이에 제한되는 것은 아니다.Wireless Internet technologies include, for example, Wireless LAN (WLAN), DLNA (Digital Living Network Alliance), Wibro (Wireless Broadband), Wimax (World Interoperability for Microwave Access: Wimax), and HSDPA (High Speed Downlink Packet). Access), HSUPA (High Speed Uplink Packet Access), IEEE 802.16, Long Term Evolution (LTE), LTE-A (Long Term Evolution-Advanced), Wireless Mobile Broadband Service (WMBS) and 5G NR (New Radio) technology. However, this embodiment is not limited to this.

근거리 통신 기술은 예를 들어, 블루투스(Bluetooth), RFID(Radio Frequency Identification), 적외선 통신(Infrared Data Association: IrDA), UWB(Ultra-Wideband), 지그비(ZigBee), 인접 자장 통신(Near Field Communication: NFC), 초음파 통신(Ultra Sound Communication: USC), 가시광 통신(Visible Light Communication: VLC), 와이 파이(Wi-Fi), 와이 파이 다이렉트(Wi-Fi Direct), 5G NR (New Radio) 중 적어도 하나를 포함할 수 있다. 단, 본 실시예가 이에 제한되는 것은 아니다.Short-range communication technologies include, for example, Bluetooth, Radio Frequency Identification (RFID), Infrared Data Association (IrDA), Ultra-Wideband (UWB), ZigBee, and Near Field Communication. At least one of NFC), Ultrasound Communication (USC), Visible Light Communication (VLC), Wi-Fi, Wi-Fi Direct, and 5G NR (New Radio) may include. However, this embodiment is not limited to this.

네트워크를 통해서 통신하는 제1 서버(200), 제공자(100) 및 연구자(300)는 이동통신을 위한 기술표준 및 표준 통신 방식을 준수할 수 있다. 예를 들어, 표준 통신 방식은 GSM(Global System for Mobile communication), CDMA(Code Division Multi Access), CDMA2000(Code Division Multi Access 2000), EV-DO(Enhanced Voice-Data Optimized or Enhanced Voice-Data Only), WCDMA(Wideband CDMA), HSDPA(High Speed Downlink Packet Access), HSUPA(High Speed Uplink Packet Access), LTE(Long Term Evolution), LTEA(Long Term Evolution-Advanced) 및 5G NR(New Radio) 중 적어도 하나를 포함할 수 있다. 단, 본 실시예가 이에 제한되는 것은 아니다.The first server 200, provider 100, and researcher 300 that communicate through the network can comply with technical standards and standard communication methods for mobile communication. For example, standard communication methods include GSM (Global System for Mobile communication), CDMA (Code Division Multi Access), CDMA2000 (Code Division Multi Access 2000), and EV-DO (Enhanced Voice-Data Optimized or Enhanced Voice-Data Only). , at least one of Wideband CDMA (WCDMA), High Speed Downlink Packet Access (HSDPA), High Speed Uplink Packet Access (HSUPA), Long Term Evolution (LTE), Long Term Evolution-Advanced (LTEA), and 5G New Radio (NR) may include. However, this embodiment is not limited to this.

연구자(300)는 비식별화 정보(Idm)를 통해서 연구를 진행할 수 있다. 이때, 비식별화 정보(Idm)는 의료 정보(Ipm) 내에서 개인을 식별할 수 있는 정보를 비식별화한 정보일 수 있다. 즉, 연구자(300)는 비식별화 정보(Idm)를 통해서 개인을 식별할 수는 없지만, 이를 통해서 의료 연구를 충분히 진행할 수 있다.Researchers 300 can conduct research through de-identified information (Idm). At this time, the de-identified information (Idm) may be information that has de-identified the information that can identify an individual within the medical information (Ipm). In other words, the researcher 300 cannot identify an individual through de-identified information (Idm), but can sufficiently conduct medical research through this.

도 2는 도 1의 서버의 구조를 세부적으로 설명하기 위한 블록도이고, 도 3은 도 1의 의료 정보를 세부적으로 설명하기 위한 블록도이다.FIG. 2 is a block diagram for explaining in detail the structure of the server of FIG. 1, and FIG. 3 is a block diagram for explaining the medical information of FIG. 1 in detail.

도 2 및 도 3을 참조하면, 제1 서버(200)는 식별부(210), 추출부(220), 제1 결합부(230), 암호화부(240) 및 재구성부(250)를 포함할 수 있다.2 and 3, the first server 200 may include an identification unit 210, an extraction unit 220, a first combining unit 230, an encryption unit 240, and a reconstruction unit 250. You can.

식별부(210)는 의료 정보(Ipm)를 제공자(100)로부터 수신할 수 있다. 식별부(210)는 의료 정보(Ipm) 내의 개인 정보(Iid)를 식별할 수 있다. 식별부(210)는 개인 정보(Iid)를 제1 결합부(230)로 전송할 수 있다.The identification unit 210 may receive medical information (Ipm) from the provider 100. The identification unit 210 may identify personal information (Iid) in medical information (Ipm). The identification unit 210 may transmit personal information (Iid) to the first combination unit 230.

도 1 및 도 3을 참조하면, 의료 정보(Ipm)는 다양한 필드로 이루어져 있을 수 있다. 하나의 필드는 한 명의 제공자(100)에 대한 의료 정보일 수 있다. 도 3에서는 하나의 행 즉, 하나의 제공자(100)에 대한 의료 정보만 도시되었지만, 본 실시예가 이에 제한되는 것은 아니다. 즉, 제공자(100) 및 행은 2개 이상일 수도 있다.Referring to FIGS. 1 and 3, medical information (Ipm) may consist of various fields. One field may be medical information for one provider (100). Although only one row, that is, medical information for one provider 100, is shown in FIG. 3, the present embodiment is not limited thereto. That is, there may be two or more providers 100 and rows.

의료 정보(Ipm)는 개인 정보(Iid)와 비개인 정보(Idid)를 포함할 수 있다. 개인 정보(Iid)를 개인을 식별할 수 있는 정보이고, 비개인 정보(Idid)는 개인을 식별할 수 없는 정보일 수 있다. 이때, 의료 정보(Ipm) 중 개인 정보(Iid)가 아닌 것은 비개인 정보(Idid)일 수 있다. 단, 본 실시예가 이에 제한되는 것은 아니다.Medical information (Ipm) may include personal information (Iid) and non-personal information (Idid). Personal information (Id) may be information that can identify an individual, and non-personal information (Idid) may be information that cannot identify an individual. At this time, medical information (Ipm) that is not personal information (Iid) may be non-personal information (Idid). However, this embodiment is not limited to this.

개인 정보(Iid)는 예를 들어, 번호, 이름, 전화번호, CI(Connecting Information), DI(Duplication Information), 생년월일 및 성별 중 적어도 하나를 포함할 수 있다. 단, 본 실시예가 이에 제한되는 것은 아니다. 개인 정보(Iid)는 주민등록번호와 같은 다른 식별 항목을 포함할 수도 있다.Personal information (Iid) may include, for example, at least one of a number, name, phone number, CI (Connecting Information), DI (Duplicate Information), date of birth, and gender. However, this embodiment is not limited to this. Personal information (Iid) may also include other identifying items such as social security number.

비개인 정보(Idid)는 개인 정보(Iid)에 의해서 식별된 개인의 의료에 대한 정보일 수 있다. 비개인 정보(Idid)는 도 3에 도시된 바와 같이 안과에 대한 정보일 수 있다. 즉, 비개인 정보(Idid)는 각각 양쪽 눈의 근시도수, 난시도수 및 난시축 중 적어도 하나를 포함할 수 있다. 또는 비개인 정보(Idid)는 혈액 검사, 초음파 검사, 조직 검사, 문진 및 측정 등과 같이 다양한 방식으로 획득된 정보일 수 있고, 개인을 식별하기 어려운 정보를 의미할 수 있다.Non-personal information (Idid) may be information about the medical care of an individual identified by personal information (Id). Non-personal information (Idid) may be information about ophthalmology, as shown in FIG. 3. That is, the non-personal information (Idid) may include at least one of the myopia power, astigmatism power, and astigmatism axis of each eye. Alternatively, non-personal information (Idid) may be information obtained in various ways, such as blood tests, ultrasound examinations, tissue examinations, questionnaires, and measurements, and may refer to information that is difficult to identify an individual.

다시, 도 2를 참조하면, 추출부(220)는 의료 정보(Ipm)를 수신할 수 있다. 추출부(220)는 또한 식별부(210)로부터 개인 정보(Iid)를 수신할 수 있다. 이를 통해서 추출부(220)는 의료 정보(Ipm) 중 개인 정보(Iid)가 아닌 영역(즉, 비개인 정보(Idid))에서 적어도 일부를 추출하여 추가 정보(Iad)를 생성할 수 있다. 추출부(220)는 추가 정보(Iad)를 제1 결합부(230)로 전송할 수 있다.Again, referring to FIG. 2, the extraction unit 220 may receive medical information (Ipm). The extraction unit 220 may also receive personal information (Iid) from the identification unit 210. Through this, the extraction unit 220 can generate additional information (Iad) by extracting at least part of the medical information (Ipm) from an area that is not personal information (Iid) (i.e., non-personal information (Idid)). The extraction unit 220 may transmit additional information (Iad) to the first combining unit 230.

제1 결합부(230)는 개인 정보(Iid)와 추가 정보(Iad)를 수신하여 이를 결합할 수 있다. 제1 결합부(230)는 개인 정보(Iid) 및 추가 정보(Iad)가 결합된 결합 정보(Icm)를 생성할 수 있다. 이때, 결합 정보(Icm)는 헥스 코드(hex code)로 생성될 수 있다. 단, 본 실시예가 이에 제한되는 것은 아니다. 제1 결합부(230)는 결합 정보(Icm)를 암호화부(240)로 전송할 수 있다.The first combining unit 230 may receive personal information (Iid) and additional information (Iad) and combine them. The first combination unit 230 may generate combined information (Icm) by combining personal information (Iid) and additional information (Iad). At this time, the combination information (Icm) may be generated as a hex code. However, this embodiment is not limited to this. The first combination unit 230 may transmit the combination information (Icm) to the encryption unit 240.

암호화부(240)는 결합 정보(Icm)를 암호화하여 암호 정보(Ien)를 생성할 수 있다. 암호화부(240)는 단순히 개인 정보(Iid)뿐만 아니라 추가 정보(Iad)까지 결합된 결합 정보(Icm)를 암호화하여 일반적인 암호화보다 더 높은 수준의 보안을 유지할 수 있다. 즉, 암호화된 내용이 복호화된다고 하여도 결합 정보(Icm)만을 알 수 있을 뿐 결합 정보(Icm)에서 개인 정보(Iid)만을 분리하기 어려울 수 있다. 또한, 암호화의 인풋이 길어짐에 따라서 암호화에 대한 복호화의 난이도 또한 높아져 보안 수준도 높아질 수 있다. The encryption unit 240 may generate encryption information (Ien) by encrypting the combination information (Icm). The encryption unit 240 can maintain a higher level of security than general encryption by encrypting the combined information (Icm) that combines not only personal information (Iid) but also additional information (Iad). That is, even if the encrypted content is decrypted, only the combined information (Icm) can be known, and it may be difficult to separate the personal information (Iid) from the combined information (Icm). In addition, as the encryption input becomes longer, the difficulty of decryption also increases, which can increase the security level.

암호화부(240)는 해시(hash) 함수를 이용하여 암호화를 수행할 수 있다. 다만, 본 실시예가 이에 제한되는 것은 아니다. 암호화부(240)의 해시 함수 사용은 2회 이상일 수도 있다. 이를 통해서 보안 수준과 비식별화 수준이 향상될 수 있다.The encryption unit 240 may perform encryption using a hash function. However, this embodiment is not limited to this. The hash function of the encryption unit 240 may be used twice or more. Through this, the level of security and de-identification can be improved.

암호화부(240)가 해시 함수를 이용함에 따라서, 추후에 다른 정보에 대한 검증 요청이 제공되는 경우 무결성 체크도 가능할 수 있다. 이때, 단순히 개인 정보(Iid) 만을 해시 함수에 통과시켜 검증하는 것보다 추가 정보(Iad)를 부가하여 해시 함수에 통과시키는 것이 무결성 체크의 성능을 더욱 높일 수 있다.As the encryption unit 240 uses a hash function, an integrity check may be possible when a verification request for other information is provided later. At this time, rather than simply passing only the personal information (Iid) through the hash function to verify it, adding additional information (Iad) and passing it through the hash function can further improve the performance of the integrity check.

암호화부(240)는 암호화한 결과인 암호 정보(Ien)를 생성하고 이를 재구성부(250)로 전송할 수 있다.The encryption unit 240 may generate encryption information (Ien), which is the result of encryption, and transmit it to the reconstruction unit 250.

재구성부(250)는 의료 정보(Ipm)를 수신할 수 있다. 재구성부(250)는 암호 정보(Ien)도 수신할 수 있다. 재구성부(250)는 의료 정보(Ipm) 내의 개인 정보(Iid)를 재구성하여 암호 정보(Ien)로 대체할 수 있다. 이에 따라, 의료 정보(Ipm)는 재구성되어 비식별화 정보(Idm)로 변환될 수 있다. 재구성부(250)는 비식별화 정보(Idm)를 연구자(300)에게 제공할 수 있다.The reconstruction unit 250 may receive medical information (Ipm). The reconstruction unit 250 may also receive encryption information (Ien). The reconstruction unit 250 may reconstruct the personal information (Iid) in the medical information (Ipm) and replace it with password information (Ien). Accordingly, the medical information (Ipm) can be reconstructed and converted into de-identified information (Idm). The reconstruction unit 250 may provide de-identified information (Idm) to the researcher 300.

도 4는 도 2의 추출부를 세부적으로 설명하기 위한 블록도이다.Figure 4 is a block diagram for explaining the extraction unit of Figure 2 in detail.

도 4를 참조하면, 추출부(220)는 제1 추출 모듈(221), 제1 헥스 모듈(222) 및 제2 추출 모듈(223)을 포함할 수 있다.Referring to FIG. 4 , the extraction unit 220 may include a first extraction module 221, a first hex module 222, and a second extraction module 223.

제1 추출 모듈(221)은 의료 정보(Ipm) 및 개인 정보(Iid)를 수신할 수 있다. 제1 추출 모듈(221)은 의료 정보(Ipm)에서 개인 정보(Iid)를 제외한 비개인 정보(Idid)를 생성할 수 있다. 구체적으로, 제1 추출 모듈(221)은 의료 정보(Ipm)에서 개인 정보(Iid)를 제거하는 방식으로 비개인 정보(Idid)를 생성할 수 있다. 단, 본 실시예가 이에 제한되는 것은 아니다.The first extraction module 221 may receive medical information (Ipm) and personal information (Iid). The first extraction module 221 may generate non-personal information (Idid) excluding personal information (Iid) from medical information (Ipm). Specifically, the first extraction module 221 may generate non-personal information (Idid) by removing personal information (Id) from medical information (Ipm). However, this embodiment is not limited to this.

제1 헥스 모듈(222)은 비개인 정보(Idid)를 수신할 수 있다. 제1 헥스 모듈(222)은 비개인 정보(Idid)를 헥스 코드로 변환할 수 있다. 이때, 헥스 코드란, 16진수를 이용하여 색상을 표현하는 방식으로 모든 형태의 데이터는 헥스 코드로 표현될 수 있다. 제1 헥스 모듈(222)은 비개인 정보(Idid)를 변환하여 제1 헥스 정보(Ih1)를 생성할 수 있다.The first hex module 222 may receive non-personal information (Idid). The first hex module 222 can convert non-personal information (Idid) into hex code. At this time, hex code is a method of expressing color using hexadecimal numbers, and all types of data can be expressed as hex code. The first hex module 222 may generate first hex information (Ih1) by converting non-personal information (Idid).

제2 추출 모듈(223)은 제1 헥스 정보(Ih1)를 수신할 수 있다. 제2 추출 모듈(223)은 제1 헥스 정보(Ih1) 중 일부를 추출할 수 있다. 이때, 제2 추출 모듈(223)은 미리 설정된 기준에 의해서 추출을 수행할 수 있다. 미리 설정된 기준이란 예를 들어, 제1 헥스 정보(Ih1)가 문자와 숫자의 시퀀스로 표현되므로 시퀀스의 몇번째 요소를 추출하는 지를 의미할 수 있다. 즉, 미리 설정된 기준은 '3번째, 5번째, 8번째, 15번째 요소를 추출하는 경우'일 수 있다. 또는 미리 설정된 기준은 '1번째 숫자', '15번째 문자' 등과 같이 다른 방식으로 결정될 수도 있다. 또는 특정한 기준에 의해서 1번째 요소가 선정된 경우 1번째 요소 3번째 앞에 있는 요소를 2번째 요소로 선정하는 방식 등도 얼마든지 가능할 수 있다. 즉, 미리 설정된 기준은 얼마든지 다양할 수 있다. The second extraction module 223 may receive first hex information (Ih1). The second extraction module 223 may extract part of the first hex information (Ih1). At this time, the second extraction module 223 may perform extraction based on preset standards. For example, the preset standard may mean which element of the sequence is extracted since the first hex information (Ih1) is expressed as a sequence of letters and numbers. In other words, the preset standard may be 'when extracting the 3rd, 5th, 8th, and 15th elements.' Alternatively, the preset criteria may be determined in other ways, such as '1st number', '15th character', etc. Alternatively, if the first element is selected based on a specific standard, it may be possible to select the element third before the first element as the second element. In other words, the preset standards can be as diverse as possible.

제1 헥스 정보(Ih1)의 형태는 비개인 정보(Idid)에 의해서 다양할 수 있으므로 미리 설정된 기준이 정해져 있다고 하여도 결과물로 추출된 정보는 임의적인 형태일 수 있다. 이러한 임의성을 통해서 추후 암호화 과정이 더욱 복잡해질 수 있다.The form of the first hex information (Ih1) may vary depending on the non-personal information (Idid), so even if a preset standard is set, the information extracted as a result may be in an arbitrary form. This randomness can make the subsequent encryption process more complicated.

제2 추출 모듈(223)은 제1 헥스 정보(Ih1)에서 추출을 수행하여 추가 정보(Iad)를 생성할 수 있다. 추가 정보(Iad)는 헥스 코드 형태로 추가될 수 있다. 단, 본 실시예가 이에 제한되는 것은 아니다.The second extraction module 223 may generate additional information (Iad) by performing extraction from the first hex information (Ih1). Additional information (Iad) can be added in the form of a hex code. However, this embodiment is not limited to this.

도 5는 도 2의 결합부를 세부적으로 설명하기 위한 블록도이다.Figure 5 is a block diagram for explaining the coupling part of Figure 2 in detail.

도 5를 참조하면, 제1 결합부(230)는 제2 헥스 모듈(231) 및 헥스 결합 모듈(232)을 포함할 수 있다.Referring to FIG. 5, the first coupling unit 230 may include a second hex module 231 and a hex coupling module 232.

제2 헥스 모듈(231)은 개인 정보(Iid)를 수신할 수 있다. 제2 헥스 모듈(231)은 개인 정보(Iid)를 헥스 코드로 변환할 수 있다. 제2 헥스 모듈(231)은 개인 정보(Iid)를 헥스 코드로 변환하여 제2 헥스 정보(Ih2)를 생성할 수 있다.The second hex module 231 can receive personal information (Iid). The second hex module 231 can convert personal information (Iid) into hex code. The second hex module 231 may generate second hex information (Ih2) by converting personal information (Iid) into a hex code.

헥스 결합 모듈(232)은 제2 헥스 정보(Ih2)를 수신할 수 있다. 헥스 결합 모듈(232)은 추가 정보(Iad)를 수신할 수 있다. 헥스 결합 모듈(232)은 추가 정보(Iad)와 제2 헥스 정보(Ih2)를 결합할 수 있다. 헥스 결합 모듈(232)은 추가 정보(Iad)와 제2 헥스 정보(Ih2)를 결합하여 결합 정보(Icm)를 생성할 수 있다. 헥스 결합 모듈(232)의 결합 방식은 단순히 추가 정보(Iad)와 제2 헥스 정보(Ih2)를 앞뒤로 이어 붙이는 방식일 수 있다. 이때, 추가 정보(Iad)와 제2 헥스 정보(Ih2)의 순서는 추가 정보(Iad)와 제2 헥스 정보(Ih2)의 순서일 수도 그 반대일 수도 있다.The hex combination module 232 may receive second hex information (Ih2). The hex combination module 232 may receive additional information (Iad). The hex combination module 232 may combine additional information (Iad) and second hex information (Ih2). The hex combination module 232 may generate combination information (Icm) by combining the additional information (Iad) and the second hex information (Ih2). The combining method of the hex combining module 232 may simply be a method of concatenating the additional information (Iad) and the second hex information (Ih2) back and forth. At this time, the order of the additional information (Iad) and the second hex information (Ih2) may be the order of the additional information (Iad) and the second hex information (Ih2) or vice versa.

또는, 헥스 결합 모듈(232)은 미리 설정된 다른 기준에 의해서 추가 정보(Iad)와 제2 헥스 정보(Ih2)를 결합할 수 있다. 예를 들어 추가 정보(Iad)는 짝수 위치에 나누어져 배치되고 제2 헥스 정보(Ih2)는 홀수 위치에 나누어져 배치되는 방식일 수 있다. 단, 본 실시예가 이에 제한되는 것은 아니고 다양한 방법이 가능할 수 있다.Alternatively, the hex combination module 232 may combine the additional information (Iad) and the second hex information (Ih2) according to other preset criteria. For example, the additional information (Iad) may be divided and placed in even-numbered positions, and the second hex information (Ih2) may be divided and placed in odd-numbered positions. However, this embodiment is not limited to this and various methods may be possible.

도 6은 도 1의 비식별화 정보를 세부적으로 설명하기 위한 블록도이다.FIG. 6 is a block diagram for explaining in detail the de-identified information of FIG. 1.

도 6을 참조하면, 비식별화 정보(Idm)는 기존의 의료 정보(Ipm)에서 개인 정보(Iid) 부분이 암호 정보(Ien)로 대체되어 생성될 수 있다. 따라서, 비식별화 정보(Idm)는 암호 정보(Ien) 및 비개인 정보(Idid)를 포함할 수 있다. 이때, 비개인 정보(Idid)는 비식별화 정보(Idm)에서 암호 정보(Ien)를 제외한 정보일 수 있다.Referring to FIG. 6, de-identified information (Idm) may be generated by replacing the personal information (Iid) part of the existing medical information (Ipm) with password information (Ien). Accordingly, the de-identified information (Idm) may include password information (Ien) and non-personal information (Idid). At this time, the non-personal information (Idid) may be information excluding the password information (Ien) from the de-identified information (Idm).

본 실시예에 따른 의료 정보 비식별화 시스템은 연구자에게 연구를 위한 정보를 제공하면서도 개인 정보 유출을 막을 수 있다. 또한, 개인 정보의 암호화의 복잡성이 높아져 해커들에 의한 복호화 가능을 크게 낮출 수 있다.The medical information de-identification system according to this embodiment can prevent personal information leakage while providing researchers with information for research. Additionally, as the complexity of encryption of personal information increases, the possibility of decryption by hackers can be greatly reduced.

또한, 본 실시예에 따른 의료 정보 비식별화 시스템은 의료 정보(Ipm) 및 비식별화 정보(Idm)를 블록체인에 저장하여 보관할 수 있다. 이에 따라서, 비식별화 정보(Idm)가 추후 변경되지 않았다는 점이 확실하게 인증되고 이를 통해서 변경된 정보의 무결성 체크도 더욱 정확하게 수행할 수 있다.Additionally, the medical information de-identification system according to this embodiment can store and store medical information (Ipm) and de-identified information (Idm) in a blockchain. Accordingly, it is reliably authenticated that the de-identified information (Idm) has not been changed later, and through this, the integrity check of the changed information can also be performed more accurately.

이때, 단순히 개인 정보(Iid)뿐이 아니라 추가 정보(Iad)를 통해서 암호화를 수행할 수 있고, 해시함수를 이용하는 경우 해시값을 생성할 수 있어서 무결성 체크의 신뢰도를 더욱 향상시킬 수 있다.At this time, encryption can be performed not only through personal information (Iid) but also through additional information (Iad), and when using a hash function, a hash value can be generated, further improving the reliability of the integrity check.

이하, 도 7 및 도 8을 참조하여, 본 발명의 몇몇 실시예에 따른 의료 정보 비식별화 시스템을 설명한다. 상술한 실시예와 중복되는 설명은 간략히 하거나 생략한다.Hereinafter, with reference to FIGS. 7 and 8, a medical information de-identification system according to some embodiments of the present invention will be described. Descriptions that overlap with the above-described embodiments will be simplified or omitted.

도 7은 본 발명의 몇몇 실시예들에 따른 의료 정보 비식별화 시스템을 설명하기 위한 블록도이다.Figure 7 is a block diagram illustrating a medical information de-identification system according to some embodiments of the present invention.

도 7을 참조하면, 제2 서버(200_1)는 도 2의 추출부(220)를 포함하지 않고, 제2 결합부(230_1)를 포함할 수 있다. 제2 결합부(230_1)는 도 2의 추가 정보(Iad)를 수신하지 않고 결합 정보(Icm)를 생성할 수 있다.Referring to FIG. 7 , the second server 200_1 may not include the extraction unit 220 of FIG. 2 but may include a second coupling unit 230_1. The second combination unit 230_1 may generate combination information (Icm) without receiving the additional information (Iad) of FIG. 2.

도 8은 도 7의 결합부를 세부적으로 설명하기 위한 블록도이다.FIG. 8 is a block diagram for explaining the coupling portion of FIG. 7 in detail.

도 8을 참조하면, 제2 결합부(230_1)는 코드 데이터베이스(233)를 포함할 수 있다.Referring to FIG. 8 , the second coupling unit 230_1 may include a code database 233.

코드 데이터베이스(233)는 추가 헥스 코드(hc)를 미리 저장할 수 있다. 코드 데이터베이스(233)는 미리 저장된 추가 헥스 코드(hc)를 헥스 결합 모듈(232)로 전송할 수 있다.The code database 233 may store additional hex codes (hc) in advance. The code database 233 may transmit a pre-stored additional hex code (hc) to the hex combination module 232.

헥스 결합 모듈(232)은 제2 헥스 정보(Ih2) 및 추가 헥스 코드(hc)를 수신할 수 있다. 헥스 결합 모듈(232)은 제2 헥스 정보(Ih2) 및 추가 헥스 코드(hc)를 결합하여 결합 정보(Icm)를 생성할 수 있다. The hex combination module 232 may receive second hex information (Ih2) and additional hex code (hc). The hex combination module 232 may generate combination information (Icm) by combining the second hex information (Ih2) and the additional hex code (hc).

헥스 결합 모듈(232)의 결합 방식은 단순히 추가 헥스 코드(hc)와 제2 헥스 정보(Ih2)를 앞뒤로 이어 붙이는 방식일 수 있다. 이때, 추가 헥스 코드(hc)와 제2 헥스 정보(Ih2)의 순서는 추가 헥스 코드(hc)와 제2 헥스 정보(Ih2)의 순서일 수도 그 반대일 수도 있다. 또는, 헥스 결합 모듈(232)은 미리 설정된 다른 기준에 의해서 추가 헥스 코드(hc)와 제2 헥스 정보(Ih2)를 결합할 수도 있다.The combining method of the hex combining module 232 may simply be a method of concatenating the additional hex code (hc) and the second hex information (Ih2) back and forth. At this time, the order of the additional hex code (hc) and the second hex information (Ih2) may be the order of the additional hex code (hc) and the second hex information (Ih2) or vice versa. Alternatively, the hex combination module 232 may combine the additional hex code (hc) and the second hex information (Ih2) according to other preset criteria.

본 실시예는 의료 정보(Ipm)에서 추가 정보(Iad)를 가져오는 방식이 아닌 미리 저장된 추가 헥스 코드(hc)를 이용하는 방식으로 개인 정보(Iid)와 전혀 관계없는 추가 헥스 코드(hc)를 통해서 보안성을 더욱 높게 가져갈 수 있다.This embodiment uses a pre-stored additional hex code (hc) rather than retrieving additional information (Iad) from medical information (Ipm), and uses an additional hex code (hc) that is completely unrelated to personal information (Iid). Security can be further improved.

이하, 도 9 및 도 10을 참조하여, 본 발명의 몇몇 실시예에 따른 의료 정보 비식별화 시스템을 설명한다. 상술한 실시예와 중복되는 설명은 간략히 하거나 생략한다.Hereinafter, with reference to FIGS. 9 and 10, a medical information de-identification system according to some embodiments of the present invention will be described. Descriptions that overlap with the above-described embodiments will be simplified or omitted.

도 9는 본 발명의 몇몇 실시예들에 따른 의료 정보 비식별화 시스템을 설명하기 위한 블록도이다.Figure 9 is a block diagram for explaining a medical information de-identification system according to some embodiments of the present invention.

도 9를 참조하면, 제3 서버(200_2)는 도 2의 추출부(220) 대신에 랜덤 추출부(220_1)를 포함할 수 있다. 랜덤 추출부(220_1)는 의료 정보(Ipm)를 수신하고, 식별부(210)로부터 개인 정보(Iid)를 수신할 수 있다. 이에 따라서, 랜덤 추출부(220_1)는 의료 정보(Ipm)에서 개인 정보(Iid)가 아닌 정보 중 랜덤하게 추출을 수행하여 추가 정보(Iad)를 생성할 수 있다.Referring to FIG. 9, the third server 200_2 may include a random extraction unit 220_1 instead of the extraction unit 220 of FIG. 2. The random extraction unit 220_1 may receive medical information (Ipm) and receive personal information (Iid) from the identification unit 210. Accordingly, the random extraction unit 220_1 may generate additional information (Iad) by randomly extracting information other than personal information (Iid) from the medical information (Ipm).

도 10은 도 9의 추출부를 세부적으로 설명하기 위한 블록도이다.FIG. 10 is a block diagram for explaining the extraction unit of FIG. 9 in detail.

도 10을 참조하면, 랜덤 추출부(220_1)는 제2 추출 모듈(223) 대신 제3 추출 모듈(223)을 더 포함할 수 있다.Referring to FIG. 10 , the random extraction unit 220_1 may further include a third extraction module 223 instead of the second extraction module 223.

제3 추출 모듈(223)은 제1 헥스 정보(Ih1)를 수신할 수 있다. 제3 추출 모듈(223)은 제1 헥스 정보(Ih1) 중 일부를 추출할 수 있다. 이때, 제2 추출 모듈(223)은 미리 설정된 기준이 아닌 임의적으로(randomly) 추출을 수행할 수 있다. 제3 추출 모듈(223)은 내부적으로 랜덤 함수 등을 이용하여 추출을 수행하고 이에 따라서 추가 정보(Iad)가 생성될 수 있다.The third extraction module 223 may receive first hex information (Ih1). The third extraction module 223 may extract part of the first hex information (Ih1). At this time, the second extraction module 223 may perform extraction randomly rather than based on preset standards. The third extraction module 223 internally performs extraction using a random function, etc., and additional information (Iad) may be generated accordingly.

본 실시예는 추가 정보(Iad)의 생성에도 미리 설정된 기준이 아니라 랜덤 방식을 사용하므로 암호화 방식의 자유도가 더욱 높아져 보안성이 향상될 수 있다. 이에 따라서, 비식별화된 부분의 유출 확률이 낮아져 더욱 안전하게 제공자(100)가 의료 정보(Ipm)를 제공할 수 있다.In this embodiment, a random method is used to generate additional information (Iad) rather than a preset standard, so the degree of freedom of the encryption method is further increased and security can be improved. Accordingly, the probability of leakage of de-identified parts is lowered, allowing the provider 100 to provide medical information (Ipm) more safely.

이상의 설명은 본 실시예의 기술 사상을 예시적으로 설명한 것에 불과한 것으로서, 본 실시예가 속하는 기술 분야에서 통상의 지식을 가진 자라면 본 실시예의 본질적인 특성에서 벗어나지 않는 범위에서 다양한 수정 및 변형이 가능할 것이다. 따라서, 본 실시예들은 본 실시예의 기술 사상을 한정하기 위한 것이 아니라 설명하기 위한 것이고, 이러한 실시예에 의하여 본 실시예의 기술 사상의 범위가 한정되는 것은 아니다. 본 실시예의 보호 범위는 아래의 청구범위에 의하여 해석되어야 하며, 그와 동등한 범위 내에 있는 모든 기술 사상은 본 실시예의 권리범위에 포함되는 것으로 해석되어야 할 것이다.The above description is merely an illustrative explanation of the technical idea of the present embodiment, and those skilled in the art will be able to make various modifications and variations without departing from the essential characteristics of the present embodiment. Accordingly, the present embodiments are not intended to limit the technical idea of the present embodiment, but rather to explain it, and the scope of the technical idea of the present embodiment is not limited by these examples. The scope of protection of this embodiment should be interpreted in accordance with the claims below, and all technical ideas within the equivalent scope should be interpreted as being included in the scope of rights of this embodiment.

Claims (10)

제공자로부터 의료 정보를 수신하고, 상기 의료 정보에 포함된 개인 정보를 식별하는 식별부;
상기 개인 정보에, 상기 의료 정보에서 상기 개인 정보를 제외한 부분 중 적어도 일부를 추출한 추가 정보를 결합하여 결합 정보를 생성하는 결합부;
상기 결합 정보를 암호화하여 암호 정보를 생성하는 암호화부; 및
상기 의료 정보에서 상기 개인 정보를 상기 암호 정보로 대체하여, 상기 의료 정보를 재구성한 비식별화 정보를 생성하는 재구성부를 포함하는
의료 정보 비식별화 시스템.
An identification unit that receives medical information from a provider and identifies personal information included in the medical information;
a combining unit that generates combined information by combining the personal information with additional information extracted from at least a portion of the medical information excluding the personal information;
an encryption unit that encrypts the combined information to generate password information; and
Comprising a reconstruction unit that replaces the personal information in the medical information with the password information and generates de-identified information that reconstructs the medical information.
Medical information de-identification system.
제1 항에 있어서,
상기 의료 정보는, 상기 개인 정보와 비개인 정보를 포함하고,
상기 비식별화 정보는, 상기 암호 정보와 상기 비개인 정보를 포함하는,
의료 정보 비식별화 시스템.
According to claim 1,
The medical information includes the personal information and non-personal information,
The de-identified information includes the password information and the non-personal information,
Medical information de-identification system.
제2 항에 있어서,
상기 의료 정보에서 상기 추가 정보를 추출하는 추출부를 더 포함하는
의료 정보 비식별화 시스템.
According to clause 2,
Further comprising an extraction unit for extracting the additional information from the medical information.
Medical information de-identification system.
제3 항에 있어서,
상기 추출부는,
상기 의료 정보로부터 상기 비개인 정보를 추출하는 제1 추출 모듈과,
상기 비개인 정보를 헥스코드로 변환하여 제1 헥스 정보를 생성하는 제1 헥스 모듈과,
상기 제1 헥스 정보 중 미리 정해진 위치에서 상기 추가 정보를 추출하는 제2 추출 모듈을 포함하는
의료 정보 비식별화 시스템.
According to clause 3,
The extraction unit,
a first extraction module for extracting the non-personal information from the medical information;
a first hex module that converts the non-personal information into a hex code and generates first hex information;
Comprising a second extraction module that extracts the additional information from a predetermined position among the first hex information.
Medical information de-identification system.
삭제delete 제2 항에 있어서,
상기 의료 정보에서 상기 추가 정보를 랜덤하게 추출하는 랜덤 추출부를 더 포함하는
의료 정보 비식별화 시스템.
According to clause 2,
Further comprising a random extraction unit that randomly extracts the additional information from the medical information.
Medical information de-identification system.
제6 항에 있어서,
상기 랜덤 추출부는,
상기 의료 정보로부터 상기 비개인 정보를 추출하는 제1 추출 모듈과,
상기 비개인 정보를 헥스 코드로 변환하여 제1 헥스 정보를 생성하는 제1 헥스 모듈과,
상기 제1 헥스 정보 중 랜덤하게 상기 추가 정보를 추출하는 제3 추출 모듈을 포함하는
의료 정보 비식별화 시스템.
According to clause 6,
The random extraction unit,
a first extraction module for extracting the non-personal information from the medical information;
A first hex module that converts the non-personal information into hex code and generates first hex information,
Comprising a third extraction module that randomly extracts the additional information from the first hex information.
Medical information de-identification system.
제1 항에 있어서,
상기 결합부는,
상기 개인 정보를 헥스 코드로 변환하여 제2 헥스 정보를 생성하는 제2 헥스 모듈과,
상기 제2 헥스 정보 및 상기 추가 정보를 결합하여 상기 결합 정보를 생성하는 헥스 결합 모듈을 포함하는
의료 정보 비식별화 시스템.
According to claim 1,
The coupling part,
a second hex module that converts the personal information into hex code and generates second hex information;
Comprising a hex combining module that combines the second hex information and the additional information to generate the combined information.
Medical information de-identification system.
삭제delete 제1 항에 있어서,
상기 재구성부는 상기 비식별화 정보를 연구자에게 제공하는
의료 정보 비식별화 시스템.
According to claim 1,
The reconstruction unit provides the de-identified information to the researcher.
Medical information de-identification system.
KR1020210168760A 2021-11-30 2021-11-30 Medical information de-identification system KR102615618B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020210168760A KR102615618B1 (en) 2021-11-30 2021-11-30 Medical information de-identification system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020210168760A KR102615618B1 (en) 2021-11-30 2021-11-30 Medical information de-identification system

Publications (2)

Publication Number Publication Date
KR20230081063A KR20230081063A (en) 2023-06-07
KR102615618B1 true KR102615618B1 (en) 2023-12-20

Family

ID=86761592

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020210168760A KR102615618B1 (en) 2021-11-30 2021-11-30 Medical information de-identification system

Country Status (1)

Country Link
KR (1) KR102615618B1 (en)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101704702B1 (en) * 2016-04-18 2017-02-08 (주)케이사인 Tagging based personal data de-identification system and de-identification method of personal data
KR101859636B1 (en) * 2017-07-19 2018-05-21 주식회사 디지털즈 Personal information de-identification system with security function and method thereof

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102000745B1 (en) * 2017-03-17 2019-07-16 (주) 프로큐라티오 Method and system for managing personal medical information data

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101704702B1 (en) * 2016-04-18 2017-02-08 (주)케이사인 Tagging based personal data de-identification system and de-identification method of personal data
KR101859636B1 (en) * 2017-07-19 2018-05-21 주식회사 디지털즈 Personal information de-identification system with security function and method thereof

Also Published As

Publication number Publication date
KR20230081063A (en) 2023-06-07

Similar Documents

Publication Publication Date Title
US11423173B2 (en) Highly secure networked system and methods for storage, processing, and transmission of sensitive personal information
ES2599615T3 (en) Secure data cache
KR102310227B1 (en) System and method for retrieval of medical information using blockchain and computer program for the same
Neubauer et al. A methodology for the pseudonymization of medical data
Kumar et al. Enhancing security mechanisms for healthcare informatics using ubiquitous cloud
CN109496403A (en) For having the preceding dynamic to privacy and commission verifiability to can search for the method and system of symmetric cryptography
CN104281815B (en) The method and system of file encryption-decryption
ES2744441T3 (en) Management of genomic inquiries
Siddiqi et al. Secure lightweight context-driven data logging for bodyworn sensing devices
KR102120942B1 (en) Medical Block Chain System
Xie et al. Security enhanced RFID authentication protocols for healthcare environment
KR20140029984A (en) Medical information management method of medical database operating system
KR102615618B1 (en) Medical information de-identification system
Prescott Two‐tailed significance tests for 2× 2 contingency tables: What is the alternative?
Pavithran et al. Enhancing randomness of the ciphertext generated by DNA-based cryptosystem and finite state machine
US20140089657A1 (en) Recording medium storing data processing program, data processing apparatus and data processing system
Choudhary et al. Fake COVID-19 vaccines: scams hampering the vaccination drive in India and possibly other countries
CN104065488B (en) Method based on Conbined public or double key certification microprocessor card cloud management system
Heurix et al. Pseudonymization with metadata encryption for privacy-preserving searchable documents
CN107315899A (en) The share system and sharing method of a kind of case history
Baskar et al. Data security in healthcare using blockchain technology
Rubio et al. A robust and simple security extension for the medical standard SCP-ECG
Abouakil et al. Data models for the pseudonymization of DICOM data
Aron Information privacy for linked data
Dey et al. Telecardiology COVID-19 cryptographic system: Security reinforcement through metaheuristics and artificial neural networks

Legal Events

Date Code Title Description
E701 Decision to grant or registration of patent right