KR20200062499A - Device and method for deidentification of personal information in medical image - Google Patents

Device and method for deidentification of personal information in medical image Download PDF

Info

Publication number
KR20200062499A
KR20200062499A KR1020180147954A KR20180147954A KR20200062499A KR 20200062499 A KR20200062499 A KR 20200062499A KR 1020180147954 A KR1020180147954 A KR 1020180147954A KR 20180147954 A KR20180147954 A KR 20180147954A KR 20200062499 A KR20200062499 A KR 20200062499A
Authority
KR
South Korea
Prior art keywords
medical image
character
image
information
medical
Prior art date
Application number
KR1020180147954A
Other languages
Korean (ko)
Inventor
신동준
Original Assignee
신동준
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 신동준 filed Critical 신동준
Priority to KR1020180147954A priority Critical patent/KR20200062499A/en
Publication of KR20200062499A publication Critical patent/KR20200062499A/en

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H30/00ICT specially adapted for the handling or processing of medical images
    • G16H30/20ICT specially adapted for the handling or processing of medical images for handling medical images, e.g. DICOM, HL7 or PACS
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T1/00General purpose image data processing
    • G06T1/0021Image watermarking
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/60ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H30/00ICT specially adapted for the handling or processing of medical images
    • G16H30/40ICT specially adapted for the handling or processing of medical images for processing medical images, e.g. editing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2200/00Indexing scheme for image data processing or generation, in general
    • G06T2200/32Indexing scheme for image data processing or generation, in general involving image mosaicing

Abstract

Disclosed are a device for deidentifying personal information from a medical image to easily deidentify a patient′s personal information included in the medical image and a method thereof. According to one aspect of the present invention, the device comprises: a character recognition unit scanning the medical image by using an optical character reader (OCR) function to determine whether characters are included in the medical image; a character processing unit, when the medical image includes the characters, extracting and storing the characters of a desired portion in accordance with a set mode and deidentifying the characters included in the medical image; an image generation unit removing the remainder excluding set information from the information included in a header of the medical image to generate a corrected medical image or a new medical image including only the set information; and a storage unit matching the characters extracted from the character processing unit with the medical image generated from the image generation unit to store the characters and the medical image.

Description

의료영상의 개인정보 비식별화 장치 및 방법{DEVICE AND METHOD FOR DEIDENTIFICATION OF PERSONAL INFORMATION IN MEDICAL IMAGE}DEVICE AND METHOD FOR DEIDENTIFICATION OF PERSONAL INFORMATION IN MEDICAL IMAGE}

본 발명은 의료영상에 포함된 개인정보를 비식별화 하기 위한 장치 및 방법에 관한 것이다.The present invention relates to an apparatus and method for de-identifying personal information included in medical images.

환자가 많은 대형 병원과 같은 경우에 많은 진료기록과 의료영상을 보유하고 있다. 그리고 4차 산업 환경으로 알파고와 같은 딥러닝을 이용한 인공지능에 대한 열기가 높아짐과 동시에 이를 기반으로 하는 의료영상의 연구도 활발하게 이루어지고 있다. 이러한 의료영상의 연구는 딥러닝 등 다양한 체계를 가지고 발전에 발전을 거듭하고 있다.In the case of a large hospital with many patients, it has many medical records and medical images. In addition, as the fourth industrial environment, the heat of artificial intelligence using deep learning such as AlphaGo is increasing, and research on medical images based thereon is also actively being conducted. This medical image research is progressing in development with various systems such as deep learning.

의료영상의 연구에 반드시 필요한 것이 일정 수 이상의 의료영상을 확보하는 것이다. 딥러닝 등 다양한 체계를 가지고 연구를 진행함에 있어서 샘플이 많으면 많을수록 더 정확한 결과를 얻을 수 있기 때문이다. Obtaining a certain number of medical images is essential to the study of medical images. This is because the more samples, the more accurate results can be obtained when conducting research with various systems such as deep learning.

따라서 의료영상을 연구하는 경우에 대형 병원과 같이 많은 의료영상을 보유하는 의료기관에 연구 자료로 의료영상을 요청하지만, 보유한 의료영상은 민감한 개인정보가 포함하기 때문에 절대 그냥 내줄 수 없다. 따라서 일일이 수작업 등을 통해서 필요한 의료영상의 개인정보를 삭제하고 확인하는 과정을 통해서 제공해야 한다. 이로 인하여 많은 비용이 발생하며, 이러한 비용은 연구 비용의 상승으로 연구 활동에 장벽으로 등장하고 있다.Therefore, when researching medical images, medical images are requested from medical institutions that have many medical images, such as large hospitals, but they cannot be given out because sensitive medical information is contained. Therefore, it is necessary to provide it through a process of deleting and confirming personal information of medical images required through manual work. Due to this, a lot of costs are incurred, and these costs have emerged as barriers to research activities due to rising research costs.

따라서 본 발명은 상술한 문제점을 해결하기 위해 도출된 것으로서, 의료영상에 포함된 환자 개인정보를 용이하게 비식별화할 수 있는 장치 및 방법을 제공하고자 한다. Accordingly, the present invention is to solve the above-mentioned problems, and is to provide an apparatus and method for easily de-identifying patient personal information included in a medical image.

본 발명의 다른 목적들은 이하에 서술되는 실시예를 통하여 더욱 명확해질 것이다.Other objects of the present invention will become more apparent through the embodiments described below.

본 발명의 일 측면에 따른 의료영상의 개인정보 비식별화 장치는, 의료영상의 이미지를 OCR(Optical Character Reader) 기능을 이용하여 스캔해서 문자가 포함되어 있는지 여부를 판단하는 문자인식부와, 의료영상의 이미지에 문자가 포함된 경우 설정된 방식에 따라서 원하는 부분의 문자를 추출하여 저장한 후 의료영상에 포함된 문자를 비인식화하는 문자처리부와, 의료영상의 헤더에 포함된 정보 중에서 설정된 정보를 제외한 나머지를 제거하여 수정된 의료영상을 생성하거나 또는 설정된 정보만 포함하는 새로운 의료영상을 생성하는 영상생성부와, 문자처리부에서 추출된 문자 및 영상생성부에서 생성된 의료영상을 상호 매칭하여 저장하는 저장부를 포함한다. The personal information de-identification device of a medical image according to an aspect of the present invention includes a character recognition unit that scans an image of a medical image using an OCR (Optical Character Reader) function to determine whether a character is included, and medical If the image of the image contains text, extract the character of the desired part according to the set method, save it, and then de-recognize the text included in the medical image, and the set information among the information included in the header of the medical image. By removing the rest, the corrected medical image is generated, or the image generating unit generating a new medical image containing only the set information and the medical images generated by the text generated by the text processing unit and the image generating unit are mutually matched and stored. It includes a storage unit.

본 발명에 따른 의료영상 개인정보 비식별화 장치는 다음과 같은 실시예들을 하나 또는 그 이상 구비할 수 있다. 예를 들면, 설정된 방식은, 문자처리부가 의료영상의 헤더에서 산출장비 및 산출시점 중에서 적어도 하나를 포함하는 정보를 확보한 후 이를 이용하여 의료영상에서 원하는 부분을 결정할 수 있다. The medical image personal information de-identification apparatus according to the present invention may include one or more of the following embodiments. For example, in the set method, the character processing unit may obtain information including at least one of a calculation device and a calculation time from a header of a medical image, and then use it to determine a desired portion of the medical image.

설정된 정보는 의료영상에 포함된 나이 및 성별을 포함할 수 있다. The set information may include age and gender included in the medical image.

문자인식부가 의료영상에서 문자가 포함되어 있는지 여부를 판단할 때 촬영방향이나 위치를 표시하는 문자는 제외할 수 있다. When the character recognition unit determines whether a character is included in the medical image, a character indicating a photographing direction or a location may be excluded.

본 발명의 일 측면에 따른 의료영상 개인정보 비식별화 방법은, 의료영상의 이미지를 스캔해서 문자가 포함되어 있는지 여부를 판단하는 단계와, 의료영상의 이미지에 문자가 포함된 경우 설정된 방식에 따라서 원하는 부분의 문자를 추출하여 저장한 후 의료영상에 포함된 문자를 비인식화하는 단계와, 의료영상의 헤더에 포함된 정보 중에서 설정된 정보를 제외한 나머지를 제거하여 수정된 의료영상을 생성하거나 또는 설정된 정보만 포함하는 새로운 의료영상을 생성하는 단계와, 추출된 문자 및 생성된 의료영상을 상호 매칭하여 저장하는 단계를 포함한다. The method of de-identifying medical image personal information according to an aspect of the present invention includes scanning a medical image image to determine whether a character is included, and when a medical image image contains a character, according to a set method After extracting and storing the desired part of the text, de-recognizing the text included in the medical image, and removing the rest of the information included in the header of the medical image except for the set information to generate a corrected medical image or setting And generating a new medical image containing only information, and matching and storing the extracted text and the generated medical image.

본 발명은 의료영상에 포함된 환자 개인 정보를 용이하게 비식별화할 수 있는 장치 및 방법을 제공할 수 있다. The present invention can provide an apparatus and method for easily de-identifying patient personal information included in a medical image.

또한, 본 발명은 의료영상 이미지에 포함된 유의미한 정보를 활용할 수 있는 의료영상의 개인정보 비식별화 장치 및 방법을 제공할 수 있다. In addition, the present invention can provide an apparatus and method for de-identifying personal information of a medical image that can utilize meaningful information included in the medical image.

도 1은 본 발명의 일 실시예에 따른 개인정보 비식별화 장치를 예시하는 도면이다.
도 2는 문자를 포함하는 의료영상 이미지의 일 예를 나타낸다.
도 3은 본 발명의 일 실시예에 따른 개인정보 비식별화 방법을 예시하는 순서도이다.
1 is a diagram illustrating an apparatus for de-identifying personal information according to an embodiment of the present invention.
2 shows an example of a medical image image including characters.
3 is a flowchart illustrating a method of de-identifying personal information according to an embodiment of the present invention.

본 발명은 다양한 변환을 가할 수 있고 여러 가지 실시 예를 가질 수 있는 바, 특정 실시 예들을 도면에 예시하고 상세한 설명에서 상세하게 설명하고자 한다. 그러나, 이는 본 발명을 특정한 실시 형태에 대해 한정하려는 것이 아니며, 본 발명의 사상 및 기술 범위에 포함되는 모든 변환, 균등물 내지 대체물을 포함하는 것으로 이해되어야 한다. 본 발명을 설명함에 있어서 관련된 공지 기술에 대한 구체적인 설명이 본 발명의 요지를 흐릴 수 있다고 판단되는 경우 그 상세한 설명을 생략한다.The present invention can be applied to a variety of transformations and may have various embodiments, and specific embodiments will be illustrated in the drawings and described in detail in the detailed description. However, this is not intended to limit the present invention to specific embodiments, and should be understood to include all conversions, equivalents, and substitutes included in the spirit and scope of the present invention. In the description of the present invention, when it is determined that detailed descriptions of related known technologies may obscure the subject matter of the present invention, detailed descriptions thereof will be omitted.

본 출원에서 사용한 용어는 단지 특정한 실시예를 설명하기 위해 사용된 것으로, 본 발명을 한정하려는 의도가 아니다. 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다. 본 출원에서, "포함하다" 또는 "가지다" 등의 용어는 명세서상에 기재된 특징, 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것이 존재함을 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.The terms used in the present application are only used to describe specific embodiments, and are not intended to limit the present invention. Singular expressions include plural expressions unless the context clearly indicates otherwise. In this application, terms such as “include” or “have” are intended to indicate the presence of features, numbers, steps, actions, components, parts, or combinations thereof described in the specification, one or more other features. It should be understood that the existence or addition possibilities of fields or numbers, steps, operations, components, parts or combinations thereof are not excluded in advance.

제1, 제2 등의 용어는 다양한 구성요소들을 설명하는데 사용될 수 있지만, 상기 구성요소들은 상기 용어들에 의해 한정되어서는 안 된다. 상기 용어들은 하나의 구성요소를 다른 구성요소로부터 구별하는 목적으로만 사용된다. Terms such as first and second may be used to describe various components, but the components should not be limited by the terms. The terms are used only for the purpose of distinguishing one component from other components.

이하, 첨부한 도면들을 참조하여 본 발명에 따른 실시예들을 상세히 설명하기로 하며, 첨부 도면을 참조하여 설명함에 있어 도면 부호에 상관없이 동일하거나 대응하는 구성 요소는 동일한 참조번호를 부여하고 이에 대한 중복되는 설명은 생략하기로 한다.Hereinafter, exemplary embodiments according to the present invention will be described in detail with reference to the accompanying drawings, and in the description with reference to the accompanying drawings, the same or corresponding components are assigned the same reference numbers regardless of reference numerals, and duplicated thereof. The description will be omitted.

도 1은 본 발명의 일 실시예에 따른 개인정보 비식별화 장치(100)를 예시하는 도면이다. 그리고 도 2는 문자를 포함하는 의료영상 이미지의 일 예를 나타낸다. 1 is a diagram illustrating a personal information de-identification device 100 according to an embodiment of the present invention. And Figure 2 shows an example of a medical image image containing a character.

도 1 내지 도 2를 참고하면, 본 발명의 일 실시예에 따른 개인정보 비식별화 장치(100)는 의료영상에 포함된 개인정보를 비식별화하고 의료영상에 포함된 유의미한 정보를 활용할 수 있게 하는 것을 특징으로 한다. 즉, 본 실시예에 따른 개인정보 비식별화 장치(100)는 의료영상 이미지에 포함된 선량정보 등과 같이 영상 분석에 필요한 정보를 삭제하기 이전에 추출한 후 저장하여 활용할 수 있는 것을 특징으로 한다. 1 to 2, the personal information de-identification device 100 according to an embodiment of the present invention can de-identify personal information included in a medical image and utilize meaningful information included in the medical image. It is characterized by. That is, the personal information de-identification apparatus 100 according to the present embodiment is characterized in that it can be extracted and stored before being used to delete information necessary for image analysis, such as dose information included in a medical image.

본 실시예에 따른 개인정보 비식별화 장치(100)는, 의료영상 저장 및 전송 시스템 즉 의료영상 시스템(예를 들면, PACS 시스템)(200)과 연결되고, 의료영상 시스템(200)으로부터 영상을 전송받거나 또는 의료영상이 저장된 경로를 전달 받는다. 여기서, 의료영상이 저장된 경로는 수작업으로 지정한 경로도 포함된다. 그리고 본 실시예에 따른 개인정보 비식별화 장치(100)는 문자인식부(110), 문자처리부(120), 영상생성부(130) 및 저장부(140)를 포함한다. The personal information de-identification apparatus 100 according to the present embodiment is connected to a medical image storage and transmission system, that is, a medical image system (eg, a PACS system) 200, and receives images from the medical image system 200. It is transmitted or the path where the medical image is stored is received. Here, the route in which the medical image is stored includes a route manually designated. In addition, the personal information de-identification apparatus 100 according to the present embodiment includes a character recognition unit 110, a character processing unit 120, an image generation unit 130, and a storage unit 140.

이하에서 사용되는 문자는 한글, 알파벳, 숫자, 각종 기호 및 기타 문자 등을 포함한다. The characters used below include Hangul, alphabets, numbers, various symbols, and other characters.

문자인식부(110)는 의료영상 이미지를 OCR(Optical Character Reader) 기능을 이용해서 스캔해서 문자가 포함되어 있는지 여부를 판단한다. 의료영상에 포함된 문자는 개인정보에 해당할 수 있기 때문에 외부에서 활용하기 위해서는 삭제가 필요하다. 따라서 문자인식부(110)는 의료영상 이미지에 문자가 포함되어 있는지를 판단해서, 문자가 포함된 경우 이에 대한 정보를 문자처리부(120)에 전송한다. The character recognition unit 110 scans a medical image image using an OCR (Optical Character Reader) function to determine whether a character is included. Text included in medical images may correspond to personal information, so deletion is necessary for external use. Therefore, the text recognition unit 110 determines whether a text is included in the medical image, and when the text is included, transmits information about the text to the text processing unit 120.

물론, 문자인식부(110)에 의해서 문자가 포함되지 않은 것으로 판단된 경우, 문자인식부(110)에 의해서 문자를 비식별화 할 필요가 없게 된다. Of course, when it is determined that the character is not included by the character recognition unit 110, it is not necessary to de-identify the character by the character recognition unit 110.

문자인식부(110)는 의료영상 이미지에 포함된 문자를 인식하는 과정에서, 사전에 설정된 문자는 제외하고 다른 문자가 포함되어 있는지 여부를 판단할 수 있다. 사전에 설정된 문자는, 예를 들면, 문자 'L' 또는 'R'과 같이 촬영 방향이나 위치를 표시하는 기호에 해당할 수 있다. In the process of recognizing the characters included in the medical image, the character recognition unit 110 may determine whether other characters are included except for the preset character. The character set in advance may correspond to a symbol indicating a shooting direction or a location, such as the character'L' or'R'.

문자인식부(110)에 의해서 사전에 설정된 문자를 제외하고 다른 문자가 있는 것으로 인식된 경우, 문자처리부(120)에 의해서 해당부분의 문자를 별도로 추출하여 저장하거나 또는 상기 과정을 거치지 않고 문자를 비인식화 할 수 있다. When it is recognized by the character recognition unit 110 that there are other characters except for the character set in advance, the character processing unit 120 separately extracts and stores the corresponding portion of the character or saves the character without going through the above process. Can be recognized.

문자인식부(110)는 의료영상 이미지를 스캔해서 사전에 설정된 문자를 제외한 다른 문자가 포함되어 있는지 여부에 대해 판단하는 과정을 2회 이상 반복할 수 있다. The character recognition unit 110 may repeat a process of scanning a medical image image and determining whether or not other characters are included except for a preset character.

문자인식부(110)에 의해서 사전에 설정된 문자를 제외한 다른 문자가 있는 것으로 판단된 경우, 문자처리부(120)는 그 문자를 비식별화 하기 이전에 문자를 추출해서 별도로 저장할 수 있다. 이와 같이 문자를 별도로 저장하는 이유는 해당 문자가 의료영상의 분석에 필요한 정보(예를 들면, 방사선량 등)에 해당할 가능성이 있기 때문이다. 의료영상의 분석에 필요한 정보를 비식별화하지 않고 별도로 추출하여 저장함으로써 추후 의료영상에 대한 분석 과정에서 유용하게 활용될 수 있다. If it is determined by the character recognition unit 110 that there is a character other than the character set in advance, the character processing unit 120 may extract the character before de-identifying the character and store it separately. The reason for storing the text separately is that the text may possibly correspond to information necessary for analysis of a medical image (for example, radiation dose). The information necessary for the analysis of the medical image is extracted and stored separately without being de-identified, and can be usefully used in the analysis process for the medical image later.

문자처리부(120)는 설정된 방식에 따라서 원하는 부분의 문자를 추출하여 저장한다. 여기서 설정된 방식이란, 의료영상의 헤더에 포함되어 있는 산출장비 및/또는 산출시점에 대한 정보를 문자처리부(120)가 확보하고, 확보한 산출장비 및 산출시점에 대응하여 의료영상 이미지의 특정 위치에 포함된 문자를 문자인식부(110)에 의해서 인식된 문자정보로서 추출한 후 저장한다. The character processing unit 120 extracts and stores characters of a desired portion according to a set method. The method set here means that the text processing unit 120 secures information on the calculation equipment and/or calculation time included in the header of the medical image, and corresponds to the calculated calculation equipment and the calculation time to a specific location of the medical image. The included characters are extracted as character information recognized by the character recognition unit 110 and stored.

의료영상의 산출장비는 생성한 의료영상 이미지의 특정 위치(예를 들면, 의료영상 이미지의 우측 상부 또는 좌측 하부 등)에 영상분석에 필요한 정보(방사선량 등)를 문자로서 표현할 수 있다. 도 2를 참고하면, 의료영상 이미지의 좌측 상부에 의료영상의 분석에 필요한 문자가 표시되어 있다. 이와 같은 문자 정보는 의료영상을 산출하는 장비의 종류(예를 들면, CT, MRI 또는 X-Ray 등) 및 제조사 등에 따라서 그 위치가 변경될 수 있다. The medical image calculating device may express information (radiation dose, etc.) required for image analysis as a character at a specific position (for example, upper right or lower left of the medical image) of the generated medical image. Referring to FIG. 2, characters required for analysis of a medical image are displayed on the upper left of the medical image. The position of the text information may be changed according to the type of equipment (for example, CT, MRI, or X-Ray) and the manufacturer of the medical image.

예를 들면, A사가 제조한 X-Ray 장비는 방사선량을 의료영상 이미지의 좌측 하부에 표시함에 반해, B사가 제조한 X-Ray 장비는 방사선량을 의료영상 이미지의 우측 상부에 표시할 수 있고, C사가 제조한 X-Ray 장비는 방사선량을 의료영상 이미지에 표시하지 않을 수 있다. 또한, 동일한 제조사의 장비인 경우에도 장비의 종류가 다른 경우 (예를 들면, CT와 X-Ray)에도 영상분석에 필요한 문자의 위치가 변경될 수 있다. For example, the X-Ray equipment manufactured by A can display the radiation dose in the lower left of the medical image, while the X-Ray equipment manufactured by B can display the radiation dose in the upper right of the medical image. , X-Ray equipment manufactured by C may not display the radiation dose on the medical image. In addition, even in the case of equipment of the same manufacturer, the position of a character required for image analysis may be changed even when the type of equipment is different (for example, CT and X-Ray).

의료영상의 산출장비는 각 병원에서 일정 시간마다 교체가 이루어질 수 있다. 따라서 동일한 제조사 및 동일한 종류의 의료장비인 경우에도 그 영상의 산출시점에 따라서 영상분석에 필요한 문자의 위치가 의료영상에서 변경될 수 있다. 예를 들면, 동일한 병원에서 2018년 10월까지는 A사의 엑스레이 장비를 이용하다가 11월부터 동일한 A사의 엑스레이 장비 중 다른 모델을 이용한 경우에, 문자가 포함된 위치가 달라질 수 있다. Medical imaging equipment can be replaced at regular intervals in each hospital. Therefore, even in the case of the same manufacturer and the same type of medical equipment, the position of the text required for image analysis may be changed in the medical image according to the calculation time of the image. For example, if the same hospital uses X-ray equipment of company A until October 2018, and then uses a different model of X-ray equipment of company A from November, the location of characters may be different.

이와 같이, 문자처리부(120)는 의료영상의 산출장비 및 산출시점에 대한 정보를 확보하고, 이를 이용하여 개인정보에 해당하지 않고 영상분석에 유용한 문자가 표시되어 있는지 여부 및 그 위치를 용이하게 파악할 수 있다. As described above, the text processing unit 120 secures information about the calculation equipment and the calculation time point of the medical image, and uses it to easily determine whether or not a character useful for image analysis is displayed and its location is not applicable to personal information. Can be.

산출장비에 대한 정보는, 예를 들면, 의료영상을 생성한 장비의 종류, 제조사, 모델명, 설치위치 등에 대한 정보를 포함할 수 있다. 또한, 산출시점에 대한 정보는 의료영상을 생성한 시각에 대한 정보를 포함할 수 있다. The information about the calculation equipment may include, for example, information about the type of the equipment that generated the medical image, the manufacturer, the model name, and the installation location. Further, the information on the calculation time may include information on the time at which the medical image is generated.

문자처리부(120)는 산출장비 또는 산출장비와 산출시점에 대한 정보를 이용해서 의료영상 이미지에서 특정 위치의 문자를 추출한 후 이를 저장할 수 있다. 즉, 문자처리부(120)는 문자인식부(110)로부터 특정 위치의 문자에 대한 정보를 확보한 후 이를 저장부(140)에 저장할 수 있다. The character processing unit 120 may extract a character at a specific location from a medical image image and store it using information about the calculation equipment or the calculation equipment and the calculation time. That is, the character processing unit 120 may obtain information about the character at a specific location from the character recognition unit 110 and store it in the storage unit 140.

문자처리부(120)는 특정 영역에 있는 문자를 추출한 후 의료영상 이미지에 포함된 모든 문자 또는 특정 영역 이외의 다른 영역에 있는 문자를 비식별화 할 수 있다. 문자에 대한 비식별화는 의료영상 이미지에서 문자의 삭제, 블랭크 또는 마스킹 처리 등을 포함할 수 있다. The character processing unit 120 may extract characters in a specific region and de-identify all characters included in the medical image or characters in other regions than the specific region. De-identification of characters may include deletion of characters from a medical image image, blank or masking processing, and the like.

영상생성부(130)는 문자처리부(120)에서 처리된 의료영상의 헤더에 포함된 정보 중에서 설정된 정보를 제외한 나머지를 제거하여 수정된 의료영상을 생성하거나 또는 설정된 정보만 포함하는 새로운 의료영상을 생성한다. 여기서 설정된 정보는 의료영상의 분석에 필요한 나이(age) 및 성별(sex)에 해당할 수 있다. 영상생성부(130)는 의료영상의 헤더(header)에 포함된 다양한 정보 중에서 개인정보 및 영상 판독에 불필요한 정보를 전부 또는 일부 삭제한 후 이를 저장하거나 또는 설정된 정보만을 포함하는 신규 의료영상을 생성한 후 이를 저장부(140)에 저장할 수 있다. The image generating unit 130 removes the rest of the information included in the header of the medical image processed by the text processing unit 120 except for the set information to generate a corrected medical image or a new medical image that includes only the set information. do. The information set here may correspond to age and sex required for analysis of the medical image. The image generating unit 130 deletes all or part of unnecessary information for reading personal information and images from various information included in the header of the medical image and then stores it or generates a new medical image including only the set information. Afterwards, it can be stored in the storage 140.

의료영상 이미지에서 별도로 추출하여 저장할 문자가 포함되지 않은 경우에는, 문자처리부(120)가 특정 영역의 문자를 추출하여 별도로 저장하는 과정을 거치지 않고, 영상생성부(130)에 의해서 헤더에 불필요한 정보를 삭제한 후 이를 저장하는 과정을 진행할 수 있다. When the text to be extracted and stored separately from the medical image is not included, the text processing unit 120 extracts the text of a specific area and separately stores the text, and unnecessary information is stored in the header by the image generation unit 130. After deletion, you can proceed to the process of saving it.

저장부(140)는 문자처리부(120)에서 추출된 문자를 저장한다. 문자처리부(120)는 의료영상 이미지에서 영상 판독에 필요한 정보에 해당하는 문자에 대한 정보를 문자인식부(110)에서 받아서 이를 저장부(140)에 저장한다. 또한, 저장부(140)는 영상생성부(130)에 의해 생성된 수정된 의료영상 또는 신규 의료영상을 저장한다. 저장부(140)는 추출된 문자와 생성된 신규 또는 수정 의료영상을 매칭하여 저장할 수 있다. The storage unit 140 stores characters extracted from the character processing unit 120. The character processing unit 120 receives information about a character corresponding to information necessary for reading an image from a medical image from the character recognition unit 110 and stores it in the storage unit 140. In addition, the storage unit 140 stores the modified medical image or new medical image generated by the image generating unit 130. The storage 140 may match and store the extracted text and the generated new or modified medical image.

저장부(140)에 저장된 추출 문자 및 신규(또는 수정) 의료영상은 외부로 전송되는 등의 방법에 의해서 활용될 수 있다.The extracted text and new (or modified) medical images stored in the storage 140 may be utilized by a method such as being transmitted to the outside.

도 3은 본 발명의 일 실시예에 따른 개인정보 비식별화 방법을 예시하는 순서도이다.3 is a flowchart illustrating a method of de-identifying personal information according to an embodiment of the present invention.

도 3을 참고하면, 의료영상의 이미지를 스캔해서 문자가 포함되어 있는지 여부를 판단하는 단계와, 의료영상의 이미지에 문자가 포함된 경우 설정된 방식에 따라서 원하는 부분의 문자를 추출하여 저장한 후 의료영상에 포함된 문자를 비인식화하는 단계와, 의료영상의 헤더에 포함된 정보 중에서 설정된 정보를 제외한 나머지를 제거하여 수정된 의료영상을 생성하거나 또는 설정된 정보만 포함하는 새로운 의료영상을 생성하는 단계와, Referring to FIG. 3, a step of determining whether a text is included by scanning an image of a medical image, and when the image of the medical image includes a character, extracting and storing a character of a desired part according to a set method, and then storing the medical image De-recognizing the characters included in the image, and removing the rest of the information included in the header of the medical image except for the set information to generate a corrected medical image or generating a new medical image containing only the set information. Wow,

추출된 문자 및 생성된 의료영상을 상호 매칭하여 저장하는 단계를 포함한다. And matching and storing the extracted text and the generated medical image.

의료영상 이미지는 OCR 기능에 의해서 스캔될 수 있다. 최근 OCR 라이브러리의 발전으로 다양한 한글, 숫자, 알파벳, 그 외 문자를 인식하는데 높은 인식율을 보인다. 특히 의료영상은 디지털 의료장비에서 산출되기 때문에 컴퓨터에서 사용되는 정자형의 한글, 숫자, 알파벳을 사용한다. 따라서 의료영상의 경우에 인식율은 100%에 가깝게 나타난다. 의료영상 이미지에 대한 스캔을 2회 이상 반복함으로써 문자 인식율을 100% 가깝게 할 수 있다. Medical image images can be scanned by the OCR function. With the recent development of the OCR library, it has a high recognition rate in recognizing various Hangul, numbers, alphabets, and other characters. In particular, since medical images are produced by digital medical equipment, Korean, numbers, and alphabets of sperm type used in computers are used. Therefore, in the case of medical imaging, the recognition rate appears close to 100%. By repeating the scan of the medical image image two or more times, the character recognition rate can be made close to 100%.

여기서 인식율이란 1과 ㅣ(알파벳 L의 소문자)를 구별하는 것이 아닌 숫자 또는 문자를 인식하는 것이다. Here, the recognition rate does not distinguish between 1 and ㅣ (lowercase letter of alphabet L).

의료영상 이미지에 대한 스캔을 통해서 문자가 포함되어 있는 것으로 판단되는 경우, 문자를 비식별화 하기 이전에 의료영상의 판독에 유용한 정보에 해당할 가능성이 높은 문자를 추출한 후 이를 저장한다. 문자를 저장한 후 의료영상 이미지에 포함된 문자를 전부 또는 일부 비식별화 한다. When it is determined that the text is included through the scan of the medical image, the text likely to correspond to information useful for reading the medical image is extracted and stored before the character is de-identified. After storing the text, all or part of the text included in the medical image is de-identified.

의료영상의 판독에 유용한 정보에 해당하는지 여부에 대한 판단은 의료영상의 헤더에 포함된 산출장비 및 산출시점에 대한 정보를 이용할 수 있다. 산출장비의 종류, 제조사, 모델명과 같은 산출장비에 대한 정보와 산출시점에 대한 정보를 이용해서 의료영상 판독에 유용한 정보의 위치를 파악하고 이를 OCR 기능에 의해서 추출할 수 있다. The determination as to whether it corresponds to information useful for reading a medical image may use calculation equipment included in the header of the medical image and information about the calculation time. Using information on the calculation equipment such as the type of the production equipment, the manufacturer and the model name, and information on the calculation time point, the location of useful information for medical image reading can be identified and extracted by the OCR function.

의료영상의 특정 위치에 있는 문자를 추출하여 저장한 후 의료영상의 헤더에 포함된 정보 중에서 설정된 정보를 제외한 나머지를 제외하고 삭제할 수 있다. 설정된 정보는 의료영상의 판독에 필요하지만 개인정보에는 해당하는 것으로 보기 어려운 나이 또는 성별 등에 해당할 수 있다. After extracting and storing the text at a specific location of the medical image, it may be deleted except for the rest of the information included in the header of the medical image except for the set information. The set information is necessary for reading medical images, but may correspond to age or gender, which is difficult to be considered as personal information.

상기에서는 본 발명의 일 실시예를 참조하여 설명하였지만, 해당 기술 분야에서 통상의 지식을 가진 자라면 하기의 특허 청구의 범위에 기재된 본 발명의 사상 및 영역으로부터 벗어나지 않는 범위 내에서 본 발명을 다양하게 수정 및 변경시킬 수 있음을 이해할 수 있을 것이다.The above has been described with reference to one embodiment of the present invention, but those skilled in the art may vary the present invention without departing from the spirit and scope of the invention as set forth in the claims below. It will be understood that modifications and changes can be made.

100: 의료영상 개인정보 비식별화 장치
110: 문자인식부
120: 문자처리부
130: 영상생성부
140: 저장부
200: 의료영상 시스템
100: medical image personal information de-identification device
110: Character recognition department
120: character processing unit
130: image generation unit
140: storage
200: medical imaging system

Claims (4)

의료영상의 이미지를 OCR(Optical Character Reader) 기능을 이용하여 스캔해서 문자가 포함되어 있는지 여부를 판단하는 문자인식부;
의료영상의 이미지에 문자가 포함된 경우 설정된 방식에 따라서 원하는 부분의 문자를 추출하여 저장한 후 의료영상에 포함된 문자를 비인식화하는 문자처리부;
의료영상의 헤더에 포함된 정보 중에서 설정된 정보를 제외한 나머지를 제거하여 수정된 의료영상을 생성하거나 또는 설정된 정보만 포함하는 새로운 의료영상을 생성하는 영상생성부; 및
상기 문자처리부에서 추출된 문자 및 상기 영상생성부에서 생성된 의료영상을 상호 매칭하여 저장하는 저장부를 포함하는 의료영상의 개인정보 비식별화 장치.
A character recognition unit that scans an image of a medical image using an OCR (Optical Character Reader) function to determine whether a character is included;
A character processing unit for extracting and storing a desired portion of a character according to a set method when the image of the medical image includes a character, and then unrecognizing the character included in the medical image;
An image generating unit generating a modified medical image by removing the rest of the information included in the header of the medical image except for the set information or a new medical image including only the set information; And
A device for non-identifying personal information of medical images, including a storage unit for matching and storing characters extracted from the text processing unit and medical images generated by the image generation unit.
제1항에 있어서,
상기 설정된 방식은, 상기 문자처리부가 의료영상의 헤더에서 산출장비 및 산출시점 중에서 적어도 하나를 포함하는 정보를 확보한 후 이를 이용하여 의료영상에서 원하는 부분을 결정하는 것을 특징으로 하는 의료영상의 개인정보 비식별화 장치.
According to claim 1,
In the set method, the character processing unit obtains information including at least one of a calculation device and a calculation time from a header of a medical image, and then uses the information to determine a desired portion of the medical image. De-identification device.
제1항에 있어서,
상기 문자인식부가 의료영상에서 문자가 포함되어 있는지 여부를 판단할 때 촬영방향이나 위치를 표시하는 문자는 제외하는 것을 특징으로 하는 의료영상의 개인정보 비식별화 장치.
According to claim 1,
When the character recognition unit determines whether a character is included in the medical image, a character indicating a photographing direction or a location is excluded.
의료영상의 이미지를 스캔해서 문자가 포함되어 있는지 여부를 판단하는 단계;
의료영상의 이미지에 문자가 포함된 경우 설정된 방식에 따라서 원하는 부분의 문자를 추출하여 저장한 후 의료영상에 포함된 문자를 비인식화하는 단계;
의료영상의 헤더에 포함된 정보 중에서 설정된 정보를 제외한 나머지를 제거하여 수정된 의료영상을 생성하거나 또는 설정된 정보만 포함하는 새로운 의료영상을 생성하는 단계; 및
추출된 문자 및 생성된 의료영상을 상호 매칭하여 저장하는 단계를 포함하는 의료영상의 개인정보 비식별화 방법.

Determining whether a text is included by scanning an image of a medical image;
If the image of the medical image includes a character, extracting and storing a desired portion of the character according to a set method, then de-recognizing the character included in the medical image;
Generating a modified medical image by removing the rest of the information included in the header of the medical image except for the set information, or generating a new medical image including only the set information; And
A method for non-identifying personal information of a medical image, comprising matching and storing the extracted text and the generated medical image.

KR1020180147954A 2018-11-27 2018-11-27 Device and method for deidentification of personal information in medical image KR20200062499A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020180147954A KR20200062499A (en) 2018-11-27 2018-11-27 Device and method for deidentification of personal information in medical image

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020180147954A KR20200062499A (en) 2018-11-27 2018-11-27 Device and method for deidentification of personal information in medical image

Publications (1)

Publication Number Publication Date
KR20200062499A true KR20200062499A (en) 2020-06-04

Family

ID=71081327

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020180147954A KR20200062499A (en) 2018-11-27 2018-11-27 Device and method for deidentification of personal information in medical image

Country Status (1)

Country Link
KR (1) KR20200062499A (en)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021256711A1 (en) * 2020-06-18 2021-12-23 휴마니타스 주식회사 Medical image processing device
WO2022124476A1 (en) * 2020-12-10 2022-06-16 삼성전자주식회사 Electronic device and control method thereof
KR102410848B1 (en) * 2021-08-30 2022-06-22 (주)아이알엠 De-identification method of electronic apparatus for de-identifying personal identification information in images
KR20230067059A (en) * 2021-11-09 2023-05-16 (주)미소정보기술 Method for processing images
KR102541303B1 (en) * 2022-11-11 2023-06-13 프로메디우스 주식회사 Method and apparatus for providing cooperative medical care service of medical image based on cloud

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021256711A1 (en) * 2020-06-18 2021-12-23 휴마니타스 주식회사 Medical image processing device
KR20210156483A (en) * 2020-06-18 2021-12-27 휴마니타스 주식회사 Apparatus for non-identifying text information in medical images
WO2022124476A1 (en) * 2020-12-10 2022-06-16 삼성전자주식회사 Electronic device and control method thereof
KR102410848B1 (en) * 2021-08-30 2022-06-22 (주)아이알엠 De-identification method of electronic apparatus for de-identifying personal identification information in images
KR20230067059A (en) * 2021-11-09 2023-05-16 (주)미소정보기술 Method for processing images
KR102541303B1 (en) * 2022-11-11 2023-06-13 프로메디우스 주식회사 Method and apparatus for providing cooperative medical care service of medical image based on cloud

Similar Documents

Publication Publication Date Title
KR20200062499A (en) Device and method for deidentification of personal information in medical image
US11170248B2 (en) Video capture in data capture scenario
CN110442744B (en) Method and device for extracting target information in image, electronic equipment and readable medium
RU2711305C2 (en) Binding report/image
JP5989333B2 (en) Medical system
US20130208952A1 (en) Method and Apparatus for Improving Accuracy of Biometric Identification in Specimen Collection Applications
US20120065997A1 (en) Automatic Processing of Handwritten Physician Orders
US11741735B2 (en) Automatically attaching optical character recognition data to images
JP7320280B2 (en) Label collection device, label collection method and label collection program
KR101852774B1 (en) Error correction method for prescription recognition, and error correction system for prescription recognition
KR101966627B1 (en) Medical documents translation system for mobile
JP2021056641A (en) Medical information management device and metadata addition method of medical report
CN109119131B (en) Physical examination method and system based on medical examination expert intelligence library platform
JP2016200899A (en) Information processing apparatus, information processing method, and program
JP2016224793A (en) Medical diagnosis support system, medical information display device, medical information management device and medical image processing program
CN110580939B (en) Method and system for providing a second medical data record
JP6655745B1 (en) Information processing apparatus, information processing method, and information processing program
JP2021012741A (en) Image processor, method for processing image, and program
WO2021095698A1 (en) Generation device and generation method
KR102451066B1 (en) System for providing critical value report using text mining technique and method thereof
JP2013062681A (en) Input support system
CA2924863A1 (en) System and method for matching physician order results to electronic orders
CN111966794A (en) Diagnosis and treatment data identification method, system and device
US20210256099A1 (en) Information processing method
KR20150098412A (en) Apparatus and method for managing chart information

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
E601 Decision to refuse application