KR20200062499A - Device and method for deidentification of personal information in medical image - Google Patents
Device and method for deidentification of personal information in medical image Download PDFInfo
- Publication number
- KR20200062499A KR20200062499A KR1020180147954A KR20180147954A KR20200062499A KR 20200062499 A KR20200062499 A KR 20200062499A KR 1020180147954 A KR1020180147954 A KR 1020180147954A KR 20180147954 A KR20180147954 A KR 20180147954A KR 20200062499 A KR20200062499 A KR 20200062499A
- Authority
- KR
- South Korea
- Prior art keywords
- medical image
- character
- image
- information
- medical
- Prior art date
Links
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H30/00—ICT specially adapted for the handling or processing of medical images
- G16H30/20—ICT specially adapted for the handling or processing of medical images for handling medical images, e.g. DICOM, HL7 or PACS
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T1/00—General purpose image data processing
- G06T1/0021—Image watermarking
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H10/00—ICT specially adapted for the handling or processing of patient-related medical or healthcare data
- G16H10/60—ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H30/00—ICT specially adapted for the handling or processing of medical images
- G16H30/40—ICT specially adapted for the handling or processing of medical images for processing medical images, e.g. editing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2200/00—Indexing scheme for image data processing or generation, in general
- G06T2200/32—Indexing scheme for image data processing or generation, in general involving image mosaicing
Abstract
Description
본 발명은 의료영상에 포함된 개인정보를 비식별화 하기 위한 장치 및 방법에 관한 것이다.The present invention relates to an apparatus and method for de-identifying personal information included in medical images.
환자가 많은 대형 병원과 같은 경우에 많은 진료기록과 의료영상을 보유하고 있다. 그리고 4차 산업 환경으로 알파고와 같은 딥러닝을 이용한 인공지능에 대한 열기가 높아짐과 동시에 이를 기반으로 하는 의료영상의 연구도 활발하게 이루어지고 있다. 이러한 의료영상의 연구는 딥러닝 등 다양한 체계를 가지고 발전에 발전을 거듭하고 있다.In the case of a large hospital with many patients, it has many medical records and medical images. In addition, as the fourth industrial environment, the heat of artificial intelligence using deep learning such as AlphaGo is increasing, and research on medical images based thereon is also actively being conducted. This medical image research is progressing in development with various systems such as deep learning.
의료영상의 연구에 반드시 필요한 것이 일정 수 이상의 의료영상을 확보하는 것이다. 딥러닝 등 다양한 체계를 가지고 연구를 진행함에 있어서 샘플이 많으면 많을수록 더 정확한 결과를 얻을 수 있기 때문이다. Obtaining a certain number of medical images is essential to the study of medical images. This is because the more samples, the more accurate results can be obtained when conducting research with various systems such as deep learning.
따라서 의료영상을 연구하는 경우에 대형 병원과 같이 많은 의료영상을 보유하는 의료기관에 연구 자료로 의료영상을 요청하지만, 보유한 의료영상은 민감한 개인정보가 포함하기 때문에 절대 그냥 내줄 수 없다. 따라서 일일이 수작업 등을 통해서 필요한 의료영상의 개인정보를 삭제하고 확인하는 과정을 통해서 제공해야 한다. 이로 인하여 많은 비용이 발생하며, 이러한 비용은 연구 비용의 상승으로 연구 활동에 장벽으로 등장하고 있다.Therefore, when researching medical images, medical images are requested from medical institutions that have many medical images, such as large hospitals, but they cannot be given out because sensitive medical information is contained. Therefore, it is necessary to provide it through a process of deleting and confirming personal information of medical images required through manual work. Due to this, a lot of costs are incurred, and these costs have emerged as barriers to research activities due to rising research costs.
따라서 본 발명은 상술한 문제점을 해결하기 위해 도출된 것으로서, 의료영상에 포함된 환자 개인정보를 용이하게 비식별화할 수 있는 장치 및 방법을 제공하고자 한다. Accordingly, the present invention is to solve the above-mentioned problems, and is to provide an apparatus and method for easily de-identifying patient personal information included in a medical image.
본 발명의 다른 목적들은 이하에 서술되는 실시예를 통하여 더욱 명확해질 것이다.Other objects of the present invention will become more apparent through the embodiments described below.
본 발명의 일 측면에 따른 의료영상의 개인정보 비식별화 장치는, 의료영상의 이미지를 OCR(Optical Character Reader) 기능을 이용하여 스캔해서 문자가 포함되어 있는지 여부를 판단하는 문자인식부와, 의료영상의 이미지에 문자가 포함된 경우 설정된 방식에 따라서 원하는 부분의 문자를 추출하여 저장한 후 의료영상에 포함된 문자를 비인식화하는 문자처리부와, 의료영상의 헤더에 포함된 정보 중에서 설정된 정보를 제외한 나머지를 제거하여 수정된 의료영상을 생성하거나 또는 설정된 정보만 포함하는 새로운 의료영상을 생성하는 영상생성부와, 문자처리부에서 추출된 문자 및 영상생성부에서 생성된 의료영상을 상호 매칭하여 저장하는 저장부를 포함한다. The personal information de-identification device of a medical image according to an aspect of the present invention includes a character recognition unit that scans an image of a medical image using an OCR (Optical Character Reader) function to determine whether a character is included, and medical If the image of the image contains text, extract the character of the desired part according to the set method, save it, and then de-recognize the text included in the medical image, and the set information among the information included in the header of the medical image. By removing the rest, the corrected medical image is generated, or the image generating unit generating a new medical image containing only the set information and the medical images generated by the text generated by the text processing unit and the image generating unit are mutually matched and stored. It includes a storage unit.
본 발명에 따른 의료영상 개인정보 비식별화 장치는 다음과 같은 실시예들을 하나 또는 그 이상 구비할 수 있다. 예를 들면, 설정된 방식은, 문자처리부가 의료영상의 헤더에서 산출장비 및 산출시점 중에서 적어도 하나를 포함하는 정보를 확보한 후 이를 이용하여 의료영상에서 원하는 부분을 결정할 수 있다. The medical image personal information de-identification apparatus according to the present invention may include one or more of the following embodiments. For example, in the set method, the character processing unit may obtain information including at least one of a calculation device and a calculation time from a header of a medical image, and then use it to determine a desired portion of the medical image.
설정된 정보는 의료영상에 포함된 나이 및 성별을 포함할 수 있다. The set information may include age and gender included in the medical image.
문자인식부가 의료영상에서 문자가 포함되어 있는지 여부를 판단할 때 촬영방향이나 위치를 표시하는 문자는 제외할 수 있다. When the character recognition unit determines whether a character is included in the medical image, a character indicating a photographing direction or a location may be excluded.
본 발명의 일 측면에 따른 의료영상 개인정보 비식별화 방법은, 의료영상의 이미지를 스캔해서 문자가 포함되어 있는지 여부를 판단하는 단계와, 의료영상의 이미지에 문자가 포함된 경우 설정된 방식에 따라서 원하는 부분의 문자를 추출하여 저장한 후 의료영상에 포함된 문자를 비인식화하는 단계와, 의료영상의 헤더에 포함된 정보 중에서 설정된 정보를 제외한 나머지를 제거하여 수정된 의료영상을 생성하거나 또는 설정된 정보만 포함하는 새로운 의료영상을 생성하는 단계와, 추출된 문자 및 생성된 의료영상을 상호 매칭하여 저장하는 단계를 포함한다. The method of de-identifying medical image personal information according to an aspect of the present invention includes scanning a medical image image to determine whether a character is included, and when a medical image image contains a character, according to a set method After extracting and storing the desired part of the text, de-recognizing the text included in the medical image, and removing the rest of the information included in the header of the medical image except for the set information to generate a corrected medical image or setting And generating a new medical image containing only information, and matching and storing the extracted text and the generated medical image.
본 발명은 의료영상에 포함된 환자 개인 정보를 용이하게 비식별화할 수 있는 장치 및 방법을 제공할 수 있다. The present invention can provide an apparatus and method for easily de-identifying patient personal information included in a medical image.
또한, 본 발명은 의료영상 이미지에 포함된 유의미한 정보를 활용할 수 있는 의료영상의 개인정보 비식별화 장치 및 방법을 제공할 수 있다. In addition, the present invention can provide an apparatus and method for de-identifying personal information of a medical image that can utilize meaningful information included in the medical image.
도 1은 본 발명의 일 실시예에 따른 개인정보 비식별화 장치를 예시하는 도면이다.
도 2는 문자를 포함하는 의료영상 이미지의 일 예를 나타낸다.
도 3은 본 발명의 일 실시예에 따른 개인정보 비식별화 방법을 예시하는 순서도이다.1 is a diagram illustrating an apparatus for de-identifying personal information according to an embodiment of the present invention.
2 shows an example of a medical image image including characters.
3 is a flowchart illustrating a method of de-identifying personal information according to an embodiment of the present invention.
본 발명은 다양한 변환을 가할 수 있고 여러 가지 실시 예를 가질 수 있는 바, 특정 실시 예들을 도면에 예시하고 상세한 설명에서 상세하게 설명하고자 한다. 그러나, 이는 본 발명을 특정한 실시 형태에 대해 한정하려는 것이 아니며, 본 발명의 사상 및 기술 범위에 포함되는 모든 변환, 균등물 내지 대체물을 포함하는 것으로 이해되어야 한다. 본 발명을 설명함에 있어서 관련된 공지 기술에 대한 구체적인 설명이 본 발명의 요지를 흐릴 수 있다고 판단되는 경우 그 상세한 설명을 생략한다.The present invention can be applied to a variety of transformations and may have various embodiments, and specific embodiments will be illustrated in the drawings and described in detail in the detailed description. However, this is not intended to limit the present invention to specific embodiments, and should be understood to include all conversions, equivalents, and substitutes included in the spirit and scope of the present invention. In the description of the present invention, when it is determined that detailed descriptions of related known technologies may obscure the subject matter of the present invention, detailed descriptions thereof will be omitted.
본 출원에서 사용한 용어는 단지 특정한 실시예를 설명하기 위해 사용된 것으로, 본 발명을 한정하려는 의도가 아니다. 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다. 본 출원에서, "포함하다" 또는 "가지다" 등의 용어는 명세서상에 기재된 특징, 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것이 존재함을 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.The terms used in the present application are only used to describe specific embodiments, and are not intended to limit the present invention. Singular expressions include plural expressions unless the context clearly indicates otherwise. In this application, terms such as “include” or “have” are intended to indicate the presence of features, numbers, steps, actions, components, parts, or combinations thereof described in the specification, one or more other features. It should be understood that the existence or addition possibilities of fields or numbers, steps, operations, components, parts or combinations thereof are not excluded in advance.
제1, 제2 등의 용어는 다양한 구성요소들을 설명하는데 사용될 수 있지만, 상기 구성요소들은 상기 용어들에 의해 한정되어서는 안 된다. 상기 용어들은 하나의 구성요소를 다른 구성요소로부터 구별하는 목적으로만 사용된다. Terms such as first and second may be used to describe various components, but the components should not be limited by the terms. The terms are used only for the purpose of distinguishing one component from other components.
이하, 첨부한 도면들을 참조하여 본 발명에 따른 실시예들을 상세히 설명하기로 하며, 첨부 도면을 참조하여 설명함에 있어 도면 부호에 상관없이 동일하거나 대응하는 구성 요소는 동일한 참조번호를 부여하고 이에 대한 중복되는 설명은 생략하기로 한다.Hereinafter, exemplary embodiments according to the present invention will be described in detail with reference to the accompanying drawings, and in the description with reference to the accompanying drawings, the same or corresponding components are assigned the same reference numbers regardless of reference numerals, and duplicated thereof. The description will be omitted.
도 1은 본 발명의 일 실시예에 따른 개인정보 비식별화 장치(100)를 예시하는 도면이다. 그리고 도 2는 문자를 포함하는 의료영상 이미지의 일 예를 나타낸다. 1 is a diagram illustrating a personal information de-identification
도 1 내지 도 2를 참고하면, 본 발명의 일 실시예에 따른 개인정보 비식별화 장치(100)는 의료영상에 포함된 개인정보를 비식별화하고 의료영상에 포함된 유의미한 정보를 활용할 수 있게 하는 것을 특징으로 한다. 즉, 본 실시예에 따른 개인정보 비식별화 장치(100)는 의료영상 이미지에 포함된 선량정보 등과 같이 영상 분석에 필요한 정보를 삭제하기 이전에 추출한 후 저장하여 활용할 수 있는 것을 특징으로 한다. 1 to 2, the personal information de-identification
본 실시예에 따른 개인정보 비식별화 장치(100)는, 의료영상 저장 및 전송 시스템 즉 의료영상 시스템(예를 들면, PACS 시스템)(200)과 연결되고, 의료영상 시스템(200)으로부터 영상을 전송받거나 또는 의료영상이 저장된 경로를 전달 받는다. 여기서, 의료영상이 저장된 경로는 수작업으로 지정한 경로도 포함된다. 그리고 본 실시예에 따른 개인정보 비식별화 장치(100)는 문자인식부(110), 문자처리부(120), 영상생성부(130) 및 저장부(140)를 포함한다. The personal information de-identification
이하에서 사용되는 문자는 한글, 알파벳, 숫자, 각종 기호 및 기타 문자 등을 포함한다. The characters used below include Hangul, alphabets, numbers, various symbols, and other characters.
문자인식부(110)는 의료영상 이미지를 OCR(Optical Character Reader) 기능을 이용해서 스캔해서 문자가 포함되어 있는지 여부를 판단한다. 의료영상에 포함된 문자는 개인정보에 해당할 수 있기 때문에 외부에서 활용하기 위해서는 삭제가 필요하다. 따라서 문자인식부(110)는 의료영상 이미지에 문자가 포함되어 있는지를 판단해서, 문자가 포함된 경우 이에 대한 정보를 문자처리부(120)에 전송한다. The
물론, 문자인식부(110)에 의해서 문자가 포함되지 않은 것으로 판단된 경우, 문자인식부(110)에 의해서 문자를 비식별화 할 필요가 없게 된다. Of course, when it is determined that the character is not included by the
문자인식부(110)는 의료영상 이미지에 포함된 문자를 인식하는 과정에서, 사전에 설정된 문자는 제외하고 다른 문자가 포함되어 있는지 여부를 판단할 수 있다. 사전에 설정된 문자는, 예를 들면, 문자 'L' 또는 'R'과 같이 촬영 방향이나 위치를 표시하는 기호에 해당할 수 있다. In the process of recognizing the characters included in the medical image, the
문자인식부(110)에 의해서 사전에 설정된 문자를 제외하고 다른 문자가 있는 것으로 인식된 경우, 문자처리부(120)에 의해서 해당부분의 문자를 별도로 추출하여 저장하거나 또는 상기 과정을 거치지 않고 문자를 비인식화 할 수 있다. When it is recognized by the
문자인식부(110)는 의료영상 이미지를 스캔해서 사전에 설정된 문자를 제외한 다른 문자가 포함되어 있는지 여부에 대해 판단하는 과정을 2회 이상 반복할 수 있다. The
문자인식부(110)에 의해서 사전에 설정된 문자를 제외한 다른 문자가 있는 것으로 판단된 경우, 문자처리부(120)는 그 문자를 비식별화 하기 이전에 문자를 추출해서 별도로 저장할 수 있다. 이와 같이 문자를 별도로 저장하는 이유는 해당 문자가 의료영상의 분석에 필요한 정보(예를 들면, 방사선량 등)에 해당할 가능성이 있기 때문이다. 의료영상의 분석에 필요한 정보를 비식별화하지 않고 별도로 추출하여 저장함으로써 추후 의료영상에 대한 분석 과정에서 유용하게 활용될 수 있다. If it is determined by the
문자처리부(120)는 설정된 방식에 따라서 원하는 부분의 문자를 추출하여 저장한다. 여기서 설정된 방식이란, 의료영상의 헤더에 포함되어 있는 산출장비 및/또는 산출시점에 대한 정보를 문자처리부(120)가 확보하고, 확보한 산출장비 및 산출시점에 대응하여 의료영상 이미지의 특정 위치에 포함된 문자를 문자인식부(110)에 의해서 인식된 문자정보로서 추출한 후 저장한다. The
의료영상의 산출장비는 생성한 의료영상 이미지의 특정 위치(예를 들면, 의료영상 이미지의 우측 상부 또는 좌측 하부 등)에 영상분석에 필요한 정보(방사선량 등)를 문자로서 표현할 수 있다. 도 2를 참고하면, 의료영상 이미지의 좌측 상부에 의료영상의 분석에 필요한 문자가 표시되어 있다. 이와 같은 문자 정보는 의료영상을 산출하는 장비의 종류(예를 들면, CT, MRI 또는 X-Ray 등) 및 제조사 등에 따라서 그 위치가 변경될 수 있다. The medical image calculating device may express information (radiation dose, etc.) required for image analysis as a character at a specific position (for example, upper right or lower left of the medical image) of the generated medical image. Referring to FIG. 2, characters required for analysis of a medical image are displayed on the upper left of the medical image. The position of the text information may be changed according to the type of equipment (for example, CT, MRI, or X-Ray) and the manufacturer of the medical image.
예를 들면, A사가 제조한 X-Ray 장비는 방사선량을 의료영상 이미지의 좌측 하부에 표시함에 반해, B사가 제조한 X-Ray 장비는 방사선량을 의료영상 이미지의 우측 상부에 표시할 수 있고, C사가 제조한 X-Ray 장비는 방사선량을 의료영상 이미지에 표시하지 않을 수 있다. 또한, 동일한 제조사의 장비인 경우에도 장비의 종류가 다른 경우 (예를 들면, CT와 X-Ray)에도 영상분석에 필요한 문자의 위치가 변경될 수 있다. For example, the X-Ray equipment manufactured by A can display the radiation dose in the lower left of the medical image, while the X-Ray equipment manufactured by B can display the radiation dose in the upper right of the medical image. , X-Ray equipment manufactured by C may not display the radiation dose on the medical image. In addition, even in the case of equipment of the same manufacturer, the position of a character required for image analysis may be changed even when the type of equipment is different (for example, CT and X-Ray).
의료영상의 산출장비는 각 병원에서 일정 시간마다 교체가 이루어질 수 있다. 따라서 동일한 제조사 및 동일한 종류의 의료장비인 경우에도 그 영상의 산출시점에 따라서 영상분석에 필요한 문자의 위치가 의료영상에서 변경될 수 있다. 예를 들면, 동일한 병원에서 2018년 10월까지는 A사의 엑스레이 장비를 이용하다가 11월부터 동일한 A사의 엑스레이 장비 중 다른 모델을 이용한 경우에, 문자가 포함된 위치가 달라질 수 있다. Medical imaging equipment can be replaced at regular intervals in each hospital. Therefore, even in the case of the same manufacturer and the same type of medical equipment, the position of the text required for image analysis may be changed in the medical image according to the calculation time of the image. For example, if the same hospital uses X-ray equipment of company A until October 2018, and then uses a different model of X-ray equipment of company A from November, the location of characters may be different.
이와 같이, 문자처리부(120)는 의료영상의 산출장비 및 산출시점에 대한 정보를 확보하고, 이를 이용하여 개인정보에 해당하지 않고 영상분석에 유용한 문자가 표시되어 있는지 여부 및 그 위치를 용이하게 파악할 수 있다. As described above, the
산출장비에 대한 정보는, 예를 들면, 의료영상을 생성한 장비의 종류, 제조사, 모델명, 설치위치 등에 대한 정보를 포함할 수 있다. 또한, 산출시점에 대한 정보는 의료영상을 생성한 시각에 대한 정보를 포함할 수 있다. The information about the calculation equipment may include, for example, information about the type of the equipment that generated the medical image, the manufacturer, the model name, and the installation location. Further, the information on the calculation time may include information on the time at which the medical image is generated.
문자처리부(120)는 산출장비 또는 산출장비와 산출시점에 대한 정보를 이용해서 의료영상 이미지에서 특정 위치의 문자를 추출한 후 이를 저장할 수 있다. 즉, 문자처리부(120)는 문자인식부(110)로부터 특정 위치의 문자에 대한 정보를 확보한 후 이를 저장부(140)에 저장할 수 있다. The
문자처리부(120)는 특정 영역에 있는 문자를 추출한 후 의료영상 이미지에 포함된 모든 문자 또는 특정 영역 이외의 다른 영역에 있는 문자를 비식별화 할 수 있다. 문자에 대한 비식별화는 의료영상 이미지에서 문자의 삭제, 블랭크 또는 마스킹 처리 등을 포함할 수 있다. The
영상생성부(130)는 문자처리부(120)에서 처리된 의료영상의 헤더에 포함된 정보 중에서 설정된 정보를 제외한 나머지를 제거하여 수정된 의료영상을 생성하거나 또는 설정된 정보만 포함하는 새로운 의료영상을 생성한다. 여기서 설정된 정보는 의료영상의 분석에 필요한 나이(age) 및 성별(sex)에 해당할 수 있다. 영상생성부(130)는 의료영상의 헤더(header)에 포함된 다양한 정보 중에서 개인정보 및 영상 판독에 불필요한 정보를 전부 또는 일부 삭제한 후 이를 저장하거나 또는 설정된 정보만을 포함하는 신규 의료영상을 생성한 후 이를 저장부(140)에 저장할 수 있다. The
의료영상 이미지에서 별도로 추출하여 저장할 문자가 포함되지 않은 경우에는, 문자처리부(120)가 특정 영역의 문자를 추출하여 별도로 저장하는 과정을 거치지 않고, 영상생성부(130)에 의해서 헤더에 불필요한 정보를 삭제한 후 이를 저장하는 과정을 진행할 수 있다. When the text to be extracted and stored separately from the medical image is not included, the
저장부(140)는 문자처리부(120)에서 추출된 문자를 저장한다. 문자처리부(120)는 의료영상 이미지에서 영상 판독에 필요한 정보에 해당하는 문자에 대한 정보를 문자인식부(110)에서 받아서 이를 저장부(140)에 저장한다. 또한, 저장부(140)는 영상생성부(130)에 의해 생성된 수정된 의료영상 또는 신규 의료영상을 저장한다. 저장부(140)는 추출된 문자와 생성된 신규 또는 수정 의료영상을 매칭하여 저장할 수 있다. The
저장부(140)에 저장된 추출 문자 및 신규(또는 수정) 의료영상은 외부로 전송되는 등의 방법에 의해서 활용될 수 있다.The extracted text and new (or modified) medical images stored in the
도 3은 본 발명의 일 실시예에 따른 개인정보 비식별화 방법을 예시하는 순서도이다.3 is a flowchart illustrating a method of de-identifying personal information according to an embodiment of the present invention.
도 3을 참고하면, 의료영상의 이미지를 스캔해서 문자가 포함되어 있는지 여부를 판단하는 단계와, 의료영상의 이미지에 문자가 포함된 경우 설정된 방식에 따라서 원하는 부분의 문자를 추출하여 저장한 후 의료영상에 포함된 문자를 비인식화하는 단계와, 의료영상의 헤더에 포함된 정보 중에서 설정된 정보를 제외한 나머지를 제거하여 수정된 의료영상을 생성하거나 또는 설정된 정보만 포함하는 새로운 의료영상을 생성하는 단계와, Referring to FIG. 3, a step of determining whether a text is included by scanning an image of a medical image, and when the image of the medical image includes a character, extracting and storing a character of a desired part according to a set method, and then storing the medical image De-recognizing the characters included in the image, and removing the rest of the information included in the header of the medical image except for the set information to generate a corrected medical image or generating a new medical image containing only the set information. Wow,
추출된 문자 및 생성된 의료영상을 상호 매칭하여 저장하는 단계를 포함한다. And matching and storing the extracted text and the generated medical image.
의료영상 이미지는 OCR 기능에 의해서 스캔될 수 있다. 최근 OCR 라이브러리의 발전으로 다양한 한글, 숫자, 알파벳, 그 외 문자를 인식하는데 높은 인식율을 보인다. 특히 의료영상은 디지털 의료장비에서 산출되기 때문에 컴퓨터에서 사용되는 정자형의 한글, 숫자, 알파벳을 사용한다. 따라서 의료영상의 경우에 인식율은 100%에 가깝게 나타난다. 의료영상 이미지에 대한 스캔을 2회 이상 반복함으로써 문자 인식율을 100% 가깝게 할 수 있다. Medical image images can be scanned by the OCR function. With the recent development of the OCR library, it has a high recognition rate in recognizing various Hangul, numbers, alphabets, and other characters. In particular, since medical images are produced by digital medical equipment, Korean, numbers, and alphabets of sperm type used in computers are used. Therefore, in the case of medical imaging, the recognition rate appears close to 100%. By repeating the scan of the medical image image two or more times, the character recognition rate can be made close to 100%.
여기서 인식율이란 1과 ㅣ(알파벳 L의 소문자)를 구별하는 것이 아닌 숫자 또는 문자를 인식하는 것이다. Here, the recognition rate does not distinguish between 1 and ㅣ (lowercase letter of alphabet L).
의료영상 이미지에 대한 스캔을 통해서 문자가 포함되어 있는 것으로 판단되는 경우, 문자를 비식별화 하기 이전에 의료영상의 판독에 유용한 정보에 해당할 가능성이 높은 문자를 추출한 후 이를 저장한다. 문자를 저장한 후 의료영상 이미지에 포함된 문자를 전부 또는 일부 비식별화 한다. When it is determined that the text is included through the scan of the medical image, the text likely to correspond to information useful for reading the medical image is extracted and stored before the character is de-identified. After storing the text, all or part of the text included in the medical image is de-identified.
의료영상의 판독에 유용한 정보에 해당하는지 여부에 대한 판단은 의료영상의 헤더에 포함된 산출장비 및 산출시점에 대한 정보를 이용할 수 있다. 산출장비의 종류, 제조사, 모델명과 같은 산출장비에 대한 정보와 산출시점에 대한 정보를 이용해서 의료영상 판독에 유용한 정보의 위치를 파악하고 이를 OCR 기능에 의해서 추출할 수 있다. The determination as to whether it corresponds to information useful for reading a medical image may use calculation equipment included in the header of the medical image and information about the calculation time. Using information on the calculation equipment such as the type of the production equipment, the manufacturer and the model name, and information on the calculation time point, the location of useful information for medical image reading can be identified and extracted by the OCR function.
의료영상의 특정 위치에 있는 문자를 추출하여 저장한 후 의료영상의 헤더에 포함된 정보 중에서 설정된 정보를 제외한 나머지를 제외하고 삭제할 수 있다. 설정된 정보는 의료영상의 판독에 필요하지만 개인정보에는 해당하는 것으로 보기 어려운 나이 또는 성별 등에 해당할 수 있다. After extracting and storing the text at a specific location of the medical image, it may be deleted except for the rest of the information included in the header of the medical image except for the set information. The set information is necessary for reading medical images, but may correspond to age or gender, which is difficult to be considered as personal information.
상기에서는 본 발명의 일 실시예를 참조하여 설명하였지만, 해당 기술 분야에서 통상의 지식을 가진 자라면 하기의 특허 청구의 범위에 기재된 본 발명의 사상 및 영역으로부터 벗어나지 않는 범위 내에서 본 발명을 다양하게 수정 및 변경시킬 수 있음을 이해할 수 있을 것이다.The above has been described with reference to one embodiment of the present invention, but those skilled in the art may vary the present invention without departing from the spirit and scope of the invention as set forth in the claims below. It will be understood that modifications and changes can be made.
100: 의료영상 개인정보 비식별화 장치
110: 문자인식부
120: 문자처리부
130: 영상생성부
140: 저장부
200: 의료영상 시스템100: medical image personal information de-identification device
110: Character recognition department
120: character processing unit
130: image generation unit
140: storage
200: medical imaging system
Claims (4)
의료영상의 이미지에 문자가 포함된 경우 설정된 방식에 따라서 원하는 부분의 문자를 추출하여 저장한 후 의료영상에 포함된 문자를 비인식화하는 문자처리부;
의료영상의 헤더에 포함된 정보 중에서 설정된 정보를 제외한 나머지를 제거하여 수정된 의료영상을 생성하거나 또는 설정된 정보만 포함하는 새로운 의료영상을 생성하는 영상생성부; 및
상기 문자처리부에서 추출된 문자 및 상기 영상생성부에서 생성된 의료영상을 상호 매칭하여 저장하는 저장부를 포함하는 의료영상의 개인정보 비식별화 장치.A character recognition unit that scans an image of a medical image using an OCR (Optical Character Reader) function to determine whether a character is included;
A character processing unit for extracting and storing a desired portion of a character according to a set method when the image of the medical image includes a character, and then unrecognizing the character included in the medical image;
An image generating unit generating a modified medical image by removing the rest of the information included in the header of the medical image except for the set information or a new medical image including only the set information; And
A device for non-identifying personal information of medical images, including a storage unit for matching and storing characters extracted from the text processing unit and medical images generated by the image generation unit.
상기 설정된 방식은, 상기 문자처리부가 의료영상의 헤더에서 산출장비 및 산출시점 중에서 적어도 하나를 포함하는 정보를 확보한 후 이를 이용하여 의료영상에서 원하는 부분을 결정하는 것을 특징으로 하는 의료영상의 개인정보 비식별화 장치.According to claim 1,
In the set method, the character processing unit obtains information including at least one of a calculation device and a calculation time from a header of a medical image, and then uses the information to determine a desired portion of the medical image. De-identification device.
상기 문자인식부가 의료영상에서 문자가 포함되어 있는지 여부를 판단할 때 촬영방향이나 위치를 표시하는 문자는 제외하는 것을 특징으로 하는 의료영상의 개인정보 비식별화 장치.According to claim 1,
When the character recognition unit determines whether a character is included in the medical image, a character indicating a photographing direction or a location is excluded.
의료영상의 이미지에 문자가 포함된 경우 설정된 방식에 따라서 원하는 부분의 문자를 추출하여 저장한 후 의료영상에 포함된 문자를 비인식화하는 단계;
의료영상의 헤더에 포함된 정보 중에서 설정된 정보를 제외한 나머지를 제거하여 수정된 의료영상을 생성하거나 또는 설정된 정보만 포함하는 새로운 의료영상을 생성하는 단계; 및
추출된 문자 및 생성된 의료영상을 상호 매칭하여 저장하는 단계를 포함하는 의료영상의 개인정보 비식별화 방법.
Determining whether a text is included by scanning an image of a medical image;
If the image of the medical image includes a character, extracting and storing a desired portion of the character according to a set method, then de-recognizing the character included in the medical image;
Generating a modified medical image by removing the rest of the information included in the header of the medical image except for the set information, or generating a new medical image including only the set information; And
A method for non-identifying personal information of a medical image, comprising matching and storing the extracted text and the generated medical image.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020180147954A KR20200062499A (en) | 2018-11-27 | 2018-11-27 | Device and method for deidentification of personal information in medical image |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020180147954A KR20200062499A (en) | 2018-11-27 | 2018-11-27 | Device and method for deidentification of personal information in medical image |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20200062499A true KR20200062499A (en) | 2020-06-04 |
Family
ID=71081327
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020180147954A KR20200062499A (en) | 2018-11-27 | 2018-11-27 | Device and method for deidentification of personal information in medical image |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR20200062499A (en) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2021256711A1 (en) * | 2020-06-18 | 2021-12-23 | 휴마니타스 주식회사 | Medical image processing device |
WO2022124476A1 (en) * | 2020-12-10 | 2022-06-16 | 삼성전자주식회사 | Electronic device and control method thereof |
KR102410848B1 (en) * | 2021-08-30 | 2022-06-22 | (주)아이알엠 | De-identification method of electronic apparatus for de-identifying personal identification information in images |
KR20230067059A (en) * | 2021-11-09 | 2023-05-16 | (주)미소정보기술 | Method for processing images |
KR102541303B1 (en) * | 2022-11-11 | 2023-06-13 | 프로메디우스 주식회사 | Method and apparatus for providing cooperative medical care service of medical image based on cloud |
-
2018
- 2018-11-27 KR KR1020180147954A patent/KR20200062499A/en not_active Application Discontinuation
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2021256711A1 (en) * | 2020-06-18 | 2021-12-23 | 휴마니타스 주식회사 | Medical image processing device |
KR20210156483A (en) * | 2020-06-18 | 2021-12-27 | 휴마니타스 주식회사 | Apparatus for non-identifying text information in medical images |
WO2022124476A1 (en) * | 2020-12-10 | 2022-06-16 | 삼성전자주식회사 | Electronic device and control method thereof |
KR102410848B1 (en) * | 2021-08-30 | 2022-06-22 | (주)아이알엠 | De-identification method of electronic apparatus for de-identifying personal identification information in images |
KR20230067059A (en) * | 2021-11-09 | 2023-05-16 | (주)미소정보기술 | Method for processing images |
KR102541303B1 (en) * | 2022-11-11 | 2023-06-13 | 프로메디우스 주식회사 | Method and apparatus for providing cooperative medical care service of medical image based on cloud |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR20200062499A (en) | Device and method for deidentification of personal information in medical image | |
US11170248B2 (en) | Video capture in data capture scenario | |
CN110442744B (en) | Method and device for extracting target information in image, electronic equipment and readable medium | |
RU2711305C2 (en) | Binding report/image | |
JP5989333B2 (en) | Medical system | |
US20130208952A1 (en) | Method and Apparatus for Improving Accuracy of Biometric Identification in Specimen Collection Applications | |
US20120065997A1 (en) | Automatic Processing of Handwritten Physician Orders | |
US11741735B2 (en) | Automatically attaching optical character recognition data to images | |
JP7320280B2 (en) | Label collection device, label collection method and label collection program | |
KR101852774B1 (en) | Error correction method for prescription recognition, and error correction system for prescription recognition | |
KR101966627B1 (en) | Medical documents translation system for mobile | |
JP2021056641A (en) | Medical information management device and metadata addition method of medical report | |
CN109119131B (en) | Physical examination method and system based on medical examination expert intelligence library platform | |
JP2016200899A (en) | Information processing apparatus, information processing method, and program | |
JP2016224793A (en) | Medical diagnosis support system, medical information display device, medical information management device and medical image processing program | |
CN110580939B (en) | Method and system for providing a second medical data record | |
JP6655745B1 (en) | Information processing apparatus, information processing method, and information processing program | |
JP2021012741A (en) | Image processor, method for processing image, and program | |
WO2021095698A1 (en) | Generation device and generation method | |
KR102451066B1 (en) | System for providing critical value report using text mining technique and method thereof | |
JP2013062681A (en) | Input support system | |
CA2924863A1 (en) | System and method for matching physician order results to electronic orders | |
CN111966794A (en) | Diagnosis and treatment data identification method, system and device | |
US20210256099A1 (en) | Information processing method | |
KR20150098412A (en) | Apparatus and method for managing chart information |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
E902 | Notification of reason for refusal | ||
E601 | Decision to refuse application |