WO2021049784A2 - Gan을 이용한 의료 영상의 광강도 분포 일반화 기법 - Google Patents

Gan을 이용한 의료 영상의 광강도 분포 일반화 기법 Download PDF

Info

Publication number
WO2021049784A2
WO2021049784A2 PCT/KR2020/011363 KR2020011363W WO2021049784A2 WO 2021049784 A2 WO2021049784 A2 WO 2021049784A2 KR 2020011363 W KR2020011363 W KR 2020011363W WO 2021049784 A2 WO2021049784 A2 WO 2021049784A2
Authority
WO
WIPO (PCT)
Prior art keywords
light intensity
intensity distribution
data set
domain
image
Prior art date
Application number
PCT/KR2020/011363
Other languages
English (en)
French (fr)
Other versions
WO2021049784A3 (ko
Inventor
신병석
이연
이동호
Original Assignee
인하대학교 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 인하대학교 산학협력단 filed Critical 인하대학교 산학협력단
Publication of WO2021049784A2 publication Critical patent/WO2021049784A2/ko
Publication of WO2021049784A3 publication Critical patent/WO2021049784A3/ko

Links

Images

Classifications

    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/0033Features or image-related aspects of imaging apparatus classified in A61B5/00, e.g. for MRI, optical tomography or impedance tomography apparatus; arrangements of imaging apparatus in a room
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H30/00ICT specially adapted for the handling or processing of medical images
    • G16H30/40ICT specially adapted for the handling or processing of medical images for processing medical images, e.g. editing

Definitions

  • the following description relates to a technique for adjusting the light intensity distribution of image information.
  • CNN convolutional neural network
  • Histogram matching is a traditional method of adjusting the light intensity of an image.
  • the generalization of light intensity can be thought of as a task of converting an arbitrary set of images into a specific learned domain, and this is called image-to-image translation.
  • Image-to-Image translation is being actively studied recently using a Generative Adversarial Network (GAN) and a VAE (Variational Auto Encoder).
  • GAN Generative Adversarial Network
  • VAE Variational Auto Encoder
  • a method and system for generalizing light intensity distribution of medical images using GAN can be provided.
  • a method and system for maintaining the performance of the existing network through a generalization process using a GAN can be provided.
  • the light intensity distribution generalization method performed by the light intensity distribution generalization system includes the steps of receiving a new data set having a distribution different from the light intensity distribution of a training data set for medical images is input; Adjusting the light intensity distribution of the received new data set based on a Generative adversarial network (GAN); And passing the new data set with the adjusted light intensity distribution through a classification network learned with the training data set to obtain a classification result.
  • GAN Generative adversarial network
  • the adjusting of the light intensity distribution includes, when the received new data set is composed of a non-corresponding data set, the received non-corresponding data set by learning a non-corresponding data set composed of the received non-corresponding data set by CycleGAN. It may include the step of adjusting the light intensity distribution of.
  • the adjusting of the light intensity distribution may include a loss between the original domain image and the reconstructed image generated through adjustment of the light intensity distribution in order to enable learning with the non-corresponding data set in the CycleGAN. -consistency) may be included.
  • the CycleGAN includes a forward cycle-consistency loss and a backward cycle-consistency loss, and the step of adjusting the light intensity distribution includes the original in the first domain in the CycleGAN.
  • the step of adjusting the light intensity distribution includes learning using a corresponding data set in a GAN before a preset reference, and learning using a non-corresponding data set in a GAN after a preset reference, wherein the corresponding data is It may mean a data pair obtained by converting each image belonging to an arbitrary domain into a target domain.
  • the light intensity distribution generalization system includes: a receiver configured to receive input of a new data set having a distribution different from the light intensity distribution of a training data set for a medical image; A controller configured to adjust a light intensity distribution of the received new data set based on a Generative Adversarial Network (GAN); And an acquirer configured to obtain a classification result by passing the new data set to which the light intensity distribution is adjusted through the classification network learned with the training data set.
  • GAN Generative Adversarial Network
  • the light intensity control system maintains the performance of the CNN-based classification network by generalizing a new data set showing a completely different light intensity from the learned data set (hereinafter, referred to as'learning data set'). I can.
  • FIG. 1 is a diagram illustrating a process of generalizing a medical image in a light intensity control system according to an exemplary embodiment.
  • FIG. 2 is a flowchart illustrating a method of generalizing a light intensity distribution of a medical image in a light intensity control system according to an exemplary embodiment.
  • CycleGAN of the light intensity control system according to an embodiment.
  • FIG. 4 is a block diagram illustrating a configuration of a system for adjusting light intensity according to an exemplary embodiment.
  • FIG. 1 is a diagram illustrating a process of generalizing a medical image in a light intensity control system according to an exemplary embodiment.
  • the light intensity adjustment system may receive that a new data set 101 having a distribution different from the light intensity distribution of the learned data set (hereinafter, described as a training data set) is input.
  • the light intensity control system can adjust the light intensity distribution of the new data set 101.
  • generalization may be performed by adjusting the light intensity distribution.
  • the light intensity control system can generalize the new data set 101 through a generalizer.
  • the light intensity control system can generalize 102 a new data set in the target distribution through a generalizer.
  • the light intensity control system can learn a new data set from a target distribution generalized to the network learned with the training data set 103, and classify a new data set from the target distribution as learning is performed, and accordingly, as a learning result.
  • the classification result 104 can be obtained.
  • FIG. 2 is a flowchart illustrating a method of generalizing a light intensity distribution of a medical image in a light intensity control system according to an exemplary embodiment.
  • the light intensity control system can maintain the performance of the CNN-based classification network by generalizing a new data set showing a light intensity that is completely different from the light intensity distribution of the training data set.
  • the light intensity control system receives the input of a new data set y, when each light intensity distribution p(y) and p(D x ) are completely different (210), it is generalized through a GAN-based generalizer.
  • the new generalized data set is passed through the classification network learned 230 as the training data set and classified 240 to obtain a classification result (240).
  • the GAN as a generalizer must be capable of training with an unpaired data set.
  • the initial GAN can use the corresponding dataset.
  • the corresponding data refers to a data pair obtained by converting each image belonging to an arbitrary x domain into a target domain y. For example, the same patient was taken with two different machines. Since it is impossible and unnecessary to collect the corresponding data set in the light intensity generalization operation, in the embodiment, a CycleGAN capable of learning a non-corresponding data set may be used as a generalizer.
  • CycleGAN is one of the most popular image-to-image translation GANs. CycleGAN allows the domain-converted and output image to maintain the characteristics of the original input of the image. Referring to FIG. 3, it is an example showing the overall structure of CycleGAN. CycleGAN uses cycle-consistency to enable learning with non-corresponding data sets.
  • FIG. 3(a) is an example of a forward cycle-consistency loss
  • FIG. 3(b) is an example of a backward cycle-consistency loss
  • the original domain image X is converted to the target domain image Y
  • Fig. 3(b) shows the conversion from the target domain image Y to the original domain image X.
  • Cycle-consistency refers to a loss between an image in the original domain X and a reconstructed image generated through a generator.
  • the domain-transformed fake image G XY (X) is generated through the generator G XY , and then the generated fake image is returned to the original domain X to create the reconstructed image G YX (G XY (X)).
  • the cycle-consistency loss reduces the loss between the original input and the reconstructed image G YX (G XY (X)) so that the network maintains the characteristics of the original input as much as possible (Fig. 3(a)).
  • Cyclic coherence refers to the loss between the image in the target domain Y and the reconstructed image generated through the generator.
  • the domain-transformed fake image G XY (Y) is generated through the generator G YX , and then the generated fake image is returned to the target domain Y to obtain the reconstructed image G YX (G XY (Y)).
  • the cycle-consistency loss reduces the loss between the target input and the reconstructed image G YX (G XY (Y)) so that the network maintains the characteristics of the target input as much as possible.
  • CycleGAN can use a least-square loss function to avoid network stability and mode collapse, and can be summarized as Equation 2 below.
  • the overall loss function can be expressed as Equation 3 by combining the least-square loss function and the cycle consistency loss for both directions.
  • FIG. 4 is a block diagram illustrating a configuration of a system for adjusting light intensity according to an exemplary embodiment.
  • the light intensity control system 100 is for maintaining the performance of the network through a generalization process based on GAN when data having a light intensity that is completely different from the data learned through the network is input. It may include 420 and an acquisition unit 430.
  • the receiver 410 may receive that a new data set having a distribution different from the light intensity distribution of the training data set for medical images is input.
  • the adjuster 420 may adjust the light intensity distribution of the received new data set based on a Generative Adversarial Network (GAN).
  • GAN Generative Adversarial Network
  • the controller 420 learns the non-corresponding data set composed of the received non-correspondence data set to CycleGAN to adjust the light intensity distribution of the received non-correspondence data set.
  • the controller 420 uses cycle-consistency, which means a loss between the original domain image and the reconstructed image generated through adjustment of the light intensity distribution to enable learning with the non-corresponding data set in CycleGAN. I can.
  • the adjusting unit 420 generates a fake image in the second domain in which the domain has been converted by adjusting the original image and the light intensity distribution in the first domain in CycleGAN, and re-creates the fake image in the second domain. By returning to the domain, a configured image in the first domain may be obtained.
  • the controller 420 may learn by using the corresponding data set from the GAN before the preset reference, and learn by using the non-corresponding data set from the GAN after the preset reference.
  • the acquisition unit 430 may obtain a classification result by passing a new data set whose light intensity distribution is adjusted through a classification network learned as a learning data set.
  • the apparatus described above may be implemented as a hardware component, a software component, and/or a combination of a hardware component and a software component.
  • the devices and components described in the embodiments are, for example, a processor, a controller, an arithmetic logic unit (ALU), a digital signal processor, a microcomputer, a field programmable gate array (FPGA). , A programmable logic unit (PLU), a microprocessor, or any other device capable of executing and responding to instructions, such as one or more general purpose computers or special purpose computers.
  • the processing device may execute an operating system (OS) and one or more software applications executed on the operating system. Further, the processing device may access, store, manipulate, process, and generate data in response to the execution of software.
  • OS operating system
  • the processing device may access, store, manipulate, process, and generate data in response to the execution of software.
  • the processing device is a plurality of processing elements and/or a plurality of types of processing elements. It can be seen that it may include.
  • the processing device may include a plurality of processors or one processor and one controller.
  • other processing configurations are possible, such as a parallel processor.
  • the software may include a computer program, code, instructions, or a combination of one or more of these, configuring the processing unit to operate as desired or processed independently or collectively. You can command the device.
  • Software and/or data may be interpreted by a processing device or, to provide instructions or data to a processing device, of any type of machine, component, physical device, virtual equipment, computer storage medium or device. Can be embodyed.
  • the software may be distributed over networked computer systems and stored or executed in a distributed manner.
  • Software and data may be stored on one or more computer-readable recording media.
  • the method according to the embodiment may be implemented in the form of program instructions that can be executed through various computer means and recorded in a computer-readable medium.
  • the computer-readable medium may include program instructions, data files, data structures, etc. alone or in combination.
  • the program instructions recorded on the medium may be specially designed and configured for the embodiment, or may be known and usable to those skilled in computer software.
  • Examples of computer-readable recording media include magnetic media such as hard disks, floppy disks, and magnetic tapes, optical media such as CD-ROMs and DVDs, and magnetic media such as floptical disks.
  • -A hardware device specially configured to store and execute program instructions such as magneto-optical media, and ROM, RAM, flash memory, and the like.
  • Examples of program instructions include not only machine language codes such as those produced by a compiler, but also high-level language codes that can be executed by a computer using an interpreter or the like.

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Medical Informatics (AREA)
  • Public Health (AREA)
  • General Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Radiology & Medical Imaging (AREA)
  • Surgery (AREA)
  • Physics & Mathematics (AREA)
  • Heart & Thoracic Surgery (AREA)
  • Animal Behavior & Ethology (AREA)
  • Pathology (AREA)
  • Biophysics (AREA)
  • Veterinary Medicine (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • Epidemiology (AREA)
  • Primary Health Care (AREA)
  • Image Analysis (AREA)
  • Measuring And Recording Apparatus For Diagnosis (AREA)
  • Optical Communication System (AREA)

Abstract

GAN을 이용한 의료 영상의 광강도 분포 일반화 기법이 개시된다. 일 실시예에 따른 광강도 분포 일반화 시스템에 의해 수행되는 광강도 분포 일반화 방법은, 의료 영상에 대한 의료 영상에 대한 학습 데이터 셋의 광강도 분포와는 다른 분포를 갖는 새로운 데이터 셋이 입력됨을 수신하는 단계; GAN(Generative adversarial network)에 기반하여 상기 수신된 새로운 데이터 셋의 광강도 분포를 조절하는 단계; 및 상기 광강도 분포가 조절된 새로운 데이터 셋을 상기 학습 데이터 셋으로 학습된 분류 네트워크를 통과시켜 분류 결과를 획득하는 단계를 포함할 수 있다.

Description

GAN을 이용한 의료 영상의 광강도 분포 일반화 기법
아래의 설명은 영상 정보의 광강도 분포를 조절하는 기술에 관한 것이다.
딥러닝(Deep learning)을 이용한 컴퓨터 보조 진단(Computer-aided diagnosis) 연구가 이미 많이 진행되고 있다. 특히 의료 영상 분야에서는 CNN(Convolutional neural network)을 이용하여 병변 분류나 구역화(Segmentation) 성능을 크게 발전시켰다. CNN은 이미지의 광강도 분포를 학습한다. 때문에 학습된 데이터 셋과 완전히 다른 광강도 분포를 보이는 입력이 들어오는 경우, CNN의 성능은 크게 저하될 수밖에 없다. 이러한 문제는 의료 영상 도메인에서 특히 크게 나타난다. 의료 영상은 일상적인 이미지와 달리 그레이 스케일(Gray scale)이며, 달리 복잡하고 디테일한 특징(feature)을 지닌다. 뿐만 아니라 의료 영상은 촬영 기계나 방사선사의 조작 방법 등에 따라 완전히 다른 광강도를 보인다. 사실상 모든 촬영 변수를 고려한 데이터 셋을 확보하기란 불가능하며, 새로운 광강도의 데이터가 들어올 때마다 네트워크를 다시 학습하는 것 역시 비효율적인 방법이다. 이에, 학습 데이터 셋과 다른 광강도를 보이는 입력에 대하여 광강도 일반화 작업을 수행하는 기술이 요구된다.
이미지의 광강도를 조절하는 전통적 방법으로는 히스토그램 매칭(Histogram matching)이 있다. 그러나 히스토그램 매칭은 이미지 단위가 아닌 데이터 셋 단위로는 적용하기 어렵다는 문제점이 있다. 광강도의 일반화는 임의의 이미지 셋을 특정한 학습된 도메인으로 변환하는 작업으로 생각할 수 있으며, 이를 이미지 대 이미지 변환(Image-to-Image translation)이라 한다. Image-to-Image translation는 최근 GAN(Generative adversarial network)과 VAE(Variational auto encoder)를 이용하여 활발히 연구되고 있다.
의료 영상에 GAN을 활용한 연구는 꾸준히 진행되어 왔다. 많은 연구는 GAN을 이용한 합성(Synthesis)을 통한 데이터 증대(Data argumentation)에 집중되어 있었다. 또한, 대부분의 실험 데이터가 MR과 CT 이미지에 집중된 경향을 보였다. 데이터 증대는 네트워크의 훈련 과정에 있어 중요한 부분이지만, 기존 CNN 네트워크의 성능 유지와는 연관이 없다. 또한 비교적 적은 비용으로 쉽게 접근할 수 있는 X-ray 데이터에 대한 연구도 적게 나타났다.
GAN을 이용한 의료 영상의 광강도 분포를 일반화하는 방법 및 시스템을 제공할 수 있다.
CNN 네트워크를 통해 학습한 데이터와 완전히 다른 광강도의 데이터가 입력됨을 수신하는 경우, GAN을 이용하여 일반화 과정을 통해 기존 네트워크의 성능을 유지하는 방법 및 시스템을 제공할 수 있다.
광강도 분포 일반화 시스템에 의해 수행되는 광강도 분포 일반화 방법은, 의료 영상에 대한 학습 데이터 셋의 광강도 분포와는 다른 분포를 갖는 새로운 데이터 셋이 입력됨을 수신하는 단계; GAN(Generative adversarial network)에 기반하여 상기 수신된 새로운 데이터 셋의 광강도 분포를 조절하는 단계; 및 상기 광강도 분포가 조절된 새로운 데이터 셋을 상기 학습 데이터 셋으로 학습된 분류 네트워크에 통과시켜 분류 결과를 획득하는 단계를 포함할 수 있다.
상기 광강도 분포를 조절하는 단계는, 상기 수신된 새로운 데이터 셋이 비대응 데이터 셋으로 구성된 경우, 상기 수신된 비대응 데이터 셋에 구성된 비대응 데이터 셋을 CycleGAN에 학습시켜 상기 수신된 비대응 데이터 셋의 광강도 분포를 조절하는 단계를 포함할 수 있다.
상기 광강도 분포를 조절하는 단계는, 상기 CycleGAN에서 비대응 데이터 셋으로 학습을 가능하게 하기 위하여 원본 도메인 이미지와 광강도 분포의 조절을 통하여 생성된 재구성된 이미지 사이의 손실을 의미하는 순환 일관성(cycle-consistency)을 사용하는 단계를 포함할 수 있다.
상기 CycleGAN은, 순방향 순환 일관성 손실(forward cycle-consistency loss) 및 역방향 순환 일관성 손실(backward cycle-consistency loss)을 포함하고, 상기 광강도 분포를 조절하는 단계는, 상기 CycleGAN에서 제1 도메인에서의 원본 이미지와 광강도 분포 조절을 통해 도메인이 변환된 제2 도메인에서의 가짜 이미지를 생성하고, 상기 생성된 제2 도메인에서의 가짜 이미지를 다시 제1 도메인으로 되돌려 상기 제1 도메인에서의 구성된 이미지를 획득하는 단계를 포함할 수 있다.
상기 광강도 분포를 조절하는 단계는, 기 설정된 기준 이전의 GAN에서 대응 데이터 셋을 사용하여 학습하고, 기 설정된 기준 이후의 GAN에서 비대응 데이터 셋을 사용하여 학습하는 단계를 포함하고, 대응 데이터란 임의의 도메인에 속하는 이미지 각각을 목표 도메인으로 변환한 데이터 쌍을 의미할 수 있다.
광강도 분포 일반화 시스템은, 의료 영상에 대한 학습 데이터 셋의 광강도 분포와는 다른 분포를 갖는 새로운 데이터 셋이 입력됨을 수신하는 수신부; GAN(Generative adversarial network)에 기반하여 상기 수신된 새로운 데이터 셋의 광강도 분포를 조절하는 조절부; 및 상기 광강도 분포가 조절된 새로운 데이터 셋을 상기 학습 데이터 셋으로 학습된 분류 네트워크에 통과시켜 분류 결과를 획득하는 획득부를 포함할 수 있다.
일 실시예에 따른 광강도 조절 시스템은 학습된 데이터 셋(이하, '학습 데이터 셋'으로 기재하기로 함)과 완전히 다른 광강도를 보이는 새로운 데이터 셋을 일반화하여 CNN 기반의 분류 네트워크의 성능을 유지할 수 있다.
도 1은 일 실시예에 따른 광강도 조절 시스템에서 의료 영상을 일반화하는 과정을 설명하기 위한 도면이다.
도 2는 일 실시예에 따른 광강도 조절 시스템에서 의료 영상의 광강도 분포를 일반화하는 방법을 설명하기 위한 흐름도이다.
도 3은 일 실시예에 따른 광강도 조절 시스템의 CycleGAN의 구조를 설명하기 위한 도면이다.
도 4는 일 실시예에 따른 광강도 조절 시스템의 구성을 설명하기 위한 블록도이다.
이하, 실시예를 첨부한 도면을 참조하여 상세히 설명한다.
도 1은 일 실시예에 따른 광강도 조절 시스템에서 의료 영상을 일반화하는 과정을 설명하기 위한 도면이다.
광강도 조절 시스템은 학습된 데이터 셋(이하, 학습 데이터 셋으로 기재하기로 함)의 광강도 분포와 다른 분포를 갖는 새로운 데이터 셋(101)이 입력됨을 수신할 수 있다. 광강도 조절 시스템은 새로운 데이터 셋(101)의 광강도 분포를 조절할 수 있다. 이때, 광강도 분포를 조절하는 방법으로 일반화(Generalize)가 수행될 수 있다. 예를 들면, 광강도 조절 시스템은 제너럴라이저(Generalizer)를 통하여 새로운 데이터 셋(101)을 일반화시킬 수 있다.
광강도 조절 시스템은 제너럴라이저를 통하여 타겟 분포에서의 새로운 데이터 셋을 일반화(102)시킬 수 있다. 광강도 조절 시스템은 학습 데이터 셋(103)으로 학습된 네트워크에 일반화된 타겟 분포에서의 새로운 데이터 셋을 학습시킬 수 있고, 학습을 수행함에 따라 타겟 분포에서의 새로운 데이터 셋을 분류하여 따라 학습 결과로서 분류 결과(104)를 획득할 수 있다.
도 2는 일 실시예에 따른 광강도 조절 시스템에서 의료 영상의 광강도 분포를 일반화하는 방법을 설명하기 위한 흐름도이다.
광강도 조절 시스템은 학습 데이터 셋의 광강도 분포와는 완전히 다른 광강도를 보이는 새로운 데이터 셋을 일반화하여 CNN 기반의 분류 네트워크의 성능을 유지할 수 있다.
광강도 조절 시스템은 학습 데이터 셋 D X으로 학습된 분류 네트워크에 대하여, 새로운 데이터 셋 y이 입력됨을 수신할 수 있다. 광강도 조절 시스템은 새로운 데이터 셋 y이 입력됨을 수신함에 따라 각각의 광강도 분포 p(y)와 p(D x)가 완전히 다른 경우(210), GAN 기반의 제너럴라이저(Generalizer)를 통해 일반화한 후(220), 일반화된 새로운 데이터 셋을 학습 데이터 셋으로 학습(230)된 분류 네트워크에 통과시켜 분류(240)함에 따라 분류 결과를 획득할 수 있다(240).
이때, 제너럴라이저(Generalizer)로서의 GAN은 비대응(unpaired) 데이터 셋으로 학습(training)이 가능해야 한다. 이미지 대 이미지 변환(Image-to-image translation)을 해결하기 위하여 초기의 GAN은 대응 데이터셋을 사용할 수 있다. 여기서, 대응 데이터란 임의의 x 도메인에 속하는 이미지 각각을 목표 도메인인 y로 변환한 데이터 쌍을 의미한다. 예를 들면, 동일한 환자를 두 개의 서로 다른 기계로 찍은 경우를 들 수 있다. 광강도 일반화 작업에서 대응 데이터 셋을 수집하는 것은 불가능하고 불필요한 일이기 때문에 실시예에서는 비대응 데이터 셋의 학습이 가능한 CycleGAN을 제너럴라이저(Generalizer)로써 사용할 수 있다.
CycleGAN은 많이 사용되는 이미지 대 이미지 변환(Image-to-image translation) GAN 중 하나이다. CycleGAN은 도메인 변환되어 출력된 이미지가 상기 이미지의 원본 입력의 특징을 유지하도록 한다. 도3을 참고하면, CycleGAN의 전반적인 구조를 나타낸 예이다. CycleGAN은 비대응 데이터 셋으로 학습을 가능하게 하기 위해 순환 일관성(cycle-consistency)을 사용하고 있다.
도 3(a)는 순방향 순환 일관성 손실(forward cycle-consistency loss)의 예이고, 도 3(b)는 역방향 순환 일관성 소실(backward cycle-consistency loss)의 예이다. 도 3(a)에서는 원본 도메인 이미지 X에서 타겟 도메인 이미지 Y로 변환한 것이고, 도 3(b)에서는 타겟 도메인 이미지 Y에서 원본 도메인 이미지X로 변환한 것이다.
순환 일관성(Cycle-consistency)은 원본 도메인 X에서의 이미지와 제너레이터(Generator)를 통해 생성된 재구성된 이미지(reconstructed image) 사이의 손실(loss)을 의미한다. 먼저, 제너레이터(Generator) G XY를 통해 도메인이 변환된 가짜 이미지 G XY(X)를 생성한 후, 생성된 가짜 이미지를 다시 원본 도메인 X로 되돌려 재구성된 이미지 G YX(G XY(X))를 획득할 수 있다. 순환 일관성 손실(Cycle-consistency loss)은 원본 입력과 재구성된 이미지 G YX(G XY(X)) 사이의 손실을 줄임으로써 네트워크가 최대한 원본 입력의 특징을 유지하도록 한다(도 3(a)).
타겟(목표) 도메인인 Y에 대해서도 동일하게 적용할 수 있다(도 3(b)). 순환 일관성은 타겟 도메인 Y에서의 이미지와 제너레이터를 통해 생성된 재구성된 이미지 사이의 손실을 의미한다. 먼저, 제너레이터 G YX를 통해 도메인이 변환된 가짜 이미지 G XY(Y)를 생성한 후, 생성된 가짜 이미지를 다시 타겟 도메인 Y로 되돌려 재구성된 이미지 G YX(G XY(Y))를 획득할 수 있다. 순환 일관성 손실(Cycle-consistency loss)은 타겟 입력과 재구성된 이미지 G YX(G XY(Y))사이의 손실을 줄임으로써 네트워크가 최대한 타겟 입력의 특징을 유지하도록 한다
이러한 과정을 수식으로 표현하면 수학식 1과 같다.
수학식 1:
Figure PCTKR2020011363-appb-img-000001
또한 CycleGAN은 네트워크의 안정성과 mode collapse를 피하기 위해 least-square loss function을 사용할 수 있으며, 아래의 수학식 2와 같이 정리될 수 있다.
수학식 2:
Figure PCTKR2020011363-appb-img-000002
이에 따라, 전체적인 손실 함수(loss function)은 양방향에 대한 least-square loss function과 cycle consistency loss를 합친 식으로 수학식 3과 같이 나타낼 수 있다.
수학식 3:
Figure PCTKR2020011363-appb-img-000003
도 4는 일 실시예에 따른 광강도 조절 시스템의 구성을 설명하기 위한 블록도이다.
광강도 조절 시스템(100)은 네트워크를 통하여 학습된 데이터와 완전히 다른 광강도를 가진 데이터가 입력되었을 경우, GAN에 기반한 일반화 과정을 통해 네트워크의 성능을 유지하기 위한 것으로, 수신부(410), 조절부(420) 및 획득부(430)를 포함할 수 있다.
수신부(410)는 의료 영상에 대한 학습 데이터 셋의 광강도 분포와는 다른 분포를 갖는 새로운 데이터 셋이 입력됨을 수신할 수 있다.
조절부(420)는 GAN(Generative adversarial network)에 기반하여 수신된 새로운 데이터 셋의 광강도 분포를 조절할 수 있다. 조절부(420)는 수신된 새로운 데이터 셋이 비대응 데이터 셋으로 구성된 경우, 수신된 비대응 데이터 셋에 구성된 비대응 데이터 셋을 CycleGAN에 학습시켜 수신된 비대응 데이터 셋의 광강도 분포를 조절할 수 있다. 조절부(420)는 CycleGAN에서 비대응 데이터 셋으로 학습을 가능하게 하기 위하여 원본 도메인 이미지와 광강도 분포의 조절을 통하여 생성된 재구성된 이미지 사이의 손실을 의미하는 순환 일관성(cycle-consistency)을 사용할 수 있다. 조절부(420)는 CycleGAN에서 제1 도메인에서의 원본 이미지와 광강도 분포 조절을 통해 도메인이 변환된 제2 도메인에서의 가짜 이미지를 생성하고, 생성된 제2 도메인에서의 가짜 이미지를 다시 제1 도메인으로 되돌려 제1 도메인에서의 구성된 이미지를 획득할 수 있다. 또한, 조절부(420)는 기 설정된 기준 이전의 GAN에서 대응 데이터 셋을 사용하여 학습하고, 기 설정된 기준 이후의 GAN에서 비대응 데이터 셋을 사용하여 학습할 수 있다.
획득부(430)는 광강도 분포가 조절된 새로운 데이터 셋을 학습 데이터 셋으로 학습된 분류 네트워크에 통과시켜 분류 결과를 획득할 수 있다.
이상에서 설명된 장치는 하드웨어 구성요소, 소프트웨어 구성요소, 및/또는 하드웨어 구성요소 및 소프트웨어 구성요소의 조합으로 구현될 수 있다. 예를 들어, 실시예들에서 설명된 장치 및 구성요소는, 예를 들어, 프로세서, 콘트롤러, ALU(arithmetic logic unit), 디지털 신호 프로세서(digital signal processor), 마이크로컴퓨터, FPGA(field programmable gate array), PLU(programmable logic unit), 마이크로프로세서, 또는 명령(instruction)을 실행하고 응답할 수 있는 다른 어떠한 장치와 같이, 하나 이상의 범용 컴퓨터 또는 특수 목적 컴퓨터를 이용하여 구현될 수 있다. 처리 장치는 운영 체제(OS) 및 상기 운영 체제 상에서 수행되는 하나 이상의 소프트웨어 애플리케이션을 수행할 수 있다. 또한, 처리 장치는 소프트웨어의 실행에 응답하여, 데이터를 접근, 저장, 조작, 처리 및 생성할 수도 있다. 이해의 편의를 위하여, 처리 장치는 하나가 사용되는 것으로 설명된 경우도 있지만, 해당 기술분야에서 통상의 지식을 가진 자는, 처리 장치가 복수 개의 처리 요소(processing element) 및/또는 복수 유형의 처리 요소를 포함할 수 있음을 알 수 있다. 예를 들어, 처리 장치는 복수 개의 프로세서 또는 하나의 프로세서 및 하나의 콘트롤러를 포함할 수 있다. 또한, 병렬 프로세서(parallel processor)와 같은, 다른 처리 구성(processing configuration)도 가능하다.
소프트웨어는 컴퓨터 프로그램(computer program), 코드(code), 명령(instruction), 또는 이들 중 하나 이상의 조합을 포함할 수 있으며, 원하는 대로 동작하도록 처리 장치를 구성하거나 독립적으로 또는 결합적으로(collectively) 처리 장치를 명령할 수 있다. 소프트웨어 및/또는 데이터는, 처리 장치에 의하여 해석되거나 처리 장치에 명령 또는 데이터를 제공하기 위하여, 어떤 유형의 기계, 구성요소(component), 물리적 장치, 가상 장치(virtual equipment), 컴퓨터 저장 매체 또는 장치에 구체화(embody)될 수 있다. 소프트웨어는 네트워크로 연결된 컴퓨터 시스템 상에 분산되어서, 분산된 방법으로 저장되거나 실행될 수도 있다. 소프트웨어 및 데이터는 하나 이상의 컴퓨터 판독 가능 기록 매체에 저장될 수 있다.
실시예에 따른 방법은 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다. 상기 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 매체에 기록되는 프로그램 명령은 실시예를 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다. 컴퓨터 판독 가능 기록 매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다.
이상과 같이 실시예들이 비록 한정된 실시예와 도면에 의해 설명되었으나, 해당 기술분야에서 통상의 지식을 가진 자라면 상기의 기재로부터 다양한 수정 및 변형이 가능하다. 예를 들어, 설명된 기술들이 설명된 방법과 다른 순서로 수행되거나, 및/또는 설명된 시스템, 구조, 장치, 회로 등의 구성요소들이 설명된 방법과 다른 형태로 결합 또는 조합되거나, 다른 구성요소 또는 균등물에 의하여 대치되거나 치환되더라도 적절한 결과가 달성될 수 있다.
그러므로, 다른 구현들, 다른 실시예들 및 특허청구범위와 균등한 것들도 후술하는 특허청구범위의 범위에 속한다.

Claims (6)

  1. 광강도 분포 일반화 시스템에 의해 수행되는 광강도 분포 일반화 방법에 있어서,
    의료 영상에 대한 학습 데이터 셋의 광강도 분포와는 다른 분포를 갖는 새로운 데이터 셋이 입력됨을 수신하는 단계;
    GAN(Generative adversarial network)에 기반하여 상기 수신된 새로운 데이터 셋의 광강도 분포를 조절하는 단계; 및
    상기 광강도 분포가 조절된 새로운 데이터 셋을 상기 학습 데이터 셋으로 학습된 분류 네트워크를 통과시켜 분류 결과를 획득하는 단계
    를 포함하는 광강도 분포 일반화 방법.
  2. 제1항에 있어서,
    상기 광강도 분포를 조절하는 단계는,
    상기 수신된 새로운 데이터 셋이 비대응 데이터 셋으로 구성된 경우, 상기 수신된 비대응 데이터 셋에 구성된 비대응 데이터 셋을 CycleGAN에 학습시켜 상기 수신된 비대응 데이터 셋의 광강도 분포를 조절하는 단계
    를 포함하는 광강도 분포 일반화 방법.
  3. 제2항에 있어서,
    상기 광강도 분포를 조절하는 단계는,
    상기 CycleGAN에서 비대응 데이터 셋으로 학습을 가능하게 하기 위하여 원본 도메인 이미지와 광강도 분포의 조절을 통하여 생성된 재구성된 이미지 사이의 손실을 의미하는 순환 일관성(cycle-consistency)을 사용하는 단계
    를 포함하는 광강도 분포 일반화 방법.
  4. 제3항에 있어서,
    상기 CycleGAN은, 순방향 순환 일관성 손실(forward cycle-consistency loss) 및 역방향 순환 일관성 손실(backward cycle-consistency loss)을 포함하고,
    상기 광강도 분포를 조절하는 단계는,
    상기 CycleGAN에서 제1 도메인에서의 원본 이미지와 광강도 분포 조절을 통해 도메인이 변환된 제2 도메인에서의 가짜 이미지를 생성하고, 상기 생성된 제2 도메인에서의 가짜 이미지를 다시 제1 도메인으로 되돌려 상기 제1 도메인에서의 구성된 이미지를 획득하는 단계
    를 포함하는 광강도 분포 일반화 방법.
  5. 제1항에 있어서,
    상기 광강도 분포를 조절하는 단계는,
    기 설정된 기준 이전의 GAN에서 대응 데이터 셋을 사용하여 학습하고, 기 설정된 기준 이후의 GAN에서 비대응 데이터 셋을 사용하여 학습하는 단계
    를 포함하고,
    대응 데이터란 임의의 x 도메인에 속하는 이미지 각각을 목표 도메인 y로 변환한 데이터 쌍을 의미하는
    것을 특징으로 하는 광강도 분포 일반화 방법.
  6. 광강도 분포 일반화 시스템에 있어서,
    학습 데이터 셋의 광강도 분포와는 다른 분포를 갖는 새로운 데이터 셋이 입력됨을 수신하는 수신부;
    GAN(Generative adversarial network)에 기반하여 상기 수신된 새로운 데이터 셋의 광강도 분포를 조절하는 조절부; 및
    상기 광강도 분포가 조절된 새로운 데이터 셋을 상기 학습 데이터 셋으로 학습된 분류 네트워크를 통과시켜 분류 결과를 획득하는 획득부
    를 포함하는 광강도 분포 일반화 시스템.
PCT/KR2020/011363 2019-09-10 2020-08-26 Gan을 이용한 의료 영상의 광강도 분포 일반화 기법 WO2021049784A2 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR10-2019-0112093 2019-09-10
KR1020190112093A KR102261111B1 (ko) 2019-09-10 2019-09-10 Gan을 이용한 의료 영상의 광강도 분포 일반화 기법

Publications (2)

Publication Number Publication Date
WO2021049784A2 true WO2021049784A2 (ko) 2021-03-18
WO2021049784A3 WO2021049784A3 (ko) 2021-05-06

Family

ID=74870012

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/KR2020/011363 WO2021049784A2 (ko) 2019-09-10 2020-08-26 Gan을 이용한 의료 영상의 광강도 분포 일반화 기법

Country Status (2)

Country Link
KR (1) KR102261111B1 (ko)
WO (1) WO2021049784A2 (ko)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113925509A (zh) * 2021-09-09 2022-01-14 杭州回车电子科技有限公司 基于脑电信号的注意力值计算方法、装置和电子装置
EP4095796A1 (de) 2021-05-29 2022-11-30 Bayer AG Maschinelles lernen im bereich der kontrastmittelverstärkten radiologie

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102616961B1 (ko) * 2021-08-31 2023-12-27 동국대학교 산학협력단 이종 캡슐내시경 간의 도메인 적응에 의한 병증정보 제공 방법

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101223681B1 (ko) * 2011-03-11 2013-01-21 한국외국어대학교 연구산학협력단 자기공명영상에서 연골 자동 영역화 장치 및 방법
CA2849119C (en) * 2011-09-20 2022-06-07 Ge Healthcare Limited Methods of spatial normalization of positron emission tomography images
KR102531819B1 (ko) * 2016-06-08 2023-05-16 리서치 디벨럽먼트 파운데이션 혈관내 광 간섭 단층촬영법을 사용한 자동 관상동맥 플라크 특징화 및 위험 평가를 위한 시스템들 및 방법들
KR102219890B1 (ko) * 2018-02-28 2021-02-24 서울대학교산학협력단 딥러닝을 이용한 의료영상의 공간 정규화 장치 및 그 방법

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP4095796A1 (de) 2021-05-29 2022-11-30 Bayer AG Maschinelles lernen im bereich der kontrastmittelverstärkten radiologie
WO2022253687A1 (de) 2021-05-29 2022-12-08 Bayer Aktiengesellschaft Maschinelles lernen im bereich der kontrastmittelverstärkten radiologie
CN113925509A (zh) * 2021-09-09 2022-01-14 杭州回车电子科技有限公司 基于脑电信号的注意力值计算方法、装置和电子装置
CN113925509B (zh) * 2021-09-09 2024-01-23 杭州回车电子科技有限公司 基于脑电信号的注意力值计算方法、装置和电子装置

Also Published As

Publication number Publication date
KR20210030669A (ko) 2021-03-18
WO2021049784A3 (ko) 2021-05-06
KR102261111B1 (ko) 2021-06-04

Similar Documents

Publication Publication Date Title
WO2021049784A2 (ko) Gan을 이용한 의료 영상의 광강도 분포 일반화 기법
JP7046240B2 (ja) 医療撮像および医療撮像情報の効率的共有
CN110188795B (zh) 图像分类方法、数据处理方法和装置
US10810735B2 (en) Method and apparatus for analyzing medical image
WO2018174623A1 (ko) 가상 3차원 심층 신경망을 이용하는 영상 분석 장치 및 방법
EP3816929B1 (en) Method and apparatus for restoring image
JP7206386B2 (ja) 画像処理モデルの訓練方法、画像処理方法、ネットワーク機器、及び記憶媒体
US20220222776A1 (en) Multi-Stage Multi-Reference Bootstrapping for Video Super-Resolution
Cheng et al. Implicit motion handling for video camouflaged object detection
WO2020125498A1 (zh) 心脏磁共振图像分割方法、装置、终端设备及存储介质
CN111340077B (zh) 基于注意力机制的视差图获取方法和装置
WO2021137454A1 (ko) 인공지능 기반의 사용자 의료정보 분석 방법 및 시스템
KR20190091806A (ko) 생성적 적대 네트워크를 이용한 비디오 시퀀스 생성 시스템 및 그 방법
US11449210B2 (en) Method for providing an image base on a reconstructed image group and an apparatus using the same
DE102021107509A1 (de) Multi-modell-trainingspipeline in verteilten systemen
WO2019124836A1 (ko) 제1 의료 영상의 관심 영역을 제2 의료 영상 위에 맵핑하는 방법 및 이를 이용한 장치
EP3859606A1 (en) Training program, training method, and information processing apparatus
Shin et al. SDC-UDA: volumetric unsupervised domain adaptation framework for slice-direction continuous cross-modality medical image segmentation
CN113239875A (zh) 人脸特征的获取方法、系统、装置及计算机可读存储介质
CN111340903A (zh) 基于非衰减校正pet图像生成合成pet-ct图像的方法和系统
CN109859314A (zh) 三维重建方法、装置、电子设备和存储介质
KR20200102961A (ko) 병변 진단 시스템 및 방법
Li et al. Scaling the inference of digital pathology deep learning models using cpu-based high-performance computing
CN111967529B (zh) 识别方法、装置、设备及系统
Tirupal et al. Multimodal medical image fusion based on fuzzy sets with orthogonal teaching–learning-based optimization

Legal Events

Date Code Title Description
NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 20864183

Country of ref document: EP

Kind code of ref document: A2