WO2021049784A2

WO2021049784A2 - Gan을 이용한 의료 영상의 광강도 분포 일반화 기법

Info

Publication number: WO2021049784A2
Application number: PCT/KR2020/011363
Authority: WO
Inventors: 신병석; 이연; 이동호
Original assignee: 인하대학교 산학협력단
Priority date: 2019-09-10
Filing date: 2020-08-26
Publication date: 2021-03-18
Also published as: KR20210030669A; WO2021049784A3; KR102261111B1

Abstract

GAN을 이용한 의료 영상의 광강도 분포 일반화 기법이 개시된다. 일 실시예에 따른 광강도 분포 일반화 시스템에 의해 수행되는 광강도 분포 일반화 방법은, 의료 영상에 대한 의료 영상에 대한 학습 데이터 셋의 광강도 분포와는 다른 분포를 갖는 새로운 데이터 셋이 입력됨을 수신하는 단계; GAN(Generative adversarial network)에 기반하여 상기 수신된 새로운 데이터 셋의 광강도 분포를 조절하는 단계; 및 상기 광강도 분포가 조절된 새로운 데이터 셋을 상기 학습 데이터 셋으로 학습된 분류 네트워크를 통과시켜 분류 결과를 획득하는 단계를 포함할 수 있다.

Description

GAN을 이용한 의료 영상의 광강도 분포 일반화 기법

아래의 설명은 영상 정보의 광강도 분포를 조절하는 기술에 관한 것이다.

딥러닝(Deep learning)을 이용한 컴퓨터 보조 진단(Computer-aided diagnosis) 연구가 이미 많이 진행되고 있다. 특히 의료 영상 분야에서는 CNN(Convolutional neural network)을 이용하여 병변 분류나 구역화(Segmentation) 성능을 크게 발전시켰다. CNN은 이미지의 광강도 분포를 학습한다. 때문에 학습된 데이터 셋과 완전히 다른 광강도 분포를 보이는 입력이 들어오는 경우, CNN의 성능은 크게 저하될 수밖에 없다. 이러한 문제는 의료 영상 도메인에서 특히 크게 나타난다. 의료 영상은 일상적인 이미지와 달리 그레이 스케일(Gray scale)이며, 달리 복잡하고 디테일한 특징(feature)을 지닌다. 뿐만 아니라 의료 영상은 촬영 기계나 방사선사의 조작 방법 등에 따라 완전히 다른 광강도를 보인다. 사실상 모든 촬영 변수를 고려한 데이터 셋을 확보하기란 불가능하며, 새로운 광강도의 데이터가 들어올 때마다 네트워크를 다시 학습하는 것 역시 비효율적인 방법이다. 이에, 학습 데이터 셋과 다른 광강도를 보이는 입력에 대하여 광강도 일반화 작업을 수행하는 기술이 요구된다.

이미지의 광강도를 조절하는 전통적 방법으로는 히스토그램 매칭(Histogram matching)이 있다. 그러나 히스토그램 매칭은 이미지 단위가 아닌 데이터 셋 단위로는 적용하기 어렵다는 문제점이 있다. 광강도의 일반화는 임의의 이미지 셋을 특정한 학습된 도메인으로 변환하는 작업으로 생각할 수 있으며, 이를 이미지 대 이미지 변환(Image-to-Image translation)이라 한다. Image-to-Image translation는 최근 GAN(Generative adversarial network)과 VAE(Variational auto encoder)를 이용하여 활발히 연구되고 있다.

의료 영상에 GAN을 활용한 연구는 꾸준히 진행되어 왔다. 많은 연구는 GAN을 이용한 합성(Synthesis)을 통한 데이터 증대(Data argumentation)에 집중되어 있었다. 또한, 대부분의 실험 데이터가 MR과 CT 이미지에 집중된 경향을 보였다. 데이터 증대는 네트워크의 훈련 과정에 있어 중요한 부분이지만, 기존 CNN 네트워크의 성능 유지와는 연관이 없다. 또한 비교적 적은 비용으로 쉽게 접근할 수 있는 X-ray 데이터에 대한 연구도 적게 나타났다.

GAN을 이용한 의료 영상의 광강도 분포를 일반화하는 방법 및 시스템을 제공할 수 있다.

CNN 네트워크를 통해 학습한 데이터와 완전히 다른 광강도의 데이터가 입력됨을 수신하는 경우, GAN을 이용하여 일반화 과정을 통해 기존 네트워크의 성능을 유지하는 방법 및 시스템을 제공할 수 있다.

광강도 분포 일반화 시스템에 의해 수행되는 광강도 분포 일반화 방법은, 의료 영상에 대한 학습 데이터 셋의 광강도 분포와는 다른 분포를 갖는 새로운 데이터 셋이 입력됨을 수신하는 단계; GAN(Generative adversarial network)에 기반하여 상기 수신된 새로운 데이터 셋의 광강도 분포를 조절하는 단계; 및 상기 광강도 분포가 조절된 새로운 데이터 셋을 상기 학습 데이터 셋으로 학습된 분류 네트워크에 통과시켜 분류 결과를 획득하는 단계를 포함할 수 있다.

상기 광강도 분포를 조절하는 단계는, 상기 수신된 새로운 데이터 셋이 비대응 데이터 셋으로 구성된 경우, 상기 수신된 비대응 데이터 셋에 구성된 비대응 데이터 셋을 CycleGAN에 학습시켜 상기 수신된 비대응 데이터 셋의 광강도 분포를 조절하는 단계를 포함할 수 있다.

상기 광강도 분포를 조절하는 단계는, 상기 CycleGAN에서 비대응 데이터 셋으로 학습을 가능하게 하기 위하여 원본 도메인 이미지와 광강도 분포의 조절을 통하여 생성된 재구성된 이미지 사이의 손실을 의미하는 순환 일관성(cycle-consistency)을 사용하는 단계를 포함할 수 있다.

상기 CycleGAN은, 순방향 순환 일관성 손실(forward cycle-consistency loss) 및 역방향 순환 일관성 손실(backward cycle-consistency loss)을 포함하고, 상기 광강도 분포를 조절하는 단계는, 상기 CycleGAN에서 제1 도메인에서의 원본 이미지와 광강도 분포 조절을 통해 도메인이 변환된 제2 도메인에서의 가짜 이미지를 생성하고, 상기 생성된 제2 도메인에서의 가짜 이미지를 다시 제1 도메인으로 되돌려 상기 제1 도메인에서의 구성된 이미지를 획득하는 단계를 포함할 수 있다.

상기 광강도 분포를 조절하는 단계는, 기 설정된 기준 이전의 GAN에서 대응 데이터 셋을 사용하여 학습하고, 기 설정된 기준 이후의 GAN에서 비대응 데이터 셋을 사용하여 학습하는 단계를 포함하고, 대응 데이터란 임의의 도메인에 속하는 이미지 각각을 목표 도메인으로 변환한 데이터 쌍을 의미할 수 있다.

광강도 분포 일반화 시스템은, 의료 영상에 대한 학습 데이터 셋의 광강도 분포와는 다른 분포를 갖는 새로운 데이터 셋이 입력됨을 수신하는 수신부; GAN(Generative adversarial network)에 기반하여 상기 수신된 새로운 데이터 셋의 광강도 분포를 조절하는 조절부; 및 상기 광강도 분포가 조절된 새로운 데이터 셋을 상기 학습 데이터 셋으로 학습된 분류 네트워크에 통과시켜 분류 결과를 획득하는 획득부를 포함할 수 있다.

일 실시예에 따른 광강도 조절 시스템은 학습된 데이터 셋(이하, '학습 데이터 셋'으로 기재하기로 함)과 완전히 다른 광강도를 보이는 새로운 데이터 셋을 일반화하여 CNN 기반의 분류 네트워크의 성능을 유지할 수 있다.

도 1은 일 실시예에 따른 광강도 조절 시스템에서 의료 영상을 일반화하는 과정을 설명하기 위한 도면이다.

도 2는 일 실시예에 따른 광강도 조절 시스템에서 의료 영상의 광강도 분포를 일반화하는 방법을 설명하기 위한 흐름도이다.

도 3은 일 실시예에 따른 광강도 조절 시스템의 CycleGAN의 구조를 설명하기 위한 도면이다.

도 4는 일 실시예에 따른 광강도 조절 시스템의 구성을 설명하기 위한 블록도이다.

이하, 실시예를 첨부한 도면을 참조하여 상세히 설명한다.

광강도 조절 시스템은 학습된 데이터 셋(이하, 학습 데이터 셋으로 기재하기로 함)의 광강도 분포와 다른 분포를 갖는 새로운 데이터 셋(101)이 입력됨을 수신할 수 있다. 광강도 조절 시스템은 새로운 데이터 셋(101)의 광강도 분포를 조절할 수 있다. 이때, 광강도 분포를 조절하는 방법으로 일반화(Generalize)가 수행될 수 있다. 예를 들면, 광강도 조절 시스템은 제너럴라이저(Generalizer)를 통하여 새로운 데이터 셋(101)을 일반화시킬 수 있다.

광강도 조절 시스템은 제너럴라이저를 통하여 타겟 분포에서의 새로운 데이터 셋을 일반화(102)시킬 수 있다. 광강도 조절 시스템은 학습 데이터 셋(103)으로 학습된 네트워크에 일반화된 타겟 분포에서의 새로운 데이터 셋을 학습시킬 수 있고, 학습을 수행함에 따라 타겟 분포에서의 새로운 데이터 셋을 분류하여 따라 학습 결과로서 분류 결과(104)를 획득할 수 있다.

광강도 조절 시스템은 학습 데이터 셋의 광강도 분포와는 완전히 다른 광강도를 보이는 새로운 데이터 셋을 일반화하여 CNN 기반의 분류 네트워크의 성능을 유지할 수 있다.

광강도 조절 시스템은 학습 데이터 셋 D _X으로 학습된 분류 네트워크에 대하여, 새로운 데이터 셋 y이 입력됨을 수신할 수 있다. 광강도 조절 시스템은 새로운 데이터 셋 y이 입력됨을 수신함에 따라 각각의 광강도 분포 p(y)와 p(D _x)가 완전히 다른 경우(210), GAN 기반의 제너럴라이저(Generalizer)를 통해 일반화한 후(220), 일반화된 새로운 데이터 셋을 학습 데이터 셋으로 학습(230)된 분류 네트워크에 통과시켜 분류(240)함에 따라 분류 결과를 획득할 수 있다(240).

이때, 제너럴라이저(Generalizer)로서의 GAN은 비대응(unpaired) 데이터 셋으로 학습(training)이 가능해야 한다. 이미지 대 이미지 변환(Image-to-image translation)을 해결하기 위하여 초기의 GAN은 대응 데이터셋을 사용할 수 있다. 여기서, 대응 데이터란 임의의 x 도메인에 속하는 이미지 각각을 목표 도메인인 y로 변환한 데이터 쌍을 의미한다. 예를 들면, 동일한 환자를 두 개의 서로 다른 기계로 찍은 경우를 들 수 있다. 광강도 일반화 작업에서 대응 데이터 셋을 수집하는 것은 불가능하고 불필요한 일이기 때문에 실시예에서는 비대응 데이터 셋의 학습이 가능한 CycleGAN을 제너럴라이저(Generalizer)로써 사용할 수 있다.

CycleGAN은 많이 사용되는 이미지 대 이미지 변환(Image-to-image translation) GAN 중 하나이다. CycleGAN은 도메인 변환되어 출력된 이미지가 상기 이미지의 원본 입력의 특징을 유지하도록 한다. 도3을 참고하면, CycleGAN의 전반적인 구조를 나타낸 예이다. CycleGAN은 비대응 데이터 셋으로 학습을 가능하게 하기 위해 순환 일관성(cycle-consistency)을 사용하고 있다.

도 3(a)는 순방향 순환 일관성 손실(forward cycle-consistency loss)의 예이고, 도 3(b)는 역방향 순환 일관성 소실(backward cycle-consistency loss)의 예이다. 도 3(a)에서는 원본 도메인 이미지 X에서 타겟 도메인 이미지 Y로 변환한 것이고, 도 3(b)에서는 타겟 도메인 이미지 Y에서 원본 도메인 이미지X로 변환한 것이다.

순환 일관성(Cycle-consistency)은 원본 도메인 X에서의 이미지와 제너레이터(Generator)를 통해 생성된 재구성된 이미지(reconstructed image) 사이의 손실(loss)을 의미한다. 먼저, 제너레이터(Generator) G _XY를 통해 도메인이 변환된 가짜 이미지 G _XY(X)를 생성한 후, 생성된 가짜 이미지를 다시 원본 도메인 X로 되돌려 재구성된 이미지 G _YX(G _XY(X))를 획득할 수 있다. 순환 일관성 손실(Cycle-consistency loss)은 원본 입력과 재구성된 이미지 G _YX(G _XY(X)) 사이의 손실을 줄임으로써 네트워크가 최대한 원본 입력의 특징을 유지하도록 한다(도 3(a)).

타겟(목표) 도메인인 Y에 대해서도 동일하게 적용할 수 있다(도 3(b)). 순환 일관성은 타겟 도메인 Y에서의 이미지와 제너레이터를 통해 생성된 재구성된 이미지 사이의 손실을 의미한다. 먼저, 제너레이터 G _YX를 통해 도메인이 변환된 가짜 이미지 G _XY(Y)를 생성한 후, 생성된 가짜 이미지를 다시 타겟 도메인 Y로 되돌려 재구성된 이미지 G _YX(G _XY(Y))를 획득할 수 있다. 순환 일관성 손실(Cycle-consistency loss)은 타겟 입력과 재구성된 이미지 G _YX(G _XY(Y))사이의 손실을 줄임으로써 네트워크가 최대한 타겟 입력의 특징을 유지하도록 한다

이러한 과정을 수식으로 표현하면 수학식 1과 같다.

수학식 1:

또한 CycleGAN은 네트워크의 안정성과 mode collapse를 피하기 위해 least-square loss function을 사용할 수 있으며, 아래의 수학식 2와 같이 정리될 수 있다.

수학식 2:

이에 따라, 전체적인 손실 함수(loss function)은 양방향에 대한 least-square loss function과 cycle consistency loss를 합친 식으로 수학식 3과 같이 나타낼 수 있다.

수학식 3:

광강도 조절 시스템(100)은 네트워크를 통하여 학습된 데이터와 완전히 다른 광강도를 가진 데이터가 입력되었을 경우, GAN에 기반한 일반화 과정을 통해 네트워크의 성능을 유지하기 위한 것으로, 수신부(410), 조절부(420) 및 획득부(430)를 포함할 수 있다.

수신부(410)는 의료 영상에 대한 학습 데이터 셋의 광강도 분포와는 다른 분포를 갖는 새로운 데이터 셋이 입력됨을 수신할 수 있다.

조절부(420)는 GAN(Generative adversarial network)에 기반하여 수신된 새로운 데이터 셋의 광강도 분포를 조절할 수 있다. 조절부(420)는 수신된 새로운 데이터 셋이 비대응 데이터 셋으로 구성된 경우, 수신된 비대응 데이터 셋에 구성된 비대응 데이터 셋을 CycleGAN에 학습시켜 수신된 비대응 데이터 셋의 광강도 분포를 조절할 수 있다. 조절부(420)는 CycleGAN에서 비대응 데이터 셋으로 학습을 가능하게 하기 위하여 원본 도메인 이미지와 광강도 분포의 조절을 통하여 생성된 재구성된 이미지 사이의 손실을 의미하는 순환 일관성(cycle-consistency)을 사용할 수 있다. 조절부(420)는 CycleGAN에서 제1 도메인에서의 원본 이미지와 광강도 분포 조절을 통해 도메인이 변환된 제2 도메인에서의 가짜 이미지를 생성하고, 생성된 제2 도메인에서의 가짜 이미지를 다시 제1 도메인으로 되돌려 제1 도메인에서의 구성된 이미지를 획득할 수 있다. 또한, 조절부(420)는 기 설정된 기준 이전의 GAN에서 대응 데이터 셋을 사용하여 학습하고, 기 설정된 기준 이후의 GAN에서 비대응 데이터 셋을 사용하여 학습할 수 있다.

획득부(430)는 광강도 분포가 조절된 새로운 데이터 셋을 학습 데이터 셋으로 학습된 분류 네트워크에 통과시켜 분류 결과를 획득할 수 있다.

이상에서 설명된 장치는 하드웨어 구성요소, 소프트웨어 구성요소, 및/또는 하드웨어 구성요소 및 소프트웨어 구성요소의 조합으로 구현될 수 있다. 예를 들어, 실시예들에서 설명된 장치 및 구성요소는, 예를 들어, 프로세서, 콘트롤러, ALU(arithmetic logic unit), 디지털 신호 프로세서(digital signal processor), 마이크로컴퓨터, FPGA(field programmable gate array), PLU(programmable logic unit), 마이크로프로세서, 또는 명령(instruction)을 실행하고 응답할 수 있는 다른 어떠한 장치와 같이, 하나 이상의 범용 컴퓨터 또는 특수 목적 컴퓨터를 이용하여 구현될 수 있다. 처리 장치는 운영 체제(OS) 및 상기 운영 체제 상에서 수행되는 하나 이상의 소프트웨어 애플리케이션을 수행할 수 있다. 또한, 처리 장치는 소프트웨어의 실행에 응답하여, 데이터를 접근, 저장, 조작, 처리 및 생성할 수도 있다. 이해의 편의를 위하여, 처리 장치는 하나가 사용되는 것으로 설명된 경우도 있지만, 해당 기술분야에서 통상의 지식을 가진 자는, 처리 장치가 복수 개의 처리 요소(processing element) 및/또는 복수 유형의 처리 요소를 포함할 수 있음을 알 수 있다. 예를 들어, 처리 장치는 복수 개의 프로세서 또는 하나의 프로세서 및 하나의 콘트롤러를 포함할 수 있다. 또한, 병렬 프로세서(parallel processor)와 같은, 다른 처리 구성(processing configuration)도 가능하다.

소프트웨어는 컴퓨터 프로그램(computer program), 코드(code), 명령(instruction), 또는 이들 중 하나 이상의 조합을 포함할 수 있으며, 원하는 대로 동작하도록 처리 장치를 구성하거나 독립적으로 또는 결합적으로(collectively) 처리 장치를 명령할 수 있다. 소프트웨어 및/또는 데이터는, 처리 장치에 의하여 해석되거나 처리 장치에 명령 또는 데이터를 제공하기 위하여, 어떤 유형의 기계, 구성요소(component), 물리적 장치, 가상 장치(virtual equipment), 컴퓨터 저장 매체 또는 장치에 구체화(embody)될 수 있다. 소프트웨어는 네트워크로 연결된 컴퓨터 시스템 상에 분산되어서, 분산된 방법으로 저장되거나 실행될 수도 있다. 소프트웨어 및 데이터는 하나 이상의 컴퓨터 판독 가능 기록 매체에 저장될 수 있다.

실시예에 따른 방법은 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다. 상기 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 매체에 기록되는 프로그램 명령은 실시예를 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다. 컴퓨터 판독 가능 기록 매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다.

이상과 같이 실시예들이 비록 한정된 실시예와 도면에 의해 설명되었으나, 해당 기술분야에서 통상의 지식을 가진 자라면 상기의 기재로부터 다양한 수정 및 변형이 가능하다. 예를 들어, 설명된 기술들이 설명된 방법과 다른 순서로 수행되거나, 및/또는 설명된 시스템, 구조, 장치, 회로 등의 구성요소들이 설명된 방법과 다른 형태로 결합 또는 조합되거나, 다른 구성요소 또는 균등물에 의하여 대치되거나 치환되더라도 적절한 결과가 달성될 수 있다.

그러므로, 다른 구현들, 다른 실시예들 및 특허청구범위와 균등한 것들도 후술하는 특허청구범위의 범위에 속한다.

Claims

광강도 분포 일반화 시스템에 의해 수행되는 광강도 분포 일반화 방법에 있어서,

의료 영상에 대한 학습 데이터 셋의 광강도 분포와는 다른 분포를 갖는 새로운 데이터 셋이 입력됨을 수신하는 단계;

GAN(Generative adversarial network)에 기반하여 상기 수신된 새로운 데이터 셋의 광강도 분포를 조절하는 단계; 및

상기 광강도 분포가 조절된 새로운 데이터 셋을 상기 학습 데이터 셋으로 학습된 분류 네트워크를 통과시켜 분류 결과를 획득하는 단계

를 포함하는 광강도 분포 일반화 방법.
제1항에 있어서,

상기 광강도 분포를 조절하는 단계는,

상기 수신된 새로운 데이터 셋이 비대응 데이터 셋으로 구성된 경우, 상기 수신된 비대응 데이터 셋에 구성된 비대응 데이터 셋을 CycleGAN에 학습시켜 상기 수신된 비대응 데이터 셋의 광강도 분포를 조절하는 단계

를 포함하는 광강도 분포 일반화 방법.
제2항에 있어서,

상기 광강도 분포를 조절하는 단계는,

상기 CycleGAN에서 비대응 데이터 셋으로 학습을 가능하게 하기 위하여 원본 도메인 이미지와 광강도 분포의 조절을 통하여 생성된 재구성된 이미지 사이의 손실을 의미하는 순환 일관성(cycle-consistency)을 사용하는 단계

를 포함하는 광강도 분포 일반화 방법.
제3항에 있어서,

상기 CycleGAN은, 순방향 순환 일관성 손실(forward cycle-consistency loss) 및 역방향 순환 일관성 손실(backward cycle-consistency loss)을 포함하고,

상기 광강도 분포를 조절하는 단계는,

상기 CycleGAN에서 제1 도메인에서의 원본 이미지와 광강도 분포 조절을 통해 도메인이 변환된 제2 도메인에서의 가짜 이미지를 생성하고, 상기 생성된 제2 도메인에서의 가짜 이미지를 다시 제1 도메인으로 되돌려 상기 제1 도메인에서의 구성된 이미지를 획득하는 단계

를 포함하는 광강도 분포 일반화 방법.
제1항에 있어서,

상기 광강도 분포를 조절하는 단계는,

기 설정된 기준 이전의 GAN에서 대응 데이터 셋을 사용하여 학습하고, 기 설정된 기준 이후의 GAN에서 비대응 데이터 셋을 사용하여 학습하는 단계

를 포함하고,

대응 데이터란 임의의 x 도메인에 속하는 이미지 각각을 목표 도메인 y로 변환한 데이터 쌍을 의미하는

것을 특징으로 하는 광강도 분포 일반화 방법.
광강도 분포 일반화 시스템에 있어서,

학습 데이터 셋의 광강도 분포와는 다른 분포를 갖는 새로운 데이터 셋이 입력됨을 수신하는 수신부;

GAN(Generative adversarial network)에 기반하여 상기 수신된 새로운 데이터 셋의 광강도 분포를 조절하는 조절부; 및

상기 광강도 분포가 조절된 새로운 데이터 셋을 상기 학습 데이터 셋으로 학습된 분류 네트워크를 통과시켜 분류 결과를 획득하는 획득부

를 포함하는 광강도 분포 일반화 시스템.