WO2017022882A1

WO2017022882A1 - 의료 영상의 병리 진단 분류 장치 및 이를 이용한 병리 진단 시스템

Info

Publication number: WO2017022882A1
Application number: PCT/KR2015/009447
Authority: WO
Inventors: 김효은; 황상흠; 백승욱; 이정인; 장민홍; 유동근; 팽경현; 박승균
Original assignee: 주식회사 루닛
Priority date: 2015-08-06
Filing date: 2015-09-08
Publication date: 2017-02-09
Also published as: KR101623431B1; US10013757B2; US20170236271A1

Abstract

본 발명은 의료 영상의 병리 진단 분류 장치 및 이를 이용한 병리 진단 시스템에 관한 것으로서, 입력 영상에 대한 특징 데이터를 특징 추출 변수에 의해 추출하는 특징 추출부; 상기 추출된 특징 데이터를 벡터 변환 변수에 의해 특징 벡터로 변환하는 특징 벡터 변환부; 및 상기 특징 벡터를 분류 변수에 의해 분류하여 입력 영상에 대한 병리 진단 분류 결과를 출력하는 벡터 분류부를 포함하고, 상기 특징 추출부, 특징 벡터 변환부 및 벡터 분류부는, 병변 유무 및 병리 진단 정보를 나타내는 제1 태그를 갖는 제1 태그드 영상과 제1 태그와 병변의 위치 정보를 나타내는 제2 태그를 함께 갖는 제2 태그드 영상과 태그 정보가 없는 영상에 의해 학습되는 것을 특징으로 하는 의료 영상의 병리 진단 분류 장치 및 이를 이용한 병리 진단 시스템을 제공한다.

Description

의료 영상의 병리 진단 분류 장치 및 이를 이용한 병리 진단 시스템

본 발명은 의료 영상의 병리 진단 분류 장치 및 이를 이용한 병리 진단 시스템에 관한 것으로서, 보다 상세하게는 머쉰-러닝(machine-learning)에 기초한 학습(learning)을 통해 의료 영상을 효율적으로 분류하고 병리 진단을 수행할 수 있는 장치 및 시스템에 관한 것이다.

병리학(pathology)이란, 조직 샘플을 육안이나 현미경을 통해 검사하고 이를 분석하여 이상 여부를 판별하는 의학의 분야이다. 예컨대, 암 진단 여부를 위해서는 해당 의심 조직의 조직 샘플을 현미경을 통해 병리학과 의사가 검사하고 암 세포의 존재 여부를 판단함으로써 암 진단을 내리게 된다. 이를 병리 진단이라고 하며, 이러한 병리 진단은 환자의 의심 병변에 대한 진단의 확정 절차로서 진단의 최종 단계라고 할 수 있다.

이러한 병리학적 진단을 컴퓨터 등의 장비에 의해 자동적으로 수행하기 위해서는, 입력되는 쿼리 영상을 비교 분석할 기존의 영상 및 그에 해당하는 병리 진단결과가 데이터베이스화된 영상 및 병리 진단 데이터가 필요하다.

분석 대상이 될 데이터베이스는, 정상 영상/이상 영상들과, 병변이 존재하는지의 여부, 병변의 병리 진단 결과와 해당 병변이 존재하는 위치에 대한 정보가 포함된 의료 영상을 저장해두어야 하며, 이것들과 입력되는 쿼리 영상에 대한 비교 분석을 수행해야 한다. 이러한 병변 존재 유무, 병변의 병리 진단 결과 및 위치 정보를 태그(tag) 정보라고 할 수 있는데, 비교 분석 대상이 될 데이터베이스는 이러한 태그 정보가 포함된 영상이 많으면 많을수록 보다 신뢰성을 가지게 될 것이다. 특히, 이러한 태그 정보가 포함된 영상을 이용하여 예컨대 머쉰-러닝(machine learning) 등과 같은 기술을 활용하여 방대한 양의 데이터로부터 학습을 수행하도록 하여 예측에 최적화된 정보만을 항상 유지하도록 하면 보다 정확한 결과를 예측해 낼 수 있다.

그러나, 종래의 기술로서는 이와 같이 의료 영상 분야에서 머쉰-러닝 등과 같은 학습 기술을 사용하여 의료 영상에 대한 분석 및 진단을 효율적으로 수행하여 병변의 병리 진단 결과를 예측할 수 있는 기술이 아직 제안되어 있지 않은 실정이다.

또한, 기존의 의료 시설에서 사용되는 각종 의료 영상들은 데이터베이스화되어 있지 않거나 체계화되어 있지 않은 경우가 많다. 특히, 영상 자체는 존재하더라도 해당 영상에 병변이 존재하는지의 여부, 병변의 병리 진단 결과와 병변의 위치에 대한 정보 즉, 태그 정보가 없는 경우가 대부분이다. 또한, 태그 정보가 존재하는 경우라도 병변의 위치 정보 없이 병변이 존재하는지의 여부 또는 해당 병변의 병리 진단 결과만을 나타내는 태그 정보만 존재하는 경우가 많아서 신뢰성 있는 데이터베이스를 구축하는데는 많은 어려움이 있다.

본 발명은 상기한 바와 같은 문제점을 해결하기 위한 것으로서, 의료 영상 분석을 위해 머쉰 러닝(machine learning)에 기반하여 효율적으로 학습되는 의료 영상의 병리 진단 분류 장치를 제공하는 것을 목적으로 한다.

또한, 본 발명은 적은 양의 병변의 위치 정보와 상대적으로 많은 양의 병변 유무 정보 및 병변의 병리 진단 결과를 병행하여 활용함으로써 학습 효율과 신뢰성을 높일 수 있는 의료 영상의 병리 진단 분류 장치를 제공하는 것을 또 다른 목적으로 한다.

또한, 본 발명은 상기한 바와 같은 병리 진단 분류 장치를 이용하여 병리 진단을 수행할 수 있는 병리 진단 시스템을 제공하는 것을 또 다른 목적으로 한다.

본 발명은 의료 영상의 병리 진단 분류 장치에 있어서, 입력 영상에 대한 특징 데이터를 특징 추출 변수에 의해 추출하는 특징 추출부; 상기 추출된 특징 데이터를 벡터 변환 변수에 의해 특징 벡터로 변환하는 특징 벡터 변환부; 및 상기 특징 벡터를 분류 변수에 의해 분류하여 입력 영상에 대한 병리 진단 분류 결과를 출력하는 벡터 분류부를 포함하고, 상기 특징 추출부, 특징 벡터 변환부 및 벡터 분류부는, 병변 유무 및 병리 진단 정보를 나타내는 제1 태그를 갖는 제1 태그드 영상과 제1 태그와 병변의 위치 정보를 나타내는 제2 태그를 함께 갖는 제2 태그드 영상과 태그 정보가 없는 영상에 의해 학습되는 것을 특징으로 하는 의료 영상의 병리 진단 분류 장치를 제공한다.

여기에서, 상기 특징 추출 변수는, 제2 태그드 영상에 의해 학습되고, 상기 변환 변수는, 제1 태그드 영상, 제2 태그드 영상 및 태그 정보가 없는 영상 중 적어도 하나에 의해 학습되고, 상기 분류 변수는, 제1 태그드 영상 및 제2 태그드 영상 중 적어도 하나에 의해 학습되는 것이 바람직하다.

또한, 상기 학습 모듈은, 상기 특징 추출부로 입력되는 입력 영상들의 부분 영상인 패치 영상을 형성하고, 상기 패치 영상들을 학습용 데이터와 검증용 데이터로 분리하고, 학습용 데이터에 대해서 비용 함수를 최소화하도록 특징 추출 변수 및 분류 변수를 조절하는 과정을 검증용 데이터에 대한 비용 함수가 최소로 되는 시점까지 반복 수행함으로써 특징 추출부의 특징 추출 변수를 조절하도록 구성할 수도 있다.

또한, 상기 학습 모듈은, 특징 추출 변수 및 분류 변수의 초기값을 설정하고, 현재의 특징 추출 변수 및 분류 변수에 기초한 특징 데이터와 분류 결과를 계산하는 제1 과정과, 비용 함수에 의해 특징 추출 변수 및 분류 변수에 대한 각각의 비용을 계산하는 제2 과정과, 상기 비용을 최소화할 수 있도록 특징 추출 변수 및 분류 변수의 변화량을 계산하여 기존 특징 추출 변수 및 분류 변수와의 차를 계산하여 특징 추출 변수 및 분류 변수를 갱신하는 제3과정을 반복 수행함으로써 특징 추출 변수 및 분류 변수를 조절하도록 구성할 수 있다.

또한, 상기 학습 모듈은, 입력 영상에 대한 복수개의 패치 영상을 상기 특징 추출부에 입력시켜 복수개의 특징 데이터를 추출하고, 상기 특징 데이터를 고정된 길이의 특징 벡터로 변환하기 위한 변환 변수를 추정함으로써 특징 벡터 변환부를 학습시키도록 할 수도 있다.

또한, 상기 학습 모듈은, 입력 영상들의 부분 영상인 패치 영상을 형성하고, 상기 패치 영상들을 학습용 데이터와 검증용 데이터로 분리하고, 학습용 데이터에 대해서 비용 함수를 최소화하도록 분류 변수를 조절하는 과정을 검증용 데이터에 대한 비용 함수가 최소로 되는 시점까지 반복 수행함으로써 벡터 분류부의 분류 변수를 조절하는 것이 바람직하다.

또한, 상기 학습 모듈은, 분류 변수의 초기값을 설정하고, 현재의 분류 변수에 기초한 분류 결과를 계산하는 제1 과정과, 비용 함수에 의해 분류 변수에 대한 각각의 비용을 계산하는 제2 과정과, 상기 비용을 최소화할 수 있도록 분류 변수의 변화량을 계산하여 기존 분류 변수와의 차를 계산하여 분류 변수를 갱신하는 제3과정을 반복 수행함으로써 분류 변수를 조절하는 것이 바람직하다.

또한, 상기 특징 추출부는 입력 영상에 대해 복수개로 분할된 패치 영상을 입력받아 각각의 패치 영상에 대한 특징 데이터를 특징 추출 변수에 의해 추출하고, 상기 특징 벡터 변환부는 상기 패치 영상에 대한 특징 데이터를 변환 변수에 의해 고정 길이의 특징 벡터로 변환하고, 상기 벡터 분류부는 상기 고정 길이의 특징 벡터를 분류 변수에 의해 분류하여 입력 영상에 대한 병리 진단 분류 결과를 출력하는 것이 바람직하다.

본 발명의 다른 측면에 의하면, 상기한 바와 같은 의료 영상의 병리 진단 분류 장치; 입력 영상에 대해 상기 의료 영상의 병리 진단 분류 장치로부터 출력되는 병리 진단 결과에 기초하여 입력 영상에 대한 최종 분석 정보를 출력하는 테스팅 모듈; 태그드 영상 데이터베이스에 저장된 태그드 영상에 기초하여 분류 장치를 학습시키는 학습 모듈; 및 병변 유무 및 병리 진단 정보를 나타내는 제1 태그를 갖는 제1 태그드 영상과 제1 태그와 병변의 위치 정보를 나타내는 제2 태그를 함께 갖는 제2 태그드 영상으로 구성된 태그드 영상을 저장하는 태그드 영상 데이터베이스를 포함하는 병리 진단 시스템을 제공한다.

본 발명에 의하면, 의료 영상 분석을 위해 머쉰 러닝(machine learning)에 기반하여 효율적으로 학습되는 의료 영상의 병리 진단 분류 장치를 제공할 수 있다.

또한, 본 발명은 적은 양의 병변의 위치 정보와 상대적으로 많은 양의 병변 유무 정보 및 병변의 병리 진단 결과를 병행하여 활용함으로써 학습 효율과 신뢰성을 높일 수 있는 의료 영상의 병리 진단 분류 장치를 제공할 수 있다.

또한, 본 발명은 상기한 바와 같은 병리 진단 분류 장치를 이용하여 병리 진단을 수행할 수 있는 병리 진단 시스템을 제공할 수 있다.

도 1은 본 발명에 의한 의료 영상의 병리 진단 분류 장치(100)의 구성을 나타낸 도면이다.

도 2는 본 발명에서 사용되는 태그를 설명하기 위한 도면이다.

도 3은 본 발명에 의한 분류 장치(100)를 포함하는 병리 진단 시스템(1000)의 전체적인 구성을 나타낸 도면이다.

도 4는 학습 모듈(300)에 의해 분류 장치(100)의 특징 추출부(10)의 특징 추출 변수를 학습하는 과정을 설명하기 위한 도면이다.

도 5는 학습 모듈(300)에 의해 특징 벡터 변환부(20)가 학습되는 과정을 설명하기 위한 도면이다.

도 6은 학습 모듈(300)에 의해 벡터 분류부(30)가 학습되는 과정을 설명하기 위한 도면이다.

도 7은 학습 과정이 완료된 분류 장치(100)에 의해 입력 영상에 대한 병리 진단 분류 결과를 출력하는 과정을 설명하기 위한 도면이다.

도 8은 본 발명에 의한 분류 장치(100) 및 시스템(1000)의 동작의 일예를 설명하기 위한 예시 화면이다.

이하, 첨부 도면을 참조하여 본 발명에 의한 실시예를 상세하게 설명하기로 한다.

도 1을 참조하면, 의료 영상의 병리 진단 분류 장치(100, 이하 간단히 "분류 장치(classifier,100)"라 한다)는, 특징 추출부(10), 특징 벡터 변환부(20) 및 벡터 분류부(30)를 포함한다.

특징 추출부(10)는, 입력 영상에 대한 특징 데이터를 특징 추출 변수에 의해 추출하고, 특징 벡터 변환부(20)는 상기 특징 추출부(10)에 의해 추출된 특징 데이터를 변환 변수에 의해 특징 벡터로 변환하며, 벡터 분류부(30)는 상기 특징 벡터 변환부(20)에서 변환된 특징 벡터를 분류 변수에 의해 분류하여 입력 영상에 대한 병리 진단 분류 결과를 출력하는 기능을 각각 수행한다.

여기에서 특징 추출 변수는 입력 영상에 대한 특징(feature)을 추출(extract)하기 위해 사용되는 변수(variables)를 의미하며, 변환 변수는 특징 데이터를 특징 벡터로 변환할 때 사용되는 변수를 말한다. 또한, 분류 변수는 특징 벡터를 분류하기 위해 사용되는 변수를 말한다.

이러한 분류 장치(100)는 학습 모듈(도 3 참조)에 의해 학습(learning)되면서 입력되는 의료 영상에 대한 병리 진단 분류 결과를 출력하는 것을 특징으로 한다. 여기서 병리 진단 분류 결과는 확률값으로 출력될 수 있다.

특히, 본 발명에 의한 분류 장치(100)의 특징 추출부(10), 특징 벡터 변환부(20) 및 벡터 분류부(30)는 병변 유무 및 병리 진단 정보를 나타내는 제1 태그(tag)를 갖는 제1 태그드 영상과 제1 태그와 병변의 위치 정보를 나타내는 제2 태그를 함께 갖는 제2 태그드 영상과 태그 정보를 갖지 않는 일반적인 의료 영상에 의해 학습이 이루어진다는 것을 특징으로 한다.

구체적으로는, 특징 추출부(10)에서 사용되는 특징 추출 변수는 제2 태그드 영상에 의해 학습되고, 특징 벡터 변환부(20)에서 사용되는 벡터 변환 변수는 태그 정보를 배제한 입력 영상 자체의 특성을 바탕으로 학습되기 때문에 태그 정보 유무와 상관없이 모든 의료 영상(즉, 제1 태그드 영상, 제2 태그드 영상 및 태그 정보가 없는 영상 중 적어도 하나)에 의해 학습되고, 벡터 분류부(30)에서 사용되는 분류 변수는 제1 태그드 영상과 제2 태그드 영상 중 적어도 어느 하나에 의해 학습되는 것을 특징으로 한다.

도 2는 유방 X-선 촬영 영상으로서, 흰색 사각형으로 나타낸 부분이 암세포 조직(병변)을 나타낸다. 이 때, 도 2의 영상에 대한 태그가 "유방암"만이 추가되어 있는 경우 이는 병변 유무 및 병리 진단 정보를 나타내기 때문에 제1 태그라고 하고 이러한 제1 태그가 부착된 영상이 제1 태그드 영상이다.

한편, 도 2의 영상에 대한 태그가 "유방암", "(x,y) 좌표값"이 부착되어 있는 경우 이는 병변 유무 및 병리 진단 정보와 함께 병변의 위치 정보(도 2에서 흰색 사각형의 좌표 값)까지 포함되어 있는 경우 제2 태그를 포함하기 때문에 이는 제2 태그드 영상이라고 한다.

학습 수행시 보다 높은 신뢰성을 갖기 위해서는 많은 양의 데이터가 필요한데 특히 병변의 위치 정보까지 포함되어 있는 제2 태그드 영상이 많을수록 학습의 효율이 높아지게 될 것이다. 그러나, 실제 태그 정보가 없거나 병변의 유무나 진단 정보만을 갖는 제1 태그드 영상인 경우가 대부분이고 병변의 위치 정보인 제2 태그 정보까지 갖는 제2 태그드 영상은 매우 제한적이어서 학습의 신뢰도를 저하시키는 요인이 되고 있다.

따라서, 본 발명의 분류 장치(100)는 제한된 숫자의 제2 태그드 영상과 상대적으로 많은 양의 제1 태그드 영상 및 태그 정보가 없는 영상을 학습시 사용되는 각 단계에서의 변수마다 적절하게 이용하여 보다 효율적으로 또한 신뢰성있게 학습을 수행할 수 있도록 하는 것을 특징으로 한다.

도 3을 참조하면, 병리 진단 시스템(1000, 이하 간단히 "시스템(1000)"이라 한다)은 분류 장치(100), 테스팅 모듈(200), 학습 모듈(300), 배치 생성기(400), 모니터링 에이전트(500) 및 태그드 영상 데이터베이스(600)를 포함한다.

분류 장치(100)는 전술한 바와 같이 입력 영상에 대한 특징 데이터를 추출하고 이를 특징 벡터로 변환한 후 특징 벡터를 분류함으로써 입력 영상에 대한 병리 진단 결과를 분류하는 동작을 수행한다.

테스팅 모듈(200)은 입력 영상을 수신하고 이를 분류 장치(100)에 의해 분류함으로써 병리 진단 결과를 출력받고, 이에 기초하여 입력 영상에 대한 최종적인 분석 정보(diagnosis result)를 출력하는 수단이다. 도시하지는 않았으나 테스팅 모듈(200)은 입력 영상을 시스템(1000)에서 사용할 수 있는 형태로 구조화하기 위한 전처리(pre-processing) 작업을 수행하는 전처리부를 포함할 수 있다.

분류 장치(100)는 입력 영상에 대한 병리 진단 분류 결과를 출력하는데 분류 결과는 병변의 유무를 나타내는 병변 유무 정보 및 병변의 병리 진단 결과 정보이거나 이들 정보와 함께 병변의 위치를 나타내는 병변 위치 정보를 확률값으로 출력할 수 있다. 테스팅 모듈(200)은 이러한 분류 결과를 전달받아 분류 결과와 관련된 기타 분석 정보를 생성, 처리 및 가공하여 입력 영상에 대한 최종 분석 결과를 생성한다.

여기에서, 기타 분석 정보는 입력 영상에 대한 병변 위치의 갯수, 병변 위치의 갯수를 고려한 최종 병리 진단 결과를 포함하는 종합적인 진단 정보(이상 여부 등)를 포함할 수 있다. 또한, 분류 장치(100)에서 출력되는 병변의 확률값에 기초하여 최종 병리 진단 결과 정보를 확률값으로 나타내어 이를 기타 분석 정보에 포함시킬 수도 있다.

학습 모듈(300)은 태그드 영상 데이터베이스(600)에 저장된 태그드 영상에 기초하여 분류 장치(100)를 학습시키기 위한 모듈이다. 학습 모듈(300)은 후술하는 배치 생성기(400)에서 생성된 배치 데이터를 입력받아서 이에 의해 분류 장치(100)를 학습시킨다. 학습 모듈(300)이 분류 장치(100)를 학습시키는 과정은 도 4 이하를 참조하여 구체적으로 설명하기로 한다.

한편, 배치 생성기(batch generator, 400)는 태그드 영상 데이터베이스(600)에 저장된 태그드 영상들의 묶음(영상 및 해당 영상의 태그 정보를 포함)인 배치 데이터를 생성하고 이를 학습 모듈(300)로 전송함으로써 분류 장치(100)를 상기 배치 데이터에 의해 학습할 수 있도록 하는 기능을 담당한다.

모니터링 에이전트(500)는 시스템(1000)의 각 구성 요소들의 동작을 모니터링하고 이들의 전체적인 동작을 제어한다.

모니터링 에이전트(500)는 학습 모듈(300)과 관련하여 학습 모듈(300) 및 분류 장치(100)의 동작을 모니터링하면서, 학습 시작 시점 및 종료 시점을 결정하고, 재학습 시작 시점 및 종료 시점을 결정하고, 현재 학습 상태 정보도 학습 모듈(300)로부터 수신한다.

또한, 배치 생성기(400)에 대해서 배치 데이터의 생성 지시 송신 및 완료 신호를 수신함으로써 배치 생성기(400)의 동작을 제어한다.

또한, 테스팅 모듈(200)이 현재 상태의 분류 장치(100)의 성능을 확인하도록 하는 지시를 전송하고 테스팅 모듈(200)로부터 분류 장치(100)의 상태 정보를 수신한다.

태그드 영상 데이터베이스(600)는 태그드(tagged) 영상을 저장하는 데이터베이스이다. 전술한 바와 같이 태그드 영상은 병변 유무 및 병리 진단 정보를 나타내는 제1 태그를 갖는 제1 태그드 영상과 제1 태그와 병변의 위치 정보를 나타내는 제2 태그를 함께 갖는 제2 태그드 영상으로 구성된다.

한편, 도시하지는 않았으나, 시스템(100)은 분류 변수 학습시에 사용되는 태그 정보가 없는 영상을 저장하는 언태그드 영상 데이터베이스를 포함할 수 있다.

이러한 구성의 시스템(1000)에서 이루어지는 학습 과정에 대해 도 4 이하를 참조하여 보다 상세하게 설명하기로 한다.

도 4는 특징 추출부(10)로 입력되는 입력 영상들의 묶음인 배치 데이터를 나타낸 것으로서 이들은 전술한 바와 같이 태그드 영상 데이터베이스(600)에 저장된 태그드 영상에 의해 배치 생성기(400)에서 생성되어 특징 추출부(10)로 입력된다.

전술한 바와 같이, 특징 추출부(10)의 학습은 제2 태그드 영상에 의해 수행되는데 제2 태그드 영상은 병변 유무 및 병리 진단 정보를 나타내는 제1 태그와 병변의 위치 정보를 나타내는 제2 태그를 모두 갖는 태그드 영상을 말한다.

도 4의 (a)는 이러한 제2 태그드 영상 중에서 양성인 영상의 묶음이고, (b)는 음성인 영상의 묶음을 나타낸다.

도 4의 (a)에서 원은 병변의 위치를 나타내며 이들 영상들은 해당 병변의 위치 정보를 예컨대 (x,y) 좌표값의 형태로 태그로서 가지고 있다.

또한, 도 4에서 실선 및 점선 사각형은 각각의 영상에서 조각 형태로 분리된 패치(patch) 영상을 의미하는데 실선 사각형은 음성을 의미하며 점선 사각형은 양성을 의미한다.

도 4의 (a)는 양성인 영상이지만 이들 중에서 패치 영상은 양성 또는 음성일 수 있다. 도 4에서 전체 패치 영상이 n+m개라 할 때 도 4의 (a)에서 양성 패치 영상은 n개이고 음성 패치 영상은 k개이며, 도 4의 (b)에서 음성 패치 영상은 m-k개이고 양성 패치 영상은 0개이다.

여기에서 각각의 패치 영상들의 크기는 서로 다를 수 있으며, 형태 또한 예컨대 직사각형 또는 정사각형 등과 같이 다양한 형태가 가능하다.

이러한 n+m개의 패치 영상들을 특징 추출부(10)에 입력하면서 학습을 수행하는데 이는 다음과 같은 과정을 통해 이루어진다.

우선, 학습 모듈(300)은 상기 패치 영상들을 학습용 데이터와 검증용 데이터로 분리한다. 학습용 데이터는 학습에 직접적으로 사용되는 데이터이고 검증용 데이터는 학습이 제대로 이루어졌는지를 검증하기 위한 데이터이다.

그리고, 학습 모듈(300)은 학습용 데이터에 대해서 비용 함수(cost function)를 최소화하도록 특징 추출 변수 및 분류 변수를 조절하는 과정을 검증용 데이터에 대한 비용 함수가 최소로 되는 시점까지 반복 수행함으로써 특징 추출부(10)의 특징 추출 변수를 학습시킨다.

여기에서, 특징 추출 변수라 함은, 특징 데이터를 추출하기 위한 변수(variable)를 의미하는데, 이는 다음과 같이 구성될 수 있다.

예를 들어, 입력 영상 X가 k-by-k 픽셀(pixel)로 구성될 경우, 입력 영상 X는 다음과 같은 k²-차원의 벡터로 표현할 수 있다.

X = (x_11,x_12,…,x_1k,x_21,x_22,…,x_2k,…,x_k1,x_k2,…,x_kk)

이 때, X를 구성하는 각 요소 x_ij는 (i,j) 번째 픽셀값을 의미하며, i,j 는 1~k까지의 값을 갖는 정수이다. k는 입력 영상의 차원(dimension)을 의미하는데, 본 수식에서는 편의상 입력 영상은 정사각형 영상으로 가정하였다.

앞서 정의한 입력 영상으로부터 특징(feature)을 추출해주는 변수인 특징 추출 변수를 P_feature라고 할 때, 특징 추출 함수(f_feature)는 다음과 같이 표현될 수 있다.

feature = f_feature(X, P_feature)

예를 들어, 특징 추출 함수(f_feature)가 입력 벡터 X의 각 구성 성분 x_ij들과 특징 추출 변수(P_feature)의 각 구성 성분들(pf_ij)과의 선형 조합으로 표현되는 함수라고 가정할 경우,

feature = f_feature(X, P_feature)

= pf_11*x_11 + pf_12*x_12 + … + pf_kk*x_kk

로 표현할 수 있으며, 실제 사용하는 특징 추출 함수(f_feature)는 알고리즘의 복잡도를 반영한 선형, 비선형 함수의 조합으로 표현될 수 있다.

한편, 분류 변수는 분류 결과를 출력하기 위한 변수를 의미하는데, 예를 들어 입력 영상 X로부터 추출된 특징(feature)을 m-차원의 벡터라고 가정할 경우,

feature = (f_1, f_2, … , f_m)

으로 표현할 수 있고, m-차원의 벡터로부터 분류 결과를 출력하는 변수를 P_classification이라고 할 경우, 분류 함수(f_classification)는 다음과 같이 표현될 수 있다.

classification result = f_classification(feature, P_classification)

예를 들어, 분류 함수(f_classification)이 입력 특징 벡터(feature)의 각 구성 성분과 분류 변수(P_classification)의 각 구성성분과의 선형 조합으로 표현되는 함수라고 가정할 경우,

classification result = f_classification(feature, P_classification)

= pc_1*f_1 + pc_2*f_2 + … + pc_m*f_m

으로 표현할 수 있으며, 실제 사용하는 분류 함수(f_classification)은 알고리즘의 복잡도를 반영한 선형, 비선형 함수의 조합으로 표현될 수 있다.

이러한 특징 추출 변수 및 분류 변수를 학습 모듈(300)이 학습시키는 과정은 다음과 같이 이루어진다.

우선, 학습 모듈(300)은 다음과 같이 특징 추출 변수와 분류 변수의 초기값을 설정한다.

P_feature = P_feature_init

P_classfication = P_classification_init

여기서, P_feature는 특징 추출 변수를 의미하며, P_feature_init은 특징 추출 변수의 초기값을 말한다.

또한, P_classfication은 분류 변수를 의미하며, P_classification_init은 분류 변수의 초기값을 의미한다.

다음으로, 다음과 같이 특징 데이터와 분류 결과를 연산한다.

feature = f_feature(X, P_feature)

classification result = f_classification(feature, P_classification)

여기에서, f_feature는 주어진 입력 영상 X로부터 P_feature를 특징 추출 변수로 할 때 특징 데이터를 출력하기 위한 함수를 의미하고, feature는 상기 함수에 의해 출력되는 특징 데이터를 의미한다.

또한, f_classification은 상기 계산된 특징 데이터 및 분류 변수에 의해 분류 결과를 출력하기 위한 함수를 의미하고, classification result은 상기 함수에 의해 출력되는 분류 결과를 의미한다.

다음으로, 학습 모듈(300)은 입력 영상으로부터 예측된 classification result와 입력 영상에 대한 병리 판독 결과(태그)로부터 비용 함수(cost function)를 정의할 수 있으며, 현재까지 학습된 특징 추출 변수 및 분류 변수로부터 비용(cost)을 계산한다. 계산된 비용은 현재까지 학습된 특징 추출 변수 및 분류 변수의 예측 오류를 정량화한 값을 의미하며, 비용이 낮을수록 예측 정확도가 높아진다.

비용 함수는 현재의 변수 즉, 특징 추출 변수 및 분류 변수를 기준으로 생성된 결과값(result)과 실제 정보(true label, 제1 및 제2 태그 정보)의 값을 비교하여 이들의 오차를 수치화한 함수로서, cost(classification result, true label)로 표현할 수 있다. 이러한 비용 함수에 의해 리턴된 결과값이 비용(cost)이 된다.

이 때, 현재까지 학습된 변수들로부터 추정되는 결과값(classification result)은 해당 입력이 양성일 확률(0: 음성, 1: 양성일 경우, classification result는 0~1 사이의 확률값으로 출력되며, 1에 가까울수록 양성일 확률이 높아짐)을 의미하며, 0 혹은 1의 값을 갖는 true label과의 차이를 정량화하여 비용을 도출할 수 있다.

이러한 비용 함수는 예컨대, 각 입력 영상 X에 대한 classification result (R) 및 true label (L) 로부터 squared_error_cost = (R-L)² 등과 같은 함수를 사용할 수 있으며 종래 기술에 의해 알려져 있는 어떠한 것이라도 그대로 사용할 수 있으므로 이에 대한 상세 설명은 생략한다.

다음으로, 학습 모듈(300)은 비용 함수에 의해 계산된 비용(cost)을 최소화할 수 있도록 현재 변수 기준으로 변수의 변화량을 계산(delta_P_feature, delta_P_classification)하고, 변수 즉, 특징 추출 변수 및 분류 변수를 각각 아래와 같은 방식으로 갱신(update)한다.

P_feature(new) = P_feature(old) - delta_P_feature

P_classification(new)= P_classification(old) - delta_P_classification

이후, 다시 상기 특징 데이터와 분류 결과를 연산하는 과정으로 돌아가서 이후의 과정을, 일정 주기마다 학습에 사용되지 않은 검증용 데이터에 대한 비용 함수에 의해 계산되는 비용(cost)이 최소가 되는 시점까지 반복 수행함으로써 특징 추출 변수 및 분류 변수를 조절한다.

이와 같은 과정을 수행하게 되면, 분류 장치(100)는 분류하기 용이한 형태의 특징 데이터가 추출될 수 있도록 하는 특징 추출 변수가 학습될 것이고 또한 추출된 특징 데이터를 잘 분류할 수 있도록 하는 분류 변수가 학습된다.

한편, 여기에서 분류 변수의 학습은 특징 추출 변수를 학습하기 위한 것으로서, 후술하는 벡터 분류부(30)에서 상기 단계에서 학습된 분류 변수는 무시하고 새로 분류 변수를 학습하게 된다.

다음으로, 도 5를 참조하여 특징 벡터 변환부(20)를 학습시키는 과정에 대해서 설명한다.

우선, 학습 모듈(300)은 입력 영상들 각각에 대해 복수개(K개)의 패치 영상을 분할 생성하고 각각의 패치 영상들을 특징 추출부(10)로 입력시켜서 각각의 패치 영상에 대한 특징 데이터를 추출하고 패치 영상들의 특징 데이터의 집합으로 입력 영상에 대한 특징 데이터를 생성한다. 상기 특징 추출부(10)는 도 4에서 설명한 바와 같은 과정을 통해 학습이 완료된 상태이다.

여기에서, 입력 영상들에 대한 패치 영상의 숫자는 동일할 필요는 없다. 예컨대, 영상 A에 대해서는 10개의 패치 영상을, 영상 B에 대해서는 20개의 패치 영상을 형성할 수 있다.

또한, 특징 벡터 변환부(20)는 태그 정보를 배제한 입력 데이터 자체가 갖는 통계적 특성을 학습하기 때문에, 여기에서의 입력 영상은 제1 태그드 영상, 제2 태그드 영상 및 태그 정보가 없는 영상 중 어느 것을 사용해도 좋다. 즉, 특징 벡터 변환부(20)의 변환 변수는 제1 태그드 영상, 제2 태그드 영상 및 태그 정보가 없는 영상 중 어느 것에 의해서도 학습될 수 있다는 점을 특징으로 한다.

도 5에 나타낸 바와 같이, 영상 A로부터 10개의 패치 영상이 특징 추출부(10)로 입력되면 도 4에서 설명한 바와 같은 과정을 통해 학습된 특징 추출 변수에 의해 특징 추출부(10)는 각각의 패치 영상에 대한 특징 데이터를 추출하여 출력한다. 이는 {imgA_f1, imgA_f2, … , imgA_f10}로 나타낼 수 있다. 여기에서 f1은 각각의 패치 영상에 대한 특징 데이터를 의미한다.

또한, 영상 B로부터 20개의 패치 영상이 특징 추출부(10)로 입력되면 특징 추출부(10)는 각각의 패치 영상에 대한 특징 데이터를 추출하여 출력하고 이는 {imgB_f1, imgB_f2, … , imgB_f10, … , imgB_f20}로 나타낼 수 있다.

학습 모듈(300)은 이와 같이 각각의 영상에 대해 추출되는 K개의 특징 데이터를 특징 벡터 변환부(20)가 고정된 길이의 벡터(L-dimensional vector)로 변환할 수 있도록 변환 변수를 학습시킨다.

변환 변수를 학습시키는 과정은 종래 기술에 의해 알려져 있는 방법을 사용할 수 있는데, 예컨대 다음과 같은 방식을 사용할 수 있다.

임의의 패치 영상으로부터 추출된 m-차원 특징 데이터를 f라고 할 경우, 전체 학습용 영상들로부터 추출된 N개의 패치 영상에 대해 N개의 m-차원 특징 데이터 f1, f2, … , fN이 추출됐다고 가정한다. 이 때, N개의 특징 데이터들이 L개의 가우시안(Gaussian) 함수의 선형 조합을 따른다고 가정할 경우, N개의 특징 데이터들을 가장 잘 표현할 수 있는 L개의 가우시안 함수에 대한 변수들 (변환 변수: L개의 평균값 및 L개의 분산 값)을 추정할 수 있다.

이렇게 추정된 변환 변수들로부터, 새로 들어오는 입력 특징 데이터 f_new가 각각의 가우시안 함수를 따르는 정도(가중치)를 수치화했을 때, f_new를 L개의 가중치값으로 표현할 수 있으며, 하나의 입력영상을 구성하는 K개의 패치 영상으로부터 추출된 K개의 특징 데이터에 대해 K개의 L-차원 벡터를 생성할 수 있다.

추출된 K개의 L-차원 벡터들을 fc_1, fc_2, … , fc_K라고 할 경우, 최종 단일 L-차원 벡터 fc_final = (fc_1 + fc2 + … + fc_K)/K 로 표현할 수 있다.

상기 예는 다수의 입력 데이터들로부터 입력 데이터의 통계적 특성을 반영하여 고정된 차원의 단일 벡터를 추출하는 하나의 예시이며, 입력 데이터의 통계적 특성을 반영함과 동시에 고정된 차원의 단일 벡터를 생성할 수 있는 기타 모든 종류의 학습 방법을 사용할 수도 있음은 물론이다.

이와 같은 과정을 수행하면, 각각의 영상에 대해 고정된 길이의 특징 벡터를 추출하기에 적합한 변환 변수가 추정된다.

도 6을 참조하면, 학습 모듈(300)은 입력 영상으로부터 복수개(K개)의 패치 영상을 특징 추출부(10)로 입력시켜 특징 데이터를 획득하고 이를 특징 벡터 변환부(20)를 통해 특징 벡터로 변환시킨다. 여기서 특징 추출부(10)와 특징 벡터 변환부(20)는 도 4 및 도 5를 참조하여 설명한 바와 같은 과정을 통해 특징 추출 변수 및 변환 변수가 학습되어 있는 상태이다.

특징 벡터 변환부(20)는 전술한 바와 같이 고정된 길이의 특징 벡터(L dimensional vector)를 출력하는데, 학습 모듈(300)은 이 고정 길이의 특징 벡터를 벡터 분류부(30)로 입력시키면서 분류 변수를 학습시킨다.

분류 변수를 학습하는 과정은 도 4에서 설명한 바와 마찬가지 방식을 사용할 수 있다.

즉, 입력 영상들(또는 패치 영상)을 학습용 데이터와 검증용 데이터로 분리하고, 학습용 데이터에 대해서 비용 함수를 최소화하도록 분류 변수를 조절하는 과정을 반복하는데 이 과정을 검증용 데이터에 대한 비용 함수가 최소로 되는 시점까지 반복적으로 수행함으로써 분류 변수를 학습시킬 수 있다.

구체적인 방법은 도 4에서 설명한 바와 마찬가지이므로 상세 설명은 생략한다.

이와 같은 과정을 수행하면, 벡터 분류부(30)에서 병리 진단 결과를 출력하기 위해 사용되는 분류 변수가 조절됨으로써 학습되고 이에 의해 분류 장치(100)의 학습 과정이 종료된다.

도 7을 참조하면, 입력 영상은 전술한 바와 같이 K개의 패치 영상으로 분할되어 특징 추출부(10)로 입력된다.

특징 추출부(10)는 앞서 살펴 본 바와 같이 학습된 특징 추출 변수에 의해 특징 데이터를 추출한다. 추출된 특징 데이터는 특징 벡터 변환부(20)로 입력된다. 전술한 바와 같이 특징 데이터는 각각의 패치 영상에 대해 추출되어 입력 영상별로 K개의 특징 데이터의 집합으로 구성된다.

특징 벡터 변환부(20)는 전술한 바와 같이 입력 영상별 K개의 특징 데이터들을 학습되어 있는 변환 변수에 기초하여 고정 길이의 특징 벡터(L-dimensional vector)로 변환한다.

고정 길이의 특징 벡터는 벡터 분류부(30)로 입력되고 벡터 분류부(30)는 입력되는 고정 길이 특징 벡터를 분류 변수에 의해 분류하고 병리 진단 분류 결과를 출력한다. 여기서 병리 진단 분류 결과는 확률값으로 주어질 수 있다.

이에 의하면, 하나의 입력 영상에 대해서 복수개의 패치 영상으로 분할하고 이를 기초로 분류한 후 하나의 입력 영상에 대한 병리 진단 분류 결과를 출력할 수 있다. 이 때의 병리 진단 분류 결과는 병변의 유무 및 병리 진단 정보 즉, 제1 태그에 해당하는 정보일 수 있다.

한편, K=1인 경우 즉, 하나의 입력 영상에 대해서 패치 영상이 하나인 경우에는 해당 패치 영상에 대한 병리 진단 분류 결과를 출력할 수 있으며 이 결과를 바탕으로 병변의 위치 정보를 추정할 수 있게 된다. 이에 의하여, 병변의 위치 정보를 알 수 있으므로 제2 태그 정보까지 획득할 수 있다.

도 8의 (a)는 유방 촬영 영상으로서 분류 장치(100)에 입력되는 의료 영상을 나타낸 것이다. 이러한 영상이 분류 장치(100)로 입력되면, 분류 장치(100)는 전술한 바와 같이 복수개의 패치 영상을 분할 생성하고 이를 특징 추출부(10)로 입력시킨다.

도 8의 (b)는 패치 영상을 분할 생성하는 예를 나타낸 것으로서 패치 영상을 Z자 모양으로 생성하는 경우를 예시적으로 나타낸 것이다.

특징 추출부(10)는 전술한 바와 같이 패치별 특징 데이터를 추출하고 벡터 변환부(20)는 이에 대한 고정 길이의 특징 벡터를 생성하고 이를 벡터 분류부(30)로 전달하고 벡터 분류부(30)는 특징 벡터에 대한 분류 결과를 확률값으로 생성한다.

도 8의 (c)는 확률값으로 표시된 분류 결과를 패치에 대해서 나타낸 것으로서 각각의 패치 영상에 대한 결과값이 0~1의 범위로 표시되어 있음을 알 수 있다.

도 8의 (d)는 패치 영상 별 결과값을 그래프로 나타낸 것으로서 임계값이 0.9로 설정되어 이를 초과하는 (5) 및 (6)의 패치 영상에 대해 병변이 존재하다는 것을 확률에 기반하여 표시하고 있음을 알 수 있다.

이상에서, 본 발명의 바람직한 실시예를 참조하여 본 발명을 설명하였으나 본 발명은 상기 실시예에 한정되지 아니하며 다양한 형태의 수정 및 변형이 가능하다는 점은 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자라면 명확히 이해할 수 있을 것이다.

Claims

의료 영상의 병리 진단 분류 장치에 있어서,

입력 영상에 대한 특징 데이터를 특징 추출 변수에 의해 추출하는 특징 추출부;

상기 추출된 특징 데이터를 벡터 변환 변수에 의해 특징 벡터로 변환하는 특징 벡터 변환부; 및

상기 특징 벡터를 분류 변수에 의해 분류하여 입력 영상에 대한 병리 진단 분류 결과를 출력하는 벡터 분류부

를 포함하고,

상기 특징 추출부, 특징 벡터 변환부 및 벡터 분류부는, 병변 유무 및 병리 진단 정보를 나타내는 제1 태그를 갖는 제1 태그드 영상과 제1 태그와 병변의 위치 정보를 나타내는 제2 태그를 함께 갖는 제2 태그드 영상과 태그 정보가 없는 영상에 의해 학습되는 것을 특징으로 하는 의료 영상의 병리 진단 분류 장치.
제1항에 있어서,

상기 특징 추출 변수는, 제2 태그드 영상에 의해 학습되고,

상기 변환 변수는, 제1 태그드 영상, 제2 태그드 영상 및 태그 정보가 없는 영상 중 적어도 하나에 의해 학습되고,

상기 분류 변수는, 제1 태그드 영상 및 제2 태그드 영상 중 적어도 하나에 의해 학습되는 것을 특징으로 하는 의료 영상의 병리 진단 분류 장치.
제2항에 있어서,

상기 학습 모듈은,

상기 특징 추출부로 입력되는 입력 영상들의 부분 영상인 패치 영상을 형성하고, 상기 패치 영상들을 학습용 데이터와 검증용 데이터로 분리하고,

학습용 데이터에 대해서 비용 함수를 최소화하도록 특징 추출 변수 및 분류 변수를 조절하는 과정을 검증용 데이터에 대한 비용 함수가 최소로 되는 시점까지 반복 수행함으로써 특징 추출부의 특징 추출 변수를 조절하는 것을 특징으로 하는 의료 영상의 병리 진단 분류 장치.
제3항에 있어서,

상기 학습 모듈은, 특징 추출 변수 및 분류 변수의 초기값을 설정하고,

현재의 특징 추출 변수 및 분류 변수에 기초한 특징 데이터와 분류 결과를 계산하는 제1 과정과, 비용 함수에 의해 특징 추출 변수 및 분류 변수에 대한 각각의 비용을 계산하는 제2 과정과, 상기 비용을 최소화할 수 있도록 특징 추출 변수 및 분류 변수의 변화량을 계산하여 기존 특징 추출 변수 및 분류 변수와의 차를 계산하여 특징 추출 변수 및 분류 변수를 갱신하는 제3과정을 반복 수행함으로써 특징 추출 변수 및 분류 변수를 조절하는 것을 특징으로 하는 의료 영상의 병리 진단 분류 장치.
제4항에 있어서,

상기 학습 모듈은,

입력 영상에 대한 복수개의 패치 영상을 상기 특징 추출부에 입력시켜 복수개의 특징 데이터를 추출하고, 상기 특징 데이터를 고정된 길이의 특징 벡터로 변환하기 위한 변환 변수를 추정함으로써 특징 벡터 변환부를 학습시키는 것을 특징으로 하는 의료 영상의 병리 진단 분류 장치.
제5항에 있어서,

상기 학습 모듈은,

입력 영상들의 부분 영상인 패치 영상을 형성하고, 상기 패치 영상들을 학습용 데이터와 검증용 데이터로 분리하고,

학습용 데이터에 대해서 비용 함수를 최소화하도록 분류 변수를 조절하는 과정을 검증용 데이터에 대한 비용 함수가 최소로 되는 시점까지 반복 수행함으로써 벡터 분류부의 분류 변수를 조절하는 것을 특징으로 하는 의료 영상의 병리 진단 분류 장치.
제6항에 있어서,

상기 학습 모듈은, 분류 변수의 초기값을 설정하고,

현재의 분류 변수에 기초한 분류 결과를 계산하는 제1 과정과, 비용 함수에 의해 분류 변수에 대한 각각의 비용을 계산하는 제2 과정과, 상기 비용을 최소화할 수 있도록 분류 변수의 변화량을 계산하여 기존 분류 변수와의 차를 계산하여 분류 변수를 갱신하는 제3과정을 반복 수행함으로써 분류 변수를 조절하는 것을 특징으로 하는 의료 영상의 병리 진단 분류 장치.
제7항에 있어서,

상기 특징 추출부는 입력 영상에 대해 복수개로 분할된 패치 영상을 입력받아 각각의 패치 영상에 대한 특징 데이터를 특징 추출 변수에 의해 추출하고,

상기 특징 벡터 변환부는 상기 패치 영상에 대한 특징 데이터를 변환 변수에 의해 고정 길이의 특징 벡터로 변환하고,

상기 벡터 분류부는 상기 고정 길이의 특징 벡터를 분류 변수에 의해 분류하여 입력 영상에 대한 병리 진단 분류 결과를 출력하는 것을 특징으로 하는 의료 영상의 병리 진단 분류 장치.
제1항 내지 제8항 중 어느 한 항에 의한 의료 영상의 병리 진단 분류 장치;

입력 영상에 대해 상기 의료 영상의 병리 진단 분류 장치로부터 출력되는 병리 진단 결과에 기초하여 입력 영상에 대한 최종 분석 정보를 출력하는 테스팅 모듈;

태그드 영상 데이터베이스에 저장된 태그드 영상에 기초하여 분류 장치를 학습시키는 학습 모듈; 및

병변 유무 및 병리 진단 정보를 나타내는 제1 태그를 갖는 제1 태그드 영상과 제1 태그와 병변의 위치 정보를 나타내는 제2 태그를 함께 갖는 제2 태그드 영상으로 구성된 태그드 영상을 저장하는 태그드 영상 데이터베이스

를 포함하는 병리 진단 시스템.