유방암은 전세계적으로 여성에게 가장 빈번하게 발생하면서도 위험도가 높은 암으로, 특히 우리나라에서 유방암은 2002년 이후로 여성에게 발생하는 암 중 1위를 차지하는 질환으로 유방암의 조기 진단이 점점 더 중요시되고 있다.
유방암의 예후인자는 조직학적 분화도, 액와림프절 전이, 종양의 크기, 발병 당시 연령, 에스트로겐 및 프로게스테론 수용체 양성 여부, c-erbB2 수용체 양성 여부 등 생리학적으로 중요한 인자들이 있지만 최근 유방촬영술(mammography)의 발달로 이와 같은 인자를 확인하기 전 조기 선별 검사로 유방 X선 영상이 많이 사용되고 있다.
북미와 유럽에서는 1960년대부터 국가의 지원 하에 선별 유방촬영술을 시행 하여 유방암 조기 발견에 노력한 결과 유방암으로 인한 사망률이 감소하였음을 보고하고 있다.
유방 X선 영상에서는 주로 종괴(mass)나 미세석회화(microcalcification)를 검출하여 유방암의 위험도를 측정하지만 최근 들어 유방촬영술에서 전반적인 유방 밀도(breast density)를 암 스크리닝에 이용하려는 시도가 많아지고 있다. 유방 밀도가 암 발생 위험도와 상관관계가 있다는 것이 Wolfe 등에 의해 주장되었으며, 지금은 높은 유방 밀도가 유방촬영술에서 유방암 검출율을 감소시키는 것과 별개로 독립적인 유방암 발생 위험인자라는 것이 많은 연구에서 밝혀지고 있다.
유방 밀도란 전체 유방 영역에서 지방을 제외한 유관 조직이 차지하는 비율을 정성적(qualitative) 또는 정량적(quantitative)하게 측정한 것을 말하는데, 정성적 분류는 BI-RADS의 규약에 따라서 유방 밀도를 구분하지만 정량적인 분류 시 유방암 위험도와의 연관성이 더 크다고 알려져 있다.
이와 같이 유방 X선 영상에서의 유방밀도는 유방암의 조기 검진에 있어 유용한 척도로 사용될 수 있지만 판독의들 간의 진단능 차이(inter-observer variation)와 판독의 본인의 판독 차이(intra-observer variation)로 인해 재현성 있는 판독이 어려운 실정이며, 따라서 유방 밀도를 자동으로 측정하는 것은 정량적이고 재현성 있는 검진을 위해 필수적이고 특정 환자에 대한 회고 진단에도 유용하게 사용된다.
따라서 보다 객관적이고 정확한 진단을 위하여 최근 컴퓨터를 이용한 진단(CAD: computer-aided diagnosis)이 활발하게 연구되고 있다. 선구적인 연구그룹 중 하나인 토론토 대학의 Byng 그룹이 1994년 발표한 논문에서는 두 명의 방사선 의학자가 유방 X선 영상을 일단 스레스홀딩(thresholding)을 통해 유방 영역으로 구분하고, 또 다시 스레스홀딩을 통해 유관 조직을 구분하는 방법을 사용하였다. 이 방법은 유방 밀도 측정 분야에서는 선구적인 연구였지만 측정 과정이 매뉴얼(manual)하여 재현성이 떨어지고, 사람의 손을 많이 필요로 한다는 단점이 있다.
미시간 대학의 Zhou 연구팀은 유방 영역의 히스토그램 특성을 4개의 BI-RADS 카테고리 별로 구분하여 그에 맞는 스레스홀딩을 자동으로 수행하는 방법을 이용하여 유관 조직을 구분하였다.
펜실베니아 대학의 Saha 연구팀은 유방 영역의 히스토그램에서 일정 영역을 시드(seed) 영역으로 정하고 이를 바탕으로 퍼지 커넥티비티(fuzzy connectivity) 방법을 이용하여 유방 밀도를 자동으로 측정한다.
최근에는 Girona 대학의 Oliver 연구팀이 유사한 특성을 갖는 조직을 C-means clustering 방법을 이용하여 분류하고, 이렇게 구분된 cluster들을 Combined Bayesian 방법을 이용하여 BI-RADS 카테고리로 구분하였다. 이 방법은 유방 밀도의 정량적 측정이라기보다는 정성적 분류를 자동화한 것이기 때문에 본 발명에서의 목적과는 차이가 있다.
위에서 살펴본 바와 같이 유방 밀도를 정량적으로 측정하는 방법은 크게 두 가지로 나눌 수 있다.
첫 번째 방법은 유방 영역 내의 픽셀 값에 대한 유사도를 이용하여 비슷한 픽셀 값을 갖는 조직을 clustering 하여 지방과 유관 조직을 구분하는 texture- based 방법이다. 두 번째 방법은 매뉴얼하게 스레스홀딩을 하거나 히스토그램의 특성을 분석한 후 이에 따른 적절한 임계치 값을 정하는 자동-스레스홀딩 기법이다.
본 발명에서 제안하는 방법은 후자인 자동-스레스홀딩 기법을 사용한다. 즉, 각 픽셀 값 별로 특정 피쳐(feature)를 사용하여 어떠한 픽셀 값을 임계치로 정했을 때 가장 효과적으로 유방 영역을 지방과 유관 조직으로 구분할 수 있는지 결정하는 것이다.
이하, 첨부된 도면을 참조하면서 본 발명에 따른 바람직한 실시예를 상세히 설명한다. 이에 앞서, 본 명세서 및 청구범위에 사용된 용어나 단어는 통상적이거나 사전적인 의미로 해석되어서는 아니 되며, 발명자는 그 자신의 발명을 가장 최선의 방법으로 설명하기 위해 용어의 개념을 적절하게 정의할 수 있다는 원칙에 입각하여, 본 발명의 기술적 사상에 부합되는 의미와 개념으로 해석되어야만 한다.
따라서 본 명세서에 기재된 실시예와 도면에 도시된 구성은 본 발명의 가장 바람직한 일 실시에 불과할 뿐이고 본 발명의 기술적 사상을 모두 대변하는 것은 아니므로, 본 출원시점에 있어서, 이들을 대체할 수 있는 다양한 균등물과 변형예들이 있을 수 있음을 이해해야 한다.
도 1은 본 발명인 정량적 유방 밀도 측정 방법의 전체 흐름도이고, 도 2의 (a) 내지 (c)는 본 발명에 사용되는 전처리 과정을 나타내는 영상이며, 도 3은 최초의 관찰자 모델에 사용된 초음파 영상이고, 도 4(a)는 명암대비 스트레칭 된 유방 영역의 히스토그램을 나타내는 그래프이며, 도 4(b)는 도 4의 (a)에 표시된 Optimum Threshold(최적 해당 위치)에서의 지방영역(μF)과 유관 조직 영역(μD)의 평균과 분산을 나타내는 그래프이고, 도 5(a) 및 도 5(b)는 유방 영역이 컨투어(contour)에 따라 분할된 예를 나타내는 영상이며, 도 6(a) 및 도 6(b)는 유방 영역이 컨투어(contour)에 따라 분할된 예를 나타내는 영상이고, 도 6(c)는 본 발명에 사용되는 각종 프로파일을 그래프로 나타낸 것이다.
도 1에서 보듯이 본 발명은, 유방 X선 영상을 전처리하여 유방 영역의 픽셀값(픽셀의 밝기)에 따른 히스토그램을 생성하는 단계(S1); 상기 유방 영역의 히스토그램에서 검출된 유방 영역의 확률적인 매개 변수인 평균(μ)과 분산(σ)의 프로파일을 생성하는 단계(S2); 상기 유방 영역의 히스토그램에서 검출된 유방 영역에서 지방 영역과 유관 조직 영역의 경계선 강도 프로파일을 생성하는 단계(S3); 상기 S2 단계 및 S3 단계에서 산출되는 값을 결합한 가분도(separability)를 계산하여 지방 영역과 유관 조직 영역을 최적으로 분리하는 단계(S4); 및 상기 S4 단계에서 지방 영역과 유관 조직 영역이 분리된 것을 바탕으로 유방 밀도를 계산하는 단 계(S5);를 포함하여 구성된다.
즉, 본 발명은 유방촬영술에서 유방 X선 영상에 대해 유방 X선 영상을 프로그램으로 읽어들인 후, 영상에서 유방 영역을 추출하는 단계, 전처리 과정인 명암대비 스트레칭과 미디언 필터링을 통해 잡음을 제거하는 단계, 검출된 유방 영역의 확률적인 매개 변수를 추출하여 관찰자 모델에 적용하는 단계, 경계선을 검출하고 그 강도를 계산하는 단계, 이 두 가지의 값을 결합하여 최종 가분도(separability)를 계산하고 그 최대값을 갖는 픽셀 값을 측정하여 지방과 유관 조직을 최적으로 분리하는 단계 및 이를 바탕으로 유방 밀도를 계산하는 단계를 포함하여 구성된다.
아울러, 본 발명은 각 단계별로 매뉴얼(manual)하게 또는 컴퓨터를 이용하여 수행하는 것이 가능하며, 전 단계를 프로그래밍하여 컴퓨터를 이용하여 수행하는 것도 가능하다.
본 발명의 구성 및 작용을 각 단계별로 상세히 설명하면 다음과 같다.
1) 유방 영역 추출 및 전처리 단계(S1)
본 단계는 유방 X선 영상에서 유방 영역을 추출한 후 전처리하여 유방 영역의 픽셀값(픽셀의 밝기)에 따른 히스토그램을 생성하는 단계이다(도 2 참조)
유방 X선 영상에서 유방 영역을 추출(S1)하면 도 2의 (a)와 같은 영상이 나오게 된다. 유방 X선 영상에서 인텐시티(intensity, 픽셀의 강도)가 가장 높은 부분이 배경에 해당하므로 이를 제외한 나머지를 추출하면 유방 영역이 추출되게 된 다.
이 상태는 도 2의 (a)에서 보듯이, 유방 영역이 대체로 밝은 영상으로 추출되어 전체적으로 명암대비를 하는 것이 어렵게 된다. 그러므로 이러한 영상을 명암차가 나도록 스트레칭(stretching)해주는 것이 바람직하다.
이에, 본 발명에서는 전처리 과정으로 추출된 유방 영역에 대해 명암대비 스트레칭 단계(S2)를 수행한다. 이를 수행하면 도 2의 (b)에서 보듯이 유방 영역이 명암차가 나는 영상으로 처리되게 된다.
또한, 전처리 과정으로 미디언(median) 필터링(S3)을 수행한다. 이는 유방 영상의 노이즈를 제거하는 것으로 석회화되어 나타나는 점 등을 제거하는 과정이다. 이를 수행하면 도 2의 (c)와 같은 영상으로 처리되게 된다.
아울러, 상기 전처리까지 수행된 유방 영역의 영상은 영상의 각 픽셀값(픽셀의 밝기)에 따라 히스토그램으로 나타내어진다.
즉, 유방 영역 영상은 다수의 픽셀로 구성되며, 각 픽셀은 다양한 밝기를 가진 것들로 이뤄지게 된다. 본 발명에서는 각 픽셀의 밝기(픽셀값)을 이용하여 지방 영역과 유관 조직 영역으로 분리하고자 하는 것을 목적으로 하므로, 유방 영역 영상을 각 픽셀값(X축)에 따른 개수(Y축)으로 히스토그램화 하게 된다(도 4a 참조).
2) 관찰자 모델 적용 과정(S2)
유방 X선 영상의 유방 영역을 각 픽셀값(t)에 대해서, 동일한 픽셀값(t)들이 연결되어 형성하는 컨투어(contour)를 기준으로 내측과 외측으로 구분하여, 밝은 영역인 내측(D, 유관 조직 영역)과 상대적으로 어두운 영역인 외측(F, 지방 영역)의 평균 및 분산을 각각 산정하여 프로파일을 생성하는 단계이다.
관찰자 모델이 최초로 제안된 것은 인간의 시각 체계(human visual system)를 수식적으로 모델링하여 텔레비전의 화질을 정량적으로 측정하기 위한 것이었다. 기존의 화질 측정 방식은 인간 관찰자(human observer)가 직접 다수의 영상을 보면서 평가 하였지만, 이와 같은 방법은 많은 시간과 인원을 필요로 하면서도 수많은 환경 변화에 따른 주관적 평가가 이루어지는 경우가 많기 때문에 컴퓨터를 이용하여 보다 정량화 되고 객관적이며 시간과 인원을 최소화 할 수 있는 방법을 고안한 것이다.
나아가 이와 같은 개념은 비단 화질 측정 분야에만 적용되지 않고 의료영상 분야에도 적용되어 디지털 초음파 영상에서 인체 모형(phantom)의 대비의 세부성에 대한 성능을 측정하는 방법으로 사용되거나, 배경 정보가 주어진 경우 자기공명영상(MRI)에서의 검출 방법으로 사용되기도 하였다. 도 3은 대비의 세부성 성능 평가에 사용된 디지털 초음파 영상을 나타낸다.
관찰자 모델을 적용하는 방법은 크게 초기 백색화(prewhitening: PW)와 비초기 백색화(non-prewhitening: NPW)로 나눌 수 있다. 이와 같이 나누는 이유는 인간 시각 체계가 초기 백색화를 하는지에 대한 가정을 어떻게 하는지에 대한 여부에 따른 것이다. 초기 백색화 필터를 사용하는 경우와 사용하지 않는 영상에 대한 검사 통계(test statistic)는 각각 아래의 식 (1)과 (2)와 같은 식으로 표현된다.
식 (1), (2)에서 g는 원본 영상을 행벡터로 전환한 것이고, g2-g1은 검출될 신호를, 행렬 K는 초기 백색화 필터를 나타낸다.
위의 두 식에서 유추할 수 있듯이, 관찰자 모델은 기본적으로 신호와 배경 정보가 주어져 있다는 가정 하에 이 정보들을 다음과 같은 수식으로 모델링하여 검출률을 계산한다.
식 (3)에서 E(λ(g)│k)는 원본 영상의 행벡터 g가 주어졌을 때 검사 통계 λ(g)의 조건부 확률의 평균을 나타내고, var(λ(g)│k)는 그에 해당하는 조건부 편차를 나타낸다.
본 발명에서는 상기 설명한 관찰자 모델을 이용하여 각 픽셀 값의 평균과 분산에 대한 프로파일을 생성한다.
도 4(a) 및 도 4(b)에서 보듯이 유관 조직 영역(D)과 지방 영역(F)이 가장 효과적으로 분리되는 경우에는, 유관 조직 영역(D)과 지방 영역(F)의 픽셀값 평균의 차인 μD-μF 값은 최대가 되고, 유관 조직 영역(D)과 지방 영역(F)의 픽셀값 분 산의 합인 σD+σF 값은 최소가 되게 된다.
이는 평균 측면에서는, 유관 조직 영역(D)과 지방 영역(F)이 가장 효과적으로 분리될 때, 유관 조직 영역(D)의 픽셀값 평균은 높아질 것이고, 지방 영역(F)의 픽셀값 평균은 낮아질 것이며, 분산 측면에서는 유관 조직 영역(D)과 지방 영역(F)이 가장 효과적으로 분리될 때, 유관 조직 영역(D) 및 지방 영역(F)의 픽셀값 분산은 낮아질 것이기 때문이다.
여기서, 상기 유관 조직 영역(D)과 지방 영역(F)은 도 6a 및 도 6b에서 보듯이 빨간 컨투어(contour) 내부의 유관 조직 영역(D)과 외부의 지방 영역(F)으로 나누어 계산할 수 있다.
또한, 도 5a 및 도 5b에서 붉은색 컨투어(contour)의 내측은 유관 조직 영역(D)을 나타내고, 붉은색 컨투어의 외측 및 녹색 컨투어의 내측은 지방 영역(F)을 나타내는 것으로 구분할 수도 있다.
이와 같이 배경 영역을 붉은색 실선부터 유방의 스킨 부분인 황색 실선까지 정의하지 않고 녹색 실선까지 정의한 것은 인간이 물체나 영상을 볼 때 실제적으로 느끼는 대비는 관심 영역의 주변을 크게 벗어나지 않기 때문이다. 따라서 붉은색 실선으로 나타낸 현재 픽셀 값에서의 컨투어를 dilation을 통해 녹색 실선까지 확대하고 이 영역을 배경 영역의 픽셀값 평균을 구하기 위한 것으로 정의하였다.
참고로, 이하 설명하겠지만, 도 6c의 청색 점선이 이하 설명할 식 (5)에서의 분자항인 μ
D(t)-μ
F(t)항에 대한 프로파일을 나타내며, 녹색 점선은 이하 설명할 식 (5)에서의 분모항인
항에 대한 프로파일을 나타낸다. 본 발명에서는 평균과 분산의 프로파일을 이용하여 하기 설명할 식(5)를 사용하게 된다.
3) 경계선 강도 프로파일 생성 단계(S3)
유방 X선 영상의 유방 영역을 각 픽셀값(t)에 대해서, 동일한 픽셀값(t)들이 연결되어 형성하는 컨투어(contour)의 경계선 강도를 산정하는 계산식인,
을 사용하여 프로파일을 생성하는 단계이다.
본 발명에서 착안한 것 중에 하나는 지방 영역(F)과 유관 조직의 영역(D)이 가장 잘 분리되었을 때 해당 위치(threshold)에서의 경계선 강도가 다른 위치보다 크다는 것이다. 따라서 식 (4)를 이용하여 각 픽셀값 별로 프로파일을 생성한다.
, Ω={t|f(x,y)=t} (4)
(여기서, Emag(t)=경계선 강도, N=동일 픽셀값(t)의 개수, Gx=x방향 미분값, Gy=y방향 미분값, x는 픽셀값(t)의 x좌표값, y는 픽셀값(t)의 y좌표값)
식 (4)에서 동일 픽셀값(t)의 개수인 N으로 전체 값을 나눠주는 것은 픽셀값(t)이 동일한 것들의 개수가 각각 상이할 것이므로 경계선 강도를 정확하게 표현하기 위한 것이다.
이에 대한 실시예로 도 6c의 적색 점선이 경계선 강도 프로파일을 나타내고 있다.
4) 최적 해당 위치(Optimum Threshold) 결정(S4)
S2 단계 및 S3 단계에서 산출되는 값을 결합한 가분도(separability)를 계산하여 지방 영역과 유관 조직 영역을 최적으로 분리하는 단계로, 유방 X선 영상의 유방 영역을 각 픽셀값(t)에 대해서, 가분도(separability)를 산정하는 계산식인,
를 사용하여 프로파일을 생성하여, 그 중 S(t)가 최대값을 갖는 픽셀값(t)을 최적 해당 위치(optimum threshold)로 정하는 단계이다.
상기 S2 단계에서 살펴봤듯이, 유관 조직 영역(D)과 지방 영역(F)이 가장 효과적으로 분리되는 경우에는, 유관 조직 영역(D)과 지방 영역(F)의 픽셀값 평균의 차인 μD-μF 값은 최대가 되고, 유관 조직 영역(D)과 지방 영역(F)의 픽셀값 분산 의 합인 σD+σF 값은 최소가 되게 된다.
또한, 상기 S3단계에서 살펴봤듯이, 지방 영역(F)과 유관 조직의 영역(D)이 가장 잘 분리되었을 때 해당 위치(threshold)에서의 경계선 강도(Emag(t))가 다른 위치보다 크게 된다.
즉, 상기 S2 단계 및 S3 단계를 종합해보면, μD-μF 값은 최대, σD+σF 값은 최소, 및 Emag(t)가 최대인 위치를 찾아야 한다.
이러한 위치를 찾는 방법은 다양한 수학적 방법이 가능하며, 본 발명에서는 하기의 식 (5)를 사용하게 된다.
(여기서, S(t)=가분도, μD(t)=유관 조직 영역 평균, μF(t)=지방 영역 평균, σD(t)=유관 조직 영역 분산, σF(t)=지방 영역 분산, W1,W2,W3는 가중치)
즉, 최대값이 되야할 μD-μF 값 및 Emag(t)값 등은 분자에 위치시키고, 최소값이 되어야 할 σD+σF 값은 분모에 위치시켜 S(t)이 최대값을 갖는 픽셀값(t)을 찾아내게 된다.
이외에도 다양한 방식(수학식, 그래프 등)으로 최적 해당 위치를 찾는 것이 가능하며 본 발명의 실시예에 한정하는 것은 아니다.
도 6c의 청색 점선이 상기 식 (5)에서의 분자항인 μ
D(t)-μ
F(t)항에 대한 프로파일을 나타내며, 녹색 점선은 상기 식 (5)에서의 분모항인
항에 대한 프로파일을 나타낸다.
또한, 도 6c의 검은색 실선은 상기 식(5)에 따른 가분도 프로파일을 나타낸다.
5) 유방 밀도 측정 단계(S5)
지방 영역과 유관 조직 영역이 분리된 것을 바탕으로 유방 밀도를 계산하는 단계로, 계산식, 유방 밀도 = (최적 해당 위치(optimum threshold) 값으로 선정된 픽셀값(t)들이 연결되어 형성하는 컨투어(contour) 내측(유관 조직 영역)의 총 픽셀수 / 유방 영역의 총 픽셀수) ×100, 을 사용하여 계산한다.
유방 밀도는 전체 유방 영역에서 지방을 제외한 유관 조직이 차지하는 비율을 측정한 것을 의미하므로, 본 발명에서는 영상을 구성하는 픽셀 수의 비율로 이를 계산하게 된다.
이상과 같이, 본 발명은 비록 한정된 실시예와 도면에 의해 설명되었으나, 본 발명은 이것에 의해 한정되지 않으며 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에 의해 본 발명의 기술 사상과 아래에 기재될 청구범위의 균등 범위 내에서 다양한 변형 및 수정이 가능함은 물론이다.