WO2023287235A1

WO2023287235A1 - 병리 이미지 분석 방법 및 시스템

Info

Publication number: WO2023287235A1
Application number: PCT/KR2022/010321
Authority: WO
Inventors: 브라톨리비아지오; 옥찬영; 정원경; 조수익; 팽경현; 유동근
Original assignee: 주식회사 루닛
Priority date: 2021-07-14
Filing date: 2022-07-14
Publication date: 2023-01-19
Also published as: US20240046670A1

Abstract

본 개시는 적어도 하나의 프로세서에 의해 수행되는 병리 이미지 분석 방법을 제공한다. 이 방법은 병리 이미지를 획득하는 단계, 획득된 병리 이미지를 기계학습 모델에 입력하여, 기계학습 모델로부터 병리 이미지에 대한 분석 결과를 획득하는 단계 및 획득된 분석 결과를 출력하는 단계를 포함하고, 기계학습 모델은 제1 도메인과 연관된 제1 병리 데이터 세트 및 제1 도메인과 상이한 제2 도메인과 연관된 제2 병리 데이터 세트에 기초하여 생성된 학습용 데이터 세트를 이용하여 학습된 모델일 수 있다.

Description

병리 이미지 분석 방법 및 시스템

본 개시는 병리 이미지 분석 방법 및 시스템에 관한 것으로, 구체적으로, 기계학습 모델을 이용하여 다양한 유형(type)의 병리 이미지를 분석하는 방법 및 시스템에 관한 것이다.

병리학(Pathology) 분야에서는, 병리 조직으로부터 생체학적 정보를 획득하고 분석하기 위해, 다양한 염색법을 기초로 조직을 염색하여 병리 슬라이드로 만든 후 병리 전문의가 병리 슬라이드를 육안으로 평가하는 방식이 이용되고 있다.

이러한 방법 중에서, 면역조직화학검사(immunohistochemistry, IHC)는 특정 항원(Target antigen)에 반응하는 항체에 이차 항체로 효소나 형광 염료(fluorescent dye)를 결합한 후, 이를 특정 조직에 염색하는 방식이다. 면역조직화학검사에 따라 특정 조직이 염색되면, 항체가 표적에 해당하는 특정 항원이 발현된 세포에 결합하고, 이 결합 반응이 이차 항체를 활성화하여 염색 반응을 일으키게 된다. 병리 전문의는 현미경을 통해 염색된 세포를 확인하고, 세포에 대한 평가를 수행할 수 있다. 예컨대, 병리 전문의는 염색 발현량 등을 평가하고 정량화하여 조직 내에서 의미있는 정보를 도출할 수 있다.

그런데 염색된 병리 슬라이드를 병리 전문의가 판독하여, 결과를 평가하고 정량화하는 방식은 사람의 주관적인 요소가 개입될 수 있을 뿐만 아니라, 노동력과 시간도 많이 필요하여, 최근에는 딥러닝 등의 인공지능 알고리즘을 이용하여 병리 슬라이드를 판독하기 위한 연구가 진행되고 있다. 이를 위해, 병리 슬라이드가 스캔되어 디지털 기반의 병리 이미지로 저장되고, 이 병리 이미지를 이용하여 인공지능 알고리즘이 학습되고 있다.

그런데 인공지능 알고리즘이 정확한 결과를 예측하기 위해서는 많은 수의 학습용 데이터가 필요하다. 하지만 인공지능 알고리즘에 입력되는 병리 이미지에 의학적 지식이 레이블링되어야 하는데, 이러한 레이블링 작업은 의료 전문가에 의해 수행되어야 하고, 이에 따라 학습용 데이터를 구축하는데 비용과 시간이 많이 발생한다.

한편, 의료계에서는 많은 신약과 연관된 바이오마커(biomarker)가 개발되고 있다. 그런데 이미 임상에서 이용되고 있는 바이오마커와 관련된 임상 자료(예를 들어, PD-L1 IHC, HER2 IHC 등과 연관된 임상 자료)는 축적된 데이터가 많아, 인공지능 알고리즘의 학습에 필요한 학습용 데이터를 생성하는 것은 비교적 쉽다. 하지만, 새로운 바이오마커와 연관된 임상 자료가 거의 없어, 새로운 종류의 IHC 염색 방법으로 염색된 슬라이드 이미지를 분석하기 위해, 충분한 양의 학습용 데이터를 확보하는 것은 단기간에 불가능할 수 있다.

또한, 특정 암종의 경우 유병율 등이 낮아서, 비교적 흔하게 발병되는 다른 암종에 비해 절대적인 검체 수가 적을 수 있다. 이러한 경우 상대적으로 적은 데이터를 이용하여 인공지능 모델을 학습시켜야 하기 때문에 인공지능 모델이 제대로 학습되지 않거나 특정 학습용 데이터 세트에 편향되게 학습될 수도 있다.

본 개시는 다양한 유형의 병리 이미지를 정확하게 분석할 수 있는 병리 이미지 분석 방법, 기록매체에 저장된 컴퓨터 프로그램 및 장치(시스템)를 제공한다.

본 개시는 방법, 장치(시스템) 및/또는 컴퓨터 판독 가능 저장 매체에 저장된 컴퓨터 프로그램, 컴퓨터 프로그램이 저장된 컴퓨터 판독 가능 저장 매체를 포함한 다양한 방식으로 구현될 수 있다.

본 개시의 일 실시예에 따르면, 적어도 하나의 프로세서에 의해 수행되는 병리 이미지 분석 방법은, 병리 이미지를 획득하는 단계, 획득된 병리 이미지를 기계학습 모델에 입력하여, 기계학습 모델로부터 병리 이미지에 대한 분석 결과를 획득하는 단계 및 획득된 분석 결과를 출력하는 단계를 포함하고, 기계학습 모델은 제1 도메인과 연관된 제1 병리 데이터 세트 및 제1 도메인과 상이한 제2 도메인과 연관된 제2 병리 데이터 세트에 기초하여 생성된 학습용 데이터 세트를 이용하여 학습된 모델일 수 있다.

또한, 병리 이미지 분석 방법은, 병리 이미지를 획득하는 단계 이전에, 제1 유형의 병리 이미지를 포함하는 제1 병리 데이터 세트 및 제2 유형의 병리 이미지를 포함하는 제2 병리 데이터 세트를 획득하는 단계, 제1 병리 데이터 세트와 제2 병리 데이터 세트에 기초하여 학습용 데이터 세트를 생성하는 단계 및 생성된 학습용 데이터 세트를 이용하여 기계학습 모델을 학습시키는 단계를 더 포함할 수 있다.

또한, 학습용 데이터 세트를 생성하는 단계는, 염색 발현 등급 또는 관심 영역 중 적어도 하나에 기초하여, 제1 유형의 병리 이미지와 연관된 항목과 제2 유형의 병리 이미지와 연관된 항목을 연관하는 단계 및 연관된 항목을 포함하는 학습용 데이터 세트를 생성하는 단계를 포함할 수 있다.

또한, 항목을 연관하는 단계는, 제1 유형의 병리 이미지에 포함된 종양 조직 영역과 연관된 제1 항목 및 제1 유형의 병리 이미지에 포함된 비종양 조직 영역과 연관된 제2 항목을 추출하는 단계, 제2 유형의 병리 이미지에 포함된 종양 조직 영역과 연관된 제3 항목 및 제2 유형의 병리 이미지에 포함된 비종양 조직 영역과 연관된 제4 항목을 추출하는 단계 및 추출된 제1 항목과 추출된 제3 항목을 연관하고, 추출된 제2 항목과 추출된 제4 항목을 연관하는 단계를 포함할 수 있다.

또한, 항목을 연관하는 단계는, 제1 유형의 병리 이미지에 포함된 픽셀들의 각각의 염색 발현 강도를 나타내는 항목들 중에서, 제1 발현 범위와 연관된 제5 항목 및 제2 발현 범위와 연관된 제6 항목을 추출하는 단계, 제2 병리 데이터 세트에 포함된 픽셀들의 각각의 염색 발현 강도를 나타내는 항목들 중에서, 제1 발현 범위와 연관된 제7 항목 및 제2 발현 범위와 연관된 제8 항목을 식별하는 단계 및 제5 항목과 제7 항목을 연관하고, 제6 항목과 제8 항목을 연관하는 단계를 포함할 수 있다.

또한, 항목을 연관하는 단계는, 제1 유형의 병리 이미지에 포함된 세포의 유형을 나타내는 적어도 하나의 오브젝트 클래스와 제2 유형의 병리 이미지에 포함된 세포의 유형을 나타내는 적어도 하나의 오브젝트 클래스를 연관하는 단계, 또는 제1 유형의 병리 이미지에 포함된 세포의 염색 발현 강도를 나타내는 적어도 하나의 오브젝트 클래스와 제2 유형의 병리 이미지에 포함된 세포의 염색 발현 강도를 나타내는 적어도 하나의 오브젝트 클래스를 연관하는 단계를 포함할 수 있다.

또한, 제1 병리 데이터 세트와 제2 병리 데이터 세트에 기초하여 학습용 데이터 세트를 생성하는 단계는, 제1 병리 데이터 세트와 제2 병리 데이터 세트로부터 패치들을 추출하는 단계 및 패치들을 포함하는 학습용 데이터 세트를 생성하는 단계를 포함하고, 생성된 학습용 데이터 세트를 이용하여 기계학습 모델을 학습시키는 단계는, 제1 병리 데이터 세트로부터 추출된 레이블링된 패치들 중에서 제1 샘플링 개수에 상응하는 개수의 제1 유형의 이미지 패치들을 가져오는(fetch) 단계, 제2 병리 데이터 세트로부터 추출된 레이블링된 패치들 중에서 제2 샘플링 개수에 상응하는 개수의 제2 유형의 이미지 패치들을 가져오는 단계, 제1 유형의 이미지 패치들 및 제2 유형의 이미지 패치들에 기초하여, 배치를 생성하는 단계 및 배치를 이용하여 기계학습 모델을 학습시키는 단계를 포함할 수 있다.

또한, 제1 병리 데이터 세트와 제2 병리 데이터 세트에 기초하여 학습용 데이터 세트를 생성하는 단계는, 제1 병리 데이터 세트로부터 제1 유형의 이미지 패치들을 추출하는 단계, 제2 병리 데이터 세트로부터 제2 유형의 이미지 패치들을 추출하는 단계 및 소정 개수만큼 제1 유형의 이미지 패치들을 복사하여 학습용 데이터 세트에 포함시키는 단계를 포함할 수 있다.

또한, 기계학습 모델에 학습시키는 단계는, 제1 유형의 병리 이미지 또는 제2 유형의 병리 이미지 중 적어도 하나에 대한 크기를 조정하는 단계 및 크기가 조정된 적어도 하나의 병리 이미지를 포함하는 학습용 데이터를 이용하여 기계학습 모델을 학습시키는 단계를 포함할 수 있다.

또한, 기계학습 모델에 학습시키는 단계는, 제1 유형의 병리 이미지 또는 제2 유형의 병리 이미지 중 적어도 하나에 포함된 픽셀들 중에서 미리 결정된 범위에 해당하는 픽셀들을 제거하는 단계를 포함할 수 있다.

또한, 기계학습 모델에 학습시키는 단계는, 제1 유형의 병리 이미지 또는 제2 유형의 병리 이미지 중 적어도 하나를 좌우 또는 상하로 반전하는 단계 및 반전된 병리 이미지를 포함하는 학습용 데이터를 이용하여 기계학습 모델을 학습시키는 단계를 포함할 수 있다.

또한, 기계학습 모델에 학습시키는 단계는, 제1 유형의 병리 이미지 또는 제2 유형의 병리 이미지 중 적어도 하나에 포함된 픽셀들 중에서 미리 결정된 범위의 픽셀들을 제거하거나 변형하는 단계 및 미리 결정된 범위의 픽셀들이 제거되거나 변형된 병리 이미지를 포함하는 학습용 데이터를 이용하여 기계학습 모델을 학습시키는 단계를 포함할 수 있다.

또한, 기계학습 모델에 학습시키는 단계는, 제1 유형의 병리 이미지 또는 제2 유형의 병리 이미지 중 적어도 하나에 포함된 픽셀들의 색상을 변환시키는 단계 및 픽셀들의 색상이 변환된 적어도 하나의 병리 이미지를 포함하는 학습용 데이터를 이용하여 기계학습 모델을 학습시키는 단계를 포함할 수 있다.

또한, 기계학습 모델을 학습시키는 단계는, 학습용 데이터 세트 중에서 타깃 학습용 데이터를 결정하는 단계, 타깃 학습용 데이터를 기계학습 모델에 입력하고, 기계학습 모델로부터 출력 값을 획득하는 단계, 제1 병리 데이터 세트 또는 제2 병리 데이터 세트 중 적어도 하나에 포함된 주석 정보를 이용하여, 타깃 학습용 데이터에 대한 레퍼런스 값을 획득하는 단계 및 출력 값과 획득된 레퍼런스 값 간의 손실 값을 기계학습 모델에 피드백하는 단계를 포함할 수 있다.

또한, 기계학습 모델은, 서로 다른 유형의 분석 결과를 출력하는 복수의 분석 모델을 포함하고, 분석 결과를 획득하는 단계는, 획득된 병리 이미지로부터 염색 색상 및 염색이 발현된 위치를 식별하는 단계, 식별된 염색 색상 및 발현된 위치에 기초하여, 복수의 분석 모델 중 어느 하나를 타깃 분석 모델로서 결정하는 단계 및 결정된 타깃 분석 모델로 병리 이미지를 입력하여, 발현된 위치에서의 염색 강도에 대한 분석 결과를 타깃 분석 모델로부터 획득하는 단계를 포함할 수 있다.

또한, 기계학습 모델은, 서로 다른 유형의 분석 결과를 출력하는 복수의 분석 모델을 포함하고, 분석 결과를 획득하는 단계는, 사용자의 입력 정보에 기초하여, 복수의 분석 모델 중 어느 하나를 타깃 분석 모델로서 결정하는 단계 및 타깃 분석 모델로 병리 이미지를 입력하여, 병리 이미지에 대한 분석 결과를 타깃 분석 모델로부터 획득하는 단계를 포함할 수 있다.

또한, 기계학습 모델은, 세포의 종류 또는 세포의 평가 지표 중 적어도 하나를 포함하는 분석 결과를 출력하고, 세포의 평가 지표는, 세포에 대한 양성 또는 음성에 대한 결과값, 세포에 대한 염색 발현 등급, 세포에 대한 염색 발현 정도를 나타내는 값, 또는 세포에 대한 염색 발현 통계 정보 중 적어도 하나를 포함할 수 있다.

상술한 병리 이미지 분석 방법을 컴퓨터에서 실행하기 위한 명령어들을 기록한 컴퓨터 판독 가능한 비일시적 기록매체가 제공될 수 있다.

본 개시의 일 실시예에 따른 정보 처리 시스템은, 메모리 및 메모리와 연결되고, 메모리에 포함된 컴퓨터 판독 가능한 적어도 하나의 프로그램을 실행하도록 구성된 적어도 하나의 프로세서를 포함하고, 적어도 하나의 프로그램은, 병리 이미지를 획득하고, 획득된 병리 이미지를 기계학습 모델에 입력하여, 기계학습 모델로부터 병리 이미지에 대한 분석 결과를 획득하고, 획득된 분석 결과를 출력하기 위한 명령어들을 포함하고, 기계학습 모델은 제1 도메인과 연관된 제1 병리 데이터 세트 및 제1 도메인과 상이한 제2 도메인과 연관된 제2 병리 데이터 세트에 기초하여 생성된 학습용 데이터 세트를 이용하여 학습된 모델일 수 있다.

본 개시의 일부 실시예에 따르면, 이종 도메인으로 구성된 학습용 데이터 세트를 기초로 기계학습 모델이 학습되고, 이에 따라 기계학습 모델은 학습에 이용되지 않은 다양한 유형의 병리 이미지까지도 정확하게 분석할 수 있다.

본 개시의 일부 실시예에 따르면, 이종 병리 데이터 세트에 대한 샘플링이 수행되어, 특정 유형의 병리 데이터 세트로 편향되지 않고 균형적으로 기계학습 모델이 학습될 수 있다.

본 개시의 일부 실시예에 따르면, 이종 병리 데이터 세트에 포함된 항목들이 서로 연관되고, 항목들이 연관된 이종 병리 데이터 세트에 기초하여 학습용 데이터 세트가 생성될 수 있다. 이러한 학습용 데이터 세트가 이용되어 기계학습 모델이 학습되는 경우, 기계학습 모델은 별도의 학습을 수행하지 않고도 새로운 암종 또는 새로운 IHC 염색 방법에 따라 발현된 세포를 포함하는 병리 이미지에 대한 정확한 분석을 수행할 수 있다.

본 개시의 일부 실시예에 따르면, 의도적으로 병리 이미지가 변형된 학습용 데이터가 기계학습 모델에 입력되어 기계학습 모델이 학습됨으로써, 이미지 왜곡, 변경 등과 같은 의도치 않은 상황에서도 강인한 기계학습 모델이 구축될 수 있다.

본 개시의 일부 실시예에 따르면, 기계학습 모델을 통해서 다양한 유형의 출력 값을 포함하는 분석 결과가 출력될 수 있다. 이에 따라, 사용자는 분석 결과에 포함된 출력 값들 중에서 원하는 유형의 출력 값을 이용하여, 의료 행위 등과 같은 후속 절차를 진행할 수 있다.

본 개시의 효과는 이상에서 언급한 효과로 제한되지 않으며, 언급되지 않은 다른 효과들은 청구범위의 기재로부터 본 개시가 속하는 기술분야에서 통상의 지식을 가진 자('통상의 기술자'라 함)에게 명확하게 이해될 수 있을 것이다.

본 개시의 실시예들은, 이하 설명하는 첨부 도면들을 참조하여 설명될 것이며, 여기서 유사한 참조 번호는 유사한 요소들을 나타내지만, 이에 한정되지는 않는다.

도 1 및 도 2는 서로 다른 유형의 병리 이미지를 예시하는 도면이다.

도 3은 오브젝트 클래스를 포함하는 병리 이미지를 예시하는 도면이다.

도 4는 종양 영역과 전암성 영역이 세그먼테이션된 병리 이미지를 예시하는 도면이다.

도 5는 본 개시의 일 실시예에 따른, 병리 이미지를 분석하는 시스템이 적용되는 환경을 예시하는 도면이다.

도 6은 본 개시의 일 실시예에 따른, 병리 이미지 분석 모델이 학습되는 것을 예시하는 개요도이다.

도 7은 본 개시의 일 실시예에 따른, 병리 이미지 분석 모델이 학습되는 방법을 설명하기 위한 흐름도이다.

도 8은 본 개시의 일 실시예에 따른, 이종 병리 데이터 세트를 전처리하여 학습용 데이터 세트를 생성하는 방법을 설명하기 위한 흐름도이다.

도 9는 패치들이 샘플링되어 배치가 생성되는 예시를 나타내는 도면이다.

도 10은 패치들이 샘플링되어 배치가 생성되는 다른 예시를 나타내는 도면이다.

도 11은 본 개시의 일 실시예에 따른, 병리 이미지 분석 모델을 통해서 병리 이미지의 분석 결과가 출력되는 것을 예시하는 도면이다.

도 12는 본 개시의 일 실시예에 따른, 병리 이미지 분석 모델에 포함된 인공신경망 모델을 예시하는 도면이다.

도 13은 본 개시의 일 실시예에 따른, 병리 이미지 분석 모델을 이용하여 병리 이미지에 대한 분석 결과를 출력하는 방법을 설명하는 흐름도이다.

도 14는 본 개시의 다른 실시예에 따른, 병리 이미지 분석 모델을 예시하는 도면이다.

도 15는 본 개시의 다른 실시예에 따른, 병리 이미지의 특성에 기초하여 호출된 분석 모델을 통해 병리 이미지에 대한 분석 결과가 출력되는 것을 예시하는 도면이다.

도 16은 본 개시의 또 다른 실시예에 따른, 사용자의 입력 정보에 기초하여 호출된 분석 모델을 통해 병리 이미지에 대한 분석 결과가 출력되는 것을 예시하는 도면이다.

도 17 내지 도 20은 병리 이미지 분석 모델로부터 출력되는 다양한 형태의 분석 결과를 예시하는 도면이다.

도 21은 본 개시의 일 실시예에 따른 병리 이미지를 분석하는 예시적인 시스템 구성도이다.

이하, 본 개시의 실시를 위한 구체적인 내용을 첨부된 도면을 참조하여 상세히 설명한다. 다만, 이하의 설명에서는 본 개시의 요지를 불필요하게 흐릴 우려가 있는 경우, 널리 알려진 기능이나 구성에 관한 구체적 설명은 생략하기로 한다.

첨부된 도면에서, 동일하거나 대응하는 구성요소에는 동일한 참조부호가 부여되어 있다. 또한, 이하의 실시예들의 설명에 있어서, 동일하거나 대응되는 구성요소를 중복하여 기술하는 것이 생략될 수 있다. 그러나, 구성요소에 관한 기술이 생략되어도, 그러한 구성요소가 어떤 실시예에 포함되지 않는 것으로 의도되지는 않는다.

개시된 실시예의 이점 및 특징, 그리고 그것들을 달성하는 방법은 첨부되는 도면과 함께 후술되어 있는 실시예들을 참조하면 명확해질 것이다. 그러나, 본 개시는 이하에서 개시되는 실시예들에 한정되는 것이 아니라 서로 다른 다양한 형태로 구현될 수 있으며, 단지 본 실시예들은 본 개시가 완전하도록 하고, 본 개시가 통상의 기술자에게 발명의 범주를 완전하게 알려주기 위해 제공되는 것일 뿐이다.

본 명세서에서 사용되는 용어에 대해 간략히 설명하고, 개시된 실시예에 대해 구체적으로 설명하기로 한다. 본 명세서에서 사용되는 용어는 본 개시에서의 기능을 고려하면서 가능한 현재 널리 사용되는 일반적인 용어들을 선택하였으나, 이는 관련 분야에 종사하는 기술자의 의도 또는 판례, 새로운 기술의 출현 등에 따라 달라질 수 있다. 또한, 특정한 경우는 출원인이 임의로 선정한 용어도 있으며, 이 경우 해당되는 발명의 설명 부분에서 상세히 그 의미를 기재할 것이다. 따라서, 본 개시에서 사용되는 용어는 단순한 용어의 명칭이 아닌, 그 용어가 가지는 의미와 본 개시의 전반에 걸친 내용을 토대로 정의되어야 한다.

본 명세서에서의 단수의 표현은 문맥상 명백하게 단수인 것으로 특정하지 않는 한, 복수의 표현을 포함한다. 또한, 복수의 표현은 문맥상 명백하게 복수인 것으로 특정하지 않는 한, 단수의 표현을 포함한다. 명세서 전체에서 어떤 부분이 어떤 구성요소를 포함한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라 다른 구성요소를 더 포함할 수 있음을 의미한다.

본 개시에서, '시스템'은 서버 장치와 클라우드 장치 중 적어도 하나의 장치를 포함할 수 있으나, 이에 한정되는 것은 아니다. 예를 들어, 시스템은 하나 이상의 서버 장치로 구성될 수 있다. 다른 예로서, 시스템은 하나 이상의 클라우드 장치로 구성될 수 있다. 또 다른 예로서, 시스템은 서버 장치와 클라우드 장치가 함께 구성되어 동작될 수 있다.

또한, 이하의 실시예들에서 사용되는 제1, 제2, A, B, (a), (b) 등의 용어는 어떤 구성요소를 다른 구성요소와 구별하기 위해 사용되는 것일 뿐, 그 용어에 의해 해당 구성요소의 본질이나 차례 또는 순서 등이 한정되지는 않는다.

또한, 이하의 실시예들에서, 어떤 구성요소가 다른 구성요소에 '연결', '결합' 또는 '접속'된다고 기재된 경우, 그 구성요소는 그 다른 구성요소에 직접적으로 연결되거나 또는 접속될 수 있지만, 각 구성요소 사이에 또 다른 구성요소가 '연결', '결합' 또는 '접속'될 수도 있다고 이해되어야 한다.

또한, 이하의 실시예들에서 사용되는 '포함한다(comprises)' 및/또는 '포함하는(comprising)'은 언급된 구성요소, 단계, 동작 및/또는 소자는 하나 이상의 다른 구성요소, 단계, 동작 및/또는 소자의 존재 또는 추가를 배제하지 않는다.

본 개시의 다양한 실시예들을 설명하기에 앞서, 사용되는 용어에 대하여 설명하기로 한다.

본 개시에서, 'IHC(Immunohistochemistry) 염색'은, 조직 또는 세포 검체에서 핵, 세포질 또는 세포막에 존재하는 단백질(또는, 항원)의 유무를 광학현미경으로 관찰하기 위해 관심 있는 항체를 조직 위에 반응시키는 원리를 이용한 염색법을 지칭할 수 있다. 항원-항체 반응물은 그대로 현미경으로 관찰할 수 없어서 표지자(biomarker)를 붙인 후 그 표지자를 발색 시키는 방법을 이용하며, 발색제로는 붉은색을 띠는 AEC(3-amino-9-ethylcarbazole), 갈색을 띠는 DAB(3,3'-diaminobenzidine) 등과 같은 다양한 발색제가 이용될 수 있다.

본 개시에서, '병리 이미지'는 인체에서 떼어낸 조직 등을 현미경으로 관찰하기 위해 일련의 화학적 처리과정을 거쳐 고정 및 염색된 병리 슬라이드를 촬영한 이미지를 지칭할 수 있다. 여기서, 병리 이미지는 병리 슬라이드에 대한 고해상도의 이미지를 포함하는 전체 슬라이드 이미지(whole slide image, WSI) 또는 고해상도의 전체 슬라이드 이미지의 일부를 지칭할 수 있다. 여기서, 전체 슬라이드의 이미지의 일부는, 병리 슬라이드 이미지 전체에서 일정 크기 단위로 분할된 영역을 지칭할 수 있다. 예를 들어, 병리 이미지는 디지털 스캐너를 이용하여 병리 슬라이드를 스캔한 디지털 이미지를 지칭할 수 있으며, 인체 내의 세포(cell), 조직(tissue) 및/또는 구조(structure)에 대한 정보를 포함할 수 있다. 또한, 병리 이미지는 하나 이상의 패치를 포함할 수 있으며, 하나 이상의 패치에는 주석(annotation) 작업을 통해 조직학적 정보가 적용(예: 태깅)될 수 있다. 본 개시에서 '병리 이미지'는 '병리 이미지에 포함된 적어도 일부 영역'을 지칭할 수도 있다.

본 개시에서, '패치'는 병리 이미지 내의 일부 영역을 지칭할 수 있다. 예를 들어, 패치는 병리 이미지에 대해 세그먼테이션(segmentation)을 수행함으로써 추출된 의미론적 오브젝트(object)에 대응하는 영역을 포함할 수 있다. 또 다른 예로서, 패치는 병리 이미지를 분석함으로써 생성된 조직학적 정보와 연관된 픽셀들의 조합을 지칭할 수 있다. 예컨대, 패치는 종양 조직과 연관된 오브젝트, 전암성 조직과 연관된 오브젝트, 종양 주변 조직과 연관된 오브젝트 및 기타 조직과 연관된 오브젝트 등을 포함할 수 있다.

본 개시에서, '조직학적 정보(histological components)'는, 병리 이미지에 포함된 인체 내의 세포(cell), 조직(tissue) 및/또는 구조(structure)에 대한 특성 또는 정보를 포함할 수 있다. 여기서, 세포에 대한 특성은 핵(nucleus), 세포막(cell membrane)과 같은 세포학적 특징(cytologic feature)을 포함할 수 있다. 조직학적 정보는 기계학습 모델을 통해 추론되거나 병리 전문의에 의해 입력된, 패치에 대한 조직학적 정보를 지칭할 수 있다.

본 개시에서, '병리 데이터'는 주석(annotation) 정보가 포함된 병리 이미지를 지칭할 수 있다. 복수의 병리 데이터를 포함하는 병리 데이터 집합이 '병리 데이터 세트'로서 지칭될 수 있다. 병리 데이터 세트 생성 시 병리 데이터의 도메인이 고려될 수 있다. 도메인이 일치하는 병리 이미지들만을 집합하여 병리 데이터 세트를 구성할 수 있다.

본 개시에서, '주석 정보'는 병리 이미지와 연관하여 병리 전문의, 또는 병리학자 등과 같은 전문가가 입력하는 정보일 수 있다. 주석 정보는 병리 이미지에 대한 조직학적 정보를 포함할 수 있다. 또한, 주석 정보는 병리 이미지와 연관된 적어도 하나의 항목을 포함할 수 있다. 여기서, 병리 이미지와 연관된 '항목(item)'은 병리 이미지에 대한 세부 정보를 나타내는 데이터로서, 염색이 발현된 오브젝트의 영역(예컨대, 영역에 포함되는 픽셀 범위, 픽셀의 위치 등)와 연관된 제1 항목, 오브젝트의 클래스과 연관된 제2 항목을 포함할 수 있다. 여기서, 오브젝트는 유의미한 세포 영역(예컨대, 이상 영역)으로서 픽셀 범위와 연관될 수 있고, 오브젝트 클래스는 세포 유형 및 평가 지표 등을 포함할 수 있다. 세포 유형은 종양 세포(tumor cell), 림프구(lymphocyte) 등일 수 있으며, 평가 지표는 염색 발현 강도와 연관된 지표로서, 양성 유무, 발현 등급, 발현 값, 발현 통계 정보 등을 포함할 수 있다. 발현 등급은 미리 결정된 복수의 등급(예컨대, 0, t+1, t+2 및 t+3) 중에서 염색 강도에 기초한 세포의 등급일 수 있으며, 발현 값은 미리 결정된 수치 범위(예컨대, 0 ~ 1)에서 염색 강도에 기초한 세포의 발현 값일 수 있다. 또한, 발현 통계 정보는 세포의 발현 강도에 대한 통계로서, 복수의 병리 이미지가 연속적으로 분석되는 경우에 출력될 수 있다. 예컨대, 10개의 병리 이미지들을 분석하여, 각 병리 이미지 내의 전체 종양 세포 대비 PD-L1 positive 종양 세포의 비율을 계산하고, 계산된 비율 값의 분포가 발현 통계 정보에 포함될 수 있다. 다른 예로서, 발현 통계 정보는 단일 병리 이미지 내에서 특정 세포에 대한 통계 정보를 포함할 수 있다. 예컨대, 하나의 병리 이미지가 분석되어, 병리 이미지 내에서 염색 발현된 전체 세포 대비 중에서 특정 등급으로 분류되는 세포에 대한 비율이 발현 통계 정보에 포함될 수 있다.

본 개시에서, '이종(異種)'은 도메인이 상이한 병리 데이터 또는 병리 이미지를 지칭할 수 있다. 여기서, '도메인'이 일치하다는 것은, 병리 이미지의 유형(type)이 동일하고 병리 이미지와 연관된 항목 유형(item type related to image)이 일치하다는 것으로 이해될 수 있으며, '도메인'이 상이하다는 것은 병리 이미지의 유형이 상이하거나, 또는 병리 이미지와 연관된 항목 유형이 상이하다는 것으로 이해될 수 있다. 여기서, 동일한 유형의 병리 이미지는 염색 방법이 동일한 것으로 이해될 수 있다. 예컨대, PD-L1(Programed cell death ligand 1) IHC 염색을 이용하여 염색된 폐암 조직에 대한 병리 이미지들이, 제1 도메인과 연관된 제1 병리 데이터 세트를 구성할 수 있다. 다른 예로서, HER2(human epidermal growth factor receptor 2) 염색을 이용하여 염색된 유방암 조직에 대한 병리 이미지들이, 제2 도메인과 연관된 제2 병리 데이터 세트를 구성할 수 있다. 이 경우, 제1 병리 데이터 세트에 포함된 병리 이미지와 제2 병리 데이터 세트에 포함된 병리 이미지가 이종인 것으로 지칭될 수 있다. 즉, 도메인이 동일한 병리 데이터들은 동일한 종류의 데이터로 지칭될 수 있으면, 도메인이 상이한 병리 데이터들은 이종 데이터인 것으로 지칭될 수 있다.

본 개시에서, '복수의 A 각각' 은 복수의 A에 포함된 모든 구성 요소의 각각을 지칭하거나, 복수의 A에 포함된 일부 구성 요소의 각각을 지칭할 수 있다.

본 개시에서, '인스트럭션(instruction)'이란, 기능을 기준으로 묶인 하나 이상의 명령어들로서, 컴퓨터 프로그램의 구성 요소이자 프로세서에 의해 실행되는 것을 지칭할 수 있다.

이하, 본 개시의 다양한 실시예들에 대하여 첨부된 도면에 따라 상세하게 설명한다.

우선, 도 1 내지 도 4를 참조하면, 본 개시의 학습에 이용될 수 있는 병리 이미지의 다양한 예시에 대해서 설명한다.

도 1 및 도 2는 서로 다른 유형의 병리 이미지를 예시하는 도면이다. 도 1에서 제1 병리 이미지(110)는 22C3 IHC 염색을 이용하여 비소세포폐암에서 PD-L1(Programed cell death ligand 1)을 염색한 슬라이드 이미지이다. 또한, 도 2의 제2 병리 이미지(120)는 HER2(human epidermal growth factor receptor 2) IHC 염색을 이용하여 유방암에서 HER2를 염색한 슬라이드 이미지이다. 22C3 IHC 염색 방법과 HER2 염색 방법은 서로 다른 항원-항체 반응을 활용하지만, 종양 세포의 세포막(membrane)이 염색된 후 동일한 색상(예컨대, 갈색)을 띈다는 점에서 패턴이 유사함을 알 수 있다.

도 2에 도시된 제3 병리 이미지(210)는 ER(estrogen receptor) IHC 염색을 이용하여 유방암을 염색한 슬라이드 이미지이고, 제4 병리 이미지(220)는 PR(progesterone receptor) IHC 염색을 이용하여 유방암을 염색한 슬라이드 이미지이다. ER IHC 염색과 PR IHC 염색에 의해 염색된 핵(nuclear)은 모두 동일한 색상(예컨대, 갈색)을 띈다는 점에서 IHC 염색 패턴이 유사하다.

이렇게 IHC 염색 후, 동일하거나 유사한 색상(예컨대, 갈색)이 발현되는 이종 병리 이미지가 후술되는 학습용 데이터를 생성하는데 이용될 수 있다. 부연하면, 도 1 및 도 2와 같은 다양한 유형의 병리 이미지를 포함하는 이종 병리 데이터에 기초하여 학습용 데이터 세트가 생성되고, 학습용 데이터 세트가 이용되어 기계학습 모델이 학습될 수 있다. 여기서, 학습용 데이터 세트는 복수의 학습용 데이터 집합일 수 있다. 또한, 특정 색상 이외에 다양한 색상(예컨대, 붉은색, 분홍색, 청색 등)으로 발현되는 병리 이미지가 학습용 데이터를 생성하는데 이용될 수도 있다.

각각의 병리 이미지는 병리 전문의가 입력한 주석 정보를 포함할 수 있다. 주석 정보는 병리 이미지 상의 오브젝트(예를 들어, 세포, 조직, 구조 등)에 대한 적어도 하나의 항목을 포함할 수 있다. 항목은 병리 전문의가 입력한 염색이 발현된 오브젝트의 종류 및 오브젝트의 클래스를 포함할 수 있다. 여기서, 패치 상에 염색이 발현된 오브젝트의 종류 및 오브젝트의 클래스는 패치에 대한 레이블링(labeling) 정보로서 지칭될 수 있다. 본 개시에서, 레이블링 정보는 주석 정보와 혼용하여 사용될 수 있다.

도 3은 오브젝트 클래스를 포함하는 병리 이미지(310)를 예시하는 도면이다. 도 3에 예시된 병리 이미지(310)는 특정 색상으로 발현된 오브젝트와 오브젝트 클래스를 포함하고 있다. 여기서, 오브젝트와 연관된 영역은 특정 색상으로 발현된 픽셀들에 기초하여 식별될 수 있다.

오브젝트 클래스는 세포가 특정 색상으로 발현된 정도에 기초하여 결정될 수 있고, 특정 색상의 채도에 따라 오브젝트의 각각의 클래스가 결정될 수 있다. 종래에는, 이러한 결정은 병리 전문의에 의해서 결정될 수 있었다. 즉, 병리 전문의는 병리 이미지를 확인한 후, 염색 발현 정도에 따라 각각의 세포의 클래스를 입력하고, 이렇게 설정된 세포의 클래스와 해당 세포의 영역(즉, 픽셀 범위)가 주석 정보로서 병리 이미지에 포함될 수 있다. 도 3에서는 t0에서부터 t3+으로 갈수록 염색 발현 강도가 강해진 것으로 예시되어 있다.

그러나 본 개시의 일 실시예에 따르면, 미리 구축된 이미지 분석 알고리즘(예컨대, 이미지 분석을 위한 기계학습 모델)을 이용하여, 오브젝트 클래스와 오브젝트가 자동적으로 결정될 수 있다.

도 4는 종양 영역과 전암성 영역이 세그먼테이션된 병리 이미지(410)를 예시하는 도면이다. 도 4에 예시된 병리 이미지(410)에서는, 종양 영역(ca)과 비종양 영역(cis)이 세그먼테이션된 후, 종양 영역(ca)은 제1 색상으로 시각화되고, 전암성 영역(cis)이 제2 색상으로 시각화될 수 있다. 종래에는 이러한 영역의 구분은 병리 전문의에 의해서 결정될 수 있었다. 예컨대, 병리 전문의는 병리 이미지(410)에서 발현되는 세포 및 조직의 형태학적 특성에 기초하여 종양 영역(ca) 및 전암성 영역(cis)을 식별할 수 있었다.

그러나 본 개시의 일 실시예에 따르면, 이러한 세그먼테이션 작업은 미리 구축된 이미지 분석 알고리즘(예컨대, 이미지 분석을 위한 기계학습 모델)을 이용하여, 자동적으로 수행될 수 있다. 예컨대, 이미지 분석 알고리즘을 통해서, 세포의 염색 발현 정도가 병리 이미지로부터 추출되고, 염색 발현 강도에 기초하여 각각의 영역이 자동으로 세그먼테이션된 후 서로 상이한 색상으로 시각화될 수 있다.

병리 이미지의 유형에 따라, 더욱 많은 영역이 세그먼테이션되어 시각화될 수 있다. 예컨대, 병리 이미지에서는 종양 영역과 전암성 영역 이외에, 종양 주변 영역(Cancer stroma 등)이 제3 색상으로 시각화될 수 있으며, 기타 조직(Connective tissue, fat tissue, bone 등)이 제4 색상으로 시각화될 수 있다. 시각화 작업과 연관된 주석 정보가 병리 이미지에 포함될 수 있다. 즉, 시각화된 오브젝트 영역과 관련된 제1 항목에 대한 정보와 오브젝트의 클래스와 관련된 제2 항목에 대한 정보를 포함하는 주석 정보가 병리 이미지에 포함될 수 있다.

상술한 바와 같이, 병리 이미지가 상이할 수 있으며, 또한, 병리 이미지에 포함된 주석 정보의 항목이 상이할 수 있다. 여기서, 병리 이미지가 상이한 것은, 병리 이미지에 대한 염색 방법이 상이할 수 있고, 또한 세포가 채취된 신체 부위가 상이한 것으로 이해될 수 있다. 예컨대, 제1 병리 이미지가 ER IHC 염색을 통해 획득된 이미지이고, 제2 병리 이미지가 PR IHC 염색을 통해 획득된 이미지인 경우, 제1 병리 이미지와 제2 병리 이미지는 이종의 이미지일 수 있다. 다른 예로서, 제3 병리 이미지가 가슴 조직으로부터 획득된 이미지이고, 제4 병리 이미지가 폐 조직으로부터 획득된 병리 이미지인 경우, 제3 병리 이미지와 제4 병리 이미지는 이종의 이미지일 수 있다.

또한, 주석 정보가 상이한 것은, 주석 정보에 포함된 항목의 유형이 상이한 것으로 이해될 수 있다. 예컨대, 제1 병리 이미지에 오브젝트 클래스로서 양성 유무와 연관된 제3 항목이 포함되고, 제2 병리 이미지에 오브젝트 클래스로서 t0, t1+, t2+ 및 t3+ 중에서 어느 하나에 대한 등급을 나타내는 제4 항목이 포함된 경우, 제1 병리 이미지와 제2 병리 이미지는 이종인 것으로 이해될 수 있다.

이렇듯, 병리 이미지의 유형 또한 주석 정보에 포함된 항목 중에서 어느 하나라도 상이한 병리 이미지는, 이종 병리 이미지인 것으로 판정될 수 있다. 동일한 유형의 병리 이미지들이 모여서 동일한 도메인의 병리 이미지 세트를 구성할 수 있다.

이하, 도 5 내지 도 21을 참조하여, 본 개시의 다양한 실시예들을 설명하기로 한다.

도 5는 본 개시의 일 실시예에 따른, 병리 이미지를 분석하는 시스템(510)이 적용되는 환경을 예시하는 도면이다. 도 5를 참조하면, 분석 시스템(510)은 네트워크(550)를 통해서, 연구 정보 시스템(520), 스캐너(530), 사용자 단말(540) 각각과 통신할 수 있다. 여기서, 네트워크(550)는 이동통신망과 유선 통신망을 포함하는 것으로서, 본 개시의 기술분야에서 주지의 관용기술에 해당하므로 자세한 설명은 생략한다. 또한, 도 5에 도시되지는 않았으나, 분석 시스템(510)은, 병리 이미지를 저장하기 위한 저장소 및 분석 결과를 저장하기 위한 저장소를 포함하는 이미지 관리 시스템(미도시)과 통신할 수 있다.

스캐너(530)는 환자의 조직 샘플을 이용하여 생성된 조직 샘플 슬라이드로부터 디지털화된 병리 이미지를 획득할 수 있다. 예컨대, 스캐너(530)는 병리 슬라이드를 스캔한 디지털 이미지인 병리 이미지를 생성하여 저장할 수 있다. 스캐너(530)는 획득된 병리 이미지를 분석 시스템(510)으로부터 전송할 수 있다.

사용자 단말(540)은 분석 시스템(510)으로부터 병리 이미지에 대한 분석 결과를 수신할 수 있다. 예컨대, 사용자 단말(540)은 병원 등과 같은 의료 시설에 위치하고, 의료진이 사용하는 컴퓨팅 장치일 수 있다. 다른 예로서, 사용자 단말(540)은 환자와 같은 일반 사용자가 사용하는 컴퓨팅 장치일 수 있다.

연구 정보 시스템(520)은 병원, 대학, 연구시설 등에서 이용하는, 서버와 데이터베이스 등을 포함하는 컴퓨팅 시스템일 수 있다. 연구 정보 시스템(520)은 학습에 이용되는 원시 데이터(raw data)의 집합인 병리 이미지 세트를 분석 시스템(510)으로 제공할 수 있다. 예컨대, 연구 정보 시스템(520)은 단일 도메인에 해당하는 이종 병리 데이터 세트를 분석 시스템(510)으로 전송할 수 있다. 다른 예로서, 연구 정보 시스템(520)은 이종 병리 데이터 세트를 분석 시스템(510)으로 제공할 수 있다. 즉, 연구 정보 시스템(520)은 제1 도메인에 해당하는 제1 병리 데이터 세트, 제2 도메인에 해당하는 제2 병리 데이터 세트 또는 제3 도메인에 해당하는 제3 병리 데이터 세트 중 둘 이상을 분석 시스템(510)으로 전송할 수 있다.

분석 시스템(510)은 학습에 이용되는 복수의 병리 데이터 세트를 저장하기 위한 데이터 저장소(예컨대, 데이터베이스)를 포함하고, 병리 이미지를 분석하기 위한 기계학습 모델을 포함할 수 있다. 분석 시스템(510)은 적어도 하나의 프로세서와 메모리를 포함할 수 있다. 일 실시예에 따르면, 분석 시스템(510)은 이종 병리 데이터 세트에 기초하여 학습용 데이터 세트를 생성하고, 학습용 데이터 세트를 이용하여 기계학습 모델을 학습시킬 수 있다. 분석 시스템(510)은 기계학습 모델의 학습량이 목표량에 도달하면, 기계학습 모델을 이용하여 주석 정보가 포함하지 않은 병리 이미지에 대한 분석을 수행할 수 있다. 즉, 분석 시스템(510)은 병리 전문가의 개입을 요구하지 않고, 기계학습 모델을 이용하여 병리 이미지에 대한 분석을 수행할 수 있다. 예컨대, 분석 시스템(510)은 스캐너(530)로부터 수신된 병리 이미지를 분석하고, 이 분석된 결과를 의뢰인에게 제공할 수 있다. 여기서, 의뢰인은 사용자 단말(540)을 이용하는 의사/연구원/환자일 수 있다.

이하, 도 6 내지 도 8을 참조하여, 기계학습 모델이 학습되는 과정에 대해서 보다 자세하게 설명한다.

도 6은 본 개시의 일 실시예에 따른, 병리 이미지 분석 모델(630)이 학습되는 것을 예시하는 개요도이다. 도 6에서는 기계학습 모델(630)이 병리 이미지 분석 모델(630)인 것으로 지칭되어 있다. 이하에서는, 기계학습 모델(630)과 병리 이미지 분석 모델(630)을 혼용하여 사용하기로 한다.

복수의 이종 병리 데이터 세트(610_1 내지 610_n)가 전처리되어, 학습용 데이터 세트(620)가 생성될 수 있다. 즉, 서로 다른 도메인에 해당하는 복수의 이종 병리 데이터 세트(610_1 내지 610_n)가 전처리되어, 복수의 학습용 데이터를 포함하는 학습용 데이터 세트(620)가 생성될 수 있다. 이종 병리 데이터 세트(610_1 내지 610_n)가 전처리되는 과정에서, 각 병리 데이터 세트(610_1 내지 610_n)로부터 추출되는 샘플링 개수가 결정될 수 있다. 데이터 샘플링에 대해서 도 8을 참조하여 자세하게 설명하기로 한다.

일부 실시예에서, 아티팩트(artifact)가 포함된 병리 이미지에 대해서 분석이 용이하게 수행될 수 있도록, 의도적으로 왜곡된 병리 이미지가 병리 이미지 분석 모델(630)에 입력되어, 아티팩트가 포함된 병리 이미지에 대해서도 분석 결과를 출력할 수 있는 강인한(robust) 기계학습 모델이 구축될 수 있다. 여기서, 아티팩트가 포함된 병리 이미지는, 일부 영역이 왜곡되거나, 변환되거나 또는 제거된 이미지일 수 있다. 강인한 기계학습 모델을 구축하기 위해, 학습용 데이터를 생성하는 다양한 실시예에 대해서는 도 8을 참조하여 자세하게 설명하기로 한다.

일 실시예에 따르면, 오브젝트 클래스 또는 관심 영역 중 적어도 하나에 기초하여, 병리 데이터 세트(610_1 내지 610_n)에 포함된 병리 이미지에 연관된 항목이 다른 병리 데이터 세트에 포함된 병리 이미지에 연관된 항목과 연관될 수 있다. 병리 이미지에 연관된 항목이란, 병리 이미지 상에 나타나는 세포, 조직, 또는 구조의 종류 또는 클래스를 구분하는 기준을 의미할 수 있다. 예컨대, 제1 병리 데이터 세트(610_1)에 제1 유형의 제1 병리 이미지가 포함되고, 제2 병리 데이터 세트(610_2)에 제2 유형의 제2 병리 이미지가 포함되고, 제1 병리 이미지와 연관된 제1 항목과 제2 병리 이미지와 연관된 제2 항목이 유사한 염색 발현 등급 또는 유사한 관심 영역에 해당하는 경우, 제1 항목과 제2 항목은 서로 연관될 수 있다. 여기서 관심 영역은 세포와 연관된 영역일 수 있다. 예컨대, 관심 영역은 종양 세포, 염증 세포 또는 기타 세포 중 적어도 하나와 연관된 영역일 수 있다. 다른 예로서, 관심 영역은 종양 조직, 전암성 조직, 종양 주변 조직 또는 기타 조직 중 적어도 하나와 연관된 영역일 수 있다. 항목들이 연관되는 다양한 예시는 도 8, 표 1 및 표 2를 참조하여 더욱 구체적으로 설명하기로 한다.

일 실시예에 따르면, 연관된 항목들을 포함하여 학습용 데이터 세트(620)가 생성될 수 있다. 예컨대, 제1 병리 이미지에 연관된 제1 항목과 제2 병리 이미지와 연관된 제2 항목이 서로 연관되는 경우, 서로 연관되는 제1 항목과 제2 항목 및 제1 병리 이미지에 기초하여 제1 학습 데이터가 생성되어 학습용 데이터 세트(620)에 포함될 수 있다. 추가적으로, 서로 연관되는 제1 항목과 제2 항목 및 제2 병리 이미지에 기초하여, 제2 학습 데이터가 생성되어 학습용 데이터 세트(620)에 포함될 수 있다. 이에 따라, 학습용 데이터 세트(620)는 병리 이미지 이외에, 병리 이미지에 포함된 항목과 연관되는 이종 병리 이미지의 항목을 더 포함할 수 있다.

학습용 데이터 세트(620)의 일부 또는 전부를 포함하는 적어도 하나의 배치(batch)가 생성되어, 병리 이미지 분석 모델(630)이 학습될 수 있다. 일 실시예에 따르면, 학습 과정에서 병리 이미지 분석 모델(630)으로부터 출력된 출력 값(즉, 분석 결과)(640)과 레퍼런스 값(650) 간의 손실(loss) 값이 산출될 수 있다. 일 실시예에 따르면, 레퍼런스 값(650)은 병리 이미지의 주석 정보로부터 획득된 일종의 정답 값일 수 있다. 예컨대, 레퍼런스 값(650)은 주석 정보에 포함된 평가 지표로부터 획득될 수 있다.

일 실시예에 따르면, 손실 값이 병리 이미지 분석 모델(630)로 피드백되어 병리 이미지 분석 모델(630)에 포함된 적어도 하나의 노드의 가중치가 조정될 수 있다. 여기서, 노드는 인공신경망에 포함되는 노드일 수 있다.

본 개시의 실시예들에 따르면, 학습용 데이터가 병리 이미지 분석 모델(630)에 입력되면, 학습용 데이터에 포함된 연관된 항목들이 유사 항목 그룹으로서 그룹핑되어, 병리 이미지 분석 모델(630)에서 가중치를 가지는 적어도 하나의 노드로서 동작할 수 있다. 이렇게 연관된 항목들이 함께 입력되어 병리 이미지 분석 모델(630)이 학습되는 경우, 다양한 유형의 병리 이미지에 대해서 분석을 수행할 수 있을 뿐만 아니라 다양한 유형의 결과 값을 출력할 수 있다.

이하, 도 7 및 도 8을 참조하여, 병리 이미지 분석 모델이 학습되는 방법을 자세하게 설명한다. 도 7 및 도 8에 도시된 방법은, 본 개시의 목적을 달성하기 위한 일 실시예일 뿐이며, 필요에 따라 일부 단계가 추가되거나 삭제될 수 있음은 물론이다. 또한, 도 7 및 도 8에 도시된 방법은, 도 5에 도시된 분석 시스템에 포함된 적어도 하나의 프로세서에 의해서 수행될 수 있다. 설명의 편의를 위해서 도 5에 도시된 분석 시스템에 포함된 프로세서에 의해서, 도 7 및 도 8에 도시된 각 단계가 수행되는 것으로 설명하기로 한다.

또한, 후술하는 실시예들에서, 이종 병리 데이터 세트는, 서로 다른 유형의 복수의 이종 병리 데이터 세트를 포함하고 있은 것으로 가정한다. 또한, 후술하는 설명에서 제N(여기서, N은 자연수) 이종 병리 데이터 세트와 제N+1 이종 병리 데이터 세트는 서로 상이한 도메인에 해당하는 데이터 세트인 것으로 지칭한다.

도 7은 본 개시의 일 실시예에 따른, 병리 이미지 분석 모델이 학습되는 방법(700)을 설명하기 위한 흐름도이다. 도 7을 참조하면, 프로세서는 이종 병리 데이터 세트를 획득할 수 있다(S710). 예컨대, 프로세서는 도 5의 분석시스템(510), 연구 정보 시스템(520), 또는 스캐너(530) 중 적어도 하나로부터 수신하여 저장한 이종 병리 데이터 세트를, 저장소로부터 획득할 수 있다.

이어서, 프로세서는 획득된 이종 병리 데이터 세트의 각각을 전처리하여, 학습용 데이터 세트를 생성할 수 있다(S720). 개별 학습용 데이터에는, 주석 정보를 포함하는 병리 이미지가 포함될 수 있다. 일 실시예에 따르면, 프로세서는 제1 병리 이미지와 연관된 항목과 제2 병리 이미지와 연관된 항목을 연관하고, 연관된 항목을 각 병리 데이터 세트에 포함되게 할 수 있다. 이에 따라, 이종 병리 데이터 세트에 포함된 이종 개별 병리 데이터가 서로 병합될 수 있다. 일 실시예에 따르면, 학습용 데이터 세트의 크기가 미리 결정된 배치(batch) 크기에 상응하도록, 프로세서는 학습용 데이터의 개수를 결정하고, 이 개수에 상응하는 데이터 개수를 가지도록 학습용 데이터 세트를 생성할 수 있다. 일부 실시예에 따르면, 프로세서는 이종 병리 데이터 세트에 대한 샘플링 또는 데이터 증강 중 적어도 하나를 수행할 수 있다. 데이터 전처리에 대한 더욱 자세한 설명은 도 8 내지 도 10을 참조하여 후술하기로 한다.

데이터 전처리가 완료된 후, 프로세서는 학습용 데이터 세트에 포함된 데이터 중에서 타깃 학습용 데이터를 결정할 수 있다(S730). 이어서, 프로세서는 타깃 학습용 데이터를 이용하여 병리 이미지 분석 모델에 대한 학습을 수행할 수 있다(S740). 일 실시예에서, 프로세서는 타깃 학습용 데이터에 포함된 주석 정보로부터 레퍼런스 값을 결정할 수 있다. 예컨대, 프로세서는 학습용 데이터에 포함된 주석 정보에서 오브젝트 클래스를 추출하고, 추출된 오브젝트 클래스에 포함된 평가 지표를 기초로 레퍼런스 값을 결정할 수 있다. 또한, 프로세서는 학습용 데이터에 포함된 주석 정보에서 세그먼테이션된 적어도 하나의 오브젝트의 영역(즉, 픽셀 범위)과 각 오브젝트의 유형(즉, 세포 유형)을 기초로 레퍼런스 값을 결정할 수 있다.

프로세서는 타깃 학습용 데이터를 병리 이미지 분석 모델로 입력하고, 병리 이미지 분석 모델로부터 출력되는 출력 값(즉, 분석 결과)과 레퍼런스 값 간의 손실(loss) 값을 산출한 후, 산출된 손실 값을 병리 이미지 분석 모델에 피드백(feedback)하여, 병리 이미지 분석 모델에 포함된 적어도 하나의 가중치를 조절할 수 있다. 출력 값은 평가 지표 또는 오브젝트 영역과 오브젝트의 유형(즉, 세포 유형) 중 적어도 하나를 포함할 수 있다. 손실 값은 평가 지표와 레퍼런스 값 간의 차이에 산술적으로 계산하여 산출될 수 있고, 또는 출력 값에 포함된 오브젝트와 레퍼런스 값에 포함된 오브젝트 간의 픽셀 범위 일치율을 평가하기 위한 평가 함수가 이용되어 산출될 수 있다.

이어서, 프로세서는 학습용 데이터 세트에 포함된 모든 데이터가 타깃 학습용 데이터로 결정되었는지 여부를 판정할 수 있다(S750). 다음으로, 프로세서는 학습용 데이터 세트에 포함된 데이터 중에서 아직 타깃 학습용 데이터로 결정되지 않은 데이터가 존재하면, 타깃 학습용 데이터로 결정되지 않은 학습용 데이터들 중에서 어느 하나를 타깃 학습용 데이터로 결정하여, 이 타깃 학습용 데이터를 이용하여 병리 이미지 분석 모델을 학습을 수행할 수 있다.

한편, 프로세서는 학습용 데이터 세트에 포함된 모든 데이터가 타깃 학습용 데이터로 결정되었으면, 이번 주기의 이포크(epoch)에서의 학습을 종료할 수 있다.

한편, 다음 주기의 이포크에서 동일할 학습용 데이터 세트가 다시 이용되어 병리 이미지 분석 모델이 다시 학습될 수 있고, 또는 새로운 학습용 데이터 세트가 생성되어 병리 이미지 분석 모델이 다시 학습될 수 있다.

상술한 바와 같이, 학습용 데이터 세트에 포함된 데이터를 이용하여 병리 이미지 분석 모델에 대한 반복적인 학습이 진행되면, 병리 이미지 분석 모델에 포함된 각 노드의 가중치는 최적의 값으로 수렴할 수 있다. 이에 따라, 병리 이미지 분석 모델은 더욱 정확한 분석 결과를 출력할 수 있다.

도 8은 본 개시의 일 실시예에 따른, 이종 병리 데이터 세트를 전처리하여 학습용 데이터 세트를 생성하는 방법을 설명하기 위한 흐름도이다. 먼저, 데이터 전처리를 위한 방법을 설명하기 앞서서, 전처리가 필요한 이유에 대해서 개략적으로 설명한다.

이종 병리 이미지인 제1 병리 이미지와 제2 병리 이미지는, 세포의 종류, 염색 강도 또는 IHC 평가에 필요한 조직 영역 중 적어도 하나가 상이할 수 있다. 대부분의 병리 이미지는 종양 세포를 레이블한 정보가 포함된다는 점은 공통적이지만, IHC 종류에 따라 종양 세포 외에 림프구(lymphocyte), 대식세포(macrophage) 등의 면역 세포나 종양 주변의 기질을 구성하는 섬유아세포(fibroblast)나 지방세포(adipocyte) 등의 간질세포(stromal cell) 등도 염색되는 경우가 있으며, 이러한 세포들에 대한 레이블링 정보는 일부 유형의 이종 이미지에 포함될 수 있다. 부연하면, 도 1 내지 도 4와 같은 다양한 유형의 병리 이미지를 포함하는 학습용 데이터 세트가 생성되고, 학습용 데이터 세트에 기초하여 기계학습 모델이 학습될 수 있다.

또한, 염색 강도를 평가하는 기준도 병리 이미지를 구성하는 세포 유형(예컨대, 암종) 및 IHC 종류에 따라 다를 수 있다. 예를 들어 유방암의 HER2 발현 정도를 평가한 IHC 데이터셋의 경우 종양세포(tumor cell)에서 HER2의 발현 정도를 3+ (강함), 2+ (중간), 1+ (약함), 0(발현 없음)으로 4단계를 나눠 분류하지만, 폐암의 PD-L1 발현 정도를 22C3 염색으로 평가한 IHC 데이터셋의 경우 종양세포에서 PD-L1 발현 정도를 양성 또는 음성으로 나눠 분류한다.

이렇듯 레이블링된 세포의 종류, 염색 강도에 대한 평가 지표 등이 병리 이미지의 유형에 따라 다를 수 있기 때문에, 서로 다른 유형의 항목을 병합하여 학습용 데이터 세트를 구축할 필요성이 있다. 다시 말해, 서로 다른 도메인의 병리 이미지들에 대해 도메인 병합(domain merging)을 수행함으로써, 통합된 학습용 데이터 세트를 구축할 필요성이 있다. 예컨대, 제1 병리 이미지에 포함된 제1 오브젝트 클래스와 제2 병리 이미지에 포함된 제2 오브젝트 클래스 간의 유형이 서로 상이한 경우, 제1 오브젝트 클래스와 제2 오브젝트 클래스가 통합될 수 있다. 한편, 특정 병리 데이터 세트에 포함된 오브젝트 클래스의 세부 항목이 더 많거나 적을 수 있으며, 세부 항목이 더 많은 쪽 또는 더 적은 쪽으로 항목이 병합되도록, 항목들이 연관될 수 있다. 만약 세부 항목이 더 적은 쪽으로 병합되는 경우는 아래의 표 1과 표 2의 예시처럼 복수의 세포 종류 또는 염색 강도를 하나로 묶는 방법을 활용할 수 있다.

만약, 세부 항목이 더 많은 쪽으로 데이터를 통합하는 경우는, 세부 항목이 더 적게 레이블링된 병리 이미지에 대한 평가가 다시 수행되어, 더 많은 개수의 세부 항목이 병리 이미지에 레이블링 될 수 있다. 이때, 세부 항목을 레이블을 자동으로 수행하는 별도의 알고리즘(예컨대, 기계학습 모델)이 이용되어, 적은 개수의 세부 항목으로 레이블링된 병리 이미지가 보다 많은 개수의 세부 항목으로 자동적으로 다시 레이블링될 수 있다. 예컨대, 제1 병리 이미지의 오브젝트 클래스와 연관된 세부 항목의 개수가 2개이고, 제2 병리 이미지의 오브젝트 클래스와 연관된 세부 항목의 개수가 4개인 경우, 제1 병리 이미지가 4개의 세부 항목을 자동으로 레이블링하는 알고리즘(예컨대, 기계학습 모델)이 입력되고, 이 알고리즘을 통해서 4개의 세부 항목으로 레이블링된 제1 병리 이미지가 출력될 수 있다.

이렇게 항목들을 연관하는 것은, IHC 분석에서 관심 대상이 되는 종양 세포의 경우 서로 다른 암종이라 하더라도 핵 이형성(nuclear atypia), 높은 핵/세포질 비율 (high N/C ratio), 비정형 유사분열(atypical mitosis)의 증가, 극성손실(loss of polarity) 등과 같이, 종양세포의 기원과 관계없이 악성 종양 세포라면 공통적으로 갖고 있는 유사한 형태적 특징(morphologic feature)이 있다는 점과 면역세포나 간질세포 등은 암종에 따른 형태 차이가 적은 병리학적 이론에 바탕을 둔다.

도 8을 참조하면, 프로세서는 이종 병리 데이터 세트에 포함된 서로 다른 항목을 서로 연관되게 처리함으로써, 이종 도메인에 해당하는 이종 병리 데이터 세트를 병합(merge)할 수 있다(S810). 여기서, 병합하다는 것은, 이종 병리 데이터 세트가 공통된 항목으로 서로 연관된다는 것을 의미할 수 있다.

서로 연관될 수 있는 항목에 대한 테이블이 분석 시스템에서 미리 저장될 수 있으며, 프로세서는 테이블을 참조하여 이종 병리 데이터 세트로부터 서로 연관되는 항목들을 추출하고, 추출된 항목들을 서로 연관되게 처리할 수 있다. 아래의 표 1과 표 2는 항목을 연관시킬 때에, 참조되는 매핑 테이블을 예시하는 도면이다. 표 1과 표 2는 PD-L1와 연관된 제1 병리 데이터 세트와 HER2과 연관된 제2 병리 데이터 세트를 예로 들어, 항목을 매핑하고 있다. 즉, PD-L1 IHC 염색을 이용한 제1 유형의 병리 이미지와 연관된 항목과, HER2 IHC 염색을 이용한 제2 유형의 병리 이미지와 연관된 항목을 연관시키기 위한, 매핑 테이블이 예시되어 있다.

	Tissue mapping
	BG (Background)	CA (Cancer Area)
PD-L1 lung	BG	CA
HER2 breast	BG, CIS	CA

	Cell mapping
	Other Cell	TC-	TC+
PD-L1 lung	LP+, LP-, MP+, MP-, OT	TC-	TC+
HER2 breast	OT	TC0	TC1, TC2, TC3

표 1 및 표 2를 참조하면, PD-L1 IHC 염색과 연관된 제1 유형의 병리 이미지와 HER2 IHC 염색과 연관된 제2 유형의 병리 이미지는, 염색 방법과 원발 부위(폐 또는 유방)가 다르나, 특성 색상으로 발현된다는 공통점이 있다. 그러나 제1 병리 이미지와 제2 병리 이미지에서는 암종과 연관된 오브젝트가 공통적으로 발견될 수 있으나, 발현되는 세포의 종류, 염색 강도 및 IHC 평가에 필요한 조직 영역은 상이할 수 있다. 본 개시에서는 이종 병리 이미지에 연관된 항목들을 중에서, 공통 속성을 가지는 항목들이 연관될 수 있다. 표 1은 관심 조직을 기초로, 이종 병리 이미지와 연관된 항목들이 서로 연관될 수 있음을 예시하고 있다. 표 1을 참조하면, PD-L1 IHC 염색으로 획득된 제1 유형의 병리 이미지와 연관된 항목들 중에서, 종양 조직을 나타내는 항목(CA)은, HER2 IHC 염색으로 획득된 제2 유형의 병리 이미지와 연관된 항목들 중에서 종양 조직을 나타내는 항목(CA)과 연관될 수 있다. 또한, PD-L1 IHC 염색으로 획득된 제1 유형의 병리 이미지와 연관된 항목들 중에서, 비종양 조직을 나타내는 오브젝트 관련 항목(BG)은, HER2 IHC 염색으로 획득된 제2 유형의 병리 이미지와 연관된 항목들 중에서 전압성 조직(CIS) 및 배경 조직(BG)과 관련될 수 있다.

표 2는 오브젝트 클래스를 기초로, 이종 병리 이미지와 연관된 항목들이 서로 연관될 수 있음을 예시하고 있다. 표 2를 참조하면, PD-L1 IHC 염색으로 획득된 제1 유형의 병리 이미지와 연관된 항목들 중에서, 종양을 제외한 림프구(LP+, LP-), 대식 세포(MP+, MP-) 및 그 외의 세포(OT)는, HER2 IHC 염색으로 획득된 제2 유형의 병리 이미지와 연관된 항목들 중에서 종양(BG)과 전암성 조직(CIS) 이외의 세포(OT)와 연관될 수 있다.

또한, 제1 유형의 병리 이미지에 포함된 픽셀들의 각각의 염색 발현 강도를 나타내는 항목들 중에서, 제1 발현 범위와 관련된 음성(TC-) 항목은, 제2 유형의 병리 이미지에 포함된 픽셀들의 각각에 염색 발현 강도를 나타내는 항목들 중에서 제1 발현 범위와 관련된 TC0 항목과 연관될 수 있다. 또한, 제1 유형의 병리 이미지에 포함된 픽셀들의 각각의 염색 발현 강도를 나타내는 항목들 중에서, 제2 발현 범위와 관련된 양성(TC+) 항목은, 제2 유형의 병리 이미지에 포함된 픽셀들의 각각에 염색 발현 강도를 나타내는 항목들 중에서 제2 발현 범위와 관련된 TC1, TC2 및 TC3 항목과 연관될 수 있다.

프로세서는 제1 병리 이미지와 연관된 항목과 제2 병리 이미지와 연관된 항목을 연관하고, 연관된 항목을 각 병리 데이터 세트에 포함되게 할 수 있다. 이에 따라, 이종 병리 데이터 세트에 포함된 이종 개별 병리 데이터가 서로 병합될 수 있다.

표 1 및 표 2를 예를 들어 설명하면, 제1 병리 이미지와 연관된 BG 항목과 제2 이미지와 연관된 BG 항목과 CIS 항목이 연관될 수 있다. 또한, 제2 병리 이미지와 연관된 OT 항목과 제1 병리 이미지와 연관된 LP+, LP-, MP+, MP- 및 OT 항목이 연관될 수 있다. 또한, 제1 병리 이미지와 연관된 TC- 항목과 제2 병리 이미지에 연관된 TC0 항목이 연관되고, 제1 병리 이미지와 연관된 TC+ 항목과 제2 병리 이미지에 연관된 TC1, TC2 및 TC3 항목이 연관될 수 있다. 이렇게 연관된 항목들은 제1 병리 데이터 세트와 제2 병리 데이터 세트 각각에 포함되고, 이에 따라 제1 도메인과 연관된 제1 병리 데이터 세트와 제2 도메인과 연관된 제2 병리 데이터 세트는 병합될 수 있다.

그 후, 프로세서는 각 병리 데이터 세트로부터 레이블링된 패치들을 추출하고, 추출된 패치들을 패치 데이터베이스에 저장할 수 있다(S820). 여기서, 레이블링된 패치는 오브젝트 클래스가 레이블링된 오브젝트를 지칭할 수 있으며, 병리 이미지의 일부이거나 전부일 수 있다. 일 실시예에서, 프로세서는 각 병리 데이터 세트로부터 미리 결정된 동일 개수의 패치들을 추출할 수 있다. 다른 실시예에 따르면, 프로세서는 서로 상이한 개수의 레이블링된 패치를 각 병리 데이터 세트로부터 추출할 수 있다. 프로세서는 제1 병리 데이터 세트에서 제1 개수 또는 제1 비율의 레이블링된 패치를 추출하고, 제2 병리 데이터 세트에서 제2 개수 또는 제2 비율의 레이블링된 패치를 추출할 수 있다.

프로세서는 레이블링된 패치들을 추출한 후, 레이블링된 패치들을 패치 데이터베이스에 저장할 수 있다. 이때, 레이블링된 패치는 항목(예컨대, 오브젝트 유형, 클래스 등)과 이 항목과 연관된 이종 병리 데이터의 항목이 포함될 수 있다. 다른 실시예에서, 프로세서는 특정 유형의 패치들을 소정 개수만큼 복사하여, 복사된 패치들을 패치 데이터베이스에 저장할 수 있다. 이때, 특정 유형의 패치들이 복사되는 소정 개수는, 가장 많은 패치 개수의 패치 유형에 기초하여 결정될 수 있다. 예컨대, 복사되는 패치의 개수는 패치 데이터베이스에 저장된 패치 유형들 중에서, 가장 많은 개수의 패치 유형과 특정 유형의 패치 개수 차이에 기초하여 결정될 수 있다. 여기서, 패치 유형은, 병리 이미지 유형과 상응할 수 있다. 예컨대, 병리 이미지의 유형이 제1 유형인 경우, 병리 이미지로부터 추출된 패치들도, 제1 유형일 수 있다. 패치 목록 또는 패치 데이터베이스에 저장된 패치들에 대한 예시는 도 9 및 도 10을 참조하여 설명하기로 한다.

다음으로, 프로세서는 패치 데이터베이스에 포함된 이미지를 왜곡, 삭제, 오염 등과 같은 인위적인 변형을 가함으로써, 레이블링된 패치를 증강할 수 있다(S830).

증강된 패치를 생성하기 위해, 프로세서는 패치 데이터베이스에 포함된 패치 중에서 적어도 하나의 패치를 추출하고, 추출된 패치의 크기를 조정할 수 있다. 예컨대, 프로세서는 패치의 크기의 해상도를 오리지널 해상도 보다 높은 해상도 또는 낮은 해상도로 변경할 수 있다. 다른 예로서, 프로세서는 패치에 외곽 영역에 위치한 픽셀들을 제거함으로써, 패치의 크기를 변경할 수 있다.

또한, 프로세서는 패치 데이터베이스에 포함된 패치 중에서 적어도 하나의 패치를 추출하고, 추출된 패치에 포함된 픽셀들 중에서 미리 결정된 범위에 해당하는 픽셀들을 제거할 수 있다. 또한, 프로세서는, 픽셀들이 제거된 패치의 크기를 패치의 오리지널 크기로 확대할 수 있다. 이러한 형태의 패치를 포함하는 이미지를 기초로, 병리 이미지 분석 모델이 학습되는 경우, 병리 이미지에서 관심 영역이 다양한 위치에서 있더라도, 병리 이미지 분석 모델은 해당 관심 영역을 정확하게 검출하고, 그 검출된 관심 영역에 대한 평가 지표를 정확하게 산출하도록 학습될 수 있다.

또한, 프로세서는 패치 데이터베이스에 포함된 패치 중에서 적어도 하나의 패치를 추출하고, 추출된 패치를 좌우 또는 상하로 반전한 후, 좌우 또는 상하가 반전된 패치를 생성할 수 있다. 이렇게 반전된 패치를 포함하는 병리 이미지를 이용하여 병리 이미지 분석 모델이 학습되는 경우, 병리 이미지 분석 모델은 새로운 유형의 병리 이미지에 대해서도 의미 있는 분석 결과를 출력하도록 학습될 수 있다.

또한, 프로세서는 패치 데이터베이스에 포함된 패치 중에서 적어도 하나의 패치를 추출하고, 추출된 패치에 포함된 픽셀들 중에서 미리 결정된 범위의 픽셀들을 제거하여 패치를 증강할 수 있다. 이렇게 의도적으로 픽셀들이 제거된 패치를 포함하는 병리 이미지를 이용하여 병리 이미지 분석 모델이 학습되는 경우, 병리 이미지 분석 모델은 아티팩트가 포함된 병리 이미지에 대해서도 정확한 분석 결과를 출력할 수 있다.

또한, 프로세서는 패치 데이터베이스에 포함된 패치 중에서 적어도 하나의 패치를 추출하고, 추출된 패치에 포함된 픽셀들 중에서 미리 결정된 범위의 픽셀들을 인위적으로 변형하여, 패치를 증강할 수 있다. 예컨대, 프로세서는 중앙값 필터(median-filter)를 이용하여 결정된 범위의 픽셀들에 흐림 효과(blurriness) 등을 적용하여 일부 픽셀들이 흐리게 되도록 하여, 해당 픽셀들을 변형할 수 있다. 다른 예로서, 프로세서는 가우시안 필터(gaussian-filter)를 이용하여, 결정된 범위의 픽셀들에 노이즈(noise)를 부가하여 일부 픽셀들을 변형할 수 있다. 이렇게 변형된 패치를 포함하는 병리 이미지를 이용하여 병리 이미지 분석 모델이 학습되는 경우, 스캐너 오류, 염색 오류 등에 대해서 강인한 병리 이미지 분석 모델이 구축될 수 있다.

또한, 프로세서는 패치 데이터베이스에 포함된 패치 중에서 적어도 하나의 패치를 추출하고, 추출된 패치에 포함된 픽셀들의 색상을 변환시킨 후, 변환된 색상을 포함하는 패치를 생성하여 패치를 증강할 수 있다. 예컨대, 프로세서는 색상 지터링 기법을 이용하여, 패치의 색조, 대비, 밝기 또는 채도 중 적어도 하나를 변경할 수 있다. 다른 예로서, 프로세서는 그레일스케일 기법을 이용하여, 패치의 색상을 변경할 수 있다. 패치의 색상을 변경하는 세부적인 설정 값은, 사용자에 의해 결정될 수 있다. 이렇게 색상이 변경된 패치를 포함하는 병리 이미지를 이용하여 병리 이미지 분석 모델이 학습되는 경우, 새로운 도메인의 병리 이미지가 입력되더라도 병리 이미지 분석 모델은 해당 병리 이미지에 대해서 유의미한 분석 결과를 출력할 수 있고, 더불어 이미지의 색상 보다는 세포 구조에 더 집중하여 병리 이미지 분석 모델이 학습되게 유도할 수 있다.

데이터 증강이 완료되고 나서, 프로세서는 증강된 적어도 하나의 패치 및 패치 데이터베이스에 포함된 패치의 일부 또는 전부 이용하여 학습용 데이터 세트를 생성할 수 있다(S840). 일 실시예에 따르면, 프로세서는 학습용 데이터 세트에 생성하는데 이용되는 각 유형의 패치 개수를 결정하고, 결정된 개수만큼의 유형별 패치를 패치 데이터베이스로부터 추출한 후, 추출된 유형별 패치 및 증강된 패치를 이용하여 학습용 데이터 세트를 생성할 수 있다. 다른 실시예에 따르면, 프로세서는 유형에 관계없이 패치 데이터베이스에 포함된 패치들 중에서, 소정 개수의 패치를 무작위로 추출하고, 추출된 패치들을 이용하여 학습용 데이터를 생성할 수 있다. 또 다른 실시예에 따르면, 프로세서는 패치 데이터베이스에 포함된 모든 패치들을 이용하여, 학습용 데이터 세트를 생성할 수 있다. 패치 데이터베이스에 포함된 패치들 중에서 일부만이 추출되어 학습용 데이터 세트가 생성되는 경우, 이를 미니-배치(mini-batch) 사이즈에 해당하는 학습용 데이터 세트인 것으로 지칭될 수 있다.

일 실시예에 따르면, 학습용 데이터 세트에 포함되는 개별 학습용 데이터는 적어도 하나의 패치를 포함할 수 있다. 또한, 개별 학습용 데이터는 서로 다른 유형의 패치가 포함될 수 있다. 추가적으로 또는 대안적으로, 개별 학습용 데이터에는 동일한 유형의 패치가 포함될 수 있다. 일부 실시예에 따르면 프로세서는 소정 크기의 학습용 병리 이미지를 생성하고, 이 병리 이미지에 적어도 하나의 패치를 무작위로 배치할 수 있다. 또한, 프로세서는 패치가 배치된 학습용 병리 이미지에서, 패치 이외에 영역에 무작위로 선택된 백그라운드 이미지를 삽입할 수 있다. 여기서, 백그라운드 이미지는 실제로 스캔된 병리 이미지로부터 추출될 수 있으며, 분석 시스템은 복수의 백그라운 이미지를 미리 저장할 수 있다. 이 경우, 프로세서는 복수의 백그라운드 이미지 중에서 어느 하나를 무작위로 선택하여 학습용 병리 이미지의 배경으로서 삽입할 수 있다.

이렇게 배경 이미지를 삽입하는 이유는, 병리 이미지 분석 모델이 병리 이미지로부터 세그먼테이션 작업을 수행할 수 있도록, 학습시키기 위함이다. 후술하는 바와 같이, 병리 이미지에 대한 세그먼테이션을 수행하는 제1 분석 모델이 병리 이미지 분석 모델에 포함된 경우, 제1 분석 모델에 패치와 배경 이미지가 모두 포함하는 학습용 병리 이미지가 입력되어, 제1 분석 모델에 대한 학습이 진행될 수 있다. 이러한 세그먼테이션 학습을 위해, 적어도 하나의 패치와 배경 이미지를 포함하는 병리 이미지가 생성될 수 있다.

상술한 바와 같이, 개별 학습용 데이터에는 학습용 병리 이미지가 포함되고, 더불어 레이블링된 적어도 하나의 패치가 포함될 수 있다. 또한, 개별 학습용 데이터에는 서로 연관된 이종 항목들이 포함될 수 있다.

도 9는 패치들이 샘플링되어 배치(940)가 생성되는 예시를 나타내는 도면이다. 도 9를 참조하면, 제1 도메인과 연관된 제1 병리 데이터 세트(910)에는 제1 유형의 병리 이미지들(912, 914)이 포함되고, 제2 도메인과 연관된 제2 병리 데이터 세트(920)에는 제2 유형의 병리 이미지들(922, 924)이 포함될 수 있다.

각각의 병리 이미지에는 레이블링된 패치가 포함될 수 있다. 도 9에서 패치는 '#'과 숫자로 조합된 사각형으로 표현되어 있다. 도 9 및 도 10에서 패치의 형상이 동일한 크기의 사각형으로 예시하고 있으나, 이는 설명의 편의를 위한 것일 뿐, 실제 각 병리 이미지에서 패치의 형상과 크기가 상이할 수 있다.

도 9에 예시된 바와 같이, 제1 병리 데이터 세트(910)에 포함된 패치들(#1-1 내지 #1-5)이 추출되어, 패치 데이터베이스(930)에 저장될 수 있다. 마찬가지로, 제2 병리 데이터 세트(920)에 포함된 패치들(#2-1 내지 #2-5)이 추출되어, 패치 데이터베이스(930)에 저장될 수 있다.

패치 데이터베이스(930)는 제1 유형의 패치들(#1-1 내지 #1-5)(932) 및 제2 유형의 패치들(#2-1 내지 #2-5)(934)을 저장할 수 있다. 프로세서는 패치 데이터베이스(930)에 포함된 제1 유형의 패치들(932)에 대한 샘플링 개수를 결정하고, 제2 유형의 패치들(934)에 대한 샘플링 개수를 결정한 후, 결정된 개수에 상응하는 각 유형의 패치들을 패치 데이터베이스(930)로부터 가져올(fetch) 수 있다. 각 유형에서 추출되는 샘플링 개수 또는 비율은 사용자에 의해 미리 설정될 수 있다. 예컨대, 제1 유형의 패치에 대한 샘플링 개수는 100개일 수 있고, 제2 유형의 패치에 대한 샘플링 개수는 50개일 수 있다.

프로세서는 패치 데이터베이스(930)로부터 추출한 패치를 이용하여, 미리 결정된 사이즈의 배치(batch)(940)를 생성할 수 있다. 이렇게 생성된 배치(940)는 학습용 데이터 세트의 일부 또는 전부를 구성할 수 있다. 이때, 프로세서는 패치 데이터베이스(930) 내의 패치들을 증강하여, 증강된 패치들(#3-1 내지 #3-6)을 포함하는 배치(940)를 생성할 수 있다.

도 10은 패치들이 샘플링되어 배치(1040)가 생성되는 다른 예시를 나타내는 도면이다. 도 10을 참조하면, 제1 도메인과 연관된 제1 병리 데이터 세트(1010)에는 제1 유형의 병리 이미지들(1012, 1014)이 포함하고, 제2 도메인과 연관된 제2 병리 데이터 세트(1020)에는 제2 유형의 병리 이미지들(1022, 1024)이 포함될 수 있다.

도 10에 예시된 바와 같이, 제1 병리 데이터 세트(1010)에 포함된 패치들(#1-1 내지 #1-5)가 추출되어, 패치 데이터베이스(1030)에 저장될 수 있다. 마찬가지로, 제2 병리 데이터 세트(1020)에 포함된 패치들(#2-1 내지 #2-3)가 추출되어, 패치 데이터베이스(1030)에 저장될 수 있다.

하지만, 제2 병리 데이터 세트(1020)로부터 추출된 패치(#2-1 내지 #2-3)의 개수가, 제1 병리 데이터 세트(1010)로부터 추출된 패치(#1-1 내지 #1-5)의 개수 보다 적은 경우, 제2 병리 데이터 세트(1020)로부터 추출된 패치(#2-1 내지 #2-3) 중에서 적어도 하나를 대상으로 패치 복사가 이루어질 수 있다. 예컨대, 제1 유형의 패치 개수와 제2 유형의 패치 개수가 동일하게 패치 데이터베이스(1030)에 저장되도록, 제1 유형의 패치 또는 제2 유형의 패치를 대상으로 패치 복사가 수행될 수 있다. 또한, 제1 유형의 패치 개수와 제2 유형의 패치 개수가 미리 결정된 비율이 되도록, 제1 유형의 패치 또는 제2 유형의 패치를 대상으로 패치 복사가 수행될 수 있다.

도 10에서는 #2-2의 패치와 #2-3의 패치를 대상으로 패치 복사가 이루어진 것으로 예시된다. 복사된 패치(#2-2, #2-3)는 패치 데이터베이스(1030)에 포함될 수 있다. 이러한 패치 복사가 수행됨에 따라, 각 유형의 패치 개수의 균형을 이루어 패치 데이터베이스(1030)에 저장될 수 있다.

프로세서는 패치 데이터베이스(1030)에 저장된 패치들(1032, 1034)을 소정의 개수만큼 무작위로 가져오고, 추출한 패치들을 이용하여 학습용 데이터 세트의 일부 또는 전부를 구성하는 배치(1040)를 생성할 수 있다. 다른 예로서, 프로세서는 패치 데이터베이스(1030)에 포함된 제1 유형의 패치들(1032)에 대한 샘플링 개수를 결정하고, 제2 유형의 패치들(1034)에 대한 샘플링 개수를 결정한 후, 결정된 개수에 상응하는 각 유형의 패치들을 패치 데이터베이스(1030)로부터 가져오고, 가져온 패치들을 이용하여 배치(1040)를 생성할 수 있다. 프로세서는 패치 데이터베이스(1030) 내의 패치들을 증강하여, 증강된 패치들((#3-1 내지 #3-6)을 포함하는 배치(1040)를 생성할 수 있다.

한편, 주석 정보를 포함하는 병리 이미지로부터 패치를 추출하는 작업을 수행하지 않고, 주석 정보를 포함하는 이종 병리 이미지들을 이용하여 학습용 데이터 세트를 생성할 수 있다. 구체적으로, 분석 시스템의 프로세서는 제1 병리 데이터 세트로부터 추출한 복수의 제1 유형의 병리 이미지 및 제2 병리 데이터 세트로부터 추출한 복수의 제2 유형의 병리 이미지에 기초하여, 학습용 데이터 세트를 생성할 수 있다. 이때, 분석 시스템의 프로세서는 추출한 제1 유형의 병리 이미지의 각각을 기초로 복수의 학습용 데이터를 생성할 수 있고, 제2 병리 데이터 세트에 포함된 제2 유형의 병리 이미지의 각각을 기초로 복수의 학습용 데이터를 생성할 수 있다.

일 실시예에 따르면, 프로세서는 제1 샘플링 개수와 상응하도록, 제1 병리 이미지 세트에서 복수의 제1 유형의 병리 이미지를 추출할 수 있고, 제2 샘플링 개수와 상응하도록, 제2 병리 이미지 세트에서 복수의 제2 유형의 병리 이미지를 추출할 수 있다. 또한, 프로세서는 제1 병리 이미지 또는 제2 병리 이미지 중 적어도 하나를 증강하여, 증강된 이미지를 포함하는 학습용 데이터 세트를 생성할 수 있다. 이미지 증강을 위한 방법으로서, 상술한 패치와 연관된 이미지 증강 방법이 이용될 수 있다.

한편, 특정 유형의 세포 또는 특정 염색 방법에 대해서 더욱 정확한 결과를 출력하기 위하여, 병리 이미지 분석 모델에는 추가 학습용 데이터 세트가 입력되어, 병리 이미지 분석 모델이 추가 학습되어 성능이 개선될 수 있다. 여기서 특정 염색 방법은, 기존의 염색 방법(예컨대, H&E 염색 방법) 또는 신규로 개발된 염색 방법일 수 있다. 예컨대, 특정 염색 방법을 통해서 염색된 복수 개의 병리 이미지를 포함하는 추가 학습용 데이터 세트가 준비되고, 이 추가 학습용 데이터 세트가 이용되어, 병리 이미지 분석 모델이 추가 학습될 수 있다. 이 경우, 특정 염색 방법에 더욱 민감하게 반응할 수 있도록 병리 이미지 분석 모델에 포함된 노드의 가중치가 조절될 수 있다.

도 11은 본 개시의 일 실시예에 따른, 병리 이미지 분석 모델을 통해서 병리 이미지의 분석 결과가 출력되는 것을 예시하는 도면이다. 도 11에 예시된 바와 같이, 다양한 유형의 병리 이미지(1110_1 내지 1110_3)가 병리 이미지 분석 모델(1120)에 입력될 수 있다. 여기서, 병리 이미지(1110_1 내지 1110_3)는 학습에 이용된 병리 이미지의 유형과 동일한 유형일 수 있고, 또는 새로운 바이오마커를 통해서 획득된 병리 이미지일 수 있다. 즉, 병리 이미지(1110_1 내지 1110_3)와 연관된 도메인은 병리 이미지 분석 모델(1120)에서 학습된 도메인과 동일한 도메인이거나 상이한 도메인일 수 있다.

병리 이미지 분석 모델(1120)은 병리 이미지(1110_1 내지 1110_3)에 대한 분석 결과(1130)를 출력할 수 있다. 여기서, 분석 결과(1130)는 병리 이미지(1110_1 내지 1110_3)로부터 추출된, 오브젝트별 클래스를 포함할 수 있다. 여기서, 오브젝트 클래스는 세포 종류 및/또는 평가 지표를 포함하고, 평가 지표는 양성 유무, 발현 등급, 발현 값 또는 발현 통계 정보 중 적어도 하나를 포함할 수 있다. 또한, 분석 결과(1130)는 병리 이미지(1110_1 내지 1110_3)에 대한 세그먼테이션 결과일 수 있다. 즉, 분석 결과(1130)는, 병리 이미지(1110_1 내지 1110_3)로부터 식별된 적어도 하나의 조직 및 조직의 종류를 포함할 수 있다.

도 12는 본 개시의 일 실시예에 따른, 병리 이미지 분석 모델에 포함된 인공신경망 모델(1200)을 예시하는 도면이다. 인공신경망 모델(1200)은, 기계학습 모델의 일 예로서, 기계학습(Machine Learning) 기술과 인지과학에서, 생물학적 신경망의 구조에 기초하여 구현된 통계학적 학습 알고리즘 또는 그 알고리즘을 실행하는 구조이다.

일 실시예에 따르면, 인공신경망 모델(1200)은, 생물학적 신경망에서와 같이 시냅스의 결합으로 네트워크를 형성한 인공 뉴런인 노드(Node)들이 시냅스의 가중치를 반복적으로 조정하여, 특정 입력에 대응한 올바른 출력과 추론된 출력 사이의 오차가 감소되도록 학습함으로써, 문제 해결 능력을 가지는 기계학습 모델을 나타낼 수 있다. 예를 들어, 인공신경망 모델(1200)은 기계학습, 딥러닝 등의 인공지능 학습법에 사용되는 임의의 확률 모델, 뉴럴 네트워크 모델 등을 포함할 수 있다.

상술한 병리 이미지 분석 모델은 인공신경망 모델(1200)의 형태로 구현될 수 있다. 일 실시예에 따르면, 인공신경망 모델(1200)은 주석 정보를 포함하는 하나 이상의 병리 이미지를 수신하고, 수신된 하나 이상의 병리 이미지에서 염색으로 발현된 오브젝트를 검출하도록 학습될 수 있다. 예를 들어, 인공신경망 모델(1200)은 하나 이상의 병리 이미지 내의 각각의 영역에 대하여, 각각의 영역이 정상 영역 또는 이상 영역에 해당하는지 여부를 판정하는 분류 기능(즉, 분류기의 기능)을 수행할 수 있도록 학습될 수 있다. 다른 예에서, 인공신경망 모델(1200)은 하나 이상의 병리 이미지 내의 이상 영역에 포함된 픽셀에 대한 레이블링을 수행하는 세그먼테이션 기능을 수행할 수 있도록 학습될 수 있다. 이때, 인공신경망 모델(1200)은 이상 영역과 연관된 오브젝트에 대한 평가 지표를 판정하여 오브젝트에 레이블링할 수 있다.

인공신경망 모델(1200)은 다층의 노드들과 이들 사이의 연결로 구성된 다층 퍼셉트론(MLP: multilayer perceptron)으로 구현될 수 있다. 본 실시예에 따른 인공신경망 모델(1200)은 MLP를 포함하는 다양한 인공신경망 모델 구조들 중의 하나를 이용하여 구현될 수 있다. 인공신경망 모델(1200)은, 외부로부터 입력 신호 또는 데이터를 수신하는 입력층, 입력 데이터에 대응한 출력 신호 또는 데이터를 출력하는 출력층, 입력층과 출력층 사이에 위치하며 입력층으로부터 신호를 받아 특성을 추출하여 출력층으로 전달하는 n개(여기서, n은 양의 정수)의 은닉층으로 구성된다.

인공신경망 모델(1200)의 입력층과 출력층에 복수의 입력변수와 대응되는 복수의 출력변수가 각각 매칭되고, 입력층, 은닉층 및 출력층에 포함된 노드들 사이의 시냅스 값이 조정됨으로써, 특정 입력에 대응한 올바른 출력이 추출될 수 있도록 학습될 수 있다. 학습용 데이터 세트에 포함된 데이터를 기초로 인공신경망 모델(1200)이 반복적으로 학습되면, 입력변수에 기초하여 계산된 출력변수와 목표 출력 간의 오차가 줄어들도록 인공신경망 모델(1200)의 노드들 사이의 시냅스 값(또는 가중치)를 조정되어, 최적의 값으로 수렴될 수 있다.

상술한 바와 같이, 병리 이미지 분석 모델에 대해서 충분한 양의 학습이 수행되면, 주석 정보가 입력되지 않은(즉, 레이블링되지 않은) 병리 이미지에 대해서도, 병리 전문가 수준에 해당하는 분석 결과가 병리 이미지 분석 모델을 통해서 출력될 수 있다.

도 13은 본 개시의 일 실시예에 따른, 병리 이미지 분석 모델을 이용하여 병리 이미지에 대한 분석 결과를 출력하는 방법(1300)을 설명하는 흐름도이다. 도 13에 도시된 방법은, 본 개시의 목적을 달성하기 위한 일 실시예일 뿐이며, 필요에 따라 일부 단계가 추가되거나 삭제될 수 있음은 물론이다. 또한, 도 13에 도시된 방법은, 도 5에 도시된 분석 시스템에 포함된 적어도 하나의 프로세서에 의해서 수행될 수 있다. 설명의 편의를 위해서 도 5에 도시된 분석 시스템에 포함된 프로세서에 의해서, 도 13에 도시된 각 단계가 수행되는 것으로 설명하기로 한다.

도 13을 참조하면, 프로세서는 병리 이미지를 획득할 수 있다(S1310). 일 실시예에 따르면, 프로세서는 스캐너로부터 전송된 병리 이미지를 획득하거나, 외부 저장소, 서버, 또는 이미지 관리 시스템으로부터 병리 이미지를 획득할 수 있다.

이어서, 프로세서는 병리 이미지를 병리 이미지 분석 모델에 입력하고, 병리 이미지 분석 모델로부터 출력되는 병리 이미지에 대한 분석 결과를 획득할 수 있다(S1320). 일 실시예에 따르면, 분석 결과는 병리 이미지로부터 식별된 오브젝트(즉, 오브젝트에 대응되는 영역 내에 포함되는 픽셀 범위)와 오브젝트 클래스를 포함할 수 있다. 여기서, 오브젝트 클래스는 세포 또는 조직의 종류 및/또는 평가 지표를 포함하고, 평가 지표는 양성 유무, 발현 등급, 발현 값 또는 발현 통계 정보 중 적어도 하나를 포함할 수 있다.

그 후, 프로세서는 획득된 분석 결과를 출력할 수 있다(S1330). 예컨대, 프로세서는 분석 결과를 모니터와 같은 디스플레이 장치에 출력할 수 있다. 다른 예로서, 프로세서는 분석 결과를 의뢰인의 단말로 전송하여, 의뢰인의 단말을 통해 출력되게 할 수 있다. 일 실시예에 따르면, 프로세서는 획득된 분석 결과를 리포트 형태로 출력할 수 있다.

한편, 병리 이미지 분석 모델은 각기 다른 유형의 분석 결과를 출력하는 복수의 분석 모델을 포함할 수 있다.

도 14는 본 개시의 다른 실시예에 따른, 병리 이미지 분석 모델(1400)을 예시하는 도면이다. 도 14에 예시된 바와 같이, 병리 이미지 분석 모델(1400)은, 각기 다른 유형의 병리 이미지를 분석하도록 사전에 학습되어, 서로 다른 유형의 분석 결과를 출력하는 복수의 분석 모델(1410 내지 1440)을 포함할 수 있다. 가령, 병리 이미지 분석 모델(1400)은, 입력된 병리 이미지에 대한 세그먼테이션 결과를 출력하는 제1 분석 모델(1410), 병리 이미지에 포함된 세포막의 염색 강도를 분석하여 분석 결과를 출력하는 제2 분석 모델(1420), 세포핵의 염색 강도를 분석하여 분석 결과를 출력하는 제3 분석 모델(1430) 및 세포핵 및/또는 세포막의 형태학적 특성을 분석하여 분석 결과를 출력하는 제4 분석 모델(1440)을 포함할 수 있다.

이렇게 복수의 분석 모델이 병리 이미지 분석 모델(1400)에 포함되는 경우, 분석 모델(1410 내지 1440)의 각각은 서로 상이한 특성을 가지는 병리 이미지를 포함하는 학습용 데이터 세트를 기초로 학습될 수 있다. 여기서, 특성은 염색 색상, 염색 대상의 유형 또는 염색 방식 중 적어도 하나를 포함할 수 있다.

예컨대, 제1 분석 모델(1410)은 타깃 학습용 데이터를 입력받고, 이 타깃 학습용 데이터에 포함된 병리 이미지로부터 이상 영역(즉, 패치와 관련된 오브젝트)을 세그먼테이션하도록 학습될 수 있다. 즉, 제1 분석 모델(1410)은 병리 이미지에서 염색이 발현된 위치 영역(즉, 오브젝트)을 추출하도록 학습될 수 있다. 이 경우, 제1 분석 모델(1410)에 병리 이미지가 입력되어 적어도 하나의 패치가 제1 분석 모델(1410)로부터 출력될 수 있다. 또한, 제1 분석 모델(1410)로부터 출력된 패치에 해당하는 영역과 주석 정보에 포함된 이상 영역 간의 손실 값이 산출되고, 손실 값이 제1 분석 모델(1410)에 피드백되어, 제1 분석 모델(1410)이 학습될 수 있다.

다른 예로서, 제2 분석 모델(1420)은 세포막이 갈색으로 염색된 병리 이미지를 포함하는 타깃 학습용 데이터를 입력 받아, 병리 이미지에 포함된 패치에 대한 염색 강도를 분석하도록 학습될 수 있다. 이 경우, 갈색으로 염색된 세포막이 패치로서 설정된 병리 이미지가 제2 분석 모델(1420)에 입력되어, 세포막에 대한 염색 강도의 분석 결과가 제2 분석 모델(1420)로부터 출력될 수 있다. 또한, 타깃 학습용 데이터에 포함된 패치의 레이블링 정보로부터 평가 지표가 추출되고, 평가 지표와 제2 분석 모델(1420)로부터 출력된 분석 결과 간의 손실 값이 산출된 후, 손실 값이 제2 분석 모델(1420)에 피드백되어, 제2 분석 모델(1420)이 학습될 수 있다.

또 다른 예로서, 제3 분석 모델(1430)은 세포핵이 청색으로 염색된 병리 이미지를 포함하는 타깃 학습용 데이터를 입력 받아, 병리 이미지에 포함된 패치에 대한 염색 강도를 분석하도록 학습될 수 있다. 이 경우, 청색으로 염색된 세포핵이 패치로서 설정된 병리 이미지가 제3 분석 모델(1430)로 입력되고, 세포핵에 대한 염색 강도의 분석 결과가 제3 분석 모델(1430)로부터 출력될 수 있다. 또한, 타깃 학습용 데이터에 포함된 패치의 레이블링 정보로부터 평가 지표가 레퍼런스 값으로서 추출되고, 제3 분석 모델(1430)로부터 출력된 분석 결과와 평가 지표 간의 손실 값이 산출된 후, 손실 값이 제3 분석 모델(1430)에 피드백되어, 제3 분석 모델(1430)이 학습될 수 있다.

또 다른 예로서, 제4 분석 모델(1440)은 세포핵 및 세포막이 분홍색으로 염색된 병리 이미지를 포함하는 타깃 학습용 데이터를 입력 받아, 병리 이미지에 포함된 세포핵 및/또는 세포막의 형태학적 특성 및/또는 색상 분포를 분석하도록 학습될 수 있다. 이 경우, 분홍색으로 염색된 세포핵 및 세포막 각각이 패치로서 설정된 병리 이미지가 제4 분석 모델(1440)으로 입력되어, 세포핵 및/또는 세포막에 대한 형태학적 특성 및/또는 색상 분포를 포함하는 분석 결과가 제4 분석 모델(1440)로부터 출력될 수 있다. 또한, 타깃 학습용 데이터에 포함된 패치의 레이블링 정보로부터 세포핵 및/또는 세포막의 형태학적 특성 및/또는 색상 분포가 레퍼런스 값으로서 획득되고, 레퍼런스 값과 분석 결과에 포함된 형태학적 특성 및/또는 색상 분포 손실 값이 산출될 수 있다. 산출된 손실 값은 제4 분석 모델(1440)로 피드백되어, 제4 분석 모델(1440)이 학습될 수 있다.

병리 이미지의 특성 정보에 기초하여, 병리 이미지 분석 모델(1400)에 포함된 복수의 분석 모델(1410 내지 1440) 중에서 하나 이상이 호출될 수 있다.

도 15는 본 개시의 다른 실시예에 따른, 병리 이미지(1510)의 특성에 기초하여 호출된 분석 모델을 통해 병리 이미지에 대한 분석 결과(1520)가 출력되는 것을 예시하는 도면이다. 도 15에 예시된 바와 같이, 병리 이미지(1510)의 특성을 추출하기 위한, 특성 추출 모델(1500)이 병리 이미지 분석 모델(1400)과 결합될 수 있다. 일부 실시예에서는, 특성 추출 모델(1500)이 병리 이미지 분석 모델(1400)에 포함될 수 있다.

본 실시예에 따르면, 특성 추출 모델(1500)은 병리 이미지에 포함된 염색 색상과 색상의 발현 위치를 특성으로서 추출할 수 있다. 여기서, 염색 색상의 발현 위치는 세포막, 세포핵 또는 세포질 중 적어도 하나일 수 있다. 다른 실시예에서, 특성 추출 모델(1500)은 병리 이미지의 특성으로서, 장기, 암종, 염색 방식 등을 추출할 수 있다. 예컨대, 특성 추출 모델(1500)은 미리 저장된 장기 패턴, 암종 패턴 또는 염색 방식 패턴 중 적어도 하나를 저장하고, 병리 이미지에 나타나는 패턴과 장기 패턴/암종 패턴/염색 방식 패턴을 비교하여, 병리 이미지로부터 특성을 추출할 수 있다. 다른 예로서, 특성 추출 모델(1500)은 기계학습 모델로 구현되어, 병리 이미지와 연관된 장기, 병리 이미지에 포함된 암종 또는 병리 이미지의 염색 방식 중 적어도 병리 이미지로부터 추출할 수 있도록 학습될 수 있다.

도 15을 참조하면, 병리 이미지(1510)가 획득되고, 병리 이미지(1510)가 특성 추출 모델(1500) 및 병리 이미지 분석 모델(1400) 각각으로 입력될 수 있다. 여기서, 병리 이미지(1510)는 레이블링되지 않은 병리 이미지일 수 있다. 또한, 병리 이미지는 신약 또는 새로운 염색 방식과 연관된 병리 이미지일 수 있다.

특성 추출 모델(1500)은 병리 이미지에 대한 특성을 추출하고, 추출된 병리 이미지의 특성을 병리 이미지 분석 모델(1400)로 제공할 수 있다. 일 실시예에 따르면, 특성 추출 모델(1500)은 염색 색상, 장기, 암종 또는 염색 방식 중 적어도 하나를, 병리 이미지(1510)의 특성으로서 추출할 수 있다.

병리 이미지 분석 모델(1400)은 제1 분석 모델(1410)을 호출한 후, 병리 이미지(1510)를 제1 분석 모델(1410)에 입력하여 병리 이미지에 포함된 이상 영역과 관련된 적어도 하나의 오브젝트에 대한 세그먼테이션을 수행할 수 있다. 또한, 병리 이미지 분석 모델(1400)은, 특성 추출 모델(1500)로부터 제공된 병리 이미지에 특성에 기초하여, 서로 다른 유형의 분석 결과를 출력하는 복수의 분석 모델(1420 내지 1440) 중에서 어느 하나를 호출하고, 호출된 분석 모델(1420, 1430 또는 1440)로부터 병리 이미지에 대한 분석 결과(1520)를 획득할 수 있다. 이때, 병리 이미지 분석 모델(1400)은 제1 분석 모델(1410)을 통해서 세그먼테이션된 병리 이미지를 호출된 분석 모델(1420, 1430 또는 1440)로 입력할 수 있다.

병리 이미지의 특성에는 염색 색상 및/또는 염색 색상의 발현 위치(예컨대, 세포막/세포질/세포핵)가 포함될 수 있다. 이 경우, 병리 이미지 분석 모델(1400)은, 병리 이미지의 특성에 기초하여 복수의 분석 모델(1420 내지 1440) 중에서 어느 하나를 타깃 분석 모델로 결정하여 호출할 수 있다. 예컨대, 발현 위치가 세포막이고 염색 색상이 갈색을 포함하는 제1 특성이 특성 추출 모델(1500)로부터 제공된 경우, 병리 이미지 분석 모델(1400)은 제2 분석 모델(1420)을 타깃 분석 모델로 결정하여 호출하고, 제2 분석 모델(1420)로 세그먼테이션된 병리 이미지를 입력할 수 있다. 이 경우, 제2 분석 모델(1420)은 병리 이미지에서 세그먼테이션된 영역(즉, 오브젝트)에서 세포막이 갈색으로 발현된 염색 강도를 분석하고, 이 분석 결과(1520)를 출력할 수 있다.

다른 예로서, 발현 위치가 세포핵이고 염색 색상이 청색을 포함하는 제2 특성이 특성 추출 모델(1500)로부터 제공된 경우, 병리 이미지 분석 모델(1400)은 제3 분석 모델(1430)을 타깃 분석 모델로 결정하여 호출하고, 제3 분석 모델(1430)로 세그먼테이션된 병리 이미지를 입력할 수 있다. 이 경우, 제3 분석 모델(1430)은 병리 이미지에서 세그먼테이션된 영역에서 세포핵이 청색으로 발현된 염색 강도를 분석하고, 이 분석 결과(1520)를 출력할 수 있다.

다른 예로서, 발현 위치가 세포핵과 세포막이고 염색 색상이 분홍색을 포함하는 제3 특성이 특성 추출 모델(1500)로부터 제공된 경우, 병리 이미지 분석 모델(1400)은 제4 분석 모델(1440)을 타깃 분석 모델로 결정하여 호출하고, 제4 분석 모델(1440)로 세그먼테이션된 병리 이미지를 입력할 수 있다. 이 경우, 제4 분석 모델(1440)은 병리 이미지에서 세그먼테이션된 각 영역에서 세포핵과 세포막 각각이 분홍색으로 발현된 분포 및/또는 형태학적 특성을 분석하여 출력할 수 있다. 여기서, 형태학적 특성은, 특정 질병과 관련성을 의미할 수 있다.

한편, 병리 이미지의 특성이 사용자로부터 수신될 수 있다. 즉, 분석 시스템은 병리 이미지의 특성을 포함하는 사용자의 입력 정보를 수신할 수 있다. 이 경우, 사용자가 입력한 병리 이미지의 특성에 기초하여, 호출되는 분석 모델이 결정될 수 있다.

도 16은 본 개시의 또 다른 실시예에 따른, 사용자의 입력 정보에 기초하여 호출된 분석 모델을 통해 병리 이미지(1610)에 대한 분석 결과(1630)가 출력되는 것을 예시하는 도면이다. 도 16에 예시된 바와 같이, 병리 이미지 분석 모델(1400)은 병리 이미지(1610)의 특성을 포함하는 사용자의 입력 정보(1620)를 획득할 수 있다. 병리 이미지 분석 모델(1400)은 제1 분석 모델(1410)을 호출한 후, 병리 이미지(1610)를 제1 분석 모델(1410)에 입력하여 병리 이미지에 포함된 이상 영역과 관련된 오브젝트에 대한 세그먼테이션을 수행할 수 있다.

또한, 병리 이미지 분석 모델(1400)은, 사용자의 입력 정보(1620)에 포함된 병리 이미지의 특성에 기초하여, 복수의 분석 모델 중에서 호출되는 타깃 분석 모델을 결정할 수 있다. 사용자의 입력 정보(1620)에는 염색 색상 및/또는 염색 색상의 발현 위치(예컨대, 세포막/세포질/세포핵)가 포함될 수 있다. 추가적으로 또는 대안적으로, 사용자 입력 정보(1620)에는 장기, 암종 또는 염색 방식 중 적어도 하나를 포함할 수 있다.

병리 이미지 분석 모델(1400)은, 사용자의 입력 정보(1620)에 포함된 특성에 기초하여 복수의 분석 모델(1420 내지 1440) 중에서 어느 하나를 타깃 분석 모델로 결정하여 호출할 수 있다. 예컨대, 사용자의 입력 정보(1620)에 제1 염색 방식이 포함된 경우, 병리 이미지 분석 모델(1400)은 제2 분석 모델(1420)을 타깃 분석 모델로 결정하여 호출하고, 제2 분석 모델(1420)로 세그먼테이션된 병리 이미지를 입력할 수 있다. 이 경우, 제2 분석 모델(1420)은 병리 이미지에서 세그먼테이션된 영역에서 제1 염색 방식으로 발현된 염색 강도를 분석하고, 이 분석 결과(1630)를 출력할 수 있다.

다른 예로서, 사용자의 입력 정보(1620)에 제2 염색 방식이 포함된 경우, 병리 이미지 분석 모델(1400)은 제3 분석 모델(1430)을 타깃 분석 모델로 결정하여 호출하고, 제3 분석 모델(1430)로 세그먼테이션된 병리 이미지를 입력할 수 있다. 이 경우, 제2 분석 모델(1430)은 병리 이미지에서 세그먼테이션된 영역에서 제2 염색 방식으로 발현된 염색 강도를 분석하고, 이 분석 결과(1630)를 출력할 수 있다.

또 다른 예로서, 사용자의 입력 정보(1620)에 제3 염색 방식이 포함된 경우, 병리 이미지 분석 모델(1400)은 제4 분석 모델(1440)을 타깃 분석 모델로 결정하여 호출하고, 제4 분석 모델(1440)로 세그먼테이션된 병리 이미지를 입력할 수 있다. 이 경우, 제4 분석 모델(1440)은 병리 이미지에서 세그먼테이션된 영역에서 제3 염색 방식에 의해 발현된 색상에 대한 분포 및/또는 형태학적 특성을 포함하는 분석 결과(1630)를 출력할 수 있다

상술한 바와 같이, 복수의 분석 모델(1410 내지 1440)이 병리 이미지 분석 모델(1400)에 포함된 경우, 병리 이미지 분석 모델(1400)은 다양한 염색 방식에 따라 염색된 다양한 세포에 대해서, 적절한 분석 결과를 출력할 수 있다. 이에 따라, 본 개시에 따른 병리 이미지 분석 모델(1400)은 범용적으로 적용되어, 다양한 환경에서 사용될 수 있다.

이하, 도 17 내지 도 20을 참조하여, 병리 이미지 분석 모델(1400)을 통해서, 출력되는 다양한 형태의 분석 결과에 대해서 설명한다.

도 17 내지 도 20은 병리 이미지 분석 모델(1400)로부터 출력되는 다양한 형태의 분석 결과를 예시하는 도면이다. 도 17 내지 도 20에서는, 병리 이미지 내에서 식별되는 적어도 하나의 객체(예를 들면, 세포, 조직, 또는 구조)가 타원인 것으로 예시하고 있다.

도 17에 예시된 바와 같이, 병리 이미지 분석 모델(1400)은 복수의 병리 이미지들(1710)을 입력받고, 각 병리 이미지들(1710)에 포함된 객체의 염색 발현 여부를 양성 또는 음성으로 판정한 후, 판정된 결과(1720, 1730)를 출력할 수 있다. 여기서, 양성은 염색의 타깃이 되는 단백질이 객체 상에 존재한다는 것을 의미하고, 음성은 염색의 타깃이 되는 단백질이 객체 상에 존재하지 않는다는 것을 의미할 수 있다. 도 17에서는 양성으로 판정된 병리 이미지(1720)와 음성으로 판정된 병리 이미지(1730)가 구분되어 출력되는 것으로 예시하고 있다.

도 18에 예시된 바와 같이, 병리 이미지 분석 모델(1400)은 복수의 병리 이미지들(1810)을 입력받고, 각 병리 이미지들(1810)에 포함된 적어도 하나의 객체에 대한 염색 발현 등급을 판정하고, 판정된 발현 등급(1820 내지 1850)을 포함하는 분석 결과를 출력할 수 있다. 도 18에서는 class 3+이 가장 강하게 발현된 객체이고, class 0이 가장 약하게 발현된 객체임을 예시하고 있다. Class 0은, 염색의 타깃이 되는 단백질이 객체 상에 존재하지 않는다는 것을 의미할 수 있다

도 19에 예시된 바와 같이, 병리 이미지 분석 모델(1400)은 복수의 병리 이미지들(1910)을 입력받고, 각 병리 이미지들(1910)에 포함된 객체의 발현 값을 소정의 범위(예컨대, 0 부터 1)에 포함된 숫자로서 수치화한 후, 객체별 발현 값(1920 내지 1950)을 포함하는 분석 결과를 출력할 수 있다. 도 19에서는 1에 가까운 발현 값일수록 염색 발현 정도가 가장 것으로 예시되어 있다.

도 20에 예시된 바와 같이, 병리 이미지 분석 모델(1400)은 복수의 병리 이미지들(2010)을 입력받고, 각 병리 이미지들에 포함된 객체의 발현 통계 정보를 포함하는 분석 결과(2020)를 출력할 수 있다. 도 20에서는 세포핵의 양성 유무/등급/발현 값의 분포에 대한 통계 정보 및 세포막의 양성 유무/등급 /발현 값의 분포에 대한 통계 정보를 포함하는 분석 결과(2020)를 예시하고 있다. 이외에도 다양한 세포, 조직, 또는 구조에 대한 통계 정보가 병리 이미지 분석 모델(1400)을 통해서 출력될 수 있다.

도 21은 본 개시의 일 실시예에 따른 병리 이미지를 분석하는 예시적인 시스템 구성도이다. 도 21의 정보 처리 시스템(2100)은 도 5에서 도시한 분석 시스템(510)의 일 예시일 수 있다. 도시된 바와 같이, 정보 처리 시스템(2100)은 하나 이상의 프로세서(2120), 버스(2110), 통신 인터페이스(2130), 프로세서(2120)에 의해 수행되는 컴퓨터 프로그램(2150)을 로드(load)하는 메모리(2140)를 포함할 수 있다. 다만, 도 21에는 본 개시의 실시예와 관련 있는 구성요소들만이 도시되어 있다. 따라서, 본 개시가 속한 기술분야의 통상의 기술자라면 도 21에 도시된 구성요소들 외에 다른 범용적인 구성 요소들이 더 포함될 수 있음을 알 수 있다.

프로세서(2120)는 정보 처리 시스템(2100)의 각 구성의 전반적인 동작을 제어한다. 본 개시의 프로세서(2120)는 복수의 프로세서로 구성될 수 있다. 프로세서(2120)는 CPU(Central Processing Unit), MPU(Micro Processor Unit), MCU(Micro Controller Unit), GPU(Graphic Processing Unit), FPGA(Field Programmable Gate Array), 본 개시의 기술 분야에 잘 알려진 임의의 형태의 프로세서 중 적어도 두 개의 프로세서를 포함하여 구성될 수 있다. 또한, 프로세서(2120)는 본 개시의 실시예들에 따른 방법을 실행하기 위한 적어도 하나의 애플리케이션 또는 프로그램에 대한 연산을 수행할 수 있다.

메모리(2140)는 각종 데이터, 명령 및/또는 정보를 저장할 수 있다. 메모리(2140)는 본 개시의 다양한 실시예들에 따른 방법/동작을 실행하기 위하여 하나 이상의 컴퓨터 프로그램(2150)을 로드할 수 있다. 메모리(2140)는 RAM과 같은 휘발성 메모리로 구현될 수 있으나, 본 개시의 기술적 범위는 이에 한정되지 아니한다. 예를 들어, 메모리(2140)는 ROM(Read Only Memory), EPROM(Erasable Programmable ROM), EEPROM(Electrically Erasable Programmable ROM), 플래시 메모리 등과 같은 비휘발성 메모리, 하드 디스크, 착탈형 디스크, 또는 본 개시가 속하는 기술 분야에서 잘 알려진 임의의 형태의 컴퓨터로 읽을 수 있는 기록 매체를 포함하여 구성될 수 있다.

버스(2110)는 정보 처리 시스템의 구성 요소 간 통신 기능을 제공할 수 있다. 버스(2110)는 주소 버스(Address Bus), 데이터 버스(Data Bus) 및 제어 버스(Control Bus) 등 다양한 형태의 버스로 구현될 수 있다.

통신 인터페이스(2130)는 정보 처리 시스템의 유무선 인터넷 통신을 지원할 수 있다. 또한, 통신 인터페이스(2130)는 인터넷 통신 외의 다양한 통신 방식을 지원할 수도 있다. 이를 위해, 통신 인터페이스(2130)는 본 개시의 기술 분야에 잘 알려진 통신 모듈을 포함하여 구성될 수 있다.

컴퓨터 프로그램(2150)은 프로세서(2120)로 하여금 본 개시의 다양한 실시예들에 따른 동작/방법을 수행하도록 하는 하나 이상의 인스트럭션들(instructions)을 포함할 수 있다. 즉, 프로세서(2120)는 하나 이상의 인스트럭션들을 실행함으로써, 본 개시의 다양한 실시예들에 따른 동작/방법들을 수행할 수 있다. 예를 들어, 컴퓨터 프로그램(2150)은 병리 이미지를 획득하는 동작, 획득된 병리 이미지를 기계학습 모델에 입력하여, 기계학습 모델로부터 병리 이미지에 대한 분석 결과를 획득하는 동작 및 획득된 분석 결과를 출력하기 동작 등을 수행하도록 하는 하나 이상의 인스트럭션들을 포함할 수 있다. 일 실시예에 따르면, 기계학습 모델은 제1 도메인과 연관된 제1 병리 데이터 세트 및 제1 도메인과 상이한 제2 도메인과 연관된 제2 병리 데이터 세트에 기초하여 생성된 학습용 데이터 세트를 이용하여 학습된 모델일 수 있다. 이와 같은 경우, 정보 처리 시스템(2100)을 통해 본 개시의 몇몇 실시예들에 따라 병리 이미지를 분석하기 위한 시스템이 구현될 수 있다.

본 개시의 앞선 설명은 통상의 기술자들이 본 개시를 행하거나 이용하는 것을 가능하게 하기 위해 제공된다. 본 개시의 다양한 수정예들이 통상의 기술자들에게 쉽게 자명할 것이고, 본원에 정의된 일반적인 원리들은 본 개시의 취지 또는 범위를 벗어나지 않으면서 다양한 변형예들에 적용될 수도 있다. 따라서, 본 개시는 본원에 설명된 예들에 제한되도록 의도된 것이 아니고, 본원에 개시된 원리들 및 신규한 특징들과 일관되는 최광의의 범위가 부여되도록 의도된다.

비록 예시적인 구현예들이 하나 이상의 독립형 컴퓨터 시스템의 맥락에서 현재 개시된 주제의 양태들을 활용하는 것을 언급할 수도 있으나, 본 주제는 그렇게 제한되지 않고, 오히려 네트워크나 분산 컴퓨팅 환경과 같은 임의의 컴퓨팅 환경과 연계하여 구현될 수도 있다. 또 나아가, 현재 개시된 주제의 양상들은 복수의 프로세싱 칩들이나 디바이스들에서 또는 그들에 걸쳐 구현될 수도 있고, 스토리지는 복수의 디바이스들에 걸쳐 유사하게 영향을 받게 될 수도 있다. 이러한 디바이스들은 PC들, 네트워크 서버들, 및 핸드헬드 디바이스들을 포함할 수도 있다.

본 명세서에서는 본 개시가 일부 실시예들과 관련하여 설명되었지만, 본 개시가 속하는 기술분야의 통상의 기술자가 이해할 수 있는 본 개시의 범위를 벗어나지 않는 범위에서 다양한 변형 및 변경이 이루어질 수 있다는 점을 알아야 할 것이다. 또한, 그러한 변형 및 변경은 본 명세서에서 첨부된 특허 청구의 범위 내에 속하는 것으로 생각되어야 한다.

Claims

적어도 하나의 프로세서에 의해서 수행되는, 병리 이미지 분석 방법에 있어서,

병리 이미지를 획득하는 단계;

상기 획득된 병리 이미지를 기계학습 모델에 입력하여, 상기 기계학습 모델로부터 상기 병리 이미지에 대한 분석 결과를 획득하는 단계; 및

상기 획득된 분석 결과를 출력하는 단계

를 포함하고,

상기 기계학습 모델은 제1 도메인과 연관된 제1 병리 데이터 세트 및 제1 도메인과 상이한 제2 도메인과 연관된 제2 병리 데이터 세트에 기초하여 생성된 학습용 데이터 세트를 이용하여 학습된 모델인,

병리 이미지 분석 방법.
제1항에 있어서,

상기 병리 이미지를 획득하는 단계 이전에,

제1 유형의 병리 이미지를 포함하는 상기 제1 병리 데이터 세트 및 제2 유형의 병리 이미지를 포함하는 상기 제2 병리 데이터 세트를 획득하는 단계;

상기 제1 병리 데이터 세트와 상기 제2 병리 데이터 세트에 기초하여 상기 학습용 데이터 세트를 생성하는 단계; 및

상기 생성된 학습용 데이터 세트를 이용하여 상기 기계학습 모델을 학습시키는 단계

를 더 포함하는, 병리 이미지 분석 방법.
제2항에 있어서,

상기 학습용 데이터 세트를 생성하는 단계는,

염색 발현 등급 또는 관심 영역 중 적어도 하나에 기초하여, 상기 제1 유형의 병리 이미지와 연관된 항목과 상기 제2 유형의 병리 이미지와 연관된 항목을 연관하는 단계; 및

상기 연관된 항목을 포함하는 학습용 데이터 세트를 생성하는 단계

를 포함하는, 병리 이미지 분석 방법.
제3항에 있어서,

상기 항목을 연관하는 단계는,

상기 제1 유형의 병리 이미지에 포함된 종양 조직 영역과 연관된 제1 항목 및 상기 제1 유형의 병리 이미지에 포함된 비종양 조직 영역과 연관된 제2 항목을 추출하는 단계;

상기 제2 유형의 병리 이미지에 포함된 종양 조직 영역과 연관된 제3 항목 및 상기 제2 유형의 병리 이미지에 포함된 비종양 조직 영역과 연관된 제4 항목을 추출하는 단계; 및

상기 추출된 제1 항목과 상기 추출된 제3 항목을 연관하고, 상기 추출된 제2 항목과 상기 추출된 제4 항목을 연관하는 단계

를 포함하는, 병리 이미지 분석 방법.
제3항에 있어서,

상기 항목을 연관하는 단계는,

상기 제1 유형의 병리 이미지에 포함된 픽셀들의 각각의 염색 발현 강도를 나타내는 항목들 중에서, 제1 발현 범위와 연관된 제5 항목 및 제2 발현 범위와 연관된 제6 항목을 추출하는 단계;

상기 제2 병리 데이터 세트에 포함된 픽셀들의 각각의 염색 발현 강도를 나타내는 항목들 중에서, 상기 제1 발현 범위와 연관된 제7 항목 및 상기 제2 발현 범위와 연관된 제8 항목을 식별하는 단계; 및

상기 제5 항목과 상기 제7 항목을 연관하고, 상기 제6 항목과 상기 제8 항목을 연관하는 단계

를 포함하는, 병리 이미지 분석 방법.
제3항에 있어서,

상기 항목을 연관하는 단계는,

상기 제1 유형의 병리 이미지에 포함된 세포의 유형을 나타내는 적어도 하나의 오브젝트 클래스와 상기 제2 유형의 병리 이미지에 포함된 세포의 유형을 나타내는 적어도 하나의 오브젝트 클래스를 연관하는 단계; 또는

상기 제1 유형의 병리 이미지에 포함된 세포의 염색 발현 강도를 나타내는 적어도 하나의 오브젝트 클래스와 상기 제2 유형의 병리 이미지에 포함된 세포의 염색 발현 강도를 나타내는 적어도 하나의 오브젝트 클래스를 연관하는 단계를 포함하는, 병리 이미지 분석 방법.
제2항에 있어서,

상기 제1 병리 데이터 세트와 상기 제2 병리 데이터 세트에 기초하여 상기 학습용 데이터 세트를 생성하는 단계는,

상기 제1 병리 데이터 세트와 상기 제2 병리 데이터 세트로부터 패치들을 추출하는 단계; 및

상기 패치들을 포함하는 상기 학습용 데이터 세트를 생성하는 단계를 포함하고,

상기 생성된 학습용 데이터 세트를 이용하여 상기 기계학습 모델을 학습시키는 단계는,

상기 제1 병리 데이터 세트로부터 추출된 레이블링된 패치들 중에서 제1 샘플링 개수에 상응하는 개수의 제1 유형의 이미지 패치들을 가져오는(fetch) 단계;

상기 제2 병리 데이터 세트로부터 추출된 레이블링된 패치들 중에서 제2 샘플링 개수에 상응하는 개수의 제2 유형의 이미지 패치들을 가져오는 단계;

상기 제1 유형의 이미지 패치들 및 상기 제2 유형의 이미지 패치들에 기초하여, 배치를 생성하는 단계; 및

상기 배치를 이용하여 상기 기계학습 모델을 학습시키는 단계

를 포함하는, 병리 이미지 분석 방법.
제2항에 있어서,

상기 제1 병리 데이터 세트와 상기 제2 병리 데이터 세트에 기초하여 상기 학습용 데이터 세트를 생성하는 단계는,

상기 제1 병리 데이터 세트로부터 제1 유형의 이미지 패치들을 추출하는 단계;

상기 제2 병리 데이터 세트로부터 제2 유형의 이미지 패치들을 추출하는 단계; 및

소정 개수만큼 상기 제1 유형의 이미지 패치들을 복사하여 상기 학습용 데이터 세트에 포함시키는 단계

를 포함하는, 병리 이미지 분석 방법.
제2항에 있어서,

상기 기계학습 모델에 학습시키는 단계는,

상기 제1 유형의 병리 이미지 또는 상기 제2 유형의 병리 이미지 중 적어도 하나에 대한 크기를 조정하는 단계; 및

상기 크기가 조정된 적어도 하나의 병리 이미지를 포함하는 학습용 데이터를 이용하여 상기 기계학습 모델을 학습시키는 단계

를 포함하는, 병리 이미지 분석 방법.
제2항에 있어서,

상기 기계학습 모델에 학습시키는 단계는,

상기 제1 유형의 병리 이미지 또는 상기 제2 유형의 병리 이미지 중 적어도 하나에 포함된 픽셀들 중에서 미리 결정된 범위에 해당하는 픽셀들을 제거하는 단계

를 포함하는, 병리 이미지 분석 방법.
제2항에 있어서,

상기 기계학습 모델에 학습시키는 단계는,

상기 제1 유형의 병리 이미지 또는 상기 제2 유형의 병리 이미지 중 적어도 하나를 좌우 또는 상하로 반전하는 단계; 및

상기 반전된 병리 이미지를 포함하는 학습용 데이터를 이용하여 상기 기계학습 모델을 학습시키는 단계

를 포함하는, 병리 이미지 분석 방법.
제2항에 있어서,

상기 기계학습 모델에 학습시키는 단계는,

상기 제1 유형의 병리 이미지 또는 상기 제2 유형의 병리 이미지 중 적어도 하나에 포함된 픽셀들 중에서 미리 결정된 범위의 픽셀들을 제거하거나 변형하는 단계; 및

상기 미리 결정된 범위의 픽셀들이 제거되거나 변형된 병리 이미지를 포함하는 학습용 데이터를 이용하여 상기 기계학습 모델을 학습시키는 단계

를 포함하는, 병리 이미지 분석 방법.
제2항에 있어서,

상기 기계학습 모델에 학습시키는 단계는,

상기 제1 유형의 병리 이미지 또는 상기 제2 유형의 병리 이미지 중 적어도 하나에 포함된 픽셀들의 색상을 변환시키는 단계; 및

상기 픽셀들의 색상이 변환된 적어도 하나의 병리 이미지를 포함하는 학습용 데이터를 이용하여 상기 기계학습 모델을 학습시키는 단계

를 포함하는, 병리 이미지 분석 방법.
제2항에 있어서,

상기 기계학습 모델을 학습시키는 단계는,

상기 학습용 데이터 세트 중에서 타깃 학습용 데이터를 결정하는 단계;

상기 타깃 학습용 데이터를 상기 기계학습 모델에 입력하고, 상기 기계학습 모델로부터 출력 값을 획득하는 단계;

상기 제1 병리 데이터 세트 또는 상기 제2 병리 데이터 세트 중 적어도 하나에 포함된 주석 정보를 이용하여, 상기 타깃 학습용 데이터에 대한 레퍼런스 값을 획득하는 단계; 및

상기 출력 값과 상기 획득된 레퍼런스 값 간의 손실 값을 상기 기계학습 모델에 피드백하는 단계

를 포함하는, 병리 이미지 분석 방법.
제1항에 있어서,

상기 기계학습 모델은, 서로 다른 유형의 분석 결과를 출력하는 복수의 분석 모델을 포함하고,

상기 분석 결과를 획득하는 단계는,

상기 획득된 병리 이미지로부터 염색 색상 및 염색이 발현된 위치를 식별하는 단계;

상기 식별된 염색 색상 및 발현된 위치에 기초하여, 상기 복수의 분석 모델 중 어느 하나를 타깃 분석 모델로서 결정하는 단계; 및

상기 결정된 타깃 분석 모델로 상기 병리 이미지를 입력하여, 상기 발현된 위치에서의 염색 강도에 대한 분석 결과를 상기 타깃 분석 모델로부터 획득하는 단계

를 포함하는, 병리 이미지 분석 방법.
제1항에 있어서,

상기 기계학습 모델은, 서로 다른 유형의 분석 결과를 출력하는 복수의 분석 모델을 포함하고,

상기 분석 결과를 획득하는 단계는,

사용자의 입력 정보에 기초하여, 상기 복수의 분석 모델 중 어느 하나를 타깃 분석 모델로서 결정하는 단계; 및

상기 타깃 분석 모델로 상기 병리 이미지를 입력하여, 상기 병리 이미지에 대한 분석 결과를 상기 타깃 분석 모델로부터 획득하는 단계

를 포함하는, 병리 이미지 분석 방법.
제1항에 있어서,

상기 기계학습 모델은, 세포의 종류 또는 상기 세포의 평가 지표 중 적어도 하나를 포함하는 분석 결과를 출력하고,

상기 세포의 평가 지표는, 상기 세포에 대한 양성 또는 음성에 대한 결과값, 상기 세포에 대한 염색 발현 등급, 상기 세포에 대한 염색 발현 정도를 나타내는 값, 또는 상기 세포에 대한 염색 발현 통계 정보 중 적어도 하나를 포함하는, 병리 이미지 분석 방법.
제1항에 따른 방법을 컴퓨터에서 실행하기 위한 명령어들을 기록한 컴퓨터 판독 가능한 비일시적 기록매체.
정보 처리 시스템으로서,

메모리; 및

상기 메모리와 연결되고, 상기 메모리에 포함된 컴퓨터 판독 가능한 적어도 하나의 프로그램을 실행하도록 구성된 적어도 하나의 프로세서

를 포함하고,

상기 적어도 하나의 프로그램은,

병리 이미지를 획득하고,

상기 획득된 병리 이미지를 기계학습 모델에 입력하여, 상기 기계학습 모델로부터 상기 병리 이미지에 대한 분석 결과를 획득하고,

상기 획득된 분석 결과를 출력하기 위한 명령어들을 포함하고,

상기 기계학습 모델은 제1 도메인과 연관된 제1 병리 데이터 세트 및 제1 도메인과 상이한 제2 도메인과 연관된 제2 병리 데이터 세트에 기초하여 생성된 학습용 데이터 세트를 이용하여 학습된 모델인, 정보 처리 시스템.