KR20220131530A - 향후 폐암의 위험을 예측하기 위한 시스템 및 방법 - Google Patents

향후 폐암의 위험을 예측하기 위한 시스템 및 방법 Download PDF

Info

Publication number
KR20220131530A
KR20220131530A KR1020227028235A KR20227028235A KR20220131530A KR 20220131530 A KR20220131530 A KR 20220131530A KR 1020227028235 A KR1020227028235 A KR 1020227028235A KR 20227028235 A KR20227028235 A KR 20227028235A KR 20220131530 A KR20220131530 A KR 20220131530A
Authority
KR
South Korea
Prior art keywords
lung
rads
subject
risk prediction
prediction model
Prior art date
Application number
KR1020227028235A
Other languages
English (en)
Inventor
조지 알. 주니어 와시코
크리스토퍼 스캇 스티븐슨
새뮤얼 요페 애쉬
라울 샌 호세 에스테파르
매튜 데이빗 메일맨
Original Assignee
존슨 앤드 존슨 엔터프라이즈 이노베이션 인코포레이티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 존슨 앤드 존슨 엔터프라이즈 이노베이션 인코포레이티드 filed Critical 존슨 앤드 존슨 엔터프라이즈 이노베이션 인코포레이티드
Publication of KR20220131530A publication Critical patent/KR20220131530A/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • G06T7/0012Biomedical image inspection
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/50ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for simulation or modelling of medical disorders
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/72Signal processing specially adapted for physiological signals or for diagnostic purposes
    • A61B5/7271Specific aspects of physiological measurement analysis
    • A61B5/7275Determining trends in physiological measurement data; Predicting development of a medical condition based on physiological measurements, e.g. determining a risk factor
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B6/00Apparatus or devices for radiation diagnosis; Apparatus or devices for radiation diagnosis combined with radiation therapy equipment
    • A61B6/02Arrangements for diagnosis sequentially in different planes; Stereoscopic radiation diagnosis
    • A61B6/03Computed tomography [CT]
    • A61B6/032Transmission computed tomography [CT]
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B6/00Apparatus or devices for radiation diagnosis; Apparatus or devices for radiation diagnosis combined with radiation therapy equipment
    • A61B6/50Apparatus or devices for radiation diagnosis; Apparatus or devices for radiation diagnosis combined with radiation therapy equipment specially adapted for specific body parts; specially adapted for specific clinical applications
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B6/00Apparatus or devices for radiation diagnosis; Apparatus or devices for radiation diagnosis combined with radiation therapy equipment
    • A61B6/52Devices using data or image processing specially adapted for radiation diagnosis
    • A61B6/5211Devices using data or image processing specially adapted for radiation diagnosis involving processing of medical diagnostic data
    • A61B6/5217Devices using data or image processing specially adapted for radiation diagnosis involving processing of medical diagnostic data extracting a diagnostic or physiological parameter from medical diagnostic data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • G06T7/0012Biomedical image inspection
    • G06T7/0014Biomedical image inspection using an image reference approach
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H30/00ICT specially adapted for the handling or processing of medical images
    • G16H30/20ICT specially adapted for the handling or processing of medical images for handling medical images, e.g. DICOM, HL7 or PACS
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H30/00ICT specially adapted for the handling or processing of medical images
    • G16H30/40ICT specially adapted for the handling or processing of medical images for processing medical images, e.g. editing
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/30ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10072Tomographic images
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10072Tomographic images
    • G06T2207/10081Computed x-ray tomography [CT]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10116X-ray image
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20076Probabilistic image processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30004Biomedical image processing
    • G06T2207/30061Lung
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30004Biomedical image processing
    • G06T2207/30096Tumor; Lesion
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/03Recognition of patterns in medical or anatomical images
    • G06V2201/032Recognition of patterns in medical or anatomical images of protuberances, polyps nodules, etc.

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Public Health (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Radiology & Medical Imaging (AREA)
  • Biomedical Technology (AREA)
  • Pathology (AREA)
  • Theoretical Computer Science (AREA)
  • Surgery (AREA)
  • Animal Behavior & Ethology (AREA)
  • Biophysics (AREA)
  • Veterinary Medicine (AREA)
  • Heart & Thoracic Surgery (AREA)
  • Molecular Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • High Energy & Nuclear Physics (AREA)
  • Optics & Photonics (AREA)
  • Primary Health Care (AREA)
  • Epidemiology (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Quality & Reliability (AREA)
  • Physiology (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • Pulmonology (AREA)
  • Dentistry (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Psychiatry (AREA)
  • Artificial Intelligence (AREA)
  • Apparatus For Radiation Diagnosis (AREA)
  • Measuring And Recording Apparatus For Diagnosis (AREA)
  • Image Analysis (AREA)
  • Medical Treatment And Welfare Office Work (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

위험 예측 모델들을 트레이닝 및 전개하여 하나 이상의 대상체들에 대한 폐암의 향후 위험을 예측하기 위해 컴퓨터 단층촬영 스캔과 같은 이미지들을 분석한다. 개별적인 위험 예측 모델들은 결절-특이 및 비-결절 특이 특징부들에 대해 개별적으로 트레이닝되어 각각의 위험 예측 모델은 상이한 기간들(예컨대, 1년, 3년, 또는 5년)에 걸친 폐암의 향후 위험을 예측할 수 있다. 이러한 위험 예측 모델들은 임상 시험 강화를 가능하게 함으로써 폐암에 대한 예방 요법을 개발하는데 유용하다.

Description

향후 폐암의 위험을 예측하기 위한 시스템 및 방법
상호 참조
본 출원은 2020년 1월 17일에 출원된 미국 가특허 출원 제62/962,614호에 대한 우선권의 이익을 주장하며, 이의 각각의 전체 개시내용은 모든 목적을 위해 전체적으로 참조로서 본 명세서에 포함된다.
폐암은 가장 일반적으로 폐 결절의 발달로 시작된다. 결절은 암성(cancerous)일 수 있거나 또는 후속적으로 악성 전환을 겪는 조직의 양성 과도성장일 수 있다. 방사선 커뮤니티는 이러한 과정을 인식하고, 의료 관리를 표준화하려는 시도에서, 그것들의 암일 가능성을 평가하기 위하여 CT 스캔 시 발견된 결절들의 단계를 구분하는 점수 시스템을 개발하였다. 이 스테이징 시스템은 폐 CT 스크리닝, 리포팅 및 데이터 시스템(Lung CT screening, Reporting and Data System, Lung-RADS)로 불리고, 결절의 크기, 결절의 성장 속도 및 결절의 외관에 기초한다. 일반적으로, 결절이 클수록, 그것의 성장이 더 빠르거나 또는 외관이 더 불규칙할수록, 암이 될 가능성이 더 많다.
그러나, 많은 시나리오들에서, 환자들의 폐 결절들은 오랜 기간 동안 검출되지 않은 채로 있거나 또는, 검출된 경우에도, 이미 암의 진행된 병기를 나타낼 수 있다. 따라서, 하나 이상의 폐 결절들의 발달 이전에도 환자의 폐암 위험의 조기 예측이 필요하다.
본 명세서에 개시된 본 발명의 실시 형태들은 폐암의 향후 위험을 예측하기 위해 이미지들(예컨대, CT 스캔)을 분석하는 위험 예측 모델을 구현하는 단계를 포함한다. 위험 예측 모델들은 이미지들로부터 추출된 특징부들, 예컨대, 결절 특이 특징부들 및 비-결절 특이 특징부들을 분석한다. 다양한 실시 형태들에서, 위험 예측 모델에서 비-결절 특이 특징부들의 포함은 위험 예측 모델들이 아직 폐 결절을 갖지 않은 대상체들에 대해 암의 향후 위험 예측들을 생성하게 하는 이점을 갖는다. 예를 들어, 비-결절 특이 특징부들을 분석함으로써, 폐 실질 특징부들 및/또는 신체 조성 특징부들을 포함하는 예들로서, 위험 예측 모델은 폐 결절의 발달 이전에 폐암의 조기 검출을 위해 구현될 수 있다. 다양한 실시 형태들에서, 위험 예측 모델은 대상체가 내년에 암을 발전시킬 가능성이 있는지 예측하도록 구현될 수 있다. 다양한 실시 형태들에서, 위험 예측 모델은 대상체가 다음 3년 내에 암을 발전시킬 가능성이 있는지 예측하도록 구현될 수 있다. 다양한 실시 형태들에서, 위험 예측 모델은 대상체가 다음 5년 내에 암을 발전시킬 가능성이 있는지 예측하도록 구현될 수 있다. 다양한 실시 형태들에서, 위험 예측 모델은 대상체가 M 기간 내에 암을 발전시킬 가능성이 있는지 예측하도록 구현될 수 있다. 다양한 실시 형태들에서, M은 6개월, 1년, 1.5년, 2년, 2.5년, 3년, 3.5년, 4년, 4.5년, 5년, 5.5년, 6년, 6.5년, 7년, 7.5년, 8년, 8.5년, 9년, 9.5년, 10년, 10.5년, 11년, 11.5년, 12년, 12.5년, 13년, 13.5년, 14년, 14.5년, 15년, 15.5년, 16년, 16.5년, 17년, 17.5년, 18년, 18.5년, 19년, 19.5년, 또는 20년 중 임의의 것이다.
위험 예측 모델들은 임상 시험 강화를 가능하게 함으로써 폐암에 대한 예방 요법 및 궁극적으로 임상 치료를 개발하는데 유용하다. 예를 들어, 이벤트 발생률(향후 폐암)이 배경 발생률보다 높아서 더 작은 코호트 크기의 등록을 가능하게 하고 치료가 필요한 환자들의 수를 감소시키기 때문에, 임상 시험은 치료법이 폐암을 방지하는 것을 나타내는데 더 효율적이고 실현가능할 것이다. 다른 예로서, 대상체들에 대한 암의 향후 위험을 아는 것은 대상체들에 대한 임상 치료의 조정을 가능하게 한다. 암의 고위험에 있는 대상체들은 증가된 빈도의 속도로 모니터링 및/또는 스크리닝될 수 있다. 추가적으로, 암의 고위험의 대상체들이 통지 및/또는 그들의 위험을 낮추도록 상담(예컨대, 금연과 같은 생활양식을 변경하도록 상담)받을 수 있다. 다른 예로서, 암 치료는 어느 정도의 위험을 수반하기 때문에, 누가 폐암을 발전시킬 가능성이 가장 높은지 아는 것은 개인의 치료의 구현에 대한 위험/이익 결정 분석 및 비용지급에 영향을 미칠 것이다.
대상체에 대한 폐암의 하나 이상의 향후 위험들을 예측하기 위한 방법이 본 명세서에 개시되어 있고, 방법은: 단일 시점에서 대상체로부터 캡처된 하나 이상의 이미지들을 획득하는 단계; 하나 이상의 획득된 이미지들로부터 특징부들을 추출하는 단계 - 추출된 특징부들은 적어도 비-결절 특이 특징부들을 포함하고, 비-결절 특이 특징부들은 폐 실질 특징부들 또는 신체 조성 특징부들 중 하나 또는 둘 모두를 포함함 -; 하나 이상의 트레이닝된 위험 예측 모델들을 적용하여 하나 이상의 획득된 이미지들로부터의 추출된 특징부들을 분석함으로써 대상체에 대한 폐암의 하나 이상의 향후 위험들을 예측하는 단계를 포함한다. 다양한 실시 형태들에서, 대상체에 대한 폐암의 하나 이상의 향후 위험들을 예측하는 단계는 M년 위험 예측 모델을 적용하여 대상체가 M년 내에 폐암을 발전시킬 가능성이 있는지 예측하는 단계를 포함하고, M년 위험 예측 모델은 결절 특이 특징부들 및 비-결절 특이 특징부들을 포함하고, 가장 높은 특징부 중요도 값들을 갖는 상위 3개의 추출된 특징부들의 50% 초과는 비-결절 특이 특징부들이고, 폐 실질 특징부들은 폐의 낮은 감쇠 영역의 백분율, 폐의 높은 감쇠 영역의 백분율, 폐 아랫부분에 비교하여 폐 윗부분에서의 낮은 감쇠 또는 높은 감쇠 영역의 비율, 정상 조직, 중심소엽 폐기종, 중심소엽 결절, 간유리음영, 벌집모양, 선형 흉터, 결절형, 그물형, 흉막하선, 기타 폐기종, 또는 낭종 중 임의의 것에 의해 점유된 폐의 백분율(들) 중 하나 이상을 포함하고, 신체 조성 특징부들은 흉근 단면적, 흉근 제지방 단면적, 또는 피하지방 단면적 중 하나 이상을 포함한다.
다양한 실시 형태들에서, 폐 실질 특징부들은 폐 실질의 밀도 측정 또는 폐 실질의 국부적 히스토그램 측정들 중 하나 이상을 포함한다. 다양한 실시 형태들에서, 폐 실질의 밀도 측정은: 폐의 낮은 감쇠 영역의 백분율, 폐의 높은 감쇠 영역의 백분율, 및 폐 아랫부분에 비교하여 폐 윗부분에서의 낮은 감쇠 또는 높은 감쇠 영역의 비율 중 하나 이상을 포함한다. 다양한 실시 형태들에서, 폐 실질의 국부적 히스토그램 측정들은 정상 조직, 중심소엽 폐기종, 중심소엽 결절, 간유리음영, 벌집모양, 선형 흉터, 결절형, 그물형, 흉막하선, 기타 폐기종, 또는 낭종 중 임의의 것에 의해 점유된 폐의 하나 이상의 백분율(들)을 포함한다. 다양한 실시 형태들에서, 신체 조성 특징부들은 흉근 단면적, 흉근 제지방 단면적, 또는 피하지방 단면적 중 하나 이상을 포함한다.
다양한 실시 형태들에서, 추출된 특징부들은 결절 특이 특징부들을 추가로 포함한다. 다양한 실시 형태들에서, 결절 특이 특징부들은 결절 특이 감쇠, 결절 마진 설명, 결절 크기, 결절 형상, 결절 텍스처, 결절 직경, Lung-RADS 점수, 또는 라디오믹(radiomic) 특징부들 중 하나 이상을 포함한다. 다양한 실시 형태들에서, 라디오믹 특징부들은 1차 통계, 3D 형상 기반 특징부들, 2D 형상 기반 특징부들, 그레이 레벨 동시발생 행렬, 그레이 레벨 반복 길이 행렬, 그레이 레벨 크기 영역 행렬, 이웃 그레이 톤 차이 행렬, 및 그레이 레벨 의존성 행렬 중 하나 이상을 포함한다. 다양한 실시 형태들에서, 라디오믹 특징부들은 웨이블렛 필터 또는 가우시안 필터와 같은 필터를 적용함으로써 변환된 이미지로부터 추출된다. 따라서, 1차 통계, 3D 형상 기반 특징부들, 2D 형상 기반 특징부들, 그레이 레벨 동시발생 행렬, 그레이 레벨 반복 길이 행렬, 그레이 레벨 크기 영역 행렬, 이웃 그레이 톤 차이 행렬, 및 그레이 레벨 의존성 행렬 중 임의의 것이 웨이블렛 변환 이미지 또는 가우시안 변환 이미지로부터 추출될 수 있다. 다양한 실시 형태들에서, 결절 특이 특징부들은 방사선과의사 보고서로부터 추출된다. 다양한 실시 형태들에서, 결절 특이 특징부들은 이미지 분석 알고리즘을 구현함으로써 연산적으로 추출된다.
다양한 실시 형태들에서, 대상체에 대한 폐암의 하나 이상의 향후 위험들을 예측하는 단계는 5년 위험 예측 모델을 적용하여 대상체가 5년 내에 폐암을 발전시킬 가능성이 있는지 예측하는 단계를 포함한다. 다양한 실시 형태들에서, 5년 위험 예측 모델은 결절 특이 특징부들 및 비-결절 특이 특징부들을 포함하고, 비-결절 특이 특징부들은 결절 특이 특징부들보다 더 높은 특징부 중요도 값들을 갖는다. 다양한 실시 형태들에서, 가장 높은 특징부 중요도 값들을 갖는 상위 3개의 추출된 특징부들의 50% 초과는 비-결절 특이 특징부들이다. 다양한 실시 형태들에서, 가장 높은 특징부 중요도 값들을 갖는 상위 5개의 추출된 특징부들의 50% 초과는 비-결절 특이 특징부들이다. 다양한 실시 형태들에서, 가장 높은 특징부 중요도 값들을 갖는 상위 10개의 추출된 특징부들의 50% 초과는 비-결절 특이 특징부들이다. 다양한 실시 형태들에서, 대상체가 후보라고 결정하는 단계는 Lung-RADS 1, Lung-RADS 2, Lung-RADS 3, Lung-RADS 4A, 또는 Lung-RADS 4B 중 하나에서 대상체의 분류를 획득하는 단계를 포함한다. 다양한 실시 형태들에서, 5년 위험 예측 모델은 적어도 0.74의 곡선하면적(AUC) 값을 나타낸다. 다양한 실시 형태들에서, 5년 위험 예측 모델은 배경 발생률과 비교하여 누적 발생의 적어도 5.1배 증가를 달성한다.
다양한 실시 형태들에서, 대상체가 후보라고 결정하는 단계는 대상체가 Lung-RADS 1, Lung-RADS 2, Lung-RADS 3, 또는 Lung-RADS 4A 중 임의의 것으로 분류된다고 결정하는 단계를 추가로 포함한다. 다양한 실시 형태들에서, 5년 위험 예측 모델은 적어도 0.72의 곡선하면적(AUC) 값을 나타낸다. 다양한 실시 형태들에서, 5년 위험 예측 모델은 배경 발생률과 비교하여 누적 발생의 적어도 3.9배 증가를 달성한다.
다양한 실시 형태들에서, 대상체가 후보라고 결정하는 단계는 대상체가 Lung-RADS 1, Lung-RADS 2, 또는 Lung-RADS 3 중 임의의 것으로 분류된다고 결정하는 단계를 추가로 포함한다. 다양한 실시 형태들에서, 5년 위험 예측 모델은 적어도 0.67의 곡선하면적(AUC) 값을 나타낸다. 다양한 실시 형태들에서, 5년 위험 예측 모델은 배경 발생률과 비교하여 누적 발생의 적어도 3.7배 증가를 달성한다.
다양한 실시 형태들에서, 대상체가 후보라고 결정하는 단계는 대상체가 Lung-RADS 1 또는 Lung-RADS 2 중 임의의 것으로 분류된다고 결정하는 단계를 추가로 포함한다. 다양한 실시 형태들에서, 5년 위험 예측 모델은 적어도 0.65의 곡선하면적(AUC) 값을 나타낸다. 다양한 실시 형태들에서, 5년 위험 예측 모델은 배경 발생률과 비교하여 누적 발생의 적어도 1.9배 증가를 달성한다.
다양한 실시 형태들에서, 대상체가 후보라고 결정하는 단계는 상기 대상체가 Lung-RADS 1로 분류된다고 결정하는 단계를 추가로 포함한다. 다양한 실시 형태들에서, 5년 위험 예측 모델은 적어도 0.57의 곡선하면적(AUC) 값을 나타낸다. 다양한 실시 형태들에서, 5년 위험 예측 모델은 배경 발생률과 비교하여 누적 발생의 적어도 1.9배 증가를 달성한다.
다양한 실시 형태들에서, 대상체에 대한 폐암의 하나 이상의 향후 위험들을 예측하는 단계는 3년 위험 예측 모델을 적용하여 대상체가 3년 내에 폐암을 발전시킬 가능성이 있는지 예측하는 단계를 포함한다. 다양한 실시 형태들에서, 3년 위험 예측 모델은 결절 특이 특징부들 및 비-결절 특이 특징부들을 포함하고, 비-결절 특이 특징부들은 결절 특이 특징부들보다 더 높은 특징부 중요도 값들을 갖는다. 다양한 실시 형태들에서, 가장 높은 특징부 중요도 값들을 갖는 상위 5개의 추출된 특징부들의 50% 초과는 비-결절 특이 특징부들이다. 다양한 실시 형태들에서, 가장 높은 특징부 중요도 값들을 갖는 상위 10개의 추출된 특징부들의 50% 초과는 비-결절 특이 특징부들이다.
다양한 실시 형태들에서, 대상체가 후보라고 결정하는 단계는 Lung-RADS 1, Lung-RADS 2, Lung-RADS 3, Lung-RADS 4A, 또는 Lung-RADS 4B 중 하나에서 대상체의 분류를 획득하는 단계를 포함한다. 다양한 실시 형태들에서, 3년 위험 예측 모델은 적어도 0.79의 곡선하면적(AUC) 값을 나타낸다. 다양한 실시 형태들에서, 3년 위험 예측 모델은 배경 발생률과 비교하여 누적 발생의 적어도 6.3배 증가를 달성한다.
다양한 실시 형태들에서, 대상체가 후보라고 결정하는 단계는 대상체가 Lung-RADS 1, Lung-RADS 2, Lung-RADS 3, 또는 Lung-RADS 4A 중 임의의 것으로 분류된다고 결정하는 단계를 추가로 포함한다. 다양한 실시 형태들에서, 3년 위험 예측 모델은 적어도 0.72의 곡선하면적(AUC) 값을 나타낸다. 다양한 실시 형태들에서, 3년 위험 예측 모델은 배경 발생률과 비교하여 누적 발생의 적어도 5.1배 증가를 달성한다.
다양한 실시 형태들에서, 대상체가 후보라고 결정하는 단계는 대상체가 Lung-RADS 1, Lung-RADS 2, 또는 Lung-RADS 3 중 임의의 것으로 분류된다고 결정하는 단계를 추가로 포함한다. 다양한 실시 형태들에서, 3년 위험 예측 모델은 적어도 0.72의 곡선하면적(AUC) 값을 나타낸다. 다양한 실시 형태들에서, 3년 위험 예측 모델은 배경 발생률과 비교하여 누적 발생의 적어도 5.7배 증가를 달성한다. 다양한 실시 형태들에서, 3년 위험 예측 모델은 적어도 0.676의 곡선하면적(AUC) 값을 나타낸다.
다양한 실시 형태들에서, 대상체가 후보라고 결정하는 단계는 대상체가 Lung-RADS 1 또는 Lung-RADS 2 중 임의의 것으로 분류된다고 결정하는 단계를 추가로 포함한다. 다양한 실시 형태들에서, 3년 위험 예측 모델은 적어도 0.65의 곡선하면적(AUC) 값을 나타낸다. 다양한 실시 형태들에서, 3년 위험 예측 모델은 배경 발생률과 비교하여 누적 발생의 적어도 3배 증가를 달성한다. 다양한 실시 형태들에서, 대상체가 후보라고 결정하는 단계는 상기 대상체가 Lung-RADS 1로 분류된다고 결정하는 단계를 추가로 포함한다. 다양한 실시 형태들에서, 3년 위험 예측 모델은 적어도 0.60의 곡선하면적(AUC) 값을 나타낸다. 다양한 실시 형태들에서, 3년 위험 예측 모델은 배경 발생률과 비교하여 누적 발생의 적어도 2.3배 증가를 달성한다.
다양한 실시 형태들에서, 대상체에 대한 폐암의 하나 이상의 향후 위험들을 예측하는 단계는 1년 위험 예측 모델을 적용하여 대상체가 1년 내에 폐암을 발전시킬 가능성이 있는지 예측하는 단계를 포함한다. 다양한 실시 형태들에서, 1년 위험 예측 모델은 결절 특이 특징부들 및 비-결절 특이 특징부들을 포함하고, 비-결절 특이 특징부들은 결절 특이 특징부들보다 더 높은 특징부 중요도 값들을 갖는다. 다양한 실시 형태들에서, 대상체가 후보라고 결정하는 단계는 대상체가 Lung-RADS 1 또는 Lung-RADS 2 중 임의의 것으로 분류된다고 결정하는 단계를 추가로 포함한다. 다양한 실시 형태들에서, 1년 위험 예측 모델은 적어도 0.72의 곡선하면적(AUC) 값을 나타낸다. 다양한 실시 형태들에서, 1년 위험 예측 모델은 배경 발생률과 비교하여 누적 발생의 적어도 5.5배 증가를 달성한다. 다양한 실시 형태들에서, 대상체가 후보라고 결정하는 단계는 상기 대상체가 Lung-RADS 1로 분류된다고 결정하는 단계를 추가로 포함한다. 다양한 실시 형태들에서, 1년 위험 예측 모델은 적어도 0.57의 곡선하면적(AUC) 값을 나타낸다.
다양한 실시 형태들에서, 1년 위험 예측 모델은 결절 특이 특징부들 및 비-결절 특이 특징부들을 포함하고, 결절 특이 특징부들은 비-결절 특이 특징부들보다 더 높은 특징부 중요도 값들을 갖는다. 다양한 실시 형태들에서, 가장 높은 특징부 중요도 값들을 갖는 상위 3개의 추출된 특징부들의 50% 초과는 결절 특이 특징부들이다. 다양한 실시 형태들에서, 대상체가 후보라고 결정하는 단계는 Lung-RADS 1, Lung-RADS 2, Lung-RADS 3, Lung-RADS 4A, 또는 Lung-RADS 4B 중 하나에서 대상체의 분류를 획득하는 단계를 포함한다. 다양한 실시 형태들에서, 1년 위험 예측 모델은 적어도 0.90의 곡선하면적(AUC) 값을 나타낸다. 다양한 실시 형태들에서, 1년 위험 예측 모델은 배경 발생률과 비교하여 누적 발생의 적어도 11배 증가를 달성한다.
다양한 실시 형태들에서, 대상체가 후보라고 결정하는 단계는 대상체가 Lung-RADS 1, Lung-RADS 2, Lung-RADS 3, 또는 Lung-RADS 4A 중 임의의 것으로 분류된다고 결정하는 단계를 추가로 포함한다. 다양한 실시 형태들에서, 1년 위험 예측 모델은 적어도 0.81의 곡선하면적(AUC) 값을 나타낸다. 다양한 실시 형태들에서, 1년 위험 예측 모델은 배경 발생률과 비교하여 누적 발생의 적어도 7.6배 증가를 달성한다.
다양한 실시 형태들에서, 가장 높은 특징부 중요도 값들을 갖는 상위 5개의 추출된 특징부들의 50% 초과는 결절 특이 특징부들이다. 다양한 실시 형태들에서, 대상체가 후보라고 결정하는 단계는 대상체가 Lung-RADS 1, Lung-RADS 2, 또는 Lung-RADS 3 중 임의의 것으로 분류된다고 결정하는 단계를 추가로 포함한다. 다양한 실시 형태들에서, 1년 위험 예측 모델은 적어도 0.82의 곡선하면적(AUC) 값을 나타낸다. 다양한 실시 형태들에서, 1년 위험 예측 모델은 배경 발생률과 비교하여 누적 발생의 적어도 8.6배 증가를 달성한다.
다양한 실시 형태들에서, 대상체에 대한 폐암의 하나 이상의 향후 위험들을 예측하는 단계는 다수의 위험 예측 모델들을 적용하여 대상체가 N의 상이한 기간들 내에 폐암을 발전시킬 가능성이 있는지 예측하는 단계를 포함한다. 다양한 실시 형태들에서, N의 상이한 기간들 중 적어도 하나는 6개월, 1년, 1.5년, 2년, 2.5년, 3년, 3.5년, 4년, 4.5년, 5년, 5.5년, 6년, 6.5년, 7년, 7.5년, 8년, 8.5년, 9년, 9.5년, 10년, 10.5년, 11년, 11.5년, 12년, 12.5년, 13년, 13.5년, 14년, 14.5년, 15년, 15.5년, 16년, 16.5년, 17년, 17.5년, 18년, 18.5년, 19년, 19.5년, 또는 20년 중 어느 하나이다. 다양한 실시 형태들에서, N은 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 또는 20의 상이한 기간들이다.
다양한 실시 형태들에서, 하나 이상의 위험 예측 모델들 중 하나는 Lung-RADS 1-4B의 임의의 것으로 분류된 트레이닝 개인들의 트레이닝 코호트로부터 캡처된 트레이닝 이미지들을 이용하여 폐암의 향후 위험을 예측하도록 트레이닝된 Lung-RADS 1-4B 예측 모델이다. 다양한 실시 형태들에서, 하나 이상의 위험 예측 모델들 중 하나는 Lung-RADS 1-4A의 임의의 것으로 분류된 트레이닝 개인들의 트레이닝 코호트로부터 캡처된 트레이닝 이미지들을 이용하여 폐암의 향후 위험을 예측하도록 트레이닝된 Lung-RADS 1-4A 모델이다. 다양한 실시 형태들에서, 하나 이상의 위험 예측 모델들 중 하나는 Lung-RADS 1-3의 임의의 것으로 분류된 트레이닝 개인들의 트레이닝 코호트로부터 캡처된 트레이닝 이미지들을 이용하여 폐암의 향후 위험을 예측하기 위한 Lung-RADS 1-3 모델이다. 다양한 실시 형태들에서, 하나 이상의 위험 예측 모델들 중 하나는 Lung-RADS 1 또는 2로 분류된 트레이닝 개인들의 트레이닝 코호트로부터 캡처된 트레이닝 이미지들을 이용하여 폐암의 향후 위험을 예측하도록 트레이닝된 Lung-RADS 1-2 모델이다. 다양한 실시 형태들에서, 하나 이상의 위험 예측 모델들 중 하나는 Lung-RADS 1로 분류된 트레이닝 개인들의 트레이닝 코호트로부터 캡처된 트레이닝 이미지들을 이용하여 폐암의 향후 위험을 예측하도록 트레이닝된 Lung-RADS 1 모델이다. 다양한 실시 형태들에서, 트레이닝 코호트의 대부분의 트레이닝 개인들은 이전에 Lung-RADS 1로 분류된다.
다양한 실시 형태들에서, 하나 이상의 이미지들은 컴퓨터 단층촬영(CT) 이미지들 또는 X-선 이미지들이다. 다양한 실시 형태들에서, 하나 이상의 이미지들은 흉부 CT 이미지들 또는 흉부 X-선 이미지들을 포함한다. 다양한 실시 형태들에서, 위험 예측 모델은 국가폐암검진연구(National Lung Screening Trial, NLST)의 트레이닝 이미지들을 이용하여 트레이닝된다. 다양한 실시 형태들에서, 본 명세서에 개시된 방법들은: 대상체에 대한 폐암의 하나 이상의 향후 위험들을 예측하기 이전에: 대상체에 대응하는 결절-특이 특징부들을 획득하는 단계; 결절-특이 특징부들에 기초하여 대상체가 추가 위험 예측에 대한 후보라고 결정하는 단계를 추가로 포함한다.
다양한 실시 형태들에서, 대상체가 후보라고 결정하는 것은 대상체가 폐암을 갖고 있지 않거나 또는 폐암을 발전시킬 위험이 낮다고 결정하는 것을 포함한다. 다양한 실시 형태들에서, 대상체가 폐암을 발전시킬 위험이 낮다고 결정하는 것은 결절-특이 특징부들에 기초하여 대상체가 결절을 갖고 있지 않다고 결정하는 것을 포함한다.
다양한 실시 형태들에서, 폐암은 비-소세포 폐암 또는 소세포 폐암이다. 다양한 실시 형태들에서, 폐암은 선암종 또는 편평세포암종이다. 다양한 실시 형태들에서, 본 명세서에 개시된 방법들은 폐암의 예측된 향후 위험에 기초하여 대상체에 대한 임상 반응을 선택하는 단계를 추가로 포함한다. 다양한 실시 형태들에서, 대상체에 대한 임상 반응을 선택하는 단계는 대상체를 치료하기 위한 중재시술을 선택하는 단계를 포함한다. 다양한 실시 형태들에서, 중재시술을 선택하는 단계는 대상체에 투여하기 위한 치료를 선택하는 단계를 포함한다. 다양한 실시 형태들에서, 선택된 치료는 폐암의 발전을 지연 또는 방지하기 위해 예방적으로 대상체에 투여된다. 다양한 실시 형태들에서, 임상 반응은 대상체의 행동을 변화시키기 위해 대상체에게 상담을 제공하는 것을 포함한다. 다양한 실시 형태들에서, 임상 반응은 대상체에 대한 추적조사의 빈도를 증가시키는 것을 포함한다. 다양한 실시 형태들에서, 임상 반응은 폐암의 예측된 향후 위험을 확인하기 위해 추가 위험 예측 테스트를 수행하거나 또는 이를 수행하도록 스케줄링하는 것을 포함한다. 다양한 실시 형태들에서, 트레이닝된 위험 예측 모델들 중 하나 이상은 랜덤 포레스트 모델(random forest model) 또는 그래디언트 부스트 모델(gradient boosted model) 중 하나이다.
추가적으로 대상체에 대한 폐암의 하나 이상의 향후 위험들을 예측하기 위한 비일시적 컴퓨터 판독가능 매체가 개시되며, 비일시적 컴퓨터 판독가능 매체는, 프로세서에 의해 실행 시, 프로세서로 하여금: 단일 시점에서 대상체로부터 캡처된 하나 이상의 이미지들을 획득하고; 하나 이상의 획득된 이미지들로부터 특징부들을 추출하고 - 추출된 특징부들은 적어도 비-결절 특이 특징부들을 포함하고, 비-결절 특이 특징부들은 폐 실질 특징부들 또는 신체 조성 특징부들 중 하나 또는 둘 모두를 포함함 -; 하나 이상의 트레이닝된 위험 예측 모델들을 적용하여 하나 이상의 획득된 이미지들로부터의 상기 추출된 특징부들을 분석함으로써 대상체에 대한 폐암의 하나 이상의 향후 위험들을 예측하게 하는 명령어들을 포함한다. 다양한 실시 형태들에서, 프로세서로 하여금 대상체에 대한 폐암의 하나 이상의 향후 위험들을 예측하게 하는 명령어들은, 프로세서에 의해 실행 시, 프로세서로 하여금 M년 위험 예측 모델을 적용하여 대상체가 M년 내에 폐암을 발전시킬 가능성이 있는지 예측하게 하는 명령어들을 추가로 포함하고, M년 위험 예측 모델은 결절 특이 특징부들 및 비-결절 특이 특징부들을 포함하고, 가장 높은 특징부 중요도 값들을 갖는 상위 3개의 추출된 특징부들의 50% 초과는 비-결절 특이 특징부들이고, 폐 실질 특징부들은 폐의 낮은 감쇠 영역의 백분율, 폐의 높은 감쇠 영역의 백분율, 폐 아랫부분에 비교하여 폐 윗부분에서의 낮은 감쇠 또는 높은 감쇠 영역의 비율, 정상 조직, 중심소엽 폐기종, 중심소엽 결절, 간유리음영, 벌집모양, 선형 흉터, 결절형, 그물형, 흉막하선, 기타 폐기종, 또는 낭종 중 임의의 것에 의해 점유된 폐의 백분율(들) 중 하나 이상을 포함하고, 신체 조성 특징부들은 흉근 단면적, 흉근 제지방 단면적, 또는 피하지방 단면적 중 하나 이상을 포함한다.
다양한 실시 형태들에서, 폐 실질 특징부들은 폐 실질의 밀도 측정 또는 폐 실질의 국부적 히스토그램 측정들 중 하나 이상을 포함한다. 다양한 실시 형태들에서, 폐 실질의 밀도 측정은: 폐의 낮은 감쇠 영역의 백분율, 폐의 높은 감쇠 영역의 백분율, 및 폐 아랫부분에 비교하여 폐 윗부분에서의 낮은 감쇠 또는 높은 감쇠 영역의 비율 중 하나 이상을 포함한다. 다양한 실시 형태들에서, 폐 실질의 국부적 히스토그램 측정들은 정상 조직, 중심소엽 폐기종, 중심소엽 결절, 간유리음영, 벌집모양, 선형 흉터, 결절형, 그물형, 흉막하선, 기타 폐기종, 또는 낭종 중 임의의 것에 의해 점유된 폐의 하나 이상의 백분율(들)을 포함한다. 다양한 실시 형태들에서, 신체 조성 특징부들은 흉근 단면적, 흉근 제지방 단면적, 또는 피하지방 단면적 중 하나 이상을 포함한다.
다양한 실시 형태들에서, 추출된 특징부들은 결절 특이 특징부들을 추가로 포함한다. 다양한 실시 형태들에서, 결절 특이 특징부들은 결절 특이 감쇠, 결절 마진 설명, 결절 크기, 결절 형상, 결절 텍스처, 결절 직경, Lung-RADS 점수, 또는 라디오믹 특징부들 중 하나 이상을 포함한다. 다양한 실시 형태들에서, 라디오믹 특징부들은 1차 통계, 3D 형상 기반 특징부들, 2D 형상 기반 특징부들, 그레이 레벨 동시발생 행렬, 그레이 레벨 반복 길이 행렬, 그레이 레벨 크기 영역 행렬, 이웃 그레이 톤 차이 행렬, 및 그레이 레벨 의존성 행렬 중 하나 이상을 포함한다. 다양한 실시 형태들에서, 라디오믹 특징부들은 웨이블렛 필터 또는 가우시안 필터와 같은 필터를 적용함으로써 변환된 이미지로부터 추출된다. 따라서, 1차 통계, 3D 형상 기반 특징부들, 2D 형상 기반 특징부들, 그레이 레벨 동시발생 행렬, 그레이 레벨 반복 길이 행렬, 그레이 레벨 크기 영역 행렬, 이웃 그레이 톤 차이 행렬, 및 그레이 레벨 의존성 행렬 중 임의의 것이 웨이블렛 변환 이미지 또는 가우시안 변환 이미지로부터 추출될 수 있다. 다양한 실시 형태들에서, 결절 특이 특징부들은 방사선과의사 보고서로부터 추출된다. 다양한 실시 형태들에서, 결절 특이 특징부들은 이미지 분석 알고리즘을 구현함으로써 연산적으로 추출된다.
다양한 실시 형태들에서, 프로세서로 하여금 대상체에 대한 폐암의 하나 이상의 향후 위험들을 예측하게 하는 명령어들은, 프로세서에 의해 실행 시, 프로세서로 하여금 5년 위험 예측 모델을 적용하여 대상체가 5년 내에 폐암을 발전시킬 가능성이 있는지 예측하게 하는 명령어들을 추가로 포함한다. 다양한 실시 형태들에서, 5년 위험 예측 모델은 결절 특이 특징부들 및 비-결절 특이 특징부들을 포함하고, 비-결절 특이 특징부들은 결절 특이 특징부들보다 더 높은 특징부 중요도 값들을 갖는다. 다양한 실시 형태들에서, 가장 높은 특징부 중요도 값들을 갖는 상위 3개의 추출된 특징부들의 50% 초과는 비-결절 특이 특징부들이다. 다양한 실시 형태들에서, 가장 높은 특징부 중요도 값들을 갖는 상위 5개의 추출된 특징부들의 50% 초과는 비-결절 특이 특징부들이다. 다양한 실시 형태들에서, 가장 높은 특징부 중요도 값들을 갖는 상위 10개의 추출된 특징부들의 50% 초과는 비-결절 특이 특징부들이다.
다양한 실시 형태들에서, 대상체가 후보라고 결정하는 단계는 Lung-RADS 1, Lung-RADS 2, Lung-RADS 3, Lung-RADS 4A, 또는 Lung-RADS 4B 중 하나에서 대상체의 분류를 획득하는 단계를 포함한다. 다양한 실시 형태들에서, 5년 위험 예측 모델은 적어도 0.74의 곡선하면적(AUC) 값을 나타낸다. 다양한 실시 형태들에서, 5년 위험 예측 모델은 배경 발생률과 비교하여 누적 발생의 적어도 5.1배 증가를 달성한다.
다양한 실시 형태들에서, 대상체가 후보라고 결정하는 단계는 대상체가 Lung-RADS 1, Lung-RADS 2, Lung-RADS 3, 또는 Lung-RADS 4A 중 임의의 것으로 분류된다고 결정하는 단계를 추가로 포함한다. 다양한 실시 형태들에서, 5년 위험 예측 모델은 적어도 0.72의 곡선하면적(AUC) 값을 나타낸다. 다양한 실시 형태들에서, 5년 위험 예측 모델은 배경 발생률과 비교하여 누적 발생의 적어도 3.9배 증가를 달성한다.
다양한 실시 형태들에서, 대상체가 후보라고 결정하는 단계는 대상체가 Lung-RADS 1, Lung-RADS 2, 또는 Lung-RADS 3 중 임의의 것으로 분류된다고 결정하는 단계를 추가로 포함한다. 다양한 실시 형태들에서, 5년 위험 예측 모델은 적어도 0.67의 곡선하면적(AUC) 값을 나타낸다. 다양한 실시 형태들에서, 5년 위험 예측 모델은 배경 발생률과 비교하여 누적 발생의 적어도 3.7배 증가를 달성한다.
다양한 실시 형태들에서, 대상체가 후보라고 결정하는 단계는 대상체가 Lung-RADS 1 또는 Lung-RADS 2 중 임의의 것으로 분류된다고 결정하는 단계를 추가로 포함한다. 다양한 실시 형태들에서, 5년 위험 예측 모델은 적어도 0.65의 곡선하면적(AUC) 값을 나타낸다. 다양한 실시 형태들에서, 5년 위험 예측 모델은 배경 발생률과 비교하여 누적 발생의 적어도 1.9배 증가를 달성한다.
다양한 실시 형태들에서, 대상체가 후보라고 결정하는 단계는 상기 대상체가 Lung-RADS 1로 분류된다고 결정하는 단계를 추가로 포함한다. 다양한 실시 형태들에서, 5년 위험 예측 모델은 적어도 0.57의 곡선하면적(AUC) 값을 나타낸다. 다양한 실시 형태들에서, 5년 위험 예측 모델은 배경 발생률과 비교하여 누적 발생의 적어도 1.9배 증가를 달성한다.
다양한 실시 형태들에서, 프로세서로 하여금 대상체에 대한 폐암의 하나 이상의 향후 위험들을 예측하게 하는 명령어들은, 프로세서에 의해 실행 시, 프로세서로 하여금 3년 위험 예측 모델을 적용하여 대상체가 3년 내에 폐암을 발전시킬 가능성이 있는지 예측하게 하는 명령어들을 추가로 포함한다. 다양한 실시 형태들에서, 3년 위험 예측 모델은 결절 특이 특징부들 및 비-결절 특이 특징부들을 포함하고, 비-결절 특이 특징부들은 결절 특이 특징부들보다 더 높은 특징부 중요도 값들을 갖는다. 다양한 실시 형태들에서, 가장 높은 특징부 중요도 값들을 갖는 상위 5개의 추출된 특징부들의 50% 초과는 비-결절 특이 특징부들이다. 다양한 실시 형태들에서, 가장 높은 특징부 중요도 값들을 갖는 상위 10개의 추출된 특징부들의 50% 초과는 비-결절 특이 특징부들이다.
다양한 실시 형태들에서, 대상체가 후보라고 결정하는 단계는 Lung-RADS 1, Lung-RADS 2, Lung-RADS 3, Lung-RADS 4A, 또는 Lung-RADS 4B 중 하나에서 대상체의 분류를 획득하는 단계를 포함한다. 다양한 실시 형태들에서, 3년 위험 예측 모델은 적어도 0.79의 곡선하면적(AUC) 값을 나타낸다. 다양한 실시 형태들에서, 3년 위험 예측 모델은 배경 발생률과 비교하여 누적 발생의 적어도 6.3배 증가를 달성한다.
다양한 실시 형태들에서, 대상체가 후보라고 결정하는 단계는 대상체가 Lung-RADS 1, Lung-RADS 2, Lung-RADS 3, 또는 Lung-RADS 4A 중 임의의 것으로 분류된다고 결정하는 단계를 추가로 포함한다. 다양한 실시 형태들에서, 3년 위험 예측 모델은 적어도 0.72의 곡선하면적(AUC) 값을 나타낸다. 다양한 실시 형태들에서, 3년 위험 예측 모델은 배경 발생률과 비교하여 누적 발생의 적어도 5.1배 증가를 달성한다.
다양한 실시 형태들에서, 대상체가 후보라고 결정하는 단계는 대상체가 Lung-RADS 1, Lung-RADS 2, 또는 Lung-RADS 3 중 임의의 것으로 분류된다고 결정하는 단계를 추가로 포함한다. 다양한 실시 형태들에서, 3년 위험 예측 모델은 적어도 0.72의 곡선하면적(AUC) 값을 나타낸다. 다양한 실시 형태들에서, 3년 위험 예측 모델은 배경 발생률과 비교하여 누적 발생의 적어도 5.7배 증가를 달성한다. 다양한 실시 형태들에서, 3년 위험 예측 모델은 적어도 0.676의 곡선하면적(AUC) 값을 나타낸다.
다양한 실시 형태들에서, 대상체가 후보라고 결정하는 단계는 대상체가 Lung-RADS 1 또는 Lung-RADS 2 중 임의의 것으로 분류된다고 결정하는 단계를 추가로 포함한다. 다양한 실시 형태들에서, 3년 위험 예측 모델은 적어도 0.65의 곡선하면적(AUC) 값을 나타낸다. 다양한 실시 형태들에서, 3년 위험 예측 모델은 배경 발생률과 비교하여 누적 발생의 적어도 3배 증가를 달성한다.
다양한 실시 형태들에서, 대상체가 후보라고 결정하는 단계는 상기 대상체가 Lung-RADS 1로 분류된다고 결정하는 단계를 추가로 포함한다. 다양한 실시 형태들에서, 3년 위험 예측 모델은 적어도 0.60의 곡선하면적(AUC) 값을 나타낸다. 다양한 실시 형태들에서, 3년 위험 예측 모델은 배경 발생률과 비교하여 누적 발생의 적어도 2.3배 증가를 달성한다.
다양한 실시 형태들에서, 프로세서로 하여금 대상체에 대한 폐암의 하나 이상의 향후 위험들을 예측하게 하는 명령어들은, 프로세서에 의해 실행 시, 프로세서로 하여금 1년 위험 예측 모델을 적용하여 대상체가 1년 내에 폐암을 발전시킬 가능성이 있는지 예측하게 하는 명령어들을 추가로 포함한다. 다양한 실시 형태들에서, 1년 위험 예측 모델은 결절 특이 특징부들 및 비-결절 특이 특징부들을 포함하고, 비-결절 특이 특징부들은 결절 특이 특징부들보다 더 높은 특징부 중요도 값들을 갖는다. 다양한 실시 형태들에서, 대상체가 후보라고 결정하는 단계는 대상체가 Lung-RADS 1 또는 Lung-RADS 2 중 임의의 것으로 분류된다고 결정하는 단계를 추가로 포함한다. 다양한 실시 형태들에서, 1년 위험 예측 모델은 적어도 0.72의 곡선하면적(AUC) 값을 나타낸다. 다양한 실시 형태들에서, 1년 위험 예측 모델은 배경 발생률과 비교하여 누적 발생의 적어도 5.5배 증가를 달성한다.
다양한 실시 형태들에서, 대상체가 후보라고 결정하는 단계는 상기 대상체가 Lung-RADS 1로 분류된다고 결정하는 단계를 추가로 포함한다. 다양한 실시 형태들에서, 1년 위험 예측 모델은 적어도 0.57의 곡선하면적(AUC) 값을 나타낸다.
다양한 실시 형태들에서, 1년 위험 예측 모델은 결절 특이 특징부들 및 비-결절 특이 특징부들을 포함하고, 결절 특이 특징부들은 비-결절 특이 특징부들보다 더 높은 특징부 중요도 값들을 갖는다. 다양한 실시 형태들에서, 가장 높은 특징부 중요도 값들을 갖는 상위 3개의 추출된 특징부들의 50% 초과는 비-결절 특이 특징부들이다. 다양한 실시 형태들에서, 대상체가 후보라고 결정하는 단계는 Lung-RADS 1, Lung-RADS 2, Lung-RADS 3, Lung-RADS 4A, 또는 Lung-RADS 4B 중 하나에서 대상체의 분류를 획득하는 단계를 포함한다. 다양한 실시 형태들에서, 1년 위험 예측 모델은 적어도 0.90의 곡선하면적(AUC) 값을 나타낸다. 다양한 실시 형태들에서, 1년 위험 예측 모델은 배경 발생률과 비교하여 누적 발생의 적어도 11배 증가를 달성한다.
다양한 실시 형태들에서, 대상체가 후보라고 결정하는 단계는 대상체가 Lung-RADS 1, Lung-RADS 2, Lung-RADS 3, 또는 Lung-RADS 4A 중 임의의 것으로 분류된다고 결정하는 단계를 추가로 포함한다. 다양한 실시 형태들에서, 1년 위험 예측 모델은 적어도 0.81의 곡선하면적(AUC) 값을 나타낸다. 다양한 실시 형태들에서, 1년 위험 예측 모델은 배경 발생률과 비교하여 누적 발생의 적어도 7.6배 증가를 달성한다. 다양한 실시 형태들에서, 가장 높은 특징부 중요도 값들을 갖는 상위 5개의 추출된 특징부들의 50% 초과는 비-결절 특이 특징부들이다.
다양한 실시 형태들에서, 대상체가 후보라고 결정하는 단계는 대상체가 Lung-RADS 1, Lung-RADS 2, 또는 Lung-RADS 3 중 임의의 것으로 분류된다고 결정하는 단계를 추가로 포함한다. 다양한 실시 형태들에서, 1년 위험 예측 모델은 적어도 0.82의 곡선하면적(AUC) 값을 나타낸다. 다양한 실시 형태들에서, 1년 위험 예측 모델은 배경 발생률과 비교하여 누적 발생의 적어도 8.6배 증가를 달성한다.
다양한 실시 형태들에서, 프로세서로 하여금 대상체에 대한 폐암의 하나 이상의 향후 위험들을 예측하게 하는 명령어들은, 프로세서에 의해 실행 시, 프로세서로 하여금 다수의 위험 예측 모델들을 적용하여 대상체가 N의 상이한 기간들 내에 폐암을 발전시킬 가능성이 있는지 예측하게 하는 명령어들을 추가로 포함한다. 다양한 실시 형태들에서, N의 상이한 기간들 중 적어도 하나는 6개월, 1년, 1.5년, 2년, 2.5년, 3년, 3.5년, 4년, 4.5년, 5년, 5.5년, 6년, 6.5년, 7년, 7.5년, 8년, 8.5년, 9년, 9.5년, 10년, 10.5년, 11년, 11.5년, 12년, 12.5년, 13년, 13.5년, 14년, 14.5년, 15년, 15.5년, 16년, 16.5년, 17년, 17.5년, 18년, 18.5년, 19년, 19.5년, 또는 20년 중 어느 하나이다. 다양한 실시 형태들에서, N은 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 또는 20의 상이한 기간들이다.
다양한 실시 형태들에서, 하나 이상의 위험 예측 모델들 중 하나는 Lung-RADS 1-4B의 임의의 것으로 분류된 트레이닝 개인들의 트레이닝 코호트로부터 캡처된 트레이닝 이미지들을 이용하여 폐암의 향후 위험을 예측하도록 트레이닝된 Lung-RADS 1-4B 예측 모델이다. 다양한 실시 형태들에서, 하나 이상의 위험 예측 모델들 중 하나는 Lung-RADS 1-4A의 임의의 것으로 분류된 트레이닝 개인들의 트레이닝 코호트로부터 캡처된 트레이닝 이미지들을 이용하여 폐암의 향후 위험을 예측하도록 트레이닝된 Lung-RADS 1-4A 모델이다. 다양한 실시 형태들에서, 하나 이상의 위험 예측 모델들 중 하나는 Lung-RADS 1-3의 임의의 것으로 분류된 트레이닝 개인들의 트레이닝 코호트로부터 캡처된 트레이닝 이미지들을 이용하여 폐암의 향후 위험을 예측하기 위한 Lung-RADS 1-3 모델이다. 다양한 실시 형태들에서, 하나 이상의 위험 예측 모델들 중 하나는 Lung-RADS 1 또는 2로 분류된 트레이닝 개인들의 트레이닝 코호트로부터 캡처된 트레이닝 이미지들을 이용하여 폐암의 향후 위험을 예측하도록 트레이닝된 Lung-RADS 1-2 모델이다. 다양한 실시 형태들에서, 하나 이상의 위험 예측 모델들 중 하나는 Lung-RADS 1로 분류된 트레이닝 개인들의 트레이닝 코호트로부터 캡처된 트레이닝 이미지들을 이용하여 폐암의 향후 위험을 예측하도록 트레이닝된 Lung-RADS 1 모델이다. 다양한 실시 형태들에서, 트레이닝 코호트의 대부분의 트레이닝 개인들은 이전에 Lung-RADS 1로 분류된다.
다양한 실시 형태들에서, 하나 이상의 이미지들은 컴퓨터 단층촬영(CT) 이미지들 또는 X-선 이미지들이다. 다양한 실시 형태들에서, 하나 이상의 이미지들은 흉부 CT 이미지들 또는 흉부 X-선 이미지들을 포함한다. 다양한 실시 형태들에서, 위험 예측 모델은 국가폐암검진연구(NLST)의 트레이닝 이미지들을 이용하여 트레이닝된다.
다양한 실시 형태들에서, 비일시적 컴퓨터 판독가능 매체는 추가로, 프로세서에 의해 실행 시, 프로세서로 하여금: 대상체에 대한 폐암의 하나 이상의 향후 위험들을 예측하기 이전에: 대상체에 대응하는 결절-특이 특징부들을 획득하고; 결절-특이 특징부들에 기초하여 대상체가 추가 위험 예측에 대한 후보라고 결정하게 하는 명령어들을 추가로 포함한다.
다양한 실시 형태들에서, 프로세서로 하여금 대상체가 후보라고 결정하게 하는 명령어들은, 프로세서에 의해 실행 시, 프로세서로 하여금 대상체가 폐암을 갖고 있지 않거나 또는 폐암을 발전시킬 위험이 낮다고 결정하게 하는 명령어들을 추가로 포함한다. 다양한 실시 형태들에서, 프로세서로 하여금 대상체가 폐암을 발전시킬 위험이 낮다고 결정하게 하는 명령어들은, 프로세서에 의해 실행 시, 프로세서로 하여금 결절-특이 특징부들에 기초하여 대상체가 결절을 갖고 있지 않다고 결정하게 하는 명령어들을 추가로 포함한다.
다양한 실시 형태들에서, 폐암은 비-소세포 폐암 또는 소세포 폐암이다. 다양한 실시 형태들에서, 폐암은 선암종 또는 편평세포암종이다. 다양한 실시 형태들에서, 본 명세서에 개시된 비일시적 컴퓨터 판독가능 매체는, 프로세서에 의해 실행 시, 프로세서로 하여금 폐암의 예측된 향후 위험에 기초하여 대상체를 치료하기 위한 중재시술을 선택하게 하는 명령어들을 추가로 포함한다. 다양한 실시 형태들에서, 프로세서로 하여금 중재시술을 선택하게 하는 명령어들은, 프로세서에 의해 실행 시, 프로세서로 하여금 대상체에 투여하기 위한 치료를 선택하게 하는 명령어들을 추가로 포함한다. 다양한 실시 형태들에서, 선택된 치료는 폐암의 발전을 지연 또는 방지하기 위한 예방이다. 다양한 실시 형태들에서, 트레이닝된 위험 예측 모델들 중 하나 이상은 랜덤 포레스트 모델 또는 그래디언트 부스트 모델 중 하나이다.
대상체에 대한 폐암의 하나 이상의 향후 위험들을 예측하기 위한 시스템이 본 명세서에 추가적으로 개시되고, 시스템은: 단일 시점에서 대상체의 하나 이상의 이미지들을 캡처하도록 구성된 이미징 디바이스; 및 컴퓨팅 디바이스를 포함하고, 컴퓨팅 디바이스는: 단일 시점에서 대상체로부터 캡처된 하나 이상의 이미지들을 획득하는 단계; 하나 이상의 획득된 이미지들로부터 특징부들을 추출하는 단계 - 추출된 특징부들은 적어도 비-결절 특이 특징부들을 포함하고, 비-결절 특이 특징부들은 폐 실질 특징부들 또는 신체 조성 특징부들 중 하나 또는 둘 모두를 포함함 -; 하나 이상의 트레이닝된 위험 예측 모델들을 적용하여 하나 이상의 획득된 이미지들로부터의 추출된 특징부들을 분석함으로써 대상체에 대한 폐암의 하나 이상의 향후 위험들을 예측하는 단계를 포함한다. 다양한 실시 형태들에서, 대상체에 대한 폐암의 하나 이상의 향후 위험들을 예측하는 단계는 M년 위험 예측 모델을 적용하여 대상체가 M년 내에 폐암을 발전시킬 가능성이 있는지 예측하는 단계를 포함하고, M년 위험 예측 모델은 결절 특이 특징부들 및 비-결절 특이 특징부들을 포함하고, 가장 높은 특징부 중요도 값들을 갖는 상위 3개의 추출된 특징부들의 50% 초과는 비-결절 특이 특징부들이고, 폐 실질 특징부들은 폐의 낮은 감쇠 영역의 백분율, 폐의 높은 감쇠 영역의 백분율, 폐 아랫부분에 비교하여 폐 윗부분에서의 낮은 감쇠 또는 높은 감쇠 영역의 비율, 정상 조직, 중심소엽 폐기종, 중심소엽 결절, 간유리음영, 벌집모양, 선형 흉터, 결절형, 그물형, 흉막하선, 기타 폐기종, 또는 낭종 중 임의의 것에 의해 점유된 폐의 백분율(들) 중 하나 이상을 포함하고, 신체 조성 특징부들은 흉근 단면적, 흉근 제지방 단면적, 또는 피하지방 단면적 중 하나 이상을 포함한다.
다양한 실시 형태들에서, 폐 실질 특징부들은 폐 실질의 밀도 측정 또는 폐 실질의 국부적 히스토그램 측정들 중 하나 이상을 포함한다. 다양한 실시 형태들에서, 폐 실질의 밀도 측정은: 폐의 낮은 감쇠 영역의 백분율, 폐의 높은 감쇠 영역의 백분율, 및 폐 아랫부분에 비교하여 폐 윗부분에서의 낮은 감쇠 또는 높은 감쇠 영역의 비율 중 하나 이상을 포함한다. 다양한 실시 형태들에서, 폐 실질의 국부적 히스토그램 측정들은 정상 조직, 중심소엽 폐기종, 중심소엽 결절, 간유리음영, 벌집모양, 선형 흉터, 결절형, 그물형, 흉막하선, 기타 폐기종, 또는 낭종 중 임의의 것에 의해 점유된 폐의 하나 이상의 백분율(들)을 포함한다. 다양한 실시 형태들에서, 신체 조성 특징부들은 흉근 단면적, 흉근 제지방 단면적, 또는 피하지방 단면적 중 하나 이상을 포함한다.
다양한 실시 형태들에서, 추출된 특징부들은 결절 특이 특징부들을 추가로 포함한다. 다양한 실시 형태들에서, 결절 특이 특징부들은 결절 특이 감쇠, 결절 마진 설명, 결절 크기, 결절 형상, 결절 텍스처, 결절 직경, Lung-RADS 점수, 또는 라디오믹 특징부들 중 하나 이상을 포함한다. 다양한 실시 형태들에서, 라디오믹 특징부들은 1차 통계, 3D 형상 기반 특징부들, 2D 형상 기반 특징부들, 그레이 레벨 동시발생 행렬, 그레이 레벨 반복 길이 행렬, 그레이 레벨 크기 영역 행렬, 이웃 그레이 톤 차이 행렬, 및 그레이 레벨 의존성 행렬 중 하나 이상을 포함한다. 다양한 실시 형태들에서, 라디오믹 특징부들은 웨이블렛 필터 또는 가우시안 필터와 같은 필터를 적용함으로써 변환된 이미지로부터 추출된다. 따라서, 1차 통계, 3D 형상 기반 특징부들, 2D 형상 기반 특징부들, 그레이 레벨 동시발생 행렬, 그레이 레벨 반복 길이 행렬, 그레이 레벨 크기 영역 행렬, 이웃 그레이 톤 차이 행렬, 및 그레이 레벨 의존성 행렬 중 임의의 것이 웨이블렛 변환 이미지 또는 가우시안 변환 이미지로부터 추출될 수 있다. 다양한 실시 형태들에서, 결절 특이 특징부들은 방사선과의사 보고서로부터 추출된다. 다양한 실시 형태들에서, 결절 특이 특징부들은 이미지 분석 알고리즘을 구현함으로써 연산적으로 추출된다.
다양한 실시 형태들에서, 대상체에 대한 폐암의 하나 이상의 향후 위험들을 예측하는 단계는 5년 위험 예측 모델을 적용하여 대상체가 5년 내에 폐암을 발전시킬 가능성이 있는지 예측하는 단계를 포함한다. 다양한 실시 형태들에서, 5년 위험 예측 모델은 결절 특이 특징부들 및 비-결절 특이 특징부들을 포함하고, 비-결절 특이 특징부들은 결절 특이 특징부들보다 더 높은 특징부 중요도 값들을 갖는다. 다양한 실시 형태들에서, 가장 높은 특징부 중요도 값들을 갖는 상위 3개의 추출된 특징부들의 50% 초과는 비-결절 특이 특징부들이다. 다양한 실시 형태들에서, 가장 높은 특징부 중요도 값들을 갖는 상위 5개의 추출된 특징부들의 50% 초과는 비-결절 특이 특징부들이다. 다양한 실시 형태들에서, 가장 높은 특징부 중요도 값들을 갖는 상위 10개의 추출된 특징부들의 50% 초과는 비-결절 특이 특징부들이다.
다양한 실시 형태들에서, 대상체가 후보라고 결정하는 단계는 Lung-RADS 1, Lung-RADS 2, Lung-RADS 3, Lung-RADS 4A, 또는 Lung-RADS 4B 중 하나에서 대상체의 분류를 획득하는 단계를 포함한다. 다양한 실시 형태들에서, 5년 위험 예측 모델은 적어도 0.74의 곡선하면적(AUC) 값을 나타낸다. 다양한 실시 형태들에서, 5년 위험 예측 모델은 배경 발생률과 비교하여 누적 발생의 적어도 5.1배 증가를 달성한다.
다양한 실시 형태들에서, 대상체가 후보라고 결정하는 단계는 대상체가 Lung-RADS 1, Lung-RADS 2, Lung-RADS 3, 또는 Lung-RADS 4A 중 임의의 것으로 분류된다고 결정하는 단계를 추가로 포함한다. 다양한 실시 형태들에서, 5년 위험 예측 모델은 적어도 0.72의 곡선하면적(AUC) 값을 나타낸다. 다양한 실시 형태들에서, 5년 위험 예측 모델은 배경 발생률과 비교하여 누적 발생의 적어도 3.9배 증가를 달성한다.
다양한 실시 형태들에서, 대상체가 후보라고 결정하는 단계는 대상체가 Lung-RADS 1, Lung-RADS 2, 또는 Lung-RADS 3 중 임의의 것으로 분류된다고 결정하는 단계를 추가로 포함한다. 다양한 실시 형태들에서, 5년 위험 예측 모델은 적어도 0.67의 곡선하면적(AUC) 값을 나타낸다. 다양한 실시 형태들에서, 5년 위험 예측 모델은 배경 발생률과 비교하여 누적 발생의 적어도 3.7배 증가를 달성한다.
다양한 실시 형태들에서, 대상체가 후보라고 결정하는 단계는 대상체가 Lung-RADS 1 또는 Lung-RADS 2 중 임의의 것으로 분류된다고 결정하는 단계를 추가로 포함한다. 다양한 실시 형태들에서, 5년 위험 예측 모델은 적어도 0.65의 곡선하면적(AUC) 값을 나타낸다. 다양한 실시 형태들에서, 5년 위험 예측 모델은 배경 발생률과 비교하여 누적 발생의 적어도 1.9배 증가를 달성한다.
다양한 실시 형태들에서, 대상체가 후보라고 결정하는 단계는 상기 대상체가 Lung-RADS 1로 분류된다고 결정하는 단계를 추가로 포함한다. 다양한 실시 형태들에서, 5년 위험 예측 모델은 적어도 0.57의 곡선하면적(AUC) 값을 나타낸다. 다양한 실시 형태들에서, 5년 위험 예측 모델은 배경 발생률과 비교하여 누적 발생의 적어도 1.9배 증가를 달성한다.
다양한 실시 형태들에서, 대상체에 대한 폐암의 하나 이상의 향후 위험들을 예측하는 단계는 3년 위험 예측 모델을 적용하여 대상체가 3년 내에 폐암을 발전시킬 가능성이 있는지 예측하는 단계를 포함한다. 다양한 실시 형태들에서, 3년 위험 예측 모델은 결절 특이 특징부들 및 비-결절 특이 특징부들을 포함하고, 비-결절 특이 특징부들은 결절 특이 특징부들보다 더 높은 특징부 중요도 값들을 갖는다. 다양한 실시 형태들에서, 가장 높은 특징부 중요도 값들을 갖는 상위 5개의 추출된 특징부들의 50% 초과는 비-결절 특이 특징부들이다. 다양한 실시 형태들에서, 가장 높은 특징부 중요도 값들을 갖는 상위 10개의 추출된 특징부들의 50% 초과는 비-결절 특이 특징부들이다.
다양한 실시 형태들에서, 대상체가 후보라고 결정하는 단계는 Lung-RADS 1, Lung-RADS 2, Lung-RADS 3, Lung-RADS 4A, 또는 Lung-RADS 4B 중 하나에서 대상체의 분류를 획득하는 단계를 포함한다. 다양한 실시 형태들에서, 3년 위험 예측 모델은 적어도 0.79의 곡선하면적(AUC) 값을 나타낸다. 다양한 실시 형태들에서, 3년 위험 예측 모델은 배경 발생률과 비교하여 누적 발생의 적어도 6.3배 증가를 달성한다.
다양한 실시 형태들에서, 대상체가 후보라고 결정하는 단계는 대상체가 Lung-RADS 1, Lung-RADS 2, Lung-RADS 3, 또는 Lung-RADS 4A 중 임의의 것으로 분류된다고 결정하는 단계를 추가로 포함한다. 다양한 실시 형태들에서, 3년 위험 예측 모델은 적어도 0.72의 곡선하면적(AUC) 값을 나타낸다. 다양한 실시 형태들에서, 3년 위험 예측 모델은 배경 발생률과 비교하여 누적 발생의 적어도 5.1배 증가를 달성한다.
다양한 실시 형태들에서, 대상체가 후보라고 결정하는 단계는 대상체가 Lung-RADS 1, Lung-RADS 2, 또는 Lung-RADS 3 중 임의의 것으로 분류된다고 결정하는 단계를 추가로 포함한다. 다양한 실시 형태들에서, 3년 위험 예측 모델은 적어도 0.72의 곡선하면적(AUC) 값을 나타낸다. 다양한 실시 형태들에서, 3년 위험 예측 모델은 배경 발생률과 비교하여 누적 발생의 적어도 5.7배 증가를 달성한다. 다양한 실시 형태들에서, 3년 위험 예측 모델은 적어도 0.676의 곡선하면적(AUC) 값을 나타낸다.
다양한 실시 형태들에서, 대상체가 후보라고 결정하는 단계는 대상체가 Lung-RADS 1 또는 Lung-RADS 2 중 임의의 것으로 분류된다고 결정하는 단계를 추가로 포함한다. 다양한 실시 형태들에서, 3년 위험 예측 모델은 적어도 0.65의 곡선하면적(AUC) 값을 나타낸다. 다양한 실시 형태들에서, 3년 위험 예측 모델은 배경 발생률과 비교하여 누적 발생의 적어도 3배 증가를 달성한다.
다양한 실시 형태들에서, 대상체가 후보라고 결정하는 단계는 상기 대상체가 Lung-RADS 1로 분류된다고 결정하는 단계를 추가로 포함한다. 다양한 실시 형태들에서, 3년 위험 예측 모델은 적어도 0.60의 곡선하면적(AUC) 값을 나타낸다. 다양한 실시 형태들에서, 3년 위험 예측 모델은 배경 발생률과 비교하여 누적 발생의 적어도 2.3배 증가를 달성한다.
다양한 실시 형태들에서, 대상체에 대한 폐암의 하나 이상의 향후 위험들을 예측하는 단계는 1년 위험 예측 모델을 적용하여 대상체가 1년 내에 폐암을 발전시킬 가능성이 있는지 예측하는 단계를 포함한다. 다양한 실시 형태들에서, 1년 위험 예측 모델은 결절 특이 특징부들 및 비-결절 특이 특징부들을 포함하고, 비-결절 특이 특징부들은 결절 특이 특징부들보다 더 높은 특징부 중요도 값들을 갖는다.
다양한 실시 형태들에서, 대상체가 후보라고 결정하는 단계는 대상체가 Lung-RADS 1 또는 Lung-RADS 2 중 임의의 것으로 분류된다고 결정하는 단계를 추가로 포함한다. 다양한 실시 형태들에서, 1년 위험 예측 모델은 적어도 0.72의 곡선하면적(AUC) 값을 나타낸다. 다양한 실시 형태들에서, 1년 위험 예측 모델은 배경 발생률과 비교하여 누적 발생의 적어도 5.5배 증가를 달성한다. 다양한 실시 형태들에서, 대상체가 후보라고 결정하는 단계는 상기 대상체가 Lung-RADS 1로 분류된다고 결정하는 단계를 추가로 포함한다. 다양한 실시 형태들에서, 1년 위험 예측 모델은 적어도 0.57의 곡선하면적(AUC) 값을 나타낸다. 다양한 실시 형태들에서, 1년 위험 예측 모델은 결절 특이 특징부들 및 비-결절 특이 특징부들을 포함하고, 결절 특이 특징부들은 비-결절 특이 특징부들보다 더 높은 특징부 중요도 값들을 갖는다. 다양한 실시 형태들에서, 가장 높은 특징부 중요도 값들을 갖는 상위 3개의 추출된 특징부들의 50% 초과는 비-결절 특이 특징부들이다.
다양한 실시 형태들에서, 대상체가 후보라고 결정하는 단계는 Lung-RADS 1, Lung-RADS 2, Lung-RADS 3, Lung-RADS 4A, 또는 Lung-RADS 4B 중 하나에서 대상체의 분류를 획득하는 단계를 포함한다. 다양한 실시 형태들에서, 1년 위험 예측 모델은 적어도 0.90의 곡선하면적(AUC) 값을 나타낸다. 다양한 실시 형태들에서, 1년 위험 예측 모델은 배경 발생률과 비교하여 누적 발생의 적어도 11배 증가를 달성한다.
다양한 실시 형태들에서, 대상체가 후보라고 결정하는 단계는 대상체가 Lung-RADS 1, Lung-RADS 2, Lung-RADS 3, 또는 Lung-RADS 4A 중 임의의 것으로 분류된다고 결정하는 단계를 추가로 포함한다. 다양한 실시 형태들에서, 1년 위험 예측 모델은 적어도 0.81의 곡선하면적(AUC) 값을 나타낸다. 다양한 실시 형태들에서, 1년 위험 예측 모델은 배경 발생률과 비교하여 누적 발생의 적어도 7.6배 증가를 달성한다. 다양한 실시 형태들에서, 가장 높은 특징부 중요도 값들을 갖는 상위 5개의 추출된 특징부들의 50% 초과는 비-결절 특이 특징부들이다.
다양한 실시 형태들에서, 대상체가 후보라고 결정하는 단계는 대상체가 Lung-RADS 1, Lung-RADS 2, 또는 Lung-RADS 3 중 임의의 것으로 분류된다고 결정하는 단계를 추가로 포함한다. 다양한 실시 형태들에서, 1년 위험 예측 모델은 적어도 0.82의 곡선하면적(AUC) 값을 나타낸다. 다양한 실시 형태들에서, 1년 위험 예측 모델은 배경 발생률과 비교하여 누적 발생의 적어도 8.6배 증가를 달성한다.
다양한 실시 형태들에서, 대상체에 대한 폐암의 하나 이상의 향후 위험들을 예측하는 단계는 다수의 위험 예측 모델들을 적용하여 대상체가 N의 상이한 기간들 내에 폐암을 발전시킬 가능성이 있는지 예측하는 단계를 포함한다. 다양한 실시 형태들에서, N의 상이한 기간들 중 적어도 하나는 6개월, 1년, 1.5년, 2년, 2.5년, 3년, 3.5년, 4년, 4.5년, 5년, 5.5년, 6년, 6.5년, 7년, 7.5년, 8년, 8.5년, 9년, 9.5년, 10년, 10.5년, 11년, 11.5년, 12년, 12.5년, 13년, 13.5년, 14년, 14.5년, 15년, 15.5년, 16년, 16.5년, 17년, 17.5년, 18년, 18.5년, 19년, 19.5년, 또는 20년 중 어느 하나이다. 다양한 실시 형태들에서, N은 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 또는 20의 상이한 기간들이다.
다양한 실시 형태들에서, 하나 이상의 위험 예측 모델들 중 하나는 Lung-RADS 1-4B의 임의의 것으로 분류된 트레이닝 개인들의 트레이닝 코호트로부터 캡처된 트레이닝 이미지들을 이용하여 폐암의 향후 위험을 예측하도록 트레이닝된 Lung-RADS 1-4B 예측 모델이다. 다양한 실시 형태들에서, 하나 이상의 위험 예측 모델들 중 하나는 Lung-RADS 1-4A의 임의의 것으로 분류된 트레이닝 개인들의 트레이닝 코호트로부터 캡처된 트레이닝 이미지들을 이용하여 폐암의 향후 위험을 예측하도록 트레이닝된 Lung-RADS 1-4A 모델이다. 다양한 실시 형태들에서, 하나 이상의 위험 예측 모델들 중 하나는 Lung-RADS 1-3의 임의의 것으로 분류된 트레이닝 개인들의 트레이닝 코호트로부터 캡처된 트레이닝 이미지들을 이용하여 폐암의 향후 위험을 예측하기 위한 Lung-RADS 1-3 모델이다. 다양한 실시 형태들에서, 하나 이상의 위험 예측 모델들 중 하나는 Lung-RADS 1 또는 2로 분류된 트레이닝 개인들의 트레이닝 코호트로부터 캡처된 트레이닝 이미지들을 이용하여 폐암의 향후 위험을 예측하도록 트레이닝된 Lung-RADS 1-2 모델이다. 다양한 실시 형태들에서, 하나 이상의 위험 예측 모델들 중 하나는 Lung-RADS 1로 분류된 트레이닝 개인들의 트레이닝 코호트로부터 캡처된 트레이닝 이미지들을 이용하여 폐암의 향후 위험을 예측하도록 트레이닝된 Lung-RADS 1 모델이다. 다양한 실시 형태들에서, 트레이닝 코호트의 대부분의 트레이닝 개인들은 이전에 Lung-RADS 1로 분류된다.
다양한 실시 형태들에서, 하나 이상의 이미지들은 컴퓨터 단층촬영(CT) 이미지들 또는 X-선 이미지들이다. 다양한 실시 형태들에서, 하나 이상의 이미지들은 흉부 CT 이미지들 또는 흉부 X-선 이미지들을 포함한다. 다양한 실시 형태들에서, 위험 예측 모델은 국가폐암검진연구(National Lung Screening Trial, NLST)의 트레이닝 이미지들을 이용하여 트레이닝된다.
다양한 실시 형태들에서, 컴퓨팅 디바이스는: 대상체에 대한 폐암의 하나 이상의 향후 위험들을 예측하기 이전에: 대상체에 대응하는 결절-특이 특징부들을 획득하고; 결절-특이 특징부들에 기초하여 대상체가 추가 위험 예측에 대한 후보라고 결정하도록 추가로 구성된다. 다양한 실시 형태들에서, 대상체가 후보라고 결정하는 것은 대상체가 폐암을 갖고 있지 않거나 또는 폐암을 발전시킬 위험이 낮다고 결정하는 것을 포함한다. 다양한 실시 형태들에서, 대상체가 폐암을 발전시킬 위험이 낮다고 결정하는 것은 결절-특이 특징부들에 기초하여 대상체가 결절을 갖고 있지 않다고 결정하는 것을 포함한다.
다양한 실시 형태들에서, 폐암은 비-소세포 폐암 또는 소세포 폐암이다. 다양한 실시 형태들에서, 폐암은 선암종 또는 편평세포암종이다. 다양한 실시 형태들에서, 컴퓨팅 디바이스 폐암의 예측된 향후 위험에 기초하여 대상체를 치료하기 위한 중재시술을 선택하는 단계를 수행하도록 추가로 구성된다. 다양한 실시 형태들에서, 대상체를 치료하기 위한 중재시술을 선택하는 것은 대상체에 투여하기 위한 치료를 선택하는 것을 포함한다. 다양한 실시 형태들에서, 선택된 치료는 폐암의 발전을 지연 또는 방지하기 위한 예방이다. 다양한 실시 형태들에서, 트레이닝된 위험 예측 모델들 중 하나 이상은 랜덤 포레스트 모델 또는 그래디언트 부스트 모델 중 하나이다.
본 발명의 이들 및 다른 특징부들, 양태들, 및 장점들은 하기 설명 및 첨부 도면들을 참고하여 더 잘 이해될 것이다.
도면(도) 1a는 일 실시 형태에 따라 대상체에 대한 암 예측을 결정하기 위한 시스템 환경 개요를 도시한다.
도 1b는 일 실시 형태에 따라 암 예측 시스템의 블록도를 도시한다.
도 2a는 제1 실시 형태에 따라 환자 강화와 같은 사용을 위한 대상체에 대한 암의 향후 위험을 결정하기 위한 예시적인 흐름도를 도시한다.
도 2b는 제2 실시 형태에 따라 환자 강화와 같은 사용을 위한 대상체에 대한 암의 향후 위험을 결정하기 위한 예시적인 흐름도를 도시한다.
도 3은 일 실시 형태에 따라 환자 강화와 같은 사용을 위한 대상체에 대한 암의 향후 위험을 결정하기 위한 예시적인 흐름 프로세스이다.
도 4는 도 1a, 도 1b, 도 2a, 도 2b, 및 도 3에 도시된 개체들을 구현하기 위한 예시적인 컴퓨터를 도시한다.
도 5a는 Lung-RADS 1-4B 환자들에 걸친 1년 내의 암의 가능성을 예측하기 위한 위험 예측 모델의 수행을 도시한다.
도 5b는 Lung-RADS 1-4B 환자들에 걸친 3년 내의 암의 가능성을 예측하기 위한 위험 예측 모델의 수행을 도시한다.
도 5c는 Lung-RADS 1-4B 환자들에 걸쳐 5년 내의 암의 가능성을 예측하기 위한 위험 예측 모델의 수행을 도시한다.
도 5d는 Lung-RADS 1-4B 환자들에 걸친 3년 누적 발생 함수를 도시한다.
도 6a는 Lung-RADS 1-4A 환자들에 걸친 1년 내의 암의 가능성을 예측하기 위한 위험 예측 모델의 수행을 도시한다.
도 6b는 Lung-RADS 1-4A 환자들에 걸친 3년 내의 암의 가능성을 예측하기 위한 위험 예측 모델의 수행을 도시한다.
도 6c는 Lung-RADS 1-4A 환자들에 걸친 5년 내의 암의 가능성을 예측하기 위한 위험 예측 모델의 수행을 도시한다.
도 6d는 Lung-RADS 1-4A 환자들에 걸친 3년 누적 발생 함수를 도시한다.
도 7a는 Lung-RADS 1-3 환자들에 걸친 1년 내의 암의 가능성을 예측하기 위한 위험 예측 모델의 수행을 도시한다.
도 7b는 Lung-RADS 1-3 환자들에 걸친 3년 내의 암의 가능성을 예측하기 위한 위험 예측 모델의 수행을 도시한다.
도 7c는 Lung-RADS 1-3 환자들에 걸친 5년 내의 암의 가능성을 예측하기 위한 위험 예측 모델의 수행을 도시한다.
도 7d는 Lung-RADS 1-3 환자들에 걸친 3년 누적 발생 함수를 도시한다.
도 8a는 Lung-RADS 1-2 환자들에 걸친 1년 내의 암의 가능성을 예측하기 위한 위험 예측 모델의 수행을 도시한다.
도 8b는 Lung-RADS 1-2 환자들에 걸친 3년 내의 암의 가능성을 예측하기 위한 위험 예측 모델의 수행을 도시한다.
도 8c는 Lung-RADS 1-2 환자들에 걸친 5년 내의 암의 가능성을 예측하기 위한 위험 예측 모델의 수행을 도시한다.
도 8d는 Lung-RADS 1-2 환자들에 걸친 3년 누적 발생 함수를 도시한다.
도 9a는 Lung-RADS 1 환자들에 걸친 1년 내의 암의 가능성을 예측하기 위한 위험 예측 모델의 수행을 도시한다.
도 9b는 Lung-RADS 1 환자들에 걸친 3년 내의 암의 가능성을 예측하기 위한 위험 예측 모델의 수행을 도시한다.
도 9c는 Lung-RADS 1 환자들에 걸친 5년 내의 암의 가능성을 예측하기 위한 위험 예측 모델의 수행을 도시한다.
도 9d는 Lung-RADS 1 환자들에 걸친 3년 누적 발생 함수를 도시한다.
도 10a는 Lung-RADS 1-4B 환자들에 걸친 1년 내의 암의 가능성을 예측하기 위한 라디오믹 특징부들을 포함하는 위험 예측 모델의 수행을 도시한다.
도 10b는 Lung-RADS 1-4B 환자들에 걸친 3년 내의 암의 가능성을 예측하기 위한 라디오믹 특징부들을 포함하는 위험 예측 모델의 수행을 도시한다.
도 11a는 Lung-RADS 1-4A 환자들에 걸친 1년 내의 암의 가능성을 예측하기 위한 라디오믹 특징부들을 포함하는 위험 예측 모델의 수행을 도시한다.
도 11b는 Lung-RADS 1-4A 환자들에 걸친 3년 내의 암의 가능성을 예측하기 위한 라디오믹 특징부들을 포함하는 위험 예측 모델의 수행을 도시한다.
도 12a는 Lung-RADS 1-3 환자들에 걸친 1년 내의 암의 가능성을 예측하기 위한 라디오믹 특징부들을 포함하는 위험 예측 모델의 수행을 도시한다.
도 12b는 Lung-RADS 1-3 환자들에 걸친 3년 내의 암의 가능성을 예측하기 위한 라디오믹 특징부들을 포함하는 위험 예측 모델의 수행을 도시한다.
도 13a는 Lung-RADS 2-4B 환자들에 걸친 1년 내의 암의 가능성을 예측하기 위한 라디오믹 특징부들을 포함하는 위험 예측 모델의 수행을 도시한다.
도 13b는 Lung-RADS 2-4B 환자들에 걸친 3년 내의 암의 가능성을 예측하기 위한 라디오믹 특징부들을 포함하는 위험 예측 모델의 수행을 도시한다.
도 14a는 Lung-RADS 4A-4B 환자들에 걸친 1년 내의 암의 가능성을 예측하기 위한 라디오믹 특징부들을 포함하는 위험 예측 모델의 수행을 도시한다.
도 14b는 Lung-RADS 4A-4B 환자들에 걸친 3년 내의 암의 가능성을 예측하기 위한 라디오믹 특징부들을 포함하는 위험 예측 모델의 수행을 도시한다.
I. 정의
청구범위 및 명세서에 사용된 용어는 달리 명시되지 않는 한 하기에 제시된 바와 같이 정의된다.
용어 "대상체" 또는 "환자"는 상호교환가능하게 사용되고, 생체내, 생체외, 또는 시험관내, 남성 또는 여성에 상관없이 세포, 조직, 또는 장기, 인간 또는 비-인간을 포함한다.
용어 "포유류"는 인류 및 비-인류 둘 모두를 포함하고, 인류, 비-인류 영장류, 개, 고양이, 쥐, 소, 말, 및 돼지를 포함하지만 이에 한정되지 않는다.
용어 "샘플" 또는 "테스트 샘플"은 정맥천자, 배설, 사정, 마사지, 생검, 바늘 흡인, 세척 샘플, 찰과, 외과적 절개, 또는 중재시술을 포함하는 수단들 또는 기타 당업계에 공지된 수단들에 의해 대상체로부터 채취된, 단일 세포 또는 다중 세포들 또는 세포 조각 또는 혈액 샘플과 같은 체액의 일정부분을 포함할 수 있다. 체액의 일정부분의 예들은 양수, 방수, 담즙, 림프, 모유, 간질액, 혈액, 혈장, 귀지(cerumen(earwax)), 쿠퍼액(사정전 액체), 암죽, 미즙, 여성 사정액, 월경, 점액, 타액, 오줌, 구토물, 눈물, 질 윤활액, 땀, 혈청, 정액, 피지, 고름, 흉수, 뇌척수액, 윤활액, 세포내액, 및 유리체액을 포함한다. 다양한 실시 형태들에서, 샘플은 폐 종양 또는 폐 결절과 같은 조직의 생검일 수 있다.
용어 "하나 이상의 이미지들을 획득하는 것"은 대상체로부터 캡처된 하나 이상의 이미지들을 획득하는 것 또는 대상체로부터 캡처된 하나 이상의 이미지들로부터 획득된 샘플을 획득하는 것을 포함한다. 하나 이상의 이미지들을 획득하는 것은 대상체 또는 대상체로부터 획득된 샘플로부터 하나 이상의 이미지들을 캡처하는 단계들을 수행하는 것을 포함할 수 있다. 문구는 또한, 예컨대, 대상체 또는 대상체로부터 획득된 샘플로부터 하나 이상의 이미지들을 캡처하는 단계들을 수행한 제3자로부터 하나 이상의 이미지들을 수신하는 것을 포함할 수 있다. 하나 이상의 이미지들은 통상의 기술자에 의해 저장 메모리에 저장되는 것을 포함하는 다양한 공지된 방법들을 통해 획득될 수 있다. 다양한 실시 형태들에서, "하나 이상의 이미지들을 획득하는 것"은 각각 단일 시점(예컨대, 단일 환자 내원)에 대상체로부터 캡처된 하나 이상의 이미지들을 획득하는 것을 지칭한다.
용어 "트레이닝 이미지"는 위험 예측 모델, 예컨대, 본 명세서에 기재된 모델과 같은 폐암 위험 예측 모델을 트레이닝시키는 데 사용되는 개인으로부터 캡처된 이미지(예컨대, CT 이미지 또는 X-선 이미지)를 지칭한다. 다양한 실시 형태들에서, 트레이닝 이미지는 환자들의 일상적인 임상 치료로부터 구축된 코호트로부터(예컨대, 일상적으로 스크리닝된 환자들로부터)의 컴퓨터 단층촬영(CT) 이미지이다. 다양한 실시 형태들에서, 트레이닝 이미지는 연구 조사(예컨대, 연방정부/산업체 지원 연구 조사)로부터 구축된 코호트로부터의 컴퓨터 단층촬영(CT) 이미지이다. 다양한 실시 형태들에서, 트레이닝 이미지는 국가폐암검진연구(NLST) 코호트로부터의 컴퓨터 단층촬영(CT) 이미지이다. 다양한 실시 형태들에서, 트레이닝 이미지는 맞춤형 데이터세트에 포함된 컴퓨터 단층촬영(CT) 이미지이다. 예를 들어, 트레이닝 이미지는 트레이닝 개인으로부터 캡처될 수 있다. 용어 "트레이닝 개인"은 위험 예측 모델을 트레이닝 시 사용하기 위하여 트레이닝 이미지가 캡처되거나 또는 다른 방식으로 획득되는 개인을 지칭한다.
용어 "결절 특이 특징부들"은 폐 결절의 특징부들을 지칭하는데, 예를 들어, 결절 특이 감쇠, 결절 마진 설명, 결절 크기, 결절 형상, 결절 텍스처(예컨대, 매끄러움, 삐죽함 등), 결절 직경, 및 Lung-RADS 점수를 포함한다. 다양한 실시 형태들에서, 결절-특이 특징부들은 (예컨대, 이미지 분석 알고리즘을 구현함으로써) 이미지들로부터 연산적으로 추출된다. 예를 들어, 결절 특이 특징부들은 PyRadiomics와 같은 이미지 프로세싱 알고리즘을 이용하여 추출되는 라디오믹 특징부들일 수 있다. 예시적인 라디오믹 특징부들은 1차 통계, 3D 형상 기반 특징부들, 2D 형상 기반 특징부들, 그레이 레벨 동시발생 행렬, 그레이 레벨 반복 길이 행렬, 그레이 레벨 크기 영역 행렬, 이웃 그레이 톤 차이 행렬, 및 그레이 레벨 의존성 행렬을 포함할 수 있다. 다양한 실시 형태들에서, 라디오믹 특징부들은 웨이블렛 필터 또는 가우시안 필터와 같은 필터를 적용함으로써 변환된 이미지로부터 추출된다. 따라서, 1차 통계, 3D 형상 기반 특징부들, 2D 형상 기반 특징부들, 그레이 레벨 동시발생 행렬, 그레이 레벨 반복 길이 행렬, 그레이 레벨 크기 영역 행렬, 이웃 그레이 톤 차이 행렬, 및 그레이 레벨 의존성 행렬 중 임의의 것이 웨이블렛 변환 이미지 또는 가우시안 변환 이미지로부터 추출될 수 있다. 본 명세서에 사용된 바와 같이, "결절-특이 특징부들"은 또한 "주관적인 특징부들"로도 지칭된다. 다양한 실시 형태들에서, 결절-특이 특징부들은 대상체의 CT 스캔과 같은 대상체의 이미지들을 분석하는 숙련된 전문가(예컨대, 방사선과의사)에 의해 준비된 보고서로부터 추출된다.
용어 "비-결절 특이 특징부들"은 폐 실질 특징부들 또는 신체 조성 특징부들 중 임의의 것을 지칭한다. 비-결절 특이 특징부들은 대상체로부터의 결절이 아닌 특징부들을 포함할 수 있다. 비-결절 특이 특징부들은 대상체로부터의 결절과 연관되지 않은 특징부들을 포함할 수 있다. 폐 실질 특징부들은, 예를 들어, (i) -950 하운스필드 단위(Hounsfield Units, HU) 미만의 감쇠를 갖는 면적/부피로서 정의되는 낮은 감쇠 영역(LAA), (ii) -600HU 내지 -250 HU의 감쇠를 갖는 폐의 면적/부피로서 정의되는 높은 감쇠 영역(HAA)에 의해 점유된 폐의 백분율, 및 폐 윗부분에서의 LAA와 폐 아랫부분에서의 LAA 사이의 비율(Ratio LAA)을 포함할 수 있는 폐 실질의 밀도 측정을 포함할 수 있다. 폐 실질 특징부들은 추가로 폐 실질의 국부적 히스토그램 측정들, 예를 들어, 정상 조직, 중심소엽 폐기종, 중심소엽 결절, 간유리음영, 벌집모양, 선형 흉터, 결절형, 그물형, 흉막하선, 기타 폐기종 및/또는 낭종에 의해 점유된 폐의 백분율과 같은 폐 실질의 사이질 변화의 측정들을 포함할 수 있다. 신체 조성 특징부들은, 예를 들어, 대흉근 단면적, 소흉근 단면적, 대흉근 제지방 단면적, 소흉근 제지방 단면적, 좌측 또는 우측 대흉근 또는 소흉근의 집합 단면적, 및 피하지방 단면적을 포함한다. 본 명세서에 사용된 바와 같이, "비-결절 특이 특징부들"은 또한 "객관적인 특징부들"로 지칭된다. 다양한 실시 형태들에서, "비-결절 특이 특징부들"은 대상체로부터 캡처된 이미지들과 같은 이미지들로부터 연산적으로 추출된다. 다양한 실시 형태들에서, 특징부들로부터 연산적으로 추출된 비-결절 특징부들은 비-결절 특징부들을 포함하는 방사선과의사 보고서와 같은 보고서를 작성하는 데 사용될 수 있다. 다양한 실시 형태들에서, "비-결절 특이 특징부들"은 폐기종의 지속시간 또는 심혈관 질환의 지속시간을 포함하지 않는다.
문구 "Lung-RADS X-Y"는 Lung-RADS X, Lung-RADS Y, 및 수치형 변수 "X"와 "Y" 사이의 임의의 값으로 분류된 개인들을 포함하는 것으로 의도된다. 예를 들어, Lung-RADS 1-3은 Lung-RADS 1, Lung-RADS 2, 및 Lung-RADS 3으로 분류된 개인들을 나타낸다.
문구 "Lung-RADS X-Y 예측 모델"은 Lung-RADS X-Y 중 어느 하나로 분류된 트레이닝 개인들로부터 캡처된 트레이닝 이미지들을 이용하여 트레이닝된 위험 예측 모델을 지칭한다.
문구 "M년 예측 모델"은 "M" 기간 내의 암의 향후 위험을 예측하도록 트레이닝된 위험 예측 모델을 지칭한다. 다양한 실시 형태들에서, "M"은 6개월, 1년, 1.5년, 2년, 2.5년, 3년, 3.5년, 4년, 4.5년, 5년, 5.5년, 6년, 6.5년, 7년, 7.5년, 8년, 8.5년, 9년, 9.5년, 10년, 10.5년, 11년, 11.5년, 12년, 12.5년, 13년, 13.5년, 14년, 14.5년, 15년, 15.5년, 16년, 16.5년, 17년, 17.5년, 18년, 18.5년, 19년, 19.5년, 또는 20년 중 임의의 것이다. 다양한 실시 형태들에서, "M"은 대상체로부터 하나 이상의 이미지들의 획득 시간으로부터 측정된다. 따라서, 1년 예측 모델은 대상체로부터 하나 이상의 이미지들을 획득한 시간으로부터 1년 내의 암의 향후 위험을 예측하도록 트레이닝된 위험 예측 모델을 지칭한다.
문구 "M년, Lung-RADS X-Y 예측 모델"은 1) is Lung-RADS X-Y 중 어느 하나로 분류된 트레이닝 개인들로부터 캡처된 트레이닝 이미지들을 이용하여 트레이닝되고 2) "M"년 내의 암의 향후 위험을 예측하도록 트레이닝된 위험 예측 모델을 지칭한다.
문구 "암의 향후 위험"은 대상체가 T0으로부터 주어진 기간, 예컨대, 1년 또는 3년 내에 암을 발전시킬 위험을 지칭한다. 다양한 실시 형태들에서, 암의 향후 위험은 대상체가 시간 0(T0)부터 주어진 기간 내에 암을 발전시킬 가능성을 지칭한다. 다양한 실시 형태들에서, 암의 향후 위험은 대상체가 1년 내에 암을 발전시킬 가능성을 지칭한다. 다양한 실시 형태들에서, 암의 향후 위험은 대상체가 3년 내에 암을 발전시킬 가능성을 지칭한다. 다양한 실시 형태들에서, 암의 향후 위험은 대상체가 5년 내에 암을 발전시킬 가능성을 지칭한다. 다양한 실시 형태들에서, 암의 향후 위험은 대상체가 적어도 1년, 적어도 2년, 적어도 3년, 적어도 4년, 적어도 5년, 적어도 6년, 적어도 7년, 적어도 8년, 적어도 9년, 적어도 10년, 적어도 11년, 적어도 12년, 적어도 13년, 적어도 14년, 적어도 15년, 적어도 16년, 적어도 17년, 적어도 18년, 적어도 19년, 또는 적어도 20년 내에 암을 발전시킬 가능성을 지칭한다. 다양한 실시 형태들에서, "암의 향후 위험"은 이진 값이다(예컨대, 0 또는 1, 여기서 0은 기간 내에 암을 발전시킬 가능성이 없음을 나타내고 1은 기간 내에 암을 발전시킬 가능성이 있음을 나타낸다). 다양한 실시 형태들에서, "암의 향후 위험"은 연속 값이다(예컨대, 0과 1 사이, 여기서 1에 더 가까운 값은 기간 내에 암을 발전시킬 가능성이 더 높음을 나타낸다).
용어 폐암의 "치료하기", "치료", 또는 "치료법"은 치료의 투여에 의한 암의 진행을 늦추거나, 중지시키거나 또는 역전시키는 것을 의미한다. 일부 실시 형태들에서, 폐암 치료는 암의 진행을, 이상적으로는 암 자체를 소멸시키는 지점까지 역전시키는 것을 의미한다. 다양한 실시 형태들에서, 폐암의 "치료하기", "치료", 또는 "치료법"은 대상체에 치료제 또는 약제적 조성물을 투여하는 것을 포함한다. 추가적으로, 본 명세서에 사용된 바와 같이, 폐암의 "치료하기", "치료", 또는 "치료법"은 예방 목적으로 치료제 또는 약제적 조성물을 투여하는 것을 추가로 포함한다. 암의 예방은 암의 발생, 발전, 발병, 진행, 또는 재발 또는 폐암의 증상의 일부 또는 전부를 방지하거나 또는 폐암의 발병의 가능성을 줄이기 위한 조성물 또는 치료제의 투여를 지칭한다.
본 명세서에 사용되는 바와 같이, 단수 형태("a", "an" 및 "the")는 그 내용이 명확하게 달리 지시하지 않는 한 복수의 지시 대상을 포함하는 것에 유의하여야 한다.
II. 시스템 환경 개요
도면(도) 1a는 일 실시 형태에 따라 대상체에 대한 암 예측을 결정하기 위한 시스템 환경 개요를 도시한다. 시스템 환경(100)은 대상체(110), 이미징 디바이스(120), 및 대상체(110)에 대한 암 예측(140)을 결정하기 위한 암 예측 시스템(130)을 소개하기 위한 맥락을 제공한다. 도 1a는 암 예측(140)이 생성되는 하나의 대상체(110)를 도시하지만, 다양한 실시 형태들에서, 시스템 환경(100)은 둘 이상의 대상체를 포함하여 암 예측 시스템(130)이 둘 이상의 대상체에 대한 암 예측(140)(예컨대, 각각의 대상체에 대한 암 예측)을 생성하도록 한다.
다양한 실시 형태들에서, 대상체(110)는 건강하다. 예를 들어, 대상체는 이전에 암으로 진단되지 않거나 또는 암이 있는 것으로 의심되지 않는다. 따라서, 본 명세서에 개시된 암의 추가 위험 예측을 위한 방법은 건강한 대상체에서 암의 조기 검출에 유리할 수 있다. 특정 실시 형태들에서, 대상체의 암의 유형은 폐암이다. 따라서, 본 명세서에 기재된 방법들은 폐암의 조기 검출에 유리할 수 있다. 다양한 실시 형태들에서, 대상체는 이전에 암으로 진단되었다. 이러한 실시 형태들에서, 대상체는 차도가 있을 수 있고, 따라서, 암의 추가 위험 예측을 위한 방법들은 대상체가 일정 기간 내에 암의 재발을 경험할 가능성이 있는지 결정하는데 유리할 수 있다.
다양한 실시 형태들에서, 일정 기간 내에 암을 발전시키거나 또는 암 재발을 경험할 것으로 예측된 대상체들은 암의 발병 또는 재발을 늦추거나 또는 방지하는 예방적 치료와 같은 치료들을 투여받을 수 있다. 다양한 실시 형태들에서, 일정 기간 내에 암을 발전시키거나 또는 암 재발을 경험할 것으로 예측된 대상체들이 임상 시험에 등록되도록 선택된다.
도 1a를 참조하면, 이미징 디바이스(120)는 대상체(110)로부터 이미지를 캡처한다. 다양한 실시 형태들에서, 이미징 디바이스(120)는 대상체(110)로부터 획득된 테스트 샘플로부터 이미지를 캡처한다. 다양한 실시 형태들에서, 이미지 및/또는 샘플은 제3자, 예컨대, 의료 전문가에 의해 획득될 수 있다. 의료 전문가들의 예에는 의사, 응급 의료 기술자, 간호사, 응급 의료요원, 심리학자, 채혈사, 의학 물리학 인원, 전담간호사, 외과의사, 치과의사, 및 통상의 기술자에 공지될 임의의 기타 명백한 의료 전문가를 포함한다. 다양한 실시 형태들에서, 이미지 및/또는 샘플은 의료 환경 또는 의료 진료소에서 획득될 수 있다. 다양한 실시 형태들에서, 이미지 및/또는 샘플은 이미징 디바이스, 예컨대, 모바일 이미징 디바이스를 이용하여 캡처될 수 있다.
일부 실시 형태들에서, 이미징 디바이스(120)는 대상체(110)의 해부학적 위치의 이미지를 캡처한다. 대상체의 예시적인 해부학적 위치들은 폐, 흉강, 신장, 간, 췌장, 뇌, 위, 장, 엉덩이, 무릎, 다리, 팔, 및 얼굴을 포함할 수 있다. 다양한 실시 형태들에서, 이미징 디바이스(120)는 대상체(110)의 흉강의 이미지를 캡처한다. 다양한 실시 형태들에서, 이미징 디바이스(120)는 대상체의 폐의 이미지를 캡처한다. 다양한 실시 형태들에서, 이미징 디바이스(120)는 대상체의 흉부(예컨대, 가슴 근육을 포함하는 흉벽)의 이미지를 캡처한다. 다양한 실시 형태들에서, 이미징 디바이스(120)는 대상체의 폐를 포함하는 흉강의 이미지를 캡처한다. 다양한 실시 형태들에서, 이미징 디바이스(120)는 대상체의 흉부(예컨대, 가슴 근육을 포함하는 흉벽)를 포함하는 흉강의 이미지를 캡처한다. 다양한 실시 형태들에서, 이미징 디바이스(120)는 대상체의 폐 및 대상체의 흉부(예컨대, 가슴 근육을 포함하는 흉벽) 둘 모두를 포함하는 흉강의 이미지를 캡처한다.
다양한 실시 형태들에서, 이미징 디바이스(120)는 컴퓨터 단층촬영(CT) 스캐너, 자기공명 이미징(MRI) 스캐너, 양전자방출단층촬영(PET) 스캐너, X-선 스캐너, 또는 초음파 이미징 디바이스 중 하나이다. 특정 실시 형태들에서, 이미징 디바이스(120)는 대상체(110)의 하나 이상의 이미지들을 캡처하는 CT 스캐너이다. 특정 실시 형태들에서, 이미징 디바이스(120)는 대상체의 폐 및 대상체의 흉부(예컨대, 가슴 근육을 포함하는 흉벽) 둘 모두를 포함하는 흉강의 하나 이상의 CT 이미지들을 캡처하는 CT 스캐너이다. 특정 실시 형태들에서, 이미징 디바이스(120)는 대상체의 폐 및 대상체의 흉부(예컨대, 가슴 근육을 포함하는 흉벽) 둘 모두를 포함하는 흉부의 하나 이상의 X-선 이미지들을 캡처하는 X-선 스캐너이다.
일반적으로, 암 예측 시스템(130)은 대상체(110)로부터 캡처된 하나 이상의 이미지들(예컨대, 이미징 디바이스(120)에 의해 캡처된 이미지들)을 분석하고 대상체(110)에 대한 암 예측(140)을 생성한다. 다양한 실시 형태들에서, 암 예측 시스템(130)에 의해 결정된 암 예측(140)은 대상체(110)에 대한 암의 예측된 향후 위험이다. 예를 들어, 암 예측(140)은 대상체(110)가 대상체(110)로부터 이미지들이 캡처된 날로부터 일정 기간 내(예컨대, 1년 내, 3년 내, 또는 5년 내)에 암을 발전시킬 것으로 예측되는지 나타내는 값이다.
다양한 실시 형태들에서, 암 예측(140)을 생성하기 위해, 암 예측 시스템(130)은 하나 이상의 이미지들로부터 특징부들을 추출하고 하나 이상의 트레이닝된 위험 예측 모델들을 적용하여 하나 이상의 이미지들의 특징부들을 분석한다. 트레이닝된 위험 예측 모델은 기간 내의 대상체(110)에 대한 암의 향후 위험을 예측한다. 예를 들어, 암 예측 시스템(130)은 3년 내의 암의 향후 위험을 예측하도록 트레이닝된 위험 예측 모델을 적용할 수 있다. 다양한 실시 형태들에서, 암 예측 시스템(130)은 다수의 트레이닝된 위험 예측 모델들을 적용함으로써 대상체(110)에 대한 상이한 기간들에 걸친 다수의 암의 향후 위험들을 결정한다. 예를 들어, 3년 내의 암의 향후 위험을 예측하도록 트레이닝된 위험 예측 모델을 적용하는 것 외에도, 암 예측 시스템(130)은 5년 내의 암의 향후 위험을 예측하도록 트레이닝된 제2 위험 예측 모델을 추가로 적용한다. 암 예측 시스템(130)은 추가적인 기간들(예컨대, 1년, 10년, 15년, 20년 등)에 대해 트레이닝된 더 많은 트레이닝된 위험 예측 모델들을 적용할 수 있다. 일반적으로, 위험 예측 모델들은 독립적으로 트레이닝되고 가산되지 않는다(예컨대, 1년에서 3년 내에 발전할 것으로 예측되는 암을 구하기 위해 3년 내에 예측되는 암에서 1년 내에 예측되는 암을 감산할 수 없음).
다양한 실시 형태들에서, 암 예측(140)은 대상체에 대한 암의 예측된 향후 위험으로부터 도출된 표시이고, 표시는 대상체(110)가 임상 시험의 등록을 위한 환자 코호트에 포함 또는 배제될지 식별한다. 표시는 임상 시험 강화 목적에 유용하다. 예를 들어, 대상체(110)가 기간 내에 암을 발전시키는 것으로 예측되는 경우, 표시는 대상체(110)가 임상 시험의 등록을 위한 환자 코호트에 포함될 것으로 식별한다. 다른 예로서, 대상체(110)가 일정 기간 내에 암을 발전시킬 것으로 예측되지 않는 경우, 표시는 대상체(110)가 임상 시험의 등록을 위한 환자 코호트에서 배제될 것으로 식별한다.
다양한 실시 형태들에서, 암 예측(140)은 암의 예측된 향후 위험에 기초하여 대상체(110)에 대한 추천 중재시술을 포함할 수 있다. 예를 들어, 암 예측 시스템(130)이 대상체(110)가 1년 내에 암을 발전시킬 가능성이 있다고 결정하는 경우, 암 예측(140)은 향후 1년간 암의 빠른 발병을 지연 또는 방지하기 위한 추천 중재시술을 포함할 수 있다.
암 예측 시스템(130)은 도 4에 관련하여 아래 논의되는 바와 같이 컴퓨터 시스템(400)으로서 구현된, 하나 이상의 컴퓨터들을 포함할 수 있다. 따라서, 다양한 실시 형태들에서, 암 예측 시스템(130)에 관련하여 기재된 단계들은 인 실리코(in silico)에서 수행된다.
다양한 실시 형태들에서, 이미징 디바이스(120) 및 암 예측 시스템(130)은 상이한 당사자들에 의해 사용된다. 예를 들어, 제1 당사자는 이미징 디바이스(120)를 동작시켜 대상체(110)로부터 하나 이상의 이미지들을을 캡처하고 이어서 암 예측 시스템(130)을 구현하여 암 예측(140)을 결정하는 제2 당사자에게 캡처된 하나 이상의 이미지들을 제공한다. 일부 실시 형태들에서, 이미징 디바이스(120) 및 암 예측 시스템(130)은 동일한 당사자에 의해 사용된다.
이제 일 실시 형태에 따라 암 예측 시스템(130)의 컴퓨터 로직 컴포넌트들을 도시하는 블록도를 도시하는 도 1b를 참조한다. 여기서, 암 예측 시스템(130)은 특징부 추출 모듈(145), 후보 대상체 모듈(150), 위험 트레이닝 모듈(155), 위험 전개 모듈(160), 강화 모듈(165), 및 트레이닝 데이터 저장소(170)를 포함한다. 다양한 실시 형태들에서, 암 예측 시스템(130)은 추가적인 또는 더 적은 모듈들로 상이하게 구성될 수 있다. 예를 들어, 암 예측 시스템(130)은 후보 대상체 모듈(150)을 포함할 필요가 없다. 다른 예로서, 암 예측 시스템(130)은 (도 1b에서 점선으로 표시된 바와 같이) 위험 트레이닝 모듈(155) 또는 트레이닝 데이터 저장소(170)를 포함할 필요가 없고, 대신에, 위험 트레이닝 모듈(155) 및 트레이닝 데이터 저장소(170)는 상이한 시스템 및/또는 당사자에 의해 사용된다.
일반적으로, 특징부 추출 모듈(145)은 대상체들로부터 캡처된 이미지들 또는 트레이닝 개인들로부터 캡처된 트레이닝 이미지들로부터 특징부들을 추출한다. 다양한 실시 형태들에서, 특징부 추출 모듈(145)은 이미지들 또는 트레이닝 이미지들로부터 비-결절 특이 특징부들을 추출한다. 다양한 실시 형태들에서, 특징부 추출 모듈(145)은 이미지들 또는 트레이닝 이미지들로부터 결절 특이 특징부들을 추출한다. 다양한 실시 형태들에서, 특징부 추출 모듈(145)은 이미지들 또는 트레이닝 이미지들로부터 결절 특이 특징부들 및 비-결절 특이 특징부들을 추출한다. 특징부 추출 모듈(145)은 위험 예측 모델들을 트레이닝시키기 위해 트레이닝 이미지들로부터 추출된 특징부들을 위험 트레이닝 모듈(155)에 제공한다. 다양한 실시 형태들에서, 특징부 추출 모듈(145)은 위험에 대한 대상체들로부터 캡처된 이미지들로부터 추출된 특징부들을 후보 대상체들을 식별하기 위한 후보 대상체 모듈(150)에 제공한다. 다양한 실시 형태들에서, 특징부 추출 모듈(145)은 하나 이상의 트레이닝된 위험 예측 모델들을 전개하기 위해 대상체들로부터 캡처된 이미지들로부터 추출된 특징부들을 위험 전개 모듈(160)에 제공한다.
후보 대상체 모듈(150)은 대상체로부터 캡처된 하나 이상의 이미지들로부터 추출된 특징부들을 분석하고 대상체가 추가 위험 예측을 받을 후보 대상체인지 결정한다. 이는 추가 위험 예측을 받을 환자들의 서브세트를 식별하는 데 유용하다. 예를 들어, 저위험 암 환자들(예컨대, 현재 암을 갖고 있지 않고/않거나 현재 암을 나타내는 폐 결절을 갖고 있지 않은 환자들)에 대한 암의 향후 위험을 예측하는 것이 바람직할 수 있다. 따라서, 후보 대상체 모듈(150)은 후속 추가 위험 예측을 위해 저위험 암 환자들의 서브세트를 식별할 수 있다. 다양한 실시 형태들에서, 후보 대상체 모듈(150)은 결절 특이 특징부들 및 비-결절 특이 특징부들 둘 모두를 분석하여 대상체가 후보 대상체인지 결정한다. 다양한 실시 형태들에서, 후보 대상체 모듈(150)은 단지 결절 특이 특징부들만을 분석하여 대상체가 후보 대상체인지 결정한다. 다양한 실시 형태들에서, 후보 대상체 모듈(150)이 암 스테이징 시스템(140)에 의해 구현될 필요는 없다. 예를 들어, 모든 대상체들이 암의 향후 위험에 대해 분석되는 시나리오에서, 모든 대상체들은 추가 위험 예측을 받을 후보 대상체들이다.
위험 트레이닝 모듈(155)은 트레이닝 개인들로부터 도출된 트레이닝 데이터를 이용하여 위험 예측 모델들을 트레이닝시킨다. 예를 들어, 트레이닝 데이터는 트레이닝 개인들로부터 캡처된 하나 이상의 트레이닝 이미지들로부터 추출된 특징부들을 포함한다. 다양한 실시 형태들에서, 위험 트레이닝 모듈(155)은 결절 특이 특징부들 및 비-결절 특이 특징부들 둘 모두를 포함하는 위험 예측 모델을 트레이닝한다. 이러한 실시 형태들에서, 위험 전개 모듈(160)은 암의 향후 위험을 결정하기 위하여 대상체(예컨대, 도 1a의 대상체(110))로부터 획득된 이미지들로부터 추출된 결절 특이 특징부들 및 비-결절 특이 특징부들 둘 모두를 분석하기 위하여 위험 예측 모델을 구현한다. 다양한 실시 형태들에서, 위험 트레이닝 모듈(155)은 비-결절 특이 특징부들만을 포함하는 위험 예측 모델을 트레이닝한다. 이러한 실시 형태들에서, 위험 전개 모듈(160)은 암의 향후 위험을 결정하기 위하여 대상체(예컨대, 도 1a의 대상체(110))로부터 획득된 이미지들로부터 추출된 비-결절 특이 특징부들만을 분석하기 위하여 위험 예측 모델을 구현한다.
위험 전개 모듈(160)은 대상체(110)에 대한 암의 향후 위험의 예측과 같은 암 예측을 결정하기 위하여 대상체(예컨대, 도 1a의 대상체(110))로부터 획득된 이미지들로부터 추출된 특징부들을 분석하기 위하여 위험 예측 모델들을 구현한다. 위험 예측 모델들의 트레이닝 및 위험 예측 모델들의 전개는 아래 더 상세하게 기재된다.
강화 모듈(165)은 환자 코호트에 포함시킬 대상체들을 선택한다. 다양한 실시 형태들에서, 환자 코호트는 임상 시험의 등록을 위해 생성된다. 예를 들어, 강화 모듈(165)은 일정 기간 내에 암을 발전시킬 환자들의 더 높은 백분율을 포함하는 환자 코호트(예컨대, 강화된 환자 코호트)를 생성한다. 이렇게 강화된 환자 코호트는 임상 시험에서 더 적은 환자들의 등록을 가능하고 하고/하거나 폐암을 차단하고 방지하는 치료법들을 이용할 수 있는 사람들을 식별한다.
암 예측 시스템(130)의 컴포넌트들은 이하에서 2가지 단계를 참조하여 설명된다: 1) 트레이닝 단계 및 2) 전개 상태. 더 구체적으로는, 트레이닝 단계는 트레이닝 개인들(예컨대, 일정 기간 내에 암을 발전시키거나 또는 발전시키지 않을 것으로 알려진 개인들)로부터 캡처된 트레이닝 이미지들과 같은 트레이닝 데이터에 기초하여 위험 트레이닝 모듈(155)에 의한 하나 이상의 위험 예측 모델들의 구축 및 트레이닝을 지칭한다. 따라서, 모델들은 전개 상태 동안, 위험 전개 모듈(160)에 의한 모델들의 구현이 대상체(예컨대, 도 1a의 대상체(110))에 대한 암의 향후 위험의 예측을 가능하게 하도록 트레이닝 데이터를 이용하여 트레이닝된다.
일부 실시 형태들에서, 암 예측 시스템(130)의 컴포넌트들은 트레이닝 단계 및 전개 상태 중 하나 동안 적용된다. 예를 들어, 위험 트레이닝 모듈(155) 및 트레이닝 데이터 저장소(170)는 트레이닝 단계 동안 적용되어 위험 모델을 트레이닝시킨다. 추가적으로, 위험 전개 모듈(160)은 전개 상태 동안 적용된다. 다양한 실시 형태들에서, 암 예측 시스템(130)의 컴포넌트들은 컴포넌트들이 트레이닝 단계 동안 적용되는지 아니면 전개 상태 동안 적용되는지에 따라 상이한 당사자들에 의해 수행될 수 있다. 이러한 시나리오들에서, 예측 모델의 트레이닝 및 전개는 상이한 당사자들에 의해 수행된다. 예를 들어, 트레이닝 단계 동안 적용되는 위험 트레이닝 모듈(155) 및 트레이닝 데이터 저장소(170)는 (예컨대, 위험 예측 모델을 트레이닝시키기 위해) 제1 당사자에 의해 사용될 수 있고 전개 상태 동안 적용되는 위험 전개 모듈(160)은 (예컨대, 위험 예측 모델을 전개하기 위해) 제2 당사자에 의해 수행될 수 있다.
III. 암의 향후 위험을 예측하기 위한 방법
본 명세서에 기재된 실시 형태들은 하나 이상의 트레이닝된 위험 예측 모델들을 적용함으로써 대상체에 대한 암의 향후 위험을 결정하기 위한 방법들을 포함한다. 이러한 방법들은 도 1b에 기재된 암 예측 시스템(130)에 의해 수행될 수 있다. 도 2a를 추가로 참조하면, 이는 일 실시 형태에 따라 환자 강화와 같은 사용을 위한 대상체에 대한 암의 향후 위험을 결정하기 위한 예시적인 흐름도(200)를 도시한다.
도 2a에 도시된 바와 같이, 대상체(예컨대, 도 1a의 대상체(110))로부터 캡처된 대상체 이미지(210)가 획득된다. 다양한 실시 형태들에서, 대상체 이미지(210)는 대상체의 CT 스캔을 수행함으로써 캡처된 CT 이미지이다. 다양한 실시 형태들에서, 대상체 이미지(210)는 대상체의 X-선 스캔을 수행함으로써 캡처된 X-선 이미지이다. 다양한 실시 형태들에서, 하나 초과의 대상체 이미지(210)가 대상체로부터 캡처된다.
다양한 실시 형태들에서, 특징부 추출 모듈(145)은 대상체의 특징부들(215A)을 추출한다. 다양한 실시 형태들에서, 대상체의 특징부들(215A)은 연령, 성별, 민족, 흡연 이력, 지리적 위치, 오염 노출, 및/또는 폐암의 가족 병력과 같은 대상체에 대응하는 임상 데이터를 포함한다. 다양한 실시 형태들에서, 특징부 추출 모듈(145)(도 1b)은 대상체 이미지(210)로부터 특징부들(215A)을 추출한다. 다양한 실시 형태들에서, 특징부 추출 모듈(145)은 대상체 이미지(210)로부터 특징부들(215A)을 추출하기 위해 이미지 분석 알고리즘을 구현한다. 다양한 실시 형태들에서, 특징부 추출 모듈(145)은 이미지를 분석하고 그로부터 특징부들을 추출하도록 트레이닝된 머신 러닝 모델을 포함하는 이미지 분석 알고리즘을 구현한다. 추출 라디오믹 특징부들에 대한 방법들이 문헌[Radiomics of Lung Nodules: A multi-institutional study of robustness and agreement of quantitative imaging features. Tomography. 2016; 2(4):430-437 and Radiomics: extracting more information from medical images using advanced feature analysis. Eur J Cancer 2012; 48(4):441-446]에 추가로 기재되어 있고, 이들의 각각은 본 명세서에서 참조로서 전체적으로 포함된다.
다양한 실시 형태들에서, 특징부 추출 모듈(145)은 대상체 이미지(210)로부터 적어도 2개의 특징부들을 추출한다. 다양한 실시 형태들에서, 특징부 추출 모듈(145)은 적어도 3개, 적어도 4개, 적어도 5개, 적어도 6개, 적어도 7개, 적어도 8개, 적어도 9개, 또는 적어도 10개의 특징부들을 대상체 이미지(210)로부터 추출한다. 다양한 실시 형태들에서, 특징부 추출 모듈(145)은 적어도 15개, 적어도 20개, 적어도 25개, 적어도 30개, 적어도 35개, 적어도 40개, 또는 적어도 45개의 특징부들을 대상체 이미지(210)로부터 추출한다. 다양한 실시 형태들에서, 특징부 추출 모듈(145)은 적어도 50개의 특징부들을 대상체 이미지(210)로부터 추출한다. 다양한 실시 형태들에서, 특징부 추출 모듈(145)은 적어도 100개의 특징부들, 적어도 150개의 특징부들, 적어도 200개의 특징부들, 적어도 250개의 특징부들, 적어도 300개의 특징부들, 적어도 350개의 특징부들, 적어도 400개의 특징부들, 적어도 450개의 특징부들, 적어도 500개의 특징부들, 적어도 550개의 특징부들, 적어도 600개의 특징부들, 적어도 650개의 특징부들, 적어도 700개의 특징부들, 적어도 750개의 특징부들, 적어도 800개의 특징부들, 적어도 850개의 특징부들, 적어도 900개의 특징부들, 적어도 950개의 특징부들, 또는 적어도 1000개의 특징부들을 대상체 이미지(210)로부터 추출한다. 다양한 실시 형태들에서, 특징부 추출 모듈(145)은 100개의 특징부들 내지 1000개의 특징부들을 추출한다. 다양한 실시 형태들에서, 특징부 추출 모듈(145)은 300개의 특징부들 내지 900개의 특징부들을 추출한다. 다양한 실시 형태들에서, 특징부 추출 모듈(145)은 500개의 특징부들 내지 1000개의 특징부들을 추출한다.
다양한 실시 형태들에서, 특징부 추출 모듈(145)은 결절 특이 특징부들을 포함하는 특징부들(215A)을 추출한다. 결절 특이 특징부들은 폐 결절(예컨대, 대상체 이미지(210)에 존재 또는 부재하는 폐 결절)의 특징부들을 지칭한다. 예시적인 결절 특이 특징부들은 결절 특이 감쇠, 결절 마진 설명, 결절 크기, 결절 형상, 결절 텍스처(예컨대, 매끄러움, 삐죽함 등), 결절 직경, 및 Lung-RADS 점수를 포함한다. 다양한 실시 형태들에서, 결절 특이 특징부들은 PyRadiomics와 같은 이미지 프로세싱 알고리즘을 이용하여 추출되는 라디오믹 특징부들일 수 있다. 예시적인 라디오믹 특징부들은 1차 통계, 3D 형상 기반 특징부들, 2D 형상 기반 특징부들, 그레이 레벨 동시발생 행렬, 그레이 레벨 반복 길이 행렬, 그레이 레벨 크기 영역 행렬, 이웃 그레이 톤 차이 행렬, 및 그레이 레벨 의존성 행렬을 포함할 수 있다. 다양한 실시 형태들에서, 라디오믹 특징부들은 웨이블렛 필터 또는 가우시안 필터와 같은 필터를 적용함으로써 변환된 이미지로부터 추출된다. 따라서, 1차 통계, 3D 형상 기반 특징부들, 2D 형상 기반 특징부들, 그레이 레벨 동시발생 행렬, 그레이 레벨 반복 길이 행렬, 그레이 레벨 크기 영역 행렬, 이웃 그레이 톤 차이 행렬, 및 그레이 레벨 의존성 행렬 중 임의의 것이 웨이블렛 변환 이미지 또는 가우시안 변환 이미지로부터 추출될 수 있다.
특정 실시 형태들에서, 특징부 추출 모듈(145)은 대상체 이미지(210)를 분석하고 추출된 결절-특이 특징부들 중 하나 이상에 기초하여 Lung-RADS 점수를 대상체 이미지(210)에 할당한다. 예를 들어, (예컨대, 라디오믹스 특징부들과 같은) 하나 이상의 추출된 결절 특이 특징부들에 기초하여, 특징부 추출 모듈(145)은 대상체 이미지(210)가 폐 결절을 포함하지 않는다고 결정한다. 이러한 시나리오들에서, 특징부 추출 모듈(145)은 대상체 이미지(210)에 1의 Lung-RADS 점수를 할당할 수 있다. 다른 예로서, 특징부 추출 모듈(145)은 대상체 이미지(210)를 분석하고 추출된 결절-특이 특징부들 중 하나 이상에 기초하여 대상체 이미지(210)가 결절을 포함한다고 결정한다. 이어서, 결절-특이 특징부들에 기초하여, 특징부 추출 모듈(145)은 표 1에 도시된 현재 Lung-RADS 기준 또는 향후 Lung-RADS 기준과 같은 Lung-RADS 기준에 따라 대응하는 Lung-RADS 점수(예컨대, Lung-RADS 2, Lung-RADS 3, Lung-RADS 4A, Lung-RADS 4B, 또는 Lung-RADS 4X)를 할당할 수 있다.
다양한 실시 형태들에서, 특징부 추출 모듈(145)은 비-결절 특이 특징부들을 포함하는 특징부들(215A)을 추출한다. 비-결절 특이 특징부들은 폐 실질 특징부들(예컨대, 폐 실질의 밀도 측정 및 폐 실질의 사이질 변화의 측정) 및 근육조직/흉벽의 신체 조성 측정 중 임의의 것을 지칭한다. 폐 실질의 밀도 측정은, 예를 들어, (i) -950 하운스필드 단위(Hounsfield Units, HU) 미만의 감쇠를 갖는 면적/부피로서 정의되는 낮은 감쇠 영역(LAA), (ii) -600HU 내지 -250 HU의 감쇠를 갖는 폐의 면적/부피로서 정의되는 높은 감쇠 영역(HAA)에 의해 점유된 폐의 백분율, 및 폐 윗부분에서의 LAA와 폐 아랫부분에서의 LAA 사이의 비율을 포함할 수 있다. 폐 실질의 사이질 변화의 측정은 폐 실질의 국부적 히스토그램 측정들, 예를 들어, 정상 조직, 중심소엽 폐기종, 중심소엽 결절, 간유리음영, 벌집모양, 선형 흉터, 결절형, 그물형, 흉막하선, 기타 폐기종 및/또는 낭종에 의해 점유된 폐의 백분율을 포함한다. 근육조직/흉벽의 신체 조성 측정은, 예를 들어, 대흉근 단면적, 소흉근 단면적, 대흉근 제지방 단면적, 소흉근 제지방 단면적, 좌측 또는 우측 대흉근 또는 소흉근의 집합 단면적, 및 피하지방 단면적을 포함할 수 있다.
다양한 실시 형태들에서, 특징부 추출 모듈(145)은 결절 특이 특징부들 및 비-결절 특이 특징부들을 포함하는 특징부들(215A)을 추출한다. 다양한 실시 형태들에서, 특징부 추출 모듈(145)은 비-결절 특이 특징부들만을 포함하는 특징부들(215A)을 추출한다. 특정 실시 형태들에서, 특징부 추출 모듈(145)은 결절 특이 특징부들만을 포함하는 특징부들(215A)을 추출한다. 다양한 실시 형태들에서, 특징부 추출 모듈(145)은 제3자에 의해 결정된 결절 특이 특징부들을 획득한다. 예를 들어, 결절 특이 특징부들은 대상체 이미지(210)를 분석하는 숙련된 전문가(예컨대, 방사선과의사)에 의해 결정되었을 수 있다. 다양한 실시 형태들에서, 특징부 추출 모듈(145)은 제3자에 의해 생성된 보고서로부터 결절 특이 특징부들을 추출한다. 예를 들어, 특징부 추출 모듈(145)은 대상체 이미지(210)를 분석하는 숙련된 전문가(예컨대, 방사선과의사)에 의해 생성된 보고서로부터 결절 특이 특징부들을 추출한다.
후보 대상체 모듈(150)(도 1b)은 대상체 이미지(210)의 특징부들(215A)을 분석함으로써 대상체 분석(220)(도 2a에 도시됨)을 수행한다. 분석에 기초하여, 후보 대상체 모듈(150)은 대상체가 추가 위험 예측을 받을 후보 대상체인지 결정한다. 달리 말하면, 대상체 분석(220)은 암의 향후 위험 예측에 자격이 있는 후보 대상체들을 식별하기 위한 스크리닝 프로세스이다. 예를 들어, 성행하는 폐암을 갖지 않는 것으로 결정된 폐암 스크리닝을 거친 대상체들은 향후 발생 폐암을 발전시킬 위험에 대해 후속적으로 평가된다.
일 예로서, 후보 대상체 모듈(150)은 대상체의 임상 데이터와 같은 대상체의 특징부들(215A)이 하나 이상의 기준을 충족하는 경우 대상체가 추가 위험 예측을 받을 후보 대상체라고 결정한다. 예를 들어, 대상체의 특징부들(215A)이 대상체가 임계량을 초과하여 흡연한다고 나타내는 경우, 대상체는 추가 위험 예측을 받을 후보 대상체로 간주된다. 다른 예로서, 후보 대상체 모듈(150)은 대상체가 저위험 암 환자(예컨대, 현재 폐암을 갖고 있지 않고/않거나 현재 암을 나타내는 폐 결절을 갖고 있지 않은 환자)인 경우 대상체가 추가 위험 예측을 받을 후보 대상체라고 결정한다. 다양한 실시 형태들에서, 후보 대상체 모듈(150)은 대상체가 고위험 암 환자(예컨대, 현재 폐암이 있는 환자 및/또는 진행중인 폐암의 고위험을 나타내는 폐 결절이 있는 환자)인 경우 대상체가 추가 위험 예측을 받을 비-후보 대상체라고 결정한다. 도 2a에 도시된 바와 같이, 대상체 분석(220)이 대상체는 후보 대상체라고 결정하는 경우, 대상체 이미지(210)는 후속 추가 위험 예측 분석을 위한 후보 대상체 이미지(225)(점선으로 도시됨)로 취해진다. 대안적으로, 대상체 분석(220)이 대상체는 비-후보 대상체라고 결정하는 경우, 환자는 추가적으로 추가 위험 예측 분석을 받지 않는다. 예를 들어, 비-후보 대상체들(218)에 대한 중재시술이 대상체에 제공될 수 있다. 예를 들어, 비-후보 대상체는 이미 폐암이 있거나 또는 대상체가 진행된 폐암을 갖고 있음을 나타내는 폐 결절이 있는 대상체일 수 있다. 따라서, 비-후보 대상체는 암의 향후 위험 예측을 받을 필요가 있고 대신에, 비-후보 대상체들(218)에 대한 중재시술이 제공될 수 있는데, 이는 암 생검 및/또는 비-후보 대상체의 폐암을 치료하기 위한 치료제(예컨대, 화학요법, 방사선)의 투여를 포함할 수 있다.
다양한 실시 형태들에서, 후보 대상체 모듈(150)은 결절 특이 특징부들을 포함하는 특징부들(215A)에 기초하여 대상체가 후보 대상체라고 결정한다. 예를 들어, 결절-특이 특징부들은 Lung-RADS 점수, 예컨대, Lung-RADS 0, Lung-RADS 1, Lung-RADS 2, Lung-RADS 3, Lung-RADS 4A, Lung-RADS 4B, 또는 Lung-RADS 4X를 포함할 수 있다. Lung-RADS 점수 분류들 및 폐 결절들의 대응하는 특징들의 요약이 표 1에 기재되어 있다. 다양한 실시 형태들에서, 후보 대상체 모듈(150)은 특징부들(215A), 예컨대, 결절 특이 특징부들에 기초하여 대상체에 대한 Lung-RADS 점수를 결정한다. 예를 들어, 결절 특이 특징부들은 결절 특이 감쇠, 결절 마진 설명, 결절 크기, 결절 형상, 결절 텍스처(예컨대, 매끄러움, 삐죽함 등), 결절 직경, Lung-RADS 점수, 및/또는 라디오믹 특징부들, 예컨대, 1차 통계, 3D 형상 기반 특징부들, 2D 형상 기반 특징부들, 그레이 레벨 동시발생 행렬, 그레이 레벨 반복 길이 행렬, 그레이 레벨 크기 영역 행렬, 이웃 그레이 톤 차이 행렬, 및 그레이 레벨 의존성 행렬 중 하나 이상을 포함할 수 있다. 따라서, 결절 감쇠 특징부가 폐 결절이 고형 결절임을 나타내고 결절 마진 및/또는 결절 직경 특징부들이 폐 결절이 5 mm임을 나타내는 경우, 후보 대상체 모듈(150)은 표 1에 명시된 기준에 기초하여 2의 Lung-RADS 점수를 할당할 수 있다.
다양한 실시 형태들에서, 후보 대상체 모듈(150)은 대상체가 0의 Lung-RADS 점수가 할당되는 경우 대상체가 후보 대상체라고 결정한다. 다양한 실시 형태들에서, 후보 대상체 모듈(150)은 대상체가 1의 Lung-RADS 점수가 할당되는 경우 대상체가 후보 대상체라고 결정한다. 다양한 실시 형태들에서, 후보 대상체 모듈(150)은 대상체가 2의 Lung-RADS 점수가 할당되는 경우 대상체가 후보 대상체라고 결정한다. 다양한 실시 형태들에서, 후보 대상체 모듈(150)은 대상체가 3의 Lung-RADS 점수가 할당되는 경우 대상체가 후보 대상체라고 결정한다. 다양한 실시 형태들에서, 후보 대상체 모듈(150)은 대상체가 4A의 Lung-RADS 점수가 할당되는 경우 대상체가 후보 대상체라고 결정한다. 다양한 실시 형태들에서, 후보 대상체 모듈(150)은 대상체가 0 또는 1의 Lung-RADS 점수가 할당되는 경우 대상체가 후보 대상체라고 결정한다. 다양한 실시 형태들에서, 후보 대상체 모듈(150)은 대상체가 0, 1, 또는 2의 Lung-RADS 점수가 할당되는 경우 대상체가 후보 대상체라고 결정한다. 다양한 실시 형태들에서, 후보 대상체 모듈(150)은 대상체가 0, 1, 2, 또는 3의 Lung-RADS 점수가 할당되는 경우 대상체가 후보 대상체라고 결정한다. 다양한 실시 형태들에서, 후보 대상체 모듈(150)은 대상체가 1, 2, 또는 3의 Lung-RADS 점수가 할당되는 경우 대상체가 후보 대상체라고 결정한다.
다양한 실시 형태들에서, 후보 대상체 모듈(150)은 대상체가 3의 Lung-RADS 점수가 할당되는 경우 대상체가 비-후보 대상체라고 결정한다. 다양한 실시 형태들에서, 후보 대상체 모듈(150)은 대상체가 4A의 Lung-RADS 점수가 할당되는 경우 대상체가 비-후보 대상체라고 결정한다. 다양한 실시 형태들에서, 후보 대상체 모듈(150)은 대상체가 4B의 Lung-RADS 점수가 할당되는 경우 대상체가 비-후보 대상체라고 결정한다. 다양한 실시 형태들에서, 후보 대상체 모듈(150)은 대상체가 4A 또는 4B의 Lung-RADS 점수가 할당되는 경우 대상체가 비-후보 대상체라고 결정한다. 다양한 실시 형태들에서, 후보 대상체 모듈(150)은 대상체가 3, 4A, 또는 4B의 Lung-RADS 점수가 할당되는 경우 대상체가 비-후보 대상체라고 결정한다.
다양한 실시 형태들에서, 결절 특이 특징부들이 대상체에는 폐 결절을 갖고 있지 않다고 나타내는 경우 후보 대상체 모듈(150)은 대상체가 후보 대상체라고 결정한다. 예를 들어, 결절 특이 특징부들은 결절 감쇠, 결절 마진 설명, 또는 결절 직경 중 하나 이상을 포함할 수 있다. 따라서, 결절 특이 특징부들 대상체 이미지(210)가 결절을 포함하지 않음을 나타내는 경우(예컨대, 감쇠 부족, 마진 부족, 또는 거의 0 또는 0의 직경), 후보 대상체 모듈(150)은 대상체가 후보 대상체라고 결정한다.
다양한 실시 형태들에서, 대상체에 폐 결절이 있는 경우에도 후보 대상체 모듈(150)은 대상체가 후보 대상체라고 결정한다. 예를 들어, 결절 특이 특징부들이 대상체가 폐 결절을 갖고 있음을 나타내는 경우, 후보 대상체 모듈(150)은 결절 특이 특징부들을 추가로 분석하여 결절을 더 높은 위험 결절 또는 더 낮은 위험 결절로 분류할 수 있다. 다양한 실시 형태들에서, 후보 대상체 모듈(150)은 결절이 고형 결절인지, 반-고형 결절인지, 아니면 비-고형 결절인지에 기초하여 결절을 분류할 수 있다. 예를 들어, 후보 대상체 모듈(150)은 결절이 고형 결절 또는 반-고형 결절인 경우 더 높은 위험 결절로 분류할 수 있고 결절이 비-고형 결절인 경우 더 낮은 위험 결절로 분류할 수 있다. 다양한 실시 형태들에서, 후보 대상체 모듈(150)은 대상체가 더 낮은 위험 결절을 갖는 경우 대상체가 후보 대상체라고 결정한다. 후보 대상체 모듈(150)은 대상체가 더 높은 위험 결절을 갖는 경우 대상체가 비-후보 대상체라고 결정할 수 있다.
도 2a를 참조하면, 대상체 분석(220) 후에, 후보 대상체로부터의 대상체 이미지(210)는 이제 후보 대상체 이미지(225)로 간주된다. 특징부 추출 모듈(145)은 후보 대상체 이미지(225)로부터 특징부들(215B)을 추출한다. 다양한 실시 형태들에서, 특징부 추출 모듈(145)은 결절 특이 특징부들 및 비-결절 특이 특징부들 중 하나 또는 둘 모두를 포함하는 특징부들(215B)을 후보 대상체 이미지(225)로부터 추출한다. 다양한 실시 형태들에서, 특징부 추출 모듈(145)은 비-결절 특이 특징부들만을 포함하는 특징부들(215A)을 추출한다. 다양한 실시 형태들에서, 특징부 추출 모듈(145)은 결절 특이 특징부들만을 포함하는 특징부들(215A)을 추출한다. 다양한 실시 형태들에서, 특징부 추출 모듈(145)은 제3자에 의해 결정된 후보 대상체 이미지(225)의 결절 특이 특징부들을 획득한다. 예를 들어, 결절 특이 특징부들은 후보 대상체 이미지(225)를 분석하는 숙련된 전문가(예컨대, 방사선과의사)에 의해 결정되었을 수 있다. 다양한 실시 형태들에서, 특징부 추출 모듈(145)은 제3자에 의해 생성된 보고서로부터 결절 특이 특징부들을 추출한다. 예를 들어, 특징부 추출 모듈(145)은 대상체 이미지(225)를 분석하는 숙련된 전문가(예컨대, 방사선과의사)에 의해 생성된 보고서로부터 결절 특이 특징부들을 추출한다.
다양한 실시 형태들에서, 특징부들(215B) 중 하나 이상은 특징부들(215A) 중 하나 이상과 동일하다. 따라서, 동일한 특징부들은 다시 추출될 필요가 없고 재사용될 수 있다. 예를 들어, 특징부들(215A)로서 대상체 이미지(210)로부터 이전에 추출된 결절 특이 특징부들은 특징부들(215B)에 포함된 결절 특이 특징부들과 동일할 수 있다. 다양한 실시 형태들에서, 모든 특징부들(215B)이 이전에 대상체 이미지(210)로부터 추출되었고 따라서, 이전에 추출된 특징부들은 여기서 특징부들(215B)로서 재사용될 수 있다. 예를 들어, 특징부 추출 모듈(145)은 대상체 분석(220) 전에 특징부들(215A) 및 특징부들(215B)을 추출할 수 있다. 따라서, 특징부들(215B)은 추가로 후보 대상체 이미지(225)로부터 추출될 필요가 없고 여기서 재사용될 수 있다.
다양한 실시 형태들에서, 특징부들(215B)은 특징부들(215A)에 포함되지 않은 추가 특징부들을 포함한다. 예를 들어, 특징부들(215B)은 특징부들(215A)에 이전에 포함되지 않은 비-결절 특이 특징부들을 포함한다. 따라서, 특징부 추출 모듈(145)은 이전에 특징부들(215A)에 포함되지 않은 이러한 추가 특징부들을 추출한다.
다양한 실시 형태들에서, 특징부 추출 모듈(145)은 후보 대상체 이미지(225)로부터 적어도 2개의 특징부들을 추출한다. 다양한 실시 형태들에서, 특징부 추출 모듈(145)은 적어도 3개, 적어도 4개, 적어도 5개, 적어도 6개, 적어도 7개, 적어도 8개, 적어도 9개, 또는 적어도 10개의 특징부들을 후보 대상체 이미지(225)로부터 추출한다. 다양한 실시 형태들에서, 특징부 추출 모듈(145)은 적어도 15개, 적어도 20개, 적어도 25개, 적어도 30개, 적어도 35개, 적어도 40개, 또는 적어도 45개의 특징부들을 후보 대상체 이미지(225)로부터 추출한다. 다양한 실시 형태들에서, 특징부 추출 모듈(145)은 후보 대상체 이미지(225)로부터 적어도 50개의 특징부들을 추출한다. 다양한 실시 형태들에서, 특징부 추출 모듈(145)은 적어도 100개의 특징부들, 적어도 150개의 특징부들, 적어도 200개의 특징부들, 적어도 250개의 특징부들, 적어도 300개의 특징부들, 적어도 350개의 특징부들, 적어도 400개의 특징부들, 적어도 450개의 특징부들, 적어도 500개의 특징부들, 적어도 550개의 특징부들, 적어도 600개의 특징부들, 적어도 650개의 특징부들, 적어도 700개의 특징부들, 적어도 750개의 특징부들, 적어도 800개의 특징부들, 적어도 850개의 특징부들, 적어도 900개의 특징부들, 적어도 950개의 특징부들, 또는 적어도 1000개의 특징부들을 후보 대상체 이미지(225)로부터 추출한다. 다양한 실시 형태들에서, 특징부 추출 모듈(145)은 100개의 특징부들 내지 1000개의 특징부들을 후보 대상체 이미지(225)로부터 추출한다. 다양한 실시 형태들에서, 특징부 추출 모듈(145)은 300개의 특징부들 내지 900개의 특징부들을 후보 대상체 이미지(225)로부터 추출한다. 다양한 실시 형태들에서, 특징부 추출 모듈(145)은 500개의 특징부들 내지 1000개의 특징부들을 후보 대상체 이미지(225)로부터 추출한다.
위험 전개 모듈(160)(도 1b)은 추출된 특징부들(215B)을 트레이닝된 위험 예측 모델들(230)(도 2a에 도시됨)에 제공하여 위험 예측(240)을 생성한다. 다양한 실시 형태들에서, 도 2a에 도시된 바와 같이, 위험 전개 모듈(160)은 추출된 특징부들(215)을 다수의 트레이닝된 위험 예측 모델들(230)에 제공하여 다수의 위험 예측들(240)을 생성한다. 다양한 실시 형태들에서, 위험 예측 모델은 일정 기간 내의 암의 향후 위험 예측(예컨대, 1년 내, 3년 내, 또는 5년 내의 암의 향후 위험)을 생성하도록 트레이닝된다. 따라서, 다수의 기간들에 대한 예측을 생성하기 위해, 위험 전개 모듈(160)은 상이한 위험 예측 모델들을 선택 및 전개하여 추출된 특징부들(215B)을 분석한다. 예를 들어, 위험 전개 모듈(160)은 제1 기간 내의 암의 향후 위험을 예측하도록 트레이닝된 제1 위험 예측 모델을 전개할 수 있고, 제2 기간 내의 암의 향후 위험을 예측하도록 트레이닝된 제2 위험 예측 모델을 추가로 전개할 수 있다.
다양한 실시 형태들에서, 위험 전개 모듈(160)은 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 또는 20개의 상이한 위험 예측 모델들을 전개하여 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 또는 20의 상이한 기간들에 걸친 암의 향후 위험을 각각 생성한다. 다양한 실시 형태들에서, 위험 전개 모듈(160)은 5개의 상이한 위험 예측 모델들을 전개하여 5개의 상이한 기간들에 걸친 암의 향후 위험을 생성한다. 다양한 실시 형태들에서, 위험 전개 모듈(160)은 3개의 상이한 위험 예측 모델들을 전개하여 3개의 상이한 기간들에 걸친 암의 향후 위험을 생성한다. 예를 들어, 위험 전개 모듈(160)은 1년 위험 예측 모델, 3년 위험 예측 모델, 및 5년 위험 예측 모델을 전개하여 1년, 3년, 및 5년 내의 암의 향후 위험의 예측들을 각각 생성한다.
다양한 실시 형태들에서, 특징부들(215B)을 분석하도록 전개되는 하나 이상의 위험 예측 모델들(230)의 각각은 이전에 상이한 영역들(예컨대, 상이한 폐 영역들)로 분리된 트레이닝 이미지들에 대해 트레이닝되었다. 예를 들어, 제1 위험 예측 모델(230)은 폐의 제1 영역 내의 암의 존재를 예측하도록 트레이닝될 수 있고, 제2 위험 예측 모델(230)은 폐의 제2 영역 내의 암의 존재를 예측하도록 트레이닝될 수 있고, 제3 위험 예측 모델(230)은 폐의 제3 영역 내의 암의 존재를 예측하도록 트레이닝될 수 있다. 예를 들어, 상이한 폐 영역들은 부피에 따라 3등분한 폐의 위, 중간, 아래 또는 개별적인 폐엽들을 포함할 수 있다. 따라서, 대상체에 대해 생성된 위험 예측들(240)은 특정 영역들(예컨대, 폐 영역들) 내의 암의 향후 위험일 수 있다.
다양한 실시 형태들에서, 특징부들(215B)을 분석하기 위해 전개되는 하나 이상의 위험 예측 모델들(230)의 각각은 이전에 대상체 분석(220)의 결과로서 결정되었던 후보 대상체들의 코호트에 정렬된 트레이닝 개인들의 코호트를 이용하여 트레이닝되었다. 달리 말하면, 위험 예측 모델들(230)은 이전에 대상체 분석(220)을 받는 경우 후보 대상체들로서 자격을 얻는 트레이닝 개인들을 이용하여 트레이닝되었다.
다양한 실시 형태들에서, 위험 예측 모델들(230)을 트레이닝하는 데 사용되는 트레이닝 개인들 중 하나 이상은 후보 대상체와 적어도 하나의 특징부를 공유한다. 예를 들어, 후보 대상체가 Lung-RADS 1로 분류되는 경우, 위험 예측 모델들(230)을 트레이닝하는 데 사용되는 트레이닝 개인들 중 하나 이상은 또한 Lung-RADS 1로 분류되었다. 다양한 실시 형태들에서, 위험 예측 모델들(230)은 Lung-RADS 1(Lung-RADS 1 위험 예측 모델로 지칭됨)로 분류된 트레이닝 개인들로부터 캡처된 트레이닝 이미지들을 이용하여 트레이닝될 수 있다. 다양한 실시 형태들에서, 위험 예측 모델들(230)은 Lung-RADS 1 또는 Lung-RADS 2(Lung-RADS 1-2 위험 예측 모델로 지칭됨)로 분류된 트레이닝 개인들로부터 캡처된 트레이닝 이미지들을 이용하여 트레이닝될 수 있다. 다양한 실시 형태들에서, 위험 예측 모델들(230)은 Lung-RADS 1, Lung-RADS 2, 또는 Lung-RADS 3(Lung-RADS 1-3 위험 예측 모델로 지칭됨)로 분류된 트레이닝 개인들로부터 캡처된 트레이닝 이미지들을 이용하여 트레이닝될 수 있다. 다양한 실시 형태들에서, 위험 예측 모델들(230)은 Lung-RADS 1, Lung-RADS 2, Lung-RADS 3, 또는 Lung-RADS 4A(Lung-RADS 1-4A 위험 예측 모델로 지칭됨)로 분류된 트레이닝 개인들로부터 캡처된 트레이닝 이미지들을 이용하여 트레이닝될 수 있다. 다양한 실시 형태들에서, 위험 예측 모델들(230)은 Lung-RADS 1, Lung-RADS 2, Lung-RADS 3, Lung-RADS 4A, 또는 Lung-RADS 4B(Lung-RADS 1-4B 위험 예측 모델로 지칭됨)로 분류된 트레이닝 개인들로부터 캡처된 트레이닝 이미지들을 이용하여 트레이닝될 수 있다. 다양한 실시 형태들에서, 위험 예측 모델들(230)은 Lung-RADS 1, Lung-RADS 2, Lung-RADS 3, Lung-RADS 4A, Lung-RADS 4B, 또는 Lung-RADS 4X(Lung-RADS 1-4X 위험 예측 모델로 지칭됨)로 분류된 트레이닝 개인들로부터 캡처된 트레이닝 이미지들을 이용하여 트레이닝될 수 있다.
후보 대상체가 Lung-RADS 1로서 분류(예컨대, 대상체 분석(220)을 통해 분류 또는 이전에 제3자에 의해 분류)되는 시나리오에서, 위험 전개 모듈(160)은 또한 이전에 Lung-RADS 1로 분류된 적어도 하나의 트레이닝 개인으로부터 캡처된 트레이닝 이미지들을 이용하여 트레이닝된 하나 이상의 위험 예측 모델들(230)을 전개한다. 따라서, 위험 전개 모듈(160)은 각각이 Lung-RADS 1 예측 모델, Lung-RADS 1-2 예측 모델, Lung-RADS 1-3 예측 모델, Lung-RADS 1-4A 예측 모델, Lung-RADS 1-4B 예측 모델, 또는 Lung-RADS 1-4X 예측 모델 중 임의의 것인 하나 이상의 위험 예측 모델들(230)을 전개할 수 있다. 특정 실시 형태들에서, 위험 전개 모듈(160)은 Lung-RADS 1 후보 대상체에 대해 Lung-RADS 1 예측 모델을 전개한다. 특정 실시 형태들에서, 위험 전개 모듈(160)은 Lung-RADS 1 후보 대상체에 대해 Lung-RADS 1-2 예측 모델을 전개한다. 특정 실시 형태들에서, 위험 전개 모듈(160)은 Lung-RADS 1 후보 대상체에 대해 Lung-RADS 1-3 예측 모델을 전개한다.
후보 대상체가 Lung-RADS 2로서 분류(예컨대, 대상체 분석(220)을 통해 분류 또는 이전에 제3자에 의해 분류)되는 시나리오에서, 위험 전개 모듈(160)은 또한 이전에 Lung-RADS 2로 분류된 적어도 하나의 트레이닝 개인으로부터 캡처된 트레이닝 이미지들을 이용하여 트레이닝된 하나 이상의 위험 예측 모델들(230)을 전개한다. 따라서, 위험 전개 모듈(160)은 각각이 Lung-RADS 1-2 예측 모델, Lung-RADS 1-3 예측 모델, Lung-RADS 1-4A 예측 모델, Lung-RADS 1-4B 예측 모델, 또는 Lung-RADS 1-4X 예측 모델 중 임의의 것인 하나 이상의 위험 예측 모델들(230)을 전개할 수 있다. 특정 실시 형태들에서, 위험 전개 모듈(160)은 Lung-RADS 2 후보 대상체에 대해 Lung-RADS 1-2 예측 모델을 전개한다. 특정 실시 형태들에서, 위험 전개 모듈(160)은 Lung-RADS 2 후보 대상체에 대해 Lung-RADS 1-3 예측 모델을 전개한다.
후보 대상체가 Lung-RADS 3으로서 분류(예컨대, 대상체 분석(220)을 통해 분류 또는 이전에 제3자에 의해 분류)되는 시나리오에서, 위험 전개 모듈(160)은 또한 이전에 Lung-RADS 3으로 분류된 적어도 하나의 트레이닝 개인으로부터 캡처된 트레이닝 이미지들을 이용하여 트레이닝된 하나 이상의 위험 예측 모델들(230)을 전개한다. 따라서, 위험 전개 모듈(160)은 각각이 Lung-RADS 1-3 예측 모델, Lung-RADS 1-4A 예측 모델, Lung-RADS 1-4B 예측 모델, 또는 Lung-RADS 1-4X 예측 모델 중 임의의 것인 하나 이상의 위험 예측 모델들(230)을 전개할 수 있다.
후보 대상체가 Lung-RADS 4A로서 분류(예컨대, 대상체 분석(220)을 통해 분류 또는 이전에 제3자에 의해 분류)되는 시나리오에서, 위험 전개 모듈(160)은 또한 이전에 Lung-RADS 4A로 분류된 적어도 하나의 트레이닝 개인으로부터 캡처된 트레이닝 이미지들을 이용하여 트레이닝된 하나 이상의 위험 예측 모델들(230)을 전개한다. 따라서, 위험 전개 모듈(160)은 각각이 Lung-RADS 1-4A 예측 모델, Lung-RADS 1-4B 예측 모델, 또는 Lung-RADS 1-4X 예측 모델 중 임의의 것인 하나 이상의 위험 예측 모델들(230)을 전개할 수 있다.
후보 대상체가 Lung-RADS 4B로서 분류(예컨대, 대상체 분석(220)을 통해 분류 또는 이전에 제3자에 의해 분류)되는 시나리오에서, 위험 전개 모듈(160)은 또한 이전에 Lung-RADS 4B로 분류된 적어도 하나의 트레이닝 개인으로부터 캡처된 트레이닝 이미지들을 이용하여 트레이닝된 하나 이상의 위험 예측 모델들(230)을 전개한다. 따라서, 위험 전개 모듈(160)은 각각이 Lung-RADS 1-4B 예측 모델, 또는 Lung-RADS 1-4X 예측 모델 중 임의의 것인 하나 이상의 위험 예측 모델들(230)을 전개할 수 있다.
후보 대상체가 Lung-RADS 4X로서 분류(예컨대, 대상체 분석(220)을 통해 분류 또는 이전에 제3자에 의해 분류)되는 시나리오에서, 위험 전개 모듈(160)은 또한 이전에 Lung-RADS 4X로 분류된 적어도 하나의 트레이닝 개인으로부터 캡처된 트레이닝 이미지들을 이용하여 트레이닝된 하나 이상의 위험 예측 모델들(230)을 전개한다. 따라서, 위험 전개 모듈(160)은 각각이 Lung-RADS 1-4X 예측 모델인 하나 이상의 위험 예측 모델들(230)을 전개할 수 있다.
다양한 실시 형태들에서, 위험 예측 모델들은 1) 대상체 분석(220)의 결과로서 결정된 후보 대상체들의 코호트에 정렬된 트레이닝 개인들의 코호트를 이용하여 트레이닝되고 2) 일정 기간 내의 암의 향후 위험 예측(예컨대, 1년 내, 3년 내, 또는 5년 내의 암의 향후 위험)을 생성하도록 트레이닝된다. 예를 들어, 후보 대상체에 대한 위험 예측들(240)을 생성하기 위해, 위험 전개 모듈(160)은 1) 적어도 하나의 특징부를 후보 대상체와 공유하는 하나 이상의 트레이닝 개인들을 이용하여 트레이닝되고 2) 상이한 기간들 내의 암의 향후 위험을 예측하도록 트레이닝되는 하나 이상의 위험 예측 모델들(230)을 적용한다.
후보 대상체가 Lung-RADS "Z"로서 분류(예컨대, 대상체 분석(220)을 통해 분류 또는 이전에 제3자에 의해 분류)되는 시나리오에서, 위험 전개 모듈(160)은 1) 또한 이전에 Lung-RADS "Z"로서 분류된 적어도 하나의 트레이닝 개인으로부터 캡처된 트레이닝 이미지들을 이용하여 트레이닝되고 2) 상이한 기간들 내의 암의 향후 위험을 예측하는 하나 이상의 위험 예측 모델들(230)을 전개한다. 본 명세서에 사용된 바와 같이, 이러한 위험 예측 모델들은 "M년, Lung-RADS X-Y 예측 모델"로 지칭되며, 여기서 "M"은 기간을 지칭하고 "X-Y"는 트레이닝 개인들의 Lung-RADS 점수들의 범위를 지칭한다. 예를 들어, 1년, Lung-RADS 1-3 예측 모델은 이전에 Lung-RADS 1-3으로 분류된 트레이닝 개인들을 이용하여 트레이닝되고, 1년 내의 암의 향후 위험을 예측하도록 트레이닝된 위험 예측 모델을 지칭한다.
다양한 실시 형태들에서, Lung-RADS 1로 분류된 후보 대상체의 경우, 위험 전개 모듈(160)은 하나 이상의 M년, Lung-RADS X-Y 예측 모델들을 전개하고, "M"은 가변적이지만, "X" 및 "Y"는 고정된다. 예를 들어, Lung-RADS 1로 분류된 후보 대상체의 경우, "M"의 범위는 1 내지 5년일 수 있지만, X = 1 이고 Y = 1에서 4B 중 임의의 값이다. 일 예로서, Y = 3이고 따라서, 위험 전개 모듈(160)은 1년, Lung-RADS 1-3 예측 모델, 2년, Lung-RADS 1-3 예측 모델, 3년, Lung-RADS 1-3 예측 모델, 4년, Lung-RADS 1-3 예측 모델, 및 5년, Lung-RADS 1-3 예측 모델을 전개할 수 있다. 다른 실시 형태들에서, 위험 전개 모듈(160)은 본 명세서에 기재된 추가 위험 예측 모델들을 전개할 수 있다(예컨대, M의 범위는 1 내지 10년, 1 내지 15년, 또는 1 내지 20년 예컨대, X 및 Y는 상이하게 선택되어 상이한 범위의 Lung-RADS 점수들을 제공함).
후보 대상체가 Lung-RADS 1로 분류된 특정 실시 형태들에서, 위험 전개 모듈(160)은 1) 1년 내의 암의 향후 위험을 예측하는 제1 위험 예측 모델(230)(예컨대, 1년, Lung-RADS 1-3 예측 모델), 2) 3년 내의 암의 미래를 예측하는 제2 위험 예측 모델(230)(예컨대, 3년, Lung-RADS 1-3 예측 모델), 및 3) 5년 내의 암의 미래를 예측하는 제3 위험 예측 모델(230)(예컨대, 5년, Lung-RADS 1-3 예측 모델)을 전개한다.
후보 대상체가 Lung-RADS 2로 분류된 특정 실시 형태들에서, 위험 전개 모듈(160)은 1) 1년 내의 암의 향후 위험을 예측하는 제1 위험 예측 모델(230)(예컨대, 1년, Lung-RADS 1-3 예측 모델), 2) 3년 내의 암의 미래를 예측하는 제2 위험 예측 모델(230)(예컨대, 3년, Lung-RADS 1-3 예측 모델), 및 3) 5년 내의 암의 미래를 예측하는 제3 위험 예측 모델(230)(예컨대, 5년, Lung-RADS 1-3 예측 모델)을 전개한다.
후보 대상체가 Lung-RADS 3으로 분류된 특정 실시 형태들에서, 위험 전개 모듈(160)은 1) 1년 내의 암의 향후 위험을 예측하는 제1 위험 예측 모델(230)(예컨대, 1년, Lung-RADS 1-3 예측 모델), 2) 3년 내의 암의 미래를 예측하는 제2 위험 예측 모델(230)(예컨대, 3년, Lung-RADS 1-3 예측 모델), 및 3) 5년 내의 암의 미래를 예측하는 제3 위험 예측 모델(230)(예컨대, 5년, Lung-RADS 1-3 예측 모델)을 전개한다.
후보 대상체가 Lung-RADS 4A로 분류된 특정 실시 형태들에서, 위험 전개 모듈(160)은 1) 1년 내의 암의 향후 위험을 예측하는 제1 위험 예측 모델(230)(예컨대, 1년, Lung-RADS 1-4A 예측 모델), 2) 3년 내의 암의 미래를 예측하는 제2 위험 예측 모델(230)(예컨대, 3년, Lung-RADS 1-4A 예측 모델), 및 3) 5년 내의 암의 미래를 예측하는 제3 위험 예측 모델(230)(예컨대, 5년, Lung-RADS 1-4A 예측 모델)을 전개한다.
후보 대상체가 Lung-RADS 4B로 분류된 특정 실시 형태들에서, 위험 전개 모듈(160)은 1) 1년 내의 암의 향후 위험을 예측하는 제1 위험 예측 모델(230)(예컨대, 1년, Lung-RADS 1-4B 예측 모델), 2) 3년 내의 암의 미래를 예측하는 제2 위험 예측 모델(230)(예컨대, 3년, Lung-RADS 1-4B 예측 모델), 및 3) 5년 내의 암의 미래를 예측하는 제3 위험 예측 모델(230)(예컨대, 5년, Lung-RADS 1-4B 예측 모델)을 전개한다.
후보 대상체가 Lung-RADS 4X로 분류된 특정 실시 형태들에서, 위험 전개 모듈(160)은 1) 1년 내의 암의 향후 위험을 예측하는 제1 위험 예측 모델(230)(예컨대, 1년, Lung-RADS 1-4X 예측 모델), 2) 3년 내의 암의 미래를 예측하는 제2 위험 예측 모델(230)(예컨대, 3년, Lung-RADS 1-4X 예측 모델), 및 3) 5년 내의 암의 미래를 예측하는 제3 위험 예측 모델(230)(예컨대, 5년, Lung-RADS 1-4X 예측 모델)을 전개한다.
도 2a에 도시된 바와 같이, 위험 예측들(240)은 환자 강화(250)에 사용될 수 있다. 예를 들어, 대상체는 임상 연구에 등록될 하나 이상의 환자 코호트들에 포함될 수 있다. 환자 강화를 위한 방법들이 아래 더 상세하게 기재된다.
이제 도 2b를 참조하면, 이는 제2 실시 형태에 따라 환자 강화와 같은 사용을 위한 대상체에 대한 암의 향후 위험을 결정하기 위한 예시적인 흐름도를 도시한다. 여기서, 도 2b는 대상체 분석 단계(예컨대, 도 2a에 도시된 단계(220))를 포함하지 않는다는 점에서 도 2b는 도 2a와 상이하다. 따라서, 도 2b는 대상체들이 스크리닝을 받지 않는 실시예를 도시한다. 대신에, 모든 대상체들은 후속적으로 추가 위험 예측을 받는 후보 대상체들이다. 다양한 실시 형태들에서, 대상체들은 폐 결절을 갖거나 갖지 않는다. 다양한 실시 형태들에서, 대상체들은 이전에 Lung-RADS 1, Lung-RADS 2, Lung-RADS 3, Lung-RADS 4A, Lung-RADS 4B, 또는 Lung-RADS 4X 중 어느 하나로 분류될 수 있다. 따라서, 이러한 실시 형태들에서, 모든 대상체들은, 그들의 폐 결절 병기 및/또는 Lung-RADS 점수에 상관없이, 추가 위험 예측을 받는다.
도 2b에 도시된 바와 같이, 후보 대상체 이미지(255)는 특징부 추출을 거쳐 특징부들(260)을 획득한다. 다양한 실시 형태들에서, 특징부들(260)은 후보 대상체 이미지(225)의 결절 특이 특징부들 및 비-결절 특이 특징부들 중 하나 또는 둘 모두를 포함한다. 다양한 실시 형태들에서, 특징부들(260)은 비-결절 특이 특징부들만을 포함한다. 다양한 실시 형태들에서, 특징부들(260)은 결절 특이 특징부들만을 포함한다. 다양한 실시 형태들에서, 특징부 추출 모듈(140)은 이미지 분석 알고리즘, 예컨대, 트레이닝된 머신 러닝 모델을 구현하는 것을 포함하는 이미지 분석 알고리즘을 구현함으로써 결절 특이 특징부들을 추출한다. 다양한 실시 형태들에서, 특징부 추출 모듈(140)은 PyRadiomics를 구현함으로써 결절 특이 특징부들을 추출한다. PyRadiomics는 문헌["Computational radiomics system to decode the radiographic phenotype." Cancer Research; 77(21):e104-e107]에 더 상세하게 기재되어 있고, 이는 본 명세서에 참조로서 전체적으로 포함된다.
다양한 실시 형태들에서, 후보 대상체 이미지(255)의 결절 특이 특징부들은 제3자에 의해 결정된다. 예를 들어, 결절 특이 특징부들은 후보 대상체 이미지(255)를 분석하는 숙련된 전문가(예컨대, 방사선과의사)에 의해 결정되었을 수 있다. 다양한 실시 형태들에서, 특징부 추출 모듈(145)은 제3자에 의해 생성된 보고서로부터 결절 특이 특징부들을 추출한다. 예를 들어, 특징부 추출 모듈(145)은 대상체 이미지(225)를 분석하는 숙련된 전문가(예컨대, 방사선과의사)에 의해 생성된 보고서로부터 결절 특이 특징부들을 추출한다.
위험 전개 모듈(260)은 하나 이상의 위험 예측 모델들(265)을 적용하여 특징부들(260)을 분석하여 위험 예측(270)을 생성한다. 따라서, 위험 예측(270)은 환자 강화(275)에 사용될 수 있다. 다양한 실시 형태들에서, 도 2b에 도시된 바와 같이 위험 예측(270)을 생성할 위험 예측 모델들(265)의 전개는 도 2a에 도시된 바와 같이 위험 예측들(240)을 생성하도록 위험 예측 모델들(230)을 전개하는 것과 동일한 프로세스이다.
여기서, 하나 이상의 위험 예측 모델들(265)은 가능한 대상체들의 전체 범위에 걸쳐 있는 트레이닝 개인들로부터 획득된 트레이닝 이미지들에 대해 트레이닝된다. 예를 들어, 위험 예측 모델들(265)은 폐 결절을 갖거나 또는 폐 결절을 갖지 않은 트레이닝 개인들로부터 캡처된 트레이닝 이미지들을 이용하여 트레이닝된다. 다른 예로서, 위험 예측 모델들(265)은 Lung-RADS 1, Lung-RADS 2, Lung-RADS 3, Lung-RADS 4A, Lung-RADS 4B, 또는 Lung-RADS 4X(예컨대, Lung-RADS 1-4X 위험 예측 모델들) 중 임의의 것의 트레이닝 개인들로부터 캡처된 트레이닝 이미지들을 이용하여 트레이닝된다.
다양한 실시 형태들에서, 위험 전개 모듈(260)은 다수의 위험 예측들(270)을 예측하기 위해 다수의 향후 위험 모델들(265)을 전개한다. 예를 들어, 위험 전개 모듈(260)은 다수의 M년, Lung-RADS 1-4X 위험 예측 모델들을 전개하는데, 여기서 "M"은 암 위험이 평가되는 기간을 지칭한다. 다양한 실시 형태들에서, "M"은 적어도 1년, 적어도 2년, 적어도 3년, 적어도 4년, 적어도 5년, 적어도 6년, 적어도 7년, 적어도 8년, 적어도 9년, 적어도 10년, 적어도 11년, 적어도 12년, 적어도 13년, 적어도 14년, 적어도 15년, 적어도 16년, 적어도 17년, 적어도 18년, 적어도 19년, 및/또는 적어도 20년이다. 특정 실시 형태들에서, 위험 전개 모듈(260)은 1) 1년, Lung-RADS 1-4X 위험 예측 모델, 2) 3년, Lung-RADS 1-4X 위험 예측 모델, 및 3) 5년, Lung-RADS 1-4X 위험 예측 모델을 전개함으로써, 1년, 3년, 및 5년 기간에 대한 암의 향후 위험 예측들을 생성한다.
다양한 실시 형태들에서, 전개 시, 위험 예측 모델은 추출된 이미지 특징부들을 분석하고 대상체가 일정 기간 내에 암을 발전시킬 가능성이 있는지 나타낼 수 있는 예측된 점수를 생성한다. 예를 들어, 위험 예측 모델은 트레이닝된 파라미터들의 세트를 추출된 이미지 특징부들의 값들과 조합함으로써 예측된 점수를 계산하는 회귀 모델(예컨대, 로지스틱 회귀 또는 선형 회귀 모델)일 수 있다. 다른 예로서, 위험 예측 모델은 신경망의 노드들 및 층들과 연관된 트레이닝된 파라미터들의 세트를 추출된 이미지 특징부들의 값들과 조합함으로써 예측된 점수를 계산하는 신경망 모델일 수 있다. 다른 예로서, 위험 예측 모델은 결정 트리 노드들과 연관된 트레이닝된 파라미터들의 세트를 추출된 이미지 특징부들의 값들과 조합함으로써 예측된 점수를 계산하는 랜덤 포레스트 모델일 수 있다. 다른 예로서, 위험 예측 모델은 결정 트리 노드들과 연관된 트레이닝된 파라미터들의 세트를 추출된 이미지 특징부들의 값들과 조합함으로써 예측된 점수를 계산하는 그래디언트 부스트 머신 모델일 수 있다.
다양한 실시 형태들에서, 위험 예측 모델은 예측된 점수를 하나 이상의 기준 점수들에 비교한다. 다양한 실시 형태들에서, 하나 이상의 기준 점수들은 임계치 컷오프 값들이다. 예를 들어, 임계치 컷오프 값은 0과 1 사이, 예컨대 0.1, 0.2, 0.3, 0.4, 0.5, 0.6, 0.7, 0.8, 또는 0.9일 수 있다. 특정 실시 형태들에서, 임계값은 0.1이다. 특정 실시 형태들에서, 임계값은 0.3이다. 따라서, 예측된 점수가 임계 기준 점수를 초과하는 경우, 대상체는 하나의 카테고리로 분류된다(예컨대, 암을 발전시킬 가능성이 있음). 예측된 점수가 임계 기준 점수 미만인 경우, 대상체는 상이한 카테고리(예컨대, 암을 발전시킬 가능성이 없음)로 분류된다.
다양한 실시 형태들에서, 다수의 기준 임계 점수들은 다수의 분류 그룹들을 생성하도록 구현될 수 있다. 예를 들어, 제1 임계값은 0.1이고 제2 임계값은 0.3이다. 따라서, 예측된 점수가 제1 임계값 미만인 경우, 대상체는 제1 카테고리(예컨대, 암을 발전시킬 가능성이 없음)로 분류된다. 예측된 점수가 제1 임계값과 제2 임계값 사이인 경우, 대상체는 제2 카테고리(예컨대, 암을 발전시킬 위험 낮음)로 분류된다. 예측된 점수가 제2 임계값보다 큰 경우, 대상체는 제3 카테고리(예컨대, 암을 발전시킬 위험 높음)로 분류된다.
일 예로서, 기준 점수는 하나 이상의 트레이닝 개인들에 대응한다. 예를 들어, 기준 점수는 기간 내에 암을 발전시킬 것으로 알려진 트레이닝 개인들에 대응할 수 있다. 다른 예로서, 기준 점수는 기간 내에 암을 발전시지 않을 것으로 알려진 트레이닝 개인들에 대응할 수 있다. 따라서, 대상체에 대해 예측된 점수가 기간 내에 암을 발전시키는 것으로 알려진 트레이닝 개인들에 대응하는 기준 점수와 비교하여 현저하게 상이하지 않은 경우(예컨대, p-값 >0.05), 위험 예측 모델은 대상체를 기간 내에 암을 발전시킬 가능성이 있는 것으로 분류할 수 있다. 대상체에 대해 예측된 점수가 기간 내에 암을 발전시키는 것으로 알려진 트레이닝 개인들에 대응하는 기준 점수와 비교하여 현저하게 상이한 경우(예컨대, p-값<0.05), 위험 예측 모델은 대상체를 기간 내에 암을 발전시킬 가능성이 없는 것으로 분류할 수 있다. 대상체에 대해 예측된 점수가 기간 내에 암을 발전시키지 않는 것으로 알려진 트레이닝 개인들에 대응하는 기준 점수와 비교하여 현저하게 상이하지 않은 경우(예컨대, p-값>0.05), 위험 예측 모델은 대상체를 기간 내에 암을 발전시킬 가능성이 없는 것으로 분류할 수 있다. 대상체에 대해 예측된 점수가 기간 내에 암을 발전시키지 않는 것으로 알려진 트레이닝 개인들에 대응하는 기준 점수와 비교하여 현저하게 상이한 경우(예컨대, p-값<0.05), 위험 예측 모델은 대상체를 기간 내에 암을 발전시킬 가능성이 있는 것으로 분류할 수 있다.
다양한 실시 형태들에서, 트레이닝 동안, 향후 암 임계치의 위험은 저위험 대상체들로부터 고위험 대상체들을 경계나누도록 정의된다. 이어서, 고위험 대상체들만이 임의의 주어진 모델에 포함된다. 다양한 실시 형태들에서, 각각의 위험 예측 모델은 대상체들을 고위험 또는 저위험으로 경계나누는데 사용되는 고유 향후 암 임계치를 갖는다. 이러한 임계치들이 각각의 위험 예측 모델에 대해 정의되면, 위험 예측 모델은 대상체에 대해 전개되어 암의 향후 위험을 예측한다. 위험이 트레이닝에서 정의된 임계치 초과인 경우, 대상체는 암의 높은 향후 위험을 갖는 것으로 분류될 수 있다.
도 2b에 도시된 바와 같이, 위험 예측들(270)은 환자 강화(275)에 사용될 수 있다. 예를 들어, 대상체는 임상에 등록될 하나 이상의 환자 코호트들에 포함될 수 있다. 환자 강화를 위한 방법들이 아래 더 상세하게 기재된다.
다양한 실시 형태들에서, 대상체에 대한 위험 예측들(270)은 사용자 예컨대, 임상의사 사용자에게 디스플레이될 수 있다. 따라서, 임상의사 사용자는 대상체에게 대상체에 대해 예측된 암의 향후 위험에 관해 통지할 수 있다. 다양한 실시 형태들에서, 추가/기타 정보가 사용자 예컨대, 임상의사 사용자에게 디스플레이될 수 있다. 예를 들어, 대상체에 대한 암의 향후 위험 예측은 대상체가 일정 기간 내에 암을 발전시킬 가능성이 있음을 나타내는 경우, 암의 향후 위험 예측에 가장 비중있게 기여하는 특징부들과 같은 정보가 사용자 예컨대, 임상의사 사용자에 디스플레이될 수 있다. 예를 들어, 암의 향후 위험을 갖는 것으로 예측된 대상체는 주로 중심소엽 폐기종에 의해 점유되는 대상체의 폐의 백분율로 인한 것일 수 있다. 따라서, 특징부의 식별 및/또는 특징부의 값(예컨대, 중심소엽 폐기종에 의해 점유되는 대상체의 폐의 백분율)은 사용자 예컨대, 임상의사 사용자에 디스플레이될 수 있다. 다양한 실시 형태들에서, 대상체에 대한 암의 향후 위험 예측에 가장 비중있게 기여한 상위 1개, 상위 2개, 상위 3개, 상위 4개, 상위 5개, 상위 6개, 상위 7개, 상위 8개, 상위 9개, 또는 상위 10개의 특징부들이 사용자 예컨대, 임상의사 사용자에 디스플레이될 수 있다. 비중있게 기여하는 특징부들의 디스플레이는 암의 향후 위험 예측을 이끈 특징부들을 이해하는 데 있어서 임상의사 사용자에게 맥락을 제공할 수 있다.
IV. 환자 강화의 방법들
일반적으로, 위험 예측 모델들로부터의 암의 향후 위험 예측들은 환자 강화에 사용된다. 예를 들어, 암의 향후 위험 예측들은 대상체가 기간들 내에(예컨대, 1년 내에, 3년 내에, 또는 5년 내에) 암을 발전시킬 가능성이 있는지에 대해 통찰력을 제공한다. 따라서, 특정 기간 내에 암을 발전시킬 것으로 예측되는 대상체들에 대해, 대상체들은 임상 시험에 등록될 환자 코호트에 포함되도록 선택될 수 있다. 암의 향후 위험 예측들에 의해 제공되는 통찰력을 고려하면, 임상 시험을 위한 환자 코호트들에서 더 적은 대상체들의 등록을 가능하게 한다. 따라서, 임상 시험을 수행하고 환자 코호트의 대상체들을 추적하는데 더 적은 리소스가 필요하다. 추가적으로, 환자 코호트에 포함되지 않은 대상체들(예컨대, 일정 기간 내에 암을 발전시키지 않을 것으로 예측되는 대상체들)은 다른 목적에 사용될 수 있다(예컨대, 다른 임상 시험들에 등록됨).
다양한 실시 형태들에서, 대상체는 환자에 대해 생성된 다수의 위험 예측들 중 하나 이상에 기초하여 환자 코호트에 포함되도록 선택된다. 예를 들어, 대상체는 대상체가 1년 내에 암을 발전시키지 않을 것이고, 3년 내에 암을 발전시키지 않을 것이지만, 5년 내에 암을 발전시킬 가능성이 있음을 나타내는 제1 위험 예측을 가질 수 있다. 따라서, 대상체는 예방적 치료제의 투여를 포함하는 암 임상 시험에서의 등록을 위한 환자 코호트에 포함되도록 선택된다.
다른 예로서, 대상체는 대상체가 1년 내에 암을 발전시킬 가능성이 있고 따라서, 또한 3년 및 5년 내에 암을 발전시킬 가능성이 있음을 나타내는 제1 위험 예측을 가질 수 있다. 따라서, 대상체는 공격적인 암 치료(예컨대, 종양 절제 및/또는 치료제의 투여)를 포함하는 암 임상 시험의 등록을 위한 환자 코호트에 포함되도록 선택된다.
다양한 실시 형태들에서, 복수의 대상체들에 대한 위험 예측들을 이용하는 환자 강화 프로세스는 무작위로 생성된 환자 코호트와 비교하여 암을 발전시킬 가능성이 더 높은 환자들의 강화된 코호트를 생성한다. 다양한 실시 형태들에서, 환자 강화 프로세스는 무작위로 생성된 환자 코호트와 비교하여 누적 암 발생에서 적어도 1.5배 증가를 경험하는 환자들의 강화된 코호트를 생성한다. 다양한 실시 형태들에서, 환자 강화 프로세스는 무작위로 생성된 환자 코호트와 비교하여 누적 암 발생에서 적어도 1.6배 증가, 적어도 1.7배 증가, 적어도 1.8배 증가, 적어도 1.9배 증가, 적어도 2배 증가, 적어도 3배 증가, 적어도 4배 증가, 적어도 5배 증가, 적어도 6배 증가, 적어도 7배 증가, 적어도 8배 증가, 적어도 9배 증가, 적어도 10배 증가, 적어도 11배 증가, 적어도 12배 증가, 적어도 13배 증가, 적어도 14배 증가, 적어도 15배 증가, 적어도 16배 증가, 적어도 17배 증가, 적어도 18배 증가, 적어도 19배 증가, 적어도 20배 증가, 적어도 21배 증가, 적어도 22배 증가, 적어도 23배 증가, 적어도 24배 증가, 적어도 25배 증가, 적어도 26배 증가, 적어도 27배 증가, 적어도 28배 증가, 적어도 29배 증가, 또는 적어도 30배 증가를 경험하는 환자들의 강화된 코호트를 생성한다.
V. 위험 예측 모델의 트레이닝
일반적으로, 위험 예측 모델은 이미지로부터 추출된 특징부들, 예컨대, 비-결절 특이 특징부들 및/또는 결절 특이 특징부들을 분석하고, 추출된 특징부들에 기초하여 대상체에 대해 향후 암 위험을 예측하도록 구성된다. 다양한 실시 형태들에서, 위험 예측 모델은 회귀 모델(예컨대, 선형 회귀, 로지스틱 회귀, 또는 다항식 회귀), 결정 트리, 랜덤 포레스트, 그래디언트 부스트 머신 러닝 모델, 지원 벡터 머신, 나이브 베이즈 모델(Na
Figure pct00001
ve Bayes model), k-평균 클러스터, 또는 신경망(예컨대, 순방향-공급 네트워크들, 콘볼루셔널 신경망(CNN), 딥 신경망(DNN), 오토인코더 신경망, 생성적 적대 네트워크들, 또는 순환 네트워크들(예컨대, 장단기 메모리 네트워크들(LSTM), 양방향 순환 네트워크들, 딥 양방향 순환 네트워크들), 또는 이들의 임의의 조합 중 어느 하나이다. 특정 실시 형태들에서, 위험 예측 모델은 로지스틱 회귀 모델이다. 특정 실시 형태들에서, 위험 예측 모델은 랜덤 포레스트 분류기이다. 특정 실시 형태들에서, 위험 예측 모델은 그래디언트 부스팅 모델이다.
위험 예측 모델은 선형 회귀 알고리즘, 로지스틱 회귀 알고리즘, 결정 트리 알고리즘, 지원 벡터 머신 분류, 나이브 베이즈 분류, K-최근접이웃 분류, 랜덤 포레스트 알고리즘, 딥 러닝 알고리즘, 그래디언트 부스팅 알고리즘, 및 다양체 학습(manifold learning), 주성분 분석, 인자 분석, 오토인코더 정규화(autoencoder regularization), 및 독립 성분 분석, 또는 이들의 조합과 같은 차원 축소 기술들 중 어느 하나와 같은 머신 러닝 구현 방법을 이용하여 트레이닝될 수 있다. 특정 실시 형태들에서, 머신 러닝 구현 방법은 로지스틱 회귀 알고리즘이다. 특정 실시 형태들에서, 머신 러닝 구현 방법은 랜덤 포레스트 알고리즘이다. 특정 실시 형태들에서, 머신 러닝 구현 방법은 XGboost와 같은 그래디언트 부스팅 알고리즘이다. 다양한 실시 형태들에서, 위험 예측 모델은 지도형 학습 알고리즘, 비지도형 학습 알고리즘, 반-지도형 학습 알고리즘(예컨대, 부분 지도), 약한 지도, 전달, 멀티-태스크 학습, 또는 이들의 임의의 조합을 이용하여 트레이닝된다.
다양한 실시 형태들에서, 위험 예측 모델은 하나 이상의 파라미터들, 예컨대, 하이퍼파라미터들 또는 모델 파라미터들을 갖는다. 하이퍼파라미터들은 일반적으로 트레이닝 이전에 확립된다. 하이퍼파라미터들의 예들은 학습 속도, 결정 트리의 깊이 또는 리프들, 딥 신경망에서의 은닉 층들의 수, k-평균 클러스터에서의 클러스터의 수, 회귀 모델에서의 페널티, 및 비용 함수와 연관된 정규화 파라미터를 포함한다. 모델 파라미터들은 일반적으로 트레이닝 동안 조정된다. 모델 파라미터들의 예들은 신경망의 층들에서의 노드들, 지원 벡터 머신에서의 지원 벡터들, 결정 트리에서의 노드 값들, 및 회귀 모델의 계수들과 연관된 가중치들을 포함한다. 위험 예측 모델의 모델 파라미터들은 위험 예측 모델의 예측 능력을 개선을 개선하기 위해 트레이닝 데이터를 이용하여 트레이닝(예컨대, 조정)된다.
위험 트레이닝 모듈(155)은 트레이닝 데이터를 이용하여 위험 예측 모델을 트레이닝시킨다. 트레이닝 데이터는 트레이닝 데이터 저장소(170)에 저장 및/또는 그로부터 검색될 수 있다. 다양한 실시 형태들에서, 트레이닝 데이터는 트레이닝 개인들(예컨대, 일정 기간 내에 암을 발전시키거나 또는 발전시키지 않는 것으로 알려진 개인들)로부터 획득된 트레이닝 이미지들로부터 추출된 특징부들을 포함한다. 다양한 실시 형태들에서, 트레이닝 데이터는 데이터세트의 스플릿으로부터 획득될 수 있다. 예를 들어, 데이터세트는 50:50 트레이닝:테스팅 데이터세트 스플릿을 거칠 수 있다. 일부 실시 형태들에서, 데이터세트는 60:40 트레이닝:테스팅 데이터세트 스플릿을 거칠 수 있다. 일부 실시 형태들에서, 데이터세트는 80:20 트레이닝:테스팅 데이터세트 스플릿을 거칠 수 있다.
다양한 실시 형태들에서, 대체 모델을 트레이닝하는 데 사용되는 트레이닝 데이터는 트레이닝 개인이 일정 기간 내에 암을 발전시켰거나 (이하 "양" 또는 "+"로도 지칭됨) 또는 트레이닝 개인이 기간 내에 암을 발전시키지 않았는지(이하 "음" 또는 "-"로도 지칭됨) 나타내는 기준 실측 자료를 포함한다. 다양한 실시 형태들에서, 트레이닝 데이터의 기준 실측 자료는 "1" 또는 "0"과 같은 이진 값들이다. 예를 들어, 일정 기간 내에 암을 발전시킨 트레이닝 개인은 트레이닝 데이터에서 "1"의 값으로 식별될 수 있는 반면, 일정 기간 내에 암을 발전시키지 않은 트레이닝 개인은 트레이닝 데이터에서 "0"의 값으로 식별될 수 있다. 다양한 실시 형태들에서, 위험 트레이닝 모듈(155)은 위험 예측 모델이 입력(예컨대, 트레이닝 이미지의 추출된 특징부들)에 기초하여 결과(예컨대, 일정 기간 내에 암의 향후 존재 또는 부재)를 더 잘 예측할 수 있도록 손실 함수를 최소화하기 위하여 트레이닝 데이터를 이용하여 위험 예측 모델을 트레이닝한다. 다양한 실시 형태들에서, 손실 함수는 적어도 절대 수축 및 선택 운영자(selection operator, LASSO) 회귀, 리지(Ridge) 회귀, 또는 엘라스틱넷(ElasticNet) 회귀 중 임의의 것에 대해 구성된다. 다양한 실시 형태들에서, 위험 예측 모델은 랜덤 포레스트 모델이고, 특징부 분할을 위해 지니 불순도(Gini impurity) 또는 엔트로피 메트릭 중 하나를 최소화하여, 위험 예측 모델이 더 정확하게 향후 암 위험을 예측할 수 있도록 트레이닝된다.
다양한 실시 형태들에서, 트레이닝 데이터는 공개적으로 이용가능한 데이터베이스로부터 획득 및/또는 도출될 수 있다. 예를 들어, 트레이닝 데이터는 국가폐암검진연구(NLST)로부터 획득 및/또는 도출될 수 있다. 일부 실시 형태들에서, 트레이닝 데이터는 예컨대, 복수의 트레이닝 개인들로부터 이미지들을 캡처함으로써 공개적으로 이용가능한 데이터베이스들에 독립적으로 획득 및 수집될 수 있다. 이러한 트레이닝 데이터는 맞춤형 데이터세트일 수 있다.
다양한 실시 형태들에서, 위험 예측 모델은 트레이닝 개인들의 특정 코호트를 이용하여 트레이닝된다. 다양한 실시 형태들에서, 위험 예측 모델은 폐 결절들을 갖지 않은 트레이닝 개인들의 코호트를 이용하여 트레이닝된다. 다양한 실시 형태들에서, 위험 예측 모델은 폐 결절들을 갖는 트레이닝 개인들의 코호트를 이용하여 트레이닝된다. 다양한 실시 형태들에서, 위험 예측 모델은 이전에 Lung-RADS 1로 분류된 트레이닝 개인들의 코호트를 이용하여 트레이닝된 Lung-RADS 1 예측 모델이다. 다양한 실시 형태들에서, 위험 예측 모델은 이전에 Lung-RADS 1-2 중 어느 하나로 분류된 트레이닝 개인들의 코호트를 이용하여 트레이닝된 Lung-RADS 2 예측 모델이다. 다양한 실시 형태들에서, 위험 예측 모델은 이전에 Lung-RADS 1-3 중 어느 하나로 분류된 트레이닝 개인들의 코호트를 이용하여 트레이닝된 Lung-RADS 1-3 예측 모델이다. 다양한 실시 형태들에서, 위험 예측 모델은 이전에 Lung-RADS 1-4A 중 어느 하나로 분류된 트레이닝 개인들의 코호트를 이용하여 트레이닝된 Lung-RADS 1-4A 예측 모델이다. 다양한 실시 형태들에서, 위험 예측 모델은 이전에 Lung-RADS 1-4B 중 어느 하나로 분류된 트레이닝 개인들의 코호트를 이용하여 트레이닝된 Lung-RADS 1-4B 예측 모델이다. 다양한 실시 형태들에서, 위험 예측 모델은 이전에 Lung-RADS 1-4X 중 어느 하나로 분류된 트레이닝 개인들의 코호트를 이용하여 트레이닝된 Lung-RADS 1-4X 예측 모델이다.
다양한 실시 형태들에서, Lung-RADS 1 예측 모델, Lung-RADS 1-2 예측 모델, Lung-RADS 1-3 예측 모델, Lung-RADS 1-4A 예측 모델, Lung-RADS 1-4B 예측 모델, 또는 Lung-RADS 1-4X 예측 모델 중 임의의 것의 각각에 대해, 위험 예측 모델은 트레이닝 개인들의 트레이닝 코호트를 이용하여 트레이닝되고, 여기서 트레이닝 코호트의 대부분(예컨대, 50% 초과)의 트레이닝 개인들은 이전에 Lung-RADS 1로서 분류되었다. 다양한 실시 형태들에서, Lung-RADS 1 예측 모델, Lung-RADS 1-2 예측 모델, Lung-RADS 1-3 예측 모델, Lung-RADS 1-4A 예측 모델, Lung-RADS 1-4B 예측 모델, 또는 Lung-RADS 1-4X 예측 모델 중 임의의 것의 각각에 대해, 위험 예측 모델은 트레이닝 개인들의 트레이닝 코호트를 이용하여 트레이닝되고, 여기서 트레이닝 코호트의 대부분(예컨대, 50% 초과)의 트레이닝 개인들은 이전에 Lung-RADS 2로서 분류되었다. 다양한 실시 형태들에서, Lung-RADS 1 예측 모델, Lung-RADS 1-2 예측 모델, Lung-RADS 1-3 예측 모델, Lung-RADS 1-4A 예측 모델, Lung-RADS 1-4B 예측 모델, 또는 Lung-RADS 1-4X 예측 모델 중 임의의 것의 각각에 대해, 위험 예측 모델은 트레이닝 개인들의 트레이닝 코호트를 이용하여 트레이닝되고, 여기서 트레이닝 코호트의 대부분(예컨대, 50% 초과)의 트레이닝 개인들은 이전에 Lung-RADS 1 또는 Lung-RADS 2로서 분류되었다. 표 1에 도시된 바와 같이, ~90%의 개인들은 Lung-RADS 1 또는 Lung-RADS 2에 해당할 수 있다. 따라서, 이러한 개인들은 위험 예측 모델들 중 임의의 것을 트레이닝하는 데 사용될 수 있다.
다양한 실시 형태들에서, 위험 예측 모델은 "M"년 내, 예컨대 적어도 1년, 적어도 2년, 적어도 3년, 적어도 4년, 적어도 5년, 적어도 6년, 적어도 7년, 적어도 8년, 적어도 9년, 적어도 10년, 적어도 11년, 적어도 12년, 적어도 13년, 적어도 14년, 적어도 15년, 적어도 16년, 적어도 17년, 적어도 18년, 적어도 19년, 또는 적어도 20년 내의 암의 향후 위험을 예측하도록 트레이닝된 "M"년 예측 모델이다. 따라서, 대체 모델을 트레이닝하는 데 사용되는 트레이닝 데이터는 트레이닝 개인이 "M"년 내에 암을 발전시켰음을 나타내는 기준 실측 자료를 포함한다.
다양한 실시 형태들에서, 위험 예측 모델은 1) 트레이닝 개인들의 특정 코호트를 이용하여 트레이닝되고 2) "M"년 내의 암의 향후 위험을 예측하도록 트레이닝된다. 위에 기재된 바와 같이, 트레이닝 개인들의 코호트는 이전에 Lung-RADS 점수들의 범위(예컨대, Lung-RADS X-Y) 내에서 분류될 수 있다. 따라서, 위험 예측 모델은 1) Lung-RADS X-Y로 분류된 트레이닝 개인들의 코호트를 이용하여 트레이닝되고 2) "M"년으로 암의 향후 위험을 예측하도록 트레이닝되는 M년, Lung-RADS X-Y 예측 모델일 수 있다.
다양한 실시 형태들에서, 위험 예측 모델은 비-결절 특이 특징부들 및 결절 특이 특징부들 둘 모두를 포함한다. 따라서, 위험 예측 모델 트레이닝 시, 위험 예측 모델은 트레이닝 이미지로부터 추출된 비-결절 특이 특징부들 및 결절 특이 특징부들 둘 모두를 분석하고 손실 함수를 최소화하는 예측을 생성하도록 시도한다. 일반적으로, 위험 예측 모델의 특징부들은 얼마나 비중있게 각각의 특징부가 위험 예측 모델에 의해 생성된 예측에 영향을 미치는지 반영하는 중요도 값들을 갖는다. 예를 들어, 특징부에 대한 더 높은 중요도 값은 중요도 값이 낮은 상이한 특징부와 비교하여 특징부가 위험 예측 모델에 의해 생성된 예측에 더 비중있게 영향을 미침을 나타낸다.
다양한 실시 형태들에서, 위험 예측 모델의 결절 특이 특징부들은 비-결절 특이 특징부들과 비교하여 더 비중있게 암의 향후 위험의 예측에 영향을 미친다. 예를 들어, 위험 예측 모델의 결절 특이 특징부들은 위험 예측 모델의 비-결절 특이 특징부들보다 더 높은 특징부 중요도 값들을 갖는다. 일반적으로, 결절 특이 특징부들은 더 짧은 기간들(예컨대, 3년 또는 5년과는 대조적으로 1년) 내의 암의 위험을 예측하도록 트레이닝된 위험 예측 모델들에 대해 더 높은 중요도 값들을 갖는다. 추가적으로, 결절 특이 특징부들은 더 높은 위험 폐암 환자들(예컨대, Lung-RADS 4A 또는 Lung-RADS 4B로 분류된 환자들)을 이용하여 트레이닝된 위험 예측 모델들에 대해 더 높은 중요도 값들을 갖는다.
다양한 실시 형태들에서, 위험 예측 모델의 가장 높은 중요도 값을 갖는 특징부가 결절 특이 특징부이다. 다양한 실시 형태들에서, 위험 예측 모델의 가장 높은 중요도 값을 갖는 상위 2개의 특징부들이 결절 특이 특징부들이다. 다양한 실시 형태들에서, 위험 예측 모델의 가장 높은 중요도 값을 갖는 상위 3개의 특징부들이 결절 특이 특징부들이다. 다양한 실시 형태들에서, 위험 예측 모델의 가장 높은 중요도 값을 갖는 상위 4개의 특징부들이 결절 특이 특징부들이다. 다양한 실시 형태들에서, 위험 예측 모델의 가장 높은 중요도 값을 갖는 상위 5, 6, 7, 8, 9, 또는 10개의 특징부들이 결절 특이 특징부들이다.
다양한 실시 형태들에서, 가장 높은 특징부 중요도 값들을 갖는 상위 3개의 특징부들의 50% 초과는 결절 특이 특징부들이다. 다양한 실시 형태들에서, 가장 높은 특징부 중요도 값들을 갖는 상위 3개의 특징부들 중 2개가 결절 특이 특징부들이다. 다양한 실시 형태들에서, 가장 높은 특징부 중요도 값들을 갖는 상위 5개의 특징부들 중 3개가 결절 특이 특징부들이다. 다양한 실시 형태들에서, 가장 높은 특징부 중요도 값들을 갖는 상위 5개의 특징부들 중 4개가 결절 특이 특징부들이다. 다양한 실시 형태들에서, 가장 높은 특징부 중요도 값들을 갖는 상위 5개의 특징부들의 50% 초과는 결절 특이 특징부들이다. 다양한 실시 형태들에서, 가장 높은 특징부 중요도 값들을 갖는 상위 10개의 특징부들의 50% 초과는 결절 특이 특징부들이다. 다양한 실시 형태들에서, 가장 높은 특징부 중요도 값들을 갖는 상위 10개의 특징부들 중 6, 7, 8, 9, 또는 10개가 결절 특이 특징부들이다.
다양한 실시 형태들에서, 이러한 위험 예측 모델(예컨대, 위험 예측 모델의 결절 특이 특징부들이 위험 예측 모델의 비-결절 특이 특징부들보다 더 높은 특징부 중요도 값들을 갖는 위험 예측 모델)은 1년 위험 예측 모델(예컨대, 1년 내의 암을 발전시키는 위험을 예측)이다. 다양한 실시 형태들에서, 이러한 위험 예측 모델은 고위험 폐 결절들을 포함하는 트레이닝 이미지들에 대해 트레이닝되는 모델이다. 다양한 실시 형태들에서, 이러한 위험 예측 모델은 Lung-RADS 4A로 분류된 개인들로부터 도출된 트레이닝 이미지들에 대해 트레이닝될 수 있다. 다양한 실시 형태들에서, 이러한 위험 예측 모델은 Lung-RADS 4B로 분류된 개인들로부터 도출된 트레이닝 이미지들에 대해 트레이닝될 수 있다. 다양한 실시 형태들에서, 이러한 위험 예측 모델은 Lung-RADS 4X로 분류된 개인들로부터 도출된 트레이닝 이미지들에 대해 트레이닝될 수 있다. 다양한 실시 형태들에서, 이러한 위험 예측 모델은 Lung-RADS 4A, Lung-RADS 4B, Lung-RADS 4X, 또는 이들의 임의의 조합으로 분류된 개인들로부터 도출된 트레이닝 이미지들에 대해 트레이닝될 수 있다. 예를 들어, 이러한 위험 예측 모델은 Lung-RADS 1-4A, Lung-RADS 1-4B, 또는 Lung-RADS 1-4X 예측 모델 중 어느 하나일 수 있다.
특정 실시 형태들에서, 이러한 위험 예측 모델(예컨대, 위험 예측 모델의 결절 특이 특징부들이 위험 예측 모델의 비-결절 특이 특징부들보다 더 높은 특징부 중요도 값들을 갖는 위험 예측 모델)은 1년, Lung-RADS 1-4B 예측 모델이다. 예를 들어, 표 3에 도시된 바와 같이, 1년, Lung-RADS 1-4B 예측 모델에 대한 특징부 중요도의 관점에서 상위 3개의 특징부들이 결절 특이 특징부들이다. 추가적으로, 1년, Lung-RADS 1-4B 예측 모델에 대한 특징부 중요도의 관점에서 상위 5개의 특징부들 중 4개가 결절 특이 특징부들이다.
특정 실시 형태들에서, 이러한 위험 예측 모델(예컨대, 위험 예측 모델의 결절 특이 특징부들이 위험 예측 모델의 비-결절 특이 특징부들보다 더 높은 특징부 중요도 값들을 갖는 위험 예측 모델)은 3년, Lung-RADS 1-4B 예측 모델이다. 예를 들어, 표 3에 도시된 바와 같이, 3년, Lung-RADS 1-4B 예측 모델에 대한 특징부 중요도의 관점에서 상위 3개의 특징부들 중 2개가 결절 특이 특징부들이다. 추가적으로, 3년, Lung-RADS 1-4B 예측 모델에 대한 특징부 중요도의 관점에서 상위 5개의 특징부들 중 3개가 결절 특이 특징부들이다. 다른 예로서, 표 19에 도시된 바와 같이, 3년, Lung-RADS 1-4B 예측 모델에 대한 특징부 중요도의 관점에서 상위 3개의 특징부들이 결절 특이 특징부들이다. 추가적으로, 3년, Lung-RADS 1-4B 예측 모델에 대한 특징부 중요도의 관점에서 상위 5개의 특징부들 중 4개가 결절 특이 특징부들이다.
특정 실시 형태들에서, 이러한 위험 예측 모델(예컨대, 위험 예측 모델의 결절 특이 특징부들이 위험 예측 모델의 비-결절 특이 특징부들보다 더 높은 특징부 중요도 값들을 갖는 위험 예측 모델)은 5년, Lung-RADS 1-4B 예측 모델이다. 예를 들어, 표 3에 도시된 바와 같이, 5년, Lung-RADS 1-4B 예측 모델에 대한 특징부 중요도의 관점에서 상위 3개의 특징부들 중 2개가 결절 특이 특징부들이다.
특정 실시 형태들에서, 이러한 위험 예측 모델(예컨대, 위험 예측 모델의 결절 특이 특징부들이 위험 예측 모델의 비-결절 특이 특징부들보다 더 높은 특징부 중요도 값들을 갖는 위험 예측 모델)은 1년, Lung-RADS 1-4A 예측 모델이다. 예를 들어, 표 6에 도시된 바와 같이, 1년, Lung-RADS 1-4A 예측 모델에 대한 특징부 중요도의 관점에서 상위 3개의 특징부들이 결절 특이 특징부들이다. 추가적으로, 1년, Lung-RADS 1-4A 예측 모델에 대한 특징부 중요도의 관점에서 상위 5개의 특징부들 중 4개가 결절 특이 특징부들이다.
특정 실시 형태들에서, 이러한 위험 예측 모델(예컨대, 위험 예측 모델의 결절 특이 특징부들이 위험 예측 모델의 비-결절 특이 특징부들보다 더 높은 특징부 중요도 값들을 갖는 위험 예측 모델)은 3년, Lung-RADS 1-4A 예측 모델이다. 예를 들어, 표 6에 도시된 바와 같이, 3년, Lung-RADS 1-4A 예측 모델에 대한 특징부 중요도의 관점에서 상위 3개의 특징부들이 결절 특이 특징부들이다. 추가적으로, 3년, Lung-RADS 1-4A 예측 모델에 대한 특징부 중요도의 관점에서 상위 5개의 특징부들 중 4개가 결절 특이 특징부들이다. 다른 예로서, 표 20에 도시된 바와 같이, 3년, Lung-RADS 1-4A 예측 모델에 대한 특징부 중요도의 관점에서 상위 3개의 특징부들이 결절 특이 특징부들이다. 추가적으로, 3년, Lung-RADS 1-4A 예측 모델에 대한 특징부 중요도의 관점에서 상위 5개의 특징부들 중 4개가 결절 특이 특징부들이다.
특정 실시 형태들에서, 이러한 위험 예측 모델(예컨대, 위험 예측 모델의 결절 특이 특징부들이 위험 예측 모델의 비-결절 특이 특징부들보다 더 높은 특징부 중요도 값들을 갖는 위험 예측 모델)은 5년, Lung-RADS 1-4A 예측 모델이다. 예를 들어, 표 6에 도시된 바와 같이, 5년, Lung-RADS 1-4A 예측 모델에 대한 특징부 중요도의 관점에서 상위 3개의 특징부들 중 2개가 결절 특이 특징부들이다.
특정 실시 형태들에서, 이러한 위험 예측 모델(예컨대, 위험 예측 모델의 결절 특이 특징부들이 위험 예측 모델의 비-결절 특이 특징부들보다 더 높은 특징부 중요도 값들을 갖는 위험 예측 모델)은 1년, Lung-RADS 1-3 예측 모델이다. 예를 들어, 표 9에 도시된 바와 같이, 1년, Lung-RADS 1-3 예측 모델에 대한 특징부 중요도의 관점에서 상위 3개의 특징부들 중 2개가 결절 특이 특징부들이다.
특정 실시 형태들에서, 이러한 위험 예측 모델(예컨대, 위험 예측 모델의 결절 특이 특징부들이 위험 예측 모델의 비-결절 특이 특징부들보다 더 높은 특징부 중요도 값들을 갖는 위험 예측 모델)은 3년, Lung-RADS 2-4B 예측 모델이다. 예를 들어, 표 22에 도시된 바와 같이, 3년, Lung-RADS 2-4B 예측 모델에 대한 특징부 중요도의 관점에서 상위 3개의 특징부들이 결절 특이 특징부들이다. 추가적으로, 3년, Lung-RADS 2-4B 예측 모델에 대한 특징부 중요도의 관점에서 상위 5개의 특징부들이 결절 특이 특징부들이다.
특정 실시 형태들에서, 이러한 위험 예측 모델(예컨대, 위험 예측 모델의 결절 특이 특징부들이 위험 예측 모델의 비-결절 특이 특징부들보다 더 높은 특징부 중요도 값들을 갖는 위험 예측 모델)은 3년, Lung-RADS 4A-4B 예측 모델이다. 예를 들어, 표 23에 도시된 바와 같이, 3년, Lung-RADS 4A-4B 예측 모델에 대한 특징부 중요도의 관점에서 상위 3개의 특징부들이 결절 특이 특징부들이다. 추가적으로, 3년, Lung-RADS 4A-4B 예측 모델에 대한 특징부 중요도의 관점에서 상위 5개의 특징부들이 결절 특이 특징부들이다.
다양한 실시 형태들에서, 위험 예측 모델의 비-결절 특이 특징부들은 결절 특이 특징부들과 비교하여 더 비중있게 암의 향후 위험의 예측에 영향을 미친다. 예를 들어, 위험 예측 모델의 비-결절 특이 특징부들은 위험 예측 모델의 결절 특이 특징부들보다 더 높은 특징부 중요도 값들을 갖는다. 일반적으로, 비-결절 특이 특징부들은 더 긴 기간들(예컨대, 1년과는 대조적으로 3 또는 5년) 내의 암의 위험을 예측하도록 트레이닝된 위험 예측 모델들에 대해 더 높은 중요도 값들을 갖는다. 추가적으로, 비-결절 특이 특징부들은 폐암의 더 낮은 위험의 환자들(예컨대, Lung-RADS 2 또는 3으로 분류된 환자들) 또는 아직 결절을 갖지 않은 환자들(예컨대, Lung-RADS 1)로 트레이닝된 위험 예측 모델들에 대해 더 높은 중요도 값들을 갖는다.
다양한 실시 형태들에서, 위험 예측 모델의 가장 높은 중요도 값을 갖는 특징부가 비-결절 특이 특징부이다. 다양한 실시 형태들에서, 위험 예측 모델의 가장 높은 중요도 값을 갖는 상위 2개의 특징부들이 비-결절 특이 특징부들이다. 다양한 실시 형태들에서, 위험 예측 모델의 가장 높은 중요도 값을 갖는 상위 3개의 특징부들이 비-결절 특이 특징부들이다. 다양한 실시 형태들에서, 위험 예측 모델의 가장 높은 중요도 값을 갖는 상위 4개의 특징부들이 비-결절 특이 특징부들이다. 다양한 실시 형태들에서, 위험 예측 모델의 가장 높은 중요도 값을 갖는 상위 5, 6, 7, 8, 9, 또는 10개의 특징부들이 비-결절 특이 특징부들이다.
다양한 실시 형태들에서, 가장 높은 특징부 중요도 값들을 갖는 상위 3개의 특징부들의 50% 초과는 비-결절 특이 특징부들이다. 다양한 실시 형태들에서, 가장 높은 특징부 중요도 값들을 갖는 상위 3개의 특징부들 중 2개가 비-결절 특이 특징부들이다. 다양한 실시 형태들에서, 가장 높은 특징부 중요도 값들을 갖는 상위 5개의 특징부들 중 3개가 비-결절 특이 특징부들이다. 다양한 실시 형태들에서, 가장 높은 특징부 중요도 값들을 갖는 상위 5개의 특징부들 중 4개가 비-결절 특이 특징부들이다. 다양한 실시 형태들에서, 가장 높은 특징부 중요도 값들을 갖는 상위 5개의 특징부들의 50% 초과는 비-결절 특이 특징부들이다. 다양한 실시 형태들에서, 가장 높은 특징부 중요도 값들을 갖는 상위 10개의 특징부들의 50% 초과는 비-결절 특이 특징부들이다. 다양한 실시 형태들에서, 가장 높은 특징부 중요도 값들을 갖는 상위 10개의 특징부들 중 6, 7, 8, 9, 또는 10개가 비-결절 특이 특징부들이다.
다양한 실시 형태들에서, 결절 특이 특징부들과 비교하여 더 비중있게 암의 향후 위험의 예측에 영향을 미치는 비-결절 특이 특징부들을 포함하는 위험 예측 모델은 M년 위험 예측 모델(예컨대, M년 내에 암을 발전시킬 위험을 예측)하고, 여기서 M은 1년과 같지 않다. 다양한 실시 형태들에서, M은 2년 이상이다. 예를 들어, M은 1.5년, 2년, 2.5년, 3년, 3.5년, 4년, 4.5년, 5년, 5.5년, 6년, 6.5년, 7년, 7.5년, 8년, 8.5년, 9년, 9.5년, 10년, 10.5년, 11년, 11.5년, 12년, 12.5년, 13년, 13.5년, 14년, 14.5년, 15년, 15.5년, 16년, 16.5년, 17년, 17.5년, 18년, 18.5년, 19년, 19.5년, 또는 20년일 수 있다. 특정 예로서, 위험 예측 모델은 3년 내에 암을 발전시키는 위험을 예측하는 3년 위험 예측 모델이다. 다른 특정 예로서, 위험 예측 모델은 5년 내에 암을 발전시키는 위험을 예측하는 5년 위험 예측 모델이다.
다양한 실시 형태들에서, 결절 특이 특징부들과 비교하여 더 비중있게 암의 향후 위험의 예측에 영향을 미치는 비-결절 특이 특징부들을 포함하는 위험 예측 모델은 폐 결절들을 포함하지 않는 트레이닝 이미지들에 대해 트레이닝된 위험 예측 모델이다. 다양한 실시 형태들에서, 이러한 위험 예측 모델은 Lung-RADS 1로 분류된 개인들로부터 도출된 트레이닝 이미지들에 대해 트레이닝될 수 있다. 다양한 실시 형태들에서, 이러한 위험 예측 모델은 Lung-RADS 2로 분류된 개인들로부터 도출된 트레이닝 이미지들에 대해 트레이닝될 수 있다. 다양한 실시 형태들에서, 이러한 위험 예측 모델은 Lung-RADS 3으로 분류된 개인들로부터 도출된 트레이닝 이미지들에 대해 트레이닝될 수 있다. 다양한 실시 형태들에서, 이러한 위험 예측 모델은 Lung-RADS 1, Lung-RADS 2, Lung-RADS 3, 또는 이들의 임의의 조합으로 분류된 개인들로부터 도출된 트레이닝 이미지들에 대해 트레이닝될 수 있다. 다양한 실시 형태들에서, 이러한 위험 예측 모델은 Lung-RADS 1 예측 모델, Lung-RADS 1-2 예측 모델, 또는 Lung-RADS 1-3 예측 모델이다.
특정 실시 형태들에서, 이러한 위험 예측 모델(예컨대, 위험 예측 모델의 비-결절 특이 특징부들이 위험 예측 모델의 결절 특이 특징부들보다 더 높은 특징부 중요도 값들을 갖는 위험 예측 모델)은 1년, Lung-RADS 1-4B 예측 모델이다. 예를 들어, 표 3에 도시된 바와 같이, 1년, Lung-RADS 1-4B 예측 모델에 대한 특징부 중요도의 관점에서 상위 10개의 특징부들 중 6개가 비-결절 특이 특징부들이다.
특정 실시 형태들에서, 이러한 위험 예측 모델(예컨대, 위험 예측 모델의 비-결절 특이 특징부들이 위험 예측 모델의 결절 특이 특징부들보다 더 높은 특징부 중요도 값들을 갖는 위험 예측 모델)은 3년, Lung-RADS 1-4B 예측 모델이다. 예를 들어, 표 3에 도시된 바와 같이, 3년, Lung-RADS 1-4B 예측 모델에 대한 특징부 중요도의 관점에서 상위 10개의 특징부들 중 6개가 비-결절 특이 특징부들이다.
특정 실시 형태들에서, 이러한 위험 예측 모델(예컨대, 위험 예측 모델의 비-결절 특이 특징부들이 위험 예측 모델의 결절 특이 특징부들보다 더 높은 특징부 중요도 값들을 갖는 위험 예측 모델)은 5년, Lung-RADS 1-4B 예측 모델이다. 예를 들어, 표 3에 도시된 바와 같이, 5년, Lung-RADS 1-4B 예측 모델에 대한 특징부 중요도의 관점에서 상위 5개의 특징부들 중 3개가 비-결절 특이 특징부들이다. 추가적으로, 5년, Lung-RADS 1-4B 예측 모델에 대한 특징부 중요도의 관점에서 상위 10개의 특징부들 중 7개가 비-결절 특이 특징부들이다.
특정 실시 형태들에서, 이러한 위험 예측 모델(예컨대, 위험 예측 모델의 비-결절 특이 특징부들이 위험 예측 모델의 결절 특이 특징부들보다 더 높은 특징부 중요도 값들을 갖는 위험 예측 모델)은 5년, Lung-RADS 1-4A 예측 모델이다. 예를 들어, 표 6에 도시된 바와 같이, 5년, Lung-RADS 1-4A 예측 모델에 대한 특징부 중요도의 관점에서 상위 5개의 특징부들 중 3개가 비-결절 특이 특징부들이다. 추가적으로, 5년, Lung-RADS 1-4A 예측 모델에 대한 특징부 중요도의 관점에서 상위 10개의 특징부들 중 6개가 비-결절 특이 특징부들이다.
특정 실시 형태들에서, 이러한 위험 예측 모델(예컨대, 위험 예측 모델의 비-결절 특이 특징부들이 위험 예측 모델의 결절 특이 특징부들보다 더 높은 특징부 중요도 값들을 갖는 위험 예측 모델)은 1년, Lung-RADS 1-3 예측 모델이다. 예를 들어, 표 9에 도시된 바와 같이, 1년, Lung-RADS 1-3 예측 모델에 대한 특징부 중요도의 관점에서 상위 5개의 특징부들 중 3개가 비-결절 특이 특징부들이다. 추가적으로, 1년, Lung-RADS 1-3 예측 모델에 대한 특징부 중요도의 관점에서 상위 10개의 특징부들 중 7개가 비-결절 특이 특징부들이다.
특정 실시 형태들에서, 이러한 위험 예측 모델(예컨대, 위험 예측 모델의 비-결절 특이 특징부들이 위험 예측 모델의 결절 특이 특징부들보다 더 높은 특징부 중요도 값들을 갖는 위험 예측 모델)은 3년, Lung-RADS 1-3 예측 모델이다. 예를 들어, 표 9에 도시된 바와 같이, 3년, Lung-RADS 1-3 예측 모델에 대한 특징부 중요도의 관점에서 상위 3개의 특징부들 중 2개가 비-결절 특이 특징부들이다. 추가적으로, 3년, Lung-RADS 1-3 예측 모델에 대한 특징부 중요도의 관점에서 상위 5개의 특징부들 중 4개가 비-결절 특이 특징부들이다. 추가적으로, 3년, Lung-RADS 1-3 예측 모델에 대한 특징부 중요도의 관점에서 상위 10개의 특징부들 중 8개가 비-결절 특이 특징부들이다. 다른 예로서, 표 21에 도시된 바와 같이, 3년, Lung-RADS 1-3 예측 모델에 대한 특징부 중요도의 관점에서 상위 3개의 특징부들 중 2개가 비-결절 특이 특징부들이다. 추가적으로, 3년, Lung-RADS 1-3 예측 모델에 대한 특징부 중요도의 관점에서 상위 5개의 특징부들 중 3개가 비-결절 특이 특징부들이다. 추가적으로, 3년, Lung-RADS 1-3 예측 모델에 대한 특징부 중요도의 관점에서 상위 10개의 특징부들 중 8개가 비-결절 특이 특징부들이다.
특정 실시 형태들에서, 이러한 위험 예측 모델(예컨대, 위험 예측 모델의 비-결절 특이 특징부들이 위험 예측 모델의 결절 특이 특징부들보다 더 높은 특징부 중요도 값들을 갖는 위험 예측 모델)은 5년, Lung-RADS 1-3 예측 모델이다. 예를 들어, 표 9에 도시된 바와 같이, 5년, Lung-RADS 1-3 예측 모델에 대한 특징부 중요도의 관점에서 상위 3개의 특징부들 중 2개가 비-결절 특이 특징부들이다. 추가적으로, 5년, Lung-RADS 1-3 예측 모델에 대한 특징부 중요도의 관점에서 상위 5개의 특징부들 중 4개가 비-결절 특이 특징부들이다. 추가적으로, 5년, Lung-RADS 1-3 예측 모델에 대한 특징부 중요도의 관점에서 상위 10개의 특징부들 중 9개가 비-결절 특이 특징부들이다.
특정 실시 형태들에서, 이러한 위험 예측 모델(예컨대, 위험 예측 모델의 비-결절 특이 특징부들이 위험 예측 모델의 결절 특이 특징부들보다 더 높은 특징부 중요도 값들을 갖는 위험 예측 모델)은 1년, Lung-RADS 1-2 예측 모델이다. 예를 들어, 표 12에 도시된 바와 같이, 1년, Lung-RADS 1-2 예측 모델에 대한 특징부 중요도의 관점에서 상위 5개의 특징부들 중 4개가 비-결절 특이 특징부들이다. 추가적으로, 1년, Lung-RADS 1-2 예측 모델에 대한 특징부 중요도의 관점에서 상위 10개의 특징부들 중 9개가 비-결절 특이 특징부들이다.
특정 실시 형태들에서, 이러한 위험 예측 모델(예컨대, 위험 예측 모델의 비-결절 특이 특징부들이 위험 예측 모델의 결절 특이 특징부들보다 더 높은 특징부 중요도 값들을 갖는 위험 예측 모델)은 3년, Lung-RADS 1-2 예측 모델이다. 예를 들어, 표 12에 도시된 바와 같이, 3년, Lung-RADS 1-2 예측 모델에 대한 특징부 중요도의 관점에서 상위 3개의 특징부들이 비-결절 특이 특징부들이다. 추가적으로, 3년, Lung-RADS 1-2 예측 모델에 대한 특징부 중요도의 관점에서 상위 5개의 특징부들이 비-결절 특이 특징부들이다. 추가적으로, 3년, Lung-RADS 1-2 예측 모델에 대한 특징부 중요도의 관점에서 상위 10개의 특징부들 중 8개가 비-결절 특이 특징부들이다.
특정 실시 형태들에서, 이러한 위험 예측 모델(예컨대, 위험 예측 모델의 비-결절 특이 특징부들이 위험 예측 모델의 결절 특이 특징부들보다 더 높은 특징부 중요도 값들을 갖는 위험 예측 모델)은 5년, Lung-RADS 1-2 예측 모델이다. 예를 들어, 표 12에 도시된 바와 같이, 5년, Lung-RADS 1-2 예측 모델에 대한 특징부 중요도의 관점에서 상위 3개의 특징부들이 비-결절 특이 특징부들이다. 추가적으로, 5년, Lung-RADS 1-2 예측 모델에 대한 특징부 중요도의 관점에서 상위 5개의 특징부들이 비-결절 특이 특징부들이다. 추가적으로, 5년, Lung-RADS 1-2 예측 모델에 대한 특징부 중요도의 관점에서 상위 10개의 특징부들이 비-결절 특이 특징부들이다.
특정 실시 형태들에서, 이러한 위험 예측 모델(예컨대, 위험 예측 모델의 비-결절 특이 특징부들이 위험 예측 모델의 결절 특이 특징부들보다 더 높은 특징부 중요도 값들을 갖는 위험 예측 모델)은 1년, Lung-RADS 1 예측 모델이다. 예를 들어, 표 15에 도시된 바와 같이, 1년, Lung-RADS 1 예측 모델에 대한 특징부 중요도의 관점에서 상위 3개의 특징부들이 비-결절 특이 특징부들이다. 추가적으로, 1년, Lung-RADS 1 예측 모델에 대한 특징부 중요도의 관점에서 상위 5개의 특징부들이 비-결절 특이 특징부들이다. 추가적으로, 1년, Lung-RADS 1 예측 모델에 대한 특징부 중요도의 관점에서 상위 10개의 특징부들이 비-결절 특이 특징부들이다.
특정 실시 형태들에서, 이러한 위험 예측 모델(예컨대, 위험 예측 모델의 비-결절 특이 특징부들이 위험 예측 모델의 결절 특이 특징부들보다 더 높은 특징부 중요도 값들을 갖는 위험 예측 모델)은 3년, Lung-RADS 1 예측 모델이다. 예를 들어, 표 15에 도시된 바와 같이, 3년, Lung-RADS 1 예측 모델에 대한 특징부 중요도의 관점에서 상위 3개의 특징부들이 비-결절 특이 특징부들이다. 추가적으로, 3년, Lung-RADS 1 예측 모델에 대한 특징부 중요도의 관점에서 상위 5개의 특징부들이 비-결절 특이 특징부들이다. 추가적으로, 3년, Lung-RADS 1 예측 모델에 대한 특징부 중요도의 관점에서 상위 10개의 특징부들이 비-결절 특이 특징부들이다.
특정 실시 형태들에서, 이러한 위험 예측 모델(예컨대, 위험 예측 모델의 비-결절 특이 특징부들이 위험 예측 모델의 결절 특이 특징부들보다 더 높은 특징부 중요도 값들을 갖는 위험 예측 모델)은 5년, Lung-RADS 1 예측 모델이다. 예를 들어, 표 15에 도시된 바와 같이, 5년, Lung-RADS 1 예측 모델에 대한 특징부 중요도의 관점에서 상위 3개의 특징부들이 비-결절 특이 특징부들이다. 추가적으로, 5년, Lung-RADS 1 예측 모델에 대한 특징부 중요도의 관점에서 상위 5개의 특징부들이 비-결절 특이 특징부들이다. 추가적으로, 5년, Lung-RADS 1 예측 모델에 대한 특징부 중요도의 관점에서 상위 10개의 특징부들이 비-결절 특이 특징부들이다.
다양한 실시 형태들에서, 트레이닝된 위험 예측 모델은, 위험 예측 모델이 전개될 때, 트레이닝된 파라미터들의 세트가 대상체에 대한 암의 향후 위험의 예측을 생성하도록 이미지의 비-결절 특이 특징부들 및 결절 특이 특징부들의 값들을 변경하는데 사용되도록 트레이닝된 파라미터들의 세트를 포함한다. 따라서, 트레이닝된 위험 예측 모델의 트레이닝된 파라미터들의 세트가 트레이닝 단계 동안 설정된다. 예를 들어, 트레이닝된 파라미터들의 세트는 비-결절 특이 특징부들이 결절 특이 특징부들보다 더 비중있게 추가 위험 예측에 영향을 미치도록 설정된다. 다른 예로서, 트레이닝된 파라미터들의 세트는 결절 특이 특징부들이 비-결절 특이 특징부들보다 더 비중있게 추가 위험 예측에 영향을 미치도록 설정된다.
예를 들어, 위험 예측 모델이 신경망인 경우, 비-결절 특이 특징부들에 대응하는 신경망의 하나 이상의 노드들은 결절 특이 특징부들에 대응하는 신경망의 하나 이상의 노드들보다 더 큰 가중치(예컨대, 파라미터들)가 할당된다. 다른 예로서, 위험 예측 모델이 비-결절 특이 특징부들을 결절 특이 특징부들보다 더 비중있게 가중하는 랜덤 포레스트 모델인 경우.
다양한 실시 형태들에서, 위험 예측 모델들은 또한 그 향후 암의 위치를 예측하도록 트레이닝될 수 있다. 다양한 실시 형태들에서, 트레이닝 이미지들은 상이한 영역들로 분할되고, 따라서, 위험 예측 모델들의 트레이닝은 상이한 영역들에 따라 수행된다. 예시적인 상이한 영역들은 부피에 따라 3등분한 폐의 위, 중간, 아래 또는 개별적인 폐엽들을 포함할 수 있다. 통상의 기술자들에 의해 폐는 임의의 수의 구성들을 갖는 임의의 수의 영역들로 분할될 수 있음이 이해될 것이다. 위험 예측 모델들이 향후 암의 위치를 예측할 수 있게 하는 것은 영역 진단 평가와 같은 중재시술 및 흡입 및 기관지경 투여 약물들 및 디바이스들을 이용한 치료 중재시술의 선택을 가이드할 수 있다.
다양한 실시 형태들에서, 본 명세서에 개시된 위험 예측 모델들은 성능 메트릭을 달성한다. 예시적인 성능 메트릭들은 수신기 동작 곡선의 곡면하면적(AUC), 양의 예측 값, 및/또는 음의 예측 값을 포함한다. 다양한 실시 형태들에서, 본 명세서에 개시된 위험 예측 모델들은 적어도 0.5의 AUC 값을 나타낸다. 다양한 실시 형태들에서, 본 명세서에 개시된 위험 예측 모델들은 적어도 0.6의 AUC 값을 나타낸다. 다양한 실시 형태들에서, 본 명세서에 개시된 위험 예측 모델들은 적어도 0.7의 AUC 값을 나타낸다. 다양한 실시 형태들에서, 본 명세서에 개시된 위험 예측 모델들은 적어도 0.8의 AUC 값을 나타낸다. 다양한 실시 형태들에서, 본 명세서에 개시된 위험 예측 모델들은 적어도 0.9의 AUC 값을 나타낸다. 다양한 실시 형태들에서, 본 명세서에 개시된 위험 예측 모델들은 적어도 0.95의 AUC 값을 나타낸다. 다양한 실시 형태들에서, 본 명세서에 개시된 위험 예측 모델들은 적어도 0.99의 AUC 값을 나타낸다. 다양한 실시 형태들에서, 본 명세서에 개시된 위험 예측 모델들은 적어도 0.51, 적어도 0.52, 적어도 0.53, 적어도 0.54, 적어도 0.55, 적어도 0.56, 적어도 0.57, 적어도 0.58, 적어도 0.59, 적어도 0.60, 적어도 0.61, 적어도 0.62, 적어도 0.63, 적어도 0.64, 적어도 0.65, 적어도 0.66, 적어도 0.67, 적어도 0.68, 적어도 0.69, 적어도 0.70, 적어도 0.71, 적어도 0.72, 적어도 0.73, 적어도 0.74, 적어도 0.75, 적어도 0.76, 적어도 0.77, 적어도 0.78, 적어도 0.79, 적어도 0.80, 적어도 0.81, 적어도 0.82, 적어도 0.83, 적어도 0.84, 적어도 0.85, 적어도 0.86, 적어도 0.87, 적어도 0.88, 적어도 0.89, 적어도 0.90, 적어도 0.91, 적어도 0.92, 적어도 0.93, 적어도 0.94, 적어도 0.95, 적어도 0.96, 적어도 0.97, 적어도 0.98, 또는 적어도 0.99의 AUC 값을 나타낸다.
VI. 암의 향후 위험을 예측하기 위한 예시적인 방법
도 3은 일 실시 형태에 따라 환자 강화와 같은 사용을 위한 대상체에 대한 암의 향후 위험을 결정하기 위한 예시적인 흐름 프로세스이다. 단계(305)는 복수의 대상체들에 대해 향후 폐암 위험을 예측하는 것을 포함한다. 단계(305)는 복수의 대상체들에서 상이한 대상체들에 대해 반복적으로 수행될 수 있는 단계들(310, 320, 330, 340)을 포함한다.
단계(310)에서, 이미지가 대상체로부터 캡처된다. 다양한 실시 형태들에서, 이미지는 대상체로부터 캡처된 흉부 CT 스캔이다.
단계(320)에서, 특징부들이 이미지로부터 추출된다. 다양한 실시 형태들에서, 특징부들은 비-결절 특이 특징부들 및 결절 특이 특징부들 중 하나 또는 둘 모두를 포함한다.
단계(330)는 추출된 특징부들 중 하나 이상에 기초하여 대상체가 추가 위험 예측을 위한 후보 대상체인지 결정하는 것을 포함하는 옵션적인 단계이다. 다양한 실시 형태들에서, 단계(330)는 결절 특이 특징부들을 분석하여 대상체가 후보 대상체인지 결정하는 것을 포함한다. 예를 들어, 단계(330)는 결절 특이 특징부들을 분석하여 대상체가 폐 결절을 갖고 있지 않거나 또는 폐암을 갖지 않고 따라서, 암의 향후 위험 분석을 받을 자격이 있다고 결정하는 것을 포함할 수 있다.
단계(340)는 획득된 이미지의 추출된 특징부들을 분석하여 향후 암 위험을 예측하기 위한 위험 예측 모델을 적용하는 것을 포함한다. 다양한 실시 형태들에서, 위험 예측 모델은 비-결절 특이 특징부들 및 결절 특이 특징부들 둘 모두를 분석한다. 다양한 실시 형태들에서, 비-결절 특이 특징부들은 결절 특이 특징부들보다 더 높은 특징부 중요도 값들을 갖는다. 따라서, 비-결절 특이 특징부들은 결절 특이 특징부들과 비교하여 더 비중있게 향후 암 위험 예측에 영향을 미친다.
단계(350)는 예측된 향후 암 위험들을 이용하여 복수의 대상체들에 걸쳐 강화를 수행하는 것을 포함한다. 여기서, 일정 기간 내에 암을 발전시키는 것으로 예측된 대상체들은, 그것들의 예측된 향후 암 위험에 의해 표시된 바와 같이, 임상 시험의 등록을 위한 하나 이상의 환자 코호트에 포함될 수 있다. 요컨대, 이는 임상 시험에서의 감소된 수의 개인들의 등록을 가능하게 한다.
VII.
본 명세서에 기재된 방법들은 암의 향후 위험을 예측하기 위한 위험 예측 모델들을 구현하는 것을 포함한다. 다양한 실시 형태들에서, 대상체의 암은 다음 중 하나 이상을 포함할 수 있다: 림프종, B 세포 림프종, T 세포 림프종, 균상식육종, 호지킨병, 골수성 백혈병, 방광암, 뇌 암, 신경계 암, 두경부암, 두경부의 편평세포암종, 신장암, 폐암, 신경모세포종/교모세포종, 난소암, 췌장암, 전립선암, 피부암, 간암, 흑색종, 구강, 인후, 후두, 및 폐의 편평세포암종, 결장암, 자궁경부암, 자궁 암종, 유방암, 및 상피 암, 신장암, 비뇨생식암, 폐 암, 식도암종, 위암, 갑상선암, 두경부 암종, 큰 창자 암, 조혈 암, 고환암, 결장 및/또는 직장암, 자궁암, 또는 전립선암. 일부 실시 형태들에서, 대상체의 암은 방광암, 유방암, 결장암, 신장암, 폐암, 흑색종, 난소암, 췌장암, 전립선암, 직장암, 위암, 갑상선암, 또는 자궁암 중 어느 하나를 포함하는, 전이암일 수 있다. 특정 실시 형태들에서, 암은 폐암이다. 특정 실시 형태들에서, 암은 소세포 폐암, 비-소세포 폐암, 비-소세포암종, 선암종, 편평세포암, 대세포암종, 소세포암종, 복합소세포암종, 신경내분비종, 폐육종, 폐림프종, 기관지유암종 중 어느 하나를 포함하는 폐암의 일 유형이다.
다양한 실시 형태들에서, 본 명세서에 기재된 위험 예측 모델들은 폐암과 같은 암의 존재의 향후 위험을 예측한다. 다시 말해서, 위험 예측 모델들은 폐암과 같은 암의 존재 또는 부재의 위험에 대해 예측한다. 다양한 실시 형태들에서, 본 명세서에 기재된 위험 예측 모델들은 소세포 폐암, 비-소세포 폐암, 비-소세포암종, 선암종, 편평세포암, 대세포암종, 소세포암종, 복합소세포암종, 신경내분비종, 폐육종, 폐림프종, 기관지유암종 중 어느 하나를 포함하는 폐암의 하위유형의 향후 위험을 예측한다. 다시 말해서, 위험 예측 모델들은 기간(예컨대, 1, 3, 또는 5년) 내에 폐암의 특정 하위유형을 발전시킬 가능성으로서 대상체를 분류한다. 특정 실시 형태들에서, 위험 예측 모델들은 비-소세포 폐암 또는 소세포 폐암의 향후 위험을 예측한다.
VIII. 중재시술
본 명세서에 기재된 실시 형태들은 암의 향후 위험을 예측하기 위한 위험 예측 모델들을 구현하는 것을 포함한다. 다양한 실시 형태들에서, 암의 향후 위험 예측에 기초하여 대상체에 중재시술이 제공된다. 다양한 실시 형태들에서, 중재시술은 진단의 적용, 예방적 치료제의 적용, 또는 후속 행동 중 어느 하나일 수 있다. 예시적인 후속 행동들은 대상체가 암을 발전시키는지 확인하기 위한 대상체의 후속 테스팅을 포함할 수 있다. 후속 테스팅은 후속 생검(예컨대, 암 생검 또는 림프 노드 생검) 또는 후속 이미지 스캐닝(예컨대, CT 스캐닝, PET 스캐닝, MRI 스캐닝, 초음파 이미징, 또는 X-선 이미징) 중 임의의 것을 포함할 수 있다. 다양한 실시 형태들에서, 대상체의 후속 테스팅은 암의 향후 위험을 예측한 후에 다음 스케줄링된 방문 또는 사전결정된 양의 시간(예컨대, 1개월, 2개월, 3개월, 4개월, 5개월, 6개월, 7개월, 8개월, 9개월, 10개월, 11개월, 12개월, 18개월, 또는 24개월) 동안일 수 있다. 다양한 실시 형태들에서, 추가적인 후속 행동들은 대상체에서 발전한 암을 치료하기 위한 후속 행동들, 예컨대, 종양 절제, 기관지경 진단, 선택 및/또는 치료(들)의 투여, 약제적 조성물의 선택/투여, 또는 이들의 임의의 조합을 포함할 수 있다.
다양한 실시 형태들에서, 암의 예측된 향후 위험에 기초하여 치료제가 선택 및/또는 대상체에 투여될 수 있다. 선택된 치료제는 폐암과 같은 암을 지연 또는 방지할 가능성이 있다. 예시적인 치료제들은 화학요법, 에너지 요법(예컨대, 외부 빔, 마이크로웨이브, 고주파 절제, 근접치료, 전기천공, 동결절제, 광열절제, 레이저 요법, 광역학 요법, 전기소작, 화학색전술, 고강도 집속 초음파, 저강도 집속 초음파), 항원-특이적 단일클론 항체, 소염제, 종양용해 바이러스 요법, 또는 면역요법을 포함한다. 다양한 실시 형태들에서, 선택된 치료제는 에너지 요법이고 인가되는 에너지의 양(예컨대, 용량 및 지속시간)은 원하는 치료 효과를 달성하도록 맞춤조정될 수 있다. 다양한 실시 형태들에서 치료제는 저분자 또는 생물학적, 예컨대 사이토카인, 항체, 가용성 사이토카인 수용체, 안티센스 올리고핵산염, siRNA 등이다. 이러한 생물학적 제제는 생물학적 제제의 뮤테인 및 유도체를 포함하고, 유도체는, 예를 들어, 융합 단백질, PEGylated 유도체, 콜레스테롤 결합 유도체, 등을 해당 기술분야에서 공지된 바와 같이 포함할 수 있다. 또한 사이토카인의 길항제 및 사이토카인 수용체, 예컨대 트랩 및 단일클론 길항제가 포함된다. 또한 본 명세서에 제시된 활성제들과의 바이오시밀러 또는 생물학적동등 약제들이 포함된다.
폐암 치료제들은 도세탁셀(docetaxel), 시스플라틴(cisplatin), 카보플라틴(carboplatin), 젬시타빈(gemcitabine), Nab-파클리탁셀(Nab-paclitaxel), 파클리탁셀, 페메트렉시드(pemetrexed), 제피티닙(gefitinib), 엘로티닙(erlotinib), 브리가티닙(brigatinib)(알룬브릭®(Alunbrig®)), 카프마티닙(capmatinib)(타브렉타®(Tabrecta®)), 셀퍼카티닙(selpercatinib)((레테브모®(Retevmo®)), 엔트렉티닙(entrectinib)(로즐리트렉®(Rozlytrek®)), 롤라티닙(lorlatinib)(로브레나®(Lorbrena®)), 라로트렉티닙(larotrectinib)(비트락비®(Vitrakvi®)), 다코미티닙(dacomitinib)(비짐프로®(Vizimpro®)), 및 비노렐빈과 같은 화학요법을 포함할 수 있다. 폐암 치료제들은 더발루맙(durvalumab)(임핀지®(Imfinzi®)), 니볼루맙(nivolumab)(옵디보®(Opdivo®)), 펨브로리주맙(pembrolizumab)(키트루다®(Keytruda®)), 아테졸리주맙(atezolizumab)(티센트릭®(Tecentriq®)), 카나키누맙(canakinumab), 및 라무시루맙(ramucirumab)과 같은 항체 요법을 포함할 수 있다.
다양한 실시 형태들에서, 설명된 치료제들 중 하나 이상은 대상체를 치료하기 위한 조합 요법으로서 조합될 수 있다.
다양한 실시 형태들에서, 약제적 조성물은 전이암의 대상체 레벨 위험에 기초하여 대상체에 선택 및/또는 투여될 수 있고, 선택된 치료제는 암에 대해 효능을 보일 가능성이 높다. 개인에 투여된 약제적 조성물은 위에서 설명된 치료제와 같은 활성제를 포함한다. 활성 성분은 치료적 유효량, , 질병 또는 그로부터 매개된 의학적 병태를 치료하기 위해 투여될 때 충분한 양으로 존재한다. 조성물들은 또한 전달 및 효능을 향상시키는, 예컨대 활성 성분들의 전달 및 안정성을 향상시키는 다양한 다른 제제들을 포함할 수 있다. 따라서, 예를 들어, 조성물들은 또한, 원하는 제형에 따라, 약제적으로 수용가능한, 무독성 운반체 또는 희석제들을 포함할 수 있고, 이는 동물 또는 인간 투여를 위한 약제적 조성물들을 제제화하는데 공통적으로 사용되는 매개체로서 정의된다. 희석제는 조합의 생물학적 활성에 영향을 미치지 않도록 선택된다. 이러한 희석제들의 예들은 증류수, 완충수, 생리식염수, PBS, 링거액, 포도당액, 및 핸크 용액이다. 또한, 약제적 조성물 또는 제제는 다른 담체, 항원보강제, 또는 무독성, 비치료, 비면역원성 안정화제, 부형제 등을 포함할 수 있다. 조성물들은 또한 pH 조정 및 완충제, 독성 조절제, 습윤제 및 세제와 같은 생리학적 조건에 근사화하기 위한 추가적인 물질들을 포함할 수 있다. 조성물은 항산화제와 같은 다양한 안정화제들 중 임의의 것을 또한 포함할 수 있다.
본 명세서에 기재된 약제적 조성물들 또는 치료제들이 다양하고 상이한 방법들로 투여될 수 있다. 실시예들은 경구, 비강, 모듈내, 병변내, 직장, 국소, 복강내, 정맥, 근육내, 피부밑, 피하, 경피, 수막공간내, 기관지내, 가슴경유, 또는 두개내 방법을 통해 약제적으로 허용가능한 담체를 포함하는 조성물을 투여하는 것을 포함한다.
다양한 실시 형태들에서, 임상 반응은 위험 예측 모델들을 구현함으로써 대상체에 대해 생성된 암의 예측된 향후 위험에 기초하여 대상체에 제공될 수 있다. 다양한 실시 형태들에서, 임상 반응은 대상체의 행동을 변화시키기 위한 상담(예컨대, 위험을 낮추기 위해 금연에 관해 환자와 상담)을 제공, 악성 전환을 지연/방지, 종양 성장을 둔화 또는 질병의 확산(전이)을 방지할 수 있는 흡기/국소, 정맥 또는 소화관(입으로) 치료의 개시, 폴립에 대한 대장내시경으로 수행되는 것과 유사한 향후 위험에 대한 적응적 스크리닝 스케줄을 구축 (예컨대, 향후 폐암에 대해 더 높은 위험이 예측되는 개인들은 더 빈번한 추적 및 이미징을 받아야 함), 또는 폐암의 예측된 향후 위험을 확인하기 위한 추가 위험 예측 테스트를 수행하거나 또는 수행되도록 스케줄링하는 것을 포함할 수 있다(예컨대, 폐암에 대한 위험이 높다고 판단되는 사람들은 또한 그 위험을 확인하거나 또는 그 사람이 가장 위험한 암 유형을 좁히기 위한 추가 테스팅을 받을 수 있다. 다양한 실시 형태들에서, 추가 위험 예측 테스트는 혈액 기반 생물표지자 (폐암에 대해 공지된 위험인 비-특이적 염증을 찾기 위함), 대사/단백질체학/유전자 발현/유전자 서열분석을 포함할 수 있다. 환자는 기도에서의 유전자 발현의 변화를 보기 위해 조직(비강 상피, 기관지 상피 등)의 추가적인 샘플링을 받을 수 있다).
IX. 컴퓨터 구현예
암의 향후 위험을 예측하기 위한 위험 예측 모델들을 구현하는 방법들을 포함하는 본 발명의 방법들이 일부 실시 형태들에서, 하나 이상의 컴퓨터들에서 수행된다.
예를 들어, 위험 예측 모델의 구축 및 전개는 하드웨어 또는 소프트웨어, 또는 이 둘의 조합으로 구현될 수 있다. 본 발명의 일 실시 형태에서, 기계-판독가능 저장 매체가 제공되고, 매체는 기계 판독가능 데이터로 인코딩된 데이터 저장 재료를 포함하고, 이는, 상기 데이터를 이용하기 위한 명령어들로 프로그래밍된 기계를 이용할 때, 위험 예측 모델들의 트레이닝 또는 전개를 실행 및/또는 본 명세서에 개시된 데이터세트들 또는 결과들(예컨대, 대상체들에 대한 암의 향후 위험 예측들) 중 임의의 것을 디스플레이할 수 있다. 본 발명은 프로세서, 데이터 저장 시스템(휘발성 및 비휘발성 메모리 및/또는 저장 소자들을 포함), 그래픽 어댑터, 포인팅 디바이스, 네트워크 어댑터, 적어도 하나의 입력 디바이스, 및 적어도 하나의 출력 디바이스를 포함하는 프로그램가능 컴퓨터들에서 실행되는 컴퓨터 프로그램들에서 구현될 수 있다. 그래픽 어댑터에 디스플레이가 결합된다. 프로그램 코드는 전술된 기능들을 수행하고 출력 정보를 생성하기 위해 입력 데이터에 적용된다. 출력 정보는 하나 이상의 출력 디바이스들에 공지된 방식으로 적용된다. 컴퓨터는, 예를 들어, 종래 설계의 개인용 컴퓨터, 마이크로컴퓨터, 또는 워크스테이션일 수 있다.
각각의 프로그램은 컴퓨터 시스템과의 통신을 위하여 고급 절차적 또는 객체-지향적 프로그래밍 언어로 구현될 수 있다. 그러나, 프로그램들은, 원하는 경우, 어셈블리어 또는 기계어로 구현될 수 있다. 어느 경우든, 언어는 컴파일된 언어 또는 해석된 언어일 수 있다. 각각의 이러한 컴퓨터 프로그램은 바람직하게는, 전술된 절차들을 수행하기 위해 저장 매체 또는 디바이스가 컴퓨터에 의해 판독될 때 컴퓨터를 구성 및 동작시키기 위해, 범용 또는 특수목적 프로그램가능 컴퓨터에 의해 판독가능한 저장 매체 또는 디바이스(예컨대, ROM 또는 자기 디스켓)에 저장된다. 시스템은 또한 컴퓨터 프로그램으로 구성된 컴퓨터-판독가능 저장 매체로서 구현되도록 고려될 수 있고, 그렇게 구성된 저장 매체는 본 명세서에 기재된 기능들을 수행하기 위해 컴퓨터로 하여금 특별하고 사전정의된 방식으로 동작하게 한다.
서명 패턴들 및 그것들의 데이터베이스들이 그것들의 사용을 용이하게 하기 위해 다양한 매체에서 제공될 수 있다. "매체"는 본 발명의 서명 패턴 정보를 포함하는 제품을 지칭한다. 본 발명의 데이터베이스들은 컴퓨터 판독가능 매체, 예컨대 컴퓨터에 의해 직접 판독 및 액세스될 수 있는 임의의 매체에 기록될 수 있다. 이러한 매체는: 플로피 디스크, 하드 디스크 저장 매체, 및 자기 테이프와 같은 자기 저장 매체; CD-ROM과 같은 광학 저장 매체; RAM 및 ROM과 같은 전기 저장 매체; 및 자기/광학 저장 매체와 같은 카테고리들의 하이브리드를 포함하지만 이에 한정되지 않는다. 통상의 기술자는 현재 공지된 컴퓨터 판독가능 매체들 중 임의의 것이 어떻게 본 데이터베이스 정보의 기록을 포함하는 제품을 생성하는 데 사용될 수 있는지 쉽게 이해할 수 있다. "기록"은 해당 기술분야에서 공지된 바와 같이 임의의 이러한 방법들을 이용하여 컴퓨터 판독가능 매체에 정보를 저장하기 위한 프로세스를 지칭한다. 저장된 정보에 액세스하는 데 사용되는 수단에 기초하여, 임의의 간편한 데이터 저장 구조체가 선택될 수 있다. 다양한 데이터 프로세서 프로그램들 및 포맷들, 예컨대 워드 프로세싱 텍스트 파일, 데이터베이스 포멧 등이 저장에 사용될 수 있다.
일부 실시 형태들에서, 위험 예측 모델들을 구현함으로써 암의 향후 위험을 예측하기 위한 방법들을 포함하는 본 발명의 방법들은 분산 컴퓨팅 시스템 환경(예컨대, 클라우드 컴퓨팅 환경)에서 하나 이상의 컴퓨터들에서 수행된다. 이 설명에서, "클라우드 컴퓨팅"은 구성가능 컴퓨팅 리소스들의 공유 세트에 대한 주문형 네트워크 액세스를 가능하게 하는 모델로서 정의된다. 클라우드 컴퓨팅은 구성가능 컴퓨팅 리소스들의 공유 세트에 대한 주문형 액세스를 제공하도록 사용될 수 있다. 구성가능 컴퓨팅 리소스들의 공유 세트는 가상화를 통해 신속하게 발급되고 낮은 관리 노력 또는 서비스 사업자 상호작용으로 배포되고, 이어서 그에 따라 스케일링될 수 있다. 클라우드-컴퓨팅 모델은, 예를 들어, 주문형 셀프-서비스, 광범위 네트워크 액세스, 리소스 풀링, 신속한 탄력성, 도수제(measured service) 등과 같은 다양한 특징들로 구성될 수 있다. 클라우드-컴퓨팅 모델은 또한, 예를 들어, 서비스로서의 소프트웨어(Software as a Service, "SaaS"), 서비스로서의 플랫폼(Platform as a Service, "PaaS"), 서비스로서의 기반구조(Infrastructure as a Servic, "IaaS")와 같은 다양한 서비스 모델들을 노출시킬 수 있다. 클라우드-컴퓨팅 모델은 또한 프라이빗 클라우드, 커뮤니티 클라우드, 퍼블릭 클라우드, 하이브리드 클라우드 등과 같은 상이한 전개 모델들을 이용하여 전개될 수 있다. 본 명세서 및 청구범위에서, "클라우드-컴퓨팅 환경"은 클라우드 컴퓨팅이 사용되는 환경이다.
도 4는 도 1a, 도 1b, 도 2a, 도 2b, 및 도 3에 도시된 개체들을 구현하기 위한 예시적인 컴퓨터를 도시한다. 컴퓨터(400)는 칩셋(404)에 결합된 적어도 하나의 프로세서(402)를 포함한다. 칩셋(404)은 메모리 제어기 허브(420) 및 입력/출력(I/O) 제어기 허브(422)를 포함한다. 메모리(406) 및 그래픽 어댑터(412)는 메모리 제어기 허브(420)에 결합되고, 디스플레이(418)는 그래픽 어댑터(412)에 결합된다. 저장 디바이스(408), 입력 디바이스(414), 및 네트워크 어댑터(416)는 I/O 제어기 허브(422)에 결합된다. 컴퓨터(400)의 다른 실시 형태들이 상이한 아키텍처들을 갖는다.
저장 디바이스(408)는 하드 드라이브, 컴팩트 디스크 판독전용 메모리(CD-ROM), DVD, 또는 솔리드-스테이트 메모리 디바이스와 같은 비일시적 컴퓨터-판독가능 저장 매체이다. 메모리(406)는 프로세서(402)에 의해 사용되는 명령어들 및 데이터를 유지한다. 입력 인터페이스(414)는 터치-스크린 인터페이스, 마우스, 트랙볼, 또는 다른 유형의 포인팅 디바이스, 키보드, 또는 이들의 일부 조합이고, 데이터를 컴퓨터(400)에 입력하는 데 사용된다. 일부 실시 형태들에서, 컴퓨터(400)는 사용자의 제스처들을 통해 입력 인터페이스(414)로부터 입력(예컨대, 커맨드들)을 수신하도록 구성될 수 있다. 네트워크 어댑터(416)는 컴퓨터(400)를 하나 이상의 컴퓨터 네트워크들에 결합시킨다.
그래픽 어댑터(412)는 디스플레이(418) 상에 이미지 및 기타 정보를 디스플레이한다. 다양한 실시 형태들에서, 디스플레이(418)는 사용자(예컨대, 방사선과의사, 종양전문의, 호흡기내과의)는 사용자 선택을 디스플레이(418) 상에서 입력하여, 예를 들어, 환자에 대한 위험 예측을 개시하고, 임의의 추가적인 검사들 또는 시술들을 지시 및/또는 위험 예측 모델들에 대한 파라미터들을 설정하도록 구성된다. 일 실시 형태에서, 디스플레이(418)는 터치 인터페이스를 포함할 수 있다. 다양한 실시 형태들에서, 디스플레이(418)는 대상체에 대한 하나 이상의 암의 향후 위험 예측들을 나타낼 수 있다. 따라서, 디스플레이(418)에 액세스하는 사용자는 대상체에게 대상체에 대해 예측된 암의 향후 위험에 관해 통지할 수 있다. 다양한 실시 형태들에서, 디스플레이(418)는 대상체에 대한 암의 향후 위험 예측에 가장 비중있게 기여하는 특징부들과 같은 정보를 나타낼 수 있다. 예를 들어, 암의 향후 위험을 갖는 것으로 예측된 대상체는 주로 중심소엽 폐기종에 의해 점유되는 대상체의 폐의 백분율로 인한 것일 수 있다. 따라서, 특징부의 식별 및/또는 특징부의 값(예컨대, 중심소엽 폐기종에 의해 점유되는 대상체의 폐의 백분율)은 디스플레이(418) 상에서 사용자 예컨대, 임상의사 사용자에게 도시될 수 있다. 다양한 실시 형태들에서, 대상체에 대한 암의 향후 위험 예측에 가장 비중있게 기여한 상위 1개, 상위 2개, 상위 3개, 상위 4개, 상위 5개, 상위 6개, 상위 7개, 상위 8개, 상위 9개, 또는 상위 10개의 특징부들이 디스플레이(418) 상에 도시될 수 있다. 상위 기여 특징부들을 디스플레이하는 것은 암의 향후 위험 예측을 이끈 특징부들을 이해하는 데 있어서 사용자 예컨대, 임상의사 사용자에게 맥락을 제공할 수 있다. 환자 프로파일, CT 이미지들, 생성된 위험 평가 및 임의의 기타 관련 정보는 메모리에 저장되어 환자 정보/결과가 임의의 주어진 시간에 액세스가능할 수 있도록 할 수 있다.
컴퓨터(400)는 전술된 기능들을 제공하기 위해 컴퓨터 프로그램 모듈들을 실행하도록 구성된다. 본 명세서에 사용된 바와 같이, 용어 "모듈"은 특정 기능을 제공하는 데 사용되는 컴퓨터 프로그램 로직을 지칭한다. 따라서, 모듈은 하드웨어, 펌웨어, 및/또는 소프트웨어로 구현될 수 있다. 일 실시 형태에서, 프로그램 모듈들은 저장 디바이스(408)에 저장되고, 메모리(406)로 로딩되고, 프로세서(402)에 의해 실행된다.
도 1a 또는 도 1b의 개체들에 의해 사용되는 컴퓨터들(400)의 유형들은 실시예 및 개체에 의해 요구되는 프로세싱 전력에 따라 달라질 수 있다. 예를 들어, 암 예측 시스템(130)은 단일 컴퓨터(400) 또는 서버 팜에서와 같은 네트워크를 통해 서로 통신하는 다중 컴퓨터들(400)에서 실행될 수 있다. 컴퓨터들(400)은 그래픽 어댑터(412), 및 디스플레이(418)와 같은, 전술된 컴포넌트들 중 일부가 없을 수 있다.
X. 시스템
암의 향후 위험을 예측하기 위한 위험 예측 모델들을 구현하기 위한 시스템들이 본 명세서에 추가로 개시되어 있다. 다양한 실시 형태들에서, 이러한 시스템은 적어도 도 1a에 전술된 암 예측 시스템(130)을 포함할 수 있다. 다양한 실시 형태들에서, 암 예측 시스템(130)은, 도 4에 설명된 예시적인 컴퓨터(400)를 구비한 컴퓨터 시스템과 같은, 컴퓨터 시스템으로서 구현된다.
다양한 실시 형태들에서, 시스템은 도 1a에서 전술된 이미징 디바이스(120)와 같은 이미징 디바이스를 포함한다. 다양한 실시 형태들에서, 시스템은 암 예측 시스템(130)(예컨대, 컴퓨터 시스템) 및 이미징 디바이스 둘 모두를 포함한다. 이러한 실시 형태들에서, 암 예측 시스템(130)은 대상체로부터 캡처된 이미지들(예컨대, CT 스캔)을 수신하도록 이미징 디바이스(120)와 통신가능하게 결합될 수 있다. 컴퓨터 시스템은 인 실리코에서, 위험 예측 모델들을 구현하여 이미지들을 분석하고 대상체에 대한 폐암의 향후 위험을 결정한다.
XI. 추가 실시예
정상 조직 복구에서 제어되지 않는 세포 성장 및 암으로의 전이를 표시하는 가장 초기의 분자 변화를 결정하기 위한 광범위한 조사가 있었다. 이 작업의 많은 부분은 흡연으로 인한 폐 손상에 누가 가장 회복력있거나 또는 민감한지 식별하는 데 초점을 맞추었다. 이러한 손상 패턴들은 날숨 기류 폐쇄를 야기하는 원위의 작은 기도 질환, 폐 실질의 폐기종 파괴, 콜라겐 및 흉터 조직의 이상 침착(사이질 변화 및 섬유증) 및 폐 혈관 리모델링을 포함한다. 이러한 폐 손상의 패턴들의 일부 혼합의 발전, 감수성의 모든 고유 소견들이 폐암을 발전시킬 위험을 증가시킨다는 것이 점점 더 명확해진다.
관찰적 연구는 날숨 기류 폐쇄(COPD - 만성 폐쇄성 폐질환의 정의된 특징)를 발전시키는 흡연자들은 향후 폐암에 대한 위험이 증가한다는 것을 반복적으로 입증하였다. 그 위험은 그들의 원위 공간의 폐기종 파괴를 갖는 COPD가 있는 사람들에게서 추가로 증가된다. 추가적인 조사는 사이질 폐질환 및 폐 섬유증(다른 형태의 흡연 관련 폐 손상)을 폐암의 위험 증가와 연관시켜, 만성 손상 및 수리를 특징으로 하는 조건들이 악성종양을 야기할 수 있다는 일반적인 논쟁을 다시 뒷받침하였다. 마지막으로, 또한 질병 위험이 높은 사람들을 식별할 수 있는 근육 쇠약과 같은 만성 담배 연기 노출에 대한 감수성의 폐외 소견이 있는데, 가능하게도 그 이유는 근육조직과 암 사이의 직접적인 연결 때문일 뿐만 아니라 또한 제지방량 및 골격 근육조직의 손실이 이미 손상된 폐로부터 흘러 넘친 염증의 반영일 수 있기 때문이다. 만성 담배 연기 노출로 인한 손상의 모든 이러한 폐 및 폐외 소견들이 컴퓨터 단층촬영(CT) 이미징에서 검출가능하다.
본 개시내용은 다음의 설명 및 첨부된 도면을 참조하여 이해될 수 있다. 본 개시내용은 의학적 이미지 분석에 전문적 의견을 통합하고 국가폐암검진연구(NLST)에서 획득된 의학적 이미지들로부터 추출된 메트릭들에 향상된 머신 러닝 기술들을 적용한 시스템 및 방법에 관한 것이다. 이러한 의학적 이미지들로부터 추출된 특징부들은 향후 폐암을 예측하는 위험 모델을 생성하는 데 사용된다. 특히, 위험 모델은 향후 폐암의 위험이 증가한 흡연자들을 식별하는 데 사용될 수 있는 특징부들의 패턴/혼합을 식별한다.
국가폐암검진연구(NLST)는 연간 CT 스캐닝이 폐암으로 인한 사망을 감소시킬 수 있는지 결정하기 위한 무작위대조시험이었다. 본 조사를 추진한 주요 가설은 CT 이미징이 치료 및 치유가 더 잘 들을 수 있는 더 빠른 병기(또는 더 작은 크기의 결절)에서 암을 검출할 더 높은 해상도의 인-비보(in-vivo) 데이터를 제공한다는 것이었다. 조사는 대략 53,000명의 흡연자들을 동원하여, 절반은 연간 CT 스캐닝에 무작위로 배정하고 나머지 절반은 연간 흉부 X-선(CXR)에 무작위로 배정했다. 연간 CT 스캐닝을 받은 흡연자들은 대략 20%의 폐암으로 인한 사망률 감소를 경험하였다. 이러한 흥미로운 결과들은 폐암 스크리닝 CT가 예방의학의 보상 부분이 되는 보건의 변화를 이끌었다.
NLST CT 스캔 및 임상 데이터는 이제 생의학 커뮤니티에 자유롭게 이용가능하고, 15,000명의 개인들로부터 기준선(T0), 1년(T1) 및 2년(T2) CT 스캔이 획득되었다. 예시적인 실시 형태에 따라, 이미지 분석 알고리즘이 모든 이러한 스캔들에 적용되어 폐기종, 사이질 변화, 보존된 폐 조직 및 가슴 근육 크기(면적)의 측정치를 추출하였으며, 후자 근육 측정은 신체 조성 또는 제지방량에 대한 대용물로서 사용된다. 일 실시 형태에서, 15,000 T0 CT 스캔을 반으로 나눠 데이터의 전용 트레이닝 세트(n=7,500) 및 데이터의 테스팅 세트(n=7,500)를 구축하였다. CT 이미지들로부터 추출된 객관적인 특징부들뿐만 아니라 시각적으로 확인된 결절들 및 그것들의 특징들(크기, 형상 등)의 주관적인 보고서를 이용하여, 향후 폐암을 예측하기 위한 견고한 모델을 생성하였다. 모델 전략은 원하는 결과를 예측하기 위해 트레이닝 데이터에서 결정 트리를 개발 및 최적화하는 랜덤 포레스트 접근법에 기초하였다. 질병의 특정 부담에 대한 고정된 임계치(즉 >10% 폐기종 또는 >10% 사이질 변화)를 선택하기 보다는 이러한 접근법을 사용하였는데, 그 이유는 폐암의 위험 증가를 식별하는 폐기종, 사이질 변화 및 근감소증의 거의 확실한 여러 조합들이 있기 때문이다. 예를 들어, 자신의 폐의 25%를 폐기종으로 갖는 흡연자는 2% 폐기종, 12% 사이질 변화 및 감소된 가슴 근육 영역을 갖는 흡연자와 동일한 향후 폐암의 위험 증가를 가질 수 있다.
랜덤 포레스트-기반 모델들을 독립적으로 트레이닝시켜서 NLST에 등록된 흡연자들의 향후 폐암의 1, 3 및 5년 위험을 예측하였다. 이어서 T0 CT 스캔 상에서 성행하는(이미 존재하는) 암을 갖는 사람들을 식별하기보다는 발생(신규) 암의 예측을 가능하게 하도록 이러한 모델들을 수정하였다. 이 최종 단계는 CT 이미지 내의 임의의 폐 결절들의 특징부들을 설명하는 시각적 데이터를 활용하였다. 예시적인 실시 형태들은 랜덤 포레스트-기반 모델들을 도시하고 설명하고 있지만, 통상의 기술자들에 의해, 예를 들어, 로지스틱 회귀 및 XGBoost와 같은 다른 모델링 접근법들이 또한 활용될 수 있음이 이해될 것이다. 위험 예측 모델들은 구체적으로 1, 3 및 5년 위험 예측들을 제공하는 것으로 도시되고 설명되어 있지만, 예측 용어들은 원하는 대로 달라질 수 있음이 또한 통상의 기술자들에 의해 이해될 것이다.
폐암의 생애는 가장 일반적으로 폐 결절의 발달로 시작된다. 이 결절은 암성일 수 있거나 또는 후속적으로 악성 전환을 겪는 조직의 양성 과도성장일 수 있다. 방사선 커뮤니티는 이러한 과정을 인식하고, 의료 관리를 표준화하려는 시도에서, 그것들의 암일 가능성에 따라 CT 스캔 시 발견된 결절들의 단계를 구분하는 점수 시스템을 개발하였다. 이 스테이징 시스템은 폐 CT 스크리닝, 리포팅 및 데이터 시스템(Lung CT screening, Reporting and Data System, LungRADS)으로 불리고, 결절의 크기, 결절의 성장 속도 및 결절의 외관에 기초한다. 일반적으로, 결절이 클수록, 그것의 성장이 더 빠르거나 또는 외관이 더 불규칙할수록, 암이 될 가능성이 더 많다.
일 실시 형태에서, LungRADS 점수 시스템을 이용하여 T0 스캔의 시기에 성행하는 암을 가질 확률이 가장 높은 사람들을 위험 모델로부터 제거하였다. 이를 위해, 가장 높은 LungRADS 점수(4A, 4B 및 4X)를 갖는 사람들은 이 특정 분석에서 배제하고(그러나 다른 모델들에는 포함됨) 향후에 암이 될 수 있는 더 작은, 더 낮은 위험 결절들(2 및 3)을 갖는 사람들은 유지하였다. LungRADS 4 결절들을 갖은 모든 사람들을 배제한 후에 1, 3 및 5년 위험 예측을 위한 모델들을 재트레이닝시키고 이어서 NLST의 테스팅 서브 코호트(n=7,500)에 적용하였다.
방사선 특징부들의 조합은 여전히 폐암을 발전시키는 10+% 절대 3-년 위험을 갖는 사람들을 식별할 수 있다. 또한, 이 사람들의 대략 1/3은 기준선 T0 스캔 상에서 결절을 갖지 않았고, 이 모델들은 어느 결절들이 암으로 될 수 있는지 예측하는 것이 아니라 어느 사람들이 결절을 발전시키고 이어서 폐암으로 진단될 수 있는지 예측한다고 시사한다. 이러한 접근법을 이용하여 일련의 위험 예측 모델들을 생성하였다. 이 모델들은 암까지의 시간(1, 3 및 5년 위험) 뿐만 아니라 배제된 결절들의 특성에 따라 달라졌다. 이러한 진술은 따라서 LungRADS 4A, 4B 및 4X를 포함하는 LungRADS 병기들에 걸쳐 모든 모델들을 포함한다.
혈관 및 기도 석회화, 폐 혈관 형태 및 골 미네랄 밀도와 같은 추가적인 방사선 특징부들은 또한 향후 폐암을 예측하는 데 사용될 수 있는 질병 감수성의 고유 메트릭들을 나타낼 수 있다. 결절 특이 특징부들은 또한 이러한 모델들에 통합될 수 있다. 결절 특이 특징부들은, 예를 들어, 결절 위치, 폐기종에 대한 근접성 및 사이질 변화, 결절 특징들의 변화율(규범적 표준에 절대적 및 상대적 둘 모두)을 포함할 수 있다.
추가적인 실시 형태에서, 이러한 이미지-기반 모델들은 위험 평가 및 결절 분별을 위해 더 포괄적인 생물표지자 패널들에 통합될 수 있다. 이 패널들은 단백질체학, 유전학, 유전자 발현, 세포 유리 순환 종양 DNA 등을 포함하지만 이에 한정되지 않고, 조합 및 고도로 민감하고 특정한 마커들에 대해 최적 모델 성능이 이루어질 수 있는 것으로 예상된다.
이러한 위험 예측 모델들은 CT 이미지로부터 추출된 객관적 및 주관적 특징부들의 혼합에 대해 예측된다. 광범위한 이전 조사는 CT에 대한 객관적이지만 주관적이지 않은 특징부들은 CT 스캐너 브랜드, 생성 및 이미지 재구성 소프트웨어에 따라 달라진다고 시사한다. 대상체들 사이의 질병의 부담에서의 추가적인 지리적 변동성은 유해 노출에 대한 실제 차이(즉 일부 사람들은 노출로부터의 손상에 더 민감하거나 덜 민감할 수 있고 폐 조직에서 폐기종 또는 사이질 변화를 발전시킬 가능성이 더 높거나 더 낮음)를 반영할 수 있다. 이러한 이유들로, 질병의 CT 메트릭들의 존재 및 중증도를 결정하기 위한 절대 임계치들을 사용하지 않았다. 대신에, 테스트 서브 코호트의 데이터는 각각의 공동변수에 대해 평균을 빼고 표준편차로 나눔으로써 각각 정규화되었다. 모델 정제를 위해 추가 코호트들이 집합됨에 따라, 데이터 정규화는 모든 기존 데이터를 이용하여 수행(교차 코호트)되거나 또는 환자 특이적 생물학, 노출 이력, 민족 또는 프로세싱되는 의학적 이미지의 유형을 반영하기에 최선이라고 생각되지만 이에 한정되지 않는 것들을 포함하는 데이터의 서브세트들을 선택할 것이다. 정규화되면, 데이터를 모델링을 위한 랜덤 포레스트-기반 접근법에 사용하였다.
일 실시 형태에서, 객관적인 특징부들은, 예를 들어, 폐 실질 특징부들(예컨대, 폐 실질의 밀도 측정 및 폐 실질의 사이질 변화의 측정) 및 근육조직/흉벽의 신체 조성 측정을 포함한다. 폐 실질의 밀도 측정은, 예를 들어, (i) -950 하운스필드 단위(Hounsfield Units, HU) 미만의 감쇠를 갖는 면적/부피로서 정의되는 낮은 감쇠 영역(LAA), (ii) -600HU 내지 -250 HU의 감쇠를 갖는 폐의 면적/부피로서 정의되는 높은 감쇠 영역(HAA)에 의해 점유된 폐의 백분율, 및 폐 윗부분에서의 LAA와 폐 아랫부분에서의 LAA 사이의 비율을 포함할 수 있다. 폐 실질의 사이질 변화의 측정은 폐 실질의 국부적 히스토그램 측정들, 예를 들어, 정상 조직, 중심소엽 폐기종, 중심소엽 결절, 간유리음영, 벌집모양, 선형 흉터, 결절형, 그물형, 흉막하선, 기타 폐기종 및/또는 낭종에 의해 점유된 폐의 백분율을 포함한다. 근육조직/흉벽의 신체 조성 측정은, 예를 들어, 대흉근 단면적, 소흉근 단면적, 대흉근 제지방 단면적, 소흉근 제지방 단면적, 좌측 또는 우측 대흉근 또는 소흉근의 집합 단면적, 및 피하지방 단면적을 포함할 수 있다.
NLST의 데이터를 이용하여 트레이닝된 위험 예측 모델들은 다중 모드 위험 평가 및 강화 접근법을 제공한다. 예를 들어, NLST에 등록한 지 3년 내에 암을 발전시킨 2명의 환자를 고려한다. 둘 모두 기준선의 Lung-RADS 3 결절들을 갖고 있었고, 둘 모두 알고리즘에 의해 3년 내에 암을 발전시킬 것으로 예측되었고 둘 모두 3년 내에 병기 IA 선암종을 발전시켰다. 실제로, 두 환자 모두에 대해 암을 발전시킬 확률 예측은 서로의 2% 이내 였다(환자 1에 대해 84.8% 및 환자 2에 대해 86.4%). 환자 1은 76갑년(pack year) 흡연 이력, 23.5의 BMI, 상대적으로 작은 가슴근육량, 및 상당히 상엽 지배적 폐기종(국부적 히스토그램 분석에 기초하여 부피 기준으로 31% 폐기종)이 있는 65세 백인 여성 전 흡연자였다. 76갑년 흡연 이력은 76년동안 매일 한 갑(20)의 담배를 피우거나 또는 38년동안 하루에 두 갑을 피운 것과 같다. 대조적으로, 환자 2는 43갑년 흡연 이력, 29.8의 BMI, 상대적으로 보존된 가슴근육량, 및 최소 폐기종(국부적 히스토그램 분석에 기초하여 부피 기준으로 2.6% 폐기종)이 있지만, 상당히 더 많은 사이질 특징부들(4%에 비교하여 7.1%)을 갖는 59세 중년 백인 여성 전 흡연자였다. 이 제2 경우에 3년 내에 암의 발전을 예측하는 알고리즘으로 이어질 가능성이 있는 것은 이 마지막 특징부 및 사이질 특징부들과 암 사이의 강한 관계이다. 이 두 가지 경우 사이의 임상 및 방사선 차이는 암을 발전시킬 가능성이 있는 구별되고 상이한 표현형들을 갖는 환자들을 식별하는 위험 예측 모델들의 능력을 강조한다.
추가적인 실시 형태에 따라, 사람별로 향후 암의 위험을 예측하는 데 사용되는 모델들은 또한 향후 암의 위치를 예측하는 데 사용될 수 있다. 일 실시 형태에서, 데이터를 3등분하여 부피뿐만 아니라 폐엽에 따라 폐의 상부, 중부, 하부 3부분을 나타낸다. 모델 트레이닝 및 테스팅이 수행될 수 있고 향후 폐암의 영역별(1/3만큼의 부피 및 폐엽에 따라) 위험이 계산될 수 있다. 이러한 추가적인 데이터는 집중적 영역별 진단 평가 및 흡기 및 기관지경 투여 약물들 및 디바이스들을 이용한 치료 중재시술을 가능하게 한다. 통상의 기술자들에 의해 폐는 임의의 수의 구성들을 갖는 임의의 수의 영역들로 분할될 수 있음이 이해될 것이다.
본 개시내용의 예시적인 실시 형태에 따른 시스템은 환자의 폐의 CT 이미지에 기초하여 향후 폐암의 위험을 예측한다. 시스템은 사용자 인터페이스, 디스플레이, 및 메모리와 함께 프로세서를 포함할 수 있다. 프로세서는, 위에 기재된 바와 같이, 위험 예측 모델들을 포함하고, 이는 향후에 암을 발전시킬 가능성에 대한 환자별 평가를 제공할 수 있다. 위험 예측 모델들은, 예를 들어, 프로세서에 의해 실행되는 코드의 라인들로서, 프로세서에 의해 실행되는 펌웨어로서, 주문형 집적회로(ASIC) 등인 프로세서의 기능으로서, 프로세서에 의해 구현될 수 있다. 또한 시스템이 단일 프로세서, 사용자 인터페이스, 디스플레이 및 메모리를 포함하는 컴퓨팅 시스템을 포함하는 것으로 도시되고 설명되어 있지만, 시스템은 컴퓨팅 시스템들의 네트워크로 구성될 수 있고, 이들의 각각은 전술한 컴포넌트들 중 하나 이상을 포함한다는 것이 통상의 기술자들에 의해 이해될 것이다. 일 예에서, 위험 예측 모델들은 네트워크의 중앙 프로세서를 통해 실행될 수 있고, 이는 다수의 상이한 사용자 스테이션들을 통해 액세스가능하다. 대안적으로, 위험 예측 모델들은 하나 이상의 프로세서들을 통해 실행될 수 있다.
향후 암에 대한 위험을 생성 시 사람들을 식별하도록 생성된 위험 예측 모델들은 고위험 개인들의 암 방지 및 치료에 집중된 임상 시험들을 가능하게 할 뿐만 아니라, 어떤 사람들이 암의 가장 이른 병기에서 암을 검출하기 위해 가장 공격적인 추적 및 스크리닝을 받아야 하는지 식별함으로써 임상 치료를 가능하게 할 것이다. 환자별 위험 평가는 하나 이상의 컴퓨팅 스테이션들의 디스플레이 상에서 사용자에게 출력 및 디스플레이될 수 있다. 환자별 위험 평가는 다양한 구성들 중 임의의 것으로 제공될 수 있다. 위험 평가는 위험의 예측 레벨 및/또는 위험에 대한 타임프레임(예컨대, 1, 3 및 5년 위험)을 포함할 수 있다. 일 실시 형태에서, 모델링 데이터의 시각화를 가능하게 하기 위해, CT 스캔은 사람에 따라 그리고 영역에 따라 컬러 코딩될 것이다. 가장 높은 위험을 갖는 영역들은 적색으로 채색될 것이다. 중간 위험 영역들은 황색이 될 것이고 저위험 영역들은 녹색이 될 것이다. 이것의 결과는 향후 폐암에 대해 저위험의 사람은 그들의 전체 폐 이미지를 녹색으로 음영되게 할 수 있는 반면, 향후 폐암에 대해 고위험인 사람들은 적색(고위험에 대응), 황색(중간 위험) 및 녹색(저위험)의 영역들을 구비한 CT 이미지를 가질 수 있다는 것이다. 예를 들어, 이러한 컬러-코딩된 맵들은 (임상 해석을 돕기 위해) 흉부 방사선과의사를 위한 영상의학 판독실의 디스플레이뿐만 아니라 표적 치료법에 대해 호흡기내과의, 종양전문의 및 시술자에 의해 사용되는 이미지 기반 워크스테이션의 디스플레이 상에 제시될 수 있다. 일 실시 형태에 따라, 이 맵들은 사용 사례 및 시각화 모드에 기초하여 3가지 색상뿐만 아니라 적색에서 녹색으로 색상의 연속적인 구배를 이용하여 생성될 것이다. 그러나, 생성된 맵이 향후 폐암의 예측된 위험을 사용자에게 나타내는 한 맵들은 다양한 색상들 및 구성들 중 임의의 것을 이용하여 생성될 수 있음이 통상의 기술자들에 의해 이해될 것이다.
사용자(예컨대, 방사선과의사, 종양전문의, 호흡기내과의)는 사용자 선택을 사용자 인터페이스 상에 입력하여, 예를 들어, 환자에 대한 위험 예측을 개시하고, 임의의 추가적인 검사들 또는 시술들을 지시 및/또는 위험 예측 모델들에 대한 파라미터들을 설정할 수 있다. 사용자 인터페이스는, 예를 들어, 키보드 및/또는 마우스와 같은 입력 디바이스들을 포함할 수 있다. 일 실시 형태에서, 사용자 인터페이스는 디스플레이 상에서 인에이블되는 터치 인터페이스를 포함할 수 있다. 환자 프로파일, CT 이미지들, 생성된 위험 평가 및 임의의 기타 관련사항은 메모리에 저장되어 환자 정보/결과가 사용자를 통해 임의의 주어진 시간에 액세스가능할 수 있도록 할 수 있다.
이미지 기반 위험 예측은 폐암의 1, 3 및 5년 위험에 대한 예측들을 포함할 수 있다. 이러한 일련의 모델들은 임상 시험을 가능하게 함으로써 폐암에 대한 예방 요법 및 궁극적으로 임상 치료를 개발하는 데 사용될 것이다. 이벤트 발생률(향후 폐암)이 배경발생률보다 높아서 더 작은 코호트 크기를 가능하게 하고 치료될 필요가 있는 환자들의 수를 잠재적으로 감소시키기 때문에, 임상 시험은 폐암의 한가지 경우를 감소시키는 데 더 효율적이고 실현가능할 것이다. 폐암의 방지를 위해 효과적인 치료법의 식별 후에, 이 모델은 임상 시험의 외부에서 임상 치료의 생물표지자로서 치료로 가장 수혜를 받을 수 있는 사람들을 식별하는 데 사용될 수 있다. 모든 치료들은 어느 정도의 위험을 수반하기 때문에, 누가 폐암을 발전시킬 가능성이 가장 높은지 아는 것은 개인의 치료의 구현에 대한 위험/이익 결정 분석 및 비용지급에 영향을 미칠 것이다.
추가적인 실시 형태에 따라, 위험 예측 모델들은 선암종 및 편평세포암종을 포함하는 폐암의 세포 유형들에 대해 상이한 위험을 식별하기 위한 기초를 제공할 수 있다. 이러한 차이들은 암이 발생하는 세포 유형에 기초하고 치료 방법들에 관련된 결정들 및 환자 결과들에 영향을 미치는 경향이 있을 수 있다.
본 명세서에 기재된 위험 예측 모델들은 환자 레벨에 따라 폐암을 발전시킬 확률을 제공한다. 이 모델들은 그 개인의 폐암의 향후 위치를 예측하기 위해 폐 감수성의 영역별 메트릭들을 이용하여 수정될 수 있다. 폐암을 진단, 치료 및 예방하는 데 기관지경 시술이 점점 더 활용될 수 있기 때문에, 폐암이 발생할 폐엽 및 폐엽의 영역에 대한 지식은 의심스러운 병변 또는 결절의 진단 생검 및/또는 악성 전환을 방지하기 위한 치료의 국소 투여를 용이하게 할 것이다.
본 명세서에 기재된 위험 예측 모델들은 또한 치료법의 선택 및 의학적 의사 결정에 사용될 수 있다. 모든 사람들의 질환 발전 및 사망의 경쟁적인 위험이 존재한다. 예를 들어, 흡연자들은 폐암, 심장 질환 또는 뇌혈관 질환을 발전시킬 수 있는데, 이들은 모두 공격적이 생명에 위협이 될 수 있다. 본 명세서에서 상세하게 설명하고 있는 위험 예측 모델들은 다른 기존 임상적으로 활용되는 위험 모델들 예컨대, 프레이밍햄 심장 연구 위험 점수(Framingham Heart Study Risk Score)(향후 심장 질환을 예측)와 통합되어 환자 건강을 유지하는 방법에 대한 더 총체적인 평가를 제공하고 그들에게 그들의 가장 긴급한 건강 관리 필요에 대해 알려줄 수 있다.
시스템의 프로세서는 환자의 CT 이미지를 프로세싱하여 실질 손상 및 신체 조성에 관련된 특징부들을 추출한다. 추가적인 모델링은 이러한 특징부들의 목록을 확장하여 다른 데이터(혈관 및 기도 석회화, 폐 혈관 형태, 골 미네랄 밀도뿐만 아니라 성장 속도 및 폐기종 및 사이질 변화 둘 모두에 대한 근접도와 같은 결절 특이 특징부들을 포함하지만, 이에 한정되지 않음)를 포함한다는 것에 유의한다. 데이터는 대상체 레벨에 따라 트레이닝 세트에서 수집된 CT 특징부들의 분포를 이용하여 정규화된다. 이 트레이닝 세트는 상이한 지리적 영역들, 노출 및 종양 생물학을 나타내는 다수의 코호트들을 포함할 것이다. 랜덤 포레스트의 활용은 (사람별 및 폐 영역별) 향후 폐암의 위험을 예측하는 위험 예측 모델을 생성하였다. 일 실시 형태에서 향후 암의 영역별 위험에 기초한 폐의 컬러 코딩(향후 암의 고위험, 중간위험 및 저위험을 나타내는 적색, 황색 및 녹색)을 포함할 수 있는 위험 평가는 디스플레이 상에서 사용자에게 디스플레이될 수 있다.
방법을 포함하는 추가 실시 형태들이 본 명세서에 개시되어 있고, 방법은: 환자의 폐의 CT 이미지로부터 특징부들을 추출하는 단계; 환자의 폐의 CT 이미지로부터 추출된 특징부들을 포함하는 데이터를 정규화하는 단계; 및 위험 예측 모델을 이용하여, 폐암의 향후 위험의 예측을 포함하는 위험 평가를 생성하는 단계를 포함한다. 다양한 실시 형태들에서, 위험 평가는 향후 암의 영역별 위험에 기초한, 환자의 폐의 컬러-코딩된 이미지를 포함한다. 다양한 실시 형태들에서, 위험 예측 모델은 폐암의 위험 증가를 나타내는 폐 특징부들의 패턴 및 혼합 중 하나를 식별한다. 다양한 실시 형태들에서, 추출된 특징부들은 폐기종, 사이질 변화, 보존된 폐 이슈 및 가슴 근육 크기의 측정치들 중 하나를 포함한다.
시스템이 추가적으로 본 명세서에 개시되며, 시스템은: 실행가능 프로그램을 저장하는 비일시적 컴퓨터 판독가능 저장 매체; 및 실행가능 프로그램을 실행하는 프로세서를 포함하고, 실행가능 프로그램은 프로세서로 하여금: 환자의 폐의 CT 이미지로부터 특징부들을 추출하고; 환자의 폐의 CT 이미지로부터 추출된 특징부들을 포함하는 데이터를 정규화하고; 위험 예측 모델을 이용하여, 폐암의 향후 위험의 예측을 포함하는 위험 평가를 생성하게 하도록 한다.
실시예
하기는 본 발명을 수행하기 위한 특정 실시 형태들의 실시예들이다. 실시예들은 예시적인 목적만을 위해 제공되며 본 발명의 범주를 어떠한 방식으로도 제한하려고 의도되지 않는다. 사용된 숫자(예컨대, 양, 온도 등)에 관련하여 정확성을 보장하기 위한 노력이 실행되었지만, 일부 실험 오차 및 편차는 허용되어야 한다.
실시예 1: 위험 예측 모델들의 구축 및 분석의 요약
국가폐암검진연구(NLST) 코호트로부터의 컴퓨터 단층촬영(CT) 이미지들을 분석하여 상이한 향후 수평적 시점들에 걸쳐(예컨대, 1년 내, 3년 내, 또는 5년 내) 환자들의 암의 가능성을 예측하였다. 암의 예측된 향후 위험을 이용하여 폐암의 발달에 대해 강화된 환자들의 집단을 식별하였다.
국가폐암검진연구(NLST)는 연간 CT 스캐닝이 폐암으로 인한 사망을 감소시킬 수 있는지 결정하기 위한 무작위대조시험이었다. 본 조사를 추진한 주요 가설은 CT 이미징이 치료 및 치유가 더 잘 들을 수 있는 더 빠른 병기(또는 더 작은 크기의 결절)에서 암을 검출할 더 높은 해상도의 인-비보(in-vivo) 데이터를 제공한다는 것이었다. 조사는 대략 53,000명의 흡연자들을 동원하여, 절반은 연간 CT 스캐닝에 무작위로 배정하고 나머지 절반은 연간 흉부 X-선(CXR)에 무작위로 배정했다. 연간 CT 스캐닝을 받은 흡연자들은 대략 20%의 폐암으로 인한 사망률 감소를 경험하였다. 이러한 흥미로운 결과들은 폐암 스크리닝 CT가 예방의학의 보상 부분이 되는 보건의 변화를 이끌었다.
NLST CT 이미지들 및 임상 데이터는 생의학 커뮤니티에 이제 자유롭게 이용가능하고 CT 스캔이 획득되었다. 전체 인구 통계 및 전체 환자의 상세사항들이 표 2에 도시되어 있다. 이미지 분석 알고리즘이 CT 이미지들에 적용되어 폐기종, 사이질 변화, 보존된 폐 조직 및 가슴 근육 크기(면적)와 같은 특징부들을 추출하였으며, 후자 근육 측정은 신체 조성 또는 제지방량에 대한 대용물로서 사용된다. CT 스캔을 반으로 분할하여 데이터의 전용 트레이닝 세트 및 데이터의 테스팅 세트를 구축하였다. CT 이미지들로부터 추출된 객관적인 특징부들(예컨대, 비-결절 특이 특징부들)뿐만 아니라 시각적으로 확인된 결절들의 주관적인 특징부들 및 그것들의 특징들(예컨대, 결절 크기, 형상 등과 같은 결절 특이 특징부들)을 이용하여, 향후 폐암을 예측하기 위한 견고한 모델을 생성하였다.
특징부들(예컨대, 변수들)을 CT 이미지들로부터 추출하였다. 포함된 특징부들은 이전 경험에 기초하여 그리고 가능성있는 생물학적 관련성에 기초하여 선택되었다.
아래 실시예 2 내지 실시예 11에 기재된 위험 예측 모델들에 대해, 다음의 비-결절 특이 특징부들이 사용된다:
1) 폐 실질의 밀도 측정
a. 점유된 폐의 백분율:
i. 낮은 감쇠 영역(LAA), 이는 -950 하운스필드 단위(HU) 미만의 감쇠를 갖는 면적/부피로서 정의됨.
ii. 높은 감쇠 영역(HAA), 이는 -600 HU 내지 -250 HU의 감쇠를 갖는 폐의 면적/부피로서 정의됨.
b. 폐 윗부분의 LAA 대 폐 아랫부분의 LAA의 비율(Ratio LAA)
2) 근육조직/흉벽의 신체 조성 측정
a. 대흉근 단면적
b. 소흉근 단면적
c. 대흉근 제지방 단면적
d. 소흉근 제지방 단면적
e. 피하지방 단면적(축방향 또는 관상)
3) 폐 실질의 국부적 히스토그램 측정들
a. 점유된 폐의 백분율:
i. 정상 조직
ii. 중심소엽 폐기종
iii. 중심소엽 결절
iv. 간유리음영
v. 벌집모양
vi. 선형 흉터
vii. 결절형
viii. 그물형
ix. 흉막하선
x. 기타 폐기종
xi. 낭포
아래 실시예 2 내지 실시예 6에 기재된 위험 예측 모델들에 대해, 하기 결절-특이 특징부들은 다음을 포함한다:
1) 감쇠
2) 마진 설명
3) 직경
4) 폐 CT 스크리닝, 리포팅 및 데이터 시스템(Lung-RADS) 점수
아래 실시예 7 내지 실시예 11에 설명된 위험 예측 모델들의 경우, 하기 라디오믹 특징부들(예컨대, 결절-특이 특징부들)을 원래 CT 이미지, 웨이블렛 변환 CT 이미지, 및 가우시안 변환 CT 이미지로부터 추출하였다.
1) 1차 통계
2) 3D 형상 기반 특징부들
3) 2D 형상 기반 특징부들
4) 그레이 레벨 동시발생 행렬
5) 그레이 레벨 반복 길이 행렬
6) 그레이 레벨 크기 영역 행렬
7) 이웃 그레이 톤 차이 행렬
8) 그레이 레벨 의존성 행렬.
구체적으로 사용된 특징부들은 임상적 특징들을 포함하지 않는데, 이는 전체 코호트의 임상적 특징들이 NLST 특징들임을 의미한다. 폐암 예측 카테고리에 의한 임상적 특징들이 아래 도시되어 있다.
위험 예측 모델들은 CT 이미지로부터 추출된 객관적인(예컨대, 비-결절 특이) 및 주관적인(예컨대, 결절 특이) 특징부들의 혼합에 대해 예측된다. CT에 대한 객관적이지만 주관적이지 않은 특징부들은 CT 스캐너 브랜드, 생성 및 이미지 재구성 소프트웨어에 따라 달라진다. 대상체들 사이의 질병의 부담에서의 추가적인 지리적 변동성은 유해 노출에 대한 실제 차이(즉 일부 사람들은 노출로부터의 손상에 더 민감하거나 덜 민감할 수 있고 폐 조직에서 폐기종 또는 사이질 변화를 발전시킬 가능성이 더 높거나 더 낮음)를 반영할 수 있다. 이러한 이유들로, 질병의 CT 메트릭들의 존재 및 중증도를 결정하기 위한 절대 임계치들을 사용하지 않았다. 대신에, 테스트 서브 코호트의 데이터는 각각의 공동변수에 대해 평균을 빼고 표준편차로 나눔으로써 각각 정규화되었다. 모델 정제를 위해 추가 코호트들이 집합됨에 따라, 데이터 정규화는 모든 기존 데이터를 이용하여 수행(교차 코호트)되거나 또는 환자 특이적 생물학, 노출 이력, 민족 또는 프로세싱되는 의학적 이미지의 유형을 반영하기에 최선이라고 생각되지만 이에 한정되지 않는 것들을 포함하는 데이터의 서브세트들을 선택할 것이다. 정규화되면, 데이터를 모델링을 위한 랜덤 포레스트-기반 접근법에 사용하였다.
데이터의 전처리를 먼저 수행하였다. 이는 (예컨대, 중앙화(평균을 뺌)하고 스케일링(표준편차로 나눔)함으로써) 연속적인 특징부들의 정규화 값들을 포함하였다. 테스트 세트의 정규화는 트레이닝 세트로부터의 정보만을 이용하여 수행하였다. 즉, 트레이닝 세트 평균 및 표준편차를 이용하여 트레이닝 세트 및 테스트 세트 둘 모두를 정규화하였다. 추가적으로, 대다수 분류(암 없음)의 전처리 포함 다운 샘플링은 불균형 데이터를 고려하기 위해, 즉 암 진단이 상대적으로 통상적이지 않다는 사실을 고려하기 위해 수행되었다. SMOTE 및 ROSE와 같은 대안적인 접근법들이 고려되었지만 더 높은 컴퓨팅 요건들을 갖는 다운 샘플링과 유사한 성능을 가졌다.
다수의 모델링 접근법들을 평가하여 로지스틱 회귀, XGBoost 및 랜덤 포레스트를 포함하는 위험 예측 모델을 구축하였다. 랜덤 포레스트-기반 모델들을 독립적으로 트레이닝시켜서 NLST에 등록된 흡연자들의 향후 폐암의 1, 3 및 5년 위험을 예측하였다. 모델 전략은 원하는 결과를 예측하기 위해 트레이닝 데이터에서 결정 트리를 개발 및 최적화하는 랜덤 포레스트 접근법에 기초하였다. 질병의 특정 부담에 대한 고정된 임계치(즉 >10% 폐기종 또는 >10% 사이질 변화)를 선택하기 보다는 이러한 접근법을 사용하였는데, 그 이유는 폐암의 위험 증가를 식별하는 폐기종, 사이질 변화 및 근감소증의 거의 확실한 여러 조합들이 있기 때문이다. 예를 들어, 자신의 폐의 25%를 폐기종으로 갖는 흡연자는 2% 폐기종, 12% 사이질 변화 및 감소된 가슴 근육 영역을 갖는 흡연자와 동일한 향후 폐암의 위험 증가를 가질 수 있다. 이어서 CT 스캔 상에서 성행하는(이미 존재하는) 암을 갖는 사람들을 식별하기보다는 발생(신규) 암의 예측을 가능하게 하도록 이러한 모델들을 수정하였다. 이 최종 단계는 CT 이미지 내의 임의의 폐 결절들의 특징부들을 설명하는 시각적 데이터를 활용하였다. 예시적인 실시 형태들은 랜덤 포레스트-기반 모델들 및 그래디언트 부스트 모델들을 도시하고 설명하고 있지만, 통상의 기술자들에 의해, 예를 들어, 로지스틱 회귀와 같은 다른 모델링 접근법들이 또한 활용될 수 있음이 이해될 것이다. 위험 예측 모델들은 구체적으로 1, 3 및 5년 위험 예측들을 제공하는 것으로 도시되고 설명되어 있지만, 예측 용어들은 원하는 대로 달라질 수 있음이 또한 통상의 기술자들에 의해 이해될 것이다.
위험 예측 모델을 구축하기 위해, 코호트를 트레이닝 및 테스팅 그룹들로 50/50 분할하였다. 모델들은 테스팅 그룹에 대해 트레이닝되었고, 3회 반복된 10배 교차 검증을 이용하여 튜닝이 수행되었다. 예측된 확률의 이분화는 교차 샘플링된 트레이닝 코호트에서 F-점수를 최대화함으로써 수행되었다. 모델링된 결과들은 1, 3 및 5년에서의 암의 진단을 포함하였다. 성능 측정 및 시각화는 모든 시점에 대한 ROC 곡선 및 강화의 표현을 포함한다(하기 실시예들에 기재된 바와 같음). 3년 암 예측에 기초한 강화 및 비-강화된 코호트의 누적 발생 함수 및 인구 통계는 또한 하기 실시예들에 예측/도시되어 있다.
모델들을 구축하여 환자들의 전체 코호트 또는 환자들의 서브그룹에 대해 암의 향후 위험을 예측하였다. 환자들의 서브그룹들을 Lung-RADS < 4B, <4A, <3 및 <2로 등급/카테고리화된 기준선에 있는 결절들을 기초로 하여 카테고리화하였다. Lung-RADS < 4B는 Lung-RADS 1-4A로 카테고리화된 환자들을 포함한다. Lung-RADS <4A는 Lung_RADS 1-3으로 카테고리화된 환자들을 포함한다. Lung-RADS <3은 Lung_RADS 1-2로 카테고리화된 환자들을 포함한다. Lung-RADs <2는 Lung_RADS 1로 카테고리화된 환자들을 포함한다. 표 1은 상이한 Lung-RADS 분류들에 대한 특징들을 요약한다. 전체 코호트의 인구학적 정보 및 환자 특징들(Lung-RADS 분류 포함)이 표 2에 도시되어 있다.
환자들의 각각의 서브그룹에 대해 개별적인 위험 예측 모델들이 생성되었다. 즉, 명시된 성능은 진술된 서브그룹에 단순히 적용되는 전체 코호트의 모델의 성능이 아니라, 그 서브그룹의 환자들에 대해 트레이닝되었던 서브그룹 특정 모델의 성능이다.
아래 실시예들에 도시된 바와 같이, 모든 결과들은 트레이닝 코호트에서 개발/트레이닝되고 테스팅 코호트에 적용된 모델들에 기초한 성능/결과들을 나타낸다. 강화 표에서, 각각의 시간 수평선(1년, 3년, 및 5년)에 대한 위험 예측 모델은 별도로 트레이닝되었는데, 그 이유는 1년 암 위험에 대한 가장 중요한 특징부들이 3년 및 5년 암 위험에 대한 가장 중요한 특징부들과 반드시 같은 것은 아니기 때문이다. 이는 3년에서의 누적 발생이, 예를 들어, 단순히 윗줄(1년)에서의 누적 발생에 간격 숫자들의 사례들을 더하는 것이 아님을 의미한다.
누적 발생 함수 선도들을 해석할 때, y축 상의 원시 확률들은 중도절단 및 사망으로 인해 설정된 위험의 변화에 의해 상당히 영향을 받는다. 이러한 선도들은 서브그룹에 따라 그것들의 형상의 변화를 입증하기 위해 주로 포함된다. 특히 유의할 것은 더 크고/더 많은 관련 결절들을 배제함으로써, 첫해 암 진단에 덜 급격한 증가가 있다는 사실이다.
수신자 조작 특성(ROC) 곡선들 및 곡면하면적(AUC) 값들을 검토할 때, 이들은 주로 그들의 친숙성 및 문헌에서의 사용을 고려하여 참조를 위해 포함된다는 점에 유의한다. 모델들은 (예컨대, "튜닝된 위험 예측 모델"로 지칭됨) 정확도 재현율 곡선 아래 면적으로 튜닝되었기 때문에, ROC 아래 면적은 튜닝 프로세스로 현저하게 개선되지 않는다.
등록에 대한 잠재적 적격성을 고려할 때, Lung-RADS 기준에 기초하여, 4A 및 4B 결절들을 갖는 개인들은 조기 평가를 보장할 것임을 유의한다. 그러나, 둘 모두, 특히 4A의 상당한 백분율은 성행하는 암이 아닐 것이며 따라서 향후 발생 암의 잠재적 연구에 등록될 가능성이 잠재적으로 있을 수 있다.
상대 등록 비율 및 백분율은 Lung-RADS 서브그룹의 비율을 등록하기 위한 CT 스크린이다. 절대 등록 백분율은 전체 코호트의 크기에 기초한다.
실시예 2: Lung-RADS 1-4B에 대한 향후 위험 예측
실시예 1에 기재된 방법들을 이용하여 전체 환자 코호트를 이용하여 3가지 개별 모델들을 구성하였다. 구체적으로, 제1 모델은 1년, Lung-RADS 1-4B 위험 예측 모델이고, 제2 모델은 3년, Lung-RADS 1-4B 위험 예측 모델이고, 제3 모델은 5년, Lung-RADS 1-4B 위험 예측 모델이다. 각각의 위험 예측 모델에 대해, 트레이닝 세트(예컨대, 코호트의 50%)를 이용하여 위험 예측 모델을 트레이닝하였고 테스팅 세트(예컨대, 코호트의 나머지 50%)를 이용하여 위험 예측 모델을 테스트하였다.
1년, 3년, 및 5년 위험 예측 모델들의 각각에 대해 상위 10개의 중요한 특징부들이 표 3에 도시되어 있다. 특히, 1년 위험 예측 모델의 중요한 특징부들 중 대부분은 결절-특이 특징부들을 포함하는 반면, 3년 및 5년 위험 예측 모델의 중요한 특징부들의 대부분은 객관적인 특징부들(예컨대, 신체 및/또는 폐 실질의 특징부들과 같은 비-결절 특이 특징부들)이다.
특히, 1년, Lung-RADS 1-4B 예측 모델의 경우, 특징부 중요도의 관점에서 상위 3개의 특징부들이 결절 특이 특징부들이다. 추가적으로, 1년, Lung-RADS 1-4B 예측 모델에 대한 특징부 중요도의 관점에서 상위 5개의 특징부들 중 4개가 결절 특이 특징부들이다. 추가적으로, 1년, Lung-RADS 1-4B 예측 모델에 대한 특징부 중요도의 관점에서 상위 10개의 특징부들 중 6개가 비-결절 특이 특징부들이다. 3년, Lung-RADS 1-4B 예측 모델의 경우, 특징부 중요도의 관점에서 상위 3개의 특징부들 중 2개가 결절 특이 특징부들이다. 추가적으로, 3년, Lung-RADS 1-4B 예측 모델에 대한 특징부 중요도의 관점에서 상위 5개의 특징부들 중 3개가 결절 특이 특징부들이다. 추가적으로, 3년, Lung-RADS 1-4B 예측 모델에 대한 특징부 중요도의 관점에서 상위 10개의 특징부들 중 6개가 비-결절 특이 특징부들이다. 5년, Lung-RADS 1-4B 예측 모델의 경우, 특징부 중요도의 관점에서 상위 3개의 특징부들 중 2개가 결절 특이 특징부들이다. 추가적으로, 5년, Lung-RADS 1-4B 예측 모델에 대한 특징부 중요도의 관점에서 상위 5개의 특징부들 중 3개가 비-결절 특이 특징부들이다. 추가적으로, 5년, Lung-RADS 1-4B 예측 모델에 대한 특징부 중요도의 관점에서 상위 10개의 특징부들 중 7개가 비-결절 특이 특징부들이다.
도 5a는 환자들의 Lung-RADS 1-4B에 걸쳐 1년 내의 암의 가능성을 예측하기 위한 위험 예측 모델의 수행을 도시한다. 기본 랜덤 포레스트 위험 예측 모델은 0.92의 AUC 값을 나타낸 반면, 튜닝된 랜덤 포레스트 위험 예측 모델은 0.90의 AUC 값을 나타내었다. 도 5b는 환자들의 Lung-RADS 1-4B에 걸쳐 3년 내의 암의 가능성을 예측하기 위한 위험 예측 모델의 수행을 도시한다. 기본 랜덤 포레스트 위험 예측 모델은 0.79의 AUC 값을 나타낸 반면, 튜닝된 랜덤 포레스트 위험 예측 모델은 0.79의 AUC 값을 나타내었다. 추가적으로, 표 4는 3년 위험 예측 모델에 의해 결정된 암 예측에 따라 환자들의 Lung-RADS 1-4B의 특징들을 문서화하고 있다.
도 5c는 환자들의 Lung-RADS 1-4B에 걸쳐 5년 내의 암의 가능성을 예측하기 위한 위험 예측 모델의 수행을 도시한다. 기본 랜덤 포레스트 위험 예측 모델은 0.74의 AUC 값을 나타낸 반면, 튜닝된 랜덤 포레스트 위험 예측 모델은 0.74의 AUC 값을 나타내었다. 요컨대, 도 5a 내지 도 5c의 결과들은 상이한 위험 예측 모델들이 구성 및 전개되어 상이한 향후 수평적 시점들에 걸쳐 환자들의 Lung-RADS 1-4B들에서 암의 가능성을 예측할 수 있음을 나타낸다.
도 5d는 환자들의 Lung-RADS 1-4B에 걸친 3년 누적 발생 함수를 도시한다. 여기서, 위험 예측 모델은 450명의 환자들에 대해 암을 예측하였고, 다른 6643명의 환자들에 대해 암이 없음을 예측하였다. 이것이 환자들의 Lung-RADS 1-4B(이는 가장 위험한 폐암 결절들을 포함함, 예컨대, Lung-RADS 4A/4B)를 포함한다는 것을 고려하면, 450명의 예측된 암 환자들에 대한 누적 발생 함수는 후속 몇 년간의 낮은 발생률과 비교하여 초기 몇 달간(예컨대, 0 내지 6개월)의 더 높은 발생률을 반영한다.
표 5는 1년, 3년, 또는 5년 위험 예측 모델들로부터의 향후 암 예측들을 이용한 전체 환자 코호트의 강화 결과들을 도시한다. 구체적으로, 표 5는 원래 코호트에서 암의 배경 발생률(표 5에서 "널 모델"로 지칭됨)과 비교하여 위험 예측 모델들의 강화 결과들을 도시한다. 위험 예측 모델들의 적용은 누적 발생(표 5의 마지막 컬럼)을 상당히 개선한다.
구체적으로, 1년 모델의 경우, 배경 발생률("널 모델")은 1.79의 누적 발생을 갖는다(예컨대, 코호트의 환자들 중 1.79%가 1년 내에 암으로 진단됨). 1년 위험 예측 모델("랜덤 포레스트")을 적용하는 것은 환자 강화를 가능하게 하는데, 이는 19.72의 누적 발생을 달성한다(예컨대, 1년 위험 예측 모델의 예측으로 인한 코호트에 포함된 환자들 중 19.72%가 1년 내에 암으로 진단됨). 따라서, 1년 위험 예측 모델의 적용은 누적 발생에서 11배 증가를 달성한다.
3년 모델의 경우, 배경 발생률("널 모델")은 4.2의 누적 발생을 갖는다(예컨대, 코호트의 환자들 중 4.2%가 3년 내에 암으로 진단됨). 3년 위험 예측 모델("랜덤 포레스트")을 적용하는 것은 환자 강화를 가능하게 하는데, 이는 26.44의 누적 발생을 달성한다(예컨대, 3년 위험 예측 모델의 예측으로 인한 코호트에 포함된 환자들 중 26.44%가 3년 내에 암으로 진단됨). 따라서, 3년 위험 예측 모델의 적용은 누적 발생에서 6.3배 증가를 달성한다.
5년 모델의 경우, 배경 발생률("널 모델")은 5.58의 누적 발생을 갖는다(예컨대, 코호트의 환자들 중 5.58%가 5년 내에 암으로 진단됨). 5년 위험 예측 모델("랜덤 포레스트")을 적용하는 것은 환자 강화를 가능하게 하는데, 이는 28.43의 누적 발생을 달성한다(예컨대, 5년 위험 예측 모델의 예측으로 인한 코호트에 포함된 환자들 중 28.43%가 5년 내에 암으로 진단됨). 따라서, 5년 위험 예측 모델의 적용은 누적 발생에서 5.1배 증가를 달성한다.
요컨대, 표 5는 Lung-RADS 1-4B 환자들을 강화하여, 임상 시험에 등록될 필요가 있는 환자들의 수를 감소시키기 위한 다양한 위험 예측 모델이 구현될 수 있음을 나타낸다.
실시예 3: Lung-RADS 1-4A 환자들에 대한 향후 위험 예측
실시예 1에 기재된 방법들을 이용하여 Lung-RADS 1-4A 환자들을 이용하여 3가지 개별 모델들을 구성하였다. 구체적으로, 제1 모델은 1년, Lung-RADS 1-4A 위험 예측 모델이고, 제2 모델은 3년, Lung-RADS 1-4A 위험 예측 모델이고, 제3 모델은 5년, Lung-RADS 1-4A 위험 예측 모델이다. 각각의 위험 예측 모델에 대해, 트레이닝 세트(예컨대, 코호트의 50%)를 이용하여 위험 예측 모델을 트레이닝하였고 테스팅 세트(예컨대, 코호트의 나머지 50%)를 이용하여 위험 예측 모델을 테스트하였다.
1년, 3년, 및 5년 위험 예측 모델들의 각각에 대해 상위 10개의 중요한 특징부들이 표 6에 도시되어 있다. 특히, 1년 위험 예측 모델의 상위 10개의 특징부들 중 5개는 결절-특이 특징부들을 포함하는 반면, 3년 및 5년 위험 예측 모델의 중요한 특징부들의 대부분은 객관적인 특징부들(예컨대, 신체 및/또는 폐 실질의 특징부들과 같은 비-결절 특이 특징부들)이다.
구체적으로, 1년, Lung-RADS 1-4A 예측 모델의 경우, 특징부 중요도의 관점에서 상위 3개의 특징부들이 결절 특이 특징부들이다. 추가적으로, 1년, Lung-RADS 1-4A 예측 모델에 대한 특징부 중요도의 관점에서 상위 5개의 특징부들 중 4개가 결절 특이 특징부들이다. 추가적으로, 1년, Lung-RADS 1-4A 예측 모델에 대한 특징부 중요도의 관점에서 상위 10개의 특징부들 중 5개가 결절 특이 특징부들이다.
3년, Lung-RADS 1-4A 예측 모델의 경우, 특징부 중요도의 관점에서 상위 3개의 특징부들 중 2개가 결절 특이 특징부들이다. 추가적으로, 3년, Lung-RADS 1-4A 예측 모델에 대한 특징부 중요도의 관점에서 상위 5개의 특징부들 중 4개가 결절 특이 특징부들이다. 추가적으로, 3년, Lung-RADS 1-4A 예측 모델에 대한 특징부 중요도의 관점에서 상위 10개의 특징부들 중 5개가 결절 특이 특징부들이다.
5년, Lung-RADS 1-4A 예측 모델의 경우, 특징부 중요도의 관점에서 상위 3개의 특징부들 중 2개가 결절 특이 특징부들이다. 추가적으로, 5년, Lung-RADS 1-4A 예측 모델에 대한 특징부 중요도의 관점에서 상위 5개의 특징부들 중 3개가 비-결절 특이 특징부들이다. 추가적으로, 5년, Lung-RADS 1-4A 예측 모델에 대한 특징부 중요도의 관점에서 상위 10개의 특징부들 중 8개가 비-결절 특이 특징부들이다.
도 6a는 Lung-RADS 1-4A 환자들에 걸친 1년 내의 암의 가능성을 예측하기 위한 위험 예측 모델의 수행을 도시한다. 기본 랜덤 포레스트 위험 예측 모델은 0.81의 AUC 값을 나타낸 반면, 튜닝된 랜덤 포레스트 위험 예측 모델은 0.85의 AUC 값을 나타내었다. 도 6b는 Lung-RADS 1-4A 환자들에 걸친 3년 내의 암의 가능성을 예측하기 위한 위험 예측 모델의 수행을 도시한다. 기본 랜덤 포레스트 위험 예측 모델은 0.73의 AUC 값을 나타낸 반면, 튜닝된 랜덤 포레스트 위험 예측 모델은 0.72의 AUC 값을 나타내었다. 추가적으로, 표 7은 3년 위험 예측 모델에 의해 결정된 암 예측에 따라 환자들의 Lung-RADS 1-4A 코호트의 특징들을 문서화하고 있다.
도 6c는 Lung-RADS 1-4A 환자들에 걸친 5년 내의 암의 가능성을 예측하기 위한 위험 예측 모델의 수행을 도시한다. 기본 랜덤 포레스트 위험 예측 모델은 0.73의 AUC 값을 나타낸 반면, 튜닝된 랜덤 포레스트 위험 예측 모델은 0.72의 AUC 값을 나타내었다. 요컨대, 도 6a 내지 도 6c의 결과들은 상이한 위험 예측 모델들이 구성 및 전개되어 상이한 향후 수평적 시점들에 걸쳐 Lung-RADS 1-4A 환자 코호트들에서 암의 가능성을 예측할 수 있음을 나타낸다. 다시 말해서, 가장 높은 위험 환자들(예컨대, Lung-RADS 4B)이 제거되었더라도, 위험 예측 모델은 여전히 더 낮은 위험 환자들(예컨대, Lung-RADS 1-4A)에서 암의 향후 위험의 가능성을 정확하게 예측할 수 있다.
도 6d는 Lung-RADS 1-4A 환자들에 걸친 3년 누적 발생 함수를 도시한다. 여기서, 위험 예측 모델은 392명의 환자들에 대해 암을 예측하였고, 다른 6531명의 환자들에 대해 암이 없음을 예측하였다. 환자들의 코호트가 Lung-RADS 4B 환자들을 배제함을 고려하면, 실시예 2(도 5d에 도시됨)와 비교하여, 도 6d에 도시된 392명의 예측된 암 환자들에 대한 누적 발생 함수는 초기 몇 달간(예컨대, 0 내지 6개월)의 더 낮은 발생률(예컨대, 더 적은 성행하는 암 또는 T0 CT 스캔의 시점에 존재하는 더 적은 암)을 반영한다.
표 8은 1년, 3년, 또는 5년 위험 예측 모델들로부터의 향후 암 예측들을 이용한 Lung-RADS 1-4A 환자 코호트의 강화 결과들을 도시한다. 구체적으로, 표 8은 원래 코호트에서 암의 배경 발생률(표 8에서 "널 모델"로 지칭됨)과 비교하여 위험 예측 모델들의 강화 결과들을 도시한다. 위험 예측 모델들의 적용은 누적 발생(표 8의 마지막 컬럼)을 상당히 개선한다.
구체적으로, 1년 모델의 경우, 배경 발생률("널 모델")은 0.98의 누적 발생을 갖는다(예컨대, 코호트의 환자들 중 0.98%가 1년 내에 암으로 진단됨). 1년 위험 예측 모델("랜덤 포레스트")을 적용하는 것은 환자 강화를 가능하게 하는데, 이는 7.48의 누적 발생을 달성한다(예컨대, 1년 위험 예측 모델의 예측으로 인한 코호트에 포함된 환자들 중 7.48%가 1년 내에 암으로 진단됨). 따라서, 1년 위험 예측 모델의 적용은 누적 발생에서 7.6배 증가를 달성한다.
3년 모델의 경우, 배경 발생률("널 모델")은 3.28의 누적 발생을 갖는다(예컨대, 코호트의 환자들 중 3.28%가 3년 내에 암으로 진단됨). 3년 위험 예측 모델("랜덤 포레스트")을 적용하는 것은 환자 강화를 가능하게 하는데, 이는 16.84의 누적 발생을 달성한다(예컨대, 3년 위험 예측 모델의 예측으로 인한 코호트에 포함된 환자들 중 26.44%가 3년 내에 암으로 진단됨). 따라서, 3년 위험 예측 모델의 적용은 누적 발생에서 5.1배 증가를 달성한다.
5년 모델의 경우, 배경 발생률("널 모델")은 4.65의 누적 발생을 갖는다(예컨대, 코호트의 환자들 중 4.65%가 5년 내에 암으로 진단됨). 5년 위험 예측 모델("랜덤 포레스트")을 적용하는 것은 환자 강화를 가능하게 하는데, 이는 17.97의 누적 발생을 달성한다(예컨대, 5년 위험 예측 모델의 예측으로 인한 코호트에 포함된 환자들 중 17.97%가 5년 내에 암으로 진단됨). 따라서, 5년 위험 예측 모델의 적용은 누적 발생에서 3.9배 증가를 달성한다.
요컨대, 표 8은 Lung-RADS 1-4A 코호트에서 환자들을 강화하여, 임상 시험에 등록될 필요가 있는 환자들의 수를 감소시키기 위한 다양한 향후 위험 예측 모델이 구현될 수 있음을 나타낸다.
실시예 4: Lung-RADS 1-3 환자들에 대한 향후 위험 예측
실시예 1에 기재된 방법들을 이용하여 Lung-RADS 1-3 환자들을 이용하여 3가지 개별 모델들을 구성하였다. 구체적으로, 제1 모델은 1년, Lung-RADS 1-3 위험 예측 모델이고, 제2 모델은 3년, Lung-RADS 1-3 위험 예측 모델이고, 제3 모델은 5년, Lung-RADS 1-3 위험 예측 모델이다. 각각의 위험 예측 모델에 대해, 트레이닝 세트(예컨대, 코호트의 50%)를 이용하여 위험 예측 모델을 트레이닝하였고 테스팅 세트(예컨대, 코호트의 나머지 50%)를 이용하여 위험 예측 모델을 테스트하였다.
1년, 3년, 및 5년 위험 예측 모델들의 각각에 대해 상위 10개의 중요한 특징부들이 표 9에 도시되어 있다. 특히, 1년 위험 예측 모델의 중요한 특징부들 중 대부분은 결절-특이 특징부들을 포함하는 반면, 3년 및 5년 위험 예측 모델의 중요한 특징부들의 대부분은 객관적인 특징부들(예컨대, 신체 및/또는 폐 실질의 특징부들과 같은 비-결절 특이 특징부들)이다.
특히, 1년, Lung-RADS 1-3 예측 모델의 경우, 특징부 중요도의 관점에서 상위 3개의 특징부들 중 2개가 결절 특이 특징부들이다. 추가적으로, 1년, Lung-RADS 1-3 예측 모델에 대한 특징부 중요도의 관점에서 상위 5개의 특징부들 중 3개가 비-결절 특이 특징부들이다. 추가적으로, 1년, Lung-RADS 1-3 예측 모델에 대한 특징부 중요도의 관점에서 상위 10개의 특징부들 중 7개가 비-결절 특이 특징부들이다.
3년, Lung-RADS 1-3 예측 모델의 경우, 특징부 중요도의 관점에서 상위 3개의 특징부들 중 2개가 비-결절 특이 특징부들이다. 추가적으로, 3년, Lung-RADS 1-3 예측 모델에 대한 특징부 중요도의 관점에서 상위 5개의 특징부들 중 4개가 비-결절 특이 특징부들이다. 추가적으로, 3년, Lung-RADS 1-3 예측 모델에 대한 특징부 중요도의 관점에서 상위 10개의 특징부들 중 8개가 비-결절 특이 특징부들이다.
5년, Lung-RADS 1-3 예측 모델의 경우, 특징부 중요도의 관점에서 상위 3개의 특징부들 중 2개가 비-결절 특이 특징부들이다. 추가적으로, 5년, Lung-RADS 1-3 예측 모델에 대한 특징부 중요도의 관점에서 상위 5개의 특징부들 중 4개가 비-결절 특이 특징부들이다. 추가적으로, 5년, Lung-RADS 1-3 예측 모델에 대한 특징부 중요도의 관점에서 상위 10개의 특징부들 중 9개가 비-결절 특이 특징부들이다.
도 7a는 Lung-RADS 1-3 환자들에 걸친 1년 내의 암의 가능성을 예측하기 위한 위험 예측 모델의 수행을 도시한다. 기본 랜덤 포레스트 위험 예측 모델은 0.82의 AUC 값을 나타낸 반면, 튜닝된 랜덤 포레스트 위험 예측 모델은 0.82의 AUC 값을 나타내었다. 도 7b는 Lung-RADS 1-3 환자들에 걸친 3년 내의 암의 가능성을 예측하기 위한 위험 예측 모델의 수행을 도시한다. 기본 랜덤 포레스트 위험 예측 모델은 0.72의 AUC 값을 나타낸 반면, 튜닝된 랜덤 포레스트 위험 예측 모델은 0.73의 AUC 값을 나타내었다. 추가적으로, 표 10은 3년 위험 예측 모델에 의해 결정된 암 예측에 따라 Lung-RADS 1-3 환자 코호트의 특징들을 문서화하고 있다.
도 7c는 Lung-RADS 1-3 환자들에 걸친 5년 내의 암의 가능성을 예측하기 위한 위험 예측 모델의 수행을 도시한다. 기본 랜덤 포레스트 위험 예측 모델은 0.67의 AUC 값을 나타낸 반면, 튜닝된 랜덤 포레스트 위험 예측 모델은 0.68의 AUC 값을 나타내었다. 요컨대, 도 7a 내지 도 7c의 결과들은 상이한 위험 예측 모델들이 구성 및 전개되어 상이한 향후 수평적 시점들에 걸쳐 Lung-RADS 1-3 환자 코호트들에서 암의 가능성을 예측할 수 있음을 나타낸다. 다시 말해서, 가장 높은 위험 환자들(예컨대, Lung-RADS 4A/4B)이 제거되었더라도, 위험 예측 모델은 여전히 더 낮은 위험 환자들(예컨대, Lung-RADS 1-3)에서 암의 향후 위험의 가능성을 정확하게 예측할 수 있다.
도 7d는 Lung-RADS 1-3 환자들에 걸친 3년 누적 발생 함수를 도시한다. 여기서, 위험 예측 모델은 324명의 환자들에 대해 암을 예측하였고, 다른 6085명의 환자들에 대해 암이 없음을 예측하였다. 환자들의 코호트가 Lung-RADS 4A 및 4B 환자들 둘 모두를 배제하는 것을 고려하면, 4A 및 4B 환자들의 제거는 도 5d에 도시된 실시예 2에서 예측된 암 환자들과 비교하여 초기 몇 달(예컨대, 0 내지 6개월) 간의 324명의 예측된 암 환자들의 암의 낮은 발생으로서 나타난다. 구체적으로, Lung-RADS 1-3 환자 코호트에 대한 1년 마크에서의 누적 발생은 0.1 미만(도 7d에 도시됨)인 반면, 전체 환자 코호트(예컨대, Lung-RADS 1-4B)에 대한 1년 마크에서의 누적 발생은 ~0.2이다.
표 11은 1년, 3년, 또는 5년 위험 예측 모델들로부터의 향후 암 예측들을 이용한 Lung-RADS 1-3 환자 코호트의 강화 결과들을 도시한다. 구체적으로, 표 11은 원래 코호트에서 암의 배경 발생률(표 11에서 "널 모델"로 지칭됨)과 비교하여 위험 예측 모델들의 강화 결과들을 도시한다. 위험 예측 모델들의 적용은 누적 발생(표 11의 마지막 컬럼)을 상당히 개선한다.
구체적으로, 1년 모델의 경우, 배경 발생률("널 모델")은 0.70의 누적 발생을 갖는다(예컨대, 코호트의 환자들 중 0.70%가 1년 내에 암으로 진단됨). 1년 위험 예측 모델("랜덤 포레스트")을 적용하는 것은 환자 강화를 가능하게 하는데, 이는 6.03의 누적 발생을 달성한다(예컨대, 1년 위험 예측 모델의 예측으로 인한 코호트에 포함된 환자들 중 6.03%가 1년 내에 암으로 진단됨). 따라서, 1년 위험 예측 모델의 적용은 누적 발생에서 8.6배 증가를 달성한다.
3년 모델의 경우, 배경 발생률("널 모델")은 2.73의 누적 발생을 갖는다(예컨대, 코호트의 환자들 중 2.73%가 3년 내에 암으로 진단됨). 3년 위험 예측 모델("랜덤 포레스트")을 적용하는 것은 환자 강화를 가능하게 하는데, 이는 15.43의 누적 발생을 달성한다(예컨대, 3년 위험 예측 모델의 예측으로 인한 코호트에 포함된 환자들 중 15.43%가 3년 내에 암으로 진단됨). 따라서, 3년 위험 예측 모델의 적용은 누적 발생에서 5.7배 증가를 달성한다.
5년 모델의 경우, 배경 발생률("널 모델")은 4.06의 누적 발생을 갖는다(예컨대, 코호트의 환자들 중 4.06%가 5년 내에 암으로 진단됨). 5년 위험 예측 모델("랜덤 포레스트")을 적용하는 것은 환자 강화를 가능하게 하는데, 이는 14.88의 누적 발생을 달성한다(예컨대, 5년 위험 예측 모델의 예측으로 인한 코호트에 포함된 환자들 중 14.88%가 5년 내에 암으로 진단됨). 따라서, 5년 위험 예측 모델의 적용은 누적 발생에서 3.7배 증가를 달성한다.
요컨대, 표 11은 Lung-RADS 1-3 코호트에서 환자들을 강화하여, 임상 시험에 등록될 필요가 있는 환자들의 수를 감소시키기 위한 다양한 위험 예측 모델이 구현될 수 있음을 나타낸다.
실시예 5: Lung-RADS 1-2 환자들에 대한 향후 위험 예측
실시예 1에 기재된 방법들을 이용하여 Lung-RADS 1-2 환자들을 이용하여 3가지 개별 모델들을 구성하였다. 구체적으로, 제1 모델은 1년, Lung-RADS 1-2 위험 예측 모델이고, 제2 모델은 3년 위험, Lung-RADS 1-2 예측 모델이고, 제3 모델은 5년 위험, Lung-RADS 1-3 예측 모델이다. 각각의 위험 예측 모델에 대해, 트레이닝 세트(예컨대, 코호트의 50%)를 이용하여 위험 예측 모델을 트레이닝하였고 테스팅 세트(예컨대, 코호트의 나머지 50%)를 이용하여 위험 예측 모델을 테스트하였다.
1년, 3년, 및 5년 위험 예측 모델들의 각각에 대해 상위 10개의 중요한 특징부들이 표 12에 도시되어 있다. 특히, 1년 위험 예측 모델의 중요한 특징부들 중 대부분은 결절-특이 특징부들을 포함하는 반면, 3년 및 5년 위험 예측 모델의 중요한 특징부들의 대부분은 객관적인 특징부들(예컨대, 신체 및/또는 폐 실질의 특징부들과 같은 비-결절 특이 특징부들)이다.
특히, 1년, Lung-RADS 1-2 예측 모델의 경우, 특징부 중요도의 관점에서 상위 3개의 특징부들 중 2개가 결절 특이 특징부들이다. 추가적으로, 1년, Lung-RADS 1-2 예측 모델에 대한 특징부 중요도의 관점에서 상위 5개의 특징부들 중 3개가 비-결절 특이 특징부들이다. 추가적으로, 1년, Lung-RADS 1-2 예측 모델에 대한 특징부 중요도의 관점에서 상위 10개의 특징부들 중 8개가 비-결절 특이 특징부들이다.
3년, Lung-RADS 1-2 예측 모델의 경우, 특징부 중요도의 관점에서 상위 3개의 특징부들이 비-결절 특이 특징부들이다. 추가적으로, 3년, Lung-RADS 1-2 예측 모델에 대한 특징부 중요도의 관점에서 상위 5개의 특징부들이 비-결절 특이 특징부들이다. 추가적으로, 3년, Lung-RADS 1-2 예측 모델에 대한 특징부 중요도의 관점에서 상위 10개의 특징부들 중 8개가 비-결절 특이 특징부들이다.
5년, Lung-RADS 1-2 예측 모델의 경우, 특징부 중요도의 관점에서 상위 3개의 특징부들이 비-결절 특이 특징부들이다. 추가적으로, 5년, Lung-RADS 1-2 예측 모델에 대한 특징부 중요도의 관점에서 상위 5개의 특징부들이 비-결절 특이 특징부들이다. 추가적으로, 5년, Lung-RADS 1-2 예측 모델에 대한 특징부 중요도의 관점에서 상위 10개의 특징부들이 비-결절 특이 특징부들이다.
도 8a는 Lung-RADS 1-2 환자들에 걸친 1년 내의 암의 가능성을 예측하기 위한 위험 예측 모델의 수행을 도시한다. 기본 랜덤 포레스트 위험 예측 모델은 0.73의 AUC 값을 나타낸 반면, 튜닝된 랜덤 포레스트 위험 예측 모델은 0.72의 AUC 값을 나타내었다. 도 8b는 Lung-RADS 1-2 환자들에 걸친 3년 내의 암의 가능성을 예측하기 위한 위험 예측 모델의 수행을 도시한다. 기본 랜덤 포레스트 위험 예측 모델은 0.66의 AUC 값을 나타낸 반면, 튜닝된 랜덤 포레스트 위험 예측 모델은 0.65의 AUC 값을 나타내었다. 추가적으로, 표 13은 3년 위험 예측 모델에 의해 결정된 암 예측에 따라 Lung-RADS 1-2 환자 코호트의 특징들을 문서화하고 있다.
도 8c는 Lung-RADS 1-2 환자들에 걸친 5년 내의 암의 가능성을 예측하기 위한 위험 예측 모델의 수행을 도시한다. 기본 랜덤 포레스트 위험 예측 모델은 0.65의 AUC 값을 나타낸 반면, 튜닝된 랜덤 포레스트 위험 예측 모델은 0.65의 AUC 값을 나타내었다. 요컨대, 도 8a 내지 도 8c의 결과들은 상이한 위험 예측 모델들이 구성 및 전개되어 상이한 향후 수평적 시점들에 걸쳐 Lung-RADS 1-2 환자 코호트들에서 암의 가능성을 예측할 수 있음을 나타낸다. 다시 말해서, 더 높은 위험 환자들(예컨대, Lung-RADS 3/4A/4B)이 제거되었더라도, 위험 예측 모델은 여전히 낮은 위험 환자들(예컨대, Lung-RADS 1-2)에서 암의 향후 위험의 가능성을 정확하게 예측할 수 있다. 특히, 표 1에 도시된 바와 같이, Lung-RADS 1-2 개인들의 유병률은 집단의 ~90%이다. 따라서, Lung-RADS 1-2 환자 코호트들에 대해 암의 가능성을 예측할 수 있는 위험 예측 모델들은 매우 가치가 있는데, 그 이유는 그것이 거의 대부분의 환자 집단에 적용될 수 있기 때문이다.
도 8d는 Lung-RADS 1-2 환자들에 걸친 3년 누적 발생 함수를 도시한다. 여기서, 위험 예측 모델은 294명의 환자들에 대해 암을 예측하였고, 다른 5314명의 환자들에 대해 암이 없음을 예측하였다. 환자들의 코호트가 Lung-RADS 3, 4A 및 4B 환자들을 배제하는 것을 고려하면, Lung-RADS 3, 4A 및 4B 환자들의 제거는 도 5d에 도시된 실시예 2와 비교하여 초기 몇 달(예컨대, 0 내지 6개월) 간의 294명의 예측된 암 환자들의 암의 낮은 발생으로서 나타난다. 구체적으로, Lung-RADS 1-2 환자 코호트에 대한 1년 마크에서의 누적 발생은 ~0.025(도 8d에 도시됨)인 반면, 전체 환자 코호트(예컨대, Lung-RADS 1-4B)에 대한 1년 마크에서의 누적 발생은 ~0.2이다.
표 14는 1년, 3년, 또는 5년 위험 예측 모델들로부터의 향후 암 예측들을 이용한 Lung-RADS 1-2 환자 코호트의 강화 결과들을 도시한다. 구체적으로, 표 14는 원래 코호트에서 암의 배경 발생률(표 14에서 "널 모델"로 지칭됨)과 비교하여 위험 예측 모델들의 강화 결과들을 도시한다. 위험 예측 모델들의 적용은 누적 발생(표 14의 마지막 컬럼)을 상당히 개선한다.
구체적으로, 1년 모델의 경우, 배경 발생률("널 모델")은 0.43의 누적 발생을 갖는다(예컨대, 코호트의 환자들 중 0.43%가 1년 내에 암으로 진단됨). 1년 위험 예측 모델("랜덤 포레스트")을 적용하는 것은 환자 강화를 가능하게 하는데, 이는 2.37의 누적 발생을 달성한다(예컨대, 1년 위험 예측 모델의 예측으로 인한 코호트에 포함된 환자들 중 2.37%가 1년 내에 암으로 진단됨). 따라서, 1년 위험 예측 모델의 적용은 누적 발생에서 5.5배 증가를 달성한다.
3년 모델의 경우, 배경 발생률("널 모델")은 2.37의 누적 발생을 갖는다(예컨대, 코호트의 환자들 중 2.37%가 3년 내에 암으로 진단됨). 3년 위험 예측 모델("랜덤 포레스트")을 적용하는 것은 환자 강화를 가능하게 하는데, 이는 7.14의 누적 발생을 달성한다(예컨대, 3년 위험 예측 모델의 예측으로 인한 코호트에 포함된 환자들 중 7.14%가 3년 내에 암으로 진단됨). 따라서, 3년 위험 예측 모델의 적용은 누적 발생에서 3배 증가를 달성한다.
5년 모델의 경우, 배경 발생률("널 모델")은 3.67의 누적 발생을 갖는다(예컨대, 코호트의 환자들 중 3.67%가 5년 내에 암으로 진단됨). 5년 위험 예측 모델("랜덤 포레스트")을 적용하는 것은 환자 강화를 가능하게 하는데, 이는 7.06의 누적 발생을 달성한다(예컨대, 5년 위험 예측 모델의 예측으로 인한 코호트에 포함된 환자들 중 7.06%가 5년 내에 암으로 진단됨). 따라서, 5년 위험 예측 모델의 적용은 누적 발생에서 1.9배 증가를 달성한다.
요컨대, 표 14는 Lung-RADS 1-2 코호트에서 환자들을 강화하여, 임상 시험에 등록될 필요가 있는 환자들의 수를 감소시키기 위한 다양한 위험 예측 모델이 구현될 수 있음을 나타낸다.
실시예 6: Lung-RADS 1 환자들에 대한 향후 위험 예측
실시예 1에 기재된 방법들을 이용하여 Lung-RADS 1 환자들을 이용하여 3가지 개별 모델들을 구성하였다. 구체적으로, 제1 모델은 1년, Lung-RADS 1 위험 예측 모델이고, 제2 모델은 3년, Lung-RADS 1 위험 예측 모델이고, 제3 모델은 5년 위험, Lung-RADS 1 위험 예측 모델이다. 각각의 위험 예측 모델에 대해, 트레이닝 세트(예컨대, 코호트의 50%)를 이용하여 위험 예측 모델을 트레이닝하였고 테스팅 세트(예컨대, 코호트의 나머지 50%)를 이용하여 위험 예측 모델을 테스트하였다.
1년, 3년, 및 5년 위험 예측 모델들의 각각에 대해 상위 10개의 중요한 특징부들이 표 15에 도시되어 있다. 특히, 1년 위험 예측 모델의 중요한 특징부들 중 대부분은 결절-특이 특징부들을 포함하는 반면, 3년 및 5년 위험 예측 모델의 중요한 특징부들의 대부분은 객관적인 특징부들(예컨대, 신체 및/또는 폐 실질의 특징부들과 같은 비-결절 특이 특징부들)이다.
특히, 1년, Lung-RADS 1 예측 모델의 경우, 특징부 중요도의 관점에서 상위 3개의 특징부들이 비-결절 특이 특징부들이다. 추가적으로, 1년, Lung-RADS 1 예측 모델에 대한 특징부 중요도의 관점에서 상위 5개의 특징부들이 비-결절 특이 특징부들이다.
3년, Lung-RADS 1 예측 모델의 경우, 특징부 중요도의 관점에서 상위 3개의 특징부들이 비-결절 특이 특징부들이다. 추가적으로, 3년, Lung-RADS 1 예측 모델에 대한 특징부 중요도의 관점에서 상위 5개의 특징부들이 비-결절 특이 특징부들이다. 추가적으로, 3년, Lung-RADS 1 예측 모델에 대한 특징부 중요도의 관점에서 상위 10개의 특징부들이 비-결절 특이 특징부들이다.
5년, Lung-RADS 1 예측 모델의 경우, 특징부 중요도의 관점에서 상위 3개의 특징부들이 비-결절 특이 특징부들이다. 추가적으로, 5년, Lung-RADS 1 예측 모델에 대한 특징부 중요도의 관점에서 상위 5개의 특징부들이 비-결절 특이 특징부들이다. 추가적으로, 5년, Lung-RADS 1 예측 모델에 대한 특징부 중요도의 관점에서 상위 10개의 특징부들이 비-결절 특이 특징부들이다.
도 9a는 Lung-RADS 1 환자들에 걸친 1년 내의 암의 가능성을 예측하기 위한 위험 예측 모델의 수행을 도시한다. 기본 랜덤 포레스트 위험 예측 모델은 0.57의 AUC 값을 나타낸 반면, 튜닝된 랜덤 포레스트 위험 예측 모델은 0.63의 AUC 값을 나타내었다. 도 9b는 Lung-RADS 1 환자들에 걸친 3년 내의 암의 가능성을 예측하기 위한 위험 예측 모델의 수행을 도시한다. 기본 랜덤 포레스트 위험 예측 모델은 0.63의 AUC 값을 나타낸 반면, 튜닝된 랜덤 포레스트 위험 예측 모델은 0.60의 AUC 값을 나타내었다. 추가적으로, 표 16은 3년 위험 예측 모델에 의해 결정된 암 예측에 따라 Lung-RADS 1 환자 코호트의 특징들을 문서화하고 있다.
도 9c는 Lung-RADS 1 환자들에 걸친 5년 내의 암의 가능성을 예측하기 위한 위험 예측 모델의 수행을 도시한다. 기본 랜덤 포레스트 위험 예측 모델은 0.57의 AUC 값을 나타낸 반면, 튜닝된 랜덤 포레스트 위험 예측 모델은 0.61의 AUC 값을 나타내었다. 요컨대, 도 9a 내지 도 9c의 결과들은 상이한 위험 예측 모델들이 구성 및 전개되어 상이한 향후 수평적 시점들에 걸쳐 Lung-RADS 1 환자 코호트들에서 암의 가능성을 예측할 수 있음을 나타낸다.
도 9d는 Lung-RADS 1 환자들에 걸친 3년 누적 발생 함수를 도시한다. 여기서, 위험 예측 모델은 261명의 환자들에 대해 암을 예측하였고, 다른 4077명의 환자들에 대해 암이 없음을 예측하였다. 여기서, 환자들의 코호트는 Lung-RADS 1 환자들만을 포함하고, 이는 가까운 미래에 암을 발전시킬 위험이 가장 낮은 환자들이다. 도 9d에 도시된 바와 같이, Lung-RADS 1 환자 코호트의 261명의 예측된 암 환자들에 대한 1년 마크에서의 누적 발생은 0.02 미만인 반면, 전체 환자 코호트(예컨대, Lung-RADS 1-4B)에 대한 1년 마크에서의 누적 발생은 ~0.2이다.
표 17은 1년, 3년, 또는 5년 위험 예측 모델들로부터의 향후 암 예측들을 이용한 Lung-RADS 1 환자 코호트의 강화 결과들을 도시한다. 구체적으로, 표 17은 원래 코호트에서 암의 배경 발생률(표 17에서 "널 모델"로 지칭됨)과 비교하여 위험 예측 모델들의 강화 결과들을 도시한다. 위험 예측 모델들의 적용은 누적 발생(표 17의 마지막 컬럼)을 상당히 개선한다.
구체적으로, 3년 모델의 경우, 배경 발생률("널 모델")은 2.31의 누적 발생을 갖는다(예컨대, 코호트의 환자들 중 2.31%가 3년 내에 암으로 진단됨). 3년 위험 예측 모델("랜덤 포레스트")을 적용하는 것은 환자 강화를 가능하게 하는데, 이는 5.36의 누적 발생을 달성한다(예컨대, 3년 위험 예측 모델의 예측으로 인한 코호트에 포함된 환자들 중 5.36%가 3년 내에 암으로 진단됨). 따라서, 3년 위험 예측 모델의 적용은 누적 발생에서 2.3배 증가를 달성한다.
5년 모델의 경우, 배경 발생률("널 모델")은 3.67의 누적 발생을 갖는다(예컨대, 코호트의 환자들 중 3.67%가 5년 내에 암으로 진단됨). 5년 위험 예측 모델("랜덤 포레스트")을 적용하는 것은 환자 강화를 가능하게 하는데, 이는 6.80의 누적 발생을 달성한다(예컨대, 5년 위험 예측 모델의 예측으로 인한 코호트에 포함된 환자들 중 6.80%가 5년 내에 암으로 진단됨). 따라서, 5년 위험 예측 모델의 적용은 누적 발생에서 1.9배 증가를 달성한다.
요컨대, 표 17은 Lung-RADS 1 코호트에서 환자들을 강화하여, 임상 시험에 등록될 필요가 있는 환자들의 수를 감소시키기 위한 다양한 위험 예측 모델이 구현될 수 있음을 나타낸다.
실시예 7: 라디오믹 특징부들을 이용하여 Lung-RADS 1-4B 대상체들에 대한 암의 향후 위험 예측
실시예 1에 기재된 방법들을 이용하여 Lung-RADS 1-4B 대상체들을 이용하여 2가지 개별 모델들을 구성하였다. 구체적으로, 제1 모델은 1년, Lung-RADS 1-4B 위험 예측 모델이고 제2 모델은 3년, Lung-RADS 1-4B 위험 예측 모델이다. 각각의 위험 예측 모델에 대해, 트레이닝 세트(예컨대, 코호트의 50%)를 이용하여 위험 예측 모델을 트레이닝하였고 테스팅 세트(예컨대, 코호트의 나머지 50%)를 이용하여 위험 예측 모델을 테스트하였다. 1년 Lung-RADS 1-4B 및 3년 Lung-RADS 1-4B 위험 예측 모델들의 수행이 표 18에 도시되어 있다.
1년 및 3년 위험 예측 모델들의 각각에 대한 상위 10개의 중요한 특징부들(예컨대, 라디오믹 특징부들 및 비-결절 특이 특징부들을 포함하는 결절 특이 특징부들)은 표 19에 도시되어 있다. 특히, 1년, Lung-RADS 1-4B 예측 모델의 경우, 특징부 중요도의 관점에서 상위 3개의 특징부들 중 2개가 결절 특이 특징부들이다. 추가적으로, 1년, Lung-RADS 1-4B 예측 모델에 대한 특징부 중요도의 관점에서 상위 5개의 특징부들 중 3개가 결절 특이 특징부들이다.
3년, Lung-RADS 1-4B 예측 모델의 경우, 특징부 중요도의 관점에서 상위 3개의 특징부들이 결절 특이 특징부들이다. 추가적으로, 3년, Lung-RADS 1-4B 예측 모델에 대한 특징부 중요도의 관점에서 상위 5개의 특징부들이 결절 특이 특징부들이다.
도 10a는 Lung-RADS 1-4B 환자들에 걸친 1년 내의 암의 가능성을 예측하기 위한 라디오믹 특징부들을 포함하는 위험 예측 모델의 수행을 도시한다. XGboost 위험 예측 모델은 0.889의 AUC 값을 나타내었다. 도 10b는 Lung-RADS 1-4B 환자들에 걸친 3년 내의 암의 가능성을 예측하기 위한 라디오믹 특징부들을 포함하는 위험 예측 모델의 수행을 도시한다. XGboost 위험 예측 모델은 0.792의 AUC 값을 나타내었다.
실시예 8: 라디오믹 특징부들을 이용하여 Lung-RADS 1-4A 대상체들에 대한 암의 향후 위험 예측
실시예 1에 기재된 방법들을 이용하여 Lung-RADS 1-4A 대상체들을 이용하여 2가지 개별 모델들을 구성하였다. 구체적으로, 제1 모델은 1년, Lung-RADS 1-4A 위험 예측 모델이고 제2 모델은 3년, Lung-RADS 1-4A 위험 예측 모델이다. 각각의 위험 예측 모델에 대해, 트레이닝 세트(예컨대, 코호트의 50%)를 이용하여 위험 예측 모델을 트레이닝하였고 테스팅 세트(예컨대, 코호트의 나머지 50%)를 이용하여 위험 예측 모델을 테스트하였다. 1년 Lung-RADS 1-4A 및 3년 Lung-RADS 1-4A 위험 예측 모델들의 수행이 표 18에 도시되어 있다.
1년 및 3년 위험 예측 모델들의 각각에 대한 상위 10개의 중요한 특징부들(예컨대, 라디오믹 특징부들 및 비-결절 특이 특징부들을 포함하는 결절 특이 특징부들)은 표 20에 도시되어 있다. 특히, 1년, Lung-RADS 1-4A 예측 모델의 경우, 특징부 중요도의 관점에서 상위 3개의 특징부들이 비-결절 특이 특징부들이다. 추가적으로, 1년, Lung-RADS 1-4A 예측 모델에 대한 특징부 중요도의 관점에서 상위 5개의 특징부들 중 3개가 비-결절 특이 특징부들이다.
3년, Lung-RADS 1-4A 예측 모델의 경우, 특징부 중요도의 관점에서 상위 3개의 특징부들이 결절 특이 특징부들이다. 추가적으로, 3년, Lung-RADS 1-4A 예측 모델에 대한 특징부 중요도의 관점에서 상위 5개의 특징부들 중 4개가 결절 특이 특징부들이다.
도 11a는 Lung-RADS 1-4A 환자들에 걸친 1년 내의 암의 가능성을 예측하기 위한 라디오믹 특징부들을 포함하는 위험 예측 모델의 수행을 도시한다. XGboost 위험 예측 모델은 0.779의 AUC 값을 나타내었다. 도 11b는 Lung-RADS 1-4A 환자들에 걸친 3년 내의 암의 가능성을 예측하기 위한 라디오믹 특징부들을 포함하는 위험 예측 모델의 수행을 도시한다. XGboost 위험 예측 모델은 0.696의 AUC 값을 나타내었다.
실시예 9: 라디오믹 특징부들을 이용하여 Lung-RADS 1-3 대상체들에 대한 암의 향후 위험 예측
실시예 1에 기재된 방법들을 이용하여 Lung-RADS 1-3 대상체들을 이용하여 2가지 개별 모델들을 구성하였다. 구체적으로, 제1 모델은 1년, Lung-RADS 1-3 위험 예측 모델이고 제2 모델은 3년, Lung-RADS 1-3 위험 예측 모델이다. 각각의 위험 예측 모델에 대해, 트레이닝 세트(예컨대, 코호트의 50%)를 이용하여 위험 예측 모델을 트레이닝하였고 테스팅 세트(예컨대, 코호트의 나머지 50%)를 이용하여 위험 예측 모델을 테스트하였다. 1년 Lung-RADS 1-3 및 3년 Lung-RADS 1-3 위험 예측 모델들의 수행이 표 18에 도시되어 있다.
1년 및 3년 위험 예측 모델들의 각각에 대한 상위 10개의 중요한 특징부들(예컨대, 라디오믹 특징부들 및 비-결절 특이 특징부들을 포함하는 결절 특이 특징부들)은 표 21에 도시되어 있다. 특히, 1년, Lung-RADS 1-3 예측 모델의 경우, 특징부 중요도의 관점에서 상위 3개의 특징부들이 비-결절 특이 특징부들이다. 추가적으로, 1년, Lung-RADS 1-3 예측 모델에 대한 특징부 중요도의 관점에서 상위 5개의 특징부들 중 3개가 비-결절 특이 특징부들이다.
3년, Lung-RADS 1-3 예측 모델의 경우, 특징부 중요도의 관점에서 상위 3개의 특징부들 중 2개가 비-결절 특이 특징부들이다. 추가적으로, 3년, Lung-RADS 1-3 예측 모델에 대한 특징부 중요도의 관점에서 상위 5개의 특징부들 중 3개가 비-결절 특이 특징부들이다.
도 12a는 Lung-RADS 1-3 환자들에 걸친 1년 내의 암의 가능성을 예측하기 위한 라디오믹 특징부들을 포함하는 위험 예측 모델의 수행을 도시한다. XGboost 위험 예측 모델은 0.793의 AUC 값을 나타내었다. 도 12b는 Lung-RADS 1-3 환자들에 걸친 3년 내의 암의 가능성을 예측하기 위한 라디오믹 특징부들을 포함하는 위험 예측 모델의 수행을 도시한다. XGboost 위험 예측 모델은 0.676의 AUC 값을 나타내었다.
실시예 10: 라디오믹 특징부들을 이용하여 Lung-RADS 2-4B 대상체들에 대한 암의 향후 위험 예측
실시예 1에 기재된 방법들을 이용하여 Lung-RADS 2-4B 대상체들을 이용하여 2가지 개별 모델들을 구성하였다. 구체적으로, 제1 모델은 1년, Lung-RADS 2-4B 위험 예측 모델이고 제2 모델은 3년, Lung-RADS 2-4B 위험 예측 모델이다. 각각의 위험 예측 모델에 대해, 트레이닝 세트(예컨대, 코호트의 50%)를 이용하여 위험 예측 모델을 트레이닝하였고 테스팅 세트(예컨대, 코호트의 나머지 50%)를 이용하여 위험 예측 모델을 테스트하였다. 1년 Lung-RADS 2-4B 및 3년 Lung-RADS 2-4B 위험 예측 모델들의 수행이 표 18에 도시되어 있다.
1년 및 3년 위험 예측 모델들의 각각에 대한 상위 10개의 중요한 특징부들(예컨대, 라디오믹 특징부들 및 비-결절 특이 특징부들을 포함하는 결절 특이 특징부들)은 표 22에 도시되어 있다. 특히, 1년, Lung-RADS 2-4B 예측 모델의 경우, 특징부 중요도의 관점에서 상위 3개의 특징부들이 결절 특이 특징부들이다. 추가적으로, 1년, Lung-RADS 2-4B 예측 모델에 대한 특징부 중요도의 관점에서 상위 5개의 특징부들이 결절 특이 특징부들이다.
3년, Lung-RADS 2-4B 위험 예측 모델의 경우, 특징부 중요도의 관점에서 상위 3개의 특징부들이 결절 특이 특징부들이다. 추가적으로, 3년, Lung-RADS 2-4B 위험 예측 모델에 대한 특징부 중요도의 관점에서 상위 5개의 특징부들이 결절 특이 특징부들이다.
도 13a는 Lung-RADS 2-4B 환자들에 걸친 1년 내의 암의 가능성을 예측하기 위한 라디오믹 특징부들을 포함하는 위험 예측 모델의 수행을 도시한다. XGboost 위험 예측 모델은 0.928의 AUC 값을 나타내었다. 도 13b는 Lung-RADS 2-4B 환자들에 걸친 3년 내의 암의 가능성을 예측하기 위한 라디오믹 특징부들을 포함하는 위험 예측 모델의 수행을 도시한다. XGboost 위험 예측 모델은 0.809의 AUC 값을 나타내었다.
실시예 11: 라디오믹 특징부들을 이용하여 Lung-RADS 4A-4B 대상체들에 대한 암의 향후 위험 예측
실시예 1에 기재된 방법들을 이용하여 Lung-RADS 4A-4B 대상체들을 이용하여 2가지 개별 모델들을 구성하였다. 구체적으로, 제1 모델은 1년, Lung-RADS 4A-4B 위험 예측 모델이고 제2 모델은 3년, Lung-RADS 4A-4B 위험 예측 모델이다. 각각의 위험 예측 모델에 대해, 트레이닝 세트(예컨대, 코호트의 50%)를 이용하여 위험 예측 모델을 트레이닝하였고 테스팅 세트(예컨대, 코호트의 나머지 50%)를 이용하여 위험 예측 모델을 테스트하였다. 1년 Lung-RADS 4A-4B 및 3년 Lung-RADS 4A-4B 위험 예측 모델들의 수행이 표 18에 도시되어 있다.
1년 및 3년 위험 예측 모델들의 각각에 대한 상위 10개의 중요한 특징부들(예컨대, 라디오믹 특징부들 및 비-결절 특이 특징부들을 포함하는 결절 특이 특징부들)은 표 23에 도시되어 있다. 특히, 1년, Lung-RADS 4A-4B 예측 모델의 경우, 특징부 중요도의 관점에서 상위 3개의 특징부들이 결절 특이 특징부들이다. 추가적으로, 1년, Lung-RADS 4A-4B 예측 모델에 대한 특징부 중요도의 관점에서 상위 5개의 특징부들이 결절 특이 특징부들이다.
3년, Lung-RADS 4A-4B 위험 예측 모델의 경우, 특징부 중요도의 관점에서 상위 3개의 특징부들이 결절 특이 특징부들이다. 추가적으로, 3년, Lung-RADS 4A-4B 위험 예측 모델에 대한 특징부 중요도의 관점에서 상위 5개의 특징부들이 결절 특이 특징부들이다.
도 14a는 Lung-RADS 4A-4B 환자들에 걸친 1년 내의 암의 가능성을 예측하기 위한 라디오믹 특징부들을 포함하는 위험 예측 모델의 수행을 도시한다. XGboost 위험 예측 모델은 0.91의 AUC 값을 나타내었다. 도 14b는 Lung-RADS 4A-4B 환자들에 걸친 3년 내의 암의 가능성을 예측하기 위한 라디오믹 특징부들을 포함하는 위험 예측 모델의 수행을 도시한다. XGboost 위험 예측 모델은 0.798의 AUC 값을 나타내었다.
실시예 12: Lung-RADS 1-4B 대상체들에 대한 암의 향후 위험을 예측하는 추가적인 실시예들
실시예 1에 기재된 방법들을 이용하여 Lung-RADS 1-4B 대상체들을 이용하는 추가적인 모델들이 구성된다. 예를 들어, 이러한 모델들은 실시예 1에 기재된 비-결절 특징부들뿐만 아니라 실시예 1에 기재된 결절 특이 특징부들(예컨대, 라디오믹 특징부들)을 포함할 수 있다.
추가적인 모델들은 랜덤 포레스트 모델들 또는 그래디언트 부스트 모델들이다. 구체적으로, 제1 모델은 6개월, Lung-RADS 1-4B 위험 예측 모델이고, 제2 모델은 1.5년, Lung-RADS 1-4B 위험 예측 모델이고, 제3 모델은 2.5년, Lung-RADS 1-4B 위험 예측 모델이고, 제4 모델은 4년, Lung-RADS 1-4B 위험 예측 모델이고, 제5 모델은 4.5년, Lung-RADS 1-4B 위험 예측 모델이고, 제6 모델은 5.5년, Lung-RADS 1-4B 위험 예측 모델이고, 제7 모델은 6년, Lung-RADS 1-4B 위험 예측 모델이고, 제8 모델은 7년, Lung-RADS 1-4B 위험 예측 모델이고, 제9 모델은 8년, Lung-RADS 1-4B 위험 예측 모델이고, 제10 모델은 9년, Lung-RADS 1-4B 위험 예측 모델이고, 제11 모델은 10년, Lung-RADS 1-4B 위험 예측 모델이고, 제12 모델은 11년, Lung-RADS 1-4B 위험 예측 모델이고, 제13 모델은 11년, Lung-RADS 1-4B 위험 예측 모델이고, 제14 모델은 12년, Lung-RADS 1-4B 위험 예측 모델이고, 제15 모델은 13년, Lung-RADS 1-4B 위험 예측 모델이고, 제16 모델은 14년, Lung-RADS 1-4B 위험 예측 모델이고, 제17 모델은 15년, Lung-RADS 1-4B 위험 예측 모델이고, 제18 모델은 16년, Lung-RADS 1-4B 위험 예측 모델이고, 제19 모델은 17년, Lung-RADS 1-4B 위험 예측 모델이고, 제20 모델은 18년, Lung-RADS 1-4B 위험 예측 모델이고, 제21 모델은 19년, Lung-RADS 1-4B 위험 예측 모델이고, 제22 모델은 20년, Lung-RADS 1-4B 위험 예측 모델이다.
추가적인 모델들은 적어도 0.55의 AUC 값의 나타낸다. 추가적인 모델들 중 적어도 하나는 적어도 0.60의 AUC 값을 나타낸다. 추가적인 모델들 중 적어도 하나는 적어도 0.65의 AUC 값을 나타낸다. 추가적인 모델들 중 적어도 하나는 적어도 0.70의 AUC 값을 나타낸다. 추가적인 모델들 중 적어도 하나는 적어도 0.75의 AUC 값을 나타낸다. 추가적인 모델들 중 적어도 하나는 적어도 0.80의 AUC 값을 나타낸다.
실시예 13: Lung-RADS 1-4A 대상체들에 대한 암의 향후 위험을 예측하는 추가적인 실시예들
실시예 1에 기재된 방법들을 이용하여 Lung-RADS 1-4A 대상체들을 이용하는 추가적인 모델들이 구성된다. 예를 들어, 이러한 모델들은 실시예 1에 기재된 비-결절 특징부들뿐만 아니라 실시예 1에 기재된 결절 특이 특징부들(예컨대, 라디오믹 특징부들)을 포함할 수 있다.
추가적인 모델들은 랜덤 포레스트 모델들 또는 그래디언트 부스트 모델들이다. 구체적으로, 제1 모델은 6개월, Lung-RADS 1-4A 위험 예측 모델이고, 제2 모델은 1.5년, Lung-RADS 1-4A 위험 예측 모델이고, 제3 모델은 2.5년, Lung-RADS 1-4A 위험 예측 모델이고, 제4 모델은 4년, Lung-RADS 1-4A 위험 예측 모델이고, 제5 모델은 4.5년, Lung-RADS 1-4A 위험 예측 모델이고, 제6 모델은 5.5년, Lung-RADS 1-4A 위험 예측 모델이고, 제7 모델은 6년, Lung-RADS 1-4A 위험 예측 모델이고, 제8 모델은 7년, Lung-RADS 1-4A 위험 예측 모델이고, 제9 모델은 8년, Lung-RADS 1-4A 위험 예측 모델이고, 제10 모델은 9년, Lung-RADS 1-4A 위험 예측 모델이고, 제11 모델은 10년, Lung-RADS 1-4A 위험 예측 모델이고, 제12 모델은 11년, Lung-RADS 1-4A 위험 예측 모델이고, 제13 모델은 11년, Lung-RADS 1-4A 위험 예측 모델이고, 제14 모델은 12년, Lung-RADS 1-4A 위험 예측 모델이고, 제15 모델은 13년, Lung-RADS 1-4A 위험 예측 모델이고, 제16 모델은 14년, Lung-RADS 1-4A 위험 예측 모델이고, 제17 모델은 15년, Lung-RADS 1-4A 위험 예측 모델이고, 제18 모델은 16년, Lung-RADS 1-4A 위험 예측 모델이고, 제19 모델은 17년, Lung-RADS 1-4A 위험 예측 모델이고, 제20 모델은 18년, Lung-RADS 1-4A 위험 예측 모델이고, 제21 모델은 19년, Lung-RADS 1-4A 위험 예측 모델이고, 제22 모델은 20년, Lung-RADS 1-4A 위험 예측 모델이다.
추가적인 모델들은 적어도 0.55의 AUC 값의 나타낸다. 추가적인 모델들 중 적어도 하나는 적어도 0.60의 AUC 값을 나타낸다. 추가적인 모델들 중 적어도 하나는 적어도 0.65의 AUC 값을 나타낸다. 추가적인 모델들 중 적어도 하나는 적어도 0.70의 AUC 값을 나타낸다. 추가적인 모델들 중 적어도 하나는 적어도 0.75의 AUC 값을 나타낸다. 추가적인 모델들 중 적어도 하나는 적어도 0.80의 AUC 값을 나타낸다.
실시예 14: Lung-RADS 1-3 대상체들에 대한 암의 향후 위험을 예측하는 추가적인 실시예들
실시예 1에 기재된 방법들을 이용하여 Lung-RADS 1-3 대상체들을 이용하는 추가적인 모델들이 구성된다. 예를 들어, 이러한 모델들은 실시예 1에 기재된 비-결절 특징부들뿐만 아니라 실시예 1에 기재된 결절 특이 특징부들(예컨대, 라디오믹 특징부들)을 포함할 수 있다.
추가적인 모델들은 랜덤 포레스트 모델들 또는 그래디언트 부스트 모델들이다. 구체적으로, 제1 모델은 6개월, Lung-RADS 1-3 위험 예측 모델이고, 제2 모델은 1.5년, Lung-RADS 1-3 위험 예측 모델이고, 제3 모델은 2.5년, Lung-RADS 1-3 위험 예측 모델이고, 제4 모델은 4년, Lung-RADS 1-3 위험 예측 모델이고, 제5 모델은 4.5년, Lung-RADS 1-3 위험 예측 모델이고, 제6 모델은 5.5년, Lung-RADS 1-3 위험 예측 모델이고, 제7 모델은 6년, Lung-RADS 1-3 위험 예측 모델이고, 제8 모델은 7년, Lung-RADS 1-3 위험 예측 모델이고, 제9 모델은 8년, Lung-RADS 1-3 위험 예측 모델이고, 제10 모델은 9년, Lung-RADS 1-3 위험 예측 모델이고, 제11 모델은 10년, Lung-RADS 1-3 위험 예측 모델이고, 제12 모델은 11년, Lung-RADS 1-3 위험 예측 모델이고, 제13 모델은 11년, Lung-RADS 1-3 위험 예측 모델이고, 제14 모델은 12년, Lung-RADS 1-3 위험 예측 모델이고, 제15 모델은 13년, Lung-RADS 1-3 위험 예측 모델이고, 제16 모델은 14년, Lung-RADS 1-3 위험 예측 모델이고, 제17 모델은 15년, Lung-RADS 1-3 위험 예측 모델이고, 제18 모델은 16년, Lung-RADS 1-3 위험 예측 모델이고, 제19 모델은 17년, Lung-RADS 1-3 위험 예측 모델이고, 제20 모델은 18년, Lung-RADS 1-3 위험 예측 모델이고, 제21 모델은 19년, Lung-RADS 1-3 위험 예측 모델이고, 제22 모델은 20년, Lung-RADS 1-3 위험 예측 모델이다.
추가적인 모델들은 적어도 0.55의 AUC 값의 나타낸다. 추가적인 모델들 중 적어도 하나는 적어도 0.60의 AUC 값을 나타낸다. 추가적인 모델들 중 적어도 하나는 적어도 0.65의 AUC 값을 나타낸다. 추가적인 모델들 중 적어도 하나는 적어도 0.70의 AUC 값을 나타낸다. 추가적인 모델들 중 적어도 하나는 적어도 0.75의 AUC 값을 나타낸다. 추가적인 모델들 중 적어도 하나는 적어도 0.80의 AUC 값을 나타낸다.
실시예 15: Lung-RADS 1-2 대상체들에 대한 암의 향후 위험을 예측하는 추가적인 실시예들
실시예 1에 기재된 방법들을 이용하여 Lung-RADS 1-2 대상체들을 이용하는 추가적인 모델들이 구성된다. 예를 들어, 이러한 모델들은 실시예 1에 기재된 비-결절 특징부들뿐만 아니라 실시예 1에 기재된 결절 특이 특징부들(예컨대, 라디오믹 특징부들)을 포함할 수 있다.
추가적인 모델들은 랜덤 포레스트 모델들 또는 그래디언트 부스트 모델들이다. 구체적으로, 제1 모델은 6개월, Lung-RADS 1-2 위험 예측 모델이고, 제2 모델은 1.5년, Lung-RADS 1-2 위험 예측 모델이고, 제3 모델은 2.5년, Lung-RADS 1-2 위험 예측 모델이고, 제4 모델은 4년, Lung-RADS 1-2 위험 예측 모델이고, 제5 모델은 4.5년, Lung-RADS 1-2 위험 예측 모델이고, 제6 모델은 5.5년, Lung-RADS 1-2 위험 예측 모델이고, 제7 모델은 6년, Lung-RADS 1-2 위험 예측 모델이고, 제8 모델은 7년, Lung-RADS 1-2 위험 예측 모델이고, 제9 모델은 8년, Lung-RADS 1-2 위험 예측 모델이고, 제10 모델은 9년, Lung-RADS 1-2 위험 예측 모델이고, 제11 모델은 10년, Lung-RADS 1-2 위험 예측 모델이고, 제12 모델은 11년, Lung-RADS 1-2 위험 예측 모델이고, 제13 모델은 11년, Lung-RADS 1-2 위험 예측 모델이고, 제14 모델은 12년, Lung-RADS 1-2 위험 예측 모델이고, 제15 모델은 13년, Lung-RADS 1-2 위험 예측 모델이고, 제16 모델은 14년, Lung-RADS 1-2 위험 예측 모델이고, 제17 모델은 15년, Lung-RADS 1-2 위험 예측 모델이고, 제18 모델은 16년, Lung-RADS 1-2 위험 예측 모델이고, 제19 모델은 17년, Lung-RADS 1-2 위험 예측 모델이고, 제20 모델은 18년, Lung-RADS 1-2 위험 예측 모델이고, 제21 모델은 19년, Lung-RADS 1-2 위험 예측 모델이고, 제22 모델은 20년, Lung-RADS 1-2 위험 예측 모델이다.
추가적인 모델들은 적어도 0.55의 AUC 값의 나타낸다. 추가적인 모델들 중 적어도 하나는 적어도 0.60의 AUC 값을 나타낸다. 추가적인 모델들 중 적어도 하나는 적어도 0.65의 AUC 값을 나타낸다. 추가적인 모델들 중 적어도 하나는 적어도 0.70의 AUC 값을 나타낸다. 추가적인 모델들 중 적어도 하나는 적어도 0.75의 AUC 값을 나타낸다. 추가적인 모델들 중 적어도 하나는 적어도 0.80의 AUC 값을 나타낸다.
실시예 15: Lung-RADS 1 대상체들에 대한 암의 향후 위험을 예측하는 추가적인 실시예들
실시예 1에 기재된 방법들을 이용하여 Lung-RADS 1 대상체들을 이용하는 추가적인 모델들이 구성된다. 예를 들어, 이러한 모델들은 실시예 1에 기재된 비-결절 특징부들뿐만 아니라 실시예 1에 기재된 결절 특이 특징부들(예컨대, 라디오믹 특징부들)을 포함할 수 있다.
추가적인 모델들은 랜덤 포레스트 모델들 또는 그래디언트 부스트 모델들이다. 구체적으로, 제1 모델은 6개월, Lung-RADS 1 위험 예측 모델이고, 제2 모델은 1.5년, Lung-RADS 1 위험 예측 모델이고, 제3 모델은 2.5년, Lung-RADS 1 위험 예측 모델이고, 제4 모델은 4년, Lung-RADS 1 위험 예측 모델이고, 제5 모델은 4.5년, Lung-RADS 1 위험 예측 모델이고, 제6 모델은 5.5년, Lung-RADS 1 위험 예측 모델이고, 제7 모델은 6년, Lung-RADS 1 위험 예측 모델이고, 제8 모델은 7년, Lung-RADS 1 위험 예측 모델이고, 제9 모델은 8년, Lung-RADS 1 위험 예측 모델이고, 제10 모델은 9년, Lung-RADS 1 위험 예측 모델이고, 제11 모델은 10년, Lung-RADS 1 위험 예측 모델이고, 제12 모델은 11년, Lung-RADS 1 위험 예측 모델이고, 제13 모델은 11년, Lung-RADS 1 위험 예측 모델이고, 제14 모델은 12년, Lung-RADS 1 위험 예측 모델이고, 제15 모델은 13년, Lung-RADS 1 위험 예측 모델이고, 제16 모델은 14년, Lung-RADS 1 위험 예측 모델이고, 제17 모델은 15년, Lung-RADS 1 위험 예측 모델이고, 제18 모델은 16년, Lung-RADS 1 위험 예측 모델이고, 제19 모델은 17년, Lung-RADS 1 위험 예측 모델이고, 제20 모델은 18년, Lung-RADS 1 위험 예측 모델이고, 제21 모델은 19년, Lung-RADS 1 위험 예측 모델이고, 제22 모델은 20년, Lung-RADS 1 위험 예측 모델이다.
추가적인 모델들은 적어도 0.55의 AUC 값의 나타낸다. 추가적인 모델들 중 적어도 하나는 적어도 0.60의 AUC 값을 나타낸다. 추가적인 모델들 중 적어도 하나는 적어도 0.65의 AUC 값을 나타낸다. 추가적인 모델들 중 적어도 하나는 적어도 0.70의 AUC 값을 나타낸다. 추가적인 모델들 중 적어도 하나는 적어도 0.75의 AUC 값을 나타낸다. 추가적인 모델들 중 적어도 하나는 적어도 0.80의 AUC 값을 나타낸다.
실시예 16: 2명의 환자에 대한 예시적인 추가 위험 예측들
NLST의 데이터를 이용하여 트레이닝된 위험 예측 모델들은 다중 모드 위험 평가 및 강화 접근법을 제공한다. 예를 들어, NLST에 등록한 지 3년 내에 암을 발전시킨 2명의 환자를 고려한다. 둘 모두 기준선의 Lung-RADS 3 결절들을 갖고 있었고, 둘 모두 알고리즘에 의해 3년 내에 암을 발전시킬 것으로 예측되었고 둘 모두 3년 내에 병기 IA 선암종을 발전시켰다. 실제로, 두 환자 모두에 대해 암을 발전시킬 확률 예측은 서로의 2% 이내 였다(환자 1에 대해 84.8% 및 환자 2에 대해 86.4%). 환자 1은 76갑년(pack year) 흡연 이력, 23.5의 BMI, 상대적으로 작은 가슴근육량, 및 상당히 상엽 지배적 폐기종(국부적 히스토그램 분석에 기초하여 부피 기준으로 31% 폐기종)이 있는 65세 백인 여성 전 흡연자였다. 76갑년 흡연 이력은 76년동안 매일 한 갑(20)의 담배를 피우거나 또는 38년동안 하루에 두 갑을 피운 것과 같다. 대조적으로, 환자 2는 43갑년 흡연 이력, 29.8의 BMI, 상대적으로 보존된 가슴근육량, 및 최소 폐기종(국부적 히스토그램 분석에 기초하여 부피 기준으로 2.6% 폐기종)이 있지만, 상당히 더 많은 사이질 특징부들(4%에 비교하여 7.1%)을 갖는 59세 중년 백인 여성 전 흡연자였다. 이 제2 경우에 3년 내에 암의 발전을 예측하는 알고리즘으로 이어질 가능성이 있는 것은 이 마지막 특징부 및 사이질 특징부들과 암 사이의 강한 관계이다. 이 두 가지 경우 사이의 임상 및 방사선 차이는 암을 발전시킬 가능성이 있는 구별되고 상이한 표현형들을 갖는 환자들을 식별하는 위험 예측 모델들의 능력을 강조한다.
본 출원에 인용된 모든 간행물, 특허, 특허 출원, 및 다른 문헌은 각각의 개별 간행물, 특허, 특허 출원, 또는 다른 문헌이 모든 목적을 위해 참고로 포함되는 것으로 개별적으로 나타낸 것과 동일한 정도로 모든 목적을 위해 전체적으로 본 명세서에 참고로 포함된다.
다양한 특정 실시 형태들이 도시되고 설명되었지만, 상기 명세서는 제한적이지 않다. 본 개시내용(들)의 사상 및 범주로부터 벗어남 없이 다양한 변형들이 이루어질 수 있음이 이해될 것이다. 본 명세서의 검토 시 많은 변형들이 통상의 기술자에게 명백할 것이다.
테이블
[표 1]
Figure pct00002
Figure pct00003
[표 2]
Figure pct00004
Figure pct00005
[표 3]
Figure pct00006
[표 4]
Figure pct00007
Figure pct00008
Figure pct00009
Figure pct00010
[표 5]
Figure pct00011
[표 6]
Figure pct00012
[표 7]
Figure pct00013
Figure pct00014
Figure pct00015
Figure pct00016
[표 8]
Figure pct00017
[표 9]
Figure pct00018
[표 10]
Figure pct00019
Figure pct00020
Figure pct00021
Figure pct00022
[표 11]
Figure pct00023
[표 12]
Figure pct00024
[표 13]
Figure pct00025
Figure pct00026
Figure pct00027
Figure pct00028
[표 14]
Figure pct00029
[표 15]
Figure pct00030
[표 16]
Figure pct00031
Figure pct00032
Figure pct00033
Figure pct00034
[표 17]
Figure pct00035
[표 18]
Figure pct00036
[표 19]
Figure pct00037
[표 20]
Figure pct00038
[표 21]
Figure pct00039
[표 22]
Figure pct00040
[표 23]
Figure pct00041

Claims (277)

  1. 대상체에 대한 폐암의 하나 이상의 향후 위험들을 예측하기 위한 방법으로서,
    단일 시점에서 상기 대상체로부터 캡처된 하나 이상의 이미지들을 획득하는 단계;
    상기 하나 이상의 획득된 이미지들로부터 특징부들을 추출하는 단계 - 상기 추출된 특징부들은 적어도 비-결절 특이 특징부들을 포함하고, 상기 비-결절 특이 특징부들은 폐 실질 특징부들 또는 신체 조성 특징부들 중 하나 또는 둘 모두를 포함함 -;
    하나 이상의 트레이닝된 위험 예측 모델들을 적용하여 상기 하나 이상의 획득된 이미지들로부터의 상기 추출된 특징부들을 분석함으로써 상기 대상체에 대한 폐암의 하나 이상의 향후 위험들을 예측하는 단계를 포함하는, 방법.
  2. 제1항에 있어서, 상기 대상체에 대한 상기 폐암의 하나 이상의 향후 위험들을 예측하는 단계는 M년 위험 예측 모델을 적용하여 상기 대상체가 M년 내에 폐암을 발전시킬 가능성이 있는지 예측하는 단계를 포함하고, 상기 M년 위험 예측 모델은 결절 특이 특징부들 및 비-결절 특이 특징부들을 포함하고, 가장 높은 특징부 중요도 값들을 갖는 상위 3개의 추출된 특징부들의 50% 초과는 비-결절 특이 특징부들이고,
    폐 실질 특징부들은 상기 폐의 낮은 감쇠 영역의 백분율, 상기 폐의 높은 감쇠 영역의 백분율, 폐 아랫부분에 비교하여 폐 윗부분에서의 낮은 감쇠 또는 높은 감쇠 영역의 비율, 정상 조직, 중심소엽 폐기종, 중심소엽 결절, 간유리음영, 벌집모양, 선형 흉터, 결절형, 그물형, 흉막하선, 기타 폐기종, 또는 낭종 중 임의의 것에 의해 점유된 폐의 백분율(들) 중 하나 이상을 포함하고,
    신체 조성 특징부들은 흉근 단면적, 흉근 제지방 단면적, 또는 피하지방 단면적 중 하나 이상을 포함하는, 방법.
  3. 제1항에 있어서, 상기 폐 실질 특징부들은 상기 폐 실질의 밀도 측정 또는 상기 폐 실질의 국부적 히스토그램 측정들 중 하나 이상을 포함하는, 방법.
  4. 제3항에 있어서, 상기 폐 실질의 상기 밀도 측정은 상기 폐의 낮은 감쇠 영역의 백분율, 상기 폐의 높은 감쇠 영역의 백분율, 및 폐 아랫부분에 비교하여 폐 윗부분에서의 낮은 감쇠 또는 높은 감쇠 영역의 비율 중 하나 이상을 포함하는, 방법.
  5. 제3항에 있어서, 상기 폐 실질의 상기 국부적 히스토그램 측정들은 정상 조직, 중심소엽 폐기종, 중심소엽 결절, 간유리음영, 벌집모양, 선형 흉터, 결절형, 그물형, 흉막하선, 기타 폐기종, 또는 낭종 중 임의의 것에 의해 점유된 폐의 하나 이상의 백분율(들)을 포함하는, 방법.
  6. 제1항에 있어서, 신체 조성 특징부들은 흉근 단면적, 흉근 제지방 단면적, 또는 피하지방 단면적 중 하나 이상을 포함하는, 방법.
  7. 제1항 또는 제3항 내지 제6항 중 어느 한 항에 있어서, 상기 추출된 특징부들은 결절 특이 특징부들을 추가로 포함하는, 방법.
  8. 제7항에 있어서, 상기 결절 특이 특징부들은 결절 특이 감쇠, 결절 마진 설명, 결절 크기, 결절 형상, 결절 텍스처, 결절 직경, Lung-RADS 점수, 또는 라디오믹(radiomic) 특징부들 중 하나 이상을 포함하는, 방법.
  9. 제8항에 있어서, 라디오믹 특징부들은 1차 통계, 3D 형상 기반 특징부들, 2D 형상 기반 특징부들, 그레이 레벨 동시발생 행렬, 그레이 레벨 반복 길이 행렬, 그레이 레벨 크기 영역 행렬, 이웃 그레이 톤 차이 행렬, 및 그레이 레벨 의존성 행렬 중 하나 이상을 포함하는, 방법.
  10. 제7항 내지 제9항 중 어느 한 항에 있어서, 상기 결절 특이 특징부들은 방사선과의사 보고서로부터 추출되는, 방법.
  11. 제7항 내지 제9항 중 어느 한 항에 있어서, 상기 결절 특이 특징부들은 이미지 분석 알고리즘을 구현함으로써 연산적으로 추출되는, 방법.
  12. 제1항 또는 제3항 내지 제11항 중 어느 한 항에 있어서, 상기 대상체에 대한 상기 폐암의 하나 이상의 향후 위험들을 예측하는 단계는 5년 위험 예측 모델을 적용하여 상기 대상체가 5년 내에 폐암을 발전시킬 가능성이 있는지 예측하는 단계를 포함하는, 방법.
  13. 제12항에 있어서, 상기 5년 위험 예측 모델은 결절 특이 특징부들 및 비-결절 특이 특징부들을 포함하고, 상기 비-결절 특이 특징부들은 상기 결절 특이 특징부들보다 더 높은 특징부 중요도 값들을 갖는, 방법.
  14. 제13항에 있어서, 가장 높은 특징부 중요도 값들을 갖는 상위 3개의 추출된 특징부들의 50% 초과는 비-결절 특이 특징부들인, 방법.
  15. 제13항에 있어서, 가장 높은 특징부 중요도 값들을 갖는 상위 5개의 추출된 특징부들의 50% 초과는 비-결절 특이 특징부들인, 방법.
  16. 제13항에 있어서, 가장 높은 특징부 중요도 값들을 갖는 상위 10개의 추출된 특징부들의 50% 초과는 비-결절 특이 특징부들인, 방법.
  17. 제12항 내지 제16항 중 어느 한 항에 있어서, 상기 대상체가 후보라고 결정하는 단계는 Lung-RADS 1, Lung-RADS 2, Lung-RADS 3, Lung-RADS 4A, 또는 Lung-RADS 4B 중 하나에서 상기 대상체의 분류를 획득하는 단계를 포함하는, 방법.
  18. 제17항에 있어서, 상기 5년 위험 예측 모델은 적어도 0.74의 곡선하면적(AUC) 값을 나타내는, 방법.
  19. 제17항에 있어서, 상기 5년 위험 예측 모델은 배경 발생률과 비교하여 누적 발생에서 적어도 5.1배 증가를 달성하는, 방법.
  20. 제12항 내지 제16항 중 어느 한 항에 있어서, 상기 대상체가 후보라고 결정하는 단계는 상기 대상체가 Lung-RADS 1, Lung-RADS 2, Lung-RADS 3, 또는 Lung-RADS 4A 중 임의의 것으로 분류된다고 결정하는 단계를 추가로 포함하는, 방법.
  21. 제20항에 있어서, 상기 5년 위험 예측 모델은 적어도 0.72의 곡선하면적(AUC) 값을 나타내는, 방법.
  22. 제20항에 있어서, 상기 5년 위험 예측 모델은 배경 발생률과 비교하여 누적 발생에서 적어도 3.9배 증가를 달성하는, 방법.
  23. 제12항 내지 제16항 중 어느 한 항에 있어서, 상기 대상체가 후보라고 결정하는 단계는 상기 대상체가 Lung-RADS 1, Lung-RADS 2, 또는 Lung-RADS 3 중 임의의 것으로 분류된다고 결정하는 단계를 추가로 포함하는, 방법.
  24. 제23항에 있어서, 상기 5년 위험 예측 모델은 적어도 0.67의 곡선하면적(AUC) 값을 나타내는, 방법.
  25. 제23항에 있어서, 상기 5년 위험 예측 모델은 배경 발생률과 비교하여 누적 발생에서 적어도 3.7배 증가를 달성하는, 방법.
  26. 제12항 내지 제16항 중 어느 한 항에 있어서, 상기 대상체가 후보라고 결정하는 단계는 상기 대상체가 Lung-RADS 1, 또는 Lung-RADS 2 중 임의의 것으로 분류된다고 결정하는 단계를 추가로 포함하는, 방법.
  27. 제26항에 있어서, 상기 5년 위험 예측 모델은 적어도 0.65의 곡선하면적(AUC) 값을 나타내는, 방법.
  28. 제26항에 있어서, 상기 5년 위험 예측 모델은 배경 발생률과 비교하여 누적 발생에서 적어도 1.9배 증가를 달성하는, 방법.
  29. 제12항 내지 제16항 중 어느 한 항에 있어서, 상기 대상체가 후보라고 결정하는 단계는 상기 대상체가 Lung-RADS 1로 분류된다고 결정하는 단계를 추가로 포함하는, 방법.
  30. 제29항에 있어서, 상기 5년 위험 예측 모델은 적어도 0.57의 곡선하면적(AUC) 값을 나타내는, 방법.
  31. 제29항에 있어서, 상기 5년 위험 예측 모델은 배경 발생률과 비교하여 누적 발생에서 적어도 1.9배 증가를 달성하는, 방법.
  32. 제1항 또는 제3항 내지 제11항 중 어느 한 항에 있어서, 상기 대상체에 대한 상기 폐암의 하나 이상의 향후 위험들을 예측하는 단계는 3년 위험 예측 모델을 적용하여 상기 대상체가 3년 내에 폐암을 발전시킬 가능성이 있는지 예측하는 단계를 포함하는, 방법.
  33. 제32항에 있어서, 상기 3년 위험 예측 모델은 결절 특이 특징부들 및 비-결절 특이 특징부들을 포함하고, 상기 비-결절 특이 특징부들은 상기 결절 특이 특징부들보다 더 높은 특징부 중요도 값들을 갖는, 방법.
  34. 제33항에 있어서, 가장 높은 특징부 중요도 값들을 갖는 상위 5개의 추출된 특징부들의 50% 초과는 비-결절 특이 특징부들인, 방법.
  35. 제33항에 있어서, 가장 높은 특징부 중요도 값들을 갖는 상위 10개의 추출된 특징부들의 50% 초과는 비-결절 특이 특징부들인, 방법.
  36. 제32항 내지 제35항 중 어느 한 항에 있어서, 상기 대상체가 후보라고 결정하는 단계는 Lung-RADS 1, Lung-RADS 2, Lung-RADS 3, Lung-RADS 4A, 또는 Lung-RADS 4B 중 하나에서 상기 대상체의 분류를 획득하는 단계를 포함하는, 방법.
  37. 제36항에 있어서, 상기 3년 위험 예측 모델은 적어도 0.79의 곡선하면적(AUC) 값을 나타내는, 방법.
  38. 제36항에 있어서, 상기 3년 위험 예측 모델은 배경 발생률과 비교하여 누적 발생에서 적어도 6.3배 증가를 달성하는, 방법.
  39. 제32항 내지 제35항 중 어느 한 항에 있어서, 상기 대상체가 후보라고 결정하는 단계는 상기 대상체가 Lung-RADS 1, Lung-RADS 2, Lung-RADS 3, 또는 Lung-RADS 4A 중 임의의 것으로 분류된다고 결정하는 단계를 추가로 포함하는, 방법.
  40. 제39항에 있어서, 상기 3년 위험 예측 모델은 적어도 0.72의 곡선하면적(AUC) 값을 나타내는, 방법.
  41. 제39항에 있어서, 상기 3년 위험 예측 모델은 배경 발생률과 비교하여 누적 발생에서 적어도 5.1배 증가를 달성하는, 방법.
  42. 제32항 내지 제35항 중 어느 한 항에 있어서, 상기 대상체가 후보라고 결정하는 단계는 상기 대상체가 Lung-RADS 1, Lung-RADS 2, 또는 Lung-RADS 3 중 임의의 것으로 분류된다고 결정하는 단계를 추가로 포함하는, 방법.
  43. 제42항에 있어서, 상기 3년 위험 예측 모델은 적어도 0.72의 곡선하면적(AUC) 값을 나타내는, 방법.
  44. 제42항에 있어서, 상기 3년 위험 예측 모델은 배경 발생률과 비교하여 누적 발생에서 적어도 5.7배 증가를 달성하는, 방법.
  45. 제42항에 있어서, 상기 3년 위험 예측 모델은 적어도 0.676의 곡선하면적(AUC) 값을 나타내는, 방법.
  46. 제32항 내지 제35항 중 어느 한 항에 있어서, 상기 대상체가 후보라고 결정하는 단계는 상기 대상체가 Lung-RADS 1, 또는 Lung-RADS 2 중 임의의 것으로 분류된다고 결정하는 단계를 추가로 포함하는, 방법.
  47. 제46항에 있어서, 상기 3년 위험 예측 모델은 적어도 0.65의 곡선하면적(AUC) 값을 나타내는, 방법.
  48. 제46항에 있어서, 상기 3년 위험 예측 모델은 배경 발생률과 비교하여 누적 발생에서 적어도 3배 증가를 달성하는, 방법.
  49. 제32항 내지 제35항 중 어느 한 항에 있어서, 상기 대상체가 후보라고 결정하는 단계는 상기 대상체가 Lung-RADS 1로 분류된다고 결정하는 단계를 추가로 포함하는, 방법.
  50. 제49항에 있어서, 상기 3년 위험 예측 모델은 적어도 0.60의 곡선하면적(AUC) 값을 나타내는, 방법.
  51. 제49항에 있어서, 상기 3년 위험 예측 모델은 배경 발생률과 비교하여 누적 발생에서 적어도 2.3배 증가를 달성하는, 방법.
  52. 제1항 또는 제3항 내지 제11항 중 어느 한 항에 있어서, 상기 대상체에 대한 상기 폐암의 하나 이상의 향후 위험들을 예측하는 단계는 1년 위험 예측 모델을 적용하여 상기 대상체가 1년 내에 폐암을 발전시킬 가능성이 있는지 예측하는 단계를 포함하는, 방법.
  53. 제52항에 있어서, 상기 1년 위험 예측 모델은 결절 특이 특징부들 및 비-결절 특이 특징부들을 포함하고, 상기 비-결절 특이 특징부들은 상기 결절 특이 특징부들보다 더 높은 특징부 중요도 값들을 갖는, 방법.
  54. 제52항 또는 제53항에 있어서, 상기 대상체가 후보라고 결정하는 단계는 상기 대상체가 Lung-RADS 1, 또는 Lung-RADS 2 중 임의의 것으로 분류된다고 결정하는 단계를 추가로 포함하는, 방법.
  55. 제54항에 있어서, 상기 1년 위험 예측 모델은 적어도 0.72의 곡선하면적(AUC) 값을 나타내는, 방법.
  56. 제54항에 있어서, 상기 1년 위험 예측 모델은 배경 발생률과 비교하여 누적 발생에서 적어도 5.5배 증가를 달성하는, 방법.
  57. 제52항 또는 제53항에 있어서, 상기 대상체가 후보라고 결정하는 단계는 상기 대상체가 Lung-RADS 1로 분류된다고 결정하는 단계를 추가로 포함하는, 방법.
  58. 제57항에 있어서, 상기 1년 위험 예측 모델은 적어도 0.57의 곡선하면적(AUC) 값을 나타내는, 방법.
  59. 제52항에 있어서, 상기 1년 위험 예측 모델은 결절 특이 특징부들 및 비-결절 특이 특징부들을 포함하고, 상기 결절 특이 특징부들은 상기 비-결절 특이 특징부들보다 더 높은 특징부 중요도 값들을 갖는, 방법.
  60. 제59항에 있어서, 가장 높은 특징부 중요도 값들을 갖는 상위 3개의 추출된 특징부들의 50% 초과는 결절 특이 특징부들인, 방법.
  61. 제59항 또는 제60항에 있어서, 상기 대상체가 후보라고 결정하는 단계는 Lung-RADS 1, Lung-RADS 2, Lung-RADS 3, Lung-RADS 4A, 또는 Lung-RADS 4B 중 하나에서 상기 대상체의 분류를 획득하는 단계를 포함하는, 방법.
  62. 제61항에 있어서, 상기 1년 위험 예측 모델은 적어도 0.90의 곡선하면적(AUC) 값을 나타내는, 방법.
  63. 제61항에 있어서, 상기 1년 위험 예측 모델은 배경 발생률과 비교하여 누적 발생에서 적어도 11배 증가를 달성하는, 방법.
  64. 제59항 또는 제60항에 있어서, 상기 대상체가 후보라고 결정하는 단계는 상기 대상체가 Lung-RADS 1, Lung-RADS 2, Lung-RADS 3, 또는 Lung-RADS 4A 중 임의의 것으로 분류된다고 결정하는 단계를 추가로 포함하는, 방법.
  65. 제64항에 있어서, 상기 1년 위험 예측 모델은 적어도 0.81의 곡선하면적(AUC) 값을 나타내는, 방법.
  66. 제64항에 있어서, 상기 1년 위험 예측 모델은 배경 발생률과 비교하여 누적 발생에서 적어도 7.6배 증가를 달성하는, 방법.
  67. 제60항 내지 제65항 중 어느 한 항에 있어서, 가장 높은 특징부 중요도 값들을 갖는 상위 5개의 추출된 특징부들의 50% 초과는 결절 특이 특징부들인, 방법.
  68. 제59항 또는 제60항에 있어서, 상기 대상체가 후보라고 결정하는 단계는 상기 대상체가 Lung-RADS 1, Lung-RADS 2, 또는 Lung-RADS 3 중 임의의 것으로 분류된다고 결정하는 단계를 추가로 포함하는, 방법.
  69. 제68항에 있어서, 상기 1년 위험 예측 모델은 적어도 0.82의 곡선하면적(AUC) 값을 나타내는, 방법.
  70. 제64항에 있어서, 상기 1년 위험 예측 모델은 배경 발생률과 비교하여 누적 발생에서 적어도 8.6배 증가를 달성하는, 방법.
  71. 제1항 또는 제3항 내지 제11항 중 어느 한 항에 있어서, 상기 대상체에 대한 상기 폐암의 하나 이상의 향후 위험들을 예측하는 단계는 다수의 위험 예측 모델들을 적용하여 상기 대상체가 N의 상이한 기간들 내에 폐암을 발전시킬 가능성이 있는지 예측하는 단계를 포함하는, 방법.
  72. 제71항에 있어서, 상기 N의 상이한 기간들 중 적어도 하나는 6개월, 1년, 1.5년, 2년, 2.5년, 3년, 3.5년, 4년, 4.5년, 5년, 5.5년, 6년, 6.5년, 7년, 7.5년, 8년, 8.5년, 9년, 9.5년, 10년, 10.5년, 11년, 11.5년, 12년, 12.5년, 13년, 13.5년, 14년, 14.5년, 15년, 15.5년, 16년, 16.5년, 17년, 17.5년, 18년, 18.5년, 19년, 19.5년, 또는 20년 중 어느 하나인, 방법.
  73. 제71항에 있어서, N은 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 또는 20의 상이한 기간들인, 방법.
  74. 제1항 내지 제73항 중 어느 한 항에 있어서, 상기 하나 이상의 위험 예측 모델들 중 하나는 Lung-RADS 1-4B의 임의의 것으로 분류된 트레이닝 개인들의 트레이닝 코호트로부터 캡처된 트레이닝 이미지들을 이용하여 상기 폐암의 향후 위험을 예측하도록 트레이닝된 Lung-RADS 1-4B 예측 모델인, 방법.
  75. 제1항 내지 제73항 중 어느 한 항에 있어서, 상기 하나 이상의 위험 예측 모델들 중 하나는 Lung-RADS 1-4A의 임의의 것으로 분류된 트레이닝 개인들의 트레이닝 코호트로부터 캡처된 트레이닝 이미지들을 이용하여 상기 폐암의 향후 위험을 예측하도록 트레이닝된 Lung-RADS 1-4A 모델인, 방법.
  76. 제1항 내지 제73항 중 어느 한 항에 있어서, 상기 하나 이상의 위험 예측 모델들 중 하나는 Lung-RADS 1-3의 임의의 것으로 분류된 트레이닝 개인들의 트레이닝 코호트로부터 캡처된 트레이닝 이미지들을 이용하여 상기 폐암의 향후 위험을 예측하기 위한 Lung-RADS 1-3 모델인, 방법.
  77. 제1항 내지 제73항 중 어느 한 항에 있어서, 상기 하나 이상의 위험 예측 모델들 중 하나는 Lung-RADS 1 또는 2로 분류된 트레이닝 개인들의 트레이닝 코호트로부터 캡처된 트레이닝 이미지들을 이용하여 상기 폐암의 향후 위험을 예측하도록 트레이닝된 Lung-RADS 1-2 모델인, 방법.
  78. 제1항 내지 제73항 중 어느 한 항에 있어서, 상기 하나 이상의 위험 예측 모델들 중 하나는 Lung-RADS 1로 분류된 트레이닝 개인들의 트레이닝 코호트로부터 캡처된 트레이닝 이미지들을 이용하여 상기 폐암의 향후 위험을 예측하도록 트레이닝된 Lung-RADS 1 모델인, 방법.
  79. 제74항 내지 제78항 중 어느 한 항에 있어서, 상기 트레이닝 코호트의 대부분의 트레이닝 개인들은 이전에 Lung-RADS 1로 분류된, 방법.
  80. 제1항 내지 제80항 중 어느 한 항에 있어서, 상기 하나 이상의 이미지들은 컴퓨터 단층촬영(CT) 이미지들 또는 X-선 이미지들인, 방법.
  81. 제1항 내지 제80항 중 어느 한 항에 있어서, 상기 하나 이상의 이미지들은 흉부 CT 이미지들 또는 흉부 X-선 이미지들을 포함하는, 방법.
  82. 제1항 내지 제81항 중 어느 한 항에 있어서, 상기 위험 예측 모델은 국가폐암검진연구(National Lung Screening Trial, NLST)의 트레이닝 이미지들을 이용하여 트레이닝되는, 방법.
  83. 제1항 내지 제82항 중 어느 한 항에 있어서,
    상기 대상체에 대해 폐암의 하나 이상의 향후 위험들을 예측하기 이전에:
    상기 대상체에 대응하는 결절-특이 특징부들을 획득하는 단계;
    상기 결절-특이 특징부들에 기초하여 상기 대상체가 향후 위험 예측에 대한 후보라고 결정하는 단계를 추가로 포함하는, 방법.
  84. 제83항에 있어서, 상기 대상체가 후보라고 결정하는 단계는 상기 대상체가 폐암을 갖고 있지 않거나 또는 폐암을 발전시킬 위험이 낮다고 결정하는 단계를 포함하는, 방법.
  85. 제84항에 있어서, 상기 대상체가 폐암을 발전시킬 위험이 낮다고 결정하는 단계는 상기 결절-특이 특징부들에 기초하여 상기 대상체가 결절을 갖고 있지 않다고 결정하는 단계를 포함하는, 방법.
  86. 제1항 내지 제85항 중 어느 한 항에 있어서, 상기 폐암은 비-소세포 폐암 또는 소세포 폐암인, 방법.
  87. 제1항 내지 제85항 중 어느 한 항에 있어서, 상기 폐암은 선암종 또는 편평세포암종인, 방법.
  88. 제1항 내지 제87항 중 어느 한 항에 있어서, 상기 폐암의 예측된 향후 위험에 기초하여 상기 대상체에 대한 임상 반응을 선택하는 단계를 추가로 포함하는, 방법.
  89. 제88항에 있어서, 상기 대상체에 대한 임상 반응을 선택하는 단계는 상기 대상체를 치료하기 위한 중재시술을 선택하는 단계를 포함하는, 방법.
  90. 제89항에 있어서, 상기 중재시술을 선택하는 단계는 상기 대상체에 투여하기 위한 치료를 선택하는 단계를 포함하는, 방법.
  91. 제90항에 있어서, 상기 선택된 치료는 상기 폐암의 발전을 지연 또는 방지하기 위해 예방적으로 상기 대상체에 투여되는, 방법.
  92. 제88항에 있어서, 상기 임상 반응은 상기 대상체의 행동을 변화시키기 위해 상기 대상체에게 상담을 제공하는 것을 포함하는, 방법.
  93. 제88항에 있어서, 상기 임상 반응은 상기 대상체에 대한 추적조사의 빈도를 증가시키는 것을 포함하는, 방법.
  94. 제88항에 있어서, 상기 임상 반응은 상기 폐암의 예측된 향후 위험을 확인하기 위해 추가 위험 예측 테스트를 수행하거나 또는 상기 추가 위험 예측 테스트가 수행되도록 스케줄링하는 것을 포함하는, 방법.
  95. 제1항 내지 제94항 중 어느 한 항에 있어서, 상기 트레이닝된 위험 예측 모델들 중 하나 이상은 랜덤 포레스트 모델(random forest model) 또는 그래디언트 부스트 모델(gradient boosted model) 중 하나인, 방법.
  96. 대상체에 대한 폐암의 하나 이상의 향후 위험들을 예측하기 위한 비일시적 컴퓨터 판독가능 매체로서, 상기 비일시적 컴퓨터 판독가능 매체는, 프로세서에 의해 실행 시, 상기 프로세서로 하여금:
    단일 시점에서 상기 대상체로부터 캡처된 하나 이상의 이미지들을 획득하고;
    상기 하나 이상의 획득된 이미지들로부터 특징부들을 추출하고 - 상기 추출된 특징부들은 적어도 비-결절 특이 특징부들을 포함하고, 상기 비-결절 특이 특징부들은 폐 실질 특징부들 또는 신체 조성 특징부들 중 하나 또는 둘 모두를 포함함 -;
    하나 이상의 트레이닝된 위험 예측 모델들을 적용하여 상기 하나 이상의 획득된 이미지들로부터의 상기 추출된 특징부들을 분석함으로써 상기 대상체에 대한 폐암의 하나 이상의 향후 위험들을 예측하게 하는 명령어들을 포함하는, 비일시적 컴퓨터 판독가능 매체.
  97. 제96항에 있어서, 상기 프로세서로 하여금 상기 대상체에 대한 상기 폐암의 하나 이상의 향후 위험들을 예측하게 하는 상기 명령어들은, 상기 프로세서에 의해 실행 시, 상기 프로세서로 하여금 M년 위험 예측 모델을 적용하여 상기 대상체가 M년 내에 폐암을 발전시킬 가능성이 있는지 예측하게 하는 명령어들을 추가로 포함하고, 상기 M년 위험 예측 모델은 결절 특이 특징부들 및 비-결절 특이 특징부들을 포함하고, 가장 높은 특징부 중요도 값들을 갖는 상위 3개의 추출된 특징부들의 50% 초과는 비-결절 특이 특징부들이고,
    폐 실질 특징부들은 상기 폐의 낮은 감쇠 영역의 백분율, 상기 폐의 높은 감쇠 영역의 백분율, 폐 아랫부분에 비교하여 폐 윗부분에서의 낮은 감쇠 또는 높은 감쇠 영역의 비율, 정상 조직, 중심소엽 폐기종, 중심소엽 결절, 간유리음영, 벌집모양, 선형 흉터, 결절형, 그물형, 흉막하선, 기타 폐기종, 또는 낭종 중 임의의 것에 의해 점유된 폐의 백분율(들) 중 하나 이상을 포함하고,
    신체 조성 특징부들은 흉근 단면적, 흉근 제지방 단면적, 또는 피하지방 단면적 중 하나 이상을 포함하는, 비일시적 컴퓨터 판독가능 매체.
  98. 제96항에 있어서, 상기 폐 실질 특징부들은 상기 폐 실질의 밀도 측정 또는 상기 폐 실질의 국부적 히스토그램 측정들 중 하나 이상을 포함하는, 비일시적 컴퓨터 판독가능 매체.
  99. 제98항에 있어서, 상기 폐 실질의 상기 밀도 측정은 상기 폐의 낮은 감쇠 영역의 백분율, 상기 폐의 높은 감쇠 영역의 백분율, 및 폐 아랫부분에 비교하여 폐 윗부분에서의 낮은 감쇠 또는 높은 감쇠 영역의 비율 중 하나 이상을 포함하는, 비일시적 컴퓨터 판독가능 매체.
  100. 제98항에 있어서, 상기 폐 실질의 상기 국부적 히스토그램 측정들은 정상 조직, 중심소엽 폐기종, 중심소엽 결절, 간유리음영, 벌집모양, 선형 흉터, 결절형, 그물형, 흉막하선, 기타 폐기종, 또는 낭종 중 임의의 것에 의해 점유된 폐의 하나 이상의 백분율(들)을 포함하는, 비일시적 컴퓨터 판독가능 매체.
  101. 제96항에 있어서, 신체 조성 특징부들은 흉근 단면적, 흉근 제지방 단면적, 또는 피하지방 단면적 중 하나 이상을 포함하는, 비일시적 컴퓨터 판독가능 매체.
  102. 제96항 또는 제98항 내지 제101항 중 어느 한 항에 있어서, 상기 추출된 특징부들은 결절 특이 특징부들을 추가로 포함하는, 비일시적 컴퓨터 판독가능 매체.
  103. 제102항에 있어서, 상기 결절 특이 특징부들은 결절 특이 감쇠, 결절 마진 설명, 결절 크기, 결절 형상, 결절 텍스처, 결절 직경, Lung-RADS 점수, 또는 라디오믹 특징부들 중 하나 이상을 포함하는, 비일시적 컴퓨터 판독가능 매체.
  104. 제103항에 있어서, 라디오믹 특징부들은 1차 통계, 3D 형상 기반 특징부들, 2D 형상 기반 특징부들, 그레이 레벨 동시발생 행렬, 그레이 레벨 반복 길이 행렬, 그레이 레벨 크기 영역 행렬, 이웃 그레이 톤 차이 행렬, 및 그레이 레벨 의존성 행렬 중 하나 이상을 포함하는, 비일시적 컴퓨터 판독가능 매체.
  105. 제102항 내지 제104항 중 어느 한 항에 있어서, 상기 결절 특이 특징부들은 방사선과의사 보고서로부터 추출되는, 비일시적 컴퓨터 판독가능 매체.
  106. 제102항 내지 제104항 중 어느 한 항에 있어서, 상기 결절 특이 특징부들은 이미지 분석 알고리즘을 구현함으로써 연산적으로 추출되는, 비일시적 컴퓨터 판독가능 매체.
  107. 제96항 또는 제98항 내지 제106항 중 어느 한 항에 있어서, 상기 프로세서로 하여금 상기 대상체에 대한 상기 폐암의 하나 이상의 향후 위험들을 예측하게 하는 상기 명령어들은, 상기 프로세서에 의해 실행 시, 상기 프로세서로 하여금 5년 위험 예측 모델을 적용하여 상기 대상체가 5년 내에 폐암을 발전시킬 가능성이 있는지 예측하게 하는 명령어들을 추가로 포함하는, 비일시적 컴퓨터 판독가능 매체.
  108. 제107항에 있어서, 상기 5년 위험 예측 모델은 결절 특이 특징부들 및 비-결절 특이 특징부들을 포함하고, 상기 비-결절 특이 특징부들은 상기 결절 특이 특징부들보다 더 높은 특징부 중요도 값들을 갖는, 비일시적 컴퓨터 판독가능 매체.
  109. 제108항에 있어서, 가장 높은 특징부 중요도 값들을 갖는 상위 3개의 추출된 특징부들의 50% 초과는 비-결절 특이 특징부들인, 비일시적 컴퓨터 판독가능 매체.
  110. 제108항에 있어서, 가장 높은 특징부 중요도 값들을 갖는 상위 5개의 추출된 특징부들의 50% 초과는 비-결절 특이 특징부들인, 비일시적 컴퓨터 판독가능 매체.
  111. 제108항에 있어서, 가장 높은 특징부 중요도 값들을 갖는 상위 10개의 추출된 특징부들의 50% 초과는 비-결절 특이 특징부들인, 비일시적 컴퓨터 판독가능 매체.
  112. 제107항 내지 제111항 중 어느 한 항에 있어서, 상기 대상체가 후보라고 결정하는 것은 Lung-RADS 1, Lung-RADS 2, Lung-RADS 3, Lung-RADS 4A, 또는 Lung-RADS 4B 중 하나에서 상기 대상체의 분류를 획득하는 것을 포함하는, 비일시적 컴퓨터 판독가능 매체.
  113. 제112항에 있어서, 상기 5년 위험 예측 모델은 적어도 0.74의 곡선하면적(AUC) 값을 나타내는, 비일시적 컴퓨터 판독가능 매체.
  114. 제112항에 있어서, 상기 5년 위험 예측 모델은 배경 발생률과 비교하여 누적 발생에서 적어도 5.1배 증가를 달성하는, 비일시적 컴퓨터 판독가능 매체.
  115. 제107항 내지 제111항 중 어느 한 항에 있어서, 상기 대상체가 후보라고 결정하는 것은 상기 대상체가 Lung-RADS 1, Lung-RADS 2, Lung-RADS 3, 또는 Lung-RADS 4A 중 임의의 것으로 분류된다고 결정하는 것을 추가로 포함하는, 비일시적 컴퓨터 판독가능 매체.
  116. 제115항에 있어서, 상기 5년 위험 예측 모델은 적어도 0.72의 곡선하면적(AUC) 값을 나타내는, 비일시적 컴퓨터 판독가능 매체.
  117. 제115항에 있어서, 상기 5년 위험 예측 모델은 배경 발생률과 비교하여 누적 발생에서 적어도 3.9배 증가를 달성하는, 비일시적 컴퓨터 판독가능 매체.
  118. 제107항 내지 제111항 중 어느 한 항에 있어서, 상기 대상체가 후보라고 결정하는 것은 상기 대상체가 Lung-RADS 1, Lung-RADS 2, 또는 Lung-RADS 3 중 임의의 것으로 분류된다고 결정하는 것을 추가로 포함하는, 비일시적 컴퓨터 판독가능 매체.
  119. 제118항에 있어서, 상기 5년 위험 예측 모델은 적어도 0.67의 곡선하면적(AUC) 값을 나타내는, 비일시적 컴퓨터 판독가능 매체.
  120. 제118항에 있어서, 상기 5년 위험 예측 모델은 배경 발생률과 비교하여 누적 발생에서 적어도 3.7배 증가를 달성하는, 비일시적 컴퓨터 판독가능 매체.
  121. 제107항 내지 제111항 중 어느 한 항에 있어서, 상기 대상체가 후보라고 결정하는 것은 상기 대상체가 Lung-RADS 1 또는 Lung-RADS 2 중 임의의 것으로 분류된다고 결정하는 것을 추가로 포함하는, 비일시적 컴퓨터 판독가능 매체.
  122. 제121항에 있어서, 상기 5년 위험 예측 모델은 적어도 0.65의 곡선하면적(AUC) 값을 나타내는, 비일시적 컴퓨터 판독가능 매체.
  123. 제121항에 있어서, 상기 5년 위험 예측 모델은 배경 발생률과 비교하여 누적 발생에서 적어도 1.9배 증가를 달성하는, 비일시적 컴퓨터 판독가능 매체.
  124. 제107항 내지 제111항 중 어느 한 항에 있어서, 상기 대상체가 후보라고 결정하는 것은 상기 대상체가 Lung-RADS 1로 분류된다고 결정하는 것을 추가로 포함하는, 비일시적 컴퓨터 판독가능 매체.
  125. 제124항에 있어서, 상기 5년 위험 예측 모델은 적어도 0.57의 곡선하면적(AUC) 값을 나타내는, 비일시적 컴퓨터 판독가능 매체.
  126. 제124항에 있어서, 상기 5년 위험 예측 모델은 배경 발생률과 비교하여 누적 발생에서 적어도 1.9배 증가를 달성하는, 비일시적 컴퓨터 판독가능 매체.
  127. 제96항 또는 제98항 내지 제106항 중 어느 한 항에 있어서, 상기 프로세서로 하여금 상기 대상체에 대한 상기 폐암의 하나 이상의 향후 위험들을 예측하게 하는 상기 명령어들은, 상기 프로세서에 의해 실행 시, 상기 프로세서로 하여금 3년 위험 예측 모델을 적용하여 상기 대상체가 3년 내에 폐암을 발전시킬 가능성이 있는지 예측하게 하는 명령어들을 추가로 포함하는, 비일시적 컴퓨터 판독가능 매체.
  128. 제127항에 있어서, 상기 3년 위험 예측 모델은 결절 특이 특징부들 및 비-결절 특이 특징부들을 포함하고, 상기 비-결절 특이 특징부들은 상기 결절 특이 특징부들보다 더 높은 특징부 중요도 값들을 갖는, 비일시적 컴퓨터 판독가능 매체.
  129. 제128항에 있어서, 가장 높은 특징부 중요도 값들을 갖는 상위 5개의 추출된 특징부들의 50% 초과는 비-결절 특이 특징부들인, 비일시적 컴퓨터 판독가능 매체.
  130. 제128항에 있어서, 가장 높은 특징부 중요도 값들을 갖는 상위 10개의 추출된 특징부들의 50% 초과는 비-결절 특이 특징부들인, 비일시적 컴퓨터 판독가능 매체.
  131. 제127항 내지 제130항 중 어느 한 항에 있어서, 상기 대상체가 후보라고 결정하는 것은 Lung-RADS 1, Lung-RADS 2, Lung-RADS 3, Lung-RADS 4A, 또는 Lung-RADS 4B 중 하나에서 상기 대상체의 분류를 획득하는 것을 포함하는, 비일시적 컴퓨터 판독가능 매체.
  132. 제131항에 있어서, 상기 3년 위험 예측 모델은 적어도 0.79의 곡선하면적(AUC) 값을 나타내는, 비일시적 컴퓨터 판독가능 매체.
  133. 제131항에 있어서, 상기 3년 위험 예측 모델은 배경 발생률과 비교하여 누적 발생에서 적어도 6.3배 증가를 달성하는, 비일시적 컴퓨터 판독가능 매체.
  134. 제127항 내지 제130항 중 어느 한 항에 있어서, 상기 대상체가 후보라고 결정하는 것은 상기 대상체가 Lung-RADS 1, Lung-RADS 2, Lung-RADS 3, 또는 Lung-RADS 4A 중 임의의 것으로 분류된다고 결정하는 것을 추가로 포함하는, 비일시적 컴퓨터 판독가능 매체.
  135. 제134항에 있어서, 상기 3년 위험 예측 모델은 적어도 0.72의 곡선하면적(AUC) 값을 나타내는, 비일시적 컴퓨터 판독가능 매체.
  136. 제134항에 있어서, 상기 3년 위험 예측 모델은 배경 발생률과 비교하여 누적 발생에서 적어도 5.1배 증가를 달성하는, 비일시적 컴퓨터 판독가능 매체.
  137. 제127항 내지 제130항 중 어느 한 항에 있어서, 상기 대상체가 후보라고 결정하는 것은 상기 대상체가 Lung-RADS 1, Lung-RADS 2, 또는 Lung-RADS 3 중 임의의 것으로 분류된다고 결정하는 것을 추가로 포함하는, 비일시적 컴퓨터 판독가능 매체.
  138. 제137항에 있어서, 상기 3년 위험 예측 모델은 적어도 0.72의 곡선하면적(AUC) 값을 나타내는, 비일시적 컴퓨터 판독가능 매체.
  139. 제137항에 있어서, 상기 3년 위험 예측 모델은 배경 발생률과 비교하여 누적 발생에서 적어도 5.7배 증가를 달성하는, 비일시적 컴퓨터 판독가능 매체.
  140. 제137항에 있어서, 상기 3년 위험 예측 모델은 적어도 0.676의 곡선하면적(AUC) 값을 나타내는, 비일시적 컴퓨터 판독가능 매체.
  141. 제127항 내지 제130항 중 어느 한 항에 있어서, 상기 대상체가 후보라고 결정하는 것은 상기 대상체가 Lung-RADS 1 또는 Lung-RADS 2 중 임의의 것으로 분류된다고 결정하는 것을 추가로 포함하는, 비일시적 컴퓨터 판독가능 매체.
  142. 제141항에 있어서, 상기 3년 위험 예측 모델은 적어도 0.65의 곡선하면적(AUC) 값을 나타내는, 비일시적 컴퓨터 판독가능 매체.
  143. 제141항에 있어서, 상기 3년 위험 예측 모델은 배경 발생률과 비교하여 누적 발생에서 적어도 3배 증가를 달성하는, 비일시적 컴퓨터 판독가능 매체.
  144. 제127항 내지 제130항 중 어느 한 항에 있어서, 상기 대상체가 후보라고 결정하는 것은 상기 대상체가 Lung-RADS 1로 분류된다고 결정하는 것을 추가로 포함하는, 비일시적 컴퓨터 판독가능 매체.
  145. 제144항에 있어서, 상기 3년 위험 예측 모델은 적어도 0.60의 곡선하면적(AUC) 값을 나타내는, 비일시적 컴퓨터 판독가능 매체.
  146. 제144항에 있어서, 상기 3년 위험 예측 모델은 배경 발생률과 비교하여 누적 발생에서 적어도 2.3배 증가를 달성하는, 비일시적 컴퓨터 판독가능 매체.
  147. 제96항 또는 제98항 내지 제106항 중 어느 한 항에 있어서, 상기 프로세서로 하여금 상기 대상체에 대한 상기 폐암의 하나 이상의 향후 위험들을 예측하게 하는 상기 명령어들은, 상기 프로세서에 의해 실행 시, 상기 프로세서로 하여금 1년 위험 예측 모델을 적용하여 상기 대상체가 1년 내에 폐암을 발전시킬 가능성이 있는지 예측하게 하는 명령어들을 추가로 포함하는, 비일시적 컴퓨터 판독가능 매체.
  148. 제147항에 있어서, 상기 1년 위험 예측 모델은 결절 특이 특징부들 및 비-결절 특이 특징부들을 포함하고, 상기 비-결절 특이 특징부들은 상기 결절 특이 특징부들보다 더 높은 특징부 중요도 값들을 갖는, 비일시적 컴퓨터 판독가능 매체.
  149. 제147항 또는 제148항에 있어서, 상기 대상체가 후보라고 결정하는 것은 상기 대상체가 Lung-RADS 1 또는 Lung-RADS 2 중 임의의 것으로 분류된다고 결정하는 것을 추가로 포함하는, 비일시적 컴퓨터 판독가능 매체.
  150. 제149항에 있어서, 상기 1년 위험 예측 모델은 적어도 0.72의 곡선하면적(AUC) 값을 나타내는, 비일시적 컴퓨터 판독가능 매체.
  151. 제149항에 있어서, 상기 1년 위험 예측 모델은 배경 발생률과 비교하여 누적 발생에서 적어도 5.5배 증가를 달성하는, 비일시적 컴퓨터 판독가능 매체.
  152. 제147항 또는 제148항에 있어서, 상기 대상체가 후보라고 결정하는 것은 상기 대상체가 Lung-RADS 1로 분류된다고 결정하는 것을 추가로 포함하는, 비일시적 컴퓨터 판독가능 매체.
  153. 제152항에 있어서, 상기 1년 위험 예측 모델은 적어도 0.57의 곡선하면적(AUC) 값을 나타내는, 비일시적 컴퓨터 판독가능 매체.
  154. 제147항에 있어서, 상기 1년 위험 예측 모델은 결절 특이 특징부들 및 비-결절 특이 특징부들을 포함하고, 상기 결절 특이 특징부들은 상기 비-결절 특이 특징부들보다 더 높은 특징부 중요도 값들을 갖는, 비일시적 컴퓨터 판독가능 매체.
  155. 제154항에 있어서, 가장 높은 특징부 중요도 값들을 갖는 상위 3개의 추출된 특징부들의 50% 초과는 비-결절 특이 특징부들인, 비일시적 컴퓨터 판독가능 매체.
  156. 제154항 또는 제155항에 있어서, 상기 대상체가 후보라고 결정하는 것은 Lung-RADS 1, Lung-RADS 2, Lung-RADS 3, Lung-RADS 4A, 또는 Lung-RADS 4B 중 하나에서 상기 대상체의 분류를 획득하는 것을 포함하는, 비일시적 컴퓨터 판독가능 매체.
  157. 제156항에 있어서, 상기 1년 위험 예측 모델은 적어도 0.90의 곡선하면적(AUC) 값을 나타내는, 비일시적 컴퓨터 판독가능 매체.
  158. 제156항에 있어서, 상기 1년 위험 예측 모델은 배경 발생률과 비교하여 누적 발생에서 적어도 11배 증가를 달성하는, 비일시적 컴퓨터 판독가능 매체.
  159. 제154항 또는 제155항에 있어서, 상기 대상체가 후보라고 결정하는 것은 상기 대상체가 Lung-RADS 1, Lung-RADS 2, Lung-RADS 3, 또는 Lung-RADS 4A 중 임의의 것으로 분류된다고 결정하는 것을 추가로 포함하는, 비일시적 컴퓨터 판독가능 매체.
  160. 제159항에 있어서, 상기 1년 위험 예측 모델은 적어도 0.81의 곡선하면적(AUC) 값을 나타내는, 비일시적 컴퓨터 판독가능 매체.
  161. 제159항에 있어서, 상기 1년 위험 예측 모델은 배경 발생률과 비교하여 누적 발생에서 적어도 7.6배 증가를 달성하는, 비일시적 컴퓨터 판독가능 매체.
  162. 제155항 내지 제160항 중 어느 한 항에 있어서, 가장 높은 특징부 중요도 값들을 갖는 상위 5개의 추출된 특징부들의 50% 초과는 비-결절 특이 특징부들인, 비일시적 컴퓨터 판독가능 매체.
  163. 제154항 또는 제155항에 있어서, 상기 대상체가 후보라고 결정하는 것은 상기 대상체가 Lung-RADS 1, Lung-RADS 2, 또는 Lung-RADS 3 중 임의의 것으로 분류된다고 결정하는 것을 추가로 포함하는, 비일시적 컴퓨터 판독가능 매체.
  164. 제162항에 있어서, 상기 1년 위험 예측 모델은 적어도 0.82의 곡선하면적(AUC) 값을 나타내는, 비일시적 컴퓨터 판독가능 매체.
  165. 제162항에 있어서, 상기 1년 위험 예측 모델은 배경 발생률과 비교하여 누적 발생에서 적어도 8.6배 증가를 달성하는, 비일시적 컴퓨터 판독가능 매체.
  166. 제96항 또는 제98항 내지 제106항 중 어느 한 항에 있어서, 상기 프로세서로 하여금 상기 대상체에 대한 상기 폐암의 하나 이상의 향후 위험들을 예측하게 하는 상기 명령어들은, 상기 프로세서에 의해 실행 시, 상기 프로세서로 하여금 다수의 위험 예측 모델들을 적용하여 상기 대상체가 N의 상이한 기간들 내에 폐암을 발전시킬 가능성이 있는지 예측하게 하는 명령어들을 추가로 포함하는, 비일시적 컴퓨터 판독가능 매체.
  167. 제166항에 있어서, 상기 N의 상이한 기간들 중 적어도 하나는 6개월, 1년, 1.5년, 2년, 2.5년, 3년, 3.5년, 4년, 4.5년, 5년, 5.5년, 6년, 6.5년, 7년, 7.5년, 8년, 8.5년, 9년, 9.5년, 10년, 10.5년, 11년, 11.5년, 12년, 12.5년, 13년, 13.5년, 14년, 14.5년, 15년, 15.5년, 16년, 16.5년, 17년, 17.5년, 18년, 18.5년, 19년, 19.5년, 또는 20년 중 어느 하나인, 비일시적 컴퓨터 판독가능 매체.
  168. 제166항에 있어서, N은 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 또는 20의 상이한 기간들인, 비일시적 컴퓨터 판독가능 매체.
  169. 제96항 내지 제166항 중 어느 한 항에 있어서, 상기 하나 이상의 위험 예측 모델들 중 하나는 Lung-RADS 1-4B의 임의의 것으로 분류된 트레이닝 개인들의 트레이닝 코호트로부터 캡처된 트레이닝 이미지들을 이용하여 상기 폐암의 향후 위험을 예측하도록 트레이닝된 Lung-RADS 1-4B 예측 모델인, 비일시적 컴퓨터 판독가능 매체.
  170. 제96항 내지 제166항 중 어느 한 항에 있어서, 상기 하나 이상의 위험 예측 모델들 중 하나는 Lung-RADS 1-4A의 임의의 것으로 분류된 트레이닝 개인들의 트레이닝 코호트로부터 캡처된 트레이닝 이미지들을 이용하여 상기 폐암의 향후 위험을 예측하도록 트레이닝된 Lung-RADS 1-4A 모델인, 비일시적 컴퓨터 판독가능 매체.
  171. 제96항 내지 제166항 중 어느 한 항에 있어서, 상기 하나 이상의 위험 예측 모델들 중 하나는 Lung-RADS 1-3의 임의의 것으로 분류된 트레이닝 개인들의 트레이닝 코호트로부터 캡처된 트레이닝 이미지들을 이용하여 상기 폐암의 향후 위험을 예측하기 위한 Lung-RADS 1-3 모델인, 비일시적 컴퓨터 판독가능 매체.
  172. 제96항 내지 제166항 중 어느 한 항에 있어서, 상기 하나 이상의 위험 예측 모델들 중 하나는 Lung-RADS 1 또는 2로 분류된 트레이닝 개인들의 트레이닝 코호트로부터 캡처된 트레이닝 이미지들을 이용하여 상기 폐암의 향후 위험을 예측하도록 트레이닝된 Lung-RADS 1-2 모델인, 비일시적 컴퓨터 판독가능 매체.
  173. 제96항 내지 제166항 중 어느 한 항에 있어서, 상기 하나 이상의 위험 예측 모델들 중 하나는 Lung-RADS 1로 분류된 트레이닝 개인들의 트레이닝 코호트로부터 캡처된 트레이닝 이미지들을 이용하여 상기 폐암의 향후 위험을 예측하도록 트레이닝된 Lung-RADS 1 모델인, 비일시적 컴퓨터 판독가능 매체.
  174. 제169항 내지 제173항 중 어느 한 항에 있어서, 상기 트레이닝 코호트의 대부분의 트레이닝 개인들은 이전에 Lung-RADS 1로 분류된, 비일시적 컴퓨터 판독가능 매체.
  175. 제96항 내지 제174항 중 어느 한 항에 있어서, 상기 하나 이상의 이미지들은 컴퓨터 단층촬영(CT) 이미지들 또는 X-선 이미지들인, 비일시적 컴퓨터 판독가능 매체.
  176. 제96항 내지 제175항 중 어느 한 항에 있어서, 상기 하나 이상의 이미지들은 흉부 CT 이미지들 또는 흉부 X-선 이미지들을 포함하는, 비일시적 컴퓨터 판독가능 매체.
  177. 제96항 내지 제176항 중 어느 한 항에 있어서, 상기 위험 예측 모델은 국가폐암검진연구(NLST)의 트레이닝 이미지들을 이용하여 트레이닝되는, 비일시적 컴퓨터 판독가능 매체.
  178. 제96항 내지 제177항 중 어느 한 항에 있어서, 상기 프로세서에 의해 실행 시, 상기 프로세서로 하여금:
    상기 대상체에 대해 폐암의 하나 이상의 향후 위험들을 예측하기 이전에:
    상기 대상체에 대응하는 결절-특이 특징부들을 획득하고;
    상기 결절-특이 특징부들에 기초하여 상기 대상체가 향후 위험 예측에 대한 후보라고 결정하게 하는 명령어들을 추가로 포함하는, 비일시적 컴퓨터 판독가능 매체.
  179. 제178항에 있어서, 상기 프로세서로 하여금 상기 대상체가 후보라고 결정하게 하는 상기 명령어들은, 상기 프로세서에 의해 실행 시, 상기 프로세서로 하여금 상기 대상체가 폐암을 갖고 있지 않거나 또는 폐암을 발전시킬 위험이 낮다고 결정하게 하는 명령어들을 추가로 포함하는, 비일시적 컴퓨터 판독가능 매체.
  180. 제179항에 있어서, 상기 프로세서로 하여금 상기 대상체가 폐암을 발전시킬 위험이 낮다고 결정하게 하는 상기 명령어들은, 상기 프로세서에 의해 실행 시, 상기 프로세서로 하여금 상기 결절-특이 특징부들에 기초하여 상기 대상체가 결절을 갖고 있지 않다고 결정하게 하는 명령어들을 추가로 포함하는, 비일시적 컴퓨터 판독가능 매체.
  181. 제96항 내지 제180항 중 어느 한 항에 있어서, 상기 폐암은 비-소세포 폐암 또는 소세포 폐암인, 비일시적 컴퓨터 판독가능 매체.
  182. 제96항 내지 제180항 중 어느 한 항에 있어서, 상기 폐암은 선암종 또는 편평세포암종인, 비일시적 컴퓨터 판독가능 매체.
  183. 제96항 내지 제182항 중 어느 한 항에 있어서, 상기 프로세서에 의해 실행 시, 상기 프로세서로 하여금 상기 폐암의 예측된 향후 위험에 기초하여 상기 대상체를 치료하기 위한 중재시술을 선택하게 하는 명령어들을 추가로 포함하는, 비일시적 컴퓨터 판독가능 매체.
  184. 제183항에 있어서, 상기 프로세서로 하여금 상기 중재시술을 선택하게 하는 상기 명령어들은, 상기 프로세서에 의해 실행 시, 상기 프로세서로 하여금 상기 대상체에 투여하기 위한 치료를 선택하게 하는 명령어들을 추가로 포함하는, 비일시적 컴퓨터 판독가능 매체.
  185. 제184항에 있어서, 상기 선택된 치료는 상기 폐암의 발전을 지연 또는 방지하기 위한 예방인, 비일시적 컴퓨터 판독가능 매체.
  186. 제96항 내지 제185항 중 어느 한 항에 있어서, 상기 트레이닝된 위험 예측 모델들 중 하나 이상은 랜덤 포레스트 모델 또는 그래디언트 부스트 모델 중 하나인, 비일시적 컴퓨터 판독가능 매체.
  187. 대상체에 대한 폐암의 하나 이상의 향후 위험들을 예측하기 위한 시스템으로서,
    단일 시점에서 상기 대상체의 하나 이상의 이미지들을 캡처하도록 구성된 이미징 디바이스; 및
    컴퓨팅 디바이스를 포함하고, 상기 컴퓨팅 디바이스는,
    상기 단일 시점에서 상기 대상체로부터 캡처된 하나 이상의 이미지들을 획득하는 단계;
    상기 하나 이상의 획득된 이미지들로부터 특징부들을 추출하는 단계 - 상기 추출된 특징부들은 적어도 비-결절 특이 특징부들을 포함하고, 상기 비-결절 특이 특징부들은 폐 실질 특징부들 또는 신체 조성 특징부들 중 하나 또는 둘 모두를 포함함 -;
    하나 이상의 트레이닝된 위험 예측 모델들을 적용하여 상기 하나 이상의 획득된 이미지들로부터의 상기 추출된 특징부들을 분석함으로써 상기 대상체에 대한 폐암의 하나 이상의 향후 위험들을 예측하는 단계를 수행하도록 구성된, 시스템.
  188. 제187항에 있어서, 상기 대상체에 대한 상기 폐암의 하나 이상의 향후 위험들을 예측하는 단계는 M년 위험 예측 모델을 적용하여 상기 대상체가 M년 내에 폐암을 발전시킬 가능성이 있는지 예측하는 단계를 포함하고, 상기 M년 위험 예측 모델은 결절 특이 특징부들 및 비-결절 특이 특징부들을 포함하고, 가장 높은 특징부 중요도 값들을 갖는 상위 3개의 추출된 특징부들의 50% 초과는 비-결절 특이 특징부들이고,
    폐 실질 특징부들은 상기 폐의 낮은 감쇠 영역의 백분율, 상기 폐의 높은 감쇠 영역의 백분율, 폐 아랫부분에 비교하여 폐 윗부분에서의 낮은 감쇠 또는 높은 감쇠 영역의 비율, 정상 조직, 중심소엽 폐기종, 중심소엽 결절, 간유리음영, 벌집모양, 선형 흉터, 결절형, 그물형, 흉막하선, 기타 폐기종, 또는 낭종 중 임의의 것에 의해 점유된 폐의 백분율(들) 중 하나 이상을 포함하고,
    신체 조성 특징부들은 흉근 단면적, 흉근 제지방 단면적, 또는 피하지방 단면적 중 하나 이상을 포함하는, 시스템.
  189. 제187항에 있어서, 상기 폐 실질 특징부들은 상기 폐 실질의 밀도 측정 또는 상기 폐 실질의 국부적 히스토그램 측정들 중 하나 이상을 포함하는, 시스템.
  190. 제189항에 있어서, 상기 폐 실질의 상기 밀도 측정은 상기 폐의 낮은 감쇠 영역의 백분율, 상기 폐의 높은 감쇠 영역의 백분율, 및 폐 아랫부분에 비교하여 폐 윗부분에서의 낮은 감쇠 또는 높은 감쇠 영역의 비율 중 하나 이상을 포함하는, 시스템.
  191. 제189항에 있어서, 상기 폐 실질의 상기 국부적 히스토그램 측정들은 정상 조직, 중심소엽 폐기종, 중심소엽 결절, 간유리음영, 벌집모양, 선형 흉터, 결절형, 그물형, 흉막하선, 기타 폐기종, 또는 낭종 중 임의의 것에 의해 점유된 폐의 하나 이상의 백분율(들)을 포함하는, 시스템.
  192. 제187항에 있어서, 신체 조성 특징부들은 흉근 단면적, 흉근 제지방 단면적, 또는 피하지방 단면적 중 하나 이상을 포함하는, 시스템.
  193. 제187항 또는 제189항 내지 제192항 중 어느 한 항에 있어서, 상기 추출된 특징부들은 결절 특이 특징부들을 추가로 포함하는, 시스템.
  194. 제193항에 있어서, 상기 결절 특이 특징부들은 결절 특이 감쇠, 결절 마진 설명, 결절 크기, 결절 형상, 결절 텍스처, 결절 직경, Lung-RADS 점수, 또는 라디오믹 특징부들 중 하나 이상을 포함하는, 시스템.
  195. 제194항에 있어서, 라디오믹 특징부들은 1차 통계, 3D 형상 기반 특징부들, 2D 형상 기반 특징부들, 그레이 레벨 동시발생 행렬, 그레이 레벨 반복 길이 행렬, 그레이 레벨 크기 영역 행렬, 이웃 그레이 톤 차이 행렬, 및 그레이 레벨 의존성 행렬 중 하나 이상을 포함하는, 시스템.
  196. 제193항 내지 제195항 중 어느 한 항에 있어서, 상기 결절 특이 특징부들은 방사선과의사 보고서로부터 추출되는, 시스템.
  197. 제193항 내지 제195항 중 어느 한 항에 있어서, 상기 결절 특이 특징부들은 이미지 분석 알고리즘을 구현함으로써 연산적으로 추출되는, 시스템.
  198. 제187항 또는 제189항 내지 제197항 중 어느 한 항에 있어서, 상기 대상체에 대한 상기 폐암의 하나 이상의 향후 위험들을 예측하는 단계는 5년 위험 예측 모델을 적용하여 상기 대상체가 5년 내에 폐암을 발전시킬 가능성이 있는지 예측하는 단계를 포함하는, 시스템.
  199. 제198항에 있어서, 상기 5년 위험 예측 모델은 결절 특이 특징부들 및 비-결절 특이 특징부들을 포함하고, 상기 비-결절 특이 특징부들은 상기 결절 특이 특징부들보다 더 높은 특징부 중요도 값들을 갖는, 시스템.
  200. 제199항에 있어서, 가장 높은 특징부 중요도 값들을 갖는 상위 3개의 추출된 특징부들의 50% 초과는 비-결절 특이 특징부들인, 시스템.
  201. 제199항에 있어서, 가장 높은 특징부 중요도 값들을 갖는 상위 5개의 추출된 특징부들의 50% 초과는 비-결절 특이 특징부들인, 시스템.
  202. 제199항에 있어서, 가장 높은 특징부 중요도 값들을 갖는 상위 10개의 추출된 특징부들의 50% 초과는 비-결절 특이 특징부들인, 시스템.
  203. 제198항 내지 제202항 중 어느 한 항에 있어서, 상기 대상체가 후보라고 결정하는 것은 Lung-RADS 1, Lung-RADS 2, Lung-RADS 3, Lung-RADS 4A, 또는 Lung-RADS 4B 중 하나에서 상기 대상체의 분류를 획득하는 것을 포함하는, 시스템.
  204. 제203항에 있어서, 상기 5년 위험 예측 모델은 적어도 0.74의 곡선하면적(AUC) 값을 나타내는, 시스템.
  205. 제203항에 있어서, 상기 5년 위험 예측 모델은 배경 발생률과 비교하여 누적 발생에서 적어도 5.1배 증가를 달성하는, 시스템.
  206. 제198항 내지 제202항 중 어느 한 항에 있어서, 상기 대상체가 후보라고 결정하는 것은 상기 대상체가 Lung-RADS 1, Lung-RADS 2, Lung-RADS 3, 또는 Lung-RADS 4A 중 임의의 것으로 분류된다고 결정하는 것을 추가로 포함하는, 시스템.
  207. 제206항에 있어서, 상기 5년 위험 예측 모델은 적어도 0.72의 곡선하면적(AUC) 값을 나타내는, 시스템.
  208. 제206항에 있어서, 상기 5년 위험 예측 모델은 배경 발생률과 비교하여 누적 발생에서 적어도 3.9배 증가를 달성하는, 시스템.
  209. 제198항 내지 제202항 중 어느 한 항에 있어서, 상기 대상체가 후보라고 결정하는 것은 상기 대상체가 Lung-RADS 1, Lung-RADS 2, 또는 Lung-RADS 3 중 임의의 것으로 분류된다고 결정하는 것을 추가로 포함하는, 시스템.
  210. 제209항에 있어서, 상기 5년 위험 예측 모델은 적어도 0.67의 곡선하면적(AUC) 값을 나타내는, 시스템.
  211. 제209항에 있어서, 상기 5년 위험 예측 모델은 배경 발생률과 비교하여 누적 발생에서 적어도 3.7배 증가를 달성하는, 시스템.
  212. 제198항 내지 제202항 중 어느 한 항에 있어서, 상기 대상체가 후보라고 결정하는 것은 상기 대상체가 Lung-RADS 1, 또는 Lung-RADS 2 중 임의의 것으로 분류된다고 결정하는 것을 추가로 포함하는, 시스템.
  213. 제212항에 있어서, 상기 5년 위험 예측 모델은 적어도 0.65의 곡선하면적(AUC) 값을 나타내는, 시스템.
  214. 제212항에 있어서, 상기 5년 위험 예측 모델은 배경 발생률과 비교하여 누적 발생에서 적어도 1.9배 증가를 달성하는, 시스템.
  215. 제198항 내지 제202항 중 어느 한 항에 있어서, 상기 대상체가 후보라고 결정하는 것은 상기 대상체가 Lung-RADS 1로 분류된다고 결정하는 것을 추가로 포함하는, 시스템.
  216. 제215항에 있어서, 상기 5년 위험 예측 모델은 적어도 0.57의 곡선하면적(AUC) 값을 나타내는, 시스템.
  217. 제215항에 있어서, 상기 5년 위험 예측 모델은 배경 발생률과 비교하여 누적 발생에서 적어도 1.9배 증가를 달성하는, 시스템.
  218. 제187항 또는 제189항 내지 제197항 중 어느 한 항에 있어서, 상기 대상체에 대한 상기 폐암의 하나 이상의 향후 위험들을 예측하는 단계는 3년 위험 예측 모델을 적용하여 상기 대상체가 3년 내에 폐암을 발전시킬 가능성이 있는지 예측하는 단계를 포함하는, 시스템.
  219. 제218항에 있어서, 상기 3년 위험 예측 모델은 결절 특이 특징부들 및 비-결절 특이 특징부들을 포함하고, 상기 비-결절 특이 특징부들은 상기 결절 특이 특징부들보다 더 높은 특징부 중요도 값들을 갖는, 시스템.
  220. 제219항에 있어서, 가장 높은 특징부 중요도 값들을 갖는 상위 5개의 추출된 특징부들의 50% 초과는 비-결절 특이 특징부들인, 시스템.
  221. 제219항에 있어서, 가장 높은 특징부 중요도 값들을 갖는 상위 10개의 추출된 특징부들의 50% 초과는 비-결절 특이 특징부들인, 시스템.
  222. 제218항 내지 제221항 중 어느 한 항에 있어서, 상기 대상체가 후보라고 결정하는 것은 Lung-RADS 1, Lung-RADS 2, Lung-RADS 3, Lung-RADS 4A, 또는 Lung-RADS 4B 중 하나에서 상기 대상체의 분류를 획득하는 것을 포함하는, 시스템.
  223. 제222항에 있어서, 상기 3년 위험 예측 모델은 적어도 0.79의 곡선하면적(AUC) 값을 나타내는, 시스템.
  224. 제222항에 있어서, 상기 3년 위험 예측 모델은 배경 발생률과 비교하여 누적 발생에서 적어도 6.3배 증가를 달성하는, 시스템.
  225. 제218항 내지 제221항 중 어느 한 항에 있어서, 상기 대상체가 후보라고 결정하는 것은 상기 대상체가 Lung-RADS 1, Lung-RADS 2, Lung-RADS 3, 또는 Lung-RADS 4A 중 임의의 것으로 분류된다고 결정하는 것을 추가로 포함하는, 시스템.
  226. 제225항에 있어서, 상기 3년 위험 예측 모델은 적어도 0.72의 곡선하면적(AUC) 값을 나타내는, 시스템.
  227. 제225항에 있어서, 상기 3년 위험 예측 모델은 배경 발생률과 비교하여 누적 발생에서 적어도 5.1배 증가를 달성하는, 시스템.
  228. 제218항 내지 제221항 중 어느 한 항에 있어서, 상기 대상체가 후보라고 결정하는 것은 상기 대상체가 Lung-RADS 1, Lung-RADS 2, 또는 Lung-RADS 3 중 임의의 것으로 분류된다고 결정하는 것을 추가로 포함하는, 시스템.
  229. 제228항에 있어서, 상기 3년 위험 예측 모델은 적어도 0.72의 곡선하면적(AUC) 값을 나타내는, 시스템.
  230. 제228항에 있어서, 상기 3년 위험 예측 모델은 배경 발생률과 비교하여 누적 발생에서 적어도 5.7배 증가를 달성하는, 시스템.
  231. 제228항에 있어서, 상기 3년 위험 예측 모델은 적어도 0.676의 곡선하면적(AUC) 값을 나타내는, 시스템.
  232. 제218항 내지 제221항 중 어느 한 항에 있어서, 상기 대상체가 후보라고 결정하는 것은 상기 대상체가 Lung-RADS 1, 또는 Lung-RADS 2 중 임의의 것으로 분류된다고 결정하는 것을 추가로 포함하는, 시스템.
  233. 제232항에 있어서, 상기 3년 위험 예측 모델은 적어도 0.65의 곡선하면적(AUC) 값을 나타내는, 시스템.
  234. 제232항에 있어서, 상기 3년 위험 예측 모델은 배경 발생률과 비교하여 누적 발생에서 적어도 3배 증가를 달성하는, 시스템.
  235. 제218항 내지 제221항 중 어느 한 항에 있어서, 상기 대상체가 후보라고 결정하는 것은 상기 대상체가 Lung-RADS 1로 분류된다고 결정하는 것을 추가로 포함하는, 시스템.
  236. 제235항에 있어서, 상기 3년 위험 예측 모델은 적어도 0.60의 곡선하면적(AUC) 값을 나타내는, 시스템.
  237. 제235항에 있어서, 상기 3년 위험 예측 모델은 배경 발생률과 비교하여 누적 발생에서 적어도 2.3배 증가를 달성하는, 시스템.
  238. 제187항 또는 제189항 내지 제197항 중 어느 한 항에 있어서, 상기 대상체에 대한 상기 폐암의 하나 이상의 향후 위험들을 예측하는 단계는 1년 위험 예측 모델을 적용하여 상기 대상체가 1년 내에 폐암을 발전시킬 가능성이 있는지 예측하는 단계를 포함하는, 시스템.
  239. 제238항에 있어서, 상기 1년 위험 예측 모델은 결절 특이 특징부들 및 비-결절 특이 특징부들을 포함하고, 상기 비-결절 특이 특징부들은 상기 결절 특이 특징부들보다 더 높은 특징부 중요도 값들을 갖는, 시스템.
  240. 제238항 또는 제239항에 있어서, 상기 대상체가 후보라고 결정하는 것은 상기 대상체가 Lung-RADS 1, 또는 Lung-RADS 2 중 임의의 것으로 분류된다고 결정하는 것을 추가로 포함하는, 시스템.
  241. 제240항에 있어서, 상기 1년 위험 예측 모델은 적어도 0.72의 곡선하면적(AUC) 값을 나타내는, 시스템.
  242. 제240항에 있어서, 상기 1년 위험 예측 모델은 배경 발생률과 비교하여 누적 발생에서 적어도 5.5배 증가를 달성하는, 시스템.
  243. 제238항 또는 제239항에 있어서, 상기 대상체가 후보라고 결정하는 것은 상기 대상체가 Lung-RADS 1로 분류된다고 결정하는 것을 추가로 포함하는, 시스템.
  244. 제243항에 있어서, 상기 1년 위험 예측 모델은 적어도 0.57의 곡선하면적(AUC) 값을 나타내는, 시스템.
  245. 제238항에 있어서, 상기 1년 위험 예측 모델은 결절 특이 특징부들 및 비-결절 특이 특징부들을 포함하고, 상기 결절 특이 특징부들은 상기 비-결절 특이 특징부들보다 더 높은 특징부 중요도 값들을 갖는, 시스템.
  246. 제245항에 있어서, 가장 높은 특징부 중요도 값들을 갖는 상위 3개의 추출된 특징부들의 50% 초과는 비-결절 특이 특징부들인, 시스템.
  247. 제245항 또는 제246항에 있어서, 상기 대상체가 후보라고 결정하는 것은 Lung-RADS 1, Lung-RADS 2, Lung-RADS 3, Lung-RADS 4A, 또는 Lung-RADS 4B 중 하나에서 상기 대상체의 분류를 획득하는 것을 포함하는, 시스템.
  248. 제247항에 있어서, 상기 1년 위험 예측 모델은 적어도 0.90의 곡선하면적(AUC) 값을 나타내는, 시스템.
  249. 제247항에 있어서, 상기 1년 위험 예측 모델은 배경 발생률과 비교하여 누적 발생에서 적어도 11배 증가를 달성하는, 시스템.
  250. 제245항 또는 제246항에 있어서, 상기 대상체가 후보라고 결정하는 것은 상기 대상체가 Lung-RADS 1, Lung-RADS 2, Lung-RADS 3, 또는 Lung-RADS 4A 중 임의의 것으로 분류된다고 결정하는 것을 추가로 포함하는, 시스템.
  251. 제250항에 있어서, 상기 1년 위험 예측 모델은 적어도 0.81의 곡선하면적(AUC) 값을 나타내는, 시스템.
  252. 제250항에 있어서, 상기 1년 위험 예측 모델은 배경 발생률과 비교하여 누적 발생에서 적어도 7.6배 증가를 달성하는, 시스템.
  253. 제246항 내지 제251항에 중 어느 한 항에 있어서, 가장 높은 특징부 중요도 값들을 갖는 상위 5개의 추출된 특징부들의 50% 초과는 비-결절 특이 특징부들인, 시스템.
  254. 제245항 또는 제246항에 있어서, 상기 대상체가 후보라고 결정하는 것은 상기 대상체가 Lung-RADS 1, Lung-RADS 2, 또는 Lung-RADS 3 중 임의의 것으로 분류된다고 결정하는 것을 추가로 포함하는, 시스템.
  255. 제254항에 있어서, 상기 1년 위험 예측 모델은 적어도 0.82의 곡선하면적(AUC) 값을 나타내는, 시스템.
  256. 제254항에 있어서, 상기 1년 위험 예측 모델은 배경 발생률과 비교하여 누적 발생에서 적어도 8.6배 증가를 달성하는, 시스템.
  257. 제187항 또는 제189항 내지 제197항 중 어느 한 항에 있어서, 상기 대상체에 대한 상기 폐암의 하나 이상의 향후 위험들을 예측하는 단계는 다수의 위험 예측 모델들을 적용하여 상기 대상체가 N의 상이한 기간들 내에 폐암을 발전시킬 가능성이 있는지 예측하는 단계를 포함하는, 시스템.
  258. 제257항에 있어서, 상기 N의 상이한 기간들 중 적어도 하나는 6개월, 1년, 1.5년, 2년, 2.5년, 3년, 3.5년, 4년, 4.5년, 5년, 5.5년, 6년, 6.5년, 7년, 7.5년, 8년, 8.5년, 9년, 9.5년, 10년, 10.5년, 11년, 11.5년, 12년, 12.5년, 13년, 13.5년, 14년, 14.5년, 15년, 15.5년, 16년, 16.5년, 17년, 17.5년, 18년, 18.5년, 19년, 19.5년, 또는 20년 중 어느 하나인, 시스템.
  259. 제257항에 있어서, N은 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 또는 20의 상이한 기간들인, 시스템.
  260. 제187항 내지 제259항 중 어느 한 항에 있어서, 상기 하나 이상의 위험 예측 모델들 중 하나는 Lung-RADS 1-4B의 임의의 것으로 분류된 트레이닝 개인들의 트레이닝 코호트로부터 캡처된 트레이닝 이미지들을 이용하여 상기 폐암의 향후 위험을 예측하도록 트레이닝된 Lung-RADS 1-4B 예측 모델인, 시스템.
  261. 제187항 내지 제259항 중 어느 한 항에 있어서, 상기 하나 이상의 위험 예측 모델들 중 하나는 Lung-RADS 1-4A의 임의의 것으로 분류된 트레이닝 개인들의 트레이닝 코호트로부터 캡처된 트레이닝 이미지들을 이용하여 상기 폐암의 향후 위험을 예측하도록 트레이닝된 Lung-RADS 1-4A 모델인, 시스템.
  262. 제187항 내지 제259항 중 어느 한 항에 있어서, 상기 하나 이상의 위험 예측 모델들 중 하나는 Lung-RADS 1-3의 임의의 것으로 분류된 트레이닝 개인들의 트레이닝 코호트로부터 캡처된 트레이닝 이미지들을 이용하여 상기 폐암의 향후 위험을 예측하기 위한 Lung-RADS 1-3 모델인, 시스템.
  263. 제187항 내지 제259항 중 어느 한 항에 있어서, 상기 하나 이상의 위험 예측 모델들 중 하나는 Lung-RADS 1 또는 2로 분류된 트레이닝 개인들의 트레이닝 코호트로부터 캡처된 트레이닝 이미지들을 이용하여 상기 폐암의 향후 위험을 예측하도록 트레이닝된 Lung-RADS 1-2 모델인, 시스템.
  264. 제187항 내지 제259항 중 어느 한 항에 있어서, 상기 하나 이상의 위험 예측 모델들 중 하나는 Lung-RADS 1로 분류된 트레이닝 개인들의 트레이닝 코호트로부터 캡처된 트레이닝 이미지들을 이용하여 상기 폐암의 향후 위험을 예측하도록 트레이닝된 Lung-RADS 1 모델인, 시스템.
  265. 제260항 내지 제264항 중 어느 한 항에 있어서, 상기 트레이닝 코호트의 대부분의 트레이닝 개인들은 이전에 Lung-RADS 1로 분류된, 시스템.
  266. 제187항 내지 제265항 중 어느 한 항에 있어서, 상기 하나 이상의 이미지들은 컴퓨터 단층촬영(CT) 이미지들 또는 X-선 이미지들인, 시스템.
  267. 제187항 내지 제266항 중 어느 한 항에 있어서, 상기 하나 이상의 이미지들은 흉부 CT 이미지들 또는 흉부 X-선 이미지들을 포함하는, 시스템.
  268. 제187항 내지 제267항 중 어느 한 항에 있어서, 상기 위험 예측 모델은 국가폐암검진연구(NLST)의 트레이닝 이미지들을 이용하여 트레이닝되는, 시스템.
  269. 제187항 내지 제268항 중 어느 한 항에 있어서, 상기 연산 디바이스는,
    상기 대상체에 대해 폐암의 하나 이상의 향후 위험들을 예측하기 이전에:
    상기 대상체에 대응하는 결절-특이 특징부들을 획득하고;
    상기 결절-특이 특징부들에 기초하여 상기 대상체가 향후 위험 예측에 대한 후보라고 결정하도록 추가로 구성된, 시스템.
  270. 제269항에 있어서, 상기 대상체가 후보라고 결정하는 것은 상기 대상체가 폐암을 갖고 있지 않거나 또는 폐암을 발전시킬 위험이 낮다고 결정하는 것을 포함하는, 시스템.
  271. 제270항에 있어서, 상기 대상체가 폐암을 발전시킬 위험이 낮다고 결정하는 것은 상기 결절-특이 특징부들에 기초하여 상기 대상체가 결절을 갖고 있지 않다고 결정하는 것을 포함하는, 시스템.
  272. 제187항 내지 제271항 중 어느 한 항에 있어서, 상기 폐암은 비-소세포 폐암 또는 소세포 폐암인, 시스템.
  273. 제187항 내지 제271항 중 어느 한 항에 있어서, 상기 폐암은 선암종 또는 편평세포암종인, 시스템.
  274. 제187항 내지 제273항 중 어느 한 항에 있어서, 상기 컴퓨팅 디바이스는 상기 폐암의 예측된 향후 위험에 기초하여 상기 대상체를 치료하기 위한 중재시술을 선택하는 단계를 수행하도록 추가로 구성된, 시스템.
  275. 제274항에 있어서, 상기 대상체를 치료하기 위한 상기 중재시술을 선택하는 것은 상기 대상체에 투여하기 위한 치료를 선택하는 것을 포함하는, 시스템.
  276. 제275항에 있어서, 상기 선택된 치료는 상기 폐암의 발전을 지연 또는 방지하기 위한 예방인, 시스템.
  277. 제187항 내지 제276항 중 어느 한 항에 있어서, 상기 트레이닝된 위험 예측 모델들 중 하나 이상은 랜덤 포레스트 모델 또는 그래디언트 부스트 모델 중 하나인, 시스템.
KR1020227028235A 2020-01-17 2021-01-15 향후 폐암의 위험을 예측하기 위한 시스템 및 방법 KR20220131530A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US202062962614P 2020-01-17 2020-01-17
US62/962,614 2020-01-17
PCT/US2021/013571 WO2021146516A1 (en) 2020-01-17 2021-01-15 System and method for predicting the risk of future lung cancer

Publications (1)

Publication Number Publication Date
KR20220131530A true KR20220131530A (ko) 2022-09-28

Family

ID=74661448

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020227028235A KR20220131530A (ko) 2020-01-17 2021-01-15 향후 폐암의 위험을 예측하기 위한 시스템 및 방법

Country Status (11)

Country Link
US (3) US11640661B2 (ko)
EP (1) EP4091136A1 (ko)
JP (1) JP2023511335A (ko)
KR (1) KR20220131530A (ko)
CN (1) CN115362470A (ko)
AU (1) AU2021207668A1 (ko)
BR (1) BR112022017882A2 (ko)
CA (1) CA3168230A1 (ko)
MX (1) MX2022008840A (ko)
TW (1) TW202141521A (ko)
WO (1) WO2021146516A1 (ko)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102283673B1 (ko) * 2020-11-30 2021-08-03 주식회사 코어라인소프트 병변 추적 검사에 기반하여 진단 보조 정보의 임계치를 조정하는 의료 영상 판독 지원 장치 및 방법
US11276173B1 (en) * 2021-05-24 2022-03-15 Qure.Ai Technologies Private Limited Predicting lung cancer risk
US20230128966A1 (en) * 2021-10-21 2023-04-27 Imam Abdulrahman Bin Faisal University System, method, and computer readable storage medium for accurate and rapid early diagnosis of covid-19 from chest x ray
AR128222A1 (es) 2022-01-07 2024-04-10 Johnson & Johnson Entpr Innovation Inc MATERIALES Y MÉTODOS DE PROTEÍNAS DE UNIÓN A IL-1b
US20230282356A1 (en) * 2022-03-04 2023-09-07 Nihon Kohden Digital Health Solutions, Inc. System that selects an optimal model combination to predict patient risks
TWI830166B (zh) * 2022-03-08 2024-01-21 國立成功大學 病理切片影像的脂滴分割方法與電腦程式產品
US20230298177A1 (en) * 2022-03-16 2023-09-21 Optellum Limited Method and apparatus to predict feature state change within an image
TWI802510B (zh) * 2022-09-21 2023-05-11 國泰醫療財團法人國泰綜合醫院 肺部結節輔助判讀系統及其方法

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9504529B2 (en) * 2014-02-24 2016-11-29 Vida Diagnostics, Inc. Treatment outcome prediction for lung volume reduction procedures
WO2016094330A2 (en) * 2014-12-08 2016-06-16 20/20 Genesystems, Inc Methods and machine learning systems for predicting the liklihood or risk of having cancer
US10064594B2 (en) 2015-08-06 2018-09-04 Case Western Reserve University Characterizing disease and treatment response with quantitative vessel tortuosity radiomics
US10492723B2 (en) * 2017-02-27 2019-12-03 Case Western Reserve University Predicting immunotherapy response in non-small cell lung cancer patients with quantitative vessel tortuosity
US11322259B2 (en) * 2017-09-08 2022-05-03 The General Hospital Corporation Patient risk stratification based on body composition derived from computed tomography images using machine learning
US10818386B2 (en) * 2018-11-21 2020-10-27 Enlitic, Inc. Multi-label heat map generating system
EP3719807A1 (en) * 2019-04-04 2020-10-07 Optos PLC Predicting a pathological condition from a medical image
US20220240881A1 (en) * 2019-07-22 2022-08-04 The Johns Hopkins University Lung cancer prediction
KR102318959B1 (ko) * 2019-09-10 2021-10-27 계명대학교 산학협력단 의료 영상을 해석하는 인공지능 모델을 이용한 폐암 발병 가능성 예측 방법 및 의료 영상 분석 장치
US11610304B2 (en) * 2019-10-11 2023-03-21 Case Western Reserve University Predicting tumor prognoses based on a combination of radiomic and clinico-pathological features
US11605164B2 (en) * 2019-10-22 2023-03-14 Shanghai United Imaging Intelligence Co., Ltd. Systems and methods for lung nodule evaluation
US11896349B2 (en) * 2019-12-09 2024-02-13 Case Western Reserve University Tumor characterization and outcome prediction through quantitative measurements of tumor-associated vasculature

Also Published As

Publication number Publication date
BR112022017882A2 (pt) 2023-01-17
JP2023511335A (ja) 2023-03-17
US11869187B2 (en) 2024-01-09
US20230215004A1 (en) 2023-07-06
US20240202917A1 (en) 2024-06-20
CA3168230A1 (en) 2021-07-22
AU2021207668A1 (en) 2022-09-15
EP4091136A1 (en) 2022-11-23
CN115362470A (zh) 2022-11-18
WO2021146516A1 (en) 2021-07-22
TW202141521A (zh) 2021-11-01
US20210233241A1 (en) 2021-07-29
US11640661B2 (en) 2023-05-02
MX2022008840A (es) 2022-10-07

Similar Documents

Publication Publication Date Title
KR20220131530A (ko) 향후 폐암의 위험을 예측하기 위한 시스템 및 방법
Wei et al. Computer-aided diagnosis of pancreas serous cystic neoplasms: a radiomics method on preoperative MDCT images
Zhu et al. Application of machine learning algorithms to predict central lymph node metastasis in T1-T2, non-invasive, and clinically node negative papillary thyroid carcinoma
de Castro et al. Predictors for papillary thyroid cancer persistence and recurrence: a retrospective analysis with a 10‐year follow‐up cohort study
Chen et al. The development and validation of a CT-based radiomics nomogram to preoperatively predict lymph node metastasis in high-grade serous ovarian cancer
Pareek et al. [Retracted] Predicting the Spread of Vessels in Initial Stage Cervical Cancer through Radiomics Strategy Based on Deep Learning Approach
Chen et al. Progression-free survival prediction in small cell lung cancer based on Radiomics analysis of contrast-enhanced CT
Saad et al. Computer-assisted subtyping and prognosis for non-small cell lung cancer patients with unresectable tumor
Meng et al. Mesenteric abnormalities play an important role in grading intestinal fibrosis in patients with Crohn’s disease: A computed tomography and clinical marker-based nomogram
Wang et al. A prognostic model of non-small cell lung cancer with a radiomics nomogram in an eastern Chinese population
Yan et al. A radiomics nomogram for non-invasive prediction of progression-free survival in esophageal squamous cell carcinoma
Rajalaxmi et al. A systematic review of lung cancer prediction using machine learning algorithm
Wu et al. Research on predicting hematoma expansion in spontaneous intracerebral hemorrhage based on deep features of the VGG-19 network
US20230027734A1 (en) System and Method for Predicting the Risk of Future Lung Cancer
Stojadinovic et al. Development of a Bayesian classifier for breast cancer risk stratification: a feasibility study
CN117917956A (zh) 用于预测未来肺癌的风险的系统和方法
Yang et al. Deep learning combining mammography and ultrasound images to predict the malignancy of BI-RADS US 4A lesions in women with dense breasts: a diagnostic study
Marappan et al. Lightweight Deep Learning Classification Model for Identifying Low‐Resolution CT Images of Lung Cancer
Saba et al. Lung Cancer Detection and Diagnosis with Deep Learning Models Evaluation
Leu et al. Survival prediction of NLST lung cancer patients from radiomics and clinical data
Li et al. Identification and validation of a radiomic signature for predicting survival outcomes in non-small-cell lung cancer treated with radiation therapy
Moreira Data Preprocessing Strategies in Cancer Stage Prediction
CN116848548A (zh) 预测淋巴结的癌累及的机器学习
Garcia Cerezo RADIOMIC EVALUATION OF GANGLIONAR AFFECTATION IN COLORECTAL CANCER PATIENTS
Ou et al. Deep Learning Analysis for Predicting Tumor Spread through Air Space in Early-Stage Lung Adenocarcinoma Pathology Images