KR20230124038A - 결장 세포 증식 장애의 조기 검출을 위한 마커 - Google Patents

결장 세포 증식 장애의 조기 검출을 위한 마커 Download PDF

Info

Publication number
KR20230124038A
KR20230124038A KR1020237024786A KR20237024786A KR20230124038A KR 20230124038 A KR20230124038 A KR 20230124038A KR 1020237024786 A KR1020237024786 A KR 1020237024786A KR 20237024786 A KR20237024786 A KR 20237024786A KR 20230124038 A KR20230124038 A KR 20230124038A
Authority
KR
South Korea
Prior art keywords
subject
protein
complement component
flt3l
fgf
Prior art date
Application number
KR1020237024786A
Other languages
English (en)
Inventor
헤일리 바르신스케
애덤 드레이크
크리슈난 칸나 팔라니아판
브라이언 디 오도노반
존 호킨스
Original Assignee
프리놈 홀딩스, 인크.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 프리놈 홀딩스, 인크. filed Critical 프리놈 홀딩스, 인크.
Publication of KR20230124038A publication Critical patent/KR20230124038A/ko

Links

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • G01N33/574Immunoassay; Biospecific binding assay; Materials therefor for cancer
    • G01N33/57407Specifically defined cancers
    • G01N33/57419Specifically defined cancers of colon
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • G16B40/20Supervised data analysis
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2333/00Assays involving biological materials from specific organisms or of a specific nature
    • G01N2333/435Assays involving biological materials from specific organisms or of a specific nature from animals; from humans
    • G01N2333/52Assays involving cytokines
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2333/00Assays involving biological materials from specific organisms or of a specific nature
    • G01N2333/82Translation products from oncogenes
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2800/00Detection or diagnosis of diseases
    • G01N2800/60Complex ways of combining multiple protein biomarkers for diagnosis

Landscapes

  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Medical Informatics (AREA)
  • Biomedical Technology (AREA)
  • Immunology (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Biotechnology (AREA)
  • Urology & Nephrology (AREA)
  • Chemical & Material Sciences (AREA)
  • Hematology (AREA)
  • Software Systems (AREA)
  • Public Health (AREA)
  • Pathology (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Biophysics (AREA)
  • Epidemiology (AREA)
  • Databases & Information Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Evolutionary Computation (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Microbiology (AREA)
  • Food Science & Technology (AREA)
  • Oncology (AREA)
  • Hospice & Palliative Care (AREA)
  • Analytical Chemistry (AREA)
  • Medicinal Chemistry (AREA)
  • Cell Biology (AREA)
  • Biochemistry (AREA)
  • Bioethics (AREA)
  • Mathematical Physics (AREA)
  • Computing Systems (AREA)

Abstract

본원에 개시된 시스템, 매체, 조성물, 방법 및 키트는 결장직장암을 포함하는 결장 세포 증식 장애의 조기 검출을 위한 단백질 바이오마커 패널과 관련된다. 본원에 기재된 단백질 패널에 대한 생물학적 샘플 내 단백질의 존재 또는 수준은 분류자 생성을 위해 사용될 수 있고, 결장 세포 증식 장애의 검출을 위한 집단에서 대상체를 분류하는 데 유용한 기계 학습 모델의 입력으로 사용될 수 있다.

Description

결장 세포 증식 장애의 조기 검출을 위한 마커
관련 출원에 대한 상호 참조
본 출원은 2020년 12월 21일에 출원된 미국 가출원 제63/128,545호의 이익을 주장하며, 이는 전체가 참조로 본원에 포함된다.
분야
본 개시내용은 진행성 선종 및 결장직장암을 포함하는 결장 세포 증식 장애의 조기 확인을 위한 바이오마커 및 방법에 관한 것이다.
결장직장암(CRC)은 서구 세계에서 암 관련된 사망의 주요 원인이다. CRC는 가장 잘 특징규명된 고형 종양 중 하나이지만 CRC는 늦은 진단으로 인해 선진국에서 계속해서 주요 사망 원인 중 하나이다. 무엇보다도 환자의 늦은 진단은 결장경검사와 같은 진단 시험이 너무 늦게 수행되기 때문이다. CRC로 인한 사망은 효과적인 조기 스크리닝을 통해 방지될 수 있다.
본 개시내용은 CRC 검출 및 질환 진행과 관련된 생물학적 샘플의 단백질 프로파일링에 관한 방법 및 시스템을 제공한다. 본원에 기재된 연구는 결장 세포 증식 장애의 특정 바이오마커의 존재를 나타내는 CRC의 특정 단백질 시그니처의 존재를 결정할 수 있게 하며, 결장 세포 증식 장애를 갖는 대상체로부터의 혈장을 사용하여 높은 특이도 및 높은 민감도로 결장 세포 증식 장애를 검출하고. 환자 집단을 계층화하고, 집단을 분류하는 잠재력을 갖는다.
한 측면에서, 본 개시내용은 EGF, FGF-2, FLT3L, 프락탈카인, IL-1a, IL-2, IL-6, IL-8, GROa, MIP-3a, 보체 성분 C2, 보체 성분 C9, 인자 D, 인자 I, MBL, MMP-2, GDF-15, 오스테오넥틴, 페리오스틴, ANGPTL4, FGF-21, FGF-23, HGF, 안지오포이에틴-2, BMP-9, IL-1RII(IL1R2), HGFR, IL-6ra, OPN, 테나신-C(TNC), 트롬보스폰딘-2(THBS2), uPAR, CD44, 칼리크레인-6, 메소텔린, EpCAM, Apo A1, AGP, A2MB, 페투인 A, HP, L-셀렉틴, 보체 성분 C1q, 보체 성분 C3, 보체 성분 C3b, 인자 B, 인자 H, 프로페르딘, AGRP, MMP-12, CYFRA21-1, HE4, 총 PSA, MIF, AFP, CA125, CA19-9, CA15-3(MUC-1), 및 CEA로 이루어진 군으로부터 선택되는 적어도 6개의 단백질을 포함하는 결장 세포 증식 장애에 특유한 미리 결정된 단백질 패널을 제공한다.
일부 실시양태에서, 패널은 FLT3L, CEACAM5, IL-6RA, ORM, 또는 이들의 조합을 포함한다.
일부 실시양태에서, 패널은 FLT3L, CEACAM5, IL-6RA, ORM, IL-8, AGP, IL-1RT2, TNC, GDF-15, 또는 이들의 조합을 포함한다.
일부 실시양태에서, 패널은 FLT3L, CEACAM5, IL-6RA, ORM, IL-8, AGP, IL-1RT2, TNC, GDF-15, AGRP, 합토글로빈, ANGPTL4, FGF-23, 보체 성분 C2, ORM2, FGF-23, MUC-16, EGF, 또는 이들의 조합을 포함한다.
일부 실시양태에서, 패널은 FLT3L, CEACAM5, IL-6, IL-8, MIP-3a, IL-1RT2, TNC, 또는 이들의 임의의 조합을 포함한다.
일부 실시양태에서, 패널은 FLT3L, CEACAM5, IL-6, IL-8, MIP-3a, IL-1RT2, TNC, HGFR, THBS2, CA125(MUC-16), CA19-9, CA15-3(MUC-1), 또는 이들의 임의의 조합을 포함한다.
일부 실시양태에서, 패널은 총 PSA를 포함한다.
일부 실시양태에서, 패널은 건강한 대상체, 양성 결장 폴립을 갖는 대상체, 진행성 선종을 갖는 대상체, 또는 결장직장암을 갖는 대상체를 구별하도록 구성된다.
일부 실시양태에서, 패널은 진행성 선종을 나타내도록 구성되며, 1) FLT3L, CEACAM5, IL-6RA, 및 ORM; 2) FLT3L, CEACAM5, IL-6RA, CEA, ORM, IL-8, AGP, IL-1RT2, TNC, 및 GDF-15; 또는 3) FLT3L, CEACAM5, IL-6RA, CEA, ORM, IL-8, AGP, IL-1RT2, TNC, GDF-15, AGRP, 합토글로빈, ANGPTL4, FGF-23, 보체 성분 C2, ORM2, FGF-23, MUC-16, EGF, p00738, 또는 이들의 조합을 포함한다.
일부 실시양태에서, 패널은 결장직장암을 나타내도록 구성되며, 1) FLT3L, CEACAM5, 및 IL-6RA; 2) FLT3L, CEACAM5, IL-6RA, IL-8, IL-1RT2, TNC, 및 이들의 조합; 또는 3) FLT3L, CEACAM5, IL-6RA, IL-8, AFP, IL-1RT2, TNC, MUC-16, EGF, 및 이들의 조합으로 이루어진 군으로부터 선택되는 단백질을 포함한다.
일부 실시양태에서, 결장 세포 증식 장애는 선종(선종성 폴립), 폴립증 장애, 린치 증후군, 무경성 톱니상 선종(SSA), 진행성 선종, 결장직장 형성이상, 결장직장 선종, 결장직장암, 결장암, 직장암, 결장직장 암종, 결장직장 선암종, 카르시노이드 종양, 위장 카르시노이드 종양, 위장 기질 종양(GIST), 림프종, 및 육종으로 이루어진 군으로부터 선택된다.
또 다른 측면에서, 본 발명은 결장 세포 증식 장애에 특유한 미리 결정된 단백질 패널로부터의 단백질을 대표하는 측정값 세트를 포함하는, 결장 세포 증식 장애를 갖는 대상체로부터 건강한 대상체의 집단을 구별하도록 구성된 분류자를 제공하며, 측정값 세트는 건강한 대상체의 샘플 및 결장 세포 증식 장애를 갖는 대상체의 샘플로부터의 단백질 발현 데이터로부터 수득되고, 측정값은 단백질 발현 데이터의 특성에 상응하는 피처 세트를 생성하는 데 사용되고, 피처 세트는 기계 학습 또는 통계 모델을 사용하여 컴퓨터 처리되며, 기계 학습 또는 통계 모델은 결장 세포 증식 장애를 갖는 대상체로부터 건강한 대상체의 집단을 구별할 수 있는 분류자로서 유용한 피처 벡터를 제공한다.
일부 실시양태에서, 미리 결정된 단백질 패널은 EGF, FGF-2, FLT3L, 프락탈카인, IL-1a, IL-2, IL-6, IL-8, GROa, MIP-3a, 보체 성분 C2, 보체 성분 C9, 인자 D, 인자 I, MBL, MMP-2, GDF-15, 오스테오넥틴, 페리오스틴, ANGPTL4, FGF-21, FGF-23, HGF, 안지오포이에틴-2, BMP-9, IL-1RII, HGFR, IL-6ra, OPN, 테나신-C, 트롬보스폰딘-2, uPAR, CD44, 칼리크레인-6, 메소텔린, EpCAM, Apo A1, AGP, A2MB, 페투인 A, HP, L-셀렉틴, 보체 성분 C1q, 보체 성분 C3, 보체 성분 C3b, 인자 B, 인자 H, 프로페르딘, AGRP, MMP-12, CYFRA21-1, HE4, 총 PSA, MIF, AFP, CA125, CA19-9, CA15-3(MUC-1), 및 CEA로 이루어진 그룹으로부터 선택되는 적어도 6개의 단백질을 포함한다.
일부 실시양태에서, 패널은 FLT3L, CEACAM5, IL-6RA, ORM, 또는 이들의 조합을 포함한다.
일부 실시양태에서, 패널은 FLT3L, CEACAM5, IL-6RA, ORM, IL-8, AGP, IL-1RT2, TNC, GDF-15, 또는 이들의 조합을 포함한다.
일부 실시양태에서, 패널은 FLT3L, CEACAM5, IL-6RA, ORM, IL-8, AGP, IL-1RT2, TNC, GDF-15, AGRP, 합토글로빈, ANGPTL4, FGF-23, 보체 성분 C2, ORM2, FGF-23, MUC-16, EGF, 또는 이들의 조합을 포함한다.
일부 실시양태에서, 패널은 FLT3L, CEACAM5, IL-6, IL-8, MIP-3a, IL-1RT2, TNC 또는 이들의 조합을 포함한다.
일부 실시양태에서, 패널은 FLT3L, CEACAM5, IL-6, IL-8, MIP-3a, IL-1RT2, TNC, HGFR, THBS2, CA125(MUC-16), CA19-9, CA15-3(MUC-1), 또는 이들의 조합을 포함한다.
일부 실시양태에서, 패널은 총 PSA를 포함한다.
일부 실시양태에서, 분류자는 건강한 대상체, 양성 결장 폴립을 갖는 대상체, 진행성 선종을 갖는 대상체, 또는 결장직장암을 갖는 대상체를 구별하도록 구성된다.
일부 실시양태에서, 패널은 진행성 선종을 나타내도록 구성되고, 1) FLT3L, CEACAM5, IL-6RA, ORM, 또는 이들의 조합으로부터 선택되는 단백질; 2) FLT3L, CEACAM5, IL-6RA, CEA, ORM, IL-8, AGP, IL-1RT2, TNC, GDF-15, 또는 이들의 조합으로부터 선택되는 단백질; 또는 3) FLT3L, CEACAM5, IL-6RA, CEA, ORM, IL-8, AGP, IL-1RT2, TNC, GDF-15, AGRP, 합토글로빈, ANGPTL4, FGF-23, 보체 성분 C2, ORM2, FGF-23, MUC-16, EGF, p00738, 또는 이들의 조합으로부터 선택되는 단백질을 포함한다.
일부 실시양태에서, 패널은 결장직장암을 나타내도록 구성되고, 1) FLT3L, CEACAM5, IL-6RA, 및 이들의 조합; 2) FLT3L, CEACAM5, IL-6RA, IL-8, IL-1RT2, TNC; 또는 3) FLT3L, CEACAM5, IL-6RA, ORM, IL-8, AGP, IL-1RT2, TNC, MUC-16, EGF, 및 이들의 조합으로부터 선택되는 단백질을 포함한다.
일부 실시양태에서, 결장 세포 증식 장애는 선종(선종성 폴립), 폴립증 장애, 린치 증후군, 무경성 톱니상 선종(SSA), 진행성 선종, 결장직장 형성이상, 결장직장 선종, 결장직장암, 결장암, 직장암, 결장직장 암종, 결장직장 선암종, 카르시노이드 종양, 위장 카르시노이드 종양, 위장 기질 종양(GIST), 림프종, 및 육종으로 이루어진 군으로부터 선택된다.
또 다른 측면에서, 본 개시내용은 미리 결정된 단백질 패널에 기초하여 대상체를 분류하도록 작동 가능한 분류자를 포함하는 컴퓨터 판독 가능 매체; 및 컴퓨터 판독 가능 매체에 저장된 명령을 실행하기 위한 하나 이상의 프로세서를 포함하는, 결장 세포 증식 장애를 검출하기 위한 기계 학습 모델 분류자를 포함하는 시스템을 제공한다.
일부 실시양태에서, 시스템은 결장 세포 증식 장애에 특유한 미리 결정된 단백질 패널로부터의 단백질을 대표하는 측정값 세트를 포함하는, 결장 세포 증식 장애를 갖는 대상체로부터 건강한 대상체의 집단을 구별하도록 구성된 분류자를 포함하고, 측정값 세트는 건강한 대상체의 샘플 및 결장 세포 증식 장애를 갖는 대상체의 샘플로부터의 단백질 발현 데이터로부터 수득되고, 측정값은 단백질 발현 데이터의 특성에 상응하는 피처 세트를 생성하는 데 사용되고, 피처 세트는 기계 학습 또는 통계 모델을 사용하여 컴퓨터 처리되며, 기계 학습 또는 통계 모델은 결장 세포 증식 장애를 갖는 대상체로부터 건강한 대상체의 집단을 구별할 수 있는 분류자로서 유용한 피처 벡터를 제공한다.
일부 실시양태에서, 패널은 EGF, FGF-2, FLT3L, 프락탈카인, IL-1a, IL-2, IL-6, IL-8, GROa, MIP-3a, 보체 성분 C2, 보체 성분 C9, 인자 D, 인자 I, MBL, MMP-2, GDF-15, 오스테오넥틴, 페리오스틴, ANGPTL4, FGF-21, FGF-23, HGF, 안지오포이에틴-2, BMP-9, IL-1RII, HGFR, IL-6ra, OPN, 테나신-C, 트롬보스폰딘-2, uPAR, CD44, 칼리크레인-6, 메소텔린, EpCAM, Apo A1, AGP, A2MB, 페투인 A, HP, L-셀렉틴, 보체 성분 C1q, 보체 성분 C3, 보체 성분 C3b, 인자 B, 인자 H, 프로페르딘, AGRP, MMP-12, CYFRA21-1, HE4, 총 PSA, MIF, AFP, CA125, CA19-9, CA15-3(MUC-1), 및 CEA로 이루어진 군으로부터 선택되는 적어도 6개의 단백질을 포함한다.
일부 실시양태에서, 기계 학습 모델은 결장 세포 증식 장애를 갖는 대상체에 상응하는 것으로 확인된 트레이닝 생물학적 샘플의 제1 서브세트 및 결장 세포 증식 장애를 갖지 않는 대상체에 상응하는 것으로 확인된 트레이닝 생물학적 샘플의 제2 서브세트인 트레이닝 생물학적 샘플로부터 수득된 트레이닝 데이터를 사용하여 트레이닝된다.
일부 실시양태에서, 분류자는 a) 단백질 시그니처 패널에 기초하여 대상체를 분류하도록 작동 가능한 분류자를 포함하는 컴퓨터 판독 가능 매체; 및 b) 컴퓨터 판독 가능 매체에 저장된 명령을 실행하기 위한 하나 이상의 프로세서를 포함하는, 결장 세포 증식 장애를 검출하기 위한 시스템에 제공된다.
일부 실시양태에서, 시스템은 심화 학습 분류자, 신경 네트워크 분류자, 선형 판별 분석(LDA) 분류자, 2차 판별 분석(QDA) 분류자, 서포트 벡터 머신(SVM) 분류자, 랜덤 포레스트(RF) 분류자, K 최근접 이웃, 선형 커넬 서포트 벡터 머신 분류자, 1차 또는 2차 다항 커넬 서포트 벡터 머신 분류자, 릿지 회귀 분류자, 엘라스틱 네트 알고리즘 분류자, 순차 최소 최적화 알고리즘 분류자, 나이브 베이즈 알고리즘 분류자, 및 주성분 분석 분류자로 이루어진 군으로부터 선택되는 기계 학습 분류자로서 구성된 분류 회로를 포함한다.
또 다른 측면에서, 본 개시내용은 하기 단계를 포함하는, 대상체로부터의 생물학적 샘플의 단백질 프로파일을 결정하는 방법을 제공한다:
a) 대상체로부터 단백질을 함유하는 생물학적 샘플을 수득하는 단계; 및
b) 생물학적 샘플에서 EGF, FGF-2, FLT3L, 프락탈카인, IL-1a, IL-2, IL-6, IL-8, GROa, MIP-3a, 보체 성분 C2, 보체 성분 C9, 인자 D, 인자 I, MBL, MMP-2, GDF-15, 오스테오넥틴, 페리오스틴, ANGPTL4, FGF-21, FGF-23, HGF, 안지오포이에틴-2, BMP-9, IL-1RII, HGFR, IL-6ra, OPN, 테나신-C, 트롬보스폰딘-2, uPAR, CD44, 칼리크레인-6, 메소텔린, EpCAM, Apo A1, AGP, A2MB, 페투인 A, HP, L-셀렉틴, 보체 성분 C1q, 보체 성분 C3, 보체 성분 C3b, 인자 B, 인자 H, 프로페르딘, AGRP, MMP-12, CYFRA21-1, HE4, 총 PSA, MIF, AFP, CA125, CA19-9, CA15-3(MUC-1), 및 CEA로 이루어진 군으로부터 선택되는 적어도 6개의 단백질을 포함하는 미리 결정된 단백질 패널로부터의 단백질의 양을 측정하여 대상체의 단백질 프로파일을 제공하는 단계.
일부 실시양태에서, 미리 결정된 단백질 패널은 FLT3L, CEACAM5, IL-6RA, ORM, 또는 이들의 조합을 포함한다.
일부 실시양태에서, 미리 결정된 단백질 패널은 FLT3L, CEACAM5, IL-6RA, ORM, IL-8, AGP, IL-1RT2, TNC, GDF-15, 또는 이들의 조합을 포함한다.
일부 실시양태에서, 미리 결정된 단백질 패널은 FLT3L, CEACAM5, IL-6RA, ORM, IL-8, AGP, IL-1RT2, TNC, GDF-15, AGRP, 합토글로빈, ANGPTL4, FGF-23, 보체 성분 C2, ORM2, FGF-23, MUC-16, EGF, 또는 이들의 조합을 포함한다.
일부 실시양태에서, 패널은 FLT3L, CEACAM5, IL-6, IL-8, MIP-3a, IL-1RT2, TNC, 또는 이들의 조합을 포함한다.
일부 실시양태에서, 패널은 FLT3L, CEACAM5, IL-6, IL-8, MIP-3a, IL-1RT2, TNC, HGFR, THBS2, CA125(MUC-16), CA19-9, CA15-3(MUC-1), 또는 이들의 조합을 포함한다.
일부 실시양태에서, 패널은 총 PSA를 포함한다.
일부 실시양태에서, 단백질 프로파일은 결장 세포 증식 장애와 관련되고, 결장 세포 증식 장애를 갖는 것으로 대상체의 분류를 제공한다.
일부 실시양태에서, 대상체로부터의 생물학적 샘플은 체액, 대변, 결장 유출물, 소변, 혈장, 혈청, 전혈, 단리된 혈액 세포, 혈액으로부터 단리된 세포, 조직 생검, 및 이들의 조합으로 이루어진 군으로부터 선택된다.
일부 실시양태에서, 결장 세포 증식 장애는 선종(선종성 폴립), 폴립증 장애, 린치 증후군, 무경성 톱니상 선종(SSA), 진행성 선종, 결장직장 형성이상, 결장직장 선종, 결장직장암, 결장암, 직장암, 결장직장 암종, 결장직장 선암종, 카르시노이드 종양, 위장 카르시노이드 종양, 위장 기질 종양(GIST), 림프종, 및 육종으로 이루어진 군으로부터 선택된다.
일부 실시양태에서, 방법은 대상체를 대상체의 단백질 프로파일에 기초하여 수술 및/또는 치료제로 치료하는 단계를 추가로 포함한다.
또 다른 측면에서, 본 개시내용은 하기 단계를 포함하는, 대상체에서 결장 세포 증식 장애를 검출하는 방법을 제공한다:
a) 대상체로부터 단백질을 함유하는 생물학적 샘플을 수득하는 단계;
b) 생물학적 샘플에서 EGF, FGF-2, FLT3L, 프락탈카인, IL-1a, IL-2, IL-6, IL-8, GROa, MIP-3a, 보체 성분 C2, 보체 성분 C9, 인자 D, 인자 I, MBL, MMP-2, GDF-15, 오스테오넥틴, 페리오스틴, ANGPTL4, FGF-21, FGF-23, HGF, 안지오포이에틴-2, BMP-9, IL-1RII, HGFR, IL-6ra, OPN, 테나신-C, 트롬보스폰딘-2, uPAR, CD44, 칼리크레인-6, 메소텔린, EpCAM, Apo A1, AGP, A2MB, 페투인 A, HP, L-셀렉틴, 보체 성분 C1q, 보체 성분 C3, 보체 성분 C3b, 인자 B, 인자 H, 프로페르딘, AGRP, MMP-12, CYFRA21-1, HE4, 총 PSA, MIF, AFP, CA125, CA19-9, CA15-3(MUC-1), 및 CEA로 이루어진 군으로부터 선택되는 적어도 6개의 단백질을 포함하는 미리 결정된 단백질 패널로부터의 단백질 양을 측정하여 대상체의 단백질 프로파일을 제공하는 단계; 및
c) 단백질 프로파일을 건강한 대상체와 결장 세포 증식 장애를 갖는 대상체를 구별할 수 있도록 트레이닝된 기계 학습 모델로 컴퓨터 처리하여 결장 세포 증식 장애의 존재 또는 부재와 관련된 출력값을 제공함으로써 대상체에서 결장 세포 증식 장애의 존재 또는 부재를 나타내는 단계.
일부 실시양태에서, 미리 결정된 단백질 패널은 FLT3L, CEACAM5, IL-6RA, ORM, 또는 이들의 조합을 포함한다.
일부 실시양태에서, 미리 결정된 단백질 패널은 FLT3L, CEACAM5, IL-6RA, ORM, IL-8, AGP, IL-1RT2, TNC, GDF-15, 또는 이들의 조합을 포함한다.
일부 실시양태에서, 미리 결정된 단백질 패널은 FLT3L, CEACAM5, IL-6RA, ORM, IL-8, AGP, IL-1RT2, TNC, GDF-15, AGRP, 합토글로빈, ANGPTL4, FGF-23, 보체 성분 C2, ORM2, FGF-23, MUC-16, EGF, 또는 이들의 조합을 포함한다.
일부 실시양태에서, 패널은 FLT3L, CEACAM5, IL-6, IL-8, MIP-3a, IL-1RT2, TNC 또는 이들의 조합을 포함한다.
일부 실시양태에서, 패널은 FLT3L, CEACAM5, IL-6, IL-8, MIP-3a, IL-1RT2, TNC, HGFR, THBS2, CA125(MUC-16), CA19-9, CA15-3(MUC-1), 또는 이들의 조합을 포함한다.
일부 실시양태에서, 패널은 총 PSA를 포함한다.
일부 실시양태에서, 단백질 프로파일은 결장 세포 증식 장애와 관련되고, 결장 세포 증식 장애를 갖는 것으로 대상체의 분류를 제공한다.
일부 실시양태에서, 대상체로부터의 생물학적 샘플은 체액, 대변, 결장 유출물, 소변, 혈장, 혈청, 전혈, 단리된 혈액 세포, 혈액으로부터 단리된 세포, 조직 생검, 및 이들의 조합으로 이루어진 군으로부터 선택된다.
일부 실시양태에서, 결장 세포 증식 장애는 선종(선종성 폴립), 폴립증 장애, 린치 증후군, 무경성 톱니상 선종(SSA), 진행성 선종, 결장직장 형성이상, 결장직장 선종, 결장직장암, 결장암, 직장암, 결장직장 암종, 결장직장 선암종, 카르시노이드 종양, 위장 카르시노이드 종양, 위장 기질 종양(GIST), 림프종, 및 육종으로 이루어진 군으로부터 선택된다.
일부 실시양태에서, 방법은 검출된 결장 세포 증식 장애에 기초하여 대상체에게 치료를 투여하는 단계를 추가로 포함한다. 일부 실시양태에서, 치료는 화학요법, 방사선요법, 면역요법, 또는 수술을 포함한다.
또 다른 측면에서, 하기 단계를 포함하는, 이전에 질환 치료를 받은 대상체에서 최소 잔류 질환을 모니터링하는 방법이 제공된다:
a) EGF, FGF-2, FLT3L, 프락탈카인, IL-1a, IL-2, IL-6, IL-8, GROa, MIP-3a, 보체 성분 C2, 보체 성분 C9, 인자 D, 인자 I, MBL, MMP-2, GDF-15, 오스테오넥틴, 페리오스틴, ANGPTL4, FGF-21, FGF-23, HGF, 안지오포이에틴-2, BMP-9, IL-1RII, HGFR, IL-6ra, OPN, 테나신-C, 트롬보스폰딘-2, uPAR, CD44, 칼리크레인-6, 메소텔린, EpCAM, Apo A1, AGP, A2MB, 페투인 A, HP, L-셀렉틴, 보체 성분 C1q, 보체 성분 C3, 보체 성분 C3b, 인자 B, 인자 H, 프로페르딘, AGRP, MMP-12, CYFRA21-1, HE4, 총 PSA, MIF, AFP, CA125, CA19-9, CA15-3(MUC-1), 및 CEA로 이루어진 군으로부터 선택되는 적어도 6개의 단백질의 패널을 사용하여 대상체로부터의 생물학적 샘플의 단백질 프로파일을 결정하여 기준선 단백질 상태를 생성하는 단계;
b) 기준선 단백질 상태를 생성한 후 하나 이상의 시점에서 대상체로부터 수득된 생물학적 샘플의 단백질 프로파일을 결정하여 현재 단백질 상태를 생성하는 단계; 및
c) 기준선 단백질 상태와 현재 단백질 상태 사이의 차이를 결정함으로써 대상체에서 최소 잔류 질환의 변화를 검출하는 단계.
일부 실시양태에서, 최소 잔류 질환은 치료에 대한 반응, 종양 부하, 수술 후 잔류 종양, 재발, 2차 스크린, 1차 스크린, 및 암 진행으로 이루어진 군으로부터 선택된다. 일부 실시양태에서, 방법은 대상체에서 최소 잔류 질환의 검출된 변화에 기초하여 대상체에게 치료를 투여하는 단계를 추가로 포함한다. 일부 실시양태에서, 치료는 화학요법, 방사선요법, 면역요법, 또는 수술을 포함한다. 치료는 대상체의 단백질 프로파일 및/또는 대상체의 생물학적 특성 세트에 적어도 부분적으로 기초하여 (예컨대, 복수의 가능한 치료 옵션 중에서) 선택되고 대상체에게 투여될 수 있다. 생물학적 특성은 측정, 진단, 예후 또는 예측(예컨대, 트레이닝된 기계 학습 분류자를 사용하여 결정됨)일 수 있다.
일부 실시양태에서, 생물학적 특성은 악성종양을 포함한다. 일부 실시양태에서, 생물학적 특성은 암 유형을 포함한다. 일부 실시양태에서, 생물학적 특성은 암 단계를 포함한다. 일부 실시양태에서, 생물학적 특성은 암 분류를 포함한다. 일부 실시양태에서, 암 분류는 암 등급을 포함한다. 일부 실시양태에서, 암 분류는 조직학적 분류를 포함한다. 일부 실시양태에서, 생물학적 특성은 대사 프로파일을 포함한다. 일부 실시양태에서, 생물학적 특성은 돌연변이를 포함한다. 일부 실시양태에서, 돌연변이는 질환 관련된 돌연변이이다. 일부 실시양태에서, 생물학적 특성은 임상 결과를 포함한다. 일부 실시양태에서, 생물학적 특성은 약물 반응을 포함한다.
또 다른 측면에서, 하기 단계를 포함하는, 치료에 대한 대상체의 반응을 결정하는 방법이 제공된다:
a) EGF, FGF-2, FLT3L, 프락탈카인, IL-1a, IL-2, IL-6, IL-8, GROa, MIP-3a, 보체 성분 C2, 보체 성분 C9, 인자 D, 인자 I, MBL, MMP-2, GDF-15, 오스테오넥틴, 페리오스틴, ANGPTL4, FGF-21, FGF-23, HGF, 안지오포이에틴-2, BMP-9, IL-1RII, HGFR, IL-6ra, OPN, 테나신-C, 트롬보스폰딘-2, uPAR, CD44, 칼리크레인-6, 메소텔린, EpCAM, Apo A1, AGP, A2MB, 페투인 A, HP, L-셀렉틴, 보체 성분 C1q, 보체 성분 C3, 보체 성분 C3b, 인자 B, 인자 H, 프로페르딘, AGRP, MMP-12, CYFRA21-1, HE4, 총 PSA, MIF, AFP, CA125, CA19-9, CA15-3(MUC-1), 및 CEA로로 이루어진 군으로부터 선택되는 적어도 6개의 단백질의 패널을 사용하여 대상체로부터의 생물학적 샘플의 단백질 프로파일을 결정하여 기준선 단백질 상태를 생성하는 단계;
b) 기준선 단백질 상태를 생성한 후 하나 이상의 시점에서 대상체로부터 수득된 생물학적 샘플의 단백질 프로파일을 결정하여 현재 단백질 상태를 생성하는 단계; 및
c) 기준선 단백질 상태와 현재 단백질 상태 사이의 차이를 결정함으로써 치료에 대한 대상체의 반응을 결정하는 단계.
일부 실시양태에서, 방법은 치료에 대한 대상체의 결정된 반응에 기초하여 대상체에게 치료를 투여하는 단계를 추가로 포함한다. 일부 실시양태에서, 치료는 화학요법, 방사선요법, 면역요법, 또는 수술을 포함한다.
또 다른 측면에서, 하기 단계를 포함하는, 대상체의 종양 부하를 모니터링하는 방법이 제공된다:
a) EGF, FGF-2, FLT3L, 프락탈카인, IL-1a, IL-2, IL-6, IL-8, GROa, MIP-3a, 보체 성분 C2, 보체 성분 C9, 인자 D, 인자 I, MBL, MMP-2, GDF-15, 오스테오넥틴, 페리오스틴, ANGPTL4, FGF-21, FGF-23, HGF, 안지오포이에틴-2, BMP-9, IL-1RII, HGFR, IL-6ra, OPN, 테나신-C, 트롬보스폰딘-2, uPAR, CD44, 칼리크레인-6, 메소텔린, EpCAM, Apo A1, AGP, A2MB, 페투인 A, HP, L-셀렉틴, 보체 성분 C1q, 보체 성분 C3, 보체 성분 C3b, 인자 B, 인자 H, 프로페르딘, AGRP, MMP-12, CYFRA21-1, HE4, 총 PSA, MIF, AFP, CA125, CA19-9, CA15-3(MUC-1), 및 CEA로 이루어진 군으로부터 선택되는 적어도 6개의 단백질의 패널을 사용하여 대상체로부터의 생물학적 샘플의 단백질 프로파일을 결정하여 기준선 단백질 상태를 생성하는 단계;
b) 기준선 단백질 상태를 생성한 후 하나 이상의 시점에서 대상체로부터 수득된 생물학적 샘플의 단백질 프로파일을 결정하여 현재 단백질 상태를 생성하는 단계; 및
c) 기준선 단백질 상태와 현재 단백질 상태 사이의 차이를 결정하여 대상체의 종양 부하를 모니터링하는 단계.
일부 실시양태에서, 방법은 대상체의 종양 부하에 기초하여 대상체에게 치료를 투여하는 단계를 추가로 포함한다. 일부 실시양태에서, 치료는 화학요법, 방사선요법, 면역요법, 또는 수술을 포함한다.
또 다른 측면에서, 하기 단계를 포함하는, 대상체의 수술 후 잔류 종양을 검출하는 방법이 제공된다:
a) EGF, FGF-2, FLT3L, 프락탈카인, IL-1a, IL-2, IL-6, IL-8, GROa, MIP-3a, 보체 성분 C2, 보체 성분 C9, 인자 D, 인자 I, MBL, MMP-2, GDF-15, 오스테오넥틴, 페리오스틴, ANGPTL4, FGF-21, FGF-23, HGF, 안지오포이에틴-2, BMP-9, IL-1RII, HGFR, IL-6ra, OPN, 테나신-C, 트롬보스폰딘-2, uPAR, CD44, 칼리크레인-6, 메소텔린, EpCAM, Apo A1, AGP, A2MB, 페투인 A, HP, L-셀렉틴, 보체 성분 C1q, 보체 성분 C3, 보체 성분 C3b, 인자 B, 인자 H, 프로페르딘, AGRP, MMP-12, CYFRA21-1, HE4, 총 PSA, MIF, AFP, CA125, CA19-9, CA15-3(MUC-1), 및 CEA로 이루어진 군으로부터 선택되는 적어도 6개의 단백질의 패널을 사용하여 대상체로부터의 생물학적 샘플의 단백질 프로파일을 결정하여 기준선 단백질 상태를 생성하는 단계;
b) 기준선 단백질 상태를 생성한 후 하나 이상의 시점에서 대상체로부터 수득된 생물학적 샘플의 단백질 프로파일을 결정하여 현재 단백질 상태를 생성하는 단계; 및
c) 기준선 단백질 상태와 현재 단백질 상태 사이의 차이를 결정하여 대상체의 수술 후 잔류 종양을 검출하는 단계.
일부 실시양태에서, 방법은 대상체의 수술 후 검출된 잔류 종양에 기초하여 대상체에게 치료를 투여하는 단계를 추가로 포함한다. 일부 실시양태에서, 치료는 화학요법, 방사선요법, 면역요법, 또는 수술을 포함한다.
또 다른 측면에서, 하기 단계를 포함하는, 대상체의 재발을 검출하는 방법이 제공된다:
a) EGF, FGF-2, FLT3L, 프락탈카인, IL-1a, IL-2, IL-6, IL-8, GROa, MIP-3a, 보체 성분 C2, 보체 성분 C9, 인자 D, 인자 I, MBL, MMP-2, GDF-15, 오스테오넥틴, 페리오스틴, ANGPTL4, FGF-21, FGF-23, HGF, 안지오포이에틴-2, BMP-9, IL-1RII, HGFR, IL-6ra, OPN, 테나신-C, 트롬보스폰딘-2, uPAR, CD44, 칼리크레인-6, 메소텔린, EpCAM, Apo A1, AGP, A2MB, 페투인 A, HP, L-셀렉틴, 보체 성분 C1q, 보체 성분 C3, 보체 성분 C3b, 인자 B, 인자 H, 프로페르딘, AGRP, MMP-12, CYFRA21-1, HE4, 총 PSA, MIF, AFP, CA125, CA19-9, CA15-3(MUC-1), 및 CEA로 이루어진 군으로부터 선택되는 적어도 6개의 단백질의 패널을 사용하여 대상체로부터의 생물학적 샘플의 단백질 프로파일을 결정하여 기준선 단백질 상태를 생성하는 단계;
b) 기준선 단백질 상태를 생성한 후 하나 이상의 시점에서 대상체로부터 수득된 생물학적 샘플의 단백질 프로파일을 결정하여 현재 단백질 상태를 생성하는 단계; 및
c) 기준선 단백질 상태와 현재 단백질 상태 사이의 차이를 결정하여 대상체의 재발을 검출하는 단계.
일부 실시양태에서, 방법은 대상체의 검출된 재발에 기초하여 대상체에게 치료를 투여하는 단계를 추가로 포함한다. 일부 실시양태에서, 치료는 화학요법, 방사선요법, 면역요법, 또는 수술을 포함한다.
또 다른 측면에서, 대상체의 단백질 프로파일에 적어도 부분적으로 기초하여 2차 스크린을 수행하는 방법이 제공된다.
또 다른 측면에서, 대상체의 단백질 프로파일에 적어도 부분적으로 기초하여 1차 스크린을 수행하는 방법이 제공된다.
또 다른 측면에서, 하기를 포함하는, 대상체의 암 진행을 모니터링하는 방법이 제공된다:
a) EGF, FGF-2, FLT3L, 프락탈카인, IL-1a, IL-2, IL-6, IL-8, GROa, MIP-3a, 보체 성분 C2, 보체 성분 C9, 인자 D, 인자 I, MBL, MMP-2, GDF-15, 오스테오넥틴, 페리오스틴, ANGPTL4, FGF-21, FGF-23, HGF, 안지오포이에틴-2, BMP-9, IL-1RII, HGFR, IL-6ra, OPN, 테나신-C, 트롬보스폰딘-2, uPAR, CD44, 칼리크레인-6, 메소텔린, EpCAM, Apo A1, AGP, A2MB, 페투인 A, HP, L-셀렉틴, 보체 성분 C1q, 보체 성분 C3, 보체 성분 C3b, 인자 B, 인자 H, 프로페르딘, AGRP, MMP-12, CYFRA21-1, HE4, 총 PSA, MIF, AFP, CA125, CA19-9, CA15-3(MUC-1), 및 CEA로 이루어진 군으로부터 선택되는 적어도 6개의 단백질의 패널을 사용하여 대상체로부터의 생물학적 샘플의 단백질 프로파일을 결정하여 기준선 단백질 상태를 생성하는 단계;
b) 기준선 단백질 상태를 생성한 후 하나 이상의 시점에서 대상체로부터 수득된 생물학적 샘플의 단백질 프로파일을 결정하여 현재 단백질 상태를 생성하는 단계; 및
c) 기준선 단백질 상태와 현재 단백질 상태 사이의 차이를 결정하여 대상체의 암 진행을 모니터링하는 단계.
일부 실시양태에서, 방법은 대상체의 모니터링된 암 진행에 기초하여 대상체에게 치료를 투여하는 단계를 추가로 포함한다. 일부 실시양태에서, 치료는 화학요법, 방사선요법, 면역요법, 또는 수술을 포함한다.
일부 실시양태에서, 단백질 프로파일은 적어도 약 25%의 민감도로 결장직장암의 존재 또는 감수성을 나타낸다. 일부 실시양태에서, 단백질 프로파일은 적어도 약 30%의 민감도로 결장직장암의 존재 또는 감수성을 나타낸다. 일부 실시양태에서, 단백질 프로파일은 적어도 약 35%의 민감도로 결장직장암의 존재 또는 감수성을 나타낸다. 일부 실시양태에서, 단백질 프로파일은 적어도 약 40%의 민감도로 결장직장암의 존재 또는 감수성을 나타낸다. 일부 실시양태에서, 단백질 프로파일은 적어도 약 50%의 민감도로 결장직장암의 존재 또는 감수성을 나타낸다. 일부 실시양태에서, 단백질 프로파일은 적어도 약 60%의 민감도로 결장직장암의 존재 또는 감수성을 나타낸다. 일부 실시양태에서, 단백질 프로파일은 적어도 약 70%의 민감도로 결장직장암의 존재 또는 감수성을 나타낸다. 일부 실시양태에서, 단백질 프로파일은 적어도 약 80%의 민감도로 결장직장암의 존재 또는 감수성을 나타낸다. 일부 실시양태에서, 단백질 프로파일은 적어도 약 90%의 민감도로 결장직장암의 존재 또는 감수성을 나타낸다. 일부 실시양태에서, 단백질 프로파일은 적어도 약 95%의 민감도로 결장직장암의 존재 또는 감수성을 나타낸다.
일부 실시양태에서, 단백질 프로파일은 적어도 약 5%의 양성 예측 값(PPV)으로 결장직장암의 존재 또는 감수성을 나타낸다. 일부 실시양태에서, 단백질 프로파일은 적어도 약 10%의 양성 예측 값(PPV)으로 결장직장암의 존재 또는 감수성을 나타낸다. 일부 실시양태에서, 단백질 프로파일은 적어도 약 15%의 양성 예측 값(PPV)으로 결장직장암의 존재 또는 감수성을 나타낸다. 일부 실시양태에서, 단백질 프로파일은 적어도 약 20%의 양성 예측 값(PPV)으로 결장직장암의 존재 또는 감수성을 나타낸다. 일부 실시양태에서, 단백질 프로파일은 적어도 약 25%의 양성 예측 값(PPV)으로 결장직장암의 존재 또는 감수성을 나타낸다. 일부 실시양태에서, 단백질 프로파일은 적어도 약 30%의 양성 예측 값(PPV)으로 결장직장암의 존재 또는 감수성을 나타낸다. 일부 실시양태에서, 단백질 프로파일은 적어도 약 40%의 양성 예측 값(PPV)으로 결장직장암의 존재 또는 감수성을 나타낸다. 일부 실시양태에서, 단백질 프로파일은 적어도 약 50%의 양성 예측 값(PPV)으로 결장직장암의 존재 또는 감수성을 나타낸다. 일부 실시양태에서, 단백질 프로파일은 적어도 약 60%의 양성 예측 값(PPV)으로 결장직장암의 존재 또는 감수성을 나타낸다. 일부 실시양태에서, 단백질 프로파일은 적어도 약 70%의 양성 예측 값(PPV)으로 결장직장암의 존재 또는 감수성을 나타낸다. 일부 실시양태에서, 단백질 프로파일은 적어도 약 80%의 양성 예측 값(PPV)으로 결장직장암의 존재 또는 감수성을 나타낸다. 일부 실시양태에서, 단백질 프로파일은 적어도 약 90%의 양성 예측 값(PPV)으로 결장직장암의 존재 또는 감수성을 나타낸다. 일부 실시양태에서, 단백질 프로파일은 적어도 약 95%의 양성 예측 값(PPV)으로 결장직장암의 존재 또는 감수성을 나타낸다. 일부 실시양태에서, 단백질 프로파일은 적어도 약 99%의 양성 예측 값(PPV)으로 결장직장암의 존재 또는 감수성을 나타낸다.
일부 실시양태에서, 단백질 프로파일은 적어도 약 40%의 음성 예측 값(NPV)으로 결장직장암의 존재 또는 감수성을 나타낸다. 일부 실시양태에서, 단백질 프로파일은 적어도 약 50%의 음성 예측 값(NPV)으로 결장직장암의 존재 또는 감수성을 나타낸다. 일부 실시양태에서, 단백질 프로파일은 적어도 약 60%의 음성 예측 값(NPV)으로 결장직장암의 존재 또는 감수성을 나타낸다. 일부 실시양태에서, 단백질 프로파일은 적어도 약 70%의 음성 예측 값(NPV)으로 결장직장암의 존재 또는 감수성을 나타낸다. 일부 실시양태에서, 단백질 프로파일은 적어도 약 80%의 음성 예측 값(NPV)으로 결장직장암의 존재 또는 감수성을 나타낸다. 일부 실시양태에서, 단백질 프로파일은 적어도 약 90%의 음성 예측 값(NPV)으로 결장직장암의 존재 또는 감수성을 나타낸다. 일부 실시양태에서, 단백질 프로파일은 적어도 약 95%의 음성 예측 값(NPV)으로 결장직장암의 존재 또는 감수성을 나타낸다. 일부 실시양태에서, 단백질 프로파일은 적어도 약 99%의 음성 예측 값(NPV)으로 결장직장암의 존재 또는 감수성을 나타낸다.
일부 실시양태에서, 트레이닝된 알고리즘은 적어도 약 0.50의 곡선 아래 면적(AUC)으로 대상체의 결장직장암의 존재 또는 감수성을 결정한다. 일부 실시양태에서, 트레이닝된 알고리즘은 적어도 약 0.60의 곡선 아래 면적(AUC)으로 대상체의 결장직장암의 존재 또는 감수성을 결정한다. 일부 실시양태에서, 트레이닝된 알고리즘은 적어도 약 0.70의 곡선 아래 면적(AUC)으로 대상체의 결장직장암의 존재 또는 감수성을 결정한다. 일부 실시양태에서, 트레이닝된 알고리즘은 적어도 약 0.80의 곡선 아래 면적(AUC)으로 대상체의 결장직장암의 존재 또는 감수성을 결정한다. 일부 실시양태에서, 트레이닝된 알고리즘은 적어도 약 0.90의 곡선 아래 면적(AUC)으로 대상체의 결장직장암의 존재 또는 감수성을 결정한다. 일부 실시양태에서, 트레이닝된 알고리즘은 적어도 약 0.95의 곡선 아래 면적(AUC)으로 대상체의 결장직장암의 존재 또는 감수성을 결정한다. 일부 실시양태에서, 트레이닝된 알고리즘은 적어도 약 0.99의 곡선 아래 면적(AUC)으로 대상체의 결장직장암의 존재 또는 감수성을 결정한다.
일부 실시양태에서, 방법은 사용자의 전자 장치의 보고서 또는 그래픽 사용자 인터페이스를 제시하는 단계를 추가로 포함한다. 일부 실시양태에서, 사용자는 대상체, 개체 또는 환자이다.
일부 실시양태에서, 방법은 대상체, 개체 또는 환자에서 결장직장암의 존재 또는 감수성의 결정 가능성을 결정하는 단계를 추가로 포함한다.
일부 실시양태에서, 트레이닝된 알고리즘(예컨대, 기계 학습 모델 또는 분류자)은 감독 또는 반감독 기계 학습 알고리즘을 포함한다. 일부 실시양태에서, 감독 기계 학습 알고리즘은 심층 학습 알고리즘, 서포트 벡터 머신(SVM), 신경 네트워크 또는 랜덤 포레스트를 포함한다.
일부 실시양태에서, 방법은 결장직장암을 갖는 환자를 치료하기 위한 치료적 개입(예컨대, 화학요법, 방사선요법, 면역요법, 또는 수술)과 같이 단백질 프로파일 또는 분석에 적어도 부분적으로 기초하여 대상체에게 치료적 개입을 제공하거나 대상체에게 치료를 투여하는 단계를 추가로 포함한다.
일부 실시양태에서, 방법은 결장직장암의 존재 또는 감수성을 모니터링하는 단계를 추가로 포함하고, 모니터링은 복수의 시점에서 대상체의 결장직장암의 존재 또는 감수성을 평가하는 것을 포함하고, 평가는 적어도 복수의 시점 각각에서 결정된 결장직장암의 존재 또는 감수성에 기초한다.
일부 실시양태에서, 복수의 시점 중 대상체의 결장직장암의 존재 또는 감수성의 평가에서의 차이는 (i) 대상체의 결장직장암의 존재 또는 감수성의 진단, (ii) 대상체의 결장직장암의 존재 또는 감수성의 예후, 및 (iii) 대상체의 결장직장암의 존재 또는 감수성을 치료하기 위한 치료 과정의 과정의 효능 또는 비-효능으로 이루어진 군으로부터 선택되는 하나 이상의 임상 징조를 나타낸다.
일부 실시양태에서, 방법은 결장직장암의 복수의 특유한 하위유형 또는 단계 중에서 대상체의 결장직장암의 하위유형을 결정하기 위해 트레이닝된 알고리즘을 사용하여 대상체의 결장직장암을 계층화하는 단계를 추가로 포함한다.
본 개시내용의 또 다른 측면은 하나 이상의 컴퓨터 프로세서에 의해 실행될 때 상기 또는 본원의 다른 곳의 방법 중 임의의 것을 구현하는 기계 실행 가능한 코드를 포함하는 비-일시적 컴퓨터 판독 가능 매체를 제공한다.
본 개시내용의 또 다른 측면은 하나 이상의 컴퓨터 프로세서 및 이에 커플링된 컴퓨터 메모리를 포함하는 시스템을 제공한다. 컴퓨터 메모리는 하나 이상의 컴퓨터 프로세서에 의해 실행될 때 상기 또는 본원의 다른 곳의 방법 중 임의의 것을 구현하는 기계 실행 가능한 코드를 포함한다.
본 발명의 또 다른 측면은 a) 기계 학습 모델을 사용하는 단백질 시그니처 패널에 기초하여 결장 세포 증식 장애를 갖지 않는 대상체로부터 결장 세포 증식 장애를 갖는 대상체의 집단을 구별하기 위한 분류자를 포함하는 컴퓨터 판독 가능 매체; 및 b) 컴퓨터 판독 가능 매체에 저장된 명령을 실행하기 위한 하나 이상의 프로세서를 포함하는 시스템을 제공한다.
본 개시내용의 추가적인 측면 및 이점은 본 개시내용의 예시적인 실시양태만이 제시되고 설명되는 하기의 상세한 설명으로부터 당업자에게 쉽게 명백해질 것이다. 이해되는 바와 같이, 본 개시내용은 다른 상이한 실시양태가 가능하며, 이의 몇몇 세부사항은 모두 본 개시내용으로부터 벗어나지 않으면서 다양한 명백한 측면에서 변형될 수 있다. 따라서, 도면 및 설명은 본질적으로 예시적인 것으로 간주되어야 하며 제한적인 것으로 간주되어서는 안 된다.
참조에 의한 포함
본 명세서에 언급된 모든 공개문, 특허 및 특허 출원은 각각의 개별 공개문, 특허 또는 특허 출원이 구체적이고 개별적으로 참고로 포함되는 것으로 표시된 것과 동일한 정도로 본원에 참조로 포함된다. 참조로 포함된 공개문 및 특허 또는 특허 출원이 본 명세서에 함유된 개시내용과 모순되는 경우에, 본 명세서는 임의의 이러한 모순되는 자료를 대체 및/또는 이에 우선하고자 한다.
첨부된 도면을 참조하여 단지 예로서 본 개시내용의 예가 이제 설명될 것이다. 본 발명의 새로운 특색은 특히 첨부된 청구범위에 기재되어 있다. 본 발명의 특색 및 이점에 대한 더 나은 이해는 본 발명의 원리가 활용되는 예시적인 실시양태를 설명하는 하기의 상세한 설명 및 첨부 도면(또한 "도면" 및 "도")을 참조함으로써 얻어질 것이다.
도 1은 본원에 제공된 방법을 구현하기 위해 기계 학습 모델 및 분류자로 프로그래밍되거나 달리 구성된 컴퓨터 시스템의 개략도를 제공한다.
도 2는 단백질 마커 데이터세트에서 사용 가능한 모든 표적에 대한 단일 분석물 단백질 데이터에서 계산된 단백질당 백분위수의 시각화를 제공한다.
도 3은 단일 검정 단백질 분석(왼쪽 패널) 및 다중 검정 가산성 분석(오른쪽 패널)으로부터의 메트릭스(metrics)의 시각화를 제공한다. 2.1 목록은 2개의 기준을 충족하는 단백질로 이루어진다. 제1 기준은 최대 및 중앙값 백분위수 메트릭스에 대한 역치를 충족하는 단백질이다. 제2 기준은 가산성에 의해 정의된 사용 빈도 및 성능 역치를 통과하는 단백질이다. 2.2 목록은 최대 및 중앙값 백분위수 메트릭(metric)에 대한 순위로 상위 25개 단백질을 취할 때 발견되는 단백질의 교차점으로 이루어진다.
도 4는 모든 데이터가 피처 선택에 사용되었지만 모델 가중치는 교차 검증 내에서 정의된 발견 데이터에 대한 53개의 피처 CRC 대 NEG의 분류 성능을 나타내는 ROC 곡선을 제공한다(이 성능에서 진정한 홀드아웃은 없음).
도 5는 모든 데이터가 피처 선택에 사용되었지만 모델 가중치는 교차 검증 내에서 정의된 발견 데이터에 대한 53개 피처 AA 대 NEG의 분류 성능을 나타내는 ROC 곡선을 제공한다(이 성능에서 진정한 홀드아웃은 없음).
본 발명의 다양한 실시양태가 본원에 제시되고 설명되었지만, 이러한 실시양태는 단지 예로서 제공된다는 것이 당업자에게 명백할 것이다. 다양한 변경, 변화 및 치환이 본 발명을 벗어나지 않으면서 당업자에게 일어날 수 있다. 본원에 기재된 본 발명의 실시양태에 대한 다양한 대안이 이용될 수 있음을 이해해야 한다.
CRC는 서방 세계에서 암 관련된 사망률의 주요 원인이다. CRC는 가장 잘 특징규명된 고형 종양 중 하나이지만 CRC는 늦은 진단으로 인해 선진국에서 계속해서 주요 사망 원인 중 하나이다. 무엇보다도 환자의 진단이 늦어지는 것은 결장경검사와 같은 진단 시험이 너무 늦게 수행되기 때문이다. 효과적인 스크리닝을 통해 CRC로 인한 사망을 방지할 수 있다. 현재, 직접적인 임상 결정을 내리는 데 도움이 되는 보편적인 특정 스크리닝 시험 또는 패널이 없다. 암 검진 및 모니터링은 조기 검출을 통해 암이 성장 및 확산되기 전에 제거할 수 있기 때문에 생존 결과를 개선한다. 예컨대, CRC에서 결장경검사는 조기 진단을 개선하는 역할을 한다. 불행하게도, 환자 순응 비율이 낮고, 절차의 침습성으로 인해 권장되는 규칙성보다 낮게 스크리닝이 수행된다. 결장직장 신생물의 조기 검출을 가능하게 하는 비-침습적이고 간단한 진단 방법의 구현은 혈청 또는 혈장에서 검출 가능한 단백질 확인을 기반으로 할 수 있다. 비-침습적 접근법은 결장직장 신생물에 대한 보다 순응적이고 보다 조기의 스크리닝 시험의 기초가 될 수 있다.
최근 연구는 암을 갖는 환자에서 종양 관련된 항원의 존재를 뒷받침한다. 종양 형성은 종양 세포에서 자가 단백질의 구조 또는 발현의 변화와 관련되기 때문에 이러한 변화는 암의 잠재적인 면역학적 마커로 작용할 수 있다.
인간에서 암 및 종양의 존재는 또한 암을 갖는 환자의 혈청 내 단백질의 존재와 관련된다. 단백질은 질환의 초기 단계에서, 심지어 암이 다른 기술에 의해 검출될 수 있기 전에 검출될 수 있으며, 이는 이러한 단백질의 질환의 바이오마커로서의 잠재력을 나타낸다. 이러한 단백질은 발현 수준 변화, 단리된 돌연변이에 의해 영향을 받을 수 있거나, 변칙적인 폴딩, 과발현, 비정상적인 글리코실화를 가질 수 있거나, 말단절단될 수 있거나, 비정상적인 분해를 겪을 수 있다.
따라서, 단백질 바이오마커는 간단하고 효과적이며 비-침습적인 방법으로 결장 신생물의 진단, (선종 또는 종양 진행과 같은) 상이한 단계에서의 결장 신생물의 분류, 질환 진행의 예후, 치료에 대한 질환 반응의 평가, 및 결장 신생물의 재발 또는 전파의 검출을 가능하게 할 수 있다. 결장 신생물과 관련된 단백질의 진단 잠재력은 결장 신생물의 조기 검출, 진단 및 예후에 유용할 수 있다.
본 개시내용은 일반적으로 암 검출 및 질환 모니터링에 관한 것이다. 보다 구체적으로, 본 개시내용은 초기 단계 결장직장암과 같은 결장 세포 증식 장애에서 암 관련된 단백질 검출 및 질환 모니터링에 관한 것이다. 구체적으로, 결장직장암(CRC) 및/또는 결장직장 선종(CA), 예컨대 진행성 결장직장 선종(AA)과 같은 결장 세포 증식 장애를 갖거나 발병할 위험이 있는 인간 대상체를 확인하기 위한 순환 단백질 시그니처 패널 및 이의 용도가 제공된다. 결장 세포 증식 장애의 존재를 나타내거나, 결장 세포 증식 장애가 발병할 위험이 높은, 예컨대 대상체가 결장직장 병변을 가질 때, 대상체에서의 종양 관련된 단백질이 본원에 추가로 개시된다.
본 개시내용의 일부 실시양태는 결장 세포 증식 장애를 갖지 않거나 결장 세포 증식 장애가 발병할 위험이 낮은 대상체의 상응하는 샘플과 비교하여 결장 세포 증식 장애를 갖거나 결장 세포 증식 장애가 발병할 위험이 높은 대상체의 샘플에서 차등적으로 풍부한 단백질을 제공한다. 일부 실시양태에서, 결장 세포 증식 장애가 발병할 위험이 높은 대상체 및 결장 세포 증식 장애가 발병할 위험이 낮은 대상체 각각은 결장직장 점막 내에서 발생하는 비-침습적 전구체 병변(이하, 결장직장 병변)을 갖는다. 건강한 대상체 및 결장 세포 증식 장애를 갖는 대상체의 샘플에 상이한 풍부도로 존재하는 단백질은 결장 세포 증식 장애의 진단, 치료 및/또는 예방을 위한 바이오마커로 사용될 수 있다.
일부 실시양태에서, 방법은 건강한 대상체로부터의 참조 단백질 프로파일의 데이터베이스에 대해 대상체의 생물학적 샘플의 단백질 프로파일을 비교하는 단계; 및 참조 단백질 프로파일에 비해 단백질 프로파일의 단백질 발현 수준에서 적어도 5%, 적어도 10%, 적어도 15%, 적어도 20%, 적어도 25%, 적어도 30%, 적어도 35%, 적어도 40%, 적어도 45%, 또는 적어도 50%의 변화를 측정하는 것에 적어도 부분적으로 기초로 하여 대상체가 결장 세포 증식성 장애를 가질 위험이 증가된다는 것을 결정하는 단계를 추가로 포함한다.
기계 학습 접근법이 정보 제공 단백질의 패널을 확인하기 위해 생물학적 샘플로부터 유래된 단백질 데이터를 특징화하는 데 이용될 수 있다. 결장 세포 증식 장애에 대한 정보 제공 단백질의 확인된 패널은 건강한 대상체 및 결장 세포 증식 장애를 갖는 대상체로부터의 샘플을 구별하는 데 유용한 분류자 모델을 트레이닝하는 데 유용할 수 있다.
본원에 기재된 방법 및 분류자에 대해 정보를 제공하는 단백질을 확인하기 위해, 결장 세포 증식 장애를 갖는 대상체의 혈장 및 결장 세포 증식 장애를 갖지 않는 대상체의 혈장(대조군 혈장 또는 참조 혈장)을 결장 세포 증식 장애에 대한 반응으로 결장 세포 증식 장애를 갖는 환자에 의해 생성되거나 환자에서 차등적으로 발현되는 단백질의 시그니처 패널을 확인하는 목적으로 검사하였다. 이를 위해 결장 세포 증식 장애를 갖는 환자로부터의 혈장 및 대조군 혈장을 바이오마커를 확인하기 위해 단백질 발현에 대해 검정하였다.
본원에서 확인된 단백질은 결장 세포 증식 장애를 갖는 대상체를 확인하여 결장 세포 증식 장애를 갖지 않는 대상체와 구별하기 위해, 결장 세포 증식 장애가 발병할 위험이 높은 대상체를 확인하여 결장 세포 증식 장애가 발병할 위험이 낮은 대상체와 구별하기 위해, 또는 결장 세포 증식 장애 전구체 병변을 갖는 대상체를 확인하기 위해 사용될 수 있다. 따라서, 이러한 단백질은 결장 세포 증식 장애의 모니터링, 치료 및 관리에 관한 결정을 안내하는 보조 도구로 사용될 수 있다.
본 개시내용의 특정한 다른 실시양태는 건강한 대상체의 혈장 샘플 및 결장 세포 증식 장애를 갖는 대상체로부터의 혈장 샘플에서 발현되는 본원에 기재된 단백질에 대해 트레이닝된 기계 학습 모델 분류자를 제공한다. 기계 학습 모델의 트레이닝은 건강한 대상체 또는 결장 세포 증식 장애를 갖는 대상체를 분류하는 데 유용한 단백질 바이오마커의 미리 결정된 세트("단백질 패널" 또는 "시그니처 패널")를 갖는 분류자를 제공한다. 일 예에서, 조직학적 중증도를 평가하기 위해 결장직장 병변을 갖는 대상체에서 사용될 수 있는 혈액 기반 최소 침습적 단백질 검정을 위한 방법이 제공된다. 또 다른 실시양태에서, 결장 세포 증식 장애를 나타내는 단백질은 대상체로부터의 무세포 샘플에서 검출된다. 단백질과 같은 무세포 분자를 함유하는 전혈, 혈장 또는 혈청과 같은 대상체로부터의 체액 샘플. 이와 같이, 외과적 절제, 면역요법, 방사선 또는 화학요법과 같은 치료를 보증하는 결장 세포 증식 장애, 고위험 또는 저위험 결장직장 병변의 존재 또는 부재를 감별하고, 모니터링될 수 있는 저위험 결장직장 병변을 확인하는 데 사용될 수 있는 단백질이 본원에서 제공된다. 결장 세포 증식 장애 또는 병변의 존재에 대한 모니터링 및 확인은, 예컨대 결장경검사, 초음파, MM 또는 CT 스캔에 의해 수행될 수 있다.
일부 실시양태에서, 결장직장 증식 장애의 조기 검출에 사용되고 CRC의 조기 검출과 관련된 혈장 단백질 바이오마커의 미리 결정된 패널이 본원에 개시된다. 미리 결정된 단백질 패널은 진행성 선종 또는 결장직장암과 같은 세포 증식 장애를 나타내는 분류자에 사용될 수 있다.
다른 실시양태에서, 검출, 진단 및 치료 관련된 방법이 본원에 개시된다. 환자로부터의 혈장은 결장직장 증식 장애의 징조로서 미리 결정된 패널의 단백질에 대해 스크리닝될 수 있다.
결장 세포 증식 장애를 앓고 있는 대상체에서 상향조절되거나 과발현되는 단백질의 발현 프로파일 또는 풍부도에 기초하여 결장 세포 증식 장애를 갖거나 가질 위험이 있는 대상체를 스크리닝 또는 확인하는 방법이 본원에 기재된다. 추가로, 대상체, 예컨대 인간 대상체에서 결장 세포 증식 장애의 진단에 유용한 데이터를 수득하는 방법이 본원에 기재된다.
결장 세포 증식 장애는 임의의 종양 단계(예컨대, TX, T0, Tis, T1, T2, T3, T4); 임의의 국지적 림프절 또는 원격 전이 단계(예컨대, NX, N0, N1, M0, M1); 임의의 단계(예컨대, 단계 0(Tis, N0, M0), 단계 IA기(T1, N0, M0), 단계 IIA(T3, N0, M0), 단계 IIB(T1-3, N1, M0), 단계 III( T4, 임의의 N, M0) 또는 단계 IV(임의의 T, 임의의 N, M1)); 절제 가능; 국소적으로 진행(절제 불가); 또는 전이성일 수 있다.
현재의 스크리닝 도구는 위양성 및 위음성 결과, 특이도 및 민감도로 인해 문제에 직면할 수 있다. 이상적인 암 스크리닝 도구는 불필요한 조사를 최소화하지만(낮은 위양성) 대다수의 암을 검출하는(낮은 위음성) 높은 양성 예측 값(PPV)를 가질 수 있다. 또 다른 주요 절충안은 크기에 기초하여 종양을 검출하는 하한인 시험 민감도와 구별되는 "검출 민감도"이다. 종양이 검출 가능한 수준으로 순환 종양 마커를 방출할 수 있을 만큼 충분히 큰 크기로 성장하도록 허용하는 것은 암 진행의 조기 검출 및 방지의 목적을 무산시킨다. 따라서, 본 개시내용은 결장직장암의 조기 진단을 위한 매우 민감하고 효과적인 혈액 기반 스크린에 대한 요구를 다룬다.
"액체 생검"으로도 지칭되는 순환 종양 DNA의 검출은 비-침습적 방식으로 종양의 검출 및 정보 제공 조사를 가능하게 한다. 이러한 액체 생검에서 종양 특이적 돌연변이의 확인은, 예컨대 결장암, 유방암 및 전립선암을 진단하는 데 사용될 수 있다. 그러나, 순환계에 존재하는 정상(즉, 비-종양 유래된) DNA의 배경이 높기 때문에 이러한 기술은 민감도가 제한될 수 있다. 따라서, 재발 스크리닝 및 위험 집단의 1차 스크리닝을 위한 초기 단계 또는 낮은 종양 부담 결장직장암 종양 마커를 검출하기 위한 보다 민감하고 특정한 스크리닝 도구에 대한 필요성이 남아 있다. 종양 관련된 항원에 대한 순환 단백질은 본원에 기재된 기계 학습 모델에서 사용될 수 있는 액체 생검 샘플에서 정보 제공 바이오마커의 또 다른 공급원을 제공한다.
본 개시내용은 결장 세포 증식 장애 및 이의 진행, 예컨대 결장직장암과 관련된 순환 단백질을 프로파일링하는 방법 및 시스템을 제공한다. 결장 세포 증식 장애의 존재 또는 결장 세포 증식 장애가 발병할 높은 위험을 나타내는 단백질은, 예컨대 대상체가 결장직장 병변만 가질 때, 가능한 한 조기에 결장 세포 증식 장애의 진행을 진단, 치료 또는 예방하기 위해 사용될 수 있다. 특히, 대상체가 결장직장 병변을 가질 때, 대상체에서 결장 세포 증식 장애를 진단하거나 결장 세포 증식 장애가 발병할 위험을 평가하기 위한 키트 및 방법이 본원에 추가로 제공된다.
일 측면에서, 질환 상태에 기초하여 대상체로부터 샘플을 구별하는 데 유용한 단백질 패널을 사용하는 방법이 본원에 제공된다. 다른 측면에서, 단백질 패널을 사용하여 결장 세포 증식 장애를 검출, 감별 및 구별하기 위한 방법, 검정 및 키트가 본원에 제공된다. 결장 세포 증식 장애의 비제한적 예는 선종(선종성 폴립), 폴립증 장애, 린치 증후군, 무경성 톱니상 선종(SSA), 진행성 선종, 결장직장 형성이상, 결장직장 선종, 결장직장암, 결장암, 직장암, 결장직장 암종, 결장직장 선암종, 카르시노이드 종양, 위장 카르시노이드 종양, 위장 기질 종양(GIST), 림프종, 및 육종을 포함한다.
일부 실시양태에서, 방법은 결장 세포 증식 장애의 감별, 검출 및 구별을 위한 마커로서 선택되는 하나 이상의 단백질의 사용을 포함한다.
정의
본 명세서 및 청구범위에서 사용되는 바와 같이, 단수형태는 문맥상 명백하게 달리 지시하지 않는 한 복수의 지시물을 포함한다. 예컨대, 용어 "핵산"은 이의 혼합물을 포함하는 복수의 핵산을 포함한다.
본원에서 사용되는 바와 같이, 용어 "대상체"는 일반적으로 시험 가능하거나 검출 가능한 유전 정보를 갖는 실체 또는 매체를 지칭한다. 대상체는 사람, 개체 또는 환자일 수 있다. 대상체는, 예컨대 포유동물과 같은 척추동물일 수 있다. 포유동물의 비제한적 예는 인간, 유인원, 농장 동물, 스포츠 동물, 설치류 및 애완 동물을 포함한다. 대상체는 암에 걸렸거나 암에 걸린 것으로 의심되는 사람일 수 있다. 대상체는 대상체의 건강, 생리학적 상태 또는 병태, 예컨대 대상체의 암 또는 다른 질환, 장애 또는 병태를 나타내는 증상을 나타낼 수 있다. 대안으로서, 대상체는 이러한 건강 또는 생리학적 상태 또는 병태와 관련하여 무증상일 수 있다.
본원에서 사용되는 바와 같이, 용어 "샘플"은 일반적으로 하나 이상의 대상체로부터 수득되거나 이로부터 유래되는 생물학적 샘플을 지칭한다. 생물학적 샘플은 무세포 생물학적 샘플 또는 실질적으로 무세포 생물학적 샘플일 수 있거나, 무세포 생물학적 샘플을 생성하기 위해 처리 또는 분획화될 수 있다. 예컨대, 무세포 생물학적 샘플은 무세포 리보핵산(cfRNA), 무세포 데옥시리보핵산(cfDNA), 무세포 태아 DNA(cffDNA), 단백질, 항체, 혈장, 혈청, 소변, 타액, 양수, 및 이의 유도체를 포함할 수 있다. 무세포 생물학적 샘플은 에틸렌디아민테트라아세트산(EDTA) 수집 튜브, 무세포 RNA 수집 튜브(예컨대, Streck® RNA 완전 BCT®) 또는 무세포 DNA 수집 튜브(예컨대, Streck® 무세포 DNA BCT®)를 사용하여 대상체로부터 수득되거나 이로부터 유래될 수 있다. 무세포 생물학적 샘플은 분획화(예컨대, 차등 원심분리)을 통해 전혈 샘플로부터 유래될 수 있다. 생물학적 샘플 또는 이의 유도체는 세포를 함유할 수 있다. 예컨대, 생물학적 샘플은 혈액 샘플 또는 이의 유도체(예컨대, 수집 튜브 또는 혈액 방울에 의해 수집된 혈액)일 수 있다.
본원에서 사용되는 바와 같이, 용어 "무세포 샘플"은 일반적으로 온전한 세포가 실질적으로 없는 생물학적 샘플을 지칭한다. 무세포 샘플은 그 자체로 세포가 실질적으로 없는 생물학적 샘플로부터 유래되거나 세포가 제거된 샘플로부터 유래될 수 있다. 무세포 샘플의 비제한적 예는 혈액, 혈청, 혈장, 소변, 정액, 가래, 분변, 관 삼출물, 림프 및 회수된 세척액으로부터 유래된 것을 포함한다.
본원에서 사용되는 바와 같이, 용어 "결장 세포 증식 장애"는 일반적으로 결장 또는 직장에서 세포의 무질서하거나 비정상적인 증식을 포함하는 장애 또는 질환을 지칭한다. 결장 세포 증식 장애의 비제한적 예는 선종(선종성 폴립), 폴립증 장애, 린치 증후군, 무경성 톱니상 선종(SSA), 진행성 선종, 결장직장 형성이상, 결장직장 선종, 결장직장암, 결장암, 직장암, 결장직장 암종, 결장직장 선암종, 카르시노이드 종양, 위장 카르시노이드 종양, 위장 기질 종양(GIST), 림프종, 및 육종을 포함한다. 본원에서 사용되는 바와 같이, 약어 "CRC"는 결장직장암으로 진단된 대상체로부터의 생물학적 샘플을 확인하기 위해 사용된다. 본원에서 사용되는 바와 같이, 약어 "AA"는 적어도 하나의 진행성 선종으로 진단된 대상체로부터의 샘플을 확인하기 위해 사용된다. 본원에서 사용되는 바와 같이, 약어 "NAA"는 진행성 선종 또는 결장직장암이 아닌 양성 결장직장 종양으로 진단된 대상체로부터의 샘플을 확인하기 위해 사용된다.
본원에서 사용되는 바와 같이, 용어 "결장직장암"은 일반적으로 소장 아래 장관(즉, 대장(결장), 예컨대 맹장, 상행 결장, 횡행 결장, 하행 결장, 구불 결장 및 직장) 세포의 암을 특징으로 하는 의학적 병태이다.
본원에서 사용되는 바와 같이, 용어 "결장직장 선종"은 일반적으로 결장직장암의 양성 및 전암성 단계인 선종성 폴립으로도 불리는 결장의 선종을 지칭한다. 결장직장 선종은 결장직장암으로 진행될 높은 위험을 나타낼 수 있다.
본원에서 사용되는 바와 같이, 용어 "진행성 결장직장 선종"은 일반적으로 크기가 적어도 10 mm이거나 조직학적으로 높은 등급의 형성이상 또는 20% 초과의 융모 성분을 갖는 선종을 지칭한다.
본원에서 사용되는 바와 같이, 용어 "결장 세포 증식 장애가 발병할 위험이 있는" 또는 "결장 세포 증식 장애가 발병할 위험이 높은"은 일반적으로 결장 세포 증식 장애를 갖지 않거나 가까운 미래에 결장 세포 증식 장애가 발병할 위험이 낮은 대상체와 비교하여 가까운 미래에서 결장 세포 증식 장애가 발병할 위험이 증가된 대상체를 지칭한다. 본원에서 사용되는 바와 같이, 용어 "가까운 미래"는 약 1개월 내지 약 2년, 약 6개월 내지 약 18개월, 또는 약 1년의 지속기간을 지칭한다.
본원에서 사용되는 바와 같이, 용어 암 "유형" 및 "하위유형"은 일반적으로 유방암과 같은 암의 한 "유형"이, 예컨대 단계, 형태, 조직학, 유전자 발현, 수용체 프로파일, 돌연변이 프로파일, 공격성, 예후 및 악성 특징에 기초하여 "하위유형"일 수 있도록 본원에서 상대적으로 사용된다. 마찬가지로, "유형" 및 "하위유형"은, 예컨대 하나의 조직학적 "유형"을, 예컨대 돌연변이 프로파일 또는 유전자 발현에 따라 정의된 "하위유형"으로 구별하기 위해 보다 미세한 수준에서 적용될 수 있다. 암 "단계"는 또한 질환 진행과 관련된 조직학적 및 병리학적 특징에 기초하여 암 유형의 분류를 지칭하는 데 사용된다.
용어 "신생물"은 일반적으로 임의의 새롭고 비정상적인 조직 성장을 지칭한다. 따라서, 신생물은 전암성 신생물 또는 악성 신생물일 수 있다. 용어 "신생물 특이적 마커"는 신생물의 존재를 나타내는 데 사용될 수 있는 임의의 생물학적 물질을 지칭한다. 생물학적 물질의 예는 핵산, 폴리펩티드, 탄수화물, 지방산, 세포 성분(예컨대, 세포막 및 미토콘드리아), 및 전체 세포를 포함하지만 이에 제한되지 않는다. 용어 "결장직장 신생물 특이적 마커"는 결장직장 신생물(예컨대, 전암성 결장직장 신생물 또는 악성 결장직장 신생물)의 존재를 나타내는 데 사용될 수 있는 임의의 생물학적 물질을 지칭한다.
본원에서 사용되는 바와 같이, 용어 "건강한"은 일반적으로 결장직장 세포 증식 장애를 갖지 않는 대상체를 지칭한다. 건강은 동적 상태이지만, 본원에서 사용되는 바와 같이, 이 용어는 특정 진술에서 언급되는 질환 상태가 없는 대상체의 병리학적 상태를 지칭한다. 한 예에서, 결장직장암을 갖는 대상체를 분류할 수 있는 시그니처 패널을 지칭할 때, 건강한 개체, 건강한 샘플, 또는 건강한 개체로부터의 샘플은 결장직장암(CRC), 진행성 선종(AA), 또는 양성 선종(NAA)이 없는 개체를 지칭한다. 본원에서 사용되는 바와 같이, 약어 "NAA"는 결장직장 종양에 대해 음성인 것으로 평가된 개체로부터의 샘플을 확인하는 데 사용되며, 따라서 일부 실시양태에서 NAA로 확인된 샘플은 건강한 샘플 그룹에 포함된다. 건강의 다른 질환 또는 상태가 그 대상체에 존재할 수 있지만, 본원에서 사용되는 바와 같이, 용어 "건강한"은 논의되는 질환 상태를 갖는 대상체와 없는 대상체 사이의 비교 또는 분류 목적을 위해 언급된 질환의 없는 것을 나타낸다.
용어 "최소 잔류 질환" 또는 "MRD"는 일반적으로 암 치료 후 대상체의 체내에 있는 소수의 암 세포를 지칭한다. MRD 시험은 암 치료의 효과를 결정하고 추가 치료 계획을 안내하기 위해 수행될 수 있다.
본원에서 사용되는 바와 같이, 용어 "스크리닝"은 일반적으로 결장직장암 또는 결장직장 선종을 앓을 위험이 있는 대상체 집단의 검사 또는 시험을 지칭하며, 진단되지 않은 결장직장암 또는 결장직장 선종을 앓는 대상체 또는 상기 징조를 앓을 위험이 높은 대상체로부터 건강한 대상체를 분별하는 목적을 갖는다.
본원에서 사용되는 바와 같이, 용어 "최소 침습적 생물학적 샘플" 또는 "비-침습적 샘플"은 일반적으로 대상체로부터 혈액을 수득하는 데 사용되는 미세 바늘을 제외하고 기구 없이 환자의 몸으로부터 취한 임의의 샘플을 지칭한다. 일부 실시양태에서, 최소 침습적 생물학적 샘플은 혈액, 혈청 또는 혈장 샘플을 포함한다.
본원에서 사용되는 바와 같이, 용어 "상향조절된" 또는 "과발현된"은 일반적으로 주어진 "역치 값" 또는 "컷오프 값"에 대해 적어도 5%, 적어도 10%, 적어도 15%, 적어도 20%, 적어도 25%, 적어도 30%, 적어도 35%, 적어도 40%, 적어도 45%, 적어도 50%, 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 100%, 적어도 110%, 적어도 120%, 적어도 130%, 적어도 140%, 적어도 150%, 또는 150% 초과의 발현 수준의 증가를 지칭한다.
본원에서 사용되는 바와 같이, 용어 "역치 값" 또는 "컷오프 값"은 발현 수준을 지칭할 때 일반적으로 대상체의 발현 수준이 상기 역치 또는 컷오프 또는 참조 수준보다 높은 경우 대상체가 주어진 민감도 및 특이도로 결장직장암 또는 결장직장 선종을 앓을 가능성이 있음을 나타내는 참조 발현 수준을 지칭한다.
본원에서 사용되는 바와 같이, 용어 "키트"는 임의의 특정 장치에 제한되지 않으며, 제한 없이 마이크로어레이, 바이오어레이, 바이오칩, 바이오칩 어레이, 또는 비드 기반 검정과 같은 본 개시내용의 시스템 및 방법을 구현하기에 적합한 임의의 장치를 포함한다.
샘플 검정
무세포 생물학적 샘플은 인간 대상체로부터 수득되거나 유래될 수 있다. 무세포 생물학적 샘플은 처리 전에 다양한 저장 조건에, 예컨대 상이한 온도에서(예컨대, 실온에서, 냉장 또는 냉동고 조건 하에, 예컨대 25℃, 4℃, -18℃, -20℃ 또는 -80℃에서) 또는 상이한 현탁액(예컨대, EDTA 수집 튜브, 무세포 RNA 수집 튜브, 또는 무세포 DNA 수집 튜브)에 저장될 수 있다.
무세포 생물학적 샘플은 암을 갖는 대상체, 암을 갖는 것으로 의심되는 대상체, 또는 암을 갖지 않거나 암을 갖는 것으로 의심되지 않는 대상체로부터의 것일 수 있다.
무세포 생물학적 샘플은 암을 갖는 대상체의 치료 전 및/또는 후에 수득될 수 있다. 무세포 생물학적 샘플은 치료 또는 치료 레지먼 동안 대상체로부터의 것일 수 있다. 다수의 무세포 생물학적 샘플은 시간 경과에 따른 치료 효과를 모니터링하기 위한 대상체로부터의 것일 수 있다. 무세포 생물학적 샘플은 임상 시험을 통해 확실한 양성 또는 음성 진단이 불가능한 암을 갖는 것으로 알려지거나 의심되는 대상체로부터 취해질 수 있다. 샘플은 암을 갖는 것으로 의심되는 대상체로부터 취해질 수 있다. 무세포 생물학적 샘플은 피로, 구역, 체중 감소, 아픔 및 통증, 쇠약 또는 출혈과 같은 설명할 수 없는 증상을 경험하는 대상체로부터 취해질 수 있다. 무세포 생물학적 샘플은 설명된 증상을 갖는 대상체로부터 취해질 수 있다. 무세포 생물학적 샘플은 가족력, 연령, 고혈압 또는 전고혈압, 당뇨병 또는 전당뇨병, 과체중 또는 비만, 환경 노출, 생활 방식 위험 요인(예컨대, 흡연, 음주 또는 약물 사용) 또는 다른 위험 요인의 존재와 같은 요인으로 인해 암이 발병할 위험이 있는 대상체로부터 취해질 수 있다.
무세포 생물학적 샘플은 전사체 데이터를 생성하기 위한 검정에 적합한 무세포 리보핵산(cfRNA) 분자, 게놈 데이터를 생성하기 위한 검정에 적합한 무세포 데옥시리보핵산(cfDNA) 분자, 프로테옴 데이터를 생성하기 위한 검정에 적합한 단백질 분자, 또는 이들의 혼합물 또는 조합과 같은 검정될 수 있는 하나 이상의 분석물을 함유할 수 있다.
대상체로부터 무세포 생물학적 샘플을 수득한 후, 무세포 생물학적 샘플을 처리하여 대상체의 결장 세포 증식 장애를 나타내는 데이터세트를 생성할 수 있다. 예컨대, 단백질 패널에서 무세포 생물학적 샘플의 단백질 분자의 존재, 부재 또는 정량적 평가. 대상체로부터 무세포 생물학적 샘플을 처리하는 것은 (i) 무세포 생물학적 샘플을 복수의 단백질을 단리, 농축 또는 추출하기에 충분한 조건에 적용하는 것, 및 (ii) 복수의 단백질 분자를 검정하여 데이터세트를 생성하는 것을 포함할 수 있다.
생물학적 샘플은 하나 이상의 단백질을 검출하기 위한 검정에 직접적으로 사용되어 샘플에 대한 단백질 프로파일을 생성할 수 있다. 일부 실시양태에서, 생물학적 샘플은 검정 전에 단백질이 농축될 수 있다(예컨대, 단백질-접합된 마이크로비드 사용). 일부 실시양태에서, 생물학적 샘플은 혈장 샘플이고, 단백질이 농축된다. 생물학적 샘플은 다양한 실험실 방법론으로 검정되어 생물학적 샘플 내 하나 이상의 단백질의 존재 및/또는 농도 또는 수준을 결정할 수 있다. 일부 실시양태에서, 이러한 접근법은 대상체로부터의 생물학적 샘플의 단백질 프로파일을 결정하기 위한 질량 분광측정, 단백질 마이크로어레이, 고밀도 단백질 마이크로어레이, 예컨대 CDI 프로테옴 어레이, ELISA, 메소 스케일 디스커버리(Meso Scale Discovery) (예컨대, Pacific Biolabs), 비드 기반 면역검정(예컨대, Luminex® 자기 비드 기반 포획 검정), 2차 플루오르-항체 검정, DNA-항체 접합체 또는 항체-금속 접합체(예컨대, 질량 세포측정, CyTOF), HD-X™ 및 SR-X™ 초고감도 바이오마커 검출 시스템(예컨대, Quanterix®), 앱타머 기반 올리고-하이브리드화 MEMS(예컨대, Somalogic), 유동 세포측정, FirePlex® 입자 기술(예컨대, Abcam®), 또는 이들의 조합을 포함할 수 있지만 이에 제한되지 않는다.
시그니처 패널
본 개시내용은 결장 세포 증식 장애의 발병과 관련된 샘플에서 확인된 단백질 분자의 조합으로부터 측정 가능한 피처를 수득하기 위해 생물학적 샘플을 분석하는 방법 및 시스템을 제공한다. 본원에 기재된 확인된 단백질 분자의 수집은 결장 세포 증식 장애 또는 이의 단계에 대한 검출을 위한 분류자 및 모델의 생성에 정보 제공 가치를 갖는다. 확인된 단백질 분자는 개별적으로 정보를 제공하고 유용할 수 있지만, 단백질 분자는 시그니처가 결장 세포 증식 장애 또는 이의 단계에 특유한 시그니처 패널을 형성하기 위해 본원에 기재된 조합으로 사용될 수 있다. 시그니처 패널로부터의 피처는 결장 세포 증식 장애가 있는 대상체 집단을 계층화하도록 구성된 분류자를 생성하기 위해 트레이닝된 알고리즘(예컨대, 기계 학습 모델)을 사용하여 처리될 수 있다. 방법은 시그니처 패널에 기재된 하나 이상의 단백질을 사용하는 것을 특징으로 한다. 일부 실시양태에서, 적어도 3개의 단백질의 시그니처 패널이 본원에 기재된 분류자 및 방법에 유용하다.
본원에 기재된 단백질 시그니처 패널은 결장 세포 증식 장애와 관련된 특정 단백질의 신속하고 구체적인 분석을 가능하게 한다. 방법에 기재되고 사용되는 시그니처 패널은 결장 세포 증식 장애의 개선된 진단, 예후, 치료 선택 및 모니터링(예컨대, 치료 모니터링)을 위해 사용될 수 있다.
시그너처 패널 및 방법은 전혈, 혈장 또는 혈청과 같은 체액 샘플로부터 초기 단계 결장 세포 증식 장애를 검출하기 위한 현재 접근법에 비해 상당한 개선을 제공한다. 결장 세포 증식 장애를 검출하고 진단하는 데 사용되는 현재 방법은 결장경검사, 구불창자경검사 및 분변 잠혈 결장암을 포함한다. 이들 방법과 비교하여, 본원에서 제공되는 방법은 결장경검사보다 훨씬 덜 침습적일 수 있고, 구불창자경검사, 분변 면역화학 시험(FIT) 및 분변 잠혈 시험(FOBT)보다 더 민감하지는 않더라도 동등할 수 있다. 본원에 제공된 방법은 단백질 패널 및 고감도 검정 기술을 이용하는 유리한 조합으로 인해 민감도 및 특이도 측면에서 상당한 이점을 제공할 수 있다.
본 개시내용은 결장 세포 증식 장애 검출 및 질환 진행과 관련된 단백질의 프로파일링에 관한 방법 및 시스템을 제공한다. 본원에 기재된 방법 및 분류자에 대해 정보를 제공하는 단백질을 확인하기 위해, 결장 세포 증식 장애를 갖는 환자로부터의 혈장 및 결장 세포 증식 장애를 갖지 않는 대상체의 혈장(대조군 혈장 또는 참조 혈장)을 검사하여 상기 결장 세포 증식 장애에 대한 반응으로 결장 세포 증식 장애를 갖는 환자에 의해 생성된 단백질의 시그니처 패널 및 각각의 반응성 단백질을 확인하였다. 이를 위해 결장 세포 증식 장애를 갖는 환자로부터의 혈장 및 대조 혈장을 고밀도 항체 마이크로어레이를 사용하여 시험할 수 있다. 항체 마이크로어레이는 단백질 확인에 이용되는 다른 접근법과 관련하여 일련의 이점을 제공한다: i) 어레이에 프링팅된 단백질은 사전에 알려져 있으므로 후속 확인을 방지하고 가능한 미모토프(mimotope) 선택을 제거하고; ii) 단백질은 모두 유사한 농도로 프린팅되기 때문에 임의의 단백질을 선택할 경향이 없다. 이러한 요인의 조합은 바이오마커 확인에 대한 높은 민감도를 초래한다.
본원에서 확인된 단백질은 결장 세포 증식 장애를 갖는 대상체를 확인하여 결장 세포 증식 장애를 갖지 않는 대상체와 구별하기 위해, 결장 세포 증식 장애가 발병할 위험이 높은 대상체를 확인하여 결장 세포 증식 장애가 발병할 위험이 낮은 대상체와 구별하기 위해, 또는 결장 세포 증식 장애 전구체 병변을 갖는 대상체를 확인하기 위해 사용될 수 있다. 따라서, 이러한 단백질은 결장 세포 증식 장애의 모니터링, 치료 및 관리에 관한 결정을 안내하는 보조 도구로 사용될 수 있다.
일부 실시양태에서, 결장직장 증식 장애의 조기 검출에 유용하고 결장직장암의 조기 검출과 관련된 혈장 단백질 바이오마커의 패널이 본원에 개시된다.
다른 실시양태에서, 검출, 진단 및 치료 관련된 방법이 본원에 개시된다. 환자로부터의 혈장은 결장 직장 증식 장애의 징조로 종양 관련된 단백질 또는 종양 유래된 단백질에 대해 스크리닝된다.
한 측면에서, 본 개시내용은 EGF, FGF-2, FLT3L, 프락탈카인, IL-1a, IL-2, IL-6, IL-8, GROa, MIP-3a, 보체 성분 C2, 보체 성분 C9, 인자 D, 인자 I, MBL, MMP-2, GDF-15, 오스테오넥틴, 페리오스틴, ANGPTL4, FGF-21, FGF-23, HGF, 안지오포이에틴-2, BMP-9, IL-1RII, HGFR, IL-6ra, OPN, 테나신-C, 트롬보스폰딘-2, uPAR, CD44, 칼리크레인-6, 메소텔린, EpCAM, Apo A1, AGP, A2MB, 페투인 A, HP, L-셀렉틴, 보체 성분 C1q, 보체 성분 C3, 보체 성분 C3b, 인자 B, 인자 H, 프로페르딘, AGRP, MMP-12, CYFRA21-1, HE4, 총 PSA, MIF, AFP, CA125, CA19-9, CA15-3(MUC-1), 및 CEA로 이루어진 군으로부터 선택되는 적어도 6개의 단백질을 포함하는 결장 세포 증식 장애에 특유한 단백질 패널을 제공한다.
일부 실시양태에서, 패널은 결장 세포 증식 장애를 갖는 대상체로부터의 샘플을 나타내는 데 유용하고, 보체 성분 C2, 보체 성분 C9, 인자 D, 인자 I, 보체 성분 C1q, 보체 성분 C3, 보체 성분 C3b, 인자 B, 및 인자 H로 이루어진 군으로부터 선택되는 적어도 3개의 단백질을 포함한다.
일부 실시양태에서, 단백질 패널은 FLT3L, CEACAM5, IL-6RA, CEA, ORM, 또는 이들의 임의의 조합을 포함한다.
일부 실시양태에서, 단백질 패널은 FLT3L, CEACAM5, IL-6RA, CEA, ORM, IL-8, AGP, IL-1RT2, TNC, GDF-15, 또는 이들의 임의의 조합을 포함한다.
일부 실시양태에서, 단백질 패널은 FLT3L, CEACAM5, IL-6RA, CEA, ORM, IL-8, AGP, IL-1RT2, TNC, GDF-15, AGRP, 합토글로빈, ANGPTL4, FGF-23, 보체 성분 C2, ORM2, FGF-23, MUC-16, EGF, p00738, 또는 이들의 임의의 조합을 포함한다.
일부 실시양태에서, 패널은 FLT3L, CEACAM5, IL-6, IL-8, MIP-3a, IL-1RT2, TNC, 또는 이들의 임의의 조합을 포함한다.
일부 실시양태에서, 패널은 FLT3L, CEACAM5, IL-6, IL-8, MIP-3a, IL-1RT2, TNC, HGFR, THBS2, CA125(MUC-16), CA19-9, CA15-3(MUC-1), 또는 이들의 임의의 조합을 포함한다.
일부 실시양태에서, 패널은 총 PSA를 포함한다.
일부 실시양태에서, 단백질 시그니처 패널은 건강한 대상체, 양성 결장 폴립을 갖는 대상체, 진행성 선종을 갖는 대상체, 또는 결장직장암을 갖는 대상체를 구별하는 데 유용하다.
일부 실시양태에서, 패널은 진행성 선종을 나타내는 데 유용하고, EGF, FGF-2, FLT3L, 프락탈카인, IL-1a, IL-2, IL-6, IL-8, GROa, MIP-3a, 보체 성분 C2, 보체 성분 C9, 인자 D, 인자 I, MBL, MMP-2, GDF-15, 오스테오넥틴, 페리오스틴, ANGPTL4, FGF-21, FGF-23, HGF, 안지오포이에틴-2, BMP-9, IL-1RII, HGFR, IL-6ra, OPN, 테나신-C, 트롬보스폰딘-2, uPAR, CD44, 칼리크레인-6, 메소텔린, EpCAM, Apo A1, AGP, A2MB, 페투인 A, HP, L-셀렉틴, 보체 성분 C1q, 보체 성분 C3, 보체 성분 C3b, 인자 B, 인자 H, 프로페르딘, AGRP, MMP-12, CYFRA21-1, HE4, 총 PSA, MIF, AFP, CA125, CA19-9, CA15-3(MUC-1), 및 CEA로 이루어진 군으로부터 선택되는 적어도 6개의 단백질을 포함한다.
일부 실시양태에서, 패널은 진행성 선종을 갖는 대상체로부터의 샘플을 나타내는 데 유용하고, 보체 성분 C2, 보체 성분 C9, 인자 D, 인자 I, 보체 성분 C1q, 보체 성분 C3, 보체 성분 C3b, 인자 B, 및 인자 H로 이루어진 군으로부터 선택되는 적어도 3개의 단백질을 포함한다.
일부 실시양태에서, 패널은 결장직장암을 나타내는 데 유용하고, EGF, FGF-2, FLT3L, 프락탈카인, IL-1a, IL-2, IL-6, IL-8, GROa, MIP-3a, 보체 성분 C2, 보체 성분 C9, 인자 D, 인자 I, MBL, MMP-2, GDF-15, 오스테오넥틴, 페리오스틴, ANGPTL4, FGF-21, FGF-23, HGF, 안지오포이에틴-2, BMP-9, IL-1RII, HGFR, IL-6ra, OPN, 테나신-C, 트롬보스폰딘-2, uPAR, CD44, 칼리크레인-6, 메소텔린, EpCAM, Apo A1, AGP, A2MB, 페투인 A, HP, L-셀렉틴, 보체 성분 C1q, 보체 성분 C3, 보체 성분 C3b, 인자 B, 인자 H, 프로페르딘, AGRP, MMP-12, CYFRA21-1, HE4, 총 PSA, MIF, AFP, CA125, CA19-9, CA15-3(MUC-1), 및 CEA로 이루어진 군으로부터 선택되는 적어도 6개의 단백질을 포함한다.
일부 실시양태에서, 패널은 결장직장암을 갖는 대상체로부터의 샘플을 나타내는 데 유용하고, 보체 성분 C2, 보체 성분 C9, 인자 D, 인자 I, 보체 성분 C1q, 보체 성분 C3, 보체 성분 C3b, 인자 B, 및 인자 H로 이루어진 군으로부터 선택되는 적어도 3개의 단백질을 포함한다.
일부 실시양태에서, 미리 결정된 단백질 세트는 적어도 1개, 적어도 2개, 적어도 3개, 적어도 4개, 적어도 5개, 적어도 6개, 적어도 7개, 적어도 8개, 적어도 9개, 적어도 10개, 적어도 11개, 적어도 12개, 적어도 13개, 적어도 14개, 적어도 15개, 적어도 16개, 적어도 17개, 적어도 18개, 적어도 19개, 적어도 20개, 적어도 21개, 적어도 22개, 적어도 23개, 적어도 24개, 적어도 25개, 적어도 26개, 적어도 27개, 적어도 28개, 적어도 29개, 적어도 30개, 적어도 31개, 적어도 32개, 적어도 33개, 적어도 34개, 적어도 35개, 적어도 36개, 적어도 37개, 적어도 38개, 적어도 39개, 적어도 40개, 적어도 41개, 적어도 42개, 적어도 43개, 적어도 44개, 적어도 45개, 적어도 46개, 적어도 47개, 적어도 48개, 적어도 49개, 적어도 50개, 적어도 51개, 적어도 52개, 적어도 53개, 적어도 54개, 적어도 55개, 적어도 56개, 적어도 57개, 적어도 58개, 적어도 59개, 적어도 60개, 또는 그 초과의 단백질, 예컨대 본원에 기재된 단백질을 함유한다. 일부 실시양태에서, 미리 결정된 단백질 세트는 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60개, 또는 그 초과의 단백질, 예컨대 본원에 기재된 단백질을 함유한다. 일부 실시양태에서, 미리 결정된 단백질 세트는 EGF, FGF-2, FLT3L, 프락탈카인, IL-1a, IL-2, IL-6, IL-8, GROa, MIP-3a, 보체 성분 C2, 보체 성분 C9, 인자 D, 인자 I, MBL, MMP-2, GDF-15, 오스테오넥틴, 페리오스틴, ANGPTL4, FGF-21, FGF-23, HGF, 안지오포이에틴-2, BMP-9, IL-1RII, HGFR, IL-6ra, OPN, 테나신-C, 트롬보스폰딘-2, uPAR, CD44, 칼리크레인-6, 메소텔린, EpCAM, Apo A1, AGP, A2MB, 페투인 A, HP, L-셀렉틴, 보체 성분 C1q, 보체 성분 C3, 보체 성분 C3b, 인자 B, 인자 H, 프로페르딘, AGRP, MMP-12, CYFRA21-1, HE4, 총 PSA, MIF, AFP, CA125, CA19-9, CA15-3(MUC-1), 및 CEA로부터 선택되는 단백질을 함유한다. 일부 실시양태에서, 미리 결정된 단백질 세트는 표 2에 열거된 군으로부터 선택되는 단백질을 함유한다.
일부 실시양태에서, 미리 결정된 패널의 단백질은 인터루킨, 보체 경로 매개체, 보체 단백질, 케모카인, 성장 인자, 시토카인, 글로불린 단백질, 뮤신 및 프로테이나제와 같은 기능적 부류의 단백질을 포함한다.
분류자, 기계 학습 모델 & 시스템
정보 제공 단백질의 패널을 확인하기 위해 대상체로부터의 생물학적 샘플로부터 유래된 단백질 데이터를 특징화하기 위해 기계 학습 접근법이 이용된다. 결장 세포 증식 장애에 대한 정보 제공 단백질의 확인된 패널은 건강한 대상체 및 결장 세포 증식 장애를 갖는 대상체로부터의 샘플을 구별하는 데 유용한 분류자 모델을 트레이닝하는 데 유용하다.
건강한 대상체의 혈장 샘플 및 결장 세포 증식 장애를 갖는 대상체로부터의 혈장 샘플에서 발현되는 본원에 기재된 단백질에 대해 트레이닝된 기계 학습 모델 분류자가 본원에 추가로 기재된다. 기계 학습 모델의 트레이닝은 건강한 대상체 또는 결장 세포 증식 장애를 갖는 대상체를 분류하는 데 유용한 단백질 바이오마커의 미리 결정된 세트("단백질 패널" 또는 "시그니처 패널")를 갖는 분류자를 제공한다. 한 예에서, 조직학적 중증도를 평가하기 위해 결장직장 병변을 갖는 대상체에서 사용될 수 있는 혈액 기반 최소 침습적 단백질 검정을 위한 방법이 제공된다. 또 다른 실시양태에서, 결장 세포 증식 장애를 나타내는 단백질은 대상체로부터의 무세포 샘플, 예컨대 전혈, 혈장 또는 혈청과 같은 대상체로부터의 체액 샘플에서 검출된다. 이와 같이, 본원에 개시된 단백질은 외과적 절제, 면역요법, 방사선 또는 화학요법과 같은 치료를 보증하는 결장 세포 증식 장애, 고위험 결장직장 병변 또는 저위험 결장직장 병변의 존재 또는 부재를 감별하고 저위험 결장 직장 병변을 모니터링하는 데 사용될 수 있다. 결장 세포 증식 장애 또는 병변의 존재에 대한 모니터링 및 확인은, 예컨대 결장경검사, 초음파, MM 또는 CT 스캔에 의해 수행될 수 있다.
일부 예에서, 단백질 피처는 단백질 프로파일과 대상체 그룹(예컨대, 환자 그룹) 사이의 상관관계를 찾기 위해 트레이닝된 알고리즘(예컨대, 기계 학습 모델 또는 분류자)에 입력 데이터세트로 사용된다. 이러한 환자 그룹의 예는 질환 또는 병태의 존재 또는 부재, 질환 또는 병태의 증가된 또는 증가되지 않은 위험, 질환 또는 병태의 단계, 질환 또는 병태의 하위유형, 치료에 대한 반응자 대 치료에 대한 비-반응자, 및 프로그레서(progressor) 대 비-프로그레서를 포함한다. 일부 예에서, 공지된 병태 또는 특징을 갖는 대상체로부터의 샘플을 비교하기 위해 피처 메트릭스가 생성된다. 일부 실시양태에서, 샘플은 건강한 대상체, 또는 어떠한 공지된 징조도 없는 대상체로부터의 샘플 및 암을 갖는 것으로 공지된 환자로부터의 샘플이다.
본원에서 사용되는 바와 같이, 기계 학습 및 패턴 인식과 관련되므로, 용어 "피처"는 일반적으로 관찰되는 현상의 개별적인 측정 가능한 특성 또는 특징을 지칭한다. "피처"의 개념은, 예컨대 선형 회귀 및 로지스틱 회귀(이에 제한되지 않음)와 같은 통계 기술에 사용되는 설명 변수의 개념과 관련된다. 피처는 수치적이거나 범주적일 수 있다(예컨대, 문자열 및 그래프와 같은 구조적 피처는 구문 패턴 인식에 사용됨).
본원에서 사용되는 바와 같이, 용어 "입력 피처" (또는 "피처")는 일반적으로 샘플의 출력 분류(라벨), 예컨대 조건, 단백질 동일성, 단백질 서열 내용(예컨대, 돌연변이), 제안된 데이터 수집 작업 또는 제안된 치료를 예측하기 위해 트레이닝된 알고리즘(예컨대, 기계 학습 모델 또는 분류자)에 의해 사용되는 변수를 지칭한다. 변수의 값은 샘플에 대해 결정되고 분류를 결정하는 데 사용될 수 있다.
복수의 검정에 대해, 시스템은 트레이닝된 알고리즘(예컨대, 기계 학습 모델 또는 분류자)에 입력할 피처 세트를 확인한다. 시스템은 각각의 생물학적 샘플에 대한 검정을 수행하고, 측정값으로부터 피처 벡터를 형성한다. 시스템은 피처 벡터를 기계 학습 모델에 입력하고, 생물학적 샘플이 지정된 특성을 갖는지의 여부에 대한 출력 분류를 수득한다.
일부 실시양태에서, 기계 학습 모델은 대상체의 집단 또는 집단의 피처에서 대상체 또는 피처의 2개 이상의 그룹 또는 부류 사이를 구별할 수 있는 분류자를 출력한다. 일부 실시양태에서, 분류자는 트레이닝된 기계 학습 분류자이다.
일부 실시양태에서, 암 조직에서 바이오마커의 정보 제공 유전자좌 또는 피처를 검정하여 프로파일을 형성한다. 수신기-작동 특징(ROC) 곡선은 2개의 집단(예컨대, 치료제에 반응하는 대상체 및 반응하지 않는 대상체)을 구별할 때 특정 피처(예컨대, 본원에 기재된 임의의 바이오마커 및/또는 추가적인 생물의학적 정보의 임의의 항목)의 성능을 플로팅함으로써 생성될 수 있다. 일부 실시양태에서, 전체 집단(예컨대, 사례 및 대조군)에 걸친 피처 데이터는 단일 피처의 값에 기초하여 오름차순으로 정렬된다.
다양한 예에서, 특정 특성은 건강함 대 암, 증가된 질환 위험 대 증가되지 않은 질환 위험, 질환 하위유형, 질환 단계, 프로그레서 대 비-프로그레서, 및 반응자 대 비-반응자로 이루어진 군으로부터 선택된다.
일부 실시양태에서, 결장 세포 증식 장애는 선종(선종성 폴립), 폴립증 장애, 린치 증후군, 무경성 톱니상 선종(SSA), 진행성 선종, 결장직장 형성이상, 결장직장 선종, 결장직장암, 결장암, 직장암, 결장직장 암종, 결장직장 선암종, 카르시노이드 종양, 위장 카르시노이드 종양, 위장 기질 종양(GIST), 림프종, 및 육종으로 이루어진 군으로부터 선택된다.
A. 데이터 분석
일부 예에서, 본 개시내용은 소프트웨어 어플리케이션, 컴퓨팅 하드웨어, 또는 둘 모두에서 실현되는 데이터 분석을 갖는 시스템, 방법 또는 키트를 제공한다. 일부 예에서, 분석 어플리케이션 또는 시스템은 적어도 데이터 수신 모듈, 데이터 전처리 모듈, 데이터 분석 모듈(하나 이상의 유형의 단백질 데이터에서 작동할 수 있음), 데이터 해석 모듈 또는 데이터 시각화 모듈을 포함한다. 일부 실시양태에서, 데이터 수신 모듈은 실험실 하드웨어 또는 기기를 실험실 데이터를 처리하는 컴퓨터 시스템과 연결하는 컴퓨터 시스템을 포함한다. 일부 실시양태에서, 데이터 전처리 모듈은 분석을 준비하기 위해 데이터에 대한 작업을 수행하는 하드웨어 시스템 또는 컴퓨터 소프트웨어를 포함한다. 전처리 모듈의 데이터에 적용될 수 있는 작업의 예는 아핀 변환, 노이즈 제거 작업, 데이터 정리, 재포맷팅 또는 서브샘플링을 포함한다. 하나 이상의 게놈 물질로부터 게놈 데이터를 분석하는 데 전문화될 수 있는 데이터 분석 모듈은, 예컨대 조립된 게놈 서열을 취하고 확률적 및 통계적 분석을 수행하여 질환, 병리, 상태, 위험, 병태 또는 표현형에 관련된 비정상적 패턴을 확인할 수 있다. 데이터 해석 모듈은 확인된 비정상적 패턴과 건강 상태, 기능 상태, 예후 또는 위험 간의 관계에 대한 이해를 지원하기 위해, 예컨대 통계, 수학 또는 생물학에서 가져온 분석 방법을 이용할 수 있다. 데이터 시각화 모듈은 결과의 이해 또는 해석을 용이하게 할 수 있는 데이터의 시각적 표현을 생성하기 위해 수학적 모델링, 컴퓨터 그래픽 또는 렌더링 방법을 이용할 수 있다.
일부 예에서, 샘플 집단에서 샘플을 구별하기 위해 기계 학습 방법이 적용된다. 일부 실시양태에서, 기계 학습 방법은 건강한 샘플과 진행성 질환(예컨대, 선종) 샘플 사이의 샘플을 구별하기 위해 적용된다.
일부 실시양태에서, 예측 엔진을 트레이닝하는 데 사용되는 하나 이상의 기계 학습 작업은 일반화된 선형 모델, 일반화된 가산 모델, 비-파라메트릭 회귀 작업, 랜덤 포레스트 분류자, 공간 회귀 작업, 베이지안 회귀 모델, 시계열 분석, 베이지안 네트워크, 가우시안 네트워크, 결정 트리 학습 작업, 인공 신경 네트워크, 순환 신경 네트워크, 강화 학습 작업, 선형 또는 비-선형 회귀 작업, 서포트 벡터 머신, 클러스터링 작업 및 유전자 알고리즘 작업 중 하나 이상을 포함한다.
일부 예에서, 컴퓨터 처리 방법은 로지스틱 회귀, 다중 선형 회귀(MLR), 차원 축소, 부분 최소 제곱(PLS) 회귀, 주성분 회귀, 오토인코더, 변이 오토인코더, 특이 값 분해, 푸리에 베이스, 웨이블릿, 판별 분석, 서포트 벡터 머신, 결정 트리, 분류 및 회귀 트리(CART), 트리 기반 방법, 랜덤 포레스트, 그래디언트 부스트 트리, 로지스틱 회귀, 매트릭스(matrix) 분해, 다차원 스케일링(MDS), 차원 감소 방법, t-분산 확률적 이웃 임베딩(t-SNE), 다층 퍼셉트론(MLP), 네트워크 클러스터링, 신경 퍼지 및 인공 신경 네트워크으로 이루어진 군으로부터 선택된다.
일부 예에서, 본원에 개시된 방법은 대상체 또는 복수의 대상체로부터의 샘플의 핵산 시퀀싱 데이터에 대한 전산 분석을 포함할 수 있다.
B. 분류자 생성
한 측면에서, 본원에 개시된 시스템 및 방법은 단백질을 함유하는 생물학적 샘플로부터의 단백질 분석으로부터 유도된 피처 정보에 기초하여 생성된 분류자를 제공한다. 분류자는 단백질과 같은 생물학적 샘플에서 확인된 피처에 기초하여 집단의 그룹을 구별하기 위한 예측 엔진의 일부를 형성한다. 생물학적 샘플에서 단백질 정보의 집합적 표현은 단백질 프로파일로 지칭될 수 있다.
일부 실시양태에서, 분류자는 단백질 정보의 유사한 부분을 통일된 포맷 및 통일된 스케일로 포맷하여 단백질 정보를 정규화하고; 정규화된 단백질 정보를 컬럼형 데이터베이스에 저장하고; 저장된 정규화된 단백질 정보에 하나 이상의 기계 학습 작업을 적용하여 예측 엔진을 트레이닝함으로써 생성되며, 예측 엔진은 적어도 2개의 분류 그룹을 정의하기 위해 하나 이상의 피처의 조합을 특정 집단에 대해 매핑한다.
일부 실시양태에서, 분류자는 단백질 정보의 유사한 부분을 통일된 포맷 및 통일된 스케일로 포맷하여 단백질 정보를 정규화하고; 정규화된 단백질 정보를 컬럼형 데이터베이스에 저장하고; 적어도 2개의 분류 그룹을 정의하기 위해 저장된 정규화된 단백질 정보 피처에 하나 이상의 기계 학습 작업을 적용하여 예측 엔진을 트레이닝함으로써 생성되며, 예측 엔진은 적어도 2개의 분류 그룹을 정의하기 위해 하나 이상의 피처의 조합을 특정 집단에 대해 매핑한다.
일부 실시양태에서, 예측 엔진은 정규화된 단백질 피처가 수득되고 집단 내의 각각의 대상체와 관련된 대상체 집단에 적용되며, 예측 엔진의 출력은 그룹과 관련된 대상체를 확인하고 대상체를 분류 그룹으로 분류하기 위해 평가된다.
본원에서 사용되는 바와 같이, 특이도는 일반적으로 "질환이 없는 이들 중에서 음성 시험의 확률"을 지칭한다. 특이도는 음성으로 시험된 무질환 사람의 수를 무질환 대상체의 총 수로 나누어 계산될 수 있다.
일부 예에서, 모델, 분류자 또는 예측 시험은 적어도 40%, 적어도 45%, 적어도 50%, 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 또는 적어도 99%의 특이도를 갖는다.
본원에서 사용되는 바와 같이, 민감도는 일반적으로 "질환을 갖는 이들 중에서 양성 시험의 확률"을 지칭한다. 민감도는 양성으로 시험된 질환에 걸린 대상체의 수를 질환에 걸린 대상체의 총 수로 나누어 계산될 수 있다.
일부 예에서, 모델, 분류자 또는 예측 시험은 적어도 25%, 적어도 30%, 적어도 35%, 적어도 40%, 적어도 45%, 적어도 50%, 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 또는 적어도 99%의 민감도를 갖는다.
C. 디지털 처리 장치
일부 예에서, 디지털 처리 장치 또는 이의 용도가 본원에 기재된다. 일부 예에서, 디지털 처리 장치는 장치의 기능을 수행하는 하나 이상의 하드웨어 중앙 처리 유닛(CPU), 그래픽 처리 유닛(GPU) 또는 텐서 처리 유닛(TPU)을 포함할 수 있다. 일부 예에서, 디지털 처리 장치는 실행 가능한 명령을 수행하도록 구성된 운영 시스템을 포함할 수 있다.
일부 예에서, 디지털 처리 장치는 임의적으로 컴퓨터 네트워크에 연결될 수 있다. 일부 예에서, 디지털 처리 장치는 임의적으로 인터넷에 연결될 수 있다. 일부 예에서, 디지털 처리 장치는 임의적으로 클라우드 컴퓨팅 인프라에 연결될 수 있다. 일부 예에서, 디지털 처리 장치는 임의적으로 인트라넷에 연결될 수 있다. 일부 예에서, 디지털 처리 장치는 임의적으로 데이터 저장 장치에 연결될 수 있다.
적합한 디지털 처리 장치의 비제한적 예는 서버 컴퓨터, 데스크탑 컴퓨터, 랩탑 컴퓨터, 노트북 컴퓨터, 서브노트북 컴퓨터, 넷북 컴퓨터, 넷패드 컴퓨터, 셋톱 컴퓨터, 핸드헬드 컴퓨터, 인터넷 기기, 모바일 스마트폰, 및 태블릿 컴퓨터를 포함한다. 적합한 태블릿 컴퓨터는, 예컨대 소책자, 슬레이트 및 컨버터블 구성을 갖는 컴퓨터를 포함할 수 있다.
일부 예에서, 디지털 처리 장치는 실행 가능한 명령을 수행하도록 구성된 운영 시스템을 포함할 수 있다. 예컨대, 운영 시스템은 장치의 하드웨어를 관리하고 어플리케이션 실행을 위한 서비스를 제공하는 프로그램 및 데이터를 포함한 소프트웨어를 포함할 수 있다. 운영 시스템의 비제한적인 예는 Ubuntu, FreeBSD, OpenBSD, NetBSD®, Linux, Apple® Mac OS X Server®, Oracle® Solaris®, Windows Server®, 및 Novell® NetWare®를 포함한다. 적합한 개인용 컴퓨터 운영 시스템의 비제한적 예는 Microsoft® Windows®, Apple® Mac OS X®, UNIX®, 및 UNIX-유사 운영 시스템, 예컨대 GNU/Linux®를 포함한다. 일부 예에서, 운영 시스템은 클라우드 컴퓨팅에 의해 제공될 수 있고, 클라우드 컴퓨팅 자원은 하나 이상의 서비스 제공자에 의해 제공될 수 있다.
일부 예에서, 장치는 저장 장치 및/또는 메모리 장치를 포함할 수 있다. 저장 장치 및/또는 메모리 장치는 일시적 또는 영구적으로 데이터 또는 프로그램을 저장하는 데 사용되는 하나 이상의 물리적 장치일 수 있다. 일부 예에서, 장치는 휘발성 메모리일 수 있으며, 저장된 정보를 유지하기 위해 전력이 필요할 수 있다. 일부 예에서, 장치는 비-휘발성 메모리일 수 있고, 디지털 처리 장치에 전원이 공급되지 않을 때 저장된 정보를 보유할 수 있다. 일부 예에서, 비-휘발성 메모리는 플래시 메모리를 포함할 수 있다. 일부 예에서, 비-휘발성 메모리는 동적 랜덤 액세스 메모리(DRAM)를 포함할 수 있다. 일부 예에서, 비-휘발성 메모리는 강유전체 랜덤 액세스 메모리(FRAM)를 포함할 수 있다. 일부 예에서, 비-휘발성 메모리는 위상 변경 랜덤 액세스 메모리(PRAM)를 포함할 수 있다.
일부 예에서, 장치는, 예컨대 CD-ROM, DVD, 플래시 메모리 장치, 자기 디스크 드라이브, 자기 테이프 드라이브, 광학 디스크 드라이브 및 클라우드 컴퓨팅 기반 저장소를 포함하는 저장 장치일 수 있다. 일부 예에서, 저장 장치 및/또는 메모리 장치는 본원에 개시된 것과 같은 장치의 조합일 수 있다. 일부 예에서, 디지털 처리 장치는 시각적 정보를 사용자에게 보내는 디스플레이를 포함할 수 있다. 일부 예에서, 디스플레이는 음극선관(CRT)일 수 있다. 일부 예에서, 디스플레이는 액정 디스플레이(LCD)일 수 있다. 일부 예에서, 디스플레이는 박막 트랜지스터 액정 디스플레이(TFT-LCD)일 수 있다. 일부 예에서, 디스플레이는 유기 발광 다이오드(OLED) 디스플레이일 수 있다. 일부 예에서, OLED 디스플레이는 수동 매트릭스 OLED(PMOLED) 또는 능동 매트릭스 OLED(AMOLED) 디스플레이일 수 있다. 일부 예에서, 디스플레이는 플라즈마 디스플레이일 수 있다. 일부 예에서, 디스플레이는 비디오 프로젝터일 수 있다. 일부 예에서, 디스플레이는 본원에 개시된 것과 같은 장치의 조합일 수 있다.
일부 예에서, 디지털 처리 장치는 사용자로부터 정보를 수신하는 입력 장치를 포함할 수 있다. 일부 예에서, 입력 장치는 키보드일 수 있다. 일부 예에서, 입력 장치는, 예컨대 마우스, 트랙볼, 트랙 패드, 조이스틱, 게임 컨트롤러 또는 스타일러스를 포함하는 포인팅 장치일 수 있다. 일부 예에서, 입력 장치는 터치 스크린 또는 멀티 터치 스크린일 수 있다. 일부 예에서, 입력 장치는 음성 또는 다른 소리 입력을 캡처하는 마이크일 수 있다. 일부 예에서, 입력 장치는 동작 또는 시각적 입력을 캡처하기 위한 비디오 카메라일 수 있다. 일부 예에서, 입력 장치는 본원에 개시된 것과 같은 장치의 조합일 수 있다.
D. 비-일시적 컴퓨터 판독 가능 저장 매체
일부 예에서, 본원에 개시된 주제는 임의적으로 네트워크화된 디지털 처리 장치의 운영 시스템에 의해 실행 가능한 명령을 포함하는 프로그램으로 인코딩된 하나 이상의 비-일시적 컴퓨터 판독 가능 저장 매체를 포함할 수 있다. 일부 예에서, 컴퓨터 판독 가능 저장 매체는 디지털 처리 장치의 유형 구성요소일 수 있다. 일부 예에서, 컴퓨터 판독 가능 저장 매체는 임의적으로 디지털 처리 장치로부터 제거될 수 있다. 일부 예에서, 컴퓨터 판독 가능 저장 매체는, 예컨대 CD-ROM, DVD, 플래시 메모리 장치, 고체 상태 메모리, 자기 디스크 드라이브, 자기 테이프 드라이브, 광학 디스크 드라이브, 클라우드 컴퓨팅 시스템 및 서비스 등을 포함할 수 있다. 일부 예에서, 프로그램 및 명령은 매체에 영구적으로, 실질적으로 영구적으로, 반영구적으로 또는 비-일시적으로 인코딩될 수 있다.
E. 컴퓨터 시스템
본 개시내용은 본원에 기재된 방법을 구현하도록 프로그래밍된 컴퓨터 시스템을 제공한다. 도 1은 환자 데이터, 생물학적 데이터, 생물학적 서열, 참조 서열 및 단백질 프로파일을 저장, 처리, 확인 또는 해석하도록 프로그래밍되거나 달리 구성된 컴퓨터 시스템(101)을 나타낸다. 컴퓨터 시스템(101)은 본 개시내용의 환자 데이터, 생물학적 데이터, 생물학적 서열, 참조 서열 및 단백질 프로파일의 다양한 측면을 처리할 수 있다. 컴퓨터 시스템(101)은 사용자의 전자 장치 또는 전자 장치에 대해 원격 위치에 있는 컴퓨터 시스템일 수 있다. 전자 장치는 모바일 전자 장치일 수 있다.
컴퓨터 시스템(101)은 중앙 처리 유닛(CPU, 본원에서 "프로세서" 및 "컴퓨터 프로세서"라고도 함)(105)을 포함하며, 이는 단일 코어 또는 멀티 코어 프로세서 또는 병렬 처리를 위한 복수의 프로세서일 수 있다. 컴퓨터 시스템(101)은 또한 메모리 또는 메모리 위치(110) (예컨대, 랜덤 액세스 메모리, 판독 전용 메모리, 플래시 메모리), 전자 저장 유닛(115) (예컨대, 하드 디스크), 하나 이상의 다른 시스템과의 통신을 위한 통신 인터페이스(120) (예컨대, 네트워크 어댑터), 및 캐시, 다른 메모리, 데이터 저장 및/또는 전자 디스플레이 어댑터와 같은 주변 장치(125)를 포함한다. 메모리(110), 저장 유닛(115), 인터페이스(120) 및 주변 장치(125)는 마더보드와 같은 통신 버스(실선)를 통해 CPU(105)와 통신한다. 저장 유닛(115)은 데이터를 저장하기 위한 데이터 저장 유닛 (또는 데이터 저장소)일 수 있다. 컴퓨터 시스템(101)은 통신 인터페이스(120)의 도움으로 컴퓨터 네트워크("네트워크") (130)에 동작 가능하게 커플링될 수 있다. 네트워크(130)는 인터넷, 인터넷 및/또는 엑스트라넷, 또는 인터넷과 통신하는 인트라넷 및/또는 엑스트라넷일 수 있다. 일부 예에서, 네트워크(130)는 원격통신 및/또는 데이터 네트워크이다. 네트워크(130)는 클라우드 컴퓨팅과 같은 분산 컴퓨팅을 가능하게 할 수 있는 하나 이상의 컴퓨터 서버를 포함할 수 있다. 일부 예에서, 네트워크(130)는 컴퓨터 시스템(101)의 도움으로 피어-투-피어 네트워크를 구현할 수 있으며, 이는 컴퓨터 시스템(101)에 커플링된 장치가 클라이언트 또는 서버로 작동하도록 할 수 있다.
CPU(105)는 프로그램 또는 소프트웨어에서 구현될 수 있는 일련의 기계 판독 가능 명령을 실행할 수 있다. 명령은 메모리(110)와 같은 메모리 위치에 저장될 수 있다. 명령은 CPU(105)로 보내질 수 있으며, 이는 본 개시내용의 방법을 구현하기 위해 CPU(105)를 후속적으로 프로그래밍하거나 달리 구성할 수 있다. CPU(105)에 의해 수행되는 동작의 예는 페치(fetch), 디코딩, 실행 및 라이트백(writeback)을 포함할 수 있다.
CPU(105)는 집적 회로와 같은 회로의 일부일 수 있다. 시스템(101)의 하나 이상의 다른 구성요소가 회로에 포함될 수 있다. 일부 예에서, 회로는 어플리케이션 지정된 집적 회로(ASIC)이다.
저장 유닛(115)은 드라이버, 라이브러리, 저장된 프로그램과 같은 파일을 저장할 수 있다. 저장 유닛(115)은 사용자 데이터, 예컨대 사용자 선호도 및 사용자 프로그램을 저장할 수 있다. 일부 예에서, 컴퓨터 시스템(101)은 인트라넷 또는 인터넷을 통해 컴퓨터 시스템(101)과 통신하는 원격 서버에 위치되는 것과 같이 컴퓨터 시스템(101) 외부에 있는 하나 이상의 추가 데이터 저장 유닛을 포함할 수 있다.
컴퓨터 시스템(101)은 네트워크(130)를 통해 하나 이상의 원격 컴퓨터 시스템과 통신할 수 있다. 예컨대, 컴퓨터 시스템(101)은 사용자의 원격 컴퓨터 시스템과 통신할 수 있다. 원격 컴퓨터 시스템의 예는 개인용 컴퓨터(예컨대, 휴대용 PC), 슬레이트 또는 태블릿 PC(예컨대, Apple® 아이패드, Samsung® 갤럭시 탭), 전화, 스마트폰(예컨대, Apple® 아이폰, 안드로이드 지원 장치, Blackberry®), 또는 개인 정보 단말기를 포함한다. 사용자는 네트워크(130)를 통해 컴퓨터 시스템(101)에 액세스할 수 있다.
본원에 기재된 방법은, 예컨대 메모리(110) 또는 전자 저장 유닛(115)과 같은 컴퓨터 시스템(101)의 전자 저장 위치에 저장된 기계(예컨대, 컴퓨터 프로세서) 실행 가능 코드를 통해 구현될 수 있다. 기계 실행 가능 또는 기계 판독 가능 코드는 소프트웨어 형태로 제공될 수 있다. 사용 중에, 코드는 프로세서(105)에 의해 실행될 수 있다. 일부 예에서, 코드는 저장 유닛(115)으로부터 검색될 수 있고 프로세서(105)에 의한 즉석 액세스를 위해 메모리(110)에 저장될 수 있다. 일부 예에서, 전자 저장 유닛(115)은 제외될 수 있으며, 기계 실행 가능 명령은 메모리(110)에 저장된다.
코드는 코드를 실행하도록 적응된 프로세서를 갖는 기계와 함께 사용하기 위해 미리 컴파일링되고 구성될 수 있거나 런타임 동안 해석 또는 컴파일링될 수 있다. 코드는 미리 컴파일링된 방식, 해석된 방식 또는 기존 컴파일링 방식으로 코드를 실행할 수 있도록 선택될 수 있는 프로그래밍 언어로 제공될 수 있다.
컴퓨터 시스템(101)과 같이 본원에 제공된 시스템 및 방법의 측면은 프로그래밍으로 구현될 수 있다. 기술의 다양한 측면은 전형적으로 기계 (또는 프로세서) 실행 가능 코드 및/또는 기계 판독 가능 매체 유형에 포함되거나 구현되는 관련된 데이터의 형태인 "제품" 또는 "제조품"으로 간주될 수 있다. 기계 실행 가능 코드는 메모리(예컨대, 판독 전용 메모리, 랜덤 액세스 메모리, 플래시 메모리) 또는 하드 디스크와 같은 전자 저장 유닛에 저장될 수 있다. "저장" 유형의 매체는 소프트웨어 프로그래밍을 위해 언제든지 비-일시적 저장을 제공할 수 있는 다양한 반도체 메모리, 테이프 드라이브, 디스크 드라이브 등과 같은 컴퓨터, 프로세서 등의 유형 메모리 또는 이의 관련된 모듈의 일부 또는 전부를 포함할 수 있다. 소프트웨어의 전부 또는 일부는 때때로 인터넷 또는 다른 다양한 원격통신 네트워크를 통해 통신될 수 있다. 예컨대, 이러한 통신은 하나의 컴퓨터 또는 프로세서로부터 다른 컴퓨터 또는 프로세서로, 예컨대 관리 서버 또는 호스트 컴퓨터로부터 어플리케이션 서버의 컴퓨터 플랫폼으로 소프트웨어를 로딩할 수 있다. 따라서, 소프트웨어 요소를 포함할 수 있는 또 다른 유형의 매체는 유선 및 광 랜선 네트워크를 통해 및 다양한 공중 링크를 통해 로컬 장치 사이의 물리적 인터페이스를 통해 사용되는 것과 같은 광학, 전기 및 전자기파를 포함한다. 유선 또는 무선 링크, 광학 링크 등과 같이 이러한 파동을 전달하는 물리적 요소도 소프트웨어를 포함하는 매체로 간주될 수 있다. 본원에서 사용되는 바와 같이, 비-일시적 유형 "저장" 매체로 제한되지 않는 한, 컴퓨터 또는 기계 "판독 가능 매체"와 같은 용어는 일반적으로 실행을 위해 프로세서에 명령을 제공하는 데 참여하는 임의의 매체를 지칭한다.
따라서, 컴퓨터 실행 가능 코드와 같은 기계 판독 가능 매체는 유형의 저장 매체, 반송파 매체 또는 물리적 전송 매체를 포함하지만 이에 제한되지 않는 다양한 형태를 취할 수 있다. 비-휘발성 저장 매체는, 예컨대 본원에 기재된 데이터베이스를 구현하는 데 사용될 수 있는 임의의 컴퓨터(들) 등에 있는 임의의 저장 장치와 같은 광학 또는 자기 디스크를 포함한다. 휘발성 저장 매체는 본원에 기재된 컴퓨터 플랫폼의 메인 메모리와 같은 동적 메모리를 포함한다. 유형의 전송 매체는 동축 케이블; 컴퓨터 시스템 내의 버스를 포함하는 전선을 포함한 구리선 및 광섬유를 포함한다. 반송파 전송 매체는 전기 또는 전자기 신호, 또는 무선 주파수(RF) 및 적외선(IR) 데이터 통신 중에 생성되는 것과 같은 음향 또는 광파의 형태를 취할 수 있다. 따라서, 일반적인 형태의 컴퓨터 판독 가능 매체는 플로피 디스크, 플렉시블 디스크, 하드 디스크, 자기 테이프, 임의의 다른 자기 매체, CD-ROM, DVD 또는 DVD-ROM, 임의의 다른 광학 매체, 펀치 카드 페이퍼 테이프, 구멍 패턴을 갖는 임의의 다른 물리적 저장 매체, RAM, ROM, PROM 및 EPROM, FLASH-EPROM, 임의의 다른 메모리 칩 또는 카트리지, 데이터 또는 명령을 전송하는 반송파, 이러한 반송파를 전송하는 케이블 또는 링크, 또는 컴퓨터가 프로그래밍 코드 및/또는 데이터를 판독할 수 있는 임의의 다른 매체를 포함한다. 이러한 형태의 컴퓨터 판독 가능 매체 중 다수는 실행을 위해 하나 이상의 명령의 하나 이상의 시퀀스를 프로세서로 전달하는 데 관여할 수 있다.
컴퓨터 시스템(101)은, 예컨대 핵산 서열, 농축된 핵산 샘플 데이터, 단백질 프로파일, 발현 프로파일, 및 RNA 발현 프로파일의 분석을 제공하기 위한 사용자 인터페이스(UI) (140)를 포함하는 전자 디스플레이(135)를 포함하거나 이와 통신할 수 있다. UI의 예는 그래픽 사용자 인터페이스(GUI) 및 웹 기반 사용자 인터페이스를 포함하지만 이에 제한되지 않는다.
본 개시내용의 방법 및 시스템은 하나 이상의 알고리즘을 통해 구현될 수 있다. 알고리즘은 중앙 처리 유닛(105)에 의해 실행될 때 소프트웨어를 통해 구현될 수 있다. 알고리즘은, 예컨대 환자 데이터, 생물학적 데이터, 생물학적 서열, 참조 서열 및 단백질 프로파일을 저장, 처리, 확인 또는 해석할 수 있다.
일부 예에서, 본원에 개시된 주제는 적어도 하나의 컴퓨터 프로그램 또는 이의 용도를 포함할 수 있다. 컴퓨터 프로그램은 지정된 작업을 수행하기 위해 작성된 디지털 처리 장치의 CPU, GPU 또는 TPU에서 실행 가능한 일련의 명령일 수 있다. 컴퓨터 판독 가능 명령은 특정 작업을 수행하거나 특정한 추상 데이터 유형을 구현하는 함수, 객체, 어플리케이션 프로그래밍 인터페이스(API), 데이터 구조 등과 같은 프로그램 모듈로 구현될 수 있다. 본원에 제공된 개시내용에 비추어 볼 때, 컴퓨터 프로그램은 다양한 버전의 다양한 언어로 작성될 수 있다.
컴퓨터 판독 가능 명령의 기능은 다양한 환경에서 원하는 대로 조합되거나 분포될 수 있다. 일부 예에서, 컴퓨터 프로그램은 하나의 명령 시퀀스를 포함할 수 있다. 일부 예에서, 컴퓨터 프로그램은 복수의 명령 시퀀스를 포함할 수 있다. 일부 예에서, 컴퓨터 프로그램은 한 위치에서 제공될 수 있다. 일부 예에서, 컴퓨터 프로그램은 복수의 위치에서 제공될 수 있다. 일부 예에서, 컴퓨터 프로그램은 하나 이상의 소프트웨어 모듈을 포함할 수 있다. 일부 예에서, 컴퓨터 프로그램은 하나 이상의 웹 어플리케이션, 하나 이상의 모바일 어플리케이션, 하나 이상의 독립 실행형 어플리케이션, 하나 이상의 웹 브라우저 플러그-인, 확장, 애드-인 또는 애드-온 또는 이의 조합을 포함할 수 있다.
일부 예에서, 컴퓨터 처리는 통계, 수학, 생물학 또는 이들의 임의의 조합의 방법일 수 있다. 일부 예에서, 컴퓨터 처리 방법은, 예컨대 로지스틱 회귀, 차원 축소, 주성분 분석, 오토인코더, 특이 값 분해, 푸리에 베이스, 특이 값 분해, 웨이블렛, 판별 분석, 서포트 벡터 머신, 트리 기반 방법, 랜덤 포레스트, 그래디언트 부스트 트리, 로지스틱 회귀, 매트릭스 분해, 네트워크 클러스터링, 및 신경 네트워크를 포함한다.
일부 예에서, 컴퓨터 처리 방법은, 예컨대 회귀, 서포트 벡터 머신, 트리 기반 방법 및 네트워크를 포함하는 감독 기계 학습 방법이다.
일부 예에서, 컴퓨터 처리 방법은, 예컨대 클러스터링, 네트워크, 주성분 분석 및 매트릭스 분해를 포함하는 무감독 기계 학습 방법이다.
F. 데이터베이스
일부 예에서, 본원에 개시된 주제는 하나 이상의 데이터베이스, 또는 환자 데이터, 생물학적 데이터, 생물학적 서열, 참조 서열 또는 단백질 프로파일을 저장하기 위한 이의 용도를 포함할 수 있다. 참조 서열은 데이터베이스에서 유도될 수 있다. 본원에 제공된 개시내용을 고려하여, 많은 데이터베이스가 서열 정보의 저장 및 검색에 적합할 수 있다. 일부 예에서, 적절한 데이터베이스는, 예컨대 관계형 데이터베이스, 비-관계형 데이터베이스, 객체 지향된 데이터베이스, 객체 데이터베이스, 실체 관계 모델 데이터베이스, 연관 데이터베이스 및 XML 데이터베이스를 포함할 수 있다. 일부 예에서, 데이터베이스는 인터넷 기반일 수 있다. 일부 예에서,데이터베이스는 웹 기반일 수 있다. 일부 예에서, 데이터베이스는 클라우드 컴퓨팅 기반일 수 있다. 일부 예에서, 데이터베이스는 하나 이상의 로컬 컴퓨터 저장 장치를 기반으로 할 수 있다.
일 측면에서, 본 개시내용은 프로세서가 본원에 개시된 방법을 수행하도록 지시하는 명령을 포함하는 비-일시적 컴퓨터 판독 가능 매체를 제공한다.
일 측면에서, 본 발명은 컴퓨터 판독 가능 매체를 포함하는 컴퓨팅 장치를 제공한다.
또 다른 측면에서, 본 개시내용은 하기를 포함하는, 생물학적 샘플의 분류를 수행하기 위한 시스템을 제공한다:
a) 복수의 트레이닝 샘플을 수신하기 위한 수신기로서, 복수의 트레이닝 샘플 각각은 복수의 분자 부류를 갖고, 복수의 트레이닝 샘플 각각은 하나 이상의 공지된 라벨을 포함하는 수신기;
b) 복수의 트레이닝 샘플 각각에 대한 기계 학습 모델을 사용하여 컴퓨터 처리되도록 작동 가능한 검정에 상응하는 피처 세트를 확인하기 위한 피처 모듈로서, 피처 세트는 복수의 트레이닝 샘플에서 분자 특성에 상응하고, 복수의 트레이닝 샘플 각각에 대해, 시스템은 측정값 세트를 수득하기 위해 트레이닝 샘플 내의 복수의 분자 부류를 복수의 상이한 검정에 적용하도록 작동 가능하며, 각각의 측정값 세트는 트레이닝 샘플 내의 분자 부류에 적용되는 하나의 검정으로부터의 것이고, 복수의 트레이닝 샘플에 대해 복수의 측정값 세트가 수득되는 피처 모듈;
c) 트레이닝 샘플에 대한 트레이닝 벡터를 수득하기 위해 측정값 세트를 분석하는 분석 모듈로서, 트레이닝 벡터는 상응하는 검정의 N 세트의 피처의 피처 값을 포함하고, 각각의 피처 값은 피처에 상응하고 하나 이상의 측정값을 포함하고, 트레이닝 벡터는 복수의 상이한 검정의 제1 서브세트에 상응하는 N 세트의 피처 중 적어도 2개로부터의 적어도 하나의 피처를 사용하여 형성하는 분석 모듈;
d) 복수의 트레이닝 샘플에 대한 출력 라벨을 수득하기 위해 기계 학습 모델의 파라미터를 사용하여 트레이닝 벡터에 대해 시스템에 알리는 라벨링 모듈;
e) 트레이닝 샘플의 공지된 라벨과 출력 라벨을 비교하기 위한 비교기 모듈;
f) 트레이닝 샘플의 공지된 라벨에 대한 출력 라벨의 비교에 기초하여 기계 학습 모델 트레이닝의 일부로서 파라미터의 최적 값을 반복적으로 검색하기 위한 트레이닝 모듈; 및
g) 기계 학습 모델의 파라미터 및 기계 학습 모델에 대한 피처 세트를 제공하기 위한 출력 모듈.
집단 내의 대상체를 분류하는 방법
개시된 방법은 대상체에서 발현된 단백질의 분석을 통해 결장 세포 증식 장애와 관련된 단백질 발현의 파라미터를 확인하는 것에 관한 것이다. 방법은, 보다 구체적으로는 상기 장애의 단계 또는 하위부류와 상기 장애에 대한 유전적 소인의 개선된 확인 및 이들 간의 감별을 가능하게 함으로써, 결장 세포 증식 장애의 개선된 진단, 치료 및 모니터링에 사용하기 위한 것이다.
일부 실시양태에서, 방법은 집단 내의 대상체로부터의 생물학적 샘플에서 단백질의 차등적 발현을 분석하는 단계를 포함한다.
본 개시내용은, 예컨대 결장 세포 증식 장애가 있는 대상체와 없는 대상체 사이 또는 상이한 결장 세포 증식 장애 사이의 단백질의 존재 및 특징을 검출하기 위해 무세포 샘플에 적용될 수 있는 결장 세포 증식 장애를 검출하는 방법을 제공한다. 방법은 결장 세포 증식 장애를 갖지 않는 건강한 대상체와 비교하여 결장 세포 증식 장애 신호에 대해 기본 "양성" 또는 "음성"으로서 단백질의 검출을 활용한다.
일부 실시양태에서, 결장 세포 증식 장애는 선종(선종성 폴립), 폴립증 장애, 린치 증후군, 무경성 톱니상 선종(SSA), 진행성 선종, 결장직장 형성이상, 결장직장 선종, 결장직장암, 결장암, 직장암, 결장직장 암종, 결장직장 선암종, 카르시노이드 종양, 위장 카르시노이드 종양, 위장 기질 종양(GIST), 림프종, 및 육종으로 이루어진 군으로부터 선택된다.
한 측면에서, 본 개시내용은 하기 단계를 포함하는, 대상체로부터의 생물학적 샘플의 단백질 프로파일을 결정하는 방법을 제공한다:
a) 대상체로부터 단백질을 함유하는 생물학적 샘플을 수득하는 단계; 및
b) 생물학적 샘플에서 EGF, FGF-2, FLT3L, 프락탈카인, IL-1a, IL-2, IL-6, IL-8, GROa, MIP-3a, 보체 성분 C2, 보체 성분 C9, 인자 D, 인자 I, MBL, MMP-2, GDF-15, 오스테오넥틴, 페리오스틴, ANGPTL4, FGF-21, FGF-23, HGF, 안지오포이에틴-2, BMP-9, IL-1RII, HGFR, IL-6ra, OPN, 테나신-C, 트롬보스폰딘-2, uPAR, CD44, 칼리크레인-6, 메소텔린, EpCAM, Apo A1, AGP, A2MB, 페투인 A, HP, L-셀렉틴, 보체 성분 C1q, 보체 성분 C3, 보체 성분 C3b, 인자 B, 인자 H, 프로페르딘, AGRP, MMP-12, CYFRA21-1, HE4, 총 PSA, MIF, AFP, CA125, CA19-9, CA15-3(MUC-1), 및 CEA로 이루어진 군으로부터 선택되는 적어도 6개의 단백질의 미리 결정된 패널의 존재 및 양을 측정하여 대상체의 단백질 프로파일을 제공하는 단계.
일부 실시양태에서, 단백질 프로파일은 결장 세포 증식 장애와 관련되고, 결장 세포 증식 장애를 갖는 것으로 대상체의 분류를 제공한다.
일부 실시양태에서, 대상체로부터의 생물학적 샘플은 체액, 대변, 결장 유출물, 소변, 혈장, 혈청, 전혈, 단리된 혈액 세포, 혈액으로부터 단리된 세포, 및 이들의 조합으로 이루어진 군으로부터 선택된다.
일부 실시양태에서, 결장 세포 증식 장애는 선종(선종성 폴립), 폴립증 장애, 린치 증후군, 무경성 톱니상 선종(SSA), 진행성 선종, 결장직장 형성이상, 결장직장 선종, 결장직장암, 결장암, 직장암, 결장직장 암종, 결장직장 선암종, 카르시노이드 종양, 위장 카르시노이드 종양, 위장 기질 종양(GIST), 림프종, 및 육종으로 이루어진 군으로부터 선택된다.
일부 실시양태에서, 결장 세포 증식 장애는 1기 결장직장암, 2기 결장직장암, 3기 결장직장암 및 4기 결장직장암으로 이루어진 군으로부터 선택된다.
일부 실시양태에서, 진행성 선종은 관형 선종, 관융모 선종, 융모 선종, 선암종 또는 과형성 폴립이다.
또 다른 측면에서, 본 개시내용은 하기 단계를 포함하는, 대상체에서 결장 세포 증식 장애를 검출하는 방법을 제공한다:
a) 대상체로부터 단백질을 함유하는 생물학적 샘플을 수득하는 단계;
b) 생물학적 샘플에서 EGF, FGF-2, FLT3L, 프락탈카인, IL-1a, IL-2, IL-6, IL-8, GROa, MIP-3a, 보체 성분 C2, 보체 성분 C9, 인자 D, 인자 I, MBL, MMP-2, GDF-15, 오스테오넥틴, 페리오스틴, ANGPTL4, FGF-21, FGF-23, HGF, 안지오포이에틴-2, BMP-9, IL-1RII, HGFR, IL-6ra, OPN, 테나신-C, 트롬보스폰딘-2, uPAR, CD44, 칼리크레인-6, 메소텔린, EpCAM, Apo A1, AGP, A2MB, 페투인 A, HP, L-셀렉틴, 보체 성분 C1q, 보체 성분 C3, 보체 성분 C3b, 인자 B, 인자 H, 프로페르딘, AGRP, MMP-12, CYFRA21-1, HE4, 총 PSA, MIF, AFP, CA125, CA19-9, CA15-3(MUC-1), 및 CEA로 이루어진 군으로부터 선택되는 적어도 6개의 단백질의 미리 결정된 패널의 존재 및 양을 측정하여 대상체의 단백질 프로파일을 제공하는 단계; 및
c) 단백질 프로파일을 건강한 대상체와 결장 세포 증식 장애를 갖는 대상체를 구별할 수 있도록 트레이닝된 기계 학습 모델로 컴퓨터 처리하여 결장 세포 증식 장애의 존재 또는 부재와 관련된 출력값을 제공함으로써 대상체에서 결장 세포 증식 장애의 존재 또는 부재를 나타내는 단계.
일부 실시양태에서, 대상체로부터의 생물학적 샘플은 체액, 대변, 결장 유출물, 소변, 혈장, 혈청, 전혈, 단리된 혈액 세포, 혈액으로부터 단리된 세포, 및 이들의 조합으로 이루어진 군으로부터 선택된다.
또 다른 측면에서, 하기 단계를 포함하는, 샘플에서 단백질 프로파일을 생성하기 위해 단백질을 검출하는 방법이 본원에 개시된다:
a) 대상체로부터 단백질을 함유하는 생물학적 샘플을 수득하는 단계; 및
b) 생물학적 샘플에서 EGF, FGF-2, FLT3L, 프락탈카인, IL-1a, IL-2, IL-6, IL-8, GROa, MIP-3a, 보체 성분 C2, 보체 성분 C9, 인자 D, 인자 I, MBL, MMP-2, GDF-15, 오스테오넥틴, 페리오스틴, ANGPTL4, FGF-21, FGF-23, HGF, 안지오포이에틴-2, BMP-9, IL-1RII, HGFR, IL-6ra, OPN, 테나신-C, 트롬보스폰딘-2, uPAR, CD44, 칼리크레인-6, 메소텔린, EpCAM, Apo A1, AGP, A2MB, 페투인 A, HP, L-셀렉틴, 보체 성분 C1q, 보체 성분 C3, 보체 성분 C3b, 인자 B, 인자 H, 프로페르딘, AGRP, MMP-12, CYFRA21-1, HE4, 총 PSA, MIF, AFP, CA125, CA19-9, CA15-3(MUC-1), 및 CEA로 이루어진 군으로부터 선택되는 적어도 6개의 단백질의 미리 결정된 패널의 존재 및 양을 측정하여 생물학적 샘플의 단백질 프로파일을 제공하는 단계.
또 다른 측면에서, EGF, FGF-2, FLT3L, 프락탈카인, IL-1a, IL-2, IL-6, IL-8, GROa, MIP-3a, 보체 성분 C2, 보체 성분 C9, 인자 D, 인자 I, MBL, MMP-2, GDF-15, 오스테오넥틴, 페리오스틴, ANGPTL4, FGF-21, FGF-23, HGF, 안지오포이에틴-2, BMP-9, IL-1RII, HGFR, IL-6ra, OPN, 테나신-C, 트롬보스폰딘-2, uPAR, CD44, 칼리크레인-6, 메소텔린, EpCAM, Apo A1, AGP, A2MB, 페투인 A, HP, L-셀렉틴, 보체 성분 C1q, 보체 성분 C3, 보체 성분 C3b, 인자 B, 인자 H, 프로페르딘, AGRP, MMP-12, CYFRA21-1, HE4, 총 PSA, MIF, AFP, CA125, CA19-9, CA15-3(MUC-1), 및 CEA로 이루어진 군으로부터 선택되는 적어도 6개의 단백질을 검출하는 단계; 및 필요한 경우 상기 샘플에서 상기 적어도 6개의 단백질의 수준을 결정하는 단계를 포함하는, 대상체로부터의 생물학적 샘플에서 데이터를 수득하는 방법이 본원에 개시된다.
일부 실시양태에서, 결장 세포 증식 장애는 선종(선종성 폴립), 폴립증 장애, 린치 증후군, 무경성 톱니상 선종(SSA), 진행성 선종, 결장직장 형성이상, 결장직장 선종, 결장직장암, 결장암, 직장암, 결장직장 암종, 결장직장 선암종, 카르시노이드 종양, 위장 카르시노이드 종양, 위장 기질 종양(GIST), 림프종, 및 육종으로 이루어진 군으로부터 선택된다.
일부 실시양태에서, 결장 세포 증식 장애는 1기 결장직장암, 2기 결장직장암, 3기 결장직장암 및 4기 결장직장암으로 이루어진 군으로부터 선택된다.
또 다른 측면에서, 본 개시내용은 하기 단계를 포함하는, 대상체로부터의 생물학적 샘플의 단백질 프로파일을 결정하는 방법을 제공한다:
a) 대상체로부터 단백질을 함유하는 생물학적 샘플을 수득하는 단계; 및
b) 생물학적 샘플에서 EGF, FGF-2, FLT3L, 프락탈카인, IL-1a, IL-2, IL-6, IL-8, GROa, MIP-3a, 보체 성분 C2, 보체 성분 C9, 인자 D, 인자 I, MBL, MMP-2, GDF-15, 오스테오넥틴, 페리오스틴, ANGPTL4, FGF-21, FGF-23, HGF, 안지오포이에틴-2, BMP-9, IL-1RII, HGFR, IL-6ra, OPN, 테나신-C, 트롬보스폰딘-2, uPAR, CD44, 칼리크레인-6, 메소텔린, EpCAM, Apo A1, AGP, A2MB, 페투인 A, HP, L-셀렉틴, 보체 성분 C1q, 보체 성분 C3, 보체 성분 C3b, 인자 B, 인자 H, 프로페르딘, AGRP, MMP-12, CYFRA21-1, HE4, 총 PSA, MIF, AFP, CA125, CA19-9, CA15-3(MUC-1), 및 CEA로 이루어진 군으로부터 선택되는 적어도 6개의 단백질의 미리 결정된 패널의 존재 및 양을 측정하여 대상체의 단백질 프로파일을 결정하는 단계.
일부 실시양태에서, 미리 결정된 단백질 패널은 FLT3L, CEACAM5, IL-6RA, ORM, 또는 이들의 임의의 조합을 포함한다.
일부 실시양태에서, 미리 결정된 단백질 패널은 FLT3L, CEACAM5, IL-6RA, ORM, IL-8, AGP, IL-1RT2, TNC, GDF-15, 또는 이들의 임의의 조합을 포함한다.
일부 실시양태에서, 미리 결정된 단백질 패널은 FLT3L, CEACAM5, IL-6RA, ORM, IL-8, AGP, IL-1RT2, TNC, GDF-15, AGRP, 합토글로빈, ANGPTL4, FGF-23, 보체 성분 C2, ORM2, FGF-23, MUC-16, EGF, 또는 이들의 임의의 조합을 포함한다.
일부 실시양태에서, 패널은 FLT3L, CEACAM5, IL-6, IL-8, MIP-3a, IL-1RT2, TNC, 또는 이들의 조합을 포함한다.
일부 실시양태에서, 패널은 FLT3L, CEACAM5, IL-6, IL-8, MIP-3a, IL-1RT2, TNC, HGFR, THBS2, CA125(MUC-16), CA19-9, CA15-3(MUC-1), 또는 이들의 조합을 포함한다.
일부 실시양태에서, 패널은 총 PSA를 포함한다.
또 다른 측면에서, 본 개시내용은 하기 단계를 포함하는, 대상체에서 결장 세포 증식 장애를 검출하는 방법을 제공한다:
a) 대상체로부터 단백질을 함유하는 생물학적 샘플을 수득하는 단계;
b) 생물학적 샘플에서 EGF, FGF-2, FLT3L, 프락탈카인, IL-1a, IL-2, IL-6, IL-8, GROa, MIP-3a, 보체 성분 C2, 보체 성분 C9, 인자 D, 인자 I, MBL, MMP-2, GDF-15, 오스테오넥틴, 페리오스틴, ANGPTL4, FGF-21, FGF-23, HGF, 안지오포이에틴-2, BMP-9, IL-1RII, HGFR, IL-6ra, OPN, 테나신-C, 트롬보스폰딘-2, uPAR, CD44, 칼리크레인-6, 메소텔린, EpCAM, Apo A1, AGP, A2MB, 페투인 A, HP, L-셀렉틴, 보체 성분 C1q, 보체 성분 C3, 보체 성분 C3b, 인자 B, 인자 H, 프로페르딘, AGRP, MMP-12, CYFRA21-1, HE4, 총 PSA, MIF, AFP, CA125, CA19-9, CA15-3(MUC-1), 및 CEA로 이루어진 군으로부터 선택되는 적어도 6개의 단백질의 미리 결정된 패널의 존재 및 양을 측정하여 대상체의 단백질 프로파일을 제공하는 단계; 및
c) 결장 세포 증식 장애를 갖지 않는 대상체와 결장 세포 증식 장애를 갖는 대상체를 구별하도록 트레이닝된 기계 학습 모델로 대상체의 단백질 프로파일을 컴퓨터 처리하는 단계; 및
d) 결장 세포 증식 장애를 갖는 대상체와 관련된 값을 단백질 프로파일에 기초하여 기계 학습 모델에 의해 출력하여 대상체에서 결장 세포 증식 장애를 검출하는 단계.
또 다른 측면에서, 본 개시내용은 EGF, FGF-2, FLT3L, 프락탈카인, IL-1a, IL-2, IL-6, IL-8, GROa, MIP-3a, 보체 성분 C2, 보체 성분 C9, 인자 D, 인자 I, MBL, MMP-2, GDF-15, 오스테오넥틴, 페리오스틴, ANGPTL4, FGF-21, FGF-23, HGF, 안지오포이에틴-2, BMP-9, IL-1RII, HGFR, IL-6ra, OPN, 테나신-C, 트롬보스폰딘-2, uPAR, CD44, 칼리크레인-6, 메소텔린, EpCAM, Apo A1, AGP, A2MB, 페투인 A, HP, L-셀렉틴, 보체 성분 C1q, 보체 성분 C3, 보체 성분 C3b, 인자 B, 인자 H, 프로페르딘, AGRP, MMP-12, CYFRA21-1, HE4, 총 PSA, MIF, AFP, CA125, CA19-9, CA15-3(MUC-1), 및 CEA로 이루어진 군으로부터 선택되는 단백질의 미리 결정된 패널을 사용하여 대상체로부터의 생물학적 샘플의 단백질 프로파일을 결정하여 기준선 단백질 상태를 생성하는 단계; 및 기준선 단백질 상태를 생성한 후 하나 이상의 시점에서 대상체로부터의 생물학적 샘플의 단백질 프로파일을 결정하여 현재 단백질 상태를 생성하는 단계를 포함하는, 이전에 질환 치료를 받은 대상체에서 최소 잔류 질환을 모니터링하는 방법을 제공하며, 기준선 단백질 상태와 현재 단백질 상태 사이의 변화는 대상체에서 최소 잔류 질환의 변화를 나타낸다.
일부 실시양태에서, 최소 잔류 질환은 치료에 대한 반응, 종양 부하, 수술 후 잔류 종양, 재발, 2차 스크린, 1차 스크린, 및 암 진행으로 이루어진 군으로부터 선택된다.
본원에 기재된 트레이닝된 기계 학습 방법, 모델 및 분별 분류자는 암 검출, 진단 및 치료 반응성을 포함하는 다양한 의료 어플리케이션에 적용될 수 있다. 모델은 대상체 메타데이터 및 분석물 유래된 피처로 트레이닝될 수 있으므로, 어플리케이션은 집단에서 대상체를 계층화하고 그에 따라 치료 결정을 안내하도록 맞춤화될 수 있다.
진단
본원에 제공된 방법 및 시스템은 대상체(환자)로부터 획득된 데이터를 분석하여 암(예컨대, 결장직장암)을 갖는 대상체의 진단 출력을 생성하기 위해 인공 지능 기반 접근법을 이용하여 예측 분석을 수행할 수 있다. 예컨대, 어플리케이션은 암을 갖는 대상체의 진단을 생성하기 위해 획득된 데이터에 예측 알고리즘을 적용할 수 있다. 예측 알고리즘은 암을 갖는 대상체의 진단을 생성하기 위해 획득한 데이터를 처리하도록 구성된 기계 학습 기반 예측자와 같은 인공 지능 기반 예측자를 포함할 수 있다.
기계 학습 예측자는 데이터세트, 예컨대 입력으로서 암을 갖는 환자의 하나 이상의 코호트 세트로부터의 대상체의 생물학적 샘플에 본원에 기재된 시그니처 패널을 사용하여 단백질 검정을 수행함으로써 생성된 데이터 세트 및 기계 학습 예측자에 대한 출력으로서 대상체의 공지된 진단(예컨대, 병기결정 및/또는 종양 분율) 결과를 사용하여 트레이닝될 수 있다.
트레이닝 데이터세트(예컨대, 대상체의 생물학적 샘플에 대해 본원에 기재된 시그니처 패널을 사용하여 검정을 수행함으로써 생성된 데이터세트)는, 예컨대 공통 특징(피처) 및 결과(라벨)를 갖는 하나 이상의 대상체 세트로부터 생성될 수 있다. 트레이닝 데이터세트는 진단과 관련된 피처에 상응하는 피처 및 라벨 세트를 포함할 수 있다. 피처는, 예컨대 건강한 대상체 및 질환에 걸린 대상체로부터의 생물학적 샘플에서 하나 이상의 단백질의 존재 또는 특징과 같은 단백질 검정 측정의 특정 범위 또는 범주와 같은 특징을 포함할 수 있다. 예컨대, 주어진 시점에서 주어진 대상체로부터 수집된 피처 세트는 일괄하여 진단 시그니처로 작용할 수 있으며, 이는 주어진 시점에서 대상체의 확인된 암을 나타낼 수 있다. 특징은 또한 하나 이상의 암에 대한 것과 같은 대상체의 진단 결과를 나타내는 라벨을 포함할 수 있다.
라벨은, 예컨대 대상체의 공지된 진단(예컨대, 병기결정 및/또는 종양 분율) 결과와 같은 결과를 포함할 수 있다. 결과는 대상체의 암과 관련된 특징을 포함할 수 있다. 예컨대, 특징은 하나 이상의 암을 갖는 대상체를 나타낼 수 있다.
트레이닝 세트(예컨대, 트레이닝 데이터세트)는 하나 이상의 대상체 세트(예컨대, 하나 이상의 암을 갖거나 갖지 않는 환자의 후향적 및/또는 전향적 코호트)에 상응하는 데이터 세트의 랜덤 샘플링에 의해 선택될 수 있다. 대안적으로, 트레이닝 세트(예컨대, 트레이닝 데이터세트)는 하나 이상의 대상체 세트(예컨대, 하나 이상의 암을 갖거나 갖지 않는 환자의 후향적 및/또는 전향적 코호트)에 상응하는 데이터 세트의 균형 잡힌 샘플링에 의해 선택될 수 있다. 트레이닝 세트는 하나 이상의 대상체 세트(예컨대, 상이한 임상 현장 또는 시험으로부터의 환자)에 상응하는 데이터 세트 간에 균형을 이룰 수 있다. 기계 학습 예측자는 진단 정확도 척도에 상응하는 최소 요구 값을 갖는 것과 같이 정확도 또는 성능에 대한 특정한 미리 결정된 조건이 충족될 때까지 트레이닝될 수 있다. 예컨대, 진단 정확도 척도는 대상체에서 하나 이상의 암의 진단, 병기결정 또는 종양 분율의 예측에 상응할 수 있다.
진단 정확도 척도의 예는 민감도, 특이도, 양성 예측 값(PPV), 음성 예측 값(NPV), 정확도, 및 암(예컨대, 결장직장암)을 검출하거나 예측하는 진단 정확도에 상응하는 수신기 작동 특징(ROC) 곡선의 곡선 아래 면적(AUC)을 포함할 수 있다.
일 측면에서, 본 개시내용은 하기 단계를 포함하는, 대상체 집단을 구별할 수 있는 분류자를 사용하는 방법을 제공한다:
a) 대상체로부터 단백질을 함유하는 생물학적 샘플을 수득하는 단계;
b) 생물학적 샘플에서 EGF, FGF-2, FLT3L, 프락탈카인, IL-1a, IL-2, IL-6, IL-8, GROa, MIP-3a, 보체 성분 C2, 보체 성분 C9, 인자 D, 인자 I, MBL, MMP-2, GDF-15, 오스테오넥틴, 페리오스틴, ANGPTL4, FGF-21, FGF-23, HGF, 안지오포이에틴-2, BMP-9, IL-1RII, HGFR, IL-6ra, OPN, 테나신-C, 트롬보스폰딘-2, uPAR, CD44, 칼리크레인-6, 메소텔린, EpCAM, Apo A1, AGP, A2MB, 페투인 A, HP, L-셀렉틴, 보체 성분 C1q, 보체 성분 C3, 보체 성분 C3b, 인자 B, 인자 H, 프로페르딘, AGRP, MMP-12, CYFRA21-1, HE4, 총 PSA, MIF, AFP, CA125, CA19-9, CA15-3(MUC-1), 및 CEA로 이루어진 군으로부터 선택되는 적어도 6개의 단백질의 미리 결정된 패널의 존재 및 양을 측정하여 대상체의 단백질 프로파일을 제공하는 단계;
c) 대상체의 단백질 프로파일을 두 개 이상의 집단에서 구별하도록 트레이닝된 기계 학습 모델로 컴퓨터 처리하는 단계; 및
d) 집단과 관련된 값을 단백질 프로파일에 기초하여 기계 학습 모델에 의해 출력함으로써 대상체의 집단을 구별하는 단계.
일부 실시양태에서, 미리 결정된 단백질 패널은 FLT3L, CEACAM5, IL-6RA, ORM, 또는 이들의 임의의 조합을 포함한다.
일부 실시양태에서, 미리 결정된 단백질 패널은 FLT3L, CEACAM5, IL-6RA, ORM, IL-8, AGP, IL-1RT2, TNC, GDF-15, 또는 이들의 임의의 조합을 포함한다.
일부 실시양태에서, 미리 결정된 단백질 패널은 FLT3L, CEACAM5, IL-6RA, ORM, IL-8, AGP, IL-1RT2, TNC, GDF-15, AGRP, 합토글로빈, ANGPTL4, FGF-23, 보체 C2, ORM2, FGF-23, MUC-16, EGF, 또는 이들의 임의의 조합을 포함한다.
일부 실시양태에서, 패널은 FLT3L, CEACAM5, IL-6, IL-8, MIP-3a, IL-1RT2, TNC 또는 이들의 조합을 포함한다.
일부 실시양태에서, 패널은 FLT3L, CEACAM5, IL-6, IL-8, MIP-3a, IL-1RT2, TNC, HGFR, THBS2, CA125(MUC-16), CA19-9, CA15-3(MUC-1), 또는 이들의 조합을 포함한다.
일부 실시양태에서, 패널은 총 PSA를 포함한다.
또 다른 측면에서, 본 개시내용은 하기 단계를 포함하는, 대상체에서 암을 확인하는 방법을 제공한다:
a) 대상체로부터 단백질을 함유하는 생물학적 샘플을 수득하는 단계;
b) 생물학적 샘플에서 EGF, FGF-2, FLT3L, 프락탈카인, IL-1a, IL-2, IL-6, IL-8, GROa, MIP-3a, 보체 성분 C2, 보체 성분 C9, 인자 D, 인자 I, MBL, MMP-2, GDF-15, 오스테오넥틴, 페리오스틴, ANGPTL4, FGF-21, FGF-23, HGF, 안지오포이에틴-2, BMP-9, IL-1RII, HGFR, IL-6ra, OPN, 테나신-C, 트롬보스폰딘-2, uPAR, CD44, 칼리크레인-6, 메소텔린, EpCAM, Apo A1, AGP, A2MB, 페투인 A, HP, L-셀렉틴, 보체 성분 C1q, 보체 성분 C3, 보체 성분 C3b, 인자 B, 인자 H, 프로페르딘, AGRP, MMP-12, CYFRA21-1, HE4, 총 PSA, MIF, AFP, CA125, CA19-9, CA15-3(MUC-1), 및 CEA로 이루어진 군으로부터 선택되는 적어도 6개의 단백질의 미리 결정된 패널의 존재 및 양을 측정하여 대상체의 단백질 프로파일을 제공하는 단계;
c) 단백질 프로파일을 건강한 대상체와 결장 세포 증식 장애를 갖는 대상체를 구별할 수 있도록 트레이닝된 기계 학습 모델로 컴퓨터 처리하여 결장 세포 증식 장애의 존재 또는 부재와 관련된 출력값을 제공함으로써 대상체에서 결장 세포 증식 장애의 존재 또는 부재를 나타내어 상기 암을 갖는 상기 대상체의 가능성을 생성하는 단계.
일부 실시양태에서, 미리 결정된 단백질 패널은 FLT3L, CEACAM5, IL-6RA, ORM, 또는 이들의 임의의 조합을 포함한다.
일부 실시양태에서, 미리 결정된 단백질 패널은 FLT3L, CEACAM5, IL-6RA, ORM, IL-8, AGP, IL-1RT2, TNC, GDF-15, 또는 이들의 임의의 조합을 포함한다.
일부 실시양태에서, 미리 결정된 단백질 패널은 FLT3L, CEACAM5, IL-6RA, ORM, IL-8, AGP, IL-1RT2, TNC, GDF-15, AGRP, 합토글로빈, ANGPTL4, FGF-23, 보체 성분 C2, ORM2, FGF-23, MUC-16, EGF, 또는 이들의 임의의 조합을 포함한다.
일부 실시양태에서, 패널은 FLT3L, CEACAM5, IL-6, IL-8, MIP-3a, IL-1RT2, TNC 또는 이들의 조합을 포함한다.
일부 실시양태에서, 패널은 FLT3L, CEACAM5, IL-6, IL-8, MIP-3a, IL-1RT2, TNC, HGFR, THBS2, CA125(MUC-16), CA19-9, CA15-3(MUC-1), 또는 이들의 조합을 포함한다.
일부 실시양태에서, 패널은 총 PSA를 포함한다.
발현의 역치 또는 컷오프 수준을 설정하기 위한 다양한 통계적 및 수학적 방법이 이용될 수 있다. 특정 바이오마커에 대한 역치 또는 컷오프 발현 수준은, 예컨대 본원에 개시된 실시예 및 도면에 기재된 바와 같이 수신기 작동 특징(ROC) 플롯으로부터의 데이터에 기초하여 선택될 수 있다. 당업자는 이러한 역치 또는 컷오프 발현 수준이, 예컨대 특정 바이오마커 또는 이의 조합에 대한 ROC 플롯을 따라 이동함으로써 변화되어 민감도 또는 특이도에 대해 상이한 값을 수득함으로써 전체 검정 성능에 영향을 미칠 수 있음을 이해할 것이다. 예컨대, 목적이 임상적 관점에서 강력한 진단 방법을 갖는 것이라면 높은 민감도가 우선되어야 한다. 그러나, 목표가 비용 효율적인 방법을 갖는 것이라면 높은 특이도가 우선되어야 한다. 최상의 컷오프는 최상의 민감도 및 특이도를 생성하는 특정 바이오마커에 대한 ROC 플롯으로부터 수득된 값을 지칭한다. 민감도 및 특이도 값은 역치(컷오프) 범위에 대해 계산된다. 따라서, 역치 또는 컷오프 값은 민감도 및/또는 특이도가 적어도 약 50%이도록 선택될 수 있고, 예컨대 검정된 환자 집단의 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 적어도 100%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 또는 적어도 80%일 수 있다.
결과적으로, 본 개시내용의 일부 실시양태는 진단 또는 스크리닝될 대상체로부터 단리된 최소 침습성 샘플에서 이전에 언급된 적어도 단백질의 존재 및/또는 수준을 결정하고, 미리 결정된 역치 또는 컷오프 값을 갖는 단백질의 존재 및/또는 수준을 비교함으로써 수행되며, 미리 결정된 역치 또는 컷오프 값은 결장직장암 또는 결장직장 선종을 앓을 위험이 있는 환자 집단에서 결정된 단백질의 발현 수준에 기초하여 계산된 ROC 곡선에서 원하는 민감도로 가장 높은 특이도와 상관관계가 있는 상기 단백질의 발현 수준에 상응하며, 상기 미리 결정된 컷오프 값에 대한 상기 단백질 중 적어도 하나의 과발현은 대상체가 상기 원하는 민감도로 결장직장암 또는 결장직장 선종을 앓는다는 것을 나타낸다.
또 다른 예로서, 이러한 미리 결정된 조건은 결장 세포 증식 장애를 예측하는 특이도가, 예컨대 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99%의 값을 포함하는 것일 수 있다.
또 다른 예로서, 이러한 미리 결정된 조건은 결장 세포 증식 장애를 예측하는 양성 예측 값(PPV)이, 예컨대 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99%의 값을 포함하는 것일 수 있다.
또 다른 예로서, 이러한 미리 결정된 조건은 결장 세포 증식 장애를 예측하는 음성 예측 값(NPV)이, 예컨대 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99%의 값을 포함하는 것일 수 있다.
또 다른 예로서, 이러한 미리 결정된 조건은 결장 세포 증식 장애를 예측하는 수신기 작동 특징(ROC) 곡선의 곡선 아래 면적(AUC)이 적어도 약 0.50, 적어도 약 0.55, 적어도 약 0.60, 적어도 약 0.65, 적어도 약 0.70, 적어도 약 0.75, 적어도 약 0.80, 적어도 약 0.85, 적어도 약 0.90, 적어도 약 0.95, 적어도 약 0.96, 적어도 약 0.97, 적어도 약 0.98, 또는 적어도 약 0.99의 값을 포함하는 것일 수 있다.
결장직장암 모니터링
트레이닝된 알고리즘을 사용하여 데이터세트를 처리한 후, 대상체에서 결장직장암을 확인하거나 모니터링할 수 있다. 확인은 결장직장암 관련된 단백질의 패널에서 데이터세트의 단백질의 정량적 측정치에 적어도 부분적으로 기초할 수 있다. 예컨대, 모니터링은 2개 이상의 상이한 시점 각각에서 대상체의 결장직장암을 평가하는 것을 포함할 수 있다.
일부 실시양태에서, 본원에 개시된 방법은 종양 부하를 모니터링 및/또는 예측하기 위해 적용될 수 있다.
일부 실시양태에서, 본원에 개시된 방법은 수술 후 잔류 종양을 검출 및/또는 예측하기 위해 적용될 수 있다.
일부 실시양태에서, 본원에 개시된 방법은 치료 후 최소 잔류 질환을 검출 및/또는 예측하기 위해 적용될 수 있다.
일부 실시양태에서, 본원에 개시된 방법은 재발을 검출 및/또는 예측하기 위해 적용될 수 있다.
일 측면에서, 본원에 개시된 방법은 2차 스크린으로서 적용될 수 있다.
일 측면에서, 본원에 개시된 방법은 1차 스크린으로서 적용될 수 있다.
일 측면에서, 본원에 개시된 방법은 암 발달을 모니터링하기 위해 적용될 수 있다.
일 측면에서, 본원에 개시된 방법은 암 위험을 모니터링 및/또는 예측하기 위해 적용될 수 있다.
결장직장암은 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 81%, 적어도 약 82%, 적어도 약 83%, 적어도 약 84%, 적어도 약 85%, 적어도 약 86%, 적어도 약 87%, 적어도 약 88%, 적어도 약 89%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99%, 또는 그 초과의 정확도로 대상체에서 확인될 수 있다. 트레이닝된 알고리즘에 의해 결장직장암을 확인하는 정확도는 결장직장암을 갖거나 갖지 않는 것으로 정확히 확인되거나 분류된 독립적인 시험 샘플(예컨대, 결장직장암을 갖는 것으로 공지된 대상체 또는 결장직장암에 대해 음성 임상 시험 결과를 갖는 대상체)의 백분율로 계산될 수 있다.
결장직장암은 적어도 약 5%, 적어도 약 10%, 적어도 약 15%, 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 81%, 적어도 약 82%, 적어도 약 83%, 적어도 약 84%, 적어도 약 85%, 적어도 약 86%, 적어도 약 87%, 적어도 약 88%, 적어도 약 89%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99%, 또는 그 초과의 양성 예측 값(PPV)으로 대상체에서 확인될 수 있다. 트레이닝된 알고리즘을 사용하여 결장직장암을 확인하는 PPV는 실제로 결장직장암을 갖는 대상체에 상응하는 결장직장암을 갖는 것으로 확인되거나 분류된 무세포 생물학적 샘플의 백분율로 계산될 수 있다.
결장직장암은 적어도 약 5%, 적어도 약 10%, 적어도 약 15%, 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 81%, 적어도 약 82%, 적어도 약 83%, 적어도 약 84%, 적어도 약 85%, 적어도 약 86%, 적어도 약 87%, 적어도 약 88%, 적어도 약 89%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99%, 또는 그 초과의 음성 예측 값(NPV)으로 대상체에서 확인될 수 있다. 트레이닝된 알고리즘을 사용하여 결장직장암을 확인하는 NPV는 실제로 결장직장암을 갖지 않는 대상체에 상응하는 결장직장암을 갖지 않는 것으로 확인되거나 분류된 무세포 생물학적 샘플의 백분율로 계산될 수 있다.
결장직장암은 적어도 약 5%, 적어도 약 10%, 적어도 약 15%, 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 81%, 적어도 약 82%, 적어도 약 83%, 적어도 약 84%, 적어도 약 85%, 적어도 약 86%, 적어도 약 87%, 적어도 약 88%, 적어도 약 89%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99%, 적어도 약 99.1%, 적어도 약 99.2%, 적어도 약 99.3%, 적어도 약 99.4%, 적어도 약 99.5%, 적어도 약 99.6%, 적어도 약 99.7%, 적어도 약 99.8%, 적어도 약 99.9%, 적어도 약 99.99%, 적어도 약 99.999%, 또는 그 초과의 임상적 민감도로 대상체에서 확인될 수 있다. 트레이닝된 알고리즘을 사용하여 결장직장암을 확인하는 임상적 민감도는 결장직장암을 갖는 것으로 정확히 확인되거나 분류된 결장직장암의 존재와 관련된 독립적인 시험 샘플(예컨대, 결장직장암을 갖는 것으로 공지된 대상체)의 백분율로 계산될 수 있다.
결장직장암은 적어도 약 5%, 적어도 약 10%, 적어도 약 15%, 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 81%, 적어도 약 82%, 적어도 약 83%, 적어도 약 84%, 적어도 약 85%, 적어도 약 86%, 적어도 약 87%, 적어도 약 88%, 적어도 약 89%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99%, 적어도 약 99.1%, 적어도 약 99.2%, 적어도 약 99.3%, 적어도 약 99.4%, 적어도 약 99.5%, 적어도 약 99.6%, 적어도 약 99.7%, 적어도 약 99.8%, 적어도 약 99.9%, 적어도 약 99.99%, 적어도 약 99.999%, 또는 그 초과의 임상적 특이도로 환자에서 확인될 수 있다. 트레이닝된 알고리즘을 사용하여 결장직장암을 확인하는 임상적 특이도는 결장직장암을 갖지 않는 것으로 정확히 확인되거나 분류된 결장직장암의 부재와 관련된 독립적인 시험 샘플(예컨대, 결장직장암에 대한 임상 시험 결과가 음성인 대상체)의 백분율로 계산될 수 있다.
일부 실시양태에서, 트레이닝된 알고리즘은 대상체가 적어도 약 5%, 적어도 약 10%, 적어도 약 15%, 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 81%, 적어도 약 82%, 적어도 약 83%, 적어도 약 84%, 적어도 약 85%, 적어도 약 86%, 적어도 약 87%, 적어도 약 88%, 적어도 약 89%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99%, 또는 그 초과의 결장직장암 위험에 처해 있다고 결정할 수 있다.
트레이닝된 알고리즘은 대상체가 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 81%, 적어도 약 82%, 적어도 약 83%, 적어도 약 84%, 적어도 약 85%, 적어도 약 86%, 적어도 약 87%, 적어도 약 88%, 적어도 약 89%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99%, 적어도 약 99.1%, 적어도 약 99.2%, 적어도 약 99.3%, 적어도 약 99.4%, 적어도 약 99.5%, 적어도 약 99.6%, 적어도 약 99.7%, 적어도 약 99.8%, 적어도 약 99.9%, 적어도 약 99.99%, 적어도 약 99.999%, 또는 그 초과의 정확도로 결장직장암 위험에 처해 있다고 결정할 수 있다.
대상체가 결장직장암을 갖는 것으로 확인되면, 대상체는 임의적으로 치료적 개입(예컨대, 대상체의 결장직장암을 치료하기 위한 적절한 치료 과정을 처방)을 제공받을 수 있다. 치료적 개입은 유효 용량의 약물 처방, 결장직장암에 대한 추가 시험 또는 평가, 결장암에 대한 추가 모니터링 또는 이들의 조합을 포함할 수 있다. 대상체가 현재 치료 과정으로 결장직장암 치료를 받고 있는 경우, 치료적 개입은 (예컨대, 현재 치료 과정의 비-효능으로 인해 치료 효능을 증가시키기 위해) 후속하는 상이한 치료 과정을 포함할 수 있다.
치료적 개입은 대상체에게 결장직장암의 진단을 확인하기 위한 2차 임상 시험을 권장하는 것을 포함할 수 있다. 이 2차 임상 시험은 이미징 시험, 혈액 시험, 컴퓨터 단층 촬영(CT) 스캔, 자기 공명 이미징(MRI) 스캔, 초음파 스캔, 흉부 X-선, 양전자 방출 단층 촬영(PET) 스캔, PET-CT 스캔, 무세포 생물학적 세포학, FIT 시험, FOBT 시험 또는 이들의 임의의 조합을 포함할 수 있다.
대상체의 결장직장암은 대상체의 결장직장암을 치료하기 위한 치료 과정을 모니터링함으로써 모니터링될 수 있다. 모니터링은 2개 이상의 시점에서 대상체의 결장직장암을 평가하는 것을 포함할 수 있다. 평가는 2개 이상의 시점 각각에서 결정된 결장직장암 관련된 단백질 패널의 정량적 측정치를 포함하는 결장직장암 관련된 단백질 패널에서 데이터세트의 단백질의 정량적 측정치에 적어도 기초할 수 있다.
일부 실시양태에서, 2개 이상의 시점 사이에 결정된 결장직장암 관련된 단백질의 패널의 정량적 측정치를 포함하는 결장직장암 관련된 단백질의 패널에서 데이터세트의 단백질의 정량적 측정치의 차이는 하나 이상의 임상적 징조, 예컨대 (i) 대상체의 결장직장암의 진단, (ii) 대상체의 결장직장암의 예후, (iii) 대상체의 결장직장암의 증가된 위험, (iv) 대상체의 결장직장암의 감소된 위험, (v) 대상체의 결장직장암을 치료하기 위한 치료 과정의 효능, 및 (vi) 대상체의 결장직장암을 치료하기 위한 치료 과정의 비-효능을 나타낼 수 있다.
일부 실시양태에서, 2개 이상의 시점 사이에서 결정된 결장직장암 관련된 단백질의 패널의 정량적 측정치를 포함하는 단백질의 정량적 측정치의 차이는 대상체의 결장직장암 진단을 나타낼 수 있다. 예컨대, 결장직장암이 이전 시점에서는 대상체에서 검출되지 않았지만 나중에 대상체에서 검출되었다면, 그 차이는 대상체의 결장직장암 진단을 나타낸다. 임상적 조치 또는 결정은, 예컨대 대상체에 대한 새로운 치료적 개입을 처방하는 것과 같이, 대상체의 결장직장암의 진단의 이러한 징조에 기초하여 이루어질 수 있다. 임상적 조치 또는 결정은 대상체에게 결장직장암의 진단을 확인하기 위한 2차 임상 시험을 권장하는 것을 포함할 수 있다. 이 2차 임상 시험은 이미징 시험, 혈액 시험, 컴퓨터 단층 촬영(CT) 스캔, 자기 공명 이미징(MRI) 스캔, 초음파 스캔, 흉부 X-선, 양전자 방출 단층 촬영(PET) 스캔, PET-CT 스캔, 무세포 생물학적 세포학, FIT 시험, FOBT 시험, 또는 이들의 임의의 조합을 포함할 수 있다.
일부 실시양태에서, 2개 이상의 시점 사이에 결정된 결장직장암 관련된 단백질의 패널의 정량적 측정치를 포함하는 결장직장암 관련된 단백질의 패널에서 데이터세트의 단백질의 정량적 측정치의 차이는 대상체의 결장직장암의 예후를 나타낼 수 있다.
일부 실시양태에서, 2개 이상의 시점 사이에 결정된 결장직장암 관련된 단백질의 패널의 정량적 측정치를 포함하는 결장직장암 관련된 단백질의 패널에서 데이터세트의 단백질의 정량적 측정치의 차이는 결장직장암의 위험이 증가된 대상체를 나타낼 수 있다. 예컨대, 이전 시점 및 나중 시점 모두에서 대상체에서 결장직장암이 검출되었고 그 차이가 양의 차이인 경우(예컨대, 결장직장암 관련된 단백질의 패널에서 데이터세트의 단백질의 정량적 측정치가 이전 시점으로부터 나중 시점으로 증가함), 차이는 결장직장암의 위험이 증가된 대상체를 나타낼 수 있다. 결장직장암의 증가된 위험의 이러한 징조에 기초하여, 예컨대 대상체에 대한 새로운 치료적 개입을 처방하거나 치료적 개입을 전환하는(예컨대, 현재 치료를 종료하고 새로운 치료를 처방하는) 임상적 조치 또는 결정이 이루어질 수 있다. 임상적 조치 또는 결정은 대상체에게 결장직장암의 증가된 위험을 확인하기 위한 2차 임상 시험을 권장하는 것을 포함할 수 있다. 이 2차 임상 시험은 이미징 시험, 혈액 시험, 컴퓨터 단층 촬영(CT) 스캔, 자기 공명 이미징(MRI) 스캔, 초음파 스캔, 흉부 X-선, 양전자 방출 단층 촬영(PET) 스캔, PET-CT 스캔, 무세포 생물학적 세포학, FIT 시험, FOBT 시험, 또는 이들의 임의의 조합을 포함할 수 있다.
일부 실시양태에서, 2개 이상의 시점 사이에 결정된 결장직장암 관련된 단백질의 패널의 정량적 측정치를 포함하는 결장직장암 관련된 단백질의 패널에서 데이터세트의 단백질의 정량적 측정치의 차이는 결장직장암의 위험이 감소된 대상체를 나타낼 수 있다. 예컨대, 이전 시점 및 나중 시점 모두에서 대상체에서 결장직장암이 검출되었고 그 차이가 음의 차이인 경우(예컨대, 결장직장암 관련된 단백질의 패널의 정량적 측정치를 포함하는 결장직장암 관련된 단백질의 패널에서 데이터세트의 단백질의 정량적 측정치가 이전 시점으로부터 나중 시점으로 감소함), 차이는 결장직장암의 위험이 감소된 대상체를 나타낼 수 있다. 대상체에 대한 결장직장암의 감소된 위험의 징조에 기초하여 임상적 조치 또는 결정(예컨대, 현재의 치료적 개입의 지속 또는 종료)이 이루어질 수 있다. 임상적 조치 또는 결정은 대상체에게 결장직장암의 감소된 위험을 확인하기 위한 2차 임상 시험을 권장하는 것을 포함할 수 있다. 이 2차 임상 시험은 이미징 시험, 혈액 시험, 컴퓨터 단층 촬영(CT) 스캔, 자기 공명 이미징(MRI) 스캔, 초음파 스캔, 흉부 X-선, 양전자 방출 단층 촬영(PET) 스캔, PET-CT 스캔, 무세포 생물학적 세포학, FIT 시험, FOBT 시험, 또는 이들의 임의의 조합을 포함할 수 있다.
일부 실시양태에서, 2개 이상의 시점 사이에 결정된 결장직장암 관련된 단백질의 패널의 정량적 측정치를 포함하는 결장직장암 관련된 단백질의 패널에서 데이터세트의 단백질의 정량적 측정치의 차이는 대상체의 결장직장암을 치료하기 위한 치료 과정의 효능을 나타낼 수 있다. 예컨대, 결장직장암이 이전 시점에서는 대상체에서 검출되었지만 나중 시점에 대상체에서 검출되지 않은 경우, 차이는 대상체의 결장직장암을 치료하기 위한 치료 과정의 효능을 나타낼 수 있다. 대상체의 결장직장암을 치료하기 위한 치료 과정의 효능의 이러한 징조에 기초하여 임상적 조치 또는 결정, 예컨대 대상체에 대한 현재의 치료적 개입을 지속하거나 종료하는 것이 이루어질 수 있다. 임상적 조치 또는 결정은 대상체에게 결장직장암을 치료하기 위한 치료 과정의 효능을 확인하기 위한 2차 임상 시험을 권장하는 것을 포함할 수 있다. 이 2차 임상 시험은 이미징 시험, 혈액 시험, 컴퓨터 단층 촬영(CT) 스캔, 자기 공명 이미징(MRI) 스캔, 초음파 스캔, 흉부 X-선, 양전자 방출 단층 촬영(PET) 스캔, PET-CT 스캔, 무세포 생물학적 세포학, FIT 시험, FOBT 시험, 또는 이들의 임의의 조합을 포함할 수 있다.
일부 실시양태에서, 2개 이상의 시점 사이에 결정된 결장직장암 관련된 단백질의 패널의 정량적 측정치를 포함하는 결장직장암 관련된 단백질의 패널에서 데이터세트의 단백질의 정량적 측정치의 차이는 대상체의 결장직장암을 치료하기 위한 치료 과정의 비-효능을 나타낼 수 있다. 예컨대, 이전 시점 및 나중 시점 모두에서 대상체에서 결장직장암이 검출되었고 차이가 양의 차이이거나 0이고(예컨대, 결장직장암 관련된 단백질의 패널의 정량적 측정치를 포함하는 직장결장암 관련된 단백질의 패널에서 데이터세트의 단백질의 정량적 측정치가 이전 시점으로부터 나중 시점으로 증가되거나 일정한 수준으로 유지됨), 효과적인 치료가 이전 시점에서 나타나는 경우, 차이는 대상체의 결장직장암을 치료하기 위한 치료 과정의 비-효능을 나타낼 수 있다. 대상체의 결장직장암을 치료하기 위한 치료 과정의 비-효능의 이러한 징조에 기초하여 임상적 조치 또는 결정, 예컨대 현재의 치료적 개입의 종료 및/또는 대상체에 대한 상이한 새로운 치료적 개입으로의 전환(예컨대 처방)이 이루어질 수 있다. 임상적 조치 또는 결정은 대상체에게 결장직장암을 치료하기 위한 치료 과정의 비-효능을 확인하기 위한 2차 임상 시험을 권장하는 것을 포함할 수 있다. 이 2차 임상 시험은 이미징 시험, 혈액 시험, 컴퓨터 단층 촬영(CT) 스캔, 자기 공명 이미징(MRI) 스캔, 초음파 스캔, 흉부 X-선, 양전자 방출 단층 촬영(PET) 스캔, PET-CT 스캔, 무세포 생물학적 세포학, FIT 시험, FOBT 시험, 또는 이들의 임의의 조합을 포함할 수 있다.
키트
본 개시내용은 대상체의 암을 확인하거나 모니터링하기 위한 키트를 제공한다. 키트는 대상체의 무세포 생물학적 샘플 내의 복수의 암 관련된 단백질 각각에서 단백질의 (예컨대, 존재, 부재 또는 상대적 양을 나타내는) 정량적 측정치를 확인하기 위한 항체, 프로브 또는 프라이머를 포함할 수 있다. 무세포 생물학적 샘플 내 단백질의 패널의 (예컨대, 존재, 부재 또는 상대적 양을 나타내는) 정량적 측정치는 하나 이상의 암을 나타낼 수 있다. 프로브는 무세포 생물학적 샘플 내의 단백질에 대해 선택적일 수 있다. 키트는 대상체의 무세포 생물학적 샘플에서 단백질의 (예컨대, 존재, 부재 또는 상대적 양을 나타내는) 정량적 측정치를 나타내는 데이터세트를 생성하기 위해 프로브를 사용하여 무세포 생물학적 샘플을 처리하기 위한 설명서를 포함할 수 있다.
키트 내의 프로브는 무세포 생물학적 샘플 내의 복수의 암 관련된 단백질에서 단백질 또는 단백질을 코딩하는 서열에 대해 선택적일 수 있다. 키트 내의 프로브는 복수의 암 관련된 단백질에 상응하는 단백질 분자를 선택적으로 농축시키도록 구성될 수 있다. 키트 내의 프로브는 단백질에 의해 인식되고 생물학적 샘플 내의 단백질에 결합한 후 단리를 허용하도록 태그부착된 항체일 수 있다.
키트 내의 설명서는 무세포 생물학적 샘플 내의 암 관련된 단백질에 대해 선택적인 프로브를 사용하여 무세포 생물학적 샘플을 검정하기 위한 설명서를 포함할 수 있다. 무세포 생물학적 샘플 내의 복수의 암 관련된 단백질 각각에서 단백질 또는 단백질을 코딩하는 서열의 (예컨대, 존재, 부재 또는 상대적인 양을 나타내는) 정량적 측정치는 하나 이상의 암을 나타낼 수 있다.
키트 내의 설명서는 무세포 생물학적 샘플 내의 복수의 암 관련된 단백질 각각에서 단백질 또는 단백질을 코딩하는 유전자의 (예컨대, 존재, 부재, 또는 상대적 양을 나타내는) 정령적 측정치를 나타내는 데이터세트를 생성하기 위해 복수의 암 관련된 단백질 중 하나 이상에서 정량화될 수 있는 검정 판독값을 측정 및 해석하기 위한 설명서를 포함할 수 있다.
실시예
실시예 1: 환자 혈장 샘플에서 단백질 분석
암에서 단백질은 암 신생항원이건 표준 단백질이건 결장직장암에 대한 잠재적인 조기 진단 바이오마커의 공급원을 나타낸다. 단백질 피처는 암 환자에서 단백질 과발현, 고갈 또는 돌연변이를 평가하여 혈장으로부터 결정될 수 있다. 일부 단백질은 유방암, 전립선암, 결장직장암, 폐암 및 난소암과 관련이 있는 것으로 확인되었다.
본원에 기재된 방법 및 분류자에 대한 정보를 제공하는 단백질을 확인하기 위해, 결장 세포 증식 장애를 갖는 환자로부터의 혈장 및 결장 세포 증식 장애를 갖지 않는 대상체의 혈장(대조군 혈장 또는 참조 혈장)을 검사하여 결장 세포 증식 장애 및 각각의 반응성 단백질에 대한 반응으로 결장 세포 증식 장애를 갖는 환자에 의해 생성된 단백질의 시그너처 패널을 확인하였다. 이를 위해 결장 세포 증식 장애를 갖는 환자로부터의 혈장 및 대조군 혈장을 질량 분광측정 기반 프로테오믹스 및 면역친화성 검정 둘 다를 이용하여 프로파일링하여 순환 혈장 단백질을 확인하고 정량화하였다. 혈장은 특징규명 전에 매우 풍부한 단백질(예컨대, 알부민, 면역글로불린)이 고갈되었거나 고갈되지 않았을 수 있다.
이 분석에 의해 확인된 단백질 패널은 결장 세포 증식 장애를 갖는 대상체로부터의 혈장과 건강한 대상체로부터의 혈청 사이의 구별을 가능하게 하였다.
방법
샘플 범주화
혈장 샘플 내의 단백질을 검출하기 위해, 결장직장암(CRC), 진행성 선종(AA), 양성 폴립(NAA), 또는 이들 중 어느 것도 갖지 않는 것(NEG)으로 차후에 확인된 대상체로부터 취한 혈장으로 면역검정 및 질량 분광측정 검정을 실행하였다.
표준화된 혈액 수집 및 처리 프로토콜을 이용하여 혈장을 수득한 후, 사용할 때까지 -80℃에서 저장하였다. 기관 심사 위원회의 승인 하에 모든 대상체로부터 서면 동의를 얻었다.
연구 코호트에 대한 설명은 분류 모델(성별 및 연령별)에서 CRC 실험에 사용된 건강한 샘플 및 암 샘플의 수를 나타내는 표 1에 제공된다.
이 연구의 1차 목표는 결장직장암을 진행성 선종, 양성 질환 및 건강한 대조군과 구별하여 현재 바이오마커의 민감도를 개선하고 임상 결정을 안내하는 혈청 단백질 바이오마커를 확인하는 것이었다.
NEG, CRC, AA 및 NAA 대상체 집단을 나타내는 대상체 샘플로부터 혈장을 단리하고 단백질 어레이에서 스크리닝하였다. 총 1,472개의 피처가 NEG, CRC, AA 및 NAA 대상체 집단 사이에서 확인되었고, 결장 세포 증식 장애를 갖는 대상체로부터의 혈장 및 건강한 대상체 혈장에서 차등적 발현에 대해 조사되었다.
모든 단백질 정량화 데이터는 정규화되었고, 상대적 또는 절대적 규모로 보고되었다.
피처 값 필터링:
특정 병태가 있는 환자와 없는 환자를 분별하는 각각의 단백질의 능력은 분별을 위한 3개의 그룹에 대한 메트릭스를 계산하여 평가되었다. 분별 그룹은 질환 음성 대 결장직장암(NEG 대 CRC), 질환 음성 대 진행성 선종(NEG 대 AA), 질환 음성 대 진행성 선종 및 비-진행성 선종(NEG 대 AA + NAA)이었다. 이 비교를 위해 계산된 메트릭스는 헤지(Hedges)의 G 효과 크기 메트릭, 워서스테인(Wasserstein) 거리 메트릭, 엘라스틱 네트 정규화를 갖는 단일 검정 선형 로지스틱 회귀에서의 피처 가중치, 단일 검정 비선형 랜덤 포레스트에서의 피처 중요도 및 다중 검정 로지스틱 회귀 모델에서의 피처 가중치를 포함한다.
각각의 단백질에 대해, 모든 단백질에 걸쳐 메트릭별 분포에서 단백질의 백분위수를 계산하였다. 단백질은 메트릭별 분포에서 백분위수로 순위를 매겼다. 단백질이 하기 기준 중 적어도 하나를 충족하는 경우, 추가 고려를 위해 단백질을 보유하였다:
A) 단백질 단독 분석으로부터 95 이상의 최대 메트릭 백분위수 및 90 이상의 중앙값 메트릭 백분위수를 가짐;
B) 최대 메트릭 백분위수 또는 중앙값 메트릭 백분위수에 대해 상위 25위 안에 듬; 및
C) 다중 검정 로지스틱 회귀 모델에서 피처 가중치로 상위 25위 안에 듬.
광범위한 문헌 검색에 기반한 고려를 위해 일부 문헌에서 유래된 피처도 포함되었다. 문헌에서 유래된 피처를 포함하여 상기 기준을 만족하는 피처를 시약 가용성에 대해 추가로 탐색하고 그 중에서 피처를 선택하였다.
도 2는 단백질 마커 데이터세트에서 사용 가능한 모든 표적에 대한 단일 분석물 단백질 데이터에서 계산된 단백질당 백분위수의 시각화를 제공한다.
도 3은 단일 검정 단백질 분석(왼쪽 패널) 및 다중 검정 분석(오른쪽 패널)으로부터의 메트릭스의 시각화를 제공한다. 2.1 목록은 최대 및 중앙값 백분위수 메트릭 분포를 역치로 설정할 때 발견되는 단백질의 교차점으로 이루어지며 해당 목록을 사용 빈도 및 가산성에 의해 정의된 성능 역치를 통과하는 목록과 교차하였다. 2.2 목록은 최대 및 중앙값 백분위수 메트릭에 대한 순위별로 상위 25개 단백질을 취할 때 발견되는 단백질의 교차점으로 이루어진다.
결과
NEG, NAA, AA, CRC
표 2는 CRC 분별을 위한 단백질 바이오마커 패널의 확인된 단백질 목록을 제공한다.
ROC 교차 검증 시험 배수 평균 메트릭스. 평균 성능 메트릭스는 모든 데이터가 피처 선택에 사용되었지만 모델 가중치는 교차 검증 내에서 정의된 20배의 발견 데이터에서 결정되었다.
"표적 0.9 특이도" 메트릭스의 경우, 예측은 예측 확률(점수) 및 라벨에 기초하여 이루어졌다. 0.9 초과의 특이도를 달성하면서 민감도를 최대화하는 역치를 선택하였다. "경험적" 메트릭의의 경우, 예측은 분류자로부터의 기본 예측 역치를 사용하고 어떠한 특정 특이도도 표적으로 하지 않거나 시험 샘플을 기반으로 하여 이루어졌다. 신뢰 구간은 꺽쇄괄호 안에 보고되며 배수별 신뢰 구간의 평균이다.
표 3은 모든 데이터가 피처 선택에 사용되었지만 모델 가중치는 교차 검증 내에서 정의된 발견 데이터에 대한 53개 피처 CRC 대 NEG의 분류 성능 사양을 제공한다(이 성능에서 진정한 홀드아웃 없음).
표 4는 모든 데이터가 피처 선택에 사용되었지만 모델 가중치는 교차 검증 내에서 정의된 발견 데이터에 대한 53개 피처 AA 대 NEG의 분류 성능 사양을 제공한다(이 성능에서 진정한 홀드아웃 없음).
본 발명의 바람직한 실시양태가 본원에 제시되고 설명되었지만, 이러한 실시양태가 단지 예로서 제공된다는 것이 당업자에게 명백할 것이다. 본 발명은 본 명세서 내에 제공된 특정 예에 의해 제한되는 것으로 의도되지 않는다. 본 발명은 전술한 명세서를 참조하여 설명되었지만, 본원의 실시양태의 설명 및 예시는 제한적인 의미로 해석되는 것을 의미하지 않는다. 이제 본 발명을 벗어나지 않고 당업자에게 많은 변경, 변화 및 치환이 일어날 것이다. 또한, 본 발명의 모든 측면은 다양한 조건 및 변수에 의존하는 본원에 제시된 특정 묘사, 구성 또는 상대적인 비율에 제한되지 않는다는 것을 이해해야 한다. 본원에 기재된 본 발명의 실시양태에 대한 다양한 대안이 본 개시내용의 발명을 실시하는 데 사용될 수 있음을 이해해야 한다. 따라서, 본 발명은 임의의 이러한 대안, 변형, 변경 또는 등가물도 포함하는 것으로 고려된다. 하기 청구범위는 본 발명의 범위를 정의하며 이들 청구범위 및 이의 등가물의 범위 내의 방법 및 구조를 포함하도록 의도된다.

Claims (37)

  1. EGF, FGF-2, FLT3L, 프락탈카인, IL-1a, IL-2, IL-6, IL-8, GROa, MIP-3a, 보체 성분 C2, 보체 성분 C9, 인자 D, 인자 I, MBL, MMP-2, GDF-15, 오스테오넥틴, 페리오스틴, ANGPTL4, FGF-21, FGF-23, HGF, 안지오포이에틴-2, BMP-9, IL-1RII(IL1R2), HGFR, IL-6ra, OPN, 테나신-C(TNC), 트롬보스폰딘-2(THBS2), uPAR, CD44, 칼리크레인-6, 메소텔린, EpCAM, Apo A1, AGP, A2MB, 페투인 A, HP, L-셀렉틴, 보체 성분 C1q, 보체 성분 C3, 보체 성분 C3b, 인자 B, 인자 H, 프로페르딘, AGRP, MMP-12, CYFRA21-1, HE4, 총 PSA, MIF, AFP, CA125(MUC-16), CA19-9, CA15-3(MUC-1), 및 CEA로 이루어진 군으로부터 선택되는 적어도 6개의 단백질을 포함하는, 결장 세포 증식 장애에 특유한 미리 결정된 단백질 패널.
  2. 제1항에 있어서, FLT3L, CEACAM5, IL-6RA, 또는 이들의 조합을 포함하는 패널.
  3. 제1항에 있어서, FLT3L, CEACAM5, IL-6RA, IL-8, IL-1RT2, TNC, 또는 이들의 조합을 포함하는 패널.
  4. 제1항에 있어서, FLT3L, CEACAM5, IL-6RA, IL-8, IL-1RT2, TNC, MUC-16, EGF, 또는 이들의 조합을 포함하는 패널.
  5. 제1항에 있어서, 건강한 대상체, 양성 결장 폴립을 갖는 대상체, 진행성 선종을 갖는 대상체, 또는 결장직장암을 갖는 대상체를 구별하도록 구성되는 패널.
  6. 제1항에 있어서, 진행성 선종을 나타내도록 구성되고, 1) FLT3L, CEACAM5, 및 IL-6RA; 2) FLT3L, CEACAM5, IL-6RA, CEA, IL-8, AGP, IL-1RT2, TNC, 및 GDF-15; 또는 3) FLT3L, CEACAM5, IL-6RA, CEA, IL-8, AGP, IL-1RT2, TNC, GDF-15, AGRP, 합토글로빈, ANGPTL4, FGF-23, 보체 성분 C2, ORM2, FGF-23, MUC-16, EGF, 및 p00738을 포함하는 패널.
  7. 제1항에 있어서, 결장직장암을 나타내도록 구성되고, FLT3L, CEACAM5, 및 IL-6RA; 2) FLT3L, CEACAM5, IL-6RA, IL-8, IL-1RT2, 및 TNC로부터 선택되는 단백질; 또는 3) FLT3L, CEACAM5, IL-6RA, ORM, IL-8, AGP, IL-1RT2, TNC, GDF-15, AGRP, 합토글로빈, ANGPTL4, FGF-23, 보체 성분 C2, ORM2, FGF-23, MUC-16, 및 EGF를 포함하는 패널.
  8. 제1항에 있어서, 결장 세포 증식 장애가 선종(선종성 폴립), 폴립증 장애, 린치 증후군, 무경성 톱니상 선종(SSA), 진행성 선종, 결장직장 형성이상, 결장직장 선종, 결장직장암, 결장암, 직장암, 결장직장 암종, 결장직장 선암종, 카르시노이드 종양, 위장 카르시노이드 종양, 위장 기질 종양(GIST), 림프종, 및 육종으로 이루어진 군으로부터 선택되는 것인 패널.
  9. 결장 세포 증식 장애에 특유한 미리 결정된 단백질 패널로부터의 단백질을 대표하는 측정값 세트를 포함하는, 결장 세포 증식 장애를 갖는 대상체로부터 건강한 대상체의 집단을 구별하도록 구성된 분류자로서,
    측정값 세트는 건강한 대상체의 샘플 및 결장 세포 증식 장애를 갖는 대상체의 샘플로부터의 단백질 발현 데이터로부터 수득되고,
    측정값은 단백질 발현 데이터의 특성에 상응하는 피처 세트를 생성하는 데 사용되고, 피처 세트는 기계 학습 또는 통계 모델을 사용하여 컴퓨터 처리되며,
    기계 학습 또는 통계 모델은 결장 세포 증식 장애를 갖는 대상체로부터 건강한 대상체의 집단을 구별할 수 있는 분류자로서 유용한 피처 벡터를 제공하는 것인 분류자.
  10. 제9항에 있어서, 미리 결정된 단백질 패널이 EGF, FGF-2, FLT3L, 프락탈카인, IL-1a, IL-2, IL-6, IL-8, GROa, MIP-3a, 보체 성분 C2, 보체 성분 C9, 인자 D, 인자 I, MBL, MMP-2, GDF-15, 오스테오넥틴, 페리오스틴, ANGPTL4, FGF-21, FGF-23, HGF, 안지오포이에틴-2, BMP-9, IL-1RII, HGFR, IL-6ra, OPN, 테나신-C, 트롬보스폰딘-2, uPAR, CD44, 칼리크레인-6, 메소텔린, EpCAM, Apo A1, AGP, A2MB, 페투인 A, HP, L-셀렉틴, 보체 성분 C1q, 보체 성분 C3, 보체 성분 C3b, 인자 B, 인자 H, 프로페르딘, AGRP, MMP-12, CYFRA21-1, HE4, 총 PSA, MIF, AFP, CA125, CA19-9, CA15-3(MUC-1), 및 CEA로 이루어진 군으로부터 선택되는 적어도 6개의 단백질을 포함하는 것인 분류자.
  11. 제9항에 있어서, 패널이 FLT3L, CEACAM5, IL-6RA, 또는 이들의 조합을 포함하는 것인 분류자.
  12. 제9항에 있어서, 패널이 FLT3L, CEACAM5, IL-6RA, IL-8, IL-1RT2, TNC, 또는 이들의 조합을 포함하는 것인 분류자.
  13. 제9항에 있어서, 패널이 FLT3L, CEACAM5, IL-6RA, ORM, IL-8, AGP, IL-1RT2, TNC, MUC-16, EGF, 또는 이들의 조합을 포함하는 것인 분류자.
  14. 제9항에 있어서, 건강한 대상체, 양성 결장 폴립을 갖는 대상체, 진행성 선종을 갖는 대상체, 또는 결장직장암을 갖는 대상체를 구별하도록 구성되는 분류자.
  15. 제9항에 있어서, 패널이 진행성 선종을 나타내도록 구성되고, FLT3L, CEACAM5, 및 IL-6RA; 2) FLT3L, CEACAM5, IL-6RA, CEA, IL-8, AGP, IL-1RT2, TNC, 및 GDF-15; 또는 3) FLT3L, CEACAM5, IL-6RA, CEA, IL-8, AGP, IL-1RT2, TNC, GDF-15, AGRP, 합토글로빈, ANGPTL4, FGF-23, 보체 성분 C2, ORM2, FGF-23, MUC-16, EGF, 및 p00738을 포함하는 것인 분류자.
  16. 제9항에 있어서, 패널이 결장직장암을 나타내도록 구성되고, 1) FLT3L, CEACAM5, 및 IL-6RA; 2) FLT3L, CEACAM5, IL-6RA, IL-8, IL-1RT2, 및 TNC; 또는 3) FLT3L, CEACAM5, IL-6RA, ORM, IL-8, AGP, IL-1RT2, TNC, GDF-15, AGRP, 합토글로빈, ANGPTL4, FGF-23, 보체 성분 C2, ORM2, FGF-23, MUC-16, 및 EGF를 포함하는 것인 분류자.
  17. 제9항에 있어서, 결장 세포 증식 장애가 선종(선종성 폴립), 폴립증 장애, 린치 증후군, 무경성 톱니상 선종(SSA), 진행성 선종, 결장직장 형성이상, 결장직장 선종, 결장직장암, 결장암, 직장암, 결장직장 암종, 결장직장 선암종, 카르시노이드 종양, 위장 카르시노이드 종양, 위장 기질 종양(GIST), 림프종, 및 육종으로 이루어진 군으로부터 선택되는 것인 분류자.
  18. 미리 결정된 단백질 패널에 기초하여 대상체를 분류하도록 작동 가능한 분류자를 포함하는 컴퓨터 판독 가능 매체; 및
    컴퓨터 판독 가능 매체에 저장된 명령을 실행하기 위한 하나 이상의 프로세서
    를 포함하는, 결장 세포 증식 장애를 검출하기 위한 기계 학습 모델 분류자를 포함하는 시스템.
  19. 제18항에 있어서, 시스템은 컴퓨터 시스템의 메모리에 로딩된 제9항의 분류자를 포함하고, 기계 학습 모델은 트레이닝 생물학적 샘플로부터 수득된 트레이닝 데이터를 사용하여 트레이닝되고, 트레이닝 생물학적 샘플의 제1 서브세트는 결장 세포 증식 장애를 갖는 대상체에 상응하는 것으로 확인되고, 트레이닝 생물학적 샘플의 제2 서브세트는 결장 세포 증식 장애를 갖지 않는 대상체에 상응하는 것으로 확인되는 것인 시스템.
  20. 제18항에 있어서, 패널이 EGF, FGF-2, FLT3L, 프락탈카인, IL-1a, IL-2, IL-6, IL-8, GROa, MIP-3a, 보체 성분 C2, 보체 성분 C9, 인자 D, 인자 I, MBL, MMP-2, GDF-15, 오스테오넥틴, 페리오스틴, ANGPTL4, FGF-21, FGF-23, HGF, 안지오포이에틴-2, BMP-9, IL-1RII, HGFR, IL-6ra, OPN, 테나신-C, 트롬보스폰딘-2, uPAR, CD44, 칼리크레인-6, 메소텔린, EpCAM, Apo A1, AGP, A2MB, 페투인 A, HP, L-셀렉틴, 보체 성분 C1q, 보체 성분 C3, 보체 성분 C3b, 인자 B, 인자 H, 프로페르딘, AGRP, MMP-12, CYFRA21-1, HE4, 총 PSA, MIF, AFP, CA125, CA19-9, CA15-3(MUC-1), 및 CEA로 이루어진 군으로부터 선택되는 적어도 6개의 단백질을 포함하는 것인 시스템.
  21. 제18항에 있어서, 심화 학습 분류자, 신경 네트워크 분류자, 선형 판별 분석(LDA) 분류자, 2차 판별 분석(QDA) 분류자, 서포트 벡터 머신(SVM) 분류자, 랜덤 포레스트(RF) 분류자, K 최근접 이웃, 선형 커넬 서포트 벡터 머신 분류자, 1차 또는 2차 다항 커넬 서포트 벡터 머신 분류자, 릿지 회귀 분류자, 엘라스틱 네트 알고리즘 분류자, 순차 최소 최적화 알고리즘 분류자, 나이브 베이즈 알고리즘 분류자, 및 주성분 분석 분류자로 이루어진 군으로부터 선택되는 기계 학습 분류자로 구성되는 분류 회로를 포함하는 시스템.
  22. a) 대상체로부터 단백질을 함유하는 생물학적 샘플을 수득하는 단계; 및
    b) 생물학적 샘플에서 EGF, FGF-2, FLT3L, 프락탈카인, IL-1a, IL-2, IL-6, IL-8, GROa, MIP-3a, 보체 성분 C2, 보체 성분 C9, 인자 D, 인자 I, MBL, MMP-2, GDF-15, 오스테오넥틴, 페리오스틴, ANGPTL4, FGF-21, FGF-23, HGF, 안지오포이에틴-2, BMP-9, IL-1RII, HGFR, IL-6ra, OPN, 테나신-C, 트롬보스폰딘-2, uPAR, CD44, 칼리크레인-6, 메소텔린, EpCAM, Apo A1, AGP, A2MB, 페투인 A, HP, L-셀렉틴, 보체 성분 C1q, 보체 성분 C3, 보체 성분 C3b, 인자 B, 인자 H, 프로페르딘, AGRP, MMP-12, CYFRA21-1, HE4, 총 PSA, MIF, AFP, CA125, CA19-9, CA15-3(MUC-1), 및 CEA로 이루어진 군으로부터 선택되는 적어도 6개의 단백질을 포함하는 미리 결정된 단백질 패널로부터의 단백질의 양을 측정하여 대상체의 단백질 프로파일을 제공하는 단계
    를 포함하는, 대상체로부터의 생물학적 샘플의 단백질 프로파일을 결정하는 방법.
  23. 제22항에 있어서, 미리 결정된 단백질 패널이 FLT3L, CEACAM5, IL-6RA, 또는 이들의 조합을 포함하는 것인 방법.
  24. 제22항에 있어서, 미리 결정된 단백질 패널이 FLT3L, CEACAM5, IL-6RA, IL-8, IL-1RT2, TNC, 또는 이들의 조합을 포함하는 것인 방법.
  25. 제22항에 있어서, 미리 결정된 단백질 패널이 FLT3L, CEACAM5, IL-6RA, ORM, IL-8, AGP, IL-1RT2, TNC, MUC-16, EGF, 또는 이들의 조합을 포함하는 것인 방법.
  26. 제22항에 있어서, 단백질 프로파일이 결장 세포 증식 장애와 관련되고, 결장 세포 증식 장애를 갖는 것으로 대상체의 분류를 제공하는 것인 방법.
  27. 제22항에 있어서, 대상체로부터의 생물학적 샘플이 체액, 대변, 결장 유출물, 소변, 혈장, 혈청, 전혈, 단리된 혈액 세포, 혈액으로부터 단리된 세포, 조직 생검, 및 이들의 조합으로 이루어진 군으로부터 선택되는 것인 방법.
  28. 제22항에 있어서, 결장 세포 증식 장애가 선종(선종성 폴립), 폴립증 장애, 린치 증후군, 무경성 톱니상 선종(SSA), 진행성 선종, 결장직장 형성이상, 결장직장 선종, 결장직장암, 결장암, 직장암, 결장직장 암종, 결장직장 선암종, 카르시노이드 종양, 위장 카르시노이드 종양, 위장 기질 종양(GIST), 림프종, 및 육종으로 이루어진 군으로부터 선택되는 것인 방법.
  29. 제22항에 있어서, c) 대상체를 대상체의 단백질 프로파일에 기초하여 수술 및/또는 치료제로 치료하는 단계를 추가로 포함하는 방법.
  30. a) 대상체로부터 단백질을 함유하는 생물학적 샘플을 수득하는 단계;
    b) 생물학적 샘플에서 EGF, FGF-2, FLT3L, 프락탈카인, IL-1a, IL-2, IL-6, IL-8, GROa, MIP-3a, 보체 성분 C2, 보체 성분 C9, 인자 D, 인자 I, MBL, MMP-2, GDF-15, 오스테오넥틴, 페리오스틴, ANGPTL4, FGF-21, FGF-23, HGF, 안지오포이에틴-2, BMP-9, IL-1RII, HGFR, IL-6ra, OPN, 테나신-C, 트롬보스폰딘-2, uPAR, CD44, 칼리크레인-6, 메소텔린, EpCAM, Apo A1, AGP, A2MB, 페투인 A, HP, L-셀렉틴, 보체 성분 C1q, 보체 성분 C3, 보체 성분 C3b, 인자 B, 인자 H, 프로페르딘, AGRP, MMP-12, CYFRA21-1, HE4, 총 PSA, MIF, AFP, CA125, CA19-9, CA15-3(MUC-1), 및 CEA로 이루어진 군으로부터 선택되는 적어도 6개의 단백질을 포함하는 미리 결정된 단백질 패널로부터의 단백질 양을 측정하여 대상체의 단백질 프로파일을 제공하는 단계; 및
    c) 단백질 프로파일을 건강한 대상체와 결장 세포 증식 장애를 갖는 대상체를 구별할 수 있도록 트레이닝된 기계 학습 모델로 컴퓨터 처리하여 결장 세포 증식 장애의 존재 또는 부재와 관련된 출력값을 제공함으로써 대상체에서 결장 세포 증식 장애의 존재 또는 부재를 나타내는 단계
    를 포함하는, 대상체에서 결장 세포 증식 장애를 검출하는 방법.
  31. 제30항에 있어서, 미리 결정된 단백질 패널이 FLT3L, CEACAM5, IL-6RA, 또는 이들의 조합을 포함하는 것인 방법.
  32. 제30항에 있어서, 미리 결정된 단백질 패널이 FLT3L, CEACAM5, IL-6RA, IL-8, IL-1RT2, TNC, 또는 이들의 조합을 포함하는 것인 방법.
  33. 제30항에 있어서, 미리 결정된 단백질 패널이 FLT3L, CEACAM5, IL-6RA, ORM, IL-8, AGP, IL-1RT2, TNC, MUC-16, EGF, 또는 이들의 조합을 포함하는 것인 방법.
  34. 제30항에 있어서, 단백질 프로파일이 결장 세포 증식 장애와 관련되고, 결장 세포 증식 장애를 갖는 것으로 대상체의 분류를 제공하는 것인 방법.
  35. 제30항에 있어서, 대상체로부터의 생물학적 샘플이 체액, 대변, 결장 유출물, 소변, 혈장, 혈청, 전혈, 단리된 혈액 세포, 혈액으로부터 단리된 세포, 조직 생검, 및 이들의 조합으로 이루어진 군으로부터 선택되는 것인 방법.
  36. 제30항에 있어서, 결장 세포 증식 장애가 선종(선종성 폴립), 폴립증 장애, 린치 증후군, 무경성 톱니상 선종(SSA), 진행성 선종, 결장직장 형성이상, 결장직장 선종, 결장직장암, 결장암, 직장암, 결장직장 암종, 결장직장 선암종, 카르시노이드 종양, 위장 카르시노이드 종양, 위장 기질 종양(GIST), 림프종, 및 육종으로 이루어진 군으로부터 선택되는 것인 방법.
  37. 제30항에 있어서, d) 대상체를 대상체의 단백질 프로파일에 기초하여 수술 및/또는 치료제로 치료하는 단계를 추가로 포함하는 방법.
KR1020237024786A 2020-12-21 2021-12-14 결장 세포 증식 장애의 조기 검출을 위한 마커 KR20230124038A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US202063128545P 2020-12-21 2020-12-21
US63/128,545 2020-12-21
PCT/US2021/063337 WO2022140116A1 (en) 2020-12-21 2021-12-14 Markers for the early detection of colon cell proliferative disorders

Publications (1)

Publication Number Publication Date
KR20230124038A true KR20230124038A (ko) 2023-08-24

Family

ID=82157028

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020237024786A KR20230124038A (ko) 2020-12-21 2021-12-14 결장 세포 증식 장애의 조기 검출을 위한 마커

Country Status (8)

Country Link
US (1) US20230176058A1 (ko)
EP (1) EP4264270A1 (ko)
JP (1) JP2024505333A (ko)
KR (1) KR20230124038A (ko)
CN (1) CN117083525A (ko)
AU (1) AU2021409465A1 (ko)
CA (1) CA3202255A1 (ko)
WO (1) WO2022140116A1 (ko)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019060716A1 (en) 2017-09-25 2019-03-28 Freenome Holdings, Inc. SAMPLE EXTRACTION METHODS AND SYSTEMS
CN116519954B (zh) * 2023-06-28 2023-10-27 杭州广科安德生物科技有限公司 一种结直肠癌检测模型构建方法、系统及生物标志物

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120143805A1 (en) * 2008-09-09 2012-06-07 Somalogic, Inc. Cancer Biomarkers and Uses Thereof
GB201319264D0 (en) * 2013-10-31 2013-12-18 Univ Cape Town The Method for diagnosing sexually transmitted infections and bacterial vaginosis in women
US11014987B2 (en) * 2013-12-24 2021-05-25 Janssen Pharmaceutics Nv Anti-vista antibodies and fragments, uses thereof, and methods of identifying same
EP3481951A4 (en) * 2016-07-06 2020-08-05 Youhealth Biotech, Limited METHYLATION MARKERS FOR COLON CARCINOMA AND USES THEREOF
JP7232476B2 (ja) * 2017-08-07 2023-03-08 ザ ジョンズ ホプキンス ユニバーシティ がんを評価及び治療するための方法及び物質
SG11202009696WA (en) * 2018-04-13 2020-10-29 Freenome Holdings Inc Machine learning implementation for multi-analyte assay of biological samples

Also Published As

Publication number Publication date
AU2021409465A1 (en) 2023-08-03
WO2022140116A1 (en) 2022-06-30
JP2024505333A (ja) 2024-02-06
CN117083525A (zh) 2023-11-17
EP4264270A1 (en) 2023-10-25
CA3202255A1 (en) 2022-06-30
US20230176058A1 (en) 2023-06-08

Similar Documents

Publication Publication Date Title
JP7431760B2 (ja) 癌分類子モデル、機械学習システム、および使用方法
Kidd et al. Blood and tissue neuroendocrine tumor gene cluster analysis correlate, define hallmarks and predict disease status
Farshidfar et al. Serum metabolomic profile as a means to distinguish stage of colorectal cancer
JP7250693B2 (ja) 初期ステージの肺がん診断のための血漿ベースのタンパク質プロファイリング
Zhu et al. Three immunomarker support vector machines–based prognostic classifiers for stage IB non–small-cell lung cancer
US20230176058A1 (en) Markers for the early detection of colon cell proliferative disorders
Wang et al. Clinical evaluation and therapeutic monitoring value of serum tumor markers in lung cancer
US20230243830A1 (en) Markers for the early detection of colon cell proliferative disorders
CN117368475A (zh) 肺癌的检测和治疗方法
US20230263477A1 (en) Universal pan cancer classifier models, machine learning systems and methods of use
BR112020021779B1 (pt) Método de identificação de uma assinatura de câncer de próstata clinicamente significativo usando citometria de microfluxo
Alexe et al. Towards improved cancer diagnosis and prognosis using analysis of gene expression data and computer aided imaging
Paproski et al. Building predictive disease models using extracellular vesicle microscale flow cytometry and machine learning
US20230223145A1 (en) Methods and software systems to optimize and personalize the frequency of cancer screening blood tests
Amjad et al. Impact of Gene Biomarker Discovery Tools Based on Protein–Protein Interaction and Machine Learning on Performance of Artificial Intelligence Models in Predicting Clinical Stages of Breast Cancer
WO2023235878A2 (en) Markers for the early detection of colon cell proliferative disorders
Firpo et al. Multianalyte serum biomarker panel for early detection of pancreatic adenocarcinoma
Rothberg et al. Construction and analysis of multiparameter prognostic models for melanoma outcome
Piedimonte et al. Evaluating the use of machine learning in endometrial cancer: A systematic review
Axelrod et al. Avoiding pitfalls in the statistical analysis of heterogeneous tumors
US20150310169A1 (en) Metabolic profiling in tissue and serum is indicative of tumor differentiation in prostate cancer
WO2024059879A2 (en) Generating electronic tumor marker analogs of carbohydrate antigen 19-9 using machine learning
Santiago et al. Mixed-Integer Programming Model for Profiling Disease Biomarkers from Gene Expression Studies
WO2023230617A2 (en) Bladder cancer biomarkers and methods of use
Lisson et al. Machine Learning Classifiers for Predictive Biomarkers Combining Clinical and Radiomic Data in Testicular Cancer