KR20230017206A - 결장 세포 증식성 장애를 식별하기 위한 rna 마커 및 방법 - Google Patents

결장 세포 증식성 장애를 식별하기 위한 rna 마커 및 방법 Download PDF

Info

Publication number
KR20230017206A
KR20230017206A KR1020227041793A KR20227041793A KR20230017206A KR 20230017206 A KR20230017206 A KR 20230017206A KR 1020227041793 A KR1020227041793 A KR 1020227041793A KR 20227041793 A KR20227041793 A KR 20227041793A KR 20230017206 A KR20230017206 A KR 20230017206A
Authority
KR
South Korea
Prior art keywords
mir
hsa
mirna
subject
cell proliferative
Prior art date
Application number
KR1020227041793A
Other languages
English (en)
Inventor
프랑세즈 암스트롱
시바니 마하잔
아담 하베이
아니샤 테와리
데이비드 웨인버그
제시 이튼
Original Assignee
프리놈 홀딩스, 인크.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 프리놈 홀딩스, 인크. filed Critical 프리놈 홀딩스, 인크.
Publication of KR20230017206A publication Critical patent/KR20230017206A/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B40/00Libraries per se, e.g. arrays, mixtures
    • C40B40/04Libraries containing only organic compounds
    • C40B40/06Libraries containing nucleotides or polynucleotides, or derivatives thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/20Ensemble learning
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • G16B40/20Supervised data analysis
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/158Expression markers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/178Oligonucleotides characterized by their use miRNA, siRNA or ncRNA

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Medical Informatics (AREA)
  • Data Mining & Analysis (AREA)
  • Wood Science & Technology (AREA)
  • Pathology (AREA)
  • Zoology (AREA)
  • Theoretical Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Analytical Chemistry (AREA)
  • Software Systems (AREA)
  • Immunology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Biochemistry (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Molecular Biology (AREA)
  • Microbiology (AREA)
  • Oncology (AREA)
  • Hospice & Palliative Care (AREA)
  • Public Health (AREA)
  • Epidemiology (AREA)
  • Databases & Information Systems (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioethics (AREA)
  • Evolutionary Biology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Computing Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)

Abstract

본 개시는 결장 세포 증식성 장애를 갖지 않거나 결장 세포 증식성 장애가 발생할 낮은 위험도를 갖는 개체의 상응하는 샘플과 비교하여, 각각 결장 세포 증식성 장애를 갖거나 결장 세포 증식성 장애가 발병할 높은 위험도를 갖는 개체의 샘플에서 차등 발현된 miRNA에 관한 것이다. 일부 실시양태에서, miRNA는 결장직장 병변을 갖고 결장 세포 증식성 장애가 발병할 높은 위험도를 갖는 개체의 조직 샘플 또는 혈장 샘플에서 결장직장 병변을 갖고 결장 세포 증식성 장애가 발병할 위험도를 갖지 않거나 낮은 위험도를 갖는 개체의 상응하는 조직 샘플 또는 혈액 샘플과 비교하여 차등 발현된다. 이러한 차등 발현된 miRNA는, 특히, 결장직장 병변을 갖는 대상체에서 결장 세포 증식성 장애의 진단, 치료, 및/또는 예방을 위한 바이오마커로서 사용될 수 있다.

Description

결장 세포 증식성 장애를 식별하기 위한 RNA 마커 및 방법
관련 출원에 대한 상호-참조
본 출원은 2020년 4월 29일에 출원된 미국 가특허 출원 번호 제63/017,552호 및 2020년 5월 14일에 출원된 미국 가특허 출원 번호 제63/024,875호의 이익을 주장하며, 이들 각각은 그 전체가 본원에 참조로 포함된다.
암 스크리닝 및 조기 검출은 암에 대한 가장 효율적인 전략으로 여겨지는데, 그 이유는 증상의 발병 전 조기에 악성종양 또는 전구체 병변을 검출하는 것이 치료가 가장 효과적인 시기이기 때문이다. 예를 들어, 결장직장암에서, 결장경검사는 조기 진단을 개선하는 역할을 한다. 결장경검사는 조기 검출에 유용하지만, 환자 순응도가 낮고, 스크리닝이 절차의 침습성으로 인해 권장되는 주기보다 덜 수행된다. 따라서, 비-침습적 방법이 조기 암 검출을 위한 보다 유망한 접근법을 제공한다.
개요
본 개시는 결장 세포 증식성 장애(예를 들어, 결장직장암) 검출 및 질환 진행과 관련된 유전자의 마이크로 리보핵산(마이크로RNA, 또는 miRNA) 프로파일링에 관한 방법 및 시스템을 제공한다. 본 개시의 일부 실시양태는 결장 세포 증식성 장애를 갖지 않거나 결장 세포 증식성 장애가 발생할 낮은 위험도를 갖는 대상체의 상응하는 샘플과 비교하여, 결장 세포 증식성 장애를 갖거나 결장 세포 증식성 장애가 발병할 높은 위험도를 갖는 대상체의 샘플에서 차등적으로 풍부한 miRNA를 제공한다. 일부 실시양태에서, 결장 세포 증식성 장애가 발병할 높은 위험도를 갖는 대상체 및 결장 세포 증식성 장애가 발병할 낮은 위험도를 갖는 대상체 각각은 결장직장 점막 내에서 발생하는 비-침습성 전구체 병변(이하, 결장직장 병변)을 갖는다. 결장 세포 증식성 장애를 갖거나 결장 세포 증식성 장애가 발병할 높은 위험도를 갖는 대상체의 샘플에 상이한 존재비로 존재하는(종종 "차등 발현된"으로 지칭됨) miRNA는 결장 세포 증식성 장애의 진단, 치료, 및/또는 예방을 위한 바이오마커로서 사용될 수 있다.
본원에서 확인된 miRNA는 결장 세포 증식성 장애를 갖는 대상체를 결장 세포 증식성 장애를 갖지 않는 대상체와 구별하여 결장 세포 증식성 장애를 갖는 대상체를 식별하거나, 결장 세포 증식성 장애가 발병할 더 높은 위험도를 갖는 대상체를 결장 세포 증식성 장애가 발병할 더 낮은 위험도를 갖는 대상체와 구별하여 결장 세포 증식성 장애가 발병할 더 높은 위험도를 갖는 대상체를 식별하거나, 비-IPMN 대비 결장 세포 증식성 장애 전구체(예컨대, 관내 유두 점액성 신생물(IPMN))를 갖는 대상체를 식별하거나, 양성 IPMN 대비 악성 IPMN을 갖는 대상체를 식별하기 위해 사용될 수 있다. 따라서, 이러한 miRNA는 결장 세포 증식성 장애의 모니터링, 치료, 및 관리에 관한 결정을 안내하기 위한 보조 도구로서 사용될 수 있다.
본 개시의 일부 실시양태는, 예를 들어, 대상체가 결장직장 병변을 갖는 경우, 결장 세포 증식성 장애를 갖거나 결장 세포 증식성 장애가 발병할 높은 위험도를 갖는 대상체의 샘플에서 차등 발현된 본원에 기재된 miRNA에 대하여 훈련된 기계 학습 모델 분류기를 제공한다. 일례에서, 조직학적 중증도를 평가하기 위해 결장직장 병변을 갖는 대상체에서 사용될 수 있는 혈액-기반 최소-침습적 miRNA 검정을 위한 방법이 제공된다. 또 다른 실시양태에서, 결장 세포 증식성 장애를 지시하는 miRNA는 대상체로부터의 무세포 샘플, 예를 들어, 대상체로부터의 체액 샘플, 예컨대, 전혈, 혈장, 또는 혈청에서 검출된다. 이와 같이, 본 개시는 결장 세포 증식성 장애, 외과적 절제, 면역요법, 방사선, 또는 화학요법과 같은 적절한 치료가 필요한 고위험 또는 저위험 결장직장 병변 및 모니터링될 수 있는 저위험 직장결장 병변의 존재 또는 부재를 구별하는 데 사용될 수 있는 miRNA를 제공한다. 결장 세포 증식성 장애 또는 병변의 존재의 모니터링 및 확인은, 예를 들어, 결장경검사, 초음파, MM, 또는 CT 스캔에 의해 수행될 수 있다.
일 측면에서, 본 개시는 표 1-11에 열거된 군으로부터 선택된 1 개 이상, 2 개 이상, 3 개 이상, 또는 4 개 이상의 miRNA의 미리 결정된 세트를 포함하는, 결장 세포 증식성 장애에 특징적인 마이크로 리보핵산(miRNA) 시그니처 패널을 제공하고, 여기서 4 개 이상의 miRNA는 결장 세포 증식성 장애 또는 이의 아형을 갖는 대상체로부터의 생물학적 샘플과 결장 세포 증식성 장애 또는 이의 아형이 없는 대상체로부터의 생물학적 샘플 사이에 차등 발현된다.
일부 실시양태에서, miRNA 시그니처 패널은 진행성 선종에 특징적이고, 시그니처 패널은 a) hsa-miR-1273a, hsa-miR-17-5p, hsa-miR-20a-3p, hsa-miR-20b-5p; b) hsa-miR-3065-5p, hsa-miR-4785, hsa-miR-5096, hsa-miR-5189-5p, 또는 c) hsa-miR-545-3p, hsa-miR-570-3p, hsa-miR-624-3p, hsa-mir-1181, hsa-mir-6073를 포함하는 miRNA의 미리 결정된 세트를 포함하고, 여기서 miRNA는 진행성 선종 또는 이의 아형을 갖는 대상체로부터의 생물학적 샘플과 진행성 선종 또는 이의 아형이 없는 대상체로부터의 생물학적 샘플 사이에 차등 발현된다.
일부 실시양태에서, miRNA 시그니처 패널은 결장직장암에 특징적이고, 시그니처 패널은 a) hsa-miR-1250-5p, hsa-miR-1255a, hsa-miR-223-3p, hsa-miR-338-3p, hsa-miR-338-5p; b) hsa-miR-424-5p, hsa-miR-424-3p, hsa-miR-450a-5p, hsa-miR-450b-5p, hsa-miR-4772-3p; c) hsa-miR-4772-5p, hsa-miR-625-5p, hsa-miR-7847-3p, hsa-miR-1181, hsa-miR-3651, hsa-mir-6073; d) hsa-mir-6125, hsa-mir-7704, hsa-miR-19b-3p, hsa-miR-19a-3p, hsa-miR-3157-5p; e) hsa-miR-142-3p, hsa-miR-30c-5p, hsa-miR-6741-5p, hsa-miR-590-3p, hsa-miR-4685-5p; f) hsa-miR-3648, hsa-miR-331-3p, hsa-miR-1303, hsa-miR-6790-3p, hsa-miR-6867-5p, hsa-miR-942-5p; g) hsa-miR-378a-3p, hsa-miR-1287-5p, hsa-mir-4785, hsa-miR-324-3p, hsa-miR-550b-2-5p; h) hsa-miR-200c-3p, hsa-miR-200b-3p, hsa-miR-3679-5p, hsa-miR-550a-3-5p, hsa-miR-3187-3p; i) hsa-miR-181b-5p, hsa-miR-3138, hsa-miR-146a-5p, hsa-miR-6721-5p, hsa-miR-23b-3p, hsa-miR-28-5p; j) hsa-miR-320d, hsa-miR-940, hsa-miR-320d-1, hsa-miR-10a-5p, hsa-miR-340-5p; k) hsa-miR-320b, hsa-miR-335-5p, hsa-miR-320c, hsa-miR-501-3p, hsa-miR-548n; 또는 l) hsa-miR-27a-3p, hsa-miR-3065-3p, hsa-miR-548aa@, hsa-miR-584-3p, hsa-miR-22-3p를 포함하는 miRNA의 미리 결정된 세트를 포함하고, 여기서 miRNA는 결장직장암 또는 이의 아형을 갖는 대상체로부터의 생물학적 샘플과 결장직장암 또는 이의 아형이 없는 대상체로부터의 생물학적 샘플 사이에 차등 발현된다.
일부 실시양태에서, miRNA의 미리 결정된 세트는 표 1-11에 열거된 군으로부터 선택된 적어도 1 개, 적어도 2 개, 적어도 3 개, 적어도 4 개, 적어도 5 개, 적어도 6 개, 적어도 7 개, 적어도 8 개, 적어도 9 개, 적어도 10 개, 적어도 11 개, 적어도 12 개, 적어도 13 개, 적어도 14 개, 적어도 15 개, 적어도 16 개, 적어도 17 개, 적어도 18 개, 적어도 19 개, 적어도 20 개, 적어도 21 개, 적어도 22 개, 적어도 23 개, 적어도 24 개, 적어도 25 개, 적어도 26 개, 적어도 27 개, 적어도 28 개, 적어도 29 개, 적어도 30 개, 적어도 40 개, 적어도 50 개, 적어도 60 개, 적어도 70 개, 적어도 80 개, 적어도 90 개, 적어도 100 개, 적어도 110 개, 적어도 120 개, 적어도 130 개, 적어도 140 개, 적어도 150 개, 적어도 160 개, 적어도 170 개, 적어도 180 개, 적어도 190 개, 적어도 200 개, 또는 적어도 250 개의 miRNA를 포함한다.
일부 실시양태에서, 생물학적 샘플은 체액, 대변, 결장 유출물, 소변, 혈장, 혈청, 전혈, 단리된 혈액 세포, 혈액으로부터 단리된 세포, 및 이들의 조합으로 이루어진 군으로부터 선택된다.
일부 실시양태에서, 생물학적 샘플은 핵산, DNA, RNA, 또는 무세포 핵산(cfDNA 또는 cfRNA)을 포함한다.
일부 실시양태에서, miRNA는 성숙 miRNA 및 miRNA 헤어핀을 포함한다.
일부 실시양태에서, 시그니처 패널은 표 1-11에 열거된 군으로부터 선택된 1 이상, 2 개 이상, 3 개 이상, 4 개 이상, 5 개 이상, 6 개 이상, 7 개 이상, 8 개 이상, 9 개 이상, 10 개 이상, 11 개 이상, 또는 12 개 이상의 miRNA에서 차등 발현을 포함한다.
일부 실시양태에서, 결장 세포 증식성 장애는 선종(선종성 용종), 무경성 거치상 선종(SSA), 진행성 선종, 결장직장 이형성증, 결장직장 선종, 결장직장암, 결장암, 직장암, 결장직장 암종, 결장직장 선암종, 카르시노이드 종양, 위장 카르시노이드 종양, 위장 기질 종양(GIST), 림프종, 및 육종으로 이루어진 군으로부터 선택된다.
일부 실시양태에서, 결장 세포 증식성 장애는 1기 결장직장암, 2기 결장직장암, 3기 결장직장암, 및 4기 결장직장암으로 이루어진 군으로부터 선택된다.
또 다른 측면에서, 본 개시는 건강한 대상체(예를 들어, 결장 세포 증식성 장애가 없는 대상체)의 집단을 결장 세포 증식성 장애가 있는 대상체로부터 구별할 수 있는 분류기로서, a) 표 1-11에 열거된 군으로부터 선택된 6 개 이상, 또는 12 개 이상의 미리 선택된 miRNA에서 차등 miRNA 발현을 나타내는 측정된 값의 세트를 포함하고, 여기서 측정된 값은 건강한 대상체 및 결장 세포 증식성 장애를 갖는 대상체로부터의 miRNA 발현 데이터로부터 얻어지고, b) 측정된 값은 차등 miRNA 발현의 성질에 상응하는 피처(feature)의 세트를 생성하는 데 사용되고, 여기서 피처의 세트는 기계 학습 모델(예를 들어, 통계적 모델)을 사용하여 컴퓨터 처리되고, c) 기계 모델은 결장 세포 증식성 장애를 갖는 대상체로부터 건강한 대상체의 집단을 구별할 수 있는 분류기로서 유용한 피처 벡터를 제공하는, 분류기를 제공한다.
일부 실시양태에서, 미리 선택된 miRNA는 표 1-11에 열거된 군으로부터 선택된 적어도 1 개, 적어도 2 개, 적어도 3 개, 적어도 4 개, 적어도 5 개, 적어도 6 개, 적어도 7 개, 적어도 8 개, 적어도 9 개, 적어도 10 개, 적어도 11 개, 적어도 12 개, 적어도 13 개, 적어도 14 개, 적어도 15 개, 적어도 16 개, 적어도 17 개, 적어도 18 개, 적어도 19 개, 적어도 20 개, 적어도 21 개, 적어도 22 개, 적어도 23 개, 적어도 24 개, 적어도 25 개, 적어도 26 개, 적어도 27 개, 적어도 28 개, 적어도 29 개, 적어도 30 개, 적어도 40 개, 적어도 50 개, 적어도 60 개, 적어도 70 개, 적어도 80 개, 적어도 90 개, 적어도 100 개, 적어도 110 개, 적어도 120 개, 적어도 130 개, 적어도 140 개, 적어도 150 개, 적어도 160 개, 적어도 170 개, 적어도 180 개, 적어도 190 개, 적어도 200 개, 또는 적어도 250 개의 miRNA를 포함한다.
일부 실시양태에서, 결장 세포 증식성 장애는 선종(선종성 용종), 무경성 거치상 선종(SSA), 진행성 선종, 결장직장 이형성증, 결장직장 선종, 결장직장암, 결장암, 직장암, 결장직장 암종, 결장직장 선암종, 카르시노이드 종양, 위장 카르시노이드 종양, 위장 기질 종양(GIST), 림프종, 및 육종으로 이루어진 군으로부터 선택된다.
일부 실시양태에서, 측정된 값의 세트는 상이한 수를 갖는 단편을 관찰한 수 또는 비율, 원시 miRNA 존재비, 하우스키핑 유전자에 대해 표준화된 miRNA 존재비, 합성 서열에 대해 표준화된 miRNA 존재비, 로그 표준화된 miRNA 존재비, 단편 길이, 단편 중간점, 성숙 miRNA 또는 miRNA 헤어핀에 따른 리드 맵핑 위치 및 리드 파일링, 및 miRNA 클러스터의 존재비로 이루어진 군으로부터 선택된 차등 miRNA 발현의 특징을 기술한다.
일부 실시양태에서, 기계 학습 모델은 훈련 생물학적 샘플, 결장 세포 증식성 장애를 갖는 대상체에 상응하는 것으로 식별된 훈련 생물학적 샘플의 제1 서브세트, 및 결장 세포 증식성 장애를 갖지 않는 것으로 대상체에 상응하여 식별된 훈련 생물학적 샘플의 제2 서브세트로부터 얻어진 훈련 데이터를 사용하여 훈련된다.
일부 실시양태에서, 분류기는 a) miRNA 시그니처 패널에 기초하여 대상체를 분류하도록 작동 가능한 분류기를 포함하는 컴퓨터-판독 가능 매체; 및 b) 컴퓨터-판독 가능 매체에 저장된 명령어를 실행하기 위한 하나 이상의 프로세서를 포함하는, 결장 세포 증식성 장애를 검출하기 위한 시스템을 제공한다.
일부 실시양태에서, 시스템은 심화 학습 분류기, 신경망 분류기, 선형 판별 분석(LDA) 분류기, 이차 판별 분석(QDA) 분류기, 서포트 벡터 머신(SVM) 분류기, 랜덤 포레스트(RF) 분류기, 선형 커널 서포트 벡터 머신 분류기, 일차 또는 이차 다항식 커널 서포트 벡터 머신 분류기, 리지 회귀 분류기, 탄성 네트 알고리즘 분류기, 순차 최소 최적화 알고리즘 분류기, 나이브 베이즈 알고리즘 분류기, 및 주성분 분석 분류기로 이루어진 군으로부터 선택된 기계 학습 분류기로서 구성되는 분류 회로를 포함한다.
또 다른 측면에서, 본 개시는 대상체로부터의 생물학적 샘플의 마이크로 리보핵산(miRNA) 프로파일을 결정하기 위한 방법으로서, a) 생물학적 샘플로부터 RNA 분자를 단리하는 단계; b) RNA 분자를 상보적 데옥시리보핵산(cDNA) 분자로 역전사시키기 전 또는 후에, RNA 분자에 RNA 어댑터를 결찰하는 단계; c) cDNA 분자를 증폭시키는 단계; d) cDNA 분자의 핵산 서열을 결정하는 단계; e) 표 1-11에 열거된 군으로부터 선택된 miRNA의 패널에 대한 참조 핵산 서열에 핵산 서열을 정렬하는 단계; 및 f) 정렬된 핵산 서열에 적어도 부분적으로 기초하여 대상체의 miRNA 프로파일을 결정하는 단계를 포함하는, 방법을 제공한다.
일부 실시양태에서, 미리 선택된 miRNA는 표 1-11에 열거된 군으로부터 선택된 적어도 1 개, 적어도 2 개, 적어도 3 개, 적어도 4 개, 적어도 5 개, 적어도 6 개, 적어도 7 개, 적어도 8 개, 적어도 9 개, 적어도 10 개, 적어도 11 개, 적어도 12 개, 적어도 13 개, 적어도 14 개, 적어도 15 개, 적어도 16 개, 적어도 17 개, 적어도 18 개, 적어도 19 개, 적어도 20 개, 적어도 21 개, 적어도 22 개, 적어도 23 개, 적어도 24 개, 적어도 25 개, 적어도 26 개, 적어도 27 개, 적어도 28 개, 적어도 29 개, 적어도 30 개, 적어도 40 개, 적어도 50 개, 적어도 60 개, 적어도 70 개, 적어도 80 개, 적어도 90 개, 적어도 100 개, 적어도 110 개, 적어도 120 개, 적어도 130 개, 적어도 140 개, 적어도 150 개, 적어도 160 개, 적어도 170 개, 적어도 180 개, 적어도 190 개, 적어도 200 개, 또는 적어도 250 개의 miRNA를 포함한다.
일부 실시양태에서, 결장 세포 증식성 장애는 선종(선종성 용종), 무경성 거치상 선종(SSA), 진행성 선종, 결장직장 이형성증, 결장직장 선종, 결장직장암, 결장암, 직장암, 결장직장 암종, 결장직장 선암종, 카르시노이드 종양, 위장 카르시노이드 종양, 위장 기질 종양(GIST), 림프종, 및 육종으로 이루어진 군으로부터 선택된다.
일부 실시양태에서, 방법은 RNA 분자 또는 cDNA 분자를 풍부화 또는 고갈시키는 단계를 추가로 포함한다.
일부 실시양태에서, 참조 핵산 서열은 게놈, 전사체, 또는 맞춤 전사체 참조 핵산 서열을 포함한다.
일부 실시양태에서, 방법은 증폭 전에 miRNA 라이브러리를 제조하는 단계를 추가로 포함한다.
일부 실시양태에서, 어댑터 결찰은 c) 전에 RNA 어댑터 결찰, 어댑터 차단, 어댑터 순환 및 이량체 제거를 포함한다.
일부 실시양태에서, RNA 어댑터를 결찰하는 것은 어댑터 차단, 어댑터 순환, 및/또는 이량체 제거를 수행하는 것을 포함한다.
일부 실시양태에서, RNA 어댑터를 결찰하는 것은 3' RNA 어댑터 결찰, 5' RNA 어댑터 결찰, 고유한 분자 식별자(UMI) 할당을 갖는 역전사, 및/또는 cDNA 클린업을 수행하는 것을 포함한다.
또 다른 측면에서, 본 개시는 다음 중 하나 이상을 수행하는 단계를 포함하는, 대상체로부터의 생물학적 샘플의 마이크로 리보핵산(miRNA) 프로파일을 결정하기 위한 방법을 제공한다: 1) 생물학적 샘플로부터 RNA 분자의 추출 후 직접 RNA 계수, 2) 생물학적 샘플로부터 RNA 분자의 추출 후 A 테일링, 이후 주형 전환으로 cDNA로의 역전사(RT), 3) 생물학적 샘플로부터 RNA 분자의 추출 후 A 테일링, 이어서 역전사 폴리머라제 연쇄 반응(RT-PCR) 및 정량적 PCR(qPCR) 또는 디지털 액적 PCR(ddPCR), 4) 생물학적 샘플로부터 RNA 분자의 추출 후 서열-특이적 결찰, 및 이어서 RT-PCR 및 qPCR 또는 ddPCR, 및 5) RNA 단리를 수행하지 않고 생물학적 샘플로부터 RNA 분자의 추출-유리 miRNA 프로파일링 및 대상체로부터의 생물학적 샘플의 miRNA 프로파일 결정.
일부 실시양태에서, miRNA 프로파일을 결정하는 것은 인간 게놈 또는 인간 전사체 데이터베이스의 일부인 참조 핵산 서열의 사용을 포함한다.
일부 실시양태에서, miRNA 프로파일을 결정하는 것은 발현된 miRNA의 카운트 표를 생성하는 것을 포함한다.
일부 실시양태에서, miRNA 프로파일을 결정하는 것은 차등적으로 풍부한 miRNA를 식별하기 위해 발현된 miRNA에 기초하여 표준화된 카운트 표를 생성하는 것을 포함한다.
일부 실시양태에서, miRNA 프로파일은 결장 세포 증식성 장애와 관련되며, 결장 세포 증식성 장애를 갖거나 결장 세포 증식성 장애를 갖지 않는 것으로서 대상체의 분류를 제공한다.
일부 실시양태에서, 대상체로부터의 생물학적 샘플은 체액, 대변, 결장 유출물, 소변, 혈장, 혈청, 전혈, 단리된 혈액 세포, 혈액으로부터 단리된 세포, 및 이들의 조합으로 이루어진 군으로부터 선택된다.
일부 실시양태에서, 방법은 건강한 대상체로부터의 참조 miRNA 프로파일의 데이터베이스에 대해 miRNA 프로파일을 비교하는 단계; 및 참조 miRNA 프로파일에 비해 miRNA 프로파일의 miRNA 발현에서 적어도 5%, 적어도 10%, 적어도 15%, 적어도 20%, 적어도 25%, 적어도 30%, 적어도 35%, 적어도 40%, 적어도 45%, 또는 적어도 50%의 변화를 측정하는 것에 적어도 부분적으로 기초하여 대상체가 결장 세포 증식성 장애를 가질 증가된 위험도를 갖는지 결정하는 단계를 추가로 포함한다.
일부 실시양태에서, 방법은 건강한 대상체로부터의 참조 miRNA 프로파일의 데이터베이스에 대해 miRNA 프로파일을 비교하는 단계; 및 참조 miRNA 프로파일에 비해 miRNA 프로파일의 miRNA 발현에서 적어도 15%의 변화를 측정하는 것에 적어도 부분적으로 기초하여 대상체가 결장 세포 증식성 장애를 가질 증가된 위험도를 갖는지 결정하는 단계를 추가로 포함한다.
일부 실시양태에서, 결장 세포 증식성 장애는 선종(선종성 용종), 무경성 거치상 선종(SSA), 진행성 선종, 결장직장 이형성증, 결장직장 선종, 결장직장암, 결장암, 직장암, 결장직장 암종, 결장직장 선암종, 카르시노이드 종양, 위장 카르시노이드 종양, 위장 기질 종양(GIST), 림프종, 및 육종으로 이루어진 군으로부터 선택된다.
일부 실시양태에서, 결장 세포 증식성 장애는 1기 결장직장암, 2기 결장직장암, 3기 결장직장암, 및 4기 결장직장암으로 이루어진 군으로부터 선택된다.
일부 실시양태에서, 진행성 선종은 관상 선종, 관융모 선종, 융모 선종, 선암종, 또는 과형성 용종을 포함한다.
또 다른 측면에서, 본 개시는 대상체에서 결장 세포 증식성 장애의 존재 또는 부재를 검출하기 위한 방법으로서, a) 생물학적 샘플로부터 리보핵산(RNA) 분자를 단리하는 단계; b) RNA 분자를 상보적 데옥시리보핵산(cDNA) 분자로 역전사시키기 전 또는 후에, RNA 분자에 RNA 어댑터를 결찰하는 단계; c) cDNA 분자를 증폭시키는 단계; d) cDNA 분자의 핵산 서열을 결정하는 단계; e) 표 1-11에 열거된 군으로부터 선택된 miRNA의 미리 식별된 패널에 대한 참조 핵산 서열에 핵산 서열을 정렬하는 단계; f) 정렬된 핵산 서열에 적어도 부분적으로 기초하여 miRNA 프로파일을 결정하는 단계; 및 g) 건강한 대상체와 결장 세포 증식성 장애가 있는 대상체를 구별할 수 있도록 훈련된 기계 학습 모델을 사용하여 miRNA 프로파일을 컴퓨터 처리하여 결장 세포 증식성 장애의 존재 또는 부재와 관련된 출력 값을 제공함으로써, 대상체에서 결장 세포 증식성 장애의 존재 또는 부재를 지시하는 단계를 포함하는, 방법을 제공한다.
일부 실시양태에서, b)는 샘플-특이적 바코드 및/또는 분자-특이적 고유 분자 식별자(UMI)를 혼입시키는 것을 포함한다.
일부 실시양태에서, 미리 선택된 miRNA는 표 1-11에 열거된 군으로부터 선택된 적어도 1 개, 적어도 2 개, 적어도 3 개, 적어도 4 개, 적어도 5 개, 적어도 6 개, 적어도 7 개, 적어도 8 개, 적어도 9 개, 적어도 10 개, 적어도 11 개, 적어도 12 개, 적어도 13 개, 적어도 14 개, 적어도 15 개, 적어도 16 개, 적어도 17 개, 적어도 18 개, 적어도 19 개, 적어도 20 개, 적어도 21 개, 적어도 22 개, 적어도 23 개, 적어도 24 개, 적어도 25 개, 적어도 26 개, 적어도 27 개, 적어도 28 개, 적어도 29 개, 적어도 30 개, 적어도 40 개, 적어도 50 개, 적어도 60 개, 적어도 70 개, 적어도 80 개, 적어도 90 개, 적어도 100 개, 적어도 110 개, 적어도 120 개, 적어도 130 개, 적어도 140 개, 적어도 150 개, 적어도 160 개, 적어도 170 개, 적어도 180 개, 적어도 190 개, 적어도 200 개, 또는 적어도 250 개의 miRNA를 포함한다.
일부 실시양태에서, 결장 세포 증식성 장애는 선종(선종성 용종), 무경성 거치상 선종(SSA), 진행성 선종, 결장직장 이형성증, 결장직장 선종, 결장직장암, 결장암, 직장암, 결장직장 암종, 결장직장 선암종, 카르시노이드 종양, 위장 카르시노이드 종양, 위장 기질 종양(GIST), 림프종, 및 육종으로 이루어진 군으로부터 선택된다.
일부 실시양태에서, 참조 핵산 서열은 인간 게놈 또는 인간 전사체 데이터베이스의 일부이다.
일부 실시양태에서, 대상체의 miRNA 프로파일을 결정하는 것은 발현된 miRNA의 카운트 표를 생성하는 것을 포함한다.
일부 실시양태에서, 대상체의 miRNA 프로파일을 결정하는 것은 차등적으로 풍부한 miRNA를 식별하기 위해 발현된 miRNA의 카운트 표를 생성하는 것을 포함한다.
일부 실시양태에서, 대상체로부터의 생물학적 샘플은 체액, 대변, 결장 유출물, 소변, 혈장, 혈청, 전혈, 단리된 혈액 세포, 혈액으로부터 단리된 세포, 및 이들의 조합으로 이루어진 군으로부터 선택된다.
일부 실시양태에서, 방법은 건강한 대상체로부터의 참조 miRNA 프로파일의 데이터베이스에 대해 miRNA 프로파일을 비교하는 단계; 및 참조 miRNA 프로파일에 비해 miRNA 프로파일의 miRNA 발현에서 적어도 5%, 적어도 10%, 적어도 15%, 적어도 20%, 적어도 25%, 적어도 30%, 적어도 35%, 적어도 40%, 적어도 45%, 또는 적어도 50%의 변화를 측정하는 것에 적어도 부분적으로 기초하여 대상체가 결장 세포 증식성 장애를 가질 증가된 위험도를 갖는지 결정하는 단계를 추가로 포함한다.
일부 실시양태에서, 방법은 건강한 대상체로부터의 참조 miRNA 프로파일의 데이터베이스에 대해 miRNA 프로파일을 비교하는 단계; 및 참조 miRNA 프로파일에 비해 miRNA 프로파일의 miRNA 발현에서 적어도 15%의 변화를 측정하는 것에 적어도 부분적으로 기초하여 대상체가 결장 세포 증식성 장애를 가질 증가된 위험도를 갖는지 결정하는 단계를 추가로 포함한다.
일부 실시양태에서, 결장 세포 증식성 장애는 선종(선종성 용종), 무경성 거치상 선종(SSA), 진행성 선종, 결장직장 이형성증, 결장직장 선종, 결장직장암, 결장암, 직장암, 결장직장 암종, 결장직장 선암종, 카르시노이드 종양, 위장 카르시노이드 종양, 위장 기질 종양(GIST), 림프종, 및 육종으로 이루어진 군으로부터 선택된다.
일부 실시양태에서, 결장 세포 증식성 장애는 1기 결장직장암, 2기 결장직장암, 3기 결장직장암, 및 4기 결장직장암으로 이루어진 군으로부터 선택된다.
또 다른 측면에서, 본 개시는 대상체로부터의 생물학적 샘플의 miRNA 프로파일을 결정하기 위한 방법으로서, a) 생물학적 샘플로부터 리보핵산(RNA) 분자를 단리하는 단계; b) RNA 분자를 상보적 데옥시리보핵산(cDNA) 분자로 역전사시키는 단계; c) RNA 분자 또는 cDNA 분자에 RNA 어댑터를 결찰하는 단계; d) cDNA 분자를 증폭시키는 단계; e) cDNA 분자의 핵산 서열을 결정하는 단계; f) 표 1-11에 열거된 군으로부터 선택된 miRNA의 패널에 대한 참조 핵산 서열에 핵산 서열을 정렬하는 단계; 및 g) 정렬된 핵산 서열에 적어도 부분적으로 기초하여 miRNA 프로파일을 결정하는 단계를 포함하는, 방법을 제공한다.
일부 실시양태에서, 미리 선택된 miRNA는 표 1-11에 열거된 군으로부터 선택된 적어도 1 개, 적어도 2 개, 적어도 3 개, 적어도 4 개, 적어도 5 개, 적어도 6 개, 적어도 7 개, 적어도 8 개, 적어도 9 개, 적어도 10 개, 적어도 11 개, 적어도 12 개, 적어도 13 개, 적어도 14 개, 적어도 15 개, 적어도 16 개, 적어도 17 개, 적어도 18 개, 적어도 19 개, 적어도 20 개, 적어도 21 개, 적어도 22 개, 적어도 23 개, 적어도 24 개, 적어도 25 개, 적어도 26 개, 적어도 27 개, 적어도 28 개, 적어도 29 개, 적어도 30 개, 적어도 40 개, 적어도 50 개, 적어도 60 개, 적어도 70 개, 적어도 80 개, 적어도 90 개, 적어도 100 개, 적어도 110 개, 적어도 120 개, 적어도 130 개, 적어도 140 개, 적어도 150 개, 적어도 160 개, 적어도 170 개, 적어도 180 개, 적어도 190 개, 적어도 200 개, 또는 적어도 250 개의 miRNA를 포함한다.
일부 실시양태에서, 방법은 검출된 결장 세포 증식성 장애에 기초하여 대상체에 대해 치료를 수행하는 단계를 추가로 포함한다. 일부 실시양태에서, 치료는 화학요법, 방사선요법, 면역요법, 또는 수술을 포함한다.
또 다른 측면에서, 본 개시는 대상체에서 결장 세포 증식성 장애의 존재 또는 부재를 검출하기 위한 방법으로서, a) 생물학적 샘플로부터 리보핵산(RNA) 분자를 단리하는 단계; b) RNA 분자를 상보적 데옥시리보핵산(cDNA) 분자로 역전사시키는 단계; c) RNA 분자 또는 cDNA 분자에 RNA 어댑터를 결찰하는 단계; d) cDNA 분자를 증폭시키는 단계; e) cDNA 분자의 핵산 서열을 결정하는 단계; f) 표 1-11에 열거된 군으로부터 선택된 miRNA의 패널에 대한 참조 핵산 서열에 핵산 서열을 정렬하는 단계; g) 정렬된 핵산 서열에 적어도 부분적으로 기초하여 miRNA 프로파일을 결정하는 단계; h) 결장 세포 증식성 장애를 갖지 않는 대상체와 결장 세포 증식성 장애를 갖는 대상체를 구별하도록 훈련된 기계 학습 모델을 사용하여 miRNA 프로파일을 컴퓨터 처리하는 단계; 및 i) 기계 학습 모델에 의해 결장 세포 증식성 장애를 갖는 대상체 또는 결장 세포 증식성 장애를 갖지 않는 대상체와 관련된 값을 출력하여 대상체에서 결장 세포 증식성 장애의 존재 또는 부재를 검출하는 단계를 포함하는, 방법을 제공한다.
일부 실시양태에서, 미리 선택된 miRNA는 표 1-11에 열거된 군으로부터 선택된 적어도 1 개, 적어도 2 개, 적어도 3 개, 적어도 4 개, 적어도 5 개, 적어도 6 개, 적어도 7 개, 적어도 8 개, 적어도 9 개, 적어도 10 개, 적어도 11 개, 적어도 12 개, 적어도 13 개, 적어도 14 개, 적어도 15 개, 적어도 16 개, 적어도 17 개, 적어도 18 개, 적어도 19 개, 적어도 20 개, 적어도 21 개, 적어도 22 개, 적어도 23 개, 적어도 24 개, 적어도 25 개, 적어도 26 개, 적어도 27 개, 적어도 28 개, 적어도 29 개, 적어도 30 개, 적어도 40 개, 적어도 50 개, 적어도 60 개, 적어도 70 개, 적어도 80 개, 적어도 90 개, 적어도 100 개, 적어도 110 개, 적어도 120 개, 적어도 130 개, 적어도 140 개, 적어도 150 개, 적어도 160 개, 적어도 170 개, 적어도 180 개, 적어도 190 개, 적어도 200 개, 또는 적어도 250 개의 miRNA를 포함한다.
일부 실시양태에서, 결장 세포 증식성 장애는 선종(선종성 용종), 무경성 거치상 선종(SSA), 진행성 선종, 결장직장 이형성증, 결장직장 선종, 결장직장암, 결장암, 직장암, 결장직장 암종, 결장직장 선암종, 카르시노이드 종양, 위장 카르시노이드 종양, 위장 기질 종양(GIST), 림프종, 및 육종으로 이루어진 군으로부터 선택된다.
일부 실시양태에서, 방법은 검출된 결장 세포 증식성 장애에 기초하여 대상체에 대해 치료를 수행하는 단계를 추가로 포함한다. 일부 실시양태에서, 치료는 화학요법, 방사선요법, 면역요법, 또는 수술을 포함한다.
또 다른 측면에서, 본 개시는 질환에 대해 이전에 치료된 대상체에서 최소 잔존 질환을 모니터링하기 위한 방법으로서, 표 1-11에 열거된 군으로부터 선택된 miRNA의 패널을 사용하여 대상체로부터 생물학적 샘플의 마이크로 리보핵산(miRNA) 프로파일을 결정함으로써 기준선 miRNA 상태를 생성하는 단계; 기준선 miRNA 상태의 생성 후 하나 이상의 시점에 대상체로부터 얻어진 생물학적 샘플의 miRNA 프로파일을 결정함으로써 현재 miRNA 상태를 생성하는 단계; 및 기준선 miRNA 상태와 현재 miRNA 상태 사이의 차이를 결정함으로써, 대상체에서 최소 잔존 질환의 변화를 검출하는 단계를 포함하는, 방법을 제공한다.
일부 실시양태에서, 최소 잔존 질환은 치료에 대한 반응, 종양 부하, 수술 후 잔존 종양, 재발, 이차 스크린, 일차 스크린, 및 암 진행으로 이루어진 군으로부터 선택된다. 일부 실시양태에서, 방법은 대상체에서 최소 잔존 질환의 검출된 변화에 기초하여 대상체에 대해 치료를 수행하는 단계를 추가로 포함한다. 일부 실시양태에서, 치료는 화학요법, 방사선요법, 면역요법, 또는 수술을 포함한다.
또 다른 측면에서, 치료에 대한 대상체의 반응을 결정하기 위한 방법으로서, 표 1-11에 열거된 군으로부터 선택된 miRNA의 패널을 사용하여 대상체로부터 생물학적 샘플의 마이크로 리보핵산(miRNA) 프로파일을 결정함으로써 기준선 miRNA 상태를 생성하는 단계; 기준선 miRNA 상태의 생성 후 하나 이상의 시점에 대상체로부터 얻어진 생물학적 샘플의 miRNA 프로파일을 결정함으로써 현재 miRNA 상태를 생성하는 단계; 및 기준선 miRNA 상태와 현재 miRNA 상태 사이의 차이를 결정함으로써, 치료에 대한 대상체의 반응을 결정하는 단계를 포함하는, 방법이 제공된다. 일부 실시양태에서, 방법은 치료에 대한 대상체의 반응에 대한 결정에 기초하여 대상체에 대해 치료를 수행하는 단계를 추가로 포함한다. 일부 실시양태에서, 치료는 화학요법, 방사선요법, 면역요법, 또는 수술을 포함한다.
또 다른 측면에서, 대상체의 종양 부하를 모니터링하기 위한 방법으로서, 표 1-11에 열거된 군으로부터 선택된 miRNA의 패널을 사용하여 대상체로부터 생물학적 샘플의 마이크로 리보핵산(miRNA) 프로파일을 결정함으로써 기준선 miRNA 상태를 생성하는 단계; 기준선 miRNA 상태의 생성 후 하나 이상의 시점에 대상체로부터 얻어진 생물학적 샘플의 miRNA 프로파일을 결정함으로써 현재 miRNA 상태를 생성하는 단계; 및 기준선 miRNA 상태와 현재 miRNA 상태 사이의 차이를 결정함으로써, 대상체의 종양 부하를 모니터링하는 단계를 포함하는, 방법이 제공된다. 일부 실시양태에서, 방법은 대상체의 종양 부하에 기초하여 대상체에 대해 치료를 수행하는 단계를 추가로 포함한다. 일부 실시양태에서, 치료는 화학요법, 방사선요법, 면역요법, 또는 수술을 포함한다.
또 다른 측면에서, 대상체의 수술 후 잔존 종양을 검출하기 위한 방법으로서, 표 1-11에 열거된 군으로부터 선택된 miRNA의 패널을 사용하여 대상체로부터 생물학적 샘플의 마이크로 리보핵산(miRNA) 프로파일을 결정함으로써 기준선 miRNA 상태를 생성하는 단계; 기준선 miRNA 상태의 생성 후 하나 이상의 시점에 대상체로부터 얻어진 생물학적 샘플의 miRNA 프로파일을 결정함으로써 현재 miRNA 상태를 생성하는 단계; 및 기준선 miRNA 상태와 현재 miRNA 상태 사이의 차이를 결정함으로써, 대상체의 수술 후 잔존 종양을 검출하는 단계를 포함하는, 방법이 제공된다. 일부 실시양태에서, 방법은 대상체의 수술 후 잔존 종양에 기초하여 대상체에 대해 치료를 수행하는 단계를 추가로 포함한다. 일부 실시양태에서, 치료는 화학요법, 방사선요법, 면역요법, 또는 수술을 포함한다.
또 다른 측면에서, 대상체의 재발을 검출하기 위한 방법으로서, 표 1-11에 열거된 군으로부터 선택된 miRNA의 패널을 사용하여 대상체로부터 생물학적 샘플의 마이크로 리보핵산(miRNA) 프로파일을 결정함으로써 기준선 miRNA 상태를 생성하는 단계; 기준선 miRNA 상태의 생성 후 하나 이상의 시점에 대상체로부터 얻어진 생물학적 샘플의 miRNA 프로파일을 결정함으로써 현재 miRNA 상태를 생성하는 단계; 및 기준선 miRNA 상태와 현재 miRNA 상태 사이의 차이를 결정함으로써, 대상체의 재발을 검출하는 단계를 포함하는, 방법이 제공된다. 일부 실시양태에서, 방법은 대상체의 재발의 검출에 기초하여 대상체에 대해 치료를 수행하는 단계를 추가로 포함한다. 일부 실시양태에서, 치료는 화학요법, 방사선요법, 면역요법, 또는 수술을 포함한다.
또 다른 측면에서, 대상체의 miRNA 프로파일에 적어도 부분적으로 기초하여 이차 스크린을 수행하기 위한 방법이 제공된다.
또 다른 측면에서, 대상체의 miRNA 프로파일에 적어도 부분적으로 기초하여 일차 스크린을 수행하기 위한 방법이 제공된다.
또 다른 측면에서, 대상체의 암 진행을 모니터링하기 위한 방법으로서, 표 1-11에 열거된 군으로부터 선택된 miRNA의 패널을 사용하여 대상체로부터 생물학적 샘플의 마이크로 리보핵산(miRNA) 프로파일을 결정함으로써 기준선 miRNA 상태를 생성하는 단계; 기준선 miRNA 상태의 생성 후 하나 이상의 시점에 대상체로부터 얻어진 생물학적 샘플의 miRNA 프로파일을 결정함으로써 현재 miRNA 상태를 생성하는 단계; 및 기준선 miRNA 상태와 현재 miRNA 상태 사이의 차이를 결정함으로써, 대상체의 암 진행을 모니터링하는 단계를 포함하는, 방법이 제공된다. 일부 실시양태에서, 방법은 대상체의 암 진행에 기초하여 대상체에 대해 치료를 수행하는 단계를 추가로 포함한다. 일부 실시양태에서, 치료는 화학요법, 방사선요법, 면역요법, 또는 수술을 포함한다.
일부 실시양태에서, miRNA 프로파일은 적어도 약 40%의 민감도에서 대상체에서 결장직장암의 존재 또는 감수성의 지표이다. 일부 실시양태에서, miRNA 프로파일은 적어도 약 50%의 민감도에서 대상체에서 결장직장암의 존재 또는 감수성의 지표이다. 일부 실시양태에서, miRNA 프로파일은 적어도 약 60%의 민감도에서 대상체에서 결장직장암의 존재 또는 감수성의 지표이다. 일부 실시양태에서, miRNA 프로파일은 적어도 약 70%의 민감도에서 대상체에서 결장직장암의 존재 또는 감수의 지표이다. 일부 실시양태에서, miRNA 프로파일은 적어도 약 80%의 민감도에서 대상체에서 결장직장암의 존재 또는 감수성의 지표이다. 일부 실시양태에서, miRNA 프로파일은 적어도 약 90%의 민감도에서 대상체에서 결장직장암의 존재 또는 감수성의 지표이다. 일부 실시양태에서, miRNA 프로파일은 적어도 약 95%의 민감도에서 대상체에서 결장직장암의 존재 또는 감수성의 지표이다.
일부 실시양태에서, miRNA 프로파일은 적어도 약 30%의 양성 예측 값(PPV)에서 대상체에서 결장직장암의 존재 또는 감수성의 지표이다. 일부 실시양태에서, miRNA 프로파일은 적어도 약 40%의 양성 예측 값(PPV)에서 결장직장암의 존재 또는 감수성의 지표이다. 일부 실시양태에서, miRNA 프로파일은 적어도 약 50%의 양성 예측 값(PPV)에서 결장직장암의 존재 또는 감수성의 지표이다. 일부 실시양태에서, miRNA 프로파일은 적어도 약 60%의 양성 예측 값(PPV)에서 결장직장암의 존재 또는 감수성의 지표이다. 일부 실시양태에서, miRNA 프로파일은 적어도 약 70%의 양성 예측 값(PPV)에서 결장직장암의 존재 또는 감수성의 지표이다. 일부 실시양태에서, miRNA 프로파일은 적어도 약 80%의 양성 예측 값(PPV)에서 결장직장암의 존재 또는 감수성의 지표이다. 일부 실시양태에서, miRNA 프로파일은 적어도 약 90%의 양성 예측 값(PPV)에서 결장직장암의 존재 또는 감수성의 지표이다. 일부 실시양태에서, miRNA 프로파일은 적어도 약 95%의 양성 예측 값(PPV)에서 결장직장암의 존재 또는 감수성의 지표이다. 일부 실시양태에서, miRNA 프로파일은 적어도 약 99%의 양성 예측 값(PPV)에서 결장직장암의 존재 또는 감수성의 지표이다.
일부 실시양태에서, miRNA 프로파일은 적어도 약 40%의 음성 예측 값(NPV)에서 결장직장암의 존재 또는 감수성의 지표이다. 일부 실시양태에서, miRNA 프로파일은 적어도 약 50%의 음성 예측 값(NPV)에서 결장직장암의 존재 또는 감수성의 지표이다. 일부 실시양태에서, miRNA 프로파일은 적어도 약 60%의 음성 예측 값(NPV)에서 결장직장암의 존재 또는 감수성의 지표이다. 일부 실시양태에서, miRNA 프로파일은 적어도 약 70%의 음성 예측 값(NPV)에서 결장직장암의 존재 또는 감수성의 지표이다. 일부 실시양태에서, miRNA 프로파일은 적어도 약 80%의 음성 예측 값(NPV)에서 결장직장암의 존재 또는 감수성의 지표이다. 일부 실시양태에서, miRNA 프로파일은 적어도 약 90%의 음성 예측 값(NPV)에서 결장직장암의 존재 또는 감수성의 지표이다. 일부 실시양태에서, miRNA 프로파일은 적어도 약 95%의 음성 예측 값(NPV)에서 결장직장암의 존재 또는 감수성의 지표이다. 일부 실시양태에서, miRNA 프로파일은 적어도 약 99%의 음성 예측 값(NPV)에서 결장직장암의 존재 또는 감수성의 지표이다.
일부 실시양태에서, 훈련된 알고리즘은 적어도 약 0.50의 곡선하 면적(AUC)으로 대상체의 결장직장암의 존재 또는 감수성을 결정한다. 일부 실시양태에서, 훈련된 알고리즘은 적어도 약 0.60의 곡선하 면적(AUC)으로 대상체의 결장직장암의 존재 또는 감수성을 결정한다. 일부 실시양태에서, 훈련된 알고리즘은 적어도 약 0.70의 곡선하 면적(AUC)으로 대상체의 결장직장암의 존재 또는 감수성을 결정한다. 일부 실시양태에서, 훈련된 알고리즘은 적어도 약 0.80의 곡선하 면적(AUC)으로 대상체의 결장직장암의 존재 또는 감수성을 결정한다. 일부 실시양태에서, 훈련된 알고리즘은 적어도 약 0.90의 곡선하 면적(AUC)으로 대상체의 결장직장암의 존재 또는 감수성을 결정한다. 일부 실시양태에서, 훈련된 알고리즘은 적어도 약 0.95의 곡선하 면적(AUC)으로 대상체의 결장직장암의 존재 또는 감수성을 결정한다. 일부 실시양태에서, 훈련된 알고리즘은 적어도 약 0.99의 곡선하 면적(AUC)으로 대상체의 결장직장암의 존재 또는 감수성을 결정한다.
일부 실시양태에서, 방법은 사용자의 전자 디바이스의 보고서 또는 그래픽 사용자 인터페이스를 제시하는 단계를 추가로 포함한다. 일부 실시양태에서, 사용자는 대상체, 개체, 또는 환자이다.
일부 실시양태에서, 방법은 대상체, 개체, 또는 환자에서 결장직장암의 존재 또는 감수성의 결정 가능성을 결정하는 단계를 추가로 포함한다.
일부 실시양태에서, 훈련된 알고리즘(예를 들어, 기계 학습 모델 또는 분류기)은 지도 기계 학습 알고리즘을 포함한다. 일부 실시양태에서, 지도 기계 학습 알고리즘은 심화 학습 알고리즘, 서포트 벡터 머신(SVM), 신경망, 또는 랜덤 포레스트를 포함한다.
일부 실시양태에서, 방법은 대상체에게 적어도 부분적으로 miRNA 프로파일 또는 분석에 기초한 치료적 개입, 예컨대, 결장직장암을 갖는 환자를 치료하기 위한 치료적 개입(예를 들어, 화학요법, 방사선요법, 면역요법, 또는 수술)을 제공하는 단계를 추가로 포함한다.
일부 실시양태에서, 방법은 결장직장암의 존재 또는 감수성을 모니터링하는 단계를 추가로 포함하고, 여기서 모니터링은 복수의 시점에서 상기 대상체의 결장직장암의 존재 또는 감수성을 평가하는 것을 포함하고, 평가는 적어도 복수의 시점 각각에서 결정된 결장직장암의 존재 또는 감수성에 기초한다.
일부 실시양태에서, 복수의 시점에 대상체의 결장직장암의 존재 또는 감수성의 평가에서의 차이는 (i) 대상체의 결장직장암의 존재 또는 감수성의 진단, (ii) 대상체의 결장직장암의 존재 또는 감수성의 예후, 및 (iii) 대상체의 결장직장암의 존재 또는 감수성을 치료하기 위한 치료 과정의 효능 또는 비-효능으로 이루어진 군으로부터 선택되는 하나 이상의 임상 지표를 지시한다.
일부 실시양태에서, 방법은 훈련된 알고리즘을 사용하여 대상체의 결장직장암을 계층화하여 결장직장암의 복수의 별개의 아형 또는 병기 중에서 대상체의 결장직장암의 아형을 결정하는 단계를 추가로 포함한다.
본 개시의 또 다른 양태는 표 1-11에 열거된 군으로부터 선택된 6 개 이상의 miRNA에서 차등 miRNA 존재비를 나타내는 측정된 값의 세트를 포함하는, 결장 세포 증식성 장애를 갖지 않는 대상체로부터 결장 세포 증식성 장애를 갖는 대상체의 집단을 구별하는 분류기로서, 측정된 값은 결장 세포 증식성 장애를 갖지 않는 대상체 및 결장 세포 증식성 장애를 갖는 대상체로부터의 miRNA 발현 데이터로부터 얻어지고, 측정된 값은 차등 miRNA 존재비의 성질에 상응하는 피처의 세트를 생성하는 데 사용되고, 피처는 기계 학습 모델 또는 통계 모델로 도입되고, 기계 학습 또는 통계 모델은 결장 세포 증식성 장애를 갖지 않는 대상체의 집단을 결장 세포 증식성 장애를 갖는 대상체로부터 구별할 수 있는 분류기로서 유용한 피처 벡터를 제공하는, 분류기를 제공한다.
본 개시의 또 다른 양태는, 하나 이상의 컴퓨터 프로세서에 의한 실행 시, 상기 또는 본원의 다른 곳에서 임의의 방법을 구현하는 기계 실행 가능 코드를 포함하는 비일시적 컴퓨터 판독 가능 매체를 제공한다.
본 개시의 또 다른 양태는 하나 이상의 컴퓨터 프로세서 및 이에 연결된 컴퓨터 메모리를 포함하는 시스템을 제공한다. 컴퓨터 메모리는, 하나 이상의 컴퓨터 프로세서에 의한 실행 시, 상기 또는 본원의 다른 곳에서 임의의 방법을 구현하는 기계 실행 가능 코드를 포함한다.
본 개시의 또 다른 양태는 a) 기계 학습 모델을 사용하여 miRNA 시그니처 패널에 기초하여 결장 세포 증식성 장애를 갖지 않는 대상체로부터 결장 세포 증식성 장애를 갖는 대상체의 집단을 구별하기 위한 분류기를 포함하는 컴퓨터-판독 가능 매체; 및 b) 컴퓨터-판독 가능 매체에 저장된 명령어를 실행하기 위한 하나 이상의 프로세서를 포함하는 시스템을 제공한다.
참조에 의한 포함
본 명세서에 언급된 모든 간행물, 특허 및 특허 출원은 마치 각각의 개별 간행물, 특허 또는 특허 출원이 참조로 포함된다고 구체적이고 개별적으로 표시된 것과 동일한 정도로 본원에 참조로 포함된다. 참조로 포함되는 간행물 및 특허 또는 특허 출원이 명세서에 포함된 본 개시와 모순되는 경우, 명세서는 임의의 이러한 모순되는 자료를 대체하고/대체하거나 그에 우선하는 것으로 의도된다.
본 개시의 예는 이제 단지 예로서 첨부된 도면을 참조하여 설명될 것이다. 본 발명의 신규한 특징은 첨부된 청구범위에서 구체적으로 제시된다. 본 발명의 특징 및 이점에 대한 더 나은 이해는 본 발명의 원리가 활용되는 예시적인 실시양태를 제시하는 다음의 상세한 설명, 및 첨부 도면(본원에서 또한 "도면" 및 "도")을 참고로 하여 얻어질 것이다:
도 1은 본원에 제공된 방법을 구현하도록 기계 학습 모델 및 분류기로 프로그래밍되거나 달리 구성된 컴퓨터 시스템의 개략도를 제공한다.
도 2는 피처 선택 동안 선택된 miRNA를 보여주는 히스토그램을 제공한다.
도 3은 가장 빈번하게 선택된 상위 10 개의 miRNA의 로지스틱 회귀 계수를 보여주는 그래프를 제공한다.
상세한 설명
본 발명의 다양한 실시양태가 본원에서 제시되고 설명되었지만, 이러한 실시양태는 단지 예로서 제공된다는 것이 관련 기술 분야의 통상의 기술자에게 명백할 것이다. 본 발명을 벗어나지 않으면서 관련 기술 분야의 통상의 기술자에 의해 수많은 변형, 변경 및 대체가 이루어질 수 있다. 본원에 기재된 본 발명의 실시양태에 대한 다양한 대안이 사용될 수 있음을 이해해야 한다.
암 스크리닝 및 조기 검출은 암에 대한 가장 효율적인 전략으로 간주되는데, 그 이유는 증상의 발병 전 조기에 악성종양 또는 전구체 병변을 검출하는 것이 치료가 가장 효과적인 시기이기 때문이다. 예를 들어, 결장직장암에서, 결장경검사는 조기 진단을 개선하는 역할을 한다. 결장경검사는 조기 검출에 유용하지만, 환자 순응도가 낮고, 스크리닝이 절차의 침습성으로 인해 권장되는 주기보다 덜 수행된다. 따라서, 비-침습적 방법은 조기 암 검출을 위한 보다 유망한 접근법을 제공한다.
본 개시는 결장 세포 증식성 장애(예를 들어, 결장직장암) 검출 및 질환 진행과 관련된 유전자의 마이크로 리보핵산(마이크로RNA, 또는 miRNA) 프로파일링에 관한 방법 및 시스템을 제공한다. 본 개시의 일부 실시양태는 결장 세포 증식성 장애를 갖지 않거나 결장 세포 증식성 장애가 발생할 낮은 위험도를 갖는 대상체의 상응하는 샘플과 비교하여, 결장 세포 증식성 장애를 갖거나 결장 세포 증식성 장애가 발병할 높은 위험도를 갖는 대상체의 샘플에서 차등적으로 풍부한 miRNA를 제공한다. 일부 실시양태에서, 결장 세포 증식성 장애가 발병할 높은 위험도를 갖는 대상체 및 결장 세포 증식성 장애가 발병할 낮은 위험도를 갖는 대상체 각각은 결장직장 점막 내에서 발생하는 비-침습성 전구체 병변(이하, 결장직장 병변)을 갖는다. 결장 세포 증식성 장애를 갖거나 결장 세포 증식성 장애가 발병할 높은 위험도를 갖는 대상체의 샘플에 상이한 존재비로 존재하는(종종 "차등 발현된"으로 지칭됨) miRNA는 결장 세포 증식성 장애의 진단, 치료, 및/또는 예방을 위한 바이오마커로서 사용될 수 있다.
본원에서 확인된 miRNA는 결장 세포 증식성 장애를 갖지 않는 대상체로부터 결장 세포 증식성 장애를 갖는 대상체와 구별하여 결장 세포 증식성 장애를 갖는 대상체를 식별하거나, 결장 세포 증식성 장애가 발병할 더 높은 위험도를 갖는 대상체를 결장 세포 증식성 장애가 발병할 더 낮은 위험도를 갖는 대상체와 구별하여 결장 세포 증식성 장애가 발병할 더 높은 위험도를 갖는 대상체를 식별하거나, 비-IPMN 대비 결장 세포 증식성 장애 전구체(예컨대, 관내 유두 점액성 신생물(IPMN))를 갖는 대상체를 식별하거나, 양성 IPMN 대비 악성 IPMN을 갖는 대상체를 식별하기 위해 사용될 수 있다. 따라서, 이러한 miRNA는 결장 세포 증식성 장애의 모니터링, 치료, 및 관리에 관한 결정을 안내하기 위한 보조 도구로서 사용될 수 있다.
본 개시의 일부 실시양태는, 예를 들어, 대상체가 결장직장 병변을 갖는 경우, 결장 세포 증식성 장애를 갖거나 결장 세포 증식성 장애가 발병할 높은 위험도를 갖는 대상체의 샘플에서 차등 발현된 본원에 기재된 miRNA에 대하여 훈련된 기계 학습 모델 분류기를 제공한다. 일례에서, 조직학적 중증도를 평가하기 위해 결장직장 병변을 갖는 대상체에서 사용될 수 있는 혈액-기반 최소-침습적 miRNA 검정을 위한 방법이 제공된다. 또 다른 실시양태에서, 결장 세포 증식성 장애를 지시하는 miRNA는 대상체로부터의 무세포 샘플, 예를 들어, 대상체로부터의 체액 샘플, 예컨대, 전혈, 혈장, 또는 혈청에서 검출된다. 이와 같이, 본 개시는 결장 세포 증식성 장애, 외과적 절제, 면역요법, 방사선, 또는 화학요법과 같은 적절한 치료가 필요한 고위험 또는 저위험 결장직장 병변 및 모니터링될 수 있는 저위험 직장결장 병변의 존재 또는 부재를 구별하는 데 사용될 수 있는 miRNA를 제공한다. 결장 세포 증식성 장애 또는 병변의 존재의 모니터링 및 확인은, 예를 들어, 결장경검사, 초음파, MM, 또는 CT 스캔에 의해 수행될 수 있다.
본 개시는 일반적으로 암 검출 및 질환 모니터링에 관한 것이다. 보다 구체적으로, 이 분야는 조기 결장직장암에서 암-관련 마이크로RNA(miRNA) 검출 및 질환 모니터링에 관한 것이다. 구체적으로, 결장직장암(CRC) 및/또는 결장직장 선종(CA), 예를 들어, 진행성 결장직장 선종(AA)과 같은 결장 세포 증식성 장애를 갖거나 발병할 위험이 있는 인간 대상체를 식별하기 위한 순환하는 miRNA 시그니처 패널 및 이의 용도가 제공된다.
본 개시는 일반적으로 암 검출 및 질환 모니터링에 관한 것이다. 본 개시는, 예를 들어, 대상체가 결장직장 병변을 가질 때 결장 세포 증식성 장애의 존재, 또는 결장 세포 증식성 장애가 발병할 높은 위험을 지시하는 대상체에서 miRNA를 식별한다. 암 스크리닝 및 모니터링은 조기 검출이 암의 성장 및 확산 전에 제거를 가능하게 하기 때문에 생존 결과를 향상시킨다. 예를 들어, 결장직장암에서, 결장경검사는 조기 진단을 개선하는 역할을 한다. 불행히도, 환자 순응도가 낮고, 스크리닝이 절차의 침습성으로 인해 권장되는 주기보다 덜 수행된다.
상기 질환을 앓고 있는 대상체에서 상향-조절되거나 과다-발현되는 miRNA의 발현 프로파일 또는 존재비에 기초하여 결장 세포 증식성 장애를 앓을 위험이 있는 대상체를 스크리닝 또는 식별하는 방법이 본원에 기재된다. 추가로, 대상체, 예를 들어, 인간 대상체에서 결장 세포 증식성 장애의 진단에 유용한 데이터를 얻기 위한 방법이 본원에 기재된다. 결장 세포 증식성 장애의 비-제한적인 예는 결장직장암, 결장직장 선종, 또는 진행성 결장직장 선종을 포함한다.
본원에서 사용되는 용어 "결장 세포 증식성 장애가 발병할 높은 위험도"는 결장 세포 증식성 장애가를 갖지 않거나 가까운 장래에 결장 세포 증식성 장애가 발생할 낮은 위험도를 갖는 대상체와 비교하여 가까운 장래에 결장 세포 증식성 장애가 발병할 증가된 위험도를 갖는 대상체를 지칭한다. 본원에서 사용되는 용어 "가까운 장래"는 약 1 개월 내지 약 2년, 약 6 개월 내지 약 18 개월, 또는 약 1 년의 기간을 지칭한다.
결장 세포 증식성 장애는 임의의 종양 단계(예를 들어, TX, T0, Tis, T1, T2, T3, T4); 임의의 국소 림프절 또는 원격 전이 단계(예를 들어, NX, N0, N1, M0, M1); 임의의 병기(예를 들어, 0 기(Tis, N0, M0), IA 기(T1, N0, M0), IIA 기(T3, N0, M0), IIB 기(T1-3, N1, M0), III 기(T4, 임의의 N, M0), 또는 IV 기(임의의 T, 임의의 N, M1)); 절제 가능; 국소 진행성(절제불가); 또는 전이성일 수 있다.
현재의 스크리닝 도구는 위양성 및 위음성 결과로 인해 이상적인 특이성 및 민감도에 이르지 못하는 문제에 직면할 수 있다. 이상적인 암 스크리닝 도구는 불필요한 조사를 최소화하지만(낮은 가양성) 대다수의 암을 검출하는(낮은 가음성) 높은 양성 예측 값(PPV)을 가질 수 있다. 또 다른 주요 절충은 일반적으로 크기를 기준으로 종양을 검출하는 하한을 지칭하는 시험 민감도와 구별되는 "검출 민감도"이다. 종양이 검출 가능한 수준에서 순환 종양 마커를 방출하기에 충분히 큰 크기로 성장하도록 하는 것은 조기 검출 및 암 진행의 예방의 목적을 소용 없게 만든다. 따라서, 본 개시는 결장직장암의 조기 진단을 위한 매우 민감하고 효과적인 혈액-기반 스크린에 대한 요구를 다룬다.
또한, "액체 생검"으로도 지칭되는 순환 종양 DNA의 검출은 비-침습적 방식으로 종양의 검출 및 유익한 조사를 가능하게 할 수 있다. 이러한 액체 생검에서 종양 특이적 돌연변이의 식별은 결장암, 유방암, 및 전립선암을 진단하는 데 사용될 수 있다. 그러나, 순환 중에 존재하는 정상(예를 들어, 비-종양-유래) DNA의 높은 배경으로 인해, 이러한 기술은 민감도가 제한될 수 있다. 따라서, 위험 집단의 재발 스크리닝 및 일차 스크리닝을 위해 조기 또는 낮은 종양 부담 결장직장암 종양 마커를 검출하기 위한 보다 민감하고 특이적인 스크리닝 도구가 여전히 필요하다.
본 개시는 결장 세포 증식성 장애 및 이의 진행, 예를 들어, 결장직장암과 관련된 순환 miRNA를 프로파일링하는 것에 관한 방법 및 시스템을 제공한다. 결장 세포 증식성 장애의 존재 또는 결장 세포 증식성 장애가 발병할 높은 위험을 지시하는 그러한 miRNA는, 예를 들어, 대상체가 결장직장 병변만을 갖는 경우 결장 세포 증식성 장애의 진행을 가능한 한 빨리 진단, 치료 또는 예방하기 위해 사용될 수 있다. 또한, 대상체에서, 특히 대상체가 결장직장 병변을 갖는 경우, 결장 세포 증식성 장애를 진단하거나 결장 세포 증식성 장애가 발병할 위험도를 평가하기 위한 키트 및 방법이 본원에 제공된다.
miRNA는 일반적으로 식물 및 동물에서 발견되는 대략 18-22 개의 뉴클레오타이드의 작은 비-코딩 RNA를 지칭한다. miRNA는 3'-비번역 영역(3'-UTR)의 특정 부위에 결합하여 mRNA 표적을 전사 후 조절함으로써, 이들 mRNA 표적의 분해를 촉진하거나 번역을 억제할 수 있다. miRNA는 증식, 분화, 및 아폽토시스와 같은 다수의 생리학적 세포 기능에 기여할 수 있다. miRNA의 조절장애는 암에서 중요한 역할을 할 수 있는데, 그 이유는 miRNA가 종양유전자 및 종양 억제 유전자의 발현을 조절하기 때문이다. 무세포 miRNA(cfmiRNA), 순환 종양 세포(CTC), 순환 종양 DNA(ctDNA), 종양-교육화 혈소판(TEP), 및 세포외 소포(EV)는 질환 상태의 검출을 도울 수 있고, 질환 상태에 대한 관련 예후 및 예측 정보를 제공할 수 있다.
진핵생물 핵 DNA에 의해 인코딩된 miRNA는 mRNA 분자 내의 상보적 서열과의 염기-쌍형성을 통해 기능하여 일반적으로 번역 억제 또는 표적 분해를 통해 유전자 침묵화를 초래할 수 있다. miRNA는 프라이-miRNA로 불리는 큰 RNA 전구체로서 RNA 폴리머라제 II에 의해 전사된다. 프라이-miRNA는 핵에서 추가로 가공되어 프리-miRNA를 생산할 수 있다. 프리-miRNA는 길이가 약 70 개-뉴클레오타이드일 수 있고 불완전한 줄기-루프, 또는 "헤어핀" 구조로 폴딩된다. 이후, 프리-miRNA는 세포질로 내보내지고 추가 가공을 거쳐 성숙 miRNA를 생성할 수 있다. 샘플의 miRNA 프로파일은 샘플에서 다양한 miRNA의 발현 수준을 지시할 수 있다.
차등 발현된 miRNA는 참조 샘플(예를 들어, 대조 세포, 또는 세포 또는 무세포액 샘플, 또는 참조 발현 수준(참조 값)과 비교하여 조직 샘플의 시험 세포)에서의 발현 수준에 비해 샘플에서 과다-발현, 상향-조절, 과소-발현 또는 하향-조절된 miRNA일 수 있다. 참조 발현 수준은, 예를 들어, "정상" 상태(예를 들어, 질환이 결여됨) 또는 관련 집단(예를 들어, 역학적으로 관련된 집단)에서 상응하는 관심 질환 상태를 반영할 수 있다.
일부 실시양태에서, 샘플에서 miRNA가 대조 샘플에서 상응하는 miRNA 또는 참조 발현 수준보다 적어도 약 1.8배 더 높거나 더 낮게 발현되는 경우, miRNA는 "차등 발현된" 또는 "차등적으로 풍부한" 것으로 식별되거나, 샘플과 대조 샘플 또는 참조 발현 수준 사이의 발현 수준의 차이는 0.05 미만의 통계적 유의성(p 값)을 갖는다.
일부 실시양태에서, 샘플에서 miRNA가 대조 샘플 또는 참조 발현 샘플에서 상응하는 miRNA보다 약 2-배, 약 3-배, 약 4-배, 약 5-배, 또는 5-배 초과로 더 높거나 낮게 발현되는 경우, miRNA는 "차등 발현된" 또는 "차등적으로 풍부한" 것으로 식별된다. 일부 실시양태에서, 발현 수준은 이로 제한되지는 않지만, 예컨대, log2, 백만개 당 개수와 같은 참조 표준에 기초하여 표준화되거나, 합성 스파이크-인으로 표준화되거나, 하우스키핑 유전자로 표준화된다.
차등 발현된 miRNA는 샘플에 존재하지만 참조 샘플에서는 거의 관찰되지 않거나, 샘플에는 없지만 참조 샘플에서 흔히 발견되는 miRNA일 수 있다(예를 들어, 대조 세포, 또는 세포 또는 무세포액 샘플, 또는 참조 발현 수준(참조 값)와 비교하여 조직 샘플의 시험 세포).
일 측면에서, 질환 상태에 기초하여 대상체로부터 샘플을 구별하는 데 유용한 miRNA의 패널을 사용하는 방법이 본원에 제공된다. 다른 측면에서, miRNA의 패널을 사용하여 결장 세포 증식성 장애를 검출, 감별, 및 구별하기 위한 방법, 검정, 및 키트가 본원에 제공된다. 결장 세포 증식성 장애의 비-제한적인 예는 선암종, 선종, 용종, 편평 세포암, 카르시노이드 종양, 육종, 및 림프종을 포함한다.
일부 실시양태에서, 방법은 결장 세포 증식성 장애의 감별, 검출, 및 구별을 위한 마커로서 선택된 하나 이상의 miRNA의 사용을 포함한다.
I. 정의
명세서 및 청구항에서 사용되는 단수 형태인 부정관사 및 정관사는 달리 분명하게 표시되지 않는 한 복수의 대상을 포함한다. 예를 들어, 용어 "핵산"은 이들의 혼합물을 포함하는 복수의 핵산을 포함한다.
본원에서 사용되는 용어 "대상체"는 일반적으로 시험 가능하거나 검출 가능한 유전 정보를 갖는 엔터티 또는 매질을 지칭한다. 대상체는 사람, 개체 또는 환자일 수 있다. 대상체는 예를 들어, 포유동물과 같은 척추동물일 수 있다. 포유동물의 비-제한적인 예는 인간, 유인원, 농장 동물, 스포츠 동물, 설치류, 및 애완동물을 포함한다. 대상체는 암을 갖거나 암을 갖는 것으로 의심되는 사람일 수 있다. 대상체는 대상체의 건강, 생리학적 상태, 또는 병태, 예컨대, 대상체의 암 또는 다른 질환, 장애, 또는 병태를 지시하는 증상을 나타낼 수 있다. 대안으로서, 대상체는 이러한 건강 또는 생리학적 상태 또는 병태와 관련하여 무증상일 수 있다.
본원에서 사용되는 용어 "샘플"은 일반적으로 하나 이상의 대상체로부터 수득되거나 유래된 생물학적 샘플을 지칭한다. 생물학적 샘플은 무세포 생물학적 샘플 또는 실질적으로 무세포 생물학적 샘플일 수 있거나, 무세포 생물학적 샘플을 생산하도록 가공되거나 분획화될 수 있다. 예를 들어, 무세포 생물학적 샘플은 무세포 리보핵산(cfRNA), 무세포 데옥시리보핵산(cfDNA), 무세포 태아 DNA(cffDNA), 혈장, 혈청, 소변, 타액, 양수, 및 이의 유도체를 포함할 수 있다. 무세포 생물학적 샘플은 에틸렌디아민테트라아세트산(EDTA) 수집 튜브, 무세포 RNA 수집 튜브(예를 들어, Streck RNA Complete BCT), 또는 무세포 DNA 수집 튜브(예를 들어, Streck 무세포 DNA BCT)를 사용하여 대상체로부터 얻어지거나 유래될 수 있다. 무세포 생물학적 샘플은 분별(예를 들어, 차등 원심분리)에 의해 전혈 샘플로부터 유래될 수 있다. 생물학적 샘플 또는 이의 유도체는 세포를 함유할 수 있다. 예를 들어, 생물학적 샘플은 혈액 샘플 또는 이의 유도체(예를 들어, 수집 튜브에 의해 수집된 혈액 또는 혈액 방울)일 수 있다.
본원에서 사용되는 용어 "핵산"은 일반적으로 데옥시리보뉴클레오타이드(dNTP) 또는 리보뉴클레오타이드(rNTP), 또는 이들의 유사체인 임의의 길이의 뉴클레오타이드의 폴리머 형태를 지칭한다. 핵산은 임의의 3차원 구조를 가질 수 있고, 공지되거나 공지되지 않은 임의의 기능을 수행할 수 있다. 핵산의 비-제한적 예는 데옥시리보핵산(DNA), 리보핵산(RNA), 유전자 또는 유전자 단편의 코딩 또는 비코딩 영역, 연결 분석으로부터 정의된 유전자좌들(유전자좌), 엑손, 인트론, 메신저 RNA(mRNA), 운반 RNA(tRNA), 리보솜 RNA(rRNA), 짧은 간섭 RNA(siRNA), 짧은-헤어핀 RNA(shRNA), 마이크로-RNA(miRNA), 리보자임, cDNA, 재조합 핵산, 분지형 핵산, 플라스미드, 벡터, 임의의 서열의 단리된 DNA, 임의의 서열의 단리된 RNA, 핵산 프로브, 및 프라이머를 포함한다. 핵산은 메틸화된 뉴클레오타이드 및 뉴클레오타이드 유사체와 같은 하나 이상의 변형된 뉴클레오타이드를 포함할 수 있다. 존재하는 경우, 뉴클레오타이드 구조에 대한 변형은 핵산의 조립 전 또는 후에 이루어질 수 있다. 핵산의 뉴클레오타이드의 서열은 비-뉴클레오타이드 성분으로 중단될 수 있다. 핵산은 중합 후, 예컨대, 리포터 작용제와의 접합 또는 결합에 의해 추가로 변형될 수 있다.
본원에서 사용되는 용어 "표적 핵산"은 일반적으로 존재, 양, 또는 서열, 또는 이의 변화가 결정되는 것이 요망되는 뉴클레오타이드 서열을 갖는 핵산 분자의 집단 내의 핵산 분자를 지칭한다. 표적 핵산은 DNA, RNA, 및 이의 유사체를 포함하는 임의의 유형의 핵산일 수 있다. 본원에서 사용되는 "표적 리보핵산(RNA)"은 일반적으로 RNA인 표적 핵산을 지칭한다. 본원에서 사용되는 "표적 데옥시리보핵산(DNA)"은 일반적으로 DNA인 표적 핵산을 지칭한다.
본원에서 사용되는 용어 "증폭시키는" 및 "증폭"은 일반적으로 핵산 분자의 크기 또는 양을 증가시키는 것을 지칭한다. 핵산 분자는 단일-가닥 또는 이중-가닥일 수 있다. 증폭은 핵산 분자의 하나 이상의 카피 또는 "증폭된 산물"을 생성하는 것을 포함할 수 있다. 증폭은, 예를 들어, 신장(예를 들어, 프라이머 신장) 또는 결찰에 의해 수행될 수 있다. 증폭은 단일 가닥 핵산 분자에 상보적인 가닥을 생성하고 일부 경우 가닥의 하나 이상의 카피 및/또는 단일 가닥 핵산 분자를 생성하기 위해 프라이머 신장 반응을 수행하는 것을 포함할 수 있다. 용어 "DNA 증폭"은 일반적으로 DNA 분자의 하나 이상의 카피 또는 "증폭된 DNA 산물"을 생성하는 것을 지칭한다. 용어 "역전사 증폭"은 일반적으로 역전사 효소의 작용을 통해 리보핵산(RNA) 주형으로부터 데옥시리보핵산(DNA)의 생성을 지칭한다.
본원에서 사용되는 용어 "무세포 핵산" 또는 "cfNA"는 일반적으로 세포에 함유되지 않은 생물학적 샘플 내의 핵산을 지칭한다. cfNA의 비-제한적인 예는 무세포 RNA(cfRNA) 및 무세포 DNA(cfDNA)를 포함한다. cfNA는 혈류와 같이 체액에서 자유롭게 순환할 수 있다.
본원에서 사용되는 용어 "무세포 샘플"은 일반적으로 온전한 세포가 실질적으로 없는 생물학적 샘플을 지칭한다. 무세포 샘플은 그 자체에 세포가 실질적으로 없는 생물학적 샘플로부터 유래될 수 있거나, 세포가 제거된 샘플로부터 유래될 수 있다. 무세포 샘플의 비-제한적인 예는 혈액, 혈청, 혈장, 소변, 정액, 가래, 대변, 도관 삼출물, 림프, 및 회수된 세척액으로부터 유래된 것들을 포함한다.
본원에서 사용되는 용어 "순환하는 종양 DNA" 또는 "ctDNA"는 일반적으로 종양으로부터 유래한 cfDNA를 지칭한다.
본원에서 사용되는 용어 "결장 세포 증식성 장애"는 일반적으로 결장 또는 직장에서 세포의 장애가 있는 또는 비정상적 증식을 포함하는 장애 또는 질환을 지칭한다. 결장 세포 증식성 장애의 비-제한적 예는 선종(선종성 용종), 무경성 거치상 선종(SSA), 진행성 선종, 결장직장 이형성증, 결장직장 선종, 결장직장암, 결장암, 직장암, 결장직장 암종, 결장직장 선암종, 카르시노이드 종양, 위장 카르시노이드 종양, 위장 기질 종양(GIST), 림프종, 및 육종을 포함한다.
본원에서 사용되는 용어 "건강한"은 일반적으로 결장직장 세포 증식성 장애를 갖지 않는 대상체를 지칭한다. 건강은 동적 상태이지만, 본원에서 사용되는 용어는 특정 진술에서 언급되는 질환 상태가 없는 대상체의 병리학적 상태를 지칭한다. 일례에서, 결장직장암을 갖는 대상체를 분류할 수 있는 시그니처 패널을 언급할 때, 건강한 개체, 건강한 샘플, 또는 건강한 개체로부터의 샘플은 결장직장암(CRC), 진행성 선종(AA), 또는 양성 선종(NAA)이 없는 개체를 지칭한다. 다른 질환 또는 건강 상태가 대상체에 존재할 수 있지만, 본원에서 사용되는 용어 "건강한"은 논의되는 질환 상태를 갖는 대상체와 결여하는 대상체 사이의 비교 또는 분류 목적을 위해 언급된 질환의 결여를 나타낸다.
용어 "최소 잔존 질환" 또는 "MRD"는 일반적으로 암 치료 후 대상체의 신체에서 소수의 암 세포를 지칭한다. MRD 시험은 암 치료의 효과를 알아보고 추가 치료 계획을 안내하기 위해 수행될 수 있다.
본원에서 사용되는 용어 "스크리닝"은 일반적으로 진단되지 않은 결장직장암 또는 결장직장 선종을 앓고 있는 건강한 대상체 또는 상기 적응증을 앓을 위험이 높은 대상체를 차등시키는 목적으로, 결장직장암 또는 결장직장 선암을 앓을 위험이 있는 대상체의 집단의 검사 또는 시험을 지칭한다.
본원에서 사용되는 용어 "결장직장암"은 일반적으로 소장 아래의 장관(예를 들어, 대장(결장), 예를 들어, 맹장, 상행 결장, 횡행 결장, 하행 결장, S자 결장 및 직장)의 세포의 암에 의해 특징화되는 의학적 병태를 지칭한다.
본원에서 사용되는 용어 "결장직장 선종"은 일반적으로 결장직장암의 양성 및 전암성 단계인, 선종성 용종으로도 불리는 결장의 선종을 지칭한다. 결장직장 선종은 결장직장암으로의 진행할 높은 위험도를 지시할 수 있다.
본원에서 사용되는 용어 "진행성 결장직장 선종"은 일반적으로 적어도 10 mm의 크기를 갖거나 조직학적으로 고등급 이형성 또는 융모 성분을 20% 넘게 갖는 선종을 지칭한다.
본원에서 사용되는 용어 "최소-침습성 생물학적 샘플" 또는 "비-침습성 샘플"은 일반적으로 대상체로부터 혈액을 수득하기 위해 사용되는 미세 바늘 이외의 기구에 대한 필요 없이 환자의 신체로부터 채취되는 임의의 샘플을 지칭한다. 일부 실시양태에서, 최소-침습성 생물학적 샘플은 혈액, 혈청, 또는 혈장 샘플을 포함한다.
본원에서 사용되는 용어 "상향-조절된" 또는 "과다-발현된"은 일반적으로 주어진 "임계값" 또는 "컷오프 값"에 대한 발현 수준의 적어도 5%, 적어도 10%, 적어도 15%, 적어도 20%, 적어도 25%, 적어도 30%, 적어도 35%, 적어도 40%, 적어도 45%, 적어도 50%, 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 100%, 적어도 110%, 적어도 120%, 적어도 130%, 적어도 140%, 적어도 150%, 또는 150% 초과까지의 증가를 지칭한다.
본원에서 사용되는 용어 "임계값" 또는 "컷오프 값"은, 발현 수준을 언급할 때, 일반적으로 대상체의 발현 수준이 상기 임계 또는 컷-오프 또는 참조 수준을 초과하는 경우 대상체가 주어진 민감도 및 특이성으로 결장직장암 또는 결장직장 선종을 앓을 가능성이 있음을 지시하는 참조 발현 수준을 지칭한다.
본원에서 사용되는 용어 "키트"는 임의의 특정 디바이스로 제한되지 않으며, 마이크로어레이, 바이오어레이, 바이오칩, 또는 바이오칩 어레이와 같은(이로 제한되지 않음) 본 개시의 시스템 및 방법을 구현하기에 적합한 임의의 디바이스를 포함할 수 있다.
본원에서 사용되는 용어 암 "유형" 및 "아형"은 일반적으로 유방암과 같은 암의 한 "유형"이, 예를 들어, 병기, 형태, 조직학, 유전자 발현, 수용체 프로파일, 돌연변이 프로파일, 공격성, 예후, 및 악성 특징에 기초한 "아형"일 수 있도록 본원에서 상대적으로 사용된다. 마찬가지로, "유형" 및 "아형"은, 예를 들어, 하나의 조직학적 "유형"을, 예를 들어, 돌연변이 프로파일 또는 유전자 발현에 따라 정의된 "아형"으로 분화시키기 위해 더 미세한 수준으로 적용될 수 있다. 암 "병기"는 또한 질환 진행과 관련된 조직학적 및 병리학적 특징에 기초한 암 유형의 분류를 지칭하기 위해 사용된다.
본원에서 사용되는 용어 "miRNA" 또는 "miR" 또는 "마이크로RNA"는 일반적으로 코딩 RNA에 혼성화하고 이의 발현을 조절하는 17 개 내지 25 개의 뉴클레오베이스 길이의 비-코딩 RNA를 지칭한다. 17-25 개 뉴클레오타이드 miRNA 분자는 자연 가공 경로(예를 들어, 온전한 세포 또는 세포 용해물 사용)를 통해 또는 합성 가공 경로(예를 들어, 단리된 가공 효소, 예컨대, 단리된 Dicer, Argonaut, 또는 RNAase III를 사용하여)를 통해 miR 전구체로부터 수득될 수 있다. 17-25 개 뉴클레오타이드 RNA 분자는 또한 miR 전구체로부터 가공되지 않고 생물학적 또는 화학적 합성에 의해 직접 생산될 수 있다.
본원에서 사용되는 용어 "miRNA 분자"는 일반적으로 miRNA를 나타내는 임의의 핵산 분자를 지칭한다. 비-제한적인 예는 천연 형태뿐만 아니라 하나 이상의 핵산이 하나 이상의 DNA 뉴클레오타이드 및/또는 핵산 유사체로 대체되거나 표현되는 이러한 천연 형태의 핵산 서열과 핵산 서열이 동일한 천연 miRNA 분자, 프리-miRNA, 프라이-miRNA, 및 miRNA 분자를 포함한다. 일부 경우에, miRNA 분자는 miRNA를 인코딩하는 핵산 분자 또는 단순히 핵산 분자로 지칭된다.
본원에서 사용되는 용어 "miRNA 프로파일"은 일반적으로 복수의 miRNA의 발현 수준 또는 존재비의 집합을 지칭한다. miRNA 프로파일은 개별 miRNA 발현 수준 또는 존재비의 정량적 측정이다. 여기서, 각각의 miRNA는 수치로 표현된다. 개별 miRNA의 값이 높을수록 이러한 miRNA의 발현 수준이 높아진다. miRNA 프로파일은 생물학적 샘플의 RNA로부터 수득된다. miRNA 프로파일을 결정하는 데 사용될 수 있는 기술의 비-제한적인 예는 마이크로어레이, RT-PCR, 및 차세대 시퀀싱을 포함한다. RNA, 전체-RNA, 또는 이의 임의의 분획은 분석을 위한 출발 물질로서 사용될 수 있다. miRNA 프로파일에 의해 결정되는 복수의 miRNA는 하나의 선택으로부터 모든 공지된 miRNA까지의 범위일 수 있다.
본원에서 사용되는 용어 "miRNA의 미리 결정된 세트" 또는 "miRNA 시그니처"는 일반적으로 조건 1과 또 다른 조건 2를 구별할 수 있는 miRNA의 고정적인 규정된 세트를 지칭한다. 예를 들어, 조건 1은 결장직장암이고, 조건 2는 정상 대조이다. 이러한 경우, miRNA의 상응하는 미리 결정된 세트는 결장직장암 환자 또는 정상 대조 환자로부터 유래된 샘플을 구별할 수 있다. 대안적으로, 조건 1이 결장직장암이고 조건 2가 진행성 선종인 경우, miRNA의 상응하는 미리 결정된 세트는 결장직장암 환자와 진행성 선종 환자를 구별할 수 있다. 예를 들어, miRNA 프로파일을 결정하는 데 사용될 수 있는 매트릭스에서 샘플 분석을 수행하기 위해, 이러한 고정적인 규정된 miRNA 세트는 miRNA의 미리 결정된 세트에 의해 규정되는 프로브 또는 다른 방법에 의해 표현된다. 표적 방법, 예를 들어, 전사체-전체 miRNA 시퀀싱 및 dd/q-PCR 방법을 사용하여 시퀀싱을 위한 방법이 선택될 수 있다. 예를 들어, 건강한 대조로부터 결장직장암을 진단하기 위한 miRNA의 미리 결정된 세트가 25 개의 miRNA로 이루어지는 경우, 이러한 25 개의 miRNA를 검출할 수 있는 프로브 또는 방법은 진단 분석을 수행하기 위해 구현되어야 한다.
본원에서 사용되는 용어 "공통 miRNA 시그니처 프로파일"은 일반적으로 조건 1과 또 다른 조건 2를 구별할 수 있는 miRNA의 비-고정적인 규정된 세트 또는 비-코딩 RNA를 지칭한다. 공통 miRNA 또는 비-코딩 RNA 시그니처 프로파일은, 예를 들어, 데이터베이스에 저장된 복수의 miRNA 프로파일로부터 즉석에서 계산된다. 조건과 또 다른 조건 2를 구별할 수 있는 공통 miRNA 시그니처 프로파일은 건강한 상태 1 또는 또 다른 조건 2와 관련된 새로운 프로파일이 데이터베이스에 추가되자마자 변경된다. 이와 관련하여, 공통 miRNA 시그니처 프로파일은 miRNA의 미리 결정된 세트와 상이하다. 또한, 공통 miRNA 시그니처 프로파일, 예를 들어, 데이터베이스에 저장된 miRNA 프로파일을 생성하기 위한 기준은, 예를 들어, 가능한 많은 miRNA를 검출하기 위해 가능한 많은 상이한 포획 프로브를 나타내는 매트릭스 상에서 포획 프로브로부터 생성된다.
본원에서 사용되는 용어 "비-코딩 RNA" 또는 "ncRNA"는 일반적으로 단백질로 번역되지 않는 기능성 RNA 분자를 지칭한다. 일부 경우에, ncRNA는 비-단백질-코딩 RNA(npcRNA), 비-메신저 RNA(nmRNA), 소형 비-메신저 RNA(snmRNA), 또는 기능성 RNA(fRNA)를 지칭한다. 소형 RNA(sRNA)라는 용어는 종종 박테리아 ncRNA에 사용된다. 비-코딩 RNA가 최종 산물로서 전사되는 DNA 서열은 종종 RNA 유전자 또는 비-코딩 RNA 유전자로 불린다. 비-코딩 RNA 유전자는 전이 RNA(tRNA) 및 리보솜 RNA(rRNA)와 같은 매우 풍부하고 기능적으로 중요한 RNA 뿐만 아니라 snoRNA, 마이크로RNA, siRNA, 및 piRNA 및 긴 ncRNA, 예컨대, Xist 및 HOTAIR와 같은 RNA를 포함한다. 인간 게놈 내에 인코딩된 ncRNA의 수는 알려져 있지 않다. 그러나, 최근의 전사체 및 생물정보학 연구는 수천 개의 ncRNA의 존재를 시사하고 있다. 새로 확인된 대부분의 ncRNA는 기능에 대해 검증되지 않았기 때문에, 많은 ncRNA는 비-기능성일 수 있다.
II. 샘플 검정
무세포 생물학적 샘플은 인간 대상체로부터 수득되거나 유래될 수 있다. 무세포 생물학적 샘플은 가공 전에 다양한 저장 조건, 예컨대, 상이한 온도(예를 들어, 실온에서, 냉장 또는 냉동고 조건 하에, 예를 들어, 25℃, 4℃, -18℃, -20℃, 또는 -80℃) 또는 상이한 현탁액(예를 들어, EDTA 수집 튜브, 무세포 RNA 수집 튜브, 또는 무세포 DNA 수집 튜브)에서 저장될 수 있다.
무세포 생물학적 샘플은 암을 갖는 대상체, 암을 갖는 것으로 의심되는 대상체, 또는 암을 갖지 않거나 갖는 것으로 의심되지 않는 대상체로부터 수득될 수 있다.
무세포 생물학적 샘플은 암을 갖는 대상체의 치료 전 및/또는 후에 수득될 수 있다. 무세포 생물학적 샘플은 치료 또는 치료 요법 동안 대상체로부터 수득될 수 있다. 다수의 무세포 생물학적 샘플은 시간 경과에 따른 치료 효과를 모니터링하기 위해 대상체로부터 수득될 수 있다. 무세포 생물학적 샘플은 임상 시험을 통해 최종 양성 또는 음성 진단을 이용할 수 없는 암을 갖는 것으로 알려지거나 의심되는 대상체로부터 채취될 수 있다. 샘플은 암을 갖는 것으로 의심되는 대상체로부터 채취될 수 있다. 무세포 생물학적 샘플은 피로, 메스꺼움, 체중 감소, 동통 및 통증, 쇠약, 또는 출혈과 같은 설명되지 않는 증상을 경험하는 대상체로부터 채취될 수 있다. 무세포 생물학적 샘플은 설명된 증상을 갖는 대상체로부터 채취될 수 있다. 무세포 생물학적 샘플은 가족력, 연령, 고혈압 또는 전-고혈압, 당뇨병 또는 전-당뇨병, 과체중 또는 비만, 환경 노출, 생활양식 위험 인자(예를 들어, 흡연, 알코올 소비, 또는 약물 사용), 또는 다른 위험 인자의 존재와 같은 요인으로 인해 암이 발병할 위험이 있는 대상체로부터 채취될 수 있다.
무세포 생물학적 샘플은 검정될 수 있는 하나 이상의 분석물, 예컨대, 전사체 데이터를 생성하기 위해 검정하기에 적합한 무세포 리보핵산(cfRNA) 분자, 게놈 데이터를 생성하기 위해 검정하기에 적합한 무세포 데옥시리보핵산(cfDNA) 분자, 또는 이들의 혼합 또는 조합을 함유할 수 있다. 하나 이상의 이러한 분석물(예를 들어, cfRNA 분자 및/또는 cfDNA 분자)은 하나 이상의 적합한 검정을 사용하여 다운스트림 검정을 위해 대상체의 하나 이상의 무세포 생물학적 샘플로부터 단리되거나 추출될 수 있다.
대상체로부터 무세포 생물학적 샘플을 수득한 후, 무세포 생물학적 샘플은 대상체의 암을 지시하는 데이터세트를 생성하기 위해 가공될 수 있다. 예를 들어, 암-관련 게놈 유전자좌의 패널에서 무세포 생물학적 샘플의 핵산 분자의 존재, 부재, 또는 정량적 평가(예를 들어, 암-관련 게놈 유전자좌에서 RNA 전사체 또는 DNA의 정량적 측정). 대상체로부터 수득된 무세포 생물학적 샘플을 가공하는 것은 (i) 무세포 생물학적 샘플을 복수의 핵산 분자를 단리, 풍부화 또는 추출하기에 충분한 조건에 노출시키고, (ii) 복수의 핵산 분자를 검정하여 데이터세트를 생성하는 것을 포함할 수 있다.
일부 실시양태에서, 복수의 핵산 분자는 무세포 생물학적 샘플로부터 추출되고, 시퀀싱에 적용되어 복수의 시퀀싱 리드를 생성한다. 핵산 분자는 리보핵산(RNA) 또는 데옥시리보핵산(DNA)을 포함할 수 있다. 핵산 분자(예를 들어, RNA 또는 DNA)는 MagMAX mirVana 전체 RNA 단리 키트, QIAamp ccfDNA/RNA 키트, Zymo Quick-cfRNA 혈청 & 혈장 키트, MP Biomedicals로부터의 FastDNA 키트 프로토콜, Qiagen로부터의 QIAamp DNA 무세포 생물학적 미니키트, 또는 Norgen Biotek로부터의 무세포 생물학적 DNA 단리 키트와 같은 다양한 방법에 의해 무세포 생물학적 샘플로부터 추출될 수 있다. 추출 방법은 샘플로부터 모든 RNA 또는 DNA 분자를 추출할 수 있다. 대안적으로, 추출 방법은 샘플로부터 RNA 또는 DNA 분자의 일부를 선택적으로 추출할 수 있다. 샘플로부터 추출된 RNA 분자는 역전사(RT)에 의해 DNA 분자로 전환될 수 있다.
시퀀싱은 대규모 병렬 시퀀싱(MPS), 페어드-엔드 시퀀싱, 고-처리량 시퀀싱, 차세대 시퀀싱(NGS), 샷건 시퀀싱, 단일-분자 시퀀싱, 나노포어 시퀀싱, 반도체 시퀀싱, 파이로시퀀싱, 합성에 의한 시퀀싱(SBS), 결찰에 의한 시퀀싱, 하이브리드화에 의한 시퀀싱, 및 RNA-Seq(Illumina)와 같은 임의의 적합한 시퀀싱 방법에 의해 수행될 수 있다.
시퀀싱은, 예를 들어, RNA 또는 DNA 분자의 핵산 증폭을 포함할 수 있다. 일부 실시양태에서, 핵산 증폭은 폴리머라제 연쇄 반응(PCR)이다. 적절한 라운드 수의 PCR(예를 들어, PCR, qPCR, 역-전사효소 PCR, 디지털 PCR 등)은 초기 양의 핵산(예를 들어, RNA 또는 DNA)을 후속 시퀀싱에 요망되는 입력 양으로 충분히 증폭시키기 위해 수행될 수 있다. 일부 경우에, PCR은 표적 핵산의 전체 증폭에 사용될 수 있다. 이는 먼저 상이한 분자에 결찰될 수 있는 어댑터 서열을 사용한 후 범용 프라이머를 사용하는 PCR 증폭을 포함할 수 있다. PCR은, 예를 들어, Life Technologies, Affymetrix, Promega, Qiagen 등에 의해 제공되는 임의의 다수의 상업적 키트를 사용하여 수행될 수 있다. 다른 경우에, 핵산 집단 내의 특정 표적 핵산만이 증폭될 수 있다. 가능하게는 어댑터 결찰과 함께 특정 프라이머를 사용하여 다운스트림 시퀀싱을 위해 특정 표적을 선택적으로 증폭시킬 수 있다. PCR은 암과 관련된 게놈 유전자좌와 같은 하나 이상의 게놈 유전자좌의 표적화된 증폭을 포함할 수 있다. 시퀀싱은 Qiagen, NEB, Thermo Fisher Scientific, 또는 Bio-Rad에 의한 OneStep RT-PCR 키트 프로토콜과 같은 동시 역전사(RT) 및 폴리머라제 연쇄 반응(PCR)의 사용을 포함할 수 있다.
무세포 생물학적 샘플로부터 단리되거나 추출된 RNA 또는 DNA 분자는, 예를 들어, 식별 가능한 태그로 태깅되어, 복수의 샘플의 다중화를 가능하게 할 수 있다. 임의의 수의 RNA 또는 DNA 샘플이 다중화될 수 있다. 예를 들어, 다중화된 반응은 적어도 약 2 개, 3 개, 4 개, 5 개, 6 개, 7 개, 8 개, 9 개, 10 개, 11 개, 12 개, 13 개, 14 개, 15 개, 16 개, 17 개, 18 개, 19 개, 20 개, 25 개, 30 개, 35 개, 40 개, 45 개, 50 개, 55 개, 60 개, 65 개, 70 개, 75 개, 80 개, 85 개, 90 개, 95 개, 100 개, 또는 100 개 초과의 초기 무세포 생물학적 샘플로부터의 RNA 또는 DNA를 함유할 수 있다. 예를 들어, 복수의 무세포 생물학적 샘플은 각각의 DNA 분자가, DNA 분자가 유래된 샘플(및 대상체)로 역추적될 수 있도록 샘플 바코드로 태깅될 수 있다. 이러한 태그는 결찰에 의해 또는 프라이머를 사용한 PCR 증폭에 의해 RNA 또는 DNA 분자에 부착될 수 있다.
핵산 분자를 시퀀싱에 적용한 후, 서열 리드에 대해 적합한 생물정보학 과정을 수행하여 암의 존재, 부재, 또는 상대적 평가를 지시하는 데이터를 생성할 수 있다. 예를 들어, 서열 리드는 하나 이상의 참조 게놈(예를 들어, 인간 게놈과 같은 하나 이상의 종의 게놈)에 대해 정렬될 수 있다. 정렬된 서열 리드는 하나 이상의 게놈 유전자좌에서 정량화되어 암을 지시하는 데이터세트를 생성할 수 있다. 예를 들어, 암과 관련된 복수의 게놈 유전자좌에 상응하는 서열의 정량화는 암을 지시하는 데이터세트를 생성할 수 있다.
검정 판독은 하나 이상의 게놈 유전자좌(예를 들어, 암-관련 게놈 유전자좌)에서 정량화되어 암을 지시하는 데이터를 생성할 수 있다. 예를 들어, 복수의 게놈 유전자좌(예를 들어, 암-관련 게놈 유전자좌)에 상응하는 어레이 혼성화 또는 폴리머라제 연쇄 반응(PCR)의 정량화는 암을 지시하는 데이터를 생성할 수 있다. 검정 판독은 정량적 PCR(qPCR) 값, 디지털 PCR(dPCR) 값, 디지털 액적 PCR(ddPCR) 값, 형광 값 등, 또는 이들의 표준화된 값을 포함할 수 있다. 검정은 가정 환경에서 수행되도록 구성된 가정 사용용 시험일 수 있다.
일부 실시양태에서, 다중 검정은 대상체의 무세포 생물학적 샘플을 동시에 처리하는 데 사용될 수 있다. 예를 들어, 제1 검정은 암을 지시하는 제1 데이터세트를 생성하기 위해 대상체로부터 수득되거나 유래된 제1 무세포 생물학적 샘플을 처리하는 데 사용될 수 있고; 제1 검정과 상이한 제2 검정은 암을 지시하는 제2 데이터세트를 생성하기 위해 대상체로부터 수득되거나 유래된 제2 무세포 생물학적 샘플을 처리하는 데 사용될 수 있다. 이후, 제1 데이터세트 및 제2 데이터세트 중 임의의 또는 전부를 분석하여 대상체의 암을 평가할 수 있다. 예를 들어, 단일 진단 지수 또는 진단 점수는 제1 데이터세트와 제2 데이터세트의 조합에 기초하여 생성될 수 있다. 또 다른 예로서, 별도의 진단 지수 또는 진단 점수는 제1 데이터세트 및 제2 데이터세트에 기초하여 생성될 수 있다.
III. 시그니처 패널
본 개시는 결장 세포 증식성 장애의 발병과 관련된 샘플에서 식별된 miRNA 분자의 조합으로부터 측정 가능한 피처를 수득하기 위해 생물학적 샘플을 분석하는 방법 및 시스템을 제공한다. 식별된 miRNA 분자의 수집은 시그니처가 결장 세포 증식성 장애 또는 이의 병기에 특징적인 시그니처 패널을 형성할 수 있다. 시그니처 패널로부터의 피처는 대상체의 집단을 결장 세포 증식성 장애를 갖거나 결장 세포 증식성 장애를 갖지 않는 것으로 계층화하도록 구성된 분류기를 생성하도록 훈련된 알고리즘(예를 들어, 기계 학습 모델)을 사용하여 처리될 수 있다. 방법은 시그니처 패널에 기재된 miRNA를 갖는 하나 이상의 핵산을 사용함으로써 특징화될 수 있다.
본원에 기재된 miRNA 시그니처 패널은 결장 세포 증식성 장애와 관련된 특이적 miRNA의 신속하고 특이적인 분석을 가능하게 할 수 있다. 본원의 방법에 기술되고 사용되는 시그니처 패널은 결장 세포 증식성 장애의 개선된 진단, 예후, 치료 선택, 및 모니터링(예를 들어, 치료 모니터링)에 사용될 수 있다.
시그니처 패널 및 방법은 전혈, 혈장, 또는 혈청과 같은 체액 샘플로부터 조기 결장 세포 증식성 장애를 검출하는 데 사용되는 마커 또는 시그니처 패널이 필요하다는 점에서 현재의 접근법에 비해 상당한 개선을 제공한다. 결장 세포 증식성 장애를 검출하고 진단하기 위해 사용되는 현재의 방법은 결장경검사, S상결장경 검사, 및 분변 잠혈 결장암을 포함할 수 있다. 이러한 방법들과 비교하여, 본원에 제공된 방법은 결장경검사보다 훨씬 덜 침습적일 수 있고, 동등하게, 민감하지 않다면, S상결장경검사, 분변 면역화학 시험(FIT), 및 분변 잠혈 시험(FOBT)보다 훨씬 덜 침습적일 수 있다. 이러한 마커의 현재 사용과 비교하여, 본원에 제공된 방법은 유전자 패널과 고감도 검정 기술을 사용하는 유리한 조합으로 인해 민감도 및 특이성 면에서 상당한 이점을 제공할 수 있다.
정보를 주는 miRNA를 포함하는 시그니처 패널은 의도된 검정의 목적에 따라 선택될 수 있다. 표적화된 방법의 경우, 프라이머 쌍은 의도된 표적 miRNA의 세트에 기초하여 설계될 수 있다. 일부 실시양태에서, miRNA의 세트는 표 1에 열거된 군으로부터 선택된 적어도 1 개, 적어도 2 개, 적어도 3 개, 또는 3 개 초과의 miRNA를 포함한다. 일부 실시양태에서, miRNA의 세트는 표 1에 열거된 모든 영역을 포함한다. 일부 실시양태에서, 결장직장암과 관련된 miRNA의 세트는 표 1에 열거된 군으로부터 선택된다.
표 1
Figure pct00001
Figure pct00002
일부 실시양태에서, 결장직장암과 관련된 miRNA의 세트는 표 2에 열거된 군으로부터 선택된다.
표 2
Figure pct00003
일부 실시양태에서, 결장직장암과 관련된 miRNA의 세트는 표 3에 열거된 군으로부터 선택된다.
표 3
Figure pct00004
일부 실시양태에서, 결장직장암과 관련된 miRNA의 세트는 표 4에 열거된 군으로부터 선택된다.
표 4
Figure pct00005
일부 실시양태에서, 결장직장암과 관련된 miRNA의 세트는 표 5에 열거된 군으로부터 선택된다.
표 5
Figure pct00006
차등 발현된 miRNA의 프로파일은 대조 또는 참조 수준과 비교하여 유체 또는 조직 샘플에서 차등 발현되는 miRNA의 세트를 나타낸다. 차등 발현된 miRNA의 프로파일은 하향-조절된 또는 과소-발현된 miRNA의 프로파일 및 상향-조절된/과다-발현된 miRNA의 프로파일을 포함한다.
일부 실시양태에서, miRNA는 결장 세포 증식성 장애가 발병할 낮은 위험도를 갖는 대상체의 상응하는 샘플과 비교하여 결장 세포 증식성 장애가 발병할 높은 위험도를 갖는 대상체의 샘플에서 차등 발현된다. 일부 실시양태에서, 결장 세포 증식성 장애가 발생할 높은 위험도를 갖는 대상체 및 결장 세포 증식성 장애가 발생할 낮은 위험도를 갖는 대상체 각각은 결장직장 병변을 갖는다. 결장 세포 증식성 장애가 발병할 높은 위험도를 갖는 또는 결장 세포 증식성 장애를 갖는 대상체의 샘플에서 차등 발현되는 miRNA는 결장 세포 증식성 장애의 진단 또는 예방을 위한 바이오마커로서 사용될 수 있다. 예를 들어, 결장 세포 증식성 장애가 발병할 낮은 위험도를 갖는 대상체의 상응하는 세포와 비교하여 결장 세포 증식성 장애가 발병할 높은 위험도를 갖는 대상체의 샘플에서 차등 발현된 miRNA는 hsa-mir-889, hsa-mir-543, hsa-mir-376b, hsa-mir-335, hsa-mir-1185-1, hsa-mir-548k, hsa-mir-12135, hsa-mir-369, hsa-mir-190a, hsa-mir-6770-1, hsa-mir-382, hsa-mir-1843, hsa-mir-142, 및 hsa-mir-485, hsa-mir-548ax, hsa-mir-548e, hsa-mir-548al, hsa-mir-548am, hsa-mir-590, hsa-mir-135a-2, hsa-mir-6770-3, hsa-mir-410, hsa-mir-376a-1, hsa-mir-377, hsa-mir-570, hsa-mir-381, hsa-mir-665, hsa-mir-758, hsa-mir-6511a-3, hsa-mir-376a-2, hsa-mir-155, hsa-mir-3140, hsa-mir-1277, hsa-mir-340, 및 hsa-mir-548n, hsa-mir-518b, hsa-mir-654, hsa-mir-5581, hsa-mir-409, hsa-mir-628, hsa-mir-10399, hsa-mir-3184, hsa-mir-423, hsa-mir-548z, hsa-mir-374a, hsa-mir-548a-3, hsa-mir-6770-2, hsa-mir-1185-2, hsa-mir-6077, hsa-mir-3202-1, hsa-mir-548o-2, hsa-mir-3143, hsa-mir-5009, hsa-mir-548g, 및 hsa-mir-656 중 하나 이상을 포함한다.
일부 실시양태에서, 결장 세포 증식성 장애가 발병할 낮은 위험도를 갖는 대상체의 상응하는 샘플과 비교하여 결장 세포 증식성 장애가 발병할 높은 위험도를 갖는 대상체의 샘플에서 더 높게 발현된 miRNA는 hsa-mir-889, hsa-mir-543, hsa-mir-376b, hsa-mir-335, hsa-mir-1185-1, hsa-mir-548k, hsa-mir-12135, hsa-mir-369, hsa-mir-190a, hsa-mir-6770-1, hsa-mir-382, hsa-mir-1843, hsa-mir-142, 및 hsa-mir-485, hsa-mir-548ax, hsa-mir-548e, hsa-mir-548al, hsa-mir-548am, hsa-mir-590, hsa-mir-135a-2, hsa-mir-6770-3, hsa-mir-410, hsa-mir-376a-1, hsa-mir-377, hsa-mir-570, hsa-mir-381, hsa-mir-665, hsa-mir-758, hsa-mir-6511a-3, hsa-mir-376a-2, hsa-mir-155, hsa-mir-3140, hsa-mir-1277, hsa-mir-340, 및 hsa-mir-548n, hsa-mir-518b, hsa-mir-654, hsa-mir-5581, hsa-mir-409, hsa-mir-628, hsa-mir-10399, hsa-mir-3184, hsa-mir-423, hsa-mir-548z, hsa-mir-374a, hsa-mir-548a-3, hsa-mir-6770-2, hsa-mir-1185-2, hsa-mir-6077, hsa-mir-3202-1, hsa-mir-548o-2, hsa-mir-3143, hsa-mir-5009, hsa-mir-548g, 및 hsa-mir-656 중 하나 이상을 포함한다.
일부 실시양태에서, 결장 세포 증식성 장애는 진행성 선종이다.
일부 실시양태에서, 결장 세포 증식성 장애가 발병할 낮은 위험도를 갖는 대상체의 상응하는 샘플과 비교하여 결장 세포 증식성 장애가 발병할 높은 위험도를 갖는 대상체의 샘플에서 더 낮게 발현된 miRNA는 hsa-mir-889, hsa-mir-543, hsa-mir-376b, hsa-mir-335, hsa-mir-1185-1, hsa-mir-548k, hsa-mir-12135, hsa-mir-369, hsa-mir-190a, hsa-mir-6770-1, hsa-mir-382, hsa-mir-1843, hsa-mir-142, 및 hsa-mir-485, hsa-mir-548ax, hsa-mir-548e, hsa-mir-548al, hsa-mir-548am, hsa-mir-590, hsa-mir-135a-2, hsa-mir-6770-3, hsa-mir-410, hsa-mir-376a-1, hsa-mir-377, hsa-mir-570, hsa-mir-381, hsa-mir-665, hsa-mir-758, hsa-mir-6511a-3, hsa-mir-376a-2, hsa-mir-155, hsa-mir-3140, hsa-mir-1277, hsa-mir-340, 및 hsa-mir-548n, hsa-mir-518b, hsa-mir-654, hsa-mir-5581, hsa-mir-409, hsa-mir-628, hsa-mir-10399, hsa-mir-3184, hsa-mir-423, hsa-mir-548z, hsa-mir-374a, hsa-mir-548a-3, hsa-mir-6770-2, hsa-mir-1185-2, hsa-mir-6077, hsa-mir-3202-1, hsa-mir-548o-2, hsa-mir-3143, hsa-mir-5009, hsa-mir-548g, 및 hsa-mir-656 중 하나 이상을 포함한다.
일례에서, miRNA의 패널은 진행성 선종이 없는 건강한 대상체로부터의 샘플에 비해 진행된 선종이 있는 대상체로부터의 샘플에서 증가된 발현을 갖는다. 일례에서, 패널은 표 6에 열거된 군으로부터 선택된 2 개 이상의 miRNA를 포함한다. 다른 예에서, 패널은 열거된 miRNA 중 3 개 이상, 4 개 이상, 5 개 이상, 또는 6 개 이상을 포함한다.
표 6
Figure pct00007
진행성 선종이 없는 건강한 대상체로부터의 샘플에 비해 진행성 선종이 있는 대상체로부터의 샘플에서 증가된 발현을 갖는 miRNA의 패널의 또 다른 예에서, 패널은 표 7에 열거된 군으로부터 선택된 2 개 이상의 miRNA를 포함한다. 다른 예에서, 패널은 열거된 miRNA 중 3 개 이상, 4 개 이상, 5 개 이상, 또는 6 개 이상을 포함한다.
일부 실시양태에서, 패널은 a) hsa-miR-1273a, hsa-miR-17-5p, hsa-miR-20a-3p, hsa-miR-20b-5p; b) hsa-miR-3065-5p, hsa-miR-4785, hsa-miR-5096, hsa-miR-5189-5p, 또는 c) hsa-miR-545-3p, hsa-miR-570-3p, hsa-miR-624-3p, hsa-mir-1181, hsa-mir-6073을 포함하는 5 개 이상의 miRNA로부터 선택된다.
표 7
Figure pct00008
일례에서, miRNA의 패널은 진행성 선종이 없는 건강한 대상체로부터의 샘플에 비해 진행된 선종이 있는 대상체로부터의 샘플에서 감소된 발현을 갖는다. 일례에서, 패널은 표 8에 열거된 군으로부터 선택된 2 개 이상의 miRNA를 포함한다. 다른 예에서, 패널은 열거된 miRNA 중 3 개 이상, 4 개 이상, 5 개 이상, 또는 6 개 이상을 포함한다.
표 8
Figure pct00009
일례에서, miRNA의 패널은 결장직장암이 없는 건강한 대상체로부터의 샘플에 비해 결장직장암이 있는 대상체로부터의 샘플에서 증가된 발현을 갖는다. 일례에서, 패널은 표 9에 열거된 군으로부터 선택된 2 개 이상의 miRNA를 포함한다. 다른 예에서, 패널은 열거된 miRNA 중 3 개 이상, 4 개 이상, 5 개 이상, 또는 6 개 이상을 포함한다.
표 9
Figure pct00010
결장직장암이 없는 건강한 대상체로부터의 샘플에 비해 직장결장암을 갖는 대상체로부터의 샘플에서 증가된 발현을 갖는 miRNA의 패널의 또 다른 예에서, 패널은 표 10에 열거된 군으로부터 선택된 2 개 이상의 miRNA를 포함한다. 다른 예에서, 패널은 열거된 miRNA 중 3 개 이상, 4 개 이상, 5 개 이상, 또는 6 개 이상을 포함한다.
또 다른 예에서, 패널은 a) hsa-miR-1250-5p, hsa-miR-1255a, hsa-miR-223-3p, hsa-miR-338-3p, hsa-miR-338-5p; b) hsa-miR-424-5p, hsa-miR-424-3p, hsa-miR-450a-5p, hsa-miR-450b-5p, hsa-miR-4772-3p; c) hsa-miR-4772-5p, hsa-miR-625-5p, hsa-miR-7847-3p, hsa-miR-1181, hsa-miR-3651, hsa-mir-6073; d) hsa-mir-6125, hsa-mir-7704, hsa-miR-19b-3p, hsa-miR-19a-3p, hsa-miR-3157-5p; e) hsa-miR-142-3p, hsa-miR-30c-5p, hsa-miR-6741-5p, hsa-miR-590-3p, hsa-miR-4685-5p; f) hsa-miR-3648, hsa-miR-331-3p, hsa-miR-1303, hsa-miR-6790-3p, hsa-miR-6867-5p, hsa-miR-942-5p; g) hsa-miR-378a-3p, hsa-miR-1287-5p, hsa-mir-4785, hsa-miR-324-3p, hsa-miR-550b-2-5p; h) hsa-miR-200c-3p, hsa-miR-200b-3p, hsa-miR-3679-5p, hsa-miR-550a-3-5p, hsa-miR-3187-3p; i) hsa-miR-181b-5p, hsa-miR-3138, hsa-miR-146a-5p, hsa-miR-6721-5p, hsa-miR-23b-3p, hsa-miR-28-5p; j) hsa-miR-320d, hsa-miR-940, hsa-miR-320d-1, hsa-miR-10a-5p, hsa-miR-340-5p; k) hsa-miR-320b, hsa-miR-335-5p, hsa-miR-320c, hsa-miR-501-3p, hsa-miR-548n; 또는 l) hsa-miR-27a-3p, hsa-miR-3065-3p, hsa-miR-548aa@, hsa-miR-584-3p, hsa-miR-22-3p를 포함하는 5 개 이상의 miRNA로부터 선택된다.
표 10
Figure pct00011
일례에서, miRNA의 패널은 결장직장암이 없는 건강한 대상체로부터의 샘플에 비해 결장직장암이 있는 대상체로부터의 샘플에서 감소된 발현을 갖는다. 일례에서, 패널은 표 11에 열거된 군으로부터 선택된 2 개 이상의 miRNA를 포함한다.
표 11
Figure pct00012
일부 실시양태에서, 결장 세포 증식성 장애는 진행성 선종이다.
일부 실시양태에서, 결장 세포 증식성 장애는 직장결장암이다.
일부 실시양태에서, 단독의 miR-889로부터 출발하는 바이오마커의 소정의 특정 조합은 이들 자체로 miR-889, miR-543, miR-376b, miR-335 및 miR-1185-1의 사용과 비교하여 진행성 결장직장 선종의 존재를 검출하고 직장결장 암의 존재를 검출하는 둘 모두에 대한 k-폴드 교차-검증의 빈도, AUC, 민감도 및 특이성 값의 측면에서 더 우수한 결과를 제공한다.
일부 실시양태에서, 이러한 예는 적어도 (miR-889) 또는 적어도 (miR-889 및 miR-543) 또는 적어도 (miR-889 및 miR-376b), 또는 적어도 (miR-889 및 miR-335), 또는 적어도 (miR-889 및 miR-1185-1), 또는 적어도 (miR-889, miR-543 및 miR-376b), 또는 적어도 (miR-889, miR-543 및 miR-335), 또는 적어도 (miR-889, miR-376b 및 miR-335), 또는 적어도 (miR-889, miR-543 및 miR-1185-1), 또는 적어도 (miR-889, miR-543 및 miR-548k), 또는 적어도 (miR-889, miR-543 및 miR-12135), 또는 적어도 (miR-889, miR-543, miR-376b, miR-335 및 miR-1185-1)를 포함하고, 결장직장암 및 진행성 선종을 앓고 있는 대상체의 혈장 샘플에서 상당히 상향-조절된다. 이러한 의미에서, 표 1에 나타낸 바와 같이, 적어도 (miR-889) 또는 적어도 (miR-889 및 miR-543) 또는 적어도 (miR-889 및 miR-376b), 또는 적어도 (miR-889 및 miR-335), 또는 적어도 (miR-889 및 miR-1185-1), 또는 적어도 (miR-889, miR-543 및 miR-376b), 또는 적어도 (miR-889, miR-543 및 miR-335), 또는 적어도 (miR-889, miR-376b 및 miR-335), 또는 적어도 (miR-889, miR-543 및 miR-1185-1), 또는 적어도 (miR-889, miR-543 및 miR-548k), 또는 적어도 (miR-889, miR-543 및 miR-12135), 또는 적어도 (miR-889, miR-543, miR-376b, miR-335, 및 miR-1185-1)의 조합이 있다.
일부 실시양태에서, 본 개시의 방법은 치료의 수행을 필요로 하는 대상체에게 (예를 들어, 결장 증식성 장애를 갖는 것에 기초하여) 치료를 수행하는 단계를 포함할 수 있다. 결장직장 선종은 결장직장암의 전구체로 볼 수 있는데 인정된 선종-암종 순서 및 진행된 결장직장 선종이 암으로 전이될 가능성이 더 높다는 개념 때문에, 결장직장 선종(예를 들어, 결장직장 선종)이, 예를 들어, 결장경검사를 통해 제거됨으로써 치료될 수 있다(후속적인 감시가 수행될 수 있음). 결장직장암의 치료는 암이 발견된 병기에 따라 다르다. 조기 결장직장암은 수술로 치료될 수 있다. I기 직장결장암의 대략 95% 및 II기 결장직장암의 65-80%는 수술로 치료될 수 있다. 그러나, 직장암은 재발 위험도를 최소화하기 위해 추가 방사선 요법이 필요할 수 있다. 진행된 병기(III 기 및 IV 기) 치료는 종종 수술, 화학요법, 항체를 이용한 치료, 항-VEGF/R 요법 및 방사선을 포함하는 요법의 조합을 포함한다. 결장직장암을 갖는 대상체에 대한 치료는, 예를 들어, 그 전체가 본원에 참조로 포함되는 문헌[Wolpin et al., "Systemic Treatment of Colorectal Cancer," Gastroenterology, Volume 134, Issue 5, 2008, Pages 1296-1310.e1, ISSN 0016-5085]에 기재되어 있을 수 있다.
치료는 (예를 들어, 복수의 가능한 치료 옵션 중에서) 선택되고 대상체의 miRNA 프로파일 및/또는 대상체의 생물학적 형질의 세트에 적어도 부분적으로 기초하여 대상체에게 투여될 수 있다. 생물학적 형질은 측정, 진단, 예후, 또는 예측(예를 들어, 훈련된 기계 학습 분류기를 사용하여 결정됨)일 수 있다.
일부 실시양태에서, 생물학적 형질은 악성종양을 포함한다. 일부 실시양태에서, 생물학적 형질은 암 유형을 포함한다. 일부 실시양태에서, 생물학적 형질은 암 병기를 포함한다. 일부 실시양태에서, 생물학적 형질은 암 분류를 포함한다. 일부 실시양태에서, 암 분류는 암 등급을 포함한다. 일부 실시양태에서, 암 분류는 조직학적 분류를 포함한다. 일부 실시양태에서, 생물학적 형질은 대사 프로파일을 포함한다. 일부 실시양태에서, 생물학적 형질은 돌연변이를 포함한다. 일부 실시양태에서, 돌연변이는 질환-관련 돌연변이이다. 일부 실시양태에서, 생물학적 형질은 임상 결과를 포함한다. 일부 실시양태에서, 생물학적 형질은 약물 반응을 포함한다.
V. 분류기, 기계 학습 모델 및 시스템
일부 예에서, miRNA 시퀀싱 피처는 서열 조성과 대상체 그룹(예를 들어, 환자 그룹) 사이의 상관관계를 찾기 위해 훈련된 알고리즘(예를 들어, 기계 학습 모델 또는 분류기)에 대한 입력 데이터세트로서 사용된다. 이러한 환자 그룹의 예로는 질환 또는 병태의 존재 또는 부재, 질환 또는 병태의 상승된 또는 비-상승된 위험, 질환 또는 병태의 병기, 질환 또는 병태의 아형, 치료에 대한 반응자 대 치료에 대한 비-반응자, 및 진행자 대 비-진행자가 포함된다. 일부 예에서, 피처 매트릭스는 알려진 조건 또는 특징을 갖는 대상체로부터 수득된 샘플을 비교하기 위해 생성된다. 일부 실시양태에서, 샘플은 건강한 대상체, 또는 임의의 알려진 적응증을 갖지 않는 대상체, 및 암을 갖는 것으로 알려진 환자로부터의 샘플로부터 얻어진다.
본원에 사용되는 바와 같이, 기계 학습 및 패턴 인식에 관한 것일 때, 용어 "피처"는 일반적으로 관찰되고 있는 현상의 개별 측정 가능한 성질 또는 특징을 지칭한다. "피처"의 개념은, 예를 들어, 이로 제한되지는 않지만, 선형 회귀 및 로지스틱 회귀와 같은 통계 기법에 사용되는 설명 변수의 개념과 관련이 있다. 피처는 숫자형 또는 범주형일 수 있다(예를 들어, 스트링 및 그래프와 같은 구조적 피처는 구문 패턴 인식에 사용된다).
본원에서 사용되는 용어 "입력 피처"(또는 "피처들")는 일반적으로 샘플의 출력 분류(라벨), 예를 들어, 병태, 서열 내용(예를 들어, 돌연변이), 제안된 데이터 수집 작업, 또는 제안된 치료를 예측하기 위해 훈련된 알고리즘(예를 들어, 기계 학습 모델 또는 분류기)에 의해 사용되는 변수를 지칭한다. 변수의 값은 샘플에 대해 결정되고 분류를 결정하는 데 사용될 수 있다.
복수의 검정의 경우, 시스템은 훈련된 알고리즘(예를 들어, 기계 학습 모델 또는 분류기)에 입력할 피처의 세트를 식별한다. 시스템은 각각의 생물학적 샘플에 대해 검정을 수행하고 측정된 값으로부터 피처 벡터를 형성한다. 시스템은 피처 벡터를 기계 학습 모델에 입력하고 생물학적 샘플이 특정 성질을 갖는지 여부의 출력 분류를 획득한다.
일부 실시양태에서, 기계 학습 모델은 2 개 이상의 그룹 또는 대상체의 부류 또는 대상체의 집단에서의 피처 또는 집단의 피처를 구별할 수 있는 분류기를 출력한다. 일부 실시양태에서, 분류기는 훈련된 기계 학습 분류기이다.
일부 실시양태에서, 암 조직에서 바이오마커의 정보를 주는 유전자좌 또는 피처가 검정되어 프로파일을 형성한다. 두 집단(예를 들어, 치료제에 반응하는 대상체와 반응하지 않는 대상체) 사이를 구별할 때 특정 피처(예를 들어, 본원에 기재된 임의의 바이오마커 및/또는 추가의 생의학 정보의 임의의 항목)의 성능을 플롯팅함으로써 수신자-조작 특징(ROC) 곡선이 생성될 수 있다. 일부 실시양태에서, 전체 집단(예를 들어, 사례 및 대조)에 대한 피처 데이터는 단일 피처의 값을 기준으로 오름차순으로 정렬된다.
일부 예에서, 명시된 성질은 건강 대 암, 질환의 상승 대 비-상승 위험, 질환 아형, 질환 병기, 진행자 대 비-진행자, 및 반응자 대 비-반응자로부터 선택된다.
일부 실시양태에서, 결장 세포 증식성 장애는 선종(선종성 용종), 무경성 거치상 선종(SSA), 진행성 선종, 결장직장 이형성증, 결장직장 선종, 결장직장암, 결장암, 직장암, 결장직장 암종, 결장직장 선암종, 카르시노이드 종양, 위장 카르시노이드 종양, 위장 기질 종양(GIST), 림프종, 및 육종으로 이루어진 군으로부터 선택된다.
A. 데이터 분석
일부 예에서, 본 개시는 데이터 분석이 소프트웨어 애플리케이션, 컴퓨팅 하드웨어, 또는 둘 모두에서 실현되는 시스템, 방법 또는 키트를 제공한다. 일부 예에서, 분석 애플리케이션 또는 시스템은 적어도 하나의 데이터 수신 모듈, 데이터 전처리 모듈, 데이터 분석 모듈(하나 이상의 유형의 게놈 데이터에서 작동할 수 있음), 데이터 해석 모듈, 또는 데이터 시각화 모듈을 포함한다. 일부 구현예에서, 데이터 수신 모듈은 실험실 하드웨어 또는 기기를 실험실 데이터를 처리하는 컴퓨터 시스템과 연결하는 컴퓨터 시스템을 포함할 수 있다. 일부 실시양태에서, 데이터 전처리 모듈은 분석을 준비하기 위해 데이터에 대한 연산을 수행하는 하드웨어 시스템 또는 컴퓨터 소프트웨어를 포함할 수 있다. 사전 처리 모듈의 데이터에 적용될 수 있는 연산의 예로는 아핀 변환, 노이즈 제거 연산, 데이터 정제, 리포맷팅, 또는 서브샘플링이 포함된다. 하나 이상의 게놈 물질로부터 게놈 데이터를 분석하기 위해 특화될 수 있는 데이터 분석 모듈은, 예를 들어, 조립된 게놈 서열을 취하고 확률적 및 통계적 분석을 수행하여 질환, 병리, 상태, 위험, 병태, 또는 표현형과 관련된 비정상 패턴을 확인할 수 있다. 데이터 해석 모듈은, 예를 들어, 통계, 수학, 또는 생물학에서 취한 분석 방법을 사용하여 확인된 비정상 패턴과 건강 상태, 기능 상태, 예후, 또는 위험 사이의 관계에 대한 이해를 지지할 수 있다. 데이터 시각화 모듈은 수학적 모델링, 컴퓨터 그래픽, 또는 렌더링 방법을 사용하여 결과의 이해 또는 해석을 용이하게 할 수 있는 데이터의 시각적 표현을 생성할 수 있다.
일부 예에서, 샘플 집단에서 샘플을 구별하기 위해 기계 학습 방법이 적용된다. 일부 실시양태에서, 건강한 샘플과 진행성 질환(예를 들어, 선종) 샘플을 구별하기 위해 기계 학습 방법이 적용된다.
일부 예에서, 예측 엔진을 훈련시키는 데 사용되는 하나 이상의 기계 학습 연산은 일반화 선형 모델, 일반화 가법 모델, 비모수 회귀 연산, 랜덤 포레스트 분류기, 공간 회귀 연산, 베이지안 회귀 모델, 시계열 분석, 베이지안 네트워크, 가우스 네트워크, 의사 결정 트리 학습 연산, 인공 신경망, 순환 신경망, 강화 학습 연산, 선형 또는 비선형 회귀 연산, 서포트 벡터 머신(support vector machine), 클러스터링 연산, 및 유전 알고리즘 연산 중 하나 이상을 포함한다.
일부 예에서, 컴퓨터 처리 방법은 로지스틱 회귀, 다중 선형 회귀(MLR), 차원 축소, 부분 최소 제곱(PLS) 회귀, 주성분 회귀, 오토인코더, 변분 오토인코더, 특이 값 분해, 푸리에 기저, 웨이블렛, 판별 분석, 서포트 벡터 머신, 의사 결정 트리, 분류 및 회귀 트리(CART), 트리 기반 방법, 랜덤 포레스트, 그라디언트 부스트 트리, 로지스틱 회귀, 행렬 인수분해, 다차원 척도법(MDS), 차원 축소 방법, t-분포 확률적 인접 임베딩(t-SNE), 다층 퍼셉트론(MLP), 네트워크 클러스터링, 뉴로 퍼지, 및 인공 신경망으로부터 선택된다.
일부 예에서, 본원에 개시된 방법은 대상체 또는 복수의 대상체로부터의 샘플의 핵산 시퀀싱 데이터에 대한 컴퓨터 분석을 포함할 수 있다.
B. 분류기 생성
일 측면에서, 개시된 시스템 및 방법은 cfRNA의 생물학적 샘플로부터의 miRNA 서열 분석으로부터 유래된 피처 정보에 기초하여 생성된 분류기를 제공한다. 분류기는 cfDNA와 같은 생물학적 샘플에서 식별된 서열 피처에 기초하여 집단에서 그룹을 구별하기 위한 예측 엔진의 일부를 형성한다.
일부 실시양태에서, 분류기는 서열 정보의 유사한 부분을 통합된 포맷 및 통합된 스케일로 포맷하여 서열 정보를 표준화하는 단계; 표준화된 서열 정보를 컬럼형 데이터베이스에 저장하는 단계; 저장된 표준화된 서열 정보에 하나 이상의 기계 학습 연산을 적용함으로써 예측 엔진을 훈련시키는 단계, 예측 엔진은 특정 집단에 대해 하나 이상의 피처의 조합을 맵핑하는 단계; 그룹과 관련된 대상체를 식별하기 위해 예측 엔진을 액세스된 필드 정보에 적용하는 단계; 및 대상체를 그룹으로 분류하는 단계에 의해 생성된다.
본원에서 사용되는 특이성은 일반적으로 "질환이 없는 사람들 중에서 음성 시험의 확률"을 지칭한다. 이는 음성 판정을 받은 질환이 없는 사람의 수를 질환이 없는 대상체의 총 수로 나누어 계산될 수 있다.
일부 예에서, 모델, 분류기, 또는 예측 시험은 적어도 40%, 적어도 45%, 적어도 50%, 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 또는 적어도 99%의 특이성을 갖는다.
본원에서 사용되는 민감도는 일반적으로 "질환을 갖는 사람들 중에서 양성 시험의 확률"을 지칭한다. 이는 양성 판정된 질환에 걸린 대상체의 수를 질환에 걸린 대상체의 총수로 나누어 계산될 수 있다.
일부 예에서, 모델, 분류기, 또는 예측 시험은 적어도 40%, 적어도 45%, 적어도 50%, 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 또는 적어도 99%의 민감도를 갖는다.
C. 디지털 처리 장치
일부 예에서, 본원에 기재된 주제는 디지털 처리 디바이스 또는 이의 용도를 포함할 수 있다. 일부 예에서, 디지털 처리 디바이스는 디바이스의 기능을 수행하는 하나 이상의 하드웨어 중앙 처리 장치(CPU), 그래픽 처리 장치(GPU), 또는 텐서 처리 장치(TPU)를 포함할 수 있다. 일부 예에서, 디지털 처리 디바이스는 실행 가능한 명령을 수행하도록 구성된 운영 체제를 포함할 수 있다.
일부 예에서, 디지털 처리 디바이스는 선택적으로 컴퓨터 네트워크에 연결될 수 있다. 일부 예에서, 디지털 처리 디바이스는 선택적으로 인터넷에 연결될 수 있다. 일부 예에서, 디지털 처리 디바이스는 선택적으로 클라우드 컴퓨팅 인프라구조에 연결될 수 있다. 일부 예에서, 디지털 처리 디바이스는 선택적으로 인트라넷에 연결될 수 있다. 일부 예에서, 디지털 처리 디바이스는 선택적으로 데이터 저장 디바이스에 연결될 수 있다.
적합한 디지털 처리 디바이스의 비-제한적인 예는 서버 컴퓨터, 데스크탑 컴퓨터, 랩톱 컴퓨터, 노트북 컴퓨터, 서브-노트북 컴퓨터, 넷북 컴퓨터, 넷패드 컴퓨터, 셋톱 컴퓨터, 핸드헬드 컴퓨터, 인터넷 기기, 모바일 스마트폰, 및 태블릿 컴퓨터를 포함한다. 적합한 태블릿 컴퓨터는, 예를 들어, 부클릿, 슬레이트, 및 컨버터블 구성을 갖는 컴퓨터를 포함할 수 있다.
일부 예에서, 디지털 처리 디바이스는 실행 가능한 명령을 수행하도록 구성된 운영 체제를 포함할 수 있다. 예를 들어, 운영 체제에는 디바이스의 하드웨어를 관리하고 애플리케이션 실행을 위한 서비스를 제공하는 프로그램 및 데이터를 포함한 소프트웨어가 포함될 수 있다. 운영 체제의 비-제한적인 예로는 Ubuntu, FreeBSD, OpenBSD, NetBSD®, Linux, Apple® Mac OS X Server®, Oracle® Solaris®, Windows Server®, 및 Novell® NetWare®을 포함한다. 적합한 개인용 컴퓨터 운영 체제의 비-제한적인 예로는 Microsoft® Windows®, Apple® Mac OS X®, UNIX®, 및 UNIX-유사 운영 체제, 예컨대, GNU/Linux®이 포함된다. 일부 예에서, 운영 체제는 클라우드 컴퓨팅에 의해 제공될 수 있고, 클라우드 컴퓨팅 리소스는 하나 이상의 서비스 제공자에 의해 제공될 수 있다.
일부 예에서, 디바이스는 저장 디바이스 및/또는 메모리 디바이스를 포함할 수 있다. 저장 및/또는 메모리 디바이스는 일시적 또는 영구적으로 데이터 또는 프로그램을 저장하는 데 사용되는 하나 이상의 물리적 장치일 수 있다. 일부 예에서, 디바이스는 휘발성 메모리일 수 있으며 저장된 정보를 유지하기 위해 전력을 필요로 할 수 있다. 일부 예에서, 디바이스는 비-휘발성 메모리일 수 있으며 디지털 처리 디바이스에 전원이 공급되지 않을 때 저장된 정보를 유지할 수 있다. 일부 예에서, 비-휘발성 메모리는 플래시 메모리를 포함할 수 있다. 일부 예에서, 비-휘발성 메모리는 동적 랜덤 액세스 메모리(DRAM)를 포함할 수 있다. 일부 예에서, 비-휘발성 메모리는 강유전성 랜덤 액세스 메모리(FRAM)를 포함할 수 있다. 일부 예에서, 비-휘발성 메모리는 상-변화 랜덤 액세스 메모리(PRAM)를 포함할 수 있다.
일부 예에서, 디바이스는, 예를 들어, CD-ROM, DVD, 플래시 메모리 디바이스, 자기 디스크 드라이브, 자기 테이프 드라이브, 광 디스크 드라이브, 및 클라우드 컴퓨팅 기반 저장소를 포함하는 저장 디바이스일 수 있다. 일부 예에서, 저장 및/또는 메모리 디바이스는 본원에 개시된 것들과 같은 디바이스의 조합일 수 있다. 일부 예에서, 디지털 처리 디바이스는 시각적 정보를 사용자에게 전송하는 디스플레이를 포함할 수 있다. 일부 예에서, 디스플레이는 음극선관(CRT)일 수 있다. 일부 예에서, 디스플레이는 액정 디스플레이(LCD)일 수 있다. 일부 예에서, 디스플레이는 박막 트랜지스터 액정 디스플레이(TFT-LCD)일 수 있다. 일부 예에서, 디스플레이는 유기 발광 다이오드(OLED) 디스플레이일 수 있다. 일부 예에서, OLED 디스플레이는 수동-매트릭스 OLED(PMOLED) 또는 능동-매트릭스 OLED(AMOLED) 디스플레이일 수 있다. 일부 예에서, 디스플레이는 플라즈마 디스플레이일 수 있다. 일부 예에서, 디스플레이는 비디오 프로젝터일 수 있다. 일부 예에서, 디스플레이는 본원에 개시된 것과 같은 장치의 조합일 수 있다.
일부 예에서, 디지털 처리 디바이스는 사용자로부터 정보를 수신하기 위한 입력 디바이스를 포함할 수 있다. 일부 예에서, 입력 디바이스는 키보드일 수 있다. 일부 예에서, 입력 디바이스는, 예를 들어, 마우스, 트랙볼, 트랙 패드, 조이스틱, 게임 컨트롤러, 또는 스타일러스를 포함하는 포인팅 디바이스일 수 있다. 일부 예에서, 입력 디바이스는 터치 스크린 또는 멀티-터치 스크린일 수 있다. 일부 예에서, 입력 디바이스는 음성 또는 기타 사운드 입력을 캡처하기 위한 마이크일 수 있다. 일부 예에서, 입력 디바이스는 모션 또는 시각적 입력을 캡처하기 위한 비디오 카메라일 수 있다. 일부 예에서, 입력 디바이스는 본원에 개시된 것들과 같은 디바이스의 조합일 수 있다.
D. 비-일시적 컴퓨터-판독 가능 저장 매체
일부 예에서, 본원에 개시된 주제는 선택적으로 네트워크된 디지털 처리 디바이스의 운영 체제에 의해 실행 가능한 명령을 포함하는 프로그램으로 인코딩된 하나 이상의 비-일시적 컴퓨터-판독 가능 저장 매체를 포함할 수 있다. 일부 예에서, 컴퓨터-판독 가능 저장 매체는 디지털 처리 디바이스의 유형적 구성 요소일 수 있다. 일부 예에서, 컴퓨터-판독 가능 저장 매체는 선택적으로 디지털 처리 디바이스로부터 제거 가능할 수 있다. 일부 예에서, 컴퓨터-판독 가능 저장 매체는, 예를 들어, CD-ROM, DVD, 플래시 메모리 장치, 솔리드 스테이트 메모리, 자기 디스크 드라이브, 자기 테이프 드라이브, 광 디스크 드라이브, 클라우드 컴퓨팅 시스템 및 서비스 등을 포함할 수 있다. 일부 예에서, 프로그램 및 명령은 영구적으로, 실질적으로 영구적으로, 반영구적으로, 또는 비일시적으로 매체에 인코딩될 수 있다.
E. 컴퓨터 시스템
본 개시는 본원에 기재된 방법을 구현하도록 프로그래밍된 컴퓨터 시스템을 제공한다. 도 1은 환자 데이터, 생물학적 데이터, 생물학적 서열, 및 참조 서열을 저장, 처리, 식별 또는 해석하도록 프로그래밍되거나 달리 구성된 컴퓨터 시스템(101)을 도시한다. 컴퓨터 시스템(101)은 본 개시의 환자 데이터, 생물학적 데이터, 생물학적 서열, 또는 참조 서열의 다양한 측면을 처리할 수 있다. 컴퓨터 시스템(101)은 사용자의 전자 디바이스 또는 전자 디바이스와 관련하여 원격에 위치한 컴퓨터 시스템일 수 있다. 전자 디바이스는 모바일 전자 디바이스일 수 있다.
컴퓨터 시스템(101)은 단일 코어 또는 멀티 코어 프로세서, 또는 병렬 처리를 위한 복수의 프로세서일 수 있는 중앙 처리 장치(CPU, 본원에서 또한 "프로세서" 및 "컴퓨터 프로세서")(105)를 포함한다. 컴퓨터 시스템(101)은 또한 메모리 또는 메모리 위치(110)(예를 들어, 랜덤 액세스 메모리, 읽기-전용 메모리, 플래시 메모리), 전자 저장 장치(115)(예를 들어, 하드 디스크), 하나 이상의 다른 시스템과 통신하기 위한 통신 인터페이스(120)(예를 들어, 네트워크 어댑터), 및 주변 디바이스(125), 예컨대, 캐시, 기타 메모리, 데이터 저장소 및/또는 전자 디스플레이 어댑터를 포함한다. 메모리(110), 저장 장치(115), 인터페이스(120) 및 주변 디바이스(125)는 마더보드와 같은 통신 버스(실선)를 통해 CPU(105)와 통신한다. 저장 장치(115)는 데이터를 저장하기 위한 데이터 저장 장치(또는 데이터 저장소)일 수 있다. 컴퓨터 시스템(101)은 통신 인터페이스(120)의 도움으로 컴퓨터 네트워크("네트워크")(130)에 작동 가능하게 결합될 수 있다. 네트워크(130)는 인터넷, 인터넷 및/또는 엑스트라넷, 또는 인터넷과 통신하는 인트라넷 및/또는 엑스트라넷일 수 있다. 일부 예에서 네트워크(130)는 텔레커뮤니케이션 및/또는 데이터 네트워크이다. 네트워크(130)는 클라우드 컴퓨팅과 같은 분산 컴퓨팅을 가능하게 할 수 있는 하나 이상의 컴퓨터 서버를 포함할 수 있다. 네트워크(130)는 일부 예에서 컴퓨터 시스템(101)의 도움으로 피어-투-피어 네트워크를 구현할 수 있으며, 이는 컴퓨터 시스템(101)에 연결된 디바이스가 클라이언트 또는 서버로서 동작하도록 할 수 있다.
CPU(105)는 프로그램 또는 소프트웨어로 구현될 수 있는 기계-판독 가능 명령 시퀀스를 실행할 수 있다. 명령은 메모리(110)와 같은 메모리 위치에 저장될 수 있다. 명령은 CPU(105)로 지시될 수 있으며, 이는 본 개시의 방법을 구현하기 위해 CPU(105)를 후속적으로 프로그래밍하거나 달리 구성할 수 있다. CPU(105)에 의해 수행되는 작업의 예는 페치, 디코딩, 실행 및 라이트백(writeback)을 포함할 수 있다.
CPU(105)는 집적 회로와 같은 회로의 일부일 수 있다. 시스템 (101)의 하나 이상의 다른 구성 요소가 회로에 포함될 수 있다. 일부 예에서, 회로는 주문형 집적 회로(ASIC)이다.
저장 장치(115)는 드라이버, 라이브러리 및 저장된 프로그램과 같은 파일을 저장할 수 있다. 저장 장치(115)는 사용자 데이터, 예를 들어 사용자 선호도 및 사용자 프로그램을 저장할 수 있다. 일부 예에서 컴퓨터 시스템(101)은 인트라넷 또는 인터넷을 통해 컴퓨터 시스템(101)과 통신하는 원격 서버에 위치된 것과 같이, 컴퓨터시스템(101) 외부에 있는 하나 이상의 추가 데이터 저장 장치를 포함할 수 있다.
컴퓨터 시스템(101)은 네트워크(130)를 통해 하나 이상의 원격 컴퓨터 시스템과 통신할 수 있다. 예를 들어, 컴퓨터 시스템(101)은 사용자의 원격 컴퓨터 시스템과 통신할 수 있다. 원격 컴퓨터 시스템의 예로는 개인용 컴퓨터(예를 들어, 휴대용 PC), 슬레이트 또는 태블릿 PC(예를 들어, Apple® iPad, Samsung® Galaxy Tab), 전화기, 스마트폰(예를 들어, Apple® iPhone, Android-사용 가능 디바이스, Blackberry®), 또는 개인용 정보 단말기가 포함된다. 사용자는 네트워크(130)를 통해 컴퓨터 시스템(101)에 액세스할 수 있다.
본원에 기술된 바와 같은 방법은, 예를 들어, 메모리(110) 또는 전자 저장 장치(115)와 같은 컴퓨터 시스템(101)의 전자 저장 위치에 저장된 기계(예를 들어, 컴퓨터 프로세서) 실행 가능 코드에 의해 구현될 수 있다. 기계-실행 가능 코드 또는 기계-판독 가능 코드는 소프트웨어 형태로 제공될 수 있다. 사용 중에, 코드는 프로세서(105)에 의해 실행될 수 있다. 일부 예에서, 코드는 저장 장치(115)으로부터 검색되고 프로세서(105)에 의한 빠른 액세스를 위해 메모리(110)에 저장될 수 있다. 일부 예에서, 전자 저장 장치(115)는 제외될 수 있고, 기계-실행 가능 명령은 메모리(110)에 저장된다.
코드는 코드를 실행하기에 적합한 프로세서를 갖는 기계와 함께 사용하기 위해 프리컴파일링되고 구성될 수 있거나 런타임 동안 해석 또는 컴파일링될 수 있다. 코드는 프리컴파일링되거나, 해석되거나, 컴파일링된 방식으로 코드가 실행할 수 있도록 선택될 수 있는 프로그래밍 언어로 제공될 수 있다.
컴퓨터 시스템(101)과 같은 본원에 제공된 시스템 및 방법의 측면은 프로그래밍으로 구현될 수 있다. 기술의 다양한 측면은 전형적으로 기계(또는 프로세서) 실행 가능 코드 및/또는 일종의 기계 판독 가능 매체에서 수행되거나 구현되는 관련 데이터의 형태인 "제품" 또는 "물품"으로 간주될 수 있다. 기계-실행 가능 코드는 메모리(예를 들어, 읽기-전용 메모리, 랜덤 액세스 메모리, 플래시 메모리) 또는 하드 디스크와 같은 전자 저장 장치에 저장될 수 있다. "저장"형 매체는 소프트웨어 프로그래밍을 위해 언제든지 비일시적 스토리지를 제공할 수 있는 다양한 반도체 메모리, 테이프 드라이브, 디스크 드라이브 등과 같은, 컴퓨터, 프로세서 등, 또는 이의 관련 모듈의 모든 유형의 메모리를 포함할 수 있다. 소프트웨어의 전부 또는 일부는 때때로 인터넷 또는 다양한 기타 텔레커뮤니케이션 네트워크를 통해 통신될 수 있다. 예를 들어, 이러한 통신은 하나의 컴퓨터 또는 프로세서에서 또 다른 컴퓨터 또는 프로세서로, 예를 들어 관리 서버 또는 호스트 컴퓨터에서 애플리케이션 서버의 컴퓨터 플랫폼으로 소프트웨어의 로딩을 가능하게 할 수 있다. 따라서, 소프트웨어 요소를 지닐 수 있는 또 다른 유형의 매체에는 유선 및 광 유선 네트워크를 통해, 다양한 무선 링크를 통해 로컬 디바이스 간의 물리적 인터페이스를 통해 사용되는 것과 같은 광, 전기 및 전자기파가 포함된다. 유선 또는 무선 링크, 광 링크 등과 같이 이러한 파동을 전달하는 물리적 요소도 소프트웨어를 포함하는 매체로서 간주될 수 있다. 본원에서 사용되는 바와 같이, 비일시적 유형의 "저장" 매체로 제한되지 않는 한, 컴퓨터 또는 기계 "판독 가능 매체"와 같은 용어는 실행을 위해 프로세서에 명령을 제공하는 데 참여하는 임의의 매체를 지칭한다.
따라서, 컴퓨터-실행 가능 코드와 같은 기계 판독 가능 매체는 유형의 저장 매체, 반송파 매체 또는 물리적 전송 매체를 포함하지만, 이로 제한되지 않는 다양한 형태를 취할 수 있다. 비-휘발성 저장 매체는, 예를 들어, 광학 또는 자기 디스크, 예컨대, 도면에 도시된 데이터베이스를 구현하는 데 사용될 수 있는 것 등과 같은 임의의 컴퓨터(들)의 임의의 저장 디바이스 등을 포함한다. 휘발성 저장 매체는 이러한 컴퓨터 플랫폼의 주 메모리와 같은 동적 메모리를 포함할 수 있다. 유형의 전송 매체에는 동축 케이블; 컴퓨터 시스템 내의 버스를 구성하는 와이어를 포함한 구리 와이어 및 광섬유가 포함된다. 반송파 전송 매체는 전기 또는 전자기 신호, 또는 무선 주파수(RF) 및 적외선(IR) 데이터 통신 중에 생성되는 것과 같은 음향 또는 광파의 형태를 취할 수 있다. 따라서, 컴퓨터 판독-가능 매체의 일반적인 형태에는, 예를 들어, 플로피 디스크, 플렉시블 디스크, 하드 디스크, 자기 테이프, 임의의 기타 자기 매체, CD-ROM, DVD 또는 DVD-ROM, 임의의 기타 광학 매체, 펀치 카드 용지 테이프, 구멍 패턴이 있는 임의의 기타 물리적 저장 매체, RAM, ROM, PROM 및 EPROM, FLASH-EPROM, 기타 메모리 칩 또는 카트리지, 데이터 또는 명령을 전송하는 반송파, 이러한 반송파를 전송하는 케이블 또는 링크, 또는 컴퓨터가 프로그래밍 코드 및/또는 데이터를 읽을 수 있는 임의의 기타 매체가 포함된다. 이러한 형태의 컴퓨터 판독 가능 매체 중 다수는 실행을 위해 하나 이상의 명령의 하나 이상의 시퀀스를 프로세서에 전달하는 데 관여할 수 있다.
컴퓨터 시스템(101)은, 예를 들어, 핵산 서열, 풍부화 핵산 샘플, miRNA 프로파일, 발현 프로파일, 및 RNA 발현 프로파일의 분석을 제공하기 위한 사용자 인터페이스(UI)(140)를 포함하는 전자 디스플레이(135)를 포함하거나 이와 통신할 수 있다. UI의 예로는, 제한 없이, 그래픽 사용자 인터페이스(GUI) 및 웹-기반 사용자 인터페이스가 포함된다.
본 개시의 방법 및 시스템은 하나 이상의 알고리즘에 의해 구현될 수 있다. 알고리즘은 중앙 처리 장치(105)에 의해 실행될 때 소프트웨어에 의해 구현될 수 있다. 알고리즘은, 예를 들어, 환자 데이터, 생물학적 데이터, 생물학적 서열, 및 참조 서열을 저장, 처리, 식별 또는 해석할 수 있다.
일부 예에서, 본원에 개시된 주제는 적어도 하나의 컴퓨터 프로그램 또는 이의 용도를 포함할 수 있다. 컴퓨터 프로그램은 지정된 작업을 수행하도록 작성된, 디지털 처리 디바이스의 CPU, GPU, 또는 TPU에서 실행 가능한 명령 시퀀스일 수 있다. 컴퓨터-판독 가능 명령은 특정 작업을 수행하거나 특정 추상 데이터 유형을 구현하는 함수, 객체, 애플리케이션 프로그래밍 인터페이스(API), 데이터 구조 등과 같은 프로그램 모듈로 구현될 수 있다. 본원에 제공된 개시에 비추어, 컴퓨터 프로그램은 다양한 언어의 다양한 버전으로 작성될 수 있다.
컴퓨터-판독 가능 명령의 기능은 다양한 환경에서 원하는 대로 결합되거나 분산될 수 있다. 일부 예에서, 컴퓨터 프로그램은 하나의 명령 시퀀스를 포함할 수 있다. 일부 예에서, 컴퓨터 프로그램은 복수의 명령 시퀀스를 포함할 수 있다. 일부 예에서, 컴퓨터 프로그램은 한 위치로부터 제공될 수 있다. 일부 예에서, 컴퓨터 프로그램은 복수의 위치로부터 제공될 수 있다. 일부 예에서, 컴퓨터 프로그램은 하나 이상의 소프트웨어 모듈을 포함할 수 있다. 일부 예에서, 컴퓨터 프로그램은 부분적으로 또는 전체적으로 하나 이상의 웹 애플리케이션, 하나 이상의 모바일 애플리케이션, 하나 이상의 독립형 애플리케이션, 하나 이상의 웹 브라우저 플러그인, 확장, 애드인, 또는 애드온, 또는 이들의 조합을 포함할 수 있다.
일부 예에서, 컴퓨터 처리는 통계, 수학, 생물학, 또는 이들의 임의의 조합의 방법일 수 있다. 일부 예에서, 컴퓨터 처리 방법은, 예를 들어, 로지스틱 회귀, 차원 축소, 주성분 분석, 오토인코더, 특이 값 분해, 푸리에 기저, 특이 값 분해, 웨이블렛, 판별 분석, 서포트 벡터 머신, 트리-기반 방법, 랜덤 포레스트, 그라디언트 부스트 트리, 로지스틱 회귀, 행렬 인수 분해, 네트워크 클러스터링, 및 신경망을 포함하는 차원 축소 방법을 포함한다.
일부 예에서, 컴퓨터 처리 방법은, 예를 들어, 회귀, 서포트 벡터 머신, 트리-기반 방법, 및 네트워크를 포함하는 지도 기계 학습 방법이다.
일부 예에서, 컴퓨터 처리 방법은, 예를 들어, 클러스터링, 네트워크, 주성분 분석, 및 행렬 인수 분해를 포함하는 비지도 기계 학습 방법이다.
F. 데이터베이스
일부 예에서, 본원에 개시된 주제는 하나 이상의 데이터베이스, 또는 환자 데이터, 생물학적 데이터, 생물학적 서열, 또는 참조 서열을 저장하기 위한 이의 용도를 포함할 수 있다. 참조 서열은 데이터베이스에서 유래할 수 있다. 본원에 제공된 개시의 관점에서, 많은 데이터베이스가 서열 정보의 저장 및 검색에 적합할 수 있다. 일부 예에서, 적합한 데이터베이스는, 예를 들어, 관계형 데이터베이스, 비-관계형 데이터베이스, 객체-지향 데이터 베이스, 객체 데이터베이스, 엔티티-관계 모델 데이터베이스, 연관 데이터베이스, 및 XML 데이터베이스를 포함할 수 있다. 일부 예에서, 데이터베이스는 인터넷-기반일 수 있다. 일부 예에서, 데이터베이스는 웹-기반일 수 있다. 일부 예에서, 데이터베이스는 클라우드 컴퓨팅-기반일 수 있다. 일부 예에서, 데이터베이스는 하나 이상의 로컬 컴퓨터 저장 디바이스를 기반으로 할 수 있다.
일 측면에서, 본 개시는 프로세서가 본원에 개시된 방법을 수행하도록 지시하는 명령어를 포함하는 비-일시적 컴퓨터-판독 가능 매체를 제공한다.
일 측면에서, 본 개시는 컴퓨터-판독 가능 매체를 포함하는 컴퓨팅 디바이스를 제공한다.
또 다른 측면에서, 본 개시는 다음을 포함하는 생물학적 샘플의 분류를 수행하기 위한 시스템을 제공한다:
a) 복수의 훈련 샘플을 수신하는 수신기로서, 각각의 복수의 훈련 샘플은 분자의 복수의 부류를 갖고, 여기서 각각의 복수의 훈련 샘플은 하나 이상의 공지된 표지를 포함하는, 수신기,
b) 각각의 복수의 훈련 샘플에 대하여 기계 학습 모델에 입력되도록 작동 가능한 검정에 상응하는 피처의 세트를 식별하는 피처 모듈로서, 피처의 세트는 복수의 훈련 샘플에서 분자의 성질에 상응하고, 각각의 복수의 훈련 샘플에 대하여, 시스템은 훈련 샘플에서 분자의 복수의 부류를 복수의 상이한 검정의 대상이 되도록 작동 가능하여 측정치의 세트를 수득하고, 측정치의 각각의 세트는 하나의 검정으로부터 훈련 샘플에서 분자의 부류에 적용되고, 측정치의 복수의 세트는 복수의 훈련 샘플에 대하여 수득되는, 피처 모듈,
c) 훈련 샘플에 대하여 훈련 벡터를 수득하기 위하여 측정치의 세트를 분석하는 분석 모듈로서, 훈련 벡터는 상응하는 검정의 피처의 N 세트의 피처 값을 포함하고, 각각의 피처 값은 피처에 상응하고 하나 이상의 측정치를 포함하고, 훈련 벡터는 복수의 상이한 검정의 제1 서브세트에 상응하는 피처의 N 세트 중 적어도 둘로부터의 적어도 하나의 피처를 사용하여 형성되는, 분석 모듈,
d) 기계 학습 모델의 파라미터를 사용하여 훈련 벡터 상의 시스템에 정보를 주어 복수의 훈련 샘플을 위한 출력 표지를 수득하는 표지화 모듈,
e) 출력 표지를 훈련 샘플의 공지된 표지에 비교하는 비교기 모듈,
f) 훈련 샘플의 공지된 표지에 대한 출력 표지의 비교를 기반으로 기계 학습 모델을 훈련의 부분으로서 파라미터의 최적 값을 반복하여 검색하는 훈련 모듈, 및
g) 기계 학습 모델의 파라미터 및 기계 학습 모델에 대한 피처의 세트를 제공하는 출력 모듈.
VI. 집단에서 대상체를 분류하는 방법
개시된 방법은 대상체에서 발현된 miRNA의 분석을 통해 결장 세포 증식성 장애와 관련된 게놈 DNA 발현의 파라미터를 확인하는 것에 관한 것이다. 방법은 보다 구체적으로 상기 장애의 병기 또는 서브클래스 사이의 구별 및 상기 장애에 대한 유전적 소인의 개선된 식별 및 차등을 가능하게 함으로써 결장 세포 증식성 장애의 개선된 진단, 치료 및 모니터링에 사용하기 위한 것이다.
일부 실시양태에서, 방법은 집단에서 대상체로부터의 생물학적 샘플에서 miRNA의 차등 발현을 분석하는 것을 포함한다.
본 개시는, 예를 들어, 결장 세포 증식성 장애가 있거나 없는 대상체 사이에서 차등 발현된 무세포 miRNA를 검출하기 위해, 무세포 샘플에 적용될 수 있는 결장 세포 증식성 장애를 검출하기 위한 방법을 제공한다. 방법은 결장 세포 증식성 장애를 갖지 않는 건강한 대상체와 비교하여 결장 세포 증식성 장애 신호에 대한 기본 "양성" 또는 "음성"으로서 miRNA의 검출을 이용한다.
일부 실시양태에서, 결장 세포 증식성 장애는 선종(선종성 용종), 무경성 거치상 선종(SSA), 진행성 선종, 결장직장 이형성증, 결장직장 선종, 결장직장암, 결장암, 직장암, 결장직장 암종, 결장직장 선암종, 카르시노이드 종양, 위장 카르시노이드 종양, 위장 기질 종양(GIST), 림프종, 및 육종으로 이루어진 군으로부터 선택된다.
일 측면에서, 본 개시는 다음을 포함하는 대상체로부터의 생물학적 샘플의 miRNA 프로파일을 결정하기 위한 방법을 제공한다:
a) 생물학적 샘플로부터 RNA를 단리하는 단계;
b) RNA를 cDNA로 역전사시키기 전 또는 후에 생물학적 샘플로부터의 핵산에 RNA 어댑터를 결찰하는 단계;
c) 단계 b)의 cDNA를 증폭시키는 단계;
d) cDNA 분자의 핵산 서열을 결정하는 단계, 및
e) 대상체의 miRNA 프로파일을 결정하기 위해, 표 1-11에 열거된 군으로부터 선택된 miRNA의 미리-확인된 패널에 대한 참조 핵산 서열에 핵산 분자의 핵산 서열을 정렬하는 단계.
일부 실시양태에서, 핵산 시퀀싱 라이브러리는 증폭 전에 제조된다.
일부 실시양태에서, 어댑터 결찰은 c) 전에 RNA 어댑터 결찰, 어댑터 차단, 어댑터 순환 및 이량체 제거를 포함한다.
일부 실시양태에서, 참조 핵산 서열은 인간 게놈 또는 인간 전사체 데이터베이스의 일부이다.
일부 실시양태에서, 대상체의 miRNA 프로파일을 결정하는 것은 발현된 miRNA의 카운트 표를 생성하는 것을 포함한다.
일부 실시양태에서, 대상체의 miRNA 프로파일을 결정하는 것은 차등적으로 풍부한 miRNA를 식별하기 위해 발현된 miRNA의 카운트 표를 생성하는 것을 포함한다.
일부 실시양태에서, miRNA 프로파일은 결장 세포 증식성 장애와 관련되며, 결장 세포 증식성 장애를 갖는 것으로서 대상체의 분류를 제공한다.
일부 실시양태에서, 대상체로부터 얻어진 생물학적 샘플은 체액, 대변, 결장 유출물, 소변, 혈장, 혈청, 전혈, 단리된 혈액 세포, 혈액으로부터 단리된 세포, 및 이들의 조합으로 이루어진 군으로부터 선택된다.
일부 실시양태에서, 방법은 건강한 대상체로부터의 측정된 miRNA 시그니처 패널의 데이터베이스에 대해 대상체로부터 측정된 miRNA 시그니처 패널을 적용하는 단계로서, 데이터베이스는 컴퓨터 시스템에 저장되는 단계; 건강한 대상체로부터의 miRNA 상태에 비해 miRNA 시그니처 패널에서 적어도 5%, 적어도 10%, 적어도 15%, 적어도 20%, 적어도 25%, 적어도 30%, 적어도 35%, 적어도 40%, 적어도 45%, 또는 적어도 50%의 변화를 측정함으로써 대상체가 결장 세포 증식성 장애를 가질 증가된 위험을 갖는지 결정하는 단계를 포함한다.
일부 실시양태에서, 결장 세포 증식성 장애는 선종(선종성 용종), 무경성 거치상 선종(SSA), 진행성 선종, 결장직장 이형성증, 결장직장 선종, 결장직장암, 결장암, 직장암, 결장직장 암종, 결장직장 선암종, 카르시노이드 종양, 위장 카르시노이드 종양, 위장 기질 종양(GIST), 림프종, 및 육종으로 이루어진 군으로부터 선택된다.
일부 실시양태에서, 결장 세포 증식성 장애는 1기 결장직장암, 2기 결장직장암, 3기 결장직장암, 및 4기 결장직장암으로 이루어진 군으로부터 선택된다.
또 다른 측면에서, 본 개시는 대상체에서 결장 세포 증식성 장애를 검출하기 위한 방법으로서,
a) 생물학적 샘플로부터 RNA를 단리하는 단계;
b) 생물학적 샘플로부터 RNA에 RNA 어댑터를 결찰하고 RNA를 cDNA로 역전사시키는 단계;
c) 단계 b)의 cDNA를 증폭시키는 단계;
d) cDNA 분자의 핵산 서열을 결정하는 단계; 및
e) 대상체의 miRNA 프로파일을 결정하기 위해, 표 1-11에 열거된 군으로부터 선택된 miRNA의 미리-확인된 패널의 핵산 서열을 정렬하는 단계; 및
f) miRNA 프로파일을 건강한 대상체와 결장 세포 증식성 장애가 있는 대상체를 구별할 수 있도록 훈련된 기계 학습 모델에 입력하여 결장 세포 증식성 장애의 존재와 관련된 출력 값을 제공함으로써, 대상체에서 결장 세포 증식성 장애의 존재를 지시하는 단계.
일부 실시양태에서, 참조 핵산 서열은 인간 게놈 또는 인간 전사체 데이터베이스의 일부이다.
일부 실시양태에서, 대상체의 miRNA 프로파일을 결정하는 것은 발현된 miRNA의 카운트 표를 생성하는 것을 포함한다.
일부 실시양태에서, 대상체의 miRNA 프로파일을 결정하는 것은 차등적으로 풍부한 miRNA를 식별하기 위해 발현된 miRNA의 카운트 표를 생성하는 것을 포함한다.
일부 실시양태에서, miRNA 프로파일은 기계 학습 모델에 입력되어 대상체의 2 개 그룹(예를 들어, 건강한 대 암, 질환 병기, 진행성 선종 대 암)을 구별할 수 있는 분류기를 수득한다.
일부 실시양태에서, 대상체로부터 얻어진 생물학적 샘플은 체액, 대변, 결장 유출물, 소변, 혈장, 혈청, 전혈, 단리된 혈액 세포, 혈액으로부터 단리된 세포, 및 이들의 조합으로 이루어진 군으로부터 선택된다.
일부 실시양태에서, 방법은 건강한 대상체로부터의 측정된 miRNA 시그니처 패널의 데이터베이스에 대해 대상체로부터 측정된 miRNA 시그니처 패널을 적용하는 단계로서, 데이터베이스는 컴퓨터 시스템에 저장되는 단계; 건강한 대상체로부터의 miRNA 상태에 비해 miRNA 시그니처 패널의 miRNA 발현에서 적어도 5%, 적어도 10%, 적어도 15%, 적어도 20%, 적어도 25%, 적어도 30%, 적어도 35%, 적어도 40%, 적어도 45%, 또는 적어도 50%의 변화를 측정함으로써 대상체가 결장 세포 증식성 장애를 가질 증가된 위험도를 갖는지 결정하는 단계를 포함한다.
일부 실시양태에서, 결장 세포 증식성 장애는 선종(선종성 용종), 무경성 거치상 선종(SSA), 진행성 선종, 결장직장 이형성증, 결장직장 선종, 결장직장암, 결장암, 직장암, 결장직장 암종, 결장직장 선암종, 카르시노이드 종양, 위장 카르시노이드 종양, 위장 기질 종양(GIST), 림프종, 및 육종으로 이루어진 군으로부터 선택된다.
일부 실시양태에서, 결장 세포 증식성 장애는 1기 결장직장암, 2기 결장직장암, 3기 결장직장암, 및 4기 결장직장암으로 이루어진 군으로부터 선택된다.
본원에 기재된 훈련된 기계 학습 방법, 모델, 및 판별 분류기는 암 검출, 진단 및 치료 반응성을 포함하는 다양한 의학적 적용에 적용될 수 있다. 모델은 대상체 메타데이터 및 분석물-유도된 특징에 의해 훈련될 수 있기 때문에, 적용은 집단에서 대상체를 계층화하고 따라서 치료 결정을 안내하도록 조정될 수 있다.
진단
본원에 제공된 방법 및 시스템은 암을 갖는 대상체(예를 들어, 결장직장암, CRC)의 진단의 출력을 생성하기 위하여 인공 지능-기반의 접근법을 사용하는 예측 분석을 수행하여 대상체(환자)로부터 수득된 데이터를 분석할 수 있다. 예를 들어, 적용은 암을 갖는 대상체의 진단을 생성하기 위하여 수득된 데이터에 예측 알고리즘을 적용할 수 있다. 예측 알고리즘은 암을 갖는 대상체의 진단을 생성하기 위하여 수득된 데이터를 처리하도록 구성된 인공 지능-기반의 예측, 예컨대, 기계 학습 기반의 예측을 포함할 수 있다.
기계 학습 예측은 입력으로서 암을 갖는 환자의 코호트의 하나 이상의 세트로부터의 데이터세트, 예를 들어, 대상체의 생물학적 샘플에 대해 본원에 기재된 시그니처 패널을 이용한 RNA 검정을 수행하여 생성된 데이터세트 및 기계 학습 예측에 대한 출력으로서 대상체의 공지된 진단(예를 들어, 병기구분 및/또는 종양 분획) 결과를 사용하여 훈련될 수 있다.
훈련 데이터세트(예를 들어, 대상체의 생물학적 샘플에 대한 본원에 기재된 시그니처 패널을 사용하는 메틸화 검정을 수행하여 생성된 데이터세트)는, 예를 들어, 공통 특징(피처) 및 결과(표지)를 갖는 대상체의 하나 이상의 세트로부터 생성될 수 있다. 훈련 데이터세트는 진단에 관한 피처에 상응하는 특징 및 표지의 세트를 포함할 수 있다. 피처는, 예를 들어, cfRNA 검정 측정의 특정한 범위 또는 카테고리와 같은 특징, 예컨대, 각각의 참조 게놈의 빈(게놈 윈도우)의 세트 내에 중첩되거나 속하는 건강한 샘플 및 질환 샘플로부터 얻어진 생물학적 샘플에서 cfRNA 또는 이의 단편의 수를 포함할 수 있다. 예를 들어, 주어진 시점에 주어진 대상체로부터 수집된 피처의 세트는 진단적 시그니처로서 집합적으로 제공될 수 있고, 이는 주어진 시점에 대상체의 식별된 암의 지표일 수 있다. 특징은 또한, 예컨대, 하나 이상의 암에 대한 대상체의 진단적 결과를 지시하는 표지를 포함할 수 있다.
표지는, 예를 들어, 대상체의 공지된 진단(예를 들어, 병기구분 및/또는 종양 분획) 결과와 같은 결과를 포함할 수 있다. 결과는 대상체에서 암과 연관된 특징을 포함할 수 있다. 예를 들어, 특징은 하나 이상의 암을 갖는 대상체의 지표일 수 있다.
훈련 세트(예를 들어, 훈련 데이터세트)는 대상체(예를 들어, 하나 이상의 암을 갖거나 갖지 않은 환자의 후행 및/또는 선행 코호트)의 하나 이상의 세트에 상응하는 데이터의 세트의 무작위 샘플링에 의해 선택될 수 있다. 대안적으로, 훈련 세트(예를 들어, 훈련 데이터세트)는 대상체(예를 들어, 하나 이상의 암을 갖거나 갖지 않은 환자의 후행 및/또는 선행 코호트)의 하나 이상의 세트에 상응하는 데이터의 세트의 비례 샘플링에 의해 선택될 수 있다. 훈련 세트는 대상체(예를 들어, 상이한 임상 부위 또는 시험으로부터의 환자)의 하나 이상의 세트에 상응하는 데이터의 세트에 걸쳐 균형이 맞춰질 수 있다. 기계 학습 예측은 진단적 정확도 측정에 상응하는 최소 원하는 값을 갖는 것과 같이 정확도 또는 성능에 대한 특정한 미리 결정된 조건이 충족될 때까지 훈련될 수 있다. 예를 들어, 진단적 정확도 측정은 대상체에서 하나 이상의 암의 진단, 병기구분, 또는 종양 분획의 예측에 상응할 수 있다.
진단적 정확도 측정의 예는 민감도, 특이성, 양성 예측치(PPV), 음성 예측치(NPV), 정확도, 및 암(예를 들어, 결장직장암)을 검출하거나 예측하는 진단적 정확도에 상응하는 수신자-조작 특징(ROC) 곡선의 곡선하면적(AUC)을 포함할 수 있다.
일 측면에서, 본 개시는 대상체의 집단을 구별할 수 있는 분류기를 사용하는 방법으로서,
a) 생물학적 샘플에서 RNA를 검정하는 단계로서, 상기 검정은 생물학적 샘플에서 RNA를 나타내는 측정치의 세트를 제공하는 단계,
b) 기계 학습 또는 통계적 모델에 입력될 생물학적 샘플에서 RNA의 성질에 상응하는 피처의 세트를 식별하는 단계,
c) 각각의 복수의 측정치의 세트로부터의 피처 값의 피처 벡터를 형성하는 단계로서, 각각의 피처 값은 피처의 세트의 피처에 상응하고 하나 이상의 측정치를 포함하고, 피처 벡터는 복수의 측정치 세트의 각 세트를 사용하여 수득된 적어도 하나의 피처 값을 포함하는 단계,
d) 컴퓨터 시스템의 메모리에, 분류기를 포함하는 기계 학습 모델, 훈련 생물학적 샘플로부터 수득된 훈련 벡터를 사용하여 훈련된 기계 학습 모델, 특정된 성질을 갖는 것으로 식별된 훈련 생물학적 샘플의 제1 서브세트 및 상기 특정된 성질을 갖지 않는 것으로 식별된 훈련 생물학적 샘플의 제2 서브세트를 로딩하는 단계,
e) 피처 벡터를 기계 학습 모델에 입력하여 생물학적 샘플이 특정된 성질을 갖는지의 여부의 출력 분류를 수득함으로써, 상기 특정된 성질을 갖는 상기 개체의 집단을 구별하는 단계.
또 다른 측면에서, 본 개시는 대상체에서 암을 식별하기 위한 방법으로서,
a) 생물학적 샘플로부터 RNA를 단리하는 단계;
b) 생물학적 샘플로부터 RNA에 RNA 어댑터를 결찰하고 RNA를 cDNA로 역전사시키는 단계;
c) 단계 b)의 cDNA를 증폭시키는 단계;
d) cDNA 분자의 핵산 서열을 결정하는 단계; 및
e) 대상체의 miRNA 프로파일을 결정하기 위해, 표 1-11에 열거된 군으로부터 선택된 miRNA의 미리-식별된 패널에 대한 참조 핵산 서열에 핵산 분자의 핵산 서열을 정렬하는 단계;
f) miRNA 프로파일을 건강한 대상체와 결장 세포 증식성 장애를 갖는 대상체를 구별할 수 있도록 훈련된 기계 학습 모델에 입력하여 결장 세포 증식성 장애의 존재와 관련된 출력 값을 제공함으로써, 대상체에서 결장 세포 증식성 장애의 존재를 지시하여 상기 암을 갖는 상기 대상체의 가능성을 생성하는 단계.
일부 실시양태에서, 상기 적어도 약 10 개의 별개의 miRNA는 적어도 약 20 개의 별개의 miRNA를 포함하고, 상기 적어도 약 20 개의 별개의 miRNA 각각은 표 1-11에 열거된 miRNA의 적어도 일부를 포함한다. 일부 예에서, 상기 적어도 약 10 개의 별개의 miRNA는 적어도 약 30 개의 별개의 miRNA를 포함하고, 상기 적어도 약 30 개의 별개의 miRNA 각각은 표 1-11에 열거된 miRNA의 적어도 일부를 포함한다.
일부 실시양태는, 특히 대상체가 췌장 병변을 가질 때, 결장 세포 증식성 장애를 갖거나 결장 세포 증식성 장애가 발병할 높은 위험도를 갖는 대상체의 샘플에서 차등 발현된 miRNA의 프로파일을 제공한다. 결장 세포 증식성 장애를 갖거나 결장 세포 증식성 장애가 발생할 높은 위험도를 갖는 대상체의 샘플에서 차등 발현된 miRNA의 프로파일은 상향-조절된/과다-발현된 miRNA의 프로파일 및 하향-조절되거나 과소-발현된 miRNA의 프로파일의 사용을 포함한다.
일부 실시양태에서, 대상체에서 결장 세포 증식성 장애, 또는 결장 세포 증식성 장애 발병의 높은 위험의 존재를 검출하기 위한 방법은
a) 대상체로부터의 샘플에서 하나 이상의 miRNA의 발현 수준을 검출하는 단계; 및
b) 검출된 발현 수준을 참조 발현 수준과 비교하는 단계로서, 참조 발현 수준과 비교하여 샘플에서 하나 이상의 miRNA의 차등 발현은 각각 결장 세포 증식성 장애의 존재, 또는 결장 세포 증식성 장애의 부재 대비 결장 세포 증식성 장애 발병의 더 높은 위험도, 또는 결장 세포 증식성 장애 발병의 더 낮은 위험도를 지시하는 단계를 포함한다.
참조 발현 수준과 비교하여, 샘플에서 하나 이상의 miRNA의 차등 발현은 결장 세포 증식성 장애 전구체의 지표일 수 있다.
일부 실시양태에서, 샘플은 조직 샘플이고, 하나 이상의 miRNA는 결장 세포 증식성 장애가 발병할 낮은 위험도를 갖는 대상체의 상응하는 세포와 비교하여 결장 세포 증식성 장애가 발생할 더 높은 위험도를 갖는 대상체의 세포에서 차등 발현된 miRNA의 프로파일에 속한다.
일부 실시양태에서, 대상체는 결장직장 병변을 갖고, 하나 이상의 miRNA는 췌장 병변을 갖고 결장 세포 증식성 장애가 발병할 더 낮은 위험도를 갖는 대상체의 상응하는 샘플과 비교하여 결장직장 병변을 갖고 결장 세포 증식성 장애가 발병할 높은 위험도를 갖는 대상체의 샘플에서 차등 발현된 miRNA의 프로파일에 속한다.
일부 방법은 샘플에서 하나 이상의 miRNA의 발현 수준을 검출하기 위해 사용될 수 있다. 예를 들어, miRNA의 측정은 바코드-기반 검정, miRNA 마이크로어레이 분석(예를 들어, 칩), 디지털 폴리머라제 연쇄 반응(PCR), 실시간 PCR, 정량적 역전사 PCR(qRT-PCR), 반-정량적 PCR, 노던 블롯, 또는 동일 반응계 혼성화에 의해 수행될 수 있다. 예를 들어, 성숙 miRNA는, 예를 들어, 시험관내 검정을 사용하여 측정된다.
발현의 임계 또는 컷오프 수준을 확립하기 위한 다양한 통계적 및 수학적 방법이 사용될 수 있다. 특정 바이오마커에 대한 임계 또는 컷오프 발현 수준은, 예를 들어, 본 개시의 실시예 및 도면에 기재된 바와 같은 수신자-조작 특징(ROC) 플롯으로부터의 데이터에 기초하여 선택될 수 있다. 일부 실시양태에서, 이러한 임계 또는 컷오프 발현 수준은, 예를 들어, 특정 바이오마커 또는 이들의 조합에 대한 ROC 플롯을 따라 이동하여, 민감도 또는 특이성에 대한 상이한 값을 수득함으로써, 전체 검정 성능에 영향을 미침으로써 달라질 수 있다. 예를 들어, 목적이 임상적 관점에서 강력한 진단 방법을 갖는 것이라면, 높은 민감도가 우선되어야 한다. 그러나, 목적이 비용-효율적인 방법을 갖는 것이라면, 높은 특이성이 우선되어야 한다. 최상의 컷오프는 최상의 민감도 및 특이성을 생성하는 특정 바이오마커에 대한 ROC 플롯으로부터 수득된 값을 지칭한다. 민감도 및 특이성 값은 임계값(컷오프)의 범위에 걸쳐 계산된다. 따라서, 임계 또는 컷오프 값은 민감도 및/또는 특이성이 적어도 약 70%가 되도록 선택될 수 있고, 예를 들어, 검정된 환자 집단의 적어도 적어도 60%에서, 또는 검정된 환자 집단의 적어도 65%, 70%, 75% 또는 80%에서, 적어도 약 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 적어도 100%일 수 있다.
결과적으로, 본 개시의 실시양태 중 일부는 진단 또는 스크리닝될 대상체로부터 단리된 최소-침습성 샘플에서 이전에 인용된 적어도 마이크로RNA의 발현 수준을 결정하고, 상기 마이크로RNA의 발현 수준을 미리 결정된 임계값 또는 컷오프 값과 비교함으로써 수행될 수 있고, 여기서 상기 미리 결정된 임계값 또는 컷오프 값은 결장직장암 또는 결장직장 선암에 걸릴 위험이 있는 환자 집단에서 결정된 마이크로RNA의 발현 수준에 기초하여 계산된 ROC 곡선의 요망되는 민감도에서 가장 높은 특이성과 상관관계가 있는 상기 마이크로RNA의 발현 수준에 상응하고, 상기 미리 결정된 컷오프 값에 대해 상기 마이크로RNA 중 적어도 하나의 과다-발현은 상기 요망되는 민감도로 직장결장 암 또는 직장결장 선암에 걸린 대상체의 지표이다.
또 다른 예로서, 이러한 미리 결정된 병태는 결장 세포 증식성 장애를 예측하는 특이성이, 예를 들어, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99%의 값을 포함한다는 것일 수 있다.
또 다른 예로서, 이러한 미리 결정된 병태는 결장 세포 증식성 장애를 예측하는 양성 예측 값(PPV)이, 예를 들어, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99%의 값을 포함한다는 것일 수 있다.
또 다른 예로서, 이러한 미리 결정된 병태는 결장 세포 증식성 장애를 예측하는 음성 예측 값(NPV)이, 예를 들어, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99%의 값을 포함한다는 것일 수 있다.
또 다른 예로서, 이러한 미리 결정된 병태는 결장 세포 증식성 장애를 예측하는 수신자-조작 특징(ROC) 곡선의 곡선하 면적(AUC)이 적어도 약 0.50, 적어도 약 0.55, 적어도 약 0.60, 적어도 약 0.65, 적어도 약 0.70, 적어도 약 0.75, 적어도 약 0.80, 적어도 약 0.85, 적어도 약 0.90, 적어도 약 0.95, 적어도 약 0.96, 적어도 약 0.97, 적어도 약 0.98, 또는 적어도 약 0.99의 값을 포함한다는 것일 수 있다.
치료 반응성
본원에 기재된 예측 분류기, 시스템 및 방법은 임상적 적용의 수에 대한 개체의 집단을 분류하는 데 적용될 수 있다(예를 들어, 개체의 생물학적 샘플에 대한 본원에 기재된 시그니처 패널을 사용한 RNA 검정의 수행에 기초하여). 이러한 임상적 적용의 예는 조기 암의 검출, 암의 진단, 암을 질환의 특정한 병기로 분류, 암의 치료를 위한 치료제에 대한 반응 또는 내성의 결정을 포함한다.
본원에 기재된 방법 및 시스템은 결장 세포 증식성 장애의 특징, 예컨대, 등급 및 병기에 적용될 수 있다. 따라서, 분석물과 검정의 조합은 상이한 조직에서 상이한 암 유형에 걸친 암 치료제의 반응성을 예측하고 치료 반응성에 기초하여 개체를 분류하기 위하여 본 발명의 시스템 및 방법에서 사용될 수 있다. 일부 실시양태에서, 본원에 기재된 분류기는 대상체의 그룹을 치료 반응자 및 비반응자로 계층화할 수 있다.
또 다른 측면에서, 본 개시는 질환에 대해 이전에 치료된 대상체에서 최소 잔존 질환을 모니터링하기 위한 방법으로서, 본원에 기재된 바와 같은 miRNA 프로파일을 기준선 miRNA 상태로서 결정하고 분석을 반복하여 하나 이상의 미리 결정된 시점에 miRNA 프로파일을 결정하는 단계를 포함하고, 기준선으로부터의 변화는 대상체에서 기준선에서의 최소 잔존 질환 상태의 변화를 지시하는, 방법을 제공한다.
일부 실시양태에서, 최소 잔존 질환은 치료에 대한 반응, 종양 부하, 수술 후 잔존 종양, 재발, 이차 스크린, 일차 스크린, 및 암 진행으로부터 선택된다.
또 다른 측면에서, 치료에 대한 반응을 결정하기 위한 방법이 제공된다.
또 다른 측면에서, 종양 부하를 모니터링하기 위한 방법이 제공된다.
또 다른 측면에서, 수술 후 잔존 종양을 검출하기 위한 방법이 제공된다.
또 다른 측면에서, 재발을 검출하기 위한 방법이 제공된다.
또 다른 측면에서, 이차 스크린으로서 사용하기 위한 방법이 제공된다.
또 다른 측면에서, 일차 스크린으로서 사용하기 위한 방법이 제공된다.
또 다른 측면에서, 암 진행을 모니터링하기 위한 방법이 제공된다.
본 개시는 또한 관심 병태 또는 질환의 약물 표적(예를 들어, 특정한 부류와 관련이 있거나 중요한 유전자)을 결정하는 방법으로서, 적어도 하나의 유전자에 대한 유전자 발현의 수준에 대하여 대상체로부터 수득된 샘플을 평가하는 단계; 및 이웃 분석 루틴을 사용하고, 샘플의 분류와 관련된 유전자를 결정하고, 이로써 분류와 관련이 있는 하나 이상의 약물 표적을 확인하는 단계를 포함하는, 방법을 제공한다.
본 개시는 또한 질환 부류를 치료하도록 설계된 약물의 효능을 결정하는 방법으로서, 질환 부류를 갖는 개체로부터 샘플을 수득하는 단계; 샘플에 약물을 적용하는 단계; 약물 노출된 샘플을 적어도 하나의 유전자에 대하여 유전자 발현의 수준에 대하여 평가하는 단계; 및 가중치 투표 방식(weighted voting scheme)으로 구축된 컴퓨터 모델을 사용하고, 약물 노출된 샘플을 모델에 관한 샘플의 상대적인 유전자 발현 수준의 함수로서 질환의 부류로 분류하는 단계를 포함하는, 방법을 제공한다.
본 개시는 또한 질환 부류를 치료하도록 설계된 약물의 효능을 결정하는 방법으로서, 개체는 약물에 주어진 적이 있고; 약물에 주어진 개체로부터의 샘플을 수득하는 단계; 적어도 하나의 유전자에 대하여 유전자 발현의 수준에 대하여 평가하는 단계; 및 가중치 투표 방식으로 구축된 모델을 사용하고, 모델의 유전자 발현 수준과 비교하여 샘플의 유전자 발현 수준을 평가하는 것을 포함하여 샘플을 질환의 부류로 분류하는 단계를 포함하는, 방법을 제공한다.
본 개시는 또한 개체가 표현형 부류(예를 들어, 지능, 치료에 대한 반응, 수명, 바이러스 감염의 가능성 또는 비만)에 속하는지의 여부를 결정하는 방법으로서, 개체로부터 샘플을 수득하는 단계; 샘플을 적어도 하나의 유전자에 대하여 유전자 발현의 수준에 대하여 평가하는 단계; 및 가중치 투표 방식으로 구축된 모델을 사용하고, 모델의 유전자 발현 수준과 비교하여 샘플의 유전자 발현 수준을 평가하는 것을 포함하여 샘플을 질환의 부류로 분류하는 단계를 포함하는, 방법을 제공한다.
일 측면에서, 치료 반응성에 기초하여 집단을 분류하는 것에 관한 본원에 기재된 시스템 및 방법은 부류 DNA 손상제의 화학요법제, DNA 복구 표적 요법, DNA 손상 신호전달의 저해제, DNA 손상 유도된 세포 주기 정지의 저해제 및 DNA 손상을 간접적으로 야기하는 과정의 저해로 치료되는 암을 지칭하지만, 이들 부류로 제한되지 않는다. 이들 화학요법제 각각은 본원에서 사용되는 용어로서 "DNA-손상 치료제"로 간주될 수 있다.
환자의 분석물 데이터에 기초하여, 환자는 임상적 재발의 높거나 낮은 위험도를 갖는 환자와 같은 높은 위험도 및 낮은 위험도의 환자 그룹으로 분류될 수 있고, 결과는 치료의 과정을 결정하는 데 사용될 수 있다. 예를 들어, 높은 위험도의 환자인 것으로 결정된 환자는 수술 후 보조 화학요법으로 치료될 수 있다. 낮은 위험도인 환자로 여겨지는 환자의 경우, 보조 화학요법은 수술 후 제공되지 않을 수 있다. 따라서, 본 개시는 일부 측면에서 재발 위험도의 지표인 결장암 종양의 유전자 발현 프로파일을 제조하는 방법을 제공한다.
일부 예에서, 본원에 기재된 분류기는 치료에 대한 반응자와 비-반응자 사이의 대상체 집단을 계층화할 수 있다.
또 다른 측면에서, 본원에 개시된 방법은 암의 검출 또는 모니터링을 포함하는 임상 적용에 적용될 수 있다.
일부 실시양태에서, 본원에 개시된 방법은 치료에 대한 반응을 결정 및/또는 예측하기 위해 적용될 수 있다.
결장직장암 모니터링
데이터세트를 처리하기 위해 훈련된 알고리즘을 사용한 후, 대상체에서 결장직장암이 식별되거나 모니터링될 수 있다. 식별은 결장직장암-관련 miRNA의 패널에서 데이터세트의 서열 리드의 정량적 측정(예를 들어, RNA 전사체의 정량적 측정)에 적어도 부분적으로 기초할 수 있다. 예를 들어, 모니터링은 2 개 이상의 상이한 시점 각각에서 대상체의 결장직장암을 평가하는 것을 포함할 수 있다.
일부 실시양태에서, 본원에 개시된 방법은 종양 부하를 모니터링 및/또는 예측하기 위해 적용될 수 있다.
일부 실시양태에서, 본원에 개시된 방법은 수술 후 잔존 종양을 검출 및/또는 예측하기 위해 적용될 수 있다.
일부 실시양태에서, 본원에 개시된 방법은 치료 후 최소 잔존 질환을 검출 및/또는 예측하기 위해 적용될 수 있다.
일부 실시양태에서, 본원에 개시된 방법은 재발을 검출 및/또는 예측하기 위해 적용될 수 있다.
일 측면에서, 본원에 개시된 방법은 이차 스크린으로서 적용될 수 있다.
일 측면에서, 본원에 개시된 방법은 일차 스크린으로서 적용될 수 있다.
일 측면에서, 본원에 개시된 방법은 암 발달을 모니터링하기 위해 적용될 수 있다.
일 측면에서, 본원에 개시된 방법은 암 위험도를 모니터링 및/또는 예측하기 위해 적용될 수 있다.
결장직장암은 대상체에서 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 81%, 적어도 약 82%, 적어도 약 83%, 적어도 약 84%, 적어도 약 85%, 적어도 약 86%, 적어도 약 87%, 적어도 약 88%, 적어도 약 89%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99%, 또는 그 초과의 정확도로 대상체에서 식별될 수 있다. 훈련된 알고리즘에 의해 결장직장암을 식별하는 정확도는 결장직장암을 갖거나 갖지 않는 것으로 정확하게 식별되거나 분류된 독립적인 시험 샘플(예를 들어, 결장직장암을 갖는 것으로 알려진 대상체 또는 결장직장암에 대한 임상 시험 결과가 음성인 대상체)의 백분율로서 계산될 수 있다.
결장직장암은 대상체에서 적어도 약 5%, 적어도 약 10%, 적어도 약 15%, 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 81%, 적어도 약 82%, 적어도 약 83%, 적어도 약 84%, 적어도 약 85%, 적어도 약 86%, 적어도 약 87%, 적어도 약 88%, 적어도 약 89%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99%, 또는 그 초과의 양성 예측 값(PPV)으로 식별될 수 있다. 훈련된 알고리즘을 사용하여 결장직장암을 확인하는 PPV는 실제로 결장직장암을 갖는 대상체에 상응하는 결장직장암을 갖는 것으로 식별되거나 분류된 무세포 생물학적 샘플의 백분율로서 계산될 수 있다.
결장직장암은 대상체에서 적어도 약 5%, 적어도 약 10%, 적어도 약 15%, 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 81%, 적어도 약 82%, 적어도 약 83%, 적어도 약 84%, 적어도 약 85%, 적어도 약 86%, 적어도 약 87%, 적어도 약 88%, 적어도 약 89%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99%, 또는 그 초과의 음성 예측 값(NPV)으로 식별될 수 있다. 훈련된 알고리즘을 사용하여 결장직장암을 확인하는 NPV는 실제로 결장직장암을 갖지 않는 대상체에 상응하는 결장직장암을 갖지 않는 것으로 식별되거나 분류된 무세포 생물학적 샘플의 백분율로서 계산될 수 있다.
결장직장암은 대상체에서 적어도 약 5%, 적어도 약 10%, 적어도 약 15%, 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 81%, 적어도 약 82%, 적어도 약 83%, 적어도 약 84%, 적어도 약 85%, 적어도 약 86%, 적어도 약 87%, 적어도 약 88%, 적어도 약 89%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99%, 적어도 약 99.1%, 적어도 약 99.2%, 적어도 약 99.3%, 적어도 약 99.4%, 적어도 약 99.5%, 적어도 약 99.6%, 적어도 약 99.7%, 적어도 약 99.8%, 적어도 약 99.9%, 적어도 약 99.99%, 적어도 약 99.999%, 또는 그 초과의 임상 민감도로 식별될 수 있다. 훈련된 알고리즘을 사용하여 결장직장암을 식별하는 임상 민감도는 결장직장암을 갖는 것으로 정확하게 식별되거나 분류된 결장직장암(예를 들어, 결장직장암을 갖는 것으로 알려진 대상체)의 존재와 관련된 독립적인 시험 샘플의 백분율로서 계산될 수 있다.
결장직장암은 대상체에서 적어도 약 5%, 적어도 약 10%, 적어도 약 15%, 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 81%, 적어도 약 82%, 적어도 약 83%, 적어도 약 84%, 적어도 약 85%, 적어도 약 86%, 적어도 약 87%, 적어도 약 88%, 적어도 약 89%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99%, 적어도 약 99.1%, 적어도 약 99.2%, 적어도 약 99.3%, 적어도 약 99.4%, 적어도 약 99.5%, 적어도 약 99.6%, 적어도 약 99.7%, 적어도 약 99.8%, 적어도 약 99.9%, 적어도 약 99.99%, 적어도 약 99.999%, 또는 그 초과의 임상 특이성으로 식별될 수 있다. 훈련된 알고리즘을 사용하여 결장직장암을 식별하는 임상 특이성은 결장직장암을 갖지 않는 것으로 정확하게 식별되거나 분류된 결장직장암의 부재와 관련된 독립적인 시험 샘플(예를 들어, 결장직장암에 대한 임상 시험 결과가 음성인 대상체)의 백분율로서 계산될 수 있다.
일부 실시양태에서, 훈련된 알고리즘은 대상체가 적어도 약 5%, 적어도 약 10%, 적어도 약 15%, 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 81%, 적어도 약 82%, 적어도 약 83%, 적어도 약 84%, 적어도 약 85%, 적어도 약 86%, 적어도 약 87%, 적어도 약 88%, 적어도 약 89%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99%, 또는 그 초과의 결장직장암 위험에 있는 것을 결정할 수 있다.
훈련된 알고리즘은 대상체가 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 81%, 적어도 약 82%, 적어도 약 83%, 적어도 약 84%, 적어도 약 85%, 적어도 약 86%, 적어도 약 87%, 적어도 약 88%, 적어도 약 89%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99%, 적어도 약 99.1%, 적어도 약 99.2%, 적어도 약 99.3%, 적어도 약 99.4%, 적어도 약 99.5%, 적어도 약 99.6%, 적어도 약 99.7%, 적어도 약 99.8%, 적어도 약 99.9%, 적어도 약 99.99%, 적어도 약 99.999%, 또는 그 초과의 정확도로 결장직장암의 위험에 있는 것을 결정할 수 있다.
대상체가 결장직장암을 갖는 것으로 식별되면, 대상체에게 선택적으로 치료적 개입(예를 들어, 대상체의 결장직장암을 치료하기 위한 적절한 치료 과정의 처방)이 제공될 수 있다. 치료적 개입은 유효 용량의 약물 처방, 결장직장암의 추가 검사 또는 평가, 결장직장암의 추가 모니터링, 또는 이들의 조합을 포함할 수 있다. 대상체가 현재 치료 과정을 통해 결장직장암에 대해 치료를 받는 중인 경우, 치료적 개입은 후속의 상이한 치료 과정(예를 들어, 현재 치료 과정의 비-효능으로 인해 치료 효능을 증가시키기 위한)을 포함할 수 있다.
치료적 개입은 직장결장암의 진단을 확인하기 위해 이차 임상 검사를 대상체에게 권장하는 것을 포함할 수 있다. 이러한 이차 임상 검사는 영상 검사, 혈액 검사, 컴퓨터 단층 촬영(CT) 스캔, 자기 공명 영상(MRI) 스캔, 초음파 스캔, 흉부 X-선, 양전자 방출 단층 촬영(PET) 스캔, PET-CT 스캔, 무세포 생물학적 세포학, FIT 검사, FOBT 검사, 또는 이들의 임의의 조합을 포함할 수 있다.
결장직장암-관련 게놈 유전자좌의 패널에서 데이터세트의 서열 리드의 정량적 측정(예를 들어, 결장직장암-관련 게놈 유전자좌에서 RNA 전사체의 정량적 측정)은 환자(예를 들어, 결장직장암을 갖거나 결장직장암에 대한 치료를 받고 있는 대상체)를 모니터링하는 기간에 걸쳐 평가될 수 있다. 이러한 경우, 환자의 데이터세트의 정량적 측정은 치료 과정 동안 변경될 수 있다. 예를 들어, 효과적인 치료로 인해 결장직장암의 위험이 감소하는 환자의 데이터세트의 정량적 측정은 건강한 대상체(예를 들어, 결장직장암이 없는 대상체)의 프로파일 또는 분포를 향해 이동할 수 있다. 반대로, 예를 들어, 효과가 없는 치료로 인해 결장직장암의 위험이 증가하는 환자의 데이터세트의 정량적 측정은 결장직장암의 위험이 더 높거나 결장직장암의 더 진행된 상태인 대상체의 프로파일 또는 분포 쪽으로 이동할 수 있다.
대상체의 결장직장암을 치료하기 위한 치료 과정을 모니터링함으로써 대상체의 결장직장암을 모니터링할 수 있다. 모니터링은 2 개 이상의 시점에 대상체의 결장직장암을 평가하는 것을 포함할 수 있다. 평가는 2 개 이상의 시점 각각에 결정된 결장직장암-관련 게놈 유전자좌의 패널의 정량적 측정을 포함하는 결장직장암-관련 게놈 유전자좌의 패널에서 데이터세트의 서열 리드의 정량적 측정(예를 들어, 결장직장암-관련 게놈 유전자좌에서 RNA 전사체 또는 DNA의 정량적 측정)에 적어도 기초할 수 있다.
일부 실시양태에서, 2 개 이상의 시점 사이에 결정된 결장직장암-관련 게놈 유전자좌의 패널의 정량적 측정을 포함하는 결장직장암-관련 게놈 유전자좌의 패널에서 데이터세트의 서열 리드의 정량적 측정(예를 들어, 결장직장암-관련 게놈 유전자좌에서 RNA 전사체 또는 DNA의 정량적 측정)의 차이는 (i) 대상체의 결장직장암의 진단, (ii) 대상체의 결장직장암의 예후, (iii) 대상체의 결장직장암의 증가된 위험, (iv) 대상체의 결장직장암의 감소된 위험, (v) 대상체의 결장직장암을 치료하기 위한 치료 과정의 효능, 및 (vi) 대상체의 결장직장암을 치료하기 위한 치료 과정의 비-효능과 같은 하나 이상의 임상 징후의 지표일 수 있다.
일부 실시양태에서, 2 개 이상의 시점 사이에 결정된 결장직장암-관련 게놈 유전자좌의 패널의 정량적 측정을 포함하는 결장직장암-관련 게놈 유전자좌의 패널에서 데이터세트의 서열 리드의 정량적 측정(예를 들어, 결장직장암-관련 게놈 유전자좌에서 RNA 전사체 또는 DNA의 정량적 측정)의 차이는 대상체의 결장직장암의 진단의 지표일 수 있다. 예를 들어, 결장직장암이 이전 시점에 대상체에서 검출되지 않았지만 이후 시점에 대상체에서 검출된 경우, 그 차이는 대상체의 결장직장암의 진단의 지표일 수 있다. 대상체의 결장직장암의 진단의 이러한 지표에 기초하여, 예를 들어, 대상체에 대한 새로운 치료적 개입을 처방하는 것과 같은 임상적 조치 또는 결정이 이루어질 수 있다. 임상적 조치 또는 결정은 결장직장암의 진단을 확인하기 위해 이차 임상 검사를 대상체에게 권장하는 것을 포함할 수 있다. 이러한 이차 임상 검사는 영상 검사, 혈액 검사, 컴퓨터 단층 촬영(CT) 스캔, 자기 공명 영상(MRI) 스캔, 초음파 스캔, 흉부 X-선, 양전자 방출 단층 촬영(PET) 스캔, PET-CT 스캔, 무세포 생물학적 세포학, FIT 검사, FOBT 검사, 또는 이들의 임의의 조합을 포함할 수 있다.
일부 실시양태에서, 2 개 이상의 시점 사이에 결정된 결장직장암-관련 게놈 유전자좌의 패널의 정량적 측정을 포함하는 결장직장암-관련 게놈 유전자좌의 패널에서 데이터세트의 서열 리드의 정량적 측정(예를 들어, 결장직장암-관련 게놈 유전자좌에서 RNA 전사체 또는 DNA의 정량적 측정)의 차이는 대상체의 결장직장암의 예후의 지표일 수 있다.
일부 실시양태에서, 2 개 이상의 시점 사이에 결정된 결장직장암-관련 게놈 유전자좌의 패널의 정량적 측정을 포함하는 결장직장암-관련 게놈 유전자좌의 패널에서 데이터세트의 서열 리드의 정량적 측정(예를 들어, 결장직장암-관련 게놈 유전자좌에서 RNA 전사체 또는 DNA의 정량적 측정)의 차이는 결장직장암의 증가된 위험도를 갖는 대상체의 지표일 수 있다. 예를 들어, 결장직장암이 대상체에서 이전 시점과 이후 시점 둘 모두에서 검출된 경우, 및 차이가 양의 값 차이인 경우(예를 들어, 결장직장암-관련 게놈 유전자좌의 패널에서 데이터세트의 서열 리드의 정량적 측정(예를 들어, 결장직장암-관련 게놈 유전자좌에서 RNA 전사체 또는 DNA의 정량적 측정)이 이전 시점에서 이후 시점까지 증가한 경우), 그 차이는 결장직장암의 증가된 위험도를 갖는 대상체의 지표일 수 있다. 예를 들어, 대상체에 대한 새로운 치료적 개입을 처방하거나 치료적 개입을 전환하는 것(예를 들어, 현재 치료를 종료하고 새로운 치료를 처방함)과 같은 임상적 조치 또는 결정이 결장직장암의 증가된 위험도의 이러한 지표에 기초하여 이루어질 수 있다. 임상적 조치 또는 결정은 결장직장암의 증가된 위험도를 확인하기 위해 이차 임상 검사를 대상체에게 권장하는 것을 포함할 수 있다. 이러한 이차 임상 검사는 영상 검사, 혈액 검사, 컴퓨터 단층 촬영(CT) 스캔, 자기 공명 영상(MRI) 스캔, 초음파 스캔, 흉부 X-선, 양전자 방출 단층 촬영(PET) 스캔, PET-CT 스캔, 무세포 생물학적 세포학, FIT 검사, FOBT 검사, 또는 이들의 임의의 조합을 포함할 수 있다.
일부 실시양태에서, 2 개 이상의 시점 사이에 결정된 결장직장암-관련 게놈 유전자좌의 패널의 정량적 측정을 포함하는 결장직장암-관련 게놈 유전자좌의 패널에서 데이터세트의 서열 리드의 정량적 측정(예를 들어, 결장직장암-관련 게놈 유전자좌에서 RNA 전사체 또는 DNA의 정량적 측정)의 차이는 결장직장암의 감소된 위험도를 갖는 대상체의 지표일 수 있다. 예를 들어, 결장직장암이 대상체에서 이전 시점과 이후 시점 둘 모두에서 검출된 경우, 및 차이가 음성 차이인 경우(예를 들어, 결장직장암-관련 게놈 유전자좌의 패널의 정량적 측정을 포함하는 결장직장암-관련 게놈 유전자좌의 패널에서 데이터세트의 서열 리드의 정량적 측정(예를 들어, 결장직장암-관련 게놈 유전자좌에서 RNA 전사체 또는 DNA의 정량적 측정)이 이전 시점에서 이후 시점까지 감소한 경우), 그 차이는 결장직장암의 감소된 위험도를 갖는 대상체의 지표일 수 있다. 임상적 조치 또는 결정은 대상체에 대한 결장직장암의 감소된 위험도(예를 들어, 현재의 치료적 개입을 지속 또는 종료)의 이러한 지표에 기초하여 이루어질 수 있다. 임상적 조치 또는 결정은 결장직장암의 감소된 위험도를 확인하기 위해 이차 임상 검사를 대상체에게 권장하는 것을 포함할 수 있다. 이러한 이차 임상 검사는 영상 검사, 혈액 검사, 컴퓨터 단층 촬영(CT) 스캔, 자기 공명 영상(MRI) 스캔, 초음파 스캔, 흉부 X-선, 양전자 방출 단층 촬영(PET) 스캔, PET-CT 스캔, 무세포 생물학적 세포학, FIT 검사, FOBT 검사, 또는 이들의 임의의 조합을 포함할 수 있다.
일부 실시양태에서, 2 개 이상의 시점 사이에 결정된 결장직장암-관련 게놈 유전자좌의 패널의 정량적 측정을 포함하는 결장직장암-관련 게놈 유전자좌의 패널에서 데이터세트의 서열 리드의 정량적 측정(예를 들어, 결장직장암-관련 게놈 유전자좌에서 RNA 전사체 또는 DNA의 정량적 측정)의 차이는 대상체의 결장직장암을 치료하기 위한 치료 과정의 효능의 지표일 수 있다. 예를 들어, 결장직장암이 이전 시점에 대상체에서 검출되었지만 이후 시점에 대상체에서 검출되지 않은 경우, 그 차이는 대상체의 결장직장암을 치료하기 위한 치료 과정의 효능의 지표일 수 있다. 임상적 조치 또는 결정은 대상체의 결장직장암을 치료하기 위한, 예를 들어, 대상체에 대한 현재의 치료적 개입을 지속하거나 종료하기 위한 치료 과정의 효능의 이러한 지표에 기초하여 이루어질 수 있다. 임상적 조치 또는 결정은 결장직장암을 치료하기 위한 치료 과정의 효능을 확인하기 위해 이차 임상 검사를 대상체에게 권장하는 것을 포함할 수 있다. 이러한 이차 임상 검사는 영상 검사, 혈액 검사, 컴퓨터 단층 촬영(CT) 스캔, 자기 공명 영상(MRI) 스캔, 초음파 스캔, 흉부 X-선, 양전자 방출 단층 촬영(PET) 스캔, PET-CT 스캔, 무세포 생물학적 세포학, FIT 검사, FOBT 검사, 또는 이들의 임의의 조합을 포함할 수 있다.
일부 실시양태에서, 2 개 이상의 시점 사이에 결정된 결장직장암-관련 게놈 유전자좌의 패널의 정량적 측정을 포함하는 결장직장암-관련 게놈 유전자좌의 패널에서 데이터세트의 서열 리드의 정량적 측정(예를 들어, 결장직장암-관련 게놈 유전자좌에서 RNA 전사체 또는 DNA의 정량적 측정)의 차이는 대상체의 결장직장암을 치료하기 위한 치료 과정의 비-효능의 지표일 수 있다. 예를 들어, 결장직장암이 대상체에서 이전 시점과 이후 시점 둘 모두에서 검출된 경우, 및 차이가 양성 또는 제로(0) 차이인 경우(예를 들어, 결장직장암-관련 게놈 유전자좌의 패널에서 데이터세트의 서열 리드의 정량적 측정(예를 들어, 결장직장암-관련 게놈 유전자좌의 패널의 정량적 측정을 포함하는 결장직장암-관련 게놈 유전자좌에서 RNA 전사체 또는 DNA의 정량적 측정)이 이전 시점에서 이후 시점까지 증가하거나 일정한 수준으로 유지되는 경우), 및 효능이 있는 치료가 더 이른 시점에 지시된 경우, 그 차이는 대상체의 결장직장암을 치료하기 위한 치료 과정의 비-효능의 지표일 수 있다. 임상적 조치 또는 결정, 예를 들어, 대상체에 대한 현재의 치료적 개입을 종료하고/종료하거나 상이한 새로운 치료적 개입을 전환(예를 들어, 처방)하는 것은 대상체의 결장직장암을 치료하기 위한 치료 과정의 비-효능의 이러한 지표에 기초하여 이루어질 수 있다. 임상적 조치 또는 결정은 결장직장암을 치료하기 위한 치료 과정의 비-효능을 확인하기 위해 이차 임상 검사를 대상체에게 권장하는 것을 포함할 수 있다. 이러한 이차 임상 검사는 영상 검사, 혈액 검사, 컴퓨터 단층 촬영(CT) 스캔, 자기 공명 영상(MRI) 스캔, 초음파 스캔, 흉부 X-선, 양전자 방출 단층 촬영(PET) 스캔, PET-CT 스캔, 무세포 생물학적 세포학, FIT 검사, FOBT 검사, 또는 이들의 임의의 조합을 포함할 수 있다.
VII. 키트
본 개시는 대상체의 암을 식별하거나 모니터링하는 키트를 제공한다. 키트는 대상체의 무세포 생물학적 샘플에서 복수의 암-관련 게놈 유전자좌들 각각에서 서열의 정량적 측정(예를 들어, 존재, 부재 또는 상대량을 나타내는)을 식별하기 위한 프로브 또는 프라이머를 포함할 수 있다. 무세포 생물학적 샘플에서 복수의 암-관련 게놈 유전자좌들 각각에서 서열의 정량적 측정(예를 들어, 존재, 부재 또는 상대량을 나타내는)은 하나 이상의 암의 지표일 수 있다. 프로브는 무세포 생물학적 샘플에서 복수의 암-관련 게놈 유전자좌에서 서열에 대해 선택적일 수 있다. 키트는 프로브를 사용하여 무세포 생물학적 샘플을 처리함으로써, 대상체의 무세포 생물학적 샘플에서 복수의 암-관련 게놈 유전자좌들 각각에서 서열의 정량적 측정을 나타내는(예를 들어, 존재, 부재 또는 상대량을 나타내는) 데이터세트를 생성하기 위한 설명서를 포함할 수 있다.
키트 내의 프로브는 무세포 생물학적 샘플에서 복수의 암-관련 게놈 유전자좌에서 서열에 대해 선택적일 수 있다. 키트 내의 프로브는 복수의 암-관련 게놈 유전자좌에 상응하는 핵산(예를 들어, RNA 또는 DNA) 분자들을 선택적으로 풍부화하도록 구성될 수 있다. 키트 내의 프로브는 핵산 프라이머일 수 있다. 키트 내의 프로브는 복수의 암-관련 miRNA 또는 이의 단편 중 하나 이상으로부터 핵산 서열과 부분 또는 완전 서열 성보성을 가질 수 있다. 복수의 암-관련 miRNA는 적어도 2 개, 적어도 3 개, 적어도 4 개, 적어도 5 개, 적어도 6 개, 적어도 7 개, 적어도 8 개, 적어도 9 개, 적어도 10 개, 적어도 11 개, 적어도 12 개, 적어도 13 개, 적어도 14 개, 적어도 15 개, 적어도 16 개, 적어도 17 개, 적어도 18 개, 적어도 19 개, 적어도 20 개, 또는 그 초과의 별개의 암-관련 miRNA를 포함할 수 있다. 복수의 암-관련 miRNA는 표 1-11에 열거된 miRNA로 이루어진 군으로부터 선택된 하나 이상의 구성원을 포함할 수 있다.
키트 내의 설명서는 무세포 생물학적 샘플에서 복수의 암-관련 게놈 유전자좌들에서 서열에 선택적인 프로브를 사용하여 무세포 생물학적 샘플을 검정하기 위한 설명서를 포함할 수 있다. 이들 프로브는 복수의 암-관련 게놈 유전자좌 중 하나 이상의 핵산 서열(예를 들어, RNA 또는 DNA)과 서열 상보성을 갖는 핵산 분자(예를 들어, RNA 또는 DNA)일 수 있다. 이들 핵산 분자는 프라이머 또는 풍부화 서열일 수 있다. 무세포 생물학적 샘플을 검정하기 위한 설명서는 어레이 하이브리드화, 중합효소 연쇄 반응(PCR) 또는 핵산 시퀀싱(예를 들어, DNA 시퀀싱 또는 RNA 시퀀싱)을 수행하여 무세포 생물학적 샘플을 처리함으로써, 무세포 생물학적샘플에서 복수의 암-관련 miRNA 각각의 정량적 측정을 나타내는(예를 들어, 존재, 부재 또는 상대량을 나타내는) 데이터세트를 생성하기 위한 설명서를 포함할 수 있다. 무세포 생물학적 샘플에서 복수의 암-관련 miRNA 각각에서 서열의 정량적 측정(예를 들어, 존재, 부재 또는 상대량을 나타내는)은 하나 이상의 암의 지표일 수 있다.
키트 내의 설명서는 무세포 생물학적 샘플에서 복수의 암-관련 게놈 유전자좌들 각각에서 서열의 정량적 측정을 나타내는(예를 들어, 존재, 부재 또는 상대량을 나타내는) 데이터세트를 생성하기 위해 복수의 암-관련 게놈 유전자좌 중 하나 이상에서 정량화될 수 있는 검정 판독치를 측정하고 해석하기 위한 설명서를 포함할 수 있다. 예를 들어, 복수의 암-관련 miRNA에 상응하는 어레이 하이브리드화 또는 중합효소 연쇄 반응(PCR)의 정량화는 무세포 생물학적 샘플에서 miRNA의 정량적 측정(예를 들어, 존재, 부재 또는 상대량을 나타내는) 및 공지된 생물학적 특징을 갖는 샘플들 사이에서 차등 발현을 나타내는 데이터세트를 생성할 수 있다. 검정 판독은 정량적 PCR(qPCR) 값, 디지털 PCR(dPCR) 값, 디지털 액적 PCR(ddPCR) 값, 형광 값 등, 또는 이들의 표준화된 값을 포함할 수 있다.
실시예
실시예 1: 무세포 핵산에서의 miRNA 분석
총 276명의 대상체가 본 연구에 전향적으로 포함되었다: 산발성 결장직장 종양으로 새로 진단된 145명의 환자(CRC가 있는 39명, 진행성 선종(AA)이 있는 49명, 및 비-진행성 선종이 있는 57명) 및 임의의 암의 개인 병력이 없고 결장직장 신생물 병변의 결여를 확인해주는 최근 결장경 검사가 있는 131명의 건강한 개체. AA가 있는 환자는 적어도 10 mm의 크기를 갖거나 조직학적으로 고등급 이형성 또는 >20% 융모 성분을 갖는 선종이 있는 환자였다. 모든 개체에서 내시경 또는 수술 전에 혈액 샘플을 수집하였다.
연구 코호트에 대한 설명이 표 12에 제공되며, 이는 분류 모델에서 CRC 실험에 사용된 건강한 샘플 및 암 샘플의 수를 나타낸다(병기, 성별, 및 연령별).
표 12
Figure pct00013
276명의 각각의 개체에 대해, MagMax mirVana 전체 RNA 단리 키트를 사용하여 100 마이크로리터(uL)의 혈장으로부터 RNA를 추출하였다. 추출 동안, 공지된 양의 52 개의 합성 miRNA를 각 혈장 샘플에 스파이크 인으로 첨가하였다.
시퀀싱 라이브러리의 작제
A. 라이브러리 작제
무세포 핵산 샘플을 차세대 시퀀싱을 위한 라이브러리 제조에 적용하였다. 본원에서 사용되는 차세대 시퀀싱 접근법의 경우, "라이브러리 제조물"은 말단-복구, A-테일링, 어댑터 결찰, 또는 RNA의 후속 시퀀싱을 가능하게 하기 위한 무세포 RNA에서 수행된 임의의 다른 제조물을 포함하였다. 일부 예에서, 제조된 무세포 핵산 라이브러리 서열은 무세포 핵산 샘플 분자 상에 결찰된 어댑터, 서열 태그, 인덱스 바코드를 함유하였다. 차세대 시퀀싱 접근법을 위한 라이브러리 제조를 용이하게 하기 위해 다양한 상업적으로 이용 가능한 키트가 이용 가능하다. 차세대 시퀀싱 라이브러리 작제는 고처리량 시퀀싱을 위해 특정 크기의 RNA 단편의 무작위 수집을 생성하도록 조정된 일련의 효소 반응을 사용하여 핵산 표적을 제조하는 것을 포함하였다. 새로운 라이브러리 제조 기술의 발전과 개발은 차세대 시퀀싱의 적용을 전사체학 및 후성유전학과 같은 분야로 확장시켰다.
일부 예에서, 라이브러리 제조 키트는 Nextera Flex (Illumina), IonAmpliseq (Thermo Fisher Scientific), 및 Genexus (Thermo Fisher Scientific), Agilent ClearSeq (Agilent), Agilent SureSelect Capture (Agilent), RealSeq (Realseq Biosciences), Archer FusionPlex (Illumina), BiooScientific NEXTflex (Perkin Elmer), IDT xGen (Illumina), Illumina TruSight (Illumina), SMARTer smRNA-Seq (Takara), Nimblegene SeqCap (Illumina), Qiaseq (Qiagen), 또는 Qiagen GeneRead (Qiagen)로부터 선택될 수 있다.
RealSeq®(RealSeq Biosciences; 이전에 Somagenics)는 차세대 시퀀싱(NSG)에서 혼입 편향을 크게 감소시키는 소형-RNA 시퀀싱 라이브러리를 제조하기 위한 방법이다. 이 기술은 일부가 10,000-배만큼 많은 다수의 miRNA의 과소검출을 초래하는 일반적으로 사용되는 시퀀싱 라이브러리 제조의 문제를 해결한다. 대부분의 편향은 시퀀싱 라이브러리의 제조 동안 miRNA/소형 RNA의 3' 및 5' 말단에 2 개의 어댑터를 부착시키는 효소 결찰 반응의 서열-의존적 가변성에서 비롯된다. 새로운 단일 어댑터 및 순환을 이용하여 RealSeq®는 라이브러리 제조 편향을 크게 줄인다.
B. 시퀀싱
시퀀싱 라이브러리를 2 나노몰(nM)로 희석하였다. 샘플을 개체당 대략 1천만 리드의 깊이로 시퀀싱하기 위해 Illumina NextSeqinstrument 상에 로딩하였다.
C. RealSeq 분석 요약
Trimmomatic, Skewer, SeqPurge, 및 Atropos와 같은 트리밍 소프트웨어를 사용하여 RealSeq 특이적 어댑터 및 다른 프라이머 및 어댑터를 제거하기 위해 서열 리드를 트리밍하였다. 트리밍된 리드를 이후 bowtie2 정렬 소프트웨어를 사용하여 성숙한 miRNA 서열, tRNA, rRNA, 미토콘드리아 RNA, U snRNA, Y RNA, 및 합성 스파이크-인 서열로 구성된 맞춤 전사체에 대해 정렬하였다. samtools idxstats를 사용하여 각 피처에 맵핑된 리드의 수를 계수하였다.
다양한 데이터 전처리 단계를 수행하여 데이터를 분석을 위해 더욱 특징화하였다. 데이터 전처리는 결측값을 추가하고, 정보를 집계하고, 카테고리로 데이터에 레이블을 지정하고(데이터 비닝(binning)), 궤적을 평활화하는 것을 목적으로 한다. 주성분 분석 및 피처 선택과 같은 보다 진보된 기술은 통계 공식으로 수행되었고 복잡한 데이터세트에 적용되었다.
헤어핀 서열에 맵핑하는 300,000 개 미만의 판독을 갖는 샘플을 후속 분석에서 제거하였다. 모든 샘플에 걸쳐 카운트가 < 25 개 개체 피처도 제거하였다. 비율 표준화의 평균, M-값의 트리밍된 평균, RUVseq, 및 log2CPM을 포함하는 여러 표준화 전략들을 비교하였다. 평균 비율 표준화 방법을 사용하여 데이터를 표준화하였다.
miRNA 서열로부터 Illumina 어댑터를 제거하기 위해 맞춤형 스크립트를 사용하여 서열을 트리밍하였다. 이어서, miRNA 서열을 (1) 인간 게놈, (2) 모든 공지된 성숙한 인간 miRNA를 포함하는 맞춤 전사체, 및 (3) 헤어핀 miRNA 서열의 제2 전사체뿐만 아니라 52 개의 합성 비-인간 유래 miRNA에 bowtie를 사용하여 맵핑하였다. 맵핑 위치로부터, miRNA와 miRNA 헤어핀 둘 모두의 카운트 표를 각 개체로부터 생성하였다.
이러한 카운트 데이터세트를 사용하여, 건강한 개체 대 결장직장암 또는 진행성 선종이 있는 개체의 혈장 사이에 차등적으로 풍부한 miRNA를 식별하였다. 둘 모두의 카운트 매트릭스를 (1) M-값의 트리밍된 평균, (2) 비율의 평균, 및 (3) RUVseq를 포함하는 다중 방법을 이용하여 표준화하였다. 이들 세 가지 방법 각각을 전체 RNA 라이브러리에서 실행하여 표준화 인자를 생성할 뿐만 아니라 합성 RNA 스파이크 인에서 실행하여 제2 세트의 표준화 인자를 생성하였다. 각 방법으로부터 표준화된 카운트를 개별적으로 사용하여 건강한 상태 사이에 유의하게 상이한 성숙 miRNA 및 miRNA 헤어핀 존재비를 나타내는 서열을 식별하는 모델을 생성하였다. 두 가지 이상의 방법에서 p < 0.05인 헤어핀 및 miRNA는 강력하게 지지된 것으로 간주되었고 CRC 및/또는 AA에 대한 마커로서 식별되었다.
분류 모델의 경우, 네 번째 표준화 방법으로 Combat를 추가하여 둘 모두의 데이터세트(성숙한 miRNA 및 miRNA 헤어핀)에 동일한 표준화를 사용하였다. 표준화된 카운트를 또한 혈장 품질, 연령, 성별, 및 수집 부위를 포함하는 공지된 교란변수에 대해 조정하였다. 생성된 카운트 데이터세트로부터, k=8로 k-최상 모델을 구축하였다. 모델을 500 개의 독립적인 시드에서 실행하여 각각 데이터를 4 개의 폴드로 분할하고, 데이터의 3 개 폴드에 대해 훈련시키고, 최종 4번째 폴드에서 시험하였다. 이후, 각 모델에서 식별된 8 개의 피처를 차등적으로 풍부한 miRNA 및 헤어핀의 목록과 비교하였다.
실시예 2: 결장직장암 및 진행성 선종에 대한 분류 시그니처의 생성
평가된 기계 학습 방법은 일련의 변환을 포함하고, 일부 경우에는 차원 축소 및 이어서 지도 분류 알고리즘을 포함하였다.
분류 모델을 평가할 때 교차-검증(CV) 절차의 목적은 모델을 구축하는 데 사용되지 않은 이전에 보지 못한 새로운 데이터에 대한 모델의 성능을 추정하는 것이다. 목적은 데이터의 별개의 서브세트에 대해 모델을 반복적으로 훈련시키고 훈련 동안 모델에 의해 보이지 않는 보류된 데이터 서브세트에 대해 시험함으로써 근사치를 제공하는 것이었다. K-폴드 교차-검증 절차는 전체 데이터세트를 k개의 그룹으로 나누는 것을 필요로 하였다. 각각의 k 그룹(또는 폴드)에 대해, 다른 k-1 폴드로 기계 학습 모델을 훈련시키고, 보류된 폴드를 시험 세트로 사용하였다. 계층화된 k-폴드 교차-검증은 샘플의 근사 비율이 폴드에 걸쳐 대체로 동등하도록 폴드로 나누기 전에 샘플을 클래스별로 계층화하였다.
다수의 모델을 k-폴드 교차-검증(k=5)으로 훈련시키고; 후속하여, 추가 교차-검증 절차로 최고 성능의 모델을 평가하였다. 교차-검증 동안 ANOVA F-통계량에 기반하여 상위 10 개 피처를 골랐다. 로지스틱 회귀를 사용하여 샘플을 분류하였다. 100 개의 상이한 무작위 시드를 사용하여 데이터를 폴드로 분할함으로써, 총 500 개의 모델을 실행하였다(100 개의 시드, 시드 당 5 개 폴드)
피처 선택 동안 miRNA를 선택하였다. 시드의 컬럼 수는 실행된 500 개 모델에서 피처 선택 동안 miRNA가 선택된 횟수를 나타낸다. hsa-mir-889에 대한 높은 수, 예를 들어, 499는 이러한 miRNA가 500 개 모델 중 499 개에서 선택되었음을 지시한다.
먼저, 이상치(모든 훈련 샘플에 걸쳐 해당 피처의 99번째 백분위수 초과인 주어진 샘플의 피처 값으로 정의됨)를 99번째 백분위수 값으로 전가시켰다. 각 피처를 이후 평균을 빼고 표준 편차로 나눔으로써 모든 훈련 샘플에 걸쳐 표준화하였다. 훈련 세트의 평균 및 표준 편차를 사용하여 동일한 이상치 대체를 사용함으로써 시험 세트를 표준화하였다. 차원 감소 변환 방법이 선택된 경우, 이를 훈련 세트에 대해 훈련시키고 훈련 및 시험 세트 둘 모두의 모든 샘플에 적용하였다. 본 연구에서 사용된 차원 감소 변환은 절단된 특이값 분해(SVD) 및 주성분 분석(PCA)이었다.
2 개의 가능한 분류 알고리즘을 변환된 입력에 대해 훈련시켰다: 로지스틱 회귀 및 서포트 벡터 머신(SVM). 무작위로 선택된 20%의 트레이닝 데이터를 포함하는 검증 세트로 폴드당 100회 반복의 무작위 검색을 이용하여 각 방법에 대해 다중 초파라미터를 고려하였고; 시험 폴드를 평가하기 위해 기계 학습 모델을 훈련시키도록 가장 우수하게 수행하는 검증 세트에 상응하는 초파라미터를 선택하였다. 로지스틱 회귀는 2 개의 초파라미터를 가졌다: 조직화 강도의 역, 및 L1 또는 L2 페널티의 선택. 표 13은 로지스틱 회귀에 대한 관련 평균 계수 값(예를 들어, miRNA가 선택된 시드의 수에 대한 평균)과 함께 k-폴드 교차-검증에서 결장직장암을 갖는 개체와 관련된 것으로 무세포 핵산 샘플에서 확인된 miRNA의 집합을 보여준다.
표 13
Figure pct00014
Figure pct00015
Figure pct00016
Figure pct00017
Figure pct00018
Figure pct00019
Figure pct00020
Figure pct00021
총 138 개의 miRNA가 결장직장암과 관련이 있는 것으로 밝혀졌다. 확인된 모든 miRNA가 건강한 개체와 결장직장암이 있는 개체를 구별하기 위해 분류 모델에 포함될 필요는 없었다. 따라서, 일부 영역은 일반적으로 평가된 다양한 유형의 암의 지표인 것으로 보인다. 다른 miRNA는 결장직장암의 서브그룹에서 더 빈번하다. 이러한 검정 및 조사된 암의 유형의 맥락에서, 특정 miRNA는 CV에서 더 높은 빈도로 "결장직장암과 특이적으로 관련이 있는" 것으로 기술될 수 있고, 샘플 시퀀스가 예측 모델에서 훈련될 때 시그니처에서 더 높은 가중치를 갖는다. 결장직장암과 관련된 이러한 더 높은 빈도의 miRNA는 건강한 개체와 CRC 사이에서 개체의 집단을 구별하도록 훈련된 특정 모델에서 사용된다. 도 2는 피처 선택 동안 선택된 miRNA를 보여주는 히스토그램을 제공한다. 막대는 miRNA가 선택된 모델의 수(최대=500)를 나타낸다. 도 3은 가장 빈번하게 선택된 상위 10 개의 miRNA의 로지스틱 회귀 계수를 나타내는 그래프를 제공한다.
본 발명의 바람직한 실시양태가 본원에서 제시되고 설명되었지만, 이러한 실시양태는 단지 예로서 제공된다는 것이 관련 기술 분야의 통상의 기술자에게 명백할 것이다. 본 발명은 본 명세서 내에 제공되는 특정 예에 의해 제한되는 것으로 의도된 것이 아니다. 본 발명은 상기 언급된 명세서를 참조하여 설명되었지만, 본원의 설명 및 실시양태의 예시는 제한적인 의미로 고려되는 것을 의미하지 않는다. 수많은 변형, 변경 및 대체가 이제 본 발명을 벗어나지 않으면서 관련 기술 분야의 통상의 기술자에 의해 가능할 것이다. 또한, 본 발명의 모든 측면은 다양한 조건 및 변수에 따라 결정되는, 본원에서 설명되는 특정 묘사, 구성 또는 상대적인 비율로 제한되지 않는다는 것을 이해하여야 한다. 본원에 기재된 본 발명의 실시양태에 대한 다양한 대안이 본 발명을 실시하는 데 이용될 수 있음을 이해하여야 한다. 따라서, 본 발명은 임의의 그러한 대안, 수정, 변형 또는 균등물도 포함하는 것으로 고려된다. 하기 청구범위는 본 발명의 범위를 규정하고 이들 청구범위 및 그의 균등물의 범위 내의 방법 및 구조는 청구범위에 의해 포함되는 것으로 의도된다.

Claims (57)

  1. 결장 세포 증식성 장애에 특징적인 마이크로 리보핵산(miRNA) 시그니처 패널로서,
    표 1-11에 열거된 군으로부터 선택된 1 개 이상, 2 개 이상, 3 개 이상, 또는 4 개 이상의 miRNA의 미리 결정된 세트로서, miRNA의 세트는 결장 세포 증식성 장애 또는 이의 아형을 갖는 대상체로부터의 생물학적 샘플과 결장 세포 증식성 장애 또는 이의 아형이 없는 대상체로부터의 생물학적 샘플 사이에 차등 발현되는 것인, 마이크로 리보핵산(miRNA) 시그니처 패널.
  2. 제1항에 있어서, 시그니처 패널은 진행성 선종에 특징적이고, 시그니처 패널은 a) hsa-miR-1273a, hsa-miR-17-5p, hsa-miR-20a-3p, hsa-miR-20b-5p; b) hsa-miR-3065-5p, hsa-miR-4785, hsa-miR-5096, hsa-miR-5189-5p, 또는 c) hsa-miR-545-3p, hsa-miR-570-3p, hsa-miR-624-3p, hsa-mir-1181, hsa-mir-6073를 포함하는 miRNA의 미리 결정된 세트를 포함하고, 여기서 miRNA는 진행성 선종 또는 이의 아형을 갖는 대상체로부터의 생물학적 샘플과 진행성 선종 또는 이의 아형이 없는 대상체로부터의 생물학적 샘플 사이에 차등 발현되는 것인, miRNA 시그니처 패널.
  3. 제1항에 있어서, miRNA 시그니처 패널은 결장직장암에 특징적이고, 시그니처 패널은 a) hsa-miR-1250-5p, hsa-miR-1255a, hsa-miR-223-3p, hsa-miR-338-3p, hsa-miR-338-5p; b) hsa-miR-424-5p, hsa-miR-424-3p, hsa-miR-450a-5p, hsa-miR-450b-5p, hsa-miR-4772-3p; c) hsa-miR-4772-5p, hsa-miR-625-5p, hsa-miR-7847-3p, hsa-miR-1181, hsa-miR-3651, hsa-mir-6073; d) hsa-mir-6125, hsa-mir-7704, hsa-miR-19b-3p, hsa-miR-19a-3p, hsa-miR-3157-5p; e) hsa-miR-142-3p, hsa-miR-30c-5p, hsa-miR-6741-5p, hsa-miR-590-3p, hsa-miR-4685-5p; f) hsa-miR-3648, hsa-miR-331-3p, hsa-miR-1303, hsa-miR-6790-3p, hsa-miR-6867-5p, hsa-miR-942-5p; g) hsa-miR-378a-3p, hsa-miR-1287-5p, hsa-mir-4785, hsa-miR-324-3p, hsa-miR-550b-2-5p; h) hsa-miR-200c-3p, hsa-miR-200b-3p, hsa-miR-3679-5p, hsa-miR-550a-3-5p, hsa-miR-3187-3p; i) hsa-miR-181b-5p, hsa-miR-3138, hsa-miR-146a-5p, hsa-miR-6721-5p, hsa-miR-23b-3p, hsa-miR-28-5p; j) hsa-miR-320d, hsa-miR-940, hsa-miR-320d-1, hsa-miR-10a-5p, hsa-miR-340-5p; k) hsa-miR-320b, hsa-miR-335-5p, hsa-miR-320c, hsa-miR-501-3p, hsa-miR-548n; 또는 l) hsa-miR-27a-3p, hsa-miR-3065-3p, hsa-miR-548aa@, hsa-miR-584-3p, hsa-miR-22-3p를 포함하는 miRNA의 미리 결정된 세트를 포함하고, 여기서 miRNA는 결장직장암 또는 이의 아형을 갖는 대상체로부터의 생물학적 샘플과 결장직장암 또는 이의 아형이 없는 대상체로부터의 생물학적 샘플 사이에 차등 발현되는 것인, miRNA 시그니처 패널.
  4. 제1항에 있어서, miRNA의 미리 결정된 세트는 표 1-11에 열거된 군으로부터 선택된 적어도 1 개, 적어도 2 개, 적어도 3 개, 적어도 4 개, 적어도 5 개, 적어도 6 개, 적어도 7 개, 적어도 8 개, 적어도 9 개, 적어도 10 개, 적어도 11 개, 적어도 12 개, 적어도 13 개, 적어도 14 개, 적어도 15 개, 적어도 16 개, 적어도 17 개, 적어도 18 개, 적어도 19 개, 적어도 20 개, 적어도 21 개, 적어도 22 개, 적어도 23 개, 적어도 24 개, 적어도 25 개, 적어도 26 개, 적어도 27 개, 적어도 28 개, 적어도 29 개, 적어도 30 개, 적어도 40 개, 적어도 50 개, 적어도 60 개, 적어도 70 개, 적어도 80 개, 적어도 90 개, 적어도 100 개, 적어도 110 개, 적어도 120 개, 적어도 130 개, 적어도 140 개, 적어도 150 개, 적어도 160 개, 적어도 170 개, 적어도 180 개, 적어도 190 개, 적어도 200 개, 또는 적어도 250 개의 miRNA를 포함하는 것인 miRNA 시그니처 패널.
  5. 제1항에 있어서, 생물학적 샘플은 체액, 대변, 결장 유출물, 소변, 혈장, 혈청, 전혈, 단리된 혈액 세포, 혈액으로부터 단리된 세포, 및 이들의 조합으로 이루어진 군으로부터 선택되는 것인 miRNA 시그니처 패널.
  6. 제1항에 있어서, 생물학적 샘플은 핵산, DNA, RNA, 또는 무세포 핵산(cfDNA 또는 cfRNA)을 포함하는 것인 miRNA 시그니처 패널.
  7. 제1항에 있어서, miRNA는 성숙 miRNA 및 miRNA 헤어핀을 포함하는 것인 miRNA 시그니처 패널.
  8. 제1항에 있어서, 시그니처 패널은 표 1-11에 열거된 군으로부터 선택된 6 개 이상, 또는 12 개 이상의 miRNA에서 차등 발현을 포함하는 것인 miRNA 시그니처 패널.
  9. 제1항에 있어서, 결장 세포 증식성 장애는 선종(선종성 용종), 무경성 거치상 선종(SSA), 진행성 선종, 결장직장 이형성증, 결장직장 선종, 결장직장암, 결장암, 직장암, 결장직장 암종, 결장직장 선암종, 카르시노이드 종양, 위장 카르시노이드 종양, 위장 기질 종양(GIST), 림프종, 및 육종으로 이루어진 군으로부터 선택되는 것인 miRNA 시그니처 패널.
  10. 제1항에 있어서, 결장 세포 증식성 장애는 1기 결장직장암, 2기 결장직장암, 3기 결장직장암, 및 4기 결장직장암으로 이루어진 군으로부터 선택되는 것인 miRNA 시그니처 패널.
  11. 건강한 대상체의 집단을 결장 세포 증식성 장애를 갖는 대상체로부터 구별할 수 있는 분류기로서,
    a) 표 1-11에 열거된 군으로부터 선택된 6 개 이상, 또는 12 개 이상의 미리 선택된 miRNA에서 차등 miRNA 발현을 나타내는 측정된 값의 세트를 포함하고, 여기서 측정된 값은 건강한 대상체 및 결장 세포 증식성 장애를 갖는 대상체로부터의 miRNA 발현 데이터로부터 얻어지고,
    b) 측정된 값은 차등 miRNA 발현의 성질에 상응하는 피처(feature)의 세트를 생성하는 데 사용되며, 여기서 피처의 세트는 기계 학습 모델을 사용하여 컴퓨터 처리되고,
    c) 기계 학습 모델은 건강한 대상체의 집단을 결장 세포 증식성 장애를 갖는 대상체로부터 구별할 수 있는 분류기로서 유용한 피처 벡터를 제공하는 것인, 분류기.
  12. 제11항에 있어서, 미리 선택된 miRNA는 표 1-11에 열거된 군으로부터 선택된 적어도 1 개, 적어도 2 개, 적어도 3 개, 적어도 4 개, 적어도 5 개, 적어도 6 개, 적어도 7 개, 적어도 8 개, 적어도 9 개, 적어도 10 개, 적어도 11 개, 적어도 12 개, 적어도 13 개, 적어도 14 개, 적어도 15 개, 적어도 16 개, 적어도 17 개, 적어도 18 개, 적어도 19 개, 적어도 20 개, 적어도 21 개, 적어도 22 개, 적어도 23 개, 적어도 24 개, 적어도 25 개, 적어도 26 개, 적어도 27 개, 적어도 28 개, 적어도 29 개, 적어도 30 개, 적어도 40 개, 적어도 50 개, 적어도 60 개, 적어도 70 개, 적어도 80 개, 적어도 90 개, 적어도 100 개, 적어도 110 개, 적어도 120 개, 적어도 130 개, 적어도 140 개, 적어도 150 개, 적어도 160 개, 적어도 170 개, 적어도 180 개, 적어도 190 개, 적어도 200 개, 또는 적어도 250 개의 miRNA를 포함하는 것인 분류기.
  13. 제11항에 있어서, 결장 세포 증식성 장애는 선종(선종성 용종), 무경성 거치상 선종(SSA), 진행성 선종, 결장직장 이형성증, 결장직장 선종, 결장직장암, 결장암, 직장암, 결장직장 암종, 결장직장 선암종, 카르시노이드 종양, 위장 카르시노이드 종양, 위장 기질 종양(GIST), 림프종, 및 육종으로 이루어진 군으로부터 선택되는 것인 분류기.
  14. 제11항에 있어서, 측정된 값의 세트는 상이한 수를 갖는 단편을 관찰한 수 또는 비율, 원시 miRNA 존재비, 하우스키핑 유전자에 대해 표준화된 miRNA 존재비, 합성 서열에 대해 표준화된 miRNA 존재비, 로그 표준화된 miRNA 존재비, 단편 길이, 단편 중간점, 성숙 miRNA 또는 miRNA 헤어핀에 따른 리드 맵핑 위치 및 리드 파일링, 및 miRNA 클러스터의 존재비로 이루어진 군으로부터 선택된 차등 miRNA 발현의 특징을 기술하는 것인 분류기.
  15. 제11항에 있어서, 기계 학습 모델은 훈련 생물학적 샘플, 결장 세포 증식성 장애를 갖는 대상체에 상응하는 것으로 식별된 훈련 생물학적 샘플의 제1 서브세트, 및 결장 세포 증식성 장애를 갖지 않는 것으로 대상체에 상응하여 식별된 훈련 생물학적 샘플의 제2 서브세트로부터 얻어진 훈련 데이터를 사용하여 훈련되는 것인 분류기.
  16. 제11항에 있어서, 분류기는 결장 세포 증식성 장애를 검출하기 위한 시스템에 제공되고,
    a) miRNA 시그니처 패널에 기초하여 대상체를 분류하도록 작동 가능한 분류기를 포함하는 컴퓨터-판독 가능 매체; 및
    b) 컴퓨터-판독 가능 매체에 저장된 명령어를 실행하기 위한 하나 이상의 프로세서를 포함하는 것인, 분류기.
  17. 제16항에 있어서, 시스템은 심화 학습 분류기, 신경망 분류기, 선형 판별 분석(LDA) 분류기, 이차 판별 분석(QDA) 분류기, 서포트 벡터 머신(SVM) 분류기, 랜덤 포레스트(RF) 분류기, 선형 커널 서포트 벡터 머신 분류기, 일차 또는 이차 다항식 커널 서포트 벡터 머신 분류기, 리지 회귀 분류기, 탄성 네트 알고리즘 분류기, 순차 최소 최적화 알고리즘 분류기, 나이브 베이즈 알고리즘 분류기, 및 주성분 분석 분류기로 이루어진 군으로부터 선택된 기계 학습 분류기로서 구성되는 분류 회로를 포함하는 것인, 분류기.
  18. a) 생물학적 샘플로부터 RNA 분자를 단리하는 단계;
    b) RNA 분자를 상보적 데옥시리보핵산(cDNA) 분자로 역전사시키기 전 또는 후에 RNA 어댑터를 RNA 분자에 결찰하는 단계;
    c) cDNA 분자를 증폭시키는 단계;
    d) cDNA 분자의 핵산 서열을 결정하는 단계;
    e) 표 1-11에 열거된 군으로부터 선택된 miRNA의 패널에 대한 참조 핵산 서열에 핵산 서열을 정렬하는 단계; 및
    f) 정렬된 핵산 서열에 적어도 부분적으로 기초하여 대상체의 miRNA 프로파일을 결정하는 단계
    를 포함하는, 대상체로부터의 생물학적 샘플의 마이크로 리보핵산(miRNA) 프로파일을 결정하기 위한 방법.
  19. 제18항에 있어서, 미리 선택된 miRNA는 표 1-11에 열거된 군으로부터 선택된 적어도 1 개, 적어도 2 개, 적어도 3 개, 적어도 4 개, 적어도 5 개, 적어도 6 개, 적어도 7 개, 적어도 8 개, 적어도 9 개, 적어도 10 개, 적어도 11 개, 적어도 12 개, 적어도 13 개, 적어도 14 개, 적어도 15 개, 적어도 16 개, 적어도 17 개, 적어도 18 개, 적어도 19 개, 적어도 20 개, 적어도 21 개, 적어도 22 개, 적어도 23 개, 적어도 24 개, 적어도 25 개, 적어도 26 개, 적어도 27 개, 적어도 28 개, 적어도 29 개, 적어도 30 개, 적어도 40 개, 적어도 50 개, 적어도 60 개, 적어도 70 개, 적어도 80 개, 적어도 90 개, 적어도 100 개, 적어도 110 개, 적어도 120 개, 적어도 130 개, 적어도 140 개, 적어도 150 개, 적어도 160 개, 적어도 170 개, 적어도 180 개, 적어도 190 개, 적어도 200 개, 또는 적어도 250 개의 miRNA를 포함하는 것인 방법.
  20. 제18항에 있어서, 결장 세포 증식성 장애는 선종(선종성 용종), 무경성 거치상 선종(SSA), 진행성 선종, 결장직장 이형성증, 결장직장 선종, 결장직장암, 결장암, 직장암, 결장직장 암종, 결장직장 선암종, 카르시노이드 종양, 위장 카르시노이드 종양, 위장 기질 종양(GIST), 림프종, 및 육종으로 이루어진 군으로부터 선택되는 것인 방법.
  21. 제18항에 있어서, RNA 분자 또는 cDNA 분자를 풍부화 또는 고갈시키는 단계를 추가로 포함하는, 방법.
  22. 제18항에 있어서, 참조 핵산 서열은 게놈, 전사체, 또는 맞춤 전사체 참조 핵산 서열을 포함하는 것인 방법.
  23. 제18항에 있어서, 증폭 전에 miRNA 라이브러리를 제조하는 단계를 추가로 포함하는, 방법.
  24. 제18항에 있어서, RNA 어댑터를 결찰하는 것은 어댑터 차단, 어댑터 순환, 및 이량체 제거를 수행하는 것을 포함하는 것인 방법.
  25. 제18항에 있어서, RNA 어댑터를 결찰하는 것은 3' RNA 어댑터 결찰, 5' RNA 어댑터 결찰, 고유한 분자 식별자(UMI) 할당을 갖는 역전사, 및 cDNA 클린업을 수행하는 것을 포함하는 것인 방법.
  26. 다음 중 하나 이상을 수행하는 단계를 포함하는, 대상체로부터의 생물학적 샘플의 마이크로 리보핵산(miRNA) 프로파일을 결정하기 위한 방법: 1) 생물학적 샘플로부터 RNA 분자의 추출 후 직접 RNA 계수, 2) 생물학적 샘플로부터 RNA 분자의 추출 후 A 테일링, 이후, 주형 전환으로 cDNA로의 역전사(RT), 3) 생물학적 샘플로부터 RNA 분자의 추출 후 A 테일링, 이어서 역전사 폴리머라제 연쇄 반응(RT-PCR) 및 정량적 PCR(qPCR) 또는 디지털 액적 PCR(ddPCR), 4) 생물학적 샘플로부터 RNA 분자의 추출 후 서열-특이적 결찰, 및 이어서 RT-PCR 및 qPCR 또는 ddPCR, 및 5) RNA 단리를 수행하지 않고 생물학적 샘플로부터 RNA 분자의 추출-유리 miRNA 프로파일링; 및 대상체로부터의 생물학적 샘플의 miRNA 프로파일 결정.
  27. 제26항에 있어서, miRNA 프로파일을 결정하는 것은 인간 게놈 또는 인간 전사체 데이터베이스의 일부인 참조 핵산 서열의 사용을 포함하는 것인 방법.
  28. 제26항에 있어서, miRNA 프로파일을 결정하는 것은 발현된 miRNA의 카운트 표를 생성하는 것을 포함하는 것인 방법.
  29. 제26항에 있어서, miRNA 프로파일을 결정하는 것은 차등적으로 풍부한 miRNA를 식별하기 위해 발현된 miRNA에 기초하여 표준화된 카운트 표를 생성하는 것을 포함하는 것인 방법.
  30. 제26항에 있어서, miRNA 프로파일은 결장 세포 증식성 장애와 관련되며, 결장 세포 증식성 장애를 갖거나 결장 세포 증식성 장애를 갖지 않는 것으로서 대상체의 분류를 제공하는 것인 방법.
  31. 제26항에 있어서, 대상체로부터의 생물학적 샘플은 체액, 대변, 결장 유출물, 소변, 혈장, 혈청, 전혈, 단리된 혈액 세포, 혈액으로부터 단리된 세포, 및 이들의 조합으로 이루어진 군으로부터 선택되는 것인 방법.
  32. 제26항에 있어서, 건강한 대상체로부터의 참조 miRNA 프로파일의 데이터베이스에 대해 miRNA 프로파일을 비교하는 단계; 및 참조 miRNA 프로파일에 비해 miRNA 프로파일의 miRNA 발현에서 적어도 15%의 변화를 측정하는 것에 적어도 부분적으로 기초하여 대상체가 결장 세포 증식성 장애를 가질 증가된 위험도를 갖는지 결정하는 단계를 추가로 포함하는, 방법.
  33. 제26항에 있어서, 결장 세포 증식성 장애는 선종(선종성 용종), 무경성 거치상 선종(SSA), 진행성 선종, 결장직장 이형성증, 결장직장 선종, 결장직장암, 결장암, 직장암, 결장직장 암종, 결장직장 선암종, 카르시노이드 종양, 위장 카르시노이드 종양, 위장 기질 종양(GIST), 림프종, 및 육종으로 이루어진 군으로부터 선택되는 것인 방법.
  34. 제26항에 있어서, 결장 세포 증식성 장애는 1기 결장직장암, 2기 결장직장암, 3기 결장직장암, 및 4기 결장직장암으로 이루어진 군으로부터 선택되는 것인 방법.
  35. 제26항에 있어서, 진행성 선종은 관상 선종, 관융모 선종, 융모 선종, 선암종, 또는 과형성 용종을 포함하는 것인 방법.
  36. a) 생물학적 샘플로부터 리보핵산(RNA) 분자를 단리하는 단계;
    b) RNA 분자를 상보적 데옥시리보핵산(cDNA) 분자로 역전사시키기 전 또는 후에 RNA 어댑터를 RNA 분자에 결찰하는 단계;
    c) cDNA 분자를 증폭시키는 단계;
    d) cDNA 분자의 핵산 서열을 결정하는 단계;
    e) 표 1-11에 열거된 군으로부터 선택된 miRNA의 미리 확인된 패널에 대한 참조 핵산 서열에 핵산 서열을 정렬하는 단계;
    f) 정렬된 핵산 서열에 적어도 부분적으로 기초하여 miRNA 프로파일을 결정하는 단계; 및
    g) 건강한 대상체와 결장 세포 증식성 장애가 있는 대상체를 구별할 수 있도록 훈련된 기계 학습 모델을 이용하여 miRNA 프로파일을 컴퓨터 처리하여 결장 세포 증식성 장애의 존재 또는 부재와 관련된 출력 값을 제공함으로써, 대상체에서 결장 세포 증식성 장애의 존재 또는 부재를 지시하는 단계
    를 포함하는, 대상체에서 결장 세포 증식성 장애의 존재 또는 부재를 검출하기 위한 방법.
  37. 제36항에 있어서, b)는 샘플-특이적 바코드 및/또는 분자-특이적 고유 분자 식별자(UMI)를 혼입시키는 것을 포함하는 것인 방법.
  38. 제36항에 있어서, 미리 선택된 miRNA는 표 1-11에 열거된 군으로부터 선택된 적어도 1 개, 적어도 2 개, 적어도 3 개, 적어도 4 개, 적어도 5 개, 적어도 6 개, 적어도 7 개, 적어도 8 개, 적어도 9 개, 적어도 10 개, 적어도 11 개, 적어도 12 개, 적어도 13 개, 적어도 14 개, 적어도 15 개, 적어도 16 개, 적어도 17 개, 적어도 18 개, 적어도 19 개, 적어도 20 개, 적어도 21 개, 적어도 22 개, 적어도 23 개, 적어도 24 개, 적어도 25 개, 적어도 26 개, 적어도 27 개, 적어도 28 개, 적어도 29 개, 적어도 30 개, 적어도 40 개, 적어도 50 개, 적어도 60 개, 적어도 70 개, 적어도 80 개, 적어도 90 개, 적어도 100 개, 적어도 110 개, 적어도 120 개, 적어도 130 개, 적어도 140 개, 적어도 150 개, 적어도 160 개, 적어도 170 개, 적어도 180 개, 적어도 190 개, 적어도 200 개, 또는 적어도 250 개의 miRNA를 포함하는 것인 방법.
  39. 제36항에 있어서, 결장 세포 증식성 장애는 선종(선종성 용종), 무경성 거치상 선종(SSA), 진행성 선종, 결장직장 이형성증, 결장직장 선종, 결장직장암, 결장암, 직장암, 결장직장 암종, 결장직장 선암종, 카르시노이드 종양, 위장 카르시노이드 종양, 위장 기질 종양(GIST), 림프종, 및 육종으로 이루어진 군으로부터 선택되는 것인 방법.
  40. 제36항에 있어서, 참조 핵산 서열은 인간 게놈 또는 인간 전사체 데이터베이스의 일부인, 방법.
  41. 제36항에 있어서, 대상체의 miRNA 프로파일을 결정하는 것은 발현된 miRNA의 카운트 표를 생성하는 것을 포함하는 것인 방법.
  42. 제36항에 있어서, 대상체의 miRNA 프로파일을 결정하는 것은 발현된 miRNA의 카운트 표를 생성하여 차등적으로 풍부한 miRNA를 식별하는 것을 포함하는 것인 방법.
  43. 제36항에 있어서, 대상체로부터의 생물학적 샘플은 체액, 대변, 결장 유출물, 소변, 혈장, 혈청, 전혈, 단리된 혈액 세포, 혈액으로부터 단리된 세포, 및 이들의 조합으로 이루어진 군으로부터 선택되는 것인 방법.
  44. 제36항에 있어서, 건강한 대상체로부터의 참조 miRNA 프로파일의 데이터베이스에 대해 miRNA 프로파일을 비교하는 단계; 및 참조 miRNA 프로파일에 비해 miRNA 프로파일의 miRNA 발현에서 적어도 15%의 변화를 측정하는 것에 적어도 부분적으로 기초하여 대상체가 결장 세포 증식성 장애를 가질 증가된 위험도를 갖는지 결정하는 단계를 추가로 포함하는, 방법.
  45. 제36항에 있어서, 결장 세포 증식성 장애는 선종(선종성 용종), 무경성 거치상 선종(SSA), 진행성 선종, 결장직장 이형성증, 결장직장 선종, 결장직장암, 결장암, 직장암, 결장직장 암종, 결장직장 선암종, 카르시노이드 종양, 위장 카르시노이드 종양, 위장 기질 종양(GIST), 림프종, 및 육종으로 이루어진 군으로부터 선택되는 것인 방법.
  46. 제36항에 있어서, 결장 세포 증식성 장애는 1기 결장직장암, 2기 결장직장암, 3기 결장직장암, 및 4기 결장직장암으로 이루어진 군으로부터 선택되는 것인 방법.
  47. 제36항에 있어서, 검출된 결장 세포 증식성 장애에 기초하여 대상체에 대해 치료를 수행하는 단계를 추가로 포함하는, 방법.
  48. a) 생물학적 샘플로부터 리보핵산(RNA) 분자를 단리하는 단계;
    b) RNA 분자를 상보적 데옥시리보핵산(cDNA) 분자로 역전사시키는 단계;
    c) RNA 분자 또는 cDNA 분자에 RNA 어댑터를 결찰하는 단계;
    d) cDNA 분자를 증폭시키는 단계;
    e) cDNA 분자의 핵산 서열을 결정하는 단계;
    f) 표 1-11에 열거된 군으로부터 선택된 miRNA의 패널에 대한 참조 핵산 서열에 핵산 서열을 정렬하는 단계; 및
    g) 정렬된 핵산 서열에 적어도 부분적으로 기초하여 miRNA 프로파일을 결정하는 단계
    를 포함하는, 대상체로부터의 생물학적 샘플의 miRNA 프로파일을 결정하기 위한 방법.
  49. 제48항에 있어서, 미리 선택된 miRNA는 표 1-11에 열거된 군으로부터 선택된 적어도 1 개, 적어도 2 개, 적어도 3 개, 적어도 4 개, 적어도 5 개, 적어도 6 개, 적어도 7 개, 적어도 8 개, 적어도 9 개, 적어도 10 개, 적어도 11 개, 적어도 12 개, 적어도 13 개, 적어도 14 개, 적어도 15 개, 적어도 16 개, 적어도 17 개, 적어도 18 개, 적어도 19 개, 적어도 20 개, 적어도 21 개, 적어도 22 개, 적어도 23 개, 적어도 24 개, 적어도 25 개, 적어도 26 개, 적어도 27 개, 적어도 28 개, 적어도 29 개, 적어도 30 개, 적어도 40 개, 적어도 50 개, 적어도 60 개, 적어도 70 개, 적어도 80 개, 적어도 90 개, 적어도 100 개, 적어도 110 개, 적어도 120 개, 적어도 130 개, 적어도 140 개, 적어도 150 개, 적어도 160 개, 적어도 170 개, 적어도 180 개, 적어도 190 개, 적어도 200 개, 또는 적어도 250 개의 miRNA를 포함하는 것인 방법.
  50. a) 생물학적 샘플로부터 리보핵산(RNA) 분자를 단리하는 단계;
    b) RNA 분자를 상보적 데옥시리보핵산(cDNA) 분자로 역전사시키는 단계;
    c) RNA 분자 또는 cDNA 분자에 RNA 어댑터를 결찰하는 단계;
    d) cDNA 분자를 증폭시키는 단계;
    e) cDNA 분자의 핵산 서열을 결정하는 단계;
    f) 표 1-11에 열거된 군으로부터 선택된 miRNA의 패널에 대한 참조 핵산 서열에 핵산 서열을 정렬하는 단계;
    g) 정렬된 핵산 서열에 적어도 부분적으로 기초하여 miRNA 프로파일을 결정하는 단계;
    h) 결장 세포 증식성 장애를 갖지 않는 대상체와 결장 세포 증식성 장애를 갖는 대상체를 구별하도록 훈련된 기계 학습 모델을 사용하여 miRNA 프로파일을 컴퓨터 처리하는 단계; 및
    i) 기계 학습 모델에 의해 결장 세포 증식성 장애를 갖는 대상체 또는 결장 세포 증식성 장애를 갖지 않는 대상체와 관련된 값을 출력함으로써, 대상체에서 결장 세포 증식성 장애의 존재 또는 부재를 검출하는 단계
    를 포함하는, 대상체에서 결장 세포 증식성 장애의 존재 또는 부재를 검출하기 위한 방법.
  51. 제50항에 있어서, 미리 선택된 miRNA는 표 1-11에 열거된 군으로부터 선택된 적어도 1 개, 적어도 2 개, 적어도 3 개, 적어도 4 개, 적어도 5 개, 적어도 6 개, 적어도 7 개, 적어도 8 개, 적어도 9 개, 적어도 10 개, 적어도 11 개, 적어도 12 개, 적어도 13 개, 적어도 14 개, 적어도 15 개, 적어도 16 개, 적어도 17 개, 적어도 18 개, 적어도 19 개, 적어도 20 개, 적어도 21 개, 적어도 22 개, 적어도 23 개, 적어도 24 개, 적어도 25 개, 적어도 26 개, 적어도 27 개, 적어도 28 개, 적어도 29 개, 적어도 30 개, 적어도 40 개, 적어도 50 개, 적어도 60 개, 적어도 70 개, 적어도 80 개, 적어도 90 개, 적어도 100 개, 적어도 110 개, 적어도 120 개, 적어도 130 개, 적어도 140 개, 적어도 150 개, 적어도 160 개, 적어도 170 개, 적어도 180 개, 적어도 190 개, 적어도 200 개, 또는 적어도 250 개의 miRNA를 포함하는 것인 방법.
  52. 제50항에 있어서, 결장 세포 증식성 장애는 선종(선종성 용종), 무경성 거치상 선종(SSA), 진행성 선종, 결장직장 이형성증, 결장직장 선종, 결장직장암, 결장암, 직장암, 결장직장 암종, 결장직장 선암종, 카르시노이드 종양, 위장 카르시노이드 종양, 위장 기질 종양(GIST), 림프종, 및 육종으로 이루어진 군으로부터 선택되는 것인 방법.
  53. 제50항에 있어서, 검출된 결장 세포 증식성 장애에 기초하여 대상체에 대해 치료를 수행하는 단계를 추가로 포함하는, 방법.
  54. 질환에 대해 이전에 치료된 대상체에서 최소 잔존 질환을 모니터링하기 위한 방법으로서, 표 1-11에 열거된 군으로부터 선택된 miRNA의 패널을 사용하여 대상체로부터 생물학적 샘플의 마이크로 리보핵산(miRNA) 프로파일을 결정함으로써 기준선 miRNA 상태를 생성하는 단계; 기준선 miRNA 상태의 생성 후 하나 이상의 시점에 대상체로부터 얻어진 생물학적 샘플의 miRNA 프로파일을 결정함으로써 현재 miRNA 상태를 생성하는 단계; 및 기준선 miRNA 상태와 현재 miRNA 상태 사이의 차이를 결정함으로써, 대상체에서 최소 잔존 질환의 변화를 검출하는 단계를 포함하는, 질환에 대해 이전에 치료된 대상체에서 최소 잔존 질환을 모니터링하기 위한 방법.
  55. 제54항에 있어서, 최소 잔존 질환은 치료에 대한 반응, 종양 부하, 수술 후 잔존 종양, 재발, 이차 스크리닝, 일차 스크린, 및 암 진행으로 이루어진 군으로부터 선택되는 것인 방법.
  56. 제54항에 있어서, miRNA 프로파일은 적어도 약 40%의 민감도로 대상체에서 결장직장암의 존재 또는 감수성을 지시하는 것인 방법.
  57. 제54항에 있어서, 대상체에서 최소 잔존 질환의 검출된 변화에 기초하여 대상체에 대해 치료를 수행하는 단계를 추가로 포함하는, 방법.
KR1020227041793A 2020-04-29 2021-04-27 결장 세포 증식성 장애를 식별하기 위한 rna 마커 및 방법 KR20230017206A (ko)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US202063017552P 2020-04-29 2020-04-29
US63/017,552 2020-04-29
US202063024875P 2020-05-14 2020-05-14
US63/024,875 2020-05-14
PCT/US2021/029361 WO2021222220A2 (en) 2020-04-29 2021-04-27 Rna markers and methods for identifying colon cell proliferative disorders

Publications (1)

Publication Number Publication Date
KR20230017206A true KR20230017206A (ko) 2023-02-03

Family

ID=78332157

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020227041793A KR20230017206A (ko) 2020-04-29 2021-04-27 결장 세포 증식성 장애를 식별하기 위한 rna 마커 및 방법

Country Status (8)

Country Link
US (1) US20230160019A1 (ko)
EP (1) EP4143309A2 (ko)
JP (1) JP2023524016A (ko)
KR (1) KR20230017206A (ko)
CN (1) CN115812101A (ko)
AU (1) AU2021263680A1 (ko)
CA (1) CA3181389A1 (ko)
WO (1) WO2021222220A2 (ko)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019060716A1 (en) 2017-09-25 2019-03-28 Freenome Holdings, Inc. SAMPLE EXTRACTION METHODS AND SYSTEMS
WO2023225560A1 (en) 2022-05-17 2023-11-23 Guardant Health, Inc. Methods for identifying druggable targets and treating cancer
WO2024009221A1 (en) * 2022-07-04 2024-01-11 Artificial Intelligence Expert Srl Method and system for multi-cancer management in subject

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100010196A1 (en) * 1997-09-26 2010-01-14 Abt Holding Company Compositions and methods for non-targeted activation of endogenous genes
US20040018973A1 (en) * 2002-01-25 2004-01-29 University Of Pittsburgh Nuclear matrix protein alterations associated with colon cancer and colon metastasis to the liver, and uses thereof
JP5297202B2 (ja) * 2006-01-11 2013-09-25 ジェノミック ヘルス, インコーポレイテッド 結腸直腸癌の予後のための遺伝子発現マーカー
US20130137593A1 (en) * 2010-04-15 2013-05-30 Hadasit Medical Research Services And Development Ltd. Early detection and staging of colorectal cancer using a panel of micro rnas
US20180010176A1 (en) * 2015-02-13 2018-01-11 Abhijit Ajit Patel Methods for highly parallel and accurate measurement of nucleic acids
EP3571315A4 (en) * 2017-01-23 2020-11-11 Srnalytics, Inc. METHOD OF IDENTIFICATION AND USE OF SMALL RNA PREDICTORS
JP7455757B2 (ja) * 2018-04-13 2024-03-26 フリーノーム・ホールディングス・インコーポレイテッド 生体試料の多検体アッセイのための機械学習実装

Also Published As

Publication number Publication date
WO2021222220A2 (en) 2021-11-04
AU2021263680A1 (en) 2022-11-24
CA3181389A1 (en) 2021-11-04
WO2021222220A3 (en) 2021-12-09
CN115812101A (zh) 2023-03-17
US20230160019A1 (en) 2023-05-25
EP4143309A2 (en) 2023-03-08
JP2023524016A (ja) 2023-06-08

Similar Documents

Publication Publication Date Title
JP7455757B2 (ja) 生体試料の多検体アッセイのための機械学習実装
JP7368483B2 (ja) 相同組換え欠損を推定するための統合された機械学習フレームワーク
US20210057046A1 (en) Methods and systems for analyzing microbiota
US20230101485A1 (en) Methods and systems for detecting colorectal cancer via nucleic acid methylation analysis
AU2020283042A1 (en) Methods and systems for high-depth sequencing of methylated nucleic acid
US20230160019A1 (en) Rna markers and methods for identifying colon cell proliferative disorders
KR20220133868A (ko) 패치 컨볼루션 신경망을 사용한 암 분류
US20240084397A1 (en) Methods and systems for detecting cancer via nucleic acid methylation analysis
US20230175058A1 (en) Methods and systems for abnormality detection in the patterns of nucleic acids
Simon Analysis of DNA microarray expression data
CN113574602A (zh) 从循环无细胞核酸中灵敏地检测拷贝数变异(cnv)
US20180371553A1 (en) Methods and compositions for the analysis of cancer biomarkers
Saha et al. A Multi-Molecular Fusion to Detect Transcriptomic Signature in Tissue-Specific Cancer
US20230272486A1 (en) Tumor fraction estimation using methylation variants
WO2023183468A2 (en) Tcr/bcr profiling for cell-free nucleic acid detection of cancer

Legal Events

Date Code Title Description
A201 Request for examination