KR20220097503A - 대장암 및/또는 진행성 선종의 검출 - Google Patents
대장암 및/또는 진행성 선종의 검출 Download PDFInfo
- Publication number
- KR20220097503A KR20220097503A KR1020227019557A KR20227019557A KR20220097503A KR 20220097503 A KR20220097503 A KR 20220097503A KR 1020227019557 A KR1020227019557 A KR 1020227019557A KR 20227019557 A KR20227019557 A KR 20227019557A KR 20220097503 A KR20220097503 A KR 20220097503A
- Authority
- KR
- South Korea
- Prior art keywords
- methylation
- colorectal cancer
- dna
- various embodiments
- seq
- Prior art date
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
- C12Q1/6883—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
- C12Q1/6886—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6844—Nucleic acid amplification reactions
- C12Q1/686—Polymerase chain reaction [PCR]
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2535/00—Reactions characterised by the assay type for determining the identity of a nucleotide base or a sequence of oligonucleotides
- C12Q2535/122—Massive parallel sequencing
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/154—Methylation markers
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/156—Polymorphic or mutational markers
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N2800/00—Detection or diagnosis of diseases
- G01N2800/52—Predicting or monitoring the response to treatment, e.g. for selection of therapy based on assay results in personalised medicine; Prognosis
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N2800/00—Detection or diagnosis of diseases
- G01N2800/56—Staging of a disease; Further complications associated with the disease
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N2800/00—Detection or diagnosis of diseases
- G01N2800/70—Mechanisms involved in disease identification
- G01N2800/7023—(Hyper)proliferation
- G01N2800/7028—Cancer
Landscapes
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Organic Chemistry (AREA)
- Health & Medical Sciences (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Engineering & Computer Science (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Immunology (AREA)
- Analytical Chemistry (AREA)
- Genetics & Genomics (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Physics & Mathematics (AREA)
- Biotechnology (AREA)
- Microbiology (AREA)
- Molecular Biology (AREA)
- Biophysics (AREA)
- Biochemistry (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Pathology (AREA)
- Hospice & Palliative Care (AREA)
- Oncology (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
본원은 무엇보다도 대장암 및/또는 진행성 선종 검출(예컨대, 스크리닝)을 위한 방법 및 이와 관련된 조성물을 제공한다. 다양한 구현예에서, 본원은 하나 이상의 메틸화 바이오마커, 및 이와 관련된 조성물의 메틸화 상태의 분석을 포함하는 예컨대, 스크리닝 방법을 제공한다. 다양한 구현예에서, 본원은 cfDNA, 예를 들어 ctDNA에서 하나 이상의 메틸화 바이오마커의 메틸화 상태를 검출(예컨대, 스크리닝)하는 것을 포함하는 검출(예컨대, 스크리닝) 방법을 제공한다. 다양한 구현예에서, 본원은 MSRE-qPCR을 사용하여 및/또는 대규모 병렬 시퀀싱(예컨대, 차세대 시퀀싱)을 사용하여 cfDNA, 예를 들어 ctDNA에서 하나 이상의 메틸화 바이오마커의 메틸화 상태를 검출(예컨대, 스크리닝)하는 것을 포함하는 스크리닝 방법을 제공한다.
Description
본 발명은 일반적으로 대장암(colorectal cancer) 및/또는 진행성 선종(advanced adenoma)의 검출 및/또는 선제적 스크리닝을 위한 방법 및 키트에 관한 것이다. 특정 구현예에서, 본원에 기재된 방법 및 키트는 대상체에서 대장암 및/또는 진행성 선종의 존재 및/또는 위험을 결정하기 위한 마커로서 인간 게놈의 식별된 차등적 메틸화 영역을 이용한다.
암 스크리닝은 암 예방, 진단 및 치료에 있어 매우 중요한 요소이다. 일부 보고서에 따르면, 대장암(Colorectal cancer, CRC)은 세계에서 세 번째로 흔한 유형의 암이자 두 번째로 흔한 암 사망 원인으로 확인되었다. 일부 보고서에 따르면, 매년 180만 명이 넘는 새로운 대장암 사례가 발생하고 약 881,000명이 대장암으로 사망하며, 이는 암 사망 10명 중 1명꼴이다. 정기적인 대장암 스크리닝은 특히 50세 이상의 개체에게 권장된다. 또한 50세 미만의 개체에서 대장암 발병률은 시간의 경과에 따라 증가하였다. 통계에 따르면 현재의 대장암 스크리닝 기술은 충분하지 않다. 시간의 경과에 따른 개선에도 불구하고 현재 대장암의 약 40-44%만이 조기의 국부적 단계에서 선별 검사를 통해 발견된다. 이것은 적어도 부분적으로 현재 스크리닝 기술의 불충분한 민감도 및/또는 특이도 때문이다. 현재 권장되는 기술은 50세 이상을 위한 대장 내시경 및/또는 대변 혈액 검사가 있다.
대부분의 대장암은 조직학에 따라 처음에는 양성으로 나타나는 결장 폴립으로부터 유래한다. 따라서 대장 용종을 조기에 발견하고 제거하는 것은 대장암 검진의 중요한 부분이다. 그러나 어떤 용종이 침윤성 암으로 발전할지 결정하는 것은 조직병리학적 분류만을 기초로 해서는 어렵다. 악성 종양으로 진행되는 경향성이 있는 진행성 선종으로서 용종의 조직병리학적 분류는, 예를 들어 대장 내시경 동안 결장 조직으로부터 절제된 샘플에 대해 일상적으로 수행된다. 진행성 선종은 다음 특징 중 하나 이상을 갖는 것으로 분류된다: 큰 크기를 가짐(즉, 1cm보다 큰 선종); 고등급 이형성증이 있음; 두드러진 융모 성분을 가짐; 및/또는 톱니 모양의 특징이 있다. 그러나, 상기 분류에 따라 선종이 진행성 선종으로 분류되더라도 상기 선종이 침윤성 암종으로 진행되지 않을 수 있다.
특정 이론에 얽매이지 않고, 침윤성 암종으로 진행되는 선종 또는 용종은 정상 조직과 구별되는 유전적 변조를 획득하고 축적할 것이다. 이러한 뚜렷한 변화의 식별을 통해 선종이 침윤성 암종으로 진행될지 여부를 결정하는 데 도움이 되는 분자 지문이 개발될 수 있다. 진행성 암종 및 대장암의 분자 지문을 결정하기 위한 도구와 기술을 개발하면 초기 단계에서 대장암을 식별하는 데 도움이 될 것이다. 따라서 대장암을 초기에 정확하게 검진할 수 있는 도구와 검진 기술이 필요하다.
본원은 무엇보다도 대장암 및/또는 진행성 선종 스크리닝을 위한 방법 및 이와 관련된 조성물을 제공한다. 본원에 구체적으로 개시된 다양한 구현예에서, 본원은 인간 대상체의 DNA의 차등적 메틸화 영역(differentially methylated region, DMR) 내에서 발견되는 하나 이상의 메틸화 부위 중 적어도 하나의 메틸화 상태의 식별을 포함하는 대장암 및/또는 진행성 선종 스크리닝을 위한 방법을 제공한다. 본원에 구체적으로 개시된 다양한 구현예에서, 본원은 cfDNA(무세포 DNA), 예컨대 ctDNA(circulating tumor DNA)에서 하나 이상의 메틸화 바이오마커의 메틸화 상태를 스크리닝하는 것을 포함하는 대장암 및/또는 진행성 선종 스크리닝을 위한 방법을 제공한다. 다양한 구현예에서, 본원은 MSRE-qPCR을 사용하여 cfDNA, 예컨대 ctDNA에서 하나 이상의 메틸화 바이오마커의 메틸화 상태를 스크리닝하는 것을 포함하는 대장암 및/또는 진행성 선종 스크리닝 방법을 제공한다. 본원에 제공된 다양한 조성물 및 방법은 대장암 및/또는 진행성 선종 스크리닝에서의 임상 적용에 충분한 민감도 및 특이도를 제공한다. 본원에 제공된 다양한 조성물 및 방법은 대상체의 접근 가능한 조직 샘플, 예를 들어 혈액 또는 혈액 성분(예컨대, cfDNA, 예를 들어, ctDNA), 결장직장 조직, 또는 대변인 조직 샘플의 분석에 의한 대장암 및/또는 진행성 선종 스크리닝에 유용하다.
특정 구현예에서, 본원에 개시된 바와 같은 임의의 방법이 시험관내(in vitro)에서 사용될 수 있다.
일 양태에서, 본원은 (i) 대장암에 대한 스크리닝 또는 (ii) 진행성 선종에 대한 스크리닝, 또는 (iii) 대장암 또는 진행성 선종(또는 둘 모두)의 존재에 대한 스크리닝 방법을 제공하며, 상기 방법은 표 1 또는 표 7에 열거된 인간 대상체의 DNA의 차등적 메틸화 영역(DMR) 내에서 발견되는 적어도 하나의 메틸화 부위의 메틸화 상태를 결정하는 단계를 포함한다.
이전 단락에서 구체적으로 언급된 다양한 구현예에서, 상기 방법은 표 1 또는 표 7에 열거된 하나 이상의 DMR 각각에 대해 DMR 내에서 발견되는 적어도 3개의 메틸화 부위의 메틸화 상태를 결정하는 단계를 포함한다.
이전 단락에서 구체적으로 언급된 다양한 구현예에서, 상기 방법은 표 1 또는 표 7에 열거된 하나 이상의 DMR 각각에 대해 DMR 내에서 발견되는 적어도 4개의 메틸화 부위의 메틸화 상태를 결정하는 것을 포함한다.
이전 단락에서 구체적으로 언급된 다양한 구현예에서, 상기 방법은 표 1 또는 표 7에 열거된 하나 이상의 DMR 각각에 대해 DMR 내에서 발견되는 적어도 5개의 메틸화 부위의 메틸화 상태를 결정하는 것을 포함한다.
이전 단락에서 구체적으로 언급된 다양한 구현예에서, 상기 방법은 표 1 또는 표 7에 열거된 3개 이상의 DMR 각각에 대해 DMR 내에서 발견되는 적어도 하나의 메틸화 부위의 메틸화 상태를 결정하는 것을 포함한다
이전 단락에서 구체적으로 언급된 다양한 구현예에서, 상기 방법은 표 1 또는 표 7에 열거된 3개 이상의 DMR 각각에 대해 DMR 내에서 발견되는 적어도 3개의 메틸화 부위의 메틸화 상태를 결정하는 것을 포함한다.
이전 단락에서 구체적으로 언급된 다양한 구현예에서, 상기 방법은 표 1 또는 표 7에 열거된 3개 이상의 DMR 각각에 대해 DMR 내에서 발견되는 적어도 4개의 메틸화 부위의 메틸화 상태를 결정하는 것을 포함한다.
이전 단락에서 구체적으로 언급된 다양한 구현예에서, 상기 방법은 표 1 또는 표 7에 열거된 3개 이상의 DMR 각각에 대해 DMR 내에서 발견되는 적어도 5개의 메틸화 부위의 메틸화 상태를 결정하는 것을 포함한다.
이전 단락에서 구체적으로 언급된 다양한 구현예에서, 상기 방법은 표 1 또는 표 7에 열거된 10개 이상의 DMR 각각에 대해 DMR 내에서 발견되는 적어도 하나의 메틸화 부위의 메틸화 상태를 결정하는 것을 포함한다.
이전 단락에서 구체적으로 언급된 다양한 구현예에서, 상기 방법은 표 1 또는 표 7에 열거된 10개 이상의 DMR 각각에 대해 DMR 내에서 발견되는 적어도 3개의 메틸화 부위의 메틸화 상태를 결정하는 것을 포함한다.
이전 단락에서 구체적으로 언급된 다양한 구현예에서, 상기 방법은 표 1 또는 표 7에 열거된 10개 이상의 DMR 각각에 대해 DMR 내에서 발견되는 적어도 4개의 메틸화 부위의 메틸화 상태를 결정하는 것을 포함한다.
이전 단락에서 구체적으로 언급된 다양한 구현예에서, 상기 방법은 표 1 또는 표 7에 열거된 10개 이상의 DMR 각각에 대해 DMR 내에서 발견되는 적어도 5개의 메틸화 부위의 메틸화 상태를 결정하는 것을 포함한다
이전 단락에서 구체적으로 언급된 다양한 구현예에서, 상기 방법은 표 1에 열거된 35개 이상의 DMR 각각에 대해 DMR 내에서 발견되는 적어도 하나의 메틸화 부위의 메틸화 상태를 결정하는 단계를 포함한다.
이전 단락에서 구체적으로 언급된 다양한 구현예에서, 상기 방법은 표 1에 열거된 35개 이상의 DMR 각각에 대해 DMR 내에서 발견되는 적어도 3개의 메틸화 부위의 메틸화 상태를 결정하는 것을 포함한다.
이전 단락에서 구체적으로 언급된 다양한 구현예에서, 상기 방법은 표 1에 열거된 35개 이상의 DMR 각각에 대해 DMR 내에서 발견되는 적어도 4개의 메틸화 부위의 메틸화 상태를 결정하는 단계를 포함한다.
이전 단락에서 구체적으로 언급된 다양한 구현예에서, 상기 방법은 표 1에 열거된 35개 이상의 DMR 각각에 대해 DMR 내에서 발견되는 적어도 5개의 메틸화 부위의 메틸화 상태를 결정하는 것을 포함한다.
이전 단락에서 구체적으로 언급된 다양한 구현예에서, 상기 방법은 표 7에 열거된 40개 이상의 DMR 각각에 대해 DMR 내에서 발견되는 적어도 3개의 메틸화 부위의 메틸화 상태를 결정하는 것을 포함한다.
이전 단락에서 구체적으로 언급된 다양한 구현예에서, 상기 방법은 표 7에 열거된 40개 이상의 DMR 각각에 대해 DMR 내에서 발견되는 적어도 4개의 메틸화 부위의 메틸화 상태를 결정하는 것을 포함한다.
이전 단락에서 구체적으로 언급된 다양한 구현예에서, 상기 방법은 표 7에 열거된 40개 이상의 DMR 각각에 대해 DMR 내에서 발견되는 적어도 5개의 메틸화 부위의 메틸화 상태를 결정하는 것을 포함한다.
이전 단락에서 구체적으로 언급된 다양한 구현예에서, DMR은 적어도 1, 적어도 2, 적어도 3, 적어도 4, 적어도 5, 적어도 6, 적어도 7, 적어도 8, 적어도 9, 적어도 10, 적어도 11, 적어도 12, 적어도 13, 적어도 14, 적어도 15 또는 그 이상의 메틸화 민감성 제한 부위를 포함한다.
이전 단락에서 구체적으로 언급된 다양한 구현예에서, 상기 방법은 기준과 비교하여 적어도 하나의 메틸화 부위가 메틸화되었는지 여부를 결정하는 단계를 포함하고(예컨대, 여기서 기준은 확인된 하나 이상의 인간 대상체의 개체군으로부터의 DNA이다), 메틸화는 (i) 대장암, (ii) 진행성 선종, 또는 (iii) 대장암 또는 진행성 선종(또는 둘 모두)의 표지이다.
이전 단락에서 구체적으로 언급된 다양한 구현예에서, 상기 방법은 표 2에 열거된 바와 같은 각각의 DMR 내에서 발견되는 적어도 하나의 메틸화 부위의 메틸화 상태를 결정하는 것을 포함한다.
이전 단락에서 구체적으로 언급된 다양한 구현예에서, 상기 방법은 표 3에 열거된 바와 같은 각각의 DMR 내에서 발견되는 적어도 하나의 메틸화 부위의 메틸화 상태를 결정하는 것을 포함한다.
이전 단락에서 구체적으로 언급된 다양한 구현예에서, 상기 방법은 표 4에 열거된 바와 같은 각각의 DMR 내에서 발견되는 적어도 하나의 메틸화 부위의 메틸화 상태를 결정하는 것을 포함한다.
이전 단락에서 구체적으로 언급된 다양한 구현예에서, 하나 이상의 DMR은 표 5에 열거된 올리고뉴클레오티드 프라이머 쌍에 의해 증폭된다.
이전 단락에서 구체적으로 언급된 다양한 구현예에서, 인간 대상체의 DNA는 인간 대상체의 조직(예컨대, 결장직장 조직, 예컨대 폴립, 선종), 혈액, 혈장, 소변, 타액 및 대변으로 이루어진 군으로부터 선택된 구성원으로부터 단리된다.
이전 단락에서 구체적으로 언급된 다양한 구현예에서, DNA는 인간 대상체의 무세포 DNA이다.
이전 단락에서 구체적으로 언급된 다양한 구현예에서, 대상체는 스크리닝 시점에 대장암 또는 진행성 선종(또는 둘 모두)에 대해 무증상이었다.
이전 단락에서 구체적으로 언급된 다양한 구현예에서, 대상체는 이전에 대장암 또는 진행성 선종(또는 둘 모두)에 대해 스크리닝되었다.
이전 단락에서 구체적으로 언급된 다양한 구현예에서, 대상체는 최근 10년 이내, 최근 5년 이내, 최근 4년 이내, 최근 3년 이내, 최근 2년 이내 또는 최근 1년 이내에 대장암 또는 진행성 선종(또는 둘 모두)에 대해 스크리닝된 적이 있다.
이전 단락에서 구체적으로 언급된 다양한 구현예에서, 대상체에서 진행성 선종 또는 대장암(또는 둘 모두)에 대한 이전 스크리닝은 대상체가 (i) 대장암, (ii) 진행성 선종, 또는 (iii) 진행성 선종 또는 대장암(또는 둘 모두)이 없는 것으로 진단된 것이다. 이에 대한 다양한 구현예에서 및 특히 이전 단락에서 언급된 바와 같이, 진행성 선종 또는 대장암(또는 둘 모두)에 대한 이전 스크리닝은 대상체가 (i) 대장암, (ii) 진행성 선종, 또는 (iii) 진행성 선종 또는 대장암(또는 둘 모두)이 없는 것으로 진단된 것이 1년 이내였다.
이전 단락에서 구체적으로 언급된 다양한 구현예에서, 진행성 선종 또는 대장암(또는 둘 모두)이 없는 것으로 대상체를 진단한 진행성 선종 또는 대장암(또는 둘 모두)에 대한 이전 스크리닝은 대장내시경 검사였다.
이전 단락에서 구체적으로 언급된 다양한 구현예에서, 상기 방법은 초기 대장암(예를 들어, 대장암이 병기 0, 병기 I, 병기 IIA, 병기 IIB 또는 병기 IIC 대장암임)의 진단을 포함한다.
이전 단락에서 구체적으로 언급된 다양한 구현예에서, 상기 방법은 암이 전이되지 않은 초기 대장암의 진단을 포함한다.
이전 단락에서 구체적으로 언급된 다양한 구현예에서, 메틸화 상태는 메틸화 민감성 제한 효소 정량적 중합효소 연쇄 반응(MSRE-qPCR), 메틸화-특이적 PCR(Methylation-Specific PCR), 메틸화-특이적 뉴클레아제-보조 소수 대립 유전자 농축 PCR(Methylation Specific Nuclease-assisted Minor-allele Enrichment PCR), 하이브리드 캡처 표적 차세대 시퀀싱(hybrid-capture targeted next-generation sequencing) 및 앰플리콘 기반 표적 차세대 시퀀싱(amplicon based targeted next-generation sequencing)으로 이루어진 군으로부터 선택된 하나 이상의 구성원을 사용하여 결정된다.
이전 단락에서 구체적으로 언급된 다양한 구현예에서, 메틸화 상태는 전체 게놈 중아황산염 시퀀싱을 사용하여 결정된다.
이전 단락에서 구체적으로 언급된 다양한 구현예에서, 방법은 시험관내 방법이다.
또 다른 양태에서, 본원은 (i) 대장암에 대한 스크리닝 또는 (ii) 진행성 선종에 대한 스크리닝, 또는 (iii) 대장암 또는 진행성 선종(또는 둘 모두)의 존재에 대한 스크리닝을 위한 메틸화 특이적 제한 효소 정량적 중합효소 연쇄 반응(MSRE-qPCR)의 방법을 제공하고, 상기 방법은 다음 단계를 포함한다: (a) 인간 대상체의 DNA를 하나 이상의 메틸화 특이적 제한 효소와 접촉시키는 단계; 및 (b) 효소-분해된 DNA, 또는 이의 앰플리콘의 qPCR을 수행하여 DNA의 하나 이상의 영역의 메틸화 상태를 결정하는 단계로, 여기서 DNA의 하나 이상의 영역 각각은 표 1의 하나 이상의 DMR의 적어도 일부를 포함하며, 각 부분은 적어도 10, 적어도 15, 적어도 20, 적어도 24, 적어도 30, 적어도 40, 적어도 50, 적어도 100, 적어도 150, 적어도 200, 적어도 250, 적어도 300, 적어도 350, 적어도 400, 적어도 500, 적어도 1000개 또는 그 이상의 길이의 염기쌍을 포함한다.
이전 단락에서 구체적으로 언급된 바와 같은 다양한 구현예에서, DNA 영역 중 하나 이상은 상응하는 올리고뉴클레오티드 프라이머 쌍(예컨대, 프라이머 쌍이 정방향 및 역방향 프라이머를 포함함)에 의해 증폭된다.
이전 단락에서 구체적으로 언급된 다양한 구현예에서, DNA의 하나 이상의 영역 각각은 적어도 1, 적어도 2, 적어도 3, 적어도 4, 적어도 5, 적어도 6, 적어도 7, 적어도 8, 적어도 9, 적어도 10, 적어도 11, 적어도 12, 적어도 13, 적어도 14, 적어도 15, 또는 그 이상의 메틸화 민감성 제한 부위를 포함한다.
이전 단락에서 구체적으로 언급된 다양한 구현예에서, 상응하는 올리고뉴클레오티드 프라이머 쌍은 표 5에 열거된 올리고뉴클레오티드 프라이머 쌍이다. 본원 및 이전 단락에서 구체적으로 언급된 바와 같은 다양한 구현예에서, 상응하는 올리고뉴클레오티드 프라이머 쌍의 정방향 프라이머는 표 5에 열거된 정방향 프라이머와 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 99%, 또는 적어도 99.5% 동일하다.
이전 단락에서 구체적으로 언급된 다양한 구현예에서, 상응하는 올리고뉴클레오티드 프라이머 쌍의 역방향 프라이머는 표 5에 나열된 역방향 프라이머와 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 99%, 또는 적어도 99.5% 동일하다.
이전 단락에서 구체적으로 언급된 다양한 구현예에서, DNA는 인간 대상체의 조직(예컨대, 결장직장 조직, 예컨대, 폴립, 선종), 혈액, 혈장, 소변, 타액, 및 대변으로 이루어진 군에서 선택되는 구성원으로부터 단리된다.
이전 단락에서 구체적으로 언급된 다양한 구현예에서, DNA는 인간 대상의 무세포 DNA이다.
이전 단락에서 구체적으로 언급된 다양한 구현예에서, 상기 방법은 적어도 0.67의 대장암을 검출하기 위한 민감도를 제공한다. 이 단락 및 이전 단락에서 구체적으로 언급된 다양한 구현예에서, 상기 방법은 적어도 0.78의 대장암을 검출하기 위한 민감도를 제공한다.
이전 단락에서 구체적으로 언급된 다양한 구현예에서, 상기 상기 방법은 적어도 0.48의 진행성 선종 및 대장암의 조합을 검출하기 위한 전체 민감도를 제공한다. 이 단락 및 이전 단락에서 구체적으로 언급된 다양한 구현예에서, 상기 방법은 적어도 0.53의 진행성 선종 및 대장암의 조합을 검출하기 위한 전체 민감도를 제공한다.
이전 단락에서 구체적으로 언급된 다양한 구현예에서, 상기 방법은 적어도 0.9의 특이도를 제공한다. 이 단락 및 이전 단락에서 구체적으로 언급된 다양한 구현예에서, 상기 방법은 적어도 0.93의 특이도를 제공한다.
이전 단락에서 구체적으로 언급된 다양한 구현예에서, DNA의 하나 이상의 영역은 표 2의 DMR 각각을 포함한다.
이전 단락에서 구체적으로 언급된 다양한 구현예에서, DNA의 하나 이상의 영역 각각은 표 2의 상응하는 DMR과 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 99%, 또는 적어도 99.5% 동일하거나 이를 포함한다.
이전 단락에서 구체적으로 언급된 다양한 구현예에서, DNA의 하나 이상의 영역은 표 3의 각각의 DMR을 포함한다.
이전 단락에서 구체적으로 언급된 다양한 구현예에서, DNA의 하나 이상의 영역 각각은 표 3의 상응하는 DMR과 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 99%, 또는 적어도 99.5% 동일하거나 이를 포함한다.
이전 단락에서 구체적으로 언급된 다양한 구현예에서, DNA의 하나 이상의 영역은 표 4의 DMR 각각을 포함한다.
이전 단락에서 구체적으로 언급된 다양한 구현예에서, DNA의 하나 이상의 영역 각각은 표 4의 상응하는 DMR과 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 99%, 또는 적어도 99.5% 동일하거나 이를 포함한다.
이전 단락에서 구체적으로 언급된 다양한 구현예에서, 방법은 시험관내 방법이다.
또 다른 양태에서, 본원은 (i) 대장암에 대한 스크리닝 또는 (ii) 진행성 선종에 대한 스크리닝, 또는 (iii) 대장암 또는 진행성 선종(또는 둘 모두)의 존재에 대한 스크리닝에 사용하기 위한 키트를 제공하며, 상기 키트는 다음을 포함한다: (a) 표 1의 하나 이상의 DMR의 적어도 일부를 증폭하도록 설계된 적어도 하나의 올리고뉴클레오티드 프라이머 쌍, 각 부분은 적어도 10, 적어도 15, 적어도 20, 적어도 24, 적어도 30, 적어도 40, 적어도 50, 적어도 100, 적어도 150, 적어도 200, 적어도 250, 적어도 300, 적어도 350, 적어도 400, 적어도 500, 적어도 1000개 또는 그 이상의 염기쌍 길이임; 및 (b) 적어도 하나의 메틸화 특이적 제한 효소 및/또는 중아황산염 시약.
이전 단락에서 구체적으로 언급된 다양한 구현예에서, 하나 이상의 DMR의 일부는 적어도 1, 적어도 2, 적어도 3, 적어도 4, 적어도 5, 적어도 6, 적어도 7, 적어도 8, 적어도 9, 적어도 10, 적어도 11, 적어도 12, 적어도 13, 적어도 14, 적어도 15, 또는 그 이상의 메틸화 민감성 제한 부위를 포함한다.
이전 단락에서 구체적으로 언급된 다양한 구현예에서, 올리고뉴클레오티드 프라이머 쌍은 표 2의 각 DMR의 증폭을 위한 올리고뉴클레오티드 프라이머 쌍을 포함한다.
이전 단락에서 구체적으로 언급된 다양한 구현예에서, 올리고뉴클레오티드 프라이머 쌍은 표 3의 각 DMR의 증폭을 위한 올리고뉴클레오티드 프라이머 쌍을 포함한다.
이전 단락에서 구체적으로 언급된 다양한 구현예에서, 올리고뉴클레오티드 프라이머 쌍은 표 4의 각 DMR의 증폭을 위한 올리고뉴클레오티드 프라이머 쌍을 포함한다.
이전 단락에서 구체적으로 언급된 다양한 구현예에서, 올리고뉴클레오티드 프라이머 쌍은 표 5의 적어도 하나의 올리고뉴클레오티드 프라이머 쌍을 포함한다.
이전 단락에서 구체적으로 언급된 다양한 구현예에서, 올리고뉴클레오티드 프라이머 쌍의 올리고뉴클레오티드 중 하나 이상은 표 5의 적어도 하나의 정방향 프라이머와 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 99%, 또는 적어도 99.5% 동일하거나 이를 포함한다.
이전 단락에서 구체적으로 언급된 다양한 구현예에서, 올리고뉴클레오티드 프라이머 쌍의 올리고뉴클레오티드 중 하나 이상은 표 5의 적어도 하나의 역방향 프라이머와 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 99%, 또는 적어도 99.5% 동일하거나 이를 포함한다.
이전 단락에서 구체적으로 언급된 다양한 구현예에서, 키트는 하나 이상의 메틸화 부위의 결정된 메틸화 상태(예컨대, 퍼센트 과메틸화, 과메틸화 비율)를 사용하여 다음 (i) 내지 (iv) 중 적어도 하나를 식별하는 것을 추가로 포함한다: (i) 인간 대상체에서 대장암의 존재; (ii) 인간 대상체에서 대장암에 대한 소인; (iii) 인간 대상체에서 대장암의 위험 증가, 및 (iv) 인간 대상체에서 대장암의 병기(stage).
이전 단락에서 구체적으로 언급된 다양한 구현예에서, 키트는 하나 이상의 메틸화 부위의 결정된 메틸화 상태(예컨대, 퍼센트 과메틸화, 과메틸화 비율)를 사용하여 다음 (i) 내지 (iv) 중 적어도 하나를 식별하는 것을 추가로 포함한다: (i) 인간 대상체에서 하나 이상의 진행성 선종의 존재; (ii) 인간 대상체의 진행성 선종에 대한 소인; (iii) 인간 대상체에서 진행성 선종의 위험 증가, 및 (iv) 인간 대상체에서 선종의 유형.
이전 단락에서 구체적으로 언급된 다양한 구현예에서, 키트는 하나 이상의 메틸화 부위의 결정된 메틸화 상태(예컨대, 퍼센트 과메틸화, 과메틸화 비율)를 사용하여 다음 (i) 내지 (iv) 중 적어도 하나를 식별하는 것을 추가로 포함한다: (i) 인간 대상체에서 대장암 또는 진행성 선종의 존재 또는 둘 모두의 존재; (ii) 인간 대상체에서 대장암 또는 진행성 선종 또는 둘 모두에 대한 소인; (iii) 인간 대상체에서 대장암 또는 진행성 선종 또는 둘 모두의 위험 증가, 및 (iv) 인간 대상체에서 대장암 또는 진행성 선종 또는 둘 모두의 병기.
이전 단락에서 구체적으로 언급된 다양한 구현예에서, 키트는 시험관내에서 사용된다.
또 다른 양태에서, 본원은 (i) 대장암에 대한 스크리닝 또는 (ii) 진행성 선종에 대한 스크리닝, 또는 (iii) 대장암 또는 진행성 선종(또는 둘 모두)의 존재에 대한 스크리닝을 위한 진단적 qPCR 반응을 제공하고, 진단적 qPCR 반응은 다음을 포함한다: (a) 인간 DNA; (b) 중합효소; 및 (c) 표 1의 하나 이상의 DMR의 적어도 일부를 증폭하도록 설계된 적어도 하나의 올리고뉴클레오티드 프라이머 쌍, 하나 이상의 DMR의 각 부분은 적어도 10, 적어도 15, 적어도 20, 적어도 24, 적어도 30, 적어도 40, 적어도 50, 적어도 100, 150, 200, 250, 300, 350, 400, 500, 1000 또는 그 이상의 염기쌍 길이를 가지고, 여기서 인간 DNA는 중아황산염 처리된 인간 DNA 또는 메틸화 특이적 제한 효소에 의해 분해된 인간 DNA이다.
이전 단락에서 구체적으로 언급된 다양한 구현예에서, 하나 이상의 DMR의 일부는 적어도 1, 적어도 2, 적어도 3, 적어도 4, 적어도 5, 적어도 6, 적어도 7, 적어도 8, 적어도 9, 적어도 10, 적어도 11, 적어도 12, 적어도 13, 적어도 14, 적어도 15, 또는 그 이상의 메틸화 민감성 제한 부위를 포함한다.
이전 단락에서 구체적으로 언급된 다양한 구현예에서, 올리고뉴클레오티드 프라이머 쌍은 표 2의 각 DMR의 증폭을 위한 올리고뉴클레오티드 프라이머 쌍을 포함한다.
이전 단락에서 구체적으로 언급된 다양한 구현예에서, 올리고뉴클레오티드 프라이머 쌍은 표 3의 각 DMR의 증폭을 위한 올리고뉴클레오티드 프라이머 쌍을 포함한다.
이전 단락에서 구체적으로 언급된 다양한 구현예에서, 올리고뉴클레오티드 프라이머 쌍은 표 4의 각 DMR의 증폭을 위한 올리고뉴클레오티드 프라이머 쌍을 포함한다.
이전 단락에서 구체적으로 언급된 다양한 구현예에서, 올리고뉴클레오티드 프라이머 쌍은 표 5의 적어도 하나의 올리고뉴클레오티드 프라이머 쌍을 포함한다.
이전 단락에서 구체적으로 언급된 다양한 구현예에서, 올리고뉴클레오티드 프라이머 쌍의 올리고뉴클레오티드 중 하나 이상은 표 5의 적어도 하나의 정방향 프라이머와 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 99%, 또는 적어도 99.5% 동일하거나 이를 포함한다.
이전 단락에서 구체적으로 언급된 다양한 구현예에서, 올리고뉴클레오티드 프라이머 쌍의 올리고뉴클레오티드 중 하나 이상은 표 5의 적어도 하나의 역방향 프라이머와 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 99%, 또는 적어도 99.5% 동일하거나 이를 포함한다.
이전 단락에서 구체적으로 언급된 다양한 구현예에서, 반응은 하나 이상의 메틸화 부위의 결정된 메틸화 상태(예컨대, 퍼센트 과메틸화, 과메틸화 비율)를 사용하여 다음 (i) 내지 (iv) 중 적어도 하나를 확인하는 것을 추가로 포함한다: (i) 인간 대상체에서 대장암의 존재; (ii) 인간 대상체에서 대장암에 대한 소인; (iii) 인간 대상체에서 대장암의 위험 증가, 및 (iv) 인간 대상체에서 대장암의 병기(stage).
이전 단락에서 구체적으로 언급된 다양한 구현예에서, 반응은 하나 이상의 메틸화 부위의 결정된 메틸화 상태(예컨대, 퍼센트 과메틸화, 과메틸화 비율)를 사용하여 다음 (i) 내지 (iv) 중 적어도 하나를 확인하는 것을 추가로 포함한다: (i) 인간 대상체에서 하나 이상의 진행성 선종의 존재; (ii) 인간 대상체의 진행성 선종에 대한 소인; (iii) 인간 대상체에서 진행성 선종의 위험 증가, 및 (iv) 인간 대상체에서 선종의 유형.
이전 단락에서 구체적으로 언급된 다양한 구현예에서, 반응은 하나 이상의 메틸화 부위의 결정된 메틸화 상태(예컨대, 퍼센트 과메틸화, 과메틸화 비율)를 사용하여 다음 (i) 내지 (iv) 중 적어도 하나를 확인하는 것을 추가로 포함한다: (i) 인간 대상체에서 대장암 또는 진행성 선종의 존재 또는 둘 모두의 존재; (ii) 인간 대상체에서 대장암 또는 진행성 선종 또는 둘 모두에 대한 소인; (iii) 인간 대상체에서 대장암 또는 진행성 선종 또는 둘 모두의 위험 증가, 및 (iv) 인간 대상체에서 대장암 또는 진행성 선종 또는 둘 모두의 병기.
이전 단락에서 구체적으로 언급된 다양한 구현예에서, 반응은 시험관내에서 수행된다.
또 다른 양태에서, 본원은 (i) 대장암에 대한 스크리닝 또는 (ii) 진행성 선종에 대한 스크리닝, 또는 (iii) 대장암 또는 진행성 선종(또는 둘 모두)의 존재에 대한 스크리닝 방법을 제공하며, 상기 방법은 다음을 포함한다: 하나 이상의 차등적 메틸화 영역(DMR)의 메틸화 상태를 결정하는 단계로, 각각의 상기 하나 이상의 DMR은 PAX7, NTNG1, SYT6, LINC01248, KCNK3, GALNT14, CHST10, THSD7B, UNC80, EPHA6, MED12L, ADGRL3, RNF150, SPOCK3, GPM6A, HELT, GFPT2, HSPA1L, HSPA1A, NKAIN2, TMEM178B, DPP6, MICU3, ALKAL1, LOC401463, BHLHE22, RIMS2, LOC105375690, SLC25A32, DMRT1, CDKN2A, CDKN2B-AS1, PAX5, C1QL3, MYO3A, LOC101929073, GAD2, MYO3A, FOXI2, LOC105369438, AMOTL1, LOC101928847, NCAM1, DSCAML1, PTPRO, RERG, DPY19L2, CUX2, PCDH9, MIR4500HG, SLITRK5, SLC8A3, LOC646548, GATM, PIF1, RASGRF1, VAC14, VAT1L, JPH3, SLFN13, ZACN, SRP68, GALR2, ADCYAP1, CDH2, DOK6, ZNF461, ZNF829, ZNF568, ZNF540, ZNF571-AS1, CIC, ZNF582-AS1, ZNF582, ZNF471, ZNF264, ZNF671, ZNF551, ZNF776, NKX2-2, ADAMTS1, TIAM1, 및 OLIG1로 이루어진 군에서 선택되는 하나 이상의 유전자를 포함하거나 이와 중첩되는, 단계; 상기 하나 이상의 DMR 각각의 결정된 메틸화 상태를 입력으로 사용하여 분류 모델을 적용하는 단계; 및 모델로부터 인간 대상체의 대장암의 예측된 상태 또는 진행성 선종의 예측된 상태 또는 대장암 또는 진행성 선종의 예측된 상태를 출력하는 단계(예컨대, 후자는 대장암 및 진행성 선종 중 하나 또는 둘 모두를 갖는 상태를 의미함).
이전 단락에서 구체적으로 언급된 다양한 구현예에서, 상기 방법은 유전자 GAD2, MYO3A 및 ALKAL1 각각을 적어도 포함하거나 이와 중첩되는 하나 이상의 DMR의 메틸화 상태를 결정하는 것을 포함한다.
이전 단락에서 구체적으로 언급된 다양한 구현예에서, 상기 유전자 GAD2, MYO3A, ALKAL1, RASGRF1, MICU3, RASGRF1, FOXI2, C1QL3, CDKN2A, 및CDKN2B-AS1 각각을 적어도 포함하거나 이와 중첩되는 하나 이상의 DMR의 메틸화 상태를 결정하는 것을 포함한다.
이전 단락에서 구체적으로 언급된 다양한 구현예에서, 방법은 유전자 GAD2, MYO3A, ALKAL1, RASGRF1, MICU3, RASGRF1, FOXI2, C1QL3, CDKN2A, CDKN2B-AS1, SYT6, SLFN13, GPM6A, THSD7B, ZBF582-AS1, ZNF582, GATM, ZNF540, ZNF571-AS1, OLIG1, EPHA6, DPY19L2, SLC8A3, LOC646548, LOC101929073, UNC80, DPP6, ZNF568, JPH3, ZNF461, NTNG1, ADGRL3, ADAMST1, CDH2, LINC01248, PTPRO, RERG, SLC8A3, LOC646548, PAX5, GFPT2 각각을 적어도 포함하거나 이와 중첩되는 하나 이상의 DMR의 메틸화 상태를 결정하는 것을 포함한다.
이전 단락에서 구체적으로 언급된 다양한 구현예, 분류 모델은 서포트 벡터 머신(support-vector machine, SVM) 알고리즘 기반 분류 모델이다.
이전 단락에서 구체적으로 언급된 다양한 구현예에서, 방법은 시험관내 방법이다.
또 다른 양태에서, 본원은 (i) 대장암에 대한 스크리닝 또는 (ii) 진행성 선종에 대한 스크리닝, 또는 (iii) 대장암 또는 진행성 선종(또는 둘 모두)의 존재에 대한 스크리닝 방법을 제공하며, 상기 방법은 다음을 포함한다: 상기 하나 이상의 차등적 메틸화 영역(DMR) 메틸화 상태를 결정하는 단계로서, 상기 하나 이상의 DMR 각각은 SEQ ID NO. 190, SEQ ID NO. 191, SEQ ID NO. 192, SEQ ID NO. 193, SEQ ID NO. 194, SEQ ID NO. 195, SEQ ID NO. 196, SEQ ID NO. 197, SEQ ID NO. 198, SEQ ID NO. 199, SEQ ID NO. 200, SEQ ID NO. 201, SEQ ID NO. 202, SEQ ID NO. 203, SEQ ID NO. 204, SEQ ID NO. 205, SEQ ID NO. 206, SEQ ID NO. 207, SEQ ID NO. 208, SEQ ID NO. 209, SEQ ID NO. 210, SEQ ID NO. 211, SEQ ID NO. 212, SEQ ID NO. 213, SEQ ID NO. 214, SEQ ID NO. 215, SEQ ID NO. 216, SEQ ID NO. 217, SEQ ID NO. 218, SEQ ID NO. 219, SEQ ID NO. 220, SEQ ID NO. 221, SEQ ID NO. 222, SEQ ID NO. 223, SEQ ID NO. 224, SEQ ID NO. 225, SEQ ID NO. 226, SEQ ID NO. 227, SEQ ID NO. 228, 및 SEQ ID NO. 229 로 이루어진 군에서 선택되는 적어도 하나의 서열과 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 99% 서열 동일성을 갖거나 이를 포함하는, 단계; 상기 하나 이상의 DMR 각각의 결정된 메틸화 상태를 입력으로 사용하여 분류 모델을 적용하는 단계; 및 모델로부터 인간 대상체의 (i) 대장암의 예측된 상태 또는 (ii) 진행성 선종의 예측된 상태 또는 (iii) 대장암 또는 진행성 선종의 예측된 상태를 출력하는 단계(예컨대, 후자는 대장암 및 진행성 선종 중 하나 또는 둘 모두를 갖는 상태를 의미함).
이전 단락에서 구체적으로 언급된 다양한 구현예에서, 방법은 3개 이상의 차등적 메틸화 영역(DMR)의 메틸화 상태를 결정하는 단계를 포함한다.
이전 단락에서 구체적으로 언급된 다양한 구현예에서, 방법은 10개 이상의 차등적 메틸화 영역(DMR)의 메틸화 상태를 결정하는 단계를 포함한다.
이전 단락에서 구체적으로 언급된 다양한 구현예에서, 방법은 40개의 차등적 메틸화 영역(DMR)의 메틸화 상태를 결정하는 단계를 포함한다.
이전 단락에서 구체적으로 언급된 다양한 실시예에서, 분류 모델은 서포트 벡터 머신(support-vector machine, SVM) 알고리즘 기반 분류 모델이다.
이전 단락에서 구체적으로 언급된 다양한 구현예에서, 방법은 시험관내 방법이다.
또 다른 양태에서, 본원은 (i) 대장암에 대한 스크리닝 또는 (ii) 진행성 선종에 대한 스크리닝, 또는 (iii) 대장암 또는 진행성 선종(또는 둘 모두)의 존재에 대한 스크리닝 방법을 제공하며, 상기 방법은 다음을 포함한다: 표 1 또는 표 7에 열거된 인간 대상체의 DNA의 차등적 메틸화 영역(DMR) 내에서 발견되는 적어도 하나의 메틸화 부위의 메틸화 상태를 결정하는 단계; 컴퓨팅 장치의 프로세서에 의해, 적어도 하나의 메틸화 부위의 메틸화 상태에 기초하여 인간 대상체의 DNA의 차등적 메틸화 영역(DMR)의 메틸화 상태를 결정하는 단계; 및 프로세서에 의해, 분류 모델을 사용하여 인간 대상체의 (i) 대장암의 예측된 상태, (ii) 진행성 선종의 예측된 상태, 또는 (iii) 대장암 또는 진행성 선종의 예측된 상태를 출력하는 단계(예컨대, 후자는 대장암 및 진행성 선종 중 하나 또는 둘 모두를 갖는 상태를 의미함).
이전 단락에서 구체적으로 언급된 다양한 구현예에서, 상기 방법은 표 1 또는 표 7에 열거된 하나 이상의 DMR 각각에 대해 DMR 내에서 발견되는 적어도 3개의 메틸화 부위의 메틸화 상태를 결정하는 단계를 포함한다.
이전 단락에서 구체적으로 언급된 다양한 구현예에서, 상기 방법은 표 1 또는 표 7에 열거된 하나 이상의 DMR 각각에 대해 DMR 내에서 발견되는 적어도 4개의 메틸화 부위의 메틸화 상태를 결정하는 단계를 포함한다.
이전 단락에서 구체적으로 언급된 다양한 구현예에서, 상기 방법은 표 1 또는 표 7에 열거된 하나 이상의 DMR 각각에 대해 DMR 내에서 발견되는 적어도 5개의 메틸화 부위의 메틸화 상태를 결정하는 단계를 포함한다.
이전 단락에서 구체적으로 언급된 다양한 구현예에서, 상기 방법은 표 1 또는 표 7에 열거된 3개 이상의 DMR 각각에 대해 DMR 내에서 발견되는 적어도 하나의 메틸화 부위의 메틸화 상태를 결정하는 단계를 포함한다.
이전 단락에서 구체적으로 언급된 다양한 구현예에서, 상기 방법은 표 1 또는 표 7에 열거된 3개 이상의 DMR 각각에 대해 DMR 내에서 발견되는 적어도 3개의 메틸화 부위의 메틸화 상태를 결정하는 단계를 포함한다.
이전 단락에서 구체적으로 언급된 다양한 구현예에서, 상기 방법은 표 1 또는 표 7에 열거된 3개 이상의 DMR 각각에 대해 DMR 내에서 발견되는 적어도 4개의 메틸화 부위의 메틸화 상태를 결정하는 단계를 포함한다.
이전 단락에서 구체적으로 언급된 다양한 구현예에서, 상기 방법은 표 1 또는 표 7에 열거된 3개 이상의 DMR 각각에 대해 DMR 내에서 발견되는 적어도 5개의 메틸화 부위의 메틸화 상태를 결정하는 단계를 포함한다.
이전 단락에서 구체적으로 언급된 다양한 구현예에서, 상기 방법은 표 1 또는 표 7에 열거된 10개 이상의 DMR 각각에 대해 DMR 내에서 발견되는 적어도 하나의 메틸화 부위의 메틸화 상태를 결정하는 단계를 포함한다.
이전 단락에서 구체적으로 언급된 다양한 구현예에서, 상기 방법은 표 1 또는 표 7에 열거된 10개 이상의 DMR 각각에 대해 DMR 내에서 발견되는 적어도 3개의 메틸화 부위의 메틸화 상태를 결정하는 단계를 포함한다.
이전 단락에서 구체적으로 언급된 다양한 구현예에서, 상기 방법은 표 1 또는 표 7에 열거된 10개 이상의 DMR 각각에 대해 DMR 내에서 발견되는 적어도 4개의 메틸화 부위의 메틸화 상태를 결정하는 단계를 포함한다.
이전 단락에서 구체적으로 언급된 다양한 구현예에서, 상기 방법은 표 1 또는 표 7에 열거된 10개 이상의 DMR 각각에 대해 DMR 내에서 발견되는 적어도 5개의 메틸화 부위의 메틸화 상태를 결정하는 단계를 포함한다.
이전 단락에서 구체적으로 언급된 다양한 구현예에서, 상기 방법은 표 1에 열거된 35개 이상의 DMR 각각에 대해 DMR 내에서 발견되는 적어도 하나의 메틸화 부위의 메틸화 상태를 결정하는 단계를 포함한다.
이전 단락에서 구체적으로 언급된 다양한 구현예에서, 상기 방법은 표 1에 열거된 35개 이상의 DMR 각각에 대해 DMR 내에서 발견되는 적어도 3개의 메틸화 부위의 메틸화 상태를 결정하는 단계를 포함한다.
이전 단락에서 구체적으로 언급된 다양한 구현예에서, 상기 방법은 표 1에 열거된 35개 이상의 DMR 각각에 대해 DMR 내에서 발견되는 적어도 4개의 메틸화 부위의 메틸화 상태를 결정하는 단계를 포함한다.
이전 단락에서 구체적으로 언급된 다양한 구현예에서, 상기 방법은 표 1에 열거된 35개 이상의 DMR 각각에 대해 DMR 내에서 발견되는 적어도 5개의 메틸화 부위의 메틸화 상태를 결정하는 단계를 포함한다.
이전 단락에서 구체적으로 언급된 다양한 구현예에서, 상기 방법은 표 7에 열거된 40개 이상의 DMR 각각에 대해 DMR 내에서 발견되는 적어도 3개의 메틸화 부위의 메틸화 상태를 결정하는 단계를 포함한다.
이전 단락에서 구체적으로 언급된 다양한 구현예에서, 상기 방법은 표 7에 열거된 40개 이상의 DMR 각각에 대해 DMR 내에서 발견되는 적어도 4개의 메틸화 부위의 메틸화 상태를 결정하는 단계를 포함한다.
이전 단락에서 구체적으로 언급된 다양한 구현예에서, 상기 방법은 표 7에 열거된 40개 이상의 DMR 각각에 대해 DMR 내에서 발견되는 적어도 5개의 메틸화 부위의 메틸화 상태를 결정하는 단계를 포함한다.
이전 단락에서 구체적으로 언급된 다양한 구현예에서, DMR은 적어도 1, 적어도 2, 적어도 3, 적어도 4, 적어도 5, 적어도 6, 적어도 7, 적어도 8, 적어도 9, 적어도 10, 적어도 11, 적어도 12, 적어도 13, 적어도 14, 적어도 15, 또는 그 이상의 메틸화 민감성 제한 부위를 포함한다.
이전 단락에서 구체적으로 언급된 다양한 구현예에서, 상기 방법은 프로세서에 의해 기준(예컨대, 여기서 기준이 하나 이상의 진행성 선종 또는 대장암을 앓지 않는 것으로 확인된 인간 대상체 개체군으로부터의 DNA임)과 비교하여 적어도 하나의 메틸화 부위가 메틸화되었는지 여부를 결정하는 단계를 포함하고, 여기서 메틸화는 (i) 대장암, (ii) 진행성 선종, 또는 (iii) 대장암 또는 진행성 선종(또는 둘 모두)의 지표이다.
이전 단락에서 구체적으로 언급된 다양한 구현예에서, 상기 방법은 표 2에 열거된 바와 같은 각각의 DMR 내에서 발견되는 적어도 하나의 메틸화 부위의 메틸화 상태를 결정하는 단계를 포함한다.
이전 단락에서 구체적으로 언급된 다양한 구현예에서, 상기 방법은 표 3에 열거된 바와 같은 각각의 DMR 내에서 발견되는 적어도 하나의 메틸화 부위의 메틸화 상태를 결정하는 단계를 포함한다.
이전 단락에서 구체적으로 언급된 다양한 구현예에서, 상기 방법은 프로세서에 의해, 표 4에 열거된 바와 같은 DMR 각각 내에서 발견되는 적어도 하나의 메틸화 부위의 메틸화 상태를 결정하는 단계를 포함한다.
이전 단락에서 구체적으로 언급된 다양한 구현예에서, DMR은 표 5에 열거된 바와 같은 올리고뉴클레오티드 프라이머 쌍에 의해 증폭된다.
이전 단락에서 구체적으로 언급된 다양한 구현예에서, 인간 대상체의 DNA는 인간 대상체의 조직(예를 들어, 결장직장 조직, 예컨대, 폴립, 선종), 혈액, 혈장, 소변, 타액 및 대변으로 이루어진 군으로부터 선택된 구성원으로부터 단리된다.
이전 단락에서 구체적으로 언급된 다양한 구현예에서, DNA는 인간 대상체의 무세포 DNA이다.
이전 단락에서 구체적으로 언급된 다양한 구현예에서, 대상체는 스크리닝 시점에 대장암 또는 진행성 선종(또는 둘 모두)에 대해 무증상이었다.
이전 단락에서 구체적으로 언급된 다양한 구현예에서, 대상체는 이전에 대장암 또는 진행성 선종(또는 둘 모두)에 대해 스크리닝되었다. 현재 또는 이전 단락에서 구체적으로 언급된 다양한 구현예에서, 대상체는 최근 10년 이내, 최근 5년 이내, 최근 4년 이내, 최근 3년 이내, 최근 2년 이내 또는 최근 1년 이내에 대장암 또는 진행성 선종(또는 둘 모두)에 대하여 스크리닝 되었다.
이전 단락에서 구체적으로 언급된 다양한 구현예에서, 대상체에서 진행성 선종 또는 대장암(또는 둘 모두)에 대한 이전 스크리닝은 대상체가 (i) 대장암, (ii) 진행성 선종, 또는 (iii) 진행성 선종 또는 대장암(또는 둘 모두)을 가지지 않는 것으로 진단되었다. 현재 또는 이전 단락에서 구체적으로 언급된 다양한 구현예에서, 대상체가 (i) 대장암, (ii) 진행성 선종, 또는 (iii) 진행성 선종 또는 대장암(또는 둘 모두)을 가지지 않는 것으로 진단된 것이 1년 이내였다.
이전 단락에서 구체적으로 언급된 다양한 구현예에서, 진행성 선종 또는 대장암(또는 둘 모두)을 가지지 않는 것으로 대상체를 진단한 진행성 선종 또는 대장암(또는 둘 모두)에 대한 이전 스크리닝은 대장내시경 검사였다.
이전 단락에서 구체적으로 언급된 다양한 구현예에서, 상기 방법은 프로세서에 의해, 초기 대장암(예컨대, 상기 대장암은 병기 0, 병기 I, 병기 IIA, 병기 IIB, 또는 병기 IIC 대장암)의 존재를 식별하는 것을 포함한다.
이전 단락에서 구체적으로 언급된 다양한 구현예에서, 상기 방법은 프로세서에 의해, 암이 전이되지 않은 초기 대장암의 존재를 식별하는 것을 포함한다.
이전 단락에서 구체적으로 언급된 다양한 구현예에서, 메틸화 상태는 메틸화 민감성 제한 효소 정량적 중합효소 연쇄 반응(MSRE-qPCR), 메틸화-특이적 PCR, 메틸화-특이적 뉴클레아제-보조 마이너 대립유전자 농축 PCR, 하이브리드 캡처 표적 차세대 시퀀싱 및 앰플리콘 기반 표적 차세대 시퀀싱으로 이루어진 군으로부터 선택된 하나 이상의 구성원을 사용하여 결정된다.
이전 단락에서 구체적으로 언급된 다양한 구현예에서, 메틸화 상태는 전체 게놈 중아황산염 시퀀싱을 사용하여 결정된다.
이전 단락에서 구체적으로 언급된 다양한 실시예에서, 분류 모델은 서포트 벡터 머신(support-vector machine, SVM) 기반 분류 모델이다.
이전 단락에서 구체적으로 언급된 다양한 구현예에서, 방법은 시험관내 방법이다.
또 다른 양태에서, 본원은 (i) 대장암에 대한 스크리닝 또는 (ii) 진행성 선종에 대한 스크리닝, 또는 (iii) 대장암 또는 진행성 선종(또는 둘 모두)의 존재에 대한 스크리닝을 위한 메틸화 특이적 제한 효소 정량적 중합효소 연쇄 반응(MSRE-qPCR) 방법을 제공하며, 상기 방법은 다음을 포함한다: (a) 인간 대상체의 DNA를 하나 이상의 메틸화 특이적 제한 효소와 접촉시키는 단계; (b) DNA의 하나 이상의 영역의 메틸화 상태를 결정하기 위해, 효소-분해된 DNA 또는 이의 앰플리콘의 qPCR을 수행하는 단계로서, DNA의 하나 이상의 영역 각각은 표 1의 하나 이상의 DMR의 적어도 일 부분을 포함하고, 각 부분은 적어도 10, 적어도 15, 적어도 20, 적어도 24, 적어도 30, 적어도 40, 적어도 50, 적어도 100, 적어도 150, 적어도 200, 적어도 250, 적어도 300, 적어도 350, 적어도 400, 적어도 500, 적어도 1000개, 또는 그 이상의 염기쌍 길이이고; (c) 컴퓨팅 장치의 프로세서에 의해, DNA의 하나 이상의 영역의 결정된 메틸화 상태에 분류 모델을 적용하는 단계; 및 (d) 프로세서에 의해, 적용된 분류 모델에 기반하여 인간 대상체의 대장암의 예측된 상태, 진행성 선종의 예측된 상태, 또는 대장암 또는 진행성 선종의 예측된 상태(예컨대, 후자는 대장암 및 진행성 선종 중 하나 또는 둘 모두를 갖는 상태를 의미함)를 결정하는 단계.
이전 단락에서 구체적으로 언급된 다양한 구현예에서, 하나 이상의 DNA 영역 중 적어도 하나는 상응하는 올리고뉴클레오티드 프라이머 쌍(예컨대, 프라이머 쌍은 정방향 및 역방향 프라이머를 포함함)에 의해 증폭된다.
이전 단락에서 구체적으로 언급된 다양한 구현예에서, DNA의 하나 이상의 영역 각각은 적어도 1, 적어도 2, 적어도 3, 적어도 4, 적어도 5, 적어도 6, 적어도 7, 적어도 8, 적어도 9, 적어도 10, 적어도 11, 적어도 12, 적어도 13, 적어도 14, 적어도 15, 또는 그 이상의 메틸화 민감성 제한 부위를 포함한다.
이전 단락에서 구체적으로 언급된 다양한 구현예에서, 상응하는 올리고뉴클레오티드 프라이머 쌍은 표 5에 열거된 올리고뉴클레오티드 프라이머 쌍이다.
이전 단락에서 구체적으로 언급된 다양한 구현예에서, 상응하는 올리고뉴클레오티드 프라이머 쌍의 정방향 프라이머는 표 5에 나열된 정방향 프라이머와 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 99%, 또는 적어도 99.5% 동일하다.
이전 단락에서 구체적으로 언급된 다양한 구현예에서, 상응하는 올리고뉴클레오티드 프라이머 쌍의 역방향 프라이머는 표 5에 나열된 역방향 프라이머와 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 99%, 또는 적어도 99.5% 동일하다.
이전 단락에서 구체적으로 언급된 다양한 구현예에서, DNA는 인간 대상체의 조직(예컨대, 결장직장 조직, 예컨대, 폴립, 선종), 혈액, 혈장, 소변, 타액, 및 대변으로 이루어진 군에서 선택되는 구성원으로부터 단리된다.
이전 단락에서 구체적으로 언급된 다양한 구현예에서, DNA는 인간 대상의 무세포 DNA이다.
이전 단락에서 구체적으로 언급된 다양한 구현예에서, 상기 방법은 적어도 0.67의 대장암을 검출하기 위한 민감도를 제공한다. 이 단락 또는 이전 단락에서 구체적으로 언급된 다양한 구현예에서, 상기 방법은 적어도 0.78의 대장암을 검출하기 위한 민감도를 제공한다.
이전 단락에서 구체적으로 언급된 다양한 구현예에서, 상기 상기 방법은 적어도 0.48의 진행성 선종 및 대장암의 조합을 검출하기 위한 전체 민감도를 제공한다. 이 단락 또는 이전 단락에서 구체적으로 언급된 다양한 구현예에서, 상기 방법은 적어도 0.53의 진행성 선종 및 대장암의 조합을 검출하기 위한 전체 민감도를 제공한다.
이전 단락에서 구체적으로 언급된 다양한 구현예에서, 상기 방법은 적어도 0.9의 특이도를 제공한다. 이 단락 또는 이전 단락에서 구체적으로 언급된 다양한 구현예에서, 상기 방법은 적어도 0.93의 특이도를 제공한다.
이전 단락에서 구체적으로 언급된 다양한 구현예에서, DNA의 하나 이상의 영역은 표 2의 DMR 각각을 포함한다.
이전 단락에서 구체적으로 언급된 다양한 구현예에서, DNA의 하나 이상의 영역 각각은 표 2의 상응하는 DMR과 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 99%, 또는 적어도 99.5% 동일하거나 이를 포함한다.
이전 단락에서 구체적으로 언급된 다양한 구현예에서, DNA의 하나 이상의 영역은 표 3의 각각의 DMR을 포함한다.
이전 단락에서 구체적으로 언급된 다양한 구현예에서, DNA의 하나 이상의 영역 각각은 표 3의 상응하는 DMR과 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 99%, 또는 적어도 99.5% 동일하거나 이를 포함한다.
이전 단락에서 구체적으로 언급된 다양한 구현예에서, DNA의 하나 이상의 영역은 표 4의 DMR 각각을 포함한다.
이전 단락에서 구체적으로 언급된 다양한 구현예에서, DNA의 하나 이상의 영역 각각은 표 4의 상응하는 DMR과 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 99%, 또는 적어도 99.5% 동일하거나 이를 포함한다.
이전 단락에서 구체적으로 언급된 다양한 실시예에서, 분류 모델은 서포트 벡터 머신(support-vector machine, SVM) 알고리즘 기반 분류 모델이다.
이전 단락에서 구체적으로 언급된 다양한 구현예에서, 방법은 시험관내 방법이다.
또 다른 양태에서, 본원은 (i) 대장암에 대한 스크리닝 또는 (ii) 진행성 선종에 대한 스크리닝, 또는 (iii) 대장암 또는 진행성 선종(또는 둘 모두)의 존재에 대한 스크리닝 방법을 제공하며, 상기 방법은 다음을 포함한다: 하나 이상의 차등적 메틸화 영역(DMR)의 메틸화 상태를 결정하는 단계로, 각각의 상기 하나 이상의 DMR은 PAX7, NTNG1, SYT6, LINC01248, KCNK3, GALNT14, CHST10, THSD7B, UNC80, EPHA6, MED12L, ADGRL3, RNF150, SPOCK3, GPM6A, HELT, GFPT2, HSPA1L, HSPA1A, NKAIN2, TMEM178B, DPP6, MICU3, ALKAL1, LOC401463, BHLHE22, RIMS2, LOC105375690, SLC25A32, DMRT1, CDKN2A, CDKN2B-AS1, PAX5, C1QL3, MYO3A, LOC101929073, GAD2, MYO3A, FOXI2, LOC105369438, AMOTL1, LOC101928847, NCAM1, DSCAML1, PTPRO, RERG, DPY19L2, CUX2, PCDH9, MIR4500HG, SLITRK5, SLC8A3, LOC646548, GATM, PIF1, RASGRF1, VAC14, VAT1L, JPH3, SLFN13, ZACN, SRP68, GALR2, ADCYAP1, CDH2, DOK6, ZNF461, ZNF829, ZNF568, ZNF540, ZNF571-AS1, CIC, ZNF582-AS1, ZNF582, ZNF471, ZNF264, ZNF671, ZNF551, ZNF776, NKX2-2, ADAMTS1, TIAM1, 및 OLIG1로 이루어진 군에서 선택되는 하나 이상의 유전자를 포함하거나 이와 중첩되는, 단계; 프로세서에 의하여, 상기 하나 이상의 DMR 각각의 결정된 메틸화 상태를 입력으로 사용하여 분류 모델을 적용하는 단계; 및 프로세서에 의하여, 모델로부터 인간 대상체의 (i) 대장암의 예측된 상태, (ii) 진행성 선종의 예측된 상태, 또는 (ii) 대장암 또는 진행성 선종의 예측된 상태(예컨대, 후자는 대장암 및 진행성 선종 중 하나 또는 둘 모두를 갖는 상태를 의미함)를 출력하는 단계.
이전 단락에서 구체적으로 언급된 다양한 구현예에서, 상기 방법은 유전자 GAD2, MYO3A 및 ALKAL1 각각을 적어도 포함하거나 이와 중첩되는 하나 이상의 DMR의 메틸화 상태를 결정하는 것을 포함한다.
이전 단락에서 구체적으로 언급된 다양한 구현예에서, 상기 유전자 GAD2, MYO3A, ALKAL1, RASGRF1, MICU3, RASGRF1, FOXI2, C1QL3, CDKN2A, 및 CDKN2B-AS1 각각을 적어도 포함하거나 이와 중첩되는 하나 이상의 DMR의 메틸화 상태를 결정하는 것을 포함한다.
이전 단락에서 구체적으로 언급된 다양한 구현예에서, 방법은 유전자 GAD2, MYO3A, ALKAL1, RASGRF1, MICU3, RASGRF1, FOXI2, C1QL3, CDKN2A, CDKN2B-AS1, SYT6, SLFN13, GPM6A, THSD7B, ZBF582-AS1, ZNF582, GATM, ZNF540, ZNF571-AS1, OLIG1, EPHA6, DPY19L2, SLC8A3, LOC646548, LOC101929073, UNC80, DPP6, ZNF568, JPH3, ZNF461, NTNG1, ADGRL3, ADAMST1, CDH2, LINC01248, PTPRO, RERG, SLC8A3, LOC646548, PAX5, GFPT2 각각을 적어도 포함하거나 이와 중첩되는 하나 이상의 DMR의 메틸화 상태를 결정하는 것을 포함한다.
이전 단락에서 구체적으로 언급된 다양한 실시예에서, 분류 모델은 서포트 벡터 머신(support-vector machine, SVM) 알고리즘 기반 분류 모델이다.
이전 단락에서 구체적으로 언급된 다양한 구현예에서, 방법은 시험관내 방법이다.
또 다른 양태에서, 본원은 (i) 대장암에 대한 스크리닝 또는 (ii) 진행성 선종에 대한 스크리닝, 또는 (iii) 대장암 또는 진행성 선종(또는 둘 모두)의 존재에 대한 스크리닝 방법을 제공하며, 상기 방법은 다음을 포함한다: 상기 하나 이상의 차등적 메틸화 영역(DMR) 메틸화 상태를 결정(예컨대, 컴퓨팅 장치의 프로세서에 의하여)하는 단계로서, 상기 하나 이상의 DMR 각각은 SEQ ID NO. 190, SEQ ID NO. 191, SEQ ID NO. 192, SEQ ID NO. 193, SEQ ID NO. 194, SEQ ID NO. 195, SEQ ID NO. 196, SEQ ID NO. 197, SEQ ID NO. 198, SEQ ID NO. 199, SEQ ID NO. 200, SEQ ID NO. 201, SEQ ID NO. 202, SEQ ID NO. 203, SEQ ID NO. 204, SEQ ID NO. 205, SEQ ID NO. 206, SEQ ID NO. 207, SEQ ID NO. 208, SEQ ID NO. 209, SEQ ID NO. 210, SEQ ID NO. 211, SEQ ID NO. 212, SEQ ID NO. 213, SEQ ID NO. 214, SEQ ID NO. 215, SEQ ID NO. 216, SEQ ID NO. 217, SEQ ID NO. 218, SEQ ID NO. 219, SEQ ID NO. 220, SEQ ID NO. 221, SEQ ID NO. 222, SEQ ID NO. 223, SEQ ID NO. 224, SEQ ID NO. 225, SEQ ID NO. 226, SEQ ID NO. 227, SEQ ID NO. 228, 및 SEQ ID NO. 229 로 이루어진 군에서 선택되는 적어도 하나의 서열과 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 99% 서열 동일성을 갖거나 이를 포함하는, 단계; 프로세서에 의하여, 상기 하나 이상의 DMR 각각의 결정된 메틸화 상태를 입력으로 사용하여 분류 모델을 적용하는 단계; 및 프로세서에 의하여, 모델로부터 인간 대상체의 (i) 대장암의 예측된 상태, (ii) 진행성 선종의 예측된 상태 또는 (iii) 대장암 또는 진행성 선종의 예측된 상태를 출력하는 단계(예컨대, 후자는 대장암 및 진행성 선종 중 하나 또는 둘 모두를 갖는 상태를 의미함).
이전 단락에서 구체적으로 언급된 다양한 구현예에서, 방법은 3개 이상의 차등적 메틸화 영역(DMR)의 메틸화 상태를 결정하는 단계를 포함한다.
이전 단락에서 구체적으로 언급된 다양한 구현예에서, 방법은 10개 이상의 차등적 메틸화 영역(DMR)의 메틸화 상태를 결정하는 단계를 포함한다.
이전 단락에서 구체적으로 언급된 다양한 구현예에서, 방법은 40개의 차등적 메틸화 영역(DMR)의 메틸화 상태를 결정하는 단계를 포함한다.
이전 단락에서 구체적으로 언급된 다양한 실시예에서, 분류 모델은 서포트 벡터 머신(support-vector machine, SVM) 알고리즘 기반 분류 모델이다.
이전 단락에서 구체적으로 언급된 다양한 구현예에서, 방법은 시험관내 방법이다.
다양한 양태에서, 본 발명의 방법 및 조성물은, 예컨대 그 전체가 본원에 참고로 포함되는 미국 특허 제10,006,925호에 개시된 바와 같은, 당업계에 공지된 바이오마커와 조합하여 사용될 수 있다.
또 다른 양태에서, 본 발명은 (i) 대장암에 대한 스크리닝 또는 (ii) 진행성 선종에 대한 스크리닝, 또는 (iii) 대장암 또는 진행성 선종(또는 둘 모두)의 존재에 대한 스크리닝을 위한 하나 이상의 차등적 메틸화 영역을 식별하는 방법에 관하며, 여기서 상기 방법은 다음을 포함한다: 전체 게놈 중아황산염 시퀀싱을 사용하여 (i) 대장암, (ii) 진행성 선종, 또는 (iii) 대장암 또는 진행성 선종(또는 둘 모두)를 가진 것으로 진단된 대상체(예컨대 적어도 10, 적어도 20, 적어도 50, 적어도 100, 또는 그 이상)의 제1 개체군의 게놈의 DNA를 시퀀싱하는 단계; 제1 개체군의 게놈 각각을 기준(reference) 게놈과 정렬하는 단계(예컨대, 기준 게놈은 GRCh38임); (예컨대, 생물정보학 도구, 예컨대, MethylKit을 사용하여) 복수의 메틸화된 대장암 및/또는 진행성 선종 부위를 식별하는 단계로, 여기서 복수의 메틸화된 대장암 및/또는 진행성 선종 부위 각각은 기준 개체군(예컨대, 건강한 대상체를 포함하는 개체군)의 상응하는 부위에 대한 제1 개체군의 차등적 메틸화 부위이고(예컨대, 기준 개체군에 대한 제1 개체군의 DNA의 메틸화 백분율의 차이는 적어도 5%, 적어도 10%, 적어도 15% 또는 그 이상); 복수의 차등적 메틸화 영역(DMR)을 포함하는 목록을 생성하는 단계로, 복수의 차등적 메틸화 영역(DMR) 각각은 복수의 식별된 메틸화된 대장암 및/또는 진행성 선종 암 부위 중 하나 이상을 포함하고(예컨대, 여기서 메틸화된 대장암 및/또는 진행성 선종 암 부위는 메틸화된 CpG 영역이거나 이를 포함함)(예컨대, 여기서 DMR은 200개 염기쌍의 CpG 사이의 최대 거리를 갖는 적어도 3개의 메틸화된 CpG 영역을 포함함); 제1 개체군의 복수의 DMR 각각의 메틸화 상태(예컨대어, 메틸화 백분율, 메틸화된 부위의 수)를 결정하는 단계; 복수의 DMR 각각의 메틸화 상태에 적어도 부분적으로 기초하여 복수의 DMR을 순위화하는 단계; 및 대장암 및/또는 진행성 선종의 진단을 위한 복수의 DMR로부터 후보 DMR의 세트를 필터링하는 단계(예컨대, 적어도 5개의 CPG 영역을 포함하는 DMR에 대한 필터링)(예컨대, 제1 대상 그룹과 기준 모집단 사이의 최소 메틸화 백분율 차이는 적어도 5%, 적어도 6%, 적어도 7%, 적어도 8%, 적어도 9%, 적어도 10%, 적어도 15% 또는 그 이상임).
이전 단락에서 구체적으로 언급된 다양한 구현예에서, 방법은 복수의 DMR 각각 내에서 하나 이상의 CpG 영역을 식별하는 단계; 제1 집단에 대한 복수의 DMR 각각 내에서 식별된 CpG 영역 각각의 메틸화 상태(예를 들어, 메틸화 백분율, 메틸화 부위의 수)를 결정하는 단계; 및 DMR의 하나 이상의 CpG 영역 각각의 결정된 메틸화 상태에 적어도 부분적으로 기초하여 복수의 DMR을 순위화하는 단계를 포함한다.
이전 단락에서 구체적으로 언급된 특정 구현예에서, 방법은 다음을 추가로 포함한다: 기준 개체군에 대한 복수의 DMR 각각의 메틸화 상태를 결정하는 단계; 기준 개체군의 복수의 DMR 각각의 결정된 메틸화 상태를 제1 개체군의 상응하는 DMR의 메틸화 상태와 비교(예컨대, 메틸화 백분율을 비교)하는 단계; 및 비교에 적어도 부분적으로 기초하여 복수의 DMR을 순위화하는 단계를 포함한다.
이전 단락에서 구체적으로 언급된 특정 구현예에서, 제1 개체군의 DNA는 제1 개체군의 각 인간 대상체의 조직(예컨대, 결장직장 조직, 예를 들어, 폴립, 선종)으로부터 단리된다.
이전 단락에서 구체적으로 언급된 특정 구현예에서, 제1 개체군의 DNA는 제1 개체군의 각 인간 대상체의 혈액, 혈장, 소변, 타액 또는 대변으로부터 단리된다.
다른 양태에서, 본 발명은 이전 단락에서 언급된 임의의 방법을 수행하기 위한 시스템에 관한 것으로, 시스템은 프로세서; 및 프로세서에 의해 실행될 때, 프로세서로 하여금 상기 방법의 하나 이상 (최대 모든) 단계를 수행하게 하는 명령을 갖는 메모리를 포함한다.
정의
A 또는 An: 관사 "a" 및 "an"은 본 명세서에서 관사의 문법적 대상 중 하나 또는 둘 이상(즉, 적어도 하나)을 지칭하는 데 사용된다. 예로서, "an element"는 하나의 요소 또는 하나 이상의 요소를 지칭한다.
약: 용어 "약"은 값과 관련하여 본 명세서에서 사용될 때, 문맥상 참조된 값과 유사한 값을 지칭한다. 일반적으로, 문맥에 친숙한 당업자는 그 문맥에서 "약"에 의해 포함되는 적절한 정도의 변동을 이해할 것이다. 예를 들어, 일부 구현예에서, 예컨대 본원에 개시된, 용어 "약"은 25%, 20%, 19%, 18%, 17%, 16%, 15%, 14%, 13%, 12%, 참조 값의 11%, 10%, 9%, 8%, 7%, 6%, 5%, 4%, 3%, 2%, 1% 또는 지칭된 값의 백분율의 일부이다.
진행성 선종: 본 명세서에 사용된 용어 "진행성 선종"은 양성(비암성) 세포성 성장인 결장 및 직장의 선종성 용종(선종)을 지칭하기 위해 사용된다. 진행성 선종은 다음 특징 중 하나 이상을 갖는 결장 선종성 선종이다: ≥1 cm 크기; 관상융모상(tubulovillous) 또는 융모상(villous) 선종; 고도 이형성증; 및 이형성증이 있는 거치상(serrated) 선종. 특정 예에서, 예컨대어, 본원에 기재된 바와 같이, 진행성 선종은 또한 "고위험성" 선종으로 분류될 수 있다.
투여: 본 명세서에 사용된 용어 "투여"는 일반적으로 예를 들어 조성물에 포함되거나 조성물에 의해 전달되는 제제의 전달을 달성하기 위해 대상체 또는 시스템에 조성물을 투여하는 것을 지칭한다.
제제: 본 명세서에 사용된 용어 "제제(agent)"는 개체(예컨대, 소분자, 펩티드, 폴리펩티드, 핵산, 지질, 다당류, 복합체, 조합물, 혼합물, 시스템, 또는 열, 전류, 전기장, 자력, 자기장 등과 같은 현상)를 지칭한다.
개선: 본 명세서에 사용된 용어 "개선(amelioration)"은 대상체 상태의 예방, 감소, 완화 또는 향상을 지칭한다. 개선에는 질환(disease), 장애(disorder) 또는 병태(condition)의 완전한 회복 또는 완전한 예방이 포함되지만 필수는 아니다.
앰플리콘 또는 앰플리콘 분자: 본원에서 사용되는 용어 "앰플리콘" 또는 "앰플리콘 분자"는 주형 핵산 분자, 또는 이에 상보적인 서열을 갖는 핵산 분자, 또는 임의의 이러한 핵산 분자를 포함하는 이중-가닥 핵산으로부터의 전사에 의해 생성된 핵산 분자를 지칭한다. 전사는 프라이머에서 시작할 수 있다.
증폭: 본 명세서에 사용된 용어 "증폭"은 주형 핵산 분자로부터 추가 핵산 분자를 생성하기 위해 다양한 시약과 함께 주형 핵산 분자를 사용하는 것을 의미하며, 추가 핵산 분자는 주형 핵산 분자의 세그먼트 및/또는 이에 상보적인 서열과 동일하거나 유사할 수 있다(예컨대, 적어도 70% 동일, 예컨대, 적어도 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일).
증폭 반응 혼합물: 본 명세서에 사용된 용어 "증폭 반응 혼합물" 또는 "증폭 반응"은 주형 핵산 분자의 증폭에 충분한 시약과 함께 주형 핵산 분자를 지칭한다.
생물학적 샘플: 본 명세서에 사용된 용어 "생물학적 샘플"은 일반적으로 본원에 기재된 바와 같이 관심 생물학적 공급원(예컨대, 조직 또는 유기체 또는 세포 배양물)에서 얻거나 유래된 샘플을 지칭한다. 일부 구현예에서, 예컨대 본원에 개시된, 생물학적 공급원은 동물 또는 인간과 같은 유기체이거나 이를 포함한다. 일부 구현에서, 예컨대 본원에 개시된, 생물학적 샘플은 생물학적 조직 또는 유체이거나 이를 포함한다. 일부 구현예에서, 예컨대 본원에 개시된, 생물학적 샘플은 세포, 조직 또는 체액일 수 있거나 이를 포함할 수 있다. 일부 구현예에서, 예컨대 본원에 개시된, 생물학적 샘플은 혈액, 혈구 세포, 무세포 DNA, 자유 부유 핵산, 복수, 생검 샘플, 수술 샘플, 세포 함유 체액, 가래, 타액, 대변, 소변, 뇌척수액, 복막액, 흉막액, 림프액, 부인과 액, 분비물, 배설물, 피부 면봉 샘플, 질 면봉 샘플, 구강 면봉 샘플, 비강 면봉 샘플, 세척액 또는 세척액, 예컨대 관 세척물 또는 기관지폐포 세척물, 흡인물, 스크레이핑, 골수이거나 이를 포함할 수 있다. 일부 구현예에서, 예컨대 본원에 개시된, 생물학적 샘플은 단일 대상체 또는 복수의 대상체로부터 수득된 세포이거나 이를 포함한다. 샘플은 생물학적 공급원에서 직접 얻은 "1차 샘플"이거나 "가공된 샘플"일 수 있다. 생물학적 샘플은 "샘플"이라고도 한다.
바이오마커: 본 명세서에서 사용되는 용어 "바이오마커"는 당업계의 사용과 일치하며, 그 존재, 수준 또는 형태가 특정 생물학적 이벤트 또는 관심 상태와 상관관계가 있어 해당 이벤트 또는 상태의 "마커"가 된다. 당업자는 예를 들어 DNA 바이오마커와 관련하여 바이오마커가 좌위(예컨대 하나 이상의 메틸화 좌위) 및/또는 좌위의 상태(예컨대 하나 이상의 메틸화 좌위의 상태)이거나 이를 포함할 수 있음을 이해할 것이다. 바이오마커의 몇 가지 예를 제공하기 위해, 일부 구현예에서, 예컨대 본원에 개시된, 바이오마커는 특정 질환, 장애 또는 병태에 대한 마커이거나 이를 포함할 수 있거나, 예컨대 대상체 내에서, 특정 질환, 장애 또는 병태가 발전, 발병, 또는 재발할 수 있는 정량적 확률의 정성적 마커일 수 있다. 일부 구현예에서, 예컨대 본원에 개시된, 바이오마커는 특정 치료 결과, 또는 그의 정량적 확률의 정성적 마커일 수 있거나 이를 포함할 수 있다. 따라서, 다양한 구현예에서, 바이오마커는 관련 생물학적 이벤트 또는 관심 상태의 예측, 예후 및/또는 진단일 수 있다. 바이오마커는 모든 화학 부류의 개체일 수 있다. 예를 들어, 일부 구현예에서, 예컨대 본원에 개시된, 바이오마커는 핵산, 폴리펩티드, 지질, 탄수화물, 소분자, 무기 제제(예컨대, 금속 또는 이온), 또는 이들의 조합일 수 있거나 이를 포함할 수 있다. 일부 구현예에서, 예컨대 본원에 개시된, 바이오마커는 세포 표면 마커이다. 일부 구현예에서, 예컨대 본원에 개시된, 바이오마커는 세포내이다. 일부 구현예에서, 예컨대 본원에 개시된, 바이오마커는 세포 외부에서 발견된다(예컨대, 세포 외부로 분비되거나 세포 외부, 예컨대 혈액, 소변, 눈물, 타액, 뇌척수액 등과 같은 체액에서 생성 또는 존재한다). 일부 구현예에서 예컨대 본원에 개시된, 바이오마커는 메틸화 좌위의 메틸화 상태이다. 일부 예에서, 예컨대 본원에 개시된, 바이오마커는 "마커"로 지칭될 수 있다.
바이오마커의 한 예를 제공하기 위해, 일부 구현예에서, 예컨대 본원에 개시된, 이 용어는 발현이 특정 종양, 종양 서브클래스, 종양 병기 등의 특징인 유전자에 의해 코딩되는 생성물의 발현을 지칭한다. 대안적으로 또는 추가로, 일부 구현예에서, 예컨대 본원에 개시된, 특정 마커의 존재 또는 수준은 특정 신호전달 경로의 활성(또는 활성 수준)과 상관관계가 있을 수 있으며, 예를 들어 그 활성이 종양의 특정 부류의 특징인 신호전달 경로의 활성도와 상관관계가 있을 수 있다.
당업자는 바이오마커가 특정 생물학적 이벤트 또는 관심 상태를 개별적으로 결정할 수 있거나 특정 생물학적 이벤트 또는 관심 상태의 통계적 확률의 결정을 나타내거나 이에 기여할 수 있음을 이해할 것이다.
당업자는 마커가 특정 생물학적 이벤트 또는 관심 상태와 관련된 특이도 및/또는 민감도가 다를 수 있음을 이해할 것이다.
혈액 성분: 본 명세서에 사용된 용어 "혈액 성분"은 적혈구, 백혈구, 혈장, 혈소판, 내피 세포, 중피 세포, 상피 세포 및 무세포 DNA를 포함하는 전혈의 임의의 성분을 지칭한다. 혈액 성분에는 단백질, 대사 산물, 지질, 핵산 및 탄수화물을 비롯한 혈장 성분과 예를 들어 임신, 장기 이식, 감염, 부상 또는 질환으로 인해 혈액에 존재할 수 있는 기타 세포도 포함된다.
암: 본 명세서에 사용된 용어 "암(cancer)", "악성종양(malignancy)", "신생물(neoplasm)", "종양(tumor)" 및 "암종(carcinoma)"은 세포가 상대적으로 비정상, 비제어적 및/또는 자율적 성장을 나타내거나 나타내었고, 이로인해 비정상적으로 상승된 증식 속도 및/또는 비정상적인 성장 표현형을 나타내거나 나타냈던 질환, 장애 또는 병태를 나타내기 위해 상호교환적으로 사용된다. 일부 구현예에서, 예컨대 본원에 개시된, 암은 하나 이상의 종양을 포함할 수 있다. 일부 구현예에서, 예컨대 본원에 개시된, 암은 전암성(예컨대, 양성), 악성, 전-전이성, 전이성 및/또는 비전이성인 세포이거나 이를 포함할 수 있다. 일부 구현예에서, 예컨대 본원에 개시된, 암은 고형 종양이거나 이를 포함할 수 있다. 일부 구현예에서, 예컨대 본원에 개시된, 암은 혈액 종양이거나 이를 포함할 수 있다. 일반적으로, 당업계에 공지된 다양한 유형의 암의 예는 예를 들어 대장암, 백혈병을 포함하는 조혈암, 림프종(호지킨 및 비호지킨), 골수종 및 골수증식성 장애; 육종, 흑색종, 선종, 고형 조직 암종, 구강, 인후, 후두, 폐의 편평 세포 암종, 간암, 전립선암, 자궁경부암, 방광암, 자궁암 및 자궁내막암과 같은 비뇨생식기암 및 신세포암종, 골암, 췌장암, 피부암, 피부 또는 안내 흑색종, 내분비계 암, 갑상선암, 부갑상선암, 두경부암, 유방암, 위장관암 및 신경계암, 유두종과 같은 양성 병변 등을 포함한다.
화학요법제: 본 명세서에 사용된 용어 "화학요법제"는 당업계의 용도와 일치하여 암을 치료하거나 암의 치료에 기여하는 것으로 공지된 또는 공지된 특성을 갖는 하나 이상의 작용제를 지칭한다. 특히, 화학요법제는 세포자멸사촉진제, 세포증식억제제, 및/또는 세포독성제를 포함한다. 일부 구현예에서, 예컨대 본원에 개시된, 화학요법제는 알킬화제, 안트라사이클린, 세포골격 파괴제(예컨대, 탁산, 메이탄신 및 이들의 유사체와 같은 미세소관 표적화 모이어티), 에포틸론, 히스톤 데아세틸라제 억제제 HDAC), 토포이소머라제 억제제(예컨대, 토포이소머라제 I 및/또는 토포이소머라제 II의 억제제), 키나제 억제제, 뉴클레오티드 유사체 또는 뉴클레오티드 전구체 유사체, 펩티드 항생제, 백금 기반 제제, 레티노이드, 빈카 알칼로이드 및/또는 관련 항증식 활성을 공유하는 유사체이거나 이를 포함할 수 있다. 일부 특정 구현예에서, 예컨대 본원에 개시된, 화학요법제는 악티노마이신(Actinomycin), 올-트랜스 레티노산(All-trans retinoic acid), 아우리스타틴(Auiristatin), 아자시티딘(Azacitidine), 아자티오프린(Azathioprine), 블레오마이신(Bleomycin), 보르테조밉(Bortezomib), 카르보플라틴(Carboplatin), 카페시타빈(Capecitabine), 시스플라틴(Cisplatin), 클로람부실(Chlorambucil), 시클로포스파미드(Cyclophosphamide), 커큐민(Curcumin), 시타라빈(Cytarabine), 다우노루비신(Daunorubicin), 도세탁셀(Docetaxel), 독시플루리딘(Doxifluridine), 독소루비신(Doxorubicin), 에피루비신(Epirubicin), 에포틸론(Epothilone), 에토포사이드(Etoposide), 플루오로우라실(Fluorouracil), 젬시타빈(Gemcitabine), 하이드록시우레아(Hydroxyurea), 이다루비신(Idarubicin), 이마티닙(Imatinib), 이리노테칸(Irinotecan), 메이탄신(Maytansine) 및/또는 이들의 유사체(예: DM1) 메클로레타민(Mechlorethamine), 메르캅토퓨린(Mercaptopurine), 메토트렉세이트(Methotrexate), 미톡산트론(Mitoxantrone), 메이탄시노이드(Maytansinoid), 옥살리플라틴(Oxaliplatin), 파클리탁셀(Paclitaxel), 페메트렉세드(Pemetrexed), 테니포시드(Teniposide), 티오구아닌(Tioguanine), 토포테칸(Topotecan), 발루비신(Valrubicin), 빈블라스틴(Vinblastine), 빈크리스틴(Vincristine), 빈데신(Vindesine), 비노렐빈(Vinorelbine), 또는 이들의 조합이거나 이를 포함할 수 있다. 일부 구현예에서, 예컨대 본원에 개시된, 화학요법제는 항체-약물 접합체의 맥락에서 이용될 수 있다. 일부 구현예에서, 예컨대 본원에 개시된, 화학요법제는 하기로 이루어진 군에서 선택된 항체-약물 접합체에서 찾을 수 있는 것이다: hLL1-독소루비신, hRS7-SN-38, hMN-14-SN-38, hLL2-SN-38, hA20-SN-38, hPAM4-SN-38, hLL1-SN-38, hRS7-Pro-2-P-Dox, hMN-14-Pro-2-P-Dox, hLL2-Pro-2-P-Dox, hA20-Pro-2-P-Dox, hPAM4-Pro-2-P-Dox, hLL1-Pro-2-P-Dox, P4/D10-독소루비신, 젬투주맙 오조가미신(gemtuzumab ozogamicin), 브렌툭시맙 베도틴(brentuximab vedotin), 트라스투주맙 엠탄신(trastuzumab emtansine), 이노투주맙 오조가미신(inotuzumab ozogamicin), 글렘바투모맙 베도틴(glembatumomab vedotin), SAR3419, SAR566658, BIIB015, BT062, SGN-75, SGN-CD19A, AMG-172, AMG-595, BAY-94-9343, ASG-5ME, ASG-22ME, ASG-16M8F, MDX-1203, MLN-0264, anti-PSMA ADC, RG-7450, RG-7458, RG-7593, RG-7596, RG-7598, RG-7599, RG-7600, RG-7636, ABT-414, IMGN-853, IMGN-529, 보르세투주맙 마포도틴(vorsetuzumab mafodotin), 및 로보투주맙 메르탄신(lorvotuzumab mertansine). 일부 구현예에서, 예컨대 본원에 개시된, 화학요법제는 파르네실-티오살리실산(farnesyl-thiosalicylic acid; FTS), 4-(4-클로로-2-메틸페녹시)-N-히드록시부탄아미드(4-(4-Chloro-2-methylphenoxy)-N-hydroxybutanamide; CMH), 에스트라디올(estradiol; E2), 테트라메톡시스틸벤(tetramethoxystilbene; TMS), d-토카트리에놀(d-tocatrienol), 살리노마이신(salinomycin) 또는 커큐민(curcumin) 이거나 이를 포함할 수 있다.
필적하는: 여기에 사용된 용어 "필적하는"은 서로 동일하지 않을 수 있지만 비견할 수 있을 만큼 충분히 유사한 둘 이상의 병태(condition), 상황, 제제, 개체, 개체군 등의 집합 내의 구성원을 나타내어, 당업자가 관찰된 차이점 또는 유사점에 기초하여 결론이 합리적으로 도출될 수 있음을 인식할 수 있게 하는 것을 지칭한다. 일부 구현예에서, 예컨대 본원에 개시된, 병태, 상황, 제제, 개체, 개체군 등의 필적하는 세트는 일반적으로 복수의 실질적으로 동일한 특징 및 0, 1 또는 복수의 상이한 특징을 특징으로 한다. 관련 기술분야의 통상의 기술자는 맥락에서 세트의 구성원을 필적하게 하기 위해 어느 정도의 동일성이 요구되는지 이해할 것이다. 예를 들어, 당업자는 병태, 상황, 제제, 개체, 개체군 등의 집합의 구성원이 관찰된 차이가 전체 또는 부분적으로 동일하지 않은 특징에 기인될 수 있다는 합리적인 결론을 보증하기에 충분한 수와 유형의 실질적으로 동일한 특징으로 특징지어질 하는 경우 서로 필적하함을 인식할 것이다.
검출가능한 모이어티: 본 명세서에 사용된 용어 "검출가능한 모이어티"는 검출가능한 임의의 요소, 분자, 작용기, 화합물, 단편, 또는 기타 모이어티를 지칭한다. 일부 구현예에서, 예컨대 본원에 개시된, 검출가능한 모이어티는 단독으로 제공되거나 이용된다. 일부 구현예에서, 검출가능한 모이어티는 다른 제제와 함께 (예컨대, 연결되어) 제공 및/또는 활용된다. 검출가능한 모이어티의 예는 다양한 리간드, 방사성 핵종(예컨대, 3H, 14C, 18F, 19F, 32P, 35S, 135l, 125l, 123l, 64Cu, 187Re, 111ln, 90Y, 99mTc, 177Lu, 89Zr 등), 형광 염료, 화학발광제, 생물발광제, 분광 분해성 무기 형광 반도체 나노결정(즉, 양자점), 금속 나노입자, 나노클러스터, 상자성 금속 이온, 효소, 비색 표지, 비오틴, 다이옥시제닌, 합텐, 및 항혈청 또는 단클론 항체를 사용할 수 있는 단백질를 포함하지만 이에 제한되지 않는다.
진단: 본 명세서에 사용된 용어 "진단"은 대상체가 질환, 장애, 병태 또는 상태를 갖거나 발병할 것인지 여부 및/또는 정량적 확률의 정성적 가능성을 결정하는 것을 의미한다. 예를 들어, 암 진단에서 진단에는 암의 위험도, 유형, 병기, 악성종양 또는 기타 분류에 관한 결정이 포함될 수 있다. 일부 예에서, 예컨대 본원에 개시된, 진단은 하나 이상의 일반 또는 특정 치료제 또는 요법에 대한 예후 및/또는 가능한 반응과 관련된 결정이거나 이를 포함할 수 있다.
진단 정보: 본 명세서에 사용된 용어 "진단 정보"는 진단을 제공하는 데 유용한 정보를 의미한다. 진단 정보는 바이오마커 상태 정보를 포함할 수 있다 수 있으나 이에 제한되지 않는다.
차등적 메틸화된: 본 명세서에 사용된 용어 "차등적 메틸화된"은 메틸화 상태가 제1 조건과 제2 조건 사이에서 상이한 메틸화 부위를 기술한다. 차등적으로 메틸화된 메틸화 부위는 차등적 메틸화된 부위로 지칭될 수 있다. 일부 예에서, 예컨대 본원에 개시된, DMR은 올리고뉴클레오티드 프라이머, 예를 들어 DMR의 증폭 또는 앰플리콘에 존재하는 관심 DNA 영역의 증폭을 위해 선택된 한 쌍의 올리고뉴클레오티드 프라이머를 사용한 증폭에 의해 생성된 앰플리콘에 의해 형성된다. 일부 예에서, 예컨대 본원에 개시된, DMR은 올리고뉴클레오티드 프라이머의 서열 또는 이에 상보적인 서열을 갖는 영역을 포함하는 한 쌍의 올리고뉴클레오티드 프라이머에 의해 증폭된 DNA 영역에 의해 형성된다. 일부 예에서, 예컨대 본원에 개시된, DMR은 올리고뉴클레오티드 프라이머의 서열 또는 이에 상보적인 서열을 갖는 영역을 제외한 한 쌍의 올리고뉴클레오티드 프라이머에 의해 증폭된 DNA 영역에 의해 형성된다.
차등적 메틸화 영역: 본 명세서에 사용된 용어 "차등적 메틸화 영역"(DMR)은 하나 이상의 차등적으로 메틸화된 부위를 포함하는 DNA 영역을 지칭한다. 암성 상태(cancerous state)와 같은 선택된 관심 조건 하에서 보다 많은 수 또는 빈도의 메틸화된 부위를 포함하는 DMR은 과메틸화 DMR로 지칭될 수 있다. 암성 상태와 같은 선택된 관심 조건 하에서 보다 적은 수 또는 빈도의 메틸화된 부위를 포함하는 DMR은 저메틸화 DMR로 지칭될 수 있다. 대장암에 대한 메틸화 바이오마커인 DMR은 대장암 DMR로 지칭될 수 있다. 일부 예에서, 예를 들어, 본원에 기재된 바와 같이, 대장암에 대한 메틸화 바이오마커인 DMR은 또한 진행성 선종의 식별에 유용할 수 있다. 일부 예에서, 예를 들어, 본원에 기재된 바와 같이, 진행성 선종에 대한 메틸화 바이오마커인 DMR은 진행성 선종 DMR로 지칭될 수 있다. 일부 예에서, 예를 들어 본원에 기재된 바와 같이, 진행성 선종에 대한 메틸화 바이오마커인 DMR은 또한 대장암의 식별에 유용할 수 있다. 일부 예에서, 예컨대 본원에 개시된, DMR은 단일 뉴클레오티드일 수 있으며, 이 단일 뉴클레오티드는 메틸화 부위이다. 바람직하게는, DMR은 적어도 약 10, 15, 20, 24, 50, 100, 150, 200, 250, 300, 350, 400, 500, 1000, 1500, 2000, 2225, 2500개 또는 그 이상의 염기의 길이를 갖는다.
DNA 영역: 본원에 사용된 "DNA 영역"은 더 큰 DNA 분자의 임의의 인접 부분을 의미한다. 당업자는 예컨대, 제1 및 제2 DNA 영역(region)의 서열 유사성(예컨대, 서열 동일성 또는 동종성) 및/또는 맥락(context) (예컨대, 제1 및 제2 DNA 영역의 상류 및/또는 하류에 있는 핵산의 서열 동일성 또는 동종성)에 기반하여, 제1 DNA 영역 및 제2 DNA 영역이 상응하는지를 결정하기 위한 기술에 익숙할 것이다.
본 명세서에 달리 명시되지 않는 한, 인간에서 발견되거나 인간과 관련된 서열(예컨대, 인간 DNA에 혼성화됨)은 Homo sapiens(인간) 게놈 어셈블리 GRCh38, hg38, 및/또는 Genome Reference Consortium Human Build 38와 같이 당업자에 일반적으로 언급되고 알려진 예시적인 인간 게놈 서열에서 발견되고, 이에 기초하고/하거나 유래된다. 당업자는 hg38의 DNA 영역이 지정된 넘버링에 따른 특정 뉴클레오티드 위치 또는 이의 범위의 식별을 포함하는 공지된 시스템에 의해 언급될 수 있음을 추가로 이해할 것이다.
다운스트림: 본원에서 사용된 용어 "다운스트림"은 제1 DNA 영역이 제2 DNA 영역에 비해 제1 DNA 영역 및 제2 DNA 영역을 포함하는 핵산의 C-말단에 더 가깝다는 것을 의미한다.
유전자: 본 명세서에 사용된 용어 "유전자"는 산물(예컨대, RNA 산물 및/또는 폴리펩티드 산물)을 인코딩하는 코딩 서열을 포함하는, 예컨대 염색체 내의, 코딩 서열의 발현 조절에 기여하는 DNA 서열 전체, 일부를 갖거나 또는 없는 단일 DNA 영역을 지칭한다. 일부 구현예에서, 예컨대 본원에 개시된, 유전자는 하나 이상의 비-코딩 서열을 포함한다. 일부 특정 구현예에서, 예컨대 본원에 개시된, 유전자는 엑손 및 인트론 서열을 포함한다. 일부 구현예에서, 예컨대 본원에 개시된, 유전자는 예를 들어 유전자 발현의 하나 이상의 양태(예컨대, 세포 유형-특이적 발현, 유도성 발현 등)을 제어하거나 영향을 미칠 수 있는 하나 이상의 조절 요소를 포함한다. 일부 구현예에서, 예컨대 본원에 개시된, 유전자는 프로모터를 포함한다. 일부 구현예에서, 예컨대 본원에 개시된, 유전자는 (i) 코딩 서열의 상류에 미리 결정된 수의 뉴클레오티드를 연장하는 DNA 뉴클레오티드 및 (ii) 코딩 서열의 하류에 미리 결정된 수의 뉴클레오티드를 연장하는 DNA 뉴클레오티드 중 하나 또는 둘 모두를 포함한다. 다양한 구현예에서, 예컨대 본원에 개시된, 미리 결정된 수의 뉴클레오티드는 500 bp, 1 kb, 2 kb, 3 kb, 4 kb, 5 kb, 10 kb, 20 kb, 30 kb, 40 kb, 50 kb, 75 kb, 또는 100 kb일 수 있다.
혼성화: 본원에 사용된 "혼성화"는 이중 가닥 구조를 형성하기 위해 제1 핵산과 제2 핵산의 회합(association)을 지칭하며, 이 회합은 뉴클레오티드의 상보적 쌍을 통해 발생한다. 당업자는 특히 상보적 서열이 혼성화할 수 있음을 인식할 것이다. 다양한 구현예에서, 예컨대 본원에 개시된, 혼성화는 예를 들어, 적어도 70% 의 상보성을 갖는 뉴클레오티드 서열, 예를 들어, 적어도 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 상보성을 갖는 뉴클레오티드 서열 사이에서 발생할 수 있다. 당업자는 제1 핵산 및 제2 핵산의 혼성화가 발생하는지 여부가 다양한 반응 조건에 의존할 수 있음을 추가로 이해할 것이다. 혼성화가 일어날 수 있는 조건은 당업계에 공지되어 있다.
저메틸화: 본 명세서에 사용된 용어 "저메틸화(Hypomethylation)"는 기준 상태와 비교하여 관심 상태에서 적어도 하나의 더 적은 메틸화된 뉴클레오티드를 갖는 메틸화 좌위의 상태를 지칭한다(예컨대, 건강한 대조군에 비해 대장암에서 적어도 하나의 더 적은 메틸화된 뉴클레오티드).
과메틸화: 본 명세서에 사용된 용어 "과메틸화(hypermethylation)"는 기준 상태와 비교하여 관심 상태에서 적어도 하나의 메틸화된 뉴클레오티드를 갖는 메틸화 좌위의 상태를 지칭한다(예컨대, 건강한 대조군에 비해 대장암에서 적어도 하나의 더 많은 메틸화된 뉴클레오티드).
동일성, 동일: 본 명세서에 사용된 용어 "동일성(identity)" 및 “동일(identical)”은 중합체 분자 사이, 예를 들어 핵산 분자(예컨대, DNA 분자 및/또는 RNA 분자) 및/또는 폴리펩티드 분자 사이의 전반적인 관련성을 지칭한다. 2개의 제공된 서열 간의 동일성 퍼센트 계산 방법은 당업계에 공지되어 있다. 예를 들어, 2개의 핵산 또는 폴리펩티드 서열의 동일성 퍼센트 계산은 최적의 비교 목적을 위해 2개의 서열(또는 하나 또는 둘 모두의 서열의 상보체)을 정렬함으로써 수행될 수 있다(예컨대, 갭은 최적의 정렬을 위해 제1 서열 및 제2 서열 중 하나 또는 둘 모두에 도입될 수 있으며 동일하지 않은 서열은 비교를 위해 무시할 수 있다). 그런 다음 상응하는 위치의 뉴클레오티드 또는 아미노산을 비교한다. 제1 서열의 위치가 제2 서열의 상응하는 위치와 동일한 잔기(예: 뉴클레오티드 또는 아미노산)에 의해 점유되는 경우, 분자는 해당 위치에서 동일성이다. 두 서열 사이의 퍼센트 동일성은, 선택적으로 두 서열의 최적 정렬을 위해 도입하기 위해 필요할 수 있는 갭의 수와 각 갭의 길이를 고려하여, 서열이 공유하는 동일한 위치의 수의 함수이다. 서열 비교 및 두 서열 간의 동일성 퍼센트의 결정은 BLAST(basic local alignment search tool)와 같은 계산 알고리즘을 사용하여 수행할 수 있다.
"향상된", "증가된" 또는 "감소된": 본 명세서에서 사용된 바와 같이, 이러한 용어 또는 문법적으로 비교 가능한 비교 용어는 비교 가능한 기준 측정값과 관련된 값을 나타낸다. 예를 들어, 일부 구현예에서, 예컨대 본원에 개시된, 관심 제제로 달성된 평가 값은 비교 가능한 기준 제제 또는 제제 없이 얻은 평가 값에 비해 "향상"될 수 있다. 대안적으로 또는 추가적으로, 일부 구현예에서, 예컨대 본원에 개시된, 관심 대상체 또는 시스템의 평가 값은 다른 조건 또는 다른 시점(예컨대, 관심 제제의 투여와 같은 사건 이전 또는 이후)에서 동일한 대상체 또는 시스템, 또는 상이한, 필적하는 대상체(예컨대, 특정 관심 질환, 장애 또는 병태(condition)의 하나 이상의 표지의 존재, 또는 조건 또는 제제에 대한 사전 노출 등에 있어서 관심 대상체 또는 시스템과 상이한 필적하는 대상체 또는 시스템에서)에서 얻은 것과 비교하여 "향상"될 수 있다. 일부 구현예에서, 예컨대 본원에 개시된, 비교급 용어는 통계적으로 관련된 차이(예컨대, 통계적 관련성을 달성하기에 충분한 유병률 및/또는 규모의 차이)를 지칭한다. 당업자는 주어진 맥락에서 이러한 통계적 의미를 달성하는 데 필요하거나 충분한 차이의 규모 및/또는 유병률을 인식하거나 쉽게 결정할 수 있을 것이다.
메틸화: 본 명세서에 사용된 용어 "메틸화"는 (i) 시토신의 C5 위치; (ii) 시토신의 N4 위치; 및 (iii) 아데닌의 N6 위치에서의 메틸화를 포함한다. 메틸화에는 (iv) 다른 유형의 뉴클레오티드 메틸화도 포함된다. 메틸화된 뉴클레오티드는 "메틸화 뉴클레오티드" 또는 "메틸화 뉴클레오티드 염기"로 지칭될 수 있다. 특정 구현예에서, 예컨대 본원에 개시된, 메틸화는 특히 시토신 잔기의 메틸화를 지칭한다. 일부 예에서, 본원에 기재된 바와 같이, 메틸화는 구체적으로 CpG 부위에 존재하는 시토신 잔기의 메틸화를 지칭한다.
메틸화 분석: 본 명세서에 사용된 용어 "메틸화 분석"은 메틸화 좌위 또는 메틸화 위치의 메틸화 상태를 결정하는 데 사용할 수 있는 임의의 기술을 의미한다.
메틸화 바이오마커: 본 명세서에 사용된 용어 "메틸화 바이오마커"는 적어도 하나의 메틸화 위치 또는 좌위 및/또는 적어도 하나의 메틸화 좌위의 메틸화 상태, 예컨대 과메틸화 좌위거나 이를 포함하는 바이오마커를 지칭한다. 특히, 메틸화 바이오마커는 하나 이상의 핵산 좌위의 메틸화 상태에서 제1 상태와 제2 상태 사이(예컨대, 암성 상태와 비암성 상태 사이)의 변화를 특징으로 하는 바이오마커이다.
메틸화 좌위: 본 명세서에 사용된 용어 "메틸화 좌위"는 적어도 하나의 차등적 메틸화 영역을 포함하는 DNA 영역을 지칭한다. 암성 상태와 같은 선택된 관심 조건 하에서 더 많은 수 또는 빈도의 메틸화 부위를 포함하는 메틸화 좌위는 과메틸화 좌위로 지칭될 수 있다. 암성 상태와 같은 선택된 관심 조건 하에서 메틸화 부위의 더 적은 수 또는 빈도를 포함하는 메틸화 좌위는 저메틸화 좌위로 지칭될 수 있다.
메틸화 부위: 본 명세서에 사용된 바와 같이, 메틸화 부위는 적어도 하나의 조건에서 메틸화된 뉴클레오티드 또는 뉴클레오티드 위치를 지칭한다. 메틸화된 상태에서 메틸화 부위는 메틸화된 부위라 지칭할 수 있다.
메틸화 상태: 본원에 사용된 "메틸화 상태(methylation status)", "메틸화 상태(methylation state)" 또는 "메틸화 프로파일(methylation profile)"은 메틸화 좌위 내의 메틸화 부위에서 메틸화의 수, 빈도 또는 패턴을 지칭한다. 따라서, 제1 상태와 제2 상태 사이의 메틸화 상태의 변화는 메틸화된 부위의 수, 빈도 또는 패턴의 증가이거나 이를 포함할 수 있거나, 메틸화된 부위의 수, 빈도 또는 패턴의 감소이거나 이를 포함할 수 있다. 다양한 예에서, 본원에 기재된, 메틸화 상태의 변화는 메틸화 값의 변화이다. 다양한 예에서, 본원에 기재된, “메틸화 상태”는 개별 메틸화 부위에서 메틸화의 존재 또는 부존재를 지칭한다.
메틸화 값: 본 명세서에 사용된 용어 "메틸화 값(methylation value)"은 예를 들어 메틸화 좌위의 메틸화 빈도 또는 비율을 나타내는 숫자 형태의 메틸화 상태의 수치적 표현을 의미한다. 일부 예에서, 예컨대 본원에 개시된, 메틸화 값은 메틸화 의존 제한 효소로 샘플을 제한효소 절단(restriction digestion)한 후 샘플에 존재하는 온전한 핵산의 양을 정량화하는 것을 포함하는 방법에 의해 생성될 수 있다. 일부 예에서, 예컨대 본원에 개시된, 메틸화 값은 샘플의 중아황산염 반응 후 증폭 프로파일을 비교하는 것을 포함하는 방법에 의해 생성될 수 있다. 일부 예에서, 예컨대 본원에 개시된, 메틸화 값은 중아황산염 처리된 핵산과 처리되지 않은 핵산의 서열을 비교하여 생성될 수 있다. 일부 예에서, 예컨대 본원에 개시된, 메틸화 값은 정량적 PCR 결과이거나 이를 포함하거나 이를 기반으로 한다.
핵산: 본 명세서에 사용된, 가장 넓은 의미에서, 용어 "핵산"은 올리고뉴클레오티드 사슬에 포함되거나 포함될 수 있는 임의의 화합물 및/또는 물질을 의미한다. 일부 구현예에서, 예컨대 본원에 개시된, 핵산은 포스포디에스테르 결합을 통해 올리고뉴클레오티드 사슬에 포함되거나 포함될 수 있는 화합물 및/또는 물질이다. 문맥으로부터 명백한 바와 같이, 일부 구현예에서, 예컨대 본원에 개시된, 용어 핵산은 개별 핵산 잔기(예컨대, 뉴클레오티드 및/또는 뉴클레오시드)를 지칭하고, 일부 구현예에서, 예컨대 본원에 개시된, 복수의 개별 핵산 잔기를 포함하는 폴리뉴클레오티드 사슬을 지칭한다. 핵산은 DNA, RNA 또는 이들의 조합일 수 있거나 이를 포함할 수 있다. 핵산은 천연 핵산 잔기, 핵산 유사체 및/또는 합성 잔기를 포함할 수 있다. 일부 구현예에서, 예컨대 본원에 개시된, 핵산은 천연 뉴클레오티드(예컨대, 아데노신, 티미딘, 구아노신, 시티딘, 우리딘, 데옥시아데노신, 데옥시티미딘, 데옥시 구아노신, 및 데옥시시티딘)를 포함한다. 일부 구현예에서, 예컨대 본원에 개시된, 핵산은 하나 이상의 뉴클레오티드 유사체(예컨대, 2-아미노아데노신, 2-티오티미딘, 이노신, 피롤로-피리미딘, 3-메틸 아데노신, 5-메틸시티딘, C-5 프로피닐-시티딘, C-5 프로피닐-우리딘, 2-아미노아데노신, C5-브로모우리딘, C5-플루오로우리딘, C5-요오도우리딘, C5-프로피닐-우리딘, C5-프로피닐-시티딘, C5-메틸시티딘, 2-아미노아데노신, 7-데아자아데노신, 7-데아자구아노신 8-옥소아데노신, 8-옥소구아노신, 0(6)-메틸구아닌, 2-티오시티딘, 메틸화된 염기, 개재(intercalated) 염기, 및 이들의 조합)이거나 이를 포함한다.
일부 구현예에서, 예컨대 본원에 개시된, 핵산은 RNA 또는 단백질과 같은 기능적 유전자 생성물을 인코딩하는 뉴클레오티드 서열을 갖는다. 일부 구현예에서, 예컨대 본원에 개시된, 핵산은 하나 이상의 인트론을 포함한다. 일부 구현예에서, 예컨대 본원에 개시된, 핵산은 하나 이상의 유전자를 포함한다. 일부 구현예에서, 예컨대 본원에 개시된, 핵산은 천연 공급원으로부터의 단리, 상보적 주형(생체내(in vivo) 또는 시험관내(in vitro))에 기초한 중합에 의한 효소적 합성, 재조합 세포 또는 시스템에서의 재생산, 및 화학적 합성 중 하나 이상에 의해 제조된다.
일부 구현예에서, 예컨대 본원에 개시된, 핵산 유사체는 포스포디에스테르 골격을 사용하지 않는다는 점에서 핵산과 상이하다. 예를 들어, 일부 구현예에서, 예컨대 본원에 개시된, 핵산은 당업계에 공지되어 있고 골격에서 포스포디에스테르 결합 대신 펩티드 결합을 갖는 하나 이상의 펩티드 핵산을 포함할 수 있다. 대안적으로 또는 추가로, 일부 구현예에서, 예컨대 본원에 개시된, 핵산은 포스포디에스테르 결합(bond) 대신에 하나 이상의 포스포로티오에이트 및/또는 5'-N-포스포르아미다이트 결합(linkage)을 갖는다. 일부 구현예에서, 예컨대 본원에 개시된, 핵산은 천연 핵산에 있는 것과 비교하여 하나 이상의 변형 당(예컨대, 2'-플루오로리보스, 리보스, 2'-데옥시리보스, 아라비노스 및 헥소스)을 포함한다.
일부 구현예에서, 예컨대 본원에 개시된, 핵산은 적어도 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 100, 1 10, 120, 130, 140, 150, 160, 170, 180, 190, 20, 225, 250, 275, 300, 325, 350, 375, 400, 425, 450, 475, 500, 600, 700, 800, 900, 1000, 1500, 2000, 2500, 3000, 3500, 4000, 4500, 5000 또는 그 이상의 잔기이거나 이를 포함한다. 일부 구현예에서, 예컨대 본원에 개시된, 핵산은 부분적으로 또는 전체적으로 단일 가닥, 또는 부분적으로 또는 전체적으로 이중 가닥이다.
핵산 검출 분석: 본 명세서에 사용된 용어 "핵산 검출 분석(nucleic acid detection assay)"은 관심 핵산의 뉴클레오티드 조성을 결정하는 임의의 방법을 지칭한다. 핵산 검출 분석에는 DNA 시퀀싱 방법, 중합효소 연쇄 반응 기반 방법, 프로브 혼성화 방법, 리가제 연쇄 반응 등이 포함되지만 이에 국한되지는 않는다.
뉴클레오티드: 본 명세서에 사용된 용어 "뉴클레오티드"는 폴리뉴클레오티드, 예를 들어 DNA 및/또는 RNA 중합체의 구조적 성분 또는 빌딩 블록을 의미한다. 뉴클레오티드는 염기(예컨대, 아데닌, 티민, 우라실, 구아닌 또는 시토신)와 당 분자 및 하나 이상의 포스페이트기를 포함한다. 본원에 사용된 뉴클레오티드는 메틸화된 뉴클레오티드 또는 비-메틸화된 뉴클레오티드일 수 있다. 당업자는 예로서 "좌위(locus)" 또는 "뉴클레오티드"와 같은 핵산 용어가 단일 핵산 분자의 좌위 또는 뉴클레오티드를 지칭할 수 있고 및/또는 복수의 핵산 내의 좌위 또는 뉴클레오티드의 누적 개체군을 지칭할 수 있으며(예컨대, 대상체의 샘플 및/또는 표본(representative) 내의 복수의 핵산) 이들은 좌위 또는 뉴클레오티드를 대표함을 이해할 것이다(예컨대, 같은 동일성 핵산 서열 및/또는 핵산 서열 맥락(context)을 가지거나 실질적으로 동일한 핵산 서열 및/또는 핵산 맥락(context)을 가짐).
올리고뉴클레오티드 프라이머: 본 명세서에 사용되는 용어, 올리고뉴클레오티드 프라이머, 또는 프라이머는 주형 핵산 분자로부터 앰플리콘을 생성하는 데 사용되거나 사용될 수 있는 핵산 분자를 의미한다. 전사 허용 조건(예: 뉴클레오티드 및 DNA 중합효소의 존재 및 적절한 온도 및 pH에서) 하에, 올리고뉴클레오티드 프라이머는 올리고뉴클레오티드 프라이머가 혼성화되는 주형으로부터 전사 개시 지점을 제공할 수 있다. 일반적으로 올리고뉴클레오티드 프라이머는 5 내지 200 뉴클레오티드 길이의 단일 가닥 핵산이다. 당업자는 주형 핵산 분자로부터 앰플리콘을 생성하기 위한 최적의 프라이머 길이가 온도 파라미터, 프라이머 조성, 및 전사 또는 증폭 방법을 포함하는 조건에 따라 달라질 수 있음을 이해할 것이다. 본 명세서에서 사용되는 한 쌍의 올리고뉴클레오티드 프라이머는 주형 이중 가닥 핵산 분자의 첫 번째 가닥 및 두 번째 가닥에 각각 상보적인 두 개의 올리고뉴클레오티드 프라이머 세트를 의미한다. 한 쌍의 올리고뉴클레오티드 프라이머의 첫 번째 및 두 번째 구성원은 주형 핵산 가닥에 대해, 정방향 올리고뉴클레오티드 프라이머는 주형 핵산 가닥의 상보적인 핵산 가닥과 혼성화할 수 있고, 역방향 올리고뉴클레오티드 프라이머는 주형 핵산 가닥과 혼성화할 수 있으며, 주형 핵산 가닥에 대한 정방향 올리고뉴클레오티드 프라이머가 주형 핵산 가닥에 대한 역방향 올리고뉴클레오티드 프라이머의 위치의 5'라는 점에서 각각 "정방향" 올리고뉴클레오티드 프라이머 및 "역방향" 올리고뉴클레오티드 프라이머로 지칭될 수 있다. 당업자는. 제1 및 제2 올리고뉴클레오티드 프라이머 각각의 정방향 및 역방향 올리고뉴클레오티드 프라이머로서의 식별은 주어진 핵산 가닥 또는 이의 상보체가 주형 핵산 분자로 활용되는지 여부에 따라 이들 식별자가 좌우되는 만큼 임의적이라는 것이 당업자에 의해 이해될 것이다.
중첩: 용어 “중첩(overlappting)”은 본원에서 DNA의 두 영역과 관련하여 사용되며, 각 영역은 다른 영역에서 동일한 길이의 하위 서열(sub-sequence)과 실질적으로 동일한 하위 서열을 포함한다(예컨대, DNA의 두 영역은 공통 하위 서열을 가진다). "실질적으로 동일(substantially identical)"는 2개의 동일한 길이의 하위 서열이 주어진 염기쌍 수보다 적은 차이만큼 다르다는 것을 의미한다. 특정 예에서, 예컨대 본원에 개시된, 각각의 하위 서열은 서로 4, 3, 2, 또는 1개 미만의 염기쌍만큼 상이한 적어도 20개 염기쌍 길이를 갖는다(예컨대, 상기 2개의 하위 서열은 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95% 유사성, 적어도 97% 유사성, 적어도 98% 유사성, 적어도 99% 유사성, 또는 적어도 99.5% 유사성을 가짐). 특정 예에서, 예컨대 본원에 개시된, 각각의 하위서열은 5, 4, 3, 2, 또는 1개 미만의 염기쌍만큼 상이한 적어도 24개 염기쌍 길이를 갖는다(예컨대, 상기 2개의 하위서열은 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95% 유사성, 적어도 97% 유사성, 적어도 98% 유사성, 적어도 99% 유사성, 또는 적어도 99.5% 유사성을 가짐). 특정 예에서, 예컨대 본원에 개시된, 각각의 하위서열은 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 미만의 염기쌍만큼 상이한 적어도 50개 염기쌍 길이를 갖는다(예컨대, 상기 2개의 하위 서열은 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95% 유사성, 적어도 97% 유사성, 적어도 98% 유사성, 적어도 99% 유사성, 또는 적어도 99.5% 유사성을 가짐). 특정 예에서, 예컨대 본원에 개시된, 각각의 하위서열은 20, 15, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 미만의 염기쌍 만큼 상이한 적어도 100개 염기쌍 길이를 갖는다(예컨대, 상기 2개의 하위 서열은 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95% 유사성, 적어도 97% 유사성, 적어도 98% 유사성, 적어도 99% 유사성, 또는 적어도 99.5% 유사성을 가짐). 특정 예에서, 예컨대 본원에 개시된, 각각의 하위서열은 40, 30, 20, 15, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 미만의 염기쌍만큼 상이한 적어도 200개 염기쌍 길이를 갖는다(예컨대, 상기 2개의 하위 서열은 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95% 유사성, 적어도 97% 유사성, 적어도 98% 유사성, 적어도 99% 유사성 또는 적어도 99.5% 유사성을 가짐). 특정 예에서, 예컨대 본원에 개시된, 각각의 하위 서열은 50, 40, 30, 20, 15, 10, 9, 8, 7, 6, 5, 4, 3, 2 또는 1개 미만의 염기쌍만큼 상이한 적어도 250개 염기쌍 길이를 갖는다(예컨대, 상기 2개의 하위 서열은 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95% 유사성, 적어도 97% 유사성, 적어도 98 % 유사성, 적어도 99% 유사성 또는 적어도 99.5% 유사성을 가짐). 특정 예에서, 예컨대 본원에 개시된, 각각의 하위서열은 60, 50, 40, 30, 20, 15, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 미만의 염기쌍만큼 상이한 적어도 300개 염기쌍 길이를 갖는다(예컨대, 상기 2개의 하위 서열은 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95% 유사성, 적어도 97% 유사성, 적어도 98% 유사성, 적어도 99% 유사성 또는 적어도 99.5% 유사성을 가짐). 특정 예에서, 예컨대 본원에 개시된, 각각의 하위서열은 100, 60, 50, 40, 30, 20, 15, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 미만의 염기쌍만큼 상이한 적어도 500개 염기쌍 길이를 갖는다(예를 들어, 상기 2개의 하위 서열은 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95% 유사성, 적어도 97% 유사성, 적어도 98% 유사성, 적어도 99% 유사성 또는 적어도 99.5% 유사성을 가짐). 특정 예에서, 예컨대 본원에 개시된, 각각의 하위서열은 200, 100, 60, 50, 40, 30, 20, 15, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 미만의 염기쌍만큼 상이한 적어도 1000개 염기쌍의 길이를 갖는다(예를 들어, 상기 2개의 하위 서열은 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95% 유사성, 적어도 97 % 유사성, 적어도 98% 유사성, 적어도 99% 유사성 또는 적어도 99.5% 유사성을 가짐). 특정 예에서, 예컨대 본원에 개시된, DNA의 2개 영역 중 제1 영역의 하위서열은 DNA의 상기 2개 영역의 제2 영역 전체를 포함할 수 있다(또는 그 반대)(예컨대, 공통 하위 서열은 하나 또는 두 영역 전체를 포함할 수 있음).
예방하다(prevent) 또는 예방(prevention): 질환, 장애 또는 병태의 발생과 관련하여 본 명세서에 사용된 용어 "예방하다(prevent)" 및 "예방(prevention)"은 질환, 장애 또는 병태가 발생할 위험을 감소시키는 것; 질환, 장애 또는 병태의 발병 지연; 질환, 장애 또는 병태의 하나 이상의 특성 또는 증상의 발병 지연; 및/또는 질환, 장애 또는 병태의 하나 이상의 특징 또는 증상의 빈도 및/또는 중증도를 감소시키는 것을 지칭한다. 예방은 특정 대상체에서의 예방 또는 대상체 개체군에 대한 통계적 영향을 의미할 수 있다.
질환, 장애 또는 병태의 발병이 사전정의된 기간 동안 지연되면 예방이 완전한 것으로 간주될 수 있다.
프로브: 본 명세서에 사용된 용어 "프로브"는 상보적 표적과 혼성화할 수 있고 검출가능한 모이어티를 포함하는 단일 가닥 또는 이중 가닥 핵산 분자를 의미한다. 특정 구현예에서, 예컨대 본원에 개시된, 프로브는 제한효소 절단 생성물이거나 합성적으로 생성된 핵산, 예를 들어 재조합 또는 증폭에 의해 생성된 핵산이다. 일부 예에서, 예컨대 본원에 개시된, 프로브는 유전자 서열과 같은 표적 서열의 검출, 식별 및/또는 단리에 유용한 포획 프로브이다. 다양한 예에서, 예컨대 본원에 개시된, 프로브의 검출가능한 모이어티는 예를 들어 효소(예컨대, ELISA는 물론 효소 기반 조직화학적 검정), 형광 모이어티, 방사성 모이어티, 또는 발광 신호와 관련된 모이어티일 수 있다.
예후: 본 명세서에서 사용되는 용어 "예후"는 적어도 하나의 가능한 미래 결과 또는 사건의 양적 확률의 정성적 판단을 지칭한다. 본 명세서에 사용되는, 예후는 대상체의 암과 같은 질환, 장애 또는 병태의 가능한 경과의 판단, 대상체의 기대 수명에 관한 판단, 또는 요법 예를 들어, 특정 요법에 대한 반응에 관한 판단일 수 있다.
예후 정보: 여기에서 사용된 용어 "예후 정보"는 예후를 제공하는 데 유용한 정보를 의미한다. 예후 정보는 바이오마커 상태 정보를 포함할 수 있으나 이에 제한되지 않는다.
프로모터: 본원에 사용된 "프로모터"는 RNA 중합효소와 직접 또는 간접적으로(예컨대, 프로모터-결합 단백질 또는 물질을 통해) 회합하고 코딩 서열의 전사 개시에 참여하는 DNA 조절 영역을 지칭할 수 있다.
기준(reference): 여기에 사용된 바와 같이 비교가 수행되는 표준 또는 대조군을 설명한다. 예를 들어, 일부 구현예에서, 예컨대 본원에 개시된, 제제, 대상체, 동물, 개체, 개체군, 샘플, 서열, 또는 관심 값은 기준 또는 대조군 제제, 대상체, 동물, 개체, 개체군, 샘플, 서열 또는 값과 비교된다. 일부 구현예에서, 예컨대 본원에 개시된, 기준 또는 그의 특성은 관심 샘플에서 특성의 시험 또는 결정과 실질적으로 동시에 시험 및/또는 결정된다. 일부 실시예에서, 예컨대 본원에 개시된, 기준은, 선택적으로 유형 매체에서 구현된, 실제적(historical) 기준이다. 일반적으로, 당업자가 이해하는 바와 같이, 기준은 예를 들어 샘플과 관련하여, 평가 중인 것들에 필적하는 조건 또는 상황에서 결정되거나 특성화된다. 당업자는 특정 가능한 기준 또는 대조군에 대한 의존 및/또는 비교를 정당화하기에 충분한 유사성이 존재하는 경우를 이해할 것이다.
위험: 질환, 장애 또는 병태와 관련하여 본 명세서에서 사용되는 용어 "위험"은 특정 개체가 질환, 장애 또는 병태를 발병할 정량적 확률(백분율로 표현되든 그렇지 않든)의 정성적 의미를 나타낸다. 일부 구현예에서, 예컨대 본원에 개시된, 위험은 백분율로 표현된다. 일부 구현예에서, 예컨대 본원에 개시된, 위험은 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 30, 40, 50, 60, 70, 80, 90 또는 100% 이상인 정량적 확률의 정성적 의미이다. 일부 구현예에서, 예컨대 본원에 개시된, 위험은 기준 위험 또는 수준 또는 기준에 기인한 동일한 결과의 위험에 대한 정량적 위험 수준의 정성적 의미로 표현된다. 일부 구현예에서, 예컨대 본원에 개시된, 상대 위험은 기준 샘플과 비교하여 1.1, 1.2, 1.3, 1.4, 1.5, 1.6, 1.7, 1.8, 1.9, 2, 3, 4, 5, 6, 7, 8, 9, 10 또는 그 이상 의 인자만큼 증가 또는 감소된다.
샘플: 여기에서 사용된 용어 "샘플"은 일반적으로 관심 공급원에서 얻거나 파생된 물질의 분취량을 나타낸다. 일부 구현예에서, 예컨대 본원에 개시된, 관심 공급원은 생물학적 또는 환경적 공급원이다. 일부 구현예에서, 예컨대 본원에 개시된, 샘플은 관심 공급원로부터 직접 얻은 "1차 샘플"이다. 일부 구현예에서, 예컨대 본원에 개시된, 문맥으로부터 명백해지는 바와 같이, 용어 "샘플"은 1차 샘플의 가공에 의해(예컨대, 1차 샘플의 하나 이상의 성분을 제거하거나 및/또는 1차 샘플에 하나 이상의 제제를 첨가하여) 얻어지는 제조물을 지칭한다. 이러한 "가공된 샘플"은 예를 들어 샘플에서 추출되거나 핵산의 증폭 또는 역전사, 특정 구성요소의 단리 및/또는 정제 등과 같은 기술을 1차 샘플에 적용하여 얻은 세포, 핵산 또는 단백질을 포함할 수 있다.
특정 예에서, 예컨대 본원에 개시된, 가공된 샘플은 증폭된(예: 사전증폭된) DNA 샘플일 수 있다. 따라서 다양한 에에서, 예컨대 본원에 개시된, 식별된 샘플은 샘플의 1차 형태 또는 샘플의 가공된 형태를 의미할 수 있다. 일부 예에서, 예컨대 본원에 개시된, 효소-절단된 DNA인 샘플은 1차 효소-절단된 DNA(효소 절단의 즉각적 생성물), 또는 추가 가공된 샘플 예컨대 증폭 단계(예컨대, 중간 증폭 단계, 예를 들어 사전 증폭) 및/또는 여과 단계, 정제 단계, 또는 추가 단계, 예컨대 메틸화 상태(예: DNA 1차 샘플 및/또는 본래 공급원 컨텍스트에 존재하는 대로의 DNA의 메틸화 상태)를 결정하는 과정을 용이하게 하기 위하여 샘플을 수정하는 단계를 거친 효소-절단된 DNA를 지칭할 수 있다.
스크리닝: 본 명세서에서 사용되는 용어 "스크리닝"은 진단 정보 및/또는 예후 정보를 생성하기 위한 임의의 방법, 기술, 프로세스 또는 작업을 의미한다. 따라서, 당업자는 스크리닝이라는 용어가 개체가 질환, 장애 또는 병태, 예컨대, 대장암을 갖고 있거나, 가질 가능성이 있거나 발병할 가능성이 있거나, 발병할 위험이 있는지 여부를 결정하는 방법, 기술, 과정 또는 사업을 포함한다는 것을 이해할 것이다.
특이도: 본 명세서에 사용된, 바이오마커의 "특이도"는 관심 사건 또는 상태의 부재를 특징으로 하는 샘플의 바이오마커의 측정이 관심 사건 또는 관심 상태의 부재를 정확하게 나타내는 백분율을 지칭한다(진음성 비율). 다양한 구현예에서, 예컨대 본원에 개시된, 음성 샘플의 특성화는 바이오마커와 무관하며, 임의의 관련 측정, 예를 들어, 당업자에게 공지된 임의의 관련 측정에 의해 달성될 수 있다. 따라서, 특이도는 해당 관심 사건 또는 관심 상태를 특성화되지 않은 샘플에서 측정할 때 바이오마커가 해당 이벤트 또는 관심 상태의 부재를 검출할 확률을 반영한다. 관심 사건 또는 상태가 대장암인 특정 구현예에서, 예컨대 본원에 개시된, 특이도는 바이오마커가 대장암이 결여된 대상체에서 대장암의 부재를 검출할 확률을 지칭한다. 대장암의 결여는 예를 들어 조직학에 의해 결정될 수 있다.
민감도: 본원에 사용된 바와 같이, 바이오마커의 "민감도"는 관심 사건 또는 상태의 존재를 특징으로 하는 샘플의 바이오마커의 측정이 관심 사건 또는 관심 상태의 존재를 정확하게 나타내는 백분율을 지칭한다(진양성 비율). 다양한 구현예에서, 예컨대 본원에 개시된, 양성 샘플의 특성화는 바이오마커와 무관하며, 임의의 관련 측정, 예를 들어, 당업자에게 공지된 임의의 관련 측정에 의해 달성될 수 있다. 따라서 민감도는 해당 관심 사건 또는 관심 상태의 존재를 특징으로 하는 샘플에서 측정할 때 바이오마커가 해당 이벤트 또는 관심 상태의 존재를 검출할 확률을 반영한다. 관심 사건 또는 상태가 대장암인 특정 구현예에서, 예컨대 본원에 개시된, 민감도는 바이오마커가 대장암이 있는 대상체에서 대장암의 존재를 검출할 확률을 지칭한다. 대장암의 존재는 예를 들어 조직학에 의해 결정될 수 있다.
고형 종양: 본 명세서에 사용된 용어 "고형 종양"은 암세포를 포함하는 조직의 비정상 덩어리를 지칭한다. 다양한 구현예에서, 예컨대 본원에 개시된, 고형 종양은 낭종 또는 액체 영역을 포함하지 않는 비정상적 조직 덩어리이거나 이를 포함한다. 일부 구현예에서, 고형 종양은 양성일 수 있고; 일부 구현예에서, 예컨대 본원에 개시된, 고형 종양은 악성일 수 있다. 고형 종양의 예로는 암종, 림프종 및 육종이 있다. 일부 구현예에서, 예컨대 본원에 개시된, 고형 종양은 부신, 담관, 방광, 뼈, 뇌, 유방, 자궁경부, 결장, 자궁내막, 식도, 눈, 담낭, 위장관, 신장, 후두, 간, 폐, 비강, 비인두, 구강, 난소, 음경, 뇌하수체, 전립선, 망막, 침샘, 피부, 소장, 위, 고환, 흉선, 갑상선, 자궁, 질 및/또는 외음부 종양이거나 이를 포함할 수 있다.
암의 병기: 본 명세서에 사용된 용어 "암의 병기"는 암 진행 수준의 정성적 또는 정량적 평가를 지칭한다. 일부 구현예에서, 예컨대 본원에 개시된, 암의 병기를 결정하기 위해 사용되는 기준은 암이 신체 내 어디에 위치하는 지, 종양 크기, 암이 림프절로 퍼졌는지 여부, 암이 신체의 하나 이상의 부분에 퍼졌는지 여부 등 중 하나 이상을 포함할 수 있으나, 이에 제한되지 않는다. 일부 구현예에서, 예컨대 본원에 개시된, TNM 시스템을 사용하여 암을 병기화할 수 있으며, 이에 따르면 T는 일반적으로 원발성 종양이라 불리는 주요 종양의 크기 및 범위를 나타내고; N은 암을 가지는 주변 림프절의 수를 나타내고; M은 암이 전이되었는지 여부를 나타낸다. 일부 구현예에서, 예컨대 본원에 개시된, 암은 병기 0(비정상 세포가 존재하지만 주변 조직으로 퍼지지 않은, 제자리 암종(carcinoma in situ) 또는 CIS라고도 하며; CIS는 암이 아니지만 암이 될 수 있음), 병기 l- llll(암이 존재함, 숫자가 높을수록 종양이 더 크고 주변 조직으로 더 많이 퍼짐) 또는 병기 IV(암이 신체의 먼 부분까지 퍼짐). 일부 구현예에서, 예컨대 본원에 개시된, 암은 하기로 이루어진 군에서 선택된 병기에 배정될 수 있다: 제자리(in situ, 비정상 세포가 존재하지만 주변 조직으로 퍼지지 않음); 국한(localized, 암이 퍼졌다는 징후 없이 시작된 곳에 국한됨); 국소(regional, 암이 가까운 림프절, 조직 또는 장기로 퍼짐): 원격(distant, 암이 신체의 먼 부분으로 퍼짐); 알 수 없음(unknown, 암 단계를 식별하기 위한 정보가 충분하지 않음).
취약한: 질환, 장애 또는 병태에 "취약한(subsceptible to)"이 있는 개체는 질환, 장애 또는 병태가 발병할 위험이 있는 것이다. 일부 구현예에서, 예컨대 본원에 개시된, 질환, 장애 또는 병태에 취약한 개체는 질환, 장애 또는 병태의 어떠한 증상도 나타내지 않는다. 일부 구현예에서, 예컨대 본원에 개시된, 질환, 장애 또는 병태에 취약한 개체는 질환, 장애 및/또는 병태로 진단되지 않았다. 일부 구현예에서, 예컨대 본원에 개시된, 질환, 장애 또는 병태에 취약한 개체는 질환, 장애 또는 병태의 발병과 관련된 상태에 노출되었거나 이와 관련된 바이오마커 상태(예: 메틸화 상태)를 나타내는 개체이다. 일부 구현예에서, 예컨대 본원에 개시된, 질환, 장애, 및/또는 병태가 발병할 위험은 개체군 기반 위험(예컨대, 질환, 장애 또는 병태를 앓고 있는 개체의 가족 구성원)이다.
대상체: 본원에서 사용된 용어 "대상체"는 유기체, 일반적으로 포유동물(예컨대, 인간)을 의미한다. 일부 구현예에서, 예컨대 본원에 개시된, 대상체는 질환, 장애 또는 병태를 앓고 있다. 일부 구현예에서, 예컨대 본원에 개시된, 대상체는 질환, 장애 또는 병태에 취약하다. 일부 구현예에서, 예컨대 본원에 개시된, 대상체는 질환, 장애 또는 병태의 하나 이상의 증상 또는 특징을 나타낸다. 일부 구현예에서, 예컨대 본원에 개시된, 대상체는 질환, 장애 또는 병태를 앓지 않는다. 일부 구현예에서, 예컨대 본원에 개시된, 대상체는 질환, 장애 또는 병태의 어떠한 증상 또는 특징도 나타내지 않는다. 일부 구현예에서, 예컨대 본원에 개시된, 대상체는 질환, 장애 또는 병태에 대한 취약성 또는 위험의 특징인 하나 이상의 특징을 갖는 사람이다. 일부 구현예에서, 예컨대 본원에 개시된, 대상체는 환자이다. 일부 구현예에서, 예컨대 본원에 개시된, 대상체는 진단이 수행되고/되거나 요법이 투여된 개체이다. 일부 예에서, 예컨대 본원에 개시된, 인간 대상체는 "개체"과 상호교환적으로 지칭할 수 있다.
치료제: 본 명세서에 사용된 용어 "치료제(therapeutic agent)” 대상체에 투여될 때 원하는 약리학적 효과를 유도하는 임의의 제제를 지칭한다. 일부 구현예에서, 예컨대 본원에 개시된, 제제는 적절한 개체군에 걸쳐 통계적으로 유의한 효과를 나타내는 경우 치료제로 간주된다. 일부 구현예에서, 예컨대 본원에 개시된, 적절한 개체군은 모델 유기체의 개체군 또는 인간 개체군일 수 있다. 일부 구현예에서, 예컨대 본원에 개시된, 적절한 개체군은 특정 연령 그룹, 성별, 유전적 배경, 기존 임상 병태 등과 같은 다양한 기준에 의해 정의될 수 있다. 일부 구현예에서, 예컨대 본원에 개시된, 치료제는 질환, 장애 또는 병태의 치료에 사용될 수 있는 물질이다. 일부 구현예에서, 예컨대 본원에 개시된, 치료제는 인간에게 투여하기 위해 시판되기 전에 정부 기관에 의해 승인되었거나 승인을 받아야 하는 제제이다. 일부 구현예에서, 예컨대 본원에 개시된, 치료제는 인간에게 투여하기 위해 의학적 처방이 필요한 제제이다.
치료: 본 명세서에 사용된 용어 "치료"(또한 "치료하다" 또는 "치료하는")는 하나 이상의 증상, 특징의 발병 및/또는 특정 질환, 장애, 또는 병태의 유발을 부분적으로 또는 완전히 경감, 개선, 완화, 억제, 발현 지연, 중증도 감소, 및/또는 감소시키거나, 이러한 임의의 결과를 달성할 목적으로 투여되는, 요법의 투여를 지칭한다. 일부 구현예에서, 예컨대 본원에 개시된, 이러한 치료는 관련 질환, 장애 또는 병태의 징후를 나타내지 않는 대상체 및/또는 질환, 장애 또는 병태의 초기 징후만을 나타내는 대상체의 치료일 수 있다. 대안적으로 또는 추가로, 이러한 치료는 관련 질환, 장애 및/또는 병태의 하나 이상의 확립된 징후를 나타내는 대상체의 치료일 수 있다. 일부 구현예에서, 예컨대 본원에 개시된, 치료는 관련 질환, 장애 및/또는 병태를 앓고 있는 것으로 진단된 대상체의 치료일 수 있다. 일부 구현예에서, 예컨대 본원에 개시된, 치료는 관련 질환, 장애 또는 병태의 발병 위험 증가와 통계적으로 상관관계가 있는 하나 이상의 취약성 인자를 갖는 것으로 공지된 대상체의 치료일 수 있다. 다양한 예에서, 치료는 암의 치료이다.
상류: 본 명세서에 사용된 용어 "상류"는 제1 DNA 영역이 제2 DNA 영역에 비해 제1 DNA 영역 및 제2 DNA 영역을 포함하는 핵산의 N-말단에 더 가깝다는 것을 의미한다.
메틸화되지 않은: 본 명세서에 사용된 용어 "메틸화되지 않은(unmethylated)" 및 "비-메틸화된(non-methylated)"은 상호교환가능하게 사용되고 확인된 DNA 영역이 메틸화된 뉴클레오티드를 포함하지 않음을 의미한다.
변이체: 본 명세서에 사용된 용어 "변이체"는 참조 개체와 상당한 구조적 동일성을 나타내지만 기준 독립체(reference entity)와 비교하여 하나 이상의 화학적 모이어티의 존재, 부재 또는 수준에서 기준 독립체와 구조적으로 다른 독립체(entity)를 의미한다. 일부 구현예에서, 예컨대 본원에 개시된, 변이체는 또한 그의 기준 독립체와 기능적으로 상이하다. 일반적으로 특정 독립체가 기준 독립체의 "변이체"으로 적절하게 고려되는지 여부는 기준 독립체와의 구조적 동일성 정도에 따라 결정된다. 변이체는 기준에 필적할 수 있지만 동일하지는 않은 분자일 수 있다. 예를 들어, 변이체 핵산은 뉴클레오티드 서열에서 하나 이상의 차이로 기준 핵산과 상이할 수 있다. 일부 구현예에서, 예컨대 본원에 개시된, 변이체 핵산은 참조 핵산과의 전체 서열 동일성이 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97% 또는 99%인 것을 나타낸다. 많은 구현예에서, 관심 핵산은 관심 핵산이 기준 핵산의 서열과 동일하지만 특정 위치에서 적은 수의 서열 변경을 갖는 경우 기준 핵산의 "변이체"로 간주된다. 일부 구현예에서, 예컨대 본원에 개시된, 변이체는 기준과 비교하여 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개의 치환된 잔기를 갖는다. 일부 구현예에서, 예컨대 본원에 개시된, 변이체는 기준과 비교하여 5, 4, 3, 2, 또는 1개 이하의 잔기 부가, 치환 또는 결실을 갖는다. 다양한 구현예에서, 예컨대 본원에 개시된, 부가, 치환 또는 결실의 수는 약 25, 약 20, 약 19, 약 18, 약 17, 약 16, 약 15, 약 14, 약 13, 약 10, 약 9, 약 8, 약 7, 약 6, 그리고 일반적으로 약 5, 약 4, 약 3 또는 약 2 미만의 잔기이다.
본 명세서의 상기 및 기타 목적, 양태, 특징 및 이점은 첨부 도면과 함께 취해진 다음의 설명을 참조함으로써 보다 명백하고 더 잘 이해될 것이며, 여기서:
도 1은 예시적 MSRE-qPCR 접근법을 보여주는 개략도이다;
도 2는 바이오마커 시그니처의 개발을 위한 컴퓨터 모델을 트레이닝하는데 사용된 166명의 대상체의 트레이닝 세트의 특성을 보여주는 표이다. 여성 대상체 수, 남성 대상체 수, 대상체의 평균 및 연령 범위. 대상체는 대장암(colorectal cancer, CRC)을 앓고 있는 것, 건강한 대조군 대상체(대조군; 과증식용종으로 진단된 환자, 비진행성 선종(non-advanced adenoma; NAA)을 갖는 것으로 진단된 환자, 및 대장 내시경 소견이 없는 환자)로 진단되었다. 도 2는 또한 대장내시경 평가에 기초하여 CRC를 앓는 이들의 암의 위치를 근위부 또는 원위부로서 구별한다;
도 3은 선택된 마커를 검증하기 위해 사용된 535명의 인간 대상체의 검증군의 특성을 나타내는 표이다. 도 3은 여성 대상체 수, 남성 대상체 수, 대상체의 평균 및 연령 범위를 제공한다. 대상체는 대장암(colorectal cancer, CRC)을 앓고 있는 것, 건강한 대조군 대상체(대조군; 과증식용종으로 진단된 환자, 비진행성 선종(non-advanced adenoma; NAA)을 갖는 것으로 진단된 환자, 및 대장 내시경 소견이 없는 환자), 및 진행성 선종(advanced adenoma; AA)를 앓는 환자로 진단되었다.
도 4는 대상체 검증 세트에 대해 수행된 초기 주성분 분석의 그래프를 나타낸다. 대상체는 3 군으로 나누어졌다: 진행성 선종(AA)을 앓고 있는 환자, 대조군 환자(CNT), 및 대장암(CRC)을 앓고 있는 환자. 대조군(CNT) 환자는 대장 내시경 소견이 없는 환자, 과형성 폴립 환자 및 비진행성 선종(NAA) 환자로 정의된다. 세 군 각각 주위에 상관 원(correlation circle)이 그려졌다.
도 5a는 535명의 대상체 군에 대한 DMR의 40개 마커 패널을 사용한 대장암 스크리닝의 성능을 나타내는 그래프이다. 검증군의 모든 대상체에 대한 ROC 및 AUC가 나타난다.
도 5b는 좌측부터 우측으로, 진행성 선종 전체 스크리닝 민감도, 대장암 전체 스크리닝 민감도, 국한(localized) 대장암 스크리닝 민감도, 진행성 대장암 스크리닝 민감도, 및 대조군 대상체(대장내시경 소견이 없는 자, 과증식용종이 있는 자, 및/또는 비진행성 선종(NAA)를 갖는 것으로 진단된 환자)의 대장암 스크리닝 특이도를 포함하는 정확도 값을 나타내는 차트이다.
도 6은 대장암(대장암 및 진행성 선종)이 있는 검증군의 대상체 및 대조군 대상체(건강한 대상체, 과증식용종 환자 및 비진행성 선종 환자)의 UDX_29_1로 식별된 영역의 MSRE-qPCR에서 의 Ct(Cycle Threshold) 값을 나타내는 그래프를 나타낸다. 데이터는 테스트에 사용된 두 번째 대상체 군(530 대상체)을 나타낸다. 표시를 위해 Ct 값을 45에서 뺀다(45-Ct). 45-Ct 값이 높을수록 더 높은 메틸화 상태에 해당하며, 대장암이 있는 대상체에서의 과메틸화를 나타낸다.
도 7은 대장암(대장암 및 진행성 선종)이 있는 검증군의 대상체 및 대조군 대상체(건강한 대상체, 과증식용종 환자 및 비진행성 선종 환자)의 UDX_272.3_2로 식별된 영역의 MSRE-qPCR에서의 Ct(Cycle Threshold) 값을 나타내는 그래프를 나타낸다. 데이터는 테스트에 사용된 두 번째 대상체 군(530 대상체)을 나타낸다. 표시를 위해 Ct 값을 45에서 뺀다(45-Ct). 45-Ct 값이 높을수록 더 높은 메틸화 상태에 해당하며, 대장암이 있는 대상체에서의 과메틸화를 나타낸다.
도 8은 대장암(대장암 및 진행성 선종)이 있는 검증군의 대상체 및 대조군 대상체(건강한 대상체, 과증식용종 환자 및 비진행성 선종 환자)의 UDX_277.7_2로 식별된 영역의 MSRE-qPCR 에서의 Ct(Cycle Threshold) 값을 나타내는 그래프를 나타낸다. 데이터는 테스트에 사용된 두 번째 대상체 군(530 대상체)을 나타낸다. 표시를 위해 Ct 값을 45에서 뺀다(45-Ct). 45-Ct 값이 높을수록 더 높은 메틸화 상태에 해당하며, 대장암이 있는 대상체에서의 과메틸화를 나타낸다.
도 9는 대장암(대장암 및 진행성 선종)이 있는 검증군의 대상체 및 대조군 대상체(건강한 대상체, 과증식용종 환자 및 비진행성 선종 환자)의 UDX_272.4로 식별된 영역의 MSRE-qPCR에서의 Ct(Cycle Threshold) 값을 나타내는 그래프를 나타낸다. 데이터는 테스트에 사용된 두 번째 대상체 군(530 대상체)을 나타낸다. 표시를 위해 Ct 값을 45에서 뺀다(45-Ct). 45-Ct 값이 높을수록 더 높은 메틸화 상태에 해당하며, 대장암이 있는 대상체에서의 과메틸화를 나타낸다.
도 10은 대장암(대장암 및 진행성 선종)이 있는 검증군의 대상체 및 대조군 대상체(건강한 대상체, 과증식용종 환자 및 비진행성 선종 환자)의 UDX_174.3으로 식별된 영역의 MSRE-qPCR에서의 Ct(Cycle Threshold) 값을 나타내는 그래프를 나타낸다. 데이터는 테스트에 사용된 두 번째 대상체 군(530 대상체)을 나타낸다. 표시를 위해 Ct 값을 45에서 뺀다(45-Ct). 45-Ct 값이 높을수록 더 높은 메틸화 상태에 해당하며, 대장암이 있는 대상체에서의 과메틸화를 나타낸다.
도 11은 대장암(대장암 및 진행성 선종)이 있는 검증군의 대상체 및 대조군 대상체(건강한 대상체, 과증식용종 환자 및 비진행성 선종 환자)의 UDX_260.2_1로 식별된 영역의 MSRE-qPCR에서의 Ct(Cycle Threshold) 값을 나타내는 그래프를 나타낸다. 데이터는 테스트에 사용된 두 번째 대상체 군(530 대상체)을 나타낸다. 표시를 위해 Ct 값을 45에서 뺀다(45-Ct). 45-Ct 값이 높을수록 더 높은 메틸화 상태에 해당하며, 대장암이 있는 대상체에서의 과메틸화를 나타낸다.
도 12는 대장암(대장암 및 진행성 선종)이 있는 검증군의 대상체 및 대조군 대상체(건강한 대상체, 과증식용종 환자 및 비진행성 선종 환자)의 UDX_260.1로 식별된 영역의 MSRE-qPCR에서의 Ct(Cycle Threshold) 값을 나타내는 그래프를 나타낸다. 데이터는 테스트에 사용된 두 번째 대상체 군(530 대상체)을 나타낸다. 표시를 위해 Ct 값을 45에서 뺀다(45-Ct). 45-Ct 값이 높을수록 더 높은 메틸화 상태에 해당하며, 대장암이 있는 대상체에서의 과메틸화를 나타낸다.
도 13은 대장암(대장암 및 진행성 선종)이 있는 검증군의 대상체 및 대조군 대상체(건강한 대상체, 과증식용종 환자 및 비진행성 선종 환자)의 UDX_137.1로 식별된 영역의 MSRE-qPCR에서의 Ct(Cycle Threshold) 값을 나타내는 그래프를 나타낸다. 데이터는 테스트에 사용된 두 번째 대상체 군(530 대상체)을 나타낸다. 표시를 위해 Ct 값을 45에서 뺀다(45-Ct). 45-Ct 값이 높을수록 더 높은 메틸화 상태에 해당하며, 대장암이 있는 대상체에서의 과메틸화를 나타낸다.
도 14는 대장암(대장암 및 진행성 선종)이 있는 검증군의 대상체 및 대조군 대상체(건강한 대상체, 과증식용종 환자 및 비진행성 선종 환자)의 UDX_17_2로 식별된 영역의 MSRE-qPCR에서의 Ct(Cycle Threshold) 값을 나타내는 그래프를 나타낸다. 데이터는 테스트에 사용된 두 번째 대상체 군(530 대상체)을 나타낸다. 표시를 위해 Ct 값을 45에서 뺀다(45-Ct). 45-Ct 값이 높을수록 더 높은 메틸화 상태에 해당하며, 대장암이 있는 대상체에서의 과메틸화를 나타낸다.
도 15는 대장암(대장암 및 진행성 선종)이 있는 검증군의 대상체 및 대조군 대상체(건강한 대상체, 과증식용종 환자 및 비진행성 선종 환자)의 UDX_230으로 식별된 영역의 MSRE-qPCR에서의 Ct(Cycle Threshold) 값을 나타내는 그래프를 나타낸다. 데이터는 테스트에 사용된 두 번째 대상체 군(530 대상체)을 나타낸다. 표시를 위해 Ct 값을 45에서 뺀다(45-Ct). 45-Ct 값이 높을수록 더 높은 메틸화 상태에 해당하며, 대장암이 있는 대상체에서의 과메틸화를 나타낸다.
도 16은 정상 세포와 암세포 사이의 메틸화 상태의 예시적 메틸화 변화를 보여주는 개략도이며, 메틸화 상태의 변화가 정상 세포와 암세포 사이의 유전자 발현 차이에 어떻게 영향을 미칠 수 있는지를 추가로 나타낸다.
도 17은 예를 들어 본 명세서에 기술된 바와 같은 특정 구현예에서 사용되는 예시적인 클라우드 컴퓨팅 환경의 블록도이다.
도 18은 예를 들어 본원에 설명된 바와 같은 특정 실시예에서 사용되는 예시적인 컴퓨팅 장치 및 예시적인 모바일 컴퓨팅 장치의 블록도이다.
본 발명의 특징 및 이점은 도면과 함께 후술하는 구체적인 내용으로부터 더욱 명백해질 것이다.
도 1은 예시적 MSRE-qPCR 접근법을 보여주는 개략도이다;
도 2는 바이오마커 시그니처의 개발을 위한 컴퓨터 모델을 트레이닝하는데 사용된 166명의 대상체의 트레이닝 세트의 특성을 보여주는 표이다. 여성 대상체 수, 남성 대상체 수, 대상체의 평균 및 연령 범위. 대상체는 대장암(colorectal cancer, CRC)을 앓고 있는 것, 건강한 대조군 대상체(대조군; 과증식용종으로 진단된 환자, 비진행성 선종(non-advanced adenoma; NAA)을 갖는 것으로 진단된 환자, 및 대장 내시경 소견이 없는 환자)로 진단되었다. 도 2는 또한 대장내시경 평가에 기초하여 CRC를 앓는 이들의 암의 위치를 근위부 또는 원위부로서 구별한다;
도 3은 선택된 마커를 검증하기 위해 사용된 535명의 인간 대상체의 검증군의 특성을 나타내는 표이다. 도 3은 여성 대상체 수, 남성 대상체 수, 대상체의 평균 및 연령 범위를 제공한다. 대상체는 대장암(colorectal cancer, CRC)을 앓고 있는 것, 건강한 대조군 대상체(대조군; 과증식용종으로 진단된 환자, 비진행성 선종(non-advanced adenoma; NAA)을 갖는 것으로 진단된 환자, 및 대장 내시경 소견이 없는 환자), 및 진행성 선종(advanced adenoma; AA)를 앓는 환자로 진단되었다.
도 4는 대상체 검증 세트에 대해 수행된 초기 주성분 분석의 그래프를 나타낸다. 대상체는 3 군으로 나누어졌다: 진행성 선종(AA)을 앓고 있는 환자, 대조군 환자(CNT), 및 대장암(CRC)을 앓고 있는 환자. 대조군(CNT) 환자는 대장 내시경 소견이 없는 환자, 과형성 폴립 환자 및 비진행성 선종(NAA) 환자로 정의된다. 세 군 각각 주위에 상관 원(correlation circle)이 그려졌다.
도 5a는 535명의 대상체 군에 대한 DMR의 40개 마커 패널을 사용한 대장암 스크리닝의 성능을 나타내는 그래프이다. 검증군의 모든 대상체에 대한 ROC 및 AUC가 나타난다.
도 5b는 좌측부터 우측으로, 진행성 선종 전체 스크리닝 민감도, 대장암 전체 스크리닝 민감도, 국한(localized) 대장암 스크리닝 민감도, 진행성 대장암 스크리닝 민감도, 및 대조군 대상체(대장내시경 소견이 없는 자, 과증식용종이 있는 자, 및/또는 비진행성 선종(NAA)를 갖는 것으로 진단된 환자)의 대장암 스크리닝 특이도를 포함하는 정확도 값을 나타내는 차트이다.
도 6은 대장암(대장암 및 진행성 선종)이 있는 검증군의 대상체 및 대조군 대상체(건강한 대상체, 과증식용종 환자 및 비진행성 선종 환자)의 UDX_29_1로 식별된 영역의 MSRE-qPCR에서 의 Ct(Cycle Threshold) 값을 나타내는 그래프를 나타낸다. 데이터는 테스트에 사용된 두 번째 대상체 군(530 대상체)을 나타낸다. 표시를 위해 Ct 값을 45에서 뺀다(45-Ct). 45-Ct 값이 높을수록 더 높은 메틸화 상태에 해당하며, 대장암이 있는 대상체에서의 과메틸화를 나타낸다.
도 7은 대장암(대장암 및 진행성 선종)이 있는 검증군의 대상체 및 대조군 대상체(건강한 대상체, 과증식용종 환자 및 비진행성 선종 환자)의 UDX_272.3_2로 식별된 영역의 MSRE-qPCR에서의 Ct(Cycle Threshold) 값을 나타내는 그래프를 나타낸다. 데이터는 테스트에 사용된 두 번째 대상체 군(530 대상체)을 나타낸다. 표시를 위해 Ct 값을 45에서 뺀다(45-Ct). 45-Ct 값이 높을수록 더 높은 메틸화 상태에 해당하며, 대장암이 있는 대상체에서의 과메틸화를 나타낸다.
도 8은 대장암(대장암 및 진행성 선종)이 있는 검증군의 대상체 및 대조군 대상체(건강한 대상체, 과증식용종 환자 및 비진행성 선종 환자)의 UDX_277.7_2로 식별된 영역의 MSRE-qPCR 에서의 Ct(Cycle Threshold) 값을 나타내는 그래프를 나타낸다. 데이터는 테스트에 사용된 두 번째 대상체 군(530 대상체)을 나타낸다. 표시를 위해 Ct 값을 45에서 뺀다(45-Ct). 45-Ct 값이 높을수록 더 높은 메틸화 상태에 해당하며, 대장암이 있는 대상체에서의 과메틸화를 나타낸다.
도 9는 대장암(대장암 및 진행성 선종)이 있는 검증군의 대상체 및 대조군 대상체(건강한 대상체, 과증식용종 환자 및 비진행성 선종 환자)의 UDX_272.4로 식별된 영역의 MSRE-qPCR에서의 Ct(Cycle Threshold) 값을 나타내는 그래프를 나타낸다. 데이터는 테스트에 사용된 두 번째 대상체 군(530 대상체)을 나타낸다. 표시를 위해 Ct 값을 45에서 뺀다(45-Ct). 45-Ct 값이 높을수록 더 높은 메틸화 상태에 해당하며, 대장암이 있는 대상체에서의 과메틸화를 나타낸다.
도 10은 대장암(대장암 및 진행성 선종)이 있는 검증군의 대상체 및 대조군 대상체(건강한 대상체, 과증식용종 환자 및 비진행성 선종 환자)의 UDX_174.3으로 식별된 영역의 MSRE-qPCR에서의 Ct(Cycle Threshold) 값을 나타내는 그래프를 나타낸다. 데이터는 테스트에 사용된 두 번째 대상체 군(530 대상체)을 나타낸다. 표시를 위해 Ct 값을 45에서 뺀다(45-Ct). 45-Ct 값이 높을수록 더 높은 메틸화 상태에 해당하며, 대장암이 있는 대상체에서의 과메틸화를 나타낸다.
도 11은 대장암(대장암 및 진행성 선종)이 있는 검증군의 대상체 및 대조군 대상체(건강한 대상체, 과증식용종 환자 및 비진행성 선종 환자)의 UDX_260.2_1로 식별된 영역의 MSRE-qPCR에서의 Ct(Cycle Threshold) 값을 나타내는 그래프를 나타낸다. 데이터는 테스트에 사용된 두 번째 대상체 군(530 대상체)을 나타낸다. 표시를 위해 Ct 값을 45에서 뺀다(45-Ct). 45-Ct 값이 높을수록 더 높은 메틸화 상태에 해당하며, 대장암이 있는 대상체에서의 과메틸화를 나타낸다.
도 12는 대장암(대장암 및 진행성 선종)이 있는 검증군의 대상체 및 대조군 대상체(건강한 대상체, 과증식용종 환자 및 비진행성 선종 환자)의 UDX_260.1로 식별된 영역의 MSRE-qPCR에서의 Ct(Cycle Threshold) 값을 나타내는 그래프를 나타낸다. 데이터는 테스트에 사용된 두 번째 대상체 군(530 대상체)을 나타낸다. 표시를 위해 Ct 값을 45에서 뺀다(45-Ct). 45-Ct 값이 높을수록 더 높은 메틸화 상태에 해당하며, 대장암이 있는 대상체에서의 과메틸화를 나타낸다.
도 13은 대장암(대장암 및 진행성 선종)이 있는 검증군의 대상체 및 대조군 대상체(건강한 대상체, 과증식용종 환자 및 비진행성 선종 환자)의 UDX_137.1로 식별된 영역의 MSRE-qPCR에서의 Ct(Cycle Threshold) 값을 나타내는 그래프를 나타낸다. 데이터는 테스트에 사용된 두 번째 대상체 군(530 대상체)을 나타낸다. 표시를 위해 Ct 값을 45에서 뺀다(45-Ct). 45-Ct 값이 높을수록 더 높은 메틸화 상태에 해당하며, 대장암이 있는 대상체에서의 과메틸화를 나타낸다.
도 14는 대장암(대장암 및 진행성 선종)이 있는 검증군의 대상체 및 대조군 대상체(건강한 대상체, 과증식용종 환자 및 비진행성 선종 환자)의 UDX_17_2로 식별된 영역의 MSRE-qPCR에서의 Ct(Cycle Threshold) 값을 나타내는 그래프를 나타낸다. 데이터는 테스트에 사용된 두 번째 대상체 군(530 대상체)을 나타낸다. 표시를 위해 Ct 값을 45에서 뺀다(45-Ct). 45-Ct 값이 높을수록 더 높은 메틸화 상태에 해당하며, 대장암이 있는 대상체에서의 과메틸화를 나타낸다.
도 15는 대장암(대장암 및 진행성 선종)이 있는 검증군의 대상체 및 대조군 대상체(건강한 대상체, 과증식용종 환자 및 비진행성 선종 환자)의 UDX_230으로 식별된 영역의 MSRE-qPCR에서의 Ct(Cycle Threshold) 값을 나타내는 그래프를 나타낸다. 데이터는 테스트에 사용된 두 번째 대상체 군(530 대상체)을 나타낸다. 표시를 위해 Ct 값을 45에서 뺀다(45-Ct). 45-Ct 값이 높을수록 더 높은 메틸화 상태에 해당하며, 대장암이 있는 대상체에서의 과메틸화를 나타낸다.
도 16은 정상 세포와 암세포 사이의 메틸화 상태의 예시적 메틸화 변화를 보여주는 개략도이며, 메틸화 상태의 변화가 정상 세포와 암세포 사이의 유전자 발현 차이에 어떻게 영향을 미칠 수 있는지를 추가로 나타낸다.
도 17은 예를 들어 본 명세서에 기술된 바와 같은 특정 구현예에서 사용되는 예시적인 클라우드 컴퓨팅 환경의 블록도이다.
도 18은 예를 들어 본원에 설명된 바와 같은 특정 실시예에서 사용되는 예시적인 컴퓨팅 장치 및 예시적인 모바일 컴퓨팅 장치의 블록도이다.
본 발명의 특징 및 이점은 도면과 함께 후술하는 구체적인 내용으로부터 더욱 명백해질 것이다.
청구된 발명의 시스템, 아키텍처, 장치, 방법 및 프로세스는 본원에 설명된 실시예로부터의 정보를 사용하여 개발된 변형 및 개조를 포함하는 것으로 고려된다. 본원에 설명된 시스템, 아키텍처, 장치, 방법 및 프로세스의 개조 및/또는 수정은 본 기재에 의해 고려되는 바와 같이 수행될 수 있다.
기재 전반에 걸쳐, 물품, 장치, 시스템 및 아키텍처가 특정 구성 요소를 갖거나 함유하거나 포함하는 것으로 설명되거나 프로세스 및 방법이 특정 단계를 함유하거나 포함하는 것으로 설명되는 경우 추가적으로, 언급된 구성요소로 본질적으로 구성되거나, 구성되는 본 발명의 물품, 장치, 시스템 및 아키텍처가 있는 것으로 고려되며, 언급된 프로세싱 단계로 본질적으로 구성되거나, 구성되는 본 발명에 따른 프로세스 및 방법이 있음을 의미한다.
단계의 순서 또는 특정 동작을 수행하기 위한 순서는 본 발명이 작동 가능한 상태로 유지되는 한 중요하지 않음을 이해해야 한다. 또한, 2개 이상의 단계 또는 동작이 동시에 수행될 수 있다.
예를 들어 배경기술 섹션에서 임의의 간행물에 대한 본원의 언급은 간행물이 본원에 제시된 청구범위와 관련하여 선행 기술의 역할을 한다는 것을 인정하는 것이 아니다. 배경기술 섹션은 명료함을 위해 제공되며 청구범위에 대한 선행 기술의 기재를 의미하지 않는다.
문헌은 언급된 대로 본원에 참조로서 포함된다. 특정 용어의 의미에 불일치가 있는 경우 상기 정의 섹션에 제시된 의미가 우선한다.
헤더는 독자의 편의를 위해 제공되며 - 헤더의 존재 및/또는 배치는 본원에 설명된 주제의 범위를 제한하지 않는다.
대장암 스크리닝
초기 대장암을 위한 스크리닝을 포함하는 대장암 및/또는 진행성 선종 스크리닝의 개선된 방법이 필요하다. 예를 들어, 50세 이상의 개체에 대한 검진에 대한 권장 사항에도 불구하고 대장암 검진 프로그램은 종종 효과가 없거나 불만족스럽다. 개선된 대장암 및/또는 진행성 선종 검진은 진단을 개선하고 대장암 사망률을 감소시킨다.
DNA 메틸화(예컨대, 메틸화 또는 저메틸화)는 암 발달에 영향을 미치는 유전자를 포함하여 유전자를 활성화하거나 비활성화할 수 있다(예컨대, 도 16 참조). 따라서, 예를 들어, 과메틸화는 일반적으로 암을 억제하는 작용을 하여 샘플 또는 대상체에서 암 발병을 유발하거나 이에 기여하는 하나 이상의 유전자를 비활성화할 수 있다.
본원은 본원에 제공된 하나 이상의 메틸화 좌위의 메틸화 상태, 및/또는 본원에 제공된 하나 이상의 DMR의 메틸화 상태, 및/또는 본원에 제공된 하나 이상의 메틸화 부위의 메틸화 상태, 예를 들어, 높은 수준의 민감도 및/또는 특이도로 대장암 및/또는 진행성 선종에 대한 스크리닝을 제공한다. 본원은 개별적으로 또는 둘 이상의 바이오마커를 포함하는 다양한 패널(panel)에서, 예를 들어 높은 정도의 특이도 및/또는 민감도로 대장암 및/또는 진행성 선종의 스크리닝을 제공하는 대장암 메틸화 바이오마커를 포함하거나 이에 관련된 조성물 및 방법을 제공한다.
다양한 구현예에서, 예를 들어, 본원에 기재된 바와 같이, 본원의 대장암 및/또는 진행성 선종 메틸화 바이오마커는 하기 표 1에서 식별된 차등적 메틸화 영역(DMR)의 서열의 일부(예컨대, 적어도 1 공통 염기쌍)이거나 이를 포함하는 메틸화 좌위로부터 선택된다. DMR은 DMR이 위치한 염색체 번호(Chr. No.), 염색체 상의 DMR의 시작 위치(시작 염기쌍), 염색체 상의 DMR의 종료 위치, DMRdml 폭, DMR과 중첩되거나 DMR 내에 포함된 하나 이상의 유전자(사용 가능한 경우)의 주석된(annotated) 명칭, 명세서의 서열 섹션 및 제시된 서열 목록에 표시된 DMR의 서열 ID 번호에 의해 식별된다. 식별된 영역의 염색체 번호와 시작(시작 염기쌍) 및 종료(종료 염기쌍) 위치는 GRCh38로 식별된 인간 게놈 빌드를 참조로 한다.
표 1. 진행성 선종 및 대장암 스크리닝에 대한 69개의 관심 DMR 목록. | |||||
SEQ ID NO | Chr. | 시작 염기쌍 |
종료 염기쌍 |
영역 길이 |
주석된 유전자명 |
SEQ ID NO: 1 | 1 | 18636183 | 18636479 | 297 | PAX7 |
SEQ ID NO: 2 | 1 | 107140100 | 107140341 | 242 | NTNG1 |
SEQ ID NO: 3 | 1 | 114153175 | 114153431 | 257 | SYT6 |
SEQ ID NO: 4 | 2 | 5673847 | 5674110 | 264 | LINC01248 |
SEQ ID NO: 5 | 2 | 26692974 | 26693164 | 191 | KCNK3 |
SEQ ID NO: 6 | 2 | 31136994 | 31138312 | 1319 | GALNT14 |
SEQ ID NO: 7 | 2 | 100416598 | 100417320 | 723 | CHST10 |
SEQ ID NO: 8 | 2 | 127025668 | 127025992 | 325 | 주석 없음 |
SEQ ID NO: 9 | 2 | 136765863 | 136767257 | 1395 | THSD7B |
SEQ ID NO: 10 | 2 | 209771521 | 209771717 | 197 | UNC80 |
SEQ ID NO: 11 | 3 | 96812527 | 96814374 | 1848 | EPHA6 |
SEQ ID NO: 12 | 3 | 151086702 | 151087381 | 680 | MED12L |
SEQ ID NO: 13 | 4 | 61201658 | 61202419 | 762 | ADGRL3 |
SEQ ID NO: 14 | 4 | 141133100 | 141133759 | 660 | RNF150 |
SEQ ID NO: 15 | 4 | 167233855 | 167235112 | 1258 | SPOCK3 |
SEQ ID NO: 16 | 4 | 176001298 | 176001937 | 640 | GPM6A |
SEQ ID NO: 17 | 4 | 185020150 | 185020721 | 572 | HELT |
SEQ ID NO: 18 | 5 | 180353742 | 180353989 | 248 | GFPT2 |
SEQ ID NO: 19 | 6 | 31815502 | 31815783 | 282 | HSPA1L, HSPA1A |
SEQ ID NO: 20 | 6 | 123803543 | 123804573 | 1031 | NKAIN2 |
SEQ ID NO: 21 | 7 | 141072216 | 141073010 | 795 | TMEM178B |
SEQ ID NO: 22 | 7 | 154304773 | 154304932 | 160 | DPP6 |
SEQ ID NO: 23 | 8 | 17026468 | 17027021 | 554 | MICU3 |
SEQ ID NO: 24 | 8 | 52564399 | 52566130 | 1732 | ALKAL1 |
SEQ ID NO: 25 | 8 | 64581458 | 64581984 | 527 | LOC401463, BHLHE22 |
SEQ ID NO: 26 | 8 | 103500115 | 103500325 | 211 | RIMS2, LOC105375690, SLC25A32 |
SEQ ID NO: 27 | 9 | 843218 | 843532 | 315 | DMRT1 |
SEQ ID NO: 28 | 9 | 21970988 | 21971129 | 142 | CDKN2A, CDKN2B-AS1 |
SEQ ID NO: 29 | 9 | 36986363 | 36986579 | 217 | PAX5 |
SEQ ID NO: 30 | 10 | 16520584 | 16520645 | 62 | C1QL3 |
SEQ ID NO: 31 | 10 | 25933862 | 25934167 | 306 | MYO3A, LOC101929073 |
SEQ ID NO: 32 | 10 | 26211596 | 26212313 | 718 | GAD2, MYO3A |
SEQ ID NO: 33 | 10 | 127736443 | 127736756 | 314 | FOXI2 |
SEQ ID NO: 34 | 11 | 94740674 | 94742025 | 1352 | LOC105369438, AMOTL1 |
SEQ ID NO: 35 | 11 | 112962067 | 112962734 | 668 | LOC101928847, NCAM1 |
SEQ ID NO: 36 | 11 | 117795608 | 117796104 | 497 | DSCAML1 |
SEQ ID NO: 37 | 12 | 15322181 | 15323178 | 998 | PTPRO, RERG |
SEQ ID NO: 38 | 12 | 63667846 | 63668580 | 735 | DPY19L2 |
SEQ ID NO: 39 | 12 | 111033274 | 111033632 | 359 | CUX2 |
SEQ ID NO: 40 | 13 | 67229618 | 67231644 | 2027 | PCDH9 |
SEQ ID NO: 41 | 13 | 87673128 | 87673271 | 144 | MIR4500HG, SLITRK5 |
SEQ ID NO: 42 | 14 | 70188797 | 70189400 | 604 | SLC8A3, LOC646548 |
SEQ ID NO: 43 | 14 | 77966179 | 77966411 | 233 | 주석 없음 |
SEQ ID NO: 44 | 15 | 45378160 | 45378420 | 261 | GATM |
SEQ ID NO: 45 | 15 | 64824187 | 64824233 | 47 | PIF1 |
SEQ ID NO: 46 | 15 | 79089616 | 79089950 | 335 | RASGRF1 |
SEQ ID NO: 47 | 16 | 70737594 | 70737910 | 317 | VAC14 |
SEQ ID NO: 48 | 16 | 77789176 | 77789410 | 235 | VAT1L |
SEQ ID NO: 49 | 16 | 87601415 | 87601495 | 81 | JPH3 |
SEQ ID NO: 50 | 17 | 35448324 | 35448347 | 24 | SLFN13 |
SEQ ID NO: 51 | 17 | 76076064 | 76076299 | 236 | ZACN, SRP68, GALR2 |
SEQ ID NO: 52 | 18 | 907740 | 908272 | 533 | ADCYAP1 |
SEQ ID NO: 53 | 18 | 28177400 | 28177679 | 280 | CDH2 |
SEQ ID NO: 54 | 18 | 69401262 | 69401796 | 535 | DOK6 |
SEQ ID NO: 55 | 18 | 75916571 | 75916639 | 69 | 주석 없음 |
SEQ ID NO: 56 | 19 | 36666416 | 36667626 | 1211 | ZNF461 |
SEQ ID NO: 57 | 19 | 36916473 | 36916789 | 317 | ZNF829, ZNF568 |
SEQ ID NO: 58 | 19 | 36973366 | 36973693 | 328 | ZNF568 |
SEQ ID NO: 59 | 19 | 37551650 | 37551952 | 303 | ZNF540, ZNF571-AS1 |
SEQ ID NO: 60 | 19 | 42270825 | 42271072 | 248 | CIC |
SEQ ID NO: 61 | 19 | 56393726 | 56393946 | 221 | ZNF582-AS1, ZNF582 |
SEQ ID NO: 62 | 19 | 56507701 | 56507850 | 150 | ZNF471 |
SEQ ID NO: 63 | 19 | 57191866 | 57192102 | 237 | ZNF264 |
SEQ ID NO: 64 | 19 | 57726974 | 57727102 | 129 | ZNF671,ZNF551, ZNF776 |
SEQ ID NO: 65 | 20 | 21518031 | 21518878 | 848 | NKX2-2 |
SEQ ID NO: 66 | 20 | 56925418 | 56925496 | 79 | 주석 없음 |
SEQ ID NO: 67 | 21 | 26843133 | 26845357 | 2225 | ADAMTS1 |
SEQ ID NO: 68 | 21 | 31343542 | 31344538 | 997 | TIAM1 |
SEQ ID NO: 69 | 21 | 33070564 | 33070847 | 284 | OLIG1 |
다시 말해, 본원에 제공된 임의의 메틸화 바이오마커는 무엇보다도 대장암 및/또는 진행성 선종 메틸화 바이오마커일 수 있거나 이에 포함될 수 있다.
일부 구현예에서, 예컨대 본원에 개시된, 대장암 및/또는 진행성 선종 메틸화 바이오마커는 단일 메틸화 좌위이거나 이를 포함할 수 있다. 일부 구현예에서, 예컨대 본원에 개시된, 메틸화 바이오마커는 2개 이상의 메틸화 좌위이거나 이를 포함할 수 있다. 일부 구현예에서, 예컨대 본원에 개시된, 메틸화 바이오마커는 단일 차등 메틸화 영역(DMR)이거나 이를 포함할 수 있다. 일부 구현예에서, 예컨대 본원에 개시된, 메틸화 바이오마커는 단일 메틸화 부위이거나 이를 포함할 수 있다. 다른 구현예에서, 예컨대 본원에 개시된, 메틸화 바이오마커는 2개 이상의 메틸화 부위이거나 이를 포함할 수 있다. 일부 구현예에서, 예컨대 본원에 개시된, 메틸화 좌위는 2개 이상의 DMR을 포함할 수 있고 포함된 DMR 중 하나 이상에 인접한 DNA 영역을 추가로 포함할 수 있다. 일부 예에서, 예컨대 본원에 개시된, 메틸화 좌위는 유전자, 예컨대 표 1에 제공된 유전자이거나 이를 포함한다. 일부 예에서 예컨대 본원에 개시된, 메틸화 좌위는 유전자의 부분, 예컨대 표 1에 제공된 유전자의 부분이거나 이를 포함한다. 일부 예에서, 예컨대 본원에 개시된, 메틸화 좌위에는 유전자의 확인된 핵산 경계가 포함되지만 이에 국한되지는 않는다. 일부 예에서, 예를 들어, 예컨대 본원에 개시된, 메틸화 좌위는 상기에 주석된(annotated) 유전자, 예컨대 표 1에 제공된 바와 같은 유전자 서열의 주석이 없는 영역 외부에서 발견된다. 일부 예에서, 예컨대 본원에 개시된, 메틸화 좌위는 예컨대 표 1에 제공된 바와 같은 다중 유전자의 부분이거나 이를 포함한다.
일부 예에서, 예컨대 본원에 개시된, 메틸화 좌위는 표 1에 제공된 유전자의 코딩 영역과 같은 유전자의 코딩 영역이거나 이를 포함한다. 일부 예에서 메틸화 좌위는 유전자의 코딩 영역, 예를 들어, 표 1에 제공된 유전자 코딩 영역의 부분이거나 이를 포함한다. 일부 예에서, 예컨대 본원에 개시된, 메틸화 좌위에는 유전자 코딩 영역의 확인된 핵산 경계가 포함되지만 이에 국한되지는 않는다.
일부 예에서, 예컨대 본원에 개시된, 메틸화 좌위는 표 1에 제공된 유전자의 프로모터 및/또는 다른 조절 영역과 같은 유전자의 프로모터 및/또는 기타 조절 영역이거나 이를 포함한다. 일부 예에서 예컨대 본원에 개시된, 메틸화 좌위는 프로모터의 부분 및/또는 유전자의 조절 영역, 예를 들어 표 1에 제공된 프로모터 및/또는 조절 영역 유전자의 부분이거나 이를 포함한다. 일부 예에서, 예컨대 본원에 개시된, 메틸화 좌위는 프로모터의 확인된 핵산 경계 및/또는 유전자의 다른 조절 영역이거나 이를 포함하지만 이에 제한되지는 않는다. 일부 구현예에서, 예컨대 본원에 개시된, 메틸화 좌위는 고 CpG 밀도 프로모터 또는 그의 부분이거나 이를 포함한다.
일부 구현예에서, 예컨대 본원에 개시된, 메틸화 좌위는 비-코딩 서열이거나 이를 포함한다. 일부 구현예에서, 예컨대 본원에 개시된, 메틸화 좌위는 하나 이상의 엑손 및/또는 하나 이상의 인트론이거나 이를 포함한다.
일부 구현예에서, 예컨대 본원에 개시된, 메틸화 좌위는 코딩 서열의 상류에서 미리 결정된 수의 뉴클레오티드를 확장하는 DNA 영역, 및/또는 코딩 서열의 하류에서 미리 결정된 수의 뉴클레오티드를 확장하는 DNA 영역을 포함한다. 다양한 예에서, 예컨대 본원에 개시된, 미리 결정된 수의 뉴클레오티드 상류 및/또는 하류는 예를 들어 500bp, 1kb, 2kb, 3kb, 4kb, 5kb, 10kb, 20kb, 30kb, 40kb, 50kb, 75kb 또는 100kb 이거나 이를 포함한다. 당업자는 코딩 서열의 발현에 영향을 미칠 수 있는 메틸화 바이오마커가 전형적으로 코딩 서열의 상류 및/또는 하류의 임의의 거리 내에 있을 수 있음을 이해할 것이다.
당업자는 메틸화 바이오마커로 확인된 메틸화 좌위가 단일 실험, 반응 또는 앰플리콘에서 반드시 분석될 필요는 없다는 것을 이해할 것이다. 대장암 및/또는 진행성 선종 메틸화 바이오마커로 확인된 단일 메틸화 좌위는 예를 들어 메틸화 좌위 내의 하나 이상의 별개의 또는 중복되는 DNA 영역, 예컨대 하나 이상의 구별되거나 겹치는 DMR의 개별 증폭(또는 증폭에 충분한 올리고뉴클레오티드 프라이머 및 조건 제공)을 포함하는 방법으로 분석될 수 있다. 당업자는 메틸화 바이오마커로 확인된 메틸화 좌위가 메틸화 좌위 내에 존재하는 각 뉴클레오티드 또는 각 CpG의 메틸화 상태에 대해 분석될 필요가 없다는 것을 추가로 이해할 것이다. 오히려, 메틸화 바이오마커인 메틸화 좌위는 예를 들어 메틸화 좌위 내의 단일 DNA 영역의 분석에 의해, 예를 들어 메틸화 좌위 내의 단일 DMR 분석에 의해 분석될 수 있다. 본 명세서의 DMR은 메틸화 좌위일 수 있거나 메틸화 좌위의 부분을 포함할 수 있다. 일부 예에서, 예컨대 본원에 개시된, DMR은 예를 들어 길이가 1 내지 5,000 bp인 메틸화 좌위를 갖는 DNA 영역이다. 다양한 구현예에서, 예컨대 본원에 개시된, DMR은 5000 bp, 4,000 bp, 3,000 bp, 2,000 bp, 1,000 bp, 950 bp, 900 bp, 850 bp, 800 bp, 800 bp, 800 bp, 800 bp, 750 bp, 700 bp, 650 bp, 600 bp, 550 bp, 500 bp, 450 bp, 400 bp, 350 bp, 300 bp, 250 bp, 200 bp, 150 bp, 100 bp, 50 bp, 20 bp 또는 10 bp 이하 길이인 메틸화 좌위를 갖는 DNA 영역이다. 일부 구현예에서, 예컨대 본원에 개시된, DMR은 길이가 1, 2, 3, 4, 5, 6, 7, 8 또는 9 bp이다.
본 명세서에 제공된 메틸화 좌위, 메틸화 부위 및 DMR을 비제한적으로 포함하는 메틸화 바이오마커.
명확성을 위해, 당업자는 메틸화 바이오마커라는 용어가 광범위하게 사용되어 메틸화 좌위가 하나 이상의 DMR을 포함하는 메틸화 바이오마커일 수 있고, 각각의 DRM은 그 자체로 메틸화 바이오마커이고, 각각의 DMR은 하나 이상의 메틸화 부위를 포함할 수 있으며, 각각의 메틸화 부위는 자체적으로 메틸화 바이오마커이기도 하다. 더욱이, 메틸화 바이오마커는 2개 이상의 메틸화 좌위를 포함할 수 있다. 따라서, 메틸화 바이오마커로서의 상태는 바이오마커에 포함된 핵산의 연속성에 좌우되는 것이 아니라, 포함된 DNA 영역(들)에 대한 메틸화 상태의 변화가 제1 상태와 제2 상태, 예컨대 대장암과 대조군 간에 및/또는 진행성 선종과 대조군 간에 존재하는지에 따라 결정된다.
본원에 제공된 바와 같이, 메틸화 좌위는 각각의 메틸화 좌위가 표 1에 식별된 바와 같은 유전자 영역(예컨대, DMR)이거나 이를 포함하는 하나 이상의 메틸화 좌위 중 임의의 것일 수 있다. 일부 특정 구현예에서, 예컨대 본원에 기재된 바와 같이, 대장암 및/또는 진행성 선종 메틸화 바이오마커는 표 1에서 식별된 유전자(전체 또는 일부)이거나 이를 포함하는 단일 메틸화 좌위를 포함한다.
일부 특정 구현예에서, 예컨대 본원에 기재된 바와 같은 대장암 및/또는 진행성 선종 메틸화 바이오마커는 2개 이상의 메틸화 좌위를 포함하고, 이들 각각은 표 1에서 식별된 유전자 영역이거나 이를 포함한다. 일부 구현예에서, 예컨대 본원에 기재된 바와 같이, 메틸화 바이오마커는 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 또는 69개 메틸화 좌위를 포함하며, 각각은 표 1에서 식별된 유전자 영역(전체 또는 일부)을 포함한다.
표 2-4에 제공된 DMR 서열은 표 1의 DMR로 구성되거나 중첩되거나 일부를 포함하는 선택된 영역이다. 즉, 표 2-4에서 확인된 각 DNA 영역은 표 1에서 식별된 DMR의 일부, 그 이하 및 모든 DMR을 포함한다. 명확화를 위해, 표 2-4의 DMR과 중첩되는 표 1의 DMR에 대한 평가는 서열 시작 및 종료 위치 및 염색체 번호에 기초하여 이루어진다. 두 DMR이 동일한 염색체에서 발견되고 두 DMR 서열 중 하나가 두 DMR 서열 중 두번째의 시작 점과 종료 점 사이 또는 시작 점 및 종료 점 중 하나에 시작 점 및/또는 종료 점을 가지면, 이들은 중첩되는 것으로 간주된다. 예를 들어, 표 4의 UDX_224.14(SEQ ID No. 190)는 염색체 21에 있는 111개의 인접 염기 쌍(contiguous base pair)의 선택을 포함한다. 모든 111개의 인접 염기 쌍은 표 1의 SEQ ID No. 67 내에서 발견되며, 염색체 21 상에서도 발견된다. UDX_224.14의 시작 점은 26844767이고 종료 점은 26844877이며, SEQ ID No. 67의 시작점은 26843133이고 종료 점은 26845357이다. UDX_224의 시작점과 종료 점 모두 SEQ ID No. 67의 시작 점과 종료 점 사이에서 발견되고 둘 모두 동일한 염색체 상에 있기 때문에, 이들은 서로 중첩되며 따라서 동일한 중첩 서열을 공유한다.
다른 예에서, 표 4의 UDX_244_2(SEQ ID No. 213)는 표 1의 SEQ ID No. 2의 일부와 중첩된다(즉, 전체를 포함하지 않음). UDX_244_2는 213개의 염기쌍 길이이고 242개 염기쌍 길이인 SEQ ID No. 2와 73개 인접 염기쌍이 공통된다. 1번 염색체 상의 UDX_224_2의 시작 위치는 107140056이고 종료 위치는 107140173이다. SEQ ID No. 2의 시작 위치는 107140100이고 종료 위치는 107140341이다. 따라서, SEQ ID No. 2의 시작 위치가 UDX_224_2의 시작 위치와 종료 위치 사이에 있고 둘 다 1번 염색체 상에 있기 때문에, 이들 서열은 서로 “중첩된다”고 한다. 일부 특정 구현예에서, 예를 들어, 본원에 기재된 바와 같이, 대장암 및/또는 진행성 선종 메틸화 바이오마커는 3개 이상의 메틸화 좌위를 포함하고, 3개 이상의 메틸화 좌위 각각은 표 1 내지 표 1 중 어느 하나에서 식별된 유전자 영역이거나 이를 포함하며, 비제한적으로 각각 표 2 내지 4 중 하나에서 식별된 유전자 영역이거나 이를 포함하는 3개 이상의 메틸화 좌위 및 조합을 포함한다.
일부 특정 구현예에서, 예를 들어, 본원에 기재된 바와 같이, 대장암 및/또는 진행성 선종 메틸화 바이오마커는 3개의 메틸화 좌위를 포함하고, 이 3개의 메틸화 좌위는 표 2에서 식별된 유전자 영역이거나 이를 포함하는 메틸화 좌위를 포함한다. 본 명세서에 기재된 바와 같이, 대장암 메틸화 바이오마커는 10개의 메틸화 좌위를 포함하고, 10개의 메틸화 좌위는 표 3에서 식별된 유전자 영역이거나 이를 포함하는 메틸화 좌위를 포함한다. 바이오마커는 40개의 메틸화 좌위를 포함하고, 이 40개의 메틸화 좌위는 표 4에서 식별된 유전자 영역이거나 이를 포함하는 메틸화 좌위를 포함한다.
표 2.대장암 및/또는 진행성 선종의 진단에 중요도 순서로 순위 매긴 3개의 메틸화 좌위의 조합. | |||||||
순서 | UID | Chr. | 시작 위치 | 종료 위치 | 서열 길이 | 유전자명 | SEQ ID NO: |
1 | UDX_29_1 | 20 | 56925429 | 56925505 | 77 | 주석 없음 | 210 |
2 | UDX_272.3_2 | 10 | 26211886 | 26211963 | 78 | GAD2, MYO3A | 201 |
3 | UDX_277.7_2 | 8 | 52565318 | 52565408 | 93 | ALKAL1 | 192 |
표 3. 대장암 및/또는 진행성 선종의 진단에 중요도 순서로 순위 매긴 10개의 메틸화 좌위의 조합. | |||||||
순서 | UID | Chr. | 시작 위치 | 종료 위치 | 서열 길이 | 유전자명 | SEQ ID NO: |
1 | UDX_29_1 | 20 | 56925429 | 56925505 | 77 | 주석 없음 | 210 |
2 | UDX_272.3_2 | 10 | 26211886 | 26211963 | 78 | GAD2, MYO3A | 201 |
3 | UDX_277.7_2 | 8 | 52565318 | 52565408 | 91 | ALKAL1 | 192 |
4 | UDX_272.4 | 10 | 26212057 | 26212160 | 104 | GAD2, MYO3A | 202 |
5 | UDX_260.1 | 15 | 79089690 | 79089791 | 102 | RASGRF1 | 218 |
6 | UDX_174.3 | 8 | 17026935 | 17027030 | 96 | MICU3 | 208 |
7 | UDX_260.2_1 | 15 | 79089784 | 79089858 | 75 | RASGRF1 | 219 |
8 | UDX_137.1 | 10 | 127736483 | 127736589 | 107 | FOXI2 | 200 |
9 | UDX_17_2 | 10 | 16520591 | 16520719 | 129 | C1QL3 | 193 |
10 | UDX_230 | 9 | 21970919 | 21971017 | 99 | CDKN2A, CDKN2B-AS1 | 195 |
표 4. 대장암 및/또는 진행성 선종의 진단에 중요도 순서로 순위 매긴 40개의 메틸화 좌위의 조합. | |||||||
서UID | Chr. | 시작 위치 | 종료 위치 | 서열 길이 | 유전자명 | SEQ ID NO: | |
UDX_29_1 | 20 | 56925429 | 56925505 | 77 | 주석 없음 | 210 | |
UDX_272.3_2 | 10 | 26211886 | 26211963 | 78 | GAD2, MYO3A | 201 | |
UDX_277.7_2 | 8 | 52565318 | 52565408 | 91 | ALKAL1 | 192 | |
UDX_272.4 | 10 | 26212057 | 26212160 | 104 | GAD2, MYO3A | 202 | |
UDX_260.1 | 15 | 79089690 | 79089791 | 102 | RASGRF1 | 218 | |
UDX_174.3 | 8 | 17026935 | 17027030 | 96 | MICU3 | 208 | |
UDX_260.2_1 | 15 | 79089784 | 79089858 | 75 | RASGRF1 | 219 | |
UDX_137.1 | 10 | 127736483 | 127736589 | 107 | FOXI2 | 200 | |
UDX_17_2 | 10 | 16520591 | 16520719 | 129 | C1QL3 | 193 | |
UDX_230 | 9 | 21970919 | 21971017 | 99 | CDKN2A, CDKN2B-AS1 | 195 | |
UDX_117.2 | 1 | 114153294 | 114153403 | 110 | SYT6 | 223 | |
UDX_1_1 | 17 | 35448307 | 35448407 | 101 | SLFN13 | 222 | |
UDX_185.1 | 4 | 176001299 | 176001402 | 104 | GPM6A | 205 | |
UDX_24_1 | 18 | 136766100 | 75916621 | 90 | 주석 없음 | 211 | |
UDX_221.2_2 | 2 | 75916502 | 136766189 | 120 | THSD7B | 224 | |
UDX_242_2 | 19 | 56393661 | 56393732 | 72 | ZNF582-AS1, ZNF582 | 229 | |
UDX_120.2 | 15 | 45378328 | 45378410 | 83 | GATM | 203 | |
UDX_250.1 | 19 | 37551665 | 37551748 | 84 | ZNF540, ZNF571-AS1 | 227 | |
UDX_128.1 | 21 | 33070632 | 33070711 | 80 | OLIG1 | 214 | |
UDX_222.1 | 3 | 96813876 | 96813987 | 112 | EPHA6 | 198 | |
UDX_197.3 | 12 | 63668267 | 63668380 | 114 | DPY19L2 | 197 | |
UDX181.2_1 | 14 | 70189011 | 70189101 | 91 | SLC8A3, LOC646548 | 220 | |
UDX_251.2_1 | 10 | 25934064 | 25934130 | 67 | MYO3A, LOC101929073 | 209 | |
UDX_85.2_1 | 2 | 209771686 | 209771755 | 70 | UNC80 | 225 | |
UDX_66.2 | 7 | 154304858 | 154304969 | 112 | DPP6 | 196 | |
UDX_107.2 | 14 | 77966334 | 77966434 | 101 | 주석 없음 | 212 | |
UDX_258.2_1 | 19 | 36973533 | 36973602 | 70 | ZNF568 | 228 | |
UDX_30_1 | 16 | 87601410 | 87601511 | 102 | JPH3 | 206 | |
UDX_217.4_1 | 19 | 36666981 | 36667097 | 117 | ZNF461 | 226 | |
UDX_244_2 | 1 | 107140057 | 107140173 | 117 | NTNG1 | 213 | |
UDX_198.5_1 | 4 | 61202278 | 61202367 | 90 | ADGRL3 | 191 | |
UDX_224.14 | 21 | 26844768 | 26844877 | 110 | ADAMTS1 | 190 | |
UDX_124.1 | 18 | 28177440 | 28177533 | 94 | CDH2 | 194 | |
UDX_121.1 | 2 | 5673895 | 5673976 | 82 | LINC01248 | 207 | |
UDX_274.2_1 | 12 | 15322353 | 15322435 | 83 | PTPRO, RERG | 216 | |
UDX181.4_1 | 14 | 70189228 | 70189296 | 69 | SLC8A3, LOC646548 | 221 | |
UDX_222.11_2 | 3 | 96814055 | 96814137 | 83 | EPHA6 | 199 | |
UDX_94.2_2 | 9 | 36986522 | 36986581 | 60 | PAX5 | 215 | |
UDX114.1_1 | 5 | 180353710 | 180353815 | 106 | GFPT2 | 204 | |
UDX_274.3_1 | 12 | 15322478 | 15322549 | 72 | PTPRO, RERG | 217 |
본원에 제공된 바와 같이, DMR은 각각이 표 1에서 식별된 유전 영역(전체 또는 일부)이거나 이를 포함하는 메틸화 좌위에 존재하는 하나 이상의 DMR 중 임의의 것일 수 있다. 일부 특정 구현예에서, 예를 들어, 본원에 기재된 대장암 및/또는 진행성 선종 메틸화 바이오마커는 표 1에서 확인된 유전자 영역의 전부 또는 일부를 포함하거나 이에 존재하는 단일 DMR이거나 이를 포함한다.
일부 특정 구현예에서, 예를 들어 본원에 기재된 바와 같은 대장암 메틸화 바이오마커는 3개 이상의 DMR을 포함하고, 이들 각각은 표 1에서 식별된 유전자 영역의 전부 또는 일부를 포함하거나, 이에 존재한다. 일부 구현예에서, 본원에 기재된 바와 같이, 대장암 메틸화 바이오마커는 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 44, 43, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68 또는 69 개 DMR을 포함하고, 이들 각각은 표 1에서 식별된 유전자 영역(전체 또는 일부)을 포함한다.
일부 특정 구현예에서, 예를 들어 본원에 기재된 바와 같이, 대장암 및/또는 진행성 선종 메틸화 바이오마커는 2개 이상의 DMR을 포함하고, 2개 이상의 DMR 각각은 표 1-4 중 어느 하나에서 식별된 유전자의 전부 또는 일부를 포함하거나 이에 존재한다. 일부 특정 구현예에서, 예를 들어, 본원에 기재된 바와 같이, 대장암 메틸화 바이오마커는 3개의 DMR을 포함하고, 이 3개의 DMR은 표 2에서 식별된 유전자 영역의 전부 또는 일부를 포함하거나 존재하는 DMR을 포함한다. 일부 특정 구현예에서 예를 들어, 본 명세서에 기재된 바와 같이, 대장암 및/또는 진행성 선종 메틸화 바이오마커는 10개의 DMR을 포함하고, 이 10개의 DMR은 표 3에서 식별된 유전자 영역의 전부 또는 일부를 포함하거나, 존재하는 DMR을 포함한다. 일부 특정 구현예에서, 예를 들어, 본원에 기재된 바와 같이, 대장암 메틸화 바이오마커는 40개의 DMR을 포함하고, 이 중 40개의 DMR은 표 4에서 확인된 유전자 영역의 전부 또는 일부를 포함하거나, 이에 존재하는 DMR을 포함한다.
다양한 구현예에서, 예컨대 본원에 개시된, 메틸화 바이오마커는 본 명세서에 제공된 하나 이상의 메틸화 좌위(예컨대 하나 이상의 DMR) 내에 존재하는 하나 이상의 개별 뉴클레오티드(예컨대, CpG와 관련하여 단일 개별 시스테인 잔기) 또는 복수의 개별 시스테인 잔기(예컨대, 복수의 CpG)이거나 이를 포함할 수 있다. 따라서, 특정 구현예에서 메틸화 바이오마커는 복수의 개별 메틸화 부위의 메틸화 상태이거나 이를 포함한다.
다양한 구현예에서, 예컨대 본원에 개시된, 메틸화 바이오마커는 하나 이상의 메틸화 좌위(예컨대, 하나 이상의 DMR) 내의 하나 이상의 메틸화 부위의 메틸화의 변화인 메틸화 상태의 변화이거나 이를 포함하거나 이를 특징으로 한다. 다양한 구현예에서, 예컨대 본원에 개시된, 메틸화 바이오마커는 하나 이상의 메틸화 좌위(예컨대, 하나 이상의 DMR) 내의 메틸화된 부위의 수의 변화인 메틸화 상태의 변화이거나 이를 포함한다. 다양한 구현예에서, 예컨대 본원에 개시된, 메틸화 바이오마커는 하나 이상의 메틸화 좌위(예컨대, 하나 이상의 DMR) 내의 메틸화 부위의 빈도의 변화인 메틸화 상태의 변화이거나 이를 포함한다. 다양한 구현예에서, 예컨대 본원에 개시된, 메틸화 바이오마커는 하나 이상의 메틸화 좌위(예컨대, 하나 이상의 DMR) 내의 메틸화 부위 패턴의 변화인 메틸화 상태의 변화이거나 이를 포함한다.
다양한 구현예에서, 예컨대 본원에 개시된, 하나 이상의 메틸화 좌위(예컨대, 하나 이상의 DMR)의 메틸화 상태는 메틸화되는 샘플에 존재하는 하나 이상의 메틸화 좌위(예컨대, 하나 이상의 DMR)의 분율(fraction) 또는 백분율로 표현되고, 예를 들어, 하나 이상의 특정 메틸화 좌위(예컨대, 하나 이상의 특정 DMR)에서 메틸화된 샘플 내 개별 DNA 가닥 수의 분율로 표현된다. 당업자는 일부 예에서, 예컨대 본원에 개시된, 메틸화 분율 또는 백분율이, 예를 들어 샘플 내에서 하나 이상의 분석된 DMR에 대한 메틸화된 DMR 대 메틸화되지 않은 DMR의 비율로부터 계산될 수 있음을 이해할 것이다. 특정 예에서, 예컨대 본원에 개시된, 하나 이상의 메틸화 좌위(예컨대, 하나 이상의 DMR)의 메틸화 상태는 메틸화된 CpG 섬의 하나 이상의 영역의 분율 또는 백분율로 표현된다.
다양한 구현예에서, 예컨대 본원에 개시된, 하나 이상의 메틸화 좌위(예컨대, 하나 이상의 DMR)의 메틸화 상태를 기준 메틸화 상태 값 및/또는 기준 샘플의 메틸화 좌위(예컨대, 하나 이상의 DMR)의 메틸화 상태와 비교한다. 특정 예에서, 예컨대 본원에 개시된, 기준은 동일한 공급원으로부터의 비동시적 샘플, 예를 들어, 동일한 공급원으로부터의, 예컨대 동일 대상체로부터의 선행 샘플이다. 특정 예에서, 예컨대 본원에 개시된, 하나 이상의 메틸화 좌위(예컨대, 하나 이상의 DMR)의 메틸화 상태에 대한 기준은 샘플(예컨대, 대상체로부터의 샘플), 또는 특정 상태(예컨대, 암성 상태 또는 비암성 상태)를 나타내는 것으로 알려진 복수의 샘플에서의 하나 이상의 메틸화 좌위(예컨대, 하나 이상의 DMR)의 메틸화 상태이다. 따라서, 기준은 하나 이상의 미리 결정된 임계값이거나 이를 포함할 수 있으며, 임계값은 정량적(예컨대, 메틸화 값) 또는 정성적일 수 있다. 특정 예에서, 예컨대 본원에 개시된, DMR의 메틸화 상태에 대한 기준은 DMR의 뉴클레오티드를 포함하지 않는 동일 샘플에 존재하는 뉴클레오티드 또는 복수의 뉴클레오티드(예컨대, 복수의 인접 올리고뉴클레오티드)의 메틸화 상태이다. 당업자는 기준 측정이 일반적으로 비-기준(non-reference) 측정이 수행된 것과 동일하거나 유사하거나 필적하는 방법론을 사용한 측정에 의해 생성된다는 것을 이해할 것이다. 임의의 특정 과학적 이론에 얽매이지 않으나, 도 16은 유전자의 조절 서열의 과메틸화 또는 저메틸화가 발현에 영향을 미칠 수 있는 한 가지 가능한 메커니즘의 개략도를 제공한다. 도 16에 도시된 바와 같이, 저메틸화는 발현 증가를 초래할 수 있고/있거나 과메틸화는 발현 억제를 초래할 수 있다. 다양한 예에서, 예컨대 본원에 개시된, 참조와 비교하여 프로모터 영역 및 인핸서 영역과 같은 발현 조절 영역의 증가된 메틸화는 작동적으로(operably) 연결된 유전자, 예를 들어, 전형적으로 암을 억제하도록 작용하는 작동적으로 연결된 유전자의 발현을 감소시키거나 침묵시킬 수 있다. 다양한 구현예에서, 예컨대 본원에 개시된, 기준과 비교하여 프로모터 영역 및 인핸서 영역과 같은 발현 조절 영역의 감소된 메틸화는 작동적으로 연결된 유전자, 예를 들어 종양발생에 기여하는 활성을 갖는 작동적으로 연결된 유전자의 발현을 증가시킬 수 있다. 특정 과학 이론에 얽매이지 않고, DNA 메틸화는 RNA 발현 또는 단백질 발현 자체보다 암 상태의 화학적 및 생물학적으로 더 안정적인 지표를 제공할 수 있다.
메틸화는 일반적으로 DNA 서열 분석에 반드시 존재하지 않는 정보 차원을 제공하는, 고도로 조직 특이적인 것으로 생각된다.
종양발생에 실질적으로 기여하는 메틸화 사건은 예컨대, 일반적으로 암을 억제하는 작용을 하는 유전자와 같은 암-관련 유전자와 작동적으로 연결된 DNA의 발현 조절 영역에서(예컨대 프로모터 영역, 인핸서 영역, 전사 인자 결합 부위, CTCF-결합 부위, CpG 섬, 또는 기타 서열에서) 일어날 수 있다. 따라서, 전형적으로 암을 억제하는 작용을 하는 유전자의 불활성화는 종양발생을 초래하거나 이에 기여한다.
암
본 명세서의 방법 및 조성물은 암, 특히 대장암 및 대장암에 대한 전구체 종양(예컨대 진행성 선종)에 대한 스크리닝에 유용하다. 대장암은 결장암, 직장암 및 이들의 조합을 포함하나 이에 제한되지는 않는다. 대장암에는 전이성 대장암과 비전이성 대장암이 있다. 대장암은 결장의 근위부에 위치한 암과 결장의 원위부에 위치한 암을 포함한다.
대장암은 예를 들어, 병기 I, 병기 II, 병기 III, 및 병기 IV 대장암(예컨대, 병기 0, I, IIA, MB, IIC, IIIA, NIB, NIC, IVA, IVB 및 IVC 를 포함)을 포함하는 당업계에 공지된 다양한 가능한 병기의 대장암을 포함한다. 대장암은 종양/결절/전이(TNM) 병기 시스템의 모든 단계를 포함한다. 대장암과 관련하여, T는 종양이 결장 또는 직장의 벽 내로 성장했는지 여부, 그리고 성장했다면 몇개 층으로 성장했는지를 나타낼 수 있다; N은 종양이 림프절로 전파되었는지 여부와 전파된 경우 림프절의 수와 위치를 나타낼 수 있다; 그리고 M은 암이 신체의 다른 부위로 전파되었는지 여부와 전파되었다면 어느 부위에 어느 정도로 전파되었는지를 나타낼 수 있다. T, N 및 M의 구체적 단계는 당업계에 공지되어 있다. T 병기는 TX, TO, Tis, T1, T2, T3, T4a 및 T4b를 포함할 수 있고; N 병기는 NX, NO, N1a, N1b, N1c, N2a 및 N2b를 포함할 수 있다. M 병기는 M0, M1a 및 M1b를 포함할 수 있다. 또한, 대장암의 등급에는 GX, G1, G2, G3 및 G4가 포함될 수 있다. 암, 특히 대장암의 다양한 병기화 수단은 예를 들어, 월드 와이드 웹(cancer.net/cancer-types/colorectal-cancer/병기s)에 요약되어 있는 바와 같이 당업계에 잘 알려져 있다.
특정 예에서, 예컨대 본원에 개시된 바와 같이, 본원은 초기 대장암의 스크리닝을 포함한다. 초기 대장암은 예컨대 대상체 내에 국한된 대장암, 예컨대 대상체의 림프절, 예컨대 암에 가까운 림프절로 아직 전파되지 않고(병기 N0), 원위부로 전파되지 않은(병기 M0)를 포함할 수 있다. 초기 병기의 암은 예를 들어 단계 0 내지 II C에 상응하는 대장암을 포함한다.
따라서, 본 명세서의 대장암은 무엇보다도 전악성(pre-malignant) 대장암(예컨대 진행성 선종) 및 악성(malignant) 대장암을 포함한다. 본 명세서의 방법 및 조성물은 본 명세서에 명명되거나 달리 당업계에 공지된 것을 포함하나 이에 제한되지 않는 모든 형태 및 단계의 대장암, 뿐만 아니라 그의 모든 하위집합의 스크리닝에 유용하다. 따라서, 당업자는 본원에 제공된 대장암에 대한 모든 참조가 본원에 명명되거나 당업계에 달리 공지된 것을 포함하나 이에 제한되지 않는 모든 형태 및 단계의 대장암 및 그 하위 집합을 포함함을 이해할 것이다.
대상체 및 샘플
본 문서에 제공된 방법과 구성을 사용하여 분석한 샘플은 생물학적 샘플 및/또는 핵산을 포함한 샘플일 수 있다. 다양한 특정 구현예에서, 본원에 제공된 방법 및 조성물을 사용하여 분석된 샘플은 포유동물로부터의 샘플일 수 있다. 다양한 특정 구현예에서, 본원에 제공된 방법 및 조성물을 사용하여 분석된 샘플은 인간 대상체로부터의 샘플일 수 있다. 다양한 특정 구현예에서, 본원에 제공된 방법 및 조성물을 사용하여 분석된 샘플은 마우스, 쥐, 돼지, 말, 닭 또는 소로부터의 샘플일 수 있다.
다양한 예에서, 예컨대 본원에 개시된, 인간 대상체는 대장암 또는 진행성 선종과 같은 전암성 종양과 같은 암이 있는 것으로 진단되거나 진단을 구하거나, 있을 위험이 있는 것으로 진단되거나 진단을 구하거나, 및/또는 있을 즉각적 위험이 있는 것으로 진단되거나 진단을 구하는 대상체이다. 다양한 예에서, 예컨대 본원에 개시된, 인간 대상체는 대장암 및/또는 진행성 선종 스크리닝이 필요한 대상체로 확인된 대상체이다. 특정 예에서, 예컨대 본원에 개시된, 인간 대상체는 의사에 의해 대장암 및/또는 진행성 선종 스크리닝이 필요한 것으로 확인된 대상체다. 다양한 예에서, 예컨대 본원에 개시된, 인간 대상은 연령, 예를 들어 50세 이상, 예를 들어 50, 55, 60, 65, 70, 75, 80, 85 또는 90세 이상의 연령으로 인해 스크리닝이 필요한 것으로 확인된다. 다양한 예에서, 예컨대 본원에 개시된, 인간 대상체는 대장암 또는 진행성 선종과 같은 전암성 종양과 같은 암에 대한 진단을 받지 않은, 가질 위험이 없는, 즉각적인 위험이 없는, 갖는 것으로 진단되지 않은 및/또는 진단을 구하지 않는 대상체, 또는 이들의 조합이다.
대상체, 예를 들어 인간 또는 다른 포유동물 대상체로부터의 샘플은 예를 들어 혈액, 혈액 성분, cfDNA, ctDNA, 대변 또는 결장직장 조직의 샘플일 수 있다. 일부 특정 구현예에서, 샘플은 대상체의 배설물 또는 체액(예컨대, 대상체의 타액, 대변, 혈액, 림프 또는 소변) 또는 대장암 조직 샘플, 또는 선종 또는 폴립 조직 샘플 이다. 대상체로부터의 샘플은 세포 또는 조직 샘플, 예를 들어, 암에 속하거나 암세포, 예를 들어 종양 또는 전이성 조직을 포함하는 세포 또는 조직 샘플일 수 있다. 다양한 구현예에서, 예컨대 본원에 개시된, 대상체, 예를 들어 인간 또는 다른 포유동물 대상체로부터의 샘플은 생검(예컨대, 미세 바늘 흡인 또는 조직 생검) 또는 수술에 의해 수득될 수 있다.
다양한 구현예에서, 예컨대 본원에 개시된, 샘플은 무세포 DNA(cfDNA)의 샘플이다. cfDNA는 일반적으로 짧은, 이중 가닥 단편으로 인간 생체 유체(예컨대, 혈장, 혈청 또는 소변)에서 발견된다. cfDNA의 농도는 일반적으로 낮지만 임신, 자가면역 장애, 심근 경색증 및 암을 포함하나 이에 국한되지 않는 특정 병태 하에서 상당히 증가할 수 있다. 순환 종양 DNA(ctDNA)는 특이적으로 암세포에서 유래한 순환 DNA의 구성 요소이다. ctDNA는 백혈구 및 적혈구에 결합되거나 백혈구 및 적혈구에 결합되지 않은 인간 생체 유체에 존재할 수 있다. 종양 유래 cfDNA 검출을 위한 다양한 테스트는 암(예컨대 관련 암) 또는 전암성 종양(예컨대 진행성 선종)의 특징인 유전적 또는 후성유전적 변형의 검출을 기반으로 한다. 암의 특징적인 유전적 또는 후성유전적 변형은 종양 억제 유전자의 발암성 또는 암 관련 돌연변이, 활성화된 종양유전자, 과메틸화 및/또는 염색체 장애를 포함할 수 있지만, 이에 제한되지는 않는다. 암의 특징적인 유전적 또는 후성유전적 변형의 검출은 검출된 cfDNA가 ctDNA임을 확인할 수 있다.
cfDNA 및 ctDNA는 공급원 조직의 메틸화 상태에 대한 실시간 또는 거의 실시간 메트릭을 제공한다. cfDNA 및 ctDNA는 혈액에서 약 2시간의 반감기를 나타내므로 주어진 시간에 채취한 샘플은 공급원 조직의 상태를 비교적 시기 적절하게 반영한다.
샘플로부터 핵산을 분리하는 다양한 방법(예컨대, 혈액 또는 혈장으로부터 cfDNA를 분리하는 방법)이 당업계에 공지되어 있다. 핵산은 예를 들어 비제한적으로, 직접 유전자 포획에 의하여(샘플 정화에 의하여 검정방지제(assay-inhibiting agent)를 제거하고 존재하는 경우 포획제를 갖는 정화된 샘플로부터 표적 핵산을 포획하여 포획 복합체를 생성하고, 포획 복합체를 단리하여 표적 핵산을 회수하여) 단리될 수 있다.
메틸화 상태 측정 방법
메틸화 상태는 당업계에 공지된 다양한 방법 및/또는 본원에 제공된 방법에 의해 측정될 수 있다. 당업자는 메틸화 상태를 측정하는 방법이 일반적으로 모든 공급원 및 모든 종류의 샘플에 적용될 수 있음을 이해할 것이며, 샘플을 주어진 방법론에 의한 측정에 적합한 형태로 변형하기 위해 사용가능한 가공 단계를 또한 알 것이다. 메틸화 상태를 측정하는 방법은 비제한적으로, 메틸화 상태 특이적 중합효소 연쇄 반응(PCR)을 포함하는 방법, 핵산 시퀀싱을 포함하는 방법, 질량 분석을 포함하는 방법, 메틸화 민감성 뉴클레아제를 포함하는 방법, 질량 기반 분리를 포함하는 방법, 표적 특이적 포획을 포함하는 방법, 메틸화 특이적 올리고뉴클레오티드 프라이머를 포함하는 방법, 혼성화-포획 표적화 차세대 시퀀싱을 포함하는 방법, 앰플리콘 기반 표적화 차세대 시퀀싱을 포함하는 방법, 및 전체 게놈 중아황산염 시퀀싱을 포함하는 방법을 포함한다. 메틸화에 대한 특정 구체 분석은 중아황산염 시약(예컨대 아황산수소 이온)을 사용한다.
중아황산염 시약은 무엇보다도 중아황산염, 디설파이트, 아황산수소 또는 이들의 조합을 포함할 수 있으며, 이러한 시약은 메틸화된 핵산 및 메틸화되지 않은 핵산을 구별하는 데 유용할 수 있다. 중아황산염은 시토신 및 5-메틸시토신과 상이하게 상호작용한다. 전형적인 중아황산염 기반 방법에서 중아황산염과 DNA의 접촉은 메틸화되지 않은 시토신을 우라실로 탈아미노화하는 반면 메틸화된 시토신은 영향을 받지 않고 남아 있다; 메틸화 시토신은 선택적으로 유지되지만 메틸화되지 않은 시토신은 유지되지 않는다. 따라서, 중아황산염 처리된 샘플에서, 우라실 잔기는 메틸화되지 않은 시토신 잔기 대신에 서서 이에 대한 식별 신호를 제공하는 반면, 나머지 (메틸화된) 시토신 잔기는 따라서 메틸화된 시토신 잔기에 대한 식별 신호를 제공한다. 중아황산염 처리된 샘플은 예컨대 PCR 또는 전체 게놈 중아황산염 시퀀싱에 의해 분석될 수 있다.
다양한 메틸화 분석 절차는 DMR과 같은 표적 서열의 메틸화 상태를 결정하기 위해 중아황산염 처리와 함께 사용될 수 있다. 이러한 분석에는 특히 메틸화 특이적 제한 효소 qPCR, 메틸화 민감성 제한 효소 qPCR, 중아황산염 처리 핵산의 시퀀싱, PCR(예컨대 서열 특이적 증폭과 함께), 메틸화 특이적 뉴클레아제-보조 소수-대립유전자 농축 PCR, 메틸화 민감성 고해상도 용융, 혼성화-포획 표적화 차세대 시퀀싱, 및 앰플리콘 기반 표적화 차세대 시퀀싱이 포함될 수 있다. 일부 구현예에서, DMR은 중아황산염 처리된 DNA 샘플로부터 증폭되고 예를 들어 일루미나 프로토콜(lllumina protocol) 또는 전치 기반 Nextera XT 프로토콜에 따른 시퀀싱을 위해 DNA 시퀀싱 라이브러리가 준비된다. 특정 구현예에서, 고처리량 및/또는 차세대 시퀀싱 기술을 사용하여 메틸화 상태를 분석할 수 있게 하는 염기쌍 수준의 DNA 서열 해상도를 달성한다. 아황산수소염 처리와 병용하여 인간 게놈의 상당 부분(예컨대 >50%)을 커버하는 경우 이러한 전체 게놈 시퀀싱 기술을 통틀어 전체 게놈 아황산염 시퀀싱(Whole Genome Bisulfite Sequencing, WGBS)이라 지칭할 수 있다.
다양한 구현예에서, 예컨대 본원에 개시된, 메틸화 상태는 예를 들어 중아황산염 처리된 샘플에 적용된 바와 같이 메틸화-특이적 올리고뉴클레오티드 프라이머(MSP 방법)를 사용한 PCR 증폭을 포함하는 방법에 의해 검출된다(예컨대, Herman 1992 Proc. Natl. Acad. Sci. USA 93: 9821-9826 참조, 메틸화 상태를 결정하는 방법과 관련하여 본원에 참고로 포함됨). 중아황산염 처리 DNA의 증폭을 위한 메틸화 상태 특이적 올리고뉴클레오티드 프라이머를 사용하면 메틸화 핵산과 메틸화되지 않은 핵산을 구별할 수 있다. MSP 방법에 사용하기 위한 올리고뉴클레오티드 프라이머쌍은 메틸화 부위, 예를 들어 CpG를 포함하는 서열과 혼성화할 수 있는 적어도 하나의 올리고뉴클레오티드 프라이머를 포함한다. 시토신 잔기에 상보적인 위치에 T 잔기를 포함하는 올리고뉴클레오티드 프라이머는 중아황산염 처리 전에 시토신이 메틸화되지 않은 주형에 선택적으로 혼성화되는 반면, 시토신 잔기에 상보적인 위치에 G 잔기를 포함하는 올리고뉴클레오티드 프라이머는 중아황산염 처리 전에 시토신이 메틸화된 시토신인 주형에 선택적으로 혼성화한다. MSP 결과는 예를 들어 겔 전기영동을 사용하여 시퀀싱 앰플리콘을 사용하거나 사용하지 않고 얻을 수 있다. MSP(methylation-specific PCR)는 중아황산염-변환 DNA의 PCR 증폭을 사용하여 좌위 특이적 DNA 메틸화의 고감도 검출(전체 특이도로, 대립유전자의 0.1% 검출 수준)을 가능하게 한다.
샘플의 중아황산염 처리 후 메틸화 상태를 결정하기 위해 사용할 수 있는 또 다른 방법은 메틸화 민감성 고해상도 용융(Methylation-Sensitive High Resolution Melting; MS-HRM) PCR이다(예컨대 본 명세서에 메틸화 상태를 결정하는 방법과 관련하여 참조로서 통합되는 Hussmann 2018 Methods Mol Biol. 1708:551-571 참조) MS-HRM은 혼성화 용융을 기반으로 특정 관심 좌위에서 메틸화 수준을 검출하는 튜브 내(in tube) PCR 기반 방법이다. MS-HRM을 수행하기 전 DNA를 중아황산염 처리에 의해 메틸화된 DNA와 메틸화되지 않은 DNA 사이의 염기 조성이 달라지며, 이는 고해상도 용융으로 생성된 앰플리콘을 분리하는 데 사용된다. 고유한 프라이머 설계는 메틸화되지 않은 배경에서 0.1-1%까지 메틸화된 대립유전자를 검출할 수 있는 분석의 고감도를 용이하게 한다. MS-HRM 분석용 올리고뉴클레오티드 프라이머는 메틸화된 대립유전자에 상보성이도록 설계되었으며, 특정 어닐링 온도는 이들 프라이머가 메틸화된 대립유전자와 메틸화 되지 않은 대립유전자 모두에 어닐링할 수 있도록 하여 분석의 민감도를 증가시킨다.
샘플의 중아황산염 처리 후 메틸화 상태를 결정하는 데 사용할 수 있는 또 다른 방법은 정량적 다중 메틸화 특이적 PCR(Quantitative Multiplex Methylation-Specific PCR, QM-MSP)이다. QM-MSP는 DNA 메틸화의 민감한 정량화를 위해 메틸화 특이적 프라이머를 사용한다(예컨대, 메틸화 상태를 결정하는 방법과 관련하여 본원에 참조로 포함되는, Fackler 2018 Methods Mol Biol. 1708:473-496 참조). QM-MSP는 2단계 PCR 접근 방식으로, 1단계에서 한 쌍의 유전자 특이적 프라이머(정방향 및 역방향)가 하나의 PCR 반응에서 동일한 유전자의 메틸화된 사본과 메틸화되지 않은 사본을 동시에 다중으로 증폭한다. 이 메틸화-무관(methylation-independent) 증폭 단계는 36 사이클 PCR 후 μL 당 최대 109 카피의 앰플리콘을 생성한다. 2단계에서, 1단계 반응의 앰플리콘은 실시간 PCR과 두 개의 독립적인 형광단을 사용하여 표준 곡선으로 정량화되어 동일한 웰(예: 6FAM 및 VIC)에서 각 유전자의 메틸화/비메틸화 DNA를 검출한다. 100,000개의 기준 유전자 카피에서 1개의 메틸화된 카피를 검출할 수 있다.
샘플의 중아황산염 처리 후 메틸화 상태를 결정하는 데 사용할 수 있는 또 다른 방법은 메틸화 특이적 뉴클레아제-보조 소수-대립유전자 농축(Methylation Specific Nuclease-assisted Minor-allele Enrichment, MS-NaME)이다(예컨대, 메틸화 상태를 결정하는 방법과 관련하여 본원에 참조로 포함되는, Liu 2017 Nucleic Acids Res. 45(6):e39 참조). Ms-NaME는 이중 가닥(ds) DNA(DSN)에 특이적인 DNA 뉴클레아제의 존재 하에 표적 서열에 대한 프로브의 선택적 혼성화를 기반으로 하여, 혼성화는 DSN에 의해 후속적으로 절단되는 이중 가닥 DNA 영역을 초래한다. 따라서, 메틸화되지 않은 서열을 표적으로 하는 올리고뉴클레오티드 프로브는 메틸화되지 않은 표적의 절단을 초래하는 국부(local) 이중 가닥 영역을 생성하고; 메틸화된 서열에 혼성화할 수 있는 올리고뉴클레오티드 프로브는 메틸화된 표적의 절단을 초래하는 국부 이중 가닥 영역을 생성하여 메틸화된 표적을 손상시키지 않는다. 더욱이, 올리고뉴클레오티드 프로브는 동시에 중아황산염 처리된 DNA의 다중 표적에 DSN 활성을 지시할 수 있다. 후속 증폭은 비-절단(non-digested) 서열을 농축할 수 있다. Ms-NaME는 독립적으로 또는 본 명세서에 제공된 다른 기술과 조합하여 사용될 수 있다.
샘플의 중아황산염 처리 후 메틸화 상태를 결정하는 데 사용할 수 있는 또 다른 방법은 메틸화 민감성 단일 뉴클레오티드 프라이머 확장(Methylation-sensitive Single Nucleotide Primer Extension, Ms-SNuPE™)이다(예컨대, 메틸화 상태를 결정하는 방법과 관련하여 본원에 참조로 포함되는, Gonzalgo 2007 Nat Protoc. 2(8): 1931-6 참조). Ms-SNuPE에서 가닥 특이적 PCR은 Ms-SNuPE를 사용한 정량적 메틸화 분석을 위한 DNA 주형을 생성하기 위해 수행된다. 그런 다음 SNuPE는 조사되는 CpG 부위(들)의 바로 상류에서 혼성화하도록 설계된 올리고뉴클레오티드(들)로 수행된다. 반응 생성물은 형광체 이미지 분석에 의한 시각화 및 정량을 위해 폴리아크릴아미드 겔에서 전기영동될 수 있다. 앰플리콘은 또한 형광 표지, 방사성 핵종 또는 분리 가능한 분자 단편 또는 질량 분석에 의해 구별될 수 있는 질량을 갖는 기타 독립체와 같은 직접 또는 간접적으로 검출 가능한 표지를 가질 수 있다. 검출은 예를 들어 매트릭스 보조 레이저 탈착/이온화 질량 분석법(matrix assisted laser desorption/ionization mass spectrometry, MALDI) 또는 전자 분무 질량 분석법(electron spray mass spectrometry, ESI)을 사용하여 수행 및/또는 시각화할 수 있다.
샘플의 중아황산염 처리 후 메틸화 상태를 결정하는 데 사용할 수 있는 특정 방법은 증폭 기반 방법에서 제1 올리고뉴클레오티드 프라이머, 제2 올리고뉴클레오티드 프라이머 및 올리고뉴클레오티드 프로브를 사용한다. 예를 들어, 올리고뉴클레오티드 프라이머 및 프로브는 실시간 중합효소 연쇄 반응(PCR) 또는 액적 디지털 PCR(droplet digital PCR, ddPCR) 방법에 사용될 수 있다. 다양한 예에서, 예컨대 본원에 개시된, 제1 올리고뉴클레오티드 프라이머, 제2 올리고뉴클레오티드 프라이머 및/또는 올리고뉴클레오티드 프로브는 증폭 또는 프로브 신호가 샘플의 메틸화 상태를 나타내도록 메틸화된 DNA 및/또는 메틸화되지 않은 DNA를 선택적으로 혼성화한다.
메틸화 상태(예컨대, 5-메틸시토신의 수준의 존재)를 검출하기 위한 다른 중아황산염 기반 방법은 예를 들어 Frommer(본원에 참조로 포함되는, 1992 Proc Natl Acad Sci US A. 1;89(5): 1827-31)에 개시되어 있다.
메틸화 상태를 검출하기 위한 중아황산염 기반 방법은 앰플리콘 기반 표적화 차세대 시퀀싱(amplicon-based targeted next generation sequencing)을 포함할 수 있다. 예컨대, Masser(2015 J Vis Exp, (96):52488, doi: 10.3791/52488, 본 명세서에 참조로 포함됨) 참조. 일반적으로 앰플리콘 기반 표적화 차세대 시퀀싱은 차세대 라이브러리 구축과 함께 중아황산염 전환(bisulfite conversion) 및 영역 특이적 PCR 증폭을 활용하여 높은 처리량 방식으로 표적 관심 영역의 메틸화 상태를 조사한다.
메틸화 상태를 검출하기 위한 또 다른 중아황산염 기반 방법은 혼성화 포획 기반 표적화 차세대 시퀀싱(hybrid-capture based targeted next generation sequencing)을 포함할 수 있다. 예컨대 Ivanov(2013, Nucleic Acids Res, doi: 10.1093/nar.gks1467, 본 명세서에 참조로 포함됨) 참조. 일반적으로, 상기 방법은 중아황산염으로 게놈 DNA를 처리하는 것을 포함한다. 그런 다음, 표적 영역은 용액 또는 고체 지지체에 결합된 DNA 또는 RNA 프로브와 혼성화된다. 결합된 표적 영역은 그 후 공지된 프로토콜에 따라 농축되고 시퀀싱된다. Gasc(2016, Front. Microbiol., doi: 10.1093/nar/gkw309, 본 명세서에 참조로 포함됨) 참조.
메틸화 상태를 결정하는 데 사용할 수 있는 특정 방법에는 샘플의 중아황산염 처리가 포함되지 않는다. 예를 들어, 메틸화 상태의 변화는 PCR 증폭(예컨대, MSRE-qPCR에 의한) 전에 DNA가 하나 이상의 메틸화 민감성 제한 효소(MSRE)로 절단되는 PCR 기반 프로세스에 의해 검출될 수 있다. 일반적으로 MSRE에는 적어도 CpG 모티프를 포함하는 인식 부위를 가져, 5-메틸시토신이 포함된 경우 MSRE의 활성이 가능한 인식 부위를 절단하는 것이 차단되게 한다. (예컨대, Beikircher 2018 Methods Mol Biol. 1708:407-424 참조, 이는 본원에 참고로 포함됨). 따라서 MSRE는 MSRE 인식 부위의 메틸화 상태에 따라 핵산을 선택적으로 절단한다; 그들은 메틸화되지 않은 MSRE 인식 사이트에서 DNA를 절단할 수 있지만 메틸화된 MSRE 인식 사이트에서는 DNA를 절단할 수 없다. 특정 구현예에서, 샘플의 분취량은 MSRE로 절단되어 MSRE에 의해 메틸화되지 않은 DNA가 절단된 처리된 샘플을 생성하여, MSRE 인식 부위 내에 적어도 하나의 메틸화된 부위를 갖는 비절단된 및/또는 증폭 가능한 DNA의 비율이 MSRE 부위 내에 적어도 하나의 메틸화된 부위를 포함하지 않는(예컨대, DNA 분자의 각각의 MSRE 인식 부위 내에 적어도 하나의 메틸화된 부위를 포함하지 않는) 비절단된 및/또는 증폭 가능한 DNA에 비해 증가하게 할 수 있다. 그런 다음 제한 효소-절단된 샘플의 비절단된 서열을 예컨대 PCR에서 사전 증폭하고, 예컨대 qPCR, 실시간 PCR Ehsms 디지털 PCR에 의해 정량화할 수 있다. MSRE-qPCR용 올리고뉴클레오티드 프라이머는 하나 이상의 MSRE 절단 부위 및/또는 복수의 MSRE 절단 부위를 포함하는 영역을 증폭한다. 복수의 MSRE 절단 부위를 포함하는 앰플리콘은 일반적으로 강건한(robust) 결과를 얻을 가능성이 더 높다. DMR 앰플리콘 내 절단 부위의 수, 및 일부 경우 예컨대 본원에 개시된, DMR에 대한 메틸화 상태 결정의 결과적인 강건성(robustness)은 DMR 앰플리콘의 복수의 MSRE 인식 부위(단일 인식 부위와 반대로)를 포함하는 DMR의 설계에 의해 증가될 수 있다. 다양한 예에서, 예컨대 본원에 개시된, 복수의 MSRE는 예를 들어 Acil, Hin6l, HpyCH4IV 및 Hpall(예컨대, Acil, Hin6l 및 HpyCH4IV 포함) 중 둘 이상을 포함하는 동일 샘플에 적용될 수 있다. 복수의 MSRE(예: Acil, Hin6l, HpyCH4IV 및 Hpall의 조합, 또는 Acil, Hin6l 및 HpyCH4IV의 조합)는 DMR 앰플리콘 내에서 MSRE 인식 부위의 향상된 빈도를 제공할 수 있다.
MSRE-qPCR은 또한 MSRE에 의한 샘플 분해 후, 그러나 혈액 내 cfDNA의 낮은 유병률을 고려할 때 사용 가능한 샘플의 양을 개선하기 위해 qPCR 이전에, 사전 증폭 단계를 포함할 수 있다.
특정 MSRE-qPCR 구현예에서, 예컨대 본원에 개시된, 총 DNA의 양은 예를 들어 실시간 PCR 또는 디지털 PCR을 사용하여 천연(native)(예컨대, 절단되지 않은) 샘플의 분취량에서 측정된다.
다양한 증폭 기술은 단독으로 또는 메틸화 상태의 검출을 위해 본원에 설명된 다른 기술과 함께 사용될 수 있다. 본 명세서를 검토한 당업자는 당업계에 공지되어 있고/있거나 본원에 설명된 다양한 증폭 기술을 당업계에 알려져 있고/있거나 여기에 제공된 메틸화 상태 결정을 위한 다양한 다른 기술과 조합하는 방법을 이해할 것이다. 증폭 기술에는 PCR, 예를 들어 정량적 PCR(qPCR), 실시간 PCR 및/또는 디지털 PCR이 포함되지만 이에 국한되지 않는다. 당업자는 중합효소 증폭이 단일 반응에서 다중 표적의 증폭을 다중화할 수 있음을 이해할 것이다. PCR 앰플리콘은 일반적으로 길이가 100~2000 염기쌍이다. 다양한 예에서, 예컨대 본원에 개시된, 증폭 기술은 메틸화 상태를 결정하기에 충분하다.
디지털 PCR(dPCR) 기반 방법은 96개, 384개 또는 그 이상의 웰이 있는 플레이트의 웰에, 또는 예를 들어 미세유체 장치를 사용하여 개별 에멀젼 액적(ddPCR)에 샘플을 나누고 분배하여, 일부 웰에 하나가 이상의 주형 카피가 포함되고 나머지에 주형 카피를 포함되지 않도록 하는 것이 포함된다. 따라서, 웰당 주형 분자의 평균 수는 증폭 전에 1개 미만이다. 주형의 증폭이 발생하는 웰의 수는 주형 농도의 척도를 제공한다. 샘플이 MSRE와 접촉하면, 주형의 증폭이 발생하는 웰의 수는 메틸화된 주형의 농도의 척도를 제공한다.
다양한 구현예에서, 예컨대 본원에 개시된, MethyLight™와 같은 형광 기반 실시간 PCR 검정을 사용하여 메틸화 상태를 측정할 수 있다(예컨대, Campan 2018 Methods Mol Biol. 1708:497-513 참조, 이는 참조로 본원에 포함된다). MethyLight는 게놈 후보 영역의 DNA 메틸화를 민감하게 감지하고 정량화하는 정량적 형광 기반 실시간 PCR 방법이다. MethyLight는 메틸화 특이적 프라이밍과 메틸화 특이적 형광 프로빙을 조합하기 때문에 메틸화되지 않은 DNA의 높은 배경에 대해 저-빈도 메틸화 DNA 영역을 검출하는 데에 특히 적합하다. 또한 MethyLight는 질환 검출 및 스크리닝에 사용하여 개별 메틸화된 분자의 고민감성 검출를 위해 디지털 PCR과 조합할 수 있다.
메틸화 상태를 결정하는 데 사용되는 실시간 PCR 기반 방법에는 일반적으로 외부 표준 분석을 기반으로 하는 메틸화되지 않은 DNA에 대한 표준 곡선을 생성하는 단계가 포함된다. 표준 곡선은 적어도 두 지점에서 구성할 수 있으며 절단된 DNA에 대한 실시간 Ct 값 및/또는 절단되지 않은 DNA에 대한 실시간 Ct 값을 알려진 정량 표준과 비교할 수 있다. 특정 예에서, 예컨대 본원에 개시된, 샘플 Ct 값은 MSRE-절단 및/또는 절단되지 않은 샘플 또는 샘플 분취량에 대해 결정될 수 있으며, DNA의 게놈 등가물은 표준 곡선에서 계산될 수 있다. MSRE-절단 및 비절단 DNA의 Ct 값을 평가하여 절단된(예컨대, 효율적으로 절단된, 예컨대 Ct 값 45를 얻는) 앰플리콘을 식별할 수 있다. 절단 또는 절단되지 않은 조건에서 증폭되지 않은 앰플리콘도 식별할 수 있다. 관심 앰플리콘에 대한 수정된 Ct 값은 조건 간에 메틸화 상태의 상대적인 차이를 설정하기 위해 조건에 걸쳐 직접 비교할 수 있다. 대안적으로 또는 추가적으로, 절단된 DNA와 절단되지 않은 DNA의 Ct 값 사이의 델타 차이를 사용하여 조건 간의 메틸화 상태의 상대적 차이를 설정할 수 있다.
메틸화 상태를 측정하는 방법은 메틸화 상태를 결정하기 위한 대규모 병렬 시퀀싱(예컨대, 차세대 시퀀싱), 예를 들어 합성에 의한 시퀀싱, 실시간(예컨대, 단일 분자) 시퀀싱, 비드 에멀젼 시퀀싱, 나노포어 시퀀싱, 또는 당업계에 공지된 다른 시퀀싱 기술을 포함할 수 있으나 이에 제한되지 않는다. 일부 구현예에서, 예컨대 본원에 개시된, 메틸화 상태를 측정하는 방법은 예를 들어 염기쌍 분해(base-pair resolution)로, 전체 게놈 시퀀싱을 포함할 수 있다.
소정의 특정 구현예에서, 예를 들어 본원에 기재된 바와 같이, 다른 기술 중에서, MSRE-qPCR을 사용하여 단일 메틸화 좌위이거나 이를 포함하는 대장암 메틸화 바이오마커의 메틸화 상태를 결정할 수 있다. 소정의 특정 구현예에서, 예를 들어 본원에 기재된 바와 같이, 다른 기술 중에서, MSRE-qPCR을 사용하여 2 이상의 메틸화 좌위거나 이를 포함하는 대장암 및/또는 진행성 선종 메틸화 바이오마커의 메틸화 상태를 결정할 수 있다. 소정의 특정 구현예에서, 예를 들어 본원에 기재된 바와 같이, 다른 기술 중에서 MSRE-qPCR을 사용하여 단일 차등 메틸화 영역(DMR)이거나 이를 포함하는 대장암 및/또는 진행성 선종 메틸화 바이오마커의 메틸화 상태를 결정할 수 있다. 소정의 특정 구현예에서, 예를 들어 본원에 기재된 바와 같이, 다른 기술 중에서 MSRE-qPCR 사용하여 2 이상의 DMR이거나 이를 포함하는 대장암 및/또는 진행성 선종 메틸화 바이오마커의 메틸화 상태를 결정할 수 있다. 소정의 특정 구현예에서, 예를 들어 본원에 기재된 바와 같이, 다른 기술 중에서 MSRE-qPCR 사용하여 단일 메틸화 부위거나 이를 포함하는 대장암 및/또는 진행성 선종 메틸화 바이오마커의 메틸화 상태를 결정할 수 있다. 소정의 특정 구현예에서, 예를 들어 본원에 기재된 바와 같이, 다른 기술 중에서 MSRE-qPCR 사용하여 2 이상의 메틸화 부위거나 이를 포함하는 대장암 및/또는 진행성 선종 메틸화 바이오마커의 메틸화 상태를 결정할 수 있다. 다양한 구현예에서, 예를 들어, 본원에 기재된 바와 같이, 대장암 및/또는 진행성 선종 메틸화 바이오마커는 본원에 제공된 임의의 대장암 및/또는 진행성 선종 메틸화 바이오마커일 수 있다. 본원은 무엇보다도 DMR의 증폭, 예컨대 표 5에서 식별된 DMR의 증폭을 위한 올리고뉴클레오티드 프라이머 쌍을 포함한다.
소정의 특정 구현예에서, 예를 들어, 본원에 기재된 바와 같이, cfDNA 샘플은 대상체 혈장으로부터 유래되고 AciI, Hin6I, HpyCH4IV 및 HpaII(예컨대, AciI, Hin6I 및 HpyCH4IV) 중 하나 이상이거나 이를 포함하는 MSRE(메틸화 민감성 제한 효소)와 접촉된다. 절단된(digested) 샘플은 하나 이상의 DMR의 올리고뉴클레오티드 프라이머 쌍, 예를 들어 하기 표 5에 제공된 하나 이상의 올리고뉴클레오티드 프라이머 쌍으로 증폭될 수 있다. 표 5는 염색체 번호(Chr. No.), 고유 ID(unique ID, UID), 염색체 상의 유전자 영역의 시작 위치(start position), 염색체 상의 유전자 영역의 종료 위치(end position), 영역의 폭(Seq. Width) 및 MSRE-qPCR에 사용된 정방향 프라이머(Fp)와 역방향 프라이머(Rp)의 서열번호(SEQ ID No.), 및 정방향 및 역방향 프라이머에 의해 증폭된 DNA 영역의 SEQ ID NO. 절단된 DNA(digested DNA), 예컨대, 사전 증폭된 절단된 DNA는 하나 이상의 DMR의 올리고뉴클레오티드 프라이머 쌍, 예를 들어 하기 표 5에 제공된 하나 이상의 올리고뉴클레오티드 프라이머 쌍을 사용하여 qPCR로 정량화할 수 있다. 그런 다음 qPCR Ct 값은 결정되고 각 DMR 앰플리콘의 메틸화 상태를 결정하는 데 사용될 수 있다. 더 낮은 Ct 값(따라서 더 높은 45 - Ct 값)은 더 높은 메틸화 상태에 해당하며, 대장암 및/또는 진행성 선종이 있는 대상체에서 과메틸화를 나타낸다.
표 5. 상응하는 프라이머 쌍으로 식별된 40개의 상위 DMR. | ||||||||
염색체 번호 |
UID | 시작 위치 |
종료 위치 |
서열 폭 (Seq. Width) |
유전자 (주석된 경우) |
정방향 프라이머 SEQ ID NO: |
역방향 프라이머 SEQ ID NO: |
증폭된 영역 SEQ ID NO. |
21 | UDX_224.14 | 26844768 | 26844877 | 110 | ADAMTS1 | 70 | 110 | 150 |
4 | UDX_198.5_1 | 61202278 | 61202367 | 90 | ADGRL3 | 71 | 111 | 151 |
8 | UDX_277.7_2 | 52565318 | 52565408 | 9 | ALKAL1 | 72 | 112 | 152 |
10 | UDX_17_2 | 16520591 | 16520719 | 129 | C1QL3 | 73 | 113 | 153 |
18 | UDX_124.1 | 28177440 | 28177533 | 94 | CDH2 | 74 | 114 | 154 |
9 | UDX_230 | 21970919 | 21971017 | 99 | CDKN2A, CDKN2B-AS1 | 75 | 115 | 155 |
7 | UDX_66.2 | 154304858 | 154304969 | 112 | DPP6 | 76 | 116 | 156 |
12 | UDX_197.3 | 63668267 | 63668380 | 114 | DPY19L2 | 77 | 117 | 157 |
3 | UDX_222.1 | 96813876 | 96813987 | 112 | EPHA6 | 78 | 118 | 158 |
3 | UDX_222.11_2 | 96814055 | 96814137 | 83 | EPHA6 | 79 | 119 | 159 |
10 | UDX_137.1 | 127736483 | 127736589 | 107 | FOXI2 | 80 | 120 | 160 |
10 | UDX_272.3_2 | 26211886 | 26211963 | 78 | GAD2, MYO3A | 81 | 121 | 161 |
10 | UDX_272.4 | 26212057 | 26212160 | 104 | GAD2, MYO3A | 82 | 122 | 162 |
15 | UDX_120.2 | 45378328 | 45378410 | 83 | GATM | 83 | 123 | 163 |
5 | UDX114.1_1 | 180353710 | 180353815 | 103 | GFPT2 | 84 | 124 | 164 |
4 | UDX_185.1 | 176001299 | 176001402 | 104 | GPM6A | 85 | 125 | 165 |
16 | UDX_30_1 | 87601410 | 87601511 | 102 | JPH3 | 86 | 126 | 166 |
2 | UDX_121.1 | 5673895 | 5673976 | 82 | LINC01248 | 87 | 127 | 167 |
8 | UDX_174.3 | 17026935 | 17027030 | 96 | MICU3 | 88 | 128 | 168 |
10 | UDX_251.2_1 | 25934064 | 25934130 | 67 | MYO3A, LOC101929073 | 89 | 129 | 169 |
20 | UDX_29_1 | 56925429 | 56925505 | 77 | 주석 없음 | 90 | 130 | 170 |
18 | UDX_24_1 | 75916502 | 75916621 | 120 | 주석 없음 | 91 | 131 | 171 |
14 | UDX_107.2 | 77966334 | 77966434 | 101 | 주석 없음 | 92 | 132 | 172 |
1 | UDX_244_2 | 107140057 | 107140173 | 117 | NTNG1 | 93 | 133 | 173 |
21 | UDX_128.1 | 33070632 | 33070711 | 80 | OLIG1 | 94 | 134 | 174 |
9 | UDX_94.2_2 | 36986522 | 36986581 | 60 | PAX5 | 95 | 135 | 175 |
12 | UDX_274.2_1 | 15322353 | 15322435 | 83 | PTPRO, RERG | 96 | 136 | 176 |
12 | UDX_274.3_1 | 15322478 | 15322549 | 72 | PTPRO, RERG | 97 | 137 | 177 |
15 | UDX_260.1 | 79089690 | 79089791 | 102 | RASGRF1 | 98 | 138 | 178 |
15 | UDX_260.2_1 | 79089784 | 79089858 | 75 | RASGRF1 | 99 | 139 | 179 |
14 | UDX181.2_1 | 70189011 | 70189101 | 91 | SLC8A3, LOC646548 | 100 | 140 | 180 |
14 | UDX181.4_1 | 70189228 | 70189296 | 69 | SLC8A3, LOC646548 | 101 | 141 | 181 |
17 | UDX_1_1 | 35448307 | 35448407 | 101 | SLFN13 | 102 | 142 | 182 |
1 | UDX_117.2 | 114153294 | 114153403 | 110 | SYT6 | 103 | 143 | 183 |
2 | UDX_221.2_2 | 136766100 | 136766189 | 90 | THSD7B | 104 | 144 | 184 |
2 | UDX_85.2_1 | 209771686 | 209771755 | 70 | UNC80 | 105 | 145 | 185 |
19 | UDX_217.4_1 | 36666981 | 36667097 | 117 | ZNF461 | 106 | 146 | 186 |
19 | UDX_250.1 | 37551665 | 37551748 | 84 | ZNF540, ZNF571-AS1 | 107 | 147 | 187 |
19 | UDX_258.2_1 | 36973533 | 36973602 | 70 | ZNF568 | 108 | 148 | 188 |
19 | UDX_242_2 | 56393661 | 56393732 | 72 | ZNF582-AS1, ZNF582 | 109 | 149 | 189 |
당업자는 표 5에 제공된 올리고뉴클레오티드 프라이머쌍이 본원에 명시된 대장암 및/또는 진행성 선종 메틸화 바이오마커의 임의의 조합에 따라 사용될 수 있다는 것을 이해할 것이다. 당업자는 표 5의 올리고뉴클레오티드 프라이머쌍이 DRM의 특정 원하는 조합을 분석하기 위해 주어진 분석에 개별적으로 포함되거나 포함되지 않을 수 있음을 인식할 것이다.
당업자는 다른 올리고뉴클레오티드 프라이머쌍이 사용될 수 있지만 유용한 DMR 앰플리콘을 생성하기 위한 올리고뉴클레오티드 프라이머의 선택 및 페어링이 중요하고 상당한 기여를 나타낸다는 것을 추가로 이해할 것이다.
당업자는 qPCR을 위한 방법, 시약 및 프로토콜이 당업계에 잘 알려져 있음을 추가로 이해할 것이다. 기존의 PCR과 달리 qPCR은 증폭-반응성 형광 시스템을 사용하여, 예컨대 형광 검출능이 있는 열순환기와 조합하여, 시간 경과에 따른 증폭(예컨대 각 증폭 주기의 끝에서)에서 앰플리콘의 생성을 검출할 수 있다. qPCR에 사용되는 두 가지 일반적인 유형의 형광 리포터는 (i) 비결합된 경우 보다 결합된 경우 실질적으로 더 밝게 형광되는 이중가닥 DNA 결합 염료; 및 (ii) 표지된 올리고뉴클레오티드(예컨대, 표지된 올리고뉴클레오티드 프라이머 또는 표지된 올리고뉴클레오티드 프로브)를 포함한다.
당업자는 본원에 제공된 대장암에 대한 스크리닝 방법에서 복수의 메틸화 좌위(예컨대, 복수의 DMR)가 메틸화 상태에 대해 분석되는 구현예에서, 각 메틸화 좌위의 메틸화 상태는 다양한 형태 중 임의의 것으로 측정되거나 표시되고, 복수의 메틸화 좌위의 메틸화 상태(바람직하게는 각각이 동일, 유사, 또는 필적하는 방식으로 측정 및/또는 표시됨)가 함께 또는 누적적으로 다양한 형태 중 임의의 것으로 분석되거나 표시된다. 다양한 구현예에서, 각각의 메틸화 좌위의 메틸화 상태는 Ct 값으로서 측정될 수 있다. 다양한 구현예에서, 예컨대, 본원에 개시된, 각각의 메틸화 좌위의 메틸화 상태는 측정된 샘플과 기준 사이의 Ct 값의 차이로서 표현될 수 있다. 다양한 구현예에서, 예컨대, 본원에 개시된, 각 메틸화 좌위의 메틸화 상태는, 예를 들어, 각 메틸화 좌위를 과메틸화되거나 과메틸화되지 않은 것으로 식별함으로써 기준에 대한 정성적 비교로서 나타낼 수 있다.
단일 메틸화 좌위가 분석되는 예컨대, 본원에 개시된, 일부 구현예에서, 단일 메틸화 좌위의 과메틸화는 대상체가 대장암 및/또는 진행성 선종을 앓거나 앓을 가능성이 있다는 진단을 구성하는 반면, 단일 메틸화 좌위의 과메틸화 부재는 대상체가 대장암 및/또는 진행성 선종을 앓고 있지 않을 것 같다는 진단을 구성한다. 일부 구현예에서, 예컨대, 본원에 개시된, 분석된 복수의 메틸화 좌위의 단일 메틸화 좌위(예컨대, 단일 DMR)의 과메틸화는 대상체가 대장암 및/또는 진행성 선종을 앓고 있거나 이를 앓고 있을 가능성이 있다는 진단을 구성하는 반면, 복수의 분석된 메틸화 좌위는 대상체가 둘 모두의 병증(affliction)을 앓지 않을 것 같다는 진단을 구성한다. 일부 구현예에서, 예컨대, 본원에 개시된, 복수의 분석된 메틸화 좌위 중 결정된 메틸화 좌위의 과메틸화 백분율(예컨대, 미리 결정된 백분율)의 과메틸화(예컨대, 적어도 10%(예컨대, 적어도 10%, 적어도 20%, 적어도 30%, 적어도 40%, 적어도 50%, 적어도 60%, 적어도 70%, 적어도 80%, 적어도 90%, 또는 100%))는 대상체가 대장암을 앓거나 또는 앓을 가능성이 있다는 진단을 구성하는 반면, 복수의 분석된 메틸화 좌위 중 결정된 메틸화 좌위의 과메틸화 백분율(예컨대, 미리 결정된 백분율)의 과메틸화(예컨대, 적어도 10%(예컨대, 적어도 10%, 적어도 20%, 적어도 30%, 적어도 40%, 적어도 50%, 적어도 60%, 적어도 70%, 적어도 80%, 적어도 90%, 또는 100%))의 과메틸화의 부재는 대상체가 대장암 또는 진행성 선종을 앓을 것 같지 않다는 진단을 구성한다. 일부 구현예에서, 예컨대, 본원에 개시된, 복수의 분석된 메틸화 좌위(예컨대, 2, 3, 4, 5, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 또는 40개의 DMR) 중 메틸화 좌위의 결정된 수(예컨대, 예정된 수)(예컨대, 적어도 1, 2, 3, 4, 5, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 또는 40개 좌위 DMR)의 과메틸화는 대상체가 대장암 및/또는 진행성 선종을 앓고 있거나 이를 가능성이 있다는 진단을 구성하는 반면, 복수의 분석된 메틸화 좌위(예컨대, 2, 3, 4, 5, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 또는 40개의 DMR) 중 메틸화 좌위의 결정된 수(예컨대, 예정된 수)(예컨대, 적어도 1, 2, 3, 4, 5, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27 , 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 또는 40개의 DMR)의 과메틸화의 부재는 대상체가 대장암 또는 진행성 선종을 앓을 것 같지 않다는 진단을 구성한다.
일부 구현예에서, 예컨대, 본원에 개시된, 복수의 메틸화 좌위(예컨대, 복수의 DMR)의 메틸화 상태를 정성적으로 또는 정량적으로 측정하고 복수의 메틸화 좌위 각각에 대한 측정치를 조합하여 진단을 제공한다. 일부 구현예에서, 예컨대, 본원에 개시된, 복수의 메틸화 좌위 각각의 정량적으로 측정된 메틸화 상태는 개별적으로 가중되고, 가중 값은 진단을 제공하기 위해 기준과 비교할 수 있는 단일 값을 제공하도록 조합된다. 이러한 접근법의 일예를 제공하기 위해, 본 명세서의 복수의 메틸화 좌위의 메틸화 상태를 분석하여 진단을 생성하기 위해 지지 벡터 머신(support vector machine, SVM) 알고리즘이 사용될 수 있다. 서포트 벡터 머신 알고리즘의 적어도 하나의 목적은 최대 마진, 즉 두 클래스의 데이터 포인트 사이의 최대 거리를 갖는 평면을 찾기 위한 목적으로 데이터 포인트를 뚜렷하게 분류하는 N 차원 공간(N- 특징의 수)에서 초평면을 식별하는 것이다. 본 실시예에서 논의된 바와 같이, SVM 모델은 트레이닝 샘플 세트(예컨대, 트레이닝 대상체군)에서 유래한 마커 값(예컨대, Ct 값)에 의거하며, 마커 값은 지지 벡터 값으로 변환되며 이를 기반으로 예측이 이루어진다. SVM 모델을 검증 샘플 세트의 신규 샘플에 적용할 때 샘플은 모델 벡터 공간에 매핑되고, 예컨대 두 조건 간의 갭에 대한 각 신규 샘플 위치에 기반하여, 제1 조건(예컨대, 대조군), 제2 조건(예컨대, 대장암으로 진단된 군), 또는 제3 군(예컨대, 진행성 선종으로 진단된 군)에 속할 확률을 갖는 것으로 분류된다. 당업자는 관련 조성물 및 방법이 식별되면, R-패키지의 예측 () 기능으로 정의된 SVM 알고리즘과 조합하여 벡터 값을 사용하여(하이퍼텍스트 트랜스퍼 프로토콜 시큐어(HTTPS)://cran.r-project.org/web/packages/e1071/index.html 참조, SVM이 여기에 참조로 포함됨) 새 샘플에 대한 예측을 쉽게 생성할 수 있음을 이해할 것이다. 따라서, 본 명세서에 개시된 대장암 및/또는 진행성 선종 진단을 위한 조성물 및 방법을 사용하면(그리고 그때만) R-패키지의 예측 () 기능과 조합된 알고리즘 입력 정보를 활용하는 예측 모델의 생성(하이퍼텍스트 트랜스퍼 프로토콜 시큐어(HTTPS)://cran.r-project.org/web/packages/e1071/index.html 참조, SVM이 여기에 참조로 포함됨)을 통해 대장암 및/또는 진행성 선종 진단을 제공하는 것은 간단할 것이다. 당업자는 본 명세서를 사용하면, SVM 벡터의 생성은 본원에 제공되고 달리 당업계에 공지된 방법에 따라 달성될 수 있음을 이해할 것이다.
적용
본 명세서의 방법 및 조성물은 임의의 다양한 적용에서 사용될 수 있다. 예를 들어, 본 명세서의 방법 및 조성물은 대장암 또는 진행성 선종을 스크리닝하거나 스크리닝을 보조하기 위해 사용될 수 있다. 다양한 예에서, 예컨대, 본원에 개시된, 본 명세서의 방법 및 조성물을 사용한 스크리닝은 초기 대장암을 포함하나 이에 제한되지 않는 임의의 병기의 대장암을 검출할 수 있으며 진행성 선종을 검출할 수 있다. 일부 구현예에서, 예컨대, 본원에 개시된, 본 명세서의 방법 및 조성물을 사용한 대장암 및 진행성 선종 스크리닝은 50세 이상, 예를 들어 50, 55, 60, 65, 70, 75, 80, 85, 또는 90세 이상의 개체에게 적용된다. 일부 구현예에서, 예컨대, 본원에 개시된, 본 명세서의 방법 및 조성물을 사용한 대장암 및 진행성 선종 스크리닝은 20세 이상의 개체, 예를 들어 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75세, 80세, 85세 또는 90세 이상의 개체에 적용된다. 일부 구현예에서, 예컨대, 본원에 개시된, 본 명세서의 방법 및 조성물을 사용한 대장암 및/또는 진행성 선종 스크리닝은 20 내지 50세, 예를 들어 20 내지 30세, 20 내지 40세, 20 내지 50세, 30세 내지 40세, 30세 내지 50세, 또는 40세 내지 50세의 개체에 적용된다. 다양한 구현예에서, 예컨대, 본원에 개시된, 본 명세서의 방법 및 조성물을 사용한 대장암 및/또는 진행성 선종 스크리닝은 복통 또는 소화불편감(abdominal discomfort)을 경험하는 개체, 예를 들어 진단되지 않거나 불완전하게 진단된 복통 또는 소화불편감을 경험하는 개체에 적용된다. 다양한 구현예에서, 예컨대, 본원에 개시된, 본 명세서의 방법 및 조성물을 사용한 대장암 및/또는 진행성 선종 스크리닝은 대장암과 연관될 가능성이 있는 증상을 경험하지 않는 개체에 적용된다. 따라서, 특정 구현예에서, 예컨대, 본원에 개시된, 본 명세서의 방법 및 조성물을 사용한 대장암 스크리닝은 적어도 대장암의 후기 또는 비-초기 병기와 관련하여 완전히 또는 부분적으로 예방적 또는 예방적이다.
다양한 구현예에서, 예컨대, 본원에 개시된, 본 명세서의 방법 및 조성물을 사용한 대장암 및/또는 진행성 선종 스크리닝은 무증상 인간 대상체에 적용될 수 있다. 본 명세서에서 사용된 바와 같이, 대상체가 보고하지 않거나 및/또는 비침습적으로 관찰 가능한 표시(예컨대, 장치 기반 프로빙, 조직 샘플 분석, 체액 분석, 수술 또는 대장암 검진 중 하나, 여러 개 또는 모두 없이), 대상체가 대장암 및/또는 진행성 선종을 앓을 가능성이 있다는 의학적으로 합리적인 의심을 뒷받침하는 대장암 및/또는 진행성 선종의 충분한 특성에 의해 입증하지 않는다면 대상체는 "무증상"으로 지칭될 수 있다. 초기 대장암 또는 진행성 선종의 존재의 검출은 본 명세서의 방법 및 조성물에 따라 선별된 무증상 개체에서 특히 가능성이 있다.
다양한 구현예에서, 예컨대 본원에서 개시된, 본 명세서의 방법 및 조성물을 사용한 대장암 및/또는 진행성 선종 스크리닝은 증상이 있는 인간 대상체에 적용될 수 있다. 본 명세서에서 사용된 바와 같이, 대상체가 보고하거나 및/또는 비침습적으로 관찰 가능한 표시(예컨대, 장치 기반 프로빙, 조직 샘플 분석, 체액 분석, 수술 또는 대장암 검진 중 하나, 여러 개 또는 모두 없이), 대상체가 대장암, 진행성 선종 및/또는 암을 앓을 가능성이 있다는 의학적으로 합리적인 의심을 뒷받침하는 대장암 및/또는 진행성 선종의 충분한 특성에 의해 입증한다면 대상체는 “유증상”으로 지칭될 수 있다. 대장암 및 진행성 선종의 증상에는 지속적인(예컨대, 3일 이상 지속되는) 배변 습관의 변화(설사, 변비 또는 가느다란 대변), 배변으로 완화되지 않는 배변이 필요하다는 느낌, 직장 출혈(예컨대 밝은 적색 혈액), 대변 혈액(변이 검게 나타날 수 있음), 복부 경련, 복통, 쇠약, 피로, 의도하지 않은 체중 감소, 빈혈 및 이들의 조합을 포함할 수 있으나 이에 제한되지 않는다. 당업자는 단독으로 대장암을 나타내거나 의심을 제기하지 않는 개별 증상이 조합되어 제시될 때, 예컨대, 비제한적인 일례로 복부 경련과 대변 내 혈액의 조합, 대장암 및/또는 진행성 선종을 나타낼 수 있음을 이해할 것이다.
당업자는 대장암 및 진행성 선종에 대한 정기적, 방지적 및/또는 예방적 스크리닝이 대장암, 및/또는 특히 초기 암의 진단을 개선한다는 것을 이해할 것이다. 상기 언급된 바와 같이, 초기 암은 적어도 하나의 암 병기 시스템에 따르면 대장암의 0 내지 II C기를 포함한다. 따라서, 본원은 무엇보다도 초기 대장암의 진단 및 치료에 특히 유용한 방법 및 조성물을 제공한다. 일반적으로, 특히 본 명세서에 따른 대장암 스크리닝이 매년 수행되고/거나 대상체가 스크리닝 시점에 무증상인 구현예에서(예컨대, 본원에서 개시된), 본 발명의 방법 및 조성물은 특히 초기 대장암 및/또는 진행성 선종을 검출할 가능성이 높다.
다양한 구현예에서, 예컨대, 본원에서 개시된, 본 명세서에 따른 대장암 또는 진행성 선종 스크리닝은 주어진 대상체에 대해 1회 또는 주어진 대상체에 대해 여러번 수행된다. 다양한 구현예에서, 본 명세서에 따른, 예컨대 본원에서 개시된, 스크리닝은 정기적으로, 예를 들어, 6개월마다, 매년, 2년마다, 3년마다, 4년마다, 5년마다 또는 10년마다 수행된다.
예컨대 본원에서 개시된, 다양한 구현예에서, 본원에 개시된 방법 및 조성물을 사용한 대장암 및/또는 진행성 선종에 대한 스크리닝은 대장암 및/또는 진행성 선종의 진단을 제공할 것이다. 예컨대 본원에서 개시된 다른 경우에, 본원에 개시된 방법 및 조성물을 사용한 대장암 및/또는 진행성 선종에 대한 스크리닝은 (예컨대 진행성 선종의 발견을 통한) 대장암 진단의 지표이지만 대장암 및/또는 진행성 선종 진단에 대해 확정적이지는 않다. 본 명세서의 방법 및 조성물이 대장암 및/또는 진행성 선종에 대한 스크리닝에 사용되는 다양한 경우에, 예컨대 본원에 개시된, 본 명세서의 방법 및 조성물을 사용한 스크리닝은 추가 진단-확인 검정이 뒤따를 수 있으며, 이 추가 검정은 이전 스크리닝, 예컨대 본 명세서에 따른 스크리닝에 따른 진단을 확인, 지지, 약화, 또는 배격할 수 있다. 본원에서 사용되는, 진단-확인 검정은 의사에 의해 확정적인 것으로 인정된 진단을 제공하는 대장암 및/또는 진행성 선종 분석, 예컨대, 대장내시경 기반 진단일 수 있고, 또는 이전 진단이 정확할 가능성을 실질적으로 증가 또는 감소시키는 대장암 및/또는 진행성 선종 분석, 예컨대, 본 명세서에 따른 스크리닝에 의한 진단일 수 있다. 진단-확인 검정에는 기존 스크리닝 기술이 포함될 수 있으며, 이는 특히 초기 대장암의 검출에서 민감도, 특이도 및 비침습성 중 하나 이상과 관련하여 일반적으로 개선이 필요한 것이다.
일부 사례에서 예컨대 본원에 개시된, 진단-확인 검정은 예를 들어 대장 내시경에 의한 대상 조직의 시각적 또는 구조적 검사이거나 이를 포함하는 검사이다. 일부 구현예에서, 예컨대 본원에 개시된, 대장내시경은 조직학적 분석을 포함하거나 이에 후속된다. 대장암에 대한 시각적 및/또는 구조적 분석에는 비정상 조직 및/또는 구조에 대한 결장 및/또는 직장의 구조 검사가 포함될 수 있다. 육안 및/또는 구조적 검사는 예를 들어 직장을 통한 스코프 사용 또는 CT-스캔에 의해 수행될 수 있다. 일부 예에서, 예컨대 본원에 개시된, 진단 확인 검정은 예를 들어 조직학적 분석을 포함하거나 후속하는 대장내시경 검사이다. 일부 보고서에 따르면, 대장내시경은 현재 우세하거나 가장 많이 의존하는 진단-확인 검정이다.
컴퓨터 단층촬영(CT)을 기반으로 하는 또 다른 시각적 및/또는 구조적 진단-확인 검정은 가상 대장내시경이라고도 하는 CT 대장조영술이다. CT 스캔은 결장의 치수 표현을 생성하기 위해 결장 및/또는 직장의 수많은 x-선 이미지를 사용한다. 진단-확인 검정으로 유용하지만 일부 보고서에서는 CT 대장 조영술이 대장 내시경 검사를 대체하기에 충분하지 않다고 제안한다. 최소한 어느정도 의사가 조직학적 분석을 위해 조직을 얻기 위해 대상체의 결장에 물리적으로 접근하지 않았기 때문이다.
또 다른 진단-확인 검정은 S상 대장내시경(sigmoidoscopy)이 될 수 있다. S상 대장내시경에서 결장 및/또는 직장의 일부를 영상화하기 위해 직장을 통해 S상 결장경을 사용한다. 일부 보고서에 따르면 S상 대장내시경은 널리 사용되지 않는다.
구체적 스크리닝 기술 중 하나는 대변 기반 스크리닝 테스트(Cologuard®(Exact Sciences Corporation, Madison, Wl, United States)로, 돌연변이 및 메틸화와 같은 비정상적인 변형에 대한 DNA 분석과 FIT 분석을 결합한다. Cologuard® 테스트 FIT 분석 단독에 비해 개선된 감도를 나타내지만 낮은 준수율로 인해 임상적으로 비실용적이거나 비효율적일 수 있으며, 낮은 준수율은 적어도 부분적으로는 대변 기반 분석 사용을 싫어하는 대상체 때문이다(예컨대, doi: 10.1056/NEJMc1405215 (예컨대, 2014 N Engl J Med. 371 (2): 184- 188) 참조) Cologuard® 테스트는 적격 인구의 거의 절반을 선별 프로그램에서 배제하는 것으로 보인다(예컨대, van der Vlugt 2017 Br J Cancer. 1 16(1):44-49 참조). 예를 들어 혈액 기반 분석에 의한 본원에 제공된 스크리닝의 사용은 대장암에 대한 스크리닝을 선택하는 개인의 수를 증가시킬 것이다(예컨대, Adler 2014 BMC Gastroenterol. 14:183; Liles 2017 Cancer Treatment and Research Communications 10: 27-31 참조). 현재 알려진 바에 따르면, 대장암을 위한 유일한 현존 스크리닝 기술인 Epiprocolon만이 FDA 승인을 받았고 CE-IVD 마크를 받았으며 혈액 기반이다. Epiprocolon은 SEPT9 유전자의 과메틸화를 기반으로 한다. 에피프로콜론 테스트는 68%의 민감도와 22%의 진행성성 선종 민감도로 대장암 검출에 대한 낮은 정확도로 어려움을 겪고 있다(예컨대, Potter 2014 Clin Chem. 60(9):1 183-91 참조). 무엇보다도, 높은 및/또는 향상된 특이도 및/또는 민감도로 높은 대상체 순응도를 달성할 가능성이 있는 비침습성 대장암 및 진행성 선종 스크린이 당업계에 요구된다.
다양한 구현예에서, 예컨대 본원에서 개시된, 본 명세서의 방법 및 조성물에 따른 스크리닝은 예를 들어 초기 대장암 진단, 예컨대 진행성 선종의 검출을 통한,에 의해 대장암 사망률을 감소시킨다. 데이터는 대장암 검진이 대장암 사망률을 감소시킨다다(예컨대, Shaukat 2013 N Engl J Med. 369(12):1 106-14 참조). 더욱이, 대장암은 적시에 검진을 받지 않으면 암이 초기 단계를 지나야 발견될 수 있기 때문에 치료하기가 특히 어렵다. 적어도 이러한 이유로 대장암 치료는 종종 성공하지 못한다. 대장암 결과의 개체군 전체 개선을 최대화하기 위해, 본 명세서에 따른 스크리닝의 활용은 예를 들어 광범위한 스크리닝을 보장하기 위해 적격한 대상체의 모집과 조합될 수 있다.
다양한 구현예에서, 예컨대 본원에 개시된, 본원에 개시된 하나 이상의 방법 및/또는 조성물을 포함하는 대장암 및/또는 진행성 선종의 스크리닝은 대장암의 치료, 예를 들어, 초기 대장암의 치료가 후속된다. 다양한 구현예에서, 예컨대 본원에 개시된, 대장암, 예를 들어 초기 대장암의 치료는 수술, 방사선 요법 및 화학요법 중 하나 이상을 포함하는 치료 요법의 투여를 포함한다. 다양한 구현예에서, 예컨대 본원에 개시된, 대장암, 예를 들어 초기 대장암의 치료는 병기 0 대장암, 병기 I 대장암 및/또는 병기 II 대장암의 치료를 위해 본원에 제공된 치료 중 하나 이상을 포함하는 치료 요법의 투여를 포함한다.
다양한 구현예에서, 예컨대 본원에 개시된 바와 같은, 진행성 선종 및/또는 대장암을 위한 스크리닝은 대변 기반 분석이다. 일반적으로 육안 또는 구조적 검사 대신 대변 기반 분석을 사용하는 경우 육안 또는 구조적 검사를 사용할 때 요구되는 것보다 더 높은 빈도로 사용하는 것이 권장된다. 일부 예에서, 예컨대 본원에 개시된 바와 같은, 검정은 guiac 기반 대변 잠혈 검사 또는 대변 면역화학 검사(gFOBT/FIT)이다(예컨대, Navarro 2017 World J Gastroenterol. 23(20):3632-3642 참조, 이는 대장암 분석과 관련하여 본원에 참고로 포함됨). FOBT 및 FIT는 때때로 대장암의 진단에 사용된다(예컨대, Nakamura 2010 J Diabetes Investig. Oct 19; 1(5):208-11 참조, 이는 대장암 검정과 관련하여 본원에 참조로 포함됨). FIT는 대변에서 잠혈의 검출을 기반으로 하며, 그 존재는 종종 대장암 또는 진행성 선종의 표지이지만 종종 육안으로 식별할 수 있을 만큼 충분한 양은 아니다. 예를 들어, 일반적인 FIT에서 검사는 헤모글로빈 특이적 시약을 사용하여 대변 샘플에서 잠혈을 검사한다. 다양한 경우에, 예컨대 본원에 개시된 바와 같은, FIT 키트는 가정에서 개인이 사용하기에 적합하다. FIT는 해마다 사용할 것을 권장할 수 있다. FIT는 대장암 또는 진행성 선종의 확정적인 진단을 위한 충분한 진단 정보를 제공하기 위해서는 일반적으로 의존하지 않는다.
다양한 구현예에서, 예컨대 본원에 개시된 바와 같은, 진행성 선종 및/또는 대장암을 위한 스크리닝은 화학 반응에 의해 대변의 잠혈을 감지하도록 설계된 gFOBT도 포함된다. FIT와 마찬가지로 gFOBT는 해마다 사용할 것을 권장할 수 있다. gFOBT는 대장암 또는 진행성 선종의 확정적인 진단을 위한 충분한 진단 정보를 제공하기 위해서는 일반적으로 의존하지 않는다.
일부 예에서, 예컨대 본원에 개시된 바와 같은, 스크리닝 분석은 대변 DNA 검사도 포함할 수 있다. 대장암 또는 진행성 선종에 대한 대변 DNA 검사는 대변 샘플에서 대장암 및/또는 진행성 선종의 특징적인 DNA 서열을 식별하도록 설계할 수 있다. 다른 진단-확인 검정이 없을 경우, 대변 DNA 검사를 3년마다 사용하도록 권장할 수 있다. 대변 DNA 검사는 대장암 및/또는 진행성 선종의 확정적인 진단을 위한 충분한 진단 정보를 제공하기 위해서는 일반적으로 의존하지 않는다.
다양한 구현예에서, 예컨대 본원에 개시된, 대장암의 치료는 예를 들어 국부 절제(예컨대, 대장내시경에 의한) 부분 결장 절제술 또는 완전 결장 절제술에 의한 하나 이상의 암 조직의 외과적 제거에 의한, 초가 대장암, 예컨대 병기 0 대장암 또는 병기 I 대장암의 치료를 포함한다.
다양한 구현예에서, 예컨대 본원에 개시된, 대장암의 치료는 암 조직의 외과적 제거(예컨대, 국부 절제(예컨대, 대장내시경에 의한) 부분 결장 절제술 또는 완전 결장 절제술에 의한), 확인된 대장암 조직에 가까운 림프절을 제거하는 수술, 및 화학요법(예컨대, 5-FU 및 류코보린, 옥살리플라틴 또는 카페시타빈 중 하나 이상의 투여)에 의한, 초기 대장암, 예컨대 병기 II 대장암의 치료를 포함한다.
다양한 구현예에서, 예컨대 본원에 개시된, 대장암의 치료는 암 조직의 외과적 제거(예컨대, 국부 절제(예컨대, 대장내시경에 의한) 부분 결장 절제술 또는 완전 결장 절제술에 의한), 확인된 대장암 조직에 가까운 림프절의 외과적 제거, 및 화학요법(예컨대, 5-FU 및 류코보린, 옥살리플라틴 또는 카페시타빈 중 하나 이상, 예컨대, (i) 5-FU 및 류코보린 (ii) 5-FU, 류코보린 및 옥살리플라틴(예: FOLFOX), 또는 (iii) 카페시타빈 및 옥살리플라틴(예: CAPEOX))의 조합의 투여), 및 방사선 요법 중 하나 이상에 의한, 예컨대 병기 III 대장암의 치료를 포함한다.
다양한 구현예에서, 예컨대 본원에 개시된, 대장암의 치료는, 암 조직의 외과적 제거(예컨대, 국부 절제(예컨대, 대장내시경에 의한) 부분 결장 절제술 또는 완전 결장 절제술에 의한), 확인된 대장암 조직에 가까운 림프절의 외과적 제거, 전이의 외과적 제거, 화학요법(예컨대, 5-FU, 류코보린, 옥살리플라틴, 카페시타빈, 이리노테칸, VEGF 표적 치료제(예컨대, 베바시주맙, 지브-애플리버셉트, 또는 라무시루맙), EGFR 표적 치료제(예컨대 세툭시맙 또는 파니투무맙), 레고라페닙, 트리플루리딘 및 티피라실, 예컨대, (i) 5-FU 및 류코보린, (ii) 5-FU, 류코보린,및 옥살리플라틴(예: FOLFOX), (iii) 카페시타빈 및 옥살리플라틴(예컨대, CAPEOX), (iv) 류코보린, 5-FU, 옥살리플라틴 및 이리노테칸(FOLFOXIRI), 및 (v) 트리플루리딘 및 티피라실(Lonsurf)의 조합으로 또는 이들을 포함하여 투여), 방사선 치료, 간동맥 주입(예컨대 암이 간으로 전이된 경우), 종양 절제, 종양 색전술, 결장 스텐트, 결장 절제술, 결장루(예컨대, 전환 결장루) 및 면역 요법(예컨대, 펨브롤리주맙) 중 하나 이상에 의한 병기 IV 대장암의 치료를 포함한다.
본원에서 제공되는 대장암의 치료가, 예컨대 의사에 의해 결정된 바에 따라, 단독으로 또는 임의의 조합으로 임의의 순서, 요법 및/또는 치료 프로그램으로 이용될 수 있다는 것은 당업자가 이해할 것이다. 당업자는 이전에 암 또는 대장암을 앓았던 대상체, 예를 들어 재발성 대장암을 갖는 것으로 진단된 대상체의 초기 암에 대하여 고급 치료 옵션이 적절할 수 있음을 추가로 이해할 것이다.
일부 구현예에서, 예컨대 본원에 개시된 바와 같이, 본원에 제공된 대장암 및 진행성 선종 스크리닝을 위한 방법 및 조성물은 예를 들어 개인, 의료 시설, 의료 종사자, 건강 보험 제공자, 정부 기관 또는 의료 비용에 관심이 있는 기타 당사자에 의한 치료 및/또는 지불(예컨대, 스크리닝 또는 치료와 같은 의료 비용에 대한 상환 또는 감소) 결정 및/또는 조치에 영향을 미칠 수 있다.
일부 구현예에서, 예컨대 본원에 개시된 바와 같이, 본원에 제공된 대장암 및 진행성 선종 검진을 위한 방법 및 조성물은 예를 들어 (1) 검진 자체(예컨대, 검진에 대한 상환이 불가능 하거나, 주기적/정기적 검진에만 이용 가능, 또는 일시적 및/또는 우발적 검진에만 이용 가능함); 및/또는 (2) 예를 들어 스크리닝 결과를 기반으로 치료 시작, 유지 및/또는 변경을 포함하는, 치료를 위해, 건강 보험 제공자가 의료 비용 지불자 또는 수혜자에게 상환할지 (또는 하지 않을지) 여부와 관련된 의사 결정에 영향을 미칠 수 있다. 예를 들어, 예컨대 본원에 개시된 바와 같이, 일부 구현예에서, 본원에 제공된 대장암 및 진행성 선종 스크리닝을 위한 방법 및 조성물은 의료비 지불자 또는 수혜자에게 상환 또는 비용 절감이 제공될 것인지 여부에 대한 결정에 대한 기초, 기여 또는 지원으로 사용된다. 일부 예에서, 예컨대 본원에 개시된 바와 같이, 상환 또는 비용 절감을 원하는 당사자는 의료 비용의 그러한 상환 또는 비용 절감에 대한 요청과 함께 본 명세서에 따라 수행된 스크리닝의 결과를 제공할 수 있다. 일부 예에서, 예컨대 본원에 개시된 바와 같이, 의료비의 상환 또는 비용 절감을 제공할지 여부를 결정하는 당사자는 본 명세서에 따라 수행된 스크리닝 결과의 수령 및/또는 검토에 전체 또는 부분적으로 기초하여 결정에 도달할 수 있다.
의심의 여지를 없애기 위해, 당업자는 본 명세서로부터 본 명세서의 대장암 및/또는 진행성 선종 진단을 위한 방법 및 조성물이 적어도 시험관내 사용을 위한 것임을 이해할 것이다. 따라서, 본 명세서의 모든 양태 및 구현예는 적어도 시험관내에서 수행 및/또는 사용될 수 있다.
키트
본원은 특히, 본원에 제공된 바와 같은 대장암 및/또는 진행성 선종 스크리닝에 사용하기 위한 하나 이상의 조성물을 선택적으로 대장암 스크리닝에서 사용하기 위한 설명서와 조합하여 포함하는 키트를 포함한다. 다양한 구현예에서, 에컨대 본원에 개시된 바와 같이, 대장암 및/또는 진행성 선종 의 스크리닝을 위한 키트는 다음 중 하나 이상을 포함할 수 있다: 하나 이상의 올리고뉴클레오티드 프라이머(예컨대, 표 5에 나타나는 바와 같은 하나 이상의 올리고뉴클레오티드 프라이머쌍), 하나 이상의 MSRE, 하나 이상의 qPCR용 시약(예컨대 완전 qPCR 반응 혼합물에 충분한 시약, dNTP 및 중합효소를 포함하나 이에 제한되지 않음), 및 대장암 스크리닝을 위한 키트의 하나 이상의 구성요소 사용에 대한 지침. 다양한 구현예에서, 대장암의 스크리닝을 위한 키트는 다음 중 하나 이상을 포함할 수 있다: 하나 이상의 올리고뉴클레오티드 프라이머(예컨대, 하나 이상의 올리고뉴클레오티드 프라이머쌍, 예를 들어, 표 5에 나타나는 바와 같음), 하나 이상의 중아황산염 시약, 하나 이상의 qPCR을 위한 시약(예컨대, 완전 qPCR 반응 혼합물에 충분한 시약, dNTP 및 중합효소를 포함하나 이에 제한되지 않음) 및 대장암 스크리닝을 위한 키트의 하나 이상의 구성요소 사용에 대한 지침.
특정 구현예에서, 본 명세서의 키트는 본 명세서에 개시된 바와 같은 메틸화 좌위 및/또는 DMR의 증폭을 위한 적어도 하나의 올리고뉴클레오티드 프라이머쌍을 포함한다.
일부 예에서, 예컨대 본 명세서에 기재된 바와 같이, 본 명세서의 키트는 본 명세서의 하나 이상의 메틸화 영역의 증폭을 위한 하나 이상의 올리고뉴클레오티드 프라이머 쌍을 포함한다. 일부 예에서, 예컨대 본원에 기재된 바와 같이, 본 명세서의 키트는 표 1에 제공된 하나 이상의 유전자 영역의 전부 또는 일부이거나 이를 포함하는 하나 이상의 메틸화 영역의 증폭을 위한 하나 이상의 올리고뉴클레오티드 프라이머 쌍을 포함한다. 일부 특정 예에서, 예컨대 본원에 기재된 바와 같이, 본 명세서의 키트는 각각 표 1에서 확인된 유전자 영역(전부 또는 일부)을 포함하는 복수의 메틸화 영역에 대한 올리고뉴클레오티드 프라이머 쌍을 포함하고, 복수의 메틸화 영역은 예컨대, 표 1 내지 4 중 어느 것에 제공된 메틸화 영역 중, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 45, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68 또는 69개(의 전체 또는 일부)를 포함한다.
일부 예에서, 예컨대 본원에 기재된 바와 같이, 본 명세서의 키트는 본 명세서의 하나 이상의 DMR의 증폭을 위한 하나 이상의 올리고뉴클레오티드 프라이머 쌍을 포함한다. 일부 예에서, 예컨대 본원에 기재된 바와 같이, 본 명세서의 키트는 표 1에서 확인된 유전자(의 전부 또는 일부)를 포함하는 하나 이상의 DMR의 증폭을 위한 하나 이상의 올리고뉴클레오티드 프라이머 쌍을 포함한다. 일부 특정 구현예에서, 본 명세서의 키트는 복수의 DMR에 대한 올리고뉴클레오티드 프라이머 쌍을 포함하고, 여기서 각각의 DMR은 표 1에서 확인된 유전자 영역(의 전부 또는 일부), 예컨대, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 또는 69 DMR, 예컨대, 표 1 내지 4 중 어느 하나에 따른 것을 포함한다.
일부 예에서, 예컨대 본원에 기재된 바와 같이, 본 명세서의 키트는 표 5의 하나 이상의 DMR의 증폭을 위한 하나 이상의 올리고뉴클레오티드 프라이머 쌍을 포함한다. 일부 특정 예에서, 예컨대 본원에 기재된 바와 같이, 본 명세서의 키트는 표 5의 복수의 DMR에 대한 올리고뉴클레오티드 프라이머 쌍을 포함하며, 복수의 DMR은 표 1의, 예컨대 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 또는 40 개 DMR(의 전체 또는 일부), 예컨대 표 2 내지 4 중 어느것에 제공된 것을 포함한다.
다양한 구현예에서, 예컨대 본원에 기재된 바와 같이, 본 명세서의 키트는 표 5에 제공된 하나 이상의 올리고뉴클레오티드 프라이머 쌍을 포함한다. 당업자는 표 5에 제공된 올리고뉴클레오티드 프라이머 쌍이 하나 이상의 올리고뉴클레오티드 프라이머 쌍의 임의의 조합, 예컨대, 표 2-4 중 어느 하나에 제공된 바와 같은 조합으로 제공될 수 있음을 이해할 것이다.
본 명세서의 키트는 개별적으로 또는 단일 용액에 하나 이상의 MSRE를 추가로 포함할 수 있다. 다양한 구현예에서, 하나 이상의 MSRE는 AciI, Hin6I, HpyCH4IV 및 HpaII를 포함하는 MSRE 세트로부터(예컨대, 키트가 AciI, Hin6I 및 HpyCH4IV를 개별적으로 또는 단일 용액으로 포함하도록) 선택된다. 특정 구현예에서, 본 명세서의 키트는 qPCR을 위한 하나 이상의 시약(예를 들어, dNTP 및 중합효소를 비제한적으로 포함하는, 완전 qPCR 반응 혼합물에 충분한 시약)을 포함한다.
실시예
본 실시예는 본 명세서가 무엇보다도 대장암 및/또는 진행성 선종의 스크리닝 및 치료를 위한 방법 및 조성물을 제공함을 확인시켜준다. 본 실시예는 본원에 제공된 조성물 및 방법이 대장암의 스크리닝 및/또는 치료에서 현저하게 높은 정도의 민감도 및 특이도를 제공함을 추가로 입증한다. 또한, 대장암 및/또는 진행성 선종을 갖는 것으로 진단된 대상체로부터의 샘플에서 바이오마커의 메틸화 및 대조군 대상체로부터의 샘플에서 바이오마커의 메틸화를 비교하는 임상 연구가 제공되며, 이는 본 명세서의 방법 및/또는 조성물을 포함하는 대장암에 대한 스크리닝을 추가로 보여준다.
실시예 1. 대장암 관련 메틸화 바이오마커의 식별
본 실시예는 건강한 조직과 비교하여 대장암 및 진행성 선종에서 DMR의 CpG 영역의 과메틸화의 식별을 포함한다. 특히, 본 실시예의 실험은 총 150명의 대상체로부터 결장직장 조직 샘플을 조사하였다. 대상체의 그룹은 다음과 같다: (i) 이전에 대장암을 앓는 것으로 진단된 52명의 대상체, (ii) 진행성 선종을 앓는 것으로 진단된 33명의 대상체, 및 (iii) 대장암을 앓는 것으로 진단된 52 환자의 및 진행성 선종을 앓는 것으로 진단된 33 대상체의 하위집합으로부터 얻어진 65개의 건강한 결장 조직 샘플. 조직 샘플은 신선한 냉동 조직이었다.
샘플의 DNA는 Illumina의 NovaSeq™ 6000 시퀀싱 시스템을 사용하여 전체 게놈 중아황산염 시퀀싱으로 분석되었다. 전체 게놈 중아황산염 시퀀싱은 본원에서 이전에 설명되었다. 일반적으로 전체 게놈 중아황산염 시퀀싱은 이전에 논의된 여러 차세대 기술 중 하나를 사용하여 게놈을 시퀀싱하기 전에 중아황산염(예: 중아황산나트륨)로 DNA 샘플을 처리하는 것을 포함한다.
샘플의 평균 시퀀싱 범위는 37.5x로, 이는 시퀀싱된 게놈의 주어진 영역이 약 37-38회 고유하게 시퀀싱되었음을 의미한다. 평균 적용 범위가 30x보다 크면 시퀀싱이 임상 등급(즉, 높은) 신뢰성으로 수행되었음을 나타낸다.
그런 다음 샘플에서 얻은 원(raw) 시퀀싱 파일을 처리하여 대조군 조직 샘플과 비교하여 차등적 메틸화 영역(DMR)을 결정하였다. 먼저 원 시퀀스를 GRCh38(Genome Research Consortium human build 38)의 기준 게놈(reference genome)과 정렬하고 Bismark Bisulfite Mapper를 사용하여 중복 제거하였다. Bismark는 각 샘플에 대한 메틸화 호출 파일을 출력한다. 이러한 메틸화 호출 파일에는 기본 출력당 백분율 메틸화 점수가 포함되어 있다. 그런 다음 메틸화 호출 출력 파일을 MethylKit을 사용하여 추가로 분석하였다. MethylKit을 사용하여 대조군 조직에 대한 대장암 조직의 출력 파일과 대조군 조직에 대한 진행성 선종 조직의 출력 파일을 비교하였다. 이러한 비교를 통해 대장암과 진행성 선종 샘플 모두에 대한 DMR이 확인되었다. MethylKit에서 식별된 DMR 출력은 CpG 사이의 최대 거리가 200bp인 적어도 3개의 CpG가 존재하는 영역으로 간주되었다. 대조군과 사례 사이의 최소 메틸화 백분율 차이는 10%로 설정되었다.
그런 다음 대조군 샘플과 관련하여 진행성 선종 및 대장암 샘플에서 과메틸화 영역에 대해 DMR을 필터링하였다. DMR은 영역 길이당 더 많은 수의 메틸화된 CpG를 선택하기 위해 다시 필터링되었다. 2개의 인접한 메틸화된 CpG 사이에 최대 200bp의 최소 5개의 CpG가 고려되었다. 또한, 조건(예: 대장암 또는 진행성 선종)과 대조군 사이의 가장 높은 평균 메틸화 백분율 차이를 조건과 대조군의 메틸화 차이가 25% 미만인 영역을 제외하여 사용하였다.
처리 결과 69개의 DMR 목록(즉, 아래 표 6 참조)이 생성되었으며, 이는 추가 표적 분석 개발을 위해 선택되었다. 하기 표 6에서 볼 수 있는 바와 같이, 각각의 DMR은 본원에 제공된 바와 같은 서열에 상응하는 서열 ID(SEQ ID NO), DMR이 있는 염색체 번호, 염색체 상의 DMR의 시작 및 종료 염기 쌍, DMR 영역의 폭(영역 폭), 및 DMR 영역 내에 속하는 주석된 하나 (또는 이상)의 유전자명(사용가능한 경우) 에 의해 식별된다. DMR의 시작 및 종료 염기쌍과 염색체 번호는 GRCh38의 기준 게놈 상의 위치에 상응한다. 유전자명의 Ensemble genome browser 98에 따른다.
표 6. 표적화 분석 개발을 위해 식별된 69개의 DMR. | |||||
SEQ ID NO | Chr. 번호 | 시작 염기쌍 | 종료 염기쌍 | 영역 폭 | 주석된 유전자명 |
SEQ ID NO: 1 | 1 | 18636183 | 18636479 | 297 | PAX7 |
SEQ ID NO: 2 | 1 | 107140100 | 107140341 | 242 | NTNG1 |
SEQ ID NO: 3 | 1 | 114153175 | 114153431 | 257 | SYT6 |
SEQ ID NO: 4 | 2 | 5673847 | 5674110 | 264 | LINC01248 |
SEQ ID NO: 5 | 2 | 26692974 | 26693164 | 191 | KCNK3 |
SEQ ID NO: 6 | 2 | 31136994 | 31138312 | 1319 | GALNT14 |
SEQ ID NO: 7 | 2 | 100416598 | 100417320 | 723 | CHST10 |
SEQ ID NO: 8 | 2 | 127025668 | 127025992 | 325 | 주석 없음 |
SEQ ID NO: 9 | 2 | 136765863 | 136767257 | 1395 | THSD7B |
SEQ ID NO: 10 | 2 | 209771521 | 209771717 | 197 | UNC80 |
SEQ ID NO: 11 | 3 | 96812527 | 96814374 | 1848 | EPHA6 |
SEQ ID NO: 12 | 3 | 151086702 | 151087381 | 680 | MED12L |
SEQ ID NO: 13 | 4 | 61201658 | 61202419 | 762 | ADGRL3 |
SEQ ID NO: 14 | 4 | 141133100 | 141133759 | 660 | RNF150 |
SEQ ID NO: 15 | 4 | 167233855 | 167235112 | 1258 | SPOCK3 |
SEQ ID NO: 16 | 4 | 176001298 | 176001937 | 640 | GPM6A |
SEQ ID NO: 17 | 4 | 185020150 | 185020721 | 572 | HELT |
SEQ ID NO: 18 | 5 | 180353742 | 180353989 | 248 | GFPT2 |
SEQ ID NO: 19 | 6 | 31815502 | 31815783 | 282 | HSPA1L, HSPA1A |
SEQ ID NO: 20 | 6 | 123803543 | 123804573 | 1031 | NKAIN2 |
SEQ ID NO: 21 | 7 | 141072216 | 141073010 | 795 | TMEM178B |
SEQ ID NO: 22 | 7 | 154304773 | 154304932 | 160 | DPP6 |
SEQ ID NO: 23 | 8 | 17026468 | 17027021 | 554 | MICU3 |
SEQ ID NO: 24 | 8 | 52564399 | 52566130 | 1732 | ALKAL1 |
SEQ ID NO: 25 | 8 | 64581458 | 64581984 | 527 | LOC401463, BHLHE22 |
SEQ ID NO: 26 | 8 | 103500115 | 103500325 | 211 | RIMS2, LOC105375690, SLC25A32 |
SEQ ID NO: 27 | 9 | 843218 | 843532 | 315 | DMRT1 |
SEQ ID NO: 28 | 9 | 21970988 | 21971129 | 142 | CDKN2A, CDKN2B-AS1 |
SEQ ID NO: 29 | 9 | 36986363 | 36986579 | 217 | PAX5 |
SEQ ID NO: 30 | 10 | 16520584 | 16520645 | 62 | C1QL3 |
SEQ ID NO: 31 | 10 | 25933862 | 25934167 | 306 | MYO3A, LOC101929073 |
SEQ ID NO: 32 | 10 | 26211596 | 26212313 | 718 | GAD2, MYO3A |
SEQ ID NO: 33 | 10 | 127736443 | 127736756 | 314 | FOXI2 |
SEQ ID NO: 34 | 11 | 94740674 | 94742025 | 1352 | LOC105369438, AMOTL1 |
SEQ ID NO: 35 | 11 | 112962067 | 112962734 | 668 | LOC101928847, NCAM1 |
SEQ ID NO: 36 | 11 | 117795608 | 117796104 | 497 | DSCAML1 |
SEQ ID NO: 37 | 12 | 15322181 | 15323178 | 998 | PTPRO, RERG |
SEQ ID NO: 38 | 12 | 63667846 | 63668580 | 735 | DPY19L2 |
SEQ ID NO: 39 | 12 | 111033274 | 111033632 | 359 | CUX2 |
SEQ ID NO: 40 | 13 | 67229618 | 67231644 | 2027 | PCDH9 |
SEQ ID NO: 41 | 13 | 87673128 | 87673271 | 144 | MIR4500HG, SLITRK5 |
SEQ ID NO: 42 | 14 | 70188797 | 70189400 | 604 | SLC8A3, LOC646548 |
SEQ ID NO: 43 | 14 | 77966179 | 77966411 | 233 | 주석 없음 |
SEQ ID NO: 44 | 15 | 45378160 | 45378420 | 261 | GATM |
SEQ ID NO: 45 | 15 | 64824187 | 64824233 | 47 | PIF1 |
SEQ ID NO: 46 | 15 | 79089616 | 79089950 | 335 | RASGRF1 |
SEQ ID NO: 47 | 16 | 70737594 | 70737910 | 317 | VAC14 |
SEQ ID NO: 48 | 16 | 77789176 | 77789410 | 235 | VAT1L |
SEQ ID NO: 49 | 16 | 87601415 | 87601495 | 81 | JPH3 |
SEQ ID NO: 50 | 17 | 35448324 | 35448347 | 24 | SLFN13 |
SEQ ID NO: 51 | 17 | 76076064 | 76076299 | 236 | ZACN, SRP68, GALR2 |
SEQ ID NO: 52 | 18 | 907740 | 908272 | 533 | ADCYAP1 |
SEQ ID NO: 53 | 18 | 28177400 | 28177679 | 280 | CDH2 |
SEQ ID NO: 54 | 18 | 69401262 | 69401796 | 535 | DOK6 |
SEQ ID NO: 55 | 18 | 75916571 | 75916639 | 69 | 주석 없음 |
SEQ ID NO: 56 | 19 | 36666416 | 36667626 | 1211 | ZNF461 |
SEQ ID NO: 57 | 19 | 36916473 | 36916789 | 317 | ZNF829, ZNF568 |
SEQ ID NO: 58 | 19 | 36973366 | 36973693 | 328 | ZNF568 |
SEQ ID NO: 59 | 19 | 37551650 | 37551952 | 303 | ZNF540, ZNF571-AS1 |
SEQ ID NO: 60 | 19 | 42270825 | 42271072 | 248 | CIC |
SEQ ID NO: 61 | 19 | 56393726 | 56393946 | 221 | ZNF582-AS1, ZNF582 |
SEQ ID NO: 62 | 19 | 56507701 | 56507850 | 150 | ZNF471 |
SEQ ID NO: 63 | 19 | 57191866 | 57192102 | 237 | ZNF264 |
SEQ ID NO: 64 | 19 | 57726974 | 57727102 | 129 | ZNF671, ZNF551, ZNF776 |
SEQ ID NO: 65 | 20 | 21518031 | 21518878 | 848 | NKX2-2 |
SEQ ID NO: 66 | 20 | 56925418 | 56925496 | 79 | 주석 없음 |
SEQ ID NO: 67 | 21 | 26843133 | 26845357 | 2225 | ADAMTS1 |
SEQ ID NO: 68 | 21 | 31343542 | 31344538 | 997 | TIAM1 |
SEQ ID NO: 69 | 21 | 33070564 | 33070847 | 284 | OLIG1 |
실시예 2: MSRE-qPCR에 의한 메틸화 바이오마커에 대한 무세포 DNA 분석의 개발
본 실시예는 순환하는 무세포 DNA(cfDNA)에 기반하여 대장암 및 진행성 선종의 메틸화 상태를 결정하기위한 분석을 개발한다. cfDNA는 불완전하고 단편화되어 있으며, cfDNA가 암세포에서 혈액으로 전달되는 메커니즘(소위 순환 종양 DNA)은 알려져 있지 않다. 적어도 실시예 1의 69개의 메틸화 바이오마커가 조직 샘플에서 확인되었기 때문에, 확인된 대장암 메틸화 바이오마커가 cfDNA로부터 충분히 분석되어 대장암 및 또는 진행성 선종의 진단에 상응하는 대상체의 샘플 또는 대상체를 식별할 수 있는 ctDNA 부분을 성공적으로 포획될 수 있는지 여부는 본 실시예의 실험 이전에 알려지지 않았다.
실시예 1에서 확인된 대장암 및 진행성 선종 메틸화 바이오마커가 cfDNA에서 충분히 분석되어 대장암에 대한 대상체 또는 샘플의 식별을 허용하는 ctDNA 부분을 성공적으로 포획할 수 있는지 여부를 결정하기 위한 중요한 단계로서, 이러한 바이오마커의 스크리닝을 위한 민감한 분석이 개발되었다. 특히 MSRE(Methylation-Sensitive Restriction Enzyme)-qPCR 방법론이 개발되었다. MSRE-qPCR 방법론은 혈액 샘플, 특히 혈액에 존재하는 종양의 무세포 DNA(cfDNA)에서 확인된 CpG 부위를 포괄하는 DMR의 메틸화를 측정하기 위해 개발되었다.
MSRE-qPCR 방법론의 개발은 샘플의 비종양 DNA 배경과 비교하여 혈액 내 순환하는 종양 유래 DNA의 낮은 농도(0.1 - 1%)로 인하여 cfDNA 분석을 통해 종양 조직에서 유래한 CpG 메틸화 바이오마커를 분석하는 것이 어렵기 때문에 적어도 부분적으로 중요하였다. 따라서 혈액, 소변 또는 대변과 같이 쉽게 얻을 수 있는 샘플에 의존하는 바이오마커 분석을 개발하는 것이 일반적으로 선호되지만 종양 유래 메틸화 바이오마커 분석을 위한 혈액 사용은 어렵다. 따라서 조직에서 대장암 및 진행성 선종의 특징인 메틸화 바이오마커를 확인한 후에도, 상기에서 논의한 바와 같이, 단편화되고 제대로 이해되지 않은 ctDNA의 특성이 조직에서 확인된 메틸화 바이오마커를 사용한 성공적인 스크리닝을 허용할지 여부는 예상할 수 없다.
MSRE-qPCR은 적어도 하나의 대장암 MSRE 절단 부위(즉, 적어도 하나의 메틸화 바이오마커 부위를 포괄하여, 적어도 하나의 메틸화 바이오마커 부위의 모두가 메틸화되지 않은 핵산 분자에 MSRE 절단 부위의 절단이 허용되고, 적어도 하나의 메틸화 바이오마커 부위 중 적어도 하나가 메틸화된 핵산 분자에서는 MSRE 절단 부위의 절단이 차단되게 하는, MSRE 절단 부위)를 각각 포함하는 DNA 영역을 증폭하는 올리고뉴클레오티드 프라이머(MSRE-qPCR 올리고뉴클레오티드 프라이머쌍))의 설계가 필요하다. 단일 MSRE는 관심 메틸화 바이오마커 부위를 모두 포함하는 절단 부위이지 않을 수 있으므로, MSRE-qPCR 검정은 다중 제한 효소를 활용하여 단일 MSRE-qPCR 반응으로 분석할 수 있는 메틸화 바이오마커 부위의 범위를 증진시킬 수 있다. 본 실시예의 MSRE-qPCR 분석은 MSRE Acil, Hin6l 및 HpyCH4IV를 활용하며, 이들은 함께 충분한 적용 범위를 제공하는 것으로 밝혀졌다.
MSRE-qPCR에 대한 예시적 도식적 작업 흐름이 도 1에 제공되어 있다. 본 실시예에서 수행된 바와 같이, 순환 무세포 종양 DNA는 에 따라 QIAamp MinElute ccfDNA 키트에 의해 제조업체 프로토콜(QIAamp MinElute ccfDNA 핸드북 08/2018, Qiagene)에 따라 대상 혈액(일반적으로 약 10mL의 혈장 샘플)에서 추출되었다. 도 1에 도시된 바와 같이, 단리된 cfDNA는 2개의 분취량으로 나누었으며, 첫 번째 분취량은 qPCR 품질 관리 분석에 사용되었고 두 번째 분취량은 MSRE-qPCR에 사용되었다.
MSRE-qPCR의 경우 용리된 cfDNA의 2/3를 MSRE로 절단하였다. 비-메틸화된 DNA는 선택적으로 절단되기 때문에, cfDNA를 MSRE와 접촉시키면 메틸화 유래 신호에 대한 샘플이 농축된다; 메틸화된 DNA는 손상되지 않고 정량화할 수 있다. 용리된 cfDNA의 나머지 1/3은 MSRE-qPCR 올리고뉴클레오티드 프라이머를 사용하여 qPCR에 사용되어 앰플리콘이 cfDNA에서 성공적으로 증폭되었음을 확인한다. 이 증폭은 주형이 존재함을 확인하여 기술적 품질 관리를 제공한다.
본 명세서에 적용된 바와 같이, MSRE-qPCR 올리고뉴클레오티드 프라이머 쌍은 DMR의 증폭을 위해 성공적으로 개발되었고, 따라서 실시예 1의 DMR에서 확인된 메틸화 바이오마커 영역으로부터 88개의 상이한 표적 DMR을 산출하였다. 88개의 상이한 표적 DMR이 하기 표 7에 나열되어 있다. 확인된 영역은 대응 대조군 조직과 비교하여 대장암 및 진행성 선종에서 상당히 더 높은 과메틸화를 나타낸다. Ensembl 게놈 브라우저 98에 따라 주석(annotation)이 있는 유전자에 대해 유전자 주석이 추가되었다. 일부 DMR이 서로 다른 유전자와 중첩되므로 해당 영역의 모든 중첩 유전자가 나열된다. 하기 표 7에는 DMR의 고유 식별자(UID), DMR이 발견된 염색체 번호(Chr), DMR의 시작 및 끝 종료 위치, DMR의 염기쌍 길이/수, DMR 내에 발견된 주석된 유전자(또는 복수의 유전자) 명칭, 및 식별된 DMR의 SEQ ID NO가 포함된다. 염색체 번호와 DMR 시작 및 종료 위치를 포함하는, 나열된 게놈 영역 매개변수는 GRCh38의 기준 게놈에 상응한다.
DMR은 일반적으로 1 내지 15개의 MSRE 절단 부위를 포함하며, MSRE 절단 부위는 88개의 메틸화 바이오마커 영역 각각을 함께 포괄한다. 본 명세서에 적용되는 바와 같이, 4개 유전자(JUB, H19, SNRPN, IRF4)의 메틸화 상태는 메틸화 컨트롤(control)을 제공했으며, 이는 분석 견고성 및 재현성의 모니터링을 허용하였다.
표 7. MSRE-qPCR에 대해 식별된 88개의 후보 DMR. | |||||||
UID | Chr | 시작 위치 | 종료 위치 | 서열 폭 | 주석된 유전자명 | SEQ ID NO. | |
UDX131.2_1 | 1 | 18636323 | 18636442 | 120 | PAX7 | 230 | |
UDX_244_2 | 1 | 107140056 | 107140173 | 118 | NTNG1 | 231 | |
UDX_244_1 | 1 | 107140136 | 107140204 | 69 | NTNG1 | 232 | |
UDX_117.2 | 1 | 114153293 | 114153403 | 111 | SYT6 | 233 | |
UDX_121.1 | 2 | 5673894 | 5673976 | 83 | LINC01248 | 234 | |
UDX_79.1 | 2 | 26692903 | 26692983 | 81 | KCNK3 | 235 | |
UDX_219.7_2 | 2 | 31138019 | 31138112 | 94 | GALNT14 | 236 | |
UDX_196.4_1 | 2 | 100417126 | 100417223 | 98 | CHST10 | 237 | |
UDX_257.2_1 | 2 | 127025856 | 127025946 | 91 | 주석 없음 | 238 | |
UDX_221.1_2 | 2 | 136765920 | 136766016 | 97 | THSD7B | 239 | |
UDX_221.2_2 | 2 | 136766099 | 136766189 | 91 | THSD7B | 240 | |
UDX_221.2_1 | 2 | 136766115 | 136766191 | 77 | THSD7B | 241 | |
UDX_221.4_1 | 2 | 136766444 | 136766530 | 87 | THSD7B | 242 | |
UDX_85.2_1 | 2 | 209771685 | 209771755 | 71 | UNC80 | 243 | |
UDX_222.1 | 3 | 96813875 | 96813987 | 113 | EPHA6 | 244 | |
UDX_222.11_2 | 3 | 96814054 | 96814137 | 84 | EPHA6 | 245 | |
UDX_192.2 | 3 | 151086946 | 151087030 | 85 | MED12L | 246 | |
UDX_198.5_1 | 4 | 61202277 | 61202367 | 91 | ADGRL3 | 247 | |
UDX_190.1 | 4 | 141133118 | 141133232 | 115 | RNF150 | 248 | |
UDX_218.4_2 | 4 | 167234344 | 167234453 | 110 | SPOCK3 | 249 | |
UDX_218.4_1 | 4 | 167234345 | 167234442 | 98 | SPOCK3 | 250 | |
UDX_185.1 | 4 | 176001298 | 176001402 | 105 | GPM6A | 251 | |
UDX_176.2 | 4 | 185020392 | 185020498 | 107 | HELT | 252 | |
UDX114.1_1 | 5 | 180353709 | 180353815 | 107 | GFPT2 | 253 | |
UDX114.1_2 | 5 | 180353728 | 180353815 | 88 | GFPT2 | 254 | |
UDX_125.2 | 6 | 31815718 | 31815803 | 86 | HSPA1L, HSPA1A | 255 | |
UDX_213.3 | 6 | 123803960 | 123804070 | 111 | NKAIN2 | 256 | |
UDX_201.3 | 7 | 141072555 | 141072639 | 85 | TMEM178B | 257 | |
UDX_201.5_1 | 7 | 141072898 | 141072970 | 73 | TMEM178B | 258 | |
UDX_177.1 | 7 | 141073214 | 141073310 | 97 | TMEM178B | 259 | |
UDX_66.2 | 7 | 154304857 | 154304969 | 113 | DPP6 | 260 | |
UDX_174.3 | 8 | 17026934 | 17027030 | 97 | MICU3 | 261 | |
UDX_277.7_2 | 8 | 52565317 | 52565408 | 92 | ALKAL1 | 262 | |
UDX_168.1 | 8 | 64581549 | 64581646 | 98 | LOC401463, BHLHE22 | 263 | |
UDX_168.3 | 8 | 64581819 | 64581913 | 95 | LOC401463, BHLHE22 | 264 | |
UDX_90.1 | 8 | 103500053 | 103500167 | 115 | RIMS2, LOC105375690, SLC25A32 | 265 | |
UDX_253.1 | 9 | 843262 | 843352 | 91 | DMRT1 | 266 | |
UDX_230 | 9 | 21970918 | 21971017 | 100 | CDKN2A, CDKN2B-AS1 | 267 | |
UDX_94.2_2 | 9 | 36986521 | 36986581 | 61 | PAX5 | 268 | |
UDX_17_2 | 10 | 16520590 | 16520719 | 130 | C1QL3 | 269 | |
UDX_251.2_1 | 10 | 25934063 | 25934130 | 68 | MYO3A, LOC101929073 | 270 | |
UDX_272.3_2 | 10 | 26211885 | 26211963 | 79 | GAD2, MYO3A | 271 | |
UDX_272.4 | 10 | 26212056 | 26212160 | 105 | GAD2, MYO3A | 272 | |
UDX_137.1 | 10 | 127736482 | 127736589 | 108 | FOXI2 | 273 | |
UDX_220.5_1 | 11 | 94741361 | 94741468 | 108 | LOC105369438, AMOTL1 | 274 | |
UDX_191.2_1 | 11 | 112962254 | 112962393 | 140 | LOC101928847, NCAM1 | 275 | |
UDX_191.3 | 11 | 112962451 | 112962564 | 114 | LOC101928847, NCAM1 | 276 | |
UDX_191.4 | 11 | 112962596 | 112962709 | 114 | LOC101928847, NCAM1 | 277 | |
UDX_158.2 | 11 | 117795852 | 117795967 | 116 | DSCAML1 | 278 | |
UDX_274.2_1 | 12 | 15322352 | 15322435 | 84 | PTPRO, RERG | 279 | |
UDX_274.3_1 | 12 | 15322477 | 15322549 | 73 | PTPRO, RERG | 280 | |
UDX_197.3 | 12 | 63668266 | 63668380 | 115 | DPY19L2 | 281 | |
UDX_143.2_1 | 12 | 111033456 | 111033526 | 71 | CUX2 | 282 | |
UDX_223.11_2 | 13 | 67231170 | 67231267 | 98 | PCDH9 | 283 | |
UDX_223.13_1 | 13 | 67231170 | 67231265 | 96 | PCDH9 | 284 | |
UDX_223.6_1 | 13 | 67230402 | 67230489 | 88 | PCDH9 | 285 | |
UDX_56_1 | 13 | 87673121 | 87673244 | 124 | MIR4500HG, SLITRK5 | 286 | |
UDX181.2_1 | 14 | 70189010 | 70189101 | 92 | SLC8A3, LOC646548 | 287 | |
UDX181.4_1 | 14 | 70189227 | 70189296 | 70 | SLC8A3, LOC646548 | 288 | |
UDX_107.2 | 14 | 77966333 | 77966434 | 102 | 주석 없음 | 289 | |
UDX_120.2 | 15 | 45378327 | 45378410 | 84 | GATM | 290 | |
UDX_6_2 | 15 | 64824187 | 64824315 | 129 | PIF1 | 291 | |
UDX_260.1 | 15 | 79089689 | 79089791 | 103 | RASGRF1 | 292 | |
UDX_260.2_1 | 15 | 79089783 | 79089858 | 76 | RASGRF1 | 293 | |
UDX_255.2_1 | 16 | 70737814 | 70737885 | 72 | VAC14 | 294 | |
UDX_109.2 | 16 | 77789273 | 77789385 | 113 | VAT1L | 295 | |
UDX_30_1 | 16 | 87601409 | 87601511 | 103 | JPH3 | 296 | |
UDX_1_1 | 17 | 35448306 | 35448407 | 102 | SLFN13 | 297 | |
UDX_110.1 | 17 | 76076051 | 76076163 | 113 | ZACN, SRP68, GALR2 | 298 | |
UDX_171.3 | 18 | 908129 | 908238 | 110 | ADCYAP1 | 299 | |
UDX_124.1 | 18 | 28177439 | 28177533 | 95 | CDH2 | 300 | |
UDX_172.1 | 18 | 69401246 | 69401321 | 76 | DOK6 | 301 | |
UDX_24_1 | 18 | 75916501 | 75916621 | 121 | 주석 없음 | 302 | |
UDX_217.4_1 | 19 | 36666980 | 36667097 | 118 | ZNF461 | 303 | |
UDX_254.2_2 | 19 | 36916694 | 36916789 | 96 | ZNF829, ZNF568 | 304 | |
UDX_258.2_1 | 19 | 36973532 | 36973602 | 71 | ZNF568 | 305 | |
UDX_250.1 | 19 | 37551664 | 37551748 | 85 | ZNF540, ZNF571-AS1 | 306 | |
UDX_245_1 | 19 | 42270787 | 42270865 | 79 | CIC | 307 | |
UDX_242_2 | 19 | 56393660 | 56393732 | 73 | ZNF582-AS1, ZNF582 | 308 | |
UDX111.1_1 | 19 | 57191843 | 57191928 | 86 | ZNF264 | 309 | |
UDX_48_1 | 19 | 57726972 | 57727075 | 104 | ZNF671, ZNF551, ZNF776 | 310 | |
UDX_204.3_2 | 20 | 21518391 | 21518499 | 109 | NKX2-2 | 311 | |
UDX_29_2 | 20 | 56925386 | 56925450 | 65 | 주석 없음 | 312 | |
UDX_29_1 | 20 | 56925428 | 56925505 | 78 | 주석 없음 | 313 | |
UDX_224.5_2 | 21 | 26843742 | 26843842 | 101 | ADAMTS1 | 314 | |
UDX_224.14 | 21 | 26844767 | 26844877 | 111 | ADAMTS1 | 315 | |
UDX_210.3 | 21 | 31343869 | 31343976 | 108 | TIAM1 | 316 | |
UDX_128.1 | 21 | 33070631 | 33070711 | 81 | OLIG1 | 317 |
실시예 3: cfDNA의 MSRE-qPCR은 대장암 상태에 따라 대상체를 성공적으로 구별한다
식별된 메틸화 바이오마커의 임상 진단 및 예후력을 조사하기 위해 88개의 메틸화 바이오마커 영역을 포괄하는 MSRE-qPCR 올리고뉴클레오티드 프라이머 쌍으로 증폭된 DMR과 적절한 대조군을 인간 대상체의 혈장에서 추출한 cfDNA에서 분석하였다. 특히 2017년 내지 2018년 사이의 스페인, 영국, 및 미국의 스크리닝 센터 및 종양클리닉에서 대장암 발생 가능성에 대한 진단을 구하거나 획득하는 과정의 개체으로부터 cfDNA를 샘플링하였다. 제1 대상체군("트레이닝 세트")에는 166명의 그러한 개체가 포함되었고(도 2의 제1 대상체군에 대한 설명 참조), 제2 대상체군("검증 세트")에는 535명의 그러한 개체가 포함되었다(도 3의 제2 대상체군에 대한 설명 참조).
대장암에 대한 메틸화 바이오마커 DMR의 예측력을 검증하기 위해, 대상체의 트레이닝 세트로부터의 샘플의 MSRE-qPCR 분석에서 유래한 데이터를 추가로 분석하여 표 7의 88개 메틸화 바이오마커 부위를 기반으로 초기 특징 선택을 수행하였다. Monte-Carlo 교차 검증은 50회 이상의 실행에 사용되었으며 랜덤 포레스트 알고리즘은 기능 순위매김에 사용되었으며 VIP >2인 마커는 지지-벡터 머신(SVM) 알고리즘 기반 분류 모델을 구축하는데 사용되었다. 이 분석은 SVM 모델에서 양호한 예측을 제공하는 마커의 여러 하위집합(표 2-4에 기술된 대로 3, 10 및 40)을 식별하였다.
MSRE-qPCR에서 40개의 DRM을 증폭하기 위한 올리고뉴클레오티드 프라이머 쌍(표 5)은 적어도 하나의 MSRE 절단 부위를 포괄한다. 그러나, 일반적으로 3~15개의 MSRE 절단 부위가 포괄된다. MSRE-qPCR은 실시예 2에 기재된 방법론에 따라 수행하였다.
40개 마커 패널을 기반으로 한 초기 주성분 분석은 도 4에 나타난 바와 같이 테스트된 535 대상체에서 대장암 환자(즉, 대장암을 앓고 있는 환자)와 대조군 환자(즉, 대장내시경 소견이 없는 환자, 과증식용종 및/또는 비진행성 선종이 있는 환자) 간의 양호한 분리도를 보여주었다. 실험된 대상체군에서 진행성 선종 진단을 받은 환자 중 일부만이 대조군과의 분리도가 양호하였다. 특정 이론에 얽매이는 것은 아니지만, 특정 대상체에서 대장암에 대한 결과의 특성의 유사성은 진행성 선종이 추가로 악성, 대장 암종으로 진행하는 경로를 더 따라가고 있음을 나타내는 것일 수 있다.
SVM 알고리즘 기반 결과의 통계적 분석은 도 5a 및 5b 에 도시되어 있다. 40개의 마커 패널을 통해 78%의 민감도로 대장암 환자로부터 대조군 환자를 식별할 수 있었다. 대조군 환자에서 진행성 선종을 앓는 환자를 결정하는 민감도는 14%였다. 초기 국한 암 검출의 민감도는 78%였다. SVM 모델에 의해 식별된 표 4의 40-마커 패널에 기반한 데이터의 ROC 곡선 분석이 도 5A에 제공된다.
하기에 나타낸 표 8은 40개 미만의 DMR을 갖는 패널에 대한 추가 연구를 나타낸다. 3 DMR 조합 연구에 사용된 DMR 목록은 표 2에 나타난다. 10 DMR 조합 연구에 사용된 DMR 목록은 표 3에 나타난다. 40 DMR 조합 연구에 사용된 DMR 목록은 표 4에 나타난다. "SensitivityALL"은 대상체가 대장암 또는 진행성 선종을 앓고 있는지 여부를 검출할 때의 민감도를 의미한다. "SensitivityCRC"는 대장암을 앓고 있는 대상체를 검출하는 민감도를 의미한다. "SensitivityAA"는 진행성 선종을 앓고 있는 대상체를 검출하는 민감도를 의미한다. 일 특정 예를 강조하기 위해, 3개의 마커 패널은 48%의 전체 민감도 및 93%의 특이도로 대조군 대상체로부터 대장암 및 진행성 선종의 특히 우수한 분리도를 나타낸다. 93%의 특이도에서 진행성 선종은 14%의 민감도로, 대장암은 67%의 민감도로 검출되었다.
표 8. 40개의 대장암 DMR 패널 및 그 하위집합을 검증군에 적용하기 위한 정확도 메트릭. | |||
패널 내 마커의 수 | |||
척도 | 3 | 10 | 40 |
AUC | 0.78 | 0.77 | 0.75 |
AUC_CI_Low | 0.73 | 0.72 | 0.70 |
AUC_CI_High | 0.83 | 0.82 | 0.81 |
SensitivityALL | 0.48 | 0.53 | 0.53 |
SensitivityCRC | 0.67 | 0.75 | 0.78 |
SensitivityAA | 0.14 | 0.14 | 0.14 |
특이도 | 0.93 | 0.90 | 0.90 |
실시예 4. 다양한 개별 메틸화 바이오마커는 각각 매우 유용하다
40개의 대장암 DMR 패널 중 개별 대장암 및 진행성 선종 DMR의 성능 평가는 다양한 개별 대장암 DMR이 대장암 및 진행성 선종의 스크리닝에 충분함을 나타낸다(도 6-15 참조). 도 6-15는 각각 UDX_29_1(도 6), UDX_272.3_2(도 7), UDX_277.7_2(도 8), UDX_272.4(도 9). UDX_174.3(도 10), UDX_260.2_1(도 11), UDX_260.1(도 12), UDX_137.1(도 13), UDX_17_2(도 14) 및 UDX_230(도 15)로 식별된 DMR의 MSRE-qPCR로부터 Ct(Cycle Threshold) 값을 나타내는 그래프를 보여준다.
선택된 대장암 및 진행성 선종 DMR의 경우, 도 6-15는 대장암 및 진행성 선종 샘플(총체적으로 "CRC"로 표시됨) 및 대조군 샘플("CNT"로 표시됨; 건강한 대상체, 과증식 용종이 있는 ghkss자 및 및 비진행성 선종이 있는 대상체)을 나타낸다. 결과는 표시 목적으로 45에서 뺀 MSRE-qPCR Ct("cycle threshold") 값(즉, 45-Ct 값)으로 표시된다.
45-Ct 값이 높을수록 샘플의 메틸화 정도가 높아진다. 이 실시예에 제공된 데이터 및 본원 실시예에 의해 제공된 데이터는 누적적으로(예를 들어, 도 4-9를 포함하여) 식별된 각각의 개별 DMR에 대해, 메틸화 상태 신호가 대장암과 진행성 선종의 조합을 위한 임상 스크리닝을 허용하도록 대상체군에 걸쳐 충분히 안정함을 입증한다. 따라서 도 4-15에 제시된 결과는 대장암 및 진행성 선종의 메틸화 마커가 본원에 제공된 대장암 및 진행성 선종의 스크리닝을 위한 전반적이고 강건한 신호를 제공할 수 있음을 확인한다. 더욱이, 당업자는 본원이 대장암 및 진행성 선종의 조합에 대한 스크리닝에 개별적으로 유용한 메틸화 바이오마커를 제공하고, 특히 본원에 제공된 메틸화 바이오마커가 개별적으로 또는 서로 조합하여 모두 유용하다는 것을 이해할 것이다.
컴퓨터 시스템 및 네트워크 환경
도 17에 나타난 바와 같이, 본원에 기술된 복수의 소스로부터의 데이터를 검색, 관리 및 분석하기 위한 시스템, 방법 및 아키텍처를 제공하는데 사용하기 위한 네트워크 환경(1700)의 구현이 도시 및 설명되어 있다. 간략한 관에서, 이제 도 17을 참조하면, 예시적인 클라우드 컴퓨팅 환경(1700)의 블록도가 도시되고 설명된다. 클라우드 컴퓨팅 환경(1700)은 하나 이상의 리소스 제공자(1702a, 1702b, 1702c)(총체적으로, 1702)를 포함할 수 있다. 각각의 리소스 제공자(1702)는 컴퓨팅 리소스를 포함할 수 있다. 일부 구현에서, 컴퓨팅 리소스는 데이터를 처리하는 데 사용되는 임의의 하드웨어 및/또는 소프트웨어를 포함할 수 있다. 예를 들어, 컴퓨팅 리소스는 알고리즘, 컴퓨터 프로그램 및/또는 컴퓨터 애플리케이션을 실행할 수 있는 하드웨어 및/또는 소프트웨어를 포함할 수 있다. 일부 구현에서, 예시적인 컴퓨팅 리소스는 저장 및 검색 능력을 갖는 애플리케이션 서버 및/또는 데이터베이스를 포함할 수 있다. 각각의 리소스 제공자(1702)는 클라우드 컴퓨팅 환경(1700)의 임의의 다른 리소스 제공자(1702)에 연결될 수 있다. 일부 구현에서, 리소스 제공자(1702)는 컴퓨터 네트워크(1708)를 통해 연결될 수 있다. 각각의 리소스 제공자(1702)는 컴퓨터 네트워크(1708)를 통해 하나 이상의 컴퓨팅 장치(1704a, 1704b, 1704c)(집합적으로 1704)에 연결될 수 있다.
클라우드 컴퓨팅 환경(1700)은 리소스 관리자(1706)를 포함할 수 있다. 리소스 관리자(1706)는 컴퓨터 네트워크(1708)를 통해 리소스 제공자(1702) 및 컴퓨팅 장치(1704)에 연결될 수 있다. 일부 구현에서, 리소스 관리자(1706)는 하나 이상의 컴퓨팅 장치(1704)에 대한 하나 이상의 리소스 제공자(1702)에 의한 컴퓨팅 리소스의 제공을 용이하게 할 수 있다. 리소스 관리자(1706)는 특정 컴퓨팅 장치(1704)로부터 컴퓨팅 리소스에 대한 요청을 수신할 수 있다. 리소스 관리자(1706)는 컴퓨팅 장치(1704)에 의해 요청된 컴퓨팅 리소스를 제공할 수 있는 하나 이상의 리소스 제공자(1702)를 식별할 수 있다. 리소스 관리자(1706)는 컴퓨팅 리소스를 제공하기 위해 리소스 제공자(1702)를 선택할 수 있다. 리소스 관리자(1706)는 리소스 제공자(1702)와 특정 컴퓨팅 디바이스(1704) 사이의 연결을 용이하게 할 수 있다. 일부 구현들에서, 리소스 관리자(1706)는 특정 리소스 제공자(1702)와 특정 컴퓨팅 디바이스(1704) 사이의 연결을 설정할 수 있다. 일부 구현들에서, 리소스 관리자(1706)는 요청된 컴퓨팅 리소스로 특정 컴퓨팅 장치(1704)를 특정 리소스 제공자(1702)로 리디렉션할 수 있다.
도 18은 본 명세서에서 설명된 기술들을 구현하는데 사용될 수 있는 컴퓨팅 디바이스(1800) 및 모바일 컴퓨팅 디바이스(1850)의 예를 도시한다. 컴퓨팅 장치(1800)는 랩탑, 데스크탑, 워크스테이션, PDA(personal digital assistant), 서버, 블레이드 서버, 메인프레임 및 기타 적절한 컴퓨터와 같은 다양한 형태의 디지털 컴퓨터를 나타내기 위한 것이다. 모바일 컴퓨팅 장치(1850)는 PDA(personal digital assistant), 셀룰러 전화, 스마트폰 및 기타 유사한 컴퓨팅 장치와 같은 다양한 형태의 모바일 장치를 나타내기 위한 것다. 여기에 표시된 구성 요소, 해당 연결 및 관계, 해당 기능은 예시일 뿐이며 제한하려는 의도가 아니다.
컴퓨팅 장치(1800)는 프로세서(1802), 메모리(1804), 저장 장치(1806), 메모리(1804) 및 다중 고속 확장 포트(1810)에 연결되는 고속 인터페이스(1808), 및 저속 확장 포트(1814) 및 저장 장치(1806)에 연결되는 저속 인터페이스(1812)를 포함한다. 각각의 프로세서(1802), 메모리(1804), 저장 장치(1806), 고속 인터페이스(1808), 고속 확장 포트(1810), 및 저속 인터페이스(1812)는 다양한 버스를 사용하여 서로 연결되어 있으며, 공통 마더보드에 장착하거나 적절한 다른 방식으로 장착할 수 있다. 프로세서(1802)는 메모리(1804) 또는 저장 장치(1806)에 저장된 명령어를 포함하는 컴퓨팅 장치(1800) 내에서 실행하기 위한 명령어를 처리하여 외부 입/출력 장치, 예컨대 고속 인터페이스(1808)에 연결된 외부 입/출력 장치에 연결된 디스플레이(1816) 상의 GUI에 대한 그래픽 정보를 표시할 수 있다. 다른 구현에서, 다중 메모리 및 메모리 유형과 함께 다중 프로세서 및/또는 다중 버스가 적절하게 사용될 수 있다.
메모리(1804)는 컴퓨팅 디바이스(1800) 내에 정보를 저장한다. 일부 구현들에서, 메모리(1804)는 휘발성 메모리 유닛 또는 유닛들이다. 일부 구현에서, 메모리(1804)는 비휘발성 메모리 유닛 또는 유닛들이다. 메모리(1804)는 또한 자기 또는 광 디스크와 같은 다른 형태의 컴퓨터 판독가능 매체일 수 있다.
저장 장치(1806)는 컴퓨팅 장치(1800)를 위한 대용량 저장 장치를 제공할 수 있다. 일부 구현에서, 저장 장치(1806)는 플로피 디스크 장치, 하드 디스크 장치, 광 디스크 장치, 또는 테이프 장치, 플래시 메모리 또는 기타 유사한 솔리드 스테이트 메모리 장치, 또는 저장 영역 네트워크 또는 기타 구성의 장치를 포함하는 장치 어레이와 같은 컴퓨터 판독 가능 매체이거나 이를 포함할 수 있다. 명령어는 정보 매체에 저장될 수 있다. 명령어는 하나 이상의 처리 장치(예컨대, 프로세서(1802))에 의해 실행될 때 상기에서 설명된 것과 같은 하나 이상의 방법을 수행한다. 명령어는 또한 컴퓨터 또는 기계 판독가능 매체(예컨대, 메모리(1804), 저장 장치(1806), 또는 프로세서(1802) 상의 메모리)와 같은 하나 이상의 저장 장치에 의해 저장될 수 있다.
고속 인터페이스(1808)는 컴퓨팅 장치(1800)에 대한 대역폭 집약적 작업을 관리하는 한편, 저속 인터페이스(1812)는 더 낮은 대역폭 집약적 작업을 관리한다. 이러한 기능 할당은 예시일 뿐이다. 일부 구현에서, 고속 인터페이스(1808)는 메모리(1804), 디스플레이(1816)(예컨대, 그래픽 프로세서 또는 가속기를 통해), 및 다양한 확장 카드(미도시)를 수용할 수 있는 고속 확장 포트(1810)에 연결된다. 구현에서, 저속 인터페이스(1812)는 저장 장치(1806) 및 저속 확장 포트(1814)에 연결된다. 다양한 통신 포트(예를 들어, USB, Bluetooth®, 이더넷, 무선 이더넷)를 포함하는 저속 확장 포트(1814)는 네트워크 어댑터를 통해 키보드, 포인팅 장치, 스캐너 또는 스위치나 라우터와 같은 네트워킹 장치와 같은 하나 이상의 입력/출력 장치에 연결될 수 있다.
컴퓨팅 디바이스(1800)는 도면에 도시된 바와 같이 다수의 상이한 형태로 구현될 수 있다. 예를 들어, 표준 서버(1820)로 구현되거나 이러한 서버 그룹에서 여러 번 구현될 수 있다. 또한, 이는 랩탑 컴퓨터(1822)와 같은 개인용 컴퓨터에서 구현될 수 있다. 랙 서버 시스템(1824)의 일부로도 구현될 수 있다. 대안으로, 컴퓨팅 장치(1800)의 구성 요소는 모바일 컴퓨팅 장치(1850)와 같은 모바일 장치(미도시)의 다른 구성 요소와 결합될 수 있다. 이러한 장치 각각은 컴퓨팅 장치(1800) 및 모바일 컴퓨팅 장치(1850) 중 하나 이상을 포함할 수 있고, 전체 시스템은 서로 통신하는 다중 컴퓨팅 장치로 구성될 수 있다.
모바일 컴퓨팅 장치(1850)는 다른 구성요소 중에서도 프로세서(1852), 메모리(1864), 디스플레이(1854)와 같은 입/출력 장치, 통신 인터페이스(1866), 및 트랜시버(1868)를 포함한다. 모바일 컴퓨팅 장치(1850)에는 추가 저장을 제공하기 위해 마이크로 드라이브 또는 다른 장치와 같은 저장 장치가 제공될 수도 있다. 프로세서(1852), 메모리(1864), 디스플레이(1854), 통신 인터페이스(1866) 및 트랜시버(1868) 각각은 다양한 버스를 사용하여 상호 연결되고, 구성요소 중 몇 개는 공통 마더보드에 또는 적절한 다른 방식으로 장착될 수 있다.
프로세서(1852)는 메모리(1864)에 저장된 명령어를 포함하여 모바일 컴퓨팅 장치(1850) 내의 명령어를 실행할 수 있다. 프로세서(1852)는 개별 및 다중 아날로그 및 디지털 프로세서를 포함하는 칩의 칩셋으로 구현될 수 있다. 프로세서(1852)는 예를 들어, 사용자 인터페이스의 제어, 모바일 컴퓨팅 장치(1850)에 의해 실행되는 애플리케이션, 및 모바일 컴퓨팅 장치(1850)에 의한 무선 통신과 같은 모바일 컴퓨팅 장치(1850)의 다른 구성요소의 조정을 제공할 수 있다.
프로세서(1852)는 디스플레이(1854)에 연결된 제어 인터페이스(1858) 및 디스플레이 인터페이스(1856)를 통해 사용자와 통신할 수 있다. 디스플레이(1854)는, 예를 들어, TFT(Thin-Film-Transistor Liquid Crystal Display) 디스플레이 또는 OLED(유기 발광 다이오드, Organic Light Emitting Diode) 디스플레이 또는 기타 적절한 디스플레이 기술일 수 있다. 디스플레이 인터페이스(1856)는 그래픽 및 기타 정보를 사용자에게 제공하기 위해 디스플레이(1854)를 구동하기 위한 적절한 회로를 포함할 수 있다. 제어 인터페이스(1858)는 사용자로부터 명령을 수신하고 프로세서(1852)에 제출하기 위해 변환할 수 있다. 또한, 외부 인터페이스(1862)는 프로세서(1852)와의 통신을 제공하여 모바일 컴퓨팅 장치(1850)와 다른 장치의 근거리 통신을 가능하게 할 수 있다. 외부 인터페이스(1862)는 예를 들어, 일부 구현에서 유선 통신을 제공하거나 다른 구현에서 무선 통신을 제공할 수 있고, 다중 인터페이스가 또한 사용될 수 있다.
메모리(1864)는 모바일 컴퓨팅 디바이스(1850) 내에 정보를 저장한다. 메모리(1864)는 컴퓨터 판독가능 매체 또는 매체들, 휘발성 메모리 유닛 또는 유닛들, 또는 비휘발성 메모리 유닛 또는 유닛들 중 하나 이상으로서 구현될 수 있다. 확장 메모리(1874)는 또한 예를 들어 SIMM(Single In Line Memory Module) 카드 인터페이스를 포함할 수 있는 확장 인터페이스(1872)를 통해 모바일 컴퓨팅 장치(1850)에 제공 및 연결될 수 있다. 확장 메모리(1874)는 모바일 컴퓨팅 장치(1850)를 위한 추가 저장 공간을 제공하거나 모바일 컴퓨팅 장치(1850)에 대한 애플리케이션 또는 기타 정보를 저장할 수도 있다. 특히, 확장 메모리(1874)는 위에서 설명된 프로세스를 수행하거나 보완하기 위한 명령어를 포함할 수 있고 보안 정보도 포함할 수 있다. 따라서, 예를 들어, 확장 메모리(1874)는 모바일 컴퓨팅 장치(1850)를 위한 보안 모듈로서 제공될 수 있고, 모바일 컴퓨팅 장치(1850)의 안전한 사용을 허용하는 명령어로 프로그래밍될 수 있다. 또한, 보안 애플리케이션은 해킹 불가능한 방식으로 SIMM 카드에 식별 정보를 넣는 것과 같은 추가 정보와 함께 SIMM 카드를 통해 제공될 수 있다.
메모리는 예를 들어 후술하는 바와 같이 플래시 메모리 및/또는 NVRAM 메모리(비휘발성 랜덤 액세스 메모리)를 포함할 수 있다. 일부 구현에서, 명령어는 정보 캐리어에 저장된다. 명령어는 하나 이상의 처리 장치(예컨대, 프로세서(1852))에 의해 실행될 때 상술한 것과 같은 하나 이상의 방법을 수행한다. 명령어는 또한 하나 이상의 컴퓨터- 또는 기계 판독 가능 매체(예를 들어, 메모리(1864), 확장 메모리(1874), 또는 프로세서(1852) 상의 메모리)와 같은 하나 이상의 저장 장치에 의해 저장될 수 있다. 일부 구현에서, 명령어는 예를 들어 트랜시버(1868) 또는 외부 인터페이스(1862)를 통해 전파된 신호로 수신될 수 있다.
모바일 컴퓨팅 장치(1850)는 필요한 경우 디지털 신호 처리 회로를 포함할 수 있는 통신 인터페이스(1866)를 통해 무선으로 통신할 수 있다. 통신 인터페이스(1866)는 GSM 음성 통화((Global System for Mobile communications), SMS(Short Message Service), EMS(Enhanced Messaging Service), 또는 MMS 메시지(Multimedia Messaging Service), CDMA(code division multiple access), TDMA(time division multiple access), PDC(Personal Digital Cellular), WCDMA(Wideband Code Division Multiple Access), CDMA2000, 또는 GPRS(General Packet Radio Service)와 같은 다양한 모드 또는 프로토콜 하의 통신을 제공할 수 있다. 이러한 통신은 예를 들어 무선 주파수를 사용하는 트랜시버(1868)를 통해 이루어질 수 있다. 또한, Bluetooth®, Wi-FiTM 또는 기타 트랜시버(미도시)를 사용하는 등 근거리 통신이 이루어질 수 있다. 또한, GPS(Global Positioning System) 수신기 모듈(1870)은 모바일 컴퓨팅 장치(1850)에서 실행되는 애플리케이션에 의해 적절하게 사용될 수 있는 추가적인 탐색 및 위치 관련 무선 데이터를 모바일 컴퓨팅 장치(1850)에 제공할 수 있다.
모바일 컴퓨팅 장치(1850)는 또한 오디오 코덱(1860)을 사용하여 청각적으로 통신할 수 있으며, 오디오 코덱은 사용자로부터 음성 정보를 수신하고 이를 사용 가능한 디지털 정보로 변환할 수 있다. 오디오 코덱(1860)은 마찬가지로 예컨대 모바일 컴퓨팅 장치(1850)의 핸드셋에서와 같이 스피커를 통해 사용자를 위한 가청 사운드를 생성할 수 있다. 이러한 사운드는 음성 전화 통화로부터의 사운드를 포함할 수 있고, 녹음된 사운드(예를 들어, 음성 메시지, 음악 파일 등) 및 모바일 컴퓨팅 장치(1850)에서 작동하는 애플리케이션에 의해 생성된 사운드를 포함할 수도 있다.
모바일 컴퓨팅 디바이스(1850)는 도면에 도시된 바와 같이 다수의 상이한 형태로 구현될 수 있다. 예를 들어, 셀룰러 전화(1880)로서 구현될 수 있다. 또한 스마트폰(1882), 개인 휴대 정보 단말기(PDA), 또는 다른 유사한 모바일 장치의 일부로서 구현될 수 있다.
본원에 설명된 시스템 및 기술의 다양한 구현은 디지털 전자 회로, 집적 회로, 특별히 설계된 ASIC(application specific integrated circuit), 컴퓨터 하드웨어, 펌웨어, 소프트웨어 및/또는 이들의 조합으로 실현될 수 있다. 이러한 다양한 구현은 적어도 하나의 입력 장치, 및 적어도 하나의 출력 장치로부터의 데이터 및 명령어의 수신, 및 저장 시스템, 적어도 하나의 입력 장치, 및 적어도 하나의 출력 장치로의 데이터 및 명령어의 전송과 함께, 특수 또는 범용일 수 있는 적어도 하나의 프로그램 가능한 프로세서를 포함하는 프로그램 가능한 시스템에서 실행 가능 및/또는 해석 가능한 하나 이상의 컴퓨터 프로그램에서의 구현을 포함할 수 있다.
이러한 컴퓨터 프로그램(프로그램, 소프트웨어, 소프트웨어 응용 프로그램 또는 코드라고도 함)은 프로그래밍 가능한 프로세서에 대한 기계 명령어를 포함하며 고급 절차 및/또는 객체 지향 프로그래밍 언어 및/또는 어셈블리/기계로 구현될 수 있다. 본 명세서에 사용된 바와 같이, 기계 판독 가능 매체 및 컴퓨터 판독 가능 매체라는 용어는 기계 명령어 및/또는 데이터를 기계 판독 가능 신호로서 기계 명령어를 수신하는 기계 판독 가능 매체를 포함하는 프로그램 가능 프로세서에 제공하는 데 사용되는 임의의 컴퓨터 프로그램 제품, 장치 및/또는 장치(예컨대, 자기 디스크, 광 디스크, 메모리, Programmable Logic Device(PLD))를 지칭한다. 기계 판독 가능 신호라는 용어는 기계 명령 및/또는 데이터를 프로그래밍 가능한 프로세서에 제공하는 데 사용되는 임의의 신호를 의미한다.
사용자와의 상호 작용을 제공하기 위해 본원에 설명된 시스템 및 기술은 사용자에게 정보를 표시하고 사용자에게 정보를 표시하기 위한 디스플레이 장치(예컨대, CRT(cathode ray tube) 또는 LCD(liquid crystal display) 모니터) 및 사용자가 컴퓨터에 입력을 제공할 수 있는 키보드 및 포인팅 장치(예컨대, 마우스 또는 트랙볼)가 있는 컴퓨터에서 구현될 수 있다. 다른 종류의 장치도 사용자와의 상호 작용을 제공하는 데 사용할 수 있다: 예를 들어, 사용자에게 제공되는 피드백은 모든 형태의 감각 피드백(예컨대, 시각적 피드백, 청각적 피드백 또는 촉각적 피드백)일 수 있으며; 사용자로부터의 입력은 음향, 음성 또는 촉각 입력을 포함한 모든 형태로 수신될 수 있다.
본원에 설명된 시스템 및 기술은 백엔드 구성요소(예컨대 데이터 서버)를 포함하거나, 미들웨어 구성요소(예컨대, 애플리케이션 서버)를 포함하거나, 프론트엔드 구성요소(예컨대, 사용자가 이를 통해 본원에 설명된 시스템 및 기술의 구현과 상호 작용할 수 있는 그래픽 사용자 인터페이스 또는 웹 브라우저가 있는 클라이언트 컴퓨터)를 포함하거나, 또는 이러한 백엔드, 미들웨어 또는 프론트 엔드 구성 요소의 임의의 조합을 포함할 수 있다. 시스템의 구성 요소는 디지털 데이터 통신의 임의의 형태 또는 매체(예컨대, 통신 네트워크)에 의해 상호 연결될 수 있다. 통신 네트워크의 예는 LAN(Local Area Network), WAN(Wide Area Network) 및 인터넷을 포함한다.
컴퓨팅 시스템은 클라이언트와 서버를 포함할 수 있다. 클라이언트와 서버는 일반적으로 서로 멀리 떨어져 있으며 통상적으로 통신 네트워크를 통해 상호 작용한다. 클라이언트와 서버의 관계는 각각의 컴퓨터에서 실행되고 서로 클라이언트-서버 관계를 갖는 컴퓨터 프로그램 덕분에 발생한다.
일부 구현에서, 본원에 설명된 모듈(예컨대, 데이터 집계 모듈(1830), 매핑 모듈(1850), 사양 모듈(1870))은 분리되거나, 결합되거나, 단일 또는 조합된 모듈로 통합될 수 있다. 도면에 도시된 모듈은 본원에 설명된 시스템을 여기에 표시된 소프트웨어 아키텍처로 제한하고자 하는 것이 아니다.
본원에 설명된 다른 구현의 요소는 위에서 구체적으로 설명되지 않은 다른 구현을 형성하기 위해 결합될 수 있다. 요소는 그 작업(operation)에 부정적인 영향을 미치지 않으면서 본원에 설명된 프로세스, 컴퓨터 프로그램, 데이터베이스 등에서 제외될 수 있다. 또한, 도면에 도시된 논리 흐름은 원하는 결과를 달성하기 위해 표시된 특정 순서 또는 순차적 순서를 요구하지 않는다. 다양한 개별 요소가 본 명세서에 설명된 기능을 수행하기 위해 하나 이상의 개별 요소로 결합될 수 있다.
설명 전반에 걸쳐, 장치 및 시스템이 특정 구성요소를 갖거나 포함하거나 함유하는 것으로 설명되거나, 프로세스 및 방법이 특정 단계를 갖거나 포함하거나 함유하는 것으로 설명되는 경우, 추가로, 언급된 구성요소로 본질적으로 구성되거나, 이로 구성되는 본 발명의 장치 및 시스템이 존재하고, 언급된 처리 단계로 본질적으로 구성되거나, 이로 구성되는 본 발명에 따른 프로세스 및 방법이 존재한다는 것을 알 수 있다.
특정 동작을 수행하기 위한 단계의 순서 또는 순서는 본 발명이 작동 가능한 상태로 유지되는 한 중요하지 않음을 이해해야 한다. 또한, 2 이상의 단계 또는 동작이 동시에 수행될 수 있다.
본 발명이 특정한 바람직한 실시예를 참조하여 구체적으로 도시되고 설명되었지만, 에 의해 정의된 바와 같은 첨부된 청구항에 정의된 본 발명의 정신 및 범위를 벗어나지 않으면서 형태 및 세부사항의 다양한 변경이 이루어질 수 있다는 것이 당업자에 의해 이해되어야 한다.
SEQUENCE LISTING
<110> UNIVERSAL DIAGNOSTICS, S.L.
<120> DETECTION OF COLORECTAL CANCER AND/OR ADVANCED ADENOMAS
<130> AX200120WO
<140>
<150> US16/680,427
<151> 2019-11-11
<160> 317
<170> BiSSAP 1.3.6
<210> 1
<211> 297
<212> DNA
<213> Homo sapiens
<400> 1
tcgctcctct gctccaacaa cttatacttg ctcttttgcc tttgaatttc tgaggtttag 60
tgagttcgat tagccgcgtg ctcagaatca agttcgggaa gaaagaggag gaggatgaag 120
cggacaagaa ggaggacgac ggcgaaaaga aggccaaaca cagcatcgac ggcatcctgg 180
gcgacaaagg tagggaactt ccctgggctg cgaggcccca gcccgggttt tcccacgctc 240
cggtgtgcgg gccagtggtt cgctcccgcc gccggagcag gcgaccagaa ctccagc 297
<210> 2
<211> 242
<212> DNA
<213> Homo sapiens
<400> 2
cgaggtcgtg gagcggcagc agctgcagcc ggagcagcac cagcaacagc aacagcgagc 60
gggacggagt taggaccgct cggagcgcac aggtctcgag gtagtataag gtttgctatc 120
cttccacttg ctggcagttg cagaagaaga tctgcttttt aagtgaaacg tacatgccac 180
ccctccgagg gctgcggctt ccccgggctt gcttctttgc cgctcctctt tccggctctc 240
gc 242
<210> 3
<211> 257
<212> DNA
<213> Homo sapiens
<400> 3
cgacgcacgg acccggggac ctcgacactc gctaggaggc aagccctatt cctcagccgg 60
gcgcccctcg tctcccgctc tctccatgga cccctctcct ggcaaatcgc ccgcagagcg 120
agcttggaga tgcgagggaa actgaagccc caagggtgcc ccgtcctggg agcctggctg 180
tctgcggggt cccccgcatt ccgcagtagt aatacaggag ggccgggggc ttctacccca 240
acctccgctc cccttcg 257
<210> 4
<211> 264
<212> DNA
<213> Homo sapiens
<400> 4
cgtcctgcgc aggaccggca gcccgaggcg gagacgaagg gggcccgcag ggactcctgg 60
ccttgcgtct tgggagagcg cacgctggcc tgcgctacac acacacactt cacagttgcg 120
ctgaaacaga gtcgggtttt ctgtacagga gataaaatga cggtagtgtg tgtgtttttt 180
gaaagagctg ttaaaaagct aagttcttct catttcagtg agagttcccc cttggattgt 240
ttgtgcgtgt attcaattca gccg 264
<210> 5
<211> 191
<212> DNA
<213> Homo sapiens
<400> 5
cgagctgatc gagcggcagc ggctggagct gcggcagcag gagctgcggg cgcgctacaa 60
cctcagccag ggcggctacg aggagctgga gcgcgtcgtg ctgcgcctca agccgcacaa 120
ggccggcgtg cagtggcgct tcgccggctc cttctacttc gccatcaccg tcatcaccac 180
catcggtaac g 191
<210> 6
<211> 1319
<212> DNA
<213> Homo sapiens
<400> 6
acgactgttc tggacccagt ttataaagac tgcctggctg gccaggaaat cccccagagg 60
cctccttccg tgtccccggg ccaaatctgt gaagagaaaa cggaaggcta ccatgtcacg 120
aaaaactatg atcaaataaa ttattatgcc ttttctccta ttgatctgcc ttttgtcaac 180
tgattttcag tgaaccttcg gagagccatg gggaagtttt ccctttcccc ctacagggct 240
ctgaatctga aggtaagagt gagcctatag ggggaacctt ctggctccct cacaggaact 300
gactgagcag gagttggaaa agccacttgg attcccattt cctcaactcc ccgccaatac 360
caaggcgtct gtttttacag gctctttcgt ggtgttctgg gcacattcaa cttccaatgc 420
agctgagagg gtcgggaaca gttagagaac aggggtggca gccgcccggg aggctgcaag 480
gcgctcgccc gcaacgcaca ggcgcgcgcg gcgcacccgg cctccggcct ccccaggtcg 540
ggcctggcag ctgcgggaag gaggtcagcg cagccgccac acttcgcccg ggcgctggcc 600
cgacccgacc gccggcgact ctctggcagc gcccggagac cgccagcccc tgggccgccc 660
gtccgcagag ccccctccgc cccgggaccc tcgcgcgcag ctcaagttgg gagccccgct 720
ccgcaggcga gcgcgcgccc accacccaca cccactgcca ctcatgcaca ccgcgggtcc 780
ggagatgccc ccgagcgttt taaaatccag aaacatcaca tggtagccac atccggcggc 840
tgttacctgc tcgcagcacc cagaccctcg ccctggtttc ccgggagccc gcaaacccgg 900
cacgcgggct gcgcgccctc ccgcaagcca ccgctcagcg ccagcgcgcc ggcaagccgc 960
ctaccttagg ggtctgcact tcaggtcccg tcggcacctc caacttcctc ttggttaccc 1020
agaagaacag cagcaccgtg atccagagca ccccgaagac tggcagaacc agccgacgag 1080
tcaggcgccg catggtcccc tttgccgctt cctctccgcg gcgctacgtc ccgggggcac 1140
cccccggcgg tcagggttgg cggggcagga gtcctggcga gcgcctcgct ctggggagct 1200
ctagacccag gatccggttg gaggggcggc aggatcctgc aaggcgccct tcccgcttcg 1260
aagagaagcg agcctgggtg gggggtgcag ggcgacccga aacgtggcag ggaaggacc 1319
<210> 7
<211> 723
<212> DNA
<213> Homo sapiens
<400> 7
gcgtctgaga catttctcac tctggcactc taagcaatgc aataacccaa ctcctcatgg 60
cccaaagccc cagactctgg ttttcagaca aaacaacaac aacaacaaca acaacaaaaa 120
cccaccgtta tgacagtcct gccgctgagc taaccagaac ctggctgcac tactttccat 180
tcactgccca accctttcct gccttgcaga cttggaaagc aaaaatgaca ttttggaaaa 240
cctggttcac cttcccagcc agaagtgcag aactgcatgc ctcaacctcc aacttcggac 300
aggcctcctg acagcgaaga tcagaggctc agggcacccc ggggcccctc aggcagggaa 360
cgtgcattcc cacccctgac tcccctcgca ccgaagctgc acatgctcct tcttccctgc 420
cttcctctgc atgctccttg gacccaagct gaaccctttc ttcctctctc catctacaat 480
tacaaacgca aattctcagc caaggatgaa agaagtaaat tgtaggctcg cacaatatca 540
ataattccgc gggtcacagc atcccgcaca aggacgcctt cttattgcat aattaacgcg 600
aggaaggctc ttcccgctac tcccgcgaac tagggaggtc ttcaagtcgc caaaacacac 660
cgggatgtgg ctcgccagga caaaacccgc gggttccccg gtttttccgt gcgccccgcg 720
gcg 723
<210> 8
<211> 325
<212> DNA
<213> Homo sapiens
<400> 8
gtttgcttgt tctcactctg cagccgcagc cagtggcgcc gctaccaagg tccccgcctc 60
gccatccggg tcctgcctga gcatccttat tggtgctcag ggctaggcgt gcattgctgc 120
taggggcgcg gaaaggttta tcgtgggtgg atgctgcccg gggcttgagt ggtttttaga 180
ggtcttgagt ggctcactct ccaatcagcg ctttctagag acagcgtggt cagcgtactt 240
gcttactttc aggattgcga gacgtcttta acccttgctg atcggctgac gctgcagctt 300
cctgtggctt cctgctcatt tcccg 325
<210> 9
<211> 1395
<212> DNA
<213> Homo sapiens
<400> 9
cggatcttct cggacgcctc tggcttgggg ctgcgggaag cgtgggctgc ccggggcgca 60
gtgtgcggag accctctagg cgggcgggga cgccccacgc ggcgacctga gcaccgacct 120
catgcaacgg gaccgaacct tgggacccgg gcagcaggag ctctgttccc ttcacctcca 180
gcttggtttg agggatactg atgaaggaaa ccgggggttt cccgtcctgc gcggagagcc 240
tcggcgccca aaatcgaaag gccgggagtt gttctgcagg ctttgcaaac aggttgactg 300
agggtttcct ttcccgtagc gctgactgcg aaatctgtgc ataggcgttc agtgccagtg 360
gaggatagct gagcaagcca agaagttttg cagcttcctc tgatttatcg gtggagtgtc 420
aggaggctgt agcaacagtt tacatttccc ctgtccctgc gagtggctag gggcaagctg 480
ggctcggacg tgatatcctg ctgtttgtgg agaggaaact gggaacgggg cttgagagtg 540
aggggcaggg agggggggac aggcatattt tctactgcat cgcccatctg cacctgtccc 600
ctttgctgtc ttacatgtcc catagtatta aagttatttg aataagcaaa tgaaccccgc 660
tctttggtga ccgcgtattt tgaagttgga aaactttgca ggggacgagg gaatgttgag 720
gagggggcgt taagctctct cactctatcc ctttttaaag acaagaaaaa aactttcgtt 780
ggcgaaggtg gtactttttt cttttggaat gtctgagctc agagcttccc ataagaggta 840
ttgcgattca atactgtaca gtcaaggtga agttccacta agattatggg accgtggcat 900
attctacgga agataccagg gttccttggc gctctgttca ttgccagggt ggtctgctga 960
aagccggcag tttcccaccc tcagactcct tggagctctt taaatgacgg tctgcctggt 1020
gtttctcagc ggtacacctg tgagtgctct gttatcatgg aaatggtaac ccatgcaggt 1080
agggctcatg ccaaccagac tgtggtgggg tgtgtgtgtg tttgtgtgtg tgtgtataca 1140
tgcgcgtgcg tgtgaacgtg tgtgtttgga gtttcctttt gacaggtaat ctttggatgt 1200
caaagggata cagttatttg tctggcagtg tcagggcaat ctgagtttct cgagtaacta 1260
ggaggaggta atctccaggg aagccttttt gtgctcttga ctgtctactc agcagttggt 1320
gaaggcttcc tgaaagccac ttagggtgtt actaaccaaa tcaagaagtc ttactcagtg 1380
gtgagtgaaa gctcg 1395
<210> 10
<211> 197
<212> DNA
<213> Homo sapiens
<400> 10
gcgactgctc tgcggttccc caaagctcct cctacccaga cggcgacagt ttggatgctg 60
aggttggaaa gcaggacagg ggacactcct gagtgcagct cggagcgggg aaagccgaat 120
tccgggggct gaagaggccg cgcaggggac gagcgcctgc gatgcggagc gtggacttct 180
tgggccgtac ccctgcg 197
<210> 11
<211> 1848
<212> DNA
<213> Homo sapiens
<400> 11
ccgatatata aactccacac atggtatctt tttagaaatg atttgcatac atttaagttg 60
gtgtggacac accttcaaag agaggcagag gtgtatgaat tcctaatgag aatgagagta 120
tagtcaccaa tcagaaccct tcctcacatt ctccaaatcg cttgtatttc accatttctc 180
tccacgcagc agaatttttg acatgggaca tttcttgctc tcattctttc tttccttcca 240
atttactgta aggcattaag tgaaacttct tcagctatgg tgtgtggcac aaaaacatcg 300
cagcgcagga atgcatggaa tagaagggtc ctttcccttc cagaactctg taagcgtcaa 360
acgccgaccc ttggctccat ctcccgctcc cctgacctct tgtcactgtg ccatttccct 420
cctgtgcttt ctgcccactt ggaaaatatc gtatatcctt tacaagaccg ctactttctc 480
tcctctgttc acatttctcc attaccatcc acattttctc aaaacattcc gacgggtttt 540
gaagtggggt tttcaacctc cctcgactgt gatagccgaa gtcccttcaa gaaagaaaaa 600
tgatgttgga aatactagta acaaataaag tatcacggaa atccccaccc aagcgatacg 660
gtttccttga cgcgccctta accaaggcgt taagtttagc ctgacagcat ccctccctcc 720
tttcggttcc tggcctgatg agccgcctcc acctgcgagc ggtgcaggca tttttgttgt 780
cgactaaccc cctctagcgc cgaactggcg gcatccgagc cgcggctgcc aggccgggag 840
aaggctgggc ttggccgggc tctgcagcgc tccgggctcc gtccctgccc tgggcgcccg 900
cctccgccgc ggggcgaggt ggtggagacc gcggacgccg agggtcctcc cagtcagcac 960
gccgcgttgc cccggccctg gggcgggggc cgcggagtcc caccaagtgg cccgcgcctc 1020
ggcttccggg agacccgagc gcggggaggg agtgggtgcc gcgagggggc ggctcgcgcg 1080
gggagagccg tcagcccacg gcgcccctgc gctgctgtgg atgtggccac gcgccactcg 1140
gcccttggac tgctaggaga gcgcggcccg acgccaccac gccgtggacg ctcggggacc 1200
cctgaatccc agcgtcaagg ctgcgacgat gctcgtgacc tccaccgcga agtcacctcc 1260
gcaaggcgac gcaaggacct cggcgatccc gggcgccgta cacccgccac tttccagcct 1320
catgtaaccc cccctctgct gcttcctccc ggcgctttgc ttttctacaa ctggaagccg 1380
cgaaggcggc tactgcgctg agccgctcgc tctgctggtc aagtttgggc gacccgcgcg 1440
gaggagggtc gggctgactg ccgccgctga gctgtccccg gacgggagcg cctgtccacg 1500
gcactcaccc cctccagcgg tggaaatgtg gagaagtaag tgggaggcgg tgtcgggaac 1560
tgactcctct taaaacggtc ggcgccgctg ctctgaaatg ggcggctaag tgcttgtggg 1620
actaagggcg gcctcagaga tgcccggaaa atcgctgcca cggccagagt gcggcgcaga 1680
cgcggcagag ttggaggtgt ccgcggtgca ggctgctgcc cacgccgctc aggccaggtg 1740
ctgagggctc agcccgcgcc tcggccgaac cactctcagc cccgttgagc cacctcgtcc 1800
gcccggcttt catcgcaccg gccagaggaa agttcccgcg gcccccac 1848
<210> 12
<211> 680
<212> DNA
<213> Homo sapiens
<400> 12
gcgcagccga gtacccgccg aaggctgtcc ccatcagtgc gtgtctgctg ccgggcagcg 60
gcagcatcca acctgcttta ttcctcctgc ctgcagcgcc acagcgagcg agcgagcgag 120
gagggggaga gagggagtct gtctgcaaag tgctgctccc tggtgctcag aggcggctgc 180
tccagctcca actctcattc atttcgccgg ttaacatgag agatcatggc cgccttcggg 240
cttctcagct atgagcagag accgctgaag cgcccccggc tcgggccgcc cgacgtctac 300
ccacaggacc ccaagcagaa ggaggtaagg gcgccggcgg cctccccggc aaccggggcc 360
gcgctctgca gcactgaccc ggggccaagt tggcccagcg ggcatcgccg gcgctgcggt 420
ggaagaggtc ggggaggggg attagaggcg ggggccaggc tgggggtgct gggcgacccc 480
ccggcggcgg agaccgagcg gctgtcagtc cccgcgctcc actggggcgc tcgctttcca 540
tgtgccggtc gctttcccgt tgccgggcct tgcacggcgc cgccgggcgc ttctcgggct 600
tcttccctgc cgaaaccttg ctcgctctca cccgtttctg cctgctttat ttttcttctt 660
gccgcttcgg taaatcgtcg 680
<210> 13
<211> 762
<212> DNA
<213> Homo sapiens
<400> 13
cggccggtct tttgccccgg gctcaatggc tggattgtgg aaactgcacc cgccttcagg 60
ttgttgagca actgatggga cgatctcagg gaccggcgtt tacgaaaggt aatttattct 120
tcgcactctt cataataggg gtcgccctgg ccgggcgcag gcggcggcat ccaccgggcg 180
ggcaacaaga gggggtgcgg ggtgcatgca cactcgccct tccactcaca cactcgccct 240
cacacacaca cacactcatc cggtcgtggt gcggggcggg aagggaacct cctggctggt 300
gggcgctcgg gtctggcgcg ggttggagtt ttttccagcc attgggcgat ttgaccggcc 360
gaggggagtg agggggataa gagactgggc gcattcgcag ctgcacacgc tggggaatag 420
gaacagttcc caccccgtta attttccctc tcctctcacc ccagtggcat cccctggtgg 480
gggcagaaag cggacaggag ggcgactttt ctccgtcagg ctggaactgg tgccgctgga 540
ggcgggagcg ggctggagga cggacagggt ctgggtgaga agctgggctc tgggaagatg 600
gaaaatgcag ggtgccgagc ccggcgcgat tctccctcaa cgcttgcctg gagcatccct 660
ggcccctttt gcccaggtcg cgcccctgag tcttggagtc gcgctgcctc cccgcgccct 720
gcctgttgtg tctccttcac ggcagtttgg tttagacctg cg 762
<210> 14
<211> 660
<212> DNA
<213> Homo sapiens
<400> 14
cgagcgtcct gctccttcgc ccggcttcgc cttctctcat aagggtggcc gggggcccac 60
gaacttgcag ggtggcggcc ctgcgccctc cagccccggc ggggacgggc acgattgctc 120
gtagtctggg gtgctgcggt gcggggtgct gcccagggtg tcccggccgc cgccactgag 180
cgctggggcg cgcgaatcca gctgcagccg ctgctgccct gcgccggttc cctcaggctg 240
cgggcgctgc gctcctgatc tcgccggtgg ctgcgcctgg gcacgcactt gccgcgggcg 300
gggcgggctt ggggacagtg ggagcgagca ggcagagcgg agtaagcggt ccgtgtgtgt 360
gtgtctgtat gtttgtgtgt gtgtgtgtgt gtgtgtataa tgtgtgcgtg caaggaggag 420
cttagtgtga tgtcaaagcc cctgggattc tcttgccatg ttcccttggt ctctctttat 480
gggcagcagc gacccctgtc gggtctcaaa ttcaacctca atcggcgact taatctaggt 540
ggaggtaaag aggaagcgac ccctcgacct ttgagtacgg gaataacttc ctgagcgtta 600
catttagcaa atgtatgtgc ctctcgtaaa cgaccctccc gtttgctgga agtactgccg 660
<210> 15
<211> 1258
<212> DNA
<213> Homo sapiens
<400> 15
cgccgccgcg tttccctaaa cccctctcct cagaaaacgg agcccactcc ccacccacat 60
ccggcggccg cggcccccgc ctcggagcag cgcgcgcgtg tgcccgggga tgtgggtgcg 120
cggaacttac gtctcggaat ttgttccact gtccgacttc cttgtcatac tgagagattg 180
tggtgagcca ttgtttatca tccagaaaat taccgccgtc cgaccgcccc ccggctgcag 240
ccaccgccgc ggcagctgcg agagactgac tgcaccaagc ggctgcacac acacacagta 300
cggctgacac cttgagcatc tgggagagga gacacaacgg ggggtggggg ggcatgtcag 360
tgtcaaataa ggggtacgaa gccaggagcg accctggaaa acatgcatta gcaacgacga 420
gggtagaggg aggaggagac aagcagaggc aagcgtgtcc cctccccgca ggctttaccc 480
ccaaaagccg ggcactcaca cacacgcaga cccagaggag gagaggtggg tataaggaag 540
caagccccag ccgcagcagc ccgagcgggc acaaaaccgc ttcctggcac atcaccttgt 600
tgtgagccag cactgtgctc gcagctcctg ctggaaatgc agccctgctc tgccaactcg 660
ctgctttctg gagctgctgc acgcgccgcc gtctcgagcc gtccactcag ctccctgcgc 720
ccggcgcgct ccccccatct ccaccctccc ttcgcgcgcg gatctccagc ttactcccct 780
ccgttccccc tccctccccg acctccgttt ttttcctctt ccacctcctc ctatcccacc 840
ttcctctcgc tggatcccag ctacagttgg ctccggatag gacgcttggc tggagccaga 900
ggacgaggta gctcctagcc taggaatcct tatctgcttt gtaacctctc ccctccagaa 960
gaggttctca tgttcgcgag acagcctgct cattctctgc tcctggattt aacacaaagt 1020
gtactatctc tcgcagttgc ctctgctcca caatttccag ggttgtcagg cagacgtgag 1080
aaacaagatc tgaggaaaac tttatgcatt aataaataag aatacctgga cttcctaccc 1140
tgtaaagctc ctgaactcag ctcctcccta aagaaaggcc atctatccac aaggtcttgg 1200
gagatctgtt taatttcaga aaatttaaag tttgctgtga gcttctggat tactaccg 1258
<210> 16
<211> 640
<212> DNA
<213> Homo sapiens
<400> 16
gcgggctggg gttggaagag taactcgggc tgcgggctga acgcagtcgg caaccgcgga 60
agagcagcat ctcccctgcg cctgtggata cgccagtcca gggatggcga gtgctttctc 120
ctccccagct tctccctcgc tcttcgaggt gactcgtggg accctgcgtc ctagtgctgg 180
gtgtgaatcg gctatttcac acccagttct tcctcccctc cgccacacgc agtcacattc 240
ctggagctat tccaagctgc ctccgctaag caccgaataa gcggaccctg cctggaaact 300
tgagcgaagc tgaactgcgc cgaactccac cgtccagtga cccgagccag tgtggacgcc 360
cttttaatca cgctgtttac ccaggtggaa tttaggaaga atcagccttc agcctcaacc 420
tcaaaccttt tgtgcaaatg ggcacttcgt ttggaaaggg actagaaatt gtccccagtc 480
tggccctgca ccagcacctt cctctgctca aacctgtaca aagtggaagt tttaggaagt 540
ttccatttct cgtgccccgt ttcaacttgc tccccaaaga gaacatgaaa acgtgggaac 600
tcgggaggac agagatctcc ctgtaatcgc ctcgctattc 640
<210> 17
<211> 572
<212> DNA
<213> Homo sapiens
<400> 17
cgggcctcaa atgggaactt tggccagaaa atgtggtggg aggtgccctg cacccgcttt 60
gggctcgcgt ggggaagggg cactcagggt gtgtccgtcc tacgggcttt ctcgttcctc 120
cagcagaact tctagcggag tttgccaact acttccacta tggctaccac gagtgcatga 180
agaacctggt gcattacctc accacggtgg agcggatgga gaccaaggac acgaagtacg 240
cgcgcatcct cgccttcttg cagtccaagg cccgcctggg cgcggagccc gcctttccgc 300
cgctgggttc gctcccggag ccggatttct cctatcagct gcaccctgcg gggcccgaat 360
tcgctggtca cagcccgggc gaggccgctg tgttcccgca gggctctggt gccgggcctt 420
tcccctggcc gcctggcgcg gcccgcagcc ccgcgctgcc ctacctgccc agcgcgccag 480
tgccgctcgc tagcccagcg cagcagcaca gccccttcct gacaccggtg cagggcctgg 540
accggcatta cctcaacctg atcggccacg cg 572
<210> 18
<211> 248
<212> DNA
<213> Homo sapiens
<400> 18
gcgaggggtc cggcatcact cgcgcgctcc ggaaacccgc gtgagccgct gttcctgccg 60
cgctcccatc tgagtgacag gcttgtttca gagctccgca gacctctaag cctggccctc 120
accctgcgtg gagagaacgc ccgggcttgg cggagagacg agaaaaccga ggctcccgga 180
ggcagacaag gactctgcca aaaccggacg ccgcggcggt ggcagaattc gaccctggga 240
tttgccgc 248
<210> 19
<211> 282
<212> DNA
<213> Homo sapiens
<400> 19
ccgtgacgac ttataaaagc ccaggggcaa gcggtccgga taacggctag cctgaggagc 60
tgctgcgaca gtccactacc tttttcgaga gtgactcccg ttgtcccaag gcttcccaga 120
gcgaacctgt gcggctgcag gcaccggcgc gtcgagtttc cggcgtccgg aaggaccgag 180
ctcttctcgc ggatccagtg ttccgtttcc agcccccaat ctcagagcgg agccgacaga 240
gagcagggaa ccggcatggc caaagccgcg gcgatcggca tc 282
<210> 20
<211> 1031
<212> DNA
<213> Homo sapiens
<400> 20
gcgccgctgc tgggacgcgg cgcggacccg catcattgcg cgcagcagcc gctgcagcag 60
ccgccgggga ccgcggagcc gggacgcccc cgctcggccc gcgccccgct ccccgcccca 120
cccccgcccg ccgggcccag caacgcaggg tgcctaggag ccgcgggctg cgcagggagg 180
cgggcagcgg ccctcgcgcg cttctgccgc ccccggagcc ggcgcgcggc gagcgcaggg 240
cgagcgcgcg tcgggcggcg gccgcgctgg ggggcgtgag gcgagcggcg cggagagcgg 300
caggggcgaa acttcgcggg ccagatgccc gagggcgcgg cggcgctgcc aggctgccgc 360
tgctgcccct gcgggccccg agcgcgcctc cgcaggcggc actgcccgcg gcgcggcgtg 420
tgcaccgagc gagtgaaggt atgtgtggcg ggcgcggctg gagctgccgc cgccgccgcc 480
gccgcgccag caggtcctaa tgcctgtcac ttcccaggac gctggcagca gcagcagccc 540
ggagcccccg agccctcggc aggtttgcgt gtccttcccc gcgatctgat tggataaagt 600
gggggctcga cggtggccga cgtgggacag tctggctgtg gcaggggtct cggaaaccat 660
gggttattgc agtggcaggt gcacgcttat ctttatctgt ggcatgcaac tggtaagtga 720
cacttgggtc cccttattct gtaatgtgtc tttgagatag tgggcagggg agtgcagcaa 780
agggtctgcc attgactaga atggacgaaa aagataaaag agaaggtgac agatatattg 840
cctatattga agatgatttc agggagacgc actctggggt acaggagagg tgagcctttc 900
cgttcccacc tatttctgtc ccttttaaga cagtttggca ggtgcgggtt aaacttgtct 960
ttaatttctt taggaaaagc aagatgtagc tcttgttctt tatgctttgc attcctattc 1020
atgtaacaac g 1031
<210> 21
<211> 795
<212> DNA
<213> Homo sapiens
<400> 21
gcgacccaaa ccggggatgc agggagctcg cttggcccct ttgaaggccg actccgcaat 60
aagcagtttt tcctttaaat aaccgtagtg gatttgagag aattttccat ggctgaaaag 120
agaaacagga gctgtaggca acatccctaa atttataata atgcatgtaa acatgctaca 180
taccacatat atgtatatgt gcataaatat ggatgtggtt gggcacatac ctatctagac 240
accattgact tgcctggtca aagaataaga cttagacatt tcgtgcctgg gaaatggtgc 300
agtttatctt taaggagact agaaaaataa gagatgaggc tcacgttgca cggatgacat 360
cactagcttt tggctgcgcg ctcggtgttc tcgtctgtgg gttttagcca aggctgcagc 420
tacccgcgcc ggacgagaga gcgcggcagc agcttcctcc ggcgcccgca cccgggcaat 480
gcgatttccc cagtcccctg ggcgcagcct gggctctcgc gcctcccggg caccagccga 540
gcctgcgagg cctcggagcc gccgcggcta gaggaggagg cgacgagggg aagccgagtg 600
acccagcctc cctcccccac cctctcccca ttcatctcgg cgaccaccgc gcgccgggag 660
ccggatcgtg ggacgccgag gccaggacgg gattctctgc acgctgtcga gtgagccggc 720
atctcggcgc ccgggtgggc tgcgaagaaa atggtgcaat ctgagagcga ctgagcccag 780
ctgggcagag cagac 795
<210> 22
<211> 160
<212> DNA
<213> Homo sapiens
<400> 22
ccggtgctcc cagaccccct tccttctcaa acacgcatca gacactttgc accaagaaaa 60
aacaaagggc atccctcctg gggccacctc tgccccctgt ccaggtacgc gctgtctggc 120
gcgccctgcg tgggggccgc aggttcagac acccgggcgc 160
<210> 23
<211> 554
<212> DNA
<213> Homo sapiens
<400> 23
acgcttctca tttattttat atttatacaa acagcgcttc cctgaaaaat cagggtatcg 60
ttcaagattt tatctttatt cacagaagtt ttaaaatttt taacttttat atgcacaaga 120
cagttctgat ttgttgaatt aagtgaccgc gggtgtgcta atgcttctaa aaaacagcat 180
tagccttctc ccatcaaaag tccggaagct gcccttcagt cgtcaaagtg tttgccttaa 240
tttgcaatcg ttatgacttg agccaaatgc ttatacctca tttgtgtcgt atatgtgaag 300
atacaattgc aaatcgttca cgaccttgag tcaagacctt gagtttcctg aggtcaggag 360
accgttaggg aatgtgagtg tcccagacgg gcgctgagcc cagctcggag acccaccccg 420
cccgtagcag cggcgcgggc cccagagagc cccgcactcg gccgcgcctc agttacgctg 480
actcggctgt gcccgcagtg tcgcgctgtc gcgtagccag gtgtcgccgg gctggcgcgg 540
ttatttatga ctgc 554
<210> 24
<211> 1732
<212> DNA
<213> Homo sapiens
<400> 24
acacgacttc tctgcctgtg gatgtctcat gaccctctag agcagcgact ttttcctccc 60
tcattccttc cactcccctc gggcatctaa gtagcaggaa cctgactgtc caaagttgat 120
ttgggagcag ccggctgccc ttctaaaatg atctaggaaa ggtgccagta acataagccg 180
ccgcctgctg aaactggcgc ttcctcagcc actcgctgcg gccagcgtga aaggggaggg 240
gaaaggggca ttcctggcac ggtcaggtgt ctacggacag caatcttagt taattctcaa 300
aaccccggaa gatccagaaa tggggtgctg acagggacct aacctgtcca ccacccctcg 360
gtcggtggga ctgaaaccca tgtctttgag ctgctttacc agtttatttc caaaaagtcc 420
tcctacacct gggaagggac atagaaagct gatcccattg ccagccggat ttctttactt 480
aactctcaac cgtggtaaat ctaattcgct tacgacctct ttccgagagc tgggaatctg 540
cagagatgct ctgttttctg ctgtactaat ctcaggcttc ccaaagcgag tgcctcgccc 600
agctcctagg ggaatccacg gagccccagg cgcagggcaa aggatggggc gggatgggga 660
catcgtacct gcgctccggg agccgctggg agtccggccg gccccggccg cggggaggaa 720
aagcaacggc ttgggctcct tatccgtgac gcgcgctccc ctgcgccccc ggggcctccc 780
gtgggctccg tgcggggaca aagccagcgc cagcaggaag agtgcgggca aaggggcgcc 840
gggcttaagg ggccgcatgt tcgcaagccg ggaggagaga gcgggagact ccgggaggat 900
cccgacgcag gtccggaggg tgcgcggccc aagagaaggc cagcgggacc acagcgcggc 960
tacgcggccg gccgcagtct tcaccgcgcg cctgcccttg tctacgtccc gggggtcggc 1020
tggagctgca ctgggactcg gtcctcagtg tgccgaagcc taagcgctgc ggggcgcggg 1080
gcgggaacgg gaggcggtgc ctggggccac ggggtcgtcc cccaggatga gggcgtgtcc 1140
cagcgcgcgg gaccctcgga agtccgcgct gggccgggcg ggcaccagcc tcggactcag 1200
cgggtctcag ggctccctgc gcaacgcctg cctcggatcc ggaccccggg ctcgctctct 1260
ggtcgccgtc cccgggagga cccagtaggg taactgccgc gtcgccccgg cggttctccc 1320
tgggctctgt ctcccgccgc ctccaccccc cgagcctcgg ggtccgtcac ggcttcccct 1380
ggctggcggg gtcagtagaa cccgcggcgc ctaggtccgg acggaaaaaa gcagggccgg 1440
ggtgcggcct ggatgagcgg agatctccgc gccttgggct caaaggtgcg gggtgcgctc 1500
tgctgccgag cccctgctcg ctcaggaaca ctggccacgc cgtcacgcca gccgcccctg 1560
ccccaggtct ggaggcccga cctgctctcc taggcgcagc accgcgttct cttccgcgtg 1620
ggggagcggc gggcggaaga ggtctggggc tgggcaccgg ggacacgcgc ccagctcccc 1680
tggcctccct ggggggagtg gccggtttca gtgcttcccc aggtgaaatc gc 1732
<210> 25
<211> 527
<212> DNA
<213> Homo sapiens
<400> 25
gcggcggcag cagcagcagc agcagcagca gcagcaagaa atccaaagag caaaaggcgc 60
tgcggcttaa catcaatgcc cgagagcgcc ggcggatgca cgacctgaac gacgcgctgg 120
acgagctgcg cgcggtgatc ccctacgcgc acagcccctc ggtgcgaaag ctctccaaga 180
tcgccacgct gctgctcgcc aagaactaca tcctcatgca ggcgcaggcc ctggaggaga 240
tgcggcgcct agtcgcctac ctcaaccagg gccaggccat ctcggctgcc tccctgccca 300
gctcggcggc tgcagcggca gcagctgctg ccctgcaccc ggcgctcggc gcctacgagc 360
aggcagccgg ctacccgttc agcgccggac tgcccccggc tgcctcctgc ccggagaagt 420
gcgccctgtt taacagcgtc tcctccagcc tctgcaaaca gtgcacggag aagccttaaa 480
cacacccccg aaaaacacaa gaccgaccca aaatctagag gaaagcg 527
<210> 26
<211> 211
<212> DNA
<213> Homo sapiens
<400> 26
cgccgctagc ccccgtcata tcttctccgc tttcgcttct ccactctagc cgggggtggg 60
gtgggtgggg ttggggtctc cgcgggggtt tccggccccg cggcccgctc ccgggtgtgc 120
ctggaggagt tctccctctg tggcgcgcgg gagccctgtg atgcgtcagc cggcgggacg 180
gatgagttgc ttctccggga aaccgtcctc g 211
<210> 27
<211> 315
<212> DNA
<213> Homo sapiens
<400> 27
cggccggctg ctgcttacgc gggtaacctg tcggaaagcc ttgtttgttt ttctggaaaa 60
gtcgctgcaa tggacacagc gttgcgcggt ttccctgcgc gcctggggcg ctttttgtct 120
tcgccctccg tggatggagg ctgagcgcct cagccatttt gagagctctg gaaattttat 180
tagcatttta aaatttgcat tctcgaccga agattaaagt gcaaattact ttgaagatgt 240
tttaaagcac gcttaagaat tttaaagaat atgcgcaggt ggaaaaaagc gcgccagggt 300
ttgagatttg gtccg 315
<210> 28
<211> 142
<212> DNA
<213> Homo sapiens
<400> 28
cgatggccca gctcctcagc caggtccacg ggcagacggc cccaggcatc gcgcacgtcc 60
agccgcgccc cggcccggtg cagcaccacc agcgtgtcca ggaagccctc ccgggcagcg 120
tcgtgcacgg gtcgggtgag ag 142
<210> 29
<211> 217
<212> DNA
<213> Homo sapiens
<400> 29
cgcgccggcg ggggcagcgc cggccgccga ttagttttat ctcggaacgt caattgactt 60
agactgattg gcttcctgcc gccaatgtca attaaattgc aaatgcttgg cggaggccgg 120
cgcgagcggg cggcctcctt cccgggggcg ccgcgctcag ccttctcttt gcgccacgtt 180
cggccgcagc tgaattcatt tctccttcca cgtcgcg 217
<210> 30
<211> 62
<212> DNA
<213> Homo sapiens
<400> 30
ccggtggtgg ggtcgtagtg gtttccgagg ttggtgacca cgtcgtcgaa cttgagcacc 60
tc 62
<210> 31
<211> 306
<212> DNA
<213> Homo sapiens
<400> 31
cgggtccgag accctcgtag tgtggggaat ttcctgggag gaagatacta cgcggggccg 60
ggagcagaat ttgctccagg cactgggcca gtccatgagg gctccaggat ccaggggccc 120
cactcccttc tcgccgggct ccgggccaag gaagcgcggc cggagtcccg ggaagcccct 180
cggcagccag ccaagggccc tgcgaggatg tggatggcgc ggatggcgcg gcctccacct 240
gcgggcagtg gagagagcgg cgagaggaag aatattcccc gcgagccggg ataaggggcc 300
ccttcg 306
<210> 32
<211> 718
<212> DNA
<213> Homo sapiens
<400> 32
acgtatctaa acaccattac caggctccac cagcccctct gctcctcagc ttagaggagt 60
ttttaaaacc tgttgagaat tatcgcagat acgtttggcc attatccagt cgtttcgatt 120
gtgcctttcc taaatgtccg cggttggcag aacgtgggag gaagaggacc cgcctaactc 180
ggggtaggtg gggacgcgct gctcactgtg gtgaggttga cacttgggcc ctgggtttca 240
cttgcaggtg ctgggcggcg gagagccccg agaaggagga ggagagagag ccagcagcca 300
acccctacga cttcaggagg ctcctgcgca aaacctccca gcgccggcgc ctcgtccagc 360
agtcctaacc gttcaacgag gcagtcaccg ccgtcggaag gcgctggagc ctgcggggca 420
gcaggggcca agcaggcact ctggggctgg caccagcagg cactgaagct gcggccctga 480
tctccgcaga ggctgcctgc tgcgctcggc cctcaagtgc ccgggccggc cttcgtgctc 540
cgaaacaaga gacctgggag ccctcgggaa acctcccccg acgctctctc tcggaactcc 600
cgcaccctcc tttctcacca gcccgccagt tgtggcaacc ctgtccttgt tcccctaatc 660
tatcactttg ttcttttttt ttgtgactcc tgtggactcc actgcgcctg ggatctcg 718
<210> 33
<211> 314
<212> DNA
<213> Homo sapiens
<400> 33
cgcggagaaa cctggcgggg ccccggactc cccggcttgg gaaaagcgat gactgccctg 60
aactgctggg gcgttcgaaa tttccagggt cccgaccctc cgtggggtac gcgcgacttc 120
ggcgcagatg tcagtccgct gccttccggg ttgagggagc gaggactcca gacgacccca 180
gggccgctgt ccaggcccag ccccgcgttc tccacctcgc cacctcgctc tgcggctcca 240
gcctggagat ctacggactt cattgcgatc tcttgcgcag tgtagtcgcc ctctatccct 300
agccccgagt cccg 314
<210> 34
<211> 1352
<212> DNA
<213> Homo sapiens
<400> 34
cgcggggaaa gttggcgcgc gcctgaccgc gcctggaagc cgcgcggtgc cagggccgag 60
ttgtccccca agtttctgcg gcgatttgtc actccctggg gatctggcgg tctgaatccc 120
gcggggcctc cggctcaggg attctgagcg ctgggagaga gaagcccgcg cttttcccgg 180
ggacctgcgc ttgagctggt gcttgtgcgg gttcgtcctg aatggtagcg attcgagttg 240
ttttctgctt ttcttctccc ccagacagtg agtttgtgga agcctcgccc gcatcctaca 300
gcccagacga gttaggtaag tctgctcatt ttgtctttta tttcttggtc gcaattctgc 360
ccgagaactg cgagtttggg gggcgtccat aggaactcag ctagggatgg ggctggggtt 420
ggagggcgga gggaaagggt caggggacac ctgctgcctt cgcggccgga accggccttt 480
cctcggcgct gtgctttcgg gggtggcagg gcaagtgtcc aatgagccgt gcgtgtgtgt 540
gtgtgtgcgt gcgtgtgcgt gtgtgtgtgt gtgagtgcgt gtgtgtgcgt gttcgtctgg 600
ggcagtggtg ctgctccgag gagcctggca cagcaaactt ccagagctgg ggcttctgaa 660
acctgcgctc atcttgccgg gaggacacag cggcgactgg ttctgacttg ccaagtacct 720
ggcacgagaa ggacgtcgtg tgggtcgtcc ttaccctgaa tttaatgaag tcaggggctg 780
aaaacggcgg tgtaatcatt aaactgtaag acctaggagc tgcttccctc cctgatttct 840
attcctcagt tagcctgtag gtgtctcgag ataggacatt ccatcctcat gcctgtcatg 900
gtaagtggag atttgcgatg ggtgaaccgg gacactcttg tcaagagaca ggctgaagag 960
agagtgaaga gaaggaaatg cgaatgggca ggatctctct aactcttcct gccacccatt 1020
ctcactcggt ggcttagtgg ctctcttttt tttttcttct gctttcaagg ttagtttagc 1080
tgctactggt ctgggctatc aagtctctcc ttactgttct ttcatcacta gcctgaatat 1140
cttgccttcc taagatgaaa tgaaaggatt tattttatga tatatgttga cagtaaagga 1200
ggaggggaac tgtccacaaa cagcggttta aatatgttta tcctcagtaa cacactcagc 1260
tgtggcaccc tgtccctggt cagcttcttg tgctgggaag aatgtcctca tcaagtccca 1320
caggacctga agcaaaattc cacctcaaca ac 1352
<210> 35
<211> 668
<212> DNA
<213> Homo sapiens
<400> 35
cgagggggaa gtggcttgtc agccccggct ccgggaagag tgaacaataa ggctagggca 60
gccgccccag atcgttatat tcctgggtct aataaagtca ggatcgctgc tttgcttccc 120
ccgccccaga agaataacgg tttgcaaaat ggggcaaaat gggcagaatc gcacggccgt 180
tgttgttggt gtgaccgttg ttgcacccca gtcgacatga cgttagtttt tcatttgcca 240
aattgctggt tagttgcaaa gcctaccctc ggccgcgagc actgaaggat gggagggtcg 300
agcgccgcgt tttgacagga ggaagtgcgg aggggcggag ggcgaggagg gcgtgattgg 360
ggctgcctgg tgtgtgcgcg cgcgtgtgcg cgcgtgtgtc tttacacgcg ccgcgtgccc 420
agtgttgcac ggggcgggag aagaatggca ggtagccgcc cgaaacacct cgccctgtct 480
cctttctttg ggcgaggttc ccgatcctgg caaagtgtga acaataggga gctgggagga 540
agacagtagt gatgctgccg cgggtggcgg gggttgcgcc gccgcccaga gaacctcggc 600
agtgtgcagg gaggtgcatt tcattttggc tatttccatc ccggcctccc tggaaaattc 660
ttctgtgc 668
<210> 36
<211> 497
<212> DNA
<213> Homo sapiens
<400> 36
cgacgatttt tgaggccacc cttccttgtc ccgcaatccg atcgcctagt aaatgccagc 60
agtatctggg ccttgagtct ggctttgacc cggcagtatc tacaaataag ggttatcctc 120
tttcccccaa cccacgatgt atcgcagtgg gctccggcag gctgcagact ccagacccct 180
ggagcaccgg cagggcaggg ttggacccct ccccgggtgg caaccctcca ctggagtgcc 240
cttcctcatc gtcttggggt taagagttgc cgcccggcca gggcaacagc cagggcaaag 300
ggagagagaa gccgccccgg ggcgagaagg agaaaagtta gagggctgaa caggtgacgc 360
tgagcttgtt ggagcgtgtg tgctccacca cgcaagggcg cggagttcgg ccgcctcatc 420
tcccgccatc tgcgcgcccg ggggcacgtc ctctgcgata gcctggaacc cagactacct 480
gcgcctgcct ggtcccg 497
<210> 37
<211> 998
<212> DNA
<213> Homo sapiens
<400> 37
gcgcctggat tgctcaagag aggtcaggga aacccctcag aactcctgag acccagagat 60
tgagggaggg gttgaggcgg agtctgcaat gggggctgtc cagcagtagc aagcagcggg 120
ccgatcctgg tggagggttg ggaggctgct gtcattttat gggtcggcag ccagagtgag 180
agtgtccctg ctgccagagg actacggcgg gctgggcgcg gggtccccgc ctctcgctca 240
ccacacagac cccgcgcctc ctctggcagc cgcggtggtg gcggcggcag agcctcgccc 300
actccaatcc ccaccctctc catccttagt cattaaagaa cagcagcgcc tggcacgttc 360
ttggaggacc ccgggcgcag aggaggaaag ggagcaggcg cagggggact ggaaaggcag 420
catgcgctcg ccaggagcaa cctcggcgcc cagggtctga ggctgcagcc ccagttcgcc 480
attgtgagcc gccgccgggg gagtccgcta gcgcagccgt gcccccgagt ccccgtccgc 540
gcagcgatgg ggcacctgcc cacggggata cacggcgccc gccgcctcct gcctctgctc 600
tggctctttg tgctgttcaa ggtaggggag ctcctccacc cctttttccc agcggtccgg 660
gcggcagccg cgctccggcg ccctcgctct gccgttggga gcggcgcgcc ccagggcacg 720
atggcccagc cgcgggaagc gcctgccgtg cagcctgggc gcacgctttg ttgtcctcgc 780
gtgtgcgtgt tcctggtggt cttgagaggt agggggcggg gggaagaata agggaagttt 840
gctccctccg gctttcgccc tttgtgctct tttatcgctg ctgaaatcca catcaaaggt 900
gggcttgttg gatcgtgctt tctcaggcaa aatgaggtca ctttcttttc tggtttccac 960
tgcaccccaa cgctgcttaa cctttccgcc ctccctcg 998
<210> 38
<211> 735
<212> DNA
<213> Homo sapiens
<400> 38
cgatctgaca gcccttcaaa ccaatatact ccctatctct ctctctcccc tggttcaatg 60
acaagatctt tggccaactt ctttctactc ggaccttgct attatttcct actaggcacc 120
cacaaaccct tgcttgttaa actgatctcc ttcaagactc aagaaaagcg ccatgcggct 180
ccctcctagg gctctcctgc cctctcctca ccgatgccga gagtggttct gctggagaac 240
cgccgcgcct gcagttcctg caccttttcc cggagctgcg ccagggaatt acggacgaac 300
tggaaggggc cgagaagaaa ggtcttggcc accacctcta gctccaagcc ttttcgctct 360
ttcagacttt ggatcctccc cggggaggac ctccaggagc cccttggcag tttcccgccg 420
cctagggccg acttttccat ctcctcctct acctccggct cccgggcgag ggaggccccg 480
cgccgcccct tagactggct gcggccggaa gattgcagcc gctttgagct tactccttgt 540
tttctcataa tcaaggagta tggtggagct gggtcaattt caggcacagc ccagccgagt 600
caggcgaggt ccagagagac ctgactcgcc tggcagcctc aacggacttg tccccgcagc 660
cgttgcggac ctcccggtcg tcatggcgac tgtgaaatgt ggggtggggc gcatgcgttg 720
gaagccattc gcgcg 735
<210> 39
<211> 359
<212> DNA
<213> Homo sapiens
<400> 39
ccgtaaagaa ccctgagcta ctactcagac gaagcccccc tccccgccaa taataataat 60
ataatggcgc ggaaactgtg ggcggtggtg gtgacatttc ccacgactca gtggcgcccc 120
cgggcggctc ccaccctccc tccggccggc gcgtctacgc agccccaagt gctggctgcg 180
accctcggat cccaagcata tctggcgatg gagcggcggc agcccgaggc acgtgttgtg 240
tgtgctccga ttgcaaaaga aaaaaaaatg catttcaaac tattaacttt tttttaagcg 300
tgcaatgccg ggagctgggg gtagacaggt gcaagcgggg gtaggcgccc cgcgcgccc 359
<210> 40
<211> 2027
<212> DNA
<213> Homo sapiens
<400> 40
ccgcgattag ttccggcaga gtgatgcagg tagggatgca gatacagccg agtaggtgag 60
ctctgcccca accgtctacc caattacaag catctttcgc ctacactgag gacacatcta 120
aacacagaat ttacaattgt gcatgcgaaa ctttacactt acgttagttg cctcaacctt 180
tcccctttcc cagtatgctg cagttaggaa tgatttgttc caacacatag aaagccatgc 240
atctggtagc accagtttgg ggagaaatca gaagcagcaa aatgtttcct ccttgtaaaa 300
tgtgttgctt cgggctggca aattagcaac tccagagaac aaattcacgg atttgtcgtt 360
agtcattctc tccacatttc gtctctctta cccactgggt ctgggttctt ctgggcattt 420
agcacacaca acacatagtt gcacttcttc agctcaggga tattttccac agcagcatgc 480
ataccatttc catccgatgc caatactgct taagtctcta acttcttgta ggaaacgtca 540
gagttgcggt gatgatgatt ctctgacagc tatccgggtg acagttgccc gaaaaattcc 600
taatcggtta tctcttgcgt gcttcagaga ctctgaggcg ctcctttccg tctcgcgtgc 660
tctccctctc tcccttcccc tctgcccctc tctccttctc cctctcctct ctctgaactg 720
aatttcttga tataactctc aataagccca gagggagggc gtgactgccc aggccccgcc 780
cccgggctct gattggcctg catcttgcgg cgcgggcggc cgcagcccgg cgcgagggag 840
ggagcgcgga acaaggcgct gactgtctcc cagcctcccc tcctccgcgc cccctcggca 900
gcagcgaaaa cccggaaatc tgatcctggc cccaggagag ccgggttcca tgaggtgcac 960
tgagcatgct ctgcagggtc cggcgtggga gggacgcgct ggcgctcccc aggcccgggc 1020
ggaagcggcg ctcgcaggcg ctgaaagcga gcgaccctct gagcccgggt ggtccggcgg 1080
gcaagggcgg cgcgggagac ccgcagggcg cgggcgcgga tccggggaac cagggccacc 1140
gctgcgggcg gatgggggtc accgaggcgg ctcgtctcca ggcgcacact tcgcacatct 1200
ctttgctaag tgaaggggcc aaaatgcaca gatgggggag tctacccagg aacagaggcg 1260
cgagacgtat agccacccct gggttgggag cacgagccag cagatccccg gagcgcgtta 1320
aacggacaac atgcccggtg ctgcaaatag aggcttttgc tggcagggac attggaaaga 1380
agggcggaga gggagtacag cgaaaggtgg ggaccgcaga atttggaatc tctgcggaga 1440
ccggaaagaa aattaatcgg agcacttcct acatgcagag ccacggaaac tgccttggaa 1500
agagaaagtg gcagcgtctg ggtcccctcg gtcagcccgg gccagtcggc tgcgcgtgcg 1560
aagtctcctc tagcggagcg ggaccggccg cggcggtgga tcgtggcggt ccctgcactt 1620
ctgctccagc cgcgcctgga aacctgagcc cggactcgcg gctgctgcaa aacccgcttc 1680
cagcccacct cactgcgaac tttgcttccg aggggctgga aggagtccca ggcagctgtt 1740
tcccaagctg tggaacactt cctttcccct aggcactttc tgctgattcc aactttcttt 1800
cctgtgattt tcgtcttttc ccgtgcattt catttctccg actccagctc tgtactaaat 1860
cctcacaagt ttctcgtttt catacgggaa ctggatggaa tgactcccca aaaaatacag 1920
ctttatttct caaatactga cccccaaagc actatctagt aatatatttg attgatcttt 1980
caaagtcagt aaaccacaaa ggtttgtgta atggcttgta cttaacg 2027
<210> 41
<211> 144
<212> DNA
<213> Homo sapiens
<400> 41
acgtacaggg cggtgatcca gtatctaaat tctttgggag aaaatgaata gttcccccgc 60
ccccgccctc caggaaaaaa aaaaatctga gaatctgaga atgttcagcg cacccgcgaa 120
tttgcatcgg aggtgcgttt cccc 144
<210> 42
<211> 604
<212> DNA
<213> Homo sapiens
<400> 42
gcgcgccctg gcggctccga gggacctggg ctcgggcttg cggtcgcgtc gcctgggctt 60
tccctgggct gggagcgcgc cgggtctccg ccttgcacgc tgtcaccgcg ggagacgtct 120
cggcctcgcc gcgcgcagag gggacgcgcg gagaggctgg tttctgggcg agcggagagc 180
tttgcccatt aagctgccgg aagaagccaa atcaaaaagc caatctccaa gcctccaaac 240
ggaacgtcac cctatcagct gggagacagc gccgcactga ctgacaagcc gcgcatattt 300
atcctcgcgc gcggagggga gactctcaga acgctcctcg accagcagcg aggaagtcga 360
gcccgcatcc cgcatcccgc atcccgcatc cagagccccc gagggacgaa ttcagatcca 420
acccctgccc cgcggccacc caccctagtc gttggagcct ggcgcccgcg cctcccggcc 480
ggcagcacgt caaaacggcg gcgcgtcctg acctggattc cgccgagttg ggagctccag 540
gcagcaggcg ggcgcgcggc accggctttc cccttgtcct caggagacgc tgcctgcaat 600
tccg 604
<210> 43
<211> 233
<212> DNA
<213> Homo sapiens
<400> 43
cgcgagcggc tgggtgtcgg tgccctgctc tcctctgggc gccaggatgt tcctgcccag 60
tgcgtgtcca gaatagccgc tcagacaccg gctccaggtt cagccaggcg gggcgcgtcc 120
ctgcctccct cccctttgcc tgccactgcc ctccttctaa cgagggctca gctccgacta 180
ccccaggcct ccggggaccc tctccggatg cgctccccgc tttgcgcttt gcg 233
<210> 44
<211> 261
<212> DNA
<213> Homo sapiens
<400> 44
acgcaagttc cccctgactg ggggacgccg cccagctcct ggagcctgcg aaggctcttg 60
aagctgagct tcccagggat accagaaggg acactctcgt gcaattccgg ctagggaaag 120
cgagggaagg tggcggctcc gggcagggag cgagcgagtg ctccacgccg cccgcaggat 180
cgagtgagtc acgcggccgc cagacgaggc cggtggcgca cgcacccgag atccgatgta 240
gtgcaccgcc tcggcgccgc g 261
<210> 45
<211> 47
<212> DNA
<213> Homo sapiens
<400> 45
cgctcgttgc gacccaggct cagctccgcg gtgcgcaggg cctggcg 47
<210> 46
<211> 335
<212> DNA
<213> Homo sapiens
<400> 46
ggcggccgcc agctgggagc ccaccaccgc tcgatggtac cgaaccgacc cgtgtagccc 60
cataacccca gcccaactcc gaggagctag cgcagaccgc tctccgccct cagctgcggc 120
gaggcaaggg ctggcagcgc tcggacgcct ccgtcttgcc cttcccatgc ctaagcgcgg 180
ggaattacac gttcccggtg tagaacagac gatcggggct attagggctg ggcggtggga 240
gtgggggttg ggagcaccat ttttggctgg acgtgtgtcc agactcatcg tctctggtcc 300
ttaggacccc atcttcctct gcatctccag gtgtc 335
<210> 47
<211> 317
<212> DNA
<213> Homo sapiens
<400> 47
cggcggctgg ccaggggcac agagacgcac tccacacaga aacccaggct ggcggggtgg 60
gcggccgggg agccagccct gcagatgtta ctaagtgaaa cctgatgtgg tgacatgaga 120
atccacagaa cgtctcacaa acaacctgcc ccgggatgtt ttggattgag ttttgtggtt 180
atgacgtgaa gaaacctcac atgtcaggat aaaaataacc ctggcttcag tacataacgc 240
gagttacagt tcaacagaac cagatgtgaa aacgtcagcc acccagttca ggcccagcag 300
ggtccctgct ccactcc 317
<210> 48
<211> 235
<212> DNA
<213> Homo sapiens
<400> 48
cgggtctgga agattgcgct acgggagttc tccgtctgag aggacaactc agctttcgca 60
cgggagggtt gatgcttaac agaattaaaa atatatgtat taagaaccgc aagcccactg 120
tgtgccagcc gccgttggta gttttacacg tgcgatctta tttaatactt cctgggacct 180
aatgagtcag gtgccatcat gatccgttta caggtaagaa agccgccgct cagcg 235
<210> 49
<211> 81
<212> DNA
<213> Homo sapiens
<400> 49
cgaatcgcac ctcttctcct gtcctaatct caggctccag gcctggcttg cagtttctgg 60
ctcaccgcgc tgcggtcacc g 81
<210> 50
<211> 24
<212> DNA
<213> Homo sapiens
<400> 50
cgcccccgcg gaaaccgctg ctcg 24
<210> 51
<211> 236
<212> DNA
<213> Homo sapiens
<400> 51
gcgaggccag actgccccca cacctcctgt agccactgag cgcgaagtgc gttggttccg 60
agcgcgctgg tgggatccac aaagctcgca ttctctcagg aatcccctga gaaattaact 120
gtcccttgcc caacatgtct tctccaggct gtctgctaga gcctcaggcg cctccgccct 180
ccctcccgcg gcaccgtcac cagtgggtag tcacagcctc ccggagccca tagccg 236
<210> 52
<211> 533
<212> DNA
<213> Homo sapiens
<400> 52
cgcctccgcg ccgcgcgccg ccgccgcctg gtaccgcccg gccgggagaa ggtgagattc 60
gcgcggcctc gcgcacaccc gcggctggga gctcgggact gcggtgacgg gaggggcagt 120
gtggtgaccc acccaggatt tttttttttt tcccgtgaaa gtcctcaagc ctgtcctctc 180
cctggcccga tcctattgca gcgacagaaa atcagcagcg ggcgggtctg tgtggacctg 240
agggccgcgt ggggaccgag gggggctgtg gcccaaagag tggcagtgag tggcgtcaag 300
gaacccacac tccgcatctg ccactcctag agccgggact agctcccgat cctagcagtt 360
gctctcgaga tcatcccggg agttattggc gagttctggg cctctggagg tttccctgtc 420
agcctccccg gccgccgagg gggcgcgcgc ccaacaaggg ggtctctagc ggccacctgg 480
ggacagaaac agtgaccctg ggcgcgcact ttgcctcccc gttagagatg tcg 533
<210> 53
<211> 280
<212> DNA
<213> Homo sapiens
<400> 53
gcggaagccg cgagggatgc agcggcgggg accttggccg gtggaggatg tggaggtgga 60
agtggagcgg atggcgctcc ccaagagctc cgccacgcga ggtttcgggc tcgtggtttt 120
gcttcctccg ggtccccgct ccagggccgc tcggcgcgac gaagacgccg gggacagcgc 180
cgcggggagg gcgctccggg tcgtgcgtgc tgcacccaca aagagcagca gtcccgccac 240
tccgcgcctc cgctgcgtgg gggccgaggg gcgcttctcg 280
<210> 54
<211> 535
<212> DNA
<213> Homo sapiens
<400> 54
cgacatagtc aagcagggct acgtgaaaat ccgcagcagg aagcttgggg tgagtggctc 60
gctcggcttg ctccttcccc ggcgctcgtt cggcccggct ggctgcctgg ggggggggca 120
gggagaggtg acccgtgcgg gtacagggca gagagggacc cggcccttag gcggatggcc 180
cgcttgttgc ttggccaggt gggggcccac acctgccggg gggctccgca gacggacctg 240
gggactccag gagcgcctga gtccccatcc tcgagtgcac cgggctgtct tcgaccgtgc 300
ggggaagtca gtagacgaaa ggggttgtca gttccaacga ggaacgtgcc ttggaggagg 360
tttctttgcg gtgctatcca cgatggtctg ttctcaaaag tgtgcgcctt tcgggtggaa 420
ctgctgtgtg tggcgacgct cgcgtgtgtt tagaatcacc attttctggt ctccgcttcc 480
caagctcaat tcgaaattcc cgtctgatgc cctcccagcg ccgcgcgtcc ctgcc 535
<210> 55
<211> 69
<212> DNA
<213> Homo sapiens
<400> 55
gcggtgggcg cggcctgcgg ggatgccggg ctctacggag cagcgcgggg tcccgaagcc 60
ccctaccgc 69
<210> 56
<211> 1211
<212> DNA
<213> Homo sapiens
<400> 56
cgtaaataaa tgagatttac acaaatagcc attcacaatc atggtcacag tcacctacaa 60
accccattta cacaaatgat caggcacaca atcacactgt cactaaagca cacccacgca 120
ccaggtcgct gtcccaacag taacacacag cccaaagaga aaccctactt cctcacgcat 180
tcaaaacaca cccacctaag ggctgatccc gcactcagag gcctaaaact atagacattc 240
ccttccgcgg cactggtgag ccaggatttc ttaccttcag cattctcagg gaaggctctg 300
gtccaagctc tgattcggat tccaagcgaa gccacacgcc cagctcttcc ttctccaccg 360
gcccgggaca tccttacctg cctctacccg gagaccattc ctgcgaggct cctaccggaa 420
gtagctgtgg acagcagtgt cctctgggaa atgcagtccg aggggagagc gcctggggtg 480
gagcgggtgt gttccgccgg gctccgggat gcacttgcgc agtttcaccc gaggctggag 540
tgacgccaac ctgttaatgt tcgttttcgg attctggact tcgggttccg ctgaggacgg 600
atttcggaat aggcacagtg gctgccccga acccctcaag gcggcctccg cgggctgtgg 660
ctgaagataa ttttcggcgg gcgcggacta acccggcttc cctttgtgga gttgtggtga 720
gaaaggtgtt ttgttgtgcg cgtgtccgaa ggtgactccg gaggagaagg tggatatgaa 780
ctgacggtga gggtgtagcg cgtgagattt gtatgtgaaa cgatttaaaa aaaaattttt 840
tttttggccg ggcgcggtgg ctcacgccaa ggcgggcgga tcaccgagac cagcctgacc 900
aacatggaga aaccccgtct ctactaaaaa tacaaaatta gccgggcgtg atggcgcatg 960
cctgtaatcc cagctactcg ggaggctgag gcaggagaat cgcttgaacc cgggaggcag 1020
aggttgcggt gagccgaggt cgcgccattg cactccagcc tgggcgacag agcaactcct 1080
tctcaaacaa acaaacaaaa ctgtatgtca tatatttgac tccatttatt tatttattta 1140
gagacagagt cttcttgccc tgttgcccgg gcaagaaaaa acaaacaaca acaacaacaa 1200
aaaactgtac g 1211
<210> 57
<211> 317
<212> DNA
<213> Homo sapiens
<400> 57
gctgccgagt ccccgcagca gggggcgagc aagggactcg cggttgacgg gacacggatc 60
ctctaaggcc cagagtgtcc cgagtagcgg cagtggggag tgctcagggt acgctaatgg 120
tgagtggttg cagttgatgg gacaaaaaac tgtgatggga gttagtgtgg gtgtgtggtt 180
gtgtgtgtga gtgtgacggc acgaataatc tgatggggtg attgtgatat ttggttgcgc 240
gggattatga tgaaatgtgt gatatgtgtg tgattatgat taaggctgta gcgagtgtga 300
acgtggcgaa gtgtgcg 317
<210> 58
<211> 328
<212> DNA
<213> Homo sapiens
<400> 58
tcggagatgt gcgggctgca tgcccacgct tcaccgctag gggaggtcag ggctgtgcga 60
tggggaagga agagagtgtc ggggcggtgc agtcgggatg ggagaagggt gtcagggcca 120
ctggccccca gctcggcaga gggcagtgtc gggccgcgcg caggcaggga gtgggtgtgg 180
tgtgaggctg gcgctggagc ggtctgggaa tgttaggagg tctagggtat cgcggccctg 240
cgtcctcttg tctggactaa aagtccgggc agttctcccc ggacctggat tgtgggccca 300
gcgacaggtg cttggcgatc tgtgcccg 328
<210> 59
<211> 303
<212> DNA
<213> Homo sapiens
<400> 59
cgcctgggat tgcgaggtag gtaccgcctg cctgtgtgta ccggggctgc tgtctccggg 60
gaggggcttc tggcggacag gagaaccaag cagcctcagg agctgcctgg gtgtgtgtgt 120
ttctgtgcga gtgttgcata tctctgtgtg tgtttctgtg caagtgttgc atgtctgtgt 180
gtgtgggggg ggtggtgtct ggtgaaaaga atgtgtctcg tgcggtggag cgccgtttct 240
ctgtagtccg cgggctctct tatgcgccct cttgtggtcc caagtgtgct tttcttgttt 300
ttc 303
<210> 60
<211> 248
<212> DNA
<213> Homo sapiens
<400> 60
gtgtgcgtgc ttctgtgcgt gtgtgtgtgt ttgtgcgcgt gcgtgtgctc atgcacggcc 60
ccgtggcagt gctgggtatg agctcttgcc ccagacatgc ccctgcctgc tccctgccag 120
gatctgggga gatggctgta cctggcagcc ctagggtgca gagcagagtg ggcagccgtc 180
cctcgggact ctcagctgcc cacttcttcc cacagtgcct ggccatgcca ggctgcccag 240
aggggcag 248
<210> 61
<211> 221
<212> DNA
<213> Homo sapiens
<400> 61
gtgtgttcga gtccctgggt tgcttcctgg ggtctgtggt gctgggtgtg ctatctgcgt 60
gtgattctct agcgagagat tgtgggcgag tgaccgagtg ggcaaggggc cgtcactgtg 120
tgtgcgtgat tttgacagtg tgtggtggta gcttctgact ccgcgtgggt cgttgaatgt 180
atgactggga ccgtttagcg gtggatacac aactgtgtgc g 221
<210> 62
<211> 150
<212> DNA
<213> Homo sapiens
<400> 62
gcgtaatcac gcactgcgca ggcaccgccc gctctgctct aaggtccctc tcactccttc 60
agcagcccga ggacaatccc ctcaacacta ggccacgcct tgtctccgcc cctctcgtcc 120
gacccctgga gagaggctgg cgcctgcgcg 150
<210> 63
<211> 237
<212> DNA
<213> Homo sapiens
<400> 63
ccgcccgggg ctcctctgtc ccagctctgc ggcccagggg gtgacgtgat ggcggcagcg 60
gtgctgacgg accgggccca ggtgagtgga cggtggcttc gcggttgccg cttccttgcc 120
agcgctgagg cggtttccga agtgggtggg agcccaggta tcccctggat ttgtcttcgc 180
agtcgtcgtt cgctttggtg tgtggagctg gtttgccact taatttatac ctggccg 237
<210> 64
<211> 129
<212> DNA
<213> Homo sapiens
<400> 64
cggtctcctc gtatccatcc tcgcagtccc caccccaaac taatgttctc ccctgagcaa 60
atttcgagac acttaaaatc ccagctaaga tcacgtcctt ctattcaaaa ccctcagtta 120
atctcaacg 129
<210> 65
<211> 848
<212> DNA
<213> Homo sapiens
<400> 65
gcgagttcaa tgtcctccgt tccgtcaagt ttgggtttga gctttgggct cagctgccgt 60
ggtctggaga cctcgtaggc actctgcaag atgcctcgtt ctgctgcatg cttggggagg 120
aagttgagct gggtgctgga agttctgaac ccagcatgcc ccgggccgga ggagatttgc 180
ttggtgtctc cttagcgtcc cgaacaccgc gcgcccctgc tggggtaacc tgaacagctg 240
gacccctcaa ctcgatcttt attatcagca ttggggctcc agattccgta cacatctcta 300
gctctattca ttcttcctag gttgagaacg gacgcattgg gagtcctacg cccgggggaa 360
aggcaggaga ggggaggaag agaacctgtg cccctggaag ctagaggaga gcctcgctct 420
ctctgctgct ctgggttccg caacgaattg agttcgggtt caggcggctg gagcgggcgc 480
ggggaggctg aacaatcgcc ggaggcccag gaggggaggc gaatgtacac aggctaagtg 540
gccccactcc aggacaagtg gccctctaag tcggctcagt gtttacctgt ttactttccc 600
aggtagctca aacacgagcg ccttttctgc gctccagggc acgggggccg cccagaggca 660
ccctgctttc ccggcttctg ccctcccacg cctcagcttt acgccccctg ttgtgggggt 720
gcgctctaaa caacagcaaa ccaggcaaga aaggaagata caggagagca ggcgaggcct 780
cggcacaccc tacggagggg agcctttctt gtgcctgtgg aagaagtggg ctccgtggac 840
ggcatccg 848
<210> 66
<211> 79
<212> DNA
<213> Homo sapiens
<400> 66
gcgcctggag gctgcattga ggccgggctg tgtaaactgt agggtgcctc gccgactcgg 60
agccgcagag actggcggc 79
<210> 67
<211> 2225
<212> DNA
<213> Homo sapiens
<400> 67
cgggccttaa ggaatctcag actgcacagc tctgctgtct cattccaggg gtccctgggg 60
tgctccgctc ttgccaattc cgggcacaag gaccacccac tctgcccagc agcctctggc 120
cccactccca ctgccccagc gaaataagtt ccagcttcca ggcatgattg attatttgga 180
acagagcctt ccactccgga ctgagaccca acccctgcag aaagtcctaa actgggctgc 240
gaccactttg ctcccaggag cagaggagca ggggaaaagg ggagaattct ttaaaaaatg 300
acacgcgaga gagttaaaga aggaaaaagg caccaaagtg atgaaacaaa aagaactgga 360
gaataagcac tgcacagaga gaaggccgta gcaggaagga ccggcagtga ctttcaacag 420
tgcttgagag cagaattatg gccgcgagag ggagtgcaaa ctgggaggcg gggcaaaccc 480
gggaaagacc tcccaagcag gttctgcgaa ggggccccac cgccttcagc ccgcctgggt 540
cagccttata agggggaaag gggacagaag tctgcagaac agagatccta gcgtagccgc 600
tcagggtacc ttcccaggtc accattgctc ctctgccctc tccacatccg ccctcccgtg 660
agcgcaggat gcacgcacag gcagcggtta caaaactcag cgcaacgttg caacccgcac 720
aaaaggcgca cacaaaatca ttaaaaagaa atacacagag tggaaagaac tcgcacaagc 780
tccaactcgc taaaggtgga aggagtcagg ttacaaactc tccctccccg gcctaaatgc 840
tttgctttag tttgcagaaa atcgtttgtc agtttttttc ttggttattc attattcggg 900
caaatgcaag tatgttttct agctgagttc accaatccaa acctcaaacc acattcctcc 960
actccaggcc tccgttctgt ccgcggactt atgatcctgc ctgccagcag gagtctaccc 1020
tgaagtcgcg tgggatagat aaagtgagga gaggaggatg aatggacaga caaacgagag 1080
caattcttct acctgtgggc tgtcctacgc cttgcagtgc cgggtcctgc ggcgaccact 1140
gagccccttc gtcctcgccc tcagtccctt cgtcctcgtc ttcggtctcc gctttcccag 1200
tcggccgggg ctcgtcgtcc acgaccccgc acgtgccgcc gacgtcgccc tgccgattcc 1260
gccgcaggag gtggaactgt agtggtgccg gcggcttctc ccctggggcg gcggtggcga 1320
ggcgctcgct ggcggcgggc agcggctgga tgaaatacgc ctcccccagc aggtagaagg 1380
cgccgcgcac gccctcgcag aggctgaggg cggcagccga gctgggatcg ccattcacgg 1440
tgccggagta gaagcagtgc gccaggtcgg tttccggaag cggcgtctcg gacccggatt 1500
tgcgccccac gttctggagc gtgaagccgg gcgccaaaaa gctgctgtcg ggccgcagct 1560
ccagatccag ctgctggtca aaggcgtgca ggcggaggcg cgtggtcccg tgtcccgggg 1620
cgcgctccag ctccggcacc actagctcct cgtcctcctc ggaggggcgc ccgagtgcgt 1680
ccgacacggc cagtagcgcc gcggcgagca gcagcagcgt gggtactggc ccaaagctcc 1740
gagaccccgg agcccgctcc gcgttcccca tgtcgctgcc cagcttgcgc cttccgaacc 1800
cctcgggcac agctcgctgc attggagccc caggagacac cgctcgtagc agcgcacgga 1860
gcgagggacc tttagttcgg gtcgggagag caaagcctcg ttggcctgct ctggattgtt 1920
aaaattaaca atttctatta ttcgttggaa gggcgcgcag agccggctac agccgaagct 1980
cccggagtca ctaaaaggag gcgctgcagt tctgccggcg cgcgggaagt ttttcttcca 2040
gcgcaaagtt ggagacactg agaggcaggc gcaggcagag tggctctgct gggacaagaa 2100
gcgctctggg gcgcctccgg ggctgaggca acgcggagat tggtgcctgg cgcccctctt 2160
cggcctccgc cttggctgcg atgttgctca ctctgctcag ggctctcccc tctccgtccg 2220
gtagc 2225
<210> 68
<211> 997
<212> DNA
<213> Homo sapiens
<400> 68
tcgaactaat ttaatcagat gtaaaattaa tgagaacccc gagacttccg acgtcccact 60
ccagaactcc catccaggtg cggtcgggag ccacagcttc tgaatattcc ttcggaactt 120
ttttctcact tgattcccaa gcctgtcatg gggttctttt tcaatggcac tgacctgcaa 180
ttacccaacg agcagcggga cagccccggg caggacgcat cctgggtggg tgacgtgatc 240
ccgcagtctc ctccccgacc ccatatccca tacaatgatc ctcgcttaca gaagtcaagg 300
gggaaagatg acgctttcaa agcccgaatc tctttaccct ggagccagaa ccagcgtcgc 360
cgccgtcccc tgcagctcag ccggcaacgc gcgccgagcc tcggggcgca gcttggagac 420
gcgcttgctc gttctgggaa ggggcacggg acgcacggtt ccccggcccc agctgcacag 480
ctcagctcgg ggctctcacc tatcctcgtt cagagccaca ttcggctgcc tcccctgacc 540
acccgacaca aagagattcg ccggtggaaa gaatcgattt caaaattcaa gctcaccgct 600
gctcaacaag gcgcgcacgt ttctccccgt ctggcttcac atgtcccaaa cttccagtaa 660
cagaaatgag gaagcagcag ccttccccgg ctgctggcgg aggcagtggg tgtaacttgt 720
gaagtttcgt gctatgatga atctggtcac ttgggtgtgt tggagagggt tggtcgctcc 780
tcccttcctc ctcccaccat cacctccctc ctctccgcct ccctctccaa tttaattctt 840
ccctctggca ttcgccggct gtcactcaga atcccagcac cctccccacc acatccttgg 900
gggcaatgta tttcgaaaag gtcttaacca ttttacggat gaacctggtc accctgcaca 960
aagcgtgagt gcttgtcaaa taattttcta cagcacg 997
<210> 69
<211> 284
<212> DNA
<213> Homo sapiens
<400> 69
gcggcgcaag atcaacagcc gcgagcggaa gcgcatgcag gacctgaacc tggccatgga 60
cgccctgcgc gaggtcatcc tgccctactc agcggcgcac tgccagggcg cgcccggccg 120
caagctctcc aagatagcca cgctgctgct cgcccgcaac tacatcctac tgctgggcag 180
ctcgctgcag gagctgcgcc gcgcgctggg cgagggcgcc gggcccgccg cgccgcgcct 240
gctgctggcc gggctgcccc tgctcgccgc cgcgcccggc tccg 284
<210> 70
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic primer
<400> 70
gcaccactag ctcctcgtcc tcct 24
<210> 71
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic primer
<400> 71
ccggcgcgat tctccctcaa cg 22
<210> 72
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic primer
<400> 72
gtgcgcggcc caagagaagg 20
<210> 73
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic primer
<400> 73
tggggtcgta gtggtttccg aggt 24
<210> 74
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic primer
<400> 74
gtggaggatg tggaggtgga agtg 24
<210> 75
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic primer
<400> 75
gcatctatgc gggcatggtt actg 24
<210> 76
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic primer
<400> 76
acctctgccc cctgtccagg ta 22
<210> 77
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic primer
<400> 77
ctagggccga cttttccatc tcctc 25
<210> 78
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic primer
<400> 78
cggcgctttg cttttctaca actg 24
<210> 79
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic primer
<400> 79
tggagaagta agtgggaggc ggtgt 25
<210> 80
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic primer
<400> 80
gaaaagcgat gactgccctg aactg 25
<210> 81
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic primer
<400> 81
ccagcagcca acccctacga cttc 24
<210> 82
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic primer
<400> 82
actgaagctg cggccctgat ct 22
<210> 83
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic primer
<400> 83
cgcccgcagg atcgagtgag tc 22
<210> 84
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic primer
<400> 84
tgagaagtca gacgggccgc gtaa 24
<210> 85
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic primer
<400> 85
cgggctgggg ttggaagagt aac 23
<210> 86
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic primer
<400> 86
ggctccgaat cgcacctctt ctcc 24
<210> 87
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic primer
<400> 87
agggactcct ggccttgcgt ctt 23
<210> 88
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic primer
<400> 88
ctcagttacg ctgactcggc tgtg 24
<210> 89
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic primer
<400> 89
cgaggatgtg gatggcgcgg atg 23
<210> 90
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic primer
<400> 90
ctgcattgag gccgggctgt gt 22
<210> 91
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic primer
<400> 91
gcgacgcgtt tccctggtta cct 23
<210> 92
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic primer
<400> 92
tctaacgagg gctcagctcc gacta 25
<210> 93
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic primer
<400> 93
gggatgggga gtagagggag ggg 23
<210> 94
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic primer
<400> 94
gcgaggtcat cctgccctac tcag 24
<210> 95
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic primer
<400> 95
gccttctctt tgcgccacgt tcg 23
<210> 96
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic primer
<400> 96
agagtgagag tgtccctgct gcca 24
<210> 97
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic primer
<400> 97
cccactccaa tccccaccct ctcc 24
<210> 98
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic primer
<400> 98
aactccgagg agctagcgca gac 23
<210> 99
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic primer
<400> 99
gcctaagcgc ggggaattac acgt 24
<210> 100
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic primer
<400> 100
aaaagccaat ctccaagcct ccaaacgg 28
<210> 101
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic primer
<400> 101
gcggccaccc accctagtcg ttg 23
<210> 102
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic primer
<400> 102
gctctgcctg tttgttccgc cc 22
<210> 103
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic primer
<400> 103
gagcttggag atgcgaggga aact 24
<210> 104
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic primer
<400> 104
gcctcggcgc ccaaaatcga aagg 24
<210> 105
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic primer
<400> 105
ggagcgtgga cttcttgggc cg 22
<210> 106
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic primer
<400> 106
ttcggattct ggacttcggg ttcc 24
<210> 107
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic primer
<400> 107
ggtaggtacc gcctgcctgt gtgta 25
<210> 108
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic primer
<400> 108
ggagtgggtg tggtgtgagg ctgg 24
<210> 109
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic primer
<400> 109
ctcgcgatgt ttcagggtga gcc 23
<210> 110
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic primer
<400> 110
gtctcggagc tttgggccag tacc 24
<210> 111
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic primer
<400> 111
gaggcagcgc gactccaaga ctcag 25
<210> 112
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic primer
<400> 112
gggacgtaga caagggcagg cg 22
<210> 113
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic primer
<400> 113
tcagcgccgc cacctacagc ac 22
<210> 114
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic primer
<400> 114
gacccggagg aagcaaaacc ac 22
<210> 115
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic primer
<400> 115
cgtggacctg gctgaggagc tg 22
<210> 116
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic primer
<400> 116
acagcctcgg tcaccgcatc 20
<210> 117
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic primer
<400> 117
gagtaagctc aaagcggctg caatc 25
<210> 118
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic primer
<400> 118
gcagtcagcc cgaccctcct 20
<210> 119
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic primer
<400> 119
acttagccgc ccatttcaga gcagc 25
<210> 120
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic primer
<400> 120
ggaaggcagc ggactgacat ctg 23
<210> 121
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic primer
<400> 121
ttaggactgc tggacgaggc gccg 24
<210> 122
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic primer
<400> 122
gagggctccc aggtctcttg tttc 24
<210> 123
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic primer
<400> 123
aggcggtgca ctacatcgga tctc 24
<210> 124
<211> 26
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic primer
<400> 124
ctcagatggg agcgcggcag gaacag 26
<210> 125
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic primer
<400> 125
atccctggac tggcgtatcc acag 24
<210> 126
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic primer
<400> 126
tcctgggagt gtgggccggt ga 22
<210> 127
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic primer
<400> 127
tctgtttcag cgcaactgtg aagtg 25
<210> 128
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic primer
<400> 128
cccaaccacg cagtcataaa taacc 25
<210> 129
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic primer
<400> 129
ttcctctcgc cgctctctcc actg 24
<210> 130
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic primer
<400> 130
agttgacccg ccgccagtct ct 22
<210> 131
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic primer
<400> 131
accccgcgct gctccgtaga 20
<210> 132
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic primer
<400> 132
gaccccaggg aacaggcaaa aag 23
<210> 133
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic primer
<400> 133
cctaactccg tcccgctcgc tgtt 24
<210> 134
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic primer
<400> 134
cagcagcgtg gctatcttgg agag 24
<210> 135
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic primer
<400> 135
tgcgcgacgt ggaaggagaa atga 24
<210> 136
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic primer
<400> 136
gcggggtctg tgtggtgagc gag 23
<210> 137
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic primer
<400> 137
gtcctccaag aacgtgccag gcg 23
<210> 138
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic primer
<400> 138
gcttaggcat gggaagggca agac 24
<210> 139
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic primer
<400> 139
cactcccacc gcccagccct aata 24
<210> 140
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic primer
<400> 140
aggataaata tgcgcggctt gtcagtca 28
<210> 141
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic primer
<400> 141
cgccgttttg acgtgctgcc g 21
<210> 142
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic primer
<400> 142
gcggcttggc gggctatctg tg 22
<210> 143
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic primer
<400> 143
cccccggccc tcctgtatta ct 22
<210> 144
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic primer
<400> 144
agtcagcgct acgggaaagg aaacc 25
<210> 145
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic primer
<400> 145
ctgcacggcc ggagaagcga at 22
<210> 146
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic primer
<400> 146
gcccgccgaa aattatcttc agcca 25
<210> 147
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic primer
<400> 147
ctgaggctgc ttggttctcc tgtc 24
<210> 148
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic primer
<400> 148
ggccgcgata ccctagacct ccta 24
<210> 149
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic primer
<400> 149
aacacacgaa cagcactcct ccgc 24
<210> 150
<211> 158
<212> DNA
<213> Homo sapiens
<400> 150
gcaccactag ctcctcgtcc tcctgtctcg gagctttggg ccagtaccgc accactagct 60
cctcgtcctc ctcggagggg cgcccgagtg cgtccgacac ggccagtagc gccgcggcga 120
gcagcagcag cgtgggtact ggcccaaagc tccgagac 158
<210> 151
<211> 137
<212> DNA
<213> Homo sapiens
<400> 151
ccggcgcgat tctccctcaa cggaggcagc gcgactccaa gactcagccg gcgcgattct 60
ccctcaacgc ttgcctggag catccctggc cccttttgcc caggtcgcgc ccctgagtct 120
tggagtcgcg ctgcctc 137
<210> 152
<211> 133
<212> DNA
<213> Homo sapiens
<400> 152
gtgcgcggcc caagagaagg gggacgtaga caagggcagg cggtgcgcgg cccaagagaa 60
ggccagcggg accacagcgc ggctacgcgg ccggccgcag tcttcaccgc gcgcctgccc 120
ttgtctacgt ccc 133
<210> 153
<211> 174
<212> DNA
<213> Homo sapiens
<400> 153
ggggtcgtag tggtttccga ggttcagcgc cgccacctac agcactgggg tcgtagtggt 60
ttccgaggtt ggtgaccacg tcgtcgaact tgagcacctc gtagccttca tgctgccgct 120
tgaggccggc gtagaaggcg atcttgggca ccgtgctgta ggtggcggcg ctga 174
<210> 154
<211> 140
<212> DNA
<213> Homo sapiens
<400> 154
gtggaggatg tggaggtgga agtggacccg gaggaagcaa aaccacgtgg aggatgtgga 60
ggtggaagtg gagcggatgg cgctccccaa gagctccgcc acgcgaggtt tcgggctcgt 120
ggttttgctt cctccgggtc 140
<210> 155
<211> 145
<212> DNA
<213> Homo sapiens
<400> 155
gcatctatgc gggcatggtt actgcgtgga cctggctgag gagctggcat ctatgcgggc 60
atggttactg cctctggtgc cccccgcagc cgcgcgcagg taccgtgcga catcgcgatg 120
gcccagctcc tcagccaggt ccacg 145
<210> 156
<211> 153
<212> DNA
<213> Homo sapiens
<400> 156
cctctgcccc ctgtccaggt aacagcctcg gtcaccgcat cacctctgcc ccctgtccag 60
gtacgcgctg tctggcgcgc cctgcgtggg ggccgcaggt tcagacaccc gggcgcggcg 120
cggggccctg atggatgcgg tgaccgaggc tgt 153
<210> 157
<211> 164
<212> DNA
<213> Homo sapiens
<400> 157
ctagggccga cttttccatc tcctcgagta agctcaaagc ggctgcaatc ctagggccga 60
cttttccatc tcctcctcta cctccggctc ccgggcgagg gaggccccgc gccgcccctt 120
agactggctg cggccggaag attgcagccg ctttgagctt actc 164
<210> 158
<211> 156
<212> DNA
<213> Homo sapiens
<400> 158
cggcgctttg cttttctaca actggcagtc agcccgaccc tcctcggcgc tttgcttttc 60
tacaactgga agccgcgaag gcggctactg cgctgagccg ctcgctctgc tggtcaagtt 120
tgggcgaccc gcgcggagga gggtcgggct gactgc 156
<210> 159
<211> 133
<212> DNA
<213> Homo sapiens
<400> 159
tggagaagta agtgggaggc ggtgtactta gccgcccatt tcagagcagc tggagaagta 60
agtgggaggc ggtgtcggga actgactcct cttaaaacgg tcggcgccgc tgctctgaaa 120
tgggcggcta agt 133
<210> 160
<211> 155
<212> DNA
<213> Homo sapiens
<400> 160
gaaaagcgat gactgccctg aactgggaag gcagcggact gacatctgga aaagcgatga 60
ctgccctgaa ctgctggggc gttcgaaatt tccagggtcc cgaccctccg tggggtacgc 120
gcgacttcgg cgcagatgtc agtccgctgc cttcc 155
<210> 161
<211> 126
<212> DNA
<213> Homo sapiens
<400> 161
ccagcagcca acccctacga cttcttagga ctgctggacg aggcgccgcc agcagccaac 60
ccctacgact tcaggaggct cctgcgcaaa acctcccagc gccggcgcct cgtccagcag 120
tcctaa 126
<210> 162
<211> 150
<212> DNA
<213> Homo sapiens
<400> 162
actgaagctg cggccctgat ctgagggctc ccaggtctct tgtttcactg aagctgcggc 60
cctgatctcc gcagaggctg cctgctgcgc tcggccctca agtgcccggg ccggccttcg 120
tgctccgaaa caagagacct gggagccctc 150
<210> 163
<211> 129
<212> DNA
<213> Homo sapiens
<400> 163
cgcccgcagg atcgagtgag tcaggcggtg cactacatcg gatctccgcc cgcaggatcg 60
agtgagtcac gcggccgcca gacgaggccg gtggcgcacg cacccgagat ccgatgtagt 120
gcaccgcct 129
<210> 164
<211> 156
<212> DNA
<213> Homo sapiens
<400> 164
tgagaagtca gacgggccgc gtaactcaga tgggagcgcg gcaggaacag tgagaagtca 60
gacgggccgc gtaaggggca gagcgagggg tccggcatca ctcgcgcgct ccggaaaccc 120
gcgtgagccg ctgttcctgc cgcgctccca tctgag 156
<210> 165
<211> 151
<212> DNA
<213> Homo sapiens
<400> 165
cgggctgggg ttggaagagt aacatccctg gactggcgta tccacagcgg gctggggttg 60
gaagagtaac tcgggctgcg ggctgaacgc agtcggcaac cgcggaagag cagcatctcc 120
cctgcgcctg tggatacgcc agtccaggga t 151
<210> 166
<211> 148
<212> DNA
<213> Homo sapiens
<400> 166
ggctccgaat cgcacctctt ctcctcctgg gagtgtgggc cggtgaggct ccgaatcgca 60
cctcttctcc tgtcctaatc tcaggctcca ggcctggctt gcagtttctg gctcaccgcg 120
ctgcggtcac cggcccacac tcccagga 148
<210> 167
<211> 130
<212> DNA
<213> Homo sapiens
<400> 167
agggactcct ggccttgcgt ctttctgttt cagcgcaact gtgaagtgag ggactcctgg 60
ccttgcgtct tgggagagcg cacgctggcc tgcgctacac acacacactt cacagttgcg 120
ctgaaacaga 130
<210> 168
<211> 145
<212> DNA
<213> Homo sapiens
<400> 168
ctcagttacg ctgactcggc tgtgcccaac cacgcagtca taaataaccc tcagttacgc 60
tgactcggct gtgcccgcag tgtcgcgctg tcgcgtagcc aggtgtcgcc gggctggcgc 120
ggttatttat gactgcgtgg ttggg 145
<210> 169
<211> 114
<212> DNA
<213> Homo sapiens
<400> 169
cgaggatgtg gatggcgcgg atgttcctct cgccgctctc tccactgcga ggatgtggat 60
ggcgcggatg gcgcggcctc cacctgcggg cagtggagag agcggcgaga ggaa 114
<210> 170
<211> 121
<212> DNA
<213> Homo sapiens
<400> 170
ctgcattgag gccgggctgt gtagttgacc cgccgccagt ctctctgcat tgaggccggg 60
ctgtgtaaac tgtagggtgc ctcgccgact cggagccgca gagactggcg gcgggtcaac 120
t 121
<210> 171
<211> 163
<212> DNA
<213> Homo sapiens
<400> 171
gcgacgcgtt tccctggtta cctaccccgc gctgctccgt agagcgacgc gtttccctgg 60
ttacctgcgg ggccgcgtcc cggaggagcc tgagggccaa gagggccggc gcgcggtggg 120
cgcggcctgc ggggatgccg ggctctacgg agcagcgcgg ggt 163
<210> 172
<211> 149
<212> DNA
<213> Homo sapiens
<400> 172
tctaacgagg gctcagctcc gactagaccc cagggaacag gcaaaaagtc taacgagggc 60
tcagctccga ctaccccagg cctccgggga ccctctccgg atgcgctccc cgctttgcgc 120
tttgcgcttt ttgcctgttc cctggggtc 149
<210> 173
<211> 164
<212> DNA
<213> Homo sapiens
<400> 173
gggatgggga gtagagggag gggcctaact ccgtcccgct cgctgttggg atggggagta 60
gagggagggg gccctgttgc ctcagcgccc cgaggtcgtg gagcggcagc agctgcagcc 120
ggagcagcac cagcaacagc aacagcgagc gggacggagt tagg 164
<210> 174
<211> 128
<212> DNA
<213> Homo sapiens
<400> 174
gcgaggtcat cctgccctac tcagcagcag cgtggctatc ttggagaggc gaggtcatcc 60
tgccctactc agcggcgcac tgccagggcg cgcccggccg caagctctcc aagatagcca 120
cgctgctg 128
<210> 175
<211> 107
<212> DNA
<213> Homo sapiens
<400> 175
gccttctctt tgcgccacgt tcgtgcgcga cgtggaagga gaaatgagcc ttctctttgc 60
gccacgttcg gccgcagctg aattcatttc tccttccacg tcgcgca 107
<210> 176
<211> 130
<212> DNA
<213> Homo sapiens
<400> 176
agagtgagag tgtccctgct gccagcgggg tctgtgtggt gagcgagaga gtgagagtgt 60
ccctgctgcc agaggactac ggcgggctgg gcgcggggtc cccgcctctc gctcaccaca 120
cagaccccgc 130
<210> 177
<211> 119
<212> DNA
<213> Homo sapiens
<400> 177
cccactccaa tccccaccct ctccgtcctc caagaacgtg ccaggcgccc actccaatcc 60
ccaccctctc catccttagt cattaaagaa cagcagcgcc tggcacgttc ttggaggac 119
<210> 178
<211> 149
<212> DNA
<213> Homo sapiens
<400> 178
aactccgagg agctagcgca gacgcttagg catgggaagg gcaagacaac tccgaggagc 60
tagcgcagac cgctctccgc cctcagctgc ggcgaggcaa gggctggcag cgctcggacg 120
cctccgtctt gcccttccca tgcctaagc 149
<210> 179
<211> 123
<212> DNA
<213> Homo sapiens
<400> 179
gcctaagcgc ggggaattac acgtcactcc caccgcccag ccctaatagc ctaagcgcgg 60
ggaattacac gttcccggtg tagaacagac gatcggggct attagggctg ggcggtggga 120
gtg 123
<210> 180
<211> 147
<212> DNA
<213> Homo sapiens
<400> 180
aaaagccaat ctccaagcct ccaaacggag gataaatatg cgcggcttgt cagtcaaaaa 60
gccaatctcc aagcctccaa acggaacgtc accctatcag ctgggagaca gcgccgcact 120
gactgacaag ccgcgcatat ttatcct 147
<210> 181
<211> 113
<212> DNA
<213> Homo sapiens
<400> 181
gcggccaccc accctagtcg ttgcgccgtt ttgacgtgct gccggcggcc acccacccta 60
gtcgttggag cctggcgccc gcgcctcccg gccggcagca cgtcaaaacg gcg 113
<210> 182
<211> 145
<212> DNA
<213> Homo sapiens
<400> 182
gctctgcctg tttgttccgc ccgcggcttg gcgggctatc tgtggctctg cctgtttgtt 60
ccgcccccgc ggaaaccgct gctcgctggg caggggcttt ctgttttgca gccggaacag 120
gaacacagat agcccgccaa gccgc 145
<210> 183
<211> 156
<212> DNA
<213> Homo sapiens
<400> 183
gagcttggag atgcgaggga aactcccccg gccctcctgt attactgagc ttggagatgc 60
gagggaaact gaagccccaa gggtgccccg tcctgggagc ctggctgtct gcggggtccc 120
ccgcattccg cagtagtaat acaggagggc cggggg 156
<210> 184
<211> 139
<212> DNA
<213> Homo sapiens
<400> 184
gcctcggcgc ccaaaatcga aaggagtcag cgctacggga aaggaaaccg cctcggcgcc 60
caaaatcgaa aggccgggag ttgttctgca ggctttgcaa acaggttgac tgagggtttc 120
ctttcccgta gcgctgact 139
<210> 185
<211> 114
<212> DNA
<213> Homo sapiens
<400> 185
ggagcgtgga cttcttgggc cgctgcacgg ccggagaagc gaatggagcg tggacttctt 60
gggccgtacc cctgcggctc aagctgcccc ggattcgctt ctccggccgt gcag 114
<210> 186
<211> 166
<212> DNA
<213> Homo sapiens
<400> 186
ttcggattct ggacttcggg ttccgcccgc cgaaaattat cttcagccat tcggattctg 60
gacttcgggt tccgctgagg acggatttcg gaataggcac agtggctgcc ccgaacccct 120
caaggcggcc tccgcgggct gtggctgaag ataattttcg gcgggc 166
<210> 187
<211> 133
<212> DNA
<213> Homo sapiens
<400> 187
ggtaggtacc gcctgcctgt gtgtactgag gctgcttggt tctcctgtcg gtaggtaccg 60
cctgcctgtg tgtaccgggg ctgctgtctc cggggagggg cttctggcgg acaggagaac 120
caagcagcct cag 133
<210> 188
<211> 118
<212> DNA
<213> Homo sapiens
<400> 188
ggagtgggtg tggtgtgagg ctggggccgc gataccctag acctcctagg agtgggtgtg 60
gtgtgaggct ggcgctggag cggtctggga atgttaggag gtctagggta tcgcggcc 118
<210> 189
<211> 119
<212> DNA
<213> Homo sapiens
<400> 189
ctcgcgatgt ttcagggtga gccaacacac gaacagcact cctccgcctc gcgatgtttc 60
agggtgagcc ggacgcaggc gtgcctgcgc agtgcgcgga ggagtgctgt tcgtgtgtt 119
<210> 190
<211> 111
<212> DNA
<213> Homo sapiens
<400> 190
ggcaccacta gctcctcgtc ctcctcggag gggcgcccga gtgcgtccga cacggccagt 60
agcgccgcgg cgagcagcag cagcgtgggt actggcccaa agctccgaga c 111
<210> 191
<211> 91
<212> DNA
<213> Homo sapiens
<400> 191
cccggcgcga ttctccctca acgcttgcct ggagcatccc tggccccttt tgcccaggtc 60
gcgcccctga gtcttggagt cgcgctgcct c 91
<210> 192
<211> 92
<212> DNA
<213> Homo sapiens
<400> 192
ggtgcgcggc ccaagagaag gccagcggga ccacagcgcg gctacgcggc cggccgcagt 60
cttcaccgcg cgcctgccct tgtctacgtc cc 92
<210> 193
<211> 130
<212> DNA
<213> Homo sapiens
<400> 193
gtggggtcgt agtggtttcc gaggttggtg accacgtcgt cgaacttgag cacctcgtag 60
ccttcatgct gccgcttgag gccggcgtag aaggcgatct tgggcaccgt gctgtaggtg 120
gcggcgctga 130
<210> 194
<211> 95
<212> DNA
<213> Homo sapiens
<400> 194
ggtggaggat gtggaggtgg aagtggagcg gatggcgctc cccaagagct ccgccacgcg 60
aggtttcggg ctcgtggttt tgcttcctcc gggtc 95
<210> 195
<211> 100
<212> DNA
<213> Homo sapiens
<400> 195
ggcatctatg cgggcatggt tactgcctct ggtgcccccc gcagccgcgc gcaggtaccg 60
tgcgacatcg cgatggccca gctcctcagc caggtccacg 100
<210> 196
<211> 113
<212> DNA
<213> Homo sapiens
<400> 196
cacctctgcc ccctgtccag gtacgcgctg tctggcgcgc cctgcgtggg ggccgcaggt 60
tcagacaccc gggcgcggcg cggggccctg atggatgcgg tgaccgaggc tgt 113
<210> 197
<211> 115
<212> DNA
<213> Homo sapiens
<400> 197
cctagggccg acttttccat ctcctcctct acctccggct cccgggcgag ggaggccccg 60
cgccgcccct tagactggct gcggccggaa gattgcagcc gctttgagct tactc 115
<210> 198
<211> 113
<212> DNA
<213> Homo sapiens
<400> 198
ccggcgcttt gcttttctac aactggaagc cgcgaaggcg gctactgcgc tgagccgctc 60
gctctgctgg tcaagtttgg gcgacccgcg cggaggaggg tcgggctgac tgc 113
<210> 199
<211> 84
<212> DNA
<213> Homo sapiens
<400> 199
gtggagaagt aagtgggagg cggtgtcggg aactgactcc tcttaaaacg gtcggcgccg 60
ctgctctgaa atgggcggct aagt 84
<210> 200
<211> 108
<212> DNA
<213> Homo sapiens
<400> 200
ggaaaagcga tgactgccct gaactgctgg ggcgttcgaa atttccaggg tcccgaccct 60
ccgtggggta cgcgcgactt cggcgcagat gtcagtccgc tgccttcc 108
<210> 201
<211> 79
<212> DNA
<213> Homo sapiens
<400> 201
gccagcagcc aacccctacg acttcaggag gctcctgcgc aaaacctccc agcgccggcg 60
cctcgtccag cagtcctaa 79
<210> 202
<211> 105
<212> DNA
<213> Homo sapiens
<400> 202
cactgaagct gcggccctga tctccgcaga ggctgcctgc tgcgctcggc cctcaagtgc 60
ccgggccggc cttcgtgctc cgaaacaaga gacctgggag ccctc 105
<210> 203
<211> 84
<212> DNA
<213> Homo sapiens
<400> 203
ccgcccgcag gatcgagtga gtcacgcggc cgccagacga ggccggtggc gcacgcaccc 60
gagatccgat gtagtgcacc gcct 84
<210> 204
<211> 107
<212> DNA
<213> Homo sapiens
<400> 204
ctgagaagtc agacgggccg cgtaaggggc agagcgaggg gtccggcatc actcgcgcgc 60
tccggaaacc cgcgtgagcc gctgttcctg ccgcgctccc atctgag 107
<210> 205
<211> 105
<212> DNA
<213> Homo sapiens
<400> 205
gcgggctggg gttggaagag taactcgggc tgcgggctga acgcagtcgg caaccgcgga 60
agagcagcat ctcccctgcg cctgtggata cgccagtcca gggat 105
<210> 206
<211> 103
<212> DNA
<213> Homo sapiens
<400> 206
aggctccgaa tcgcacctct tctcctgtcc taatctcagg ctccaggcct ggcttgcagt 60
ttctggctca ccgcgctgcg gtcaccggcc cacactccca gga 103
<210> 207
<211> 83
<212> DNA
<213> Homo sapiens
<400> 207
cagggactcc tggccttgcg tcttgggaga gcgcacgctg gcctgcgcta cacacacaca 60
cttcacagtt gcgctgaaac aga 83
<210> 208
<211> 97
<212> DNA
<213> Homo sapiens
<400> 208
cctcagttac gctgactcgg ctgtgcccgc agtgtcgcgc tgtcgcgtag ccaggtgtcg 60
ccgggctggc gcggttattt atgactgcgt ggttggg 97
<210> 209
<211> 68
<212> DNA
<213> Homo sapiens
<400> 209
gcgaggatgt ggatggcgcg gatggcgcgg cctccacctg cgggcagtgg agagagcggc 60
gagaggaa 68
<210> 210
<211> 78
<212> DNA
<213> Homo sapiens
<400> 210
gctgcattga ggccgggctg tgtaaactgt agggtgcctc gccgactcgg agccgcagag 60
actggcggcg ggtcaact 78
<210> 211
<211> 121
<212> DNA
<213> Homo sapiens
<400> 211
ggcgacgcgt ttccctggtt acctgcgggg ccgcgtcccg gaggagcctg agggccaaga 60
gggccggcgc gcggtgggcg cggcctgcgg ggatgccggg ctctacggag cagcgcgggg 120
t 121
<210> 212
<211> 102
<212> DNA
<213> Homo sapiens
<400> 212
ttctaacgag ggctcagctc cgactacccc aggcctccgg ggaccctctc cggatgcgct 60
ccccgctttg cgctttgcgc tttttgcctg ttccctgggg tc 102
<210> 213
<211> 118
<212> DNA
<213> Homo sapiens
<400> 213
ggggatgggg agtagaggga gggggccctg ttgcctcagc gccccgaggt cgtggagcgg 60
cagcagctgc agccggagca gcaccagcaa cagcaacagc gagcgggacg gagttagg 118
<210> 214
<211> 81
<212> DNA
<213> Homo sapiens
<400> 214
cgcgaggtca tcctgcccta ctcagcggcg cactgccagg gcgcgcccgg ccgcaagctc 60
tccaagatag ccacgctgct g 81
<210> 215
<211> 61
<212> DNA
<213> Homo sapiens
<400> 215
agccttctct ttgcgccacg ttcggccgca gctgaattca tttctccttc cacgtcgcgc 60
a 61
<210> 216
<211> 84
<212> DNA
<213> Homo sapiens
<400> 216
cagagtgaga gtgtccctgc tgccagagga ctacggcggg ctgggcgcgg ggtccccgcc 60
tctcgctcac cacacagacc ccgc 84
<210> 217
<211> 73
<212> DNA
<213> Homo sapiens
<400> 217
gcccactcca atccccaccc tctccatcct tagtcattaa agaacagcag cgcctggcac 60
gttcttggag gac 73
<210> 218
<211> 103
<212> DNA
<213> Homo sapiens
<400> 218
caactccgag gagctagcgc agaccgctct ccgccctcag ctgcggcgag gcaagggctg 60
gcagcgctcg gacgcctccg tcttgccctt cccatgccta agc 103
<210> 219
<211> 76
<212> DNA
<213> Homo sapiens
<400> 219
tgcctaagcg cggggaatta cacgttcccg gtgtagaaca gacgatcggg gctattaggg 60
ctgggcggtg ggagtg 76
<210> 220
<211> 92
<212> DNA
<213> Homo sapiens
<400> 220
aaaaagccaa tctccaagcc tccaaacgga acgtcaccct atcagctggg agacagcgcc 60
gcactgactg acaagccgcg catatttatc ct 92
<210> 221
<211> 70
<212> DNA
<213> Homo sapiens
<400> 221
cgcggccacc caccctagtc gttggagcct ggcgcccgcg cctcccggcc ggcagcacgt 60
caaaacggcg 70
<210> 222
<211> 102
<212> DNA
<213> Homo sapiens
<400> 222
ggctctgcct gtttgttccg cccccgcgga aaccgctgct cgctgggcag gggctttctg 60
ttttgcagcc ggaacaggaa cacagatagc ccgccaagcc gc 102
<210> 223
<211> 111
<212> DNA
<213> Homo sapiens
<400> 223
cgagcttgga gatgcgaggg aaactgaagc cccaagggtg ccccgtcctg ggagcctggc 60
tgtctgcggg gtcccccgca ttccgcagta gtaatacagg agggccgggg g 111
<210> 224
<211> 91
<212> DNA
<213> Homo sapiens
<400> 224
agcctcggcg cccaaaatcg aaaggccggg agttgttctg caggctttgc aaacaggttg 60
actgagggtt tcctttcccg tagcgctgac t 91
<210> 225
<211> 71
<212> DNA
<213> Homo sapiens
<400> 225
cggagcgtgg acttcttggg ccgtacccct gcggctcaag ctgccccgga ttcgcttctc 60
cggccgtgca g 71
<210> 226
<211> 118
<212> DNA
<213> Homo sapiens
<400> 226
tttcggattc tggacttcgg gttccgctga ggacggattt cggaataggc acagtggctg 60
ccccgaaccc ctcaaggcgg cctccgcggg ctgtggctga agataatttt cggcgggc 118
<210> 227
<211> 85
<212> DNA
<213> Homo sapiens
<400> 227
aggtaggtac cgcctgcctg tgtgtaccgg ggctgctgtc tccggggagg ggcttctggc 60
ggacaggaga accaagcagc ctcag 85
<210> 228
<211> 71
<212> DNA
<213> Homo sapiens
<400> 228
gggagtgggt gtggtgtgag gctggcgctg gagcggtctg ggaatgttag gaggtctagg 60
gtatcgcggc c 71
<210> 229
<211> 73
<212> DNA
<213> Homo sapiens
<400> 229
tctcgcgatg tttcagggtg agccggacgc aggcgtgcct gcgcagtgcg cggaggagtg 60
ctgttcgtgt gtt 73
<210> 230
<211> 120
<212> DNA
<213> Homo sapiens
<400> 230
ggcgaaaaga aggccaaaca cagcatcgac ggcatcctgg gcgacaaagg tagggaactt 60
ccctgggctg cgaggcccca gcccgggttt tcccacgctc cggtgtgcgg gccagtggtt 120
<210> 231
<211> 118
<212> DNA
<213> Homo sapiens
<400> 231
ggggatgggg agtagaggga gggggccctg ttgcctcagc gccccgaggt cgtggagcgg 60
cagcagctgc agccggagca gcaccagcaa cagcaacagc gagcgggacg gagttagg 118
<210> 232
<211> 69
<212> DNA
<213> Homo sapiens
<400> 232
gcaccagcaa cagcaacagc gagcgggacg gagttaggac cgctcggagc gcacaggtct 60
cgaggtagt 69
<210> 233
<211> 111
<212> DNA
<213> Homo sapiens
<400> 233
cgagcttgga gatgcgaggg aaactgaagc cccaagggtg ccccgtcctg ggagcctggc 60
tgtctgcggg gtcccccgca ttccgcagta gtaatacagg agggccgggg g 111
<210> 234
<211> 83
<212> DNA
<213> Homo sapiens
<400> 234
cagggactcc tggccttgcg tcttgggaga gcgcacgctg gcctgcgcta cacacacaca 60
cttcacagtt gcgctgaaac aga 83
<210> 235
<211> 81
<212> DNA
<213> Homo sapiens
<400> 235
gcgctcatcg tgtgcacctt cacctacctg ctggtgggcg ccgcggtctt cgacgcgctg 60
gagtcggagc ccgagctgat c 81
<210> 236
<211> 94
<212> DNA
<213> Homo sapiens
<400> 236
aacagcagca ccgtgatcca gagcaccccg aagactggca gaaccagccg acgagtcagg 60
cgccgcatgg tcccctttgc cgcttcctct ccgc 94
<210> 237
<211> 98
<212> DNA
<213> Homo sapiens
<400> 237
cgcacaatat caataattcc gcgggtcaca gcatcccgca caaggacgcc ttcttattgc 60
ataattaacg cgaggaaggc tcttcccgct actcccgc 98
<210> 238
<211> 91
<212> DNA
<213> Homo sapiens
<400> 238
gtggctcact ctccaatcag cgctttctag agacagcgtg gtcagcgtac ttgcttactt 60
tcaggattgc gagacgtctt taacccttgc t 91
<210> 239
<211> 97
<212> DNA
<213> Homo sapiens
<400> 239
gcagtgtgcg gagaccctct aggcgggcgg ggacgcccca cgcggcgacc tgagcaccga 60
cctcatgcaa cgggaccgaa ccttgggacc cgggcag 97
<210> 240
<211> 91
<212> DNA
<213> Homo sapiens
<400> 240
agcctcggcg cccaaaatcg aaaggccggg agttgttctg caggctttgc aaacaggttg 60
actgagggtt tcctttcccg tagcgctgac t 91
<210> 241
<211> 77
<212> DNA
<213> Homo sapiens
<400> 241
atcgaaaggc cgggagttgt tctgcaggct ttgcaaacag gttgactgag ggtttccttt 60
cccgtagcgc tgactgc 77
<210> 242
<211> 87
<212> DNA
<213> Homo sapiens
<400> 242
gcccatctgc acctgtcccc tttgctgtct tacatgtccc atagtattaa agttatttga 60
ataagcaaat gaaccccgct ctttggt 87
<210> 243
<211> 71
<212> DNA
<213> Homo sapiens
<400> 243
cggagcgtgg acttcttggg ccgtacccct gcggctcaag ctgccccgga ttcgcttctc 60
cggccgtgca g 71
<210> 244
<211> 113
<212> DNA
<213> Homo sapiens
<400> 244
ccggcgcttt gcttttctac aactggaagc cgcgaaggcg gctactgcgc tgagccgctc 60
gctctgctgg tcaagtttgg gcgacccgcg cggaggaggg tcgggctgac tgc 113
<210> 245
<211> 84
<212> DNA
<213> Homo sapiens
<400> 245
gtggagaagt aagtgggagg cggtgtcggg aactgactcc tcttaaaacg gtcggcgccg 60
ctgctctgaa atgggcggct aagt 84
<210> 246
<211> 85
<212> DNA
<213> Homo sapiens
<400> 246
tcagctatga gcagagaccg ctgaagcgcc cccggctcgg gccgcccgac gtctacccac 60
aggaccccaa gcagaaggag gtaag 85
<210> 247
<211> 91
<212> DNA
<213> Homo sapiens
<400> 247
cccggcgcga ttctccctca acgcttgcct ggagcatccc tggccccttt tgcccaggtc 60
gcgcccctga gtcttggagt cgcgctgcct c 91
<210> 248
<211> 115
<212> DNA
<213> Homo sapiens
<400> 248
gcccggcttc gccttctctc ataagggtgg ccgggggccc acgaacttgc agggtggcgg 60
ccctgcgccc tccagccccg gcggggacgg gcacgattgc tcgtagtctg gggtg 115
<210> 249
<211> 110
<212> DNA
<213> Homo sapiens
<400> 249
gggcactcac acacacgcag acccagagga ggagaggtgg gtataaggaa gcaagcccca 60
gccgcagcag cccgagcggg cacaaaaccg cttcctggca catcaccttg 110
<210> 250
<211> 98
<212> DNA
<213> Homo sapiens
<400> 250
ggcactcaca cacacgcaga cccagaggag gagaggtggg tataaggaag caagccccag 60
ccgcagcagc ccgagcgggc acaaaaccgc ttcctggc 98
<210> 251
<211> 105
<212> DNA
<213> Homo sapiens
<400> 251
gcgggctggg gttggaagag taactcgggc tgcgggctga acgcagtcgg caaccgcgga 60
agagcagcat ctcccctgcg cctgtggata cgccagtcca gggat 105
<210> 252
<211> 107
<212> DNA
<213> Homo sapiens
<400> 252
cgcatcctcg ccttcttgca gtccaaggcc cgcctgggcg cggagcccgc ctttccgccg 60
ctgggttcgc tcccggagcc ggatttctcc tatcagctgc accctgc 107
<210> 253
<211> 107
<212> DNA
<213> Homo sapiens
<400> 253
ctgagaagtc agacgggccg cgtaaggggc agagcgaggg gtccggcatc actcgcgcgc 60
tccggaaacc cgcgtgagcc gctgttcctg ccgcgctccc atctgag 107
<210> 254
<211> 88
<212> DNA
<213> Homo sapiens
<400> 254
gcgtaagggg cagagcgagg ggtccggcat cactcgcgcg ctccggaaac ccgcgtgagc 60
cgctgttcct gccgcgctcc catctgag 88
<210> 255
<211> 86
<212> DNA
<213> Homo sapiens
<400> 255
caatctcaga gcggagccga cagagagcag ggaaccggca tggccaaagc cgcggcgatc 60
ggcatcgacc tgggcaccac ctactc 86
<210> 256
<211> 111
<212> DNA
<213> Homo sapiens
<400> 256
gtgtgcaccg agcgagtgaa ggtatgtgtg gcgggcgcgg ctggagctgc cgccgccgcc 60
gccgccgcgc cagcaggtcc taatgcctgt cacttcccag gacgctggca g 111
<210> 257
<211> 85
<212> DNA
<213> Homo sapiens
<400> 257
ctcacgttgc acggatgaca tcactagctt ttggctgcgc gctcggtgtt ctcgtctgtg 60
ggttttagcc aaggctgcag ctacc 85
<210> 258
<211> 73
<212> DNA
<213> Homo sapiens
<400> 258
caggacggga ttctctgcac gctgtcgagt gagccggcat ctcggcgccc gggtgggctg 60
cgaagaaaat ggt 73
<210> 259
<211> 97
<212> DNA
<213> Homo sapiens
<400> 259
gcagaagacg gcgctgggaa gagctgcgtg acgctcgggg gctggcggct gggccggcag 60
cgcgccgtgg cggcgtgacc tgtccatggt gttgaag 97
<210> 260
<211> 113
<212> DNA
<213> Homo sapiens
<400> 260
cacctctgcc ccctgtccag gtacgcgctg tctggcgcgc cctgcgtggg ggccgcaggt 60
tcagacaccc gggcgcggcg cggggccctg atggatgcgg tgaccgaggc tgt 113
<210> 261
<211> 97
<212> DNA
<213> Homo sapiens
<400> 261
cctcagttac gctgactcgg ctgtgcccgc agtgtcgcgc tgtcgcgtag ccaggtgtcg 60
ccgggctggc gcggttattt atgactgcgt ggttggg 97
<210> 262
<211> 92
<212> DNA
<213> Homo sapiens
<400> 262
ggtgcgcggc ccaagagaag gccagcggga ccacagcgcg gctacgcggc cggccgcagt 60
cttcaccgcg cgcctgccct tgtctacgtc cc 92
<210> 263
<211> 98
<212> DNA
<213> Homo sapiens
<400> 263
gcggatgcac gacctgaacg acgcgctgga cgagctgcgc gcggtgatcc cctacgcgca 60
cagcccctcg gtgcgaaagc tctccaagat cgccacgc 98
<210> 264
<211> 95
<212> DNA
<213> Homo sapiens
<400> 264
ggcagccggc tacccgttca gcgccggact gcccccggct gcctcctgcc cggagaagtg 60
cgccctgttt aacagcgtct cctccagcct ctgca 95
<210> 265
<211> 115
<212> DNA
<213> Homo sapiens
<400> 265
cacgtcggag ctcgcctgga tccgggcgtt ggcagccgaa gggccctggc cccgggactc 60
tccgccgcta gcccccgtca tatcttctcc gctttcgctt ctccactcta gccgg 115
<210> 266
<211> 91
<212> DNA
<213> Homo sapiens
<400> 266
ttgtttttct ggaaaagtcg ctgcaatgga cacagcgttg cgcggtttcc ctgcgcgcct 60
ggggcgcttt ttgtcttcgc cctccgtgga t 91
<210> 267
<211> 100
<212> DNA
<213> Homo sapiens
<400> 267
ggcatctatg cgggcatggt tactgcctct ggtgcccccc gcagccgcgc gcaggtaccg 60
tgcgacatcg cgatggccca gctcctcagc caggtccacg 100
<210> 268
<211> 61
<212> DNA
<213> Homo sapiens
<400> 268
agccttctct ttgcgccacg ttcggccgca gctgaattca tttctccttc cacgtcgcgc 60
a 61
<210> 269
<211> 130
<212> DNA
<213> Homo sapiens
<400> 269
gtggggtcgt agtggtttcc gaggttggtg accacgtcgt cgaacttgag cacctcgtag 60
ccttcatgct gccgcttgag gccggcgtag aaggcgatct tgggcaccgt gctgtaggtg 120
gcggcgctga 130
<210> 270
<211> 68
<212> DNA
<213> Homo sapiens
<400> 270
gcgaggatgt ggatggcgcg gatggcgcgg cctccacctg cgggcagtgg agagagcggc 60
gagaggaa 68
<210> 271
<211> 79
<212> DNA
<213> Homo sapiens
<400> 271
gccagcagcc aacccctacg acttcaggag gctcctgcgc aaaacctccc agcgccggcg 60
cctcgtccag cagtcctaa 79
<210> 272
<211> 105
<212> DNA
<213> Homo sapiens
<400> 272
cactgaagct gcggccctga tctccgcaga ggctgcctgc tgcgctcggc cctcaagtgc 60
ccgggccggc cttcgtgctc cgaaacaaga gacctgggag ccctc 105
<210> 273
<211> 108
<212> DNA
<213> Homo sapiens
<400> 273
ggaaaagcga tgactgccct gaactgctgg ggcgttcgaa atttccaggg tcccgaccct 60
ccgtggggta cgcgcgactt cggcgcagat gtcagtccgc tgccttcc 108
<210> 274
<211> 108
<212> DNA
<213> Homo sapiens
<400> 274
cagcggcgac tggttctgac ttgccaagta cctggcacga gaaggacgtc gtgtgggtcg 60
tccttaccct gaatttaatg aagtcagggg ctgaaaacgg cggtgtaa 108
<210> 275
<211> 140
<212> DNA
<213> Homo sapiens
<400> 275
ggtgtgaccg ttgttgcacc ccagtcgaca tgacgttagt ttttcatttg ccaaattgct 60
ggttagttgc aaagcctacc ctcggccgcg agcactgaag gatgggaggg tcgagcgccg 120
cgttttgaca ggaggaagtg 140
<210> 276
<211> 114
<212> DNA
<213> Homo sapiens
<400> 276
tgtgcgcgcg tgtgtcttta cacgcgccgc gtgcccagtg ttgcacgggg cgggagaaga 60
atggcaggta gccgcccgaa acacctcgcc ctgtctcctt tctttgggcg aggt 114
<210> 277
<211> 114
<212> DNA
<213> Homo sapiens
<400> 277
agctgggagg aagacagtag tgatgctgcc gcgggtggcg ggggttgcgc cgccgcccag 60
agaacctcgg cagtgtgcag ggaggtgcat ttcattttgg ctatttccat cccg 114
<210> 278
<211> 116
<212> DNA
<213> Homo sapiens
<400> 278
ctcatcgtct tggggttaag agttgccgcc cggccagggc aacagccagg gcaaagggag 60
agagaagccg ccccggggcg agaaggagaa aagttagagg gctgaacagg tgacgc 116
<210> 279
<211> 84
<212> DNA
<213> Homo sapiens
<400> 279
cagagtgaga gtgtccctgc tgccagagga ctacggcggg ctgggcgcgg ggtccccgcc 60
tctcgctcac cacacagacc ccgc 84
<210> 280
<211> 73
<212> DNA
<213> Homo sapiens
<400> 280
gcccactcca atccccaccc tctccatcct tagtcattaa agaacagcag cgcctggcac 60
gttcttggag gac 73
<210> 281
<211> 115
<212> DNA
<213> Homo sapiens
<400> 281
cctagggccg acttttccat ctcctcctct acctccggct cccgggcgag ggaggccccg 60
cgccgcccct tagactggct gcggccggaa gattgcagcc gctttgagct tactc 115
<210> 282
<211> 71
<212> DNA
<213> Homo sapiens
<400> 282
cctcggatcc caagcatatc tggcgatgga gcggcggcag cccgaggcac gtgttgtgtg 60
tgctccgatt g 71
<210> 283
<211> 98
<212> DNA
<213> Homo sapiens
<400> 283
cgcgtgcgaa gtctcctcta gcggagcggg accggccgcg gcggtggatc gtggcggtcc 60
ctgcacttct gctccagccg cgcctggaaa cctgagcc 98
<210> 284
<211> 96
<212> DNA
<213> Homo sapiens
<400> 284
cgcgtgcgaa gtctcctcta gcggagcggg accggccgcg gcggtggatc gtggcggtcc 60
ctgcacttct gctccagccg cgcctggaaa cctgag 96
<210> 285
<211> 88
<212> DNA
<213> Homo sapiens
<400> 285
ggctctgatt ggcctgcatc ttgcggcgcg ggcggccgca gcccggcgcg agggagggag 60
cgcggaacaa ggcgctgact gtctccca 88
<210> 286
<211> 124
<212> DNA
<213> Homo sapiens
<400> 286
tgcagggacg tacagggcgg tgatccagta tctaaattct ttgggagaaa atgaatagtt 60
cccccgcccc cgccctccag gaaaaaaaaa aatctgagaa tctgagaatg ttcagcgcac 120
ccgc 124
<210> 287
<211> 92
<212> DNA
<213> Homo sapiens
<400> 287
aaaaagccaa tctccaagcc tccaaacgga acgtcaccct atcagctggg agacagcgcc 60
gcactgactg acaagccgcg catatttatc ct 92
<210> 288
<211> 70
<212> DNA
<213> Homo sapiens
<400> 288
cgcggccacc caccctagtc gttggagcct ggcgcccgcg cctcccggcc ggcagcacgt 60
caaaacggcg 70
<210> 289
<211> 102
<212> DNA
<213> Homo sapiens
<400> 289
ttctaacgag ggctcagctc cgactacccc aggcctccgg ggaccctctc cggatgcgct 60
ccccgctttg cgctttgcgc tttttgcctg ttccctgggg tc 102
<210> 290
<211> 84
<212> DNA
<213> Homo sapiens
<400> 290
ccgcccgcag gatcgagtga gtcacgcggc cgccagacga ggccggtggc gcacgcaccc 60
gagatccgat gtagtgcacc gcct 84
<210> 291
<211> 129
<212> DNA
<213> Homo sapiens
<400> 291
cgctcgttgc gacccaggct cagctccgcg gtgcgcaggg cctggcgcct tcgcggctgc 60
ccgcccgggc tcagctcctc cacagccacg cggcaccgca gctccgagtc ctcatattcc 120
cctgccgcc 129
<210> 292
<211> 103
<212> DNA
<213> Homo sapiens
<400> 292
caactccgag gagctagcgc agaccgctct ccgccctcag ctgcggcgag gcaagggctg 60
gcagcgctcg gacgcctccg tcttgccctt cccatgccta agc 103
<210> 293
<211> 76
<212> DNA
<213> Homo sapiens
<400> 293
tgcctaagcg cggggaatta cacgttcccg gtgtagaaca gacgatcggg gctattaggg 60
ctgggcggtg ggagtg 76
<210> 294
<211> 72
<212> DNA
<213> Homo sapiens
<400> 294
ctggcttcag tacataacgc gagttacagt tcaacagaac cagatgtgaa aacgtcagcc 60
acccagttca gg 72
<210> 295
<211> 113
<212> DNA
<213> Homo sapiens
<400> 295
tattaagaac cgcaagccca ctgtgtgcca gccgccgttg gtagttttac acgtgcgatc 60
ttatttaata cttcctggga cctaatgagt caggtgccat catgatccgt tta 113
<210> 296
<211> 103
<212> DNA
<213> Homo sapiens
<400> 296
aggctccgaa tcgcacctct tctcctgtcc taatctcagg ctccaggcct ggcttgcagt 60
ttctggctca ccgcgctgcg gtcaccggcc cacactccca gga 103
<210> 297
<211> 102
<212> DNA
<213> Homo sapiens
<400> 297
ggctctgcct gtttgttccg cccccgcgga aaccgctgct cgctgggcag gggctttctg 60
ttttgcagcc ggaacaggaa cacagatagc ccgccaagcc gc 102
<210> 298
<211> 113
<212> DNA
<213> Homo sapiens
<400> 298
gaaaaacaga gaggcgaggc cagactgccc ccacacctcc tgtagccact gagcgcgaag 60
tgcgttggtt ccgagcgcgc tggtgggatc cacaaagctc gcattctctc agg 113
<210> 299
<211> 110
<212> DNA
<213> Homo sapiens
<400> 299
cgagttctgg gcctctggag gtttccctgt cagcctcccc ggccgccgag ggggcgcgcg 60
cccaacaagg gggtctctag cggccacctg gggacagaaa cagtgaccct 110
<210> 300
<211> 95
<212> DNA
<213> Homo sapiens
<400> 300
ggtggaggat gtggaggtgg aagtggagcg gatggcgctc cccaagagct ccgccacgcg 60
aggtttcggg ctcgtggttt tgcttcctcc gggtc 95
<210> 301
<211> 76
<212> DNA
<213> Homo sapiens
<400> 301
tggcctccaa ctttaacgac atagtcaagc agggctacgt gaaaatccgc agcaggaagc 60
ttggggtgag tggctc 76
<210> 302
<211> 121
<212> DNA
<213> Homo sapiens
<400> 302
ggcgacgcgt ttccctggtt acctgcgggg ccgcgtcccg gaggagcctg agggccaaga 60
gggccggcgc gcggtgggcg cggcctgcgg ggatgccggg ctctacggag cagcgcgggg 120
t 121
<210> 303
<211> 118
<212> DNA
<213> Homo sapiens
<400> 303
tttcggattc tggacttcgg gttccgctga ggacggattt cggaataggc acagtggctg 60
ccccgaaccc ctcaaggcgg cctccgcggg ctgtggctga agataatttt cggcgggc 118
<210> 304
<211> 96
<212> DNA
<213> Homo sapiens
<400> 304
ttgtgatatt tggttgcgcg ggattatgat gaaatgtgtg atatgtgtgt gattatgatt 60
aaggctgtag cgagtgtgaa cgtggcgaag tgtgcg 96
<210> 305
<211> 71
<212> DNA
<213> Homo sapiens
<400> 305
gggagtgggt gtggtgtgag gctggcgctg gagcggtctg ggaatgttag gaggtctagg 60
gtatcgcggc c 71
<210> 306
<211> 85
<212> DNA
<213> Homo sapiens
<400> 306
aggtaggtac cgcctgcctg tgtgtaccgg ggctgctgtc tccggggagg ggcttctggc 60
ggacaggaga accaagcagc ctcag 85
<210> 307
<211> 79
<212> DNA
<213> Homo sapiens
<400> 307
accctggggt gtagctctgt gtcccactgt gtgatgacgt gtgcgtgctt ctgtgcgtgt 60
gtgtgtgttt gtgcgcgtg 79
<210> 308
<211> 73
<212> DNA
<213> Homo sapiens
<400> 308
tctcgcgatg tttcagggtg agccggacgc aggcgtgcct gcgcagtgcg cggaggagtg 60
ctgttcgtgt gtt 73
<210> 309
<211> 86
<212> DNA
<213> Homo sapiens
<400> 309
gggcacaggt ggggtccgtc aggccgcccg gggctcctct gtcccagctc tgcggcccag 60
ggggtgacgt gatggcggca gcggtg 86
<210> 310
<211> 104
<212> DNA
<213> Homo sapiens
<400> 310
accggtctcc tcgtatccat cctcgcagtc cccaccccaa actaatgttc tcccctgagc 60
aaatttcgag acacttaaaa tcccagctaa gatcacgtcc ttct 104
<210> 311
<211> 109
<212> DNA
<213> Homo sapiens
<400> 311
aggcaggaga ggggaggaag agaacctgtg cccctggaag ctagaggaga gcctcgctct 60
ctctgctgct ctgggttccg caacgaattg agttcgggtt caggcggct 109
<210> 312
<211> 65
<212> DNA
<213> Homo sapiens
<400> 312
ggctcttttg catgcaggcc cgcctgaatg gggcgcctgg aggctgcatt gaggccgggc 60
tgtgt 65
<210> 313
<211> 78
<212> DNA
<213> Homo sapiens
<400> 313
gctgcattga ggccgggctg tgtaaactgt agggtgcctc gccgactcgg agccgcagag 60
actggcggcg ggtcaact 78
<210> 314
<211> 101
<212> DNA
<213> Homo sapiens
<400> 314
cttcccaggt caccattgct cctctgccct ctccacatcc gccctcccgt gagcgcagga 60
tgcacgcaca ggcagcggtt acaaaactca gcgcaacgtt g 101
<210> 315
<211> 111
<212> DNA
<213> Homo sapiens
<400> 315
ggcaccacta gctcctcgtc ctcctcggag gggcgcccga gtgcgtccga cacggccagt 60
agcgccgcgg cgagcagcag cagcgtgggt actggcccaa agctccgaga c 111
<210> 316
<211> 108
<212> DNA
<213> Homo sapiens
<400> 316
atctctttac cctggagcca gaaccagcgt cgccgccgtc ccctgcagct cagccggcaa 60
cgcgcgccga gcctcggggc gcagcttgga gacgcgcttg ctcgttct 108
<210> 317
<211> 81
<212> DNA
<213> Homo sapiens
<400> 317
cgcgaggtca tcctgcccta ctcagcggcg cactgccagg gcgcgcccgg ccgcaagctc 60
tccaagatag ccacgctgct g 81
Claims (17)
- 다음을 포함하는 대상체에서 대장암 및/또는 진행성 선종을 스크리닝하는 시험관내(in vitro) 방법:
- 대상체의 DNA 샘플에서, DMR 세트 내 모든 DMR 좌위의 메틸화 상태를 결정하는 단계로, 상기 DMR 세트는 표 2, 3 또는 4의 좌위를 포함하는, 단계,
- 수득한 데이터를 건강한 개체로부터 수득한 기준값과 비교하는 단계,
- 기준 샘플과 비교하여 하나 이상의 좌위에서 과메틸화가 검출되는 경우 대상체에서 대장암 및/또는 진행성 선종을 진단하는 단계. - 제1항에 있어서,
메틸화 상태가 메틸화 특이적 제한 효소 정량적 중합효소 연쇄 반응(methylation specific restriction enzyme quantitative polymerase chain reaction, MSRE-qPCR)에 의해 결정되는 것인 방법. - 제1항 또는 제2항에 있어서,
DMR 좌위가 표 5에 제공된 올리고뉴클레오티드 프라이머쌍에 의해 증폭되는 것인 방법. - 제1항 내지 제3항 중 어느 한 항에 있어서,
DNA가 인간 대상체의 혈액, 혈장 또는 대변으로부터 단리되는 것인 방법. - 제1항 내지 제4항 중 어느 한 항에 있어서,
DNA가 인간 대상체의 무세포 DNA인 방법. - 제1항 내지 제5항 중 어느 한 항에 있어서,
대상체가 스크리닝 시점 대장암에 대해 무증상이었던 것인 방법. - 제1항 내지 제6항 중 어느 한 항에 있어서,
대상체가 이전에 대장암에 대해 스크리닝된 것인 방법. - 제7항에 있어서,
대상체가 지난 10년 이내, 지난 5년 이내, 지난 4년 이내, 지난 3년 이내, 지난 2년 이내, 또는 지난 1년 이내에 대장암에 대해 스크리닝된 것인 방법. - 제7항 또는 제8항에 있어서,
대상체의 대장암에 대한 이전 스크리닝이 대상체를 대장암이 없는 것으로 진단한 것인 방법. - 제9항에 있어서,
대상체를 대장암이 없는 것으로 진단한 대장암에 대한 이전 스크리닝이 1년 이내인 방법. - 제9항 또는 제10항에 있어서,
대상체를 대장암이 없는 것으로 진단한 대장암에 대한 이전 스크리닝은 대장내시경 검사인 방법. - 제1항 내지 제11항 중 어느 한 항에 있어서,
상기 방법은 초기 대장암의 진단을 포함하고, 임의로 대장암이 병기 0, 병기 I, 병기 IIA, 병기 IIB 또는 병기 IIC 대장암인 방법. - 제1항 내지 제12항 중 어느 한 항에 있어서,
상기 방법은 암이 전이되지 않은 초기 대장암의 진단을 포함하는 것인 방법. - 제1항에 있어서,
메틸화 상태는 메틸화 민감성 제한 효소 정량적 중합효소 연쇄 반응(Methylation sensitive restriction enzyme quantitative polymerase chain reaction, MSRE-qPCR), 메틸화-특이적 PCR, 메틸화 특이적 뉴클레아제-보조 소수-대립유전자 농축 PCR 및 차세대 시퀀싱으로 이루어진 군에서 선택되는 하나 이상의 방법을 사용하여 결정하는 것인 방법. - 다음을 포함하는 키트이고:
(a) 표 2, 3 또는 4에 정의된 바와 같은 하나의 DMR 세트에서 각각의 DMR 좌위의 메틸화 상태의 검출을 위한 프라이머쌍, 여기서 프라이머쌍은 표 5의 것이고,
상기 키트는 선택적으로 추가로 다음을 포함하는, 키트:
(b) 적어도 하나의 메틸화 특이적 제한 효소 및/또는 중아황산염(bisulfite) 시약
(c) 중합효소. - 제1항 내지 제14항 중 어느 한 항에 있어서,
진단이 발암성 돌연변이의 존재 또는 부재를 결정하는 것을 추가로 포함하는 방법. - 제16항에 있어서,
Kras, NRAS, PIK3CA, PTEN, TP53, BRAF 및 APC 유전자로 이루어진 유전자의 군에서 선택된 유전자에 발암성 돌연변이가 있는 것인 방법.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US16/680,427 | 2019-11-11 | ||
US16/680,427 US11898199B2 (en) | 2019-11-11 | 2019-11-11 | Detection of colorectal cancer and/or advanced adenomas |
PCT/EP2020/076220 WO2021094017A1 (en) | 2019-11-11 | 2020-09-21 | Detection of colorectal cancer and/or advanced adenomas |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20220097503A true KR20220097503A (ko) | 2022-07-07 |
Family
ID=72752874
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020227019557A KR20220097503A (ko) | 2019-11-11 | 2020-09-21 | 대장암 및/또는 진행성 선종의 검출 |
Country Status (8)
Country | Link |
---|---|
US (1) | US11898199B2 (ko) |
EP (1) | EP4028556A1 (ko) |
JP (1) | JP2023500386A (ko) |
KR (1) | KR20220097503A (ko) |
CN (1) | CN114651073A (ko) |
AU (1) | AU2020384237A1 (ko) |
CA (1) | CA3155798A1 (ko) |
WO (1) | WO2021094017A1 (ko) |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11396679B2 (en) | 2019-05-31 | 2022-07-26 | Universal Diagnostics, S.L. | Detection of colorectal cancer |
US11898199B2 (en) | 2019-11-11 | 2024-02-13 | Universal Diagnostics, S.A. | Detection of colorectal cancer and/or advanced adenomas |
US11530453B2 (en) | 2020-06-30 | 2022-12-20 | Universal Diagnostics, S.L. | Systems and methods for detection of multiple cancer types |
TW202307218A (zh) * | 2021-05-14 | 2023-02-16 | 西班牙商通用診斷公司 | 用於疾病偵測的方法 |
EP4320276A1 (en) * | 2021-05-14 | 2024-02-14 | Universal Diagnostics, S.A. | Methods for disease detection |
CN115537464B (zh) * | 2021-06-30 | 2023-06-20 | 武汉艾米森生命科技有限公司 | 一种结直肠癌或癌前病变的诊断或辅助诊断试剂、核酸组合、试剂盒及应用 |
WO2023064053A1 (en) * | 2021-10-15 | 2023-04-20 | The Johns Hopkins University | Camera-based hemoglobin detection |
CN114594259B (zh) * | 2022-04-22 | 2022-09-13 | 北京易科拜德科技有限公司 | 一种新型的用于结直肠癌预后预测和诊断的模型及其应用 |
WO2024105132A1 (en) * | 2022-11-16 | 2024-05-23 | Universal Diagnostics, S.A. | Methods for stratification and early detection of advanced adenoma and/or colorectal cancer using dna methylation markers |
Family Cites Families (99)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6017704A (en) | 1996-06-03 | 2000-01-25 | The Johns Hopkins University School Of Medicine | Method of detection of methylated nucleic acid using agents which modify unmethylated cytosine and distinguishing modified methylated and non-methylated nucleic acids |
US6605432B1 (en) | 1999-02-05 | 2003-08-12 | Curators Of The University Of Missouri | High-throughput methods for detecting DNA methylation |
US6812339B1 (en) | 2000-09-08 | 2004-11-02 | Applera Corporation | Polymorphisms in known genes associated with human disease, methods of detection and uses thereof |
US7662549B1 (en) | 2000-10-27 | 2010-02-16 | The University Of Southern California | Methylation altered DNA sequences as markers associated with human cancer |
US20040142325A1 (en) | 2001-09-14 | 2004-07-22 | Liat Mintz | Methods and systems for annotating biomolecular sequences |
US20040265833A1 (en) | 2003-06-23 | 2004-12-30 | Cathy Lofton-Day | Methods and nucleic acids for the analysis of colorectal cell proliferative disorders |
JP2007119359A (ja) | 2005-10-25 | 2007-05-17 | Fujifilm Corp | 癌抑制剤 |
WO2007143037A2 (en) * | 2006-05-31 | 2007-12-13 | Orion Genomics Llc | Gene methylation in cancer diagnosis |
CA2654266A1 (en) | 2006-06-12 | 2007-12-27 | Oncomethylome Sciences S.A. | Methylation markers for early detection and prognosis of colon cancers |
GB0700374D0 (en) | 2007-01-09 | 2007-02-14 | Oncomethylome Sciences S A | NDRG family methylation markers |
CA2688536A1 (en) | 2007-05-21 | 2008-11-27 | Dana-Farber Cancer Institute, Inc. | Compositions, kits, and methods for identification, assessment, prevention, and therapy of cancer |
CN101815792A (zh) | 2007-06-22 | 2010-08-25 | 纽约市哥伦比亚大学托管会 | 肿瘤特异性dna序列的特异性扩增 |
US10927415B2 (en) | 2008-11-26 | 2021-02-23 | The Johns Hopkins University | Methods for identifying cancer risk |
WO2010074924A1 (en) | 2008-12-23 | 2010-07-01 | University Of Utah Research Foundation | Identification and regulation of a novel dna demethylase system |
KR101530498B1 (ko) | 2009-04-17 | 2015-06-19 | 내셔널 디펜스 메디컬 센터 | 검사 마커로서 표적 유전자의 메틸화율을 검출하는 방법 |
US8048634B2 (en) | 2009-08-18 | 2011-11-01 | National Defense Medical Center | Cancer screening method |
KR101142131B1 (ko) | 2009-11-05 | 2012-05-11 | (주)지노믹트리 | 장암 진단을 위한 장암 특이적 메틸화 마커 유전자의 메틸화 검출방법 |
US10428388B2 (en) | 2009-11-05 | 2019-10-01 | Genomictree, Inc. | Method for detecting the methylation of colorectal-cancer-specific methylation marker genes for colorectal cancer diagnosis |
WO2011126768A2 (en) | 2010-03-29 | 2011-10-13 | Mayo Foundation For Medical Education And Research | Methods and materials for detecting colorectal cancer and adenoma |
DK3508589T3 (da) | 2010-09-13 | 2023-06-06 | Clinical Genomics Pty Ltd | Epigenetiske markører af kolorektale kræftformer og diagnostiske fremgangsmåder under anvendelse af det samme |
WO2012047899A2 (en) | 2010-10-04 | 2012-04-12 | The Johns Hopkins University | Novel dna hypermethylation diagnostic biomarkers for colorectal cancer |
JP2012075427A (ja) * | 2010-10-06 | 2012-04-19 | Sumitomo Chemical Co Ltd | 哺乳動物由来の検体の癌化度を評価する方法 |
EP2481813A1 (en) | 2011-02-01 | 2012-08-01 | Centro di Riferimento Oncologico - Istituto Nazionale Tumori - Aviano | Markers of cutaneous melanoma and uses thereof |
GB201102014D0 (en) | 2011-02-04 | 2011-03-23 | Ucl Business Plc | Method for predicting risk of developing cancer |
AU2012253414B2 (en) | 2011-05-12 | 2016-03-17 | The Johns Hopkins University | Method of detecting cancer through generalized loss of stability of epigenetic domains, and compositions thereof |
US8557787B2 (en) * | 2011-05-13 | 2013-10-15 | The Board Of Trustees Of The Leland Stanford Junior University | Diagnostic, prognostic and therapeutic uses of long non-coding RNAs for cancer and regenerative medicine |
WO2012167145A2 (en) | 2011-06-01 | 2012-12-06 | University Of Southern California | Genome-scale analysis of aberrant dna methylation in colorectal cancer |
CA2838736A1 (en) | 2011-06-07 | 2012-12-13 | Caris Mpi, Inc. | Molecular profiling for cancer |
US9367663B2 (en) | 2011-10-06 | 2016-06-14 | Sequenom, Inc. | Methods and processes for non-invasive assessment of genetic variations |
US9994900B2 (en) | 2011-10-17 | 2018-06-12 | King Abdullah University Of Science And Technology | Composite biomarkers for non-invasive screening, diagnosis and prognosis of colorectal cancer |
WO2013097868A1 (en) | 2011-12-27 | 2013-07-04 | Region Syddanmark | Detection of adenomas of the colon or rectum |
US20150072866A1 (en) | 2012-03-20 | 2015-03-12 | Exact Sciences Corporation | Marker panel for detecting cancer |
DK3608421T3 (da) | 2012-05-18 | 2022-09-05 | Clinical Genomics Pty Ltd | Fremgangsmåde til screening for colorektal cancer |
KR20150041148A (ko) | 2012-08-28 | 2015-04-15 | 이스타트 바이오메디칼 코., 엘티드. | 암을 스크리닝하기 위한 시험 조성물 |
WO2014046200A1 (ja) | 2012-09-19 | 2014-03-27 | シスメックス株式会社 | 子宮体癌に関する情報の取得方法、ならびに子宮体癌に関する情報を取得するためのマーカーおよびキット |
US9732390B2 (en) | 2012-09-20 | 2017-08-15 | The Chinese University Of Hong Kong | Non-invasive determination of methylome of fetus or tumor from plasma |
WO2014062218A1 (en) | 2012-10-16 | 2014-04-24 | University Of Southern California | Colorectal cancer dna methylation markers |
US20130189684A1 (en) | 2013-03-12 | 2013-07-25 | Sequenom, Inc. | Quantification of cell-specific nucleic acid markers |
ES2859645T3 (es) | 2013-03-14 | 2021-10-04 | Mayo Found Medical Education & Res | Detección de neoplasia |
US10262755B2 (en) | 2014-04-21 | 2019-04-16 | Natera, Inc. | Detecting cancer mutations and aneuploidy in chromosomal segments |
EP2886659A1 (en) | 2013-12-20 | 2015-06-24 | AIT Austrian Institute of Technology GmbH | Gene methylation based colorectal cancer diagnosis |
CA2938451C (en) | 2014-01-30 | 2023-10-17 | The Regents Of The University Of California | Methylation haplotyping for non-invasive diagnosis (monod) |
WO2015153284A1 (en) | 2014-03-31 | 2015-10-08 | Mayo Foundation For Medical Education And Research | Detecting colorectal neoplasm |
EP4306659A3 (en) | 2014-04-14 | 2024-03-27 | Yissum Research and Development Company of the Hebrew University of Jerusalem Ltd. | A method and kit for determining the tissue or cell origin of dna |
JP6418595B2 (ja) | 2014-07-11 | 2018-11-07 | シスメックス株式会社 | 複数種類の癌に関する情報を取得する方法、システムおよびプログラム |
WO2016060278A1 (ja) | 2014-10-17 | 2016-04-21 | 国立大学法人東北大学 | 大腸癌に対する薬物療法の感受性を予測する方法 |
EP3240912A4 (en) | 2014-12-31 | 2018-07-25 | Case Western Reserve University | Methods and compositions for detecting esophageal neoplasias and/or metaplasias in the esophagus |
WO2016183106A1 (en) | 2015-05-11 | 2016-11-17 | Natera, Inc. | Methods and compositions for determining ploidy |
WO2016187234A1 (en) | 2015-05-18 | 2016-11-24 | Karius, Inc. | Compositions and methods for enriching populations of nucleic acids |
GB201511152D0 (en) | 2015-06-24 | 2015-08-05 | Ucl Business Plc | Method of diagnosing bladder cancer |
CN114999567A (zh) | 2015-07-23 | 2022-09-02 | 香港中文大学 | 游离dna的片段化模式的分析 |
WO2017019751A1 (en) | 2015-07-27 | 2017-02-02 | The Johns Hopkins University | Method to use viral and host methylation markers for cervical cancer screening and triage in liquid prep, serum/plasma, and urine: pcr and sequencing based process methods |
US20170101674A1 (en) | 2015-08-21 | 2017-04-13 | Toma Biosciences, Inc. | Methods, compositions, and kits for nucleic acid analysis |
WO2017040627A1 (en) | 2015-08-31 | 2017-03-09 | Mayo Foundation For Medical Education And Research | Detecting gastric neoplasm |
WO2017043497A1 (ja) | 2015-09-08 | 2017-03-16 | 国立大学法人山口大学 | 大腸腫瘍の有無を検査する方法 |
EP3350344A1 (en) | 2015-09-17 | 2018-07-25 | The United States Of America, As Represented By The Secretary, Department Of Health And Human Services | Cancer detection methods |
US10370726B2 (en) * | 2016-04-14 | 2019-08-06 | Mayo Foundation For Medical Education And Research | Detecting colorectal neoplasia |
WO2017181146A1 (en) | 2016-04-14 | 2017-10-19 | Guardant Health, Inc. | Methods for early detection of cancer |
EP3452620A4 (en) | 2016-05-04 | 2020-01-01 | Queen's University At Kingston | CELL-FREE DETECTION OF METHYLATED TUMOR DNA |
KR102436270B1 (ko) | 2016-05-05 | 2022-08-25 | 이그젝트 싸이언스 디블롭먼트 컴패니, 엘엘씨 | 메틸화된 dna 분석에 의한 폐 종양의 검출 |
GB2568608B (en) | 2016-05-27 | 2022-10-12 | Personalis Inc | Personalized genetic testing |
US10006925B2 (en) | 2016-05-30 | 2018-06-26 | Universal Diagnostics, S. L. | Methods and systems for metabolite and/or lipid-based detection of colorectal cancer and/or adenomatous polyps |
WO2017212428A1 (en) | 2016-06-07 | 2017-12-14 | The Regents Of The University Of California | Cell-free dna methylation patterns for disease and condition analysis |
WO2018057888A1 (en) | 2016-09-23 | 2018-03-29 | Driver, Inc. | Integrated systems and methods for automated processing and analysis of biological samples, clinical information processing and clinical trial matching |
CN109844139A (zh) | 2016-09-29 | 2019-06-04 | 哈鲁曼有限公司 | 散发性大肠癌发病可能性的判定方法 |
US9850523B1 (en) | 2016-09-30 | 2017-12-26 | Guardant Health, Inc. | Methods for multi-resolution analysis of cell-free nucleic acids |
WO2018087129A1 (en) | 2016-11-08 | 2018-05-17 | Region Nordjylland, Aalborg University Hospital | Colorectal cancer methylation markers |
WO2018119452A2 (en) | 2016-12-22 | 2018-06-28 | Guardant Health, Inc. | Methods and systems for analyzing nucleic acid molecules |
WO2018140781A1 (en) | 2017-01-27 | 2018-08-02 | Exact Sciences Development Company, Llc | Detection of colon neoplasia by analysis of methylated dna |
EP3612627A4 (en) | 2017-04-19 | 2020-12-30 | Singlera Genomics, Inc. | COMPOSITIONS AND METHODS FOR DETECTION OF GENOMIC VARIANCE AND OF DNA METHYLATION STATUS |
EP3622091A4 (en) | 2017-05-12 | 2021-02-17 | President and Fellows of Harvard College | UNIVERSAL EARLY CANCER DIAGNOSIS |
EP3431612A1 (en) | 2017-07-20 | 2019-01-23 | INSERM (Institut National de la Santé et de la Recherche Médicale) | Method for molecular typing of tumors in a single targeted next generation sequencing experiment |
AU2018304458B2 (en) | 2017-07-21 | 2021-12-09 | Foundation Medicine, Inc. | Therapeutic and diagnostic methods for cancer |
EP3665308A1 (en) | 2017-08-07 | 2020-06-17 | The Johns Hopkins University | Methods and materials for assessing and treating cancer |
WO2019035100A2 (en) | 2017-08-18 | 2019-02-21 | University Of Southern California | PROGNOSTIC MARKERS OF CANCER RECIDIVE |
US11851711B2 (en) | 2017-09-29 | 2023-12-26 | Arizona Board Of Regents On Behalf Of The University Of Arizona | DNA methylation biomarkers for cancer diagnosing |
CA3084584A1 (en) | 2017-11-30 | 2019-06-06 | Mayo Foundation For Medical Education And Research | Detecting breast cancer |
EP3765638A2 (en) | 2018-03-13 | 2021-01-20 | Yissum Research Development Company of the Hebrew University of Jerusalem Ltd. | Diagnostic use of cell free dna chromatin immunoprecipitation |
US20200017916A1 (en) | 2018-05-31 | 2020-01-16 | Wright State University | Blood-based biomarkers for the detection of colorectal cancer |
CN113286881A (zh) | 2018-09-27 | 2021-08-20 | 格里尔公司 | 甲基化标记和标靶甲基化探针板 |
CN113423410A (zh) | 2018-11-27 | 2021-09-21 | 精密科学发展有限责任公司 | 在肺肿瘤检测中表征甲基化dna、rna和蛋白质 |
US10533214B2 (en) | 2018-12-21 | 2020-01-14 | Inivata Ltd. | Method for measuring mutational load |
AU2020211461A1 (en) | 2019-01-24 | 2021-08-19 | Exact Sciences Corporation | Detecting endometrial cancer |
CN113826167A (zh) | 2019-05-13 | 2021-12-21 | 格瑞尔公司 | 基于模型的特征化和分类 |
WO2020236939A2 (en) | 2019-05-23 | 2020-11-26 | Paradigm Diagnostics | Tissue preparation using nuclease |
US11396679B2 (en) | 2019-05-31 | 2022-07-26 | Universal Diagnostics, S.L. | Detection of colorectal cancer |
US11001898B2 (en) | 2019-05-31 | 2021-05-11 | Universal Diagnostics, S.L. | Detection of colorectal cancer |
EP3963111B8 (en) | 2019-05-31 | 2024-06-26 | Universal Diagnostics, S.A. | Detection of colorectal cancer |
WO2020257353A1 (en) | 2019-06-17 | 2020-12-24 | The Board Of Trustees Of The Leland Stanford Junior University | Diagnostics and treatments based upon molecular characterization of colorectal cancer |
EP4004238A1 (en) | 2019-07-23 | 2022-06-01 | Grail, LLC | Systems and methods for determining tumor fraction |
EP4022093A4 (en) | 2019-08-27 | 2024-05-22 | Exact Sciences Corporation | CHARACTERIZATION OF METHYLATED DNA, RNA AND PROTEINS IN SUBJECTS SUSPECTED TO HAVE LUNG NEOPLASIA |
US11898199B2 (en) | 2019-11-11 | 2024-02-13 | Universal Diagnostics, S.A. | Detection of colorectal cancer and/or advanced adenomas |
EP4121563A1 (en) | 2020-04-17 | 2023-01-25 | Universal Diagnostics, S.L. | Detection of advanced adenoma and/or early stage colorectal cancer |
US20210324477A1 (en) | 2020-04-21 | 2021-10-21 | Grail, Inc. | Generating cancer detection panels according to a performance metric |
WO2021228418A1 (en) | 2020-05-15 | 2021-11-18 | Universal Diagnostics, S.L. | Methods and systems for identifying methylation biomarkers |
US20230242995A1 (en) | 2020-06-29 | 2023-08-03 | Epify B.V. | Method for detecting colorectal cancer |
US20210404010A1 (en) | 2020-06-30 | 2021-12-30 | Universal Diagnostics, S.L. | Detection of colorectal neoplasms |
US11530453B2 (en) | 2020-06-30 | 2022-12-20 | Universal Diagnostics, S.L. | Systems and methods for detection of multiple cancer types |
US20220411878A1 (en) | 2021-05-14 | 2022-12-29 | Universal Diagnostics, S.L. | Methods for disease detection |
-
2019
- 2019-11-11 US US16/680,427 patent/US11898199B2/en active Active
-
2020
- 2020-09-21 CA CA3155798A patent/CA3155798A1/en active Pending
- 2020-09-21 JP JP2022526793A patent/JP2023500386A/ja active Pending
- 2020-09-21 EP EP20786469.5A patent/EP4028556A1/en active Pending
- 2020-09-21 AU AU2020384237A patent/AU2020384237A1/en active Pending
- 2020-09-21 WO PCT/EP2020/076220 patent/WO2021094017A1/en unknown
- 2020-09-21 CN CN202080077593.5A patent/CN114651073A/zh active Pending
- 2020-09-21 KR KR1020227019557A patent/KR20220097503A/ko unknown
Also Published As
Publication number | Publication date |
---|---|
EP4028556A1 (en) | 2022-07-20 |
US20210139948A1 (en) | 2021-05-13 |
AU2020384237A1 (en) | 2022-05-05 |
CA3155798A1 (en) | 2021-05-20 |
CN114651073A (zh) | 2022-06-21 |
WO2021094017A1 (en) | 2021-05-20 |
JP2023500386A (ja) | 2023-01-05 |
US11898199B2 (en) | 2024-02-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11898199B2 (en) | Detection of colorectal cancer and/or advanced adenomas | |
CN108350504B (zh) | 膀胱癌的诊断方法 | |
US11396679B2 (en) | Detection of colorectal cancer | |
EP3963111B1 (en) | Detection of colorectal cancer | |
US20230183815A1 (en) | Detection of colorectal neoplasms | |
US11530453B2 (en) | Systems and methods for detection of multiple cancer types | |
US20210332440A1 (en) | Detection of advanced adenoma and/or early stage colorectal cancer | |
US20210230707A1 (en) | Detection of colorectal cancer | |
CN117813403A (zh) | 用于疾病检测的方法 | |
US20240158862A1 (en) | Methods for stratification and early detection of advanced adenoma and/or colorectal cancer using dna methylation markers | |
EP4299764A1 (en) | Methods for detecting pancreatic cancer using dna methylation markers | |
WO2024105132A1 (en) | Methods for stratification and early detection of advanced adenoma and/or colorectal cancer using dna methylation markers | |
TW202307218A (zh) | 用於疾病偵測的方法 | |
TW202311533A (zh) | 用於疾病偵測的方法 |