KR20220097503A

KR20220097503A - 대장암 및/또는 진행성 선종의 검출

Info

Publication number: KR20220097503A
Application number: KR1020227019557A
Authority: KR
Inventors: 마르코 비텐츠; 크리스티 크루스마; 후안 마르티네즈-바레아; 크리스티안 헨스; 마르코 체르시콜라; 프리모즈 크나프
Original assignee: 유니버설 다이아그노스틱스, 에스.엘.
Priority date: 2019-11-11
Filing date: 2020-09-21
Publication date: 2022-07-07
Also published as: EP4028556A1; US20210139948A1; AU2020384237A1; CA3155798A1; CN114651073A; WO2021094017A1; JP2023500386A; US11898199B2

Abstract

본원은 무엇보다도 대장암 및/또는 진행성 선종 검출(예컨대, 스크리닝)을 위한 방법 및 이와 관련된 조성물을 제공한다. 다양한 구현예에서, 본원은 하나 이상의 메틸화 바이오마커, 및 이와 관련된 조성물의 메틸화 상태의 분석을 포함하는 예컨대, 스크리닝 방법을 제공한다. 다양한 구현예에서, 본원은 cfDNA, 예를 들어 ctDNA에서 하나 이상의 메틸화 바이오마커의 메틸화 상태를 검출(예컨대, 스크리닝)하는 것을 포함하는 검출(예컨대, 스크리닝) 방법을 제공한다. 다양한 구현예에서, 본원은 MSRE-qPCR을 사용하여 및/또는 대규모 병렬 시퀀싱(예컨대, 차세대 시퀀싱)을 사용하여 cfDNA, 예를 들어 ctDNA에서 하나 이상의 메틸화 바이오마커의 메틸화 상태를 검출(예컨대, 스크리닝)하는 것을 포함하는 스크리닝 방법을 제공한다.

Description

대장암 및/또는 진행성 선종의 검출

본 발명은 일반적으로 대장암(colorectal cancer) 및/또는 진행성 선종(advanced adenoma)의 검출 및/또는 선제적 스크리닝을 위한 방법 및 키트에 관한 것이다. 특정 구현예에서, 본원에 기재된 방법 및 키트는 대상체에서 대장암 및/또는 진행성 선종의 존재 및/또는 위험을 결정하기 위한 마커로서 인간 게놈의 식별된 차등적 메틸화 영역을 이용한다.

암 스크리닝은 암 예방, 진단 및 치료에 있어 매우 중요한 요소이다. 일부 보고서에 따르면, 대장암(Colorectal cancer, CRC)은 세계에서 세 번째로 흔한 유형의 암이자 두 번째로 흔한 암 사망 원인으로 확인되었다. 일부 보고서에 따르면, 매년 180만 명이 넘는 새로운 대장암 사례가 발생하고 약 881,000명이 대장암으로 사망하며, 이는 암 사망 10명 중 1명꼴이다. 정기적인 대장암 스크리닝은 특히 50세 이상의 개체에게 권장된다. 또한 50세 미만의 개체에서 대장암 발병률은 시간의 경과에 따라 증가하였다. 통계에 따르면 현재의 대장암 스크리닝 기술은 충분하지 않다. 시간의 경과에 따른 개선에도 불구하고 현재 대장암의 약 40-44%만이 조기의 국부적 단계에서 선별 검사를 통해 발견된다. 이것은 적어도 부분적으로 현재 스크리닝 기술의 불충분한 민감도 및/또는 특이도 때문이다. 현재 권장되는 기술은 50세 이상을 위한 대장 내시경 및/또는 대변 혈액 검사가 있다.

대부분의 대장암은 조직학에 따라 처음에는 양성으로 나타나는 결장 폴립으로부터 유래한다. 따라서 대장 용종을 조기에 발견하고 제거하는 것은 대장암 검진의 중요한 부분이다. 그러나 어떤 용종이 침윤성 암으로 발전할지 결정하는 것은 조직병리학적 분류만을 기초로 해서는 어렵다. 악성 종양으로 진행되는 경향성이 있는 진행성 선종으로서 용종의 조직병리학적 분류는, 예를 들어 대장 내시경 동안 결장 조직으로부터 절제된 샘플에 대해 일상적으로 수행된다. 진행성 선종은 다음 특징 중 하나 이상을 갖는 것으로 분류된다: 큰 크기를 가짐(즉, 1cm보다 큰 선종); 고등급 이형성증이 있음; 두드러진 융모 성분을 가짐; 및/또는 톱니 모양의 특징이 있다. 그러나, 상기 분류에 따라 선종이 진행성 선종으로 분류되더라도 상기 선종이 침윤성 암종으로 진행되지 않을 수 있다.

특정 이론에 얽매이지 않고, 침윤성 암종으로 진행되는 선종 또는 용종은 정상 조직과 구별되는 유전적 변조를 획득하고 축적할 것이다. 이러한 뚜렷한 변화의 식별을 통해 선종이 침윤성 암종으로 진행될지 여부를 결정하는 데 도움이 되는 분자 지문이 개발될 수 있다. 진행성 암종 및 대장암의 분자 지문을 결정하기 위한 도구와 기술을 개발하면 초기 단계에서 대장암을 식별하는 데 도움이 될 것이다. 따라서 대장암을 초기에 정확하게 검진할 수 있는 도구와 검진 기술이 필요하다.

본원은 무엇보다도 대장암 및/또는 진행성 선종 스크리닝을 위한 방법 및 이와 관련된 조성물을 제공한다. 본원에 구체적으로 개시된 다양한 구현예에서, 본원은 인간 대상체의 DNA의 차등적 메틸화 영역(differentially methylated region, DMR) 내에서 발견되는 하나 이상의 메틸화 부위 중 적어도 하나의 메틸화 상태의 식별을 포함하는 대장암 및/또는 진행성 선종 스크리닝을 위한 방법을 제공한다. 본원에 구체적으로 개시된 다양한 구현예에서, 본원은 cfDNA(무세포 DNA), 예컨대 ctDNA(circulating tumor DNA)에서 하나 이상의 메틸화 바이오마커의 메틸화 상태를 스크리닝하는 것을 포함하는 대장암 및/또는 진행성 선종 스크리닝을 위한 방법을 제공한다. 다양한 구현예에서, 본원은 MSRE-qPCR을 사용하여 cfDNA, 예컨대 ctDNA에서 하나 이상의 메틸화 바이오마커의 메틸화 상태를 스크리닝하는 것을 포함하는 대장암 및/또는 진행성 선종 스크리닝 방법을 제공한다. 본원에 제공된 다양한 조성물 및 방법은 대장암 및/또는 진행성 선종 스크리닝에서의 임상 적용에 충분한 민감도 및 특이도를 제공한다. 본원에 제공된 다양한 조성물 및 방법은 대상체의 접근 가능한 조직 샘플, 예를 들어 혈액 또는 혈액 성분(예컨대, cfDNA, 예를 들어, ctDNA), 결장직장 조직, 또는 대변인 조직 샘플의 분석에 의한 대장암 및/또는 진행성 선종 스크리닝에 유용하다.

특정 구현예에서, 본원에 개시된 바와 같은 임의의 방법이 시험관내(in vitro)에서 사용될 수 있다.

일 양태에서, 본원은 (i) 대장암에 대한 스크리닝 또는 (ii) 진행성 선종에 대한 스크리닝, 또는 (iii) 대장암 또는 진행성 선종(또는 둘 모두)의 존재에 대한 스크리닝 방법을 제공하며, 상기 방법은 표 1 또는 표 7에 열거된 인간 대상체의 DNA의 차등적 메틸화 영역(DMR) 내에서 발견되는 적어도 하나의 메틸화 부위의 메틸화 상태를 결정하는 단계를 포함한다.

이전 단락에서 구체적으로 언급된 다양한 구현예에서, 상기 방법은 표 1 또는 표 7에 열거된 하나 이상의 DMR 각각에 대해 DMR 내에서 발견되는 적어도 3개의 메틸화 부위의 메틸화 상태를 결정하는 단계를 포함한다.

이전 단락에서 구체적으로 언급된 다양한 구현예에서, 상기 방법은 표 1 또는 표 7에 열거된 하나 이상의 DMR 각각에 대해 DMR 내에서 발견되는 적어도 4개의 메틸화 부위의 메틸화 상태를 결정하는 것을 포함한다.

이전 단락에서 구체적으로 언급된 다양한 구현예에서, 상기 방법은 표 1 또는 표 7에 열거된 하나 이상의 DMR 각각에 대해 DMR 내에서 발견되는 적어도 5개의 메틸화 부위의 메틸화 상태를 결정하는 것을 포함한다.

이전 단락에서 구체적으로 언급된 다양한 구현예에서, 상기 방법은 표 1 또는 표 7에 열거된 3개 이상의 DMR 각각에 대해 DMR 내에서 발견되는 적어도 하나의 메틸화 부위의 메틸화 상태를 결정하는 것을 포함한다

이전 단락에서 구체적으로 언급된 다양한 구현예에서, 상기 방법은 표 1 또는 표 7에 열거된 3개 이상의 DMR 각각에 대해 DMR 내에서 발견되는 적어도 3개의 메틸화 부위의 메틸화 상태를 결정하는 것을 포함한다.

이전 단락에서 구체적으로 언급된 다양한 구현예에서, 상기 방법은 표 1 또는 표 7에 열거된 3개 이상의 DMR 각각에 대해 DMR 내에서 발견되는 적어도 4개의 메틸화 부위의 메틸화 상태를 결정하는 것을 포함한다.

이전 단락에서 구체적으로 언급된 다양한 구현예에서, 상기 방법은 표 1 또는 표 7에 열거된 3개 이상의 DMR 각각에 대해 DMR 내에서 발견되는 적어도 5개의 메틸화 부위의 메틸화 상태를 결정하는 것을 포함한다.

이전 단락에서 구체적으로 언급된 다양한 구현예에서, 상기 방법은 표 1 또는 표 7에 열거된 10개 이상의 DMR 각각에 대해 DMR 내에서 발견되는 적어도 하나의 메틸화 부위의 메틸화 상태를 결정하는 것을 포함한다.

이전 단락에서 구체적으로 언급된 다양한 구현예에서, 상기 방법은 표 1 또는 표 7에 열거된 10개 이상의 DMR 각각에 대해 DMR 내에서 발견되는 적어도 3개의 메틸화 부위의 메틸화 상태를 결정하는 것을 포함한다.

이전 단락에서 구체적으로 언급된 다양한 구현예에서, 상기 방법은 표 1 또는 표 7에 열거된 10개 이상의 DMR 각각에 대해 DMR 내에서 발견되는 적어도 4개의 메틸화 부위의 메틸화 상태를 결정하는 것을 포함한다.

이전 단락에서 구체적으로 언급된 다양한 구현예에서, 상기 방법은 표 1 또는 표 7에 열거된 10개 이상의 DMR 각각에 대해 DMR 내에서 발견되는 적어도 5개의 메틸화 부위의 메틸화 상태를 결정하는 것을 포함한다

이전 단락에서 구체적으로 언급된 다양한 구현예에서, 상기 방법은 표 1에 열거된 35개 이상의 DMR 각각에 대해 DMR 내에서 발견되는 적어도 하나의 메틸화 부위의 메틸화 상태를 결정하는 단계를 포함한다.

이전 단락에서 구체적으로 언급된 다양한 구현예에서, 상기 방법은 표 1에 열거된 35개 이상의 DMR 각각에 대해 DMR 내에서 발견되는 적어도 3개의 메틸화 부위의 메틸화 상태를 결정하는 것을 포함한다.

이전 단락에서 구체적으로 언급된 다양한 구현예에서, 상기 방법은 표 1에 열거된 35개 이상의 DMR 각각에 대해 DMR 내에서 발견되는 적어도 4개의 메틸화 부위의 메틸화 상태를 결정하는 단계를 포함한다.

이전 단락에서 구체적으로 언급된 다양한 구현예에서, 상기 방법은 표 1에 열거된 35개 이상의 DMR 각각에 대해 DMR 내에서 발견되는 적어도 5개의 메틸화 부위의 메틸화 상태를 결정하는 것을 포함한다.

이전 단락에서 구체적으로 언급된 다양한 구현예에서, 상기 방법은 표 7에 열거된 40개 이상의 DMR 각각에 대해 DMR 내에서 발견되는 적어도 3개의 메틸화 부위의 메틸화 상태를 결정하는 것을 포함한다.

이전 단락에서 구체적으로 언급된 다양한 구현예에서, 상기 방법은 표 7에 열거된 40개 이상의 DMR 각각에 대해 DMR 내에서 발견되는 적어도 4개의 메틸화 부위의 메틸화 상태를 결정하는 것을 포함한다.

이전 단락에서 구체적으로 언급된 다양한 구현예에서, 상기 방법은 표 7에 열거된 40개 이상의 DMR 각각에 대해 DMR 내에서 발견되는 적어도 5개의 메틸화 부위의 메틸화 상태를 결정하는 것을 포함한다.

이전 단락에서 구체적으로 언급된 다양한 구현예에서, DMR은 적어도 1, 적어도 2, 적어도 3, 적어도 4, 적어도 5, 적어도 6, 적어도 7, 적어도 8, 적어도 9, 적어도 10, 적어도 11, 적어도 12, 적어도 13, 적어도 14, 적어도 15 또는 그 이상의 메틸화 민감성 제한 부위를 포함한다.

이전 단락에서 구체적으로 언급된 다양한 구현예에서, 상기 방법은 기준과 비교하여 적어도 하나의 메틸화 부위가 메틸화되었는지 여부를 결정하는 단계를 포함하고(예컨대, 여기서 기준은 확인된 하나 이상의 인간 대상체의 개체군으로부터의 DNA이다), 메틸화는 (i) 대장암, (ii) 진행성 선종, 또는 (iii) 대장암 또는 진행성 선종(또는 둘 모두)의 표지이다.

이전 단락에서 구체적으로 언급된 다양한 구현예에서, 상기 방법은 표 2에 열거된 바와 같은 각각의 DMR 내에서 발견되는 적어도 하나의 메틸화 부위의 메틸화 상태를 결정하는 것을 포함한다.

이전 단락에서 구체적으로 언급된 다양한 구현예에서, 상기 방법은 표 3에 열거된 바와 같은 각각의 DMR 내에서 발견되는 적어도 하나의 메틸화 부위의 메틸화 상태를 결정하는 것을 포함한다.

이전 단락에서 구체적으로 언급된 다양한 구현예에서, 상기 방법은 표 4에 열거된 바와 같은 각각의 DMR 내에서 발견되는 적어도 하나의 메틸화 부위의 메틸화 상태를 결정하는 것을 포함한다.

이전 단락에서 구체적으로 언급된 다양한 구현예에서, 하나 이상의 DMR은 표 5에 열거된 올리고뉴클레오티드 프라이머 쌍에 의해 증폭된다.

이전 단락에서 구체적으로 언급된 다양한 구현예에서, 인간 대상체의 DNA는 인간 대상체의 조직(예컨대, 결장직장 조직, 예컨대 폴립, 선종), 혈액, 혈장, 소변, 타액 및 대변으로 이루어진 군으로부터 선택된 구성원으로부터 단리된다.

이전 단락에서 구체적으로 언급된 다양한 구현예에서, DNA는 인간 대상체의 무세포 DNA이다.

이전 단락에서 구체적으로 언급된 다양한 구현예에서, 대상체는 스크리닝 시점에 대장암 또는 진행성 선종(또는 둘 모두)에 대해 무증상이었다.

이전 단락에서 구체적으로 언급된 다양한 구현예에서, 대상체는 이전에 대장암 또는 진행성 선종(또는 둘 모두)에 대해 스크리닝되었다.

이전 단락에서 구체적으로 언급된 다양한 구현예에서, 대상체는 최근 10년 이내, 최근 5년 이내, 최근 4년 이내, 최근 3년 이내, 최근 2년 이내 또는 최근 1년 이내에 대장암 또는 진행성 선종(또는 둘 모두)에 대해 스크리닝된 적이 있다.

이전 단락에서 구체적으로 언급된 다양한 구현예에서, 대상체에서 진행성 선종 또는 대장암(또는 둘 모두)에 대한 이전 스크리닝은 대상체가 (i) 대장암, (ii) 진행성 선종, 또는 (iii) 진행성 선종 또는 대장암(또는 둘 모두)이 없는 것으로 진단된 것이다. 이에 대한 다양한 구현예에서 및 특히 이전 단락에서 언급된 바와 같이, 진행성 선종 또는 대장암(또는 둘 모두)에 대한 이전 스크리닝은 대상체가 (i) 대장암, (ii) 진행성 선종, 또는 (iii) 진행성 선종 또는 대장암(또는 둘 모두)이 없는 것으로 진단된 것이 1년 이내였다.

이전 단락에서 구체적으로 언급된 다양한 구현예에서, 진행성 선종 또는 대장암(또는 둘 모두)이 없는 것으로 대상체를 진단한 진행성 선종 또는 대장암(또는 둘 모두)에 대한 이전 스크리닝은 대장내시경 검사였다.

이전 단락에서 구체적으로 언급된 다양한 구현예에서, 상기 방법은 초기 대장암(예를 들어, 대장암이 병기 0, 병기 I, 병기 IIA, 병기 IIB 또는 병기 IIC 대장암임)의 진단을 포함한다.

이전 단락에서 구체적으로 언급된 다양한 구현예에서, 상기 방법은 암이 전이되지 않은 초기 대장암의 진단을 포함한다.

이전 단락에서 구체적으로 언급된 다양한 구현예에서, 메틸화 상태는 메틸화 민감성 제한 효소 정량적 중합효소 연쇄 반응(MSRE-qPCR), 메틸화-특이적 PCR(Methylation-Specific PCR), 메틸화-특이적 뉴클레아제-보조 소수 대립 유전자 농축 PCR(Methylation Specific Nuclease-assisted Minor-allele Enrichment PCR), 하이브리드 캡처 표적 차세대 시퀀싱(hybrid-capture targeted next-generation sequencing) 및 앰플리콘 기반 표적 차세대 시퀀싱(amplicon based targeted next-generation sequencing)으로 이루어진 군으로부터 선택된 하나 이상의 구성원을 사용하여 결정된다.

이전 단락에서 구체적으로 언급된 다양한 구현예에서, 메틸화 상태는 전체 게놈 중아황산염 시퀀싱을 사용하여 결정된다.

이전 단락에서 구체적으로 언급된 다양한 구현예에서, 방법은 시험관내 방법이다.

또 다른 양태에서, 본원은 (i) 대장암에 대한 스크리닝 또는 (ii) 진행성 선종에 대한 스크리닝, 또는 (iii) 대장암 또는 진행성 선종(또는 둘 모두)의 존재에 대한 스크리닝을 위한 메틸화 특이적 제한 효소 정량적 중합효소 연쇄 반응(MSRE-qPCR)의 방법을 제공하고, 상기 방법은 다음 단계를 포함한다: (a) 인간 대상체의 DNA를 하나 이상의 메틸화 특이적 제한 효소와 접촉시키는 단계; 및 (b) 효소-분해된 DNA, 또는 이의 앰플리콘의 qPCR을 수행하여 DNA의 하나 이상의 영역의 메틸화 상태를 결정하는 단계로, 여기서 DNA의 하나 이상의 영역 각각은 표 1의 하나 이상의 DMR의 적어도 일부를 포함하며, 각 부분은 적어도 10, 적어도 15, 적어도 20, 적어도 24, 적어도 30, 적어도 40, 적어도 50, 적어도 100, 적어도 150, 적어도 200, 적어도 250, 적어도 300, 적어도 350, 적어도 400, 적어도 500, 적어도 1000개 또는 그 이상의 길이의 염기쌍을 포함한다.

이전 단락에서 구체적으로 언급된 바와 같은 다양한 구현예에서, DNA 영역 중 하나 이상은 상응하는 올리고뉴클레오티드 프라이머 쌍(예컨대, 프라이머 쌍이 정방향 및 역방향 프라이머를 포함함)에 의해 증폭된다.

이전 단락에서 구체적으로 언급된 다양한 구현예에서, DNA의 하나 이상의 영역 각각은 적어도 1, 적어도 2, 적어도 3, 적어도 4, 적어도 5, 적어도 6, 적어도 7, 적어도 8, 적어도 9, 적어도 10, 적어도 11, 적어도 12, 적어도 13, 적어도 14, 적어도 15, 또는 그 이상의 메틸화 민감성 제한 부위를 포함한다.

이전 단락에서 구체적으로 언급된 다양한 구현예에서, 상응하는 올리고뉴클레오티드 프라이머 쌍은 표 5에 열거된 올리고뉴클레오티드 프라이머 쌍이다. 본원 및 이전 단락에서 구체적으로 언급된 바와 같은 다양한 구현예에서, 상응하는 올리고뉴클레오티드 프라이머 쌍의 정방향 프라이머는 표 5에 열거된 정방향 프라이머와 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 99%, 또는 적어도 99.5% 동일하다.

이전 단락에서 구체적으로 언급된 다양한 구현예에서, 상응하는 올리고뉴클레오티드 프라이머 쌍의 역방향 프라이머는 표 5에 나열된 역방향 프라이머와 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 99%, 또는 적어도 99.5% 동일하다.

이전 단락에서 구체적으로 언급된 다양한 구현예에서, DNA는 인간 대상체의 조직(예컨대, 결장직장 조직, 예컨대, 폴립, 선종), 혈액, 혈장, 소변, 타액, 및 대변으로 이루어진 군에서 선택되는 구성원으로부터 단리된다.

이전 단락에서 구체적으로 언급된 다양한 구현예에서, DNA는 인간 대상의 무세포 DNA이다.

이전 단락에서 구체적으로 언급된 다양한 구현예에서, 상기 방법은 적어도 0.67의 대장암을 검출하기 위한 민감도를 제공한다. 이 단락 및 이전 단락에서 구체적으로 언급된 다양한 구현예에서, 상기 방법은 적어도 0.78의 대장암을 검출하기 위한 민감도를 제공한다.

이전 단락에서 구체적으로 언급된 다양한 구현예에서, 상기 상기 방법은 적어도 0.48의 진행성 선종 및 대장암의 조합을 검출하기 위한 전체 민감도를 제공한다. 이 단락 및 이전 단락에서 구체적으로 언급된 다양한 구현예에서, 상기 방법은 적어도 0.53의 진행성 선종 및 대장암의 조합을 검출하기 위한 전체 민감도를 제공한다.

이전 단락에서 구체적으로 언급된 다양한 구현예에서, 상기 방법은 적어도 0.9의 특이도를 제공한다. 이 단락 및 이전 단락에서 구체적으로 언급된 다양한 구현예에서, 상기 방법은 적어도 0.93의 특이도를 제공한다.

이전 단락에서 구체적으로 언급된 다양한 구현예에서, DNA의 하나 이상의 영역은 표 2의 DMR 각각을 포함한다.

이전 단락에서 구체적으로 언급된 다양한 구현예에서, DNA의 하나 이상의 영역 각각은 표 2의 상응하는 DMR과 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 99%, 또는 적어도 99.5% 동일하거나 이를 포함한다.

이전 단락에서 구체적으로 언급된 다양한 구현예에서, DNA의 하나 이상의 영역은 표 3의 각각의 DMR을 포함한다.

이전 단락에서 구체적으로 언급된 다양한 구현예에서, DNA의 하나 이상의 영역 각각은 표 3의 상응하는 DMR과 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 99%, 또는 적어도 99.5% 동일하거나 이를 포함한다.

이전 단락에서 구체적으로 언급된 다양한 구현예에서, DNA의 하나 이상의 영역은 표 4의 DMR 각각을 포함한다.

이전 단락에서 구체적으로 언급된 다양한 구현예에서, DNA의 하나 이상의 영역 각각은 표 4의 상응하는 DMR과 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 99%, 또는 적어도 99.5% 동일하거나 이를 포함한다.

또 다른 양태에서, 본원은 (i) 대장암에 대한 스크리닝 또는 (ii) 진행성 선종에 대한 스크리닝, 또는 (iii) 대장암 또는 진행성 선종(또는 둘 모두)의 존재에 대한 스크리닝에 사용하기 위한 키트를 제공하며, 상기 키트는 다음을 포함한다: (a) 표 1의 하나 이상의 DMR의 적어도 일부를 증폭하도록 설계된 적어도 하나의 올리고뉴클레오티드 프라이머 쌍, 각 부분은 적어도 10, 적어도 15, 적어도 20, 적어도 24, 적어도 30, 적어도 40, 적어도 50, 적어도 100, 적어도 150, 적어도 200, 적어도 250, 적어도 300, 적어도 350, 적어도 400, 적어도 500, 적어도 1000개 또는 그 이상의 염기쌍 길이임; 및 (b) 적어도 하나의 메틸화 특이적 제한 효소 및/또는 중아황산염 시약.

이전 단락에서 구체적으로 언급된 다양한 구현예에서, 하나 이상의 DMR의 일부는 적어도 1, 적어도 2, 적어도 3, 적어도 4, 적어도 5, 적어도 6, 적어도 7, 적어도 8, 적어도 9, 적어도 10, 적어도 11, 적어도 12, 적어도 13, 적어도 14, 적어도 15, 또는 그 이상의 메틸화 민감성 제한 부위를 포함한다.

이전 단락에서 구체적으로 언급된 다양한 구현예에서, 올리고뉴클레오티드 프라이머 쌍은 표 2의 각 DMR의 증폭을 위한 올리고뉴클레오티드 프라이머 쌍을 포함한다.

이전 단락에서 구체적으로 언급된 다양한 구현예에서, 올리고뉴클레오티드 프라이머 쌍은 표 3의 각 DMR의 증폭을 위한 올리고뉴클레오티드 프라이머 쌍을 포함한다.

이전 단락에서 구체적으로 언급된 다양한 구현예에서, 올리고뉴클레오티드 프라이머 쌍은 표 4의 각 DMR의 증폭을 위한 올리고뉴클레오티드 프라이머 쌍을 포함한다.

이전 단락에서 구체적으로 언급된 다양한 구현예에서, 올리고뉴클레오티드 프라이머 쌍은 표 5의 적어도 하나의 올리고뉴클레오티드 프라이머 쌍을 포함한다.

이전 단락에서 구체적으로 언급된 다양한 구현예에서, 올리고뉴클레오티드 프라이머 쌍의 올리고뉴클레오티드 중 하나 이상은 표 5의 적어도 하나의 정방향 프라이머와 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 99%, 또는 적어도 99.5% 동일하거나 이를 포함한다.

이전 단락에서 구체적으로 언급된 다양한 구현예에서, 올리고뉴클레오티드 프라이머 쌍의 올리고뉴클레오티드 중 하나 이상은 표 5의 적어도 하나의 역방향 프라이머와 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 99%, 또는 적어도 99.5% 동일하거나 이를 포함한다.

이전 단락에서 구체적으로 언급된 다양한 구현예에서, 키트는 하나 이상의 메틸화 부위의 결정된 메틸화 상태(예컨대, 퍼센트 과메틸화, 과메틸화 비율)를 사용하여 다음 (i) 내지 (iv) 중 적어도 하나를 식별하는 것을 추가로 포함한다: (i) 인간 대상체에서 대장암의 존재; (ii) 인간 대상체에서 대장암에 대한 소인; (iii) 인간 대상체에서 대장암의 위험 증가, 및 (iv) 인간 대상체에서 대장암의 병기(stage).

이전 단락에서 구체적으로 언급된 다양한 구현예에서, 키트는 하나 이상의 메틸화 부위의 결정된 메틸화 상태(예컨대, 퍼센트 과메틸화, 과메틸화 비율)를 사용하여 다음 (i) 내지 (iv) 중 적어도 하나를 식별하는 것을 추가로 포함한다: (i) 인간 대상체에서 하나 이상의 진행성 선종의 존재; (ii) 인간 대상체의 진행성 선종에 대한 소인; (iii) 인간 대상체에서 진행성 선종의 위험 증가, 및 (iv) 인간 대상체에서 선종의 유형.

이전 단락에서 구체적으로 언급된 다양한 구현예에서, 키트는 하나 이상의 메틸화 부위의 결정된 메틸화 상태(예컨대, 퍼센트 과메틸화, 과메틸화 비율)를 사용하여 다음 (i) 내지 (iv) 중 적어도 하나를 식별하는 것을 추가로 포함한다: (i) 인간 대상체에서 대장암 또는 진행성 선종의 존재 또는 둘 모두의 존재; (ii) 인간 대상체에서 대장암 또는 진행성 선종 또는 둘 모두에 대한 소인; (iii) 인간 대상체에서 대장암 또는 진행성 선종 또는 둘 모두의 위험 증가, 및 (iv) 인간 대상체에서 대장암 또는 진행성 선종 또는 둘 모두의 병기.

이전 단락에서 구체적으로 언급된 다양한 구현예에서, 키트는 시험관내에서 사용된다.

또 다른 양태에서, 본원은 (i) 대장암에 대한 스크리닝 또는 (ii) 진행성 선종에 대한 스크리닝, 또는 (iii) 대장암 또는 진행성 선종(또는 둘 모두)의 존재에 대한 스크리닝을 위한 진단적 qPCR 반응을 제공하고, 진단적 qPCR 반응은 다음을 포함한다: (a) 인간 DNA; (b) 중합효소; 및 (c) 표 1의 하나 이상의 DMR의 적어도 일부를 증폭하도록 설계된 적어도 하나의 올리고뉴클레오티드 프라이머 쌍, 하나 이상의 DMR의 각 부분은 적어도 10, 적어도 15, 적어도 20, 적어도 24, 적어도 30, 적어도 40, 적어도 50, 적어도 100, 150, 200, 250, 300, 350, 400, 500, 1000 또는 그 이상의 염기쌍 길이를 가지고, 여기서 인간 DNA는 중아황산염 처리된 인간 DNA 또는 메틸화 특이적 제한 효소에 의해 분해된 인간 DNA이다.

이전 단락에서 구체적으로 언급된 다양한 구현예에서, 반응은 하나 이상의 메틸화 부위의 결정된 메틸화 상태(예컨대, 퍼센트 과메틸화, 과메틸화 비율)를 사용하여 다음 (i) 내지 (iv) 중 적어도 하나를 확인하는 것을 추가로 포함한다: (i) 인간 대상체에서 대장암의 존재; (ii) 인간 대상체에서 대장암에 대한 소인; (iii) 인간 대상체에서 대장암의 위험 증가, 및 (iv) 인간 대상체에서 대장암의 병기(stage).

이전 단락에서 구체적으로 언급된 다양한 구현예에서, 반응은 하나 이상의 메틸화 부위의 결정된 메틸화 상태(예컨대, 퍼센트 과메틸화, 과메틸화 비율)를 사용하여 다음 (i) 내지 (iv) 중 적어도 하나를 확인하는 것을 추가로 포함한다: (i) 인간 대상체에서 하나 이상의 진행성 선종의 존재; (ii) 인간 대상체의 진행성 선종에 대한 소인; (iii) 인간 대상체에서 진행성 선종의 위험 증가, 및 (iv) 인간 대상체에서 선종의 유형.

이전 단락에서 구체적으로 언급된 다양한 구현예에서, 반응은 하나 이상의 메틸화 부위의 결정된 메틸화 상태(예컨대, 퍼센트 과메틸화, 과메틸화 비율)를 사용하여 다음 (i) 내지 (iv) 중 적어도 하나를 확인하는 것을 추가로 포함한다: (i) 인간 대상체에서 대장암 또는 진행성 선종의 존재 또는 둘 모두의 존재; (ii) 인간 대상체에서 대장암 또는 진행성 선종 또는 둘 모두에 대한 소인; (iii) 인간 대상체에서 대장암 또는 진행성 선종 또는 둘 모두의 위험 증가, 및 (iv) 인간 대상체에서 대장암 또는 진행성 선종 또는 둘 모두의 병기.

이전 단락에서 구체적으로 언급된 다양한 구현예에서, 반응은 시험관내에서 수행된다.

또 다른 양태에서, 본원은 (i) 대장암에 대한 스크리닝 또는 (ii) 진행성 선종에 대한 스크리닝, 또는 (iii) 대장암 또는 진행성 선종(또는 둘 모두)의 존재에 대한 스크리닝 방법을 제공하며, 상기 방법은 다음을 포함한다: 하나 이상의 차등적 메틸화 영역(DMR)의 메틸화 상태를 결정하는 단계로, 각각의 상기 하나 이상의 DMR은 PAX7, NTNG1, SYT6, LINC01248, KCNK3, GALNT14, CHST10, THSD7B, UNC80, EPHA6, MED12L, ADGRL3, RNF150, SPOCK3, GPM6A, HELT, GFPT2, HSPA1L, HSPA1A, NKAIN2, TMEM178B, DPP6, MICU3, ALKAL1, LOC401463, BHLHE22, RIMS2, LOC105375690, SLC25A32, DMRT1, CDKN2A, CDKN2B-AS1, PAX5, C1QL3, MYO3A, LOC101929073, GAD2, MYO3A, FOXI2, LOC105369438, AMOTL1, LOC101928847, NCAM1, DSCAML1, PTPRO, RERG, DPY19L2, CUX2, PCDH9, MIR4500HG, SLITRK5, SLC8A3, LOC646548, GATM, PIF1, RASGRF1, VAC14, VAT1L, JPH3, SLFN13, ZACN, SRP68, GALR2, ADCYAP1, CDH2, DOK6, ZNF461, ZNF829, ZNF568, ZNF540, ZNF571-AS1, CIC, ZNF582-AS1, ZNF582, ZNF471, ZNF264, ZNF671, ZNF551, ZNF776, NKX2-2, ADAMTS1, TIAM1, 및 OLIG1로 이루어진 군에서 선택되는 하나 이상의 유전자를 포함하거나 이와 중첩되는, 단계; 상기 하나 이상의 DMR 각각의 결정된 메틸화 상태를 입력으로 사용하여 분류 모델을 적용하는 단계; 및 모델로부터 인간 대상체의 대장암의 예측된 상태 또는 진행성 선종의 예측된 상태 또는 대장암 또는 진행성 선종의 예측된 상태를 출력하는 단계(예컨대, 후자는 대장암 및 진행성 선종 중 하나 또는 둘 모두를 갖는 상태를 의미함).

이전 단락에서 구체적으로 언급된 다양한 구현예에서, 상기 방법은 유전자 GAD2, MYO3A 및 ALKAL1 각각을 적어도 포함하거나 이와 중첩되는 하나 이상의 DMR의 메틸화 상태를 결정하는 것을 포함한다.

이전 단락에서 구체적으로 언급된 다양한 구현예에서, 상기 유전자 GAD2, MYO3A, ALKAL1, RASGRF1, MICU3, RASGRF1, FOXI2, C1QL3, CDKN2A, 및CDKN2B-AS1 각각을 적어도 포함하거나 이와 중첩되는 하나 이상의 DMR의 메틸화 상태를 결정하는 것을 포함한다.

이전 단락에서 구체적으로 언급된 다양한 구현예에서, 방법은 유전자 GAD2, MYO3A, ALKAL1, RASGRF1, MICU3, RASGRF1, FOXI2, C1QL3, CDKN2A, CDKN2B-AS1, SYT6, SLFN13, GPM6A, THSD7B, ZBF582-AS1, ZNF582, GATM, ZNF540, ZNF571-AS1, OLIG1, EPHA6, DPY19L2, SLC8A3, LOC646548, LOC101929073, UNC80, DPP6, ZNF568, JPH3, ZNF461, NTNG1, ADGRL3, ADAMST1, CDH2, LINC01248, PTPRO, RERG, SLC8A3, LOC646548, PAX5, GFPT2 각각을 적어도 포함하거나 이와 중첩되는 하나 이상의 DMR의 메틸화 상태를 결정하는 것을 포함한다.

이전 단락에서 구체적으로 언급된 다양한 구현예, 분류 모델은 서포트 벡터 머신(support-vector machine, SVM) 알고리즘 기반 분류 모델이다.

또 다른 양태에서, 본원은 (i) 대장암에 대한 스크리닝 또는 (ii) 진행성 선종에 대한 스크리닝, 또는 (iii) 대장암 또는 진행성 선종(또는 둘 모두)의 존재에 대한 스크리닝 방법을 제공하며, 상기 방법은 다음을 포함한다: 상기 하나 이상의 차등적 메틸화 영역(DMR) 메틸화 상태를 결정하는 단계로서, 상기 하나 이상의 DMR 각각은 SEQ ID NO. 190, SEQ ID NO. 191, SEQ ID NO. 192, SEQ ID NO. 193, SEQ ID NO. 194, SEQ ID NO. 195, SEQ ID NO. 196, SEQ ID NO. 197, SEQ ID NO. 198, SEQ ID NO. 199, SEQ ID NO. 200, SEQ ID NO. 201, SEQ ID NO. 202, SEQ ID NO. 203, SEQ ID NO. 204, SEQ ID NO. 205, SEQ ID NO. 206, SEQ ID NO. 207, SEQ ID NO. 208, SEQ ID NO. 209, SEQ ID NO. 210, SEQ ID NO. 211, SEQ ID NO. 212, SEQ ID NO. 213, SEQ ID NO. 214, SEQ ID NO. 215, SEQ ID NO. 216, SEQ ID NO. 217, SEQ ID NO. 218, SEQ ID NO. 219, SEQ ID NO. 220, SEQ ID NO. 221, SEQ ID NO. 222, SEQ ID NO. 223, SEQ ID NO. 224, SEQ ID NO. 225, SEQ ID NO. 226, SEQ ID NO. 227, SEQ ID NO. 228, 및 SEQ ID NO. 229 로 이루어진 군에서 선택되는 적어도 하나의 서열과 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 99% 서열 동일성을 갖거나 이를 포함하는, 단계; 상기 하나 이상의 DMR 각각의 결정된 메틸화 상태를 입력으로 사용하여 분류 모델을 적용하는 단계; 및 모델로부터 인간 대상체의 (i) 대장암의 예측된 상태 또는 (ii) 진행성 선종의 예측된 상태 또는 (iii) 대장암 또는 진행성 선종의 예측된 상태를 출력하는 단계(예컨대, 후자는 대장암 및 진행성 선종 중 하나 또는 둘 모두를 갖는 상태를 의미함).

이전 단락에서 구체적으로 언급된 다양한 구현예에서, 방법은 3개 이상의 차등적 메틸화 영역(DMR)의 메틸화 상태를 결정하는 단계를 포함한다.

이전 단락에서 구체적으로 언급된 다양한 구현예에서, 방법은 10개 이상의 차등적 메틸화 영역(DMR)의 메틸화 상태를 결정하는 단계를 포함한다.

이전 단락에서 구체적으로 언급된 다양한 구현예에서, 방법은 40개의 차등적 메틸화 영역(DMR)의 메틸화 상태를 결정하는 단계를 포함한다.

이전 단락에서 구체적으로 언급된 다양한 실시예에서, 분류 모델은 서포트 벡터 머신(support-vector machine, SVM) 알고리즘 기반 분류 모델이다.

또 다른 양태에서, 본원은 (i) 대장암에 대한 스크리닝 또는 (ii) 진행성 선종에 대한 스크리닝, 또는 (iii) 대장암 또는 진행성 선종(또는 둘 모두)의 존재에 대한 스크리닝 방법을 제공하며, 상기 방법은 다음을 포함한다: 표 1 또는 표 7에 열거된 인간 대상체의 DNA의 차등적 메틸화 영역(DMR) 내에서 발견되는 적어도 하나의 메틸화 부위의 메틸화 상태를 결정하는 단계; 컴퓨팅 장치의 프로세서에 의해, 적어도 하나의 메틸화 부위의 메틸화 상태에 기초하여 인간 대상체의 DNA의 차등적 메틸화 영역(DMR)의 메틸화 상태를 결정하는 단계; 및 프로세서에 의해, 분류 모델을 사용하여 인간 대상체의 (i) 대장암의 예측된 상태, (ii) 진행성 선종의 예측된 상태, 또는 (iii) 대장암 또는 진행성 선종의 예측된 상태를 출력하는 단계(예컨대, 후자는 대장암 및 진행성 선종 중 하나 또는 둘 모두를 갖는 상태를 의미함).

이전 단락에서 구체적으로 언급된 다양한 구현예에서, 상기 방법은 표 1 또는 표 7에 열거된 하나 이상의 DMR 각각에 대해 DMR 내에서 발견되는 적어도 4개의 메틸화 부위의 메틸화 상태를 결정하는 단계를 포함한다.

이전 단락에서 구체적으로 언급된 다양한 구현예에서, 상기 방법은 표 1 또는 표 7에 열거된 하나 이상의 DMR 각각에 대해 DMR 내에서 발견되는 적어도 5개의 메틸화 부위의 메틸화 상태를 결정하는 단계를 포함한다.

이전 단락에서 구체적으로 언급된 다양한 구현예에서, 상기 방법은 표 1 또는 표 7에 열거된 3개 이상의 DMR 각각에 대해 DMR 내에서 발견되는 적어도 하나의 메틸화 부위의 메틸화 상태를 결정하는 단계를 포함한다.

이전 단락에서 구체적으로 언급된 다양한 구현예에서, 상기 방법은 표 1 또는 표 7에 열거된 3개 이상의 DMR 각각에 대해 DMR 내에서 발견되는 적어도 3개의 메틸화 부위의 메틸화 상태를 결정하는 단계를 포함한다.

이전 단락에서 구체적으로 언급된 다양한 구현예에서, 상기 방법은 표 1 또는 표 7에 열거된 3개 이상의 DMR 각각에 대해 DMR 내에서 발견되는 적어도 4개의 메틸화 부위의 메틸화 상태를 결정하는 단계를 포함한다.

이전 단락에서 구체적으로 언급된 다양한 구현예에서, 상기 방법은 표 1 또는 표 7에 열거된 3개 이상의 DMR 각각에 대해 DMR 내에서 발견되는 적어도 5개의 메틸화 부위의 메틸화 상태를 결정하는 단계를 포함한다.

이전 단락에서 구체적으로 언급된 다양한 구현예에서, 상기 방법은 표 1 또는 표 7에 열거된 10개 이상의 DMR 각각에 대해 DMR 내에서 발견되는 적어도 하나의 메틸화 부위의 메틸화 상태를 결정하는 단계를 포함한다.

이전 단락에서 구체적으로 언급된 다양한 구현예에서, 상기 방법은 표 1 또는 표 7에 열거된 10개 이상의 DMR 각각에 대해 DMR 내에서 발견되는 적어도 3개의 메틸화 부위의 메틸화 상태를 결정하는 단계를 포함한다.

이전 단락에서 구체적으로 언급된 다양한 구현예에서, 상기 방법은 표 1 또는 표 7에 열거된 10개 이상의 DMR 각각에 대해 DMR 내에서 발견되는 적어도 4개의 메틸화 부위의 메틸화 상태를 결정하는 단계를 포함한다.

이전 단락에서 구체적으로 언급된 다양한 구현예에서, 상기 방법은 표 1 또는 표 7에 열거된 10개 이상의 DMR 각각에 대해 DMR 내에서 발견되는 적어도 5개의 메틸화 부위의 메틸화 상태를 결정하는 단계를 포함한다.

이전 단락에서 구체적으로 언급된 다양한 구현예에서, 상기 방법은 표 1에 열거된 35개 이상의 DMR 각각에 대해 DMR 내에서 발견되는 적어도 3개의 메틸화 부위의 메틸화 상태를 결정하는 단계를 포함한다.

이전 단락에서 구체적으로 언급된 다양한 구현예에서, 상기 방법은 표 1에 열거된 35개 이상의 DMR 각각에 대해 DMR 내에서 발견되는 적어도 5개의 메틸화 부위의 메틸화 상태를 결정하는 단계를 포함한다.

이전 단락에서 구체적으로 언급된 다양한 구현예에서, 상기 방법은 표 7에 열거된 40개 이상의 DMR 각각에 대해 DMR 내에서 발견되는 적어도 3개의 메틸화 부위의 메틸화 상태를 결정하는 단계를 포함한다.

이전 단락에서 구체적으로 언급된 다양한 구현예에서, 상기 방법은 표 7에 열거된 40개 이상의 DMR 각각에 대해 DMR 내에서 발견되는 적어도 4개의 메틸화 부위의 메틸화 상태를 결정하는 단계를 포함한다.

이전 단락에서 구체적으로 언급된 다양한 구현예에서, 상기 방법은 표 7에 열거된 40개 이상의 DMR 각각에 대해 DMR 내에서 발견되는 적어도 5개의 메틸화 부위의 메틸화 상태를 결정하는 단계를 포함한다.

이전 단락에서 구체적으로 언급된 다양한 구현예에서, DMR은 적어도 1, 적어도 2, 적어도 3, 적어도 4, 적어도 5, 적어도 6, 적어도 7, 적어도 8, 적어도 9, 적어도 10, 적어도 11, 적어도 12, 적어도 13, 적어도 14, 적어도 15, 또는 그 이상의 메틸화 민감성 제한 부위를 포함한다.

이전 단락에서 구체적으로 언급된 다양한 구현예에서, 상기 방법은 프로세서에 의해 기준(예컨대, 여기서 기준이 하나 이상의 진행성 선종 또는 대장암을 앓지 않는 것으로 확인된 인간 대상체 개체군으로부터의 DNA임)과 비교하여 적어도 하나의 메틸화 부위가 메틸화되었는지 여부를 결정하는 단계를 포함하고, 여기서 메틸화는 (i) 대장암, (ii) 진행성 선종, 또는 (iii) 대장암 또는 진행성 선종(또는 둘 모두)의 지표이다.

이전 단락에서 구체적으로 언급된 다양한 구현예에서, 상기 방법은 표 2에 열거된 바와 같은 각각의 DMR 내에서 발견되는 적어도 하나의 메틸화 부위의 메틸화 상태를 결정하는 단계를 포함한다.

이전 단락에서 구체적으로 언급된 다양한 구현예에서, 상기 방법은 표 3에 열거된 바와 같은 각각의 DMR 내에서 발견되는 적어도 하나의 메틸화 부위의 메틸화 상태를 결정하는 단계를 포함한다.

이전 단락에서 구체적으로 언급된 다양한 구현예에서, 상기 방법은 프로세서에 의해, 표 4에 열거된 바와 같은 DMR 각각 내에서 발견되는 적어도 하나의 메틸화 부위의 메틸화 상태를 결정하는 단계를 포함한다.

이전 단락에서 구체적으로 언급된 다양한 구현예에서, DMR은 표 5에 열거된 바와 같은 올리고뉴클레오티드 프라이머 쌍에 의해 증폭된다.

이전 단락에서 구체적으로 언급된 다양한 구현예에서, 인간 대상체의 DNA는 인간 대상체의 조직(예를 들어, 결장직장 조직, 예컨대, 폴립, 선종), 혈액, 혈장, 소변, 타액 및 대변으로 이루어진 군으로부터 선택된 구성원으로부터 단리된다.

이전 단락에서 구체적으로 언급된 다양한 구현예에서, 대상체는 이전에 대장암 또는 진행성 선종(또는 둘 모두)에 대해 스크리닝되었다. 현재 또는 이전 단락에서 구체적으로 언급된 다양한 구현예에서, 대상체는 최근 10년 이내, 최근 5년 이내, 최근 4년 이내, 최근 3년 이내, 최근 2년 이내 또는 최근 1년 이내에 대장암 또는 진행성 선종(또는 둘 모두)에 대하여 스크리닝 되었다.

이전 단락에서 구체적으로 언급된 다양한 구현예에서, 대상체에서 진행성 선종 또는 대장암(또는 둘 모두)에 대한 이전 스크리닝은 대상체가 (i) 대장암, (ii) 진행성 선종, 또는 (iii) 진행성 선종 또는 대장암(또는 둘 모두)을 가지지 않는 것으로 진단되었다. 현재 또는 이전 단락에서 구체적으로 언급된 다양한 구현예에서, 대상체가 (i) 대장암, (ii) 진행성 선종, 또는 (iii) 진행성 선종 또는 대장암(또는 둘 모두)을 가지지 않는 것으로 진단된 것이 1년 이내였다.

이전 단락에서 구체적으로 언급된 다양한 구현예에서, 진행성 선종 또는 대장암(또는 둘 모두)을 가지지 않는 것으로 대상체를 진단한 진행성 선종 또는 대장암(또는 둘 모두)에 대한 이전 스크리닝은 대장내시경 검사였다.

이전 단락에서 구체적으로 언급된 다양한 구현예에서, 상기 방법은 프로세서에 의해, 초기 대장암(예컨대, 상기 대장암은 병기 0, 병기 I, 병기 IIA, 병기 IIB, 또는 병기 IIC 대장암)의 존재를 식별하는 것을 포함한다.

이전 단락에서 구체적으로 언급된 다양한 구현예에서, 상기 방법은 프로세서에 의해, 암이 전이되지 않은 초기 대장암의 존재를 식별하는 것을 포함한다.

이전 단락에서 구체적으로 언급된 다양한 구현예에서, 메틸화 상태는 메틸화 민감성 제한 효소 정량적 중합효소 연쇄 반응(MSRE-qPCR), 메틸화-특이적 PCR, 메틸화-특이적 뉴클레아제-보조 마이너 대립유전자 농축 PCR, 하이브리드 캡처 표적 차세대 시퀀싱 및 앰플리콘 기반 표적 차세대 시퀀싱으로 이루어진 군으로부터 선택된 하나 이상의 구성원을 사용하여 결정된다.

이전 단락에서 구체적으로 언급된 다양한 실시예에서, 분류 모델은 서포트 벡터 머신(support-vector machine, SVM) 기반 분류 모델이다.

또 다른 양태에서, 본원은 (i) 대장암에 대한 스크리닝 또는 (ii) 진행성 선종에 대한 스크리닝, 또는 (iii) 대장암 또는 진행성 선종(또는 둘 모두)의 존재에 대한 스크리닝을 위한 메틸화 특이적 제한 효소 정량적 중합효소 연쇄 반응(MSRE-qPCR) 방법을 제공하며, 상기 방법은 다음을 포함한다: (a) 인간 대상체의 DNA를 하나 이상의 메틸화 특이적 제한 효소와 접촉시키는 단계; (b) DNA의 하나 이상의 영역의 메틸화 상태를 결정하기 위해, 효소-분해된 DNA 또는 이의 앰플리콘의 qPCR을 수행하는 단계로서, DNA의 하나 이상의 영역 각각은 표 1의 하나 이상의 DMR의 적어도 일 부분을 포함하고, 각 부분은 적어도 10, 적어도 15, 적어도 20, 적어도 24, 적어도 30, 적어도 40, 적어도 50, 적어도 100, 적어도 150, 적어도 200, 적어도 250, 적어도 300, 적어도 350, 적어도 400, 적어도 500, 적어도 1000개, 또는 그 이상의 염기쌍 길이이고; (c) 컴퓨팅 장치의 프로세서에 의해, DNA의 하나 이상의 영역의 결정된 메틸화 상태에 분류 모델을 적용하는 단계; 및 (d) 프로세서에 의해, 적용된 분류 모델에 기반하여 인간 대상체의 대장암의 예측된 상태, 진행성 선종의 예측된 상태, 또는 대장암 또는 진행성 선종의 예측된 상태(예컨대, 후자는 대장암 및 진행성 선종 중 하나 또는 둘 모두를 갖는 상태를 의미함)를 결정하는 단계.

이전 단락에서 구체적으로 언급된 다양한 구현예에서, 하나 이상의 DNA 영역 중 적어도 하나는 상응하는 올리고뉴클레오티드 프라이머 쌍(예컨대, 프라이머 쌍은 정방향 및 역방향 프라이머를 포함함)에 의해 증폭된다.

이전 단락에서 구체적으로 언급된 다양한 구현예에서, 상응하는 올리고뉴클레오티드 프라이머 쌍은 표 5에 열거된 올리고뉴클레오티드 프라이머 쌍이다.

이전 단락에서 구체적으로 언급된 다양한 구현예에서, 상응하는 올리고뉴클레오티드 프라이머 쌍의 정방향 프라이머는 표 5에 나열된 정방향 프라이머와 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 99%, 또는 적어도 99.5% 동일하다.

이전 단락에서 구체적으로 언급된 다양한 구현예에서, 상기 방법은 적어도 0.67의 대장암을 검출하기 위한 민감도를 제공한다. 이 단락 또는 이전 단락에서 구체적으로 언급된 다양한 구현예에서, 상기 방법은 적어도 0.78의 대장암을 검출하기 위한 민감도를 제공한다.

이전 단락에서 구체적으로 언급된 다양한 구현예에서, 상기 상기 방법은 적어도 0.48의 진행성 선종 및 대장암의 조합을 검출하기 위한 전체 민감도를 제공한다. 이 단락 또는 이전 단락에서 구체적으로 언급된 다양한 구현예에서, 상기 방법은 적어도 0.53의 진행성 선종 및 대장암의 조합을 검출하기 위한 전체 민감도를 제공한다.

이전 단락에서 구체적으로 언급된 다양한 구현예에서, 상기 방법은 적어도 0.9의 특이도를 제공한다. 이 단락 또는 이전 단락에서 구체적으로 언급된 다양한 구현예에서, 상기 방법은 적어도 0.93의 특이도를 제공한다.

또 다른 양태에서, 본원은 (i) 대장암에 대한 스크리닝 또는 (ii) 진행성 선종에 대한 스크리닝, 또는 (iii) 대장암 또는 진행성 선종(또는 둘 모두)의 존재에 대한 스크리닝 방법을 제공하며, 상기 방법은 다음을 포함한다: 하나 이상의 차등적 메틸화 영역(DMR)의 메틸화 상태를 결정하는 단계로, 각각의 상기 하나 이상의 DMR은 PAX7, NTNG1, SYT6, LINC01248, KCNK3, GALNT14, CHST10, THSD7B, UNC80, EPHA6, MED12L, ADGRL3, RNF150, SPOCK3, GPM6A, HELT, GFPT2, HSPA1L, HSPA1A, NKAIN2, TMEM178B, DPP6, MICU3, ALKAL1, LOC401463, BHLHE22, RIMS2, LOC105375690, SLC25A32, DMRT1, CDKN2A, CDKN2B-AS1, PAX5, C1QL3, MYO3A, LOC101929073, GAD2, MYO3A, FOXI2, LOC105369438, AMOTL1, LOC101928847, NCAM1, DSCAML1, PTPRO, RERG, DPY19L2, CUX2, PCDH9, MIR4500HG, SLITRK5, SLC8A3, LOC646548, GATM, PIF1, RASGRF1, VAC14, VAT1L, JPH3, SLFN13, ZACN, SRP68, GALR2, ADCYAP1, CDH2, DOK6, ZNF461, ZNF829, ZNF568, ZNF540, ZNF571-AS1, CIC, ZNF582-AS1, ZNF582, ZNF471, ZNF264, ZNF671, ZNF551, ZNF776, NKX2-2, ADAMTS1, TIAM1, 및 OLIG1로 이루어진 군에서 선택되는 하나 이상의 유전자를 포함하거나 이와 중첩되는, 단계; 프로세서에 의하여, 상기 하나 이상의 DMR 각각의 결정된 메틸화 상태를 입력으로 사용하여 분류 모델을 적용하는 단계; 및 프로세서에 의하여, 모델로부터 인간 대상체의 (i) 대장암의 예측된 상태, (ii) 진행성 선종의 예측된 상태, 또는 (ii) 대장암 또는 진행성 선종의 예측된 상태(예컨대, 후자는 대장암 및 진행성 선종 중 하나 또는 둘 모두를 갖는 상태를 의미함)를 출력하는 단계.

이전 단락에서 구체적으로 언급된 다양한 구현예에서, 상기 유전자 GAD2, MYO3A, ALKAL1, RASGRF1, MICU3, RASGRF1, FOXI2, C1QL3, CDKN2A, 및 CDKN2B-AS1 각각을 적어도 포함하거나 이와 중첩되는 하나 이상의 DMR의 메틸화 상태를 결정하는 것을 포함한다.

또 다른 양태에서, 본원은 (i) 대장암에 대한 스크리닝 또는 (ii) 진행성 선종에 대한 스크리닝, 또는 (iii) 대장암 또는 진행성 선종(또는 둘 모두)의 존재에 대한 스크리닝 방법을 제공하며, 상기 방법은 다음을 포함한다: 상기 하나 이상의 차등적 메틸화 영역(DMR) 메틸화 상태를 결정(예컨대, 컴퓨팅 장치의 프로세서에 의하여)하는 단계로서, 상기 하나 이상의 DMR 각각은 SEQ ID NO. 190, SEQ ID NO. 191, SEQ ID NO. 192, SEQ ID NO. 193, SEQ ID NO. 194, SEQ ID NO. 195, SEQ ID NO. 196, SEQ ID NO. 197, SEQ ID NO. 198, SEQ ID NO. 199, SEQ ID NO. 200, SEQ ID NO. 201, SEQ ID NO. 202, SEQ ID NO. 203, SEQ ID NO. 204, SEQ ID NO. 205, SEQ ID NO. 206, SEQ ID NO. 207, SEQ ID NO. 208, SEQ ID NO. 209, SEQ ID NO. 210, SEQ ID NO. 211, SEQ ID NO. 212, SEQ ID NO. 213, SEQ ID NO. 214, SEQ ID NO. 215, SEQ ID NO. 216, SEQ ID NO. 217, SEQ ID NO. 218, SEQ ID NO. 219, SEQ ID NO. 220, SEQ ID NO. 221, SEQ ID NO. 222, SEQ ID NO. 223, SEQ ID NO. 224, SEQ ID NO. 225, SEQ ID NO. 226, SEQ ID NO. 227, SEQ ID NO. 228, 및 SEQ ID NO. 229 로 이루어진 군에서 선택되는 적어도 하나의 서열과 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 99% 서열 동일성을 갖거나 이를 포함하는, 단계; 프로세서에 의하여, 상기 하나 이상의 DMR 각각의 결정된 메틸화 상태를 입력으로 사용하여 분류 모델을 적용하는 단계; 및 프로세서에 의하여, 모델로부터 인간 대상체의 (i) 대장암의 예측된 상태, (ii) 진행성 선종의 예측된 상태 또는 (iii) 대장암 또는 진행성 선종의 예측된 상태를 출력하는 단계(예컨대, 후자는 대장암 및 진행성 선종 중 하나 또는 둘 모두를 갖는 상태를 의미함).

다양한 양태에서, 본 발명의 방법 및 조성물은, 예컨대 그 전체가 본원에 참고로 포함되는 미국 특허 제10,006,925호에 개시된 바와 같은, 당업계에 공지된 바이오마커와 조합하여 사용될 수 있다.

또 다른 양태에서, 본 발명은 (i) 대장암에 대한 스크리닝 또는 (ii) 진행성 선종에 대한 스크리닝, 또는 (iii) 대장암 또는 진행성 선종(또는 둘 모두)의 존재에 대한 스크리닝을 위한 하나 이상의 차등적 메틸화 영역을 식별하는 방법에 관하며, 여기서 상기 방법은 다음을 포함한다: 전체 게놈 중아황산염 시퀀싱을 사용하여 (i) 대장암, (ii) 진행성 선종, 또는 (iii) 대장암 또는 진행성 선종(또는 둘 모두)를 가진 것으로 진단된 대상체(예컨대 적어도 10, 적어도 20, 적어도 50, 적어도 100, 또는 그 이상)의 제1 개체군의 게놈의 DNA를 시퀀싱하는 단계; 제1 개체군의 게놈 각각을 기준(reference) 게놈과 정렬하는 단계(예컨대, 기준 게놈은 GRCh38임); (예컨대, 생물정보학 도구, 예컨대, MethylKit을 사용하여) 복수의 메틸화된 대장암 및/또는 진행성 선종 부위를 식별하는 단계로, 여기서 복수의 메틸화된 대장암 및/또는 진행성 선종 부위 각각은 기준 개체군(예컨대, 건강한 대상체를 포함하는 개체군)의 상응하는 부위에 대한 제1 개체군의 차등적 메틸화 부위이고(예컨대, 기준 개체군에 대한 제1 개체군의 DNA의 메틸화 백분율의 차이는 적어도 5%, 적어도 10%, 적어도 15% 또는 그 이상); 복수의 차등적 메틸화 영역(DMR)을 포함하는 목록을 생성하는 단계로, 복수의 차등적 메틸화 영역(DMR) 각각은 복수의 식별된 메틸화된 대장암 및/또는 진행성 선종 암 부위 중 하나 이상을 포함하고(예컨대, 여기서 메틸화된 대장암 및/또는 진행성 선종 암 부위는 메틸화된 CpG 영역이거나 이를 포함함)(예컨대, 여기서 DMR은 200개 염기쌍의 CpG 사이의 최대 거리를 갖는 적어도 3개의 메틸화된 CpG 영역을 포함함); 제1 개체군의 복수의 DMR 각각의 메틸화 상태(예컨대어, 메틸화 백분율, 메틸화된 부위의 수)를 결정하는 단계; 복수의 DMR 각각의 메틸화 상태에 적어도 부분적으로 기초하여 복수의 DMR을 순위화하는 단계; 및 대장암 및/또는 진행성 선종의 진단을 위한 복수의 DMR로부터 후보 DMR의 세트를 필터링하는 단계(예컨대, 적어도 5개의 CPG 영역을 포함하는 DMR에 대한 필터링)(예컨대, 제1 대상 그룹과 기준 모집단 사이의 최소 메틸화 백분율 차이는 적어도 5%, 적어도 6%, 적어도 7%, 적어도 8%, 적어도 9%, 적어도 10%, 적어도 15% 또는 그 이상임).

이전 단락에서 구체적으로 언급된 다양한 구현예에서, 방법은 복수의 DMR 각각 내에서 하나 이상의 CpG 영역을 식별하는 단계; 제1 집단에 대한 복수의 DMR 각각 내에서 식별된 CpG 영역 각각의 메틸화 상태(예를 들어, 메틸화 백분율, 메틸화 부위의 수)를 결정하는 단계; 및 DMR의 하나 이상의 CpG 영역 각각의 결정된 메틸화 상태에 적어도 부분적으로 기초하여 복수의 DMR을 순위화하는 단계를 포함한다.

이전 단락에서 구체적으로 언급된 특정 구현예에서, 방법은 다음을 추가로 포함한다: 기준 개체군에 대한 복수의 DMR 각각의 메틸화 상태를 결정하는 단계; 기준 개체군의 복수의 DMR 각각의 결정된 메틸화 상태를 제1 개체군의 상응하는 DMR의 메틸화 상태와 비교(예컨대, 메틸화 백분율을 비교)하는 단계; 및 비교에 적어도 부분적으로 기초하여 복수의 DMR을 순위화하는 단계를 포함한다.

이전 단락에서 구체적으로 언급된 특정 구현예에서, 제1 개체군의 DNA는 제1 개체군의 각 인간 대상체의 조직(예컨대, 결장직장 조직, 예를 들어, 폴립, 선종)으로부터 단리된다.

이전 단락에서 구체적으로 언급된 특정 구현예에서, 제1 개체군의 DNA는 제1 개체군의 각 인간 대상체의 혈액, 혈장, 소변, 타액 또는 대변으로부터 단리된다.

다른 양태에서, 본 발명은 이전 단락에서 언급된 임의의 방법을 수행하기 위한 시스템에 관한 것으로, 시스템은 프로세서; 및 프로세서에 의해 실행될 때, 프로세서로 하여금 상기 방법의 하나 이상 (최대 모든) 단계를 수행하게 하는 명령을 갖는 메모리를 포함한다.

정의

A 또는 An: 관사 "a" 및 "an"은 본 명세서에서 관사의 문법적 대상 중 하나 또는 둘 이상(즉, 적어도 하나)을 지칭하는 데 사용된다. 예로서, "an element"는 하나의 요소 또는 하나 이상의 요소를 지칭한다.

약: 용어 "약"은 값과 관련하여 본 명세서에서 사용될 때, 문맥상 참조된 값과 유사한 값을 지칭한다. 일반적으로, 문맥에 친숙한 당업자는 그 문맥에서 "약"에 의해 포함되는 적절한 정도의 변동을 이해할 것이다. 예를 들어, 일부 구현예에서, 예컨대 본원에 개시된, 용어 "약"은 25%, 20%, 19%, 18%, 17%, 16%, 15%, 14%, 13%, 12%, 참조 값의 11%, 10%, 9%, 8%, 7%, 6%, 5%, 4%, 3%, 2%, 1% 또는 지칭된 값의 백분율의 일부이다.

진행성 선종: 본 명세서에 사용된 용어 "진행성 선종"은 양성(비암성) 세포성 성장인 결장 및 직장의 선종성 용종(선종)을 지칭하기 위해 사용된다. 진행성 선종은 다음 특징 중 하나 이상을 갖는 결장 선종성 선종이다: ≥1 cm 크기; 관상융모상(tubulovillous) 또는 융모상(villous) 선종; 고도 이형성증; 및 이형성증이 있는 거치상(serrated) 선종. 특정 예에서, 예컨대어, 본원에 기재된 바와 같이, 진행성 선종은 또한 "고위험성" 선종으로 분류될 수 있다.

투여: 본 명세서에 사용된 용어 "투여"는 일반적으로 예를 들어 조성물에 포함되거나 조성물에 의해 전달되는 제제의 전달을 달성하기 위해 대상체 또는 시스템에 조성물을 투여하는 것을 지칭한다.

제제: 본 명세서에 사용된 용어 "제제(agent)"는 개체(예컨대, 소분자, 펩티드, 폴리펩티드, 핵산, 지질, 다당류, 복합체, 조합물, 혼합물, 시스템, 또는 열, 전류, 전기장, 자력, 자기장 등과 같은 현상)를 지칭한다.

개선: 본 명세서에 사용된 용어 "개선(amelioration)"은 대상체 상태의 예방, 감소, 완화 또는 향상을 지칭한다. 개선에는 질환(disease), 장애(disorder) 또는 병태(condition)의 완전한 회복 또는 완전한 예방이 포함되지만 필수는 아니다.

앰플리콘 또는 앰플리콘 분자: 본원에서 사용되는 용어 "앰플리콘" 또는 "앰플리콘 분자"는 주형 핵산 분자, 또는 이에 상보적인 서열을 갖는 핵산 분자, 또는 임의의 이러한 핵산 분자를 포함하는 이중-가닥 핵산으로부터의 전사에 의해 생성된 핵산 분자를 지칭한다. 전사는 프라이머에서 시작할 수 있다.

증폭: 본 명세서에 사용된 용어 "증폭"은 주형 핵산 분자로부터 추가 핵산 분자를 생성하기 위해 다양한 시약과 함께 주형 핵산 분자를 사용하는 것을 의미하며, 추가 핵산 분자는 주형 핵산 분자의 세그먼트 및/또는 이에 상보적인 서열과 동일하거나 유사할 수 있다(예컨대, 적어도 70% 동일, 예컨대, 적어도 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일).

증폭 반응 혼합물: 본 명세서에 사용된 용어 "증폭 반응 혼합물" 또는 "증폭 반응"은 주형 핵산 분자의 증폭에 충분한 시약과 함께 주형 핵산 분자를 지칭한다.

생물학적 샘플: 본 명세서에 사용된 용어 "생물학적 샘플"은 일반적으로 본원에 기재된 바와 같이 관심 생물학적 공급원(예컨대, 조직 또는 유기체 또는 세포 배양물)에서 얻거나 유래된 샘플을 지칭한다. 일부 구현예에서, 예컨대 본원에 개시된, 생물학적 공급원은 동물 또는 인간과 같은 유기체이거나 이를 포함한다. 일부 구현에서, 예컨대 본원에 개시된, 생물학적 샘플은 생물학적 조직 또는 유체이거나 이를 포함한다. 일부 구현예에서, 예컨대 본원에 개시된, 생물학적 샘플은 세포, 조직 또는 체액일 수 있거나 이를 포함할 수 있다. 일부 구현예에서, 예컨대 본원에 개시된, 생물학적 샘플은 혈액, 혈구 세포, 무세포 DNA, 자유 부유 핵산, 복수, 생검 샘플, 수술 샘플, 세포 함유 체액, 가래, 타액, 대변, 소변, 뇌척수액, 복막액, 흉막액, 림프액, 부인과 액, 분비물, 배설물, 피부 면봉 샘플, 질 면봉 샘플, 구강 면봉 샘플, 비강 면봉 샘플, 세척액 또는 세척액, 예컨대 관 세척물 또는 기관지폐포 세척물, 흡인물, 스크레이핑, 골수이거나 이를 포함할 수 있다. 일부 구현예에서, 예컨대 본원에 개시된, 생물학적 샘플은 단일 대상체 또는 복수의 대상체로부터 수득된 세포이거나 이를 포함한다. 샘플은 생물학적 공급원에서 직접 얻은 "1차 샘플"이거나 "가공된 샘플"일 수 있다. 생물학적 샘플은 "샘플"이라고도 한다.

바이오마커: 본 명세서에서 사용되는 용어 "바이오마커"는 당업계의 사용과 일치하며, 그 존재, 수준 또는 형태가 특정 생물학적 이벤트 또는 관심 상태와 상관관계가 있어 해당 이벤트 또는 상태의 "마커"가 된다. 당업자는 예를 들어 DNA 바이오마커와 관련하여 바이오마커가 좌위(예컨대 하나 이상의 메틸화 좌위) 및/또는 좌위의 상태(예컨대 하나 이상의 메틸화 좌위의 상태)이거나 이를 포함할 수 있음을 이해할 것이다. 바이오마커의 몇 가지 예를 제공하기 위해, 일부 구현예에서, 예컨대 본원에 개시된, 바이오마커는 특정 질환, 장애 또는 병태에 대한 마커이거나 이를 포함할 수 있거나, 예컨대 대상체 내에서, 특정 질환, 장애 또는 병태가 발전, 발병, 또는 재발할 수 있는 정량적 확률의 정성적 마커일 수 있다. 일부 구현예에서, 예컨대 본원에 개시된, 바이오마커는 특정 치료 결과, 또는 그의 정량적 확률의 정성적 마커일 수 있거나 이를 포함할 수 있다. 따라서, 다양한 구현예에서, 바이오마커는 관련 생물학적 이벤트 또는 관심 상태의 예측, 예후 및/또는 진단일 수 있다. 바이오마커는 모든 화학 부류의 개체일 수 있다. 예를 들어, 일부 구현예에서, 예컨대 본원에 개시된, 바이오마커는 핵산, 폴리펩티드, 지질, 탄수화물, 소분자, 무기 제제(예컨대, 금속 또는 이온), 또는 이들의 조합일 수 있거나 이를 포함할 수 있다. 일부 구현예에서, 예컨대 본원에 개시된, 바이오마커는 세포 표면 마커이다. 일부 구현예에서, 예컨대 본원에 개시된, 바이오마커는 세포내이다. 일부 구현예에서, 예컨대 본원에 개시된, 바이오마커는 세포 외부에서 발견된다(예컨대, 세포 외부로 분비되거나 세포 외부, 예컨대 혈액, 소변, 눈물, 타액, 뇌척수액 등과 같은 체액에서 생성 또는 존재한다). 일부 구현예에서 예컨대 본원에 개시된, 바이오마커는 메틸화 좌위의 메틸화 상태이다. 일부 예에서, 예컨대 본원에 개시된, 바이오마커는 "마커"로 지칭될 수 있다.

바이오마커의 한 예를 제공하기 위해, 일부 구현예에서, 예컨대 본원에 개시된, 이 용어는 발현이 특정 종양, 종양 서브클래스, 종양 병기 등의 특징인 유전자에 의해 코딩되는 생성물의 발현을 지칭한다. 대안적으로 또는 추가로, 일부 구현예에서, 예컨대 본원에 개시된, 특정 마커의 존재 또는 수준은 특정 신호전달 경로의 활성(또는 활성 수준)과 상관관계가 있을 수 있으며, 예를 들어 그 활성이 종양의 특정 부류의 특징인 신호전달 경로의 활성도와 상관관계가 있을 수 있다.

당업자는 바이오마커가 특정 생물학적 이벤트 또는 관심 상태를 개별적으로 결정할 수 있거나 특정 생물학적 이벤트 또는 관심 상태의 통계적 확률의 결정을 나타내거나 이에 기여할 수 있음을 이해할 것이다.

당업자는 마커가 특정 생물학적 이벤트 또는 관심 상태와 관련된 특이도 및/또는 민감도가 다를 수 있음을 이해할 것이다.

혈액 성분: 본 명세서에 사용된 용어 "혈액 성분"은 적혈구, 백혈구, 혈장, 혈소판, 내피 세포, 중피 세포, 상피 세포 및 무세포 DNA를 포함하는 전혈의 임의의 성분을 지칭한다. 혈액 성분에는 단백질, 대사 산물, 지질, 핵산 및 탄수화물을 비롯한 혈장 성분과 예를 들어 임신, 장기 이식, 감염, 부상 또는 질환으로 인해 혈액에 존재할 수 있는 기타 세포도 포함된다.

암: 본 명세서에 사용된 용어 "암(cancer)", "악성종양(malignancy)", "신생물(neoplasm)", "종양(tumor)" 및 "암종(carcinoma)"은 세포가 상대적으로 비정상, 비제어적 및/또는 자율적 성장을 나타내거나 나타내었고, 이로인해 비정상적으로 상승된 증식 속도 및/또는 비정상적인 성장 표현형을 나타내거나 나타냈던 질환, 장애 또는 병태를 나타내기 위해 상호교환적으로 사용된다. 일부 구현예에서, 예컨대 본원에 개시된, 암은 하나 이상의 종양을 포함할 수 있다. 일부 구현예에서, 예컨대 본원에 개시된, 암은 전암성(예컨대, 양성), 악성, 전-전이성, 전이성 및/또는 비전이성인 세포이거나 이를 포함할 수 있다. 일부 구현예에서, 예컨대 본원에 개시된, 암은 고형 종양이거나 이를 포함할 수 있다. 일부 구현예에서, 예컨대 본원에 개시된, 암은 혈액 종양이거나 이를 포함할 수 있다. 일반적으로, 당업계에 공지된 다양한 유형의 암의 예는 예를 들어 대장암, 백혈병을 포함하는 조혈암, 림프종(호지킨 및 비호지킨), 골수종 및 골수증식성 장애; 육종, 흑색종, 선종, 고형 조직 암종, 구강, 인후, 후두, 폐의 편평 세포 암종, 간암, 전립선암, 자궁경부암, 방광암, 자궁암 및 자궁내막암과 같은 비뇨생식기암 및 신세포암종, 골암, 췌장암, 피부암, 피부 또는 안내 흑색종, 내분비계 암, 갑상선암, 부갑상선암, 두경부암, 유방암, 위장관암 및 신경계암, 유두종과 같은 양성 병변 등을 포함한다.

화학요법제: 본 명세서에 사용된 용어 "화학요법제"는 당업계의 용도와 일치하여 암을 치료하거나 암의 치료에 기여하는 것으로 공지된 또는 공지된 특성을 갖는 하나 이상의 작용제를 지칭한다. 특히, 화학요법제는 세포자멸사촉진제, 세포증식억제제, 및/또는 세포독성제를 포함한다. 일부 구현예에서, 예컨대 본원에 개시된, 화학요법제는 알킬화제, 안트라사이클린, 세포골격 파괴제(예컨대, 탁산, 메이탄신 및 이들의 유사체와 같은 미세소관 표적화 모이어티), 에포틸론, 히스톤 데아세틸라제 억제제 HDAC), 토포이소머라제 억제제(예컨대, 토포이소머라제 I 및/또는 토포이소머라제 II의 억제제), 키나제 억제제, 뉴클레오티드 유사체 또는 뉴클레오티드 전구체 유사체, 펩티드 항생제, 백금 기반 제제, 레티노이드, 빈카 알칼로이드 및/또는 관련 항증식 활성을 공유하는 유사체이거나 이를 포함할 수 있다. 일부 특정 구현예에서, 예컨대 본원에 개시된, 화학요법제는 악티노마이신(Actinomycin), 올-트랜스 레티노산(All-trans retinoic acid), 아우리스타틴(Auiristatin), 아자시티딘(Azacitidine), 아자티오프린(Azathioprine), 블레오마이신(Bleomycin), 보르테조밉(Bortezomib), 카르보플라틴(Carboplatin), 카페시타빈(Capecitabine), 시스플라틴(Cisplatin), 클로람부실(Chlorambucil), 시클로포스파미드(Cyclophosphamide), 커큐민(Curcumin), 시타라빈(Cytarabine), 다우노루비신(Daunorubicin), 도세탁셀(Docetaxel), 독시플루리딘(Doxifluridine), 독소루비신(Doxorubicin), 에피루비신(Epirubicin), 에포틸론(Epothilone), 에토포사이드(Etoposide), 플루오로우라실(Fluorouracil), 젬시타빈(Gemcitabine), 하이드록시우레아(Hydroxyurea), 이다루비신(Idarubicin), 이마티닙(Imatinib), 이리노테칸(Irinotecan), 메이탄신(Maytansine) 및/또는 이들의 유사체(예: DM1) 메클로레타민(Mechlorethamine), 메르캅토퓨린(Mercaptopurine), 메토트렉세이트(Methotrexate), 미톡산트론(Mitoxantrone), 메이탄시노이드(Maytansinoid), 옥살리플라틴(Oxaliplatin), 파클리탁셀(Paclitaxel), 페메트렉세드(Pemetrexed), 테니포시드(Teniposide), 티오구아닌(Tioguanine), 토포테칸(Topotecan), 발루비신(Valrubicin), 빈블라스틴(Vinblastine), 빈크리스틴(Vincristine), 빈데신(Vindesine), 비노렐빈(Vinorelbine), 또는 이들의 조합이거나 이를 포함할 수 있다. 일부 구현예에서, 예컨대 본원에 개시된, 화학요법제는 항체-약물 접합체의 맥락에서 이용될 수 있다. 일부 구현예에서, 예컨대 본원에 개시된, 화학요법제는 하기로 이루어진 군에서 선택된 항체-약물 접합체에서 찾을 수 있는 것이다: hLL1-독소루비신, hRS7-SN-38, hMN-14-SN-38, hLL2-SN-38, hA20-SN-38, hPAM4-SN-38, hLL1-SN-38, hRS7-Pro-2-P-Dox, hMN-14-Pro-2-P-Dox, hLL2-Pro-2-P-Dox, hA20-Pro-2-P-Dox, hPAM4-Pro-2-P-Dox, hLL1-Pro-2-P-Dox, P4/D10-독소루비신, 젬투주맙 오조가미신(gemtuzumab ozogamicin), 브렌툭시맙 베도틴(brentuximab vedotin), 트라스투주맙 엠탄신(trastuzumab emtansine), 이노투주맙 오조가미신(inotuzumab ozogamicin), 글렘바투모맙 베도틴(glembatumomab vedotin), SAR3419, SAR566658, BIIB015, BT062, SGN-75, SGN-CD19A, AMG-172, AMG-595, BAY-94-9343, ASG-5ME, ASG-22ME, ASG-16M8F, MDX-1203, MLN-0264, anti-PSMA ADC, RG-7450, RG-7458, RG-7593, RG-7596, RG-7598, RG-7599, RG-7600, RG-7636, ABT-414, IMGN-853, IMGN-529, 보르세투주맙 마포도틴(vorsetuzumab mafodotin), 및 로보투주맙 메르탄신(lorvotuzumab mertansine). 일부 구현예에서, 예컨대 본원에 개시된, 화학요법제는 파르네실-티오살리실산(farnesyl-thiosalicylic acid; FTS), 4-(4-클로로-2-메틸페녹시)-N-히드록시부탄아미드(4-(4-Chloro-2-methylphenoxy)-N-hydroxybutanamide; CMH), 에스트라디올(estradiol; E2), 테트라메톡시스틸벤(tetramethoxystilbene; TMS), d-토카트리에놀(d-tocatrienol), 살리노마이신(salinomycin) 또는 커큐민(curcumin) 이거나 이를 포함할 수 있다.

필적하는: 여기에 사용된 용어 "필적하는"은 서로 동일하지 않을 수 있지만 비견할 수 있을 만큼 충분히 유사한 둘 이상의 병태(condition), 상황, 제제, 개체, 개체군 등의 집합 내의 구성원을 나타내어, 당업자가 관찰된 차이점 또는 유사점에 기초하여 결론이 합리적으로 도출될 수 있음을 인식할 수 있게 하는 것을 지칭한다. 일부 구현예에서, 예컨대 본원에 개시된, 병태, 상황, 제제, 개체, 개체군 등의 필적하는 세트는 일반적으로 복수의 실질적으로 동일한 특징 및 0, 1 또는 복수의 상이한 특징을 특징으로 한다. 관련 기술분야의 통상의 기술자는 맥락에서 세트의 구성원을 필적하게 하기 위해 어느 정도의 동일성이 요구되는지 이해할 것이다. 예를 들어, 당업자는 병태, 상황, 제제, 개체, 개체군 등의 집합의 구성원이 관찰된 차이가 전체 또는 부분적으로 동일하지 않은 특징에 기인될 수 있다는 합리적인 결론을 보증하기에 충분한 수와 유형의 실질적으로 동일한 특징으로 특징지어질 하는 경우 서로 필적하함을 인식할 것이다.

검출가능한 모이어티: 본 명세서에 사용된 용어 "검출가능한 모이어티"는 검출가능한 임의의 요소, 분자, 작용기, 화합물, 단편, 또는 기타 모이어티를 지칭한다. 일부 구현예에서, 예컨대 본원에 개시된, 검출가능한 모이어티는 단독으로 제공되거나 이용된다. 일부 구현예에서, 검출가능한 모이어티는 다른 제제와 함께 (예컨대, 연결되어) 제공 및/또는 활용된다. 검출가능한 모이어티의 예는 다양한 리간드, 방사성 핵종(예컨대, ³H,　¹⁴C,　¹⁸F,　¹⁹F,　³²P,　³⁵S,　¹³⁵l,　¹²⁵l,　¹²³l,　⁶⁴Cu,　¹⁸⁷Re,　¹¹¹ln,　⁹⁰Y,　^99mTc,　¹⁷⁷Lu,　⁸⁹Zr 등), 형광 염료, 화학발광제, 생물발광제, 분광 분해성 무기 형광 반도체 나노결정(즉, 양자점), 금속 나노입자, 나노클러스터, 상자성 금속 이온, 효소, 비색 표지, 비오틴, 다이옥시제닌, 합텐, 및 항혈청 또는 단클론 항체를 사용할 수 있는 단백질를 포함하지만 이에 제한되지 않는다.

진단: 본 명세서에 사용된 용어 "진단"은 대상체가 질환, 장애, 병태 또는 상태를 갖거나 발병할 것인지 여부 및/또는 정량적 확률의 정성적 가능성을 결정하는 것을 의미한다. 예를 들어, 암 진단에서 진단에는 암의 위험도, 유형, 병기, 악성종양 또는 기타 분류에 관한 결정이 포함될 수 있다. 일부 예에서, 예컨대 본원에 개시된, 진단은 하나 이상의 일반 또는 특정 치료제 또는 요법에 대한 예후 및/또는 가능한 반응과 관련된 결정이거나 이를 포함할 수 있다.

진단 정보: 본 명세서에 사용된 용어 "진단 정보"는 진단을 제공하는 데 유용한 정보를 의미한다. 진단 정보는 바이오마커 상태 정보를 포함할 수 있다 수 있으나 이에 제한되지 않는다.

차등적 메틸화된: 본 명세서에 사용된 용어 "차등적 메틸화된"은 메틸화 상태가 제1 조건과 제2 조건 사이에서 상이한 메틸화 부위를 기술한다. 차등적으로 메틸화된 메틸화 부위는 차등적 메틸화된 부위로 지칭될 수 있다. 일부 예에서, 예컨대 본원에 개시된, DMR은 올리고뉴클레오티드 프라이머, 예를 들어 DMR의 증폭 또는 앰플리콘에 존재하는 관심 DNA 영역의 증폭을 위해 선택된 한 쌍의 올리고뉴클레오티드 프라이머를 사용한 증폭에 의해 생성된 앰플리콘에 의해 형성된다. 일부 예에서, 예컨대 본원에 개시된, DMR은 올리고뉴클레오티드 프라이머의 서열 또는 이에 상보적인 서열을 갖는 영역을 포함하는 한 쌍의 올리고뉴클레오티드 프라이머에 의해 증폭된 DNA 영역에 의해 형성된다. 일부 예에서, 예컨대 본원에 개시된, DMR은 올리고뉴클레오티드 프라이머의 서열 또는 이에 상보적인 서열을 갖는 영역을 제외한 한 쌍의 올리고뉴클레오티드 프라이머에 의해 증폭된 DNA 영역에 의해 형성된다.

차등적 메틸화 영역: 본 명세서에 사용된 용어 "차등적 메틸화 영역"(DMR)은 하나 이상의 차등적으로 메틸화된 부위를 포함하는 DNA 영역을 지칭한다. 암성 상태(cancerous state)와 같은 선택된 관심 조건 하에서 보다 많은 수 또는 빈도의 메틸화된 부위를 포함하는 DMR은 과메틸화 DMR로 지칭될 수 있다. 암성 상태와 같은 선택된 관심 조건 하에서 보다 적은 수 또는 빈도의 메틸화된 부위를 포함하는 DMR은 저메틸화 DMR로 지칭될 수 있다. 대장암에 대한 메틸화 바이오마커인 DMR은 대장암 DMR로 지칭될 수 있다. 일부 예에서, 예를 들어, 본원에 기재된 바와 같이, 대장암에 대한 메틸화 바이오마커인 DMR은 또한 진행성 선종의 식별에 유용할 수 있다. 일부 예에서, 예를 들어, 본원에 기재된 바와 같이, 진행성 선종에 대한 메틸화 바이오마커인 DMR은 진행성 선종 DMR로 지칭될 수 있다. 일부 예에서, 예를 들어 본원에 기재된 바와 같이, 진행성 선종에 대한 메틸화 바이오마커인 DMR은 또한 대장암의 식별에 유용할 수 있다. 일부 예에서, 예컨대 본원에 개시된, DMR은 단일 뉴클레오티드일 수 있으며, 이 단일 뉴클레오티드는 메틸화 부위이다. 바람직하게는, DMR은 적어도 약 10, 15, 20, 24, 50, 100, 150, 200, 250, 300, 350, 400, 500, 1000, 1500, 2000, 2225, 2500개 또는 그 이상의 염기의 길이를 갖는다.

DNA 영역: 본원에 사용된 "DNA 영역"은 더 큰 DNA 분자의 임의의 인접 부분을 의미한다. 당업자는 예컨대, 제1 및 제2 DNA 영역(region)의 서열 유사성(예컨대, 서열 동일성 또는 동종성) 및/또는 맥락(context) (예컨대, 제1 및 제2 DNA 영역의 상류 및/또는 하류에 있는 핵산의 서열 동일성 또는 동종성)에 기반하여, 제1 DNA 영역 및 제2 DNA 영역이 상응하는지를 결정하기 위한 기술에 익숙할 것이다.

본 명세서에 달리 명시되지 않는 한, 인간에서 발견되거나 인간과 관련된 서열(예컨대, 인간 DNA에 혼성화됨)은 Homo sapiens(인간) 게놈 어셈블리 GRCh38, hg38, 및/또는 Genome Reference Consortium Human Build 38와 같이 당업자에 일반적으로 언급되고 알려진 예시적인 인간 게놈 서열에서 발견되고, 이에 기초하고/하거나 유래된다. 당업자는 hg38의 DNA 영역이 지정된 넘버링에 따른 특정 뉴클레오티드 위치 또는 이의 범위의 식별을 포함하는 공지된 시스템에 의해 언급될 수 있음을 추가로 이해할 것이다.

다운스트림: 본원에서 사용된 용어 "다운스트림"은 제1 DNA 영역이 제2 DNA 영역에 비해 제1 DNA 영역 및 제2 DNA 영역을 포함하는 핵산의 C-말단에 더 가깝다는 것을 의미한다.

유전자: 본 명세서에 사용된 용어 "유전자"는 산물(예컨대, RNA 산물 및/또는 폴리펩티드 산물)을 인코딩하는 코딩 서열을 포함하는, 예컨대 염색체 내의, 코딩 서열의 발현 조절에 기여하는 DNA 서열 전체, 일부를 갖거나 또는 없는 단일 DNA 영역을 지칭한다. 일부 구현예에서, 예컨대 본원에 개시된, 유전자는 하나 이상의 비-코딩 서열을 포함한다. 일부 특정 구현예에서, 예컨대 본원에 개시된, 유전자는 엑손 및 인트론 서열을 포함한다. 일부 구현예에서, 예컨대 본원에 개시된, 유전자는 예를 들어 유전자 발현의 하나 이상의 양태(예컨대, 세포 유형-특이적 발현, 유도성 발현 등)을 제어하거나 영향을 미칠 수 있는 하나 이상의 조절 요소를 포함한다. 일부 구현예에서, 예컨대 본원에 개시된, 유전자는 프로모터를 포함한다. 일부 구현예에서, 예컨대 본원에 개시된, 유전자는 (i) 코딩 서열의 상류에 미리 결정된 수의 뉴클레오티드를 연장하는 DNA 뉴클레오티드 및 (ii) 코딩 서열의 하류에 미리 결정된 수의 뉴클레오티드를 연장하는 DNA 뉴클레오티드 중 하나 또는 둘 모두를 포함한다. 다양한 구현예에서, 예컨대 본원에 개시된, 미리 결정된 수의 뉴클레오티드는 500 bp, 1 kb, 2 kb, 3 kb, 4 kb, 5 kb, 10 kb, 20 kb, 30 kb, 40 kb, 50 kb, 75 kb, 또는 100 kb일 수 있다.

혼성화: 본원에 사용된 "혼성화"는 이중 가닥 구조를 형성하기 위해 제1 핵산과 제2 핵산의 회합(association)을 지칭하며, 이 회합은 뉴클레오티드의 상보적 쌍을 통해 발생한다. 당업자는 특히 상보적 서열이 혼성화할 수 있음을 인식할 것이다. 다양한 구현예에서, 예컨대 본원에 개시된, 혼성화는 예를 들어, 적어도 70% 의 상보성을 갖는 뉴클레오티드 서열, 예를 들어, 적어도 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 상보성을 갖는 뉴클레오티드 서열 사이에서 발생할 수 있다. 당업자는 제1 핵산 및 제2 핵산의 혼성화가 발생하는지 여부가 다양한 반응 조건에 의존할 수 있음을 추가로 이해할 것이다. 혼성화가 일어날 수 있는 조건은 당업계에 공지되어 있다.

저메틸화: 본 명세서에 사용된 용어 "저메틸화(Hypomethylation)"는 기준 상태와 비교하여 관심 상태에서 적어도 하나의 더 적은 메틸화된 뉴클레오티드를 갖는 메틸화 좌위의 상태를 지칭한다(예컨대, 건강한 대조군에 비해 대장암에서 적어도 하나의 더 적은 메틸화된 뉴클레오티드).

과메틸화: 본 명세서에 사용된 용어 "과메틸화(hypermethylation)"는 기준 상태와 비교하여 관심 상태에서 적어도 하나의 메틸화된 뉴클레오티드를 갖는 메틸화 좌위의 상태를 지칭한다(예컨대, 건강한 대조군에 비해 대장암에서 적어도 하나의 더 많은 메틸화된 뉴클레오티드).

동일성, 동일: 본 명세서에 사용된 용어 "동일성(identity)" 및 “동일(identical)”은 중합체 분자 사이, 예를 들어 핵산 분자(예컨대, DNA 분자 및/또는 RNA 분자) 및/또는 폴리펩티드 분자 사이의 전반적인 관련성을 지칭한다. 2개의 제공된 서열 간의 동일성 퍼센트 계산 방법은 당업계에 공지되어 있다. 예를 들어, 2개의 핵산 또는 폴리펩티드 서열의 동일성 퍼센트 계산은 최적의 비교 목적을 위해 2개의 서열(또는 하나 또는 둘 모두의 서열의 상보체)을 정렬함으로써 수행될 수 있다(예컨대, 갭은 최적의 정렬을 위해 제1 서열 및 제2 서열 중 하나 또는 둘 모두에 도입될 수 있으며 동일하지 않은 서열은 비교를 위해 무시할 수 있다). 그런 다음 상응하는 위치의 뉴클레오티드 또는 아미노산을 비교한다. 제1 서열의 위치가 제2 서열의 상응하는 위치와 동일한 잔기(예: 뉴클레오티드 또는 아미노산)에 의해 점유되는 경우, 분자는 해당 위치에서 동일성이다. 두 서열 사이의 퍼센트 동일성은, 선택적으로 두 서열의 최적 정렬을 위해 도입하기 위해 필요할 수 있는 갭의 수와 각 갭의 길이를 고려하여, 서열이 공유하는 동일한 위치의 수의 함수이다. 서열 비교 및 두 서열 간의 동일성 퍼센트의 결정은 BLAST(basic local alignment search tool)와 같은 계산 알고리즘을 사용하여 수행할 수 있다.

"향상된", "증가된" 또는 "감소된": 본 명세서에서 사용된 바와 같이, 이러한 용어 또는 문법적으로 비교 가능한 비교 용어는 비교 가능한 기준 측정값과 관련된 값을 나타낸다. 예를 들어, 일부 구현예에서, 예컨대 본원에 개시된, 관심 제제로 달성된 평가 값은 비교 가능한 기준 제제 또는 제제 없이 얻은 평가 값에 비해 "향상"될 수 있다. 대안적으로 또는 추가적으로, 일부 구현예에서, 예컨대 본원에 개시된, 관심 대상체 또는 시스템의 평가 값은 다른 조건 또는 다른 시점(예컨대, 관심 제제의 투여와 같은 사건 이전 또는 이후)에서 동일한 대상체 또는 시스템, 또는 상이한, 필적하는 대상체(예컨대, 특정 관심 질환, 장애 또는 병태(condition)의 하나 이상의 표지의 존재, 또는 조건 또는 제제에 대한 사전 노출 등에 있어서 관심 대상체 또는 시스템과 상이한 필적하는 대상체 또는 시스템에서)에서 얻은 것과 비교하여 "향상"될 수 있다. 일부 구현예에서, 예컨대 본원에 개시된, 비교급 용어는 통계적으로 관련된 차이(예컨대, 통계적 관련성을 달성하기에 충분한 유병률 및/또는 규모의 차이)를 지칭한다. 당업자는 주어진 맥락에서 이러한 통계적 의미를 달성하는 데 필요하거나 충분한 차이의 규모 및/또는 유병률을 인식하거나 쉽게 결정할 수 있을 것이다.

메틸화: 본 명세서에 사용된 용어 "메틸화"는 (i) 시토신의 C5 위치; (ii) 시토신의 N4 위치; 및 (iii) 아데닌의 N6 위치에서의 메틸화를 포함한다. 메틸화에는 (iv) 다른 유형의 뉴클레오티드 메틸화도 포함된다. 메틸화된 뉴클레오티드는 "메틸화 뉴클레오티드" 또는 "메틸화 뉴클레오티드 염기"로 지칭될 수 있다. 특정 구현예에서, 예컨대 본원에 개시된, 메틸화는 특히 시토신 잔기의 메틸화를 지칭한다. 일부 예에서, 본원에 기재된 바와 같이, 메틸화는 구체적으로 CpG 부위에 존재하는 시토신 잔기의 메틸화를 지칭한다.

메틸화 분석: 본 명세서에 사용된 용어 "메틸화 분석"은 메틸화 좌위 또는 메틸화 위치의 메틸화 상태를 결정하는 데 사용할 수 있는 임의의 기술을 의미한다.

메틸화 바이오마커: 본 명세서에 사용된 용어 "메틸화 바이오마커"는 적어도 하나의 메틸화 위치 또는 좌위 및/또는 적어도 하나의 메틸화 좌위의 메틸화 상태, 예컨대 과메틸화 좌위거나 이를 포함하는 바이오마커를 지칭한다. 특히, 메틸화 바이오마커는 하나 이상의 핵산 좌위의 메틸화 상태에서 제1 상태와 제2 상태 사이(예컨대, 암성 상태와 비암성 상태 사이)의 변화를 특징으로 하는 바이오마커이다.

메틸화 좌위: 본 명세서에 사용된 용어 "메틸화 좌위"는 적어도 하나의 차등적 메틸화 영역을 포함하는 DNA 영역을 지칭한다. 암성 상태와 같은 선택된 관심 조건 하에서 더 많은 수 또는 빈도의 메틸화 부위를 포함하는 메틸화 좌위는 과메틸화 좌위로 지칭될 수 있다. 암성 상태와 같은 선택된 관심 조건 하에서 메틸화 부위의 더 적은 수 또는 빈도를 포함하는 메틸화 좌위는 저메틸화 좌위로 지칭될 수 있다.

메틸화 부위: 본 명세서에 사용된 바와 같이, 메틸화 부위는 적어도 하나의 조건에서 메틸화된 뉴클레오티드 또는 뉴클레오티드 위치를 지칭한다. 메틸화된 상태에서 메틸화 부위는 메틸화된 부위라 지칭할 수 있다.

메틸화 상태: 본원에 사용된 "메틸화 상태(methylation status)", "메틸화 상태(methylation state)" 또는 "메틸화 프로파일(methylation profile)"은 메틸화 좌위 내의 메틸화 부위에서 메틸화의 수, 빈도 또는 패턴을 지칭한다. 따라서, 제1 상태와 제2 상태 사이의 메틸화 상태의 변화는 메틸화된 부위의 수, 빈도 또는 패턴의 증가이거나 이를 포함할 수 있거나, 메틸화된 부위의 수, 빈도 또는 패턴의 감소이거나 이를 포함할 수 있다. 다양한 예에서, 본원에 기재된, 메틸화 상태의 변화는 메틸화 값의 변화이다. 다양한 예에서, 본원에 기재된, “메틸화 상태”는 개별 메틸화 부위에서 메틸화의 존재 또는 부존재를 지칭한다.

메틸화 값: 본 명세서에 사용된 용어 "메틸화 값(methylation value)"은 예를 들어 메틸화 좌위의 메틸화 빈도 또는 비율을 나타내는 숫자 형태의 메틸화 상태의 수치적 표현을 의미한다. 일부 예에서, 예컨대 본원에 개시된, 메틸화 값은 메틸화 의존 제한 효소로 샘플을 제한효소 절단(restriction digestion)한 후 샘플에 존재하는 온전한 핵산의 양을 정량화하는 것을 포함하는 방법에 의해 생성될 수 있다. 일부 예에서, 예컨대 본원에 개시된, 메틸화 값은 샘플의 중아황산염 반응 후 증폭 프로파일을 비교하는 것을 포함하는 방법에 의해 생성될 수 있다. 일부 예에서, 예컨대 본원에 개시된, 메틸화 값은 중아황산염 처리된 핵산과 처리되지 않은 핵산의 서열을 비교하여 생성될 수 있다. 일부 예에서, 예컨대 본원에 개시된, 메틸화 값은 정량적 PCR 결과이거나 이를 포함하거나 이를 기반으로 한다.

핵산: 본 명세서에 사용된, 가장 넓은 의미에서, 용어 "핵산"은 올리고뉴클레오티드 사슬에 포함되거나 포함될 수 있는 임의의 화합물 및/또는 물질을 의미한다. 일부 구현예에서, 예컨대 본원에 개시된, 핵산은 포스포디에스테르 결합을 통해 올리고뉴클레오티드 사슬에 포함되거나 포함될 수 있는 화합물 및/또는 물질이다. 문맥으로부터 명백한 바와 같이, 일부 구현예에서, 예컨대 본원에 개시된, 용어 핵산은 개별 핵산 잔기(예컨대, 뉴클레오티드 및/또는 뉴클레오시드)를 지칭하고, 일부 구현예에서, 예컨대 본원에 개시된, 복수의 개별 핵산 잔기를 포함하는 폴리뉴클레오티드 사슬을 지칭한다. 핵산은 DNA, RNA 또는 이들의 조합일 수 있거나 이를 포함할 수 있다. 핵산은 천연 핵산 잔기, 핵산 유사체 및/또는 합성 잔기를 포함할 수 있다. 일부 구현예에서, 예컨대 본원에 개시된, 핵산은 천연 뉴클레오티드(예컨대, 아데노신, 티미딘, 구아노신, 시티딘, 우리딘, 데옥시아데노신, 데옥시티미딘, 데옥시 구아노신, 및 데옥시시티딘)를 포함한다. 일부 구현예에서, 예컨대 본원에 개시된, 핵산은 하나 이상의 뉴클레오티드 유사체(예컨대, 2-아미노아데노신, 2-티오티미딘, 이노신, 피롤로-피리미딘, 3-메틸 아데노신, 5-메틸시티딘, C-5 프로피닐-시티딘, C-5 프로피닐-우리딘, 2-아미노아데노신, C5-브로모우리딘, C5-플루오로우리딘, C5-요오도우리딘, C5-프로피닐-우리딘, C5-프로피닐-시티딘, C5-메틸시티딘, 2-아미노아데노신, 7-데아자아데노신, 7-데아자구아노신 8-옥소아데노신, 8-옥소구아노신, 0(6)-메틸구아닌, 2-티오시티딘, 메틸화된 염기, 개재(intercalated) 염기, 및 이들의 조합)이거나 이를 포함한다.

일부 구현예에서, 예컨대 본원에 개시된, 핵산은 RNA 또는 단백질과 같은 기능적 유전자 생성물을 인코딩하는 뉴클레오티드 서열을 갖는다. 일부 구현예에서, 예컨대 본원에 개시된, 핵산은 하나 이상의 인트론을 포함한다. 일부 구현예에서, 예컨대 본원에 개시된, 핵산은 하나 이상의 유전자를 포함한다. 일부 구현예에서, 예컨대 본원에 개시된, 핵산은 천연 공급원으로부터의 단리, 상보적 주형(생체내(in vivo) 또는 시험관내(in vitro))에 기초한 중합에 의한 효소적 합성, 재조합 세포 또는 시스템에서의 재생산, 및 화학적 합성 중 하나 이상에 의해 제조된다.

일부 구현예에서, 예컨대 본원에 개시된, 핵산 유사체는 포스포디에스테르 골격을 사용하지 않는다는 점에서 핵산과 상이하다. 예를 들어, 일부 구현예에서, 예컨대 본원에 개시된, 핵산은 당업계에 공지되어 있고 골격에서 포스포디에스테르 결합 대신 펩티드 결합을 갖는 하나 이상의 펩티드 핵산을 포함할 수 있다. 대안적으로 또는 추가로, 일부 구현예에서, 예컨대 본원에 개시된, 핵산은 포스포디에스테르 결합(bond) 대신에 하나 이상의 포스포로티오에이트 및/또는 5'-N-포스포르아미다이트 결합(linkage)을 갖는다. 일부 구현예에서, 예컨대 본원에 개시된, 핵산은 천연 핵산에 있는 것과 비교하여 하나 이상의 변형 당(예컨대, 2'-플루오로리보스, 리보스, 2'-데옥시리보스, 아라비노스 및 헥소스)을 포함한다.

일부 구현예에서, 예컨대 본원에 개시된, 핵산은 적어도 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 100, 1 10, 120, 130, 140, 150, 160, 170, 180, 190, 20, 225, 250, 275, 300, 325, 350, 375, 400, 425, 450, 475, 500, 600, 700, 800, 900, 1000, 1500, 2000, 2500, 3000, 3500, 4000, 4500, 5000 또는 그 이상의 잔기이거나 이를 포함한다. 일부 구현예에서, 예컨대 본원에 개시된, 핵산은 부분적으로 또는 전체적으로 단일 가닥, 또는 부분적으로 또는 전체적으로 이중 가닥이다.

핵산 검출 분석: 본 명세서에 사용된 용어 "핵산 검출 분석(nucleic acid detection assay)"은 관심 핵산의 뉴클레오티드 조성을 결정하는 임의의 방법을 지칭한다. 핵산 검출 분석에는 DNA 시퀀싱 방법, 중합효소 연쇄 반응 기반 방법, 프로브 혼성화 방법, 리가제 연쇄 반응 등이 포함되지만 이에 국한되지는 않는다.

뉴클레오티드: 본 명세서에 사용된 용어 "뉴클레오티드"는 폴리뉴클레오티드, 예를 들어 DNA 및/또는 RNA 중합체의 구조적 성분 또는 빌딩 블록을 의미한다. 뉴클레오티드는 염기(예컨대, 아데닌, 티민, 우라실, 구아닌 또는 시토신)와 당 분자 및 하나 이상의 포스페이트기를 포함한다. 본원에 사용된 뉴클레오티드는 메틸화된 뉴클레오티드 또는 비-메틸화된 뉴클레오티드일 수 있다. 당업자는 예로서 "좌위(locus)" 또는 "뉴클레오티드"와 같은 핵산 용어가 단일 핵산 분자의 좌위 또는 뉴클레오티드를 지칭할 수 있고 및/또는 복수의 핵산 내의 좌위 또는 뉴클레오티드의 누적 개체군을 지칭할 수 있으며(예컨대, 대상체의 샘플 및/또는 표본(representative) 내의 복수의 핵산) 이들은 좌위 또는 뉴클레오티드를 대표함을 이해할 것이다(예컨대, 같은 동일성 핵산 서열 및/또는 핵산 서열 맥락(context)을 가지거나 실질적으로 동일한 핵산 서열 및/또는 핵산 맥락(context)을 가짐).

올리고뉴클레오티드 프라이머: 본 명세서에 사용되는 용어, 올리고뉴클레오티드 프라이머, 또는 프라이머는 주형 핵산 분자로부터 앰플리콘을 생성하는 데 사용되거나 사용될 수 있는 핵산 분자를 의미한다. 전사 허용 조건(예: 뉴클레오티드 및 DNA 중합효소의 존재 및 적절한 온도 및 pH에서) 하에, 올리고뉴클레오티드 프라이머는 올리고뉴클레오티드 프라이머가 혼성화되는 주형으로부터 전사 개시 지점을 제공할 수 있다. 일반적으로 올리고뉴클레오티드 프라이머는 5 내지 200 뉴클레오티드 길이의 단일 가닥 핵산이다. 당업자는 주형 핵산 분자로부터 앰플리콘을 생성하기 위한 최적의 프라이머 길이가 온도 파라미터, 프라이머 조성, 및 전사 또는 증폭 방법을 포함하는 조건에 따라 달라질 수 있음을 이해할 것이다. 본 명세서에서 사용되는 한 쌍의 올리고뉴클레오티드 프라이머는 주형 이중 가닥 핵산 분자의 첫 번째 가닥 및 두 번째 가닥에 각각 상보적인 두 개의 올리고뉴클레오티드 프라이머 세트를 의미한다. 한 쌍의 올리고뉴클레오티드 프라이머의 첫 번째 및 두 번째 구성원은 주형 핵산 가닥에 대해, 정방향 올리고뉴클레오티드 프라이머는 주형 핵산 가닥의 상보적인 핵산 가닥과 혼성화할 수 있고, 역방향 올리고뉴클레오티드 프라이머는 주형 핵산 가닥과 혼성화할 수 있으며, 주형 핵산 가닥에 대한 정방향 올리고뉴클레오티드 프라이머가 주형 핵산 가닥에 대한 역방향 올리고뉴클레오티드 프라이머의 위치의 5'라는 점에서 각각 "정방향" 올리고뉴클레오티드 프라이머 및 "역방향" 올리고뉴클레오티드 프라이머로 지칭될 수 있다. 당업자는. 제1 및 제2 올리고뉴클레오티드 프라이머 각각의 정방향 및 역방향 올리고뉴클레오티드 프라이머로서의 식별은 주어진 핵산 가닥 또는 이의 상보체가 주형 핵산 분자로 활용되는지 여부에 따라 이들 식별자가 좌우되는 만큼 임의적이라는 것이 당업자에 의해 이해될 것이다.

중첩: 용어 “중첩(overlappting)”은 본원에서 DNA의 두 영역과 관련하여 사용되며, 각 영역은 다른 영역에서 동일한 길이의 하위 서열(sub-sequence)과 실질적으로 동일한 하위 서열을 포함한다(예컨대, DNA의 두 영역은 공통 하위 서열을 가진다). "실질적으로 동일(substantially identical)"는 2개의 동일한 길이의 하위 서열이 주어진 염기쌍 수보다 적은 차이만큼 다르다는 것을 의미한다. 특정 예에서, 예컨대 본원에 개시된, 각각의 하위 서열은 서로 4, 3, 2, 또는 1개 미만의 염기쌍만큼 상이한 적어도 20개 염기쌍 길이를 갖는다(예컨대, 상기 2개의 하위 서열은 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95% 유사성, 적어도 97% 유사성, 적어도 98% 유사성, 적어도 99% 유사성, 또는 적어도 99.5% 유사성을 가짐). 특정 예에서, 예컨대 본원에 개시된, 각각의 하위서열은 5, 4, 3, 2, 또는 1개 미만의 염기쌍만큼 상이한 적어도 24개 염기쌍 길이를 갖는다(예컨대, 상기 2개의 하위서열은 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95% 유사성, 적어도 97% 유사성, 적어도 98% 유사성, 적어도 99% 유사성, 또는 적어도 99.5% 유사성을 가짐). 특정 예에서, 예컨대 본원에 개시된, 각각의 하위서열은 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 미만의 염기쌍만큼 상이한 적어도 50개 염기쌍 길이를 갖는다(예컨대, 상기 2개의 하위 서열은 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95% 유사성, 적어도 97% 유사성, 적어도 98% 유사성, 적어도 99% 유사성, 또는 적어도 99.5% 유사성을 가짐). 특정 예에서, 예컨대 본원에 개시된, 각각의 하위서열은 20, 15, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 미만의 염기쌍 만큼 상이한 적어도 100개 염기쌍 길이를 갖는다(예컨대, 상기 2개의 하위 서열은 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95% 유사성, 적어도 97% 유사성, 적어도 98% 유사성, 적어도 99% 유사성, 또는 적어도 99.5% 유사성을 가짐). 특정 예에서, 예컨대 본원에 개시된, 각각의 하위서열은 40, 30, 20, 15, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 미만의 염기쌍만큼 상이한 적어도 200개 염기쌍 길이를 갖는다(예컨대, 상기 2개의 하위 서열은 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95% 유사성, 적어도 97% 유사성, 적어도 98% 유사성, 적어도 99% 유사성 또는 적어도 99.5% 유사성을 가짐). 특정 예에서, 예컨대 본원에 개시된, 각각의 하위 서열은 50, 40, 30, 20, 15, 10, 9, 8, 7, 6, 5, 4, 3, 2 또는 1개 미만의 염기쌍만큼 상이한 적어도 250개 염기쌍 길이를 갖는다(예컨대, 상기 2개의 하위 서열은 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95% 유사성, 적어도 97% 유사성, 적어도 98 % 유사성, 적어도 99% 유사성 또는 적어도 99.5% 유사성을 가짐). 특정 예에서, 예컨대 본원에 개시된, 각각의 하위서열은 60, 50, 40, 30, 20, 15, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 미만의 염기쌍만큼 상이한 적어도 300개 염기쌍 길이를 갖는다(예컨대, 상기 2개의 하위 서열은 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95% 유사성, 적어도 97% 유사성, 적어도 98% 유사성, 적어도 99% 유사성 또는 적어도 99.5% 유사성을 가짐). 특정 예에서, 예컨대 본원에 개시된, 각각의 하위서열은 100, 60, 50, 40, 30, 20, 15, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 미만의 염기쌍만큼 상이한 적어도 500개 염기쌍 길이를 갖는다(예를 들어, 상기 2개의 하위 서열은 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95% 유사성, 적어도 97% 유사성, 적어도 98% 유사성, 적어도 99% 유사성 또는 적어도 99.5% 유사성을 가짐). 특정 예에서, 예컨대 본원에 개시된, 각각의 하위서열은 200, 100, 60, 50, 40, 30, 20, 15, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 미만의 염기쌍만큼 상이한 적어도 1000개 염기쌍의 길이를 갖는다(예를 들어, 상기 2개의 하위 서열은 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95% 유사성, 적어도 97 % 유사성, 적어도 98% 유사성, 적어도 99% 유사성 또는 적어도 99.5% 유사성을 가짐). 특정 예에서, 예컨대 본원에 개시된, DNA의 2개 영역 중 제1 영역의 하위서열은 DNA의 상기 2개 영역의 제2 영역 전체를 포함할 수 있다(또는 그 반대)(예컨대, 공통 하위 서열은 하나 또는 두 영역 전체를 포함할 수 있음).

예방하다(prevent) 또는 예방(prevention): 질환, 장애 또는 병태의 발생과 관련하여 본 명세서에 사용된 용어 "예방하다(prevent)" 및 "예방(prevention)"은 질환, 장애 또는 병태가 발생할 위험을 감소시키는 것; 질환, 장애 또는 병태의 발병 지연; 질환, 장애 또는 병태의 하나 이상의 특성 또는 증상의 발병 지연; 및/또는 질환, 장애 또는 병태의 하나 이상의 특징 또는 증상의 빈도 및/또는 중증도를 감소시키는 것을 지칭한다. 예방은 특정 대상체에서의 예방 또는 대상체 개체군에 대한 통계적 영향을 의미할 수 있다.

질환, 장애 또는 병태의 발병이 사전정의된 기간 동안 지연되면 예방이 완전한 것으로 간주될 수 있다.

프로브: 본 명세서에 사용된 용어 "프로브"는 상보적 표적과 혼성화할 수 있고 검출가능한 모이어티를 포함하는 단일 가닥 또는 이중 가닥 핵산 분자를 의미한다. 특정 구현예에서, 예컨대 본원에 개시된, 프로브는 제한효소 절단 생성물이거나 합성적으로 생성된 핵산, 예를 들어 재조합 또는 증폭에 의해 생성된 핵산이다. 일부 예에서, 예컨대 본원에 개시된, 프로브는 유전자 서열과 같은 표적 서열의 검출, 식별 및/또는 단리에 유용한 포획 프로브이다. 다양한 예에서, 예컨대 본원에 개시된, 프로브의 검출가능한 모이어티는 예를 들어 효소(예컨대, ELISA는 물론 효소 기반 조직화학적 검정), 형광 모이어티, 방사성 모이어티, 또는 발광 신호와 관련된 모이어티일 수 있다.

예후: 본 명세서에서 사용되는 용어 "예후"는 적어도 하나의 가능한 미래 결과 또는 사건의 양적 확률의 정성적 판단을 지칭한다. 본 명세서에 사용되는, 예후는 대상체의 암과 같은 질환, 장애 또는 병태의 가능한 경과의 판단, 대상체의 기대 수명에 관한 판단, 또는 요법 예를 들어, 특정 요법에 대한 반응에 관한 판단일 수 있다.

예후 정보: 여기에서 사용된 용어 "예후 정보"는 예후를 제공하는 데 유용한 정보를 의미한다. 예후 정보는 바이오마커 상태 정보를 포함할 수 있으나 이에 제한되지 않는다.

프로모터: 본원에 사용된 "프로모터"는 RNA 중합효소와 직접 또는 간접적으로(예컨대, 프로모터-결합 단백질 또는 물질을 통해) 회합하고 코딩 서열의 전사 개시에 참여하는 DNA 조절 영역을 지칭할 수 있다.

기준(reference): 여기에 사용된 바와 같이 비교가 수행되는 표준 또는 대조군을 설명한다. 예를 들어, 일부 구현예에서, 예컨대 본원에 개시된, 제제, 대상체, 동물, 개체, 개체군, 샘플, 서열, 또는 관심 값은 기준 또는 대조군 제제, 대상체, 동물, 개체, 개체군, 샘플, 서열 또는 값과 비교된다. 일부 구현예에서, 예컨대 본원에 개시된, 기준 또는 그의 특성은 관심 샘플에서 특성의 시험 또는 결정과 실질적으로 동시에 시험 및/또는 결정된다. 일부 실시예에서, 예컨대 본원에 개시된, 기준은, 선택적으로 유형 매체에서 구현된, 실제적(historical) 기준이다. 일반적으로, 당업자가 이해하는 바와 같이, 기준은 예를 들어 샘플과 관련하여, 평가 중인 것들에 필적하는 조건 또는 상황에서 결정되거나 특성화된다. 당업자는 특정 가능한 기준 또는 대조군에 대한 의존 및/또는 비교를 정당화하기에 충분한 유사성이 존재하는 경우를 이해할 것이다.

위험: 질환, 장애 또는 병태와 관련하여 본 명세서에서 사용되는 용어 "위험"은 특정 개체가 질환, 장애 또는 병태를 발병할 정량적 확률(백분율로 표현되든 그렇지 않든)의 정성적 의미를 나타낸다. 일부 구현예에서, 예컨대 본원에 개시된, 위험은 백분율로 표현된다. 일부 구현예에서, 예컨대 본원에 개시된, 위험은 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 30, 40, 50, 60, 70, 80, 90 또는 100% 이상인 정량적 확률의 정성적 의미이다. 일부 구현예에서, 예컨대 본원에 개시된, 위험은 기준 위험 또는 수준 또는 기준에 기인한 동일한 결과의 위험에 대한 정량적 위험 수준의 정성적 의미로 표현된다. 일부 구현예에서, 예컨대 본원에 개시된, 상대 위험은 기준 샘플과 비교하여 1.1, 1.2, 1.3, 1.4, 1.5, 1.6, 1.7, 1.8, 1.9, 2, 3, 4, 5, 6, 7, 8, 9, 10 또는 그 이상 의 인자만큼 증가 또는 감소된다.

샘플: 여기에서 사용된 용어 "샘플"은 일반적으로 관심 공급원에서 얻거나 파생된 물질의 분취량을 나타낸다. 일부 구현예에서, 예컨대 본원에 개시된, 관심 공급원은 생물학적 또는 환경적 공급원이다. 일부 구현예에서, 예컨대 본원에 개시된, 샘플은 관심 공급원로부터 직접 얻은 "1차 샘플"이다. 일부 구현예에서, 예컨대 본원에 개시된, 문맥으로부터 명백해지는 바와 같이, 용어 "샘플"은 1차 샘플의 가공에 의해(예컨대, 1차 샘플의 하나 이상의 성분을 제거하거나 및/또는 1차 샘플에 하나 이상의 제제를 첨가하여) 얻어지는 제조물을 지칭한다. 이러한 "가공된 샘플"은 예를 들어 샘플에서 추출되거나 핵산의 증폭 또는 역전사, 특정 구성요소의 단리 및/또는 정제 등과 같은 기술을 1차 샘플에 적용하여 얻은 세포, 핵산 또는 단백질을 포함할 수 있다.

특정 예에서, 예컨대 본원에 개시된, 가공된 샘플은 증폭된(예: 사전증폭된) DNA 샘플일 수 있다. 따라서 다양한 에에서, 예컨대 본원에 개시된, 식별된 샘플은 샘플의 1차 형태 또는 샘플의 가공된 형태를 의미할 수 있다. 일부 예에서, 예컨대 본원에 개시된, 효소-절단된 DNA인 샘플은 1차 효소-절단된 DNA(효소 절단의 즉각적 생성물), 또는 추가 가공된 샘플 예컨대 증폭 단계(예컨대, 중간 증폭 단계, 예를 들어 사전 증폭) 및/또는 여과 단계, 정제 단계, 또는 추가 단계, 예컨대 메틸화 상태(예: DNA 1차 샘플 및/또는 본래 공급원 컨텍스트에 존재하는 대로의 DNA의 메틸화 상태)를 결정하는 과정을 용이하게 하기 위하여 샘플을 수정하는 단계를 거친 효소-절단된 DNA를 지칭할 수 있다.

스크리닝: 본 명세서에서 사용되는 용어 "스크리닝"은 진단 정보 및/또는 예후 정보를 생성하기 위한 임의의 방법, 기술, 프로세스 또는 작업을 의미한다. 따라서, 당업자는 스크리닝이라는 용어가 개체가 질환, 장애 또는 병태, 예컨대, 대장암을 갖고 있거나, 가질 가능성이 있거나 발병할 가능성이 있거나, 발병할 위험이 있는지 여부를 결정하는 방법, 기술, 과정 또는 사업을 포함한다는 것을 이해할 것이다.

특이도: 본 명세서에 사용된, 바이오마커의 "특이도"는 관심 사건 또는 상태의 부재를 특징으로 하는 샘플의 바이오마커의 측정이 관심 사건 또는 관심 상태의 부재를 정확하게 나타내는 백분율을 지칭한다(진음성 비율). 다양한 구현예에서, 예컨대 본원에 개시된, 음성 샘플의 특성화는 바이오마커와 무관하며, 임의의 관련 측정, 예를 들어, 당업자에게 공지된 임의의 관련 측정에 의해 달성될 수 있다. 따라서, 특이도는 해당 관심 사건 또는 관심 상태를 특성화되지 않은 샘플에서 측정할 때 바이오마커가 해당 이벤트 또는 관심 상태의 부재를 검출할 확률을 반영한다. 관심 사건 또는 상태가 대장암인 특정 구현예에서, 예컨대 본원에 개시된, 특이도는 바이오마커가 대장암이 결여된 대상체에서 대장암의 부재를 검출할 확률을 지칭한다. 대장암의 결여는 예를 들어 조직학에 의해 결정될 수 있다.

민감도: 본원에 사용된 바와 같이, 바이오마커의 "민감도"는 관심 사건 또는 상태의 존재를 특징으로 하는 샘플의 바이오마커의 측정이 관심 사건 또는 관심 상태의 존재를 정확하게 나타내는 백분율을 지칭한다(진양성 비율). 다양한 구현예에서, 예컨대 본원에 개시된, 양성 샘플의 특성화는 바이오마커와 무관하며, 임의의 관련 측정, 예를 들어, 당업자에게 공지된 임의의 관련 측정에 의해 달성될 수 있다. 따라서 민감도는 해당 관심 사건 또는 관심 상태의 존재를 특징으로 하는 샘플에서 측정할 때 바이오마커가 해당 이벤트 또는 관심 상태의 존재를 검출할 확률을 반영한다. 관심 사건 또는 상태가 대장암인 특정 구현예에서, 예컨대 본원에 개시된, 민감도는 바이오마커가 대장암이 있는 대상체에서 대장암의 존재를 검출할 확률을 지칭한다. 대장암의 존재는 예를 들어 조직학에 의해 결정될 수 있다.

고형 종양: 본 명세서에 사용된 용어 "고형 종양"은 암세포를 포함하는 조직의 비정상 덩어리를 지칭한다. 다양한 구현예에서, 예컨대 본원에 개시된, 고형 종양은 낭종 또는 액체 영역을 포함하지 않는 비정상적 조직 덩어리이거나 이를 포함한다. 일부 구현예에서, 고형 종양은 양성일 수 있고; 일부 구현예에서, 예컨대 본원에 개시된, 고형 종양은 악성일 수 있다. 고형 종양의 예로는 암종, 림프종 및 육종이 있다. 일부 구현예에서, 예컨대 본원에 개시된, 고형 종양은 부신, 담관, 방광, 뼈, 뇌, 유방, 자궁경부, 결장, 자궁내막, 식도, 눈, 담낭, 위장관, 신장, 후두, 간, 폐, 비강, 비인두, 구강, 난소, 음경, 뇌하수체, 전립선, 망막, 침샘, 피부, 소장, 위, 고환, 흉선, 갑상선, 자궁, 질 및/또는 외음부 종양이거나 이를 포함할 수 있다.

암의 병기: 본 명세서에 사용된 용어 "암의 병기"는 암 진행 수준의 정성적 또는 정량적 평가를 지칭한다. 일부 구현예에서, 예컨대 본원에 개시된, 암의 병기를 결정하기 위해 사용되는 기준은 암이 신체 내 어디에 위치하는 지, 종양 크기, 암이 림프절로 퍼졌는지 여부, 암이 신체의 하나 이상의 부분에 퍼졌는지 여부 등 중 하나 이상을 포함할 수 있으나, 이에 제한되지 않는다. 일부 구현예에서, 예컨대 본원에 개시된, TNM 시스템을 사용하여 암을 병기화할 수 있으며, 이에 따르면 T는 일반적으로 원발성 종양이라 불리는 주요 종양의 크기 및 범위를 나타내고; N은 암을 가지는 주변 림프절의 수를 나타내고; M은 암이 전이되었는지 여부를 나타낸다. 일부 구현예에서, 예컨대 본원에 개시된, 암은 병기 0(비정상 세포가 존재하지만 주변 조직으로 퍼지지 않은, 제자리 암종(carcinoma in situ) 또는 CIS라고도 하며; CIS는 암이 아니지만 암이 될 수 있음), 병기 l- llll(암이 존재함, 숫자가 높을수록 종양이 더 크고 주변 조직으로 더 많이 퍼짐) 또는 병기 IV(암이 신체의 먼 부분까지 퍼짐). 일부 구현예에서, 예컨대 본원에 개시된, 암은 하기로 이루어진 군에서 선택된 병기에 배정될 수 있다: 제자리(in situ, 비정상 세포가 존재하지만 주변 조직으로 퍼지지 않음); 국한(localized, 암이 퍼졌다는 징후 없이 시작된 곳에 국한됨); 국소(regional, 암이 가까운 림프절, 조직 또는 장기로 퍼짐): 원격(distant, 암이 신체의 먼 부분으로 퍼짐); 알 수 없음(unknown, 암 단계를 식별하기 위한 정보가 충분하지 않음).

취약한: 질환, 장애 또는 병태에 "취약한(subsceptible to)"이 있는 개체는 질환, 장애 또는 병태가 발병할 위험이 있는 것이다. 일부 구현예에서, 예컨대 본원에 개시된, 질환, 장애 또는 병태에 취약한 개체는 질환, 장애 또는 병태의 어떠한 증상도 나타내지 않는다. 일부 구현예에서, 예컨대 본원에 개시된, 질환, 장애 또는 병태에 취약한 개체는 질환, 장애 및/또는 병태로 진단되지 않았다. 일부 구현예에서, 예컨대 본원에 개시된, 질환, 장애 또는 병태에 취약한 개체는 질환, 장애 또는 병태의 발병과 관련된 상태에 노출되었거나 이와 관련된 바이오마커 상태(예: 메틸화 상태)를 나타내는 개체이다. 일부 구현예에서, 예컨대 본원에 개시된, 질환, 장애, 및/또는 병태가 발병할 위험은 개체군 기반 위험(예컨대, 질환, 장애 또는 병태를 앓고 있는 개체의 가족 구성원)이다.

대상체: 본원에서 사용된 용어 "대상체"는 유기체, 일반적으로 포유동물(예컨대, 인간)을 의미한다. 일부 구현예에서, 예컨대 본원에 개시된, 대상체는 질환, 장애 또는 병태를 앓고 있다. 일부 구현예에서, 예컨대 본원에 개시된, 대상체는 질환, 장애 또는 병태에 취약하다. 일부 구현예에서, 예컨대 본원에 개시된, 대상체는 질환, 장애 또는 병태의 하나 이상의 증상 또는 특징을 나타낸다. 일부 구현예에서, 예컨대 본원에 개시된, 대상체는 질환, 장애 또는 병태를 앓지 않는다. 일부 구현예에서, 예컨대 본원에 개시된, 대상체는 질환, 장애 또는 병태의 어떠한 증상 또는 특징도 나타내지 않는다. 일부 구현예에서, 예컨대 본원에 개시된, 대상체는 질환, 장애 또는 병태에 대한 취약성 또는 위험의 특징인 하나 이상의 특징을 갖는 사람이다. 일부 구현예에서, 예컨대 본원에 개시된, 대상체는 환자이다. 일부 구현예에서, 예컨대 본원에 개시된, 대상체는 진단이 수행되고/되거나 요법이 투여된 개체이다. 일부 예에서, 예컨대 본원에 개시된, 인간 대상체는 "개체"과 상호교환적으로 지칭할 수 있다.

치료제: 본 명세서에 사용된 용어 "치료제(therapeutic agent)” 대상체에 투여될 때 원하는 약리학적 효과를 유도하는 임의의 제제를 지칭한다. 일부 구현예에서, 예컨대 본원에 개시된, 제제는 적절한 개체군에 걸쳐 통계적으로 유의한 효과를 나타내는 경우 치료제로 간주된다. 일부 구현예에서, 예컨대 본원에 개시된, 적절한 개체군은 모델 유기체의 개체군 또는 인간 개체군일 수 있다. 일부 구현예에서, 예컨대 본원에 개시된, 적절한 개체군은 특정 연령 그룹, 성별, 유전적 배경, 기존 임상 병태 등과 같은 다양한 기준에 의해 정의될 수 있다. 일부 구현예에서, 예컨대 본원에 개시된, 치료제는 질환, 장애 또는 병태의 치료에 사용될 수 있는 물질이다. 일부 구현예에서, 예컨대 본원에 개시된, 치료제는 인간에게 투여하기 위해 시판되기 전에 정부 기관에 의해 승인되었거나 승인을 받아야 하는 제제이다. 일부 구현예에서, 예컨대 본원에 개시된, 치료제는 인간에게 투여하기 위해 의학적 처방이 필요한 제제이다.

치료: 본 명세서에 사용된 용어 "치료"(또한 "치료하다" 또는 "치료하는")는 하나 이상의 증상, 특징의 발병 및/또는 특정 질환, 장애, 또는 병태의 유발을 부분적으로 또는 완전히 경감, 개선, 완화, 억제, 발현 지연, 중증도 감소, 및/또는 감소시키거나, 이러한 임의의 결과를 달성할 목적으로 투여되는, 요법의 투여를 지칭한다. 일부 구현예에서, 예컨대 본원에 개시된, 이러한 치료는 관련 질환, 장애 또는 병태의 징후를 나타내지 않는 대상체 및/또는 질환, 장애 또는 병태의 초기 징후만을 나타내는 대상체의 치료일 수 있다. 대안적으로 또는 추가로, 이러한 치료는 관련 질환, 장애 및/또는 병태의 하나 이상의 확립된 징후를 나타내는 대상체의 치료일 수 있다. 일부 구현예에서, 예컨대 본원에 개시된, 치료는 관련 질환, 장애 및/또는 병태를 앓고 있는 것으로 진단된 대상체의 치료일 수 있다. 일부 구현예에서, 예컨대 본원에 개시된, 치료는 관련 질환, 장애 또는 병태의 발병 위험 증가와 통계적으로 상관관계가 있는 하나 이상의 취약성 인자를 갖는 것으로 공지된 대상체의 치료일 수 있다. 다양한 예에서, 치료는 암의 치료이다.

상류: 본 명세서에 사용된 용어 "상류"는 제1 DNA 영역이 제2 DNA 영역에 비해 제1 DNA 영역 및 제2 DNA 영역을 포함하는 핵산의 N-말단에 더 가깝다는 것을 의미한다.

메틸화되지 않은: 본 명세서에 사용된 용어 "메틸화되지 않은(unmethylated)" 및 "비-메틸화된(non-methylated)"은 상호교환가능하게 사용되고 확인된 DNA 영역이 메틸화된 뉴클레오티드를 포함하지 않음을 의미한다.

변이체: 본 명세서에 사용된 용어 "변이체"는 참조 개체와 상당한 구조적 동일성을 나타내지만 기준 독립체(reference entity)와 비교하여 하나 이상의 화학적 모이어티의 존재, 부재 또는 수준에서 기준 독립체와 구조적으로 다른 독립체(entity)를 의미한다. 일부 구현예에서, 예컨대 본원에 개시된, 변이체는 또한 그의 기준 독립체와 기능적으로 상이하다. 일반적으로 특정 독립체가 기준 독립체의 "변이체"으로 적절하게 고려되는지 여부는 기준 독립체와의 구조적 동일성 정도에 따라 결정된다. 변이체는 기준에 필적할 수 있지만 동일하지는 않은 분자일 수 있다. 예를 들어, 변이체 핵산은 뉴클레오티드 서열에서 하나 이상의 차이로 기준 핵산과 상이할 수 있다. 일부 구현예에서, 예컨대 본원에 개시된, 변이체 핵산은 참조 핵산과의 전체 서열 동일성이 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97% 또는 99%인 것을 나타낸다. 많은 구현예에서, 관심 핵산은 관심 핵산이 기준 핵산의 서열과 동일하지만 특정 위치에서 적은 수의 서열 변경을 갖는 경우 기준 핵산의 "변이체"로 간주된다. 일부 구현예에서, 예컨대 본원에 개시된, 변이체는 기준과 비교하여 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개의 치환된 잔기를 갖는다. 일부 구현예에서, 예컨대 본원에 개시된, 변이체는 기준과 비교하여 5, 4, 3, 2, 또는 1개 이하의 잔기 부가, 치환 또는 결실을 갖는다. 다양한 구현예에서, 예컨대 본원에 개시된, 부가, 치환 또는 결실의 수는 약 25, 약 20, 약 19, 약 18, 약 17, 약 16, 약 15, 약 14, 약 13, 약 10, 약 9, 약 8, 약 7, 약 6, 그리고 일반적으로 약 5, 약 4, 약 3 또는 약 2 미만의 잔기이다.

본 명세서의 상기 및 기타 목적, 양태, 특징 및 이점은 첨부 도면과 함께 취해진 다음의 설명을 참조함으로써 보다 명백하고 더 잘 이해될 것이며, 여기서:
도 1은 예시적 MSRE-qPCR 접근법을 보여주는 개략도이다;
도 2는 바이오마커 시그니처의 개발을 위한 컴퓨터 모델을 트레이닝하는데 사용된 166명의 대상체의 트레이닝 세트의 특성을 보여주는 표이다. 여성 대상체 수, 남성 대상체 수, 대상체의 평균 및 연령 범위. 대상체는 대장암(colorectal cancer, CRC)을 앓고 있는 것, 건강한 대조군 대상체(대조군; 과증식용종으로 진단된 환자, 비진행성 선종(non-advanced adenoma; NAA)을 갖는 것으로 진단된 환자, 및 대장 내시경 소견이 없는 환자)로 진단되었다. 도 2는 또한 대장내시경 평가에 기초하여 CRC를 앓는 이들의 암의 위치를 근위부 또는 원위부로서 구별한다;
도 3은 선택된 마커를 검증하기 위해 사용된 535명의 인간 대상체의 검증군의 특성을 나타내는 표이다. 도 3은 여성 대상체 수, 남성 대상체 수, 대상체의 평균 및 연령 범위를 제공한다. 대상체는 대장암(colorectal cancer, CRC)을 앓고 있는 것, 건강한 대조군 대상체(대조군; 과증식용종으로 진단된 환자, 비진행성 선종(non-advanced adenoma; NAA)을 갖는 것으로 진단된 환자, 및 대장 내시경 소견이 없는 환자), 및 진행성 선종(advanced adenoma; AA)를 앓는 환자로 진단되었다.
도 4는 대상체 검증 세트에 대해 수행된 초기 주성분 분석의 그래프를 나타낸다. 대상체는 3 군으로 나누어졌다: 진행성 선종(AA)을 앓고 있는 환자, 대조군 환자(CNT), 및 대장암(CRC)을 앓고 있는 환자. 대조군(CNT) 환자는 대장 내시경 소견이 없는 환자, 과형성 폴립 환자 및 비진행성 선종(NAA) 환자로 정의된다. 세 군 각각 주위에 상관 원(correlation circle)이 그려졌다.
도 5a는 535명의 대상체 군에 대한 DMR의 40개 마커 패널을 사용한 대장암 스크리닝의 성능을 나타내는 그래프이다. 검증군의 모든 대상체에 대한 ROC 및 AUC가 나타난다.
도 5b는 좌측부터 우측으로, 진행성 선종 전체 스크리닝 민감도, 대장암 전체 스크리닝 민감도, 국한(localized) 대장암 스크리닝 민감도, 진행성 대장암 스크리닝 민감도, 및 대조군 대상체(대장내시경 소견이 없는 자, 과증식용종이 있는 자, 및/또는 비진행성 선종(NAA)를 갖는 것으로 진단된 환자)의 대장암 스크리닝 특이도를 포함하는 정확도 값을 나타내는 차트이다.
도 6은 대장암(대장암 및 진행성 선종)이 있는 검증군의 대상체 및 대조군 대상체(건강한 대상체, 과증식용종 환자 및 비진행성 선종 환자)의 UDX_29_1로 식별된 영역의 MSRE-qPCR에서 의 Ct(Cycle Threshold) 값을 나타내는 그래프를 나타낸다. 데이터는 테스트에 사용된 두 번째 대상체 군(530 대상체)을 나타낸다. 표시를 위해 Ct 값을 45에서 뺀다(45-Ct). 45-Ct 값이 높을수록 더 높은 메틸화 상태에 해당하며, 대장암이 있는 대상체에서의 과메틸화를 나타낸다.
도 7은 대장암(대장암 및 진행성 선종)이 있는 검증군의 대상체 및 대조군 대상체(건강한 대상체, 과증식용종 환자 및 비진행성 선종 환자)의 UDX_272.3_2로 식별된 영역의 MSRE-qPCR에서의 Ct(Cycle Threshold) 값을 나타내는 그래프를 나타낸다. 데이터는 테스트에 사용된 두 번째 대상체 군(530 대상체)을 나타낸다. 표시를 위해 Ct 값을 45에서 뺀다(45-Ct). 45-Ct 값이 높을수록 더 높은 메틸화 상태에 해당하며, 대장암이 있는 대상체에서의 과메틸화를 나타낸다.
도 8은 대장암(대장암 및 진행성 선종)이 있는 검증군의 대상체 및 대조군 대상체(건강한 대상체, 과증식용종 환자 및 비진행성 선종 환자)의 UDX_277.7_2로 식별된 영역의 MSRE-qPCR 에서의 Ct(Cycle Threshold) 값을 나타내는 그래프를 나타낸다. 데이터는 테스트에 사용된 두 번째 대상체 군(530 대상체)을 나타낸다. 표시를 위해 Ct 값을 45에서 뺀다(45-Ct). 45-Ct 값이 높을수록 더 높은 메틸화 상태에 해당하며, 대장암이 있는 대상체에서의 과메틸화를 나타낸다.
도 9는 대장암(대장암 및 진행성 선종)이 있는 검증군의 대상체 및 대조군 대상체(건강한 대상체, 과증식용종 환자 및 비진행성 선종 환자)의 UDX_272.4로 식별된 영역의 MSRE-qPCR에서의 Ct(Cycle Threshold) 값을 나타내는 그래프를 나타낸다. 데이터는 테스트에 사용된 두 번째 대상체 군(530 대상체)을 나타낸다. 표시를 위해 Ct 값을 45에서 뺀다(45-Ct). 45-Ct 값이 높을수록 더 높은 메틸화 상태에 해당하며, 대장암이 있는 대상체에서의 과메틸화를 나타낸다.
도 10은 대장암(대장암 및 진행성 선종)이 있는 검증군의 대상체 및 대조군 대상체(건강한 대상체, 과증식용종 환자 및 비진행성 선종 환자)의 UDX_174.3으로 식별된 영역의 MSRE-qPCR에서의 Ct(Cycle Threshold) 값을 나타내는 그래프를 나타낸다. 데이터는 테스트에 사용된 두 번째 대상체 군(530 대상체)을 나타낸다. 표시를 위해 Ct 값을 45에서 뺀다(45-Ct). 45-Ct 값이 높을수록 더 높은 메틸화 상태에 해당하며, 대장암이 있는 대상체에서의 과메틸화를 나타낸다.
도 11은 대장암(대장암 및 진행성 선종)이 있는 검증군의 대상체 및 대조군 대상체(건강한 대상체, 과증식용종 환자 및 비진행성 선종 환자)의 UDX_260.2_1로 식별된 영역의 MSRE-qPCR에서의 Ct(Cycle Threshold) 값을 나타내는 그래프를 나타낸다. 데이터는 테스트에 사용된 두 번째 대상체 군(530 대상체)을 나타낸다. 표시를 위해 Ct 값을 45에서 뺀다(45-Ct). 45-Ct 값이 높을수록 더 높은 메틸화 상태에 해당하며, 대장암이 있는 대상체에서의 과메틸화를 나타낸다.
도 12는 대장암(대장암 및 진행성 선종)이 있는 검증군의 대상체 및 대조군 대상체(건강한 대상체, 과증식용종 환자 및 비진행성 선종 환자)의 UDX_260.1로 식별된 영역의 MSRE-qPCR에서의 Ct(Cycle Threshold) 값을 나타내는 그래프를 나타낸다. 데이터는 테스트에 사용된 두 번째 대상체 군(530 대상체)을 나타낸다. 표시를 위해 Ct 값을 45에서 뺀다(45-Ct). 45-Ct 값이 높을수록 더 높은 메틸화 상태에 해당하며, 대장암이 있는 대상체에서의 과메틸화를 나타낸다.
도 13은 대장암(대장암 및 진행성 선종)이 있는 검증군의 대상체 및 대조군 대상체(건강한 대상체, 과증식용종 환자 및 비진행성 선종 환자)의 UDX_137.1로 식별된 영역의 MSRE-qPCR에서의 Ct(Cycle Threshold) 값을 나타내는 그래프를 나타낸다. 데이터는 테스트에 사용된 두 번째 대상체 군(530 대상체)을 나타낸다. 표시를 위해 Ct 값을 45에서 뺀다(45-Ct). 45-Ct 값이 높을수록 더 높은 메틸화 상태에 해당하며, 대장암이 있는 대상체에서의 과메틸화를 나타낸다.
도 14는 대장암(대장암 및 진행성 선종)이 있는 검증군의 대상체 및 대조군 대상체(건강한 대상체, 과증식용종 환자 및 비진행성 선종 환자)의 UDX_17_2로 식별된 영역의 MSRE-qPCR에서의 Ct(Cycle Threshold) 값을 나타내는 그래프를 나타낸다. 데이터는 테스트에 사용된 두 번째 대상체 군(530 대상체)을 나타낸다. 표시를 위해 Ct 값을 45에서 뺀다(45-Ct). 45-Ct 값이 높을수록 더 높은 메틸화 상태에 해당하며, 대장암이 있는 대상체에서의 과메틸화를 나타낸다.
도 15는 대장암(대장암 및 진행성 선종)이 있는 검증군의 대상체 및 대조군 대상체(건강한 대상체, 과증식용종 환자 및 비진행성 선종 환자)의 UDX_230으로 식별된 영역의 MSRE-qPCR에서의 Ct(Cycle Threshold) 값을 나타내는 그래프를 나타낸다. 데이터는 테스트에 사용된 두 번째 대상체 군(530 대상체)을 나타낸다. 표시를 위해 Ct 값을 45에서 뺀다(45-Ct). 45-Ct 값이 높을수록 더 높은 메틸화 상태에 해당하며, 대장암이 있는 대상체에서의 과메틸화를 나타낸다.
도 16은 정상 세포와 암세포 사이의 메틸화 상태의 예시적 메틸화 변화를 보여주는 개략도이며, 메틸화 상태의 변화가 정상 세포와 암세포 사이의 유전자 발현 차이에 어떻게 영향을 미칠 수 있는지를 추가로 나타낸다.
도 17은 예를 들어 본 명세서에 기술된 바와 같은 특정 구현예에서 사용되는 예시적인 클라우드 컴퓨팅 환경의 블록도이다.
도 18은 예를 들어 본원에 설명된 바와 같은 특정 실시예에서 사용되는 예시적인 컴퓨팅 장치 및 예시적인 모바일 컴퓨팅 장치의 블록도이다.
본 발명의 특징 및 이점은 도면과 함께 후술하는 구체적인 내용으로부터 더욱 명백해질 것이다.

청구된 발명의 시스템, 아키텍처, 장치, 방법 및 프로세스는 본원에 설명된 실시예로부터의 정보를 사용하여 개발된 변형 및 개조를 포함하는 것으로 고려된다. 본원에 설명된 시스템, 아키텍처, 장치, 방법 및 프로세스의 개조 및/또는 수정은 본 기재에 의해 고려되는 바와 같이 수행될 수 있다.

기재 전반에 걸쳐, 물품, 장치, 시스템 및 아키텍처가 특정 구성 요소를 갖거나 함유하거나 포함하는 것으로 설명되거나 프로세스 및 방법이 특정 단계를 함유하거나 포함하는 것으로 설명되는 경우 추가적으로, 언급된 구성요소로 본질적으로 구성되거나, 구성되는 본 발명의 물품, 장치, 시스템 및 아키텍처가 있는 것으로 고려되며, 언급된 프로세싱 단계로 본질적으로 구성되거나, 구성되는 본 발명에 따른 프로세스 및 방법이 있음을 의미한다.

단계의 순서 또는 특정 동작을 수행하기 위한 순서는 본 발명이 작동 가능한 상태로 유지되는 한 중요하지 않음을 이해해야 한다. 또한, 2개 이상의 단계 또는 동작이 동시에 수행될 수 있다.

예를 들어 배경기술 섹션에서 임의의 간행물에 대한 본원의 언급은 간행물이 본원에 제시된 청구범위와 관련하여 선행 기술의 역할을 한다는 것을 인정하는 것이 아니다. 배경기술 섹션은 명료함을 위해 제공되며 청구범위에 대한 선행 기술의 기재를 의미하지 않는다.

문헌은 언급된 대로 본원에 참조로서 포함된다. 특정 용어의 의미에 불일치가 있는 경우 상기 정의 섹션에 제시된 의미가 우선한다.

헤더는 독자의 편의를 위해 제공되며 - 헤더의 존재 및/또는 배치는 본원에 설명된 주제의 범위를 제한하지 않는다.

대장암 스크리닝

초기 대장암을 위한 스크리닝을 포함하는 대장암 및/또는 진행성 선종 스크리닝의 개선된 방법이 필요하다. 예를 들어, 50세 이상의 개체에 대한 검진에 대한 권장 사항에도 불구하고 대장암 검진 프로그램은 종종 효과가 없거나 불만족스럽다. 개선된 대장암 및/또는 진행성 선종 검진은 진단을 개선하고 대장암 사망률을 감소시킨다.

DNA 메틸화(예컨대, 메틸화 또는 저메틸화)는 암 발달에 영향을 미치는 유전자를 포함하여 유전자를 활성화하거나 비활성화할 수 있다(예컨대, 도 16 참조). 따라서, 예를 들어, 과메틸화는 일반적으로 암을 억제하는 작용을 하여 샘플 또는 대상체에서 암 발병을 유발하거나 이에 기여하는 하나 이상의 유전자를 비활성화할 수 있다.

본원은 본원에 제공된 하나 이상의 메틸화 좌위의 메틸화 상태, 및/또는 본원에 제공된 하나 이상의 DMR의 메틸화 상태, 및/또는 본원에 제공된 하나 이상의 메틸화 부위의 메틸화 상태, 예를 들어, 높은 수준의 민감도 및/또는 특이도로 대장암 및/또는 진행성 선종에 대한 스크리닝을 제공한다. 본원은 개별적으로 또는 둘 이상의 바이오마커를 포함하는 다양한 패널(panel)에서, 예를 들어 높은 정도의 특이도 및/또는 민감도로 대장암 및/또는 진행성 선종의 스크리닝을 제공하는 대장암 메틸화 바이오마커를 포함하거나 이에 관련된 조성물 및 방법을 제공한다.

다양한 구현예에서, 예를 들어, 본원에 기재된 바와 같이, 본원의 대장암 및/또는 진행성 선종 메틸화 바이오마커는 하기 표 1에서 식별된 차등적 메틸화 영역(DMR)의 서열의 일부(예컨대, 적어도 1 공통 염기쌍)이거나 이를 포함하는 메틸화 좌위로부터 선택된다. DMR은 DMR이 위치한 염색체 번호(Chr. No.), 염색체 상의 DMR의 시작 위치(시작 염기쌍), 염색체 상의 DMR의 종료 위치, DMRdml 폭, DMR과 중첩되거나 DMR 내에 포함된 하나 이상의 유전자(사용 가능한 경우)의 주석된(annotated) 명칭, 명세서의 서열 섹션 및 제시된 서열 목록에 표시된 DMR의 서열 ID 번호에 의해 식별된다. 식별된 영역의 염색체 번호와 시작(시작 염기쌍) 및 종료(종료 염기쌍) 위치는 GRCh38로 식별된 인간 게놈 빌드를 참조로 한다.

표 1. 진행성 선종 및 대장암 스크리닝에 대한 69개의 관심 DMR 목록.
SEQ ID NO	Chr.	시작 염기쌍	종료 염기쌍	영역 길이	주석된 유전자명
SEQ ID NO: 1	1	18636183	18636479	297	PAX7
SEQ ID NO: 2	1	107140100	107140341	242	NTNG1
SEQ ID NO: 3	1	114153175	114153431	257	SYT6
SEQ ID NO: 4	2	5673847	5674110	264	LINC01248
SEQ ID NO: 5	2	26692974	26693164	191	KCNK3
SEQ ID NO: 6	2	31136994	31138312	1319	GALNT14
SEQ ID NO: 7	2	100416598	100417320	723	CHST10
SEQ ID NO: 8	2	127025668	127025992	325	주석 없음
SEQ ID NO: 9	2	136765863	136767257	1395	THSD7B
SEQ ID NO: 10	2	209771521	209771717	197	UNC80
SEQ ID NO: 11	3	96812527	96814374	1848	EPHA6
SEQ ID NO: 12	3	151086702	151087381	680	MED12L
SEQ ID NO: 13	4	61201658	61202419	762	ADGRL3
SEQ ID NO: 14	4	141133100	141133759	660	RNF150
SEQ ID NO: 15	4	167233855	167235112	1258	SPOCK3
SEQ ID NO: 16	4	176001298	176001937	640	GPM6A
SEQ ID NO: 17	4	185020150	185020721	572	HELT
SEQ ID NO: 18	5	180353742	180353989	248	GFPT2
SEQ ID NO: 19	6	31815502	31815783	282	HSPA1L, HSPA1A
SEQ ID NO: 20	6	123803543	123804573	1031	NKAIN2
SEQ ID NO: 21	7	141072216	141073010	795	TMEM178B
SEQ ID NO: 22	7	154304773	154304932	160	DPP6
SEQ ID NO: 23	8	17026468	17027021	554	MICU3
SEQ ID NO: 24	8	52564399	52566130	1732	ALKAL1
SEQ ID NO: 25	8	64581458	64581984	527	LOC401463, BHLHE22
SEQ ID NO: 26	8	103500115	103500325	211	RIMS2, LOC105375690, SLC25A32
SEQ ID NO: 27	9	843218	843532	315	DMRT1
SEQ ID NO: 28	9	21970988	21971129	142	CDKN2A, CDKN2B-AS1
SEQ ID NO: 29	9	36986363	36986579	217	PAX5
SEQ ID NO: 30	10	16520584	16520645	62	C1QL3
SEQ ID NO: 31	10	25933862	25934167	306	MYO3A, LOC101929073
SEQ ID NO: 32	10	26211596	26212313	718	GAD2, MYO3A
SEQ ID NO: 33	10	127736443	127736756	314	FOXI2
SEQ ID NO: 34	11	94740674	94742025	1352	LOC105369438, AMOTL1
SEQ ID NO: 35	11	112962067	112962734	668	LOC101928847, NCAM1
SEQ ID NO: 36	11	117795608	117796104	497	DSCAML1
SEQ ID NO: 37	12	15322181	15323178	998	PTPRO, RERG
SEQ ID NO: 38	12	63667846	63668580	735	DPY19L2
SEQ ID NO: 39	12	111033274	111033632	359	CUX2
SEQ ID NO: 40	13	67229618	67231644	2027	PCDH9
SEQ ID NO: 41	13	87673128	87673271	144	MIR4500HG, SLITRK5
SEQ ID NO: 42	14	70188797	70189400	604	SLC8A3, LOC646548
SEQ ID NO: 43	14	77966179	77966411	233	주석 없음
SEQ ID NO: 44	15	45378160	45378420	261	GATM
SEQ ID NO: 45	15	64824187	64824233	47	PIF1
SEQ ID NO: 46	15	79089616	79089950	335	RASGRF1
SEQ ID NO: 47	16	70737594	70737910	317	VAC14
SEQ ID NO: 48	16	77789176	77789410	235	VAT1L
SEQ ID NO: 49	16	87601415	87601495	81	JPH3
SEQ ID NO: 50	17	35448324	35448347	24	SLFN13
SEQ ID NO: 51	17	76076064	76076299	236	ZACN, SRP68, GALR2
SEQ ID NO: 52	18	907740	908272	533	ADCYAP1
SEQ ID NO: 53	18	28177400	28177679	280	CDH2
SEQ ID NO: 54	18	69401262	69401796	535	DOK6
SEQ ID NO: 55	18	75916571	75916639	69	주석 없음
SEQ ID NO: 56	19	36666416	36667626	1211	ZNF461
SEQ ID NO: 57	19	36916473	36916789	317	ZNF829, ZNF568
SEQ ID NO: 58	19	36973366	36973693	328	ZNF568
SEQ ID NO: 59	19	37551650	37551952	303	ZNF540, ZNF571-AS1
SEQ ID NO: 60	19	42270825	42271072	248	CIC
SEQ ID NO: 61	19	56393726	56393946	221	ZNF582-AS1, ZNF582
SEQ ID NO: 62	19	56507701	56507850	150	ZNF471
SEQ ID NO: 63	19	57191866	57192102	237	ZNF264
SEQ ID NO: 64	19	57726974	57727102	129	ZNF671,ZNF551, ZNF776
SEQ ID NO: 65	20	21518031	21518878	848	NKX2-2
SEQ ID NO: 66	20	56925418	56925496	79	주석 없음
SEQ ID NO: 67	21	26843133	26845357	2225	ADAMTS1
SEQ ID NO: 68	21	31343542	31344538	997	TIAM1
SEQ ID NO: 69	21	33070564	33070847	284	OLIG1

다시 말해, 본원에 제공된 임의의 메틸화 바이오마커는 무엇보다도 대장암 및/또는 진행성 선종 메틸화 바이오마커일 수 있거나 이에 포함될 수 있다.

일부 구현예에서, 예컨대 본원에 개시된, 대장암 및/또는 진행성 선종 메틸화 바이오마커는 단일 메틸화 좌위이거나 이를 포함할 수 있다. 일부 구현예에서, 예컨대 본원에 개시된, 메틸화 바이오마커는 2개 이상의 메틸화 좌위이거나 이를 포함할 수 있다. 일부 구현예에서, 예컨대 본원에 개시된, 메틸화 바이오마커는 단일 차등 메틸화 영역(DMR)이거나 이를 포함할 수 있다. 일부 구현예에서, 예컨대 본원에 개시된, 메틸화 바이오마커는 단일 메틸화 부위이거나 이를 포함할 수 있다. 다른 구현예에서, 예컨대 본원에 개시된, 메틸화 바이오마커는 2개 이상의 메틸화 부위이거나 이를 포함할 수 있다. 일부 구현예에서, 예컨대 본원에 개시된, 메틸화 좌위는 2개 이상의 DMR을 포함할 수 있고 포함된 DMR 중 하나 이상에 인접한 DNA 영역을 추가로 포함할 수 있다. 일부 예에서, 예컨대 본원에 개시된, 메틸화 좌위는 유전자, 예컨대 표 1에 제공된 유전자이거나 이를 포함한다. 일부 예에서 예컨대 본원에 개시된, 메틸화 좌위는 유전자의 부분, 예컨대 표 1에 제공된 유전자의 부분이거나 이를 포함한다. 일부 예에서, 예컨대 본원에 개시된, 메틸화 좌위에는 유전자의 확인된 핵산 경계가 포함되지만 이에 국한되지는 않는다. 일부 예에서, 예를 들어, 예컨대 본원에 개시된, 메틸화 좌위는 상기에 주석된(annotated) 유전자, 예컨대 표 1에 제공된 바와 같은 유전자 서열의 주석이 없는 영역 외부에서 발견된다. 일부 예에서, 예컨대 본원에 개시된, 메틸화 좌위는 예컨대 표 1에 제공된 바와 같은 다중 유전자의 부분이거나 이를 포함한다.

일부 예에서, 예컨대 본원에 개시된, 메틸화 좌위는 표 1에 제공된 유전자의 코딩 영역과 같은 유전자의 코딩 영역이거나 이를 포함한다. 일부 예에서 메틸화 좌위는 유전자의 코딩 영역, 예를 들어, 표 1에 제공된 유전자 코딩 영역의 부분이거나 이를 포함한다. 일부 예에서, 예컨대 본원에 개시된, 메틸화 좌위에는 유전자 코딩 영역의 확인된 핵산 경계가 포함되지만 이에 국한되지는 않는다.

일부 예에서, 예컨대 본원에 개시된, 메틸화 좌위는 표 1에 제공된 유전자의 프로모터 및/또는 다른 조절 영역과 같은 유전자의 프로모터 및/또는 기타 조절 영역이거나 이를 포함한다. 일부 예에서 예컨대 본원에 개시된, 메틸화 좌위는 프로모터의 부분 및/또는 유전자의 조절 영역, 예를 들어 표 1에 제공된 프로모터 및/또는 조절 영역 유전자의 부분이거나 이를 포함한다. 일부 예에서, 예컨대 본원에 개시된, 메틸화 좌위는 프로모터의 확인된 핵산 경계 및/또는 유전자의 다른 조절 영역이거나 이를 포함하지만 이에 제한되지는 않는다. 일부 구현예에서, 예컨대 본원에 개시된, 메틸화 좌위는 고 CpG 밀도 프로모터 또는 그의 부분이거나 이를 포함한다.

일부 구현예에서, 예컨대 본원에 개시된, 메틸화 좌위는 비-코딩 서열이거나 이를 포함한다. 일부 구현예에서, 예컨대 본원에 개시된, 메틸화 좌위는 하나 이상의 엑손 및/또는 하나 이상의 인트론이거나 이를 포함한다.

일부 구현예에서, 예컨대 본원에 개시된, 메틸화 좌위는 코딩 서열의 상류에서 미리 결정된 수의 뉴클레오티드를 확장하는 DNA 영역, 및/또는 코딩 서열의 하류에서 미리 결정된 수의 뉴클레오티드를 확장하는 DNA 영역을 포함한다. 다양한 예에서, 예컨대 본원에 개시된, 미리 결정된 수의 뉴클레오티드 상류 및/또는 하류는 예를 들어 500bp, 1kb, 2kb, 3kb, 4kb, 5kb, 10kb, 20kb, 30kb, 40kb, 50kb, 75kb 또는 100kb 이거나 이를 포함한다. 당업자는 코딩 서열의 발현에 영향을 미칠 수 있는 메틸화 바이오마커가 전형적으로 코딩 서열의 상류 및/또는 하류의 임의의 거리 내에 있을 수 있음을 이해할 것이다.

당업자는 메틸화 바이오마커로 확인된 메틸화 좌위가 단일 실험, 반응 또는 앰플리콘에서 반드시 분석될 필요는 없다는 것을 이해할 것이다. 대장암 및/또는 진행성 선종 메틸화 바이오마커로 확인된 단일 메틸화 좌위는 예를 들어 메틸화 좌위 내의 하나 이상의 별개의 또는 중복되는 DNA 영역, 예컨대 하나 이상의 구별되거나 겹치는 DMR의 개별 증폭(또는 증폭에 충분한 올리고뉴클레오티드 프라이머 및 조건 제공)을 포함하는 방법으로 분석될 수 있다. 당업자는 메틸화 바이오마커로 확인된 메틸화 좌위가 메틸화 좌위 내에 존재하는 각 뉴클레오티드 또는 각 CpG의 메틸화 상태에 대해 분석될 필요가 없다는 것을 추가로 이해할 것이다. 오히려, 메틸화 바이오마커인 메틸화 좌위는 예를 들어 메틸화 좌위 내의 단일 DNA 영역의 분석에 의해, 예를 들어 메틸화 좌위 내의 단일 DMR 분석에 의해 분석될 수 있다. 본 명세서의 DMR은 메틸화 좌위일 수 있거나 메틸화 좌위의 부분을 포함할 수 있다. 일부 예에서, 예컨대 본원에 개시된, DMR은 예를 들어 길이가 1 내지 5,000 bp인 메틸화 좌위를 갖는 DNA 영역이다. 다양한 구현예에서, 예컨대 본원에 개시된, DMR은 5000 bp, 4,000 bp, 3,000 bp, 2,000 bp, 1,000 bp, 950 bp, 900 bp, 850 bp, 800 bp, 800 bp, 800 bp, 800 bp, 750 bp, 700 bp, 650 bp, 600 bp, 550 bp, 500 bp, 450 bp, 400 bp, 350 bp, 300 bp, 250 bp, 200 bp, 150 bp, 100 bp, 50 bp, 20 bp 또는 10 bp 이하 길이인 메틸화 좌위를 갖는 DNA 영역이다. 일부 구현예에서, 예컨대 본원에 개시된, DMR은 길이가 1, 2, 3, 4, 5, 6, 7, 8 또는 9 bp이다.

본 명세서에 제공된 메틸화 좌위, 메틸화 부위 및 DMR을 비제한적으로 포함하는 메틸화 바이오마커.

명확성을 위해, 당업자는 메틸화 바이오마커라는 용어가 광범위하게 사용되어 메틸화 좌위가 하나 이상의 DMR을 포함하는 메틸화 바이오마커일 수 있고, 각각의 DRM은 그 자체로 메틸화 바이오마커이고, 각각의 DMR은 하나 이상의 메틸화 부위를 포함할 수 있으며, 각각의 메틸화 부위는 자체적으로 메틸화 바이오마커이기도 하다. 더욱이, 메틸화 바이오마커는 2개 이상의 메틸화 좌위를 포함할 수 있다. 따라서, 메틸화 바이오마커로서의 상태는 바이오마커에 포함된 핵산의 연속성에 좌우되는 것이 아니라, 포함된 DNA 영역(들)에 대한 메틸화 상태의 변화가 제1 상태와 제2 상태, 예컨대 대장암과 대조군 간에 및/또는 진행성 선종과 대조군 간에 존재하는지에 따라 결정된다.

본원에 제공된 바와 같이, 메틸화 좌위는 각각의 메틸화 좌위가 표 1에 식별된 바와 같은 유전자 영역(예컨대, DMR)이거나 이를 포함하는 하나 이상의 메틸화 좌위 중 임의의 것일 수 있다. 일부 특정 구현예에서, 예컨대 본원에 기재된 바와 같이, 대장암 및/또는 진행성 선종 메틸화 바이오마커는 표 1에서 식별된 유전자(전체 또는 일부)이거나 이를 포함하는 단일 메틸화 좌위를 포함한다.

일부 특정 구현예에서, 예컨대 본원에 기재된 바와 같은 대장암 및/또는 진행성 선종 메틸화 바이오마커는 2개 이상의 메틸화 좌위를 포함하고, 이들 각각은 표 1에서 식별된 유전자 영역이거나 이를 포함한다. 일부 구현예에서, 예컨대 본원에 기재된 바와 같이, 메틸화 바이오마커는 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 또는 69개 메틸화 좌위를 포함하며, 각각은 표 1에서 식별된 유전자 영역(전체 또는 일부)을 포함한다.

표 2-4에 제공된 DMR 서열은 표 1의 DMR로 구성되거나 중첩되거나 일부를 포함하는 선택된 영역이다. 즉, 표 2-4에서 확인된 각 DNA 영역은 표 1에서 식별된 DMR의 일부, 그 이하 및 모든 DMR을 포함한다. 명확화를 위해, 표 2-4의 DMR과 중첩되는 표 1의 DMR에 대한 평가는 서열 시작 및 종료 위치 및 염색체 번호에 기초하여 이루어진다. 두 DMR이 동일한 염색체에서 발견되고 두 DMR 서열 중 하나가 두 DMR 서열 중 두번째의 시작 점과 종료 점 사이 또는 시작 점 및 종료 점 중 하나에 시작 점 및/또는 종료 점을 가지면, 이들은 중첩되는 것으로 간주된다. 예를 들어, 표 4의 UDX_224.14(SEQ ID No. 190)는 염색체 21에 있는 111개의 인접 염기 쌍(contiguous base pair)의 선택을 포함한다. 모든 111개의 인접 염기 쌍은 표 1의 SEQ ID No. 67 내에서 발견되며, 염색체 21 상에서도 발견된다. UDX_224.14의 시작 점은 26844767이고 종료 점은 26844877이며, SEQ ID No. 67의 시작점은 26843133이고 종료 점은 26845357이다. UDX_224의 시작점과 종료 점 모두 SEQ ID No. 67의 시작 점과 종료 점 사이에서 발견되고 둘 모두 동일한 염색체 상에 있기 때문에, 이들은 서로 중첩되며 따라서 동일한 중첩 서열을 공유한다.

다른 예에서, 표 4의 UDX_244_2(SEQ ID No. 213)는 표 1의 SEQ ID No. 2의 일부와 중첩된다(즉, 전체를 포함하지 않음). UDX_244_2는 213개의 염기쌍 길이이고 242개 염기쌍 길이인 SEQ ID No. 2와 73개 인접 염기쌍이 공통된다. 1번 염색체 상의 UDX_224_2의 시작 위치는 107140056이고 종료 위치는 107140173이다. SEQ ID No. 2의 시작 위치는 107140100이고 종료 위치는 107140341이다. 따라서, SEQ ID No. 2의 시작 위치가 UDX_224_2의 시작 위치와 종료 위치 사이에 있고 둘 다 1번 염색체 상에 있기 때문에, 이들 서열은 서로 “중첩된다”고 한다. 일부 특정 구현예에서, 예를 들어, 본원에 기재된 바와 같이, 대장암 및/또는 진행성 선종 메틸화 바이오마커는 3개 이상의 메틸화 좌위를 포함하고, 3개 이상의 메틸화 좌위 각각은 표 1 내지 표 1 중 어느 하나에서 식별된 유전자 영역이거나 이를 포함하며, 비제한적으로 각각 표 2 내지 4 중 하나에서 식별된 유전자 영역이거나 이를 포함하는 3개 이상의 메틸화 좌위 및 조합을 포함한다.

일부 특정 구현예에서, 예를 들어, 본원에 기재된 바와 같이, 대장암 및/또는 진행성 선종 메틸화 바이오마커는 3개의 메틸화 좌위를 포함하고, 이 3개의 메틸화 좌위는 표 2에서 식별된 유전자 영역이거나 이를 포함하는 메틸화 좌위를 포함한다. 본 명세서에 기재된 바와 같이, 대장암 메틸화 바이오마커는 10개의 메틸화 좌위를 포함하고, 10개의 메틸화 좌위는 표 3에서 식별된 유전자 영역이거나 이를 포함하는 메틸화 좌위를 포함한다. 바이오마커는 40개의 메틸화 좌위를 포함하고, 이 40개의 메틸화 좌위는 표 4에서 식별된 유전자 영역이거나 이를 포함하는 메틸화 좌위를 포함한다.

표 2.대장암 및/또는 진행성 선종의 진단에 중요도 순서로 순위 매긴 3개의 메틸화 좌위의 조합.
순서	UID	Chr.	시작 위치	종료 위치	서열 길이	유전자명	SEQ ID NO:
1	UDX_29_1	20	56925429	56925505	77	주석 없음	210
2	UDX_272.3_2	10	26211886	26211963	78	GAD2, MYO3A	201
3	UDX_277.7_2	8	52565318	52565408	93	ALKAL1	192

표 3. 대장암 및/또는 진행성 선종의 진단에 중요도 순서로 순위 매긴 10개의 메틸화 좌위의 조합.
순서	UID	Chr.	시작 위치	종료 위치	서열 길이	유전자명	SEQ ID NO:
1	UDX_29_1	20	56925429	56925505	77	주석 없음	210
2	UDX_272.3_2	10	26211886	26211963	78	GAD2, MYO3A	201
3	UDX_277.7_2	8	52565318	52565408	91	ALKAL1	192
4	UDX_272.4	10	26212057	26212160	104	GAD2, MYO3A	202
5	UDX_260.1	15	79089690	79089791	102	RASGRF1	218
6	UDX_174.3	8	17026935	17027030	96	MICU3	208
7	UDX_260.2_1	15	79089784	79089858	75	RASGRF1	219
8	UDX_137.1	10	127736483	127736589	107	FOXI2	200
9	UDX_17_2	10	16520591	16520719	129	C1QL3	193
10	UDX_230	9	21970919	21971017	99	CDKN2A, CDKN2B-AS1	195

표 4. 대장암 및/또는 진행성 선종의 진단에 중요도 순서로 순위 매긴 40개의 메틸화 좌위의 조합.
서UID	Chr.	시작 위치	종료 위치	서열 길이	유전자명	SEQ ID NO:
UDX_29_1	20	56925429	56925505	77	주석 없음	210
UDX_272.3_2	10	26211886	26211963	78	GAD2, MYO3A	201
UDX_277.7_2	8	52565318	52565408	91	ALKAL1	192
UDX_272.4	10	26212057	26212160	104	GAD2, MYO3A	202
UDX_260.1	15	79089690	79089791	102	RASGRF1	218
UDX_174.3	8	17026935	17027030	96	MICU3	208
UDX_260.2_1	15	79089784	79089858	75	RASGRF1	219
UDX_137.1	10	127736483	127736589	107	FOXI2	200
UDX_17_2	10	16520591	16520719	129	C1QL3	193
UDX_230	9	21970919	21971017	99	CDKN2A, CDKN2B-AS1	195
UDX_117.2	1	114153294	114153403	110	SYT6	223
UDX_1_1	17	35448307	35448407	101	SLFN13	222
UDX_185.1	4	176001299	176001402	104	GPM6A	205
UDX_24_1	18	136766100	75916621	90	주석 없음	211
UDX_221.2_2	2	75916502	136766189	120	THSD7B	224
UDX_242_2	19	56393661	56393732	72	ZNF582-AS1, ZNF582	229
UDX_120.2	15	45378328	45378410	83	GATM	203
UDX_250.1	19	37551665	37551748	84	ZNF540, ZNF571-AS1	227
UDX_128.1	21	33070632	33070711	80	OLIG1	214
UDX_222.1	3	96813876	96813987	112	EPHA6	198
UDX_197.3	12	63668267	63668380	114	DPY19L2	197
UDX181.2_1	14	70189011	70189101	91	SLC8A3, LOC646548	220
UDX_251.2_1	10	25934064	25934130	67	MYO3A, LOC101929073	209
UDX_85.2_1	2	209771686	209771755	70	UNC80	225
UDX_66.2	7	154304858	154304969	112	DPP6	196
UDX_107.2	14	77966334	77966434	101	주석 없음	212
UDX_258.2_1	19	36973533	36973602	70	ZNF568	228
UDX_30_1	16	87601410	87601511	102	JPH3	206
UDX_217.4_1	19	36666981	36667097	117	ZNF461	226
UDX_244_2	1	107140057	107140173	117	NTNG1	213
UDX_198.5_1	4	61202278	61202367	90	ADGRL3	191
UDX_224.14	21	26844768	26844877	110	ADAMTS1	190
UDX_124.1	18	28177440	28177533	94	CDH2	194
UDX_121.1	2	5673895	5673976	82	LINC01248	207
UDX_274.2_1	12	15322353	15322435	83	PTPRO, RERG	216
UDX181.4_1	14	70189228	70189296	69	SLC8A3, LOC646548	221
UDX_222.11_2	3	96814055	96814137	83	EPHA6	199
UDX_94.2_2	9	36986522	36986581	60	PAX5	215
UDX114.1_1	5	180353710	180353815	106	GFPT2	204
UDX_274.3_1	12	15322478	15322549	72	PTPRO, RERG	217

본원에 제공된 바와 같이, DMR은 각각이 표 1에서 식별된 유전 영역(전체 또는 일부)이거나 이를 포함하는 메틸화 좌위에 존재하는 하나 이상의 DMR 중 임의의 것일 수 있다. 일부 특정 구현예에서, 예를 들어, 본원에 기재된 대장암 및/또는 진행성 선종 메틸화 바이오마커는 표 1에서 확인된 유전자 영역의 전부 또는 일부를 포함하거나 이에 존재하는 단일 DMR이거나 이를 포함한다.

일부 특정 구현예에서, 예를 들어 본원에 기재된 바와 같은 대장암 메틸화 바이오마커는 3개 이상의 DMR을 포함하고, 이들 각각은 표 1에서 식별된 유전자 영역의 전부 또는 일부를 포함하거나, 이에 존재한다. 일부 구현예에서, 본원에 기재된 바와 같이, 대장암 메틸화 바이오마커는 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 44, 43, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68 또는 69 개 DMR을 포함하고, 이들 각각은 표 1에서 식별된 유전자 영역(전체 또는 일부)을 포함한다.

일부 특정 구현예에서, 예를 들어 본원에 기재된 바와 같이, 대장암 및/또는 진행성 선종 메틸화 바이오마커는 2개 이상의 DMR을 포함하고, 2개 이상의 DMR 각각은 표 1-4 중 어느 하나에서 식별된 유전자의 전부 또는 일부를 포함하거나 이에 존재한다. 일부 특정 구현예에서, 예를 들어, 본원에 기재된 바와 같이, 대장암 메틸화 바이오마커는 3개의 DMR을 포함하고, 이 3개의 DMR은 표 2에서 식별된 유전자 영역의 전부 또는 일부를 포함하거나 존재하는 DMR을 포함한다. 일부 특정 구현예에서 예를 들어, 본 명세서에 기재된 바와 같이, 대장암 및/또는 진행성 선종 메틸화 바이오마커는 10개의 DMR을 포함하고, 이 10개의 DMR은 표 3에서 식별된 유전자 영역의 전부 또는 일부를 포함하거나, 존재하는 DMR을 포함한다. 일부 특정 구현예에서, 예를 들어, 본원에 기재된 바와 같이, 대장암 메틸화 바이오마커는 40개의 DMR을 포함하고, 이 중 40개의 DMR은 표 4에서 확인된 유전자 영역의 전부 또는 일부를 포함하거나, 이에 존재하는 DMR을 포함한다.

다양한 구현예에서, 예컨대 본원에 개시된, 메틸화 바이오마커는 본 명세서에 제공된 하나 이상의 메틸화 좌위(예컨대 하나 이상의 DMR) 내에 존재하는 하나 이상의 개별 뉴클레오티드(예컨대, CpG와 관련하여 단일 개별 시스테인 잔기) 또는 복수의 개별 시스테인 잔기(예컨대, 복수의 CpG)이거나 이를 포함할 수 있다. 따라서, 특정 구현예에서 메틸화 바이오마커는 복수의 개별 메틸화 부위의 메틸화 상태이거나 이를 포함한다.

다양한 구현예에서, 예컨대 본원에 개시된, 메틸화 바이오마커는 하나 이상의 메틸화 좌위(예컨대, 하나 이상의 DMR) 내의 하나 이상의 메틸화 부위의 메틸화의 변화인 메틸화 상태의 변화이거나 이를 포함하거나 이를 특징으로 한다. 다양한 구현예에서, 예컨대 본원에 개시된, 메틸화 바이오마커는 하나 이상의 메틸화 좌위(예컨대, 하나 이상의 DMR) 내의 메틸화된 부위의 수의 변화인 메틸화 상태의 변화이거나 이를 포함한다. 다양한 구현예에서, 예컨대 본원에 개시된, 메틸화 바이오마커는 하나 이상의 메틸화 좌위(예컨대, 하나 이상의 DMR) 내의 메틸화 부위의 빈도의 변화인 메틸화 상태의 변화이거나 이를 포함한다. 다양한 구현예에서, 예컨대 본원에 개시된, 메틸화 바이오마커는 하나 이상의 메틸화 좌위(예컨대, 하나 이상의 DMR) 내의 메틸화 부위 패턴의 변화인 메틸화 상태의 변화이거나 이를 포함한다.

다양한 구현예에서, 예컨대 본원에 개시된, 하나 이상의 메틸화 좌위(예컨대, 하나 이상의 DMR)의 메틸화 상태는 메틸화되는 샘플에 존재하는 하나 이상의 메틸화 좌위(예컨대, 하나 이상의 DMR)의 분율(fraction) 또는 백분율로 표현되고, 예를 들어, 하나 이상의 특정 메틸화 좌위(예컨대, 하나 이상의 특정 DMR)에서 메틸화된 샘플 내 개별 DNA 가닥 수의 분율로 표현된다. 당업자는 일부 예에서, 예컨대 본원에 개시된, 메틸화 분율 또는 백분율이, 예를 들어 샘플 내에서 하나 이상의 분석된 DMR에 대한 메틸화된 DMR 대 메틸화되지 않은 DMR의 비율로부터 계산될 수 있음을 이해할 것이다. 특정 예에서, 예컨대 본원에 개시된, 하나 이상의 메틸화 좌위(예컨대, 하나 이상의 DMR)의 메틸화 상태는 메틸화된 CpG 섬의 하나 이상의 영역의 분율 또는 백분율로 표현된다.

다양한 구현예에서, 예컨대 본원에 개시된, 하나 이상의 메틸화 좌위(예컨대, 하나 이상의 DMR)의 메틸화 상태를 기준 메틸화 상태 값 및/또는 기준 샘플의 메틸화 좌위(예컨대, 하나 이상의 DMR)의 메틸화 상태와 비교한다. 특정 예에서, 예컨대 본원에 개시된, 기준은 동일한 공급원으로부터의 비동시적 샘플, 예를 들어, 동일한 공급원으로부터의, 예컨대 동일 대상체로부터의 선행 샘플이다. 특정 예에서, 예컨대 본원에 개시된, 하나 이상의 메틸화 좌위(예컨대, 하나 이상의 DMR)의 메틸화 상태에 대한 기준은 샘플(예컨대, 대상체로부터의 샘플), 또는 특정 상태(예컨대, 암성 상태 또는 비암성 상태)를 나타내는 것으로 알려진 복수의 샘플에서의 하나 이상의 메틸화 좌위(예컨대, 하나 이상의 DMR)의 메틸화 상태이다. 따라서, 기준은 하나 이상의 미리 결정된 임계값이거나 이를 포함할 수 있으며, 임계값은 정량적(예컨대, 메틸화 값) 또는 정성적일 수 있다. 특정 예에서, 예컨대 본원에 개시된, DMR의 메틸화 상태에 대한 기준은 DMR의 뉴클레오티드를 포함하지 않는 동일 샘플에 존재하는 뉴클레오티드 또는 복수의 뉴클레오티드(예컨대, 복수의 인접 올리고뉴클레오티드)의 메틸화 상태이다. 당업자는 기준 측정이 일반적으로 비-기준(non-reference) 측정이 수행된 것과 동일하거나 유사하거나 필적하는 방법론을 사용한 측정에 의해 생성된다는 것을 이해할 것이다. 임의의 특정 과학적 이론에 얽매이지 않으나, 도 16은 유전자의 조절 서열의 과메틸화 또는 저메틸화가 발현에 영향을 미칠 수 있는 한 가지 가능한 메커니즘의 개략도를 제공한다. 도 16에 도시된 바와 같이, 저메틸화는 발현 증가를 초래할 수 있고/있거나 과메틸화는 발현 억제를 초래할 수 있다. 다양한 예에서, 예컨대 본원에 개시된, 참조와 비교하여 프로모터 영역 및 인핸서 영역과 같은 발현 조절 영역의 증가된 메틸화는 작동적으로(operably) 연결된 유전자, 예를 들어, 전형적으로 암을 억제하도록 작용하는 작동적으로 연결된 유전자의 발현을 감소시키거나 침묵시킬 수 있다. 다양한 구현예에서, 예컨대 본원에 개시된, 기준과 비교하여 프로모터 영역 및 인핸서 영역과 같은 발현 조절 영역의 감소된 메틸화는 작동적으로 연결된 유전자, 예를 들어 종양발생에 기여하는 활성을 갖는 작동적으로 연결된 유전자의 발현을 증가시킬 수 있다. 특정 과학 이론에 얽매이지 않고, DNA 메틸화는 RNA 발현 또는 단백질 발현 자체보다 암 상태의 화학적 및 생물학적으로 더 안정적인 지표를 제공할 수 있다.

메틸화는 일반적으로 DNA 서열 분석에 반드시 존재하지 않는 정보 차원을 제공하는, 고도로 조직 특이적인 것으로 생각된다.

종양발생에 실질적으로 기여하는 메틸화 사건은 예컨대, 일반적으로 암을 억제하는 작용을 하는 유전자와 같은 암-관련 유전자와 작동적으로 연결된 DNA의 발현 조절 영역에서(예컨대 프로모터 영역, 인핸서 영역, 전사 인자 결합 부위, CTCF-결합 부위, CpG 섬, 또는 기타 서열에서) 일어날 수 있다. 따라서, 전형적으로 암을 억제하는 작용을 하는 유전자의 불활성화는 종양발생을 초래하거나 이에 기여한다.

암

본 명세서의 방법 및 조성물은 암, 특히 대장암 및 대장암에 대한 전구체 종양(예컨대 진행성 선종)에 대한 스크리닝에 유용하다. 대장암은 결장암, 직장암 및 이들의 조합을 포함하나 이에 제한되지는 않는다. 대장암에는 전이성 대장암과 비전이성 대장암이 있다. 대장암은 결장의 근위부에 위치한 암과 결장의 원위부에 위치한 암을 포함한다.

대장암은 예를 들어, 병기 I, 병기 II, 병기 III, 및 병기 IV 대장암(예컨대, 병기 0, I, IIA, MB, IIC, IIIA, NIB, NIC, IVA, IVB 및 IVC 를 포함)을 포함하는 당업계에 공지된 다양한 가능한 병기의 대장암을 포함한다. 대장암은 종양/결절/전이(TNM) 병기 시스템의 모든 단계를 포함한다. 대장암과 관련하여, T는 종양이 결장 또는 직장의 벽 내로 성장했는지 여부, 그리고 성장했다면 몇개 층으로 성장했는지를 나타낼 수 있다; N은 종양이 림프절로 전파되었는지 여부와 전파된 경우 림프절의 수와 위치를 나타낼 수 있다; 그리고 M은 암이 신체의 다른 부위로 전파되었는지 여부와 전파되었다면 어느 부위에 어느 정도로 전파되었는지를 나타낼 수 있다. T, N 및 M의 구체적 단계는 당업계에 공지되어 있다. T 병기는 TX, TO, Tis, T1, T2, T3, T4a 및 T4b를 포함할 수 있고; N 병기는 NX, NO, N1a, N1b, N1c, N2a 및 N2b를 포함할 수 있다. M 병기는 M0, M1a 및 M1b를 포함할 수 있다. 또한, 대장암의 등급에는 GX, G1, G2, G3 및 G4가 포함될 수 있다. 암, 특히 대장암의 다양한 병기화 수단은 예를 들어, 월드 와이드 웹(cancer.net/cancer-types/colorectal-cancer/병기s)에 요약되어 있는 바와 같이 당업계에 잘 알려져 있다.

특정 예에서, 예컨대 본원에 개시된 바와 같이, 본원은 초기 대장암의 스크리닝을 포함한다. 초기 대장암은 예컨대 대상체 내에 국한된 대장암, 예컨대 대상체의 림프절, 예컨대 암에 가까운 림프절로 아직 전파되지 않고(병기 N0), 원위부로 전파되지 않은(병기 M0)를 포함할 수 있다. 초기 병기의 암은 예를 들어 단계 0 내지 II C에 상응하는 대장암을 포함한다.

따라서, 본 명세서의 대장암은 무엇보다도 전악성(pre-malignant) 대장암(예컨대 진행성 선종) 및 악성(malignant) 대장암을 포함한다. 본 명세서의 방법 및 조성물은 본 명세서에 명명되거나 달리 당업계에 공지된 것을 포함하나 이에 제한되지 않는 모든 형태 및 단계의 대장암, 뿐만 아니라 그의 모든 하위집합의 스크리닝에 유용하다. 따라서, 당업자는 본원에 제공된 대장암에 대한 모든 참조가 본원에 명명되거나 당업계에 달리 공지된 것을 포함하나 이에 제한되지 않는 모든 형태 및 단계의 대장암 및 그 하위 집합을 포함함을 이해할 것이다.

대상체 및 샘플

본 문서에 제공된 방법과 구성을 사용하여 분석한 샘플은 생물학적 샘플 및/또는 핵산을 포함한 샘플일 수 있다. 다양한 특정 구현예에서, 본원에 제공된 방법 및 조성물을 사용하여 분석된 샘플은 포유동물로부터의 샘플일 수 있다. 다양한 특정 구현예에서, 본원에 제공된 방법 및 조성물을 사용하여 분석된 샘플은 인간 대상체로부터의 샘플일 수 있다. 다양한 특정 구현예에서, 본원에 제공된 방법 및 조성물을 사용하여 분석된 샘플은 마우스, 쥐, 돼지, 말, 닭 또는 소로부터의 샘플일 수 있다.

다양한 예에서, 예컨대 본원에 개시된, 인간 대상체는 대장암 또는 진행성 선종과 같은 전암성 종양과 같은 암이 있는 것으로 진단되거나 진단을 구하거나, 있을 위험이 있는 것으로 진단되거나 진단을 구하거나, 및/또는 있을 즉각적 위험이 있는 것으로 진단되거나 진단을 구하는 대상체이다. 다양한 예에서, 예컨대 본원에 개시된, 인간 대상체는 대장암 및/또는 진행성 선종 스크리닝이 필요한 대상체로 확인된 대상체이다. 특정 예에서, 예컨대 본원에 개시된, 인간 대상체는 의사에 의해 대장암 및/또는 진행성 선종 스크리닝이 필요한 것으로 확인된 대상체다. 다양한 예에서, 예컨대 본원에 개시된, 인간 대상은 연령, 예를 들어 50세 이상, 예를 들어 50, 55, 60, 65, 70, 75, 80, 85 또는 90세 이상의 연령으로 인해 스크리닝이 필요한 것으로 확인된다. 다양한 예에서, 예컨대 본원에 개시된, 인간 대상체는 대장암 또는 진행성 선종과 같은 전암성 종양과 같은 암에 대한 진단을 받지 않은, 가질 위험이 없는, 즉각적인 위험이 없는, 갖는 것으로 진단되지 않은 및/또는 진단을 구하지 않는 대상체, 또는 이들의 조합이다.

대상체, 예를 들어 인간 또는 다른 포유동물 대상체로부터의 샘플은 예를 들어 혈액, 혈액 성분, cfDNA, ctDNA, 대변 또는 결장직장 조직의 샘플일 수 있다. 일부 특정 구현예에서, 샘플은 대상체의 배설물 또는 체액(예컨대, 대상체의 타액, 대변, 혈액, 림프 또는 소변) 또는 대장암 조직 샘플, 또는 선종 또는 폴립 조직 샘플 이다. 대상체로부터의 샘플은 세포 또는 조직 샘플, 예를 들어, 암에 속하거나 암세포, 예를 들어 종양 또는 전이성 조직을 포함하는 세포 또는 조직 샘플일 수 있다. 다양한 구현예에서, 예컨대 본원에 개시된, 대상체, 예를 들어 인간 또는 다른 포유동물 대상체로부터의 샘플은 생검(예컨대, 미세 바늘 흡인 또는 조직 생검) 또는 수술에 의해 수득될 수 있다.

다양한 구현예에서, 예컨대 본원에 개시된, 샘플은 무세포 DNA(cfDNA)의 샘플이다. cfDNA는 일반적으로 짧은, 이중 가닥 단편으로 인간 생체 유체(예컨대, 혈장, 혈청 또는 소변)에서 발견된다. cfDNA의 농도는 일반적으로 낮지만 임신, 자가면역 장애, 심근 경색증 및 암을 포함하나 이에 국한되지 않는 특정 병태 하에서 상당히 증가할 수 있다. 순환 종양 DNA(ctDNA)는 특이적으로 암세포에서 유래한 순환 DNA의 구성 요소이다. ctDNA는 백혈구 및 적혈구에 결합되거나 백혈구 및 적혈구에 결합되지 않은 인간 생체 유체에 존재할 수 있다. 종양 유래 cfDNA 검출을 위한 다양한 테스트는 암(예컨대 관련 암) 또는 전암성 종양(예컨대 진행성 선종)의 특징인 유전적 또는 후성유전적 변형의 검출을 기반으로 한다. 암의 특징적인 유전적 또는 후성유전적 변형은 종양 억제 유전자의 발암성 또는 암 관련 돌연변이, 활성화된 종양유전자, 과메틸화 및/또는 염색체 장애를 포함할 수 있지만, 이에 제한되지는 않는다. 암의 특징적인 유전적 또는 후성유전적 변형의 검출은 검출된 cfDNA가 ctDNA임을 확인할 수 있다.

cfDNA 및 ctDNA는 공급원 조직의 메틸화 상태에 대한 실시간 또는 거의 실시간 메트릭을 제공한다. cfDNA 및 ctDNA는 혈액에서 약 2시간의 반감기를 나타내므로 주어진 시간에 채취한 샘플은 공급원 조직의 상태를 비교적 시기 적절하게 반영한다.

샘플로부터 핵산을 분리하는 다양한 방법(예컨대, 혈액 또는 혈장으로부터 cfDNA를 분리하는 방법)이 당업계에 공지되어 있다. 핵산은 예를 들어 비제한적으로, 직접 유전자 포획에 의하여(샘플 정화에 의하여 검정방지제(assay-inhibiting agent)를 제거하고 존재하는 경우 포획제를 갖는 정화된 샘플로부터 표적 핵산을 포획하여 포획 복합체를 생성하고, 포획 복합체를 단리하여 표적 핵산을 회수하여) 단리될 수 있다.

메틸화 상태 측정 방법

메틸화 상태는 당업계에 공지된 다양한 방법 및/또는 본원에 제공된 방법에 의해 측정될 수 있다. 당업자는 메틸화 상태를 측정하는 방법이 일반적으로 모든 공급원 및 모든 종류의 샘플에 적용될 수 있음을 이해할 것이며, 샘플을 주어진 방법론에 의한 측정에 적합한 형태로 변형하기 위해 사용가능한 가공 단계를 또한 알 것이다. 메틸화 상태를 측정하는 방법은 비제한적으로, 메틸화 상태 특이적 중합효소 연쇄 반응(PCR)을 포함하는 방법, 핵산 시퀀싱을 포함하는 방법, 질량 분석을 포함하는 방법, 메틸화 민감성 뉴클레아제를 포함하는 방법, 질량 기반 분리를 포함하는 방법, 표적 특이적 포획을 포함하는 방법, 메틸화 특이적 올리고뉴클레오티드 프라이머를 포함하는 방법, 혼성화-포획 표적화 차세대 시퀀싱을 포함하는 방법, 앰플리콘 기반 표적화 차세대 시퀀싱을 포함하는 방법, 및 전체 게놈 중아황산염 시퀀싱을 포함하는 방법을 포함한다. 메틸화에 대한 특정 구체 분석은 중아황산염 시약(예컨대 아황산수소 이온)을 사용한다.

중아황산염 시약은 무엇보다도 중아황산염, 디설파이트, 아황산수소 또는 이들의 조합을 포함할 수 있으며, 이러한 시약은 메틸화된 핵산 및 메틸화되지 않은 핵산을 구별하는 데 유용할 수 있다. 중아황산염은 시토신 및 5-메틸시토신과 상이하게 상호작용한다. 전형적인 중아황산염 기반 방법에서 중아황산염과 DNA의 접촉은 메틸화되지 않은 시토신을 우라실로 탈아미노화하는 반면 메틸화된 시토신은 영향을 받지 않고 남아 있다; 메틸화 시토신은 선택적으로 유지되지만 메틸화되지 않은 시토신은 유지되지 않는다. 따라서, 중아황산염 처리된 샘플에서, 우라실 잔기는 메틸화되지 않은 시토신 잔기 대신에 서서 이에 대한 식별 신호를 제공하는 반면, 나머지 (메틸화된) 시토신 잔기는 따라서 메틸화된 시토신 잔기에 대한 식별 신호를 제공한다. 중아황산염 처리된 샘플은 예컨대 PCR 또는 전체 게놈 중아황산염 시퀀싱에 의해 분석될 수 있다.

다양한 메틸화 분석 절차는 DMR과 같은 표적 서열의 메틸화 상태를 결정하기 위해 중아황산염 처리와 함께 사용될 수 있다. 이러한 분석에는 특히 메틸화 특이적 제한 효소 qPCR, 메틸화 민감성 제한 효소 qPCR, 중아황산염 처리 핵산의 시퀀싱, PCR(예컨대 서열 특이적 증폭과 함께), 메틸화 특이적 뉴클레아제-보조 소수-대립유전자 농축 PCR, 메틸화 민감성 고해상도 용융, 혼성화-포획 표적화 차세대 시퀀싱, 및 앰플리콘 기반 표적화 차세대 시퀀싱이 포함될 수 있다. 일부 구현예에서, DMR은 중아황산염 처리된 DNA 샘플로부터 증폭되고 예를 들어 일루미나 프로토콜(lllumina protocol) 또는 전치 기반 Nextera XT 프로토콜에 따른 시퀀싱을 위해 DNA 시퀀싱 라이브러리가 준비된다. 특정 구현예에서, 고처리량 및/또는 차세대 시퀀싱 기술을 사용하여 메틸화 상태를 분석할 수 있게 하는 염기쌍 수준의 DNA 서열 해상도를 달성한다. 아황산수소염 처리와 병용하여 인간 게놈의 상당 부분(예컨대 >50%)을 커버하는 경우 이러한 전체 게놈 시퀀싱 기술을 통틀어 전체 게놈 아황산염 시퀀싱(Whole Genome Bisulfite Sequencing, WGBS)이라 지칭할 수 있다.

다양한 구현예에서, 예컨대 본원에 개시된, 메틸화 상태는 예를 들어 중아황산염 처리된 샘플에 적용된 바와 같이 메틸화-특이적 올리고뉴클레오티드 프라이머(MSP 방법)를 사용한 PCR 증폭을 포함하는 방법에 의해 검출된다(예컨대, Herman 1992 Proc. Natl. Acad. Sci. USA 93: 9821-9826 참조, 메틸화 상태를 결정하는 방법과 관련하여 본원에 참고로 포함됨). 중아황산염 처리 DNA의 증폭을 위한 메틸화 상태 특이적 올리고뉴클레오티드 프라이머를 사용하면 메틸화 핵산과 메틸화되지 않은 핵산을 구별할 수 있다. MSP 방법에 사용하기 위한 올리고뉴클레오티드 프라이머쌍은 메틸화 부위, 예를 들어 CpG를 포함하는 서열과 혼성화할 수 있는 적어도 하나의 올리고뉴클레오티드 프라이머를 포함한다. 시토신 잔기에 상보적인 위치에 T 잔기를 포함하는 올리고뉴클레오티드 프라이머는 중아황산염 처리 전에 시토신이 메틸화되지 않은 주형에 선택적으로 혼성화되는 반면, 시토신 잔기에 상보적인 위치에 G 잔기를 포함하는 올리고뉴클레오티드 프라이머는 중아황산염 처리 전에 시토신이 메틸화된 시토신인 주형에 선택적으로 혼성화한다. MSP 결과는 예를 들어 겔 전기영동을 사용하여 시퀀싱 앰플리콘을 사용하거나 사용하지 않고 얻을 수 있다. MSP(methylation-specific PCR)는 중아황산염-변환 DNA의 PCR 증폭을 사용하여 좌위 특이적 DNA 메틸화의 고감도 검출(전체 특이도로, 대립유전자의 0.1% 검출 수준)을 가능하게 한다.

샘플의 중아황산염 처리 후 메틸화 상태를 결정하기 위해 사용할 수 있는 또 다른 방법은 메틸화 민감성 고해상도 용융(Methylation-Sensitive High Resolution Melting; MS-HRM) PCR이다(예컨대 본 명세서에 메틸화 상태를 결정하는 방법과 관련하여 참조로서 통합되는 Hussmann 2018 Methods Mol Biol. 1708:551-571 참조) MS-HRM은 혼성화 용융을 기반으로 특정 관심 좌위에서 메틸화 수준을 검출하는 튜브 내(in tube) PCR 기반 방법이다. MS-HRM을 수행하기 전 DNA를 중아황산염 처리에 의해 메틸화된 DNA와 메틸화되지 않은 DNA 사이의 염기 조성이 달라지며, 이는 고해상도 용융으로 생성된 앰플리콘을 분리하는 데 사용된다. 고유한 프라이머 설계는 메틸화되지 않은 배경에서 0.1-1%까지 메틸화된 대립유전자를 검출할 수 있는 분석의 고감도를 용이하게 한다. MS-HRM 분석용 올리고뉴클레오티드 프라이머는 메틸화된 대립유전자에 상보성이도록 설계되었으며, 특정 어닐링 온도는 이들 프라이머가 메틸화된 대립유전자와 메틸화 되지 않은 대립유전자 모두에 어닐링할 수 있도록 하여 분석의 민감도를 증가시킨다.

샘플의 중아황산염 처리 후 메틸화 상태를 결정하는 데 사용할 수 있는 또 다른 방법은 정량적 다중 메틸화 특이적 PCR(Quantitative Multiplex Methylation-Specific PCR, QM-MSP)이다. QM-MSP는 DNA 메틸화의 민감한 정량화를 위해 메틸화 특이적 프라이머를 사용한다(예컨대, 메틸화 상태를 결정하는 방법과 관련하여 본원에 참조로 포함되는, Fackler 2018 Methods Mol Biol. 1708:473-496 참조). QM-MSP는 2단계 PCR 접근 방식으로, 1단계에서 한 쌍의 유전자 특이적 프라이머(정방향 및 역방향)가 하나의 PCR 반응에서 동일한 유전자의 메틸화된 사본과 메틸화되지 않은 사본을 동시에 다중으로 증폭한다. 이 메틸화-무관(methylation-independent) 증폭 단계는 36 사이클 PCR 후 μL 당 최대 10⁹ 카피의 앰플리콘을 생성한다. 2단계에서, 1단계 반응의 앰플리콘은 실시간 PCR과 두 개의 독립적인 형광단을 사용하여 표준 곡선으로 정량화되어 동일한 웰(예: 6FAM 및 VIC)에서 각 유전자의 메틸화/비메틸화 DNA를 검출한다. 100,000개의 기준 유전자 카피에서 1개의 메틸화된 카피를 검출할 수 있다.

샘플의 중아황산염 처리 후 메틸화 상태를 결정하는 데 사용할 수 있는 또 다른 방법은 메틸화 특이적 뉴클레아제-보조 소수-대립유전자 농축(Methylation Specific Nuclease-assisted Minor-allele Enrichment, MS-NaME)이다(예컨대, 메틸화 상태를 결정하는 방법과 관련하여 본원에 참조로 포함되는, Liu 2017 Nucleic Acids Res. 45(6):e39 참조). Ms-NaME는 이중 가닥(ds) DNA(DSN)에 특이적인 DNA 뉴클레아제의 존재 하에 표적 서열에 대한 프로브의 선택적 혼성화를 기반으로 하여, 혼성화는 DSN에 의해 후속적으로 절단되는 이중 가닥 DNA 영역을 초래한다. 따라서, 메틸화되지 않은 서열을 표적으로 하는 올리고뉴클레오티드 프로브는 메틸화되지 않은 표적의 절단을 초래하는 국부(local) 이중 가닥 영역을 생성하고; 메틸화된 서열에 혼성화할 수 있는 올리고뉴클레오티드 프로브는 메틸화된 표적의 절단을 초래하는 국부 이중 가닥 영역을 생성하여 메틸화된 표적을 손상시키지 않는다. 더욱이, 올리고뉴클레오티드 프로브는 동시에 중아황산염 처리된 DNA의 다중 표적에 DSN 활성을 지시할 수 있다. 후속 증폭은 비-절단(non-digested) 서열을 농축할 수 있다. Ms-NaME는 독립적으로 또는 본 명세서에 제공된 다른 기술과 조합하여 사용될 수 있다.

샘플의 중아황산염 처리 후 메틸화 상태를 결정하는 데 사용할 수 있는 또 다른 방법은 메틸화 민감성 단일 뉴클레오티드 프라이머 확장(Methylation-sensitive Single Nucleotide Primer Extension, Ms-SNuPE™)이다(예컨대, 메틸화 상태를 결정하는 방법과 관련하여 본원에 참조로 포함되는, Gonzalgo 2007 Nat Protoc. 2(8): 1931-6 참조). Ms-SNuPE에서 가닥 특이적 PCR은 Ms-SNuPE를 사용한 정량적 메틸화 분석을 위한 DNA 주형을 생성하기 위해 수행된다. 그런 다음 SNuPE는 조사되는 CpG 부위(들)의 바로 상류에서 혼성화하도록 설계된 올리고뉴클레오티드(들)로 수행된다. 반응 생성물은 형광체 이미지 분석에 의한 시각화 및 정량을 위해 폴리아크릴아미드 겔에서 전기영동될 수 있다. 앰플리콘은 또한 형광 표지, 방사성 핵종 또는 분리 가능한 분자 단편 또는 질량 분석에 의해 구별될 수 있는 질량을 갖는 기타 독립체와 같은 직접 또는 간접적으로 검출 가능한 표지를 가질 수 있다. 검출은 예를 들어 매트릭스 보조 레이저 탈착/이온화 질량 분석법(matrix assisted laser desorption/ionization mass spectrometry, MALDI) 또는 전자 분무 질량 분석법(electron spray mass spectrometry, ESI)을 사용하여 수행 및/또는 시각화할 수 있다.

샘플의 중아황산염 처리 후 메틸화 상태를 결정하는 데 사용할 수 있는 특정 방법은 증폭 기반 방법에서 제1 올리고뉴클레오티드 프라이머, 제2 올리고뉴클레오티드 프라이머 및 올리고뉴클레오티드 프로브를 사용한다. 예를 들어, 올리고뉴클레오티드 프라이머 및 프로브는 실시간 중합효소 연쇄 반응(PCR) 또는 액적 디지털 PCR(droplet digital PCR, ddPCR) 방법에 사용될 수 있다. 다양한 예에서, 예컨대 본원에 개시된, 제1 올리고뉴클레오티드 프라이머, 제2 올리고뉴클레오티드 프라이머 및/또는 올리고뉴클레오티드 프로브는 증폭 또는 프로브 신호가 샘플의 메틸화 상태를 나타내도록 메틸화된 DNA 및/또는 메틸화되지 않은 DNA를 선택적으로 혼성화한다.

메틸화 상태(예컨대, 5-메틸시토신의 수준의 존재)를 검출하기 위한 다른 중아황산염 기반 방법은 예를 들어 Frommer(본원에 참조로 포함되는, 1992 Proc Natl Acad Sci US A. 1;89(5): 1827-31)에 개시되어 있다.

메틸화 상태를 검출하기 위한 중아황산염 기반 방법은 앰플리콘 기반 표적화 차세대 시퀀싱(amplicon-based targeted next generation sequencing)을 포함할 수 있다. 예컨대, Masser(2015 J Vis Exp, (96):52488, doi: 10.3791/52488, 본 명세서에 참조로 포함됨) 참조. 일반적으로 앰플리콘 기반 표적화 차세대 시퀀싱은 차세대 라이브러리 구축과 함께 중아황산염 전환(bisulfite conversion) 및 영역 특이적 PCR 증폭을 활용하여 높은 처리량 방식으로 표적 관심 영역의 메틸화 상태를 조사한다.

메틸화 상태를 검출하기 위한 또 다른 중아황산염 기반 방법은 혼성화 포획 기반 표적화 차세대 시퀀싱(hybrid-capture based targeted next generation sequencing)을 포함할 수 있다. 예컨대 Ivanov(2013, Nucleic Acids Res, doi: 10.1093/nar.gks1467, 본 명세서에 참조로 포함됨) 참조. 일반적으로, 상기 방법은 중아황산염으로 게놈 DNA를 처리하는 것을 포함한다. 그런 다음, 표적 영역은 용액 또는 고체 지지체에 결합된 DNA 또는 RNA 프로브와 혼성화된다. 결합된 표적 영역은 그 후 공지된 프로토콜에 따라 농축되고 시퀀싱된다. Gasc(2016, Front. Microbiol., doi: 10.1093/nar/gkw309, 본 명세서에 참조로 포함됨) 참조.

메틸화 상태를 결정하는 데 사용할 수 있는 특정 방법에는 샘플의 중아황산염 처리가 포함되지 않는다. 예를 들어, 메틸화 상태의 변화는 PCR 증폭(예컨대, MSRE-qPCR에 의한) 전에 DNA가 하나 이상의 메틸화 민감성 제한 효소(MSRE)로 절단되는 PCR 기반 프로세스에 의해 검출될 수 있다. 일반적으로 MSRE에는 적어도 CpG 모티프를 포함하는 인식 부위를 가져, 5-메틸시토신이 포함된 경우 MSRE의 활성이 가능한 인식 부위를 절단하는 것이 차단되게 한다. (예컨대, Beikircher 2018 Methods Mol Biol. 1708:407-424 참조, 이는 본원에 참고로 포함됨). 따라서 MSRE는 MSRE 인식 부위의 메틸화 상태에 따라 핵산을 선택적으로 절단한다; 그들은 메틸화되지 않은 MSRE 인식 사이트에서 DNA를 절단할 수 있지만 메틸화된 MSRE 인식 사이트에서는 DNA를 절단할 수 없다. 특정 구현예에서, 샘플의 분취량은 MSRE로 절단되어 MSRE에 의해 메틸화되지 않은 DNA가 절단된 처리된 샘플을 생성하여, MSRE 인식 부위 내에 적어도 하나의 메틸화된 부위를 갖는 비절단된 및/또는 증폭 가능한 DNA의 비율이 MSRE 부위 내에 적어도 하나의 메틸화된 부위를 포함하지 않는(예컨대, DNA 분자의 각각의 MSRE 인식 부위 내에 적어도 하나의 메틸화된 부위를 포함하지 않는) 비절단된 및/또는 증폭 가능한 DNA에 비해 증가하게 할 수 있다. 그런 다음 제한 효소-절단된 샘플의 비절단된 서열을 예컨대 PCR에서 사전 증폭하고, 예컨대 qPCR, 실시간 PCR Ehsms 디지털 PCR에 의해 정량화할 수 있다. MSRE-qPCR용 올리고뉴클레오티드 프라이머는 하나 이상의 MSRE 절단 부위 및/또는 복수의 MSRE 절단 부위를 포함하는 영역을 증폭한다. 복수의 MSRE 절단 부위를 포함하는 앰플리콘은 일반적으로 강건한(robust) 결과를 얻을 가능성이 더 높다. DMR 앰플리콘 내 절단 부위의 수, 및 일부 경우 예컨대 본원에 개시된, DMR에 대한 메틸화 상태 결정의 결과적인 강건성(robustness)은 DMR 앰플리콘의 복수의 MSRE 인식 부위(단일 인식 부위와 반대로)를 포함하는 DMR의 설계에 의해 증가될 수 있다. 다양한 예에서, 예컨대 본원에 개시된, 복수의 MSRE는 예를 들어 Acil, Hin6l, HpyCH4IV 및 Hpall(예컨대, Acil, Hin6l 및 HpyCH4IV 포함) 중 둘 이상을 포함하는 동일 샘플에 적용될 수 있다. 복수의 MSRE(예: Acil, Hin6l, HpyCH4IV 및 Hpall의 조합, 또는 Acil, Hin6l 및 HpyCH4IV의 조합)는 DMR 앰플리콘 내에서 MSRE 인식 부위의 향상된 빈도를 제공할 수 있다.

MSRE-qPCR은 또한 MSRE에 의한 샘플 분해 후, 그러나 혈액 내 cfDNA의 낮은 유병률을 고려할 때 사용 가능한 샘플의 양을 개선하기 위해 qPCR 이전에, 사전 증폭 단계를 포함할 수 있다.

특정 MSRE-qPCR 구현예에서, 예컨대 본원에 개시된, 총 DNA의 양은 예를 들어 실시간 PCR 또는 디지털 PCR을 사용하여 천연(native)(예컨대, 절단되지 않은) 샘플의 분취량에서 측정된다.

다양한 증폭 기술은 단독으로 또는 메틸화 상태의 검출을 위해 본원에 설명된 다른 기술과 함께 사용될 수 있다. 본 명세서를 검토한 당업자는 당업계에 공지되어 있고/있거나 본원에 설명된 다양한 증폭 기술을 당업계에 알려져 있고/있거나 여기에 제공된 메틸화 상태 결정을 위한 다양한 다른 기술과 조합하는 방법을 이해할 것이다. 증폭 기술에는 PCR, 예를 들어 정량적 PCR(qPCR), 실시간 PCR 및/또는 디지털 PCR이 포함되지만 이에 국한되지 않는다. 당업자는 중합효소 증폭이 단일 반응에서 다중 표적의 증폭을 다중화할 수 있음을 이해할 것이다. PCR 앰플리콘은 일반적으로 길이가 100~2000 염기쌍이다. 다양한 예에서, 예컨대 본원에 개시된, 증폭 기술은 메틸화 상태를 결정하기에 충분하다.

디지털 PCR(dPCR) 기반 방법은 96개, 384개 또는 그 이상의 웰이 있는 플레이트의 웰에, 또는 예를 들어 미세유체 장치를 사용하여 개별 에멀젼 액적(ddPCR)에 샘플을 나누고 분배하여, 일부 웰에 하나가 이상의 주형 카피가 포함되고 나머지에 주형 카피를 포함되지 않도록 하는 것이 포함된다. 따라서, 웰당 주형 분자의 평균 수는 증폭 전에 1개 미만이다. 주형의 증폭이 발생하는 웰의 수는 주형 농도의 척도를 제공한다. 샘플이 MSRE와 접촉하면, 주형의 증폭이 발생하는 웰의 수는 메틸화된 주형의 농도의 척도를 제공한다.

다양한 구현예에서, 예컨대 본원에 개시된, MethyLight™와 같은 형광 기반 실시간 PCR 검정을 사용하여 메틸화 상태를 측정할 수 있다(예컨대, Campan 2018 Methods Mol Biol. 1708:497-513 참조, 이는 참조로 본원에 포함된다). MethyLight는 게놈 후보 영역의 DNA 메틸화를 민감하게 감지하고 정량화하는 정량적 형광 기반 실시간 PCR 방법이다. MethyLight는 메틸화 특이적 프라이밍과 메틸화 특이적 형광 프로빙을 조합하기 때문에 메틸화되지 않은 DNA의 높은 배경에 대해 저-빈도 메틸화 DNA 영역을 검출하는 데에 특히 적합하다. 또한 MethyLight는 질환 검출 및 스크리닝에 사용하여 개별 메틸화된 분자의 고민감성 검출를 위해 디지털 PCR과 조합할 수 있다.

메틸화 상태를 결정하는 데 사용되는 실시간 PCR 기반 방법에는 일반적으로 외부 표준 분석을 기반으로 하는 메틸화되지 않은 DNA에 대한 표준 곡선을 생성하는 단계가 포함된다. 표준 곡선은 적어도 두 지점에서 구성할 수 있으며 절단된 DNA에 대한 실시간 Ct 값 및/또는 절단되지 않은 DNA에 대한 실시간 Ct 값을 알려진 정량 표준과 비교할 수 있다. 특정 예에서, 예컨대 본원에 개시된, 샘플 Ct 값은 MSRE-절단 및/또는 절단되지 않은 샘플 또는 샘플 분취량에 대해 결정될 수 있으며, DNA의 게놈 등가물은 표준 곡선에서 계산될 수 있다. MSRE-절단 및 비절단 DNA의 Ct 값을 평가하여 절단된(예컨대, 효율적으로 절단된, 예컨대 Ct 값 45를 얻는) 앰플리콘을 식별할 수 있다. 절단 또는 절단되지 않은 조건에서 증폭되지 않은 앰플리콘도 식별할 수 있다. 관심 앰플리콘에 대한 수정된 Ct 값은 조건 간에 메틸화 상태의 상대적인 차이를 설정하기 위해 조건에 걸쳐 직접 비교할 수 있다. 대안적으로 또는 추가적으로, 절단된 DNA와 절단되지 않은 DNA의 Ct 값 사이의 델타 차이를 사용하여 조건 간의 메틸화 상태의 상대적 차이를 설정할 수 있다.

메틸화 상태를 측정하는 방법은 메틸화 상태를 결정하기 위한 대규모 병렬 시퀀싱(예컨대, 차세대 시퀀싱), 예를 들어 합성에 의한 시퀀싱, 실시간(예컨대, 단일 분자) 시퀀싱, 비드 에멀젼 시퀀싱, 나노포어 시퀀싱, 또는 당업계에 공지된 다른 시퀀싱 기술을 포함할 수 있으나 이에 제한되지 않는다. 일부 구현예에서, 예컨대 본원에 개시된, 메틸화 상태를 측정하는 방법은 예를 들어 염기쌍 분해(base-pair resolution)로, 전체 게놈 시퀀싱을 포함할 수 있다.

소정의 특정 구현예에서, 예를 들어 본원에 기재된 바와 같이, 다른 기술 중에서, MSRE-qPCR을 사용하여 단일 메틸화 좌위이거나 이를 포함하는 대장암 메틸화 바이오마커의 메틸화 상태를 결정할 수 있다. 소정의 특정 구현예에서, 예를 들어 본원에 기재된 바와 같이, 다른 기술 중에서, MSRE-qPCR을 사용하여 2 이상의 메틸화 좌위거나 이를 포함하는 대장암 및/또는 진행성 선종 메틸화 바이오마커의 메틸화 상태를 결정할 수 있다. 소정의 특정 구현예에서, 예를 들어 본원에 기재된 바와 같이, 다른 기술 중에서 MSRE-qPCR을 사용하여 단일 차등 메틸화 영역(DMR)이거나 이를 포함하는 대장암 및/또는 진행성 선종 메틸화 바이오마커의 메틸화 상태를 결정할 수 있다. 소정의 특정 구현예에서, 예를 들어 본원에 기재된 바와 같이, 다른 기술 중에서 MSRE-qPCR 사용하여 2 이상의 DMR이거나 이를 포함하는 대장암 및/또는 진행성 선종 메틸화 바이오마커의 메틸화 상태를 결정할 수 있다. 소정의 특정 구현예에서, 예를 들어 본원에 기재된 바와 같이, 다른 기술 중에서 MSRE-qPCR 사용하여 단일 메틸화 부위거나 이를 포함하는 대장암 및/또는 진행성 선종 메틸화 바이오마커의 메틸화 상태를 결정할 수 있다. 소정의 특정 구현예에서, 예를 들어 본원에 기재된 바와 같이, 다른 기술 중에서 MSRE-qPCR 사용하여 2 이상의 메틸화 부위거나 이를 포함하는 대장암 및/또는 진행성 선종 메틸화 바이오마커의 메틸화 상태를 결정할 수 있다. 다양한 구현예에서, 예를 들어, 본원에 기재된 바와 같이, 대장암 및/또는 진행성 선종 메틸화 바이오마커는 본원에 제공된 임의의 대장암 및/또는 진행성 선종 메틸화 바이오마커일 수 있다. 본원은 무엇보다도 DMR의 증폭, 예컨대 표 5에서 식별된 DMR의 증폭을 위한 올리고뉴클레오티드 프라이머 쌍을 포함한다.

소정의 특정 구현예에서, 예를 들어, 본원에 기재된 바와 같이, cfDNA 샘플은 대상체 혈장으로부터 유래되고 AciI, Hin6I, HpyCH4IV 및 HpaII(예컨대, AciI, Hin6I 및 HpyCH4IV) 중 하나 이상이거나 이를 포함하는 MSRE(메틸화 민감성 제한 효소)와 접촉된다. 절단된(digested) 샘플은 하나 이상의 DMR의 올리고뉴클레오티드 프라이머 쌍, 예를 들어 하기 표 5에 제공된 하나 이상의 올리고뉴클레오티드 프라이머 쌍으로 증폭될 수 있다. 표 5는 염색체 번호(Chr. No.), 고유 ID(unique ID, UID), 염색체 상의 유전자 영역의 시작 위치(start position), 염색체 상의 유전자 영역의 종료 위치(end position), 영역의 폭(Seq. Width) 및 MSRE-qPCR에 사용된 정방향 프라이머(Fp)와 역방향 프라이머(Rp)의 서열번호(SEQ ID No.), 및 정방향 및 역방향 프라이머에 의해 증폭된 DNA 영역의 SEQ ID NO. 절단된 DNA(digested DNA), 예컨대, 사전 증폭된 절단된 DNA는 하나 이상의 DMR의 올리고뉴클레오티드 프라이머 쌍, 예를 들어 하기 표 5에 제공된 하나 이상의 올리고뉴클레오티드 프라이머 쌍을 사용하여 qPCR로 정량화할 수 있다. 그런 다음 qPCR Ct 값은 결정되고 각 DMR 앰플리콘의 메틸화 상태를 결정하는 데 사용될 수 있다. 더 낮은 Ct 값(따라서 더 높은 45 - Ct 값)은 더 높은 메틸화 상태에 해당하며, 대장암 및/또는 진행성 선종이 있는 대상체에서 과메틸화를 나타낸다.

표 5. 상응하는 프라이머 쌍으로 식별된 40개의 상위 DMR.
염색체 번호	UID	시작 위치	종료 위치	서열 폭 (Seq. Width)	유전자 (주석된 경우)	정방향 프라이머 SEQ ID NO:	역방향 프라이머 SEQ ID NO:	증폭된 영역 SEQ ID NO.
21	UDX_224.14	26844768	26844877	110	ADAMTS1	70	110	150
4	UDX_198.5_1	61202278	61202367	90	ADGRL3	71	111	151
8	UDX_277.7_2	52565318	52565408	9	ALKAL1	72	112	152
10	UDX_17_2	16520591	16520719	129	C1QL3	73	113	153
18	UDX_124.1	28177440	28177533	94	CDH2	74	114	154
9	UDX_230	21970919	21971017	99	CDKN2A, CDKN2B-AS1	75	115	155
7	UDX_66.2	154304858	154304969	112	DPP6	76	116	156
12	UDX_197.3	63668267	63668380	114	DPY19L2	77	117	157
3	UDX_222.1	96813876	96813987	112	EPHA6	78	118	158
3	UDX_222.11_2	96814055	96814137	83	EPHA6	79	119	159
10	UDX_137.1	127736483	127736589	107	FOXI2	80	120	160
10	UDX_272.3_2	26211886	26211963	78	GAD2, MYO3A	81	121	161
10	UDX_272.4	26212057	26212160	104	GAD2, MYO3A	82	122	162
15	UDX_120.2	45378328	45378410	83	GATM	83	123	163
5	UDX114.1_1	180353710	180353815	103	GFPT2	84	124	164
4	UDX_185.1	176001299	176001402	104	GPM6A	85	125	165
16	UDX_30_1	87601410	87601511	102	JPH3	86	126	166
2	UDX_121.1	5673895	5673976	82	LINC01248	87	127	167
8	UDX_174.3	17026935	17027030	96	MICU3	88	128	168
10	UDX_251.2_1	25934064	25934130	67	MYO3A, LOC101929073	89	129	169
20	UDX_29_1	56925429	56925505	77	주석 없음	90	130	170
18	UDX_24_1	75916502	75916621	120	주석 없음	91	131	171
14	UDX_107.2	77966334	77966434	101	주석 없음	92	132	172
1	UDX_244_2	107140057	107140173	117	NTNG1	93	133	173
21	UDX_128.1	33070632	33070711	80	OLIG1	94	134	174
9	UDX_94.2_2	36986522	36986581	60	PAX5	95	135	175
12	UDX_274.2_1	15322353	15322435	83	PTPRO, RERG	96	136	176
12	UDX_274.3_1	15322478	15322549	72	PTPRO, RERG	97	137	177
15	UDX_260.1	79089690	79089791	102	RASGRF1	98	138	178
15	UDX_260.2_1	79089784	79089858	75	RASGRF1	99	139	179
14	UDX181.2_1	70189011	70189101	91	SLC8A3, LOC646548	100	140	180
14	UDX181.4_1	70189228	70189296	69	SLC8A3, LOC646548	101	141	181
17	UDX_1_1	35448307	35448407	101	SLFN13	102	142	182
1	UDX_117.2	114153294	114153403	110	SYT6	103	143	183
2	UDX_221.2_2	136766100	136766189	90	THSD7B	104	144	184
2	UDX_85.2_1	209771686	209771755	70	UNC80	105	145	185
19	UDX_217.4_1	36666981	36667097	117	ZNF461	106	146	186
19	UDX_250.1	37551665	37551748	84	ZNF540, ZNF571-AS1	107	147	187
19	UDX_258.2_1	36973533	36973602	70	ZNF568	108	148	188
19	UDX_242_2	56393661	56393732	72	ZNF582-AS1, ZNF582	109	149	189

당업자는 표 5에 제공된 올리고뉴클레오티드 프라이머쌍이 본원에 명시된 대장암 및/또는 진행성 선종 메틸화 바이오마커의 임의의 조합에 따라 사용될 수 있다는 것을 이해할 것이다. 당업자는 표 5의 올리고뉴클레오티드 프라이머쌍이 DRM의 특정 원하는 조합을 분석하기 위해 주어진 분석에 개별적으로 포함되거나 포함되지 않을 수 있음을 인식할 것이다.

당업자는 다른 올리고뉴클레오티드 프라이머쌍이 사용될 수 있지만 유용한 DMR 앰플리콘을 생성하기 위한 올리고뉴클레오티드 프라이머의 선택 및 페어링이 중요하고 상당한 기여를 나타낸다는 것을 추가로 이해할 것이다.

당업자는 qPCR을 위한 방법, 시약 및 프로토콜이 당업계에 잘 알려져 있음을 추가로 이해할 것이다. 기존의 PCR과 달리 qPCR은 증폭-반응성 형광 시스템을 사용하여, 예컨대 형광 검출능이 있는 열순환기와 조합하여, 시간 경과에 따른 증폭(예컨대 각 증폭 주기의 끝에서)에서 앰플리콘의 생성을 검출할 수 있다. qPCR에 사용되는 두 가지 일반적인 유형의 형광 리포터는 (i) 비결합된 경우 보다 결합된 경우 실질적으로 더 밝게 형광되는 이중가닥 DNA 결합 염료; 및 (ii) 표지된 올리고뉴클레오티드(예컨대, 표지된 올리고뉴클레오티드 프라이머 또는 표지된 올리고뉴클레오티드 프로브)를 포함한다.

당업자는 본원에 제공된 대장암에 대한 스크리닝 방법에서 복수의 메틸화 좌위(예컨대, 복수의 DMR)가 메틸화 상태에 대해 분석되는 구현예에서, 각 메틸화 좌위의 메틸화 상태는 다양한 형태 중 임의의 것으로 측정되거나 표시되고, 복수의 메틸화 좌위의 메틸화 상태(바람직하게는 각각이 동일, 유사, 또는 필적하는 방식으로 측정 및/또는 표시됨)가 함께 또는 누적적으로 다양한 형태 중 임의의 것으로 분석되거나 표시된다. 다양한 구현예에서, 각각의 메틸화 좌위의 메틸화 상태는 Ct 값으로서 측정될 수 있다. 다양한 구현예에서, 예컨대, 본원에 개시된, 각각의 메틸화 좌위의 메틸화 상태는 측정된 샘플과 기준 사이의 Ct 값의 차이로서 표현될 수 있다. 다양한 구현예에서, 예컨대, 본원에 개시된, 각 메틸화 좌위의 메틸화 상태는, 예를 들어, 각 메틸화 좌위를 과메틸화되거나 과메틸화되지 않은 것으로 식별함으로써 기준에 대한 정성적 비교로서 나타낼 수 있다.

단일 메틸화 좌위가 분석되는 예컨대, 본원에 개시된, 일부 구현예에서, 단일 메틸화 좌위의 과메틸화는 대상체가 대장암 및/또는 진행성 선종을 앓거나 앓을 가능성이 있다는 진단을 구성하는 반면, 단일 메틸화 좌위의 과메틸화 부재는 대상체가 대장암 및/또는 진행성 선종을 앓고 있지 않을 것 같다는 진단을 구성한다. 일부 구현예에서, 예컨대, 본원에 개시된, 분석된 복수의 메틸화 좌위의 단일 메틸화 좌위(예컨대, 단일 DMR)의 과메틸화는 대상체가 대장암 및/또는 진행성 선종을 앓고 있거나 이를 앓고 있을 가능성이 있다는 진단을 구성하는 반면, 복수의 분석된 메틸화 좌위는 대상체가 둘 모두의 병증(affliction)을 앓지 않을 것 같다는 진단을 구성한다. 일부 구현예에서, 예컨대, 본원에 개시된, 복수의 분석된 메틸화 좌위 중 결정된 메틸화 좌위의 과메틸화 백분율(예컨대, 미리 결정된 백분율)의 과메틸화(예컨대, 적어도 10%(예컨대, 적어도 10%, 적어도 20%, 적어도 30%, 적어도 40%, 적어도 50%, 적어도 60%, 적어도 70%, 적어도 80%, 적어도 90%, 또는 100%))는 대상체가 대장암을 앓거나 또는 앓을 가능성이 있다는 진단을 구성하는 반면, 복수의 분석된 메틸화 좌위 중 결정된 메틸화 좌위의 과메틸화 백분율(예컨대, 미리 결정된 백분율)의 과메틸화(예컨대, 적어도 10%(예컨대, 적어도 10%, 적어도 20%, 적어도 30%, 적어도 40%, 적어도 50%, 적어도 60%, 적어도 70%, 적어도 80%, 적어도 90%, 또는 100%))의 과메틸화의 부재는 대상체가 대장암 또는 진행성 선종을 앓을 것 같지 않다는 진단을 구성한다. 일부 구현예에서, 예컨대, 본원에 개시된, 복수의 분석된 메틸화 좌위(예컨대, 2, 3, 4, 5, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 또는 40개의 DMR) 중 메틸화 좌위의 결정된 수(예컨대, 예정된 수)(예컨대, 적어도 1, 2, 3, 4, 5, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 또는 40개 좌위 DMR)의 과메틸화는 대상체가 대장암 및/또는 진행성 선종을 앓고 있거나 이를 가능성이 있다는 진단을 구성하는 반면, 복수의 분석된 메틸화 좌위(예컨대, 2, 3, 4, 5, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 또는 40개의 DMR) 중 메틸화 좌위의 결정된 수(예컨대, 예정된 수)(예컨대, 적어도 1, 2, 3, 4, 5, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27 , 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 또는 40개의 DMR)의 과메틸화의 부재는 대상체가 대장암 또는 진행성 선종을 앓을 것 같지 않다는 진단을 구성한다.

일부 구현예에서, 예컨대, 본원에 개시된, 복수의 메틸화 좌위(예컨대, 복수의 DMR)의 메틸화 상태를 정성적으로 또는 정량적으로 측정하고 복수의 메틸화 좌위 각각에 대한 측정치를 조합하여 진단을 제공한다. 일부 구현예에서, 예컨대, 본원에 개시된, 복수의 메틸화 좌위 각각의 정량적으로 측정된 메틸화 상태는 개별적으로 가중되고, 가중 값은 진단을 제공하기 위해 기준과 비교할 수 있는 단일 값을 제공하도록 조합된다. 이러한 접근법의 일예를 제공하기 위해, 본 명세서의 복수의 메틸화 좌위의 메틸화 상태를 분석하여 진단을 생성하기 위해 지지 벡터 머신(support vector machine, SVM) 알고리즘이 사용될 수 있다. 서포트 벡터 머신 알고리즘의 적어도 하나의 목적은 최대 마진, 즉 두 클래스의 데이터 포인트 사이의 최대 거리를 갖는 평면을 찾기 위한 목적으로 데이터 포인트를 뚜렷하게 분류하는 N 차원 공간(N- 특징의 수)에서 초평면을 식별하는 것이다. 본 실시예에서 논의된 바와 같이, SVM 모델은 트레이닝 샘플 세트(예컨대, 트레이닝 대상체군)에서 유래한 마커 값(예컨대, Ct 값)에 의거하며, 마커 값은 지지 벡터 값으로 변환되며 이를 기반으로 예측이 이루어진다. SVM 모델을 검증 샘플 세트의 신규 샘플에 적용할 때 샘플은 모델 벡터 공간에 매핑되고, 예컨대 두 조건 간의 갭에 대한 각 신규 샘플 위치에 기반하여, 제1 조건(예컨대, 대조군), 제2 조건(예컨대, 대장암으로 진단된 군), 또는 제3 군(예컨대, 진행성 선종으로 진단된 군)에 속할 확률을 갖는 것으로 분류된다. 당업자는 관련 조성물 및 방법이 식별되면, R-패키지의 예측 () 기능으로 정의된 SVM 알고리즘과 조합하여 벡터 값을 사용하여(하이퍼텍스트 트랜스퍼 프로토콜 시큐어(HTTPS)://cran.r-project.org/web/packages/e1071/index.html 참조, SVM이 여기에 참조로 포함됨) 새 샘플에 대한 예측을 쉽게 생성할 수 있음을 이해할 것이다. 따라서, 본 명세서에 개시된 대장암 및/또는 진행성 선종 진단을 위한 조성물 및 방법을 사용하면(그리고 그때만) R-패키지의 예측 () 기능과 조합된 알고리즘 입력 정보를 활용하는 예측 모델의 생성(하이퍼텍스트 트랜스퍼 프로토콜 시큐어(HTTPS)://cran.r-project.org/web/packages/e1071/index.html 참조, SVM이 여기에 참조로 포함됨)을 통해 대장암 및/또는 진행성 선종 진단을 제공하는 것은 간단할 것이다. 당업자는 본 명세서를 사용하면, SVM 벡터의 생성은 본원에 제공되고 달리 당업계에 공지된 방법에 따라 달성될 수 있음을 이해할 것이다.

적용

본 명세서의 방법 및 조성물은 임의의 다양한 적용에서 사용될 수 있다. 예를 들어, 본 명세서의 방법 및 조성물은 대장암 또는 진행성 선종을 스크리닝하거나 스크리닝을 보조하기 위해 사용될 수 있다. 다양한 예에서, 예컨대, 본원에 개시된, 본 명세서의 방법 및 조성물을 사용한 스크리닝은 초기 대장암을 포함하나 이에 제한되지 않는 임의의 병기의 대장암을 검출할 수 있으며 진행성 선종을 검출할 수 있다. 일부 구현예에서, 예컨대, 본원에 개시된, 본 명세서의 방법 및 조성물을 사용한 대장암 및 진행성 선종 스크리닝은 50세 이상, 예를 들어 50, 55, 60, 65, 70, 75, 80, 85, 또는 90세 이상의 개체에게 적용된다. 일부 구현예에서, 예컨대, 본원에 개시된, 본 명세서의 방법 및 조성물을 사용한 대장암 및 진행성 선종 스크리닝은 20세 이상의 개체, 예를 들어 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75세, 80세, 85세 또는 90세 이상의 개체에 적용된다. 일부 구현예에서, 예컨대, 본원에 개시된, 본 명세서의 방법 및 조성물을 사용한 대장암 및/또는 진행성 선종 스크리닝은 20 내지 50세, 예를 들어 20 내지 30세, 20 내지 40세, 20 내지 50세, 30세 내지 40세, 30세 내지 50세, 또는 40세 내지 50세의 개체에 적용된다. 다양한 구현예에서, 예컨대, 본원에 개시된, 본 명세서의 방법 및 조성물을 사용한 대장암 및/또는 진행성 선종 스크리닝은 복통 또는 소화불편감(abdominal discomfort)을 경험하는 개체, 예를 들어 진단되지 않거나 불완전하게 진단된 복통 또는 소화불편감을 경험하는 개체에 적용된다. 다양한 구현예에서, 예컨대, 본원에 개시된, 본 명세서의 방법 및 조성물을 사용한 대장암 및/또는 진행성 선종 스크리닝은 대장암과 연관될 가능성이 있는 증상을 경험하지 않는 개체에 적용된다. 따라서, 특정 구현예에서, 예컨대, 본원에 개시된, 본 명세서의 방법 및 조성물을 사용한 대장암 스크리닝은 적어도 대장암의 후기 또는 비-초기 병기와 관련하여 완전히 또는 부분적으로 예방적 또는 예방적이다.

다양한 구현예에서, 예컨대, 본원에 개시된, 본 명세서의 방법 및 조성물을 사용한 대장암 및/또는 진행성 선종 스크리닝은 무증상 인간 대상체에 적용될 수 있다. 본 명세서에서 사용된 바와 같이, 대상체가 보고하지 않거나 및/또는 비침습적으로 관찰 가능한 표시(예컨대, 장치 기반 프로빙, 조직 샘플 분석, 체액 분석, 수술 또는 대장암 검진 중 하나, 여러 개 또는 모두 없이), 대상체가 대장암 및/또는 진행성 선종을 앓을 가능성이 있다는 의학적으로 합리적인 의심을 뒷받침하는 대장암 및/또는 진행성 선종의 충분한 특성에 의해 입증하지 않는다면 대상체는 "무증상"으로 지칭될 수 있다. 초기 대장암 또는 진행성 선종의 존재의 검출은 본 명세서의 방법 및 조성물에 따라 선별된 무증상 개체에서 특히 가능성이 있다.

다양한 구현예에서, 예컨대 본원에서 개시된, 본 명세서의 방법 및 조성물을 사용한 대장암 및/또는 진행성 선종 스크리닝은 증상이 있는 인간 대상체에 적용될 수 있다. 본 명세서에서 사용된 바와 같이, 대상체가 보고하거나 및/또는 비침습적으로 관찰 가능한 표시(예컨대, 장치 기반 프로빙, 조직 샘플 분석, 체액 분석, 수술 또는 대장암 검진 중 하나, 여러 개 또는 모두 없이), 대상체가 대장암, 진행성 선종 및/또는 암을 앓을 가능성이 있다는 의학적으로 합리적인 의심을 뒷받침하는 대장암 및/또는 진행성 선종의 충분한 특성에 의해 입증한다면 대상체는 “유증상”으로 지칭될 수 있다. 대장암 및 진행성 선종의 증상에는 지속적인(예컨대, 3일 이상 지속되는) 배변 습관의 변화(설사, 변비 또는 가느다란 대변), 배변으로 완화되지 않는 배변이 필요하다는 느낌, 직장 출혈(예컨대 밝은 적색 혈액), 대변 혈액(변이 검게 나타날 수 있음), 복부 경련, 복통, 쇠약, 피로, 의도하지 않은 체중 감소, 빈혈 및 이들의 조합을 포함할 수 있으나 이에 제한되지 않는다. 당업자는 단독으로 대장암을 나타내거나 의심을 제기하지 않는 개별 증상이 조합되어 제시될 때, 예컨대, 비제한적인 일례로 복부 경련과 대변 내 혈액의 조합, 대장암 및/또는 진행성 선종을 나타낼 수 있음을 이해할 것이다.

당업자는 대장암 및 진행성 선종에 대한 정기적, 방지적 및/또는 예방적 스크리닝이 대장암, 및/또는 특히 초기 암의 진단을 개선한다는 것을 이해할 것이다. 상기 언급된 바와 같이, 초기 암은 적어도 하나의 암 병기 시스템에 따르면 대장암의 0 내지 II C기를 포함한다. 따라서, 본원은 무엇보다도 초기 대장암의 진단 및 치료에 특히 유용한 방법 및 조성물을 제공한다. 일반적으로, 특히 본 명세서에 따른 대장암 스크리닝이 매년 수행되고/거나 대상체가 스크리닝 시점에 무증상인 구현예에서(예컨대, 본원에서 개시된), 본 발명의 방법 및 조성물은 특히 초기 대장암 및/또는 진행성 선종을 검출할 가능성이 높다.

다양한 구현예에서, 예컨대, 본원에서 개시된, 본 명세서에 따른 대장암 또는 진행성 선종 스크리닝은 주어진 대상체에 대해 1회 또는 주어진 대상체에 대해 여러번 수행된다. 다양한 구현예에서, 본 명세서에 따른, 예컨대 본원에서 개시된, 스크리닝은 정기적으로, 예를 들어, 6개월마다, 매년, 2년마다, 3년마다, 4년마다, 5년마다 또는 10년마다 수행된다.

예컨대 본원에서 개시된, 다양한 구현예에서, 본원에 개시된 방법 및 조성물을 사용한 대장암 및/또는 진행성 선종에 대한 스크리닝은 대장암 및/또는 진행성 선종의 진단을 제공할 것이다. 예컨대 본원에서 개시된 다른 경우에, 본원에 개시된 방법 및 조성물을 사용한 대장암 및/또는 진행성 선종에 대한 스크리닝은 (예컨대 진행성 선종의 발견을 통한) 대장암 진단의 지표이지만 대장암 및/또는 진행성 선종 진단에 대해 확정적이지는 않다. 본 명세서의 방법 및 조성물이 대장암 및/또는 진행성 선종에 대한 스크리닝에 사용되는 다양한 경우에, 예컨대 본원에 개시된, 본 명세서의 방법 및 조성물을 사용한 스크리닝은 추가 진단-확인 검정이 뒤따를 수 있으며, 이 추가 검정은 이전 스크리닝, 예컨대 본 명세서에 따른 스크리닝에 따른 진단을 확인, 지지, 약화, 또는 배격할 수 있다. 본원에서 사용되는, 진단-확인 검정은 의사에 의해 확정적인 것으로 인정된 진단을 제공하는 대장암 및/또는 진행성 선종 분석, 예컨대, 대장내시경 기반 진단일 수 있고, 또는 이전 진단이 정확할 가능성을 실질적으로 증가 또는 감소시키는 대장암 및/또는 진행성 선종 분석, 예컨대, 본 명세서에 따른 스크리닝에 의한 진단일 수 있다. 진단-확인 검정에는 기존 스크리닝 기술이 포함될 수 있으며, 이는 특히 초기 대장암의 검출에서 민감도, 특이도 및 비침습성 중 하나 이상과 관련하여 일반적으로 개선이 필요한 것이다.

일부 사례에서 예컨대 본원에 개시된, 진단-확인 검정은 예를 들어 대장 내시경에 의한 대상 조직의 시각적 또는 구조적 검사이거나 이를 포함하는 검사이다. 일부 구현예에서, 예컨대 본원에 개시된, 대장내시경은 조직학적 분석을 포함하거나 이에 후속된다. 대장암에 대한 시각적 및/또는 구조적 분석에는 비정상 조직 및/또는 구조에 대한 결장 및/또는 직장의 구조 검사가 포함될 수 있다. 육안 및/또는 구조적 검사는 예를 들어 직장을 통한 스코프 사용 또는 CT-스캔에 의해 수행될 수 있다. 일부 예에서, 예컨대 본원에 개시된, 진단 확인 검정은 예를 들어 조직학적 분석을 포함하거나 후속하는 대장내시경 검사이다. 일부 보고서에 따르면, 대장내시경은 현재 우세하거나 가장 많이 의존하는 진단-확인 검정이다.

컴퓨터 단층촬영(CT)을 기반으로 하는 또 다른 시각적 및/또는 구조적 진단-확인 검정은 가상 대장내시경이라고도 하는 CT 대장조영술이다. CT 스캔은 결장의 치수 표현을 생성하기 위해 결장 및/또는 직장의 수많은 x-선 이미지를 사용한다. 진단-확인 검정으로 유용하지만 일부 보고서에서는 CT 대장 조영술이 대장 내시경 검사를 대체하기에 충분하지 않다고 제안한다. 최소한 어느정도 의사가 조직학적 분석을 위해 조직을 얻기 위해 대상체의 결장에 물리적으로 접근하지 않았기 때문이다.

또 다른 진단-확인 검정은 S상 대장내시경(sigmoidoscopy)이 될 수 있다. S상 대장내시경에서 결장 및/또는 직장의 일부를 영상화하기 위해 직장을 통해 S상 결장경을 사용한다. 일부 보고서에 따르면 S상 대장내시경은 널리 사용되지 않는다.

구체적 스크리닝 기술 중 하나는 대변 기반 스크리닝 테스트(Cologuard®(Exact Sciences Corporation, Madison, Wl, United States)로, 돌연변이 및 메틸화와 같은 비정상적인 변형에 대한 DNA 분석과 FIT 분석을 결합한다. Cologuard® 테스트 FIT 분석 단독에 비해 개선된 감도를 나타내지만 낮은 준수율로 인해 임상적으로 비실용적이거나 비효율적일 수 있으며, 낮은 준수율은 적어도 부분적으로는 대변 기반 분석 사용을 싫어하는 대상체 때문이다(예컨대, doi: 10.1056/NEJMc1405215 (예컨대, 2014 N Engl J Med. 371 (2): 184- 188) 참조) Cologuard® 테스트는 적격 인구의 거의 절반을 선별 프로그램에서 배제하는 것으로 보인다(예컨대, van der Vlugt 2017 Br J Cancer. 1 16(1):44-49 참조). 예를 들어 혈액 기반 분석에 의한 본원에 제공된 스크리닝의 사용은 대장암에 대한 스크리닝을 선택하는 개인의 수를 증가시킬 것이다(예컨대, Adler 2014 BMC Gastroenterol. 14:183; Liles 2017 Cancer Treatment and Research Communications 10: 27-31 참조). 현재 알려진 바에 따르면, 대장암을 위한 유일한 현존 스크리닝 기술인 Epiprocolon만이 FDA 승인을 받았고 CE-IVD 마크를 받았으며 혈액 기반이다. Epiprocolon은 SEPT9 유전자의 과메틸화를 기반으로 한다. 에피프로콜론 테스트는 68%의 민감도와 22%의 진행성성 선종 민감도로 대장암 검출에 대한 낮은 정확도로 어려움을 겪고 있다(예컨대, Potter 2014 Clin Chem. 60(9):1 183-91 참조). 무엇보다도, 높은 및/또는 향상된 특이도 및/또는 민감도로 높은 대상체 순응도를 달성할 가능성이 있는 비침습성 대장암 및 진행성 선종 스크린이 당업계에 요구된다.

다양한 구현예에서, 예컨대 본원에서 개시된, 본 명세서의 방법 및 조성물에 따른 스크리닝은 예를 들어 초기 대장암 진단, 예컨대 진행성 선종의 검출을 통한,에 의해 대장암 사망률을 감소시킨다. 데이터는 대장암 검진이 대장암 사망률을 감소시킨다다(예컨대, Shaukat 2013 N Engl J Med. 369(12):1 106-14 참조). 더욱이, 대장암은 적시에 검진을 받지 않으면 암이 초기 단계를 지나야 발견될 수 있기 때문에 치료하기가 특히 어렵다. 적어도 이러한 이유로 대장암 치료는 종종 성공하지 못한다. 대장암 결과의 개체군 전체 개선을 최대화하기 위해, 본 명세서에 따른 스크리닝의 활용은 예를 들어 광범위한 스크리닝을 보장하기 위해 적격한 대상체의 모집과 조합될 수 있다.

다양한 구현예에서, 예컨대 본원에 개시된, 본원에 개시된 하나 이상의 방법 및/또는 조성물을 포함하는 대장암 및/또는 진행성 선종의 스크리닝은 대장암의 치료, 예를 들어, 초기 대장암의 치료가 후속된다. 다양한 구현예에서, 예컨대 본원에 개시된, 대장암, 예를 들어 초기 대장암의 치료는 수술, 방사선 요법 및 화학요법 중 하나 이상을 포함하는 치료 요법의 투여를 포함한다. 다양한 구현예에서, 예컨대 본원에 개시된, 대장암, 예를 들어 초기 대장암의 치료는 병기 0 대장암, 병기 I 대장암 및/또는 병기 II 대장암의 치료를 위해 본원에 제공된 치료 중 하나 이상을 포함하는 치료 요법의 투여를 포함한다.

다양한 구현예에서, 예컨대 본원에 개시된 바와 같은, 진행성 선종 및/또는 대장암을 위한 스크리닝은 대변 기반 분석이다. 일반적으로 육안 또는 구조적 검사 대신 대변 기반 분석을 사용하는 경우 육안 또는 구조적 검사를 사용할 때 요구되는 것보다 더 높은 빈도로 사용하는 것이 권장된다. 일부 예에서, 예컨대 본원에 개시된 바와 같은, 검정은 guiac 기반 대변 잠혈 검사 또는 대변 면역화학 검사(gFOBT/FIT)이다(예컨대, Navarro 2017 World J Gastroenterol. 23(20):3632-3642 참조, 이는 대장암 분석과 관련하여 본원에 참고로 포함됨). FOBT 및 FIT는 때때로 대장암의 진단에 사용된다(예컨대, Nakamura 2010 J Diabetes Investig. Oct 19; 1(5):208-11 참조, 이는 대장암 검정과 관련하여 본원에 참조로 포함됨). FIT는 대변에서 잠혈의 검출을 기반으로 하며, 그 존재는 종종 대장암 또는 진행성 선종의 표지이지만 종종 육안으로 식별할 수 있을 만큼 충분한 양은 아니다. 예를 들어, 일반적인 FIT에서 검사는 헤모글로빈 특이적 시약을 사용하여 대변 샘플에서 잠혈을 검사한다. 다양한 경우에, 예컨대 본원에 개시된 바와 같은, FIT 키트는 가정에서 개인이 사용하기에 적합하다. FIT는 해마다 사용할 것을 권장할 수 있다. FIT는 대장암 또는 진행성 선종의 확정적인 진단을 위한 충분한 진단 정보를 제공하기 위해서는 일반적으로 의존하지 않는다.

다양한 구현예에서, 예컨대 본원에 개시된 바와 같은, 진행성 선종 및/또는 대장암을 위한 스크리닝은 화학 반응에 의해 대변의 잠혈을 감지하도록 설계된 gFOBT도 포함된다. FIT와 마찬가지로 gFOBT는 해마다 사용할 것을 권장할 수 있다. gFOBT는 대장암 또는 진행성 선종의 확정적인 진단을 위한 충분한 진단 정보를 제공하기 위해서는 일반적으로 의존하지 않는다.

일부 예에서, 예컨대 본원에 개시된 바와 같은, 스크리닝 분석은 대변 DNA 검사도 포함할 수 있다. 대장암 또는 진행성 선종에 대한 대변 DNA 검사는 대변 샘플에서 대장암 및/또는 진행성 선종의 특징적인 DNA 서열을 식별하도록 설계할 수 있다. 다른 진단-확인 검정이 없을 경우, 대변 DNA 검사를 3년마다 사용하도록 권장할 수 있다. 대변 DNA 검사는 대장암 및/또는 진행성 선종의 확정적인 진단을 위한 충분한 진단 정보를 제공하기 위해서는 일반적으로 의존하지 않는다.

다양한 구현예에서, 예컨대 본원에 개시된, 대장암의 치료는 예를 들어 국부 절제(예컨대, 대장내시경에 의한) 부분 결장 절제술 또는 완전 결장 절제술에 의한 하나 이상의 암 조직의 외과적 제거에 의한, 초가 대장암, 예컨대 병기 0 대장암 또는 병기 I 대장암의 치료를 포함한다.

다양한 구현예에서, 예컨대 본원에 개시된, 대장암의 치료는 암 조직의 외과적 제거(예컨대, 국부 절제(예컨대, 대장내시경에 의한) 부분 결장 절제술 또는 완전 결장 절제술에 의한), 확인된 대장암 조직에 가까운 림프절을 제거하는 수술, 및 화학요법(예컨대, 5-FU 및 류코보린, 옥살리플라틴 또는 카페시타빈 중 하나 이상의 투여)에 의한, 초기 대장암, 예컨대 병기 II 대장암의 치료를 포함한다.

다양한 구현예에서, 예컨대 본원에 개시된, 대장암의 치료는 암 조직의 외과적 제거(예컨대, 국부 절제(예컨대, 대장내시경에 의한) 부분 결장 절제술 또는 완전 결장 절제술에 의한), 확인된 대장암 조직에 가까운 림프절의 외과적 제거, 및 화학요법(예컨대, 5-FU 및 류코보린, 옥살리플라틴 또는 카페시타빈 중 하나 이상, 예컨대, (i) 5-FU 및 류코보린 (ii) 5-FU, 류코보린 및 옥살리플라틴(예: FOLFOX), 또는 (iii) 카페시타빈 및 옥살리플라틴(예: CAPEOX))의 조합의 투여), 및 방사선 요법 중 하나 이상에 의한, 예컨대 병기 III 대장암의 치료를 포함한다.

다양한 구현예에서, 예컨대 본원에 개시된, 대장암의 치료는, 암 조직의 외과적 제거(예컨대, 국부 절제(예컨대, 대장내시경에 의한) 부분 결장 절제술 또는 완전 결장 절제술에 의한), 확인된 대장암 조직에 가까운 림프절의 외과적 제거, 전이의 외과적 제거, 화학요법(예컨대, 5-FU, 류코보린, 옥살리플라틴, 카페시타빈, 이리노테칸, VEGF 표적 치료제(예컨대, 베바시주맙, 지브-애플리버셉트, 또는 라무시루맙), EGFR 표적 치료제(예컨대 세툭시맙 또는 파니투무맙), 레고라페닙, 트리플루리딘 및 티피라실, 예컨대, (i) 5-FU 및 류코보린, (ii) 5-FU, 류코보린,및 옥살리플라틴(예: FOLFOX), (iii) 카페시타빈 및 옥살리플라틴(예컨대, CAPEOX), (iv) 류코보린, 5-FU, 옥살리플라틴 및 이리노테칸(FOLFOXIRI), 및 (v) 트리플루리딘 및 티피라실(Lonsurf)의 조합으로 또는 이들을 포함하여 투여), 방사선 치료, 간동맥 주입(예컨대 암이 간으로 전이된 경우), 종양 절제, 종양 색전술, 결장 스텐트, 결장 절제술, 결장루(예컨대, 전환 결장루) 및 면역 요법(예컨대, 펨브롤리주맙) 중 하나 이상에 의한 병기 IV 대장암의 치료를 포함한다.

본원에서 제공되는 대장암의 치료가, 예컨대 의사에 의해 결정된 바에 따라, 단독으로 또는 임의의 조합으로 임의의 순서, 요법 및/또는 치료 프로그램으로 이용될 수 있다는 것은 당업자가 이해할 것이다. 당업자는 이전에 암 또는 대장암을 앓았던 대상체, 예를 들어 재발성 대장암을 갖는 것으로 진단된 대상체의 초기 암에 대하여 고급 치료 옵션이 적절할 수 있음을 추가로 이해할 것이다.

일부 구현예에서, 예컨대 본원에 개시된 바와 같이, 본원에 제공된 대장암 및 진행성 선종 스크리닝을 위한 방법 및 조성물은 예를 들어 개인, 의료 시설, 의료 종사자, 건강 보험 제공자, 정부 기관 또는 의료 비용에 관심이 있는 기타 당사자에 의한 치료 및/또는 지불(예컨대, 스크리닝 또는 치료와 같은 의료 비용에 대한 상환 또는 감소) 결정 및/또는 조치에 영향을 미칠 수 있다.

일부 구현예에서, 예컨대 본원에 개시된 바와 같이, 본원에 제공된 대장암 및 진행성 선종 검진을 위한 방법 및 조성물은 예를 들어 (1) 검진 자체(예컨대, 검진에 대한 상환이 불가능 하거나, 주기적/정기적 검진에만 이용 가능, 또는 일시적 및/또는 우발적 검진에만 이용 가능함); 및/또는 (2) 예를 들어 스크리닝 결과를 기반으로 치료 시작, 유지 및/또는 변경을 포함하는, 치료를 위해, 건강 보험 제공자가 의료 비용 지불자 또는 수혜자에게 상환할지 (또는 하지 않을지) 여부와 관련된 의사 결정에 영향을 미칠 수 있다. 예를 들어, 예컨대 본원에 개시된 바와 같이, 일부 구현예에서, 본원에 제공된 대장암 및 진행성 선종 스크리닝을 위한 방법 및 조성물은 의료비 지불자 또는 수혜자에게 상환 또는 비용 절감이 제공될 것인지 여부에 대한 결정에 대한 기초, 기여 또는 지원으로 사용된다. 일부 예에서, 예컨대 본원에 개시된 바와 같이, 상환 또는 비용 절감을 원하는 당사자는 의료 비용의 그러한 상환 또는 비용 절감에 대한 요청과 함께 본 명세서에 따라 수행된 스크리닝의 결과를 제공할 수 있다. 일부 예에서, 예컨대 본원에 개시된 바와 같이, 의료비의 상환 또는 비용 절감을 제공할지 여부를 결정하는 당사자는 본 명세서에 따라 수행된 스크리닝 결과의 수령 및/또는 검토에 전체 또는 부분적으로 기초하여 결정에 도달할 수 있다.

의심의 여지를 없애기 위해, 당업자는 본 명세서로부터 본 명세서의 대장암 및/또는 진행성 선종 진단을 위한 방법 및 조성물이 적어도 시험관내 사용을 위한 것임을 이해할 것이다. 따라서, 본 명세서의 모든 양태 및 구현예는 적어도 시험관내에서 수행 및/또는 사용될 수 있다.

키트

본원은 특히, 본원에 제공된 바와 같은 대장암 및/또는 진행성 선종 스크리닝에 사용하기 위한 하나 이상의 조성물을 선택적으로 대장암 스크리닝에서 사용하기 위한 설명서와 조합하여 포함하는 키트를 포함한다. 다양한 구현예에서, 에컨대 본원에 개시된 바와 같이, 대장암 및/또는 진행성 선종 의 스크리닝을 위한 키트는 다음 중 하나 이상을 포함할 수 있다: 하나 이상의 올리고뉴클레오티드 프라이머(예컨대, 표 5에 나타나는 바와 같은 하나 이상의 올리고뉴클레오티드 프라이머쌍), 하나 이상의 MSRE, 하나 이상의 qPCR용 시약(예컨대 완전 qPCR 반응 혼합물에 충분한 시약, dNTP 및 중합효소를 포함하나 이에 제한되지 않음), 및 대장암 스크리닝을 위한 키트의 하나 이상의 구성요소 사용에 대한 지침. 다양한 구현예에서, 대장암의 스크리닝을 위한 키트는 다음 중 하나 이상을 포함할 수 있다: 하나 이상의 올리고뉴클레오티드 프라이머(예컨대, 하나 이상의 올리고뉴클레오티드 프라이머쌍, 예를 들어, 표 5에 나타나는 바와 같음), 하나 이상의 중아황산염 시약, 하나 이상의 qPCR을 위한 시약(예컨대, 완전 qPCR 반응 혼합물에 충분한 시약, dNTP 및 중합효소를 포함하나 이에 제한되지 않음) 및 대장암 스크리닝을 위한 키트의 하나 이상의 구성요소 사용에 대한 지침.

특정 구현예에서, 본 명세서의 키트는 본 명세서에 개시된 바와 같은 메틸화 좌위 및/또는 DMR의 증폭을 위한 적어도 하나의 올리고뉴클레오티드 프라이머쌍을 포함한다.

일부 예에서, 예컨대 본 명세서에 기재된 바와 같이, 본 명세서의 키트는 본 명세서의 하나 이상의 메틸화 영역의 증폭을 위한 하나 이상의 올리고뉴클레오티드 프라이머 쌍을 포함한다. 일부 예에서, 예컨대 본원에 기재된 바와 같이, 본 명세서의 키트는 표 1에 제공된 하나 이상의 유전자 영역의 전부 또는 일부이거나 이를 포함하는 하나 이상의 메틸화 영역의 증폭을 위한 하나 이상의 올리고뉴클레오티드 프라이머 쌍을 포함한다. 일부 특정 예에서, 예컨대 본원에 기재된 바와 같이, 본 명세서의 키트는 각각 표 1에서 확인된 유전자 영역(전부 또는 일부)을 포함하는 복수의 메틸화 영역에 대한 올리고뉴클레오티드 프라이머 쌍을 포함하고, 복수의 메틸화 영역은 예컨대, 표 1 내지 4 중 어느 것에 제공된 메틸화 영역 중, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 45, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68 또는 69개(의 전체 또는 일부)를 포함한다.

일부 예에서, 예컨대 본원에 기재된 바와 같이, 본 명세서의 키트는 본 명세서의 하나 이상의 DMR의 증폭을 위한 하나 이상의 올리고뉴클레오티드 프라이머 쌍을 포함한다. 일부 예에서, 예컨대 본원에 기재된 바와 같이, 본 명세서의 키트는 표 1에서 확인된 유전자(의 전부 또는 일부)를 포함하는 하나 이상의 DMR의 증폭을 위한 하나 이상의 올리고뉴클레오티드 프라이머 쌍을 포함한다. 일부 특정 구현예에서, 본 명세서의 키트는 복수의 DMR에 대한 올리고뉴클레오티드 프라이머 쌍을 포함하고, 여기서 각각의 DMR은 표 1에서 확인된 유전자 영역(의 전부 또는 일부), 예컨대, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 또는 69 DMR, 예컨대, 표 1 내지 4 중 어느 하나에 따른 것을 포함한다.

일부 예에서, 예컨대 본원에 기재된 바와 같이, 본 명세서의 키트는 표 5의 하나 이상의 DMR의 증폭을 위한 하나 이상의 올리고뉴클레오티드 프라이머 쌍을 포함한다. 일부 특정 예에서, 예컨대 본원에 기재된 바와 같이, 본 명세서의 키트는 표 5의 복수의 DMR에 대한 올리고뉴클레오티드 프라이머 쌍을 포함하며, 복수의 DMR은 표 1의, 예컨대 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 또는 40 개 DMR(의 전체 또는 일부), 예컨대 표 2 내지 4 중 어느것에 제공된 것을 포함한다.

다양한 구현예에서, 예컨대 본원에 기재된 바와 같이, 본 명세서의 키트는 표 5에 제공된 하나 이상의 올리고뉴클레오티드 프라이머 쌍을 포함한다. 당업자는 표 5에 제공된 올리고뉴클레오티드 프라이머 쌍이 하나 이상의 올리고뉴클레오티드 프라이머 쌍의 임의의 조합, 예컨대, 표 2-4 중 어느 하나에 제공된 바와 같은 조합으로 제공될 수 있음을 이해할 것이다.

본 명세서의 키트는 개별적으로 또는 단일 용액에 하나 이상의 MSRE를 추가로 포함할 수 있다. 다양한 구현예에서, 하나 이상의 MSRE는 AciI, Hin6I, HpyCH4IV 및 HpaII를 포함하는 MSRE 세트로부터(예컨대, 키트가 AciI, Hin6I 및 HpyCH4IV를 개별적으로 또는 단일 용액으로 포함하도록) 선택된다. 특정 구현예에서, 본 명세서의 키트는 qPCR을 위한 하나 이상의 시약(예를 들어, dNTP 및 중합효소를 비제한적으로 포함하는, 완전 qPCR 반응 혼합물에 충분한 시약)을 포함한다.

실시예

본 실시예는 본 명세서가 무엇보다도 대장암 및/또는 진행성 선종의 스크리닝 및 치료를 위한 방법 및 조성물을 제공함을 확인시켜준다. 본 실시예는 본원에 제공된 조성물 및 방법이 대장암의 스크리닝 및/또는 치료에서 현저하게 높은 정도의 민감도 및 특이도를 제공함을 추가로 입증한다. 또한, 대장암 및/또는 진행성 선종을 갖는 것으로 진단된 대상체로부터의 샘플에서 바이오마커의 메틸화 및 대조군 대상체로부터의 샘플에서 바이오마커의 메틸화를 비교하는 임상 연구가 제공되며, 이는 본 명세서의 방법 및/또는 조성물을 포함하는 대장암에 대한 스크리닝을 추가로 보여준다.

실시예 1. 대장암 관련 메틸화 바이오마커의 식별

본 실시예는 건강한 조직과 비교하여 대장암 및 진행성 선종에서 DMR의 CpG 영역의 과메틸화의 식별을 포함한다. 특히, 본 실시예의 실험은 총 150명의 대상체로부터 결장직장 조직 샘플을 조사하였다. 대상체의 그룹은 다음과 같다: (i) 이전에 대장암을 앓는 것으로 진단된 52명의 대상체, (ii) 진행성 선종을 앓는 것으로 진단된 33명의 대상체, 및 (iii) 대장암을 앓는 것으로 진단된 52 환자의 및 진행성 선종을 앓는 것으로 진단된 33 대상체의 하위집합으로부터 얻어진 65개의 건강한 결장 조직 샘플. 조직 샘플은 신선한 냉동 조직이었다.

샘플의 DNA는 Illumina의 NovaSeq™ 6000 시퀀싱 시스템을 사용하여 전체 게놈 중아황산염 시퀀싱으로 분석되었다. 전체 게놈 중아황산염 시퀀싱은 본원에서 이전에 설명되었다. 일반적으로 전체 게놈 중아황산염 시퀀싱은 이전에 논의된 여러 차세대 기술 중 하나를 사용하여 게놈을 시퀀싱하기 전에 중아황산염(예: 중아황산나트륨)로 DNA 샘플을 처리하는 것을 포함한다.

샘플의 평균 시퀀싱 범위는 37.5x로, 이는 시퀀싱된 게놈의 주어진 영역이 약 37-38회 고유하게 시퀀싱되었음을 의미한다. 평균 적용 범위가 30x보다 크면 시퀀싱이 임상 등급(즉, 높은) 신뢰성으로 수행되었음을 나타낸다.

그런 다음 샘플에서 얻은 원(raw) 시퀀싱 파일을 처리하여 대조군 조직 샘플과 비교하여 차등적 메틸화 영역(DMR)을 결정하였다. 먼저 원 시퀀스를 GRCh38(Genome Research Consortium human build 38)의 기준 게놈(reference genome)과 정렬하고 Bismark Bisulfite Mapper를 사용하여 중복 제거하였다. Bismark는 각 샘플에 대한 메틸화 호출 파일을 출력한다. 이러한 메틸화 호출 파일에는 기본 출력당 백분율 메틸화 점수가 포함되어 있다. 그런 다음 메틸화 호출 출력 파일을 MethylKit을 사용하여 추가로 분석하였다. MethylKit을 사용하여 대조군 조직에 대한 대장암 조직의 출력 파일과 대조군 조직에 대한 진행성 선종 조직의 출력 파일을 비교하였다. 이러한 비교를 통해 대장암과 진행성 선종 샘플 모두에 대한 DMR이 확인되었다. MethylKit에서 식별된 DMR 출력은 CpG 사이의 최대 거리가 200bp인 적어도 3개의 CpG가 존재하는 영역으로 간주되었다. 대조군과 사례 사이의 최소 메틸화 백분율 차이는 10%로 설정되었다.

그런 다음 대조군 샘플과 관련하여 진행성 선종 및 대장암 샘플에서 과메틸화 영역에 대해 DMR을 필터링하였다. DMR은 영역 길이당 더 많은 수의 메틸화된 CpG를 선택하기 위해 다시 필터링되었다. 2개의 인접한 메틸화된 CpG 사이에 최대 200bp의 최소 5개의 CpG가 고려되었다. 또한, 조건(예: 대장암 또는 진행성 선종)과 대조군 사이의 가장 높은 평균 메틸화 백분율 차이를 조건과 대조군의 메틸화 차이가 25% 미만인 영역을 제외하여 사용하였다.

처리 결과 69개의 DMR 목록(즉, 아래 표 6 참조)이 생성되었으며, 이는 추가 표적 분석 개발을 위해 선택되었다. 하기 표 6에서 볼 수 있는 바와 같이, 각각의 DMR은 본원에 제공된 바와 같은 서열에 상응하는 서열 ID(SEQ ID NO), DMR이 있는 염색체 번호, 염색체 상의 DMR의 시작 및 종료 염기 쌍, DMR 영역의 폭(영역 폭), 및 DMR 영역 내에 속하는 주석된 하나 (또는 이상)의 유전자명(사용가능한 경우) 에 의해 식별된다. DMR의 시작 및 종료 염기쌍과 염색체 번호는 GRCh38의 기준 게놈 상의 위치에 상응한다. 유전자명의 Ensemble genome browser 98에 따른다.

표 6. 표적화 분석 개발을 위해 식별된 69개의 DMR.
SEQ ID NO	Chr. 번호	시작 염기쌍	종료 염기쌍	영역 폭	주석된 유전자명
SEQ ID NO: 1	1	18636183	18636479	297	PAX7
SEQ ID NO: 2	1	107140100	107140341	242	NTNG1
SEQ ID NO: 3	1	114153175	114153431	257	SYT6
SEQ ID NO: 4	2	5673847	5674110	264	LINC01248
SEQ ID NO: 5	2	26692974	26693164	191	KCNK3
SEQ ID NO: 6	2	31136994	31138312	1319	GALNT14
SEQ ID NO: 7	2	100416598	100417320	723	CHST10
SEQ ID NO: 8	2	127025668	127025992	325	주석 없음
SEQ ID NO: 9	2	136765863	136767257	1395	THSD7B
SEQ ID NO: 10	2	209771521	209771717	197	UNC80
SEQ ID NO: 11	3	96812527	96814374	1848	EPHA6
SEQ ID NO: 12	3	151086702	151087381	680	MED12L
SEQ ID NO: 13	4	61201658	61202419	762	ADGRL3
SEQ ID NO: 14	4	141133100	141133759	660	RNF150
SEQ ID NO: 15	4	167233855	167235112	1258	SPOCK3
SEQ ID NO: 16	4	176001298	176001937	640	GPM6A
SEQ ID NO: 17	4	185020150	185020721	572	HELT
SEQ ID NO: 18	5	180353742	180353989	248	GFPT2
SEQ ID NO: 19	6	31815502	31815783	282	HSPA1L, HSPA1A
SEQ ID NO: 20	6	123803543	123804573	1031	NKAIN2
SEQ ID NO: 21	7	141072216	141073010	795	TMEM178B
SEQ ID NO: 22	7	154304773	154304932	160	DPP6
SEQ ID NO: 23	8	17026468	17027021	554	MICU3
SEQ ID NO: 24	8	52564399	52566130	1732	ALKAL1
SEQ ID NO: 25	8	64581458	64581984	527	LOC401463, BHLHE22
SEQ ID NO: 26	8	103500115	103500325	211	RIMS2, LOC105375690, SLC25A32
SEQ ID NO: 27	9	843218	843532	315	DMRT1
SEQ ID NO: 28	9	21970988	21971129	142	CDKN2A, CDKN2B-AS1
SEQ ID NO: 29	9	36986363	36986579	217	PAX5
SEQ ID NO: 30	10	16520584	16520645	62	C1QL3
SEQ ID NO: 31	10	25933862	25934167	306	MYO3A, LOC101929073
SEQ ID NO: 32	10	26211596	26212313	718	GAD2, MYO3A
SEQ ID NO: 33	10	127736443	127736756	314	FOXI2
SEQ ID NO: 34	11	94740674	94742025	1352	LOC105369438, AMOTL1
SEQ ID NO: 35	11	112962067	112962734	668	LOC101928847, NCAM1
SEQ ID NO: 36	11	117795608	117796104	497	DSCAML1
SEQ ID NO: 37	12	15322181	15323178	998	PTPRO, RERG
SEQ ID NO: 38	12	63667846	63668580	735	DPY19L2
SEQ ID NO: 39	12	111033274	111033632	359	CUX2
SEQ ID NO: 40	13	67229618	67231644	2027	PCDH9
SEQ ID NO: 41	13	87673128	87673271	144	MIR4500HG, SLITRK5
SEQ ID NO: 42	14	70188797	70189400	604	SLC8A3, LOC646548
SEQ ID NO: 43	14	77966179	77966411	233	주석 없음
SEQ ID NO: 44	15	45378160	45378420	261	GATM
SEQ ID NO: 45	15	64824187	64824233	47	PIF1
SEQ ID NO: 46	15	79089616	79089950	335	RASGRF1
SEQ ID NO: 47	16	70737594	70737910	317	VAC14
SEQ ID NO: 48	16	77789176	77789410	235	VAT1L
SEQ ID NO: 49	16	87601415	87601495	81	JPH3
SEQ ID NO: 50	17	35448324	35448347	24	SLFN13
SEQ ID NO: 51	17	76076064	76076299	236	ZACN, SRP68, GALR2
SEQ ID NO: 52	18	907740	908272	533	ADCYAP1
SEQ ID NO: 53	18	28177400	28177679	280	CDH2
SEQ ID NO: 54	18	69401262	69401796	535	DOK6
SEQ ID NO: 55	18	75916571	75916639	69	주석 없음
SEQ ID NO: 56	19	36666416	36667626	1211	ZNF461
SEQ ID NO: 57	19	36916473	36916789	317	ZNF829, ZNF568
SEQ ID NO: 58	19	36973366	36973693	328	ZNF568
SEQ ID NO: 59	19	37551650	37551952	303	ZNF540, ZNF571-AS1
SEQ ID NO: 60	19	42270825	42271072	248	CIC
SEQ ID NO: 61	19	56393726	56393946	221	ZNF582-AS1, ZNF582
SEQ ID NO: 62	19	56507701	56507850	150	ZNF471
SEQ ID NO: 63	19	57191866	57192102	237	ZNF264
SEQ ID NO: 64	19	57726974	57727102	129	ZNF671, ZNF551, ZNF776
SEQ ID NO: 65	20	21518031	21518878	848	NKX2-2
SEQ ID NO: 66	20	56925418	56925496	79	주석 없음
SEQ ID NO: 67	21	26843133	26845357	2225	ADAMTS1
SEQ ID NO: 68	21	31343542	31344538	997	TIAM1
SEQ ID NO: 69	21	33070564	33070847	284	OLIG1

실시예 2: MSRE-qPCR에 의한 메틸화 바이오마커에 대한 무세포 DNA 분석의 개발

본 실시예는 순환하는 무세포 DNA(cfDNA)에 기반하여 대장암 및 진행성 선종의 메틸화 상태를 결정하기위한 분석을 개발한다. cfDNA는 불완전하고 단편화되어 있으며, cfDNA가 암세포에서 혈액으로 전달되는 메커니즘(소위 순환 종양 DNA)은 알려져 있지 않다. 적어도 실시예 1의 69개의 메틸화 바이오마커가 조직 샘플에서 확인되었기 때문에, 확인된 대장암 메틸화 바이오마커가 cfDNA로부터 충분히 분석되어 대장암 및 또는 진행성 선종의 진단에 상응하는 대상체의 샘플 또는 대상체를 식별할 수 있는 ctDNA 부분을 성공적으로 포획될 수 있는지 여부는 본 실시예의 실험 이전에 알려지지 않았다.

실시예 1에서 확인된 대장암 및 진행성 선종 메틸화 바이오마커가 cfDNA에서 충분히 분석되어 대장암에 대한 대상체 또는 샘플의 식별을 허용하는 ctDNA 부분을 성공적으로 포획할 수 있는지 여부를 결정하기 위한 중요한 단계로서, 이러한 바이오마커의 스크리닝을 위한 민감한 분석이 개발되었다. 특히 MSRE(Methylation-Sensitive Restriction Enzyme)-qPCR 방법론이 개발되었다. MSRE-qPCR 방법론은 혈액 샘플, 특히 혈액에 존재하는 종양의 무세포 DNA(cfDNA)에서 확인된 CpG 부위를 포괄하는 DMR의 메틸화를 측정하기 위해 개발되었다.

MSRE-qPCR 방법론의 개발은 샘플의 비종양 DNA 배경과 비교하여 혈액 내 순환하는 종양 유래 DNA의 낮은 농도(0.1 - 1%)로 인하여 cfDNA 분석을 통해 종양 조직에서 유래한 CpG 메틸화 바이오마커를 분석하는 것이 어렵기 때문에 적어도 부분적으로 중요하였다. 따라서 혈액, 소변 또는 대변과 같이 쉽게 얻을 수 있는 샘플에 의존하는 바이오마커 분석을 개발하는 것이 일반적으로 선호되지만 종양 유래 메틸화 바이오마커 분석을 위한 혈액 사용은 어렵다. 따라서 조직에서 대장암 및 진행성 선종의 특징인 메틸화 바이오마커를 확인한 후에도, 상기에서 논의한 바와 같이, 단편화되고 제대로 이해되지 않은 ctDNA의 특성이 조직에서 확인된 메틸화 바이오마커를 사용한 성공적인 스크리닝을 허용할지 여부는 예상할 수 없다.

MSRE-qPCR은 적어도 하나의 대장암 MSRE 절단 부위(즉, 적어도 하나의 메틸화 바이오마커 부위를 포괄하여, 적어도 하나의 메틸화 바이오마커 부위의 모두가 메틸화되지 않은 핵산 분자에 MSRE 절단 부위의 절단이 허용되고, 적어도 하나의 메틸화 바이오마커 부위 중 적어도 하나가 메틸화된 핵산 분자에서는 MSRE 절단 부위의 절단이 차단되게 하는, MSRE 절단 부위)를 각각 포함하는 DNA 영역을 증폭하는 올리고뉴클레오티드 프라이머(MSRE-qPCR 올리고뉴클레오티드 프라이머쌍))의 설계가 필요하다. 단일 MSRE는 관심 메틸화 바이오마커 부위를 모두 포함하는 절단 부위이지 않을 수 있으므로, MSRE-qPCR 검정은 다중 제한 효소를 활용하여 단일 MSRE-qPCR 반응으로 분석할 수 있는 메틸화 바이오마커 부위의 범위를 증진시킬 수 있다. 본 실시예의 MSRE-qPCR 분석은 MSRE Acil, Hin6l 및 HpyCH4IV를 활용하며, 이들은 함께 충분한 적용 범위를 제공하는 것으로 밝혀졌다.

MSRE-qPCR에 대한 예시적 도식적 작업 흐름이 도 1에 제공되어 있다. 본 실시예에서 수행된 바와 같이, 순환 무세포 종양 DNA는 에 따라 QIAamp MinElute ccfDNA 키트에 의해 제조업체 프로토콜(QIAamp MinElute ccfDNA 핸드북 08/2018, Qiagene)에 따라 대상 혈액(일반적으로 약 10mL의 혈장 샘플)에서 추출되었다. 도 1에 도시된 바와 같이, 단리된 cfDNA는 2개의 분취량으로 나누었으며, 첫 번째 분취량은 qPCR 품질 관리 분석에 사용되었고 두 번째 분취량은 MSRE-qPCR에 사용되었다.

MSRE-qPCR의 경우 용리된 cfDNA의 2/3를 MSRE로 절단하였다. 비-메틸화된 DNA는 선택적으로 절단되기 때문에, cfDNA를 MSRE와 접촉시키면 메틸화 유래 신호에 대한 샘플이 농축된다; 메틸화된 DNA는 손상되지 않고 정량화할 수 있다. 용리된 cfDNA의 나머지 1/3은 MSRE-qPCR 올리고뉴클레오티드 프라이머를 사용하여 qPCR에 사용되어 앰플리콘이 cfDNA에서 성공적으로 증폭되었음을 확인한다. 이 증폭은 주형이 존재함을 확인하여 기술적 품질 관리를 제공한다.

본 명세서에 적용된 바와 같이, MSRE-qPCR 올리고뉴클레오티드 프라이머 쌍은 DMR의 증폭을 위해 성공적으로 개발되었고, 따라서 실시예 1의 DMR에서 확인된 메틸화 바이오마커 영역으로부터 88개의 상이한 표적 DMR을 산출하였다. 88개의 상이한 표적 DMR이 하기 표 7에 나열되어 있다. 확인된 영역은 대응 대조군 조직과 비교하여 대장암 및 진행성 선종에서 상당히 더 높은 과메틸화를 나타낸다. Ensembl 게놈 브라우저 98에 따라 주석(annotation)이 있는 유전자에 대해 유전자 주석이 추가되었다. 일부 DMR이 서로 다른 유전자와 중첩되므로 해당 영역의 모든 중첩 유전자가 나열된다. 하기 표 7에는 DMR의 고유 식별자(UID), DMR이 발견된 염색체 번호(Chr), DMR의 시작 및 끝 종료 위치, DMR의 염기쌍 길이/수, DMR 내에 발견된 주석된 유전자(또는 복수의 유전자) 명칭, 및 식별된 DMR의 SEQ ID NO가 포함된다. 염색체 번호와 DMR 시작 및 종료 위치를 포함하는, 나열된 게놈 영역 매개변수는 GRCh38의 기준 게놈에 상응한다.

DMR은 일반적으로 1 내지 15개의 MSRE 절단 부위를 포함하며, MSRE 절단 부위는 88개의 메틸화 바이오마커 영역 각각을 함께 포괄한다. 본 명세서에 적용되는 바와 같이, 4개 유전자(JUB, H19, SNRPN, IRF4)의 메틸화 상태는 메틸화 컨트롤(control)을 제공했으며, 이는 분석 견고성 및 재현성의 모니터링을 허용하였다.

표 7. MSRE-qPCR에 대해 식별된 88개의 후보 DMR.
UID	Chr	시작 위치	종료 위치	서열 폭	주석된 유전자명	SEQ ID NO.
UDX131.2_1	1	18636323	18636442	120	PAX7	230
UDX_244_2	1	107140056	107140173	118	NTNG1	231
UDX_244_1	1	107140136	107140204	69	NTNG1	232
UDX_117.2	1	114153293	114153403	111	SYT6	233
UDX_121.1	2	5673894	5673976	83	LINC01248	234
UDX_79.1	2	26692903	26692983	81	KCNK3	235
UDX_219.7_2	2	31138019	31138112	94	GALNT14	236
UDX_196.4_1	2	100417126	100417223	98	CHST10	237
UDX_257.2_1	2	127025856	127025946	91	주석 없음	238
UDX_221.1_2	2	136765920	136766016	97	THSD7B	239
UDX_221.2_2	2	136766099	136766189	91	THSD7B	240
UDX_221.2_1	2	136766115	136766191	77	THSD7B	241
UDX_221.4_1	2	136766444	136766530	87	THSD7B	242
UDX_85.2_1	2	209771685	209771755	71	UNC80	243
UDX_222.1	3	96813875	96813987	113	EPHA6	244
UDX_222.11_2	3	96814054	96814137	84	EPHA6	245
UDX_192.2	3	151086946	151087030	85	MED12L	246
UDX_198.5_1	4	61202277	61202367	91	ADGRL3	247
UDX_190.1	4	141133118	141133232	115	RNF150	248
UDX_218.4_2	4	167234344	167234453	110	SPOCK3	249
UDX_218.4_1	4	167234345	167234442	98	SPOCK3	250
UDX_185.1	4	176001298	176001402	105	GPM6A	251
UDX_176.2	4	185020392	185020498	107	HELT	252
UDX114.1_1	5	180353709	180353815	107	GFPT2	253
UDX114.1_2	5	180353728	180353815	88	GFPT2	254
UDX_125.2	6	31815718	31815803	86	HSPA1L, HSPA1A	255
UDX_213.3	6	123803960	123804070	111	NKAIN2	256
UDX_201.3	7	141072555	141072639	85	TMEM178B	257
UDX_201.5_1	7	141072898	141072970	73	TMEM178B	258
UDX_177.1	7	141073214	141073310	97	TMEM178B	259
UDX_66.2	7	154304857	154304969	113	DPP6	260
UDX_174.3	8	17026934	17027030	97	MICU3	261
UDX_277.7_2	8	52565317	52565408	92	ALKAL1	262
UDX_168.1	8	64581549	64581646	98	LOC401463, BHLHE22	263
UDX_168.3	8	64581819	64581913	95	LOC401463, BHLHE22	264
UDX_90.1	8	103500053	103500167	115	RIMS2, LOC105375690, SLC25A32	265
UDX_253.1	9	843262	843352	91	DMRT1	266
UDX_230	9	21970918	21971017	100	CDKN2A, CDKN2B-AS1	267
UDX_94.2_2		9	36986521	36986581	61	PAX5	268
UDX_17_2		10	16520590	16520719	130	C1QL3	269
UDX_251.2_1		10	25934063	25934130	68	MYO3A, LOC101929073	270
UDX_272.3_2		10	26211885	26211963	79	GAD2, MYO3A	271
UDX_272.4		10	26212056	26212160	105	GAD2, MYO3A	272
UDX_137.1		10	127736482	127736589	108	FOXI2	273
UDX_220.5_1		11	94741361	94741468	108	LOC105369438, AMOTL1	274
UDX_191.2_1		11	112962254	112962393	140	LOC101928847, NCAM1	275
UDX_191.3		11	112962451	112962564	114	LOC101928847, NCAM1	276
UDX_191.4		11	112962596	112962709	114	LOC101928847, NCAM1	277
UDX_158.2		11	117795852	117795967	116	DSCAML1	278
UDX_274.2_1		12	15322352	15322435	84	PTPRO, RERG	279
UDX_274.3_1		12	15322477	15322549	73	PTPRO, RERG	280
UDX_197.3		12	63668266	63668380	115	DPY19L2	281
UDX_143.2_1		12	111033456	111033526	71	CUX2	282
UDX_223.11_2		13	67231170	67231267	98	PCDH9	283
UDX_223.13_1		13	67231170	67231265	96	PCDH9	284
UDX_223.6_1		13	67230402	67230489	88	PCDH9	285
UDX_56_1		13	87673121	87673244	124	MIR4500HG, SLITRK5	286
UDX181.2_1		14	70189010	70189101	92	SLC8A3, LOC646548	287
UDX181.4_1		14	70189227	70189296	70	SLC8A3, LOC646548	288
UDX_107.2		14	77966333	77966434	102	주석 없음	289
UDX_120.2		15	45378327	45378410	84	GATM	290
UDX_6_2		15	64824187	64824315	129	PIF1	291
UDX_260.1		15	79089689	79089791	103	RASGRF1	292
UDX_260.2_1		15	79089783	79089858	76	RASGRF1	293
UDX_255.2_1		16	70737814	70737885	72	VAC14	294
UDX_109.2		16	77789273	77789385	113	VAT1L	295
UDX_30_1		16	87601409	87601511	103	JPH3	296
UDX_1_1		17	35448306	35448407	102	SLFN13	297
UDX_110.1		17	76076051	76076163	113	ZACN, SRP68, GALR2	298
UDX_171.3		18	908129	908238	110	ADCYAP1	299
UDX_124.1		18	28177439	28177533	95	CDH2	300
UDX_172.1		18	69401246	69401321	76	DOK6	301
UDX_24_1		18	75916501	75916621	121	주석 없음	302
UDX_217.4_1		19	36666980	36667097	118	ZNF461	303
UDX_254.2_2		19	36916694	36916789	96	ZNF829, ZNF568	304
UDX_258.2_1		19	36973532	36973602	71	ZNF568	305
UDX_250.1		19	37551664	37551748	85	ZNF540, ZNF571-AS1	306
UDX_245_1		19	42270787	42270865	79	CIC	307
UDX_242_2		19	56393660	56393732	73	ZNF582-AS1, ZNF582	308
UDX111.1_1		19	57191843	57191928	86	ZNF264	309
UDX_48_1		19	57726972	57727075	104	ZNF671, ZNF551, ZNF776	310
UDX_204.3_2		20	21518391	21518499	109	NKX2-2	311
UDX_29_2		20	56925386	56925450	65	주석 없음	312
UDX_29_1		20	56925428	56925505	78	주석 없음	313
UDX_224.5_2		21	26843742	26843842	101	ADAMTS1	314
UDX_224.14		21	26844767	26844877	111	ADAMTS1	315
UDX_210.3		21	31343869	31343976	108	TIAM1	316
UDX_128.1		21	33070631	33070711	81	OLIG1	317

실시예 3: cfDNA의 MSRE-qPCR은 대장암 상태에 따라 대상체를 성공적으로 구별한다

식별된 메틸화 바이오마커의 임상 진단 및 예후력을 조사하기 위해 88개의 메틸화 바이오마커 영역을 포괄하는 MSRE-qPCR 올리고뉴클레오티드 프라이머 쌍으로 증폭된 DMR과 적절한 대조군을 인간 대상체의 혈장에서 추출한 cfDNA에서 분석하였다. 특히 2017년 내지 2018년 사이의 스페인, 영국, 및 미국의 스크리닝 센터 및 종양클리닉에서 대장암 발생 가능성에 대한 진단을 구하거나 획득하는 과정의 개체으로부터 cfDNA를 샘플링하였다. 제1 대상체군("트레이닝 세트")에는 166명의 그러한 개체가 포함되었고(도 2의 제1 대상체군에 대한 설명 참조), 제2 대상체군("검증 세트")에는 535명의 그러한 개체가 포함되었다(도 3의 제2 대상체군에 대한 설명 참조).

대장암에 대한 메틸화 바이오마커 DMR의 예측력을 검증하기 위해, 대상체의 트레이닝 세트로부터의 샘플의 MSRE-qPCR 분석에서 유래한 데이터를 추가로 분석하여 표 7의 88개 메틸화 바이오마커 부위를 기반으로 초기 특징 선택을 수행하였다. Monte-Carlo 교차 검증은 50회 이상의 실행에 사용되었으며 랜덤 포레스트 알고리즘은 기능 순위매김에 사용되었으며 VIP >2인 마커는 지지-벡터 머신(SVM) 알고리즘 기반 분류 모델을 구축하는데 사용되었다. 이 분석은 SVM 모델에서 양호한 예측을 제공하는 마커의 여러 하위집합(표 2-4에 기술된 대로 3, 10 및 40)을 식별하였다.

MSRE-qPCR에서 40개의 DRM을 증폭하기 위한 올리고뉴클레오티드 프라이머 쌍(표 5)은 적어도 하나의 MSRE 절단 부위를 포괄한다. 그러나, 일반적으로 3~15개의 MSRE 절단 부위가 포괄된다. MSRE-qPCR은 실시예 2에 기재된 방법론에 따라 수행하였다.

40개 마커 패널을 기반으로 한 초기 주성분 분석은 도 4에 나타난 바와 같이 테스트된 535 대상체에서 대장암 환자(즉, 대장암을 앓고 있는 환자)와 대조군 환자(즉, 대장내시경 소견이 없는 환자, 과증식용종 및/또는 비진행성 선종이 있는 환자) 간의 양호한 분리도를 보여주었다. 실험된 대상체군에서 진행성 선종 진단을 받은 환자 중 일부만이 대조군과의 분리도가 양호하였다. 특정 이론에 얽매이는 것은 아니지만, 특정 대상체에서 대장암에 대한 결과의 특성의 유사성은 진행성 선종이 추가로 악성, 대장 암종으로 진행하는 경로를 더 따라가고 있음을 나타내는 것일 수 있다.

SVM 알고리즘 기반 결과의 통계적 분석은 도 5a 및 5b 에 도시되어 있다. 40개의 마커 패널을 통해 78%의 민감도로 대장암 환자로부터 대조군 환자를 식별할 수 있었다. 대조군 환자에서 진행성 선종을 앓는 환자를 결정하는 민감도는 14%였다. 초기 국한 암 검출의 민감도는 78%였다. SVM 모델에 의해 식별된 표 4의 40-마커 패널에 기반한 데이터의 ROC 곡선 분석이 도 5A에 제공된다.

하기에 나타낸 표 8은 40개 미만의 DMR을 갖는 패널에 대한 추가 연구를 나타낸다. 3 DMR 조합 연구에 사용된 DMR 목록은 표 2에 나타난다. 10 DMR 조합 연구에 사용된 DMR 목록은 표 3에 나타난다. 40 DMR 조합 연구에 사용된 DMR 목록은 표 4에 나타난다. "SensitivityALL"은 대상체가 대장암 또는 진행성 선종을 앓고 있는지 여부를 검출할 때의 민감도를 의미한다. "SensitivityCRC"는 대장암을 앓고 있는 대상체를 검출하는 민감도를 의미한다. "SensitivityAA"는 진행성 선종을 앓고 있는 대상체를 검출하는 민감도를 의미한다. 일 특정 예를 강조하기 위해, 3개의 마커 패널은 48%의 전체 민감도 및 93%의 특이도로 대조군 대상체로부터 대장암 및 진행성 선종의 특히 우수한 분리도를 나타낸다. 93%의 특이도에서 진행성 선종은 14%의 민감도로, 대장암은 67%의 민감도로 검출되었다.

표 8. 40개의 대장암 DMR 패널 및 그 하위집합을 검증군에 적용하기 위한 정확도 메트릭.
	패널 내 마커의 수
척도	3	10	40
AUC	0.78	0.77	0.75
AUC_CI_Low	0.73	0.72	0.70
AUC_CI_High	0.83	0.82	0.81
SensitivityALL	0.48	0.53	0.53
SensitivityCRC	0.67	0.75	0.78
SensitivityAA	0.14	0.14	0.14
특이도	0.93	0.90	0.90

실시예 4. 다양한 개별 메틸화 바이오마커는 각각 매우 유용하다

40개의 대장암 DMR 패널 중 개별 대장암 및 진행성 선종 DMR의 성능 평가는 다양한 개별 대장암 DMR이 대장암 및 진행성 선종의 스크리닝에 충분함을 나타낸다(도 6-15 참조). 도 6-15는 각각 UDX_29_1(도 6), UDX_272.3_2(도 7), UDX_277.7_2(도 8), UDX_272.4(도 9). UDX_174.3(도 10), UDX_260.2_1(도 11), UDX_260.1(도 12), UDX_137.1(도 13), UDX_17_2(도 14) 및 UDX_230(도 15)로 식별된 DMR의 MSRE-qPCR로부터 Ct(Cycle Threshold) 값을 나타내는 그래프를 보여준다.

선택된 대장암 및 진행성 선종 DMR의 경우, 도 6-15는 대장암 및 진행성 선종 샘플(총체적으로 "CRC"로 표시됨) 및 대조군 샘플("CNT"로 표시됨; 건강한 대상체, 과증식 용종이 있는 ghkss자 및 및 비진행성 선종이 있는 대상체)을 나타낸다. 결과는 표시 목적으로 45에서 뺀 MSRE-qPCR Ct("cycle threshold") 값(즉, 45-Ct 값)으로 표시된다.

45-Ct 값이 높을수록 샘플의 메틸화 정도가 높아진다. 이 실시예에 제공된 데이터 및 본원 실시예에 의해 제공된 데이터는 누적적으로(예를 들어, 도 4-9를 포함하여) 식별된 각각의 개별 DMR에 대해, 메틸화 상태 신호가 대장암과 진행성 선종의 조합을 위한 임상 스크리닝을 허용하도록 대상체군에 걸쳐 충분히 안정함을 입증한다. 따라서 도 4-15에 제시된 결과는 대장암 및 진행성 선종의 메틸화 마커가 본원에 제공된 대장암 및 진행성 선종의 스크리닝을 위한 전반적이고 강건한 신호를 제공할 수 있음을 확인한다. 더욱이, 당업자는 본원이 대장암 및 진행성 선종의 조합에 대한 스크리닝에 개별적으로 유용한 메틸화 바이오마커를 제공하고, 특히 본원에 제공된 메틸화 바이오마커가 개별적으로 또는 서로 조합하여 모두 유용하다는 것을 이해할 것이다.

컴퓨터 시스템 및 네트워크 환경

도 17에 나타난 바와 같이, 본원에 기술된 복수의 소스로부터의 데이터를 검색, 관리 및 분석하기 위한 시스템, 방법 및 아키텍처를 제공하는데 사용하기 위한 네트워크 환경(1700)의 구현이 도시 및 설명되어 있다. 간략한 관에서, 이제 도 17을 참조하면, 예시적인 클라우드 컴퓨팅 환경(1700)의 블록도가 도시되고 설명된다. 클라우드 컴퓨팅 환경(1700)은 하나 이상의 리소스 제공자(1702a, 1702b, 1702c)(총체적으로, 1702)를 포함할 수 있다. 각각의 리소스 제공자(1702)는 컴퓨팅 리소스를 포함할 수 있다. 일부 구현에서, 컴퓨팅 리소스는 데이터를 처리하는 데 사용되는 임의의 하드웨어 및/또는 소프트웨어를 포함할 수 있다. 예를 들어, 컴퓨팅 리소스는 알고리즘, 컴퓨터 프로그램 및/또는 컴퓨터 애플리케이션을 실행할 수 있는 하드웨어 및/또는 소프트웨어를 포함할 수 있다. 일부 구현에서, 예시적인 컴퓨팅 리소스는 저장 및 검색 능력을 갖는 애플리케이션 서버 및/또는 데이터베이스를 포함할 수 있다. 각각의 리소스 제공자(1702)는 클라우드 컴퓨팅 환경(1700)의 임의의 다른 리소스 제공자(1702)에 연결될 수 있다. 일부 구현에서, 리소스 제공자(1702)는 컴퓨터 네트워크(1708)를 통해 연결될 수 있다. 각각의 리소스 제공자(1702)는 컴퓨터 네트워크(1708)를 통해 하나 이상의 컴퓨팅 장치(1704a, 1704b, 1704c)(집합적으로 1704)에 연결될 수 있다.

클라우드 컴퓨팅 환경(1700)은 리소스 관리자(1706)를 포함할 수 있다. 리소스 관리자(1706)는 컴퓨터 네트워크(1708)를 통해 리소스 제공자(1702) 및 컴퓨팅 장치(1704)에 연결될 수 있다. 일부 구현에서, 리소스 관리자(1706)는 하나 이상의 컴퓨팅 장치(1704)에 대한 하나 이상의 리소스 제공자(1702)에 의한 컴퓨팅 리소스의 제공을 용이하게 할 수 있다. 리소스 관리자(1706)는 특정 컴퓨팅 장치(1704)로부터 컴퓨팅 리소스에 대한 요청을 수신할 수 있다. 리소스 관리자(1706)는 컴퓨팅 장치(1704)에 의해 요청된 컴퓨팅 리소스를 제공할 수 있는 하나 이상의 리소스 제공자(1702)를 식별할 수 있다. 리소스 관리자(1706)는 컴퓨팅 리소스를 제공하기 위해 리소스 제공자(1702)를 선택할 수 있다. 리소스 관리자(1706)는 리소스 제공자(1702)와 특정 컴퓨팅 디바이스(1704) 사이의 연결을 용이하게 할 수 있다. 일부 구현들에서, 리소스 관리자(1706)는 특정 리소스 제공자(1702)와 특정 컴퓨팅 디바이스(1704) 사이의 연결을 설정할 수 있다. 일부 구현들에서, 리소스 관리자(1706)는 요청된 컴퓨팅 리소스로 특정 컴퓨팅 장치(1704)를 특정 리소스 제공자(1702)로 리디렉션할 수 있다.

도 18은 본 명세서에서 설명된 기술들을 구현하는데 사용될 수 있는 컴퓨팅 디바이스(1800) 및 모바일 컴퓨팅 디바이스(1850)의 예를 도시한다. 컴퓨팅 장치(1800)는 랩탑, 데스크탑, 워크스테이션, PDA(personal digital assistant), 서버, 블레이드 서버, 메인프레임 및 기타 적절한 컴퓨터와 같은 다양한 형태의 디지털 컴퓨터를 나타내기 위한 것이다. 모바일 컴퓨팅 장치(1850)는 PDA(personal digital assistant), 셀룰러 전화, 스마트폰 및 기타 유사한 컴퓨팅 장치와 같은 다양한 형태의 모바일 장치를 나타내기 위한 것다. 여기에 표시된 구성 요소, 해당 연결 및 관계, 해당 기능은 예시일 뿐이며 제한하려는 의도가 아니다.

컴퓨팅 장치(1800)는 프로세서(1802), 메모리(1804), 저장 장치(1806), 메모리(1804) 및 다중 고속 확장 포트(1810)에 연결되는 고속 인터페이스(1808), 및 저속 확장 포트(1814) 및 저장 장치(1806)에 연결되는 저속 인터페이스(1812)를 포함한다. 각각의 프로세서(1802), 메모리(1804), 저장 장치(1806), 고속 인터페이스(1808), 고속 확장 포트(1810), 및 저속 인터페이스(1812)는 다양한 버스를 사용하여 서로 연결되어 있으며, 공통 마더보드에 장착하거나 적절한 다른 방식으로 장착할 수 있다. 프로세서(1802)는 메모리(1804) 또는 저장 장치(1806)에 저장된 명령어를 포함하는 컴퓨팅 장치(1800) 내에서 실행하기 위한 명령어를 처리하여 외부 입/출력 장치, 예컨대 고속 인터페이스(1808)에 연결된 외부 입/출력 장치에 연결된 디스플레이(1816) 상의 GUI에 대한 그래픽 정보를 표시할 수 있다. 다른 구현에서, 다중 메모리 및 메모리 유형과 함께 다중 프로세서 및/또는 다중 버스가 적절하게 사용될 수 있다.

메모리(1804)는 컴퓨팅 디바이스(1800) 내에 정보를 저장한다. 일부 구현들에서, 메모리(1804)는 휘발성 메모리 유닛 또는 유닛들이다. 일부 구현에서, 메모리(1804)는 비휘발성 메모리 유닛 또는 유닛들이다. 메모리(1804)는 또한 자기 또는 광 디스크와 같은 다른 형태의 컴퓨터 판독가능 매체일 수 있다.

저장 장치(1806)는 컴퓨팅 장치(1800)를 위한 대용량 저장 장치를 제공할 수 있다. 일부 구현에서, 저장 장치(1806)는 플로피 디스크 장치, 하드 디스크 장치, 광 디스크 장치, 또는 테이프 장치, 플래시 메모리 또는 기타 유사한 솔리드 스테이트 메모리 장치, 또는 저장 영역 네트워크 또는 기타 구성의 장치를 포함하는 장치 어레이와 같은 컴퓨터 판독 가능 매체이거나 이를 포함할 수 있다. 명령어는 정보 매체에 저장될 수 있다. 명령어는 하나 이상의 처리 장치(예컨대, 프로세서(1802))에 의해 실행될 때 상기에서 설명된 것과 같은 하나 이상의 방법을 수행한다. 명령어는 또한 컴퓨터 또는 기계 판독가능 매체(예컨대, 메모리(1804), 저장 장치(1806), 또는 프로세서(1802) 상의 메모리)와 같은 하나 이상의 저장 장치에 의해 저장될 수 있다.

고속 인터페이스(1808)는 컴퓨팅 장치(1800)에 대한 대역폭 집약적 작업을 관리하는 한편, 저속 인터페이스(1812)는 더 낮은 대역폭 집약적 작업을 관리한다. 이러한 기능 할당은 예시일 뿐이다. 일부 구현에서, 고속 인터페이스(1808)는 메모리(1804), 디스플레이(1816)(예컨대, 그래픽 프로세서 또는 가속기를 통해), 및 다양한 확장 카드(미도시)를 수용할 수 있는 고속 확장 포트(1810)에 연결된다. 구현에서, 저속 인터페이스(1812)는 저장 장치(1806) 및 저속 확장 포트(1814)에 연결된다. 다양한 통신 포트(예를 들어, USB, Bluetooth®, 이더넷, 무선 이더넷)를 포함하는 저속 확장 포트(1814)는 네트워크 어댑터를 통해 키보드, 포인팅 장치, 스캐너 또는 스위치나 라우터와 같은 네트워킹 장치와 같은 하나 이상의 입력/출력 장치에 연결될 수 있다.

컴퓨팅 디바이스(1800)는 도면에 도시된 바와 같이 다수의 상이한 형태로 구현될 수 있다. 예를 들어, 표준 서버(1820)로 구현되거나 이러한 서버 그룹에서 여러 번 구현될 수 있다. 또한, 이는 랩탑 컴퓨터(1822)와 같은 개인용 컴퓨터에서 구현될 수 있다. 랙 서버 시스템(1824)의 일부로도 구현될 수 있다. 대안으로, 컴퓨팅 장치(1800)의 구성 요소는 모바일 컴퓨팅 장치(1850)와 같은 모바일 장치(미도시)의 다른 구성 요소와 결합될 수 있다. 이러한 장치 각각은 컴퓨팅 장치(1800) 및 모바일 컴퓨팅 장치(1850) 중 하나 이상을 포함할 수 있고, 전체 시스템은 서로 통신하는 다중 컴퓨팅 장치로 구성될 수 있다.

모바일 컴퓨팅 장치(1850)는 다른 구성요소 중에서도 프로세서(1852), 메모리(1864), 디스플레이(1854)와 같은 입/출력 장치, 통신 인터페이스(1866), 및 트랜시버(1868)를 포함한다. 모바일 컴퓨팅 장치(1850)에는 추가 저장을 제공하기 위해 마이크로 드라이브 또는 다른 장치와 같은 저장 장치가 제공될 수도 있다. 프로세서(1852), 메모리(1864), 디스플레이(1854), 통신 인터페이스(1866) 및 트랜시버(1868) 각각은 다양한 버스를 사용하여 상호 연결되고, 구성요소 중 몇 개는 공통 마더보드에 또는 적절한 다른 방식으로 장착될 수 있다.

프로세서(1852)는 메모리(1864)에 저장된 명령어를 포함하여 모바일 컴퓨팅 장치(1850) 내의 명령어를 실행할 수 있다. 프로세서(1852)는 개별 및 다중 아날로그 및 디지털 프로세서를 포함하는 칩의 칩셋으로 구현될 수 있다. 프로세서(1852)는 예를 들어, 사용자 인터페이스의 제어, 모바일 컴퓨팅 장치(1850)에 의해 실행되는 애플리케이션, 및 모바일 컴퓨팅 장치(1850)에 의한 무선 통신과 같은 모바일 컴퓨팅 장치(1850)의 다른 구성요소의 조정을 제공할 수 있다.

프로세서(1852)는 디스플레이(1854)에 연결된 제어 인터페이스(1858) 및 디스플레이 인터페이스(1856)를 통해 사용자와 통신할 수 있다. 디스플레이(1854)는, 예를 들어, TFT(Thin-Film-Transistor Liquid Crystal Display) 디스플레이 또는 OLED(유기 발광 다이오드, Organic Light Emitting Diode) 디스플레이 또는 기타 적절한 디스플레이 기술일 수 있다. 디스플레이 인터페이스(1856)는 그래픽 및 기타 정보를 사용자에게 제공하기 위해 디스플레이(1854)를 구동하기 위한 적절한 회로를 포함할 수 있다. 제어 인터페이스(1858)는 사용자로부터 명령을 수신하고 프로세서(1852)에 제출하기 위해 변환할 수 있다. 또한, 외부 인터페이스(1862)는 프로세서(1852)와의 통신을 제공하여 모바일 컴퓨팅 장치(1850)와 다른 장치의 근거리 통신을 가능하게 할 수 있다. 외부 인터페이스(1862)는 예를 들어, 일부 구현에서 유선 통신을 제공하거나 다른 구현에서 무선 통신을 제공할 수 있고, 다중 인터페이스가 또한 사용될 수 있다.

메모리(1864)는 모바일 컴퓨팅 디바이스(1850) 내에 정보를 저장한다. 메모리(1864)는 컴퓨터 판독가능 매체 또는 매체들, 휘발성 메모리 유닛 또는 유닛들, 또는 비휘발성 메모리 유닛 또는 유닛들 중 하나 이상으로서 구현될 수 있다. 확장 메모리(1874)는 또한 예를 들어 SIMM(Single In Line Memory Module) 카드 인터페이스를 포함할 수 있는 확장 인터페이스(1872)를 통해 모바일 컴퓨팅 장치(1850)에 제공 및 연결될 수 있다. 확장 메모리(1874)는 모바일 컴퓨팅 장치(1850)를 위한 추가 저장 공간을 제공하거나 모바일 컴퓨팅 장치(1850)에 대한 애플리케이션 또는 기타 정보를 저장할 수도 있다. 특히, 확장 메모리(1874)는 위에서 설명된 프로세스를 수행하거나 보완하기 위한 명령어를 포함할 수 있고 보안 정보도 포함할 수 있다. 따라서, 예를 들어, 확장 메모리(1874)는 모바일 컴퓨팅 장치(1850)를 위한 보안 모듈로서 제공될 수 있고, 모바일 컴퓨팅 장치(1850)의 안전한 사용을 허용하는 명령어로 프로그래밍될 수 있다. 또한, 보안 애플리케이션은 해킹 불가능한 방식으로 SIMM 카드에 식별 정보를 넣는 것과 같은 추가 정보와 함께 SIMM 카드를 통해 제공될 수 있다.

메모리는 예를 들어 후술하는 바와 같이 플래시 메모리 및/또는 NVRAM 메모리(비휘발성 랜덤 액세스 메모리)를 포함할 수 있다. 일부 구현에서, 명령어는 정보 캐리어에 저장된다. 명령어는 하나 이상의 처리 장치(예컨대, 프로세서(1852))에 의해 실행될 때 상술한 것과 같은 하나 이상의 방법을 수행한다. 명령어는 또한 하나 이상의 컴퓨터- 또는 기계 판독 가능 매체(예를 들어, 메모리(1864), 확장 메모리(1874), 또는 프로세서(1852) 상의 메모리)와 같은 하나 이상의 저장 장치에 의해 저장될 수 있다. 일부 구현에서, 명령어는 예를 들어 트랜시버(1868) 또는 외부 인터페이스(1862)를 통해 전파된 신호로 수신될 수 있다.

모바일 컴퓨팅 장치(1850)는 필요한 경우 디지털 신호 처리 회로를 포함할 수 있는 통신 인터페이스(1866)를 통해 무선으로 통신할 수 있다. 통신 인터페이스(1866)는 GSM 음성 통화((Global System for Mobile communications), SMS(Short Message Service), EMS(Enhanced Messaging Service), 또는 MMS 메시지(Multimedia Messaging Service), CDMA(code division multiple access), TDMA(time division multiple access), PDC(Personal Digital Cellular), WCDMA(Wideband Code Division Multiple Access), CDMA2000, 또는 GPRS(General Packet Radio Service)와 같은 다양한 모드 또는 프로토콜 하의 통신을 제공할 수 있다. 이러한 통신은 예를 들어 무선 주파수를 사용하는 트랜시버(1868)를 통해 이루어질 수 있다. 또한, Bluetooth®, Wi-Fi^TM 또는 기타 트랜시버(미도시)를 사용하는 등 근거리 통신이 이루어질 수 있다. 또한, GPS(Global Positioning System) 수신기 모듈(1870)은 모바일 컴퓨팅 장치(1850)에서 실행되는 애플리케이션에 의해 적절하게 사용될 수 있는 추가적인 탐색 및 위치 관련 무선 데이터를 모바일 컴퓨팅 장치(1850)에 제공할 수 있다.

모바일 컴퓨팅 장치(1850)는 또한 오디오 코덱(1860)을 사용하여 청각적으로 통신할 수 있으며, 오디오 코덱은 사용자로부터 음성 정보를 수신하고 이를 사용 가능한 디지털 정보로 변환할 수 있다. 오디오 코덱(1860)은 마찬가지로 예컨대 모바일 컴퓨팅 장치(1850)의 핸드셋에서와 같이 스피커를 통해 사용자를 위한 가청 사운드를 생성할 수 있다. 이러한 사운드는 음성 전화 통화로부터의 사운드를 포함할 수 있고, 녹음된 사운드(예를 들어, 음성 메시지, 음악 파일 등) 및 모바일 컴퓨팅 장치(1850)에서 작동하는 애플리케이션에 의해 생성된 사운드를 포함할 수도 있다.

모바일 컴퓨팅 디바이스(1850)는 도면에 도시된 바와 같이 다수의 상이한 형태로 구현될 수 있다. 예를 들어, 셀룰러 전화(1880)로서 구현될 수 있다. 또한 스마트폰(1882), 개인 휴대 정보 단말기(PDA), 또는 다른 유사한 모바일 장치의 일부로서 구현될 수 있다.

본원에 설명된 시스템 및 기술의 다양한 구현은 디지털 전자 회로, 집적 회로, 특별히 설계된 ASIC(application specific integrated circuit), 컴퓨터 하드웨어, 펌웨어, 소프트웨어 및/또는 이들의 조합으로 실현될 수 있다. 이러한 다양한 구현은 적어도 하나의 입력 장치, 및 적어도 하나의 출력 장치로부터의 데이터 및 명령어의 수신, 및 저장 시스템, 적어도 하나의 입력 장치, 및 적어도 하나의 출력 장치로의 데이터 및 명령어의 전송과 함께, 특수 또는 범용일 수 있는 적어도 하나의 프로그램 가능한 프로세서를 포함하는 프로그램 가능한 시스템에서 실행 가능 및/또는 해석 가능한 하나 이상의 컴퓨터 프로그램에서의 구현을 포함할 수 있다.

이러한 컴퓨터 프로그램(프로그램, 소프트웨어, 소프트웨어 응용 프로그램 또는 코드라고도 함)은 프로그래밍 가능한 프로세서에 대한 기계 명령어를 포함하며 고급 절차 및/또는 객체 지향 프로그래밍 언어 및/또는 어셈블리/기계로 구현될 수 있다. 본 명세서에 사용된 바와 같이, 기계 판독 가능 매체 및 컴퓨터 판독 가능 매체라는 용어는 기계 명령어 및/또는 데이터를 기계 판독 가능 신호로서 기계 명령어를 수신하는 기계 판독 가능 매체를 포함하는 프로그램 가능 프로세서에 제공하는 데 사용되는 임의의 컴퓨터 프로그램 제품, 장치 및/또는 장치(예컨대, 자기 디스크, 광 디스크, 메모리, Programmable Logic Device(PLD))를 지칭한다. 기계 판독 가능 신호라는 용어는 기계 명령 및/또는 데이터를 프로그래밍 가능한 프로세서에 제공하는 데 사용되는 임의의 신호를 의미한다.

사용자와의 상호 작용을 제공하기 위해 본원에 설명된 시스템 및 기술은 사용자에게 정보를 표시하고 사용자에게 정보를 표시하기 위한 디스플레이 장치(예컨대, CRT(cathode ray tube) 또는 LCD(liquid crystal display) 모니터) 및 사용자가 컴퓨터에 입력을 제공할 수 있는 키보드 및 포인팅 장치(예컨대, 마우스 또는 트랙볼)가 있는 컴퓨터에서 구현될 수 있다. 다른 종류의 장치도 사용자와의 상호 작용을 제공하는 데 사용할 수 있다: 예를 들어, 사용자에게 제공되는 피드백은 모든 형태의 감각 피드백(예컨대, 시각적 피드백, 청각적 피드백 또는 촉각적 피드백)일 수 있으며; 사용자로부터의 입력은 음향, 음성 또는 촉각 입력을 포함한 모든 형태로 수신될 수 있다.

본원에 설명된 시스템 및 기술은 백엔드 구성요소(예컨대 데이터 서버)를 포함하거나, 미들웨어 구성요소(예컨대, 애플리케이션 서버)를 포함하거나, 프론트엔드 구성요소(예컨대, 사용자가 이를 통해 본원에 설명된 시스템 및 기술의 구현과 상호 작용할 수 있는 그래픽 사용자 인터페이스 또는 웹 브라우저가 있는 클라이언트 컴퓨터)를 포함하거나, 또는 이러한 백엔드, 미들웨어 또는 프론트 엔드 구성 요소의 임의의 조합을 포함할 수 있다. 시스템의 구성 요소는 디지털 데이터 통신의 임의의 형태 또는 매체(예컨대, 통신 네트워크)에 의해 상호 연결될 수 있다. 통신 네트워크의 예는 LAN(Local Area Network), WAN(Wide Area Network) 및 인터넷을 포함한다.

컴퓨팅 시스템은 클라이언트와 서버를 포함할 수 있다. 클라이언트와 서버는 일반적으로 서로 멀리 떨어져 있으며 통상적으로 통신 네트워크를 통해 상호 작용한다. 클라이언트와 서버의 관계는 각각의 컴퓨터에서 실행되고 서로 클라이언트-서버 관계를 갖는 컴퓨터 프로그램 덕분에 발생한다.

일부 구현에서, 본원에 설명된 모듈(예컨대, 데이터 집계 모듈(1830), 매핑 모듈(1850), 사양 모듈(1870))은 분리되거나, 결합되거나, 단일 또는 조합된 모듈로 통합될 수 있다. 도면에 도시된 모듈은 본원에 설명된 시스템을 여기에 표시된 소프트웨어 아키텍처로 제한하고자 하는 것이 아니다.

본원에 설명된 다른 구현의 요소는 위에서 구체적으로 설명되지 않은 다른 구현을 형성하기 위해 결합될 수 있다. 요소는 그 작업(operation)에 부정적인 영향을 미치지 않으면서 본원에 설명된 프로세스, 컴퓨터 프로그램, 데이터베이스 등에서 제외될 수 있다. 또한, 도면에 도시된 논리 흐름은 원하는 결과를 달성하기 위해 표시된 특정 순서 또는 순차적 순서를 요구하지 않는다. 다양한 개별 요소가 본 명세서에 설명된 기능을 수행하기 위해 하나 이상의 개별 요소로 결합될 수 있다.

설명 전반에 걸쳐, 장치 및 시스템이 특정 구성요소를 갖거나 포함하거나 함유하는 것으로 설명되거나, 프로세스 및 방법이 특정 단계를 갖거나 포함하거나 함유하는 것으로 설명되는 경우, 추가로, 언급된 구성요소로 본질적으로 구성되거나, 이로 구성되는 본 발명의 장치 및 시스템이 존재하고, 언급된 처리 단계로 본질적으로 구성되거나, 이로 구성되는 본 발명에 따른 프로세스 및 방법이 존재한다는 것을 알 수 있다.

특정 동작을 수행하기 위한 단계의 순서 또는 순서는 본 발명이 작동 가능한 상태로 유지되는 한 중요하지 않음을 이해해야 한다. 또한, 2 이상의 단계 또는 동작이 동시에 수행될 수 있다.

본 발명이 특정한 바람직한 실시예를 참조하여 구체적으로 도시되고 설명되었지만, 에 의해 정의된 바와 같은 첨부된 청구항에 정의된 본 발명의 정신 및 범위를 벗어나지 않으면서 형태 및 세부사항의 다양한 변경이 이루어질 수 있다는 것이 당업자에 의해 이해되어야 한다.

SEQUENCE LISTING <110> UNIVERSAL DIAGNOSTICS, S.L. <120> DETECTION OF COLORECTAL CANCER AND/OR ADVANCED ADENOMAS <130> AX200120WO <140> <150> US16/680,427 <151> 2019-11-11 <160> 317 <170> BiSSAP 1.3.6 <210> 1 <211> 297 <212> DNA <213> Homo sapiens <400> 1 tcgctcctct gctccaacaa cttatacttg ctcttttgcc tttgaatttc tgaggtttag 60 tgagttcgat tagccgcgtg ctcagaatca agttcgggaa gaaagaggag gaggatgaag 120 cggacaagaa ggaggacgac ggcgaaaaga aggccaaaca cagcatcgac ggcatcctgg 180 gcgacaaagg tagggaactt ccctgggctg cgaggcccca gcccgggttt tcccacgctc 240 cggtgtgcgg gccagtggtt cgctcccgcc gccggagcag gcgaccagaa ctccagc 297 <210> 2 <211> 242 <212> DNA <213> Homo sapiens <400> 2 cgaggtcgtg gagcggcagc agctgcagcc ggagcagcac cagcaacagc aacagcgagc 60 gggacggagt taggaccgct cggagcgcac aggtctcgag gtagtataag gtttgctatc 120 cttccacttg ctggcagttg cagaagaaga tctgcttttt aagtgaaacg tacatgccac 180 ccctccgagg gctgcggctt ccccgggctt gcttctttgc cgctcctctt tccggctctc 240 gc 242 <210> 3 <211> 257 <212> DNA <213> Homo sapiens <400> 3 cgacgcacgg acccggggac ctcgacactc gctaggaggc aagccctatt cctcagccgg 60 gcgcccctcg tctcccgctc tctccatgga cccctctcct ggcaaatcgc ccgcagagcg 120 agcttggaga tgcgagggaa actgaagccc caagggtgcc ccgtcctggg agcctggctg 180 tctgcggggt cccccgcatt ccgcagtagt aatacaggag ggccgggggc ttctacccca 240 acctccgctc cccttcg 257 <210> 4 <211> 264 <212> DNA <213> Homo sapiens <400> 4 cgtcctgcgc aggaccggca gcccgaggcg gagacgaagg gggcccgcag ggactcctgg 60 ccttgcgtct tgggagagcg cacgctggcc tgcgctacac acacacactt cacagttgcg 120 ctgaaacaga gtcgggtttt ctgtacagga gataaaatga cggtagtgtg tgtgtttttt 180 gaaagagctg ttaaaaagct aagttcttct catttcagtg agagttcccc cttggattgt 240 ttgtgcgtgt attcaattca gccg 264 <210> 5 <211> 191 <212> DNA <213> Homo sapiens <400> 5 cgagctgatc gagcggcagc ggctggagct gcggcagcag gagctgcggg cgcgctacaa 60 cctcagccag ggcggctacg aggagctgga gcgcgtcgtg ctgcgcctca agccgcacaa 120 ggccggcgtg cagtggcgct tcgccggctc cttctacttc gccatcaccg tcatcaccac 180 catcggtaac g 191 <210> 6 <211> 1319 <212> DNA <213> Homo sapiens <400> 6 acgactgttc tggacccagt ttataaagac tgcctggctg gccaggaaat cccccagagg 60 cctccttccg tgtccccggg ccaaatctgt gaagagaaaa cggaaggcta ccatgtcacg 120 aaaaactatg atcaaataaa ttattatgcc ttttctccta ttgatctgcc ttttgtcaac 180 tgattttcag tgaaccttcg gagagccatg gggaagtttt ccctttcccc ctacagggct 240 ctgaatctga aggtaagagt gagcctatag ggggaacctt ctggctccct cacaggaact 300 gactgagcag gagttggaaa agccacttgg attcccattt cctcaactcc ccgccaatac 360 caaggcgtct gtttttacag gctctttcgt ggtgttctgg gcacattcaa cttccaatgc 420 agctgagagg gtcgggaaca gttagagaac aggggtggca gccgcccggg aggctgcaag 480 gcgctcgccc gcaacgcaca ggcgcgcgcg gcgcacccgg cctccggcct ccccaggtcg 540 ggcctggcag ctgcgggaag gaggtcagcg cagccgccac acttcgcccg ggcgctggcc 600 cgacccgacc gccggcgact ctctggcagc gcccggagac cgccagcccc tgggccgccc 660 gtccgcagag ccccctccgc cccgggaccc tcgcgcgcag ctcaagttgg gagccccgct 720 ccgcaggcga gcgcgcgccc accacccaca cccactgcca ctcatgcaca ccgcgggtcc 780 ggagatgccc ccgagcgttt taaaatccag aaacatcaca tggtagccac atccggcggc 840 tgttacctgc tcgcagcacc cagaccctcg ccctggtttc ccgggagccc gcaaacccgg 900 cacgcgggct gcgcgccctc ccgcaagcca ccgctcagcg ccagcgcgcc ggcaagccgc 960 ctaccttagg ggtctgcact tcaggtcccg tcggcacctc caacttcctc ttggttaccc 1020 agaagaacag cagcaccgtg atccagagca ccccgaagac tggcagaacc agccgacgag 1080 tcaggcgccg catggtcccc tttgccgctt cctctccgcg gcgctacgtc ccgggggcac 1140 cccccggcgg tcagggttgg cggggcagga gtcctggcga gcgcctcgct ctggggagct 1200 ctagacccag gatccggttg gaggggcggc aggatcctgc aaggcgccct tcccgcttcg 1260 aagagaagcg agcctgggtg gggggtgcag ggcgacccga aacgtggcag ggaaggacc 1319 <210> 7 <211> 723 <212> DNA <213> Homo sapiens <400> 7 gcgtctgaga catttctcac tctggcactc taagcaatgc aataacccaa ctcctcatgg 60 cccaaagccc cagactctgg ttttcagaca aaacaacaac aacaacaaca acaacaaaaa 120 cccaccgtta tgacagtcct gccgctgagc taaccagaac ctggctgcac tactttccat 180 tcactgccca accctttcct gccttgcaga cttggaaagc aaaaatgaca ttttggaaaa 240 cctggttcac cttcccagcc agaagtgcag aactgcatgc ctcaacctcc aacttcggac 300 aggcctcctg acagcgaaga tcagaggctc agggcacccc ggggcccctc aggcagggaa 360 cgtgcattcc cacccctgac tcccctcgca ccgaagctgc acatgctcct tcttccctgc 420 cttcctctgc atgctccttg gacccaagct gaaccctttc ttcctctctc catctacaat 480 tacaaacgca aattctcagc caaggatgaa agaagtaaat tgtaggctcg cacaatatca 540 ataattccgc gggtcacagc atcccgcaca aggacgcctt cttattgcat aattaacgcg 600 aggaaggctc ttcccgctac tcccgcgaac tagggaggtc ttcaagtcgc caaaacacac 660 cgggatgtgg ctcgccagga caaaacccgc gggttccccg gtttttccgt gcgccccgcg 720 gcg 723 <210> 8 <211> 325 <212> DNA <213> Homo sapiens <400> 8 gtttgcttgt tctcactctg cagccgcagc cagtggcgcc gctaccaagg tccccgcctc 60 gccatccggg tcctgcctga gcatccttat tggtgctcag ggctaggcgt gcattgctgc 120 taggggcgcg gaaaggttta tcgtgggtgg atgctgcccg gggcttgagt ggtttttaga 180 ggtcttgagt ggctcactct ccaatcagcg ctttctagag acagcgtggt cagcgtactt 240 gcttactttc aggattgcga gacgtcttta acccttgctg atcggctgac gctgcagctt 300 cctgtggctt cctgctcatt tcccg 325 <210> 9 <211> 1395 <212> DNA <213> Homo sapiens <400> 9 cggatcttct cggacgcctc tggcttgggg ctgcgggaag cgtgggctgc ccggggcgca 60 gtgtgcggag accctctagg cgggcgggga cgccccacgc ggcgacctga gcaccgacct 120 catgcaacgg gaccgaacct tgggacccgg gcagcaggag ctctgttccc ttcacctcca 180 gcttggtttg agggatactg atgaaggaaa ccgggggttt cccgtcctgc gcggagagcc 240 tcggcgccca aaatcgaaag gccgggagtt gttctgcagg ctttgcaaac aggttgactg 300 agggtttcct ttcccgtagc gctgactgcg aaatctgtgc ataggcgttc agtgccagtg 360 gaggatagct gagcaagcca agaagttttg cagcttcctc tgatttatcg gtggagtgtc 420 aggaggctgt agcaacagtt tacatttccc ctgtccctgc gagtggctag gggcaagctg 480 ggctcggacg tgatatcctg ctgtttgtgg agaggaaact gggaacgggg cttgagagtg 540 aggggcaggg agggggggac aggcatattt tctactgcat cgcccatctg cacctgtccc 600 ctttgctgtc ttacatgtcc catagtatta aagttatttg aataagcaaa tgaaccccgc 660 tctttggtga ccgcgtattt tgaagttgga aaactttgca ggggacgagg gaatgttgag 720 gagggggcgt taagctctct cactctatcc ctttttaaag acaagaaaaa aactttcgtt 780 ggcgaaggtg gtactttttt cttttggaat gtctgagctc agagcttccc ataagaggta 840 ttgcgattca atactgtaca gtcaaggtga agttccacta agattatggg accgtggcat 900 attctacgga agataccagg gttccttggc gctctgttca ttgccagggt ggtctgctga 960 aagccggcag tttcccaccc tcagactcct tggagctctt taaatgacgg tctgcctggt 1020 gtttctcagc ggtacacctg tgagtgctct gttatcatgg aaatggtaac ccatgcaggt 1080 agggctcatg ccaaccagac tgtggtgggg tgtgtgtgtg tttgtgtgtg tgtgtataca 1140 tgcgcgtgcg tgtgaacgtg tgtgtttgga gtttcctttt gacaggtaat ctttggatgt 1200 caaagggata cagttatttg tctggcagtg tcagggcaat ctgagtttct cgagtaacta 1260 ggaggaggta atctccaggg aagccttttt gtgctcttga ctgtctactc agcagttggt 1320 gaaggcttcc tgaaagccac ttagggtgtt actaaccaaa tcaagaagtc ttactcagtg 1380 gtgagtgaaa gctcg 1395 <210> 10 <211> 197 <212> DNA <213> Homo sapiens <400> 10 gcgactgctc tgcggttccc caaagctcct cctacccaga cggcgacagt ttggatgctg 60 aggttggaaa gcaggacagg ggacactcct gagtgcagct cggagcgggg aaagccgaat 120 tccgggggct gaagaggccg cgcaggggac gagcgcctgc gatgcggagc gtggacttct 180 tgggccgtac ccctgcg 197 <210> 11 <211> 1848 <212> DNA <213> Homo sapiens <400> 11 ccgatatata aactccacac atggtatctt tttagaaatg atttgcatac atttaagttg 60 gtgtggacac accttcaaag agaggcagag gtgtatgaat tcctaatgag aatgagagta 120 tagtcaccaa tcagaaccct tcctcacatt ctccaaatcg cttgtatttc accatttctc 180 tccacgcagc agaatttttg acatgggaca tttcttgctc tcattctttc tttccttcca 240 atttactgta aggcattaag tgaaacttct tcagctatgg tgtgtggcac aaaaacatcg 300 cagcgcagga atgcatggaa tagaagggtc ctttcccttc cagaactctg taagcgtcaa 360 acgccgaccc ttggctccat ctcccgctcc cctgacctct tgtcactgtg ccatttccct 420 cctgtgcttt ctgcccactt ggaaaatatc gtatatcctt tacaagaccg ctactttctc 480 tcctctgttc acatttctcc attaccatcc acattttctc aaaacattcc gacgggtttt 540 gaagtggggt tttcaacctc cctcgactgt gatagccgaa gtcccttcaa gaaagaaaaa 600 tgatgttgga aatactagta acaaataaag tatcacggaa atccccaccc aagcgatacg 660 gtttccttga cgcgccctta accaaggcgt taagtttagc ctgacagcat ccctccctcc 720 tttcggttcc tggcctgatg agccgcctcc acctgcgagc ggtgcaggca tttttgttgt 780 cgactaaccc cctctagcgc cgaactggcg gcatccgagc cgcggctgcc aggccgggag 840 aaggctgggc ttggccgggc tctgcagcgc tccgggctcc gtccctgccc tgggcgcccg 900 cctccgccgc ggggcgaggt ggtggagacc gcggacgccg agggtcctcc cagtcagcac 960 gccgcgttgc cccggccctg gggcgggggc cgcggagtcc caccaagtgg cccgcgcctc 1020 ggcttccggg agacccgagc gcggggaggg agtgggtgcc gcgagggggc ggctcgcgcg 1080 gggagagccg tcagcccacg gcgcccctgc gctgctgtgg atgtggccac gcgccactcg 1140 gcccttggac tgctaggaga gcgcggcccg acgccaccac gccgtggacg ctcggggacc 1200 cctgaatccc agcgtcaagg ctgcgacgat gctcgtgacc tccaccgcga agtcacctcc 1260 gcaaggcgac gcaaggacct cggcgatccc gggcgccgta cacccgccac tttccagcct 1320 catgtaaccc cccctctgct gcttcctccc ggcgctttgc ttttctacaa ctggaagccg 1380 cgaaggcggc tactgcgctg agccgctcgc tctgctggtc aagtttgggc gacccgcgcg 1440 gaggagggtc gggctgactg ccgccgctga gctgtccccg gacgggagcg cctgtccacg 1500 gcactcaccc cctccagcgg tggaaatgtg gagaagtaag tgggaggcgg tgtcgggaac 1560 tgactcctct taaaacggtc ggcgccgctg ctctgaaatg ggcggctaag tgcttgtggg 1620 actaagggcg gcctcagaga tgcccggaaa atcgctgcca cggccagagt gcggcgcaga 1680 cgcggcagag ttggaggtgt ccgcggtgca ggctgctgcc cacgccgctc aggccaggtg 1740 ctgagggctc agcccgcgcc tcggccgaac cactctcagc cccgttgagc cacctcgtcc 1800 gcccggcttt catcgcaccg gccagaggaa agttcccgcg gcccccac 1848 <210> 12 <211> 680 <212> DNA <213> Homo sapiens <400> 12 gcgcagccga gtacccgccg aaggctgtcc ccatcagtgc gtgtctgctg ccgggcagcg 60 gcagcatcca acctgcttta ttcctcctgc ctgcagcgcc acagcgagcg agcgagcgag 120 gagggggaga gagggagtct gtctgcaaag tgctgctccc tggtgctcag aggcggctgc 180 tccagctcca actctcattc atttcgccgg ttaacatgag agatcatggc cgccttcggg 240 cttctcagct atgagcagag accgctgaag cgcccccggc tcgggccgcc cgacgtctac 300 ccacaggacc ccaagcagaa ggaggtaagg gcgccggcgg cctccccggc aaccggggcc 360 gcgctctgca gcactgaccc ggggccaagt tggcccagcg ggcatcgccg gcgctgcggt 420 ggaagaggtc ggggaggggg attagaggcg ggggccaggc tgggggtgct gggcgacccc 480 ccggcggcgg agaccgagcg gctgtcagtc cccgcgctcc actggggcgc tcgctttcca 540 tgtgccggtc gctttcccgt tgccgggcct tgcacggcgc cgccgggcgc ttctcgggct 600 tcttccctgc cgaaaccttg ctcgctctca cccgtttctg cctgctttat ttttcttctt 660 gccgcttcgg taaatcgtcg 680 <210> 13 <211> 762 <212> DNA <213> Homo sapiens <400> 13 cggccggtct tttgccccgg gctcaatggc tggattgtgg aaactgcacc cgccttcagg 60 ttgttgagca actgatggga cgatctcagg gaccggcgtt tacgaaaggt aatttattct 120 tcgcactctt cataataggg gtcgccctgg ccgggcgcag gcggcggcat ccaccgggcg 180 ggcaacaaga gggggtgcgg ggtgcatgca cactcgccct tccactcaca cactcgccct 240 cacacacaca cacactcatc cggtcgtggt gcggggcggg aagggaacct cctggctggt 300 gggcgctcgg gtctggcgcg ggttggagtt ttttccagcc attgggcgat ttgaccggcc 360 gaggggagtg agggggataa gagactgggc gcattcgcag ctgcacacgc tggggaatag 420 gaacagttcc caccccgtta attttccctc tcctctcacc ccagtggcat cccctggtgg 480 gggcagaaag cggacaggag ggcgactttt ctccgtcagg ctggaactgg tgccgctgga 540 ggcgggagcg ggctggagga cggacagggt ctgggtgaga agctgggctc tgggaagatg 600 gaaaatgcag ggtgccgagc ccggcgcgat tctccctcaa cgcttgcctg gagcatccct 660 ggcccctttt gcccaggtcg cgcccctgag tcttggagtc gcgctgcctc cccgcgccct 720 gcctgttgtg tctccttcac ggcagtttgg tttagacctg cg 762 <210> 14 <211> 660 <212> DNA <213> Homo sapiens <400> 14 cgagcgtcct gctccttcgc ccggcttcgc cttctctcat aagggtggcc gggggcccac 60 gaacttgcag ggtggcggcc ctgcgccctc cagccccggc ggggacgggc acgattgctc 120 gtagtctggg gtgctgcggt gcggggtgct gcccagggtg tcccggccgc cgccactgag 180 cgctggggcg cgcgaatcca gctgcagccg ctgctgccct gcgccggttc cctcaggctg 240 cgggcgctgc gctcctgatc tcgccggtgg ctgcgcctgg gcacgcactt gccgcgggcg 300 gggcgggctt ggggacagtg ggagcgagca ggcagagcgg agtaagcggt ccgtgtgtgt 360 gtgtctgtat gtttgtgtgt gtgtgtgtgt gtgtgtataa tgtgtgcgtg caaggaggag 420 cttagtgtga tgtcaaagcc cctgggattc tcttgccatg ttcccttggt ctctctttat 480 gggcagcagc gacccctgtc gggtctcaaa ttcaacctca atcggcgact taatctaggt 540 ggaggtaaag aggaagcgac ccctcgacct ttgagtacgg gaataacttc ctgagcgtta 600 catttagcaa atgtatgtgc ctctcgtaaa cgaccctccc gtttgctgga agtactgccg 660 <210> 15 <211> 1258 <212> DNA <213> Homo sapiens <400> 15 cgccgccgcg tttccctaaa cccctctcct cagaaaacgg agcccactcc ccacccacat 60 ccggcggccg cggcccccgc ctcggagcag cgcgcgcgtg tgcccgggga tgtgggtgcg 120 cggaacttac gtctcggaat ttgttccact gtccgacttc cttgtcatac tgagagattg 180 tggtgagcca ttgtttatca tccagaaaat taccgccgtc cgaccgcccc ccggctgcag 240 ccaccgccgc ggcagctgcg agagactgac tgcaccaagc ggctgcacac acacacagta 300 cggctgacac cttgagcatc tgggagagga gacacaacgg ggggtggggg ggcatgtcag 360 tgtcaaataa ggggtacgaa gccaggagcg accctggaaa acatgcatta gcaacgacga 420 gggtagaggg aggaggagac aagcagaggc aagcgtgtcc cctccccgca ggctttaccc 480 ccaaaagccg ggcactcaca cacacgcaga cccagaggag gagaggtggg tataaggaag 540 caagccccag ccgcagcagc ccgagcgggc acaaaaccgc ttcctggcac atcaccttgt 600 tgtgagccag cactgtgctc gcagctcctg ctggaaatgc agccctgctc tgccaactcg 660 ctgctttctg gagctgctgc acgcgccgcc gtctcgagcc gtccactcag ctccctgcgc 720 ccggcgcgct ccccccatct ccaccctccc ttcgcgcgcg gatctccagc ttactcccct 780 ccgttccccc tccctccccg acctccgttt ttttcctctt ccacctcctc ctatcccacc 840 ttcctctcgc tggatcccag ctacagttgg ctccggatag gacgcttggc tggagccaga 900 ggacgaggta gctcctagcc taggaatcct tatctgcttt gtaacctctc ccctccagaa 960 gaggttctca tgttcgcgag acagcctgct cattctctgc tcctggattt aacacaaagt 1020 gtactatctc tcgcagttgc ctctgctcca caatttccag ggttgtcagg cagacgtgag 1080 aaacaagatc tgaggaaaac tttatgcatt aataaataag aatacctgga cttcctaccc 1140 tgtaaagctc ctgaactcag ctcctcccta aagaaaggcc atctatccac aaggtcttgg 1200 gagatctgtt taatttcaga aaatttaaag tttgctgtga gcttctggat tactaccg 1258 <210> 16 <211> 640 <212> DNA <213> Homo sapiens <400> 16 gcgggctggg gttggaagag taactcgggc tgcgggctga acgcagtcgg caaccgcgga 60 agagcagcat ctcccctgcg cctgtggata cgccagtcca gggatggcga gtgctttctc 120 ctccccagct tctccctcgc tcttcgaggt gactcgtggg accctgcgtc ctagtgctgg 180 gtgtgaatcg gctatttcac acccagttct tcctcccctc cgccacacgc agtcacattc 240 ctggagctat tccaagctgc ctccgctaag caccgaataa gcggaccctg cctggaaact 300 tgagcgaagc tgaactgcgc cgaactccac cgtccagtga cccgagccag tgtggacgcc 360 cttttaatca cgctgtttac ccaggtggaa tttaggaaga atcagccttc agcctcaacc 420 tcaaaccttt tgtgcaaatg ggcacttcgt ttggaaaggg actagaaatt gtccccagtc 480 tggccctgca ccagcacctt cctctgctca aacctgtaca aagtggaagt tttaggaagt 540 ttccatttct cgtgccccgt ttcaacttgc tccccaaaga gaacatgaaa acgtgggaac 600 tcgggaggac agagatctcc ctgtaatcgc ctcgctattc 640 <210> 17 <211> 572 <212> DNA <213> Homo sapiens <400> 17 cgggcctcaa atgggaactt tggccagaaa atgtggtggg aggtgccctg cacccgcttt 60 gggctcgcgt ggggaagggg cactcagggt gtgtccgtcc tacgggcttt ctcgttcctc 120 cagcagaact tctagcggag tttgccaact acttccacta tggctaccac gagtgcatga 180 agaacctggt gcattacctc accacggtgg agcggatgga gaccaaggac acgaagtacg 240 cgcgcatcct cgccttcttg cagtccaagg cccgcctggg cgcggagccc gcctttccgc 300 cgctgggttc gctcccggag ccggatttct cctatcagct gcaccctgcg gggcccgaat 360 tcgctggtca cagcccgggc gaggccgctg tgttcccgca gggctctggt gccgggcctt 420 tcccctggcc gcctggcgcg gcccgcagcc ccgcgctgcc ctacctgccc agcgcgccag 480 tgccgctcgc tagcccagcg cagcagcaca gccccttcct gacaccggtg cagggcctgg 540 accggcatta cctcaacctg atcggccacg cg 572 <210> 18 <211> 248 <212> DNA <213> Homo sapiens <400> 18 gcgaggggtc cggcatcact cgcgcgctcc ggaaacccgc gtgagccgct gttcctgccg 60 cgctcccatc tgagtgacag gcttgtttca gagctccgca gacctctaag cctggccctc 120 accctgcgtg gagagaacgc ccgggcttgg cggagagacg agaaaaccga ggctcccgga 180 ggcagacaag gactctgcca aaaccggacg ccgcggcggt ggcagaattc gaccctggga 240 tttgccgc 248 <210> 19 <211> 282 <212> DNA <213> Homo sapiens <400> 19 ccgtgacgac ttataaaagc ccaggggcaa gcggtccgga taacggctag cctgaggagc 60 tgctgcgaca gtccactacc tttttcgaga gtgactcccg ttgtcccaag gcttcccaga 120 gcgaacctgt gcggctgcag gcaccggcgc gtcgagtttc cggcgtccgg aaggaccgag 180 ctcttctcgc ggatccagtg ttccgtttcc agcccccaat ctcagagcgg agccgacaga 240 gagcagggaa ccggcatggc caaagccgcg gcgatcggca tc 282 <210> 20 <211> 1031 <212> DNA <213> Homo sapiens <400> 20 gcgccgctgc tgggacgcgg cgcggacccg catcattgcg cgcagcagcc gctgcagcag 60 ccgccgggga ccgcggagcc gggacgcccc cgctcggccc gcgccccgct ccccgcccca 120 cccccgcccg ccgggcccag caacgcaggg tgcctaggag ccgcgggctg cgcagggagg 180 cgggcagcgg ccctcgcgcg cttctgccgc ccccggagcc ggcgcgcggc gagcgcaggg 240 cgagcgcgcg tcgggcggcg gccgcgctgg ggggcgtgag gcgagcggcg cggagagcgg 300 caggggcgaa acttcgcggg ccagatgccc gagggcgcgg cggcgctgcc aggctgccgc 360 tgctgcccct gcgggccccg agcgcgcctc cgcaggcggc actgcccgcg gcgcggcgtg 420 tgcaccgagc gagtgaaggt atgtgtggcg ggcgcggctg gagctgccgc cgccgccgcc 480 gccgcgccag caggtcctaa tgcctgtcac ttcccaggac gctggcagca gcagcagccc 540 ggagcccccg agccctcggc aggtttgcgt gtccttcccc gcgatctgat tggataaagt 600 gggggctcga cggtggccga cgtgggacag tctggctgtg gcaggggtct cggaaaccat 660 gggttattgc agtggcaggt gcacgcttat ctttatctgt ggcatgcaac tggtaagtga 720 cacttgggtc cccttattct gtaatgtgtc tttgagatag tgggcagggg agtgcagcaa 780 agggtctgcc attgactaga atggacgaaa aagataaaag agaaggtgac agatatattg 840 cctatattga agatgatttc agggagacgc actctggggt acaggagagg tgagcctttc 900 cgttcccacc tatttctgtc ccttttaaga cagtttggca ggtgcgggtt aaacttgtct 960 ttaatttctt taggaaaagc aagatgtagc tcttgttctt tatgctttgc attcctattc 1020 atgtaacaac g 1031 <210> 21 <211> 795 <212> DNA <213> Homo sapiens <400> 21 gcgacccaaa ccggggatgc agggagctcg cttggcccct ttgaaggccg actccgcaat 60 aagcagtttt tcctttaaat aaccgtagtg gatttgagag aattttccat ggctgaaaag 120 agaaacagga gctgtaggca acatccctaa atttataata atgcatgtaa acatgctaca 180 taccacatat atgtatatgt gcataaatat ggatgtggtt gggcacatac ctatctagac 240 accattgact tgcctggtca aagaataaga cttagacatt tcgtgcctgg gaaatggtgc 300 agtttatctt taaggagact agaaaaataa gagatgaggc tcacgttgca cggatgacat 360 cactagcttt tggctgcgcg ctcggtgttc tcgtctgtgg gttttagcca aggctgcagc 420 tacccgcgcc ggacgagaga gcgcggcagc agcttcctcc ggcgcccgca cccgggcaat 480 gcgatttccc cagtcccctg ggcgcagcct gggctctcgc gcctcccggg caccagccga 540 gcctgcgagg cctcggagcc gccgcggcta gaggaggagg cgacgagggg aagccgagtg 600 acccagcctc cctcccccac cctctcccca ttcatctcgg cgaccaccgc gcgccgggag 660 ccggatcgtg ggacgccgag gccaggacgg gattctctgc acgctgtcga gtgagccggc 720 atctcggcgc ccgggtgggc tgcgaagaaa atggtgcaat ctgagagcga ctgagcccag 780 ctgggcagag cagac 795 <210> 22 <211> 160 <212> DNA <213> Homo sapiens <400> 22 ccggtgctcc cagaccccct tccttctcaa acacgcatca gacactttgc accaagaaaa 60 aacaaagggc atccctcctg gggccacctc tgccccctgt ccaggtacgc gctgtctggc 120 gcgccctgcg tgggggccgc aggttcagac acccgggcgc 160 <210> 23 <211> 554 <212> DNA <213> Homo sapiens <400> 23 acgcttctca tttattttat atttatacaa acagcgcttc cctgaaaaat cagggtatcg 60 ttcaagattt tatctttatt cacagaagtt ttaaaatttt taacttttat atgcacaaga 120 cagttctgat ttgttgaatt aagtgaccgc gggtgtgcta atgcttctaa aaaacagcat 180 tagccttctc ccatcaaaag tccggaagct gcccttcagt cgtcaaagtg tttgccttaa 240 tttgcaatcg ttatgacttg agccaaatgc ttatacctca tttgtgtcgt atatgtgaag 300 atacaattgc aaatcgttca cgaccttgag tcaagacctt gagtttcctg aggtcaggag 360 accgttaggg aatgtgagtg tcccagacgg gcgctgagcc cagctcggag acccaccccg 420 cccgtagcag cggcgcgggc cccagagagc cccgcactcg gccgcgcctc agttacgctg 480 actcggctgt gcccgcagtg tcgcgctgtc gcgtagccag gtgtcgccgg gctggcgcgg 540 ttatttatga ctgc 554 <210> 24 <211> 1732 <212> DNA <213> Homo sapiens <400> 24 acacgacttc tctgcctgtg gatgtctcat gaccctctag agcagcgact ttttcctccc 60 tcattccttc cactcccctc gggcatctaa gtagcaggaa cctgactgtc caaagttgat 120 ttgggagcag ccggctgccc ttctaaaatg atctaggaaa ggtgccagta acataagccg 180 ccgcctgctg aaactggcgc ttcctcagcc actcgctgcg gccagcgtga aaggggaggg 240 gaaaggggca ttcctggcac ggtcaggtgt ctacggacag caatcttagt taattctcaa 300 aaccccggaa gatccagaaa tggggtgctg acagggacct aacctgtcca ccacccctcg 360 gtcggtggga ctgaaaccca tgtctttgag ctgctttacc agtttatttc caaaaagtcc 420 tcctacacct gggaagggac atagaaagct gatcccattg ccagccggat ttctttactt 480 aactctcaac cgtggtaaat ctaattcgct tacgacctct ttccgagagc tgggaatctg 540 cagagatgct ctgttttctg ctgtactaat ctcaggcttc ccaaagcgag tgcctcgccc 600 agctcctagg ggaatccacg gagccccagg cgcagggcaa aggatggggc gggatgggga 660 catcgtacct gcgctccggg agccgctggg agtccggccg gccccggccg cggggaggaa 720 aagcaacggc ttgggctcct tatccgtgac gcgcgctccc ctgcgccccc ggggcctccc 780 gtgggctccg tgcggggaca aagccagcgc cagcaggaag agtgcgggca aaggggcgcc 840 gggcttaagg ggccgcatgt tcgcaagccg ggaggagaga gcgggagact ccgggaggat 900 cccgacgcag gtccggaggg tgcgcggccc aagagaaggc cagcgggacc acagcgcggc 960 tacgcggccg gccgcagtct tcaccgcgcg cctgcccttg tctacgtccc gggggtcggc 1020 tggagctgca ctgggactcg gtcctcagtg tgccgaagcc taagcgctgc ggggcgcggg 1080 gcgggaacgg gaggcggtgc ctggggccac ggggtcgtcc cccaggatga gggcgtgtcc 1140 cagcgcgcgg gaccctcgga agtccgcgct gggccgggcg ggcaccagcc tcggactcag 1200 cgggtctcag ggctccctgc gcaacgcctg cctcggatcc ggaccccggg ctcgctctct 1260 ggtcgccgtc cccgggagga cccagtaggg taactgccgc gtcgccccgg cggttctccc 1320 tgggctctgt ctcccgccgc ctccaccccc cgagcctcgg ggtccgtcac ggcttcccct 1380 ggctggcggg gtcagtagaa cccgcggcgc ctaggtccgg acggaaaaaa gcagggccgg 1440 ggtgcggcct ggatgagcgg agatctccgc gccttgggct caaaggtgcg gggtgcgctc 1500 tgctgccgag cccctgctcg ctcaggaaca ctggccacgc cgtcacgcca gccgcccctg 1560 ccccaggtct ggaggcccga cctgctctcc taggcgcagc accgcgttct cttccgcgtg 1620 ggggagcggc gggcggaaga ggtctggggc tgggcaccgg ggacacgcgc ccagctcccc 1680 tggcctccct ggggggagtg gccggtttca gtgcttcccc aggtgaaatc gc 1732 <210> 25 <211> 527 <212> DNA <213> Homo sapiens <400> 25 gcggcggcag cagcagcagc agcagcagca gcagcaagaa atccaaagag caaaaggcgc 60 tgcggcttaa catcaatgcc cgagagcgcc ggcggatgca cgacctgaac gacgcgctgg 120 acgagctgcg cgcggtgatc ccctacgcgc acagcccctc ggtgcgaaag ctctccaaga 180 tcgccacgct gctgctcgcc aagaactaca tcctcatgca ggcgcaggcc ctggaggaga 240 tgcggcgcct agtcgcctac ctcaaccagg gccaggccat ctcggctgcc tccctgccca 300 gctcggcggc tgcagcggca gcagctgctg ccctgcaccc ggcgctcggc gcctacgagc 360 aggcagccgg ctacccgttc agcgccggac tgcccccggc tgcctcctgc ccggagaagt 420 gcgccctgtt taacagcgtc tcctccagcc tctgcaaaca gtgcacggag aagccttaaa 480 cacacccccg aaaaacacaa gaccgaccca aaatctagag gaaagcg 527 <210> 26 <211> 211 <212> DNA <213> Homo sapiens <400> 26 cgccgctagc ccccgtcata tcttctccgc tttcgcttct ccactctagc cgggggtggg 60 gtgggtgggg ttggggtctc cgcgggggtt tccggccccg cggcccgctc ccgggtgtgc 120 ctggaggagt tctccctctg tggcgcgcgg gagccctgtg atgcgtcagc cggcgggacg 180 gatgagttgc ttctccggga aaccgtcctc g 211 <210> 27 <211> 315 <212> DNA <213> Homo sapiens <400> 27 cggccggctg ctgcttacgc gggtaacctg tcggaaagcc ttgtttgttt ttctggaaaa 60 gtcgctgcaa tggacacagc gttgcgcggt ttccctgcgc gcctggggcg ctttttgtct 120 tcgccctccg tggatggagg ctgagcgcct cagccatttt gagagctctg gaaattttat 180 tagcatttta aaatttgcat tctcgaccga agattaaagt gcaaattact ttgaagatgt 240 tttaaagcac gcttaagaat tttaaagaat atgcgcaggt ggaaaaaagc gcgccagggt 300 ttgagatttg gtccg 315 <210> 28 <211> 142 <212> DNA <213> Homo sapiens <400> 28 cgatggccca gctcctcagc caggtccacg ggcagacggc cccaggcatc gcgcacgtcc 60 agccgcgccc cggcccggtg cagcaccacc agcgtgtcca ggaagccctc ccgggcagcg 120 tcgtgcacgg gtcgggtgag ag 142 <210> 29 <211> 217 <212> DNA <213> Homo sapiens <400> 29 cgcgccggcg ggggcagcgc cggccgccga ttagttttat ctcggaacgt caattgactt 60 agactgattg gcttcctgcc gccaatgtca attaaattgc aaatgcttgg cggaggccgg 120 cgcgagcggg cggcctcctt cccgggggcg ccgcgctcag ccttctcttt gcgccacgtt 180 cggccgcagc tgaattcatt tctccttcca cgtcgcg 217 <210> 30 <211> 62 <212> DNA <213> Homo sapiens <400> 30 ccggtggtgg ggtcgtagtg gtttccgagg ttggtgacca cgtcgtcgaa cttgagcacc 60 tc 62 <210> 31 <211> 306 <212> DNA <213> Homo sapiens <400> 31 cgggtccgag accctcgtag tgtggggaat ttcctgggag gaagatacta cgcggggccg 60 ggagcagaat ttgctccagg cactgggcca gtccatgagg gctccaggat ccaggggccc 120 cactcccttc tcgccgggct ccgggccaag gaagcgcggc cggagtcccg ggaagcccct 180 cggcagccag ccaagggccc tgcgaggatg tggatggcgc ggatggcgcg gcctccacct 240 gcgggcagtg gagagagcgg cgagaggaag aatattcccc gcgagccggg ataaggggcc 300 ccttcg 306 <210> 32 <211> 718 <212> DNA <213> Homo sapiens <400> 32 acgtatctaa acaccattac caggctccac cagcccctct gctcctcagc ttagaggagt 60 ttttaaaacc tgttgagaat tatcgcagat acgtttggcc attatccagt cgtttcgatt 120 gtgcctttcc taaatgtccg cggttggcag aacgtgggag gaagaggacc cgcctaactc 180 ggggtaggtg gggacgcgct gctcactgtg gtgaggttga cacttgggcc ctgggtttca 240 cttgcaggtg ctgggcggcg gagagccccg agaaggagga ggagagagag ccagcagcca 300 acccctacga cttcaggagg ctcctgcgca aaacctccca gcgccggcgc ctcgtccagc 360 agtcctaacc gttcaacgag gcagtcaccg ccgtcggaag gcgctggagc ctgcggggca 420 gcaggggcca agcaggcact ctggggctgg caccagcagg cactgaagct gcggccctga 480 tctccgcaga ggctgcctgc tgcgctcggc cctcaagtgc ccgggccggc cttcgtgctc 540 cgaaacaaga gacctgggag ccctcgggaa acctcccccg acgctctctc tcggaactcc 600 cgcaccctcc tttctcacca gcccgccagt tgtggcaacc ctgtccttgt tcccctaatc 660 tatcactttg ttcttttttt ttgtgactcc tgtggactcc actgcgcctg ggatctcg 718 <210> 33 <211> 314 <212> DNA <213> Homo sapiens <400> 33 cgcggagaaa cctggcgggg ccccggactc cccggcttgg gaaaagcgat gactgccctg 60 aactgctggg gcgttcgaaa tttccagggt cccgaccctc cgtggggtac gcgcgacttc 120 ggcgcagatg tcagtccgct gccttccggg ttgagggagc gaggactcca gacgacccca 180 gggccgctgt ccaggcccag ccccgcgttc tccacctcgc cacctcgctc tgcggctcca 240 gcctggagat ctacggactt cattgcgatc tcttgcgcag tgtagtcgcc ctctatccct 300 agccccgagt cccg 314 <210> 34 <211> 1352 <212> DNA <213> Homo sapiens <400> 34 cgcggggaaa gttggcgcgc gcctgaccgc gcctggaagc cgcgcggtgc cagggccgag 60 ttgtccccca agtttctgcg gcgatttgtc actccctggg gatctggcgg tctgaatccc 120 gcggggcctc cggctcaggg attctgagcg ctgggagaga gaagcccgcg cttttcccgg 180 ggacctgcgc ttgagctggt gcttgtgcgg gttcgtcctg aatggtagcg attcgagttg 240 ttttctgctt ttcttctccc ccagacagtg agtttgtgga agcctcgccc gcatcctaca 300 gcccagacga gttaggtaag tctgctcatt ttgtctttta tttcttggtc gcaattctgc 360 ccgagaactg cgagtttggg gggcgtccat aggaactcag ctagggatgg ggctggggtt 420 ggagggcgga gggaaagggt caggggacac ctgctgcctt cgcggccgga accggccttt 480 cctcggcgct gtgctttcgg gggtggcagg gcaagtgtcc aatgagccgt gcgtgtgtgt 540 gtgtgtgcgt gcgtgtgcgt gtgtgtgtgt gtgagtgcgt gtgtgtgcgt gttcgtctgg 600 ggcagtggtg ctgctccgag gagcctggca cagcaaactt ccagagctgg ggcttctgaa 660 acctgcgctc atcttgccgg gaggacacag cggcgactgg ttctgacttg ccaagtacct 720 ggcacgagaa ggacgtcgtg tgggtcgtcc ttaccctgaa tttaatgaag tcaggggctg 780 aaaacggcgg tgtaatcatt aaactgtaag acctaggagc tgcttccctc cctgatttct 840 attcctcagt tagcctgtag gtgtctcgag ataggacatt ccatcctcat gcctgtcatg 900 gtaagtggag atttgcgatg ggtgaaccgg gacactcttg tcaagagaca ggctgaagag 960 agagtgaaga gaaggaaatg cgaatgggca ggatctctct aactcttcct gccacccatt 1020 ctcactcggt ggcttagtgg ctctcttttt tttttcttct gctttcaagg ttagtttagc 1080 tgctactggt ctgggctatc aagtctctcc ttactgttct ttcatcacta gcctgaatat 1140 cttgccttcc taagatgaaa tgaaaggatt tattttatga tatatgttga cagtaaagga 1200 ggaggggaac tgtccacaaa cagcggttta aatatgttta tcctcagtaa cacactcagc 1260 tgtggcaccc tgtccctggt cagcttcttg tgctgggaag aatgtcctca tcaagtccca 1320 caggacctga agcaaaattc cacctcaaca ac 1352 <210> 35 <211> 668 <212> DNA <213> Homo sapiens <400> 35 cgagggggaa gtggcttgtc agccccggct ccgggaagag tgaacaataa ggctagggca 60 gccgccccag atcgttatat tcctgggtct aataaagtca ggatcgctgc tttgcttccc 120 ccgccccaga agaataacgg tttgcaaaat ggggcaaaat gggcagaatc gcacggccgt 180 tgttgttggt gtgaccgttg ttgcacccca gtcgacatga cgttagtttt tcatttgcca 240 aattgctggt tagttgcaaa gcctaccctc ggccgcgagc actgaaggat gggagggtcg 300 agcgccgcgt tttgacagga ggaagtgcgg aggggcggag ggcgaggagg gcgtgattgg 360 ggctgcctgg tgtgtgcgcg cgcgtgtgcg cgcgtgtgtc tttacacgcg ccgcgtgccc 420 agtgttgcac ggggcgggag aagaatggca ggtagccgcc cgaaacacct cgccctgtct 480 cctttctttg ggcgaggttc ccgatcctgg caaagtgtga acaataggga gctgggagga 540 agacagtagt gatgctgccg cgggtggcgg gggttgcgcc gccgcccaga gaacctcggc 600 agtgtgcagg gaggtgcatt tcattttggc tatttccatc ccggcctccc tggaaaattc 660 ttctgtgc 668 <210> 36 <211> 497 <212> DNA <213> Homo sapiens <400> 36 cgacgatttt tgaggccacc cttccttgtc ccgcaatccg atcgcctagt aaatgccagc 60 agtatctggg ccttgagtct ggctttgacc cggcagtatc tacaaataag ggttatcctc 120 tttcccccaa cccacgatgt atcgcagtgg gctccggcag gctgcagact ccagacccct 180 ggagcaccgg cagggcaggg ttggacccct ccccgggtgg caaccctcca ctggagtgcc 240 cttcctcatc gtcttggggt taagagttgc cgcccggcca gggcaacagc cagggcaaag 300 ggagagagaa gccgccccgg ggcgagaagg agaaaagtta gagggctgaa caggtgacgc 360 tgagcttgtt ggagcgtgtg tgctccacca cgcaagggcg cggagttcgg ccgcctcatc 420 tcccgccatc tgcgcgcccg ggggcacgtc ctctgcgata gcctggaacc cagactacct 480 gcgcctgcct ggtcccg 497 <210> 37 <211> 998 <212> DNA <213> Homo sapiens <400> 37 gcgcctggat tgctcaagag aggtcaggga aacccctcag aactcctgag acccagagat 60 tgagggaggg gttgaggcgg agtctgcaat gggggctgtc cagcagtagc aagcagcggg 120 ccgatcctgg tggagggttg ggaggctgct gtcattttat gggtcggcag ccagagtgag 180 agtgtccctg ctgccagagg actacggcgg gctgggcgcg gggtccccgc ctctcgctca 240 ccacacagac cccgcgcctc ctctggcagc cgcggtggtg gcggcggcag agcctcgccc 300 actccaatcc ccaccctctc catccttagt cattaaagaa cagcagcgcc tggcacgttc 360 ttggaggacc ccgggcgcag aggaggaaag ggagcaggcg cagggggact ggaaaggcag 420 catgcgctcg ccaggagcaa cctcggcgcc cagggtctga ggctgcagcc ccagttcgcc 480 attgtgagcc gccgccgggg gagtccgcta gcgcagccgt gcccccgagt ccccgtccgc 540 gcagcgatgg ggcacctgcc cacggggata cacggcgccc gccgcctcct gcctctgctc 600 tggctctttg tgctgttcaa ggtaggggag ctcctccacc cctttttccc agcggtccgg 660 gcggcagccg cgctccggcg ccctcgctct gccgttggga gcggcgcgcc ccagggcacg 720 atggcccagc cgcgggaagc gcctgccgtg cagcctgggc gcacgctttg ttgtcctcgc 780 gtgtgcgtgt tcctggtggt cttgagaggt agggggcggg gggaagaata agggaagttt 840 gctccctccg gctttcgccc tttgtgctct tttatcgctg ctgaaatcca catcaaaggt 900 gggcttgttg gatcgtgctt tctcaggcaa aatgaggtca ctttcttttc tggtttccac 960 tgcaccccaa cgctgcttaa cctttccgcc ctccctcg 998 <210> 38 <211> 735 <212> DNA <213> Homo sapiens <400> 38 cgatctgaca gcccttcaaa ccaatatact ccctatctct ctctctcccc tggttcaatg 60 acaagatctt tggccaactt ctttctactc ggaccttgct attatttcct actaggcacc 120 cacaaaccct tgcttgttaa actgatctcc ttcaagactc aagaaaagcg ccatgcggct 180 ccctcctagg gctctcctgc cctctcctca ccgatgccga gagtggttct gctggagaac 240 cgccgcgcct gcagttcctg caccttttcc cggagctgcg ccagggaatt acggacgaac 300 tggaaggggc cgagaagaaa ggtcttggcc accacctcta gctccaagcc ttttcgctct 360 ttcagacttt ggatcctccc cggggaggac ctccaggagc cccttggcag tttcccgccg 420 cctagggccg acttttccat ctcctcctct acctccggct cccgggcgag ggaggccccg 480 cgccgcccct tagactggct gcggccggaa gattgcagcc gctttgagct tactccttgt 540 tttctcataa tcaaggagta tggtggagct gggtcaattt caggcacagc ccagccgagt 600 caggcgaggt ccagagagac ctgactcgcc tggcagcctc aacggacttg tccccgcagc 660 cgttgcggac ctcccggtcg tcatggcgac tgtgaaatgt ggggtggggc gcatgcgttg 720 gaagccattc gcgcg 735 <210> 39 <211> 359 <212> DNA <213> Homo sapiens <400> 39 ccgtaaagaa ccctgagcta ctactcagac gaagcccccc tccccgccaa taataataat 60 ataatggcgc ggaaactgtg ggcggtggtg gtgacatttc ccacgactca gtggcgcccc 120 cgggcggctc ccaccctccc tccggccggc gcgtctacgc agccccaagt gctggctgcg 180 accctcggat cccaagcata tctggcgatg gagcggcggc agcccgaggc acgtgttgtg 240 tgtgctccga ttgcaaaaga aaaaaaaatg catttcaaac tattaacttt tttttaagcg 300 tgcaatgccg ggagctgggg gtagacaggt gcaagcgggg gtaggcgccc cgcgcgccc 359 <210> 40 <211> 2027 <212> DNA <213> Homo sapiens <400> 40 ccgcgattag ttccggcaga gtgatgcagg tagggatgca gatacagccg agtaggtgag 60 ctctgcccca accgtctacc caattacaag catctttcgc ctacactgag gacacatcta 120 aacacagaat ttacaattgt gcatgcgaaa ctttacactt acgttagttg cctcaacctt 180 tcccctttcc cagtatgctg cagttaggaa tgatttgttc caacacatag aaagccatgc 240 atctggtagc accagtttgg ggagaaatca gaagcagcaa aatgtttcct ccttgtaaaa 300 tgtgttgctt cgggctggca aattagcaac tccagagaac aaattcacgg atttgtcgtt 360 agtcattctc tccacatttc gtctctctta cccactgggt ctgggttctt ctgggcattt 420 agcacacaca acacatagtt gcacttcttc agctcaggga tattttccac agcagcatgc 480 ataccatttc catccgatgc caatactgct taagtctcta acttcttgta ggaaacgtca 540 gagttgcggt gatgatgatt ctctgacagc tatccgggtg acagttgccc gaaaaattcc 600 taatcggtta tctcttgcgt gcttcagaga ctctgaggcg ctcctttccg tctcgcgtgc 660 tctccctctc tcccttcccc tctgcccctc tctccttctc cctctcctct ctctgaactg 720 aatttcttga tataactctc aataagccca gagggagggc gtgactgccc aggccccgcc 780 cccgggctct gattggcctg catcttgcgg cgcgggcggc cgcagcccgg cgcgagggag 840 ggagcgcgga acaaggcgct gactgtctcc cagcctcccc tcctccgcgc cccctcggca 900 gcagcgaaaa cccggaaatc tgatcctggc cccaggagag ccgggttcca tgaggtgcac 960 tgagcatgct ctgcagggtc cggcgtggga gggacgcgct ggcgctcccc aggcccgggc 1020 ggaagcggcg ctcgcaggcg ctgaaagcga gcgaccctct gagcccgggt ggtccggcgg 1080 gcaagggcgg cgcgggagac ccgcagggcg cgggcgcgga tccggggaac cagggccacc 1140 gctgcgggcg gatgggggtc accgaggcgg ctcgtctcca ggcgcacact tcgcacatct 1200 ctttgctaag tgaaggggcc aaaatgcaca gatgggggag tctacccagg aacagaggcg 1260 cgagacgtat agccacccct gggttgggag cacgagccag cagatccccg gagcgcgtta 1320 aacggacaac atgcccggtg ctgcaaatag aggcttttgc tggcagggac attggaaaga 1380 agggcggaga gggagtacag cgaaaggtgg ggaccgcaga atttggaatc tctgcggaga 1440 ccggaaagaa aattaatcgg agcacttcct acatgcagag ccacggaaac tgccttggaa 1500 agagaaagtg gcagcgtctg ggtcccctcg gtcagcccgg gccagtcggc tgcgcgtgcg 1560 aagtctcctc tagcggagcg ggaccggccg cggcggtgga tcgtggcggt ccctgcactt 1620 ctgctccagc cgcgcctgga aacctgagcc cggactcgcg gctgctgcaa aacccgcttc 1680 cagcccacct cactgcgaac tttgcttccg aggggctgga aggagtccca ggcagctgtt 1740 tcccaagctg tggaacactt cctttcccct aggcactttc tgctgattcc aactttcttt 1800 cctgtgattt tcgtcttttc ccgtgcattt catttctccg actccagctc tgtactaaat 1860 cctcacaagt ttctcgtttt catacgggaa ctggatggaa tgactcccca aaaaatacag 1920 ctttatttct caaatactga cccccaaagc actatctagt aatatatttg attgatcttt 1980 caaagtcagt aaaccacaaa ggtttgtgta atggcttgta cttaacg 2027 <210> 41 <211> 144 <212> DNA <213> Homo sapiens <400> 41 acgtacaggg cggtgatcca gtatctaaat tctttgggag aaaatgaata gttcccccgc 60 ccccgccctc caggaaaaaa aaaaatctga gaatctgaga atgttcagcg cacccgcgaa 120 tttgcatcgg aggtgcgttt cccc 144 <210> 42 <211> 604 <212> DNA <213> Homo sapiens <400> 42 gcgcgccctg gcggctccga gggacctggg ctcgggcttg cggtcgcgtc gcctgggctt 60 tccctgggct gggagcgcgc cgggtctccg ccttgcacgc tgtcaccgcg ggagacgtct 120 cggcctcgcc gcgcgcagag gggacgcgcg gagaggctgg tttctgggcg agcggagagc 180 tttgcccatt aagctgccgg aagaagccaa atcaaaaagc caatctccaa gcctccaaac 240 ggaacgtcac cctatcagct gggagacagc gccgcactga ctgacaagcc gcgcatattt 300 atcctcgcgc gcggagggga gactctcaga acgctcctcg accagcagcg aggaagtcga 360 gcccgcatcc cgcatcccgc atcccgcatc cagagccccc gagggacgaa ttcagatcca 420 acccctgccc cgcggccacc caccctagtc gttggagcct ggcgcccgcg cctcccggcc 480 ggcagcacgt caaaacggcg gcgcgtcctg acctggattc cgccgagttg ggagctccag 540 gcagcaggcg ggcgcgcggc accggctttc cccttgtcct caggagacgc tgcctgcaat 600 tccg 604 <210> 43 <211> 233 <212> DNA <213> Homo sapiens <400> 43 cgcgagcggc tgggtgtcgg tgccctgctc tcctctgggc gccaggatgt tcctgcccag 60 tgcgtgtcca gaatagccgc tcagacaccg gctccaggtt cagccaggcg gggcgcgtcc 120 ctgcctccct cccctttgcc tgccactgcc ctccttctaa cgagggctca gctccgacta 180 ccccaggcct ccggggaccc tctccggatg cgctccccgc tttgcgcttt gcg 233 <210> 44 <211> 261 <212> DNA <213> Homo sapiens <400> 44 acgcaagttc cccctgactg ggggacgccg cccagctcct ggagcctgcg aaggctcttg 60 aagctgagct tcccagggat accagaaggg acactctcgt gcaattccgg ctagggaaag 120 cgagggaagg tggcggctcc gggcagggag cgagcgagtg ctccacgccg cccgcaggat 180 cgagtgagtc acgcggccgc cagacgaggc cggtggcgca cgcacccgag atccgatgta 240 gtgcaccgcc tcggcgccgc g 261 <210> 45 <211> 47 <212> DNA <213> Homo sapiens <400> 45 cgctcgttgc gacccaggct cagctccgcg gtgcgcaggg cctggcg 47 <210> 46 <211> 335 <212> DNA <213> Homo sapiens <400> 46 ggcggccgcc agctgggagc ccaccaccgc tcgatggtac cgaaccgacc cgtgtagccc 60 cataacccca gcccaactcc gaggagctag cgcagaccgc tctccgccct cagctgcggc 120 gaggcaaggg ctggcagcgc tcggacgcct ccgtcttgcc cttcccatgc ctaagcgcgg 180 ggaattacac gttcccggtg tagaacagac gatcggggct attagggctg ggcggtggga 240 gtgggggttg ggagcaccat ttttggctgg acgtgtgtcc agactcatcg tctctggtcc 300 ttaggacccc atcttcctct gcatctccag gtgtc 335 <210> 47 <211> 317 <212> DNA <213> Homo sapiens <400> 47 cggcggctgg ccaggggcac agagacgcac tccacacaga aacccaggct ggcggggtgg 60 gcggccgggg agccagccct gcagatgtta ctaagtgaaa cctgatgtgg tgacatgaga 120 atccacagaa cgtctcacaa acaacctgcc ccgggatgtt ttggattgag ttttgtggtt 180 atgacgtgaa gaaacctcac atgtcaggat aaaaataacc ctggcttcag tacataacgc 240 gagttacagt tcaacagaac cagatgtgaa aacgtcagcc acccagttca ggcccagcag 300 ggtccctgct ccactcc 317 <210> 48 <211> 235 <212> DNA <213> Homo sapiens <400> 48 cgggtctgga agattgcgct acgggagttc tccgtctgag aggacaactc agctttcgca 60 cgggagggtt gatgcttaac agaattaaaa atatatgtat taagaaccgc aagcccactg 120 tgtgccagcc gccgttggta gttttacacg tgcgatctta tttaatactt cctgggacct 180 aatgagtcag gtgccatcat gatccgttta caggtaagaa agccgccgct cagcg 235 <210> 49 <211> 81 <212> DNA <213> Homo sapiens <400> 49 cgaatcgcac ctcttctcct gtcctaatct caggctccag gcctggcttg cagtttctgg 60 ctcaccgcgc tgcggtcacc g 81 <210> 50 <211> 24 <212> DNA <213> Homo sapiens <400> 50 cgcccccgcg gaaaccgctg ctcg 24 <210> 51 <211> 236 <212> DNA <213> Homo sapiens <400> 51 gcgaggccag actgccccca cacctcctgt agccactgag cgcgaagtgc gttggttccg 60 agcgcgctgg tgggatccac aaagctcgca ttctctcagg aatcccctga gaaattaact 120 gtcccttgcc caacatgtct tctccaggct gtctgctaga gcctcaggcg cctccgccct 180 ccctcccgcg gcaccgtcac cagtgggtag tcacagcctc ccggagccca tagccg 236 <210> 52 <211> 533 <212> DNA <213> Homo sapiens <400> 52 cgcctccgcg ccgcgcgccg ccgccgcctg gtaccgcccg gccgggagaa ggtgagattc 60 gcgcggcctc gcgcacaccc gcggctggga gctcgggact gcggtgacgg gaggggcagt 120 gtggtgaccc acccaggatt tttttttttt tcccgtgaaa gtcctcaagc ctgtcctctc 180 cctggcccga tcctattgca gcgacagaaa atcagcagcg ggcgggtctg tgtggacctg 240 agggccgcgt ggggaccgag gggggctgtg gcccaaagag tggcagtgag tggcgtcaag 300 gaacccacac tccgcatctg ccactcctag agccgggact agctcccgat cctagcagtt 360 gctctcgaga tcatcccggg agttattggc gagttctggg cctctggagg tttccctgtc 420 agcctccccg gccgccgagg gggcgcgcgc ccaacaaggg ggtctctagc ggccacctgg 480 ggacagaaac agtgaccctg ggcgcgcact ttgcctcccc gttagagatg tcg 533 <210> 53 <211> 280 <212> DNA <213> Homo sapiens <400> 53 gcggaagccg cgagggatgc agcggcgggg accttggccg gtggaggatg tggaggtgga 60 agtggagcgg atggcgctcc ccaagagctc cgccacgcga ggtttcgggc tcgtggtttt 120 gcttcctccg ggtccccgct ccagggccgc tcggcgcgac gaagacgccg gggacagcgc 180 cgcggggagg gcgctccggg tcgtgcgtgc tgcacccaca aagagcagca gtcccgccac 240 tccgcgcctc cgctgcgtgg gggccgaggg gcgcttctcg 280 <210> 54 <211> 535 <212> DNA <213> Homo sapiens <400> 54 cgacatagtc aagcagggct acgtgaaaat ccgcagcagg aagcttgggg tgagtggctc 60 gctcggcttg ctccttcccc ggcgctcgtt cggcccggct ggctgcctgg ggggggggca 120 gggagaggtg acccgtgcgg gtacagggca gagagggacc cggcccttag gcggatggcc 180 cgcttgttgc ttggccaggt gggggcccac acctgccggg gggctccgca gacggacctg 240 gggactccag gagcgcctga gtccccatcc tcgagtgcac cgggctgtct tcgaccgtgc 300 ggggaagtca gtagacgaaa ggggttgtca gttccaacga ggaacgtgcc ttggaggagg 360 tttctttgcg gtgctatcca cgatggtctg ttctcaaaag tgtgcgcctt tcgggtggaa 420 ctgctgtgtg tggcgacgct cgcgtgtgtt tagaatcacc attttctggt ctccgcttcc 480 caagctcaat tcgaaattcc cgtctgatgc cctcccagcg ccgcgcgtcc ctgcc 535 <210> 55 <211> 69 <212> DNA <213> Homo sapiens <400> 55 gcggtgggcg cggcctgcgg ggatgccggg ctctacggag cagcgcgggg tcccgaagcc 60 ccctaccgc 69 <210> 56 <211> 1211 <212> DNA <213> Homo sapiens <400> 56 cgtaaataaa tgagatttac acaaatagcc attcacaatc atggtcacag tcacctacaa 60 accccattta cacaaatgat caggcacaca atcacactgt cactaaagca cacccacgca 120 ccaggtcgct gtcccaacag taacacacag cccaaagaga aaccctactt cctcacgcat 180 tcaaaacaca cccacctaag ggctgatccc gcactcagag gcctaaaact atagacattc 240 ccttccgcgg cactggtgag ccaggatttc ttaccttcag cattctcagg gaaggctctg 300 gtccaagctc tgattcggat tccaagcgaa gccacacgcc cagctcttcc ttctccaccg 360 gcccgggaca tccttacctg cctctacccg gagaccattc ctgcgaggct cctaccggaa 420 gtagctgtgg acagcagtgt cctctgggaa atgcagtccg aggggagagc gcctggggtg 480 gagcgggtgt gttccgccgg gctccgggat gcacttgcgc agtttcaccc gaggctggag 540 tgacgccaac ctgttaatgt tcgttttcgg attctggact tcgggttccg ctgaggacgg 600 atttcggaat aggcacagtg gctgccccga acccctcaag gcggcctccg cgggctgtgg 660 ctgaagataa ttttcggcgg gcgcggacta acccggcttc cctttgtgga gttgtggtga 720 gaaaggtgtt ttgttgtgcg cgtgtccgaa ggtgactccg gaggagaagg tggatatgaa 780 ctgacggtga gggtgtagcg cgtgagattt gtatgtgaaa cgatttaaaa aaaaattttt 840 tttttggccg ggcgcggtgg ctcacgccaa ggcgggcgga tcaccgagac cagcctgacc 900 aacatggaga aaccccgtct ctactaaaaa tacaaaatta gccgggcgtg atggcgcatg 960 cctgtaatcc cagctactcg ggaggctgag gcaggagaat cgcttgaacc cgggaggcag 1020 aggttgcggt gagccgaggt cgcgccattg cactccagcc tgggcgacag agcaactcct 1080 tctcaaacaa acaaacaaaa ctgtatgtca tatatttgac tccatttatt tatttattta 1140 gagacagagt cttcttgccc tgttgcccgg gcaagaaaaa acaaacaaca acaacaacaa 1200 aaaactgtac g 1211 <210> 57 <211> 317 <212> DNA <213> Homo sapiens <400> 57 gctgccgagt ccccgcagca gggggcgagc aagggactcg cggttgacgg gacacggatc 60 ctctaaggcc cagagtgtcc cgagtagcgg cagtggggag tgctcagggt acgctaatgg 120 tgagtggttg cagttgatgg gacaaaaaac tgtgatggga gttagtgtgg gtgtgtggtt 180 gtgtgtgtga gtgtgacggc acgaataatc tgatggggtg attgtgatat ttggttgcgc 240 gggattatga tgaaatgtgt gatatgtgtg tgattatgat taaggctgta gcgagtgtga 300 acgtggcgaa gtgtgcg 317 <210> 58 <211> 328 <212> DNA <213> Homo sapiens <400> 58 tcggagatgt gcgggctgca tgcccacgct tcaccgctag gggaggtcag ggctgtgcga 60 tggggaagga agagagtgtc ggggcggtgc agtcgggatg ggagaagggt gtcagggcca 120 ctggccccca gctcggcaga gggcagtgtc gggccgcgcg caggcaggga gtgggtgtgg 180 tgtgaggctg gcgctggagc ggtctgggaa tgttaggagg tctagggtat cgcggccctg 240 cgtcctcttg tctggactaa aagtccgggc agttctcccc ggacctggat tgtgggccca 300 gcgacaggtg cttggcgatc tgtgcccg 328 <210> 59 <211> 303 <212> DNA <213> Homo sapiens <400> 59 cgcctgggat tgcgaggtag gtaccgcctg cctgtgtgta ccggggctgc tgtctccggg 60 gaggggcttc tggcggacag gagaaccaag cagcctcagg agctgcctgg gtgtgtgtgt 120 ttctgtgcga gtgttgcata tctctgtgtg tgtttctgtg caagtgttgc atgtctgtgt 180 gtgtgggggg ggtggtgtct ggtgaaaaga atgtgtctcg tgcggtggag cgccgtttct 240 ctgtagtccg cgggctctct tatgcgccct cttgtggtcc caagtgtgct tttcttgttt 300 ttc 303 <210> 60 <211> 248 <212> DNA <213> Homo sapiens <400> 60 gtgtgcgtgc ttctgtgcgt gtgtgtgtgt ttgtgcgcgt gcgtgtgctc atgcacggcc 60 ccgtggcagt gctgggtatg agctcttgcc ccagacatgc ccctgcctgc tccctgccag 120 gatctgggga gatggctgta cctggcagcc ctagggtgca gagcagagtg ggcagccgtc 180 cctcgggact ctcagctgcc cacttcttcc cacagtgcct ggccatgcca ggctgcccag 240 aggggcag 248 <210> 61 <211> 221 <212> DNA <213> Homo sapiens <400> 61 gtgtgttcga gtccctgggt tgcttcctgg ggtctgtggt gctgggtgtg ctatctgcgt 60 gtgattctct agcgagagat tgtgggcgag tgaccgagtg ggcaaggggc cgtcactgtg 120 tgtgcgtgat tttgacagtg tgtggtggta gcttctgact ccgcgtgggt cgttgaatgt 180 atgactggga ccgtttagcg gtggatacac aactgtgtgc g 221 <210> 62 <211> 150 <212> DNA <213> Homo sapiens <400> 62 gcgtaatcac gcactgcgca ggcaccgccc gctctgctct aaggtccctc tcactccttc 60 agcagcccga ggacaatccc ctcaacacta ggccacgcct tgtctccgcc cctctcgtcc 120 gacccctgga gagaggctgg cgcctgcgcg 150 <210> 63 <211> 237 <212> DNA <213> Homo sapiens <400> 63 ccgcccgggg ctcctctgtc ccagctctgc ggcccagggg gtgacgtgat ggcggcagcg 60 gtgctgacgg accgggccca ggtgagtgga cggtggcttc gcggttgccg cttccttgcc 120 agcgctgagg cggtttccga agtgggtggg agcccaggta tcccctggat ttgtcttcgc 180 agtcgtcgtt cgctttggtg tgtggagctg gtttgccact taatttatac ctggccg 237 <210> 64 <211> 129 <212> DNA <213> Homo sapiens <400> 64 cggtctcctc gtatccatcc tcgcagtccc caccccaaac taatgttctc ccctgagcaa 60 atttcgagac acttaaaatc ccagctaaga tcacgtcctt ctattcaaaa ccctcagtta 120 atctcaacg 129 <210> 65 <211> 848 <212> DNA <213> Homo sapiens <400> 65 gcgagttcaa tgtcctccgt tccgtcaagt ttgggtttga gctttgggct cagctgccgt 60 ggtctggaga cctcgtaggc actctgcaag atgcctcgtt ctgctgcatg cttggggagg 120 aagttgagct gggtgctgga agttctgaac ccagcatgcc ccgggccgga ggagatttgc 180 ttggtgtctc cttagcgtcc cgaacaccgc gcgcccctgc tggggtaacc tgaacagctg 240 gacccctcaa ctcgatcttt attatcagca ttggggctcc agattccgta cacatctcta 300 gctctattca ttcttcctag gttgagaacg gacgcattgg gagtcctacg cccgggggaa 360 aggcaggaga ggggaggaag agaacctgtg cccctggaag ctagaggaga gcctcgctct 420 ctctgctgct ctgggttccg caacgaattg agttcgggtt caggcggctg gagcgggcgc 480 ggggaggctg aacaatcgcc ggaggcccag gaggggaggc gaatgtacac aggctaagtg 540 gccccactcc aggacaagtg gccctctaag tcggctcagt gtttacctgt ttactttccc 600 aggtagctca aacacgagcg ccttttctgc gctccagggc acgggggccg cccagaggca 660 ccctgctttc ccggcttctg ccctcccacg cctcagcttt acgccccctg ttgtgggggt 720 gcgctctaaa caacagcaaa ccaggcaaga aaggaagata caggagagca ggcgaggcct 780 cggcacaccc tacggagggg agcctttctt gtgcctgtgg aagaagtggg ctccgtggac 840 ggcatccg 848 <210> 66 <211> 79 <212> DNA <213> Homo sapiens <400> 66 gcgcctggag gctgcattga ggccgggctg tgtaaactgt agggtgcctc gccgactcgg 60 agccgcagag actggcggc 79 <210> 67 <211> 2225 <212> DNA <213> Homo sapiens <400> 67 cgggccttaa ggaatctcag actgcacagc tctgctgtct cattccaggg gtccctgggg 60 tgctccgctc ttgccaattc cgggcacaag gaccacccac tctgcccagc agcctctggc 120 cccactccca ctgccccagc gaaataagtt ccagcttcca ggcatgattg attatttgga 180 acagagcctt ccactccgga ctgagaccca acccctgcag aaagtcctaa actgggctgc 240 gaccactttg ctcccaggag cagaggagca ggggaaaagg ggagaattct ttaaaaaatg 300 acacgcgaga gagttaaaga aggaaaaagg caccaaagtg atgaaacaaa aagaactgga 360 gaataagcac tgcacagaga gaaggccgta gcaggaagga ccggcagtga ctttcaacag 420 tgcttgagag cagaattatg gccgcgagag ggagtgcaaa ctgggaggcg gggcaaaccc 480 gggaaagacc tcccaagcag gttctgcgaa ggggccccac cgccttcagc ccgcctgggt 540 cagccttata agggggaaag gggacagaag tctgcagaac agagatccta gcgtagccgc 600 tcagggtacc ttcccaggtc accattgctc ctctgccctc tccacatccg ccctcccgtg 660 agcgcaggat gcacgcacag gcagcggtta caaaactcag cgcaacgttg caacccgcac 720 aaaaggcgca cacaaaatca ttaaaaagaa atacacagag tggaaagaac tcgcacaagc 780 tccaactcgc taaaggtgga aggagtcagg ttacaaactc tccctccccg gcctaaatgc 840 tttgctttag tttgcagaaa atcgtttgtc agtttttttc ttggttattc attattcggg 900 caaatgcaag tatgttttct agctgagttc accaatccaa acctcaaacc acattcctcc 960 actccaggcc tccgttctgt ccgcggactt atgatcctgc ctgccagcag gagtctaccc 1020 tgaagtcgcg tgggatagat aaagtgagga gaggaggatg aatggacaga caaacgagag 1080 caattcttct acctgtgggc tgtcctacgc cttgcagtgc cgggtcctgc ggcgaccact 1140 gagccccttc gtcctcgccc tcagtccctt cgtcctcgtc ttcggtctcc gctttcccag 1200 tcggccgggg ctcgtcgtcc acgaccccgc acgtgccgcc gacgtcgccc tgccgattcc 1260 gccgcaggag gtggaactgt agtggtgccg gcggcttctc ccctggggcg gcggtggcga 1320 ggcgctcgct ggcggcgggc agcggctgga tgaaatacgc ctcccccagc aggtagaagg 1380 cgccgcgcac gccctcgcag aggctgaggg cggcagccga gctgggatcg ccattcacgg 1440 tgccggagta gaagcagtgc gccaggtcgg tttccggaag cggcgtctcg gacccggatt 1500 tgcgccccac gttctggagc gtgaagccgg gcgccaaaaa gctgctgtcg ggccgcagct 1560 ccagatccag ctgctggtca aaggcgtgca ggcggaggcg cgtggtcccg tgtcccgggg 1620 cgcgctccag ctccggcacc actagctcct cgtcctcctc ggaggggcgc ccgagtgcgt 1680 ccgacacggc cagtagcgcc gcggcgagca gcagcagcgt gggtactggc ccaaagctcc 1740 gagaccccgg agcccgctcc gcgttcccca tgtcgctgcc cagcttgcgc cttccgaacc 1800 cctcgggcac agctcgctgc attggagccc caggagacac cgctcgtagc agcgcacgga 1860 gcgagggacc tttagttcgg gtcgggagag caaagcctcg ttggcctgct ctggattgtt 1920 aaaattaaca atttctatta ttcgttggaa gggcgcgcag agccggctac agccgaagct 1980 cccggagtca ctaaaaggag gcgctgcagt tctgccggcg cgcgggaagt ttttcttcca 2040 gcgcaaagtt ggagacactg agaggcaggc gcaggcagag tggctctgct gggacaagaa 2100 gcgctctggg gcgcctccgg ggctgaggca acgcggagat tggtgcctgg cgcccctctt 2160 cggcctccgc cttggctgcg atgttgctca ctctgctcag ggctctcccc tctccgtccg 2220 gtagc 2225 <210> 68 <211> 997 <212> DNA <213> Homo sapiens <400> 68 tcgaactaat ttaatcagat gtaaaattaa tgagaacccc gagacttccg acgtcccact 60 ccagaactcc catccaggtg cggtcgggag ccacagcttc tgaatattcc ttcggaactt 120 ttttctcact tgattcccaa gcctgtcatg gggttctttt tcaatggcac tgacctgcaa 180 ttacccaacg agcagcggga cagccccggg caggacgcat cctgggtggg tgacgtgatc 240 ccgcagtctc ctccccgacc ccatatccca tacaatgatc ctcgcttaca gaagtcaagg 300 gggaaagatg acgctttcaa agcccgaatc tctttaccct ggagccagaa ccagcgtcgc 360 cgccgtcccc tgcagctcag ccggcaacgc gcgccgagcc tcggggcgca gcttggagac 420 gcgcttgctc gttctgggaa ggggcacggg acgcacggtt ccccggcccc agctgcacag 480 ctcagctcgg ggctctcacc tatcctcgtt cagagccaca ttcggctgcc tcccctgacc 540 acccgacaca aagagattcg ccggtggaaa gaatcgattt caaaattcaa gctcaccgct 600 gctcaacaag gcgcgcacgt ttctccccgt ctggcttcac atgtcccaaa cttccagtaa 660 cagaaatgag gaagcagcag ccttccccgg ctgctggcgg aggcagtggg tgtaacttgt 720 gaagtttcgt gctatgatga atctggtcac ttgggtgtgt tggagagggt tggtcgctcc 780 tcccttcctc ctcccaccat cacctccctc ctctccgcct ccctctccaa tttaattctt 840 ccctctggca ttcgccggct gtcactcaga atcccagcac cctccccacc acatccttgg 900 gggcaatgta tttcgaaaag gtcttaacca ttttacggat gaacctggtc accctgcaca 960 aagcgtgagt gcttgtcaaa taattttcta cagcacg 997 <210> 69 <211> 284 <212> DNA <213> Homo sapiens <400> 69 gcggcgcaag atcaacagcc gcgagcggaa gcgcatgcag gacctgaacc tggccatgga 60 cgccctgcgc gaggtcatcc tgccctactc agcggcgcac tgccagggcg cgcccggccg 120 caagctctcc aagatagcca cgctgctgct cgcccgcaac tacatcctac tgctgggcag 180 ctcgctgcag gagctgcgcc gcgcgctggg cgagggcgcc gggcccgccg cgccgcgcct 240 gctgctggcc gggctgcccc tgctcgccgc cgcgcccggc tccg 284 <210> 70 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 70 gcaccactag ctcctcgtcc tcct 24 <210> 71 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 71 ccggcgcgat tctccctcaa cg 22 <210> 72 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 72 gtgcgcggcc caagagaagg 20 <210> 73 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 73 tggggtcgta gtggtttccg aggt 24 <210> 74 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 74 gtggaggatg tggaggtgga agtg 24 <210> 75 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 75 gcatctatgc gggcatggtt actg 24 <210> 76 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 76 acctctgccc cctgtccagg ta 22 <210> 77 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 77 ctagggccga cttttccatc tcctc 25 <210> 78 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 78 cggcgctttg cttttctaca actg 24 <210> 79 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 79 tggagaagta agtgggaggc ggtgt 25 <210> 80 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 80 gaaaagcgat gactgccctg aactg 25 <210> 81 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 81 ccagcagcca acccctacga cttc 24 <210> 82 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 82 actgaagctg cggccctgat ct 22 <210> 83 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 83 cgcccgcagg atcgagtgag tc 22 <210> 84 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 84 tgagaagtca gacgggccgc gtaa 24 <210> 85 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 85 cgggctgggg ttggaagagt aac 23 <210> 86 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 86 ggctccgaat cgcacctctt ctcc 24 <210> 87 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 87 agggactcct ggccttgcgt ctt 23 <210> 88 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 88 ctcagttacg ctgactcggc tgtg 24 <210> 89 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 89 cgaggatgtg gatggcgcgg atg 23 <210> 90 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 90 ctgcattgag gccgggctgt gt 22 <210> 91 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 91 gcgacgcgtt tccctggtta cct 23 <210> 92 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 92 tctaacgagg gctcagctcc gacta 25 <210> 93 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 93 gggatgggga gtagagggag ggg 23 <210> 94 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 94 gcgaggtcat cctgccctac tcag 24 <210> 95 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 95 gccttctctt tgcgccacgt tcg 23 <210> 96 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 96 agagtgagag tgtccctgct gcca 24 <210> 97 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 97 cccactccaa tccccaccct ctcc 24 <210> 98 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 98 aactccgagg agctagcgca gac 23 <210> 99 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 99 gcctaagcgc ggggaattac acgt 24 <210> 100 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 100 aaaagccaat ctccaagcct ccaaacgg 28 <210> 101 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 101 gcggccaccc accctagtcg ttg 23 <210> 102 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 102 gctctgcctg tttgttccgc cc 22 <210> 103 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 103 gagcttggag atgcgaggga aact 24 <210> 104 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 104 gcctcggcgc ccaaaatcga aagg 24 <210> 105 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 105 ggagcgtgga cttcttgggc cg 22 <210> 106 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 106 ttcggattct ggacttcggg ttcc 24 <210> 107 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 107 ggtaggtacc gcctgcctgt gtgta 25 <210> 108 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 108 ggagtgggtg tggtgtgagg ctgg 24 <210> 109 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 109 ctcgcgatgt ttcagggtga gcc 23 <210> 110 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 110 gtctcggagc tttgggccag tacc 24 <210> 111 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 111 gaggcagcgc gactccaaga ctcag 25 <210> 112 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 112 gggacgtaga caagggcagg cg 22 <210> 113 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 113 tcagcgccgc cacctacagc ac 22 <210> 114 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 114 gacccggagg aagcaaaacc ac 22 <210> 115 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 115 cgtggacctg gctgaggagc tg 22 <210> 116 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 116 acagcctcgg tcaccgcatc 20 <210> 117 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 117 gagtaagctc aaagcggctg caatc 25 <210> 118 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 118 gcagtcagcc cgaccctcct 20 <210> 119 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 119 acttagccgc ccatttcaga gcagc 25 <210> 120 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 120 ggaaggcagc ggactgacat ctg 23 <210> 121 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 121 ttaggactgc tggacgaggc gccg 24 <210> 122 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 122 gagggctccc aggtctcttg tttc 24 <210> 123 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 123 aggcggtgca ctacatcgga tctc 24 <210> 124 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 124 ctcagatggg agcgcggcag gaacag 26 <210> 125 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 125 atccctggac tggcgtatcc acag 24 <210> 126 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 126 tcctgggagt gtgggccggt ga 22 <210> 127 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 127 tctgtttcag cgcaactgtg aagtg 25 <210> 128 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 128 cccaaccacg cagtcataaa taacc 25 <210> 129 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 129 ttcctctcgc cgctctctcc actg 24 <210> 130 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 130 agttgacccg ccgccagtct ct 22 <210> 131 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 131 accccgcgct gctccgtaga 20 <210> 132 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 132 gaccccaggg aacaggcaaa aag 23 <210> 133 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 133 cctaactccg tcccgctcgc tgtt 24 <210> 134 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 134 cagcagcgtg gctatcttgg agag 24 <210> 135 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 135 tgcgcgacgt ggaaggagaa atga 24 <210> 136 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 136 gcggggtctg tgtggtgagc gag 23 <210> 137 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 137 gtcctccaag aacgtgccag gcg 23 <210> 138 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 138 gcttaggcat gggaagggca agac 24 <210> 139 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 139 cactcccacc gcccagccct aata 24 <210> 140 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 140 aggataaata tgcgcggctt gtcagtca 28 <210> 141 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 141 cgccgttttg acgtgctgcc g 21 <210> 142 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 142 gcggcttggc gggctatctg tg 22 <210> 143 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 143 cccccggccc tcctgtatta ct 22 <210> 144 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 144 agtcagcgct acgggaaagg aaacc 25 <210> 145 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 145 ctgcacggcc ggagaagcga at 22 <210> 146 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 146 gcccgccgaa aattatcttc agcca 25 <210> 147 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 147 ctgaggctgc ttggttctcc tgtc 24 <210> 148 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 148 ggccgcgata ccctagacct ccta 24 <210> 149 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 149 aacacacgaa cagcactcct ccgc 24 <210> 150 <211> 158 <212> DNA <213> Homo sapiens <400> 150 gcaccactag ctcctcgtcc tcctgtctcg gagctttggg ccagtaccgc accactagct 60 cctcgtcctc ctcggagggg cgcccgagtg cgtccgacac ggccagtagc gccgcggcga 120 gcagcagcag cgtgggtact ggcccaaagc tccgagac 158 <210> 151 <211> 137 <212> DNA <213> Homo sapiens <400> 151 ccggcgcgat tctccctcaa cggaggcagc gcgactccaa gactcagccg gcgcgattct 60 ccctcaacgc ttgcctggag catccctggc cccttttgcc caggtcgcgc ccctgagtct 120 tggagtcgcg ctgcctc 137 <210> 152 <211> 133 <212> DNA <213> Homo sapiens <400> 152 gtgcgcggcc caagagaagg gggacgtaga caagggcagg cggtgcgcgg cccaagagaa 60 ggccagcggg accacagcgc ggctacgcgg ccggccgcag tcttcaccgc gcgcctgccc 120 ttgtctacgt ccc 133 <210> 153 <211> 174 <212> DNA <213> Homo sapiens <400> 153 ggggtcgtag tggtttccga ggttcagcgc cgccacctac agcactgggg tcgtagtggt 60 ttccgaggtt ggtgaccacg tcgtcgaact tgagcacctc gtagccttca tgctgccgct 120 tgaggccggc gtagaaggcg atcttgggca ccgtgctgta ggtggcggcg ctga 174 <210> 154 <211> 140 <212> DNA <213> Homo sapiens <400> 154 gtggaggatg tggaggtgga agtggacccg gaggaagcaa aaccacgtgg aggatgtgga 60 ggtggaagtg gagcggatgg cgctccccaa gagctccgcc acgcgaggtt tcgggctcgt 120 ggttttgctt cctccgggtc 140 <210> 155 <211> 145 <212> DNA <213> Homo sapiens <400> 155 gcatctatgc gggcatggtt actgcgtgga cctggctgag gagctggcat ctatgcgggc 60 atggttactg cctctggtgc cccccgcagc cgcgcgcagg taccgtgcga catcgcgatg 120 gcccagctcc tcagccaggt ccacg 145 <210> 156 <211> 153 <212> DNA <213> Homo sapiens <400> 156 cctctgcccc ctgtccaggt aacagcctcg gtcaccgcat cacctctgcc ccctgtccag 60 gtacgcgctg tctggcgcgc cctgcgtggg ggccgcaggt tcagacaccc gggcgcggcg 120 cggggccctg atggatgcgg tgaccgaggc tgt 153 <210> 157 <211> 164 <212> DNA <213> Homo sapiens <400> 157 ctagggccga cttttccatc tcctcgagta agctcaaagc ggctgcaatc ctagggccga 60 cttttccatc tcctcctcta cctccggctc ccgggcgagg gaggccccgc gccgcccctt 120 agactggctg cggccggaag attgcagccg ctttgagctt actc 164 <210> 158 <211> 156 <212> DNA <213> Homo sapiens <400> 158 cggcgctttg cttttctaca actggcagtc agcccgaccc tcctcggcgc tttgcttttc 60 tacaactgga agccgcgaag gcggctactg cgctgagccg ctcgctctgc tggtcaagtt 120 tgggcgaccc gcgcggagga gggtcgggct gactgc 156 <210> 159 <211> 133 <212> DNA <213> Homo sapiens <400> 159 tggagaagta agtgggaggc ggtgtactta gccgcccatt tcagagcagc tggagaagta 60 agtgggaggc ggtgtcggga actgactcct cttaaaacgg tcggcgccgc tgctctgaaa 120 tgggcggcta agt 133 <210> 160 <211> 155 <212> DNA <213> Homo sapiens <400> 160 gaaaagcgat gactgccctg aactgggaag gcagcggact gacatctgga aaagcgatga 60 ctgccctgaa ctgctggggc gttcgaaatt tccagggtcc cgaccctccg tggggtacgc 120 gcgacttcgg cgcagatgtc agtccgctgc cttcc 155 <210> 161 <211> 126 <212> DNA <213> Homo sapiens <400> 161 ccagcagcca acccctacga cttcttagga ctgctggacg aggcgccgcc agcagccaac 60 ccctacgact tcaggaggct cctgcgcaaa acctcccagc gccggcgcct cgtccagcag 120 tcctaa 126 <210> 162 <211> 150 <212> DNA <213> Homo sapiens <400> 162 actgaagctg cggccctgat ctgagggctc ccaggtctct tgtttcactg aagctgcggc 60 cctgatctcc gcagaggctg cctgctgcgc tcggccctca agtgcccggg ccggccttcg 120 tgctccgaaa caagagacct gggagccctc 150 <210> 163 <211> 129 <212> DNA <213> Homo sapiens <400> 163 cgcccgcagg atcgagtgag tcaggcggtg cactacatcg gatctccgcc cgcaggatcg 60 agtgagtcac gcggccgcca gacgaggccg gtggcgcacg cacccgagat ccgatgtagt 120 gcaccgcct 129 <210> 164 <211> 156 <212> DNA <213> Homo sapiens <400> 164 tgagaagtca gacgggccgc gtaactcaga tgggagcgcg gcaggaacag tgagaagtca 60 gacgggccgc gtaaggggca gagcgagggg tccggcatca ctcgcgcgct ccggaaaccc 120 gcgtgagccg ctgttcctgc cgcgctccca tctgag 156 <210> 165 <211> 151 <212> DNA <213> Homo sapiens <400> 165 cgggctgggg ttggaagagt aacatccctg gactggcgta tccacagcgg gctggggttg 60 gaagagtaac tcgggctgcg ggctgaacgc agtcggcaac cgcggaagag cagcatctcc 120 cctgcgcctg tggatacgcc agtccaggga t 151 <210> 166 <211> 148 <212> DNA <213> Homo sapiens <400> 166 ggctccgaat cgcacctctt ctcctcctgg gagtgtgggc cggtgaggct ccgaatcgca 60 cctcttctcc tgtcctaatc tcaggctcca ggcctggctt gcagtttctg gctcaccgcg 120 ctgcggtcac cggcccacac tcccagga 148 <210> 167 <211> 130 <212> DNA <213> Homo sapiens <400> 167 agggactcct ggccttgcgt ctttctgttt cagcgcaact gtgaagtgag ggactcctgg 60 ccttgcgtct tgggagagcg cacgctggcc tgcgctacac acacacactt cacagttgcg 120 ctgaaacaga 130 <210> 168 <211> 145 <212> DNA <213> Homo sapiens <400> 168 ctcagttacg ctgactcggc tgtgcccaac cacgcagtca taaataaccc tcagttacgc 60 tgactcggct gtgcccgcag tgtcgcgctg tcgcgtagcc aggtgtcgcc gggctggcgc 120 ggttatttat gactgcgtgg ttggg 145 <210> 169 <211> 114 <212> DNA <213> Homo sapiens <400> 169 cgaggatgtg gatggcgcgg atgttcctct cgccgctctc tccactgcga ggatgtggat 60 ggcgcggatg gcgcggcctc cacctgcggg cagtggagag agcggcgaga ggaa 114 <210> 170 <211> 121 <212> DNA <213> Homo sapiens <400> 170 ctgcattgag gccgggctgt gtagttgacc cgccgccagt ctctctgcat tgaggccggg 60 ctgtgtaaac tgtagggtgc ctcgccgact cggagccgca gagactggcg gcgggtcaac 120 t 121 <210> 171 <211> 163 <212> DNA <213> Homo sapiens <400> 171 gcgacgcgtt tccctggtta cctaccccgc gctgctccgt agagcgacgc gtttccctgg 60 ttacctgcgg ggccgcgtcc cggaggagcc tgagggccaa gagggccggc gcgcggtggg 120 cgcggcctgc ggggatgccg ggctctacgg agcagcgcgg ggt 163 <210> 172 <211> 149 <212> DNA <213> Homo sapiens <400> 172 tctaacgagg gctcagctcc gactagaccc cagggaacag gcaaaaagtc taacgagggc 60 tcagctccga ctaccccagg cctccgggga ccctctccgg atgcgctccc cgctttgcgc 120 tttgcgcttt ttgcctgttc cctggggtc 149 <210> 173 <211> 164 <212> DNA <213> Homo sapiens <400> 173 gggatgggga gtagagggag gggcctaact ccgtcccgct cgctgttggg atggggagta 60 gagggagggg gccctgttgc ctcagcgccc cgaggtcgtg gagcggcagc agctgcagcc 120 ggagcagcac cagcaacagc aacagcgagc gggacggagt tagg 164 <210> 174 <211> 128 <212> DNA <213> Homo sapiens <400> 174 gcgaggtcat cctgccctac tcagcagcag cgtggctatc ttggagaggc gaggtcatcc 60 tgccctactc agcggcgcac tgccagggcg cgcccggccg caagctctcc aagatagcca 120 cgctgctg 128 <210> 175 <211> 107 <212> DNA <213> Homo sapiens <400> 175 gccttctctt tgcgccacgt tcgtgcgcga cgtggaagga gaaatgagcc ttctctttgc 60 gccacgttcg gccgcagctg aattcatttc tccttccacg tcgcgca 107 <210> 176 <211> 130 <212> DNA <213> Homo sapiens <400> 176 agagtgagag tgtccctgct gccagcgggg tctgtgtggt gagcgagaga gtgagagtgt 60 ccctgctgcc agaggactac ggcgggctgg gcgcggggtc cccgcctctc gctcaccaca 120 cagaccccgc 130 <210> 177 <211> 119 <212> DNA <213> Homo sapiens <400> 177 cccactccaa tccccaccct ctccgtcctc caagaacgtg ccaggcgccc actccaatcc 60 ccaccctctc catccttagt cattaaagaa cagcagcgcc tggcacgttc ttggaggac 119 <210> 178 <211> 149 <212> DNA <213> Homo sapiens <400> 178 aactccgagg agctagcgca gacgcttagg catgggaagg gcaagacaac tccgaggagc 60 tagcgcagac cgctctccgc cctcagctgc ggcgaggcaa gggctggcag cgctcggacg 120 cctccgtctt gcccttccca tgcctaagc 149 <210> 179 <211> 123 <212> DNA <213> Homo sapiens <400> 179 gcctaagcgc ggggaattac acgtcactcc caccgcccag ccctaatagc ctaagcgcgg 60 ggaattacac gttcccggtg tagaacagac gatcggggct attagggctg ggcggtggga 120 gtg 123 <210> 180 <211> 147 <212> DNA <213> Homo sapiens <400> 180 aaaagccaat ctccaagcct ccaaacggag gataaatatg cgcggcttgt cagtcaaaaa 60 gccaatctcc aagcctccaa acggaacgtc accctatcag ctgggagaca gcgccgcact 120 gactgacaag ccgcgcatat ttatcct 147 <210> 181 <211> 113 <212> DNA <213> Homo sapiens <400> 181 gcggccaccc accctagtcg ttgcgccgtt ttgacgtgct gccggcggcc acccacccta 60 gtcgttggag cctggcgccc gcgcctcccg gccggcagca cgtcaaaacg gcg 113 <210> 182 <211> 145 <212> DNA <213> Homo sapiens <400> 182 gctctgcctg tttgttccgc ccgcggcttg gcgggctatc tgtggctctg cctgtttgtt 60 ccgcccccgc ggaaaccgct gctcgctggg caggggcttt ctgttttgca gccggaacag 120 gaacacagat agcccgccaa gccgc 145 <210> 183 <211> 156 <212> DNA <213> Homo sapiens <400> 183 gagcttggag atgcgaggga aactcccccg gccctcctgt attactgagc ttggagatgc 60 gagggaaact gaagccccaa gggtgccccg tcctgggagc ctggctgtct gcggggtccc 120 ccgcattccg cagtagtaat acaggagggc cggggg 156 <210> 184 <211> 139 <212> DNA <213> Homo sapiens <400> 184 gcctcggcgc ccaaaatcga aaggagtcag cgctacggga aaggaaaccg cctcggcgcc 60 caaaatcgaa aggccgggag ttgttctgca ggctttgcaa acaggttgac tgagggtttc 120 ctttcccgta gcgctgact 139 <210> 185 <211> 114 <212> DNA <213> Homo sapiens <400> 185 ggagcgtgga cttcttgggc cgctgcacgg ccggagaagc gaatggagcg tggacttctt 60 gggccgtacc cctgcggctc aagctgcccc ggattcgctt ctccggccgt gcag 114 <210> 186 <211> 166 <212> DNA <213> Homo sapiens <400> 186 ttcggattct ggacttcggg ttccgcccgc cgaaaattat cttcagccat tcggattctg 60 gacttcgggt tccgctgagg acggatttcg gaataggcac agtggctgcc ccgaacccct 120 caaggcggcc tccgcgggct gtggctgaag ataattttcg gcgggc 166 <210> 187 <211> 133 <212> DNA <213> Homo sapiens <400> 187 ggtaggtacc gcctgcctgt gtgtactgag gctgcttggt tctcctgtcg gtaggtaccg 60 cctgcctgtg tgtaccgggg ctgctgtctc cggggagggg cttctggcgg acaggagaac 120 caagcagcct cag 133 <210> 188 <211> 118 <212> DNA <213> Homo sapiens <400> 188 ggagtgggtg tggtgtgagg ctggggccgc gataccctag acctcctagg agtgggtgtg 60 gtgtgaggct ggcgctggag cggtctggga atgttaggag gtctagggta tcgcggcc 118 <210> 189 <211> 119 <212> DNA <213> Homo sapiens <400> 189 ctcgcgatgt ttcagggtga gccaacacac gaacagcact cctccgcctc gcgatgtttc 60 agggtgagcc ggacgcaggc gtgcctgcgc agtgcgcgga ggagtgctgt tcgtgtgtt 119 <210> 190 <211> 111 <212> DNA <213> Homo sapiens <400> 190 ggcaccacta gctcctcgtc ctcctcggag gggcgcccga gtgcgtccga cacggccagt 60 agcgccgcgg cgagcagcag cagcgtgggt actggcccaa agctccgaga c 111 <210> 191 <211> 91 <212> DNA <213> Homo sapiens <400> 191 cccggcgcga ttctccctca acgcttgcct ggagcatccc tggccccttt tgcccaggtc 60 gcgcccctga gtcttggagt cgcgctgcct c 91 <210> 192 <211> 92 <212> DNA <213> Homo sapiens <400> 192 ggtgcgcggc ccaagagaag gccagcggga ccacagcgcg gctacgcggc cggccgcagt 60 cttcaccgcg cgcctgccct tgtctacgtc cc 92 <210> 193 <211> 130 <212> DNA <213> Homo sapiens <400> 193 gtggggtcgt agtggtttcc gaggttggtg accacgtcgt cgaacttgag cacctcgtag 60 ccttcatgct gccgcttgag gccggcgtag aaggcgatct tgggcaccgt gctgtaggtg 120 gcggcgctga 130 <210> 194 <211> 95 <212> DNA <213> Homo sapiens <400> 194 ggtggaggat gtggaggtgg aagtggagcg gatggcgctc cccaagagct ccgccacgcg 60 aggtttcggg ctcgtggttt tgcttcctcc gggtc 95 <210> 195 <211> 100 <212> DNA <213> Homo sapiens <400> 195 ggcatctatg cgggcatggt tactgcctct ggtgcccccc gcagccgcgc gcaggtaccg 60 tgcgacatcg cgatggccca gctcctcagc caggtccacg 100 <210> 196 <211> 113 <212> DNA <213> Homo sapiens <400> 196 cacctctgcc ccctgtccag gtacgcgctg tctggcgcgc cctgcgtggg ggccgcaggt 60 tcagacaccc gggcgcggcg cggggccctg atggatgcgg tgaccgaggc tgt 113 <210> 197 <211> 115 <212> DNA <213> Homo sapiens <400> 197 cctagggccg acttttccat ctcctcctct acctccggct cccgggcgag ggaggccccg 60 cgccgcccct tagactggct gcggccggaa gattgcagcc gctttgagct tactc 115 <210> 198 <211> 113 <212> DNA <213> Homo sapiens <400> 198 ccggcgcttt gcttttctac aactggaagc cgcgaaggcg gctactgcgc tgagccgctc 60 gctctgctgg tcaagtttgg gcgacccgcg cggaggaggg tcgggctgac tgc 113 <210> 199 <211> 84 <212> DNA <213> Homo sapiens <400> 199 gtggagaagt aagtgggagg cggtgtcggg aactgactcc tcttaaaacg gtcggcgccg 60 ctgctctgaa atgggcggct aagt 84 <210> 200 <211> 108 <212> DNA <213> Homo sapiens <400> 200 ggaaaagcga tgactgccct gaactgctgg ggcgttcgaa atttccaggg tcccgaccct 60 ccgtggggta cgcgcgactt cggcgcagat gtcagtccgc tgccttcc 108 <210> 201 <211> 79 <212> DNA <213> Homo sapiens <400> 201 gccagcagcc aacccctacg acttcaggag gctcctgcgc aaaacctccc agcgccggcg 60 cctcgtccag cagtcctaa 79 <210> 202 <211> 105 <212> DNA <213> Homo sapiens <400> 202 cactgaagct gcggccctga tctccgcaga ggctgcctgc tgcgctcggc cctcaagtgc 60 ccgggccggc cttcgtgctc cgaaacaaga gacctgggag ccctc 105 <210> 203 <211> 84 <212> DNA <213> Homo sapiens <400> 203 ccgcccgcag gatcgagtga gtcacgcggc cgccagacga ggccggtggc gcacgcaccc 60 gagatccgat gtagtgcacc gcct 84 <210> 204 <211> 107 <212> DNA <213> Homo sapiens <400> 204 ctgagaagtc agacgggccg cgtaaggggc agagcgaggg gtccggcatc actcgcgcgc 60 tccggaaacc cgcgtgagcc gctgttcctg ccgcgctccc atctgag 107 <210> 205 <211> 105 <212> DNA <213> Homo sapiens <400> 205 gcgggctggg gttggaagag taactcgggc tgcgggctga acgcagtcgg caaccgcgga 60 agagcagcat ctcccctgcg cctgtggata cgccagtcca gggat 105 <210> 206 <211> 103 <212> DNA <213> Homo sapiens <400> 206 aggctccgaa tcgcacctct tctcctgtcc taatctcagg ctccaggcct ggcttgcagt 60 ttctggctca ccgcgctgcg gtcaccggcc cacactccca gga 103 <210> 207 <211> 83 <212> DNA <213> Homo sapiens <400> 207 cagggactcc tggccttgcg tcttgggaga gcgcacgctg gcctgcgcta cacacacaca 60 cttcacagtt gcgctgaaac aga 83 <210> 208 <211> 97 <212> DNA <213> Homo sapiens <400> 208 cctcagttac gctgactcgg ctgtgcccgc agtgtcgcgc tgtcgcgtag ccaggtgtcg 60 ccgggctggc gcggttattt atgactgcgt ggttggg 97 <210> 209 <211> 68 <212> DNA <213> Homo sapiens <400> 209 gcgaggatgt ggatggcgcg gatggcgcgg cctccacctg cgggcagtgg agagagcggc 60 gagaggaa 68 <210> 210 <211> 78 <212> DNA <213> Homo sapiens <400> 210 gctgcattga ggccgggctg tgtaaactgt agggtgcctc gccgactcgg agccgcagag 60 actggcggcg ggtcaact 78 <210> 211 <211> 121 <212> DNA <213> Homo sapiens <400> 211 ggcgacgcgt ttccctggtt acctgcgggg ccgcgtcccg gaggagcctg agggccaaga 60 gggccggcgc gcggtgggcg cggcctgcgg ggatgccggg ctctacggag cagcgcgggg 120 t 121 <210> 212 <211> 102 <212> DNA <213> Homo sapiens <400> 212 ttctaacgag ggctcagctc cgactacccc aggcctccgg ggaccctctc cggatgcgct 60 ccccgctttg cgctttgcgc tttttgcctg ttccctgggg tc 102 <210> 213 <211> 118 <212> DNA <213> Homo sapiens <400> 213 ggggatgggg agtagaggga gggggccctg ttgcctcagc gccccgaggt cgtggagcgg 60 cagcagctgc agccggagca gcaccagcaa cagcaacagc gagcgggacg gagttagg 118 <210> 214 <211> 81 <212> DNA <213> Homo sapiens <400> 214 cgcgaggtca tcctgcccta ctcagcggcg cactgccagg gcgcgcccgg ccgcaagctc 60 tccaagatag ccacgctgct g 81 <210> 215 <211> 61 <212> DNA <213> Homo sapiens <400> 215 agccttctct ttgcgccacg ttcggccgca gctgaattca tttctccttc cacgtcgcgc 60 a 61 <210> 216 <211> 84 <212> DNA <213> Homo sapiens <400> 216 cagagtgaga gtgtccctgc tgccagagga ctacggcggg ctgggcgcgg ggtccccgcc 60 tctcgctcac cacacagacc ccgc 84 <210> 217 <211> 73 <212> DNA <213> Homo sapiens <400> 217 gcccactcca atccccaccc tctccatcct tagtcattaa agaacagcag cgcctggcac 60 gttcttggag gac 73 <210> 218 <211> 103 <212> DNA <213> Homo sapiens <400> 218 caactccgag gagctagcgc agaccgctct ccgccctcag ctgcggcgag gcaagggctg 60 gcagcgctcg gacgcctccg tcttgccctt cccatgccta agc 103 <210> 219 <211> 76 <212> DNA <213> Homo sapiens <400> 219 tgcctaagcg cggggaatta cacgttcccg gtgtagaaca gacgatcggg gctattaggg 60 ctgggcggtg ggagtg 76 <210> 220 <211> 92 <212> DNA <213> Homo sapiens <400> 220 aaaaagccaa tctccaagcc tccaaacgga acgtcaccct atcagctggg agacagcgcc 60 gcactgactg acaagccgcg catatttatc ct 92 <210> 221 <211> 70 <212> DNA <213> Homo sapiens <400> 221 cgcggccacc caccctagtc gttggagcct ggcgcccgcg cctcccggcc ggcagcacgt 60 caaaacggcg 70 <210> 222 <211> 102 <212> DNA <213> Homo sapiens <400> 222 ggctctgcct gtttgttccg cccccgcgga aaccgctgct cgctgggcag gggctttctg 60 ttttgcagcc ggaacaggaa cacagatagc ccgccaagcc gc 102 <210> 223 <211> 111 <212> DNA <213> Homo sapiens <400> 223 cgagcttgga gatgcgaggg aaactgaagc cccaagggtg ccccgtcctg ggagcctggc 60 tgtctgcggg gtcccccgca ttccgcagta gtaatacagg agggccgggg g 111 <210> 224 <211> 91 <212> DNA <213> Homo sapiens <400> 224 agcctcggcg cccaaaatcg aaaggccggg agttgttctg caggctttgc aaacaggttg 60 actgagggtt tcctttcccg tagcgctgac t 91 <210> 225 <211> 71 <212> DNA <213> Homo sapiens <400> 225 cggagcgtgg acttcttggg ccgtacccct gcggctcaag ctgccccgga ttcgcttctc 60 cggccgtgca g 71 <210> 226 <211> 118 <212> DNA <213> Homo sapiens <400> 226 tttcggattc tggacttcgg gttccgctga ggacggattt cggaataggc acagtggctg 60 ccccgaaccc ctcaaggcgg cctccgcggg ctgtggctga agataatttt cggcgggc 118 <210> 227 <211> 85 <212> DNA <213> Homo sapiens <400> 227 aggtaggtac cgcctgcctg tgtgtaccgg ggctgctgtc tccggggagg ggcttctggc 60 ggacaggaga accaagcagc ctcag 85 <210> 228 <211> 71 <212> DNA <213> Homo sapiens <400> 228 gggagtgggt gtggtgtgag gctggcgctg gagcggtctg ggaatgttag gaggtctagg 60 gtatcgcggc c 71 <210> 229 <211> 73 <212> DNA <213> Homo sapiens <400> 229 tctcgcgatg tttcagggtg agccggacgc aggcgtgcct gcgcagtgcg cggaggagtg 60 ctgttcgtgt gtt 73 <210> 230 <211> 120 <212> DNA <213> Homo sapiens <400> 230 ggcgaaaaga aggccaaaca cagcatcgac ggcatcctgg gcgacaaagg tagggaactt 60 ccctgggctg cgaggcccca gcccgggttt tcccacgctc cggtgtgcgg gccagtggtt 120 <210> 231 <211> 118 <212> DNA <213> Homo sapiens <400> 231 ggggatgggg agtagaggga gggggccctg ttgcctcagc gccccgaggt cgtggagcgg 60 cagcagctgc agccggagca gcaccagcaa cagcaacagc gagcgggacg gagttagg 118 <210> 232 <211> 69 <212> DNA <213> Homo sapiens <400> 232 gcaccagcaa cagcaacagc gagcgggacg gagttaggac cgctcggagc gcacaggtct 60 cgaggtagt 69 <210> 233 <211> 111 <212> DNA <213> Homo sapiens <400> 233 cgagcttgga gatgcgaggg aaactgaagc cccaagggtg ccccgtcctg ggagcctggc 60 tgtctgcggg gtcccccgca ttccgcagta gtaatacagg agggccgggg g 111 <210> 234 <211> 83 <212> DNA <213> Homo sapiens <400> 234 cagggactcc tggccttgcg tcttgggaga gcgcacgctg gcctgcgcta cacacacaca 60 cttcacagtt gcgctgaaac aga 83 <210> 235 <211> 81 <212> DNA <213> Homo sapiens <400> 235 gcgctcatcg tgtgcacctt cacctacctg ctggtgggcg ccgcggtctt cgacgcgctg 60 gagtcggagc ccgagctgat c 81 <210> 236 <211> 94 <212> DNA <213> Homo sapiens <400> 236 aacagcagca ccgtgatcca gagcaccccg aagactggca gaaccagccg acgagtcagg 60 cgccgcatgg tcccctttgc cgcttcctct ccgc 94 <210> 237 <211> 98 <212> DNA <213> Homo sapiens <400> 237 cgcacaatat caataattcc gcgggtcaca gcatcccgca caaggacgcc ttcttattgc 60 ataattaacg cgaggaaggc tcttcccgct actcccgc 98 <210> 238 <211> 91 <212> DNA <213> Homo sapiens <400> 238 gtggctcact ctccaatcag cgctttctag agacagcgtg gtcagcgtac ttgcttactt 60 tcaggattgc gagacgtctt taacccttgc t 91 <210> 239 <211> 97 <212> DNA <213> Homo sapiens <400> 239 gcagtgtgcg gagaccctct aggcgggcgg ggacgcccca cgcggcgacc tgagcaccga 60 cctcatgcaa cgggaccgaa ccttgggacc cgggcag 97 <210> 240 <211> 91 <212> DNA <213> Homo sapiens <400> 240 agcctcggcg cccaaaatcg aaaggccggg agttgttctg caggctttgc aaacaggttg 60 actgagggtt tcctttcccg tagcgctgac t 91 <210> 241 <211> 77 <212> DNA <213> Homo sapiens <400> 241 atcgaaaggc cgggagttgt tctgcaggct ttgcaaacag gttgactgag ggtttccttt 60 cccgtagcgc tgactgc 77 <210> 242 <211> 87 <212> DNA <213> Homo sapiens <400> 242 gcccatctgc acctgtcccc tttgctgtct tacatgtccc atagtattaa agttatttga 60 ataagcaaat gaaccccgct ctttggt 87 <210> 243 <211> 71 <212> DNA <213> Homo sapiens <400> 243 cggagcgtgg acttcttggg ccgtacccct gcggctcaag ctgccccgga ttcgcttctc 60 cggccgtgca g 71 <210> 244 <211> 113 <212> DNA <213> Homo sapiens <400> 244 ccggcgcttt gcttttctac aactggaagc cgcgaaggcg gctactgcgc tgagccgctc 60 gctctgctgg tcaagtttgg gcgacccgcg cggaggaggg tcgggctgac tgc 113 <210> 245 <211> 84 <212> DNA <213> Homo sapiens <400> 245 gtggagaagt aagtgggagg cggtgtcggg aactgactcc tcttaaaacg gtcggcgccg 60 ctgctctgaa atgggcggct aagt 84 <210> 246 <211> 85 <212> DNA <213> Homo sapiens <400> 246 tcagctatga gcagagaccg ctgaagcgcc cccggctcgg gccgcccgac gtctacccac 60 aggaccccaa gcagaaggag gtaag 85 <210> 247 <211> 91 <212> DNA <213> Homo sapiens <400> 247 cccggcgcga ttctccctca acgcttgcct ggagcatccc tggccccttt tgcccaggtc 60 gcgcccctga gtcttggagt cgcgctgcct c 91 <210> 248 <211> 115 <212> DNA <213> Homo sapiens <400> 248 gcccggcttc gccttctctc ataagggtgg ccgggggccc acgaacttgc agggtggcgg 60 ccctgcgccc tccagccccg gcggggacgg gcacgattgc tcgtagtctg gggtg 115 <210> 249 <211> 110 <212> DNA <213> Homo sapiens <400> 249 gggcactcac acacacgcag acccagagga ggagaggtgg gtataaggaa gcaagcccca 60 gccgcagcag cccgagcggg cacaaaaccg cttcctggca catcaccttg 110 <210> 250 <211> 98 <212> DNA <213> Homo sapiens <400> 250 ggcactcaca cacacgcaga cccagaggag gagaggtggg tataaggaag caagccccag 60 ccgcagcagc ccgagcgggc acaaaaccgc ttcctggc 98 <210> 251 <211> 105 <212> DNA <213> Homo sapiens <400> 251 gcgggctggg gttggaagag taactcgggc tgcgggctga acgcagtcgg caaccgcgga 60 agagcagcat ctcccctgcg cctgtggata cgccagtcca gggat 105 <210> 252 <211> 107 <212> DNA <213> Homo sapiens <400> 252 cgcatcctcg ccttcttgca gtccaaggcc cgcctgggcg cggagcccgc ctttccgccg 60 ctgggttcgc tcccggagcc ggatttctcc tatcagctgc accctgc 107 <210> 253 <211> 107 <212> DNA <213> Homo sapiens <400> 253 ctgagaagtc agacgggccg cgtaaggggc agagcgaggg gtccggcatc actcgcgcgc 60 tccggaaacc cgcgtgagcc gctgttcctg ccgcgctccc atctgag 107 <210> 254 <211> 88 <212> DNA <213> Homo sapiens <400> 254 gcgtaagggg cagagcgagg ggtccggcat cactcgcgcg ctccggaaac ccgcgtgagc 60 cgctgttcct gccgcgctcc catctgag 88 <210> 255 <211> 86 <212> DNA <213> Homo sapiens <400> 255 caatctcaga gcggagccga cagagagcag ggaaccggca tggccaaagc cgcggcgatc 60 ggcatcgacc tgggcaccac ctactc 86 <210> 256 <211> 111 <212> DNA <213> Homo sapiens <400> 256 gtgtgcaccg agcgagtgaa ggtatgtgtg gcgggcgcgg ctggagctgc cgccgccgcc 60 gccgccgcgc cagcaggtcc taatgcctgt cacttcccag gacgctggca g 111 <210> 257 <211> 85 <212> DNA <213> Homo sapiens <400> 257 ctcacgttgc acggatgaca tcactagctt ttggctgcgc gctcggtgtt ctcgtctgtg 60 ggttttagcc aaggctgcag ctacc 85 <210> 258 <211> 73 <212> DNA <213> Homo sapiens <400> 258 caggacggga ttctctgcac gctgtcgagt gagccggcat ctcggcgccc gggtgggctg 60 cgaagaaaat ggt 73 <210> 259 <211> 97 <212> DNA <213> Homo sapiens <400> 259 gcagaagacg gcgctgggaa gagctgcgtg acgctcgggg gctggcggct gggccggcag 60 cgcgccgtgg cggcgtgacc tgtccatggt gttgaag 97 <210> 260 <211> 113 <212> DNA <213> Homo sapiens <400> 260 cacctctgcc ccctgtccag gtacgcgctg tctggcgcgc cctgcgtggg ggccgcaggt 60 tcagacaccc gggcgcggcg cggggccctg atggatgcgg tgaccgaggc tgt 113 <210> 261 <211> 97 <212> DNA <213> Homo sapiens <400> 261 cctcagttac gctgactcgg ctgtgcccgc agtgtcgcgc tgtcgcgtag ccaggtgtcg 60 ccgggctggc gcggttattt atgactgcgt ggttggg 97 <210> 262 <211> 92 <212> DNA <213> Homo sapiens <400> 262 ggtgcgcggc ccaagagaag gccagcggga ccacagcgcg gctacgcggc cggccgcagt 60 cttcaccgcg cgcctgccct tgtctacgtc cc 92 <210> 263 <211> 98 <212> DNA <213> Homo sapiens <400> 263 gcggatgcac gacctgaacg acgcgctgga cgagctgcgc gcggtgatcc cctacgcgca 60 cagcccctcg gtgcgaaagc tctccaagat cgccacgc 98 <210> 264 <211> 95 <212> DNA <213> Homo sapiens <400> 264 ggcagccggc tacccgttca gcgccggact gcccccggct gcctcctgcc cggagaagtg 60 cgccctgttt aacagcgtct cctccagcct ctgca 95 <210> 265 <211> 115 <212> DNA <213> Homo sapiens <400> 265 cacgtcggag ctcgcctgga tccgggcgtt ggcagccgaa gggccctggc cccgggactc 60 tccgccgcta gcccccgtca tatcttctcc gctttcgctt ctccactcta gccgg 115 <210> 266 <211> 91 <212> DNA <213> Homo sapiens <400> 266 ttgtttttct ggaaaagtcg ctgcaatgga cacagcgttg cgcggtttcc ctgcgcgcct 60 ggggcgcttt ttgtcttcgc cctccgtgga t 91 <210> 267 <211> 100 <212> DNA <213> Homo sapiens <400> 267 ggcatctatg cgggcatggt tactgcctct ggtgcccccc gcagccgcgc gcaggtaccg 60 tgcgacatcg cgatggccca gctcctcagc caggtccacg 100 <210> 268 <211> 61 <212> DNA <213> Homo sapiens <400> 268 agccttctct ttgcgccacg ttcggccgca gctgaattca tttctccttc cacgtcgcgc 60 a 61 <210> 269 <211> 130 <212> DNA <213> Homo sapiens <400> 269 gtggggtcgt agtggtttcc gaggttggtg accacgtcgt cgaacttgag cacctcgtag 60 ccttcatgct gccgcttgag gccggcgtag aaggcgatct tgggcaccgt gctgtaggtg 120 gcggcgctga 130 <210> 270 <211> 68 <212> DNA <213> Homo sapiens <400> 270 gcgaggatgt ggatggcgcg gatggcgcgg cctccacctg cgggcagtgg agagagcggc 60 gagaggaa 68 <210> 271 <211> 79 <212> DNA <213> Homo sapiens <400> 271 gccagcagcc aacccctacg acttcaggag gctcctgcgc aaaacctccc agcgccggcg 60 cctcgtccag cagtcctaa 79 <210> 272 <211> 105 <212> DNA <213> Homo sapiens <400> 272 cactgaagct gcggccctga tctccgcaga ggctgcctgc tgcgctcggc cctcaagtgc 60 ccgggccggc cttcgtgctc cgaaacaaga gacctgggag ccctc 105 <210> 273 <211> 108 <212> DNA <213> Homo sapiens <400> 273 ggaaaagcga tgactgccct gaactgctgg ggcgttcgaa atttccaggg tcccgaccct 60 ccgtggggta cgcgcgactt cggcgcagat gtcagtccgc tgccttcc 108 <210> 274 <211> 108 <212> DNA <213> Homo sapiens <400> 274 cagcggcgac tggttctgac ttgccaagta cctggcacga gaaggacgtc gtgtgggtcg 60 tccttaccct gaatttaatg aagtcagggg ctgaaaacgg cggtgtaa 108 <210> 275 <211> 140 <212> DNA <213> Homo sapiens <400> 275 ggtgtgaccg ttgttgcacc ccagtcgaca tgacgttagt ttttcatttg ccaaattgct 60 ggttagttgc aaagcctacc ctcggccgcg agcactgaag gatgggaggg tcgagcgccg 120 cgttttgaca ggaggaagtg 140 <210> 276 <211> 114 <212> DNA <213> Homo sapiens <400> 276 tgtgcgcgcg tgtgtcttta cacgcgccgc gtgcccagtg ttgcacgggg cgggagaaga 60 atggcaggta gccgcccgaa acacctcgcc ctgtctcctt tctttgggcg aggt 114 <210> 277 <211> 114 <212> DNA <213> Homo sapiens <400> 277 agctgggagg aagacagtag tgatgctgcc gcgggtggcg ggggttgcgc cgccgcccag 60 agaacctcgg cagtgtgcag ggaggtgcat ttcattttgg ctatttccat cccg 114 <210> 278 <211> 116 <212> DNA <213> Homo sapiens <400> 278 ctcatcgtct tggggttaag agttgccgcc cggccagggc aacagccagg gcaaagggag 60 agagaagccg ccccggggcg agaaggagaa aagttagagg gctgaacagg tgacgc 116 <210> 279 <211> 84 <212> DNA <213> Homo sapiens <400> 279 cagagtgaga gtgtccctgc tgccagagga ctacggcggg ctgggcgcgg ggtccccgcc 60 tctcgctcac cacacagacc ccgc 84 <210> 280 <211> 73 <212> DNA <213> Homo sapiens <400> 280 gcccactcca atccccaccc tctccatcct tagtcattaa agaacagcag cgcctggcac 60 gttcttggag gac 73 <210> 281 <211> 115 <212> DNA <213> Homo sapiens <400> 281 cctagggccg acttttccat ctcctcctct acctccggct cccgggcgag ggaggccccg 60 cgccgcccct tagactggct gcggccggaa gattgcagcc gctttgagct tactc 115 <210> 282 <211> 71 <212> DNA <213> Homo sapiens <400> 282 cctcggatcc caagcatatc tggcgatgga gcggcggcag cccgaggcac gtgttgtgtg 60 tgctccgatt g 71 <210> 283 <211> 98 <212> DNA <213> Homo sapiens <400> 283 cgcgtgcgaa gtctcctcta gcggagcggg accggccgcg gcggtggatc gtggcggtcc 60 ctgcacttct gctccagccg cgcctggaaa cctgagcc 98 <210> 284 <211> 96 <212> DNA <213> Homo sapiens <400> 284 cgcgtgcgaa gtctcctcta gcggagcggg accggccgcg gcggtggatc gtggcggtcc 60 ctgcacttct gctccagccg cgcctggaaa cctgag 96 <210> 285 <211> 88 <212> DNA <213> Homo sapiens <400> 285 ggctctgatt ggcctgcatc ttgcggcgcg ggcggccgca gcccggcgcg agggagggag 60 cgcggaacaa ggcgctgact gtctccca 88 <210> 286 <211> 124 <212> DNA <213> Homo sapiens <400> 286 tgcagggacg tacagggcgg tgatccagta tctaaattct ttgggagaaa atgaatagtt 60 cccccgcccc cgccctccag gaaaaaaaaa aatctgagaa tctgagaatg ttcagcgcac 120 ccgc 124 <210> 287 <211> 92 <212> DNA <213> Homo sapiens <400> 287 aaaaagccaa tctccaagcc tccaaacgga acgtcaccct atcagctggg agacagcgcc 60 gcactgactg acaagccgcg catatttatc ct 92 <210> 288 <211> 70 <212> DNA <213> Homo sapiens <400> 288 cgcggccacc caccctagtc gttggagcct ggcgcccgcg cctcccggcc ggcagcacgt 60 caaaacggcg 70 <210> 289 <211> 102 <212> DNA <213> Homo sapiens <400> 289 ttctaacgag ggctcagctc cgactacccc aggcctccgg ggaccctctc cggatgcgct 60 ccccgctttg cgctttgcgc tttttgcctg ttccctgggg tc 102 <210> 290 <211> 84 <212> DNA <213> Homo sapiens <400> 290 ccgcccgcag gatcgagtga gtcacgcggc cgccagacga ggccggtggc gcacgcaccc 60 gagatccgat gtagtgcacc gcct 84 <210> 291 <211> 129 <212> DNA <213> Homo sapiens <400> 291 cgctcgttgc gacccaggct cagctccgcg gtgcgcaggg cctggcgcct tcgcggctgc 60 ccgcccgggc tcagctcctc cacagccacg cggcaccgca gctccgagtc ctcatattcc 120 cctgccgcc 129 <210> 292 <211> 103 <212> DNA <213> Homo sapiens <400> 292 caactccgag gagctagcgc agaccgctct ccgccctcag ctgcggcgag gcaagggctg 60 gcagcgctcg gacgcctccg tcttgccctt cccatgccta agc 103 <210> 293 <211> 76 <212> DNA <213> Homo sapiens <400> 293 tgcctaagcg cggggaatta cacgttcccg gtgtagaaca gacgatcggg gctattaggg 60 ctgggcggtg ggagtg 76 <210> 294 <211> 72 <212> DNA <213> Homo sapiens <400> 294 ctggcttcag tacataacgc gagttacagt tcaacagaac cagatgtgaa aacgtcagcc 60 acccagttca gg 72 <210> 295 <211> 113 <212> DNA <213> Homo sapiens <400> 295 tattaagaac cgcaagccca ctgtgtgcca gccgccgttg gtagttttac acgtgcgatc 60 ttatttaata cttcctggga cctaatgagt caggtgccat catgatccgt tta 113 <210> 296 <211> 103 <212> DNA <213> Homo sapiens <400> 296 aggctccgaa tcgcacctct tctcctgtcc taatctcagg ctccaggcct ggcttgcagt 60 ttctggctca ccgcgctgcg gtcaccggcc cacactccca gga 103 <210> 297 <211> 102 <212> DNA <213> Homo sapiens <400> 297 ggctctgcct gtttgttccg cccccgcgga aaccgctgct cgctgggcag gggctttctg 60 ttttgcagcc ggaacaggaa cacagatagc ccgccaagcc gc 102 <210> 298 <211> 113 <212> DNA <213> Homo sapiens <400> 298 gaaaaacaga gaggcgaggc cagactgccc ccacacctcc tgtagccact gagcgcgaag 60 tgcgttggtt ccgagcgcgc tggtgggatc cacaaagctc gcattctctc agg 113 <210> 299 <211> 110 <212> DNA <213> Homo sapiens <400> 299 cgagttctgg gcctctggag gtttccctgt cagcctcccc ggccgccgag ggggcgcgcg 60 cccaacaagg gggtctctag cggccacctg gggacagaaa cagtgaccct 110 <210> 300 <211> 95 <212> DNA <213> Homo sapiens <400> 300 ggtggaggat gtggaggtgg aagtggagcg gatggcgctc cccaagagct ccgccacgcg 60 aggtttcggg ctcgtggttt tgcttcctcc gggtc 95 <210> 301 <211> 76 <212> DNA <213> Homo sapiens <400> 301 tggcctccaa ctttaacgac atagtcaagc agggctacgt gaaaatccgc agcaggaagc 60 ttggggtgag tggctc 76 <210> 302 <211> 121 <212> DNA <213> Homo sapiens <400> 302 ggcgacgcgt ttccctggtt acctgcgggg ccgcgtcccg gaggagcctg agggccaaga 60 gggccggcgc gcggtgggcg cggcctgcgg ggatgccggg ctctacggag cagcgcgggg 120 t 121 <210> 303 <211> 118 <212> DNA <213> Homo sapiens <400> 303 tttcggattc tggacttcgg gttccgctga ggacggattt cggaataggc acagtggctg 60 ccccgaaccc ctcaaggcgg cctccgcggg ctgtggctga agataatttt cggcgggc 118 <210> 304 <211> 96 <212> DNA <213> Homo sapiens <400> 304 ttgtgatatt tggttgcgcg ggattatgat gaaatgtgtg atatgtgtgt gattatgatt 60 aaggctgtag cgagtgtgaa cgtggcgaag tgtgcg 96 <210> 305 <211> 71 <212> DNA <213> Homo sapiens <400> 305 gggagtgggt gtggtgtgag gctggcgctg gagcggtctg ggaatgttag gaggtctagg 60 gtatcgcggc c 71 <210> 306 <211> 85 <212> DNA <213> Homo sapiens <400> 306 aggtaggtac cgcctgcctg tgtgtaccgg ggctgctgtc tccggggagg ggcttctggc 60 ggacaggaga accaagcagc ctcag 85 <210> 307 <211> 79 <212> DNA <213> Homo sapiens <400> 307 accctggggt gtagctctgt gtcccactgt gtgatgacgt gtgcgtgctt ctgtgcgtgt 60 gtgtgtgttt gtgcgcgtg 79 <210> 308 <211> 73 <212> DNA <213> Homo sapiens <400> 308 tctcgcgatg tttcagggtg agccggacgc aggcgtgcct gcgcagtgcg cggaggagtg 60 ctgttcgtgt gtt 73 <210> 309 <211> 86 <212> DNA <213> Homo sapiens <400> 309 gggcacaggt ggggtccgtc aggccgcccg gggctcctct gtcccagctc tgcggcccag 60 ggggtgacgt gatggcggca gcggtg 86 <210> 310 <211> 104 <212> DNA <213> Homo sapiens <400> 310 accggtctcc tcgtatccat cctcgcagtc cccaccccaa actaatgttc tcccctgagc 60 aaatttcgag acacttaaaa tcccagctaa gatcacgtcc ttct 104 <210> 311 <211> 109 <212> DNA <213> Homo sapiens <400> 311 aggcaggaga ggggaggaag agaacctgtg cccctggaag ctagaggaga gcctcgctct 60 ctctgctgct ctgggttccg caacgaattg agttcgggtt caggcggct 109 <210> 312 <211> 65 <212> DNA <213> Homo sapiens <400> 312 ggctcttttg catgcaggcc cgcctgaatg gggcgcctgg aggctgcatt gaggccgggc 60 tgtgt 65 <210> 313 <211> 78 <212> DNA <213> Homo sapiens <400> 313 gctgcattga ggccgggctg tgtaaactgt agggtgcctc gccgactcgg agccgcagag 60 actggcggcg ggtcaact 78 <210> 314 <211> 101 <212> DNA <213> Homo sapiens <400> 314 cttcccaggt caccattgct cctctgccct ctccacatcc gccctcccgt gagcgcagga 60 tgcacgcaca ggcagcggtt acaaaactca gcgcaacgtt g 101 <210> 315 <211> 111 <212> DNA <213> Homo sapiens <400> 315 ggcaccacta gctcctcgtc ctcctcggag gggcgcccga gtgcgtccga cacggccagt 60 agcgccgcgg cgagcagcag cagcgtgggt actggcccaa agctccgaga c 111 <210> 316 <211> 108 <212> DNA <213> Homo sapiens <400> 316 atctctttac cctggagcca gaaccagcgt cgccgccgtc ccctgcagct cagccggcaa 60 cgcgcgccga gcctcggggc gcagcttgga gacgcgcttg ctcgttct 108 <210> 317 <211> 81 <212> DNA <213> Homo sapiens <400> 317 cgcgaggtca tcctgcccta ctcagcggcg cactgccagg gcgcgcccgg ccgcaagctc 60 tccaagatag ccacgctgct g 81

Claims

다음을 포함하는 대상체에서 대장암 및/또는 진행성 선종을 스크리닝하는 시험관내(in vitro) 방법:
- 대상체의 DNA 샘플에서, DMR 세트 내 모든 DMR 좌위의 메틸화 상태를 결정하는 단계로, 상기 DMR 세트는 표 2, 3 또는 4의 좌위를 포함하는, 단계,
- 수득한 데이터를 건강한 개체로부터 수득한 기준값과 비교하는 단계,
- 기준 샘플과 비교하여 하나 이상의 좌위에서 과메틸화가 검출되는 경우 대상체에서 대장암 및/또는 진행성 선종을 진단하는 단계.
제1항에 있어서,
메틸화 상태가 메틸화 특이적 제한 효소 정량적 중합효소 연쇄 반응(methylation specific restriction enzyme quantitative polymerase chain reaction, MSRE-qPCR)에 의해 결정되는 것인 방법.
제1항 또는 제2항에 있어서,
DMR 좌위가 표 5에 제공된 올리고뉴클레오티드 프라이머쌍에 의해 증폭되는 것인 방법.
제1항 내지 제3항 중 어느 한 항에 있어서,
DNA가 인간 대상체의 혈액, 혈장 또는 대변으로부터 단리되는 것인 방법.
제1항 내지 제4항 중 어느 한 항에 있어서,
DNA가 인간 대상체의 무세포 DNA인 방법.
제1항 내지 제5항 중 어느 한 항에 있어서,
대상체가 스크리닝 시점 대장암에 대해 무증상이었던 것인 방법.
제1항 내지 제6항 중 어느 한 항에 있어서,
대상체가 이전에 대장암에 대해 스크리닝된 것인 방법.
제7항에 있어서,
대상체가 지난 10년 이내, 지난 5년 이내, 지난 4년 이내, 지난 3년 이내, 지난 2년 이내, 또는 지난 1년 이내에 대장암에 대해 스크리닝된 것인 방법.
제7항 또는 제8항에 있어서,
대상체의 대장암에 대한 이전 스크리닝이 대상체를 대장암이 없는 것으로 진단한 것인 방법.
제9항에 있어서,
대상체를 대장암이 없는 것으로 진단한 대장암에 대한 이전 스크리닝이 1년 이내인 방법.
제9항 또는 제10항에 있어서,
대상체를 대장암이 없는 것으로 진단한 대장암에 대한 이전 스크리닝은 대장내시경 검사인 방법.
제1항 내지 제11항 중 어느 한 항에 있어서,
상기 방법은 초기 대장암의 진단을 포함하고, 임의로 대장암이 병기 0, 병기 I, 병기 IIA, 병기 IIB 또는 병기 IIC 대장암인 방법.
제1항 내지 제12항 중 어느 한 항에 있어서,
상기 방법은 암이 전이되지 않은 초기 대장암의 진단을 포함하는 것인 방법.
제1항에 있어서,
메틸화 상태는 메틸화 민감성 제한 효소 정량적 중합효소 연쇄 반응(Methylation sensitive restriction enzyme quantitative polymerase chain reaction, MSRE-qPCR), 메틸화-특이적 PCR, 메틸화 특이적 뉴클레아제-보조 소수-대립유전자 농축 PCR 및 차세대 시퀀싱으로 이루어진 군에서 선택되는 하나 이상의 방법을 사용하여 결정하는 것인 방법.
다음을 포함하는 키트이고:
(a) 표 2, 3 또는 4에 정의된 바와 같은 하나의 DMR 세트에서 각각의 DMR 좌위의 메틸화 상태의 검출을 위한 프라이머쌍, 여기서 프라이머쌍은 표 5의 것이고,
상기 키트는 선택적으로 추가로 다음을 포함하는, 키트:
(b) 적어도 하나의 메틸화 특이적 제한 효소 및/또는 중아황산염(bisulfite) 시약
(c) 중합효소.
제1항 내지 제14항 중 어느 한 항에 있어서,
진단이 발암성 돌연변이의 존재 또는 부재를 결정하는 것을 추가로 포함하는 방법.
제16항에 있어서,
Kras, NRAS, PIK3CA, PTEN, TP53, BRAF 및 APC 유전자로 이루어진 유전자의 군에서 선택된 유전자에 발암성 돌연변이가 있는 것인 방법.