KR20210018189A

KR20210018189A - 암의 비침습적 검출 및 이의 용도를 위한 dna 메틸화 마커

Info

Publication number: KR20210018189A
Application number: KR1020207028042A
Authority: KR
Inventors: 데이비드 체이슈빌리; 후이 리; 츠 파 웡
Original assignee: 에이치케이쥐 에피테라퓨틱스 리미티드
Priority date: 2018-07-09
Filing date: 2019-07-09
Publication date: 2021-02-17
Also published as: AU2019301959B2; AU2023241365A1; US20210171617A1; IL279170A; JP2024001068A; SG11202004888PA; EP3821039A2; WO2020012367A2; WO2020012367A3; EP3821039A4; BR112020013857A2; CA3087429A1; JP2021532735A; KR20240023700A; CN112236534A; AU2019301959A1

Abstract

환자로부터 유래 된 생물학적 물질에서 DNA의 암을 검출하기 위해 인간 게놈 (CG IDs)에서 소수(2-10)의 정교한 DNA 메틸화 위치 조합을 찾는 "이진 범주 분화 (BCD)"방법 혈장, 타액, 소변, 대변, 조직 생검, 조직 면봉 및 조직 도말 (예 : 펍 도말)과 같이 다른 조직 세포가없는 DNA 및 혈액 세포 DNA와 구별된다. 종양 DNA의 기원 조직을 검출하는 또 다른 방법은 인간 게놈 (CG IDs)에서 소수의 고유 한 DNA 메틸화 위치 조합을 사용한다. 높은 특이성과 감도로 검출하기 위해 간세포 암종 (HCC), b. 폐암, c. 전립선 암, d. 유방암, e. 대장 암, f. 췌장암, g. 뇌암 (교 모세포종), h. 위암 i. 난소 암, j. 자궁 경부암 k. 두경부 편평 세포 암종 (HNSC), l. 식도암 m. 방광암, n. 신장 암, o. 고환암, p. 일반적인 고형 종양, q. 혈액 암, r. 급성 골수성 백혈병 (AML), s. 특정 CG IDs 조합의 DNA 메틸화를 측정하고 본원에 개시된 "메틸화 점수"를 유도함으로써 흑색종 종양 DNA로부터 유래된 CG IDs의 다양한 신규 조합이 개시된다. 소량의 혈장에서 멀티 플렉스 차세대 시퀀싱 메틸화 분석, 파이로 시퀀싱 분석 및 메틸화 특정 PCR을 사용하여 CG IDs를 사용하여 암을 예측하기 위한 키트이다. 혈장, 소변, 대변, 조직 생검 또는 조직 면봉을 사용하는 다양한 방법은 암에 대한 다른 임상적 증거가없는 사람의 암을 예측하는 데 도움이 된다.

Description

암의 비침습적 검출 및 이의 용도를 위한 DNA 메틸화 마커

본 발명은 인간 DNA, 특히 분자 진단분야에서의 DNA 메틸화 서명에 관한 것이다.

암은 인간들의 주요 킬러가 되었다. 암을 조기에 발견하면 치료 속도를 크게 개선하고 환자 가족과 건강 관리 시스템에 대한 끔찍한 개인적인 및 재정적인 비용을 줄일 수 있다. 예를 들어, 간세포 암종(HCC)은 세계에서 다섯 번째로 가장 흔한 암이다(El-Serag, 2011). 특히 아시아에서 유행하며, B 형 간염이 널리 퍼져있는 지역에서 발생률이 높기 때문에 인과 관계가 있을 수 있다(Flores & Marrero, 2014). 만성 간염 환자와 같은 고위험군의 후속 조치와 만성 간염에서 HCC 로의 전이의 조기 진단은 치료 속도를 향상시킨다. 간세포 암종의 생존율은 거의 항상 후기 단계에서 진단되기 때문에 현재 매우 낮다. 간암은 조기 진단시 >80% 의 치료율로서 효과적으로 치료할 수 있다. 이러한 과제는 HCC에만 국한되지 않고 다른 암들에도 공통적이다. 예를 들어, 유방암 및 결장 직장암의 조기 발견은 질병율, 사망률, 공중 보건 시스템 및 보험 회사에 대한 비용을 크게 감소시킬 수 있다. 더욱이, 췌장암과 같은 특정 암들은 거의 늦게 감지되어 사실상 특정 사망률을 야기한다. 영상화의 발전으로 암의 조기 발견이 개선되었지만, MRI와 같은 고해상도 영상은 비싸고 숙련된 인력이 필요하며 여러 지역에서 이용할 수 없다. 아직은 아직 광범위한 인구를 선별하는 방법으로 발전하지 않았다. 암으로 인한 질병율과 사망률을 낮추는 데 영향을 미치기 위해서는 인구의 일반적인 검진을 위해 넓은 지역에서 사용될 수 있는 비침습적이고 강력하지만 그럼에도 불구하고 저렴한 방법을 개발해야 한다. 주요 과제는 고형 종양이 내부 장기에 숨어 임상 증상이 나타나기 오래 전에 진화한다는 것이다. 그러나 비침습적으로 종양 물질을 얻는 것이 가능하다.

종양 DNA가 시스템으로 유출되어 혈장(Warton & Samimi, 2015) 및 소변 및 타액과 같은 기타 분비된 체액 및 대변에서 발견될 수 있다는 사실은 현재 널리 알려져 있다. 종양 DNA의 분자 특성을 측정함으로써 체액에서 발견된 DNA가 종양에서 유래한 것으로 판단할 수 있다(Zhai et al., 2012). 비록 종양 세포가 종양 DNA를 정상 세포 DNA와 구별할 수 있는 돌연변이로 성장하지만, 가능한 돌연변이의 수는 방대하고 모든 종양에서 공통적인 돌연변이가 발생하지는 않는다(Dominguez-Vigil, Moreno-Martinez, Wang, Roehrl, & Barrera-Saldana, 2018).

게놈 기능의 후성 유전적 조절의 주요 메커니즘인 DNA의 공유 변형인 DNA 메틸화는 종양에서 편재적으로 변경된다(Aguirre-Ghiso, 2007; Baylin et al., 2001; Ehrlich, 2002; Issa et al., 1993). 종양의 DNA 메틸화 프로파일은 화학 요법에 대한 반응의 종양 분류, 예후 및 예측을 위한 강력한 도구일 수 있다(Stefansson et al., 2014). 조기 진단에서 종양 DNA 메틸화를 사용하는 주요 단점은 침습적 절차와 의심되는 종양의 해부학적 시각화가 필요하다는 것이다. 순환하는 종양 세포는 비 침습성 종양 DNA 공급원이며 종양 억제 유전자에서 DNA 메틸화를 측정하는 데 사용된다(Radpour et al., 2011). HCC DNA의 저 메틸화는 환자의 혈액에서 검출될 수 있고(Ramzy, Omran, Hamad, Shaker, & Abboud, 2011), 최근 HCC 환자의 혈장에서 저 메틸화 DNA를 검출하기 위해 게놈 와이드 비설파이트 시퀀싱(genome wide bisulfite sequencing)이 적용되었다(Chan et al., 2013). 그러나, 이 공급원은 특히 암의 초기 단계에서 제한되며 DNA 메틸화 프로파일은 숙주 DNA 메틸화 프로파일에 의해 혼동된다. 게놈 와이드 비설파이트 시퀀싱(genome wide bisulfite sequencing)은 비교적 비용이 많이 드는 절차이며 스크리닝 도구로는 불가능한 상당한 생체 정보 분석이 필요하다. 따라서, 종양 DNA를 비종양 DNA로부터 강력하게 구별할 수 있고 광범위하며 다양한 지리적 영역에서 광범위한 집단의 스크리닝을 가능하게 하는 고 처리량 저비용 분석을 개발할 수 있는 적은 수의 CG를 기술하는 것이 요구된다. 보다 최근에는 몇몇 그룹이 암과 정상 DNA 및 혈액 DNA의 게놈 전체 DNA 메틸화 맵의 비교 분석을 수행했다(Zhai et al., 2012). 그러나, 이들 접근법의 주요 도전은, 종래에 예상되지 않은 상이한 수준의 혈액에서 발견되는 다른 조직으로부터의 세포 유리 DNA(cell free DNA)를 고려하지 않았다는 것이다. 암 조직과 유사한 메틸화 프로파일을 가진 다른 조직에서 DNA를 오염시키면 위양성이 나타날 수 있다. 또한, 과거의 접근법은 정상 및 암 조직에서 DNA 메틸화를 정량적으로 비교하였다. 이 정량적 차이는 종양 DNA가 변형되지 않은 다른 조직과는 다르고 알려지지 않은 양의 DNA와 혼합될 때 희석되어 잘못된 음성을 유발할 수 있다. 현재의 방법에서의 이러한 결함은 본 발명의 주제에 개시된 다른 접근법을 필요로 한다.

암 탐지를 위한 시스템 및 방법의 사용에 관한 추가적인 간행물은 다음과 같다: Grigg G, Clark S. Sequencing 5-methylcytosine residues in genomic DNA. Bioessays. 1994 June; 16(6):431-6, 431; Zeschnigk M, Schmitz B, Dittrich B, Buiting K, Horsthemke B, Doerfler W. 인간 게놈에 새겨진 세그먼트 : 게놈 시퀀싱 방법에 의해 결정된 Prader-Willi/Angelman 증후군 영역에서 상이한 DNA 메틸화 패턴. 험 몰 유전자(Hum Mol Genet) 1997 March; 6(3):387-95; Feil R, Charlton J, Bird A P, Walter J, Reik W. 개별 염색체에 대한 메틸화 분석 : 비설파이트 게놈 시퀀싱을 위한 개선된 프로토콜. 핵산(Nucleic Acids Res) 1994 February 25;22(4):695-6; Martin V, Ribieras S, Song-Wang X, Rio M C, Dante R. 게놈 시퀀싱은 pS2 유전자의 5 '영역에서 DNA 저 메틸화와 인간 유방암 세포주에서의 발현 사이의 상관관계를 나타낸다. 유전자 1995 May 19;157(1-2):261-4; WO 97 46705, WO 95 15373 및 WO 45560.

Aguirre-Ghiso, J. A. (2007). Models, mechanisms and clinical evidence for cancer dormancy. Nat Rev Cancer, 7(11), 834-846. doi:10.1038/nrc2256

Baylin, S. B., Esteller, M., Rountree, M. R., Bachman, K. E., Schuebel, K., & Herman, J. G. (2001). Aberrant patterns of DNA methylation, chromatin formation and gene expression in cancer. Hum Mol Genet, 10(7), 687-692.

Breitbach, S., Tug, S., Helmig, S., Zahn, D., Kubiak, T., Michal, M., . . . Simon, P. (2014). Direct quantification of cell-free, circulating DNA from unpurified plasma. PLoS One, 9(3), e87838. doi:10.1371/journal.pone.0087838

Chan, K. C., Jiang, P., Chan, C. W., Sun, K., Wong, J., Hui, E. P., . . . Lo, Y. M. (2013). Noninvasive detection of cancer-associated genome-wide hypomethylation and copy number aberrations by plasma DNA bisulfite sequencing. Proc Natl Acad Sci U S A, 110(47), 18761-18768. doi:10.1073/pnas.1313995110

Dominguez-Vigil, I. G., Moreno-Martinez, A. K., Wang, J. Y., Roehrl, M. H. A., & Barrera-Saldana, H. A. (2018). The dawn of the liquid biopsy in the fight against cancer. Oncotarget , 9(2), 2912-2922. doi:10.18632/oncotarget.23131

Ehrlich, M. (2002). DNA methylation in cancer: too much, but also too little. Oncogene, 21(35), 5400-5413.

El-Serag, H. B. (2011). Hepatocellular carcinoma. N Engl J Med , 365(12), 1118-1127. doi:10.1056/NEJMra1001683

Flores, A., & Marrero, J. A. (2014). Emerging trends in hepatocellular carcinoma: focus on diagnosis and therapeutics. Clin Med Insights Oncol , 8, 71-76. doi:10.4137/CMO.S9926

Issa, J. P., Vertino, P. M., Wu, J., Sazawal, S., Celano, P., Nelkin, B. D., . . . Baylin, S. B. (1993). Increased cytosine DNA-methyltransferase activity during colon cancer progression. J Natl Cancer Inst , 85(15), 1235-1240.

Luczak, M. W., & Jagodzinski, P. P. (2006). The role of DNA methylation in cancer development. Folia Histochem Cytobiol , 44(3), 143-154.

Radpour, R., Barekati, Z., Kohler, C., Lv, Q., Burki, N., Diesch, C., . . . Zhong, X. Y. (2011). Hypermethylation of tumor suppressor genes involved in critical regulatory pathways for developing a blood-based test in breast cancer. PLoS One, 6(1), e16080. doi:10.1371/journal.pone.0016080

Ramzy, II, Omran, D. A., Hamad, O., Shaker, O., & Abboud, A. (2011). Evaluation of serum LINE-1 hypomethylation as a prognostic marker for hepatocellular carcinoma. Arab J Gastroenterol , 12(3), 139-142. doi:10.1016/j.ajg.2011.07.002

Stefansson, O. A., Moran, S., Gomez, A., Sayols, S., Arribas-Jorba, C., Sandoval, J., . . . Esteller, M. (2014). A DNA methylation-based definition of biologically distinct breast cancer subtypes. Mol Oncol. doi:10.1016/j.molonc.2014.10.012

Tan, C. H., Low, S. C., & Thng, C. H. (2011). APASL and AASLD Consensus Guidelines on Imaging Diagnosis of Hepatocellular Carcinoma: A Review. Int J Hepatol, 2011, 519783. doi:10.4061/2011/519783

Valente, S., Liu, Y., Schnekenburger, M., Zwergel, C., Cosconati, S., Gros, C., . . . Mai, A. (2014). Selective non-nucleoside inhibitors of human DNA methyltransferases active in cancer including in cancer stem cells. J Med Chem, 57(3), 701-713. doi:10.1021/jm4012627

Warton, K., & Samimi, G. (2015). Methylation of cell-free circulating DNA in the diagnosis of cancer. Front Mol Biosci , 2, 13. doi:10.3389/fmolb.2015.00013

Xu, R. H., Wei, W., Krawczyk, M., Wang, W., Luo, H., Flagg, K., . . . Zhang, K. (2017). Circulating tumour DNA methylation markers for diagnosis and prognosis of hepatocellular carcinoma. Nat Mater, 16(11), 1155-1161. doi:10.1038/nmat4997

Zhai, R., Zhao, Y., Su, L., Cassidy, L., Liu, G., & Christiani, D. C. (2012). Genome-wide DNA methylation profiling of cell-free serum DNA in esophageal adenocarcinoma and Barrett esophagus. Neoplasia, 14(1), 29-33.

청구항들의 실시예는 암이 임의의 정상 조직 및 혈액 세포 DNA 메틸화 프로파일과 상이한 "범주적으로" 별개의 DNA 메틸화 시그니처 세트와 관련됨을 보여준다. 이들 부위는 암과 다른 조직 사이에 이원 분화를 일으켜 암에서 메틸화되고 다른 암에서 완전히 메틸화되지 않는다. 따라서, 깊은 차세대 시퀀싱을 사용하여 메틸화의 정상 세포 DNA 프로파일의 배경에서 소수의 암 세포 분자도 검출할 수 있다. 본 발명의 실시예는 다른 조직으로부터의 높은 세포 유리 DNA 배경에서도 세포 유리 종양 DNA의 검출을 가능하게 하고, 따라서 체액으로부터 추출된 세포 유리(CF) DNA, 예를 들어 타액, 혈장, 소변, 대변 등을 사용하여 암의 조기 검출에 특히 적합하다. 실시예는 또한 번식 및 바늘 생검 뿐만 아니라 펍 번짐(pup smears )과 같은 조직 도말에서 암의 조기 검출을 허용한다. 종래 기술에서의 이전의 분석은 동일한 조직 및 혈액으로부터의 정상 및 암 세포 및 그들의 DNA 메틸화 수준이 정량적으로 상이한 유도된 부위만을 비교하였다(Xu et al., 2017). 그러나, 이러한 종래기술 분석에 의해 발견된 부위는 다른 조직 CF DNA와 혼합될 때 CF 종양 DNA를 검출할 수 없다(Sun Yat Sen University Cancer hospital의 HCC에 대한 ctDNA 마커에 대해서는 도 2 참조). 본발명의 청구된 주제의 일 실시예는 모든 조직에서 메틸화되지 않지만 특정 암에서 메틸화되는 독특한 부위 세트를 나타낸다. 또 다른 실시예는 차세대 시퀀싱, MeDIP 어레이, MeDIP시퀀싱, 및 이와 같은 것에 의해 유도된 게놈 와이드 DNA 메틸화 데이터의 상이한 공급원을 사용하여 암, 다른 조직 및 "BCD (binary-categorical differentiation)방법"으로 불리는 다른 질환에서 범주적으로 별개의 메틸화 부위를 발견하는 방법을 개시한다. 일 실시예는 a. 간세포 암종 (HCC), b. 폐암, c. 전립선 암, d. 유방암, e. 결장 직장암, f. 두경부 편평 세포 암종 (HNSC), g. 췌장암, h. 뇌암(교모세포종), i. 위암, j. 난소암, k. 자궁경부암, l. 식도 암종, m. 방광암, n. 신장 암, o. 고환암, p. 흔한 고형 종양, q. 게놈 전체 데이터의 발견 세트에서 혈액 암 프로파일의 검출을 위한 "범주" DNA 메틸화 부위의 조합을 나타낸다. 다른 실시예는 또한 그들의 기원(origin) 조직에 의해 종양을 구별하는 "범주" DNA 메틸화 부위의 조합을 나타낸다. 이 실시예는 낮은 조직 특이성을 갖는 메틸화된 CF DNA를 검출하기 위한 종래의 방법과 분석법을 구별한다. 실시예는 높은 감도 및 특이성을 갖는 종양 기원 조직뿐만 아니라 수백 명의 환자로부터의 DNA 메틸화 데이터에서 암의 검출을 위한 폴리 유전자 DNA 메틸화 분석을 검증한다. 본 발명은 수백 명의 사람들에서 CG IDs의 다원성 세트에서 DNA 메틸화를 정확하게 측정하는 방법을 개시하고, 단일 차세대 Miseq 시퀀싱 반응, 표적 체액, 예컨대 타액 또는 소변과 같은 소량의 체액으로부터 메틸화의 정량 및 정량화에 이어 표적 특이적 프라이머를 사용한 순차적 증폭에 이어 바코딩(barcoding) 프라이머 및 다중화된 시퀀싱에 의해 수행된다. 본 발명의 주제의 실시예는 또한 파이로시퀀싱 분석 또는 메틸화 특이적 PCR을 사용하여 상기 DNA 메틸화 CG IDs의 메틸화의 측정을 개시한다. 또 다른 실시예는 암 환자를 건강한 사람과 구별시키는 "범주적"또는 다원성 가중 메틸화 점수의 계산을 개시한다. 다른 실시예는 암에 대한 다른 임상적 증거가 없는 사람에서 암을 예측하기 위해 혈장, 소변, 대변, 조직 생검 또는 조직 스왑(swabs)으로 이어지는 새로운 과정을 개시한다. 다른 실시예는 암뿐만 아니라 세포 사망 및 CF DNA의 방출과 관련된 알츠하이머병 및 뉴런의 신경 퇴행성 질환, 심장 근육 세포의 심장병을 포함하는 다른 질환을 검출하기 위해 당업자에 의해 사용될 수 있다. 실시예에 기재된 DNA 메틸화 마커(CG IDs)는 a. 일상적인 "검사"를 통해 그렇지 않으면 "건강한"사람들에서 암의 비 침습적 조기 발견; b. HCC 위험이 높은 만성 간염 환자 또는 폐암 위험이 높은 흡연자와 같은 "위험이 높은"사람들의 모니터링; c. 암 치료를 받는 환자의 치료에 대한 반응을 모니터링 하여 재발 또는 전이를 탐지는 것에 이용될 것이다.

실시예는 본원에 개시된 DNA 메틸화 측정 방법에 기초하여 다유전자성 또는 범주 성 스코어를 사용하여 미지의 샘플의 암을 검출하는 실용성을 입증한다. 개시된 실시예는 당업자에게 이용 가능한 메틸화 분석 방법, 예를 들어 차세대 비설파이트 시퀀싱(bisulfite sequencing), 일루미나 에픽 마이크로어레이(Illumina Epic microarrays), 캡처 시퀀싱(capture sequencing), 메틸화 DNA 면역침전(MeDIP) 메틸화 특이적 PCR 및 이용 가능한 메틸화 측정과 같은 방법을 사용하여 임의의 암 또는 질환 조직의 체액, 대변, 소변 및 조직에서 암을 검출하기 위해 당업자에 의해 사용될 수 있다.

실시예는 또한 게놈 와이드 시퀀싱을 위해 질병의 비 침습적 검출에 사용될 특이적이고 민감한 마커를 발견하기위한 이진 범주 형 분화 (BCD) 분석 방법으로서 차세대 비설파이트 시퀀싱, MeDip 시퀀싱, 이온 토런트 시퀀싱, 에픽 마이크로 어레이 등과 같은 당업자에게 이용 가능한 임의의 방법을 사용하여 다른 암 및 질병에 대한 새로운 "다원성"범주형 DNA 메틸화 마커의 발견 가능성을 개시한다.

제1 측면에서, 실시예는 암의 조기 검출을 위한 혈장과 같은 체액 내의 세포 유리 DNA에서 암의 폴리유전자 DNA 메틸화 마커를 제공하고, 상기 폴리 유전자 DNA 메틸화 마커 세트는 게놈 와이드 DNA 메틸화에 대해 본원에 개시된 바와 같은 Illumina 450K 또는 EPIC 어레이, 게놈 와이드 비설파이트 시퀀싱(genome wide bisulfite sequencing), 메틸화 된 DNA 면역 침전(MeDIP) 시퀀싱 또는 올리고뉴클레오티드 어레이(oligonucleotide arrays )와의 하이브리드 화와 같은 맵핑 방법에 의해 유도된 게놈 와이드 DNA 메틸화에 관한 것이다.

다른 실시예에서, 폴리유전자 DNA 메틸화 마커는 혈장 CF DNA 또는 다른 체액 CF DNA를 사용한 간암 간세포 암종 (HCC)의 조기 검출용으로서 하기 표에서 CG IDs의 조합이다(또는 하기 표 1과 같은 이 목록의 짧은 부분 집합).

검출을 위한 부분 집합:

cg02012576, cg03768777, cg24804544, cg05739190

다른 실시예에서, 폴리유전자 DNA 메틸화 마커는 하기 표의 CG IDs 또는 암의 기원을 HCC로 지정하고 혈장 CF DNA 또는 다른 체액 DNA를 사용하여 다른 10 개의 일반적인 고형 종양 암과 구별하는 것에 대한 이 표의 짧은 부분 집합이다 (하기 표 2에 나타난 예와 같음)

특이성을 위한 부분 집합:

cg14126493

다른 실시예에서, 폴리유전자 DNA 메틸화 마커는 혈장 CF DNA 또는 다른 체액 CF DNA을 사용하여 폐암의 조기 검출을위한 하기 표의 CG IDs 또는이 표의 짧은 부분 집합(예를 들어, 표 3에 열거된 예)의 조합이다.

검출을 위한 부분 집합:

cg04223424, cg23141355

다른 실시예에서, 폴리유전자 DNA 메틸화 마커는 암의 기원을 폐암으로 지정하고

혈장 CF DNA 또는 다른 체액 DNA를 사용하는 다른 10 개의 일반적인 고형 종양 암과 구별하기 위한 하기 표의 CG IDs 또는 이 표의 짧은 부분 집합(표 4에 나열된 예에 나타냄)의 조합이다.

스펙을 위한 부분 집합:

cg05917732, cg25470077

다른 실시예에서, 폴리유전지 DNA 메틸화 마커는 전립선 암의 조기 검출 및 기원을 지정하고 전립선 암으로서의 암 및 혈장 CF DNA 또는 다른 체액 CF DNA를 사용하는 다른 16 개의 일반적인 고형 종양 암과 구별하기 위한 하기 표(또는 하기 표 5와 같은 짧은 부분 집합)에서 CG IDs의 조합이다.

검출_스펙을 위한 부분 집합:

cg14283569

[상기 표에 나열된 4 리스트 중 일부이다]

다른 실시예에서, 폴리유전자 DNA 메틸화 마커는 혈장 CF DNA 또는 다른 체액 CF DNA을 사용하여 유방암의 조기 검출을 위한 하기 표의 CG IDs 또는 이 표의 짧은 부분 집합(예를 들어, 표 6에 열거된 예)의 조합이다.

검출을 위한 부분 집합:

cg13031251, cg09734791, cg09695735, cg03637878

다른 실시예에서, 폴리유전자 DNA 메틸화 마커는 암의 기원을 유방암으로 지정하고 혈장 CF DNA 또는 다른 체액 DNA를 사용하는 다른 10 개의 일반적인 고형 종양 암의 구별하기 위한 아래 표의 CG IDs 또는 이 표의 짧은 부분 집합(표 7에 나열된 예에 표시됨)의 조합이다.

스펙을 위한 부분 집합:

cg03113878, cg20180843

다른 실시예에서, 폴리유전자 DNA 메틸화 마커는 결장 직장암 (CRC)의 조기 검출 및 특정을 위해 결장 직장암으로서의 암 기원 및 혈장 CF DNA 또는 다른 체액 CF DNA를 사용하는 다른 16 개의 일반적인 고형 종양 암과 구별하는 하기 표의 CG IDs 또는 이 표의 짧은 부분(예를 들어 하기 표 8에 열거된 예)의 조합이다.

검출-스펙을 위한 부분 집합

cg09854653, cg01566242

다른 실시예에서, 폴리유전자 DNA 메틸화 마커는 혈장 CF DNA 또는 다른 체액 CF DNA 을 사용하여 췌장암의 조기 검출을 위한 하기 표의 CG IDs 또는 이 표의 짧은 부분 집합(예를 들어 표 9에 기재된 예)의 조합이다.

검출을 위한 부분 집합:

cg25024074, cg15386964, cg16232979

다른 실시예에서, 폴리유전자 DNA 메틸화 마커는 암의 기원을 췌장암으로 지정하고 혈장 CF DNA 또는 다른 체액 DNA를 사용하는 다른 10 개의 일반적인 고형 종양암을 구별하기 위한 아래 표의 CG IDs 또는 이 표의 짧은 부분 집합(표 10에 나열된 예에 표시됨)의 조합이다.

스펙을 위한 부분 집합:

cg01237565, cg08182975, cg20983577, cg25591377

다른 실시예에서, 폴리유전자 DNA 메틸화 마커는 뇌암(교모세포종)의 조기 검출뿐만 아니라 암의 기원을 뇌암(교모세포종)으로 지정하고 혈장 CF DNA 또는 다른 체액 CF DNA를 사용하여 다른 10 개의 일반적인 고형 종양 암과 구별하기 위한 하기 표의 CG IDs 또는 이 표의 짧은 부분 집합(예를 들어, 하기 표 11에 열거된 예)이다.

스펙-검출을 위한 부분 집합

Cg19929355

다른 실시예에서, 폴리유전자 DNA 메틸화 마커는 혈장 CF DNA를 사용하여 위 (위)암 또는 다른 체액 CF DNA의 조기 검출을 위한 하기 표의 CG IDs 또는 이 표의 짧은 부분 집합(예를 들어, 표 12에 열거된 예)이다.

검출을 위한 부분 집합:

cg05611779, cg09734791, cg15760257

다른 실시예에서, 폴리유전자 DNA 메틸화 마커는 암의 기원을 위암으로 지정하고 혈장 CF DNA 또는 다른 체액 DNA를 사용하는 다른 10 개의 일반적인 고형 종양 암과 구별하기 위한 아래 표의 CG IDs 또는 이 표의 짧은 부분 집합(표 13에 나타낸 예에 표시됨)의 조합이다.

스펙을 위한 부분 집합:

cg05611779, cg19235339

다른 실시예에서, 폴리유전자 DNA 메틸화 마커는 혈장 CF DNA 또는 다른 체액 CF DNA을 사용하여 난소 암의 조기 검출을위한 하기 표의 CG IDs 또는 이 표의 짧은 부분 집합(예를 들어, 하기 표 14에 나타낸 예)의 조합이다.

검출을 위한 부분 집합:

cg24339193, cg22694153, cg11252337, cg21210985

다른 실시예에서, 폴리유전자 DNA 메틸화 마커는 암의 기원을 난소 암으로 지정하고 혈장 CF DNA 또는 다른 체액 DNA를 사용하는 다른 10 개의 일반적인 고형 종양 암과 구별하기 위한 아래 표의 CG IDs 또는이 표의 짧은 부분 집합(표 15에 나열된 예에 표시됨)의 조합이다.

스펙을 위한 부분 집합:

cg07068768, cg19846609

다른 실시예에서, 폴리유전자 DNA 메틸화 마커는 혈장 CF DNA 또는 다른 체액 CF DNA을 이용한 자궁 경부암의 조기 검출을 위한 하기 표의 CG IDs 또는이 표의 짧은 부분 집합(예를 들어, 표 16에 나타낸 예)의 조합이다.

검출을 위한 부분 집합:

cg00757182, cg01601746

다른 실시예에서, 폴리유전자 DNA 메틸화 마커는 암의 기원을 자궁 경부암으로 지정하고 혈장 CF DNA 또는 다른 체액 DNA를 사용하는 다른 10 개의 일반적인 고형 종양 암과 구별하기 위한 아래 표의 CG IDs 또는 이 표의 짧은 부분 집합 (표 17에 나열된 예에 표시됨)의 조합이다.

스펙을 위한 부분 집합:

cg07066594, cg09260640, cg12961842

다른 실시예에서, 폴리유전자 DNA 메틸화 마커는 혈장 CF DNA 또는 다른 체액 CF DNA 를 사용하여 두경부 편평 상피 세포 암종(HNSC) 암종의 조기 검출을 위해 아래 표의 CG IDs 또는 이 표의 짧은 부분 집합(예 : 아래 표 18에 나열된 예)의 조합이다.

검출을 위한 부분 집합:

cg07900968, cg20334243, cg27420520

다른 실시예에서, 폴리유전자 DNA 메틸화 마커는 암의 기원을 두경부 편평 상피 세포 암종(HNSC)으로 지정하고 혈장 CF DNA 또는 기타 체액 DNA를 사용하여 다른 10 개의 일반적인 고형 종양 암과 구별하는 하기 표의 CG IDs 또는 이 표의 짧은 부분 집합(표 19에 열거된 예에 나타낸 바와 같이)의 조합이다.

스펙을 위한 부분 집합:

cg18006328, cg19287220

다른 실시예에서, 폴리유전자 DNA 메틸화 마커는 혈장 CF DNA 또는 다른 체액 CF DNA신체를 사용한 식도 암종의 조기 검출을 위한 아래 표의 CG IDs 또는 이 표의 짧은 부분 집합(예를 들어, 표 20에 나열된 예)의 조합이다.

검출을 위한 부분 집합:

cg03280624, cg03735888, cg09734791, cg27420520

일 실시예에서, 폴리유전자 DNA 메틸화 마커는 암의 기원을 식도 암종으로 지정하고 혈장 CF DNA 또는 기타 체액 DNA를 사용하여 다른 10 개의 일반적인 고형 종양 암과 구별하는 하기 표의 CG IDs 또는 이 표의 짧은 부분 집합이다(표 21에 열거된 예에 나타낸 바와 같이).

스펙을 위한 부분 집합:

Cg09556952, cg12473285

다른 실시예에서, 폴리유전자 DNA 메틸화 마커는 혈장 CF DNA 또는 다른 체액 CF DNA을 사용하여 방광암의 조기 검출을 위한 하기 표의 CG IDs 또는 이 표의 짧은 부분 집합(예를 들어, 표 22에 열거된 예)의 조합이다.

검출을 위한 부분 집합:

cg04223424, cg10723962, cg25024074

다른 실시예에서, 폴리유전자 DNA 메틸화 마커는 암의 기원을 방광암으로 지정하고 혈장 CF DNA 또는 다른 체액 DNA를 사용하여 다른 10 개의 일반적인 고형 종양 암과 구별하는 하기 표의 CG IDs 또는 이 표의 짧은 부분 집합의 조합이다 (예를 들어, 표 23에 열거된 예).

스펙을 위한 부분 집합:

cg13544006

다른 실시예에서, 폴리유전자 DNA 메틸화 마커는 암의 기원을 신장 암으로 지정하고 혈장 CF DNA 또는 다른 체액 CF DNA를 사용하여 다른 10 개의 일반적인 고형 종양 암과 구별하기 위한 신장 암(콩팥)의 조기 발견하는 하기 표의 CG IDs 또는 이 표의 짧은 부분 집합(예를 들어,하기 표 24에 열거된 예)이다.

검출 스펙을 위한 부분 집합:

cg08884571, cg00011225, cg00011225

다른 실시예에서, 폴리유전자 DNA 메틸화 마커는 고환암으로서 암의 기원을 지정하고 혈장 CF DNA 또는 다른 체액 CF DNA를 사용하여 다른 10 개의 일반적인 고형 종양 암과 구별하기 위한 고환암의 조기 검출용으로 하기 표의 CG IDs 또는 이 표의 짧은 부분 집합(예를 들어, 하기 표 25에 열거된 예)의 조합이다.

검출 및 스펙을 위한 부분 집합:

cg14531093, cg25159927

다른 실시예에서, 폴리유전자 DNA 메틸화 마커는 혈장 CF DNA 또는 다른 체액 CF DNA를 사용하여 13 개의 가장 흔한 고형 종양 중 하나를 조기에 검출하기 위한 하기 표의 CG IDs 또는 이 표의 짧은 부분 집합(예 :하기 표 26에 제시된 예)의 조합이다.

검출을 위한 부분 집합:

cg10723962, cg15759056, cg24427504, cg25024074

다른 실시예에서, 폴리유전자 DNA 메틸화 마커는 백혈구, 혈장 CF DNA 또는 기타 체액 CF DNA를 사용하여 AML, CLL 등과 같은 혈액 암을 조기에 발견하기 위해 표 27에 나타낸 바와 같은 게놈 와이드 DNA 메틸화 데이터에 대한 BCD 방법에 의해 묘사된 CG IDs의 조합이다 (또는 하기 표 27에 나타낸 바와 같은 이 조합의 짧은 부분 집합).

검출-스펙을 위한 부분 집합:

cg18658397, cg18780412, cg20439288, cg22828045, cg25375340

다른 실시예에서, 폴리유전자 DNA 메틸화 마커는 암의 기원을 흑색 종으로 지정하고 혈장 CF DNA 또는 다른 체액 CF DNA를 사용하여 다른 16 개의 일반적인 고형 종양 암과 구별하기위한 흑색 종의 조기 검출하기 위해 하기 표에 나타낸 CG IDs의 조합 (또는 하기 표 28에 열거된 예 표에서의 짧은 부분 집합)이다.

검출-스펙을 위한 부분 집합:

cg15307891, cg18866529, cg27084903

본 발명 주제의 다른 측면에서, 다 유전자 DNA 메틸화 마커의 DNA 메틸화 측정을 검출하기 위한 수단 및 시약을 포함하는 암을 검출하기 위한 키트 및 방법이 제공된다.

일 실시예에서, 표 1 및 2의 CG IDs의 DNA 메틸화 측정을 위한 수단 및 시약을 포함하는 간세포 암종을 검출하기 위한 키트가 제공된다.

다른 실시예에서, 표 3 및 4의 CG IDs의 DNA 메틸화 측정을 위한 수단 및 시약을 포함하는 폐암을 검출하기 위한 키트가 제공된다.

다른 실시예에서, 표 5의 CG IDs의 DNA 메틸화 측정을 검출하기 위한 수단 및 시약을 포함하는 전립선 암을 검출하기 위한 키트가 제공된다.

다른 실시예에서, 표 6 및 7의 CG IDs의 DNA 메틸화 측정을 검출하기 위한 수단 및 시약을 포함하는 유방암을 검출하기 위한 키트가 제공된다.

다른 실시예에서, 표 8의 CG IDs의 DNA 메틸화 측정을 검출하기 위한 수단 및 시약을 포함하는 결장 직장암을 검출하기 위한 키트가 제공된다.

다른 실시예에서, 표 9 및 10의 CG IDs의 DNA 메틸화 측정을 검출하기 위한 수단 및 시약을 포함하는 췌장암을 검출하기 위한 키트가 제공된다.

또 다른 실시예에서, 표 11의 CG IDs의 DNA 메틸화 측정을 검출하기 위한 수단 및 시약을 포함하는 뇌암을 검출하기 위한 키트가 제공된다.

다른 실시예에서, 표 12 및 13의 CG IDs의 DNA 메틸화 측정을 검출하기 위한 수단 및 시약을 포함하는 위암을 검출하기 위한 키트가 제공된다.

다른 실시예에서, 표 14 및 15의 CG IDs의 DNA 메틸화 측정을 검출하기 위한 수단 및 시약을 포함하는 난소 암을 검출하기 위한 키트가 제공된다.

다른 실시예에서, 표 16 및 17의 CG IDs의 DNA 메틸화 측정을 검출하기 위한 수단 및 시약을 포함하는 자궁 경부암을 검출하기 위한 키트가 제공된다.

다른 실시예에서, 표 18 및 19의 CG IDs의 DNA 메틸화 측정을 검출하기 위한 수단 및 시약을 포함하는 HNSC(head and neck squamous carcinoma)를 검출하기 위한 키트가 제공된다.

다른 실시예에서, 표 20 및 21의 CG IDs의 DNA 메틸화 측정을 검출하기 위한 수단 및 시약을 포함하는 식도 암종을 검출하기 위한 키트가 제공된다.

다른 실시예에서, 표 22 및 23의 CG IDs의 DNA 메틸화 측정을 검출하기 위한 수단 및 시약을 포함하는 방광암을 검출하기 위한 키트가 제공된다.

다른 실시예에서, 표 24의 CG IDs의 DNA 메틸화 측정을 검출하기 위한 수단 및 시약을 포함하는 신장 암을 검출하기 위한 키트가 제공된다.

다른 실시예에서, 표 25의 CG IDs의 DNA 메틸화 측정을 검출하기 위한 수단 및 시약을 포함하는 고환암을 검출하기 위한 키트가 제공된다.

다른 실시예에서, 표 26의 CG IDs의 DNA 메틸화 측정을 검출하기위한 수단 및 시약을 포함하는 13 개의 일반적인 암 (방광, 뇌, 유방, 자궁 경부, 결장 직장, 식도, HNSC, HCC(간), 폐, 난소, 췌장, 전립선, 위) 중 하나를 검출하기 위한 키트가 제공된다.

다른 실시예에서, 표 27의 혈액 암의 다른 하위 유형에 대한 BCD 방법에 의해 검출 된 CG IDs의 DNA 메틸화 측정을 검출하기 위한 수단 및 시약을 포함하는 AML 및 CLL과 같은 혈액 암을 검출하기위한 키트가 제공된다.

다른 실시예에서, 표 28의 CG IDs의 DNA 메틸화 측정을 검출하기 위한 수단 및 시약을 포함하는 흑색 종을 검출하기 위한 키트가 제공된다.

다른 실시예에서, DNA 파이로시퀀싱 메틸화 분석은 상기 열거된 CG IDs를 사용하여, 예를 들어 하기 개시된 프라이머 및 파이로시퀀싱 반응의 표준 조건을 사용함으로써 혈장 CF DNA와 같은 체액에서 HCC를 예측하는데 사용된다:

cg02012576

정방향: GGTAGTTAGGAAGTTTAGAGGTTGTAGTA

역방향(비오틴화): ACCACTACCCCAACCCAACCCTA

시퀀스: GGTTTTAGGATGTTTG

cg03768777 (VASH2)

정방향: AGAATAATATTAGAGAATGGGATATGGAA

역방향(비오틴화): ACAACTCCAAAATCCTACCT

시퀀스: GAATGGGATATGGAATGA

cg05739190 (CCNJ)

정방향: GTTTAGGAGTTGGGTTTTAGTTGAG

역방향(비오틴화): ACCCCACCCTAACTCCCTTACC

시퀀스: TGGGTTTTAGTTGAGG

cg24804544 (GRID2IP)

정방향(비오틴화): GGGTAGGGGAGGGTTTTGAAATA

역방향: TAACCCCCCCTCCAACCTCATTC

시퀀스: CACCCAACTTCTCAAT

암 기원 조직의 특이성은 하기 CGID cg02012576 (HPX)의 DNA 메틸화를 측정함으로써 결정된다.

정방향(비오틴화): ATTTTTATGGGTATTAGTTTTAGGGAGAA

역방향(비오틴화): CCAAAACTATCCTATAACCTCTACAACTCA

시퀀스: ACCATTACCACCCCT

다른 실시예에서, 폴리유전자 다중화 된 앰플리콘 비설파이트(amplicon bisulfate) 시퀀싱 DNA 메틸화 분석은 상기 열거된 CG IDs를 사용하여 혈장 CF DNA와 같은 체액에서의 암을 예측하기 위해 사용된다. 예를 들어, 하기 개시된 프라이머 및 비설파이트 전환을 수반하는 표준 조건, 표적 특이적 프라이머(PCR 1)에 의한 순차적 증폭, 이어서 바코드 프라이머 (PCR 2) 및 단일 차세대 MiSeq 시퀀서(Illumina)에서의 다중화 시퀀싱, Illumina 소프트웨어를 사용한 디멀티플렉싱, 메틸킷(Methylkit)과 같은 메틸화 분석을 위한 표준 방법을 사용하여 메틸화의 데이터 추출 및 정량화, 가중 DNA 메틸화 점수 계산 및 소량의 암 예측 혈장, 타액 또는 소변과 같은 체액의 양을 사용하여 전립선 암 예측한다.

첫 번째 PCR 전립선 암을 탐지하는 단계는 다음과 같이 수행된다:

CGID cg02879662의 경우

정방향 프라이머: 5'ACACTCTTTCCCTACACgACgCTCTTCCgATCTNNNNNGGTAGGAGTTTTGGGAATTGG3'

역방향 프라이머:

5'gTgACTggAgTTCAgACgTgTgCTCTTCCgATCTCCACCCCTACAATCCCTAA3'

CGID cg16232979의 경우

정방향 프라이머:

5'ACACTCTTTCCCTACACgACgCTCTTCCgATCT NNNNNYGGTTTYGGGTTTYGTATT3'

역방향 프라이머:

5'gTgACTggAgTTCAgACgTgTgCTCTTCCgATCTACRCAAAAATATAAATCRACRATC3'

암이 전립선에서 특이적으로 발생하는지 테스트하기 위해 첫 번째 PCR은 다음과 같이 수행된다:

CGID의 경우: cg14041701 및 cg14498227

정방향 프라이머:

5'ACACTCTTTCCCTACACgACgCTCTTCCgATCTNNNNNGTTTTGYGTTTYGGATTTGGGTT3'

역방향 프라이머:

5' gTgACTggAgTTCAgACgTgTgCTCTTCCgATCTCATAAACAACACCTTTAAATAAACACTAAA3'

샘플을 바코드화 하기 위한, 다음 프라이머와 함께 두 번째 PCR 반응을 사용했다:

정방향 프라이머:

5'AATgATACggCgACCACCgAgATCTACACTCTTTCCCTACACgAC3'

바코팅 프라이머 (역방향):

5' CAAgCAgAAgACggCATACgAgATAGTCATCG gTgACTggAgTTCAgACgTg3' (빨강 염기는 인덱스(index )다; 인덱스는200 가지 변형이 사용된다)

다른 실시예에서, CG IDs의 가중 DNA 메틸화 측정을 사용하여 암과 정상 사이의 임계 값을 정의함으로써 암을 검출하기 위해 리시버 작동 특성(ROC) 분석이 사용된다. 임계 값보다 높거나 낮은 샘플은 암으로 분류된다. 예를 들어, HCC 탐지를 위해 위에 나열된 CGIDs이다:

다른 실시예에서, 계층적 군집 분석 검정은 상기 열거된 CG IDs의 메틸화의 측정을 사용하여 암을 예측하기 위해 사용된다.

본 발명 주제의 다른 측면에서, 암 및 다른 질병을 검출하기 위한 DNA 메틸화 마커를 식별하는 방법은 임상 샘플로부터 수득된 DNA 메틸화 측정에 관해 이전에 개시된 "이진 범주형 분화 (BCD)" 방법으로 통계 분석을 수행하는 단계를 포함한다.

다른 실시예에서, 상기 방법은 샘플로부터 수득된 DNA 메틸화 측정에 대한 통계적 분석 및 "이진 범주형 분화 (BCD)" 방법을 수행하는 단계로서 적어도 하나의 샘플로부터 추출된 DNA의 Illumina Beadchip 450K 또는 EPIC 어레이를 수행함으로써 얻어진 DNA 메틸화 측정한다.

다른 실시예에서, DNA 메틸화 측정은 샘플로부터 추출된 DNA의 DNA 파이로시퀀싱을 수행한 후 질량 분광 분석법(Epityper ™), 비설파이트 전환된 DNA로부터 본원에 개시된 표적 CG IDs에 걸친 영역의 PCR 기반 메틸화 분석 및 표적화 된 증폭에 이어서 일루미나(Illumina) 차세대 시퀀서 상에서의 제 2 세트의 증폭 및 인덱스-멀티플렉스 시퀀싱에서 바코딩 한다.

다른 실시예에서, 통계 분석은 수신기 작동 특성(ROC) 분석을 포함한다.

다른 실시예에서, 통계적 분석은 계층적 군집 분석 검정을 포함한다.

정의

본원에 사용된 용어 "CG"는 사이토신 및 구아노신 염기를 함유하는 DNA의 디-뉴클레오티드 서열을 지칭한다. 이들 디-뉴클레오티드 서열은 인간 및 다른 동물의 DNA에서 메틸화 될 수 있다. CG ID는 Illumina 450K 매니페스트에 의해 정의된 인간 게놈에서의 위치를 나타낸다(여기에 나열된 CGs의 목록은 https://bioconductor.org/packages/release/data/annotation/html/IlluminaHumanMethylation450k.db.html에서 공개적으로 사용할 수 있으며 R 패키지 IlluminaHumanMethylation450k.db IlluminaHumanMethylation450k.db로 설치된다: Illumina 인간 메틸화 450k 주석 데이터. R 패키지 버전 2.0.9.).

본원에 사용된, 용어 "베타-값"은 화학식 베타 값 = 메틸화 C 강도 / (메틸화 C 강도 + 메틸화되지 않은 C 강도) 0과 1 사이에서 0은 완전히 메틸화되지 않고 1은 완전히 메틸화되는 것으로, 메틸화 프로브와 비메틸화 프로브 사이의 강도 비율을 사용하여 Illumina 450K 어레이의 정규화 및 정량화에 의해 유도된 CG ID 위치에서의 메틸화 수준의 추정을 지칭한다.

본원에 사용된 용어 "패널라이징된 회귀"는 예를 들어 R statistical package "penalized" as described in Goeman, J. J., L1 penalized estimation in the Cox proportional hazards model. Biometrical Journal 52(1), 70-84. 와 같이 구현된 바와 같이 더 큰 바이오 마커 목록으로부터 결과를 예측하는데 필요한 가장 적은 수의 예측 인자를 식별하는 것을 목표로 하는 통계적 방법을 지칭한다.

본 명세서에서 사용되는 용어 "클러스터링 (clustering)"은 동일한 그룹 (클러스터 라 칭함)의 객체들이 (어떤 의미로든 또는 더) 유사한 방식으로 다른 그룹 (클러스터)의 사람들보다 서로 객체 세트를 그룹화하는 것을 지칭한다.

본원에 사용된 용어 "계층 클러스터링(Hierarchical clustering )"은 예를 들어 Kaufman , L.; Rousseeuw , P.J . (1990). Finding Groups in Data: An Introduction to Cluster Analysis (1 ed.). New York: John Wiley . ISBN 　 0-471-87876-6 . 에 기재된 바와 같이 서로 클러스터가 얼마나 유사한 지(가까운 지) 또는 비 유사한 지(거리)인지에 기초하여 "클러스터"의 계층 구조를 구축하는 통계적 방법을 지칭한다.

본 명세서에서 사용되는 용어 "수용체 작동 특성 (ROC) 분석"은 예측의 성능을 나타내는 그래픽 플롯을 생성하는 통계적 방법을 지칭한다. 실제 양성(true positive) 예측율은 예를 들어 Hanley, James A.; McNeil, Barbara J. (1982). "The Meaning and Use of the Area under a Receiver Operating Characteristic (ROC) Curve". Radiology 143 (1): 29-36.에 기재된 바와 같이 예측에 대한 다양한 역치 설정(즉, 상이한 %의 메틸화)에서 거짓 양성율에 대해 플롯팅 된다.

본원에 사용된 용어 "다변량 또는 다형성 선형 회귀"는 CG IDs에서의 메틸화 백분율과 같은 다수의 "독립적 변수" 또는 "예측", 및 암과 같은 "의존적 변수"사이의 관계를 추정하는 통계적 방법을 지칭한다. 이 방법은 CG IDs와 같은 여러 "독립 변수"가 모델에 포함된 경우 "결과"(암과 같은 종속 변수)를 예측할 때 각 CG IDs의 "무게" 또는 계수를 결정한다.

도 1은 수백 명의 개인에서 혈액 샘플 및 정상 조직에 걸쳐 완전히 메틸화되지 않은 부위의 목록을 보여준다. 그림 A는 Illumina450K 게놈 와이드 메틸화 어레이 (GSE50192)에서 모든 개인 (<0.1)에서 메틸화되지 않은 17 개 조직에 대한 CG IDs가 33477 CG IDs 목록을 생성하는 312 명의 혈액 샘플의 게놈 와이드 DNA 메틸화 어레이(GSE61496)에서 메틸화되지 않은 CG IDs와 겹침을 보여준다.
B는 19 세에서 101 세 사이의 656 명의 개인 (여성과 남성)의 혈액 샘플의 DNA 메틸화 배열에서 (GSE40279) A로부터 메틸화되지 않은 CG IDs와 중첩된 가장 강력하게 메틸화되지 않은 CG IDs를 33477 CG ID 목록으로 선정하는 방법을 보여준다. 이러한 분석 결과를 종합하여 모든 연령대에 걸쳐 많은 개인의 조직과 혈액 샘플에서 메틸화되지 않은 높은 신뢰도의 28754 CG ID 목록을 생성했다. 이들 28754 위치는 본 발명의 주제에 의해 개시된 "이진- 범주형 분화 (BCD)"방법을 사용하여 암에서 범주적으로 메틸화 된 부위를 발견하기 위해 사용되었지만 다른 조직에서는 그렇지 않았다.
도 2는 HCC에 대한 현재 순환 DNA 마커의 조직 결손 특이성을 나타내는 예시이다. 예시된 히트 맵은 Xu 등(Xu et al., 2017)에서 다른 정상 조직의 이들 부위에 대한 HCC 및 메틸화 수준의 바이오 마커로서 최종 후보로 선정된 10 개의 CG IDs를 보여준다. HCC의 특이적 바이오 마커로서 제안된 CG IDs 중 일부는 다른 조직에서 메틸화되고 혈액 DNA에서 다양한 수준의 메틸화를 나타낸다. (청색 0 메틸화 짙은 적색 100 % 메틸화)
도 3은 암 DNA에 대한 BCD 방법을 사용하여 발견된 HCC DNA 메틸화 마커의 특이성을 나타내는 예시이다. 예시된 히트맵은 본원에 기술된 BCD 방법에 의해 HCC DNA 메틸화 마커로서 선택된 4 개의 CG IDs를 나타낸다. 메틸화 수준은 암 (HCC)과 정상 조직 및 혈액간에 범주적으로 다르므로, 혈액 및 다른 조직의 모든 개체에서 부위가 메틸화되지 않고 HCC에서 측정 가능하게 메틸화된다.
도 4는 결장 직장암에 대한 현재 DNA 메틸화 마커의 기원 특이성의 암 조직의 결여 및 본 발명의 주제의 실시예에 따른 "검출-스펙"방법과의 비교를 도시한다.
A는 대장 암(Epigenomics Inc.에서 판매)에 대한 "Epi-colon" CF DNA 메틸화 마커에 포함 된 Sept9 유전자의 CG 사이트를 보여주며, 이는 암 DNA 메틸화 데이터의 TCGA 수집으로부터 메틸화 데이터를 이용하여 많은 다른 암을 검출하는데 사용될 수 있고, 따라서 결장 직장암에 대한 특이성이 결여되어 있다(HKG-Colon (HKG-epiCRC), 청색). BCD 방법 (HKG-Colon orange) (표 10)을 사용하여 발견된 결장 직장암의 검출을 위한 본 발명의 주제(표 9)에 개시된 마커 (표 10)는 다른 일반적인 고형 종양 암에 대해 시험될 때 결장 직장암에 대해 매우 특이적이다. B와 C는 HKG-Colon (HKG-epiCRC) (B) 또는 Epi-Colon (C) DNA 메틸화 마커를 사용하여 다른 암을 가진 다른 개체의 종양 DNA에 대한 DNA 메틸화 값의 산점도이다. HKG-epiCRC 마커 (B)와 Epi-Colon 마커 (C)의 분산된 이종 프로필을 사용하는 결장 직장암과 다른 암 사이의 DNA 메틸화의 밀접하고 범주적인 차이가 주목된다.
도 5는 간암 (HCC)의 조기 검출을 위한 다 유전자 DNA 메틸화 마커의 발견을 보여주는 예시이다. A는 BCD 방법 (표 1)을 사용하는 실시예에 따른 HCC 검출을 위한 4 개의 CGIDs 세트의 발견을 위해 메틸화 데이터를 사용한 환자의 소스 및 수를 나타내는 표 및 기원의 암(표 2)특이성을 결정하기 위한 CG IDs를 나타낸 표이다. 도 5의 좌측 하단 패널(검출)의 B는 1-145 (79 정상 및 66 HCC)에 열거된 각각의 시험된 사람들에 대한 이들 CG IDs (표 1)에 대한 결합된 메틸화 점수를 보여준다. 다형성 점수는 HCC 환자와 정상 간 조직을 범주별로 구분한다. 우측 하단 패널의 C는 8 개의 다른 종양 (표 2)에 대한 데이터를 사용하여 특정 종양 기원(표 2)을 검출하는 1 CGID에 대한 메틸화 점수를 보여준다. 마커는 다른 기원의 암과 HCC를 범주적으로 구분한다.
도 6은 GSE76269 (n = 227)로부터의 DNA 메틸화 데이터를 사용한 HCC (스펙)에 대한 다 유전자 DNA 메틸화 마커의 검증의 예시이다. A는 227 간암 환자 DNA 메틸화 데이터 및 10 정상을 사용하는 HCC DNA 메틸화 마커에 대한 곡선 아래 면적을 나타내는 ROC 플롯이다. B는 HCC 검출의 감도, 특이성 및 정확성을 보여준다. C는 검증 데이터 세트에서 HCC의 검출 검출률을 보여준다.
도 7은 TCGA 메틸화 데이터 (n = 4166)에서 다른 암에 대한 HCC에 대한 폴리 유전자 HKG-epiLiver- 검출 및 스펙 마커의 정확성 및 특이성을 검증한 도면이다. A는 암이 다른 환자의 HKG-Liver 검출 / 사양 마커 DNA 메틸화 데이터의 검출 속도를 보여준다. TCGA C 민감도 및 다른 기원의 암에 대한 HCC에 대한 특이성의 4166 환자 DNA 메틸화 데이터에서 HCC에 대해 HKG-간-검출 마커의 특이성과 감도의 HCC. B. ROC 플롯에 대한 거의 완벽한 특이성에 주목한다.
도 8은 폐암에 대한 다 유전자 DNA 메틸화 마커의 발견의 예시이다. 도 8의 A는 BCD 방법 (표 3) 및 특정 암 조직 기원 (표 4)의 결정을 위한 CG IDs를 사용하여 실시예에 개시된 폐암 검출을 위한 CGIDs 세트의 발견에 사용된 메틸화 데이터를 갖는 환자의 소스 및 수를 열거한 표이다. 도 8의 좌측 하단 패널(검출)의 예시 B는 1 내지 20 (10 정상 및 10 폐암)으로 열거된 각각의 시험 된 사람들에 대한 이들 CG IDs (표 3)에 대한 결합된 메틸화 점수를 보여준다. 다형성 점수는 폐암 환자와 정상 조직을 범주별로 구분한다. 도 8의 우측 하단 패널의 예시 C는 8 개의 상이한 종양 (n = 80)을 갖는 사람들로부터의 데이터를 사용하여 특정 종양 기원을 검출하는 CGIDs (표 4)에 대한 메틸화 스코어를 보여준다. 이들 구체 예에서, 마커는 다른 기원의 암과 폐암을 범주적으로 구별한다.
도 9는 TCGA 메틸화 데이터(n = 4166)에서 다른 암에 대한 HCC에 대한 다 유전자 HKG-epiLung- 검출 및 스펙 마커의 정확성 및 특이성의 검증의 예시이다. 도 9의 A는 상이한 암 환자의 DNA 메틸화 데이터를 사용한 HKG-epiLung 검출 / 스펙 마커의 검출 속도를 보여준다. 폐암의 특이성은 주목할 만하다. 도 9의 B는 TCGA로부터의 4166 환자 DNA 메틸화 데이터에서 폐암에 대한 HKG-폐-검출 마커 특이성 및 민감성의 ROC 플롯을 보여준다. 도 9의 C는 폐암 대 다른 기원의 암에 대한 민감성 및 특이성을 보여준다.
도 10은 전립선 암에 대한 다 유전자 DNA 메틸화 마커의 발견의 예시이다. 도 10의 A는 BCD 방법 (표 5)을 사용하여 실시예에 개시된 전립선 암의 검출을 위해 메틸화 데이터가 CGIDs 세트의 발견을 위해 사용된 환자의 공급원 및 수를 나타내는 표이고, 특정 암 조직 기원 (표 6)을 결정하기위한 CGIDs이다. 도 10의 좌측 하단 패널 (검출)의 B는 1 내지 15 (5 개의 정상 및 10 개의 전립선 암)에서 열거된 각각의 시험된 사람들에 대한 이들 CGIDs에 대한 조합된 메틸화 점수 (표 5)를 보여준다. 다형성 점수는 전립선 암 환자와 정상인을 범주별로 구분한다. 도 10의 우측 하단 패널의 C는 8 개의 상이한 종양 (n = 80)을 갖는 사람들로부터의 데이터를 사용하여 특정 기원의 종양 조직을 검출하는 CG에 대한 메틸화 스코어를 나타낸다(표 6). 이들 실시예에서, 마커는 다른 기원의 암과 전립선 암을 범주적으로 구별한다.
도 11은 TCGA 메틸화 데이터에서 전립선 대 다른 암에 대한 다 유전자 HKG-epiProstate- 검출 및 스펙 마커의 정확성 및 특이성의 검증의 예시이다(n = 4166). 도 11의 A는 상이한 암 환자의 DNA 메틸화 데이터를 사용한 HKG-전립선 검출 / 스펙 마커의 검출 속도를 보여준다. 전립선 암의 특이성은 주목할 만하다. 도 11의 B는 TCGA에서 4166 명의 환자로부터 DNA 메틸화 데이터를 사용하여 폐암에 대한 HKG- 전립선-검출 마커 특이성 및 민감성의 ROC 플롯이다. 도 11의 C는 다른 기원으로부터의 전립선 대 암에 대한 민감성 및 특이성을 보여준다.
도 12는 유방암에 대한 다 유전자 DNA 메틸화 마커의 발견의 예시이다. 도 12의 A는 BCD 방법 (표 7)을 사용하는 실시예에 개시된 유방암의 검출을위한 CGs 세트의 발견을 위해 메틸화 데이터가 사용된 환자 및 공급원의 수 및 특정 기원 암(표 8)을 결정하기위한 CGIDs를 나타내는 표이다. 도 12의 좌측 하단 패널 (검출)의 B는 1-27 (17 정상 및 10 유방암)에 열거된 각각의 시험된 사람들에 대한 이들 CGIDs에 대한 조합된 메틸화 점수 (표 7)를 보여준다. 다 유전자 성 점수는 유방암 환자와 정상 유방 조직을 범주별로 구분한다. 도 12의 우측 하단 패널의 C는 8 개의 상이한 종양 (n = 80)을 갖는 사람들로부터의 데이터를 사용하여 종양의 특이적 기원을 검출하는 CGIDs에 대한 메틸화 스코어를 나타낸다(표 8). 이들 실시예에서, 마커는 다른 기원의 암과 유방암을 범주적으로 구별한다.
도 13은 검증 코호트 GSE60185(n = 285)에서 비 침습성 및 침윤성 유방암을 검출하는 HKG-epiBreast- 검출 다 유전자 DNA 메틸화 마커의 예시이다. 도 13의 A는 239 유방암 환자 DNA 메틸화 데이터, 유방암이없는 17 명의 유방 성형 수술 환자 및 29 개의 인접 조직을 사용하여 유방암 다형성 DNA 메틸화 마커에 대한 곡선 아래 면적을 나타내는 ROC 플롯이다. 모든 유방암에 대한 민감도, 특이성 및 정확성은 B에 나열되고 DCIS (관내 암종)의 예측률, 침습성 및 혼합 유방암 샘플이 도 13의 C에 도시되어있다. 유방암 마커는 주목할 만하다. 매우 이른 유방암 (DCIS)조차도 감지한다.
도 14는 TCGA 메틸화 데이터 (n = 4166)에서 유방암 대 다른 암에 대한 다 유전자 HKG-epiBreast-검출 및 스펙 마커의 정확성 및 특이성의 검증의 예시이다. 도 14의 A는 암이 다른 환자의 DNA 메틸화 데이터에서 HKG-epiBreast 검출 / 스펙 마커의 검출 속도를 보여준다. 유방암의 특이성은 주목할 만하다. 도 14의 B는 TCGA에서 4166 명의 환자로부터 DNA 메틸화 데이터를 사용하여 유방암을 검출하기 위한 HKG-유방 검출 마커 특이성 및 민감성의 ROC 플롯이다. 도 14의 C는 다른 기원의 유방 대 암에 대한 민감성 및 특이성을 보여준다.
도 15는 결장 직장암 (CRC)에 대한 다 유전자 DNA 메틸화 마커의 발견의 예시이다. 도 15의 A는 BCD 방법 (표 9)을 사용하여 실시예에 개시된 대장 암의 검출을 위한 CGIDs 세트의 발견을 위해 메틸화 데이터가 사용된 환자의 소스 및 수를 나타낸 표이며, 특정 기원의 암(표 10)을 결정하기 위한 CGIDs이다. 도 15의 좌측 하단 패널(검출)의 B는 1-75 (25 개의 정상 및 50 결장 직장암)로 열거된 각각의 시험된 사람들에 대한 이들 CGIDs에 대한 결합된 메틸화 점수를 보여준다. 다 유전자 성 점수는 암 환자와 정상 조직을 범주별로 구분한다. 도 15의 우측 하단 패널의 C는 8 개의 상이한 종양(n = 80)을 갖는 사람들로부터의 DNA 메틸화 데이터를 사용하여 종양의 특이적 기원을 검출하는 CGIDs에 대한 메틸화 스코어를 나타낸다. 이들 실시예에서, 마커는 다른 기원의 암과 결장 직장암을 범주적으로 구별한다.
도 16은 TCGA DNA 메틸화 데이터 세트 (n = 4166)를 사용하여 다른 암에 대한 CRC에 대한 다 유전자 HKG-epiCRC-검출 및 스펙 마커 정확도 및 특이성의 예시 적 검증이다. 도 16의 A는 상이한 암 환자의 DNA 메틸화 데이터를 사용한 HKG-epiCRC 검출 / 스펙 마커의 검출 속도이다. 대장 암의 특이성은 주목할 만하다. 도 16의 B는 TCGA에서 4166 명의 환자로부터 DNA 메틸화 데이터를 사용하여 대장 암에 대한 HKG-epiColon-검출 마커 특이성 및 민감성의 ROC 플롯이다. 도 16의C는 결장 직장암 대 다른 기원의 암에 대한 민감성 및 특이성을 보여준다.
도 17은 췌장암에 대한 다 유전자 DNA 메틸화 마커의 발견을 예시한다.
도 17의 A는 BCD 방법 (표 11) 및 CGIDs를 사용하여 특정 기원 암을 결정(표 12)하여 본 발명에 개시된 췌장암의 검출을 위해 메틸화 데이터가 CGIDs 세트의 발견에 사용된 환자의 소스 및 수를 열거한 표이다. 도 17의 좌측 하단 패널 (검출)의 B는 1-32 (12 개의 정상 및 20 개의 췌장암)로 열거된 각각의 시험된 사람들에 대한 이들 CGIDs에 대한 조합된 메틸화 점수 (표 11)를 보여준다. 다원성 점수는 췌장암 환자와 정상 조직을 범주별로 구분한다. 도 17의 우측 하단 패널의 C는 10 개의 상이한 종양 (표 12)을 갖는 사람들 (n = 100)의 데이터를 사용하여 종양의 특이적 기원을 검출하는 CGIDs에 대한 메틸화 스코어를 나타낸다. 이들 실시예에서, 마커는 다른 기원의 암과 췌장암을 범주적으로 구별한다.
도 18은 TCGA 메틸화 데이터 (n = 4854)에서 췌장암에 대한 다 유전자 HKG-epiPancreas-검출 및 스펙 마커의 정확성 및 특이성을 입증하는 도면이다. 도 18의 A는 상이한 암 환자에서 DNA 메틸화 데이터를 사용한 HKG-epiPancreas 검출 / 스펙 마커의 검출 속도이다. 췌장암의 특이성은 주목할 만하다. 도 18의 B는 TCGA에서 4854 명의 환자에 대한 DNA 메틸화 데이터를 사용하여 췌장암에 대한 HKG-epiPancreas 검출 마커 특이성 및 민감성의 ROC 플롯이다. C는 췌장암 대 다른 기원의 암에 대한 민감성 및 특이성이다.
도 19는 뇌암 (교모세포종)에 대한 다 유전자 DNA 메틸화 마커의 발견의 예시이다.
도 19의 A는 암의 특정 기원을 결정하기 위해 BCD 방법 (표 13) 및 CGID를 사용하여 (표 13) 본 발명에 개시된 뇌암 검출을 위한 메틸화 데이터가 CGID 세트의 발견에 사용된 환자의 소스 및 수를 열거한 표이다. 왼쪽 하단 패널 (검출 / 스펙)의 B는 1-16 (6 정상 및 10 뇌암)으로 나열된 각 테스트된 사람들에 대해 이러한 CGIDs에 대한 결합된 메틸화 점수 (표 13)를 보여준다. 다 유전자 점수는 뇌암, 110 개의 다른 암, 정상 조직을 가진 사람들을 범주적으로 구분한다.
도 20은 TCGA 메틸화 데이터 (n = 4854)에서 유방암 대 다른 암에 대한 다 유전자 HKG-epiBrain-검출 및 스펙 마커 정확도 및 특이성의 검증의 예시이다. A는 상이한 암 환자의 DNA 메틸화 데이터를 사용한 HKG-epiBrain 검출 / 스펙 마커의 검출 속도이다. 뇌암의 특이성에 주목한다. B는 TCGA에서 4854 명의 환자로부터 DNA 메틸화 데이터를 사용하여 뇌암에 대한 HKG-epiBrain-검출 마커의 특이성 및 민감성의 ROC 플롯이다. C는 TCGA 데이터 세트에서 뇌암에 대한 민감성 및 특이성을 나타낸다(n = 695).
도 21은 암의 특정 기원을 결정하기 위해 BCD 방법 (표 14) 및 CGIDs를 사용하여 (표 15) 위암의 검출을 위한 다 유전자 DNA 메틸화 마커의 발견을 나타낸 것이다. A는 본 발명에 개시된 위암의 검출을 위해 메틸화 데이터가 일련의 CGIDs의 발견에 사용 된 환자의 소스 및 수를 열거한 표이다. 도 21의 좌측 하단 패널 (검출)의 예시 B는 1-28 (14 정상 및 20 위암)로 나열된 각각의 시험된 사람들에 대한 이들 CGIDs에 대한 조합된 메틸화 점수 (표 14)를 보여준다. 다 유전자 성 점수는 위암 환자와 정상 조직을 범주별로 구분한다. 도 21(스펙)의 우측 하단 패널의 C는 10 개의 상이한 종양 (n = 100)을 갖는 사람들에 대한 다 유전자 메틸화 점수를 보여준다. 이들 실시예에서, 마커는 다른 기원의 암과 위암을 범주적으로 구별한다.
도 22는 TCGA 메틸화 데이터 (n = 4817)에서 위암에 대한 다 유전자성 HKG- 위-검출 및 스펙 마커의 정확성 및 특이성을 검증한 도면이다. A는 상이한 암 환자의 DNA 메틸화 데이터를 사용한 HKG-epiStomach 검출 / 스펙 마커의 검출 속도이다. 위암에 대한 특이성은 주목할만하다. B는 TCGA에서 4420 명의 환자로부터 DNA 메틸화 데이터를 사용하여 위(위암)에 대한 HKG-epiStomach-검출 스펙 1 마커의 ROC 플롯 특이성 및 감도이다. C는 TCGA에서 4854 명의 환자로부터 DNA 메틸화 데이터를 사용하여 위암에 대한 HKG-epiStomach -스펙 1 마커의 특이성 및 감도의 ROC 플롯이다. 주목할 점은 공유된 기원을 입증하는 결장 직장암 및 식도암과의 유의한 교차 반응성이 있다는 점이다.
도 23은 난소 암에 대한 다 유전자 DNA 메틸화 마커의 발견의 예시이다.
A는 BCD 방법 (표 16) 및 CGID를 사용하여 특정 기원 암을 결정하여(표 17) 본 발명에 개시된 난소 암의 검출을위한 메틸화 데이터가 CGIDs 세트의 발견에 사용 된 환자의 소스 및 수를 열거 한 표이다.
도 23의 좌측 하단 패널 (검출)의 B는 1 내지 15 (5 정상 및 10 난소 암)로 열거된 각각의 시험된 사람들에 대한 이들 CGIDs에 대한 결합된 메틸화 점수를 보여준다. 다 유전성 점수는 난소 암 환자와 정상 조직을 범주별로 구분한다. 도 23의 우측 하단 패널의 C는 11 개의 상이한 종양을 갖는 사람들로부터의 데이터를 사용하여 특정 종양 기원(n = 110)을 검출하는 CGIDs에 대한 메틸화 스코어를 나타낸다. 이들 실시예에서, 마커는 다른 기원의 암과 난소 암을 범주적으로 구별한다.
도 24는 TCGA 메틸화 데이터 (n = 6522)에서 자궁 경부암 대 다른 암에 대한 다 유전자 HKG-epiOvarian-검출 및 스펙 마커의 정확성 및 특이성을 입증하는 도면이다. A는 상이한 암 환자의 DNA 메틸화 데이터를 사용한 HKG-epiOvarian 검출 / 스펙 마커의 검출 속도이다. 난소 암의 특이성을 주목할만하다. B는 TCGA에서 4723 명의 환자로부터의 DNA 메틸화 데이터에 대한 난소 암에 대한 HKG-epiOvarian-검출 및 스펙 마커의 ROC 플롯 특이성 및 감도이다. C는 난소 암에 대한 민감성과 특이성을 보여준다.
도 25는 자궁 경부암에 대한 다 유전자 DNA 메틸화 마커의 발견의 예시이다.
A는 BCD 방법 (표 18) 및 CG를 사용하여 특이적 기원 암을 결정하며(표 19) 본 발명에 개시된 자궁 경부암의 검출을 위해 메틸화 데이터가 CGIDs 세트의 발견에 사용된 환자의 소스 및 수를 열거한 표이다. 도 25의 좌측 하단 패널(검출)의 B는 1 내지 30 (20 정상 및 10 난소암)으로 열거된 각각의 시험된 사람들에 대한 이들 CGIDs에 대한 조합된 메틸화 점수(표 18)를 보여준다. 다 유전자성 점수는 자궁 경부암과 정상 조직을 범주적으로 구분한다. 도 25의 우측 하단 패널의 C는 8 개의 상이한 종양(n = 80)을 갖는 사람들로부터의 데이터를 사용하여 종양의 특이적 기원(표 19)을 검출하는 CG IDs에 대한 메틸화 스코어를 나타낸다. 이들 실시예에서, 마커는 다른 기원으로부터의 암과 자궁 경부암을 범주적으로 구별하지만, 대장 암의 일부 측정 가능한 검출에 주목한다.
도 26은 TCGA 메틸화 데이터 (n = 6522)에서 자궁 경부 대 다른 암에 대한 다 유전자 HKG-Cervix-검출 및 스펙 마커 정확도 및 특이성의 검증의 예시이다. A는 암이 다른 환자의 DNA 메틸화 데이터를 사용한 HKG-Cervix 검출 / 스펙 마커의 검출 속도를 보여준다. 자궁 경부암의 특이성은 주목할 만하다. B는 TCGA에서 4420 명의 환자로부터의 DNA 메틸화 데이터를 사용하여 자궁 경부암에 대한 HKG-Cervix-검출 스펙 마커의 특이성 및 민감성의 ROC 플롯이다. C는 자궁 경부암에 대한 민감성과 특이성을 보여준다.
도 27은 HNSC (Head and Neck squamous cell Carcinoma)에 대한 다 유전자 DNA 메틸화 마커의 발견을 나타낸 것이다. 도 A는 BCD 방법 (표 20) 및 CGs를 특이 적 기원 암(표 21)을 결정하는 것을 사용하여 본 발명에 개시된 HNSC의 검출을 위한 CG IDs 세트의 발견을 위해 메틸화 데이터를 사용한 환자의 소스 및 수를 나타낸 표이다. 도 27의 좌측 하단 패널의 B는 1-140 (10 개의 암, 10 개의 정상 및 120 개의 다른 암)으로 열거된 각각의 시험된 사람들에 대한 이들 CG IDs (표 20)에 대한 결합된 메틸화 점수를 보여준다. C는 실시예에서 HNSC와 정상 조직 샘플을 범주 적으로 구별할 뿐만 아니라 다른 기원의 암과 HNSC를 범주적으로 구별하는 다형성 스코어를 보여준다.
도 28은 TCGA 메틸화 데이터(n = 4166)에서 다른 암에 대한 HNSC에 대한 다 유전자 HKG-epiHNSC- 검출 / 스펙 마커의 정확성 및 특이성을 검증한 도면이다.
A는 상이한 암 환자의 DNA 메틸화 데이터를 사용한 HKG-epiHNSC 검출 / 스펙 마커의 검출 속도이다. 주목할 것은 HNSC에 대한 특이성이다. B는 TCGA에서 4166 명의 환자로부터의 DNA 메틸화 데이터에 대한 HNSC에 대한 HKG-epiHNSC- 검출 마커의 특이성 및 민감성의 ROC 플롯이다. C는 다른 기원의 암에 대한 HNSC의 민감도와 특이성을 보여준다.
도 29는 식도암에 대한 다 유전자 DNA 메틸화 마커의 발견의 예시이다.
A는 암의 특정 기원 (표 23)을 결정하기 위해 BCD 방법 (표 22) 및 CGIDs를 사용하여 실시예에 개시된 식도암의 검출을 위한 메틸화 데이터가 일련의 CGIDs의 발견에 사용된 환자의 소스 및 수를 열거한 표이다. 도 29의 좌측 하단 패널의 B는 1-15 (6 정상, 10 암)로 열거된 각각의 시험된 사람들에 대한 이들 CGIDs에 대한 조합된 메틸화 점수(표 22)를 보여준다. C는 실시예에서 식도암과 정상 조직 사이에서 범주적으로 차별화되는 다 유전자 성 점수를 나타내며 1-220 (20 개 암, 190 개 다른 암 및 10 개의 건강한 혈액)으로 열거된 다른 기원의 암과 식도암 사이를 범주적으로 구별한다.
도 30은 TCGA 메틸화 데이터 (n = 7102)에서 식도암 대 다른 암에 대한 다 유전자 HKG-epiEsophageal- 검출 / 스펙 마커 정확도 및 특이성의 검증의 예시이다. A는 암이 다른 환자의 DNA 메틸화 데이터를 사용한 HKG-epiEsophageal 검출 / 스펙 마커의 탐지 속도를 보여준다. 식도암의 특이성은 주목할 만하다. B는 TCGA의 4166 환자 DNA 메틸화 데이터에서 HNSC에 대한 HKG-epiEsophageal-검출 마커의 특이성과 감도의 ROC 플롯이다. C는 식도암 대 다른 기원의 암에 대한 감수성과 특이성을 보여준다.
도 31은 방광암에 대한 다 유전자 DNA 메틸화 마커의 검출을 나타낸 것이다. A는 암의 특정 기원(표 25)을 결정하기 위해 BCD 방법 (표 24) 및 CGIDs를 사용하여 실시예에 개시된 방광암의 검출을 위해 메틸화 데이터가 일련의 CGIDs의 발견에 사용된 환자 및 공급원의 수를 열거한 표이다. 도 31의 좌측 하단 패널 (검출)의 B는 1 내지 15 (5 개의 정상 및 10 개의 방광암)에 열거된 각각의 시험된 사람들에 대한 이들 CGIDs에 대한 조합된 메틸화 점수 (표 24)를 보여준다. 도 31의 우측 하단 패널의 C는 13 개의 상이한 종양 (n = 130)을 갖는 사람들로부터의 데이터를 사용하여 종양의 특이적 기원을 검출하는 CGIDs (표 25)에 대한 메틸화 스코어를 보여준다. 이들 실시예에서, 마커는 다른 기원의 암과 방광암을 구별한다. 이들 마커를 사용하여 결장 직장암을 측정할 수 있는 것도 주목할 만하다.
도 32는 TCGA에서 방광암 대 다른 암에 대한 폴리 유전자 HKG-epiBladder- 검출 및 스펙 마커의 정확성 및 특이성의 검증의 예시이다(n = 4723). A는 암 (A)과 방광암 (B)이 다른 환자의 DNA 메틸화 데이터에서 HKG-epiBladder 스펙 (A)의 검출률과 마커 (B)를 보여준다. C는 TCGA에서 4420 명의 환자로부터 DNA 메틸화 데이터를 사용하여 방광암에 대한 HKG-epiBladder 스펙 마커의 특이성 및 민감성의 ROC 플롯이다. D는 방광암에 대한 HKG-epiBladder 탐지 마커의 특이성과 감도에 대한 ROC 플롯이다(n = 440).
도 33은 신장 암에 대한 다 유전자 DNA 메틸화 마커의 발견의 예시이다. A는 BCD (hypo) 방법을 사용하여 실시예에 개시된 신장 암의 검출을위한 CGIDs 세트의 발견 및 암의 특이적 기원(표 26)을 결정하기 위해 메틸화 데이터가 사용된 환자의 소스 및 수를 열거한 표이다. 도 33의 좌측 하단 패널 (검출 / 스펙)의 B는 1-226 (180 개의 다른 암, 10 개의 건강한 혈액, 6 개의 정상 신장, 30 신장 암)으로 나열된 각각의 시험된 사람들에 대한 이들 CGIDs에 대한 결합 된 메틸화 점수(표 26)를 보여준다. 이들 실시예에서, 다형성 스코어는 신장 암, 다른 암 및 정상 혈액을 범주 적으로 구별한다.
도 34는 TCGA DNA 메틸화 데이터(n = 7102)를 사용하여 다른 암 및 정상 조직에 대한 신장 암에 대한 다 유전자 HKG-epiKidney-검출 및 스펙 마커의 정확성 및 특이성의 검증의 예시이다. A는 상이한 암으로부터의 DNA 메틸화 데이터를 사용한 HKG-epiKidney 검출 / 스펙 마커의 검출 속도이다. 신장 암의 특이성은 주목할 만하다. B는 TCGA에서 6367 개의 암으로부터의 DNA 메틸화 데이터를 사용하여 신장 암에 대한 HKG-Cervix-검출 스펙 마커의 특이성 및 민감성의 ROC 플롯이다. C는 신장(콩팥) 암에 대한 민감성 및 특이성이다. 추가로 주목할 것은 뇌, HCC 및 고환암과의 교차이다.
도 35는 고환암에 대한 다 유전자 DNA 메틸화 마커의 발견을 나타낸 것이다. A는 BCD(hypo) 방법을 사용하여 실시예에서 개시된 고환암의 검출을위한 CGIDs 세트의 발견 및 특정 기원의 암(표 27)을 결정하기 위해 메틸화 데이터를 사용한 환자의 소스 및 수를 열거한 표이다. 도 35의 좌측 하단 패널 (검출 / 스펙)의 B는 1-226 (10 개의 고환암, 180 개의 다른 암, 10 개의 정상 피)으로 나열된 각각의 시험 된 사람들에 대한 이들 CG IDs (표 27)에 대한 결합된 메틸화 점수를 보여준다. 이들 실시예에서, 다 유전자 성 점수는 고환암과 정상 혈액 및 다른 암을 범주적으로 구별한다.
도 36은 TCGA 메틸화 데이터 (n = 7102)에서 고환암 대 다른 정상 조직 및 암에 대한 다 유전자 HKG-epiTestis- 검출 및 스펙 마커의 정확성 및 특이성의 검증의 예시이다. A는 암이 다른 환자의 DNA 메틸화 데이터를 사용한 HKG-epiTesstis 검출 / 스펙 마커의 검출 속도를 보여준다. 고환암의 특이성은 주목할 만하다. B는 TCGA에서 6367 명의 환자로부터의 DNA 메틸화 데이터를 사용하여 고환암에 대한 HKG-epiTestis-검출 스펙 마커의 특이성 및 감도의 ROC 플롯이다. C는 고환암에 대한 민감성 및 특이성이다.
도 37은 13 개의 일반적인 암에 대한 팬(Pan) 암 다 유전자 DNA 메틸화 마커의 발견을 나타낸 것이다. A는 BCD 방법 (표 28)을 사용하여 실시예에 개시된 13 개의 일반적인 암 (표 28) (방광암, 뇌암, 유방암, 자궁 경부암, 결장 직장암 CRC, 식도암, 간암, 폐암. 난소 암, 췌장암, 전립선 암 및 위암)의 검출을위한 CGIDs 세트의 발견을 위해 메틸화 데이터를 사용한 환자의 소스 및 수를 열거한 표이다. B는 1-310 (180 명의 암과 10 명의 정상)으로 나열된 시험 대상자 각각에 대해 이들 CGIDs에 대한 결합된 메틸화 점수를 보여준다. 이들 실시예에서, 다 유전자성 점수는 암과 정상 조직을 구별한다.
도 38은 TCGA 메틸화 데이터(n = 7102)에서 다 유전자 HKG epiPancancer마커의 정확성 및 특이성을 검증한 도면이다. A는 TGCA 데이터를 사용하여 13 가지 다른 암 환자에서 epiPancancer 다 유전자 DNA 메틸화 마커를 사용하여 계산한 메틸화 점수를 보여준다. B는 TCGA에서 4878 명의 환자로부터의 모든 암에 대한 DNA 메틸화 데이터를 사용한 HKG-epiPancancer 검출 및 스펙 마커의 특이성 및 감도의 ROC 플롯이다. C는 13 개의 일반적인 암의 검출을 위한 특이성 및 민감성을 기술하는 epiPancancer 다형성 마커의 ROC 플롯이다. D는 암을 검출하기 위한 팬(Pan) 암마커의 전반적인 감도 및 특이성을 보여준다. 이들 실시예에서, 하나 이상의 색, 예를 들어 주황색 (가중 메틸화 점수) 및 청색이 사용된다(샘플 당 하나의 BCD 마커의 검출은 양성 암으로 평가됨).
도 39는 흑색 종에 대한 다 유전자 DNA 메틸화 마커의 발견의 예시이다. A는 BCD 방법(표 45)을 사용하는 실시예에 개시된 흑색 종의 검출을 위한 CGIDs 세트 (표 45)의 발견을 위해 메틸화 데이터를 사용한 환자의 소스 및 수를 열거한 표이다. B는 1-220 명 (기타 암 및 정상 혈액) 및 흑색 종 환자 10 명으로 나열된 각 피검사자에 대한 이들 CGIDs의 총 메틸화 점수이다. 이들 실시예에서, 다 유전자 성 점수는 흑색 종, 다른 암 및 정상 조직을 구별한다.
도 40은 TCGA 메틸화 데이터 (n = 7102)에서 흑색 종 대 다른 정상 조직 및 암에 대한 다형성 HKG-epiMelanoma 검출 및 스펙 마커의 정확성 및 특이성의 검증의 예시이다. A는 암이 다른 환자의 DNA 메틸화 데이터를 사용한 HKG-epiMelanoma 검출 / 스펙 마커의 검출 속도를 보여준다. 흑색 종에 대한 특이성이 주목된다(간암 뇌 및 암 및 전립선 암의 중복 검출). B는 TCGA에서 6367 명의 환자로부터 DNA 메틸화 데이터를 사용하여 흑색 종에 대한 HKG-흑색 종-검출 스펙 마커의 특이성 및 민감성의 ROC 플롯이다. C는 흑색 종에 대한 민감도와 특이성을 보여준다.
도 41은 혈액 암에 대한 다 유전자 DNA 메틸화 마커의 발견 (Acute Myeloid Leukemia (AML))의 발견을 나타낸 것이다. A는 메틸화 데이터가 검출을 위한 CGIDs 세트의 발견에 사용된 환자의 소스 및 수를 열거한 표이다. BCD 방법 (표 46)을 사용한 실시예는 혈액 암 AML (표 46)의 실시예를 개시하였다. B는 1-10 (정상 혈액) 및 AML 환자 10 명으로부터 열거된 각각의 시험된 사람들에 대한 이들 CGIDs에 대한 결합된 메틸화 점수이다. 이들 실시예에서, 다 유전자 성 점수는 AML과 정상 혈액을 구별한다.
도 42는 GSE86479 (n = 79) 및 TCGA (n-140) 및 GSE40279 및 GSE61496 (n= 968)에서 정상 혈액에 대한 AML에 대한 다 유전자HKG-epiAML- 검출 및 스펙 마커의 정확성 및 특이성의 검증의 예시이다. A는 AML 및 건강한 혈액을 가진 환자로부터의 DNA 메틸화 데이터를 사용한 HKG-epiAML 검출/스펙 마커의 검출 속도를 보여준다. 흑색 종에 대한 특이성이 주목된다(간암 뇌 및 암 및 전립선 암의 중복 검출). B는 GSE86409 (n = 79), TCGA (n-140) GSE40279 및 GSE61496 (n = 968)의 DNA 메틸화 데이터를 사용하여 AML에 대한 HKG-AML-검출 스펙 마커의 특이성 및 감도의 ROC 플롯이다. C는 AML에 대한 민감도와 특이성을 보여준다.
도 43은 상이한 암을 검출하기 위해 선택된 프라이머가 정상인으로부터 유래된 혈장에서 BCD 특성 ~ 0 메틸화를 나타내는 검증의 예시이다(각 샘플은 정상 환자로부터의 혈장의 혼합물임). 특이적 CGs를 표적화하는 제1 PCR1 반응은 서열 표적화 된 프라이머를 사용하여 수행하였다. 제2 PCR 후, 증폭된 단편을 정제하고 차세대 시퀀싱을 수행하였다. 지시된 각 CG ID 위치에서 DNA 메틸화를 정량화하였다.
도 44는 상이한 암을 검출하기 위해 선택된 지시된 프라이머가 정상 사람들로부터 유래된 혈장에서 BCD 특성 ~ 0 메틸화를 나타내는 검증의 예시이다(각 샘플은 정상 환자로부터의 혈장의 혼합물임).
도 45는 다중 증폭 및 서열 분석을 위한 프라이머 디자인의 예시이다. 제1 PCR 반응은 관심있는 특정 영역을 표적으로 한다. PCR1 프라이머는 제2 PCR2 프라이머에 상보적인 서열을 가진다. 제2프라이머 세트는 각각의 환자 및 역방향 및 정방향 시퀀싱 프라이머에 대한 인덱스를 도입한다.
도 46은 전립선 암을 검출하기위한 PCR 조건의 최적화의 예시이다. 전립선 암 HIF3A 232 bp, TPM4 213 bp, 및 CTTN 199 bp의 3 가지 마커에 대해 지시된 DNA로서 다양한 프라이머 농도를 사용한 다중 PCR1 반응이 오른쪽 패널에 표시된다.
도 47은 DNA 메틸화 수준을 결정하기 위한 생물 정보학 워크 플로우의 예시이다.
PCR2 생성물을 조합, 정량 및 정제하고 Miseq Illumina 시퀀서상에서 차세대 시퀀싱을 수행한다. 시퀀스가 역 다중화되고 각 환자에 대해 FASTQ 파일이 생성되고 체계에 표시된 워크 플로로 분석된다. DNA 메틸화 점수는 각 환자에 대해 계산된다.

도면의 모든 예시는 선택된 실시예를 설명하기 위한 것이며 청구된 주제의 범위를 제한하려는 것은 아니다.

실시예 1. 정상 조직 및 혈액 DNA에서 수백 명의 개인에 걸쳐 범주화되지 않은 메틸화 CGIDs 발견

종양에서 유래하는 세포 유리 DNA는 혈장, 소변 및 대변과 같은 체액에서 발견되는 것으로 알려져 있다. 또한 CF 종양 DNA의 DNA 메틸화 프로파일은 종양 DNA와 유사하다는 것이 확립되었다(Dominguez-Vigil et al., 2018). 방대한 양의 데이터는 종양 DNA가 정상 조직과 비교하여 차등적으로 메틸화된다는 것을 확립했다(Luczak & Jagodzinski, 2006). 따라서, 많은 그룹은 암과 그것의 정상 기원 조직, 예를 들어 간암 대 인접 간 조직 사이에서 차별적으로 메틸화된 DNA에서의 로지스틱 회귀(logistic regressions) CGID 위치(Illumina 450K매니페스트에서 CG ID)에 의해 묘사하려 시도했다. 그러나, 이들 방법은 범주적 정성적 차이보다는 암과 형질 전환되지 않은 조직 사이의 정량적 차이를 측정하기 때문에, 종양과 정상 조직 사이의 이러한 정량적 차이는 정상 조직으로부터 CF DNA에 의해 희석되고 소거될 수 있으며, 이는 잘못된 음성 및 감도 감소를 초래한다. 또한, 분석에 포함되지 않은 다른 조직은 종양 DNA와 유사한 DNA 메틸화 프로파일을 가질 수 있으며, 대부분의 연구는 종양 DNA를 변형되지 않은 대응물과 비교하고 다른 조직과 비교하지 않기 때문에 거짓 양성(false positive)으로 이어질 수 있다. 다른 조직에서 다양하고 예측할 수 없는 양의 DNA가 CF DNA에서 발견되었으며 (Breitbach et al., 2014), 측정된 DNA 메틸화는 다른 출처와 종양 DNA에서 알려지지 않은 예측할 수 없는 조직 DNA의 혼합물을 반영한다. 수천 개의 종양 샘플에 Illumina 450K 어레이를 사용하여 게놈 전체 DNA 메틸화 분석을 실시하였고 공개 도메인 (TCGA)에서 발견되었다. 많은 정상 조직 및 암 조직의 메틸화 프로파일을 조사한 결과, 본 발명자들은 모든 정상 조직에서 완전히 메틸화되지 않았지만 종양으로부터 DNA에서 메틸화되는 게놈에 상당한 CG 그룹이 있음을 발견하였다. 이들 부위의 부분 집합은 DNA 메틸화가 공개 영역에서 프로파일링 된 수많은 개체에 걸쳐 메틸화되지 않았다. 본 발명자들은 또한 많은 암에서 이들 강력하게 메틸화되지 않은 부위가 암에서 메틸화되는 것을 발견했다. 따라서, 종양 DNA와 혈액에서 발견될 수 있는 다른 모든 DNA 사이에 질적 "범주 적 차이"를 생성한다. 깊은(deep) 차세대 시퀀싱을 사용하면 메틸화되지 않은 카피의 배경에서 메틸화된 분자조차 거의 식별할 수 없다.

데이터베이스; Illumina 450K DNA 메틸화 데이터

우리는 유전자 발현 옴니버스(GEO) https://www.ncbi.nlm.nih.gov/geo/ 또는 암 게놈 Atlas TCGA https :// cancergenome .nih. gov / 공개 데이터베이스에 기탁된 다수의 개체로부터 인간 게놈에 걸쳐 ~ 450,000 CG에 대해 표준화된 메틸화 베타 값의 메틸화의 공개된 데이터베이스를 사용하였다. 우리는 다음과 같은 데이터베이스를 사용하여 많은 정상 조직 및 혈액 DNA에서 강력하게 메틸화되지 않은 CG IDs 목록을 도출했다 : GSE50192, GSE50192, GSE40279.

백혈구의 DNA는 혈장에서 CF DNA의 주요 공급원 중 하나이다. 본 발명자들은 먼저 GSE50192의 Illumina 450K 데이터 및 Excel의 논리적 COUNTIF 및 IF 기능을 사용하여 17 개의 상이한 체적 인간 조직에서 모든 개체에서 메틸화되지 않은 47981 CGIDS의 목록을 생성하였다 :

NmCGID_x=COUNTIF (betaCGID_xn₁:n_i,">0.1")

umCGID_x=IF(NmCGID_x=0, TRUE, FALSE)

NmCGIDx=CGIDx 가 메틸화된 정상 대상체의 수

umCGIDx=모든 대상체에서 메틸화되지 않은CGIDx

betaCGIDx= 주어진CGIDx 메틸화 수치

x= Illumina 450k 어레이의 모든 GID

n₁=어레이의 첫번째 대상,

n_i=어레이의 마지막 대상.

이어서, 본 발명자들은 동일한 기준을 사용하여 312 명의 개체로부터 혈액 DNA 중 68260 개의 메틸화되지 않은 CGIDs (UMCGIDs)의 목록을 생성하였다. 다음, 본 발명자들은 47981 및 68260 CG IDS 목록과 겹치고 모든 개인에 걸쳐 혈액 및 체세포 조직에서 메틸화되지 않은 33477 CG IDs 목록을 획득하였다 (도 1A). 이 메틸화되지 않은 CG IDs 리스트의 견고성을 증가시키기 위해, 본 발명자들은 19 내지 101 세 (GSE40279)의 656 명의 개인 남성 및 여성으로부터의 Illumina 450K 어레이의 전혈 DNA의 60,379 CG IDs의 메틸화되지 않은 CGIDs의 리스트를 설명 하였다. 이들은 혈액에서 수백 명의 개인에 대해 성별과 연령에 독립적으로 강력하게 메틸화되지 않은 부위이다. 이 60,379 CG IDs 목록은 체조직과 혈액 모두에서 메틸화되지 않은 33,477 CG IDs 목록과 겹쳐져 암에 대한 범주적 메틸화 마커 발견에 사용된 28,754 CG IDs의 최종 목록을 생성한다. 이 목록에는 조직과 개인간에 강력하게 메틸화되지 않은 CG ID 위치가 포함된다.

암과 정상 조직간에 범주적으로 다른 DNA 메틸화 위치를 확인하기 위해, 본 발명자들은 이들 28754 CG IDs 중 어느 것이 다른 암에서 메틸화되었는지를 조사 하였다. 본 발명자들은 종양 DNA 메틸화 데이터를 조사한 후 이들 28754 CG IDs의 부분 집합의 메틸화가 개별 환자의 종양 DNA에서 일반적이라는 것을 알았다. 그러나, 모든 개인이 메틸화된 동일한 위치를 갖는 것은 아니다. 따라서, 높은 특이성을 갖는 암을 검출하기 위해 CG IDs의 조합이 요구된다. 따라서, 본 발명자들은 암 검출을위한 CG IDs의 다 유전자 조합을 발견하였다.

본 발명자들은 TCGA 또는 GEO의 공개 도메인으로부터 10 내지 50 개의 DNA 메틸화 프로파일을 "발견 세트"로서 사용하여, 메틸화 상태가 종양과 정상 조직 사이에서 "범주적으로" 상이한 다 유전자 세트의 CGIDs를 발견하여 가장 높은 민감성 및 특이성을 가진 암을 검출할 수 있었다. 이어서, 이들 CGIDs를 실시예 2에 개시된 바와 같이 암을 검출하기 위한 다 유전자 DNA 메틸화 마커의 민감성 및 특이성을 검증하기 위해 "유효성 세트"로서 수백 개의 TCGA 및 GEO 종양 DNA 메틸화 어레이 데이터에 대해 시험하였다.

실시예 2 : 세포 유리 DNA에서 암을 검출하기 위한 이진-범주형 분화(BCD) 방법.

인간 게놈에 걸쳐 ~ 450,000 CGs (CG IDs)에 대한 메틸화의 표준화된 베타 값의 하기의 공개적으로 이용 가능한 데이터베이스를 사용하여 암 특이적 DNA 메틸화 마커의 목록을 도출하였다 :

BCD 방법

다음은 다른 암의 조기 예측을위한 다 유전자 DNA 메틸화 마커를 발견하기 위해 본 발명자들이 발명 한 이진 범주 형 분화 방법 (BCD)의 단계이다.

우리는 정상 조직에서 강력하게 메틸화되지 않은 28,754 개의 CGID를 필터링했다. 발견 코호트의 경우 정상 조직에서 강력하게 메틸화되지 않은 28,754 CG IDs, 특정 암에서 범주 적으로 메틸화되고 영향을받지 않은 조직 및 정상 조직에서 메틸화되지 않는 CG IDs 목록에서 Microsoft Excel의 COUNTIF 및 IF 기능을 사용하여 설명했다.

NmcCGIDx=COUNTIF (betaCGIDxCancer n₁:n_i,">0.2")

NmnCGIDx=COUNTIF (betaCGIDxNormal n₁:n_i,">0.1")

DMCGIDx= IF((AND(NmcCGIDx>0, NmnCGIDx=0)),"TRUE", "FALSE")

DM CGIDx 는 가장 높은 번호에서 가장 낮은 번호로 정렬되었다.

최고 20개의 TRUE DM CGIDx 위치가 선택되었다.

NmcCGID_x=메틸화된 CGIDx 를 가진 암환자의 수

Nmn= 메틸화 된 CGIDx가있는 정상 인접 또는 유사한 조직 샘플의 수

betaCGIDx= CGIDx 의 메틸화 수준

n= 1 에서 i 까지의 환자

DM=차등 메틸화된CGIDx

본 발명자들은 고환암 및 신장 암이 모든 조직에서 고도로 메틸화되는 CG IDs에서 메틸화의 만연 적 결여를 나타냄을 발견했다. 따라서 우리는 BCD 방법의 수정을 사용하여 "BCDhypo"라고하는 고환암 및 신장 (신장) 암에 대해 차등 적으로 메틸화 된 CG IDs 위치를 발견했다. 암에서는 메틸화되지 않고 정상 조직에서는 메틸화된다. 다음 단계는 고환암 및 신장 암에서 차별적으로 저 메틸화 된 CGIDs 위치를 발견하는 데 사용되었다.

발견 코호트를 위해 우리는 Excel의 COUNTIF 및 IF 기능을 사용하여 정상 조직에서 완전히 메틸화되는 고환 또는 신장의 저 메틸화 CGIDs를 설명했다.

NucCGIDx=COUNTIF (betaCGIDxCancer n₁:n_i,"<0.2")

NunCGIDx=COUNTIF (betaCGIDxNormal n₁:n_i,"<0.9")

DHMCGIDx= IF((AND(NucCGIDx>0, NunCGIDx=0)),"TRUE", "FALSE")

DHM CGID 위치는 가장 높은 번호에서 가장 낮은 번호로 정렬되었다.

20개의 상위TRUE DHM 사이트가 선택되어 페널티 회귀 분석을 받았다.

NucCGIDx= 메틸화되지 않은 CGID X를 가진 암 환자의 수

NunCGIDx= 메틸화되지 않은 CGID X가있는 정상 조직 샘플의 수

n= 1에서 i까지의 환자

DHM= 차등 저 메틸화 된 CGID

그런 다음 본 발명자들은 최고 민감도와 특이도에서 암을 예측하는 CGIDx의 최소 조합을 묘사하기 위해 R에서 페널티를받은 패키지를 사용하여 상위 20 개의 DM (또는 DHM) CGIDx에 페널티 회귀를 수행했다. CGIDx의 다 유전자 조합은 다변량 선형 회귀 방정식에서 추가로 테스트되어 다 유전자 조합에서 이러한 CGIDs의 메틸화 수준과 암 사이의 회귀 계수를 결정했다. 이 모델은 전형적인 암에 대한 각 환자의 메틸화 점수를 계산하는 데 사용되었다.

Ms=α+

Νs=메탈화 점수, α=절편, β_i=CG ID_i 계수, CG_i=methylation level per CG 당 메틸화 수준 조합. 1 내지 i=조합된 CGs 수.

실시예 3. 간암 (HCC)에 대한 다 유전자 DNA 메틸화 마커의 발견.

본 발명자들은 GSE61258 (정상 간)의 정규화 된 Illumina 450K DNA 메틸화 데이터와 HCC DNA 메틸화 데이터의 TCGA HCC 컬렉션에서 무작위로 선택된 66 개 샘플을 "훈련"코호트로 사용했다. 본 발명자들은 실시 예 1에서 정상 조직 및 혈액 샘플에 걸쳐 강하게 메틸화되지 않은 부위로서 발견 된 "훈련 코호트"데이터 세트 28754 CGIDx에 처음으로 후보에 올랐다. 이어서 본 발명자들은 훈련 코호트에서 높은 민감도와 특이성을 갖는 HCC를 검출하는 이원 범주 형 차등 메틸화 CGIDs의 폴리 유전자 세트를 발견하기 위해 실시 예 2에 기술 된 BCD 방법을 사용 하였다 (도 5B, 표 1) (검출). 가중 DNA 메틸화 점수 및 암에 대한 역치는 실시 예 2에 기술 된 바와 같이 CGIDs에 대해 개발되었다. 그 후 본 발명자들은 8 개의 상이한 종양 유형을 나타내는 TCGA로부터 무작위로 선택된 80 개의 DNA 메틸화 샘플로부터 "훈련 코호트"를 생성하였다. 본 발명자들은이 훈련 코호트를 사용하여 HCC와 다른 종양 사이에 차별적으로 메틸화 된 CGIDs의 다 유전자 세트를 발견했다 (도 5C, 표 2) (사양). 실시 예 2에 기재된 바와 같이 CGIDs에 대해 가중 DNA 메틸화 점수가 개발되었다.

실시예 4. HCC를 검출하기 위한 HCC 다 유전자 DNA 메틸화 마커의 유용성.

본 발명자들은 가중 HCC DNA 메틸화 점수가 표 1의 CGID에 대해 227 명의 HCC 환자에 대한 GSE76269의 정규화 된 Illumina 450K DNA 메틸화 베타 값을 포함하는 "검증 코호트"에서 HCC를 검출했음을 입증했다. 이 방법을 사용하여 HCC의 95 % 샘플은 HCC로 검출되었다 (도 6C). 도 6A에 제시된 ROC 곡선은 암 검출에 대한이 메틸화 점수의 특이성 (1) 및 민감도 (0.96)를 보여준다.

본 발명자들은 GSE75041의 메틸화 데이터와 HCC 및 8 가지 다른 유형의 암에 대한 "검증 코호트"를 사용하여 HCC를 검출하고 HCC와 다른 암을 구별하기위한 결합 된 스펙의 유용성을 입증하고 DNA 메틸화 점수를 검출한다. 도 7B에 제시된 ROC 곡선은 HCC를 다른 정상 조직 및 다른 암과 구별하기위한이 메틸화 점수의 특이성 (0.97) 및 민감도 (0.95)를 나타낸다. 이러한 DNA 메틸화 마커와 계산 된 메틸화 점수는 조직, 대변, 타액, 혈장 및 소변과 같은 사람과 다른 생체 물질을 사용하는 일반적인 건강한 인구뿐만 아니라 위험에 처한 사람들의 암을 선별하고 조기 발견하는 데 사용할 수 있다.

실시예 5. 폐암에 대한 다 유전자 DNA 메틸화 마커의 발견.

본 발명자들은 GSE61258 (정상 폐)의 10 명에 대해 정규화 된 Illumina 450K DNA 메틸화 데이터를 사용하고 "훈련"코호트로서 폐암 DNA 메틸화 데이터의 TCGA 폐암 수집에서 무작위로 선택된 10 개의 샘플을 사용했다. 본 발명자들은 실시 예 1에서 정상 조직 및 혈액 샘플에 걸쳐 강력하게 메틸화되지 않은 부위로서 발견 된 "훈련 코호트"데이터 세트 28754 CGIDs에 처음으로 후보에 올랐다. 그 다음, 본 발명자들은 훈련 코호트에서 높은 민감도와 특이성을 갖는 폐암 (샘플은 선암종 및 편평 세포 암종 모두를 포함 함)을 검출하는 이원 범주 형 차등 메틸화 CGIDs의 폴리 유전자 세트를 발견하기 위해 실시 예 2에 기재된 BCD 방법을 사용했다 (도 8B, 표 3) (감지). 가중 DNA 메틸화 점수 및 암에 대한 역치는 실시 예 2에 기술 된 바와 같이 CGID에 대해 개발되었다. 그 후 본 발명자들은 8 개의 상이한 종양 유형을 나타내는 TCGA로부터 무작위로 선택된 80 개의 DNA 메틸화 샘플로부터 "훈련 코호트"를 생성하였다. 본 발명자들은 이 훈련 코호트를 사용하여 폐암과 다른 종양 사이에서 차별적으로 메틸화 된 CGIDs의 다 유전자 세트를 발견했다 (도 8C, 표 4) (사양). 실시 예 2에 기재된 바와 같이 CGIDs에 대해 가중 DNA 메틸화 점수가 개발되었다.

실시예 6. 폐암을 검출하기 위한 폐 다 유전자 DNA 메틸화 마커의 유용성.

본 발명자들은 실시 예 3에서 개발 된 가중 폐암 DNA 메틸화 점수 및 역치 (검출)가 GSE66836, GSE63704, GSE76269 및 919 명의 폐암 환자로부터의 정규화 된 Illumina 450K DNA 메틸화 베타 값을 포함하는 "검증 코호트"에서 폐암을 검출한다는 것을 입증했다. TCGA에서. 이 방법을 사용하여 폐암 샘플의 96 %가 폐암으로 검출되었습니다 (도 9A). 그 후 본 발명자들은 폐암 및 8 가지 다른 유형의 암에 대한 GSE 및 TCGA의 메틸화 데이터가있는 "검증 코호트"를 사용하여 폐암과 다른 암을 구별하기 위한 조합 된 스펙의 유용성을 입증하고 DNA 메틸화 점수를 검출합니다 (도 9A). 도 9b에 제시된 ROC 곡선은 다른 정상 조직 및 다른 암으로부터의 폐암을 검출하기위한이 메틸화 점수의 특이성 (0.96) 및 민감도 (0.84)를 나타낸다 (도 9C). 이러한 DNA 메틸화 마커와 계산 된 메틸화 점수는 조직, 대변, 타액, 혈장 및 소변에서 환자와 다른 생체 재료를 사용하는 일반 건강한 인구뿐만 아니라 위험에 처한 사람들의 암을 조기에 발견하는 데 사용할 수 있습니다.

실시예 7. 전립선 암에 대한 다 유전자 DNA 메틸화 마커의 발견.

본 발명자들은 GSE52955 (정상 전립선)의 5 명에 대해 정규화 된 Illumina 450K DNA 메틸화 데이터를 사용하고 "훈련"코호트로서 전립선 암 DNA 메틸화 데이터의 TCGA 전립선 암 수집에서 무작위로 선택된 10 개의 샘플을 사용했다. 본 발명자들은 실시예 1에서 정상 조직 및 혈액 샘플에 걸쳐 강하게 메틸화되지 않은 부위로서 발견 된 "훈련 코호트"데이터 세트 28754 CGIDs에 처음으로 후보에 올랐다. 이어서 본 발명자들은 훈련 코호트에서 높은 민감도와 특이성을 갖는 전립선 암을 검출하는 이원 범주 형 차등 메틸화 된 CGIsD의 다 유전자 세트를 발견하기 위해 실시 예 2에 기술 된 BCD 방법을 사용하였다 (도 10b, 표 5) (검출). 가중 DNA 메틸화 점수 및 암에 대한 역치는 실시 예 2에 기술 된 바와 같이 CGIDs에 대해 개발되었다. 그 후 본 발명자들은 8 개의 상이한 종양 유형을 나타내는 TCGA로부터 무작위로 선택된 80 개의 DNA 메틸화 샘플로부터 "훈련 코호트"를 생성 하였다. 본 발명자들은이 훈련 코호트를 사용하여 전립선 암과 다른 종양 사이의 차별적으로 메틸화 된 CGIDs의 다 유전자 세트를 발견했다 (도 10C, 표 6) (사양). 실시 예 2에 기술 된 바와 같이 CGIDs에 대해 가중 DNA 메틸화 점수가 개발되었다.

실시예 8. 전립선암 검출을 위한 전립선암 다 유전자 DNA 메틸화 마커의 유용성.

본 발명자들은 실시 예 3에서 TCGA로부터 개발 된 가중 전립선 암 DNA 메틸화 점수 및 역치 (검출)가 GSE73549, GSE2955 및 430 명의 전립선 암 환자로부터의 정규화 된 Illumina 450K DNA 메틸화 베타 값을 포함하는 "검증 코호트"에서 전립선 암을 검출 함을 입증했다. 이 방법을 사용하여 전립선 암 샘플의 99 %가 전립선 암으로 검출되었다 (도 11A). 그 후 본 발명자들은 전립선 암 및 8 가지 다른 유형의 암에 대한 GSE 및 TCGA의 메틸화 데이터를 사용하여 "검증 코호트"를 사용하여 전립선 암과 다른 암을 구별하기위한 결합 된 스펙의 유용성을 입증하고 DNA 메틸화 점수를 검출한다 (도 11A). 도 11B에 제시된 ROC 곡선은 다른 정상 조직 및 다른 암으로부터 전립선 암을 검출하기위한이 메틸화 점수의 특이성 (0.99) 및 민감도 (0.98)를 나타낸다 (도 11C). 이러한 DNA 메틸화 마커와 계산 된 메틸화 점수는 조직, 대변, 타액, 혈장 및 소변에서 환자와 다른 생체 재료를 사용하는 일반 건강한 인구뿐만 아니라 위험에 처한 사람들의 암을 조기에 발견하는 데 사용할 수 있다.

실시예 9. 유방암에 대한 다 유전자 DNA 메틸화 마커의 발견.

본 발명자들은 GSE60185 (정상 유방)의 17 명에 대해 정규화 된 Illumina 450K DNA 메틸화 데이터를 사용하고 "훈련"코호트로서 유방암 DNA 메틸화 데이터의 TCGA 유방암 수집에서 무작위로 선택된 10 개의 샘플을 사용했다. 본 발명자들은 실시 예 1에서 정상 조직 및 혈액 샘플에 걸쳐 강력하게 메틸화되지 않은 부위로서 발견 된 "훈련 코호트"데이터 세트 28754 CGIDs에 처음으로 후보에 올랐다. 이어서 본 발명자들은 훈련 코호트에서 높은 민감도와 특이성을 갖는 유방암을 검출하는 이원 범주 형 차등 메틸화 CGIDs의 폴리 유전자 세트를 발견하기 위해 실시 예 2에 기재된 BCD 방법을 사용 하였다 (도 12B, 표 7) (검출). 가중 DNA 메틸화 점수 및 암에 대한 역치는 실시 예 2에 기술 된 바와 같이 CGIDs에 대해 개발되었습니다. 그 후 본 발명자들은 8 개의 상이한 종양 유형을 나타내는 TCGA로부터 무작위로 선택된 80 개의 DNA 메틸화 샘플로부터 "훈련 코호트"를 생성 하였다. 본 발명자들은 유방암과 다른 종양 사이의 차별적으로 메틸화 된 CGIDs의 다 유전자 세트를 발견하기 위해이 훈련 코호트를 사용했다 (도 12C, 표 8) (사양). 실시 예 2에 기재된 바와 같이 CGIDs에 대해 가중 DNA 메틸화 점수가 개발되었다.

실시예 10. 유방암 검출을 위한 유방암 다 유전자 DNA 메틸화 마커의 유용성.

본 발명자들은 그 후 실시예 9에서 TCGA로부터 개발 된 가중 유방암 DNA 메틸화 점수 및 역치 (검출)가 GSE60185, GSE75067 및 GSE60185, 및 GSE75067의 정규화 된 Illumina 450K DNA 메틸화 베타 값을 사용하여 891 명의 유방암 환자를 포함하는 "검증 코호트"에서 유방암을 검출한다는 것을 입증했다. 이 방법을 사용하여 유방암 샘플의 91 %가 유방암으로 검출되었고 (도 13A) DCIS 및 침습성 암이 모두 검출되었다. 그 후 본 발명자들은 유방암 및 8 가지 다른 유형의 암에 대한 GSE 및 TCGA의 메틸화 데이터를 사용하여 "검증 코호트"를 사용하여 유방암과 다른 암을 구별하기위한 결합 된 스펙의 유용성을 입증하고 DNA 메틸화 점수를 검출합니다 (도 14A). 도 14B에 제시된 ROC 곡선은 유방암을 다른 정상 조직 및 다른 암과 구별하기위한이 메틸화 점수의 특이성 (0.89) 및 민감도 (0.87)를 보여준다 (도 14C). 이러한 DNA 메틸화 마커와 메틸화 값에서 계산 된 메틸화 점수는 조직, 대변, 타액, 혈장 및 소변에서 환자와 다른 생체 재료를 사용하는 일반적인 건강한 인구뿐만 아니라 위험에 처한 여성의 유방암 조기 발견에 사용할 수 있습니다.

실시예 11. 결장 직장암 (CRC)에 대한 다 유전자 DNA 메틸화 마커의 발견.

본 발명자들은 GSE (32146) (정상)의 25 명에 대한 정규화 된 Illumina 450K DNA 메틸화 데이터를 사용하고 "훈련"코호트로서 TCGA 결장 직장암 컬렉션의 TCGA 대장 암 DNA 메틸화 데이터에서 무작위로 선택한 샘플을 사용했다. 본 발명자들은 실시 예 1에서 정상 조직 및 혈액 샘플에 걸쳐 강력하게 메틸화되지 않은 부위로서 발견 된 "훈련 코호트"데이터 세트 28754 CGID에 처음으로 후보에 올랐다. 그 후, 본 발명자들은 훈련 코호트에서 높은 민감도와 특이성을 갖는 결장 직장암을 검출하는 이원 범주 형 차등 메틸화 CGIDs의 폴리 유전자 세트를 발견하기 위해 실시 예 2에 기술 된 BCD 방법을 사용 하였다 (도 15B, 표 9) (검출). 가중 DNA 메틸화 점수 및 암에 대한 역치는 실시 예 2에 기술 된 바와 같이 CGIDs에 대해 개발되었다. 그 후 본 발명자들은 8 개의 상이한 종양 유형을 나타내는 TCGA로부터 무작위로 선택된 80 개의 DNA 메틸화 샘플로부터 "훈련 코호트"를 생성 하였다. 본 발명자들은이 훈련 코호트를 사용하여 결장 직장암과 다른 종양 사이의 차별적으로 메틸화 된 CGID의 다 유전자 세트를 발견했다 (도 15C, 표 10) (사양). 실시 예 2에 기술 된 바와 같이 CGID에 대해 가중 DNA 메틸화 점수가 개발되었다.

실시예 12. 결장 직장암을 검출하기 위한 결장 직장암 다 유전자 DNA 메틸화 마커의 유용성.

이어서 본 발명자들은 실시 예 11에서 개발 된 가중 결장 직장암 DNA 메틸화 점수 및 역치 (검출)가 GSE69550으로부터의 정규화 된 Illumina 450K DNA 메틸화 베타 값 및 TCGA로부터의 459 명의 결장 직장암 환자를 포함하는 "검증 코호트"에서 결장 직장암을 검출한다는 것을 입증했다. 이 방법을 사용하여 결장 직장암 샘플의 98 %가 결장 직장암으로 검출되었다 (도 16A). 이어서 본 발명자들은 결장 직장암 및 8 가지 다른 유형의 암에 대한 GSE 및 TCGA의 메틸화 데이터를 사용하여 "검증 코호트"를 사용하여 결장 직장암과 다른 암을 구별하기위한 조합 된 스펙의 유용성을 입증하고 DNA 메틸화 점수를 검출gks다 (도 16A). 도 16B에 제시된 ROC 곡선은 다른 정상 조직 및 다른 암으로부터 결장 직장암을 검출하기위한이 메틸화 점수의 특이성 (0.96) 및 민감도 (0.98)를 나타낸다 (도 16C). 이러한 DNA 메틸화 마커와 메틸화 값에서 계산 된 메틸화 점수는 조직, 대변, 타액, 혈장 및 소변에서 환자와 다른 생체 재료를 사용하는 일반 건강한 인구뿐만 아니라 CRC 위험에 처한 사람들의 암을 조기에 발견하는 데 사용할 수 있다.

실시예 13. 췌장암에 대한 다 유전자 DNA 메틸화 마커의 발견.

본 발명자들은 GSE53051 (정상)의 12 명에 대해 정규화 된 Illumina 450K DNA 메틸화 데이터를 사용하고 "훈련"코호트로서 TCGA의 췌장암 DNA 메틸화 데이터 수집에서 무작위로 선택된 20 개의 샘플을 사용했다. 본 발명자들은 실시 예 1에서 정상 조직 및 혈액 샘플에 걸쳐 강력하게 메틸화되지 않은 부위로서 발견 된 "훈련 코호트"데이터 세트 28754 CGID에 처음으로 후보에 올랐다. 이어서 본 발명자들은 훈련 코호트에서 높은 민감도와 특이성을 갖는 췌장암을 검출하는 이원 범주 형 차등 메틸화 CGIDs의 폴리 유전자 세트를 발견하기 위해 실시 예 2에 기재된 BCD 방법을 사용 하였다 (도 17B, 표 11) (검출). 실시 예 2에 기술 된 바와 같이 CGIDs에 대해 가중 DNA 메틸화 점수 및 암에 대한 임계 값을 개발했다. 그런 다음 본 발명자들은 10 개의 다른 종양 유형을 나타내는 TCGA로부터 무작위로 선택된 DNA 메틸화 샘플 100 개로부터 "훈련 코호트"를 생성했다. 본 발명자들은이 훈련 코호트를 사용하여 췌장암과 다른 종양 사이의 차별적으로 메틸화 된 CGIDs의 다 유전자 세트를 발견했다 (도 17C, 표 12) (사양). 실시 예 2에 기재된 바와 같이 CGIDs에 대해 가중 DNA 메틸화 점수가 개발되었다.

실시예 14. 췌장암 검출을 위한 췌장암 다 유전자 DNA 메틸화 마커의 유용성.

본 발명자들은 실시 예 13에서 개발 된 가중 췌장암 DNA 메틸화 점수 및 역치 (검출)가 TCGA로부터의 891 명의 췌장암 환자로부터의 정규화 된 Illumina 450K DNA 메틸화 베타 값을 포함하는 "검증 코호트"에서 췌장암을 검출한다는 것을 입증했습니다. 이 방법을 사용하여 췌장암 샘플의 86 %가 췌장암으로 검출되었습니다 (도 18A). 본 발명자들은 췌장암 및 9 가지 다른 유형의 암에 대한 GSE 및 TCGA의 메틸화 데이터가있는 "검증 코호트"를 사용하여 췌장암과 다른 암을 구별하기위한 결합 된 스펙의 유용성을 입증하고 DNA 메틸화 점수를 검출합니다 (도 18A). 도 18B에 제시된 ROC 곡선은 췌장암을 검출하고 다른 정상 조직 및 다른 암과 구별하기위한이 메틸화 점수의 특이성 (0.93) 및 민감도 (0.86)를 보여준다 (도 18C). 이러한 DNA 메틸화 마커와 메틸화 값에서 계산 된 메틸화 점수는 조직, 대변, 타액, 혈장 및 소변에서 환자와 다른 생체 물질을 사용하는 일반적인 건강한 인구뿐만 아니라 위험에 처한 사람들의 암을 조기에 발견하는 데 사용할 수 있습니다.

실시예 15. 뇌암에 대한 다 유전자 DNA 메틸화 마커의 발견.

본 발명자들은 GSE65820 (정상)의 10 명에 대해 정규화 된 Illumina 450K DNA 메틸화 데이터를 사용하고 "훈련"코호트로서 뇌암 DNA 메틸화 데이터의 TCGA 수집에서 무작위로 선택된 10 개의 샘플을 사용했다. 본 발명자들은 실시 예 1에서 정상 조직 및 혈액 샘플에 걸쳐 강력하게 메틸화되지 않은 부위로서 발견 된 "훈련 코호트"데이터 세트 28754 CGIDs에 처음으로 후보에 올랐다. 그 후, 본 발명자들은 훈련 코호트에서 높은 민감도와 특이성을 갖는 뇌암을 검출하는 이진 범주 형 차등 메틸화 CGIDs 세트를 발견하기 위해 실시 예 2에 기술 된 BCD 방법을 사용 하였다 (도 19B, 표 13) (검출). 가중 DNA 메틸화 점수 및 암에 대한 역치는 실시 예 2에 기술 된 바와 같이 CGIDs에 대해 개발되었습니다. 그 다음, 본 발명자들은 11 개의 상이한 종양 유형을 나타내는 TCGA로부터 무작위로 선택된 110 개의 DNA 메틸화 샘플로부터 "훈련 코호트"를 생성 하였다. 본 발명자들은이 훈련 코호트를 사용하고 검출 된 CGIDs가 또한 뇌암과 다른 종양을 구별한다는 것을 발견했다 (도 19C, 표 13) (검출-사양). 실시 예 2에 기재된 바와 같이 CGIDs에 대해 가중 DNA 메틸화 점수가 개발되었다.

실시예 16. 뇌암 검출을위한 뇌암 다 유전자 DNA 메틸화 마커의 유용성.

본 발명자들은 GSE36278의 GSE58298 및 136 명의 환자로부터 실시 예 15에서 개발 된 가중 뇌암 DNA 메틸화 점수 및 역치 (검출)가 TCGA로부터의 689 명의 뇌암 환자로부터의 정규화 된 Illumina 450K DNA 메틸화 베타 값을 포함하는 "검증 코호트"에서 뇌암을 검출 함을 입증했다. 이 방법을 사용하여 뇌암 샘플의 91-97 %가 뇌암으로 검출되었습니다 (도 20A). 그 후 본 발명자들은 뇌암 및 9 가지 다른 유형의 암에 대한 GSE 및 TCGA의 메틸화 데이터가있는 "검증 코호트"를 사용하여 뇌암과 다른 암을 구별하기위한 동일한 CGIDs의 유용성을 입증했다 (도 20A). 도 22B에 제시된 ROC 곡선은 다른 정상 조직 및 다른 암으로부터 뇌암을 검출하기위한이 메틸화 점수의 특이성 (1) 및 민감도 (0.97)를 나타낸다 (도 20C). 이러한 DNA 메틸화 마커와 메틸화 값에서 계산 된 메틸화 점수는 조직, 대변, 타액, 혈장 및 소변에서 환자와 다른 생체 재료를 사용하는 일반적인 건강한 인구뿐만 아니라 위험에 처한 사람들의 암을 조기에 발견하는 데 사용할 수 있다.

실시예 17. 위암에 대한 다 유전자 DNA 메틸화 마커의 발견.

본 발명자들은 GSE99553 (정상)의 18 명에 대해 정규화 된 Illumina 450K DNA 메틸화 데이터를 사용하고 "훈련"코호트로서 위암 DNA 메틸화 데이터의 TCGA 수집에서 무작위로 선택된 10 개의 샘플을 사용했다. 본 발명자들은 실시 예 1에서 정상 조직 및 혈액 샘플에 걸쳐 강력하게 메틸화되지 않은 부위로서 발견 된 "훈련 코호트"데이터 세트 28754 CGIDs에 처음으로 후보에 올랐다.

이어서 본 발명자들은 훈련 코호트에서 높은 민감도와 특이성을 갖는 위암을 검출하는 이원 범주 형 차등 메틸화 CGIDs의 폴리 유전자 세트를 발견하기 위해 실시 예 2에 기재된 BCD 방법을 사용 하였다 (도 21B, 표 14) (검출).

실시 예 2에 기재된 바와 같이 CGIDs에 대해 가중 DNA 메틸화 점수 및 암에 대한 역치를 개발 하였다. 본 발명자들은 11 개의 다른 종양 유형을 나타내는 TCGA에서 무작위로 선택된 100 개의 DNA 메틸화 샘플로부터 "훈련 코호트"를 생성했다. 본 발명자들은 위암과 다른 종양 사이의 차별적으로 메틸화 된 CGIDs의 다 유전자 세트를 발견하기 위해이 훈련 코호트를 사용했다 (도 21C, 표 15) (사양). 실시 예 2에 기재된 바와 같이 CGIDs에 대해 가중 DNA 메틸화 점수가 개발되었다.

실시예 18. 위암 검출을 위한 위암 다 유전자 DNA 메틸화 마커의 유용성.

본 발명자들은 실시 예 17에서 개발 된 가중 위암 DNA 메틸화 점수 및 역치 (검출)가 TCGA로부터의 397 위암 환자로부터의 정규화 된 Illumina 450K DNA 메틸화 베타 값을 포함하는 "검증 코호트"에서 위암을 검출한다는 것을 입증했다.

이 방법을 사용하여 88 %의 위암 샘플이 위암으로 검출되었다 (도 23A).

그 후 본 발명자들은 위암 및 10 가지 다른 유형의 암에 대한 GSE 및 TCGA의 메틸화 데이터가있는 "검증 코호트"를 사용하여 위암과 다른 암을 구별하기위한 조합 된 스펙의 유용성을 입증하고 DNA 메틸화 점수를 검출한다 (도 23A).

도 22B에 제시된 ROC 곡선은 다른 정상 조직 및 다른 암으로부터 위암을 검출하기위한이 메틸화 점수의 특이성 (0.9) 및 민감도 (0.9)를 나타낸다 (도 22C).

이러한 DNA 메틸화 마커와 메틸화 값에서 계산 된 메틸화 점수는 조직, 대변, 타액, 혈장 및 소변에서 환자와 다른 생체 물질을 사용하는 일반적인 건강한 인구뿐만 아니라 위험에 처한 사람들의 암을 선별하고 조기 발견하는 데 사용할 수 있다.

실시예 19. 난소 암에 대한 다 유전자 DNA 메틸화 마커의 발견.

본 발명자들은 GSE65820 (정상)의 5 명에 대해 정규화 된 Illumina 450K DNA 메틸화 데이터를 사용했고 "훈련"코호트로서 난소 암 DNA 메틸화 데이터의 TCGA 컬렉션에서 무작위로 선택된 10 개의 샘플을 사용했다. 본 발명자들은 실시 예 1에서 정상 조직 및 혈액 샘플에 걸쳐 강력하게 메틸화되지 않은 부위로서 발견 된 "훈련 코호트"데이터 세트 28754 CGIDs에 처음으로 후보에 올랐다.

이어서 본 발명자들은 훈련 코호트에서 높은 민감도와 특이성을 갖는 난소 암을 검출하는 이원 범주 형 차등 메틸화 CGIDs의 폴리 유전자 세트를 발견하기 위해 실시 예 2에 기재된 BCD 방법을 사용 하였다 (도 23B, 표 16) (검출).

가중 DNA 메틸화 점수 및 암에 대한 역치는 실시 예 2에 기술 된 바와 같이 CGIDs에 대해 개발되었다. 그 후 본 발명자들은 10 개의 상이한 종양 유형 및 혈액을 나타내는 TCGA로부터 무작위로 선택된 DNA 메틸화 샘플 100 개로부터 "훈련 코호트"를 생성 하였다.

본 발명자들은이 훈련 코호트를 사용하여 난소 암과 다른 종양 사이의 차별적으로 메틸화 된 CGIDs의 다 유전자 세트를 발견했다 (도 2C, 표 17) (사양). 실시 예 2에 기술 된 바와 같이 CGIDs에 대해 가중 DNA 메틸화 점수가 개발되었다.

실시예 20. 난소 암을 검출하기 위한 난소 암 다 유전자 DNA 메틸화 마커의 유용성.

이어서 본 발명자들은 실시 예 19에서 개발 된 가중 난소 암 DNA 메틸화 점수 및 역치 (검출)가 TCGA의 난소 암 환자 114 명의 정규화 된 Illumina 450K DNA 메틸화 베타 값을 포함하는 "검증 코호트"에서 난소 암을 검출한다는 것을 입증했다. 이 방법을 사용하여 난소 암 샘플의 86 %가 난소 암으로 검출되었다 (도 24A). 그 후 본 발명자들은 난소 암 및 9 가지 다른 유형의 암에 대한 GSE 및 TCGA의 메틸화 데이터를 사용하여 "검증 코호트"를 사용하여 난소 암과 다른 암을 구별하기위한 spec DNA 메틸화 점수의 유용성을 입증했다 (도 24A).

도 24B에 제시된 ROC 곡선은 난소 암을 다른 정상 조직 및 다른 암과 구별하기위한이 메틸화 점수의 특이성 (0.99) 및 민감도 (1)를 나타낸다 (도 24C).

이러한 DNA 메틸화 마커와 메틸화 값에서 계산 된 메틸화 점수는 조직, 대변, 타액, 혈장 및 소변에서 환자와 다른 생체 재료를 사용하는 일반적인 건강한 인구뿐만 아니라 위험에 처한 사람들의 암을 조기에 발견하는 데 사용할 수 있다.

실시예 21. 자궁 경부암에 대한 다 유전자 DNA 메틸화 마커의 발견.

본 발명자들은 GSE46306 (정상)의 20 명에 대해 정규화 된 Illumina 450K DNA 메틸화 데이터를 사용하고 "훈련"코호트로서 자궁 경부암 DNA 메틸화 데이터의 TCGA 수집에서 무작위로 선택된 10 개의 샘플을 사용했다. 본 발명자들은 실시 예 1에서 정상 조직 및 혈액 샘플에 걸쳐 강력하게 메틸화되지 않은 부위로서 발견 된 "훈련 코호트"데이터 세트 28754 CGIDs에 처음으로 후보에 올랐다.

그 후 본 발명자들은 훈련 코호트에서 높은 민감도와 특이성을 갖는 자궁 경부암을 검출하는 이원 범주 형 차등 메틸화 CGIDs의 다 유전자 세트를 발견하기 위해 실시 예 2에 기술 된 BCD 방법을 사용 하였다 (도 25B, 표 18) (검출). 실시 예 2에 기재된 바와 같이 CGIDs에 대해 가중 DNA 메틸화 점수 및 암에 대한 역치를 개발 하였다. 본 발명자들은 8 개의 다른 종양 유형 및 혈액을 나타내는 TCGA로부터 무작위로 선택된 80 개의 DNA 메틸화 샘플로부터 "훈련 코호트"를 생성했다. 본 발명자들은이 훈련 코호트를 사용하여 자궁 경부암과 다른 종양 사이의 차별적으로 메틸화 된 CGIDs의 다 유전자 세트를 발견했다 (도 25C, 표 19) (사양). 실시 예 2에 기재된 바와 같이 CGIDs에 대해 가중 DNA 메틸화 점수가 개발되었다.

실시예 22. 자궁 경부암 검출을 위한 자궁 경부암 다 유전자 DNA 메틸화 마커의 유용성.

이어서 본 발명자들은 실시 예 21에서 개발 된 가중 자궁 경부암 DNA 메틸화 점수 및 역치 (검출)가 TCGA로부터의 313 명의 자궁 경부암 환자로부터의 정규화 된 Illumina 450K DNA 메틸화 베타 값을 포함하는 "검증 코호트"에서 자궁 경부암을 검출한다는 것을 입증했다. 이 방법을 사용하여 자궁 경부암 샘플의 91 %가 자궁 경부암으로 검출되었다 (도 26A). 그 후 본 발명자들은 자궁 경부암 및 9 가지 다른 유형의 암에 대한 GSE 및 TCGA의 메틸화 데이터를 사용하여 "검증 코호트"를 사용하여 자궁 경부암과 다른 암을 구별하기위한 spec DNA 메틸화 점수의 유용성을 입증했다 (도 26A). 도 26B에 제시된 ROC 곡선은 자궁 경부암을 검출하고 다른 정상 조직 및 다른 암과 구별하기위한이 메틸화 점수의 특이성 (0.9) 및 민감도 (0.9)를 나타낸다 (도 26C). 이러한 DNA 메틸화 마커와 메틸화 값에서 계산 된 메틸화 점수는 조직, 대변, 타액, 혈장 및 소변에서 환자와 다른 생체 물질을 사용하는 일반적인 건강한 인구뿐만 아니라 위험에 처한 사람들의 암을 조기에 발견하는 데 사용할 수 있다.

실시예 23. HNSC (Head and Neck Squamous Carcinoma)에 대한 다 유전자 DNA 메틸화 마커의 발견.

본 발명자들은 GSE (52068) (정상)의 10 명에 대한 정규화 된 Illumina 450K DNA 메틸화 데이터를 사용하고 "훈련"코호트로서 HNSC DNA 메틸화 데이터의 TCGA 암 컬렉션에서 무작위로 선택된 10 개의 샘플을 사용했다. 본 발명자들은 실시 예 1에서 정상 조직 및 혈액 샘플에 걸쳐 강력하게 메틸화되지 않은 부위로서 발견 된 "훈련 코호트"데이터 세트 28754 CGID에 처음으로 후보에 올랐다. 이어서 본 발명자들은 훈련 코호트에서 높은 민감도와 특이성을 갖는 HNSC를 검출하는 이원 범주 형 차등 메틸화 CGIDs의 폴리 유전자 세트를 발견하기 위해 실시 예 2에 기재된 BCD 방법을 사용 하였다 (도 27B, 표 20) (검출). 가중 DNA 메틸화 점수 및 암에 대한 역치는 실시 예 2에 기술 된 바와 같이 CGIDs에 대해 개발되었다. 그 다음, 본 발명자들은 12 개의 상이한 종양 유형을 나타내는 TCGA로부터 무작위로 선택된 80 개의 DNA 메틸화 샘플로부터 "훈련 코호트"를 생성 하였다. 본 발명자들은이 훈련 코호트를 사용하여 HNSC와 다른 종양 사이의 차별적으로 메틸화 된 CGIDs의 다 유전자 세트를 발견했다 (도 27C, 표 21) (사양).

실시예 24. HNSC 검출을위한 두경부 편평 암종 (HNSC) 다 유전자 DNA 메틸화 마커의 유용성.

본 발명자들은 실시 예 23에서 개발 된 가중 HNSC DNA 메틸화 점수 및 역치 (검출)가 GSE52068 및 GSE52068로부터 정규화 된 Illumina 450K DNA 메틸화 베타 값을 포함하는 "검증 코호트"에서 HNSC를 검출한다는 것을 입증했다. 이 방법을 사용하여 HNSC 샘플의 88 % -96 %가 검출되었다 (도 28A). 그 후 본 발명자들은 HNSC 및 12 개의 다른 유형의 암에 대한 GSE 및 TCGA의 메틸화 데이터와 함께 "검증 코호트"를 사용하여 HNSC와 다른 암을 구별하기위한 DNA 메틸화 검출 점수의 유용성을 입증 하였다 (도 28A). 도 28B에 제시된 ROC 곡선은 HNSC를 다른 정상 조직 및 다른 암과 구별하기위한이 메틸화 점수의 특이성 (0.86) 및 민감도 (0.88)를 보여준다 (도 28C). 마커는 또한 여러 다른 암을 감지한다 (상대적으로 높은 민감도로 이러한 암에 대한 특이성이 제한됨). 이러한 DNA 메틸화 마커와 메틸화 값에서 계산 된 메틸화 점수는 조직, 대변, 타액, 혈장 및 소변에서 환자와 다른 생체 재료를 사용하는 일반적인 건강한 인구뿐만 아니라 위험에 처한 사람들의 암을 조기에 발견하는 데 사용할 수 있다.

실시예 25. 식도암에 대한 다 유전자 DNA 메틸화 마커의 발견.

본 발명자들은 GSE (52068) (정상)의 10 명에 대해 정규화 된 Illumina 450K DNA 메틸화 데이터를 사용하고 "훈련"코호트로서 식도암 DNA 메틸화 데이터의 TCGA 암 수집에서 무작위로 선택된 10 개의 샘플을 사용했다. 본 발명자들은 실시 예 1에서 정상 조직 및 혈액 샘플에 걸쳐 강력하게 메틸화되지 않은 부위로서 발견 된 "훈련 코호트"데이터 세트 28754 CGID에 처음으로 후보에 올랐다. 이어서 본 발명자들은 훈련 코호트 (도 29B, 표 22) (검출)에서 높은 민감도와 특이성을 갖는 식도암을 검출하는 이원 범주 형 차등 메틸화 CGIDs의 폴리 유전자 세트를 발견하기 위해 실시 예 2에 기재된 BCD 방법을 사용 하였다.

가중 DNA 메틸화 점수 및 암에 대한 역치는 실시 예 2에 기술 된 바와 같이 CGIDs에 대해 개발되었다. 그 다음, 본 발명자들은 12 개의 상이한 종양 유형을 나타내는 TCGA로부터 무작위로 선택된 80 개의 DNA 메틸화 샘플로부터 "훈련 코호트"를 생성 하였다. 본 발명자들은이 훈련 코호트를 사용하여 식도암과 다른 종양 사이에서 차별적으로 메틸화 된 CGIDs의 다 유전자 세트를 발견했다 (도 29C, 표 23) (사양).

실시예 26. 식도암 검출을 위한 식도암 다 유전자 DNA 메틸화 마커의 유용성.

이어서 본 발명자들은 실시 예 25에서 개발 된 가중 식도암 DNA 메틸화 점수 및 역치 (검출)가 GSE52068 및 GSE52068로부터의 정규화 된 Illumina 450K DNA 메틸화 베타 값을 포함하는 "검증 코호트"에서 식도암을 검출한다는 것을 입증했다. 이 방법을 사용하여 88 % -96 %의 식도암 샘플이 검출되었습니다 (도 30A). 그 후 본 발명자들은 식도암 및 12 개의 다른 유형의 암에 대한 GSE 및 TCGA의 메틸화 데이터를 사용하여 식도암과 다른 암을 구별하기위한 DNA 메틸화 점수 검출의 유용성을 입증했다 (도 30A). 도 30B에 제시된 ROC 곡선은 다른 정상 조직 및 다른 암과 식도암을 구별하기위한이 메틸화 점수의 특이성 (0.86) 및 민감도 (0.88)를 나타낸다 (도 30C). 마커는 또한 여러 다른 암을 감지한다 (상대적으로 높은 민감도로 이러한 암에 대한 특이성이 제한됨). 이러한 DNA 메틸화 마커와 메틸화 값에서 계산 된 메틸화 점수는 조직, 대변, 타액, 혈장 및 소변에서 환자와 다른 생체 재료를 사용하는 일반적인 건강한 인구뿐만 아니라 위험에 처한 사람들의 암을 조기에 발견하는 데 사용할 수 있다.

실시예 27. 방광암에 대한 다 유전자 DNA 메틸화 마커의 발견.

본 발명자들은 GSE52955 (정상)의 5 명에 대해 정규화 된 Illumina 450K DNA 메틸화 데이터를 사용하고 "훈련"코호트로서 방광암 DNA 메틸화 데이터의 TCGA 수집에서 무작위로 선택된 10 개의 샘플을 사용했다. 본 발명자들은 실시 예 1에서 정상 조직 및 혈액 샘플에 걸쳐 강하게 메틸화되지 않은 부위로서 발견 된 "훈련 코호트"데이터 세트 28754 CGIDs에 처음으로 후보에 올랐다. 이어서 본 발명자들은 훈련 코호트 (도 31B, 표 24) (검출)에서 높은 민감도와 특이성을 갖는 방광암을 검출하는 이원 범주 형 차등 메틸화 CGIDs의 폴리 유전자 세트를 발견하기 위해 실시 예 2에 기재된 BCD 방법을 사용했다. 실시 예 2에 기술 된 바와 같이 CGIDs에 대해 가중 DNA 메틸화 점수 및 암에 대한 임계 값이 개발되었다. 그런 다음 본 발명자들은 13 개의 다른 종양 유형 및 정상 혈액을 나타내는 TCGA로부터 무작위로 선택된 80 개의 DNA 메틸화 샘플로부터 "훈련 코호트"를 생성했다. 본 발명자들은이 훈련 코호트를 사용하여 방광암과 다른 종양 사이의 차별적으로 메틸화 된 CGIDs의 다 유전자 세트를 발견했다 (도 31C, 표 25) (사양). 실시 예 2에 기술 된 바와 같이 CGIDs에 대해 가중 DNA 메틸화 점수가 개발되었다.

실시예 28. 방광암 검출을 위한 방광암 다 유전자 DNA 메틸화 마커의 유용성.

이어서 본 발명자들은 실시 예 27에서 개발 된 가중 방광암 DNA 메틸화 점수 및 역치 (검출)가 TCGA의 439 방광암 환자로부터의 정규화 된 Illumina 450K DNA 메틸화 베타 값을 포함하는 "검증 코호트"에서 방광암을 검출 함을 입증했다. 이 방법을 사용하여 방광암 샘플의 96 %가 방광암으로 검출되었다 (도 32B). 본 발명자들은 방광암 및 13 가지 다른 유형의 암에 대한 GSE 및 TCGA의 메틸화 데이터를 사용하여 "검증 코호트"를 사용하여 방광암과 다른 암을 구별하기위한 spec DNA 메틸화 점수의 유용성을 입증했다 (도 32B). 도 32C에 제시된 ROC 곡선은 다른 정상 조직 및 다른 암으로부터 방광암을 검출하기위한이 메틸화 점수의 특이성 (0.86) 및 민감도 (0.88)를 나타낸다 (도 32C). 그러나 위암, 췌장 식도암 및 대장 암의 경우 상당히 높은 비율로 교차 검출이 있다. 이러한 DNA 메틸화 마커와 메틸화 값에서 계산 된 메틸화 점수는 조직, 대변, 타액, 혈장 및 소변에서 환자와 다른 생체 물질을 사용하는 일반적인 건강한 인구뿐만 아니라 위험에 처한 사람들의 암을 조기에 발견하는 데 사용할 수 있다.

실시예 29. 신장 암에 대한 다 유전자 DNA 메틸화 마커의 발견.

본 발명자들은 GSE52955 (정상)에서 10 명의 신장 (신장) 암에 대해 정규화 된 Illumina 450K DNA 메틸화 데이터를 사용했으며 TCGA 데이터 세트의 13 개 암에서 암당 무작위로 선택된 10 개의 샘플을 "훈련"코호트와 정상 조직 및 혈액으로 사용했다 (GSE40279, GSE 52955). 본 발명자들은 실시 예 1에서 정상 조직 및 혈액 샘플에 걸쳐 강력하게 메틸화되지 않은 부위로서 발견 된 "훈련 코호트"데이터 세트 28754 CGID에 처음으로 후보에 올랐다. 이어서 본 발명자들은 실시 예 2에 기술 된 BCD hypo 방법을 사용하여 훈련 코호트에서 높은 민감도와 특이성을 갖는 신장 암을 검출하고 다른 암 "Detect-Spec"에 대한 신장 암에 특이적인 이원 범주 형 차등 메틸화 CGID의 다 유전자 세트를 발견했다. (도 33B, 표 26) (검출 사양). 실시 예 2에 기재된 바와 같이 CGID에 대해 가중 DNA 메틸화 점수 및 암에 대한 역치를 개발 하였다.

실시예 30. 신장 암 검출을 위한 신장 암 다 유전자 DNA 메틸화 마커의 유용성.

본 발명자들은 실시 예 27에서 개발 된 가중 신장 암 DNA 메틸화 점수 및 역치 ( "Detect-Spec")가 TCGA 및 871 신장 암 환자로부터의 정규화 된 Illumina 450K DNA 메틸화 베타 값을 포함하는 "검증 코호트"에서 신장 암을 검출 함을 입증했다. 신장 암을 다른 암과 구별한다. 이 방법을 사용하여 신장 암 샘플의 90 %가 신장 암으로 검출되었다 (도 34A). 본 발명자들은 신장 암 및 13 가지 다른 유형의 암에 대한 GSE 및 TCGA의 메틸화 데이터가 포함 된 "검증 코호트"를 사용하여 신장 암과 다른 암을 구별하기위한 "Detect-Spec"DNA 메틸화 점수의 유용성을 입증했다 (도 34A). 도 34B에 제시된 ROC 곡선은 다른 정상 조직 및 다른 암 (도 34C)에서 신장 암을 검출하기위한이 메틸화 점수의 특이성 (0.87) 및 민감도 (0.91)를 나타낸다 (도 34C) (HCC, 뇌 및 고환과의 높은 교차). 이러한 DNA 메틸화 마커와 메틸화 값에서 계산 된 메틸화 점수는 조직, 대변, 타액, 혈장 및 소변에서 환자와 다른 생체 물질을 사용하는 일반적인 건강한 인구뿐만 아니라 위험에 처한 사람들의 신장 암을 조기에 발견하는 데 사용할 수 있다.

실시예 31. 고환암에 대한 다 유전자 DNA 메틸화 마커의 발견.

본 발명자들은 GSE46306 (정상)의 10 명의 고환암에 대해 정규화 된 Illumina 450K DNA 메틸화 데이터를 사용했으며 TCGA 데이터 세트의 13 개 암에서 암당 무작위로 선택된 10 개의 샘플을 "훈련"코호트뿐만 아니라 정상 조직 및 혈액 (GSE40279, GSE 61496)를 정규화한다. 본 발명자들은 실시 예 1에서 정상 조직 및 혈액 샘플에 걸쳐 강하게 메틸화되지 않은 부위로서 발견 된 "훈련 코호트"데이터 세트 28754 CGID에 처음으로 후보에 올랐다. 그 후 본 발명자들은 실시 예 2에 기술 된 BCD hypo 방법을 사용하여 훈련 코호트에서 높은 민감도와 특이성을 가진 고환암을 검출하고 다른 암 "Detect-Spec"에 대한 고환암에 특이적인 이원 범주 형 차등 메틸화 CGIDs의 폴리 유전자 세트를 발견했다. (도 35B, 표 27) (검출 사양). 실시 예 2에 기재된 바와 같이 CGIDs에 대해 가중 DNA 메틸화 점수 및 암에 대한 역치를 개발 하였다.

실시예 32. 고환암 검출을 위한 고환암 다 유전자 DNA 메틸화 마커의 유용성.

본 발명자들은 실시 예 31에서 개발 된 가중 고환암 DNA 메틸화 점수 및 역치 ( "검출-스펙")가 TCGA의 고환암 환자 156 명의 정규화 된 Illumina 450K DNA 메틸화 베타 값을 포함하는 "검증 코호트"에서 고환암을 검출 함을 입증했다. 고환암을 다른 암과 구별합니다. 이 방법을 사용하여 고환암 샘플의 96 %가 고환암으로 검출되었다 (도 36A). 그 후 본 발명자들은 고환암 및 13 가지 다른 유형의 암에 대한 GSE 및 TCGA의 메틸화 데이터를 사용하여 "검증 코호트"를 사용하여 고환암과 다른 암을 구별하기위한 "검출-스펙"DNA 메틸화 점수의 유용성을 입증했다 (도 36A). 도 36B에 제시된 ROC 곡선은 다른 정상 조직 및 다른 암으로부터 고환암을 검출하기위한이 메틸화 점수의 특이성 (0.97) 및 민감도 (0.96)를 나타낸다 (도 36C). 이러한 DNA 메틸화 마커와 메틸화 값에서 계산 된 메틸화 점수는 조직, 대변, 타액, 혈장 및 소변에서 환자와 다른 생체 재료를 사용하는 일반적인 건강한 인구뿐만 아니라 위험에 처한 사람들의 암을 조기에 발견하는 데 사용할 수 있다.

실시예 33. 13 개의 일반적인 고형 종양에 대한 다 유전자 팬(pan)-암 DNA 메틸화 마커의 발견.

본 발명자들은 TCGA 데이터 세트의 "훈련"코호트와 TCGA 및 GEO의 정상 조직 및 혈액으로 포함하는13 개 암 (방광암, 뇌암, 유방암, 자궁 경부암, 대장 암, 식도암, HNSC, 간암, 폐암, 난소 암, 췌장암, 전립선 암, 위암)에서 암당 무작위로 선택된 10 개의 샘플에 대해 정규화 된 Illumina 450K DNA 메틸화 데이터를 사용했다. 그 다음, 본 발명자들은 표 xy에 나열된 10 개의 다른 암을 검출하기 위해 CGIDs의 조합 된 목록과 높은 민감도와 특이도에서 10 개의 일반적인 암 중 임의의 것을 검출하는 최종 CGIDs에 대해 불이익을받은 회귀를 수행했다 (도 37B, 표 28) (검출). 실시 예 2에 기재된 바와 같이 CGIDs에 대해 가중 DNA 메틸화 점수 및 암에 대한 역치를 개발 하였다.

실시예 34. 암 탐지를위한 팬(pan)-암 다 유전자 DNA 메틸화 마커의 유용성.

본 발명자들은 실시 예 33에서 개발 된 가중 암 DNA 메틸화 점수 및 역치 ("검출")가 13 개의 일반적인 암 (방광암, 뇌암, 유방암, 자궁 경부암, 결장 직장암, 식도암, HNSC, 간암, 폐암, 난소 암, 췌장암, 전립선 암, 위암) 다른 정상 조직의 TCGA 암 환자 3,644 명의 정규화 된 Illumina 450K DNA 메틸화 베타 값을 포함하는 "검증 코호트"에서 이 방법을 사용하여 90-95 %의 암 샘플이 검출되었다 (도 38A).

도 38B에 제시된 ROC 곡선은 다른 정상 조직으로부터 13 개의 암을 검출하기 위한이 메틸화 점수의 특이성 (0.99) 및 민감도 (0.95)를 보여준다 (도 38C).

실시예 35. 흑색 종의 검출을 위한 다 유전자 DNA 메틸화 마커의 발견.

본 발명자들은 TCGA 및 GEO 데이터 세트의 정상 혈액을 "훈련"코호트로 사용하여 무작위로 선택된 10 개의 흑색 종 샘플과 다른 암 (방광암, 뇌암, 유방암, 자궁 경부암, 대장 암, 식도암, HNSC, 간암, 폐암, 난소 암, 췌장암, 전립선 암, 위암)의 220 개 샘플에 대해 정규화 된 Illumina 450K DNA 메틸화 데이터를 사용했다. 그 후, 본 발명자들은 고감도 및 특이성 (도 39, 표 28) (검출-사양)에서 흑색 종을 검출하는 흑색 종 및 최종 후보 CGIDs의 검출을위한 결합 된 CGIDs 목록에 대해 페널티 회귀를 수행 하였다. 가중 DNA 메틸화 점수 및 흑색 종에 대한 임계 값은 실시 예 2에 기재된 바와 같이 CGIDs에 대해 개발되었다.

실시예 36. 흑색 종을 검출하기 위한 흑색 종 다 유전자 DNA 메틸화 마커의 유용성.

본 발명자들은 실시 예 35에서 개발 된 가중 흑색 종 DNA 메틸화 점수 및 역치 ("검출-사양")가 다른 암 및 정상 조직의 TCGA로부터의 475 명의 흑색 종 환자로부터의 정규화 된 Illumina 450K DNA 메틸화 베타 값을 포함하는 "검증 코호트"에서 흑색 종을 검출한다는 것을 입증했다. 이 방법을 사용하여 98 %의 흑색 종 샘플이 검출되었다 (도 40A). 도 40B에 제시된 ROC 곡선은 다른 정상 조직 및 다른 암으로부터 흑색 종을 검출하기 위한 이 메틸화 점수의 특이성 (0.98) 및 민감도 (0.95)를 나타낸다 (도 40C). 이러한 DNA 메틸화 마커와 메틸화 값에서 계산 된 메틸화 점수는 조직, 대변, 타액, 혈장 및 소변에서 환자와 다른 생체 물질을 사용하는 일반적인 건강한 인구뿐만 아니라 위험에 처한 사람들의 흑색 종을 조기에 발견하는 데 사용할 수 있다.

실시예 37. 급성 골수성 백혈병 (AML)의 검출을 위한 다 유전자 DNA 메틸화 마커의 발견.

본 발명자들은 "훈련"코호트로서 GEO 데이터 세트에서 무작위로 선택된 10 개의 AML 샘플과 10 개의 정상 혈액 샘플에 대해 정규화 된 Illumina 450K DNA 메틸화 데이터를 사용했다. 그 후 본 발명자들은 고감도 및 특이성 (도 41, 표 27)에서 흑색 종을 검출하는 AML 및 최종 후보 CGIDs의 검출을위한 결합 된 CGIDs 목록에 대해 페널티 회귀를 수행 하였다 (검출-사양). 가중 DNA 메틸화 점수 및 흑색 종에 대한 임계 값은 실시 예 2에 기재된 바와 같이 CGIDs에 대해 개발되었다.

실시예 38. 혈액 DNA에서 AML을 검출하기 위한 급성 골수성 백혈병 (AML) 다 유전자 DNA 메틸화 마커의 유용성.

본 발명자들은 실시 예 37에서 개발 된 가중 흑색 종 DNA 메틸화 점수 및 역치 ("검출-사양")가 TGCA 및 정상 혈액 환자로부터 GEO 및 140 명의 AML 환자 79 명의 정규화 된 Illumina 450K DNA 메틸화 베타 값을 포함하는 "검증 코호트"에서 AML을 검출 함을 입증했다. 이 방법을 사용하여 100 %의 AML 샘플이 검출되었습니다 (도 42A). 도 42B에 제시된 ROC 곡선은 혈액으로부터 AML을 검출하기위한이 메틸화 점수의 특이성 (1) 및 민감도 (1)를 나타낸다 (도 42C). 이러한 DNA 메틸화 마커와 메틸화 값에서 계산 된 메틸화 점수는 혈액 DNA를 사용하는 일반적인 건강한 인구뿐만 아니라 위험에 처한 사람들의 AML을 조기에 발견하는 데 사용할 수 있다.

실시예 39. 비설파이트 전환, 멀티플렉스 증폭 및 차세대 시퀀싱 및 전립선 암 예측을 위한 메틸화 점수의 계산.

혈액은 K3-EDTA가 포함 된 9ml 튜브에 수집되어 1 시간 이내에 처리되었습니다. 신선한 혈액 샘플은 4 ° C에서 10 분 동안 1000g에서 원심 분리되었다. 상층 액을 세포층을 방해하지 않고 조심스럽게 팔콘 튜브로 옮기고 나머지 세포를 완전히 제거하기 위해 다시 10 분 동안 원심 분리하고 -80 ° C에서 냉동시켰다. 혈장 샘플을 해동하고, 여러 가지 방법으로 DNA를 추출하고 혈장 DNA 용 Qiagen 키트 또는 EZ DNA 직접 추출 방법과 같은 혈장 DNA 추출 용 키트를 사용한다. DNA는 AMPure XP 마그네틱 비드와 같은 상업적으로 이용 가능한 방법을 사용하여 정제되고 정제 된 DNA는 예를 들어 EZ DNA bisulfite 처리 키트를 사용하여 sodium bisulfite로 처리됩니다. 표적 서열의 라이브러리는 2 단계 PCR 반응에 의해 생성된다 (도 40). 첫 번째 PCR 반응은 표 5 및 6의 특정 CGIDs를 표적으로하며, PCR1 프라이머는 두 번째 PCR2 프라이머에 대한 상보 적 서열을 가지고 있다 (도 40). 본 발명자들은 HIF3A (232 염기쌍 영역), TPM4 (213 염기쌍 영역) 및 CTTN (199 염기쌍 영역)에서 전립선 암을 검출하는 CGIDs를 포함하는 3 개의 DNA 서열을 동시에 증폭하기 위해 HEK293 세포에서 인간 bisulfite 변환 된 게놈 DNA를 사용했다. 표준 Taq 중합 효소 반응에서 다음 프라이머를 사용한 다중 PCR 반응: CGID cg02879662의 경우; 정방향 프라이머 :5'ACACTCTTTCCCTACACgACgCTCTTCCgATCTNNNNNGGTAGGAGTTTTGGGAATTGG3' 및 역방향 프라이머: 5'gTgACTggAgTTCAgACgTgTgCTCTTCCgATCTCCACCCCTACAATCCCTAA3'

CGID cg16232979; 정방향 프라이머:

5'ACACTCTTTCCCTACACgACgCTCTTCCgATCT NNNNNYGGTTTYGGGTTTYGTATT3'

및 역방향 프라이머:

5'gTgACTggAgTTCAgACgTgTgCTCTTCCgATCTACRCAAAAATATAAATCRACRATC3'

CGID: cg14041701 및 cg14498227; 정방향 프라이머:

5'ACACTCTTTCCCTACACgACgCTCTTCCgATCTNNNNNGTTTTGYGTTTYGGATTTGGGTT3'

및 역방향 프라이머:

5'gTgACTggAgTTCAgToACgTgTgCTCTTCCgATCTCATAAACAACACCTTTAAATAAACACTAAA3'. 증폭 된 단편을 아가 로스 겔에서 분획 화했다.

샘플을 바코드 화하기 위해 다음 프라이머로 두 번째 PCR 반응을 사용한다:

정방향 프라이며: 5'AATgATACggCgACCACCgAgATCTACACTCTTTCCCTACACgAC3'

바코드 프라이머 (역방향):

5' CAAgCAgAAgACggCATACgAgATAGTCATCG gTgACTggAgTTCAgACgTg3' (굵은 염기는 색인이다; 이 색인의 200 개의 변형이 사용된다. 두 번째 프라이머 세트는 각 환자에 대한 색인과 역방향 및 순방향 시퀀싱 프라이머를 설명한다. 전립선 암 HIF3A 232 bp의 세 가지 마커에 대한 다중 PCR1 반응 , TPM4 213 bp 및 CTTN 199 bp는 도 41에 표시된대로 다양한 프라이머 농도를 사용하여 오른쪽 패널에 표시된다.

실시예 40 : 비설파이트 전환, 멀티플렉스 증폭 및 차세대 시퀀싱 및 암 예측을 위한 메틸화 점수 계산 방법의 유용성.

본 발명자들은 실시예 35가 동시에 수백 명의 환자로부터의 혈장 샘플을 사용하여 전립선 암 및 다른 암의 높은 처리량 예측에 사용될 수 있음을 입증한다. 고도로 예측 가능한 CG IDs의 증폭 및 암을 나타내는 메틸화 점수를 계산하기 위한 간소화된 방법은 전립선 암 및 다른 암의 조기 발견에 사용될 수 있다.

실시예 41. 선택된 바이오마커는 건강한 사람들의 혈장에서 실제 BCD 특성이 완전히 저 메틸화되었음을 나타내는 입증.

40 명의 건강한 개인으로부터 제조된 혈장으로부터 혈장 DNA를 추출하고 하기 암에 대해 암 특이적 프라이머로 표적화 증폭 시켰다 : 간, 전립선, 폐(도 43) 및 위, 전립선 암 및 CRC(도 44)에 이어 실시예 39 및 40에 기술된 바와 같이 제 2 세트의 증폭 (PCR 2) 및 차세대 시퀀싱을 사용하여 바코딩한다. 모든 CGs는 건강한 사람의 혈장에서 매우 낮은 수준의 메틸화를 나타냈다(그림 43 및 44).

실시예 42. DNA 메틸화 수준을 결정하기 위한 생물 정보학 워크-플로우.

PCR2 생성물을 정량화하고 정제하여 Miseq Illumina 시퀀스에서 다음 세대 시퀀스를 수행한다. 인덱스된 시퀀싱을 위해Illumina 소프트웨어를 사용하여 시퀀스를 역다중화하고(demultiplexed), 각 환자에 대해 FASTQ 파일을 생성한다.

A Perl 텍스트 편집 스크립트 https://www.activestate.com/activeperl/downloads는 CG IDS 당 환자 당 FASTQ 파일에서 Ts 및 Cs를 계산하고 C/C+T의 수를 나누어 환자의 CG ID에서 메틸화된 Cs의 분율을 정량화하는 데 사용된다(도 42 참조). 아웃풋(output) CSV 파일은 다음 방정식을 사용하여 각 환자의 메틸화 점수(Ms)를 계산하는 데 사용된다: Ms=α+

여기서 CG ID i에 대한 α=절편 β=계수, CG=1 내지 n의 CG IDs 의 조합에서 CG 당 메틸화 레벨. n=조합된 CGs 수. MS=메틸화 점수.

본 발명의 주제의 응용

본 발명은 일반적으로 분자 진단 및 암의 조기 예측 분야에 있다. 당업자는 본 발명을 이용하여 세포 암 및 세포 유리 DNA를 신경계 질환, 당뇨병, 심혈관 질환에서 간경변 및 심장 조직 손상과 같은 심장 질병과 같은 시스템으로 흘리는 다른 암 및 다른 질병의 조기 예측을 위해 유사한 비 침습성 바이오 마커를 유도할 수 있다. 본 발명의 주제는 BCD 및 BCDhypo 방법을 사용하여 특정 세포 유형 및 조직의 절묘한 메틸화 마커를 찾는 경로를 제공한다. 또한 암을 조기에 검출하고 생존율을 현저하게 향상시키고 암으로부터 치료하기 위해 당업자에 의해 사용될 수 있는 광범위한 암의 조기 예측을위한 방법 및 바이오 마커가 개시된다. 본 발명에 의해 개시된 방법은 건강한 집단의 일상적인 스크리닝을 위해 당업자에 의해 사용될 수 있으며, 암에 걸리기 시작한 사람들을 식별하고 즉시 치료하고 암 사망률과 이환율로 인한 심각한 개인적 사회적 경제적 결과를 방지하기 위해, "위험이 높은"사람을 모니터링하고 재발 또는 전이를 탐지하기 위해 치료를 받는 환자의 치료에 대한 반응을 모니터링 할 수 있다. 건강 제공자(health providers) 및 건강 검진 시설에 의한 일상적인 건강 관리 관리를 위해 설명된 본 발명의 채택은 건강 관리 비용뿐만 아니라 암의 부담을 감소시키는 데 큰 영향을 미칠 것이다.

본 발명의 주제가 다수의 상이한 종속 청구항을 포함한다는 사실은 암을 예측하기 위해 이들 청구항의 조합을 사용할 수 없다는 것을 의미하지는 않는다. 암을 측정하고 통계적으로 분석하고 예측하기 위해 본 명세서에 개시된 실시예는 제한적인 것으로 간주되어서는 안된다. Illumina EPIC 어레이, 포획 어레이 시퀀싱, 차세대 시퀀싱, 메틸화 특이적 PCR, 에피타이퍼(epitype), 제한 효소-기반 분석 및 공개 도메인에서 기타 방법과 같은 암 환자에서 DNA 메틸화를 측정하기 위해 다양한 다른 변형이 당업자에게 명백할 것이다. 유사하게, 환자 샘플에서 암을 예측하기 위해 본 발명의 주제를 사용하기 위해 여기에 열거된 것들에 더하여 공개 영역에서 수많은 통계적 방법이 존재한다.

본 발명의 주제는 하나 이상의 바람직한 실시예를 포함하는 실시예와 관련하여 설명되었지만, 청구된 주제의 사상 및 범위를 벗어나지 않고 많은 다른 가능한 수정 및 변형이 이루어질 수 있음을 이해해야 한다.

Claims

암의 "이진-범주형" DNA 메틸화 서명를 사용하여 암을 탐지하는 방법으로서,
게놈 와이드 DNA 메틸화 맵(genome wide DNA methylation maps)에서 "이진-범주형 분화(BCD)" 방법을 사용하여 상기 "이진" DNA 메틸화 서명을 유도하는 단계를 포함하는
방법.
제1항에 있어서,
상기 게놈 와이드 DNA 메틸화 맵은 암 세포, 정상 조직 및 혈액 DNA 중 하나 이상인
방법.
제1항에 있어서,
상기 "이진-범주형 분화(BCD)" 방법은 다음 중 하나 이상의 사용을 포함하는 방법: Illumina 27K, 450K 또는 EPIC 어레이, 게놈 와이드 비설파이트 시퀀싱(genome wide bisulfite sequencing), 메틸화 DNA 면역침전(MeDIP)시퀀싱 및 올리고뉴클레오티드(oligonucleotide) 어레이와의 혼성화.
제1항에 있어서,
"암 메틸화 점수"를 도출 한 다음 표 및 하위 집합에서 종양에서 유래 된 DNA에서 "이진 범주"또는 선형 회귀 방정식 사용하여 타액, 소변, 대변 및 무 세포 혈장 DNA와 같은 환자 유래의 생물학적 물질에서 표와 하위 집합은 다음과 같으며, 하나 이상의 CG IDs의 DNA 메틸화 수준을 측정하여 간세포 암종 (HCC) 간암 (검출)을 검출하고 다른 종양 (spec)과 구별하기 위한 방법:

탐지를 위한 부분 집합 : cg02012576, cg03768777, cg24804544, cg05739190; 과
스펙을 위한 부분 집합 : cg14126493.
제1항에 있어서,
타액, 소변, 대변 및 무 세포 혈장 DNA와 같은 표와 하위 집합은 다음과 같은 환자 유래 생물학적 물질의 종양 유래 DNA에서 "이진 범주" 또는 선형 회귀 방정식 및 ROC (수신자 작동 특성) 분석 사용하여 하기 표 및 서브 세트로부터 하나 이상의 CG IDs의 DNA 메틸화 수준을 측정하고 "암 메틸화 점수"를 유도함으로써 폐암을 검출하고 다른 종양 (spec)과 구별하기 위한 방법:

탐지를 위한 부분 집합:
cg04223424, cg23141355; 및
스펙을 위한 부분 집합:
cg05917732, cg25470077
제1항에 있어서,
타액, 소변, 대변 및 무 세포 혈장 DNA와 같은 표와 하위 집합은 다음과 같은 환자 유래 생물학적 물질의 종양 유래 DNA에서 "이진 범주"또는 선형 회귀 방정식 및 ROC (수신자 작동 특성) 분석 사용하여 하기 표 및 서브 세트로부터 하나 이상의 CG IDs의 DNA 메틸화 수준을 측정하고 "암 메틸화 점수"를 유도함으로써 전립선 암을 검출하고 다른 종양 (spec)과 구별하기 위한 방법:

검출_스펙을 위한 부분집합:
cg14283569.
제1항에 있어서,
타액, 소변, 대변 및 무 세포 혈장 DNA와 같은 표와 하위 집합은 다음과 같은 환자 유래 생물학적 물질의 종양 유래 DNA에서 "이진 범주"또는 선형 회귀 방정식 및 ROC (수신자 작동 특성) 분석 사용하여 하기 표 및 서브 세트로부터 하나 이상의 CG IDs의 DNA 메틸화 수준을 측정하고 "암 메틸화 점수"를 유도함으로써 유방 암을 검출하고 다른 종양 (spec)과 구별하기 위한 방법:

검출을 위한 부분 집합:
cg13031251, cg09734791, cg09695735, cg03637878; 및
스펙을 위한 부분 집합:
cg03113878, cg20180843.
제1항에 있어서,
타액, 소변, 대변 및 무 세포 혈장 DNA와 같은 표와 하위 집합은 다음과 같은 환자 유래 생물학적 물질의 종양 유래 DNA에서 "이진 범주"또는 선형 회귀 방정식 및 ROC (수신자 작동 특성) 분석 사용하여 하기 표 및 서브 세트로부터 하나 이상의 CG IDs의 DNA 메틸화 수준을 측정하고 "암 메틸화 점수"를 유도함으로써 결장 직장암(CRC)을 검출하고 다른 종양 (spec)과 구별하기 위한 방법:

검출-스펙을 위한 부분 집합:
cg09854653, cg01566242.
제1항에 있어서,
타액, 소변, 대변 및 무 세포 혈장 DNA와 같은 표와 하위 집합은 다음과 같은 환자 유래 생물학적 물질의 종양 유래 DNA에서 "이진 범주"또는 선형 회귀 방정식 및 ROC (수신자 작동 특성) 분석 사용하여 하기 표 및 서브 세트로부터 하나 이상의 CG IDs의 DNA 메틸화 수준을 측정하고 "암 메틸화 점수"를 유도함으로써 췌장암을 검출하고 다른 종양 (spec)과 구별하기 위한 방법:

검출을 위한 부분 집합:
cg25024074, cg15386964, cg16232979; 및
스펙을 위한 부분 집합:
cg01237565, cg08182975, cg20983577, cg25591377.
제1항에 있어서,
타액, 소변, 대변 및 무 세포 혈장 DNA와 같은 표와 하위 집합은 다음과 같은 환자 유래 생물학적 물질의 종양 유래 DNA에서 "이진 범주"또는 선형 회귀 방정식 및 ROC (수신자 작동 특성) 분석 사용하여 하기 표 및 서브 세트로부터 하나 이상의 CG IDs의 DNA 메틸화 수준을 측정하고 "암 메틸화 점수"를 유도함으로써 뇌암(교모세포종)을 검출하고 다른 종양 (spec)과 구별하기 위한 방법:

검출 및 스펙을 위한 부분 집합:
cg19929355.
제1항에 있어서,
타액, 소변, 대변 및 무 세포 혈장 DNA와 같은 표와 하위 집합은 다음과 같은 환자 유래 생물학적 물질의 종양 유래 DNA에서 "이진 범주"또는 선형 회귀 방정식 및 ROC (수신자 작동 특성) 분석 사용하여 하기 표 및 서브 세트로부터 하나 이상의 CG IDs의 DNA 메틸화 수준을 측정하고 "암 메틸화 점수"를 유도함으로써 위(복부)암을 검출하고 다른 종양 (spec)과 구별하기 위한 방법:

검출을 위한 부분 집합:
cg05611779, cg09734791, cg15760257; 및
스펙을 위한 부분 집합:
cg05611779, cg19235339.
제1항에 있어서,
타액, 소변, 대변 및 무 세포 혈장 DNA와 같은 표와 하위 집합은 다음과 같은 환자 유래 생물학적 물질의 종양 유래 DNA에서 "이진 범주"또는 선형 회귀 방정식 및 ROC (수신자 작동 특성) 분석 사용하여 하기 표 및 서브 세트로부터 하나 이상의 CG IDs의 DNA 메틸화 수준을 측정하고 "암 메틸화 점수"를 유도함으로써 난소 암을 검출하고 다른 종양 (spec)과 구별하기 위한 방법:

검출을 위한 부분 집합:
cg24339193, cg22694153, cg11252337, cg21210985; 및
스펙을 위한 부분 집합:
cg07068768, cg19846609.
제1항에 있어서,
타액, 소변, 대변 및 무 세포 혈장 DNA와 같은 표와 하위 집합은 다음과 같은 환자 유래 생물학적 물질의 종양 유래 DNA에서 "이진 범주"또는 선형 회귀 방정식 및 ROC (수신자 작동 특성) 분석 사용하여 하기 표 및 서브 세트로부터 하나 이상의 CG IDs의 DNA 메틸화 수준을 측정하고 "암 메틸화 점수"를 유도함으로써 자궁 경부암을 검출하고 다른 종양 (spec)과 구별하기 위한 방법:

검출을 위한 부분 집합:
cg00757182, cg01601746; 및
스펙을 위한 부분 집합:
cg07066594, cg09260640, cg12961842.
제1항에 있어서,
타액, 소변, 대변 및 무 세포 혈장 DNA와 같은 표와 하위 집합은 다음과 같은 환자 유래 생물학적 물질의 종양 유래 DNA에서 "이진 범주"또는 선형 회귀 방정식 및 ROC (수신자 작동 특성) 분석 사용하여 하기 표 및 서브 세트로부터 하나 이상의 CG IDs의 DNA 메틸화 수준을 측정하고 "암 메틸화 점수"를 유도함으로써 두경부 편평 세포 암을 검출하고 다른 종양 (spec)과 구별하기 위한 방법:

검출을 위한 부분 집합:
cg07900968, cg20334243, cg27420520; 및
스펙을 위한 부분 집합:
cg18006328, cg19287220.
제1항에 있어서,
타액, 소변, 대변 및 무 세포 혈장 DNA와 같은 표와 하위 집합은 다음과 같은 환자 유래 생물학적 물질의 종양 유래 DNA에서 "이진 범주"또는 선형 회귀 방정식 및 ROC (수신자 작동 특성) 분석 사용하여 하기 표 및 서브 세트로부터 하나 이상의 CG IDs의 DNA 메틸화 수준을 측정하고 "암 메틸화 점수"를 유도함으로써 식도암을 검출하고 다른 종양 (spec)과 구별하기 위한 방법:

검출을 위한 부분 집합:
cg03280624, cg03735888, cg27420520, cg09734791; 및
스펙을 위한 부분 집합:
cg09556952, cg12473285.
제1항에 있어서,
타액, 소변, 대변 및 무 세포 혈장 DNA와 같은 표와 하위 집합은 다음과 같은 환자 유래 생물학적 물질의 종양 유래 DNA에서 "이진 범주"또는 선형 회귀 방정식 및 ROC (수신자 작동 특성) 분석 사용하여 하기 표 및 서브 세트로부터 하나 이상의 CG IDs의 DNA 메틸화 수준을 측정하고 "암 메틸화 점수"를 유도함으로써 방광암을 검출하고 다른 종양 (spec)과 구별하기 위한 방법:

검출을 위한 부분 집합:
cg04223424, cg10723962, cg25024074; 및
스펙을 위한 부분 집합:
cg13544006.
제1항에 있어서,
타액, 소변, 대변 및 무 세포 혈장 DNA와 같은 표와 하위 집합은 다음과 같은 환자 유래 생물학적 물질의 종양 유래 DNA에서 "이진 범주"또는 선형 회귀 방정식 및 ROC (수신자 작동 특성) 분석 사용하여 하기 표 및 서브 세트로부터 하나 이상의 CG IDs의 DNA 메틸화 수준을 측정하고 "암 메틸화 점수"를 유도함으로써 신장 암을 검출하고 다른 종양 (spec)과 구별하기 위한 방법:

검출 스펙을 위한 부분 집합:
cg08884571, cg00011225, cg00011225.
제1항에 있어서,
타액, 소변, 대변 및 무 세포 혈장 DNA와 같은 표와 하위 집합은 다음과 같은 환자 유래 생물학적 물질의 종양 유래 DNA에서 "이진 범주"또는 선형 회귀 방정식 및 ROC (수신자 작동 특성) 분석 사용하여 하기 표 및 서브 세트로부터 하나 이상의 CG IDs의 DNA 메틸화 수준을 측정하고 "암 메틸화 점수"를 유도함으로써 고환암을 검출하고 다른 종양 (spec)과 구별하기 위한 방법:

검출 스펙을 위한 부분 집합:
cg14531093, cg25159927.
제1항에 있어서,
타액, 소변, 대변 및 무 세포 혈장 DNA와 같은 표와 하위 집합은 다음과 같은 환자 유래 생물학적 물질의 종양 유래 DNA에서 "이진 범주"또는 선형 회귀 방정식 및 ROC (수신자 작동 특성) 분석 사용하여 하기 표 및 서브 세트로부터 하나 이상의 CG IDs의 DNA 메틸화 수준을 측정하고 "암 메틸화 점수"를 유도함으로써 13개의 일반적인 고형 종양(팬암)을 검출하고 다른 종양 (spec)과 구별하기 위한 방법:

검출을 위한 부분 집합:
cg10723962, cg15759056, cg24427504, cg25024074.
제1항에 있어서,
타액, 소변, 대변 및 무 세포 혈장 DNA와 같은 표와 하위 집합은 다음과 같은 환자 유래 생물학적 물질의 종양 유래 DNA에서 "이진 범주"또는 선형 회귀 방정식 및 ROC (수신자 작동 특성) 분석 사용하여 하기 표 및 서브 세트로부터 하나 이상의 CG IDs의 DNA 메틸화 수준을 측정하고 "암 메틸화 점수"를 유도함으로써 혈액암을 검출하고 다른 종양 (spec)과 구별하기 위한 방법:
제1항에 있어서,
타액, 소변, 대변 및 무 세포 혈장 DNA와 같은 표와 하위 집합은 다음과 같은 환자 유래 생물학적 물질의 종양 유래 DNA에서 "이진 범주"또는 선형 회귀 방정식 및 ROC (수신자 작동 특성) 분석 사용하여 하기 표 및 서브 세트로부터 하나 이상의 CG IDs의 DNA 메틸화 수준을 측정하고 "암 메틸화 점수"를 유도함으로써 급성 골수성 백혈병 (AML)을 검출하고 다른 종양 (spec)과 구별하기 위한 방법:

검출-스펙을 위한 부분 집합:
cg18658397, cg18780412, cg20439288, cg22828045, cg25375340.
제1항에 있어서,
타액, 소변, 대변 및 무 세포 혈장 DNA와 같은 표와 하위 집합은 다음과 같은 환자 유래 생물학적 물질의 종양 유래 DNA에서 "이진 범주"또는 선형 회귀 방정식 및 ROC (수신자 작동 특성) 분석 사용하여 하기 표 및 서브 세트로부터 하나 이상의 CG IDs의 DNA 메틸화 수준을 측정하고 "흑색종 메틸화 점수"를 유도함으로써 흑색 종을 검출하고 다른 종양 (spec)과 구별하기 위한 방법:

검출-스펙을 위한 부분 집합:
cg15307891, cg18866529, cg27084903.
제1항의 방법에 따른 DNA 메틸화 스코어의 DNA 메틸화 측정을 유도하기 위해 사용되는 장비 및 1개 이상의 시약을 포함하는
암 검출용 키트.
제4항의 방법에 따른 DNA 메틸화 서명의 DNA 메틸화 측정을 위한 장비 및 1개 이상의 시약을 포함하는
간세포 암종(HCC) 검출용 키트.
제5항의 방법에 따른 DNA 메틸화 서명의 DNA 메틸화 측정을 위한 장비 및 1개 이상의 시약을 포함하는
폐암 검출용 키트.
제6항의 방법에 따른 DNA 메틸화 서명의 DNA 메틸화 측정을 위한 장비 및 1개 이상의 시약을 포함하는
전립선 암 검출용 키트.
제7항의 방법에 따른 DNA 메틸화 서명의 DNA 메틸화 측정을 위한 장비 및 1개 이상의 시약을 포함하는
유방암 검출용 키트.
제8항의 방법에 따른 DNA 메틸화 서명의 DNA 메틸화 측정을 위한 장비 및 1개 이상의 시약을 포함하는
대장암 검출용 키트.
제9항의 방법에 따른 DNA 메틸화 서명의 DNA 메틸화 측정을 위한 장비 및 1개 이상의 시약을 포함하는
췌장암 검출용 키트.
제10항의 방법에 따른 DNA 메틸화 서명의 DNA 메틸화 측정을 위한 장비 및 1개 이상의 시약을 포함하는
뇌암 "교모세포종" 검출용 키트.
제11항의 방법에 따른 DNA 메틸화 서명의 DNA 메틸화 측정을 위한 장비 및 1개 이상의 시약을 포함하는
뇌암 "교모세포종" 검출용 키트.
제12항의 방법에 따른 DNA 메틸화 서명의 DNA 메틸화 측정을 위한 장비 및 1개 이상의 시약을 포함하는
뇌암 "교모세포종" 검출용 키트.
제13항의 방법에 따른 DNA 메틸화 서명의 DNA 메틸화 측정을 위한 장비 및 1개 이상의 시약을 포함하는
뇌암 "교모세포종" 검출용 키트.
제14항의 방법에 따른 DNA 메틸화 서명의 DNA 메틸화 측정을 위한 장비 및 1개 이상의 시약을 포함하는
뇌암 "교모세포종" 검출용 키트.
제15항의 방법에 따른 DNA 메틸화 서명의 DNA 메틸화 측정을 위한 장비 및 1개 이상의 시약을 포함하는
뇌암 "교모세포종" 검출용 키트.
제16항의 방법에 따른 DNA 메틸화 서명의 DNA 메틸화 측정을 위한 장비 및 1개 이상의 시약을 포함하는
뇌암 "교모세포종" 검출용 키트.
제17항의 방법에 따른 DNA 메틸화 서명의 DNA 메틸화 측정을 위한 장비 및 1개 이상의 시약을 포함하는
뇌암 "교모세포종" 검출용 키트.
제18항의 방법에 따른 DNA 메틸화 서명의 DNA 메틸화 측정을 위한 장비 및 1개 이상의 시약을 포함하는
뇌암 "교모세포종" 검출용 키트.
제19항의 방법에 따른 DNA 메틸화 서명의 DNA 메틸화 측정을 위한 장비 및 1개 이상의 시약을 포함하는
뇌암 "교모세포종" 검출용 키트.
제20항의 방법에 따른 DNA 메틸화 서명의 DNA 메틸화 측정을 위한 장비 및 1개 이상의 시약을 포함하는
뇌암 "교모세포종" 검출용 키트.
제21항의 방법에 따른 DNA 메틸화 서명의 DNA 메틸화 측정을 위한 장비 및 1개 이상의 시약을 포함하는
뇌암 "교모세포종" 검출용 키트.
제22항의 방법에 따른 DNA 메틸화 서명의 DNA 메틸화 측정을 위한 장비 및 1개 이상의 시약을 포함하는
흑색종 검출용 키트.
제1항 내지 제22항에 있어서,
DNA 메틸화 조합을 사용하여 암을 예측하기 위해 DNA 파이로 시퀀싱 메틸화 분석을 사용하는 단계를 추가로 포함하는 방법.
제1항 내지 제22항에 있어서,
암을 검출하기 위해 Illumina MiSeq와 같은 차세대 시퀀서상에서 다중화 된 증폭 표적화 된 바이 설 파이트 시퀀싱을 사용하는 단계를 추가로 포함하는 방법.
제1항 내지 제22항에 있어서,
암을 예측하기위한 메틸화 점수를 계산하기 위해 "이진 범주 검정"을 사용하는 단계를 추가로 포함하는 방법.
제1항 내지 제22항에 있어서,
암을 예측하기 위해 메틸화 점수를 계산하기 위해 다변량 선형 회귀 방정식을 사용하는 단계를 추가로 포함하는 방법.
제1항 내지 제22항에 있어서,
DNA 메틸화 조합의 측정을 사용함으로써 비암 및 기원 조직으로부터 암을 구별하는 "메틸화 점수"역치를 정의하기 위해 수신기 작동 특성 (ROC) 분석을 사용하는 단계를 추가로 포함하는 방법.
타액, 소변, 혈장, 대변 또는 조직 생검과 같은 체액에서 세포 유리 DNA 기원의 조직을 검출하기위한 DNA 메틸화 시그니처 및 "다원성 DNA 메틸화 마커"를 확인하는 방법으로서, "이원 범주 분화 ( BCD) "방법은 특정 조직의 게놈 전체 DNA 메틸화 맵과 Illumina 27K, 450K 또는 EPIC 어레이, 게놈 전체 바이 설 파이트 시퀀싱, 샘플에서 얻은 DNA 메틸화 측정에 대한 통계 분석을 수행하는 단계를 포함하는, 메틸화 된 DNA 면역 침전 (MeDIP) 시퀀싱 또는 올리고 뉴클레오타이드 어레이와의 혼성화에 대한 방법.
제48항에 있어서,
뇌의 뉴런, 당뇨병의 췌장, 허혈의 심장 및 심장 질환과 같은 질병 조직의 "다원성 DNA 메틸화 마커"를 추가로 확인하며, 상기 혈장에서 죽어가는 뉴런 CF DNA와 같은 확인은 알츠하이머 병과 같은 질병의 조기 발견에 사용되는 방법.
제48항에 있어서,
상기 DNA 메틸화 측정은 하나 이상의 샘플로부터 추출 된 DNA의 Illumina Beadchip 450K 또는 EPIC 분석을 수행하여 얻어지는 방법.
제48항에 있어서,
상기 DNA 메틸화 측정은 iSeq, MiniSeq, MiSeq 또는 NextSeq 시퀀서, 토렌트 시퀀싱, DNA 파이로 시퀀싱, 질량 분석 기반 ( Epityper β) 및 PCR 기반의 샘플에서 추출한 DNA의 메틸화 분석하는 방법.
제48항에 있어서,
상기 통계적 분석은 피어슨 상관 관계를 포함하는 방법.
제48항에 있어서,
상기 통계적 분석은 수신기 작동 특성 (ROC) 분석을 포함하는 방법.
제48항에 있어서,
상기 통계적 분석은 계층 적 클러스터링 분석 분석을 포함하는 방법.