KR20230154009A - 두경부 암의 진단 및 위험 평가 - Google Patents

두경부 암의 진단 및 위험 평가 Download PDF

Info

Publication number
KR20230154009A
KR20230154009A KR1020237028775A KR20237028775A KR20230154009A KR 20230154009 A KR20230154009 A KR 20230154009A KR 1020237028775 A KR1020237028775 A KR 1020237028775A KR 20237028775 A KR20237028775 A KR 20237028775A KR 20230154009 A KR20230154009 A KR 20230154009A
Authority
KR
South Korea
Prior art keywords
cancer
patient
region
head
methylation
Prior art date
Application number
KR1020237028775A
Other languages
English (en)
Inventor
올란도 건티나스-리치우스
다니엘 스타인바치
마티나 슈미츠
알프레드 한셀
Original Assignee
온크그노스틱스 게엠베하
유니벌스타츠크인컴 제나
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 온크그노스틱스 게엠베하, 유니벌스타츠크인컴 제나 filed Critical 온크그노스틱스 게엠베하
Publication of KR20230154009A publication Critical patent/KR20230154009A/ko

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2521/00Reaction characterised by the enzymatic activity
    • C12Q2521/30Phosphoric diester hydrolysing, i.e. nuclease
    • C12Q2521/331Methylation site specific nuclease
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/118Prognosis of disease development
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/154Methylation markers

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Immunology (AREA)
  • Wood Science & Technology (AREA)
  • Pathology (AREA)
  • Genetics & Genomics (AREA)
  • Analytical Chemistry (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • Physics & Mathematics (AREA)
  • Oncology (AREA)
  • Hospice & Palliative Care (AREA)
  • Biotechnology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Investigating Or Analysing Biological Materials (AREA)
  • Apparatus For Radiation Diagnosis (AREA)
  • Measuring Pulse, Heart Rate, Blood Pressure Or Blood Flow (AREA)
  • Magnetic Resonance Imaging Apparatus (AREA)

Abstract

두경부 암의 발병 위험을 평가하는 방법을 기술한다. 본 방법은 유전자 ZNF823과 ZNF833 사이에 위치한 게놈 DNA 서열에서 메틸화 상태를 확인하는 것을 기반으로 하며, 이들 서열이 메틸화된 경우 두경부 암의 발병 위험은 증가한다.

Description

두경부 암의 진단 및 위험 평가
본 발명은 환자에서 두경부 암의 존재 가능성을 평가/진단하는 방법뿐 아니라 환자에서 두경부 암 발병 위험을 평가하는 방법에 관한 것이다. 보다 상세하게는, 본 방법은 환자로부터 수득한 생물학적 샘플에서 19번 염색체의 유전자 ZNF823과 유전자 ZNF833 사이에 존재하는 게놈 영역의 메틸화 상태를 확인하는 것을 수반하며, 샘플에서 게놈 영역이 메틸화된 경우 그 환자는 두경부 암을 앓거나 또는 두경부 암을 앓을 가능성이 높거나 및/또는 두경부 암 발병 위험이 높은 것이다.
"IARC" (International Agency for Research on Cancer)에 따르면, 2015년에 전세계적으로 약 657,000명이 두경부 암 (구강 암, 입술 암, 코 암, 입 암, 하인두 암)으로 진단되었으며, 약 336,000명이 이러한 암으로 사망하였다 (Bray et al., 2018, Global cancer statistics 2018: GLOBOCAN estimates of incidence and mortality worldwide for 36 cancers in 185 countries, CA Cancer J Clin 68:394-424). 이 암의 사망률이 비교적 높은 주된 이유는 조기 검출 검사가 부족해 질환이 늦게 발견되기 때문이며, 일부 경우에는 치료 가능성이 좋지 않기 때문이다. 두경부 암의 발병률은 더 증가할 것으로 예상된다. 새로운 사례의 건수 증가는 아마도 두경부 영역에 종양을 유발할 수 있는 인간 파필로마바이러스 (HPV) 감염의 전파 증가와도 관련 있을 수 있다.
인간 파필로마바이러스 감염은, 알코올 및 담배 남용과 더불어, 질환의 주된 위험 인자 중 하나이다. 이는 주로 구인두 암종의 발병과 관련 있다. 편도가 가장 크게 영향을 받는다. 이 종양을 진단하기 위해 이용가능한 일부 검사는 환자의 HPV 감염 상태에 의존하며, 바이러스 검출을 기반으로 한다.
여러 간행물들에서 메틸화 마커가 자궁경부 암종과 같은 특정 암을 조기 검출하는 분야에서 분자 진단제로서 일반적으로 적합한 것으로 밝혀졌다. 예를 들어, Wang et al., 2008, Cancer Res. 68:2489에는 자궁경부 암종에서 새로운 메틸화 마커의 동정이 언급되어 있다. 나아가, Huang et al., 2008, Abstract # 50, 99th Annual Meeting of the American Association for Cancer Research, San Diego, CA, USA에는 난소암에 대한 잠재적인 후생유전학적 마커로서 CIDEA 및 RXFP3의 과도한 메틸화가 언급되어 있다.
유럽 특허 2 478 117 B1은 CIN3 및 자궁경부 암종을 검출하기 위해 ASTN1 및 ZNF671 유전자의 프로모터/5'-영역에서 과도한 메틸화를 검출하는 것을 기술하고 있으며, Schmitz et al., 2017, Clin. Epigenetics 9: Article number 118에서는 고-위험의 파필로마바이러스 DNA-양성 여성을 분류하기 위한 ASTN1, DLX1, ITGA4, RXFP3, SOX17 및 ZNF671과 같은 DNA 메틸화 마커의 용도를 기술하고 있다.
환자에서 암을 앓거나 또는 암 발병 가능성을 평가하는데 유용한 진단 방법들이 다수 존재한다. 그럼에도 불구하고, 환자에서, 예를 들어 두경부 조직에 암 징후가 없을 경우에, 두경부 암의 발병 위험을 결정하거나 진단하기 위한 방법이 당해 기술 분야에서 요구되고 있다. 아래에서 기술된 본 발명은 이러한 필요성을 충족시킨다.
본 발명은 적어도 부분적으로 유전자 ZNF823과 ZNF833 사이에 위치한 영역의 메틸화 상태가 두경부 암을 앓거나 또는 두경부 암이 발병할 상대적인 위험성 또는 가능성/진단과 연관성이 있다는 본 발명자들의 발견을 토대로 한다. 이 영역은 2013년 12월 현재 최종 인간 게놈 어셈블리 hg38에서 인간 19번 염색체의 뉴클레오티드 11,686,870와 뉴클레오티드 11,721,264 사이에 위치한다. 이 영역은 도 1에서 도시되며, 그 서열은 서열번호 1에 나타낸다. 이 영역은 시토신 (C)과 구아닌 (G) 뉴클레오티드 비율이 높은 것을 특징으로 하며, 적어도 59개의 CpG 다이뉴클레오티드로 이루어진 CpG 섬 (CpG island)을 포함한다.
이에, 일 측면에서, 본 발명은 환자로부터 수득한 생물학적 샘플에서 19번 염색체의 유전자 ZNF823과 유전자 ZNF833 사이에 존재하는 게놈 영역의 메틸화 상태를 확인하는 것을 포함하는, 인간 환자에서 두경부 암의 발병 위험을 평가하는 방법에 관한 것이다. 일 측면에서, 본 발명은 환자로부터 수득한 생물학적 샘플에서 19번 염색체의 유전자 ZNF823과 유전자 ZNF833 사이에 존재하는 게놈 영역의 메틸화 상태를 확인하는 것을 포함하는, 인간 환자에서 두경부 암의 발병 위험을 평가하는 방법에 관한 것이다. 일 측면에서, 본 발명은 환자로부터 수득한 생물학적 샘플에서 19번 염색체의 유전자 ZNF823과 유전자 ZNF833 사이에 존재하는 게놈 영역의 메틸화 상태를 확인하는 것을 포함하는, 인간 환자에서 두경부 암의 존재를 진단하는 방법에 관한 것이다. 일 구현예에서, 생물학적 샘플에서 게놈 영역이 메틸화되었을 경우, 그 환자는 두경부 암의 발병 위험이 높거나 또는 환자는 두경부 암이 존재할 가능성이 높거나, 또는 환자는 두경부 암을 앓고 있는 것이다. 일 구현예에서, 게놈 영역의 메틸화 수준은 최대 메틸화 수준에 대해 1%, 2%, 3%, 4%, 5%, 10%, 15%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95% 또는 100% 수준일 수 있다.
일 구현예에서, 유전자 ZNF823과 유전자 ZNF833 사이의 게놈 영역은 인간 19번 염색체에서 뉴클레오티드 11,686,870에서 뉴클레오티드 11,721,264까지이다. 일 구현예에서, 게놈 영역은 인간 19번 염색체에서 뉴클레오티드 11,694,447에서 뉴클레오티드 11,695,085까지이다. 본 발명에서, 유전자 및 뉴클레오티드 위치는 2013년 12월 현재 완전한 최종 인간 게놈 어셈블리 hg38에 명시된 바와 같다.
일 구현예에서, 인간 19번 염색체에서 뉴클레오티드 11,694,447과 뉴클레오티드 11,695,085 사이에 위치한 CpG 다이뉴클레오티드 하나 이상이 메틸화될 수 있다. 일 구현예에서, 인간 19번 염색체에서 뉴클레오티드 11,694,447과 뉴클레오티드 11,695,085 사이에 위치한 CpG 다이뉴클레오티드들 중 적어도 0.5%, 1%, 2%, 3%, 4%, 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95% 또는 100%가 메틸화될 수 있다. 이 영역의 메틸화 상태는 대조군 샘플에서 동일 영역의 메틸화 상태와 비교될 수 있다. 대조군 샘플은 19번 염색체에서 유전자 ZNF823과 유전자 ZNF833 사이에 위치한 게놈 영역이 메틸화되지 않은 것으로 확인된 조직으로부터 수득된 샘플이거나, 또는 공지된 메틸화 값 또는 수준을 반영하는 표준일 수 있다. 대조군 샘플은 또한 19번 염색체에서 유전자 ZNF823과 유전자 ZNF833 사이에 위치한 게놈 영역이 메틸화되지 않은 것으로 확인된 다른 환자로부터 수득된 생물학적 샘플일 수도 있다.
두경부 암은 입 및 혀의 암, 코 암, 비인두 암, 인후 암, 하인두 암, 후두 암, 기도 암, 식도 암, 편도 암, 부비강 암 또는 침샘 암일 수 있다.
일 구현예에서, 환자로부터 수득한 생물학적 샘플은 머리 및/또는 목의 세포를 함유할 수 있다. 일 구현예에서, 생물학적 샘플은 조직 생검 (tissue biopsy)일 수 있으며, 바람직하게는 인후, 목, 입, 비강, 식도, 편도 및/또는 침샘의 세포를 포함하는 조직 생검일 수 있다. 일 구현예에서, 생물학적 샘플은 타액, 혈액, 객담, 기관지 흡인물 (bronchial aspirate), 소변, 대변, 담즙, 위장 분비물 또는 림프액이고, 바람직하게는 인후, 목, 입, 비강, 식도, 편도 및/또는 침샘의 세포를 포함하는 것이다.
본 발명의 방법은 환자로부터 수득한 다른 생물학적 샘플에서 또는 환자로부터 수득한 동일한 생물학적 샘플에서 ZNF773, ZNF671, ZIC1, HOXA9 및 PAX6으로 이루어진 군으로부터 선택되는 유전자와 연관된 게놈 DNA의 하나 이상의 영역에서 메틸화 상태를 확인하는 추가적인 단계를 포함할 수 있다. 일 구현예에서, 유전자와 연관된 게놈 DNA의 영역은 유전자의 프로모터/인핸서 영역이다. 일 구현예에서, ZNF773, ZNF671, ZIC1, HOXA9 및 PAX6으로 이루어진 군으로부터 선택되는 유전자와 연관된 게놈 DNA의 하나 이상의 영역이 생물학적 샘플에서 메틸화된 경우, 그 환자는 두경부 암의 발병 위험이 더 높은 것이거나 또는 그 환자는 두경부 암이 존재할 가능성이 더 높은 것이거나 또는 그 환자는 두경부 암을 앓고 있는 것이다. 일 구현예에서, ZNF773, ZNF671, ZIC1, HOXA9 및 PAX6으로 이루어진 군으로부터 선택되는 유전자와 연관된 게놈 DNA의 하나 이상의 영역이 생물학적 샘플에서 메틸화된 경우, 더 높은 (통계학적) 정확성으로 두경부 암의 존재 가능성 증가 또는 위험 증가에 대한 평가가 이루어질 수 있다.
일 구현예에서, ZNF773과 연관된 게놈 DNA의 영역은 인간 19번 염색체의 뉴클레오티드 57,499,757과 뉴클레오티드 57,500,375 사이일 수 있다. 일 구현예에서, ZNF671과 연관된 게놈 DNA의 영역은 인간 19번 염색체의 뉴클레오티드 57,727,218과 뉴클레오티드 57,727,600 사이일 수 있다. 일 구현예에서, ZIC1과 연관된 게놈 DNA의 영역은 인간 3번 염색체의 뉴클레오티드 147,412,556과 뉴클레오티드 147,412,790 사이일 수 있다. 일 구현예에서, HOXA9와 연관된 게놈 DNA의 영역은 인간 7번 염색체의 뉴클레오티드 27,164,297과 뉴클레오티드 27,166,843 사이일 수 있다. 일 구현예에서, PAX6과 연관된 게놈 DNA의 영역은 인간 11번 염색체의 뉴클레오티드 31,798,513과 뉴클레오티드 31,799,868 사이일 수 있다.
환자는 파필로마바이러스로 감염될 수 있거나, 또는 파필로마바이러스로 감염되지 않았을 수 있다.
하나 이상의 게놈 영역에 대한 메틸화 상태의 확인은 당해 기술 분야에서 공지된 임의의 적절한 방법을 이용해 수행할 수 있다. 예를 들어, 메틸화 상태는 나노포어 서열분석 (nanopore sequencing)에 의해 결정할 수 있거나, 또는 메틸화-특이적인 PCR (MSP)에 의해 결정할 수 있으며, 바람직하게는 MSP는 정량적인 MSP (QMSP)이며, 선택적으로 형광 프로브를 이용한 방식이다. 또한, 메틸화 상태는 메틸화-민감성 효소가 메틸화된 DNA를 절단하던지 또는 메틸화-민감성 효소가 비-메틸화된 DNA를 절단하던지 간에, 메틸화-민감성 제한 효소에 의해 확인할 수 있다.
일 구현예에서, 환자가 두경부 암 발병 위험이 높거나 또는 환자가 두경부 암이 존재할 가능성이 높거나 또는 환자가 두경부 암을 앓고 있는 것으로 평가된 이후에, 본 방법은 암 발병을 예방하거나 또는 암을 치료하기 위한 의약제를 환자에게 투여하는 것을 추가로 포함할 수 있다. 암을 예방 또는 치료하기에 적합한 당해 기술 분야에 공지된 임의의 이러한 의약제를 두경부 암 발병 위험이 높은 환자에게 투여할 수 있다. 일 구현예에서, 이러한 의약제는 항-염증제, 바람직하게는 비-스테로이드계 항-염증제이거나, 또는 의약제는 아자시티딘 (azacytidine) 또는 데시타빈 (decitabine)과 같은 메틸화 저해제이다. 일 구현예에서, 두경부 암 발병 위험이 높은 환자는 파필로마바이러스, 예를 들어 인간 파필로마바이러스에 대한 백신을 환자에 접종함으로써 치료할 수 있다. 일 구현예에서, 백신 접종의 표적이 되는 파필로마바이러스는 바람직하게는 HPV 균주 (strain) 16 또는 18과 같이 암을 유발하거나, 또는 암 유발에 기여하는 것으로 알려진 바이러스 균주일 수 있다.
또한, 본 발명은 환자로부터 수득한 생물학적 샘플에서 19번 염색체의 유전자 ZNF823과 유전자 ZNF833 사이의 게놈 영역이 메틸화된 인간 환자를 선정하는 것을 포함하는, 두경부 암 발병에 대해 더 빈번한 선별 검사 (screening)를 수행할 환자를 선정하는 방법에 관한 것이다. 일 구현예에서, 더 빈번한 선별 검사는 조직병리학에 기반한 선별 검사, 예를 들어 12개월 주기, 바람직하게는 6개월 주기, 더 바람직하게는 3개월 주기의 선별 검사일 수 있다.
발명의 상세한 설명
본 발명을 아래에서 상세히 설명하지만, 본원에 기술된 구체적인 방법, 프로토콜 및 시약은 달라질 수 있으므로 본 발명은 이들로 제한되지 않는 것으로 이해되어야 한다. 또한, 본원에 사용된 용어는 단순히 특정한 구현예를 설명하기 위한 목적일 뿐 첨부된 청구항으로만 제한될 본 발명의 범위를 제한하고자 의도하는 것은 아닌 것으로 이해되어야 한다. 달리 정의되지 않은 한, 본 발명에서 사용된 모든 기술 용어 및 과학 용어들은 당해 기술 분야의 당업자가 통상적으로 이해하는 의미와 동일한 의미를 가진다.
이하, 본 발명의 요소들이 설명될 것이다. 이들 요소는 구체적인 구현예를 들어 열거되지만, 임의의 방식으로, 그리고 임의의 개수로 조합하여 추가적인 구현예를 구성할 수 있는 것으로 이해되어야 한다. 다양하게 기술된 예들과 바람직한 구현예들은 본 발명을 명확하게 기술된 구현예로만 제한하는 것으로 해석되어서는 안된다. 이러한 기술 내용은 명확하게 기술된 구현예들이 개시되거나 및/또는 바람직한 임의 개수의 요소와 조합된 구현예를 뒷받침하고 망라하는 것으로 이해되어야 한다. 아울러, 본 출원에서 모든 기술된 요소들에 대한 임의 정렬 및 조합 역시 문맥상 달리 지시되지 않은 한 본 출원의 설명에 의해 개시된 것으로 간주되어야 한다.
바람직하게는, 본원에 사용된 용어는 "A multilingual glossary of biotechnological terms: (IUPAC Recommendations)", H.G.W. Leuenberger, B. Nagel, and H. Kolbl, Eds., (1995) Helvetica Chimica Acta, CH-4010 Basel, Switzerland에 기술된 바와 같이 정의된다.
본 발명의 실시는 달리 나타내지 않은 한 기술 분야의 문헌에 설명된 생화학, 세포 생물학, 면역학 및 재조합 DNA 기법의 통상적인 방법을 채택할 것이다 (예, Molecular Cloning: A Laboratory Manual, 4th Edition, M.R. Green, J. Sambrook et al. eds., Cold Spring Harbor Laboratory Press, Cold Spring Harbor 2012).
문맥상 달리 요구되지 않은 한, 본 명세서와 후술한 청구항 전체에서, 용어 "포함한다"와 이의 변형어, 예를 들어 "포함한다" 및 "포함하는"은 언급된 구성요소, 정수 또는 단계, 또는 구성요소, 정수 또는 단계의 군을 망라하는 것을 내포하지만, 임의의 다른 구성요소, 정수 또는 단계 또는 구성요소, 정수 또는 단계의 군을 배제하는 것은 아니며, 그러나 일부 구현예에서는 이러한 다른 구성요소, 정수 또는 단계 또는 구성요소, 정수 또는 단계의 군은 제외될 수 있는 것으로, 즉 발명의 내용은 언급된 구성요소, 정수 또는 단계 또는 구성요소, 정수 또는 단계의 군을 포함하는 것으로 구성되는 것으로 이해될 것이다. 본원에 기술된 문맥 (특히 청구항의 문맥)에서 사용된 용어 정관사 ("the") 및 부정관사 ("a" 및 "an") 및 유사한 용어는 본원에 달리 지시되거나 또는 문맥상 명확하게 상충하지 않은 한 단수 및 복수 둘다를 망라하는 것으로 해석되어야 한다. 본원에서 값에 대한 범위 언급은 주로 그 범위에 속하는 각각의 개별 값들을 개별적으로 언급하는 축약적인 방식으로 사용하기 위한 것으로 의도된다. 본원에서 달리 나타내지 않은 한, 각각의 개별 값은 이것이 본원에서 개별적으로 언급된 것처럼 명세서에 통합된다.
본원에 기술된 모든 방법들은 본원에서 달리 지시되지 않거나 또는 문맥상 명확하게 상충하지 않은 한 임의의 적절한 순서로 수행될 수 있다. 본원에 제공된, 임의의 모든 실시예 또는 예시적인 표현 (예를 들어, "와 같은")은 주로 본 발명을 더 잘 예시하기 위한 것으로 의도되며, 달리 청구된 본 발명의 범위에 대한 제한을 제시하는 것은 아니다. 명세서에서 표현들은 본 발명을 실시하는데 본질적인 임의의 비-청구 요소들을 나타내는 것으로 해석되어서는 안된다.
본 명세서 전체에서 몇몇 문헌들이 인용된다. 본원에서 상기 또는 하기에 인용된 문헌들 각각 (모든 특허, 특허 출원, 과학 간행물, 제조사의 명세서, 설명서 등)은 그 전체가 원용에 의해 본원에 통합된다. 본원의 어떤 것도 본 발명이 선행 발명으로 인해 이러한 개시내용을 선행할 자격이 없다는 용인으로서 해석되어서는 안된다.
본 발명은 특히 두경부 암 발병 위험이 높은 인간 환자를 식별 가능하게 한다. 이러한 환자의 식별은, 환자로부터 수득한 조직 또는 기타 생물학적 샘플에서, 19번 염색체의 유전자 ZNF823과 ZNF833 사이에 위치한 게놈 DNA 서열이 메틸화된 경우, 두경부 암의 발병 위험이 현저하게 높다는 점에서 비롯한다. 두경부 암이 발병하거나 또는 두경부 암을 앓을 위험이 높은 환자가 식별되면, 이러한 환자는 조기 검출 가능성을 높이기 위해 표준적인 조직병리학적 방법을 이용해 두경부 암의 출현에 대해 더 빈번하게 모니터링하거나 및/또는 두경부 암의 발병을 예방하기 위해 치료할 수 있다.
19번 염색체에서 유전자 ZNF823과 ZNF833 사이에 위치한 영역과 더불어 또는 이와 조합하여, ZNF773, ZNF671, ZIC1, HOXA9 및 PAX6으로 이루어진 군으로부터 선택되는 유전자와 연관된 게놈 DNA의 하나 이상의 영역에서 메틸화를 확인할 수 있다.
본 발명의 특정 구현예에서, 개체가 비-인간 개체일 경우, 메틸화 상태를 확인하고자 하는 서열과 연관된 유전자는 각 비-인간 개체에서 각각의 상동적인 유전자일 것이다. 비-인간 개체와 관련한 일 구현예에서, 게놈 DNA는 각각의 유전자의 인간 서열 및/또는 이의 일부에 대해 가장 높은 상동성/동일성을 가진 비-인간 염색체(들)에서의 영역이다.
ZNF671 (GenBank 수탁 번호 NM_024833, NC_000019.10에 수록)은 전형적인 아연 핑거 모티프를 가진 전사 인자이다. 이 단백질은 전사 억제에 중요한 역할을 담당하며, 세포 분화, 증식, 세포자살 및 종양 억제에 참여한다. 단백질의 발현은 특히 프로모터 영역의 메틸화 상태에 의해 조절된다. 실험들에서 다양한 종양들 (요로상피 암종, 자궁경부 암종, 두경부 영역에서의 암종)에서 DNA 메틸화를 통한 후생유전학적 제어가 밝혀져 있다 (Yeh et al., 2015, Methylomics analysis identifies ZNF671 as an epigenetically repressed novel tumor suppressor and a potential non-invasive biomarker for the detection of urothelial carcinoma, Oncotarget. 6:29555-29572; Tian et al., 2014, Prognostication of patients with clear cell renal cell carcinomas based on quantification of DNA methylation levels of CpG island methylator phenotype marker genes, BMC Cancer 14:772; Hansel et al., 2014, A Promising DNA Methylation Signature for the Triage of High-Risk Human Papillomavirus DNA-Positive Women. PLoS ONE 9(3): e91905). 비인두 암종과 관련하여, ZNF671의 비정상적인 과도한 메틸화가 질환의 진행과 관련 있다는 데이터도 이미 발표되어 있다 (Zhang et al., 2017, Journal of Experimental & Clinical Cancer Research 36:147; Zhang et al., 2017, Liquid Biopsy for Cancer: Circulating Tumor Cells, Circulating Free DNA or Exosomes?, Cellular Physiology and Biochemistry 41:755-768; Zhao et al., 2017, BMC Cancer 17:489).
ZNF773 (GenBank 수탁 번호 NM_001304334.1, NC_000019.10에 수록)은 HPV-양성의 구인두 암종의 종양 조직에서 과도하게 메틸화되는 것으로 언급된 바 있다 (Ren et al., 2018, Discovery and development of differentially methylated regions in human papillomavirus-related oropharyngeal squamous cell carcinoma, Int. J. Cancer 143:2425-2436).
ZIC1 (GenBank 수탁 번호 NM_003412.4, NC_000003.12에 수록)은 소뇌의 아연 핑거 단백질 (ZMIC) 계열에 속한다. 이 단백질은 초기 발달의 신경발생시 전사 인자로서 기능한다. 또한, 이 단백질은 아포지단백질 E (지질 대사)에 대한 유전자의 잠재적인 전사 조절인자인 것으로 언급되어 있다 (Salero et al., 2001, Transcription Factors ZIC1 and ZIC2 Bind and Transactivate the Apolipoprotein E Gene Promoter, J. Biol. Chem. 276:1881-1888). 나아가, 위암 및 두경부 종양에서의 과도한 메틸화는 ZIC1에서 언급된 바 있다 (Lin et al., 2017, Combined Detection of Plasma ZIC1, HOXD10 and RUNX3 Methylation is a Promising Strategy for Early Detection of Gastric Cancer and Precancerous Lesions, Journal of Cancer 8:1038-1044; Paluszczak et al., 2017, Prognostic significance of the methylation of Wnt pathway antagonists - CXXC4, DACT2, and the inhibitors of sonic hedgehog signaling - ZIC1, ZIC4, and HHIP in head and neck squamous cell carcinomas, Clin. Oral Invest. 21:1777-1788).
HOXA9 (homeobox gene A9)(GenBank 수탁 번호 NM_152739.4, NC_000007.14에 수록) 및 PAX6 (paired box 6 gene)(GenBank 수탁 번호 NM_001368930.1, NC_000011.10에 수록)는 배아발생시 중요한 역할을 수행하는 전사 인자를 코딩하며, 둘다 호메오박스 유전자 계열에 속한다. HOXA9 프로모터 영역에서의 특이적인 과도한 메틸화는 폐암 (Wrangle et al., 2014, Functional identification of cancer-specific methylation of CDO1, HOXA9, and TAC1 for the diagnosis of lung cancer, Clin. Cancer Res. 20:1856-1864), 간세포암 (Kuo et al., 2014, Frequent methylation of HOXA9 gene in tumor tissues and plasma samples from human hepatocellular carcinomas, Clin. Chem. Lab Med. 52:1235-1245), 난소암 (Singh and Sachan, 2017, HOXA9 and SOX1 - a promising DNA methylation based diagnostic biomarker for epithelial ovarian cancer, Can. J. Biotech. 1:66), 및 두경부 종양 (Uchida et al., 2014, Investigation of HOXA9 promoter methylation as a biomarker to distinguish oral cancer patients at low risk of neck metastasis, BMC Cancer 14:353)과 관련 있는 것으로 공지되어 있다. 아울러, HOXA9은 두경부 종양 (Hayashi et al., 2015, Correlation of gene methylation in surgical margin imprints with locoregional recurrence in head and neck squamous cell carcinoma, Cancer J. 121:1957-1965) 및 방광암 (Kitchen et al., 2015, Methylation of HOXA9 and ISL1 Predicts Patient Outcome in High-Grade Non-Invasive Bladder Cancer, PLoS ONE 10:e0137003)에서 질환의 코스를 예측하기 위한 후생유전학적 마커로서 잠재성이 가질 수 있다. PAX6 프로모터 영역에서 종양-특이적인 과도한 메틸화는 또한 비-소 세포성 폐암에 대한 예후적인 가치가 있는 것으로 다양한 간행물들에 언급되어 있다 (Kiselev et al., 2018, Transcription factor PAX6 as a novel prognostic factor and putative tumour suppressor in non-small cell lung cancer, Scientific Reports 8:5059; Ooki et al., 2018, Epigenetically regulated PAX6 drives cancer cells toward a stem-like state via GLI-SOX2 signaling axis in lung adenocarcinoma, Oncogene 37:5967-5981).
일 구현예에서, 메틸화 상태를 확인하여야 하는, 명시된 유전자 ZNF773, ZNF671, ZIC1, HOXA9 및 PAX6과 연관된 게놈 DNA의 하나 이상의 영역은, 명시된 유전자 하나 이상의 서열로부터 상류 및/또는 하류 (5' 및/또는 3') 대략 0.5, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 25, 30, 35 또는 40kb (kilobase) 영역에 위치한 게놈 DNA 서열을 포함한다. 본 발명의 일 구현예에서, ZNF773과 연관된 게놈 DNA의 영역은 인간 19번 염색체에서 뉴클레오티드 57,499,757과 뉴클레오티드 57,500,375 사이에 위치할 수 있다. 일 구현예에서, ZNF671과 연관된 게놈 DNA의 영역은 인간 19번 염색체에서 뉴클레오티드 57,727,218과 뉴클레오티드 57,727,600 사이에 위치할 수 있다. 일 구현예에서, ZIC1과 연관된 게놈 DNA의 영역은 인간 3번 염색체에서 뉴클레오티드 147,412,556과 뉴클레오티드 147,412,790 사이에 위치할 수 있다. 일 구현예에서, HOXA9와 연관된 게놈 DNA의 영역은 인간 7번 염색체에서 뉴클레오티드 27,164,297과 뉴클레오티드 27,166,843 사이에 위치할 수 있다. 일 구현예에서, PAX6과 연관된 게놈 DNA의 영역은 인간 11번 염색체에서 뉴클레오티드 31,798,513과 뉴클레오티드 31,799,868 사이에 위치할 수 있다. 본원에 언급된 뉴클레오티드 위치 번호 (위치)는 2013년 12월 인간 게놈 어셈블리 hg38로부터 유래한다.
바람직하게는, 전술한 서열들 중 일부는 더 큰 서열 내에 포함된 CpG 섬 및/또는 CG-풍부 영역을 포함한다. 즉, 일 구현예에서, 명시된 유전자와 연관된 게놈 DNA의 하나 이상의 영역은 상기 명시된 염색체 서열의 하나 이상의 부분이며, 하나 이상의 부분이 CG-풍부 영역 및/또는 CpG 섬을 포함한다.
게놈 DNA 서열의 이들 영역 또는 그 일부에서 메틸화 상태를 확인하는 경우, 이들 서열에 포함된 단일한, 예를 들어, 분리된, 시토신의 메틸화 상태를 확인할 수 있으며, 아울러 이들 서열에 포함된 CG-풍부 영역 및 CpG에서 시토신의 메틸화 상태를 확인할 수 있다. 바람직한 구현예에서, 명시된 유전자와 연관된 게놈 DNA의 하나 이상의 영역에서 메틸화 상태는 이러한 게놈 서열에 포함된 하나 이상의 CpG 섬에서 시토신의 메틸화 상태를 확인함으로써 평가한다.
본원에 사용된 바와 같이, 용어 "일부", "단편" 및 "부분"은 상호 호환적으로 사용되며, 분획, 특히 더 큰 뉴클레오티드 서열 또는 아미노산 서열의 분획을 의미한다. 또한, 더 큰 분자의 불연속적인 부분 여러개를 포함하는 분자, 예를 들어 염색체 서열과 같이 다른 뉴클레오티드 서열의 불연속적인 부분 하나 이상을 포함하는 뉴클레오티드 서열 역시 이 용어에 포함된다. 특정 구현예에서, 뉴클레오티드 서열의 부분은 뉴클레오티드 약 10개, 20개, 30개, 40개, 50개, 100개, 150개, 200개, 300개, 400개, 500개, 600개, 700개, 800개, 900개, 1000개, 1500개, 2000개, 2500개, 3000개, 3500개, 4000개, 4500개, 5000개, 6000개, 7000개, 8000개, 9000개 또는 약 10,000개 길이이거나 또는 이보다 더 긴 길이일 수 있다. 다른 구현예에서, 1번, 3번, 7번, 9번, 11번 또는 19번 염색체에서 염색체 서열의 부분은 CpG 섬 또는 CpG 섬의 일 부분을 하나 이상 포함한다.
두경부 암 발병 위험을 본 발명에 따라 평가할 조직은 환자의 임의 조직일 수 있다. 조직의 예로는 인후, 목, 입, 혀, 비강, 식도, 편도 및 타액성 조직 등이 있으나, 이들로 한정되는 것은 아니다.
용어 "개체", "개인", "유기체" 또는 "환자"는 상호 호환적으로 사용되며, 척추동물, 바람직하게는 포유류에 대한 것이다. 예를 들어, 포유류는 본 발명의 맥락에서 인간, 인간을 제외한 영장류, 개, 고양이, 양, 소, 염소, 돼지, 말 등과 같은 가축 동물, 마우스, 랫, 토끼, 기니아피그 등과 같은 실험 동물뿐 아니라 동물원 동물과 같이 우리에 갇힌 동물이다. 또한, 용어 "동물"은 인간을 포함한다. 바람직하게는, 용어 "개체", "개인", "유기체" 또는 "환자"는 포유류 암컷 및 수컷, 특히 인간 여성 및 남성을 지칭한다. 개체는 임의 연령일 수 있지만, 바람직하게는 개체는 성인이다. 특정 구현예에서, 개체는 파필로마바이러스에 감염될 수 있거나, 또는 파필로마바이러스 감염이 없을 수 있다.
용어 "생체내"는 개체에서의 상황을 지칭한다.
본원에 사용된 바와 같이, "생물학적 샘플"은 환자로부터 수득한 모든 생물학적 샘플을 포함한다. 이러한 생물학적 샘플에 대한 예로는 타액, 혈액, 세포 도말 (smears of cells), 객담, 기관지 흡인물, 소변, 대변, 담즙, 위장 분비물, 림프액, 장기 흡인물 (organ aspirates) 및 펀치 생검 (punch biopsy)과 같은 조직 생검 등이 있다. 선택적으로, 생물학적 샘플은 환자의 점막으로부터 수득할 수 있다. 세포를 함유한 도말, 타액 샘플 또는 입 세척물이 바람직하다. 생물학적 샘플은 바람직하게는 두경부 암 발병 위험의 증가를 확인할 조직으로부터 유래한 세포를 함유할 수 있다. 바람직하게는, 생물학적 샘플은 DNA 또는 이의 일부의 메틸화 상태를 확인할 수 있도록 DNA, 예를 들어 게놈 DNA 또는 순환하는 비-세포성 DNA를 함유한다. 생물학적 샘플은 두경부 암의 발병 위험을 결정할 조직으로부터 수득한 것일 수 있다.
"위험이 있는" 또는 "위험이 높은"은 질환, 특히 두경부 암의 발병 기회가 일반 대중과 비교해, 정상보다 더 높은 것으로 식별된 개체, 즉 환자를 의미한다. 일 구현예에서, 위험이 높은 것은 샘플 수득 1-3개월 이내에 암 발병을 의미한다. 일 구현예에서, 위험이 높은 것은 샘플 수득 3-6개월 이내에 암 발병을 의미한다. 일 구현예에서, 위험이 높은 것은 샘플 수득 7-12개월 이내에 암 발병을 의미한다. 일 구현예에서, 위험이 높은 것은 샘플 수득 13-24개월 이내에 암 발병을 의미한다. 일 구현예에서, 위험이 높은 것은 샘플 수득 24-36개월 이내에 암 발병을 의미한다. 일 구현예에서, 위험이 높은 것은 샘플 수득 후 36개월 이내, 예를 들어 42개월 이내, 48개월 이내, 52개월 이내, 60개월 이내 또는 그 이후에 암 발병을 의미한다.
본 발명에 따르면, 샘플에 존재하는 게놈 DNA는 관련 게놈 DNA 서열의 메틸화 상태를 확인하기 위해 어떤 방식으로 가공할 수 있다. 예를 들어, 생물학적 샘플로부터 게놈 DNA를 추출할 수 있으며, 이 DNA의 특정 영역의 메틸화 상태를 당해 기술 분야의 당업자에게 공지된 임의 방법을 이용해 확인할 수 있으며, 예를 들어 페놀/클로로포름을 이용해 또는 시판 키트를 이용해 추출한 다음 아황산수소나트륨 또는 아황산수소암모늄 방법을 이용해 또는 캘리포니아 어바인에 위치한 Zymo Research 사의 EZ-DNA 메틸화-Gold™ 키트와 같은 시판 키트를 이용해 메틸화를 평가할 수 있다. 다른 구현예에서, 메틸화 상태는 샘플로부터 DNA를 단리하는 준비 단계 없이 확인할 수 있다. 다른 구현예에서, 메틸화 상태는 수소아황산염-기반의 방법 이외의 다른 방법을 적용해 DNA에서 확인할 수 있다.
용어 "메틸화 상태"는 일반적으로 게놈 DNA 또는 이의 영역이 메틸화된 뉴클레오티드 잔기, 특히 메틸화된 시토신 잔기, 즉 5-메틸 시토신의 함유 여부에 관한 것이다. 일 구현예에서, 메틸화 상태를 결정할 게놈 DNA의 영역은 구아닌과 시토신 잔기가 풍부한 영역, 특히 CG-다이뉴클레오티드가 풍부한 영역이며, 즉 그 영역은 하나 이상의 CpG 섬을 함유한다. 메틸화 상태는 아래에 논의된 바와 같이 공지된 방법을 이용함으로써 확인할 수 있다. 메틸화는 흔히 유전자의 프로모터 영역에서 이루어지며, 따라서 관련 유전자의 메틸화 상태를 검출하는 방법은 통상적으로 이들 영역에 대해 집중적으로 이루어진다. 그러나, 유전자는 또한 프로모터 영역 이외의 다른 영역에서 메틸화될 수 있는데, 그 이유는 CpG 섬을 함유한 영역과 같은 GC-풍부 영역이 유전자의 다른 영역에 위치할 수도 있기 때문이다. 이러한 유전자의 다른 영역에서 메틸화 상태를 검출하는 것 역시 본 발명에 망라된다.
본 발명에 따른 방법에서, 유전자 ZNF823과 ZNF833 사이에 위치한 게놈 DNA 또는 유전자 ZNF671, ZNF773, ZIC1, HOXA 및/또는 PAX6과 연관된 게놈 DNA에서, 바람직하게는 CG-풍부 영역의 메틸화 상태, 예를 들어 CpG 섬의 메틸화 상태를 확인한다. 용어 "메틸화"는 분자 생물학에서 일반적으로 공지된 바와 같이 용어 "과도한 메틸화"와 동의어로 간주된다. 이는 DNA의 양성 메틸화 상태, 즉 DNA에서, 바람직하게는 CpG 섬 또는 GC 뉴클레오티드가 풍부한 영역에서의 5-메틸시토신의 존재를 의미한다.
전술한 바와 같이, 메틸화 상태를 확인할 게놈 DNA의 영역은 명시된 유전자의 엑손, 인트론, 5' 프로모터/인핸서 또는 임의의 다른 영역에 위치할 수 있다. 본원에 사용된 바와 같이, 용어 "메틸화된다"는 것은 적어도 DNA 서열이 5-메틸시토신 뉴클레오티드를 함유하는 것을 의미한다. 일 구현예에서, 신생물증 (비정상적인 과도한 조직 증식) 발병 위험 증가는 검사한 (메틸화 상태를 확인할) DNA 서열에서 5-메틸시토신 뉴클레오티드의 존재에 의해 결정된다. 일 구현예에서, 신생물증 발병 위험 증가는 검사한 DNA 서열에서 5-메틸시토신 (메틸화)의 양적 증가에 의해 결정된다. 메틸화의 양적 증가는 대조군 샘플에서 결정된 메틸화 양적 수준에 대해 생물학적 샘플에서 메틸화 양적 수준을 비교함으로써 결정할 수 있다. 일 구현예에서, 신생물증 발병 위험 증가는, 메틸화 증가가 대조군 샘플에서 결정된 메틸화의 양적 수준 대비 적어도 0.5%, 1%, 2%, 3%, 4%, 5%, 10%, 15%, 20%, 25%, 50%, 75%, 100%, 150%, 200% 또는 그 이상일 경우에, 결정된다. 일 구현예에서, 신생물증 발병 위험 증가는 대조군 샘플에서 결정된 메틸화의 양적 수준 대비 적어도 1.5x, 2x, 3x, 4x, 5x, 6x, 7x, 8x, 9x, 10x, 20x, 30x, 40x, 50x 또는 그 이상일 경우에 결정된다. 일 구현예에서, 메틸화 수준 증가는 생물학적 샘플에서 메틸화 수준이 미리 정해진 역치 수준을 초과하는지 여부에 의해 결정된다. 대조군 샘플은 메틸화되거나 또는 비-메틸화된 것으로 공지된 유전자/서열일 수 있거나, 또는 환자로부터 수득한 생물학적 샘플에서 검사하는 동일한 서열일 수 있지만 이 동일한 서열은 다른 환자로부터 수득된 것이며, 여기서 다른 환자의 조직은 다른 환자로부터 샘플을 수득한 후 지정된 기간 이내에 신생물증이 발병하지 않을 것으로 확인된 것이다. 특정 구현예에서, 명시된 기간은 적어도 24개월, 30개월, 36개월 또는 48개월이거나 또는 그보다 길 수 있다.
일 구현예에서, DNA의 메틸화 상태는, 단일한 DNA 분자를 나노미터 크기의 단백질 포어를 통해 통과시켰을 경우에 관찰되는 이온 전류 변화를 해석하는, 나노포어 서열분석을 이용하여, 확인한다. 아울러, 나노포어 서열분석은 DNA 가닥의 뉴클레오티드뿐 아니라 5'-메틸화된 시토신과 같은 단일한 염기 변형을 식별할 수 있다. 이러한 능력에 비추어, 서열 정체 (identity)와 시토신의 메틸화에 대한 동시적인 분석을 수행할 수 있으며, 예를 들어 Euskirchen et al., 2017, Acta Neuropathol, epub prior to publication, DOI 10.1007/S00401-017-1743-5를 참조한다.
또한, DNA의 메틸화 상태는 적절한 프라이머 쌍을 이용한 메틸화-특이적인 PCR 반응 (MSP)으로 지칭되는 수단에 의해, 수소아황산염 방법으로 비-메틸화된 시토신 잔기를 우선 변형한 후, 결정할 수 있다. 수소아황산염 방법에서, 비-메틸화된 시토신 잔기는 아황산수소나트륨에 의해 우라실로 변환되는 반면, 메틸화된 시토신 잔기 (5-메틸시토신)는 이러한 변환으로부터 보호된다. 우라실은 시토신과는 다른 쌍 형성 특징을 가지므로, 즉 우라실은 아데노신과 쌍 형성하는 티민과 마찬가지로 거동하므로, 상기한 변환은, 우라실은 티민에 결합하고 시토신은 티민에 결합하지 않는다는 점에 기반하여 특이적으로 설계한 프라이머를 이용해 검출할 수 있다. MSP는 DNA 메틸화를 검출하기 위한 당해 기술 분야에서 공지된 확립된 기법이다.
본 발명의 맥락에서, 메틸화 상태를 검출하기 위해 이용되는 PCR 증폭용 프라이머의 설계는 게놈 DNA 서열에서 서열의 위치에 따라, 예를 들어 메틸화 상태를 결정할 하나 이상의 명시된 유전자와 연관된 서열의 위치에 따라 결정될 것이다. 예를 들어, 이러한 서열에 대한 메틸화-특이적인 프라이머는, 특정 시토신이 프라이머 결합 부위에서 메틸화된 경우에 수소아황산염-변형된 샘플 DNA에만 결합하도록 설계할 수 있다. 만일 이들 영역이 수소아황산염 처리하기 전 메틸화되지 않았다면, 프라이머는 결합하지 않을 것이며, 그래서 PCR 반응 산물은 생성되지 않는다. 따라서, 본 발명의 맥락에서, PCR 반응의 존재는, 특정 유전자의 특정 DNA 영역이 메틸화된 것을 의미하고, 즉 그 환자는 조직에 신생물증이 발병할 위험이 높거나 또는 이미 악성 질환을 앓고 있는 것을 의미한다.
메틸화를 정성적으로 검출할 수 있을 뿐 아니라 메틸화된 DNA 영역에 대한 정량적인 검출도 가능한 실시간 PCR 방법 (QMSP)이 특히 바람직하다. 이 MSP는 메틸화-특이적인 산물의 형성을 형광 염료, 예를 들어 SYBR®-Green I 또는 II (ThermoFisher Scientific, Waltham, MA) 또는 EVA-Green® (Biotium, Inc., Fremont, CA)의 병합에 의해 검출하는, 형광-기반의 실시간 방법으로 수행할 수 있다. 이러한 방법은 비-메틸화된 DNA의 거대 백그라운드에서 메틸화된 DNA의 영역을 검출할 수 있으며, 조직 샘플 스크리닝에 특히 적합한 고-성능 방법 (high-throughput method)이다 (Shames et al., 2007, Cancer Lett, 251:187-198).
대안적으로, MSP에 의한 PCR 산물의 생성은 또한 PCR을 완료한 후 혼성화 방법에 의해, 예를 들어 생성된 PCR 산물과 결합하는 프로브가 고정되어 따라서 이를 검출할 수 있는 스트립 또는 어레이를 이용해, 검출할 수 있다. 다른 기법으로는 메틸화된 DNA와 비-메틸화된 DNA를 구별하기 위한 메틸화-민감성 DNA 제한 효소의 이용 또는 메틸화된 DNA를 검출하기 위한 수소아황산염으로 화학적으로 처리된 DNA에 대한 고-성능 서열분석 등이 있다.
다른 바람직한 방법은 메틸화를 검사할 DNA 각 영역에 대해 형광 염료를 이용하는, "MethyLight" 기법에 기반한 QMSP 방법이다. 바람직한 예에서, 프로브는 5'-말단에 형광 염료 마커를 운반하고 3'-말단에는 퀀처 (quencher)를 운반하는데, 이 프로브는 특이적인 증폭 프라이머 2개 사이의 PCR 반응 산물에 결합한다 (예, Eads et al., 2000, Nucleic Acids Research 28:e32 참조). 형광 염료는 표적 서열에 결합한 후 DNA 중합효소의 5'-3'-엑소뉴클레아제 활성에 의해 프로브가 분해된 즉시 해리되며, 측정된 형광성이 형성된 산물의 양을 나타낸다. 여러개의 올리고뉴클레오티드 및 프로프를 이용함으로써 이러한 방법으로 조사할 샘플에 대해 수행할 반응의 수를 상응하게 낮출 수 있다 (Shames et al., 2007, Cancer Lett 251:187-198). 적합한 형광 염료 및 퀀처들이, 예를 들어, 영국 사우스햄튼에 위치한 ATDBio Ltd.사 또는 독일 슈타이나흐에 위치한 LGC Biosearch Technologies에서 입수가능한, 예를 들어 형광단 FAM™, HEX™, NED™, ROX™, Texas Red® 등, 그리고 퀀처 TAMRA™ 또는 Black Hole Quencher®가 당해 기술 분야에 공지되어 있다.
특히 바람직한 구현예에서, 메틸화 상태에 대한 확인은 멀티플렉스 QPCR 실험으로 수행할 수 있다. 이러한 멀티플렉스 실험은, 단일 분석에서 신생물증의 발병 위험 증가와 상관성이 있는 것으로 알려져 있는, 샘플내 게놈 DNA의 여러 영역들에 대해 메틸화 상태 분석을 가능하게 한다. 멀티플렉스 방법은, 검사할 DNA 영역(들)의 메틸화 상태를 샘플 당 1번 또는 2번의 반응으로 확인할 수 있어, 여러가지 이점을 제공한다. 멀티플렉스 방법은 상당한 시간, 샘플 재료 및 재료 비용을 절약한다. 일부 멀티플렉스 실험의 경우, 유전자 최대 5종에서 메틸화 상태를 확인할 수 있다. 아울러, 각각 하나의 특이적인 올리고뉴클레오티드, 즉 "프로브"가 각 유전자에 대해 사용된다. 프로브는 한쪽 말단에 형광 염료를 운반하며, 생성된 PCR 반응 산물에 프로브가 특이적으로 결합할 때까지 형광 신호가 검출되지 않도록 프로브는 설계된다. 서로 다른 프로브가 서로 다른 형광 기를 운반할 것이며, 따라서 각각의 형광 신호를 동시에 검출할 수 있다. 이러한 방법은 또한 "마이크로어레이" 기법을 이용함으로써 수행할 수도 있다.
특히 바람직한 구현예에서, 메틸화 상태에 대한 확인은 디지털 PCR 실험으로서 수행할 수 있다. 이러한 디지털 PCR 실험은 단일 분석으로 샘플에서 게놈의 여러 영역들의 메틸화 상태를 정성적으로, 정량적으로 분석 가능하며, 이는 신생물증 발병 위험의 증가와 연관성이 있는 것으로 알려져 있다.
메틸화 상태를 확인하기 위한 당해 기술 분야에 공지된 다른 방법, 예를 들어 특이적인 산물의 양을 형광에 의해 직접 결정하는 방식에 기반한 방법도 본 발명에 따라 이용할 수 있다. 예를 들어, 분자 비콘 (molecular beacon) 기법을 본원에서 이용할 수 있다. 분자 비콘은 리포터 형광단 및 퀀처 둘다가 연결된 올리고뉴클레오티드이다. 프로브의 5'- 말단에 위치한 뉴클레오티드는 3'-말단에 위치한 뉴클레오티드와 상보적이며, 그래서 분자 비콘의 특징인 2차 구조를 형성한다. 헤어핀 또는 루프 구조로서 언급되는 이런 상태에서는 형광단이 퀀처에 인접하게 위치하므로 형광은 검출되지 않는다. 루프 구조가 PCR 중에 생성되는 상보적인 DNA 서열에 결합하게 되면 형광단과 퀀처 사이의 거리가 멀어지고, 따라서 형광을 검출할 수 있다.
다른 적절한 기법으로는 "스코피온 (scorpion)" 기법을 포함한다. 스코피온 프로브는 실시간 PCR 프로브와 PCR 프라이머의 특성을 분자 하나 (단일-스코피온) 또는 2개 (바이-스코피??)에 조합한 복합적인 올리고뉴클레오티드이다. 이는, 분자 비콘과 마찬가지로, 리포터 형광단과 퀀처로 변형된 말단을 가진 자기-상보적인 영역을 가진 특징적인 2차 구조를 가진다. 아울러, 이들 프로브는 PCR 프라이머로 이용할 수도 있다. PCR 사이클 중에, 결합시 퀀처와 리포터 형광단 간의 거리가 멀어지므로, 루프 구조에 상보적인 DNA 서열의 부착에 의해 리포터 형광성이 관찰될 수 있다. 여러가지 프로브의 결합을 검출하기 위해 서로 다른 프로브는 서로 다른 리포터 형광단을 가질 수 있다.
아울러, 양성 및/또는 음성 대조군 DNA, 예를 들어 DNA의 비-메틸화된 대조군 영역도 동시-증폭할 수 있으며, PCR 반응에 대한 감독 및/또는 메틸화의 존재 및/또는 부재에 대한 감독으로서 이용할 수 있다.
또한, 게놈 DNA의 영역에서의 메틸화는 메틸화된 유전자가 코딩하는 단백질이 발현되지 않도록 (메틸화된) DNA의 이러한 영역과 인접한 유전자의 전사 차단과 흔히 관련있는 것으로 알려져 있다. 이에, 일 구현예에서, 게놈 DNA의 명시된 영역 하나 이상에서 메틸화 상태에 대한 간접적인 확인은 ZNF823, ZNF833, ZNF671, ZNF773, ZIC1, HOXA9 및/또는 PAX6 유전자 중 하나 이상에 코딩된 RNA 및/또는 단백질의 농도를 결정함으로써 달성할 수 있다. 이의 검출은 당해 기술 분야에 공지된 임의의 적절한 방법에 의해, 예를 들어 (RNA의 경우) 노던 블롯 분석, RT-PCR 등, 그리고 (단백질의 경우) 발현된 단백질의 생물학적 활성 검출에 기반한 항체-기반 방법에 의해 수행할 수 있다.
예시적인 예로서, 본 발명에 따른 방법은 다음과 같은 단계들을 포함한다: (a) 환자로부터 수득한 생물학적 샘플, 예를 들어 두경부 암 발병 위험을 확인할 조직의 세포를 함유한 도말 샘플로부터, 예를 들어 QIAamp DNA-Mini 키트 (QIAGEN, Hilden, Germany)를 사용해, 표준 방법에 따라 DNA를 단리하는 단계; (b) 수소아황산염 방법에 따라, 예를 들어 아황산수소나트륨 또는 아황산수소암모늄을 처리한 다음 알칼리 가수분해를 이행함으로써 DNA 샘플에서 비-메틸화된 시토신을 우라실로 변환하는, 캘리포니아 어바인에 위치한 Zymo Research 사의 EZ-DNA Methylation-Gold™ 키트와 같은, 시판 키트를 이용함으로써, 단리한 DNA를 화학적으로 변환하는 단계; (c) DNA의 메틸화된 형태에 대해 특이적인 PCR 프라이머를 이용해 해당 DNA를 증폭하는 단계; 및 (d) 수득한 샘플에서 DNA가 메틸화되었음을 의미하는 PCR 산물의 존재를 검출하는 단계.
본 발명은 하기 도면과 실시예를 들어 상세하게 설명되며, 이는 단순 예시 목적일 뿐 제한하고자 하는 것은 아니다. 이러한 설명 및 예들을 통해, 당업자는 마찬가지로 본 발명에 포함되는 추가적인 구현예들을 생각할 수 있을 것이다.
도 1은 19번 염색체에서 유전자 ZNF833과 ZNF823 사이에 위치한 게놈 영역을 나타낸 것이다. 구아닌 및 시토신, 특히 CG 다이뉴클레오티드가 풍부한 진단학적으로 관련있는 영역은 유전자 2종 사이에 위치한다 (CpG: 59, CG 다이뉴클레오티드를 59개 함유한 영역을 의미함; 삼중-프레임). ZNF833의 5' 말단에 위치한 영역 (CpG: 20; 이중-프레임)은 본 발명과는 관련 없다. 하단부: ZNF833 유전자와 관련하여 진단 마커 영역의 위치와 함께 유전자 영역에 대한 보다 상세한 도표.
도 2는 HPV-양성의 편도 암종 (16x), HPV-음성의 편도 암종 (28x), 기타 두경부 종양 (19x), 대조군 (56x)에서 마커 ZNF671, ZNF773 및 ZNF833과 ZNF823 사이 영역에 대한 인지률을 나타낸 도표이다.
도 3은 HPV-양성의 편도 암종 (5x), HPV-음성의 편도 암종 (11x), 기타 두경부 종양 (12x), 대조군 (24x)에서의 마커 HOXA9, PAX6 및 ZIC1의 검출률을 나타낸 도표이다.
실시예
본원에서 이용된 기법 및 방법은 본원에 기술되거나 또는 자체 공지된 방식으로, 그리고 예를 들어 Green, Sambrook, Molecular Cloning: A Laboratory Manual, 4th Edition (2012) Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y.에 기술된 바와 같이 이루어진다. 키트 및 시약의 사용을 비롯한 모든 방법들은 구체적으로 명시되지 않은 한 제조사의 정보에 따라 이루어진다.
19번 염색체에서 유전자 ZNF823과 ZNF833 사이에 위치한 게놈 영역의 메틸화 상태에 대한 진단 성능:
19번 염색체에서 유전자 ZNF823과 ZNF833 사이에 위치한 게놈 DNA뿐 아니라 마커 영역 ZNF773, ZNF671, ZIC1, HOXA9 및 PAX6의 메틸화 상태와, 두경부 암 발병 또는 존재할 위험의 증가 간의 연관성을 다음과 같이 확인하였다. 각 마커 유전자에 인접한 게놈 DNA 영역 (마커 영역)의 메틸화 상태를 두경부 암 환자로부터 수득한 조직과 참조로서 악성 질환이 없는 환자로부터 수득한 건강한 조직에서 확인하였다. 신선한-냉동 조직 물질을 입수하여, 검사하기 전에는 -80℃에서 보관하였다. 표준 DNA 단리 공정을 이용해 이들 조직으로부터 DNA를 단리하였다. 마커 영역의 특이성에 대한 대조군으로서 두경부 암이 없는 환자로부터 수득한 대조군 샘플에서 이러한 영역의 메틸화 상태를 확인하였다.
단리한 DNA에 대해, 아황산수소나트륨 또는 아황산수소암모늄을 이용해 비-메틸화된 시토신 잔기들을 모두 화학적으로 변환한 다음, 표준 방법에 따라 DNA를 정제하였다. 이러한 화학적 변환은 메틸화된 DNA 서열과 비-메틸화된 DNA 서열을 구별하기 위한, 즉 대상 게놈 영역에서 비-메틸화된 DNA 백그라운드에서 메틸화된 DNA를 검출하기 위한 전제 요건이다. 이러한 과정은, 분석하는 생물학적 샘플이 통상적으로 세포성 물질의 혼합물을 포함하고 방법의 목적이 조직의 잠재적으로 전암성 세포 및 암 세포의 서브세트로부터 기원한 수개의 메틸화된 DNA 분자를 검출하는 것이므로, 가장 중요하다.
대상 DNA 영역을 증폭하기 위해 분석용 PCR에 이용할 올리고뉴클레오티드 프라이머를 설계하였다. 메틸화 특이적인 QPCR DNA를 통해, HNC 63종과 대조군 조직 56종 (도 2) 및 HNC 28종과 대조군 조직 24종 코호트로부터 수소아황산염-변환 DNA를 이용하여 ZIC1, HOXA9, PAX6에서 전술한 마커 영역의 메틸화를 분석하였다. 본 실시예에서, 아래 기술된 프라이머는 대상 DNA 영역이 메틸화되었을 경우에만 증폭 산물을 생성할 수 있다. 아래 PCR 프라이머들을 분석용 PCR에 사용하였다:
유전자 2013년 12월 인간 게놈 어셈블리 (GRCh38/hg38)에 따른 유전자에서의 CpG 영역의 위치 정방향 프라이머 역방향 프라이머
유전자 ZNF8233과 ZNF8323 사이에 위치한 영역 19번 염색체 (len: 151) 센스 11.694.599- 11.694.749 AAGGGACGGGATAGGACGTTC (서열번호 2) AACTAACCGTAACGAATCCCCG (서열번호 3)
HOXA9 7번 염색체 (len: 202) 센스 27166053-27166255 GATTAATAGATTCGTTTGTTTCGTC (서열번호 4)
AAACCGACGACGACTCCG (서열번호 5)
PAX6 11번 염색체 (len 243) 센스 31799442-31799685 ATTGGTAATTGGTGTCGAATC (서열번호 6) GCCTCCATAAAATCGAACG (서열번호 7)
ZIC1 3번 염색체 (len: 136) 센스 147412090-147412226 TAGGGGATGCGGAGCGTC (서열번호 8) TACCCAAAACTACACACGATTTCG (서열번호 9)
ZNF671 19번 염색체 (Len: 103) 센스 57727371-57727474 CGGAGGACGTAGTATTTATTCGC (서열번호 10) CTACGTCCCCGATCGAAACG (서열번호 11)
ZNF773 19번 염색체: 57499833-57499996 AGGTTTATTCGAGAGTGCGAC (서열번호 12) AACTACGAAAACACAACGCG (서열번호 13)
그 결과, 유전자 ZNF823과 ZNF833 사이에 위치한 게놈 영역의 메틸화 상태가, 놀랍게도 특히 HPV-양성 편도 암종 (ToCa)을 검출하는데 높은 민감도 및 특이도를 나타내는 것으로 확인되었다. HPV-양성 편도 암종에 대한 민감도는 마커 영역의 경우 88%이었다. HPV-음성 편도 암종과 기타 두경부 종양 (HNSCC)에 대한 종합적인 민감도는 이러한 마커 영역의 경우 38%이었다. 악성이 아닌 대조군 샘플에서는 마커 영역의 특이도는 96%이었다. 따라서, 생물학적 샘플에서 유전자 ZNF833과 ZNF823 사이에 위치한 마커 영역에서의 메틸화의 검출은, HPV-양성의 편도 종양일 가능성이 높아, 샘플이 기원한 사람에는 두경부 영역에 종양이 존재할 수 있음을 의미한다.
요컨대 이들 결과는 환자로부터 수득한 샘플에서 유전자 ZNF823과 ZNF833 사이에 위치한 게놈 영역의 메틸화 상태 확인이 두경부 암 발병 위험의 증가를 조기에 확인하거나 및/또는 두경부 암을 진단하기에 유용한 도구를 제공해줌을 입증해준다. 이들 결과들로부터, 이 게놈 영역의 메틸화 상태는 발병한 두경부 암을 조기에 진단할 수 있게 하며, 심지어 예를 들어 이미 존재하는 전암성 단계에서 두경부 암의 발병 위험을 적시에 평가할 수 있다는 사실이 명확해진다.
두경부 종양을 진단하기 위한 추가적인 대상 마커 영역:
ZNF773 유전자 구역에서의 마커 영역: ZNF773 유전자 구역내 마커 영역 역시 유사하게 높은 민감도 및 특이도를 나타내었다. 이 영역의 민감도는 HPV-양성 ToCa에 대해서는 75%이고, 기타 HNSCC에 대해서는 35%이었다. 악성이 없는 대조군 샘플의 경우에는 이 마커의 특이도는 100%이었다. 이는, 이 마커와 ZNF823과 ZNF833 사이의 위치한 마커 영역과의 조합으로 진단 상황에서 HPV-양성 편도 암종을 민감하고 특이적으로 검출할 수 있음을, 의미한다.
ZNF671 유전자 구역에서의 마커 영역: ZNF671 마커는 특히 암 세포에서 매우 우수한 검출성을 특징으로 한다. 이는 이미 자궁경부암을 진단하는데 활용되고 있다. 놀랍게도, 이 마커는 모든 두경부 종양과 대조군 샘플을 구별하는데 있어 71%의 우수한 임상 민감도와 98%의 매우 양호한 임상 특이도를 나타내었다.
수종의 메틸화 마커들의 조합 사용이 진단 분석 방식에서 유익한 것으로 입증된 이래로 추가적인 메틸화 마커들이 확립되었다. ZNF823과 ZNF833 사이에 위치한 마커 영역과 ZNF671 마커로 구성된 진단학적 조합 (양성 샘플 = 마커 2개 중 하나 이상에 대해 양성)은 대조군 조직 (n = 56)과 비교해 두경부 종양 (n = 63)을 검출하는데 78%의 우수한 민감도와 95%의 특이도를 나타내었다.
유전자 ZIC1, HOXA9 및 PAX6 구역에서의 마커 영역:
전술한 마커 영역과 더불어, 추가적인 바이오마커 3종, 즉 유전자 ZIC1, HOXA9 및 PAX6 구역에서의 메틸화 대상 DNA 영역이 주로 구강의 면봉 샘플에서 검증되었다 (도 3). ZIC1은 단일 마커로서는 민감도가 낮았지만 (46%), 마커 ZNF671 및 ZNF823과 ZNF833 사이에 위치한 마커 영역에 대한 보완으로서, 민감도를 79%로, 특이도를 96%로 증가시켰다 (조직: 암종 28종, 대조군 24종). ZIC1은 ZNF671에 의해 인지되지 않았던 부가적인 암종 샘플을 검출할 수 있는 가능성이 있다.
PAX6 (조합할 경우: 민감도 89%, 특이도 54%) 및 HOXA9 (조합할 경우: 민감도 75%, 특이도 88%)와 조합하여 사용되는 ZNF823과 ZNF833 사이에 위치한 마커 영역과 ZNF671 역시 두경부 종양 마커로서 높은 잠재성을 가진다 (조직: 암종 28종, 대조군 24종).
SEQUENCE LISTING <110> oncgnoctics GmbH et al. <120> DIAGNOSIS AND RISK DETERMINATION FOR HEAD AND NECK CANCER <130> 992-2 <160> 13 <170> PatentIn version 3.5 <210> 1 <211> 34395 <212> DNA <213> Homo sapiens <400> 1 ttctagttgg ggacattatc aaggatgcag tttacccaga gcgattaacc ctagtggagg 60 agctagatta ggaaagtttc tggggtcatg gttaagtcta ggttctactt ggaatggata 120 tctaaccaga aatctttctt gtatcattag tagagttgcc catttcacca ccgaagccat 180 caggacacaa gagaagtctc taggttccct tgcctgcatg gccctagaca accacattgc 240 agctatctcc ctactttaca gggtagtgtc tgtgctaacc cttgcttctg catctgggta 300 aaatacttcc agtcagactg aattgggaac atataagatc ttaaaaccag ccaaatctct 360 gaaagggaca ccttcagaaa ccctcctgtc tagacttact gggttacatt tccaatttcc 420 agatattttc agctggctct tcccctggta taggatttct tctccattct gccctacaag 480 tctcaatgat cctatttaaa atatgcattt ggctcctctt taaaattgtt ctatcttgtt 540 tcaacagatg cctccaagag acccccacta ggttcttgct gacctaatac ttgagatttt 600 aaactcactc cagctggcca ctgaaaccaa cttaacccaa gagattttgg ctaaaattta 660 acaggttcct gagaacctct tataagtaaa tggctatagt tgcccaactg gccactgccc 720 tgccattagg atccctgcat gggatggacc cacagcaggt cactggtacc atgatagaac 780 acacacaaaa acttatgaat gctgtctgtg gacgggttag agtcagtcct tcacactggc 840 taactgggcc taagttttaa aaagagctaa gccgccactt gttaactagg ggtcacaagc 900 actgtgagtt tcctgaaaac caacaccttt ttaactttgg gggctcacct gagctagtca 960 atcagagctc agctgtatca accaatcaga actgagtttc aagtttcaga tcttcatttg 1020 cataaaagca cttgactagg aacccagatg ggaacttttg ctataaaacc taagctttcc 1080 cttgttctct ggaacaaata atgtttaggt tgcaaactcc ttatgccttt tccccagaac 1140 tatgtagaaa taacgccttc taaaatgtga tcttgatacc agggaactcc tttttttttt 1200 tttttttttt tttttttttg agtcggagtc ttgctctgtt gcccaggctg gagtgcagtg 1260 gcgtgatctc agctcactgc aagctccgcc tcccaagtgg ctgagagaca ggtgcgcacc 1320 accacgccca gctaattttt tgtcatttag tagagatggg gtttcaccct gttggccaag 1380 atggtctcaa tcgacctgac cttgtgatct acgtgcctcg gcctcccaaa gtgctgggat 1440 tacaggcgtg agccaccgca cctggctgat accagggaac tcccagagca aagcactaaa 1500 tactttcatt cctctaaggt ctatgactct aatcagcaga aagtagttag agcagttatc 1560 attccttttc cttcaagact taggaatgaa cataatagga gggatttgta accacaacag 1620 attatgtggt acaacttcta tataacaaag ctgagttttc agttgccatg gacccaacac 1680 tcaaggtcac ataatctgag catgcccaga tgaaccaaat gtgtaaccat gggtggaacc 1740 tatatgcttg gactgaggtg tggagattaa agtaaaaagt agatgctggg cacggtgact 1800 catgcctgta atcccagcac tttgggaggc tgaggtgggt ggattgcctg agctcaagag 1860 ttcaagacca cccagagcaa catggtaaaa ccctgtctct gtgaaagata caaaatatta 1920 accaggtgtg gtggcgcaca cctgtagtcc cagctacttg ggaggctgag gcagaattgc 1980 ttgagctcca gaggtgaagg ttgcagtgag cgagatcatg ccactgcatt ccagcttggg 2040 ctacagagtg aggctctgtc tcaaaaaaaa aaaaaaaaaa aagataccac atggtggaat 2100 ctaggatcta atcaggttgg gccccggtat catcccatgg caggatccaa tcgagtcaca 2160 ttaacctggc atgagatcat tgcaagatgc agtgagttca tgtcttatta ccccacgctt 2220 ataaaacttg ccaaagcccc cagctcaggg agacatattt gagcatttct tcctttctcc 2280 ttgccagtca aacttgtagt aaagcttttc tttcttcaaa agctggtgcc atgctattgg 2340 cttgtgtgta catctggaag tgagccaatt cactacttgc taacataaca aagaatcagc 2400 aactgtgaag atgaaacaat taaaattatc cagtctgggc caggcgcggt ggctcacacc 2460 tgtaatccca gcactttggg aggtccaggt gggtggatca cctgaggtcg ggagttcgag 2520 accagcctga ccaacatgga gaaaccctgt ctctactaaa aatacagaat tagctgggtg 2580 tggtggtgca tgcctgtaat cccagttact tgggaggctg aggtagaaga atagcttgaa 2640 ccaaggaggt ggaggtagca gtgaaccgag attacgccat tgcacaccag cctgggcaac 2700 gagagtgaaa ctccatctca aaaaaaaaaa aaaaaaaaaa gaaagaaaaa aattaccagt 2760 ctgtggaaaa gaaagaggaa agaaattgag agaatgtgtt actagtatac ctgccttgcc 2820 agtcatgtta aagttcttca gagcgaagga aactgataca ggttaggaaa gcagatgttt 2880 cagaaataaa acttgttaga aaataattaa atgagggcac aaatatgatt atcttttctt 2940 ctccttcata gataaatgtt tgttcaaatg aatatcaaca atgtattggg tggttatagc 3000 ttctaacagg tcaaatgcgt gacagtgata ttatatggga ttggaaagag gaattcagaa 3060 cactcttaac atattggcac taccccagac accagtatag tgttatttga aaatgaaagt 3120 ccattagttg caaatgtata ctgcaaacta tggaattcac taataaaatt taagaaacaa 3180 gtagacttac tacactaata gaagcaagca aatggaatca tatagaacgc tcaattaaaa 3240 ggcagaaaaa tagagcaagt agaaaaaaag cacaagtaca acaaacaata tatatgaaca 3300 tattaatcta tgtcaattac cactttgaat gtgtattttt tttttttttt gagatggagt 3360 ctcgctccat cgcccaggct ggagtgcagt ggtgccatct cggctcactg caagctccgc 3420 ctcccgggtt cacgccattc tcctgcctca gcctcccgag tagctgggac tacaggtgcc 3480 caccaacacg cctggctaat tttttatatt tttagtagag acggggtttc accatgctag 3540 ccaggatggt ctcaatctcc tgacctcgtg attcatctca ggaagacaag atgggtggat 3600 cacttgagcc caggagttct caagaccagc tgagcaacat ggagagaccc tgtctctaca 3660 aaaaataaat acaaaaatta gccaggcatg gtagcacacg cctgtagtcc cagatgaggt 3720 gggaggattg cttgagttcg ggaggcacag gttgctgtga tcacaccact gcaccccagc 3780 ctgggtgcca gagaccctgt ctcgaaaaat aaataaataa ataaataaac caaaaaacct 3840 gatttatctg aatttaatat agccgttcca tacttttgag tagggctaga atggcatata 3900 tttcaccata cctttctatt taaggtatct gtgtctttct gttgaaaatg gttatctttt 3960 acacattgct gggccttgtt tttaattcta ctctgccagt gcctgtcttt tttactggtg 4020 tatatagata atacacattc aggccgggcg cggcggctca tgcctgtaat cccagcactt 4080 tgggaggccg aggtgggtgg atcaactgag atcaagagtt tgagaccagc ctaaccaaca 4140 tggtgaaacc ctgtctctac taaaaataca aaaattagcc gggtgtggtg gcatgcacct 4200 gtagtcccag ctactcagga ggctgaaaca ggagaccatg gaatattcac caaggcagac 4260 cacatagcat aaaacatacc ttaacaaatt taaaaaaatc aaattccata aaatacgaaa 4320 tcaaaccgta ttagcattaa actagagatc aatagcagaa gcatagttta aaagcctcca 4380 gaaagtaaag atttaaacca caaacttcta aactatgcaa cagacagaat tctccagaga 4440 tacttaaata ttccaaaaat tgaaaaaaac ttttagcaaa atttgtagaa tacagcaaag 4500 gcagtgctta gagagctatt taaataatta aatgcaaact cttgaaagta aagatctaaa 4560 aaacaatgct gtaaattcca ccccaggaaa ctagagaaag aagagcacga taaatgtaaa 4620 ttaaggagag gaaaacaacg agagaagata ttaatgaaat tgcaaacagg aaatcaatgg 4680 aaaacatcaa caaatccaaa tcctggtttt ctgaaatgaa taaaattgat aaacacccat 4740 gctaactcac aaaagggtgg gcatctctaa gatttccatg aacattaaaa gaaccataaa 4800 ggaatattaa ctccatgccc atagatctga taaattacaa gatgaggccg ggcgcggggt 4860 ggctcacgcc tgtaatctca gcaccttggg aggccgaggc gggcggatca cgaggtcagg 4920 agatcaagac catcctggct aacacagtga aaccctgtct ctactaaaaa aaatacaaaa 4980 aattatccgg gcgtggtggc tggcacctgt agtcccagct actcgggagg ctgaggcagg 5040 agaatggcgt gaacctggga ggcgcagctt gcagtgagcc aagatggcgc cactgcactc 5100 cagcctgggc gacagagcga gactccgtct caaaaaaaaa aaaaaagtaa atctgagatg 5160 agttacagat gtcttcaagg tgacaaatcc atggaggtgc agtgctgact gaaaacagac 5220 aagtctgact caagtatcag gtcaggttct cctatcatct gagacatacc ccttcccatg 5280 ctgctcactg aagtgctgag tgaccgccct cccaggagac actgcactgt gtgcttttga 5340 ggttcttgta ccacatcatt ggggggtggg ttttcctttc cttagggtta gtttttaccc 5400 ttcactatgt ggcaggccag agtctcacta acacaggctt ccataacaac tgtttcagca 5460 ctgagtggtt aaatattaaa agtcgagaga gccgatgcct ctaaacaaag gctggaatgt 5520 aacaaaagcc caacaagagt tttgcccagg cctttcctgg gccttgaagc atgacaagat 5580 aacgaaggaa ttcctttttt tttttttttt tttttttttt ggagacggag tcttgctctg 5640 ggactataag tgcatgccac catgcccagc taattttcgt atttttagta gagatggggt 5700 ttcaccatat tggcaaggct ggccttgaat tcctgacctc aggtgatcca cccaaagtgc 5760 tggtattaca ggcgtgagcc accgcgcctg gcccagaaaa cagcgttttg attgaatact 5820 atgacttaag aaatgtacac aaacactcga ttctaatggg tatttttccc tagaagggta 5880 tggattagca attctgaaac tattttacat gttagaatat atgttgttat gttatctaca 5940 atatatgttg tagataatta gtgcctgttt ctcactggag ttgaaaaaag taaaagaaat 6000 aaagggacac tgctagaatg aacccagtgg tgctagaaat acagcaccag ggaaaaagaa 6060 tgtttaatgt tgctgtgaac tgaggagatg aaatcagagt cacaaaatgc agggaaagag 6120 cttaaaaacc aagggatttt aagccctcgg aggagttagt tgagggaaga gagtggtgga 6180 ttagaaaccc tgattcccaa acctttggaa gatgcagagg gataccactt gccatttagg 6240 aatgtgaact caaaagtatc tgagacatgt ttcaatttag aaagtttatt ggctgggcgt 6300 ggtggcttac gcctgtaatc ccagcacttt gggaggcaga ggcaggtgga tcacctgagg 6360 cccagagttc gagaccagcc tgaccaacag ggagaaaccc cgtctctact aaaaatacaa 6420 aattagccag gcgtggtggt gcatgcctgt aatcccagct actcgggagg ctgaggcagg 6480 agaatcactt gaacccggga ggcagaggtt gtaccgagcc aagatggcac cactgcactc 6540 tagcctgggc aagaagagtg aaactccatc tcagaaaaaa aagtttattt tgccaaggtt 6600 aaggacacat ccatgataca gcctcaggag gtcctgacca catgtgtcca aggtggttgg 6660 ggtacagctt gcttttatat taatacattt tggggagaca taatacatca gtcaatacat 6720 gtaagaggta cattggttct acttggaaag gagggacaac acaaagtggg cgggggaggg 6780 gtctggttcc caggtcacag gtggattttc ccataaatgg ttgtggagac caaagtttca 6840 taatgcagat gaagcctcca ggtggcaggc ttcagagaga atagattgta aatgcttctt 6900 atcagactta agttctgtgt tgatgttaat actgataggc ttttcctggg ttccaaaagg 6960 gaggcaaata taatggggca cgtccagctg atacagtttg actgtgtccc catctaaatt 7020 gcatctggta ttgtaatcct ttcgatttag gctattgcgc cacagagcct gcttgcagga 7080 attgtaatcc tatttgtaat ccccatatgt tgagggaggg acctgctggg aggtgattgg 7140 atcatggggg tggtttcccc catgctgttc tcctgataca gtgttctcac gagatctggt 7200 tactggataa gtgtctgggc tcctcccttc tctctctccc tctcctccct tctctctctc 7260 cctcctgcca ccccgtaaga cgtgccttgc ttccccttct gccatgattg taagtttcct 7320 aaggccatgt ggaacagtga gtcaattaaa aacttttttt aaaaataaat tacccagtct 7380 caggtagtat ctttccagca gtgtgagaac agacgaatac acagaccacc cttccatgat 7440 ggcctgaaca agtttttcag gttaattttg tagtgccttc gccgggagga gggatctgtt 7500 caaaatgact ggggggctta gaattttata tttggtttaa aaaaggaata aaggaataaa 7560 gaaggaactg gggaccccgg accgtagctc cttccacgca tgaaccccgc acacgagtcg 7620 ggattccccc catgaccctc ccgtggcccc cgcacaatct ggagagacgc ggggctgcgg 7680 gcgcggagct gcccagagag gactcctgcc cgggcccgca gtcgccgcga agggacggga 7740 caggacgccc ggggtcccgg ctgccagccc agccccaccc tgcggccgag gggaccgagg 7800 gccgagctcc gccagcggta ctccggtcca cagagcccgg agtcgctggc tgggaggccg 7860 gggacccgcc acggccagtt ccaaccagcc cctcctcccg tctcgggatc cctggcccct 7920 cacgctcacc attttccgaa ttcctccgtg tcccgggggc ctctctgcgg ctcccacgac 7980 cagtgcaggt ccctgtgtga cagaggctgc cgcagactct ccagagtgcc tctcagcgac 8040 agagacagga gcccagcgaa gtggcgtgta gaagacgccg cgggcttttt caatctcgca 8100 ccctcttagc tgaagtgcgc ctgattgaca gttcccacga ccccgcccca cggccctgat 8160 tggatagtgc gacagatccc gccccctgac gactgagtta cagaagcgat ctcacgctgg 8220 ggagtggaga ctgatgaacg agttcttgac acagcccttg gcagggcggg cttcttccct 8280 gcgctgtgac ctgacccctc ccaggggaca tctgcattta agcaggatcc cccatctgta 8340 ctcagtgtga ccttcctgct ttttcctcct agactgggga tcacaagtgt gtgcagggaa 8400 acccagacac attgtccagt ggagccattc cctggcctcg gagtaggagg agagccgagg 8460 ccatacgggc cacactgcaa caagaataag ggcttaggct gggcgtgata gctcatagcc 8520 gtaatcctaa cactttggga ggccgaggcc ggtgcattgc ttgagcccag gagttcgaga 8580 ccatcctgga caacatagtg agagcctgtc tctacaaaaa aatacaaaaa ttagcctgga 8640 atggtggcct gtacctgtag tcctagctac tcggaaggct gaggtgggag gatcacttga 8700 gcctgggagg tcaaggctgc agtgagtcaa gatcgtgcca ctgcactcca gcctgggcga 8760 cagagtgaga caccatctca aaaaaaaaaa aaaaaaaaaa aaaaaaataa gggcccgatg 8820 tgttccaggg atcaggaatt ttggataagt ctgttggctg catggccaag cctttctccc 8880 accttatctc tcaatctact gattttcagc caaggaagta ataacatgcc aacaacggaa 8940 taaaatcatt aaatgtatgg aaaaagtgga atcacatagt agcaatattt tataaggaaa 9000 tcgaaagaca agaaaagcaa acactcgaac tagttgagat aagtagcctg ctgcacccac 9060 agttcacaaa cctgcagtca gaaggtgata cacgttccca agcttgtgag tcaaactctg 9120 atgaggcagg ggcacttaaa gatttaactc tgggaactca acgtggcctc ctactccttc 9180 tccagagtgt ggaaatgctc cttccttcaa gaccttcatt ttctttcttt ctttttcttt 9240 tttttttttt ttttgagacg gagtctctct ctgtcgccca ggctggagtg tagtggcgtg 9300 atcttggctc gcaaccttcg cctcccgggt tcaagcgatc ctcctacctt agccacccaa 9360 ggagctggga ctacaggcat gtgctaccac gcccagctaa tttttttttt tgagacacag 9420 tctcgctctg ttgcccaggc tggaatgcag tggcacgatc tcggctcact gcaacctccg 9480 cctcccaggc tcaagcaatt ctcctgcctc agcctcccga gtagctggga ctacaggcgc 9540 acgccgccat gtccggctaa ttttttgtat tttagtagag acgggatttc accgtgttgc 9600 ccaggctggt cgcgaactcc tgagctcagg caatttgccc accttggcct ccgaaagtga 9660 tgagattaca ggtgtgagcc actgcactcg gcccactaat ttttatattt ttagagagac 9720 gaggttttac catgttggcc aggctggtct tgaattcctg acatcgggtg atccacccac 9780 ctcagcctct caaaatgttg ggattacagg tgtgaaccac cgtgccggcc aagaccttcc 9840 tttttgccag caggaaactc tcatctaaaa atcagtttaa tgcattgacc tatataaact 9900 gtcaaattca taactccttt tccagaaggc aatctaatga gtctttaagt ctgaccttca 9960 cagattttcc tcctatatac aaatgacagc ctgcctcctg tgactctgtg catgcccaag 10020 gcaaagcact tgaatgtact gagatcttca atatttacaa aagaagatgg tcagattaaa 10080 atattctgtc tatgccctca atgagcaggt agtataacag gttagagagg acaaaatcaa 10140 ataaaatgga catggaactt acccatgata tcacagtcta tcctggagga tttttgtggt 10200 tgttttgttt tgttttggag acagggtctc tgtgtcacca aggctggagg gcagtgagtg 10260 gtgtgatccc agctcactgc agcctcaagc tcctgggttc aagccatcct cccacctcag 10320 cctcccaagg agctggaact gcaggcgtgc accaccagct tggctaattt aaaaaaattt 10380 tttgaggtag acacggcgtg gcggggggat gggggagtct caccatgttg cccaggctgg 10440 tcttgaaccc ctgggctcaa gcaaccctcc cccctcagcc ttccacagtg ctgggaatac 10500 aggtgtgagc caccgtgcct ggcgatggtt tctaaaaagc actttgcttc aaaggattta 10560 gagagccaca ggtgggttca tctggggcca gttagactgc ttgaaaagga aagctattta 10620 tgcaatctgc agctgcctag gaaatggccc caaagttccc agagttacag tctcaaaaag 10680 gacgcaaccc cctagctgca tctacatgtg ggtttcccgc tttccagggc actgcagctt 10740 ctcagaatcc acagtcctta gctgttctga gcagctggag gccatccgca agggtaggca 10800 ggatgcccag ctccattctc ctccctttgt aggcttaaga ctggtgtcag cttaaagtca 10860 ctgtcctcag gctctgctgc ccactccagg tttttagggc tccgaaaaca atgatcctca 10920 aaacaggtct cagaagcaga agtttttctc tgaccttctc ttgccctcct gtctctcagt 10980 cccattctcc accaagggta gccatagaag ctagaatccc tcttccccaa ggcaggtcat 11040 agaatccaga acccctattc cccaagggca gccataaaat gcaaacagat aactttccct 11100 gtgccttcct ttggaaaaac tggtcacaaa gaatttatct gacctacctt atttgactgt 11160 aggtcataag actgtcattt aagagaggat tctggccagg tgcggtggct cacacctgta 11220 atcccagcac tttgggaggc caagacaggt ggatcacgag gtcaggagat caagaccatc 11280 tggccaacat ggtgaaaccc cgtctctact aaaatacaaa aaattagctg ggcatggtgg 11340 cacgcgcctg tagtcccagc tactcgggag gctgaggcag gggaatggct tgaacccagg 11400 aagcggaggt tgcagtgggc cgagatcgcg ccactgcact ccagcctgga gacagagtaa 11460 gactccgtct caaaaaaaaa aaaaaaagat tctgtctcat acctagaagg aaggaatgct 11520 actcagagag accaagaaaa atctagacag acaggccttc tgggtttcct cactcagtct 11580 gttagcattc aatcatacct tttttgttca atcaggtttc ttcatagctg ttcacacatt 11640 gttaaaccca agcacaaaaa tgtacaactt accctgtatc tctgagtctt cattctgaag 11700 gctcctgtgt atatacatta aataaaatgt gtatgccttt tctccaatta atcagtcttt 11760 tgtgagttga tttttcagtg caacatgaga gggtaaagga gaactttccc catggcccct 11820 acaaggttat tcacctgcct ttcactgata agttaaatga gacaaagacc ctcaatccca 11880 ctgtttgaat aagaagccag cagactcctg ggttttctcc tatgtttata tataaagtag 11940 aggaagaaaa ttctaagata ttttatatgg gttaaaaaaa aaaaaaagcc tggagtccgg 12000 gtgcggtggc tcacgcctgt aattccagta ctttgggagg ctgaggcggg cggatcacaa 12060 ggtcaggaga tcaagaccat cctggctaac acggtgaaac cccgtctcta ctaaaaatac 12120 aaaaaattag ccgggcgtgg tggcgggcgc ctgtagtccc agctacttgg gagactgagg 12180 caggagaatg gcgtgaacct gggaggcgca gcttgctgag atcgcgccac tgcactccag 12240 cctgggcgac agagtgagac tctgtctcaa acaaaacaaa acaaaaaaac cctgaaaatg 12300 gttggctatg gtggttcaag cctgtcatcc cagcactttg ggaggcagat cacttgaggc 12360 taggagttca agactagcct ggccaacata gtgaaacctt atttctacta aaaatacaaa 12420 attagccggg catggtggcc catgtctgta gtcccagcta ctcgggaggc tgaggcatga 12480 ggattgcttg aacccaagag gcggaggttg cagtgagcca agattgtgcc actacactcc 12540 agcctgggtg acagagccag actctgtctc gaaaaaaaga aaaaaaatta aaaaccacct 12600 ggatataatt attcctttga gaaaacaaac tgttattttc ctcctaacag ttgtataaaa 12660 caactaatca ggctgggcac ggtggctcac gcctgtaatc ccagcacttt gggaggccaa 12720 ggtgggcaga tcacttgagg tcaggagttc aagaccagtc tggtcaacat ggtgaaaccc 12780 catctgtact aaaaatacaa aaattagcag ggtgtggtcg tgcatgcctg taatcccagc 12840 tgcttgggag gctaaggcac gagaatcact tgaacctggg gaggtggagg ttgtagtgag 12900 ccgagattga gccactgcac cccagcctgg gtgaaagagc gaggctctgt cacaaaacaa 12960 aaaaaacaaa aacacacaca cgcacacgca cacactaatc aaaagtgaac tctccccttt 13020 ttcctctgtt tcagcagctc cccaaccttc acagttcatg gttgtcatca cgtgctctgt 13080 acctggtaat ggacatgttc agtttaccca tctgaaactc tcaaccccac tccatcacca 13140 ctgacccatc caatcatttc tgcagctaaa ttctaagcat tgtataaata cctcttccct 13200 ttcagcagtc cagctggccc aggttgaatc cacctgtggc tctctcattt ccctcaattt 13260 caattattca tttgaaacta tcttccagga tcgactgtga tatcttgtat gatgaccaca 13320 ttccctttat ttgcttctgt tcttcctaac ccatgtcgcc acctgttcat tgagggcaca 13380 gacagaatat tctaagctga ctatcacctg ctgtaaattc tggagtctca gcacaacctg 13440 gagaaatcca cagcccagag aggatgttaa tgccatcctt accacaagag ggagcttctt 13500 attttcactt ctggaaaatg gctaaaaaca gaattttgga gttttacata gcacaatata 13560 gatgatagaa gtaaaggtaa caccattcaa ttttgtttca ttttctttct tttttttttt 13620 ctttgagaca gggtctcact ctattgccca ggcaggagtg cattgtcacg atcacagctc 13680 actgcagcct caacctcctg ggctccagtg atgctcctgc ctcaacctcc agttagctgg 13740 gaccacgggt gtgtaccacc atgcctggct tattttttaa aaagttattt gtagaggtag 13800 gggtctcact atgttgccca ggtggtcttg aactctgggc tcaagtggtc ctcttgcctc 13860 ggcctcccaa agtgttagga ttacaggtgt gagccactgt ggccaacctg gtttcatttt 13920 tatgatttaa cttttcctag gttaaaaaag caaataagtc catgcacagt ggctcacctc 13980 tgtaatccta gcacttcggg aggtcgaggc tggaggatca cttgagccaa ggagtttgag 14040 accagcctgg agcctgggca acctagtgac accctgtctc caccaaagaa agaaagaaag 14100 agaaagagag agagggagag caaaaaagtc tgtgaatctt aactgaattt ctctgaatat 14160 gagaagtgca aggaaatatc tctacaaacg gaaagatgta ggagtaactg aggtggtaca 14220 aaggattctc tctgagatgg tgacatttac tgtgagacct gaaataatat attagggcag 14280 taaaacgtta gggcagagga ttcagggaag atggcagagt agcaagcata aaaaagcttt 14340 ctcaggccgg gcgcagtggc tcacgcttgt aatcccagca ctttgggaga ctgaggcggg 14400 cagatcatga ggtcaggagt ttgagaccag cctgaccagc atggtgaaac tccgtctcta 14460 ctaaaaatac aaaatttagc tgggcatggt ggcctgcacc tgtaatccca gctacttggg 14520 aggctgaggc aggagaatcg cttgaacccg ggtgtcagag gttgcagtga gcagagattg 14580 caccactgca ctccagccga cagagcgaga ctccatctaa aaacaaaagc aaaaacaaaa 14640 acaaaaacaa aaccaagctg tctcagccgg gtgtggtggc tcacagctat aatcccagca 14700 ctttgggagg ctgaggtggg cagatcaccc ggggtcggga attcgagacc agcctgacca 14760 atgtggagaa acctcatctc tactaaaaat acaaaattag ccgggtgcgg tggtgcatgc 14820 ctgtaatccc agctacttgg gaggctgagg caggagaatc gcttgaaccc gggaggcaga 14880 ggttgcggtg agccgagatc gcaccattgc actccagcct gggcaacaag agcgaaactc 14940 tgtcttaaaa aaaaaaaaaa agctgtctcc ccacctagac aaccactgga ctgacagaat 15000 catctgatgt agcaatgtta taactgtgga ggctattgaa gctttgcaac ttccataaaa 15060 aggattagac agtaaactat ggctaattgt ggtcatttta tcacttagca caatacaagc 15120 tatcatcccc acccttaccc ctgttgcagg cagctgcaca tggagtgttt tcctctaatt 15180 tggcctcggg atctctctca gaagcgtggc tataaacttt agtgctggcc aggcggggta 15240 gctcatgcct gtaatcccag cactttggga ggccgaggcg ggcggatcac aaggtcagga 15300 gatcaagacc atcctggcta acctggtgaa acccagtctc tactaaaaaa aatacaaaaa 15360 attagccagg catggtggcg ggcgcctgta gtcccagcta ctcaggaagc tgaggcagga 15420 gaatggcgtg aacccgggag gcagagcttg cagtgagccg agattgcacc actgcacacc 15480 agcctgggcc actgagtgag actctgtctc aaaaaaagca aaaacaaaaa caaacaaaaa 15540 gaactttagt gctgcattga cggggctcca ggacacttgg ttgtggatat ttacagtgtg 15600 actttcatgg ggtctaatat ttaagtgtta acccataacc aaatgtcctt cacaggaaac 15660 ttgattatac tggcagatgc ccttatggtt ctacctctgc caagttaatc tctaccaaga 15720 tagccagata cccactctct acagagccct gacctggtaa taagctagac ataggtgtgg 15780 cagtcaggtg agacgtgtga gacagcatca ggcaggccaa tatatgcact gtgggagttt 15840 cagaaggaga agagacagag aaaggtcagg ggagactatt tggagaaata atagctgcaa 15900 atattccaaa ttagataaaa gccatgaatg aatgctgtca tccaagaagc tcaatgaact 15960 ccaggtagga tgaatgcaaa gagaaggaca tgaagacata ttatactcaa attgtcaaag 16020 ccaaacataa agggagaacc ttgaaggcag caagaaagaa gtgaatcatc acatataaat 16080 gatctttcat aagatcatca gcagatttct catcagaagc gctgaaggcc agaggtagtg 16140 ggctgatgta ttcaaggtac ttaaaaaaaa atggccacgg tggcacatcc ctgcagtccc 16200 agctattccg gagtctgaag tgggaggatc agttaaggcc caagagttca aggccagcct 16260 aggtaacatg gcaagactcc atctcagaaa caaagacagc caagaatcca atatctggca 16320 acattgtctt tcaaaagtga ggaggaaatt aaggcatgct cacatgaaca aaaactgagg 16380 tagttttgtt ctttttgttt ttgccattag atgtaccctg tgagaaacgc aaaagccttc 16440 tacaggttga aatagaacac tggacaatat ctggaaggcg taagcccaaa taaagatctc 16500 agtagaaaca aatgcatgga caattataaa tgctaatatt attgtacaat aattgtgaac 16560 tccagttttt gtctttacat aattgaagat acaaatccat taaaaattat tagtctaaaa 16620 gctagcattt tagacttggc ttttgaactc tatattttgt ttttttacac agtttaagag 16680 actaataaaa aagaaactag gttgggcgtg gtggctcacg cctgcaatcc caacactttg 16740 ggaggctgag gcaggcagat cacgaggtca agagattgag tccatcctta ccaacatgga 16800 gaaatcccat ctctactaaa aaaagaaata caaaaattag ttgggcgtgg tggcgcacgc 16860 ctgtaatctc agttacttgg gaggctgagg cagtagaatc acttgaaccc aggaggcgga 16920 ggttgcagtg agccgagatt gcaccactgc actgcagcct ggagacagag agagactccg 16980 tctcaaaaaa aaaaaaaaag aaagaaagaa acgaatgcac cgaaaatatg tttgcgtttt 17040 tgaatacata aagtataaag atgtaaattt atgacaccaa actgaaaggg gtgtgaacag 17100 gcatgccatg gagcattgta tttgcatgct atttatgtta aattggcata aatttagaat 17160 gttatggcct taggatggta aacgcaatcc ccatggtaat taacagagca gtagtgtata 17220 cacaaaagga aacaataaag aaatttaaat gtttcactac aaaaagcaat taaaagcaaa 17280 ataatgcaga aatgcatgaa atgagaagaa aaaagctaca aggcatattg aaaacaaata 17340 ggaaaatgac aaaaccaagt cctttcttat caggaattac tttatctatt tattcatttt 17400 gagacacagt gttgctctgt cgtccaggct ggagtgcagt ggtacgatct cggctcactg 17460 caacctctgc ctcctaggtt caagtgattc tcatacctcc aaagtagctg ggattacagg 17520 catgcaattc tcctgcctca gcctcccaag tagctgggat tacaggcatg cgtcaccaca 17580 cccggctaat ttatttctat ttttagtaga gacagggttt cactgtgttg gccaggctgg 17640 tctggaactc ctggcctcaa gggatctgct cacttcggct tccccaagtg ctgggattac 17700 aggcgtgagc cgcagcgcct ggcaatgtga gttaatttta gtgtataatg tgagaaaggt 17760 tctcagttca tctttctgca ggtcaatatc ccattttccc agcacattgt tgaaaaccca 17820 ttccctatga aagcatcttg gcccatttgt tgaaaatcaa tgagccataa acaaagagtg 17880 tcttagtcca tttgtgctgc tatcgtggaa taccacagac tgggtaattt ataaagaata 17940 gaaattgact ttctcacagt tcagaaggct tagaaatcca agaagacact ggcatctggc 18000 ttcagcattg ctgcattctc acagggtgga agacaggagg gcaagagagg gcaaattgca 18060 ttcatcaaac cctgtataat gccattaatc tattcacgag ggcagagtcc tcatgatcta 18120 atcaccaaaa ggcccctcct cccaatagtg ttgcagtggg aattaagttc tgacttataa 18180 attttagaga gtacacaaat atttaaacca tagctaaggg actctcaatt ctgccctgct 18240 ggtctatata gctgacaatt tgccagtaag tctggttact ttactaccca ccctgatgct 18300 gaagcatccc attccgtccc acatgatagt catgcaggca tagaaatggt tctaaagccg 18360 caagagcatc ccttagacaa cctagatgta cttctatttt aggatacatc ctgtaaaaga 18420 aattttctga agaacataat aatgggtcat gccatggttg ctccacatga aacgctcggg 18480 gcactgtctt cactcactgt aaaatcagcc caaggactga actcatagct cttaggaaag 18540 cttgcacatt ggcaaacaag aaaactgaca cagagagtaa gcttccacac ccacaatctc 18600 agctactcag gaggctgagg caaggggatt cttgaggcca ggagtttgag gccagtttga 18660 accacacagc cagattccac ctcaaaaaga aaaaagaaaa agaaaacggc tacaatttac 18720 acggatacca gatacgcttt gggagtcttt catgcagtgg acacagtctc aaaacctgga 18780 ggatttacaa cttgttctgg ttacttatta cctatcatct attaccaatg gacatgtaat 18840 acatgcacta ttacaggcta ttcatctccc tcccaaagtg gctactgttc actgttcagt 18900 ccatattaag gagacttatc ctatgtcttt caggaatgat agggcttaaa tactgttaaa 18960 tagaaagaca gacatgtacc cctttatcct ttctcccccc aatttataag cctgcctttt 19020 tttttttttt ttttttgagg tggggtcttg ctctgtcacc caggctgcag ggcagtggca 19080 tgatcacagc tcagtgcagc ctcaaccttc caggctcaag tgatcctcca acttcagcct 19140 ccaaagtagc tgagatcaca gacatgtgcc accatgccca aataatttac ttttttattt 19200 ttatttattt atttatttat ttttattttt attttttttg agacagagtc tcgctctgtc 19260 gcccaggctg gagtgcagtg gcgcgatctc ggctcactac aagctccgcc tcccgggttc 19320 acgccattct cctgcctcag cctccagagt agctgggact acaggcgccc accaccacgc 19380 ctggctaatt gtttgtattt ttagtagaga tggggtttca ccgtgttagc cagtatggtc 19440 tcgatctcct gacctcgtga tctgcccacc ttggcctccc aaagtgctgg gattacaggc 19500 gtgagccacc gcggccggcc atttttttat tttttgtaaa ggctgtcttt aactctggtt 19560 gatattacta tcaggtaaat gtcccataat ctgaaggaga ccaatagata caaaagagag 19620 acaaacaatt gttggagaga ttatatatgc ctcatgatta gtaattatag taacttgtta 19680 acaattgtca ttgttaatga aaatcagatt ataccaaaca tactccttgt agcccctttc 19740 tctctctctt tttttttttt ttcttttttt tgagatagag tttcactctt attgcctggg 19800 ctggagtgca atggcacgat ctcagctcat tgcaacctcc gcctcctggg ttcaagcaat 19860 tctcctgcct cagcctccca agtagctggg attacaggca tgcgccacca cgcccggtta 19920 attttttgta ttttttagtg gagacagtgt ttctccatgt tggtcaggtg gtctcaaacc 19980 ccctacctca ggtgatccac ccgcctcggc ctcccaaagt gctaggatta caggtgtgag 20040 ccaccatgcc cgaccagccc ctttcttttg atattttgct ttgcactaat ctcctaccag 20100 ctgggacatt tacagagata ggaaatagtt aagaaaatta aaaaaagaaa aaaaaagaaa 20160 aaaaagaaaa gaaaactggc tgtgccctgg catttacaaa atttctgacc caattatttc 20220 tcacaacact acttacttgt aaatctcaca caacactgct tacttgtaaa tctcacacaa 20280 tttcattccc atgtatatat tcaagagaat tgagggcagg gactcacaca gacacatgta 20340 ttctaattct atagcagcct tattcacagt agtcaaaatg tgattgtgga aacccacatg 20400 tttatcaaca tataaatgga tgagaacagt gtgttttaac tatacaatgg aaaattattc 20460 aagcactaaa caagaatttc tgatatgtgc caccacatgg atggatcttg gaaatattat 20520 gctaagtgaa attagccaga tatagaagca caaatactgt atgctttcac ttatatgagg 20580 tgcctagcat agtcaaattc acacagagag aaaatagaat agagattatc aggacctggg 20640 ggtgggagag aatagggaat tatgtgtatg tatatgggat gctaagtaga aatagcaagt 20700 ggtatggtaa catgtatagt ataatcccat ccagtatgta ttttagtttg taccagcatt 20760 gaagaagggt cttccagatg gacagtccca gtggttacac ttgccatagg caacaatgcc 20820 cctgggccac atcttggaag tctatttgaa ttacatttca atgcaattta ttcttatgaa 20880 tactctaatg aaacagctct tatcaaggca cccagtgacc aaacacttgt caaaatctac 20940 gtcaaccctg tttccttgtc ttattcaaac tctcagttac ctgtgacaga gttggccact 21000 ctctcatctt tagatacttt cttctggagg cttccaggag aggacatcca cctgttactc 21060 ctcctgcctc accagcctgc ccagtctctt ccaggctctt cctcctgcta acctcagggg 21120 ttgccagcac ttggactcct cttgagcact caatttttaa atttattttt tatttttatt 21180 tttgagatgg agtctcgctc tgttgcccag gttgaagtgc agtggcacta tctcggctca 21240 ctgcaacctc cacttcctgg gttcaagcaa ttctcctgcc tcaccctccc aagtagctgg 21300 gactacaggc aaacgccacc aaagccggct aatttttgta tttttattag agatggggtt 21360 tcaccatatt ggccaggctg gtctcgaact cctgacctca tgatctgcct gcctcggcct 21420 cccaaagtgc tgggattaca agcgtgagcc actgcacctg gctgagcagt cattttctgt 21480 tataattcgc tcctaactct gaaaccagtt ggcctgttct ggacccgggg cttcaaataa 21540 cttccgcatg ataatattct caacattcca tccagatctc ccttgcaagc tccagactcc 21600 caggtccagt ggcctgctga aaaatcttcc cttgtttggc tcaaatatgt catggctgaa 21660 catgaaacgt aacccttgac ttcccctcct gtcaactccc ctgagccttg ttcctctgag 21720 taagaggcag cacccaggag ctctgaacag taggacacat ccttgactct tctctctttt 21780 cacatcatca gaagttctac aggagctacc tctgcctggt tcactcccac tcaggtttca 21840 ggttttaatt tgagcatcag tccccacacc agggaagcct ccactaacct ctcagactcg 21900 tttgggaacc ccctccatca tcatatgctc tcagatccac acacccttct gtactgcact 21960 gaacactatc agcaccggtc ctttatgttt atgtccagac tccactaaat agtgggaatg 22020 gtagggcctt tctctaccat cccacccagc tccaaaaaca ctgctcaggt tcatatctag 22080 atttcgaaat acacaacctt ctgttaacat ccactaacac tagccaagtc caggccagca 22140 cgacctatct tgcaactact actgtggttt tcaaactggt cttccagctc ccctctagca 22200 tctttttttc ccaaccaaga gaaggagtaa acttcttcaa acactaatga aaactgctgc 22260 tttgctcaaa atccagtaac tgtctataac atggcgacaa gatcccatgt gatctggccc 22320 ctgcctacct attgaagccc atctattatt accttggcac tctagctgtg gtccaaggat 22380 caacaacaca gatgacacct ggaagcaagt taggaaggca gactttcttt catttttgag 22440 acagagtttc gttcttgttg cccaagctgg agtgcaatgg caagatctcg gctcactgca 22500 acctccactt cccgggttca agtgattctc ctgtctcagc ctcccgagta gctgggatta 22560 caggcgtgca ccaccatgcc cggctaattt tttgtatttt tagtagagat tgggtttcac 22620 catgttggcc aggctggtct cgaactcctg acctcaggca atccacctgc ctcggcctcc 22680 caaagtgctg ggattacagg cgtgagccac tgcgcccggc caggaatgca gactttcatg 22740 ccctactctt aatctgctga gtcagaagct gaatttgaag atccatattt cctgtgaaag 22800 tttgagaagt acatctcata agcttccccc tccacctgat tcagccctaa gggtattgca 22860 tattcctcac cactgaggta tttgaatcaa caaaatgtct taggtggcgt agacccagga 22920 gggctgcaaa atgcttgggc ttgaactggg agaggacact agagagacag tcccaagaag 22980 accatgcggc cacggccgag cctgcctttc cagcactgcc atggcatgtc ccactgctcc 23040 tgaagtacag gaatggccac tcatgggaac tgaccgggag tgactgtgtg cgcagtcagc 23100 aacacactga ggctggagtg cttgtagcag gatgagccgc agacgaaacc cctcagacat 23160 cacgttaaag aaggaagggc tttattcagc caggagcatc ggcaagactc acatcttaaa 23220 aaccgaactc cccgagtgag caattcctgt ccctcttaag ggctcacaac tctaaggggg 23280 tccgcatgag agggtcgtga ttgattgagc aaacagggag tacgtgacta ggtgctgcat 23340 gcactggcaa ttagaacaga acagaacagg acagggattt tcacagtgct tttctcttca 23400 atgtctgtaa tctacagata acataaccga ttaggtcagg ggtagatctt taactaccag 23460 gcctagggtg aggcgccggg ctgtctgcct gcggatttca tttctgcctt ttagttttta 23520 cttcttcttt ctttggaggc agaaatcggg cataagacaa tatgaagggg tgtctcctcc 23580 cttctgctca cacactgagg ctggagtgct cgcaccctgc tacccatgtg ctcaccctgg 23640 gattcgggga agcatgcaca caggcaagca ggaaaaacac gaggatcctg gaaggggatg 23700 ggcagaacgt gatggaggag agaggtttct gcttcctcca agggccaaaa gtcactgtct 23760 gacatgtgaa cgagatactc taacagagtt cggggttggg gtaggggcag atacccagta 23820 cctgctacaa aaggccagta gtaaagtcac aacaaatacc aaaatgtcat gtttcaaagg 23880 ctctttagat aagcatcgat tttaaaacca tataagaatt aaacttgttg ccaggcagca 23940 tgactcatgc ctgcaatcac aacactttgg gaaaccgagg cgggaagatg gctcgaggcc 24000 aggagttcaa gaccagcctg agcaagatag caagacctca tttctccaaa aaaaaaaaaa 24060 aaaaaaaaaa aaaattagct gagtttggta ccatgcacca gtagtcttaa ctacttggga 24120 gactgaggca ggaggatgtc atgagcccag gtgctcaaag ctgctgtgag ctatgattac 24180 accactgcat tccagcctgg ataacagaat aagatgcgat ctctaaaaat taaaaaaaaa 24240 agaattaaat ctacttgtct attacacata aacttcaagc aactcaagga tccaagagaa 24300 tacaaaattg aaagaaaaat tttatcaact gactttacca aaacaaaccc accacctatt 24360 caacttatga aagctctttt taaaatcaac ttttatttta gattcaggga gtacacatgc 24420 aggtttgtta cttgggtatt ttgcatgatg ctgaggttta aagtatgatt gattccatca 24480 cccaggtagc gagcatagtt cccaacaggt ggtttttcaa cctttcacct ccctccctcc 24540 cccgtctact agtccccagt atgtattgtt cccatcttta tgtccatgtt tactcaatgt 24600 ttaactcccc cctttttttt tttttgagat ggagtctcgc cctgtcaccc aggctggagt 24660 gcaatggcac gatcttggct cactgcaacc tccacttcct gggttcaaat gattctcctg 24720 cctcagcctc ccgagtagct tggattacag gcacctgcca ccacgcccag ctaatttttg 24780 tatttttagt agagacaggg tttcaccatg ttggccaggt tggtcttgaa ctcctgacct 24840 cgtgatccac ctgcttcggc ctcccaaagt gctgggatta caggcgtgag ccactgcacc 24900 cagctgttta actcccattt ctaagtgaga atatgtggta tttggctttc tgttcctgtg 24960 ttaatttgtt tagggtaaca gcctccagct gcatccatgt tgcatcaaac gacatgattt 25020 tattcttttt tttttttttt ttgagacaga gtcttgctct gttgcccagg ctggagggca 25080 gtggcacaat ctcggctcac tgtaacttcc accaggttca agcaattctc ctgcctcagc 25140 ttctcgagta gctgggacca caggcatgca ccaccacagt cggctaattt ttgtattttt 25200 actagagacg gggtttcacc atgttggcca ggctagtctc gaactcctga cctcaggtga 25260 tccacgcctc ccaaaatgct gggattatag gtgtgagcca ttgcccctgg ctgatttttt 25320 ttttttttta tggttgtgat gaacctttgt gtaaagaaaa tttacaaaga tatctcacat 25380 taatttttta atataagact taggaatcca gagtgaagat ctattttgtc aatgagccac 25440 tgataaagac aatatttatg tattttataa catttctttg atgtggcaaa ttttctggaa 25500 cattatacat gagtaaattt ggttaagaat ttcctgaatt acttacgtac atttacctcc 25560 agtcgtgtga ggatgaggag ccttcaagcc aacaaagttg tagacctata tccatggaag 25620 tgacgagcag gtcatttcat caggaaactc tcacacttgt cagcagatag atgctgcaca 25680 tggaattagt tctattcctc agaaatttat atatatttgt aagaaatgtg atttaaattc 25740 aatactatat agtttatgtt attgtgtaca cagcatatgt ttactccata agcaggacct 25800 tgactccatt atcaggttta atacttttcc aggtgttttg tttttagttt cctgggcaaa 25860 tagtgctatc atctccaatc acgatacttg cttcttccat ctggttcttc atagtgatct 25920 tttttttttg tttttgtttg gagactgagt ctcgcactgt cacccaggct ggagtgcagt 25980 ggtgcaatct cagctcactg caaactctgc ctcccgggtt caagcgattc tcccacttca 26040 gcctcccaag tagctgggat tataagcggc cgccaccatg cctggctaat ttctgtattt 26100 ttaggagata tggggttgca ccatgttggc caggctggtc ttgaactcct gacctcaggt 26160 gatctgcccg ccccggcctg ccaacataat gatcattttt tgacagtaag tactatagac 26220 taccgtaata ataagtgggg ttaaacagac atatttgctt tcattagatt ctgttcctcc 26280 tttcactggg aagcctctca cctaccggtt cctcatcgtg ctgtgctctg aaacatacct 26340 taatgaagaa tctgatatcc aaaaaattca tcttcaaaat ggaagacaaa agaaaaacta 26400 tcccaggctt aaaatatata tattgagaga atgtgttcct actacaccag acctacaaga 26460 aagatcaaag gagggtcttc aatttgaaat taaaaaaagt caaaatccac agggaaaaac 26520 aaagagcacc attagagatt atgtaagtgg gaacgacaaa tggtatgtgt atttcttcat 26580 ctttcttctc gttatagatt taaaaggcaa ctgtgtaaaa taataagtag tcaatggatt 26640 gttgggccta caacatagaa gaatgtaaca tgtgcattat atttacaaat gaaaccataa 26700 aaaagtgagc taactaaatg actaccaaag caaagtagaa agaatgtatt gttggatgtg 26760 taaacctaag gattgttaca catgcaacaa aataccccag aaaggcaaaa aatataatag 26820 ggctttagag gataaatatg tttgtatatc actggaattt atccatagat cactggaaaa 26880 ttgaccctga ttgggataag ttatttacat gataaacact tgagtaaaca ctacagaacc 26940 tcaagtcatc ctacattgta aagacgtatt ggatgaaagc agaatttact gtccttccta 27000 aattaaaaat ggacactaca tacattctat aacattatga ggacaagatt tccctcattc 27060 atccaacttg gaagtttcca tgttatatta catatttccc cttcaacatt cactctacaa 27120 ttagaatcag aaaattgttt cttgtgcagg tcgtgatctc tctatatcca tttcttgaac 27180 ttctagccca ggtacagaat tacatttcaa cgatccctta ttttgcatta tatgttctca 27240 aaaaattttt tttttttgag acagagtctc gctctgtcac ccaggctgga gtgcagtggc 27300 gcaatctcgg ctcactgcaa gctccgcctt ctgggatcac gccattctcc tgcctcagcc 27360 tcccgagtag ctgggactac aggcgcctgc caccacgccc agctaatttt ttgtattttt 27420 agtagagacg gggtttcacc gtgttcgcca gggtggtctt gatctcctga ccttgtgatc 27480 cacccccctc ggcctcccaa agtgctggga ttacaggcgt gagccaccag gcccggcctc 27540 cctgactttt tttatggtgc aaaaatacac ataaaataaa atttaccctc tttttttttt 27600 tttttgagaa ggggtctcac tctgtcacca agttggagtg cagtggcacg atctctgttc 27660 actgcaatct ctgcctcctg ggttcaagca attctcctgc ctcagcctcc ccagtagctg 27720 ggactatagg cgtgcgccac cacacccagc taatttttgt atttttagta tagatggggt 27780 ttcaccatgt tggccaggat ggtctcgatc tcctgacctt gtgatccccc tgcctcggcc 27840 tcccaaaagt tctgagatta caggcatgag ccactgtgcc tggacaaaat ttaccctctt 27900 aaccctattc atgagggccc taccctcatg gtctcatttc atcctaatgt cctcccagag 27960 atcccatctc ctcattccat acattagaga gtagtctttc aacgtatgaa tttcagggga 28020 caaataaact caataatatt gtaatctcca ccccaatgta tttcctcaca tgcaaaatac 28080 atttattcca tcccaacacc atcaaaagtc ttgactcatt ctatcattaa ctctgaagcc 28140 taaaatcaaa gtctcattta aatagcatct gaatcagata agggtgagag tcaatgtaac 28200 attcatgctg agccaacatt cttctccaga tgtaaaatca aatcagttgt gtacttttaa 28260 attataatgg tggaacagtt ataagataaa caatgctatt ccgaagggga gccatataag 28320 gggtggaaga gtgacagttc ccaagcaagt ccaaaacctg gaaaggtaaa cttcatgaga 28380 tttttttttt tttttttgag atggagtttc gctcttgttg ccaaggctag agtgtaatgg 28440 cgcgatctca gctcactgca acctctgcct gccgggttca agcgattctc ctgcctcaga 28500 cccctgagta gcttggatta cagccatgtg ccaccacgcc tggctaattt tgtattttta 28560 gtagagatgg ggtttctcca tgttagtcag gctggtctcg aactcccaac ctcaggtaat 28620 ccgcccgcct cggcctccca aagtgctggg attacaagtg tgagccactg cgcccggcca 28680 ggatcttaag gctaaataat aatccctttt cattcaatac tctgccctca aggaattgtg 28740 acacagcaat tgtgtcccag catctctgtt agacatggat caaacccaaa tagcgtttga 28800 tggcactgca tccacacttc tgggtttagc tcatcttgtt tgtggaaact ccaaaatgtc 28860 ccctactgtt gatgctcagg aggcagcctt catgacctct aaacagctac tgggatcctt 28920 cttctcttgt ctctaagaat accatgcatt cagctctatg gatggttcct gtaaaatcat 28980 acaggtccaa caactttcat tttttcctgt gaccttcact ttcagttcaa aggggctatt 29040 ttactgctga ggtggctaag tccatggtta acaagaatac cactcttcct atcaaaaggt 29100 cttggacaca cccttggtgc tgtcttccca gcatgccttt tcatctttgc gataattgtt 29160 ttctaaacat tttcatttca atttctcaat ttcttcttgc ttaataattc catctccaac 29220 atttttctct actcacattt tatttattta tttattgaga cagaatctca ctctgtcgcc 29280 caggctggag tgcactgttg cgatctcggc tcactgcaac ctctgccact tgagttcaag 29340 cgattctcct gccttagcct cccgagcagc tgggattaca ggcatgtgac accacatctg 29400 gctaattttt gtatttttag cagagacagg gttttaccat gttggtcagg ctggactcga 29460 actcctaacc tcaagtggtc tgcctgcctc agcctcccaa agtgctggga ttacaggtgt 29520 gagccaccgc gcccggcctc tcctcacatt tagtatatgc agtcaagagg atccaagttg 29580 tttttttttt cctttttttt tttttttgag acagagtctg gctttgtcac ccaggctgga 29640 gtgcagtggc gcaatctcgg ctcactgcaa gctccacctc ctgggttctc accattctcc 29700 tgcctcagcc tcccgagtag ctgggactac aggcgcccgc caccatgccc ggctattttt 29760 tttgtatttt tagtagagac ggggtttcac tgtgttagcc aggatggtct caatctcctg 29820 acctcgtgat ccacctgcct cggcctccca aagtgctggg attacaggcg tgaacccacc 29880 acgcccggcc caggttgttt ttttcaacac ttctaagaaa tattgtcagc tcaatatcaa 29940 gtttcatcac ttcctagttc tagtttcccc aaaacagtag caccggagta caatgcacca 30000 agttctttgc cactttctgc aacggttcat cttttctcta ttatgcagta atattgtcct 30060 caattctgag acctcattag tattgccttt attgtccata tatccaccaa aattttgtac 30120 atgatttttt atgtgcccta gtaagatgga agctttctct attcctcttt ttattttatt 30180 tttttagaga aggggtcttg ccacactgcc taggctggtc ttgaactgct aggctcaagc 30240 gatcctcctg cctcaccctc ccaaagttct ggcattatag gcatgaacca ccataccccg 30300 cctgcctgtc ctcttttgtg agctcttacc agcgtccaaa gacaaaatta caacaaattt 30360 aggtactggc agatttagtg tctgatgagg gcctgttttc tgattcacag acagctgtct 30420 tttttgttta ttttttgagg cagagtctca ctctgtcacc caggctgcag tgcagtggtg 30480 tgatcacggc tcactgcagc ctcggcttcc ctgggcttgg gtgatcctcc cacctcagcc 30540 tcttaagtag ctggaactac aggcgtgtgc caccatgccc agctcatttt tgtatttttt 30600 gtagaaatgg ggctttatca tgttgcccag gctggtcttg aactcctggg ctcaagtgat 30660 ctgcccacct cagcctccca gagtgctggg attacaggca tgaaccacca ggcctagcct 30720 catagataac tatcttaatg tatcctccaa ggcagagagc aaaaaagcaa gctgctgggc 30780 ggactcacaa taggtaacca atttcattat tgaggctcca ctctcatggt ctaatccaat 30840 ctgtattata ttccaaagaa gacgttccct aatctgtcac gttagggaaa tggattagaa 30900 tgagtggatt ttatgaagac atttattccc taacaggtgg tatgcttttt gttgttgact 30960 ttttagagtt ctctaagcag tctgcatatt aatttcttgt cagatacatg atttggaaat 31020 actttctctc attctatggg ttgtctattt tgatgccgaa agtttaaaaa ttccatatat 31080 ttccatttat tctcttatgg gtcatgcctt tggtgtcata tctaggaaat cattggaaaa 31140 tccaggttca taaagctttt gccttatact tttttttttt ttttttgaga cggagtctca 31200 ctctgtcacc aggctggagt gcagtggcgc gatctcagct cactgcaacc tctgcctcct 31260 gggttcaagt gattgtcctg cctcagcctc ctgagtagtg ggattacagg catgagctac 31320 catgcccggc taattttgta tttttaatgg agacggggtt tctccatgtt ggtcaggctg 31380 gtttcaaact cttgaactca ggtgatctgc cagccttggc ctcccaaagt gctgggatta 31440 caggcgtgag ccaccgtgcc tggacaggga agggtacatt ttcattctgt tgcatatgga 31500 tgtgcatttt tccccagcat cattctatgg aaatactgtc ctatcctcca ttgtatcgtc 31560 atagtacgct tgtcaaaaat tgttggactc actatgcaaa cgtgtatttc tgtgctgtct 31620 attttgtcac aatggtctat ttctttgtca gtatgctgat attaaatttt tttattagta 31680 taaatttgct ctaagttttg aaatcaggaa gtgtcaatct accaactttg ctcttgtttt 31740 tcaattttat tttttattta tttatttttt tgagacggag tctcgctctg tcgcccaggt 31800 tggaatgcag tggcgcgatc ttggctcact gcaagctcca cctcccaggt tcaagccatt 31860 ctcctggctc agcctcccgc ccgagtagct gggactacag gtgcccgcca ctgtgcccgg 31920 ctaatttttt gtatttttag tagagacggg gtttcaccgt gttagccagg atggtctgga 31980 tctcctgaac tcgtgatccg cccgcctcgg cctcccaaag tgctgggatt acaggcgtga 32040 gccactgcac ccgacgtttt tcaattcttg ttttgtatat tcagagtccc ttaagatgcc 32100 atatgtaaaa caatggaaaa atgggtccta aaaactaatc aagtggtcaa agctatccct 32160 aaaaggctag cagggagcaa aaagtgctat ttctcaatga gaaaataaaa atcttagaga 32220 gatgttttga aaaatgccat gtcacttttg aaagtgggcc acatggtaag aacaaactaa 32280 gcattcacac actaaagcag aaagaagctg aaattcttgg aagtcttaga gctgcctcta 32340 caatgggaaa aatgacccct ctgcttcatg ataaactgag taaaaagact gagaaagcat 32400 taagtatgtg gctagaggac acatcgctga acaacatctc ttttgataat aaaataaagt 32460 gggaaaaaac agcctctata aataccactg tgagaaggct gaggagagca aggaaaagga 32520 gtttcaggcc agtattgtct ggctgggcta gctacataaa gcgccagagc ctcaaaaatt 32580 taaagaccac aggagaattg acactggctt atgccaaggc aatattagca ttcccagcag 32640 agctcacaaa actcataaaa aggaagtcta ccttccagag caagtcctcc attccaatga 32700 attgggcaag ccctagaaaa agaaagcggt ccagtggtac ctacatccat gactgccaag 32760 gaggccctgg ggctcagggc ctggaaagat cacctactct ggtgcagtgt ggcaatgtgg 32820 caggtcacaa gaacaagcca ggccttggct actgagcaaa caatccctag gtcctttaga 32880 accaaagcaa aacttgcctg cctcctttct ggcaaaaata taagaaggct tgggtgatga 32940 tcatcttgtc cttggaatgg ttctaccaag gcttcattcc tgatgtgaag aaatatcttg 33000 aagagaaggg gctgccactc aaggtccttc tcataattga caatgttcct ggccatctcc 33060 aatctctcta ctttgccaca aagaatgtgg aagtgatgtc cctgctgcct aacactacat 33120 cacagtgaaa gctactcaat caaggcataa tcaagtagat cctgaccttc gggaggattc 33180 atgccatcct gatgctaact ctgactgtac catagtggat ttatgaaagc acttcacaat 33240 tgcacatgca actgtcctta ttgcagaggc tatagatgtc ccagagctca agaaactcaa 33300 agcatgctgg aagccattat ggagtgaggg agtcaataat tttaggggct tccccactat 33360 tgatgcagta gttaggaata tcttaaatac tgcaagggga gttggtaaga aaggctatct 33420 ctgacaggat tgaagacgat gttgagtaac acacagaagg gcataaattc ttacaacaag 33480 gaactcaaag atctgctcaa atgctctata gattgatgat gataatgatg acttaaaaaa 33540 ggtagtgcca cagatttgga cacttgaaaa atttgcagta gtttttttta ttttttttga 33600 gacggagtct cgctctgtct cccaggttgg agtgcagtgg cgccatctcg gctcactgca 33660 agctccgcct cctgggttca caccattctc ctgcctcagc ctcctgagta gctgggacta 33720 caggcgcctg ccaccatgcc cagctatttt tttgtatttt tagtagagac agggtttcac 33780 tgtgttagcc aggatggtct caatctcctg acctcgtgat ccacctgtct cagcctccca 33840 aagtgctggg aatataggtg tgagccacct cgcctgacct gcagcagttt ttcaataggc 33900 aaaactgtta agaaagttca tcatcctcaa gtaagatcct tcgatggaac aaagcctcca 33960 tgtcacccat ggaataacat gccaacaaac agtgcaagat ttttttgatg actcaaaaaa 34020 aaagaaaaaa agaaaaacta gcttcctaca cttctcacta agcacctgca aatataaaca 34080 cagagccttc catggttaag gatctgcagc cctgaagctg aacagatctt gacattagta 34140 ttatttggcc tcctccaaca agtcaacatc tgcatcagaa cctagttctt tgaacactga 34200 tgatcatcct gatattctgt caaggttcaa gttagcctga tgtctcctgc ttgtctataa 34260 tgctacaaca catgacaatg ttaggcacca tccagcaatc atcatcatca tcattatact 34320 tgggttatca agagagaagc aggattttga taagtgttga catgctcatt caggtcacaa 34380 aacaaaagca atctg 34395 <210> 2 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> fwd primer <400> 2 aagggacggg ataggacgtt c 21 <210> 3 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> primer rev <400> 3 aactaaccgt aacgaatccc cg 22 <210> 4 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> primer fwd <400> 4 gattaataga ttcgtttgtt tcgtc 25 <210> 5 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> primer rev <400> 5 aaaccgacga cgactccg 18 <210> 6 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> primer fwd <400> 6 attggtaatt ggtgtcgaat c 21 <210> 7 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> primer rev <400> 7 gcctccataa aatcgaacg 19 <210> 8 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> primer fwd <400> 8 taggggatgc ggagcgtc 18 <210> 9 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> primer rev <400> 9 tacccaaaac tacacacgat ttcg 24 <210> 10 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> primer fwd <400> 10 cggaggacgt agtatttatt cgc 23 <210> 11 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> primer rev <400> 11 ctacgtcccc gatcgaaacg 20 <210> 12 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> primer fwd <400> 12 aggtttattc gagagtgcga c 21 <210> 13 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> primer rev <400> 13 aactacgaaa acacaacgcg 20

Claims (34)

  1. 환자로부터 수득한 생물학적 샘플에서 19번 염색체의 유전자 ZNF823과 유전자 ZNF833 사이에 존재하는 게놈 영역의 메틸화 상태를 확인하는 것을 포함하는, 인간 환자에서 두경부 암의 발병 위험을 평가하는 방법.
  2. 환자로부터 수득한 생물학적 샘플에서 19번 염색체의 유전자 ZNF823과 유전자 ZNF833 사이에 존재하는 게놈 영역의 메틸화 상태를 확인하는 것을 포함하는, 인간 환자에서 두경부 암의 존재 가능성을 평가하는 방법.
  3. 환자로부터 수득한 생물학적 샘플에서 19번 염색체의 유전자 ZNF823과 유전자 ZNF833 사이에 존재하는 게놈 영역의 메틸화 상태를 확인하는 것을 포함하는, 인간 환자에서 두경부 암의 존재를 진단하는 방법.
  4. 제1항 내지 제3항 중 어느 한 항에 있어서, 상기 생물학적 샘플에서 게놈 영역이 메틸화된 경우, 상기 환자는 두경부 암의 발병 위험이 높거나 또는 상기 환자는 두경부 암이 존재할 가능성이 높거나 또는 상기 환자는 두경부 암을 앓고 있는 것인, 방법.
  5. 제1항 내지 제4항 중 어느 한 항에 있어서, 상기 게놈 영역의 메틸화 수준이 최대 메틸화 수준에 대해 1%, 2%, 3%, 4%, 5%, 10%, 15%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95% 또는 100%인, 방법.
  6. 제1항 내지 제5항 중 어느 한 항에 있어서, 상기 게놈 영역이 인간 19번 염색체의 뉴클레오티드 11,686,870에서 뉴클레오티드 11,721,264까지인, 방법.
  7. 제6항에 있어서, 상기 게놈 영역이 인간 19번 염색체의 뉴클레오티드 11,694,447에서 뉴클레오티드 11,695,085까지인, 방법.
  8. 제7항에 있어서, 인간 19번 염색체에서 뉴클레오티드 11,694,447과 뉴클레오티드 11,695,085 사이에 위치한 CpG 다이뉴클레오티드 하나 이상이 메틸화된, 방법.
  9. 제7항 또는 제8항에 있어서, 상기 인간 19번 염색체에서 뉴클레오티드 11,694,447과 뉴클레오티드 11,695,085 사이에 위치한 CpG 다이뉴클레오티드들 중 적어도 0.5%, 1%, 2%, 3%, 4%, 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95% 또는 100%가 메틸화된, 방법.
  10. 제1항 내지 제9항 중 어느 한 항에 있어서, 상기 메틸화 상태는 대조군 샘플의 메틸화 상태와 비교되는, 방법.
  11. 제1항 내지 제10항 중 어느 한 항에 있어서, 상기 두경부 암이 입 암, 코 암, 비인두 암, 인후 암, 하인두 암, 후두 암, 기도 암, 식도 암, 편도 암, 부비강 암 또는 침샘 암인, 방법.
  12. 제1항 내지 제11항 중 어느 한 항에 있어서, 상기 생물학적 샘플이 머리 및/또는 목의 세포를 함유하는, 방법.
  13. 제1항 내지 제12항 중 어느 한 항에 있어서, 상기 생물학적 샘플이 조직 생검인, 방법.
  14. 제13항에 있어서, 상기 생물학적 샘플에서의 조직이 인후, 목, 입, 비강, 식도, 편도 및/또는 침샘의 세포를 포함하는, 방법.
  15. 제1항 내지 제12항 중 어느 한 항에 있어서, 상기 생물학적 샘플이 타액, 혈액, 객담, 기관지 흡인물, 소변, 대변, 담즙, 위장 분비물 또는 림프액인, 방법.
  16. 제1항 내지 제15항 중 어느 한 항에 있어서, 상기 방법이 환자로부터 수득한 다른 생물학적 샘플에서 또는 환자로부터 수득한 동일한 생물학적 샘플에서 ZNF773, ZNF671, ZIC1, HOXA9 및 PAX6으로 이루어진 군으로부터 선택되는 유전자와 연관된 게놈 DNA의 하나 이상의 영역에서 메틸화 상태를 확인하는 것을 추가로 포함하는, 방법.
  17. 제16항에 있어서, 상기 유전자와 연관된 게놈 DNA의 영역이 유전자의 프로모터 영역인, 방법.
  18. 제16항에 있어서, ZNF773과 연관된 게놈 DNA의 영역이 인간 19번 염색체의 뉴클레오티드 57,499,757과 뉴클레오티드 57,500,375 사이에 위치한, 방법.
  19. 제16항에 있어서, ZNF671과 연관된 게놈 DNA의 영역이 인간 19번 염색체의 뉴클레오티드 57,727,218과 뉴클레오티드 57,727,600 사이에 위치한, 방법.
  20. 제16항에 있어서, ZIC1과 연관된 게놈 DNA의 영역이 인간 3번 염색체의 뉴클레오티드 147,412,556과 뉴클레오티드 147,412,790 사이에 위치한, 방법.
  21. 제16항에 있어서, HOXA9와 연관된 게놈 DNA의 영역이 인간 7번 염색체의 뉴클레오티드 27,164,297과 뉴클레오티드 27,166,843 사이에 위치한, 방법.
  22. 제16항에 있어서, PAX6과 연관된 게놈 DNA의 영역이 인간 11번 염색체의 뉴클레오티드 31,798,513과 뉴클레오티드 31,799,868 사이에 위치한, 방법.
  23. 제1항 내지 제22항 중 어느 한 항에 있어서, 상기 환자는 파필로마바이러스로 감염된, 방법.
  24. 제1항 내지 제22항 중 어느 한 항에 있어서, 상기 환자는 파필로마바이러스로 감염되지 않은, 방법.
  25. 제1항 내지 제24항 중 어느 한 항에 있어서, 상기 메틸화 상태는 나노포어 서열분석에 의해 확인하는, 방법.
  26. 제1항 내지 제24항 중 어느 한 항에 있어서, 상기 메틸화 상태는 메틸화-특이적인 PCR (MSP)에 의해 확인하며, 바람직하게는 상기 MSP가 정량적인 MSP (QMSP)인, 방법.
  27. 제26항에 있어서, 상기 QMSP가 형광 프로브의 사용에 기반하는, 방법.
  28. 제1항 내지 제24항 중 어느 한 항에 있어서, 상기 메틸화 상태는 메틸화-민감성 제한 효소에 의해 확인하는, 방법.
  29. 제28항에 있어서, 상기 메틸화-민감성 효소가 메틸화된 DNA를 절단하는, 방법.
  30. 제28항에 있어서, 상기 메틸화-민감성 효소가 비-메틸화된 DNA를 절단하는, 방법.
  31. 제1항 내지 제30항 중 어느 한 항에 있어서, 상기 환자가 두경부 암 발병 위험이 높거나 또는 상기 환자가 두경부 암이 존재할 가능성이 높거나 또는 상기 환자가 두경부 암을 앓고 있는 것으로 확인된 후, 상기 방법은 상기 암 발병을 예방하거나 또는 암을 치료하기 위해 의약제를 환자에 투여하는 것을 추가로 포함하는, 방법.
  32. 환자로부터 수득한 생물학적 샘플에서 19번 염색체의 유전자 ZNF823과 유전자 ZNF833 사이의 게놈 영역이 메틸화된 인간 환자를 선정하는 것을 포함하는, 두경부 암 발병에 대해 더 빈번한 선별 검사를 수행할 환자를 선정하는 방법.
  33. 제32항에 있어서, 상기 더 빈번한 선별 검사가 조직병리학에 기반한 선별 검사인, 방법.
  34. 제32항 또는 제33항에 있어서, 상기 더 빈번한 선별 검사가 12개월 주기, 바람직하게는 6개월 주기, 더 바람직하게는 3개월 주기인, 방법.
KR1020237028775A 2021-02-26 2021-02-26 두경부 암의 진단 및 위험 평가 KR20230154009A (ko)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/EP2021/054926 WO2022179708A1 (en) 2021-02-26 2021-02-26 Diagnosis and risk determination for head and neck cancer

Publications (1)

Publication Number Publication Date
KR20230154009A true KR20230154009A (ko) 2023-11-07

Family

ID=74856832

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020237028775A KR20230154009A (ko) 2021-02-26 2021-02-26 두경부 암의 진단 및 위험 평가

Country Status (8)

Country Link
US (1) US20240132968A1 (ko)
EP (1) EP4298249A1 (ko)
JP (1) JP2024511561A (ko)
KR (1) KR20230154009A (ko)
CN (1) CN117015619A (ko)
AU (1) AU2021429371A1 (ko)
CA (1) CA3208505A1 (ko)
WO (1) WO2022179708A1 (ko)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116574810B (zh) * 2023-07-05 2023-10-13 广州凯普医药科技有限公司 一种通过检测znf671和zmynd10基因甲基化诊断鼻咽癌的试剂盒
CN117625791B (zh) * 2024-01-23 2024-04-16 杭州华得森生物技术有限公司 用于结直肠癌诊断和预后判断的生物标志物及其应用

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2308998A1 (de) 2009-09-18 2011-04-13 Universitätsklinikum Jena Körperschaft des öffentlichen Rechts und Teilkörperschaft der Friedrich-Schiller-Universität Jena Verfahren zur frühen Diagnose von Karzinomen des Anogenitaltraktes
US10961590B2 (en) * 2015-09-17 2021-03-30 The United States Of America, As Represented By The Secretary, Department Of Health And Human Services Cancer detection methods
AU2019200359A1 (en) * 2019-01-18 2020-09-10 Clinical Genomics Pty Ltd Screening method
US20200299779A1 (en) * 2019-02-13 2020-09-24 Epigenomics Ag Methods for detecting head and neck cancer

Also Published As

Publication number Publication date
JP2024511561A (ja) 2024-03-14
CA3208505A1 (en) 2022-09-01
US20240132968A1 (en) 2024-04-25
AU2021429371A1 (en) 2023-09-14
EP4298249A1 (en) 2024-01-03
CN117015619A (zh) 2023-11-07
WO2022179708A1 (en) 2022-09-01

Similar Documents

Publication Publication Date Title
KR102657306B1 (ko) 전립선암의 진단 및 치료에서 필라민을 포함하는 마커의 용도
CN111183234A (zh) 在表达pnpla3 i148m变异的患者的肝病治疗中对hsd17b13的抑制
CN108138242B (zh) 确定基因组dna中突变的方法、该方法的用途以及实施该方法的试剂盒
ES2524643T3 (es) Genes control para la normalización de datos de análisis de expresión génica
KR20140027205A (ko) 전사 신호 전달 인자 및 활성 인자 3(stat3) 발현 조절
TW201632629A (zh) 用於癌症診斷與預後的方法
CN101687050A (zh) 用于鉴别原发起源不明的癌的起源的方法和材料
KR20150023904A (ko) 전립선암의 진단 및 치료에서의 마커의 용도
KR20230154009A (ko) 두경부 암의 진단 및 위험 평가
KR101750146B1 (ko) 방광암 예후 진단 마커로서 rsph9의 용도
KR102102051B1 (ko) 아토피 피부염 진단을 위한 마커 조성물 및 이를 이용한 아토피 피부염 예측또는 진단 방법
KR102003835B1 (ko) 섬유증 감수성 il22ra2 유전자 및 이의 용도
US6723508B2 (en) Method for determining the presence of at least one allele of a GSTT1 deletion mutant
KR100901147B1 (ko) 자궁암 환자의 방사선 치료 후 재발 예측용 마커, 그를포함하는 키트 및 마이크로어레이, 및 상기 마커를 이용한자궁암 환자 재발 여부 예측 방법
CN114277123B (zh) 与精神分裂症相关的含有snp位点的多核苷酸和用途
CN112877428B (zh) 癌症检测套组
CN115807080A (zh) 甲状腺癌诊断方法
CN108770360B (zh) 对癌性疾病进行分期、分型和治疗的手段和方法
KR101114033B1 (ko) 단일염기다형을 포함하는 폴리뉴클레오티드, 이를 포함하는 마이크로어레이 및 진단키트, 및 이를 이용한 분석방법
CN113825839A (zh) 用固醇调节元件结合蛋白切割激活蛋白(scap)抑制剂治疗脂质水平升高
KR101090742B1 (ko) Her-2 유전자를 이용한 폐암 감수성 진단용 마커 및 이를 이용한 폐암 감수성 진단 방법
KR102464776B1 (ko) 여성형 탈모증 관련 유전자 다형성 마커 및 이의 용도
KR102559726B1 (ko) 유전자 다형성 마커 기반 여성형 탈모증 위험도 예측 모델
KR102314972B1 (ko) Pex26 유전자의 메틸화 수준을 이용한 비만의 예측 또는 진단을 위한 정보제공방법 및 이를 위한 조성물
JP2004000115A (ja) 糖尿病の発症危険性判定方法

Legal Events

Date Code Title Description
A201 Request for examination