KR20110081807A - 갑상선암의 위험도 평가를 위해 유용한 유전적 변이 - Google Patents
갑상선암의 위험도 평가를 위해 유용한 유전적 변이 Download PDFInfo
- Publication number
- KR20110081807A KR20110081807A KR1020117005803A KR20117005803A KR20110081807A KR 20110081807 A KR20110081807 A KR 20110081807A KR 1020117005803 A KR1020117005803 A KR 1020117005803A KR 20117005803 A KR20117005803 A KR 20117005803A KR 20110081807 A KR20110081807 A KR 20110081807A
- Authority
- KR
- South Korea
- Prior art keywords
- markers
- individual
- thyroid cancer
- risk
- alleles
- Prior art date
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
- C12Q1/6883—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
- C12Q1/6886—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/70—Vectors or expression systems specially adapted for E. coli
- C12N15/73—Expression systems using phage (lambda) regulatory sequences
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/112—Disease subtyping, staging or classification
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/118—Prognosis of disease development
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/136—Screening for pharmacological compounds
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/172—Haplotypes
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N2800/00—Detection or diagnosis of diseases
- G01N2800/04—Endocrine or metabolic disorders
- G01N2800/046—Thyroid disorders
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Abstract
본 발명은 갑상선암의 감수성 변이로 결정된 유전적 변이(genetic variant)를 개시한다. 그와 같은 변이를 이용하여 갑상선암에 대한 증가된 감수성의 결정을 포함한 질병 관리 방법, 치료에 대한 반응을 예측하는 방법 및 갑상선암의 예후를 예측하는 방법이 기재된다. 본 발명은 또한 본 발명의 방법에서 유용한 키트에 관한 것이다.
Description
본 발명은 갑상선암의 감수성 변이로 결정된 유전적 변이(genetic variant)를 개시한다. 그와 같은 변이를 이용하여 갑상선암에 대한 증가된 감수성의 결정을 포함한 질병 관리 방법, 치료에 대한 반응을 예측하는 방법 및 갑상선암의 예후를 예측하는 방법이 기재된다. 본 발명은 또한 본 발명의 방법에서 유용한 키트에 관한 것이다.
갑상선암
갑상선 암종은 가장 흔한 고전적 내분비 암이고, 그 발생률이 과거 수십년 동안 미국 및 기타 선진국에서 급속하게 증가하고 있다. 갑상선암은 조직학적으로 4개의 그룹으로 분류된다: 유두암(papillary), 여포암(follicular), 수질암(medullary), 및 미분화(undifferentiated) 또는 퇴행성(anaplastic) 갑상선암 (DeLellis, R. A., J Surg Oncol, 94, 662 (2006)). 유두암 및 여포암(Hurthle-세포 변이체 포함)은 통합적으로 분화 갑상선암으로 알려져 있고, 이들은 발병 케이스의 약 95%를 차지한다 (DeLellis, R. A., J Surg Oncol, 94, 662 (2006)). 2008년에, 미국에서 37,000 건 이상의 신규 케이스가 진단되고, 그들 중 약 75%가 여성일 것(남성 대 여성의 비는 1:3.2임)으로 예상된다 (Jemal, A., et al., Cancer statistics, 2008. CA Cancer J Clin, 58: 71-96, (2008)). 조기 단계에 진단되는 경우, 갑상선암은 모든 환자들 중 97%의 5-년 생존율을 갖는 관리가능한 질병이나, 미국에서 2008년에 약 1,600명이 이 질환으로 사망할 것으로 예상된다(Jemal, A., et al., Cancer statistics, 2008. CA Cancer J Clin, 58: 71-96, (2008)). 보다 진행된 질환으로 진단된 개인들 중에서 생존율은 더 낮고(~40%); 즉, 대형, 침윤성 종양 및/또는 원격 전이를 갖는 개인들은 XX40%의 5-년 생존율을 갖는다(Sherman, S. I., et al., 3rd, Cancer, 83, 1012 (1998), Kondo, T., Ezzat, S., and Asa, S. L., Nat Rev Cancer, 6, 292 (2006)). 방사성요오드-내성 전이성 질환의 경우, 효과적인 치료법이 없고, 이 환자들의 10-년 생존율은 15% 미만이다(Durante, C., et al., J Clin Endocrinol Metab, 91, 2892 (2006)). 따라서, 새로운 진단 도구 및 보다 우수한 치료 옵션을 개발하기 위해 갑상선암 진행의 분자적 원인에 대한 보다 진보된 이해가 요구된다.
비교적 드물지만(미국에서 모든 악성종양의 1%), 갑상선암의 발생률은 미국에서 1984년과 2004년 사이에 두배 이상 증가되었고; 이 증가는 거의 대부분 갑상선 유두암 진단에 기인한다(SEER web report; Ries L, Melbert D, Krapcho M et al (2007) SEER cancer statistics review, 1975_2004. National Cancer Institute, Bethesda, MD, http://seer.cancer.gov/csr/1975_2004/, based on November 2006 SEER data submission). 1995년과 2004년 사이에, 갑상선암은 복막(peritoneum), 간막(omentum), 및 장간막(mesentery) 암 및 "기타(other)" 소화기암(digestive cancer) 다음으로, 제3위의 가장 빠르게 증가하는 암 진단이었다[SEER web report]. 비슷하게, 갑상선암 발생률의 급격한 증가가 또한 캐나다, 호주, 이스라엘, 및 여러 유럽 국가에서 관찰되었다 (Liu, S., et al., Br J Cancer, 85, 1335 (2001), Burgess, J. R., Thyroid, 12, 141 (2002), Lubina, A., et al., Thyroid, 16, 1033 (2006), Colonna, M., et al., Eur J Cancer, 38, 1762 (2002), Leenhardt, L., et al., Thyroid, 14, 1056 (2004), Reynolds, R. M., et al., Clin Endocrinol (Oxf), 62, 156 (2005), Smailyte, G., et al., BMC Cancer, 6, 284 (2006)). 이 질환을 유발하는 인자들은 규명되지 않고 있다. 공지된 위험 인자의 증가의 명확한 부재 하에, 과학자들은 진단 방법의 변화가 원인이 될 수 있는 것으로 널리 추측했다(Davies, L. and Welch, H. G., Jama, 295, 2164 (2006), Verkooijen, H. M., et al., Cancer Causes Control, 14, 13 (2003)).
갑상선암의 주요한 공지된 위험 인자는 방사선 노출이다. 노출의 잠정적 출처는 진단 및 치료 의학에서 이용되는 방사선 조사, 및 핵 폭발로부터의 방사성 분진이다. 그러나, 지난 20년 동안 미국에서 어느 출처도 증가되지 않았다. 한때, 미국에서 흔했던, 양성 아동 상태(benign childhood condition)를 위한 두경부에 대한 방사선 요법이 1950년대 초반 이후 감소되었다 (Zheng, T., et al., Int J Cancer, 67, 504 (1996)). 마찬가지로, 미국에서 핵무기의 대기 테스트(atmospheric testing)가 제한적 핵 실험 금지 협정(Limited Test Ban Treaty)의 체결로 1963년에 중단되었다. 완전히 명확한 것은 아니나, 그와 같은 핵 실험의 갑상선암에 대한 영향은 제한적인 것으로 사료된다 (Gilbert, E. S., et al., J Natl Cancer Inst, 90, 1654 (1998), Hundahl, S. A., CA Cancer J Clin, 48, 285 (1998), Robbins, J. and Schneider, A. B., Rev Endocr Metab Disord, 1, 197 (2000)).
갑상선암 발생률의 증가는 갑상선암의 실제 발생률의 증가보다는, 무증상 암(sub-clinical cancer)의 검출 증가에서 기인할 수 있다 (Davies, L. and Welch, H. G., Jama, 295, 2164 (2006)). 미국에서 갑상선암 발생률은 수십년 동안 증가하고 있으나, 사망률은 비교적 일정하게 유지되었다 (Davies, L. and Welch, H. G., Jama, 295, 2164 (2006)). 1980년대 초음파촬영술 및 미세침 흡인 생검법(fine-needle aspiration biopsy)의 도입이 소결절의 검출을 개선했고 결절의 세포학적 평가를 보다 일상적인 것이 되게 하였다 (Rojeski, M. T. and Gharib, H., N Engl J Med, 313, 428 (1985), Ross, D. S., J Clin Endocrinol Metab, 91, 4253 (2006)). 이와 같은 증가된 진단 정밀성(diganostic scrutiny)은 잠재적으로 치명적인 갑상선암의 조기 검출을 가능하게 할 수 있다. 그러나, 여러 연구는 갑상선암을 갑상선암으로 진단되지 않은 개인에서 흔한 부검 발견사항(최대 35%)으로 보고한다 (Bondeson, L. and Ljungberg, O., Cancer, 47, 319 (1981), Harach, H. R., et al., Cancer, 56, 531 (1985), Solares, C. A., et al., Am J Otolaryngol, 26, 87 (2005) and Sobrinho-Simoes, M. A., Sambade, M. C., and Goncalves, V., Cancer, 43, 1702 (1979)). 이는 많은 사람들이 그들의 건강에 대한 위협이 거의 또는 전혀 아닌 갑상선암의 무증상 형태를 가지고 살고 있다는 것을 시사한다.
PTC 개시를 유발하는 것으로 사료되는 체세포 유전적 결함이 대부분의 케이스에서 확인되었다; 이들은 RET의 티로신 키나아제 도메인을 포함한 유전적 재배열(genetic rearrangement) 및 BRAF 및 RAS의 활성화 돌연변이를 포함한다(Kondo, T., Ezzat, S., and Asa, S. L., Nat Rev Cancer, 6, 292 (2006), Tallini, G., Endocr Pathol, 13, 271 (2002)., Fagin, J. A., Mol Endocrinol, 16, 903 (2002)). 일부 상관관계 연구가 특이적 유전적 변화와 공격적인 암 거동 간의 연관관계를 뒷받침하나 (Nikiforova, M. N., et al., J Clin Endocrinol Metab, 88, 5399 (2003), Trovisco, V., et al., J Pathol, 202, 247 (2004), Garcia-Rostan, G., et al., J Clin Oncol, 21, 3226 (2003), Nikiforov, Y. E., Endocr Pathol, 13, 3 (2002)), p53의 돌연변이 (Fagin, J. A., et al., J Clin Invest, 91, 179 (1993), La Perle, K. M., et al., Am J Pathol, 157, 671 (2000)), β-카테닌 신호전달 조절곤란 (Karim, R., et al., Pathology, 36, 120 (2004)), 사이클린-D1의 상향-조절(Khoo, M. et al., J Clin Endocrinol Metab, 87, 1810 (2002)), 및 전이-촉진, 혈관생성- 및/또는 세포 부착-관련 유전자의 과발현 (Klein, M., et al., J Clin Endocrinol Metab, 86, 656 (2001), Yu, X. M., et al., Clin Cancer Res, 11, 8063 (2005), Guarino, V., et al., J Clin Endocrinol Metab, 90, 5270 (2005), Brabant, G., et al., Cancer Res, 53, 4987 (1993), Scheumman, G. F., et al., J Clin Endocrinol Metab, 80, 2168 (1995), Maeta, H., Ohgi, S., and Terada, T., Virchows Arch, 438, 121 (2001) and Shiomi, T. and Okada, Y., Cancer Metastasis Rev, 22, 145 (2003))을 포함한, 공격적 PTC에서 거의 배타적으로 발견되는 다수의 사건이 있다. 원발성 PTC의 침윤성 영역은 증가된 Akt 활성 및 세포질 p27 국재화를 빈번하게 특징으로 한다는 것이 입증되었다 (Ringel, M. D., et al., Cancer Res, 61, 6105 (2001), Vasko, V., et al., J Med Genet, 41, 161 (2004)). 인 비트로에서 PTC 세포 침윤에서 PI3 키나아제, Akt, 및 p27의 기능적 역할도 입증되었다 (Guarino, V., et al., J Clin Endocrinol Metab, 90, 5270 (2005), Vitagliano, D., et al., Cancer Res, 64, 3823 (2004), Motti, M. L., et al., Am J Pathol, 166, 737 (2005)). 그러나, 증가된 Akt 활성과 침윤 간의 상관관계가 활성화 BRAF 돌연변이를 갖는 PTC에서 발견되지 않았다. 가장 중요하게는, 이와 같은 집중된 연구는 침윤성 PTC 세포에서 어떤 생물학적 기능 및 신호전달 경로가 변화되는지의 보다 포괄적인 문제를 해결하지 못한다.
갑상선 수질암(Medullary Thyroid Cancer)
모든 갑상선암의 케이스 중에서, 2% 내지 3%가 수질성 종류이다(갑상선 수질암, MTC)(Hundahl, S. A., et al., Cancer, 83, 2638 (1998)). MTC의 평균 생존율은 보다 흔한 갑상선암의 생존율보다 더 낮고, 예를 들면, 갑상선 유두암 및 갑상선 여포암의 5-년 생존율, 90% 내지 94% 대비 MTC는 83%의 5-년 생존율을 갖는다(Hundahl, S. A., et al., Cancer, 83, 2638 (1998), Bhattacharyya, N., Otolaryngol Head Neck Surg, 128, 115 (2003)). 생존율은 진단시 병기(stage)와 상관관계를 가지며, MTC의 감소된 생존율은 부분적으로 말기 진단의 높은 비율에 의해 설명될 수 있다 (Hundahl, S. A., et al., Cancer, 83, 2638 (1998), Bhattacharyya, N., Otolaryngol Head Neck Surg, 128, 115 (2003), Modigliani, E., et al., J Intern Med, 238, 363 (1995)). 1,252명의 갑상선 수질암 환자를 대상으로 한 SEER(Surveillance, Epidemiology, and End Results) 집단-기반 연구는 생존율이 국소 질환의 정도에 따라 변화된다는 것을 발견했다. 예를 들면, 10-년 생존율은 갑상선에 한정된 질병의 경우 95.6% 내지 원격 전이를 갖는 질병의 경우, 40% 범위인 것으로 발견했다 (Roman, S., Lin, R., and Sosa, J. A., Cancer, 107, 2134 (2006)).
MTC는 갑상선의 부여포(parafollicular) 칼시토닌-분비 세포로부터 유래된다. MTC는 산발성 형태 및 가족성 형태에서 발생하며 C-세포 과다형성(C-cell hyperplasia, CCH)은 중년 성인에서 비교적 흔한 이상증이나, CCH에 의해 선행될 수 있다. 스웨덴에서 집단-기반 연구에서, MTC를 갖는 환자의 26%가 가족성 형태를 가졌다 (Bergholm, U., Bergstrom, R., and Ekbom, A., Cancer, 79, 132 (1997)). 프랑스 국가 등록부 및 미국 임상 동향(clinical series)은 모두 가족성 케이스의 보다 높은 비율을 보고했다 (각각, 43% 및 44%) (Modigliani, E., et al., J Intern Med, 238, 363 (1995), Kebebew, E., et al., Cancer, 88, 1139 (2000)). 가족성 케이스는 종종 RET 원형-종양유전자(proto-oncogene)의 유전된 돌연변이에 의해 유발된 상염색체 우성 유전적 질환(autosomal dominant genetic disorder)의 그룹인 제2형 다발성 내분비 선종증(multiple endocrine neoplasia type 2)의 존재를 종종 나타낸다 (OMIM, online mendelian inheritance in men (http://www.ncbi.nlm.nih.gov/sites/entrez?db=omim)).
퇴행성 갑상선암(Anaplastic thyroid cancer)
퇴행성 종양은 모든 갑상선암 중 가장 흔하지 않고(약 0.5 내지 1.5%) 가장 치명적이다. 이 암은 매우 낮은 치료율을 가지며, 최상의 치료는 환자의 10% 만이 진단 후 3년 동안 생존할 수 있게 한다. 퇴행성 갑상선암을 갖는 환자의 대부분은 그들이 진단된 날로부터 1년 살지 못한다. 퇴행성 갑상선암은 보다 분화된 갑상선 암 내에서 또는 심지어 갑상선종(goiter) 내에서도 종종 발생한다. 유두암 처럼, 퇴행성 갑상선암은 방사선 노출 후 수년(20년 이상) 후에 발생할 수 있다. 경부 전이(목의 림프절로의 암의 전파)가 진단시 케이스의 대부분(90% 이상)에 존재한다. 이 경부 영역에서 림프절 전이의 존재는 보다 높은 재발률을 유발하고 높은 사망률을 예측한다(Endocrine web, (http://www.endocrineweb.com/caana.html)).
유전적 위험도(genetic risk)는 집단 내의 개체들 간에 게놈 중 미묘한 차이에 의해 부여된다. 개인들 간의 게놈 차이는 가장 빈번하게는 단일 염기 다형성(single nucleotide polymorphisms, SNP) 때문에 발생하나, 카피 수 변이(copy number variation, CNV)와 같은 다른 변이도 중요하다. SNP는 인간 게놈에서 평균 1000개의 염기쌍마다 존재한다. 따라서, 250,000개의 염기쌍(bp)을 포함하는 통상적인 인간 유전자는 250개의 상이한 SNP를 포함할 수 있다. 소수의 SNP만이 엑손에 위치하고, 해당 유전자에 의해 코딩된 단백질의 아미노산 서열을 변화시킨다. 대부분의 SNP는 유전자 기능에 거의 또는 전혀 효과를 갖지 않을 수 있고, 다른 SNP는 해당 유전자에 의해 코딩된 mRNA의 전사, 스플라이싱(splicing), 번역, 또는 안정성을 변화시킬 수 있다. 인간 게놈에서 추가적인 유전적 다형성이 DNA의 짧거나 또는 긴 스트레치(stretch)의 삽입, 결실, 전위(translocation), 또는 역전에 의해 유발된다. 따라서, 질병 위험도를 부여하는 유전적 다형성은 단백질의 아미노산 서열을 직접적으로 변화시킬 수 있거나, 해당 유전자로부터 생성된 단백질의 양을 증가시킬 수 있거나, 또는 해당 유전자에 의해 생성된 단백질의 양을 감소시킬 수 있다.
흔한 질환의 위험도를 부여하는 유전적 다형성이 밝혀져서, 그와 같은 위험 인자에 대한 유전적 테스트가 임상 의학에서 중요해지고 있다. 최근의 예는 알쯔하이머병의 차등적 진단(differential diagnosis)을 위해 치매 환자에서 apoE4 다형성의 유전적 보인자를 확인하기 위한 아포리포프로테인(apolipoprotein) E 테스트 및 심부 정맥 혈전증에 대한 소인을 테스트하기 위한 Factor V Leiden 테스트이다. 보다 중요하게는, 암의 치료에서, 종양 세포의 유전적 변이의 진단이 개별 환자를 위한 가장 적합한 치료 방법(treatment regime)의 선택을 위해 이용된다. 유방암에서, 에스트로겐 수용체 발현 또는 Her2(heregulin type 2) 수용체 티로신 키나아제 발현의 유전적 변이가 항-에스트로겐 약물(타목시펜) 또는 항-Her2 항체(Herceptiin)가 치료 계획 내에 포함되어야 하는지 여부를 결정한다. 필라델피아 염색체의 만성 골수성 백혈병(chronic myeloid leukemia, CML) 진단에서, Bcr 및 Abl 수용체 티로신 키나아제를 코딩하는 유전자를 융합하는 유전적 전좌(genetic translocation)는 Bcr-Abl 키나아제의 특이적 저해제인 Gleevec(STI571)이 암의 치료를 위해 이용되어야 한다는 것을 나타낸다. 그와 같은 유전적 변화를 갖는 CML 환자의 경우, Bcr-Abl 키나아제의 저해는 종양 세포의 신속한 제거 및 백혈병의 완화를 가져온다.
갑상선암의 감수성을 부여하는 유전적 변이에 대한 충족되지 않은 요구가 존재한다. 그와 같은 변이는 갑상선암을 발병할 특정한 위험도의 개인들이 확인될 수 있는 유용성에 근거하여, 갑상선암의 위험 관리를 위해 유용할 것으로 예상된다. 본 발명은 그와 같은 감수성 변이를 제공한다.
발명의 요약
본 발명은 특정한 유전적 변이가 갑상선암의 위험도와 상관관계를 갖는다는 발견에 근거한, 갑상선암의 위험도 관리 방법에 관한 것이다. 따라서, 본 발명은 인간에서 갑상선암의 감수성과 상관관계를 갖는 것으로 확인된 특정한 마커의 평가를 통해, 갑상선암의 증가된 감수성 또는 증가된 위험도를 결정하는 방법, 및 갑상선암의 감소된 감수성을 결정하는 방법을 포함한다. 본 발명의 다른 양태는 갑상선암으로 진단된 개인들의 예후를 평가하는 방법, 갑상선암의 치료제 또는 치료법에 대해 반응할 확률을 평가하는 방법, 및 갑상선암으로 진단된 개인들의 치료 진행을 모니터링하는 방법에 관한 것이다.
일 양태에서, 본 발명은 개인으로부터 수득된 핵산 시료에서 rs965513, 및 이와 연관 불균형(linkage disequilibrium)인 마커들로부터 선택된 하나 이상의 다형성 마커의 하나 이상의 대립인자의 존재 또는 부재를 결정하는 단계를 포함하는, 개인에서 갑상선암에 대한 감수성을 결정하는 방법으로서, 상기 하나 이상의 대립인자의 존재는 상기 개인의 갑상선암에 대한 감수성을 나타내는 것인 방법에 관한 것이다. 본 발명은 또한 rs965513 (서열번호 1), 및 이와 연관 불균형인 마커들로부터 선택된 하나 이상의 다형성의 하나 이상의 대립인자의 존재 또는 부재를 결정하는 것에 의해 갑상선암에 대한 감수성을 결정하는 방법으로서, 상기 하나 이상의 대립인자의 존재의 결정은 갑상선암에 대한 감수성을 나타내는 것인 방법에 관한 것이다.
또 다른 양태에서, 본 발명은 개인으로부터 수득된 핵산 시료 또는 개인으로부터 유래된 유전형 데이터세트(genotype dataset)에서 하나 이상의 다형성 마커의 하나 이상의 대립인자의 존재 또는 부재를 결정하는 단계를 포함하는, 개인에서 갑상선암에 대한 감수성을 결정하는 방법으로서, 상기 하나 이상의 다형성 마커는 rs965513 및 이와 연관 불균형(linkage disequilibrium)인 마커들로부터 선택되고, 상기 하나 이상의 대립인자의 존재는 상기 개인의 갑상선암에 대한 감수성을 나타내는 것인 방법에 관한 것이다.
또 다른 양태에서, 본 발명은 개인으로부터 유래된 유전형 데이터세트에 하나 이상의 다형성 마커의 하나 이상의 위험 대립인자가 존재하는지 여부를 결정하는 단계를 포함하는, 개인에서 갑상선암에 대한 감수성을 결정하는 방법으로서, 상기 하나 이상의 다형성 마커는 마커 rs965513 (서열번호 1), 및 이와 연관 불균형인 마커들로부터 선택되고, 상기 하나 이상의 위험 대립인자의 존재의 결정은 상기 개인에서 갑상선암에 대한 증가된 감수성을 나타내는 것인 방법에 관한 것이다.
일 구체예에서, 유전형 데이터세트는 마커 정체(marker identity), 및 마커의 하나 이상의 대립인자에 대한 개체의 대립인자 상태에 대한 정보, 즉, 개체에서 상기 마커의 하나 이상의 대립인자의 정체에 대한 정보를 포함한다. 유전형 데이터세트는 두개 이상의 마커, 세개 이상의 마커, 다섯개 이상의 마커, 열개 이상의 마커, 백개 이상의 마커 등을 포함한, 하나 이상의 마커에 대한 대립인자 정보(대립인자 상태(allelic status)에 관한 정보)를 포함할 수 있다. 일부 구체예에서, 유전형 데이터세트는 수십만개의 마커, 또는 심지어 개체의 전체 게놈을 포괄하는 백만개 이상의 마커를 포함할 수 있는, 개체의 전체 게놈 평가로부터의 유전형 정보를 포함한다.
특정한 구체예에서, 상기 하나 이상의 다형성 마커는 FoxE1 유전자와 연관된다.
본 발명의 또 다른 양태는 개인에서 갑상선암에 대한 감수성을 결정하는 방법으로서, 상기 방법은:
rs965513 (서열번호 1), 및 이와 연관 불균형인 마커들로부터 선택된 하나 이상의 다형성 마커의 하나 이상의 대립인자를 식별하는, 개인에 대한 핵산 서열 데이터를 수득하는 단계로서, 상기 하나 이상의 다형성 마커의 상이한 대립인자는 인간에서 갑상선암에 대한 상이한 감수성과 연관되는 것인 단계, 및
상기 핵산 서열 데이터로부터 갑상선암에 대한 감수성을 결정하는 단계를 포함하는 것인 방법에 관한 것이다.
본 발명은 또한, 개인에서 갑상선암에 대한 감수성을 결정하는 방법에 관한 것이고, 상기 방법은 FoxE1 유전자와 연관된 하나 이상의 다형성 마커의 하나 이상의 대립인자를 식별하는, 개인에 대한 핵산 서열 데이터를 수득하는 단계로서, 상기 하나 이상의 다형성 마커의 상이한 대립인자는 인간에서 갑상선암에 대한 상이한 감수성과 연관되는 것인 단계, 및 상기 핵산 서열 데이터로부터 갑상선암에 대한 감수성을 결정하는 단계를 포함한다.
일반적으로, 다형성 유전적 마커는 핵산 수준에서 대안적인(alternate) 서열을 초래한다. 핵산 마커가 그 핵산에 의해 코딩된 폴리펩티드의 코돈을 변화시키면, 마커도 코딩된 폴리펩티드의 아미노산 수준에서 대안적인 서열(폴리펩티드 마커)을 초래할 것이다. 핵산 중 다형성 마커에서 특정 대립인자 또는 폴리펩티드 마커에서 특정 대립인자 정체의 결정은 특정한 대립인자가 해당 서열 중 특정한 위치에 존재하는지 여부를 포함한다. 마커의 특정한 대립인자를 식별하는 서열 데이터는 상기 특정한 대립인자를 검출하기 위한 충분한 서열을 포함한다. 본 명세서에 기재된 단일 뉴클레오티드 다형성(single nucleotide polymorphism, SNP) 또는 아미노산 다형성의 경우, 서열 데이터는 단일 위치에서의 서열, 즉, 서열 내 단일 위치에서의 뉴클레오티드 또는 아미노산의 정체를 포함할 수 있다. 상기 서열 데이터는 선택적으로 다형성 부위를 플랭킹(flank)하는 서열에 대한 정보를 포함할 수 있고, 상기 서열은 SNP의 경우 단일 뉴클레오티드일 수 있다.
특정한 구체예에서, 두 개 이상의 다형성 마커에 대해 핵산 서열을 결정하는 것이 유용할 수 있다. 다른 구체예에서, 3개 이상, 4개 이상 또는 5개 이상의 다형성 마커의 핵산 서열이 결정된다. 일배체형 정보가 두 개 이상의 다형성 마커의 분석으로부터 유래될 수 있다. 따라서, 특정한 구체예에서, 추가적인 단계가 수행되고, 이에 의해 일배체형 정보가 두 개 이상의 다형성 마커에 대한 서열 정보에 근거하여 유래된다.
본 발명은 또한 개인에서 갑상선암에 대한 감수성을 결정하는 방법으로서, 상기 방법은 rs965513 (서열번호 1), 및 이와 연관 불균형인 마커들로부터 선택된 두 개 이상의 다형성 마커의 두 개의 대립인자 모두를 식별하는, 개인에 대한 핵산 서열 데이터를 수득하는 단계, 상기 서열 데이터에 근거하여 하나 이상의 일배체형의 정체(identity)를 결정하는 단계, 및 상기 일배체형 데이터로부터 갑상선암에 대한 감수성을 결정하는 단계를 포함하는 것인 방법을 제공한다.
특정한 구체예에서, 감수성의 결정은 하나 이상의 다형성 마커와 갑상선암에 대한 감수성 간의 상관관계를 포함하는 데이터베이스와 핵산 서열 데이터를 비교하는 단계를 포함한다. 일부 구체예에서, 상기 데이터베이스는 상기 하나 이상의 마커에 대해 갑상선암에 대한 감수성의 하나 이상의 위험도 척도(risk measure)를 포함한다. 서열 데이터베이스는 예를 들면, 하나 또는 복수의 특정한 다형성에 대해 갑상선암의 감수성을 나타내는 데이터를 포함하는 참조표로 제공될 수 있다. 데이터베이스는 또한 두 개 이상의 다형성 마커를 포함하는 특정한 일배체형에 대한 감수성을 나타내는 데이터를 포함할 수 있다.
특정 구체예에서, 핵산 서열을 수득하는 것은 개인으로부터 생물학적 시료를 수득하는 단계 및 상기 시료 중 핵산에서 상기 하나 이상의 다형성 마커의 서열을 분석하는 단계를 포함할 수 있다. 서열을 분석하는 것은 상기 하나 이상의 다형성 마커의 하나 이상의 대립인자의 존재 또는 부재를 결정하는 것을 포함할 수 있다. 특정한 감수성 대립인자(예를 들면, 위험 대립인자)의 존재의 결정은 개인에서 갑상선암에 대한 감수성을 나타낸다. 특정한 감수성 대립인자의 부재의 결정은 하나 이상의 다형성에 의한 특정한 감수성이 개인에서 존재하지 않는다는 것을 나타낸다.
일부 구체예에서, 핵산 서열 데이터를 수득하는 것은 기존의 기록으로부터 핵산 서열 정보를 수득하는 것을 포함한다. 기존의 기록은 예를 들면, 개인에 대한, 하나 이상의 다형성 마커에 대한 유전형 데이터와 같은 서열 데이터를 포함하는 컴퓨터 파일 또는 데이터베이스일 수 있다.
본 발명의 진단 방법에 의해 결정된 감수성은 특정한 대상(entity)에게 보고될 수 있다. 일부 구체예에서, 상기 하나 이상의 대상은 개인, 개인의 후견인(guardian), 유전학 서비스 제공자, 의사, 의료 기관, 및 의료보험 회사로 구성된 군으로부터 선택된다.
본 발명의 특정한 구체예에서, 감수성의 결정은 핵산 서열 데이터를 상기 하나 이상의 다형성 마커와 갑상선암에 대한 감수성 간의 상관관계 데이터를 포함하는 데이터베이스에 비교하는 단계를 포함한다. 하나의 그와 같은 구체예에서, 데이터베이스는 상기 하나 이상의 다형성 마커에 대해 갑상선암에 대한 감수성의 하나 이상의 위험도 척도를 포함한다. 또 다른 구체예에서, 데이터베이스는 상기 하나 이상의 다형성 마커에 대해 상기 하나 이상의 상태의 하나 이상의 위험도 척도를 포함하는 참조표를 포함한다.
특정한 구체예에서, 핵산 서열 데이터를 수득하는 것은 개인으로부터 생물학 적 시료를 수득하는 단계 및 상기 시료 중 핵산에서 상기 하나 이상의 다형성 마커의 서열을 분석하는 단계를 포함한다. 상기 하나 이상의 다형성 마커의 서열을 분석하는 것은 상기 하나 이상의 다형성 마커의 하나 이상의 대립인자의 존재 또는 부재를 결정하는 것을 포함할 수 있다. 핵산 서열 데이터를 수득하는 것은 또한 기존의 기록으로부터 핵산 서열 정보를 수득하는 것을 포함할 수 있다.
본 발명의 특정한 구체예는 rs965513 (서열번호 1), 및 이와 연관 불균형인 마커들로부터 선택된 두 개 이상의 다형성 마커에 대한 핵산 서열 데이터를 수득하는 것에 관한 것이다.
본 발명의 특정한 구체예에서, 상기 하나 이상의 다형성 마커는 표 2에 표시된 마커들로부터 선택된다. 일 구체예에서, 상기 하나 이상의 다형성 마커는 서열번호 1 내지 229로 표시된 마커들로부터 선택된다. 일 구체예에서, 상기 하나 이상의 마커는 rs965513 (서열번호 1), rs907580 (서열번호 2) 및 rs7024345 (서열번호 3) 중 하나 이상과 연관 불균형이다. 또 다른 구체예에서, 상기 하나 이상의 마커는 rs965513 (서열번호 1), rs10759944 (서열번호 17), rs907580 (서열번호 2), rs10984103 (서열번호 37), rs925487 (서열번호 34), rs7024345 (서열번호 3) 및 rs1443434 (서열번호 30)로 구성된 군으로부터 선택된 하나 이상의 마커와 연관 불균형이다. 일 구체예에서, 상기 하나 이상의 마커는 rs965513 (서열번호 1), rs10759944 (서열번호 17), rs907580 (서열번호 2), rs10984103 (서열번호 37), rs925487 (서열번호 34), rs7024345 (서열번호 3) 및 rs1443434 (서열번호 30)로 구성된 군으로부터 선택된다.
본 발명의 특정한 구체예에서, 개체에서 하나 이상의 일배체형(haplotype)의 빈도를 평가하는 추가적인 단계가 수행된다. 그와 같은 구체예에서, 3개, 4개, 5개, 6개, 7개, 8개, 9개 또는 10개 이상의 마커들을 포함한, 2개 이상의 마커들이 일배체형에 포함될 수 있다. 일부 구체예에서, 상기 하나 이상의 일배체형은 rs965513 (서열번호 1), rs10759944 (서열번호 17), rs907580 (서열번호 2), rs10984103 (서열번호 37), rs925487 (서열번호 34), rs7024345 (서열번호 3) 및 rs1443434 (서열번호 30), 및 이들과 연관 불균형인 마커들로부터 선택된 마커들을 포함한다. 그와 같은 구체예에서, 상기 하나 이상의 일배체형은 전술된 마커들 중 하나가 존재하는 특정한 게놈 영역(예를 들면, LD 블럭)의 게놈 구조를 대표한다.
본 명세서에 기재된, 갑상선암의 위험도를 부여하는 마커들은 갑상선암에 대한 다른 유전적 마커와 조합될 수 있다. 그와 같은 마커들은 통상적으로 본 명세서에 기재된 마커들, 특히, 마커 rs965513 (서열번호 1), rs907580 (서열번호 2) 및 rs7024345 (서열번호 3)ID NO:6), rs9956546 (서열번호 7), rs11912922 (서열번호 8), rs6001954 (서열번호 9) 중 하나와 연관 불균형이 아니다. 본 명세서에 기재된 방법은 본 명세서에 기재된 유전적 위험 인자들을 갑상선암에 대한 추가적인 유전적 위험 인자들과 조합하는 것에 의해 실행될 수 있다.
따라서, 특정한 구체예에서, 마커 rs965513 (서열번호 1), rs907580 (서열번호 2) 및 rs7024345 (서열번호 3) 중 하나와 연관 불균형이 아닌 갑상선암에 대한 하나 이상의 위험 변이의 하나 이상의 위험 대리인자가 개인으로부터의 게놈 DNA를 포함하는 시료 또는 개인으로부터 유래된 유전형 데이터세트에 존재하는지 여부를 결정하는 단계를 포함하는 추가적인 단계가 포함된다. 바꾸어 말하면, 본 발명의 마커들과 조합된, 게놈의 다른 위치에 있는 유전적 마커는 복수의 유전적 변이에 기반하여 갑상선암의 전체 위험도를 결정하기 위해, 유용할 수 있다. 일 구체예에서, 상기 하나 이상의 갑상선암에 대한 위험 변이는 마커 rs965513 (서열번호 1)과 연관 불균형이 아니다. 연관 불균형이 아닌(LD가 아닌) 마커들의 선택은 본 명세서에서 더 설명되는 바와 같이, 연관 불균형에 대한 적합한 척도에 기반할 수 있다. 특정한 구체예에서, 연관 불균형이 아닌 마커들은 0.2 미만의 마커들을 상관시키는 LD 척도 r2의 값을 갖는다. 특정한 다른 구체예에서, LD가 아닌 마커들은 0.10 미만, 0.05 미만, 0.02 미만, 및 0.01 미만을 포함한, 0.15 미만의 마커들을 상관시키는 r2의 값을 갖는다. 전술된 값들 사이의 값들을 포함한, 마커들이 LD가 아니라는 것을 확립하기 위한 다른 적합한 수치값이 고려된다.
일 구체예에서, 전체 위험도를 확립하기 위해, 본 명세서에 기재된 하나 이상의 마커들의 평가가 염색체 14q13.3 상의 마커 rs944289, 또는 이와 연관 불균형인 마커들의 평가와 조합될 수 있다.
일부 구체예에서, 본 명세서에 기재된 복수의 마커들이 갑상선암의 전체 위험도를 결정하기 위해 결정된다. 따라서, 일부 구체예에서, 추가적인 단계가 포함되고, 상기 단계는 두개 이상의 다형성 마커 각각의 하나 이상의 대립인자가 개인으로부터 유래된 게놈 DNA를 포함하는 시료 또는 개인으로부터 유래된 유전형 데이터세트에 존재하는지 여부를 결정하는 단계를 포함하고, 상기 두개 이상의 다형성 마커에서 상기 하나 이상의 대립인자의 존재는 갑상선암에 대한 증가된 감수성을 나타낸다. 일 구체예에서, 마커들은 rs965513 (서열번호 1), 및 이와 연관 불균형인 마커들로 구성된 군으로부터 부터 선택된다. 일 구체예에서, 상기 마커들은 표 2에 표시된 마커들로 구성된 군으로부터 선택된다.
본 발명의 유전적 마커들은 또한 개인에 대한 전체 위험도를 확립하기 위해 비-유전적 정보와 조합될 수 있다. 따라서, 일부 구체예에서, 개인의 위험도 평가, 진단, 또는 예후의 판단을 수행하기 위해 비-유전적 정보를 분석하는 추가적인 단계가 포함된다. 비-유전적 정보는 개인의 질병 상태에 대한 정보 또는 개인에 대한 갑상선암의 전체 위험도의 추정에 영향을 미칠 수 있는 다른 정보일 수 있다. 일 구체예에서, 비-유전적 정보는 연령, 성별, 민족, 사회경제적 지위, 과거 질병 진단, 개인의 병력(medical history), 갑상선암의 가족력(family history), 생화학적 척도, 및 임상적 척도로부터 선택된다.
본 발명은 또한 컴퓨터-구현 양태(computer-implemented aspect)를 제공한다. 하나의 그와 같은 양태에서, 본 발명은 개인에서 갑상선암에 대한 감수성을 결정하기 위한 컴퓨터에서 실행가능한 프로그램(computer executable instructions)이 수록된 컴퓨터-판독가능한 매체로서, 상기 컴퓨터-판독가능한 매체는
하나 이상의 다형성 마커를 나타내는 데이터; 및
상기 컴퓨터-판독가능한 매체 상에 저장되고 개인에서 상기 하나 이상의 다형성 마커의 하나 이상의 대립인자의 대립인자 상태(allelic status)에 근거하여 개인에서 갑상선암에 대한 감수성을 결정하기 위해 프로세서에 의해 실행되도록 개조된 루틴(routine);을 포함하는 것인 컴퓨터-판독가능한 매체를 제공한다.
일 구체예에서, 하나 이상의 다형성 마커를 나타내는 상기 데이터는 상기 하나 이상의 다형성 마커에 연관된 갑상선암에 대한 감수성을 나타내는 하나 이상의 파라미터를 포함한다. 또 다른 구체예에서, 하나 이상의 다형성 마커를 나타내는 상기 데이터는 상기 개인에서 상기 하나 이상의 대립인자 마커의 하나 이상의 대립인자의 대립인자 상태를 나타내는 데이터를 포함한다. 또 다른 구체예에서, 상기 루틴은 상기 개인에서 상기 하나 이상의 대립인자 마커의 하나 이상의 대립인자에 대한 대립인자 상태를 나타내는 입력 데이터를 수용하도록 개조된다. 바람직한 구체예에서, 상기 하나 이상의 마커는 rs965513 (서열번호 1), 및 이와 연관 불균형인 마커들로부터 선택된다. 또 다른 바람직한 구체예에서, 상기 하나 이상의 다형성 마커는 표 2에 표시된 마커들로부터 선택된다.
본 발명은 또한 개인에서 갑상선암에 대한 유전적 지표(indicator)를 결정하기 위한 장치로서:
프로세서,
갑상선암에 관해 1명 이상의 개인에 대한 마커 및/또는 일배체형 정보를 분석하고 상기 마커 또는 일배체형 정보에 기반한 출력물(output)을 생성하기 위해 상기 프로세서 상에서 실행되도록 개조된 컴퓨터 실행가능한 프로그램이 수록된 컴퓨터 판독가능한 메모리를 포함하고,
상기 출력물은 상기 개인의 갑상선암의 유전적 지표로서 상기 하나 이상의 마커 또는 일배체형의 위험도 척도를 포함하는 것인 장치를 제공한다. 일 구체예에서, 상기 컴퓨터 판독가능한 메모리는 갑상선암으로 진단된 복수의 개인에서 상기 하나 이상의 다형성 마커의 하나 이상의 대립인자 또는 상기 하나 이상의 일배체형의 빈도를 나타내는 데이터와, 복수의 기준 개인(reference individual)에서 상기 하나 이상의 다형성 마커의 하나 이상의 대립인자 또는 상기 하나 이상의 일배체형의 빈도를 나타내는 데이터를 포함하고, 상기 위험도 척도는 상기 개인에 대한 상기 하나 이상의 마커 및/또는 일배체형 상태와 갑상선암으로 진단된 복수의 개인에 대한 상기 하나 이상의 마커 및/또는 하나 이상의 일배체형의 빈도를 나타내는 데이터의 비교에 근거한다. 일 구체예에서, 상기 컴퓨터 판독가능한 메모리는 상기 하나 이상의 다형성 마커의 하나 이상의 대립인자 또는 하나 이상의 일배체형과 연관된 갑상선암을 발병할 위험을 나타내는 데이터를 포함하고, 상기 개인에 대한 위험도 척도는 상기 개인에 대한 하나 이상의 마커 및/또는 일배체형 상태와 상기 하나 이상의 다형성 마커의 하나 이상의 대립인자 또는 하나 이상의 일배체형과 연관된 갑상선암을 발병할 위험도의 비교에 기반한다. 또 다른 구체예에서, 상기 컴퓨터 판독가능한 메모리는 갑상선암으로 진단된 복수의 개인에서 상기 하나 이상의 다형성 마커의 하나 이상의 대립인자 또는 상기 하나 이상의 일배체형의 빈도를 나타내는 데이터와, 복수의 기준 개인(reference individual)에서 상기 하나 이상의 다형성 마커의 하나 이상의 대립인자 또는 상기 하나 이상의 일배체형의 빈도를 나타내는 데이터를 더 포함하고, 갑상선암을 발병할 위험도는 갑상선암으로 진단된 개인과 기준 개인에서 상기 하나 이상의 대립인자 또는 일배체형의 빈도의 비교에 기반한다. 바람직한 구체예에서, 상기 하나 이상의 마커는 rs965513 (서열번호 1), 및 이와 연관 불균형인 마커들로 구성된 군으로부터 선택된다. 또 다른 바람직한 구체예에서, 상기 하나 이상의 다형성 마커는 표 2에 표시된 마커들로부터 선택된다.
또 다른 양태에서, 본 발명은 갑상선암에 대한 감수성을 평가하기 위해 이용될 마커를 확인하는 방법으로서, 상기 방법은 rs965513 (서열번호 1), rs907580(서열번호 2) 및 rs7024345 (서열번호 3) 중 하나 이상과 연관 불균형인 하나 이상의 다형성 마커를 확인하는 단계, 갑상선암으로 진단되거나 또는 갑상선암에 대한 감수성을 갖는 개인의 시료의 유전형 상태(genotype status)를 결정하는 단계, 및 대조군 개인의 시료의 유전형 상태를 결정하는 단계를 포함하고, 상기 대조군 시료에서의 하나 이상의 다형성의 하나 이상의 대립인자의 빈도 대비, 갑상선암으로 진단되거나, 또는 갑상선암에 대한 감수성을 갖는 개인에서 상기 하나 이상의 대립인자의 빈도의 유의성 있는 차이는 상기 하나 이상의 다형성이 갑상선암에 대한 감수성을 평가하기 위해 유용하다는 것을 나타내는 것인 방법에 관한 것이다. 유의성 있는 차이는 갑상선암 환자와 대조군에서 특정한 다형성 마커의 대립인자의 계수(allelic count)의 통계적 분석에 대해 추정될 수 있다. 일 구체예에서, 유의성 있는 차이는 갑상선암 환자와 대조군 간의 0.05 미만의 계산된 P-값에 근거한다. 다른 구체예에서, 유의성 있는 차이는 0.005 미만, 0.0005 미만, 또는 0.00005 미만과 같은, 계산된 P-값의 보다 낮은 값에 근거한다. 일 구체예에서, 대조군 시료에서 하나 이상의 다형성의 하나 이상의 대립인자의 빈도 대비, 갑상선암으로 진단되거나, 또는 갑상선암에 대한 감수성을 갖는 개인에서 상기 하나 이상의 다형성의 하나 이상의 대립인자의 빈도의 증가는 상기 하나 이상의 다형성이 갑상선암에 대한 증가된 감수성을 평가하기에 유용하다는 것을 나타낸다. 또 다른 구체예에서, 대조군 시료에서 상기 하나 이상의 다형성의 하나 이상의 대립인자의 빈도 대비, 갑상선암으로 진단되거나, 또는 갑상선암에 대한 감수성을 갖는 개인에서 상기 하나 이상의 다형성의 하나 이상의 대립인자의 빈도의 감소는 상기 하나 이상의 다형성이 갑상선암에 대한 감소된 감수성 또는 갑상선암에 대한 보호를 평가하기에 유용하다는 것을 나타낸다.
본 발명은 또한 개인으로부터 수득된 핵산 시료에서 하나 이상의 다형성 마커의 하나 이상의 대립인자가 존재하는지 여부를 결정하는 단계를 포함하는, 개인으로부터 수득된 핵산 시료의 유전형을 분석하는 방법으로서, 상기 하나 이상의 마커는 rs965513 (서열번호 1), 및 이와 연관 불균형인 마커들로부터 선택되고, 상기 시료에서 상기 하나 이상의 대립인자의 존재의 결정은 상기 개인에서 갑상선암에 대한 감수성을 나타내는 것인 방법에 관한 것이다. 일 구체예에서, rs965513 (서열번호 1)의 대립인자 C의 존재의 결정은 상기 개인에서 갑상선암의 증가된 감수성을 나타낸다. 일 구체예에서, 유전형 분석은 상기 하나 이상의 다형성 마커를 플랭킹(flanking)하는 뉴클레오티드 프라이머 쌍을 이용한 중합효소 연쇄 반응(PCR)에 의해, 상기 하나 이상의 다형성 마커를 포함하는 핵산의 세그먼트를 증폭하는 단계를 포함한다. 또 다른 구체예에서, 유전형 분석은 대립인자-특이적 프로브 혼성화, 대립인자-특이적 프라이머 연장(primer extension), 대립인자-특이적 증폭, 핵산 서열결정(nucleic acid sequencing), 5'-엑소뉴클레아제 처리(exonuclease digestion), 분자 표지 분석법(molecular beacon assay), 올리고뉴클레오티드 라이게이션 분석법(oligonucleotide ligation assay), 크기 분석, 단일 가닥 구조 분석(single-stranded conformation analysis) 및 마이크로어레이 기술로부터 선택된 방법을 이용하여 수행된다. 일 구체예에서, 상기 마이크로어레이 기술은 Molecular Inversion Probe 어레이 기술 또는 BeadArray Technologies이다. 일 구체예에서, 상기 방법은 대립인자-특이적 프로브 혼성화를 포함한다. 또 다른 구체예에서, 상기 방법은 마이크로어레이 기술을 포함한다. 하나의 바람직한 구체예는 (1) 상기 핵산의 카피를 검출 올리고뉴클레오티드 프로브 및 인핸서 올리고뉴클레오티드 프로브와, 상기 올리고뉴클레오티드 프로브와 상기 핵산 간의 특이적 혼성화 조건 하에 접촉시키는 단계로서,
(a) 상기 검출 올리고뉴클레오티드 프로브는 길이가 5 내지 100개의 뉴클레오티드로 구성되고 서열번호 1 내지 서열번호 229 중 하나에 의해 주어진 뉴클레오티드 서열을 갖는 핵산의 제1 세그먼트에 특이적으로 혼성화되고,
(b) 상기 검출 올리고뉴클레오티드 프로브는 3' 말단의 검출가능한 표지 및 5' 말단의 퀀칭 모이어티(quenching moiety)를 포함하며,
(c) 상기 인핸서 올리고뉴클레오티드는 길이가 5 내지 100개의 뉴클레오티드로 구성되고 상기 올리고뉴클레오티드 프로브의 5'에 배열된 상기 뉴클레오티드 서열의 제2 세그먼트에 상보적이어서, 상기 두개의 올리고뉴클레오티드가 모두 상기 핵산에 혼성화되는 경우 상기 인핸서 올리고뉴클레오티드는 상기 검출 올리고뉴클레오티드에 대해 3' 에 위치하며, 및
(d) 상기 제1 세그먼트와 상기 제2 세그먼트 간에 단일 염기 갭(single base gap)이 존재하여, 상기 올리고뉴클레오티드 프로브와 상기 인핸서 올리고뉴클레오티드 프로브가 모두 상기 핵산에 혼성화되는 경우, 상기 올리고뉴클레오티드 간에 단일 염기 갭이 존재하는 것인 단계,
(2) 상기 검출 프로브가 상기 핵산에 혼성화되는 경우, 상기 검출 프로브의 3' 말단으로부터 상기 검출가능한 표지를 절단하여 유리된 검출가능한 표지를 방출시키는 엔도뉴클레아제로 상기 핵산을 처리하는 단계, 및
(3) 유리된 검출가능한 표지를 측정하는 단계로서, 상기 유리된 검출가능한 표지의 존재는 상기 검출 프로브가 상기 핵산의 제1 세그먼트에 특이적으로 혼성화된다는 것을 나타내고, 상기 다형성 부위의 서열이 상기 검출 프로브의 상보체(complement)라는 것을 나타내는 것인 단계를 포함한다.
본 발명의 또 다른 양태는 갑상선암 치료제에 대한 반응의 확률에 대해 개인을 평가하는 방법으로서, 상기 개인으로부터 수득된 핵산 시료, 또는 상기 개인으로부터 유래된 유전형 데이터세트에서 하나 이상의 다형성 마커의 하나 이상의 대립인자가 존재하는지 여부를 결정하는 단계를 포함하고, 상기 하나 이상의 다형성 마커는 rs965513 (서열번호 1), 및 이와 연관 불균형인 마커들로 구성된 군으로부터 선택되고, 상기 하나 이상의 마커의 상기 하나 이상의 대립인자의 존재는 상기 치료제에 대한 양성 반응의 확률을 나타내는 것인 방법에 관한 것이다.
또 다른 양태에서, 본 발명은 갑상선암으로 진단된 개인의 예후(prognosis)를 예측하는 방법으로서, 상기 방법은 상기 개인으로부터 수득된 핵산 시료, 또는 상기 개인으로부터 유래된 유전형 데이터세트에서 하나 이상의 다형성 마커의 하나 이상의 대립인자가 존재하는지 여부를 결정하는 단계를 포함하고, 상기 하나 이상의 다형성 마커는 rs965513 (서열번호 1), 및 이와 연관 불균형인 마커들로 구성된 군으로부터 선택되고, 상기 하나 이상의 대립인자의 존재는 상기 개인에서 갑상선암의 악화된 예후를 나타내는 것인 방법에 관한 것이다.
본 발명의 또 다른 양태는 갑상선암의 치료를 받는 개인의 치료의 진행을 모니터링하는 방법으로서, 상기 방법은 상기 개인으로부터 수득된 핵산 시료 또는 상기 개인으로부터 유래된 유전형 데이터세트에서 하나 이상의 다형성 마커의 하나 이상의 대립인자가 존재하는지 여부를 결정하는 단계를 포함하고, 상기 하나 이상의 다형성 마커는 rs965513 (서열번호 1), 및 이와 연관 불균형인 마커들로 구성된 군으로부터 선택되고, 상기 하나 이상의 대립인자의 존재가 상기 개인의 치료 결과(treatment outcome)를 나타내는 것인 방법에 관한 것이다. 일 구체예에서, 상기 치료는 수술에 의한 치료, 방사선 요법에 의한 치료, 또는 약물 투여에 의한 치료이다.
본 발명은 또한 개인에서 갑상선암에 대한 감수성을 진단 및/또는 평가하기 위한 시약의 제조에서 올리고뉴클레오티드 프로브의 용도로서, 상기 프로브는 서열번호 1 내지 서열번호 229 중 하나로 표시된 뉴클레오티드 서열을 갖는 핵산의 세그먼트에 혼성화되고, 상기 프로브는 길이가 15 내지 500개의 뉴클레오티드로 구성되는 것인 용도에 관한 것이다. 일부 구체예에서, 상기 프로브는 길이가 약 16개 내지 약 100개의 뉴클레오티드로 구성된다. 일부 다른 구체예에서, 상기 프로브는 길이가 약 20개 내지 약 50개의 뉴클레오티드로 구성된다. 일부 다른 구체예에서, 상기 프로브는 길이가 약 20개 내지 약 30개의 뉴클레오티드로 구성된다.
본 발명은 그의 가장 광범위한 의미에서 갑상선 유두암, 갑상선 여포암, 갑상선 수질암 및 퇴행성 갑상선암을 포함한, 갑상선암의 서브표현형(subphenotype)에 관한 것이다. 특정한 구체예에서, 본 발명은 특정한 종양 종류에 관한 것이다. 따라서, 일 구체예에서, 본 발명은 갑상선 유두암에 관한 것이다. 또 다른 구체예에서, 본 발명은 갑상선 여포암에 관한 것이다. 또 다른 구체예에서, 본 발명은 갑상선 유두암(papillary thyroid cancer) 및/또는 갑상선 여포암(follicular thyroid cancer)에 관한 것이다. 또 다른 구체예에서, 본 발명은 갑상선 수질암(medullary thyroid cancer)에 관한 것이다. 또 다른 구체예에서, 본 발명은 퇴행성 갑상선암에 관한 것이다. 갑상선암의 기타 서브표현형, 및 서브표현형의 기타 조합도 고려되며 또한 본 발명의 범위 내에 속한다.
본 발명의 특정한 구체예는 조기 발병 연령 및/또는 조기 진단 연령을 갖는 갑상선암의 진단에 관한 것이다. 조기 연령에 진단된 갑상선암은 보다 공격적일 수 있고, 특히, 양성 결절이 조기 연령에 존재하는 경우에 보다 공격적일 수 있다. 따라서, 특정한 구체예는 조기 발병 연령 및/또는 조기 진단 연령에 발생하는 갑상선암에 관한 것이다.
본 발명의 특정한 구체예는 또한 갑상선암에 대한 바이오마커의 정량적 수준을 평가하는 것을 포함한다. 일부 구체예에서, 상기 바이오마커는 개인으로부터의 생물학적 시료에서 평가될 수 있다. 일부 구체예에서, 상기 시료는 혈액 시료이다. 일부 구체예에서, 상기 혈액 시료는 혈청 시료이다. 바람직한 구체예에서, 상기 바이오마커는 갑상선 자극 호르몬(thyroid stimulating hormone, TSH), 티록신(T4) 및 트리요오도티로닌(thriiodothyronine, T3)으로 구성된 군으로부터 선택된다. 특정한 구체예에서, 상기 바이오마커의 비정상적 수준의 결정은 개인에서 비정상적인 갑상선 기능을 나타내고, 이는 상기 개인에서 갑상선암의 증가된 위험도를 나타낼 수 있다. 비정상적 수준은 증가된 수준일 수 있거나, 또는 비정상적 수준은 감소된 수준일 수 있다. 특정한 구체예에서, 비정상적 수준의 결정은 집단에서 상기 바이오마커의 평균 수준으로부터의 편차의 결정에 근거하여 결정된다. 일 구체예에서, TSH의 비정상적 수준은 0.2mIU/L 미만 및/또는 10mIU/L보다 큰 측정값이다. 또 다른 구체예에서, TSH의 비정상적 수준은 0.3mIU/L 미만 및/또는 3.0mIU/L보다 큰 측정값이다. 또 다른 구체예에서, T3 (유리 T3)의 비정상적 수준은 70 ng/dL 미만이고 및/또는 205 ng/dL보다 크다. 또 다른 구체예에서, T4 (유리 T4)의 비정상적 수준은 0.8 ng/dL 미만이고 및/또는 2.7 ng/dL보다 크다.
본 발명의 방법의 일부 구체예에서, 상기 방법에서 결정된 감수성은 증가된 감수성이다. 하나의 그와 같은 구체예에서, 증가된 감수성은 1.30 이상의 상대적 위험도(relative risk, RR) 또는 오즈비(odds ratio, OR)를 특징으로 한다. 또 다른 구체예에서, 증가된 감수성은 1.40 이상의 상대적 위험도 또는 오즈비를 특징으로 한다. 또 다른 구체예에서, 증가된 감수성은 1.50 이상의 상대적 위험도 또는 오즈비를 특징으로 한다. 또 다른 구체예에서, 증가된 감수성은 1.60 이상의 상대적 위험도 또는 오즈비를 특징으로 한다. 또 다른 구체예에서, 증가된 감수성은 1.70 이상의 상대적 위험도 또는 오즈비를 특징으로 한다. 또 다른 구체예에서, 증가된 감수성은 1.80 이상의 상대적 위험도 또는 오즈비를 특징으로 한다. 또 다른 구체예에서, 증가된 감수성은 1.90 이상의 상대적 위험도 또는 오즈비를 특징으로 한다. 또 다른 구체예에서, 증가된 감수성은 2.0 이상의 상대적 위험도 또는 오즈비를 특징으로 한다. 다른 구체예는 1.55 이상, 1.65 이상, 1.75 이상, 1.85 이상, 및 1.95 이상의 위험 변이의 상대적 위험도 또는 오즈비를 특징으로 한다. 이와 같은 전술된 값들을 사이의 값들을 포함한, 상대적 위험도 및/또는 오즈비에 대한 다른 수치값들도 가능하고, 이들도 본 발명의 범위 내에 속한다.
본 발명의 방법의 일부 구체예에서, 상기 방법에서 결정된 감수성은 감소된 감수성이다. 하나의 그와 같은 구체예에서, 감소된 감수성은 0.8 미만의 상대적 위험도(RR) 또는 오즈비(OR)를 특징으로 한다. 또 다른 구체예에서, 감소된 감수성은 0.7 미만의 상대적 위험도(RR) 또는 오즈비(OR)를 특징으로 한다. 또 다른 구체예에서, 감소된 감수성은 0.6 미만의 상대적 위험도(RR) 또는 오즈비(OR)를 특징으로 한다. 또 다른 구체예에서, 감소된 감수성은 0.5 미만의 상대적 위험도(RR) 또는 오즈비(OR)를 특징으로 한다. 0.69 미만, 0.68 미만, 0.67 미만, 0.66 미만, 0.65 미만, 0.64 미만, 0.63 미만, 0.62 미만, 0.61 미만, 0.60 미만, 0.59 미만, 0.58 미만, 0.57 미만, 0.56 미만, 0.55 미만, 0.54 미만, 0.53 미만, 0.52 미만, 0.51 미만, 0.50 미만, 등의 상대적 위험도 또는 오즈비와 같은 다른 컷오프가 고려되고, 본 발명의 범위 내에 속한다.
본 발명은 또한 키트에 관한 것이다. 하나의 그와 같은 양태에서, 본 발명은 개인에서 갑상선암에 대한 감수성을 평가하기 위한 키트로서, 상기 키트는 상기 개인의 게놈에서 rs965513 (서열번호 1), 및 이와 연관 불균형인 마커들로 구성된 군으로부터 선택된 하나 이상의 다형성 마커의 하나 이상의 대립인자를 선택적으로 검출하는 시약을 포함하고, 상기 하나 이상의 대립인자의 존재는 갑상선암에 대한 증가된 감수성을 나타내는 것인 키트에 관한 것이다. 또 다른 양태에서, 본 발명은 개인에서 갑상선암에 대한 감수성을 평가하기 위한 키트로서, 상기 키트는 상기 개인의 게놈에서 하나 이상의 다형성 마커의 하나 이상의 대립인자를 선택적으로 검출하기 위해 필요한 시약을 포함하고, 상기 다형성 마커는 rs965513 (서열번호 1), 및 이와 연관 불균형인 마커들로 구성된 군으로부터 선택되고, 상기 하나 이상의 대립인자의 존재는 갑상선암에 대한 감수성을 나타내는 것인 키트에 관한 것이다. 일 구체예에서, 상기 하나 이상의 다형성 마커는 표 2에 표시된 마커들로부터 선택된다.
일 구체예에서, 키트 시약은 상기 하나 이상의 다형성 마커를 포함하는 상기 개인의 게놈의 단편에 혼성화하는 하나 이상의 연속된(contiguous) 올리고뉴클레오티드를 포함한다. 또 다른 구체예에서, 상기 키트는 상기 개인으로부터 수득된 게놈 세그먼트의 반대쪽 가닥에 혼성화하는 한 쌍 이상의 올리고뉴클레오티드를 포함하고, 상기 각 올리고뉴클레오티드 프라이머 쌍은 하나의 다형성을 포함하는 상기 개인의 게놈의 단편을 선택적으로 증폭시키도록 설계되고, 상기 다형성은 표 2에 정의된 다형성으로 구성된 군으로부터 선택되며, 상기 단편은 크기가 20 bp 이상이다. 일 구체예에서, 상기 올리고뉴클레오티드는 상기 개인의 게놈에 완전히 상보적이다. 또 다른 구체예에서, 상기 키트는 완충액 및 상기 세그먼트를 증폭시키는 효소를 더 포함한다. 또 다른 구체예에서, 상기 시약은 상기 단편을 검출하기 위한 표지를 더 포함한다.
하나의 바람직한 구체예에서, 상기 키트는 길이가 5 내지 100개의 뉴클레오티드로 구성된 검출 올리고뉴클레오티드 프로브; 길이가 5 내지 100개의 뉴클레오티드로 구성된 인핸서 올리고뉴클레오티드 프로브; 및 엔도뉴클레아제 효소;를 포함하고,
상기 검출 올리고뉴클레오티드 프로브는 서열번호 1 내지 서열번호 229 중 하나로 표시된 뉴클레오티드 서열의 핵산의 제1 세그먼트에 특이적으로 혼성화되고; 및
상기 검출 올리고뉴클레오티드 프로브는 3' 말단에 검출가능한 표지를 포함하고 5' 말단에 퀀칭 모이어티(quenching moiety)를 포함하며;
상기 인핸서 올리고뉴클레오티드는 길이가 5개 내지 100개의 뉴클레오티드로 구성되고, 상기 올리고뉴클레오티드 프로브의 5'에 배열된 상기 뉴클레오티드 서열의 제2 세그먼트에 상보적이어서, 상기 인핸서 올리고뉴클레오티드는 상기 두개의 올리고뉴클레오티드가 모두 상기 핵산에 혼성화되는 경우 상기 검출 올리고뉴클레오티드에 대해 3'에 위치하며; 및
상기 제1 세그먼트와 상기 제2 세그먼트 간에 단일 염기 갭이 존재하여, 상기 올리고뉴클레오티드 프로브와 상기 인핸서 올리고뉴클레오티드 프로브가 모두 상기 핵산에 혼성화되는 경우, 상기 올리고뉴클레오티드 간에 단일 염기 갭이 존재하며; 및
상기 핵산을 상기 엔도뉴클레아제에 의해 처리하는 단계는 상기 검출 프로브가 상기 핵산에 혼성화된 경우, 상기 검출 프로브의 3'말단으로부터 상기 검출가능한 표지를 절단하여 유리 상태의 검출가능한 표지를 방출시킨다.
본 발명에 따른 키트는 또한 이전에 갑상선암으로 진단되었던 개인에서 하나 이상의 제2 원발성 종양을 발병할 위험도를 평가하는 방법, 갑상선암 치료제에 대해 반응할 확률에 대해 개인을 평가하는 방법, 및 갑상선암으로 진단되었고 상기 질병에 대한 치료를 받은 개인의 치료 진행을 모니터링하는 방법을 포함한, 본 발명의 다른 방법에서 이용될 수 있다.
본 발명의 방법, 용도, 장치 또는 키트의 특정한 구체예에서, 갑상선암에 대한 감수성에 관한 정보를 제공하는 상기 하나 이상의 다형성 마커는 FoxE1 유전자와 연관된다. 본 발명에서 "연관된(associated with)"은 상기 하나 이상의 마커가 FoxE1 유전자 또는 그의 조절 영역과 연관 불균형이라는 것을 의미한다. 그와 같은 마커는 FoxE1 유전자, 또는 그의 조절 영역 내에 위치할 수 있거나, 또는 이들은 FoxE1 유전자 또는 상기 유전자의 기능에 대해 직접적인 영향을 갖는 조절 영역 내의 하나 이상의 마커와 연관 불균형일 수 있다. FoxE1과 연관된 감수성 변이의 기능적 결과는 본 명세서에서 보다 상세하게 설명되는 바와 같이, FoxE1 유전자의 발현 수준, 그의 전사체의 안정성, 또는 아미노산 변형을 통해 단백질 수준에서 일어날 수 있다.
본 명세서에서 갑상선암과 연관된 것으로 설명된 마커들은 모두 본 명세서에 기재된 방법, 키트, 용도, 장치, 절차를 포함한, 본 발명의 다양한 양태에서 이용될 수 있다. 특정한 구체예에서, 본 발명은 본 명세서에서 정의된 C09 LD 블럭과 연관된 마커들에 관한 것이다. 특정한 다른 구체예에서, 본 발명은 표 2에 표시된 마커들(서열번호 1 내지 229), 및 이들과 연관 불균형인 마커들에 관한 것이다. 특정한 다른 구체예에서, 본 발명은 표 2에 표시된 마커들에 관한 것이다. 특정한 다른 구체예에서, 본 발명은 마커 rs965513 (서열번호 1), rs10759944 (서열번호 17), rs907580 (서열번호 2), rs10984103 (서열번호 37), rs925487 (서열번호 34), rs7024345 (서열번호 3) 및 rs1443434 (서열번호 30), 및 이들과 연관 불균형인 마커들에 관한 것이다. 일부 다른 바람직한 구체예에서, 본 발명은 rs965513 (서열번호 1), rs10759944 (서열번호 17), rs907580 (서열번호 2), rs10984103 (서열번호 37), rs925487 (서열번호 34), rs7024345 (서열번호 3) 및 rs1443434 (서열번호 30)로 구성된 군으로부터 선택된 마커들 중 하나에 관한 것이다.
특정한 구체예에서, 갑상선암의 증가된 위험도를 부여하는 하나 이상의 마커 대립인자는 rs965513 대립인자 A, rs10759944 대립인자 A, rs907580 대립인자 A, rs10984103 대립인자 A, rs925487 대립인자 G, rs7024345 대립인자 A 및 rs1443434 대립인자 G로 구성된 군으로부터 선택된다. 이 구체예에서, 상기 대립인자(위험 대립인자)의 존재는 갑상선암의 증가된 위험도를 나타낸다.
본 발명의 일부 구체예에서, 연관 불균형(linkage disequilibrium, LD)은 두 개의 유전적 세그먼트(예를 들면, 다형성 마커) 간의 연관 불균형의 정도의 정량적 척도를 제공하는, 연관 불균형 척도 r2 및 |D'|을 이용하여 결정된다. 본 명세서에서 더 설명되는 바와 같이, 특정한 마커들 간의 이 척도들의 특정한 수치값들은 상기 마커들이 연관 불균형에 있다는 것을 나타낸다. 본 발명의 일 구체예에서, 마커들 간의 연관 불균형(즉, LD 값이 마커들이 연관 불균형이라는 것을 나타냄)은 0.1보다 큰 r2으로 정의된다. 또 다른 구체예에서, 연관 불균형은 0.2보다 큰 r2으로 정의된다. 다른 구체예는 r2 > 0.25, r2 > 0.3, r2 > 0.35, r2 > 0.4, r2 > 0.45, r2 > 0.5, r2 > 0.55, r2 > 0.6, r2 > 0.65, r2 > 0.7, r2 > 0.75, r2 > 0.8, r2 > 0.85, r2 > 0.9, r2 > 0.95, r2 > 0.96, r2 > 0.97, r2 > 0.98, 또는 r2 > 0.99와 같은, 연관 불균형의 다른 정의를 포함할 수 있다. 일부 구체예에서, 연관 불균형은 또한 |D'| > 0.2, 또는 |D'| > 0.3, |D'| > 0.4, |D'| > 0.5, |D'| > 0.6, |D'| > 0.7, |D'| > 0.8, |D'| > 0.9, |D'| > 0.95, |D'| > 0.98 또는 |D'| > 0.99로 정의될 수 있다. 일부 구체예에서, 연관 불균형은 r2 > 0.2 및 |D'| > 0.8과 같은 두 개의 기준 r2 및 |D'|을 충족시키는 것으로 정의된다. 앞서 표시된 이 파라미터들에 대한 값들을 포함하나, 이에 한정되지 않는, r2 및 |D'|에 대한 값들의 다른 조합도 가능하고, 본 발명의 범위 내에 속한다.
특징의 조합이 본 명세서의 동일한 문장 또는 구에서 구체적으로 확인되지 않더라도, 본 명세서에 기재된 특징들의 모든 조합이 고려되는 것으로 이해되어야 한다. 이는 특히 본 명세서에 기재된 본 발명의 모든 양태에서, 개별적으로 또는 일배체형으로 분석을 위한, 단독으로 또는 조합된 본 명세서에 기재된 모든 마커들의 용도를 포함한다.
발명의 상세한 설명
정의
달리 표시되지 않으면, 핵산 서열은 5'에서 3' 방향으로 좌측에서 우측으로 기재된다. 명세서 내에 기재된 수치 범위는 그 범위를 한정하는 수치를 포함하며 정의된 범위 내의 각 정수 또는 비-정수 분수(non-integer fraction)를 포함한다. 달리 정의되지 않으면, 본 명세서에서 사용된 모든 기술 용어 및 과학 용어는 본 발명이 속하는 기술 분야의 통상적인 기술자에 의해 일반적으로 이해되는 것과 동일한 의미를 갖는다.
본 발명에서, 하기의 용어들은 표시된 바와 같은 의미를 갖는다:
본 명세서에 기재된 바와 같이, 종종 "마커(marker)"로 불리는, "다형성 마커(polymorphic marker)"는 게놈 다형성 부위(genomic polymorphic site)를 의미한다. 각 다형성 마커는 다형성 부위에서 특정한 대립인자에 특징적인 두 개 이상의 서열 변이를 갖는다. 따라서, 다형성 마커에 대한 유전적 연관(genetic association)은 특정한 다형성 마커의 하나 이상의 특정한 대립인자에 대해 연관이 있다는 것을 의미한다. 마커는 SNP(single nucleotide polymorphism), 미니새틀라이트(minisatellite) 또는 마이크로새틀라이트(microsatellite), 전위(translocation) 및 카피수 변이(copy number variation)(삽입, 결실, 중복)를 포함한, 게놈에서 발견되는 임의의 변이 형태의 대립인자를 포함할 수 있다. 다형성 마커는 집단에서 임의의 측정가능한 빈도로 존재할 수 있다. 질병 유전자의 맵핑을 위해, 5-10%보다 높은 집단 빈도(population frequency)를 갖는 다형성 마커가 일반적으로 가장 유용하다. 그러나, 다형성 마커는 또한 1-5%와 같은 더 낮은 집단 빈도, 또는 훨씬 더 낮은 빈도, 특히, 카피 수 변이(copy number variation, CNV)를 가질 수 있다. 본 발명에서, 상기 용어는 임의의 집단 빈도를 갖는 다형성 마커를 포함하는 것으로 이해될 것이다.
"대립인자(allele)"는 염색체 상에 있는 주어진 유전자 좌(위치)의 뉴클레오티드 서열을 의미한다. 다형성 마커 대립인자는 따라서, 염색체 상의 마커의 조성(즉, 서열)을 의미한다. 개인으로부터의 게놈 DNA는 각 염색체 상의 마커의 각 카피를 대표하는, 임의의 주어진 다형성 마커에 대한 두 개의 대립인자(예를 들면, 대립인자-특이적 서열)를 포함한다. 본 명세서에서 사용된 뉴클레오티드에 대한 서열 코드는 A = 1, C = 2, G = 3, T = 4이다. 마이크로새틀라이트 대립인자(microsatellite allele)의 경우, CEPH 표본(Centre d'Etudes du Polymorphisme Humain, genomics repository, CEPH sample 1347-02)이 기준으로 이용되고, 이 표본에서 각 마이크로새틀라이트의 보다 짧은 대립인자는 0으로 설정되고 다른 표본에서 모든 다른 대립인자는 이 기준에 대비하여 번호가 부여된다. 따라서, 예를 들면, 대립인자 1은 CEPH 표본에서의 보다 짧은 대립인자보다 1 bp 더 길고, 대립인자 2는 CEPH 표본에서의 보다 짧은 대립인자보다 2 bp 더 길며, 대립인자 3은 CEPH 표본에서의 보다 짧은 대립인자보다 3 bp 더 길며, 대립인자 -1은 CEPH 표본에서의 보다 짧은 대립인자보다 1 bp 더 짧고, 대립인자 -2는 CEPH 표본에서의 보다 짧은 대립인자보다 2 bp 더 짧다.
본 명세서에 기재된 서열 코뉴클레오티드 중의성(sequence conucleotide ambiguity)은 IUPAC-IUB에 의해 제안된 바와 같다. 이 코드들은 EMBL, GenBank, 및 PIR 데이터베이스에 의해 사용된 코드들과 양립될 수 있다.
IUB 코드 | 의미 |
A | 아데노신 |
C | 시티딘 |
G | 구아닌 |
T | 티미딘 |
R | G 또는 A |
Y | T 또는 C |
K | G 또는 T |
M | A 또는 C |
S | G 또는 C |
W | A 또는 T |
B | C G 또는 T |
D | A G 또는 T |
H | A C 또는 T |
V | A C 또는 G |
N | A C G 또는 T (임의의 염기) |
집단(자연 집단 또는 인공 집단, 예를 들면, 합성 분자들의 인공 라이브러리)에서 2개 이상의 서열이 가능한 뉴클레오티드 위치가 본 명세서에서 "다형성 부위(polymorphic site)"로 지칭된다.
"단일 뉴클레오티드 다형성(Single Nucleotide Polymorphism)" 또는 "SNP"는 게놈의 특정한 위치에 있는 단일 뉴클레오티드가 종의 멤버 간에 또는 개체 내에서 쌍을 이루는 염색체 간에 상이할 때 나타나는 DNA 서열 변이이다. 대부분의 SNP 다형성은 두 개의 대립인자를 갖는다. 각 개체는 이 경우, 상기 다형성의 하나의 대립인자에 대해 동형접합(즉, 개체의 두 개의 염색체 카피 모두 SNP 위치에서 동일한 뉴클레오티드를 가짐)이거나, 또는 개체는 이형접합이다(즉, 상기 개체의 두 개의 자매 염색체(sister nucleotide)가 상이한 뉴클레오티드를 포함함). 본 명세서에서 보고된 바와 같이, SNP 명명은 NCBI(the National Center for Biotechnological Information)에 의해 각각의 독특한 SNP에 부여된 공식적인 기준 SNP(Reference SNP, rs) ID 식별 택(tag)을 의미한다.
본 명세서에 기재된 "변이(variant)"는 기준(reference) DNA와 상이한 DNA의 세그먼트를 의미한다. 본 명세서에서 정의된 "마커(marker)" 또는 "다형성 마커(polymorphic marker)"는 변이이다. 기준과 상이한 대립인자(allele)는 "변이" 대립인자로 지칭된다.
"마이크로새틀라이트(microsatellite)"는 특정한 부위에 있는 길이가 2 내지 8개의 뉴클레오티드로 구성된 염기의 작은 반복체(repeat)(예를 들면, CA 반복체)를 복수 개 갖는 다형성 마커이며, 전체 집단에서 반복체 길이의 수는 변한다.
"indel"은 통상적으로 단지 수개의 뉴클레오티드로 구성된 길이의 작은 삽입 또는 결실을 포함하는 다형성의 일반적인 형태이다.
본 명세서에 기재된, "일배체형(haplotype)"은 세그먼트를 따라 배열된 대립인자의 특정한 조합을 특징으로 하는 게놈 DNA의 세그먼트를 의미한다. 인간과 같은 이배체(diploid) 개체의 경우, 일배체형은 각 다형성 마커 또는 유전자 좌에 대한 대립인자의 쌍 중 하나의 대립인자(one member)를 포함한다. 특정한 구체예에서, 일배체형은 두개 이상의 대립인자, 세개 이상의 대립인자, 네개 이상의 대립인자, 또는 다섯개 이상의 대립인자를 포함할 수 있다. 본 명세서에서 일배체형은 마커 명칭 및 상기 마커의 대립인자로 기재되며, 예를 들면, 일배체형 "3 rs965513"은 마커 rs965513의 대립인자 3이 일배체형에 있다는 것을 의미하고, "rs965513 대립인자 3(rs965513 allele 3)"과 동등하다. 또한, 일배체형에서 대립인자 코드는 개별적인 마커에 대한 것과 같고, 즉, 1 = A, 2 = C, 3 = G 및 4 = T이다.
본 명세서에 기재된 용어 "감수성(susceptibility)"은 개체가 평균 개체들보다 특정한 상태(예를 들면, 특정한 형질, 표현형, 또는 질병, 예를 들면, 갑상선암)을 발병하는 경향이 있거나, 또는 특정 상태에 저항할 수 있는 능력이 평균 개체보다 더 약한 것을 의미한다. 상기 용어는 증가된 감수성 및 감소된 감수성을 모두 포함한다. 따라서, 본 발명의 다형성 마커의 특정한 대립인자 및/또는 일배체형은 상기 특정한 대립인자 또는 일배체형에 대한 1보다 큰 상대적 위험도(RR) 또는 오즈비(OR)를 특징으로 하는, 갑상선암의 증가된 감수성(즉, 증가된 위험도)을 특징으로 할 수 있다. 대안적으로, 본 발명의 마커 및/또는 일배체형은 1 미만의 상대적 위험도를 특징으로 하는, 갑상선암의 감소된 감수성(즉, 감소된 위험도)을 특징으로 한다.
용어 "및/또는"은 본 명세서에서 상기 용어에 의해 연결된 항목들 중 하나 또는 양자 모두가 포함된다는 것을 나타내는 것으로 이해될 것이다. 바꾸어 말하면, 본 명세서에서 상기 용어는 "하나 또는 그 나머지 또는 양자 모두(one or the other or both)"를 의미하는 것으로 이해될 것이다.
본 명세서에 기재된 용어 "참조표(look-up table)"는 하나의 형태의 데이터를 또 다른 형태와 상관시키거나, 또는 하나 이상의 형태의 데이터를 상기 데이터가 관련된 예상되는 결과, 예를 들면, 표현형 또는 성향과 상관시키는 표이다. 예를 들면, 참조표는 하나 이상의 다형성 마커에 대한 대립인자 데이터와, 특정한 대립인자 데이터를 포함하는 개체가 표시할 것 같거나, 또는 그 특정한 대립인자 데이터를 갖지 않는 개인보다 표시할 가능성이 더 높은, 특정한 질병 진단과 같은 특정한 성향 또는 표현형 간의 상관관계를 포함할 수 있다. 참조표는 다면적(multidimensional)일 수 있고, 즉, 참조표는 단일 마커들에 대한 복수 개의 대립인자에 대한 정보를 동시에 포함할 수 있거나, 또는 그들은 복수 개의 마커들에 대한 정보를 포함할 수 있고, 그들은 또한 질병 진단에 대한 세부사항, 인종 정보, 바이오마커, 생화학적 측정값, 치료적 방법, 또는 약물 등과 같은 다른 인자들을 포함할 수 있다.
"컴퓨터-판독가능한 매체(computer-readable medium)"는 상업적으로 구매가능하거나 또는 맞춤-제작된(custom-made) 인터페이스를 이용하여 컴퓨터에 의해 접근될 수 있는 정보 저장 매체이다. 대표적인 컴퓨터-판독가능한 매체는 메모리(예를 들면, RAM, ROM, 플래쉬 메모리, 등), 광학적 저장 매체(예를 들면, CD-ROM), 자기 저장 매체(예를 들면, 컴퓨터 하드 드라이브, 플로피 디스크, 등), 천공 카드(punch card), 또는 기타 상업적으로 구입가능한 매체를 포함한다. 목적 시스템(system of interest)과 매체, 컴퓨터간, 또는 컴퓨터와 저장 또는 저장된 정보의 접근을 위한 컴퓨터-판독가능한 매체 간에 정보가 전달될 수 있다. 그와 같은 전송은 전기적이거나, 또는 IR 링크, 무선 연결 등과 같은 다른 이용가능한 방법에 의해 수행될 수 있다.
"핵산 시료(nucleic acid sample)"는 핵산(DNA 또는 RNA)를 포함하는 개체로부터 수득된 시료이다. 일부 구체예에서, 즉, 특정한 다형성 마커 및/또는 일배체형의 검출에서, 핵산 시료는 게놈 DNA를 포함한다. 그와 같은 핵산 시료는 혈액 시료, 양수액, 뇌척수액, 또는 피부, 근육, 구강 점막 또는 결막 점막, 태반, 위장관 또는 기타 기관으로부터의 조직 시료를 포함한, 게놈 DNA를 포함하는 임의의 공급원(source)으로부터 수득될 수 있다.
본 명세서에서 사용된 용어 "갑상선암 치료제(thyroid cancer therapeutic agent)"는 갑상선암과 연관된 증상을 개선시키거나 또는 예방하기 위해 이용될 수 있는 작용제를 의미한다.
본 명세서에 기재된 용어 "갑상선암-연관 핵산(thyroid cancer-associated nucleic acid)"은 갑상선암과 연관된 것으로 확인된 핵산을 의미한다. 이는 본 명세서에 기재된 마커 및 일배체형 및 이들과 강한 연관 불균형(LD)인 마커 및 일배체형을 포함하나, 이에 한정되지 않는다. 일 구체예에서, 갑상선암-연관 핵산은 게놈 영역 또는 LD 블럭 내에 위치한 하나 이상의 다형성 마커를 통해 갑상선암의 위험도와 연관된 것으로 확인된, LD-블럭과 같은 게놈 영역을 의미한다.
본 명세서에 기재된 용어 "FoxE1" 또는 "FoxE1 유전자"는 염색체 9q22.23 상의 갑상선 전사 인자 2(thyroid transcription factor 2, TTF-2)로 불렸던, Forkhead Factor E1 유전자를 의미한다.
본 명세서에 기재된 용어 " LD Block C09"는 NCBI (National Center for Biotechnology Information) Build 36 (서열번호 1)의 위치 99,350,532 내지 99,953,197에 해당하는, 마커 rs2795492 및 rs7855669를 포함하는, 염색체 9 상의 연관 불균형(Linkage Disequilibrium, LD) 블럭 영역을 의미한다.
갑상선암에 대한 감수성을 부여하는 유전적 변이에 대한 게놈-전체 탐색을 통해, 본 발명자들은 갑상선암의 위험도와 연관된 변이를 포함하는 염색체 9q22.33 상의 영역을 확인하였다. 마커 rs965513, rs907580 및 rs7024345는 갑상선암의 위험도와 유의성있게 연관된 것으로 확인되었다. 가장 강력한 연관 신호가 마커 rs965513 (OR 1.77, P-값 1.18 x 10-15)에 대해 관찰되었다. 후속 분석이 아이슬란드 및 미국과 스페인으로부터의 표본에서 이 결과를 확인했다 (rs965513에 대한 전체 P-값 1.7x10-27).
rs965513 마커는 광범위한 연관 불균형을 특징으로 하는 염색체 9q22.33 상의 영역 내에 위치한다. 그와 같은 광범위한 LD의 결과는 상기 영역 내의 다수의 유전적 변이, 예를 들면, rs907580 및 rs7024345 및 또한 rs10759944, rs10984103, rs925487 및 rs1443434를 포함한 유전적 변이가 위험 변이 rs965513을 위한 대리물(surrogate)이고, 그와 같은 마커는 또한, 본 발명을 실현하기 위해 유용하다. rs965513과 LD이기 때문에 본 발명의 실시를 위해 유용한 기타 SNP 마커가 본 명세서에서 표 2에 제공된다. 하기에서 보다 상세하게 검토되는 바와 같이, 대리 마커들은 영역의 게놈 구조에 따라, 큰 게놈 영역에 걸쳐 존재할 수 있다. 예를 들면, 본 명세서에서 표 2에 표시된 rs965513의 대리 마커는 약 600 kb의 영역에 존재한다(본 명세서에서 LD 블럭 C09로도 지칭됨). 이 영역에서 확인된 갑상선암에 대한 유전적 위험도의 생물학적 결과를 초래하는 기능적 단위(functional unit)는 원칙적으로 광범위한 LD의 영역 내에 위치할 수 있다. rs965513과 특히 높은 LD (예를 들면, 하기에서 더 설명되는 바와 같이 r2 및/또는 |D'|에 대한 높은 값, 예를 들면, 0.1 또는 0.2보다 큰 r2 값을 특징으로 하는 LD)인 마커들은 그와 같은 단위 내에 있거나, 또는 이와 높은 LD일 가능성이 매우 높다.
FoxE1 (Forkhead factor E1; 이전에 갑상선 전사 인자 2(TTF-2)로 지칭됨) 유전자는 rs965513 부근에, 및 rs965513과 강한 LD인 마커들을 포함하는 영역 내에 위치한다. 상기 영역 내의 다른 유전자들은 XPA, C9orf156 및 HEMGN (도 2)을 포함한다. FoxE1 유전자는 갑상선-특이적 유전자의 발현을 조절하고(De Felice, M., and R. Di Lauro., Endocr. Rev. 25:722-746 (2004); Francis-Lang, H., et al., Mol. Cell. Biol. 12:576-588 (1992); Sinclair, A. et al. Eur. J. Biochem. 193:311-318 (1990)), 갑상선 형성(Dathan, N., R. Parlato, A. Rosica, M. De Felice, and R. Di Lauro, Dev. Dyn. 224:450-456 (2002)) 및 이동(migration) (De Felice, M., et al. Nat. Genet. 19:395-398 (1998))을 위해 필수적이고 갑상선 분화를 개시하는 전사 인자 및 보조 인자의 조절 네트워크의 중심에 있다(Parlato, R., et al. Dev. Biol. 276:464-475 (2004)). FoxE1 유전자의 돌연변이는 기타 표현형들 중에서 특히, 갑상선 발육부전(thyroid agenesis)과 연관된 인간 증후군을 유발한다(Castanet, M., et al., Hum Mol Genet 11:2051-9 (2002); Clifton-Bligh, R. J., et al. Nat. Genet. 19:399-401 (1998)). FoxE1은 또한 Tg(thyroglobulin) (Santisteban, P., et al., Mol. Endocrinol. 6:1310-1317 (1992)) 및 TPO(thyroperoxidase) (Aza-Blanc, P., R. Di Lauro, and P. Santisteban. Mol. Endocrinol. 7:1297-1306 (1993)) 유전자와 같은, 갑상선-특이적 유전자의 전사의 호르몬 조절을 위해 필수적이기 때문에, 갑상선 분화 상태의 유지를 위해 필요하다. TPO 유전자 발현은 또한 TTF-1 (Nkx2.1), Pax8, 및 핵 인자 1(nuclear factor 1, NF-1)에 의해 조절된다. 이 인자들 중에서, FoxE1은 갑상선-자극 호르몬(TSH) 및 인슐린-유사 인자 1(IGF-1)에 대한 TPO 반응의 주요한 매개체이다 (Aza-Blanc, P., R. Di Lauro, and P. Santisteban. Mol. Endocrinol. 7:1297-1306 (1993)). FoxE1의 결합, 및 그의 DNA 결합 및 전사 활성이 TSH 및 IGF-1에 의해 활성화되고, FoxE1 DNA 결합 부위는 갑상선 유전자의 특이적 발현을 조절하는 호르몬 반응 요소(hormone response element)를 구성한다(Ortiz, L., et al. J. Biol. Chem. 272:23334-23339 (1997)). FOXE1은 또한, Tg(thyroglobulin) 및 TPO(thyroperoxidase) 유전자와 같은, 갑상선-특이적 유전자의 전사 조절에서의 관여에 기반하여, 갑상선의 분화 상태의 유지를 위해 필수적이다. Tg가 T3(triiodothyronine)및 T4(thyroxine)의 전구체이고, 그들의 합성이 TPO에 의해 촉매되기 때문에, 이 두 유전자 모두의 조절된 발현은 갑상선 호르몬인 T3와 T4의 합성을 위해 중요하다. 주요한 조절자로 작용하는 갑상선 자극 호르몬(TSH)이 갑상선 호르몬 합성 및 분비 조절의 중심이다.
본 발명자들은 또한 rs965513이 혈청 중 TSH, 유리 T4 및 유리 T3의 수준과 연관된다는 것을 발견하여, 염색체 9q22 영역의 마커와 갑상선암 및 갑상선암-관련 생물학적 활성과 연관된다는 것을 더 확인하였다.
마커 및 일배체형의 평가
집단 내에서 게놈 서열은 개체들이 비교될 때 동일하지 않다. 오히려, 게놈은 게놈 상의 다수의 위치에서 개체들 간에 서열 변이성(sequence variability)을 보인다. 그와 같은 서열 상의 변이는 일반적으로 다형성(polymorphism)으로 지칭되며, 각 게놈 내에 다수의 그와 같은 부위들이 있다. 예를 들면, 인간 게놈은 평균적으로 500 bp마다 나타나는 서열 변이를 보인다. 가장 일반적인 서열 변이는 게놈 내의 단일 염기 위치에서의 염기의 변화로 구성되고, 그와 같은 서열 변이, 또는 다형성은 일반적으로 단일 뉴클레오티드 다형성("SNP")으로 지칭된다. 이 SNP들은 단일 돌연변이 사건에서 일어난 것으로 사료되며, 따라서, 통상적으로 각 SNP 부위에 두 개의 가능한 대립인자들이 있다; 본래의 대립인자와 돌연변이된(대안적인) 대립인자. 자연적인 유전적 부동(genetic drift) 및 또한 가능한 선택적 압력 때문에, 본래의 돌연변이가 주어진 집단에서 그의 대립인자의 특정한 빈도를 특징으로 하는 다형성을 초래했다. 미니새틀라이트, 마이크로새틀라이트, 및 삽입, 결실, 역전을 포함한, 다수의 다른 종류의 서열 변이(카피 수 변화(CNV)로도 지칭됨)가 인간 게놈 내에서 발견된다. 다형성 마이크로새틀라이트는 특정한 부위에 복수 개의 짧은 염기 반복체(small repeat of bases)(예를 들면, CA 반복체, 상보성 가닥 상의 TG)를 가지며, 전체 집단에서 반복체 길이의 수가 변화한다. 일반적인 용어로, 다형성 부위에 대한 서열의 각 버전은 상기 다형성 부위의 특정한 대립인자를 나타낸다. 모든 서열 변이들은 해당 서열 변이의 특징적인, 특정한 다형성 부위에서 일어나는, 다형성으로 지칭될 수 있다. 일반적으로, 다형성은 임의의 수의 특정한 대립인자를 포함할 수 있다. 따라서, 본 발명의 일 구체예에서, 다형성은 임의의 주어진 집단에서 둘 이상의 대립인자의 존재를 특징으로 한다. 또 다른 구체예에서, 다형성은 세개 이상의 대립인자의 존재를 특징으로 한다. 다른 구체예에서, 다형성은 4개 이상의 대립인자, 5개 이상의 대립인자, 6개 이상의 대립인자, 7개 이상의 대립인자, 9개 이상의 대립인자 또는 10개 이상의 대립인자의 존재를 특징으로 한다. 모든 그와 같은 다형성은 본 발명의 방법 및 키트에서 이용될 수 있고, 따라서, 본 발명의 범위 내에 속한다.
그들의 존재도(abundance) 때문에, SNP는 인간 게놈 중의 대부분의 서열 변이를 설명한다. 6백만 개 이상의 SNP가 현재까지 검증되었다(http://www.ncbi.nlm.nih.gov/projects/SNP/snp_summary.cgi). 그러나, CNV에 대한 관심이 증가되고 있다. 이 대규모 다형성(통상적으로 1 kb 이상)은 집합된 인간 게놈의 상당한 부분에 영향을 미치는 다형성을 설명한다; 공지된 CNV가 인간 게놈 서열의 15% 이상을 차지한다(Estivill, X Armengol; L., PloS Genetics 3:1787-99 (2007). A http://projects.tcag.ca/variation/). 그러나, 이 다형성의 대부분은 매우 드물며, 평균적으로 각 개체의 게놈 서열의 일부에만 영향을 미친다. CNV는 유전자 량(gene dosage)을 붕괴시키는 것에 의해 유전자 발현, 표현형 변이 및 적응(adaptation)에 영향을 미치는 것으로 알려져 있고, 또한, 질병(미세결실(microdeletion) 증후군 및 미세중복(microduplication) 증후군)을 유발하고 HIV-1 감염 및 사구체신염을 포함한, 일반적인 복합 질환(common complex disease)의 위험도를 부여하는 것으로 알려져 있다(Redon, R., et al. Nature 23:444-454 (2006)). 따라서, 이전에 개시되거나 또는 알려지지 않았던 CNV가 본 명세서에 갑상선암과 연관된 것으로 기재된 마커들과 연관 불균형인 원인적 변이(causative variant)를 나타내는 것이 가능하다. CNV를 검출하는 방법은 CGH(comparative genomic hybridization) 및 Carter (Nature Genetics 39:S16-S21 (2007))에 의해 기재된 바와 같은, 유전형분석 어레이의 이용을 포함한 유전형분석(genotyping)을 포함한다. 게놈 변이 데이터베이스(Database of Genomic Variants) (http://projects.tcag.ca/variation/)는 개시된 CNV의 위치, 종류 및 크기에 대한 업데이트된 정보를 포함한다. 상기 데이터베이스는 현재 15,000개 이상의 CNV에 대한 데이터를 포함한다.
일부 경우에, 기준 대립인자(reference allele)를 선택하지 않고, 다형성 부위에서 상이한 대립인자를 지칭할 수 있다. 대안적으로, 특정한 다형성 부위에 대해 기준 서열이 지칭될 수 있다. 기준 대립인자는 종종 "야생형(wild-type)" 대립인자로 지칭되고, 이는 통상적으로 최초의 서열결정된(first sequenced) 대립인자 또는 "영향받지 않은(non-affected)" 개체(예를 들면, 성향(trait)이나 질병 표현형을 보이지 않는 개체)로부터의 대립인자로 선택된다.
본 명세서에서 지칭되는 SNP 마커에 대한 대립인자는 다형성 부위에서 그들이 나타나는 경우, 염기 A, C, G 또는 T로 지칭된다. 본 명세서에서 이용된 SNP에 대한 대립인자 코드는 하기와 같다: 1 = A, 2 = C, 3 = G, 4 = T. 그러나, 본 발명이 속하는 기술 분야의 당업자는 반대쪽 DNA 가닥을 분석하거나 또는 판독하는 것에 의해, 각 경우에 상보적 대립인자가 측정될 수 있다는 것을 인식할 것이다. 따라서, A/G 다형성을 특징으로 하는 다형성 부위(다형성 마커)에 대해, 마커를 검출하기 위해 이용되는 방법은 가능한 두 염기, 즉, A 및 G 중 하나 또는 양자 모두를 검출하도록 설계될 수 있다. 대안적으로, DNA 주형 상의 상보적 가닥을 검출하도록 분석법을 설계하는 것에 의해, 상보적 염기 T 및 C의 존재가 측정될 수 있다. 정량적으로(예를 들면, 상대적 위험도의 측면에서), 동일한 결과가 각 DNA 가닥(+ 가닥 또는 - 가닥)의 측정으로부터 수득될 것이다.
일반적으로, 특정한 서열에 대해 기준 서열이 지정된다. 기준과 상이한 대립인자는 종종 "변이(variant)" 대립인자로 지칭된다. 본 명세서에서 사용된, 변이 서열(variant sequence)은 기준 서열과 상이하나, 그 외에는 실질적으로 유사한 서열을 의미한다. 본 명세서에 기재된 다형성 유전적 마커의 대립인자는 변이(variant)이다. 변이들은 폴리펩티드에 영향을 미치는 변화들을 포함할 수 있다. 기준 뉴클레오티드 서열과 비교한 경우, 서열 차이는 프레임 쉬프트(frame shift)를 초래하는, 단일 뉴클레오티드의 삽입 또는 결실, 하나보다 많은 수의 뉴클레오티드의 삽입 또는 결실; 코딩된 아미노산의 변화를 초래하는, 하나 이상의 뉴클레오티드의 변화; 조기 종료 코돈(premature stop codon)의 생성을 초래하는, 하나 이상의 뉴클레오티드의 변화; 뉴클레오티드에 의해 코딩된, 하나 이상의 아미노산의 결실을 초래하는, 수개의 뉴클레오티드의 결실; 해독 프레임(reading frame)의 코딩 서열의 중단(interruption)을 초래하는, 불균등 재조합(unequal recombination) 또는 유전자 전환(gene conversion)과 같은, 하나 또는 수개의 뉴클레오티드의 삽입; 전체 서열 또는 일부 서열의 중복; 전위; 또는 뉴클레오티드 서열의 재배열을 포함할 수 있다. 그와 같은 서열 변화는 핵산에 의해 코딩된 폴리펩티드를 변화시킬 수 있다. 예를 들면, 핵산 서열의 변화가 프레임 쉬프트를 유발하는 경우, 프레임 쉬프트는 코딩된 아미노산의 변화를 초래할 수 있고, 및/또는 조기 종료 코돈의 생성을 초래하여, 절단된(truncated) 폴리펩티드의 생성을 유발할 수 있다. 대안적으로, 다형성은 하나 또는 그 이상의 뉴클레오티드의 동의적 변화(synonymous change)(즉, 아미노산 서열의 변화를 초래하지 않는 변화)일 수 있다. 그와 같은 다형성은 예를 들면, 스플라이싱 부위(splice site)를 변화시키고, mRNA의 안정성 또는 수송에 영향을 미치거나 또는 코딩된 폴리펩티드의 전사 또는 번역에 영향을 미칠 수 있다. 다형성은 또한 증폭 또는 결실과 같은 구조적 변화가 체세포 수준(somatic level)에서 일어날 가능성을 증가시키도록 DNA를 변화시킬 수 있다. 기준 뉴클레오티드 서열에 의해 코딩된 폴리펩티드는 특정한 기준 아미노산 서열을 갖는 "기준(reference)" 폴리펩티드이고, 변이 대립인자에 의해 코딩된 폴리펩티드는 변이 아미노산 서열을 갖는 "변이(variant)" 폴리펩티드로 지칭된다.
일배체형은 세그먼트를 따라 배열된 대립인자의 특정한 조합을 특징으로 하는 DNA의 세그먼트를 의미한다. 인간과 같은 이배체 개체의 경우, 일배체형은 각 다형성 마커 또는 유전자 좌에 대한 1쌍의 대립인자 중 하나의 대립인자를 포함한다. 특정한 구체예에서, 일배체형은 두개 이상의 대립인자, 세개 이상의 대립인자, 네개 이상의 대립인자, 또는 다섯개 이상의 대립인자를 포함할 수 있고, 각 대립인자는 세그먼트 상의 특정한 다형성 마커에 대응된다. 일배체형은 다양한 다형성 마커의 조합, 예를 들면, 다형성 부위에 특정한 대립인자를 갖는 SNP와 마이크로새틀라이트의 조합을 포함할 수 있다. 따라서, 일배체형은 다양한 유전적 마커에서 대립인자의 조합을 포함한다.
특정한 다형성 마커 및/또는 일배체형의 검출은 본 발명이 속하는 기술 분야에서 공지된, 다형성 부위에서 서열을 검출하는 방법에 의해 달성될 수 있다. 예를 들면, PCR, LCR, 이중 PCR(nested PCR) 및 핵산 증폭을 위한 기타 기법을 이용한, 형광-기반 기법(예를 들면, Chen, X. et al., Genome Res. 9(5): 492-98 (1999); Kutyavin et al., Nucleic Acid Res. 34: e128 (2006)))과 같은, SNP 및/또는 마이크로새틀라이트 마커의 존재에 대한 유전형분석을 위한 표준 기법이 이용될 수 있다. SNP 유전형분석을 위해 이용할 수 있는 특정한 방법들은 TaqMan 유전형 분석법(genotyping assay) 및 SNPlex 플랫폼(Applied Biosystems), 겔 전기영동(Applied Biosystems), 질량 분석법(예를 들면, Sequenom의 MassARRAY 시스템), 미니-시퀀싱(mini-sequencing) 방법, 실시간 PCR, Bio-Plex 시스템(BioRad), CEQ and SNPstream 시스템(Beckman), 어레이 혼성화 기술(예를 들면, Affymetrix GeneChip), BeadArray Technologies(예를 들면, Illumina GoldenGate 및 Infinium 분석법), 어레이 택(array tag) 기술(예를 들면, Parallele) 및 엔도뉴클레아제-기반 형광 혼성화 기술(Invader; Third Wave)를 포함하나, 이에 한정되지 않는다. Affymetrix SNP Array 6.0 및 Illumina CNV370-Duo 및 1M BeadChips를 포함한 이용가능한 어레이 플랫폼 중 일부는 특정 CNV를 태깅하는 SNP를 포함한다. 이는 이 플랫폼에 포함된 대리(surrogate) SNP를 통한 CNV의 검출을 가능하게 한다. 따라서, 상기 방법들 또는 본 발명이 속하는 기술분야의 당업자에게 이용가능한 다른 방법에 의해, 마이크로새틀라이트, SNP 또는 다른 종류의 다형성 마커를 포함한, 다형성 마커에서의 하나 이상의 대립인자가 확인될 수 있다.
본 방법에서, 질병에 대한 증가된 감수성(즉, 증가된 위험도)을 갖는 개체는 질병에 대해 증가된 감수성(증가된 위험도)을 부여하는 하나 이상의 다형성 마커의 하나 이상의 대립인자 또는 일배체형(즉, 위험 마커 대립인자 또는 일배체형)이 확인된 개체이다. 상기 위험 마커 또는 일배체형은 질병의 증가된 위험도(증가된 감수성)를 부여하는 마커 또는 일배체형이다. 일 구체예에서, 마커 또는 일배체형과 연관된 유의성은 상대적 위험도(relative risk, RR)에 의해 측정된다. 또 다른 구체예에서, 마커 또는 일배체형과 연관된 유의성은 오즈비(odds ratio, OR)에 의해 측정된다. 또 다른 구체예에서, 유의성은 백분율로 측정된다. 일 구체예에서, 유의성 있는 증가된 위험도는 1.2 이상, 1.3 이상, 1.4 이상, 1.5 이상, 1.6 이상, 1.7 이상, 1.8 이상, 1.9 이상, 2.0 이상, 2.5 이상, 3.0 이상, 4.0 이상, 및 5.0 이상을 포함하나, 이에 한정되지 않는, 1.2 이상의 위험도(상대적 위험도 및/또는 오즈비)로 측정된다. 특정한 구체예에서, 1.2 이상의 위험도(상대적 위험도 및/또는 오즈비)는 유의성이 있다. 또 다른 특정한 구체예에서, 1.3 이상의 위험도는 유의성이 있다. 또 다른 구체예에서, 1.4 이상의 위험도는 유의성이 있다. 또 다른 구체예에서, 1.5 이상의 위험도는 유의성이 있다. 또 다른 추가적인 구체예에서, 1.7 이상의 위험도는 유의성이 있다. 그러나, 다른 컷오프, 예를 들면, 1.15, 1.25, 1.35 이상 등이 고려되며, 그와 같은 컷오프도 또한 본 발명의 범위 내에 속한다. 다른 구체예에서, 위험도의 유의성 있는 증가는 약 25%, 약 30%, 약 35%, 약 40%, 약 45%, 약 50%, 약 55%, 약 60%, 약 65%, 약 70%, 약 75%, 약 80%, 약 85%, 약 90%, 약 95%, 및 약 100%, 약 150%, 약 200%, 약 300%, 및 약 500%를 포함하나, 이에 한정되지 않는, 약 20% 이상이다. 하나의 특정한 구체예에서, 위험도의 유의성 있는 증가는 20% 이상이다. 다른 구체예에서, 위험도의 유의성 있는 증가는 30% 이상, 40% 이상, 50% 이상, 60% 이상, 70% 이상, 80% 이상, 90% 이상 및 100% 이상이다. 그러나, 본 발명이 속하는 기술 분야의 당업자에 의해 본 발명의 특징으로 적합한 것으로 간주되는 다른 컷오프 또는 범위도 고려되고, 그들도 본 발명의 범위 내에 속한다. 특정한 구체예에서, 위험도의 유의성 있는 증가는 0.05 미만, 0.01 미만, 0.001 미만, 0.0001 미만, 0.00001 미만, 0.000001 미만, 0.0000001 미만, 0.00000001 미만, 또는 0.000000001 미만의 p-값과 같은 p-값을 특징으로 한다.
본 명세서에 기재된 위험 다형성 마커 또는 일배체형은 하나 이상의 마커의 하나 이상의 대립인자 또는 일배체형이 비교군(대조군)에서의 존재의 빈도 대비 질병에 대한 위험도를 갖거나 상기 질병 또는 성향으로 진단된 개체(질병군(affected))에 보다 빈번하게 존재하여, 상기 마커 또는 일배체형의 존재가 상기 질병에 대한 감수성을 나타내는 것인 마커 또는 일배체형이다. 일 구체예에서, 대조군은 집단 표본(population sample), 즉, 일반적인 집단으로부터의 랜덤 표본일 수 있다. 또 다른 구체예에서, 대조군은 질병에 걸리지 않은 개인의 군으로 대표된다. 일 구체예에서, 그와 같은, 질병-불포함(disease-free) 대조군은 하나 이상의 특정한 질병-연관 증상의 부재를 특징으로 할 수 있다. 대안적으로, 질병-불포함 대조군은 해당 질병으로 진단되지 않은 개인들일 수 있다. 또 다른 구체예에서, 상기 질병-불포함 대조군은 하나 이상의 질병-특이적 위험 인자의 부재를 특징으로 한다. 일 구체예에서, 그와 같은 위험 인자는 하나 이상의 환경적 위험 인자이다. 대표적인 환경적 인자들은 특정한 질병 또는 성향을 발현할 위험도에 영향을 미치는 것으로 알려지거나, 상기 위험도에 영향을 미치는 것으로 고려되는 천연 산물, 미네랄, 또는 기타 화학물질이다. 기타 환경적 위험 인자들은 식음습관(food and drink habit), 주요 거주지의 지리적 위치 및 직업적 위험 인자를 포함하나, 이에 한정되지 않는, 생활방식(lifestyle)과 관련된 위험 인자들이다. 또 다른 구체예에서, 위험 인자는 하나 이상의 추가적인 유전적 위험 인자를 포함한다.
상관관계에 대한 간단한 검정의 예로서 2 x 2 표(two by two table) 상에서의 Fisher-exact 검정이 있다. 염색체의 코호트가 주어지면, 마커 및 일배체형을 모두 포함하는 염색체, 마커 또는 일배체형을 중 하나를 포함하고, 나머지 하나는 포함하지 않는 염색체 및 마커나 일배체형 중 어느 것도 포함하지 않는 염색체의 갯수로부터 2 x 2 표가 작성된다. 본 발명이 속하는 기술 분야의 당업자에게 공지된 연관의 다른 통계적 검정도 본 발명의 범위 내에 속한다.
본 발명의 다른 구체예에서, 질병 또는 성향에 대한 감소된 감수성(즉, 감소된 위험도)을 갖는 개체는 상기 질병 또는 성향에 대한 감소된 감수성을 부여하는 하나 이상의 다형성 마커의 하나 이상의 특정한 대립인자 또는 일배체형이 확인된 개체이다. 감소된 위험도를 부여하는 마커 대립인자 및/또는 일배체형은 또한 보호성(protective)인 것으로 표현된다. 일 양태에서, 보호성 마커 또는 일배체형은 질병 또는 성향의 유의성 있는 감소된 위험도(또는 감수성)를 부여하는 마커 또는 일배체형이다. 일 구체예에서, 유의성 있는 감소된 위험도는 0.9 미만, 0.8 미만, 0.7 미만, 0.6 미만, 0.5 미만, 0.4 미만, 0.3 미만, 0.2 미만 및 0.1 미만을 포함하나, 이에 한정되지 않는, 0.9 미만의 상대적 위험도로 측정된다. 하나의 특정한 구체예에서, 유의성 있는 감소된 위험도는 0.7 미만이다. 또 다른 구체예에서, 유의성 있는 감소된 위험도는 0.5 미만이다. 또 다른 구체예에서, 유의성 있는 감소된 위험도는 0.3 미만이다. 또 다른 구체예에서, 위험도(또는 감수성)의 감소는 25% 이상, 30% 이상, 35% 이상, 40% 이상, 45% 이상, 50% 이상, 55% 이상, 60% 이상, 65% 이상, 70% 이상, 80% 이상, 85% 이상, 90% 이상, 95% 이상 및 98% 이상을 포함하나, 이에 한정되지 않는, 20% 이상이다. 하나의 특정한 구체예에서, 위험도의 유의성 있는 감소는 약 30% 이상이다. 또 다른 구체예에서, 위험도의 유의성 있는 감소는 약 50% 이상이다. 또 다른 구체예에서, 위험도의 유의성 있는 감소는 약 70% 이상이다. 그러나, 본 발명이 속하는 기술 분야의 당업자에 의해 본 발명의 특징으로 적합한 것으로 간주되는 다른 컷오프 또는 범위도 고려되고, 그들도 본 발명의 범위 내에 속한다.
본 발명이 속하는 기술 분야의 당업자는 연구된 집단에 존재하는 두개의 대립인자를 갖는 마커(예를 들면, SNP)에 대해, 하나의 대립인자가 상기 집단 내에서 성향 또는 질병을 갖는 개인의 그룹에서 대조군 대비 증가된 빈도로 발견되는 경우, 상기 마커의 나머지 다른 대립인자는 상기 성향 또는 질병을 갖는 개인의 그룹에서 대조군 대비 감소된 빈도로 발견될 것으로 이해할 것이다. 그와 같은 경우에, 상기 마커의 하나의 대립인자(상기 성향 또는 질병을 갖는 개인에서 증가된 빈도로 발견되는 대립인자)는 위험 대립인자(at-risk allele)이고, 나머지 다른 대립인자는 보호성 대립인자(protective allele)일 것이다.
질병 또는 성향(예를 들면, 갑상선암)과 연관된 유전적 변이가 단독으로 주어진 유전형에 대해 질병의 위험도를 예측하기 위해 이용될 수 있다. SNP와 같은 이대립인자 마커(biallelic marker)의 경우, 3개의 가능한 유전형이 있다: 위험 변이에 대한 동형접합체, 이형접합체(heterozygote), 및 상기 위험 변이의 비-보인자(non-carrier). 복수의 유전자 좌에서의 변이와 연관된 위험도가 전체 위험도를 추정하기 위해 이용될 수 있다. 복수 개의 SNP 변이에 대해, k = 3n x 2p 개의 가능한 유전형이 있고; 상기에서 n은 상염색체 유전자좌(autosomal loci)의 갯수이고 p는 성염색체 유전자좌의 갯수이다. 복수 개의 위험 변이에 대한 전체 위험도 평가 계산은 통상적으로 상이한 유전적 변이의 상대적 위험도가 곱해진다는 것, 즉, 특정한 유전형 조합과 연관된 전체 위험도(예를 들면, RR 또는 OR)가 각 유전자좌의 유전자형에 대한 위험도 값의 곱이라는 것을 가정한다. 제시된 위험도가 일치된(matched) 성별 및 민족을 갖는 기준 집단 대비 개인, 또는 개인에 대한 특정한 유전형에 대한 상대적 위험도인 경우, 통합 위험도(combined risk)는 유전자좌-특이적 위험도 값의 곱이고, 이는 또한 집단 대비 전체 위험도 추정치에 해당한다. 개인에 대한 위험도가 위험 대립인자의 비-보인자에 대한 비교에 근거하는 경우, 통합 위험도는 모든 유전자좌의 유전형의 주어진 조합을 갖는 개인을 상기 유전자좌들에서 위험 변이를 보유하지 않는 개인들의 군에 비교하는 추정치에 해당한다. 위험 변이의 비-보인자들의 그룹은 가장 낮은 추정된 위험도를 가지며 그 자체(즉, 비-보인자)와 비교하여 1.0의 통합 위험도를 가지나, 집단 대비, 1.0 미만의 전체 위험도를 갖는다. 비-보인자 그룹은 잠재적으로 매우 작을 수 있고, 특히, 다수의 유전자좌에 대해 매우 작을 수 있으며, 그 경우, 그의 관련성은 그만큼 작다는 것에 주목해야 한다.
승법 모델(multiplicative model)은 일반적으로 복합 성향(complex trait)의 데이터에 합리적으로 잘 맞는 간명(parsimonious) 모델이다. 승법성(multiplicity)으로부터의 편향은 일반적인 질환에 대한 일반적인 변이에서는 드물게 설명되었으며, 보고된 경우에도, 제안적인 것에 불과하며, 이는 유전자좌 간의 통계적 상호작용을 입증할 수 있기 위해서는 매우 큰 표본 크기가 통상적으로 요구되기 때문이다.
예로서, 케이스가 갑상선암과 연관된 총 8개의 변이를 가졌다는 것을 고려한다(Gudmundsson, J., et al., Nat Genet 39:631-7 (2007), Gudmundsson, J., et al., Nat Genet 39:977-83 (2007); Yeager, M., et al, Nat Genet 39:645-49 (2007), Amundadottir, L., el al., Nat Genet 38:652-8 (2006); Haiman, C.A., et al., Nat Genet 39:638-44 (2007)). 이 유전자좌들 중 7개는 상염색체 상에 존재하고, 나머지 유전자좌는 염색체 X에 존재한다. 이때, 이론적인 유전형 조합의 총수는 37 x 21 = 4373이다. 그 유전형 분류(genotypic class) 중 일부는 매우 드무나, 여전히 가능하고, 전체 위험도 평가를 위해 고려되어야 한다. 복수 개의 유전적 변이의 경우에 적용된 승법 모델은 상기 유전적 변이가 "환경적(environmental)" 인자와 명확하게 상관되지 않는다는 것을 가정할 때 비-유전적 위험 변이와의 결합(conjugation)에서 유효할 것으로 보인다. 다시 말하면, 비-유전적 위험 인자와 유전적 위험 인자가 상호작용하지 않는다는 것을 가정할 때, 유전적 변이와 비-유전적 변이는 통합 위험도를 추정하기 위해 승법 모델 하에 평가될 수 있다.
동일한 정량적 접근방법을 이용하여, rs965513 (서열번호 1), rs907580 (서열번호 2) 및 rs7024345 (서열번호 3), 또는 이들과 연관 불균형인 마커들 중 하나의 조합을 포함한, 갑상선암과 연관된 복수 개의 변이와 관련된 통합 위험도 또는 전체 위험도가 평가될 수 있다.
연관 불균형(Linkage Disequilibrium)
각 감수분열 사건 동안 각 염색체 쌍에 대해 평균 1회 일어나는, 재조합의 자연적인 현상은 자연이 서열(및 결과적으로 생물학적 기능)에 변화를 제공하는 한가지 방법이다. 재조합은 게놈에서 랜덤하게 일어나지 않는 것으로 발견되었다; 오히려, 재조합율의 빈도에 큰 변화가 있어서, 높은 재조합 빈도를 갖는 작은 영역(따라서, 재조합 핫스팟(recombination hotspot)으로 불림) 및 일반적으로 연관 불균형(LD) 블럭이라 불리는, 낮은 재조합 빈도의 보다 넓은 영역을 생성한다(Myers, S. et al., Biochem Soc Trans 34:526-530 (2006); Jeffreys, A.J., et al.,Nature Genet 29:217-222 (2001); May, C.A., et al., Nature Genet 31:272-275(2002)).
연관 불균형(Linkage Disequilibrium, LD)은 두 개의 유전적 요소의 비-랜덤 조합(non-random assortment)을 의미한다. 예를 들면, 특정한 유전적 요소(예를 들면, 다형성 마커의 대립인자(allele), 또는 일배체형)가 0.50(50%)의 빈도로 집단에서 일어나고, 또 다른 요소가 0.50(50%)의 빈도로 일어나는 경우, 두 요소를 모두 갖는 개인의 예상되는 발생율은 상기 요소들의 랜덤 분포를 가정하면, 0.25(25%)이다. 그러나, 상기 두 요소들이 0.25보다 더 높은 빈도로 함께 나타나는 것으로 발견되는 경우, 상기 요소들은 연관 불균형에 있다고 하며, 이는 그들이 그들의 독립적인 발생의 빈도(예를 들면, 대립인자 또는 일배체형 빈도)가 예측하는 비율보다 더 높은 비율로 함께 유전되는 경향이 있기 때문이다. 개략적으로, LD는 일반적으로 두 요소간의 재조합 사건의 빈도와 상관관계를 갖는다. 집단에서 대립인자 또는 일배체형 빈도는 집단 내의 개체의 유전형을 분석하고 상기 집단에서 각 대립인자 또는 일배체형의 발생 빈도를 결정하는 것에 의해 결정될 수 있다. 이배체(diploid)의 집단, 예를 들면, 인간 집단의 경우, 개인들은 일반적으로 각 유전적 요소(예를 들면, 마커, 일배체형 또는 유전자)에 대해 두 개의 대립인자 또는 대립인자 조합을 가질 것이다.
다수의 상이한 척도들이 연관 불균형(LD; Develin, B & Risch, N., Genomics 29:311-22(1995)))의 강도를 평가하기 위해 제안되었다. 대부분은 이대립인자(biallelic) 부위의 쌍 간의 연관의 강도를 획득한다. LD의 두 개의 중요한 쌍대 척도(pairwise measures)는 r2 (△2으로 표시되기도 함) 및 |D'|이다(Lewontin, R., Genetics 49: 49-67 (1964); Hill, W.G. & Robertson, A. Thor. Appl. Genet. 22:226-231(1968)). 두 척도는 모두 0(불균형 없음) 내지 1('완전한' 불균형)의 범위이나, 그들의 해석은 약간 다르다. |D'|는 가능한 일배체형 중 2개 또는 3개만 존재하는 경우, 그 값이 1이고, 모든 4개의 가능한 일배체형이 존재하는 경우는 그 값이 1보다 작은 것으로 정의된다. 따라서, 1보다 작은 |D'|의 값은 두 부위 간에 과거에 재조합이 일어났을 수도 있다는 것을 나타낸다(재발성 돌연변이(recurrent mutation)는 |D'|가 1보다 작게할 수 있으나, 단일 뉴클레오티드 다형성(SNP)의 경우, 이는 통상적으로 재조합보다 가능성이 낮은 것으로 간주됨). 척도 r2은 두 부위간의 통계적 상관성을 나타내고, 두 개의 일배체형만 존재하는 경우 1의 값을 취한다.
r2과, 감수성 유전자 좌와 SNP 간의 연관성을 검출하기 위해 요구되는 표본 크기 간에 단순한 반비례 관계(inverse relationship)가 있기 때문에, r2 측정값은 이론의 여지는 있지만 연관 맵핑(association mapping)에 대한 가장 적합한 척도이다. 이 척도는 부위의 쌍에 대해 정의되나, 일부 적용의 경우, 다수의 다형성 부위를 포함하는 전체 영역에서 LD가 얼마나 강한지를 결정하는 것이 바람직할 수 있다(예를 들면, LD의 강도가 유전자 좌들 간에 또는 집단 전체에 있어서 유의성 있게 상이한지 여부, 또는 하나의 영역에서 특정한 모델 하에서 예측된 것보다 더 크거나 또는 더 작은 LD가 존재하는지 여부). 영역 전체에 걸친 LD의 측정은 간단하지 않으나, 한 가지 방법은 집단 유전학에서 개발된, 척도 r을 이용하는 것이다. 개략적으로 말하면, r은 데이터에서 확인되는 LD를 생성하기 위해, 특정한 집단 모델 하에서 어느 정도의 재조합이 요구되는지를 측정한다. 이 종류의 방법은 또한 잠재적으로 LD 데이터가 재조합 핫스팟의 존재에 대한 증거를 제공하는지 여부를 결정하는 문제에 대한 통계적으로 엄격한 방식을 제공할 수 있다. 본 명세서에 기재된 방법의 경우, 유의성 있는 r2 값은 0.1 이상, 예를 들면, 0.1 이상, 0.15 이상, 0.2 이상, 0.25 이상, 0.3 이상, 0.35 이상, 0.4 이상, 0.45 이상, 0.5 이상, 0.55 이상, 0.6 이상, 0.65 이상, 0.7 이상, 0.75 이상, 0.8 이상, 0.85 이상, 0.9 이상, 0.91 이상, 0.92 이상, 0.93 이상, 0.94 이상, 0.95 이상, 0.96 이상, 0.97 이상, 0.98 이상, 또는 0.99 이상일 수 있다. 하나의 바람직한 구체예에서, 유의성 있는 r2 값은 0.2 이상일 수 있다. 대안적으로, 연관 불균형인 마커들은 0.3 이상, 0.4 이상, 0.5 이상, 0.6 이상, 0.7 이상, 0.8 이상, 0.85 이상, 0.9 이상, 0.95 이상, 0.96 이상, 0.97 이상, 0.98 이상, 0.99 이상과 같은, 0.2 이상의 |D'| 값을 특징으로 한다. 따라서, 연관 불균형은 별개의 마커들의 대립인자 간의 상관관계를 나타낸다. 연관 불균형은 상관 계수 또는 |D'|에 의해 측정된다 (1.0 이하의 r2 및 1.0 이하의 |D'|).특정한 구체예에서, 연관 불균형은 r2 및 |D'| 척도 모두에 대한 값으로 정의된다. 하나의 그와 같은 구체예에서, 유의성 있는 연관 불균형은 r2 > 0.1 및 |D'| >0.8로 정의된다. 또 다른 구체예에서, 유의성 있는 연관 불균형은 r2 > 0.2 및 |D'| >0.9로 정의된다. 연관 불균형을 결정하기 위한 r2 및 |D'|의 값의 다른 조합과 치환(permutation)도 고려되고, 또한 본 발명의 범위 내에 속한다. 연관 불균형은 본 명세서에서 정의된 바와 같이, 하나의 인간 집단에서 결정될 수 있거나, 또는 하나보다 많은 인간 집단으로부터의 개인들을 포함하는 표본의 집합(collection)에서 결정될 수 있다. 본 발명의 일 구체예에서, LD는 정의된 바와 같은(http://www.hapmap.org), 하나 이상의 HapMap 집단(코카서스인, 아프리카인, 일본인, 중국인)으로부터의 표본에서 결정된다. 하나의 그와 같은 구체예에서, LD는 HapMap 표본의 CEU 집단(Utah residents with ancestry from northern and western Europe)에서 결정된다. 또 다른 구체예에서, LD는 HapMap 표본의 YRI 집단에서 결정된다. 또 다른 구체예에서, LD는 아이슬란드 집단으로부터의 표본에서 결정된다.
게놈의 모든 다형성이 집단 수준에서 독립적이면(즉, LD가 없음), 모든 상이한 다형성 상태를 평가하기 위해, 모든 단일 다형성이 연관(association) 연구에서 조사되어야 할 것이다. 그러나, 다형성 간의 연관 불균형 때문에, 긴밀하게 연관된 다형성들이 강한 상관관계를 가지며, 이는 유의성 있는 연관을 관찰하기 위해 연관 연구에서 조사되어야 하는 다형성의 갯수를 감소시킨다. LD의 또 다른 결과는 이 다형성들이 강한 상관관계를 갖는다는 사실 때문에, 다수의 다형성들이 연관 신호(association signal)를 생성할 수 있다는 것이다.
게놈 LD 맵이 게놈 전체에 대해 생성되었고, 그와 같은 LD 맵이 질병-유전자를 맵핑하기 위한 프레임워크로 작용하는 것으로 제안되었다(Risch, N. & Merkiangas, K, Science 273:1516-1517 (1996); Maniatis, N., et al., Proc Natl Acad Sci USA 99:2228-2233 (2002); Reich, DE et al, Nature 411:199-204 (2001)).
현재, 인간 게놈의 많은 부분들이 수개의 공통된 일배체형을 포함하는 일련의 별개의 일배체형 블럭들로 분류될 수 있다는 것이 확립되었다; 이 블럭들의 경우, 연관 불균형 데이터는 재조합을 나타내는 증거를 거의 제공하지 않는다(예를 들면, Wall., J.D. and Pritchard, J.K., Nature Reviews Genetics 4:587-597 (2003); Daly, M. et al., Nature Genet. 29:229-232 (2001); Gabriel, S.B. et al., Science 296:2225-2229 (2002); Patil, N. et al., Science 294:1719-1723 (2001); Dawson, E. et al., Nature 418:544-548 (2002); Phillips, M.S. et al., Nature Genet. 33:382-387 (2003) 참조).
이와 같은 일배체형 블럭을 정의하는 두 가지 주요한 방법들이 있다: 블럭은 한정된 일배체형 다양성을 갖는 DNA의 영역(예를 들면, Daly, M. et al., Nature Genet. 29:229-232 (2001); Patil, N. et al., Science 294:1719-1723 (2001); Dawson, E. et al., Nature 418:544-548 (2002); Zhang, K. et al., Proc. Natl. Acad. Sci. USA 99:7335-7339 (2002) 참조), 또는, 연관 불균형을 이용하여 확인된, 광범위한 과거의 재조합(extensive historical recombination)을 갖는 이행 구역(transition zone) 간의 영역(예를 들면, Gabriel, S.B. et al., Science 296:2225-2229 (2002); Phillips, M.S. et al., Nature Genet. 33:382-387 (2003); Wang, N. et al., Am. J. Hum. Genet. 71:1227-1234 (2002); Stumpf, M.P., and Goldstein, D.B., Curr. Biol. 13:1-8 (2003) 참조)으로 정의될 수 있다. 보다 최근에, 인간 게놈 전체에 대한 재조합률(recombination rate) 및 상응하는 핫스팟의 상세 맵(fine-scale map)이 작성되었다(Myers, S., et al., Science 310:321-32324 (2005); Myers, S. et al., Biochem Soc Trans 34:526530 (2006)). 상기 맵은 게놈 전체에서 재조합의 엄청난 변이를 보여주며, 재조합률은 핫스팟에서 10-60 cM/Mb로 높았고, 개재 영역(intervening region)에서는 재조합률이 0에 가까워서, 제한적인 일배체형 다양성 및 높은 LD의 영역을 나타낸다. 따라서, 상기 맵은 일배체형 블럭 및/또는 LD 블럭을 재조합 핫스팟에 의해 둘러싸인(flanked) 영역으로 정의하기 위해 이용될 수 있다. 본 명세서에서 사용된, 용어 "일배체형 블럭(haplotype block)" 또는 "LD 블럭"은 전술된 특징들에 의해 정의되는 블럭, 또는 그와 같은 영역을 정의하기 위해 본 발명이 속하는 기술 분야의 당업자에 의해 이용되는 다른 대안적인 방법에 의해 정의되는 블럭을 포함한다.
일배체형 블럭(LD 블럭)이 단일 마커 또는 복수 개의 마커를 포함하는 일배체형을 이용하여, 표현형과 일배체형 상태 간의 연관을 맵핑하기 위해 이용될 수 있다. 주요한 일배체형이 각 일배체형 블럭에서 식별될 수 있고, 그 후 일련의 "태깅(tagging)" SNP 또는 마커(일배체형들을 구별하기 위해 필요한 SNP 또는 마커의 최소 세트)가 식별될 수 있다. 그 후, 이 태깅 SNP 또는 마커는 표현형과 일배체형 간의 연관을 확인하기 위해, 개체들의 그룹으로부터의 표본의 평가에서 이용될 수 있다. 필요한 경우, 일배체형 블럭 간에 연관 불균형이 존재할 수 있기 때문에, 인접 일배체형 블럭이 동시에 평가될 수 있다.
따라서, 게놈에서 다형성 마커에 대한 관찰된 연관에 대해, 게놈 내의 추가적인 마커들이 또한 연관을 보일 수 있다는 것이 명백하다. 이는 재조합률의 큰 변이에서 관찰된 바와 같이, 게놈 전체에서 LD의 불균등한 분포의 당연한 결과이다. 따라서, 연관을 검출하기 위해 이용되는 마커들은 주어진 질병 또는 성향과 연관된 게놈 영역(즉, 일배체형 블럭 또는 LD 블럭)에 대한 "택(tag)"을 나타내고, 따라서, 본 발명의 방법 및 키트에서 사용하기에 유용하다. 하나 이상의 원인이 되는(causative)(기능성) 변이 또는 돌연변이가 상기 질병 또는 성향과 연관된 것으로 확인되는 영역 내에 존재할 수 있다. 기능성 변이는 또 다른 SNP, 연쇄 반복체 다형성(tandem repeat polymorphism)(예를 들면, 미니새틀라이트 또는 마이크로새틀라이트), 전이성 요소(transposable element), 역전, 결실 또는 삽입과 같은 카피수 변화일 수 있다. 본 명세서에 기재된 변이와 LD인 그와 같은 변이는 연관을 검출하기 위해 이용되는 태깅 마커에 대해 관찰되는 것보다 더 높은 상대적 위험도(RR) 또는 오즈비(OR)를 부여할 수 있다. 따라서, 본 발명은 본 명세서에 기재된 바와 같이, 질병과의 연관을 검출하기 위해 이용되는 마커, 및 상기 마커와 연관 불균형인 마커를 포함한다. 따라서, 본 발명의 특정한 구체예에서, 본 명세서에서 기재된, 본 발명의 마커 및/또는 일배체형과 LD인 마커가 대리 마커(surrogate marker)로 이용될 수 있다. 일 구체예에서, 대리 마커는 원래 상기 질병과 연관된 것으로 확인된 마커 또는 일배체형의 경우보다 더 작은 상대적 위험도(RR) 및/또는 오즈비(OR)을 갖는다. 다른 구체예에서, 대리 마커는 상기 질환과 연관된 것으로 초기에 확인된 마커에 대해 초기에 결정된 RR 또는 OR 값보다 큰 RR 또는 OR 값을 갖는다. 그와 같은 구체예의 예는 상기 질병과 연관되는 것으로 초기에 확인된 것 보다 더 일반적인 변이(> 10% 집단 빈도)와 LD인 드물거나, 또는 비교적 드문(< 10% 대립인자의 집단 빈도) 변이일 것이다. 연관을 검출하기 위해 그와 같은 대리 마커들을 식별하고 이용하는 것은 본 발명이 속하는 기술 분야의 당업자에게 잘 알려진 통상적인 방법에 의해 수행될 수 있고, 따라서, 본 발명의 범위에 속한다.
일배체형 빈도의 결정
기대값-최대화 알고리즘(expectation-maximization algorithm)을 이용하여 환자군 및 대조군에서 일배체형의 빈도를 추정할 수 있다(Dempster A. et al., J. R. Stat. Soc. B, 39:1-38 (1977)). 결실된 유전형 및 그 단계(phase)에 따른 불확실성을 처리할 수 있는 이 알고리즘의 구현이 이용될 수 있다. 귀무 가설(null hypothesis) 하에서, 환자와 대조군은 동일한 빈도를 갖는 것으로 가정된다. 우도 방식(likelihood approach)을 이용하여, 본 명세서에 기재된 마커들을 포함할 수 있는, 후보 위험-일배체형이 대조군에서보다 환자에서 보다 높은 빈도를 가지며, 다른 일배체형의 빈도는 양 군에서 동일한 것으로 가정되는 것인 대립 가설(alternate hypothesis)이 테스트된다. 양 가설 하에 우도가 각각 최대화되고, 상응하는 1-df 우도 비 통계값이 통계적 유의성을 평가하기 위해 이용된다.
감수성 영역, 예를 들면, LD 블럭 영역 내에서 위험 마커와 일배체형 및 보호성 마커와 일배체형을 찾기 위해, 상기 영역 내의 유전형 분석된 마커들의 모든 가능한 조합의 연관이 연구된다. 통합된 환자군과 대조군이 원래의 환자군 및 대조군과 동일한 크기인 두개의 세트로 무작위로 분류될 수 있다. 그 후, 마커 및 일배체형 분석이 반복되고, 기록된 가장 유의성 있는 p-값이 결정된다. 이 랜덤화 체계(randomization scheme)는 p-값의 경험적 분포를 구성하기 위해 예를 들면, 100회 이상 반복될 수 있다. 바람직한 구체예에서, 0.05 미만의 p-값은 유의성 있는 마커 및/또는 일배체형 연관을 나타낸다.
일배체형 분석
일배체형 분석의 일반적인 방법은 NEsted MOdels에 적용된 우도-기반 추론(likelihood-based inference)을 이용하는 단계를 포함한다(Gretarsdottir S., et al., Nat. Genet. 35:131-38 (2003)). 상기 방법은 다수의 다형성 마커, SNP 및 마이크로새틀라이트에 대해 이용될 수 있는 프로그램 NEMO에서 구현된다. 상기 방법 및 소프트웨어는 특별히, 상이한 위험도를 부여하는 일배체형 그룹을 식별하는 것을 목적으로 하는 케이스-대조군(case-control) 연구를 위해 설계된다. 상기 방법 및 소프트웨어는 또한 LD 구조를 연구하기 위한 도구이다. NEMO에서, 관찰된 데이터가 이를 결실-데이터(missing-data) 문제로 처리하기 때문에, EM 알고리즘을 이용하여, 최대 우도 추정치, 우도 비(likelihood ratio) 및 p-값이 직접 계산된다.
단계(phase)의 불확실성 및 결실된 유전형에 따른 정보 소실을 반영한, 관찰된 데이터에 대해 직접 계산된 우도에 기반한 우도 비 테스트가 유효한 p-값을 제공하기 위해 이용될 수 있으나, 정보의 불완전성 때문에 소실된 데이터의 양을 아는 것이 여전히 유용할 것이다. 일배체형 분석의 정보 척도(information measure)는 Nicolae and Kong (Technical Report 537, Department of Statistics, University of Statistics, University of Chicago; Biometrics, 60(2):368-75 (2004))에서 연관성 분석(linkage analysis)를 위해 정의된 정보 척도의 당연한 연장(natural extension)으로 설명되며, NEMO에서 구현된다.
질병에 대한 단일 마커 연관을 위해, 각각의 개별적인 대립인자에 대해 양측 p-값(two-sided p-value)을 계산하기 위해 Fisher exact 테스트가 이용될 수 있다. 일반적으로, 모든 p-값은 구체적으로 표시되지 않으면, 다중 비교에 대해 조정되지 않은 상태로 제시된다. (마이크로새틀라이트, SNP 및 일배체형에 대한) 제시된 빈도는 보인자 빈도가 아닌 대립인자 빈도이다. 연구에 가족으로 동원된 환자들의 혈연관계(relatedness)에 의한 편향을 최소화하기 위해, 일촌 및 이촌 친척(first and second-degree relatives)이 환자 목록으로부터 제외될 수 있다. 또한, 동기간 관계(sibship)에 대해 이전에 설명된 분산 조정 절차(variance adjustment procedure)를 수행하는 것에 의해(Risch, N. & Teng, J. Genome Res., 8:1273-1288 (1998)), 환자 중 남은 혈연관계에 대해 보정하기 위해 연관 테스트가 반복될 수 있어서, 일반적인 가족 관계에 적용될 수 있고, 비교를 위해 조정 p-값 및 미조정(unadjusted) p-값을 제시할 수 있다. 게놈 대조의 방법(Devlin, B. & Roeder, K. Biometrics 55:997 (1999))은 또한 개인들 간의 혈연관계 및 가능한 계층화(stratification)에 대해 조정하기 위해 이용될 수 있다. 차이는 일반적으로 예상되는 것에 비해 매우 작다. 복수 테스트에 대해 보정된 단일-마커 연관의 유의성을 평가하기 위해, 본 발명자들은 동일한 유전형 데이터를 이용하여 랜덤화(randomization) 테스트를 수행할 수 있다. 환자들과 대조군의 코호트가 랜덤화되고 연관 분석이 복수 회(예를 들면, 500,000회까지) 반복되고, p-값은 본 발명자들이 최초의 환자 및 대조군 코호트를 이용하여 관찰한 p-값보다 더 낮거나 또는 이와 동일한 일부 마커 대립인자에 대한 p-값을 생성하는 재현의 부분(fraction)이다.
단일 마커 분석 및 일배체형 분석에 대해, 승법 모델(multiplicative model)(일배체형 상대적 위험도 모델), 즉, 한 사람이 갖는 두 개의 대립인자/일배체형의 위험도들이 곱해진다는 승법 모델을 가정하여 상대적 위험도(RR) 및 집단 귀속 위험도(population attributable risk, PAR)가 계산될 수 있다(Terwilliger, J.D. & Ott, J., Hum. Hered. 42:337-46 (1992) and Falk, C.T. & Rubinstein, P, Ann. Hum. Genet. 51 (Pt 3):227-33 (1987)). 예를 들면, RR이 a 대비 A의 위험도라면, 동형접합체 AA를 갖는 사람의 위험도는 이형접합체 Aa의 위험도의 RR배이고, 동형접합체 aa를 갖는 사람의 RR2배일 것이다. 승법 모델은 분석 및 계산을 단순화하는 유용한 특성을 갖는다- 환자 집단(affected population) 및 대조구 집단 내에서 일배체형은 독립적이고, 즉, 하디-와인버그 평형(Hardy-Weinberg equilibrium)에 있다. 그 결과, 환자(affected)와 대조군 각각의 일배체형 계수(haplotype count)는 다항 분포를 가지나, 대립 가설 하에서 상이한 일배체형 빈도를 갖는 다항 분포를 갖는다. 구체적으로, 두개의 일배체형, hi 및 hj에 대해, risk(hi)/risk(hj) = (fi/pi)/(fj/pj)이고, 상기에서 f와 p는 각각 환자 집단 및 대조군 집단에서의 빈도를 나타낸다. 실제 모델이 승법성이 아닌 경우, 일부 검정력 손실(power loss)이 있으나, 이 손실은 극단적인 경우를 제외하고는 작은(mild) 경향이 있다. 가장 중요한 것은, p-값은 귀무 가설 하에 계산되기 때문에, 항상 유효하다는 것이다.
하나의 연관 연구에서 검출된 연관 신호가 이상적으로는 동일하거나 또는 상이한 민족의 상이한 집단(예를 들면, 동일 국가의 다른 지역, 또는 다른 국가)으로부터 유래된 제2 코호트에서 재현될 수 있다. 재현 연구(replication study)의 장점은 재현 연구에서 수행되는 테스트의 횟수, 및 이에 따라 적용되는 덜 엄격한 통계적 척도이다. 예를 들면, 300,000개의 SNP를 이용한, 특정 질병 또는 성향에 대한 감수성 변이의 게놈-전체 검색을 위해, 수행된 300,000회의 테스트(각 SNP당 1회)에 대한 보정(correction)이 수행될 수 있다. 통상적으로 이용되는 어레이 상의 다수의 SNP가 상관되기(즉, LD 관계) 때문에, 그들은 독립적이지 않다. 따라서, 보정은 보수적이다. 그럼에도 불구하고, 이 보정 인자를 적용하는 것은 신호가 단일 연구 코호트로부터의 결과에 대해 이 보수적 테스트를 적용하는 것이 유의성이 있는 것으로 간주되기 위해서는 0.05/300,000 = 1.7 x 10-7 미만의 관찰된 P-값을 요구한다. 분명히, 이 보수적 역치(threshold) 미만의 P-값을 갖는 게놈-전체 연구에서 확인된 신호는 진정한 유전적 효과의 척도이며, 추가적인 코호트에서의 재현이 통계학적 관점에서 반드시 요구되는 것은 아니다. 그러나, 보정 인자는 수행된 통계적 검정의 갯수에 의존적이기 때문에, 최초 연구로부터의 신호(하나의 SNP)가 제2 케이스-대조군 코호트에서 재현되는 경우, 유의성에 대한 적합한 통계적 검정은 단일 통계적 검정에 대해, 0.05 미만의 P-값을 갖는 것이다. 하나 또는 여러 개의 추가적인 케이스-대조군 코호트에서의 재현 연구는 추가적인 집단에서 연관 신호의 평가를 제공하여, 동시에 최초 발견을 확인하고 일반적인 인간 집단에서 테스트되고 있는 유전적 변이(들)의 전체 유의성의 평가를 제공하는 추가적인 장점을 갖는다.
여러 케이스-대조군 코호트로부터의 결과는 또한 기저 효과(underlying effect)의 전체 평가를 제공하기 위해 통합될 수 있다. 복수 개의 유전적 연관 연구로부터의 결과를 통합하기 위해 통상적으로 이용되는 방법은 Mantel-Haenszel 모델이다(Mantel and Haenszel, J Natl Cancer Inst 22:719-48 (1959)). 상기 모델은 각각 유전적 변이의 상이한 집단 빈도를 갖는, 상이한 집단으로부터의 연관 결과가 통합되는 상황을 다루기 위해 설계되었다. 상기 모델은 OR 또는 RR에 의해 측정된, 질병의 위험도에 대한 변이의 효과가 모든 집단에서 동일하고, 변이의 빈도는 집단간에 상이할 수 있다는 것을 가정하여 결과를 통합한다. 여러 개의 집단으로부터의 결과를 통합하는 것은 통합된 코호트에 의해 제공되는 증가된 통계적 검정력 때문에, 실제의 기저 연관 신호를 검출하기 위한 전체 검정력(power)이 증가된다는 추가적인 장점을 갖는다. 또한, 다수의 코호트로부터의 결과가 통합되는 경우, 예를 들면, 케이스와 대조군 간의 비균등한 일치(mataching) 또는 집단 계층화(population stratification)에 따른, 개별적인 연구의 결함이 균형잡히는 경향이 있어서, 진정한 기저 유전적 효과의 보다 우수한 추정을 제공할 것이다.
위험도 평가 및 진단
주어진 집단 내에서, 사람이 특정된 기간 동안 특정한 질병 또는 성향을 발생시킬 가능성으로 정의된, 질병 또는 성향을 발생시킬 절대 위험도(absolute risk)가 있다. 예를 들면, 여성의 갑상선암에 대한 생애 절대 위험도(lifetime absolute risk)는 1/9이다. 즉, 9명의 여성 당 1명은 그들의 생애 중 어느 시점에 갑상선암을 발병할 것이다. 위험도(risk)는 통상적으로 특정인이 아니라, 매우 많은 수의 사람들을 조사하는 것에 의해 측정된다. 위험도는 종종 절대적 위험도(Absolute Risk, AR) 및 상대적 위험도(Relative Risk, RR)로 제시된다. 상대적 위험도는 두개의 변이와 연관된 위험도, 또는 두개의 상이한 사람들의 그룹의 위험도를 비교하기 위해 이용된다. 예를 들면, 상대적 위험도는 특정한 유전형을 갖는 사람들의 그룹과 다른 유전형을 갖는 또 다른 그룹을 비교하기 위해 이용될 수 있다. 질병에 대해, 2의 상대적 위험도는 하나의 그룹이 나머지 그룹보다 질병을 발병할 가능성이 두배 높다는 것을 의미한다. 제시되는 위험도는 일반적으로 일치된 성별 및 민족의 집단 대비, 1인, 또는 1인의 특정한 유전형에 대한 상대적 위험도이다. 동일한 성별 및 민족의 2인의 위험도는 단순한 방식으로 비교될 수 있다. 예를 들면, 집단 대비, 제1 개체는 1.5의 상대적 위험도를 가지며, 제2 개체는 0.5의 상대적 위험도를 갖는 경우, 제2 개체 대비 제1 개체의 위험도는 1.5/0.5 = 3이다.
위험도 계산
전체 유전적 위험도(overall genetic risk)를 계산하기 위한 모델의 형성은 두 단계를 포함한다: i) 단일 유전적 변이에 대한 오즈비의 상대적 위험도로의 전환 및 ii) 상이한 유전자 좌(genetic loci)의 복수의 변이로부터의 위험도의 단일 상대적 위험도 값으로의 조합.
오즈비로부터 위험도의 유도
현재까지 권위있는 저널에 발표된 복합 질환에 대한 대부분의 유전자 발견은 그들의 소급적 설정(retrospective setup) 때문에 케이스-대조군 설계를 이용했다. 이 연구들은 선택된 세트의 케이스(특정된 질병 상태를 갖는 사람들) 및 대조군 개인들을 표본 추출하고 유전형을 분석한다. 관심은 케이스와 대조군에서의 빈도가 유의성있게 상이한 유전적 변이(대립인자)에 있다.
결과는 통상적으로 오즈비, 즉, 환자군 대 대조군에서 위험 변이(보인자)를 갖는 비율(확률) 대 비-위험 변이(비-보인자) 비율 간의 비로 보고되고, 즉, 질병 상태 조건부 확률(probability conditional on the affected status)로 표현된다:
OR = (Pr(c|A)/Pr(nc|A)) / (Pr(c|C)/Pr(nc|C))
그러나, 때때로, 본 발명자들이 관심을 갖는 것은 질환에 대한 절대 위험도(absolute risk), 즉, 위험 변이를 갖는, 해당 질환을 가진 개인들의 비율 또는 다시 말하면, 그 질환을 가질 확률이다. 부분적으로 케이스 대 대조군의 비가 통상적으로 일반 집단에서의 비와 동일하지 않기 때문에 이 수치는 케이스-대조군 연구에서 직접적으로 측정될 수 없다. 그러나, 특정한 가정 하에, 본 발명자들은 오즈비로부터 위험도를 추정할 수 있다.
희귀 질환 가정(rare disease assumption) 하에서, 질병의 상대적 위험도는 오즈비에 의해 근사될 수 있다는 것이 잘 알려져 있다. 그러나, 이 가정은 다수의 일반적 질환에는 적용될 수 없다. 또한, 또 다른 유전형 변이 대비 하나의 유전형 변이는 앞서 표현된 오즈비로부터 추정될 수 있는 것으로 입증된다. 계산은 대조군이 엄격하게 무질환 상태(unaffected) 개인들이기 보다는 질환 상태 사람들을 포함한, 케이스와 동일한 집단으로부터의 랜덤 표본인 것인 랜덤 집단 대조군(random population control)의 가정 하에 특히 간단하다. 표본 크기 및 검정력(power)을 증가시키기 위해, 다수의 대규모 게놈-전체 연관 및 재현 연구는 케이스와 연령-일치되지(age-matched) 않고, 또한 연구 당시에 대조군이 해당 질병을 갖지 않는다는 것을 보장하기 위해 세심하게 검토되지 않은 대조군을 이용한다. 따라서, 정확하지 않으나, 그들은 종종 일반 집단으로부터 랜덤 표본을 근사한다. 이 가정이 정확하게 만족스러울 것으로 거의 기대되지 않으나, 위험도 추정값은 통상적으로 이 가정으로부터 고도 내지 중등도의 변경(robust to moderate deviation)이라는 것이 주목된다.
계산은 본 발명자들이 위험 변이 보인자, "c" 및 비-보인자, "nc"를 갖는 것인, 우성(dominant model) 및 열성(recessive) 모델의 경우, 개인의 오즈비는 이 변이들 간의 위험도 비와 동일하다는 것을 보여준다:
OR = Pr(A|c)/Pr(A|nc) = r
위험도가 두 개의 대립인자 카피와 연관된 위험도의 곱인 것인 승법 모델에서와 마찬가지로, 대립인자 오즈비는 위험 인자(risk factor)와 일치한다:
OR = Pr(A|aa)/Pr(A|ab) = Pr(A|ab)/Pr(A|bb) = r
식 중에서, "a"는 위험 대립인자를 나타내고, "b"는 비-위험 대립인자(non-risk allele)를 나타낸다. 따라서, 인자 "r"은 대립인자 종류 간의 상대적 위험도이다.
복합 질환과 연관된 공통 변이(common variant)를 보고하는, 지난 수년간 발표된 다수의 연구의 경우, 승법 모델이 그 효과를 적절하게 요약하고 가장 자주 우성 및 열성 모델과 같은 대안적 모델보다 탁월한, 데이터로의 맞춤(fit)을 제공하는 것으로 확인되었다.
평균 집단 위험도 대비 위험도
평균 집단 대비 유전적 변이의 위험도를 표현하는 것이 가장 편리하며, 이는 기준(baseline) 집단 위험도 대비 질병을 발병할 생애 위험도(lifetime risk)를 소통시키는 것을 보다 용이하게 하기 때문이다. 예를 들면, 승법 모델에서, 본 발명자들은 변이 "a"에 대해 상대적 집단 위험도를 하기와 같이 계산할 수 있다:
RR(aa) = Pr(A|aa)/Pr(A) = (Pr(A|aa)/Pr(A|bb))/(Pr(A)/Pr(A|bb)) =
r2/(Pr(aa) r2 + Pr(ab)r + Pr(bb)) = r2/(p2 r2 + 2pqr + q2) = r2/R
이때, "p" 및 "q"는 각각 "a" 및 "b"의 대립인자 빈도이다. 마찬가지로, 본 발명자들은 RR(ab) = r/R 및 RR(bb) = 1/R을 얻는다. 대립인자 빈도 추정값은 오즈비를 보고하는 공개 문헌 및 HapMap 데이터베이스로부터 얻을 수 있다. 본 발명자들이 개인의 유전자형을 알 수 없는 경우, 테스트 또는 마커에 대한 상대적 유전적 위험도는 간단하게 1이다.
예로서, 타입-2 당뇨병 위험도에서, 염색체 10 상의 TCF7L2 유전자 중의 질병 연관 마커 rs7903146의 대립인자 T는 비-히스패닉(non-Hispanic) 백인 집단에서 1.37의 대립인자 OR 및 약 0.28의 빈도(p)를 갖는다. 유전형 CC 대비 유전형 상대적 위험도는 승법 모델에 근거하여 추정된다.
TT의 경우, 상대적 위험도는 1.37 ± 0.37 = 1.88이고; CT의 경우, 단순히 OR 1.37이며, CC의 경우 정의에 의해 1.0이다.
대리인자 C의 빈도는 q = 1 - p = 1 - 0.28 = 0.72이다. 이 마커에서 3개의 가능한 유전형 각각의 집단 빈도는 하기와 같다:
Pr(TT) = p2 = 0.08, Pr(CT) = 2pq = 0.40, 및 Pr(CC) = q2 = 0.52
유전형 CC(1의 위험도를 갖는 것으로 정의됨) 대비 평균 집단 위험도는 하기와 같다 :
R = 0.08x1.88 + 0.40x1.37 + 0.52x1 = 1.22
따라서, 이 마커에서 하기 유전형 중 하나를 갖는 개체에 대한 전체 집단 대비 상대적 위험도(RR)는 하기와 같다 :
RR(TT) = 1.88/1.22 = 1.54, RR(CT) = 1.37/1.22 = 1.12, RR(CC) = 1/1.22 = 0.82.
복수의 마커로부터의 위험도의 통합:
다수의 SNP 변이의 유전형이 개인에 대해 위험도를 추정하기 위해 이용되는 경우, 위험도에 대한 승법 모델이 일반적으로 가정될 수 있다. 이는 집단 대비 통합된 유전적 위험도는 개별적인 마커, 예를 들면, 두 개의 마커, g1 및 g2에 대한 상응하는 추정값의 곱으로 계산된다:
RR(g1,g2) = RR(g1)RR(g2)
근본적인 가정은 위험 인자가 독립적으로 일어나고 행동한다는 것, 즉, 결합 조건적 확률(joint conditional probability)이 곱으로 표현될 수 있다는 것이다.
Pr(A|g1,g2) = Pr(A|g1)Pr(A|g2)/Pr(A) 및 Pr(g1,g2) = Pr(g1)Pr(g2)
이 가정에 대한 명백한 위배는 두 개 이상의 위험 대립인자의 동시 발생이 상관되도록 게놈에서 근접하게 배치된 마커들이고, 즉, 연관 불균형인 마커들이다. 그와 같은 경우에, 본 발명자들은 상관된 SNP의 모든 대립인자 조합에 대해 오즈비가 정의된 것인 소위 일배체형 모델링을 이용할 수 있다.
통계적 모델이 이용되는 것인 대부분의 경우에서와 같이, 적용된 모델은 근본적인 생물-물리학적 모델(bio-physical model)에 기반하지 않기 때문에 정확하게 일치할 것으로 기대되지 않는다. 그러나, 승법 모델은 현재까지 데이터에 적합하게 맞는 것으로 확인되었고, 즉, 다수의 위험 변이들이 발견된 다수의 일반적 질환에 대해 유의성 있는 편차가 검출되지 않는다.
예로서, 각 마커에 대해 집단 대비 위험도와 함께 타입-2 당뇨병과 연관된 4개의 마커들에서 하기의 유전형을 갖는 개인을 고려한다:
염색체 3 | PPARG | CC | 계산된 위험도: RR(CC) = 1.03 |
염색체 6 | CDKAL1 | GG | 계산된 위험도: RR(GG) = 1.30 |
염색체 9 | CDKN2A | AG | 계산된 위험도: RR(AG) = 0.88 |
염색체 11 | TCF7L2 | TT | 계산된 위험도: RR(TT) = 1.54 |
통합하면, 이 개인에 대한 집단 대비 전체 위험도는 1.03 x 1.30 x 0.88 x 1.54 = 1.81이다.
조정된 생애 위험도(Adjusted life-time risk)
개인의 생애 위험도는 집단 대비 전체 유전적 위험도에 해당 개인의 지리적 기원의 지역에서 동일한 민족 및 성별의 전체 집단에서의 질병의 평균 생애 위험도를 곱하는 것에 의해 도출될 수 있다. 통상적으로 전체 집단 위험도의 정의시 선택할 수 있는 여러 역학 연구가 있기 때문에, 본 발명자들은 유전적 변이를 위해 이용되었던 질병 정의를 위해 검정력이 우수한(well-powered) 연구를 선택할 것이다.
예를 들면, 타입-2 당뇨병의 경우, 집단 대비 전체 유전적 위험도가 백인 남성에 대해 1.8인 경우, 및 그의 인구통계적 특성의 개인의 타입-2 당뇨병의 평균 생애 위험도가 20%인 경우, 그에 대한 조정된 생애 위험도는 20% x 1.8 = 36%이다.
집단에 대한 평균 RR이 1이기 때문에, 이 승법 모델은 질병의 동일한 평균 조정된 생애 위험도를 제공한다. 또한, 실제의 생애 위험도는 100%를 초과할 수 없기 때문에, 유전적 RR에 대한 상한이 있어야 한다.
갑상선암에 대한 위험도 평가
본 명세서에 기재된 바와 같이, 특정한 다형성 마커 및 그와 같은 마커를 포함하는 일배체형이 갑상선암의 위험도 평가를 위해 유용한 것으로 확인되었다. 위험도 평가는 갑상선암에 대한 감수성을 진단하기 위한 마커의 이용을 포함할 수 있다. 다형성 마커의 특정한 대립인자는 갑상선암의 진단을 갖지 않는 개체들에서보다, 갑상선암의 진단을 갖는 개체들에서 보다 빈번하게 발견된다. 그러므로, 이 마커 대립인자들은 개체에서 갑상선암, 또는 갑상선암에 대한 감수성을 검출하기 위한 예측적 가치(predictive value)를 갖는다. 본 명세서에 기재된 위험 변이(또는 예측적 변이)와 연관 불균형인 태깅 마커가 이 마커들 (및/또는 일배체형)에 대한 대리물(surrogate)로 이용될 수 있다. 그와 같은 대리 마커들은 특정한 일배체형 블럭 또는 LD 블럭 내에 위치할 수 있다. 그와 같은 대리 마커들은 또한 때때로 그와 같은 일배체형 블럭 또는 LD 블럭의 물리적 경계 외부에, LD 블럭/일배체형 블럭의 인근에 위치할 수 있으나, 가능하게는 또한 보다 먼 게놈 위치에 위치할 수 있다.
특정한 게놈 영역(예를 들면, 유전자)이 기능적 관계에 있는 경우, 장거리 LD가 예를 들면, 일어날 수 있다. 예를 들면, 두 개의 유전자가 공유된 대사 경로에서 역할을 수행하는 단백질을 코딩하는 경우, 하나의 유전자 중의 특정한 변이가 나머지 유전자에 대한 관찰된 변이에 대해 직접적 효과를 가질 수 있다. 하나의 유전자 중 변이가 유전자 산물의 증가된 발현을 초래하는 경우를 고려한다. 이 효과를 길항시키고, 특정한 경로의 전체 흐름(flux)을 보존하기 위해, 이 변이는 상기 유전자의 감소된 발현 수준을 부여하는 제2 유전자에서 하나(또는 그 이상)의 변이의 선택을 초래할 수 있었을 것이다. 이 두 유전자들은 상이한 게놈 위치, 가능하게는 상이한 유전자 상에 위치할 수 있으나, 상기 유전자 내의 변이들은 높은 LD의 영역 내의 공유된 물리적 위치 때문이 아니라, 진화력(evolutionary force) 때문에, 상이한 게놈 위치 내에, 가능하게는 상이한 염색체 상에 위치할 수 있다. 그와 같은 LD도 고려되고 본 발명의 범위 내에 속한다. 당업자는 기능성 유전자-유전자 상호작용의 다수의 다른 시나리오가 가능하고, 본 명세서에서 검토된 특정한 예는 단지 하나의 그와 같은 가능한 시나리오를 대표하는 것이라는 것을 이해할 것이다.
1의 r2 값을 갖는 마커들이 위험 변이(at-risk variant)(anchor variant)에 대한 완벽한 대리물이고, 즉, 하나의 마커에 대한 유전형이 다른 마커에 대한 유전형을 완벽하게 예측한다. 1보다 작은 r2 값을 갖는 마커들도 위험 변이의 대리물일 수 있거나, 또는 대안적으로 그 위험 변이만큼 높거나 또는 그 변이보다 훨씬 더 높은 상대적 위험도 값을 갖는 변이를 나타낸다. 확인된 위험 변이는 그 자체로 기능적 변이가 아닐 수 있으나, 이 경우, 진정한 기능적 변이와 연관 불균형 관계일 수 있다. 기능적 변이는 예를 들면, 미니새틀라이트(minisatellite), 또는 마이크로새틀라이트(microsatellite)와 같은 연쇄 반복(tandem repeat), 전위 요소(transposable element)(예를 들면, Alu 요소), 또는 결실, 삽입 또는 역전(때때로 카피수 변위(copy number variation), 또는 CNV로도 지칭됨)과 같은 구조적 변형일 수 있다. 본 발명은 본 명세서에 개시된 마커에 대한 그와 같은 대리 마커(surrogate marker)의 평가를 포함한다. 그와 같은 마커들이 본 발명이 속하는 기술 분야의 당업자에게 잘 알려진 바와 같이, 공개 데이터베이스에 설명(annotate)되고, 맵핑되고, 열거되어 있거나, 또는 대안적으로 개체들의 군에서 본 발명의 마커에 의해 확인된 영역 또는 그 영역의 일부를 서열결정하고, 결과적으로 수득된 서열의 군에서 다형성을 식별하는 것에 의해 용이하게 식별될 수 있다. 그 결과, 본 발명이 속하는 기술 분야의 당업자는 용이하게, 과도한 실험 없이 본 명세서에 기재된 마커 및/또는 일배체형과 연관 불균형인 대리 마커들을 확인하고 그의 유전형을 분석할 수 있다. 검출된 위험 변이와 LD인 태깅 마커 또는 대리 마커도 개체에서, 질병과의 연관, 또는 질병에 대한 감수성을 검출하기 위해 이용된다. 본 발명의 마커와 LD인 이 태깅(tagging) 마커 또는 대리(surrogate) 마커도 일체형들을 구별하는 다른 마커를 포함할 수 있고, 이들은 마찬가지로 특정한 질환에 대한 예측적 가치를 갖는다.
특정 구체예에서, 본 발명은 갑상선암과 연관된 것으로 본 명세서에 기재된 특정 변이의 존재에 대해 개인으로부터 유래된 게놈 DNA를 포함하는 시료를 평가하는 것에 의해 실시될 수 있다. 그와 같은 평가는 당업자에게 잘 알려지고 본 명세서에서 더 설명될 방법을 이용하여, 하나 이상의 다형성 마커의 하나 이상의 대립인자의 존재 또는 부재를 검출하는 단계를 포함하고, 그와 같은 평가의 결과에 근거하여 시료가 유래된 개인이 갑상선암의 증가된 위험도 또는 감소된 위험도(증가된 감수성 또는 감소된 감수성)를 갖는지 여부를 결정한다. 특정한 구체예에서, 다형성 마커의 특정한 대립인자의 검출이 하나 이상의 다형성 마커의 하나 이상의 대립인자를 식별하는, 특정한 개인에 대한 핵산 서열 데이터를 수득하는 것에 의해 수행될 수 있다. 상기 하나 이상의 마커의 상이한 대립인자들이 인간에서 갑상선암에 대한 상이한 감수성과 연관된다. 핵산 서열 데이터의 수득은 SNP에서 대립인자를 식별하기에 충분한, 단일 뉴클레오티드 위치의 핵산 서열을 포함할 수 있다. 핵산 서열 데이터는 또한 다른 갯수의 뉴클레오티드 위치의 서열을 포함할 수 있고, 특히, 다중 뉴클레오티드 위치를 포함하는 유전적 마커에 대한 서열을 포함할 수 있고, 2개 내지 수십만개, 심지어 수백만개의 뉴클레오티드일 수 있다(특히, 카피 수 변이(copy number variation, CNV)의 경우).
특정한 구체예에서, 본 발명은 질병과 연관된 하나 이상의 다형성 마커(또는 상기 질병와 연관된 하나 이상의 마커와 연관 불균형인 마커)의 유전형 상태에 관한 정보를 포함하는 데이터세트를 이용하여 실시될 수 있다. 바꾸어 말하면, 그와 같은 유전적 상태, 예를 들면, 특정한 다형성 마커, 또는 복수 개의 마커에서의 서열 데이터, 유전형 계수(genotype count)(예를 들면, 특정한 위험 대립인자의 존재 또는 부재에 대한 표시), 또는 하나 이상의 마커의 실제 유전형의 형태로 그와 같은 유전적 상태에 관한 정보를 포함하는 데이터세트가 본 발명자들에 의해 상기 질병과 연관된 것으로 입증된 특정한 위험 대립인자의 존재 또는 부재에 대해 검색될 수 있다. 상기 질병과 연관된 변이(예를 들면, 마커 대립인자)에 대한 양성 결과는 데이터세트가 유래된 개체가 상기 질병의 증가된 감수성(증가된 위험도)을 갖는다는 것을 나타낸다.
본 발명의 특정한 구체예에서, 다형성 마커는 다형성의 하나 이상의 대립인자와 갑상선암 간의 상관관계를 포함하는 참조표(look-up table)에 상기 다형성 마커에 대한 유전형을 조회하는 것에 의해, 질병과 상관된다. 일부 구체예에서, 상기 표는 하나의 다형성에 대한 상관관계를 포함한다. 다른 구체예에서, 상기 표는 복수의 다형성에 대한 상관관계를 포함한다. 두 시나리오에서, 마커와 질병 간의 상관관계를 제공하는 참조 표를 조회하는 것에 의해, 질병에 대한 위험도, 또는 질병에 대한 감수성이 시료가 유래된 개인에서 확인될 수 있다. 일부 구체예에서, 상관관계가 통계적 척도로서 보고된다. 통계적 척도는 상대적 위험도(RR), 절대적 위험도(absolute risk, AR), 또는 오즈비(OR)과 같은 위험 척도로 보고될 수 있다.
본 명세서에 기재된 마커들, 예를 들면, rs965513 (서열번호 1)과 같은, 표 2에 제시된 마커들은 단독으로 또는 조합되어, 위험도 평가 및 진단 목적을 위해 유용할 수 있다. 본 명세서에 기재된 마커에 근거한 갑상선암 위험도의 결과는 전체 위험도를 수립하기 위해, 갑상선암에 대한 다른 유전적 마커 또는 위험 인자들을 위한 데이터와 조합될 수 있다. 따라서, 개별적인 마커에 의한 위험도의 증가가 비교적 크지 않은 경우, 예를 들면, 10 내지 30% 수준인 경우, 연관은 상당한 영향을 가질 수 있다. 따라서, 비교적 흔한 변이가 전체 위험도에 상당한 기여를 가질 수 있거나(집단 귀속 위험도(population attributable risk)가 높음), 또는 마커들의 조합이 마커들의 통합 위험도(combined risk)에 기반하여, 상기 질병을 발병할 유의성 있는 통합 위험도를 갖는 개인들의 군을 정의하기 위해 이용될 수 있다.
따라서, 본 발명의 일부 구체예에서, 복수의 변이(유전적 마커, 바이오마커 및/또는 일배체형)가 전체 위험도 평가를 위해 이용된다. 일 구체예에서, 이 변이들은 본 명세서에 개시된 변이들로부터 선택된다. 기타 구체예는 갑상선암에 대한 감수성을 진단하기 위해 유용한 것으로 알려진 다른 변이와 조합된 본 발명의 변이의 이용을 포함한다. 그와 같은 구체예에서, 복수의 마커 및/또는 일배체형의 유전형 상태는 개인에서 결정되고, 개인의 상태가 연관된 변이의 집단 빈도, 또는 임상적으로 건강한 개체, 예를 들면, 연령-일치된(age-matched) 개체 및 성별-일치된 개체에서의 변이의 빈도와 비교된다. 뒤이어, 다변량 분석 또는 결합 위험도 분석(joint risk analysis)과 같은 당해 기술 분야에서 공지된 방법, 또는 당업자에게 공지된 기타 방법이 복수 개의 유전자좌에서의 유전형 상태에 근거하여 부여된 전체 위험도를 결정하기 위해 이용될 수 있다. 그와 같은 분석에 근거한 위험도의 평가가 이후에 본 명세서에 기재된, 본 발명의 방법, 용도 및 키트에서 이용될 수 있다.
갑상선암에 대한 위험 변이에 대해 동형접합인 개인은 갑상선암 발병의 특히 높은 위험도를 갖는다. 이는 위험 대립인자의 용량-의존적 효과에서 기인되며, 동형접합 보인자에 대한 위험도는 일반적으로 각 대립인자 카피에 대한 위험도의 제곱으로 추정된다. 하나의 그와 같은 구체예에서, 마커 rs965513의 대립인자 A에 대해 동형접합인 개인은 일반 집단 및/또는 rs965513-A 위험 대립인자의 비-보인자에 비해 갑상선암 발병의 특히 높은 위험도를 갖는다.
전술된 바와 같이, 인간 게놈의 일배체형 블럭 구조는 질병 또는 성향(trait)가 원래 연관된 변이와 연관 불균형인 다수의 변이(마커 및/또는 일배체형)이 상기 질병 또는 성향과의 연관을 평가하기 위한 대리 마커로 이용될 수 있게 하는 효과를 갖는다. 그와 같은 대리 마커의 갯수는 해당 영역에서의 과거 재조합률(historical recombination rate), 해당 영역에서의 돌연변이 빈도(즉, 해당 영역 중 다형성 부위 또는 마커의 갯수), 및 해당 영역에서 LD의 정도(즉, LD 블럭의 크기)와 같은 인자에 의존적일 것이다. 이 마커들은 통상적으로 본 명세서에 기재된 방법, 또는 당해 기술 분야에서 당업자에게 알려진 기타 방법을 이용하여 정의된 LD 블럭 또는 일배체형 블럭의 물리적 경계 내에 위치한다. 그러나, 때때로 마커 및 일배체형 연관은 앞서 검토된 바와 같이, 정의된 일배체형 블럭의 물리적 경계 외부까지 확장되는 것으로 발견된다. 그와 같은 마커 및/또는 일배체형은 그 경우에 또한 정의된 일배체형 블럭 내에 물리적으로 존재하는 마커 및/또는 일배체형에 대한 대리 마커 및/또는 일배체형으로 이용될 수 있다. 그 결과, 본 발명의 마커 및 일배체형과 LD(통상적으로 0.4보다 큰 r2의 값에 의해 상관관계를 갖는 마커들을 포함한, 0.3보다 큰 r2을 포함한, 0.2보다 큰 r2과 같은 0.1보다 큰 마커간(inter-marker) r2값을 특징으로 함)인 마커 및 일배체형은 정의된 일배체형 블럭의 경계 외부에 물리적으로 존재하더라도, 본 발명의 범위 내에 속한다. 이는 본 명세서에 기재된 마커들(예를 들면, rs965513)을 포함하나, 또한, rs965513과 강한 LD(예를 들면, 0.1 또는 0.2보다 더 큰 r2 및/또는 |D'|> 0.8을 특징으로 함)인 다른 마커들(예를 들면, 표 2에 표시된 마커들)을 포함할 수 있다.
본 명세서에 기재된 SNP 마커에 대해, 환자에서 과량으로 존재하는 것으로 발견된 대립인자(위험 대립인자)에 대한 반대 대립인자가 갑상선암에서 감소된 빈도로 발견된다. 따라서, 이 마커들 및 이들과 LD이고 및/또는 이들을 포함하는 일배체형은 갑상선암에 대해 보호성이고, 즉, 그들은 이 마커들 및/또는 일배체형을 갖는 개인들에게 갑상선암 발병의 감소된 위험도 또는 감수성을 부여한다.
특정한 일배체형을 포함한, 본 발명의 특정한 변이는 일부 경우에, 다양한 유전적 마커들, 예를 들면, SNP 및 마이크로새틀라이트의 조합을 포함한다. 일배체형의 검출은 다형성 부위에서 서열을 검출하기 위한, 당해 기술분야에서 공지되고 및/또는 본 명세서에 기재된 방법에 의해 달성될 수 있다. 또한, 특정한 일배체형 또는 마커들의 세트와 질병 표현형 간의 상관관계가 표준 기법을 이용하여 확인될 수 있다. 상관관계의 간단한 검정의 대표적 예가 2x2 표에서의 Fisher-exact 검정이다.
특정한 구체예에서, 갑상선암과 연관된 것으로 확인된 마커 대립인자 또는 일배체형(예를 들면, 표 1에 열거된 마커 대립인자)은 건강한 개인(대조군), 또는 집단으로부터 무작위로 선택된 개인에서의 존재 빈도 대비, 갑상선암에 대한 위험도를 갖는 개인(질병군)에 보다 빈번하게 존재하며, 상기 마커 대립인자 또는 일배체형의 존재는 갑상선암에 대한 감수성을 나타낸다. 다른 구체예에서, 갑상선암과 연관된 것으로 본 명세서에서 확인된 하나 이상의 마커들(예를 들면, 표 1에 열거된 마커 대립인자)과 연관 불균형인 위험 마커들은 건강한 개인(대조군), 또는 집단으로부터 무작위로 선택된 개인에서의 존재 빈도 대비, 갑상선암에 대한 위험도를 갖는 개인(질병군)에 보다 빈번하게 존재하는 태깅 마커이고, 상기 태깅 마커의 존재는 갑상선암에 대한 증가된 감수성을 나타낸다. 또 다른 구체예에서, 갑상선암과 연관된 것으로 발견된 하나 이상의 마커와 연관 불균형인 위험 마커 대립인자(즉, 증가된 감수성을 부여하는 마커 대립인자)는 건강한 개인(대조군)에서의 그들의 존재 빈도에 비해, 갑상선암에 대한 위험도를 갖는 개인에서 보다 빈번하게 존재하는 하나 이상의 대립인자를 포함하는 마커이고, 상기 마커의 존재는 갑상선암에 대한 증가된 감수성을 나타낸다.
연구 집단
일반적으로, 본 명세서에 기재된 방법 및 키트는 임의의 원천(source) 및 임의의 개체으로부터의 핵산 물질(DNA 또는 RNA)를 포함하는 시료, 및 개인 또는 그와 같은 시료로부터 유래된 유전형 또는 서열 데이터로부터 이용될 수 있다. 바람직한 구체예에서, 개체는 인간이다. 개인은 성인, 아동, 또는 태아일 수 있다. 핵산 출처는 생물학적 시료을 포함한, 핵산 물질을 포함하는 시료, 또는 그로부터 유래된 핵산 물질을 포함하는 시료일 수 있다. 본 발명은 또한, 표적 집단의 구성원인 개체에서 마커 및/또는 일배체형을 평가하는 방법을 제공한다. 일 구체예에서, 그와 같은 표적 집단은 다른 유전적 인자, 바이오마커, 생체물리적 인자(예를 들면, 체중, BMD, 혈압), 또는 전반적인 건강 및/또는 생활방식 파라미터(예를 들면, 갑상선암의 병력, 갑상선암의 과거 진단, 암의 가족력, 갑상선암의 가족력)에 기반하여, 질병을 발병할 위험도를 갖는 개체들의 집단 또는 그룹이다. 특정한 구체예에서, 표적 집단은 진단 또는 치료 의학, 핵 폭발로부터의 방사성 분진, 핵 발전소 또는 기타 방사성 활성의 출처에 의한 방사성 노출과 같은 공지된 방사선 노출을 갖는 집단 또는 그룹이다.
본 발명은 40세 이상, 45세 이상, 또는 50세 이상, 55세 이상, 60세 이상, 65세 이상, 70세 이상, 75세 이상, 80세 이상, 또는 85세 이상의 개인과 같은, 특정한 연령 서브그룹으로부터의 개인을 포함하는 구체예를 제공한다. 본 발명의 다른 구체예는 80세 미만, 75세 미만, 또는 70세 미만, 65세 미만, 60세 미만, 55세 미만, 50세 미만, 45세 미만, 40세 미만, 35세 미만, 또는 30세 미만과 같은, 85세 미만의 개인과 같은, 다른 연령군에 관한 것이다. 다른 구체예는 전술된 임의의 연령 범위에 속하는 갑상선암의 발병 연령을 갖는 개인에 관한 것이다. 또한, 특정한 구체예에서, 45세를 초과하나, 60세 미만인 발병 연령과 같은 일정 범위의 연령이 관련된 것일 수 있는 것으로 고려된다. 그러나, 앞서 열거된 연령값에 의해 일괄된 모든 연령 범위를 포함한, 다른 연령 범위도 고려된다. 본 발명은 또한 하나의 성별의 개인, 남성 또는 여성에 관한 것이다.
아이슬란드 집단은 북유럽 선조 기원의 코카서스인 집단이다. 아이슬란드 집단에서 유전적 연관(genetic linkage)과 관련성(association)의 결과를 보고하는 다수의 연구가 최근 수년간 발표되었다. 그와 같은 다수의 연구들은 다른 집단에서, 최초에 아이슬란드 집단에서 특정 질환과 연관된 것으로 확인된 변이의 재현을 보여준다(Sulem, P., et al., Nat Genet May 17 2009 (Epub ahead of print); Rafnar, T., et al. Nat Genet 41:221-7 (2009); Gretarsdottir, S., et al. Ann Neurol 64:402-9 (2008); Stacey, S.N., et al. Nat Genet 40:1313-18 (2008); Gudbjartsson, D.F., et al. Nat Genet 40:886-91 (2008); Styrkarsdottir, U., et al. N Engl J Med 358:2355-65 (2008); Thorgeirsson, T., et al. Nature 452:638-42 (2008); Gudmundsson, J., et al. Nat Genet. 40:281-3 (2008); Stacey, S.N., et al., Nat Genet. 39:865-69 (2007); Helgadottir, A., et al., Science 316:1491-93 (2007); Steinthorsdottir, V., et al., Nat Genet. 39:770-75 (2007); Gudmundsson, J., et al., Nat Genet. 39:631-37 (2007); Frayling, TM, Nature Reviews Genet 8:657-662 (2007); Amundadottir, L.T., et al., Nat Genet. 38:652-58 (2006); Grant, S.F., et al., Nat Genet. 38:320-23 (2006)). 따라서, 아이슬란드 집단에서의 유전적 발견이 일반적으로 아프리카 및 아시아로부터의 집단을 포함한, 다른 집단에서 재현되었다.
갑상선암과 연관된 것으로 확인된 본 발명의 마커들은 다른 인간 집단에서 유사한 연관성을 보이는 것으로 사료된다. 따라서, 개별적인 인간 집단을 포함하는 특정한 구체예가 또한 고려되며 본 발명의 범위 내에 속한다. 그와 같은 구체예는 코카서스 집단, 유럽 집단, 미국 집단, 유라시아 집단, 아시아 집단, 중앙/남아시아 집단, 동아시아 집단, 중동 집단, 아프리카 집단, 라틴 아메리카 집단, 및 오세아니아 집단을 포함하나, 이에 한정되지 않는 하나 이상의 인간 집단으로부터의 인간 개체에 관한 것이다. 유럽 집단은 스웨덴 집단, 노르웨이 집단, 핀란드 집단, 러시아 집단, 덴마크 집단, 아이슬란드 집단, 아일랜드 집단, 켈트(Kelt) 집단, 영국 집단, 스코틀랜드 집단, 네덜란드 집단, 벨기에 집단, 프랑스 집단, 독일 집단, 스페인 집단, 포르투갈 집단, 이탈리아 집단, 폴란드 집단, 불가리아 집단, 슬라브 집단, 세르비아 집단, 보스니아 집단, 체코 집단, 그리스 집단, 및 터키 집단을 포함하나, 이에 한정되지 않는다. 다른 구체예에서, 본 발명은 또한 반투(Bantu), 만덴크(Mandenk), 요루바(Yoruba), 산(San), 음부티 피그미(Mbuti Pygmy), 오르카디안(Orcadian), 아디겔(Adygel), 러시안(Russian), 사르디니안(Sardinian), 투스칸(Tuscan), 모자비트(Mozabite), 베두인(Bedouin), 드루즈(Druze), 팔레스티니안(Palestinian), 발로치(Balochi), 브라휘(Brahui), 마크라니(Makrani), 신디(Sindhi), 파탄(Pathan), 부루쇼(Burusho), 하자라(Hazara), 위구르(Uygur), 칼라쉬(Kalash), 한(Han), 다이(Dai), 다우르(Daur), 헤젠(Hezhen), 라후(Lahu), 미아오(Miao), 오로켄(Oroqen), 쉬(She), 투지아(Tujia), 투(Tu), 시보(Xibo), 이(Yi), 몽골란(Mongolan), 낙시(Naxi), 캄보디안(Cambodian), 일본인( Japanese), 야쿠트(Yakut), 멜라네시안(Melanesian), 파푸안(Papuan), 카리티아난(Karitianan), 수루이(Surui), 콜럼비안(Columbian), 마야(Maya) 및 피마(Pima)를 포함하나, 이에 한정되지 않는 특정한 인간 집단에서 실시될 수 있다.
특정한 구체예에서, 본 발명은 아프리카 후손 또는 계통의 사람을 포함하는 집단과 같은 블랙 아프리카 선조(ancestry)를 포함하는 집단에 관한 것이다. 블랙 아프리가 선조는 흑인(black race)에 속하거나 또는 니그로 인종(negro race)에 속하는, 아프리카계 미국인(African-American), 아프로-아메리칸(Afro-American), 블랙 아메리칸(Black American)으로 자가-보고하는 것에 의해 결정될 수 있다. 예를 들면, 아프리카계 미국인 또는 블랙 아메리칸은 북미에 거주하고 아프리카의 흑인군에 속하는 기원을 갖는 사람들이다. 또 다른 예에서, 블랙 아프리카 선조의 자가-보고된 사람은 한 명 이상의 블랙 아프리카 선조의 부모 또는 한 명 이상의 블랙 아프리카 선조의 조부모를 가질 수 있다. 또 다른 구체예에서, 본 발명은 코카서스 기원의 개인들에 관한 것이다.
개체에서 인종적 기여는 또한 유전적 분석에 의해 결정될 수 있다. 선조의 유전적 분석은 Smith et al. (Am J Hum Genet 74, 1001-13 (2004))에 개시된 마커와 같은, 연관되지 않은(unlinked) 마이크로새틀라이트 마커를 이용하여 수행될 수 있다.
특정한 구체예에서, 본 발명은 앞서 기재된 바와 같이, 특정한 집단에서 확인된 마커 및/또는 일배체형에 관한 것이다. 본 발명이 속하는 기술 분야의 당업자는 상이한 집단에 적용되는 경우, 연관 불균형(LD)의 척도는 상이한 결과를 가져올 수 있다는 것을 이해할 것이다. 이는 특정한 게놈 영역에서 LD의 차이를 초래했을 수 있는 차등적 선택 압력(differential selective pressure) 및 상이한 인간 집단의 상이한 집단 역사 때문이다. 또한, 일부 마커들, 예를 들면, SNP 마커들이 하나의 집단에서는 다형성이나, 다른 집단에서는 다형성이 아니라는 것이 본 발명이 속하는 기술 분야의 당업자에게 잘 알려져 있다. 그러나, 본 발명이 속하는 기술 분야의 당업자는 입수가능한 방법을 적용하고, 본 명세서에서 고려되는 바와 같이, 임의의 인간 집단에서 본 발명을 실시할 것이다. 이는 특정한 집단 내에서 가장 강력한 연관을 제공하는 마커들을 확인하기 위해, 본 발명의 LD 영역에서 다형성 마커를 평가하는 것을 포함할 수 있다. 따라서, 본 발명의 위험 변이는 다양한 인간 집단에서 상이한 일배체형 배경에 상이한 빈도로 존재할 수 있다. 그러나, 당해 분야에서 알려진 방법 및 본 발명의 마커를 이용하여, 본 발명이 임의의 주어진 인간 집단에서 실시될 수 있다.
갑상선 자극 호르몬
갑상선-자극 호르몬(TSH 또는 티로트로핀(thyrotropin)으로도 알려짐)은 갑상선의 내분비 기능을 조절하는 뇌하수체 전엽의 갑상선 자극세포(thyrotrope)에 의해 합성되고 분비되는 펩티드 호르몬이다. TSH는 갑상선이 호르몬인 T4(thyroxine)과 T3(triiodothyronine)를 분비하도록 자극한다. TSH 생성은 시상하부에서 생성되고 상하수체 동맥(superior hypophyseal artery)을 통해 뇌하수체 전엽까지 수송되는 TRH(Thyrotropin Releasing Hormone)에 의해 조절되고, 뇌하수체 전염에서 TRH는 TSH 생성 및 분비를 증가시킨다. 소마토스타틴도 시상하부에 의해 생성되고, TSH의 뇌하수체 생성에 대한 반대 효과를 가져서, 그의 분비를 감소시키거나 또는 억제한다.
혈중 갑상선 호르몬(T3 및 T4)의 수준은 뇌하수체의 TSH 분비에 영향을 미친다; T3 및 T4의 수준이 낮을 때, TSH의 생성은 증가되고, 반대로, T3 및 T4의 수준이 높을 때, TSH 생성은 감소된다. 이 효과는 조절성 네가티브 피드백 루프(regulatory negative feedback loop)를 생성한다.
티록신(Thyroxine), 또는 3,5,3',5'-테트라-요오도티로닌(종종 T4로 약칭됨)은 갑상선의 여포 세포에 의해 분비되는 주요한 호르몬이다. T4는 혈액에서 수송되고, 분비된 T4의 99.95%는 주로, TBG(thyroxine-binding globulin)에 결합된 단백질이고, 보다 낮은 정도로, 트랜스티레틴(transthyretin) 및 혈청 알부민에 결합된 단백질이다. T4는 체내에서 대사과정의 속도 조절에 관여되고 신체 발달에 영향을 미친다. 티록신의 투여는 성체 마우스의 뇌에서 신경 성장 인자의 농도를 유의성 있게 증가시키는 것으로 확인되었다.
시상하부에서, T4는 T3로도 알려진, 트리요오도티로닌으로 전환된다. 갑상선은 T3보다 더 많은 양의 T4를 분비하므로, T4의 혈장 농도는 T3보다 40-배 더 높다. 순환 T3의 대부분은 T4의 탈요오드화(deiodination)에 의해 말초혈액에서 생성되고(85%), 이 과정은 T4의 외부 고리 상에 있는 5번 탄소로부터 요오드의 제거를 포함한다. 따라서, T4는 T3의 프로호르몬(prohormone)으로 작용한다.
유전적 검사의 유용성
본 발명이 속하는 기술 분야의 당업자는 본 명세서에 기재된 변이가 일반적으로 그 자체로 특정한 갑상선암을 발병할 개인의 절대적 확인을 제공하지 않는다는 것을 고려하고 이해할 것이다. 그러나, 본 명세서에 기재된 변이는 본 발명의 위험 또는 보호성 변이를 갖는 개인이 갑상선암을 발병할 증가된 및/또는 감소된 가능성을 나타낸다. 본 발명자들은 본 명세서의 예시(Exemplification)에서 제시된 통계적으로 유의성 있는 결과에 의해 뒷받침되는 바와 같이, 특정한 변이가 갑상선 발병의 증가된 위험도를 부여한다는 것을 발견했다. 이 정보는 조기에 치료를 적용적용할 수 있도록 하기 위해, 예를 들면, 조기 단계에 예방책을 개시하거나, 증상의 진행 및/또는 출현을 모니터링하기 위해 정기적인 건강검진을 수행하거나, 또는 초기 증상을 확인하기 위해 규칙적인 간격으로 검사를 계획하기 위해 이용될 수 있 기 때문에, 하기에서 보다 상세하게 요약되는 바와 같이, 그 자체로 매우 유용하다.
갑상선암을 발병할 위험도를 부여하는 유전적 변이에 대한 지식은 갑상선암을 발병할 증가된 위험도를 갖는 개체(즉, 위험 변이의 보인자)와 갑상선암을 발병할 감소된 위험도를 갖는 개체(즉, 보호성 변이의 보인자)를 구별하기 위해 유전적 테스트를 적용할 기회를 제공한다. 상기 언급된 두 그룹에 속하는 개체들에 대해, 유전적 테스트의 핵심 가치는 조기 단계에 질병, 또는 질병에 대한 소인을 진단하고 가장 적절한 치료를 제공할 수 있도록 하기 위해 임상의에게 질병의 예후/공격성(aggressiveness)에 대한 정보를 제공할 수 있는 가능성이다.
유전적 위험 인자의 존재, 또는 하나 이상의 위험 인자의 보인자일 증가된 위험도에 대한 증거의 인식은 갑상선암에 대한 공지된 환경적 위험 인자들을 피하거나 또는 최소화하는 것에 의해 보다 건강한 생활습관을 실천하기 위한 증가된 동기를 제공할 수 있기 때문에, 갑상선암의 가족력을 갖는 개인들 및 위험 변이의 보인자들은 유전적 검사로부터 잇점을 얻을 수 있다. 갑상선암으로 진단된 환자의 유전적 검사는 갑상선암의 주요 원인에 대한 중요한 정보를 제공할 수 있고, 의사가 각 개인에 대한 최상의 치료 옵션 및 약제를 선택할 수 있도록 기여할 수 있다.
앞서 검토된 바와 같이, 갑상선암에 대한 주요한 공지된 위험 인자는 방사선 노출이다. 미국에서 갑상선암 발생률은 수십년 동안 증가했으며(Davies, L. and Welch, H. G., Jama, 295, 2164 (2006)), 이는 갑상선암의 실제 발생률의 증가가 아니라, 무증상 암(sub-clinical cancer)의 증가된 검출에서 기인될 수 있다 (Davies, L. and Welch, H. G., Jama, 295, 2164 (2006)). 1980년대 초음파촬영술 및 미세침 흡인 생검법(fine-needle aspiration biopsy)의 도입이 소결절의 검출을 개선했고 결절의 세포학적 평가를 보다 일상적인 것이 되게 하였다 (Rojeski, M. T. and Gharib, H., N Engl J Med, 313, 428 (1985), Ross, D. S., J Clin Endocrinol Metab, 91, 4253 (2006)). 이와 같은 증가된 진단 정밀성(diganostic scrutiny)은 잠재적으로 치명적인 갑상선암의 조기 검출을 가능하게 할 수 있다. 그러나, 여러 연구는 갑상선암을 갑상선암으로 진단되지 않은 개인에서 흔한 부검 발견사항(최대 35%)으로 보고한다 (Bondeson, L. and Ljungberg, O., Cancer, 47, 319 (1981), Harach, H. R., et al., Cancer, 56, 531 (1985), Solares, C. A., et al., Am J Otolaryngol, 26, 87 (2005) and Sobrinho-Simoes, M. A., Sambade, M. C., and Goncalves, V., Cancer, 43, 1702 (1979)). 이는 많은 사람들이 그들의 건강에 대한 위협이 거의 또는 전혀 아닌 갑상선암의 무증상 형태를 가지고 살고 있다는 것을 시사한다.
의사들은 갑상선암의 의심을 확인하기 위해, 종괴(lump)의 크기 및 위치를 식별하고, 종괴가 비-암성(양성)인지 암성(악성)인지 여부를 결정하기 위해 여러 검사를 이용한다. 갑상선 자극 호르몬(TSH) 검사와 같은 혈액 검사는 갑상선 기능 을 조사한다.
갑상선 호르몬의 과다(갑상선기능항진증), 또는 결핍(갑상선기능저하증)을 앓는 것으로 의심되는 환자의 혈액에서 TSH 수준이 검사된다. 일반적으로, 성인에서 TSH의 정상 범위는 0.2 내지 10 uIU/mL (mIU/L와 동등함)이다. 치료 중인 환자의 최적 TSH 수준은 0.3 내지 3.0 mIU/L 범위이다. TSH 측정값의 해석은 또한 갑상선 호르몬 (T3 및 T4)의 혈액 수준에 의존적이다. 영국의 국립보건원(National Health Service)은 "정상(normal)" 범위가 0.1 내지 5.0 uIU/mL일 것으로 간주한다.
아동의 TSH 수준은 정상적으로 훨씬 높게 출발한다. 2002년에 미국의 임상생화학회(National Academy of Clinical Biochemistry, NACB)는 정상 출생 영아에서 약 1.3-19 uIU/mL에서 출발되어, 생후 10주에 0.6-10 uIU/mL까지 저하되고, 14개월에 0.4-7.0 uIU/mL까지 저하되며, 소아기 및 사춘기 동안 점진적으로 성인 수준, 0.4-4.0 uIU/mL까지 저하되는, 연령-관련 기준 한계(age-related reference limit)를 권고했다. NACB는 또한 연구가 2 uIU/mL보다 높은 최초 측정된 TSH 수준을 갖는 성인이 , 특히, 갑상선 항체가 상승한 경우, 이후 20년 동안 갑상선기능저하증 발병의 증가된 오즈비를 갖는다는 것을 확인했기 때문에 성인의 정상 (95%) 범위는 0.4-2.5 uIU/mL까지 저하될 것으로 예상된다고 발표했다.
일반적으로, TSH와 T3 및 T4는 모두 특정한 갑상선 기능이상이 원발성 뇌하수체 질환에 의해, 또는 원발성 갑상선 질환에 의해 유발되는지를 확인하기 위해 측정되어야 한다. TSH와 T3 및 T4가 모두 증가(감소)된 경우, 문제는 주로 뇌하수체에 있다. 하나의 성분(TSH)이 증가되고, 나머지(T3 및 T4)는 감소된 경우, 질환은 아마도 갑상선 자체에 있다. 동일한 논리가 낮은 TSH, 높은 T3 및 T4 발견에 적용된다.
갑상선암의 근본적인 유전적 위험 인자의 지식이 갑상선암의 스크리닝 프로그램의 적용에서 이용될 수 있다. 따라서, 갑상선암의 위험 변이의 보인자는 비-보인자보다 보다 빈번한 스크리닝으로부터 잇점을 얻을 수 있다. 위험 변이의 동형접합 보인자가 특히 갑상선암을 발병할 위험을 갖는다.
특정한 유전적 프로파일 하에서, 예를 들면, 본 명세서에 기재된 갑상선암에 대한 특정한 위험 대립인자(예를 들면, rs965513-A)의 존재시 TSH, T3 및 T4 수준을 결정하는 것이 유용할 수 있다. TSH, T3 및 T4는 갑상선 기능의 척도이므로, 진단 및 예방 스크리니링 프로그램은 그와 같은 임상적 측정을 포함하는 분석으로부터 잇점을 얻을 것이다. 예를 들면, rs965513-A의 1개 이상의 카피의 존재의 결정과 함께 TSH의 비정상(증가된 또는 감소된) 수준은 개인이 갑상선암을 발병할 위험이 있다는 것을 나타낸다. 일 구체예에서, rs965513-A의 존재시 개인에서 TSH의 감소된 수준의 결정은 개인에서 갑상선암의 증가된 위험을 나타낸다.
또한, 보인자는 초음파촬영술 및/또는 미세침 생검을 포함한, 보다 정밀한 스크리닝으로부터 잇점을 얻을 수 있다. 스크리닝 프로그램의 목표는 조기에 암을 검출하는 것이다. 공지된 위험 변이에 대한 개인의 유전적 상태의 파악은 적용가능한 스크리닝 프로그램의 선택에 기여할 수 있다. 특정한 구체예에서, 방사성 요오드 스캔(Radioactive Iodine (RAI) Scan), 초음파 검사, CT 스캔 (CAT 스캔), 자기공명영상(Magnetic Resonance Imaging, MRI), 양전자 단층 촬영(Positron Emission Tomography, PET) 스캔, 미세침 흡인 생검(Fine needle aspiration biopsy) 및 외과적 생검(surgical biopsy)으로부터 선택된 하나 이상의 진단 도구와 함께, 본 명세서에 기재된 갑상선암의 위험 변이를 이용하는 것이 유용할 수 있다.
방법
질병 위험 평가 및 위험 관리 방법이 본 명세서에 기재되며, 본 발명에 포함된다. 본 발명은 또한 치료제에 반응할 확률에 대해 개체를 평가하는 방법, 치료제의 효과를 예측하는 방법, 핵산, 폴리펩티드 및 항체 및 컴퓨터-구현 기능을 포함한다. 본 명세서에서 제시된 다양한 방법에서 이용하기 위한 키트도 본 발명에 포함된다.
진단 및 스크리닝 방법
특정한 구체예에서, 본 발명은 갑상선암으로 진단된 개체 또는 갑상선암에 대한 감수성을 갖는 개체에서 보다 빈번하게 나타나는 유전적 마커의 특정한 대립인자를 검출하는 것에 의해, 갑상선암, 또는 갑상선암에 대한 감수성을 진단하거나 또는 상기 진단을 보조하는 방법에 관한 것이다. 특정한 구체예에서, 본 발명은 하나 이상의 다형성 마커(예를 들면, 본 명세서에 기재된 마커)의 하나 이상의 대립인자를 검출하는 것에 의해 갑상선암에 대한 감수성을 결정하는 방법이다. 다른 구체예에서, 본 발명은 하나 이상의 다형성 마커의 하나 이상의 대립인자를 검출하는 것에 의해 갑상선암에 대한 감수성을 진단하는 방법에 관한 것이다. 본 발명은 특정한 마커의 특정한 대립인자 또는 일배체형의 검출이 갑상선암에 대한 감수성을 나타내는 것인 방법을 기재한다. 그와 같은 예후적 또는 예측적 분석법은 또한 갑상선암과 연관된 증상의 발생 전에 개체의 예방적 치료를 결정하기 위해 이용될 수 있다.
일부 구체예에서, 본 발명은 의료 전문가에 의해 수행되는 진단과 같은 진단의 임상적 적용 방법에 관한 것이다. 다른 구체예에서, 본 발명은 일반인(layman)에 의해 수행되는 진단 방법 또는 감수성의 결정 방법에 관한 것이다. 상기 일반인은 유전형분석 서비스의 고객일 수 있다. 상기 일반인은 또한 개인(즉, 고객)의 유전형 상태에 근거하여, 특정한 성향 또는 질병에 대한 유전적 위험 인자와 관련된 서비스를 제공하기 위해, 개체로부터의 DNA 시료에 대해 유전형 분석을 수행하는, 유전형 서비스 제공자일 수 있다. Molecular Inversion Probe 어레이 기술 (예를 들면, Affymetrix GeneChip), 및 BeadArray Technologies (예를 들면, Illumina GoldenGate and Infinium assays)와 같은 SNP 마커의 고효율 유전형분석(high-throughput genotyping)을 포함한, 유전형분석 기술에서의 최근의 기술적 진전은 개인들이 비교적 낮은 비용으로 그들의 게놈을 백만개 까지의 SNP에 대해 동시에 평가받을 수 있게 한다. 결과적으로 수득된, 개인에게 이용가능하게 된 유전형 정보는 공개 문헌 및 과학 저널로부터의 정보를 포함한, 다양한 SNP와 연관된 질병 또는 성향 위험도에 대한 정보와 비교될 수 있다. 따라서, 본 명세서에 기재된 바와 같은, 질병-연관 대립인자의 진단적 응용은 자신의 유전형 데이터의 분석을 통해 개인에 의해, 임상적 테스트의 결과에 근거하여 의료전문가에 의해, 또는 유전형 서비스 제공자를 포함한 제3자에 의해 수행될 수 있다. 제3자는 또한 본 명세서에 기재된 유전적 마커를 포함한, 특정한 유전적 위험 인자와 관련된 서비스를 제공하기 위해 고객으로부터의 유전형 정보를 해석하는 서비스 제공자일 수 있다. 바꾸어 말하면, 유전적 위험도에 근거한 감수성의 진단 또는 평가가 대상자의 유전형 상태에 대한 정보 및 특정한 유전적 위험 인자(예를 들면, 특정한 SNP)에 의해 부여되는 위험도에 대한 지식에 근거하여, 의료 전문가, 유전학 상담자(genetic counselor), 유전형분석 서비스를 제공하는 제3자, 위험도 평가 서비스를 제공하는 제3자 또는 또는 일반인(예를 들면 개인)에 의해 이루어질 수 있다. 본 발명에서, 용어 "진단하는(diagnosing)" 및 "감수성을 진단하다(dignose a susceptibility)" 및 "감수성을 결정하다(determine a suceptiblity)"는 전술된 방법을 포함한, 모든 이용가능한 진단 방법을 의미하도록 의도된다.
일부 구체예에서, 개체로부터 게놈 DNA를 포함하는 시료가 수집된다. 그와 같은 시료는 예를 들면, 구강 도말(buccal swab), 타액 시료, 혈액 시료, 또는 본 명세서에서 더 설명되는 바와 같이, 게놈 DNA를 포함하는 기타 적합한 시료일 수 있다. 그 후, 게놈 DNA가 고-효율 어레이 기술(high-throughput array technology)과 같은, 당업자에게 이용가능한 통상적인 기법을 이용하여 분석된다. 그와 같은 유전형분석으로부터의 결과가 컴퓨터 데이터베이스를 포함한 데이터 캐리어, 데이터 저장 디스크와 같은 편리한 데이터 저장 유닛에, 또는 다른 편리한 데이터 저장 수단에 의해 저장된다. 일부 구체예에서, 상기 컴퓨터 데이터베이스는 객체형 데이터베이스(object database), 관계형 데이터베이스(relational database) 또는 후-관계형 데이터베이스(post-relational database)이다. 뒤이어, 유전형 데이터가 본 명세서에 기재된 유전적 변이와 같은, 특정한 인간 상태에 대한 감수성 변이인 것으로 알려진 일부 변이의 존재에 대해 분석된다. 유전형 데이터가 편리한 데이터 조회(query) 방법을 이용하여 데이터 저장 유닛으로부터 재생될 수 있다. 개체에 대한 특정한 유전형에 의해 부여된 위험도를 계산하는 것은 개체의 유전형을 유전형에 대한, 예를 들면, 특정한 질병 또는 성향(예를 들면, 갑상선암)에 대한 위험 변이의 이형접합형 보인자에 대한 이전에 결정된 위험도(예를 들면, 상대적 위험도(RR) 또는 오즈비(OR)로 표현됨)와 비교하는 것에 근거할 수 있다. 개체에 대한 계산된 위험도는 일치된(matched) 성별 및 민족기원을 갖는 평균 집단 대비, 사람, 또는 사람의 특정한 유전형에 대한 상대적 위험도일 수 있다. 평균 집단 위험도는 기준 집단으로부터의 결과를 이용하여, 상이한 유전형의 위험도의 가중평균(weighted average)으로 표현될 수 있고, 그 후, 집단 대비 유전형 그룹의 위험도를 계산하기 위한 적합한 계산이 수행될 수 있다. 대안적으로, 개체에 대한 위험도는 특정한 유전형의 비교, 예를 들면, 마커의 위험 대립인자의 비-보인자(non-carrier) 대비, 마커의 위험 대립인자의 이형접합형 보인자의 비교에 근거한다. 일부 구체예에서, 집단 평균은 사용자가 해석하기 용이한 척도, 즉, 집단의 평균 대비, 자신의 유전형에 근거한, 개체의 위험도를 제공하는 척도를 제공하기 때문에, 집단 평균을 이용하는 것이 더 편리할 수 있다. 계산된 위험도 추정값은 웹사이트, 바람직하게는 안전한 웹사이트를 통해 고객에게 이용가능하게 될 수 있다.
일부 구체예에서, 서비스 제공자는 제공되는 서비스에 고객에 의해 제공된 시료로부터 게놈 DNA를 단리(isolate)하는 단계, 상기 단리된 DNA의 유전형분석을 수행하는 단계, 상기 유전형 데이터에 기반하여 유전적 위험도를 계산하는 단계 및 상기 위험도를 상기 고객에게 보고하는 단계의 모든 단계들을 포함할 것이다. 일부 다른 구체예에서, 서비스 제공자는 상기 서비스에 개체에 대한 유전형 데이터의 해석, 즉, 상기 개체에 대한 유전형 데이터에 기반한 특정한 유전적 변이에 대한 위험도 추정값을 포함시킬 것이다. 일부 다른 구체예에서, 서비스 제공자는 개체(고객)로부터의 단리된 DNA의 시료로부터 출발하여, 유전형 분석 서비스 및 유전형 데이터의 해석을 포함한 서비스를 포함할 수 있다.
복수 개의 위험 변이에 대한 전체 위험도(overall risk)는 표준 방법을 이용하여 수행될 수 있다. 예를 들면, 승법 모델을 가정하는 것, 즉, 개별적인 위험 변이의 위험도가 전체 효과를 확립하기 위해 곱해진다는 것을 가정하는 것은 복수 개의 마커에 대한 전체 위험도의 계산을 간단하게 할 것이다.
또한, 특정한 다른 구체예에서, 본 발명은 갑상선암으로 진단되지 않은 개인, 또는 일반 집단에서보다 갑상선암 환자에서 덜 빈번하게 나타나는 특정한 유전적 마커 또는 일배체형을 검출하는 것에 의해, 갑상선암에 대한 감소된 감수성을 결정하는 방법에 관한 것이다.
본 명세서에서 설명되고 예시된 바와 같이, 특정한 마커 대립인자 또는 일배체형(예를 들면, rs965513, 및 이와 연관 불균형인 마커들)은 갑상선암과 연관된다. 일 구체예에서, 상기 마커 대립인자 또는 일배체형은 갑상선암에 대한 유의성 있는 위험도 또는 감수성을 부여하는 마커 대립인자 또는 일배체형이다. 또 다른 구체예에서, 본 발명은 개인에서 갑상선암에 대한 감수성을 결정하는 방법에 관한 것이고, 상기 방법은 상기 개인으로부터 수득된 핵산 시료 중에서 하나 이상의 다형성 마커의 하나 이상의 대립인자의 존재 또는 부재를 결정하는 단계를 포함하고, 상기 하나 이상의 다형성 마커는 표 2에 열거된 다형성 마커로 구성된 군으로부터 선택된다. 또 다른 구체예에서, 본 발명은 rs965513 (서열번호 1), rs907580 (서열번호 81) 및 rs7024345 (서열번호 66)로부터 선택된 하나 이상의 마커에 대해 스크리닝하는 것에 의해, 개인에서 갑상선암에 대한 감수성을 결정하는 방법에 관한 것이다. 또 다른 구체예에서, 상기 마커 대립인자 또는 일배체형은 건강한 개체(대조군, 예를 들면, 집단 대조군)에서 그의 존재의 빈도 대비, 갑상선암을 갖거나, 또는 갑상선암에 대한 감수성을 갖는 개체(질병군)에 보다 빈번하게 존재한다. 일부 구체예에서, 상기 하나 이상의 마커 대립인자 또는 일배체형의 연관의 유의성은 0.05 미만의 p 값을 특징으로 한다. 다른 구체예에서, 연관의 유의성은 보다 작은 p-값, 예를 들면, 0.01 미만, 0.001 미만, 0.0001 미만, 0.00001 미만, 0.000001 미만, 0.0000001 미만, 0.00000001 미만 또는 0.000000001 미만의 p-값과 같은 보다 작은 p-값을 특징으로 한다.
이 구체예에서, 상기 하나 이상의 마커 대립인자 또는 일배체형의 존재는 갑상선암에 대한 감수성을 나타낸다. 이 진단 방법들은 갑상선암의 위험도와 연관된 특정한 대립인자 또는 일배체형이 특정한 개인에 존재하는지 여부를 결정하는 단계를 포함한다. 본 명세서에 기재된 일배체형은 다양한 유전적 마커(예를 들면, SNP, 마이크로새틀라이트, 또는 기타 유전적 변이)의 대립인자의 조합을 포함한다. 특정한 일배체형을 구성하는 특정한 유전적 마커 대립인자의 검출은 본 명세서에 기재되고 및/또는 당해 기술 분야에서 공지된 다양한 방법에 의해 수행될 수 있다. 예를 들면, 유전적 마커는 핵산 수준에서(예를 들면, 직접적인 뉴클레오티드 서열결정에 의해, 또는 당해 기술분야의 당업자에게 공지된 기타 유전형분석 수단에 의해) 검출되거나, 유전적 마커가 단백질의 코딩 서열에 영향을 미치는 경우, 아미노산 수준에서(예를 들면, 단백질 서열결정에 의해, 또는 그와 같은 단백질을 인식하는 항체를 이용한 면역분석법에 의해) 검출될 수 있다. 본 발명의 마커 대립인자 또는 일배체형은 갑상선암과 연관된 게놈 세그먼트(예를 들면, 유전자)의 단편에 해당한다. 그와 같은 단편은 대상이 되는 다형성 마커 또는 일배체형의 DNA 서열을 포괄하나, 또한, 상기 마커 또는 일배체형과 강한 LD(연관 불균형)인 DNA 세그먼트를 포함할 수 있다. 일 구체예에서, 그와 같은 세그먼트는 0.2보다 큰 r2 값 및/또는 |D'|> 0.8에 의해 결정된 마커 또는 일배체형과 LD인 세그먼트를 포함한다.
일 구체예에서, 갑상선암에 대한 감수성의 결정은 혼성화 방법을 이용하여 수행될 수 있다(모든 보충물을 포함한, Current Protocols in Molecular Biology, Ausubel, F. et al., eds. , John Wiley & Sons 참조). 특정한 마커 대립인자의 존재는 상기 특정한 대립인자에 대해 특이적인 핵산 프로브의 서열-특이적 혼성화에 의해 표시될 수 있다. 각각 특정한 대립인자에 대해 특이적인, 여러 개의 서열-특이적 핵산 프로브를 사용하는 것에 의해, 하나 이상의 특정한 마커 대립인자 또는 하나 이상의 특정한 일배체형의 존재가 표시될 수 있다. 서열-특이적 프로브는 게놈 DNA, RNA, 또는 cDNA에 혼성화되도록 지시될 수 있다. 본 명세서에서 사용된, "핵산 프로브(nucleic acid probe)"는 상보적 서열에 혼성화되는 DNA 프로브 또는 RNA 프로브일 수 있다. 본 발명이 속하는 기술 분야의 당업자는 테스트 시료로부터의 게놈 서열에 특정한 대립인자가 존재하는 경우에만 서열 특이적 혼성화가 일어나도록 그와 같은 프로브를 설계하는 방법을 알 것이다. 본 발명은 또한 특정한 다형성 마커의 유전형 분석을 위한 상업적으로 입수가능한 기술 및 방법을 포함한 편리한 유전형분석 방법을 이용하여 실시될 수 있다.
갑상선암에 대한 감수성을 결정하기 위해, 갑상선암과 연관된 핵산을 포함하는 테스트 시료, 예를 들면, 게놈 DNA 시료를 하나 이상의 핵산 프로브와 접촉시키는 것에 의해 혼성화 시료가 형성된다. mRNA 또는 게놈 DNA를 검출하기 위한 프로브의 비-한정적인 예는 본 명세서에 기재된 mRNA 또는 게놈 DNA 서열에 혼성화될 수 있는 표지된 핵산 프로브이다. 상기 핵산 프로브는 예를 들면, 전장(full-length) 핵산 분자, 또는 그의 일부, 예를 들면, 적합한 mRNA 또는 게놈 DNA에 엄격한(stringent) 조건 하에 특이적으로 혼성화하기에 충분한 15개 이상, 30개 이상, 50개 이상, 100개 이상, 250개 이상, 또는 500개 이상의 뉴클레오티드로 구성된 길이의 올리고뉴클레오티드일 수 있다. 예를 들면, 핵산 프로브는 선택적으로 본 명세서에 기재된 마커의 하나 이상의 대립인자, 또는 본 명세서에 기재된 하나 이상의 일배체형을 포함하는, 본 명세서에 기재된, LD 블럭 C09 전체 또는 일부를 포함할 수 있거나, 또는 상기 프로브는 그와 같은 서열에 상보적일 수 있다. 상기 핵산 프로브는 또한 선택적으로 본 명세서에서 표 2에 표시된 다형성 마커들 중 하나 이상의 하나 이상의 대립인자를 포함하는, 본 명세서에 표시된 서열번호 1 내지 229 중 하나의 뉴클레오티드 서열 전부 또는 일부를 포함하거나, 또는 상기 프로브는 그와 같은 서열의 상보적 서열일 수 있다. 본 발명의 진단 분석법에서 이용하기 위한 다른 적합한 프로브가 본 명세서에 기재된다. 혼성화는 당해 기술 분야의 당업자에게 잘 알려진 방법에 의해 수행될 수 있다(예를 들면, 모든 보충물을 포함한, Current Protocols in Molecular Biology, Ausubel, F. et al ., eds., John Wiley & Sons 참조). 일 구체예에서, 혼성화는 특이적 혼성화, 즉, 불일치를 포함하지 않는 혼성화(정확한 혼성화)를 의미한다. 일 구체예에서, 상기 특이적 혼성화를 위한 혼성화 조건은 높은 엄격성이다.
존재하는 경우, 특이적 혼성화는 표준 방법을 이용하여 검출된다. 핵산 프로브와 테스트 시료 내의 핵산 간에 특이적 혼성화가 일어나면, 상기 시료는 상기 핵산 프로브에 존재하는 뉴클레오티드에 상보적인 대립인자를 포함한다. 본 발명의 마커, 또는 본 발명의 일배체형을 구성하는 마커에 대해, 상기 방법이 반복될 수 있거나, 또는 한번에 하나 이상의 마커 대립인자를 검출하기 위해 복수 개의 프로브가 동시에 이용될 수 있다. 특정한 일배체형의 둘 이상의 마커 대립인자를 포함하는 단일 프로브를 설계할 수 있다(예를 들면, 2개, 3개, 4개, 5개, 또는 특정한 일배체형을 구성하는 모든 마커에 상보적인 대립인자를 포함하는 프로브). 시료에서 일배체형의 특정한 마커의 검출은 상기 시료의 원천이 특정한 일배체형(예를 들면, 일배체형)을 가지며 따라서, 갑상선암에 대해 감수성을 갖는다는 것을 나타낸다.
하나의 바람직한 구체예에서, Kutyavin 등 (Nucleic Acid Res. 34:e128 (2006))에 기재된 바와 같이, 그의 3' 말단에 있는 형광 모이어티(fluorescent moiety) 또는 그룹 및 그의 5' 말단에 있는 퀀처(quencher)를 포함하는 검출 올리고뉴클레오티드 및 인핸서 올리고뉴클레오티드를 이용하는 방법이 적용될 수 있다. 형광 모이어티는 Gig Harbor Green 또는 Yakima Yellow, 또는 다른 적합한 형광 모이어티일 수 있다. 검출 프로브는 검출대상 SNP 다형성을 포함하는 짧은 뉴클레오티드 서열에 혼성화되도록 설계된다. 바람직하게는, 상기 SNP는 검출 프로브의 말단 잔기부터 3' 말단으로부터의 -6 잔기까지 중에 존재한다. 인핸서는 검출 프로브에 대해 3'인 DNA 주형에 혼성화되는 짧은 올리고뉴클레오티드 프로브이다. 상기 프로브들은 검출 프로브와 인핸서 뉴클레오티드 프로브가 모두 주형에 결합된 경우, 상기 검출 프로브와 인핸서 뉴클레오티드 프로브 간에 단일 뉴클레오티드 갭이 존재하도록 설계된다. 상기 갭은 엔도뉴클레아제 IV와 같은, 엔도뉴클레아제에 의해 인식되는 합성 탈염기 부위(synthetic abasic site)를 생성한다. 상기 효소는 완전히 상보적인 검출 프로브로부터 염료를 절단하나, 불일치를 포함하는 검출 프로브는 절단할 수 없다. 따라서, 방출된 형광 모이어티의 형광을 측정하는 것에 의해, 검출 프로브의 뉴클레오티드 서열에 의해 정의된 특정한 대립인자의 존재의 평가가 수행될 수 있다.
검출 프로브는 임의의 적합한 크기일 수 있으나, 바람직하게는 프로브는 비교적 짧다. 일 구체예에서, 상기 프로브는 길이가 5개 내지 100개의 뉴클레오티드로 구성된다. 또 다른 구체예에서, 상기 프로브는 길이가 10개 내지 50개의 뉴클레오티드로 구성되고, 또 다른 구체예에서, 상기 프로브는 길이가 12개 내지 30개의 뉴클레오티드로 구성된다. 다른 길이의 프로브들도 가능하고 본 발명이 속하는 기술 분야의 평균적인 당업자의 기술의 범위 내에 속한다.
바람직한 구체예에서, SNP 다형성을 포함하는 DNA 주형은 검출 전에 중합효소 연쇄 반응(PCR)에 의해 증폭된다. 그와 같은 구체예에서, 증폭된 DNA가 검출 프로프 및 인핸서 프로브에 대한 주형으로 기능한다.
검출 프로브, 인핸서 프로브, 및/또는 PCR에 의한 주형의 증폭을 위해 이용되는 프라이머의 특정한 구체예는 변형된 A 및 변형된 G를 포함한, 변형된 염기의 이용을 포함한다. 변형된 염기의 이용은 주형 DNA에 대한 뉴클레오티드 분자(프로브 및/또는 프라이머)의 용융점을 조정하기 위해, 예를 들면, 상보적인 T와 세개의 수소 결합을 형성할 수 있는 능력을 갖는 변형된 A가 이용될 수 있는, 낮은 비율의 G 또는 C 염기를 포함하는 영역에서 용융점을 높이기 위해, 또는 예를 들면, 상보적인 C와 두 개의 수소 결합만을 형성하는 변형된 G 염기를 이용하는 것에 의해, 높은 비율의 G 또는 C 염기를 포함하는 영역에서 용융점을 낮추기 위해 유용할 수 있다. 바람직한 구체예에서, 검출 뉴클레오티드 프로브의 설계에서 변형된 염기들이 이용된다. 당업자에게 알려진 임의의 변형된 염기가 이 방법에서 선택될 수 있고, 적합한 염기의 선택은 본 명세서의 교시 및 당업자에게 알려진 상업적 출처로부터 이용가능한 공지된 염기에 근거하여 당업자의 기술의 범위 내에 속한다.
대안적으로, 펩티드 핵산(peptide nucleic acid, PNA) 프로브가 본 명세서에 기재된 혼성화 방법에서 핵산 프로브에 추가하여, 또는 핵산 프로브 대신에 이용될 수 있다. PNA는 유기 염기 (A, G, C, T 또는 U)가 메틸렌 카르보닐 링커를 통해 글리신 질소에 결합된, N-(2-아미노에틸)글리신 유닛과 같은, 펩티드-유사 무기 백본(peptide-like inorganic backbone)을 갖는 DNA 모방체(mimic)이다(예를 들면, Nielsen, P., et al., Bioconjug. Chem. 5:3-7 (1994) 참조). PNA 프로브는 갑상선암과 연관된 하나 이상의 마커 대립인자 또는 일배체형을 포함하는 것으로 사료되는 시료 내의 분자에 특이적으로 혼성화하도록 설계될 수 있다. 따라서, PNA 프로브의 혼성화는 갑상선암 또는 갑상선암에 대한 감수성을 진단한다.
본 발명의 일 구체예에서, 개체로부터 수득된 게놈 DNA를 포함하는 테스트 시료가 수집되고 본 발명의 하나 이상의 마커 또는 일배체형을 포함하는 단편을 증폭시키기 위해 중합효소 연쇄 반응(PCR)이 이용된다. 본 명세서에 기재된 바와 같이, 특정한 마커 대립인자 또는 일배체형의 확인은 다양한 방법(예를 들면, 서열 분석, 제한효소 처리에 의한 분석, 특이적 혼성화, SSCP(single stranded conformation polymorphism), 전기영동 분석 등)을 이용하여 수행될 수 있다. 또 다른 구체예에서, 진단은 정량적 PCR(kinetic thermal cycling)을 이용한 발현 분석에 의해 수행된다. 이 기법은 예를 들면, TaqMan®(Applied Biosystems, Foster City, CA)과 같은 상업적으로 이용가능한 기술을 이용할 수 있다. 상기 기법은 갑상선암과 연관된 핵산에 의해 코딩된 폴리펩티드 또는 스플라이싱 변이(splicing variant)의 발현 또는 조성의 변화의 존재를 평가할 수 있다. 또한, 변이의 발현은 물리적으로 또는 기능적으로 상이한 것으로 정량될 수 있다.
본 발명의 방법의 또 다른 구체예에서, 특정한 대립인자가 기준 서열 대비 제한효소 인식 부위의 생성 또는 제거를 초래하는 경우, 제한효소 처리(restriction digestion)에 의한 분석이 상기 특정한 대립인자를 검출하기 위해 이용될 수 있다. RFLP(Restriction fragment length polymorphism) 분석은 예를 들면, 전술된 Current Protocols in Molecular Biology에 기재된 바와 같이 수행될 수 있다. 관련된 DNA 단편의 제한효소 처리의 결과 패턴(digestion pattern)이 시료 중의 특정한 대립인자의 존재 또는 부재를 나타낸다.
특정한 대립인자 또는 일배체형을 검출하기 위해, 서열 분석이 또한 이용될 수 있다. 따라서, 일 구체예에서, 특정한 마커 대립인자 또는 일배체형의 존재 또는 부재의 결정은 대상 또는 개체로부터 수득된 DNA 또는 RNA의 테스트 시료의 서열 분석을 포함한다. PCR 또는 다른 적합한 방법이 갑상선암과 연관된 핵산의 일부를 증폭시키기 위해 이용될 수 있고, 그 후, 특정한 대립인자의 존재가 직접 시료 중의 게놈 DNA의 다형성 부위(또는 일배체형 내의 복수 개의 다형성 부위들)의 서열을 결정하는 것에 의해 검출될 수 있다.
또 다른 구체예에서, 개체로부터의 표적 핵산 서열 세그먼트에 상보적인 올리고뉴클레오티드 프로브의 어레이(array)가 다형성 부위에서 특정한 대립인자를 식별하기 위해 이용될 수 있다. 예를 들면, 올리고뉴클레오티드 어레이가 이용될 수 있다. 올리고뉴클레오티드 어레이는 일반적으로 상이한 공지된 위치에 있는 기판(substrate)의 표면에 결합된 복수 개의 상이한 올리고뉴클레오티드 프로브를 포함한다. 이 어레이들은 일반적으로 포토리소그래피 방법과 고상 올리고뉴클레오티드 합성 방법의 조합을 포함하는 기계적 합성 방법, 또는 본 발명이 속하는 기술 분야의 당업자에게 공지된 다른 방법을 이용하여 생산된다(각각의 전체 교시가 참조에 의해 본 명세서에 포함된, Bier, F. F., et al., Adv Biochem Eng Biotechnol, 109:433-54 (2008); Hoheisel, J.D., Nat Rev Genet 7:200-10 (2006); Fan, J.B., et al., Methods Enzymol 410:57-73 (2006); Raquossis, J & Elvidge, G., Expert Rev Mol Diagn 6:145-52 (2006); Mockler, T.C., et al Genomics 85: 1-15 (2005), 및 인용된 참조 문헌 참조). 다형성의 검출을 위한 올리고뉴클레오티드 어레이의 제조 및 이용의 추가적인 설명이 예를 들면, 전체 교시가 참조에 의해 본 명세서에 포함된 미국특허 제6,858,394호, 제6,429,027호, 제5,445,934호, 제5,700,637호, 제5,744,305호, 제5,945,334호, 제6,054,270호, 제6,300,063호, 제6,733,977호, 제7,364,858호, 유럽특허 제619 321호, 및 제373 203호에서 찾을 수 있다.
본 발명이 속하는 기술 분야의 당업자에게 이용가능한 핵산 분석의 다른 방법들이 갑상선암과 연관된 다형성 부위에서 특정한 대립인자를 검출하기 위해 이용될 수 있다. 대표적인 방법들은 예를 들면, 직접적인 수동 서열결정(direct manual sequencing) (Church and Gilbert, Proc. Natl. Acad. Sci. USA, 81: 1991-1995 (1988); Sanger, F., et al., Proc. Natl. Acad. Sci. USA, 74:5463-5467 (1977); Beavis, et al., U.S. Patent No. 5,288,644); 자동화된 형광 서열결정(automated fluorescent sequencing); 단일가닥 구조 다형성(SSCP) 분석; CDGE(clamped denaturing gel electrophoresis); DGGE(denaturing gradient gel electrophoresis) (Sheffield, V., et al., Proc. Natl. Acad. Sci. USA, 86:232-236 (1989)), 운동성 변화 분석(mobility shift analysis)(Orita, M., et al., Proc. Natl. Acad. Sci. USA, 86:2766-2770 (1989)), 제한효소 분석(Flavell, R., et al., Cell, 15:25-41 (1978); Geever, R., et al., Proc. Natl. Acad. Sci. USA, 78:5081-5085 (1981)); 헤테로듀플렉스(heteroduplex) 분석; 화학적 불일치 절단(chemical mismatch cleavage, CMC) (Cotton, R., et al., Proc. Natl. Acad. Sci. USA, 85:4397-4401 (1985)); RNase 보호 분석(Myers, R., et al., Science, 230:1242-1246 (1985); E. coli mutS 단백질과 같은, 뉴클레오티드 불일치를 인식하는 폴리펩티드의 이용; 및 대립인자-특이적 PCR을 포함한다.
본 발명의 또 다른 구체예에서, 갑상선암의 진단 또는 갑상선암에 대한 감수성의 결정은 본 발명의 유전적 마커 또는 일배체형이 폴리펩티드의 조성 또는 발현의 변화를 초래하는 경우, 갑상선암과 연관된 핵산에 의해 코딩된 폴리펩티드의 발현 및/또는 조성을 조사하는 것에 의해 수행될 수 있다. 따라서, 본 발명의 마커 또는 일배체형이 폴리펩티드의 조성 또는 발현의 변화를 초래하는 경우, 갑상선암에 대한 감수성의 결정은 이 폴리펩티드 중 하나, 또는 갑상선암과 연관된 핵산에 의해 코딩된 또 다른 폴리펩티드의 발현 및/또는 조성을 조사하는 것에 의해 수행될 수 있다. 갑상선암에 대한 연관을 보이는 본 발명의 마커는 이 인접 유전자들(nearby gene) 중 하나 이상에 대한 효과를 통해 역할을 수행할 수 있다. 특정한 구체예에서, 상기 마커는 FoxE1 유전자에 대한 효과를 보인다. 이 유전자들(예를 들면, FoxE1 유전자)에 영향을 미치는 가능한 메카니즘은 예를 들면, 전사에 대한 효과, RNA 스플라이싱에 대한 효과, mRNA의 대안적인 스플라이싱 형태의 상대적 양의 변화, RNA 안정성에 대한 효과, 핵으로부터 세포질로의 수송에 대한 효과, 및 번역의 효율성 및 정확도에 대한 효과를 포함한다.
따라서, 또 다른 구체예에서, 본 명세서에서 제시된 변이(마커 또는 일배체형)는 FoxE1 유전자의 발현에 영향을 미친다. 유전자 발현에 영향을 미치는 조절 요소가 유전자의 프로모터 영역으로부터 멀리 위치할 수 있고, 심지어는 수십 킬로베이스 또는 수백 킬로베이스 떨어져서 위치할 수 있다는 것이 잘 알려져 있다. 본 발명의 하나 이상의 다형성 마커의 하나 이상의 대립인자의 존재 또는 부재에 대해 분석하는 것에 의해, 따라서, 인접 유전자의 발현 수준을 평가할 수 있다. 따라서, 본 명세서에 기재된 마커, 또는 그와 같은 마커를 포함하는 일배체형의 검출이 FoxE1 유전자, 또는 본 명세서에서 갑상선암의 위험도를 부여하는 것으로 확인된 마커들 중 하나와 연관된 또 다른 인접 유전자의 발현을 평가 및/또는 예측하기 위해 이용될 수 있다.
ELISA(enzyme linked immunosorbent assay), 웨스턴 블롯(Western blot), 면역침전(immunoprecipitation) 및 면역형광(immunofluorescence)을 포함한 다양한 방법들이 단백질 발현 수준을 검출하기 위해 이용될 수 있다. 개체로부터의 테스트 시료가 특정한 핵산에 의해 코딩되는 폴리펩티드의 발현의 변화 및/또는 그의 조성의 변화의 존재에 대해 평가된다. 특정한 핵산 핵산에 의해 코딩되는 폴리펩티드의 발현의 변화가 예를 들면, 정량적인 폴리펩티드 발현(즉, 생성되는 폴리펩티드의 양)의 변화일 수 있다. 특정한 핵산 핵산에 의해 코딩되는 폴리펩티드의 조성의 변화는 정성적 폴리펩티드 발현의 변화(예를 들면, 돌연변이 폴리펩티드의 발현 또는 상이한 스플라이싱 변이의 발현)이다. 일 구체예에서, 갑상선암에 대한 감수성의 진단은 갑상선암과 연관된 핵산에 의해 코딩되는 특정한 스플라이싱 변이, 또는 스플라이싱 변이의 특정한 패턴을 검출하는 것에 의해 수행된다.
또한, 그와 같은 변화(정량적 및 정성적 변화)가 모두 존재할 수 있다. 본 명세서에서 사용된 폴리펩티드 발현 또는 조성의 "변화(alteration)"는 대조군 시료에서 상기 폴리펩티드의 발현 또는 조성 대비, 테스트 시료 중의 발현 또는 조성의 변화를 의미한다. 대조군 시료는 테스트 시료에 대응되는 시료(예를 들면, 동일한 종류의 세포로부터 유래된 시료)이고, 갑상선암에 의해 영향받지 않고 및/또는 갑상선암에 대한 감수성을 갖지 않는 개체로부터 유래된다. 일 구체예에서, 대조군 시료는 본 명세서에 기재된 갑상선암과 연관된 마커 대립인자 또는 일배체형을 갖지 않는 개체로부터 유래된다. 유사하게, 대조군 시료 대비, 테스트 시료 중에 하나 이상의 상이한 스플라이싱 변이의 존재, 또는 테스트 시료 중의 상이한 스플라이싱 변이의 유의성 있게 상이한 양의 존재는 갑상선암에 대한 감수성을 나타낼 수 있다. 대조군 시료 대비, 테스트 시료 중의 폴리펩티드의 발현 또는 조성의 변화는 특정한 대립인자가 대조군 시료 중의 기준 대비 스플라이스 위치를 변화시키는 경우, 특정한 대립인자를 나타낼 수 있다. 분광분석법, 비색법(colorimetry), 전기영동, 등전점 전기영동법(isoelectric focusing), 및 면역블롯팅(immunoblotting)(예를 들면, 전술된 바와 같은, Current Protocols in Molecular Biology, 특히, 챕터 10 참조)과 같은 면역분석법(immunoassays)(예를 들면, David et al., 미국특허 제4,376,110호)을 포함한, 핵산에 의해 코딩된 폴리펩티드의 발현 또는 조성을 조사하는 다양한 수단이 본 발명이 속하는 기술 분야의 당업자에게 알려져 있고, 이용될 수 있다.
예를 들면, 일 구체예에서, 갑상선암과 연관된 핵산에 의해 코딩되는 폴리펩티드에 결합할 수 있는 항체(예를 들면, 검출가능한 표지를 갖는 항체)가 이용될 수 있다. 항체는 다중클론 항체 또는 단일클론 항체일 수 있다. 완전한 항체, 또는 그의 단편(예를 들면, Fv, Fab, Fab', F(ab')2)이 이용될 수 있다. 프로브 또는 항체에 대해, 용어 "표지된(labeled)"은 검출가능한 물질을 프로브 또는 항체에 결합(즉, 물리적 연결)시키는 것에 의한 프로브 또는 항체의 직접적인 표지화, 및 직접적으로 표지된 또 다른 시약과의 반응성에 의한 프로브 또는 항체의 간접적 표지화를 포함하도록 의도된다. 간접적 표지화의 예는 표지된 이차 항체(예를 들면, 형광-표지된 이차 항체)를 이용한 일차 항체의 검출 및 형광-표지된 스트렙타비딘에 의해 검출될 수 있는, 비오틴에 의한 DNA 프로브의 말단-표지화(end-labeling)를 포함한다.
이 방법의 일 구체예에서, 테스트 시료 중의 폴리펩티드의 수준 또는 양이 대조군 시료 중의 폴리펩티드의 수준 또는 양과 비교된다. 대조군 시료 중의 폴리펩티드의 수준 또는 양에 비해 더 높거나 또는 더 낮으며, 그 차이가 통계적으로 유의성이 있는 것인 테스트 시료 중의 폴리펩티드의 수준 또는 양은 핵산에 의해 코딩된 폴리펩티드의 발현의 변화를 나타내고, 발현의 차이를 유발한 특정한 대립인자 또는 일배체형을 진단한다. 대안적으로, 테스트 시료 중의 폴리펩티드의 조성이 대조군 시료 중의 상기 폴리펩티드의 조성과 비교된다. 또 다른 구체예에서, 폴리펩티드의 수준 또는 양과 조성이 모두 테스트 시료 및 대조군 시료에서 평가될 수 있다.
또 다른 구체예에서, 갑상선암에 대한 감수성의 결정은 추가적인 단백질-기반 분석법, RNA-기반 분석법 또는 DNA-기반 분석법과 조합하여, 하나 이상의 본 발명의 마커 또는 일배체형을 검출하는 것에 의해 수행된다.
키트
본 발명의 방법에서 유용한 키트는 본 명세서에 기재된 방법에서 유용한 성분들, 예를 들면, 핵산 증폭용 프라이머, 혼성화 프로브, 제한효소(예를 들면, RFLP 분석용 제한효소), 대립인자-특이적 올리고뉴클레오티드, 본 명세서에 기재된 본 발명의 핵산(예를 들면, 본 발명의 하나 이상의 다형성 마커 및/또는 일배체형을 포함하는 게놈 단편)에 의해 코딩된 변화된 폴리펩티드에 결합하는 항체 또는 본 명세서에 기재된 본 발명의 핵산에 의해 코딩된 변화되지 않은(원형의) 폴리펩티드에 결합하는 항체, 갑상선암과 연관된 핵산의 증폭을 위한 수단, 갑상선암과 연관된 핵산의 핵산 서열을 분석하기 위한 수단, 갑상선암과 연관된 핵산에 코딩되는 폴리펩티드의 아미노산 서열을 분석하기 위한 수단, 등을 포함한다. 본 발명의 키트는 예를 들면, 필요한 완충액, 본 발명의 핵산(예를 들면, 본 명세서에 기재된 하나 이상의 다형성 마커를 포함하는 핵산 세그먼트)을 증폭하기 위한 핵산 프라이머, 및 그와 같은 프라이머 및 필요한 효소(예를 들면, DNA 중합효소)를 이용하여 증폭된 단편의 대립인자-특이적 검출을 위한 시약을 포함할 수 있다. 추가적으로, 키트는 본 발명의 방법과 조합되어 이용될 수 있는 분석법을 위한 시약들, 예를 들면, 본 명세서에 기재된 갑상선암 진단 분석법에서 이용되는 시약을 제공할 수 있다.
일 구체예에서, 본 발명은 개인에서 갑상선암에 대한 감수성을 검출하기 위한 키트에 관한 것으로서, 상기 키트는 상기 개인의 게놈에서 본 발명의 다형성의 하나 이상의 대립인자를 선택적으로 검출하는 시약을 포함한다. 특정한 구체예에서, 상기 시약은 상기 하나 이상의 다형성 마커를 포함하는 상기 개인의 게놈의 단편에 혼성화하는 하나 이상의 연속된(contiguous) 올리고뉴클레오티드를 포함한다. 또 다른 구체예에서, 상기 개인으로부터 수득된 게놈 세그먼트의 반대쪽 가닥에 혼성화하는 한 쌍 이상의 올리고뉴클레오티드를 포함하고, 상기 각 올리고뉴클레오티드 프라이머 쌍은 하나의 다형성을 포함하는 상기 개인의 게놈의 단편을 선택적으로 증폭시키도록 설계된다. 하나의 그와 같은 구체예에서, 상기 다형성은 본 명세서에서 표 2에 표시된 다형성으로 구성된 군으로부터 선택된다. 또 다른 구체예에서, 상기 다형성은 rs965513 (서열번호 1), rs907580 (서열번호 81) 및 rs7024345 (서열번호 66)으로부터 선택된다. 또 다른 구체예에서, 상기 단편은 크기가 20 bp 이상이다. 그와 같은 올리고뉴클레오티드 또는 핵산(예를 들면, 올리고뉴클레오티드 프라이머)은 갑상선암의 위험도와 연관된 다형성(예를 들면, SNP 또는 마이크로새틀라이트)을 둘러싼(flanking) 핵산 서열의 부분을 이용하여 설계될 수 있다. 또 다른 구체예에서, 상기 키트는 하나 이상의 특정한 다형성 마커 또는 일배체형을 대립인자-특이적으로 검출할 수 있는 하나 이상의 표지된 핵산, 및 상기 표지의 검출을 위한 시약을 포함한다. 적합한 표지는 예를 들면, 방사성 동위원소, 형광 표지, 효소 표지, 효소 보조-인자(co-factor) 표지, 자성 표지(magnetic label), 스핀 표지(spin label), 에피토프 표지(epitope label)를 포함한다.
특정한 구체예에서, 본 발명의 키트의 시약에 의해 검출될 다형성 마커 또는 일배체형은 표 2에 표시된 마커들로 구성된 군으로부터 선택된, 하나 이상의 마커, 두개 이상의 마커, 세개 이상의 마커, 네개 이상의 마커, 또는 다섯개 이상의 마커를 포함한다. 또 다른 구체예에서, 검출될 마커 또는 일배체형은 마커 rs965513 (서열번호 1), rs907580 (서열번호 81) 및 rs7024345 (서열번호 66)로 구성된 군으로부터 선택된 하나 이상의 마커, 두개 이상의 마커, 세개 이상의 마커, 네개 이상의 마커, 또는 다섯개 이상의 마커를 포함한다. 또 다른 구체예에서, 검출될 마커는 마커 rs965513 (서열번호 1), 또는 이와 연관 불균형인 마커들로부터 선택된다.
하나의 바람직한 구체예에서, 본 발명의 마커들을 검출하기 위한 키트는 검출대상 SNP 다형성을 포함하는 주형 DNA의 세그먼트에 혼성화하는 검출 올리고뉴클레오티드 프로브, 인핸서 올리고뉴클레오티드 프로브 및 엔도뉴클레아제를 포함한다. 앞서 설명된 바와 같이, 검출 올리고뉴클레오티드 프로브는 그의 3' 말단에 있는 형광 모이어티(fluorescent moiety) 또는 그룹 및 그의 5' 말단에 있는 퀀처(quencher)를 포함하고 Kutyavin 등 (Nucleic Acid Res. 34:e128 (2006))에 기재된 바와 같은 인핸서 올리고뉴클레오티드가 이용된다. 형광 모이어티는 Gig Harbor Green 또는 Yakima Yellow, 또는 다른 적합한 형광 모이어티일 수 있다. 검출 프로브는 검출대상 SNP 다형성을 포함하는 짧은 뉴클레오티드 서열에 혼성화되도록 설계된다. 바람직하게는, 상기 SNP는 검출 프로브의 말단 잔기부터 3' 말단으로부터의 -6 잔기까지 중에 존재한다. 인핸서는 검출 프로브에 대해 3'인 DNA 주형에 혼성화되는 짧은 올리고뉴클레오티드 프로브이다. 상기 프로브들은 검출 프로브와 인핸서 뉴클레오티드 프로브가 모두 주형에 결합된 경우, 상기 검출 프로브와 인핸서 뉴클레오티드 프로브 간에 단일 뉴클레오티드 갭이 존재하도록 설계된다. 상기 갭은 엔도뉴클레아제 IV와 같은, 엔도뉴클레아제에 의해 인식되는 합성 탈염기 부위(synthetic abasic site)를 생성한다. 상기 효소는 완전히 상보적인 검출 프로브로부터 염료를 절단하나, 불일치를 포함하는 검출 프로브는 절단할 수 없다. 따라서, 방출된 형광 모이어티의 형광을 측정하는 것에 의해, 검출 프로브의 뉴클레오티드 서열에 의해 정의된 특정한 대립인자의 존재의 평가가 수행될 수 있다.
검출 프로브는 임의의 적합한 크기일 수 있으나, 바람직하게는 프로브는 비교적 짧다. 일 구체예에서, 상기 프로브는 길이가 5개 내지 100개의 뉴클레오티드로 구성된다. 또 다른 구체예에서, 상기 프로브는 길이가 10개 내지 50개의 뉴클레오티드로 구성되고, 또 다른 구체예에서, 상기 프로브는 길이가 12개 내지 30개의 뉴클레오티드로 구성된다. 다른 길이의 프로브들도 가능하고 본 발명이 속하는 기술 분야의 평균적인 당업자의 기술의 범위 내에 속한다.
바람직한 구체예에서, SNP 다형성을 포함하는 DNA 주형은 검출 전에 중합효소 연쇄 반응(PCR)에 의해 증폭되고, 그와 같은 증폭을 위한 프라이머는 시약 키트에 포함된다. 그와 같은 구체예에서, 증폭된 DNA가 검출 프로프 및 인핸서 프로브에 대한 주형으로 기능한다.
일 구체예에서, DNA 주형은 본 명세서에 기재된 특정한 다형성 마커의 존재에 대한 평가 전에, WGA(Whole Genome Amplification)에 의해 증폭된다. 당업자에게 잘 알려진, WGA를 수행하기 위한 표준 방법이 이용될 수 있고, 본 발명의 범위 내에 속한다. 하나의 그와 같은 구체예에서, WGA를 수행하기 위한 시약이 시약 키트에 포함된다.
검출 프로브, 인핸서 프로브, 및/또는 PCR에 의한 주형의 증폭을 위해 이용되는 프라이머의 특정한 구체예는 변형된 A 및 변형된 G를 포함한, 변형된 염기의 이용을 포함한다. 변형된 염기의 이용은 주형 DNA에 대한 뉴클레오티드 분자(프로브 및/또는 프라이머)의 용융점을 조정하기 위해, 예를 들면, 상보적인 T와 세개의 수소 결합을 형성할 수 있는 능력을 갖는 변형된 A가 이용될 수 있는, 낮은 비율의 G 또는 C 염기를 포함하는 영역에서 용융점을 높이기 위해, 또는 예를 들면, 상보적인 C와 두 개의 수소 결합만을 형성하는 변형된 G 염기를 이용하는 것에 의해, 높은 비율의 G 또는 C 염기를 포함하는 영역에서 용융점을 낮추기 위해 유용할 수 있다. 바람직한 구체예에서, 검출 뉴클레오티드 프로브의 설계에서 변형된 염기들이 이용된다. 당업자에게 알려진 임의의 변형된 염기가 이 방법에서 선택될 수 있고, 적합한 염기의 선택은 본 명세서의 교시 및 당업자에게 알려진 상업적 출처로부터 이용가능한 공지된 염기에 근거하여 당업자의 기술의 범위 내에 속한다.
하나의 그와 같은 구체예에서, 상기 마커 또는 일배체형의 존재의 결정은 갑상선암에 대한 감수성(증가된 감수성 또는 감소된 감수성)을 나타낸다. 또 다른 구체예에서, 상기 마커 대립인자 또는 일배체형의 존재의 결정은 갑상선암 치료제에 대한 반응을 나타낸다. 또 다른 구체예에서, 상기 마커 또는 일배체형의 존재의 결정은 갑상선암 치료제에 대한 반응을 나타낸다. 또 다른 구체예에서, 상기 마커 또는 일배체형의 존재의 결정은 갑상선암 치료의 예후를 나타낸다. 그와 같은 치료는 수술에 의한 개입, 투약, 방사선요법 또는 기타 수단(예를 들면, 생활방식 변화)을 포함할 수 있다.
본 발명의 추가적인 양태에서, 약제학적 팩(pack)(키트)이 제공되고, 상기 팩은 치료제와 본 명세서에 개시된 바와 같은, 본 발명의 하나 이상의 변이에 대해 진단적으로 테스트된 인간에게 상기 치료제를 투여하는 것에 대한 일련의 설명서를 포함한다. 상기 치료제는 소형 분자 약물, 항체, 펩티드, 안티센스 또는 RNAi 분자, 또는 기타 치료 분자일 수 있다. 일 구체예에서, 본 발명의 하나 이상의 변이의 보인자로 확인된 개인은 치료제의 처방된 투여량을 복용하도록 지시된다. 하나의 그와 같은 구체예에서, 본 발명의 하나 이상의 변이의 동형접합 보인자로 확인된 개인은 상기 치료제의 처방된 투여량을 복용하도록 지시된다. 또 다른 구체예에서, 본 발명의 하나 이상의 변이의 비-보인자로 확인된 개인은 치료제의 처방된 투여량을 복용하도록 지시된다.
특정한 구체예에서, 상기 키트는 또한 상기 키트를 포함하는 시약을 이용하는 것에 대한 일련의 설명서를 포함한다.
치료제
갑상선암의 치료 옵션은 현재의 표준 치료 방법 및 임상 시험 중인 방법들을 포함한다.
갑상선암에 대한 현재의 치료 옵션은 하기를 포함한다:
수술 - 갑상선암이 발견된 엽(lobe)를 절제하는 엽절제술(lobectomy), 갑상선의 매우 작은 부분을 제외한 모든 부분이 제거되는 것인 갑상선절제술(thyroidectomy), 갑상선 전체가 제거되는 것인 갑상선 적출술(total thyroidectomoy), 및 암 증식을 포함하는 경부의 림프절이 제거되는 것인 림프절절제술(lymphadenectomoy)을 포함한다;
방사선 요법 - 외부(externation) 방사선 요법 및 방사성 화합물을 이용한 내부 방사선 요법(internal radiation therapy)을 포함한다. 방사선 요법은 생존하는 암 세포를 제거하기 위해 외과적 수술 후에 적용될 수 있다. 또한, 갑상선 여포암 및 갑상선 유두암은 종종 방사성 요오드(RAI) 요법에 의해 치료된다;
화학요법 - 화학요법 화합물의 경구 투여 또는 정맥 투여를 포함한다;
갑상선 호르몬 요법 - 이 요법은 신체에서 갑상선-자극 호르몬(TSH)의 생성을 방해하는 약물의 투여를 포함한다.
18F-플루오로데옥시글루코오스(FluGlucoScan); 111In-펜테트레오티드 (NeuroendoMedix); 퇴행성 갑상선암의 치료에서 컴브레타스타틴(Combretastatin) 및 파클리탁셀/카르보플라틴, 수술후 치료에서 갑상선-자극 호르몬을 동반하거나 또는 동반하지 않은 131I, XL184-301 (Exelixis), 반데타니브(Zactima; Astra Zeneca), CS-7017 (Sankyo), 데시타빈 (Dacogen; 5-aza-2'-deoxycytidine), 이리노테칸 (Pfizer, Yakult Honsha), 보르테조미브 (Velcade; Millenium Pharmaceuticals); 17-AAG (17-N-Allylamino-17-demethoxygeldanamycin), 소라페니브 (Nexavar, Bayer), 재조합 티로트로핀, 레날리도미드 (Revlimid, Celgene), 수니티니브 (Sutent), 소라페니브 (Nexavar, Bayer), 악시티니브 (AG-013736, Pfizer), 발프로산 (2-프로필펜탄산), 반데타니브 (Zactima, Astra Zeneca), AZD6244 (Astra Zeneca), 베바시주마브 (Avastin, Genetech/Roche), MK-0646 (Merck), 파조파니브 (GlaxoSmithKline), 아필베르세프트 (Sanofi-Aventis & Regeneron Pharmaceuticals), 및 FR901228 (Romedepsin)의 시험을 포함하나, 이에 한정되지 않는, 갑상선암 치료법 및 치료제에 대한 다수의 임상 시험이 현재 진행중이다.
본 명세서에서 갑상선암의 증가된 위험도를 부여하는 것으로 개시된 위험 변이(마커 및/또는 일배체형)는 갑상선암을 위한 신규한 치료 표적의 식별에서 유용하게 이용될 수 있다. 예를 들면, 이 변이들 중 하나 이상을 포함하거나 이들과 연관 불균형인 유전자, 또는 이들의 산물(예를 들면, FoxE1 유전자 및 그의 유전자 산물), 및 이 변이 유전자들 또는 이들의 산물에 의해 직접적으로 또는 간접적으로 조절되거나 또는 이들과 상호작용하는 유전자 또는 그들의 산물이 갑상선암을 치료하거나, 갑상선암과 연관된 증상의 발생을 예방하거나 또는 지연시키는 치료제의 개발을 위해 표적화될 수 있다. 치료제는 하나 이상의, 예를 들면, 표적 유전자 또는 그들의 유전자 산물의 기능 및/또는 수준을 조절할 수 있는, 작은 비-단백질(non-protein) 및 비-핵산 분자, 단백질, 펩티드, 단백질 단편, 핵산(DNA, RNA), PNA(peptide nucleic acid), 또는 그들의 유도체 또는 모방체(mimetics)를 포함할 수 있다.
본 발명의 핵산 및/또는 변이, 또는 이들의 상보적 서열을 포함하는 핵산이 세포, 조직 또는 기관에서 유전자 발현을 조절하기 위한 안티센스 구조물(antisense construct)로서 이용될 수 있다. 안티센스 기법과 연관된 방법은 당업자에게 잘 알려져 있고, 예를 들면, Antisense Drug Technology: Principles, Strategies, and Applications, Crooke, ed., Marcel Dekker Inc., New York (2001)에서 설명되고 검토된다. 일반적으로, 안티센스 핵산 분자는 안티센스 분자가 상기 mRNA에 혼성화하여, mRNA의 단백질로의 번역을 차단할 수 있게, 유전자에 의해 발현된 mRNA의 영역에 상보적이게 설계된다. 절단제(cleaver) 및 차단제(blocker)를 포함한, 여러 종류의 안티센스 올리고뉴클레오티드가 본 발명이 속하는 기술 분야의 당업자에게 알려져 있다. 전자, 즉, 절단제는 표적 RNA 부위에 결합하고, 상기 표적 RNA를 절단하는, 세포내 뉴클레아제(예를 들면, RnaseH 또는 Rnase L)를 활성화시킨다. 차단제는 표적 RNA에 결합하고, 리보좀의 입체 장애(steric hindrance)에 의해 단백질 번역을 저해한다. 차단제의 예는 핵산, 모르폴리노 화합물, LNA(locked nucleic acid) 및 메틸포스포네이트를 포함한다(Thompson, Drug Discovery Today, 7:912-917 (2002)). 안티센스 올리고뉴클레오티드는 직접적으로 치료제로서 유용하고, 또한 예를 들면, 유전자 넉-아웃(knock-out) 또는 유전자 넉-다운 실험에 의해, 유전자 기능을 결정하고 검증하기 위해 유용하다. 안티센스 기술은 Lavery et al., Curr. Opin. Drug Discov. Devel. 6:561-569 (2003), Stephens et al., Curr. Opin. Mol. Ther. 5:118-122 (2003), Kurreck, Eur. J. Biochem. 270:1628-44 (2003), Dias et al., Mol. Cancer Ter. 1:347-55 (2002), Chen, Methods Mol. Med. 75:621-636 (2003), Wang et al., Curr. Cancer Drug Targets 1:177-96 (2001), 및 Bennett, Antisense Nucleic Acid Drug.Dev. 12:215-24 (2002)에 더 설명된다.
본 명세서에 기재된 변이는 특정한 변이에 특이적인 안티센스 시약의 선택 및 설계를 위해 이용될 수 있다. 본 명세서에 기재된 변이에 관한 정보를 이용하여, 본 발명의 하나 이상의 변이를 포함하는 mRNA 분자를 특이적으로 표적화하는 안티센스 올리고뉴클레오티드 또는 다른 안티센스 분자가 설계될 수 있다. 이 방식으로, 본 발명의 하나 이상의 변이(마커 및/또는 일배체형)를 포함하는 mRNA 분자의 발현이 저해되거나 또는 차단될 수 있다. 일 구체예에서, 안티센스 분자는 표적 핵산의 특정한 대립인자 형태(즉, 하나 이상의 변이(대립인자 및/또는 일배체형))에 특이적으로 결합하여, 이에 의해 이 특정한 대립인자 또는 일배체형으로부터 유래된 산물의 번역을 억제하나, 표적 핵산 분자의 특정한 다형성 부위의 다른 또는 대안적인 변이에 결합하지 않도록 설계된다.
안티센스 분자는 유전자 발현을 저해하고, 따라서, 단백질 발현을 저해하기 위해 mRNA를 불활성화시키기 위해 이용될 수 있기 때문에, 안티센스 분자는 질병을 치료하기 위해 이용될 수 있다. 방법은 mRNA가 번역되는 능력을 약화시키는, mRNA의 하나 이상의 영역에 상보적인 뉴클레오티드 서열을 포함하는 리보자임(ribozyme)에 의한 절단을 포함할 수 있다. 그와 같은 mRNA 영역은 예를 들면, 단백질-코딩 영역, 특히, 촉매 활성, 기질 및/또는 리간드 결합 부위, 또는 단백질의 다른 기능성 도메인에 상응하는 단백질-코딩 영역을 포함한다.
C. elegans (Fire et al.,Nature 391:806-11 (1998))에서의 최초의 발견 이후, 지난 10년간 RNA 간섭(RNA interference, RNAi) 현상이 활발하게 연구되었고, 최근년에, 인간 질병의 치료에서 RNAi의 잠재적 용도가 활발히 탐구되고 있다(reviewed in Kim & Rossi, Nature Rev. Genet. 8:173-204 (2007)). 유전자 침묵(gene silencing)으로도 불리는, RNA 간섭(RNAi)은 특정한 유전자를 중지(turn off)시키기 위해 이중-가닥 RNA 분자(dsRNA)를 이용하는 것에 기반한다. 세포에서, 세포질 이중가닥-RNA 분자(dsRNA)는 세포성 복합체(cellular complex)에 의해 작은 간섭 RNA(siRNA)로 가공된다. siRNA는 단백질-RNA 복합체를 표적 mRNA 상의 특정한 부위로 표적화되게 하여, 상기 mRNA의 절단을 초래한다(Thompson, Drug Discovery Today, 7:912-917 (2002)). siRNA 분자들은 통상적으로 길이가 약 20개, 21개, 22개 또는 23개의 뉴클레오티드로 구성된다. 따라서, 본 발명의 일 양태는 단리된 핵산 분자, 및 상기 분자들의 RNA 간섭을 위한 용도, 즉, 작은 간섭 RNA 분자(siRNA)로서의 용도에 관한 것이다. 일 구체예에서, 상기 단리된 핵산 분자는 길이가 18개 내지 26개의 뉴클레오티드로 구성되고, 바람직하게는 19개 내지 25개의 뉴클레오티드로 구성되며, 보다 바람직하게는 20개 내지 24개의 뉴클레오티드로 구성되고, 보다 바람직하게는, 21개, 22개 또는 23개의 뉴클레오티드로 구성된다.
RNAi-매개 유전자 침묵을 위한 또 다른 경로는 세포에서 전구체 miRNA(precursor microRNA, pri-miRNA)를 생성하기 위해 가공되는, 내재적으로 코딩된 일차 마이크로RNA(endogenously encoded micorRNA)(pri-miRNA) 전사체에서 기인한다. 이 miRNA 분자들은 핵으로부터 세포질로 유출되고, 세포질에서 성숙 miRNA 분자(mature miRNA)를 생성하기 위해 가공을 거치고, 상기 miRNA는 mRNA의 3' 비번역 영역(untranslated region, UTR) 내의 표적 부위를 인식하는 것에 의해 번역 저해(translational inhibition)를 주도하고, 뒤이어 P-바디(P-body)를 가공하는 것에 의해 mRNA 분해를 주도한다(reviewed in Kim & Rossi, Nature Rev. Genet. 8:173-204 (2007)).
RNAi의 임상적 적용은 바람직하게는 크기가 약 20 내지 23개의 뉴클레오티드로 구성되고, 바람직하게는 2개의 뉴클레오티드로 구성된 3' 오버랩(overlap)을 갖는 것인 합성 siRNA 듀플렉스의 내포(incorporation)를 포함한다. 유전자 발현의 넉다운은 표적 mRNA에 대한 서열-특이적 설계에 의해 확립된다. 그와 같은 분자의 최적 설계 및 합성을 위한 여러 상업적 사이트들이 본 발명이 속하는 기술 분야의 당업자에게 알려져 있다.
다른 적용들은 보다 긴 siRNA 분자(통상적으로 25 내지 30개의 뉴클레오티드로 구성된 길이, 바람직하게는 약 27개의 뉴클레오티드로 구성된 길이), 및 작은 헤어핀 RNA(small hairpin, sh RNA; 통상적으로 약 29개의 뉴클레오티드로 구성된 길이)를 제공한다. 후자는 Amarzguioui 등(FEBS Lett. 579:5974-81 (2005))에 기재된 바와 같이, 자연적으로 발현된다. 화학적으로 합성된 siRNA 및 shRNA는 인 비보 가공을 위한 기질이며, 일부 경우에, 보다 짧은 설계의 경우보다 더 강력한 유전자 침묵을 제공한다(Kim et al., Nature Biotechnol. 23:222-226 (2005); Siolas et al., Nature Biotechnol. 23:227-231 (2005)). 일반적으로, siRNA의 세포내 농도가 후속 세포 분열에 의해 희석되기 때문에, siRNA는 유전자 발현의 일시적 침묵을 제공한다. 대조적으로, 발현된 shRNA는 shRNA의 전사가 일어나는 동안은, 표적 전사체(target transcript)의 장기적이고 안정적인 넉다운을 매개한다(Marques et al., Nature Biotechnol. 23:559-565 (2006); Brummelkamp et al., Science 296: 550-553 (2002)).
siRNA, miRNA 및 shRNA를 포함하는 RNAi 분자들은 서열-의존적 방식으로 작용하기 때문에, 본 명세서에 기재된 변이(예를 들면, 표 2에 표시된 마커 및 일배체형)는 특정한 대립인자 및/또는 일배체형(예를 들면, 본 발명의 대립인자 및/또는 일배체형)을 포함하는 특이적 핵산 분자를 인식하나, 다른 대립인자 또는 일배체형을 포함하는 핵산 분자는 인식하지 않는 RNAi 시약을 설계하기 위해 이용될 수 있다. 따라서, 이 RNAi 시약은 표적 핵산 분자를 인식하고 파괴시킬 수 있다. 안티센스 시약의 경우와 같이, RNAi 시약은 치료제로서(즉, 질병-연관 유전자 또는 질병-연관 유전자 변이의 중지(turn off)를 위해) 유용할 수 있으나, 또한 유전자 기능을 규명하고 검증하기 위해 유용할 수 있다(예를 들면, 유전자 넉-아웃 또는 유전자 넉-다운 실험에 의해).
RNAi의 전달은 본 발명이 속하는 기술 분야에서 당업자에게 알려진 다양한 방법에 의해 수행될 수 있다. 비-바이러스 전달(non-viral delivery)을 이용하는 방법은 콜레스테롤, 안정한 핵산-지질 입자(stable nucleic acid-lipid particle, SNALP), 중쇄 항체 단편(Fab), 앱타머(aptamer) 및 나노입자를 포함한다. 바이러스에 의한 전달 방법(viral delivery method)은 렌티바이러스, 아데노바이러스 및 아데노-연관 바이러스(adeno-associated virus)의 이용을 포함한다. 일부 구체예에서, siRNA 분자는 그들의 안정성을 증가시키기 위해 화학적으로 변형된다. 이는 2'-O-메틸퓨린 및 2'-플루오로피리미딘을 포함한, 리보오스의 2' 위치에서의 변형을 포함할 수 있고, 이 변형들은 Rnase 활성에 대한 내성을 제공한다. 다른 화학적 변형이 가능하며 본 발명이 속하는 기술 분야의 당업자에게 알려져 있다.
하기의 참조문헌들이 RNAi, 및 RNAi를 이용한 특정한 유전자의 표적화 가능성의 추가적인 요약을 제공한다: Kim & Rossi, Nat. Rev. Genet. 8:173-184 (2007), Chen & Rajewsky, Nat. Rev. Genet. 8: 93-103 (2007), Reynolds, et al., Nat. Biotechnol. 22:326-330 (2004), Chi et al., Proc. Natl. Acad. Sci. USA 100:6343-6346 (2003), Vickers et al., J. Biol. Chem. 278:7108-7118 (2003), Agami, Curr. Opin. Chem. Biol. 6:829-834 (2002), Lavery, et al., Curr. Opin. Drug Discov. Devel. 6:561-569 (2003), Shi, Trends Genet. 19:9-12 (2003), Shuey et al., Drug Discov. Today 7:1040-46 (2002), McManus et al., Nat. Rev. Genet. 3:737-747 (2002), Xia et al., Nat. Biotechnol. 20:1006-10 (2002), Plasterk et al., curr. Opin. Genet. Dev. 10:562-7 (2000), Bosher et al., Nat. Cell Biol. 2:E31-6 (2000), 및 Hunter, Curr. Biol. 9:R440-442 (1999).
갑상선암과 같은 질병의 발병에 대한 증가된 소인(predispotion) 또는 위험도를 초래하는 유전적 결함, 또는 상기 질병을 유발하는 결함이 유전적 결함을 갖는 개체에게 상기 유전적 결함의 부위에 정상/야생형 뉴클레오티드를 공급하는 복구 서열(repair sequence)을 내포하는 핵산 단편을 투여하는 것에 의해 영구적으로 정정될 수 있다. 그와 같은 부위-특이적 복구 서열은 개체의 게놈 DNA의 내재적 복구를 촉진하기 위해 작용하는 RNA/DNA 올리고뉴클레오티드를 포함(concompass)할 수 있다. 복구 서열의 투여는 음이온성 리포좀 내에 캡슐화된, 폴리에틸렌이민과의 복합체, 아데노바이러스 벡터와 같은 바이러스 벡터 또는 투여되는 핵산의 세포내 흡수를 촉진하기에 적합한 다른 약제학적 조성물과 같은, 적합한 비히클에 의해 수행될 수 있다. 그 후, 키메라 올리고뉴클레오티드가 개체의 게놈으로 정상적인 서열의 내포를 유도하여, 정상/야생형 유전자 산물의 발현을 유도하기 때문에, 유전적 결함이 극복될 수 있다. 서열 교체(replacement)가 유전되고, 따라서, 질환 또는 상태와 연관된 증상의 영구적인 치유 및 경감을 가능하게 한다.
본 발명은 갑상선암을 치료하기 위해 이용될 수 있는 화합물 또는 작용제를 확인(식별, identify)하는 방법을 제공한다. 따라서, 본 발명의 변이는 치료제의 확인 및/또는 개발을 위한 표적으로 유용하다. 특정한 구체예에서, 그와 같은 방법은 작용제 또는 화합물이 본 발명의 하나 이상의 변이(마커 및/또는 일배체형)를 포함하는 핵산, 또는 상기 핵산의 코딩된 산물의 활성 및/또는 발현을 조절하는 능력을 분석하는 단계를 포함할 수 있다. 특정한 구체예에서, 상기 화합물 또는 작용제는 FoxE1 유전자의 활성 또는 발현을 조절한다. 상기 작용제 또는 화합물은 코딩된 핵산 산물, 즉, FoxE1 단백질 산물의 활성 또는 발현을 저해 또는 변화시킬 수 있다. 그와 같은 실험을 수행하기 위한 분석법은 당업자에게 공지된 바와 같이, 세포-기반 시스템 또는 세포-불포함 시스템(cell-free system)에서 수행될 수 있다. 세포-기반 시스템은 본래 목적 핵산 분자를 발현하는 세포, 또는 특정한 원하는 핵산 분자를 발현하도록 유전적으로 변형된 재조합 세포를 포함한다.
환자에서 변이 유전자 발현이 변이-함유 핵산 서열의 발현(예를 들면, 하나 이상의 변이를 포함하는 RNA로 전사되고, 뒤이어 단백질로 번역될 수 있는, 본 발명의 하나 이상의 변이를 포함하는 유전자), 또는 정상적인 전사체의 발현 수준 또는 패턴에 영향을 미치는 변이, 예를 들면, 유전자의 조절 또는 제어 영역의 변이에 따른, 정상/야생형 핵산 서열의 변화된 발현에 의해 평가될 수 있다. 유전자 발현에 대한 분석법은 직접적인 핵산 분석법(mRNA), 발현된 단백질 수준에 대한 분석법, 또는 경로, 예를 들면, 신호 경로(signal pathway)에 관여된 부수적(collateral) 화합물의 분석을 포함한다. 또한, 신호 경로에 대응하여 상향-조절 또는 하향-조절되는 유전자의 발현이 분석될 수 있다. 일 구체예는 루시페라아제와 같은 리포터 유전자를 목적 유전자의 조절 영역에 작동가능하게 연결하는 단계를 포함한다.
일 구체예에서, 세포가 후보 화합물 또는 작용제와 접촉되고, mRAN의 발현이 결정되는 경우, 유전자 발현의 조절제(modulator)가 확인될 수 있다. 후보 화합물 또는 작용제의 존재시의 mRNA의 발현 수준이 상기 화합물 또는 작용제의 부재시의 발현 수준에 비교될 수 있다. 이 비교에 근거하여, 갑상선암을 치료하기 위한 후보 화합물 또는 작용제가 변이 유전자의 유전자 발현을 조절하는 화합물 또는 작용제로 확인될 수 있다. mRNA 또는 코딩된 단백질의 발현이 후보 화합물 또는 작용제의 부재시보다 존재 시에 통계적으로 유의성 있게 더 높은 경우, 상기 후보 화합물 또는 작용제는 상기 핵산의 발현의 촉진제 또는 상향-조절제(up-regulator)로 확인된다. 핵산 발현 또는 단백질 수준이 후보 화합물 또는 작용제의 부재시 보다 존재 시에 통계적으로 유의성 있게 더 낮은 경우, 상기 후보 화합물은 상기 핵산의 발현의 저해제 또는 하향-조절제(down-regulator)로 확인된다.
본 발명은 또한 약물(화합물 및/또는 작용제) 스크리닝을 통해 확인된 화합물을 유전자 조절제(즉, 유전자 발현의 촉진제 및/또는 저해제)로 이용한 치료 방법을 제공한다.
치료제에 대한 반응의 확률을 평가하는 방법, 치료의 진행을 모니터링하는 방법 및 갑상선암의 치료 방법
본 발명이 속하는 기술 분야에서 공지된 바와 같이, 개체들은 특정한 치료(예를 들면, 치료제 또는 치료 방법)에 대해 차등적 반응을 가질 수 있다. 약물유전학(Pharmacogenomics)은 유전적 변이(예를 들면, 본 발명의 변이(마커 및/또는 일배체형))가 변화된 약물 소인(drug disposition) 및/또는 약물의 비정상적인 또는 변화된 작용 때문에, 약물 반응에 어떻게 영향을 미치는지의 문제를 다룬다. 따라서, 차등적 반응의 근거(basis)가 부분적으로 유전학적으로 결정될 수 있다. 약물 반응에 영향을 미치는 유전적 변이에 따른 임상적 결과는 일부 개체(본 발명의 유전적 변이의 보인자 또는 비-보인자)에서 약물의 독성, 또는 약물의 치료적 실패(therapeutic failure)를 초래할 수 있다. 따라서, 본 발명의 변이는 치료제 및/또는 방법이 신체에 대해 작용하는 방식, 또는 신체가 치료제를 대사하는 방식을 결정할 수 있다.
따라서, 일 구체예에서, 다형성 부위(예를 들면, rs965513 다형성 마커, 또는 이와 연관 불균형인 마커)에서 특정한 대립인자 또는 일배체형의 존재는 특정한 치료 방식(treatment modality)에 대한 상이한 반응을 나타낸다. 이는 갑상선암으로 진단되고, 본 발명의 다형성 부위에 특정한 대립인자 또는 일배체형(예를 들면, 본 발명의 보호성 대립인자 및/또는 일배체형)을 갖는 환자가 갑상선암을 치료하기 위해 이용된 특정한 치료제, 약물 및/또는 다른 치료법에 대해 보다 유리하게 또는 보다 불리하게 반응할 것이라는 것을 의미한다. 따라서, 상기 마커 대립인자 또는 일배체형의 존재 또는 부재는 환자에 대해 어떤 치료가 이용되어야 하는지를 결정하는데 도움이 될 수 있다. 예를 들면, 새로 진단된 환자의 경우, 본 발명의 마커 또는 일배체형의 존재가 (예를 들면, 본 명세서에 기재된 바와 같이, 혈액 시료로부터 유래된 DNA의 테스트를 통해) 평가될 수 있다. 환자가 마커 대립인자 또는 일배체형에 대해 양성인 경우(즉, 마커의 하나 이상의 특정한 대립인자 또는 일배체형이 존재하는 경우), 의사는 하나의 특정한 치료를 권고하고, 환자가 마커의 상기 하나 이상의 대립인자 또는 일배체형에 대해 음성인 경우, 다른 코스의 치료(즉각적인 치료가 아닌, 질병의 진행에 대한 연속적인 모니터링이 수행될 것을 권고하는 것을 포함할 수 있음)가 권고될 수 있다. 따라서, 환자의 보인자 상태가 특정한 치료 방식이 적용되어야 하는지 여부를 결정하는 것을 보조하기 위해 이용될 수 있다. 그 가치는 질병을 조기에 진단하고, 가장 적합한 치료를 선택하고, 임상의에게 가장 적합한 치료를 적용할 수 있도록 질병의 예후/공격성에 대한 정보를 제공할 수 있다는 가능성에 있다.
치료제에 대한 부분에서 설명된 치료 방법 및 화합물이 그와 같은 방법에서 이용될 수 있다. 즉, 전술되거나 또는 앞서 고려된 화합물 또는 방법을 이용한 갑상선암의 치료는 특정한 구체예에서, 본 명세서에 기재된 다형성 마커 중 하나 이상에 대한 특정한 대립인자의 존재에 대한 스크리닝으로부터 잇점을 얻을 수 있고, 이때, 특정한 대립인자의 존재는 특정한 화합물 또는 방법에 대한 치료 결과를 예측한다.
특정한 구체예에서, 갑상선암의 치료를 위한 치료제(약물)이 본 명세서에 기재된 다형성 마커(예를 들면, rs965513, 또는 이와 연관 불균형인 마커들)에서 대립인자 상태를 결정하기 위한 키트와 함께 제공된다. 개인이 테스트된 특정한 대립인자 또는 복수 개의 대립인자에 대해 양성인 경우, 상기 개인은 상기 대립인자의 비-보인자보다 상기 특정 화합물로부터 잇점을 얻을 가능성이 더 높다. 특정한 다른 구체예에서, 특정한 화합물의 치료 결과를 예측하는 하나 이상의 다형성 마커에 관한 유전형 정보가 미리 결정되고 데이터베이스, 참조표, 또는 기타 적합한 수단에 저장되고, 예를 들면, 당업자에게 알려진 통상적인 데이터 조회(data query) 방법에 의해 데이터베이스 또는 참조표로부터 접근될 수 있다. 특정한 개인이 갑상선암의 치료를 위한 특정한 화합물 또는 약물의 양성 치료 결과를 예측하는 대립인자를 포함하는 경우, 상기 개인은 상기 특정한 화합물의 투여로부터 잇점을 얻을 것이다.
본 발명은 또한 갑상선암에 대한 치료의 진행 또는 효과를 모니터링하는 방법에 관한 것이다. 이는 본 발명의 마커 및 일배체형의 유전형 및/또는 일배체형 상태에 근거하여 수행되며, 즉, 본 명세서에 개시된 하나 이상의 다형성 마커의 하나 이상의 대립인자의 부재 또는 존재를 평가하거나, 또는 본 발명의 변이(마커 및 일배체형)와 연관된 유전자의 발현을 모니터링하는 것에 의해 수행될 수 있다. 조직 시료(예를 들면, 말초 혈액 시료, 또는 생검 시료)에서 위험 유전자 mRNA 또는 코딩된 폴리펩티드가 측정될 수 있다. 따라서, 치료 효과를 모니터링하기 위해 발현 수준 및/또는 mRNA 수준이 치료 전 및 치료 동안 측정될 수 있다. 대안적으로 또는 동시에, 치료 효과를 모니터링하기 위해 본 명세서에 개시된 갑상선암에 대한 하나 이상의 위험 변이의 유전형 및/또는 일배체형 상태가 치료 전 및 치료 동안 측정될 수 있다.
대안적으로, 본 발명의 마커 및 일배체형과 관련된 생물학적 네트워크 또는 대사 경로는 mRNA 및/또는 폴리펩티드 수준을 결정하는 것에 의해 모니터링될 수 있다. 이는 예를 들면, 치료 전과 치료 동안 채취된 시료에서, 상기 네트워크 및/또는 경로에 속하는 여러 유전자들의 발현 수준 또는 폴리펩티드를 모니터링하는 것에 의해 수행될 수 있다. 대안적으로, 상기 생물학적 네트워크 또는 대사 경로에 속하는 대사산물이 치료 전 및 치료 동안 결정될 수 있다. 치료의 효과는 건강한 개체로부터의 상응하는 데이터 대비, 치료 동안 발현 수준/대사산물 수준의 관찰된 변화를 비교하는 것에 의해 결정된다.
또 다른 양태에서, 본 발명의 마커는 임상 시험의 검정력(power) 및 효과를 증가시키기 위해 이용될 수 있다. 따라서, 본 발명의 위험 변이의 보인자인 개체가 특정한 치료 방식(treatment modality)에 반응할 가능성이 더 높을 수 있다. 일 구체예에서, 특정한 치료(예를 들면, 소형 분자 약물)가 표적화하는 경로 및/또는 대사 네트워크 내의 유전자에 대한 위험 변이를 갖는 개체는 상기 치료에 대해 반응을 보일 가능성이 더 높다. 또 다른 구체예에서, 그 발현 및/또는 기능이 위험 변이에 의해 변화되는 것인 유전자에 대한 위험 변이를 갖는 개체는 상기 유전자, 그의 발현 또는 그의 유전자 산물을 표적화하는 치료 방식에 반응할 가능성이 더 높다. 이 적용은 임상 시험의 안전성을 개선할 수 있으나, 임상 시험이 집단의 일부 서브-그룹에 한정될 수 있는, 통계적으로 유의성 있는 효능을 보일 가능성을 증가시킬 수 있다. 따라서, 그와 같은 시험의 하나의 가능한 결과는 특정한 유전적 변이, 예를 들면, 본 발명의 마커 및 일배체형의 보인자가 치료제에 대한 양성 반응을 보이고, 즉, 처방된 치료제 또는 약물을 복용했을 때, 갑상선암과 연관된 증상의 경감을 경험할, 통계적으로 유의성 있는 가능성을 갖는다는 것이다.
또 다른 양태에서, 본 발명의 마커 및 일배체형은 특정한 개인을 위한 약제학적 작용제의 선택을 표적화하기 위해 이용될 수 있다. 치료 방식의 맞춤화된 선택(personalized seleciton), 생활방식 변화 또는 치료 방식의 맞춤화된 선택과 생활방식 변화의 조합이 본 발명의 위험 변이의 이용에 의해 실현될 수 있다. 따라서, 본 발명의 특정한 마커에 대한 개체의 상태의 지식은 본 발명의 위험 변이에 의해 영향받은 유전자 또는 유전자 산물을 표적화하는 치료 옵션의 선택을 위해 유용할 수 있다. 변이의 특정한 조합이 하나의 치료 옵션의 선택을 위해 적합할 수 있고, 다른 유전자 변이 조합은 다른 치료 옵션을 표적화할 수 있다. 그와 같은 변이의 조합은 임상적으로 신뢰성있는 정확도로 치료 모듈의 선택을 결정하기 위해 필요한 경우, 하나의 변이, 두개의 변이, 세개의 변이, 또는 네개 또는 그 이상의 변이를 포함할 수 있다.
컴퓨터-구현 양태(Computer-implemented aspect)
본 발명이 속하는 기술 분야의 당업자에 의해 이해되는 바와 같이, 본 명세서에 기재된 방법 및 정보는 공지된 컴퓨터 판독가능한 매체 상에서, 컴퓨터에 의해 실행가능한 프로그램(computer executable instruction)으로서, 전체로 또는 부분적으로 구현될 수 있다. 예를 들면, 본 명세서에 기재된 방법은 하드웨어에서 구현될 수 있다. 대안적으로, 본 발명의 방법은 예를 들면, 하나 이상의 메모리 또는 다른 컴퓨터 판독가능한 매체에 저장되고 하나 이상의 프로세서 상에 구현된 소프트웨어로 구현될 수 있다. 알려진 바와 같이, 프로세서는 하나 이상의 컨트롤러(controller), 연산 유닛(calculation unit) 및/또는 컴퓨터 시스템의 다른 유닛과 결합되거나, 바람직한 펌웨어(firmware)에 이식될 수 있다. 소프트웨어에 이식되는 경우, 루틴(routine)은 알려진 바와 같이, RAM, ROM, 플래쉬 메모리, 자기 디스크, 레이저 디스크, 또는 기타 저장 매체와 같은 컴퓨터 판독가능한 메모리에 저장될 수 있다. 마찬가지로, 이 소프트웨어는 예를 들면, 전화선, 인터넷, 무선 접속 등과 같은 통신 채널 상에서, 또는 컴퓨터 판독가능한 디스크, 플래쉬 드라이브, 등과 같은, 휴대용 매체(transportable medium)를 통한 것을 포함한, 공지된 전달 방법을 통해 컴퓨터 장치에 전달될 수 있다.
보다 일반적으로, 및 본 발명이 속하는 기술 분야의 당업자에 의해 이해되는 바와 같이, 전술된 다양한 단계들이 다양한 블록, 작업(operation), 툴, 모듈, 및 하드웨어, 펌웨어, 소프트웨어, 또는 하드웨어, 펌웨어 및/또는 소프트웨어의 조합에서 구현될 수 있는 기법으로서 구현될 수 있다. 하드웨어에서 구현되는 경우, 블록, 작업, 기법 등의 일부 또는 전부가 예를 들면, 맞춤화 집적 회로(custom IC), ASIC(application specific integrated circuit), FPGA(field programmable logic array), PLA(programmable logic array) 등에서 구현될 수 있다.
소프트웨어에서 구현되는 경우, 소프트웨어는 자기 디스크, 광 디스크, 또는 다른 저장 매체와 같은 공지된 컴퓨터 판독가능한 매체, 컴퓨터의 RAM, 또는 ROM 또는 플래쉬 메모리, 프로세서, 하드 디스크 드라이브, 광 디스크 드라이브, 테이프 드라이브 등에 저장될 수 있다. 마찬가지로, 소프트웨어는 예를 들면, 컴퓨터 판독가능한 디스크 또는 다른 휴대용 컴퓨터 저장 메카니즘을 포함한 공지된 전달 방법을 통해 사용자 또는 컴퓨터 시스템에 전달될 수 있다.
도 1은 청구된 방법 및 장치의 단계를 위한 시스템이 구현될 수 있는 적합한 컴퓨팅 시스템 환경(100)의 예를 보여준다. 컴퓨팅 시스템 환경(100)은 적합한 컴퓨팅 환경의 하나의 예에 불과하며 청구항의 방법 또는 장치의 용도 또는 기능성(functionality)의 범위에 대한 한정으로 의도되지 않는다. 컴퓨팅 환경(100)도 대표적인 운영 환경(100)에 예시된 성분들 중 하나 또는 이들의 조합과 관련된 의존이나 요건을 갖는 것으로 해석되어서는 안 된다.
청구된 방법 및 시스템의 단계는 다수의 다른 범용(general purpose) 또는 특수 목적 컴퓨팅 시스템 환경 또는 구조로 운영된다. 청구항의 방법 또는 시스템과 사용하기에 적합할 수 있는 공지된 컴퓨팅 시스템, 환경, 및/또는 구조의 예는 퍼스널 컴퓨터, 서버 컴퓨터, 휴대용 또는 랩탑(laptop) 장치, 멀티프로세서 시스템, 마이크로프로세서-기반 시스템, 셋탑 박스, 프로그램가능한(programmable) 가전(consumer electronics), 네트워크 PC, 미니컴퓨터, 메인프레임 컴퓨터, 전술된 시스템 또는 장치를 포함하는 분산 컴퓨팅(distributed computing) 환경 등을 포함하나, 이에 한정되지 않는다.
청구된 방법 및 시스템의 단계들은 컴퓨터에 의해 실행되는 프로그램 모듈과 같은, 컴퓨터-실행가능한 프로그램(computer-executable instruction)의 일반적 배경에서 설명될 수 있다. 일반적으로, 프로그램 모듈은 특정한 작업(task)을 수행하거나 또는 특정한 추상 데이터형(abstract data type)을 구현하는, 루틴(routine), 프로그램(program), 객체(object), 구성요소(component), 데이터 구조 등을 포함한다. 본 발명의 방법 및 장치들은 또한 작업이 통신 네트워크를 통해 연결된 원격 처리 장치들에 의해 수행되는 것인 분산 컴퓨팅 환경에서 실시될 수 있다. 통합 컴퓨팅 환경 및 분산 컴퓨팅 환경 모두에서, 프로그램 모듈은 메모리 저장 장치를 포함한, 로컬 및 원격 컴퓨터 저장 매체에 위치될 수 있다.
도 1을 참조하면, 청구된 방법 및 시스템의 단계들을 구현하는 대표적 시스템은 컴퓨터(110)의 형태인 범용 컴퓨팅 장치를 포함한다. 컴퓨터(110)의 구성요소들은 프로세싱 유닛(processing unit)(120), 시스템 메모리(130), 및 상기 시스템 메모리를 포함한 다양한 시스템 구성요소들 프로세싱 유닛(120)에 연결시키는 시스템 버스(121)를 포함하나, 이에 한정되지 않는다. 시스템 버스(121)는 다양한 버스 아키텍쳐를 이용한, 메모리 버스 또는 메모리 컨트롤러(memory controller), 주변장치 버스(peripheral bus) 및 로컬 버스를 포함한 여러 종류의 버스 구조 중 하나일 수 있다. 한정이 아닌 예로서, 그와 같은 아키텍쳐는 ISA(Industry Standard Architecture) 버스, MCA(Micro Channel Architecture) 버스, EISA(Enhanced ISA) 버스, VESA(Video Electronics Standards Association) 로컬 버스, 및 메자닌(Mexxanine) 버스로도 알려진, PCI(Peripheral Component Interconnect) 버스를 포함한다.
컴퓨터(110)는 통상적으로 다양한 컴퓨터 판독가능한 매체를 포함한다. 컴퓨터 판독가능한 매체는 컴퓨터(110)에 의해 접근될 수 있는 이용가능한 매체일 수 있고 휘발성 매체 및 비휘발성 매체, 이동성(removable) 매체 및 비이동성 매체를 포함한다. 한정이 아닌, 예로서, 컴퓨터 판독가능한 매체는 컴퓨터 저장 매체 및 통신 매체(communication media)를 포함할 수 있다. 컴퓨터 저장 매체는 컴퓨터 판독가능한 명령어, 데이터 구조, 프로그램 모듈 또는 기타 데이터와 같은 정보의 저장을 위한 방법 또는 기술에서 구현된, 휘발성 및 비휘발성, 이동성 및 비이동성 매체를 포함한다. 컴퓨터 저장 매체는 RAM, ROM, EEPROM, 플래쉬 메모리 또는 기타 메모리 기술, CD-ROM, DVD(digital versatile disk) 또는 기타 광학적 디스크 저장, 자기 카세트(magnetic cassette), 자기 테이프, 자기 디스크 저장 또는 기타 자기 저장 장치, 또는 원하는 정보를 저장하기 위해 이용될 수 있고 컴퓨터(110)에 의해 접근될 수 있는 기타 매체를 포함하나, 이에 한정되지 않는다. 통신 매체는 통상적으로 컴퓨터 판독가능한 명령어, 데이터 구조, 프로그램 모듈, 또는 반송파(carrier wave)와 같은 모듈화 데이터 신호(modulated data signal) 중 기타 데이터 또는 기타 전송(transport) 메카니즘을 구현하고 정보 전달 매체(information delivery media)를 포함한다. 용어 "모듈화 데이터 신호(modulated data signal)"는 신호에 정보를 코딩하는 방식으로 설정되거나 변경된 하나 이상의 그의 특징을 갖는 신호를 의미한다. 한정이 아닌, 예로서, 통신 매체는 유선 네트워크 또는 직접-유선 연결(direct-wired connection)과 같은 유선 매체, 및 음향(acoustic) 매체, RF, 적외선 및 기타 무선 매체와 같은 무선 매체를 포함한다. 전술된 것들의 조합도 또한 컴퓨터 판독가능한 매체의 범위 내에 포함되어야 한다.
시스템 메모리(130)는 ROM(read only memory)(131) 및 RAM(random access memory)(132)와 같은 휘발성 및/또는 비휘발성 메모리의 형태로 컴퓨터 저장 매체를 포함한다. 스타트-업(start-up) 동안과 같은, 컴퓨터(110) 내의 요소들 간에 정보를 전달할 수 있는 기본 루틴을 포함하는 BIOS(basic input/output system)(133)는 통상적으로 ROM(131)에 저장된다. RAM(132)은 통상적으로 프로세싱 유닛(120)에 의해 즉시 접근가능하고 및/또는 그 위에서 운영되는 데이터 및/또는 프로그램 모듈을 포함한다. 한정이 아닌, 예로서, 도 1은 오퍼레이팅 시스템(134), 애플리케이션 프로그램(135), 기타 프로그램 모듈(136), 및 프로그램 데이터(137)을 예시한다.
컴퓨터(110)는 또한 기타 이동성/비이동성, 휘발성/비휘발성 컴퓨터 저장 매체를 포함할 수 있다. 예로서만, 도 1은 비이동성, 비휘발성 자기 매체로부터 판독하거나 또는 그에 기록하는 하드 디스크 드라이브(140), 이동성, 비휘발성 자기 디스크(152)로부터 판독하거나 또는 그에 기록하는 자기 디스크 드라이브(151), 및 CD ROM 또는 기타 광학 매체와 같은 이동성, 비휘발성 광학 디스크(156)로부터 판독하거나 또는 그에 기록하는 광학 디스크 드라이브(155)를 보여준다. 대표적인 오퍼레이팅 환경에서 사용될 수 있는 기타 이동성/비이동성, 휘발성/비휘발성 컴퓨터 저장 매체는 자기 테이프 카세트, 플래시 메모리 카드, DVD(digital versatile disk), 디지털 비디오 테이프, 고체 상태 RAM, 고체 상태 ROM 등을 포함하나, 이에 한정되지 않는다. 하드 디스크 드라이브(141)는 통상적으로 인터페이스(140)과 같은 비이동성 메모리 인터페이스를 통해 시스템 버스(121)에 연결되고, 자기 디스크 드라이브(151)와 광학 디스크 드라이브(155)는 통상적으로 인터페이스(150)와 같은 이동성 메모리 인터페이스에 의해 시스템 버스(121)에 연결된다.
앞서 검토되고 도 1에 예시된 드라이브 및 그와 결합된 컴퓨터 저장 매체는 컴퓨터(110)를 위한 컴퓨터 판독가능한 명령어(computer readable instructions), 데이터 구조, 프로그램 모듈 및 기타 데이터를 제공한다. 도 1에서, 예를 들면, 하드 디스크 드라이브(141)는 저장 오퍼레이팅 시스템(144), 애플리케이션 프로그램(145), 기타 프로그램 모듈(146), 및 프로그램 데이터(147)로 예시된다. 이 구성요소들은 오퍼레이팅 시스템(134), 애플리케이션 프로그램(135), 기타 프로그램 모듈(136), 및 프로그램 데이터(137)과 동일하거나 상이할 수 있다는 것에 유의한다. 오퍼레이팅 시스템(144), 애플리케이션 프로그램(145), 기타 프로그램 모듈(146), 및 프로그램 데이터(147)는 최소한 그들이 상이한 카피라는 것을 예시하기 위해 상이한 번호가 부여된다. 사용자는 키보드(162) 및 통상적으로 마우스, 트랙볼(trackball) 또는 터치 패드(touch pad)로 지칭되는 포인팅 장치(161)와 같은 입력 장치를 통해 컴퓨터(20)에 명령어 및 정보를 입력할 수 있다. 기타 입력 장치(표시되지 않음)는 마이크로폰, 조이스틱(joystick), 게임 패드(game pad), 위성 접시, 스캐너, 등을 포함할 수 있다. 이들 및 기타 입력 장치는 종종 시스템 버스에 커플링된 사용자 입력 인터페이스(160)를 통해 프로세싱 유닛(120)에 연결되나, 병렬 포트(parallel port), 게임 포트 또는 USB(universal serial bus)와 같은 기타 인터페이스 및 버스 구조에 의해 연결될 수 있다. 모니터(191) 또는 다른 종류의 디스플레이 장치도 비디오 인터페이스(190)와 같은 인터페이스를 통해 시스템 버스(121)에 연결된다. 모니터 외에, 컴퓨터는 또한 출력 주변장치 인터페이스(190)를 통해 연결될 수 있는, 스피커(197) 및 프린터(196)와 같은 기타 주변 출력 장치를 포함할 수 있다.
컴퓨터(110)는 원격 컴퓨터(180)와 같은 하나 이상의 원격 컴퓨터로의 로지컬 연결(logical connection)을 통해 네트워크 환경에서 운영될 수 있다. 원격 컴퓨터(180)는 퍼스널 컴퓨터, 서버, 라우터(router), 네트워크 PC, 피어 장치(peer device) 또는 기타 공통 네트워크 노드(common network node)일 수 있고, 도 1에 메모리 저장 장치(181)만이 예시되었으나, 통상적으로 컴퓨터(110)과 관련된 전술된 다수의 요소들 또는 모든 요소들을 포함한다. 도 1에 도시된 로지컬 연결은 LAN(local area network)(171) 및 WAN(wide area network)(173)을 포함하나, 또한 다른 네트워크를 포함할 수 있다. 그와 같은 네트워킹 환경은 사무실, 전사적 컴퓨터 네트워크(enterprise-wide computer network), 인트라넷 및 인터넷에서 흔하다.
LAN 네트워킹 환경에서 이용되는 경우, 컴퓨터(110)는 네트워크 인터페이스 또는 어댑터(170)를 통해 LAN(171)에 연결된다. WAN 네트워킹 환경에서 이용되는 경우, 컴퓨터(110)는 통상적으로 모뎀(172) 또는 인터넷과 같은 WAN(173)을 통한 통신(communications)을 구축하기 위한 다른 수단을 포함한다. 내장형이거나 외장형일 수 있는 모뎀(172)은 사용자 입력 인터페이스(160), 또는 다른 적합한 메카니즘을 통해, 시스템 버스(121)에 연결될 수 있다. 네트워크 환경에서, 컴퓨터(110), 또는 그의 일부에 대해 도시된 프로그램 모듈은 원격 메모리 저장 장치에 저장될 수 있다. 한정이 아닌, 예로서, 도 1은 메모리 장치(181)에 존재하는 원격 애플리케이션 프로그램(185)을 예시한다. 표시된 네트워크 연결은 예시적이고 컴퓨터 간의 통신 연결을 수립하기 위한 다른 수단이 이용될 수 있다.
앞의 본문은 본 발명의 다수의 상이한 구체예의 상세한 설명을 제시하나, 본 발명의 범위는 본 특허의 말미에 제시된 청구항의 기재에 의해 한정되는 것으로 이해되어야 한다. 상세한 설명은 예시인 것으로만 해석되며 모든 가능한 구체예를 기재하는 것은 불가능하지는 않으나, 비현실적이기 때문에, 본 발명의 모든 가능한 구체예를 설명하지 않는 것으로 해석된다. 다수의 대안적인 구체예가 현재의 기술 및 본 특허의 출원일 후에 개발된 기술을 이용하여 구현될 수 있고, 이들은 여전히 본 발명을 한정하는 청구항의 범위 내에 속할 것이다.
위험도 평가 시스템, 방법 및 요소가 바람직하게는 소프트웨어에서 구현되는 것으로 기재되었으나, 이들은 하드웨어, 펌웨어(firmware) 등에서 구현될 수 있고, 다른 프로세서에 의해 구현될 수 있다. 따라서, 본 명세서에 기재된 요소들은 표준 다목적(multi-purpose) CPU에서, 또는 도 1의 컴퓨터(110)를 포함하나, 이에 한정되지 않는, ASIC(application-specific integrated circuit) 또는 다른 하드-와이어드 장치(hard-wired device)와 같은 특수하게 설계된 하드웨어 또는 펌웨어 상에서 구현될 수 있다. 소프트웨어에서 구현되는 경우, 소프트웨어 루틴은 자기 디스크, 레이저 디스크, 또는 기타 저장 매체와 같은 컴퓨터 판독가능한 메모리, 컴퓨터 또는 프로세서의 RAM 또는 ROM, 데이터베이스 등에 저장될 수 있다. 마찬가지로, 이 소프트웨어는 예를 들면, 컴퓨터 판독가능한 디스크 또는 기타 이동성 컴퓨터 저장 메카니즘 상에, 또는 전화선, 인터넷, 무선 통신 등과 같은 통신 채널을 포함한, 공지되거나 또는 바람직한 전달 방법을 통해 사용자 또는 진단 시스템에 전달될 수 있다(이동성 저장 매체(transportable storage medium)를 통한 그와 같은 소프트웨어의 제공과 동일하거나 호환가능한 것으로 볼 수 있음).
따라서, 다수의 수정 및 변형이 본 발명의 원리(spirit) 및 범위를 벗어나지 않으면서 본 명세서에서 설명되고 예시된 기법과 구조에서 이루어질 수 있다. 따라서, 본 명세서에 기재된 방법 및 장치는 예시적인 것에 불과하고 본 발명의 범위를 한정하지 않는 것으로 이해되어야 한다.
따라서, 본 발명은 또한 본 명세서에서 기재된 다형성 마커 및 일배체형, 및 그로부터 유래된 유전형 및/또는 질병-연관 데이터의 컴퓨터-구현 응용(computer-implemented applicatoin)에 관한 것이다. 그와 같은 응용은 본 발명의 방법에서 유용한 유전형 데이터를 저장, 처리(manipulate)하거나 또는 분석하기 위해 유용할 수 있다. 일 실시예는 제3자(예를 들면, 개인, 상기 개인의 후견인, 의료 서비스 제공자 또는 유전자 분석 서비스 제공자)에게 유전형 정보를 제공할 수 있도록 하기 위해, 개인으로부터 유래된 유전형 정보를 판독가능한 매체 상에 저장하는 것, 또는 예를 들면, 유전형 데이터를 암의 증가된 감수성에 기여하는 유전적 위험 인자에 관한 정보를 비교하고, 그와 같은 비교에 기반한 결과를 보고하는 것에 의해, 유전형 데이터로부터 정보를 도출하는 것에 관한 것이다.
일반적으로, 컴퓨터-판독가능한 매체는 (i) 본 명세서에 기재된 바와 같은, 하나 이상의 다형성 마커 또는 일배체형에 대한 식별자(identifier) 정보; (ii) 갑상선암을 갖는 개체에서, 상기 하나 이상의 마커의 하나 이상의 대립인자의 빈도, 또는 일배체형의 빈도의 지표(indicator); 및 기준 집단(reference population)에서 상기 하나 이상의 마커의 하나 이상의 대립인자의 빈도, 또는 일배체형의 빈도의 지표를 저장하는 능력을 갖는다. 기준 집단은 질병-불포함(disease-free) 개인의 집단일 수 있다. 대안적으로, 기준 집단은 전체 집단으로부터의 랜덤 표본이고, 따라서, 전반적으로 상기 집단을 대표한다. 빈도 지표는 계산된 빈도, 대립인자 및/또는 일배체형 카피의 계수(count), 또는 특정한 매체를 위해 적합한 실제 빈도의 정규화된(normalized) 또는 달리 처리된(manipulated) 값일 수 있다.
특정한 구체예에서, 본 명세서에서 갑상선암의 증가된 감수성(예를 들면, 증가된 위험도)과 연관된 것으로 기재된 마커들 및 일배체형들은 유전형 데이터의 해석 및/또는 분석을 위해 유용하다. 따라서, 특정한 구체예에서, 본 명세서에서 입증된 바와 같은, 갑상선암에 대한 위험 대립인자, 또는 본 명세서에서 갑상선암과 연관된 것으로 확인된 마커들 중 하나와 LD인 다형성 마커의 대립인자의 확인(식별)은 해당 유전형 데이터가 기원한 개체가 갑상선암의 증가된 위험도를 갖는다는 것을 나타낸다. 하나의 그와 같은 구체예에서, 유전형 데이터는 본 명세서에서 갑상선암과 연관된 것으로 확인된 하나 이상의 다형성 마커, 또는 이들과 연관 불균형인 마커에 대해 생성된다. 유전형 데이터는 뒤이어 질병에 대한 위험도 척도의 형태(예를 들면, 절대적 위험도(AR), 위험도 비(risk ratio, RR), 또는 오즈비(odds ratio, OR))인 유전형 데이터의 해석과 함께, 해당 데이터가 기원한 개인, 그의 후견인 또는 대리인, 의사, 또는 의료인, 유전학 카운셀러 또는 보험업자와 같은 제3자에게 예를 들면, 인터넷을 통해 접근가능한 사용자 인터페이스를 통해 이용가능하다. 또 다른 구체예에서, 개인으로부터 유래된 유전형 데이터세트에서 확인된 위험 마커가 평가되고 상기 데이터세트에서 그와 같은 위험 변이의 존재에 의해 부여된 위험도의 평가로부터의 결과가, 예를 들면, 안전한 웹 인터페이스를 통해, 또는 다른 통신 수단에 의해 상기 개인에게 이용가능하게 될 수 있다. 그와 같은 위험도 평가의 결과가 수치 형태(예를 들면, 절대적 위험도, 상대적 위험도 및/또는 오즈비와 같은 위험도 값, 또는 기준 대비 위험도의 백분율 증가), 그래프 수단에 의해, 또는 해당 유전형 데이터가 유래된 개체에 대한 위험도를 보여주기에 적합한 다른 수단에 의해 보고될 수 있다.
핵산 및 폴리펩티드
본 명세서에 기재된 핵산 및 폴리펩티드는 본 발명의 방법 및 키트에서 이용될 수 있다. 본 명세서에서 사용된, "단리된(isolated)" 핵산 분자는 (게놈 서열에서와 같이) 정상적으로 유전자 또는 뉴클레오티드 서열을 둘러싸는(flank) 핵산으로부터 분리되고 및/또는 (예를 들면, RNA 라이브러리에서와 같이) 다른 전사된 서열들로부터 완전하게 또는 부분적으로 정제된 핵산이다. 예를 들면, 본 발명의 단리된 핵산은 핵산이 원래 존재하는 복잡한 세포 매질(cellular milieu), 또는 재조합 기법에 의해 생성되는 경우 배양 배지, 또는 화학적으로 합성되는 경우, 화학적 전구체 또는 다른 화학물질들에 대해 실질적으로 분리될 수 있다. 일부 경우에, 단리된 물질은 조성(예를 들면, 다른 물질을 포함하는 조 추출물), 완충 시스템 또는 시약 혼합물(reagent mix)의 부분을 형성할 것이다. 다른 상황들에서, 상기 물질은 예를 들면, 폴리아크릴아미드 겔 전기영동(PAGE) 또는 컬럼 크로마토그래피(예를 들면, HPLC)에 의해 결정되는 바와 같이, 필수적인 균질성(essential homogeneity)까지 정제될 수 있다. 본 발명의 단리된 핵산 분자는 존재하는 모든 거대분자 종의 약 50% 이상, 약 80% 이상, 또는 약 90% 이상(몰 기준)을 구성할 수 있다. 게놈 DNA에 대해, 용어 "단리된(isolated)"은 또한 본래 게놈 DNA가 결합되어 있는 염색체로부터 단리된 핵산 분자를 의미한다. 예를 들면, 단리된 핵산 분자는 핵산 분자가 유래된 세포의 게놈 DNA에서 상기 핵산 분자를 플랭킹(flank)하는 뉴클레오티드의 약 250 kb, 200 kb, 150 kb, 100 kb, 75 kb, 50 kb, 25 kb, 10 kb, 5 kb, 4 kb, 3 kb, 2 kb, 1 kb, 0.5 kb 또는 0.1 kb 미만을 포함할 수 있다.
핵산 분자는 다른 코딩 서열 또는 조절 서열에 융합될 수 있고, 여전히 단리된 것으로 고려될 수 있다. 따라서, 벡터 내에 포함된 재조합 DNA는 본 명세서에서 사용된 "단리된"의 정의에 포함된다. 또한, 단리된 핵산 분자는 이종(heterologous) 숙주 세포 또는 이종 개체 내의 재조합 DNA 분자, 및 용액 중의 부분적으로 또는 실질적으로 정제된 DNA 분자를 포함한다. "단리된" 핵산 분자는 또한 본 발명의 DNA 분자의 인 비보 및 인 비트로 RNA 전사체를 포함한다. 단리된 핵산 분자 또는 뉴클레오티드 서열은 화학적으로 합성되거나 또는 재조합 수단에 의해 생산된 핵산 분자 또는 뉴클레오티드 서열을 포함할 수 있다. 그와 같은 단리된 뉴클레오티드 서열이 예를 들면, 코딩된 폴리펩티드의 제조에서, 상동성 서열(예를 들면, 다른 포유동물 종으로부터)의 단리를 위해, 유전자 맵핑을 위해(예를 들면, 염색체와의 인 시투 혼성화에 의해), 또는 예를 들면, 노던 블롯 분석 또는 기타 혼성화 기법과 같은 조직 (예를 들면, 인간 조직) 중의 유전자의 발현을 검출하기 위해, 프로브로서 유용하다.
본 발명은 또한 높은 엄격성(stringency)의 혼성화 조건, 예를 들면, 선택적 혼성화를 위한 조건 하에, 본 명세서에 기재된 뉴클레오티드 서열에 혼성화되는 핵산 분자(예를 들면, 본 명세서에 기재된 마커 또는 일배체형과 연관된 다형성 부위를 포함하는 뉴클레오티드 서열에 특이적으로 혼성화하는 핵산 분자)에 관한 것이다. 그와 같은 핵산 분자는 대립인자-특이적 혼성화 또는 서열-특이적 혼성화(예를 들면, 높은 엄격성(stringency) 조건 하에)에 의해 검출 및/또는 분리될 수 있다. 핵산 혼성화를 위한 엄격성 조건 및 방법은 본 발명이 속하는 기술 분야의 당업자에게 잘 알려져 있다(예를 들면, 전체 교시에 참조에 의해 본 명세서에 포함된 Current Protocols in Molecular Biology, Ausubel, F. et al, John Wiley & Sons, (1998), 및 Kraus, M. and Aaronson, S., Methods Enzymol., 200:546-556 (1991) 참조).
두 개의 뉴클레오티드 서열 또는 아미노산 서열 간의 퍼센트 동일성(percent identity)은 최적의 비교 목적을 위해 서열들을 정렬시키는 것에 의해(예를 들면, 제1 서열의 서열에 갭이 도입될 수 있음) 결정될 수 있다. 상응하는 위치의 뉴클레오티드 또는 아미노산이 비교되고, 두 서열 간의 퍼센트 동일성은 상기 서열들 간에 공유된 동일한 위치의 갯수의 함수이다(즉, % 동일성 = 동일한 위치의 갯수(#)/위치의 총 갯수(#) x 100). 특정한 구체예에서, 비교 목적을 위해 정렬된 서열의 길이는 기준 서열의 길이의 30% 이상, 40% 이상, 50% 이상, 60% 이상, 70% 이상, 80% 이상, 90% 이상, 또는 95% 이상이다. 두 서열의 실제적인 비교는 잘 알려진 방법, 예를 들면, 수학적 알고리즘을 이용한 방법에 의해 달성될 수 있다. 그와 같은 수학적 알고리즘의 비-한정적인 예가 Karlin, S. and Altschul, S., Proc. Natl. Acad. Sci. USA, 90:5873-5877 (1993)에 기재된다. 그와 같은 알고리즘이 Altschul, S. et al., Nucleic Acids Res., 25:3389-3402 (1997)에 기재된 바와 같이, NBLAST 및 XBLAST 프로그램(버전 2.0)에 구현된다. BLAST 및 Gapped BLAST 프로그램을 이용하는 경우, 개별적인 프로그램(예를 들면, NBLAST)의 디폴트 파라미터가 이용될 수 있다. ncbi.nlm.nih.gov에서 월드 와이드 웹의 웹사이트를 참조한다. 일 구체예에서, 서열 비교를 위한 파라미터는 score=100, wordlength=12로 설정되거나, 또는 변할 수 있다(예를 들면, W=5 또는 W=20). 알고리즘의 또 다른 예는 BLAT (Kent, W.J. Genome Res. 12:656-64 (2002))이다.
다른 예는 Myers and Miller, CABIOS (1989), Torellis, A. and Robotti, C., Comput. Appl. Biosci. 10:3-5 (1994)에 기재된 ADVANCE and ADAM; 및 Pearson, W. and Lipman, D., Proc. Natl. Acad. Sci. USA, 85:2444-48 (1988)에 기재된 FASTA 알고리즘을 포함한다.
또 다른 구체예에서, 두 개의 아미노산 서열간의 퍼센트 동일성(percent identity)은 GCG 소프트웨어 패키지 (Accelrys, Cambridge, UK) 중의 GAP 프로그램을 이용하여 수득될 수 있다.
본 발명은 또한 높은 엄격성 조건(highly stringent condition) 하에 서열번호 1 내지 229 중 하나의 뉴클레오티드 서열, 서열번호 1 내지 229 중 하나의 뉴클레오티드 서열의 상보체를 포함하거나, 이로 구성된 뉴클레오티드 서열을 포함하거나 또는 이들로 구성된 핵산에 혼성화하는 단편 또는 부분을 포함하는 단리된 핵산 분자로서, 상기 뉴클레오티드 서열은 본 명세서에 기재된 마커 및 일배체형에 포함된 하나 이상의 다형성 대립인자를 포함하는 것인 단리된 핵산 분자를 제공한다. 본 발명의 핵산 단편은 약 15개 이상, 약 18개 이상, 20개, 23개 또는 25개 이상의 뉴클레오티드로 구성된 길이이고, 30개, 40개, 50개, 100개, 200개, 500개, 1000개, 10,000개 또는 그 이상의 뉴클레오티드로 구성된 길이일 수 있다.
본 발명의 핵산 단편은 본 명세서에 기재된 바와 같은 분석법에서 프로브 또는 프라이머로서 이용된다. "프로브(probe)" 또는 "프라이머(primer)"는 핵산 분자의 상보적 가닥에 염기-특이적 방식으로 혼성화하는 올리고뉴클레오티드이다. DNA 및 RNA 외에, 그와 같은 프로브 및 프라이머는 Nielsen, P. et al., Science 254:1497-1500 (1991)에 기재된 바와 같은 PNA(polypeptide nucleic acid)를 포함한다. 프로브 또는 프라이머는 핵산 분자의 약 15개 이상, 일반적으로 약 20개 내지 25개, 및 일부 구체예에서, 약 40개, 50개 또는 75개의 연속된 뉴클레오티드로 구성된 부분에 혼성화하는 뉴클레오티드 서열의 영역을 포함한다. 일 구체예에서, 프로브 또는 프라이머는 본 명세서에 기재된 하나 이상의 다형성 마커의 하나 이상의 대립인자 또는 하나 이상의 일배체형, 또는 그의 상보체(complement)를 포함한다. 특정한 구체예에서, 프로브 또는 프라이머는 100개 또는 그 미만의 뉴클레오티드를 포함할 수 있고, 예를 들면, 특정한 구체예에서, 6개 내지 50개의 뉴클레오티드, 또는 예를 들면, 12개 내지 30개의 뉴클레오티드를 포함할 수 있다. 다른 구체예에서, 프로브 또는 프라이머는 연속적인 뉴클레오티드 서열 또는 상기 연속적인 뉴클레오티드 서열의 상보체에 70% 이상, 80% 이상, 85% 이상, 90% 이상, 또는 95% 이상 동일하다. 또 다른 구체예에서, 프로브 또는 프라이머는 연속적인 뉴클레오티드 서열 또는 상기 연속적인 뉴클레오티드 서열의 상보체에 선택적으로 혼성화될 수 있다. 종종, 프로브 또는 프라이머는 표지, 예를 들면, 방사성동위원소, 형광 표지, 효소 표지, 효소 보조-인자 표지, 자성 표지(magnetic label), 스핀 표지, 에피토프 표지를 더 포함한다.
전술된 바와 같은 본 발명의 핵산 분자는 본 발명이 속하는 기술 분야의 당업자에게 잘 알려진 표준 분자생물학 기법을 이용하여 확인되고 단리될 수 있다. 증폭된 DNA는 표지되고(예를 들면, 방사성 표지되고), 인간 세포로부터 유래된 cDNA 라이브러리를 스크리닝하기 위한 프로브로서 이용될 수 있다. 상기 cDNA는 mRNA로부터 유래되고 적합한 벡터에 담길 수 있다. 상응하는 클론들이 단리되고, 인 비보 절제(in vivo excision) 후에 DNA가 수득되고, 적합한 분자량의 폴리펩티드를 코딩하는 올바른 해독 프레임을 확인하기 위해 본 발명이 속하는 기술 분야에서 인정되는 방법에 의해 클로닝된 삽입물이 한 방향으로 또는 양 방향으로 서열분석될 수 있다. 이 방법들 또는 유사한 방법들을 이용하여, 폴리펩티드 및 상기 폴리펩티드를 코딩하는 DNA가 단리되고, 서열결정되고, 그 특성이 더 규명될 수 있다.
항체
본 발명은 또한 변이 대립인자에 의해 코딩된 변이 아미노산 서열(예를 들면, 아미노산 치환 포함) 또는 상응하는 비-변이 또는 야생형 대립인자에 의해 코딩된 기준 아미노산 서열을 포함하는 에피토프에 결합하는 항체를 제공한다. 본 명세서에서 사용된 용어 "항체(antibody)"는 면역글로불린 분자 및 면역글로불린 분자의 면역학적으로 활성인 부분, 즉, 항원에 특이적으로 결합하는 항원-결합 부위를 포함하는 분자를 의미한다. 본 발명의 폴리펩티드에 특이적으로 결합하는 분자는 폴리펩티드 또는 그의 단편에 결합하나, 자연적으로 상기 폴리펩티드를 포함하는 시료, 예를 들면, 생물학적 시료 중의 다른 분자에는 실질적으로 결합하지 않는 분자이다. 면역글로불린 분자의 면역학적 활성 부분의 예는 펩신과 같은 효소에 의해 항체를 처리하는 것에 의해 생성될 수 있는 F(ab) 및 F(ab')2 단편을 포함한다. 본 발명은 본 발명의 폴리펩티드에 결합하는 다중클론 항체 및 단일클론 항체를 제공한다. 본 명세서에서 사용된, 용어 "단일클론 항체(monoclonal antibody)" 또는 "단일클론 항체 조성물(monoclonal antibody composition)"은 본 발명의 폴리펩티드의 특정한 에피토프와 면역반응할 수 있는 항원 결합 부위의 단 하나의 종만을 포함하는 항체 분자의 집단을 의미한다. 따라서, 단일클론 항체 조성물은 일반적으로 그와 면역반응하는 본 발명의 특정한 폴리펩티드에 대한 단일 결합 친화도를 보인다.
다중클론 항체는 적합한 개체를 원하는 면역원(immunogen), 예를 들면, 본 발명의 폴리펩티드 또는 그의 단편으로 면역화시키는 것에 의해 전술된 바와 같이 제조될 수 있다. 면역화된 개체에서 항체 역가(antibody titer)는 시간의 경과에 대해, 표준 기법, 예를 들면, 고정화된 폴리펩티드를 이용한, ELISA(enzyme linked immunosorbent assay)에 의해 모니터링될 수 있다. 필요한 경우, 폴리펩티드에 대한 항체 분자가 포유동물(예를 들면, 혈액)로부터 분리되고, IgG 분획을 수득하기 위한 단백질 A 크로마토그래피와 같은, 잘 알려진 기법에 의해 더 정제될 수 있다. 면역화 후 적절한 시점에, 예를 들면, 항체 역가가 최고인 시점에, 항체-생성 세포들이 개체로부터 수득되고, Kohler and Milstein, Nature 256:495-497 (1975)에 의해 최초로 개시된 하이브리도마 기법, 인간 B 세포 하이브리도마 기법(Kozbor et al., Immunol. Today 4: 72 (1983)), EBV-하이브리도마 기법(Cole et al., Monoclonal Antibodies and Cancer Therapy, Alan R. Liss,1985, Inc., pp. 77-96) 또는 트리오마(trioma) 기법과 같은 표준 기법에 의해 단일클론 항체를 제조하기 위해 이용될 수 있다. 하이브리도마를 생성하는 기술이 잘 알려져 있다(일반적으로, Current Protocols in Immunology (1994) Collgan et al., (eds.) John Wiley & Sons, Inc., New York, NY 참조). 요약하면, 불멸 세포주(immortal cell line)(일반적으로, 골수종(myeloma))가 전술된 바와 같이 면역원에 의해 면역화된 포유동물로부터의 림프구(일반적으로, 비장림프구(splenocyte))에 융합되고, 결과물인 하이브리도마 세포의 배양 상층액이 본 발명의 폴리펩티드에 결합하는 단일클론 항체를 생성하는 하이브리도마를 확인하기 위해 스크리닝된다.
림프구와 불멸화된 세포주를 융합시키기 위해 이용되는 다수의 잘 알려진 프로토콜이 본 발명의 폴리펩티드에 대한 단일클론 항체를 생성할 목적으로 적용될 수 있다(예를 들면, Current Protocols in Immunology, supra; Galfre et al., Nature 266:55052 (1977); R.H. Kenneth, in Monoclonal Antibodies: A New Dimension In Biological Analyses, Plenum Publishing Corp., New York, New York (1980); 및 Lerner, Yale J. Biol. Med. 54:387-402 (1981) 참조). 또한, 통상적인 당업자는 역시 유용할, 그와 같은 방법의 다양한 변형이 존재한다는 것을 이해할 것이다.
단일클론 항체-분비 하이브리도마 제조의 대안으로, 본 발명의 폴리펩티드에 대한 단일클론 항체가 상기 폴리펩티드로 재조합 조합적 면역글로불린 라이브러리(recombinant combinatorial immunoglobulin library)(예를 들면, 항체 파아지 표시(phage display) 라이브러리)를 스크리닝하고, 그에 의해 상기 폴리펩티드에 결합하는 면역글로불린 라이브러리 구성물을 단리하는 것에 의해 식별되고 단리될 수 있다. 파아지 표시 라이브러리를 생성하고 스크리닝하기 위한 키트가 상업적으로 이용가능하다(예를 들면, the Pharmacia Recombinant Phage Antibody System, Catalog No. 27-9400-01; 및 Stratagene Surf ZAP™ Phage Display Kit, Catalog No. 240612). 추가적으로, 항체 표시 라이브러리를 생성하고 스크리닝하기 위해 이용할 수 있는 특히 유용한 방법 및 시약의 예를, 예를 들면, 미국특허 제5,223,409호; PCT 공개 WO 92/18619; PCT 공개 WO 91/17271; PCT 공개 WO 92/20791; PCT 공개 WO 92/15679; PCT 공개 WO 93/01288; PCT 공개 WO 92/01047; PCT 공개 WO 92/09690; PCT 공개 WO 90/02809; Fuchs et al., Bio/Technology 9: 1370-1372 (1991); Hay et al., Hum. Antibod. Hybridomas 3:81-85 (1992); Huse et al., Science 246: 1275-1281 (1989); 및 Griffiths et al., EMBO J. 12:725-734 (1993)에서 찾을 수 있다.
추가적으로, 표준 재조합 DNA 기법을 이용하여 제조될 수 있는, 인간 부분 및 비-인간(non-human) 부분을 모두 포함하는, 키메라 단일클론 항체 및 인간화(humanized) 단일클론 항체와 같은 재조합 항체가 본 발명의 범위에 속한다. 그와 같은 키메라 항체 및 인간화 단일클론 항체는 본 발명이 속하는 기술 분야에서 알려진 재조합 DNA 기법에 의해 생산될 수 있다.
일반적으로, 본 발명의 항체(예를 들면, 단일클론 항체)는 친화도 크로마토그래피 또는 면역침전과 같은 표준 기법에 의해 본 발명의 폴리펩티드를 분리하기 위해 이용될 수 있다. 폴리펩티드-특이적 항체는 세포로부터 천연 폴리펩티드 및 숙주 세포에서 발현된 재조합기법에 의해 생산된 폴리펩티드의 정제를 촉진할 수 있다. 또한, 본 발명의 폴리펩티드에 대해 특이적인 항체는 폴리펩티드의 발현의 양(abundance) 및 패턴을 평가하기 위해 (예를 들면, 세포 용해액, 세포 상층액, 또는 조직 시료에서) 폴리펩티드를 검출하기 위해 이용될 수 있다. 항체는 임상 테스트 절차의 일부로서, 예를 들면, 주어진 치료 계획(treatment regime)의 효능을 결정하기 위해, 조직에서 단백질 수준을 진단 목적으로 모니터링하기 위해 이용될 수 있다. 그의 검출을 촉진하기 위해 항체는 검출가능한 물질에 결합될 수 있다. 검출가능한 물질의 예는 다양한 효소, 보조 그룹(prosthetic group), 형광 물질, 발광 물질, 생물발광 물질, 및 방사성활성 물질을 포함한다. 적합한 효소의 예는 호스래디쉬 퍼옥시다아제(horseradish peroxidase), 알칼리 포스파타아제, 베타-갈락토시다아제, 또는 아세틸콜린에스테라아제를 포함하고; 적합한 보조 그룹 복합체(prothetic group complex)의 예는 스트렙타비딘/비오틴 및 아비딘/비오틴을 포함하며; 적합한 형광 물질의 예는 움벨리페론(umbelliferone), 플루오레세인(fluorescein), 플루오레세인 이소티오시아네이트, 로다민(rhodamine), 디클로로트리아지닐아민 플루오레세인, 단실 클로라이드(dansyl chloride) 또는 피코에리트린(phycoerythrin)을 포함하고; 발광 물질의 예는 루미놀을 포함하며; 생물발광 물질의 예는 루시페라아제, 루시페린, 및 에쿼린(aequorin)을 포함하고, 및 적합한 방사성활성 물질의 예는 125I, 131I, 35S 또는 3H를 포함한다.
항체는 또한 약물유전학 분석에서 유용할 수 있다. 그와 같은 구체에에서, 본 명세서에 따른 핵산에 의해 코딩되는 변이 단백질에 대한 항체, 예를 들면, 하나 이상의 본 발명의 다형성 마커를 포함하는 핵산에 의해 코딩된 변이 단백질에 대한 항체가 변형된 치료 방식을 필요로 하는 개체를 식별하기 위해 이용될 수 있다.
항체는 또한 질병의 활성 단계(active stage)와 같은 질병 상태에서, 또는 단백질의 기능과 관련된 질병, 특히, 갑상선암에 대한 소인을 갖는 개인에서 변이 단백질의 발현을 평가하기 위해 유용할 수 있다. 본 명세서에 기재된 하나 이상의 다형성 마커 또는 일배체형을 포함하는 핵산에 의해 코딩된 본 발명의 변이 단백질에 특이적인 항체가 상기 변이 단백질의 존재를 스크리닝하기 위해, 예를 들면, 상기 변이 단백질의 존재에 의해 표시된 바와 같이, 갑상선암에 대한 소인을 스크리닝하기 위해 이용될 수 있다.
항체는 다른 방법들에서 이용될 수 있다. 따라서, 항체는 전기영동 이동성(electrophoretic mobility), 등전점, 트립신 또는 기타 단백질분해효소에 의한 처리와 함께 본 발명의 변이 단백질과 같은 단백질을 평가하기 위한 진단 도구로서, 또는 본 발명이 속하는 기술 분야의 당업자에게 알려진 다른 물리적 분석법(physical assay)에서 이용하기에 유용하다. 항체는 또한 조직형 검사(tissue typing)에서 이용될 수 있다. 하나의 그와 같은 구체예에서, 특정한 변이 단백질이 특정한 조직형에서의 발현과 상관되며, 상기 변이 단백질에 대한 특이적 항체가 상기 특이적 조직형을 식별하기 위해 이용될 수 있다.
변이 단백질을 포함한, 단백질의 세포내 국재화(subcellular localization) 가 또한 항체를 이용하여 결정될 수 있고, 다양한 조직의 세포에서 단백질의 비정상적인 세포내 국재화를 평가하기 위해 적용될 수 있다. 그와 같은 용도는 유전적 테스트에 적용될 수 있으나, 또한, 특정한 치료 방식을 모니터링하기 위해 적용될 수 있다. 치료가 변이 단백질의 발현 수준 또는 존재, 또는 변이 단백질의 비정상적인 조직 분포 또는 발생에 따른 발현(developmental expression)을 정정하는 것을 목적으로 하는 경우, 상기 변이 단백질 또는 그의 단편에 대해 특이적인 항체가 치료 효능을 모니터링하기 위해 이용될 수 있다.
항체는 또한, 예를 들면, 변이 단백질이 결합 분자 또는 파트너에 결합하는 것을 차단하는 것에 의해 변이 단백질 기능의 저해를 위해 유용하다. 그와 같은 용도는 또한 치료가 변이 단백질의 기능을 저해하는 것을 포함하는 치료적 상황에 적용될 수 있다. 항체는 예를 들면, 결합을 차단하거나 또는 경쟁적으로 저해하여, 그에 의해, 단백질의 활성을 조절(즉, 촉진 또는 길항)하기 위해 이용될 수 있다. 특정한 기능을 위해 요구되는 부위를 포함하는 특정한 단백질 단편에 대한 항체, 또는 세포 또는 세포막과 결합된 완전한 단백질에 대한 항체가 제조될 수 있다. 인 비보 투여를 위해, 항체는 방사성 핵종(radionuclide), 효소, 면역원성 에피토프, 또는 세균성 독소를 포함한 세포독성제(디프테리아 또는 리신(ricin)과 같은 식물 독소)와 같은 추가적인 치료적 유효탑재물(therapeutic payload)과 결합될 수 있다. 항체 또는 그의 단편의 인 비보 반감기는 폴리에틸렌 글리콜로의 접합을 통한 페길화(pegylation)에 의해 증가될 수 있다.
본 발명은 또한 본 명세서에 기재된 방법에서 항체를 사용하기 위한 키트에 관한 것이다. 이는 테스트 시료에서 변이 단백질의 존재를 검출하기 위한 키트를 포함하나, 이에 한정되지 않는다. 하나의 바람직한 구체예는 표지된 또는 표지가능한 항체 및 생물학적 시료에서 변이 단백질을 검출하기 위한 화합물 또는 작용제, 상기 시료 중의 변이 단백질의 양 또는 존재 및/또는 부재를 결정하기 위한 수단, 및 상기 시료 중의 변이 단백질의 양과 표준을 비교하기 위한 수단, 및 키트의 사용 설명서를 포함한다.
이하, 본 발명은 하기의 비-한정적인 실시예에 의해 예시될 것이다.
본 발명의 전술된 목적, 특징 및 장점과 기타 목적, 특징 및 장점은 본 발명의 바람직한 구체예의 하기의 보다 구체적인 설명으로부터 자명할 것이다.
도 1은 본 명세서에 기술된 위험 변이를 이용하는 컴퓨터-구현 시스템을 보여주는 도면을 제공한다.
도 2는 염색체 9q22.33 상의 영역에서 연관 결과 및 LD-구조의 개략도이다. (a) Illumina Hap300/370 칩으로부터의 SNP에 대한 단일 마커(다이아몬드) 연관 결과. 혈연관계에 대해 보정된 P 값이 표시된다. (b) CEU HapMap 집단으로부터의 쌍별(pair-wise) 상관계수 (r2) 및 UCSC Genome Browser, Build 36에 근거한, 영역 중의 유전자의 상대적 위치. .
도 1은 본 명세서에 기술된 위험 변이를 이용하는 컴퓨터-구현 시스템을 보여주는 도면을 제공한다.
도 2는 염색체 9q22.33 상의 영역에서 연관 결과 및 LD-구조의 개략도이다. (a) Illumina Hap300/370 칩으로부터의 SNP에 대한 단일 마커(다이아몬드) 연관 결과. 혈연관계에 대해 보정된 P 값이 표시된다. (b) CEU HapMap 집단으로부터의 쌍별(pair-wise) 상관계수 (r2) 및 UCSC Genome Browser, Build 36에 근거한, 영역 중의 유전자의 상대적 위치. .
실시예
1
갑상선암의 위험도를 부여하는 염색체 9
q22
.33 상의 위험 변이의 확인
아이슬란드에서 갑상선암의 발생률은 인근 국가에서보다 더 높고 세계에서 최고이다. 100,000명당 아이슬란드에서 연령 표준화된 발생률은 남성과 여성에서 각각 5명 및 12.5명이다. 평균 진단 연령은 남성의 경우 61세이고 여성의 경우 47세이다. 아이슬란드에서 조직학적 서브타입간의 분포는 다른 선진국가의 경우와 유사하다. 유두 조직학적 서브타입(papillary histological subtype)이 가장 빈번하여, 모든 갑상선암의 80%를 차지하고, 2위는 여포형(~14%)이며, 3위는 모든 갑상선 케이스의 약 5%를 나타내는 퇴화형이며, 가장 덜 흔한 서브타입은 수질형(~1%)이다.
대상자
본 연구의 허가는 아이슬란드의 국가 생명윤리 위원회(the National Bioethics Committee) 및 아이슬란드 데이터 보호국(the Icelandic Data Protection Commission)에 의해 허여되었다.
갑상선암 연구를 위해 이용된 본 발명자들의 표본 집합은 아이슬란드의 전체 분포를 상당히 잘 반영한다. 본 발명자들이 유전형분석을 수행한 406건의 케이스 중에서, 309건 (82%)이 유두형이고, 53건 (14%)은 여포형이며, 7건 (1.5%)은 갑상선 수질암이고, 37건은 미지 또는 미정(undetermined) 조직학적 서브타입이다.
상이한 조직학적 서브그룹 간에 통계적으로 유의성 있는 차이가 관찰되지 않았기 때문에, 하기의 표 1에 제시된 결과는 본 발명자들의 모든 케이스에 대한 통합 결과에 관한 것이다.
28,858명의 아이슬란드 대조군은 deCODE genetics에서 진행 중인 다른 게놈-전체 연관 연구로부터의 개인들로 구성되었다. 갑상선암의 진단을 갖는 개인들은 배제시켰다. 남성 및 여성 모두 포함시켰다.
유전형분석
갑상선암에 대한 감수성 변이의 게놈-전체 검색에서, 갑상선암으로 진단된 아이슬란드 환자 및 집단 대조군으로부터의 시료를 대상으로 국제 HapMap 프로젝트의 I 상으로부터 유래된 317,503개의 SNP를 포함하는 Illumina Hap300 SNP 비드 마이크로어레이(Illumina, San Diego, CA, USA) 상에서 유전형분석을 수행했다. 이 칩은 r2 >0.8의 공통된 SNP에 대한 Utah CEPH (CEU) HapMap 표본에서 약 75% 게놈 적용범위(genome coveragre)를 제공한다 (Barrett and Cardon, (2006), Nat Genet, 38, 659-62). 단일형(monomorphic)(통합 환자군 및 대조군에서 MAF(minor allele frequency)가 0.001 미만임)이거나, 낮은 수율(<95%)을 갖기 때문에 적합하지 않은 것으로 간주된 마커들은 분석 전에 제거하였다.
마커 rs907580, rs7024345 및 rs965513을 Centaurus SNP 유전형분석 (Kutyavin, et al., (2006), Nucleic Acids Res, 34, e128)에 의해 더 평가하였다.
모든 유전형분석은 deCODE genetics 시설에서 수행하였다.
통계적 분석
본 발명자들은 승법 모델을 가정하여, 즉, 한 명이 보유한 두 개의 대립인자의 상대적 위험도가 곱해진다는 것을 가정하여 SNP 대립인자의 오즈비(OR)를 계산하였다. 마커에 대해, 보인자 빈도가 아닌, 대립인자 빈도가 제시된다. NEMO 소프트웨어 패키지 (Gretarsdottir, et al., (2003), Nat Genet, 35, 131-8)에서 구현된 바와 같은 표준 우도 비 카이-스퀘어 통계값(standard likelihood ratio Chi-squared statistic)으로 연관된 P-값을 계산했다. OR의 추정값이 로그-노말 분포(log-normal distribution)을 갖는 것으로 가정하여, 신뢰 구간을 계산하였다.
모든 P-값은 양측(two-sided) P-값으로 보고된다.
결과
Illumina Hap300 칩으로부터의 유전형의 분석 후에, 본 발명자들은 갑상선암에 대한 매우 유의성 있는 연관을 제공한 염색체 9q22.33 상의 3개의 마커, rs965513, rs907580 및 rs7024345를 발견했다. 본 발명자들은 Centaurus 유전형분석을 이용하여, 추가적인 케이스를 유전형분석하는 것에 의해 이 결과들을 추적했다. 결과가 하기 표 1A에 표시된다.
모든 3개의 마커가 갑상선암에 대한 게놈-전체 유의성 있는 연관을 제공하고(317,000개의 테스트에 대한 보정은 (0.05/317,000 ~ 1.5 x 10-8 미만의 P-값을 필요로 함), rs965513 (OR 1.77, P-value 1.18 x 10-15)에 대해 가장 유의성 있는 결과를 수득했다. rs907580 및 rs702345 마커는 0.90의 r2-값으로(표 1B) rs965513과 상관되고, 따라서, 이 마커들은 동일한 연관 신호를 획득할 가능성이 가장 높다.
실시예
2
갑상선암의 위험도를 부여하는 서열 변이를 검색하기 위해, 본 발명자들은 Illumina HumanHap300 및 HumanCNV370-duo Bead Chip 유전형분석 플랫폼을 이용하여 192명의 조직병리학적으로 확인된 아이슬란드 갑상선암 케이스와 37,196명의 대조군을 대상으로 유전형분석을 수행하여 게놈-전체 연관 연구(genome-wide associatoin study, GWAS)를 수행하였다. 또한, 본 발명자들은 SNP 당 평균, 추가적인 186명의 갑상선암 환자들에 해당하는 유전형을 추가하기 위해, 유전형분석되지 않은 갑상선암 케이스에 관한 정보를 제공하기 위해 친척들의 알려진 유전형이 이용되는 것인 방법을 이용하였다(인 실리코 유전형분석(in silico genotyping)) (Gudbjartsson, DF et al Nat Genet 40:609-15 (2008)). 품질 검사(quality check)를 통과하지 못한 SNP를 제거한 후, 총 304,083개의 SNP를 연관에 대해 테스트하였다. 본 발명자들은 승법 모델을 가정하여 각 SNP에 대한 대립인자 오즈비(OR)를 계산하고 표준 우도 비(standard likelihood ratio) χ2 통계치를 테스트를 위해 계산하였다. 결과를 게놈 대조(genomic control) 방법을 이용하여 개체들 간의 가족 혈연관계 및 잠재적인 집단 계층화(population stratification)에 대해 보정하였다(Devlin B & Roeder K Biometrics 55:997-1004 (1999)); χ2 통계치를 1.09의 추정 팽창 인자(inflation factor)로 나누었다.
본 발명자들은 9q22.33 상의 FOXE1(Forkehead factor E1) 유전자와 동일한 연관 불균형(LD) 영역에 위치한 여러 강한 신호들을 관찰했다(도 2; 표 3). 이 결과들을 확인하고자, 본 발명자들은 Centaurus 단일 트랙 분석(single track assay) 유전형분석을 이용하여 추가적인 241명의 아이슬란드 갑상선암 케이스에서 이 SNP의 유전형분석을 수행하였다. 이 결과들을 GWAS로부터의 결과와 통합했을 때, 가장 강력한 연관 신호가 rs965513의 대립인자 A (rs965513-A) 및 rs10759944의 대립인자 A (rs10759944-A)에서 관찰되었고, 이 두개의 변이에 대한 OR은 1.77이었다 (rs965513, 및 rs10759944에 대해, 각각 P = 6.8 x 10-20 및 P = 1.7 x 10-19) (표 3 및 표 4). 이 두 SNP는 서로에 대한 거의 완벽한 대리물(surrogate)이고 (Utah CEPH (CEU) HapMap 표본에서 r2 = 1 및 아이슬란드 표본에서 r2 = 0.998) 변이의 효과가 상호 간에 구별될 수 없기 때문에, 본 발명자들은 이후의 조사에서 rs965513-A에 중점을 두었다. 다변량 분석에서 rs965513-A를 제어(control)하는 경우, 9q22.33 상의 나머지 SNP 중 어느 것도 유의성이 없다.
본 발명자들은 다음으로 미국, 오하이오주, 콜럼버스의 집단(324명의 케이스 및 384명의 대조군) 및 스페인(90명의 케이스 및 1,343명의 대조군) 집단으로 유럽 기원의 두 개의 케이스-대조군 그룹에서 갑상선암에 대한 rs965513의 연관을 테스트하였다. rs965513에 대한 연관은 두 연구 그룹 모두에서 재현되었다(표 4). 3개의 연구 집단 간의 OR의 이질성 테스트(test of heterogeneity)는 유의성 있는 차이를 보여주지 않았다(rs965513에 대해, P = 0.58). 아이슬란드, 콜럼버스 및 스페인으로부터의 결과를 통합하여 rs965513-A에 대한 1.75의 추정 OR을 얻었다(P = 1.7x10-27).
유전 방식을 조사하기 위해, 본 발명자들은 유전형-특이적 OR을 계산했고 승법 모델이 두 변이 모두에 대해 적합한 맞춤(fit)을 제공한다는 것을 확인했다(표 5). 전체 집단의 개인의 약 11%가 rs965513-A의 동형접한 보인자이다.rs965513-A의 동형접합 보인자는 비-보인자 대비 갑상선암을 발병할 위험도가 3.1배 더 높은 것으로 추정된다. 또한, 본 발명자들은 rs965513-A의 빈도가 3개의 집단 모두에서 보다 젊은 연령에서 진단된 케이스들 중에 더 높다는 것을 확인했다. 데이터를 통합하면, 보유된 각각의 대립인자에 대해, 진단 연령은 2.42년 낮아지는 것으로 추정된다 (P = 0.0014) (표 6).
본 발명자들은 갑상선암의 4개의 주요한 조직학적 종류에서 rs965513의 효과를 분석하였다. 스페인 및 아이슬란드 표본 집합의 대부분은 PTC (~85%) 및 FTC (~12%)로 구성되었고 컬럼버스로부터의 케이스는 모두 PTC였다. rs965513-A의 경우, 3개 집단의 통합 분석에서 PTC에 대한 관찰된 OR은 1.80 (P = 4.7 x 10-23)이고 FTC의 경우, 아이슬란드 및 스페인 표본만을 기준으로 할 때, OR은 1.55였다(P = 0.016) (표 7). 이는 상기 변이가 갑상선암의 두 개의 주요한 조직학적 종류의 위험도에 영향을 미친다는 것을 보여준다. 다른 조직학적 갑상선암 종류의 갯수는 너무 제한적이어서 의미있는 결론을 도출할 수 없었다.
SNP rs965513은 하기의 유전자들이 위치한 LD-영역 내의 9q22.33 상에 존재한다: XPA, FOXE1, C9orf156 및 HEMGN (도 2). 가장 인접한 유전자는 FOXE1이고, rs965513에 대해 약 57 kb 떨어져(telomeric) 위치한다. FOXE1은 뇌하수체 및 갑상선 형성을 위해 중요하고(Dathan, N et al Dev Dyn 224:450456 (2002); De Felice, M et al Nat Genet 19:395-98 (1998)) 배아 단계에서 갑상선 분화를 개시하는 전사인자 및 보조인자들의 조절 네트워크의 중심에 있다(Parlato R et al. Dev Biol 276:464-75 (2004)). 또한, FOXE1 유전자의 돌연변이는 다른 표현형들 중에서 특히, 갑상선 발육부전(thyroid agenesis)와 연관된 인간 증후군을 유발한다(De Felice, M et al Nat Genet 19:395-98 (1998); Clifton-Bligh RJ et al. Nat Genet 19:399-1401 (1998)). FOXE1은 또한, Tg(thyroglobulin) 및 TPO(thyroperoxidase) 유전자와 같은, 갑상선-특이적 유전자의 전사 조절에서의 관여에 근거하여, 갑상선의 분화 상태의 유지를 위해 필수적이다. Tg가 T3(triiodothyronine)및 T4(thyroxine)의 전구체이고, 그들의 합성이 TPO에 의해 촉매되기 때문에, 이 두 유전자 모두의 조절된 발현은 갑상선 호르몬인 T3와 T4의 합성을 위해 중요하다. 주요한 조절자로 작용하는 갑상선 자극 호르몬(TSH)이 갑상선 호르몬 합성 및 분비 조절의 중심이다.
갑상선의 생명 작용에서 FOXE1의 관여를 고려하여, 본 발명자들은 혈청에서 TSH (N = 12,035), 유리 T4 (N = 7,108), 및 유리 T3 (N = 3,593)의 순환 수준에 대한 rs965513-A의 효과를 평가하였다. 사용된 데이터는 갑상선암을 갖는 것으로 알려지지 않은 아이슬란드인으로부터 11년(1997년부터 2008년)의 기간 동안 수집된 일련의 측정값들로부터 얻었다(표 8). rs965513-A는 rs965513-A 카피 당 5.9% 감소된 TSH 혈청 수준과 연관되었고 (P = 2.90x10-14; 표 9), 또한 T3 및 T4의 수준과, 그러나 반대 방향으로; rs965513-A 카피 당 1.2%의 T3 수준 증가 및 1.2%의 T4 수준 감소와 연관되었다(T3 및 T4 각각에 대해, P = 3.00 x 10-3 및 6.10 x 10-5) (표 9). 이 데이터는 9q22.33 변이가 갑상선의 내분비 기능의 일부 양태에 영향을 미친다는 것을 보여준다.
종합하면, 9q22.33 상의 rs965513의 갑상선 및 갑상선 관련 호르몬에 대한 효과, rs965513의 FOXE1에 대한 근접성, 및 FOXE1의 갑상선 특이적 유전자에 대한 제어 효과는 갑상선암과 rs965513 간의 연관이 FOXE1을 포함하는 과정을 통해 매개된다는 것을 강력하게 시사한다. 또한, FOXE1의 발현은 갑상선암에서 비정상적인 것으로 확인되었다(Sequeira, MJ et al. Thyroid 995-1001 (2001)). 따라서, 이 변이는 갑상선암에 대한 유전적 감수성의 가장 중요한 결정인자에 속할 가능성이 있다.
방법
대상. 아이슬란드 연구 집단. 갑상선암으로 진단된 개인들을 1995년 1월 1일부터 2007년 12월 31일까지 진단된 1,110명의 아이슬란드 갑상선암 환자들을 포함하는 아이슬란드 암 등록부(Icelandic Cancer Registry, ICR)(http://www.krabbameinsskra.is/)의 전국 목록에 근거하여 파악하였다. 이들 중, 1.097명은 비-수질성 갑상선암이었다. 아이슬란드 갑상선암 연구 집단은 2000년 11월부터 2008년 4월까지 모집된 460명의 환자들(1974년 12월부터 2007년 6월 사이에 진단됨)로 구성되었고, 이들 중 454명(98%)은 이 연구에서 성공적으로 유전형이 분석되었다. 본 연구에서 이용된 모든 갑상선 암종의 조직학을 검토하고 확인하였다. 총 192명의 환자를 Illumina Sentrix HumanHap300 (n = 96) 및 HumanCNV370-duo Bead Chip (n = 96) 마이크로어레이 (Illumina, San Diego, CA, USA)를 이용한, 게놈-전체 SNP 유전형분석 노력에 포함시켰고 본 발명자들의 품질 검사 기준에 따라 성공적으로 유전형을 분석하고 본 케이스-대조군 연관 연구에서 이용하였다. 나머지 241명의 케이스는 Centaurs 단일 트랙 유전형분석 플랫폼을 이용하여 유전형분석하였다. 동의한 환자들의 평균 진단 연령은 44세(중위(median) 43세)였고, 범위는 13세 내지 87세였으며, 반면에, ICR에서 모든 갑상선암 환자에 대한 평균 진단 연령은 56세였다. 진단부터 혈액시료 채취까지의 중위 시간(median time)은 10년이었다(범위 0년 내지 46년). 본 발명자들이 1998년 전에 진단된 개인들과 1998년 이후에 진단된 개인들 간에 A-rs965513의 빈도를 비교했을 때, 유의성 있는 차이가 관찰되지 않았다(P = 0.97). 본 연구에서 이용된 37,202명의 대조군(16,109명의 남성 (43.3%) 및 21,093명의 여성 (56.7%))은 deCODE에서 상이한 유전적 연구 프로젝트에 속하는 개인들로 구성되었다. 상기 개인들은 심혈관계의 흔한 질환(예를 들면, 뇌졸중 또는 심근경색), 정신 질환 및 신경 질환(예를 들면, 정신분열증, 양극성 장애), 내분비계 및 자가면역계 질환(예를 들면, 타입 2 당뇨병, 천식), 악성 질환(예를 들면, 유방암 또는 전립선암)으로 진단되었고 및 아이슬란드 가계 데이터베이스(Icelandic genealogical database)로부터 무작위로 선택된 개인들이었다. 대조군의 총 수의 6% 이상을 차지하는 단일 질병 프로젝트는 없었다. 대조군은 84세의 평균 연령을 가졌고, 범위는 8세 내지 105세였다. 선형 회귀 분석은 A-rs965513의 대립인자 빈도와 아이슬란드 대조군의 출생년도 간에 상관관계가 없다는 것을 보여주었다(P > 0.2). 대조군은 ICR에 따른 갑상선암 환자의 전국 목록에 없었다. 아이슬란드 케이스와 대조군 모두에 대한 DNA를 표준 방법을 이용하여 전혈로부터 분리하였다.
본 연구는 아이슬란드 데이터 보호국 및 아이슬란드의 국가 생명윤리 위원회로부터 승인받았다. 서면 고지 동의서(written informed consent)를 모든 대상자들로부터 받았다. 의료 정보 및 혈액 시료와 관련된 개인 식별자(personal identifier)를 이전에 기술된 바와 같이 제3자 암호화 시스템(third-party encryption system)에 의해 암호화하였다(Gulcher, JG et al. Eur J Hum Genet 8:739-42 (2000)).
미국, 오하이오주, 콜럼버스(Columbus, Ohio, US). 본 연구는 오하이오 주립대학교 제도 검토 위원회(Institutional Review Board of Ohio State University)에 의해 허가되었다. 모든 대상자는 서면 고지 동의서를 제공했다. 케이스 (n= 342)는 조직학적으로 확인된 갑상선 유두암 환자들(전통적인 PCT 및 여포 변형 PTC(follicular variant PTC) 포함) 이었다. 1명의 케이스가 Cooperative Human Tissue Network (CHTN)을 통해 확보된 것을 제외하고, 이 환자들은 오하이오 주립 대학교 종합 암 센터(Ohio State University Comprehensive Cancer Center)에 입원하였다; 상기 한 명의 케이스는 펜실베니아 대학교 의료원에 입원했다. 모든 케이스는 코카서스인이었다; 92명의 남성, 250명의 여성, 중위 연령 40세, 범위 13세 내지 88세. 게놈 DNA를 혈액 시료, 또는 PTC 환자로부터의 신선한 동결된 정상 갑상선 조직으로부터 추출하였다. 대조군(n= 384)은 중부 오하이오 지역의 임상적으로 갑상선암 진단을 받은 적이 없는 개인들이었다. 모든 대조군은 코카서스인이었고, 143명의 남성, 241명의 여성, 51세의 중위 연령, 범위 18세 내지 94세였다.
스페인. 스페인 연구 집단은 90명의 갑상선암 케이스로 구성되었다. 상기 케이스들은 2006년 10월부터 2007년 6월까지, 스페인, 사라고사의 사라고사 병원의 종양과로부터 모집하였다. 모든 환자들은 유럽계 후손으로 자가-보고하였다. 발병연령, 등급 및 병기를 포함한 임상적 정보를 의료 기록으로부터 수득하였다. 환자의 평균 진단 연령은 48세였고(중위 49세) 범위는 22세 내지 79세였다. 1,343명의 스페인 대조군 개인은 579명 (43%)의 남성 및 764 (57%)명의 여성으로 구성되었고, 이들은 51세의 평균 연령(중위 50세 및 범위 12세 내지 87세)을 가졌으며, 스페인의 사라고사에 있는 대학 병원에서 접촉하였고, 갑상선암을 갖는 것으로 알려지지 않았다. 스페인 케이스 및 대조군 모두에 대해 DNA는 표준 방법을 이용하여 전혈로부터 분리하였다. 연구 프로코콜은 사라고사 대학 병원의 제도 검토 위원회(the Institutional Review Board of Zaragoza University Hospital)에 의해 허가되었다. 모든 대상자들은 서면 고지 동의서를 제출하였다.
통계적 분석
연관 분석. 이전에 설명되고(Gretarsdottir S et al. Nat Genet 35:131-38 (2003)) NEMO 소프트웨어에서 구현된 우도 절차(likelihood procedure)를 이용하여 연관 분석을 수행하였다. 보고된 SNP에 대해 모든 개인들을 대상으로 유전형분석을 수행하고자 하였다. 모든 그룹에서, 수율은 SNP에 대해 95%보다 높았다. 본 발명자들은 개체가 혈연관계가 아닌 경우, 귀무 가설 하에 점근적으로 1의 자유도를 갖는 χ2 분포를 가질, 표준 우도 비 통계치를 이용하여 갑상선암에 대한 대립인자의 연관을 테스트하였다. 본문에서, 보인자 빈도가 아닌 대립인자 빈도를 마커에 대해 제시하였다. 개인의 두 개의 염색체에 대한 승법 모델을 가정하여, 대립인자-특이적 OR 및 연관된 P 값을 계산하였다(Falk CT & Rubinstein P Ann Hum Genet 51(Pt 3):227-33 (1987)). 3개의 케이스-대조군 그룹 각각에 대해, 대조군에서 HWE로부터의 유의성 있는 편차는 없었다 (P > 0.3). 복수 개의 케이스-대조군 그룹으로부터 결과를 그룹들이 대립인자 및 유전형에 대해 상이한 집단 빈도를 가질 수 있으나, 공통된 상대적 위험도를 갖는 것으로 가정되는 것인 Mantel-Haenszel 모델 (Mantel, N & Haenszel, W J Natl Cancer Inst 22:719-48 (1959))을 이용하여 통합하였다(Gudmundsson et al. Nat Genet 39:977-83 (2007) 참조).
혈연관계 및 게놈 대조에 대한 보정. 아이슬란드 GWAS 그룹의 일부 개인들은 상호 간에 혈연관계를 가져서, 전술된 χ2 검정 통계치가 1보다 큰 평균을 갖게 했다. 본 발명자들은 게놈 대조 (Devlin B. Roeder K. Biometrics 55:997-1004 (1999)의 방법을 이용하여 팽창 인자를 추정하고, 304,083개의 χ2 통계치들의 평균을 계산하였다. 이 방법에 따르면, 팽창 인자는 1.09로 추정되었다. 단일 분석 유전형분석(single assay genotyping) 때문에, 유전형 분석된 케이스와 인-실리코 유전형분석된 케이스의 표본 크기의 변화에 근거하여, 본 발명자들은 통합된 아이슬란드 표본 세트의 팽창 인자가 1.12인 것으로 추정하였다. 통합된 아이슬란드 표본에서 갑상선암과의 연관에 대한 테스트를 위한 χ2 통계치를 이에 따라 조정하였다.
유전형 분석
Illumina 유전형분석. 192명 및 37,202명의 아이슬란드 케이스- 및 대조군-시료를 각각 Illumina Sentrix HumanHap300 또는 HumanCNV370-duo Bead Chip (Illumina, San Diego, CA, USA)으로 분석하고 본 발명자들의 품질 관리 기준에 따라 성공적으로 유전형분석을 수행하였다. 칩에서 분석된 SNP 중에서, 95%보다 낮은 수율을 갖는 SNP는 케이스 및 대조군의 통합된 세트에서 0.01 미만의 소수 대립인자 빈도를 갖거나, 단일형인 SNP들은 분석에서 제외시켰다. 추가적인 4,632개의 SNP가 대조군에서 하디-와인버그 평형(ardy-Weinberg equilibrium)으로부터 유의성 있는 왜곡을 보였다 (P < 1.0x10-3). 전체적으로, 13,420개의 특유한 SNP를 연구로부터 제외시켰다. 따라서, 본문에서 보고된 분석은 304,083개의 SNP를 이용했다. 98% 미만의 SNP의 전체 콜 레이트(call rate)를 갖는 시료도 게놈-전체 연관 분석에서 배제하였다.
단일 트랙 분석 SNP 유전형분석. Centaurus (Nanogen) 플랫폼 (Kutyavin, IV et al Nucleic Acids Res 34:e128 (2006))을 적용하여, 아이슬란드, 레이캬비크에 있는 deCODE Genetics가 아이슬란드 및 스페인으로부터의 두 개의 케이스-대조군 그룹에 대한 단일 SNP 유전형분석을 수행하였다. 각 Centaurus SNP 분석의 질은 CEU 및/또는 YRI HapMap 표본에서 각 분석을 유전형분석하고, 그 결과를 HapMap 공개 데이터와 비교하는 것에 의해 평가하였다. 1.5%보다 높은 불일치율을 보이는 분석은 이용하지 않았고, LD인 것으로 알려진 마커들에 대해 연관 불균형(LD) 테스트를 이용하였다. 본 발명자들은 Illumina Hap300 칩 및 Centaurus 단일 트랙 SNP 분석을 이용하여 330명의 개인들의 유전형분석을 수행하였고 0.5% 미만의 불일치율을 관찰했다.
오하이오 연구 집단으로부터의 시료의 유전형분석은 이전에 기술된 (He H. et al. Thyroid 15:660-667 (2005)), 오하이오 주립 대학교의 SNaPshot (PE Applied Biosystems,Foster City, CA) 유전형분석 플랫폼을 이용하여 수행하였다.
TSH, 유리-T4 및 유리-T3 측정.
TSH, 유리-T4 및 유리-T3 수준을 내과 전문 클리닉인 아이슬란드 의료원(Iceland Medical Center)(Laeknasetrid)에서 1997년과 2008년 사이에 진찰 받은 아이슬란드인을 대상으로 측정하였다. 측정은 아이슬란드, 레이캬비크, 묘드(Mjodd)에 있는 연구소에서 수행하였다. 특정된 범위 외부의 측정값들은 제거했다. 로그-변환된 측정값들을 일반화 가법 모델(generalized additive model)을 이용하여 성별 및 측정시 연령에 대해 조정했다. 개인에 대해 복수의 측정값이 존재하는 경우, 로그-조정 측정값(log-adjusted measurement)의 평균을 후속 분석에서 이용했다. 연령 및 성별 조정된 로그-변환 측정값을 고전적인 선형 회귀를 이용하여 대립인자 계수(allele count)에 대해 회귀시켰다.
100: 컴퓨팅 시스템 환경(computing system environment)
110: 컴퓨터
120: 프로세싱 유닛
121: 시스템 버스
130: 시스템 메모리
131: ROM
132: RAM
133: BIOS
134, 144: 오퍼레이팅 시스템
135, 145: 애플리케이션 프로그램
136, 146: 기타 프로그램 모듈
137, 147: 프로그램 데이터
140: 비-이동성 비-휘발성 메모리 인터페이스
141: 하드 디스크 드라이브
150: 이동성 비휘발성 메모리 인터페이스
(removable non-volatile memory interface)
151: 자기 디스크 드라이브
152: 디스켓
155: 광학 디스크 드라이브
156: CD (compact disk)
160: 사용자 입력 인터페이스
161: 마우스
162: 키보드
170: 네트워크 인터페이스
171: LAN(local area network)
172: 모뎀
173: WAN(wide area network)
180: 원격 컴퓨터
181:
185: 원격 애플리케이션 프로그램
190: 비디오 인터페이스
191: 모니터
195: 출력 주변장치 인터페이스 (output peripheral interface)
196: 프린터
197: 스피커
110: 컴퓨터
120: 프로세싱 유닛
121: 시스템 버스
130: 시스템 메모리
131: ROM
132: RAM
133: BIOS
134, 144: 오퍼레이팅 시스템
135, 145: 애플리케이션 프로그램
136, 146: 기타 프로그램 모듈
137, 147: 프로그램 데이터
140: 비-이동성 비-휘발성 메모리 인터페이스
141: 하드 디스크 드라이브
150: 이동성 비휘발성 메모리 인터페이스
(removable non-volatile memory interface)
151: 자기 디스크 드라이브
152: 디스켓
155: 광학 디스크 드라이브
156: CD (compact disk)
160: 사용자 입력 인터페이스
161: 마우스
162: 키보드
170: 네트워크 인터페이스
171: LAN(local area network)
172: 모뎀
173: WAN(wide area network)
180: 원격 컴퓨터
181:
185: 원격 애플리케이션 프로그램
190: 비디오 인터페이스
191: 모니터
195: 출력 주변장치 인터페이스 (output peripheral interface)
196: 프린터
197: 스피커
SEQUENCE LISTING
<110> deCODE Genetics ehf
<120> GENETIC VARIANTS USEFUL FOR RISK ASSESSMENT OF THYROID CANCER
<130> P2560-PC00
<160> 229
<210> 1
<211> 599
<212> DNA
<213> Homo sapiens
<400> 1
caaatatgaa ggaagaagag tggaatacag gaattagaat acttgaaata gagtagttat 60
gatgatgaac cacagaaatt tagctggtta aggaaggaag tgagaacctg agggaaatga 120
cagatagtgg gaaaagtgga agggccagtg tattggaagt cttgatgagg tggattggaa 180
atactgcccc aagggagctg ggatgaaagg aggtagcagg cagagaatgt aggtttttgg 240
tgatggtatg gtcatggaca tgacaaaggt aatgagtggc tggaatggaa cagatcaaar 300
gagtaaatta aaaagaagat gtattagtct gttctcacaa tgctaacaaa gacataacct 360
gagcctgggt aatttataaa agaaagagat ttaattgact cgcagttcag catggctggg 420
gaggcctcag gaaacttaca atcatggtgg aatgggaagc caacacgtac ttcttcacat 480
ggtagcagga agcaaaagtg ctgagcaaaa gggggaaaag gcccttataa aaccatcaga 540
tcttgtgaga actcactcat tatcaccaga acagtatgag ggtaactgtc cccatgatt 599
<210> 2
<211> 599
<212> DNA
<213> Homo sapiens
<400> 2
tgcttacccc aagtcacata gcaagttagg caggagactg ggcacaagac ctcctgactt 60
ccgcaccacc acaaccctca aatttttttt aatgagtgtt tttctttaaa acatagtatg 120
aacactggaa cagagggaaa tgcagtattc caatttccat ccacagtgtt gtccgacctg 180
gcatctcact ggagtcccca agcacaggcc ctggcagcag accaggctgg gttcaagtcc 240
tactcctgcc ttttgctagc cccacggctt tggcaaatta ctgcagttgg aattattaas 300
tgttggaatt attaaattgt tggaattatt aagtgaacta atgggcacag acattttgtt 360
ccacacttag catatagtaa gcacccaatt attgctattg ccattagcag ctccggcact 420
tacctgccag gtgtgcaagg ccctcaactg ctaagccttc tgtctcaaat gagacatcac 480
caagatttct cctaactcca gagccctgta gtctccacca cctggcccaa atgaaacgat 540
ggaccccaga atcagggaag tatggtggga acctgtgtca cttccctgtt tctctttct 599
<210> 3
<211> 599
<212> DNA
<213> Homo sapiens
<400> 3
ggcctccaat atggctcagc acagccctga tagaaaatat tttgaaattt tgcttgtatg 60
aaatgtctct attctattct ttcatttagc tgggaattga attctaggtc aaaaataatt 120
ttccttcaga attttggagg caatgttcca tcatcttctc acttccagtg ttactttctg 180
agaagtcttc aatcactata attgctgacc atttttgtac gtgacctggt tttgctgttt 240
ggaacctcat agaatctttt ctttatcacc agtattcttg tactttgcag taattgtttk 300
gtggagcttt ttgtttgttt gtttgttttt taatctatgg acctgattct caaggattct 360
ttcattctgg agacttatgc ccttgggttc tggagaaatc aatctctttt taaagaaaat 420
aatttttcac cttctttttt tcactgtctg gaagtactat tagtcaaatt tactgaattc 480
gtccttattt ttcttacatt ttctccacta ttttcatctc tttgccattt gttttctatt 540
ttcggacaga ctgccttgtt gataagagga taagtgcagt ctttcagata cattttctt 599
<210> 4
<211> 599
<212> DNA
<213> Homo sapiens
<400> 4
attattttgc actaattttt atattttaaa atgctgttta aaatatcatt tattgtgatt 60
attgagattt tgggtgctct cttgcatttt gcacttgaag caagtgcctc actttccttt 120
ctcttgtccc atccttaatt cccatgacct ttcttgggaa gttactgaaa tatgtgcttc 180
cctcaaaaaa ggagaaaatc aagaaggaga aagacatgga cacaagggca aggcatgaaa 240
cacggcagaa agatcaaggg aattcctgta gtgttggtga agggtgatcc tagggtgatr 300
accatgccca aatcagagag gccaagagac ctagattgca gcaagacaga aggcaagaag 360
tggaaactgg taagttcata cgaaaacaca gagaggaggg cattaaggat ggtaataatt 420
ttttttaatt cagcaaatga aaacacagat aattattatc tccagacaaa accaaaagtc 480
caaaaatgga aataaataaa taaataaata aataaataaa taaatagtat tctactagtt 540
cagctgtgaa aagcatttag ataatactat aaacactgac tattgatcta attaacatt 599
<210> 5
<211> 599
<212> DNA
<213> Homo sapiens
<400> 5
tactgtatta tgtacttgaa aattactgag agggtagatc tcaagtgttt tcatcacaca 60
cacacataca cacacacaca cacacacaca cacacacaca cacacaaatg taaccacatg 120
aggtgatgaa tatattaatt agcttgattg tggtaatcat ttcacaatgt atatacacat 180
caaaacatca tgttgtacac cttaaatata tacaattttt atttgccaat tatatctcaa 240
ttgttaaaaa tcaagtaata gcaagttaat tgagttatat agagatgtgg aagaaaatay 300
taaaaaagtg aaaagaggtg gaaaaaattt gcttttgggt gggggatatg ggagaaggca 360
aagcaatagg gctactcttt ttgtgtcaaa tcttacagag ttatttgatc tttaaactat 420
gtatctgtat aactttaaaa aatataaaaa ctttctaaaa acgatgtatt gatagctgtt 480
ttcagattag ttgaaacatt tgggaagaat tagagaaaac tacctagatg actcatccaa 540
gcaattatta agtccaggaa aaacaaaaag aagtacaaaa agagagacat agtaatatg 599
<210> 6
<211> 599
<212> DNA
<213> Homo sapiens
<400> 6
tcaggtcaaa gcagcaaggc tttttctgac ttagcctcag aagtcataca acatcacttc 60
tgccatattc tttttattac aagtgagagt tccaggattg gtccaggtcc aagggaaggg 120
tagtacacat acacgtgaac actgggaggc atagtttatt gagaccctct tacagctacc 180
tggagcatag agtcagaagt cttcctagct tctctgattg tactcgaccc cttctccccg 240
ctatgcctct gaccatcctc ttaattttgg ctgggagttg ttgcagaaga cacatccatr 300
ctccaggtgt gcacagtccc cttcgtggtc agcagaatgt gtacagcctc attgtgagca 360
gggccaacag taggttacca agctcctgca atgctggagt gcccattacc aactcctgcc 420
aacccactgc cacatagtat ctcatgggct cttgtttaag ctgaacatat tcactggggc 480
caccttggag aacttggcct tgacctgctt aaacacttga gcaaggttct attctgagag 540
cttggatctt tcctgagacc aacaggactc acaggggttt tgcagatggg actaagagc 599
<210> 7
<211> 599
<212> DNA
<213> Homo sapiens
<400> 7
gtgggttggc aggagttggt aatgggcact ccagcattgc aggagcttgg taacctactg 60
ttggccctgc tcacaatgag gctgtacaca ttctgctgac cacgaagggg actgtgcaca 120
cctggagcat ggatgtgtct tctgcaacaa ctcccagcca aaattaagag gatggtcaga 180
ggcatagcgg ggagaagggg tcgagtacaa tcagagaagc taggaagact tctgactcta 240
tgctccaggt agctgtaaga gggtctcaat aaactatgcc tcccagtgtt cacgtgtatr 300
tgtactaccc ttcccttgga cctggaccaa tcctggaact ctcacttgta ataaaaagaa 360
tatggcagaa gtgatgttgt atgacttctg aggctaagtc agaaaaagcc ttgctgcttt 420
gacctgagtc tcttggaaca ttctctaagg agccgtgaac tactatataa gaagtctgcc 480
atactgggga agccaagtgt aggcactccg gttaacagtc cccgcacagc tccgccttcc 540
agccattccc actaagacat cacacataca agggaagttg tctcggatcc tccagatca 599
<210> 8
<211> 599
<212> DNA
<213> Homo sapiens
<400> 8
atcagagaag ctaggaagac ttctgactct atgctccagg tagctgtaag agggtctcaa 60
taaactatgc ctcccagtgt tcacgtgtat gtgtactacc cttcccttgg acctggacca 120
atcctggaac tctcacttgt aataaaaaga atatggcaga agtgatgttg tatgacttct 180
gaggctaagt cagaaaaagc cttgctgctt tgacctgagt ctcttggaac attctctaag 240
gagccgtgaa ctactatata agaagtctgc catactgggg aagccaagtg taggcactcy 300
ggttaacagt ccccgcacag ctccgccttc cagccattcc cactaagaca tcacacatac 360
aagggaagtt gtctcggatc ctccagatca gcccatccac aagctgaata ctcccaagtg 420
acttcagcca gtaccacaca gagcagaaga atctctcagc tgatcctggc ccaaattcct 480
gacccacaaa attataatac aaaataaaat ggttgctatt ttaagccact aagtgagggg 540
gcaattaata tgcagcaata cataaccagc atatcacctt tgggagatgc ttgagaata 599
<210> 9
<211> 599
<212> DNA
<213> Homo sapiens
<400> 9
tcaggaggct gaggtggaag aatcccttga actcaggagg aggaggttgc agtgagccga 60
gattgcacca ctgcactcca gcctgggtga aagagagaga agagattctg tctcacaaaa 120
aaaaaaaaaa aaaaaaaaaa aagtgccggg cacggtggct cacgcctgta atcccaacac 180
tttgggaagc tgaggctgtt ggatcacttg aggtctggag ttcgagacca gtctagccaa 240
catggtaaaa cccatgtcta ctaaaaatac aaaaattagc cagttgtgat ggcacatgcy 300
taacatgcct gtaatcccag gtacttggga gactgaggca ggaaaattgc ttgaacccag 360
gaagtggagt ttgcagtgag ccaagatcgc accaccgcac tccagcctgg gtgaaagaat 420
gagaccctgc ctcaaaaaaa aaaaaaaaaa aaaaaaggaa acaagagata tgtcaaccaa 480
attcaatgtg tatatcagaa tccacaaagt ctgtggattc tgatatatac attagtgtgt 540
gtgtgtgtgt gtgtgtgtgt atttgaacat agactaggta tttagtgata ttaacaatt 599
<210> 10
<211> 599
<212> DNA
<213> Homo sapiens
<400> 10
cccaacactt tgggaagctg aggctgttgg atcacttgag gtctggagtt cgagaccagt 60
ctagccaaca tggtaaaacc catgtctact aaaaatacaa aaattagcca gttgtgatgg 120
cacatgctta acatgcctgt aatcccaggt acttgggaga ctgaggcagg aaaattgctt 180
gaacccagga agtggagttt gcagtgagcc aagatcgcac caccgcactc cagcctgggt 240
gaaagaatga gaccctgcct caaaaaaaaa aaaaaaaaaa aaaaggaaac aagagatatr 300
tcaaccaaat tcaatgtgta tatcagaatc cacaaagtct gtggattctg atatatacat 360
tagtgtgtgt gtgtgtgtgt gtgtgtgtat ttgaacatag actaggtatt tagtgatatt 420
aacaattatt tttaatttta ggtgtgatat aatattgtgt atatttttta aagataaaag 480
atgtatttag agataaaaag atatatgcat cccaggtata tctgggattt gcttcaaatg 540
aatgcagtgg taagggggta ggaatagaca gggtataagg aggcaagatt ggccatatg 599
<210> 11
<211> 599
<212> DNA
<213> Homo sapiens
<400> 11
ggatgcataa tggaggggag tttggagagg gaacaaaatt attaaggagg attatactgt 60
caccactcga cacaatggag actgctgctt ttaactgcct taaacaagtc ttgcttcata 120
ccagagctgc gactcaagga ggcgtcgcca tgggaagtgg atcctgccca gccgatcaaa 180
tctttcttct tggctgggtc tttgagtgca ggttttctgc ctatacaaca agagaatgga 240
tgtggctctt agaatgcact tgaaattctt cttcctcttc atggtgtctt tgtggccagr 300
tgtcttggaa ggcccaggaa tgaaggcgcc tctggataaa gtggccatcc tgcttctgag 360
agcatggggg acccaggcaa gttactatct ttctgtgagt ctctgtttcc tccagatgca 420
gtgagcagcg gtatagcata gggttagcca gagggctcta gagacatctg gttcccgcaa 480
ctcaccagct ctgcaacctt gttaggccat gcaactccta tgtgccttat tccctattta 540
taaagtaggg atgataactt ccacctcaca ttgttgatga aaggataaaa ttagataat 599
<210> 12
<211> 599
<212> DNA
<213> Homo sapiens
<400> 12
tggtgtgatt ccgatgcagc ccatctttcc tgcctccaga ctgcacctca tactttctct 60
tcatcttgga taccctcctt ccagggtttt gcttcatcag atctttctta ttctccaagg 120
accaggtcca gtatcaccct tcaggaagat ggggcactct tcctgacccc agtgccccat 180
agcccatctc tggcccttcc tgtggtcctg atgaccatac tttgctggtg ctggggtctg 240
tgaccatgca gtcctgggag gaagccacct tcaactcact ctgcttctgc cagtgctccr 300
tgcaacatct tgttcatggt aggggctcac gtttgtgtgg aatgatgaga atgggtggtg 360
ggggcctggc tgccacaggg aggtatgtgt agtctaccaa agcagcatgc tccttcctgg 420
tcatgaggtg gtgaccatct catggcagcc ttgaagttga aggaaagtga ctactgaggc 480
tgctctccat tttctcatcc agaactgggg ctgggaactt agaagcaatg gagggagcat 540
tgctttgctc tgaatggagg acagtttatg gctttcacgt tccaggccct aggaggaaa 599
<210> 13
<211> 599
<212> DNA
<213> Homo sapiens
<400> 13
actgcatggt cacagacccc agcaccagca aagtatggtc atcaggacca caggaagggc 60
cagagatggg ctatggggca ctggggtcag gaagagtgcc ccatcttcct gaagggtgat 120
actggacctg gtccttggag aataagaaag atctgatgaa gcaaaaccct ggaaggaggg 180
tatccaagat gaagagaaag tatgaggtgc agtctggagg caggaaagat gggctgcatc 240
ggaatcacac caggtagaat ggttggttgg ttgaattggg aggtggagct ggagaggtaw 300
gtagggcaga tggcaaaagg ccttaaattc aggccaagga gagtggactt gattatggag 360
gcaacagaga ctgagggaca agagctggga ttggaaagag gccccaagca tatatgaagc 420
tcccctactc atgcctgccc cacacctttt catgggatgt tgtacagcac actcccagat 480
ttggaaagcc ccatctataa atctttcagt cccaggatca ctcctttcta cagtggcttc 540
agcagcaatg acagagtcaa gagaggtcac cctttaggtt tctcaacaca gttgccctt 599
<210> 14
<211> 599
<212> DNA
<213> Homo sapiens
<400> 14
aggctttgtg ttagatgatt ttgcctgact gtgggctaat ggaagtggtt tgagcacatt 60
tgaggtaggc tagagtaagc tatgttgttc agtaggttag gtgtattaaa tgcattttca 120
acttatgata ttttcagttt tcaatgggtt tattgggaca taaccacatc ataagccaag 180
aagcatctgt attttactag ggagcaggag tgaggaacaa ggagagcgaa gcaggcaaga 240
gggaggatac aaggatatat gatggagacg gccactgcta aatgcacctc attattcaay 300
ctcatggaaa tgtcccccga gaaaccatgc aatctgtgtc tcaggtaggg tgaccaacca 360
tcctggtttt ctcaagatgg ggggattttt ccaggatgtg gaactttcag tgccaaaccc 420
aggaaggtcc tgggaaaacg agaatgagct tgttccgtag aatcaggacc actggatttg 480
aggatagaaa aatggaaaga tagggaaggt aacagttgat ggtcttgatt gctttatgaa 540
gtgcgacata cagagatggg tgtgggaaac taaaaatggg gtatgaatag ttgaaagaa 599
<210> 15
<211> 599
<212> DNA
<213> Homo sapiens
<400> 15
ctttcttctt ggagcactgc aaaatcattt aagggttata aacagaagag ctggtgcatt 60
agccagggtt ctccagagag acagaaccct taagatatat ataaatgtag agaaaaagat 120
tcatcatgag gaattggctt atgtgattat ctgctatctg caagctgaag gcccaggaaa 180
gccagtggtg tagttcttat ccaagcccaa aggcctgaga atcaggagtg ctgatgtccg 240
agaataaaag aagatggatg ttccagctcc agagaagaga gaatgtaccc ttcctcgacm 300
ttttttgttc ttttccagtc ctcaatggac tgggtgatgc ccatgcatgt tggggagggt 360
ggagcttctt tactgcctgc tgattcaaat gctaatgtct tctggaaaca cgtgcacaga 420
catactcaga aataatgttt tgccagctat ctgggtatgc cttagcccag tgaagctggc 480
acacaaaatt aaccatcaca gtacgcatga tttgatttat acttttaaat acacctttaa 540
atttgatttc caccctggct gctgagtgga caatagaaag tacaggaaca agacaaata 599
<210> 16
<211> 599
<212> DNA
<213> Homo sapiens
<400> 16
agtagaggta taaaatataa ggttggatat atatgagtgt gagctagaca gagctgtatg 60
tagttttggg aggcactgca gcatattcaa agccttgggc cagaggagct caggagctca 120
ccagggagaa gatggatcta aagaaggaga tctatggcca agacttgcag cactatgaca 180
tttagaaatc aagcagcaaa tgtgcagggc tgctaaggag actacaaagg gacaactaaa 240
aagatatgat attctagaag ccaagagaag aaagcagttc aagaagggtg tggccaacts 300
tatcaaccat ataatacgct gctgagagat caaataagga cagagaagtg accactggag 360
gtcatcagca gcctcgtgaa aaacagtctc agtggggtgg aagaaagaga ggacccatag 420
cacagggctg agcagagaat caaaggtgag gaagtagaca caggagacaa ctccctgaaa 480
agggcttctg tgagggacag cagagaacta gatcagctac aggaaaaggt agggtaagga 540
aaaggctctg caaaccctgg agatactgga acaggtctgc attttggggg aatgatctg 599
<210> 17
<211> 599
<212> DNA
<213> Homo sapiens
<400> 17
attaaaggag tggagagttg aaggaagagg gagaagggat gggttcagaa gtgaccacag 60
aaggcaagga ggaccactta cacaacttcc ccacctcagg ccctcaggta cccagttttt 120
aagaggaaag acaccttcca cctcagtagg ttgtaaaaga aataatgtca tgagcagata 180
ttcagctttc atttaatgca aaaaagtaag tgagcactca gagaagtaat tgaggatatt 240
ggaaagagtg taattgacag ccatgagttc acaaacccac agagaaaagg tttgggagcr 300
caggaaggaa aggaaaattg agtcaaaaca gagactcttc caagtggcat gggaattagg 360
gtccccttga cctgaggagc ttgggtttct ggagatgact gaagtggaca ggaatgaaag 420
gcatcctgaa attagtctta agagtctctt aggggaaggt ggacttgaga caaaaggcac 480
aatgctggtt agcaacaatt ctctactgtg cctgtgagta atgcagaagc cagaatgagt 540
ccctgaaggg attgttctct taaggggagt tcactgtgaa ggcttccggg gagggtcca 599
<210> 18
<211> 599
<212> DNA
<213> Homo sapiens
<400> 18
tggagctctg cactccttgt ctgcactttt ggctgtgtga ccttgggcca gtctctctcc 60
atctctgggc ctaggtccac acatctgtgc atagacagag caggcccagg tgccctcaga 120
gggacctcaa cttcatgagg atcagaagca ccttcctgtg tggttcctcc cctttgaggc 180
ctccctcgct tctctgctgc tcctccccca atcttgaagc aatttgtagt gtctgttggg 240
ttttcactga tcccaactct gcctagagcc tgggaccaat ccctctgtca gttcttctcy 300
ccttcaacct cctgcttgta aattggggct aataatacct gataactcac tttgctgcta 360
cagggattaa ctaattagtg gttattaagg gatagaggaa tgcagtactc tgctcccatt 420
aagatgactt tcctcctcca acttcctgct actgtgtgcg caatctcagt gttagtcaga 480
aaaccctgaa agtccggact tccaggacct ccatgataca gataaagaaa ctgaggctga 540
ggagcaggaa ggagtagcct gtgaccatgc agcgtcttgt agcagagagg ggaccagaa 599
<210> 19
<211> 599
<212> DNA
<213> Homo sapiens
<400> 19
actttctcac cttccacact cataaggtgg gattaggatc cctgctgtcc ttccctgaag 60
gggggctttg aagagccatt gagatgatag aagtgaaacc actttgtcaa ttagggagat 120
aagaaatgga gtgtgaaaag atccaacctg ggttcgaacc ccagcctcac tgctcatttc 180
ctgggtaacc atgataaatt aatctctctg gactttcatt tccttaccaa caaaaggagg 240
tgataatatg tatcaggagg atttaattag atatcagata tgaggctctt agcacactcy 300
gtgacatagg aagctctact aaatggcagc tcttaataac agactgtgaa gtccaggagc 360
ttactaacta cagtattttt ttttaaccaa aggacaagaa gacatagaat ctaagccaga 420
ctgatgtcag tgaatgtgat ttacatggaa ataagaaaat tctgaataaa caaaactcgc 480
cataccaggt gtgaaaaata agatcctgag gcactggtat ttttagcagc cattttgcct 540
gtcattcttg tttcattttc ctaactctct gtggggatga gtttttaaat aatttaact 599
<210> 20
<211> 599
<212> DNA
<213> Homo sapiens
<400> 20
attattaaga ggtatagcct ttaggaggtg attgagtcat gaggactcca ccctcatgaa 60
tgggattaga tacccttata aaagtgcttg gcagagggaa tttgcgcctt tttacacatc 120
cgtccattct gccatgtgag gacacagcat tcctcccctc tggaggatgc agtaacaaag 180
caccatgtta gaagcagagc gagcagtcct catcagatac caagcttgcc ttgatcatgg 240
acttcccagc cttccgaacc gtgagaaatg aaaaaaccca gtctgtggta ttttttgtcr 300
cagcacaaat ggattaagac aattgccaaa gtgtggaagt aactaagatg tccttcaata 360
gctgagtgga taaataatta catccataca gtggaatatt attcagtgat aaaaagaaac 420
aagccatcaa gccatgaaaa cacatggagg atccttaaat ccatatcact aggtgaaaga 480
aaccaatctg aaaaggctac ctactgtgtg attccaatta tatgatattc tggaaaaggc 540
aaaactatgg agacagtaaa aagaccagtg attgccgggg gaactaaggt atgaataag 599
<210> 21
<211> 599
<212> DNA
<213> Homo sapiens
<400> 21
ccaaagcagg tactgagtaa atatctgcta aatggacaaa tacctactaa atgaatgaaa 60
gaaaaaatga atggagggca tttgttaatc tccttgaatg agaatttgtt tgaagattag 120
cagttaaatt atttaaaaac tcatccccac agagagttag gaaaatgaaa caagaatgac 180
aggcaaaatg gctgctaaaa ataccagtgc ctcaggatct tatttttcac acctggtatg 240
gcgagttttg tttattcaga attttcttat ttccatgtaa atcacattca ctgacatcar 300
tctggcttag attctatgtc ttcttgtcct ttggttaaaa aaaaatactg tagttagtaa 360
gctcctggac ttcacagtct gttattaaga gctgccattt agtagagctt cctatgtcac 420
agagtgtgct aagagcctca tatctgatat ctaattaaat cctcctgata catattatca 480
cctccttttg ttggtaagga aatgaaagtc cagagagatt aatttatcat ggttacccag 540
gaaatgagca gtgaggctgg ggttcgaacc caggttggat cttttcacac tccatttct 599
<210> 22
<211> 599
<212> DNA
<213> Homo sapiens
<400> 22
gccaaaatca gatctcatgg ctttcctcaa tcagtgagtt gagatagaga cactggcaag 60
tgaaatggga ttttccctag accaatcaag cactcctctg aagttggggg tggggtcaga 120
gacccccagg ggtagctggc tgtgtctgta agtgtatgat ggggttacct caatcacact 180
cgggttctgt taggaaggaa caaaaggaaa acggcactgg caggtagccc acgatgtgca 240
ctgcactacg tccaatgatt accttggcca aagctttcct taaacttggg ccacatcaar 300
ttctcaggca ggaagttttc tccccctagt ctctgcaaga gaatggtgat cataagacat 360
ccacacacaa tgtccagaat caaccttcag gtgtcgacat ttgtcctagt cactttgaga 420
aaggttctct ggactgctgt catgggatgg actaaagtga ggtggtgctg aatgcaggaa 480
gtcagtccag ctgtcagccc agcaccagta aaatcagcag acaccccagc ccaggaatgc 540
caaggcatga gtcaggacta agttttcggt cagaagggtg aagaaaagaa gggtgtgtt 599
<210> 23
<211> 599
<212> DNA
<213> Homo sapiens
<400> 23
tggtgacgtt attgactagt ttgaaaacaa ttattttcgt ggtaggataa ggagacagcc 60
aatggtgtta caatgtgtta ctgtttgatc gccattatcg tttccaccaa atttgtggtc 120
tgtatatgca cgcttgtgga atgcattttg gagtactcaa aacaacacag aagcagggct 180
caaaagattg gaaaatttaa taggaaatgc taatgtcagt gtgtattgta tcatagaagg 240
atttcaaaaa gagcagtgcc acatagaaaa tgaatgtgaa tgtattttcc aaggagatcy 300
gtgtccaaaa aaataataag cagctattta tcatgatgca agacttcaaa acatagttaa 360
taatcatgaa aatcagctag ctcttatgga ctatctctgt gcaattgccc ataatctatc 420
cctataatac acttttcaat atgtcaaatt ttctttttag tttttaaatc ttttggggtt 480
ttccccctac tatttaaaat tgtcagtatt attttttaca attcactacc cttcatatct 540
catctttgca tcatttccaa tacttgtagt ataaattgta tagaggcttt cagagttct 599
<210> 24
<211> 599
<212> DNA
<213> Homo sapiens
<400> 24
actacagatt taaaatatta atgtcctatg acctagcaat tccacttctg agaatctatt 60
ttttaaataa tgaaagttgc aaagactcct gtacaaacat attcattgcc acattattta 120
taataataaa aattagaaac aaatgtctgt tttaagctgg gtttccccca gaagttgacc 180
ctgagacaag gttatggatg caagtagttt attttagaag tgaccctagg aagcaccagt 240
agggggataa ggcagtgggt caggcaagga aagaaaccct gtaaagggta agttatcaar 300
ccggtttcca ccatgggcaa ctggggctca gtcccacagg ggaaccctca gagacactgc 360
aaatcatacc tcagaatgac cccacctgac aagtgaggaa gctggagtat ttacccatca 420
actctatatc tgtcatcatt ttctgtgact cctgggggca ttaacttcct agaactttca 480
ttttgttcca catgcaggct aagtatactc tcatagatag aagaaagtcc tcaggaaagt 540
cataggtgtt cccagtaagc agcctccagt gaatagaggt aagtcctatg tgacacagc 599
<210> 25
<211> 599
<212> DNA
<213> Homo sapiens
<220>
<221> variant
<222> 300
<223> a,c,g or t (any base)
<400> 25
atgttcatga attgaaaggc tcaatgtcat acaaagtatt agcccaagcc actaatttat 60
gagaaataca gaagataaaa acatgttgaa ctacaccata aaaatacaat tcagaatatg 120
gaaaactcta taagaccaac aatccagctt cttcaacaaa taaattccag agaaaataaa 180
agatggagca atactttatg tattaagtga gataagacta ctgaaagcca acccaaaaca 240
aaatgtagaa acaaaaacaa ataaattcat gaaatgaatg aatgagttgg aaatttaaan 300
cttgactttt aacaagtcat caagttgccc ttgatgatat taaagactta ttgttaattt 360
ttggggagta caacaacagt attggggttt tgatatcttt tagagatata cactgaaata 420
tttacagatg aatttaaatg acgtctggga tttgtttcaa aataatatga gcacagggga 480
cgatgggggc acagatggta ccaaattgga caggattgat ggctgttagg gctgggtaat 540
gagtacaaag ggatacatca tactatttgt tttgtatatg cttaaaattc caatttttt 599
<210> 26
<211> 599
<212> DNA
<213> Homo sapiens
<400> 26
ttaacctctc tggaccttag cttccttatc tggaaggtgg ggataataaa agcacccaac 60
ccacagaatt gttttaagga ttaaatacat taagccatgt gaaacactta gaacagggtt 120
ggcacatagc aagtgttcaa aatacagtac ctattattat tataggcatt tacattttag 180
taaagcaata agtgtgtctc caagtcaatg aattccatct cggtgtgtga aagttgtagc 240
tgcaatatcg aaagtactcc ctgtaatctt tgagaacaac tcgcagagaa aaggaaaagy 300
agcaaaaagt tgagtagtgt taaatgtttt gatttccaaa ataataaaag aaaatgtatc 360
tgaaagactg cacttatcct cttatcaaca aggcagtctg tccgaaaata gaaaacaaat 420
ggcaaagaga tgaaaatagt ggagaaaatg taagaaaaat aaggacgaat tcagtaaatt 480
tgactaatag tacttccaga cagtgaaaaa aagaaggtga aaaattattt tctttaaaaa 540
gagattgatt tctccagaac ccaagggcat aagtctccag aatgaaagaa tccttgaga 599
<210> 27
<211> 599
<212> DNA
<213> Homo sapiens
<400> 27
ctttgatacc tgagaagtct tagtgccccc gaaaatcccc tacggaggta gtgactatga 60
actagaaaac agtgggagca tagttgaagc caggcagtct gggtccagag cttcttagta 120
ggtgcatgcc actgtgccca gctctatgtt taatcttttg agaaaccacc aaactttccc 180
atagttactg caccattttg cattcccacc agcaatgcat gaggattcca gtttctccac 240
attcttacca gcacttgtta ttttctgggg ttttgtttgt ttgtttctgt tttcttatar 300
tcatcctggt aagtgtgcag aggtatctca ttgtggttat gatttgcatt tccctagtga 360
ctaataatgt tgagcatttt ttcatgtgct taggggccat ttgtatattt tctttggaaa 420
aatgtctatt cgagtccttt gcccattttt gaattaagtt gttttattgt tactgagttt 480
tagatgttct ttatgtattt tgaatattaa ttccttatca ggtatatgct ttacaaatat 540
tttctctcat ttactaggtc atctttttca ctttttgata gtattctttg atgcacaga 599
<210> 28
<211> 599
<212> DNA
<213> Homo sapiens
<400> 28
atcagatttg caagtgtgga cgcctggagt tttgttgttc agtaaaaagg gcagcccagg 60
ccaaagaatt aagtacaagt aaggctctga gaactcaaga aaagacagag aggctttggg 120
gccaaagagt aaggcccaaa gacctgagtt tccttctcag cccaaggctt ttctctctac 180
aagtcccttc cacaatccag gcccagtctc cttccagctt gaatttccat ggtttcttta 240
atagaagaac tggttacctc tgcgtctgca tgcaggggaa tctccgtcaa ggaatctggw 300
ggaattttcc ttgactcctt ggacccctct cgtttttatt tacaaagtcg cccattcaaa 360
actgaggaaa gcagctgttg cagaagaaca tcttctaaag attcccaata gcacctccag 420
ccccctatgc acataaaatg gcctgctgca ggctggcttc tccaggggtg ctgggaatac 480
ttgaagggct gaagatcagt gggaagcaga aatcactggc ctgcccacat caacaccaac 540
ccacccctgc tggattggga gaatgatttc caagggtctg gaacctgccc ttcctaact 599
<210> 29
<211> 599
<212> DNA
<213> Homo sapiens
<400> 29
tgtgtggaaa cgctcaaagc gtttgcttga caaccttctg cggcagaggg ttggtcgaac 60
gaagggagag gggctttaca ctcgctaaac aaaactcctg gtttccttct tcccaagtaa 120
tggagaagca aaaaacccag atttcgtcct gtttcgtttt tacaaaggag gaaaaacttc 180
aaattttaaa atttttaact ggattatatt ataggcacct tttaatacgg gatttcgtgg 240
ctctcagtaa ctttcaagat tctgagattc agatatctag attttaaatt ctggacgacs 300
gttgtcctaa cgtgattcca taaatctaaa gaatgcgatc ctgcgatcct gcgaccctgt 360
aattctaaga ttccaagact gggagtctaa ctttgactat gcttatattc ctttgactta 420
agcttctagt caaagtctaa aaacctatgt attaagatac tgggactaaa ccaggcacgg 480
tggcgggagc ctgtagtccc agctactgga ggttaaggca ggaagatcgc ttgagcccag 540
gagttccagg ctgtagtgca caatcattgt gcctgtgagt agccacagca ctccagcct 599
<210> 30
<211> 599
<212> DNA
<213> Homo sapiens
<400> 30
gtcgcccggc cagttcggag cgctgggagc ctgctacaac cctggcgggc agctcggagg 60
ggccagtgca ggcgcctacc atgctcgcca tgctgccgct tatcccggtg ggatagatcg 120
gttcgtgtcc gccatgtgag ccagcgtagg gacgaaaact catagacaca tcggctgttc 180
acacgttccc cgcaatctga gaacgaacag gaatggagag aggactcaac tgggacccac 240
gtggaaaaga ccgagcaggc cacagaggct cggtctcccc gcgcacagcg taggcaccck 300
gtgtactctg taaacgggag gaggtggggc gaggcagcca gagcccttgg actggcacag 360
ggaccctcga tggagcgaag ccctcaaacg ggatgctttc tggtattcta tcggggaggg 420
tccttggcgg taaccagagg gcagcgtagt gtcaacacca gagaccagga tccaaattgt 480
ggggaatcag tttcagcctt ccatgtgctg ccggaactcg ggccttttta cgcggttcgt 540
cctctagtgc ctttaactgc gttactacaa taaaaggctg cggcagcgcc tttcttctt 599
<210> 31
<211> 599
<212> DNA
<213> Homo sapiens
<400> 31
ttgtttaata gctctagtaa ccttgtggat tctttgggat tttctacata taagatcatg 60
tcatctgtga atagagatag ttttacctct tcctttccag tttgggtgcc ttttatttct 120
ttttcttttc ggatagctct ggctagaatt tccagtacaa tgttggacag cataaagcaa 180
acattcttct cttgttcctg ttattaggaa gaaagctttc agtttttcac cactgagtat 240
gatgttaact gtgaactttt aaataaatac gccttatcat tttgaggaat tttctctctr 300
ttcctagttt cctgagagtt tttcatcatg aaaggatgtt ggattttgtc aaataatgca 360
acatcctttt ctgcattgag atgatcatgc agtttcttcc cctcttcatt gtataaaagt 420
gatggattga ttttcttatg ttgaaccatc cttgcattcc tgagataaat ctcacttgat 480
catgttgaaa atccttttaa tttgctctag gattttatct attaatattt tgttgagaat 540
ttttgcatct atattcaaaa ggaatatttg tctgtaattt tcttataatg tctatctag 599
<210> 32
<211> 599
<212> DNA
<213> Homo sapiens
<400> 32
tgtgaataga gatagtttta cctcttcctt tccagtttgg gtgcctttta tttctttttc 60
ttttcggata gctctggcta gaatttccag tacaatgttg gacagcataa agcaaacatt 120
cttctcttgt tcctgttatt aggaagaaag ctttcagttt ttcaccactg agtatgatgt 180
taactgtgaa cttttaaata aatacgcctt atcattttga ggaattttct ctctgttcct 240
agtttcctga gagtttttca tcatgaaagg atgttggatt ttgtcaaata atgcaacaty 300
cttttctgca ttgagatgat catgcagttt cttcccctct tcattgtata aaagtgatgg 360
attgattttc ttatgttgaa ccatccttgc attcctgaga taaatctcac ttgatcatgt 420
tgaaaatcct tttaatttgc tctaggattt tatctattaa tattttgttg agaatttttg 480
catctatatt caaaaggaat atttgtctgt aattttctta taatgtctat ctagctttgg 540
tatcagagaa atattgccct catggaatga attaggaagt gttccctctt cttcaattt 599
<210> 33
<211> 599
<212> DNA
<213> Homo sapiens
<400> 33
caccctacaa cctggactga ggttttttca ttattacact catgacttct gctccaatat 60
gtgtttgaac actgtttgag tgagaggcgg tgtttcttaa cattctcttc ttctgcatat 120
ccagaacaaa taatacaaag ggaatctaga aactacctaa ccccatagcc agatcattct 180
gacaatgcta tagaaaaatt aggtaggata tgccatatta taaagtaggg ccatgagttc 240
aaaaaacaaa taacacatgg actagctagg gaagccacaa taggtaacag catgcgtttw 300
aaaggcttag ccaatgctaa gctccctgtg agtcaggaat gtcatgaggc ttccataata 360
ataaacttca tttgtagcag cattaaaaga aatagagtgc ccagagtgag gaggcaatgg 420
tcatacctga ctttgccctg ctcagggtgt ctgaattgcc catgagcttc acactttttg 480
atgggcattg attaactgga ctatgtcata gaagacaaac ggaatggcgc agtggctgca 540
acctgtgtcc caggaggagg aattaggtga attaggcttg tgtagcctga agaaagcca 599
<210> 34
<211> 599
<212> DNA
<213> Homo sapiens
<400> 34
tttcctctct tagtttcatc gtttgtctaa tagcaaagag cgggaaggct ggggtgggtg 60
tgctgacttg agaatccact gtagatgaga gtttccctca cctgcccctc cttaactaca 120
ttggaggtgt gtcattcgct gccattgaaa tggtttgggt ggactagctg gccttgatga 180
tagggtgcgg tggaggggac atgcaggggt tgaaagcaga cacctgagat ggaagcttgt 240
ggtaccttat gtgatttgag gcagggccag ctagccgtcc accaggatgg gtgcatctgr 300
tgccacaggg tgagtcatca ctgcacaaca attgctcagc cagcaactcc atttcccagg 360
cccctttgca ctaagtcagg tacagtacag tgtttcctgt tgttgacagc tggcatttgt 420
tccgattggc tgggtgtcca ctccgactgg ttggtgcgtg tgctgaacta gccaaaaagt 480
attttttctt tttttggttt taaggagcaa aaagtttaat aggcaagaaa gaaggaagaa 540
aaaagagacc agctccctca tacaaagaca agggaggagg acttggaaca aagagaaac 599
<210> 35
<211> 599
<212> DNA
<213> Homo sapiens
<400> 35
ctgtctgaag acgccacctc ctctgtgagg cctctcctga tttctgagac cacacaaatc 60
tctccctggg ctgcgttttc atggcatgct gccttcagtc aagggaacac atgcaagcag 120
aaagagctca gagctgtgtg agaaagaaaa gcagcatgtg tggtctcaga aatcagaaga 180
ggcctcacgg aggaggtggc atcttcagac agagccaggt ggacagaggg attcaggctg 240
aaggagtagc acagagatca gcaaggagaa tggtctagtg cgtggcacac atagtactgr 300
tgggaagggt gtggcctggc aggcagggtc acatcatgga gatctatgag tgttctgtta 360
gggtctggaa gtttctcctc agggcatgag gaaccatgga agagattttg ttttttcagt 420
gtgtatgcat aggtggatgt gttttagtaa actttttatt gaaatgtaac atatgtatag 480
aaaagtacaa aatttttcac aaactgaccg catctacgta atagcactca gattaaaaca 540
ataacaaatt attactaaaa ctccagagat ccactctggc ctctttcagg aactactta 599
<210> 36
<211> 599
<212> DNA
<213> Homo sapiens
<400> 36
aggtagaaat gaacttaaga gggagatgga ggaaggtttc tgtatggggt ggctggctgg 60
atgagggact tcagatttga agccaggaga aaacatccca attttataac atcatgtttg 120
aaatgtagga caatgagatg aagatgtcca ataaactgtt agctatatga gtctgttgct 180
tagggatgag gtcaaggctg tagacagagt taggagttat cacagagatg ggggttgagg 240
ctggggggtg gctgagattt ctcaggtggt tgtgtgcaat gaaagagaca agggctgaar 300
accagacgcc tggcttaggg gatgagcgga ggaagaacaa gagacaacat cgcttccctc 360
tgaaatgctg gcacgggctg cgaagcatga gtcagaccct tctagcccca gcagcagcct 420
caacagcctg ggtctatctc accagccaca cagttttctc ctgaatgaac ttgcatcact 480
aacctcagaa gctgtgttgc gaaatccgca tcagattgcg tacctctggt ggcgtcctag 540
ggacaatggg cactaaagac tcatagcatc ctggggttgg agtcctcctc tccgcctcc 599
<210> 37
<211> 599
<212> DNA
<213> Homo sapiens
<400> 37
taggagttat cacagagatg ggggttgagg ctggggggtg gctgagattt ctcaggtggt 60
tgtgtgcaat gaaagagaca agggctgaag accagacgcc tggcttaggg gatgagcgga 120
ggaagaacaa gagacaacat cgcttccctc tgaaatgctg gcacgggctg cgaagcatga 180
gtcagaccct tctagcccca gcagcagcct caacagcctg ggtctatctc accagccaca 240
cagttttctc ctgaatgaac ttgcatcact aacctcagaa gctgtgttgc gaaatccgcm 300
tcagattgcg tacctctggt ggcgtcctag ggacaatggg cactaaagac tcatagcatc 360
ctggggttgg agtcctcctc tccgcctcca caacatccct gccaatcagt tatcgagcac 420
cccaggcagg gaactcataa cttcccacgg catcccattt ccttgttgag caagtgaaga 480
tctaagaaaa ccttttcttg caatctcacg atactgaaaa gtcaaagaaa aagataacgc 540
tataatttaa tggtaatgat ccaggacaga gtgaaatgca aggactctgc atcctggaa 599
<210> 38
<211> 599
<212> DNA
<213> Homo sapiens
<400> 38
acacaccata tgctaaaact aactcaaaat ggaataaaga ccttaatgtt tatagacaat 60
gttataaaac ttataaaaga aaacacagat gtatatcttt gtgatgttgg attactcaac 120
agtttcttag atataatacc aaaaacaaag cacagtaaca aaagaaaaaa cagataactg 180
gactttatca aaactaaaaa ctttgcatgt gaaaggacac tgtcaagaaa gtagaaagac 240
aaagaatgag aggaaatatg tgcaaatcat gtatctgata aaggtctaat agccagaatr 300
tacatatttt taaactctca caactcaaca ataaaaaaat ttgaaaatta gtaaagtact 360
tcaatagaca tttgtccaaa gaagatatac aaatggccaa taagaaatga aaagatgttc 420
attattagtc tttaggaaac tagaagtcaa aaccacaatg agaatttgga atctttgtgc 480
attgctgtag taatgtaaaa tggtacagcc actgtggaaa acagtttggc aatttctcaa 540
aaagctcaac ataaaactag caaatgaccc agcaattcta ttcctaggta tacacccaa 599
<210> 39
<211> 599
<212> DNA
<213> Homo sapiens
<400> 39
gcggcccctc tggcccgggt tcgttccctg gccattcact gggagatcca gggcctgtcc 60
ttgtcccctc gcagggcctc agtgttctac tctgttaaat agcagctgga gggcgtgtgc 120
tgatctccga ggcccctgct acgtatagga ttccgggcct tggcgcgggt tccagtggct 180
ccagcccgga cgcagctttc cggggtgggg ggggggggcg ggccggggct gtgggtgcag 240
agccgcgcgg atggtggtgc caggtgagtg tgggagatcc caagacgaga gttctggccr 300
gtaacgggtg gcatgccttc cagggtttta gtcgcgttct tcgtggcggt gagctgaggg 360
caggctaagc ccggccaagc gttgggcagc tgccttcgga agagcgaggc aaagcccaga 420
tccttgctcc gtcgacccgg tgtgtggaaa cgctcaaagc gtttgcttga caaccttctg 480
cggcagaggg ttggtcgaac gaagggagag gggctttaca ctcgctaaac aaaactcctg 540
gtttccttct tcccaagtaa tggagaagca aaaaacccag atttcgtcct gtttcgttt 599
<210> 40
<211> 599
<212> DNA
<213> Homo sapiens
<400> 40
gcccgggcgc acctccccag gtaggagcag ctgtggcggc gcggtaggag ccccacagcg 60
tcagggcggg gagggcgctt ggagatcccc cgggtcggcc ccctccgcac cccgatcgac 120
tgaggcccgg agagttcagg aaccggctcg ggagacctca gcgcccgaac tcggagtttt 180
cggacttttc aggcctctgc caagggcttg gactcgcagg tgaaaggacg ggctcatctc 240
acttttttgt cctgagaggg tgagaattgg ccgagagggc gcttggtttt tgtgggaatr 300
gggagggaga agttccagga gactggctcc ccgggccttt caggatggtt tccaaacccc 360
aatcgtggct gccacagcca ctcggcactc cagtcccccc atctttcgaa tgagtattcc 420
taggcccgaa agggaaggtg acttgccatg gccccactgc ggcttctccg cttagcggag 480
tctccaacct gcgtctcctt taggactgcg cttcccaact gtgtggtaga ggtagccgct 540
ttcccttttt gggccccagg tccctcgact gtaccggggt ctggatctct caagagtcc 599
<210> 41
<211> 599
<212> DNA
<213> Homo sapiens
<400> 41
ccggtgggat agatcggttc gtgtccgcca tgtgagccag cgtagggacg aaaactcata 60
gacacatcgg ctgttcacac gttccccgca atctgagaac gaacaggaat ggagagagga 120
ctcaactggg acccacgtgg aaaagaccga gcaggccaca gaggctcggt ctccccgcgc 180
acagcgtagg cacccggtgt actctgtaaa cgggaggagg tggggcgagg cagccagagc 240
ccttggactg gcacagggac cctcgatgga gcgaagccct caaacgggat gctttctggy 300
attctatcgg ggagggtcct tggcggtaac cagagggcag cgtagtgtca acaccagaga 360
ccaggatcca aattgtgggg aatcagtttc agccttccat gtgctgccgg aactcgggcc 420
tttttacgcg gttcgtcctc tagtgccttt aactgcgtta ctacaataaa aggctgcggc 480
agcgcctttc ttcttaaagt gaggaggaca aatttgcaaa agaaataggc ttttcttctt 540
ttttaaattg gagaaatctc tgctctggtt gacctgggct ggttttccct gtctctgag 599
<210> 42
<211> 599
<212> DNA
<213> Homo sapiens
<400> 42
ttctttccat agctgggccc ctgctttgct taaaagagtc ttgtagggca aagcccgagt 60
ggtcagagag ctactggaac accaacccca caaggcagct aactgacagc ctttcctaag 120
ccttgtcaac tccacctcct ggccatttca gaagcaatct ttcctctcct tcctttcact 180
tctttccatc ctcgcaaccc ttacacacat ccagggcttc accactgtgt tagtcctctg 240
acccagagct ctgttccagc agtatgtttg gtcccaccac ctatggacag tttggcctcr 300
ccagggctca gggaaggcag ggagcgctac acaccagcca cccaaggtga ggccccctac 360
acagacctga gcagctgttc ctcatctttt catattcctg aattacattt aaacccacaa 420
caggagggca agctcagctc tcctggccag ccccagggtt ccctagagtc ctaccctagt 480
ggctgataga catgatgacc atgcggatgg cttcaggact gacaaaaaca cccctgaacc 540
tatagaagct gggaccctgc tcagtgctga atctttcccc gaccctcctg ccaaaagtt 599
<210> 43
<211> 599
<212> DNA
<213> Homo sapiens
<400> 43
cgccagggct cagggaaggc agggagcgct acacaccagc cacccaaggt gaggccccct 60
acacagacct gagcagctgt tcctcatctt ttcatattcc tgaattacat ttaaacccac 120
aacaggaggg caagctcagc tctcctggcc agccccaggg ttccctagag tcctacccta 180
gtggctgata gacatgatga ccatgcggat ggcttcagga ctgacaaaaa cacccctgaa 240
cctatagaag ctgggaccct gctcagtgct gaatctttcc ccgaccctcc tgccaaaagy 300
tgggctacat ctgcccaggc aaaggccagg gctacatgca catgcaagac cctaagtttc 360
caggacacca gggagaaagg ttgctcctgt gagaccctca gaccccagcc cagtagggcc 420
aagttagcca aactctccct caaagcttct tatttctaga ccccaggata atccctgggt 480
ccccagtacc tgaacctagg gtagaagatg gtgctccgag tctgaatctc ccctcatgcc 540
tgcttatcac ctgcaagacc cctgcttctg ggctgctttg cagttgccca cctgtctag 599
<210> 44
<211> 599
<212> DNA
<213> Homo sapiens
<400> 44
tggcgcttac ggccaccttg gcctcggggg cagggcatgg gcggcccccg ccagatcgcc 60
cagcgccagt actaactgcc ctcgctctgg ccttcgagcc cgaagcctct tctgcgcgca 120
caacctaggc agtaatccta aactagcggg caccacagac cagctgcagc caccccaacc 180
cagggatcac ttccggaccc ctcgaccgcc cggcaccagc gcgcaaggga cccttcagcc 240
ggagaccaga gtccagtccc ggtcacgagg ccaccgccgc tgcccgcctc gagaagcacm 300
acgcgggctg agccgtcggc tagcgggtca ctcccgagcc tctgtctgca ccgcgccagc 360
cccagaccac ggacgctgag cctccagcgc gtgccagcct gggccgctgg gctctcgggg 420
ccagcccgcg acgatcccct gagctctccg cagaagggcc gagcgtccgt tccggggacg 480
ccaggcccgc ccccgccccc cgacagccgc ggggatccag agcccggggg tgcgggacgc 540
ccgcgccatg actgccgaga gcgggccgcc gccgccgcag ccggaggtgc tggctaccg 599
<210> 45
<211> 599
<212> DNA
<213> Homo sapiens
<400> 45
ctgggaccct gctcagtgct gaatctttcc ccgaccctcc tgccaaaagt tgggctacat 60
ctgcccaggc aaaggccagg gctacatgca catgcaagac cctaagtttc caggacacca 120
gggagaaagg ttgctcctgt gagaccctca gaccccagcc cagtagggcc aagttagcca 180
aactctccct caaagcttct tatttctaga ccccaggata atccctgggt ccccagtacc 240
tgaacctagg gtagaagatg gtgctccgag tctgaatctc ccctcatgcc tgcttatcay 300
ctgcaagacc cctgcttctg ggctgctttg cagttgccca cctgtctaga tggcctacct 360
ttccattacc atgccttcca gatccagtgc tctgccagtt atcctggata tgctcccaat 420
gcccagttag tgacaggcct gagagtagcc cctgggtctc ctgatacatt agtgtattta 480
atatgtgcaa agtggttaca acagtgtgtg ttcatggaag agttatgtat gtctgagtta 540
atattactaa ctttcacaac tctcttacat tactatttat ccccattgta tagatcgac 599
<210> 46
<211> 599
<212> DNA
<213> Homo sapiens
<400> 46
gaggctcgta tgggcaactg gaacccggct ggagtgtgca gctggccccc tcacttccag 60
cccgcaggct gccgcggggg tgactcccgg gagatgcgcc tagagaggca ggacacctgc 120
acgcatattc gtaacagagg cagaaatact gacggcgaaa cctagagaga cttgcactcc 180
aggcccgggg ggtggggggg cgggggagaa gccttaggga gagtggggag gaggccagag 240
gagagctggc tgctctctcg tgttgaggtt caagtgtctt ccagctcccc gcgcccccts 300
ctcaccgtgc caccgcccac ctcatgcttt gggcgccaag cagccaagca accgggttgc 360
gttgtagggg gaggcaatca gccctgttac ccctcctcag gcggccggac tgagctgcgg 420
gatgggatcc ctacagagac tggcctgggt aaggggaaaa aatcactgcc tcttcctgtg 480
cctctagtgg ttgaactaga atcctggcta gctcatctcg cttttgaagg gggaagggga 540
gtaatcatcg gctcttttga gattgtcttg caaaccatgg actctctccc cagaaatga 599
<210> 47
<211> 599
<212> DNA
<213> Homo sapiens
<400> 47
catattacct tcattaagat gataatcaaa tgcagtctcc attgggggag gcagaggttc 60
tagtccagct tggacacttg taactgtcat atcttgggca agtcacacac cccttctatg 120
gctctatgga ggctccacac acactcacaa tattcctatt tatttctatt gggaacttat 180
acaagcaatg agatgaaaat cctggttctc cccatgtggt gcaatgtgat cctgggaaca 240
tgctttccca atctgggccc cttccccatc cttcatggta catgcccctg tctgaactgy 300
ttttcatcag ggacatattc ccccagctat cttgtcatgt ctaccctcag gaacaggctg 360
agcacacaca gaaagtcaag ctcgtatgtg ttcaaggcag gggagggttc cttagggcac 420
tgaggaggac cttaggcttt tactagagga tcctttggcc cagactgact tggagacagg 480
gaccccttcc agttggccat tgtgtcctga acagaaagct taatttttct cctaaaccct 540
caactacctc agacttgggg ctagagctga ggggtcagag gcaaagttta ttctatact 599
<210> 48
<211> 599
<212> DNA
<213> Homo sapiens
<400> 48
acatggtctg gctgggcttt gagctgggtc acacattggc tgctgtaggg aaaactgcca 60
agggagcagg ggaggaagca gggggtcctg ttaggggctg gcactgtgat ccgggagaga 120
tgacagggtc ctggagggct ggcggctgtg gaagcgtggc atggggttag gtggttcctg 180
gagagggaat ggtcagggca aattcatgat gacaggaaca catgggagtg tcagggaaca 240
gcaaatggtg tgttggctgc agcctagggg tgtgggaagg cagctatggg agacgtggcy 300
ggcaagaagg ttgacataag gatgaccgag ggtcccaagt gccaggtgag gcactgaagc 360
gttctactgc agacggcagg cagccttctc cacaggactg gagctcagct tcagggaggc 420
aagctggcag cacggacaga atggaggcag gagtactctt gggaggccct ggctggctgc 480
tggggccgtg agcagaggtg ggagttgagt cctgggaggt ggtggctctc aatttattgc 540
ctggttgcag agcacctcca tgcctgagaa accatgactg gggctctgcc ctgaccacc 599
<210> 49
<211> 599
<212> DNA
<213> Homo sapiens
<400> 49
ttccctttga gacttctctt ggcttcttat aaataaatgt gcagctaaca gactatctag 60
ccctacccct tgttttatgg aagagaagcc agagaaagta actttccaag gtaacagtga 120
gttatcattg tagaccctag ttcagggccc ttccacagct ccaggggctc agcaggaaca 180
aaactaataa taatcccaac attttccaaa agccactttg ttcagggagt accagccatt 240
ttcacaggtg ttatctcttt ggatcctcac agctcccctg ggaagcagaa ggtttcaaay 300
gcaccctttt caggcaagga aactaaggtc caagaaaagg ggtaatgagc tcaagtcatg 360
tgaccgttgc acacaggagg gaccaaccct caacccgggt gtaacaaatc ctcagtaaaa 420
tgaaccagaa atctgaggct ccttcctccc tggatgtagg aatcaggagg ctgggagaat 480
cacctgttag tgttgactgg cgcttgggaa tcctctggct tcgagcctct gagtagggtg 540
gattctccat atgcccctgg cttatctcca tacggcatgt aaggcttaaa gatagtgtc 599
<210> 50
<211> 599
<212> DNA
<213> Homo sapiens
<400> 50
aggcaccatt tctgccacct cgaggaggtt taccttctgc cctccatgat gtgaccctgt 60
ctagcaggcc ccctcctgcc cacctggggc atgtgtgcca tctaccagcc cactccacat 120
tctctgcgca ggtctctgtg ctcttccttc agcctggaat tcttctgtcc acctggctct 180
gtctgaagac gccacctcct ctgtgaggcc tctcctgatt tctgagacca cacaaatctc 240
tccctgggct gcgttttcat ggcatgctgc cttcagtcaa gggaacacat gcaagcagar 300
agagctcaga gctgtgtgag aaagaaaagc agcatgtgtg gtctcagaaa tcagaagagg 360
cctcacggag gaggtggcat cttcagacag agccaggtgg acagagggat tcaggctgaa 420
ggagtagcac agagatcagc aaggagaatg gtctagtgcg tggcacacat agtactgatg 480
ggaagggtgt ggcctggcag gcagggtcac atcatggaga tctatgagtg ttctgttagg 540
gtctggaagt ttctcctcag ggcatgagga accatggaag agattttgtt ttttcagtg 599
<210> 51
<211> 599
<212> DNA
<213> Homo sapiens
<400> 51
tccagagatc cactctggcc tctttcagga actacttaca tacaagaaaa ataaccatcc 60
taacatcata aactagtttt cactattttc ttgtgtgtgg cttttttcac tccacatatg 120
tttgcaagac tcccccatgt tgttagacat aaatgcactt tgttcttgct cattgctggt 180
tgatatccca ttgtatggat gcactgcaat tgttgatgag ctttgtgcag tttccagttt 240
ggggctgtaa accttcctgc acatgccttt acgtgctcct ctgggggtaa atctgttgcr 300
tgcatatcta ggagtggaat tgctgggttg tgggctatgc atatatctac ttgagtagat 360
acttctagtt tcccaaagtt gttctaccca tgtacacgcc caccagggat gcacaggagt 420
tctcattgct ctatattctt gtcaacactt ggtattgtca gtctttttgt gttttatgct 480
tgtttttttt tttttagggg aatgaccacc tggtggaggt ggagtcccac ttgggttgaa 540
gtatactcac tctggcagga atgaaatcag tggtaataga gctagaatga aaaaggcca 599
<210> 52
<211> 599
<212> DNA
<213> Homo sapiens
<400> 52
gctcctgacc tcaagtggtc tgactgcctc ggactcccaa agtgctgcga ttacaggcgt 60
gagtcactac gtcgggccat cctctaatca tcttttcttg atttttgcct ttcccaaatc 120
caggtttcat attcaaaaca acaaaattgt taagatgttt tcatatctaa acaacatttg 180
ggtgttctaa agtaaccacc aggtaacaca atggtttgct cctatactac ctatgaaagg 240
aatgacgaaa ggaataatta ggtttgtata gaatattgtg cattatagtc ataactgctr 300
tgagaactcc caaatcaggg tggtgtgcag gttagggcag agttttggga gaggcgaact 360
gttctgtaca aaaaggagaa gaatcataat gctgagggga ggggagggac ctgggagagg 420
ggagtgagca gcaagcaggg tggggcacca cctgaatgaa ggacagaagg tgagagccct 480
taggggcaca gcagcacaaa agactttggg agaaaaggaa ttaataagag ggaattttta 540
agttgtttgt catggtgtgt gctatgggcc tccttccctc ttgtcactct tacactgtc 599
<210> 53
<211> 599
<212> DNA
<213> Homo sapiens
<400> 53
cacccactag atggcgctgt gaggtgcagt gggaagagta gctggaggca aacctttgag 60
attcagattt tggacaaata tttaacttcc tggaggctca gattcctcct tgagatacac 120
ttggcctgta tcccccacaa cacaggtatg tagatcatac gggataacgt gtaagaaagc 180
actttcaagt ataacacgtg gtgacatact tgagcctgtg gactgttgtc actgaccact 240
ccaccctgtg taccagaggc tggggctgtc agagtctagt gtcccaggac cttccccags 300
cttctctatg atcccttcac tcctaccttc accacgtgtg accaagtccc ctggtttccc 360
agctaggaga gattgccaga aaggagctca tgttgatact gtacttgctt gctctttgga 420
aaagcacgta ttgattaatc tcttcacctt tgctgtaccc cttttcctag catggcctgt 480
gtgactccag ggccctagtg ctgctgaggt tggcatggga ggggaatccc ataggaaggg 540
aatgtgaaag aaagccccag catgaggaat aagggaagtt ccacaatgcc catggtgtg 599
<210> 54
<211> 599
<212> DNA
<213> Homo sapiens
<400> 54
gaggcaaacc tttgagattc agattttgga caaatattta acttcctgga ggctcagatt 60
cctccttgag atacacttgg cctgtatccc ccacaacaca ggtatgtaga tcatacggga 120
taacgtgtaa gaaagcactt tcaagtataa cacgtggtga catacttgag cctgtggact 180
gttgtcactg accactccac cctgtgtacc agaggctggg gctgtcagag tctagtgtcc 240
caggaccttc cccaggcttc tctatgatcc cttcactcct accttcacca cgtgtgaccr 300
agtcccctgg tttcccagct aggagagatt gccagaaagg agctcatgtt gatactgtac 360
ttgcttgctc tttggaaaag cacgtattga ttaatctctt cacctttgct gtaccccttt 420
tcctagcatg gcctgtgtga ctccagggcc ctagtgctgc tgaggttggc atgggagggg 480
aatcccatag gaagggaatg tgaaagaaag ccccagcatg aggaataagg gaagttccac 540
aatgcccatg gtgtgggaga atgcaactcc caccaggcct gctgggcctt ctatctatc 599
<210> 55
<211> 599
<212> DNA
<213> Homo sapiens
<400> 55
gctgacatgc aaaacaacac aggctcccaa cccttgtgaa atactgaaga caagtcagtc 60
tggacagtcc tcagcagctc ccagatccca aaacctggca gaaccatttg caacaggaat 120
ggagccagct tttctggggt ctgccctctg cacagcgagt tcctggaggc tacagtcctg 180
gtgtctggta gttgatcccc agtagatttt ccatttgtct tactcactgc tctcctaagg 240
gcctccagcc taatttaggc caaagaatct gcattgcatc ccccgccccg tcccaatccm 300
agccccacct caggcccacc ttcaatcctc tcccccattc taactctcac cccagattag 360
ggcctgtggg gtatctttcc ctagagccca gaaagacgta cagtctctca tcccaaggga 420
aattcaatga ctgaattggc actgattgca aaagcaacta gaatatttgt ggcatttact 480
tttttttggt ccaaagatct caggaaacct tgaatccttc agctgtcaac attcctcagg 540
atagcgtggc ctctcagacc agagcaccca tctccatcct tgctggagaa tgtcccgtc 599
<210> 56
<211> 599
<212> DNA
<213> Homo sapiens
<400> 56
tctttttcat tcctgatgtt agtaatctgt cttctctctt tttttccttg gccaatctgg 60
ctagaagttt atcagtttta ttaatccttt taaataacca gcttttcatt tcactaatat 120
tcctctgttg ttccgttttc aatttcattg agttctgcta caataaaaca tttaatttct 180
gttttgtaat gtttctctgg atgctttcaa aatacttttc atttcctctc atttccagta 240
gattaataat aatgtgtctg gacattgttt tctttgaatt tatcatattt cagatttgtk 300
gagtttcttc tttttctttt ttcttgagac agggccttgc tctttcaccc aggctgtagt 360
gcagtggtgc aatcacggct cactgcagtc tcaacctccc aggctcaagt aatcctttca 420
cctcagcctc ccaagtagct gagacatgcc accaggcctg gctaactttt tttttttttt 480
ttttaagaca ccaggatctc cctatgttgg ccagactcgt ctcaaactcc tgggctcaag 540
tgatccacca cccttgttct ccaaagtgct gggactacag gcgtgtgcct ggccttgct 599
<210> 57
<211> 599
<212> DNA
<213> Homo sapiens
<400> 57
gctgttaggc tacaaacctg tatagcatgt tactgtactg aatgctgcat gcaattgtaa 60
cacagtggca tttgtgtacc taaatatatc taaacagaga aaagaaacag taaaactatg 120
atatcatgat ctcgagggac cactgttgta tatgcagccc atttttgacc aaaacattgt 180
tatatggtac atgactgtat tatgctgtaa gatgctggat cctattaaag tcctctgggg 240
aacactgatt ttttttttta acctaacaat tctttccagt taggtttaga ccacaaattw 300
tgactcacct tctgtggaca gaggttccaa agtcagttca gttttcaaag ccatcccctg 360
tctcagcctc ccatttaaca ccacttgctt tcccttggcc cattagtttt aagcattatt 420
tatgtcatct tactatattt ttgaaggcat tttcatatgt gaccttgtat cttggcaaag 480
atcagatatt aggcaaagaa ctaagaaata caaatctcca gctccagtat gatgaggagg 540
tccctgcctt gaggtccctg agcgccctgg ataacctgcc tataccctct tggactcag 599
<210> 58
<211> 599
<212> DNA
<213> Homo sapiens
<400> 58
gatcctgcct tggttctgtc agttctctcg tatctcaact cctcccctaa tcccagcaga 60
gcctaaactc ccaagtctgt tgacaaccct actgcacccc tagcccaggc tctgctccat 120
cacctgccaa catcccagcc tggcctttct cctaggtctg cccacctctg catcagtaca 180
gccaccttat ccagaggggc acagccaatc ttggactcca agcctctcct ttactgttga 240
ctcaagtgac tgagctcaga cttcccattc tgacagcggc aaggtccagt ggtaggaagr 300
gcaattccta ccactcatag cctagctcac tacatgcaag tagacagtga accagtgggt 360
ggagctgatg agtgagtgat ctgcaggcag agactccaga ttggatgaac cacacagttt 420
tggcaagcat tgggtcaagg agctctctgg tggctcagcc ctgccagcaa catcatccac 480
atgggcgtct gtcttctgcc tggaggcaca gcgccttatc cataaacctg tctctggaag 540
aacagaaaac gtcagtgcac cctcagggac aaagctgccc aggcttagcc agtttgcct 599
<210> 59
<211> 599
<212> DNA
<213> Homo sapiens
<400> 59
tcatacattg aattttaggg accccctaga tccccctgaa gtctgcttat ctagccaggt 60
aagccagaac agagtggtag aaaaaggcta tcaatgaaga gaaacacaat aaaaatatta 120
cctaggttta taggtcattg aagagttcag aagacacttt cccaagcatt atcctggcaa 180
caactctgta aggtcacaga gctagaggca gggtgcagtg acttgcctga ggtcacgagc 240
tagcccatgg cagggcagaa agcgcttgaa gtttctgagg ccaagcccag tgctcttcgy 300
atttcccatc ttgcttccca ggaggttcca tgcagatcct gtgggaatgg gcgtttctgc 360
ccttattccc ctgtgcattc ttcacgagtg gttggatttc catggacttc attctgccaa 420
agactcatgt gctgaatcat atggaactgc tgaccttcca ataaaccagc atgatttgct 480
aaggcgtaga gccaggctga gaaggaagag gactcaggcc agactggtgg gttggaatcc 540
tagctgtgca gccgagcagc ttgagcacgt tactcaacct ccacccaatg tacgaaaag 599
<210> 60
<211> 599
<212> DNA
<213> Homo sapiens
<400> 60
agcttgaact cctggtgttt tcctccaagc cagtgaaatg ggaataaaat ctgctatcaa 60
gggctccccc tacaggcacc aaaaagcaaa ggctaaaaat taaggtgggt gccatttacg 120
cctagtagag aattgtttct tctcttgaaa aagtttctaa ggcagtcctg aaaccacaac 180
tttgcttgtt gacacaatcc cttttccaaa actctggcca aagagtctta aaaatctaaa 240
ggaccaagaa tcaagcaacc tcttcctctt gatgtactca cctcccactt aataaaggam 300
caaatgtgat tttgatacaa ataggacaca aaacgaccct agagctgtaa cactattttt 360
gacagtcata attatggcac ttttgagttt tcttgtagct catttccatc tcatttttag 420
gattagtgtg tatttgtgtg tgtgtgtaca tgcgtgtgtg tacatgcacg caccaaaaca 480
acttcaattc cggacataaa atcaatgaca gttttaaaac cacttgatgg aaggtttgag 540
ggaactttta tcatttattt attttgtgct acaaatcagg tatatttaat tctctgggt 599
<210> 61
<211> 599
<212> DNA
<213> Homo sapiens
<400> 61
aaaatctgct atcaagggct ccccctacag gcaccaaaaa gcaaaggcta aaaattaagg 60
tgggtgccat ttacgcctag tagagaattg tttcttctct tgaaaaagtt tctaaggcag 120
tcctgaaacc acaactttgc ttgttgacac aatccctttt ccaaaactct ggccaaagag 180
tcttaaaaat ctaaaggacc aagaatcaag caacctcttc ctcttgatgt actcacctcc 240
cacttaataa aggaccaaat gtgattttga tacaaatagg acacaaaacg accctagagy 300
tgtaacacta tttttgacag tcataattat ggcacttttg agttttcttg tagctcattt 360
ccatctcatt tttaggatta gtgtgtattt gtgtgtgtgt gtacatgcgt gtgtgtacat 420
gcacgcacca aaacaacttc aattccggac ataaaatcaa tgacagtttt aaaaccactt 480
gatggaaggt ttgagggaac ttttatcatt tatttatttt gtgctacaaa tcaggtatat 540
ttaattctct gggttcgtgg aatgagcttg gatggttgcc tgctctcaaa ggctaaaaa 599
<210> 62
<211> 599
<212> DNA
<213> Homo sapiens
<400> 62
atcccagcta ctcaggaggc tgaggcagga gaattgctcg aacctgggag gcagagattg 60
cagtgagccg agatcacgcc actgcactcc agcctgggcg aaagagcaag actccatctc 120
aaaacaaaaa caaaaacaaa aaaacagtaa caattttctt gaacttctga gggtgatttc 180
cttttctgat acaaagacat ccaaagaaat ctcagagagt ctctatttta gaatcagtat 240
taaatatata tacatatata tatgtgtgtg tgactatgtc acaaagtctc tgaaacacak 300
aagtttaatc tcaaaaacta tctctacttg ttttttattt gttagtttcc tgatataggt 360
ttgatttgga atcaaataga aaggtcaggc ttttccagac agacaggaaa accaatatga 420
attactgaat agatcccctc aactagaaag tctctgctgg aatgaacttt gtctaatttt 480
atcaagtgca ccaagaacag cttctttcag aaattatcga gacagcatca ccttttgatt 540
ctttaatatc aacagatcaa aaagcatttg gtgatttctc tgtattttat atctctttg 599
<210> 63
<211> 599
<212> DNA
<213> Homo sapiens
<400> 63
tatgttttat acataccata ttaaaaataa aatacattaa aaatcctaca aacataggaa 60
gttttgctgt ttcttaggga cacagatgtg agagagtccc aaagcaaagg gatgttactg 120
gtaactgcgg gtctgtgata ctagctttct ggtgcagcct ctctcgcctg tagctggtgt 180
tctgggtgtg tgtgggttta gttctctttc ttgtggcttt ctgaggatgc tgggactgtc 240
atgcatttcc ttgtctctgt tctgagaaga aaatgacaag gaattaaagt ctacattgar 300
tatagaaaag tgacattttg gatatcagaa aagtgacatc ttggctgaca gaaaatgaaa 360
gctcacctgt cttaggagac taaggaaaaa tactaccatg atttttctgt ccagtaaaac 420
aaaaatttgg gggtgtacaa gttaaaccta atgataataa acacctcttg acggtgacag 480
tctccgtaat gatcaaatag ttttccaaac cctgtccatg tcaagtgatc tttaaggaac 540
caaccagatt ccatattgaa gtttgttgta attaaattca acctgcatga tagtgctca 599
<210> 64
<211> 599
<212> DNA
<213> Homo sapiens
<400> 64
tgttttgtat atgcttaaaa ttccaatttt ttaaattaaa catatatatc aaatatacat 60
gttatccctt actcatttat agacttcata taatcctaat cagaatccca acagaagaca 120
aaataaatgt aacatatatg ctaatagaat actaagcaac attttacatg atgctcttaa 180
aaaatattta actacataga aagtcattta tacatattat taaagcaaat tatgaaggat 240
tatgtgtaga aaacttccat ttatataaaa aataggccaa ctgaggacca gagctcagay 300
aaggagtttt tgcagaaggt taagtatcag agaggtatgt ccaagtgagt gcttcttaac 360
attcactatg ctttggaatc atctgggggg actttttttt tttttttttt tttttgaggc 420
tgagtctcgc tctgtcatca ggctgatgta cactggcaca atctcagctc actgcaacct 480
ccacctcccg ggtcccagtt caagcaattc tcctgcctca gcctcccgag tagctggagg 540
cgtgcaccac catgcccatc taatttttgt atttttagta gagacggggt ttcactatg 599
<210> 65
<211> 599
<212> DNA
<213> Homo sapiens
<400> 65
gagccaatgt acccagcctc atctgggagg actttcaaaa tatacagatc accaggccct 60
acaccaaaat attctatttc aattggcctg aaatggagcc caggcatcca tagattttaa 120
aaactcttca ggtgatttca atgtatttcc aggtgatttt aatgtgcagg actgagaacc 180
aattatctag atttacaaag agaagcatag aaagatgggt ggagaataga aatgtgatag 240
agatgtaata gatatatgat tgatggacag atgaaagatt tttaataggt agatagatay 300
gtaggtgaca catggataga tgatagattt ttgaaacatg atggatgaga cagaaatatg 360
gatagataga tagataatag gtaattaagt agataaacag tagacctgaa gatctgaagg 420
aagggaagag aaaaaagagg aaaaagggat gggaaaagaa ggaatggaat ttggaatgac 480
aggtcagaaa tggcccacaa ctcagaccct caatggacaa aagaaaatga aacaaaaatg 540
aatttggaaa aataaaaggt gaataggtac agctaatgca atgaaatgta aaagttgtc 599
<210> 66
<211> 599
<212> DNA
<213> Homo sapiens
<400> 66
ctgggactat aagtgtgcaa cactgcactt acctagtttt ttaaattttt tgcagagata 60
ggggtcttgc tatgttgaga aggctggtct ccaacttctg gcctcaagca atcctctcac 120
cttggccttc caaagtgctg gggttataga atcacacttc ttgaccattc tcaaaaacca 180
ccgccaccct caaagaaggt ggccaaatct acacagatag aactttacct gtccctcgct 240
caggactctg aaagagcatt ctctgcccag agccatgagc aacctgaaag cagaattgcr 300
ccccatttgt ctaccccaag tgatcatcac agaaaccaac acttagtagg gactcaataa 360
atgctattga atgaaagaaa acataaatct gaatgaaaag ttagccacaa gacatgtcac 420
atgctgtgac gaaaagagtt gggaatcaaa agaactggtt ctggctctac taataatgca 480
ttatgggcac tcactggccc tctctggatc tcagggatcc cattaattga actgagagag 540
gtggagtagg tattctttgg cagtccattt cagctctgat tttgtgtgag gctgtaggg 599
<210> 67
<211> 599
<212> DNA
<213> Homo sapiens
<400> 67
tgaggccagg ggctagagac cagcctgggt aacatagtgg gaccctatct ctacaaaaat 60
aaaagaaata aaaatttaaa caaaattagc caggcatggt ggttcatgcc tgtaatccca 120
gctacttagg aggccaaggt ggaaggatcg cttgagccca ggccctcaag gctgcagtct 180
tctatgatcg tcccattgca ctccagcctg ggcaacagag cgagactctc tctctcaaaa 240
aaaaaaaaaa aaaaagccca caaacagttg aaggatcagg aagagggtat gctgaggcck 300
agatggagtc actggtgagt tccaccaaat gtttaatgaa taacaccgat acttcataaa 360
ttattccaat aagatagaag aggaaggaat acttcacatc tcaatccgtg aagccactat 420
taccctgatg ccaaacaaga cgaagatatc atgagaaaag catagaccaa tatattttat 480
gaatatagat gtaaaatctt caagaaaatg ctagcaaact gaattcaaca acatatgaaa 540
aggattatac accatgccca agcggtattt atctcagaat gtaaggttgg tgcagcata 599
<210> 68
<211> 599
<212> DNA
<213> Homo sapiens
<400> 68
ataaatagta tactttaaaa tagtgaattt tattttatgc aaaatatatc tcaataaagc 60
tggatttttt taaaaggtca ttatagcaaa ccaggcaaga gattgttgta gcttaaacca 120
ggataatggc aatgaaaatg aacagaaata aacaaactga aagaattctg gggaagtagg 180
aaagatagaa cttcagaatt gattggctat ggagggagaa tgagagtgat atgttccaga 240
taaattaaga agctaaataa tttaaaatca tggaacacaa acatttgtag gaaatatgcr 300
tataaaaagt ttagaaggaa aaatacaaaa atggtaataa tagctatgtt atagtaagag 360
aaattaaata actttttaaa atctcatttt ccagaatttc tataatgtga ctgactatat 420
tgcttttgtg tttaaaaata gtttttggcc aggcgcggtg gctcacgcct gtaatcccaa 480
cactttggga ggctgagatg ggtggatcac ctgaggtcag gtgttcaaga acagcctggc 540
caacacggtg aaactccgtc tctactaaaa atacaaaaat tagctcggtg tggtggcac 599
<210> 69
<211> 599
<212> DNA
<213> Homo sapiens
<400> 69
gtcattaaag aagatctaca gatggaaaaa agcacataaa aagaagctca acattgtttg 60
tggtaagcag cttctaagat ggtccccagt gatttccaca ttctcgtatt cacactctgt 120
gtgatccctt cctcttgagt ataggttgga catagtcact cctttctaac aaatagaata 180
tgaataaaag tgatagaaag cagctctgag attaagctac agaaagactg tggtttccat 240
ttgggttctt tctagttttc tttctcagtt caccagcctg aggatgctcg ggcagcctay 300
ggaggtccac atgatgaaga actgaggtta accaacaacc atgtaagtga actggaagtg 360
gattttgcag tcccagtcag ccttgagatg atttctactt gactgcaaac ttataagaga 420
ccctgaacta gcctcaccca gcccacctaa gccacaccca gattcctaac ccgcagaaac 480
tgtgagataa taaatgtttg ttgttttaag ccagtaattt gggggtaatt ggttgcacag 540
cagtagataa caaatatatt attagtcatg aggtaaatac aaactaaagc taccaatga 599
<210> 70
<211> 599
<212> DNA
<213> Homo sapiens
<400> 70
aacccacccc tgctggattg ggagaatgat ttccaagggt ctggaacctg cccttcctaa 60
cttccagatg attcataaac gttaaggagc actgtggcag agaagagggg aggacttggc 120
catgaccatg ttccttctca agaaactgag aaggaagcaa tgggaagaga taggaaatgc 180
cccgaggaga tttttgtgta tggttttgat ccaaacgggt aaacttgtga cctgtgtact 240
caccaaatca tttaatgtga actcactgtg gactcacaga atcttcaaat gcattattcr 300
aagagaacat ttatgaaata gaaatttagg ggtccttggt ttgcgaaaat cttagaatca 360
tgatcttgga aattctaatc tcatgatgct aggtatttgg tctcggccac aggagtagct 420
tgatattaac aaagtttgag aaaaccatca gaattctaga agaatgaggt cacagacaca 480
agacactgaa gaacagaaaa tcctgagaca agaaggcttt tagccatagt cgttgcagct 540
taaaagtaga ggatcataaa gtcatgggac taatcattac agcatataat cacaaacat 599
<210> 71
<211> 599
<212> DNA
<213> Homo sapiens
<400> 71
ttactctcag aagataaagc ccccagcagg gacactcata aaaaggaatc cgaatctgga 60
gtgcttagga gattgcctgc tctgtccatc ccctgaaatg aaagaatgat ggagccggcc 120
catgggtctc acccactaga tggcgctgtg aggtgcagtg ggaagagtag ctggaggcaa 180
acctttgaga ttcagatttt ggacaaatat ttaacttcct ggaggctcag attcctcctt 240
gagatacact tggcctgtat cccccacaac acaggtatgt agatcatacg ggataacgtr 300
taagaaagca ctttcaagta taacacgtgg tgacatactt gagcctgtgg actgttgtca 360
ctgaccactc caccctgtgt accagaggct ggggctgtca gagtctagtg tcccaggacc 420
ttccccaggc ttctctatga tcccttcact cctaccttca ccacgtgtga ccaagtcccc 480
tggtttccca gctaggagag attgccagaa aggagctcat gttgatactg tacttgcttg 540
ctctttggaa aagcacgtat tgattaatct cttcaccttt gctgtacccc ttttcctag 599
<210> 72
<211> 599
<212> DNA
<213> Homo sapiens
<400> 72
gtgaaaagat agtttgagcc caggggcaga agttgtagtg agctatgact gagccactgc 60
acgccagcct gggtaacaga gagagactct gtctccaaaa aaaagaaaga aagaaaaaat 120
aattagctgg gcatggtggc aaacagttac tcaggaggct gaggcaggag gatcacttga 180
gcctgggagg tcaaggctgc agtgagccgt gattgcacca ctacactcca gcctgggcaa 240
tagagcaaga ctgcctcaaa aaacaaaaca aaacaacaaa aacagaagcc attcatacay 300
tgaattttag ggacccccta gatccccctg aagtctgctt atctagccag gtaagccaga 360
acagagtggt agaaaaaggc tatcaatgaa gagaaacaca ataaaaatat tacctaggtt 420
tataggtcat tgaagagttc agaagacact ttcccaagca ttatcctggc aacaactctg 480
taaggtcaca gagctagagg cagggtgcag tgacttgcct gaggtcacga gctagcccat 540
ggcagggcag aaagcgcttg aagtttctga ggccaagccc agtgctcttc gtatttccc 599
<210> 73
<211> 599
<212> DNA
<213> Homo sapiens
<400> 73
gcccaggggc agaagttgta gtgagctatg actgagccac tgcacgccag cctgggtaac 60
agagagagac tctgtctcca aaaaaaagaa agaaagaaaa aataattagc tgggcatggt 120
ggcaaacagt tactcaggag gctgaggcag gaggatcact tgagcctggg aggtcaaggc 180
tgcagtgagc cgtgattgca ccactacact ccagcctggg caatagagca agactgcctc 240
aaaaaacaaa acaaaacaac aaaaacagaa gccattcata cattgaattt tagggacccs 300
ctagatcccc ctgaagtctg cttatctagc caggtaagcc agaacagagt ggtagaaaaa 360
ggctatcaat gaagagaaac acaataaaaa tattacctag gtttataggt cattgaagag 420
ttcagaagac actttcccaa gcattatcct ggcaacaact ctgtaaggtc acagagctag 480
aggcagggtg cagtgacttg cctgaggtca cgagctagcc catggcaggg cagaaagcgc 540
ttgaagtttc tgaggccaag cccagtgctc ttcgtatttc ccatcttgct tcccaggag 599
<210> 74
<211> 599
<212> DNA
<213> Homo sapiens
<400> 74
ggagcgagta cctcggagac agtgcgcgcc gcccggggcc tcatccacag cggggtcgcg 60
ggcggccccc ttagcccgcg tgactgtggg atcctgagaa cattccgctg tatgtcttgg 120
aaccttctaa ccctaggaat ttgcaaaccc ctcccagtcc ctcatctggg ggctcagaga 180
ctggaggtgc cttttttatt tttttcttct tcactttatg aacacagaaa aatcgtttgt 240
ccctctccgg gccctgcacc cgccagcgtc gtgtgcaggc gtccccgggc tgtggataay 300
tagacacgtt cttccctcat tgcccaaggc tcgttagaat tcgccctaga gctgtatcat 360
gtattttctt tcaaattaac tttgcttgca attaagctta gggaaccagc aacaaaagca 420
aacttggccc gaggtcgttc accgcgaaaa tggattagag aaacttcttc cccgatttaa 480
ggggaaagat tcctgcggcc agcgctttgg ggaaagtgcc ccgaccgcag aggcgacgac 540
aggggagcag gaagctgctc acggtagtcg gcgttggcgg cagcggtggc cttcctcat 599
<210> 75
<211> 599
<212> DNA
<213> Homo sapiens
<400> 75
attgcccaag gctcgttaga attcgcccta gagctgtatc atgtattttc tttcaaatta 60
actttgcttg caattaagct tagggaacca gcaacaaaag caaacttggc ccgaggtcgt 120
tcaccgcgaa aatggattag agaaacttct tccccgattt aaggggaaag attcctgcgg 180
ccagcgcttt ggggaaagtg ccccgaccgc agaggcgacg acaggggagc aggaagctgc 240
tcacggtagt cggcgttggc ggcagcggtg gccttcctca tctgggcgat gtgggctcck 300
agaagagtaa ggataacatc ctggaaatga cttctgtacg gtttgagccc aactgcacac 360
tcatgacttg gagctgccct gtggagttac agtttaccaa acacattcat gaacataatc 420
tcatttacta aaaactttgt gagaattttc ttttactaaa attttttctt attacaaaat 480
cagtagtgtt cattgtttta aaagaaataa caggtaagaa aaataaagag ggagggaaat 540
aacagcaaaa aaaaaaaaaa aaaaaggctg gcggggggga acccatagtt ggcccagag 599
<210> 76
<211> 599
<212> DNA
<213> Homo sapiens
<400> 76
ggggtcccag gggaggccac gggccgcggg gcgggcgggc ggcgccgcaa gcgccccctg 60
cagcgcggga agccgcccta cagctacatc gcgctcatcg ccatggccat cgcgcacgcg 120
cccgagcgcc gcctcacgct gggcggcatc tacaagttca tcaccgagcg cttccccttc 180
taccgcgaca accccaaaaa gtggcagaac agcatccgcc acaacctcac actcaacgac 240
tgcttcctca agatcccgcg cgaggccggc cgcccgggta agggcaacta ctgggcgcty 300
gaccccaacg cggaggacat gttcgagagc ggcagcttcc tgcgccgccg caagcgcttc 360
aagcgctcgg acctctccac ctacccggct tacatgcacg acgcggcggc tgccgcagcc 420
gccgccgccg ccgccgccgc cgccgccgcc atcttcccag gcgcggtgcc cgccgcgcgc 480
cccccctacc cgggcgccgt ctatgcaggc tacgcgccgc cgtcgctggc cgcgccgcct 540
ccagtctact accccgcggc gtcgcccggc ccttgccgcg tcttcggcct ggttcctga 599
<210> 77
<211> 599
<212> DNA
<213> Homo sapiens
<400> 77
tgaccctgcc acccgtcggc ccaaattcca gacccagcct tgtgaccttg aagagtgcag 60
gtattgggcc gccctcctct ccctaagaat ctttgcaggt atggagttca agggttctcc 120
ttcattcagc tagacaagct ggctgtccca ggtgcagagg tcaggatgac ttgcctggtt 180
gagaagaatg ggaaagtaag agttctccac ccaggagttt tgttctgggc tgcagaagag 240
cccaggcgtg ggactggggc tggagaaggc tggtttttgc ccttagtgcc agagttgags 300
ctttctctgt ttcctaatga gcaagtccag tgctttgaca gcaccactaa tcttaagcca 360
gtcccttctc ctctcgggtc gtcatttgtg aaatgggaat ttgtgactgc tacctcagat 420
aattttcctg aagttaaacg agaggagagg tgaaaagcgc tttgtaaact gcaaagcgca 480
gagcatagca gggctgaaag gctttaaata agcgctgcct tgtaacaaag cctcctggag 540
tgtcatgata aagccccggg aaggagaaag acagggtggg aaagagcgga cattttcgt 599
<210> 78
<211> 599
<212> DNA
<213> Homo sapiens
<400> 78
cgacagccct tctcggcctc ccaccggccg acgacaccaa gagctcgcgc accggccggg 60
ccaggtggga atgggcgccg cgcaggggag cgagtacctc ggagacagtg cgcgccgccc 120
ggggcctcat ccacagcggg gtcgcgggcg gcccccttag cccgcgtgac tgtgggatcc 180
tgagaacatt ccgctgtatg tcttggaacc ttctaaccct aggaatttgc aaacccctcc 240
cagtccctca tctgggggct cagagactgg aggtgccttt tttatttttt tcttcttcay 300
tttatgaaca cagaaaaatc gtttgtccct ctccgggccc tgcacccgcc agcgtcgtgt 360
gcaggcgtcc ccgggctgtg gataattaga cacgttcttc cctcattgcc caaggctcgt 420
tagaattcgc cctagagctg tatcatgtat tttctttcaa attaactttg cttgcaatta 480
agcttaggga accagcaaca aaagcaaact tggcccgagg tcgttcaccg cgaaaatgga 540
ttagagaaac ttcttccccg atttaagggg aaagattcct gcggccagcg ctttgggga 599
<210> 79
<211> 599
<212> DNA
<213> Homo sapiens
<400> 79
aggattccaa gactcagaaa gtactcaaag gaggagatga agcactccac cccatctctg 60
tccccttgcc accctgccct ctctgctctc tgtggtcaga gccacaagac agcgctggag 120
tgctagctgg ggttccgggc cagaaacagg aggcttctag aagttattct ggcatctcta 180
atctcaataa cacatttttt caaagttctt tctctttgac cagggcatag gaatcaccta 240
agggtcttat agaaaggcag gttctggtct aggaggtctg gggtgaggcc aaagaaccar 300
tatttctagc aagctcccag ggaatgtcct tgcagccgac ctccatctct tgtgtaaacc 360
aacagggagg gcttgcctcc ctttgccccc aggccttgct cctggccctt gcagaagtgc 420
atcttgcatt caagtgacca aaagaagagg cattagaaaa tgtgaaaggg taaaagggga 480
cctgcaccca gttttatagg tggggaaaca ggcccactcc atgccagaag gaatttgttc 540
aagacctcac agcaatttag tgacaaagtc aagactcagg cctcctgtat aggggaaaa 599
<210> 80
<211> 599
<212> DNA
<213> Homo sapiens
<400> 80
ccccatcctt catggtacat gcccctgtct gaactgtttt tcatcaggga catattcccc 60
cagctatctt gtcatgtcta ccctcaggaa caggctgagc acacacagaa agtcaagctc 120
gtatgtgttc aaggcagggg agggttcctt agggcactga ggaggacctt aggcttttac 180
tagaggatcc tttggcccag actgacttgg agacagggac cccttccagt tggccattgt 240
gtcctgaaca gaaagcttaa tttttctcct aaaccctcaa ctacctcaga cttggggctr 300
gagctgaggg gtcagaggca aagtttattc tatactcagg caattgactg ttgctaaggg 360
agggtataga gcttgaaccc aaggtcccta cagtgcctca gcccgaaatc aggacgtggc 420
ttcctgccct ggctctgtca ccccagcttt caagatgttt tcagatatac tcttgttgaa 480
tgtcattgtc acagtcaccc atacagctgg aaacaggaga tgaggtacag tctaagggct 540
aggattccaa gactcagaaa gtactcaaag gaggagatga agcactccac cccatctct 599
<210> 81
<211> 599
<212> DNA
<213> Homo sapiens
<400> 81
atccgagctt ccgttctcag aagagggagt gtggggctgg cagaggggtt caggaactcc 60
acagggagca gacagcattc ctcttttgag gccaagcatt gaggaccatg ccaggggctc 120
tgcaaaggct ggctttggcc tcagccaggg agaggagatg ctggagagag ggccggggca 180
ggagagcaga actcactaag ggcattccat ctcgccccta ctctgcctgt ccatcccatt 240
taaaattttg ttcactgctt agtttggcct gaggagcact aactacacta ctttctctcr 300
aggtagttct aagctattta tttaacaggt aagtccattc ctcaagctgc agtccatccc 360
cactccttag cccctacctt cacatcctca ccagattact tttacttcca tattaccttc 420
attaagatga taatcaaatg cagtctccat tgggggaggc agaggttcta gtccagcttg 480
gacacttgta actgtcatat cttgggcaag tcacacaccc cttctatggc tctatggagg 540
ctccacacac actcacaata ttcctattta tttctattgg gaacttatac aagcaatga 599
<210> 82
<211> 599
<212> DNA
<213> Homo sapiens
<400> 82
gaggtgggag ttgagtcctg ggaggtggtg gctctcaatt tattgcctgg ttgcagagca 60
cctccatgcc tgagaaacca tgactggggc tctgccctga ccacccccac ttgagaaact 120
gctccaggtt ctcagatagc gagataaact ggtgctctgc cccatggctg agatccaccc 180
tgattctggc ttcccaatct cttcctcacc ctgggagggg ctgacagctg ttccctgggt 240
gtctgactag gtgcttcctg gttaaccctt ctgggctgag ctggaaatcc gagcttccgy 300
tctcagaaga gggagtgtgg ggctggcaga ggggttcagg aactccacag ggagcagaca 360
gcattcctct tttgaggcca agcattgagg accatgccag gggctctgca aaggctggct 420
ttggcctcag ccagggagag gagatgctgg agagagggcc ggggcaggag agcagaactc 480
actaagggca ttccatctcg cccctactct gcctgtccat cccatttaaa attttgttca 540
ctgcttagtt tggcctgagg agcactaact acactacttt ctctcaaggt agttctaag 599
<210> 83
<211> 599
<212> DNA
<213> Homo sapiens
<400> 83
acatttttaa ttttaccttt tctagtagat gtgaaatgat atctcattgt ggtttttatt 60
tgcatatcca taatgaccaa taaggttgag cttcttttca catgctgatt ggccacctat 120
ataacttctt tggagtaatg tctgttgtag tcttttgtcc atttttaatt gggtagtttg 180
ggtgtttctt tgttcttcag ttgtaagaat tctttgtata ttctggatat taaactttat 240
caaatgtgtg atatgaaaat attttctccc tttccatgga ttgtcttttt actcacttgr 300
tagtttcatt tgattcaaga aagtttttgg ttttgagaag gtacaatgta tctatttttg 360
ctgttgttgc ctatgctttt aatgtcaaaa aatgatgtta agaaaccatt gccaggccgg 420
gtgcagtggg ttcacacctg taatcccagc actttgggag gccgagttgg gtggatcgct 480
tgaacccagg aattcaagac cagcctgggc aacatggcaa aaccctgttg ctacaaaaaa 540
tacaaaagtt ggccaggtgt ggtggcgtcc acctgtagtc ccagttactc gacaggctg 599
<210> 84
<211> 599
<212> DNA
<213> Homo sapiens
<400> 84
gagacccttg tctctacaaa aaaatttaaa aatagtgggg catggtggca tgagcctgta 60
gacccagcta ctcaggaagg tgaggtggga ggatcccttg agcctgggag gttaaggctg 120
cagtgagcta tgatcaggct actgcactcc agcctgggca aaagcatgag actcatctct 180
aaaaaaaaaa tcaaaaacca aaaatcaaat taaagatacc tccccaagaa gttctaagta 240
acatcaaagg caattacaaa tcagtttggt ttaggagtac agtgtcatca gccacaaatk 300
actctgcaca agtatccaca ggcagcagaa ctcatttcaa aactattcaa gactatttca 360
atcagctcat ttcgatcagc tattaagatt tacaatcatg attaggaaag catgtatcat 420
gttgacaggt gtctaatttg gttatgttga tcataaatcc tcagttatct gggagcacat 480
cattaaaatc acctataggc aatacattct tacaactgtt tcctatgtgg tactacagag 540
gatccatgta taattactgt atttctaaaa ctataataca ataatttatt tatgtctta 599
<210> 85
<211> 599
<212> DNA
<213> Homo sapiens
<400> 85
tcatatatat atacatttgt atatatactt gtataccaaa aaaaattttg ttttagagac 60
gggcttttca cgttacccag actgttccca aactcctggc ctcaaacgat ctgccaccct 120
cagcagccca aagtgctagg attacaagca tgagctgccg tgccccacca ggaaacttat 180
tttttacaat ataaacatcc ctattatata tttaattgag ctttaaaact tatgacttgc 240
cccttctcca tcacggaggt agggcttgct tcaataacct cacaccatga ttataattgy 300
attttcatat atatatatac tttttttttt tttttttttt agatggagac tcgctctgtc 360
agccaggctg gagtgcagtg gtgccatctc ggctcactgc aagctccgcc tcccaggttc 420
acgccattct cctgcctcag cctcccaagt agctgggact acaggcgcct gtcaccacac 480
ccggctaatt tttttatttt tagtagagac ggggtttcac cacgttagcc aggatggtct 540
cgatctcccg acctcgtgat ccgcccgcct cggcctccca aagtgctggg attacaggc 599
<210> 86
<211> 599
<212> DNA
<213> Homo sapiens
<400> 86
atttttagca gagacggggt ttctctatgt tgaggctggt ctcgaactcc tgacatcagg 60
tgacccgccc acctcagcct cccaaagtgc tgggattaca ggcgtgagcc atcgcgcccg 120
gccaacacat tcttttatcc caaattttta tcaaaacctc acacaactat tcaaccttgt 180
gtgaagtggg gtccgccttc attttccctg cacaggtgct cataaagaat ggtgtcctct 240
cctggggact gtgctcaggg cttttgatgg cagggccatg ttgaggacaa ctgtccagcr 300
ggcaactcca gacaggcatg aaacaatcca ccctctttct gccatataaa tatcagctta 360
ttttgagaag aaagtgtgcc agacactgct agttgtctac ccacccattt tcttcacttc 420
ttgtttgctc gcaagaccct gattttgttc aggtttcagt tggttgtgtc ttatcccttg 480
gcagtgaatc ttgacttgca taaggtaagc gcagtcacta tcctatcact cttgtcagag 540
attgatttgg aaacaggtac aggatacttt ctgggccaat gagatgttca ggaaagtct 599
<210> 87
<211> 599
<212> DNA
<213> Homo sapiens
<400> 87
cctcacaaag gacacttgaa gttgtgccca cagaggcaaa tgctcatatg gagactcaag 60
aaagcctggg gttcagaaga ggcttgagat catgttatga gaaacagctg aagaaaacgg 120
gggtgctcag cctagggaag accaaggggt ggtatgacag gctaacttgg gagggcaacc 180
agcctgtgtg gcctctctag tgggcagagc tgtcggagga cagagtggat ctcacgttca 240
ggaagaatgt tttaataatg agcactgccc ataaagaata agctgcacag gtcaggggtr 300
tatacctcat ttaggcaggg cctggaaagg ccagatagtg ggaacattga agagactcag 360
gaactggcag aaaactgagc cagattatat ttaacatcct ttttattatt tttgtgggtt 420
ttttttgaga cagggtctca ctctgtcgcc caggctggag tgcagtggca cgatctcggc 480
tcactgcaac ctctgcctcc caggttcaag cgattctcct gccttagcct cccgagtagc 540
tgggattaca ggcatgcgcc attaccaccc agctaatttt tgtattttaa gtagaggta 599
<210> 88
<211> 599
<212> DNA
<213> Homo sapiens
<400> 88
caatccaccc tctttctgcc atataaatat cagcttattt tgagaagaaa gtgtgccaga 60
cactgctagt tgtctaccca cccattttct tcacttcttg tttgctcgca agaccctgat 120
tttgttcagg tttcagttgg ttgtgtctta tcccttggca gtgaatcttg acttgcataa 180
ggtaagcgca gtcactatcc tatcactctt gtcagagatt gatttggaaa caggtacagg 240
atactttctg ggccaatgag atgttcagga aagtctgctg tggacttctg gaacacatty 300
atttggtctt aacaaaaaat aggggagggc atggtggtgt atgcctgtaa tcccagctac 360
tcaggagcct gaggcaggag aatcacctga acccgggagg cagaggttgc cgtaagccga 420
gatcgcacca ctgcactcca gcctgggtga cagagccaga ctctgtctca aaaacaacaa 480
tgacaataac aacaacaaca acaaacaaat gtatcctaac tgatacagaa agtgaccatg 540
aaagggcagg ggaaaactga ttcttgatgt attccctttg agacttctct tggcttctt 599
<210> 89
<211> 599
<212> DNA
<213> Homo sapiens
<400> 89
aactccagac aggcatgaaa caatccaccc tctttctgcc atataaatat cagcttattt 60
tgagaagaaa gtgtgccaga cactgctagt tgtctaccca cccattttct tcacttcttg 120
tttgctcgca agaccctgat tttgttcagg tttcagttgg ttgtgtctta tcccttggca 180
gtgaatcttg acttgcataa ggtaagcgca gtcactatcc tatcactctt gtcagagatt 240
gatttggaaa caggtacagg atactttctg ggccaatgag atgttcagga aagtctgcts 300
tggacttctg gaacacattc atttggtctt aacaaaaaat aggggagggc atggtggtgt 360
atgcctgtaa tcccagctac tcaggagcct gaggcaggag aatcacctga acccgggagg 420
cagaggttgc cgtaagccga gatcgcacca ctgcactcca gcctgggtga cagagccaga 480
ctctgtctca aaaacaacaa tgacaataac aacaacaaca acaaacaaat gtatcctaac 540
tgatacagaa agtgaccatg aaagggcagg ggaaaactga ttcttgatgt attcccttt 599
<210> 90
<211> 599
<212> DNA
<213> Homo sapiens
<400> 90
gaaggtctgg taaaggtatt taacatttct gaacttcaat ttcctcatcc caaaaatggg 60
ggataaatta tattacttaa gacagttaag gcgattgtat gaaatgagtg taaaaatgtt 120
ttaccgtact acctggcaaa cagcagacac ttagtaaata ttgtttgttg ggcacttgat 180
aaacgtctct caagttccta ctgtgtgcca gttgttgtgt tagctgcaaa ggatgtggag 240
atgagattct gtctcttcct ttaaggaaag gggatggtgt tattttcttc ctaccagatk 300
acaagttaat actatttaaa acatgatttc tgttaatttg tgggagattg catttttttc 360
cccatcagat cattgtggta aaataacttg tgctcttttc ttattccgtg gtttgttttg 420
ttttgttttc tataggattt tgtttgtttt tcacaaaaat ggtcatttga gctgtaaggc 480
aaaagtgcag cctcctaggc tgaatggtgc aaagactgga gttttttcca caaggagccc 540
tcatcgtccc aatgcaatag gactgaccct ggccaagctg gaaaaggtag aaggtaacc 599
<210> 91
<211> 599
<212> DNA
<213> Homo sapiens
<400> 91
agtattcaac taatatgtat taagcaagga gcgtgacaag tgctgggata tggagttgaa 60
caggaaaaaa tccctgcctg caaggagctt acgttctggt gcataaacag acactctata 120
aacaatgtgg acatgaagtg gcagagatca gcactaggta gagaggaagg agctccccca 180
agccttggcc aggagggttg gcaggccctg gggggaggtg gtgtttgaac tgagtcatga 240
gggatggata aatagaaatc tttcacaaga agtgggcagg gcattccagg aatgagctar 300
aaagcccaga gtccaaagca gcatgacatg tacaaaaact acacatggca caggtaaaat 360
gtgggtggga tgcggagaca gaaaagggtc aatagggaca cagctcacat gattggaaga 420
tgagaccctg gatagactcc agtaaaactt atgtgaattt cagagaactc ctccctcctt 480
gcaataattc acaatcctat tcccaccacc atgacaccca gtggtatcct cagagtagga 540
gtcagcttac tgcttggact taacctacct tccccagaaa gcagagcttg aggcagagg 599
<210> 92
<211> 599
<212> DNA
<213> Homo sapiens
<400> 92
accaaagcct atacaccaat gttcatagta gcagtcttca caatagccaa aagataggaa 60
caactccttt taatcacatt tatcagccaa aaatagtcac atgaccatgc tttatttcaa 120
ggggacagaa gagtatatgc atccacatac ttagaagtaa aagagaattg gataattggt 180
gaacattaac tatcttccac gattacctgt gatactaaaa attatttcca caccaacata 240
ttgcaaagag attgaaacag aacttgctca aagaatgtga actgtcccat gaaccagagr 300
tcctacccag aaaaagtggg agaactgcaa ctccagccac accttattct ctcaatacat 360
tcccagtatg gacggccaaa attccagaaa ccccaaggac atctgggtgg cagctctatt 420
tgattaaaaa gtctcttaac tggcagaggt tgccgtgagc tgaaatcgcg ccattgcact 480
ccagcctggg taacaagagc gaaactctgt ctcaaaaaaa aaaaaaagtc tcttagctgc 540
ctagaaacca acgttcttcc ttttcacttg ctatgcatgc tatcagatac ctctaccac 599
<210> 93
<211> 599
<212> DNA
<213> Homo sapiens
<400> 93
gaaagatcaa gggaattcct gtagtgttgg tgaagggtga tcctagggtg ataaccatgc 60
ccaaatcaga gaggccaaga gacctagatt gcagcaagac agaaggcaag aagtggaaac 120
tggtaagttc atacgaaaac acagagagga gggcattaag gatggtaata atttttttta 180
attcagcaaa tgaaaacaca gataattatt atctccagac aaaaccaaaa gtccaaaaat 240
ggaaataaat aaataaataa ataaataaat aaataaatag tattctacta gttcagctgk 300
gaaaagcatt tagataatac tataaacact gactattgat ctaattaaca ttatgatatg 360
actatattag gaggatgggg taataggaag gatgggtaca catggtggaa ataggtgtaa 420
aagaaagcta aatctttatt ttccatagtg ttaagcccaa aatctgaaat attaagtagt 480
agctgacacc gaaagcacat gcaacaaaag caaaaataaa caactgggac tatatcaaat 540
taaatagttt cttcacagca aaggtaacca tcaacaaaac aaaaagacat ccaacctat 599
<210> 94
<211> 599
<212> DNA
<213> Homo sapiens
<400> 94
ttggtagact acacatacct ccctgtggca gccaggcccc caccacccat tctcatcatt 60
ccacacaaac gtgagcccct accatgaaca agatgttgca tggagcactg gcagaagcag 120
agtgagttga aggtggcttc ctcccaggac tgcatggtca cagaccccag caccagcaaa 180
gtatggtcat caggaccaca ggaagggcca gagatgggct atggggcact ggggtcagga 240
agagtgcccc atcttcctga agggtgatac tggacctggt ccttggagaa taagaaagay 300
ctgatgaagc aaaaccctgg aaggagggta tccaagatga agagaaagta tgaggtgcag 360
tctggaggca ggaaagatgg gctgcatcgg aatcacacca ggtagaatgg ttggttggtt 420
gaattgggag gtggagctgg agaggtatgt agggcagatg gcaaaaggcc ttaaattcag 480
gccaaggaga gtggacttga ttatggaggc aacagagact gagggacaag agctgggatt 540
ggaaagaggc cccaagcata tatgaagctc ccctactcat gcctgcccca caccttttc 599
<210> 95
<211> 599
<212> DNA
<213> Homo sapiens
<400> 95
gagtcaaaac agagactctt ccaagtggca tgggaattag ggtccccttg acctgaggag 60
cttgggtttc tggagatgac tgaagtggac aggaatgaaa ggcatcctga aattagtctt 120
aagagtctct taggggaagg tggacttgag acaaaaggca caatgctggt tagcaacaat 180
tctctactgt gcctgtgagt aatgcagaag ccagaatgag tccctgaagg gattgttctc 240
ttaaggggag ttcactgtga aggcttccgg ggagggtcca tctaccctga aaatggatcy 300
ctagggttga cttttccaac tcctcaggtg gtgcagtgtt atgatgctct ggagcacaag 360
gagctcagag cctgccactg tgctgctggg tggtgtggtg gtgtggcggg caggctccca 420
aatcattcca cacaagtgac atttgtgtaa acaccactgt aatttctctg ttggagtctg 480
cagacccatc ctcaagttat cagggagaat tttaattttt ctatattgat aataagctta 540
acaaataata aaatcatatt ctatgtcctc tagatgtgag gctaccagat aaattacag 599
<210> 96
<211> 599
<212> DNA
<213> Homo sapiens
<400> 96
tacagaaaag gaaactgagg tcacaagatg ggcagacact tgtacagtat tatacagcat 60
tagtggcagg gccaagatca catcccgacc tctgcattcc tgtgccagta ctcttttcct 120
caccattcct cctctgaaga gcgcttcctt aaaaatagtt ctaacaaaaa tgaagctgct 180
tcttcatgtc attttactga tctcatgtag gcagtattgt gtcaggaatc ttatatttga 240
attgtagcaa cgtttggttt cctggatatc tgcttcagag gtcatgtggt gaaccctccr 300
agacaccagt caaagtttgc tgaacccaaa cctccaagtc gttcacctga aagatctaaa 360
ccaacagaaa tgaaacaaat tggcattgct ttgtctcact atctcgtgag atgcgtgaga 420
attcttaagc agacagttac tgcctgtgtc atgggtaaaa tcccaaatca ttttgtgggg 480
tttgttattg ttccaacagc tataagagag ccaatatctg catgtaccaa catctctttg 540
tagtatcgct tcctggatcc tttttttttt tttttttttt ccgcttgatt tgggagtca 599
<210> 97
<211> 599
<212> DNA
<213> Homo sapiens
<400> 97
gacatgagct gagagttgtg aataaacccc tgtactttgt acttacttac tcaacttgac 60
aaacattccc catggacttg ccctctgtca gactgcactg ggaactgggg attctgtagt 120
gaatcaggca ctatgtttgc tcttcagaat ctagtaagag ttgggctcac atagccaaaa 180
tgcaaagcag agcatggcag cgccctggaa gatgaattcc agattcctgc tgcctggtcc 240
agaatcagca tagcccaaca atgctaggtg accttggtca agttgcttaa tctctctacy 300
ctcagtttcc atccttaccc ttctttctca aagagctact ctaagaagaa aataagacaa 360
ttggcctgga catactttgg agtcaaagct gaatagggag agacgattgc tagtgtttca 420
tagtgtcatc agtaacatag acaccattta ttcagtatct tcccaggtac caagcatctg 480
accagtgttg catgtcattc ttccaacact cctggtacag ctctattatt atctatattt 540
tagagatgag aaattgaggc tcagagaggg gaggtgactt acccatggtc acactgctt 599
<210> 98
<211> 599
<212> DNA
<213> Homo sapiens
<400> 98
aaaaaaaaaa aaaaaagaga cgaaactatt atgtggttgt gctgccctgc cctcagtatg 60
ttgtgtaata aatataatag gggtatgaat aattgtgcaa tgaatacatc ctgatggtaa 120
aaaatttaat gtacacacaa aagggggtag gcagatagga gggaaacaat attgtaacat 180
cccactgtac tattggttct caaccctacc tccactttag gattgtcagg agagctttta 240
aaataaaaac atcctaaatg caattctata tcctggattg gaccctgaag cagacaaags 300
acattagtgg aaaaattcat gaaaacggaa taatgtctgt agttaatggt agtgtaacta 360
tcctgatttc ttagttttga caaatggccc atggttatgt aagacgttaa cattggtgta 420
aactgggcga aaggtatata gtaacttttg tactatcatg acaacttttc tgtaattcta 480
aaattattcc tccaaaaact attatttgaa gcataaaaca attaaaaaat aaatatacct 540
atgcctgtac atcagctaga tgggggaatc tgaatccctg ggggagaagt ctggacata 599
<210> 99
<211> 599
<212> DNA
<213> Homo sapiens
<400> 99
acacacacac gggcagccta attttccatc caaagtcttt acattcagaa agcagattaa 60
tcttggattc acttgatttc ccatggggat ctctcatact aatccttcag aaaagtgaac 120
caacttaaat cccccaccaa gctctgttct aaggaggaat attcaactct gtggcaatta 180
cattccaaag tccctatttt ctgtagagag cttccctggt gttaaccact tttccttagt 240
tattctttta tttttttatt tttattttgt tttattttat tcttttattc taccaacaay 300
tccacaatgt aggtattagt gttcttttgc tctgtgagaa aactgaactt caaaaaggtt 360
aaataacttt ctcaaagaca cagcaataag tggcagaacc aggattcaaa cactcattct 420
caggacacca gaccttgtac ctcagtgttc cctggtccac cctgccagac cagagcagag 480
gtcctttgta caggttgcag ggaagctttt ttgagactca caggaaatga gagctaaaat 540
gaccttgtag gtcctcattt cacatttcgt tccatctttc aaacaaacca cattgtaca 599
<210> 100
<211> 599
<212> DNA
<213> Homo sapiens
<400> 100
agtttgattt ccgtcactca aaccaagaga gtcctaaatg agaccagcat cttccattta 60
ttaagctcac ttatgtgctg ggagcttttc actgtatcac tttatgtaat cttgcacaca 120
gtcacatgaa ccatatggcc attttataga caaggaagct gagacacaga gggctgaggg 180
atgtacctag ggccacccag ctgttagtaa gtggccaaag agggattcaa acccaggtct 240
gcctaacacc aaacccatgt ccctaactct tgccacagtg ctattcacac tatgccctgr 300
agcttctcca gttctcactc tctgggatgg gcagcttcag aacagactca gcttccatga 360
cttgaccttt tgtgtactgg cttcttgtac cgcgtatgaa ctgcacataa aattactccc 420
ataaataatt tttcaataca agatcttatg atggttctta gcagcttagc gggttagagt 480
caaagtctcc atgctggatc tgtcctcaca ccttcaccca actaagtaaa tactttttat 540
tgacatcccc tttggaaagt gagacttttc tgatctgatc aaatcctggc cttaagaac 599
<210> 101
<211> 599
<212> DNA
<213> Homo sapiens
<400> 101
gtaatggtga gcactcaggg gcagaatggc caatgtgtga gacttcaaac cacacaagag 60
gaagagaaag gcaagcatcc ccagctagcc tgaggcatat tggcccatga tccttagagg 120
cagaatgtgg agggagctcc gacgggttat ggccaagtat gttcttgggc aaaccactct 180
ccaaagaagg gaaagagaga agctccctgt tagtaaacta ccaccatgtg ccaggcactt 240
ttcctgctgt gtctactctg ttcagcaaca ctgtgaggcg gggattatga tctcttatcs 300
gttcctctgg tgacttctaa ccaaggctgt ggcaaggttt tgtgctatag gtggcatttg 360
ccctgagctt taaaactagg tagactttgg gcatgtagag gtaaagttgg gatgtggaag 420
ggaacaaagg gcattttagg cagagggaat aaaatagaga gggaaaaaag gaggtaattg 480
tgggtccctg gattttaaaa gtagagttgc cattgtttca ttttttttaa aaaagagtat 540
actctgagga gtagctggag ctaagtctgc gaaggccaat taggatctgt tcttgaaaa 599
<210> 102
<211> 599
<212> DNA
<213> Homo sapiens
<400> 102
caggggcaga atggccaatg tgtgagactt caaaccacac aagaggaaga gaaaggcaag 60
catccccagc tagcctgagg catattggcc catgatcctt agaggcagaa tgtggaggga 120
gctccgacgg gttatggcca agtatgttct tgggcaaacc actctccaaa gaagggaaag 180
agagaagctc cctgttagta aactaccacc atgtgccagg cacttttcct gctgtgtcta 240
ctctgttcag caacactgtg aggcggggat tatgatctct tatcggttcc tctggtgack 300
tctaaccaag gctgtggcaa ggttttgtgc tataggtggc atttgccctg agctttaaaa 360
ctaggtagac tttgggcatg tagaggtaaa gttgggatgt ggaagggaac aaagggcatt 420
ttaggcagag ggaataaaat agagagggaa aaaaggaggt aattgtgggt ccctggattt 480
taaaagtaga gttgccattg tttcattttt tttaaaaaag agtatactct gaggagtagc 540
tggagctaag tctgcgaagg ccaattagga tctgttcttg aaaaagagcc ccaaatgcc 599
<210> 103
<211> 599
<212> DNA
<213> Homo sapiens
<400> 103
atcacctgag gtcaggagtt cgagaccagc ctgaccaata tggtgaaacc ccatctttac 60
taaaaataca aaaattagct agtcatggta gcatgtgcct gtagccccag ctactcagga 120
ggctgaggca ggagaattgc ttgaagctgg gaggcggagg ttgcagtgag tcgagattgc 180
gccactgcac tccagcctgg gcaacagagg gagactctgt ctcacaaaaa aaaaaaaaaa 240
aaaaaaaaat taaactaact aaataaaagt taaaatttag ttcctcagtc acactagccw 300
caaaggcctc aataacccta tgtagctact ggctactgat tggacaacac aaacatagaa 360
catttccatc attgtagaaa gtccttttct agaaactcaa actatggctg cagaactaag 420
aggggcagac catctgctac aaacaccatt cttttccaac ccagcaccca gcactaggcc 480
agacacagcc tccttcctcc tctctctcct tcctttccac ccatctttct ccacacccct 540
ttccaggagc agatcataat cccggaagag acaaccttga acaccataat cccaaatat 599
<210> 104
<211> 599
<212> DNA
<213> Homo sapiens
<400> 104
cttaacttta ttattcctct gtaagtgatc ctttcattga agtctctatt tgaaccatct 60
gggtgcattc tgtttcctgt tgaaagtgat aaagcaaaat gcttattttc tcgtgcctca 120
gtgtcctcat ctaaaaataa gaatcatatt aatgcccact tcgcagggat gatatggcaa 180
tcaaatgaga aaatgtattt atgataccta gttcagtgcc tggcataggt aagtgctcaa 240
tgaacgttca ttgatattat catcatcact cccattggaa tttataacct ggggctatay 300
gatctctata ggtccttaca gcatgaatgg aatatgaatg ggtgattctc tatacaaaag 360
ttgctgccaa tccagatatt attttagtct tttgatctca aggtagagtt gaggcttaga 420
caataaaaat tataattatc tcttgttgcc atttataagc aagaggacta tgccttttac 480
agagaggttt cttcacgtga tgtcagccat ttggaacttt catgccctgt tacagataac 540
aggtaacatt tatggagcat tttctctatg ccaaataacc tgagtcttta tatgtggaa 599
<210> 105
<211> 599
<212> DNA
<213> Homo sapiens
<400> 105
gcagagatca gcactaggta gagaggaagg agctccccca agccttggcc aggagggttg 60
gcaggccctg gggggaggtg gtgtttgaac tgagtcatga gggatggata aatagaaatc 120
tttcacaaga agtgggcagg gcattccagg aatgagctag aaagcccaga gtccaaagca 180
gcatgacatg tacaaaaact acacatggca caggtaaaat gtgggtggga tgcggagaca 240
gaaaagggtc aatagggaca cagctcacat gattggaaga tgagaccctg gatagactcm 300
agtaaaactt atgtgaattt cagagaactc ctccctcctt gcaataattc acaatcctat 360
tcccaccacc atgacaccca gtggtatcct cagagtagga gtcagcttac tgcttggact 420
taacctacct tccccagaaa gcagagcttg aggcagaggg cttttgagct gccatagatg 480
atcctcaact taccatggtt taacttatga cttttcaact ttatgatggt gcaagagtga 540
tacacattca gtagaaaccg tagttcaaga gcccatacaa ccattctgat tttcacttg 599
<210> 106
<211> 599
<212> DNA
<213> Homo sapiens
<400> 106
gtgattgctt ataagacaac ccacggaatc cagaataagt tctgcctctc aagatcctta 60
accacatctt tgtcacataa gggaataatc actcttttgc tatataaggt aatagtcaca 120
ggtagcaggg attaggatgt gaacgcagct tttggggcca ccatccaacc cactacacca 180
gaaattagca ggtgaatctc caccccttcc ctgtttgatg ttattttgtc tctctcagta 240
tattcctttg ggtgggacac ttgtgtctag aaacagcaat tgtcggtttg aatctcatcy 300
atagtgtttc tccggccttc ttttctttct ttctttcttc tttttttttt ttgtttgaag 360
cagagtctcg ctctgtttcc caggctggag tgcagtggtg caatctcagc tcactgcaac 420
cgccgcctcc tgggttcaag tgattcttct gtctaagcct cccgagtagc tggaattata 480
ggcgcatacc agcacacctg gctaattttt ttgtattttt ggttgagatg ggtttttgcc 540
atgttggcca ggctggtctc aaactcctga cctcaggtga tccacccgct ttggccttc 599
<210> 107
<211> 599
<212> DNA
<213> Homo sapiens
<400> 107
tggcaaaaac ccatctcaac caaaaataca aaaaaattag ccaggtgtgc tggtatgcgc 60
ctataattcc agctactcgg gaggcttaga cagaagaatc acttgaaccc aggaggcggc 120
ggttgcagtg agctgagatt gcaccactgc actccagcct gggaaacaga gcgagactct 180
gcttcaaaca aaaaaaaaaa agaagaaaga aagaaagaaa agaaggccgg agaaacacta 240
tggatgagat tcaaaccgac aattgctgtt tctagacaca agtgtcccac ccaaaggaay 300
atactgagag agacaaaata acatcaaaca gggaaggggt ggagattcac ctgctaattt 360
ctggtgtagt gggttggatg gtggccccaa aagctgcgtt cacatcctaa tccctgctac 420
ctgtgactat taccttatat agcaaaagag tgattattcc cttatgtgac aaagatgtgg 480
ttaaggatct tgagaggcag aacttattct ggattccgtg ggttgtctta taagcaatca 540
catgtgactt tataagacag acacacagag aagaggagga agaagcaatg tgaccacag 599
<210> 108
<211> 599
<212> DNA
<213> Homo sapiens
<400> 108
gagggcccta ctccctcctg aggctctagg ggagggtcca tcccttgcct cttccagctt 60
ctgatggcct catgcattcc ttggcttgtg gccacatcac tccaacctct gtggtcacat 120
tgcttcttcc tcctcttctc tgtgtgtctg tcttataaag tcacatgtga ttgcttataa 180
gacaacccac ggaatccaga ataagttctg cctctcaaga tccttaacca catctttgtc 240
acataaggga ataatcactc ttttgctata taaggtaata gtcacaggta gcagggattr 300
ggatgtgaac gcagcttttg gggccaccat ccaacccact acaccagaaa ttagcaggtg 360
aatctccacc ccttccctgt ttgatgttat tttgtctctc tcagtatatt cctttgggtg 420
ggacacttgt gtctagaaac agcaattgtc ggtttgaatc tcatccatag tgtttctccg 480
gccttctttt ctttctttct ttcttctttt ttttttttgt ttgaagcaga gtctcgctct 540
gtttcccagg ctggagtgca gtggtgcaat ctcagctcac tgcaaccgcc gcctcctgg 599
<210> 109
<211> 599
<212> DNA
<213> Homo sapiens
<400> 109
tctaacgcct gtatttttca atttacattg aagacgccat tgcatggctg ctatgggaat 60
ttttgtactg gggacagaag gcatcatggg tgaaggacag catgaacaaa ggcccagagc 120
cccgtgtctg cagcccaggc tcatctgctt ccctcaggat gctcacccct ctctctttag 180
gggttccaaa gttggcttac tgatgttata taaccttgat ttctatcaac acctaaaaaa 240
taccagttat ttccactggc agccagtcag aaataacccc agaatggcaa gaatgcagcy 300
gtgtctctta ggcatgtcag caaagggcat gctgactgag tccaagcaga gaaacgcctg 360
agctgagaag cagcccctac aggacacatg ggcagcagag acatgaattc aaaagatggg 420
aattccctgc atagccgcac accatcaccc actgtgagtg gcacccaagt catctcatgt 480
actcctcaca gcagtcctag aggtagcaaa cctcatcatc cccattttac agtggagaaa 540
gccaaggccc tccgagcttg gggagcttgc ccagagagtc tctatgtatt ggaactggg 599
<210> 110
<211> 599
<212> DNA
<213> Homo sapiens
<400> 110
agagtgatgt gtacatttca agaatgttta cccaattcag ggaagaacca tttgccacta 60
aaaggtcccc ccgcctgtcc tcatcaccat gtcaccctgc agaaggtcaa gtggccttat 120
gcatgaggct aattccctgc attcctgatc aaggggcagg gagggccagg caaagtcact 180
gctgtcttca gcagacagtg gccatgatgg aattaggacc agaggcccac agttgcaaag 240
ataactcaaa taccctgtag gcttccttca aaggctgaaa agcacaggct tggggcttcr 300
ttcattggaa caaaacttta cgaaaagaaa caggtacact gatgtctagg catctttaag 360
acaggtaacc tcaaatgaca tttacatagc atgttatggt ttattgtata catctcacca 420
gcctgctaaa aagaaaaagg gtctctcctg aaggctgagt tccagcccca gctcagctac 480
tgacttgctg ggtaatcttg ggcaggtaac ttactttctc tgggtcccaa gttcctcatt 540
tgtaaaataa ggggtggagt aggtcatgtc taaattggtc cctgattctt accttgtaa 599
<210> 111
<211> 599
<212> DNA
<213> Homo sapiens
<400> 111
accttatttt aaacagctaa agccacccaa atctctattt ctgttctctc atacctagag 60
acacaaaaaa attcacaaaa aataataaaa cctagttaga atgtaaagga gtcaatcagt 120
tttcacttgc agcagattaa atggtctaga atgaaatgag aggcatggag aggtctcctg 180
gcccctcaga cgtgctctcc aaatgtggag gccagttctt tgcatcactc cacagtgcat 240
ccccacacag atggcagagt gtgaaagcgt attgcaaccc aaatcagcat cttccctttr 300
gtacagtatt taaaaggact ggccaggtgc aggtgctcat gcctgtagtc ccaacacttt 360
tttttttttt ttgagacaga gtctcactct gttgcacagg ctgggattca gtggtgccat 420
cttggttcac tgcagtgtcc gcctcctggg ctgaagcaat tctcctgcct cagcctcccg 480
agtagctggg attacaggca cgcatcacca cacctggcta atttttgtat ttttagtaga 540
gactgggttt caccatgttg gccaggctgg tcttgaactc ctgacctcaa atgatctac 599
<210> 112
<211> 599
<212> DNA
<213> Homo sapiens
<400> 112
atgtgttctg ctagaagctg caagacacta aattgcatgt acaggccaaa tacaactgcc 60
cacagccata tgcctatgaa aaagatacta gaaaggatat cagggtgttt tccttctttc 120
atcccctcca tcctttgcat ttacagatga ggaaactgag accaatgggc tgttcctgct 180
gttgagaacc tgtccctaca gtttccgtgt ggcccacagg ggcagagtgg aggagctggt 240
gaccatgcaa caggaggatc aggtcatgaa agacacctgg agctggggtg gagacagctr 300
gttcaacacg tggcttcagc acacacccac tgagcaaagg agcctactca atgccaggcc 360
ctgagggaga gaggcagacc cgacccagtg ctcactatca cggggcacat gggaggaaga 420
gacgatctct gcctgaggtg atcagagagg gcattaagca ggagtggcat ttggatctca 480
aagcagggtg aggacatgtg gcacactgga gccagtttgt accagctttt ggaggctagc 540
tgcttttagg aatttcacat gccagtgctt agacataggt attattaaaa ataaatttg 599
<210> 113
<211> 599
<212> DNA
<213> Homo sapiens
<400> 113
ttttgagaat ccattgtagg aactcagata ggagaagaca gggcaggaga aggtagagga 60
agatacagta gggattataa tccctactgt atagatacag tgtcttctat agcagagtga 120
cactgtagga gatgtggtag ctgctatctc ctgggggcca gcatccttac tgccctagat 180
tcctctggct cttgtccttg gcccaaatag ctttcaggag aaaggaggca accctgggtg 240
gggccactcc caacctccca ctgagtgagc ctggctacag actgtgctga gctggaccay 300
cccaggagaa aatgctttgg agccactgga gagaggggac cctgtatttt caaagcatcc 360
ctgagctgga gacaaaccta gcagggccaa aagatcccct catgcgatgc cagccctctc 420
taggtcaaaa cccaagtagg agaagatgag gcagagaggg aaggtctggg catgctgtgc 480
tgattccagg atccctgcac acccaccagg gaacctgtgc ttctgccctt caagaacaca 540
cactgcagcc caattgtgtt gttactctgc ctaatcctgc cattatgttg aatcctagt 599
<210> 114
<211> 599
<212> DNA
<213> Homo sapiens
<400> 114
ggttgggtgc ttctcaacgg caggagcaaa accccactgt ctctcacagg acccaatcct 60
gagtagctgc tcaaccatgt gtgtccagtg ggatggtcct gggtgaactt agagttaagg 120
ctcgcagatc acagaggaag gaagaactta aagacagcag gtaaaacacg ggaagtcaac 180
attccctcct ccctctgcct ctgccaccag cctatgtaat attccaggta atgcaacagg 240
actttgtggg tgacctagat tttcttcata ataatcacag ccatttactc agcacatccy 300
atgcacccca cacttcatgt gtattagctg taatcctaac accagtccta atcccatttt 360
caagatgtgg ggcctgaggt tcagagacct caaattattt ccttacaagg agaggagcta 420
ggatttgacc tcaggtgtgt ttgattccaa gcccgcattc tctctgtaaa acatgcagcc 480
ttgttcagaa cactgatagt ctcagcaggc ttgaggctaa agcacttccc tctgctggac 540
gttttttctt agtgtagagg gtagaagtag tgagggtggg gctcttccct gaccctgac 599
<210> 115
<211> 599
<212> DNA
<213> Homo sapiens
<400> 115
actgggagac aggagagcca gggttcaggg ccactgggag agcttccccc agtccctacc 60
tgtctgcttg cccatctgta aactgccagg cttgcatgca tctggtgtgt tttcccggac 120
ggagtttgac tactgatgtc ctccttggct cctggggccc gctgtaaaca ccacttcctc 180
accctggctc tcagtttgcc ccctacagtg tggctgtcca cataggtgcc cgtctacctg 240
tcaggttggg tgcttctcaa cggcaggagc aaaaccccac tgtctctcac aggacccaay 300
cctgagtagc tgctcaacca tgtgtgtcca gtgggatggt cctgggtgaa cttagagtta 360
aggctcgcag atcacagagg aaggaagaac ttaaagacag caggtaaaac acgggaagtc 420
aacattccct cctccctctg cctctgccac cagcctatgt aatattccag gtaatgcaac 480
aggactttgt gggtgaccta gattttcttc ataataatca cagccattta ctcagcacat 540
cccatgcacc ccacacttca tgtgtattag ctgtaatcct aacaccagtc ctaatccca 599
<210> 116
<211> 599
<212> DNA
<213> Homo sapiens
<400> 116
ctctttattg acactatatc aatccaactt tccctaaaag ataaactcca aaagagatag 60
aaagatggag cactgggaga caggagagcc agggttcagg gccactggga gagcttcccc 120
cagtccctac ctgtctgctt gcccatctgt aaactgccag gcttgcatgc atctggtgtg 180
ttttcccgga cggagtttga ctactgatgt cctccttggc tcctggggcc cgctgtaaac 240
accacttcct caccctggct ctcagtttgc cccctacagt gtggctgtcc acataggtgs 300
ccgtctacct gtcaggttgg gtgcttctca acggcaggag caaaacccca ctgtctctca 360
caggacccaa tcctgagtag ctgctcaacc atgtgtgtcc agtgggatgg tcctgggtga 420
acttagagtt aaggctcgca gatcacagag gaaggaagaa cttaaagaca gcaggtaaaa 480
cacgggaagt caacattccc tcctccctct gcctctgcca ccagcctatg taatattcca 540
ggtaatgcaa caggactttg tgggtgacct agattttctt cataataatc acagccatt 599
<210> 117
<211> 599
<212> DNA
<213> Homo sapiens
<400> 117
ggatctgaaa gagccctggg agacaattag cctaaagctt tcatttcaca gacagggatg 60
ctgaggccca gggagagaca gggaactgcc cagatcacag agcaagtcaa gcacagatag 120
cctagaacac aggccttctg attgccagga cccacgctcc aagctcaagg cctggccttg 180
aaaagaccaa ggtgctgtca taggtgagtt cttgctcttg cccctgaact tccatgtgga 240
tgtcgttttg aaaccaaaat actctgtaaa caacacttat taacacaagt tcacatgtay 300
tctgctgtgg aaggagatgc gtctttcttc tttgtgaaat attagctcag ataggcatac 360
aaagaactct atgactctca gtttgcttaa catatttgat ttgctttatg cctacaagtt 420
catactaagc tcttgcatat ctgctggcct ctttattgac actatatcaa tccaactttc 480
cctaaaagat aaactccaaa agagatagaa agatggagca ctgggagaca ggagagccag 540
ggttcagggc cactgggaga gcttccccca gtccctacct gtctgcttgc ccatctgta 599
<210> 118
<211> 599
<212> DNA
<213> Homo sapiens
<400> 118
gggaaaagtt ccgttctctg ttatttatat gggcagattg aatgagcatt atctccgcaa 60
ggtcttccca gtactttata gtttgcaaag caaactttaa tgtctctgaa ctctaaggat 120
actctggcaa gcaaagatag tctctcattt tactaattag gaaactgagg ccagagaggg 180
aaaggcacct gctctgtgca tcatgcgtgc atgcacatgt gcctgtgtat gtgtgtttct 240
gtgtgcaaga aaggccttga atgctcctgc agacctggat cccagttgtg agagaagttk 300
tcagttctga tgcttggcgg gcagcgttcc ggcccactgc ccatgtatgg agtcactcag 360
acttagctaa gtacacagca gccaggagcc tgtgtttcag cagctaaaat cagtgggcag 420
cacaaaaatg taggtgtagc tccctcgccg cttccacctt gcccctcttc tctcccctcc 480
cacagggtgg aactgcctgg aataagctca gcccagataa caagtctaca catgcagcat 540
ccagggaata agcacagggc agctctgggg cacacatgga gacatgtatc ttcatacac 599
<210> 119
<211> 599
<212> DNA
<213> Homo sapiens
<400> 119
acctcattaa aacttcttgt gggagctcct gtggaaaatg ctgtggtcag gaagttaggg 60
tagagtacct gcccttccct ctaacaatag agcattcctc caaaaccagt gtaggctgga 120
ggaggccatg ggctagctca ggtctagcct tggcactggc aatcactgat tcacattgaa 180
tatgtacatc accatcatca tcaccaccac ctactcttct tccaagaaga caaataataa 240
ccaccactta tatcaagcag tcttatatgt gcagacattc acaacagccc agtggaggas 300
gcgctatagt catgccacat gacagatgat gaacctaagg tacagagcaa ttaaatgaca 360
gggcctaggc attgcaacac aactgcaagt ggcagaactg ggatttgaac caggcattct 420
agctccagag tccattctat tagtcatctc gctacattat cttccttttg aatcatgaat 480
cagggtattc tctggcaatc aaaccattcc agattcggtg gggaaaagga tacatcagat 540
agcatgtttc tgaggctgaa atcaccaatt ttgtattaat agaatagggt attatctat 599
<210> 120
<211> 599
<212> DNA
<213> Homo sapiens
<400> 120
acgccagcac tggtagagag aggtgcagag agccccacct ttttgcttgg aattggtgag 60
agcttgtgct tacctcatta aaacttcttg tgggagctcc tgtggaaaat gctgtggtca 120
ggaagttagg gtagagtacc tgcccttccc tctaacaata gagcattcct ccaaaaccag 180
tgtaggctgg aggaggccat gggctagctc aggtctagcc ttggcactgg caatcactga 240
ttcacattga atatgtacat caccatcatc atcaccacca cctactcttc ttccaagaar 300
acaaataata accaccactt atatcaagca gtcttatatg tgcagacatt cacaacagcc 360
cagtggagga cgcgctatag tcatgccaca tgacagatga tgaacctaag gtacagagca 420
attaaatgac agggcctagg cattgcaaca caactgcaag tggcagaact gggatttgaa 480
ccaggcattc tagctccaga gtccattcta ttagtcatct cgctacatta tcttcctttt 540
gaatcatgaa tcagggtatt ctctggcaat caaaccattc cagattcggt ggggaaaag 599
<210> 121
<211> 599
<212> DNA
<213> Homo sapiens
<400> 121
atcaaatcct ggccttaaga acgacaacca atattgtaat cttcaaaggc tcagacaggt 60
gaaatgactt gcctagggtc actcagcttg ccagggtcag aacagaaatt ggaacccaat 120
tattcatttt gtctagtcct aacaaatttc tgagtcctta tagtcctcag ggttccaaac 180
cttctgtcgc aagacctctg catccaggca cagatgacgg tggtggtgac gccagcactg 240
gtagagagag gtgcagagag ccccaccttt ttgcttggaa ttggtgagag cttgtgcttm 300
cctcattaaa acttcttgtg ggagctcctg tggaaaatgc tgtggtcagg aagttagggt 360
agagtacctg cccttccctc taacaataga gcattcctcc aaaaccagtg taggctggag 420
gaggccatgg gctagctcag gtctagcctt ggcactggca atcactgatt cacattgaat 480
atgtacatca ccatcatcat caccaccacc tactcttctt ccaagaagac aaataataac 540
caccacttat atcaagcagt cttatatgtg cagacattca caacagccca gtggaggac 599
<210> 122
<211> 599
<212> DNA
<213> Homo sapiens
<400> 122
gaaagtgaga cttttctgat ctgatcaaat cctggcctta agaacgacaa ccaatattgt 60
aatcttcaaa ggctcagaca ggtgaaatga cttgcctagg gtcactcagc ttgccagggt 120
cagaacagaa attggaaccc aattattcat tttgtctagt cctaacaaat ttctgagtcc 180
ttatagtcct cagggttcca aaccttctgt cgcaagacct ctgcatccag gcacagatga 240
cggtggtggt gacgccagca ctggtagaga gaggtgcaga gagccccacc tttttgcttk 300
gaattggtga gagcttgtgc ttacctcatt aaaacttctt gtgggagctc ctgtggaaaa 360
tgctgtggtc aggaagttag ggtagagtac ctgcccttcc ctctaacaat agagcattcc 420
tccaaaacca gtgtaggctg gaggaggcca tgggctagct caggtctagc cttggcactg 480
gcaatcactg attcacattg aatatgtaca tcaccatcat catcaccacc acctactctt 540
cttccaagaa gacaaataat aaccaccact tatatcaagc agtcttatat gtgcagaca 599
<210> 123
<211> 599
<212> DNA
<213> Homo sapiens
<400> 123
tagcgggtta gagtcaaagt ctccatgctg gatctgtcct cacaccttca cccaactaag 60
taaatacttt ttattgacat cccctttgga aagtgagact tttctgatct gatcaaatcc 120
tggccttaag aacgacaacc aatattgtaa tcttcaaagg ctcagacagg tgaaatgact 180
tgcctagggt cactcagctt gccagggtca gaacagaaat tggaacccaa ttattcattt 240
tgtctagtcc taacaaattt ctgagtcctt atagtcctca gggttccaaa ccttctgtcr 300
caagacctct gcatccaggc acagatgacg gtggtggtga cgccagcact ggtagagaga 360
ggtgcagaga gccccacctt tttgcttgga attggtgaga gcttgtgctt acctcattaa 420
aacttcttgt gggagctcct gtggaaaatg ctgtggtcag gaagttaggg tagagtacct 480
gcccttccct ctaacaatag agcattcctc caaaaccagt gtaggctgga ggaggccatg 540
ggctagctca ggtctagcct tggcactggc aatcactgat tcacattgaa tatgtacat 599
<210> 124
<211> 599
<212> DNA
<213> Homo sapiens
<400> 124
ctgtatcact ttatgtaatc ttgcacacag tcacatgaac catatggcca ttttatagac 60
aaggaagctg agacacagag ggctgaggga tgtacctagg gccacccagc tgttagtaag 120
tggccaaaga gggattcaaa cccaggtctg cctaacacca aacccatgtc cctaactctt 180
gccacagtgc tattcacact atgccctgaa gcttctccag ttctcactct ctgggatggg 240
cagcttcaga acagactcag cttccatgac ttgacctttt gtgtactggc ttcttgtacy 300
gcgtatgaac tgcacataaa attactccca taaataattt ttcaatacaa gatcttatga 360
tggttcttag cagcttagcg ggttagagtc aaagtctcca tgctggatct gtcctcacac 420
cttcacccaa ctaagtaaat actttttatt gacatcccct ttggaaagtg agacttttct 480
gatctgatca aatcctggcc ttaagaacga caaccaatat tgtaatcttc aaaggctcag 540
acaggtgaaa tgacttgcct agggtcactc agcttgccag ggtcagaaca gaaattgga 599
<210> 125
<211> 599
<212> DNA
<213> Homo sapiens
<400> 125
tcccgggatg ttttttagct ggtgggaaag aatcctctcc tgataggtca tggaatggtg 60
aactgagagg ttttggaagt catgtcctca ccccatagga aacctctgtg gcagggcaga 120
aggaagccaa cagttagaga tgagaagctg agaagagaga gtcttgctga tgtctaagtc 180
cctgtccccg actgccctaa ggccaacccc acccctgccc ttcttggtta tttaaaacaa 240
caaaatgact actttactta agctagtgtg agtttgattt ccgtcactca aaccaagagr 300
gtcctaaatg agaccagcat cttccattta ttaagctcac ttatgtgctg ggagcttttc 360
actgtatcac tttatgtaat cttgcacaca gtcacatgaa ccatatggcc attttataga 420
caaggaagct gagacacaga gggctgaggg atgtacctag ggccacccag ctgttagtaa 480
gtggccaaag agggattcaa acccaggtct gcctaacacc aaacccatgt ccctaactct 540
tgccacagtg ctattcacac tatgccctga agcttctcca gttctcactc tctgggatg 599
<210> 126
<211> 599
<212> DNA
<213> Homo sapiens
<400> 126
agggcgcttg atgaagacat agttccaaag gagcaatgtg tccctgggta ggcaggcact 60
ttgcctttgc ttggcttcag tctctccgtc tgtgaagtgg gccaggtggt tcctgaggtc 120
ccttctaaca ctatgactgt ttgttgttgt tttttttttt tctaattacc gtgctcccag 180
gctcattgag atctgcaggg ggtcgacaga ggaaatgagg ccagggtctt actgaggcgg 240
gggctatggg ttggtgaagg gaaagctcca cgcggagccc tccagtgaga ctgccacagy 300
tcctgggctt cctctgctgg gaacgctgcc taagctctgc aaacagcagc tgaggatggt 360
ggatttggtc agcattaagc tgtattaagt cgagctgttt ctacaaagac tacattttgg 420
gataaacatg gtaccaaagc cacactaaga caatatagct cttggaagaa ggggcttcat 480
gccaccctca gcacctagtg cagagaactg ttctcctaac gcacccacat acagacttcc 540
tgaggagaaa ttcctgcagc atccccaccc tctgttcctg ccgggaacaa gtcccttag 599
<210> 127
<211> 599
<212> DNA
<213> Homo sapiens
<400> 127
cttgccttct ttaagctgca gaggaatttt gatggaactt tttcatctgt tgaatgggag 60
tggaatgctg tcctgcctat cacaaacagg accaaatcat gagttattaa aaggcaacga 120
tgagtatgtg cttacctctc tcaaatccat tcctcccatc tgcctgcccc gataccacat 180
accagttctc attcacttca gctaggactg tgctcactga ggtcatctac ataacctcct 240
gcccatcctg gtcaaggagc catctccctt agagcaggaa aggactttag tctagaaatk 300
atttttaggt tcaaggggaa gtagaatgat atatcagaaa taatatgaac ctggatttaa 360
atctcagttt attcattcat tcacccaaca ttcttattta gttatttatt tatttaagac 420
aggatcttgc tctgttgtcc aggctggaat gcagtggtgc gatcatggct cattgcagcc 480
tcaaactctt gggctcaagc catcctctca cctcagcctc ctgagtagct agaactacag 540
tcatgtgcca ccacacatag ttaatttttt ttttcttttg tagagaaaga gtttcacta 599
<210> 128
<211> 599
<212> DNA
<213> Homo sapiens
<400> 128
ttttcataga gacaggattt caccatgttt tccaggctgg tcttgaactc ctgggctcaa 60
gcgagcctcc ccgcaccggc ctttgggagc cgacaaggaa tccctgtctt ctagtagtct 120
tcaaagccag atccagcttg tctaggttaa ggattcgatg cctccaatga ggcagagaaa 180
atgaacatgc ccgttccccc aaggccttca agagcctcca ggctcacaga gattaacttg 240
tcctcacccg cctgcctgcc ttttgtgcag atctctgcat tgtcctgaag aaagactccr 300
gcactcgggc tgaaactccg tgtgccgatg accctggcct tgtcccggga ggcactggaa 360
gggatggcgc ccgtcgcgct cctgaaggcc cggagccacc cgctgtgagc agataaccgg 420
cagcactggg cagcgcggag gcggccccac gaggactcag ccccgggctg ggagtcaggg 480
attcgccctg aagccttgca ggtgcccccg tcaccgggcg tcggattccc gcgggacgcg 540
gttttcccca cggctgggcc tccctttggg cgagtcccca gcacaatgcg cgtcatccc 599
<210> 129
<211> 599
<212> DNA
<213> Homo sapiens
<400> 129
taggtcatca gggacaaatc atttttaatg gttggaaaat tatttttatt gtagtaggaa 60
ctactagcac ataaatctca ttttatttca cagatacagc ttagcaaaaa tttaataagc 120
aagttgatat aagaaaaacg ttgaatcagt aatactacaa gttgtgaatc aggttcactg 180
tgtactggtt accaacttgt ctgagtggga tgagatagaa cgcccacaca caacaagtta 240
catgaagtgg gttcactgct tacagagatg cagcaaggga ctgtagaagc gtaggacgcm 300
tttgaggcct gagccctaag gctccggaaa gctgtccagg ggaaaggaat ctcgactgtg 360
tgtctcccac ttgtacggca gcggaggacc ctggaaagca gcctgtcctg ggttttatac 420
cccggaaaac aagactcgct ggactaaagc gttgaaagac attctgttct ggggaggact 480
ggcacagagc caggctgttc cagccagcca ctccctatct caggatgttg cccttccagc 540
atattctaca gttattcttg agaactacaa ggcagaaagg gggtagaact ggatgagtc 599
<210> 130
<211> 599
<212> DNA
<213> Homo sapiens
<400> 130
tgacagagct aggatgggaa cccaggagtc agaaatcgga acttgtgttc ctaatcactt 60
aagctatatc acaaatgaga gaggtggatg attctatgac tgtagggctc taaaatgatg 120
tgaaggaatg aaatgtcttc acatagacaa gaaatgtcta tgtcctaatt cccagatcct 180
gtgaacatta ctttatatgg tgaacaacgt gattcagtta aagatcttga gataaggaac 240
ttatcctgta ttacctgggt aggacctgca tcaatcacat gtatttttta aaagagggas 300
gtttgacaca gacagaagac acatagaaga gaaggtgata tgaagacaga ggcagagatt 360
ggagtgatgc agccgcaagc aacggaatac tggcagcaac cagaatctgg aagaggcaag 420
gaatggattc tcctgctgga gcctccggag gaagtacagc cctgctggca ccttgatttg 480
ggacttccgt cctccagaaa agagagaata catttctgta gtttcaagcc accaagtttg 540
tggtaaagtt ttttacagca tccacaggaa actaatacca gtggtaaagt gtactttac 599
<210> 131
<211> 599
<212> DNA
<213> Homo sapiens
<400> 131
cctactttca agtaggtttc ttccttctac ttcctctgag tttatttttt tctttctcta 60
tttttagtat cttgaattga aactttagtt ggtcccactc tttatttttt aaatttttct 120
cttttaatag tgaggacact taaagctatg aatttccctc tgagtattgc tttggcaata 180
tcccatagat cggatatcca ttcattcaac aaattttttt ctagctttat tgaagtatga 240
ttgagaaata aaaattatat atattttggg tatataacat gatgttttga tatatatacr 300
cattggcaaa tgattactac agtaatgcta atagcatatt cattacctta catagttact 360
gtgtgtgtgt gtgtgtatgt tgtgtgcatg tgagataagg cacatgaggc ctactcaaca 420
aatttcaagt atatcataca ttaatattaa ctatagtcat gatgcttaca ttaggtctcc 480
cgtacttatt cttcttataa cagatttgta aacttcgacc aatatctccc ctcactcccc 540
aggccctggt aaccactgtt ctaccctctt gtactataag ttcacctttt ttttttttt 599
<210> 132
<211> 599
<212> DNA
<213> Homo sapiens
<400> 132
ttcctctgct gggaacgctg cctaagctct gcaaacagca gctgaggatg gtggatttgg 60
tcagcattaa gctgtattaa gtcgagctgt ttctacaaag actacatttt gggataaaca 120
tggtaccaaa gccacactaa gacaatatag ctcttggaag aaggggcttc atgccaccct 180
cagcacctag tgcagagaac tgttctccta acgcacccac atacagactt cctgaggaga 240
aattcctgca gcatccccac cctctgttcc tgccgggaac aagtccctta gcccagggar 300
aggcatatga cccaagctga gccaatcaga ggagccatcc tcctggctac tgtgattggt 360
ccagtgtggt catgtgacat agcctggcaa attagagtcc ttttcccggg atgtttttta 420
gctggtggga aagaatcctc tcctgatagg tcatggaatg gtgaactgag aggttttgga 480
agtcatgtcc tcaccccata ggaaacctct gtggcagggc agaaggaagc caacagttag 540
agatgagaag ctgagaagag agagtcttgc tgatgtctaa gtccctgtcc ccgactgcc 599
<210> 133
<211> 599
<212> DNA
<213> Homo sapiens
<400> 133
gagcctagtt tttcacaaat gttgattgat attttcattt accctaacag gtaagaaaaa 60
atgacatata atgaagacat ataatggaac ttcactcatt tatcagtgac acagatatta 120
ctttcattga atcagaattc aatcagatat tagttttaaa tagaatattt cctcatttgt 180
gggtgctatt cacaatatat aaaagctata gacatgacag actttgaaat ttaatctgca 240
ttattaatat tttcttcacc cctttcttaa gttcagagtc taaactttgc acaatcaacr 300
aaacattaac tggagtcctg atgtgtagca tttgcccatt tccatagtgt aaatactccc 360
accgtggcca gtttcagcta ccaacatcat gtccctggat acagagttgg gaagagatgt 420
atagtagcac agagctttgt agtattttca ccatacaaat gcaatagttg caaacaatct 480
caagagcata gataatagta aaacatagtg aaatagttca gatgtgacaa gtgttgggta 540
ttacctttgt ttcaaatatt atttatcaaa ttgtaaattt gtcaaattta tttttaata 599
<210> 134
<211> 599
<212> DNA
<213> Homo sapiens
<400> 134
aagatttccc aacaggcaaa tgtcagagcc tggatcagac ttcagactca ggccccctct 60
ttttctccag tgccgtgtca cctctcacta aggggtcatc taatccagcc tgctatctga 120
tatactaatg ccttcaacaa cgtccctgtc cagtgactat ccagcttctg cctaaacact 180
ccccaagaca cgagcctcac taccattccc tgaagcagcg agatgcatct ttagacagct 240
ctgccagaaa acacttgctc agtcagggtc aaaatcagcc gtcttgtaac actcctgtcy 300
gagacctcag taatcatgcc atgcagccat tcaaatgcct tctgcgacac agatgccggc 360
ccacttccag catctgctcg ctcacctcca gtttggggaa ttcaacacca ctcaagccga 420
ccctttcctt ctttgagtat ttaaaaatca tcctccctcc cgcaactcct ccccactggc 480
tttgtcctct gtggccccca cagaccacat ctgttccttc tgccccaggg tagcccctca 540
gagacaacga ccatgcccct aagttttatt tttcttctgg ctgcagcctt aacaggtca 599
<210> 135
<211> 599
<212> DNA
<213> Homo sapiens
<400> 135
ttcgggctga ggcactgtag ggaccttggg ttcaagctct ataccctccc ttagcaacag 60
tcaattgcct gagtatagaa taaactttgc ctctgacccc tcagctctag ccccaagtct 120
gaggtagttg agggtttagg agaaaaatta agctttctgt tcaggacaca atggccaact 180
ggaaggggtc cctgtctcca agtcagtctg ggccaaagga tcctctagta aaagcctaag 240
gtcctcctca gtgccctaag gaaccctccc ctgccttgaa cacatacgag cttgacttts 300
tgtgtgtgct cagcctgttc ctgagggtag acatgacaag atagctgggg gaatatgtcc 360
ctgatgaaaa acagttcaga caggggcatg taccatgaag gatggggaag gggcccagat 420
tgggaaagca tgttcccagg atcacattgc accacatggg gagaaccagg attttcatct 480
cattgcttgt ataagttccc aatagaaata aataggaata ttgtgagtgt gtgtggagcc 540
tccatagagc catagaaggg gtgtgtgact tgcccaagat atgacagtta caagtgtcc 599
<210> 136
<211> 599
<212> DNA
<213> Homo sapiens
<400> 136
taaattaatt tttgtatatg gtatgaggta ggagttcaaa ttcattcttt tgcatgtgga 60
tatccattgt catggcacca tttgttgagg agactgtttt tcccatggaa tgctcttggt 120
acccttgtca aaaattaatt agtcataggt gtatgggttt atttctggac tctctattct 180
attccattga tctatatatc tatccttatg ccagtgtcac ttcagtaaag ttttctagtt 240
ttcttaaaaa aaaaaaaaca aaaaacagca gattcaaccc actttcttct ggcctttaak 300
tccaatatta taattagaat aaactgctcc caaaaggatg tgaataacac accctacaac 360
ctggactgag gttttttcat tattacactc atgacttctg ctccaatatg tgtttgaaca 420
ctgtttgagt gagaggcggt gtttcttaac attctcttct tctgcatatc cagaacaaat 480
aatacaaagg gaatctagaa actacctaac cccatagcca gatcattctg acaatgctat 540
agaaaaatta ggtaggatat gccatattat aaagtagggc catgagttca aaaaacaaa 599
<210> 137
<211> 599
<212> DNA
<213> Homo sapiens
<400> 137
acatttgcat attaaagggc taaggtggga aggccaggtt gttcatgggc tacgtgaatg 60
acacacctgg tcaaaccaat cccctgagac ctatgcaaac cagacactgc ctcctccagc 120
ctccctatat aatggactgc ctttgtgctg cacacagggt ttctctttgt tccaagtcct 180
cctcccttgt ctttgtatga gggagctggt ctcttttttc ttccttcttt cttgcctatt 240
aaactttttg ctccttaaaa ccaaaaaaag aaaaaatact ttttggctag ttcagcacas 300
gcaccaacca gtcggagtgg acacccagcc aatcggaaca aatgccagct gtcaacaaca 360
ggaaacactg tactgtacct gacttagtgc aaaggggcct gggaaatgga gttgctggct 420
gagcaattgt tgtgcagtga tgactcaccc tgtggcacca gatgcaccca tcctggtgga 480
cggctagctg gccctgcctc aaatcacata aggtaccaca agcttccatc tcaggtgtct 540
gctttcaacc cctgcatgtc ccctccaccg caccctatca tcaaggccag ctagtccac 599
<210> 138
<211> 599
<212> DNA
<213> Homo sapiens
<400> 138
ggagcgacat ggtcattaac cacatatttg cacagcttat tcatgttagt tgggctgctc 60
catctcactg agtctaattg gacacgccca caatgctgca caacacattt acatcgacct 120
ggctgtcagc agccaataaa ggactacagg atgtgtttgg ttccaaaggg acttggctct 180
cggcagaagc ttgtttgcag gcacactggg tgtcttggct ttctggcact gtggactaca 240
gcttaactca gagcatacat tcaatcattt ctcaaacatt tgttagctca agcactgtay 300
caggcacagc actggcccta gcagggtcta caaagatgaa ccaggcacca tttctgccac 360
ctcgaggagg tttaccttct gccctccatg atgtgaccct gtctagcagg ccccctcctg 420
cccacctggg gcatgtgtgc catctaccag cccactccac attctctgcg caggtctctg 480
tgctcttcct tcagcctgga attcttctgt ccacctggct ctgtctgaag acgccacctc 540
ctctgtgagg cctctcctga tttctgagac cacacaaatc tctccctggg ctgcgtttt 599
<210> 139
<211> 599
<212> DNA
<213> Homo sapiens
<400> 139
cccaaggcct tcaagagcct ccaggctcac agagattaac ttgtcctcac ccgcctgcct 60
gccttttgtg cagatctctg cattgtcctg aagaaagact ccggcactcg ggctgaaact 120
ccgtgtgccg atgaccctgg ccttgtcccg ggaggcactg gaagggatgg cgcccgtcgc 180
gctcctgaag gcccggagcc acccgctgtg agcagataac cggcagcact gggcagcgcg 240
gaggcggccc cacgaggact cagccccggg ctgggagtca gggattcgcc ctgaagcctk 300
gcaggtgccc ccgtcaccgg gcgtcggatt cccgcgggac gcggttttcc ccacggctgg 360
gcctcccttt gggcgagtcc ccagcacaat gcgcgtcatc ccgcagacct gcccggcaga 420
ggcgggcggg caggagcgcg cttggcttcc tgtctcgctg aatggcttga atgggcgctg 480
ggcccgttcc taatccccta gcggctgact gtcccggcag gggcggagga gggcgggggg 540
gcttgcagcc ctggcgtctc ctcgcaggct gcaggcagtg gggcccgcct gttctagtt 599
<210> 140
<211> 599
<212> DNA
<213> Homo sapiens
<400> 140
ctgaatccta ttcctgtccc acagaataca aatgtttcac tgaacacagt ttgtgaagtg 60
ctgccctgaa aaatatcagc tcttgtcctg acaacctgag agcacaggat ggaggccgtg 120
aaggaagcct ggagacctct gtgcagagcc tctttgttgt acatgtgagg ttctgagacc 180
cagagagtag caggtgttct caggttgcac agccaaggag gggaggcacc atggccaaga 240
acggcctttt cactccaggc aggctggcag ggctggcatt ttggaaagct ctcagcagay 300
agaattcaca caccttcctg tagaggccgc acaggattca agagatggaa actgctggaa 360
ggagcactgt cttattgaaa gtaatctcaa gatcccagga ccacaaagct agatgtttca 420
catcagtcta attcccccaa cacacaggcc tagagaggag aaggacttat tcaaggccac 480
aaagcaagtt caaagcacag ctggaactag aatccaagtg tcctgccccc tgcctccagc 540
tccaaggctc tgtctggcct ttcctgcagt tgttgatatg tctgtctgtc ttctcagcc 599
<210> 141
<211> 599
<212> DNA
<213> Homo sapiens
<400> 141
ggacatgctc caatgacacc catggctgct tcctcatagg gcaccctctg cctctctgga 60
gcctgccgct ggctctatcg aaaggggcca gtgggaaata gtcatggggt cctactctga 120
tctgagcagc cagagggagt gacatgagct gagagttgtg aataaacccc tgtactttgt 180
acttacttac tcaacttgac aaacattccc catggacttg ccctctgtca gactgcactg 240
ggaactgggg attctgtagt gaatcaggca ctatgtttgc tcttcagaat ctagtaagak 300
ttgggctcac atagccaaaa tgcaaagcag agcatggcag cgccctggaa gatgaattcc 360
agattcctgc tgcctggtcc agaatcagca tagcccaaca atgctaggtg accttggtca 420
agttgcttaa tctctctacc ctcagtttcc atccttaccc ttctttctca aagagctact 480
ctaagaagaa aataagacaa ttggcctgga catactttgg agtcaaagct gaatagggag 540
agacgattgc tagtgtttca tagtgtcatc agtaacatag acaccattta ttcagtatc 599
<210> 142
<211> 599
<212> DNA
<213> Homo sapiens
<400> 142
atttatatgg gcagattgaa tgagcattat ctccgcaagg tcttcccagt actttatagt 60
ttgcaaagca aactttaatg tctctgaact ctaaggatac tctggcaagc aaagatagtc 120
tctcatttta ctaattagga aactgaggcc agagagggaa aggcacctgc tctgtgcatc 180
atgcgtgcat gcacatgtgc ctgtgtatgt gtgtttctgt gtgcaagaaa ggccttgaat 240
gctcctgcag acctggatcc cagttgtgag agaagttgtc agttctgatg cttggcgggy 300
agcgttccgg cccactgccc atgtatggag tcactcagac ttagctaagt acacagcagc 360
caggagcctg tgtttcagca gctaaaatca gtgggcagca caaaaatgta ggtgtagctc 420
cctcgccgct tccaccttgc ccctcttctc tcccctccca cagggtggaa ctgcctggaa 480
taagctcagc ccagataaca agtctacaca tgcagcatcc agggaataag cacagggcag 540
ctctggggca cacatggaga catgtatctt catacacacg cacatatgta cacacaaat 599
<210> 143
<211> 599
<212> DNA
<213> Homo sapiens
<400> 143
atggaaactt gcttatgatg tgttctgcta gaagctgcaa gacactaaat tgcatgtaca 60
ggccaaatac aactgcccac agccatatgc ctatgaaaaa gatactagaa aggatatcag 120
ggtgttttcc ttctttcatc ccctccatcc tttgcattta cagatgagga aactgagacc 180
aatgggctgt tcctgctgtt gagaacctgt ccctacagtt tccgtgtggc ccacaggggc 240
agagtggagg agctggtgac catgcaacag gaggatcagg tcatgaaaga cacctggagm 300
tggggtggag acagctagtt caacacgtgg cttcagcaca cacccactga gcaaaggagc 360
ctactcaatg ccaggccctg agggagagag gcagacccga cccagtgctc actatcacgg 420
ggcacatggg aggaagagac gatctctgcc tgaggtgatc agagagggca ttaagcagga 480
gtggcatttg gatctcaaag cagggtgagg acatgtggca cactggagcc agtttgtacc 540
agcttttgga ggctagctgc ttttaggaat ttcacatgcc agtgcttaga cataggtat 599
<210> 144
<211> 599
<212> DNA
<213> Homo sapiens
<400> 144
taataattaa ttaatttaat taattatggc aaattatact gggtttccat ccaaagtttc 60
tttttagagt aaacgtacat tttttaaaaa tgagttagtt taaagaaaaa tattgattac 120
tctcacaagt ggtttgtaga tatgacaaaa attgtaaagg cagaatcaaa agactaaaat 180
tatggtgaac gtccctggaa caatgaaaag aacatgggct ttggaatcag gccagggttt 240
gaatccagtt cctccaattg ttagcagtgt gacctcatta ctcaagctct ctgagattgy 300
ttcctcctca ttacttttta atggagatca ttaaccaaac ctcatgttgg tgggggtgat 360
ggcagtgtga agggatggag tgggaggagg tgcatggggg tgtgaggggg ggggcggtgg 420
ggaggtgtga ggattatggc ttactttcac cactgctgtt cttacattcc tctttcttat 480
tgttgcccct gggtcttgac ccagtttgta aattggggtc caatccaacc caattcccag 540
atgcctggcc aggctccggg gacagaaccc aataggacca gcttcctgcc ctccaggag 599
<210> 145
<211> 599
<212> DNA
<213> Homo sapiens
<400> 145
ttgctctgtc acccaggctg gagtgcagtg gcatgatctc ggctcactgc aagctccgcc 60
tcccgggttc acgccattct cctgcctcag cctcccgagt agctgggact acagtcgcct 120
gccaccatgc ccggctaagt ttttgtattt tttttagtag agacggagtt tcactgtgtt 180
agctaagata gcctcgatct cctgcccttg agaccagccc gcttccgcct cccaaagtgc 240
tgggattaca ggcgtgagcc actgcgcccg gccaactgct agtggatttt acaacaaacr 300
gcagcactga agttaaaggt gtatggaatt tacagtagag tattgcatgt tactattttt 360
aaattgtggg ctacacattc tttatattag gaaaatttgt aattaacaaa tacatatatt 420
aacttgtata cttatattaa cttatataca tatatatgca tacatttttg agaatccatt 480
gtaggaactc agataggaga agacagggca ggagaaggta gaggaagata cagtagggat 540
tataatccct actgtataga tacagtgtct tctatagcag agtgacactg taggagatg 599
<210> 146
<211> 599
<212> DNA
<213> Homo sapiens
<400> 146
tatctaaaca acatttgggt gttctaaagt aaccaccagg taacacaatg gtttgctcct 60
atactaccta tgaaaggaat gacgaaagga ataattaggt ttgtatagaa tattgtgcat 120
tatagtcata actgctgtga gaactcccaa atcagggtgg tgtgcaggtt agggcagagt 180
tttgggagag gcgaactgtt ctgtacaaaa aggagaagaa tcataatgct gaggggaggg 240
gagggacctg ggagagggga gtgagcagca agcagggtgg ggcaccacct gaatgaaggw 300
cagaaggtga gagcccttag gggcacagca gcacaaaaga ctttgggaga aaaggaatta 360
ataagaggga atttttaagt tgtttgtcat ggtgtgtgct atgggcctcc ttccctcttg 420
tcactcttac actgtcttta gaaaagtcat tctttttttg tgaaagggga ttctccaggg 480
agtattgaag gatgcaggga tgaattgttt gtttctgaaa tggagtcttg ctctgtcact 540
caggctggag tgcagtggtg tgatctcagc tcactgcaac cttcacctct tgggttcaa 599
<210> 147
<211> 599
<212> DNA
<213> Homo sapiens
<400> 147
gcaaagcgtg ccattgaggc tgtgctgtca gcggatcctc ggtctgtgta ccgccggaag 60
ctttgccagg accgcctttt ctactttact gtagacatag cgcatgtcac ttgctggttt 120
ggtgatggct ttgcagaggt gctgaggatc aagccggctt ctgagcctgt tcatatgact 180
ggccctgtgg ggtccttggt gtctctaggg tcttaaggag cctccctcat gtctttaagg 240
tagcatcatt gatctttgga tgtggctttt ggattttctg aacaagctaa tgttgtgtcr 300
agaagcaaca ctttgtgatc tcatggcttt gattgatttg ggctgttcaa aatgtttatt 360
tgaaaaacgt atacattaat aaacttaaca aagagatata aaatacagag aaatcaccaa 420
atgctttttg atctgttgat attaaagaat caaaaggtga tgctgtctcg ataatttctg 480
aaagaagctg ttcttggtgc acttgataaa attagacaaa gttcattcca gcagagactt 540
tctagttgag gggatctatt cagtaattca tattggtttt cctgtctgtc tggaaaagc 599
<210> 148
<211> 599
<212> DNA
<213> Homo sapiens
<400> 148
agtggactga ggagggctga gcggaaggat atgaggtcaa agaggcacta gaaaagggac 60
gaggtcacct aagggtttta taggccattg taaggacttg agttttgatc ttgggagaag 120
taaaaggcag aggaacttga tgtccgtatc cccagagagc aggggaccat ctctggggtc 180
agatcactac ctgtgtgatt tctgggatgt cacacctcag tgacatgcaa aggcaagctg 240
gagttcctta ttgagacaat gaagactttc attctatatc cagaaaataa aggcttacam 300
aaccaaagat actagatttt cccctgcttt actagcaggg agagaatgaa gaggctaggg 360
gggtatttgg ctttgataat ccaacctgaa ggaggttttt ctgatgggaa aaagaagtct 420
aaaagttggg actggagata catgccaact gactctgaga tttccccatt tcttcctgtc 480
agagccacag ccagcccaca ctgttgcctt ttgcaaagga aaagccaccc cttcctctgg 540
gtggaggcag ccacctgcca gggcccagga actggtttta gccccaacat gcaaacttc 599
<210> 149
<211> 599
<212> DNA
<213> Homo sapiens
<400> 149
acctcagccc tccttccttt cttgtctttc agcatcaatg cagagaaaag aggagcagca 60
aagagggtgc atttccaggt tagtgtctta gtccgtttgg gctgcaataa cagaatacca 120
taggcccata gactaggtgg cttaaattga tctctcacac tgctgaaggg tgcaaatgcc 180
aaaatcaggg cactggcaga ttcagtatcc ggtgacgccc actatgtcct cacatggtaa 240
aacagacaat ggggttctca ggggtctctt ttattaggcc actaattcca ctcatgaags 300
ctcctccccc acaatctact cacctcccaa aagcctcgct tcctaatact gttggaccgg 360
ggattaggat ttcaacacat gaactagggg gatataaaca ttcagtcaat agtagaaggt 420
tctgcctgtt cagcccagaa ctctcaaggt ctaaacttaa tctctccttt cccatgagga 480
ccccggtcca cagcctctga ggctgtgtca gcttctagag cccattactc tcagaagata 540
aagcccccag cagggacact cataaaaagg aatccgaatc tggagtgctt aggagattg 599
<210> 150
<211> 599
<212> DNA
<213> Homo sapiens
<400> 150
caaatattta acaggaggtc ctctgaggct gtataaatat ccagtttctt cttaaaattt 60
tgtccaccaa ttttatcata gtcagtggat attgcaatta ctgttatagt gttctaatgg 120
tgatcttctg ttttcttagt ttcttctata tttactattt gaaattcttc tataaggaaa 180
atttatctct tcttccccgt ttatttattt attcaatcca tttttattta tatcaatatg 240
gactcatgga tatttatttt attcttcagg ttataatgca ctaccacatt tattaaccty 300
gttgctcaac tttagccact gggagctctt tcaggttgac ttttacgtcc ttttgtcatg 360
ccctatcttt attttttcaa tatactttct tacttgctgg cactccttta ggatttagga 420
ccatcttgta tttattttcc ttgactcagc tctagaacta cccatttctc caaggggccc 480
tggttccttt tattggagaa tggtatttag gaaccaagat ttgggggctg agagtgccca 540
ttgctactgg ggtgtcactg cttctaggcc ttctcagcag acagagcaag gaaatatat 599
<210> 151
<211> 599
<212> DNA
<213> Homo sapiens
<400> 151
cattctgctg tttccatctc tgctccatgt gctacccctt tggctaaggg ggaaatatgt 60
ttttaaatct caaatagtca ggctcatttt ctgcttcaca cagtccttgt tctctcttga 120
ggaacttgga acatgctcct gagctacact ggaaaatatc gaagtgccct tctccataat 180
tagccagcat ccctgccatc tggaccctct catacctcac agggatttcc ttgtccacat 240
ggaactgaga ctgatccaag agtccagctc ctgctgactg aactctgcca tctgttccgm 300
agcttgcctt acctgctcct gtccaaccag gcacccctct gtgggcctgt gctttagtcc 360
tttttcactc tagaccctgg tactactgag gtggcttgcg tggtcctaaa tttgctagtc 420
tcttattttg ataaaggctg caagtagcaa atatccttat ccttgaaaat aagggcatct 480
aggcccctgg cttcttttta tgtttattta tgcatgtact atagaaaact tggaaaccat 540
acttacagag aagaaaataa gaatttccat ccaaggcttt tttaaagggc caagcactg 599
<210> 152
<211> 599
<212> DNA
<213> Homo sapiens
<400> 152
tcgatcaaag taatgagaat gaattacagt gagcccttaa tgacaagaga aatctagctt 60
cttagtagtt atatgaattt cagcaaacct acttggcttt gctgagtctg tttcctaaat 120
actaaaaaaa ggtggattat cgtcctgccc ggggagctgt tgctaggatt aactgagaag 180
cagtgtacac aaaagtccca tgcatagcac ttggcataag gatggtgctt aataaatatt 240
agacctgact cttggtagtc atagctcttc cctgctgcac caggaaggca tagcacctcy 300
agctggttca gaaagcagaa aggaacctgg gcaggggccc gttactgggc ctagagcttc 360
ctgtacacct gacacattcc cctcctctgt ttttaccatg tggagactaa caggatctcc 420
tcccttaacc cattttcacc tatttgcctc tccctctccc cttgtctcaa taatctcagc 480
tgcctagatg gtatttttta gtacatgtga cactattttc aacataacat acatttgcaa 540
agcatctgct atgttctaaa gatggacccc aggtcctcct ctccattcct atcatccag 599
<210> 153
<211> 599
<212> DNA
<213> Homo sapiens
<400> 153
gaggggcctg gggtctctgt gtttaagaca gcactcccca gcgccagccc tggcagagga 60
agagtggagg tatggggagg gaggcctcaa acagaatcta gagatcatat tctagcccca 120
acctggccac tgaatggtat ttgctcccct ctgtcacttc ccctctgagc ctccagttcc 180
tcaactgaaa ctccgaggcc caagctaagt gagcctgcag gttgtttcag ctgtacaaat 240
ctgcatgtgg ttcaccgtga gcctaaccag caataggaat actaattgta tttcatgccs 300
ttactcccag ttaccctctg aaggagtagg taagggtttg ggctagtaga aaatgtcaga 360
gctatgttta ggctgatgga attgaaaagg atagaccagt agcatggggc cagatgagtg 420
ctgcactttc agtgaaggag gtgtcttcca gaaattgcca caggtatata cataagttgg 480
ccagactagt cagtcatcta gtagcattac agatgcaggt tagtacatac atctgccatt 540
gatggccatt tactgagagg aatttagtct tcaacttccc tgaaaaataa cctataatc 599
<210> 154
<211> 599
<212> DNA
<213> Homo sapiens
<400> 154
tggtagaata aaagaataaa ataaaacaaa ataaaaataa aaaaataaaa gaataactaa 60
ggaaaagtgg ttaacaccag ggaagctctc tacagaaaat agggactttg gaatgtaatt 120
gccacagagt tgaatattcc tccttagaac agagcttggt gggggattta agttggttca 180
cttttctgaa ggattagtat gagagatccc catgggaaat caagtgaatc caagattaat 240
ctgctttctg aatgtaaaga ctttggatgg aaaattaggc tgcccgtgtg tgtgtgtgtr 300
tgtgtgtgtg tagactgtct tggggtcaat tgctgggatg ggtagggaca tatttcaaaa 360
tgagcaggga ccacagagtg aggaaacatg ttcaaattct ggctctgcca ttaccttcct 420
gtgccatctg gcaggtgggg ccagtaatca atcatctttg ggtttccagt ttcctgattc 480
caagatgagg gggtagaatc cgaagatctc caaggccttg atgagtgcta ccagtctgca 540
aattcccaag ccaagttctt caatgaatca aatttcctcc agtagccatt tctaccaaa 599
<210> 155
<211> 599
<212> DNA
<213> Homo sapiens
<400> 155
tgtttttatt tctcccctgg ttccctgggg ctttacttct taatgtggtc actttgaaca 60
tcattggcat caattcacaa cagggaaaca tctgtgagaa gaaacacacc aagcggggaa 120
tctttctgga acaaggatgc agcaacacag aaattagcct gatcctgttg ccttaagctg 180
cattcatgta gtaatccagg aaatgcagtc tcttttttct gtgattggcc agacaaatcc 240
tccttctgaa gaaacttaga tttcagcctc cccgaaccaa aagaaaaaaa agaattgggy 300
aaaaacatca tagtggagca tctatcaaca aaatatgtgc acggagaggt ttcaaaatca 360
tcttgaagac tcacaagaat tgtctttcca aaagcagtaa ggagtagaag tgtacaactg 420
attcaactaa ggacagggcc atcagctctg gatgccaaaa tcttcaccac tcacagacca 480
gcaagggcag gtcttcccac tcggcatccc tagatcctga atatggccca gaggtcttta 540
gcttcccgtt gcagcttttt ggaagccgga ctctctcctc tggctgtccc tgatcctcc 599
<210> 156
<211> 599
<212> DNA
<213> Homo sapiens
<400> 156
ttagggtaaa taataccaga aaagcaacag gtacaaccca aatcaatcaa gatgtgtgcc 60
agcaccttca gttataaaca ctttcttctt tttgcccctt aatttcagag ctatgaaaat 120
ttccttcctt agaagaaata gttcccaaga cagccccact gtaatatgcc agaagaaatg 180
tcaaaatcgc tactgtggcc aaatcttgtc aaaatggaca cactacaacc atcataccat 240
gttggttctt ttgtaaagca aaggtgacag gtgacaagca ctaagaggca cactgagaar 300
aagtatgggc tttggtttgt gctgcagcag tttgccaagc atgtgaacat gggcaagcta 360
cttaaggttt ctgagttcta aatctctctt gtggaaattg tgcattgtag tatctacatt 420
acagtactgt actgtagact ggaaagaaat attaatatat agtgtctggc acaaactagg 480
gttcaatgaa tggtaatatt attaatattt taattgaatg ctgtatttta aatttaacat 540
taaaatttta tttaaaaatt agctgtgaca gattatattt tccaaaaatg gctgcagca 599
<210> 157
<211> 599
<212> DNA
<213> Homo sapiens
<400> 157
agcctagcag gttgcctact ggttgttatt ttgatttttt ttattagatt tgattaagcc 60
aggccaggcc tttcctggga gcaggaaggt tctggtggaa gacacagaga ggactctggc 120
tgggtccttt ccctcaggag ggccagccaa gtcagagaca gacgccatca tagagaaagc 180
tgacatgcca tcccgggggc acactgaagt gaagggcact gaggaggggg cgatgatttc 240
aaaacagagg gcttcctggg agctagcctc tcagcaggtc tcagcaaggc aggggcgacr 300
gggtaggtat tcctggctcg gagcatcatt ttaggcagca gggcccaccg atcagtatgt 360
cctatcagct gctggtgtct ttttccctcc atgacgcatc gtttccacca actgctaatt 420
atctcatttc cttcagaggc tctgattgtc atctacaccc cctggctgag ttcctctgaa 480
acgtgctagg ggccacctaa gctcctcttc tccagtttgc cctggtcact tgcccagtgg 540
gtggtttccc aggcttccct cttctgctct gtagtgctca gatgaagaaa accatgtct 599
<210> 158
<211> 599
<212> DNA
<213> Homo sapiens
<400> 158
ctctgaatca ccaagcgaga cctattttaa aggtgaccag gtcgtgagat atgatctcag 60
cacggaccct tctcccggat gacaagagag caggtagtta ggcgggtact ccgtgtccgc 120
gcatacccag actccgccca gcgcccgggc aggccacccc gagcccctta actgcgcagg 180
cgctctcact cagaaaggcc gctgggtgcg gggagcgcag aggcggtgca gggcggctgg 240
ctcgcctcgg cgtgcagtgc gcgtgcgtgg agctgggagc taggtcctcg gagtgggccr 300
gagatggcgg cggccgacgg ggctttgccg gaggcggcgg ctttagagca acccgcggag 360
ctgcctgcct cggtgcgggc gagtatcgag cggaagcggc agcgggcact gatgctgcgc 420
caggcccggc tggctgcccg gccctactcg gcgacggcgg ctgcggctac tggaggtttg 480
ggccgcgtcc gcgctttccc cttccctctc cccgcctccc cggtccccag actggctcgt 540
gcaagccgag tcccggggcc cgggggtcgc gtcaactccg ctggcgtatg tgtgcagat 599
<210> 159
<211> 599
<212> DNA
<213> Homo sapiens
<400> 159
atgagtcctc tacgtcagca ctcctcgcca tgcgccgttc ttccgtgagc atcttaacag 60
gtctctgctg gctcttcaga tttcctgttg tttttccaca cctagggagt gtgcaaggag 120
gtgttccagc tcaagggtgg catccacaag tacctggaag agtttcctga tggcttttac 180
aaagggaagt tgtttgtttt tgatgaacgc tatgctctgt cctacaacag tgatgtggtg 240
tcaggtaggt cagcacaggc tcagagccca aactgaaatg aagcacattg tcagttcacy 300
attctagaaa aatgacacag ggaagacagg ccagtgctca ttactgagca ctgaataagc 360
agggaaaata agtacattgt gccaccattt tcccagctgt ggagctgaga gaaccctagc 420
ccaggagtca ggaggcctgg gttgggatcc tggcttcacc attgctagct ggacaagccc 480
attaacatgg ggatcatctc acctgccctg cctgcctgtc tacctgccaa gagctgtact 540
actgggctaa ttcagggctc ttaacctgga attggtacat agatttcagg gattctgtg 599
<210> 160
<211> 599
<212> DNA
<213> Homo sapiens
<400> 160
gcatacattg tttcattgtg cttagcagaa attgcttctt tttttttttt ttaactgaag 60
gtttgtggca accctgcaac aagcaagtct actggcacca tttttccaat ggcatctgct 120
tgcttcttgt ctctgtgtca catactggta atttttacaa taaaacaagc ttttccatta 180
ttaattgctg caatcccata ataaaacttt aaaaaataag aagatgcttt ctatgtatga 240
gcaaagaaag tgtttttttg agatggaatc aactccttgt gaacactgct gaatgacaay 300
gaaggattta gaatatcata gaaacttagc taataaagca gtggcagggt ttgggaagat 360
taattccaac tctgaaagaa gttctactgt gggtaaaatg ctgtatcaaa cagcaagcat 420
cacatgcttc agagaaatct attgtgagag gaaaagtcaa tctaggcaac aaattttatt 480
gttgtctatt tttgaactcc ctgacccaaa tagtgaagga tgtatctaca tatgtatagg 540
tacatatgta tttacagaca tacaagtaca tacatgtaat acacacacac aacacactt 599
<210> 161
<211> 599
<212> DNA
<213> Homo sapiens
<400> 161
acctgacacc acatcactgt tgtaggacag agcatagcgt tcatcaaaaa caaacaactt 60
ccctttgtaa aagccatcag gaaactcttc caggtacttg tggatgccac ccttgagctg 120
gaacacctcc ttgcacactc cctaggtgtg gaaaaacaac aggaaatctg aagagccagc 180
agagacctgt taagatgctc acggaagaac ggcgcatggc gaggagtgct gacgtagagg 240
actcatggcc gctgctatca gtcaggggct cctggctccc actgcgggac actgaggaay 300
tgctgaccaa ggggtcaagg caccaactgg ccagatcttg cctcctaggg ggatgggtga 360
tgacagcagg cagggccttc accctctaga tcctgggaag cccaactatt tttgctgccc 420
cctaaatata ggaagacacc tgttgggaca tgtaatgtta ctgaatttgc tcttctcagg 480
atcaagcaaa aggatcagga aaagggagat gttaactaat ctctcccttt tacatctgat 540
gagtctctat gactgttaag tgtttttcat atcttgagat taaagaccct cagattttg 599
<210> 162
<211> 599
<212> DNA
<213> Homo sapiens
<400> 162
atgcttgtgg agttaaataa attgaatgaa taatactgag taagactact tgcatatctc 60
tttagcactg acaactcata gtccaaagct gcaccctaca accgccttgt ctctgcttgt 120
gtgactttgg tgatggggaa cactccactt gagaacaaac aacccattct attgttgtct 180
agcattggcc attatttatt gtaataataa caataacaat agcaaacact tatatggtac 240
ttactataat actaggcagt ttttaagcat attcaccagt ctcagtttag agatgagacr 300
actaaagcac agagatgcta agcaacttgt tcaagatcat acagctaata agtgacagag 360
ctgggttcag gcaggcacag cccagcccca gcattaatag tctcaaccac caaattataa 420
gtctctaaac tggaacaagt ctccctctta ccctcttact tcctccacca gagattgtcc 480
tgcatgggtt agcacagagc tggaatcaga ccaggttctt gccagtaccc tacgtggcta 540
accaggtggc ttgaaacaga gagggcatct ctgcctcaag cttagtcttg gagttattg 599
<210> 163
<211> 599
<212> DNA
<213> Homo sapiens
<400> 163
attaacggta ttttataaaa ttttcaacta caaccactag tcaacctaaa accttagtgc 60
ataaagaact gaaccacaaa agggtttcat gctgccagca ttttgccttc tggtttcccc 120
tgcagagcac aggtcatcaa tagaacacat ccagttcaaa ggcatggact ccaccgccac 180
acactagaca ccactccggc acttgggaat gatgggccca gtcaggtccg caagcctcct 240
cttcctcact ggaaaggaat ggagataaga tataaggcac ttttccctgt agaccagggr 300
ccagcactgt tgctgagaaa gcactgtgaa acctcgcact aattggtttg ttaacagagt 360
ctgaagtctg ttgttttgaa aggacagtat gtgtgagttg tacaacagcc ctccagtctg 420
tcagtgttca ttgatgaggg tctgtggtag tggagattca ttcatagata tctgctaagt 480
ggctgaccac acagtcccac gttataagtc ggctattttc tttgcttaca gaagctccag 540
ttgaagatct ttactccggt gttcagataa gagttaaaag tttagtcagt cttcttaat 599
<210> 164
<211> 599
<212> DNA
<213> Homo sapiens
<400> 164
tacccacatt ctgtagggtt gttgtgaaga tcaaagatga tggatgtaag atgtgtatct 60
cagagcctgg tccacagtac actctcaaca catgtaacat gtaagatgtt gttattagca 120
tcctcttaga aagtcagagc tgaaagagtt gccccgcaga taaaatgatt gacccacaga 180
agttacagag aaacagtaac tccataagaa taaagacaaa ctagaattgc ctagagagta 240
atgtgaatgg tgaggaaatt caaaagccgc attgaatggg ggtgaatgaa gaaaactggr 300
aattttaacc tggagaagga gagcttagtg gtccatgaga tctgtgcaac agatgtcctg 360
agtgaagcag agaacagagc taagcccaac aaacaggact tacggggagc tgacttctac 420
cggatataag gaagaatgtt ctcattgcct aagaatggaa gtgatgatgt tggtaaggag 480
tgtgtccccc atcatgagag ggactcaatc agaactggaa gagcacgtag tggaagcgat 540
gaagaaggaa ggtgagcgtg gtagagggtg tgaactttag ggaccttgga ggtccctca 599
<210> 165
<211> 599
<212> DNA
<213> Homo sapiens
<400> 165
actgtactat ttcttataac tgcttgtgaa tctactatga tgtcaaaata aaacttttaa 60
ttaaaaagaa aaaagcaaaa ataacgattt gttgtttatc tgaaagtcaa attaaactgg 120
gcatcctgta ttttatcagg catctctggg agcttgttgg agatgcagat tccctggccc 180
cacttcagac ccactacatc agaatctgtg ttgtaacact aaagtatgag aagctctgat 240
tagtggctcc tgggtgtgtt agtccatttt gcattgctat ataggaatat gtgaggctgr 300
gtatttacaa agaaaagacg tttgtttggc tcacagttct gcaggaggca aaagaagcct 360
ggcaccagca tctgcttctg gtaaggactg caggggagct tccaatcatg cagacagtga 420
aggggggatc aggtgtgccg caggccacgg ggaggtgtcc cagactgttt tcaacaatca 480
gatctcaggt gaactcatta tcacagggag ggcatcaagc cattcatgag ctgcccccat 540
gacccaaaca cctcccatga ggccccacct ccaacactgg ggatcacatt tccacatga 599
<210> 166
<211> 599
<212> DNA
<213> Homo sapiens
<400> 166
agctgtattc attcaaaagc atagtctggg gtcaaaatcc tacacattcc aggagctcct 60
gttattggta atgactgcag atgctgagaa tcaggctttg tgatctgtgc tgtcgatcta 120
agagggcagg gacagctagt agaaaaatgt ccaatagcac tagtagttaa aacaaaaagc 180
acataaaaca acaataaagt ctatgattgg catatatttt ctgaaatgaa aaatctctat 240
gctggtggtg atgacataaa actgaaaact acacaattgt ttcaaaggaa aggtaaagcr 300
aattttgatt acataaaata tgacgtcttc tgcatccaat agtggaaaat gtggaaacta 360
tacaggaaca tggaaacttg cttatgatgt gttctgctag aagctgcaag acactaaatt 420
gcatgtacag gccaaataca actgcccaca gccatatgcc tatgaaaaag atactagaaa 480
ggatatcagg gtgttttcct tctttcatcc cctccatcct ttgcatttac agatgaggaa 540
actgagacca atgggctgtt cctgctgttg agaacctgtc cctacagttt ccgtgtggc 599
<210> 167
<211> 599
<212> DNA
<213> Homo sapiens
<400> 167
taagtatgaa atgacaaatg agagtgagcg tctgaacaga atcagtacag cgtgtgaggg 60
aggcacttgg ggtagggctg ggggagacca gggaagagct atggagaaga gcctaggagc 120
agaagagtag cagtgagaaa gtgcggagaa ggtccagggc ttgggagcgg caggaggagc 180
ggttccgggc tggggagggc aggcccctct gaacggagtg gcctggcagg cttgctatct 240
gctgatggga ggagcctgga gggcaagctc aggtgtgccc tcctaactca ggtgtgacay 300
gggtgagatg catcactcat gtattcacct aactgctcac taagccagtg cacattattg 360
aactcctact gtatactagg atgaacagga gccagtcctt gcctttggga ggcccaggag 420
gtgatgagga ggacagacga gaaacatgta tttttttttt aaccttaaaa tcttttatca 480
cttcaacatg tagatttcaa cattaaaagc gtccctgctg ggcaacaagc agagtgcaca 540
ggttcctggc agggctaagt tcttggcgca tagcctacag ggttgtaggt cagaggctg 599
<210> 168
<211> 599
<212> DNA
<213> Homo sapiens
<400> 168
gagctgggag ctaggtcctc ggagtgggcc agagatggcg gcggccgacg gggctttgcc 60
ggaggcggcg gctttagagc aacccgcgga gctgcctgcc tcggtgcggg cgagtatcga 120
gcggaagcgg cagcgggcac tgatgctgcg ccaggcccgg ctggctgccc ggccctactc 180
ggcgacggcg gctgcggcta ctggaggttt gggccgcgtc cgcgctttcc ccttccctct 240
ccccgcctcc ccggtcccca gactggctcg tgcaagccga gtcccggggc ccgggggtcs 300
cgtcaactcc gctggcgtat gtgtgcagat tctccccgag tcggagaggg aatccgccca 360
gccagccgcc ttgtcaaagc gtcctgtcca cgaccacaga gcgttcctct gtcgcacgcg 420
ggcctcctga cccccagccc cgggccttct tcgctgcacc tcggctgctg gcagcttcga 480
tttttcgttt agggatgcag ccgccccggc cgggaggtgt cagccactgc caggtgtcag 540
ggcctcagct gtcccggaaa gaggagttag actagttctt gattctggcc tctatacct 599
<210> 169
<211> 599
<212> DNA
<213> Homo sapiens
<400> 169
gttccagttg ttccacatcc tcatttcaca tttgacacag ttggtctttc tcactttagc 60
cattttaatg ggtgaattgt agtatctcat tgtggttgga aaaatacttt aaatcaaacc 120
aaaatacaga atgaaaatct taccttatca gctcatcagg gttaaagcag cttatatcag 180
ggagccaagc agacacgtca tggctatgtg gaaggcactc ttttaaaggg ttcttttcat 240
ctgcagacga aagactcttt gaggtgctca atgtcacagc cagttgcttt aaaatagaak 300
ctgtctggtg ataaatttca tcagcatgtt gtgttgccac atgtctatgg atgctggttt 360
ggtctgtgaa tagctgccga cagcatttcc acaatttttc tttacattca aaactccttt 420
ttgttggaac ttctttggtt ttgacaaaaa gggcaaaggc ctgcaattag atttcaaatg 480
ctaacactgt taaataacct taggtttatg gctaatagaa gtctcactaa gattctttag 540
attatctttc cacaggggct tctagtttta tgttccatta tgttatacaa ttctctgag 599
<210> 170
<211> 599
<212> DNA
<213> Homo sapiens
<400> 170
cttaaccaag aaacaaataa tagcaatggt ggtgcaccac tgtaccccag gttctagtca 60
tgtgtttttt aggacgattt ctgtctccac gatggtggaa acagtgggga actactgctg 120
gaaaaagccc taatagcaga aataaacatt gagttgtacg agtctgatca tgttttctgt 180
actcttgggg cctctattgt gggacttaac attagtctag atagcttttt aaatgctgga 240
ttaaaatgga aaagagctgt tttcatggtt gactatctga ttgttgatca aagaaggcay 300
tgatgtttat tttaagtagt gctaacattt actgagcatt taccaaccag gtgccaggca 360
tgcacctaag tgccttagga gtatgttcat ttagtcccag gcttgcttcc atgctgcttt 420
cagacttcta aggaaaggaa ggtgaagtct cacatcaccg caggcatctg catcaacttt 480
agtgaaattt tcctgtagct tgtcaaaaga attattgggt ctatgcatta ttttttgaca 540
aaaacaaatt ccagttagtt aaaataacct gatattttca aattgtttga catgacatt 599
<210> 171
<211> 599
<212> DNA
<213> Homo sapiens
<400> 171
tcatcctcta ctcctccctc atcccggatg acagggaatg tatccagaca accacccagg 60
cccatgcaga caccctccac caacaagatg ctgcccataa ccttataggg accctagctg 120
tccccagaac tgaccccaat tgggattatg aagcagtttc ctcagacaga cagaaacgaa 180
gctatatgat atcatgcctc ctagctggca tggataaagc tgcccttaag gctgtaaact 240
ctgaaaagat aaaagaaatc actcaaggcc ccaatgaaaa ccctgctctt ttcttctccs 300
gcatttcaga ggccataact aattatacca ccttaagccc tgataccaat gggggcagaa 360
tctacctacc catttacact tcatttccca gtcagccccc aacgtctgaa agaaacttaa 420
aaaactagaa gatggccctc aaacctccca aagagactta atcaaagtgg cctttatggt 480
ctttaatgat gatggctaga atttaaaaaa agaacaaaag aaagaaaaga aaagaagtat 540
tggcaaagat gtaaaaaaaa ttggaaccct catacattat tggtgggaat gtaaactag 599
<210> 172
<211> 599
<212> DNA
<213> Homo sapiens
<400> 172
gtacctactc tatgggtagg ttctcaatga ctactgctga aggaattcaa actgaaatgg 60
aagaagtttt ctcatggatc aaaagtctta gctgaagact tcatgttttc cattaactgc 120
agtcactcac atctatttaa gcttctgcta tcaaaaatgg aaaagcagcc agtgacttct 180
gctttaaccg aggctgtctt gtattttttg taaacttttt tctattttta aatttttatc 240
tagagaaagg gtcttgctct gtcatccagg ctggagtgca gtggcacgat tgtagctcay 300
taacttcaaa ctcatgggct ctaacaatcc tcctgcccta gcctctcaag tagctcagac 360
tacaagtgca agcccagcta atttttaaga ttttttgtag agatggggtc tcgttatgtt 420
gctatgtagc tggtctcaaa ctcctggcct caagcagtcc tcctgctgcc acctctcaaa 480
atgttgggat tacaggcagg gcgcagtggc tcatgcctgt aatcccagca ctttgggagg 540
cggaggcagg tagatcattt gaggtcagga gttcaagacc agcctggcca acatggtga 599
<210> 173
<211> 599
<212> DNA
<213> Homo sapiens
<400> 173
gatcttccaa ctttagcacc atcttcacat ttaatggttg gcattttact gtaagcagga 60
gccctctcct ctctcctgtt tcttatctac ttattattga tctatttatt cttgcacaga 120
ctcatagatt cctatttttc aatggtttat tttctttatt ttcttaatta tgttgatgct 180
caaattgtcc tagatttggc cagtggaagc ctcttcaagt tgatttcctt gtccttttga 240
caggtcccca tcactttttt gagcactgcc ttactttcca gcacaaggta tttaatgcty 300
attttgtaaa ggaaaagtgt gtgattagaa caaaaaaagg ggccctcaca gatcaacaaa 360
gatggttgtg cattggcaat tataggtata attaagtgca aattattttg agcatataac 420
acagaaagaa ataactgcac agaaaaaaga aaggaccata ataaaagact aaaagaaact 480
cttggaatta tgaaaagttt ttttcatatt gttctttttt tctgtatatt caaaatttta 540
tgtaatgaga atgtattagt tttataatga gaaaaattac ataaaaggtt tttcctttt 599
<210> 174
<211> 599
<212> DNA
<213> Homo sapiens
<400> 174
gatcgtgaag aggtgttttc aggcatcttt attggtgttt tggacatatt tatttatcct 60
gttgtaatgt ctcagagctc gtccactcca ttattcttaa aaaggaaaaa ccttttatgt 120
aatttttctc attataaaac taatacattc tcattacata aaattttgaa tatacagaaa 180
aaaagaacaa tatgaaaaaa acttttcata attccaagag tttcttttag tcttttatta 240
tggtcctttc ttttttctgt gcagttattt ctttctgtgt tatatgctca aaataatttr 300
cacttaatta tacctataat tgccaatgca caaccatctt tgttgatctg tgagggcccc 360
tttttttgtt ctaatcacac acttttcctt tacaaaataa gcattaaata ccttgtgctg 420
gaaagtaagg cagtgctcaa aaaagtgatg gggacctgtc aaaaggacaa ggaaatcaac 480
ttgaagaggc ttccactggc caaatctagg acaatttgag catcaacata attaagaaaa 540
taaagaaaat aaaccattga aaaataggaa tctatgagtc tgtgcaagaa taaatagat 599
<210> 175
<211> 599
<212> DNA
<213> Homo sapiens
<400> 175
aacaccaata aagatgcctg aaaacacctc ttcacgatca tcagtcacac tatcaaaaac 60
tatcagtcct atggctgaac cagggttgga aaatgtgggt ttctatatct tattctatgg 120
tgtacctctt gggttacttt gtctaatcac ttcatcaatt tgggtcttaa cttcctcacc 180
tgaaaaagag gataataact tcttgctata ttagcaatgt aatgagactc aaatgaaacc 240
atgtatatga aaactccttt aaaatgctac aaaagtaaat ggttttataa aagagcttty 300
ttaaaaatgg ctgctttatt gaaacgtttt aacagtttct tttttaaaaa agcagccaat 360
ttggaggacc tacgcatttg gatggtgaag ccctttggca gtctgagtaa gcccatttgg 420
gttctgtgtt gcagcctggg caactacctc tccatggctg catcttaatt ggggtcccca 480
gaagaaaccc tggaggaaga ttcatgtgaa agtgatgtat taggaagtgc tcccagaaaa 540
aatggtaagg cagtggggca ccgtatcaca caaggcactc ggaggagaac tttggctta 599
<210> 176
<211> 599
<212> DNA
<213> Homo sapiens
<400> 176
ctgaccccag caaaaagcaa tatttaacag cctgacagga gaaatgccca aaagagtata 60
aatggcagct gtattcattc aaaagcatag tctggggtca aaatcctaca cattccagga 120
gctcctgtta ttggtaatga ctgcagatgc tgagaatcag gctttgtgat ctgtgctgtc 180
gatctaagag ggcagggaca gctagtagaa aaatgtccaa tagcactagt agttaaaaca 240
aaaagcacat aaaacaacaa taaagtctat gattggcata tattttctga aatgaaaaaw 300
ctctatgctg gtggtgatga cataaaactg aaaactacac aattgtttca aaggaaaggt 360
aaagcaaatt ttgattacat aaaatatgac gtcttctgca tccaatagtg gaaaatgtgg 420
aaactataca ggaacatgga aacttgctta tgatgtgttc tgctagaagc tgcaagacac 480
taaattgcat gtacaggcca aatacaactg cccacagcca tatgcctatg aaaaagatac 540
tagaaaggat atcagggtgt tttccttctt tcatcccctc catcctttgc atttacaga 599
<210> 177
<211> 599
<212> DNA
<213> Homo sapiens
<400> 177
cttcacatca ttttagagcc ctacagtcat agaatcatcc acctctctca tttgtgatat 60
agcttaagtg attaggaaca caagttccga tttctgactc ctgggttccc atcctagctc 120
tgtcatttgc tgtgggattt tggggaaatt actgaatatc gtagaatctc agtttttgtt 180
ttttttttca tttgaaaact caaggatagt atctacctta tagggttgaa atagggatta 240
aacaaaatac tctgtaaaaa cacaaaatac aggagctctc aagatttgaa gggcacttas 300
agactatata atcccatctc tctaacttag cactgatgag tctcaatctg attttaggtc 360
atcagggaca aatcattttt aatggttgga aaattatttt tattgtagta ggaactacta 420
gcacataaat ctcattttat ttcacagata cagcttagca aaaatttaat aagcaagttg 480
atataagaaa aacgttgaat cagtaatact acaagttgtg aatcaggttc actgtgtact 540
ggttaccaac ttgtctgagt gggatgagat agaacgccca cacacaacaa gttacatga 599
<210> 178
<211> 599
<212> DNA
<213> Homo sapiens
<400> 178
tactttatat ggtgaacaac gtgattcagt taaagatctt gagataagga acttatcctg 60
tattacctgg gtaggacctg catcaatcac atgtattttt taaaagaggg acgtttgaca 120
cagacagaag acacatagaa gagaaggtga tatgaagaca gaggcagaga ttggagtgat 180
gcagccgcaa gcaacggaat actggcagca accagaatct ggaagaggca aggaatggat 240
tctcctgctg gagcctccgg aggaagtaca gccctgctgg caccttgatt tgggacttcy 300
gtcctccaga aaagagagaa tacatttctg tagtttcaag ccaccaagtt tgtggtaaag 360
ttttttacag catccacagg aaactaatac cagtggtaaa gtgtacttta cctccccgtt 420
tgtcatagtt gctcttgatg gctggaatgg tctgtttggg gctttgatat ggtttggctc 480
tgtgtcctca cccaaatctc atctccaatt gtaatcccca catgtcaaag gcgggatctg 540
atgggagacg actggattgt ggcggcggat ttccccctta ctattctcgt gacagtgag 599
<210> 179
<211> 599
<212> DNA
<213> Homo sapiens
<400> 179
tgaagtaagt ccaagttagg tctatacctc catgccctct caccacttgc ctgctccttt 60
cctggcccca ccctcaccag tcttgcaagt ttcttcacca ctcatgaagg aggggaacac 120
ctgtgagggt gtcacaagtc atgctaccaa gaaccagaac catacagggc ttgactccat 180
ccctgagccc ctgggtgaca gtttcccatg gctctgacaa ggtgctagaa gtgagctggc 240
atatgctctg ccttctcaga caggctactg gtctggtctg tcctggtgtc tgtcagacak 300
gagcccagcc ttatgtcacc cagttcctga actgacgact ccccaggatg atctatgtcc 360
ctgatagcac aacctctaga ccactgggtc tgaggaccag agtggtggag ccatgggatg 420
ctggagcagg aaagtcatgt agggactggg aacttgttct aaccctccca ttgttggggg 480
gatgccttag acctgggagg acagggtctt gtccaaggtc acacagtgca acaggagtgg 540
aatggggcat gaactcaggg ttttttcttt tatttccagt tcagcatttt tgcctcatt 599
<210> 180
<211> 599
<212> DNA
<213> Homo sapiens
<400> 180
ctacaggtgc ccgccaccac gcccggctaa tttttcatat ttttagtaga gacggggttt 60
caccgtgtta gccaggatgg tctcaatctc ctgaccttgt gacctgcctg cctcggcctt 120
ccaaagtgct gggattacag gcatgaacca tcgcacccag ccctacctga tcaactcttt 180
agggtatgga tataaaacaa gattcatggc acaagccaat gccaactcat tggaagtggt 240
atataatttt aaactttgaa agaacataaa agacacaaac atatgcatgt gtgtaatatr 300
atcagagaat attttaggaa aataaaaacc atcgataacc ctacatgcct agataatcct 360
tactaacatt ttggtataca caaccttcca tgtttataca tgcacttctg gttttgtcat 420
gaacatgcat tctatattct ccaaatatct actgagggtc tactacatgc taagctctgt 480
tccagcactg agaatacatc aattaagacc aaaattcctg tcctcatgaa gcttataaat 540
gaagattata ctttcagata gtaataaatt ctttgaaaag cagaaaggga tagaacgtg 599
<210> 181
<211> 599
<212> DNA
<213> Homo sapiens
<400> 181
gtagtatctc attgtggttg gaaaaatact ttaaatcaaa ccaaaataca gaatgaaaat 60
cttaccttat cagctcatca gggttaaagc agcttatatc agggagccaa gcagacacgt 120
catggctatg tggaaggcac tcttttaaag ggttcttttc atctgcagac gaaagactct 180
ttgaggtgct caatgtcaca gccagttgct ttaaaataga agctgtctgg tgataaattt 240
catcagcatg ttgtgttgcc acatgtctat ggatgctggt ttggtctgtg aatagctgcy 300
gacagcattt ccacaatttt tctttacatt caaaactcct ttttgttgga acttctttgg 360
ttttgacaaa aagggcaaag gcctgcaatt agatttcaaa tgctaacact gttaaataac 420
cttaggttta tggctaatag aagtctcact aagattcttt agattatctt tccacagggg 480
cttctagttt tatgttccat tatgttatac aattctctga gaagtaacac ttctcttatt 540
agtaagcttt agaagagact attagagaaa ttaaaactag gctttatatt gaggaggtt 599
<210> 182
<211> 599
<212> DNA
<213> Homo sapiens
<400> 182
cttaactaaa gaaaaaaata gaagtgaaag gatttgttat tttgagagag tatagtttat 60
ttcagaagtg atggttgcct gttttaagtc tgcgggctca aggcatgtta tctttcaagt 120
tgttcaatat caaaatagat gagccaaaaa gaagggaaca gtgtgcttaa ggtttaaaaa 180
cgtaatgttg aagttgttgg ttttagttac tttacttttc tattttacag ggttggtttt 240
tgttttccat tttgtgggtc taaaatttct tgtaaggcta taagatgtac agtgtacccr 300
tataaaatta ggattgactt atagagggga aatttatttg gtttattaag atcctttcag 360
atggatttta tacctgcttc tctatactag ccaagtctgt ctgagtgaag tggtaatgtt 420
atctttaatt tacattttaa aacttttaca tagttaaatt ttaataaaaa atctgttctt 480
gccttgggaa ctaccataga tacgttttct tcagggtaca ttgagcgaat tccccaaatt 540
gtattcgtat tgttttattt catttccctg ttcccttacc caggttgtct tatgagttc 599
<210> 183
<211> 599
<212> DNA
<213> Homo sapiens
<400> 183
tgtgtacatc acatcaatgt gagggggtgc tggaagttga aacagctctg caaagatcac 60
ctacaaaaga atcatgagtc acaattcaat ccaactgcta tctttgcact tctattagaa 120
agaccttaac attctaaatc tgagctctaa ctccatggca ttcatatgaa aatggaatta 180
ctttttaata tttaaaatta tgctctttca aacacaaaaa tctaaaactg aaaactgtaa 240
tgaaaatttc ttctctctat aattcgatca aataaaaaca cacgacacta atgcttatty 300
gatctacact cctcccagag aactatgcaa ttaaattcca actttgaaag caccacagct 360
gagccaggat gtacagcttt ttgaggggct caaaagatcc atgacagttt cattcctata 420
aataacaaga actcttaggc tgggcgcagt ggctcacgcc tgtaatccca gcactttggg 480
aggctgaggc aggcagatta cttgaggtca ggagttcaag accagcctgg ccaacacggt 540
gaaactctgt ctctacaaaa aatacaaaaa ttagccaggt gtggtggtgg gcacctata 599
<210> 184
<211> 599
<212> DNA
<213> Homo sapiens
<400> 184
cggttaaaaa atatttacag ctattgagct tgggctagaa tctagaagga gaaaaggaag 60
tggagctaga aagggctttc cagactgggg taatggcaaa gtcaagaaca gggagtatgg 120
aaaaaataaa aaagtacatg gacctggcag aaatagaggt ccatgtgggg agaagtgaaa 180
aataacaaag taggaacaat ggttatgaag gccttgaatg ttaggcggag ttattcctat 240
ggggcaaaaa gaaagcttaa tcttcaacaa aagcctgagc tttctgatag caaagactay 300
accttatcat tctcggaacc agtacaggac aaaactcaaa acccagcact tctaagtact 360
gcataaacct ttgatctgcc aaaaagcaca gtggctaaca gcatggccac tcagttagtg 420
cacctacgcc tgaatttggg ctccaccact caaaagcaat ctcattctag cttgacctct 480
tggaagtcat ttcctcattg tagttttgat aatcatatct attcttcaga gttgacataa 540
tgaaatagga aatgtaccag gaccgacaca gttcatttca aggaaaacag gtacagtca 599
<210> 185
<211> 599
<212> DNA
<213> Homo sapiens
<400> 185
aaattatttt aagatatcaa aaaaaacctt gacatgagga aaaaatgacc cttaggcctg 60
cagggcacag aactgctgga acacggccaa gatatgaggg tctaattcag cagtgaagag 120
aaggttctcc agggtcacca tgtactgctg gattatttgg tgatgctgtg gacacacaaa 180
agggggtagt taggtcagga aaaagcatat aagcaatctt gtggaacatt tccttcagca 240
gcccacccat gctgcagaat gatgaaaaga ggaaggggaa aaaaaagtgc tgataggaay 300
aatggacccc tgaaaatccc caacattaaa aaaataaaaa gggaaatgaa aaaaatggat 360
gctcaatagc tttttaaaaa atccagttct taccaacttc tatgtaaaca gaattcatga 420
ttcaaggcag tggcagcagt gcctgcttgc tcctagtact attacggact aggctcagct 480
agctctctcc ccagtcaggg cataatacat tgtaactttt taaaaagcag ccagacggac 540
tgacaggaag ataaacagtc agaaaacgaa atactcttgt ctatgtgttc ctctataag 599
<210> 186
<211> 599
<212> DNA
<213> Homo sapiens
<400> 186
atatttctga atcccagcca tgtacaaggt acttgtatta gtgctacatt agttataaga 60
aactaccaca gacagagtga cttaaaacaa cacacattta ttatcacacg gatctctagt 120
ttattctgac atgggtctca gcaggctaaa atcaaggtgt tggcagggct gtgttccttt 180
ctggaggctc taggcaagaa tccatctcct tgccttttcc agcttctata ggctgcctgc 240
attccttgac tcatgacccc ttcctccatc ttcatagcca gcaatggtgg cttctcacay 300
ggcatcaccc acttcttcca taatcacatg tccctctgac tcttggcttt cctcttctac 360
tttttttgtt tttttgaaat ggagtcttgc tctgccaccc aggctggagt gcagtggcac 420
gatctcagct cagtgtaacc tccacctctc gggttcaagc gattctcctg ccttagcctc 480
ccaagtagct gggattacag gtgcaagcca ccatgcccgg ataatttttg tttttgtttt 540
gttttgtttt ttgagatgga atctcgctct gttgctcagg ttttagtgca gtggtgcaa 599
<210> 187
<211> 599
<212> DNA
<213> Homo sapiens
<400> 187
ctcaagctta gtcttggagt tattgttgcc catcatgggt agagccaagg gaggatgaat 60
atggtccagg gttcacccat tatgtagatg aactctggtc ataatggggt tatggtcttg 120
tggtttcctc ctctcttacc ccaaatggga gttttccttt caattatctt tataacaagt 180
gtggttgcag cttcaaacca caaaccacta atatttttat tggcaagtgc atcctctaat 240
acgtatagtt ctgttgaatg ggtgaaatat ttatcaccag atgcatttgt ttttgtagtk 300
tttataatgc ttggaaaggg gctgagtgtc tctggcctta atcccttctt tggctctact 360
gccactgtcc tggtttagct ccccccaaat tttacctgta tagcctctga actggtctcc 420
cagactccag gctgacccct ctaatccatc ttccacattg gcttacagct ccatctttct 480
aaagtacagc ttttgccatg ccattccttt gctcaaaaat catttattga ctcccagttg 540
cagctaattg taagttccca tcacctggtt cctgtagccc ttcaggaact ttccttcca 599
<210> 188
<211> 599
<212> DNA
<213> Homo sapiens
<400> 188
gaaagggtct ctttctgcat gtgtgggaag cggccttaga tgacctcagg acaatgttca 60
accttcagtg tctatgattt tcatgttagg taggggtaga tcactattga gaagggctca 120
taaaataatc tgatggcctt ggtgtcctac aagctaagtg gaaaccaaca gtgtgacatg 180
gcttctgaaa agagatggtg tgacctgagg tgacaagaac aaaagcaggg cctgaactga 240
gggaggtgtt tgtcccgctg tttggggctg cttaaaccac atctggagct tgtgttcagw 300
tctagacacc accagggaat cagagagcca tctatgtggc caggacgggg agggaagagt 360
taagaaaccc tatcacagga agaaagtgca gattcatgac caggcactgc atctccaaag 420
ggctcctcta gggcagaggg catagatatg gtctgccagg actttatgct ctcacttacc 480
tggacattca cagtggtctg cctgggcagg atttcttctc ccttcagacc atgagaccca 540
ggactgctcc acgtccccca tctctcagaa gctaaagacg gaagcagcaa cagggtgag 599
<210> 189
<211> 599
<212> DNA
<213> Homo sapiens
<400> 189
aataagagta gctgggacta caggcacaca ccaccacacc tggctaattt ttacactatt 60
tttttccaga ggcagggtct ccctgtgttg cccaggctgg tcttgaactc ctgggctcaa 120
gggatcctac cacctcagcg tcccaaaatg ctggaattac aggcatgagt caccgtgcct 180
ggcctgaagt ttttttcaaa ggaaaagaga aattttaaca ggaggaaaaa gaaaaattga 240
gtacaatgta tttgtttgtg taaataaaga catttctata cattttaaag gcaaacaccy 300
gacttgcttt tattaccagc ttggactcca cagcatcctg agtttgctag ccagtagagt 360
ctttggcacc ttcttatctc tgcagtgtgg acctcaggtc agattctcac cctgttgctg 420
cttccgtctt tagcttctga gagatggggg acgtggagca gtcctgggtc tcatggtctg 480
aagggagaag aaatcctgcc caggcagacc actgtgaatg tccaggtaag tgagagcata 540
aagtcctggc agaccatatc tatgccctct gccctagagg agccctttgg agatgcagt 599
<210> 190
<211> 599
<212> DNA
<213> Homo sapiens
<400> 190
gcggcctcgg ttgtcctggc cacaaatgca agaaagcctt tacaccccag gctgcaggag 60
gttccctaag tatgtaggtt attcatacac acgctccttt tttattggaa agttagaaat 120
tgcactacat tgtaccttgg gggtgaaggt gacattaaca aaagcagttt ggagtagtgg 180
aaaggatact ccaaagggga aggcttgcag gatgtgggtt cttgcccttg ccctagccct 240
tgtgctgtgt gacccagaca cagcctgtgt ctggaccccc tcttgtagcc tgagagggty 300
ggaccaggag atctctaagg gacactccag ctgtctatga ttaagattct gggacaaata 360
aatgtcatga ggcagcaggt ggggggactg ggtgggggga catggagtaa atgacctctg 420
gatgccctca ctggggctgg gacttgatga tttgtacaca gtcaagggaa gccacataca 480
ggctaatctt ggcctcacaa aggagtgtgg ttagagttgt tgggtggtgg cgatgttttc 540
ctgcaagcgc acacgatgtt tatcgtcttc gtacaggttg atgctgaagc cacgaagac 599
<210> 191
<211> 599
<212> DNA
<213> Homo sapiens
<400> 191
gattatacag tatttatttt tgtctatatt ttttcactca acagtatatg aatgagattc 60
atgttgttgc atatagctat agttcattca ctcattgaca tatatagtat tcttttgtat 120
aaatatatca caatttactt atccattcta ctgttgatgg acatgggggt tgtttccagg 180
tttcagctat ttcagctgct atgaacattc tttagatgtc ttttggtgaa cataggtata 240
cacttttgtt acctacctgc tcaggagtgc aatttctaga ccataatgtt cagctttagy 300
ggaaaatgct gatagtctcc aaagtggttg cagcagtgta tgaaagttcc agttgctcta 360
catctttacc taaaacatca attttaatat caacacagca tttcattata tggatacacc 420
atacttcatt ttatcagatt cctatagatc agggattctt tgccatagac ctctggcact 480
ctgataaagc ctgaggactc tgtctcagaa tgcgacatag taaaacgtgg gcattatcat 540
taacacacta aatcacacca tccagtagca ggtctaataa ccaagcaatt tcaaaattt 599
<210> 192
<211> 599
<212> DNA
<213> Homo sapiens
<400> 192
tgaatttgta tttaattggt atcacctctg taaggtgcat atccatccct tgctagaaga 60
gtataaatat ataaaataca tattactccc aaaacgaaca ggattttgtt tctgttctgg 120
ccttttacaa gttgtttatt aaaaaacatt agaaattgta aaaaaaagat tagaatcatc 180
caaaagtcat tattaaaggt ttattttgtg tgttttgaac ctgtttgcta tgaatatact 240
taagaataaa ataatgccat gtagggaata tgttttgagc ttagacagta tattatgggy 300
atttttcaat tcatgcatga ctttttatgg ctatgtggtg tttgaataga attttctctc 360
tgcatagtta ttaatggaaa taattcactc tcggtttaaa aaataaactc tgtaagactt 420
gtattatcca aaattattta gtttcatata ataattggtg tgtaaagtag gcagtggttg 480
tatggttagg tatgagatgt ggtagaaaaa acactacagc tgatactctg gggtataagt 540
gaacatgaca atggaatttc ctgaaatata gagctttaac acttcagaac ttttatccc 599
<210> 193
<211> 599
<212> DNA
<213> Homo sapiens
<400> 193
tttctacaca taatgtttac atttaggaga ggaaaaatgt atttccattt ttaatgttaa 60
tgtccatcat agtttgccat ttcaattcag taagtatgta cctctggtaa gggatggaaa 120
taagaaaaat gactacacag tgctgccctc agggggctcg cctgaatcta atgggtgtga 180
agatagatac ttgcacaatt tacaataaaa gaccaatttg taagtattgc tggagaaaga 240
tgactaattc agccccaagg acagaaggct gtatcagctg ttaagaatga aattacaaar 300
gttgaaagat tttattttct gtaaccatag cttgacatac agtaaccaaa tgccatattt 360
ctttaagatt gtttgtttgg gaaattttgc actctacaat tcgtaagatg aacaaacatg 420
tcctgaagat ccagaaagag ctggaagaag ctaaagagaa acttgctagg caacacaaac 480
gggtaagttt tgtgtaaact tgtaagtagt taaagaaaat ataccagaaa ctctggagag 540
gattcagagt tcattatctt gatgatattt cattttttct gagcccaaat taatgcaga 599
<210> 194
<211> 599
<212> DNA
<213> Homo sapiens
<400> 194
agttcactat ctctgggtcg gcctcacgtt tgcacaaggg aagtagcaga agggaagagg 60
acacttgtat ttctgtagga gtctctgggg gaagagggag aggactatag atacttaaca 120
ctttccccgt actgtgagga ggaatggggc agtcattccc aagttaacgg aatacttctc 180
atagtattaa tttagtattt tagccatttt ggagggaagc agtgagtgac ttaacatgat 240
actactattc attatgaaag tattttccag tgttatgcat atttaccata gtagaaggtr 300
aaaaaaagtt gagtttagtg ccctatagga acctttcgca agtttgagta ccagtctcca 360
tgtagacata cctgtataca tatatggata taaacactca gacctgaaat actgtaaggt 420
aaatggtgtc atctcatttt gtagatgtta taaagtgaga catagagaag ttaagtaaca 480
tagctagtag gttgcatagc tggtaaatga ccagagctag gttctgacac aggtctgtca 540
gactccagag acttttctct catgccacac tgtttctaga agtgtgctgt ccaacacag 599
<210> 195
<211> 599
<212> DNA
<213> Homo sapiens
<400> 195
attctgtctg tagtactacc ttaacttctt ctccctttcc agcggtttat catgatcttg 60
accgagcacc tagtacgatg cgaaactgat gggaccagtg tattaacacc atggtataag 120
aactgtatag agaggctgca gcagatcttc ctacaggtat gtggggaact tcgattaggt 180
aataacacta ttctcagcca caaagatttt tcattaaaaa aaatccttgt caaatttgtt 240
aggaggttat atagtacctg ttagaccctt tagttcatgt ccatttgctg ctaccattgs 300
tcatcagaat atttaggctt aaactgattc tgtaccactt agattcctaa ttgccacccc 360
cccaacaacc ccccgcccca cctttttttt gagatggcat ctcactctgt tgcccaggct 420
ggagttcagt gacacgatct cagctcactg caacctccac ctcctaggtt taagcaattc 480
ttctgcctca gcctcccata ttgctgggat tacaggcacc cgtcactact cctgcctgat 540
ttttgtattt ttagtaggga cagagtttca ccatgttggc caggctagtc tcaaactcc 599
<210> 196
<211> 599
<212> DNA
<213> Homo sapiens
<400> 196
ccaatataat tttctttgta aaatgatttt gacacgaagt agcagaaaaa gctccaaaca 60
ttagaatatg accagtgtcc tggcttcaca gttaaactat ctttgctcag tttccctact 120
tgcaaaataa agtgaagtaa aatcaaaact ctgtggttct ttccagctct taacattctg 180
tgattcttat ttttagccct ctcctaaaat aatgctgtca tcttataaga acttcaacag 240
acttgaggtc ttattgcaca agcacttttt ctaagatgaa aacataccag catagtggtr 300
gagttctcta ctttctagtt ttcttgcaaa gcttgacttg atgcttattg acgtagctcc 360
taacaggaac ttaaaaacac tcctttttct taattatttc agctgactcc ttttcctact 420
gtggcattct gttatctgaa gtcaaacgta cctgaatgtg tcctattgtg ttactcaact 480
cacttctgaa tatggttctg ttttgcatac caccaaccca cataaccatt tctgaatctc 540
ttgtttcaca ctgctccagt gacaacttga ttcacaggcc gaactagtga ggtaagaaa 599
<210> 197
<211> 599
<212> DNA
<213> Homo sapiens
<400> 197
gaaactgcaa attccagcta cttttgatgg tactggtctc atcctttcta ctttatagtg 60
gttacctttt attcctttct aaacttgagg cacgctagag tcagacagaa agttcatttg 120
cactgattaa ttcatagtca tgattccata aaggtttcca ggtctacgac atggctgtgg 180
aacggaaggt gcaaaatagc aaaaactgac attaaattaa acttttgatc atggaaagca 240
aggtagaatg aacattcttt aagatttctt aggcagttcc ccaagaactg aactgtattk 300
tagcattgtg tacaacccac catgtttcaa gagttaggta agtgctgaga tttttatctt 360
tgtgacactt ttatttcatg gtactataca attttctttt tctctgtgtg ccatgacata 420
tgccatgaaa gactgaaaaa acttgcttag aatacgaaga gtggtgctaa ggtcctgggg 480
aaacagcaag gcatagcagc agagagaaat cggactttgt tttgggcatg agttagcatt 540
gtttaggatc ctgctcaagt catgggctcg actactccag ctttccctct tcttaattc 599
<210> 198
<211> 599
<212> DNA
<213> Homo sapiens
<400> 198
aaaaacttca ggccaggcac ggtgactcat gcctgtaatt ccagcatttt gggacgctga 60
ggtggtagga tcccttgagc ccaggagttc aagaccagcc tgggcaacac agggagaccc 120
tgcctctgga aaaaaatagt gtaaaaatta gccaggtgtg gtggtgtgtg cctgtagtcc 180
cagctactct tatttgtttt tacaataaga aaaacaacag cacatgtgtg aggcgaagta 240
acctctgctg gtcatcctca gtgctggggg acaacgcaga ggggaggggc agcagtgacs 300
ggctgcagca ggcccagtga ggccgtctcc cactttgtta aagaggagtt agaaatctgg 360
attttaatgt gaaatcttcc agtttctaaa tgtttacacc aatgtttaaa aacacacaca 420
ggcggccagg tgcggtggct cacgcctgta atcccagcac tttgggaggc caaggcaggc 480
agatcacgag gtcaggagtt ggagaccatc ctggccagca tggtgaaacc tcatctctac 540
taaaaataca aaaattagct gctgtggtgg cacgcacctg taatcccaac tacttggga 599
<210> 199
<211> 599
<212> DNA
<213> Homo sapiens
<400> 199
acatggcgag acccccaacc catctctaca aaaaatttaa aaatcagtca ggtgcagtgg 60
tgtacacctg tagtcccagc tactcatgag gttaaggtgg gaagattgct tgagcccagg 120
agttccaggc tgcagtgagc tgtgatcaca ccactgcact ccagcctggg tgacagagct 180
agaccctgtc ttaaaaataa acaaataaat aaaaataaaa taaaataatc cataattcca 240
ttacccagag gtaaacatag ttatcatttt atattgatag tgccagtcct ttattttcas 300
aaaaatgaga ttatacagtt ttatagtctg atttatttat gcattgaatt ggcaatacat 360
atacacagtt aaatcttcag aaggtacaaa acagcataaa gcaaacttgt ccatcccaca 420
gccatgggcc acatatggcc caggatagct ttgaatgcgg cccagcacat attcgtaaac 480
tttctttaaa cattatgaaa attttttgca attttttaaa gctcatcagc tatcattagt 540
gttaatgtat tttatgtgtg gcccaagacg attcttattc ttccagtgtg gcccaggga 599
<210> 200
<211> 599
<212> DNA
<213> Homo sapiens
<400> 200
gagctagacc ctgtcttaaa aataaacaaa taaataaaaa taaaataaaa taatccataa 60
ttccattacc cagaggtaaa catagttatc attttatatt gatagtgcca gtcctttatt 120
ttcagaaaaa tgagattata cagttttata gtctgattta tttatgcatt gaattggcaa 180
tacatataca cagttaaatc ttcagaaggt acaaaacagc ataaagcaaa cttgtccatc 240
ccacagccat gggccacata tggcccagga tagctttgaa tgcggcccag cacatattcr 300
taaactttct ttaaacatta tgaaaatttt ttgcaatttt ttaaagctca tcagctatca 360
ttagtgttaa tgtattttat gtgtggccca agacgattct tattcttcca gtgtggccca 420
gggaagccaa aagattggac acccttgaca tgaagtaaaa aataaatctc tctcccattc 480
tcactctcca gaagcaacca cttctatcaa ttgctcatat atcctcctaa agatatgtca 540
tgtactgaaa agcacatatg tatgatgatc ttgaagggaa taagtgaaag cacactata 599
<210> 201
<211> 599
<212> DNA
<213> Homo sapiens
<400> 201
tctgggccct ctgtttaaca agagtattag catttgtttt tatattcaat aagtgtataa 60
acgaagaaaa caatttaagg taagactttc tgccttccaa gagatggtgg tggtttcaaa 120
tacttggggc ccagaaggaa gaatgaagat gttccttcta aaacgcagag gacaattcag 180
ctgttccgaa tgatggccct gagtgtcagc taaccccctc ctgcagctaa gtccccctgg 240
gtccccctgc aagctcttcc caccccgggt gctgggacca cctcttccct caatcagacr 300
taaatcaaag gaccaagatt aggaaggatg ggtgattttg acctttctat aacagagaaa 360
atccagataa atggtcttct ctgaaccacc aagttttgct tttctttttc tctcaagttg 420
gtaataacat gaacaatgac acattacctt agagcttgaa ctgatggtcg agtagataat 480
ctaatgtggg cctgatgaga ccctttacag atgaggtagt tgagactcag ggggcttcag 540
tgactgggcc aagattccct tttggctggt aagtgacagc ttagaatcca agctgtggt 599
<210> 202
<211> 599
<212> DNA
<213> Homo sapiens
<400> 202
ctttctataa cagagaaaat ccagataaat ggtcttctct gaaccaccaa gttttgcttt 60
tctttttctc tcaagttggt aataacatga acaatgacac attaccttag agcttgaact 120
gatggtcgag tagataatct aatgtgggcc tgatgagacc ctttacagat gaggtagttg 180
agactcaggg ggcttcagtg actgggccaa gattcccttt tggctggtaa gtgacagctt 240
agaatccaag ctgtggtctt tggagtccaa atctctggcc tttcctcatt ctgtgaagay 300
ctgcacccct tctttcaggc aggtataaga caccgtgtaa aatgtcaaac aaaagttcag 360
ctatctttgg ctgtgtggag atggaagata tttcaataca acagaattaa taggcttatt 420
ttgaaatcct tctaattcct cagtcaacta atctgagccc tagctctggg ccctagattg 480
ctgggttttc agctgtggct gacaggtgca tactttctga gcagaaaaca cgcaaggctg 540
ggaagtggca tggttttcat aatagccaca ggtgttccaa tctgcctttc tgcttcacg 599
<210> 203
<211> 599
<212> DNA
<213> Homo sapiens
<400> 203
gacagcttag aatccaagct gtggtctttg gagtccaaat ctctggcctt tcctcattct 60
gtgaagacct gcaccccttc tttcaggcag gtataagaca ccgtgtaaaa tgtcaaacaa 120
aagttcagct atctttggct gtgtggagat ggaagatatt tcaatacaac agaattaata 180
ggcttatttt gaaatccttc taattcctca gtcaactaat ctgagcccta gctctgggcc 240
ctagattgct gggttttcag ctgtggctga caggtgcata ctttctgagc agaaaacacr 300
caaggctggg aagtggcatg gttttcataa tagccacagg tgttccaatc tgcctttctg 360
cttcacgctt tttatacttt accagacagc aaagacatgt tgatgaagac tggtttgccc 420
ttctgaggtt gtacatgact ggaaggattt gttaggtaag ggaacttgca ttttcctgct 480
gtgtttcccc tgggaaaaca ggactctcaa agacagtgcc aaaactttga atctggaagt 540
tctggcctaa agctgagtaa ggaaagtttt aaaaaatgac aacaacaaaa ttagggtga 599
<210> 204
<211> 599
<212> DNA
<213> Homo sapiens
<400> 204
agaaaccctg gaggaagatt catgtgaaag tgatgtatta ggaagtgctc ccagaaaaaa 60
tggtaaggca gtggggcacc gtatcacaca aggcactcgg aggagaactt tggcttaatc 120
ccaccaggga gctctggtga gggtcacacc cgtgagtcgt cctggtcagg ggctgggggc 180
tagagtactt atgcctcagc acccatcaat tactagaaaa agagtgggtg ggggtgggta 240
atctcccagg tacttccagc tctcctgtgt gcggacagaa cagtcgccag cagccctggr 300
ctctatcctc tgacaaagag atgcagatgc tggccacagg taggccccca atggtaaagg 360
aatctaaatg gatatgcact gacaatatca gctcaaagaa ggactaattc cttccaggct 420
ggacgttcag aacacgagaa atgagaacaa gagacacata ggacaggcct ctctggagac 480
ggcccagaga ggttgagtga cctatcaggg tcactcaggt ggcagagtca ggattccagc 540
cctggtgtat ctgactccaa atcccatgtg cccttttctg tgccctactg tctcactac 599
<210> 205
<211> 599
<212> DNA
<213> Homo sapiens
<400> 205
cacttgtaat tcgcagtgcc tcccctgccc actcagggag gtgatgctgg ctggctttag 60
ggacccttca ggtggggcag aacccaggaa ggaagtgggg tagggagact catcgtttag 120
atgggacagc ctcgggccac tcacccccaa gggcagttgg caacctgggg gtcttgcagc 180
tatcagagac aggcttagcc aggccacccc ctggcttctg gctacttccg tgtgcttagg 240
cacctgtcct gctaccctgc cagtggcagg gtgtatctta tccaggagca gctcaactgy 300
atccaagtcc tgggctggag ccagtttctc ccacctgtcc ctgggatgca ggagaacatc 360
ttccagccat ctgcccagag ccagcccgag cagctggcag caggaggagc cggggatgtg 420
tgctgttatc tctctgcgtc ctgagtggaa ttaccaaatg agtgaactct gccaaggcag 480
ggagaggaaa cagaactcaa tgttcttttt cagagttcaa aaatagtcct ttttgagttt 540
tgaggaagat ctagacttaa aaaaaaaaaa aaatcaagtt ccccagtgct aaattcagc 599
<210> 206
<211> 599
<212> DNA
<213> Homo sapiens
<400> 206
tcagcctcct gagtagctgg gattacaggc atgcgccacc aagcccagct aatgttcgta 60
tttttagtag agacggggtt tcgccatgtt ggccaggctg gtctccaact cctggcctca 120
agtgatctac ccgccttggc ctcccaaagt gctgggatta caggcacaag ccaccgtgcc 180
cagctggata cttgtatttt tctaaaatgg catagccttc agttcagatg aggtattctg 240
tttcatgcat gctgaacaaa agaatgtgaa taaaactcct ggaaagcccc atttgctats 300
gagctacaat agtccaacag ccaaagaagt gaattctgag cttaatctaa atccaggtag 360
cttaacagag tcctccacag aggtcagcag atctaggctc aagattaagc tctgccactc 420
acttgcatgt agctgtgaga aagttaattg acttctctga atcttaattt ctttatatga 480
ataaaaaggg aactaaagag caccagaaat gaaaagaact gctgaggaga tactaccaaa 540
atcctaaagc acagagtaca tctgagggct gagggtatac atgagcatgt atctctgca 599
<210> 207
<211> 599
<212> DNA
<213> Homo sapiens
<400> 207
cttttattat tgaattgtaa gtgttcttta tatattctat atatcacagg ctttttaatt 60
tttttcttta tgctttctct attttctaaa ttttctacaa tgactatgag gtaccttgat 120
gagcagaatg cataaccagt atgtaccaac atatataaaa atgtagaaac tgtcctcatc 180
aaatttatga atgacataga actggaaaag atgactaatg tgtcttttga caaaatcaag 240
atccattctt ggaggaatgg agcaatgagt gaaatataaa ttcctcactt cagttaaaam 300
attctgtaag ggtgtgatat ggtttggctg tgtccccatc caaatctcat cttgaactgt 360
agttcccata atccccaggc atcatgggag gaaccagtgg gaggtaattg aatcatgggg 420
acaggtttta cctggctgtt cttgtgctag tgcatacgtc tcatgagatc cgatggtttt 480
ataaagggca gttcccctac acatgctctc ttgcctaccg ccatgtaaga ggtgccaatg 540
ctcctctttc accttctgtc atgactgtga ggcctcccag ccatgtgaaa ctgtgagtc 599
<210> 208
<211> 599
<212> DNA
<213> Homo sapiens
<400> 208
tggcccttcc atttcatatg gccccacact tcagggaatt tacttactag ttagaaaaac 60
aacgaaaaag acacatgagg caattagcag atgataacgg gttacataat tatcagttga 120
attgtatgtt acagagacta acttgttata ggagcttaga gaaaggaaaa taggatctaa 180
aatagacaag aaggtttcat ggaggagcat ggaaagcatg gaagagacta ggccctgaaa 240
tatgatgagg ctgttgagga gggactcaga ctccagagct ggataggacc ttaattgtcr 300
tgtactgtag cattccctaa aatatgttct gtggaacact agttctagag gatgctaaca 360
aggtattgaa aaaaggggta ttaaagacaa atttgggaag cactcagtca aaatgttgtt 420
actgcaagac ttctcagagc ctttaagagg ctttggctgt gattcttaag gagggagatg 480
ctgtctgcag ggtttccaaa cataatttta tagaacagct tcataacata ctttggaaaa 540
tatagtttat ttccattctc tgattttaca gatgaggaaa ccaaggccca gaagtgatg 599
<210> 209
<211> 599
<212> DNA
<213> Homo sapiens
<400> 209
gcagtgtatg aaagttccag ttgctctaca tctttaccta aaacatcaat tttaatatca 60
acacagcatt tcattatatg gatacaccat acttcatttt atcagattcc tatagatcag 120
ggattctttg ccatagacct ctggcactct gataaagcct gaggactctg tctcagaatg 180
cgacatagta aaacgtgggc attatcatta acacactaaa tcacaccatc cagtagcagg 240
tctaataacc aagcaatttc aaaatttcaa aatgagcatc aacataaaaa tatgtttaty 300
ggcctttgtg ctgcttctcc cacacaaaat cattttcttt gtttctacat ttattggcaa 360
aagtcaatgc atattcttga cttttgccaa cttttaatgg cccatatata tttaaatttg 420
tatgtaagca ctcttcctgt gttatggata tgaaccatct ctgtgaaatg ttacaattgt 480
tttcatttgt cattagcttt gccattttgt ggtctttaga aagaattgat gccctgtgtt 540
cagtgcgatg acaaagattg gctaaataag tgataaaggg aatagtgaag gttgtttta 599
<210> 210
<211> 599
<212> DNA
<213> Homo sapiens
<400> 210
caggtgattc cagtgtgcag ccaaattggg aatgatggat acaaagtgtc ttccctggcc 60
cagagcatgt gctcagtgag aggggtggtg ttgccatgcg tctgattatt accgccacac 120
atccagcttc tatcctgttt cccccagcag tgattgtcac agctgtgtca tcactggtgt 180
cctggccttg gcctcttcct actctccacc tcccaacatg cagcacagag cagctggaaa 240
ggtctttcct gaaatgccaa cctgaccttc ctccctcact ggcctgccac tctctgaacy 300
tcgaggcttt cccacctgca ttcctctgcc tgtaatgttc tatagccctt ctcttaactt 360
gaccaacact tactcctcct ttgcatccca agttcctctt ttatgctgtc ttaggactga 420
actttttcct ctaccacact cagcataccc tgtgctggtt tttcattgtg tgggaacttg 480
cttggctcct ctctccccca gcacactttc agctccatga gcggagaccc agtctttctt 540
attctccact gtccccacca gagcctagca cacagtgctg gggtgggcct cattacatg 599
<210> 211
<211> 599
<212> DNA
<213> Homo sapiens
<400> 211
aaaaaaaaag actaatttac atcaatcgtt gttatgcaac agctattgcc atttaatgga 60
gaaagtgacc accatttccc ctgcattatt tctaccatat aatcagttcc taataaccta 120
ttattgtcct cccataaaaa tctctgcatc ctaatgtctt ggcctgctca tttcattgtt 180
ggtagagcct ttctttccta taacctacaa taccctcttg tcagaaaagc atcctgaaca 240
caataagtat gatgactgac ataataattt tacattatac tctacccctg ctccaggcty 300
tctaattcag aaaatagaat attgttaata tcactccatc aggctagaag agaccttggg 360
gaatgtctta gtgcttctct atcatttgag tttgaagata cttttttaac agctataaat 420
tccacagtcc ttgcaacata caaagtagat agacttttca gtaaacactg agaaatttta 480
tgtccaaaaa atgaccaaaa attcagtaac atcttaaaat gaatttgcat tttatttgtc 540
acgcagcttg acatacattt gaaaagtagt catatatgca tatatacaca cacacatac 599
<210> 212
<211> 599
<212> DNA
<213> Homo sapiens
<400> 212
cctgaagtgt ggggccatat gaaatggaag ggccatatct gtatagcaca gtgtagttca 60
caactgctta tactatcacc gtcctatata actcattctg cagtactggg aggtaggcaa 120
ggcaggcatt attattccaa ttttagaggt gaggaaatga aggtacagaa aattttagtg 180
actagctcaa gtgtgacttc tacttcaact tgctttcttg ctcctttcca ataagtaaaa 240
gggaatgtgg cactgagtag taatgacaaa aattgatcaa atttggacta cagttgaccy 300
gtgagcaacg cgggtttgaa ctgtgcaggt ccacttactt gtagatcttt ttgtgcctct 360
agcactcatg cagcaacaag accaatccct ctttctcctc agcctactca atgtgaaggt 420
gacaaagatg aagaccttta tgacgaacca tttaacataa agaatagtaa atatgtatta 480
cgattttctt tttttctttt ttttttgtag ggcagggtct tactatgttg cccagactgg 540
tcttgaactc ctggcctaat gtgatcttcc tgccttggcc ctccacaatg ctgggatta 599
<210> 213
<211> 599
<212> DNA
<213> Homo sapiens
<400> 213
agggctcggt tgcacagcat cattgaatca agtggattaa atgtgttttc tgcatctctg 60
agtcccttgg aacctcctaa ccacatacgc ctgggtacag agaaaggccc agagacaccc 120
taggtcccct cctagcgccc cttctggagg aaggctacca cagggaagaa gtttccttgg 180
gcactttgta tgtcactttc cttctgggaa gcagcctggc acggtgaaca gcaagcatgg 240
ggtttactgg acttgtggcc ctgagcaagc cactgatgtc ccagcctagg cctgcccacr 300
tgttcagtag aagtgctgac acagaggagc ggaagaaaca gggctgggtt tgaatccagg 360
ctcaatcaac ttgagcggat tatttaatat gtatgagcct caatttcatc ctctataaag 420
ttgggataaa actgcctact ctccaggcct gttctttgca ttcaaaatta gaaataaatt 480
tgcacgttga atgtcctgct cagcagatgc ccaggaagag gggcagtgat tgtcattgtt 540
actgatagcc agtagagggc accaaaccat tctttaatga aagcggcctc ggttgtcct 599
<210> 214
<211> 599
<212> DNA
<213> Homo sapiens
<400> 214
tctatagggg gtccttccca ttttgacctt tttatgtctt tctacaaatt ccattttgca 60
cttgtccctc cctagctcga aacattctct ctctctttag gatacaggtc acatgcctca 120
ccccagcatt caaggctctg ctcagctagc cccagtccac ttccttaggg tacttccctt 180
cttctccttc acagattatt tgttctggcc agacagctgc tctctgcatt gcttcctgaa 240
cattctatat acagttgcac ctccatgcct ttgcttgtgc ccttcccttt gccatttatr 300
ccctccctat ttatttggat gaacaaccat gagataattt gtggagttaa tgaaaattta 360
tgagcaacaa ttatgcaccc aactacatta ggaggtacta gcagaaaagc acaaaggact 420
ctaattcaaa gtagtcaggg catggttcta aggaaaaaat aggcttggaa tatgtcctaa 480
aaaaagagaa tgctgtggga atttgaggga ggaagtaaaa gtgtctatcc atgaatatag 540
taaatatttc catctattga ggtcatcttt attagtcttt taacaatgtt ctatcattt 599
<210> 215
<211> 599
<212> DNA
<213> Homo sapiens
<400> 215
cctggaacta actgtgctga ccacacagtt gtccaacaaa agtcatcaca tgatggtact 60
gcaaaaatat tattttatac ctgtttccta aaaaccagtc atactgacaa acactccaca 120
tacctgcctt cacaaatacc aaacttggct aaatctcaaa gtaaaagttc atctctcatt 180
cagaatgaag aaactgaaga taccttgtga actgagctgc ccaaggtcca tctcggcatg 240
aggagtaaac cgcacttcta aagtggccac aggagcctct gtcacccagg caggaaccay 300
gctgcgggga gctccatcag cccttccagc agggcagtga ggggccatgg gctgtgtctc 360
tgccctgctt ccttgcaaga ctgctgctcc ttccactctt tctagcttct tgtctgtacc 420
tttctctgaa aagctcttct ctgggcaata tgggccaatt tgttcttctg ccacgctgga 480
actctgatca cgtcttgatt ccaaaccaaa atccactgct atctccctgt gcataggaaa 540
tgcttgctga attctggctg tgtcactgtg tgtcaggtag ttttcttctg aagttctgt 599
<210> 216
<211> 599
<212> DNA
<213> Homo sapiens
<400> 216
acttcaattt cctcatccca aaaatggggg ataaattata ttacttaaga cagttaaggc 60
gattgtatga aatgagtgta aaaatgtttt accgtactac ctggcaaaca gcagacactt 120
agtaaatatt gtttgttggg cacttgataa acgtctctca agttcctact gtgtgccagt 180
tgttgtgtta gctgcaaagg atgtggagat gagattctgt ctcttccttt aaggaaaggg 240
gatggtgtta ttttcttcct accagatgac aagttaatac tatttaaaac atgatttctr 300
ttaatttgtg ggagattgca tttttttccc catcagatca ttgtggtaaa ataacttgtg 360
ctcttttctt attccgtggt ttgttttgtt ttgttttcta taggattttg tttgtttttc 420
acaaaaatgg tcatttgagc tgtaaggcaa aagtgcagcc tcctaggctg aatggtgcaa 480
agactggagt tttttccaca aggagccctc atcgtcccaa tgcaatagga ctgaccctgg 540
ccaagctgga aaaggtagaa ggtaacccat ttcatttcta cttttacctt tttcctcac 599
<210> 217
<211> 599
<212> DNA
<213> Homo sapiens
<400> 217
gttttctcat gtttcttgtc ttgaagacca ctttcctttt ccttctctgt gagaaaaatc 60
cctttgccag tccttcacca ggtgagtcct cacaggaatg agactaactc aaagtcaggg 120
aaatccatca tacaaaatac acctagcagg aatttctcaa agaccaagtc tagaatagtc 180
acgcagggcc tcagcagaaa cacatgaggt gagcttgggc actcaaaaga cagtcctctt 240
ctatgtgtct tcaccaaaat gaaatgaaaa tgccactggt tctccccacc acctcccaar 300
tggtaatatt tggaacacac acacactttc aaagctaaac aataattctc aaagccagtg 360
tagactctag actactagaa gacattttta caaatgcaca taatctgcac agattctccc 420
gcccacatgg atatccatct tatacgtgcc cctttttgct cacaccagtt ggaattgtgt 480
ttctatcact taaaatggta agagtcccaa ccagtgcacc tcatctccct gtattggtta 540
agaggcattc agccagccgg gcacggtggc tcacgcctgt aatcccagca ctttgggag 599
<210> 218
<211> 599
<212> DNA
<213> Homo sapiens
<400> 218
tgaaaccaca gctgcttcaa gaacccagac aggcatagca ttatacatgg actctggagt 60
cacacagacc tgggtttgaa tcttgcccct cttgcttctt gtgtggcctt gggcaggttg 120
catagcctgc ctggcactcc gtttcctcat ctgtgataca gggatgggtt gtaatgccac 180
ttacagagtc tttgtgaaca ttaaattaga taatagacac aaagtaccca gtatggtttt 240
ggcacatgat acctgctcag gaaattaact cttagaatag catgtgaatc ccctagttcr 300
ccttcccagt gattctaaaa gttaacaact tcagagttta catctgttat ctccttagga 360
gcagagattc ttataatcct cattttacaa gccaggaaac ggaggctcag ggaagtaaat 420
gtttttgaac cagggtattc agctaaggta agggcaatgg ttagcatggg ctccatcttg 480
gactctgggg ggatagtgtg tggagggaag gggcaactcc ctggcagctg ccaccacagt 540
gacctgctcc cagtcctctt ttgctgacat tctgccctgg gagttaagtt tcagctgac 599
<210> 219
<211> 599
<212> DNA
<213> Homo sapiens
<400> 219
gagggggtca aggcaggtgg atcacaaggt caggagtttg agaccagcct ggccaatgtg 60
gtgaaacttc atctctacta gaaatacaaa aattagctgg gcgtggtggc acatgcctgt 120
agtgccagct actcaggagg ctgaggcaga agaatcgctt gaacccagaa ggtggaggtt 180
gcagtgagct gagatcatgc cactgcactc cagcctgggt gatggtgtga gactccttct 240
caaaaaaaaa aaaaaaaaaa gtatggaaat gtcacccaca ccccctgact gagagacaas 300
actcccatgg atgatgggct agtcacagaa tgggctggtt agctttggat tgctttgcaa 360
ttaaatgcat ggtaaaatca ttgcactgtc ttgttcatag catttctcct tttgggatct 420
gagatctggt ctaaaaatga aacccttaat attgggggaa tccattttac cttccaggtg 480
tgcctgctta ttaggtccta gaaactgctt tcctcaccct gttctacaaa gggctccact 540
ctaaagccag taatccaatt aagaaatata aaaactggca aatgaaaaat cctacagct 599
<210> 220
<211> 599
<212> DNA
<213> Homo sapiens
<400> 220
ggcagccagg cccccaccac ccattctcat cattccacac aaacgtgagc ccctaccatg 60
aacaagatgt tgcatggagc actggcagaa gcagagtgag ttgaaggtgg cttcctccca 120
ggactgcatg gtcacagacc ccagcaccag caaagtatgg tcatcaggac cacaggaagg 180
gccagagatg ggctatgggg cactggggtc aggaagagtg ccccatcttc ctgaagggtg 240
atactggacc tggtccttgg agaataagaa agatctgatg aagcaaaacc ctggaaggar 300
ggtatccaag atgaagagaa agtatgaggt gcagtctgga ggcaggaaag atgggctgca 360
tcggaatcac accaggtaga atggttggtt ggttgaattg ggaggtggag ctggagaggt 420
atgtagggca gatggcaaaa ggccttaaat tcaggccaag gagagtggac ttgattatgg 480
aggcaacaga gactgaggga caagagctgg gattggaaag aggccccaag catatatgaa 540
gctcccctac tcatgcctgc cccacacctt ttcatgggat gttgtacagc acactccca 599
<210> 221
<211> 599
<212> DNA
<213> Homo sapiens
<400> 221
aattaattgt ttcttttcag tctcttccat tccctccacc cctaagaatg caagcattgt 60
gagccccagg tccacatctg tggctggctc ccctgtatcg cagttgtatt tgcacaatgc 120
ccagcactaa gtagctgctt cataaaatga gtacgcacat gggggtagac attgtgcaga 180
ggacttcaaa ccattccaaa tcctggactt ggagctcagt ccaggtttca ctgaaaactg 240
gaagtccagg gaggcctaag gggcatctag attatagaac ttctgaattt tgaaaggaty 300
gcgtggtcag agggatcctg gagggggtgg caggagagaa ggtgaggacg agggcaggga 360
gtggggatgg gcagcagacc tgggtggaca cctagcgagg tgagtcattg ctggtgtcca 420
cttcctcatg tacccacacc cctcccaggg gaggacctgg aggatggtgt gagggatggg 480
gaagggagtc tgaacggtac agaaatcagt cctgccactc ctccagctct ggactgggca 540
gagctgggga aagctctcta gcctcccaga gctggactgt cttcatgaaa aaccaggct 599
<210> 222
<211> 599
<212> DNA
<213> Homo sapiens
<400> 222
agtctctact aaaaatacaa aaattagcca ggtgtggtga tgcgtgcctg taatcccagc 60
tactcgggag gctgaggcag gagaattgct tcagcccagg aggcggacac tgcagtgaac 120
caagatggca ccactgaatc ccagcctgtg caacagagtg agactctgtc tcaaaaaaaa 180
aaaaaaagtg ttgggactac aggcatgagc acctgcacct ggccagtcct tttaaatact 240
gtactaaagg gaagatgctg atttgggttg caatacgctt tcacactctg ccatctgtgy 300
ggggatgcac tgtggagtga tgcaaagaac tggcctccac atttggagag cacgtctgag 360
gggccaggag acctctccat gcctctcatt tcattctaga ccatttaatc tgctgcaagt 420
gaaaactgat tgactccttt acattctaac taggttttat tattttttgt gaattttttt 480
gtgtctctag gtatgagaga acagaaatag agatttgggt ggctttagct gtttaaaata 540
aggtgaccaa acctcctttc tgcctgttcc tgctatttca aacaccactg ttctccaca 599
<210> 223
<211> 599
<212> DNA
<213> Homo sapiens
<400> 223
tggtaaataa aatcagaaga actttacatc ataaaagtct ggtaacatgt cagtcttttc 60
cccaaatact aaaaaagaag agtgcaatgt ttctccgtat ttccgaagtt tcaactctgc 120
gcccctctgc tttttcctca gcccatattg actcctgtct tccctgaaag tagctgcatt 180
gccacacttt atattttatt atatttcatc ctctagtgtt tcatgtctgt gccctaacta 240
aaattgtaag caccctaaga ttgtgttata aatctctgaa tttttcccta tactgccacs 300
ctagaacatt aaagaccgct tgatacccag gaagttctta atggccattt gattactcaa 360
atgttaacat ttgtttcagc taaatttatt aaactgtttg attgtctcat actgtgaaaa 420
tacctggatt taataaaaat tattttcaat ttatatttct ttagactact atgctgccag 480
aaaaacacat agttctctgg gagagtagat aaaggaagag agggactaaa gtctagtaac 540
ctaatataaa ggttgcaaaa gacttgatgt atttttctat atatgaggct gagtgggta 599
<210> 224
<211> 599
<212> DNA
<213> Homo sapiens
<400> 224
catggagtag taccagtctg tggcctgtgg gttgaagacc cctgaagtag gaagacttaa 60
gaacagcaga gtggcaagcc tgtaagagca agcggtttac agtttaaacg cacagcatcc 120
taacttagct tgtagacttc aggaaatgct tcccgggcca ggttcagtgt ctcatccctg 180
taatcccacc acttggggag gctgaggtgg gaggatccct tgaggccagg tgcttatgaa 240
ataggcctta gctataaatt taatggaatg cctacattca aaaaatacac gcgtgcgcay 300
gcacacaaac acacactatt ttcctcaata gtaagaacat ctagtagctt ttttttttga 360
gacaccctgt ctgtcttctg agacggagtg cagtggggaa caatcatggc tcactgtagc 420
ctcaaactcc taggttcaag tgatcctccc acctcggcct ccagtcttct gagtagctaa 480
gactccaggt gtgcgccacc acacctggct aatttttttt ttttctattt tctgtagaaa 540
caaggtattg ccatgttgcc caggctagtc tcaaactcct gggctcaagc aatgccccc 599
<210> 225
<211> 599
<212> DNA
<213> Homo sapiens
<400> 225
actgctgtag cagcagggag cctgcaccag cacagacaca ctgatgggac gatagaaacg 60
agaatgtgaa tgtgtaaacc accagagcca agagtatttt attttcttct cagtggtatc 120
atattctaaa taatggatgt ttttctctaa tttttaactg agaatgatca aaatgcatgc 180
attaggccca ccttcatcct catcctcatc ttcatcttct tcatcaagtc caaattcttc 240
ttcctaaaga atagcaaaca gcataacatt aaattaattc tgccaaattg aaaagtgcaw 300
atagtacaaa ttctgccaaa ctaagaagta caaataaatg caacaatatc aatcaagcag 360
gaaactgtaa tgttattttt atctactttg atgtaccaag acccactgat tttccttaac 420
gagctttata atttttctaa gaaaaatttt ttttagaagc aagcagttca tttgctagat 480
gtttaattag tatataactc tggataattc aagaaaacat cttaaaatct caaatttcaa 540
aacagattta gacaaaaatt tctatatccc attcatatac aaagcttctt tcagaactt 599
<210> 226
<211> 599
<212> DNA
<213> Homo sapiens
<400> 226
aatatctgta ggaaaaagaa aggcactgta gcataagtaa gacttcaaag gatttagagt 60
cagatgacca cctggctgga tgctattaga cagattatct aatcttaaag agccctagtt 120
tcctcaccta tgagatgagg attgctactt tgtcaaaccc acaaagccac tgtgagataa 180
ggtacgtgaa cactgtttac taactgtaaa gcactgcaca aacactagtt gccataaagc 240
ttatatagta atgtctacag tgctactgtg tttgcctttt aacctatctg acttgaccty 300
cccaattgaa acattaagtt ctttagggca tggatttcta ctttcatctg atttgtttat 360
cactatagct ctagcaccta ggacaatgtc tggcacatat tcagtgctag aaaatatgtc 420
cctgaataat cataaaatct tctagtactt gctatccaag tttgttagcc attacaaatt 480
gataaaattc aaggtggatc agctactgaa tttttctgag aaaactacct aaggcccagt 540
tgagtacaat ccagtgggag agttcaagtt ctgggaaaga acaagcaaaa taactgctc 599
<210> 227
<211> 599
<212> DNA
<213> Homo sapiens
<400> 227
atccactcaa ggtggggagg gatggcatca atgagtagtc tctgggcaag acaaagagca 60
gagagttacc ccttaacagt caggcctgtt aagctttttt ttcagagctc actgaatgtg 120
accatactta cagagggttt tctgagttag gcctgctgga cttgcatcag aaattccctc 180
agagatcccc tccacatata caaacacaca cacaaagaca agacggacag aaggccttcc 240
aaaccaagat ccctaaccaa gaattccaag agtattcctt ccaaactatc ctattctccr 300
tctgagaagt ctccccgaaa tcttactgat tgaggagaag tctccagaac caagactctt 360
cctactaatt agggagagta aaccgagacc cctgaagaag ctgaaccaat tgggagaagg 420
aaaggggtgt tggcagcacc tagactactc accaaatcag acaccccata atggggctgc 480
agctgcagac aatccatgat ggggctacaa acagacactg tgataaggtt acagttacag 540
gcaccccatg gtggagctac agagggacac cttgccatgg agctctagtt atgagatat 599
<210> 228
<211> 599
<212> DNA
<213> Homo sapiens
<400> 228
ttttgaaatt ttgcttgtat gaaatgtctc tattctattc tttcatttag ctgggaattg 60
aattctaggt caaaaataat tttccttcag aattttggag gcaatgttcc atcatcttct 120
cacttccagt gttactttct gagaagtctt caatcactat aattgctgac catttttgta 180
cgtgacctgg ttttgctgtt tggaacctca tagaatcttt tctttatcac cagtattctt 240
gtactttgca gtaattgttt tgtggagctt tttgtttgtt tgtttgtttt ttaatctatr 300
gacctgattc tcaaggattc tttcattctg gagacttatg cccttgggtt ctggagaaat 360
caatctcttt ttaaagaaaa taatttttca ccttcttttt ttcactgtct ggaagtacta 420
ttagtcaaat ttactgaatt cgtccttatt tttcttacat tttctccact attttcatct 480
ctttgccatt tgttttctat tttcggacag actgccttgt tgataagagg ataagtgcag 540
tctttcagat acattttctt ttattatttt ggaaatcaaa acatttaaca ctactcaac 599
<210> 229
<211> 599
<212> DNA
<213> Homo sapiens
<400> 229
caatatgttt cttattaagt aaccacatcc attactactg tgcaggcacc atgccatagc 60
acttacctgc acagacaggc cttagaggct ctttattatg ttgtaaccag ggttggagtg 120
attatgctga taccttatga acattagccc catttatagg ggatcttgcc ccattgcaca 180
gatgaggtcg ctgaggctca ggaagatgac ttcccagagg accctgtgca gtgtgtccag 240
gacccgaatg ggagcccaga cctgggtgtg gcctcgggcc ttgctctcac ttcactgacw 300
tgaggcccct gaggtttggc actgatttgc atcagctcct acttgttacc aggattacgt 360
tctgtgccag gcacagagat gtatcagtag gtgagtgatg tgagaacaag gaagggacaa 420
gctagctaat gatttaatta agtacataaa ttgcattgag attgggagat gtctggcctt 480
gccacagcgt gcaggaagtc cttctcagag gggccgggct gccccaggca gtttcagatg 540
tcccaaaggg agtgacactg caggcagggt ccctccctct tgcctgttgt gacccaggg 599
1
Claims (65)
- 개인으로부터 수득된 핵산 시료 또는 개인으로부터 유래된 유전형 데이터세트(genotype dataset)에서 하나 이상의 다형성 마커의 하나 이상의 대립인자의 존재 여부를 결정하는 단계를 포함하는, 개인에서 갑상선암에 대한 감수성을 결정하는 방법으로서, 상기 하나 이상의 다형성 마커는 rs965513, 및 이와 연관 불균형(linkage disequilibrium)인 마커들로 구성된 군으로부터 선택되고, 상기 하나 이상의 대립인자의 존재는 상기 개인의 갑상선암에 대한 감수성을 나타내는 것인 방법.
- 제1항에 있어서, 상기 하나 이상의 다형성 마커는 표 2에 표시된 마커들로 구성된 군으로부터 선택되는 것인 방법.
- 제1항 또는 제2항에 있어서, 상기 하나 이상의 다형성 마커는 rs965513, rs10759944, rs907580, rs10984103, rs925487, rs7024345 및 rs1443434로 구성된 군으로부터 선택되는 것인 방법.
- 제1항 내지 제3항 중 어느 한 항에 있어서, 상기 개인에서 하나 이상의 일배체형의 빈도를 평가하는 단계를 더 포함하는 것인 방법.
- 제1항 내지 제4항 중 어느 한 항에 있어서, 상기 하나 이상의 대립인자 또는 일배체형의 존재에 의해 부여된 감수성은 증가된 감수성인 것인 방법.
- 제5항에 있어서, 마커 rs965513의 대립인자 A, 마커 rs907580의 대립인자 A, 마커 rs10759933의 대립인자 A, 마커 rs10984103의 대립인자 A, 마커 rs925487의 대립인자 G, 마커 rs7024345의 대립인자 A, 및 마커 rs1443434의 대립인자 G의 존재는 상기 개인에서 갑상선암에 대한 증가된 감수성을 나타내는 것인 방법.
- 제5항 또는 제6항에 있어서, 상기 하나 이상의 대립인자 또는 일배체형의 존재는 1.6 이상의 상대적 위험도(relative risk, RR) 또는 오즈비(odds ratio, OR)를 갖는 갑상선암에 대한 증가된 감수성을 나타내는 것인 방법.
- 제5항 또는 제6항에 있어서, 상기 하나 이상의 대립인자 또는 일배체형의 존재는 1.7 이상의 상대적 위험도(RR) 또는 오즈비(OR)를 갖는 증가된 감수성을 나타내는 것인 방법.
- 제1항 내지 제4항 중 어느 한 항에 있어서, 상기 하나 이상의 대립인자 또는 일배체형의 존재에 의해 부여된 감수성은 감소된 감수성인 것인 방법.
- 제1항 내지 제9항 중 어느 한 항에 있어서, 표 2에 표시된 마커들 중 하나와 연관 불균형이 아닌, 갑상선암에 대한 하나 이상의 위험 변이(at-risk variant)의 하나 이상의 위험 대립인자가 개인으로부터 수득된 게놈 DNA를 포함하는 시료 또는 개인으로부터 유래된 유전형 데이터세트에 존재하는지 여부를 결정하는 단계를 더 포함하는 것인 방법.
- 제1항 내지 제9항 중 어느 한 항에 있어서, 두개 이상의 다형성 마커 각각의 하나 이상의 대립인자가 개인으로부터 수득된 게놈 DNA를 포함하는 시료 또는 개인으로부터 유래된 유전형 데이터세트에 존재하는지 여부를 결정하는 단계를 포함하고, 상기 두개 이상의 다형성 마커의 상기 하나 이상의 대립인자의 존재는 갑상선암에 대한 증가된 감수성을 나타내는 것인 방법.
- 개인에서 갑상선암에 대한 감수성을 결정하는 방법으로서, 상기 방법은:
rs965513 (서열번호 1), 및 이와 연관 불균형인 마커들로 구성된 군으로부터 선택된 하나 이상의 다형성 마커의 하나 이상의 대립인자를 식별하는, 개인에 대한 핵산 서열 데이터를 수득하는 단계로서, 상기 하나 이상의 다형성 마커의 상이한 대립인자는 인간에서 갑상선암에 대한 상이한 감수성과 연관되는 것인 단계, 및
상기 핵산 서열 데이터로부터 갑상선암에 대한 감수성을 결정하는 단계를 포함하는 것인 방법. - 제12항에 있어서, rs965513 (서열번호 1), 및 이와 연관 불균형인 마커들로 구성된 군으로부터 선택된 두 개 이상의 다형성 마커에 대한 핵산 서열 데이터를 수득하는 단계를 포함하는 것인 방법.
- 제12항 또는 제13항에 있어서, 감수성의 결정은 상기 핵산 서열 데이터를 상기 하나 이상의 다형성 마커와 갑상선암에 대한 감수성 간의 상관관계 데이터를 담은 데이터베이스와 비교하는 단계를 포함하는 것인 방법.
- 제14항에 있어서, 상기 데이터베이스는 상기 하나 이상의 다형성 마커에 대해 갑상선암에 대한 감수성의 하나 이상의 위험도 척도를 포함하는 것인 방법.
- 제14항에 있어서, 상기 데이터베이스는 상기 하나 이상의 다형성 마커에 대한 상기 하나 이상의 상태(condition)의 하나 이상의 위험도 척도를 담은 참조표(look-up table)를 포함하는 것인 방법.
- 제12항 내지 제16항 중 어느 한 항에 있어서, 핵산 서열 데이터의 수득은 상기 개인으로부터 생물학적 시료를 수득하는 단계 및 상기 시료 중 핵산에서 상기 하나 이상의 다형성 마커의 서열을 분석하는 단계를 포함하는 것인 방법.
- 제17항에 있어서, 상기 하나 이상의 다형성 마커의 서열을 분석하는 단계는 상기 하나 이상의 다형성 마커의 하나 이상의 대립인자의 존재 또는 부재를 결정하는 단계를 포함하는 것인 방법.
- 제12항 내지 제18항 중 어느 한 항에 있어서, 상기 핵산 서열 데이터의 수득은 기존의 기록으로부터 핵산 서열 정보를 수득하는 단계를 포함하는 것인 방법.
- 제1항 내지 제19항 중 어느 한 항에 있어서, 상기 개인, 상기 개인의 후견인, 유전학 서비스 제공자(genetic service provider), 의사, 의료 기관, 및 의료보험 회사로 구성된 군으로부터 선택된 하나 이상의 대상(entity)에게 상기 감수성을 보고하는 단계를 더 포함하는 것인 방법.
- 제12항 내지 제19항 중 어느 한 항에 있어서, 상기 하나 이상의 다형성 마커는 표 2에 열거된 마커들로 구성된 군으로부터 선택되는 것인 방법.
- 제21항에 있어서, 상기 하나 이상의 다형성 마커는 rs965513, rs10759944, rs907580, rs10984103, rs925487, rs7024345 및 rs1443434로 구성된 군으로부터 선택된 것인 방법.
- 제1항 내지 제22항 중 어느 한 항에 있어서, 상기 하나 이상의 다형성 마커는 FoxE1 유전자와 연관된 것인 방법.
- 갑상선암에 대한 감수성을 평가하기 위해 이용될 마커를 확인하는 방법으로서, 상기 방법은
a. rs965513, rs10759944, rs907580, rs10984103, rs925487, rs7024345 및 rs1443434로 구성된 군으로부터 선택된 마커 중 하나 이상의 마커와 연관 불균형인 하나 이상의 다형성 마커를 확인하는 단계,
b. 갑상선암으로 진단되거나 또는 갑상선암에 대한 감수성을 갖는 개인의 시료의 유전형 상태를 결정하는 단계, 및
c. 대조군 개인의 시료의 유전형 상태를 결정하는 단계를 포함하고,
상기 대조군 시료에서의 하나 이상의 다형성의 하나 이상의 대립인자의 빈도 대비, 갑상선암으로 진단되거나, 또는 갑상선암에 대한 감수성을 갖는 개인에서 상기 하나 이상의 대립인자의 빈도의 유의성 있는 차이는 상기 하나 이상의 다형성이 갑상선암에 대한 감수성을 평가하기 위해 유용하다는 것을 나타내는 것인 방법. - 제24항에 있어서, 상기 대조군 시료에서의 상기 하나 이상의 다형성의 하나 이상의 대립인자의 빈도 대비, 갑상선암으로 진단되거나, 또는 갑상선암에 대한 감수성을 갖는 개인에서 상기 하나 이상의 대립인자의 빈도의 증가는 상기 하나 이상의 다형성이 갑상선암에 대한 증가된 감수성을 평가하기 위해 유용하다는 것을 나타내는 것인 방법.
- 제24항 또는 제25항에 있어서, 상기 대조군 시료에서의 상기 하나 이상의 다형성의 하나 이상의 대립인자의 빈도 대비, 갑상선암으로 진단되거나, 또는 갑상선암에 대한 감수성을 갖는 개인에서 상기 하나 이상의 대립인자의 빈도의 감소는 상기 하나 이상의 다형성이 갑상선암에 대한 감소된 감수성 또는 보호를 평가하기 위해 유용하다는 것을 나타내는 것인 방법.
- 개인으로부터 수득된 핵산 시료에서 하나 이상의 다형성 마커의 하나 이상의 대립인자가 존재하는지 여부를 결정하는 단계를 포함하는, 개인으로부터 수득된 핵산 시료의 유전형을 분석하는 방법으로서, 상기 하나 이상의 마커는 rs965513, 및 이와 연관 불균형인 마커들로 구성된 군으로부터 선택되고, 상기 시료 중의 상기 하나 이상의 대립인자의 존재의 결정은 상기 개인의 갑상선암에 대한 감수성을 나타내는 것인 방법.
- 제27항에 있어서, 마커 rs965513의 대립인자 A, 마커 rs907580의 대립인자 A, 마커 rs10759933의 대립인자 A, 마커 rs10984103의 대립인자 A, 마커 rs925487의 대립인자 G, 마커 rs7024345의 대립인자 A, 및 마커 rs1443434의 대립인자 G의 존재는 상기 개인에서 갑상선암의 증가된 감수성을 나타내는 것인 방법.
- 제27항 또는 제28항에 있어서, 유전형 분석은 상기 하나 이상의 다형성 마커를 플랭킹(flanking)하는 뉴클레오티드 프라이머 쌍을 이용한 중합효소 연쇄 반응(PCR)에 의해, 상기 하나 이상의 다형성 마커를 포함하는 핵산의 세그먼트를 증폭하는 단계를 포함하는 것인 방법.
- 제27항 내지 제29항 중 어느 한 항에 있어서, 유전형 분석은 대립인자-특이적 프로브 혼성화, 대립인자-특이적 프라이머 연장(primer extension), 대립인자-특이적 증폭, 핵산 서열결정(nucleic acid sequencing), 5'-엑소뉴클레아제 처리(exonuclease digestion), 분자 표지 분석법(molecular beacon assay), 올리고뉴클레오티드 라이게이션 분석법(oligonucleotide ligation assay), 크기 분석, 단일 가닥 구조 분석(single-stranded conformation analysis), 및 마이크로어레이 기술로부터 선택된 방법을 이용하여 수행되는 것인 방법.
- 제30항에 있어서, 상기 방법은 대립인자-특이적 프로브 혼성화를 포함하는 것인 방법.
- 제30항 또는 제31항에 있어서, 상기 방법은 마이크로어레이 기술인 것인 방법.
- 제27항 내지 제32항 중 어느 한 항에 있어서, 상기 방법은:
1) 상기 핵산의 카피를 검출 올리고뉴클레오티드 프로브 및 인핸서 올리고뉴클레오티드 프로브와, 상기 올리고뉴클레오티드 프로브와 상기 핵산 간의 특이적 혼성화 조건 하에 접촉시키는 단계로서,
a) 상기 검출 올리고뉴클레오티드 프로브는 길이가 5 내지 100개의 뉴클레오티드로 구성되고 서열번호 1 내지 서열번호 229 중 하나에 의해 주어진 뉴클레오티드 서열을 갖는 핵산의 제1 세그먼트에 특이적으로 혼성화되고,
b) 상기 검출 올리고뉴클레오티드 프로브는 3' 말단의 검출가능한 표지 및 5' 말단의 퀀칭 모이어티(quenching moiety)를 포함하며,
c) 상기 인핸서 올리고뉴클레오티드는 길이가 5 내지 100개의 뉴클레오티드로 구성되고 상기 올리고뉴클레오티드 프로브의 5'에 배열된 상기 뉴클레오티드 서열의 제2 세그먼트에 상보적이어서, 상기 두개의 올리고뉴클레오티드가 모두 상기 핵산에 혼성화되는 경우 상기 인핸서 올리고뉴클레오티드는 상기 검출 올리고뉴클레오티드에 대해 3'에 위치하며, 및
d) 상기 제1 세그먼트와 상기 제2 세그먼트 간에 단일 염기 갭(single base gap)이 존재하여, 상기 올리고뉴클레오티드 프로브와 상기 인핸서 올리고뉴클레오티드 프로브가 모두 상기 핵산에 혼성화되는 경우, 상기 올리고뉴클레오티드 간에 단일 염기 갭이 존재하는 것인 단계,
2) 상기 검출 프로브가 상기 핵산에 혼성화되는 경우, 상기 검출 프로브의 3' 말단으로부터 상기 검출가능한 표지를 절단하여 유리된 검출가능한 표지를 방출시키는 엔도뉴클레아제로 상기 핵산을 처리하는 단계, 및
3) 유리된 검출가능한 표지를 측정하는 단계로서, 상기 유리된 검출가능한 표지의 존재는 상기 검출 프로브가 상기 핵산의 제1 세그먼트에 특이적으로 혼성화된다는 것을 나타내고, 상기 다형성 부위의 서열이 상기 검출 프로브의 상보체(complement)라는 것을 나타내는 것인 단계를 포함하는 것인 방법. - 갑상선암 치료제에 대한 반응의 확률에 대해 개인을 평가하는 방법으로서, 상기 개인으로부터 수득된 핵산 시료, 또는 상기 개인으로부터 유래된 유전형 데이터세트에서 하나 이상의 다형성 마커의 하나 이상의 대립인자가 존재하는지 여부를 결정하는 단계를 포함하고, 상기 하나 이상의 다형성 마커는 rs965513 (서열번호 1), 및 이와 연관 불균형인 마커들로 구성된 군으로부터 선택되고, 상기 하나 이상의 마커의 상기 하나 이상의 대립인자의 존재는 상기 치료제에 대한 양성 반응의 확률을 나타내는 것인 방법.
- 갑상선암으로 진단된 개인의 예후(prognosis)를 예측하는 방법으로서, 상기 방법은 상기 개인으로부터 수득된 핵산 시료, 또는 상기 개인으로부터 유래된 유전형 데이터세트에서 하나 이상의 다형성 마커의 하나 이상의 대립인자가 존재하는지 여부를 결정하는 단계를 포함하고, 상기 하나 이상의 다형성 마커는 rs965513 (서열번호 1), 및 이와 연관 불균형인 마커들로 구성된 군으로부터 선택되고, 상기 하나 이상의 대립인자의 존재는 상기 개인에서 갑상선암의 악화된 예후를 나타내는 것인 방법.
- 갑상선암의 치료를 받는 개인의 치료의 진행을 모니터링하는 방법으로서, 상기 방법은 상기 개인으로부터 수득된 핵산 시료 또는 상기 개인으로부터 유래된 유전형 데이터세트에서 하나 이상의 다형성 마커의 하나 이상의 대립인자가 존재하는지 여부를 결정하는 단계를 포함하고, 상기 하나 이상의 다형성 마커는 rs965513 (서열번호 1), 및 이와 연관 불균형인 마커들로 구성된 군으로부터 선택되고, 상기 하나 이상의 대립인자의 존재가 상기 개인의 치료 결과(treatment outcome)를 나타내는 것인 방법.
- 제34항 내지 제36항 중 어느 한 항에 있어서, 상기 하나 이상의 다형성 마커는 표 2에 표시된 마커들로부터 선택되는 것인 방법.
- 제1항 내지 제37항 중 어느 한 항에 있어서, 상기 개인의 위험도 평가, 진단, 또는 예후의 판단을 수행하기 위해 비-유전적 정보(non-genetic information)를 분석하는 단계를 더 포함하는 것인 방법.
- 제38항에 있어서, 상기 비-유전적 정보는 연령, 성별, 민족, 사회경제적 지위, 과거 질병 진단, 개인의 병력(medical history), 갑상선암의 가족력(family history), 생화학적 척도, 및 임상적 척도로부터 선택되는 것인 방법.
- 제38항 또는 제39항에 있어서, 통합 위험도(combined risk)를 계산하는 단계를 더 포함하는 것인 방법.
- 개인에서 갑상선암에 대한 감수성을 진단 및/또는 평가하기 위한 시약의 제조에서 올리고뉴클레오티드 프로브의 용도로서, 상기 프로브는 서열번호 1 내지 서열번호 229 중 하나로 표시된 뉴클레오티드 서열을 갖는 핵산의 세그먼트에 혼성화되고, 상기 프로브는 길이가 15 내지 500개의 뉴클레오티드로 구성되는 것인 용도.
- 개인에서 갑상선암에 대한 감수성을 평가하기 위한 키트로서, 상기 키트는
상기 개인의 게놈에서 하나 이상의 다형성 마커의 하나 이상의 대립인자를 선택적으로 검출하는 시약으로서, 상기 다형성 마커는 rs965513, 및 이와 연관 불균형인 마커들로 구성된 군으로부터 선택되는 것인 시약을 포함하고,
상기 하나 이상의 대립인자의 존재는 갑상선암에 대한 감수성을 나타내는 것인 키트. - 제42항에 있어서, 상기 하나 이상의 다형성 마커는 표 2에 표시된 마커들로부터 선택되는 것인 키트.
- 제42항 또는 제43항에 있어서, 상기 시약은 상기 하나 이상의 다형성 마커를 포함하는 상기 개인의 게놈의 단편에 혼성화하는 하나 이상의 연속된(contiguous) 올리고뉴클레오티드, 완충액 및 검출가능한 표지를 포함하는 것인 키트.
- 제42항 내지 제44항 중 어느 한 항에 있어서, 상기 시약은 상기 개인으로부터 수득된 게놈 핵산 세그먼트의 반대쪽 가닥에 혼성화하는 한 쌍 이상의 올리고뉴클레오티드를 포함하고, 각 올리고뉴클레오티드 프라이머 쌍은 하나의 다형성 마커를 포함하는 상기 개인의 게놈의 단편을 선택적으로 증폭시키도록 설계되고, 상기 단편은 크기가 30 bp 이상인 것인 키트.
- 제44항 또는 제45항에 있어서, 상기 하나 이상의 올리고뉴클레오티드는 상기 개인의 게놈에 완전히 상보적인 것인 키트.
- 제42항 내지 제46항 중 어느 한 항에 있어서, 상기 키트는:
a. 길이가 5 내지 100개의 뉴클레오티드로 구성된 검출 올리고뉴클레오티드 프로브;
b. 길이가 5 내지 100개의 뉴클레오티드로 구성된 인핸서 올리고뉴클레오티드 프로브; 및
c. 엔도뉴클레아제 효소;를 포함하고,
상기 검출 올리고뉴클레오티드 프로브는 서열번호 1 내지 서열번호 229 중 하나로 표시된 뉴클레오티드 서열의 핵산의 제1 세그먼트에 특이적으로 혼성화되고; 및
상기 검출 올리고뉴클레오티드 프로브는 3' 말단에 검출가능한 표지를 포함하고 5' 말단에 퀀칭 모이어티(quenching moiety)를 포함하며;
상기 인핸서 올리고뉴클레오티드는 길이가 5개 내지 100개의 뉴클레오티드로 구성되고, 상기 올리고뉴클레오티드 프로브의 5'에 배열된 상기 뉴클레오티드 서열의 제2 세그먼트에 상보적이어서, 상기 인핸서 올리고뉴클레오티드는 상기 두개의 올리고뉴클레오티드가 모두 상기 핵산에 혼성화되는 경우 상기 검출 올리고뉴클레오티드에 대해 3'에 위치하며;
상기 제1 세그먼트와 상기 제2 세그먼트 간에 단일 염기 갭이 존재하여, 상기 올리고뉴클레오티드 프로브와 상기 인핸서 올리고뉴클레오티드 프로브가 모두 상기 핵산에 혼성화되는 경우, 상기 올리고뉴클레오티드 간에 단일 염기 갭이 존재하며; 및
상기 핵산을 상기 엔도뉴클레아제에 의해 처리하는 단계는 상기 검출 프로브가 상기 핵산에 혼성화된 경우, 상기 검출 프로브의 3'말단으로부터 상기 검출가능한 표지를 절단하여 유리 상태의 검출가능한 표지를 방출하는 것인 키트. - 개인에서 갑상선암에 대한 감수성을 결정하기 위한 컴퓨터에서 실행가능한 프로그램(computer executable instructions)이 수록된 컴퓨터-판독가능한 매체로서, 상기 컴퓨터-판독가능한 매체는
하나 이상의 다형성 마커를 나타내는 데이터; 및
상기 컴퓨터-판독가능한 매체 상에 저장되고 상기 하나 이상의 다형성 마커에 대해 개인에서 갑상선암을 발병할 위험도를 결정하기 위해 프로세서에 의해 실행되도록 개조된 루틴(routine);을 포함하고,
상기 하나 이상의 다형성 마커는 rs965513, 및 이와 연관 불균형인 마커들로부터 선택되는 것인 컴퓨터-판독가능한 매체. - 제48항에 있어서, 상기 컴퓨터 판독가능한 매체는 두 개 이상의 다형성 마커를 나타내는 데이터를 포함하는 것인 컴퓨터 판독가능한 매체.
- 제48항 또는 제49항에 있어서, 상기 하나 이상의 다형성 마커를 나타내는 데이터는 상기 하나 이상의 다형성 마커에 대해 갑상선암에 대한 감수성을 나타내는 파라미터를 포함하고, 개인에서 갑상선암을 발병할 위험도는 상기 개인에서 상기 하나 이상의 다형성 마커의 대립인자 상태에 근거하는 것인 컴퓨터 판독가능한 매체.
- 제48항 내지 제50항 중 어느 한 항에 있어서, 상기 하나 이상의 다형성 마커를 나타내는 데이터는 상기 개인에서 상기 하나 이상의 다형성 마커의 대립인자 상태를 나타내는 데이터를 포함하는 것인 컴퓨터 판독가능한 매체.
- 제48항 내지 제50항 중 어느 한 항에 있어서, 상기 루틴은 상기 개인에서 상기 하나 이상의 다형성 마커의 대립인자 상태를 나타내는 입력 데이터를 수신하도록 개조된 것인 컴퓨터 판독가능한 매체.
- 제48항 내지 제52항 중 어느 한 항에 있어서, 상기 하나 이상의 다형성 마커는 표 2에 표시된 마커들로부터 선택되는 것인 컴퓨터 판독가능한 매체.
- 제48항 내지 제53항 중 어느 한 항에 있어서, 상기 하나 이상의 다형성 마커는 rs965513, rs10759944, rs907580, rs10984103, rs925487, rs7024345 및 rs1443434로 구성된 군으로부터 선택되는 것인 컴퓨터 판독가능한 매체.
- 제48항 내지 제54항 중 어느 한 항에 있어서, 두 개 이상의 다형성 마커를 포함하는 하나 이상의 일배체형을 나타내는 데이터를 더 포함하는 것인 컴퓨터 판독가능한 매체.
- 개인에서 갑상선암에 대한 유전적 지표(indicator)를 결정하기 위한 장치로서:
프로세서,
rs965513, 및 이와 연관 불균형인 마커들로 구성된 군으로부터 선택된 하나 이상의 다형성 마커에 대해 하나 이상의 개인에 대한 마커 및/또는 일배체형 정보를 분석하고, 상기 마커 또는 일배체형 정보에 기반한 출력물(output)을 생성하기 위해 상기 프로세서 상에서 실행되도록 개조된 컴퓨터 실행가능한 프로그램이 수록된 컴퓨터 판독가능한 메모리를 포함하고,
상기 출력물은 상기 개인의 갑상선암의 유전적 지표로서 상기 하나 이상의 마커 또는 대립인자의 위험도 척도를 포함하는 것인 장치. - 제56항에 있어서, 상기 컴퓨터 판독가능한 메모리는 갑상선암으로 진단된 복수의 개인에서 하나 이상의 다형성 마커의 하나 이상의 대립인자 또는 하나 이상의 일배체형의 빈도를 나타내는 데이터, 및 복수의 기준(reference) 개인에서 하나 이상의 다형성 마커의 하나 이상의 대립인자 또는 하나 이상의 일배체형의 빈도를 나타내는 데이터를 포함하고, 위험도 척도는 상기 개인에 대한 상기 하나 이상의 마커 및/또는 일배체형 상태와 갑상선암으로 진단된 복수의 개인에 대한 상기 하나 이상의 마커 및/또는 일배체형 빈도 정보를 나타내는 데이터의 비교에 기반한 것인 장치.
- 제56항에 있어서, 상기 컴퓨터 판독가능한 메모리는 상기 하나 이상의 다형성 마커의 하나 이상의 대립인자 또는 하나 이상의 일배체형과 연관된 갑상선암을 발병할 위험도를 나타내는 데이터를 포함하고, 상기 개인에 대한 위험도 척도는 상기 개인에 대한 상기 하나 이상의 다형성 마커 및/또는 하나 이상의 일배체형 상태와 상기 하나 이상의 다형성 마커의 하나 이상의 대립인자 또는 하나 이상의 일배체형과 연관된 갑상선암을 발병할 위험도의 비교에 기반한 것인 장치.
- 제56항에 있어서, 상기 컴퓨터 판독가능한 메모리는 갑상선암으로 진단된 복수의 개인에서 상기 하나 이상의 다형성 마커의 하나 이상의 대립인자 또는 상기 하나 이상의 일배체형의 빈도를 나타내는 데이터와, 복수의 기준 개인에서 상기 하나 이상의 다형성 마커의 하나 이상의 대립인자 또는 상기 하나 이상의 일배체형의 빈도를 나타내는 데이터를 더 포함하고, 갑상선암을 발병할 위험도는 갑상선암으로 진단된 개인과 기준 개인에서 상기 하나 이상의 대립인자 또는 일배체형의 빈도의 비교에 기반한 것인 장치.
- 제56항 내지 제59항 중 어느 한 항에 있어서, 상기 하나 이상의 마커 또는 일배체형은 표 2에 표시된 마커들로부터 선택된 하나 이상의 마커를 포함하는 것인 장치.
- 제56항 내지 제60항 중 어느 한 항에 있어서, 상기 위험도 척도는 오즈비(odds ratio, OR) 또는 상대적 위험도(relative risk, RR)에 의해 특정되는 것인 장치.
- 제1항 내지 제61항 중 어느 한 항에 있어서, 마커들 간의 연관 불균형은 연관 불균형 척도 r2 및/또는 |D'|의 특정한 수치값을 특징으로 하는 것인 방법, 키트, 용도, 매체 또는 장치.
- 제1항 내지 제62항 중 어느 한 항에 있어서, 마커들 간의 연관 불균형은 0.1 이상의 r2 값을 특징으로 하는 것인 방법, 키트, 용도, 매체 또는 장치.
- 제1항 내지 제63항 중 어느 한 항에 있어서, 마커들 간의 연관 불균형은 0.2 이상의 r2 값을 특징으로 하는 것인 방법, 키트, 용도, 매체 또는 장치.
- 제1항 내지 제64항 중 어느 한 항에 있어서, 상기 개인은 유럽계 선조를 포함하는 선조로부터 유래된 것인 방법, 키트, 용도, 매체 또는 장치.
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
IS8755 | 2008-08-12 | ||
IS8755 | 2008-08-12 | ||
IS8791 | 2009-02-05 | ||
IS8791 | 2009-02-05 |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20110081807A true KR20110081807A (ko) | 2011-07-14 |
Family
ID=41217645
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020117005803A KR20110081807A (ko) | 2008-08-12 | 2009-08-12 | 갑상선암의 위험도 평가를 위해 유용한 유전적 변이 |
Country Status (10)
Country | Link |
---|---|
US (1) | US20110230366A1 (ko) |
EP (1) | EP2334820A1 (ko) |
JP (1) | JP2011530306A (ko) |
KR (1) | KR20110081807A (ko) |
CN (1) | CN102177252B (ko) |
AU (1) | AU2009280807A1 (ko) |
CA (1) | CA2733910A1 (ko) |
IL (1) | IL211177A0 (ko) |
NZ (1) | NZ591613A (ko) |
WO (1) | WO2010018600A1 (ko) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20160051079A (ko) * | 2014-10-31 | 2016-05-11 | 에스케이텔레콤 주식회사 | 갑상선암의 서브타입 분류용 조성물 |
KR20190013240A (ko) * | 2017-08-01 | 2019-02-11 | 사회복지법인 삼성생명공익재단 | Ahr 분류에 기반한 갑상선암 예후 예측 방법 및 시스템 |
KR20190077997A (ko) * | 2017-12-26 | 2019-07-04 | 주식회사 클리노믹스 | 질병 및 표현형 위험도 예측 장치 및 방법 |
WO2021132920A1 (ko) * | 2019-12-27 | 2021-07-01 | 주식회사 클리노믹스 | 유전자 검사를 위한 맞춤형 유전자칩 및 이의 제작 방법 |
Families Citing this family (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10236078B2 (en) | 2008-11-17 | 2019-03-19 | Veracyte, Inc. | Methods for processing or analyzing a sample of thyroid tissue |
US9495515B1 (en) | 2009-12-09 | 2016-11-15 | Veracyte, Inc. | Algorithms for disease diagnostics |
AU2009321163A1 (en) * | 2008-11-26 | 2011-07-07 | Decode Genetics Ehf | Genetic variants useful for risk assessment of thyroid cancer |
CN102459636B (zh) | 2009-05-07 | 2016-08-17 | 威拉赛特公司 | 用于诊断甲状腺病症的方法和组合物 |
EP2686443A4 (en) * | 2011-03-17 | 2014-12-17 | Decode Genetics Ehf | GENETIC VARIANTS USEFUL IN ESTIMATING THE RISK OF THYROID CANCER |
US8718950B2 (en) | 2011-07-08 | 2014-05-06 | The Medical College Of Wisconsin, Inc. | Methods and apparatus for identification of disease associated mutations |
WO2013088457A1 (en) * | 2011-12-13 | 2013-06-20 | Decode Genetics Ehf | Genetic variants useful for risk assessment of thyroid cancer |
BR112015012239B1 (pt) | 2012-11-27 | 2022-07-19 | Pontificia Universidad Católica De Chile | Método in vitro de diagnóstico de câncer de tireoide |
US20170335396A1 (en) | 2014-11-05 | 2017-11-23 | Veracyte, Inc. | Systems and methods of diagnosing idiopathic pulmonary fibrosis on transbronchial biopsies using machine learning and high dimensional transcriptional data |
CN106021992A (zh) * | 2015-03-27 | 2016-10-12 | 知源生信公司(美国硅谷) | 位置相关变体识别计算流水线 |
US10395759B2 (en) | 2015-05-18 | 2019-08-27 | Regeneron Pharmaceuticals, Inc. | Methods and systems for copy number variant detection |
CN106636413B (zh) * | 2016-12-28 | 2019-07-16 | 常州市第二人民医院 | 一种用于诊断哮喘的分子标志物 |
US11217329B1 (en) | 2017-06-23 | 2022-01-04 | Veracyte, Inc. | Methods and systems for determining biological sample integrity |
CN107194206A (zh) * | 2017-06-26 | 2017-09-22 | 思畅信息科技(上海)有限公司 | 一种基于大数据的染色体异常位点的筛选方法 |
CN108315425B (zh) * | 2018-04-10 | 2021-08-06 | 广东省人民医院(广东省医学科学院) | 甲状腺癌转移相关基因检测用的pcr特异性引物、试剂盒及其使用方法 |
US11216742B2 (en) | 2019-03-04 | 2022-01-04 | Iocurrents, Inc. | Data compression and communication using machine learning |
Family Cites Families (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4376110A (en) * | 1980-08-04 | 1983-03-08 | Hybritech, Incorporated | Immunometric assays using monoclonal antibodies |
US5700637A (en) * | 1988-05-03 | 1997-12-23 | Isis Innovation Limited | Apparatus and method for analyzing polynucleotide sequences and method of generating oligonucleotide arrays |
US6054270A (en) * | 1988-05-03 | 2000-04-25 | Oxford Gene Technology Limited | Analying polynucleotide sequences |
US5223409A (en) * | 1988-09-02 | 1993-06-29 | Protein Engineering Corp. | Directed evolution of novel binding proteins |
US5143854A (en) * | 1989-06-07 | 1992-09-01 | Affymax Technologies N.V. | Large scale photolithographic solid phase synthesis of polypeptides and receptor binding screening thereof |
US5744101A (en) * | 1989-06-07 | 1998-04-28 | Affymax Technologies N.V. | Photolabile nucleoside protecting groups |
US5288644A (en) * | 1990-04-04 | 1994-02-22 | The Rockefeller University | Instrument and method for the sequencing of genome |
EP0695941B1 (en) * | 1994-06-08 | 2002-07-31 | Affymetrix, Inc. | Method and apparatus for packaging a chip |
US6287850B1 (en) * | 1995-06-07 | 2001-09-11 | Affymetrix, Inc. | Bioarray chip reaction apparatus and its manufacture |
US6300063B1 (en) * | 1995-11-29 | 2001-10-09 | Affymetrix, Inc. | Polymorphism detection |
EP0912761A4 (en) * | 1996-05-29 | 2004-06-09 | Cornell Res Foundation Inc | DETERMINATION OF DIFFERENCES IN THE NUCLEIC ACID SEQUENCE BY MEANS OF A COMBINATION OF LIGASE DETERMINATION AND POLYMERASE CHAIN REACTION |
US6429027B1 (en) * | 1998-12-28 | 2002-08-06 | Illumina, Inc. | Composite arrays utilizing microspheres |
US20020077775A1 (en) * | 2000-05-25 | 2002-06-20 | Schork Nicholas J. | Methods of DNA marker-based genetic analysis using estimated haplotype frequencies and uses thereof |
JP4729030B2 (ja) * | 2002-07-31 | 2011-07-20 | 株式会社東芝 | 塩基配列検出装置 |
JP4994676B2 (ja) * | 2006-02-27 | 2012-08-08 | 富士通株式会社 | 遺伝子多型解析支援プログラム、該プログラムを記録した記録媒体、遺伝子多型解析支援装置、および遺伝子多型解析支援方法 |
CN101608227A (zh) * | 2008-06-20 | 2009-12-23 | 上海主健生物工程有限公司 | 甲状腺癌遗传检测试剂盒 |
-
2009
- 2009-08-12 EP EP09787622A patent/EP2334820A1/en not_active Withdrawn
- 2009-08-12 KR KR1020117005803A patent/KR20110081807A/ko not_active Application Discontinuation
- 2009-08-12 NZ NZ591613A patent/NZ591613A/xx not_active IP Right Cessation
- 2009-08-12 CN CN200980139521.2A patent/CN102177252B/zh not_active Expired - Fee Related
- 2009-08-12 WO PCT/IS2009/000010 patent/WO2010018600A1/en active Application Filing
- 2009-08-12 CA CA2733910A patent/CA2733910A1/en not_active Abandoned
- 2009-08-12 AU AU2009280807A patent/AU2009280807A1/en not_active Abandoned
- 2009-08-12 US US13/058,790 patent/US20110230366A1/en not_active Abandoned
- 2009-08-12 JP JP2011522616A patent/JP2011530306A/ja active Pending
-
2011
- 2011-02-10 IL IL211177A patent/IL211177A0/en unknown
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20160051079A (ko) * | 2014-10-31 | 2016-05-11 | 에스케이텔레콤 주식회사 | 갑상선암의 서브타입 분류용 조성물 |
KR20190013240A (ko) * | 2017-08-01 | 2019-02-11 | 사회복지법인 삼성생명공익재단 | Ahr 분류에 기반한 갑상선암 예후 예측 방법 및 시스템 |
KR20190077997A (ko) * | 2017-12-26 | 2019-07-04 | 주식회사 클리노믹스 | 질병 및 표현형 위험도 예측 장치 및 방법 |
WO2021132920A1 (ko) * | 2019-12-27 | 2021-07-01 | 주식회사 클리노믹스 | 유전자 검사를 위한 맞춤형 유전자칩 및 이의 제작 방법 |
Also Published As
Publication number | Publication date |
---|---|
CN102177252A (zh) | 2011-09-07 |
US20110230366A1 (en) | 2011-09-22 |
CN102177252B (zh) | 2014-12-24 |
NZ591613A (en) | 2013-01-25 |
JP2011530306A (ja) | 2011-12-22 |
CA2733910A1 (en) | 2010-02-18 |
IL211177A0 (en) | 2011-04-28 |
EP2334820A1 (en) | 2011-06-22 |
AU2009280807A1 (en) | 2010-02-18 |
WO2010018600A1 (en) | 2010-02-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR20110081807A (ko) | 갑상선암의 위험도 평가를 위해 유용한 유전적 변이 | |
KR101374304B1 (ko) | 타입 2 당뇨병의 위험에 대한 진단 마커인 tcf7l2유전자의 유전적 변이체 | |
DK2471954T3 (en) | Susceptibility genetic variants associated with cardiovascular diseases | |
CN101874120B (zh) | 作为用于乳腺癌风险评估、诊断、预后和治疗的标记的chr2和chr16的遗传性变型 | |
CN101784675B (zh) | 用于剥脱性综合征和青光眼的诊断、预后和治疗的标记物的chr 15q24上的遗传变异 | |
CA2566256C (en) | Genetic polymorphisms associated with liver fibrosis methods of detection and uses thereof | |
DK2414543T3 (en) | Genetic markers for risk management of atrial fibrillation and stroke | |
KR20100017865A (ko) | 유방암의 위험도 평가, 진단, 예후 및 치료용 마커인 염색체 5p12 및 염색체 10q26 상의 유전적 변이 | |
KR20110036608A (ko) | 유방암 위험도 평가를 위한 유전적 변이 | |
CN101641451A (zh) | chr8q24.21上的癌症易感性变体 | |
US20090305284A1 (en) | Methods for Identifying Risk of Breast Cancer and Treatments Thereof | |
CN111183234A (zh) | 在表达pnpla3 i148m变异的患者的肝病治疗中对hsd17b13的抑制 | |
CA2651376A1 (en) | Method for diagnosis and treatment of a mental disease | |
KR102481305B1 (ko) | 유전자에 기반한 염증성 장 질환의 진단 | |
US20230390280A1 (en) | Biomarkers for the diagnosis and treatment of fibrotic lung disease | |
US20030099958A1 (en) | Diagnosis and treatment of vascular disease | |
WO2006022634A1 (en) | Methods for identifying risk of type ii diabetes and treatments thereof | |
WO2006022638A1 (en) | Methods for identifying risk of type ii diabetes and treatments thereof | |
KR101114033B1 (ko) | 단일염기다형을 포함하는 폴리뉴클레오티드, 이를 포함하는 마이크로어레이 및 진단키트, 및 이를 이용한 분석방법 | |
KR102327623B1 (ko) | 천식 진단용 snp 및 이를 이용한 천식 진단 방법 | |
US20090258344A1 (en) | Methods for identifying risk of breast cancer and treatments thereof | |
US20030124536A1 (en) | Diagnosis and treatment of vascular disease | |
CA2826522A1 (en) | Genetic polymorphism in pnlpa3 associated with liver fibrosis methods of detection and uses thereof | |
CN1936017A (zh) | 胰升糖素样肽-1受体基因多态性与2型糖尿病的相关性 | |
KR20100028985A (ko) | 한국인의 폐암 발생 위험도를 예측하는 방법 및 이를 이용한 진단 키트 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
E902 | Notification of reason for refusal | ||
E601 | Decision to refuse application |