KR20110081807A

KR20110081807A - 갑상선암의 위험도 평가를 위해 유용한 유전적 변이

Info

Publication number: KR20110081807A
Application number: KR1020117005803A
Authority: KR
Inventors: 율리우스 구드문트쏭; 다니엘 구드뱌르쏭; 파트리끄 쉴럼
Original assignee: 디코드 제네틱스 이에이치에프
Priority date: 2008-08-12
Filing date: 2009-08-12
Publication date: 2011-07-14
Also published as: CN102177252A; US20110230366A1; CN102177252B; NZ591613A; JP2011530306A; CA2733910A1; IL211177A0; EP2334820A1; AU2009280807A1; WO2010018600A1

Abstract

본 발명은 갑상선암의 감수성 변이로 결정된 유전적 변이(genetic variant)를 개시한다. 그와 같은 변이를 이용하여 갑상선암에 대한 증가된 감수성의 결정을 포함한 질병 관리 방법, 치료에 대한 반응을 예측하는 방법 및 갑상선암의 예후를 예측하는 방법이 기재된다. 본 발명은 또한 본 발명의 방법에서 유용한 키트에 관한 것이다.

Description

갑상선암의 위험도 평가를 위해 유용한 유전적 변이{Genetic variants useful for risk assessment of thyroid cancer}

갑상선암

갑상선 암종은 가장 흔한 고전적 내분비 암이고, 그 발생률이 과거 수십년 동안 미국 및 기타 선진국에서 급속하게 증가하고 있다. 갑상선암은 조직학적으로 4개의 그룹으로 분류된다: 유두암(papillary), 여포암(follicular), 수질암(medullary), 및 미분화(undifferentiated) 또는 퇴행성(anaplastic) 갑상선암 (DeLellis, R. A., J Surg Oncol, 94, 662 (2006)). 유두암 및 여포암(Hurthle-세포 변이체 포함)은 통합적으로 분화 갑상선암으로 알려져 있고, 이들은 발병 케이스의 약 95%를 차지한다 (DeLellis, R. A., J Surg Oncol, 94, 662 (2006)). 2008년에, 미국에서 37,000 건 이상의 신규 케이스가 진단되고, 그들 중 약 75%가 여성일 것(남성 대 여성의 비는 1:3.2임)으로 예상된다 (Jemal, A., et al., Cancer statistics, 2008. CA Cancer J Clin, 58: 71-96, (2008)). 조기 단계에 진단되는 경우, 갑상선암은 모든 환자들 중 97%의 5-년 생존율을 갖는 관리가능한 질병이나, 미국에서 2008년에 약 1,600명이 이 질환으로 사망할 것으로 예상된다(Jemal, A., et al., Cancer statistics, 2008. CA Cancer J Clin, 58: 71-96, (2008)). 보다 진행된 질환으로 진단된 개인들 중에서 생존율은 더 낮고(~40%); 즉, 대형, 침윤성 종양 및/또는 원격 전이를 갖는 개인들은 XX

40%의 5-년 생존율을 갖는다(Sherman, S. I., et al., 3rd, Cancer, 83, 1012 (1998), Kondo, T., Ezzat, S., and Asa, S. L., Nat Rev Cancer, 6, 292 (2006)). 방사성요오드-내성 전이성 질환의 경우, 효과적인 치료법이 없고, 이 환자들의 10-년 생존율은 15% 미만이다(Durante, C., et al., J Clin Endocrinol Metab, 91, 2892 (2006)). 따라서, 새로운 진단 도구 및 보다 우수한 치료 옵션을 개발하기 위해 갑상선암 진행의 분자적 원인에 대한 보다 진보된 이해가 요구된다.

비교적 드물지만(미국에서 모든 악성종양의 1%), 갑상선암의 발생률은 미국에서 1984년과 2004년 사이에 두배 이상 증가되었고; 이 증가는 거의 대부분 갑상선 유두암 진단에 기인한다(SEER web report; Ries L, Melbert D, Krapcho M et al (2007) SEER cancer statistics review, 1975_2004. National Cancer Institute, Bethesda, MD, http://seer.cancer.gov/csr/1975_2004/, based on November 2006 SEER data submission). 1995년과 2004년 사이에, 갑상선암은 복막(peritoneum), 간막(omentum), 및 장간막(mesentery) 암 및 "기타(other)" 소화기암(digestive cancer) 다음으로, 제3위의 가장 빠르게 증가하는 암 진단이었다[SEER web report]. 비슷하게, 갑상선암 발생률의 급격한 증가가 또한 캐나다, 호주, 이스라엘, 및 여러 유럽 국가에서 관찰되었다 (Liu, S., et al., Br J Cancer, 85, 1335 (2001), Burgess, J. R., Thyroid, 12, 141 (2002), Lubina, A., et al., Thyroid, 16, 1033 (2006), Colonna, M., et al., Eur J Cancer, 38, 1762 (2002), Leenhardt, L., et al., Thyroid, 14, 1056 (2004), Reynolds, R. M., et al., Clin Endocrinol (Oxf), 62, 156 (2005), Smailyte, G., et al., BMC Cancer, 6, 284 (2006)). 이 질환을 유발하는 인자들은 규명되지 않고 있다. 공지된 위험 인자의 증가의 명확한 부재 하에, 과학자들은 진단 방법의 변화가 원인이 될 수 있는 것으로 널리 추측했다(Davies, L. and Welch, H. G., Jama, 295, 2164 (2006), Verkooijen, H. M., et al., Cancer Causes Control, 14, 13 (2003)).

갑상선암의 주요한 공지된 위험 인자는 방사선 노출이다. 노출의 잠정적 출처는 진단 및 치료 의학에서 이용되는 방사선 조사, 및 핵 폭발로부터의 방사성 분진이다. 그러나, 지난 20년 동안 미국에서 어느 출처도 증가되지 않았다. 한때, 미국에서 흔했던, 양성 아동 상태(benign childhood condition)를 위한 두경부에 대한 방사선 요법이 1950년대 초반 이후 감소되었다 (Zheng, T., et al., Int J Cancer, 67, 504 (1996)). 마찬가지로, 미국에서 핵무기의 대기 테스트(atmospheric testing)가 제한적 핵 실험 금지 협정(Limited Test Ban Treaty)의 체결로 1963년에 중단되었다. 완전히 명확한 것은 아니나, 그와 같은 핵 실험의 갑상선암에 대한 영향은 제한적인 것으로 사료된다 (Gilbert, E. S., et al., J Natl Cancer Inst, 90, 1654 (1998), Hundahl, S. A., CA Cancer J Clin, 48, 285 (1998), Robbins, J. and Schneider, A. B., Rev Endocr Metab Disord, 1, 197 (2000)).

갑상선암 발생률의 증가는 갑상선암의 실제 발생률의 증가보다는, 무증상 암(sub-clinical cancer)의 검출 증가에서 기인할 수 있다 (Davies, L. and Welch, H. G., Jama, 295, 2164 (2006)). 미국에서 갑상선암 발생률은 수십년 동안 증가하고 있으나, 사망률은 비교적 일정하게 유지되었다 (Davies, L. and Welch, H. G., Jama, 295, 2164 (2006)). 1980년대 초음파촬영술 및 미세침 흡인 생검법(fine-needle aspiration biopsy)의 도입이 소결절의 검출을 개선했고 결절의 세포학적 평가를 보다 일상적인 것이 되게 하였다 (Rojeski, M. T. and Gharib, H., N Engl J Med, 313, 428 (1985), Ross, D. S., J Clin Endocrinol Metab, 91, 4253 (2006)). 이와 같은 증가된 진단 정밀성(diganostic scrutiny)은 잠재적으로 치명적인 갑상선암의 조기 검출을 가능하게 할 수 있다. 그러나, 여러 연구는 갑상선암을 갑상선암으로 진단되지 않은 개인에서 흔한 부검 발견사항(최대 35%)으로 보고한다 (Bondeson, L. and Ljungberg, O., Cancer, 47, 319 (1981), Harach, H. R., et al., Cancer, 56, 531 (1985), Solares, C. A., et al., Am J Otolaryngol, 26, 87 (2005) and Sobrinho-Simoes, M. A., Sambade, M. C., and Goncalves, V., Cancer, 43, 1702 (1979)). 이는 많은 사람들이 그들의 건강에 대한 위협이 거의 또는 전혀 아닌 갑상선암의 무증상 형태를 가지고 살고 있다는 것을 시사한다.

PTC 개시를 유발하는 것으로 사료되는 체세포 유전적 결함이 대부분의 케이스에서 확인되었다; 이들은 RET의 티로신 키나아제 도메인을 포함한 유전적 재배열(genetic rearrangement) 및 BRAF 및 RAS의 활성화 돌연변이를 포함한다(Kondo, T., Ezzat, S., and Asa, S. L., Nat Rev Cancer, 6, 292 (2006), Tallini, G., Endocr Pathol, 13, 271 (2002)., Fagin, J. A., Mol Endocrinol, 16, 903 (2002)). 일부 상관관계 연구가 특이적 유전적 변화와 공격적인 암 거동 간의 연관관계를 뒷받침하나 (Nikiforova, M. N., et al., J Clin Endocrinol Metab, 88, 5399 (2003), Trovisco, V., et al., J Pathol, 202, 247 (2004), Garcia-Rostan, G., et al., J Clin Oncol, 21, 3226 (2003), Nikiforov, Y. E., Endocr Pathol, 13, 3 (2002)), p53의 돌연변이 (Fagin, J. A., et al., J Clin Invest, 91, 179 (1993), La Perle, K. M., et al., Am J Pathol, 157, 671 (2000)), β-카테닌 신호전달 조절곤란 (Karim, R., et al., Pathology, 36, 120 (2004)), 사이클린-D1의 상향-조절(Khoo, M. et al., J Clin Endocrinol Metab, 87, 1810 (2002)), 및 전이-촉진, 혈관생성- 및/또는 세포 부착-관련 유전자의 과발현 (Klein, M., et al., J Clin Endocrinol Metab, 86, 656 (2001), Yu, X. M., et al., Clin Cancer Res, 11, 8063 (2005), Guarino, V., et al., J Clin Endocrinol Metab, 90, 5270 (2005), Brabant, G., et al., Cancer Res, 53, 4987 (1993), Scheumman, G. F., et al., J Clin Endocrinol Metab, 80, 2168 (1995), Maeta, H., Ohgi, S., and Terada, T., Virchows Arch, 438, 121 (2001) and Shiomi, T. and Okada, Y., Cancer Metastasis Rev, 22, 145 (2003))을 포함한, 공격적 PTC에서 거의 배타적으로 발견되는 다수의 사건이 있다. 원발성 PTC의 침윤성 영역은 증가된 Akt 활성 및 세포질 p27 국재화를 빈번하게 특징으로 한다는 것이 입증되었다 (Ringel, M. D., et al., Cancer Res, 61, 6105 (2001), Vasko, V., et al., J Med Genet, 41, 161 (2004)). 인 비트로에서 PTC 세포 침윤에서 PI3 키나아제, Akt, 및 p27의 기능적 역할도 입증되었다 (Guarino, V., et al., J Clin Endocrinol Metab, 90, 5270 (2005), Vitagliano, D., et al., Cancer Res, 64, 3823 (2004), Motti, M. L., et al., Am J Pathol, 166, 737 (2005)). 그러나, 증가된 Akt 활성과 침윤 간의 상관관계가 활성화 BRAF 돌연변이를 갖는 PTC에서 발견되지 않았다. 가장 중요하게는, 이와 같은 집중된 연구는 침윤성 PTC 세포에서 어떤 생물학적 기능 및 신호전달 경로가 변화되는지의 보다 포괄적인 문제를 해결하지 못한다.

갑상선 수질암(Medullary Thyroid Cancer)

모든 갑상선암의 케이스 중에서, 2% 내지 3%가 수질성 종류이다(갑상선 수질암, MTC)(Hundahl, S. A., et al., Cancer, 83, 2638 (1998)). MTC의 평균 생존율은 보다 흔한 갑상선암의 생존율보다 더 낮고, 예를 들면, 갑상선 유두암 및 갑상선 여포암의 5-년 생존율, 90% 내지 94% 대비 MTC는 83%의 5-년 생존율을 갖는다(Hundahl, S. A., et al., Cancer, 83, 2638 (1998), Bhattacharyya, N., Otolaryngol Head Neck Surg, 128, 115 (2003)). 생존율은 진단시 병기(stage)와 상관관계를 가지며, MTC의 감소된 생존율은 부분적으로 말기 진단의 높은 비율에 의해 설명될 수 있다 (Hundahl, S. A., et al., Cancer, 83, 2638 (1998), Bhattacharyya, N., Otolaryngol Head Neck Surg, 128, 115 (2003), Modigliani, E., et al., J Intern Med, 238, 363 (1995)). 1,252명의 갑상선 수질암 환자를 대상으로 한 SEER(Surveillance, Epidemiology, and End Results) 집단-기반 연구는 생존율이 국소 질환의 정도에 따라 변화된다는 것을 발견했다. 예를 들면, 10-년 생존율은 갑상선에 한정된 질병의 경우 95.6% 내지 원격 전이를 갖는 질병의 경우, 40% 범위인 것으로 발견했다 (Roman, S., Lin, R., and Sosa, J. A., Cancer, 107, 2134 (2006)).

MTC는 갑상선의 부여포(parafollicular) 칼시토닌-분비 세포로부터 유래된다. MTC는 산발성 형태 및 가족성 형태에서 발생하며 C-세포 과다형성(C-cell hyperplasia, CCH)은 중년 성인에서 비교적 흔한 이상증이나, CCH에 의해 선행될 수 있다. 스웨덴에서 집단-기반 연구에서, MTC를 갖는 환자의 26%가 가족성 형태를 가졌다 (Bergholm, U., Bergstrom, R., and Ekbom, A., Cancer, 79, 132 (1997)). 프랑스 국가 등록부 및 미국 임상 동향(clinical series)은 모두 가족성 케이스의 보다 높은 비율을 보고했다 (각각, 43% 및 44%) (Modigliani, E., et al., J Intern Med, 238, 363 (1995), Kebebew, E., et al., Cancer, 88, 1139 (2000)). 가족성 케이스는 종종 RET 원형-종양유전자(proto-oncogene)의 유전된 돌연변이에 의해 유발된 상염색체 우성 유전적 질환(autosomal dominant genetic disorder)의 그룹인 제2형 다발성 내분비 선종증(multiple endocrine neoplasia type 2)의 존재를 종종 나타낸다 (OMIM, online mendelian inheritance in men (http://www.ncbi.nlm.nih.gov/sites/entrez?db=omim)).

퇴행성 갑상선암(Anaplastic thyroid cancer)

퇴행성 종양은 모든 갑상선암 중 가장 흔하지 않고(약 0.5 내지 1.5%) 가장 치명적이다. 이 암은 매우 낮은 치료율을 가지며, 최상의 치료는 환자의 10% 만이 진단 후 3년 동안 생존할 수 있게 한다. 퇴행성 갑상선암을 갖는 환자의 대부분은 그들이 진단된 날로부터 1년 살지 못한다. 퇴행성 갑상선암은 보다 분화된 갑상선 암 내에서 또는 심지어 갑상선종(goiter) 내에서도 종종 발생한다. 유두암 처럼, 퇴행성 갑상선암은 방사선 노출 후 수년(20년 이상) 후에 발생할 수 있다. 경부 전이(목의 림프절로의 암의 전파)가 진단시 케이스의 대부분(90% 이상)에 존재한다. 이 경부 영역에서 림프절 전이의 존재는 보다 높은 재발률을 유발하고 높은 사망률을 예측한다(Endocrine web, (http://www.endocrineweb.com/caana.html)).

유전적 위험도(genetic risk)는 집단 내의 개체들 간에 게놈 중 미묘한 차이에 의해 부여된다. 개인들 간의 게놈 차이는 가장 빈번하게는 단일 염기 다형성(single nucleotide polymorphisms, SNP) 때문에 발생하나, 카피 수 변이(copy number variation, CNV)와 같은 다른 변이도 중요하다. SNP는 인간 게놈에서 평균 1000개의 염기쌍마다 존재한다. 따라서, 250,000개의 염기쌍(bp)을 포함하는 통상적인 인간 유전자는 250개의 상이한 SNP를 포함할 수 있다. 소수의 SNP만이 엑손에 위치하고, 해당 유전자에 의해 코딩된 단백질의 아미노산 서열을 변화시킨다. 대부분의 SNP는 유전자 기능에 거의 또는 전혀 효과를 갖지 않을 수 있고, 다른 SNP는 해당 유전자에 의해 코딩된 mRNA의 전사, 스플라이싱(splicing), 번역, 또는 안정성을 변화시킬 수 있다. 인간 게놈에서 추가적인 유전적 다형성이 DNA의 짧거나 또는 긴 스트레치(stretch)의 삽입, 결실, 전위(translocation), 또는 역전에 의해 유발된다. 따라서, 질병 위험도를 부여하는 유전적 다형성은 단백질의 아미노산 서열을 직접적으로 변화시킬 수 있거나, 해당 유전자로부터 생성된 단백질의 양을 증가시킬 수 있거나, 또는 해당 유전자에 의해 생성된 단백질의 양을 감소시킬 수 있다.

흔한 질환의 위험도를 부여하는 유전적 다형성이 밝혀져서, 그와 같은 위험 인자에 대한 유전적 테스트가 임상 의학에서 중요해지고 있다. 최근의 예는 알쯔하이머병의 차등적 진단(differential diagnosis)을 위해 치매 환자에서 apoE4 다형성의 유전적 보인자를 확인하기 위한 아포리포프로테인(apolipoprotein) E 테스트 및 심부 정맥 혈전증에 대한 소인을 테스트하기 위한 Factor V Leiden 테스트이다. 보다 중요하게는, 암의 치료에서, 종양 세포의 유전적 변이의 진단이 개별 환자를 위한 가장 적합한 치료 방법(treatment regime)의 선택을 위해 이용된다. 유방암에서, 에스트로겐 수용체 발현 또는 Her2(heregulin type 2) 수용체 티로신 키나아제 발현의 유전적 변이가 항-에스트로겐 약물(타목시펜) 또는 항-Her2 항체(Herceptiin)가 치료 계획 내에 포함되어야 하는지 여부를 결정한다. 필라델피아 염색체의 만성 골수성 백혈병(chronic myeloid leukemia, CML) 진단에서, Bcr 및 Abl 수용체 티로신 키나아제를 코딩하는 유전자를 융합하는 유전적 전좌(genetic translocation)는 Bcr-Abl 키나아제의 특이적 저해제인 Gleevec(STI571)이 암의 치료를 위해 이용되어야 한다는 것을 나타낸다. 그와 같은 유전적 변화를 갖는 CML 환자의 경우, Bcr-Abl 키나아제의 저해는 종양 세포의 신속한 제거 및 백혈병의 완화를 가져온다.

갑상선암의 감수성을 부여하는 유전적 변이에 대한 충족되지 않은 요구가 존재한다. 그와 같은 변이는 갑상선암을 발병할 특정한 위험도의 개인들이 확인될 수 있는 유용성에 근거하여, 갑상선암의 위험 관리를 위해 유용할 것으로 예상된다. 본 발명은 그와 같은 감수성 변이를 제공한다.

발명의 요약

본 발명은 특정한 유전적 변이가 갑상선암의 위험도와 상관관계를 갖는다는 발견에 근거한, 갑상선암의 위험도 관리 방법에 관한 것이다. 따라서, 본 발명은 인간에서 갑상선암의 감수성과 상관관계를 갖는 것으로 확인된 특정한 마커의 평가를 통해, 갑상선암의 증가된 감수성 또는 증가된 위험도를 결정하는 방법, 및 갑상선암의 감소된 감수성을 결정하는 방법을 포함한다. 본 발명의 다른 양태는 갑상선암으로 진단된 개인들의 예후를 평가하는 방법, 갑상선암의 치료제 또는 치료법에 대해 반응할 확률을 평가하는 방법, 및 갑상선암으로 진단된 개인들의 치료 진행을 모니터링하는 방법에 관한 것이다.

일 양태에서, 본 발명은 개인으로부터 수득된 핵산 시료에서 rs965513, 및 이와 연관 불균형(linkage disequilibrium)인 마커들로부터 선택된 하나 이상의 다형성 마커의 하나 이상의 대립인자의 존재 또는 부재를 결정하는 단계를 포함하는, 개인에서 갑상선암에 대한 감수성을 결정하는 방법으로서, 상기 하나 이상의 대립인자의 존재는 상기 개인의 갑상선암에 대한 감수성을 나타내는 것인 방법에 관한 것이다. 본 발명은 또한 rs965513 (서열번호 1), 및 이와 연관 불균형인 마커들로부터 선택된 하나 이상의 다형성의 하나 이상의 대립인자의 존재 또는 부재를 결정하는 것에 의해 갑상선암에 대한 감수성을 결정하는 방법으로서, 상기 하나 이상의 대립인자의 존재의 결정은 갑상선암에 대한 감수성을 나타내는 것인 방법에 관한 것이다.

또 다른 양태에서, 본 발명은 개인으로부터 수득된 핵산 시료 또는 개인으로부터 유래된 유전형 데이터세트(genotype dataset)에서 하나 이상의 다형성 마커의 하나 이상의 대립인자의 존재 또는 부재를 결정하는 단계를 포함하는, 개인에서 갑상선암에 대한 감수성을 결정하는 방법으로서, 상기 하나 이상의 다형성 마커는 rs965513 및 이와 연관 불균형(linkage disequilibrium)인 마커들로부터 선택되고, 상기 하나 이상의 대립인자의 존재는 상기 개인의 갑상선암에 대한 감수성을 나타내는 것인 방법에 관한 것이다.

또 다른 양태에서, 본 발명은 개인으로부터 유래된 유전형 데이터세트에 하나 이상의 다형성 마커의 하나 이상의 위험 대립인자가 존재하는지 여부를 결정하는 단계를 포함하는, 개인에서 갑상선암에 대한 감수성을 결정하는 방법으로서, 상기 하나 이상의 다형성 마커는 마커 rs965513 (서열번호 1), 및 이와 연관 불균형인 마커들로부터 선택되고, 상기 하나 이상의 위험 대립인자의 존재의 결정은 상기 개인에서 갑상선암에 대한 증가된 감수성을 나타내는 것인 방법에 관한 것이다.

일 구체예에서, 유전형 데이터세트는 마커 정체(marker identity), 및 마커의 하나 이상의 대립인자에 대한 개체의 대립인자 상태에 대한 정보, 즉, 개체에서 상기 마커의 하나 이상의 대립인자의 정체에 대한 정보를 포함한다. 유전형 데이터세트는 두개 이상의 마커, 세개 이상의 마커, 다섯개 이상의 마커, 열개 이상의 마커, 백개 이상의 마커 등을 포함한, 하나 이상의 마커에 대한 대립인자 정보(대립인자 상태(allelic status)에 관한 정보)를 포함할 수 있다. 일부 구체예에서, 유전형 데이터세트는 수십만개의 마커, 또는 심지어 개체의 전체 게놈을 포괄하는 백만개 이상의 마커를 포함할 수 있는, 개체의 전체 게놈 평가로부터의 유전형 정보를 포함한다.

특정한 구체예에서, 상기 하나 이상의 다형성 마커는 FoxE1 유전자와 연관된다.

본 발명의 또 다른 양태는 개인에서 갑상선암에 대한 감수성을 결정하는 방법으로서, 상기 방법은:

rs965513 (서열번호 1), 및 이와 연관 불균형인 마커들로부터 선택된 하나 이상의 다형성 마커의 하나 이상의 대립인자를 식별하는, 개인에 대한 핵산 서열 데이터를 수득하는 단계로서, 상기 하나 이상의 다형성 마커의 상이한 대립인자는 인간에서 갑상선암에 대한 상이한 감수성과 연관되는 것인 단계, 및

상기 핵산 서열 데이터로부터 갑상선암에 대한 감수성을 결정하는 단계를 포함하는 것인 방법에 관한 것이다.

본 발명은 또한, 개인에서 갑상선암에 대한 감수성을 결정하는 방법에 관한 것이고, 상기 방법은 FoxE1 유전자와 연관된 하나 이상의 다형성 마커의 하나 이상의 대립인자를 식별하는, 개인에 대한 핵산 서열 데이터를 수득하는 단계로서, 상기 하나 이상의 다형성 마커의 상이한 대립인자는 인간에서 갑상선암에 대한 상이한 감수성과 연관되는 것인 단계, 및 상기 핵산 서열 데이터로부터 갑상선암에 대한 감수성을 결정하는 단계를 포함한다.

일반적으로, 다형성 유전적 마커는 핵산 수준에서 대안적인(alternate) 서열을 초래한다. 핵산 마커가 그 핵산에 의해 코딩된 폴리펩티드의 코돈을 변화시키면, 마커도 코딩된 폴리펩티드의 아미노산 수준에서 대안적인 서열(폴리펩티드 마커)을 초래할 것이다. 핵산 중 다형성 마커에서 특정 대립인자 또는 폴리펩티드 마커에서 특정 대립인자 정체의 결정은 특정한 대립인자가 해당 서열 중 특정한 위치에 존재하는지 여부를 포함한다. 마커의 특정한 대립인자를 식별하는 서열 데이터는 상기 특정한 대립인자를 검출하기 위한 충분한 서열을 포함한다. 본 명세서에 기재된 단일 뉴클레오티드 다형성(single nucleotide polymorphism, SNP) 또는 아미노산 다형성의 경우, 서열 데이터는 단일 위치에서의 서열, 즉, 서열 내 단일 위치에서의 뉴클레오티드 또는 아미노산의 정체를 포함할 수 있다. 상기 서열 데이터는 선택적으로 다형성 부위를 플랭킹(flank)하는 서열에 대한 정보를 포함할 수 있고, 상기 서열은 SNP의 경우 단일 뉴클레오티드일 수 있다.

특정한 구체예에서, 두 개 이상의 다형성 마커에 대해 핵산 서열을 결정하는 것이 유용할 수 있다. 다른 구체예에서, 3개 이상, 4개 이상 또는 5개 이상의 다형성 마커의 핵산 서열이 결정된다. 일배체형 정보가 두 개 이상의 다형성 마커의 분석으로부터 유래될 수 있다. 따라서, 특정한 구체예에서, 추가적인 단계가 수행되고, 이에 의해 일배체형 정보가 두 개 이상의 다형성 마커에 대한 서열 정보에 근거하여 유래된다.

본 발명은 또한 개인에서 갑상선암에 대한 감수성을 결정하는 방법으로서, 상기 방법은 rs965513 (서열번호 1), 및 이와 연관 불균형인 마커들로부터 선택된 두 개 이상의 다형성 마커의 두 개의 대립인자 모두를 식별하는, 개인에 대한 핵산 서열 데이터를 수득하는 단계, 상기 서열 데이터에 근거하여 하나 이상의 일배체형의 정체(identity)를 결정하는 단계, 및 상기 일배체형 데이터로부터 갑상선암에 대한 감수성을 결정하는 단계를 포함하는 것인 방법을 제공한다.

특정한 구체예에서, 감수성의 결정은 하나 이상의 다형성 마커와 갑상선암에 대한 감수성 간의 상관관계를 포함하는 데이터베이스와 핵산 서열 데이터를 비교하는 단계를 포함한다. 일부 구체예에서, 상기 데이터베이스는 상기 하나 이상의 마커에 대해 갑상선암에 대한 감수성의 하나 이상의 위험도 척도(risk measure)를 포함한다. 서열 데이터베이스는 예를 들면, 하나 또는 복수의 특정한 다형성에 대해 갑상선암의 감수성을 나타내는 데이터를 포함하는 참조표로 제공될 수 있다. 데이터베이스는 또한 두 개 이상의 다형성 마커를 포함하는 특정한 일배체형에 대한 감수성을 나타내는 데이터를 포함할 수 있다.

특정 구체예에서, 핵산 서열을 수득하는 것은 개인으로부터 생물학적 시료를 수득하는 단계 및 상기 시료 중 핵산에서 상기 하나 이상의 다형성 마커의 서열을 분석하는 단계를 포함할 수 있다. 서열을 분석하는 것은 상기 하나 이상의 다형성 마커의 하나 이상의 대립인자의 존재 또는 부재를 결정하는 것을 포함할 수 있다. 특정한 감수성 대립인자(예를 들면, 위험 대립인자)의 존재의 결정은 개인에서 갑상선암에 대한 감수성을 나타낸다. 특정한 감수성 대립인자의 부재의 결정은 하나 이상의 다형성에 의한 특정한 감수성이 개인에서 존재하지 않는다는 것을 나타낸다.

일부 구체예에서, 핵산 서열 데이터를 수득하는 것은 기존의 기록으로부터 핵산 서열 정보를 수득하는 것을 포함한다. 기존의 기록은 예를 들면, 개인에 대한, 하나 이상의 다형성 마커에 대한 유전형 데이터와 같은 서열 데이터를 포함하는 컴퓨터 파일 또는 데이터베이스일 수 있다.

본 발명의 진단 방법에 의해 결정된 감수성은 특정한 대상(entity)에게 보고될 수 있다. 일부 구체예에서, 상기 하나 이상의 대상은 개인, 개인의 후견인(guardian), 유전학 서비스 제공자, 의사, 의료 기관, 및 의료보험 회사로 구성된 군으로부터 선택된다.

본 발명의 특정한 구체예에서, 감수성의 결정은 핵산 서열 데이터를 상기 하나 이상의 다형성 마커와 갑상선암에 대한 감수성 간의 상관관계 데이터를 포함하는 데이터베이스에 비교하는 단계를 포함한다. 하나의 그와 같은 구체예에서, 데이터베이스는 상기 하나 이상의 다형성 마커에 대해 갑상선암에 대한 감수성의 하나 이상의 위험도 척도를 포함한다. 또 다른 구체예에서, 데이터베이스는 상기 하나 이상의 다형성 마커에 대해 상기 하나 이상의 상태의 하나 이상의 위험도 척도를 포함하는 참조표를 포함한다.

특정한 구체예에서, 핵산 서열 데이터를 수득하는 것은 개인으로부터 생물학 적 시료를 수득하는 단계 및 상기 시료 중 핵산에서 상기 하나 이상의 다형성 마커의 서열을 분석하는 단계를 포함한다. 상기 하나 이상의 다형성 마커의 서열을 분석하는 것은 상기 하나 이상의 다형성 마커의 하나 이상의 대립인자의 존재 또는 부재를 결정하는 것을 포함할 수 있다. 핵산 서열 데이터를 수득하는 것은 또한 기존의 기록으로부터 핵산 서열 정보를 수득하는 것을 포함할 수 있다.

본 발명의 특정한 구체예는 rs965513 (서열번호 1), 및 이와 연관 불균형인 마커들로부터 선택된 두 개 이상의 다형성 마커에 대한 핵산 서열 데이터를 수득하는 것에 관한 것이다.

본 발명의 특정한 구체예에서, 상기 하나 이상의 다형성 마커는 표 2에 표시된 마커들로부터 선택된다. 일 구체예에서, 상기 하나 이상의 다형성 마커는 서열번호 1 내지 229로 표시된 마커들로부터 선택된다. 일 구체예에서, 상기 하나 이상의 마커는 rs965513 (서열번호 1), rs907580 (서열번호 2) 및 rs7024345 (서열번호 3) 중 하나 이상과 연관 불균형이다. 또 다른 구체예에서, 상기 하나 이상의 마커는 rs965513 (서열번호 1), rs10759944 (서열번호 17), rs907580 (서열번호 2), rs10984103 (서열번호 37), rs925487 (서열번호 34), rs7024345 (서열번호 3) 및 rs1443434 (서열번호 30)로 구성된 군으로부터 선택된 하나 이상의 마커와 연관 불균형이다. 일 구체예에서, 상기 하나 이상의 마커는 rs965513 (서열번호 1), rs10759944 (서열번호 17), rs907580 (서열번호 2), rs10984103 (서열번호 37), rs925487 (서열번호 34), rs7024345 (서열번호 3) 및 rs1443434 (서열번호 30)로 구성된 군으로부터 선택된다.

본 발명의 특정한 구체예에서, 개체에서 하나 이상의 일배체형(haplotype)의 빈도를 평가하는 추가적인 단계가 수행된다. 그와 같은 구체예에서, 3개, 4개, 5개, 6개, 7개, 8개, 9개 또는 10개 이상의 마커들을 포함한, 2개 이상의 마커들이 일배체형에 포함될 수 있다. 일부 구체예에서, 상기 하나 이상의 일배체형은 rs965513 (서열번호 1), rs10759944 (서열번호 17), rs907580 (서열번호 2), rs10984103 (서열번호 37), rs925487 (서열번호 34), rs7024345 (서열번호 3) 및 rs1443434 (서열번호 30), 및 이들과 연관 불균형인 마커들로부터 선택된 마커들을 포함한다. 그와 같은 구체예에서, 상기 하나 이상의 일배체형은 전술된 마커들 중 하나가 존재하는 특정한 게놈 영역(예를 들면, LD 블럭)의 게놈 구조를 대표한다.

본 명세서에 기재된, 갑상선암의 위험도를 부여하는 마커들은 갑상선암에 대한 다른 유전적 마커와 조합될 수 있다. 그와 같은 마커들은 통상적으로 본 명세서에 기재된 마커들, 특히, 마커 rs965513 (서열번호 1), rs907580 (서열번호 2) 및 rs7024345 (서열번호 3)ID NO:6), rs9956546 (서열번호 7), rs11912922 (서열번호 8), rs6001954 (서열번호 9) 중 하나와 연관 불균형이 아니다. 본 명세서에 기재된 방법은 본 명세서에 기재된 유전적 위험 인자들을 갑상선암에 대한 추가적인 유전적 위험 인자들과 조합하는 것에 의해 실행될 수 있다.

따라서, 특정한 구체예에서, 마커 rs965513 (서열번호 1), rs907580 (서열번호 2) 및 rs7024345 (서열번호 3) 중 하나와 연관 불균형이 아닌 갑상선암에 대한 하나 이상의 위험 변이의 하나 이상의 위험 대리인자가 개인으로부터의 게놈 DNA를 포함하는 시료 또는 개인으로부터 유래된 유전형 데이터세트에 존재하는지 여부를 결정하는 단계를 포함하는 추가적인 단계가 포함된다. 바꾸어 말하면, 본 발명의 마커들과 조합된, 게놈의 다른 위치에 있는 유전적 마커는 복수의 유전적 변이에 기반하여 갑상선암의 전체 위험도를 결정하기 위해, 유용할 수 있다. 일 구체예에서, 상기 하나 이상의 갑상선암에 대한 위험 변이는 마커 rs965513 (서열번호 1)과 연관 불균형이 아니다. 연관 불균형이 아닌(LD가 아닌) 마커들의 선택은 본 명세서에서 더 설명되는 바와 같이, 연관 불균형에 대한 적합한 척도에 기반할 수 있다. 특정한 구체예에서, 연관 불균형이 아닌 마커들은 0.2 미만의 마커들을 상관시키는 LD 척도 r²의 값을 갖는다. 특정한 다른 구체예에서, LD가 아닌 마커들은 0.10 미만, 0.05 미만, 0.02 미만, 및 0.01 미만을 포함한, 0.15 미만의 마커들을 상관시키는 r²의 값을 갖는다. 전술된 값들 사이의 값들을 포함한, 마커들이 LD가 아니라는 것을 확립하기 위한 다른 적합한 수치값이 고려된다.

일 구체예에서, 전체 위험도를 확립하기 위해, 본 명세서에 기재된 하나 이상의 마커들의 평가가 염색체 14q13.3 상의 마커 rs944289, 또는 이와 연관 불균형인 마커들의 평가와 조합될 수 있다.

일부 구체예에서, 본 명세서에 기재된 복수의 마커들이 갑상선암의 전체 위험도를 결정하기 위해 결정된다. 따라서, 일부 구체예에서, 추가적인 단계가 포함되고, 상기 단계는 두개 이상의 다형성 마커 각각의 하나 이상의 대립인자가 개인으로부터 유래된 게놈 DNA를 포함하는 시료 또는 개인으로부터 유래된 유전형 데이터세트에 존재하는지 여부를 결정하는 단계를 포함하고, 상기 두개 이상의 다형성 마커에서 상기 하나 이상의 대립인자의 존재는 갑상선암에 대한 증가된 감수성을 나타낸다. 일 구체예에서, 마커들은 rs965513 (서열번호 1), 및 이와 연관 불균형인 마커들로 구성된 군으로부터 부터 선택된다. 일 구체예에서, 상기 마커들은 표 2에 표시된 마커들로 구성된 군으로부터 선택된다.

본 발명의 유전적 마커들은 또한 개인에 대한 전체 위험도를 확립하기 위해 비-유전적 정보와 조합될 수 있다. 따라서, 일부 구체예에서, 개인의 위험도 평가, 진단, 또는 예후의 판단을 수행하기 위해 비-유전적 정보를 분석하는 추가적인 단계가 포함된다. 비-유전적 정보는 개인의 질병 상태에 대한 정보 또는 개인에 대한 갑상선암의 전체 위험도의 추정에 영향을 미칠 수 있는 다른 정보일 수 있다. 일 구체예에서, 비-유전적 정보는 연령, 성별, 민족, 사회경제적 지위, 과거 질병 진단, 개인의 병력(medical history), 갑상선암의 가족력(family history), 생화학적 척도, 및 임상적 척도로부터 선택된다.

본 발명은 또한 컴퓨터-구현 양태(computer-implemented aspect)를 제공한다. 하나의 그와 같은 양태에서, 본 발명은 개인에서 갑상선암에 대한 감수성을 결정하기 위한 컴퓨터에서 실행가능한 프로그램(computer executable instructions)이 수록된 컴퓨터-판독가능한 매체로서, 상기 컴퓨터-판독가능한 매체는

하나 이상의 다형성 마커를 나타내는 데이터; 및

상기 컴퓨터-판독가능한 매체 상에 저장되고 개인에서 상기 하나 이상의 다형성 마커의 하나 이상의 대립인자의 대립인자 상태(allelic status)에 근거하여 개인에서 갑상선암에 대한 감수성을 결정하기 위해 프로세서에 의해 실행되도록 개조된 루틴(routine);을 포함하는 것인 컴퓨터-판독가능한 매체를 제공한다.

일 구체예에서, 하나 이상의 다형성 마커를 나타내는 상기 데이터는 상기 하나 이상의 다형성 마커에 연관된 갑상선암에 대한 감수성을 나타내는 하나 이상의 파라미터를 포함한다. 또 다른 구체예에서, 하나 이상의 다형성 마커를 나타내는 상기 데이터는 상기 개인에서 상기 하나 이상의 대립인자 마커의 하나 이상의 대립인자의 대립인자 상태를 나타내는 데이터를 포함한다. 또 다른 구체예에서, 상기 루틴은 상기 개인에서 상기 하나 이상의 대립인자 마커의 하나 이상의 대립인자에 대한 대립인자 상태를 나타내는 입력 데이터를 수용하도록 개조된다. 바람직한 구체예에서, 상기 하나 이상의 마커는 rs965513 (서열번호 1), 및 이와 연관 불균형인 마커들로부터 선택된다. 또 다른 바람직한 구체예에서, 상기 하나 이상의 다형성 마커는 표 2에 표시된 마커들로부터 선택된다.

본 발명은 또한 개인에서 갑상선암에 대한 유전적 지표(indicator)를 결정하기 위한 장치로서:

프로세서,

갑상선암에 관해 1명 이상의 개인에 대한 마커 및/또는 일배체형 정보를 분석하고 상기 마커 또는 일배체형 정보에 기반한 출력물(output)을 생성하기 위해 상기 프로세서 상에서 실행되도록 개조된 컴퓨터 실행가능한 프로그램이 수록된 컴퓨터 판독가능한 메모리를 포함하고,

상기 출력물은 상기 개인의 갑상선암의 유전적 지표로서 상기 하나 이상의 마커 또는 일배체형의 위험도 척도를 포함하는 것인 장치를 제공한다. 일 구체예에서, 상기 컴퓨터 판독가능한 메모리는 갑상선암으로 진단된 복수의 개인에서 상기 하나 이상의 다형성 마커의 하나 이상의 대립인자 또는 상기 하나 이상의 일배체형의 빈도를 나타내는 데이터와, 복수의 기준 개인(reference individual)에서 상기 하나 이상의 다형성 마커의 하나 이상의 대립인자 또는 상기 하나 이상의 일배체형의 빈도를 나타내는 데이터를 포함하고, 상기 위험도 척도는 상기 개인에 대한 상기 하나 이상의 마커 및/또는 일배체형 상태와 갑상선암으로 진단된 복수의 개인에 대한 상기 하나 이상의 마커 및/또는 하나 이상의 일배체형의 빈도를 나타내는 데이터의 비교에 근거한다. 일 구체예에서, 상기 컴퓨터 판독가능한 메모리는 상기 하나 이상의 다형성 마커의 하나 이상의 대립인자 또는 하나 이상의 일배체형과 연관된 갑상선암을 발병할 위험을 나타내는 데이터를 포함하고, 상기 개인에 대한 위험도 척도는 상기 개인에 대한 하나 이상의 마커 및/또는 일배체형 상태와 상기 하나 이상의 다형성 마커의 하나 이상의 대립인자 또는 하나 이상의 일배체형과 연관된 갑상선암을 발병할 위험도의 비교에 기반한다. 또 다른 구체예에서, 상기 컴퓨터 판독가능한 메모리는 갑상선암으로 진단된 복수의 개인에서 상기 하나 이상의 다형성 마커의 하나 이상의 대립인자 또는 상기 하나 이상의 일배체형의 빈도를 나타내는 데이터와, 복수의 기준 개인(reference individual)에서 상기 하나 이상의 다형성 마커의 하나 이상의 대립인자 또는 상기 하나 이상의 일배체형의 빈도를 나타내는 데이터를 더 포함하고, 갑상선암을 발병할 위험도는 갑상선암으로 진단된 개인과 기준 개인에서 상기 하나 이상의 대립인자 또는 일배체형의 빈도의 비교에 기반한다. 바람직한 구체예에서, 상기 하나 이상의 마커는 rs965513 (서열번호 1), 및 이와 연관 불균형인 마커들로 구성된 군으로부터 선택된다. 또 다른 바람직한 구체예에서, 상기 하나 이상의 다형성 마커는 표 2에 표시된 마커들로부터 선택된다.

또 다른 양태에서, 본 발명은 갑상선암에 대한 감수성을 평가하기 위해 이용될 마커를 확인하는 방법으로서, 상기 방법은 rs965513 (서열번호 1), rs907580(서열번호 2) 및 rs7024345 (서열번호 3) 중 하나 이상과 연관 불균형인 하나 이상의 다형성 마커를 확인하는 단계, 갑상선암으로 진단되거나 또는 갑상선암에 대한 감수성을 갖는 개인의 시료의 유전형 상태(genotype status)를 결정하는 단계, 및 대조군 개인의 시료의 유전형 상태를 결정하는 단계를 포함하고, 상기 대조군 시료에서의 하나 이상의 다형성의 하나 이상의 대립인자의 빈도 대비, 갑상선암으로 진단되거나, 또는 갑상선암에 대한 감수성을 갖는 개인에서 상기 하나 이상의 대립인자의 빈도의 유의성 있는 차이는 상기 하나 이상의 다형성이 갑상선암에 대한 감수성을 평가하기 위해 유용하다는 것을 나타내는 것인 방법에 관한 것이다. 유의성 있는 차이는 갑상선암 환자와 대조군에서 특정한 다형성 마커의 대립인자의 계수(allelic count)의 통계적 분석에 대해 추정될 수 있다. 일 구체예에서, 유의성 있는 차이는 갑상선암 환자와 대조군 간의 0.05 미만의 계산된 P-값에 근거한다. 다른 구체예에서, 유의성 있는 차이는 0.005 미만, 0.0005 미만, 또는 0.00005 미만과 같은, 계산된 P-값의 보다 낮은 값에 근거한다. 일 구체예에서, 대조군 시료에서 하나 이상의 다형성의 하나 이상의 대립인자의 빈도 대비, 갑상선암으로 진단되거나, 또는 갑상선암에 대한 감수성을 갖는 개인에서 상기 하나 이상의 다형성의 하나 이상의 대립인자의 빈도의 증가는 상기 하나 이상의 다형성이 갑상선암에 대한 증가된 감수성을 평가하기에 유용하다는 것을 나타낸다. 또 다른 구체예에서, 대조군 시료에서 상기 하나 이상의 다형성의 하나 이상의 대립인자의 빈도 대비, 갑상선암으로 진단되거나, 또는 갑상선암에 대한 감수성을 갖는 개인에서 상기 하나 이상의 다형성의 하나 이상의 대립인자의 빈도의 감소는 상기 하나 이상의 다형성이 갑상선암에 대한 감소된 감수성 또는 갑상선암에 대한 보호를 평가하기에 유용하다는 것을 나타낸다.

본 발명은 또한 개인으로부터 수득된 핵산 시료에서 하나 이상의 다형성 마커의 하나 이상의 대립인자가 존재하는지 여부를 결정하는 단계를 포함하는, 개인으로부터 수득된 핵산 시료의 유전형을 분석하는 방법으로서, 상기 하나 이상의 마커는 rs965513 (서열번호 1), 및 이와 연관 불균형인 마커들로부터 선택되고, 상기 시료에서 상기 하나 이상의 대립인자의 존재의 결정은 상기 개인에서 갑상선암에 대한 감수성을 나타내는 것인 방법에 관한 것이다. 일 구체예에서, rs965513 (서열번호 1)의 대립인자 C의 존재의 결정은 상기 개인에서 갑상선암의 증가된 감수성을 나타낸다. 일 구체예에서, 유전형 분석은 상기 하나 이상의 다형성 마커를 플랭킹(flanking)하는 뉴클레오티드 프라이머 쌍을 이용한 중합효소 연쇄 반응(PCR)에 의해, 상기 하나 이상의 다형성 마커를 포함하는 핵산의 세그먼트를 증폭하는 단계를 포함한다. 또 다른 구체예에서, 유전형 분석은 대립인자-특이적 프로브 혼성화, 대립인자-특이적 프라이머 연장(primer extension), 대립인자-특이적 증폭, 핵산 서열결정(nucleic acid sequencing), 5'-엑소뉴클레아제 처리(exonuclease digestion), 분자 표지 분석법(molecular beacon assay), 올리고뉴클레오티드 라이게이션 분석법(oligonucleotide ligation assay), 크기 분석, 단일 가닥 구조 분석(single-stranded conformation analysis) 및 마이크로어레이 기술로부터 선택된 방법을 이용하여 수행된다. 일 구체예에서, 상기 마이크로어레이 기술은 Molecular Inversion Probe 어레이 기술 또는 BeadArray Technologies이다. 일 구체예에서, 상기 방법은 대립인자-특이적 프로브 혼성화를 포함한다. 또 다른 구체예에서, 상기 방법은 마이크로어레이 기술을 포함한다. 하나의 바람직한 구체예는 (1) 상기 핵산의 카피를 검출 올리고뉴클레오티드 프로브 및 인핸서 올리고뉴클레오티드 프로브와, 상기 올리고뉴클레오티드 프로브와 상기 핵산 간의 특이적 혼성화 조건 하에 접촉시키는 단계로서,

(a) 상기 검출 올리고뉴클레오티드 프로브는 길이가 5 내지 100개의 뉴클레오티드로 구성되고 서열번호 1 내지 서열번호 229 중 하나에 의해 주어진 뉴클레오티드 서열을 갖는 핵산의 제1 세그먼트에 특이적으로 혼성화되고,

(b) 상기 검출 올리고뉴클레오티드 프로브는 3' 말단의 검출가능한 표지 및 5' 말단의 퀀칭 모이어티(quenching moiety)를 포함하며,

(c) 상기 인핸서 올리고뉴클레오티드는 길이가 5 내지 100개의 뉴클레오티드로 구성되고 상기 올리고뉴클레오티드 프로브의 5'에 배열된 상기 뉴클레오티드 서열의 제2 세그먼트에 상보적이어서, 상기 두개의 올리고뉴클레오티드가 모두 상기 핵산에 혼성화되는 경우 상기 인핸서 올리고뉴클레오티드는 상기 검출 올리고뉴클레오티드에 대해 3' 에 위치하며, 및

(d) 상기 제1 세그먼트와 상기 제2 세그먼트 간에 단일 염기 갭(single base gap)이 존재하여, 상기 올리고뉴클레오티드 프로브와 상기 인핸서 올리고뉴클레오티드 프로브가 모두 상기 핵산에 혼성화되는 경우, 상기 올리고뉴클레오티드 간에 단일 염기 갭이 존재하는 것인 단계,

(2) 상기 검출 프로브가 상기 핵산에 혼성화되는 경우, 상기 검출 프로브의 3' 말단으로부터 상기 검출가능한 표지를 절단하여 유리된 검출가능한 표지를 방출시키는 엔도뉴클레아제로 상기 핵산을 처리하는 단계, 및

(3) 유리된 검출가능한 표지를 측정하는 단계로서, 상기 유리된 검출가능한 표지의 존재는 상기 검출 프로브가 상기 핵산의 제1 세그먼트에 특이적으로 혼성화된다는 것을 나타내고, 상기 다형성 부위의 서열이 상기 검출 프로브의 상보체(complement)라는 것을 나타내는 것인 단계를 포함한다.

본 발명의 또 다른 양태는 갑상선암 치료제에 대한 반응의 확률에 대해 개인을 평가하는 방법으로서, 상기 개인으로부터 수득된 핵산 시료, 또는 상기 개인으로부터 유래된 유전형 데이터세트에서 하나 이상의 다형성 마커의 하나 이상의 대립인자가 존재하는지 여부를 결정하는 단계를 포함하고, 상기 하나 이상의 다형성 마커는 rs965513 (서열번호 1), 및 이와 연관 불균형인 마커들로 구성된 군으로부터 선택되고, 상기 하나 이상의 마커의 상기 하나 이상의 대립인자의 존재는 상기 치료제에 대한 양성 반응의 확률을 나타내는 것인 방법에 관한 것이다.

또 다른 양태에서, 본 발명은 갑상선암으로 진단된 개인의 예후(prognosis)를 예측하는 방법으로서, 상기 방법은 상기 개인으로부터 수득된 핵산 시료, 또는 상기 개인으로부터 유래된 유전형 데이터세트에서 하나 이상의 다형성 마커의 하나 이상의 대립인자가 존재하는지 여부를 결정하는 단계를 포함하고, 상기 하나 이상의 다형성 마커는 rs965513 (서열번호 1), 및 이와 연관 불균형인 마커들로 구성된 군으로부터 선택되고, 상기 하나 이상의 대립인자의 존재는 상기 개인에서 갑상선암의 악화된 예후를 나타내는 것인 방법에 관한 것이다.

본 발명의 또 다른 양태는 갑상선암의 치료를 받는 개인의 치료의 진행을 모니터링하는 방법으로서, 상기 방법은 상기 개인으로부터 수득된 핵산 시료 또는 상기 개인으로부터 유래된 유전형 데이터세트에서 하나 이상의 다형성 마커의 하나 이상의 대립인자가 존재하는지 여부를 결정하는 단계를 포함하고, 상기 하나 이상의 다형성 마커는 rs965513 (서열번호 1), 및 이와 연관 불균형인 마커들로 구성된 군으로부터 선택되고, 상기 하나 이상의 대립인자의 존재가 상기 개인의 치료 결과(treatment outcome)를 나타내는 것인 방법에 관한 것이다. 일 구체예에서, 상기 치료는 수술에 의한 치료, 방사선 요법에 의한 치료, 또는 약물 투여에 의한 치료이다.

본 발명은 또한 개인에서 갑상선암에 대한 감수성을 진단 및/또는 평가하기 위한 시약의 제조에서 올리고뉴클레오티드 프로브의 용도로서, 상기 프로브는 서열번호 1 내지 서열번호 229 중 하나로 표시된 뉴클레오티드 서열을 갖는 핵산의 세그먼트에 혼성화되고, 상기 프로브는 길이가 15 내지 500개의 뉴클레오티드로 구성되는 것인 용도에 관한 것이다. 일부 구체예에서, 상기 프로브는 길이가 약 16개 내지 약 100개의 뉴클레오티드로 구성된다. 일부 다른 구체예에서, 상기 프로브는 길이가 약 20개 내지 약 50개의 뉴클레오티드로 구성된다. 일부 다른 구체예에서, 상기 프로브는 길이가 약 20개 내지 약 30개의 뉴클레오티드로 구성된다.

본 발명은 그의 가장 광범위한 의미에서 갑상선 유두암, 갑상선 여포암, 갑상선 수질암 및 퇴행성 갑상선암을 포함한, 갑상선암의 서브표현형(subphenotype)에 관한 것이다. 특정한 구체예에서, 본 발명은 특정한 종양 종류에 관한 것이다. 따라서, 일 구체예에서, 본 발명은 갑상선 유두암에 관한 것이다. 또 다른 구체예에서, 본 발명은 갑상선 여포암에 관한 것이다. 또 다른 구체예에서, 본 발명은 갑상선 유두암(papillary thyroid cancer) 및/또는 갑상선 여포암(follicular thyroid cancer)에 관한 것이다. 또 다른 구체예에서, 본 발명은 갑상선 수질암(medullary thyroid cancer)에 관한 것이다. 또 다른 구체예에서, 본 발명은 퇴행성 갑상선암에 관한 것이다. 갑상선암의 기타 서브표현형, 및 서브표현형의 기타 조합도 고려되며 또한 본 발명의 범위 내에 속한다.

본 발명의 특정한 구체예는 조기 발병 연령 및/또는 조기 진단 연령을 갖는 갑상선암의 진단에 관한 것이다. 조기 연령에 진단된 갑상선암은 보다 공격적일 수 있고, 특히, 양성 결절이 조기 연령에 존재하는 경우에 보다 공격적일 수 있다. 따라서, 특정한 구체예는 조기 발병 연령 및/또는 조기 진단 연령에 발생하는 갑상선암에 관한 것이다.

본 발명의 특정한 구체예는 또한 갑상선암에 대한 바이오마커의 정량적 수준을 평가하는 것을 포함한다. 일부 구체예에서, 상기 바이오마커는 개인으로부터의 생물학적 시료에서 평가될 수 있다. 일부 구체예에서, 상기 시료는 혈액 시료이다. 일부 구체예에서, 상기 혈액 시료는 혈청 시료이다. 바람직한 구체예에서, 상기 바이오마커는 갑상선 자극 호르몬(thyroid stimulating hormone, TSH), 티록신(T4) 및 트리요오도티로닌(thriiodothyronine, T3)으로 구성된 군으로부터 선택된다. 특정한 구체예에서, 상기 바이오마커의 비정상적 수준의 결정은 개인에서 비정상적인 갑상선 기능을 나타내고, 이는 상기 개인에서 갑상선암의 증가된 위험도를 나타낼 수 있다. 비정상적 수준은 증가된 수준일 수 있거나, 또는 비정상적 수준은 감소된 수준일 수 있다. 특정한 구체예에서, 비정상적 수준의 결정은 집단에서 상기 바이오마커의 평균 수준으로부터의 편차의 결정에 근거하여 결정된다. 일 구체예에서, TSH의 비정상적 수준은 0.2mIU/L 미만 및/또는 10mIU/L보다 큰 측정값이다. 또 다른 구체예에서, TSH의 비정상적 수준은 0.3mIU/L 미만 및/또는 3.0mIU/L보다 큰 측정값이다. 또 다른 구체예에서, T₃ (유리 T₃)의 비정상적 수준은 70 ng/dL 미만이고 및/또는 205 ng/dL보다 크다. 또 다른 구체예에서, T₄ (유리 T₄)의 비정상적 수준은 0.8 ng/dL 미만이고 및/또는 2.7 ng/dL보다 크다.

본 발명의 방법의 일부 구체예에서, 상기 방법에서 결정된 감수성은 증가된 감수성이다. 하나의 그와 같은 구체예에서, 증가된 감수성은 1.30 이상의 상대적 위험도(relative risk, RR) 또는 오즈비(odds ratio, OR)를 특징으로 한다. 또 다른 구체예에서, 증가된 감수성은 1.40 이상의 상대적 위험도 또는 오즈비를 특징으로 한다. 또 다른 구체예에서, 증가된 감수성은 1.50 이상의 상대적 위험도 또는 오즈비를 특징으로 한다. 또 다른 구체예에서, 증가된 감수성은 1.60 이상의 상대적 위험도 또는 오즈비를 특징으로 한다. 또 다른 구체예에서, 증가된 감수성은 1.70 이상의 상대적 위험도 또는 오즈비를 특징으로 한다. 또 다른 구체예에서, 증가된 감수성은 1.80 이상의 상대적 위험도 또는 오즈비를 특징으로 한다. 또 다른 구체예에서, 증가된 감수성은 1.90 이상의 상대적 위험도 또는 오즈비를 특징으로 한다. 또 다른 구체예에서, 증가된 감수성은 2.0 이상의 상대적 위험도 또는 오즈비를 특징으로 한다. 다른 구체예는 1.55 이상, 1.65 이상, 1.75 이상, 1.85 이상, 및 1.95 이상의 위험 변이의 상대적 위험도 또는 오즈비를 특징으로 한다. 이와 같은 전술된 값들을 사이의 값들을 포함한, 상대적 위험도 및/또는 오즈비에 대한 다른 수치값들도 가능하고, 이들도 본 발명의 범위 내에 속한다.

본 발명의 방법의 일부 구체예에서, 상기 방법에서 결정된 감수성은 감소된 감수성이다. 하나의 그와 같은 구체예에서, 감소된 감수성은 0.8 미만의 상대적 위험도(RR) 또는 오즈비(OR)를 특징으로 한다. 또 다른 구체예에서, 감소된 감수성은 0.7 미만의 상대적 위험도(RR) 또는 오즈비(OR)를 특징으로 한다. 또 다른 구체예에서, 감소된 감수성은 0.6 미만의 상대적 위험도(RR) 또는 오즈비(OR)를 특징으로 한다. 또 다른 구체예에서, 감소된 감수성은 0.5 미만의 상대적 위험도(RR) 또는 오즈비(OR)를 특징으로 한다. 0.69 미만, 0.68 미만, 0.67 미만, 0.66 미만, 0.65 미만, 0.64 미만, 0.63 미만, 0.62 미만, 0.61 미만, 0.60 미만, 0.59 미만, 0.58 미만, 0.57 미만, 0.56 미만, 0.55 미만, 0.54 미만, 0.53 미만, 0.52 미만, 0.51 미만, 0.50 미만, 등의 상대적 위험도 또는 오즈비와 같은 다른 컷오프가 고려되고, 본 발명의 범위 내에 속한다.

본 발명은 또한 키트에 관한 것이다. 하나의 그와 같은 양태에서, 본 발명은 개인에서 갑상선암에 대한 감수성을 평가하기 위한 키트로서, 상기 키트는 상기 개인의 게놈에서 rs965513 (서열번호 1), 및 이와 연관 불균형인 마커들로 구성된 군으로부터 선택된 하나 이상의 다형성 마커의 하나 이상의 대립인자를 선택적으로 검출하는 시약을 포함하고, 상기 하나 이상의 대립인자의 존재는 갑상선암에 대한 증가된 감수성을 나타내는 것인 키트에 관한 것이다. 또 다른 양태에서, 본 발명은 개인에서 갑상선암에 대한 감수성을 평가하기 위한 키트로서, 상기 키트는 상기 개인의 게놈에서 하나 이상의 다형성 마커의 하나 이상의 대립인자를 선택적으로 검출하기 위해 필요한 시약을 포함하고, 상기 다형성 마커는 rs965513 (서열번호 1), 및 이와 연관 불균형인 마커들로 구성된 군으로부터 선택되고, 상기 하나 이상의 대립인자의 존재는 갑상선암에 대한 감수성을 나타내는 것인 키트에 관한 것이다. 일 구체예에서, 상기 하나 이상의 다형성 마커는 표 2에 표시된 마커들로부터 선택된다.

일 구체예에서, 키트 시약은 상기 하나 이상의 다형성 마커를 포함하는 상기 개인의 게놈의 단편에 혼성화하는 하나 이상의 연속된(contiguous) 올리고뉴클레오티드를 포함한다. 또 다른 구체예에서, 상기 키트는 상기 개인으로부터 수득된 게놈 세그먼트의 반대쪽 가닥에 혼성화하는 한 쌍 이상의 올리고뉴클레오티드를 포함하고, 상기 각 올리고뉴클레오티드 프라이머 쌍은 하나의 다형성을 포함하는 상기 개인의 게놈의 단편을 선택적으로 증폭시키도록 설계되고, 상기 다형성은 표 2에 정의된 다형성으로 구성된 군으로부터 선택되며, 상기 단편은 크기가 20 bp 이상이다. 일 구체예에서, 상기 올리고뉴클레오티드는 상기 개인의 게놈에 완전히 상보적이다. 또 다른 구체예에서, 상기 키트는 완충액 및 상기 세그먼트를 증폭시키는 효소를 더 포함한다. 또 다른 구체예에서, 상기 시약은 상기 단편을 검출하기 위한 표지를 더 포함한다.

하나의 바람직한 구체예에서, 상기 키트는 길이가 5 내지 100개의 뉴클레오티드로 구성된 검출 올리고뉴클레오티드 프로브; 길이가 5 내지 100개의 뉴클레오티드로 구성된 인핸서 올리고뉴클레오티드 프로브; 및 엔도뉴클레아제 효소;를 포함하고,

상기 검출 올리고뉴클레오티드 프로브는 서열번호 1 내지 서열번호 229 중 하나로 표시된 뉴클레오티드 서열의 핵산의 제1 세그먼트에 특이적으로 혼성화되고; 및

상기 검출 올리고뉴클레오티드 프로브는 3' 말단에 검출가능한 표지를 포함하고 5' 말단에 퀀칭 모이어티(quenching moiety)를 포함하며;

상기 인핸서 올리고뉴클레오티드는 길이가 5개 내지 100개의 뉴클레오티드로 구성되고, 상기 올리고뉴클레오티드 프로브의 5'에 배열된 상기 뉴클레오티드 서열의 제2 세그먼트에 상보적이어서, 상기 인핸서 올리고뉴클레오티드는 상기 두개의 올리고뉴클레오티드가 모두 상기 핵산에 혼성화되는 경우 상기 검출 올리고뉴클레오티드에 대해 3'에 위치하며; 및

상기 제1 세그먼트와 상기 제2 세그먼트 간에 단일 염기 갭이 존재하여, 상기 올리고뉴클레오티드 프로브와 상기 인핸서 올리고뉴클레오티드 프로브가 모두 상기 핵산에 혼성화되는 경우, 상기 올리고뉴클레오티드 간에 단일 염기 갭이 존재하며; 및

상기 핵산을 상기 엔도뉴클레아제에 의해 처리하는 단계는 상기 검출 프로브가 상기 핵산에 혼성화된 경우, 상기 검출 프로브의 3'말단으로부터 상기 검출가능한 표지를 절단하여 유리 상태의 검출가능한 표지를 방출시킨다.

본 발명에 따른 키트는 또한 이전에 갑상선암으로 진단되었던 개인에서 하나 이상의 제2 원발성 종양을 발병할 위험도를 평가하는 방법, 갑상선암 치료제에 대해 반응할 확률에 대해 개인을 평가하는 방법, 및 갑상선암으로 진단되었고 상기 질병에 대한 치료를 받은 개인의 치료 진행을 모니터링하는 방법을 포함한, 본 발명의 다른 방법에서 이용될 수 있다.

본 발명의 방법, 용도, 장치 또는 키트의 특정한 구체예에서, 갑상선암에 대한 감수성에 관한 정보를 제공하는 상기 하나 이상의 다형성 마커는 FoxE1 유전자와 연관된다. 본 발명에서 "연관된(associated with)"은 상기 하나 이상의 마커가 FoxE1 유전자 또는 그의 조절 영역과 연관 불균형이라는 것을 의미한다. 그와 같은 마커는 FoxE1 유전자, 또는 그의 조절 영역 내에 위치할 수 있거나, 또는 이들은 FoxE1 유전자 또는 상기 유전자의 기능에 대해 직접적인 영향을 갖는 조절 영역 내의 하나 이상의 마커와 연관 불균형일 수 있다. FoxE1과 연관된 감수성 변이의 기능적 결과는 본 명세서에서 보다 상세하게 설명되는 바와 같이, FoxE1 유전자의 발현 수준, 그의 전사체의 안정성, 또는 아미노산 변형을 통해 단백질 수준에서 일어날 수 있다.

본 명세서에서 갑상선암과 연관된 것으로 설명된 마커들은 모두 본 명세서에 기재된 방법, 키트, 용도, 장치, 절차를 포함한, 본 발명의 다양한 양태에서 이용될 수 있다. 특정한 구체예에서, 본 발명은 본 명세서에서 정의된 C09 LD 블럭과 연관된 마커들에 관한 것이다. 특정한 다른 구체예에서, 본 발명은 표 2에 표시된 마커들(서열번호 1 내지 229), 및 이들과 연관 불균형인 마커들에 관한 것이다. 특정한 다른 구체예에서, 본 발명은 표 2에 표시된 마커들에 관한 것이다. 특정한 다른 구체예에서, 본 발명은 마커 rs965513 (서열번호 1), rs10759944 (서열번호 17), rs907580 (서열번호 2), rs10984103 (서열번호 37), rs925487 (서열번호 34), rs7024345 (서열번호 3) 및 rs1443434 (서열번호 30), 및 이들과 연관 불균형인 마커들에 관한 것이다. 일부 다른 바람직한 구체예에서, 본 발명은 rs965513 (서열번호 1), rs10759944 (서열번호 17), rs907580 (서열번호 2), rs10984103 (서열번호 37), rs925487 (서열번호 34), rs7024345 (서열번호 3) 및 rs1443434 (서열번호 30)로 구성된 군으로부터 선택된 마커들 중 하나에 관한 것이다.

특정한 구체예에서, 갑상선암의 증가된 위험도를 부여하는 하나 이상의 마커 대립인자는 rs965513 대립인자 A, rs10759944 대립인자 A, rs907580 대립인자 A, rs10984103 대립인자 A, rs925487 대립인자 G, rs7024345 대립인자 A 및 rs1443434 대립인자 G로 구성된 군으로부터 선택된다. 이 구체예에서, 상기 대립인자(위험 대립인자)의 존재는 갑상선암의 증가된 위험도를 나타낸다.

본 발명의 일부 구체예에서, 연관 불균형(linkage disequilibrium, LD)은 두 개의 유전적 세그먼트(예를 들면, 다형성 마커) 간의 연관 불균형의 정도의 정량적 척도를 제공하는, 연관 불균형 척도 r² 및 |D'|을 이용하여 결정된다. 본 명세서에서 더 설명되는 바와 같이, 특정한 마커들 간의 이 척도들의 특정한 수치값들은 상기 마커들이 연관 불균형에 있다는 것을 나타낸다. 본 발명의 일 구체예에서, 마커들 간의 연관 불균형(즉, LD 값이 마커들이 연관 불균형이라는 것을 나타냄)은 0.1보다 큰 r²으로 정의된다. 또 다른 구체예에서, 연관 불균형은 0.2보다 큰 r²으로 정의된다. 다른 구체예는 r² > 0.25, r² > 0.3, r² > 0.35, r² > 0.4, r² > 0.45, r² > 0.5, r² > 0.55, r² > 0.6, r² > 0.65, r² > 0.7, r² > 0.75, r² > 0.8, r² > 0.85, r² > 0.9, r² > 0.95, r² > 0.96, r² > 0.97, r² > 0.98, 또는 r² > 0.99와 같은, 연관 불균형의 다른 정의를 포함할 수 있다. 일부 구체예에서, 연관 불균형은 또한 |D'| > 0.2, 또는 |D'| > 0.3, |D'| > 0.4, |D'| > 0.5, |D'| > 0.6, |D'| > 0.7, |D'| > 0.8, |D'| > 0.9, |D'| > 0.95, |D'| > 0.98 또는 |D'| > 0.99로 정의될 수 있다. 일부 구체예에서, 연관 불균형은 r² > 0.2 및 |D'| > 0.8과 같은 두 개의 기준 r² 및 |D'|을 충족시키는 것으로 정의된다. 앞서 표시된 이 파라미터들에 대한 값들을 포함하나, 이에 한정되지 않는, r² 및 |D'|에 대한 값들의 다른 조합도 가능하고, 본 발명의 범위 내에 속한다.

특징의 조합이 본 명세서의 동일한 문장 또는 구에서 구체적으로 확인되지 않더라도, 본 명세서에 기재된 특징들의 모든 조합이 고려되는 것으로 이해되어야 한다. 이는 특히 본 명세서에 기재된 본 발명의 모든 양태에서, 개별적으로 또는 일배체형으로 분석을 위한, 단독으로 또는 조합된 본 명세서에 기재된 모든 마커들의 용도를 포함한다.

발명의 상세한 설명

정의

달리 표시되지 않으면, 핵산 서열은 5'에서 3' 방향으로 좌측에서 우측으로 기재된다. 명세서 내에 기재된 수치 범위는 그 범위를 한정하는 수치를 포함하며 정의된 범위 내의 각 정수 또는 비-정수 분수(non-integer fraction)를 포함한다. 달리 정의되지 않으면, 본 명세서에서 사용된 모든 기술 용어 및 과학 용어는 본 발명이 속하는 기술 분야의 통상적인 기술자에 의해 일반적으로 이해되는 것과 동일한 의미를 갖는다.

본 발명에서, 하기의 용어들은 표시된 바와 같은 의미를 갖는다:

본 명세서에 기재된 바와 같이, 종종 "마커(marker)"로 불리는, "다형성 마커(polymorphic marker)"는 게놈 다형성 부위(genomic polymorphic site)를 의미한다. 각 다형성 마커는 다형성 부위에서 특정한 대립인자에 특징적인 두 개 이상의 서열 변이를 갖는다. 따라서, 다형성 마커에 대한 유전적 연관(genetic association)은 특정한 다형성 마커의 하나 이상의 특정한 대립인자에 대해 연관이 있다는 것을 의미한다. 마커는 SNP(single nucleotide polymorphism), 미니새틀라이트(minisatellite) 또는 마이크로새틀라이트(microsatellite), 전위(translocation) 및 카피수 변이(copy number variation)(삽입, 결실, 중복)를 포함한, 게놈에서 발견되는 임의의 변이 형태의 대립인자를 포함할 수 있다. 다형성 마커는 집단에서 임의의 측정가능한 빈도로 존재할 수 있다. 질병 유전자의 맵핑을 위해, 5-10%보다 높은 집단 빈도(population frequency)를 갖는 다형성 마커가 일반적으로 가장 유용하다. 그러나, 다형성 마커는 또한 1-5%와 같은 더 낮은 집단 빈도, 또는 훨씬 더 낮은 빈도, 특히, 카피 수 변이(copy number variation, CNV)를 가질 수 있다. 본 발명에서, 상기 용어는 임의의 집단 빈도를 갖는 다형성 마커를 포함하는 것으로 이해될 것이다.

"대립인자(allele)"는 염색체 상에 있는 주어진 유전자 좌(위치)의 뉴클레오티드 서열을 의미한다. 다형성 마커 대립인자는 따라서, 염색체 상의 마커의 조성(즉, 서열)을 의미한다. 개인으로부터의 게놈 DNA는 각 염색체 상의 마커의 각 카피를 대표하는, 임의의 주어진 다형성 마커에 대한 두 개의 대립인자(예를 들면, 대립인자-특이적 서열)를 포함한다. 본 명세서에서 사용된 뉴클레오티드에 대한 서열 코드는 A = 1, C = 2, G = 3, T = 4이다. 마이크로새틀라이트 대립인자(microsatellite allele)의 경우, CEPH 표본(Centre d'Etudes du Polymorphisme Humain, genomics repository, CEPH sample 1347-02)이 기준으로 이용되고, 이 표본에서 각 마이크로새틀라이트의 보다 짧은 대립인자는 0으로 설정되고 다른 표본에서 모든 다른 대립인자는 이 기준에 대비하여 번호가 부여된다. 따라서, 예를 들면, 대립인자 1은 CEPH 표본에서의 보다 짧은 대립인자보다 1 bp 더 길고, 대립인자 2는 CEPH 표본에서의 보다 짧은 대립인자보다 2 bp 더 길며, 대립인자 3은 CEPH 표본에서의 보다 짧은 대립인자보다 3 bp 더 길며, 대립인자 -1은 CEPH 표본에서의 보다 짧은 대립인자보다 1 bp 더 짧고, 대립인자 -2는 CEPH 표본에서의 보다 짧은 대립인자보다 2 bp 더 짧다.

본 명세서에 기재된 서열 코뉴클레오티드 중의성(sequence conucleotide ambiguity)은 IUPAC-IUB에 의해 제안된 바와 같다. 이 코드들은 EMBL, GenBank, 및 PIR 데이터베이스에 의해 사용된 코드들과 양립될 수 있다.

IUB 코드	의미
A	아데노신
C	시티딘
G	구아닌
T	티미딘
R	G 또는 A
Y	T 또는 C
K	G 또는 T
M	A 또는 C
S	G 또는 C
W	A 또는 T
B	C G 또는 T
D	A G 또는 T
H	A C 또는 T
V	A C 또는 G
N	A C G 또는 T (임의의 염기)

집단(자연 집단 또는 인공 집단, 예를 들면, 합성 분자들의 인공 라이브러리)에서 2개 이상의 서열이 가능한 뉴클레오티드 위치가 본 명세서에서 "다형성 부위(polymorphic site)"로 지칭된다.

"단일 뉴클레오티드 다형성(Single Nucleotide Polymorphism)" 또는 "SNP"는 게놈의 특정한 위치에 있는 단일 뉴클레오티드가 종의 멤버 간에 또는 개체 내에서 쌍을 이루는 염색체 간에 상이할 때 나타나는 DNA 서열 변이이다. 대부분의 SNP 다형성은 두 개의 대립인자를 갖는다. 각 개체는 이 경우, 상기 다형성의 하나의 대립인자에 대해 동형접합(즉, 개체의 두 개의 염색체 카피 모두 SNP 위치에서 동일한 뉴클레오티드를 가짐)이거나, 또는 개체는 이형접합이다(즉, 상기 개체의 두 개의 자매 염색체(sister nucleotide)가 상이한 뉴클레오티드를 포함함). 본 명세서에서 보고된 바와 같이, SNP 명명은 NCBI(the National Center for Biotechnological Information)에 의해 각각의 독특한 SNP에 부여된 공식적인 기준 SNP(Reference SNP, rs) ID 식별 택(tag)을 의미한다.

본 명세서에 기재된 "변이(variant)"는 기준(reference) DNA와 상이한 DNA의 세그먼트를 의미한다. 본 명세서에서 정의된 "마커(marker)" 또는 "다형성 마커(polymorphic marker)"는 변이이다. 기준과 상이한 대립인자(allele)는 "변이" 대립인자로 지칭된다.

"마이크로새틀라이트(microsatellite)"는 특정한 부위에 있는 길이가 2 내지 8개의 뉴클레오티드로 구성된 염기의 작은 반복체(repeat)(예를 들면, CA 반복체)를 복수 개 갖는 다형성 마커이며, 전체 집단에서 반복체 길이의 수는 변한다.

"indel"은 통상적으로 단지 수개의 뉴클레오티드로 구성된 길이의 작은 삽입 또는 결실을 포함하는 다형성의 일반적인 형태이다.

본 명세서에 기재된, "일배체형(haplotype)"은 세그먼트를 따라 배열된 대립인자의 특정한 조합을 특징으로 하는 게놈 DNA의 세그먼트를 의미한다. 인간과 같은 이배체(diploid) 개체의 경우, 일배체형은 각 다형성 마커 또는 유전자 좌에 대한 대립인자의 쌍 중 하나의 대립인자(one member)를 포함한다. 특정한 구체예에서, 일배체형은 두개 이상의 대립인자, 세개 이상의 대립인자, 네개 이상의 대립인자, 또는 다섯개 이상의 대립인자를 포함할 수 있다. 본 명세서에서 일배체형은 마커 명칭 및 상기 마커의 대립인자로 기재되며, 예를 들면, 일배체형 "3 rs965513"은 마커 rs965513의 대립인자 3이 일배체형에 있다는 것을 의미하고, "rs965513 대립인자 3(rs965513 allele 3)"과 동등하다. 또한, 일배체형에서 대립인자 코드는 개별적인 마커에 대한 것과 같고, 즉, 1 = A, 2 = C, 3 = G 및 4 = T이다.

본 명세서에 기재된 용어 "감수성(susceptibility)"은 개체가 평균 개체들보다 특정한 상태(예를 들면, 특정한 형질, 표현형, 또는 질병, 예를 들면, 갑상선암)을 발병하는 경향이 있거나, 또는 특정 상태에 저항할 수 있는 능력이 평균 개체보다 더 약한 것을 의미한다. 상기 용어는 증가된 감수성 및 감소된 감수성을 모두 포함한다. 따라서, 본 발명의 다형성 마커의 특정한 대립인자 및/또는 일배체형은 상기 특정한 대립인자 또는 일배체형에 대한 1보다 큰 상대적 위험도(RR) 또는 오즈비(OR)를 특징으로 하는, 갑상선암의 증가된 감수성(즉, 증가된 위험도)을 특징으로 할 수 있다. 대안적으로, 본 발명의 마커 및/또는 일배체형은 1 미만의 상대적 위험도를 특징으로 하는, 갑상선암의 감소된 감수성(즉, 감소된 위험도)을 특징으로 한다.

용어 "및/또는"은 본 명세서에서 상기 용어에 의해 연결된 항목들 중 하나 또는 양자 모두가 포함된다는 것을 나타내는 것으로 이해될 것이다. 바꾸어 말하면, 본 명세서에서 상기 용어는 "하나 또는 그 나머지 또는 양자 모두(one or the other or both)"를 의미하는 것으로 이해될 것이다.

본 명세서에 기재된 용어 "참조표(look-up table)"는 하나의 형태의 데이터를 또 다른 형태와 상관시키거나, 또는 하나 이상의 형태의 데이터를 상기 데이터가 관련된 예상되는 결과, 예를 들면, 표현형 또는 성향과 상관시키는 표이다. 예를 들면, 참조표는 하나 이상의 다형성 마커에 대한 대립인자 데이터와, 특정한 대립인자 데이터를 포함하는 개체가 표시할 것 같거나, 또는 그 특정한 대립인자 데이터를 갖지 않는 개인보다 표시할 가능성이 더 높은, 특정한 질병 진단과 같은 특정한 성향 또는 표현형 간의 상관관계를 포함할 수 있다. 참조표는 다면적(multidimensional)일 수 있고, 즉, 참조표는 단일 마커들에 대한 복수 개의 대립인자에 대한 정보를 동시에 포함할 수 있거나, 또는 그들은 복수 개의 마커들에 대한 정보를 포함할 수 있고, 그들은 또한 질병 진단에 대한 세부사항, 인종 정보, 바이오마커, 생화학적 측정값, 치료적 방법, 또는 약물 등과 같은 다른 인자들을 포함할 수 있다.

"컴퓨터-판독가능한 매체(computer-readable medium)"는 상업적으로 구매가능하거나 또는 맞춤-제작된(custom-made) 인터페이스를 이용하여 컴퓨터에 의해 접근될 수 있는 정보 저장 매체이다. 대표적인 컴퓨터-판독가능한 매체는 메모리(예를 들면, RAM, ROM, 플래쉬 메모리, 등), 광학적 저장 매체(예를 들면, CD-ROM), 자기 저장 매체(예를 들면, 컴퓨터 하드 드라이브, 플로피 디스크, 등), 천공 카드(punch card), 또는 기타 상업적으로 구입가능한 매체를 포함한다. 목적 시스템(system of interest)과 매체, 컴퓨터간, 또는 컴퓨터와 저장 또는 저장된 정보의 접근을 위한 컴퓨터-판독가능한 매체 간에 정보가 전달될 수 있다. 그와 같은 전송은 전기적이거나, 또는 IR 링크, 무선 연결 등과 같은 다른 이용가능한 방법에 의해 수행될 수 있다.

"핵산 시료(nucleic acid sample)"는 핵산(DNA 또는 RNA)를 포함하는 개체로부터 수득된 시료이다. 일부 구체예에서, 즉, 특정한 다형성 마커 및/또는 일배체형의 검출에서, 핵산 시료는 게놈 DNA를 포함한다. 그와 같은 핵산 시료는 혈액 시료, 양수액, 뇌척수액, 또는 피부, 근육, 구강 점막 또는 결막 점막, 태반, 위장관 또는 기타 기관으로부터의 조직 시료를 포함한, 게놈 DNA를 포함하는 임의의 공급원(source)으로부터 수득될 수 있다.

본 명세서에서 사용된 용어 "갑상선암 치료제(thyroid cancer therapeutic agent)"는 갑상선암과 연관된 증상을 개선시키거나 또는 예방하기 위해 이용될 수 있는 작용제를 의미한다.

본 명세서에 기재된 용어 "갑상선암-연관 핵산(thyroid cancer-associated nucleic acid)"은 갑상선암과 연관된 것으로 확인된 핵산을 의미한다. 이는 본 명세서에 기재된 마커 및 일배체형 및 이들과 강한 연관 불균형(LD)인 마커 및 일배체형을 포함하나, 이에 한정되지 않는다. 일 구체예에서, 갑상선암-연관 핵산은 게놈 영역 또는 LD 블럭 내에 위치한 하나 이상의 다형성 마커를 통해 갑상선암의 위험도와 연관된 것으로 확인된, LD-블럭과 같은 게놈 영역을 의미한다.

본 명세서에 기재된 용어 "FoxE1" 또는 "FoxE1 유전자"는 염색체 9q22.23 상의 갑상선 전사 인자 2(thyroid transcription factor 2, TTF-2)로 불렸던, Forkhead Factor E1 유전자를 의미한다.

본 명세서에 기재된 용어 " LD Block C09"는 NCBI (National Center for Biotechnology Information) Build 36 (서열번호 1)의 위치 99,350,532 내지 99,953,197에 해당하는, 마커 rs2795492 및 rs7855669를 포함하는, 염색체 9 상의 연관 불균형(Linkage Disequilibrium, LD) 블럭 영역을 의미한다.

갑상선암에 대한 감수성을 부여하는 유전적 변이에 대한 게놈-전체 탐색을 통해, 본 발명자들은 갑상선암의 위험도와 연관된 변이를 포함하는 염색체 9q22.33 상의 영역을 확인하였다. 마커 rs965513, rs907580 및 rs7024345는 갑상선암의 위험도와 유의성있게 연관된 것으로 확인되었다. 가장 강력한 연관 신호가 마커 rs965513 (OR 1.77, P-값 1.18 x 10^-15)에 대해 관찰되었다. 후속 분석이 아이슬란드 및 미국과 스페인으로부터의 표본에서 이 결과를 확인했다 (rs965513에 대한 전체 P-값 1.7x10^-27).

rs965513 마커는 광범위한 연관 불균형을 특징으로 하는 염색체 9q22.33 상의 영역 내에 위치한다. 그와 같은 광범위한 LD의 결과는 상기 영역 내의 다수의 유전적 변이, 예를 들면, rs907580 및 rs7024345 및 또한 rs10759944, rs10984103, rs925487 및 rs1443434를 포함한 유전적 변이가 위험 변이 rs965513을 위한 대리물(surrogate)이고, 그와 같은 마커는 또한, 본 발명을 실현하기 위해 유용하다. rs965513과 LD이기 때문에 본 발명의 실시를 위해 유용한 기타 SNP 마커가 본 명세서에서 표 2에 제공된다. 하기에서 보다 상세하게 검토되는 바와 같이, 대리 마커들은 영역의 게놈 구조에 따라, 큰 게놈 영역에 걸쳐 존재할 수 있다. 예를 들면, 본 명세서에서 표 2에 표시된 rs965513의 대리 마커는 약 600 kb의 영역에 존재한다(본 명세서에서 LD 블럭 C09로도 지칭됨). 이 영역에서 확인된 갑상선암에 대한 유전적 위험도의 생물학적 결과를 초래하는 기능적 단위(functional unit)는 원칙적으로 광범위한 LD의 영역 내에 위치할 수 있다. rs965513과 특히 높은 LD (예를 들면, 하기에서 더 설명되는 바와 같이 r² 및/또는 |D'|에 대한 높은 값, 예를 들면, 0.1 또는 0.2보다 큰 r² 값을 특징으로 하는 LD)인 마커들은 그와 같은 단위 내에 있거나, 또는 이와 높은 LD일 가능성이 매우 높다.

FoxE1 (Forkhead factor E1; 이전에 갑상선 전사 인자 2(TTF-2)로 지칭됨) 유전자는 rs965513 부근에, 및 rs965513과 강한 LD인 마커들을 포함하는 영역 내에 위치한다. 상기 영역 내의 다른 유전자들은 XPA, C9orf156 및 HEMGN (도 2)을 포함한다. FoxE1 유전자는 갑상선-특이적 유전자의 발현을 조절하고(De Felice, M., and R. Di Lauro., Endocr. Rev. 25:722-746 (2004); Francis-Lang, H., et al., Mol. Cell. Biol. 12:576-588 (1992); Sinclair, A. et al. Eur. J. Biochem. 193:311-318 (1990)), 갑상선 형성(Dathan, N., R. Parlato, A. Rosica, M. De Felice, and R. Di Lauro, Dev. Dyn. 224:450-456 (2002)) 및 이동(migration) (De Felice, M., et al. Nat. Genet. 19:395-398 (1998))을 위해 필수적이고 갑상선 분화를 개시하는 전사 인자 및 보조 인자의 조절 네트워크의 중심에 있다(Parlato, R., et al. Dev. Biol. 276:464-475 (2004)). FoxE1 유전자의 돌연변이는 기타 표현형들 중에서 특히, 갑상선 발육부전(thyroid agenesis)과 연관된 인간 증후군을 유발한다(Castanet, M., et al., Hum Mol Genet 11:2051-9 (2002); Clifton-Bligh, R. J., et al. Nat. Genet. 19:399-401 (1998)). FoxE1은 또한 Tg(thyroglobulin) (Santisteban, P., et al., Mol. Endocrinol. 6:1310-1317 (1992)) 및 TPO(thyroperoxidase) (Aza-Blanc, P., R. Di Lauro, and P. Santisteban. Mol. Endocrinol. 7:1297-1306 (1993)) 유전자와 같은, 갑상선-특이적 유전자의 전사의 호르몬 조절을 위해 필수적이기 때문에, 갑상선 분화 상태의 유지를 위해 필요하다. TPO 유전자 발현은 또한 TTF-1 (Nkx2.1), Pax8, 및 핵 인자 1(nuclear factor 1, NF-1)에 의해 조절된다. 이 인자들 중에서, FoxE1은 갑상선-자극 호르몬(TSH) 및 인슐린-유사 인자 1(IGF-1)에 대한 TPO 반응의 주요한 매개체이다 (Aza-Blanc, P., R. Di Lauro, and P. Santisteban. Mol. Endocrinol. 7:1297-1306 (1993)). FoxE1의 결합, 및 그의 DNA 결합 및 전사 활성이 TSH 및 IGF-1에 의해 활성화되고, FoxE1 DNA 결합 부위는 갑상선 유전자의 특이적 발현을 조절하는 호르몬 반응 요소(hormone response element)를 구성한다(Ortiz, L., et al. J. Biol. Chem. 272:23334-23339 (1997)). FOXE1은 또한, Tg(thyroglobulin) 및 TPO(thyroperoxidase) 유전자와 같은, 갑상선-특이적 유전자의 전사 조절에서의 관여에 기반하여, 갑상선의 분화 상태의 유지를 위해 필수적이다. Tg가 T₃(triiodothyronine)및 T₄(thyroxine)의 전구체이고, 그들의 합성이 TPO에 의해 촉매되기 때문에, 이 두 유전자 모두의 조절된 발현은 갑상선 호르몬인 T₃와 T₄의 합성을 위해 중요하다. 주요한 조절자로 작용하는 갑상선 자극 호르몬(TSH)이 갑상선 호르몬 합성 및 분비 조절의 중심이다.

본 발명자들은 또한 rs965513이 혈청 중 TSH, 유리 T₄ 및 유리 T₃의 수준과 연관된다는 것을 발견하여, 염색체 9q22 영역의 마커와 갑상선암 및 갑상선암-관련 생물학적 활성과 연관된다는 것을 더 확인하였다.

마커 및 일배체형의 평가

집단 내에서 게놈 서열은 개체들이 비교될 때 동일하지 않다. 오히려, 게놈은 게놈 상의 다수의 위치에서 개체들 간에 서열 변이성(sequence variability)을 보인다. 그와 같은 서열 상의 변이는 일반적으로 다형성(polymorphism)으로 지칭되며, 각 게놈 내에 다수의 그와 같은 부위들이 있다. 예를 들면, 인간 게놈은 평균적으로 500 bp마다 나타나는 서열 변이를 보인다. 가장 일반적인 서열 변이는 게놈 내의 단일 염기 위치에서의 염기의 변화로 구성되고, 그와 같은 서열 변이, 또는 다형성은 일반적으로 단일 뉴클레오티드 다형성("SNP")으로 지칭된다. 이 SNP들은 단일 돌연변이 사건에서 일어난 것으로 사료되며, 따라서, 통상적으로 각 SNP 부위에 두 개의 가능한 대립인자들이 있다; 본래의 대립인자와 돌연변이된(대안적인) 대립인자. 자연적인 유전적 부동(genetic drift) 및 또한 가능한 선택적 압력 때문에, 본래의 돌연변이가 주어진 집단에서 그의 대립인자의 특정한 빈도를 특징으로 하는 다형성을 초래했다. 미니새틀라이트, 마이크로새틀라이트, 및 삽입, 결실, 역전을 포함한, 다수의 다른 종류의 서열 변이(카피 수 변화(CNV)로도 지칭됨)가 인간 게놈 내에서 발견된다. 다형성 마이크로새틀라이트는 특정한 부위에 복수 개의 짧은 염기 반복체(small repeat of bases)(예를 들면, CA 반복체, 상보성 가닥 상의 TG)를 가지며, 전체 집단에서 반복체 길이의 수가 변화한다. 일반적인 용어로, 다형성 부위에 대한 서열의 각 버전은 상기 다형성 부위의 특정한 대립인자를 나타낸다. 모든 서열 변이들은 해당 서열 변이의 특징적인, 특정한 다형성 부위에서 일어나는, 다형성으로 지칭될 수 있다. 일반적으로, 다형성은 임의의 수의 특정한 대립인자를 포함할 수 있다. 따라서, 본 발명의 일 구체예에서, 다형성은 임의의 주어진 집단에서 둘 이상의 대립인자의 존재를 특징으로 한다. 또 다른 구체예에서, 다형성은 세개 이상의 대립인자의 존재를 특징으로 한다. 다른 구체예에서, 다형성은 4개 이상의 대립인자, 5개 이상의 대립인자, 6개 이상의 대립인자, 7개 이상의 대립인자, 9개 이상의 대립인자 또는 10개 이상의 대립인자의 존재를 특징으로 한다. 모든 그와 같은 다형성은 본 발명의 방법 및 키트에서 이용될 수 있고, 따라서, 본 발명의 범위 내에 속한다.

그들의 존재도(abundance) 때문에, SNP는 인간 게놈 중의 대부분의 서열 변이를 설명한다. 6백만 개 이상의 SNP가 현재까지 검증되었다(http://www.ncbi.nlm.nih.gov/projects/SNP/snp_summary.cgi). 그러나, CNV에 대한 관심이 증가되고 있다. 이 대규모 다형성(통상적으로 1 kb 이상)은 집합된 인간 게놈의 상당한 부분에 영향을 미치는 다형성을 설명한다; 공지된 CNV가 인간 게놈 서열의 15% 이상을 차지한다(Estivill, X Armengol; L., PloS Genetics 3:1787-99 (2007). A http://projects.tcag.ca/variation/). 그러나, 이 다형성의 대부분은 매우 드물며, 평균적으로 각 개체의 게놈 서열의 일부에만 영향을 미친다. CNV는 유전자 량(gene dosage)을 붕괴시키는 것에 의해 유전자 발현, 표현형 변이 및 적응(adaptation)에 영향을 미치는 것으로 알려져 있고, 또한, 질병(미세결실(microdeletion) 증후군 및 미세중복(microduplication) 증후군)을 유발하고 HIV-1 감염 및 사구체신염을 포함한, 일반적인 복합 질환(common complex disease)의 위험도를 부여하는 것으로 알려져 있다(Redon, R., et al. Nature 23:444-454 (2006)). 따라서, 이전에 개시되거나 또는 알려지지 않았던 CNV가 본 명세서에 갑상선암과 연관된 것으로 기재된 마커들과 연관 불균형인 원인적 변이(causative variant)를 나타내는 것이 가능하다. CNV를 검출하는 방법은 CGH(comparative genomic hybridization) 및 Carter (Nature Genetics 39:S16-S21 (2007))에 의해 기재된 바와 같은, 유전형분석 어레이의 이용을 포함한 유전형분석(genotyping)을 포함한다. 게놈 변이 데이터베이스(Database of Genomic Variants) (http://projects.tcag.ca/variation/)는 개시된 CNV의 위치, 종류 및 크기에 대한 업데이트된 정보를 포함한다. 상기 데이터베이스는 현재 15,000개 이상의 CNV에 대한 데이터를 포함한다.

일부 경우에, 기준 대립인자(reference allele)를 선택하지 않고, 다형성 부위에서 상이한 대립인자를 지칭할 수 있다. 대안적으로, 특정한 다형성 부위에 대해 기준 서열이 지칭될 수 있다. 기준 대립인자는 종종 "야생형(wild-type)" 대립인자로 지칭되고, 이는 통상적으로 최초의 서열결정된(first sequenced) 대립인자 또는 "영향받지 않은(non-affected)" 개체(예를 들면, 성향(trait)이나 질병 표현형을 보이지 않는 개체)로부터의 대립인자로 선택된다.

본 명세서에서 지칭되는 SNP 마커에 대한 대립인자는 다형성 부위에서 그들이 나타나는 경우, 염기 A, C, G 또는 T로 지칭된다. 본 명세서에서 이용된 SNP에 대한 대립인자 코드는 하기와 같다: 1 = A, 2 = C, 3 = G, 4 = T. 그러나, 본 발명이 속하는 기술 분야의 당업자는 반대쪽 DNA 가닥을 분석하거나 또는 판독하는 것에 의해, 각 경우에 상보적 대립인자가 측정될 수 있다는 것을 인식할 것이다. 따라서, A/G 다형성을 특징으로 하는 다형성 부위(다형성 마커)에 대해, 마커를 검출하기 위해 이용되는 방법은 가능한 두 염기, 즉, A 및 G 중 하나 또는 양자 모두를 검출하도록 설계될 수 있다. 대안적으로, DNA 주형 상의 상보적 가닥을 검출하도록 분석법을 설계하는 것에 의해, 상보적 염기 T 및 C의 존재가 측정될 수 있다. 정량적으로(예를 들면, 상대적 위험도의 측면에서), 동일한 결과가 각 DNA 가닥(+ 가닥 또는 - 가닥)의 측정으로부터 수득될 것이다.

일반적으로, 특정한 서열에 대해 기준 서열이 지정된다. 기준과 상이한 대립인자는 종종 "변이(variant)" 대립인자로 지칭된다. 본 명세서에서 사용된, 변이 서열(variant sequence)은 기준 서열과 상이하나, 그 외에는 실질적으로 유사한 서열을 의미한다. 본 명세서에 기재된 다형성 유전적 마커의 대립인자는 변이(variant)이다. 변이들은 폴리펩티드에 영향을 미치는 변화들을 포함할 수 있다. 기준 뉴클레오티드 서열과 비교한 경우, 서열 차이는 프레임 쉬프트(frame shift)를 초래하는, 단일 뉴클레오티드의 삽입 또는 결실, 하나보다 많은 수의 뉴클레오티드의 삽입 또는 결실; 코딩된 아미노산의 변화를 초래하는, 하나 이상의 뉴클레오티드의 변화; 조기 종료 코돈(premature stop codon)의 생성을 초래하는, 하나 이상의 뉴클레오티드의 변화; 뉴클레오티드에 의해 코딩된, 하나 이상의 아미노산의 결실을 초래하는, 수개의 뉴클레오티드의 결실; 해독 프레임(reading frame)의 코딩 서열의 중단(interruption)을 초래하는, 불균등 재조합(unequal recombination) 또는 유전자 전환(gene conversion)과 같은, 하나 또는 수개의 뉴클레오티드의 삽입; 전체 서열 또는 일부 서열의 중복; 전위; 또는 뉴클레오티드 서열의 재배열을 포함할 수 있다. 그와 같은 서열 변화는 핵산에 의해 코딩된 폴리펩티드를 변화시킬 수 있다. 예를 들면, 핵산 서열의 변화가 프레임 쉬프트를 유발하는 경우, 프레임 쉬프트는 코딩된 아미노산의 변화를 초래할 수 있고, 및/또는 조기 종료 코돈의 생성을 초래하여, 절단된(truncated) 폴리펩티드의 생성을 유발할 수 있다. 대안적으로, 다형성은 하나 또는 그 이상의 뉴클레오티드의 동의적 변화(synonymous change)(즉, 아미노산 서열의 변화를 초래하지 않는 변화)일 수 있다. 그와 같은 다형성은 예를 들면, 스플라이싱 부위(splice site)를 변화시키고, mRNA의 안정성 또는 수송에 영향을 미치거나 또는 코딩된 폴리펩티드의 전사 또는 번역에 영향을 미칠 수 있다. 다형성은 또한 증폭 또는 결실과 같은 구조적 변화가 체세포 수준(somatic level)에서 일어날 가능성을 증가시키도록 DNA를 변화시킬 수 있다. 기준 뉴클레오티드 서열에 의해 코딩된 폴리펩티드는 특정한 기준 아미노산 서열을 갖는 "기준(reference)" 폴리펩티드이고, 변이 대립인자에 의해 코딩된 폴리펩티드는 변이 아미노산 서열을 갖는 "변이(variant)" 폴리펩티드로 지칭된다.

일배체형은 세그먼트를 따라 배열된 대립인자의 특정한 조합을 특징으로 하는 DNA의 세그먼트를 의미한다. 인간과 같은 이배체 개체의 경우, 일배체형은 각 다형성 마커 또는 유전자 좌에 대한 1쌍의 대립인자 중 하나의 대립인자를 포함한다. 특정한 구체예에서, 일배체형은 두개 이상의 대립인자, 세개 이상의 대립인자, 네개 이상의 대립인자, 또는 다섯개 이상의 대립인자를 포함할 수 있고, 각 대립인자는 세그먼트 상의 특정한 다형성 마커에 대응된다. 일배체형은 다양한 다형성 마커의 조합, 예를 들면, 다형성 부위에 특정한 대립인자를 갖는 SNP와 마이크로새틀라이트의 조합을 포함할 수 있다. 따라서, 일배체형은 다양한 유전적 마커에서 대립인자의 조합을 포함한다.

특정한 다형성 마커 및/또는 일배체형의 검출은 본 발명이 속하는 기술 분야에서 공지된, 다형성 부위에서 서열을 검출하는 방법에 의해 달성될 수 있다. 예를 들면, PCR, LCR, 이중 PCR(nested PCR) 및 핵산 증폭을 위한 기타 기법을 이용한, 형광-기반 기법(예를 들면, Chen, X. et al., Genome Res. 9(5): 492-98 (1999); Kutyavin et al., Nucleic Acid Res. 34: e128 (2006)))과 같은, SNP 및/또는 마이크로새틀라이트 마커의 존재에 대한 유전형분석을 위한 표준 기법이 이용될 수 있다. SNP 유전형분석을 위해 이용할 수 있는 특정한 방법들은 TaqMan 유전형 분석법(genotyping assay) 및 SNPlex 플랫폼(Applied Biosystems), 겔 전기영동(Applied Biosystems), 질량 분석법(예를 들면, Sequenom의 MassARRAY 시스템), 미니-시퀀싱(mini-sequencing) 방법, 실시간 PCR, Bio-Plex 시스템(BioRad), CEQ and SNPstream 시스템(Beckman), 어레이 혼성화 기술(예를 들면, Affymetrix GeneChip), BeadArray Technologies(예를 들면, Illumina GoldenGate 및 Infinium 분석법), 어레이 택(array tag) 기술(예를 들면, Parallele) 및 엔도뉴클레아제-기반 형광 혼성화 기술(Invader; Third Wave)를 포함하나, 이에 한정되지 않는다. Affymetrix SNP Array 6.0 및 Illumina CNV370-Duo 및 1M BeadChips를 포함한 이용가능한 어레이 플랫폼 중 일부는 특정 CNV를 태깅하는 SNP를 포함한다. 이는 이 플랫폼에 포함된 대리(surrogate) SNP를 통한 CNV의 검출을 가능하게 한다. 따라서, 상기 방법들 또는 본 발명이 속하는 기술분야의 당업자에게 이용가능한 다른 방법에 의해, 마이크로새틀라이트, SNP 또는 다른 종류의 다형성 마커를 포함한, 다형성 마커에서의 하나 이상의 대립인자가 확인될 수 있다.

본 방법에서, 질병에 대한 증가된 감수성(즉, 증가된 위험도)을 갖는 개체는 질병에 대해 증가된 감수성(증가된 위험도)을 부여하는 하나 이상의 다형성 마커의 하나 이상의 대립인자 또는 일배체형(즉, 위험 마커 대립인자 또는 일배체형)이 확인된 개체이다. 상기 위험 마커 또는 일배체형은 질병의 증가된 위험도(증가된 감수성)를 부여하는 마커 또는 일배체형이다. 일 구체예에서, 마커 또는 일배체형과 연관된 유의성은 상대적 위험도(relative risk, RR)에 의해 측정된다. 또 다른 구체예에서, 마커 또는 일배체형과 연관된 유의성은 오즈비(odds ratio, OR)에 의해 측정된다. 또 다른 구체예에서, 유의성은 백분율로 측정된다. 일 구체예에서, 유의성 있는 증가된 위험도는 1.2 이상, 1.3 이상, 1.4 이상, 1.5 이상, 1.6 이상, 1.7 이상, 1.8 이상, 1.9 이상, 2.0 이상, 2.5 이상, 3.0 이상, 4.0 이상, 및 5.0 이상을 포함하나, 이에 한정되지 않는, 1.2 이상의 위험도(상대적 위험도 및/또는 오즈비)로 측정된다. 특정한 구체예에서, 1.2 이상의 위험도(상대적 위험도 및/또는 오즈비)는 유의성이 있다. 또 다른 특정한 구체예에서, 1.3 이상의 위험도는 유의성이 있다. 또 다른 구체예에서, 1.4 이상의 위험도는 유의성이 있다. 또 다른 구체예에서, 1.5 이상의 위험도는 유의성이 있다. 또 다른 추가적인 구체예에서, 1.7 이상의 위험도는 유의성이 있다. 그러나, 다른 컷오프, 예를 들면, 1.15, 1.25, 1.35 이상 등이 고려되며, 그와 같은 컷오프도 또한 본 발명의 범위 내에 속한다. 다른 구체예에서, 위험도의 유의성 있는 증가는 약 25%, 약 30%, 약 35%, 약 40%, 약 45%, 약 50%, 약 55%, 약 60%, 약 65%, 약 70%, 약 75%, 약 80%, 약 85%, 약 90%, 약 95%, 및 약 100%, 약 150%, 약 200%, 약 300%, 및 약 500%를 포함하나, 이에 한정되지 않는, 약 20% 이상이다. 하나의 특정한 구체예에서, 위험도의 유의성 있는 증가는 20% 이상이다. 다른 구체예에서, 위험도의 유의성 있는 증가는 30% 이상, 40% 이상, 50% 이상, 60% 이상, 70% 이상, 80% 이상, 90% 이상 및 100% 이상이다. 그러나, 본 발명이 속하는 기술 분야의 당업자에 의해 본 발명의 특징으로 적합한 것으로 간주되는 다른 컷오프 또는 범위도 고려되고, 그들도 본 발명의 범위 내에 속한다. 특정한 구체예에서, 위험도의 유의성 있는 증가는 0.05 미만, 0.01 미만, 0.001 미만, 0.0001 미만, 0.00001 미만, 0.000001 미만, 0.0000001 미만, 0.00000001 미만, 또는 0.000000001 미만의 p-값과 같은 p-값을 특징으로 한다.

본 명세서에 기재된 위험 다형성 마커 또는 일배체형은 하나 이상의 마커의 하나 이상의 대립인자 또는 일배체형이 비교군(대조군)에서의 존재의 빈도 대비 질병에 대한 위험도를 갖거나 상기 질병 또는 성향으로 진단된 개체(질병군(affected))에 보다 빈번하게 존재하여, 상기 마커 또는 일배체형의 존재가 상기 질병에 대한 감수성을 나타내는 것인 마커 또는 일배체형이다. 일 구체예에서, 대조군은 집단 표본(population sample), 즉, 일반적인 집단으로부터의 랜덤 표본일 수 있다. 또 다른 구체예에서, 대조군은 질병에 걸리지 않은 개인의 군으로 대표된다. 일 구체예에서, 그와 같은, 질병-불포함(disease-free) 대조군은 하나 이상의 특정한 질병-연관 증상의 부재를 특징으로 할 수 있다. 대안적으로, 질병-불포함 대조군은 해당 질병으로 진단되지 않은 개인들일 수 있다. 또 다른 구체예에서, 상기 질병-불포함 대조군은 하나 이상의 질병-특이적 위험 인자의 부재를 특징으로 한다. 일 구체예에서, 그와 같은 위험 인자는 하나 이상의 환경적 위험 인자이다. 대표적인 환경적 인자들은 특정한 질병 또는 성향을 발현할 위험도에 영향을 미치는 것으로 알려지거나, 상기 위험도에 영향을 미치는 것으로 고려되는 천연 산물, 미네랄, 또는 기타 화학물질이다. 기타 환경적 위험 인자들은 식음습관(food and drink habit), 주요 거주지의 지리적 위치 및 직업적 위험 인자를 포함하나, 이에 한정되지 않는, 생활방식(lifestyle)과 관련된 위험 인자들이다. 또 다른 구체예에서, 위험 인자는 하나 이상의 추가적인 유전적 위험 인자를 포함한다.

상관관계에 대한 간단한 검정의 예로서 2 x 2 표(two by two table) 상에서의 Fisher-exact 검정이 있다. 염색체의 코호트가 주어지면, 마커 및 일배체형을 모두 포함하는 염색체, 마커 또는 일배체형을 중 하나를 포함하고, 나머지 하나는 포함하지 않는 염색체 및 마커나 일배체형 중 어느 것도 포함하지 않는 염색체의 갯수로부터 2 x 2 표가 작성된다. 본 발명이 속하는 기술 분야의 당업자에게 공지된 연관의 다른 통계적 검정도 본 발명의 범위 내에 속한다.

본 발명의 다른 구체예에서, 질병 또는 성향에 대한 감소된 감수성(즉, 감소된 위험도)을 갖는 개체는 상기 질병 또는 성향에 대한 감소된 감수성을 부여하는 하나 이상의 다형성 마커의 하나 이상의 특정한 대립인자 또는 일배체형이 확인된 개체이다. 감소된 위험도를 부여하는 마커 대립인자 및/또는 일배체형은 또한 보호성(protective)인 것으로 표현된다. 일 양태에서, 보호성 마커 또는 일배체형은 질병 또는 성향의 유의성 있는 감소된 위험도(또는 감수성)를 부여하는 마커 또는 일배체형이다. 일 구체예에서, 유의성 있는 감소된 위험도는 0.9 미만, 0.8 미만, 0.7 미만, 0.6 미만, 0.5 미만, 0.4 미만, 0.3 미만, 0.2 미만 및 0.1 미만을 포함하나, 이에 한정되지 않는, 0.9 미만의 상대적 위험도로 측정된다. 하나의 특정한 구체예에서, 유의성 있는 감소된 위험도는 0.7 미만이다. 또 다른 구체예에서, 유의성 있는 감소된 위험도는 0.5 미만이다. 또 다른 구체예에서, 유의성 있는 감소된 위험도는 0.3 미만이다. 또 다른 구체예에서, 위험도(또는 감수성)의 감소는 25% 이상, 30% 이상, 35% 이상, 40% 이상, 45% 이상, 50% 이상, 55% 이상, 60% 이상, 65% 이상, 70% 이상, 80% 이상, 85% 이상, 90% 이상, 95% 이상 및 98% 이상을 포함하나, 이에 한정되지 않는, 20% 이상이다. 하나의 특정한 구체예에서, 위험도의 유의성 있는 감소는 약 30% 이상이다. 또 다른 구체예에서, 위험도의 유의성 있는 감소는 약 50% 이상이다. 또 다른 구체예에서, 위험도의 유의성 있는 감소는 약 70% 이상이다. 그러나, 본 발명이 속하는 기술 분야의 당업자에 의해 본 발명의 특징으로 적합한 것으로 간주되는 다른 컷오프 또는 범위도 고려되고, 그들도 본 발명의 범위 내에 속한다.

본 발명이 속하는 기술 분야의 당업자는 연구된 집단에 존재하는 두개의 대립인자를 갖는 마커(예를 들면, SNP)에 대해, 하나의 대립인자가 상기 집단 내에서 성향 또는 질병을 갖는 개인의 그룹에서 대조군 대비 증가된 빈도로 발견되는 경우, 상기 마커의 나머지 다른 대립인자는 상기 성향 또는 질병을 갖는 개인의 그룹에서 대조군 대비 감소된 빈도로 발견될 것으로 이해할 것이다. 그와 같은 경우에, 상기 마커의 하나의 대립인자(상기 성향 또는 질병을 갖는 개인에서 증가된 빈도로 발견되는 대립인자)는 위험 대립인자(at-risk allele)이고, 나머지 다른 대립인자는 보호성 대립인자(protective allele)일 것이다.

질병 또는 성향(예를 들면, 갑상선암)과 연관된 유전적 변이가 단독으로 주어진 유전형에 대해 질병의 위험도를 예측하기 위해 이용될 수 있다. SNP와 같은 이대립인자 마커(biallelic marker)의 경우, 3개의 가능한 유전형이 있다: 위험 변이에 대한 동형접합체, 이형접합체(heterozygote), 및 상기 위험 변이의 비-보인자(non-carrier). 복수의 유전자 좌에서의 변이와 연관된 위험도가 전체 위험도를 추정하기 위해 이용될 수 있다. 복수 개의 SNP 변이에 대해, k = 3ⁿx 2^p 개의 가능한 유전형이 있고; 상기에서 n은 상염색체 유전자좌(autosomal loci)의 갯수이고 p는 성염색체 유전자좌의 갯수이다. 복수 개의 위험 변이에 대한 전체 위험도 평가 계산은 통상적으로 상이한 유전적 변이의 상대적 위험도가 곱해진다는 것, 즉, 특정한 유전형 조합과 연관된 전체 위험도(예를 들면, RR 또는 OR)가 각 유전자좌의 유전자형에 대한 위험도 값의 곱이라는 것을 가정한다. 제시된 위험도가 일치된(matched) 성별 및 민족을 갖는 기준 집단 대비 개인, 또는 개인에 대한 특정한 유전형에 대한 상대적 위험도인 경우, 통합 위험도(combined risk)는 유전자좌-특이적 위험도 값의 곱이고, 이는 또한 집단 대비 전체 위험도 추정치에 해당한다. 개인에 대한 위험도가 위험 대립인자의 비-보인자에 대한 비교에 근거하는 경우, 통합 위험도는 모든 유전자좌의 유전형의 주어진 조합을 갖는 개인을 상기 유전자좌들에서 위험 변이를 보유하지 않는 개인들의 군에 비교하는 추정치에 해당한다. 위험 변이의 비-보인자들의 그룹은 가장 낮은 추정된 위험도를 가지며 그 자체(즉, 비-보인자)와 비교하여 1.0의 통합 위험도를 가지나, 집단 대비, 1.0 미만의 전체 위험도를 갖는다. 비-보인자 그룹은 잠재적으로 매우 작을 수 있고, 특히, 다수의 유전자좌에 대해 매우 작을 수 있으며, 그 경우, 그의 관련성은 그만큼 작다는 것에 주목해야 한다.

승법 모델(multiplicative model)은 일반적으로 복합 성향(complex trait)의 데이터에 합리적으로 잘 맞는 간명(parsimonious) 모델이다. 승법성(multiplicity)으로부터의 편향은 일반적인 질환에 대한 일반적인 변이에서는 드물게 설명되었으며, 보고된 경우에도, 제안적인 것에 불과하며, 이는 유전자좌 간의 통계적 상호작용을 입증할 수 있기 위해서는 매우 큰 표본 크기가 통상적으로 요구되기 때문이다.

예로서, 케이스가 갑상선암과 연관된 총 8개의 변이를 가졌다는 것을 고려한다(Gudmundsson, J., et al., Nat Genet 39:631-7 (2007), Gudmundsson, J., et al., Nat Genet 39:977-83 (2007); Yeager, M., et al, Nat Genet 39:645-49 (2007), Amundadottir, L., el al., Nat Genet 38:652-8 (2006); Haiman, C.A., et al., Nat Genet 39:638-44 (2007)). 이 유전자좌들 중 7개는 상염색체 상에 존재하고, 나머지 유전자좌는 염색체 X에 존재한다. 이때, 이론적인 유전형 조합의 총수는 3⁷x 2¹ = 4373이다. 그 유전형 분류(genotypic class) 중 일부는 매우 드무나, 여전히 가능하고, 전체 위험도 평가를 위해 고려되어야 한다. 복수 개의 유전적 변이의 경우에 적용된 승법 모델은 상기 유전적 변이가 "환경적(environmental)" 인자와 명확하게 상관되지 않는다는 것을 가정할 때 비-유전적 위험 변이와의 결합(conjugation)에서 유효할 것으로 보인다. 다시 말하면, 비-유전적 위험 인자와 유전적 위험 인자가 상호작용하지 않는다는 것을 가정할 때, 유전적 변이와 비-유전적 변이는 통합 위험도를 추정하기 위해 승법 모델 하에 평가될 수 있다.

동일한 정량적 접근방법을 이용하여, rs965513 (서열번호 1), rs907580 (서열번호 2) 및 rs7024345 (서열번호 3), 또는 이들과 연관 불균형인 마커들 중 하나의 조합을 포함한, 갑상선암과 연관된 복수 개의 변이와 관련된 통합 위험도 또는 전체 위험도가 평가될 수 있다.

연관 불균형(Linkage Disequilibrium)

각 감수분열 사건 동안 각 염색체 쌍에 대해 평균 1회 일어나는, 재조합의 자연적인 현상은 자연이 서열(및 결과적으로 생물학적 기능)에 변화를 제공하는 한가지 방법이다. 재조합은 게놈에서 랜덤하게 일어나지 않는 것으로 발견되었다; 오히려, 재조합율의 빈도에 큰 변화가 있어서, 높은 재조합 빈도를 갖는 작은 영역(따라서, 재조합 핫스팟(recombination hotspot)으로 불림) 및 일반적으로 연관 불균형(LD) 블럭이라 불리는, 낮은 재조합 빈도의 보다 넓은 영역을 생성한다(Myers, S. et al., Biochem Soc Trans 34:526-530 (2006); Jeffreys, A.J., et al.,Nature Genet 29:217-222 (2001); May, C.A., et al., Nature Genet 31:272-275(2002)).

연관 불균형(Linkage Disequilibrium, LD)은 두 개의 유전적 요소의 비-랜덤 조합(non-random assortment)을 의미한다. 예를 들면, 특정한 유전적 요소(예를 들면, 다형성 마커의 대립인자(allele), 또는 일배체형)가 0.50(50%)의 빈도로 집단에서 일어나고, 또 다른 요소가 0.50(50%)의 빈도로 일어나는 경우, 두 요소를 모두 갖는 개인의 예상되는 발생율은 상기 요소들의 랜덤 분포를 가정하면, 0.25(25%)이다. 그러나, 상기 두 요소들이 0.25보다 더 높은 빈도로 함께 나타나는 것으로 발견되는 경우, 상기 요소들은 연관 불균형에 있다고 하며, 이는 그들이 그들의 독립적인 발생의 빈도(예를 들면, 대립인자 또는 일배체형 빈도)가 예측하는 비율보다 더 높은 비율로 함께 유전되는 경향이 있기 때문이다. 개략적으로, LD는 일반적으로 두 요소간의 재조합 사건의 빈도와 상관관계를 갖는다. 집단에서 대립인자 또는 일배체형 빈도는 집단 내의 개체의 유전형을 분석하고 상기 집단에서 각 대립인자 또는 일배체형의 발생 빈도를 결정하는 것에 의해 결정될 수 있다. 이배체(diploid)의 집단, 예를 들면, 인간 집단의 경우, 개인들은 일반적으로 각 유전적 요소(예를 들면, 마커, 일배체형 또는 유전자)에 대해 두 개의 대립인자 또는 대립인자 조합을 가질 것이다.

다수의 상이한 척도들이 연관 불균형(LD; Develin, B & Risch, N., Genomics 29:311-22(1995)))의 강도를 평가하기 위해 제안되었다. 대부분은 이대립인자(biallelic) 부위의 쌍 간의 연관의 강도를 획득한다. LD의 두 개의 중요한 쌍대 척도(pairwise measures)는 r² (△²으로 표시되기도 함) 및 |D'|이다(Lewontin, R., Genetics 49: 49-67 (1964); Hill, W.G. & Robertson, A. Thor. Appl. Genet. 22:226-231(1968)). 두 척도는 모두 0(불균형 없음) 내지 1('완전한' 불균형)의 범위이나, 그들의 해석은 약간 다르다. |D'|는 가능한 일배체형 중 2개 또는 3개만 존재하는 경우, 그 값이 1이고, 모든 4개의 가능한 일배체형이 존재하는 경우는 그 값이 1보다 작은 것으로 정의된다. 따라서, 1보다 작은 |D'|의 값은 두 부위 간에 과거에 재조합이 일어났을 수도 있다는 것을 나타낸다(재발성 돌연변이(recurrent mutation)는 |D'|가 1보다 작게할 수 있으나, 단일 뉴클레오티드 다형성(SNP)의 경우, 이는 통상적으로 재조합보다 가능성이 낮은 것으로 간주됨). 척도 r²은 두 부위간의 통계적 상관성을 나타내고, 두 개의 일배체형만 존재하는 경우 1의 값을 취한다.

r²과, 감수성 유전자 좌와 SNP 간의 연관성을 검출하기 위해 요구되는 표본 크기 간에 단순한 반비례 관계(inverse relationship)가 있기 때문에, r² 측정값은 이론의 여지는 있지만 연관 맵핑(association mapping)에 대한 가장 적합한 척도이다. 이 척도는 부위의 쌍에 대해 정의되나, 일부 적용의 경우, 다수의 다형성 부위를 포함하는 전체 영역에서 LD가 얼마나 강한지를 결정하는 것이 바람직할 수 있다(예를 들면, LD의 강도가 유전자 좌들 간에 또는 집단 전체에 있어서 유의성 있게 상이한지 여부, 또는 하나의 영역에서 특정한 모델 하에서 예측된 것보다 더 크거나 또는 더 작은 LD가 존재하는지 여부). 영역 전체에 걸친 LD의 측정은 간단하지 않으나, 한 가지 방법은 집단 유전학에서 개발된, 척도 r을 이용하는 것이다. 개략적으로 말하면, r은 데이터에서 확인되는 LD를 생성하기 위해, 특정한 집단 모델 하에서 어느 정도의 재조합이 요구되는지를 측정한다. 이 종류의 방법은 또한 잠재적으로 LD 데이터가 재조합 핫스팟의 존재에 대한 증거를 제공하는지 여부를 결정하는 문제에 대한 통계적으로 엄격한 방식을 제공할 수 있다. 본 명세서에 기재된 방법의 경우, 유의성 있는 r² 값은 0.1 이상, 예를 들면, 0.1 이상, 0.15 이상, 0.2 이상, 0.25 이상, 0.3 이상, 0.35 이상, 0.4 이상, 0.45 이상, 0.5 이상, 0.55 이상, 0.6 이상, 0.65 이상, 0.7 이상, 0.75 이상, 0.8 이상, 0.85 이상, 0.9 이상, 0.91 이상, 0.92 이상, 0.93 이상, 0.94 이상, 0.95 이상, 0.96 이상, 0.97 이상, 0.98 이상, 또는 0.99 이상일 수 있다. 하나의 바람직한 구체예에서, 유의성 있는 r² 값은 0.2 이상일 수 있다. 대안적으로, 연관 불균형인 마커들은 0.3 이상, 0.4 이상, 0.5 이상, 0.6 이상, 0.7 이상, 0.8 이상, 0.85 이상, 0.9 이상, 0.95 이상, 0.96 이상, 0.97 이상, 0.98 이상, 0.99 이상과 같은, 0.2 이상의 |D'| 값을 특징으로 한다. 따라서, 연관 불균형은 별개의 마커들의 대립인자 간의 상관관계를 나타낸다. 연관 불균형은 상관 계수 또는 |D'|에 의해 측정된다 (1.0 이하의 r² 및 1.0 이하의 |D'|).특정한 구체예에서, 연관 불균형은 r² 및 |D'| 척도 모두에 대한 값으로 정의된다. 하나의 그와 같은 구체예에서, 유의성 있는 연관 불균형은 r² > 0.1 및 |D'| >0.8로 정의된다. 또 다른 구체예에서, 유의성 있는 연관 불균형은 r² > 0.2 및 |D'| >0.9로 정의된다. 연관 불균형을 결정하기 위한 r² 및|D'|의 값의 다른 조합과 치환(permutation)도 고려되고, 또한 본 발명의 범위 내에 속한다. 연관 불균형은 본 명세서에서 정의된 바와 같이, 하나의 인간 집단에서 결정될 수 있거나, 또는 하나보다 많은 인간 집단으로부터의 개인들을 포함하는 표본의 집합(collection)에서 결정될 수 있다. 본 발명의 일 구체예에서, LD는 정의된 바와 같은(http://www.hapmap.org), 하나 이상의 HapMap 집단(코카서스인, 아프리카인, 일본인, 중국인)으로부터의 표본에서 결정된다. 하나의 그와 같은 구체예에서, LD는 HapMap 표본의 CEU 집단(Utah residents with ancestry from northern and western Europe)에서 결정된다. 또 다른 구체예에서, LD는 HapMap 표본의 YRI 집단에서 결정된다. 또 다른 구체예에서, LD는 아이슬란드 집단으로부터의 표본에서 결정된다.

게놈의 모든 다형성이 집단 수준에서 독립적이면(즉, LD가 없음), 모든 상이한 다형성 상태를 평가하기 위해, 모든 단일 다형성이 연관(association) 연구에서 조사되어야 할 것이다. 그러나, 다형성 간의 연관 불균형 때문에, 긴밀하게 연관된 다형성들이 강한 상관관계를 가지며, 이는 유의성 있는 연관을 관찰하기 위해 연관 연구에서 조사되어야 하는 다형성의 갯수를 감소시킨다. LD의 또 다른 결과는 이 다형성들이 강한 상관관계를 갖는다는 사실 때문에, 다수의 다형성들이 연관 신호(association signal)를 생성할 수 있다는 것이다.

게놈 LD 맵이 게놈 전체에 대해 생성되었고, 그와 같은 LD 맵이 질병-유전자를 맵핑하기 위한 프레임워크로 작용하는 것으로 제안되었다(Risch, N. & Merkiangas, K, Science 273:1516-1517 (1996); Maniatis, N., et al., Proc Natl Acad Sci USA 99:2228-2233 (2002); Reich, DE et al, Nature 411:199-204 (2001)).

현재, 인간 게놈의 많은 부분들이 수개의 공통된 일배체형을 포함하는 일련의 별개의 일배체형 블럭들로 분류될 수 있다는 것이 확립되었다; 이 블럭들의 경우, 연관 불균형 데이터는 재조합을 나타내는 증거를 거의 제공하지 않는다(예를 들면, Wall., J.D. and Pritchard, J.K., Nature Reviews Genetics 4:587-597 (2003); Daly, M. et al., Nature Genet. 29:229-232 (2001); Gabriel, S.B. et al., Science 296:2225-2229 (2002); Patil, N. et al., Science 294:1719-1723 (2001); Dawson, E. et al., Nature 418:544-548 (2002); Phillips, M.S. et al., Nature Genet. 33:382-387 (2003) 참조).

이와 같은 일배체형 블럭을 정의하는 두 가지 주요한 방법들이 있다: 블럭은 한정된 일배체형 다양성을 갖는 DNA의 영역(예를 들면, Daly, M. et al., Nature Genet. 29:229-232 (2001); Patil, N. et al., Science 294:1719-1723 (2001); Dawson, E. et al., Nature 418:544-548 (2002); Zhang, K. et al., Proc. Natl. Acad. Sci. USA 99:7335-7339 (2002) 참조), 또는, 연관 불균형을 이용하여 확인된, 광범위한 과거의 재조합(extensive historical recombination)을 갖는 이행 구역(transition zone) 간의 영역(예를 들면, Gabriel, S.B. et al., Science 296:2225-2229 (2002); Phillips, M.S. et al., Nature Genet. 33:382-387 (2003); Wang, N. et al., Am. J. Hum. Genet. 71:1227-1234 (2002); Stumpf, M.P., and Goldstein, D.B., Curr. Biol. 13:1-8 (2003) 참조)으로 정의될 수 있다. 보다 최근에, 인간 게놈 전체에 대한 재조합률(recombination rate) 및 상응하는 핫스팟의 상세 맵(fine-scale map)이 작성되었다(Myers, S., et al., Science 310:321-32324 (2005); Myers, S. et al., Biochem Soc Trans 34:526530 (2006)). 상기 맵은 게놈 전체에서 재조합의 엄청난 변이를 보여주며, 재조합률은 핫스팟에서 10-60 cM/Mb로 높았고, 개재 영역(intervening region)에서는 재조합률이 0에 가까워서, 제한적인 일배체형 다양성 및 높은 LD의 영역을 나타낸다. 따라서, 상기 맵은 일배체형 블럭 및/또는 LD 블럭을 재조합 핫스팟에 의해 둘러싸인(flanked) 영역으로 정의하기 위해 이용될 수 있다. 본 명세서에서 사용된, 용어 "일배체형 블럭(haplotype block)" 또는 "LD 블럭"은 전술된 특징들에 의해 정의되는 블럭, 또는 그와 같은 영역을 정의하기 위해 본 발명이 속하는 기술 분야의 당업자에 의해 이용되는 다른 대안적인 방법에 의해 정의되는 블럭을 포함한다.

일배체형 블럭(LD 블럭)이 단일 마커 또는 복수 개의 마커를 포함하는 일배체형을 이용하여, 표현형과 일배체형 상태 간의 연관을 맵핑하기 위해 이용될 수 있다. 주요한 일배체형이 각 일배체형 블럭에서 식별될 수 있고, 그 후 일련의 "태깅(tagging)" SNP 또는 마커(일배체형들을 구별하기 위해 필요한 SNP 또는 마커의 최소 세트)가 식별될 수 있다. 그 후, 이 태깅 SNP 또는 마커는 표현형과 일배체형 간의 연관을 확인하기 위해, 개체들의 그룹으로부터의 표본의 평가에서 이용될 수 있다. 필요한 경우, 일배체형 블럭 간에 연관 불균형이 존재할 수 있기 때문에, 인접 일배체형 블럭이 동시에 평가될 수 있다.

따라서, 게놈에서 다형성 마커에 대한 관찰된 연관에 대해, 게놈 내의 추가적인 마커들이 또한 연관을 보일 수 있다는 것이 명백하다. 이는 재조합률의 큰 변이에서 관찰된 바와 같이, 게놈 전체에서 LD의 불균등한 분포의 당연한 결과이다. 따라서, 연관을 검출하기 위해 이용되는 마커들은 주어진 질병 또는 성향과 연관된 게놈 영역(즉, 일배체형 블럭 또는 LD 블럭)에 대한 "택(tag)"을 나타내고, 따라서, 본 발명의 방법 및 키트에서 사용하기에 유용하다. 하나 이상의 원인이 되는(causative)(기능성) 변이 또는 돌연변이가 상기 질병 또는 성향과 연관된 것으로 확인되는 영역 내에 존재할 수 있다. 기능성 변이는 또 다른 SNP, 연쇄 반복체 다형성(tandem repeat polymorphism)(예를 들면, 미니새틀라이트 또는 마이크로새틀라이트), 전이성 요소(transposable element), 역전, 결실 또는 삽입과 같은 카피수 변화일 수 있다. 본 명세서에 기재된 변이와 LD인 그와 같은 변이는 연관을 검출하기 위해 이용되는 태깅 마커에 대해 관찰되는 것보다 더 높은 상대적 위험도(RR) 또는 오즈비(OR)를 부여할 수 있다. 따라서, 본 발명은 본 명세서에 기재된 바와 같이, 질병과의 연관을 검출하기 위해 이용되는 마커, 및 상기 마커와 연관 불균형인 마커를 포함한다. 따라서, 본 발명의 특정한 구체예에서, 본 명세서에서 기재된, 본 발명의 마커 및/또는 일배체형과 LD인 마커가 대리 마커(surrogate marker)로 이용될 수 있다. 일 구체예에서, 대리 마커는 원래 상기 질병과 연관된 것으로 확인된 마커 또는 일배체형의 경우보다 더 작은 상대적 위험도(RR) 및/또는 오즈비(OR)을 갖는다. 다른 구체예에서, 대리 마커는 상기 질환과 연관된 것으로 초기에 확인된 마커에 대해 초기에 결정된 RR 또는 OR 값보다 큰 RR 또는 OR 값을 갖는다. 그와 같은 구체예의 예는 상기 질병과 연관되는 것으로 초기에 확인된 것 보다 더 일반적인 변이(> 10% 집단 빈도)와 LD인 드물거나, 또는 비교적 드문(< 10% 대립인자의 집단 빈도) 변이일 것이다. 연관을 검출하기 위해 그와 같은 대리 마커들을 식별하고 이용하는 것은 본 발명이 속하는 기술 분야의 당업자에게 잘 알려진 통상적인 방법에 의해 수행될 수 있고, 따라서, 본 발명의 범위에 속한다.

일배체형 빈도의 결정

기대값-최대화 알고리즘(expectation-maximization algorithm)을 이용하여 환자군 및 대조군에서 일배체형의 빈도를 추정할 수 있다(Dempster A. et al., J. R. Stat. Soc. B, 39:1-38 (1977)). 결실된 유전형 및 그 단계(phase)에 따른 불확실성을 처리할 수 있는 이 알고리즘의 구현이 이용될 수 있다. 귀무 가설(null hypothesis) 하에서, 환자와 대조군은 동일한 빈도를 갖는 것으로 가정된다. 우도 방식(likelihood approach)을 이용하여, 본 명세서에 기재된 마커들을 포함할 수 있는, 후보 위험-일배체형이 대조군에서보다 환자에서 보다 높은 빈도를 가지며, 다른 일배체형의 빈도는 양 군에서 동일한 것으로 가정되는 것인 대립 가설(alternate hypothesis)이 테스트된다. 양 가설 하에 우도가 각각 최대화되고, 상응하는 1-df 우도 비 통계값이 통계적 유의성을 평가하기 위해 이용된다.

감수성 영역, 예를 들면, LD 블럭 영역 내에서 위험 마커와 일배체형 및 보호성 마커와 일배체형을 찾기 위해, 상기 영역 내의 유전형 분석된 마커들의 모든 가능한 조합의 연관이 연구된다. 통합된 환자군과 대조군이 원래의 환자군 및 대조군과 동일한 크기인 두개의 세트로 무작위로 분류될 수 있다. 그 후, 마커 및 일배체형 분석이 반복되고, 기록된 가장 유의성 있는 p-값이 결정된다. 이 랜덤화 체계(randomization scheme)는 p-값의 경험적 분포를 구성하기 위해 예를 들면, 100회 이상 반복될 수 있다. 바람직한 구체예에서, 0.05 미만의 p-값은 유의성 있는 마커 및/또는 일배체형 연관을 나타낸다.

일배체형 분석

일배체형 분석의 일반적인 방법은 NEsted MOdels에 적용된 우도-기반 추론(likelihood-based inference)을 이용하는 단계를 포함한다(Gretarsdottir S., et al., Nat. Genet. 35:131-38 (2003)). 상기 방법은 다수의 다형성 마커, SNP 및 마이크로새틀라이트에 대해 이용될 수 있는 프로그램 NEMO에서 구현된다. 상기 방법 및 소프트웨어는 특별히, 상이한 위험도를 부여하는 일배체형 그룹을 식별하는 것을 목적으로 하는 케이스-대조군(case-control) 연구를 위해 설계된다. 상기 방법 및 소프트웨어는 또한 LD 구조를 연구하기 위한 도구이다. NEMO에서, 관찰된 데이터가 이를 결실-데이터(missing-data) 문제로 처리하기 때문에, EM 알고리즘을 이용하여, 최대 우도 추정치, 우도 비(likelihood ratio) 및 p-값이 직접 계산된다.

단계(phase)의 불확실성 및 결실된 유전형에 따른 정보 소실을 반영한, 관찰된 데이터에 대해 직접 계산된 우도에 기반한 우도 비 테스트가 유효한 p-값을 제공하기 위해 이용될 수 있으나, 정보의 불완전성 때문에 소실된 데이터의 양을 아는 것이 여전히 유용할 것이다. 일배체형 분석의 정보 척도(information measure)는 Nicolae and Kong (Technical Report 537, Department of Statistics, University of Statistics, University of Chicago; Biometrics, 60(2):368-75 (2004))에서 연관성 분석(linkage analysis)를 위해 정의된 정보 척도의 당연한 연장(natural extension)으로 설명되며, NEMO에서 구현된다.

질병에 대한 단일 마커 연관을 위해, 각각의 개별적인 대립인자에 대해 양측 p-값(two-sided p-value)을 계산하기 위해 Fisher exact 테스트가 이용될 수 있다. 일반적으로, 모든 p-값은 구체적으로 표시되지 않으면, 다중 비교에 대해 조정되지 않은 상태로 제시된다. (마이크로새틀라이트, SNP 및 일배체형에 대한) 제시된 빈도는 보인자 빈도가 아닌 대립인자 빈도이다. 연구에 가족으로 동원된 환자들의 혈연관계(relatedness)에 의한 편향을 최소화하기 위해, 일촌 및 이촌 친척(first and second-degree relatives)이 환자 목록으로부터 제외될 수 있다. 또한, 동기간 관계(sibship)에 대해 이전에 설명된 분산 조정 절차(variance adjustment procedure)를 수행하는 것에 의해(Risch, N. & Teng, J. Genome Res., 8:1273-1288 (1998)), 환자 중 남은 혈연관계에 대해 보정하기 위해 연관 테스트가 반복될 수 있어서, 일반적인 가족 관계에 적용될 수 있고, 비교를 위해 조정 p-값 및 미조정(unadjusted) p-값을 제시할 수 있다. 게놈 대조의 방법(Devlin, B. & Roeder, K. Biometrics 55:997 (1999))은 또한 개인들 간의 혈연관계 및 가능한 계층화(stratification)에 대해 조정하기 위해 이용될 수 있다. 차이는 일반적으로 예상되는 것에 비해 매우 작다. 복수 테스트에 대해 보정된 단일-마커 연관의 유의성을 평가하기 위해, 본 발명자들은 동일한 유전형 데이터를 이용하여 랜덤화(randomization) 테스트를 수행할 수 있다. 환자들과 대조군의 코호트가 랜덤화되고 연관 분석이 복수 회(예를 들면, 500,000회까지) 반복되고, p-값은 본 발명자들이 최초의 환자 및 대조군 코호트를 이용하여 관찰한 p-값보다 더 낮거나 또는 이와 동일한 일부 마커 대립인자에 대한 p-값을 생성하는 재현의 부분(fraction)이다.

단일 마커 분석 및 일배체형 분석에 대해, 승법 모델(multiplicative model)(일배체형 상대적 위험도 모델), 즉, 한 사람이 갖는 두 개의 대립인자/일배체형의 위험도들이 곱해진다는 승법 모델을 가정하여 상대적 위험도(RR) 및 집단 귀속 위험도(population attributable risk, PAR)가 계산될 수 있다(Terwilliger, J.D. & Ott, J., Hum. Hered. 42:337-46 (1992) and Falk, C.T. & Rubinstein, P, Ann. Hum. Genet. 51 (Pt 3):227-33 (1987)). 예를 들면, RR이 a 대비 A의 위험도라면, 동형접합체 AA를 갖는 사람의 위험도는 이형접합체 Aa의 위험도의 RR배이고, 동형접합체 aa를 갖는 사람의 RR²배일 것이다. 승법 모델은 분석 및 계산을 단순화하는 유용한 특성을 갖는다- 환자 집단(affected population) 및 대조구 집단 내에서 일배체형은 독립적이고, 즉, 하디-와인버그 평형(Hardy-Weinberg equilibrium)에 있다. 그 결과, 환자(affected)와 대조군 각각의 일배체형 계수(haplotype count)는 다항 분포를 가지나, 대립 가설 하에서 상이한 일배체형 빈도를 갖는 다항 분포를 갖는다. 구체적으로, 두개의 일배체형, h_i 및 h_j에 대해, risk(h_i)/risk(h_j) = (f_i/p_i)/(f_j/p_j)이고, 상기에서 f와 p는 각각 환자 집단 및 대조군 집단에서의 빈도를 나타낸다. 실제 모델이 승법성이 아닌 경우, 일부 검정력 손실(power loss)이 있으나, 이 손실은 극단적인 경우를 제외하고는 작은(mild) 경향이 있다. 가장 중요한 것은, p-값은 귀무 가설 하에 계산되기 때문에, 항상 유효하다는 것이다.

하나의 연관 연구에서 검출된 연관 신호가 이상적으로는 동일하거나 또는 상이한 민족의 상이한 집단(예를 들면, 동일 국가의 다른 지역, 또는 다른 국가)으로부터 유래된 제2 코호트에서 재현될 수 있다. 재현 연구(replication study)의 장점은 재현 연구에서 수행되는 테스트의 횟수, 및 이에 따라 적용되는 덜 엄격한 통계적 척도이다. 예를 들면, 300,000개의 SNP를 이용한, 특정 질병 또는 성향에 대한 감수성 변이의 게놈-전체 검색을 위해, 수행된 300,000회의 테스트(각 SNP당 1회)에 대한 보정(correction)이 수행될 수 있다. 통상적으로 이용되는 어레이 상의 다수의 SNP가 상관되기(즉, LD 관계) 때문에, 그들은 독립적이지 않다. 따라서, 보정은 보수적이다. 그럼에도 불구하고, 이 보정 인자를 적용하는 것은 신호가 단일 연구 코호트로부터의 결과에 대해 이 보수적 테스트를 적용하는 것이 유의성이 있는 것으로 간주되기 위해서는 0.05/300,000 = 1.7 x 10^-7 미만의 관찰된 P-값을 요구한다. 분명히, 이 보수적 역치(threshold) 미만의 P-값을 갖는 게놈-전체 연구에서 확인된 신호는 진정한 유전적 효과의 척도이며, 추가적인 코호트에서의 재현이 통계학적 관점에서 반드시 요구되는 것은 아니다. 그러나, 보정 인자는 수행된 통계적 검정의 갯수에 의존적이기 때문에, 최초 연구로부터의 신호(하나의 SNP)가 제2 케이스-대조군 코호트에서 재현되는 경우, 유의성에 대한 적합한 통계적 검정은 단일 통계적 검정에 대해, 0.05 미만의 P-값을 갖는 것이다. 하나 또는 여러 개의 추가적인 케이스-대조군 코호트에서의 재현 연구는 추가적인 집단에서 연관 신호의 평가를 제공하여, 동시에 최초 발견을 확인하고 일반적인 인간 집단에서 테스트되고 있는 유전적 변이(들)의 전체 유의성의 평가를 제공하는 추가적인 장점을 갖는다.

여러 케이스-대조군 코호트로부터의 결과는 또한 기저 효과(underlying effect)의 전체 평가를 제공하기 위해 통합될 수 있다. 복수 개의 유전적 연관 연구로부터의 결과를 통합하기 위해 통상적으로 이용되는 방법은 Mantel-Haenszel 모델이다(Mantel and Haenszel, J Natl Cancer Inst 22:719-48 (1959)). 상기 모델은 각각 유전적 변이의 상이한 집단 빈도를 갖는, 상이한 집단으로부터의 연관 결과가 통합되는 상황을 다루기 위해 설계되었다. 상기 모델은 OR 또는 RR에 의해 측정된, 질병의 위험도에 대한 변이의 효과가 모든 집단에서 동일하고, 변이의 빈도는 집단간에 상이할 수 있다는 것을 가정하여 결과를 통합한다. 여러 개의 집단으로부터의 결과를 통합하는 것은 통합된 코호트에 의해 제공되는 증가된 통계적 검정력 때문에, 실제의 기저 연관 신호를 검출하기 위한 전체 검정력(power)이 증가된다는 추가적인 장점을 갖는다. 또한, 다수의 코호트로부터의 결과가 통합되는 경우, 예를 들면, 케이스와 대조군 간의 비균등한 일치(mataching) 또는 집단 계층화(population stratification)에 따른, 개별적인 연구의 결함이 균형잡히는 경향이 있어서, 진정한 기저 유전적 효과의 보다 우수한 추정을 제공할 것이다.

위험도 평가 및 진단

주어진 집단 내에서, 사람이 특정된 기간 동안 특정한 질병 또는 성향을 발생시킬 가능성으로 정의된, 질병 또는 성향을 발생시킬 절대 위험도(absolute risk)가 있다. 예를 들면, 여성의 갑상선암에 대한 생애 절대 위험도(lifetime absolute risk)는 1/9이다. 즉, 9명의 여성 당 1명은 그들의 생애 중 어느 시점에 갑상선암을 발병할 것이다. 위험도(risk)는 통상적으로 특정인이 아니라, 매우 많은 수의 사람들을 조사하는 것에 의해 측정된다. 위험도는 종종 절대적 위험도(Absolute Risk, AR) 및 상대적 위험도(Relative Risk, RR)로 제시된다. 상대적 위험도는 두개의 변이와 연관된 위험도, 또는 두개의 상이한 사람들의 그룹의 위험도를 비교하기 위해 이용된다. 예를 들면, 상대적 위험도는 특정한 유전형을 갖는 사람들의 그룹과 다른 유전형을 갖는 또 다른 그룹을 비교하기 위해 이용될 수 있다. 질병에 대해, 2의 상대적 위험도는 하나의 그룹이 나머지 그룹보다 질병을 발병할 가능성이 두배 높다는 것을 의미한다. 제시되는 위험도는 일반적으로 일치된 성별 및 민족의 집단 대비, 1인, 또는 1인의 특정한 유전형에 대한 상대적 위험도이다. 동일한 성별 및 민족의 2인의 위험도는 단순한 방식으로 비교될 수 있다. 예를 들면, 집단 대비, 제1 개체는 1.5의 상대적 위험도를 가지며, 제2 개체는 0.5의 상대적 위험도를 갖는 경우, 제2 개체 대비 제1 개체의 위험도는 1.5/0.5 = 3이다.

위험도 계산

전체 유전적 위험도(overall genetic risk)를 계산하기 위한 모델의 형성은 두 단계를 포함한다: i) 단일 유전적 변이에 대한 오즈비의 상대적 위험도로의 전환 및 ii) 상이한 유전자 좌(genetic loci)의 복수의 변이로부터의 위험도의 단일 상대적 위험도 값으로의 조합.

오즈비로부터 위험도의 유도

현재까지 권위있는 저널에 발표된 복합 질환에 대한 대부분의 유전자 발견은 그들의 소급적 설정(retrospective setup) 때문에 케이스-대조군 설계를 이용했다. 이 연구들은 선택된 세트의 케이스(특정된 질병 상태를 갖는 사람들) 및 대조군 개인들을 표본 추출하고 유전형을 분석한다. 관심은 케이스와 대조군에서의 빈도가 유의성있게 상이한 유전적 변이(대립인자)에 있다.

결과는 통상적으로 오즈비, 즉, 환자군 대 대조군에서 위험 변이(보인자)를 갖는 비율(확률) 대 비-위험 변이(비-보인자) 비율 간의 비로 보고되고, 즉, 질병 상태 조건부 확률(probability conditional on the affected status)로 표현된다:

OR = (Pr(c|A)/Pr(nc|A)) / (Pr(c|C)/Pr(nc|C))

그러나, 때때로, 본 발명자들이 관심을 갖는 것은 질환에 대한 절대 위험도(absolute risk), 즉, 위험 변이를 갖는, 해당 질환을 가진 개인들의 비율 또는 다시 말하면, 그 질환을 가질 확률이다. 부분적으로 케이스 대 대조군의 비가 통상적으로 일반 집단에서의 비와 동일하지 않기 때문에 이 수치는 케이스-대조군 연구에서 직접적으로 측정될 수 없다. 그러나, 특정한 가정 하에, 본 발명자들은 오즈비로부터 위험도를 추정할 수 있다.

희귀 질환 가정(rare disease assumption) 하에서, 질병의 상대적 위험도는 오즈비에 의해 근사될 수 있다는 것이 잘 알려져 있다. 그러나, 이 가정은 다수의 일반적 질환에는 적용될 수 없다. 또한, 또 다른 유전형 변이 대비 하나의 유전형 변이는 앞서 표현된 오즈비로부터 추정될 수 있는 것으로 입증된다. 계산은 대조군이 엄격하게 무질환 상태(unaffected) 개인들이기 보다는 질환 상태 사람들을 포함한, 케이스와 동일한 집단으로부터의 랜덤 표본인 것인 랜덤 집단 대조군(random population control)의 가정 하에 특히 간단하다. 표본 크기 및 검정력(power)을 증가시키기 위해, 다수의 대규모 게놈-전체 연관 및 재현 연구는 케이스와 연령-일치되지(age-matched) 않고, 또한 연구 당시에 대조군이 해당 질병을 갖지 않는다는 것을 보장하기 위해 세심하게 검토되지 않은 대조군을 이용한다. 따라서, 정확하지 않으나, 그들은 종종 일반 집단으로부터 랜덤 표본을 근사한다. 이 가정이 정확하게 만족스러울 것으로 거의 기대되지 않으나, 위험도 추정값은 통상적으로 이 가정으로부터 고도 내지 중등도의 변경(robust to moderate deviation)이라는 것이 주목된다.

계산은 본 발명자들이 위험 변이 보인자, "c" 및 비-보인자, "nc"를 갖는 것인, 우성(dominant model) 및 열성(recessive) 모델의 경우, 개인의 오즈비는 이 변이들 간의 위험도 비와 동일하다는 것을 보여준다:

OR = Pr(A|c)/Pr(A|nc) = r

위험도가 두 개의 대립인자 카피와 연관된 위험도의 곱인 것인 승법 모델에서와 마찬가지로, 대립인자 오즈비는 위험 인자(risk factor)와 일치한다:

OR = Pr(A|aa)/Pr(A|ab) = Pr(A|ab)/Pr(A|bb) = r

식 중에서, "a"는 위험 대립인자를 나타내고, "b"는 비-위험 대립인자(non-risk allele)를 나타낸다. 따라서, 인자 "r"은 대립인자 종류 간의 상대적 위험도이다.

복합 질환과 연관된 공통 변이(common variant)를 보고하는, 지난 수년간 발표된 다수의 연구의 경우, 승법 모델이 그 효과를 적절하게 요약하고 가장 자주 우성 및 열성 모델과 같은 대안적 모델보다 탁월한, 데이터로의 맞춤(fit)을 제공하는 것으로 확인되었다.

평균 집단 위험도 대비 위험도

평균 집단 대비 유전적 변이의 위험도를 표현하는 것이 가장 편리하며, 이는 기준(baseline) 집단 위험도 대비 질병을 발병할 생애 위험도(lifetime risk)를 소통시키는 것을 보다 용이하게 하기 때문이다. 예를 들면, 승법 모델에서, 본 발명자들은 변이 "a"에 대해 상대적 집단 위험도를 하기와 같이 계산할 수 있다:

RR(aa) = Pr(A|aa)/Pr(A) = (Pr(A|aa)/Pr(A|bb))/(Pr(A)/Pr(A|bb)) =

r²/(Pr(aa) r² + Pr(ab)r + Pr(bb)) = r²/(p² r² + 2pqr + q²) = r²/R

이때, "p" 및 "q"는 각각 "a" 및 "b"의 대립인자 빈도이다. 마찬가지로, 본 발명자들은 RR(ab) = r/R 및 RR(bb) = 1/R을 얻는다. 대립인자 빈도 추정값은 오즈비를 보고하는 공개 문헌 및 HapMap 데이터베이스로부터 얻을 수 있다. 본 발명자들이 개인의 유전자형을 알 수 없는 경우, 테스트 또는 마커에 대한 상대적 유전적 위험도는 간단하게 1이다.

예로서, 타입-2 당뇨병 위험도에서, 염색체 10 상의 TCF7L2 유전자 중의 질병 연관 마커 rs7903146의 대립인자 T는 비-히스패닉(non-Hispanic) 백인 집단에서 1.37의 대립인자 OR 및 약 0.28의 빈도(p)를 갖는다. 유전형 CC 대비 유전형 상대적 위험도는 승법 모델에 근거하여 추정된다.

TT의 경우, 상대적 위험도는 1.37 ± 0.37 = 1.88이고; CT의 경우, 단순히 OR 1.37이며, CC의 경우 정의에 의해 1.0이다.

대리인자 C의 빈도는 q = 1 - p = 1 - 0.28 = 0.72이다. 이 마커에서 3개의 가능한 유전형 각각의 집단 빈도는 하기와 같다:

Pr(TT) = p² = 0.08, Pr(CT) = 2pq = 0.40, 및 Pr(CC) = q² = 0.52

유전형 CC(1의 위험도를 갖는 것으로 정의됨) 대비 평균 집단 위험도는 하기와 같다 :

R = 0.08x1.88 + 0.40x1.37 + 0.52x1 = 1.22

따라서, 이 마커에서 하기 유전형 중 하나를 갖는 개체에 대한 전체 집단 대비 상대적 위험도(RR)는 하기와 같다 :

RR(TT) = 1.88/1.22 = 1.54, RR(CT) = 1.37/1.22 = 1.12, RR(CC) = 1/1.22 = 0.82.

복수의 마커로부터의 위험도의 통합:

다수의 SNP 변이의 유전형이 개인에 대해 위험도를 추정하기 위해 이용되는 경우, 위험도에 대한 승법 모델이 일반적으로 가정될 수 있다. 이는 집단 대비 통합된 유전적 위험도는 개별적인 마커, 예를 들면, 두 개의 마커, g1 및 g2에 대한 상응하는 추정값의 곱으로 계산된다:

RR(g1,g2) = RR(g1)RR(g2)

근본적인 가정은 위험 인자가 독립적으로 일어나고 행동한다는 것, 즉, 결합 조건적 확률(joint conditional probability)이 곱으로 표현될 수 있다는 것이다.

Pr(A|g1,g2) = Pr(A|g1)Pr(A|g2)/Pr(A) 및 Pr(g1,g2) = Pr(g1)Pr(g2)

이 가정에 대한 명백한 위배는 두 개 이상의 위험 대립인자의 동시 발생이 상관되도록 게놈에서 근접하게 배치된 마커들이고, 즉, 연관 불균형인 마커들이다. 그와 같은 경우에, 본 발명자들은 상관된 SNP의 모든 대립인자 조합에 대해 오즈비가 정의된 것인 소위 일배체형 모델링을 이용할 수 있다.

통계적 모델이 이용되는 것인 대부분의 경우에서와 같이, 적용된 모델은 근본적인 생물-물리학적 모델(bio-physical model)에 기반하지 않기 때문에 정확하게 일치할 것으로 기대되지 않는다. 그러나, 승법 모델은 현재까지 데이터에 적합하게 맞는 것으로 확인되었고, 즉, 다수의 위험 변이들이 발견된 다수의 일반적 질환에 대해 유의성 있는 편차가 검출되지 않는다.

예로서, 각 마커에 대해 집단 대비 위험도와 함께 타입-2 당뇨병과 연관된 4개의 마커들에서 하기의 유전형을 갖는 개인을 고려한다:

염색체 3	PPARG	CC	계산된 위험도: RR(CC) = 1.03
염색체 6	CDKAL1	GG	계산된 위험도: RR(GG) = 1.30
염색체 9	CDKN2A	AG	계산된 위험도: RR(AG) = 0.88
염색체 11	TCF7L2	TT	계산된 위험도: RR(TT) = 1.54

통합하면, 이 개인에 대한 집단 대비 전체 위험도는 1.03 x 1.30 x 0.88 x 1.54 = 1.81이다.

조정된 생애 위험도(Adjusted life-time risk)

개인의 생애 위험도는 집단 대비 전체 유전적 위험도에 해당 개인의 지리적 기원의 지역에서 동일한 민족 및 성별의 전체 집단에서의 질병의 평균 생애 위험도를 곱하는 것에 의해 도출될 수 있다. 통상적으로 전체 집단 위험도의 정의시 선택할 수 있는 여러 역학 연구가 있기 때문에, 본 발명자들은 유전적 변이를 위해 이용되었던 질병 정의를 위해 검정력이 우수한(well-powered) 연구를 선택할 것이다.

예를 들면, 타입-2 당뇨병의 경우, 집단 대비 전체 유전적 위험도가 백인 남성에 대해 1.8인 경우, 및 그의 인구통계적 특성의 개인의 타입-2 당뇨병의 평균 생애 위험도가 20%인 경우, 그에 대한 조정된 생애 위험도는 20% x 1.8 = 36%이다.

집단에 대한 평균 RR이 1이기 때문에, 이 승법 모델은 질병의 동일한 평균 조정된 생애 위험도를 제공한다. 또한, 실제의 생애 위험도는 100%를 초과할 수 없기 때문에, 유전적 RR에 대한 상한이 있어야 한다.

갑상선암에 대한 위험도 평가

본 명세서에 기재된 바와 같이, 특정한 다형성 마커 및 그와 같은 마커를 포함하는 일배체형이 갑상선암의 위험도 평가를 위해 유용한 것으로 확인되었다. 위험도 평가는 갑상선암에 대한 감수성을 진단하기 위한 마커의 이용을 포함할 수 있다. 다형성 마커의 특정한 대립인자는 갑상선암의 진단을 갖지 않는 개체들에서보다, 갑상선암의 진단을 갖는 개체들에서 보다 빈번하게 발견된다. 그러므로, 이 마커 대립인자들은 개체에서 갑상선암, 또는 갑상선암에 대한 감수성을 검출하기 위한 예측적 가치(predictive value)를 갖는다. 본 명세서에 기재된 위험 변이(또는 예측적 변이)와 연관 불균형인 태깅 마커가 이 마커들 (및/또는 일배체형)에 대한 대리물(surrogate)로 이용될 수 있다. 그와 같은 대리 마커들은 특정한 일배체형 블럭 또는 LD 블럭 내에 위치할 수 있다. 그와 같은 대리 마커들은 또한 때때로 그와 같은 일배체형 블럭 또는 LD 블럭의 물리적 경계 외부에, LD 블럭/일배체형 블럭의 인근에 위치할 수 있으나, 가능하게는 또한 보다 먼 게놈 위치에 위치할 수 있다.

특정한 게놈 영역(예를 들면, 유전자)이 기능적 관계에 있는 경우, 장거리 LD가 예를 들면, 일어날 수 있다. 예를 들면, 두 개의 유전자가 공유된 대사 경로에서 역할을 수행하는 단백질을 코딩하는 경우, 하나의 유전자 중의 특정한 변이가 나머지 유전자에 대한 관찰된 변이에 대해 직접적 효과를 가질 수 있다. 하나의 유전자 중 변이가 유전자 산물의 증가된 발현을 초래하는 경우를 고려한다. 이 효과를 길항시키고, 특정한 경로의 전체 흐름(flux)을 보존하기 위해, 이 변이는 상기 유전자의 감소된 발현 수준을 부여하는 제2 유전자에서 하나(또는 그 이상)의 변이의 선택을 초래할 수 있었을 것이다. 이 두 유전자들은 상이한 게놈 위치, 가능하게는 상이한 유전자 상에 위치할 수 있으나, 상기 유전자 내의 변이들은 높은 LD의 영역 내의 공유된 물리적 위치 때문이 아니라, 진화력(evolutionary force) 때문에, 상이한 게놈 위치 내에, 가능하게는 상이한 염색체 상에 위치할 수 있다. 그와 같은 LD도 고려되고 본 발명의 범위 내에 속한다. 당업자는 기능성 유전자-유전자 상호작용의 다수의 다른 시나리오가 가능하고, 본 명세서에서 검토된 특정한 예는 단지 하나의 그와 같은 가능한 시나리오를 대표하는 것이라는 것을 이해할 것이다.

1의 r² 값을 갖는 마커들이 위험 변이(at-risk variant)(anchor variant)에 대한 완벽한 대리물이고, 즉, 하나의 마커에 대한 유전형이 다른 마커에 대한 유전형을 완벽하게 예측한다. 1보다 작은 r² 값을 갖는 마커들도 위험 변이의 대리물일 수 있거나, 또는 대안적으로 그 위험 변이만큼 높거나 또는 그 변이보다 훨씬 더 높은 상대적 위험도 값을 갖는 변이를 나타낸다. 확인된 위험 변이는 그 자체로 기능적 변이가 아닐 수 있으나, 이 경우, 진정한 기능적 변이와 연관 불균형 관계일 수 있다. 기능적 변이는 예를 들면, 미니새틀라이트(minisatellite), 또는 마이크로새틀라이트(microsatellite)와 같은 연쇄 반복(tandem repeat), 전위 요소(transposable element)(예를 들면, Alu 요소), 또는 결실, 삽입 또는 역전(때때로 카피수 변위(copy number variation), 또는 CNV로도 지칭됨)과 같은 구조적 변형일 수 있다. 본 발명은 본 명세서에 개시된 마커에 대한 그와 같은 대리 마커(surrogate marker)의 평가를 포함한다. 그와 같은 마커들이 본 발명이 속하는 기술 분야의 당업자에게 잘 알려진 바와 같이, 공개 데이터베이스에 설명(annotate)되고, 맵핑되고, 열거되어 있거나, 또는 대안적으로 개체들의 군에서 본 발명의 마커에 의해 확인된 영역 또는 그 영역의 일부를 서열결정하고, 결과적으로 수득된 서열의 군에서 다형성을 식별하는 것에 의해 용이하게 식별될 수 있다. 그 결과, 본 발명이 속하는 기술 분야의 당업자는 용이하게, 과도한 실험 없이 본 명세서에 기재된 마커 및/또는 일배체형과 연관 불균형인 대리 마커들을 확인하고 그의 유전형을 분석할 수 있다. 검출된 위험 변이와 LD인 태깅 마커 또는 대리 마커도 개체에서, 질병과의 연관, 또는 질병에 대한 감수성을 검출하기 위해 이용된다. 본 발명의 마커와 LD인 이 태깅(tagging) 마커 또는 대리(surrogate) 마커도 일체형들을 구별하는 다른 마커를 포함할 수 있고, 이들은 마찬가지로 특정한 질환에 대한 예측적 가치를 갖는다.

특정 구체예에서, 본 발명은 갑상선암과 연관된 것으로 본 명세서에 기재된 특정 변이의 존재에 대해 개인으로부터 유래된 게놈 DNA를 포함하는 시료를 평가하는 것에 의해 실시될 수 있다. 그와 같은 평가는 당업자에게 잘 알려지고 본 명세서에서 더 설명될 방법을 이용하여, 하나 이상의 다형성 마커의 하나 이상의 대립인자의 존재 또는 부재를 검출하는 단계를 포함하고, 그와 같은 평가의 결과에 근거하여 시료가 유래된 개인이 갑상선암의 증가된 위험도 또는 감소된 위험도(증가된 감수성 또는 감소된 감수성)를 갖는지 여부를 결정한다. 특정한 구체예에서, 다형성 마커의 특정한 대립인자의 검출이 하나 이상의 다형성 마커의 하나 이상의 대립인자를 식별하는, 특정한 개인에 대한 핵산 서열 데이터를 수득하는 것에 의해 수행될 수 있다. 상기 하나 이상의 마커의 상이한 대립인자들이 인간에서 갑상선암에 대한 상이한 감수성과 연관된다. 핵산 서열 데이터의 수득은 SNP에서 대립인자를 식별하기에 충분한, 단일 뉴클레오티드 위치의 핵산 서열을 포함할 수 있다. 핵산 서열 데이터는 또한 다른 갯수의 뉴클레오티드 위치의 서열을 포함할 수 있고, 특히, 다중 뉴클레오티드 위치를 포함하는 유전적 마커에 대한 서열을 포함할 수 있고, 2개 내지 수십만개, 심지어 수백만개의 뉴클레오티드일 수 있다(특히, 카피 수 변이(copy number variation, CNV)의 경우).

특정한 구체예에서, 본 발명은 질병과 연관된 하나 이상의 다형성 마커(또는 상기 질병와 연관된 하나 이상의 마커와 연관 불균형인 마커)의 유전형 상태에 관한 정보를 포함하는 데이터세트를 이용하여 실시될 수 있다. 바꾸어 말하면, 그와 같은 유전적 상태, 예를 들면, 특정한 다형성 마커, 또는 복수 개의 마커에서의 서열 데이터, 유전형 계수(genotype count)(예를 들면, 특정한 위험 대립인자의 존재 또는 부재에 대한 표시), 또는 하나 이상의 마커의 실제 유전형의 형태로 그와 같은 유전적 상태에 관한 정보를 포함하는 데이터세트가 본 발명자들에 의해 상기 질병과 연관된 것으로 입증된 특정한 위험 대립인자의 존재 또는 부재에 대해 검색될 수 있다. 상기 질병과 연관된 변이(예를 들면, 마커 대립인자)에 대한 양성 결과는 데이터세트가 유래된 개체가 상기 질병의 증가된 감수성(증가된 위험도)을 갖는다는 것을 나타낸다.

본 발명의 특정한 구체예에서, 다형성 마커는 다형성의 하나 이상의 대립인자와 갑상선암 간의 상관관계를 포함하는 참조표(look-up table)에 상기 다형성 마커에 대한 유전형을 조회하는 것에 의해, 질병과 상관된다. 일부 구체예에서, 상기 표는 하나의 다형성에 대한 상관관계를 포함한다. 다른 구체예에서, 상기 표는 복수의 다형성에 대한 상관관계를 포함한다. 두 시나리오에서, 마커와 질병 간의 상관관계를 제공하는 참조 표를 조회하는 것에 의해, 질병에 대한 위험도, 또는 질병에 대한 감수성이 시료가 유래된 개인에서 확인될 수 있다. 일부 구체예에서, 상관관계가 통계적 척도로서 보고된다. 통계적 척도는 상대적 위험도(RR), 절대적 위험도(absolute risk, AR), 또는 오즈비(OR)과 같은 위험 척도로 보고될 수 있다.

본 명세서에 기재된 마커들, 예를 들면, rs965513 (서열번호 1)과 같은, 표 2에 제시된 마커들은 단독으로 또는 조합되어, 위험도 평가 및 진단 목적을 위해 유용할 수 있다. 본 명세서에 기재된 마커에 근거한 갑상선암 위험도의 결과는 전체 위험도를 수립하기 위해, 갑상선암에 대한 다른 유전적 마커 또는 위험 인자들을 위한 데이터와 조합될 수 있다. 따라서, 개별적인 마커에 의한 위험도의 증가가 비교적 크지 않은 경우, 예를 들면, 10 내지 30% 수준인 경우, 연관은 상당한 영향을 가질 수 있다. 따라서, 비교적 흔한 변이가 전체 위험도에 상당한 기여를 가질 수 있거나(집단 귀속 위험도(population attributable risk)가 높음), 또는 마커들의 조합이 마커들의 통합 위험도(combined risk)에 기반하여, 상기 질병을 발병할 유의성 있는 통합 위험도를 갖는 개인들의 군을 정의하기 위해 이용될 수 있다.

따라서, 본 발명의 일부 구체예에서, 복수의 변이(유전적 마커, 바이오마커 및/또는 일배체형)가 전체 위험도 평가를 위해 이용된다. 일 구체예에서, 이 변이들은 본 명세서에 개시된 변이들로부터 선택된다. 기타 구체예는 갑상선암에 대한 감수성을 진단하기 위해 유용한 것으로 알려진 다른 변이와 조합된 본 발명의 변이의 이용을 포함한다. 그와 같은 구체예에서, 복수의 마커 및/또는 일배체형의 유전형 상태는 개인에서 결정되고, 개인의 상태가 연관된 변이의 집단 빈도, 또는 임상적으로 건강한 개체, 예를 들면, 연령-일치된(age-matched) 개체 및 성별-일치된 개체에서의 변이의 빈도와 비교된다. 뒤이어, 다변량 분석 또는 결합 위험도 분석(joint risk analysis)과 같은 당해 기술 분야에서 공지된 방법, 또는 당업자에게 공지된 기타 방법이 복수 개의 유전자좌에서의 유전형 상태에 근거하여 부여된 전체 위험도를 결정하기 위해 이용될 수 있다. 그와 같은 분석에 근거한 위험도의 평가가 이후에 본 명세서에 기재된, 본 발명의 방법, 용도 및 키트에서 이용될 수 있다.

갑상선암에 대한 위험 변이에 대해 동형접합인 개인은 갑상선암 발병의 특히 높은 위험도를 갖는다. 이는 위험 대립인자의 용량-의존적 효과에서 기인되며, 동형접합 보인자에 대한 위험도는 일반적으로 각 대립인자 카피에 대한 위험도의 제곱으로 추정된다. 하나의 그와 같은 구체예에서, 마커 rs965513의 대립인자 A에 대해 동형접합인 개인은 일반 집단 및/또는 rs965513-A 위험 대립인자의 비-보인자에 비해 갑상선암 발병의 특히 높은 위험도를 갖는다.

전술된 바와 같이, 인간 게놈의 일배체형 블럭 구조는 질병 또는 성향(trait)가 원래 연관된 변이와 연관 불균형인 다수의 변이(마커 및/또는 일배체형)이 상기 질병 또는 성향과의 연관을 평가하기 위한 대리 마커로 이용될 수 있게 하는 효과를 갖는다. 그와 같은 대리 마커의 갯수는 해당 영역에서의 과거 재조합률(historical recombination rate), 해당 영역에서의 돌연변이 빈도(즉, 해당 영역 중 다형성 부위 또는 마커의 갯수), 및 해당 영역에서 LD의 정도(즉, LD 블럭의 크기)와 같은 인자에 의존적일 것이다. 이 마커들은 통상적으로 본 명세서에 기재된 방법, 또는 당해 기술 분야에서 당업자에게 알려진 기타 방법을 이용하여 정의된 LD 블럭 또는 일배체형 블럭의 물리적 경계 내에 위치한다. 그러나, 때때로 마커 및 일배체형 연관은 앞서 검토된 바와 같이, 정의된 일배체형 블럭의 물리적 경계 외부까지 확장되는 것으로 발견된다. 그와 같은 마커 및/또는 일배체형은 그 경우에 또한 정의된 일배체형 블럭 내에 물리적으로 존재하는 마커 및/또는 일배체형에 대한 대리 마커 및/또는 일배체형으로 이용될 수 있다. 그 결과, 본 발명의 마커 및 일배체형과 LD(통상적으로 0.4보다 큰 r²의 값에 의해 상관관계를 갖는 마커들을 포함한, 0.3보다 큰 r²을 포함한, 0.2보다 큰 r²과 같은 0.1보다 큰 마커간(inter-marker) r²값을 특징으로 함)인 마커 및 일배체형은 정의된 일배체형 블럭의 경계 외부에 물리적으로 존재하더라도, 본 발명의 범위 내에 속한다. 이는 본 명세서에 기재된 마커들(예를 들면, rs965513)을 포함하나, 또한, rs965513과 강한 LD(예를 들면, 0.1 또는 0.2보다 더 큰 r² 및/또는 |D'|> 0.8을 특징으로 함)인 다른 마커들(예를 들면, 표 2에 표시된 마커들)을 포함할 수 있다.

본 명세서에 기재된 SNP 마커에 대해, 환자에서 과량으로 존재하는 것으로 발견된 대립인자(위험 대립인자)에 대한 반대 대립인자가 갑상선암에서 감소된 빈도로 발견된다. 따라서, 이 마커들 및 이들과 LD이고 및/또는 이들을 포함하는 일배체형은 갑상선암에 대해 보호성이고, 즉, 그들은 이 마커들 및/또는 일배체형을 갖는 개인들에게 갑상선암 발병의 감소된 위험도 또는 감수성을 부여한다.

특정한 일배체형을 포함한, 본 발명의 특정한 변이는 일부 경우에, 다양한 유전적 마커들, 예를 들면, SNP 및 마이크로새틀라이트의 조합을 포함한다. 일배체형의 검출은 다형성 부위에서 서열을 검출하기 위한, 당해 기술분야에서 공지되고 및/또는 본 명세서에 기재된 방법에 의해 달성될 수 있다. 또한, 특정한 일배체형 또는 마커들의 세트와 질병 표현형 간의 상관관계가 표준 기법을 이용하여 확인될 수 있다. 상관관계의 간단한 검정의 대표적 예가 2x2 표에서의 Fisher-exact 검정이다.

특정한 구체예에서, 갑상선암과 연관된 것으로 확인된 마커 대립인자 또는 일배체형(예를 들면, 표 1에 열거된 마커 대립인자)은 건강한 개인(대조군), 또는 집단으로부터 무작위로 선택된 개인에서의 존재 빈도 대비, 갑상선암에 대한 위험도를 갖는 개인(질병군)에 보다 빈번하게 존재하며, 상기 마커 대립인자 또는 일배체형의 존재는 갑상선암에 대한 감수성을 나타낸다. 다른 구체예에서, 갑상선암과 연관된 것으로 본 명세서에서 확인된 하나 이상의 마커들(예를 들면, 표 1에 열거된 마커 대립인자)과 연관 불균형인 위험 마커들은 건강한 개인(대조군), 또는 집단으로부터 무작위로 선택된 개인에서의 존재 빈도 대비, 갑상선암에 대한 위험도를 갖는 개인(질병군)에 보다 빈번하게 존재하는 태깅 마커이고, 상기 태깅 마커의 존재는 갑상선암에 대한 증가된 감수성을 나타낸다. 또 다른 구체예에서, 갑상선암과 연관된 것으로 발견된 하나 이상의 마커와 연관 불균형인 위험 마커 대립인자(즉, 증가된 감수성을 부여하는 마커 대립인자)는 건강한 개인(대조군)에서의 그들의 존재 빈도에 비해, 갑상선암에 대한 위험도를 갖는 개인에서 보다 빈번하게 존재하는 하나 이상의 대립인자를 포함하는 마커이고, 상기 마커의 존재는 갑상선암에 대한 증가된 감수성을 나타낸다.

연구 집단

일반적으로, 본 명세서에 기재된 방법 및 키트는 임의의 원천(source) 및 임의의 개체으로부터의 핵산 물질(DNA 또는 RNA)를 포함하는 시료, 및 개인 또는 그와 같은 시료로부터 유래된 유전형 또는 서열 데이터로부터 이용될 수 있다. 바람직한 구체예에서, 개체는 인간이다. 개인은 성인, 아동, 또는 태아일 수 있다. 핵산 출처는 생물학적 시료을 포함한, 핵산 물질을 포함하는 시료, 또는 그로부터 유래된 핵산 물질을 포함하는 시료일 수 있다. 본 발명은 또한, 표적 집단의 구성원인 개체에서 마커 및/또는 일배체형을 평가하는 방법을 제공한다. 일 구체예에서, 그와 같은 표적 집단은 다른 유전적 인자, 바이오마커, 생체물리적 인자(예를 들면, 체중, BMD, 혈압), 또는 전반적인 건강 및/또는 생활방식 파라미터(예를 들면, 갑상선암의 병력, 갑상선암의 과거 진단, 암의 가족력, 갑상선암의 가족력)에 기반하여, 질병을 발병할 위험도를 갖는 개체들의 집단 또는 그룹이다. 특정한 구체예에서, 표적 집단은 진단 또는 치료 의학, 핵 폭발로부터의 방사성 분진, 핵 발전소 또는 기타 방사성 활성의 출처에 의한 방사성 노출과 같은 공지된 방사선 노출을 갖는 집단 또는 그룹이다.

본 발명은 40세 이상, 45세 이상, 또는 50세 이상, 55세 이상, 60세 이상, 65세 이상, 70세 이상, 75세 이상, 80세 이상, 또는 85세 이상의 개인과 같은, 특정한 연령 서브그룹으로부터의 개인을 포함하는 구체예를 제공한다. 본 발명의 다른 구체예는 80세 미만, 75세 미만, 또는 70세 미만, 65세 미만, 60세 미만, 55세 미만, 50세 미만, 45세 미만, 40세 미만, 35세 미만, 또는 30세 미만과 같은, 85세 미만의 개인과 같은, 다른 연령군에 관한 것이다. 다른 구체예는 전술된 임의의 연령 범위에 속하는 갑상선암의 발병 연령을 갖는 개인에 관한 것이다. 또한, 특정한 구체예에서, 45세를 초과하나, 60세 미만인 발병 연령과 같은 일정 범위의 연령이 관련된 것일 수 있는 것으로 고려된다. 그러나, 앞서 열거된 연령값에 의해 일괄된 모든 연령 범위를 포함한, 다른 연령 범위도 고려된다. 본 발명은 또한 하나의 성별의 개인, 남성 또는 여성에 관한 것이다.

아이슬란드 집단은 북유럽 선조 기원의 코카서스인 집단이다. 아이슬란드 집단에서 유전적 연관(genetic linkage)과 관련성(association)의 결과를 보고하는 다수의 연구가 최근 수년간 발표되었다. 그와 같은 다수의 연구들은 다른 집단에서, 최초에 아이슬란드 집단에서 특정 질환과 연관된 것으로 확인된 변이의 재현을 보여준다(Sulem, P., et al., Nat Genet May 17 2009 (Epub ahead of print); Rafnar, T., et al. Nat Genet 41:221-7 (2009); Gretarsdottir, S., et al. Ann Neurol 64:402-9 (2008); Stacey, S.N., et al. Nat Genet 40:1313-18 (2008); Gudbjartsson, D.F., et al. Nat Genet 40:886-91 (2008); Styrkarsdottir, U., et al. N Engl J Med 358:2355-65 (2008); Thorgeirsson, T., et al. Nature 452:638-42 (2008); Gudmundsson, J., et al. Nat Genet. 40:281-3 (2008); Stacey, S.N., et al., Nat Genet. 39:865-69 (2007); Helgadottir, A., et al., Science 316:1491-93 (2007); Steinthorsdottir, V., et al., Nat Genet. 39:770-75 (2007); Gudmundsson, J., et al., Nat Genet. 39:631-37 (2007); Frayling, TM, Nature Reviews Genet 8:657-662 (2007); Amundadottir, L.T., et al., Nat Genet. 38:652-58 (2006); Grant, S.F., et al., Nat Genet. 38:320-23 (2006)). 따라서, 아이슬란드 집단에서의 유전적 발견이 일반적으로 아프리카 및 아시아로부터의 집단을 포함한, 다른 집단에서 재현되었다.

갑상선암과 연관된 것으로 확인된 본 발명의 마커들은 다른 인간 집단에서 유사한 연관성을 보이는 것으로 사료된다. 따라서, 개별적인 인간 집단을 포함하는 특정한 구체예가 또한 고려되며 본 발명의 범위 내에 속한다. 그와 같은 구체예는 코카서스 집단, 유럽 집단, 미국 집단, 유라시아 집단, 아시아 집단, 중앙/남아시아 집단, 동아시아 집단, 중동 집단, 아프리카 집단, 라틴 아메리카 집단, 및 오세아니아 집단을 포함하나, 이에 한정되지 않는 하나 이상의 인간 집단으로부터의 인간 개체에 관한 것이다. 유럽 집단은 스웨덴 집단, 노르웨이 집단, 핀란드 집단, 러시아 집단, 덴마크 집단, 아이슬란드 집단, 아일랜드 집단, 켈트(Kelt) 집단, 영국 집단, 스코틀랜드 집단, 네덜란드 집단, 벨기에 집단, 프랑스 집단, 독일 집단, 스페인 집단, 포르투갈 집단, 이탈리아 집단, 폴란드 집단, 불가리아 집단, 슬라브 집단, 세르비아 집단, 보스니아 집단, 체코 집단, 그리스 집단, 및 터키 집단을 포함하나, 이에 한정되지 않는다. 다른 구체예에서, 본 발명은 또한 반투(Bantu), 만덴크(Mandenk), 요루바(Yoruba), 산(San), 음부티 피그미(Mbuti Pygmy), 오르카디안(Orcadian), 아디겔(Adygel), 러시안(Russian), 사르디니안(Sardinian), 투스칸(Tuscan), 모자비트(Mozabite), 베두인(Bedouin), 드루즈(Druze), 팔레스티니안(Palestinian), 발로치(Balochi), 브라휘(Brahui), 마크라니(Makrani), 신디(Sindhi), 파탄(Pathan), 부루쇼(Burusho), 하자라(Hazara), 위구르(Uygur), 칼라쉬(Kalash), 한(Han), 다이(Dai), 다우르(Daur), 헤젠(Hezhen), 라후(Lahu), 미아오(Miao), 오로켄(Oroqen), 쉬(She), 투지아(Tujia), 투(Tu), 시보(Xibo), 이(Yi), 몽골란(Mongolan), 낙시(Naxi), 캄보디안(Cambodian), 일본인( Japanese), 야쿠트(Yakut), 멜라네시안(Melanesian), 파푸안(Papuan), 카리티아난(Karitianan), 수루이(Surui), 콜럼비안(Columbian), 마야(Maya) 및 피마(Pima)를 포함하나, 이에 한정되지 않는 특정한 인간 집단에서 실시될 수 있다.

특정한 구체예에서, 본 발명은 아프리카 후손 또는 계통의 사람을 포함하는 집단과 같은 블랙 아프리카 선조(ancestry)를 포함하는 집단에 관한 것이다. 블랙 아프리가 선조는 흑인(black race)에 속하거나 또는 니그로 인종(negro race)에 속하는, 아프리카계 미국인(African-American), 아프로-아메리칸(Afro-American), 블랙 아메리칸(Black American)으로 자가-보고하는 것에 의해 결정될 수 있다. 예를 들면, 아프리카계 미국인 또는 블랙 아메리칸은 북미에 거주하고 아프리카의 흑인군에 속하는 기원을 갖는 사람들이다. 또 다른 예에서, 블랙 아프리카 선조의 자가-보고된 사람은 한 명 이상의 블랙 아프리카 선조의 부모 또는 한 명 이상의 블랙 아프리카 선조의 조부모를 가질 수 있다. 또 다른 구체예에서, 본 발명은 코카서스 기원의 개인들에 관한 것이다.

개체에서 인종적 기여는 또한 유전적 분석에 의해 결정될 수 있다. 선조의 유전적 분석은 Smith et al. (Am J Hum Genet 74, 1001-13 (2004))에 개시된 마커와 같은, 연관되지 않은(unlinked) 마이크로새틀라이트 마커를 이용하여 수행될 수 있다.

특정한 구체예에서, 본 발명은 앞서 기재된 바와 같이, 특정한 집단에서 확인된 마커 및/또는 일배체형에 관한 것이다. 본 발명이 속하는 기술 분야의 당업자는 상이한 집단에 적용되는 경우, 연관 불균형(LD)의 척도는 상이한 결과를 가져올 수 있다는 것을 이해할 것이다. 이는 특정한 게놈 영역에서 LD의 차이를 초래했을 수 있는 차등적 선택 압력(differential selective pressure) 및 상이한 인간 집단의 상이한 집단 역사 때문이다. 또한, 일부 마커들, 예를 들면, SNP 마커들이 하나의 집단에서는 다형성이나, 다른 집단에서는 다형성이 아니라는 것이 본 발명이 속하는 기술 분야의 당업자에게 잘 알려져 있다. 그러나, 본 발명이 속하는 기술 분야의 당업자는 입수가능한 방법을 적용하고, 본 명세서에서 고려되는 바와 같이, 임의의 인간 집단에서 본 발명을 실시할 것이다. 이는 특정한 집단 내에서 가장 강력한 연관을 제공하는 마커들을 확인하기 위해, 본 발명의 LD 영역에서 다형성 마커를 평가하는 것을 포함할 수 있다. 따라서, 본 발명의 위험 변이는 다양한 인간 집단에서 상이한 일배체형 배경에 상이한 빈도로 존재할 수 있다. 그러나, 당해 분야에서 알려진 방법 및 본 발명의 마커를 이용하여, 본 발명이 임의의 주어진 인간 집단에서 실시될 수 있다.

갑상선 자극 호르몬

갑상선-자극 호르몬(TSH 또는 티로트로핀(thyrotropin)으로도 알려짐)은 갑상선의 내분비 기능을 조절하는 뇌하수체 전엽의 갑상선 자극세포(thyrotrope)에 의해 합성되고 분비되는 펩티드 호르몬이다. TSH는 갑상선이 호르몬인 T₄(thyroxine)과 T₃(triiodothyronine)를 분비하도록 자극한다. TSH 생성은 시상하부에서 생성되고 상하수체 동맥(superior hypophyseal artery)을 통해 뇌하수체 전엽까지 수송되는 TRH(Thyrotropin Releasing Hormone)에 의해 조절되고, 뇌하수체 전염에서 TRH는 TSH 생성 및 분비를 증가시킨다. 소마토스타틴도 시상하부에 의해 생성되고, TSH의 뇌하수체 생성에 대한 반대 효과를 가져서, 그의 분비를 감소시키거나 또는 억제한다.

혈중 갑상선 호르몬(T₃ 및 T₄)의 수준은 뇌하수체의 TSH 분비에 영향을 미친다; T₃ 및 T₄의 수준이 낮을 때, TSH의 생성은 증가되고, 반대로, T₃ 및 T₄의 수준이 높을 때, TSH 생성은 감소된다. 이 효과는 조절성 네가티브 피드백 루프(regulatory negative feedback loop)를 생성한다.

티록신(Thyroxine), 또는 3,5,3',5'-테트라-요오도티로닌(종종 T₄로 약칭됨)은 갑상선의 여포 세포에 의해 분비되는 주요한 호르몬이다. T₄는 혈액에서 수송되고, 분비된 T₄의 99.95%는 주로, TBG(thyroxine-binding globulin)에 결합된 단백질이고, 보다 낮은 정도로, 트랜스티레틴(transthyretin) 및 혈청 알부민에 결합된 단백질이다. T₄는 체내에서 대사과정의 속도 조절에 관여되고 신체 발달에 영향을 미친다. 티록신의 투여는 성체 마우스의 뇌에서 신경 성장 인자의 농도를 유의성 있게 증가시키는 것으로 확인되었다.

시상하부에서, T₄는 T₃로도 알려진, 트리요오도티로닌으로 전환된다. 갑상선은 T₃보다 더 많은 양의 T₄를 분비하므로, T₄의 혈장 농도는 T₃보다 40-배 더 높다. 순환 T₃의 대부분은 T₄의 탈요오드화(deiodination)에 의해 말초혈액에서 생성되고(85%), 이 과정은 T₄의 외부 고리 상에 있는 5번 탄소로부터 요오드의 제거를 포함한다. 따라서, T₄는 T₃의 프로호르몬(prohormone)으로 작용한다.

유전적 검사의 유용성

본 발명이 속하는 기술 분야의 당업자는 본 명세서에 기재된 변이가 일반적으로 그 자체로 특정한 갑상선암을 발병할 개인의 절대적 확인을 제공하지 않는다는 것을 고려하고 이해할 것이다. 그러나, 본 명세서에 기재된 변이는 본 발명의 위험 또는 보호성 변이를 갖는 개인이 갑상선암을 발병할 증가된 및/또는 감소된 가능성을 나타낸다. 본 발명자들은 본 명세서의 예시(Exemplification)에서 제시된 통계적으로 유의성 있는 결과에 의해 뒷받침되는 바와 같이, 특정한 변이가 갑상선 발병의 증가된 위험도를 부여한다는 것을 발견했다. 이 정보는 조기에 치료를 적용적용할 수 있도록 하기 위해, 예를 들면, 조기 단계에 예방책을 개시하거나, 증상의 진행 및/또는 출현을 모니터링하기 위해 정기적인 건강검진을 수행하거나, 또는 초기 증상을 확인하기 위해 규칙적인 간격으로 검사를 계획하기 위해 이용될 수 있 기 때문에, 하기에서 보다 상세하게 요약되는 바와 같이, 그 자체로 매우 유용하다.

갑상선암을 발병할 위험도를 부여하는 유전적 변이에 대한 지식은 갑상선암을 발병할 증가된 위험도를 갖는 개체(즉, 위험 변이의 보인자)와 갑상선암을 발병할 감소된 위험도를 갖는 개체(즉, 보호성 변이의 보인자)를 구별하기 위해 유전적 테스트를 적용할 기회를 제공한다. 상기 언급된 두 그룹에 속하는 개체들에 대해, 유전적 테스트의 핵심 가치는 조기 단계에 질병, 또는 질병에 대한 소인을 진단하고 가장 적절한 치료를 제공할 수 있도록 하기 위해 임상의에게 질병의 예후/공격성(aggressiveness)에 대한 정보를 제공할 수 있는 가능성이다.

유전적 위험 인자의 존재, 또는 하나 이상의 위험 인자의 보인자일 증가된 위험도에 대한 증거의 인식은 갑상선암에 대한 공지된 환경적 위험 인자들을 피하거나 또는 최소화하는 것에 의해 보다 건강한 생활습관을 실천하기 위한 증가된 동기를 제공할 수 있기 때문에, 갑상선암의 가족력을 갖는 개인들 및 위험 변이의 보인자들은 유전적 검사로부터 잇점을 얻을 수 있다. 갑상선암으로 진단된 환자의 유전적 검사는 갑상선암의 주요 원인에 대한 중요한 정보를 제공할 수 있고, 의사가 각 개인에 대한 최상의 치료 옵션 및 약제를 선택할 수 있도록 기여할 수 있다.

앞서 검토된 바와 같이, 갑상선암에 대한 주요한 공지된 위험 인자는 방사선 노출이다. 미국에서 갑상선암 발생률은 수십년 동안 증가했으며(Davies, L. and Welch, H. G., Jama, 295, 2164 (2006)), 이는 갑상선암의 실제 발생률의 증가가 아니라, 무증상 암(sub-clinical cancer)의 증가된 검출에서 기인될 수 있다 (Davies, L. and Welch, H. G., Jama, 295, 2164 (2006)). 1980년대 초음파촬영술 및 미세침 흡인 생검법(fine-needle aspiration biopsy)의 도입이 소결절의 검출을 개선했고 결절의 세포학적 평가를 보다 일상적인 것이 되게 하였다 (Rojeski, M. T. and Gharib, H., N Engl J Med, 313, 428 (1985), Ross, D. S., J Clin Endocrinol Metab, 91, 4253 (2006)). 이와 같은 증가된 진단 정밀성(diganostic scrutiny)은 잠재적으로 치명적인 갑상선암의 조기 검출을 가능하게 할 수 있다. 그러나, 여러 연구는 갑상선암을 갑상선암으로 진단되지 않은 개인에서 흔한 부검 발견사항(최대 35%)으로 보고한다 (Bondeson, L. and Ljungberg, O., Cancer, 47, 319 (1981), Harach, H. R., et al., Cancer, 56, 531 (1985), Solares, C. A., et al., Am J Otolaryngol, 26, 87 (2005) and Sobrinho-Simoes, M. A., Sambade, M. C., and Goncalves, V., Cancer, 43, 1702 (1979)). 이는 많은 사람들이 그들의 건강에 대한 위협이 거의 또는 전혀 아닌 갑상선암의 무증상 형태를 가지고 살고 있다는 것을 시사한다.

의사들은 갑상선암의 의심을 확인하기 위해, 종괴(lump)의 크기 및 위치를 식별하고, 종괴가 비-암성(양성)인지 암성(악성)인지 여부를 결정하기 위해 여러 검사를 이용한다. 갑상선 자극 호르몬(TSH) 검사와 같은 혈액 검사는 갑상선 기능 을 조사한다.

갑상선 호르몬의 과다(갑상선기능항진증), 또는 결핍(갑상선기능저하증)을 앓는 것으로 의심되는 환자의 혈액에서 TSH 수준이 검사된다. 일반적으로, 성인에서 TSH의 정상 범위는 0.2 내지 10 uIU/mL (mIU/L와 동등함)이다. 치료 중인 환자의 최적 TSH 수준은 0.3 내지 3.0 mIU/L 범위이다. TSH 측정값의 해석은 또한 갑상선 호르몬 (T₃ 및 T₄)의 혈액 수준에 의존적이다. 영국의 국립보건원(National Health Service)은 "정상(normal)" 범위가 0.1 내지 5.0 uIU/mL일 것으로 간주한다.

아동의 TSH 수준은 정상적으로 훨씬 높게 출발한다. 2002년에 미국의 임상생화학회(National Academy of Clinical Biochemistry, NACB)는 정상 출생 영아에서 약 1.3-19 uIU/mL에서 출발되어, 생후 10주에 0.6-10 uIU/mL까지 저하되고, 14개월에 0.4-7.0 uIU/mL까지 저하되며, 소아기 및 사춘기 동안 점진적으로 성인 수준, 0.4-4.0 uIU/mL까지 저하되는, 연령-관련 기준 한계(age-related reference limit)를 권고했다. NACB는 또한 연구가 2 uIU/mL보다 높은 최초 측정된 TSH 수준을 갖는 성인이 , 특히, 갑상선 항체가 상승한 경우, 이후 20년 동안 갑상선기능저하증 발병의 증가된 오즈비를 갖는다는 것을 확인했기 때문에 성인의 정상 (95%) 범위는 0.4-2.5 uIU/mL까지 저하될 것으로 예상된다고 발표했다.

일반적으로, TSH와 T₃ 및 T₄는 모두 특정한 갑상선 기능이상이 원발성 뇌하수체 질환에 의해, 또는 원발성 갑상선 질환에 의해 유발되는지를 확인하기 위해 측정되어야 한다. TSH와 T₃ 및 T₄가 모두 증가(감소)된 경우, 문제는 주로 뇌하수체에 있다. 하나의 성분(TSH)이 증가되고, 나머지(T₃ 및 T₄)는 감소된 경우, 질환은 아마도 갑상선 자체에 있다. 동일한 논리가 낮은 TSH, 높은 T₃ 및 T₄ 발견에 적용된다.

갑상선암의 근본적인 유전적 위험 인자의 지식이 갑상선암의 스크리닝 프로그램의 적용에서 이용될 수 있다. 따라서, 갑상선암의 위험 변이의 보인자는 비-보인자보다 보다 빈번한 스크리닝으로부터 잇점을 얻을 수 있다. 위험 변이의 동형접합 보인자가 특히 갑상선암을 발병할 위험을 갖는다.

특정한 유전적 프로파일 하에서, 예를 들면, 본 명세서에 기재된 갑상선암에 대한 특정한 위험 대립인자(예를 들면, rs965513-A)의 존재시 TSH, T₃ 및 T₄ 수준을 결정하는 것이 유용할 수 있다. TSH, T₃ 및 T₄는 갑상선 기능의 척도이므로, 진단 및 예방 스크리니링 프로그램은 그와 같은 임상적 측정을 포함하는 분석으로부터 잇점을 얻을 것이다. 예를 들면, rs965513-A의 1개 이상의 카피의 존재의 결정과 함께 TSH의 비정상(증가된 또는 감소된) 수준은 개인이 갑상선암을 발병할 위험이 있다는 것을 나타낸다. 일 구체예에서, rs965513-A의 존재시 개인에서 TSH의 감소된 수준의 결정은 개인에서 갑상선암의 증가된 위험을 나타낸다.

또한, 보인자는 초음파촬영술 및/또는 미세침 생검을 포함한, 보다 정밀한 스크리닝으로부터 잇점을 얻을 수 있다. 스크리닝 프로그램의 목표는 조기에 암을 검출하는 것이다. 공지된 위험 변이에 대한 개인의 유전적 상태의 파악은 적용가능한 스크리닝 프로그램의 선택에 기여할 수 있다. 특정한 구체예에서, 방사성 요오드 스캔(Radioactive Iodine (RAI) Scan), 초음파 검사, CT 스캔 (CAT 스캔), 자기공명영상(Magnetic Resonance Imaging, MRI), 양전자 단층 촬영(Positron Emission Tomography, PET) 스캔, 미세침 흡인 생검(Fine needle aspiration biopsy) 및 외과적 생검(surgical biopsy)으로부터 선택된 하나 이상의 진단 도구와 함께, 본 명세서에 기재된 갑상선암의 위험 변이를 이용하는 것이 유용할 수 있다.

방법

질병 위험 평가 및 위험 관리 방법이 본 명세서에 기재되며, 본 발명에 포함된다. 본 발명은 또한 치료제에 반응할 확률에 대해 개체를 평가하는 방법, 치료제의 효과를 예측하는 방법, 핵산, 폴리펩티드 및 항체 및 컴퓨터-구현 기능을 포함한다. 본 명세서에서 제시된 다양한 방법에서 이용하기 위한 키트도 본 발명에 포함된다.

진단 및 스크리닝 방법

특정한 구체예에서, 본 발명은 갑상선암으로 진단된 개체 또는 갑상선암에 대한 감수성을 갖는 개체에서 보다 빈번하게 나타나는 유전적 마커의 특정한 대립인자를 검출하는 것에 의해, 갑상선암, 또는 갑상선암에 대한 감수성을 진단하거나 또는 상기 진단을 보조하는 방법에 관한 것이다. 특정한 구체예에서, 본 발명은 하나 이상의 다형성 마커(예를 들면, 본 명세서에 기재된 마커)의 하나 이상의 대립인자를 검출하는 것에 의해 갑상선암에 대한 감수성을 결정하는 방법이다. 다른 구체예에서, 본 발명은 하나 이상의 다형성 마커의 하나 이상의 대립인자를 검출하는 것에 의해 갑상선암에 대한 감수성을 진단하는 방법에 관한 것이다. 본 발명은 특정한 마커의 특정한 대립인자 또는 일배체형의 검출이 갑상선암에 대한 감수성을 나타내는 것인 방법을 기재한다. 그와 같은 예후적 또는 예측적 분석법은 또한 갑상선암과 연관된 증상의 발생 전에 개체의 예방적 치료를 결정하기 위해 이용될 수 있다.

일부 구체예에서, 본 발명은 의료 전문가에 의해 수행되는 진단과 같은 진단의 임상적 적용 방법에 관한 것이다. 다른 구체예에서, 본 발명은 일반인(layman)에 의해 수행되는 진단 방법 또는 감수성의 결정 방법에 관한 것이다. 상기 일반인은 유전형분석 서비스의 고객일 수 있다. 상기 일반인은 또한 개인(즉, 고객)의 유전형 상태에 근거하여, 특정한 성향 또는 질병에 대한 유전적 위험 인자와 관련된 서비스를 제공하기 위해, 개체로부터의 DNA 시료에 대해 유전형 분석을 수행하는, 유전형 서비스 제공자일 수 있다. Molecular Inversion Probe 어레이 기술 (예를 들면, Affymetrix GeneChip), 및 BeadArray Technologies (예를 들면, Illumina GoldenGate and Infinium assays)와 같은 SNP 마커의 고효율 유전형분석(high-throughput genotyping)을 포함한, 유전형분석 기술에서의 최근의 기술적 진전은 개인들이 비교적 낮은 비용으로 그들의 게놈을 백만개 까지의 SNP에 대해 동시에 평가받을 수 있게 한다. 결과적으로 수득된, 개인에게 이용가능하게 된 유전형 정보는 공개 문헌 및 과학 저널로부터의 정보를 포함한, 다양한 SNP와 연관된 질병 또는 성향 위험도에 대한 정보와 비교될 수 있다. 따라서, 본 명세서에 기재된 바와 같은, 질병-연관 대립인자의 진단적 응용은 자신의 유전형 데이터의 분석을 통해 개인에 의해, 임상적 테스트의 결과에 근거하여 의료전문가에 의해, 또는 유전형 서비스 제공자를 포함한 제3자에 의해 수행될 수 있다. 제3자는 또한 본 명세서에 기재된 유전적 마커를 포함한, 특정한 유전적 위험 인자와 관련된 서비스를 제공하기 위해 고객으로부터의 유전형 정보를 해석하는 서비스 제공자일 수 있다. 바꾸어 말하면, 유전적 위험도에 근거한 감수성의 진단 또는 평가가 대상자의 유전형 상태에 대한 정보 및 특정한 유전적 위험 인자(예를 들면, 특정한 SNP)에 의해 부여되는 위험도에 대한 지식에 근거하여, 의료 전문가, 유전학 상담자(genetic counselor), 유전형분석 서비스를 제공하는 제3자, 위험도 평가 서비스를 제공하는 제3자 또는 또는 일반인(예를 들면 개인)에 의해 이루어질 수 있다. 본 발명에서, 용어 "진단하는(diagnosing)" 및 "감수성을 진단하다(dignose a susceptibility)" 및 "감수성을 결정하다(determine a suceptiblity)"는 전술된 방법을 포함한, 모든 이용가능한 진단 방법을 의미하도록 의도된다.

일부 구체예에서, 개체로부터 게놈 DNA를 포함하는 시료가 수집된다. 그와 같은 시료는 예를 들면, 구강 도말(buccal swab), 타액 시료, 혈액 시료, 또는 본 명세서에서 더 설명되는 바와 같이, 게놈 DNA를 포함하는 기타 적합한 시료일 수 있다. 그 후, 게놈 DNA가 고-효율 어레이 기술(high-throughput array technology)과 같은, 당업자에게 이용가능한 통상적인 기법을 이용하여 분석된다. 그와 같은 유전형분석으로부터의 결과가 컴퓨터 데이터베이스를 포함한 데이터 캐리어, 데이터 저장 디스크와 같은 편리한 데이터 저장 유닛에, 또는 다른 편리한 데이터 저장 수단에 의해 저장된다. 일부 구체예에서, 상기 컴퓨터 데이터베이스는 객체형 데이터베이스(object database), 관계형 데이터베이스(relational database) 또는 후-관계형 데이터베이스(post-relational database)이다. 뒤이어, 유전형 데이터가 본 명세서에 기재된 유전적 변이와 같은, 특정한 인간 상태에 대한 감수성 변이인 것으로 알려진 일부 변이의 존재에 대해 분석된다. 유전형 데이터가 편리한 데이터 조회(query) 방법을 이용하여 데이터 저장 유닛으로부터 재생될 수 있다. 개체에 대한 특정한 유전형에 의해 부여된 위험도를 계산하는 것은 개체의 유전형을 유전형에 대한, 예를 들면, 특정한 질병 또는 성향(예를 들면, 갑상선암)에 대한 위험 변이의 이형접합형 보인자에 대한 이전에 결정된 위험도(예를 들면, 상대적 위험도(RR) 또는 오즈비(OR)로 표현됨)와 비교하는 것에 근거할 수 있다. 개체에 대한 계산된 위험도는 일치된(matched) 성별 및 민족기원을 갖는 평균 집단 대비, 사람, 또는 사람의 특정한 유전형에 대한 상대적 위험도일 수 있다. 평균 집단 위험도는 기준 집단으로부터의 결과를 이용하여, 상이한 유전형의 위험도의 가중평균(weighted average)으로 표현될 수 있고, 그 후, 집단 대비 유전형 그룹의 위험도를 계산하기 위한 적합한 계산이 수행될 수 있다. 대안적으로, 개체에 대한 위험도는 특정한 유전형의 비교, 예를 들면, 마커의 위험 대립인자의 비-보인자(non-carrier) 대비, 마커의 위험 대립인자의 이형접합형 보인자의 비교에 근거한다. 일부 구체예에서, 집단 평균은 사용자가 해석하기 용이한 척도, 즉, 집단의 평균 대비, 자신의 유전형에 근거한, 개체의 위험도를 제공하는 척도를 제공하기 때문에, 집단 평균을 이용하는 것이 더 편리할 수 있다. 계산된 위험도 추정값은 웹사이트, 바람직하게는 안전한 웹사이트를 통해 고객에게 이용가능하게 될 수 있다.

일부 구체예에서, 서비스 제공자는 제공되는 서비스에 고객에 의해 제공된 시료로부터 게놈 DNA를 단리(isolate)하는 단계, 상기 단리된 DNA의 유전형분석을 수행하는 단계, 상기 유전형 데이터에 기반하여 유전적 위험도를 계산하는 단계 및 상기 위험도를 상기 고객에게 보고하는 단계의 모든 단계들을 포함할 것이다. 일부 다른 구체예에서, 서비스 제공자는 상기 서비스에 개체에 대한 유전형 데이터의 해석, 즉, 상기 개체에 대한 유전형 데이터에 기반한 특정한 유전적 변이에 대한 위험도 추정값을 포함시킬 것이다. 일부 다른 구체예에서, 서비스 제공자는 개체(고객)로부터의 단리된 DNA의 시료로부터 출발하여, 유전형 분석 서비스 및 유전형 데이터의 해석을 포함한 서비스를 포함할 수 있다.

복수 개의 위험 변이에 대한 전체 위험도(overall risk)는 표준 방법을 이용하여 수행될 수 있다. 예를 들면, 승법 모델을 가정하는 것, 즉, 개별적인 위험 변이의 위험도가 전체 효과를 확립하기 위해 곱해진다는 것을 가정하는 것은 복수 개의 마커에 대한 전체 위험도의 계산을 간단하게 할 것이다.

또한, 특정한 다른 구체예에서, 본 발명은 갑상선암으로 진단되지 않은 개인, 또는 일반 집단에서보다 갑상선암 환자에서 덜 빈번하게 나타나는 특정한 유전적 마커 또는 일배체형을 검출하는 것에 의해, 갑상선암에 대한 감소된 감수성을 결정하는 방법에 관한 것이다.

본 명세서에서 설명되고 예시된 바와 같이, 특정한 마커 대립인자 또는 일배체형(예를 들면, rs965513, 및 이와 연관 불균형인 마커들)은 갑상선암과 연관된다. 일 구체예에서, 상기 마커 대립인자 또는 일배체형은 갑상선암에 대한 유의성 있는 위험도 또는 감수성을 부여하는 마커 대립인자 또는 일배체형이다. 또 다른 구체예에서, 본 발명은 개인에서 갑상선암에 대한 감수성을 결정하는 방법에 관한 것이고, 상기 방법은 상기 개인으로부터 수득된 핵산 시료 중에서 하나 이상의 다형성 마커의 하나 이상의 대립인자의 존재 또는 부재를 결정하는 단계를 포함하고, 상기 하나 이상의 다형성 마커는 표 2에 열거된 다형성 마커로 구성된 군으로부터 선택된다. 또 다른 구체예에서, 본 발명은 rs965513 (서열번호 1), rs907580 (서열번호 81) 및 rs7024345 (서열번호 66)로부터 선택된 하나 이상의 마커에 대해 스크리닝하는 것에 의해, 개인에서 갑상선암에 대한 감수성을 결정하는 방법에 관한 것이다. 또 다른 구체예에서, 상기 마커 대립인자 또는 일배체형은 건강한 개체(대조군, 예를 들면, 집단 대조군)에서 그의 존재의 빈도 대비, 갑상선암을 갖거나, 또는 갑상선암에 대한 감수성을 갖는 개체(질병군)에 보다 빈번하게 존재한다. 일부 구체예에서, 상기 하나 이상의 마커 대립인자 또는 일배체형의 연관의 유의성은 0.05 미만의 p 값을 특징으로 한다. 다른 구체예에서, 연관의 유의성은 보다 작은 p-값, 예를 들면, 0.01 미만, 0.001 미만, 0.0001 미만, 0.00001 미만, 0.000001 미만, 0.0000001 미만, 0.00000001 미만 또는 0.000000001 미만의 p-값과 같은 보다 작은 p-값을 특징으로 한다.

이 구체예에서, 상기 하나 이상의 마커 대립인자 또는 일배체형의 존재는 갑상선암에 대한 감수성을 나타낸다. 이 진단 방법들은 갑상선암의 위험도와 연관된 특정한 대립인자 또는 일배체형이 특정한 개인에 존재하는지 여부를 결정하는 단계를 포함한다. 본 명세서에 기재된 일배체형은 다양한 유전적 마커(예를 들면, SNP, 마이크로새틀라이트, 또는 기타 유전적 변이)의 대립인자의 조합을 포함한다. 특정한 일배체형을 구성하는 특정한 유전적 마커 대립인자의 검출은 본 명세서에 기재되고 및/또는 당해 기술 분야에서 공지된 다양한 방법에 의해 수행될 수 있다. 예를 들면, 유전적 마커는 핵산 수준에서(예를 들면, 직접적인 뉴클레오티드 서열결정에 의해, 또는 당해 기술분야의 당업자에게 공지된 기타 유전형분석 수단에 의해) 검출되거나, 유전적 마커가 단백질의 코딩 서열에 영향을 미치는 경우, 아미노산 수준에서(예를 들면, 단백질 서열결정에 의해, 또는 그와 같은 단백질을 인식하는 항체를 이용한 면역분석법에 의해) 검출될 수 있다. 본 발명의 마커 대립인자 또는 일배체형은 갑상선암과 연관된 게놈 세그먼트(예를 들면, 유전자)의 단편에 해당한다. 그와 같은 단편은 대상이 되는 다형성 마커 또는 일배체형의 DNA 서열을 포괄하나, 또한, 상기 마커 또는 일배체형과 강한 LD(연관 불균형)인 DNA 세그먼트를 포함할 수 있다. 일 구체예에서, 그와 같은 세그먼트는 0.2보다 큰 r² 값 및/또는 |D'|> 0.8에 의해 결정된 마커 또는 일배체형과 LD인 세그먼트를 포함한다.

일 구체예에서, 갑상선암에 대한 감수성의 결정은 혼성화 방법을 이용하여 수행될 수 있다(모든 보충물을 포함한, Current Protocols in Molecular Biology, Ausubel, F. et al., eds. , John Wiley & Sons 참조). 특정한 마커 대립인자의 존재는 상기 특정한 대립인자에 대해 특이적인 핵산 프로브의 서열-특이적 혼성화에 의해 표시될 수 있다. 각각 특정한 대립인자에 대해 특이적인, 여러 개의 서열-특이적 핵산 프로브를 사용하는 것에 의해, 하나 이상의 특정한 마커 대립인자 또는 하나 이상의 특정한 일배체형의 존재가 표시될 수 있다. 서열-특이적 프로브는 게놈 DNA, RNA, 또는 cDNA에 혼성화되도록 지시될 수 있다. 본 명세서에서 사용된, "핵산 프로브(nucleic acid probe)"는 상보적 서열에 혼성화되는 DNA 프로브 또는 RNA 프로브일 수 있다. 본 발명이 속하는 기술 분야의 당업자는 테스트 시료로부터의 게놈 서열에 특정한 대립인자가 존재하는 경우에만 서열 특이적 혼성화가 일어나도록 그와 같은 프로브를 설계하는 방법을 알 것이다. 본 발명은 또한 특정한 다형성 마커의 유전형 분석을 위한 상업적으로 입수가능한 기술 및 방법을 포함한 편리한 유전형분석 방법을 이용하여 실시될 수 있다.

갑상선암에 대한 감수성을 결정하기 위해, 갑상선암과 연관된 핵산을 포함하는 테스트 시료, 예를 들면, 게놈 DNA 시료를 하나 이상의 핵산 프로브와 접촉시키는 것에 의해 혼성화 시료가 형성된다. mRNA 또는 게놈 DNA를 검출하기 위한 프로브의 비-한정적인 예는 본 명세서에 기재된 mRNA 또는 게놈 DNA 서열에 혼성화될 수 있는 표지된 핵산 프로브이다. 상기 핵산 프로브는 예를 들면, 전장(full-length) 핵산 분자, 또는 그의 일부, 예를 들면, 적합한 mRNA 또는 게놈 DNA에 엄격한(stringent) 조건 하에 특이적으로 혼성화하기에 충분한 15개 이상, 30개 이상, 50개 이상, 100개 이상, 250개 이상, 또는 500개 이상의 뉴클레오티드로 구성된 길이의 올리고뉴클레오티드일 수 있다. 예를 들면, 핵산 프로브는 선택적으로 본 명세서에 기재된 마커의 하나 이상의 대립인자, 또는 본 명세서에 기재된 하나 이상의 일배체형을 포함하는, 본 명세서에 기재된, LD 블럭 C09 전체 또는 일부를 포함할 수 있거나, 또는 상기 프로브는 그와 같은 서열에 상보적일 수 있다. 상기 핵산 프로브는 또한 선택적으로 본 명세서에서 표 2에 표시된 다형성 마커들 중 하나 이상의 하나 이상의 대립인자를 포함하는, 본 명세서에 표시된 서열번호 1 내지 229 중 하나의 뉴클레오티드 서열 전부 또는 일부를 포함하거나, 또는 상기 프로브는 그와 같은 서열의 상보적 서열일 수 있다. 본 발명의 진단 분석법에서 이용하기 위한 다른 적합한 프로브가 본 명세서에 기재된다. 혼성화는 당해 기술 분야의 당업자에게 잘 알려진 방법에 의해 수행될 수 있다(예를 들면, 모든 보충물을 포함한, Current Protocols in Molecular Biology, Ausubel, F. et al ., eds., John Wiley & Sons 참조). 일 구체예에서, 혼성화는 특이적 혼성화, 즉, 불일치를 포함하지 않는 혼성화(정확한 혼성화)를 의미한다. 일 구체예에서, 상기 특이적 혼성화를 위한 혼성화 조건은 높은 엄격성이다.

존재하는 경우, 특이적 혼성화는 표준 방법을 이용하여 검출된다. 핵산 프로브와 테스트 시료 내의 핵산 간에 특이적 혼성화가 일어나면, 상기 시료는 상기 핵산 프로브에 존재하는 뉴클레오티드에 상보적인 대립인자를 포함한다. 본 발명의 마커, 또는 본 발명의 일배체형을 구성하는 마커에 대해, 상기 방법이 반복될 수 있거나, 또는 한번에 하나 이상의 마커 대립인자를 검출하기 위해 복수 개의 프로브가 동시에 이용될 수 있다. 특정한 일배체형의 둘 이상의 마커 대립인자를 포함하는 단일 프로브를 설계할 수 있다(예를 들면, 2개, 3개, 4개, 5개, 또는 특정한 일배체형을 구성하는 모든 마커에 상보적인 대립인자를 포함하는 프로브). 시료에서 일배체형의 특정한 마커의 검출은 상기 시료의 원천이 특정한 일배체형(예를 들면, 일배체형)을 가지며 따라서, 갑상선암에 대해 감수성을 갖는다는 것을 나타낸다.

하나의 바람직한 구체예에서, Kutyavin 등 (Nucleic Acid Res. 34:e128 (2006))에 기재된 바와 같이, 그의 3' 말단에 있는 형광 모이어티(fluorescent moiety) 또는 그룹 및 그의 5' 말단에 있는 퀀처(quencher)를 포함하는 검출 올리고뉴클레오티드 및 인핸서 올리고뉴클레오티드를 이용하는 방법이 적용될 수 있다. 형광 모이어티는 Gig Harbor Green 또는 Yakima Yellow, 또는 다른 적합한 형광 모이어티일 수 있다. 검출 프로브는 검출대상 SNP 다형성을 포함하는 짧은 뉴클레오티드 서열에 혼성화되도록 설계된다. 바람직하게는, 상기 SNP는 검출 프로브의 말단 잔기부터 3' 말단으로부터의 -6 잔기까지 중에 존재한다. 인핸서는 검출 프로브에 대해 3'인 DNA 주형에 혼성화되는 짧은 올리고뉴클레오티드 프로브이다. 상기 프로브들은 검출 프로브와 인핸서 뉴클레오티드 프로브가 모두 주형에 결합된 경우, 상기 검출 프로브와 인핸서 뉴클레오티드 프로브 간에 단일 뉴클레오티드 갭이 존재하도록 설계된다. 상기 갭은 엔도뉴클레아제 IV와 같은, 엔도뉴클레아제에 의해 인식되는 합성 탈염기 부위(synthetic abasic site)를 생성한다. 상기 효소는 완전히 상보적인 검출 프로브로부터 염료를 절단하나, 불일치를 포함하는 검출 프로브는 절단할 수 없다. 따라서, 방출된 형광 모이어티의 형광을 측정하는 것에 의해, 검출 프로브의 뉴클레오티드 서열에 의해 정의된 특정한 대립인자의 존재의 평가가 수행될 수 있다.

검출 프로브는 임의의 적합한 크기일 수 있으나, 바람직하게는 프로브는 비교적 짧다. 일 구체예에서, 상기 프로브는 길이가 5개 내지 100개의 뉴클레오티드로 구성된다. 또 다른 구체예에서, 상기 프로브는 길이가 10개 내지 50개의 뉴클레오티드로 구성되고, 또 다른 구체예에서, 상기 프로브는 길이가 12개 내지 30개의 뉴클레오티드로 구성된다. 다른 길이의 프로브들도 가능하고 본 발명이 속하는 기술 분야의 평균적인 당업자의 기술의 범위 내에 속한다.

바람직한 구체예에서, SNP 다형성을 포함하는 DNA 주형은 검출 전에 중합효소 연쇄 반응(PCR)에 의해 증폭된다. 그와 같은 구체예에서, 증폭된 DNA가 검출 프로프 및 인핸서 프로브에 대한 주형으로 기능한다.

검출 프로브, 인핸서 프로브, 및/또는 PCR에 의한 주형의 증폭을 위해 이용되는 프라이머의 특정한 구체예는 변형된 A 및 변형된 G를 포함한, 변형된 염기의 이용을 포함한다. 변형된 염기의 이용은 주형 DNA에 대한 뉴클레오티드 분자(프로브 및/또는 프라이머)의 용융점을 조정하기 위해, 예를 들면, 상보적인 T와 세개의 수소 결합을 형성할 수 있는 능력을 갖는 변형된 A가 이용될 수 있는, 낮은 비율의 G 또는 C 염기를 포함하는 영역에서 용융점을 높이기 위해, 또는 예를 들면, 상보적인 C와 두 개의 수소 결합만을 형성하는 변형된 G 염기를 이용하는 것에 의해, 높은 비율의 G 또는 C 염기를 포함하는 영역에서 용융점을 낮추기 위해 유용할 수 있다. 바람직한 구체예에서, 검출 뉴클레오티드 프로브의 설계에서 변형된 염기들이 이용된다. 당업자에게 알려진 임의의 변형된 염기가 이 방법에서 선택될 수 있고, 적합한 염기의 선택은 본 명세서의 교시 및 당업자에게 알려진 상업적 출처로부터 이용가능한 공지된 염기에 근거하여 당업자의 기술의 범위 내에 속한다.

대안적으로, 펩티드 핵산(peptide nucleic acid, PNA) 프로브가 본 명세서에 기재된 혼성화 방법에서 핵산 프로브에 추가하여, 또는 핵산 프로브 대신에 이용될 수 있다. PNA는 유기 염기 (A, G, C, T 또는 U)가 메틸렌 카르보닐 링커를 통해 글리신 질소에 결합된, N-(2-아미노에틸)글리신 유닛과 같은, 펩티드-유사 무기 백본(peptide-like inorganic backbone)을 갖는 DNA 모방체(mimic)이다(예를 들면, Nielsen, P., et al., Bioconjug. Chem. 5:3-7 (1994) 참조). PNA 프로브는 갑상선암과 연관된 하나 이상의 마커 대립인자 또는 일배체형을 포함하는 것으로 사료되는 시료 내의 분자에 특이적으로 혼성화하도록 설계될 수 있다. 따라서, PNA 프로브의 혼성화는 갑상선암 또는 갑상선암에 대한 감수성을 진단한다.

본 발명의 일 구체예에서, 개체로부터 수득된 게놈 DNA를 포함하는 테스트 시료가 수집되고 본 발명의 하나 이상의 마커 또는 일배체형을 포함하는 단편을 증폭시키기 위해 중합효소 연쇄 반응(PCR)이 이용된다. 본 명세서에 기재된 바와 같이, 특정한 마커 대립인자 또는 일배체형의 확인은 다양한 방법(예를 들면, 서열 분석, 제한효소 처리에 의한 분석, 특이적 혼성화, SSCP(single stranded conformation polymorphism), 전기영동 분석 등)을 이용하여 수행될 수 있다. 또 다른 구체예에서, 진단은 정량적 PCR(kinetic thermal cycling)을 이용한 발현 분석에 의해 수행된다. 이 기법은 예를 들면, TaqMan^®(Applied Biosystems, Foster City, CA)과 같은 상업적으로 이용가능한 기술을 이용할 수 있다. 상기 기법은 갑상선암과 연관된 핵산에 의해 코딩된 폴리펩티드 또는 스플라이싱 변이(splicing variant)의 발현 또는 조성의 변화의 존재를 평가할 수 있다. 또한, 변이의 발현은 물리적으로 또는 기능적으로 상이한 것으로 정량될 수 있다.

본 발명의 방법의 또 다른 구체예에서, 특정한 대립인자가 기준 서열 대비 제한효소 인식 부위의 생성 또는 제거를 초래하는 경우, 제한효소 처리(restriction digestion)에 의한 분석이 상기 특정한 대립인자를 검출하기 위해 이용될 수 있다. RFLP(Restriction fragment length polymorphism) 분석은 예를 들면, 전술된 Current Protocols in Molecular Biology에 기재된 바와 같이 수행될 수 있다. 관련된 DNA 단편의 제한효소 처리의 결과 패턴(digestion pattern)이 시료 중의 특정한 대립인자의 존재 또는 부재를 나타낸다.

특정한 대립인자 또는 일배체형을 검출하기 위해, 서열 분석이 또한 이용될 수 있다. 따라서, 일 구체예에서, 특정한 마커 대립인자 또는 일배체형의 존재 또는 부재의 결정은 대상 또는 개체로부터 수득된 DNA 또는 RNA의 테스트 시료의 서열 분석을 포함한다. PCR 또는 다른 적합한 방법이 갑상선암과 연관된 핵산의 일부를 증폭시키기 위해 이용될 수 있고, 그 후, 특정한 대립인자의 존재가 직접 시료 중의 게놈 DNA의 다형성 부위(또는 일배체형 내의 복수 개의 다형성 부위들)의 서열을 결정하는 것에 의해 검출될 수 있다.

또 다른 구체예에서, 개체로부터의 표적 핵산 서열 세그먼트에 상보적인 올리고뉴클레오티드 프로브의 어레이(array)가 다형성 부위에서 특정한 대립인자를 식별하기 위해 이용될 수 있다. 예를 들면, 올리고뉴클레오티드 어레이가 이용될 수 있다. 올리고뉴클레오티드 어레이는 일반적으로 상이한 공지된 위치에 있는 기판(substrate)의 표면에 결합된 복수 개의 상이한 올리고뉴클레오티드 프로브를 포함한다. 이 어레이들은 일반적으로 포토리소그래피 방법과 고상 올리고뉴클레오티드 합성 방법의 조합을 포함하는 기계적 합성 방법, 또는 본 발명이 속하는 기술 분야의 당업자에게 공지된 다른 방법을 이용하여 생산된다(각각의 전체 교시가 참조에 의해 본 명세서에 포함된, Bier, F. F., et al., Adv Biochem Eng Biotechnol, 109:433-54 (2008); Hoheisel, J.D., Nat Rev Genet 7:200-10 (2006); Fan, J.B., et al., Methods Enzymol 410:57-73 (2006); Raquossis, J & Elvidge, G., Expert Rev Mol Diagn 6:145-52 (2006); Mockler, T.C., et al Genomics 85: 1-15 (2005), 및 인용된 참조 문헌 참조). 다형성의 검출을 위한 올리고뉴클레오티드 어레이의 제조 및 이용의 추가적인 설명이 예를 들면, 전체 교시가 참조에 의해 본 명세서에 포함된 미국특허 제6,858,394호, 제6,429,027호, 제5,445,934호, 제5,700,637호, 제5,744,305호, 제5,945,334호, 제6,054,270호, 제6,300,063호, 제6,733,977호, 제7,364,858호, 유럽특허 제619 321호, 및 제373 203호에서 찾을 수 있다.

본 발명이 속하는 기술 분야의 당업자에게 이용가능한 핵산 분석의 다른 방법들이 갑상선암과 연관된 다형성 부위에서 특정한 대립인자를 검출하기 위해 이용될 수 있다. 대표적인 방법들은 예를 들면, 직접적인 수동 서열결정(direct manual sequencing) (Church and Gilbert, Proc. Natl. Acad. Sci. USA, 81: 1991-1995 (1988); Sanger, F., et al., Proc. Natl. Acad. Sci. USA, 74:5463-5467 (1977); Beavis, et al., U.S. Patent No. 5,288,644); 자동화된 형광 서열결정(automated fluorescent sequencing); 단일가닥 구조 다형성(SSCP) 분석; CDGE(clamped denaturing gel electrophoresis); DGGE(denaturing gradient gel electrophoresis) (Sheffield, V., et al., Proc. Natl. Acad. Sci. USA, 86:232-236 (1989)), 운동성 변화 분석(mobility shift analysis)(Orita, M., et al., Proc. Natl. Acad. Sci. USA, 86:2766-2770 (1989)), 제한효소 분석(Flavell, R., et al., Cell, 15:25-41 (1978); Geever, R., et al., Proc. Natl. Acad. Sci. USA, 78:5081-5085 (1981)); 헤테로듀플렉스(heteroduplex) 분석; 화학적 불일치 절단(chemical mismatch cleavage, CMC) (Cotton, R., et al., Proc. Natl. Acad. Sci. USA, 85:4397-4401 (1985)); RNase 보호 분석(Myers, R., et al., Science, 230:1242-1246 (1985); E. coli mutS 단백질과 같은, 뉴클레오티드 불일치를 인식하는 폴리펩티드의 이용; 및 대립인자-특이적 PCR을 포함한다.

본 발명의 또 다른 구체예에서, 갑상선암의 진단 또는 갑상선암에 대한 감수성의 결정은 본 발명의 유전적 마커 또는 일배체형이 폴리펩티드의 조성 또는 발현의 변화를 초래하는 경우, 갑상선암과 연관된 핵산에 의해 코딩된 폴리펩티드의 발현 및/또는 조성을 조사하는 것에 의해 수행될 수 있다. 따라서, 본 발명의 마커 또는 일배체형이 폴리펩티드의 조성 또는 발현의 변화를 초래하는 경우, 갑상선암에 대한 감수성의 결정은 이 폴리펩티드 중 하나, 또는 갑상선암과 연관된 핵산에 의해 코딩된 또 다른 폴리펩티드의 발현 및/또는 조성을 조사하는 것에 의해 수행될 수 있다. 갑상선암에 대한 연관을 보이는 본 발명의 마커는 이 인접 유전자들(nearby gene) 중 하나 이상에 대한 효과를 통해 역할을 수행할 수 있다. 특정한 구체예에서, 상기 마커는 FoxE1 유전자에 대한 효과를 보인다. 이 유전자들(예를 들면, FoxE1 유전자)에 영향을 미치는 가능한 메카니즘은 예를 들면, 전사에 대한 효과, RNA 스플라이싱에 대한 효과, mRNA의 대안적인 스플라이싱 형태의 상대적 양의 변화, RNA 안정성에 대한 효과, 핵으로부터 세포질로의 수송에 대한 효과, 및 번역의 효율성 및 정확도에 대한 효과를 포함한다.

따라서, 또 다른 구체예에서, 본 명세서에서 제시된 변이(마커 또는 일배체형)는 FoxE1 유전자의 발현에 영향을 미친다. 유전자 발현에 영향을 미치는 조절 요소가 유전자의 프로모터 영역으로부터 멀리 위치할 수 있고, 심지어는 수십 킬로베이스 또는 수백 킬로베이스 떨어져서 위치할 수 있다는 것이 잘 알려져 있다. 본 발명의 하나 이상의 다형성 마커의 하나 이상의 대립인자의 존재 또는 부재에 대해 분석하는 것에 의해, 따라서, 인접 유전자의 발현 수준을 평가할 수 있다. 따라서, 본 명세서에 기재된 마커, 또는 그와 같은 마커를 포함하는 일배체형의 검출이 FoxE1 유전자, 또는 본 명세서에서 갑상선암의 위험도를 부여하는 것으로 확인된 마커들 중 하나와 연관된 또 다른 인접 유전자의 발현을 평가 및/또는 예측하기 위해 이용될 수 있다.

ELISA(enzyme linked immunosorbent assay), 웨스턴 블롯(Western blot), 면역침전(immunoprecipitation) 및 면역형광(immunofluorescence)을 포함한 다양한 방법들이 단백질 발현 수준을 검출하기 위해 이용될 수 있다. 개체로부터의 테스트 시료가 특정한 핵산에 의해 코딩되는 폴리펩티드의 발현의 변화 및/또는 그의 조성의 변화의 존재에 대해 평가된다. 특정한 핵산 핵산에 의해 코딩되는 폴리펩티드의 발현의 변화가 예를 들면, 정량적인 폴리펩티드 발현(즉, 생성되는 폴리펩티드의 양)의 변화일 수 있다. 특정한 핵산 핵산에 의해 코딩되는 폴리펩티드의 조성의 변화는 정성적 폴리펩티드 발현의 변화(예를 들면, 돌연변이 폴리펩티드의 발현 또는 상이한 스플라이싱 변이의 발현)이다. 일 구체예에서, 갑상선암에 대한 감수성의 진단은 갑상선암과 연관된 핵산에 의해 코딩되는 특정한 스플라이싱 변이, 또는 스플라이싱 변이의 특정한 패턴을 검출하는 것에 의해 수행된다.

또한, 그와 같은 변화(정량적 및 정성적 변화)가 모두 존재할 수 있다. 본 명세서에서 사용된 폴리펩티드 발현 또는 조성의 "변화(alteration)"는 대조군 시료에서 상기 폴리펩티드의 발현 또는 조성 대비, 테스트 시료 중의 발현 또는 조성의 변화를 의미한다. 대조군 시료는 테스트 시료에 대응되는 시료(예를 들면, 동일한 종류의 세포로부터 유래된 시료)이고, 갑상선암에 의해 영향받지 않고 및/또는 갑상선암에 대한 감수성을 갖지 않는 개체로부터 유래된다. 일 구체예에서, 대조군 시료는 본 명세서에 기재된 갑상선암과 연관된 마커 대립인자 또는 일배체형을 갖지 않는 개체로부터 유래된다. 유사하게, 대조군 시료 대비, 테스트 시료 중에 하나 이상의 상이한 스플라이싱 변이의 존재, 또는 테스트 시료 중의 상이한 스플라이싱 변이의 유의성 있게 상이한 양의 존재는 갑상선암에 대한 감수성을 나타낼 수 있다. 대조군 시료 대비, 테스트 시료 중의 폴리펩티드의 발현 또는 조성의 변화는 특정한 대립인자가 대조군 시료 중의 기준 대비 스플라이스 위치를 변화시키는 경우, 특정한 대립인자를 나타낼 수 있다. 분광분석법, 비색법(colorimetry), 전기영동, 등전점 전기영동법(isoelectric focusing), 및 면역블롯팅(immunoblotting)(예를 들면, 전술된 바와 같은, Current Protocols in Molecular Biology, 특히, 챕터 10 참조)과 같은 면역분석법(immunoassays)(예를 들면, David et al., 미국특허 제4,376,110호)을 포함한, 핵산에 의해 코딩된 폴리펩티드의 발현 또는 조성을 조사하는 다양한 수단이 본 발명이 속하는 기술 분야의 당업자에게 알려져 있고, 이용될 수 있다.

예를 들면, 일 구체예에서, 갑상선암과 연관된 핵산에 의해 코딩되는 폴리펩티드에 결합할 수 있는 항체(예를 들면, 검출가능한 표지를 갖는 항체)가 이용될 수 있다. 항체는 다중클론 항체 또는 단일클론 항체일 수 있다. 완전한 항체, 또는 그의 단편(예를 들면, Fv, Fab, Fab', F(ab')₂)이 이용될 수 있다. 프로브 또는 항체에 대해, 용어 "표지된(labeled)"은 검출가능한 물질을 프로브 또는 항체에 결합(즉, 물리적 연결)시키는 것에 의한 프로브 또는 항체의 직접적인 표지화, 및 직접적으로 표지된 또 다른 시약과의 반응성에 의한 프로브 또는 항체의 간접적 표지화를 포함하도록 의도된다. 간접적 표지화의 예는 표지된 이차 항체(예를 들면, 형광-표지된 이차 항체)를 이용한 일차 항체의 검출 및 형광-표지된 스트렙타비딘에 의해 검출될 수 있는, 비오틴에 의한 DNA 프로브의 말단-표지화(end-labeling)를 포함한다.

이 방법의 일 구체예에서, 테스트 시료 중의 폴리펩티드의 수준 또는 양이 대조군 시료 중의 폴리펩티드의 수준 또는 양과 비교된다. 대조군 시료 중의 폴리펩티드의 수준 또는 양에 비해 더 높거나 또는 더 낮으며, 그 차이가 통계적으로 유의성이 있는 것인 테스트 시료 중의 폴리펩티드의 수준 또는 양은 핵산에 의해 코딩된 폴리펩티드의 발현의 변화를 나타내고, 발현의 차이를 유발한 특정한 대립인자 또는 일배체형을 진단한다. 대안적으로, 테스트 시료 중의 폴리펩티드의 조성이 대조군 시료 중의 상기 폴리펩티드의 조성과 비교된다. 또 다른 구체예에서, 폴리펩티드의 수준 또는 양과 조성이 모두 테스트 시료 및 대조군 시료에서 평가될 수 있다.

또 다른 구체예에서, 갑상선암에 대한 감수성의 결정은 추가적인 단백질-기반 분석법, RNA-기반 분석법 또는 DNA-기반 분석법과 조합하여, 하나 이상의 본 발명의 마커 또는 일배체형을 검출하는 것에 의해 수행된다.

키트

본 발명의 방법에서 유용한 키트는 본 명세서에 기재된 방법에서 유용한 성분들, 예를 들면, 핵산 증폭용 프라이머, 혼성화 프로브, 제한효소(예를 들면, RFLP 분석용 제한효소), 대립인자-특이적 올리고뉴클레오티드, 본 명세서에 기재된 본 발명의 핵산(예를 들면, 본 발명의 하나 이상의 다형성 마커 및/또는 일배체형을 포함하는 게놈 단편)에 의해 코딩된 변화된 폴리펩티드에 결합하는 항체 또는 본 명세서에 기재된 본 발명의 핵산에 의해 코딩된 변화되지 않은(원형의) 폴리펩티드에 결합하는 항체, 갑상선암과 연관된 핵산의 증폭을 위한 수단, 갑상선암과 연관된 핵산의 핵산 서열을 분석하기 위한 수단, 갑상선암과 연관된 핵산에 코딩되는 폴리펩티드의 아미노산 서열을 분석하기 위한 수단, 등을 포함한다. 본 발명의 키트는 예를 들면, 필요한 완충액, 본 발명의 핵산(예를 들면, 본 명세서에 기재된 하나 이상의 다형성 마커를 포함하는 핵산 세그먼트)을 증폭하기 위한 핵산 프라이머, 및 그와 같은 프라이머 및 필요한 효소(예를 들면, DNA 중합효소)를 이용하여 증폭된 단편의 대립인자-특이적 검출을 위한 시약을 포함할 수 있다. 추가적으로, 키트는 본 발명의 방법과 조합되어 이용될 수 있는 분석법을 위한 시약들, 예를 들면, 본 명세서에 기재된 갑상선암 진단 분석법에서 이용되는 시약을 제공할 수 있다.

일 구체예에서, 본 발명은 개인에서 갑상선암에 대한 감수성을 검출하기 위한 키트에 관한 것으로서, 상기 키트는 상기 개인의 게놈에서 본 발명의 다형성의 하나 이상의 대립인자를 선택적으로 검출하는 시약을 포함한다. 특정한 구체예에서, 상기 시약은 상기 하나 이상의 다형성 마커를 포함하는 상기 개인의 게놈의 단편에 혼성화하는 하나 이상의 연속된(contiguous) 올리고뉴클레오티드를 포함한다. 또 다른 구체예에서, 상기 개인으로부터 수득된 게놈 세그먼트의 반대쪽 가닥에 혼성화하는 한 쌍 이상의 올리고뉴클레오티드를 포함하고, 상기 각 올리고뉴클레오티드 프라이머 쌍은 하나의 다형성을 포함하는 상기 개인의 게놈의 단편을 선택적으로 증폭시키도록 설계된다. 하나의 그와 같은 구체예에서, 상기 다형성은 본 명세서에서 표 2에 표시된 다형성으로 구성된 군으로부터 선택된다. 또 다른 구체예에서, 상기 다형성은 rs965513 (서열번호 1), rs907580 (서열번호 81) 및 rs7024345 (서열번호 66)으로부터 선택된다. 또 다른 구체예에서, 상기 단편은 크기가 20 bp 이상이다. 그와 같은 올리고뉴클레오티드 또는 핵산(예를 들면, 올리고뉴클레오티드 프라이머)은 갑상선암의 위험도와 연관된 다형성(예를 들면, SNP 또는 마이크로새틀라이트)을 둘러싼(flanking) 핵산 서열의 부분을 이용하여 설계될 수 있다. 또 다른 구체예에서, 상기 키트는 하나 이상의 특정한 다형성 마커 또는 일배체형을 대립인자-특이적으로 검출할 수 있는 하나 이상의 표지된 핵산, 및 상기 표지의 검출을 위한 시약을 포함한다. 적합한 표지는 예를 들면, 방사성 동위원소, 형광 표지, 효소 표지, 효소 보조-인자(co-factor) 표지, 자성 표지(magnetic label), 스핀 표지(spin label), 에피토프 표지(epitope label)를 포함한다.

특정한 구체예에서, 본 발명의 키트의 시약에 의해 검출될 다형성 마커 또는 일배체형은 표 2에 표시된 마커들로 구성된 군으로부터 선택된, 하나 이상의 마커, 두개 이상의 마커, 세개 이상의 마커, 네개 이상의 마커, 또는 다섯개 이상의 마커를 포함한다. 또 다른 구체예에서, 검출될 마커 또는 일배체형은 마커 rs965513 (서열번호 1), rs907580 (서열번호 81) 및 rs7024345 (서열번호 66)로 구성된 군으로부터 선택된 하나 이상의 마커, 두개 이상의 마커, 세개 이상의 마커, 네개 이상의 마커, 또는 다섯개 이상의 마커를 포함한다. 또 다른 구체예에서, 검출될 마커는 마커 rs965513 (서열번호 1), 또는 이와 연관 불균형인 마커들로부터 선택된다.

하나의 바람직한 구체예에서, 본 발명의 마커들을 검출하기 위한 키트는 검출대상 SNP 다형성을 포함하는 주형 DNA의 세그먼트에 혼성화하는 검출 올리고뉴클레오티드 프로브, 인핸서 올리고뉴클레오티드 프로브 및 엔도뉴클레아제를 포함한다. 앞서 설명된 바와 같이, 검출 올리고뉴클레오티드 프로브는 그의 3' 말단에 있는 형광 모이어티(fluorescent moiety) 또는 그룹 및 그의 5' 말단에 있는 퀀처(quencher)를 포함하고 Kutyavin 등 (Nucleic Acid Res. 34:e128 (2006))에 기재된 바와 같은 인핸서 올리고뉴클레오티드가 이용된다. 형광 모이어티는 Gig Harbor Green 또는 Yakima Yellow, 또는 다른 적합한 형광 모이어티일 수 있다. 검출 프로브는 검출대상 SNP 다형성을 포함하는 짧은 뉴클레오티드 서열에 혼성화되도록 설계된다. 바람직하게는, 상기 SNP는 검출 프로브의 말단 잔기부터 3' 말단으로부터의 -6 잔기까지 중에 존재한다. 인핸서는 검출 프로브에 대해 3'인 DNA 주형에 혼성화되는 짧은 올리고뉴클레오티드 프로브이다. 상기 프로브들은 검출 프로브와 인핸서 뉴클레오티드 프로브가 모두 주형에 결합된 경우, 상기 검출 프로브와 인핸서 뉴클레오티드 프로브 간에 단일 뉴클레오티드 갭이 존재하도록 설계된다. 상기 갭은 엔도뉴클레아제 IV와 같은, 엔도뉴클레아제에 의해 인식되는 합성 탈염기 부위(synthetic abasic site)를 생성한다. 상기 효소는 완전히 상보적인 검출 프로브로부터 염료를 절단하나, 불일치를 포함하는 검출 프로브는 절단할 수 없다. 따라서, 방출된 형광 모이어티의 형광을 측정하는 것에 의해, 검출 프로브의 뉴클레오티드 서열에 의해 정의된 특정한 대립인자의 존재의 평가가 수행될 수 있다.

바람직한 구체예에서, SNP 다형성을 포함하는 DNA 주형은 검출 전에 중합효소 연쇄 반응(PCR)에 의해 증폭되고, 그와 같은 증폭을 위한 프라이머는 시약 키트에 포함된다. 그와 같은 구체예에서, 증폭된 DNA가 검출 프로프 및 인핸서 프로브에 대한 주형으로 기능한다.

일 구체예에서, DNA 주형은 본 명세서에 기재된 특정한 다형성 마커의 존재에 대한 평가 전에, WGA(Whole Genome Amplification)에 의해 증폭된다. 당업자에게 잘 알려진, WGA를 수행하기 위한 표준 방법이 이용될 수 있고, 본 발명의 범위 내에 속한다. 하나의 그와 같은 구체예에서, WGA를 수행하기 위한 시약이 시약 키트에 포함된다.

하나의 그와 같은 구체예에서, 상기 마커 또는 일배체형의 존재의 결정은 갑상선암에 대한 감수성(증가된 감수성 또는 감소된 감수성)을 나타낸다. 또 다른 구체예에서, 상기 마커 대립인자 또는 일배체형의 존재의 결정은 갑상선암 치료제에 대한 반응을 나타낸다. 또 다른 구체예에서, 상기 마커 또는 일배체형의 존재의 결정은 갑상선암 치료제에 대한 반응을 나타낸다. 또 다른 구체예에서, 상기 마커 또는 일배체형의 존재의 결정은 갑상선암 치료의 예후를 나타낸다. 그와 같은 치료는 수술에 의한 개입, 투약, 방사선요법 또는 기타 수단(예를 들면, 생활방식 변화)을 포함할 수 있다.

본 발명의 추가적인 양태에서, 약제학적 팩(pack)(키트)이 제공되고, 상기 팩은 치료제와 본 명세서에 개시된 바와 같은, 본 발명의 하나 이상의 변이에 대해 진단적으로 테스트된 인간에게 상기 치료제를 투여하는 것에 대한 일련의 설명서를 포함한다. 상기 치료제는 소형 분자 약물, 항체, 펩티드, 안티센스 또는 RNAi 분자, 또는 기타 치료 분자일 수 있다. 일 구체예에서, 본 발명의 하나 이상의 변이의 보인자로 확인된 개인은 치료제의 처방된 투여량을 복용하도록 지시된다. 하나의 그와 같은 구체예에서, 본 발명의 하나 이상의 변이의 동형접합 보인자로 확인된 개인은 상기 치료제의 처방된 투여량을 복용하도록 지시된다. 또 다른 구체예에서, 본 발명의 하나 이상의 변이의 비-보인자로 확인된 개인은 치료제의 처방된 투여량을 복용하도록 지시된다.

특정한 구체예에서, 상기 키트는 또한 상기 키트를 포함하는 시약을 이용하는 것에 대한 일련의 설명서를 포함한다.

치료제

갑상선암의 치료 옵션은 현재의 표준 치료 방법 및 임상 시험 중인 방법들을 포함한다.

갑상선암에 대한 현재의 치료 옵션은 하기를 포함한다:

수술 - 갑상선암이 발견된 엽(lobe)를 절제하는 엽절제술(lobectomy), 갑상선의 매우 작은 부분을 제외한 모든 부분이 제거되는 것인 갑상선절제술(thyroidectomy), 갑상선 전체가 제거되는 것인 갑상선 적출술(total thyroidectomoy), 및 암 증식을 포함하는 경부의 림프절이 제거되는 것인 림프절절제술(lymphadenectomoy)을 포함한다;

방사선 요법 - 외부(externation) 방사선 요법 및 방사성 화합물을 이용한 내부 방사선 요법(internal radiation therapy)을 포함한다. 방사선 요법은 생존하는 암 세포를 제거하기 위해 외과적 수술 후에 적용될 수 있다. 또한, 갑상선 여포암 및 갑상선 유두암은 종종 방사성 요오드(RAI) 요법에 의해 치료된다;

화학요법 - 화학요법 화합물의 경구 투여 또는 정맥 투여를 포함한다;

갑상선 호르몬 요법 - 이 요법은 신체에서 갑상선-자극 호르몬(TSH)의 생성을 방해하는 약물의 투여를 포함한다.

¹⁸F-플루오로데옥시글루코오스(FluGlucoScan); ¹¹¹In-펜테트레오티드 (NeuroendoMedix); 퇴행성 갑상선암의 치료에서 컴브레타스타틴(Combretastatin) 및 파클리탁셀/카르보플라틴, 수술후 치료에서 갑상선-자극 호르몬을 동반하거나 또는 동반하지 않은 ¹³¹I, XL184-301 (Exelixis), 반데타니브(Zactima; Astra Zeneca), CS-7017 (Sankyo), 데시타빈 (Dacogen; 5-aza-2'-deoxycytidine), 이리노테칸 (Pfizer, Yakult Honsha), 보르테조미브 (Velcade; Millenium Pharmaceuticals); 17-AAG (17-N-Allylamino-17-demethoxygeldanamycin), 소라페니브 (Nexavar, Bayer), 재조합 티로트로핀, 레날리도미드 (Revlimid, Celgene), 수니티니브 (Sutent), 소라페니브 (Nexavar, Bayer), 악시티니브 (AG-013736, Pfizer), 발프로산 (2-프로필펜탄산), 반데타니브 (Zactima, Astra Zeneca), AZD6244 (Astra Zeneca), 베바시주마브 (Avastin, Genetech/Roche), MK-0646 (Merck), 파조파니브 (GlaxoSmithKline), 아필베르세프트 (Sanofi-Aventis & Regeneron Pharmaceuticals), 및 FR901228 (Romedepsin)의 시험을 포함하나, 이에 한정되지 않는, 갑상선암 치료법 및 치료제에 대한 다수의 임상 시험이 현재 진행중이다.

본 명세서에서 갑상선암의 증가된 위험도를 부여하는 것으로 개시된 위험 변이(마커 및/또는 일배체형)는 갑상선암을 위한 신규한 치료 표적의 식별에서 유용하게 이용될 수 있다. 예를 들면, 이 변이들 중 하나 이상을 포함하거나 이들과 연관 불균형인 유전자, 또는 이들의 산물(예를 들면, FoxE1 유전자 및 그의 유전자 산물), 및 이 변이 유전자들 또는 이들의 산물에 의해 직접적으로 또는 간접적으로 조절되거나 또는 이들과 상호작용하는 유전자 또는 그들의 산물이 갑상선암을 치료하거나, 갑상선암과 연관된 증상의 발생을 예방하거나 또는 지연시키는 치료제의 개발을 위해 표적화될 수 있다. 치료제는 하나 이상의, 예를 들면, 표적 유전자 또는 그들의 유전자 산물의 기능 및/또는 수준을 조절할 수 있는, 작은 비-단백질(non-protein) 및 비-핵산 분자, 단백질, 펩티드, 단백질 단편, 핵산(DNA, RNA), PNA(peptide nucleic acid), 또는 그들의 유도체 또는 모방체(mimetics)를 포함할 수 있다.

본 발명의 핵산 및/또는 변이, 또는 이들의 상보적 서열을 포함하는 핵산이 세포, 조직 또는 기관에서 유전자 발현을 조절하기 위한 안티센스 구조물(antisense construct)로서 이용될 수 있다. 안티센스 기법과 연관된 방법은 당업자에게 잘 알려져 있고, 예를 들면, Antisense Drug Technology: Principles, Strategies, and Applications, Crooke, ed., Marcel Dekker Inc., New York (2001)에서 설명되고 검토된다. 일반적으로, 안티센스 핵산 분자는 안티센스 분자가 상기 mRNA에 혼성화하여, mRNA의 단백질로의 번역을 차단할 수 있게, 유전자에 의해 발현된 mRNA의 영역에 상보적이게 설계된다. 절단제(cleaver) 및 차단제(blocker)를 포함한, 여러 종류의 안티센스 올리고뉴클레오티드가 본 발명이 속하는 기술 분야의 당업자에게 알려져 있다. 전자, 즉, 절단제는 표적 RNA 부위에 결합하고, 상기 표적 RNA를 절단하는, 세포내 뉴클레아제(예를 들면, RnaseH 또는 Rnase L)를 활성화시킨다. 차단제는 표적 RNA에 결합하고, 리보좀의 입체 장애(steric hindrance)에 의해 단백질 번역을 저해한다. 차단제의 예는 핵산, 모르폴리노 화합물, LNA(locked nucleic acid) 및 메틸포스포네이트를 포함한다(Thompson, Drug Discovery Today, 7:912-917 (2002)). 안티센스 올리고뉴클레오티드는 직접적으로 치료제로서 유용하고, 또한 예를 들면, 유전자 넉-아웃(knock-out) 또는 유전자 넉-다운 실험에 의해, 유전자 기능을 결정하고 검증하기 위해 유용하다. 안티센스 기술은 Lavery et al., Curr. Opin. Drug Discov. Devel. 6:561-569 (2003), Stephens et al., Curr. Opin. Mol. Ther. 5:118-122 (2003), Kurreck, Eur. J. Biochem. 270:1628-44 (2003), Dias et al., Mol. Cancer Ter. 1:347-55 (2002), Chen, Methods Mol. Med. 75:621-636 (2003), Wang et al., Curr. Cancer Drug Targets 1:177-96 (2001), 및 Bennett, Antisense Nucleic Acid Drug.Dev. 12:215-24 (2002)에 더 설명된다.

본 명세서에 기재된 변이는 특정한 변이에 특이적인 안티센스 시약의 선택 및 설계를 위해 이용될 수 있다. 본 명세서에 기재된 변이에 관한 정보를 이용하여, 본 발명의 하나 이상의 변이를 포함하는 mRNA 분자를 특이적으로 표적화하는 안티센스 올리고뉴클레오티드 또는 다른 안티센스 분자가 설계될 수 있다. 이 방식으로, 본 발명의 하나 이상의 변이(마커 및/또는 일배체형)를 포함하는 mRNA 분자의 발현이 저해되거나 또는 차단될 수 있다. 일 구체예에서, 안티센스 분자는 표적 핵산의 특정한 대립인자 형태(즉, 하나 이상의 변이(대립인자 및/또는 일배체형))에 특이적으로 결합하여, 이에 의해 이 특정한 대립인자 또는 일배체형으로부터 유래된 산물의 번역을 억제하나, 표적 핵산 분자의 특정한 다형성 부위의 다른 또는 대안적인 변이에 결합하지 않도록 설계된다.

안티센스 분자는 유전자 발현을 저해하고, 따라서, 단백질 발현을 저해하기 위해 mRNA를 불활성화시키기 위해 이용될 수 있기 때문에, 안티센스 분자는 질병을 치료하기 위해 이용될 수 있다. 방법은 mRNA가 번역되는 능력을 약화시키는, mRNA의 하나 이상의 영역에 상보적인 뉴클레오티드 서열을 포함하는 리보자임(ribozyme)에 의한 절단을 포함할 수 있다. 그와 같은 mRNA 영역은 예를 들면, 단백질-코딩 영역, 특히, 촉매 활성, 기질 및/또는 리간드 결합 부위, 또는 단백질의 다른 기능성 도메인에 상응하는 단백질-코딩 영역을 포함한다.

C. elegans (Fire et al.,Nature 391:806-11 (1998))에서의 최초의 발견 이후, 지난 10년간 RNA 간섭(RNA interference, RNAi) 현상이 활발하게 연구되었고, 최근년에, 인간 질병의 치료에서 RNAi의 잠재적 용도가 활발히 탐구되고 있다(reviewed in Kim & Rossi, Nature Rev. Genet. 8:173-204 (2007)). 유전자 침묵(gene silencing)으로도 불리는, RNA 간섭(RNAi)은 특정한 유전자를 중지(turn off)시키기 위해 이중-가닥 RNA 분자(dsRNA)를 이용하는 것에 기반한다. 세포에서, 세포질 이중가닥-RNA 분자(dsRNA)는 세포성 복합체(cellular complex)에 의해 작은 간섭 RNA(siRNA)로 가공된다. siRNA는 단백질-RNA 복합체를 표적 mRNA 상의 특정한 부위로 표적화되게 하여, 상기 mRNA의 절단을 초래한다(Thompson, Drug Discovery Today, 7:912-917 (2002)). siRNA 분자들은 통상적으로 길이가 약 20개, 21개, 22개 또는 23개의 뉴클레오티드로 구성된다. 따라서, 본 발명의 일 양태는 단리된 핵산 분자, 및 상기 분자들의 RNA 간섭을 위한 용도, 즉, 작은 간섭 RNA 분자(siRNA)로서의 용도에 관한 것이다. 일 구체예에서, 상기 단리된 핵산 분자는 길이가 18개 내지 26개의 뉴클레오티드로 구성되고, 바람직하게는 19개 내지 25개의 뉴클레오티드로 구성되며, 보다 바람직하게는 20개 내지 24개의 뉴클레오티드로 구성되고, 보다 바람직하게는, 21개, 22개 또는 23개의 뉴클레오티드로 구성된다.

RNAi-매개 유전자 침묵을 위한 또 다른 경로는 세포에서 전구체 miRNA(precursor microRNA, pri-miRNA)를 생성하기 위해 가공되는, 내재적으로 코딩된 일차 마이크로RNA(endogenously encoded micorRNA)(pri-miRNA) 전사체에서 기인한다. 이 miRNA 분자들은 핵으로부터 세포질로 유출되고, 세포질에서 성숙 miRNA 분자(mature miRNA)를 생성하기 위해 가공을 거치고, 상기 miRNA는 mRNA의 3' 비번역 영역(untranslated region, UTR) 내의 표적 부위를 인식하는 것에 의해 번역 저해(translational inhibition)를 주도하고, 뒤이어 P-바디(P-body)를 가공하는 것에 의해 mRNA 분해를 주도한다(reviewed in Kim & Rossi, Nature Rev. Genet. 8:173-204 (2007)).

RNAi의 임상적 적용은 바람직하게는 크기가 약 20 내지 23개의 뉴클레오티드로 구성되고, 바람직하게는 2개의 뉴클레오티드로 구성된 3' 오버랩(overlap)을 갖는 것인 합성 siRNA 듀플렉스의 내포(incorporation)를 포함한다. 유전자 발현의 넉다운은 표적 mRNA에 대한 서열-특이적 설계에 의해 확립된다. 그와 같은 분자의 최적 설계 및 합성을 위한 여러 상업적 사이트들이 본 발명이 속하는 기술 분야의 당업자에게 알려져 있다.

다른 적용들은 보다 긴 siRNA 분자(통상적으로 25 내지 30개의 뉴클레오티드로 구성된 길이, 바람직하게는 약 27개의 뉴클레오티드로 구성된 길이), 및 작은 헤어핀 RNA(small hairpin, sh RNA; 통상적으로 약 29개의 뉴클레오티드로 구성된 길이)를 제공한다. 후자는 Amarzguioui 등(FEBS Lett. 579:5974-81 (2005))에 기재된 바와 같이, 자연적으로 발현된다. 화학적으로 합성된 siRNA 및 shRNA는 인 비보 가공을 위한 기질이며, 일부 경우에, 보다 짧은 설계의 경우보다 더 강력한 유전자 침묵을 제공한다(Kim et al., Nature Biotechnol. 23:222-226 (2005); Siolas et al., Nature Biotechnol. 23:227-231 (2005)). 일반적으로, siRNA의 세포내 농도가 후속 세포 분열에 의해 희석되기 때문에, siRNA는 유전자 발현의 일시적 침묵을 제공한다. 대조적으로, 발현된 shRNA는 shRNA의 전사가 일어나는 동안은, 표적 전사체(target transcript)의 장기적이고 안정적인 넉다운을 매개한다(Marques et al., Nature Biotechnol. 23:559-565 (2006); Brummelkamp et al., Science 296: 550-553 (2002)).

siRNA, miRNA 및 shRNA를 포함하는 RNAi 분자들은 서열-의존적 방식으로 작용하기 때문에, 본 명세서에 기재된 변이(예를 들면, 표 2에 표시된 마커 및 일배체형)는 특정한 대립인자 및/또는 일배체형(예를 들면, 본 발명의 대립인자 및/또는 일배체형)을 포함하는 특이적 핵산 분자를 인식하나, 다른 대립인자 또는 일배체형을 포함하는 핵산 분자는 인식하지 않는 RNAi 시약을 설계하기 위해 이용될 수 있다. 따라서, 이 RNAi 시약은 표적 핵산 분자를 인식하고 파괴시킬 수 있다. 안티센스 시약의 경우와 같이, RNAi 시약은 치료제로서(즉, 질병-연관 유전자 또는 질병-연관 유전자 변이의 중지(turn off)를 위해) 유용할 수 있으나, 또한 유전자 기능을 규명하고 검증하기 위해 유용할 수 있다(예를 들면, 유전자 넉-아웃 또는 유전자 넉-다운 실험에 의해).

RNAi의 전달은 본 발명이 속하는 기술 분야에서 당업자에게 알려진 다양한 방법에 의해 수행될 수 있다. 비-바이러스 전달(non-viral delivery)을 이용하는 방법은 콜레스테롤, 안정한 핵산-지질 입자(stable nucleic acid-lipid particle, SNALP), 중쇄 항체 단편(Fab), 앱타머(aptamer) 및 나노입자를 포함한다. 바이러스에 의한 전달 방법(viral delivery method)은 렌티바이러스, 아데노바이러스 및 아데노-연관 바이러스(adeno-associated virus)의 이용을 포함한다. 일부 구체예에서, siRNA 분자는 그들의 안정성을 증가시키기 위해 화학적으로 변형된다. 이는 2'-O-메틸퓨린 및 2'-플루오로피리미딘을 포함한, 리보오스의 2' 위치에서의 변형을 포함할 수 있고, 이 변형들은 Rnase 활성에 대한 내성을 제공한다. 다른 화학적 변형이 가능하며 본 발명이 속하는 기술 분야의 당업자에게 알려져 있다.

하기의 참조문헌들이 RNAi, 및 RNAi를 이용한 특정한 유전자의 표적화 가능성의 추가적인 요약을 제공한다: Kim & Rossi, Nat. Rev. Genet. 8:173-184 (2007), Chen & Rajewsky, Nat. Rev. Genet. 8: 93-103 (2007), Reynolds, et al., Nat. Biotechnol. 22:326-330 (2004), Chi et al., Proc. Natl. Acad. Sci. USA 100:6343-6346 (2003), Vickers et al., J. Biol. Chem. 278:7108-7118 (2003), Agami, Curr. Opin. Chem. Biol. 6:829-834 (2002), Lavery, et al., Curr. Opin. Drug Discov. Devel. 6:561-569 (2003), Shi, Trends Genet. 19:9-12 (2003), Shuey et al., Drug Discov. Today 7:1040-46 (2002), McManus et al., Nat. Rev. Genet. 3:737-747 (2002), Xia et al., Nat. Biotechnol. 20:1006-10 (2002), Plasterk et al., curr. Opin. Genet. Dev. 10:562-7 (2000), Bosher et al., Nat. Cell Biol. 2:E31-6 (2000), 및 Hunter, Curr. Biol. 9:R440-442 (1999).

갑상선암과 같은 질병의 발병에 대한 증가된 소인(predispotion) 또는 위험도를 초래하는 유전적 결함, 또는 상기 질병을 유발하는 결함이 유전적 결함을 갖는 개체에게 상기 유전적 결함의 부위에 정상/야생형 뉴클레오티드를 공급하는 복구 서열(repair sequence)을 내포하는 핵산 단편을 투여하는 것에 의해 영구적으로 정정될 수 있다. 그와 같은 부위-특이적 복구 서열은 개체의 게놈 DNA의 내재적 복구를 촉진하기 위해 작용하는 RNA/DNA 올리고뉴클레오티드를 포함(concompass)할 수 있다. 복구 서열의 투여는 음이온성 리포좀 내에 캡슐화된, 폴리에틸렌이민과의 복합체, 아데노바이러스 벡터와 같은 바이러스 벡터 또는 투여되는 핵산의 세포내 흡수를 촉진하기에 적합한 다른 약제학적 조성물과 같은, 적합한 비히클에 의해 수행될 수 있다. 그 후, 키메라 올리고뉴클레오티드가 개체의 게놈으로 정상적인 서열의 내포를 유도하여, 정상/야생형 유전자 산물의 발현을 유도하기 때문에, 유전적 결함이 극복될 수 있다. 서열 교체(replacement)가 유전되고, 따라서, 질환 또는 상태와 연관된 증상의 영구적인 치유 및 경감을 가능하게 한다.

본 발명은 갑상선암을 치료하기 위해 이용될 수 있는 화합물 또는 작용제를 확인(식별, identify)하는 방법을 제공한다. 따라서, 본 발명의 변이는 치료제의 확인 및/또는 개발을 위한 표적으로 유용하다. 특정한 구체예에서, 그와 같은 방법은 작용제 또는 화합물이 본 발명의 하나 이상의 변이(마커 및/또는 일배체형)를 포함하는 핵산, 또는 상기 핵산의 코딩된 산물의 활성 및/또는 발현을 조절하는 능력을 분석하는 단계를 포함할 수 있다. 특정한 구체예에서, 상기 화합물 또는 작용제는 FoxE1 유전자의 활성 또는 발현을 조절한다. 상기 작용제 또는 화합물은 코딩된 핵산 산물, 즉, FoxE1 단백질 산물의 활성 또는 발현을 저해 또는 변화시킬 수 있다. 그와 같은 실험을 수행하기 위한 분석법은 당업자에게 공지된 바와 같이, 세포-기반 시스템 또는 세포-불포함 시스템(cell-free system)에서 수행될 수 있다. 세포-기반 시스템은 본래 목적 핵산 분자를 발현하는 세포, 또는 특정한 원하는 핵산 분자를 발현하도록 유전적으로 변형된 재조합 세포를 포함한다.

환자에서 변이 유전자 발현이 변이-함유 핵산 서열의 발현(예를 들면, 하나 이상의 변이를 포함하는 RNA로 전사되고, 뒤이어 단백질로 번역될 수 있는, 본 발명의 하나 이상의 변이를 포함하는 유전자), 또는 정상적인 전사체의 발현 수준 또는 패턴에 영향을 미치는 변이, 예를 들면, 유전자의 조절 또는 제어 영역의 변이에 따른, 정상/야생형 핵산 서열의 변화된 발현에 의해 평가될 수 있다. 유전자 발현에 대한 분석법은 직접적인 핵산 분석법(mRNA), 발현된 단백질 수준에 대한 분석법, 또는 경로, 예를 들면, 신호 경로(signal pathway)에 관여된 부수적(collateral) 화합물의 분석을 포함한다. 또한, 신호 경로에 대응하여 상향-조절 또는 하향-조절되는 유전자의 발현이 분석될 수 있다. 일 구체예는 루시페라아제와 같은 리포터 유전자를 목적 유전자의 조절 영역에 작동가능하게 연결하는 단계를 포함한다.

일 구체예에서, 세포가 후보 화합물 또는 작용제와 접촉되고, mRAN의 발현이 결정되는 경우, 유전자 발현의 조절제(modulator)가 확인될 수 있다. 후보 화합물 또는 작용제의 존재시의 mRNA의 발현 수준이 상기 화합물 또는 작용제의 부재시의 발현 수준에 비교될 수 있다. 이 비교에 근거하여, 갑상선암을 치료하기 위한 후보 화합물 또는 작용제가 변이 유전자의 유전자 발현을 조절하는 화합물 또는 작용제로 확인될 수 있다. mRNA 또는 코딩된 단백질의 발현이 후보 화합물 또는 작용제의 부재시보다 존재 시에 통계적으로 유의성 있게 더 높은 경우, 상기 후보 화합물 또는 작용제는 상기 핵산의 발현의 촉진제 또는 상향-조절제(up-regulator)로 확인된다. 핵산 발현 또는 단백질 수준이 후보 화합물 또는 작용제의 부재시 보다 존재 시에 통계적으로 유의성 있게 더 낮은 경우, 상기 후보 화합물은 상기 핵산의 발현의 저해제 또는 하향-조절제(down-regulator)로 확인된다.

본 발명은 또한 약물(화합물 및/또는 작용제) 스크리닝을 통해 확인된 화합물을 유전자 조절제(즉, 유전자 발현의 촉진제 및/또는 저해제)로 이용한 치료 방법을 제공한다.

치료제에 대한 반응의 확률을 평가하는 방법, 치료의 진행을 모니터링하는 방법 및 갑상선암의 치료 방법

본 발명이 속하는 기술 분야에서 공지된 바와 같이, 개체들은 특정한 치료(예를 들면, 치료제 또는 치료 방법)에 대해 차등적 반응을 가질 수 있다. 약물유전학(Pharmacogenomics)은 유전적 변이(예를 들면, 본 발명의 변이(마커 및/또는 일배체형))가 변화된 약물 소인(drug disposition) 및/또는 약물의 비정상적인 또는 변화된 작용 때문에, 약물 반응에 어떻게 영향을 미치는지의 문제를 다룬다. 따라서, 차등적 반응의 근거(basis)가 부분적으로 유전학적으로 결정될 수 있다. 약물 반응에 영향을 미치는 유전적 변이에 따른 임상적 결과는 일부 개체(본 발명의 유전적 변이의 보인자 또는 비-보인자)에서 약물의 독성, 또는 약물의 치료적 실패(therapeutic failure)를 초래할 수 있다. 따라서, 본 발명의 변이는 치료제 및/또는 방법이 신체에 대해 작용하는 방식, 또는 신체가 치료제를 대사하는 방식을 결정할 수 있다.

따라서, 일 구체예에서, 다형성 부위(예를 들면, rs965513 다형성 마커, 또는 이와 연관 불균형인 마커)에서 특정한 대립인자 또는 일배체형의 존재는 특정한 치료 방식(treatment modality)에 대한 상이한 반응을 나타낸다. 이는 갑상선암으로 진단되고, 본 발명의 다형성 부위에 특정한 대립인자 또는 일배체형(예를 들면, 본 발명의 보호성 대립인자 및/또는 일배체형)을 갖는 환자가 갑상선암을 치료하기 위해 이용된 특정한 치료제, 약물 및/또는 다른 치료법에 대해 보다 유리하게 또는 보다 불리하게 반응할 것이라는 것을 의미한다. 따라서, 상기 마커 대립인자 또는 일배체형의 존재 또는 부재는 환자에 대해 어떤 치료가 이용되어야 하는지를 결정하는데 도움이 될 수 있다. 예를 들면, 새로 진단된 환자의 경우, 본 발명의 마커 또는 일배체형의 존재가 (예를 들면, 본 명세서에 기재된 바와 같이, 혈액 시료로부터 유래된 DNA의 테스트를 통해) 평가될 수 있다. 환자가 마커 대립인자 또는 일배체형에 대해 양성인 경우(즉, 마커의 하나 이상의 특정한 대립인자 또는 일배체형이 존재하는 경우), 의사는 하나의 특정한 치료를 권고하고, 환자가 마커의 상기 하나 이상의 대립인자 또는 일배체형에 대해 음성인 경우, 다른 코스의 치료(즉각적인 치료가 아닌, 질병의 진행에 대한 연속적인 모니터링이 수행될 것을 권고하는 것을 포함할 수 있음)가 권고될 수 있다. 따라서, 환자의 보인자 상태가 특정한 치료 방식이 적용되어야 하는지 여부를 결정하는 것을 보조하기 위해 이용될 수 있다. 그 가치는 질병을 조기에 진단하고, 가장 적합한 치료를 선택하고, 임상의에게 가장 적합한 치료를 적용할 수 있도록 질병의 예후/공격성에 대한 정보를 제공할 수 있다는 가능성에 있다.

치료제에 대한 부분에서 설명된 치료 방법 및 화합물이 그와 같은 방법에서 이용될 수 있다. 즉, 전술되거나 또는 앞서 고려된 화합물 또는 방법을 이용한 갑상선암의 치료는 특정한 구체예에서, 본 명세서에 기재된 다형성 마커 중 하나 이상에 대한 특정한 대립인자의 존재에 대한 스크리닝으로부터 잇점을 얻을 수 있고, 이때, 특정한 대립인자의 존재는 특정한 화합물 또는 방법에 대한 치료 결과를 예측한다.

특정한 구체예에서, 갑상선암의 치료를 위한 치료제(약물)이 본 명세서에 기재된 다형성 마커(예를 들면, rs965513, 또는 이와 연관 불균형인 마커들)에서 대립인자 상태를 결정하기 위한 키트와 함께 제공된다. 개인이 테스트된 특정한 대립인자 또는 복수 개의 대립인자에 대해 양성인 경우, 상기 개인은 상기 대립인자의 비-보인자보다 상기 특정 화합물로부터 잇점을 얻을 가능성이 더 높다. 특정한 다른 구체예에서, 특정한 화합물의 치료 결과를 예측하는 하나 이상의 다형성 마커에 관한 유전형 정보가 미리 결정되고 데이터베이스, 참조표, 또는 기타 적합한 수단에 저장되고, 예를 들면, 당업자에게 알려진 통상적인 데이터 조회(data query) 방법에 의해 데이터베이스 또는 참조표로부터 접근될 수 있다. 특정한 개인이 갑상선암의 치료를 위한 특정한 화합물 또는 약물의 양성 치료 결과를 예측하는 대립인자를 포함하는 경우, 상기 개인은 상기 특정한 화합물의 투여로부터 잇점을 얻을 것이다.

본 발명은 또한 갑상선암에 대한 치료의 진행 또는 효과를 모니터링하는 방법에 관한 것이다. 이는 본 발명의 마커 및 일배체형의 유전형 및/또는 일배체형 상태에 근거하여 수행되며, 즉, 본 명세서에 개시된 하나 이상의 다형성 마커의 하나 이상의 대립인자의 부재 또는 존재를 평가하거나, 또는 본 발명의 변이(마커 및 일배체형)와 연관된 유전자의 발현을 모니터링하는 것에 의해 수행될 수 있다. 조직 시료(예를 들면, 말초 혈액 시료, 또는 생검 시료)에서 위험 유전자 mRNA 또는 코딩된 폴리펩티드가 측정될 수 있다. 따라서, 치료 효과를 모니터링하기 위해 발현 수준 및/또는 mRNA 수준이 치료 전 및 치료 동안 측정될 수 있다. 대안적으로 또는 동시에, 치료 효과를 모니터링하기 위해 본 명세서에 개시된 갑상선암에 대한 하나 이상의 위험 변이의 유전형 및/또는 일배체형 상태가 치료 전 및 치료 동안 측정될 수 있다.

대안적으로, 본 발명의 마커 및 일배체형과 관련된 생물학적 네트워크 또는 대사 경로는 mRNA 및/또는 폴리펩티드 수준을 결정하는 것에 의해 모니터링될 수 있다. 이는 예를 들면, 치료 전과 치료 동안 채취된 시료에서, 상기 네트워크 및/또는 경로에 속하는 여러 유전자들의 발현 수준 또는 폴리펩티드를 모니터링하는 것에 의해 수행될 수 있다. 대안적으로, 상기 생물학적 네트워크 또는 대사 경로에 속하는 대사산물이 치료 전 및 치료 동안 결정될 수 있다. 치료의 효과는 건강한 개체로부터의 상응하는 데이터 대비, 치료 동안 발현 수준/대사산물 수준의 관찰된 변화를 비교하는 것에 의해 결정된다.

또 다른 양태에서, 본 발명의 마커는 임상 시험의 검정력(power) 및 효과를 증가시키기 위해 이용될 수 있다. 따라서, 본 발명의 위험 변이의 보인자인 개체가 특정한 치료 방식(treatment modality)에 반응할 가능성이 더 높을 수 있다. 일 구체예에서, 특정한 치료(예를 들면, 소형 분자 약물)가 표적화하는 경로 및/또는 대사 네트워크 내의 유전자에 대한 위험 변이를 갖는 개체는 상기 치료에 대해 반응을 보일 가능성이 더 높다. 또 다른 구체예에서, 그 발현 및/또는 기능이 위험 변이에 의해 변화되는 것인 유전자에 대한 위험 변이를 갖는 개체는 상기 유전자, 그의 발현 또는 그의 유전자 산물을 표적화하는 치료 방식에 반응할 가능성이 더 높다. 이 적용은 임상 시험의 안전성을 개선할 수 있으나, 임상 시험이 집단의 일부 서브-그룹에 한정될 수 있는, 통계적으로 유의성 있는 효능을 보일 가능성을 증가시킬 수 있다. 따라서, 그와 같은 시험의 하나의 가능한 결과는 특정한 유전적 변이, 예를 들면, 본 발명의 마커 및 일배체형의 보인자가 치료제에 대한 양성 반응을 보이고, 즉, 처방된 치료제 또는 약물을 복용했을 때, 갑상선암과 연관된 증상의 경감을 경험할, 통계적으로 유의성 있는 가능성을 갖는다는 것이다.

또 다른 양태에서, 본 발명의 마커 및 일배체형은 특정한 개인을 위한 약제학적 작용제의 선택을 표적화하기 위해 이용될 수 있다. 치료 방식의 맞춤화된 선택(personalized seleciton), 생활방식 변화 또는 치료 방식의 맞춤화된 선택과 생활방식 변화의 조합이 본 발명의 위험 변이의 이용에 의해 실현될 수 있다. 따라서, 본 발명의 특정한 마커에 대한 개체의 상태의 지식은 본 발명의 위험 변이에 의해 영향받은 유전자 또는 유전자 산물을 표적화하는 치료 옵션의 선택을 위해 유용할 수 있다. 변이의 특정한 조합이 하나의 치료 옵션의 선택을 위해 적합할 수 있고, 다른 유전자 변이 조합은 다른 치료 옵션을 표적화할 수 있다. 그와 같은 변이의 조합은 임상적으로 신뢰성있는 정확도로 치료 모듈의 선택을 결정하기 위해 필요한 경우, 하나의 변이, 두개의 변이, 세개의 변이, 또는 네개 또는 그 이상의 변이를 포함할 수 있다.

컴퓨터-구현 양태(Computer-implemented aspect)

본 발명이 속하는 기술 분야의 당업자에 의해 이해되는 바와 같이, 본 명세서에 기재된 방법 및 정보는 공지된 컴퓨터 판독가능한 매체 상에서, 컴퓨터에 의해 실행가능한 프로그램(computer executable instruction)으로서, 전체로 또는 부분적으로 구현될 수 있다. 예를 들면, 본 명세서에 기재된 방법은 하드웨어에서 구현될 수 있다. 대안적으로, 본 발명의 방법은 예를 들면, 하나 이상의 메모리 또는 다른 컴퓨터 판독가능한 매체에 저장되고 하나 이상의 프로세서 상에 구현된 소프트웨어로 구현될 수 있다. 알려진 바와 같이, 프로세서는 하나 이상의 컨트롤러(controller), 연산 유닛(calculation unit) 및/또는 컴퓨터 시스템의 다른 유닛과 결합되거나, 바람직한 펌웨어(firmware)에 이식될 수 있다. 소프트웨어에 이식되는 경우, 루틴(routine)은 알려진 바와 같이, RAM, ROM, 플래쉬 메모리, 자기 디스크, 레이저 디스크, 또는 기타 저장 매체와 같은 컴퓨터 판독가능한 메모리에 저장될 수 있다. 마찬가지로, 이 소프트웨어는 예를 들면, 전화선, 인터넷, 무선 접속 등과 같은 통신 채널 상에서, 또는 컴퓨터 판독가능한 디스크, 플래쉬 드라이브, 등과 같은, 휴대용 매체(transportable medium)를 통한 것을 포함한, 공지된 전달 방법을 통해 컴퓨터 장치에 전달될 수 있다.

보다 일반적으로, 및 본 발명이 속하는 기술 분야의 당업자에 의해 이해되는 바와 같이, 전술된 다양한 단계들이 다양한 블록, 작업(operation), 툴, 모듈, 및 하드웨어, 펌웨어, 소프트웨어, 또는 하드웨어, 펌웨어 및/또는 소프트웨어의 조합에서 구현될 수 있는 기법으로서 구현될 수 있다. 하드웨어에서 구현되는 경우, 블록, 작업, 기법 등의 일부 또는 전부가 예를 들면, 맞춤화 집적 회로(custom IC), ASIC(application specific integrated circuit), FPGA(field programmable logic array), PLA(programmable logic array) 등에서 구현될 수 있다.

소프트웨어에서 구현되는 경우, 소프트웨어는 자기 디스크, 광 디스크, 또는 다른 저장 매체와 같은 공지된 컴퓨터 판독가능한 매체, 컴퓨터의 RAM, 또는 ROM 또는 플래쉬 메모리, 프로세서, 하드 디스크 드라이브, 광 디스크 드라이브, 테이프 드라이브 등에 저장될 수 있다. 마찬가지로, 소프트웨어는 예를 들면, 컴퓨터 판독가능한 디스크 또는 다른 휴대용 컴퓨터 저장 메카니즘을 포함한 공지된 전달 방법을 통해 사용자 또는 컴퓨터 시스템에 전달될 수 있다.

도 1은 청구된 방법 및 장치의 단계를 위한 시스템이 구현될 수 있는 적합한 컴퓨팅 시스템 환경(100)의 예를 보여준다. 컴퓨팅 시스템 환경(100)은 적합한 컴퓨팅 환경의 하나의 예에 불과하며 청구항의 방법 또는 장치의 용도 또는 기능성(functionality)의 범위에 대한 한정으로 의도되지 않는다. 컴퓨팅 환경(100)도 대표적인 운영 환경(100)에 예시된 성분들 중 하나 또는 이들의 조합과 관련된 의존이나 요건을 갖는 것으로 해석되어서는 안 된다.

청구된 방법 및 시스템의 단계는 다수의 다른 범용(general purpose) 또는 특수 목적 컴퓨팅 시스템 환경 또는 구조로 운영된다. 청구항의 방법 또는 시스템과 사용하기에 적합할 수 있는 공지된 컴퓨팅 시스템, 환경, 및/또는 구조의 예는 퍼스널 컴퓨터, 서버 컴퓨터, 휴대용 또는 랩탑(laptop) 장치, 멀티프로세서 시스템, 마이크로프로세서-기반 시스템, 셋탑 박스, 프로그램가능한(programmable) 가전(consumer electronics), 네트워크 PC, 미니컴퓨터, 메인프레임 컴퓨터, 전술된 시스템 또는 장치를 포함하는 분산 컴퓨팅(distributed computing) 환경 등을 포함하나, 이에 한정되지 않는다.

청구된 방법 및 시스템의 단계들은 컴퓨터에 의해 실행되는 프로그램 모듈과 같은, 컴퓨터-실행가능한 프로그램(computer-executable instruction)의 일반적 배경에서 설명될 수 있다. 일반적으로, 프로그램 모듈은 특정한 작업(task)을 수행하거나 또는 특정한 추상 데이터형(abstract data type)을 구현하는, 루틴(routine), 프로그램(program), 객체(object), 구성요소(component), 데이터 구조 등을 포함한다. 본 발명의 방법 및 장치들은 또한 작업이 통신 네트워크를 통해 연결된 원격 처리 장치들에 의해 수행되는 것인 분산 컴퓨팅 환경에서 실시될 수 있다. 통합 컴퓨팅 환경 및 분산 컴퓨팅 환경 모두에서, 프로그램 모듈은 메모리 저장 장치를 포함한, 로컬 및 원격 컴퓨터 저장 매체에 위치될 수 있다.

도 1을 참조하면, 청구된 방법 및 시스템의 단계들을 구현하는 대표적 시스템은 컴퓨터(110)의 형태인 범용 컴퓨팅 장치를 포함한다. 컴퓨터(110)의 구성요소들은 프로세싱 유닛(processing unit)(120), 시스템 메모리(130), 및 상기 시스템 메모리를 포함한 다양한 시스템 구성요소들 프로세싱 유닛(120)에 연결시키는 시스템 버스(121)를 포함하나, 이에 한정되지 않는다. 시스템 버스(121)는 다양한 버스 아키텍쳐를 이용한, 메모리 버스 또는 메모리 컨트롤러(memory controller), 주변장치 버스(peripheral bus) 및 로컬 버스를 포함한 여러 종류의 버스 구조 중 하나일 수 있다. 한정이 아닌 예로서, 그와 같은 아키텍쳐는 ISA(Industry Standard Architecture) 버스, MCA(Micro Channel Architecture) 버스, EISA(Enhanced ISA) 버스, VESA(Video Electronics Standards Association) 로컬 버스, 및 메자닌(Mexxanine) 버스로도 알려진, PCI(Peripheral Component Interconnect) 버스를 포함한다.

컴퓨터(110)는 통상적으로 다양한 컴퓨터 판독가능한 매체를 포함한다. 컴퓨터 판독가능한 매체는 컴퓨터(110)에 의해 접근될 수 있는 이용가능한 매체일 수 있고 휘발성 매체 및 비휘발성 매체, 이동성(removable) 매체 및 비이동성 매체를 포함한다. 한정이 아닌, 예로서, 컴퓨터 판독가능한 매체는 컴퓨터 저장 매체 및 통신 매체(communication media)를 포함할 수 있다. 컴퓨터 저장 매체는 컴퓨터 판독가능한 명령어, 데이터 구조, 프로그램 모듈 또는 기타 데이터와 같은 정보의 저장을 위한 방법 또는 기술에서 구현된, 휘발성 및 비휘발성, 이동성 및 비이동성 매체를 포함한다. 컴퓨터 저장 매체는 RAM, ROM, EEPROM, 플래쉬 메모리 또는 기타 메모리 기술, CD-ROM, DVD(digital versatile disk) 또는 기타 광학적 디스크 저장, 자기 카세트(magnetic cassette), 자기 테이프, 자기 디스크 저장 또는 기타 자기 저장 장치, 또는 원하는 정보를 저장하기 위해 이용될 수 있고 컴퓨터(110)에 의해 접근될 수 있는 기타 매체를 포함하나, 이에 한정되지 않는다. 통신 매체는 통상적으로 컴퓨터 판독가능한 명령어, 데이터 구조, 프로그램 모듈, 또는 반송파(carrier wave)와 같은 모듈화 데이터 신호(modulated data signal) 중 기타 데이터 또는 기타 전송(transport) 메카니즘을 구현하고 정보 전달 매체(information delivery media)를 포함한다. 용어 "모듈화 데이터 신호(modulated data signal)"는 신호에 정보를 코딩하는 방식으로 설정되거나 변경된 하나 이상의 그의 특징을 갖는 신호를 의미한다. 한정이 아닌, 예로서, 통신 매체는 유선 네트워크 또는 직접-유선 연결(direct-wired connection)과 같은 유선 매체, 및 음향(acoustic) 매체, RF, 적외선 및 기타 무선 매체와 같은 무선 매체를 포함한다. 전술된 것들의 조합도 또한 컴퓨터 판독가능한 매체의 범위 내에 포함되어야 한다.

시스템 메모리(130)는 ROM(read only memory)(131) 및 RAM(random access memory)(132)와 같은 휘발성 및/또는 비휘발성 메모리의 형태로 컴퓨터 저장 매체를 포함한다. 스타트-업(start-up) 동안과 같은, 컴퓨터(110) 내의 요소들 간에 정보를 전달할 수 있는 기본 루틴을 포함하는 BIOS(basic input/output system)(133)는 통상적으로 ROM(131)에 저장된다. RAM(132)은 통상적으로 프로세싱 유닛(120)에 의해 즉시 접근가능하고 및/또는 그 위에서 운영되는 데이터 및/또는 프로그램 모듈을 포함한다. 한정이 아닌, 예로서, 도 1은 오퍼레이팅 시스템(134), 애플리케이션 프로그램(135), 기타 프로그램 모듈(136), 및 프로그램 데이터(137)을 예시한다.

컴퓨터(110)는 또한 기타 이동성/비이동성, 휘발성/비휘발성 컴퓨터 저장 매체를 포함할 수 있다. 예로서만, 도 1은 비이동성, 비휘발성 자기 매체로부터 판독하거나 또는 그에 기록하는 하드 디스크 드라이브(140), 이동성, 비휘발성 자기 디스크(152)로부터 판독하거나 또는 그에 기록하는 자기 디스크 드라이브(151), 및 CD ROM 또는 기타 광학 매체와 같은 이동성, 비휘발성 광학 디스크(156)로부터 판독하거나 또는 그에 기록하는 광학 디스크 드라이브(155)를 보여준다. 대표적인 오퍼레이팅 환경에서 사용될 수 있는 기타 이동성/비이동성, 휘발성/비휘발성 컴퓨터 저장 매체는 자기 테이프 카세트, 플래시 메모리 카드, DVD(digital versatile disk), 디지털 비디오 테이프, 고체 상태 RAM, 고체 상태 ROM 등을 포함하나, 이에 한정되지 않는다. 하드 디스크 드라이브(141)는 통상적으로 인터페이스(140)과 같은 비이동성 메모리 인터페이스를 통해 시스템 버스(121)에 연결되고, 자기 디스크 드라이브(151)와 광학 디스크 드라이브(155)는 통상적으로 인터페이스(150)와 같은 이동성 메모리 인터페이스에 의해 시스템 버스(121)에 연결된다.

앞서 검토되고 도 1에 예시된 드라이브 및 그와 결합된 컴퓨터 저장 매체는 컴퓨터(110)를 위한 컴퓨터 판독가능한 명령어(computer readable instructions), 데이터 구조, 프로그램 모듈 및 기타 데이터를 제공한다. 도 1에서, 예를 들면, 하드 디스크 드라이브(141)는 저장 오퍼레이팅 시스템(144), 애플리케이션 프로그램(145), 기타 프로그램 모듈(146), 및 프로그램 데이터(147)로 예시된다. 이 구성요소들은 오퍼레이팅 시스템(134), 애플리케이션 프로그램(135), 기타 프로그램 모듈(136), 및 프로그램 데이터(137)과 동일하거나 상이할 수 있다는 것에 유의한다. 오퍼레이팅 시스템(144), 애플리케이션 프로그램(145), 기타 프로그램 모듈(146), 및 프로그램 데이터(147)는 최소한 그들이 상이한 카피라는 것을 예시하기 위해 상이한 번호가 부여된다. 사용자는 키보드(162) 및 통상적으로 마우스, 트랙볼(trackball) 또는 터치 패드(touch pad)로 지칭되는 포인팅 장치(161)와 같은 입력 장치를 통해 컴퓨터(20)에 명령어 및 정보를 입력할 수 있다. 기타 입력 장치(표시되지 않음)는 마이크로폰, 조이스틱(joystick), 게임 패드(game pad), 위성 접시, 스캐너, 등을 포함할 수 있다. 이들 및 기타 입력 장치는 종종 시스템 버스에 커플링된 사용자 입력 인터페이스(160)를 통해 프로세싱 유닛(120)에 연결되나, 병렬 포트(parallel port), 게임 포트 또는 USB(universal serial bus)와 같은 기타 인터페이스 및 버스 구조에 의해 연결될 수 있다. 모니터(191) 또는 다른 종류의 디스플레이 장치도 비디오 인터페이스(190)와 같은 인터페이스를 통해 시스템 버스(121)에 연결된다. 모니터 외에, 컴퓨터는 또한 출력 주변장치 인터페이스(190)를 통해 연결될 수 있는, 스피커(197) 및 프린터(196)와 같은 기타 주변 출력 장치를 포함할 수 있다.

컴퓨터(110)는 원격 컴퓨터(180)와 같은 하나 이상의 원격 컴퓨터로의 로지컬 연결(logical connection)을 통해 네트워크 환경에서 운영될 수 있다. 원격 컴퓨터(180)는 퍼스널 컴퓨터, 서버, 라우터(router), 네트워크 PC, 피어 장치(peer device) 또는 기타 공통 네트워크 노드(common network node)일 수 있고, 도 1에 메모리 저장 장치(181)만이 예시되었으나, 통상적으로 컴퓨터(110)과 관련된 전술된 다수의 요소들 또는 모든 요소들을 포함한다. 도 1에 도시된 로지컬 연결은 LAN(local area network)(171) 및 WAN(wide area network)(173)을 포함하나, 또한 다른 네트워크를 포함할 수 있다. 그와 같은 네트워킹 환경은 사무실, 전사적 컴퓨터 네트워크(enterprise-wide computer network), 인트라넷 및 인터넷에서 흔하다.

LAN 네트워킹 환경에서 이용되는 경우, 컴퓨터(110)는 네트워크 인터페이스 또는 어댑터(170)를 통해 LAN(171)에 연결된다. WAN 네트워킹 환경에서 이용되는 경우, 컴퓨터(110)는 통상적으로 모뎀(172) 또는 인터넷과 같은 WAN(173)을 통한 통신(communications)을 구축하기 위한 다른 수단을 포함한다. 내장형이거나 외장형일 수 있는 모뎀(172)은 사용자 입력 인터페이스(160), 또는 다른 적합한 메카니즘을 통해, 시스템 버스(121)에 연결될 수 있다. 네트워크 환경에서, 컴퓨터(110), 또는 그의 일부에 대해 도시된 프로그램 모듈은 원격 메모리 저장 장치에 저장될 수 있다. 한정이 아닌, 예로서, 도 1은 메모리 장치(181)에 존재하는 원격 애플리케이션 프로그램(185)을 예시한다. 표시된 네트워크 연결은 예시적이고 컴퓨터 간의 통신 연결을 수립하기 위한 다른 수단이 이용될 수 있다.

앞의 본문은 본 발명의 다수의 상이한 구체예의 상세한 설명을 제시하나, 본 발명의 범위는 본 특허의 말미에 제시된 청구항의 기재에 의해 한정되는 것으로 이해되어야 한다. 상세한 설명은 예시인 것으로만 해석되며 모든 가능한 구체예를 기재하는 것은 불가능하지는 않으나, 비현실적이기 때문에, 본 발명의 모든 가능한 구체예를 설명하지 않는 것으로 해석된다. 다수의 대안적인 구체예가 현재의 기술 및 본 특허의 출원일 후에 개발된 기술을 이용하여 구현될 수 있고, 이들은 여전히 본 발명을 한정하는 청구항의 범위 내에 속할 것이다.

위험도 평가 시스템, 방법 및 요소가 바람직하게는 소프트웨어에서 구현되는 것으로 기재되었으나, 이들은 하드웨어, 펌웨어(firmware) 등에서 구현될 수 있고, 다른 프로세서에 의해 구현될 수 있다. 따라서, 본 명세서에 기재된 요소들은 표준 다목적(multi-purpose) CPU에서, 또는 도 1의 컴퓨터(110)를 포함하나, 이에 한정되지 않는, ASIC(application-specific integrated circuit) 또는 다른 하드-와이어드 장치(hard-wired device)와 같은 특수하게 설계된 하드웨어 또는 펌웨어 상에서 구현될 수 있다. 소프트웨어에서 구현되는 경우, 소프트웨어 루틴은 자기 디스크, 레이저 디스크, 또는 기타 저장 매체와 같은 컴퓨터 판독가능한 메모리, 컴퓨터 또는 프로세서의 RAM 또는 ROM, 데이터베이스 등에 저장될 수 있다. 마찬가지로, 이 소프트웨어는 예를 들면, 컴퓨터 판독가능한 디스크 또는 기타 이동성 컴퓨터 저장 메카니즘 상에, 또는 전화선, 인터넷, 무선 통신 등과 같은 통신 채널을 포함한, 공지되거나 또는 바람직한 전달 방법을 통해 사용자 또는 진단 시스템에 전달될 수 있다(이동성 저장 매체(transportable storage medium)를 통한 그와 같은 소프트웨어의 제공과 동일하거나 호환가능한 것으로 볼 수 있음).

따라서, 다수의 수정 및 변형이 본 발명의 원리(spirit) 및 범위를 벗어나지 않으면서 본 명세서에서 설명되고 예시된 기법과 구조에서 이루어질 수 있다. 따라서, 본 명세서에 기재된 방법 및 장치는 예시적인 것에 불과하고 본 발명의 범위를 한정하지 않는 것으로 이해되어야 한다.

따라서, 본 발명은 또한 본 명세서에서 기재된 다형성 마커 및 일배체형, 및 그로부터 유래된 유전형 및/또는 질병-연관 데이터의 컴퓨터-구현 응용(computer-implemented applicatoin)에 관한 것이다. 그와 같은 응용은 본 발명의 방법에서 유용한 유전형 데이터를 저장, 처리(manipulate)하거나 또는 분석하기 위해 유용할 수 있다. 일 실시예는 제3자(예를 들면, 개인, 상기 개인의 후견인, 의료 서비스 제공자 또는 유전자 분석 서비스 제공자)에게 유전형 정보를 제공할 수 있도록 하기 위해, 개인으로부터 유래된 유전형 정보를 판독가능한 매체 상에 저장하는 것, 또는 예를 들면, 유전형 데이터를 암의 증가된 감수성에 기여하는 유전적 위험 인자에 관한 정보를 비교하고, 그와 같은 비교에 기반한 결과를 보고하는 것에 의해, 유전형 데이터로부터 정보를 도출하는 것에 관한 것이다.

일반적으로, 컴퓨터-판독가능한 매체는 (i) 본 명세서에 기재된 바와 같은, 하나 이상의 다형성 마커 또는 일배체형에 대한 식별자(identifier) 정보; (ii) 갑상선암을 갖는 개체에서, 상기 하나 이상의 마커의 하나 이상의 대립인자의 빈도, 또는 일배체형의 빈도의 지표(indicator); 및 기준 집단(reference population)에서 상기 하나 이상의 마커의 하나 이상의 대립인자의 빈도, 또는 일배체형의 빈도의 지표를 저장하는 능력을 갖는다. 기준 집단은 질병-불포함(disease-free) 개인의 집단일 수 있다. 대안적으로, 기준 집단은 전체 집단으로부터의 랜덤 표본이고, 따라서, 전반적으로 상기 집단을 대표한다. 빈도 지표는 계산된 빈도, 대립인자 및/또는 일배체형 카피의 계수(count), 또는 특정한 매체를 위해 적합한 실제 빈도의 정규화된(normalized) 또는 달리 처리된(manipulated) 값일 수 있다.

특정한 구체예에서, 본 명세서에서 갑상선암의 증가된 감수성(예를 들면, 증가된 위험도)과 연관된 것으로 기재된 마커들 및 일배체형들은 유전형 데이터의 해석 및/또는 분석을 위해 유용하다. 따라서, 특정한 구체예에서, 본 명세서에서 입증된 바와 같은, 갑상선암에 대한 위험 대립인자, 또는 본 명세서에서 갑상선암과 연관된 것으로 확인된 마커들 중 하나와 LD인 다형성 마커의 대립인자의 확인(식별)은 해당 유전형 데이터가 기원한 개체가 갑상선암의 증가된 위험도를 갖는다는 것을 나타낸다. 하나의 그와 같은 구체예에서, 유전형 데이터는 본 명세서에서 갑상선암과 연관된 것으로 확인된 하나 이상의 다형성 마커, 또는 이들과 연관 불균형인 마커에 대해 생성된다. 유전형 데이터는 뒤이어 질병에 대한 위험도 척도의 형태(예를 들면, 절대적 위험도(AR), 위험도 비(risk ratio, RR), 또는 오즈비(odds ratio, OR))인 유전형 데이터의 해석과 함께, 해당 데이터가 기원한 개인, 그의 후견인 또는 대리인, 의사, 또는 의료인, 유전학 카운셀러 또는 보험업자와 같은 제3자에게 예를 들면, 인터넷을 통해 접근가능한 사용자 인터페이스를 통해 이용가능하다. 또 다른 구체예에서, 개인으로부터 유래된 유전형 데이터세트에서 확인된 위험 마커가 평가되고 상기 데이터세트에서 그와 같은 위험 변이의 존재에 의해 부여된 위험도의 평가로부터의 결과가, 예를 들면, 안전한 웹 인터페이스를 통해, 또는 다른 통신 수단에 의해 상기 개인에게 이용가능하게 될 수 있다. 그와 같은 위험도 평가의 결과가 수치 형태(예를 들면, 절대적 위험도, 상대적 위험도 및/또는 오즈비와 같은 위험도 값, 또는 기준 대비 위험도의 백분율 증가), 그래프 수단에 의해, 또는 해당 유전형 데이터가 유래된 개체에 대한 위험도를 보여주기에 적합한 다른 수단에 의해 보고될 수 있다.

핵산 및 폴리펩티드

본 명세서에 기재된 핵산 및 폴리펩티드는 본 발명의 방법 및 키트에서 이용될 수 있다. 본 명세서에서 사용된, "단리된(isolated)" 핵산 분자는 (게놈 서열에서와 같이) 정상적으로 유전자 또는 뉴클레오티드 서열을 둘러싸는(flank) 핵산으로부터 분리되고 및/또는 (예를 들면, RNA 라이브러리에서와 같이) 다른 전사된 서열들로부터 완전하게 또는 부분적으로 정제된 핵산이다. 예를 들면, 본 발명의 단리된 핵산은 핵산이 원래 존재하는 복잡한 세포 매질(cellular milieu), 또는 재조합 기법에 의해 생성되는 경우 배양 배지, 또는 화학적으로 합성되는 경우, 화학적 전구체 또는 다른 화학물질들에 대해 실질적으로 분리될 수 있다. 일부 경우에, 단리된 물질은 조성(예를 들면, 다른 물질을 포함하는 조 추출물), 완충 시스템 또는 시약 혼합물(reagent mix)의 부분을 형성할 것이다. 다른 상황들에서, 상기 물질은 예를 들면, 폴리아크릴아미드 겔 전기영동(PAGE) 또는 컬럼 크로마토그래피(예를 들면, HPLC)에 의해 결정되는 바와 같이, 필수적인 균질성(essential homogeneity)까지 정제될 수 있다. 본 발명의 단리된 핵산 분자는 존재하는 모든 거대분자 종의 약 50% 이상, 약 80% 이상, 또는 약 90% 이상(몰 기준)을 구성할 수 있다. 게놈 DNA에 대해, 용어 "단리된(isolated)"은 또한 본래 게놈 DNA가 결합되어 있는 염색체로부터 단리된 핵산 분자를 의미한다. 예를 들면, 단리된 핵산 분자는 핵산 분자가 유래된 세포의 게놈 DNA에서 상기 핵산 분자를 플랭킹(flank)하는 뉴클레오티드의 약 250 kb, 200 kb, 150 kb, 100 kb, 75 kb, 50 kb, 25 kb, 10 kb, 5 kb, 4 kb, 3 kb, 2 kb, 1 kb, 0.5 kb 또는 0.1 kb 미만을 포함할 수 있다.

핵산 분자는 다른 코딩 서열 또는 조절 서열에 융합될 수 있고, 여전히 단리된 것으로 고려될 수 있다. 따라서, 벡터 내에 포함된 재조합 DNA는 본 명세서에서 사용된 "단리된"의 정의에 포함된다. 또한, 단리된 핵산 분자는 이종(heterologous) 숙주 세포 또는 이종 개체 내의 재조합 DNA 분자, 및 용액 중의 부분적으로 또는 실질적으로 정제된 DNA 분자를 포함한다. "단리된" 핵산 분자는 또한 본 발명의 DNA 분자의 인 비보 및 인 비트로 RNA 전사체를 포함한다. 단리된 핵산 분자 또는 뉴클레오티드 서열은 화학적으로 합성되거나 또는 재조합 수단에 의해 생산된 핵산 분자 또는 뉴클레오티드 서열을 포함할 수 있다. 그와 같은 단리된 뉴클레오티드 서열이 예를 들면, 코딩된 폴리펩티드의 제조에서, 상동성 서열(예를 들면, 다른 포유동물 종으로부터)의 단리를 위해, 유전자 맵핑을 위해(예를 들면, 염색체와의 인 시투 혼성화에 의해), 또는 예를 들면, 노던 블롯 분석 또는 기타 혼성화 기법과 같은 조직 (예를 들면, 인간 조직) 중의 유전자의 발현을 검출하기 위해, 프로브로서 유용하다.

본 발명은 또한 높은 엄격성(stringency)의 혼성화 조건, 예를 들면, 선택적 혼성화를 위한 조건 하에, 본 명세서에 기재된 뉴클레오티드 서열에 혼성화되는 핵산 분자(예를 들면, 본 명세서에 기재된 마커 또는 일배체형과 연관된 다형성 부위를 포함하는 뉴클레오티드 서열에 특이적으로 혼성화하는 핵산 분자)에 관한 것이다. 그와 같은 핵산 분자는 대립인자-특이적 혼성화 또는 서열-특이적 혼성화(예를 들면, 높은 엄격성(stringency) 조건 하에)에 의해 검출 및/또는 분리될 수 있다. 핵산 혼성화를 위한 엄격성 조건 및 방법은 본 발명이 속하는 기술 분야의 당업자에게 잘 알려져 있다(예를 들면, 전체 교시에 참조에 의해 본 명세서에 포함된 Current Protocols in Molecular Biology, Ausubel, F. et al, John Wiley & Sons, (1998), 및 Kraus, M. and Aaronson, S., Methods Enzymol., 200:546-556 (1991) 참조).

두 개의 뉴클레오티드 서열 또는 아미노산 서열 간의 퍼센트 동일성(percent identity)은 최적의 비교 목적을 위해 서열들을 정렬시키는 것에 의해(예를 들면, 제1 서열의 서열에 갭이 도입될 수 있음) 결정될 수 있다. 상응하는 위치의 뉴클레오티드 또는 아미노산이 비교되고, 두 서열 간의 퍼센트 동일성은 상기 서열들 간에 공유된 동일한 위치의 갯수의 함수이다(즉, % 동일성 = 동일한 위치의 갯수(#)/위치의 총 갯수(#) x 100). 특정한 구체예에서, 비교 목적을 위해 정렬된 서열의 길이는 기준 서열의 길이의 30% 이상, 40% 이상, 50% 이상, 60% 이상, 70% 이상, 80% 이상, 90% 이상, 또는 95% 이상이다. 두 서열의 실제적인 비교는 잘 알려진 방법, 예를 들면, 수학적 알고리즘을 이용한 방법에 의해 달성될 수 있다. 그와 같은 수학적 알고리즘의 비-한정적인 예가 Karlin, S. and Altschul, S., Proc. Natl. Acad. Sci. USA, 90:5873-5877 (1993)에 기재된다. 그와 같은 알고리즘이 Altschul, S. et al., Nucleic Acids Res., 25:3389-3402 (1997)에 기재된 바와 같이, NBLAST 및 XBLAST 프로그램(버전 2.0)에 구현된다. BLAST 및 Gapped BLAST 프로그램을 이용하는 경우, 개별적인 프로그램(예를 들면, NBLAST)의 디폴트 파라미터가 이용될 수 있다. ncbi.nlm.nih.gov에서 월드 와이드 웹의 웹사이트를 참조한다. 일 구체예에서, 서열 비교를 위한 파라미터는 score=100, wordlength=12로 설정되거나, 또는 변할 수 있다(예를 들면, W=5 또는 W=20). 알고리즘의 또 다른 예는 BLAT (Kent, W.J. Genome Res. 12:656-64 (2002))이다.

다른 예는 Myers and Miller, CABIOS (1989), Torellis, A. and Robotti, C., Comput. Appl. Biosci. 10:3-5 (1994)에 기재된 ADVANCE and ADAM; 및 Pearson, W. and Lipman, D., Proc. Natl. Acad. Sci. USA, 85:2444-48 (1988)에 기재된 FASTA 알고리즘을 포함한다.

또 다른 구체예에서, 두 개의 아미노산 서열간의 퍼센트 동일성(percent identity)은 GCG 소프트웨어 패키지 (Accelrys, Cambridge, UK) 중의 GAP 프로그램을 이용하여 수득될 수 있다.

본 발명은 또한 높은 엄격성 조건(highly stringent condition) 하에 서열번호 1 내지 229 중 하나의 뉴클레오티드 서열, 서열번호 1 내지 229 중 하나의 뉴클레오티드 서열의 상보체를 포함하거나, 이로 구성된 뉴클레오티드 서열을 포함하거나 또는 이들로 구성된 핵산에 혼성화하는 단편 또는 부분을 포함하는 단리된 핵산 분자로서, 상기 뉴클레오티드 서열은 본 명세서에 기재된 마커 및 일배체형에 포함된 하나 이상의 다형성 대립인자를 포함하는 것인 단리된 핵산 분자를 제공한다. 본 발명의 핵산 단편은 약 15개 이상, 약 18개 이상, 20개, 23개 또는 25개 이상의 뉴클레오티드로 구성된 길이이고, 30개, 40개, 50개, 100개, 200개, 500개, 1000개, 10,000개 또는 그 이상의 뉴클레오티드로 구성된 길이일 수 있다.

본 발명의 핵산 단편은 본 명세서에 기재된 바와 같은 분석법에서 프로브 또는 프라이머로서 이용된다. "프로브(probe)" 또는 "프라이머(primer)"는 핵산 분자의 상보적 가닥에 염기-특이적 방식으로 혼성화하는 올리고뉴클레오티드이다. DNA 및 RNA 외에, 그와 같은 프로브 및 프라이머는 Nielsen, P. et al., Science 254:1497-1500 (1991)에 기재된 바와 같은 PNA(polypeptide nucleic acid)를 포함한다. 프로브 또는 프라이머는 핵산 분자의 약 15개 이상, 일반적으로 약 20개 내지 25개, 및 일부 구체예에서, 약 40개, 50개 또는 75개의 연속된 뉴클레오티드로 구성된 부분에 혼성화하는 뉴클레오티드 서열의 영역을 포함한다. 일 구체예에서, 프로브 또는 프라이머는 본 명세서에 기재된 하나 이상의 다형성 마커의 하나 이상의 대립인자 또는 하나 이상의 일배체형, 또는 그의 상보체(complement)를 포함한다. 특정한 구체예에서, 프로브 또는 프라이머는 100개 또는 그 미만의 뉴클레오티드를 포함할 수 있고, 예를 들면, 특정한 구체예에서, 6개 내지 50개의 뉴클레오티드, 또는 예를 들면, 12개 내지 30개의 뉴클레오티드를 포함할 수 있다. 다른 구체예에서, 프로브 또는 프라이머는 연속적인 뉴클레오티드 서열 또는 상기 연속적인 뉴클레오티드 서열의 상보체에 70% 이상, 80% 이상, 85% 이상, 90% 이상, 또는 95% 이상 동일하다. 또 다른 구체예에서, 프로브 또는 프라이머는 연속적인 뉴클레오티드 서열 또는 상기 연속적인 뉴클레오티드 서열의 상보체에 선택적으로 혼성화될 수 있다. 종종, 프로브 또는 프라이머는 표지, 예를 들면, 방사성동위원소, 형광 표지, 효소 표지, 효소 보조-인자 표지, 자성 표지(magnetic label), 스핀 표지, 에피토프 표지를 더 포함한다.

전술된 바와 같은 본 발명의 핵산 분자는 본 발명이 속하는 기술 분야의 당업자에게 잘 알려진 표준 분자생물학 기법을 이용하여 확인되고 단리될 수 있다. 증폭된 DNA는 표지되고(예를 들면, 방사성 표지되고), 인간 세포로부터 유래된 cDNA 라이브러리를 스크리닝하기 위한 프로브로서 이용될 수 있다. 상기 cDNA는 mRNA로부터 유래되고 적합한 벡터에 담길 수 있다. 상응하는 클론들이 단리되고, 인 비보 절제(in vivo excision) 후에 DNA가 수득되고, 적합한 분자량의 폴리펩티드를 코딩하는 올바른 해독 프레임을 확인하기 위해 본 발명이 속하는 기술 분야에서 인정되는 방법에 의해 클로닝된 삽입물이 한 방향으로 또는 양 방향으로 서열분석될 수 있다. 이 방법들 또는 유사한 방법들을 이용하여, 폴리펩티드 및 상기 폴리펩티드를 코딩하는 DNA가 단리되고, 서열결정되고, 그 특성이 더 규명될 수 있다.

항체

본 발명은 또한 변이 대립인자에 의해 코딩된 변이 아미노산 서열(예를 들면, 아미노산 치환 포함) 또는 상응하는 비-변이 또는 야생형 대립인자에 의해 코딩된 기준 아미노산 서열을 포함하는 에피토프에 결합하는 항체를 제공한다. 본 명세서에서 사용된 용어 "항체(antibody)"는 면역글로불린 분자 및 면역글로불린 분자의 면역학적으로 활성인 부분, 즉, 항원에 특이적으로 결합하는 항원-결합 부위를 포함하는 분자를 의미한다. 본 발명의 폴리펩티드에 특이적으로 결합하는 분자는 폴리펩티드 또는 그의 단편에 결합하나, 자연적으로 상기 폴리펩티드를 포함하는 시료, 예를 들면, 생물학적 시료 중의 다른 분자에는 실질적으로 결합하지 않는 분자이다. 면역글로불린 분자의 면역학적 활성 부분의 예는 펩신과 같은 효소에 의해 항체를 처리하는 것에 의해 생성될 수 있는 F(ab) 및 F(ab')₂ 단편을 포함한다. 본 발명은 본 발명의 폴리펩티드에 결합하는 다중클론 항체 및 단일클론 항체를 제공한다. 본 명세서에서 사용된, 용어 "단일클론 항체(monoclonal antibody)" 또는 "단일클론 항체 조성물(monoclonal antibody composition)"은 본 발명의 폴리펩티드의 특정한 에피토프와 면역반응할 수 있는 항원 결합 부위의 단 하나의 종만을 포함하는 항체 분자의 집단을 의미한다. 따라서, 단일클론 항체 조성물은 일반적으로 그와 면역반응하는 본 발명의 특정한 폴리펩티드에 대한 단일 결합 친화도를 보인다.

다중클론 항체는 적합한 개체를 원하는 면역원(immunogen), 예를 들면, 본 발명의 폴리펩티드 또는 그의 단편으로 면역화시키는 것에 의해 전술된 바와 같이 제조될 수 있다. 면역화된 개체에서 항체 역가(antibody titer)는 시간의 경과에 대해, 표준 기법, 예를 들면, 고정화된 폴리펩티드를 이용한, ELISA(enzyme linked immunosorbent assay)에 의해 모니터링될 수 있다. 필요한 경우, 폴리펩티드에 대한 항체 분자가 포유동물(예를 들면, 혈액)로부터 분리되고, IgG 분획을 수득하기 위한 단백질 A 크로마토그래피와 같은, 잘 알려진 기법에 의해 더 정제될 수 있다. 면역화 후 적절한 시점에, 예를 들면, 항체 역가가 최고인 시점에, 항체-생성 세포들이 개체로부터 수득되고, Kohler and Milstein, Nature 256:495-497 (1975)에 의해 최초로 개시된 하이브리도마 기법, 인간 B 세포 하이브리도마 기법(Kozbor et al., Immunol. Today 4: 72 (1983)), EBV-하이브리도마 기법(Cole et al., Monoclonal Antibodies and Cancer Therapy, Alan R. Liss,1985, Inc., pp. 77-96) 또는 트리오마(trioma) 기법과 같은 표준 기법에 의해 단일클론 항체를 제조하기 위해 이용될 수 있다. 하이브리도마를 생성하는 기술이 잘 알려져 있다(일반적으로, Current Protocols in Immunology (1994) Collgan et al., (eds.) John Wiley & Sons, Inc., New York, NY 참조). 요약하면, 불멸 세포주(immortal cell line)(일반적으로, 골수종(myeloma))가 전술된 바와 같이 면역원에 의해 면역화된 포유동물로부터의 림프구(일반적으로, 비장림프구(splenocyte))에 융합되고, 결과물인 하이브리도마 세포의 배양 상층액이 본 발명의 폴리펩티드에 결합하는 단일클론 항체를 생성하는 하이브리도마를 확인하기 위해 스크리닝된다.

림프구와 불멸화된 세포주를 융합시키기 위해 이용되는 다수의 잘 알려진 프로토콜이 본 발명의 폴리펩티드에 대한 단일클론 항체를 생성할 목적으로 적용될 수 있다(예를 들면, Current Protocols in Immunology, supra; Galfre et al., Nature 266:55052 (1977); R.H. Kenneth, in Monoclonal Antibodies: A New Dimension In Biological Analyses, Plenum Publishing Corp., New York, New York (1980); 및 Lerner, Yale J. Biol. Med. 54:387-402 (1981) 참조). 또한, 통상적인 당업자는 역시 유용할, 그와 같은 방법의 다양한 변형이 존재한다는 것을 이해할 것이다.

단일클론 항체-분비 하이브리도마 제조의 대안으로, 본 발명의 폴리펩티드에 대한 단일클론 항체가 상기 폴리펩티드로 재조합 조합적 면역글로불린 라이브러리(recombinant combinatorial immunoglobulin library)(예를 들면, 항체 파아지 표시(phage display) 라이브러리)를 스크리닝하고, 그에 의해 상기 폴리펩티드에 결합하는 면역글로불린 라이브러리 구성물을 단리하는 것에 의해 식별되고 단리될 수 있다. 파아지 표시 라이브러리를 생성하고 스크리닝하기 위한 키트가 상업적으로 이용가능하다(예를 들면, the Pharmacia Recombinant Phage Antibody System, Catalog No. 27-9400-01; 및 Stratagene Surf ZAP™ Phage Display Kit, Catalog No. 240612). 추가적으로, 항체 표시 라이브러리를 생성하고 스크리닝하기 위해 이용할 수 있는 특히 유용한 방법 및 시약의 예를, 예를 들면, 미국특허 제5,223,409호; PCT 공개 WO 92/18619; PCT 공개 WO 91/17271; PCT 공개 WO 92/20791; PCT 공개 WO 92/15679; PCT 공개 WO 93/01288; PCT 공개 WO 92/01047; PCT 공개 WO 92/09690; PCT 공개 WO 90/02809; Fuchs et al., Bio/Technology 9: 1370-1372 (1991); Hay et al., Hum. Antibod. Hybridomas 3:81-85 (1992); Huse et al., Science 246: 1275-1281 (1989); 및 Griffiths et al., EMBO J. 12:725-734 (1993)에서 찾을 수 있다.

추가적으로, 표준 재조합 DNA 기법을 이용하여 제조될 수 있는, 인간 부분 및 비-인간(non-human) 부분을 모두 포함하는, 키메라 단일클론 항체 및 인간화(humanized) 단일클론 항체와 같은 재조합 항체가 본 발명의 범위에 속한다. 그와 같은 키메라 항체 및 인간화 단일클론 항체는 본 발명이 속하는 기술 분야에서 알려진 재조합 DNA 기법에 의해 생산될 수 있다.

일반적으로, 본 발명의 항체(예를 들면, 단일클론 항체)는 친화도 크로마토그래피 또는 면역침전과 같은 표준 기법에 의해 본 발명의 폴리펩티드를 분리하기 위해 이용될 수 있다. 폴리펩티드-특이적 항체는 세포로부터 천연 폴리펩티드 및 숙주 세포에서 발현된 재조합기법에 의해 생산된 폴리펩티드의 정제를 촉진할 수 있다. 또한, 본 발명의 폴리펩티드에 대해 특이적인 항체는 폴리펩티드의 발현의 양(abundance) 및 패턴을 평가하기 위해 (예를 들면, 세포 용해액, 세포 상층액, 또는 조직 시료에서) 폴리펩티드를 검출하기 위해 이용될 수 있다. 항체는 임상 테스트 절차의 일부로서, 예를 들면, 주어진 치료 계획(treatment regime)의 효능을 결정하기 위해, 조직에서 단백질 수준을 진단 목적으로 모니터링하기 위해 이용될 수 있다. 그의 검출을 촉진하기 위해 항체는 검출가능한 물질에 결합될 수 있다. 검출가능한 물질의 예는 다양한 효소, 보조 그룹(prosthetic group), 형광 물질, 발광 물질, 생물발광 물질, 및 방사성활성 물질을 포함한다. 적합한 효소의 예는 호스래디쉬 퍼옥시다아제(horseradish peroxidase), 알칼리 포스파타아제, 베타-갈락토시다아제, 또는 아세틸콜린에스테라아제를 포함하고; 적합한 보조 그룹 복합체(prothetic group complex)의 예는 스트렙타비딘/비오틴 및 아비딘/비오틴을 포함하며; 적합한 형광 물질의 예는 움벨리페론(umbelliferone), 플루오레세인(fluorescein), 플루오레세인 이소티오시아네이트, 로다민(rhodamine), 디클로로트리아지닐아민 플루오레세인, 단실 클로라이드(dansyl chloride) 또는 피코에리트린(phycoerythrin)을 포함하고; 발광 물질의 예는 루미놀을 포함하며; 생물발광 물질의 예는 루시페라아제, 루시페린, 및 에쿼린(aequorin)을 포함하고, 및 적합한 방사성활성 물질의 예는 ¹²⁵I, ¹³¹I, ³⁵S 또는 ³H를 포함한다.

항체는 또한 약물유전학 분석에서 유용할 수 있다. 그와 같은 구체에에서, 본 명세서에 따른 핵산에 의해 코딩되는 변이 단백질에 대한 항체, 예를 들면, 하나 이상의 본 발명의 다형성 마커를 포함하는 핵산에 의해 코딩된 변이 단백질에 대한 항체가 변형된 치료 방식을 필요로 하는 개체를 식별하기 위해 이용될 수 있다.

항체는 또한 질병의 활성 단계(active stage)와 같은 질병 상태에서, 또는 단백질의 기능과 관련된 질병, 특히, 갑상선암에 대한 소인을 갖는 개인에서 변이 단백질의 발현을 평가하기 위해 유용할 수 있다. 본 명세서에 기재된 하나 이상의 다형성 마커 또는 일배체형을 포함하는 핵산에 의해 코딩된 본 발명의 변이 단백질에 특이적인 항체가 상기 변이 단백질의 존재를 스크리닝하기 위해, 예를 들면, 상기 변이 단백질의 존재에 의해 표시된 바와 같이, 갑상선암에 대한 소인을 스크리닝하기 위해 이용될 수 있다.

항체는 다른 방법들에서 이용될 수 있다. 따라서, 항체는 전기영동 이동성(electrophoretic mobility), 등전점, 트립신 또는 기타 단백질분해효소에 의한 처리와 함께 본 발명의 변이 단백질과 같은 단백질을 평가하기 위한 진단 도구로서, 또는 본 발명이 속하는 기술 분야의 당업자에게 알려진 다른 물리적 분석법(physical assay)에서 이용하기에 유용하다. 항체는 또한 조직형 검사(tissue typing)에서 이용될 수 있다. 하나의 그와 같은 구체예에서, 특정한 변이 단백질이 특정한 조직형에서의 발현과 상관되며, 상기 변이 단백질에 대한 특이적 항체가 상기 특이적 조직형을 식별하기 위해 이용될 수 있다.

변이 단백질을 포함한, 단백질의 세포내 국재화(subcellular localization) 가 또한 항체를 이용하여 결정될 수 있고, 다양한 조직의 세포에서 단백질의 비정상적인 세포내 국재화를 평가하기 위해 적용될 수 있다. 그와 같은 용도는 유전적 테스트에 적용될 수 있으나, 또한, 특정한 치료 방식을 모니터링하기 위해 적용될 수 있다. 치료가 변이 단백질의 발현 수준 또는 존재, 또는 변이 단백질의 비정상적인 조직 분포 또는 발생에 따른 발현(developmental expression)을 정정하는 것을 목적으로 하는 경우, 상기 변이 단백질 또는 그의 단편에 대해 특이적인 항체가 치료 효능을 모니터링하기 위해 이용될 수 있다.

항체는 또한, 예를 들면, 변이 단백질이 결합 분자 또는 파트너에 결합하는 것을 차단하는 것에 의해 변이 단백질 기능의 저해를 위해 유용하다. 그와 같은 용도는 또한 치료가 변이 단백질의 기능을 저해하는 것을 포함하는 치료적 상황에 적용될 수 있다. 항체는 예를 들면, 결합을 차단하거나 또는 경쟁적으로 저해하여, 그에 의해, 단백질의 활성을 조절(즉, 촉진 또는 길항)하기 위해 이용될 수 있다. 특정한 기능을 위해 요구되는 부위를 포함하는 특정한 단백질 단편에 대한 항체, 또는 세포 또는 세포막과 결합된 완전한 단백질에 대한 항체가 제조될 수 있다. 인 비보 투여를 위해, 항체는 방사성 핵종(radionuclide), 효소, 면역원성 에피토프, 또는 세균성 독소를 포함한 세포독성제(디프테리아 또는 리신(ricin)과 같은 식물 독소)와 같은 추가적인 치료적 유효탑재물(therapeutic payload)과 결합될 수 있다. 항체 또는 그의 단편의 인 비보 반감기는 폴리에틸렌 글리콜로의 접합을 통한 페길화(pegylation)에 의해 증가될 수 있다.

본 발명은 또한 본 명세서에 기재된 방법에서 항체를 사용하기 위한 키트에 관한 것이다. 이는 테스트 시료에서 변이 단백질의 존재를 검출하기 위한 키트를 포함하나, 이에 한정되지 않는다. 하나의 바람직한 구체예는 표지된 또는 표지가능한 항체 및 생물학적 시료에서 변이 단백질을 검출하기 위한 화합물 또는 작용제, 상기 시료 중의 변이 단백질의 양 또는 존재 및/또는 부재를 결정하기 위한 수단, 및 상기 시료 중의 변이 단백질의 양과 표준을 비교하기 위한 수단, 및 키트의 사용 설명서를 포함한다.

이하, 본 발명은 하기의 비-한정적인 실시예에 의해 예시될 것이다.

본 발명의 전술된 목적, 특징 및 장점과 기타 목적, 특징 및 장점은 본 발명의 바람직한 구체예의 하기의 보다 구체적인 설명으로부터 자명할 것이다.
도 1은 본 명세서에 기술된 위험 변이를 이용하는 컴퓨터-구현 시스템을 보여주는 도면을 제공한다.
도 2는 염색체 9q22.33 상의 영역에서 연관 결과 및 LD-구조의 개략도이다. (a) Illumina Hap300/370 칩으로부터의 SNP에 대한 단일 마커(다이아몬드) 연관 결과. 혈연관계에 대해 보정된 P 값이 표시된다. (b) CEU HapMap 집단으로부터의 쌍별(pair-wise) 상관계수 (r²) 및 UCSC Genome Browser, Build 36에 근거한, 영역 중의 유전자의 상대적 위치. .

실시예 1

갑상선암의 위험도를 부여하는 염색체 9 q22 .33 상의 위험 변이의 확인

아이슬란드에서 갑상선암의 발생률은 인근 국가에서보다 더 높고 세계에서 최고이다. 100,000명당 아이슬란드에서 연령 표준화된 발생률은 남성과 여성에서 각각 5명 및 12.5명이다. 평균 진단 연령은 남성의 경우 61세이고 여성의 경우 47세이다. 아이슬란드에서 조직학적 서브타입간의 분포는 다른 선진국가의 경우와 유사하다. 유두 조직학적 서브타입(papillary histological subtype)이 가장 빈번하여, 모든 갑상선암의 80%를 차지하고, 2위는 여포형(~14%)이며, 3위는 모든 갑상선 케이스의 약 5%를 나타내는 퇴화형이며, 가장 덜 흔한 서브타입은 수질형(~1%)이다.

대상자

본 연구의 허가는 아이슬란드의 국가 생명윤리 위원회(the National Bioethics Committee) 및 아이슬란드 데이터 보호국(the Icelandic Data Protection Commission)에 의해 허여되었다.

갑상선암 연구를 위해 이용된 본 발명자들의 표본 집합은 아이슬란드의 전체 분포를 상당히 잘 반영한다. 본 발명자들이 유전형분석을 수행한 406건의 케이스 중에서, 309건 (82%)이 유두형이고, 53건 (14%)은 여포형이며, 7건 (1.5%)은 갑상선 수질암이고, 37건은 미지 또는 미정(undetermined) 조직학적 서브타입이다.

상이한 조직학적 서브그룹 간에 통계적으로 유의성 있는 차이가 관찰되지 않았기 때문에, 하기의 표 1에 제시된 결과는 본 발명자들의 모든 케이스에 대한 통합 결과에 관한 것이다.

28,858명의 아이슬란드 대조군은 deCODE genetics에서 진행 중인 다른 게놈-전체 연관 연구로부터의 개인들로 구성되었다. 갑상선암의 진단을 갖는 개인들은 배제시켰다. 남성 및 여성 모두 포함시켰다.

유전형분석

갑상선암에 대한 감수성 변이의 게놈-전체 검색에서, 갑상선암으로 진단된 아이슬란드 환자 및 집단 대조군으로부터의 시료를 대상으로 국제 HapMap 프로젝트의 I 상으로부터 유래된 317,503개의 SNP를 포함하는 Illumina Hap300 SNP 비드 마이크로어레이(Illumina, San Diego, CA, USA) 상에서 유전형분석을 수행했다. 이 칩은 r² >0.8의 공통된 SNP에 대한 Utah CEPH (CEU) HapMap 표본에서 약 75% 게놈 적용범위(genome coveragre)를 제공한다 (Barrett and Cardon, (2006), Nat Genet, 38, 659-62). 단일형(monomorphic)(통합 환자군 및 대조군에서 MAF(minor allele frequency)가 0.001 미만임)이거나, 낮은 수율(<95%)을 갖기 때문에 적합하지 않은 것으로 간주된 마커들은 분석 전에 제거하였다.

마커 rs907580, rs7024345 및 rs965513을 Centaurus SNP 유전형분석 (Kutyavin, et al., (2006), Nucleic Acids Res, 34, e128)에 의해 더 평가하였다.

모든 유전형분석은 deCODE genetics 시설에서 수행하였다.

통계적 분석

본 발명자들은 승법 모델을 가정하여, 즉, 한 명이 보유한 두 개의 대립인자의 상대적 위험도가 곱해진다는 것을 가정하여 SNP 대립인자의 오즈비(OR)를 계산하였다. 마커에 대해, 보인자 빈도가 아닌, 대립인자 빈도가 제시된다. NEMO 소프트웨어 패키지 (Gretarsdottir, et al., (2003), Nat Genet, 35, 131-8)에서 구현된 바와 같은 표준 우도 비 카이-스퀘어 통계값(standard likelihood ratio Chi-squared statistic)으로 연관된 P-값을 계산했다. OR의 추정값이 로그-노말 분포(log-normal distribution)을 갖는 것으로 가정하여, 신뢰 구간을 계산하였다.

모든 P-값은 양측(two-sided) P-값으로 보고된다.

결과

Illumina Hap300 칩으로부터의 유전형의 분석 후에, 본 발명자들은 갑상선암에 대한 매우 유의성 있는 연관을 제공한 염색체 9q22.33 상의 3개의 마커, rs965513, rs907580 및 rs7024345를 발견했다. 본 발명자들은 Centaurus 유전형분석을 이용하여, 추가적인 케이스를 유전형분석하는 것에 의해 이 결과들을 추적했다. 결과가 하기 표 1A에 표시된다.

모든 3개의 마커가 갑상선암에 대한 게놈-전체 유의성 있는 연관을 제공하고(317,000개의 테스트에 대한 보정은 (0.05/317,000 ~ 1.5 x 10^-8 미만의 P-값을 필요로 함), rs965513 (OR 1.77, P-value 1.18 x 10^-15)에 대해 가장 유의성 있는 결과를 수득했다. rs907580 및 rs702345 마커는 0.90의 r²-값으로(표 1B) rs965513과 상관되고, 따라서, 이 마커들은 동일한 연관 신호를 획득할 가능성이 가장 높다.

실시예 2

갑상선암의 위험도를 부여하는 서열 변이를 검색하기 위해, 본 발명자들은 Illumina HumanHap300 및 HumanCNV370-duo Bead Chip 유전형분석 플랫폼을 이용하여 192명의 조직병리학적으로 확인된 아이슬란드 갑상선암 케이스와 37,196명의 대조군을 대상으로 유전형분석을 수행하여 게놈-전체 연관 연구(genome-wide associatoin study, GWAS)를 수행하였다. 또한, 본 발명자들은 SNP 당 평균, 추가적인 186명의 갑상선암 환자들에 해당하는 유전형을 추가하기 위해, 유전형분석되지 않은 갑상선암 케이스에 관한 정보를 제공하기 위해 친척들의 알려진 유전형이 이용되는 것인 방법을 이용하였다(인 실리코 유전형분석(in silico genotyping)) (Gudbjartsson, DF et al Nat Genet 40:609-15 (2008)). 품질 검사(quality check)를 통과하지 못한 SNP를 제거한 후, 총 304,083개의 SNP를 연관에 대해 테스트하였다. 본 발명자들은 승법 모델을 가정하여 각 SNP에 대한 대립인자 오즈비(OR)를 계산하고 표준 우도 비(standard likelihood ratio) χ² 통계치를 테스트를 위해 계산하였다. 결과를 게놈 대조(genomic control) 방법을 이용하여 개체들 간의 가족 혈연관계 및 잠재적인 집단 계층화(population stratification)에 대해 보정하였다(Devlin B & Roeder K Biometrics 55:997-1004 (1999)); χ² 통계치를 1.09의 추정 팽창 인자(inflation factor)로 나누었다.

본 발명자들은 9q22.33 상의 FOXE1(Forkehead factor E1) 유전자와 동일한 연관 불균형(LD) 영역에 위치한 여러 강한 신호들을 관찰했다(도 2; 표 3). 이 결과들을 확인하고자, 본 발명자들은 Centaurus 단일 트랙 분석(single track assay) 유전형분석을 이용하여 추가적인 241명의 아이슬란드 갑상선암 케이스에서 이 SNP의 유전형분석을 수행하였다. 이 결과들을 GWAS로부터의 결과와 통합했을 때, 가장 강력한 연관 신호가 rs965513의 대립인자 A (rs965513-A) 및 rs10759944의 대립인자 A (rs10759944-A)에서 관찰되었고, 이 두개의 변이에 대한 OR은 1.77이었다 (rs965513, 및 rs10759944에 대해, 각각 P = 6.8 x 10^-20 및 P = 1.7 x 10^-19) (표 3 및 표 4). 이 두 SNP는 서로에 대한 거의 완벽한 대리물(surrogate)이고 (Utah CEPH (CEU) HapMap 표본에서 r² = 1 및 아이슬란드 표본에서 r² = 0.998) 변이의 효과가 상호 간에 구별될 수 없기 때문에, 본 발명자들은 이후의 조사에서 rs965513-A에 중점을 두었다. 다변량 분석에서 rs965513-A를 제어(control)하는 경우, 9q22.33 상의 나머지 SNP 중 어느 것도 유의성이 없다.

본 발명자들은 다음으로 미국, 오하이오주, 콜럼버스의 집단(324명의 케이스 및 384명의 대조군) 및 스페인(90명의 케이스 및 1,343명의 대조군) 집단으로 유럽 기원의 두 개의 케이스-대조군 그룹에서 갑상선암에 대한 rs965513의 연관을 테스트하였다. rs965513에 대한 연관은 두 연구 그룹 모두에서 재현되었다(표 4). 3개의 연구 집단 간의 OR의 이질성 테스트(test of heterogeneity)는 유의성 있는 차이를 보여주지 않았다(rs965513에 대해, P = 0.58). 아이슬란드, 콜럼버스 및 스페인으로부터의 결과를 통합하여 rs965513-A에 대한 1.75의 추정 OR을 얻었다(P = 1.7x10^-27).

유전 방식을 조사하기 위해, 본 발명자들은 유전형-특이적 OR을 계산했고 승법 모델이 두 변이 모두에 대해 적합한 맞춤(fit)을 제공한다는 것을 확인했다(표 5). 전체 집단의 개인의 약 11%가 rs965513-A의 동형접한 보인자이다.rs965513-A의 동형접합 보인자는 비-보인자 대비 갑상선암을 발병할 위험도가 3.1배 더 높은 것으로 추정된다. 또한, 본 발명자들은 rs965513-A의 빈도가 3개의 집단 모두에서 보다 젊은 연령에서 진단된 케이스들 중에 더 높다는 것을 확인했다. 데이터를 통합하면, 보유된 각각의 대립인자에 대해, 진단 연령은 2.42년 낮아지는 것으로 추정된다 (P = 0.0014) (표 6).

본 발명자들은 갑상선암의 4개의 주요한 조직학적 종류에서 rs965513의 효과를 분석하였다. 스페인 및 아이슬란드 표본 집합의 대부분은 PTC (~85%) 및 FTC (~12%)로 구성되었고 컬럼버스로부터의 케이스는 모두 PTC였다. rs965513-A의 경우, 3개 집단의 통합 분석에서 PTC에 대한 관찰된 OR은 1.80 (P = 4.7 x 10^-23)이고 FTC의 경우, 아이슬란드 및 스페인 표본만을 기준으로 할 때, OR은 1.55였다(P = 0.016) (표 7). 이는 상기 변이가 갑상선암의 두 개의 주요한 조직학적 종류의 위험도에 영향을 미친다는 것을 보여준다. 다른 조직학적 갑상선암 종류의 갯수는 너무 제한적이어서 의미있는 결론을 도출할 수 없었다.

SNP rs965513은 하기의 유전자들이 위치한 LD-영역 내의 9q22.33 상에 존재한다: XPA, FOXE1, C9orf156 및 HEMGN (도 2). 가장 인접한 유전자는 FOXE1이고, rs965513에 대해 약 57 kb 떨어져(telomeric) 위치한다. FOXE1은 뇌하수체 및 갑상선 형성을 위해 중요하고(Dathan, N et al Dev Dyn 224:450456 (2002); De Felice, M et al Nat Genet 19:395-98 (1998)) 배아 단계에서 갑상선 분화를 개시하는 전사인자 및 보조인자들의 조절 네트워크의 중심에 있다(Parlato R et al. Dev Biol 276:464-75 (2004)). 또한, FOXE1 유전자의 돌연변이는 다른 표현형들 중에서 특히, 갑상선 발육부전(thyroid agenesis)와 연관된 인간 증후군을 유발한다(De Felice, M et al Nat Genet 19:395-98 (1998); Clifton-Bligh RJ et al. Nat Genet 19:399-1401 (1998)). FOXE1은 또한, Tg(thyroglobulin) 및 TPO(thyroperoxidase) 유전자와 같은, 갑상선-특이적 유전자의 전사 조절에서의 관여에 근거하여, 갑상선의 분화 상태의 유지를 위해 필수적이다. Tg가 T₃(triiodothyronine)및 T₄(thyroxine)의 전구체이고, 그들의 합성이 TPO에 의해 촉매되기 때문에, 이 두 유전자 모두의 조절된 발현은 갑상선 호르몬인 T₃와 T₄의 합성을 위해 중요하다. 주요한 조절자로 작용하는 갑상선 자극 호르몬(TSH)이 갑상선 호르몬 합성 및 분비 조절의 중심이다.

갑상선의 생명 작용에서 FOXE1의 관여를 고려하여, 본 발명자들은 혈청에서 TSH (N = 12,035), 유리 T₄ (N = 7,108), 및 유리 T₃ (N = 3,593)의 순환 수준에 대한 rs965513-A의 효과를 평가하였다. 사용된 데이터는 갑상선암을 갖는 것으로 알려지지 않은 아이슬란드인으로부터 11년(1997년부터 2008년)의 기간 동안 수집된 일련의 측정값들로부터 얻었다(표 8). rs965513-A는 rs965513-A 카피 당 5.9% 감소된 TSH 혈청 수준과 연관되었고 (P = 2.90x10^-14; 표 9), 또한 T₃ 및 T₄의 수준과, 그러나 반대 방향으로; rs965513-A 카피 당 1.2%의 T₃ 수준 증가 및 1.2%의 T₄ 수준 감소와 연관되었다(T₃ 및 T₄ 각각에 대해, P = 3.00 x 10^-3 및 6.10 x 10^-5) (표 9). 이 데이터는 9q22.33 변이가 갑상선의 내분비 기능의 일부 양태에 영향을 미친다는 것을 보여준다.

종합하면, 9q22.33 상의 rs965513의 갑상선 및 갑상선 관련 호르몬에 대한 효과, rs965513의 FOXE1에 대한 근접성, 및 FOXE1의 갑상선 특이적 유전자에 대한 제어 효과는 갑상선암과 rs965513 간의 연관이 FOXE1을 포함하는 과정을 통해 매개된다는 것을 강력하게 시사한다. 또한, FOXE1의 발현은 갑상선암에서 비정상적인 것으로 확인되었다(Sequeira, MJ et al. Thyroid 995-1001 (2001)). 따라서, 이 변이는 갑상선암에 대한 유전적 감수성의 가장 중요한 결정인자에 속할 가능성이 있다.

방법

대상. 아이슬란드 연구 집단. 갑상선암으로 진단된 개인들을 1995년 1월 1일부터 2007년 12월 31일까지 진단된 1,110명의 아이슬란드 갑상선암 환자들을 포함하는 아이슬란드 암 등록부(Icelandic Cancer Registry, ICR)(http://www.krabbameinsskra.is/)의 전국 목록에 근거하여 파악하였다. 이들 중, 1.097명은 비-수질성 갑상선암이었다. 아이슬란드 갑상선암 연구 집단은 2000년 11월부터 2008년 4월까지 모집된 460명의 환자들(1974년 12월부터 2007년 6월 사이에 진단됨)로 구성되었고, 이들 중 454명(98%)은 이 연구에서 성공적으로 유전형이 분석되었다. 본 연구에서 이용된 모든 갑상선 암종의 조직학을 검토하고 확인하였다. 총 192명의 환자를 Illumina Sentrix HumanHap300 (n = 96) 및 HumanCNV370-duo Bead Chip (n = 96) 마이크로어레이 (Illumina, San Diego, CA, USA)를 이용한, 게놈-전체 SNP 유전형분석 노력에 포함시켰고 본 발명자들의 품질 검사 기준에 따라 성공적으로 유전형을 분석하고 본 케이스-대조군 연관 연구에서 이용하였다. 나머지 241명의 케이스는 Centaurs 단일 트랙 유전형분석 플랫폼을 이용하여 유전형분석하였다. 동의한 환자들의 평균 진단 연령은 44세(중위(median) 43세)였고, 범위는 13세 내지 87세였으며, 반면에, ICR에서 모든 갑상선암 환자에 대한 평균 진단 연령은 56세였다. 진단부터 혈액시료 채취까지의 중위 시간(median time)은 10년이었다(범위 0년 내지 46년). 본 발명자들이 1998년 전에 진단된 개인들과 1998년 이후에 진단된 개인들 간에 A-rs965513의 빈도를 비교했을 때, 유의성 있는 차이가 관찰되지 않았다(P = 0.97). 본 연구에서 이용된 37,202명의 대조군(16,109명의 남성 (43.3%) 및 21,093명의 여성 (56.7%))은 deCODE에서 상이한 유전적 연구 프로젝트에 속하는 개인들로 구성되었다. 상기 개인들은 심혈관계의 흔한 질환(예를 들면, 뇌졸중 또는 심근경색), 정신 질환 및 신경 질환(예를 들면, 정신분열증, 양극성 장애), 내분비계 및 자가면역계 질환(예를 들면, 타입 2 당뇨병, 천식), 악성 질환(예를 들면, 유방암 또는 전립선암)으로 진단되었고 및 아이슬란드 가계 데이터베이스(Icelandic genealogical database)로부터 무작위로 선택된 개인들이었다. 대조군의 총 수의 6% 이상을 차지하는 단일 질병 프로젝트는 없었다. 대조군은 84세의 평균 연령을 가졌고, 범위는 8세 내지 105세였다. 선형 회귀 분석은 A-rs965513의 대립인자 빈도와 아이슬란드 대조군의 출생년도 간에 상관관계가 없다는 것을 보여주었다(P > 0.2). 대조군은 ICR에 따른 갑상선암 환자의 전국 목록에 없었다. 아이슬란드 케이스와 대조군 모두에 대한 DNA를 표준 방법을 이용하여 전혈로부터 분리하였다.

본 연구는 아이슬란드 데이터 보호국 및 아이슬란드의 국가 생명윤리 위원회로부터 승인받았다. 서면 고지 동의서(written informed consent)를 모든 대상자들로부터 받았다. 의료 정보 및 혈액 시료와 관련된 개인 식별자(personal identifier)를 이전에 기술된 바와 같이 제3자 암호화 시스템(third-party encryption system)에 의해 암호화하였다(Gulcher, JG et al. Eur J Hum Genet 8:739-42 (2000)).

미국, 오하이오주, 콜럼버스(Columbus, Ohio, US). 본 연구는 오하이오 주립대학교 제도 검토 위원회(Institutional Review Board of Ohio State University)에 의해 허가되었다. 모든 대상자는 서면 고지 동의서를 제공했다. 케이스 (n= 342)는 조직학적으로 확인된 갑상선 유두암 환자들(전통적인 PCT 및 여포 변형 PTC(follicular variant PTC) 포함) 이었다. 1명의 케이스가 Cooperative Human Tissue Network (CHTN)을 통해 확보된 것을 제외하고, 이 환자들은 오하이오 주립 대학교 종합 암 센터(Ohio State University Comprehensive Cancer Center)에 입원하였다; 상기 한 명의 케이스는 펜실베니아 대학교 의료원에 입원했다. 모든 케이스는 코카서스인이었다; 92명의 남성, 250명의 여성, 중위 연령 40세, 범위 13세 내지 88세. 게놈 DNA를 혈액 시료, 또는 PTC 환자로부터의 신선한 동결된 정상 갑상선 조직으로부터 추출하였다. 대조군(n= 384)은 중부 오하이오 지역의 임상적으로 갑상선암 진단을 받은 적이 없는 개인들이었다. 모든 대조군은 코카서스인이었고, 143명의 남성, 241명의 여성, 51세의 중위 연령, 범위 18세 내지 94세였다.

스페인. 스페인 연구 집단은 90명의 갑상선암 케이스로 구성되었다. 상기 케이스들은 2006년 10월부터 2007년 6월까지, 스페인, 사라고사의 사라고사 병원의 종양과로부터 모집하였다. 모든 환자들은 유럽계 후손으로 자가-보고하였다. 발병연령, 등급 및 병기를 포함한 임상적 정보를 의료 기록으로부터 수득하였다. 환자의 평균 진단 연령은 48세였고(중위 49세) 범위는 22세 내지 79세였다. 1,343명의 스페인 대조군 개인은 579명 (43%)의 남성 및 764 (57%)명의 여성으로 구성되었고, 이들은 51세의 평균 연령(중위 50세 및 범위 12세 내지 87세)을 가졌으며, 스페인의 사라고사에 있는 대학 병원에서 접촉하였고, 갑상선암을 갖는 것으로 알려지지 않았다. 스페인 케이스 및 대조군 모두에 대해 DNA는 표준 방법을 이용하여 전혈로부터 분리하였다. 연구 프로코콜은 사라고사 대학 병원의 제도 검토 위원회(the Institutional Review Board of Zaragoza University Hospital)에 의해 허가되었다. 모든 대상자들은 서면 고지 동의서를 제출하였다.

통계적 분석

연관 분석. 이전에 설명되고(Gretarsdottir S et al. Nat Genet 35:131-38 (2003)) NEMO 소프트웨어에서 구현된 우도 절차(likelihood procedure)를 이용하여 연관 분석을 수행하였다. 보고된 SNP에 대해 모든 개인들을 대상으로 유전형분석을 수행하고자 하였다. 모든 그룹에서, 수율은 SNP에 대해 95%보다 높았다. 본 발명자들은 개체가 혈연관계가 아닌 경우, 귀무 가설 하에 점근적으로 1의 자유도를 갖는 χ² 분포를 가질, 표준 우도 비 통계치를 이용하여 갑상선암에 대한 대립인자의 연관을 테스트하였다. 본문에서, 보인자 빈도가 아닌 대립인자 빈도를 마커에 대해 제시하였다. 개인의 두 개의 염색체에 대한 승법 모델을 가정하여, 대립인자-특이적 OR 및 연관된 P 값을 계산하였다(Falk CT & Rubinstein P Ann Hum Genet 51(Pt 3):227-33 (1987)). 3개의 케이스-대조군 그룹 각각에 대해, 대조군에서 HWE로부터의 유의성 있는 편차는 없었다 (P > 0.3). 복수 개의 케이스-대조군 그룹으로부터 결과를 그룹들이 대립인자 및 유전형에 대해 상이한 집단 빈도를 가질 수 있으나, 공통된 상대적 위험도를 갖는 것으로 가정되는 것인 Mantel-Haenszel 모델 (Mantel, N & Haenszel, W J Natl Cancer Inst 22:719-48 (1959))을 이용하여 통합하였다(Gudmundsson et al. Nat Genet 39:977-83 (2007) 참조).

혈연관계 및 게놈 대조에 대한 보정. 아이슬란드 GWAS 그룹의 일부 개인들은 상호 간에 혈연관계를 가져서, 전술된 χ²검정 통계치가 1보다 큰 평균을 갖게 했다. 본 발명자들은 게놈 대조 (Devlin B. Roeder K. Biometrics 55:997-1004 (1999)의 방법을 이용하여 팽창 인자를 추정하고, 304,083개의 χ² 통계치들의 평균을 계산하였다. 이 방법에 따르면, 팽창 인자는 1.09로 추정되었다. 단일 분석 유전형분석(single assay genotyping) 때문에, 유전형 분석된 케이스와 인-실리코 유전형분석된 케이스의 표본 크기의 변화에 근거하여, 본 발명자들은 통합된 아이슬란드 표본 세트의 팽창 인자가 1.12인 것으로 추정하였다. 통합된 아이슬란드 표본에서 갑상선암과의 연관에 대한 테스트를 위한 χ² 통계치를 이에 따라 조정하였다.

유전형 분석

Illumina 유전형분석. 192명 및 37,202명의 아이슬란드 케이스- 및 대조군-시료를 각각 Illumina Sentrix HumanHap300 또는 HumanCNV370-duo Bead Chip (Illumina, San Diego, CA, USA)으로 분석하고 본 발명자들의 품질 관리 기준에 따라 성공적으로 유전형분석을 수행하였다. 칩에서 분석된 SNP 중에서, 95%보다 낮은 수율을 갖는 SNP는 케이스 및 대조군의 통합된 세트에서 0.01 미만의 소수 대립인자 빈도를 갖거나, 단일형인 SNP들은 분석에서 제외시켰다. 추가적인 4,632개의 SNP가 대조군에서 하디-와인버그 평형(ardy-Weinberg equilibrium)으로부터 유의성 있는 왜곡을 보였다 (P < 1.0x10^-3). 전체적으로, 13,420개의 특유한 SNP를 연구로부터 제외시켰다. 따라서, 본문에서 보고된 분석은 304,083개의 SNP를 이용했다. 98% 미만의 SNP의 전체 콜 레이트(call rate)를 갖는 시료도 게놈-전체 연관 분석에서 배제하였다.

단일 트랙 분석 SNP 유전형분석. Centaurus (Nanogen) 플랫폼 (Kutyavin, IV et al Nucleic Acids Res 34:e128 (2006))을 적용하여, 아이슬란드, 레이캬비크에 있는 deCODE Genetics가 아이슬란드 및 스페인으로부터의 두 개의 케이스-대조군 그룹에 대한 단일 SNP 유전형분석을 수행하였다. 각 Centaurus SNP 분석의 질은 CEU 및/또는 YRI HapMap 표본에서 각 분석을 유전형분석하고, 그 결과를 HapMap 공개 데이터와 비교하는 것에 의해 평가하였다. 1.5%보다 높은 불일치율을 보이는 분석은 이용하지 않았고, LD인 것으로 알려진 마커들에 대해 연관 불균형(LD) 테스트를 이용하였다. 본 발명자들은 Illumina Hap300 칩 및 Centaurus 단일 트랙 SNP 분석을 이용하여 330명의 개인들의 유전형분석을 수행하였고 0.5% 미만의 불일치율을 관찰했다.

오하이오 연구 집단으로부터의 시료의 유전형분석은 이전에 기술된 (He H. et al. Thyroid 15:660-667 (2005)), 오하이오 주립 대학교의 SNaPshot (PE Applied Biosystems,Foster City, CA) 유전형분석 플랫폼을 이용하여 수행하였다.

TSH, 유리-T₄ 및 유리-T₃ 측정.

TSH, 유리-T₄ 및 유리-T₃ 수준을 내과 전문 클리닉인 아이슬란드 의료원(Iceland Medical Center)(Laeknasetrid)에서 1997년과 2008년 사이에 진찰 받은 아이슬란드인을 대상으로 측정하였다. 측정은 아이슬란드, 레이캬비크, 묘드(Mjodd)에 있는 연구소에서 수행하였다. 특정된 범위 외부의 측정값들은 제거했다. 로그-변환된 측정값들을 일반화 가법 모델(generalized additive model)을 이용하여 성별 및 측정시 연령에 대해 조정했다. 개인에 대해 복수의 측정값이 존재하는 경우, 로그-조정 측정값(log-adjusted measurement)의 평균을 후속 분석에서 이용했다. 연령 및 성별 조정된 로그-변환 측정값을 고전적인 선형 회귀를 이용하여 대립인자 계수(allele count)에 대해 회귀시켰다.

100: 컴퓨팅 시스템 환경(computing system environment)
110: 컴퓨터
120: 프로세싱 유닛
121: 시스템 버스
130: 시스템 메모리
131: ROM
132: RAM
133: BIOS
134, 144: 오퍼레이팅 시스템
135, 145: 애플리케이션 프로그램
136, 146: 기타 프로그램 모듈
137, 147: 프로그램 데이터
140: 비-이동성 비-휘발성 메모리 인터페이스
141: 하드 디스크 드라이브
150: 이동성 비휘발성 메모리 인터페이스
(removable non-volatile memory interface)
151: 자기 디스크 드라이브
152: 디스켓
155: 광학 디스크 드라이브
156: CD (compact disk)
160: 사용자 입력 인터페이스
161: 마우스
162: 키보드
170: 네트워크 인터페이스
171: LAN(local area network)
172: 모뎀
173: WAN(wide area network)
180: 원격 컴퓨터
181:
185: 원격 애플리케이션 프로그램
190: 비디오 인터페이스
191: 모니터
195: 출력 주변장치 인터페이스 (output peripheral interface)
196: 프린터
197: 스피커

SEQUENCE LISTING <110> deCODE Genetics ehf <120> GENETIC VARIANTS USEFUL FOR RISK ASSESSMENT OF THYROID CANCER <130> P2560-PC00 <160> 229 <210> 1 <211> 599 <212> DNA <213> Homo sapiens <400> 1 caaatatgaa ggaagaagag tggaatacag gaattagaat acttgaaata gagtagttat 60 gatgatgaac cacagaaatt tagctggtta aggaaggaag tgagaacctg agggaaatga 120 cagatagtgg gaaaagtgga agggccagtg tattggaagt cttgatgagg tggattggaa 180 atactgcccc aagggagctg ggatgaaagg aggtagcagg cagagaatgt aggtttttgg 240 tgatggtatg gtcatggaca tgacaaaggt aatgagtggc tggaatggaa cagatcaaar 300 gagtaaatta aaaagaagat gtattagtct gttctcacaa tgctaacaaa gacataacct 360 gagcctgggt aatttataaa agaaagagat ttaattgact cgcagttcag catggctggg 420 gaggcctcag gaaacttaca atcatggtgg aatgggaagc caacacgtac ttcttcacat 480 ggtagcagga agcaaaagtg ctgagcaaaa gggggaaaag gcccttataa aaccatcaga 540 tcttgtgaga actcactcat tatcaccaga acagtatgag ggtaactgtc cccatgatt 599 <210> 2 <211> 599 <212> DNA <213> Homo sapiens <400> 2 tgcttacccc aagtcacata gcaagttagg caggagactg ggcacaagac ctcctgactt 60 ccgcaccacc acaaccctca aatttttttt aatgagtgtt tttctttaaa acatagtatg 120 aacactggaa cagagggaaa tgcagtattc caatttccat ccacagtgtt gtccgacctg 180 gcatctcact ggagtcccca agcacaggcc ctggcagcag accaggctgg gttcaagtcc 240 tactcctgcc ttttgctagc cccacggctt tggcaaatta ctgcagttgg aattattaas 300 tgttggaatt attaaattgt tggaattatt aagtgaacta atgggcacag acattttgtt 360 ccacacttag catatagtaa gcacccaatt attgctattg ccattagcag ctccggcact 420 tacctgccag gtgtgcaagg ccctcaactg ctaagccttc tgtctcaaat gagacatcac 480 caagatttct cctaactcca gagccctgta gtctccacca cctggcccaa atgaaacgat 540 ggaccccaga atcagggaag tatggtggga acctgtgtca cttccctgtt tctctttct 599 <210> 3 <211> 599 <212> DNA <213> Homo sapiens <400> 3 ggcctccaat atggctcagc acagccctga tagaaaatat tttgaaattt tgcttgtatg 60 aaatgtctct attctattct ttcatttagc tgggaattga attctaggtc aaaaataatt 120 ttccttcaga attttggagg caatgttcca tcatcttctc acttccagtg ttactttctg 180 agaagtcttc aatcactata attgctgacc atttttgtac gtgacctggt tttgctgttt 240 ggaacctcat agaatctttt ctttatcacc agtattcttg tactttgcag taattgtttk 300 gtggagcttt ttgtttgttt gtttgttttt taatctatgg acctgattct caaggattct 360 ttcattctgg agacttatgc ccttgggttc tggagaaatc aatctctttt taaagaaaat 420 aatttttcac cttctttttt tcactgtctg gaagtactat tagtcaaatt tactgaattc 480 gtccttattt ttcttacatt ttctccacta ttttcatctc tttgccattt gttttctatt 540 ttcggacaga ctgccttgtt gataagagga taagtgcagt ctttcagata cattttctt 599 <210> 4 <211> 599 <212> DNA <213> Homo sapiens <400> 4 attattttgc actaattttt atattttaaa atgctgttta aaatatcatt tattgtgatt 60 attgagattt tgggtgctct cttgcatttt gcacttgaag caagtgcctc actttccttt 120 ctcttgtccc atccttaatt cccatgacct ttcttgggaa gttactgaaa tatgtgcttc 180 cctcaaaaaa ggagaaaatc aagaaggaga aagacatgga cacaagggca aggcatgaaa 240 cacggcagaa agatcaaggg aattcctgta gtgttggtga agggtgatcc tagggtgatr 300 accatgccca aatcagagag gccaagagac ctagattgca gcaagacaga aggcaagaag 360 tggaaactgg taagttcata cgaaaacaca gagaggaggg cattaaggat ggtaataatt 420 ttttttaatt cagcaaatga aaacacagat aattattatc tccagacaaa accaaaagtc 480 caaaaatgga aataaataaa taaataaata aataaataaa taaatagtat tctactagtt 540 cagctgtgaa aagcatttag ataatactat aaacactgac tattgatcta attaacatt 599 <210> 5 <211> 599 <212> DNA <213> Homo sapiens <400> 5 tactgtatta tgtacttgaa aattactgag agggtagatc tcaagtgttt tcatcacaca 60 cacacataca cacacacaca cacacacaca cacacacaca cacacaaatg taaccacatg 120 aggtgatgaa tatattaatt agcttgattg tggtaatcat ttcacaatgt atatacacat 180 caaaacatca tgttgtacac cttaaatata tacaattttt atttgccaat tatatctcaa 240 ttgttaaaaa tcaagtaata gcaagttaat tgagttatat agagatgtgg aagaaaatay 300 taaaaaagtg aaaagaggtg gaaaaaattt gcttttgggt gggggatatg ggagaaggca 360 aagcaatagg gctactcttt ttgtgtcaaa tcttacagag ttatttgatc tttaaactat 420 gtatctgtat aactttaaaa aatataaaaa ctttctaaaa acgatgtatt gatagctgtt 480 ttcagattag ttgaaacatt tgggaagaat tagagaaaac tacctagatg actcatccaa 540 gcaattatta agtccaggaa aaacaaaaag aagtacaaaa agagagacat agtaatatg 599 <210> 6 <211> 599 <212> DNA <213> Homo sapiens <400> 6 tcaggtcaaa gcagcaaggc tttttctgac ttagcctcag aagtcataca acatcacttc 60 tgccatattc tttttattac aagtgagagt tccaggattg gtccaggtcc aagggaaggg 120 tagtacacat acacgtgaac actgggaggc atagtttatt gagaccctct tacagctacc 180 tggagcatag agtcagaagt cttcctagct tctctgattg tactcgaccc cttctccccg 240 ctatgcctct gaccatcctc ttaattttgg ctgggagttg ttgcagaaga cacatccatr 300 ctccaggtgt gcacagtccc cttcgtggtc agcagaatgt gtacagcctc attgtgagca 360 gggccaacag taggttacca agctcctgca atgctggagt gcccattacc aactcctgcc 420 aacccactgc cacatagtat ctcatgggct cttgtttaag ctgaacatat tcactggggc 480 caccttggag aacttggcct tgacctgctt aaacacttga gcaaggttct attctgagag 540 cttggatctt tcctgagacc aacaggactc acaggggttt tgcagatggg actaagagc 599 <210> 7 <211> 599 <212> DNA <213> Homo sapiens <400> 7 gtgggttggc aggagttggt aatgggcact ccagcattgc aggagcttgg taacctactg 60 ttggccctgc tcacaatgag gctgtacaca ttctgctgac cacgaagggg actgtgcaca 120 cctggagcat ggatgtgtct tctgcaacaa ctcccagcca aaattaagag gatggtcaga 180 ggcatagcgg ggagaagggg tcgagtacaa tcagagaagc taggaagact tctgactcta 240 tgctccaggt agctgtaaga gggtctcaat aaactatgcc tcccagtgtt cacgtgtatr 300 tgtactaccc ttcccttgga cctggaccaa tcctggaact ctcacttgta ataaaaagaa 360 tatggcagaa gtgatgttgt atgacttctg aggctaagtc agaaaaagcc ttgctgcttt 420 gacctgagtc tcttggaaca ttctctaagg agccgtgaac tactatataa gaagtctgcc 480 atactgggga agccaagtgt aggcactccg gttaacagtc cccgcacagc tccgccttcc 540 agccattccc actaagacat cacacataca agggaagttg tctcggatcc tccagatca 599 <210> 8 <211> 599 <212> DNA <213> Homo sapiens <400> 8 atcagagaag ctaggaagac ttctgactct atgctccagg tagctgtaag agggtctcaa 60 taaactatgc ctcccagtgt tcacgtgtat gtgtactacc cttcccttgg acctggacca 120 atcctggaac tctcacttgt aataaaaaga atatggcaga agtgatgttg tatgacttct 180 gaggctaagt cagaaaaagc cttgctgctt tgacctgagt ctcttggaac attctctaag 240 gagccgtgaa ctactatata agaagtctgc catactgggg aagccaagtg taggcactcy 300 ggttaacagt ccccgcacag ctccgccttc cagccattcc cactaagaca tcacacatac 360 aagggaagtt gtctcggatc ctccagatca gcccatccac aagctgaata ctcccaagtg 420 acttcagcca gtaccacaca gagcagaaga atctctcagc tgatcctggc ccaaattcct 480 gacccacaaa attataatac aaaataaaat ggttgctatt ttaagccact aagtgagggg 540 gcaattaata tgcagcaata cataaccagc atatcacctt tgggagatgc ttgagaata 599 <210> 9 <211> 599 <212> DNA <213> Homo sapiens <400> 9 tcaggaggct gaggtggaag aatcccttga actcaggagg aggaggttgc agtgagccga 60 gattgcacca ctgcactcca gcctgggtga aagagagaga agagattctg tctcacaaaa 120 aaaaaaaaaa aaaaaaaaaa aagtgccggg cacggtggct cacgcctgta atcccaacac 180 tttgggaagc tgaggctgtt ggatcacttg aggtctggag ttcgagacca gtctagccaa 240 catggtaaaa cccatgtcta ctaaaaatac aaaaattagc cagttgtgat ggcacatgcy 300 taacatgcct gtaatcccag gtacttggga gactgaggca ggaaaattgc ttgaacccag 360 gaagtggagt ttgcagtgag ccaagatcgc accaccgcac tccagcctgg gtgaaagaat 420 gagaccctgc ctcaaaaaaa aaaaaaaaaa aaaaaaggaa acaagagata tgtcaaccaa 480 attcaatgtg tatatcagaa tccacaaagt ctgtggattc tgatatatac attagtgtgt 540 gtgtgtgtgt gtgtgtgtgt atttgaacat agactaggta tttagtgata ttaacaatt 599 <210> 10 <211> 599 <212> DNA <213> Homo sapiens <400> 10 cccaacactt tgggaagctg aggctgttgg atcacttgag gtctggagtt cgagaccagt 60 ctagccaaca tggtaaaacc catgtctact aaaaatacaa aaattagcca gttgtgatgg 120 cacatgctta acatgcctgt aatcccaggt acttgggaga ctgaggcagg aaaattgctt 180 gaacccagga agtggagttt gcagtgagcc aagatcgcac caccgcactc cagcctgggt 240 gaaagaatga gaccctgcct caaaaaaaaa aaaaaaaaaa aaaaggaaac aagagatatr 300 tcaaccaaat tcaatgtgta tatcagaatc cacaaagtct gtggattctg atatatacat 360 tagtgtgtgt gtgtgtgtgt gtgtgtgtat ttgaacatag actaggtatt tagtgatatt 420 aacaattatt tttaatttta ggtgtgatat aatattgtgt atatttttta aagataaaag 480 atgtatttag agataaaaag atatatgcat cccaggtata tctgggattt gcttcaaatg 540 aatgcagtgg taagggggta ggaatagaca gggtataagg aggcaagatt ggccatatg 599 <210> 11 <211> 599 <212> DNA <213> Homo sapiens <400> 11 ggatgcataa tggaggggag tttggagagg gaacaaaatt attaaggagg attatactgt 60 caccactcga cacaatggag actgctgctt ttaactgcct taaacaagtc ttgcttcata 120 ccagagctgc gactcaagga ggcgtcgcca tgggaagtgg atcctgccca gccgatcaaa 180 tctttcttct tggctgggtc tttgagtgca ggttttctgc ctatacaaca agagaatgga 240 tgtggctctt agaatgcact tgaaattctt cttcctcttc atggtgtctt tgtggccagr 300 tgtcttggaa ggcccaggaa tgaaggcgcc tctggataaa gtggccatcc tgcttctgag 360 agcatggggg acccaggcaa gttactatct ttctgtgagt ctctgtttcc tccagatgca 420 gtgagcagcg gtatagcata gggttagcca gagggctcta gagacatctg gttcccgcaa 480 ctcaccagct ctgcaacctt gttaggccat gcaactccta tgtgccttat tccctattta 540 taaagtaggg atgataactt ccacctcaca ttgttgatga aaggataaaa ttagataat 599 <210> 12 <211> 599 <212> DNA <213> Homo sapiens <400> 12 tggtgtgatt ccgatgcagc ccatctttcc tgcctccaga ctgcacctca tactttctct 60 tcatcttgga taccctcctt ccagggtttt gcttcatcag atctttctta ttctccaagg 120 accaggtcca gtatcaccct tcaggaagat ggggcactct tcctgacccc agtgccccat 180 agcccatctc tggcccttcc tgtggtcctg atgaccatac tttgctggtg ctggggtctg 240 tgaccatgca gtcctgggag gaagccacct tcaactcact ctgcttctgc cagtgctccr 300 tgcaacatct tgttcatggt aggggctcac gtttgtgtgg aatgatgaga atgggtggtg 360 ggggcctggc tgccacaggg aggtatgtgt agtctaccaa agcagcatgc tccttcctgg 420 tcatgaggtg gtgaccatct catggcagcc ttgaagttga aggaaagtga ctactgaggc 480 tgctctccat tttctcatcc agaactgggg ctgggaactt agaagcaatg gagggagcat 540 tgctttgctc tgaatggagg acagtttatg gctttcacgt tccaggccct aggaggaaa 599 <210> 13 <211> 599 <212> DNA <213> Homo sapiens <400> 13 actgcatggt cacagacccc agcaccagca aagtatggtc atcaggacca caggaagggc 60 cagagatggg ctatggggca ctggggtcag gaagagtgcc ccatcttcct gaagggtgat 120 actggacctg gtccttggag aataagaaag atctgatgaa gcaaaaccct ggaaggaggg 180 tatccaagat gaagagaaag tatgaggtgc agtctggagg caggaaagat gggctgcatc 240 ggaatcacac caggtagaat ggttggttgg ttgaattggg aggtggagct ggagaggtaw 300 gtagggcaga tggcaaaagg ccttaaattc aggccaagga gagtggactt gattatggag 360 gcaacagaga ctgagggaca agagctggga ttggaaagag gccccaagca tatatgaagc 420 tcccctactc atgcctgccc cacacctttt catgggatgt tgtacagcac actcccagat 480 ttggaaagcc ccatctataa atctttcagt cccaggatca ctcctttcta cagtggcttc 540 agcagcaatg acagagtcaa gagaggtcac cctttaggtt tctcaacaca gttgccctt 599 <210> 14 <211> 599 <212> DNA <213> Homo sapiens <400> 14 aggctttgtg ttagatgatt ttgcctgact gtgggctaat ggaagtggtt tgagcacatt 60 tgaggtaggc tagagtaagc tatgttgttc agtaggttag gtgtattaaa tgcattttca 120 acttatgata ttttcagttt tcaatgggtt tattgggaca taaccacatc ataagccaag 180 aagcatctgt attttactag ggagcaggag tgaggaacaa ggagagcgaa gcaggcaaga 240 gggaggatac aaggatatat gatggagacg gccactgcta aatgcacctc attattcaay 300 ctcatggaaa tgtcccccga gaaaccatgc aatctgtgtc tcaggtaggg tgaccaacca 360 tcctggtttt ctcaagatgg ggggattttt ccaggatgtg gaactttcag tgccaaaccc 420 aggaaggtcc tgggaaaacg agaatgagct tgttccgtag aatcaggacc actggatttg 480 aggatagaaa aatggaaaga tagggaaggt aacagttgat ggtcttgatt gctttatgaa 540 gtgcgacata cagagatggg tgtgggaaac taaaaatggg gtatgaatag ttgaaagaa 599 <210> 15 <211> 599 <212> DNA <213> Homo sapiens <400> 15 ctttcttctt ggagcactgc aaaatcattt aagggttata aacagaagag ctggtgcatt 60 agccagggtt ctccagagag acagaaccct taagatatat ataaatgtag agaaaaagat 120 tcatcatgag gaattggctt atgtgattat ctgctatctg caagctgaag gcccaggaaa 180 gccagtggtg tagttcttat ccaagcccaa aggcctgaga atcaggagtg ctgatgtccg 240 agaataaaag aagatggatg ttccagctcc agagaagaga gaatgtaccc ttcctcgacm 300 ttttttgttc ttttccagtc ctcaatggac tgggtgatgc ccatgcatgt tggggagggt 360 ggagcttctt tactgcctgc tgattcaaat gctaatgtct tctggaaaca cgtgcacaga 420 catactcaga aataatgttt tgccagctat ctgggtatgc cttagcccag tgaagctggc 480 acacaaaatt aaccatcaca gtacgcatga tttgatttat acttttaaat acacctttaa 540 atttgatttc caccctggct gctgagtgga caatagaaag tacaggaaca agacaaata 599 <210> 16 <211> 599 <212> DNA <213> Homo sapiens <400> 16 agtagaggta taaaatataa ggttggatat atatgagtgt gagctagaca gagctgtatg 60 tagttttggg aggcactgca gcatattcaa agccttgggc cagaggagct caggagctca 120 ccagggagaa gatggatcta aagaaggaga tctatggcca agacttgcag cactatgaca 180 tttagaaatc aagcagcaaa tgtgcagggc tgctaaggag actacaaagg gacaactaaa 240 aagatatgat attctagaag ccaagagaag aaagcagttc aagaagggtg tggccaacts 300 tatcaaccat ataatacgct gctgagagat caaataagga cagagaagtg accactggag 360 gtcatcagca gcctcgtgaa aaacagtctc agtggggtgg aagaaagaga ggacccatag 420 cacagggctg agcagagaat caaaggtgag gaagtagaca caggagacaa ctccctgaaa 480 agggcttctg tgagggacag cagagaacta gatcagctac aggaaaaggt agggtaagga 540 aaaggctctg caaaccctgg agatactgga acaggtctgc attttggggg aatgatctg 599 <210> 17 <211> 599 <212> DNA <213> Homo sapiens <400> 17 attaaaggag tggagagttg aaggaagagg gagaagggat gggttcagaa gtgaccacag 60 aaggcaagga ggaccactta cacaacttcc ccacctcagg ccctcaggta cccagttttt 120 aagaggaaag acaccttcca cctcagtagg ttgtaaaaga aataatgtca tgagcagata 180 ttcagctttc atttaatgca aaaaagtaag tgagcactca gagaagtaat tgaggatatt 240 ggaaagagtg taattgacag ccatgagttc acaaacccac agagaaaagg tttgggagcr 300 caggaaggaa aggaaaattg agtcaaaaca gagactcttc caagtggcat gggaattagg 360 gtccccttga cctgaggagc ttgggtttct ggagatgact gaagtggaca ggaatgaaag 420 gcatcctgaa attagtctta agagtctctt aggggaaggt ggacttgaga caaaaggcac 480 aatgctggtt agcaacaatt ctctactgtg cctgtgagta atgcagaagc cagaatgagt 540 ccctgaaggg attgttctct taaggggagt tcactgtgaa ggcttccggg gagggtcca 599 <210> 18 <211> 599 <212> DNA <213> Homo sapiens <400> 18 tggagctctg cactccttgt ctgcactttt ggctgtgtga ccttgggcca gtctctctcc 60 atctctgggc ctaggtccac acatctgtgc atagacagag caggcccagg tgccctcaga 120 gggacctcaa cttcatgagg atcagaagca ccttcctgtg tggttcctcc cctttgaggc 180 ctccctcgct tctctgctgc tcctccccca atcttgaagc aatttgtagt gtctgttggg 240 ttttcactga tcccaactct gcctagagcc tgggaccaat ccctctgtca gttcttctcy 300 ccttcaacct cctgcttgta aattggggct aataatacct gataactcac tttgctgcta 360 cagggattaa ctaattagtg gttattaagg gatagaggaa tgcagtactc tgctcccatt 420 aagatgactt tcctcctcca acttcctgct actgtgtgcg caatctcagt gttagtcaga 480 aaaccctgaa agtccggact tccaggacct ccatgataca gataaagaaa ctgaggctga 540 ggagcaggaa ggagtagcct gtgaccatgc agcgtcttgt agcagagagg ggaccagaa 599 <210> 19 <211> 599 <212> DNA <213> Homo sapiens <400> 19 actttctcac cttccacact cataaggtgg gattaggatc cctgctgtcc ttccctgaag 60 gggggctttg aagagccatt gagatgatag aagtgaaacc actttgtcaa ttagggagat 120 aagaaatgga gtgtgaaaag atccaacctg ggttcgaacc ccagcctcac tgctcatttc 180 ctgggtaacc atgataaatt aatctctctg gactttcatt tccttaccaa caaaaggagg 240 tgataatatg tatcaggagg atttaattag atatcagata tgaggctctt agcacactcy 300 gtgacatagg aagctctact aaatggcagc tcttaataac agactgtgaa gtccaggagc 360 ttactaacta cagtattttt ttttaaccaa aggacaagaa gacatagaat ctaagccaga 420 ctgatgtcag tgaatgtgat ttacatggaa ataagaaaat tctgaataaa caaaactcgc 480 cataccaggt gtgaaaaata agatcctgag gcactggtat ttttagcagc cattttgcct 540 gtcattcttg tttcattttc ctaactctct gtggggatga gtttttaaat aatttaact 599 <210> 20 <211> 599 <212> DNA <213> Homo sapiens <400> 20 attattaaga ggtatagcct ttaggaggtg attgagtcat gaggactcca ccctcatgaa 60 tgggattaga tacccttata aaagtgcttg gcagagggaa tttgcgcctt tttacacatc 120 cgtccattct gccatgtgag gacacagcat tcctcccctc tggaggatgc agtaacaaag 180 caccatgtta gaagcagagc gagcagtcct catcagatac caagcttgcc ttgatcatgg 240 acttcccagc cttccgaacc gtgagaaatg aaaaaaccca gtctgtggta ttttttgtcr 300 cagcacaaat ggattaagac aattgccaaa gtgtggaagt aactaagatg tccttcaata 360 gctgagtgga taaataatta catccataca gtggaatatt attcagtgat aaaaagaaac 420 aagccatcaa gccatgaaaa cacatggagg atccttaaat ccatatcact aggtgaaaga 480 aaccaatctg aaaaggctac ctactgtgtg attccaatta tatgatattc tggaaaaggc 540 aaaactatgg agacagtaaa aagaccagtg attgccgggg gaactaaggt atgaataag 599 <210> 21 <211> 599 <212> DNA <213> Homo sapiens <400> 21 ccaaagcagg tactgagtaa atatctgcta aatggacaaa tacctactaa atgaatgaaa 60 gaaaaaatga atggagggca tttgttaatc tccttgaatg agaatttgtt tgaagattag 120 cagttaaatt atttaaaaac tcatccccac agagagttag gaaaatgaaa caagaatgac 180 aggcaaaatg gctgctaaaa ataccagtgc ctcaggatct tatttttcac acctggtatg 240 gcgagttttg tttattcaga attttcttat ttccatgtaa atcacattca ctgacatcar 300 tctggcttag attctatgtc ttcttgtcct ttggttaaaa aaaaatactg tagttagtaa 360 gctcctggac ttcacagtct gttattaaga gctgccattt agtagagctt cctatgtcac 420 agagtgtgct aagagcctca tatctgatat ctaattaaat cctcctgata catattatca 480 cctccttttg ttggtaagga aatgaaagtc cagagagatt aatttatcat ggttacccag 540 gaaatgagca gtgaggctgg ggttcgaacc caggttggat cttttcacac tccatttct 599 <210> 22 <211> 599 <212> DNA <213> Homo sapiens <400> 22 gccaaaatca gatctcatgg ctttcctcaa tcagtgagtt gagatagaga cactggcaag 60 tgaaatggga ttttccctag accaatcaag cactcctctg aagttggggg tggggtcaga 120 gacccccagg ggtagctggc tgtgtctgta agtgtatgat ggggttacct caatcacact 180 cgggttctgt taggaaggaa caaaaggaaa acggcactgg caggtagccc acgatgtgca 240 ctgcactacg tccaatgatt accttggcca aagctttcct taaacttggg ccacatcaar 300 ttctcaggca ggaagttttc tccccctagt ctctgcaaga gaatggtgat cataagacat 360 ccacacacaa tgtccagaat caaccttcag gtgtcgacat ttgtcctagt cactttgaga 420 aaggttctct ggactgctgt catgggatgg actaaagtga ggtggtgctg aatgcaggaa 480 gtcagtccag ctgtcagccc agcaccagta aaatcagcag acaccccagc ccaggaatgc 540 caaggcatga gtcaggacta agttttcggt cagaagggtg aagaaaagaa gggtgtgtt 599 <210> 23 <211> 599 <212> DNA <213> Homo sapiens <400> 23 tggtgacgtt attgactagt ttgaaaacaa ttattttcgt ggtaggataa ggagacagcc 60 aatggtgtta caatgtgtta ctgtttgatc gccattatcg tttccaccaa atttgtggtc 120 tgtatatgca cgcttgtgga atgcattttg gagtactcaa aacaacacag aagcagggct 180 caaaagattg gaaaatttaa taggaaatgc taatgtcagt gtgtattgta tcatagaagg 240 atttcaaaaa gagcagtgcc acatagaaaa tgaatgtgaa tgtattttcc aaggagatcy 300 gtgtccaaaa aaataataag cagctattta tcatgatgca agacttcaaa acatagttaa 360 taatcatgaa aatcagctag ctcttatgga ctatctctgt gcaattgccc ataatctatc 420 cctataatac acttttcaat atgtcaaatt ttctttttag tttttaaatc ttttggggtt 480 ttccccctac tatttaaaat tgtcagtatt attttttaca attcactacc cttcatatct 540 catctttgca tcatttccaa tacttgtagt ataaattgta tagaggcttt cagagttct 599 <210> 24 <211> 599 <212> DNA <213> Homo sapiens <400> 24 actacagatt taaaatatta atgtcctatg acctagcaat tccacttctg agaatctatt 60 ttttaaataa tgaaagttgc aaagactcct gtacaaacat attcattgcc acattattta 120 taataataaa aattagaaac aaatgtctgt tttaagctgg gtttccccca gaagttgacc 180 ctgagacaag gttatggatg caagtagttt attttagaag tgaccctagg aagcaccagt 240 agggggataa ggcagtgggt caggcaagga aagaaaccct gtaaagggta agttatcaar 300 ccggtttcca ccatgggcaa ctggggctca gtcccacagg ggaaccctca gagacactgc 360 aaatcatacc tcagaatgac cccacctgac aagtgaggaa gctggagtat ttacccatca 420 actctatatc tgtcatcatt ttctgtgact cctgggggca ttaacttcct agaactttca 480 ttttgttcca catgcaggct aagtatactc tcatagatag aagaaagtcc tcaggaaagt 540 cataggtgtt cccagtaagc agcctccagt gaatagaggt aagtcctatg tgacacagc 599 <210> 25 <211> 599 <212> DNA <213> Homo sapiens <220> <221> variant <222> 300 <223> a,c,g or t (any base) <400> 25 atgttcatga attgaaaggc tcaatgtcat acaaagtatt agcccaagcc actaatttat 60 gagaaataca gaagataaaa acatgttgaa ctacaccata aaaatacaat tcagaatatg 120 gaaaactcta taagaccaac aatccagctt cttcaacaaa taaattccag agaaaataaa 180 agatggagca atactttatg tattaagtga gataagacta ctgaaagcca acccaaaaca 240 aaatgtagaa acaaaaacaa ataaattcat gaaatgaatg aatgagttgg aaatttaaan 300 cttgactttt aacaagtcat caagttgccc ttgatgatat taaagactta ttgttaattt 360 ttggggagta caacaacagt attggggttt tgatatcttt tagagatata cactgaaata 420 tttacagatg aatttaaatg acgtctggga tttgtttcaa aataatatga gcacagggga 480 cgatgggggc acagatggta ccaaattgga caggattgat ggctgttagg gctgggtaat 540 gagtacaaag ggatacatca tactatttgt tttgtatatg cttaaaattc caatttttt 599 <210> 26 <211> 599 <212> DNA <213> Homo sapiens <400> 26 ttaacctctc tggaccttag cttccttatc tggaaggtgg ggataataaa agcacccaac 60 ccacagaatt gttttaagga ttaaatacat taagccatgt gaaacactta gaacagggtt 120 ggcacatagc aagtgttcaa aatacagtac ctattattat tataggcatt tacattttag 180 taaagcaata agtgtgtctc caagtcaatg aattccatct cggtgtgtga aagttgtagc 240 tgcaatatcg aaagtactcc ctgtaatctt tgagaacaac tcgcagagaa aaggaaaagy 300 agcaaaaagt tgagtagtgt taaatgtttt gatttccaaa ataataaaag aaaatgtatc 360 tgaaagactg cacttatcct cttatcaaca aggcagtctg tccgaaaata gaaaacaaat 420 ggcaaagaga tgaaaatagt ggagaaaatg taagaaaaat aaggacgaat tcagtaaatt 480 tgactaatag tacttccaga cagtgaaaaa aagaaggtga aaaattattt tctttaaaaa 540 gagattgatt tctccagaac ccaagggcat aagtctccag aatgaaagaa tccttgaga 599 <210> 27 <211> 599 <212> DNA <213> Homo sapiens <400> 27 ctttgatacc tgagaagtct tagtgccccc gaaaatcccc tacggaggta gtgactatga 60 actagaaaac agtgggagca tagttgaagc caggcagtct gggtccagag cttcttagta 120 ggtgcatgcc actgtgccca gctctatgtt taatcttttg agaaaccacc aaactttccc 180 atagttactg caccattttg cattcccacc agcaatgcat gaggattcca gtttctccac 240 attcttacca gcacttgtta ttttctgggg ttttgtttgt ttgtttctgt tttcttatar 300 tcatcctggt aagtgtgcag aggtatctca ttgtggttat gatttgcatt tccctagtga 360 ctaataatgt tgagcatttt ttcatgtgct taggggccat ttgtatattt tctttggaaa 420 aatgtctatt cgagtccttt gcccattttt gaattaagtt gttttattgt tactgagttt 480 tagatgttct ttatgtattt tgaatattaa ttccttatca ggtatatgct ttacaaatat 540 tttctctcat ttactaggtc atctttttca ctttttgata gtattctttg atgcacaga 599 <210> 28 <211> 599 <212> DNA <213> Homo sapiens <400> 28 atcagatttg caagtgtgga cgcctggagt tttgttgttc agtaaaaagg gcagcccagg 60 ccaaagaatt aagtacaagt aaggctctga gaactcaaga aaagacagag aggctttggg 120 gccaaagagt aaggcccaaa gacctgagtt tccttctcag cccaaggctt ttctctctac 180 aagtcccttc cacaatccag gcccagtctc cttccagctt gaatttccat ggtttcttta 240 atagaagaac tggttacctc tgcgtctgca tgcaggggaa tctccgtcaa ggaatctggw 300 ggaattttcc ttgactcctt ggacccctct cgtttttatt tacaaagtcg cccattcaaa 360 actgaggaaa gcagctgttg cagaagaaca tcttctaaag attcccaata gcacctccag 420 ccccctatgc acataaaatg gcctgctgca ggctggcttc tccaggggtg ctgggaatac 480 ttgaagggct gaagatcagt gggaagcaga aatcactggc ctgcccacat caacaccaac 540 ccacccctgc tggattggga gaatgatttc caagggtctg gaacctgccc ttcctaact 599 <210> 29 <211> 599 <212> DNA <213> Homo sapiens <400> 29 tgtgtggaaa cgctcaaagc gtttgcttga caaccttctg cggcagaggg ttggtcgaac 60 gaagggagag gggctttaca ctcgctaaac aaaactcctg gtttccttct tcccaagtaa 120 tggagaagca aaaaacccag atttcgtcct gtttcgtttt tacaaaggag gaaaaacttc 180 aaattttaaa atttttaact ggattatatt ataggcacct tttaatacgg gatttcgtgg 240 ctctcagtaa ctttcaagat tctgagattc agatatctag attttaaatt ctggacgacs 300 gttgtcctaa cgtgattcca taaatctaaa gaatgcgatc ctgcgatcct gcgaccctgt 360 aattctaaga ttccaagact gggagtctaa ctttgactat gcttatattc ctttgactta 420 agcttctagt caaagtctaa aaacctatgt attaagatac tgggactaaa ccaggcacgg 480 tggcgggagc ctgtagtccc agctactgga ggttaaggca ggaagatcgc ttgagcccag 540 gagttccagg ctgtagtgca caatcattgt gcctgtgagt agccacagca ctccagcct 599 <210> 30 <211> 599 <212> DNA <213> Homo sapiens <400> 30 gtcgcccggc cagttcggag cgctgggagc ctgctacaac cctggcgggc agctcggagg 60 ggccagtgca ggcgcctacc atgctcgcca tgctgccgct tatcccggtg ggatagatcg 120 gttcgtgtcc gccatgtgag ccagcgtagg gacgaaaact catagacaca tcggctgttc 180 acacgttccc cgcaatctga gaacgaacag gaatggagag aggactcaac tgggacccac 240 gtggaaaaga ccgagcaggc cacagaggct cggtctcccc gcgcacagcg taggcaccck 300 gtgtactctg taaacgggag gaggtggggc gaggcagcca gagcccttgg actggcacag 360 ggaccctcga tggagcgaag ccctcaaacg ggatgctttc tggtattcta tcggggaggg 420 tccttggcgg taaccagagg gcagcgtagt gtcaacacca gagaccagga tccaaattgt 480 ggggaatcag tttcagcctt ccatgtgctg ccggaactcg ggccttttta cgcggttcgt 540 cctctagtgc ctttaactgc gttactacaa taaaaggctg cggcagcgcc tttcttctt 599 <210> 31 <211> 599 <212> DNA <213> Homo sapiens <400> 31 ttgtttaata gctctagtaa ccttgtggat tctttgggat tttctacata taagatcatg 60 tcatctgtga atagagatag ttttacctct tcctttccag tttgggtgcc ttttatttct 120 ttttcttttc ggatagctct ggctagaatt tccagtacaa tgttggacag cataaagcaa 180 acattcttct cttgttcctg ttattaggaa gaaagctttc agtttttcac cactgagtat 240 gatgttaact gtgaactttt aaataaatac gccttatcat tttgaggaat tttctctctr 300 ttcctagttt cctgagagtt tttcatcatg aaaggatgtt ggattttgtc aaataatgca 360 acatcctttt ctgcattgag atgatcatgc agtttcttcc cctcttcatt gtataaaagt 420 gatggattga ttttcttatg ttgaaccatc cttgcattcc tgagataaat ctcacttgat 480 catgttgaaa atccttttaa tttgctctag gattttatct attaatattt tgttgagaat 540 ttttgcatct atattcaaaa ggaatatttg tctgtaattt tcttataatg tctatctag 599 <210> 32 <211> 599 <212> DNA <213> Homo sapiens <400> 32 tgtgaataga gatagtttta cctcttcctt tccagtttgg gtgcctttta tttctttttc 60 ttttcggata gctctggcta gaatttccag tacaatgttg gacagcataa agcaaacatt 120 cttctcttgt tcctgttatt aggaagaaag ctttcagttt ttcaccactg agtatgatgt 180 taactgtgaa cttttaaata aatacgcctt atcattttga ggaattttct ctctgttcct 240 agtttcctga gagtttttca tcatgaaagg atgttggatt ttgtcaaata atgcaacaty 300 cttttctgca ttgagatgat catgcagttt cttcccctct tcattgtata aaagtgatgg 360 attgattttc ttatgttgaa ccatccttgc attcctgaga taaatctcac ttgatcatgt 420 tgaaaatcct tttaatttgc tctaggattt tatctattaa tattttgttg agaatttttg 480 catctatatt caaaaggaat atttgtctgt aattttctta taatgtctat ctagctttgg 540 tatcagagaa atattgccct catggaatga attaggaagt gttccctctt cttcaattt 599 <210> 33 <211> 599 <212> DNA <213> Homo sapiens <400> 33 caccctacaa cctggactga ggttttttca ttattacact catgacttct gctccaatat 60 gtgtttgaac actgtttgag tgagaggcgg tgtttcttaa cattctcttc ttctgcatat 120 ccagaacaaa taatacaaag ggaatctaga aactacctaa ccccatagcc agatcattct 180 gacaatgcta tagaaaaatt aggtaggata tgccatatta taaagtaggg ccatgagttc 240 aaaaaacaaa taacacatgg actagctagg gaagccacaa taggtaacag catgcgtttw 300 aaaggcttag ccaatgctaa gctccctgtg agtcaggaat gtcatgaggc ttccataata 360 ataaacttca tttgtagcag cattaaaaga aatagagtgc ccagagtgag gaggcaatgg 420 tcatacctga ctttgccctg ctcagggtgt ctgaattgcc catgagcttc acactttttg 480 atgggcattg attaactgga ctatgtcata gaagacaaac ggaatggcgc agtggctgca 540 acctgtgtcc caggaggagg aattaggtga attaggcttg tgtagcctga agaaagcca 599 <210> 34 <211> 599 <212> DNA <213> Homo sapiens <400> 34 tttcctctct tagtttcatc gtttgtctaa tagcaaagag cgggaaggct ggggtgggtg 60 tgctgacttg agaatccact gtagatgaga gtttccctca cctgcccctc cttaactaca 120 ttggaggtgt gtcattcgct gccattgaaa tggtttgggt ggactagctg gccttgatga 180 tagggtgcgg tggaggggac atgcaggggt tgaaagcaga cacctgagat ggaagcttgt 240 ggtaccttat gtgatttgag gcagggccag ctagccgtcc accaggatgg gtgcatctgr 300 tgccacaggg tgagtcatca ctgcacaaca attgctcagc cagcaactcc atttcccagg 360 cccctttgca ctaagtcagg tacagtacag tgtttcctgt tgttgacagc tggcatttgt 420 tccgattggc tgggtgtcca ctccgactgg ttggtgcgtg tgctgaacta gccaaaaagt 480 attttttctt tttttggttt taaggagcaa aaagtttaat aggcaagaaa gaaggaagaa 540 aaaagagacc agctccctca tacaaagaca agggaggagg acttggaaca aagagaaac 599 <210> 35 <211> 599 <212> DNA <213> Homo sapiens <400> 35 ctgtctgaag acgccacctc ctctgtgagg cctctcctga tttctgagac cacacaaatc 60 tctccctggg ctgcgttttc atggcatgct gccttcagtc aagggaacac atgcaagcag 120 aaagagctca gagctgtgtg agaaagaaaa gcagcatgtg tggtctcaga aatcagaaga 180 ggcctcacgg aggaggtggc atcttcagac agagccaggt ggacagaggg attcaggctg 240 aaggagtagc acagagatca gcaaggagaa tggtctagtg cgtggcacac atagtactgr 300 tgggaagggt gtggcctggc aggcagggtc acatcatgga gatctatgag tgttctgtta 360 gggtctggaa gtttctcctc agggcatgag gaaccatgga agagattttg ttttttcagt 420 gtgtatgcat aggtggatgt gttttagtaa actttttatt gaaatgtaac atatgtatag 480 aaaagtacaa aatttttcac aaactgaccg catctacgta atagcactca gattaaaaca 540 ataacaaatt attactaaaa ctccagagat ccactctggc ctctttcagg aactactta 599 <210> 36 <211> 599 <212> DNA <213> Homo sapiens <400> 36 aggtagaaat gaacttaaga gggagatgga ggaaggtttc tgtatggggt ggctggctgg 60 atgagggact tcagatttga agccaggaga aaacatccca attttataac atcatgtttg 120 aaatgtagga caatgagatg aagatgtcca ataaactgtt agctatatga gtctgttgct 180 tagggatgag gtcaaggctg tagacagagt taggagttat cacagagatg ggggttgagg 240 ctggggggtg gctgagattt ctcaggtggt tgtgtgcaat gaaagagaca agggctgaar 300 accagacgcc tggcttaggg gatgagcgga ggaagaacaa gagacaacat cgcttccctc 360 tgaaatgctg gcacgggctg cgaagcatga gtcagaccct tctagcccca gcagcagcct 420 caacagcctg ggtctatctc accagccaca cagttttctc ctgaatgaac ttgcatcact 480 aacctcagaa gctgtgttgc gaaatccgca tcagattgcg tacctctggt ggcgtcctag 540 ggacaatggg cactaaagac tcatagcatc ctggggttgg agtcctcctc tccgcctcc 599 <210> 37 <211> 599 <212> DNA <213> Homo sapiens <400> 37 taggagttat cacagagatg ggggttgagg ctggggggtg gctgagattt ctcaggtggt 60 tgtgtgcaat gaaagagaca agggctgaag accagacgcc tggcttaggg gatgagcgga 120 ggaagaacaa gagacaacat cgcttccctc tgaaatgctg gcacgggctg cgaagcatga 180 gtcagaccct tctagcccca gcagcagcct caacagcctg ggtctatctc accagccaca 240 cagttttctc ctgaatgaac ttgcatcact aacctcagaa gctgtgttgc gaaatccgcm 300 tcagattgcg tacctctggt ggcgtcctag ggacaatggg cactaaagac tcatagcatc 360 ctggggttgg agtcctcctc tccgcctcca caacatccct gccaatcagt tatcgagcac 420 cccaggcagg gaactcataa cttcccacgg catcccattt ccttgttgag caagtgaaga 480 tctaagaaaa ccttttcttg caatctcacg atactgaaaa gtcaaagaaa aagataacgc 540 tataatttaa tggtaatgat ccaggacaga gtgaaatgca aggactctgc atcctggaa 599 <210> 38 <211> 599 <212> DNA <213> Homo sapiens <400> 38 acacaccata tgctaaaact aactcaaaat ggaataaaga ccttaatgtt tatagacaat 60 gttataaaac ttataaaaga aaacacagat gtatatcttt gtgatgttgg attactcaac 120 agtttcttag atataatacc aaaaacaaag cacagtaaca aaagaaaaaa cagataactg 180 gactttatca aaactaaaaa ctttgcatgt gaaaggacac tgtcaagaaa gtagaaagac 240 aaagaatgag aggaaatatg tgcaaatcat gtatctgata aaggtctaat agccagaatr 300 tacatatttt taaactctca caactcaaca ataaaaaaat ttgaaaatta gtaaagtact 360 tcaatagaca tttgtccaaa gaagatatac aaatggccaa taagaaatga aaagatgttc 420 attattagtc tttaggaaac tagaagtcaa aaccacaatg agaatttgga atctttgtgc 480 attgctgtag taatgtaaaa tggtacagcc actgtggaaa acagtttggc aatttctcaa 540 aaagctcaac ataaaactag caaatgaccc agcaattcta ttcctaggta tacacccaa 599 <210> 39 <211> 599 <212> DNA <213> Homo sapiens <400> 39 gcggcccctc tggcccgggt tcgttccctg gccattcact gggagatcca gggcctgtcc 60 ttgtcccctc gcagggcctc agtgttctac tctgttaaat agcagctgga gggcgtgtgc 120 tgatctccga ggcccctgct acgtatagga ttccgggcct tggcgcgggt tccagtggct 180 ccagcccgga cgcagctttc cggggtgggg ggggggggcg ggccggggct gtgggtgcag 240 agccgcgcgg atggtggtgc caggtgagtg tgggagatcc caagacgaga gttctggccr 300 gtaacgggtg gcatgccttc cagggtttta gtcgcgttct tcgtggcggt gagctgaggg 360 caggctaagc ccggccaagc gttgggcagc tgccttcgga agagcgaggc aaagcccaga 420 tccttgctcc gtcgacccgg tgtgtggaaa cgctcaaagc gtttgcttga caaccttctg 480 cggcagaggg ttggtcgaac gaagggagag gggctttaca ctcgctaaac aaaactcctg 540 gtttccttct tcccaagtaa tggagaagca aaaaacccag atttcgtcct gtttcgttt 599 <210> 40 <211> 599 <212> DNA <213> Homo sapiens <400> 40 gcccgggcgc acctccccag gtaggagcag ctgtggcggc gcggtaggag ccccacagcg 60 tcagggcggg gagggcgctt ggagatcccc cgggtcggcc ccctccgcac cccgatcgac 120 tgaggcccgg agagttcagg aaccggctcg ggagacctca gcgcccgaac tcggagtttt 180 cggacttttc aggcctctgc caagggcttg gactcgcagg tgaaaggacg ggctcatctc 240 acttttttgt cctgagaggg tgagaattgg ccgagagggc gcttggtttt tgtgggaatr 300 gggagggaga agttccagga gactggctcc ccgggccttt caggatggtt tccaaacccc 360 aatcgtggct gccacagcca ctcggcactc cagtcccccc atctttcgaa tgagtattcc 420 taggcccgaa agggaaggtg acttgccatg gccccactgc ggcttctccg cttagcggag 480 tctccaacct gcgtctcctt taggactgcg cttcccaact gtgtggtaga ggtagccgct 540 ttcccttttt gggccccagg tccctcgact gtaccggggt ctggatctct caagagtcc 599 <210> 41 <211> 599 <212> DNA <213> Homo sapiens <400> 41 ccggtgggat agatcggttc gtgtccgcca tgtgagccag cgtagggacg aaaactcata 60 gacacatcgg ctgttcacac gttccccgca atctgagaac gaacaggaat ggagagagga 120 ctcaactggg acccacgtgg aaaagaccga gcaggccaca gaggctcggt ctccccgcgc 180 acagcgtagg cacccggtgt actctgtaaa cgggaggagg tggggcgagg cagccagagc 240 ccttggactg gcacagggac cctcgatgga gcgaagccct caaacgggat gctttctggy 300 attctatcgg ggagggtcct tggcggtaac cagagggcag cgtagtgtca acaccagaga 360 ccaggatcca aattgtgggg aatcagtttc agccttccat gtgctgccgg aactcgggcc 420 tttttacgcg gttcgtcctc tagtgccttt aactgcgtta ctacaataaa aggctgcggc 480 agcgcctttc ttcttaaagt gaggaggaca aatttgcaaa agaaataggc ttttcttctt 540 ttttaaattg gagaaatctc tgctctggtt gacctgggct ggttttccct gtctctgag 599 <210> 42 <211> 599 <212> DNA <213> Homo sapiens <400> 42 ttctttccat agctgggccc ctgctttgct taaaagagtc ttgtagggca aagcccgagt 60 ggtcagagag ctactggaac accaacccca caaggcagct aactgacagc ctttcctaag 120 ccttgtcaac tccacctcct ggccatttca gaagcaatct ttcctctcct tcctttcact 180 tctttccatc ctcgcaaccc ttacacacat ccagggcttc accactgtgt tagtcctctg 240 acccagagct ctgttccagc agtatgtttg gtcccaccac ctatggacag tttggcctcr 300 ccagggctca gggaaggcag ggagcgctac acaccagcca cccaaggtga ggccccctac 360 acagacctga gcagctgttc ctcatctttt catattcctg aattacattt aaacccacaa 420 caggagggca agctcagctc tcctggccag ccccagggtt ccctagagtc ctaccctagt 480 ggctgataga catgatgacc atgcggatgg cttcaggact gacaaaaaca cccctgaacc 540 tatagaagct gggaccctgc tcagtgctga atctttcccc gaccctcctg ccaaaagtt 599 <210> 43 <211> 599 <212> DNA <213> Homo sapiens <400> 43 cgccagggct cagggaaggc agggagcgct acacaccagc cacccaaggt gaggccccct 60 acacagacct gagcagctgt tcctcatctt ttcatattcc tgaattacat ttaaacccac 120 aacaggaggg caagctcagc tctcctggcc agccccaggg ttccctagag tcctacccta 180 gtggctgata gacatgatga ccatgcggat ggcttcagga ctgacaaaaa cacccctgaa 240 cctatagaag ctgggaccct gctcagtgct gaatctttcc ccgaccctcc tgccaaaagy 300 tgggctacat ctgcccaggc aaaggccagg gctacatgca catgcaagac cctaagtttc 360 caggacacca gggagaaagg ttgctcctgt gagaccctca gaccccagcc cagtagggcc 420 aagttagcca aactctccct caaagcttct tatttctaga ccccaggata atccctgggt 480 ccccagtacc tgaacctagg gtagaagatg gtgctccgag tctgaatctc ccctcatgcc 540 tgcttatcac ctgcaagacc cctgcttctg ggctgctttg cagttgccca cctgtctag 599 <210> 44 <211> 599 <212> DNA <213> Homo sapiens <400> 44 tggcgcttac ggccaccttg gcctcggggg cagggcatgg gcggcccccg ccagatcgcc 60 cagcgccagt actaactgcc ctcgctctgg ccttcgagcc cgaagcctct tctgcgcgca 120 caacctaggc agtaatccta aactagcggg caccacagac cagctgcagc caccccaacc 180 cagggatcac ttccggaccc ctcgaccgcc cggcaccagc gcgcaaggga cccttcagcc 240 ggagaccaga gtccagtccc ggtcacgagg ccaccgccgc tgcccgcctc gagaagcacm 300 acgcgggctg agccgtcggc tagcgggtca ctcccgagcc tctgtctgca ccgcgccagc 360 cccagaccac ggacgctgag cctccagcgc gtgccagcct gggccgctgg gctctcgggg 420 ccagcccgcg acgatcccct gagctctccg cagaagggcc gagcgtccgt tccggggacg 480 ccaggcccgc ccccgccccc cgacagccgc ggggatccag agcccggggg tgcgggacgc 540 ccgcgccatg actgccgaga gcgggccgcc gccgccgcag ccggaggtgc tggctaccg 599 <210> 45 <211> 599 <212> DNA <213> Homo sapiens <400> 45 ctgggaccct gctcagtgct gaatctttcc ccgaccctcc tgccaaaagt tgggctacat 60 ctgcccaggc aaaggccagg gctacatgca catgcaagac cctaagtttc caggacacca 120 gggagaaagg ttgctcctgt gagaccctca gaccccagcc cagtagggcc aagttagcca 180 aactctccct caaagcttct tatttctaga ccccaggata atccctgggt ccccagtacc 240 tgaacctagg gtagaagatg gtgctccgag tctgaatctc ccctcatgcc tgcttatcay 300 ctgcaagacc cctgcttctg ggctgctttg cagttgccca cctgtctaga tggcctacct 360 ttccattacc atgccttcca gatccagtgc tctgccagtt atcctggata tgctcccaat 420 gcccagttag tgacaggcct gagagtagcc cctgggtctc ctgatacatt agtgtattta 480 atatgtgcaa agtggttaca acagtgtgtg ttcatggaag agttatgtat gtctgagtta 540 atattactaa ctttcacaac tctcttacat tactatttat ccccattgta tagatcgac 599 <210> 46 <211> 599 <212> DNA <213> Homo sapiens <400> 46 gaggctcgta tgggcaactg gaacccggct ggagtgtgca gctggccccc tcacttccag 60 cccgcaggct gccgcggggg tgactcccgg gagatgcgcc tagagaggca ggacacctgc 120 acgcatattc gtaacagagg cagaaatact gacggcgaaa cctagagaga cttgcactcc 180 aggcccgggg ggtggggggg cgggggagaa gccttaggga gagtggggag gaggccagag 240 gagagctggc tgctctctcg tgttgaggtt caagtgtctt ccagctcccc gcgcccccts 300 ctcaccgtgc caccgcccac ctcatgcttt gggcgccaag cagccaagca accgggttgc 360 gttgtagggg gaggcaatca gccctgttac ccctcctcag gcggccggac tgagctgcgg 420 gatgggatcc ctacagagac tggcctgggt aaggggaaaa aatcactgcc tcttcctgtg 480 cctctagtgg ttgaactaga atcctggcta gctcatctcg cttttgaagg gggaagggga 540 gtaatcatcg gctcttttga gattgtcttg caaaccatgg actctctccc cagaaatga 599 <210> 47 <211> 599 <212> DNA <213> Homo sapiens <400> 47 catattacct tcattaagat gataatcaaa tgcagtctcc attgggggag gcagaggttc 60 tagtccagct tggacacttg taactgtcat atcttgggca agtcacacac cccttctatg 120 gctctatgga ggctccacac acactcacaa tattcctatt tatttctatt gggaacttat 180 acaagcaatg agatgaaaat cctggttctc cccatgtggt gcaatgtgat cctgggaaca 240 tgctttccca atctgggccc cttccccatc cttcatggta catgcccctg tctgaactgy 300 ttttcatcag ggacatattc ccccagctat cttgtcatgt ctaccctcag gaacaggctg 360 agcacacaca gaaagtcaag ctcgtatgtg ttcaaggcag gggagggttc cttagggcac 420 tgaggaggac cttaggcttt tactagagga tcctttggcc cagactgact tggagacagg 480 gaccccttcc agttggccat tgtgtcctga acagaaagct taatttttct cctaaaccct 540 caactacctc agacttgggg ctagagctga ggggtcagag gcaaagttta ttctatact 599 <210> 48 <211> 599 <212> DNA <213> Homo sapiens <400> 48 acatggtctg gctgggcttt gagctgggtc acacattggc tgctgtaggg aaaactgcca 60 agggagcagg ggaggaagca gggggtcctg ttaggggctg gcactgtgat ccgggagaga 120 tgacagggtc ctggagggct ggcggctgtg gaagcgtggc atggggttag gtggttcctg 180 gagagggaat ggtcagggca aattcatgat gacaggaaca catgggagtg tcagggaaca 240 gcaaatggtg tgttggctgc agcctagggg tgtgggaagg cagctatggg agacgtggcy 300 ggcaagaagg ttgacataag gatgaccgag ggtcccaagt gccaggtgag gcactgaagc 360 gttctactgc agacggcagg cagccttctc cacaggactg gagctcagct tcagggaggc 420 aagctggcag cacggacaga atggaggcag gagtactctt gggaggccct ggctggctgc 480 tggggccgtg agcagaggtg ggagttgagt cctgggaggt ggtggctctc aatttattgc 540 ctggttgcag agcacctcca tgcctgagaa accatgactg gggctctgcc ctgaccacc 599 <210> 49 <211> 599 <212> DNA <213> Homo sapiens <400> 49 ttccctttga gacttctctt ggcttcttat aaataaatgt gcagctaaca gactatctag 60 ccctacccct tgttttatgg aagagaagcc agagaaagta actttccaag gtaacagtga 120 gttatcattg tagaccctag ttcagggccc ttccacagct ccaggggctc agcaggaaca 180 aaactaataa taatcccaac attttccaaa agccactttg ttcagggagt accagccatt 240 ttcacaggtg ttatctcttt ggatcctcac agctcccctg ggaagcagaa ggtttcaaay 300 gcaccctttt caggcaagga aactaaggtc caagaaaagg ggtaatgagc tcaagtcatg 360 tgaccgttgc acacaggagg gaccaaccct caacccgggt gtaacaaatc ctcagtaaaa 420 tgaaccagaa atctgaggct ccttcctccc tggatgtagg aatcaggagg ctgggagaat 480 cacctgttag tgttgactgg cgcttgggaa tcctctggct tcgagcctct gagtagggtg 540 gattctccat atgcccctgg cttatctcca tacggcatgt aaggcttaaa gatagtgtc 599 <210> 50 <211> 599 <212> DNA <213> Homo sapiens <400> 50 aggcaccatt tctgccacct cgaggaggtt taccttctgc cctccatgat gtgaccctgt 60 ctagcaggcc ccctcctgcc cacctggggc atgtgtgcca tctaccagcc cactccacat 120 tctctgcgca ggtctctgtg ctcttccttc agcctggaat tcttctgtcc acctggctct 180 gtctgaagac gccacctcct ctgtgaggcc tctcctgatt tctgagacca cacaaatctc 240 tccctgggct gcgttttcat ggcatgctgc cttcagtcaa gggaacacat gcaagcagar 300 agagctcaga gctgtgtgag aaagaaaagc agcatgtgtg gtctcagaaa tcagaagagg 360 cctcacggag gaggtggcat cttcagacag agccaggtgg acagagggat tcaggctgaa 420 ggagtagcac agagatcagc aaggagaatg gtctagtgcg tggcacacat agtactgatg 480 ggaagggtgt ggcctggcag gcagggtcac atcatggaga tctatgagtg ttctgttagg 540 gtctggaagt ttctcctcag ggcatgagga accatggaag agattttgtt ttttcagtg 599 <210> 51 <211> 599 <212> DNA <213> Homo sapiens <400> 51 tccagagatc cactctggcc tctttcagga actacttaca tacaagaaaa ataaccatcc 60 taacatcata aactagtttt cactattttc ttgtgtgtgg cttttttcac tccacatatg 120 tttgcaagac tcccccatgt tgttagacat aaatgcactt tgttcttgct cattgctggt 180 tgatatccca ttgtatggat gcactgcaat tgttgatgag ctttgtgcag tttccagttt 240 ggggctgtaa accttcctgc acatgccttt acgtgctcct ctgggggtaa atctgttgcr 300 tgcatatcta ggagtggaat tgctgggttg tgggctatgc atatatctac ttgagtagat 360 acttctagtt tcccaaagtt gttctaccca tgtacacgcc caccagggat gcacaggagt 420 tctcattgct ctatattctt gtcaacactt ggtattgtca gtctttttgt gttttatgct 480 tgtttttttt tttttagggg aatgaccacc tggtggaggt ggagtcccac ttgggttgaa 540 gtatactcac tctggcagga atgaaatcag tggtaataga gctagaatga aaaaggcca 599 <210> 52 <211> 599 <212> DNA <213> Homo sapiens <400> 52 gctcctgacc tcaagtggtc tgactgcctc ggactcccaa agtgctgcga ttacaggcgt 60 gagtcactac gtcgggccat cctctaatca tcttttcttg atttttgcct ttcccaaatc 120 caggtttcat attcaaaaca acaaaattgt taagatgttt tcatatctaa acaacatttg 180 ggtgttctaa agtaaccacc aggtaacaca atggtttgct cctatactac ctatgaaagg 240 aatgacgaaa ggaataatta ggtttgtata gaatattgtg cattatagtc ataactgctr 300 tgagaactcc caaatcaggg tggtgtgcag gttagggcag agttttggga gaggcgaact 360 gttctgtaca aaaaggagaa gaatcataat gctgagggga ggggagggac ctgggagagg 420 ggagtgagca gcaagcaggg tggggcacca cctgaatgaa ggacagaagg tgagagccct 480 taggggcaca gcagcacaaa agactttggg agaaaaggaa ttaataagag ggaattttta 540 agttgtttgt catggtgtgt gctatgggcc tccttccctc ttgtcactct tacactgtc 599 <210> 53 <211> 599 <212> DNA <213> Homo sapiens <400> 53 cacccactag atggcgctgt gaggtgcagt gggaagagta gctggaggca aacctttgag 60 attcagattt tggacaaata tttaacttcc tggaggctca gattcctcct tgagatacac 120 ttggcctgta tcccccacaa cacaggtatg tagatcatac gggataacgt gtaagaaagc 180 actttcaagt ataacacgtg gtgacatact tgagcctgtg gactgttgtc actgaccact 240 ccaccctgtg taccagaggc tggggctgtc agagtctagt gtcccaggac cttccccags 300 cttctctatg atcccttcac tcctaccttc accacgtgtg accaagtccc ctggtttccc 360 agctaggaga gattgccaga aaggagctca tgttgatact gtacttgctt gctctttgga 420 aaagcacgta ttgattaatc tcttcacctt tgctgtaccc cttttcctag catggcctgt 480 gtgactccag ggccctagtg ctgctgaggt tggcatggga ggggaatccc ataggaaggg 540 aatgtgaaag aaagccccag catgaggaat aagggaagtt ccacaatgcc catggtgtg 599 <210> 54 <211> 599 <212> DNA <213> Homo sapiens <400> 54 gaggcaaacc tttgagattc agattttgga caaatattta acttcctgga ggctcagatt 60 cctccttgag atacacttgg cctgtatccc ccacaacaca ggtatgtaga tcatacggga 120 taacgtgtaa gaaagcactt tcaagtataa cacgtggtga catacttgag cctgtggact 180 gttgtcactg accactccac cctgtgtacc agaggctggg gctgtcagag tctagtgtcc 240 caggaccttc cccaggcttc tctatgatcc cttcactcct accttcacca cgtgtgaccr 300 agtcccctgg tttcccagct aggagagatt gccagaaagg agctcatgtt gatactgtac 360 ttgcttgctc tttggaaaag cacgtattga ttaatctctt cacctttgct gtaccccttt 420 tcctagcatg gcctgtgtga ctccagggcc ctagtgctgc tgaggttggc atgggagggg 480 aatcccatag gaagggaatg tgaaagaaag ccccagcatg aggaataagg gaagttccac 540 aatgcccatg gtgtgggaga atgcaactcc caccaggcct gctgggcctt ctatctatc 599 <210> 55 <211> 599 <212> DNA <213> Homo sapiens <400> 55 gctgacatgc aaaacaacac aggctcccaa cccttgtgaa atactgaaga caagtcagtc 60 tggacagtcc tcagcagctc ccagatccca aaacctggca gaaccatttg caacaggaat 120 ggagccagct tttctggggt ctgccctctg cacagcgagt tcctggaggc tacagtcctg 180 gtgtctggta gttgatcccc agtagatttt ccatttgtct tactcactgc tctcctaagg 240 gcctccagcc taatttaggc caaagaatct gcattgcatc ccccgccccg tcccaatccm 300 agccccacct caggcccacc ttcaatcctc tcccccattc taactctcac cccagattag 360 ggcctgtggg gtatctttcc ctagagccca gaaagacgta cagtctctca tcccaaggga 420 aattcaatga ctgaattggc actgattgca aaagcaacta gaatatttgt ggcatttact 480 tttttttggt ccaaagatct caggaaacct tgaatccttc agctgtcaac attcctcagg 540 atagcgtggc ctctcagacc agagcaccca tctccatcct tgctggagaa tgtcccgtc 599 <210> 56 <211> 599 <212> DNA <213> Homo sapiens <400> 56 tctttttcat tcctgatgtt agtaatctgt cttctctctt tttttccttg gccaatctgg 60 ctagaagttt atcagtttta ttaatccttt taaataacca gcttttcatt tcactaatat 120 tcctctgttg ttccgttttc aatttcattg agttctgcta caataaaaca tttaatttct 180 gttttgtaat gtttctctgg atgctttcaa aatacttttc atttcctctc atttccagta 240 gattaataat aatgtgtctg gacattgttt tctttgaatt tatcatattt cagatttgtk 300 gagtttcttc tttttctttt ttcttgagac agggccttgc tctttcaccc aggctgtagt 360 gcagtggtgc aatcacggct cactgcagtc tcaacctccc aggctcaagt aatcctttca 420 cctcagcctc ccaagtagct gagacatgcc accaggcctg gctaactttt tttttttttt 480 ttttaagaca ccaggatctc cctatgttgg ccagactcgt ctcaaactcc tgggctcaag 540 tgatccacca cccttgttct ccaaagtgct gggactacag gcgtgtgcct ggccttgct 599 <210> 57 <211> 599 <212> DNA <213> Homo sapiens <400> 57 gctgttaggc tacaaacctg tatagcatgt tactgtactg aatgctgcat gcaattgtaa 60 cacagtggca tttgtgtacc taaatatatc taaacagaga aaagaaacag taaaactatg 120 atatcatgat ctcgagggac cactgttgta tatgcagccc atttttgacc aaaacattgt 180 tatatggtac atgactgtat tatgctgtaa gatgctggat cctattaaag tcctctgggg 240 aacactgatt ttttttttta acctaacaat tctttccagt taggtttaga ccacaaattw 300 tgactcacct tctgtggaca gaggttccaa agtcagttca gttttcaaag ccatcccctg 360 tctcagcctc ccatttaaca ccacttgctt tcccttggcc cattagtttt aagcattatt 420 tatgtcatct tactatattt ttgaaggcat tttcatatgt gaccttgtat cttggcaaag 480 atcagatatt aggcaaagaa ctaagaaata caaatctcca gctccagtat gatgaggagg 540 tccctgcctt gaggtccctg agcgccctgg ataacctgcc tataccctct tggactcag 599 <210> 58 <211> 599 <212> DNA <213> Homo sapiens <400> 58 gatcctgcct tggttctgtc agttctctcg tatctcaact cctcccctaa tcccagcaga 60 gcctaaactc ccaagtctgt tgacaaccct actgcacccc tagcccaggc tctgctccat 120 cacctgccaa catcccagcc tggcctttct cctaggtctg cccacctctg catcagtaca 180 gccaccttat ccagaggggc acagccaatc ttggactcca agcctctcct ttactgttga 240 ctcaagtgac tgagctcaga cttcccattc tgacagcggc aaggtccagt ggtaggaagr 300 gcaattccta ccactcatag cctagctcac tacatgcaag tagacagtga accagtgggt 360 ggagctgatg agtgagtgat ctgcaggcag agactccaga ttggatgaac cacacagttt 420 tggcaagcat tgggtcaagg agctctctgg tggctcagcc ctgccagcaa catcatccac 480 atgggcgtct gtcttctgcc tggaggcaca gcgccttatc cataaacctg tctctggaag 540 aacagaaaac gtcagtgcac cctcagggac aaagctgccc aggcttagcc agtttgcct 599 <210> 59 <211> 599 <212> DNA <213> Homo sapiens <400> 59 tcatacattg aattttaggg accccctaga tccccctgaa gtctgcttat ctagccaggt 60 aagccagaac agagtggtag aaaaaggcta tcaatgaaga gaaacacaat aaaaatatta 120 cctaggttta taggtcattg aagagttcag aagacacttt cccaagcatt atcctggcaa 180 caactctgta aggtcacaga gctagaggca gggtgcagtg acttgcctga ggtcacgagc 240 tagcccatgg cagggcagaa agcgcttgaa gtttctgagg ccaagcccag tgctcttcgy 300 atttcccatc ttgcttccca ggaggttcca tgcagatcct gtgggaatgg gcgtttctgc 360 ccttattccc ctgtgcattc ttcacgagtg gttggatttc catggacttc attctgccaa 420 agactcatgt gctgaatcat atggaactgc tgaccttcca ataaaccagc atgatttgct 480 aaggcgtaga gccaggctga gaaggaagag gactcaggcc agactggtgg gttggaatcc 540 tagctgtgca gccgagcagc ttgagcacgt tactcaacct ccacccaatg tacgaaaag 599 <210> 60 <211> 599 <212> DNA <213> Homo sapiens <400> 60 agcttgaact cctggtgttt tcctccaagc cagtgaaatg ggaataaaat ctgctatcaa 60 gggctccccc tacaggcacc aaaaagcaaa ggctaaaaat taaggtgggt gccatttacg 120 cctagtagag aattgtttct tctcttgaaa aagtttctaa ggcagtcctg aaaccacaac 180 tttgcttgtt gacacaatcc cttttccaaa actctggcca aagagtctta aaaatctaaa 240 ggaccaagaa tcaagcaacc tcttcctctt gatgtactca cctcccactt aataaaggam 300 caaatgtgat tttgatacaa ataggacaca aaacgaccct agagctgtaa cactattttt 360 gacagtcata attatggcac ttttgagttt tcttgtagct catttccatc tcatttttag 420 gattagtgtg tatttgtgtg tgtgtgtaca tgcgtgtgtg tacatgcacg caccaaaaca 480 acttcaattc cggacataaa atcaatgaca gttttaaaac cacttgatgg aaggtttgag 540 ggaactttta tcatttattt attttgtgct acaaatcagg tatatttaat tctctgggt 599 <210> 61 <211> 599 <212> DNA <213> Homo sapiens <400> 61 aaaatctgct atcaagggct ccccctacag gcaccaaaaa gcaaaggcta aaaattaagg 60 tgggtgccat ttacgcctag tagagaattg tttcttctct tgaaaaagtt tctaaggcag 120 tcctgaaacc acaactttgc ttgttgacac aatccctttt ccaaaactct ggccaaagag 180 tcttaaaaat ctaaaggacc aagaatcaag caacctcttc ctcttgatgt actcacctcc 240 cacttaataa aggaccaaat gtgattttga tacaaatagg acacaaaacg accctagagy 300 tgtaacacta tttttgacag tcataattat ggcacttttg agttttcttg tagctcattt 360 ccatctcatt tttaggatta gtgtgtattt gtgtgtgtgt gtacatgcgt gtgtgtacat 420 gcacgcacca aaacaacttc aattccggac ataaaatcaa tgacagtttt aaaaccactt 480 gatggaaggt ttgagggaac ttttatcatt tatttatttt gtgctacaaa tcaggtatat 540 ttaattctct gggttcgtgg aatgagcttg gatggttgcc tgctctcaaa ggctaaaaa 599 <210> 62 <211> 599 <212> DNA <213> Homo sapiens <400> 62 atcccagcta ctcaggaggc tgaggcagga gaattgctcg aacctgggag gcagagattg 60 cagtgagccg agatcacgcc actgcactcc agcctgggcg aaagagcaag actccatctc 120 aaaacaaaaa caaaaacaaa aaaacagtaa caattttctt gaacttctga gggtgatttc 180 cttttctgat acaaagacat ccaaagaaat ctcagagagt ctctatttta gaatcagtat 240 taaatatata tacatatata tatgtgtgtg tgactatgtc acaaagtctc tgaaacacak 300 aagtttaatc tcaaaaacta tctctacttg ttttttattt gttagtttcc tgatataggt 360 ttgatttgga atcaaataga aaggtcaggc ttttccagac agacaggaaa accaatatga 420 attactgaat agatcccctc aactagaaag tctctgctgg aatgaacttt gtctaatttt 480 atcaagtgca ccaagaacag cttctttcag aaattatcga gacagcatca ccttttgatt 540 ctttaatatc aacagatcaa aaagcatttg gtgatttctc tgtattttat atctctttg 599 <210> 63 <211> 599 <212> DNA <213> Homo sapiens <400> 63 tatgttttat acataccata ttaaaaataa aatacattaa aaatcctaca aacataggaa 60 gttttgctgt ttcttaggga cacagatgtg agagagtccc aaagcaaagg gatgttactg 120 gtaactgcgg gtctgtgata ctagctttct ggtgcagcct ctctcgcctg tagctggtgt 180 tctgggtgtg tgtgggttta gttctctttc ttgtggcttt ctgaggatgc tgggactgtc 240 atgcatttcc ttgtctctgt tctgagaaga aaatgacaag gaattaaagt ctacattgar 300 tatagaaaag tgacattttg gatatcagaa aagtgacatc ttggctgaca gaaaatgaaa 360 gctcacctgt cttaggagac taaggaaaaa tactaccatg atttttctgt ccagtaaaac 420 aaaaatttgg gggtgtacaa gttaaaccta atgataataa acacctcttg acggtgacag 480 tctccgtaat gatcaaatag ttttccaaac cctgtccatg tcaagtgatc tttaaggaac 540 caaccagatt ccatattgaa gtttgttgta attaaattca acctgcatga tagtgctca 599 <210> 64 <211> 599 <212> DNA <213> Homo sapiens <400> 64 tgttttgtat atgcttaaaa ttccaatttt ttaaattaaa catatatatc aaatatacat 60 gttatccctt actcatttat agacttcata taatcctaat cagaatccca acagaagaca 120 aaataaatgt aacatatatg ctaatagaat actaagcaac attttacatg atgctcttaa 180 aaaatattta actacataga aagtcattta tacatattat taaagcaaat tatgaaggat 240 tatgtgtaga aaacttccat ttatataaaa aataggccaa ctgaggacca gagctcagay 300 aaggagtttt tgcagaaggt taagtatcag agaggtatgt ccaagtgagt gcttcttaac 360 attcactatg ctttggaatc atctgggggg actttttttt tttttttttt tttttgaggc 420 tgagtctcgc tctgtcatca ggctgatgta cactggcaca atctcagctc actgcaacct 480 ccacctcccg ggtcccagtt caagcaattc tcctgcctca gcctcccgag tagctggagg 540 cgtgcaccac catgcccatc taatttttgt atttttagta gagacggggt ttcactatg 599 <210> 65 <211> 599 <212> DNA <213> Homo sapiens <400> 65 gagccaatgt acccagcctc atctgggagg actttcaaaa tatacagatc accaggccct 60 acaccaaaat attctatttc aattggcctg aaatggagcc caggcatcca tagattttaa 120 aaactcttca ggtgatttca atgtatttcc aggtgatttt aatgtgcagg actgagaacc 180 aattatctag atttacaaag agaagcatag aaagatgggt ggagaataga aatgtgatag 240 agatgtaata gatatatgat tgatggacag atgaaagatt tttaataggt agatagatay 300 gtaggtgaca catggataga tgatagattt ttgaaacatg atggatgaga cagaaatatg 360 gatagataga tagataatag gtaattaagt agataaacag tagacctgaa gatctgaagg 420 aagggaagag aaaaaagagg aaaaagggat gggaaaagaa ggaatggaat ttggaatgac 480 aggtcagaaa tggcccacaa ctcagaccct caatggacaa aagaaaatga aacaaaaatg 540 aatttggaaa aataaaaggt gaataggtac agctaatgca atgaaatgta aaagttgtc 599 <210> 66 <211> 599 <212> DNA <213> Homo sapiens <400> 66 ctgggactat aagtgtgcaa cactgcactt acctagtttt ttaaattttt tgcagagata 60 ggggtcttgc tatgttgaga aggctggtct ccaacttctg gcctcaagca atcctctcac 120 cttggccttc caaagtgctg gggttataga atcacacttc ttgaccattc tcaaaaacca 180 ccgccaccct caaagaaggt ggccaaatct acacagatag aactttacct gtccctcgct 240 caggactctg aaagagcatt ctctgcccag agccatgagc aacctgaaag cagaattgcr 300 ccccatttgt ctaccccaag tgatcatcac agaaaccaac acttagtagg gactcaataa 360 atgctattga atgaaagaaa acataaatct gaatgaaaag ttagccacaa gacatgtcac 420 atgctgtgac gaaaagagtt gggaatcaaa agaactggtt ctggctctac taataatgca 480 ttatgggcac tcactggccc tctctggatc tcagggatcc cattaattga actgagagag 540 gtggagtagg tattctttgg cagtccattt cagctctgat tttgtgtgag gctgtaggg 599 <210> 67 <211> 599 <212> DNA <213> Homo sapiens <400> 67 tgaggccagg ggctagagac cagcctgggt aacatagtgg gaccctatct ctacaaaaat 60 aaaagaaata aaaatttaaa caaaattagc caggcatggt ggttcatgcc tgtaatccca 120 gctacttagg aggccaaggt ggaaggatcg cttgagccca ggccctcaag gctgcagtct 180 tctatgatcg tcccattgca ctccagcctg ggcaacagag cgagactctc tctctcaaaa 240 aaaaaaaaaa aaaaagccca caaacagttg aaggatcagg aagagggtat gctgaggcck 300 agatggagtc actggtgagt tccaccaaat gtttaatgaa taacaccgat acttcataaa 360 ttattccaat aagatagaag aggaaggaat acttcacatc tcaatccgtg aagccactat 420 taccctgatg ccaaacaaga cgaagatatc atgagaaaag catagaccaa tatattttat 480 gaatatagat gtaaaatctt caagaaaatg ctagcaaact gaattcaaca acatatgaaa 540 aggattatac accatgccca agcggtattt atctcagaat gtaaggttgg tgcagcata 599 <210> 68 <211> 599 <212> DNA <213> Homo sapiens <400> 68 ataaatagta tactttaaaa tagtgaattt tattttatgc aaaatatatc tcaataaagc 60 tggatttttt taaaaggtca ttatagcaaa ccaggcaaga gattgttgta gcttaaacca 120 ggataatggc aatgaaaatg aacagaaata aacaaactga aagaattctg gggaagtagg 180 aaagatagaa cttcagaatt gattggctat ggagggagaa tgagagtgat atgttccaga 240 taaattaaga agctaaataa tttaaaatca tggaacacaa acatttgtag gaaatatgcr 300 tataaaaagt ttagaaggaa aaatacaaaa atggtaataa tagctatgtt atagtaagag 360 aaattaaata actttttaaa atctcatttt ccagaatttc tataatgtga ctgactatat 420 tgcttttgtg tttaaaaata gtttttggcc aggcgcggtg gctcacgcct gtaatcccaa 480 cactttggga ggctgagatg ggtggatcac ctgaggtcag gtgttcaaga acagcctggc 540 caacacggtg aaactccgtc tctactaaaa atacaaaaat tagctcggtg tggtggcac 599 <210> 69 <211> 599 <212> DNA <213> Homo sapiens <400> 69 gtcattaaag aagatctaca gatggaaaaa agcacataaa aagaagctca acattgtttg 60 tggtaagcag cttctaagat ggtccccagt gatttccaca ttctcgtatt cacactctgt 120 gtgatccctt cctcttgagt ataggttgga catagtcact cctttctaac aaatagaata 180 tgaataaaag tgatagaaag cagctctgag attaagctac agaaagactg tggtttccat 240 ttgggttctt tctagttttc tttctcagtt caccagcctg aggatgctcg ggcagcctay 300 ggaggtccac atgatgaaga actgaggtta accaacaacc atgtaagtga actggaagtg 360 gattttgcag tcccagtcag ccttgagatg atttctactt gactgcaaac ttataagaga 420 ccctgaacta gcctcaccca gcccacctaa gccacaccca gattcctaac ccgcagaaac 480 tgtgagataa taaatgtttg ttgttttaag ccagtaattt gggggtaatt ggttgcacag 540 cagtagataa caaatatatt attagtcatg aggtaaatac aaactaaagc taccaatga 599 <210> 70 <211> 599 <212> DNA <213> Homo sapiens <400> 70 aacccacccc tgctggattg ggagaatgat ttccaagggt ctggaacctg cccttcctaa 60 cttccagatg attcataaac gttaaggagc actgtggcag agaagagggg aggacttggc 120 catgaccatg ttccttctca agaaactgag aaggaagcaa tgggaagaga taggaaatgc 180 cccgaggaga tttttgtgta tggttttgat ccaaacgggt aaacttgtga cctgtgtact 240 caccaaatca tttaatgtga actcactgtg gactcacaga atcttcaaat gcattattcr 300 aagagaacat ttatgaaata gaaatttagg ggtccttggt ttgcgaaaat cttagaatca 360 tgatcttgga aattctaatc tcatgatgct aggtatttgg tctcggccac aggagtagct 420 tgatattaac aaagtttgag aaaaccatca gaattctaga agaatgaggt cacagacaca 480 agacactgaa gaacagaaaa tcctgagaca agaaggcttt tagccatagt cgttgcagct 540 taaaagtaga ggatcataaa gtcatgggac taatcattac agcatataat cacaaacat 599 <210> 71 <211> 599 <212> DNA <213> Homo sapiens <400> 71 ttactctcag aagataaagc ccccagcagg gacactcata aaaaggaatc cgaatctgga 60 gtgcttagga gattgcctgc tctgtccatc ccctgaaatg aaagaatgat ggagccggcc 120 catgggtctc acccactaga tggcgctgtg aggtgcagtg ggaagagtag ctggaggcaa 180 acctttgaga ttcagatttt ggacaaatat ttaacttcct ggaggctcag attcctcctt 240 gagatacact tggcctgtat cccccacaac acaggtatgt agatcatacg ggataacgtr 300 taagaaagca ctttcaagta taacacgtgg tgacatactt gagcctgtgg actgttgtca 360 ctgaccactc caccctgtgt accagaggct ggggctgtca gagtctagtg tcccaggacc 420 ttccccaggc ttctctatga tcccttcact cctaccttca ccacgtgtga ccaagtcccc 480 tggtttccca gctaggagag attgccagaa aggagctcat gttgatactg tacttgcttg 540 ctctttggaa aagcacgtat tgattaatct cttcaccttt gctgtacccc ttttcctag 599 <210> 72 <211> 599 <212> DNA <213> Homo sapiens <400> 72 gtgaaaagat agtttgagcc caggggcaga agttgtagtg agctatgact gagccactgc 60 acgccagcct gggtaacaga gagagactct gtctccaaaa aaaagaaaga aagaaaaaat 120 aattagctgg gcatggtggc aaacagttac tcaggaggct gaggcaggag gatcacttga 180 gcctgggagg tcaaggctgc agtgagccgt gattgcacca ctacactcca gcctgggcaa 240 tagagcaaga ctgcctcaaa aaacaaaaca aaacaacaaa aacagaagcc attcatacay 300 tgaattttag ggacccccta gatccccctg aagtctgctt atctagccag gtaagccaga 360 acagagtggt agaaaaaggc tatcaatgaa gagaaacaca ataaaaatat tacctaggtt 420 tataggtcat tgaagagttc agaagacact ttcccaagca ttatcctggc aacaactctg 480 taaggtcaca gagctagagg cagggtgcag tgacttgcct gaggtcacga gctagcccat 540 ggcagggcag aaagcgcttg aagtttctga ggccaagccc agtgctcttc gtatttccc 599 <210> 73 <211> 599 <212> DNA <213> Homo sapiens <400> 73 gcccaggggc agaagttgta gtgagctatg actgagccac tgcacgccag cctgggtaac 60 agagagagac tctgtctcca aaaaaaagaa agaaagaaaa aataattagc tgggcatggt 120 ggcaaacagt tactcaggag gctgaggcag gaggatcact tgagcctggg aggtcaaggc 180 tgcagtgagc cgtgattgca ccactacact ccagcctggg caatagagca agactgcctc 240 aaaaaacaaa acaaaacaac aaaaacagaa gccattcata cattgaattt tagggacccs 300 ctagatcccc ctgaagtctg cttatctagc caggtaagcc agaacagagt ggtagaaaaa 360 ggctatcaat gaagagaaac acaataaaaa tattacctag gtttataggt cattgaagag 420 ttcagaagac actttcccaa gcattatcct ggcaacaact ctgtaaggtc acagagctag 480 aggcagggtg cagtgacttg cctgaggtca cgagctagcc catggcaggg cagaaagcgc 540 ttgaagtttc tgaggccaag cccagtgctc ttcgtatttc ccatcttgct tcccaggag 599 <210> 74 <211> 599 <212> DNA <213> Homo sapiens <400> 74 ggagcgagta cctcggagac agtgcgcgcc gcccggggcc tcatccacag cggggtcgcg 60 ggcggccccc ttagcccgcg tgactgtggg atcctgagaa cattccgctg tatgtcttgg 120 aaccttctaa ccctaggaat ttgcaaaccc ctcccagtcc ctcatctggg ggctcagaga 180 ctggaggtgc cttttttatt tttttcttct tcactttatg aacacagaaa aatcgtttgt 240 ccctctccgg gccctgcacc cgccagcgtc gtgtgcaggc gtccccgggc tgtggataay 300 tagacacgtt cttccctcat tgcccaaggc tcgttagaat tcgccctaga gctgtatcat 360 gtattttctt tcaaattaac tttgcttgca attaagctta gggaaccagc aacaaaagca 420 aacttggccc gaggtcgttc accgcgaaaa tggattagag aaacttcttc cccgatttaa 480 ggggaaagat tcctgcggcc agcgctttgg ggaaagtgcc ccgaccgcag aggcgacgac 540 aggggagcag gaagctgctc acggtagtcg gcgttggcgg cagcggtggc cttcctcat 599 <210> 75 <211> 599 <212> DNA <213> Homo sapiens <400> 75 attgcccaag gctcgttaga attcgcccta gagctgtatc atgtattttc tttcaaatta 60 actttgcttg caattaagct tagggaacca gcaacaaaag caaacttggc ccgaggtcgt 120 tcaccgcgaa aatggattag agaaacttct tccccgattt aaggggaaag attcctgcgg 180 ccagcgcttt ggggaaagtg ccccgaccgc agaggcgacg acaggggagc aggaagctgc 240 tcacggtagt cggcgttggc ggcagcggtg gccttcctca tctgggcgat gtgggctcck 300 agaagagtaa ggataacatc ctggaaatga cttctgtacg gtttgagccc aactgcacac 360 tcatgacttg gagctgccct gtggagttac agtttaccaa acacattcat gaacataatc 420 tcatttacta aaaactttgt gagaattttc ttttactaaa attttttctt attacaaaat 480 cagtagtgtt cattgtttta aaagaaataa caggtaagaa aaataaagag ggagggaaat 540 aacagcaaaa aaaaaaaaaa aaaaaggctg gcggggggga acccatagtt ggcccagag 599 <210> 76 <211> 599 <212> DNA <213> Homo sapiens <400> 76 ggggtcccag gggaggccac gggccgcggg gcgggcgggc ggcgccgcaa gcgccccctg 60 cagcgcggga agccgcccta cagctacatc gcgctcatcg ccatggccat cgcgcacgcg 120 cccgagcgcc gcctcacgct gggcggcatc tacaagttca tcaccgagcg cttccccttc 180 taccgcgaca accccaaaaa gtggcagaac agcatccgcc acaacctcac actcaacgac 240 tgcttcctca agatcccgcg cgaggccggc cgcccgggta agggcaacta ctgggcgcty 300 gaccccaacg cggaggacat gttcgagagc ggcagcttcc tgcgccgccg caagcgcttc 360 aagcgctcgg acctctccac ctacccggct tacatgcacg acgcggcggc tgccgcagcc 420 gccgccgccg ccgccgccgc cgccgccgcc atcttcccag gcgcggtgcc cgccgcgcgc 480 cccccctacc cgggcgccgt ctatgcaggc tacgcgccgc cgtcgctggc cgcgccgcct 540 ccagtctact accccgcggc gtcgcccggc ccttgccgcg tcttcggcct ggttcctga 599 <210> 77 <211> 599 <212> DNA <213> Homo sapiens <400> 77 tgaccctgcc acccgtcggc ccaaattcca gacccagcct tgtgaccttg aagagtgcag 60 gtattgggcc gccctcctct ccctaagaat ctttgcaggt atggagttca agggttctcc 120 ttcattcagc tagacaagct ggctgtccca ggtgcagagg tcaggatgac ttgcctggtt 180 gagaagaatg ggaaagtaag agttctccac ccaggagttt tgttctgggc tgcagaagag 240 cccaggcgtg ggactggggc tggagaaggc tggtttttgc ccttagtgcc agagttgags 300 ctttctctgt ttcctaatga gcaagtccag tgctttgaca gcaccactaa tcttaagcca 360 gtcccttctc ctctcgggtc gtcatttgtg aaatgggaat ttgtgactgc tacctcagat 420 aattttcctg aagttaaacg agaggagagg tgaaaagcgc tttgtaaact gcaaagcgca 480 gagcatagca gggctgaaag gctttaaata agcgctgcct tgtaacaaag cctcctggag 540 tgtcatgata aagccccggg aaggagaaag acagggtggg aaagagcgga cattttcgt 599 <210> 78 <211> 599 <212> DNA <213> Homo sapiens <400> 78 cgacagccct tctcggcctc ccaccggccg acgacaccaa gagctcgcgc accggccggg 60 ccaggtggga atgggcgccg cgcaggggag cgagtacctc ggagacagtg cgcgccgccc 120 ggggcctcat ccacagcggg gtcgcgggcg gcccccttag cccgcgtgac tgtgggatcc 180 tgagaacatt ccgctgtatg tcttggaacc ttctaaccct aggaatttgc aaacccctcc 240 cagtccctca tctgggggct cagagactgg aggtgccttt tttatttttt tcttcttcay 300 tttatgaaca cagaaaaatc gtttgtccct ctccgggccc tgcacccgcc agcgtcgtgt 360 gcaggcgtcc ccgggctgtg gataattaga cacgttcttc cctcattgcc caaggctcgt 420 tagaattcgc cctagagctg tatcatgtat tttctttcaa attaactttg cttgcaatta 480 agcttaggga accagcaaca aaagcaaact tggcccgagg tcgttcaccg cgaaaatgga 540 ttagagaaac ttcttccccg atttaagggg aaagattcct gcggccagcg ctttgggga 599 <210> 79 <211> 599 <212> DNA <213> Homo sapiens <400> 79 aggattccaa gactcagaaa gtactcaaag gaggagatga agcactccac cccatctctg 60 tccccttgcc accctgccct ctctgctctc tgtggtcaga gccacaagac agcgctggag 120 tgctagctgg ggttccgggc cagaaacagg aggcttctag aagttattct ggcatctcta 180 atctcaataa cacatttttt caaagttctt tctctttgac cagggcatag gaatcaccta 240 agggtcttat agaaaggcag gttctggtct aggaggtctg gggtgaggcc aaagaaccar 300 tatttctagc aagctcccag ggaatgtcct tgcagccgac ctccatctct tgtgtaaacc 360 aacagggagg gcttgcctcc ctttgccccc aggccttgct cctggccctt gcagaagtgc 420 atcttgcatt caagtgacca aaagaagagg cattagaaaa tgtgaaaggg taaaagggga 480 cctgcaccca gttttatagg tggggaaaca ggcccactcc atgccagaag gaatttgttc 540 aagacctcac agcaatttag tgacaaagtc aagactcagg cctcctgtat aggggaaaa 599 <210> 80 <211> 599 <212> DNA <213> Homo sapiens <400> 80 ccccatcctt catggtacat gcccctgtct gaactgtttt tcatcaggga catattcccc 60 cagctatctt gtcatgtcta ccctcaggaa caggctgagc acacacagaa agtcaagctc 120 gtatgtgttc aaggcagggg agggttcctt agggcactga ggaggacctt aggcttttac 180 tagaggatcc tttggcccag actgacttgg agacagggac cccttccagt tggccattgt 240 gtcctgaaca gaaagcttaa tttttctcct aaaccctcaa ctacctcaga cttggggctr 300 gagctgaggg gtcagaggca aagtttattc tatactcagg caattgactg ttgctaaggg 360 agggtataga gcttgaaccc aaggtcccta cagtgcctca gcccgaaatc aggacgtggc 420 ttcctgccct ggctctgtca ccccagcttt caagatgttt tcagatatac tcttgttgaa 480 tgtcattgtc acagtcaccc atacagctgg aaacaggaga tgaggtacag tctaagggct 540 aggattccaa gactcagaaa gtactcaaag gaggagatga agcactccac cccatctct 599 <210> 81 <211> 599 <212> DNA <213> Homo sapiens <400> 81 atccgagctt ccgttctcag aagagggagt gtggggctgg cagaggggtt caggaactcc 60 acagggagca gacagcattc ctcttttgag gccaagcatt gaggaccatg ccaggggctc 120 tgcaaaggct ggctttggcc tcagccaggg agaggagatg ctggagagag ggccggggca 180 ggagagcaga actcactaag ggcattccat ctcgccccta ctctgcctgt ccatcccatt 240 taaaattttg ttcactgctt agtttggcct gaggagcact aactacacta ctttctctcr 300 aggtagttct aagctattta tttaacaggt aagtccattc ctcaagctgc agtccatccc 360 cactccttag cccctacctt cacatcctca ccagattact tttacttcca tattaccttc 420 attaagatga taatcaaatg cagtctccat tgggggaggc agaggttcta gtccagcttg 480 gacacttgta actgtcatat cttgggcaag tcacacaccc cttctatggc tctatggagg 540 ctccacacac actcacaata ttcctattta tttctattgg gaacttatac aagcaatga 599 <210> 82 <211> 599 <212> DNA <213> Homo sapiens <400> 82 gaggtgggag ttgagtcctg ggaggtggtg gctctcaatt tattgcctgg ttgcagagca 60 cctccatgcc tgagaaacca tgactggggc tctgccctga ccacccccac ttgagaaact 120 gctccaggtt ctcagatagc gagataaact ggtgctctgc cccatggctg agatccaccc 180 tgattctggc ttcccaatct cttcctcacc ctgggagggg ctgacagctg ttccctgggt 240 gtctgactag gtgcttcctg gttaaccctt ctgggctgag ctggaaatcc gagcttccgy 300 tctcagaaga gggagtgtgg ggctggcaga ggggttcagg aactccacag ggagcagaca 360 gcattcctct tttgaggcca agcattgagg accatgccag gggctctgca aaggctggct 420 ttggcctcag ccagggagag gagatgctgg agagagggcc ggggcaggag agcagaactc 480 actaagggca ttccatctcg cccctactct gcctgtccat cccatttaaa attttgttca 540 ctgcttagtt tggcctgagg agcactaact acactacttt ctctcaaggt agttctaag 599 <210> 83 <211> 599 <212> DNA <213> Homo sapiens <400> 83 acatttttaa ttttaccttt tctagtagat gtgaaatgat atctcattgt ggtttttatt 60 tgcatatcca taatgaccaa taaggttgag cttcttttca catgctgatt ggccacctat 120 ataacttctt tggagtaatg tctgttgtag tcttttgtcc atttttaatt gggtagtttg 180 ggtgtttctt tgttcttcag ttgtaagaat tctttgtata ttctggatat taaactttat 240 caaatgtgtg atatgaaaat attttctccc tttccatgga ttgtcttttt actcacttgr 300 tagtttcatt tgattcaaga aagtttttgg ttttgagaag gtacaatgta tctatttttg 360 ctgttgttgc ctatgctttt aatgtcaaaa aatgatgtta agaaaccatt gccaggccgg 420 gtgcagtggg ttcacacctg taatcccagc actttgggag gccgagttgg gtggatcgct 480 tgaacccagg aattcaagac cagcctgggc aacatggcaa aaccctgttg ctacaaaaaa 540 tacaaaagtt ggccaggtgt ggtggcgtcc acctgtagtc ccagttactc gacaggctg 599 <210> 84 <211> 599 <212> DNA <213> Homo sapiens <400> 84 gagacccttg tctctacaaa aaaatttaaa aatagtgggg catggtggca tgagcctgta 60 gacccagcta ctcaggaagg tgaggtggga ggatcccttg agcctgggag gttaaggctg 120 cagtgagcta tgatcaggct actgcactcc agcctgggca aaagcatgag actcatctct 180 aaaaaaaaaa tcaaaaacca aaaatcaaat taaagatacc tccccaagaa gttctaagta 240 acatcaaagg caattacaaa tcagtttggt ttaggagtac agtgtcatca gccacaaatk 300 actctgcaca agtatccaca ggcagcagaa ctcatttcaa aactattcaa gactatttca 360 atcagctcat ttcgatcagc tattaagatt tacaatcatg attaggaaag catgtatcat 420 gttgacaggt gtctaatttg gttatgttga tcataaatcc tcagttatct gggagcacat 480 cattaaaatc acctataggc aatacattct tacaactgtt tcctatgtgg tactacagag 540 gatccatgta taattactgt atttctaaaa ctataataca ataatttatt tatgtctta 599 <210> 85 <211> 599 <212> DNA <213> Homo sapiens <400> 85 tcatatatat atacatttgt atatatactt gtataccaaa aaaaattttg ttttagagac 60 gggcttttca cgttacccag actgttccca aactcctggc ctcaaacgat ctgccaccct 120 cagcagccca aagtgctagg attacaagca tgagctgccg tgccccacca ggaaacttat 180 tttttacaat ataaacatcc ctattatata tttaattgag ctttaaaact tatgacttgc 240 cccttctcca tcacggaggt agggcttgct tcaataacct cacaccatga ttataattgy 300 attttcatat atatatatac tttttttttt tttttttttt agatggagac tcgctctgtc 360 agccaggctg gagtgcagtg gtgccatctc ggctcactgc aagctccgcc tcccaggttc 420 acgccattct cctgcctcag cctcccaagt agctgggact acaggcgcct gtcaccacac 480 ccggctaatt tttttatttt tagtagagac ggggtttcac cacgttagcc aggatggtct 540 cgatctcccg acctcgtgat ccgcccgcct cggcctccca aagtgctggg attacaggc 599 <210> 86 <211> 599 <212> DNA <213> Homo sapiens <400> 86 atttttagca gagacggggt ttctctatgt tgaggctggt ctcgaactcc tgacatcagg 60 tgacccgccc acctcagcct cccaaagtgc tgggattaca ggcgtgagcc atcgcgcccg 120 gccaacacat tcttttatcc caaattttta tcaaaacctc acacaactat tcaaccttgt 180 gtgaagtggg gtccgccttc attttccctg cacaggtgct cataaagaat ggtgtcctct 240 cctggggact gtgctcaggg cttttgatgg cagggccatg ttgaggacaa ctgtccagcr 300 ggcaactcca gacaggcatg aaacaatcca ccctctttct gccatataaa tatcagctta 360 ttttgagaag aaagtgtgcc agacactgct agttgtctac ccacccattt tcttcacttc 420 ttgtttgctc gcaagaccct gattttgttc aggtttcagt tggttgtgtc ttatcccttg 480 gcagtgaatc ttgacttgca taaggtaagc gcagtcacta tcctatcact cttgtcagag 540 attgatttgg aaacaggtac aggatacttt ctgggccaat gagatgttca ggaaagtct 599 <210> 87 <211> 599 <212> DNA <213> Homo sapiens <400> 87 cctcacaaag gacacttgaa gttgtgccca cagaggcaaa tgctcatatg gagactcaag 60 aaagcctggg gttcagaaga ggcttgagat catgttatga gaaacagctg aagaaaacgg 120 gggtgctcag cctagggaag accaaggggt ggtatgacag gctaacttgg gagggcaacc 180 agcctgtgtg gcctctctag tgggcagagc tgtcggagga cagagtggat ctcacgttca 240 ggaagaatgt tttaataatg agcactgccc ataaagaata agctgcacag gtcaggggtr 300 tatacctcat ttaggcaggg cctggaaagg ccagatagtg ggaacattga agagactcag 360 gaactggcag aaaactgagc cagattatat ttaacatcct ttttattatt tttgtgggtt 420 ttttttgaga cagggtctca ctctgtcgcc caggctggag tgcagtggca cgatctcggc 480 tcactgcaac ctctgcctcc caggttcaag cgattctcct gccttagcct cccgagtagc 540 tgggattaca ggcatgcgcc attaccaccc agctaatttt tgtattttaa gtagaggta 599 <210> 88 <211> 599 <212> DNA <213> Homo sapiens <400> 88 caatccaccc tctttctgcc atataaatat cagcttattt tgagaagaaa gtgtgccaga 60 cactgctagt tgtctaccca cccattttct tcacttcttg tttgctcgca agaccctgat 120 tttgttcagg tttcagttgg ttgtgtctta tcccttggca gtgaatcttg acttgcataa 180 ggtaagcgca gtcactatcc tatcactctt gtcagagatt gatttggaaa caggtacagg 240 atactttctg ggccaatgag atgttcagga aagtctgctg tggacttctg gaacacatty 300 atttggtctt aacaaaaaat aggggagggc atggtggtgt atgcctgtaa tcccagctac 360 tcaggagcct gaggcaggag aatcacctga acccgggagg cagaggttgc cgtaagccga 420 gatcgcacca ctgcactcca gcctgggtga cagagccaga ctctgtctca aaaacaacaa 480 tgacaataac aacaacaaca acaaacaaat gtatcctaac tgatacagaa agtgaccatg 540 aaagggcagg ggaaaactga ttcttgatgt attccctttg agacttctct tggcttctt 599 <210> 89 <211> 599 <212> DNA <213> Homo sapiens <400> 89 aactccagac aggcatgaaa caatccaccc tctttctgcc atataaatat cagcttattt 60 tgagaagaaa gtgtgccaga cactgctagt tgtctaccca cccattttct tcacttcttg 120 tttgctcgca agaccctgat tttgttcagg tttcagttgg ttgtgtctta tcccttggca 180 gtgaatcttg acttgcataa ggtaagcgca gtcactatcc tatcactctt gtcagagatt 240 gatttggaaa caggtacagg atactttctg ggccaatgag atgttcagga aagtctgcts 300 tggacttctg gaacacattc atttggtctt aacaaaaaat aggggagggc atggtggtgt 360 atgcctgtaa tcccagctac tcaggagcct gaggcaggag aatcacctga acccgggagg 420 cagaggttgc cgtaagccga gatcgcacca ctgcactcca gcctgggtga cagagccaga 480 ctctgtctca aaaacaacaa tgacaataac aacaacaaca acaaacaaat gtatcctaac 540 tgatacagaa agtgaccatg aaagggcagg ggaaaactga ttcttgatgt attcccttt 599 <210> 90 <211> 599 <212> DNA <213> Homo sapiens <400> 90 gaaggtctgg taaaggtatt taacatttct gaacttcaat ttcctcatcc caaaaatggg 60 ggataaatta tattacttaa gacagttaag gcgattgtat gaaatgagtg taaaaatgtt 120 ttaccgtact acctggcaaa cagcagacac ttagtaaata ttgtttgttg ggcacttgat 180 aaacgtctct caagttccta ctgtgtgcca gttgttgtgt tagctgcaaa ggatgtggag 240 atgagattct gtctcttcct ttaaggaaag gggatggtgt tattttcttc ctaccagatk 300 acaagttaat actatttaaa acatgatttc tgttaatttg tgggagattg catttttttc 360 cccatcagat cattgtggta aaataacttg tgctcttttc ttattccgtg gtttgttttg 420 ttttgttttc tataggattt tgtttgtttt tcacaaaaat ggtcatttga gctgtaaggc 480 aaaagtgcag cctcctaggc tgaatggtgc aaagactgga gttttttcca caaggagccc 540 tcatcgtccc aatgcaatag gactgaccct ggccaagctg gaaaaggtag aaggtaacc 599 <210> 91 <211> 599 <212> DNA <213> Homo sapiens <400> 91 agtattcaac taatatgtat taagcaagga gcgtgacaag tgctgggata tggagttgaa 60 caggaaaaaa tccctgcctg caaggagctt acgttctggt gcataaacag acactctata 120 aacaatgtgg acatgaagtg gcagagatca gcactaggta gagaggaagg agctccccca 180 agccttggcc aggagggttg gcaggccctg gggggaggtg gtgtttgaac tgagtcatga 240 gggatggata aatagaaatc tttcacaaga agtgggcagg gcattccagg aatgagctar 300 aaagcccaga gtccaaagca gcatgacatg tacaaaaact acacatggca caggtaaaat 360 gtgggtggga tgcggagaca gaaaagggtc aatagggaca cagctcacat gattggaaga 420 tgagaccctg gatagactcc agtaaaactt atgtgaattt cagagaactc ctccctcctt 480 gcaataattc acaatcctat tcccaccacc atgacaccca gtggtatcct cagagtagga 540 gtcagcttac tgcttggact taacctacct tccccagaaa gcagagcttg aggcagagg 599 <210> 92 <211> 599 <212> DNA <213> Homo sapiens <400> 92 accaaagcct atacaccaat gttcatagta gcagtcttca caatagccaa aagataggaa 60 caactccttt taatcacatt tatcagccaa aaatagtcac atgaccatgc tttatttcaa 120 ggggacagaa gagtatatgc atccacatac ttagaagtaa aagagaattg gataattggt 180 gaacattaac tatcttccac gattacctgt gatactaaaa attatttcca caccaacata 240 ttgcaaagag attgaaacag aacttgctca aagaatgtga actgtcccat gaaccagagr 300 tcctacccag aaaaagtggg agaactgcaa ctccagccac accttattct ctcaatacat 360 tcccagtatg gacggccaaa attccagaaa ccccaaggac atctgggtgg cagctctatt 420 tgattaaaaa gtctcttaac tggcagaggt tgccgtgagc tgaaatcgcg ccattgcact 480 ccagcctggg taacaagagc gaaactctgt ctcaaaaaaa aaaaaaagtc tcttagctgc 540 ctagaaacca acgttcttcc ttttcacttg ctatgcatgc tatcagatac ctctaccac 599 <210> 93 <211> 599 <212> DNA <213> Homo sapiens <400> 93 gaaagatcaa gggaattcct gtagtgttgg tgaagggtga tcctagggtg ataaccatgc 60 ccaaatcaga gaggccaaga gacctagatt gcagcaagac agaaggcaag aagtggaaac 120 tggtaagttc atacgaaaac acagagagga gggcattaag gatggtaata atttttttta 180 attcagcaaa tgaaaacaca gataattatt atctccagac aaaaccaaaa gtccaaaaat 240 ggaaataaat aaataaataa ataaataaat aaataaatag tattctacta gttcagctgk 300 gaaaagcatt tagataatac tataaacact gactattgat ctaattaaca ttatgatatg 360 actatattag gaggatgggg taataggaag gatgggtaca catggtggaa ataggtgtaa 420 aagaaagcta aatctttatt ttccatagtg ttaagcccaa aatctgaaat attaagtagt 480 agctgacacc gaaagcacat gcaacaaaag caaaaataaa caactgggac tatatcaaat 540 taaatagttt cttcacagca aaggtaacca tcaacaaaac aaaaagacat ccaacctat 599 <210> 94 <211> 599 <212> DNA <213> Homo sapiens <400> 94 ttggtagact acacatacct ccctgtggca gccaggcccc caccacccat tctcatcatt 60 ccacacaaac gtgagcccct accatgaaca agatgttgca tggagcactg gcagaagcag 120 agtgagttga aggtggcttc ctcccaggac tgcatggtca cagaccccag caccagcaaa 180 gtatggtcat caggaccaca ggaagggcca gagatgggct atggggcact ggggtcagga 240 agagtgcccc atcttcctga agggtgatac tggacctggt ccttggagaa taagaaagay 300 ctgatgaagc aaaaccctgg aaggagggta tccaagatga agagaaagta tgaggtgcag 360 tctggaggca ggaaagatgg gctgcatcgg aatcacacca ggtagaatgg ttggttggtt 420 gaattgggag gtggagctgg agaggtatgt agggcagatg gcaaaaggcc ttaaattcag 480 gccaaggaga gtggacttga ttatggaggc aacagagact gagggacaag agctgggatt 540 ggaaagaggc cccaagcata tatgaagctc ccctactcat gcctgcccca caccttttc 599 <210> 95 <211> 599 <212> DNA <213> Homo sapiens <400> 95 gagtcaaaac agagactctt ccaagtggca tgggaattag ggtccccttg acctgaggag 60 cttgggtttc tggagatgac tgaagtggac aggaatgaaa ggcatcctga aattagtctt 120 aagagtctct taggggaagg tggacttgag acaaaaggca caatgctggt tagcaacaat 180 tctctactgt gcctgtgagt aatgcagaag ccagaatgag tccctgaagg gattgttctc 240 ttaaggggag ttcactgtga aggcttccgg ggagggtcca tctaccctga aaatggatcy 300 ctagggttga cttttccaac tcctcaggtg gtgcagtgtt atgatgctct ggagcacaag 360 gagctcagag cctgccactg tgctgctggg tggtgtggtg gtgtggcggg caggctccca 420 aatcattcca cacaagtgac atttgtgtaa acaccactgt aatttctctg ttggagtctg 480 cagacccatc ctcaagttat cagggagaat tttaattttt ctatattgat aataagctta 540 acaaataata aaatcatatt ctatgtcctc tagatgtgag gctaccagat aaattacag 599 <210> 96 <211> 599 <212> DNA <213> Homo sapiens <400> 96 tacagaaaag gaaactgagg tcacaagatg ggcagacact tgtacagtat tatacagcat 60 tagtggcagg gccaagatca catcccgacc tctgcattcc tgtgccagta ctcttttcct 120 caccattcct cctctgaaga gcgcttcctt aaaaatagtt ctaacaaaaa tgaagctgct 180 tcttcatgtc attttactga tctcatgtag gcagtattgt gtcaggaatc ttatatttga 240 attgtagcaa cgtttggttt cctggatatc tgcttcagag gtcatgtggt gaaccctccr 300 agacaccagt caaagtttgc tgaacccaaa cctccaagtc gttcacctga aagatctaaa 360 ccaacagaaa tgaaacaaat tggcattgct ttgtctcact atctcgtgag atgcgtgaga 420 attcttaagc agacagttac tgcctgtgtc atgggtaaaa tcccaaatca ttttgtgggg 480 tttgttattg ttccaacagc tataagagag ccaatatctg catgtaccaa catctctttg 540 tagtatcgct tcctggatcc tttttttttt tttttttttt ccgcttgatt tgggagtca 599 <210> 97 <211> 599 <212> DNA <213> Homo sapiens <400> 97 gacatgagct gagagttgtg aataaacccc tgtactttgt acttacttac tcaacttgac 60 aaacattccc catggacttg ccctctgtca gactgcactg ggaactgggg attctgtagt 120 gaatcaggca ctatgtttgc tcttcagaat ctagtaagag ttgggctcac atagccaaaa 180 tgcaaagcag agcatggcag cgccctggaa gatgaattcc agattcctgc tgcctggtcc 240 agaatcagca tagcccaaca atgctaggtg accttggtca agttgcttaa tctctctacy 300 ctcagtttcc atccttaccc ttctttctca aagagctact ctaagaagaa aataagacaa 360 ttggcctgga catactttgg agtcaaagct gaatagggag agacgattgc tagtgtttca 420 tagtgtcatc agtaacatag acaccattta ttcagtatct tcccaggtac caagcatctg 480 accagtgttg catgtcattc ttccaacact cctggtacag ctctattatt atctatattt 540 tagagatgag aaattgaggc tcagagaggg gaggtgactt acccatggtc acactgctt 599 <210> 98 <211> 599 <212> DNA <213> Homo sapiens <400> 98 aaaaaaaaaa aaaaaagaga cgaaactatt atgtggttgt gctgccctgc cctcagtatg 60 ttgtgtaata aatataatag gggtatgaat aattgtgcaa tgaatacatc ctgatggtaa 120 aaaatttaat gtacacacaa aagggggtag gcagatagga gggaaacaat attgtaacat 180 cccactgtac tattggttct caaccctacc tccactttag gattgtcagg agagctttta 240 aaataaaaac atcctaaatg caattctata tcctggattg gaccctgaag cagacaaags 300 acattagtgg aaaaattcat gaaaacggaa taatgtctgt agttaatggt agtgtaacta 360 tcctgatttc ttagttttga caaatggccc atggttatgt aagacgttaa cattggtgta 420 aactgggcga aaggtatata gtaacttttg tactatcatg acaacttttc tgtaattcta 480 aaattattcc tccaaaaact attatttgaa gcataaaaca attaaaaaat aaatatacct 540 atgcctgtac atcagctaga tgggggaatc tgaatccctg ggggagaagt ctggacata 599 <210> 99 <211> 599 <212> DNA <213> Homo sapiens <400> 99 acacacacac gggcagccta attttccatc caaagtcttt acattcagaa agcagattaa 60 tcttggattc acttgatttc ccatggggat ctctcatact aatccttcag aaaagtgaac 120 caacttaaat cccccaccaa gctctgttct aaggaggaat attcaactct gtggcaatta 180 cattccaaag tccctatttt ctgtagagag cttccctggt gttaaccact tttccttagt 240 tattctttta tttttttatt tttattttgt tttattttat tcttttattc taccaacaay 300 tccacaatgt aggtattagt gttcttttgc tctgtgagaa aactgaactt caaaaaggtt 360 aaataacttt ctcaaagaca cagcaataag tggcagaacc aggattcaaa cactcattct 420 caggacacca gaccttgtac ctcagtgttc cctggtccac cctgccagac cagagcagag 480 gtcctttgta caggttgcag ggaagctttt ttgagactca caggaaatga gagctaaaat 540 gaccttgtag gtcctcattt cacatttcgt tccatctttc aaacaaacca cattgtaca 599 <210> 100 <211> 599 <212> DNA <213> Homo sapiens <400> 100 agtttgattt ccgtcactca aaccaagaga gtcctaaatg agaccagcat cttccattta 60 ttaagctcac ttatgtgctg ggagcttttc actgtatcac tttatgtaat cttgcacaca 120 gtcacatgaa ccatatggcc attttataga caaggaagct gagacacaga gggctgaggg 180 atgtacctag ggccacccag ctgttagtaa gtggccaaag agggattcaa acccaggtct 240 gcctaacacc aaacccatgt ccctaactct tgccacagtg ctattcacac tatgccctgr 300 agcttctcca gttctcactc tctgggatgg gcagcttcag aacagactca gcttccatga 360 cttgaccttt tgtgtactgg cttcttgtac cgcgtatgaa ctgcacataa aattactccc 420 ataaataatt tttcaataca agatcttatg atggttctta gcagcttagc gggttagagt 480 caaagtctcc atgctggatc tgtcctcaca ccttcaccca actaagtaaa tactttttat 540 tgacatcccc tttggaaagt gagacttttc tgatctgatc aaatcctggc cttaagaac 599 <210> 101 <211> 599 <212> DNA <213> Homo sapiens <400> 101 gtaatggtga gcactcaggg gcagaatggc caatgtgtga gacttcaaac cacacaagag 60 gaagagaaag gcaagcatcc ccagctagcc tgaggcatat tggcccatga tccttagagg 120 cagaatgtgg agggagctcc gacgggttat ggccaagtat gttcttgggc aaaccactct 180 ccaaagaagg gaaagagaga agctccctgt tagtaaacta ccaccatgtg ccaggcactt 240 ttcctgctgt gtctactctg ttcagcaaca ctgtgaggcg gggattatga tctcttatcs 300 gttcctctgg tgacttctaa ccaaggctgt ggcaaggttt tgtgctatag gtggcatttg 360 ccctgagctt taaaactagg tagactttgg gcatgtagag gtaaagttgg gatgtggaag 420 ggaacaaagg gcattttagg cagagggaat aaaatagaga gggaaaaaag gaggtaattg 480 tgggtccctg gattttaaaa gtagagttgc cattgtttca ttttttttaa aaaagagtat 540 actctgagga gtagctggag ctaagtctgc gaaggccaat taggatctgt tcttgaaaa 599 <210> 102 <211> 599 <212> DNA <213> Homo sapiens <400> 102 caggggcaga atggccaatg tgtgagactt caaaccacac aagaggaaga gaaaggcaag 60 catccccagc tagcctgagg catattggcc catgatcctt agaggcagaa tgtggaggga 120 gctccgacgg gttatggcca agtatgttct tgggcaaacc actctccaaa gaagggaaag 180 agagaagctc cctgttagta aactaccacc atgtgccagg cacttttcct gctgtgtcta 240 ctctgttcag caacactgtg aggcggggat tatgatctct tatcggttcc tctggtgack 300 tctaaccaag gctgtggcaa ggttttgtgc tataggtggc atttgccctg agctttaaaa 360 ctaggtagac tttgggcatg tagaggtaaa gttgggatgt ggaagggaac aaagggcatt 420 ttaggcagag ggaataaaat agagagggaa aaaaggaggt aattgtgggt ccctggattt 480 taaaagtaga gttgccattg tttcattttt tttaaaaaag agtatactct gaggagtagc 540 tggagctaag tctgcgaagg ccaattagga tctgttcttg aaaaagagcc ccaaatgcc 599 <210> 103 <211> 599 <212> DNA <213> Homo sapiens <400> 103 atcacctgag gtcaggagtt cgagaccagc ctgaccaata tggtgaaacc ccatctttac 60 taaaaataca aaaattagct agtcatggta gcatgtgcct gtagccccag ctactcagga 120 ggctgaggca ggagaattgc ttgaagctgg gaggcggagg ttgcagtgag tcgagattgc 180 gccactgcac tccagcctgg gcaacagagg gagactctgt ctcacaaaaa aaaaaaaaaa 240 aaaaaaaaat taaactaact aaataaaagt taaaatttag ttcctcagtc acactagccw 300 caaaggcctc aataacccta tgtagctact ggctactgat tggacaacac aaacatagaa 360 catttccatc attgtagaaa gtccttttct agaaactcaa actatggctg cagaactaag 420 aggggcagac catctgctac aaacaccatt cttttccaac ccagcaccca gcactaggcc 480 agacacagcc tccttcctcc tctctctcct tcctttccac ccatctttct ccacacccct 540 ttccaggagc agatcataat cccggaagag acaaccttga acaccataat cccaaatat 599 <210> 104 <211> 599 <212> DNA <213> Homo sapiens <400> 104 cttaacttta ttattcctct gtaagtgatc ctttcattga agtctctatt tgaaccatct 60 gggtgcattc tgtttcctgt tgaaagtgat aaagcaaaat gcttattttc tcgtgcctca 120 gtgtcctcat ctaaaaataa gaatcatatt aatgcccact tcgcagggat gatatggcaa 180 tcaaatgaga aaatgtattt atgataccta gttcagtgcc tggcataggt aagtgctcaa 240 tgaacgttca ttgatattat catcatcact cccattggaa tttataacct ggggctatay 300 gatctctata ggtccttaca gcatgaatgg aatatgaatg ggtgattctc tatacaaaag 360 ttgctgccaa tccagatatt attttagtct tttgatctca aggtagagtt gaggcttaga 420 caataaaaat tataattatc tcttgttgcc atttataagc aagaggacta tgccttttac 480 agagaggttt cttcacgtga tgtcagccat ttggaacttt catgccctgt tacagataac 540 aggtaacatt tatggagcat tttctctatg ccaaataacc tgagtcttta tatgtggaa 599 <210> 105 <211> 599 <212> DNA <213> Homo sapiens <400> 105 gcagagatca gcactaggta gagaggaagg agctccccca agccttggcc aggagggttg 60 gcaggccctg gggggaggtg gtgtttgaac tgagtcatga gggatggata aatagaaatc 120 tttcacaaga agtgggcagg gcattccagg aatgagctag aaagcccaga gtccaaagca 180 gcatgacatg tacaaaaact acacatggca caggtaaaat gtgggtggga tgcggagaca 240 gaaaagggtc aatagggaca cagctcacat gattggaaga tgagaccctg gatagactcm 300 agtaaaactt atgtgaattt cagagaactc ctccctcctt gcaataattc acaatcctat 360 tcccaccacc atgacaccca gtggtatcct cagagtagga gtcagcttac tgcttggact 420 taacctacct tccccagaaa gcagagcttg aggcagaggg cttttgagct gccatagatg 480 atcctcaact taccatggtt taacttatga cttttcaact ttatgatggt gcaagagtga 540 tacacattca gtagaaaccg tagttcaaga gcccatacaa ccattctgat tttcacttg 599 <210> 106 <211> 599 <212> DNA <213> Homo sapiens <400> 106 gtgattgctt ataagacaac ccacggaatc cagaataagt tctgcctctc aagatcctta 60 accacatctt tgtcacataa gggaataatc actcttttgc tatataaggt aatagtcaca 120 ggtagcaggg attaggatgt gaacgcagct tttggggcca ccatccaacc cactacacca 180 gaaattagca ggtgaatctc caccccttcc ctgtttgatg ttattttgtc tctctcagta 240 tattcctttg ggtgggacac ttgtgtctag aaacagcaat tgtcggtttg aatctcatcy 300 atagtgtttc tccggccttc ttttctttct ttctttcttc tttttttttt ttgtttgaag 360 cagagtctcg ctctgtttcc caggctggag tgcagtggtg caatctcagc tcactgcaac 420 cgccgcctcc tgggttcaag tgattcttct gtctaagcct cccgagtagc tggaattata 480 ggcgcatacc agcacacctg gctaattttt ttgtattttt ggttgagatg ggtttttgcc 540 atgttggcca ggctggtctc aaactcctga cctcaggtga tccacccgct ttggccttc 599 <210> 107 <211> 599 <212> DNA <213> Homo sapiens <400> 107 tggcaaaaac ccatctcaac caaaaataca aaaaaattag ccaggtgtgc tggtatgcgc 60 ctataattcc agctactcgg gaggcttaga cagaagaatc acttgaaccc aggaggcggc 120 ggttgcagtg agctgagatt gcaccactgc actccagcct gggaaacaga gcgagactct 180 gcttcaaaca aaaaaaaaaa agaagaaaga aagaaagaaa agaaggccgg agaaacacta 240 tggatgagat tcaaaccgac aattgctgtt tctagacaca agtgtcccac ccaaaggaay 300 atactgagag agacaaaata acatcaaaca gggaaggggt ggagattcac ctgctaattt 360 ctggtgtagt gggttggatg gtggccccaa aagctgcgtt cacatcctaa tccctgctac 420 ctgtgactat taccttatat agcaaaagag tgattattcc cttatgtgac aaagatgtgg 480 ttaaggatct tgagaggcag aacttattct ggattccgtg ggttgtctta taagcaatca 540 catgtgactt tataagacag acacacagag aagaggagga agaagcaatg tgaccacag 599 <210> 108 <211> 599 <212> DNA <213> Homo sapiens <400> 108 gagggcccta ctccctcctg aggctctagg ggagggtcca tcccttgcct cttccagctt 60 ctgatggcct catgcattcc ttggcttgtg gccacatcac tccaacctct gtggtcacat 120 tgcttcttcc tcctcttctc tgtgtgtctg tcttataaag tcacatgtga ttgcttataa 180 gacaacccac ggaatccaga ataagttctg cctctcaaga tccttaacca catctttgtc 240 acataaggga ataatcactc ttttgctata taaggtaata gtcacaggta gcagggattr 300 ggatgtgaac gcagcttttg gggccaccat ccaacccact acaccagaaa ttagcaggtg 360 aatctccacc ccttccctgt ttgatgttat tttgtctctc tcagtatatt cctttgggtg 420 ggacacttgt gtctagaaac agcaattgtc ggtttgaatc tcatccatag tgtttctccg 480 gccttctttt ctttctttct ttcttctttt ttttttttgt ttgaagcaga gtctcgctct 540 gtttcccagg ctggagtgca gtggtgcaat ctcagctcac tgcaaccgcc gcctcctgg 599 <210> 109 <211> 599 <212> DNA <213> Homo sapiens <400> 109 tctaacgcct gtatttttca atttacattg aagacgccat tgcatggctg ctatgggaat 60 ttttgtactg gggacagaag gcatcatggg tgaaggacag catgaacaaa ggcccagagc 120 cccgtgtctg cagcccaggc tcatctgctt ccctcaggat gctcacccct ctctctttag 180 gggttccaaa gttggcttac tgatgttata taaccttgat ttctatcaac acctaaaaaa 240 taccagttat ttccactggc agccagtcag aaataacccc agaatggcaa gaatgcagcy 300 gtgtctctta ggcatgtcag caaagggcat gctgactgag tccaagcaga gaaacgcctg 360 agctgagaag cagcccctac aggacacatg ggcagcagag acatgaattc aaaagatggg 420 aattccctgc atagccgcac accatcaccc actgtgagtg gcacccaagt catctcatgt 480 actcctcaca gcagtcctag aggtagcaaa cctcatcatc cccattttac agtggagaaa 540 gccaaggccc tccgagcttg gggagcttgc ccagagagtc tctatgtatt ggaactggg 599 <210> 110 <211> 599 <212> DNA <213> Homo sapiens <400> 110 agagtgatgt gtacatttca agaatgttta cccaattcag ggaagaacca tttgccacta 60 aaaggtcccc ccgcctgtcc tcatcaccat gtcaccctgc agaaggtcaa gtggccttat 120 gcatgaggct aattccctgc attcctgatc aaggggcagg gagggccagg caaagtcact 180 gctgtcttca gcagacagtg gccatgatgg aattaggacc agaggcccac agttgcaaag 240 ataactcaaa taccctgtag gcttccttca aaggctgaaa agcacaggct tggggcttcr 300 ttcattggaa caaaacttta cgaaaagaaa caggtacact gatgtctagg catctttaag 360 acaggtaacc tcaaatgaca tttacatagc atgttatggt ttattgtata catctcacca 420 gcctgctaaa aagaaaaagg gtctctcctg aaggctgagt tccagcccca gctcagctac 480 tgacttgctg ggtaatcttg ggcaggtaac ttactttctc tgggtcccaa gttcctcatt 540 tgtaaaataa ggggtggagt aggtcatgtc taaattggtc cctgattctt accttgtaa 599 <210> 111 <211> 599 <212> DNA <213> Homo sapiens <400> 111 accttatttt aaacagctaa agccacccaa atctctattt ctgttctctc atacctagag 60 acacaaaaaa attcacaaaa aataataaaa cctagttaga atgtaaagga gtcaatcagt 120 tttcacttgc agcagattaa atggtctaga atgaaatgag aggcatggag aggtctcctg 180 gcccctcaga cgtgctctcc aaatgtggag gccagttctt tgcatcactc cacagtgcat 240 ccccacacag atggcagagt gtgaaagcgt attgcaaccc aaatcagcat cttccctttr 300 gtacagtatt taaaaggact ggccaggtgc aggtgctcat gcctgtagtc ccaacacttt 360 tttttttttt ttgagacaga gtctcactct gttgcacagg ctgggattca gtggtgccat 420 cttggttcac tgcagtgtcc gcctcctggg ctgaagcaat tctcctgcct cagcctcccg 480 agtagctggg attacaggca cgcatcacca cacctggcta atttttgtat ttttagtaga 540 gactgggttt caccatgttg gccaggctgg tcttgaactc ctgacctcaa atgatctac 599 <210> 112 <211> 599 <212> DNA <213> Homo sapiens <400> 112 atgtgttctg ctagaagctg caagacacta aattgcatgt acaggccaaa tacaactgcc 60 cacagccata tgcctatgaa aaagatacta gaaaggatat cagggtgttt tccttctttc 120 atcccctcca tcctttgcat ttacagatga ggaaactgag accaatgggc tgttcctgct 180 gttgagaacc tgtccctaca gtttccgtgt ggcccacagg ggcagagtgg aggagctggt 240 gaccatgcaa caggaggatc aggtcatgaa agacacctgg agctggggtg gagacagctr 300 gttcaacacg tggcttcagc acacacccac tgagcaaagg agcctactca atgccaggcc 360 ctgagggaga gaggcagacc cgacccagtg ctcactatca cggggcacat gggaggaaga 420 gacgatctct gcctgaggtg atcagagagg gcattaagca ggagtggcat ttggatctca 480 aagcagggtg aggacatgtg gcacactgga gccagtttgt accagctttt ggaggctagc 540 tgcttttagg aatttcacat gccagtgctt agacataggt attattaaaa ataaatttg 599 <210> 113 <211> 599 <212> DNA <213> Homo sapiens <400> 113 ttttgagaat ccattgtagg aactcagata ggagaagaca gggcaggaga aggtagagga 60 agatacagta gggattataa tccctactgt atagatacag tgtcttctat agcagagtga 120 cactgtagga gatgtggtag ctgctatctc ctgggggcca gcatccttac tgccctagat 180 tcctctggct cttgtccttg gcccaaatag ctttcaggag aaaggaggca accctgggtg 240 gggccactcc caacctccca ctgagtgagc ctggctacag actgtgctga gctggaccay 300 cccaggagaa aatgctttgg agccactgga gagaggggac cctgtatttt caaagcatcc 360 ctgagctgga gacaaaccta gcagggccaa aagatcccct catgcgatgc cagccctctc 420 taggtcaaaa cccaagtagg agaagatgag gcagagaggg aaggtctggg catgctgtgc 480 tgattccagg atccctgcac acccaccagg gaacctgtgc ttctgccctt caagaacaca 540 cactgcagcc caattgtgtt gttactctgc ctaatcctgc cattatgttg aatcctagt 599 <210> 114 <211> 599 <212> DNA <213> Homo sapiens <400> 114 ggttgggtgc ttctcaacgg caggagcaaa accccactgt ctctcacagg acccaatcct 60 gagtagctgc tcaaccatgt gtgtccagtg ggatggtcct gggtgaactt agagttaagg 120 ctcgcagatc acagaggaag gaagaactta aagacagcag gtaaaacacg ggaagtcaac 180 attccctcct ccctctgcct ctgccaccag cctatgtaat attccaggta atgcaacagg 240 actttgtggg tgacctagat tttcttcata ataatcacag ccatttactc agcacatccy 300 atgcacccca cacttcatgt gtattagctg taatcctaac accagtccta atcccatttt 360 caagatgtgg ggcctgaggt tcagagacct caaattattt ccttacaagg agaggagcta 420 ggatttgacc tcaggtgtgt ttgattccaa gcccgcattc tctctgtaaa acatgcagcc 480 ttgttcagaa cactgatagt ctcagcaggc ttgaggctaa agcacttccc tctgctggac 540 gttttttctt agtgtagagg gtagaagtag tgagggtggg gctcttccct gaccctgac 599 <210> 115 <211> 599 <212> DNA <213> Homo sapiens <400> 115 actgggagac aggagagcca gggttcaggg ccactgggag agcttccccc agtccctacc 60 tgtctgcttg cccatctgta aactgccagg cttgcatgca tctggtgtgt tttcccggac 120 ggagtttgac tactgatgtc ctccttggct cctggggccc gctgtaaaca ccacttcctc 180 accctggctc tcagtttgcc ccctacagtg tggctgtcca cataggtgcc cgtctacctg 240 tcaggttggg tgcttctcaa cggcaggagc aaaaccccac tgtctctcac aggacccaay 300 cctgagtagc tgctcaacca tgtgtgtcca gtgggatggt cctgggtgaa cttagagtta 360 aggctcgcag atcacagagg aaggaagaac ttaaagacag caggtaaaac acgggaagtc 420 aacattccct cctccctctg cctctgccac cagcctatgt aatattccag gtaatgcaac 480 aggactttgt gggtgaccta gattttcttc ataataatca cagccattta ctcagcacat 540 cccatgcacc ccacacttca tgtgtattag ctgtaatcct aacaccagtc ctaatccca 599 <210> 116 <211> 599 <212> DNA <213> Homo sapiens <400> 116 ctctttattg acactatatc aatccaactt tccctaaaag ataaactcca aaagagatag 60 aaagatggag cactgggaga caggagagcc agggttcagg gccactggga gagcttcccc 120 cagtccctac ctgtctgctt gcccatctgt aaactgccag gcttgcatgc atctggtgtg 180 ttttcccgga cggagtttga ctactgatgt cctccttggc tcctggggcc cgctgtaaac 240 accacttcct caccctggct ctcagtttgc cccctacagt gtggctgtcc acataggtgs 300 ccgtctacct gtcaggttgg gtgcttctca acggcaggag caaaacccca ctgtctctca 360 caggacccaa tcctgagtag ctgctcaacc atgtgtgtcc agtgggatgg tcctgggtga 420 acttagagtt aaggctcgca gatcacagag gaaggaagaa cttaaagaca gcaggtaaaa 480 cacgggaagt caacattccc tcctccctct gcctctgcca ccagcctatg taatattcca 540 ggtaatgcaa caggactttg tgggtgacct agattttctt cataataatc acagccatt 599 <210> 117 <211> 599 <212> DNA <213> Homo sapiens <400> 117 ggatctgaaa gagccctggg agacaattag cctaaagctt tcatttcaca gacagggatg 60 ctgaggccca gggagagaca gggaactgcc cagatcacag agcaagtcaa gcacagatag 120 cctagaacac aggccttctg attgccagga cccacgctcc aagctcaagg cctggccttg 180 aaaagaccaa ggtgctgtca taggtgagtt cttgctcttg cccctgaact tccatgtgga 240 tgtcgttttg aaaccaaaat actctgtaaa caacacttat taacacaagt tcacatgtay 300 tctgctgtgg aaggagatgc gtctttcttc tttgtgaaat attagctcag ataggcatac 360 aaagaactct atgactctca gtttgcttaa catatttgat ttgctttatg cctacaagtt 420 catactaagc tcttgcatat ctgctggcct ctttattgac actatatcaa tccaactttc 480 cctaaaagat aaactccaaa agagatagaa agatggagca ctgggagaca ggagagccag 540 ggttcagggc cactgggaga gcttccccca gtccctacct gtctgcttgc ccatctgta 599 <210> 118 <211> 599 <212> DNA <213> Homo sapiens <400> 118 gggaaaagtt ccgttctctg ttatttatat gggcagattg aatgagcatt atctccgcaa 60 ggtcttccca gtactttata gtttgcaaag caaactttaa tgtctctgaa ctctaaggat 120 actctggcaa gcaaagatag tctctcattt tactaattag gaaactgagg ccagagaggg 180 aaaggcacct gctctgtgca tcatgcgtgc atgcacatgt gcctgtgtat gtgtgtttct 240 gtgtgcaaga aaggccttga atgctcctgc agacctggat cccagttgtg agagaagttk 300 tcagttctga tgcttggcgg gcagcgttcc ggcccactgc ccatgtatgg agtcactcag 360 acttagctaa gtacacagca gccaggagcc tgtgtttcag cagctaaaat cagtgggcag 420 cacaaaaatg taggtgtagc tccctcgccg cttccacctt gcccctcttc tctcccctcc 480 cacagggtgg aactgcctgg aataagctca gcccagataa caagtctaca catgcagcat 540 ccagggaata agcacagggc agctctgggg cacacatgga gacatgtatc ttcatacac 599 <210> 119 <211> 599 <212> DNA <213> Homo sapiens <400> 119 acctcattaa aacttcttgt gggagctcct gtggaaaatg ctgtggtcag gaagttaggg 60 tagagtacct gcccttccct ctaacaatag agcattcctc caaaaccagt gtaggctgga 120 ggaggccatg ggctagctca ggtctagcct tggcactggc aatcactgat tcacattgaa 180 tatgtacatc accatcatca tcaccaccac ctactcttct tccaagaaga caaataataa 240 ccaccactta tatcaagcag tcttatatgt gcagacattc acaacagccc agtggaggas 300 gcgctatagt catgccacat gacagatgat gaacctaagg tacagagcaa ttaaatgaca 360 gggcctaggc attgcaacac aactgcaagt ggcagaactg ggatttgaac caggcattct 420 agctccagag tccattctat tagtcatctc gctacattat cttccttttg aatcatgaat 480 cagggtattc tctggcaatc aaaccattcc agattcggtg gggaaaagga tacatcagat 540 agcatgtttc tgaggctgaa atcaccaatt ttgtattaat agaatagggt attatctat 599 <210> 120 <211> 599 <212> DNA <213> Homo sapiens <400> 120 acgccagcac tggtagagag aggtgcagag agccccacct ttttgcttgg aattggtgag 60 agcttgtgct tacctcatta aaacttcttg tgggagctcc tgtggaaaat gctgtggtca 120 ggaagttagg gtagagtacc tgcccttccc tctaacaata gagcattcct ccaaaaccag 180 tgtaggctgg aggaggccat gggctagctc aggtctagcc ttggcactgg caatcactga 240 ttcacattga atatgtacat caccatcatc atcaccacca cctactcttc ttccaagaar 300 acaaataata accaccactt atatcaagca gtcttatatg tgcagacatt cacaacagcc 360 cagtggagga cgcgctatag tcatgccaca tgacagatga tgaacctaag gtacagagca 420 attaaatgac agggcctagg cattgcaaca caactgcaag tggcagaact gggatttgaa 480 ccaggcattc tagctccaga gtccattcta ttagtcatct cgctacatta tcttcctttt 540 gaatcatgaa tcagggtatt ctctggcaat caaaccattc cagattcggt ggggaaaag 599 <210> 121 <211> 599 <212> DNA <213> Homo sapiens <400> 121 atcaaatcct ggccttaaga acgacaacca atattgtaat cttcaaaggc tcagacaggt 60 gaaatgactt gcctagggtc actcagcttg ccagggtcag aacagaaatt ggaacccaat 120 tattcatttt gtctagtcct aacaaatttc tgagtcctta tagtcctcag ggttccaaac 180 cttctgtcgc aagacctctg catccaggca cagatgacgg tggtggtgac gccagcactg 240 gtagagagag gtgcagagag ccccaccttt ttgcttggaa ttggtgagag cttgtgcttm 300 cctcattaaa acttcttgtg ggagctcctg tggaaaatgc tgtggtcagg aagttagggt 360 agagtacctg cccttccctc taacaataga gcattcctcc aaaaccagtg taggctggag 420 gaggccatgg gctagctcag gtctagcctt ggcactggca atcactgatt cacattgaat 480 atgtacatca ccatcatcat caccaccacc tactcttctt ccaagaagac aaataataac 540 caccacttat atcaagcagt cttatatgtg cagacattca caacagccca gtggaggac 599 <210> 122 <211> 599 <212> DNA <213> Homo sapiens <400> 122 gaaagtgaga cttttctgat ctgatcaaat cctggcctta agaacgacaa ccaatattgt 60 aatcttcaaa ggctcagaca ggtgaaatga cttgcctagg gtcactcagc ttgccagggt 120 cagaacagaa attggaaccc aattattcat tttgtctagt cctaacaaat ttctgagtcc 180 ttatagtcct cagggttcca aaccttctgt cgcaagacct ctgcatccag gcacagatga 240 cggtggtggt gacgccagca ctggtagaga gaggtgcaga gagccccacc tttttgcttk 300 gaattggtga gagcttgtgc ttacctcatt aaaacttctt gtgggagctc ctgtggaaaa 360 tgctgtggtc aggaagttag ggtagagtac ctgcccttcc ctctaacaat agagcattcc 420 tccaaaacca gtgtaggctg gaggaggcca tgggctagct caggtctagc cttggcactg 480 gcaatcactg attcacattg aatatgtaca tcaccatcat catcaccacc acctactctt 540 cttccaagaa gacaaataat aaccaccact tatatcaagc agtcttatat gtgcagaca 599 <210> 123 <211> 599 <212> DNA <213> Homo sapiens <400> 123 tagcgggtta gagtcaaagt ctccatgctg gatctgtcct cacaccttca cccaactaag 60 taaatacttt ttattgacat cccctttgga aagtgagact tttctgatct gatcaaatcc 120 tggccttaag aacgacaacc aatattgtaa tcttcaaagg ctcagacagg tgaaatgact 180 tgcctagggt cactcagctt gccagggtca gaacagaaat tggaacccaa ttattcattt 240 tgtctagtcc taacaaattt ctgagtcctt atagtcctca gggttccaaa ccttctgtcr 300 caagacctct gcatccaggc acagatgacg gtggtggtga cgccagcact ggtagagaga 360 ggtgcagaga gccccacctt tttgcttgga attggtgaga gcttgtgctt acctcattaa 420 aacttcttgt gggagctcct gtggaaaatg ctgtggtcag gaagttaggg tagagtacct 480 gcccttccct ctaacaatag agcattcctc caaaaccagt gtaggctgga ggaggccatg 540 ggctagctca ggtctagcct tggcactggc aatcactgat tcacattgaa tatgtacat 599 <210> 124 <211> 599 <212> DNA <213> Homo sapiens <400> 124 ctgtatcact ttatgtaatc ttgcacacag tcacatgaac catatggcca ttttatagac 60 aaggaagctg agacacagag ggctgaggga tgtacctagg gccacccagc tgttagtaag 120 tggccaaaga gggattcaaa cccaggtctg cctaacacca aacccatgtc cctaactctt 180 gccacagtgc tattcacact atgccctgaa gcttctccag ttctcactct ctgggatggg 240 cagcttcaga acagactcag cttccatgac ttgacctttt gtgtactggc ttcttgtacy 300 gcgtatgaac tgcacataaa attactccca taaataattt ttcaatacaa gatcttatga 360 tggttcttag cagcttagcg ggttagagtc aaagtctcca tgctggatct gtcctcacac 420 cttcacccaa ctaagtaaat actttttatt gacatcccct ttggaaagtg agacttttct 480 gatctgatca aatcctggcc ttaagaacga caaccaatat tgtaatcttc aaaggctcag 540 acaggtgaaa tgacttgcct agggtcactc agcttgccag ggtcagaaca gaaattgga 599 <210> 125 <211> 599 <212> DNA <213> Homo sapiens <400> 125 tcccgggatg ttttttagct ggtgggaaag aatcctctcc tgataggtca tggaatggtg 60 aactgagagg ttttggaagt catgtcctca ccccatagga aacctctgtg gcagggcaga 120 aggaagccaa cagttagaga tgagaagctg agaagagaga gtcttgctga tgtctaagtc 180 cctgtccccg actgccctaa ggccaacccc acccctgccc ttcttggtta tttaaaacaa 240 caaaatgact actttactta agctagtgtg agtttgattt ccgtcactca aaccaagagr 300 gtcctaaatg agaccagcat cttccattta ttaagctcac ttatgtgctg ggagcttttc 360 actgtatcac tttatgtaat cttgcacaca gtcacatgaa ccatatggcc attttataga 420 caaggaagct gagacacaga gggctgaggg atgtacctag ggccacccag ctgttagtaa 480 gtggccaaag agggattcaa acccaggtct gcctaacacc aaacccatgt ccctaactct 540 tgccacagtg ctattcacac tatgccctga agcttctcca gttctcactc tctgggatg 599 <210> 126 <211> 599 <212> DNA <213> Homo sapiens <400> 126 agggcgcttg atgaagacat agttccaaag gagcaatgtg tccctgggta ggcaggcact 60 ttgcctttgc ttggcttcag tctctccgtc tgtgaagtgg gccaggtggt tcctgaggtc 120 ccttctaaca ctatgactgt ttgttgttgt tttttttttt tctaattacc gtgctcccag 180 gctcattgag atctgcaggg ggtcgacaga ggaaatgagg ccagggtctt actgaggcgg 240 gggctatggg ttggtgaagg gaaagctcca cgcggagccc tccagtgaga ctgccacagy 300 tcctgggctt cctctgctgg gaacgctgcc taagctctgc aaacagcagc tgaggatggt 360 ggatttggtc agcattaagc tgtattaagt cgagctgttt ctacaaagac tacattttgg 420 gataaacatg gtaccaaagc cacactaaga caatatagct cttggaagaa ggggcttcat 480 gccaccctca gcacctagtg cagagaactg ttctcctaac gcacccacat acagacttcc 540 tgaggagaaa ttcctgcagc atccccaccc tctgttcctg ccgggaacaa gtcccttag 599 <210> 127 <211> 599 <212> DNA <213> Homo sapiens <400> 127 cttgccttct ttaagctgca gaggaatttt gatggaactt tttcatctgt tgaatgggag 60 tggaatgctg tcctgcctat cacaaacagg accaaatcat gagttattaa aaggcaacga 120 tgagtatgtg cttacctctc tcaaatccat tcctcccatc tgcctgcccc gataccacat 180 accagttctc attcacttca gctaggactg tgctcactga ggtcatctac ataacctcct 240 gcccatcctg gtcaaggagc catctccctt agagcaggaa aggactttag tctagaaatk 300 atttttaggt tcaaggggaa gtagaatgat atatcagaaa taatatgaac ctggatttaa 360 atctcagttt attcattcat tcacccaaca ttcttattta gttatttatt tatttaagac 420 aggatcttgc tctgttgtcc aggctggaat gcagtggtgc gatcatggct cattgcagcc 480 tcaaactctt gggctcaagc catcctctca cctcagcctc ctgagtagct agaactacag 540 tcatgtgcca ccacacatag ttaatttttt ttttcttttg tagagaaaga gtttcacta 599 <210> 128 <211> 599 <212> DNA <213> Homo sapiens <400> 128 ttttcataga gacaggattt caccatgttt tccaggctgg tcttgaactc ctgggctcaa 60 gcgagcctcc ccgcaccggc ctttgggagc cgacaaggaa tccctgtctt ctagtagtct 120 tcaaagccag atccagcttg tctaggttaa ggattcgatg cctccaatga ggcagagaaa 180 atgaacatgc ccgttccccc aaggccttca agagcctcca ggctcacaga gattaacttg 240 tcctcacccg cctgcctgcc ttttgtgcag atctctgcat tgtcctgaag aaagactccr 300 gcactcgggc tgaaactccg tgtgccgatg accctggcct tgtcccggga ggcactggaa 360 gggatggcgc ccgtcgcgct cctgaaggcc cggagccacc cgctgtgagc agataaccgg 420 cagcactggg cagcgcggag gcggccccac gaggactcag ccccgggctg ggagtcaggg 480 attcgccctg aagccttgca ggtgcccccg tcaccgggcg tcggattccc gcgggacgcg 540 gttttcccca cggctgggcc tccctttggg cgagtcccca gcacaatgcg cgtcatccc 599 <210> 129 <211> 599 <212> DNA <213> Homo sapiens <400> 129 taggtcatca gggacaaatc atttttaatg gttggaaaat tatttttatt gtagtaggaa 60 ctactagcac ataaatctca ttttatttca cagatacagc ttagcaaaaa tttaataagc 120 aagttgatat aagaaaaacg ttgaatcagt aatactacaa gttgtgaatc aggttcactg 180 tgtactggtt accaacttgt ctgagtggga tgagatagaa cgcccacaca caacaagtta 240 catgaagtgg gttcactgct tacagagatg cagcaaggga ctgtagaagc gtaggacgcm 300 tttgaggcct gagccctaag gctccggaaa gctgtccagg ggaaaggaat ctcgactgtg 360 tgtctcccac ttgtacggca gcggaggacc ctggaaagca gcctgtcctg ggttttatac 420 cccggaaaac aagactcgct ggactaaagc gttgaaagac attctgttct ggggaggact 480 ggcacagagc caggctgttc cagccagcca ctccctatct caggatgttg cccttccagc 540 atattctaca gttattcttg agaactacaa ggcagaaagg gggtagaact ggatgagtc 599 <210> 130 <211> 599 <212> DNA <213> Homo sapiens <400> 130 tgacagagct aggatgggaa cccaggagtc agaaatcgga acttgtgttc ctaatcactt 60 aagctatatc acaaatgaga gaggtggatg attctatgac tgtagggctc taaaatgatg 120 tgaaggaatg aaatgtcttc acatagacaa gaaatgtcta tgtcctaatt cccagatcct 180 gtgaacatta ctttatatgg tgaacaacgt gattcagtta aagatcttga gataaggaac 240 ttatcctgta ttacctgggt aggacctgca tcaatcacat gtatttttta aaagagggas 300 gtttgacaca gacagaagac acatagaaga gaaggtgata tgaagacaga ggcagagatt 360 ggagtgatgc agccgcaagc aacggaatac tggcagcaac cagaatctgg aagaggcaag 420 gaatggattc tcctgctgga gcctccggag gaagtacagc cctgctggca ccttgatttg 480 ggacttccgt cctccagaaa agagagaata catttctgta gtttcaagcc accaagtttg 540 tggtaaagtt ttttacagca tccacaggaa actaatacca gtggtaaagt gtactttac 599 <210> 131 <211> 599 <212> DNA <213> Homo sapiens <400> 131 cctactttca agtaggtttc ttccttctac ttcctctgag tttatttttt tctttctcta 60 tttttagtat cttgaattga aactttagtt ggtcccactc tttatttttt aaatttttct 120 cttttaatag tgaggacact taaagctatg aatttccctc tgagtattgc tttggcaata 180 tcccatagat cggatatcca ttcattcaac aaattttttt ctagctttat tgaagtatga 240 ttgagaaata aaaattatat atattttggg tatataacat gatgttttga tatatatacr 300 cattggcaaa tgattactac agtaatgcta atagcatatt cattacctta catagttact 360 gtgtgtgtgt gtgtgtatgt tgtgtgcatg tgagataagg cacatgaggc ctactcaaca 420 aatttcaagt atatcataca ttaatattaa ctatagtcat gatgcttaca ttaggtctcc 480 cgtacttatt cttcttataa cagatttgta aacttcgacc aatatctccc ctcactcccc 540 aggccctggt aaccactgtt ctaccctctt gtactataag ttcacctttt ttttttttt 599 <210> 132 <211> 599 <212> DNA <213> Homo sapiens <400> 132 ttcctctgct gggaacgctg cctaagctct gcaaacagca gctgaggatg gtggatttgg 60 tcagcattaa gctgtattaa gtcgagctgt ttctacaaag actacatttt gggataaaca 120 tggtaccaaa gccacactaa gacaatatag ctcttggaag aaggggcttc atgccaccct 180 cagcacctag tgcagagaac tgttctccta acgcacccac atacagactt cctgaggaga 240 aattcctgca gcatccccac cctctgttcc tgccgggaac aagtccctta gcccagggar 300 aggcatatga cccaagctga gccaatcaga ggagccatcc tcctggctac tgtgattggt 360 ccagtgtggt catgtgacat agcctggcaa attagagtcc ttttcccggg atgtttttta 420 gctggtggga aagaatcctc tcctgatagg tcatggaatg gtgaactgag aggttttgga 480 agtcatgtcc tcaccccata ggaaacctct gtggcagggc agaaggaagc caacagttag 540 agatgagaag ctgagaagag agagtcttgc tgatgtctaa gtccctgtcc ccgactgcc 599 <210> 133 <211> 599 <212> DNA <213> Homo sapiens <400> 133 gagcctagtt tttcacaaat gttgattgat attttcattt accctaacag gtaagaaaaa 60 atgacatata atgaagacat ataatggaac ttcactcatt tatcagtgac acagatatta 120 ctttcattga atcagaattc aatcagatat tagttttaaa tagaatattt cctcatttgt 180 gggtgctatt cacaatatat aaaagctata gacatgacag actttgaaat ttaatctgca 240 ttattaatat tttcttcacc cctttcttaa gttcagagtc taaactttgc acaatcaacr 300 aaacattaac tggagtcctg atgtgtagca tttgcccatt tccatagtgt aaatactccc 360 accgtggcca gtttcagcta ccaacatcat gtccctggat acagagttgg gaagagatgt 420 atagtagcac agagctttgt agtattttca ccatacaaat gcaatagttg caaacaatct 480 caagagcata gataatagta aaacatagtg aaatagttca gatgtgacaa gtgttgggta 540 ttacctttgt ttcaaatatt atttatcaaa ttgtaaattt gtcaaattta tttttaata 599 <210> 134 <211> 599 <212> DNA <213> Homo sapiens <400> 134 aagatttccc aacaggcaaa tgtcagagcc tggatcagac ttcagactca ggccccctct 60 ttttctccag tgccgtgtca cctctcacta aggggtcatc taatccagcc tgctatctga 120 tatactaatg ccttcaacaa cgtccctgtc cagtgactat ccagcttctg cctaaacact 180 ccccaagaca cgagcctcac taccattccc tgaagcagcg agatgcatct ttagacagct 240 ctgccagaaa acacttgctc agtcagggtc aaaatcagcc gtcttgtaac actcctgtcy 300 gagacctcag taatcatgcc atgcagccat tcaaatgcct tctgcgacac agatgccggc 360 ccacttccag catctgctcg ctcacctcca gtttggggaa ttcaacacca ctcaagccga 420 ccctttcctt ctttgagtat ttaaaaatca tcctccctcc cgcaactcct ccccactggc 480 tttgtcctct gtggccccca cagaccacat ctgttccttc tgccccaggg tagcccctca 540 gagacaacga ccatgcccct aagttttatt tttcttctgg ctgcagcctt aacaggtca 599 <210> 135 <211> 599 <212> DNA <213> Homo sapiens <400> 135 ttcgggctga ggcactgtag ggaccttggg ttcaagctct ataccctccc ttagcaacag 60 tcaattgcct gagtatagaa taaactttgc ctctgacccc tcagctctag ccccaagtct 120 gaggtagttg agggtttagg agaaaaatta agctttctgt tcaggacaca atggccaact 180 ggaaggggtc cctgtctcca agtcagtctg ggccaaagga tcctctagta aaagcctaag 240 gtcctcctca gtgccctaag gaaccctccc ctgccttgaa cacatacgag cttgacttts 300 tgtgtgtgct cagcctgttc ctgagggtag acatgacaag atagctgggg gaatatgtcc 360 ctgatgaaaa acagttcaga caggggcatg taccatgaag gatggggaag gggcccagat 420 tgggaaagca tgttcccagg atcacattgc accacatggg gagaaccagg attttcatct 480 cattgcttgt ataagttccc aatagaaata aataggaata ttgtgagtgt gtgtggagcc 540 tccatagagc catagaaggg gtgtgtgact tgcccaagat atgacagtta caagtgtcc 599 <210> 136 <211> 599 <212> DNA <213> Homo sapiens <400> 136 taaattaatt tttgtatatg gtatgaggta ggagttcaaa ttcattcttt tgcatgtgga 60 tatccattgt catggcacca tttgttgagg agactgtttt tcccatggaa tgctcttggt 120 acccttgtca aaaattaatt agtcataggt gtatgggttt atttctggac tctctattct 180 attccattga tctatatatc tatccttatg ccagtgtcac ttcagtaaag ttttctagtt 240 ttcttaaaaa aaaaaaaaca aaaaacagca gattcaaccc actttcttct ggcctttaak 300 tccaatatta taattagaat aaactgctcc caaaaggatg tgaataacac accctacaac 360 ctggactgag gttttttcat tattacactc atgacttctg ctccaatatg tgtttgaaca 420 ctgtttgagt gagaggcggt gtttcttaac attctcttct tctgcatatc cagaacaaat 480 aatacaaagg gaatctagaa actacctaac cccatagcca gatcattctg acaatgctat 540 agaaaaatta ggtaggatat gccatattat aaagtagggc catgagttca aaaaacaaa 599 <210> 137 <211> 599 <212> DNA <213> Homo sapiens <400> 137 acatttgcat attaaagggc taaggtggga aggccaggtt gttcatgggc tacgtgaatg 60 acacacctgg tcaaaccaat cccctgagac ctatgcaaac cagacactgc ctcctccagc 120 ctccctatat aatggactgc ctttgtgctg cacacagggt ttctctttgt tccaagtcct 180 cctcccttgt ctttgtatga gggagctggt ctcttttttc ttccttcttt cttgcctatt 240 aaactttttg ctccttaaaa ccaaaaaaag aaaaaatact ttttggctag ttcagcacas 300 gcaccaacca gtcggagtgg acacccagcc aatcggaaca aatgccagct gtcaacaaca 360 ggaaacactg tactgtacct gacttagtgc aaaggggcct gggaaatgga gttgctggct 420 gagcaattgt tgtgcagtga tgactcaccc tgtggcacca gatgcaccca tcctggtgga 480 cggctagctg gccctgcctc aaatcacata aggtaccaca agcttccatc tcaggtgtct 540 gctttcaacc cctgcatgtc ccctccaccg caccctatca tcaaggccag ctagtccac 599 <210> 138 <211> 599 <212> DNA <213> Homo sapiens <400> 138 ggagcgacat ggtcattaac cacatatttg cacagcttat tcatgttagt tgggctgctc 60 catctcactg agtctaattg gacacgccca caatgctgca caacacattt acatcgacct 120 ggctgtcagc agccaataaa ggactacagg atgtgtttgg ttccaaaggg acttggctct 180 cggcagaagc ttgtttgcag gcacactggg tgtcttggct ttctggcact gtggactaca 240 gcttaactca gagcatacat tcaatcattt ctcaaacatt tgttagctca agcactgtay 300 caggcacagc actggcccta gcagggtcta caaagatgaa ccaggcacca tttctgccac 360 ctcgaggagg tttaccttct gccctccatg atgtgaccct gtctagcagg ccccctcctg 420 cccacctggg gcatgtgtgc catctaccag cccactccac attctctgcg caggtctctg 480 tgctcttcct tcagcctgga attcttctgt ccacctggct ctgtctgaag acgccacctc 540 ctctgtgagg cctctcctga tttctgagac cacacaaatc tctccctggg ctgcgtttt 599 <210> 139 <211> 599 <212> DNA <213> Homo sapiens <400> 139 cccaaggcct tcaagagcct ccaggctcac agagattaac ttgtcctcac ccgcctgcct 60 gccttttgtg cagatctctg cattgtcctg aagaaagact ccggcactcg ggctgaaact 120 ccgtgtgccg atgaccctgg ccttgtcccg ggaggcactg gaagggatgg cgcccgtcgc 180 gctcctgaag gcccggagcc acccgctgtg agcagataac cggcagcact gggcagcgcg 240 gaggcggccc cacgaggact cagccccggg ctgggagtca gggattcgcc ctgaagcctk 300 gcaggtgccc ccgtcaccgg gcgtcggatt cccgcgggac gcggttttcc ccacggctgg 360 gcctcccttt gggcgagtcc ccagcacaat gcgcgtcatc ccgcagacct gcccggcaga 420 ggcgggcggg caggagcgcg cttggcttcc tgtctcgctg aatggcttga atgggcgctg 480 ggcccgttcc taatccccta gcggctgact gtcccggcag gggcggagga gggcgggggg 540 gcttgcagcc ctggcgtctc ctcgcaggct gcaggcagtg gggcccgcct gttctagtt 599 <210> 140 <211> 599 <212> DNA <213> Homo sapiens <400> 140 ctgaatccta ttcctgtccc acagaataca aatgtttcac tgaacacagt ttgtgaagtg 60 ctgccctgaa aaatatcagc tcttgtcctg acaacctgag agcacaggat ggaggccgtg 120 aaggaagcct ggagacctct gtgcagagcc tctttgttgt acatgtgagg ttctgagacc 180 cagagagtag caggtgttct caggttgcac agccaaggag gggaggcacc atggccaaga 240 acggcctttt cactccaggc aggctggcag ggctggcatt ttggaaagct ctcagcagay 300 agaattcaca caccttcctg tagaggccgc acaggattca agagatggaa actgctggaa 360 ggagcactgt cttattgaaa gtaatctcaa gatcccagga ccacaaagct agatgtttca 420 catcagtcta attcccccaa cacacaggcc tagagaggag aaggacttat tcaaggccac 480 aaagcaagtt caaagcacag ctggaactag aatccaagtg tcctgccccc tgcctccagc 540 tccaaggctc tgtctggcct ttcctgcagt tgttgatatg tctgtctgtc ttctcagcc 599 <210> 141 <211> 599 <212> DNA <213> Homo sapiens <400> 141 ggacatgctc caatgacacc catggctgct tcctcatagg gcaccctctg cctctctgga 60 gcctgccgct ggctctatcg aaaggggcca gtgggaaata gtcatggggt cctactctga 120 tctgagcagc cagagggagt gacatgagct gagagttgtg aataaacccc tgtactttgt 180 acttacttac tcaacttgac aaacattccc catggacttg ccctctgtca gactgcactg 240 ggaactgggg attctgtagt gaatcaggca ctatgtttgc tcttcagaat ctagtaagak 300 ttgggctcac atagccaaaa tgcaaagcag agcatggcag cgccctggaa gatgaattcc 360 agattcctgc tgcctggtcc agaatcagca tagcccaaca atgctaggtg accttggtca 420 agttgcttaa tctctctacc ctcagtttcc atccttaccc ttctttctca aagagctact 480 ctaagaagaa aataagacaa ttggcctgga catactttgg agtcaaagct gaatagggag 540 agacgattgc tagtgtttca tagtgtcatc agtaacatag acaccattta ttcagtatc 599 <210> 142 <211> 599 <212> DNA <213> Homo sapiens <400> 142 atttatatgg gcagattgaa tgagcattat ctccgcaagg tcttcccagt actttatagt 60 ttgcaaagca aactttaatg tctctgaact ctaaggatac tctggcaagc aaagatagtc 120 tctcatttta ctaattagga aactgaggcc agagagggaa aggcacctgc tctgtgcatc 180 atgcgtgcat gcacatgtgc ctgtgtatgt gtgtttctgt gtgcaagaaa ggccttgaat 240 gctcctgcag acctggatcc cagttgtgag agaagttgtc agttctgatg cttggcgggy 300 agcgttccgg cccactgccc atgtatggag tcactcagac ttagctaagt acacagcagc 360 caggagcctg tgtttcagca gctaaaatca gtgggcagca caaaaatgta ggtgtagctc 420 cctcgccgct tccaccttgc ccctcttctc tcccctccca cagggtggaa ctgcctggaa 480 taagctcagc ccagataaca agtctacaca tgcagcatcc agggaataag cacagggcag 540 ctctggggca cacatggaga catgtatctt catacacacg cacatatgta cacacaaat 599 <210> 143 <211> 599 <212> DNA <213> Homo sapiens <400> 143 atggaaactt gcttatgatg tgttctgcta gaagctgcaa gacactaaat tgcatgtaca 60 ggccaaatac aactgcccac agccatatgc ctatgaaaaa gatactagaa aggatatcag 120 ggtgttttcc ttctttcatc ccctccatcc tttgcattta cagatgagga aactgagacc 180 aatgggctgt tcctgctgtt gagaacctgt ccctacagtt tccgtgtggc ccacaggggc 240 agagtggagg agctggtgac catgcaacag gaggatcagg tcatgaaaga cacctggagm 300 tggggtggag acagctagtt caacacgtgg cttcagcaca cacccactga gcaaaggagc 360 ctactcaatg ccaggccctg agggagagag gcagacccga cccagtgctc actatcacgg 420 ggcacatggg aggaagagac gatctctgcc tgaggtgatc agagagggca ttaagcagga 480 gtggcatttg gatctcaaag cagggtgagg acatgtggca cactggagcc agtttgtacc 540 agcttttgga ggctagctgc ttttaggaat ttcacatgcc agtgcttaga cataggtat 599 <210> 144 <211> 599 <212> DNA <213> Homo sapiens <400> 144 taataattaa ttaatttaat taattatggc aaattatact gggtttccat ccaaagtttc 60 tttttagagt aaacgtacat tttttaaaaa tgagttagtt taaagaaaaa tattgattac 120 tctcacaagt ggtttgtaga tatgacaaaa attgtaaagg cagaatcaaa agactaaaat 180 tatggtgaac gtccctggaa caatgaaaag aacatgggct ttggaatcag gccagggttt 240 gaatccagtt cctccaattg ttagcagtgt gacctcatta ctcaagctct ctgagattgy 300 ttcctcctca ttacttttta atggagatca ttaaccaaac ctcatgttgg tgggggtgat 360 ggcagtgtga agggatggag tgggaggagg tgcatggggg tgtgaggggg ggggcggtgg 420 ggaggtgtga ggattatggc ttactttcac cactgctgtt cttacattcc tctttcttat 480 tgttgcccct gggtcttgac ccagtttgta aattggggtc caatccaacc caattcccag 540 atgcctggcc aggctccggg gacagaaccc aataggacca gcttcctgcc ctccaggag 599 <210> 145 <211> 599 <212> DNA <213> Homo sapiens <400> 145 ttgctctgtc acccaggctg gagtgcagtg gcatgatctc ggctcactgc aagctccgcc 60 tcccgggttc acgccattct cctgcctcag cctcccgagt agctgggact acagtcgcct 120 gccaccatgc ccggctaagt ttttgtattt tttttagtag agacggagtt tcactgtgtt 180 agctaagata gcctcgatct cctgcccttg agaccagccc gcttccgcct cccaaagtgc 240 tgggattaca ggcgtgagcc actgcgcccg gccaactgct agtggatttt acaacaaacr 300 gcagcactga agttaaaggt gtatggaatt tacagtagag tattgcatgt tactattttt 360 aaattgtggg ctacacattc tttatattag gaaaatttgt aattaacaaa tacatatatt 420 aacttgtata cttatattaa cttatataca tatatatgca tacatttttg agaatccatt 480 gtaggaactc agataggaga agacagggca ggagaaggta gaggaagata cagtagggat 540 tataatccct actgtataga tacagtgtct tctatagcag agtgacactg taggagatg 599 <210> 146 <211> 599 <212> DNA <213> Homo sapiens <400> 146 tatctaaaca acatttgggt gttctaaagt aaccaccagg taacacaatg gtttgctcct 60 atactaccta tgaaaggaat gacgaaagga ataattaggt ttgtatagaa tattgtgcat 120 tatagtcata actgctgtga gaactcccaa atcagggtgg tgtgcaggtt agggcagagt 180 tttgggagag gcgaactgtt ctgtacaaaa aggagaagaa tcataatgct gaggggaggg 240 gagggacctg ggagagggga gtgagcagca agcagggtgg ggcaccacct gaatgaaggw 300 cagaaggtga gagcccttag gggcacagca gcacaaaaga ctttgggaga aaaggaatta 360 ataagaggga atttttaagt tgtttgtcat ggtgtgtgct atgggcctcc ttccctcttg 420 tcactcttac actgtcttta gaaaagtcat tctttttttg tgaaagggga ttctccaggg 480 agtattgaag gatgcaggga tgaattgttt gtttctgaaa tggagtcttg ctctgtcact 540 caggctggag tgcagtggtg tgatctcagc tcactgcaac cttcacctct tgggttcaa 599 <210> 147 <211> 599 <212> DNA <213> Homo sapiens <400> 147 gcaaagcgtg ccattgaggc tgtgctgtca gcggatcctc ggtctgtgta ccgccggaag 60 ctttgccagg accgcctttt ctactttact gtagacatag cgcatgtcac ttgctggttt 120 ggtgatggct ttgcagaggt gctgaggatc aagccggctt ctgagcctgt tcatatgact 180 ggccctgtgg ggtccttggt gtctctaggg tcttaaggag cctccctcat gtctttaagg 240 tagcatcatt gatctttgga tgtggctttt ggattttctg aacaagctaa tgttgtgtcr 300 agaagcaaca ctttgtgatc tcatggcttt gattgatttg ggctgttcaa aatgtttatt 360 tgaaaaacgt atacattaat aaacttaaca aagagatata aaatacagag aaatcaccaa 420 atgctttttg atctgttgat attaaagaat caaaaggtga tgctgtctcg ataatttctg 480 aaagaagctg ttcttggtgc acttgataaa attagacaaa gttcattcca gcagagactt 540 tctagttgag gggatctatt cagtaattca tattggtttt cctgtctgtc tggaaaagc 599 <210> 148 <211> 599 <212> DNA <213> Homo sapiens <400> 148 agtggactga ggagggctga gcggaaggat atgaggtcaa agaggcacta gaaaagggac 60 gaggtcacct aagggtttta taggccattg taaggacttg agttttgatc ttgggagaag 120 taaaaggcag aggaacttga tgtccgtatc cccagagagc aggggaccat ctctggggtc 180 agatcactac ctgtgtgatt tctgggatgt cacacctcag tgacatgcaa aggcaagctg 240 gagttcctta ttgagacaat gaagactttc attctatatc cagaaaataa aggcttacam 300 aaccaaagat actagatttt cccctgcttt actagcaggg agagaatgaa gaggctaggg 360 gggtatttgg ctttgataat ccaacctgaa ggaggttttt ctgatgggaa aaagaagtct 420 aaaagttggg actggagata catgccaact gactctgaga tttccccatt tcttcctgtc 480 agagccacag ccagcccaca ctgttgcctt ttgcaaagga aaagccaccc cttcctctgg 540 gtggaggcag ccacctgcca gggcccagga actggtttta gccccaacat gcaaacttc 599 <210> 149 <211> 599 <212> DNA <213> Homo sapiens <400> 149 acctcagccc tccttccttt cttgtctttc agcatcaatg cagagaaaag aggagcagca 60 aagagggtgc atttccaggt tagtgtctta gtccgtttgg gctgcaataa cagaatacca 120 taggcccata gactaggtgg cttaaattga tctctcacac tgctgaaggg tgcaaatgcc 180 aaaatcaggg cactggcaga ttcagtatcc ggtgacgccc actatgtcct cacatggtaa 240 aacagacaat ggggttctca ggggtctctt ttattaggcc actaattcca ctcatgaags 300 ctcctccccc acaatctact cacctcccaa aagcctcgct tcctaatact gttggaccgg 360 ggattaggat ttcaacacat gaactagggg gatataaaca ttcagtcaat agtagaaggt 420 tctgcctgtt cagcccagaa ctctcaaggt ctaaacttaa tctctccttt cccatgagga 480 ccccggtcca cagcctctga ggctgtgtca gcttctagag cccattactc tcagaagata 540 aagcccccag cagggacact cataaaaagg aatccgaatc tggagtgctt aggagattg 599 <210> 150 <211> 599 <212> DNA <213> Homo sapiens <400> 150 caaatattta acaggaggtc ctctgaggct gtataaatat ccagtttctt cttaaaattt 60 tgtccaccaa ttttatcata gtcagtggat attgcaatta ctgttatagt gttctaatgg 120 tgatcttctg ttttcttagt ttcttctata tttactattt gaaattcttc tataaggaaa 180 atttatctct tcttccccgt ttatttattt attcaatcca tttttattta tatcaatatg 240 gactcatgga tatttatttt attcttcagg ttataatgca ctaccacatt tattaaccty 300 gttgctcaac tttagccact gggagctctt tcaggttgac ttttacgtcc ttttgtcatg 360 ccctatcttt attttttcaa tatactttct tacttgctgg cactccttta ggatttagga 420 ccatcttgta tttattttcc ttgactcagc tctagaacta cccatttctc caaggggccc 480 tggttccttt tattggagaa tggtatttag gaaccaagat ttgggggctg agagtgccca 540 ttgctactgg ggtgtcactg cttctaggcc ttctcagcag acagagcaag gaaatatat 599 <210> 151 <211> 599 <212> DNA <213> Homo sapiens <400> 151 cattctgctg tttccatctc tgctccatgt gctacccctt tggctaaggg ggaaatatgt 60 ttttaaatct caaatagtca ggctcatttt ctgcttcaca cagtccttgt tctctcttga 120 ggaacttgga acatgctcct gagctacact ggaaaatatc gaagtgccct tctccataat 180 tagccagcat ccctgccatc tggaccctct catacctcac agggatttcc ttgtccacat 240 ggaactgaga ctgatccaag agtccagctc ctgctgactg aactctgcca tctgttccgm 300 agcttgcctt acctgctcct gtccaaccag gcacccctct gtgggcctgt gctttagtcc 360 tttttcactc tagaccctgg tactactgag gtggcttgcg tggtcctaaa tttgctagtc 420 tcttattttg ataaaggctg caagtagcaa atatccttat ccttgaaaat aagggcatct 480 aggcccctgg cttcttttta tgtttattta tgcatgtact atagaaaact tggaaaccat 540 acttacagag aagaaaataa gaatttccat ccaaggcttt tttaaagggc caagcactg 599 <210> 152 <211> 599 <212> DNA <213> Homo sapiens <400> 152 tcgatcaaag taatgagaat gaattacagt gagcccttaa tgacaagaga aatctagctt 60 cttagtagtt atatgaattt cagcaaacct acttggcttt gctgagtctg tttcctaaat 120 actaaaaaaa ggtggattat cgtcctgccc ggggagctgt tgctaggatt aactgagaag 180 cagtgtacac aaaagtccca tgcatagcac ttggcataag gatggtgctt aataaatatt 240 agacctgact cttggtagtc atagctcttc cctgctgcac caggaaggca tagcacctcy 300 agctggttca gaaagcagaa aggaacctgg gcaggggccc gttactgggc ctagagcttc 360 ctgtacacct gacacattcc cctcctctgt ttttaccatg tggagactaa caggatctcc 420 tcccttaacc cattttcacc tatttgcctc tccctctccc cttgtctcaa taatctcagc 480 tgcctagatg gtatttttta gtacatgtga cactattttc aacataacat acatttgcaa 540 agcatctgct atgttctaaa gatggacccc aggtcctcct ctccattcct atcatccag 599 <210> 153 <211> 599 <212> DNA <213> Homo sapiens <400> 153 gaggggcctg gggtctctgt gtttaagaca gcactcccca gcgccagccc tggcagagga 60 agagtggagg tatggggagg gaggcctcaa acagaatcta gagatcatat tctagcccca 120 acctggccac tgaatggtat ttgctcccct ctgtcacttc ccctctgagc ctccagttcc 180 tcaactgaaa ctccgaggcc caagctaagt gagcctgcag gttgtttcag ctgtacaaat 240 ctgcatgtgg ttcaccgtga gcctaaccag caataggaat actaattgta tttcatgccs 300 ttactcccag ttaccctctg aaggagtagg taagggtttg ggctagtaga aaatgtcaga 360 gctatgttta ggctgatgga attgaaaagg atagaccagt agcatggggc cagatgagtg 420 ctgcactttc agtgaaggag gtgtcttcca gaaattgcca caggtatata cataagttgg 480 ccagactagt cagtcatcta gtagcattac agatgcaggt tagtacatac atctgccatt 540 gatggccatt tactgagagg aatttagtct tcaacttccc tgaaaaataa cctataatc 599 <210> 154 <211> 599 <212> DNA <213> Homo sapiens <400> 154 tggtagaata aaagaataaa ataaaacaaa ataaaaataa aaaaataaaa gaataactaa 60 ggaaaagtgg ttaacaccag ggaagctctc tacagaaaat agggactttg gaatgtaatt 120 gccacagagt tgaatattcc tccttagaac agagcttggt gggggattta agttggttca 180 cttttctgaa ggattagtat gagagatccc catgggaaat caagtgaatc caagattaat 240 ctgctttctg aatgtaaaga ctttggatgg aaaattaggc tgcccgtgtg tgtgtgtgtr 300 tgtgtgtgtg tagactgtct tggggtcaat tgctgggatg ggtagggaca tatttcaaaa 360 tgagcaggga ccacagagtg aggaaacatg ttcaaattct ggctctgcca ttaccttcct 420 gtgccatctg gcaggtgggg ccagtaatca atcatctttg ggtttccagt ttcctgattc 480 caagatgagg gggtagaatc cgaagatctc caaggccttg atgagtgcta ccagtctgca 540 aattcccaag ccaagttctt caatgaatca aatttcctcc agtagccatt tctaccaaa 599 <210> 155 <211> 599 <212> DNA <213> Homo sapiens <400> 155 tgtttttatt tctcccctgg ttccctgggg ctttacttct taatgtggtc actttgaaca 60 tcattggcat caattcacaa cagggaaaca tctgtgagaa gaaacacacc aagcggggaa 120 tctttctgga acaaggatgc agcaacacag aaattagcct gatcctgttg ccttaagctg 180 cattcatgta gtaatccagg aaatgcagtc tcttttttct gtgattggcc agacaaatcc 240 tccttctgaa gaaacttaga tttcagcctc cccgaaccaa aagaaaaaaa agaattgggy 300 aaaaacatca tagtggagca tctatcaaca aaatatgtgc acggagaggt ttcaaaatca 360 tcttgaagac tcacaagaat tgtctttcca aaagcagtaa ggagtagaag tgtacaactg 420 attcaactaa ggacagggcc atcagctctg gatgccaaaa tcttcaccac tcacagacca 480 gcaagggcag gtcttcccac tcggcatccc tagatcctga atatggccca gaggtcttta 540 gcttcccgtt gcagcttttt ggaagccgga ctctctcctc tggctgtccc tgatcctcc 599 <210> 156 <211> 599 <212> DNA <213> Homo sapiens <400> 156 ttagggtaaa taataccaga aaagcaacag gtacaaccca aatcaatcaa gatgtgtgcc 60 agcaccttca gttataaaca ctttcttctt tttgcccctt aatttcagag ctatgaaaat 120 ttccttcctt agaagaaata gttcccaaga cagccccact gtaatatgcc agaagaaatg 180 tcaaaatcgc tactgtggcc aaatcttgtc aaaatggaca cactacaacc atcataccat 240 gttggttctt ttgtaaagca aaggtgacag gtgacaagca ctaagaggca cactgagaar 300 aagtatgggc tttggtttgt gctgcagcag tttgccaagc atgtgaacat gggcaagcta 360 cttaaggttt ctgagttcta aatctctctt gtggaaattg tgcattgtag tatctacatt 420 acagtactgt actgtagact ggaaagaaat attaatatat agtgtctggc acaaactagg 480 gttcaatgaa tggtaatatt attaatattt taattgaatg ctgtatttta aatttaacat 540 taaaatttta tttaaaaatt agctgtgaca gattatattt tccaaaaatg gctgcagca 599 <210> 157 <211> 599 <212> DNA <213> Homo sapiens <400> 157 agcctagcag gttgcctact ggttgttatt ttgatttttt ttattagatt tgattaagcc 60 aggccaggcc tttcctggga gcaggaaggt tctggtggaa gacacagaga ggactctggc 120 tgggtccttt ccctcaggag ggccagccaa gtcagagaca gacgccatca tagagaaagc 180 tgacatgcca tcccgggggc acactgaagt gaagggcact gaggaggggg cgatgatttc 240 aaaacagagg gcttcctggg agctagcctc tcagcaggtc tcagcaaggc aggggcgacr 300 gggtaggtat tcctggctcg gagcatcatt ttaggcagca gggcccaccg atcagtatgt 360 cctatcagct gctggtgtct ttttccctcc atgacgcatc gtttccacca actgctaatt 420 atctcatttc cttcagaggc tctgattgtc atctacaccc cctggctgag ttcctctgaa 480 acgtgctagg ggccacctaa gctcctcttc tccagtttgc cctggtcact tgcccagtgg 540 gtggtttccc aggcttccct cttctgctct gtagtgctca gatgaagaaa accatgtct 599 <210> 158 <211> 599 <212> DNA <213> Homo sapiens <400> 158 ctctgaatca ccaagcgaga cctattttaa aggtgaccag gtcgtgagat atgatctcag 60 cacggaccct tctcccggat gacaagagag caggtagtta ggcgggtact ccgtgtccgc 120 gcatacccag actccgccca gcgcccgggc aggccacccc gagcccctta actgcgcagg 180 cgctctcact cagaaaggcc gctgggtgcg gggagcgcag aggcggtgca gggcggctgg 240 ctcgcctcgg cgtgcagtgc gcgtgcgtgg agctgggagc taggtcctcg gagtgggccr 300 gagatggcgg cggccgacgg ggctttgccg gaggcggcgg ctttagagca acccgcggag 360 ctgcctgcct cggtgcgggc gagtatcgag cggaagcggc agcgggcact gatgctgcgc 420 caggcccggc tggctgcccg gccctactcg gcgacggcgg ctgcggctac tggaggtttg 480 ggccgcgtcc gcgctttccc cttccctctc cccgcctccc cggtccccag actggctcgt 540 gcaagccgag tcccggggcc cgggggtcgc gtcaactccg ctggcgtatg tgtgcagat 599 <210> 159 <211> 599 <212> DNA <213> Homo sapiens <400> 159 atgagtcctc tacgtcagca ctcctcgcca tgcgccgttc ttccgtgagc atcttaacag 60 gtctctgctg gctcttcaga tttcctgttg tttttccaca cctagggagt gtgcaaggag 120 gtgttccagc tcaagggtgg catccacaag tacctggaag agtttcctga tggcttttac 180 aaagggaagt tgtttgtttt tgatgaacgc tatgctctgt cctacaacag tgatgtggtg 240 tcaggtaggt cagcacaggc tcagagccca aactgaaatg aagcacattg tcagttcacy 300 attctagaaa aatgacacag ggaagacagg ccagtgctca ttactgagca ctgaataagc 360 agggaaaata agtacattgt gccaccattt tcccagctgt ggagctgaga gaaccctagc 420 ccaggagtca ggaggcctgg gttgggatcc tggcttcacc attgctagct ggacaagccc 480 attaacatgg ggatcatctc acctgccctg cctgcctgtc tacctgccaa gagctgtact 540 actgggctaa ttcagggctc ttaacctgga attggtacat agatttcagg gattctgtg 599 <210> 160 <211> 599 <212> DNA <213> Homo sapiens <400> 160 gcatacattg tttcattgtg cttagcagaa attgcttctt tttttttttt ttaactgaag 60 gtttgtggca accctgcaac aagcaagtct actggcacca tttttccaat ggcatctgct 120 tgcttcttgt ctctgtgtca catactggta atttttacaa taaaacaagc ttttccatta 180 ttaattgctg caatcccata ataaaacttt aaaaaataag aagatgcttt ctatgtatga 240 gcaaagaaag tgtttttttg agatggaatc aactccttgt gaacactgct gaatgacaay 300 gaaggattta gaatatcata gaaacttagc taataaagca gtggcagggt ttgggaagat 360 taattccaac tctgaaagaa gttctactgt gggtaaaatg ctgtatcaaa cagcaagcat 420 cacatgcttc agagaaatct attgtgagag gaaaagtcaa tctaggcaac aaattttatt 480 gttgtctatt tttgaactcc ctgacccaaa tagtgaagga tgtatctaca tatgtatagg 540 tacatatgta tttacagaca tacaagtaca tacatgtaat acacacacac aacacactt 599 <210> 161 <211> 599 <212> DNA <213> Homo sapiens <400> 161 acctgacacc acatcactgt tgtaggacag agcatagcgt tcatcaaaaa caaacaactt 60 ccctttgtaa aagccatcag gaaactcttc caggtacttg tggatgccac ccttgagctg 120 gaacacctcc ttgcacactc cctaggtgtg gaaaaacaac aggaaatctg aagagccagc 180 agagacctgt taagatgctc acggaagaac ggcgcatggc gaggagtgct gacgtagagg 240 actcatggcc gctgctatca gtcaggggct cctggctccc actgcgggac actgaggaay 300 tgctgaccaa ggggtcaagg caccaactgg ccagatcttg cctcctaggg ggatgggtga 360 tgacagcagg cagggccttc accctctaga tcctgggaag cccaactatt tttgctgccc 420 cctaaatata ggaagacacc tgttgggaca tgtaatgtta ctgaatttgc tcttctcagg 480 atcaagcaaa aggatcagga aaagggagat gttaactaat ctctcccttt tacatctgat 540 gagtctctat gactgttaag tgtttttcat atcttgagat taaagaccct cagattttg 599 <210> 162 <211> 599 <212> DNA <213> Homo sapiens <400> 162 atgcttgtgg agttaaataa attgaatgaa taatactgag taagactact tgcatatctc 60 tttagcactg acaactcata gtccaaagct gcaccctaca accgccttgt ctctgcttgt 120 gtgactttgg tgatggggaa cactccactt gagaacaaac aacccattct attgttgtct 180 agcattggcc attatttatt gtaataataa caataacaat agcaaacact tatatggtac 240 ttactataat actaggcagt ttttaagcat attcaccagt ctcagtttag agatgagacr 300 actaaagcac agagatgcta agcaacttgt tcaagatcat acagctaata agtgacagag 360 ctgggttcag gcaggcacag cccagcccca gcattaatag tctcaaccac caaattataa 420 gtctctaaac tggaacaagt ctccctctta ccctcttact tcctccacca gagattgtcc 480 tgcatgggtt agcacagagc tggaatcaga ccaggttctt gccagtaccc tacgtggcta 540 accaggtggc ttgaaacaga gagggcatct ctgcctcaag cttagtcttg gagttattg 599 <210> 163 <211> 599 <212> DNA <213> Homo sapiens <400> 163 attaacggta ttttataaaa ttttcaacta caaccactag tcaacctaaa accttagtgc 60 ataaagaact gaaccacaaa agggtttcat gctgccagca ttttgccttc tggtttcccc 120 tgcagagcac aggtcatcaa tagaacacat ccagttcaaa ggcatggact ccaccgccac 180 acactagaca ccactccggc acttgggaat gatgggccca gtcaggtccg caagcctcct 240 cttcctcact ggaaaggaat ggagataaga tataaggcac ttttccctgt agaccagggr 300 ccagcactgt tgctgagaaa gcactgtgaa acctcgcact aattggtttg ttaacagagt 360 ctgaagtctg ttgttttgaa aggacagtat gtgtgagttg tacaacagcc ctccagtctg 420 tcagtgttca ttgatgaggg tctgtggtag tggagattca ttcatagata tctgctaagt 480 ggctgaccac acagtcccac gttataagtc ggctattttc tttgcttaca gaagctccag 540 ttgaagatct ttactccggt gttcagataa gagttaaaag tttagtcagt cttcttaat 599 <210> 164 <211> 599 <212> DNA <213> Homo sapiens <400> 164 tacccacatt ctgtagggtt gttgtgaaga tcaaagatga tggatgtaag atgtgtatct 60 cagagcctgg tccacagtac actctcaaca catgtaacat gtaagatgtt gttattagca 120 tcctcttaga aagtcagagc tgaaagagtt gccccgcaga taaaatgatt gacccacaga 180 agttacagag aaacagtaac tccataagaa taaagacaaa ctagaattgc ctagagagta 240 atgtgaatgg tgaggaaatt caaaagccgc attgaatggg ggtgaatgaa gaaaactggr 300 aattttaacc tggagaagga gagcttagtg gtccatgaga tctgtgcaac agatgtcctg 360 agtgaagcag agaacagagc taagcccaac aaacaggact tacggggagc tgacttctac 420 cggatataag gaagaatgtt ctcattgcct aagaatggaa gtgatgatgt tggtaaggag 480 tgtgtccccc atcatgagag ggactcaatc agaactggaa gagcacgtag tggaagcgat 540 gaagaaggaa ggtgagcgtg gtagagggtg tgaactttag ggaccttgga ggtccctca 599 <210> 165 <211> 599 <212> DNA <213> Homo sapiens <400> 165 actgtactat ttcttataac tgcttgtgaa tctactatga tgtcaaaata aaacttttaa 60 ttaaaaagaa aaaagcaaaa ataacgattt gttgtttatc tgaaagtcaa attaaactgg 120 gcatcctgta ttttatcagg catctctggg agcttgttgg agatgcagat tccctggccc 180 cacttcagac ccactacatc agaatctgtg ttgtaacact aaagtatgag aagctctgat 240 tagtggctcc tgggtgtgtt agtccatttt gcattgctat ataggaatat gtgaggctgr 300 gtatttacaa agaaaagacg tttgtttggc tcacagttct gcaggaggca aaagaagcct 360 ggcaccagca tctgcttctg gtaaggactg caggggagct tccaatcatg cagacagtga 420 aggggggatc aggtgtgccg caggccacgg ggaggtgtcc cagactgttt tcaacaatca 480 gatctcaggt gaactcatta tcacagggag ggcatcaagc cattcatgag ctgcccccat 540 gacccaaaca cctcccatga ggccccacct ccaacactgg ggatcacatt tccacatga 599 <210> 166 <211> 599 <212> DNA <213> Homo sapiens <400> 166 agctgtattc attcaaaagc atagtctggg gtcaaaatcc tacacattcc aggagctcct 60 gttattggta atgactgcag atgctgagaa tcaggctttg tgatctgtgc tgtcgatcta 120 agagggcagg gacagctagt agaaaaatgt ccaatagcac tagtagttaa aacaaaaagc 180 acataaaaca acaataaagt ctatgattgg catatatttt ctgaaatgaa aaatctctat 240 gctggtggtg atgacataaa actgaaaact acacaattgt ttcaaaggaa aggtaaagcr 300 aattttgatt acataaaata tgacgtcttc tgcatccaat agtggaaaat gtggaaacta 360 tacaggaaca tggaaacttg cttatgatgt gttctgctag aagctgcaag acactaaatt 420 gcatgtacag gccaaataca actgcccaca gccatatgcc tatgaaaaag atactagaaa 480 ggatatcagg gtgttttcct tctttcatcc cctccatcct ttgcatttac agatgaggaa 540 actgagacca atgggctgtt cctgctgttg agaacctgtc cctacagttt ccgtgtggc 599 <210> 167 <211> 599 <212> DNA <213> Homo sapiens <400> 167 taagtatgaa atgacaaatg agagtgagcg tctgaacaga atcagtacag cgtgtgaggg 60 aggcacttgg ggtagggctg ggggagacca gggaagagct atggagaaga gcctaggagc 120 agaagagtag cagtgagaaa gtgcggagaa ggtccagggc ttgggagcgg caggaggagc 180 ggttccgggc tggggagggc aggcccctct gaacggagtg gcctggcagg cttgctatct 240 gctgatggga ggagcctgga gggcaagctc aggtgtgccc tcctaactca ggtgtgacay 300 gggtgagatg catcactcat gtattcacct aactgctcac taagccagtg cacattattg 360 aactcctact gtatactagg atgaacagga gccagtcctt gcctttggga ggcccaggag 420 gtgatgagga ggacagacga gaaacatgta tttttttttt aaccttaaaa tcttttatca 480 cttcaacatg tagatttcaa cattaaaagc gtccctgctg ggcaacaagc agagtgcaca 540 ggttcctggc agggctaagt tcttggcgca tagcctacag ggttgtaggt cagaggctg 599 <210> 168 <211> 599 <212> DNA <213> Homo sapiens <400> 168 gagctgggag ctaggtcctc ggagtgggcc agagatggcg gcggccgacg gggctttgcc 60 ggaggcggcg gctttagagc aacccgcgga gctgcctgcc tcggtgcggg cgagtatcga 120 gcggaagcgg cagcgggcac tgatgctgcg ccaggcccgg ctggctgccc ggccctactc 180 ggcgacggcg gctgcggcta ctggaggttt gggccgcgtc cgcgctttcc ccttccctct 240 ccccgcctcc ccggtcccca gactggctcg tgcaagccga gtcccggggc ccgggggtcs 300 cgtcaactcc gctggcgtat gtgtgcagat tctccccgag tcggagaggg aatccgccca 360 gccagccgcc ttgtcaaagc gtcctgtcca cgaccacaga gcgttcctct gtcgcacgcg 420 ggcctcctga cccccagccc cgggccttct tcgctgcacc tcggctgctg gcagcttcga 480 tttttcgttt agggatgcag ccgccccggc cgggaggtgt cagccactgc caggtgtcag 540 ggcctcagct gtcccggaaa gaggagttag actagttctt gattctggcc tctatacct 599 <210> 169 <211> 599 <212> DNA <213> Homo sapiens <400> 169 gttccagttg ttccacatcc tcatttcaca tttgacacag ttggtctttc tcactttagc 60 cattttaatg ggtgaattgt agtatctcat tgtggttgga aaaatacttt aaatcaaacc 120 aaaatacaga atgaaaatct taccttatca gctcatcagg gttaaagcag cttatatcag 180 ggagccaagc agacacgtca tggctatgtg gaaggcactc ttttaaaggg ttcttttcat 240 ctgcagacga aagactcttt gaggtgctca atgtcacagc cagttgcttt aaaatagaak 300 ctgtctggtg ataaatttca tcagcatgtt gtgttgccac atgtctatgg atgctggttt 360 ggtctgtgaa tagctgccga cagcatttcc acaatttttc tttacattca aaactccttt 420 ttgttggaac ttctttggtt ttgacaaaaa gggcaaaggc ctgcaattag atttcaaatg 480 ctaacactgt taaataacct taggtttatg gctaatagaa gtctcactaa gattctttag 540 attatctttc cacaggggct tctagtttta tgttccatta tgttatacaa ttctctgag 599 <210> 170 <211> 599 <212> DNA <213> Homo sapiens <400> 170 cttaaccaag aaacaaataa tagcaatggt ggtgcaccac tgtaccccag gttctagtca 60 tgtgtttttt aggacgattt ctgtctccac gatggtggaa acagtgggga actactgctg 120 gaaaaagccc taatagcaga aataaacatt gagttgtacg agtctgatca tgttttctgt 180 actcttgggg cctctattgt gggacttaac attagtctag atagcttttt aaatgctgga 240 ttaaaatgga aaagagctgt tttcatggtt gactatctga ttgttgatca aagaaggcay 300 tgatgtttat tttaagtagt gctaacattt actgagcatt taccaaccag gtgccaggca 360 tgcacctaag tgccttagga gtatgttcat ttagtcccag gcttgcttcc atgctgcttt 420 cagacttcta aggaaaggaa ggtgaagtct cacatcaccg caggcatctg catcaacttt 480 agtgaaattt tcctgtagct tgtcaaaaga attattgggt ctatgcatta ttttttgaca 540 aaaacaaatt ccagttagtt aaaataacct gatattttca aattgtttga catgacatt 599 <210> 171 <211> 599 <212> DNA <213> Homo sapiens <400> 171 tcatcctcta ctcctccctc atcccggatg acagggaatg tatccagaca accacccagg 60 cccatgcaga caccctccac caacaagatg ctgcccataa ccttataggg accctagctg 120 tccccagaac tgaccccaat tgggattatg aagcagtttc ctcagacaga cagaaacgaa 180 gctatatgat atcatgcctc ctagctggca tggataaagc tgcccttaag gctgtaaact 240 ctgaaaagat aaaagaaatc actcaaggcc ccaatgaaaa ccctgctctt ttcttctccs 300 gcatttcaga ggccataact aattatacca ccttaagccc tgataccaat gggggcagaa 360 tctacctacc catttacact tcatttccca gtcagccccc aacgtctgaa agaaacttaa 420 aaaactagaa gatggccctc aaacctccca aagagactta atcaaagtgg cctttatggt 480 ctttaatgat gatggctaga atttaaaaaa agaacaaaag aaagaaaaga aaagaagtat 540 tggcaaagat gtaaaaaaaa ttggaaccct catacattat tggtgggaat gtaaactag 599 <210> 172 <211> 599 <212> DNA <213> Homo sapiens <400> 172 gtacctactc tatgggtagg ttctcaatga ctactgctga aggaattcaa actgaaatgg 60 aagaagtttt ctcatggatc aaaagtctta gctgaagact tcatgttttc cattaactgc 120 agtcactcac atctatttaa gcttctgcta tcaaaaatgg aaaagcagcc agtgacttct 180 gctttaaccg aggctgtctt gtattttttg taaacttttt tctattttta aatttttatc 240 tagagaaagg gtcttgctct gtcatccagg ctggagtgca gtggcacgat tgtagctcay 300 taacttcaaa ctcatgggct ctaacaatcc tcctgcccta gcctctcaag tagctcagac 360 tacaagtgca agcccagcta atttttaaga ttttttgtag agatggggtc tcgttatgtt 420 gctatgtagc tggtctcaaa ctcctggcct caagcagtcc tcctgctgcc acctctcaaa 480 atgttgggat tacaggcagg gcgcagtggc tcatgcctgt aatcccagca ctttgggagg 540 cggaggcagg tagatcattt gaggtcagga gttcaagacc agcctggcca acatggtga 599 <210> 173 <211> 599 <212> DNA <213> Homo sapiens <400> 173 gatcttccaa ctttagcacc atcttcacat ttaatggttg gcattttact gtaagcagga 60 gccctctcct ctctcctgtt tcttatctac ttattattga tctatttatt cttgcacaga 120 ctcatagatt cctatttttc aatggtttat tttctttatt ttcttaatta tgttgatgct 180 caaattgtcc tagatttggc cagtggaagc ctcttcaagt tgatttcctt gtccttttga 240 caggtcccca tcactttttt gagcactgcc ttactttcca gcacaaggta tttaatgcty 300 attttgtaaa ggaaaagtgt gtgattagaa caaaaaaagg ggccctcaca gatcaacaaa 360 gatggttgtg cattggcaat tataggtata attaagtgca aattattttg agcatataac 420 acagaaagaa ataactgcac agaaaaaaga aaggaccata ataaaagact aaaagaaact 480 cttggaatta tgaaaagttt ttttcatatt gttctttttt tctgtatatt caaaatttta 540 tgtaatgaga atgtattagt tttataatga gaaaaattac ataaaaggtt tttcctttt 599 <210> 174 <211> 599 <212> DNA <213> Homo sapiens <400> 174 gatcgtgaag aggtgttttc aggcatcttt attggtgttt tggacatatt tatttatcct 60 gttgtaatgt ctcagagctc gtccactcca ttattcttaa aaaggaaaaa ccttttatgt 120 aatttttctc attataaaac taatacattc tcattacata aaattttgaa tatacagaaa 180 aaaagaacaa tatgaaaaaa acttttcata attccaagag tttcttttag tcttttatta 240 tggtcctttc ttttttctgt gcagttattt ctttctgtgt tatatgctca aaataatttr 300 cacttaatta tacctataat tgccaatgca caaccatctt tgttgatctg tgagggcccc 360 tttttttgtt ctaatcacac acttttcctt tacaaaataa gcattaaata ccttgtgctg 420 gaaagtaagg cagtgctcaa aaaagtgatg gggacctgtc aaaaggacaa ggaaatcaac 480 ttgaagaggc ttccactggc caaatctagg acaatttgag catcaacata attaagaaaa 540 taaagaaaat aaaccattga aaaataggaa tctatgagtc tgtgcaagaa taaatagat 599 <210> 175 <211> 599 <212> DNA <213> Homo sapiens <400> 175 aacaccaata aagatgcctg aaaacacctc ttcacgatca tcagtcacac tatcaaaaac 60 tatcagtcct atggctgaac cagggttgga aaatgtgggt ttctatatct tattctatgg 120 tgtacctctt gggttacttt gtctaatcac ttcatcaatt tgggtcttaa cttcctcacc 180 tgaaaaagag gataataact tcttgctata ttagcaatgt aatgagactc aaatgaaacc 240 atgtatatga aaactccttt aaaatgctac aaaagtaaat ggttttataa aagagcttty 300 ttaaaaatgg ctgctttatt gaaacgtttt aacagtttct tttttaaaaa agcagccaat 360 ttggaggacc tacgcatttg gatggtgaag ccctttggca gtctgagtaa gcccatttgg 420 gttctgtgtt gcagcctggg caactacctc tccatggctg catcttaatt ggggtcccca 480 gaagaaaccc tggaggaaga ttcatgtgaa agtgatgtat taggaagtgc tcccagaaaa 540 aatggtaagg cagtggggca ccgtatcaca caaggcactc ggaggagaac tttggctta 599 <210> 176 <211> 599 <212> DNA <213> Homo sapiens <400> 176 ctgaccccag caaaaagcaa tatttaacag cctgacagga gaaatgccca aaagagtata 60 aatggcagct gtattcattc aaaagcatag tctggggtca aaatcctaca cattccagga 120 gctcctgtta ttggtaatga ctgcagatgc tgagaatcag gctttgtgat ctgtgctgtc 180 gatctaagag ggcagggaca gctagtagaa aaatgtccaa tagcactagt agttaaaaca 240 aaaagcacat aaaacaacaa taaagtctat gattggcata tattttctga aatgaaaaaw 300 ctctatgctg gtggtgatga cataaaactg aaaactacac aattgtttca aaggaaaggt 360 aaagcaaatt ttgattacat aaaatatgac gtcttctgca tccaatagtg gaaaatgtgg 420 aaactataca ggaacatgga aacttgctta tgatgtgttc tgctagaagc tgcaagacac 480 taaattgcat gtacaggcca aatacaactg cccacagcca tatgcctatg aaaaagatac 540 tagaaaggat atcagggtgt tttccttctt tcatcccctc catcctttgc atttacaga 599 <210> 177 <211> 599 <212> DNA <213> Homo sapiens <400> 177 cttcacatca ttttagagcc ctacagtcat agaatcatcc acctctctca tttgtgatat 60 agcttaagtg attaggaaca caagttccga tttctgactc ctgggttccc atcctagctc 120 tgtcatttgc tgtgggattt tggggaaatt actgaatatc gtagaatctc agtttttgtt 180 ttttttttca tttgaaaact caaggatagt atctacctta tagggttgaa atagggatta 240 aacaaaatac tctgtaaaaa cacaaaatac aggagctctc aagatttgaa gggcacttas 300 agactatata atcccatctc tctaacttag cactgatgag tctcaatctg attttaggtc 360 atcagggaca aatcattttt aatggttgga aaattatttt tattgtagta ggaactacta 420 gcacataaat ctcattttat ttcacagata cagcttagca aaaatttaat aagcaagttg 480 atataagaaa aacgttgaat cagtaatact acaagttgtg aatcaggttc actgtgtact 540 ggttaccaac ttgtctgagt gggatgagat agaacgccca cacacaacaa gttacatga 599 <210> 178 <211> 599 <212> DNA <213> Homo sapiens <400> 178 tactttatat ggtgaacaac gtgattcagt taaagatctt gagataagga acttatcctg 60 tattacctgg gtaggacctg catcaatcac atgtattttt taaaagaggg acgtttgaca 120 cagacagaag acacatagaa gagaaggtga tatgaagaca gaggcagaga ttggagtgat 180 gcagccgcaa gcaacggaat actggcagca accagaatct ggaagaggca aggaatggat 240 tctcctgctg gagcctccgg aggaagtaca gccctgctgg caccttgatt tgggacttcy 300 gtcctccaga aaagagagaa tacatttctg tagtttcaag ccaccaagtt tgtggtaaag 360 ttttttacag catccacagg aaactaatac cagtggtaaa gtgtacttta cctccccgtt 420 tgtcatagtt gctcttgatg gctggaatgg tctgtttggg gctttgatat ggtttggctc 480 tgtgtcctca cccaaatctc atctccaatt gtaatcccca catgtcaaag gcgggatctg 540 atgggagacg actggattgt ggcggcggat ttccccctta ctattctcgt gacagtgag 599 <210> 179 <211> 599 <212> DNA <213> Homo sapiens <400> 179 tgaagtaagt ccaagttagg tctatacctc catgccctct caccacttgc ctgctccttt 60 cctggcccca ccctcaccag tcttgcaagt ttcttcacca ctcatgaagg aggggaacac 120 ctgtgagggt gtcacaagtc atgctaccaa gaaccagaac catacagggc ttgactccat 180 ccctgagccc ctgggtgaca gtttcccatg gctctgacaa ggtgctagaa gtgagctggc 240 atatgctctg ccttctcaga caggctactg gtctggtctg tcctggtgtc tgtcagacak 300 gagcccagcc ttatgtcacc cagttcctga actgacgact ccccaggatg atctatgtcc 360 ctgatagcac aacctctaga ccactgggtc tgaggaccag agtggtggag ccatgggatg 420 ctggagcagg aaagtcatgt agggactggg aacttgttct aaccctccca ttgttggggg 480 gatgccttag acctgggagg acagggtctt gtccaaggtc acacagtgca acaggagtgg 540 aatggggcat gaactcaggg ttttttcttt tatttccagt tcagcatttt tgcctcatt 599 <210> 180 <211> 599 <212> DNA <213> Homo sapiens <400> 180 ctacaggtgc ccgccaccac gcccggctaa tttttcatat ttttagtaga gacggggttt 60 caccgtgtta gccaggatgg tctcaatctc ctgaccttgt gacctgcctg cctcggcctt 120 ccaaagtgct gggattacag gcatgaacca tcgcacccag ccctacctga tcaactcttt 180 agggtatgga tataaaacaa gattcatggc acaagccaat gccaactcat tggaagtggt 240 atataatttt aaactttgaa agaacataaa agacacaaac atatgcatgt gtgtaatatr 300 atcagagaat attttaggaa aataaaaacc atcgataacc ctacatgcct agataatcct 360 tactaacatt ttggtataca caaccttcca tgtttataca tgcacttctg gttttgtcat 420 gaacatgcat tctatattct ccaaatatct actgagggtc tactacatgc taagctctgt 480 tccagcactg agaatacatc aattaagacc aaaattcctg tcctcatgaa gcttataaat 540 gaagattata ctttcagata gtaataaatt ctttgaaaag cagaaaggga tagaacgtg 599 <210> 181 <211> 599 <212> DNA <213> Homo sapiens <400> 181 gtagtatctc attgtggttg gaaaaatact ttaaatcaaa ccaaaataca gaatgaaaat 60 cttaccttat cagctcatca gggttaaagc agcttatatc agggagccaa gcagacacgt 120 catggctatg tggaaggcac tcttttaaag ggttcttttc atctgcagac gaaagactct 180 ttgaggtgct caatgtcaca gccagttgct ttaaaataga agctgtctgg tgataaattt 240 catcagcatg ttgtgttgcc acatgtctat ggatgctggt ttggtctgtg aatagctgcy 300 gacagcattt ccacaatttt tctttacatt caaaactcct ttttgttgga acttctttgg 360 ttttgacaaa aagggcaaag gcctgcaatt agatttcaaa tgctaacact gttaaataac 420 cttaggttta tggctaatag aagtctcact aagattcttt agattatctt tccacagggg 480 cttctagttt tatgttccat tatgttatac aattctctga gaagtaacac ttctcttatt 540 agtaagcttt agaagagact attagagaaa ttaaaactag gctttatatt gaggaggtt 599 <210> 182 <211> 599 <212> DNA <213> Homo sapiens <400> 182 cttaactaaa gaaaaaaata gaagtgaaag gatttgttat tttgagagag tatagtttat 60 ttcagaagtg atggttgcct gttttaagtc tgcgggctca aggcatgtta tctttcaagt 120 tgttcaatat caaaatagat gagccaaaaa gaagggaaca gtgtgcttaa ggtttaaaaa 180 cgtaatgttg aagttgttgg ttttagttac tttacttttc tattttacag ggttggtttt 240 tgttttccat tttgtgggtc taaaatttct tgtaaggcta taagatgtac agtgtacccr 300 tataaaatta ggattgactt atagagggga aatttatttg gtttattaag atcctttcag 360 atggatttta tacctgcttc tctatactag ccaagtctgt ctgagtgaag tggtaatgtt 420 atctttaatt tacattttaa aacttttaca tagttaaatt ttaataaaaa atctgttctt 480 gccttgggaa ctaccataga tacgttttct tcagggtaca ttgagcgaat tccccaaatt 540 gtattcgtat tgttttattt catttccctg ttcccttacc caggttgtct tatgagttc 599 <210> 183 <211> 599 <212> DNA <213> Homo sapiens <400> 183 tgtgtacatc acatcaatgt gagggggtgc tggaagttga aacagctctg caaagatcac 60 ctacaaaaga atcatgagtc acaattcaat ccaactgcta tctttgcact tctattagaa 120 agaccttaac attctaaatc tgagctctaa ctccatggca ttcatatgaa aatggaatta 180 ctttttaata tttaaaatta tgctctttca aacacaaaaa tctaaaactg aaaactgtaa 240 tgaaaatttc ttctctctat aattcgatca aataaaaaca cacgacacta atgcttatty 300 gatctacact cctcccagag aactatgcaa ttaaattcca actttgaaag caccacagct 360 gagccaggat gtacagcttt ttgaggggct caaaagatcc atgacagttt cattcctata 420 aataacaaga actcttaggc tgggcgcagt ggctcacgcc tgtaatccca gcactttggg 480 aggctgaggc aggcagatta cttgaggtca ggagttcaag accagcctgg ccaacacggt 540 gaaactctgt ctctacaaaa aatacaaaaa ttagccaggt gtggtggtgg gcacctata 599 <210> 184 <211> 599 <212> DNA <213> Homo sapiens <400> 184 cggttaaaaa atatttacag ctattgagct tgggctagaa tctagaagga gaaaaggaag 60 tggagctaga aagggctttc cagactgggg taatggcaaa gtcaagaaca gggagtatgg 120 aaaaaataaa aaagtacatg gacctggcag aaatagaggt ccatgtgggg agaagtgaaa 180 aataacaaag taggaacaat ggttatgaag gccttgaatg ttaggcggag ttattcctat 240 ggggcaaaaa gaaagcttaa tcttcaacaa aagcctgagc tttctgatag caaagactay 300 accttatcat tctcggaacc agtacaggac aaaactcaaa acccagcact tctaagtact 360 gcataaacct ttgatctgcc aaaaagcaca gtggctaaca gcatggccac tcagttagtg 420 cacctacgcc tgaatttggg ctccaccact caaaagcaat ctcattctag cttgacctct 480 tggaagtcat ttcctcattg tagttttgat aatcatatct attcttcaga gttgacataa 540 tgaaatagga aatgtaccag gaccgacaca gttcatttca aggaaaacag gtacagtca 599 <210> 185 <211> 599 <212> DNA <213> Homo sapiens <400> 185 aaattatttt aagatatcaa aaaaaacctt gacatgagga aaaaatgacc cttaggcctg 60 cagggcacag aactgctgga acacggccaa gatatgaggg tctaattcag cagtgaagag 120 aaggttctcc agggtcacca tgtactgctg gattatttgg tgatgctgtg gacacacaaa 180 agggggtagt taggtcagga aaaagcatat aagcaatctt gtggaacatt tccttcagca 240 gcccacccat gctgcagaat gatgaaaaga ggaaggggaa aaaaaagtgc tgataggaay 300 aatggacccc tgaaaatccc caacattaaa aaaataaaaa gggaaatgaa aaaaatggat 360 gctcaatagc tttttaaaaa atccagttct taccaacttc tatgtaaaca gaattcatga 420 ttcaaggcag tggcagcagt gcctgcttgc tcctagtact attacggact aggctcagct 480 agctctctcc ccagtcaggg cataatacat tgtaactttt taaaaagcag ccagacggac 540 tgacaggaag ataaacagtc agaaaacgaa atactcttgt ctatgtgttc ctctataag 599 <210> 186 <211> 599 <212> DNA <213> Homo sapiens <400> 186 atatttctga atcccagcca tgtacaaggt acttgtatta gtgctacatt agttataaga 60 aactaccaca gacagagtga cttaaaacaa cacacattta ttatcacacg gatctctagt 120 ttattctgac atgggtctca gcaggctaaa atcaaggtgt tggcagggct gtgttccttt 180 ctggaggctc taggcaagaa tccatctcct tgccttttcc agcttctata ggctgcctgc 240 attccttgac tcatgacccc ttcctccatc ttcatagcca gcaatggtgg cttctcacay 300 ggcatcaccc acttcttcca taatcacatg tccctctgac tcttggcttt cctcttctac 360 tttttttgtt tttttgaaat ggagtcttgc tctgccaccc aggctggagt gcagtggcac 420 gatctcagct cagtgtaacc tccacctctc gggttcaagc gattctcctg ccttagcctc 480 ccaagtagct gggattacag gtgcaagcca ccatgcccgg ataatttttg tttttgtttt 540 gttttgtttt ttgagatgga atctcgctct gttgctcagg ttttagtgca gtggtgcaa 599 <210> 187 <211> 599 <212> DNA <213> Homo sapiens <400> 187 ctcaagctta gtcttggagt tattgttgcc catcatgggt agagccaagg gaggatgaat 60 atggtccagg gttcacccat tatgtagatg aactctggtc ataatggggt tatggtcttg 120 tggtttcctc ctctcttacc ccaaatggga gttttccttt caattatctt tataacaagt 180 gtggttgcag cttcaaacca caaaccacta atatttttat tggcaagtgc atcctctaat 240 acgtatagtt ctgttgaatg ggtgaaatat ttatcaccag atgcatttgt ttttgtagtk 300 tttataatgc ttggaaaggg gctgagtgtc tctggcctta atcccttctt tggctctact 360 gccactgtcc tggtttagct ccccccaaat tttacctgta tagcctctga actggtctcc 420 cagactccag gctgacccct ctaatccatc ttccacattg gcttacagct ccatctttct 480 aaagtacagc ttttgccatg ccattccttt gctcaaaaat catttattga ctcccagttg 540 cagctaattg taagttccca tcacctggtt cctgtagccc ttcaggaact ttccttcca 599 <210> 188 <211> 599 <212> DNA <213> Homo sapiens <400> 188 gaaagggtct ctttctgcat gtgtgggaag cggccttaga tgacctcagg acaatgttca 60 accttcagtg tctatgattt tcatgttagg taggggtaga tcactattga gaagggctca 120 taaaataatc tgatggcctt ggtgtcctac aagctaagtg gaaaccaaca gtgtgacatg 180 gcttctgaaa agagatggtg tgacctgagg tgacaagaac aaaagcaggg cctgaactga 240 gggaggtgtt tgtcccgctg tttggggctg cttaaaccac atctggagct tgtgttcagw 300 tctagacacc accagggaat cagagagcca tctatgtggc caggacgggg agggaagagt 360 taagaaaccc tatcacagga agaaagtgca gattcatgac caggcactgc atctccaaag 420 ggctcctcta gggcagaggg catagatatg gtctgccagg actttatgct ctcacttacc 480 tggacattca cagtggtctg cctgggcagg atttcttctc ccttcagacc atgagaccca 540 ggactgctcc acgtccccca tctctcagaa gctaaagacg gaagcagcaa cagggtgag 599 <210> 189 <211> 599 <212> DNA <213> Homo sapiens <400> 189 aataagagta gctgggacta caggcacaca ccaccacacc tggctaattt ttacactatt 60 tttttccaga ggcagggtct ccctgtgttg cccaggctgg tcttgaactc ctgggctcaa 120 gggatcctac cacctcagcg tcccaaaatg ctggaattac aggcatgagt caccgtgcct 180 ggcctgaagt ttttttcaaa ggaaaagaga aattttaaca ggaggaaaaa gaaaaattga 240 gtacaatgta tttgtttgtg taaataaaga catttctata cattttaaag gcaaacaccy 300 gacttgcttt tattaccagc ttggactcca cagcatcctg agtttgctag ccagtagagt 360 ctttggcacc ttcttatctc tgcagtgtgg acctcaggtc agattctcac cctgttgctg 420 cttccgtctt tagcttctga gagatggggg acgtggagca gtcctgggtc tcatggtctg 480 aagggagaag aaatcctgcc caggcagacc actgtgaatg tccaggtaag tgagagcata 540 aagtcctggc agaccatatc tatgccctct gccctagagg agccctttgg agatgcagt 599 <210> 190 <211> 599 <212> DNA <213> Homo sapiens <400> 190 gcggcctcgg ttgtcctggc cacaaatgca agaaagcctt tacaccccag gctgcaggag 60 gttccctaag tatgtaggtt attcatacac acgctccttt tttattggaa agttagaaat 120 tgcactacat tgtaccttgg gggtgaaggt gacattaaca aaagcagttt ggagtagtgg 180 aaaggatact ccaaagggga aggcttgcag gatgtgggtt cttgcccttg ccctagccct 240 tgtgctgtgt gacccagaca cagcctgtgt ctggaccccc tcttgtagcc tgagagggty 300 ggaccaggag atctctaagg gacactccag ctgtctatga ttaagattct gggacaaata 360 aatgtcatga ggcagcaggt ggggggactg ggtgggggga catggagtaa atgacctctg 420 gatgccctca ctggggctgg gacttgatga tttgtacaca gtcaagggaa gccacataca 480 ggctaatctt ggcctcacaa aggagtgtgg ttagagttgt tgggtggtgg cgatgttttc 540 ctgcaagcgc acacgatgtt tatcgtcttc gtacaggttg atgctgaagc cacgaagac 599 <210> 191 <211> 599 <212> DNA <213> Homo sapiens <400> 191 gattatacag tatttatttt tgtctatatt ttttcactca acagtatatg aatgagattc 60 atgttgttgc atatagctat agttcattca ctcattgaca tatatagtat tcttttgtat 120 aaatatatca caatttactt atccattcta ctgttgatgg acatgggggt tgtttccagg 180 tttcagctat ttcagctgct atgaacattc tttagatgtc ttttggtgaa cataggtata 240 cacttttgtt acctacctgc tcaggagtgc aatttctaga ccataatgtt cagctttagy 300 ggaaaatgct gatagtctcc aaagtggttg cagcagtgta tgaaagttcc agttgctcta 360 catctttacc taaaacatca attttaatat caacacagca tttcattata tggatacacc 420 atacttcatt ttatcagatt cctatagatc agggattctt tgccatagac ctctggcact 480 ctgataaagc ctgaggactc tgtctcagaa tgcgacatag taaaacgtgg gcattatcat 540 taacacacta aatcacacca tccagtagca ggtctaataa ccaagcaatt tcaaaattt 599 <210> 192 <211> 599 <212> DNA <213> Homo sapiens <400> 192 tgaatttgta tttaattggt atcacctctg taaggtgcat atccatccct tgctagaaga 60 gtataaatat ataaaataca tattactccc aaaacgaaca ggattttgtt tctgttctgg 120 ccttttacaa gttgtttatt aaaaaacatt agaaattgta aaaaaaagat tagaatcatc 180 caaaagtcat tattaaaggt ttattttgtg tgttttgaac ctgtttgcta tgaatatact 240 taagaataaa ataatgccat gtagggaata tgttttgagc ttagacagta tattatgggy 300 atttttcaat tcatgcatga ctttttatgg ctatgtggtg tttgaataga attttctctc 360 tgcatagtta ttaatggaaa taattcactc tcggtttaaa aaataaactc tgtaagactt 420 gtattatcca aaattattta gtttcatata ataattggtg tgtaaagtag gcagtggttg 480 tatggttagg tatgagatgt ggtagaaaaa acactacagc tgatactctg gggtataagt 540 gaacatgaca atggaatttc ctgaaatata gagctttaac acttcagaac ttttatccc 599 <210> 193 <211> 599 <212> DNA <213> Homo sapiens <400> 193 tttctacaca taatgtttac atttaggaga ggaaaaatgt atttccattt ttaatgttaa 60 tgtccatcat agtttgccat ttcaattcag taagtatgta cctctggtaa gggatggaaa 120 taagaaaaat gactacacag tgctgccctc agggggctcg cctgaatcta atgggtgtga 180 agatagatac ttgcacaatt tacaataaaa gaccaatttg taagtattgc tggagaaaga 240 tgactaattc agccccaagg acagaaggct gtatcagctg ttaagaatga aattacaaar 300 gttgaaagat tttattttct gtaaccatag cttgacatac agtaaccaaa tgccatattt 360 ctttaagatt gtttgtttgg gaaattttgc actctacaat tcgtaagatg aacaaacatg 420 tcctgaagat ccagaaagag ctggaagaag ctaaagagaa acttgctagg caacacaaac 480 gggtaagttt tgtgtaaact tgtaagtagt taaagaaaat ataccagaaa ctctggagag 540 gattcagagt tcattatctt gatgatattt cattttttct gagcccaaat taatgcaga 599 <210> 194 <211> 599 <212> DNA <213> Homo sapiens <400> 194 agttcactat ctctgggtcg gcctcacgtt tgcacaaggg aagtagcaga agggaagagg 60 acacttgtat ttctgtagga gtctctgggg gaagagggag aggactatag atacttaaca 120 ctttccccgt actgtgagga ggaatggggc agtcattccc aagttaacgg aatacttctc 180 atagtattaa tttagtattt tagccatttt ggagggaagc agtgagtgac ttaacatgat 240 actactattc attatgaaag tattttccag tgttatgcat atttaccata gtagaaggtr 300 aaaaaaagtt gagtttagtg ccctatagga acctttcgca agtttgagta ccagtctcca 360 tgtagacata cctgtataca tatatggata taaacactca gacctgaaat actgtaaggt 420 aaatggtgtc atctcatttt gtagatgtta taaagtgaga catagagaag ttaagtaaca 480 tagctagtag gttgcatagc tggtaaatga ccagagctag gttctgacac aggtctgtca 540 gactccagag acttttctct catgccacac tgtttctaga agtgtgctgt ccaacacag 599 <210> 195 <211> 599 <212> DNA <213> Homo sapiens <400> 195 attctgtctg tagtactacc ttaacttctt ctccctttcc agcggtttat catgatcttg 60 accgagcacc tagtacgatg cgaaactgat gggaccagtg tattaacacc atggtataag 120 aactgtatag agaggctgca gcagatcttc ctacaggtat gtggggaact tcgattaggt 180 aataacacta ttctcagcca caaagatttt tcattaaaaa aaatccttgt caaatttgtt 240 aggaggttat atagtacctg ttagaccctt tagttcatgt ccatttgctg ctaccattgs 300 tcatcagaat atttaggctt aaactgattc tgtaccactt agattcctaa ttgccacccc 360 cccaacaacc ccccgcccca cctttttttt gagatggcat ctcactctgt tgcccaggct 420 ggagttcagt gacacgatct cagctcactg caacctccac ctcctaggtt taagcaattc 480 ttctgcctca gcctcccata ttgctgggat tacaggcacc cgtcactact cctgcctgat 540 ttttgtattt ttagtaggga cagagtttca ccatgttggc caggctagtc tcaaactcc 599 <210> 196 <211> 599 <212> DNA <213> Homo sapiens <400> 196 ccaatataat tttctttgta aaatgatttt gacacgaagt agcagaaaaa gctccaaaca 60 ttagaatatg accagtgtcc tggcttcaca gttaaactat ctttgctcag tttccctact 120 tgcaaaataa agtgaagtaa aatcaaaact ctgtggttct ttccagctct taacattctg 180 tgattcttat ttttagccct ctcctaaaat aatgctgtca tcttataaga acttcaacag 240 acttgaggtc ttattgcaca agcacttttt ctaagatgaa aacataccag catagtggtr 300 gagttctcta ctttctagtt ttcttgcaaa gcttgacttg atgcttattg acgtagctcc 360 taacaggaac ttaaaaacac tcctttttct taattatttc agctgactcc ttttcctact 420 gtggcattct gttatctgaa gtcaaacgta cctgaatgtg tcctattgtg ttactcaact 480 cacttctgaa tatggttctg ttttgcatac caccaaccca cataaccatt tctgaatctc 540 ttgtttcaca ctgctccagt gacaacttga ttcacaggcc gaactagtga ggtaagaaa 599 <210> 197 <211> 599 <212> DNA <213> Homo sapiens <400> 197 gaaactgcaa attccagcta cttttgatgg tactggtctc atcctttcta ctttatagtg 60 gttacctttt attcctttct aaacttgagg cacgctagag tcagacagaa agttcatttg 120 cactgattaa ttcatagtca tgattccata aaggtttcca ggtctacgac atggctgtgg 180 aacggaaggt gcaaaatagc aaaaactgac attaaattaa acttttgatc atggaaagca 240 aggtagaatg aacattcttt aagatttctt aggcagttcc ccaagaactg aactgtattk 300 tagcattgtg tacaacccac catgtttcaa gagttaggta agtgctgaga tttttatctt 360 tgtgacactt ttatttcatg gtactataca attttctttt tctctgtgtg ccatgacata 420 tgccatgaaa gactgaaaaa acttgcttag aatacgaaga gtggtgctaa ggtcctgggg 480 aaacagcaag gcatagcagc agagagaaat cggactttgt tttgggcatg agttagcatt 540 gtttaggatc ctgctcaagt catgggctcg actactccag ctttccctct tcttaattc 599 <210> 198 <211> 599 <212> DNA <213> Homo sapiens <400> 198 aaaaacttca ggccaggcac ggtgactcat gcctgtaatt ccagcatttt gggacgctga 60 ggtggtagga tcccttgagc ccaggagttc aagaccagcc tgggcaacac agggagaccc 120 tgcctctgga aaaaaatagt gtaaaaatta gccaggtgtg gtggtgtgtg cctgtagtcc 180 cagctactct tatttgtttt tacaataaga aaaacaacag cacatgtgtg aggcgaagta 240 acctctgctg gtcatcctca gtgctggggg acaacgcaga ggggaggggc agcagtgacs 300 ggctgcagca ggcccagtga ggccgtctcc cactttgtta aagaggagtt agaaatctgg 360 attttaatgt gaaatcttcc agtttctaaa tgtttacacc aatgtttaaa aacacacaca 420 ggcggccagg tgcggtggct cacgcctgta atcccagcac tttgggaggc caaggcaggc 480 agatcacgag gtcaggagtt ggagaccatc ctggccagca tggtgaaacc tcatctctac 540 taaaaataca aaaattagct gctgtggtgg cacgcacctg taatcccaac tacttggga 599 <210> 199 <211> 599 <212> DNA <213> Homo sapiens <400> 199 acatggcgag acccccaacc catctctaca aaaaatttaa aaatcagtca ggtgcagtgg 60 tgtacacctg tagtcccagc tactcatgag gttaaggtgg gaagattgct tgagcccagg 120 agttccaggc tgcagtgagc tgtgatcaca ccactgcact ccagcctggg tgacagagct 180 agaccctgtc ttaaaaataa acaaataaat aaaaataaaa taaaataatc cataattcca 240 ttacccagag gtaaacatag ttatcatttt atattgatag tgccagtcct ttattttcas 300 aaaaatgaga ttatacagtt ttatagtctg atttatttat gcattgaatt ggcaatacat 360 atacacagtt aaatcttcag aaggtacaaa acagcataaa gcaaacttgt ccatcccaca 420 gccatgggcc acatatggcc caggatagct ttgaatgcgg cccagcacat attcgtaaac 480 tttctttaaa cattatgaaa attttttgca attttttaaa gctcatcagc tatcattagt 540 gttaatgtat tttatgtgtg gcccaagacg attcttattc ttccagtgtg gcccaggga 599 <210> 200 <211> 599 <212> DNA <213> Homo sapiens <400> 200 gagctagacc ctgtcttaaa aataaacaaa taaataaaaa taaaataaaa taatccataa 60 ttccattacc cagaggtaaa catagttatc attttatatt gatagtgcca gtcctttatt 120 ttcagaaaaa tgagattata cagttttata gtctgattta tttatgcatt gaattggcaa 180 tacatataca cagttaaatc ttcagaaggt acaaaacagc ataaagcaaa cttgtccatc 240 ccacagccat gggccacata tggcccagga tagctttgaa tgcggcccag cacatattcr 300 taaactttct ttaaacatta tgaaaatttt ttgcaatttt ttaaagctca tcagctatca 360 ttagtgttaa tgtattttat gtgtggccca agacgattct tattcttcca gtgtggccca 420 gggaagccaa aagattggac acccttgaca tgaagtaaaa aataaatctc tctcccattc 480 tcactctcca gaagcaacca cttctatcaa ttgctcatat atcctcctaa agatatgtca 540 tgtactgaaa agcacatatg tatgatgatc ttgaagggaa taagtgaaag cacactata 599 <210> 201 <211> 599 <212> DNA <213> Homo sapiens <400> 201 tctgggccct ctgtttaaca agagtattag catttgtttt tatattcaat aagtgtataa 60 acgaagaaaa caatttaagg taagactttc tgccttccaa gagatggtgg tggtttcaaa 120 tacttggggc ccagaaggaa gaatgaagat gttccttcta aaacgcagag gacaattcag 180 ctgttccgaa tgatggccct gagtgtcagc taaccccctc ctgcagctaa gtccccctgg 240 gtccccctgc aagctcttcc caccccgggt gctgggacca cctcttccct caatcagacr 300 taaatcaaag gaccaagatt aggaaggatg ggtgattttg acctttctat aacagagaaa 360 atccagataa atggtcttct ctgaaccacc aagttttgct tttctttttc tctcaagttg 420 gtaataacat gaacaatgac acattacctt agagcttgaa ctgatggtcg agtagataat 480 ctaatgtggg cctgatgaga ccctttacag atgaggtagt tgagactcag ggggcttcag 540 tgactgggcc aagattccct tttggctggt aagtgacagc ttagaatcca agctgtggt 599 <210> 202 <211> 599 <212> DNA <213> Homo sapiens <400> 202 ctttctataa cagagaaaat ccagataaat ggtcttctct gaaccaccaa gttttgcttt 60 tctttttctc tcaagttggt aataacatga acaatgacac attaccttag agcttgaact 120 gatggtcgag tagataatct aatgtgggcc tgatgagacc ctttacagat gaggtagttg 180 agactcaggg ggcttcagtg actgggccaa gattcccttt tggctggtaa gtgacagctt 240 agaatccaag ctgtggtctt tggagtccaa atctctggcc tttcctcatt ctgtgaagay 300 ctgcacccct tctttcaggc aggtataaga caccgtgtaa aatgtcaaac aaaagttcag 360 ctatctttgg ctgtgtggag atggaagata tttcaataca acagaattaa taggcttatt 420 ttgaaatcct tctaattcct cagtcaacta atctgagccc tagctctggg ccctagattg 480 ctgggttttc agctgtggct gacaggtgca tactttctga gcagaaaaca cgcaaggctg 540 ggaagtggca tggttttcat aatagccaca ggtgttccaa tctgcctttc tgcttcacg 599 <210> 203 <211> 599 <212> DNA <213> Homo sapiens <400> 203 gacagcttag aatccaagct gtggtctttg gagtccaaat ctctggcctt tcctcattct 60 gtgaagacct gcaccccttc tttcaggcag gtataagaca ccgtgtaaaa tgtcaaacaa 120 aagttcagct atctttggct gtgtggagat ggaagatatt tcaatacaac agaattaata 180 ggcttatttt gaaatccttc taattcctca gtcaactaat ctgagcccta gctctgggcc 240 ctagattgct gggttttcag ctgtggctga caggtgcata ctttctgagc agaaaacacr 300 caaggctggg aagtggcatg gttttcataa tagccacagg tgttccaatc tgcctttctg 360 cttcacgctt tttatacttt accagacagc aaagacatgt tgatgaagac tggtttgccc 420 ttctgaggtt gtacatgact ggaaggattt gttaggtaag ggaacttgca ttttcctgct 480 gtgtttcccc tgggaaaaca ggactctcaa agacagtgcc aaaactttga atctggaagt 540 tctggcctaa agctgagtaa ggaaagtttt aaaaaatgac aacaacaaaa ttagggtga 599 <210> 204 <211> 599 <212> DNA <213> Homo sapiens <400> 204 agaaaccctg gaggaagatt catgtgaaag tgatgtatta ggaagtgctc ccagaaaaaa 60 tggtaaggca gtggggcacc gtatcacaca aggcactcgg aggagaactt tggcttaatc 120 ccaccaggga gctctggtga gggtcacacc cgtgagtcgt cctggtcagg ggctgggggc 180 tagagtactt atgcctcagc acccatcaat tactagaaaa agagtgggtg ggggtgggta 240 atctcccagg tacttccagc tctcctgtgt gcggacagaa cagtcgccag cagccctggr 300 ctctatcctc tgacaaagag atgcagatgc tggccacagg taggccccca atggtaaagg 360 aatctaaatg gatatgcact gacaatatca gctcaaagaa ggactaattc cttccaggct 420 ggacgttcag aacacgagaa atgagaacaa gagacacata ggacaggcct ctctggagac 480 ggcccagaga ggttgagtga cctatcaggg tcactcaggt ggcagagtca ggattccagc 540 cctggtgtat ctgactccaa atcccatgtg cccttttctg tgccctactg tctcactac 599 <210> 205 <211> 599 <212> DNA <213> Homo sapiens <400> 205 cacttgtaat tcgcagtgcc tcccctgccc actcagggag gtgatgctgg ctggctttag 60 ggacccttca ggtggggcag aacccaggaa ggaagtgggg tagggagact catcgtttag 120 atgggacagc ctcgggccac tcacccccaa gggcagttgg caacctgggg gtcttgcagc 180 tatcagagac aggcttagcc aggccacccc ctggcttctg gctacttccg tgtgcttagg 240 cacctgtcct gctaccctgc cagtggcagg gtgtatctta tccaggagca gctcaactgy 300 atccaagtcc tgggctggag ccagtttctc ccacctgtcc ctgggatgca ggagaacatc 360 ttccagccat ctgcccagag ccagcccgag cagctggcag caggaggagc cggggatgtg 420 tgctgttatc tctctgcgtc ctgagtggaa ttaccaaatg agtgaactct gccaaggcag 480 ggagaggaaa cagaactcaa tgttcttttt cagagttcaa aaatagtcct ttttgagttt 540 tgaggaagat ctagacttaa aaaaaaaaaa aaatcaagtt ccccagtgct aaattcagc 599 <210> 206 <211> 599 <212> DNA <213> Homo sapiens <400> 206 tcagcctcct gagtagctgg gattacaggc atgcgccacc aagcccagct aatgttcgta 60 tttttagtag agacggggtt tcgccatgtt ggccaggctg gtctccaact cctggcctca 120 agtgatctac ccgccttggc ctcccaaagt gctgggatta caggcacaag ccaccgtgcc 180 cagctggata cttgtatttt tctaaaatgg catagccttc agttcagatg aggtattctg 240 tttcatgcat gctgaacaaa agaatgtgaa taaaactcct ggaaagcccc atttgctats 300 gagctacaat agtccaacag ccaaagaagt gaattctgag cttaatctaa atccaggtag 360 cttaacagag tcctccacag aggtcagcag atctaggctc aagattaagc tctgccactc 420 acttgcatgt agctgtgaga aagttaattg acttctctga atcttaattt ctttatatga 480 ataaaaaggg aactaaagag caccagaaat gaaaagaact gctgaggaga tactaccaaa 540 atcctaaagc acagagtaca tctgagggct gagggtatac atgagcatgt atctctgca 599 <210> 207 <211> 599 <212> DNA <213> Homo sapiens <400> 207 cttttattat tgaattgtaa gtgttcttta tatattctat atatcacagg ctttttaatt 60 tttttcttta tgctttctct attttctaaa ttttctacaa tgactatgag gtaccttgat 120 gagcagaatg cataaccagt atgtaccaac atatataaaa atgtagaaac tgtcctcatc 180 aaatttatga atgacataga actggaaaag atgactaatg tgtcttttga caaaatcaag 240 atccattctt ggaggaatgg agcaatgagt gaaatataaa ttcctcactt cagttaaaam 300 attctgtaag ggtgtgatat ggtttggctg tgtccccatc caaatctcat cttgaactgt 360 agttcccata atccccaggc atcatgggag gaaccagtgg gaggtaattg aatcatgggg 420 acaggtttta cctggctgtt cttgtgctag tgcatacgtc tcatgagatc cgatggtttt 480 ataaagggca gttcccctac acatgctctc ttgcctaccg ccatgtaaga ggtgccaatg 540 ctcctctttc accttctgtc atgactgtga ggcctcccag ccatgtgaaa ctgtgagtc 599 <210> 208 <211> 599 <212> DNA <213> Homo sapiens <400> 208 tggcccttcc atttcatatg gccccacact tcagggaatt tacttactag ttagaaaaac 60 aacgaaaaag acacatgagg caattagcag atgataacgg gttacataat tatcagttga 120 attgtatgtt acagagacta acttgttata ggagcttaga gaaaggaaaa taggatctaa 180 aatagacaag aaggtttcat ggaggagcat ggaaagcatg gaagagacta ggccctgaaa 240 tatgatgagg ctgttgagga gggactcaga ctccagagct ggataggacc ttaattgtcr 300 tgtactgtag cattccctaa aatatgttct gtggaacact agttctagag gatgctaaca 360 aggtattgaa aaaaggggta ttaaagacaa atttgggaag cactcagtca aaatgttgtt 420 actgcaagac ttctcagagc ctttaagagg ctttggctgt gattcttaag gagggagatg 480 ctgtctgcag ggtttccaaa cataatttta tagaacagct tcataacata ctttggaaaa 540 tatagtttat ttccattctc tgattttaca gatgaggaaa ccaaggccca gaagtgatg 599 <210> 209 <211> 599 <212> DNA <213> Homo sapiens <400> 209 gcagtgtatg aaagttccag ttgctctaca tctttaccta aaacatcaat tttaatatca 60 acacagcatt tcattatatg gatacaccat acttcatttt atcagattcc tatagatcag 120 ggattctttg ccatagacct ctggcactct gataaagcct gaggactctg tctcagaatg 180 cgacatagta aaacgtgggc attatcatta acacactaaa tcacaccatc cagtagcagg 240 tctaataacc aagcaatttc aaaatttcaa aatgagcatc aacataaaaa tatgtttaty 300 ggcctttgtg ctgcttctcc cacacaaaat cattttcttt gtttctacat ttattggcaa 360 aagtcaatgc atattcttga cttttgccaa cttttaatgg cccatatata tttaaatttg 420 tatgtaagca ctcttcctgt gttatggata tgaaccatct ctgtgaaatg ttacaattgt 480 tttcatttgt cattagcttt gccattttgt ggtctttaga aagaattgat gccctgtgtt 540 cagtgcgatg acaaagattg gctaaataag tgataaaggg aatagtgaag gttgtttta 599 <210> 210 <211> 599 <212> DNA <213> Homo sapiens <400> 210 caggtgattc cagtgtgcag ccaaattggg aatgatggat acaaagtgtc ttccctggcc 60 cagagcatgt gctcagtgag aggggtggtg ttgccatgcg tctgattatt accgccacac 120 atccagcttc tatcctgttt cccccagcag tgattgtcac agctgtgtca tcactggtgt 180 cctggccttg gcctcttcct actctccacc tcccaacatg cagcacagag cagctggaaa 240 ggtctttcct gaaatgccaa cctgaccttc ctccctcact ggcctgccac tctctgaacy 300 tcgaggcttt cccacctgca ttcctctgcc tgtaatgttc tatagccctt ctcttaactt 360 gaccaacact tactcctcct ttgcatccca agttcctctt ttatgctgtc ttaggactga 420 actttttcct ctaccacact cagcataccc tgtgctggtt tttcattgtg tgggaacttg 480 cttggctcct ctctccccca gcacactttc agctccatga gcggagaccc agtctttctt 540 attctccact gtccccacca gagcctagca cacagtgctg gggtgggcct cattacatg 599 <210> 211 <211> 599 <212> DNA <213> Homo sapiens <400> 211 aaaaaaaaag actaatttac atcaatcgtt gttatgcaac agctattgcc atttaatgga 60 gaaagtgacc accatttccc ctgcattatt tctaccatat aatcagttcc taataaccta 120 ttattgtcct cccataaaaa tctctgcatc ctaatgtctt ggcctgctca tttcattgtt 180 ggtagagcct ttctttccta taacctacaa taccctcttg tcagaaaagc atcctgaaca 240 caataagtat gatgactgac ataataattt tacattatac tctacccctg ctccaggcty 300 tctaattcag aaaatagaat attgttaata tcactccatc aggctagaag agaccttggg 360 gaatgtctta gtgcttctct atcatttgag tttgaagata cttttttaac agctataaat 420 tccacagtcc ttgcaacata caaagtagat agacttttca gtaaacactg agaaatttta 480 tgtccaaaaa atgaccaaaa attcagtaac atcttaaaat gaatttgcat tttatttgtc 540 acgcagcttg acatacattt gaaaagtagt catatatgca tatatacaca cacacatac 599 <210> 212 <211> 599 <212> DNA <213> Homo sapiens <400> 212 cctgaagtgt ggggccatat gaaatggaag ggccatatct gtatagcaca gtgtagttca 60 caactgctta tactatcacc gtcctatata actcattctg cagtactggg aggtaggcaa 120 ggcaggcatt attattccaa ttttagaggt gaggaaatga aggtacagaa aattttagtg 180 actagctcaa gtgtgacttc tacttcaact tgctttcttg ctcctttcca ataagtaaaa 240 gggaatgtgg cactgagtag taatgacaaa aattgatcaa atttggacta cagttgaccy 300 gtgagcaacg cgggtttgaa ctgtgcaggt ccacttactt gtagatcttt ttgtgcctct 360 agcactcatg cagcaacaag accaatccct ctttctcctc agcctactca atgtgaaggt 420 gacaaagatg aagaccttta tgacgaacca tttaacataa agaatagtaa atatgtatta 480 cgattttctt tttttctttt ttttttgtag ggcagggtct tactatgttg cccagactgg 540 tcttgaactc ctggcctaat gtgatcttcc tgccttggcc ctccacaatg ctgggatta 599 <210> 213 <211> 599 <212> DNA <213> Homo sapiens <400> 213 agggctcggt tgcacagcat cattgaatca agtggattaa atgtgttttc tgcatctctg 60 agtcccttgg aacctcctaa ccacatacgc ctgggtacag agaaaggccc agagacaccc 120 taggtcccct cctagcgccc cttctggagg aaggctacca cagggaagaa gtttccttgg 180 gcactttgta tgtcactttc cttctgggaa gcagcctggc acggtgaaca gcaagcatgg 240 ggtttactgg acttgtggcc ctgagcaagc cactgatgtc ccagcctagg cctgcccacr 300 tgttcagtag aagtgctgac acagaggagc ggaagaaaca gggctgggtt tgaatccagg 360 ctcaatcaac ttgagcggat tatttaatat gtatgagcct caatttcatc ctctataaag 420 ttgggataaa actgcctact ctccaggcct gttctttgca ttcaaaatta gaaataaatt 480 tgcacgttga atgtcctgct cagcagatgc ccaggaagag gggcagtgat tgtcattgtt 540 actgatagcc agtagagggc accaaaccat tctttaatga aagcggcctc ggttgtcct 599 <210> 214 <211> 599 <212> DNA <213> Homo sapiens <400> 214 tctatagggg gtccttccca ttttgacctt tttatgtctt tctacaaatt ccattttgca 60 cttgtccctc cctagctcga aacattctct ctctctttag gatacaggtc acatgcctca 120 ccccagcatt caaggctctg ctcagctagc cccagtccac ttccttaggg tacttccctt 180 cttctccttc acagattatt tgttctggcc agacagctgc tctctgcatt gcttcctgaa 240 cattctatat acagttgcac ctccatgcct ttgcttgtgc ccttcccttt gccatttatr 300 ccctccctat ttatttggat gaacaaccat gagataattt gtggagttaa tgaaaattta 360 tgagcaacaa ttatgcaccc aactacatta ggaggtacta gcagaaaagc acaaaggact 420 ctaattcaaa gtagtcaggg catggttcta aggaaaaaat aggcttggaa tatgtcctaa 480 aaaaagagaa tgctgtggga atttgaggga ggaagtaaaa gtgtctatcc atgaatatag 540 taaatatttc catctattga ggtcatcttt attagtcttt taacaatgtt ctatcattt 599 <210> 215 <211> 599 <212> DNA <213> Homo sapiens <400> 215 cctggaacta actgtgctga ccacacagtt gtccaacaaa agtcatcaca tgatggtact 60 gcaaaaatat tattttatac ctgtttccta aaaaccagtc atactgacaa acactccaca 120 tacctgcctt cacaaatacc aaacttggct aaatctcaaa gtaaaagttc atctctcatt 180 cagaatgaag aaactgaaga taccttgtga actgagctgc ccaaggtcca tctcggcatg 240 aggagtaaac cgcacttcta aagtggccac aggagcctct gtcacccagg caggaaccay 300 gctgcgggga gctccatcag cccttccagc agggcagtga ggggccatgg gctgtgtctc 360 tgccctgctt ccttgcaaga ctgctgctcc ttccactctt tctagcttct tgtctgtacc 420 tttctctgaa aagctcttct ctgggcaata tgggccaatt tgttcttctg ccacgctgga 480 actctgatca cgtcttgatt ccaaaccaaa atccactgct atctccctgt gcataggaaa 540 tgcttgctga attctggctg tgtcactgtg tgtcaggtag ttttcttctg aagttctgt 599 <210> 216 <211> 599 <212> DNA <213> Homo sapiens <400> 216 acttcaattt cctcatccca aaaatggggg ataaattata ttacttaaga cagttaaggc 60 gattgtatga aatgagtgta aaaatgtttt accgtactac ctggcaaaca gcagacactt 120 agtaaatatt gtttgttggg cacttgataa acgtctctca agttcctact gtgtgccagt 180 tgttgtgtta gctgcaaagg atgtggagat gagattctgt ctcttccttt aaggaaaggg 240 gatggtgtta ttttcttcct accagatgac aagttaatac tatttaaaac atgatttctr 300 ttaatttgtg ggagattgca tttttttccc catcagatca ttgtggtaaa ataacttgtg 360 ctcttttctt attccgtggt ttgttttgtt ttgttttcta taggattttg tttgtttttc 420 acaaaaatgg tcatttgagc tgtaaggcaa aagtgcagcc tcctaggctg aatggtgcaa 480 agactggagt tttttccaca aggagccctc atcgtcccaa tgcaatagga ctgaccctgg 540 ccaagctgga aaaggtagaa ggtaacccat ttcatttcta cttttacctt tttcctcac 599 <210> 217 <211> 599 <212> DNA <213> Homo sapiens <400> 217 gttttctcat gtttcttgtc ttgaagacca ctttcctttt ccttctctgt gagaaaaatc 60 cctttgccag tccttcacca ggtgagtcct cacaggaatg agactaactc aaagtcaggg 120 aaatccatca tacaaaatac acctagcagg aatttctcaa agaccaagtc tagaatagtc 180 acgcagggcc tcagcagaaa cacatgaggt gagcttgggc actcaaaaga cagtcctctt 240 ctatgtgtct tcaccaaaat gaaatgaaaa tgccactggt tctccccacc acctcccaar 300 tggtaatatt tggaacacac acacactttc aaagctaaac aataattctc aaagccagtg 360 tagactctag actactagaa gacattttta caaatgcaca taatctgcac agattctccc 420 gcccacatgg atatccatct tatacgtgcc cctttttgct cacaccagtt ggaattgtgt 480 ttctatcact taaaatggta agagtcccaa ccagtgcacc tcatctccct gtattggtta 540 agaggcattc agccagccgg gcacggtggc tcacgcctgt aatcccagca ctttgggag 599 <210> 218 <211> 599 <212> DNA <213> Homo sapiens <400> 218 tgaaaccaca gctgcttcaa gaacccagac aggcatagca ttatacatgg actctggagt 60 cacacagacc tgggtttgaa tcttgcccct cttgcttctt gtgtggcctt gggcaggttg 120 catagcctgc ctggcactcc gtttcctcat ctgtgataca gggatgggtt gtaatgccac 180 ttacagagtc tttgtgaaca ttaaattaga taatagacac aaagtaccca gtatggtttt 240 ggcacatgat acctgctcag gaaattaact cttagaatag catgtgaatc ccctagttcr 300 ccttcccagt gattctaaaa gttaacaact tcagagttta catctgttat ctccttagga 360 gcagagattc ttataatcct cattttacaa gccaggaaac ggaggctcag ggaagtaaat 420 gtttttgaac cagggtattc agctaaggta agggcaatgg ttagcatggg ctccatcttg 480 gactctgggg ggatagtgtg tggagggaag gggcaactcc ctggcagctg ccaccacagt 540 gacctgctcc cagtcctctt ttgctgacat tctgccctgg gagttaagtt tcagctgac 599 <210> 219 <211> 599 <212> DNA <213> Homo sapiens <400> 219 gagggggtca aggcaggtgg atcacaaggt caggagtttg agaccagcct ggccaatgtg 60 gtgaaacttc atctctacta gaaatacaaa aattagctgg gcgtggtggc acatgcctgt 120 agtgccagct actcaggagg ctgaggcaga agaatcgctt gaacccagaa ggtggaggtt 180 gcagtgagct gagatcatgc cactgcactc cagcctgggt gatggtgtga gactccttct 240 caaaaaaaaa aaaaaaaaaa gtatggaaat gtcacccaca ccccctgact gagagacaas 300 actcccatgg atgatgggct agtcacagaa tgggctggtt agctttggat tgctttgcaa 360 ttaaatgcat ggtaaaatca ttgcactgtc ttgttcatag catttctcct tttgggatct 420 gagatctggt ctaaaaatga aacccttaat attgggggaa tccattttac cttccaggtg 480 tgcctgctta ttaggtccta gaaactgctt tcctcaccct gttctacaaa gggctccact 540 ctaaagccag taatccaatt aagaaatata aaaactggca aatgaaaaat cctacagct 599 <210> 220 <211> 599 <212> DNA <213> Homo sapiens <400> 220 ggcagccagg cccccaccac ccattctcat cattccacac aaacgtgagc ccctaccatg 60 aacaagatgt tgcatggagc actggcagaa gcagagtgag ttgaaggtgg cttcctccca 120 ggactgcatg gtcacagacc ccagcaccag caaagtatgg tcatcaggac cacaggaagg 180 gccagagatg ggctatgggg cactggggtc aggaagagtg ccccatcttc ctgaagggtg 240 atactggacc tggtccttgg agaataagaa agatctgatg aagcaaaacc ctggaaggar 300 ggtatccaag atgaagagaa agtatgaggt gcagtctgga ggcaggaaag atgggctgca 360 tcggaatcac accaggtaga atggttggtt ggttgaattg ggaggtggag ctggagaggt 420 atgtagggca gatggcaaaa ggccttaaat tcaggccaag gagagtggac ttgattatgg 480 aggcaacaga gactgaggga caagagctgg gattggaaag aggccccaag catatatgaa 540 gctcccctac tcatgcctgc cccacacctt ttcatgggat gttgtacagc acactccca 599 <210> 221 <211> 599 <212> DNA <213> Homo sapiens <400> 221 aattaattgt ttcttttcag tctcttccat tccctccacc cctaagaatg caagcattgt 60 gagccccagg tccacatctg tggctggctc ccctgtatcg cagttgtatt tgcacaatgc 120 ccagcactaa gtagctgctt cataaaatga gtacgcacat gggggtagac attgtgcaga 180 ggacttcaaa ccattccaaa tcctggactt ggagctcagt ccaggtttca ctgaaaactg 240 gaagtccagg gaggcctaag gggcatctag attatagaac ttctgaattt tgaaaggaty 300 gcgtggtcag agggatcctg gagggggtgg caggagagaa ggtgaggacg agggcaggga 360 gtggggatgg gcagcagacc tgggtggaca cctagcgagg tgagtcattg ctggtgtcca 420 cttcctcatg tacccacacc cctcccaggg gaggacctgg aggatggtgt gagggatggg 480 gaagggagtc tgaacggtac agaaatcagt cctgccactc ctccagctct ggactgggca 540 gagctgggga aagctctcta gcctcccaga gctggactgt cttcatgaaa aaccaggct 599 <210> 222 <211> 599 <212> DNA <213> Homo sapiens <400> 222 agtctctact aaaaatacaa aaattagcca ggtgtggtga tgcgtgcctg taatcccagc 60 tactcgggag gctgaggcag gagaattgct tcagcccagg aggcggacac tgcagtgaac 120 caagatggca ccactgaatc ccagcctgtg caacagagtg agactctgtc tcaaaaaaaa 180 aaaaaaagtg ttgggactac aggcatgagc acctgcacct ggccagtcct tttaaatact 240 gtactaaagg gaagatgctg atttgggttg caatacgctt tcacactctg ccatctgtgy 300 ggggatgcac tgtggagtga tgcaaagaac tggcctccac atttggagag cacgtctgag 360 gggccaggag acctctccat gcctctcatt tcattctaga ccatttaatc tgctgcaagt 420 gaaaactgat tgactccttt acattctaac taggttttat tattttttgt gaattttttt 480 gtgtctctag gtatgagaga acagaaatag agatttgggt ggctttagct gtttaaaata 540 aggtgaccaa acctcctttc tgcctgttcc tgctatttca aacaccactg ttctccaca 599 <210> 223 <211> 599 <212> DNA <213> Homo sapiens <400> 223 tggtaaataa aatcagaaga actttacatc ataaaagtct ggtaacatgt cagtcttttc 60 cccaaatact aaaaaagaag agtgcaatgt ttctccgtat ttccgaagtt tcaactctgc 120 gcccctctgc tttttcctca gcccatattg actcctgtct tccctgaaag tagctgcatt 180 gccacacttt atattttatt atatttcatc ctctagtgtt tcatgtctgt gccctaacta 240 aaattgtaag caccctaaga ttgtgttata aatctctgaa tttttcccta tactgccacs 300 ctagaacatt aaagaccgct tgatacccag gaagttctta atggccattt gattactcaa 360 atgttaacat ttgtttcagc taaatttatt aaactgtttg attgtctcat actgtgaaaa 420 tacctggatt taataaaaat tattttcaat ttatatttct ttagactact atgctgccag 480 aaaaacacat agttctctgg gagagtagat aaaggaagag agggactaaa gtctagtaac 540 ctaatataaa ggttgcaaaa gacttgatgt atttttctat atatgaggct gagtgggta 599 <210> 224 <211> 599 <212> DNA <213> Homo sapiens <400> 224 catggagtag taccagtctg tggcctgtgg gttgaagacc cctgaagtag gaagacttaa 60 gaacagcaga gtggcaagcc tgtaagagca agcggtttac agtttaaacg cacagcatcc 120 taacttagct tgtagacttc aggaaatgct tcccgggcca ggttcagtgt ctcatccctg 180 taatcccacc acttggggag gctgaggtgg gaggatccct tgaggccagg tgcttatgaa 240 ataggcctta gctataaatt taatggaatg cctacattca aaaaatacac gcgtgcgcay 300 gcacacaaac acacactatt ttcctcaata gtaagaacat ctagtagctt ttttttttga 360 gacaccctgt ctgtcttctg agacggagtg cagtggggaa caatcatggc tcactgtagc 420 ctcaaactcc taggttcaag tgatcctccc acctcggcct ccagtcttct gagtagctaa 480 gactccaggt gtgcgccacc acacctggct aatttttttt ttttctattt tctgtagaaa 540 caaggtattg ccatgttgcc caggctagtc tcaaactcct gggctcaagc aatgccccc 599 <210> 225 <211> 599 <212> DNA <213> Homo sapiens <400> 225 actgctgtag cagcagggag cctgcaccag cacagacaca ctgatgggac gatagaaacg 60 agaatgtgaa tgtgtaaacc accagagcca agagtatttt attttcttct cagtggtatc 120 atattctaaa taatggatgt ttttctctaa tttttaactg agaatgatca aaatgcatgc 180 attaggccca ccttcatcct catcctcatc ttcatcttct tcatcaagtc caaattcttc 240 ttcctaaaga atagcaaaca gcataacatt aaattaattc tgccaaattg aaaagtgcaw 300 atagtacaaa ttctgccaaa ctaagaagta caaataaatg caacaatatc aatcaagcag 360 gaaactgtaa tgttattttt atctactttg atgtaccaag acccactgat tttccttaac 420 gagctttata atttttctaa gaaaaatttt ttttagaagc aagcagttca tttgctagat 480 gtttaattag tatataactc tggataattc aagaaaacat cttaaaatct caaatttcaa 540 aacagattta gacaaaaatt tctatatccc attcatatac aaagcttctt tcagaactt 599 <210> 226 <211> 599 <212> DNA <213> Homo sapiens <400> 226 aatatctgta ggaaaaagaa aggcactgta gcataagtaa gacttcaaag gatttagagt 60 cagatgacca cctggctgga tgctattaga cagattatct aatcttaaag agccctagtt 120 tcctcaccta tgagatgagg attgctactt tgtcaaaccc acaaagccac tgtgagataa 180 ggtacgtgaa cactgtttac taactgtaaa gcactgcaca aacactagtt gccataaagc 240 ttatatagta atgtctacag tgctactgtg tttgcctttt aacctatctg acttgaccty 300 cccaattgaa acattaagtt ctttagggca tggatttcta ctttcatctg atttgtttat 360 cactatagct ctagcaccta ggacaatgtc tggcacatat tcagtgctag aaaatatgtc 420 cctgaataat cataaaatct tctagtactt gctatccaag tttgttagcc attacaaatt 480 gataaaattc aaggtggatc agctactgaa tttttctgag aaaactacct aaggcccagt 540 tgagtacaat ccagtgggag agttcaagtt ctgggaaaga acaagcaaaa taactgctc 599 <210> 227 <211> 599 <212> DNA <213> Homo sapiens <400> 227 atccactcaa ggtggggagg gatggcatca atgagtagtc tctgggcaag acaaagagca 60 gagagttacc ccttaacagt caggcctgtt aagctttttt ttcagagctc actgaatgtg 120 accatactta cagagggttt tctgagttag gcctgctgga cttgcatcag aaattccctc 180 agagatcccc tccacatata caaacacaca cacaaagaca agacggacag aaggccttcc 240 aaaccaagat ccctaaccaa gaattccaag agtattcctt ccaaactatc ctattctccr 300 tctgagaagt ctccccgaaa tcttactgat tgaggagaag tctccagaac caagactctt 360 cctactaatt agggagagta aaccgagacc cctgaagaag ctgaaccaat tgggagaagg 420 aaaggggtgt tggcagcacc tagactactc accaaatcag acaccccata atggggctgc 480 agctgcagac aatccatgat ggggctacaa acagacactg tgataaggtt acagttacag 540 gcaccccatg gtggagctac agagggacac cttgccatgg agctctagtt atgagatat 599 <210> 228 <211> 599 <212> DNA <213> Homo sapiens <400> 228 ttttgaaatt ttgcttgtat gaaatgtctc tattctattc tttcatttag ctgggaattg 60 aattctaggt caaaaataat tttccttcag aattttggag gcaatgttcc atcatcttct 120 cacttccagt gttactttct gagaagtctt caatcactat aattgctgac catttttgta 180 cgtgacctgg ttttgctgtt tggaacctca tagaatcttt tctttatcac cagtattctt 240 gtactttgca gtaattgttt tgtggagctt tttgtttgtt tgtttgtttt ttaatctatr 300 gacctgattc tcaaggattc tttcattctg gagacttatg cccttgggtt ctggagaaat 360 caatctcttt ttaaagaaaa taatttttca ccttcttttt ttcactgtct ggaagtacta 420 ttagtcaaat ttactgaatt cgtccttatt tttcttacat tttctccact attttcatct 480 ctttgccatt tgttttctat tttcggacag actgccttgt tgataagagg ataagtgcag 540 tctttcagat acattttctt ttattatttt ggaaatcaaa acatttaaca ctactcaac 599 <210> 229 <211> 599 <212> DNA <213> Homo sapiens <400> 229 caatatgttt cttattaagt aaccacatcc attactactg tgcaggcacc atgccatagc 60 acttacctgc acagacaggc cttagaggct ctttattatg ttgtaaccag ggttggagtg 120 attatgctga taccttatga acattagccc catttatagg ggatcttgcc ccattgcaca 180 gatgaggtcg ctgaggctca ggaagatgac ttcccagagg accctgtgca gtgtgtccag 240 gacccgaatg ggagcccaga cctgggtgtg gcctcgggcc ttgctctcac ttcactgacw 300 tgaggcccct gaggtttggc actgatttgc atcagctcct acttgttacc aggattacgt 360 tctgtgccag gcacagagat gtatcagtag gtgagtgatg tgagaacaag gaagggacaa 420 gctagctaat gatttaatta agtacataaa ttgcattgag attgggagat gtctggcctt 480 gccacagcgt gcaggaagtc cttctcagag gggccgggct gccccaggca gtttcagatg 540 tcccaaaggg agtgacactg caggcagggt ccctccctct tgcctgttgt gacccaggg 599 1

Claims

개인으로부터 수득된 핵산 시료 또는 개인으로부터 유래된 유전형 데이터세트(genotype dataset)에서 하나 이상의 다형성 마커의 하나 이상의 대립인자의 존재 여부를 결정하는 단계를 포함하는, 개인에서 갑상선암에 대한 감수성을 결정하는 방법으로서, 상기 하나 이상의 다형성 마커는 rs965513, 및 이와 연관 불균형(linkage disequilibrium)인 마커들로 구성된 군으로부터 선택되고, 상기 하나 이상의 대립인자의 존재는 상기 개인의 갑상선암에 대한 감수성을 나타내는 것인 방법.
제1항에 있어서, 상기 하나 이상의 다형성 마커는 표 2에 표시된 마커들로 구성된 군으로부터 선택되는 것인 방법.
제1항 또는 제2항에 있어서, 상기 하나 이상의 다형성 마커는 rs965513, rs10759944, rs907580, rs10984103, rs925487, rs7024345 및 rs1443434로 구성된 군으로부터 선택되는 것인 방법.
제1항 내지 제3항 중 어느 한 항에 있어서, 상기 개인에서 하나 이상의 일배체형의 빈도를 평가하는 단계를 더 포함하는 것인 방법.
제1항 내지 제4항 중 어느 한 항에 있어서, 상기 하나 이상의 대립인자 또는 일배체형의 존재에 의해 부여된 감수성은 증가된 감수성인 것인 방법.
제5항에 있어서, 마커 rs965513의 대립인자 A, 마커 rs907580의 대립인자 A, 마커 rs10759933의 대립인자 A, 마커 rs10984103의 대립인자 A, 마커 rs925487의 대립인자 G, 마커 rs7024345의 대립인자 A, 및 마커 rs1443434의 대립인자 G의 존재는 상기 개인에서 갑상선암에 대한 증가된 감수성을 나타내는 것인 방법.
제5항 또는 제6항에 있어서, 상기 하나 이상의 대립인자 또는 일배체형의 존재는 1.6 이상의 상대적 위험도(relative risk, RR) 또는 오즈비(odds ratio, OR)를 갖는 갑상선암에 대한 증가된 감수성을 나타내는 것인 방법.
제5항 또는 제6항에 있어서, 상기 하나 이상의 대립인자 또는 일배체형의 존재는 1.7 이상의 상대적 위험도(RR) 또는 오즈비(OR)를 갖는 증가된 감수성을 나타내는 것인 방법.
제1항 내지 제4항 중 어느 한 항에 있어서, 상기 하나 이상의 대립인자 또는 일배체형의 존재에 의해 부여된 감수성은 감소된 감수성인 것인 방법.
제1항 내지 제9항 중 어느 한 항에 있어서, 표 2에 표시된 마커들 중 하나와 연관 불균형이 아닌, 갑상선암에 대한 하나 이상의 위험 변이(at-risk variant)의 하나 이상의 위험 대립인자가 개인으로부터 수득된 게놈 DNA를 포함하는 시료 또는 개인으로부터 유래된 유전형 데이터세트에 존재하는지 여부를 결정하는 단계를 더 포함하는 것인 방법.
제1항 내지 제9항 중 어느 한 항에 있어서, 두개 이상의 다형성 마커 각각의 하나 이상의 대립인자가 개인으로부터 수득된 게놈 DNA를 포함하는 시료 또는 개인으로부터 유래된 유전형 데이터세트에 존재하는지 여부를 결정하는 단계를 포함하고, 상기 두개 이상의 다형성 마커의 상기 하나 이상의 대립인자의 존재는 갑상선암에 대한 증가된 감수성을 나타내는 것인 방법.
개인에서 갑상선암에 대한 감수성을 결정하는 방법으로서, 상기 방법은:
rs965513 (서열번호 1), 및 이와 연관 불균형인 마커들로 구성된 군으로부터 선택된 하나 이상의 다형성 마커의 하나 이상의 대립인자를 식별하는, 개인에 대한 핵산 서열 데이터를 수득하는 단계로서, 상기 하나 이상의 다형성 마커의 상이한 대립인자는 인간에서 갑상선암에 대한 상이한 감수성과 연관되는 것인 단계, 및
상기 핵산 서열 데이터로부터 갑상선암에 대한 감수성을 결정하는 단계를 포함하는 것인 방법.
제12항에 있어서, rs965513 (서열번호 1), 및 이와 연관 불균형인 마커들로 구성된 군으로부터 선택된 두 개 이상의 다형성 마커에 대한 핵산 서열 데이터를 수득하는 단계를 포함하는 것인 방법.
제12항 또는 제13항에 있어서, 감수성의 결정은 상기 핵산 서열 데이터를 상기 하나 이상의 다형성 마커와 갑상선암에 대한 감수성 간의 상관관계 데이터를 담은 데이터베이스와 비교하는 단계를 포함하는 것인 방법.
제14항에 있어서, 상기 데이터베이스는 상기 하나 이상의 다형성 마커에 대해 갑상선암에 대한 감수성의 하나 이상의 위험도 척도를 포함하는 것인 방법.
제14항에 있어서, 상기 데이터베이스는 상기 하나 이상의 다형성 마커에 대한 상기 하나 이상의 상태(condition)의 하나 이상의 위험도 척도를 담은 참조표(look-up table)를 포함하는 것인 방법.
제12항 내지 제16항 중 어느 한 항에 있어서, 핵산 서열 데이터의 수득은 상기 개인으로부터 생물학적 시료를 수득하는 단계 및 상기 시료 중 핵산에서 상기 하나 이상의 다형성 마커의 서열을 분석하는 단계를 포함하는 것인 방법.
제17항에 있어서, 상기 하나 이상의 다형성 마커의 서열을 분석하는 단계는 상기 하나 이상의 다형성 마커의 하나 이상의 대립인자의 존재 또는 부재를 결정하는 단계를 포함하는 것인 방법.
제12항 내지 제18항 중 어느 한 항에 있어서, 상기 핵산 서열 데이터의 수득은 기존의 기록으로부터 핵산 서열 정보를 수득하는 단계를 포함하는 것인 방법.
제1항 내지 제19항 중 어느 한 항에 있어서, 상기 개인, 상기 개인의 후견인, 유전학 서비스 제공자(genetic service provider), 의사, 의료 기관, 및 의료보험 회사로 구성된 군으로부터 선택된 하나 이상의 대상(entity)에게 상기 감수성을 보고하는 단계를 더 포함하는 것인 방법.
제12항 내지 제19항 중 어느 한 항에 있어서, 상기 하나 이상의 다형성 마커는 표 2에 열거된 마커들로 구성된 군으로부터 선택되는 것인 방법.
제21항에 있어서, 상기 하나 이상의 다형성 마커는 rs965513, rs10759944, rs907580, rs10984103, rs925487, rs7024345 및 rs1443434로 구성된 군으로부터 선택된 것인 방법.
제1항 내지 제22항 중 어느 한 항에 있어서, 상기 하나 이상의 다형성 마커는 FoxE1 유전자와 연관된 것인 방법.
갑상선암에 대한 감수성을 평가하기 위해 이용될 마커를 확인하는 방법으로서, 상기 방법은
a. rs965513, rs10759944, rs907580, rs10984103, rs925487, rs7024345 및 rs1443434로 구성된 군으로부터 선택된 마커 중 하나 이상의 마커와 연관 불균형인 하나 이상의 다형성 마커를 확인하는 단계,
b. 갑상선암으로 진단되거나 또는 갑상선암에 대한 감수성을 갖는 개인의 시료의 유전형 상태를 결정하는 단계, 및
c. 대조군 개인의 시료의 유전형 상태를 결정하는 단계를 포함하고,
상기 대조군 시료에서의 하나 이상의 다형성의 하나 이상의 대립인자의 빈도 대비, 갑상선암으로 진단되거나, 또는 갑상선암에 대한 감수성을 갖는 개인에서 상기 하나 이상의 대립인자의 빈도의 유의성 있는 차이는 상기 하나 이상의 다형성이 갑상선암에 대한 감수성을 평가하기 위해 유용하다는 것을 나타내는 것인 방법.
제24항에 있어서, 상기 대조군 시료에서의 상기 하나 이상의 다형성의 하나 이상의 대립인자의 빈도 대비, 갑상선암으로 진단되거나, 또는 갑상선암에 대한 감수성을 갖는 개인에서 상기 하나 이상의 대립인자의 빈도의 증가는 상기 하나 이상의 다형성이 갑상선암에 대한 증가된 감수성을 평가하기 위해 유용하다는 것을 나타내는 것인 방법.
제24항 또는 제25항에 있어서, 상기 대조군 시료에서의 상기 하나 이상의 다형성의 하나 이상의 대립인자의 빈도 대비, 갑상선암으로 진단되거나, 또는 갑상선암에 대한 감수성을 갖는 개인에서 상기 하나 이상의 대립인자의 빈도의 감소는 상기 하나 이상의 다형성이 갑상선암에 대한 감소된 감수성 또는 보호를 평가하기 위해 유용하다는 것을 나타내는 것인 방법.
개인으로부터 수득된 핵산 시료에서 하나 이상의 다형성 마커의 하나 이상의 대립인자가 존재하는지 여부를 결정하는 단계를 포함하는, 개인으로부터 수득된 핵산 시료의 유전형을 분석하는 방법으로서, 상기 하나 이상의 마커는 rs965513, 및 이와 연관 불균형인 마커들로 구성된 군으로부터 선택되고, 상기 시료 중의 상기 하나 이상의 대립인자의 존재의 결정은 상기 개인의 갑상선암에 대한 감수성을 나타내는 것인 방법.
제27항에 있어서, 마커 rs965513의 대립인자 A, 마커 rs907580의 대립인자 A, 마커 rs10759933의 대립인자 A, 마커 rs10984103의 대립인자 A, 마커 rs925487의 대립인자 G, 마커 rs7024345의 대립인자 A, 및 마커 rs1443434의 대립인자 G의 존재는 상기 개인에서 갑상선암의 증가된 감수성을 나타내는 것인 방법.
제27항 또는 제28항에 있어서, 유전형 분석은 상기 하나 이상의 다형성 마커를 플랭킹(flanking)하는 뉴클레오티드 프라이머 쌍을 이용한 중합효소 연쇄 반응(PCR)에 의해, 상기 하나 이상의 다형성 마커를 포함하는 핵산의 세그먼트를 증폭하는 단계를 포함하는 것인 방법.
제27항 내지 제29항 중 어느 한 항에 있어서, 유전형 분석은 대립인자-특이적 프로브 혼성화, 대립인자-특이적 프라이머 연장(primer extension), 대립인자-특이적 증폭, 핵산 서열결정(nucleic acid sequencing), 5'-엑소뉴클레아제 처리(exonuclease digestion), 분자 표지 분석법(molecular beacon assay), 올리고뉴클레오티드 라이게이션 분석법(oligonucleotide ligation assay), 크기 분석, 단일 가닥 구조 분석(single-stranded conformation analysis), 및 마이크로어레이 기술로부터 선택된 방법을 이용하여 수행되는 것인 방법.
제30항에 있어서, 상기 방법은 대립인자-특이적 프로브 혼성화를 포함하는 것인 방법.
제30항 또는 제31항에 있어서, 상기 방법은 마이크로어레이 기술인 것인 방법.
제27항 내지 제32항 중 어느 한 항에 있어서, 상기 방법은:
1) 상기 핵산의 카피를 검출 올리고뉴클레오티드 프로브 및 인핸서 올리고뉴클레오티드 프로브와, 상기 올리고뉴클레오티드 프로브와 상기 핵산 간의 특이적 혼성화 조건 하에 접촉시키는 단계로서,
a) 상기 검출 올리고뉴클레오티드 프로브는 길이가 5 내지 100개의 뉴클레오티드로 구성되고 서열번호 1 내지 서열번호 229 중 하나에 의해 주어진 뉴클레오티드 서열을 갖는 핵산의 제1 세그먼트에 특이적으로 혼성화되고,
b) 상기 검출 올리고뉴클레오티드 프로브는 3' 말단의 검출가능한 표지 및 5' 말단의 퀀칭 모이어티(quenching moiety)를 포함하며,
c) 상기 인핸서 올리고뉴클레오티드는 길이가 5 내지 100개의 뉴클레오티드로 구성되고 상기 올리고뉴클레오티드 프로브의 5'에 배열된 상기 뉴클레오티드 서열의 제2 세그먼트에 상보적이어서, 상기 두개의 올리고뉴클레오티드가 모두 상기 핵산에 혼성화되는 경우 상기 인핸서 올리고뉴클레오티드는 상기 검출 올리고뉴클레오티드에 대해 3'에 위치하며, 및
d) 상기 제1 세그먼트와 상기 제2 세그먼트 간에 단일 염기 갭(single base gap)이 존재하여, 상기 올리고뉴클레오티드 프로브와 상기 인핸서 올리고뉴클레오티드 프로브가 모두 상기 핵산에 혼성화되는 경우, 상기 올리고뉴클레오티드 간에 단일 염기 갭이 존재하는 것인 단계,
2) 상기 검출 프로브가 상기 핵산에 혼성화되는 경우, 상기 검출 프로브의 3' 말단으로부터 상기 검출가능한 표지를 절단하여 유리된 검출가능한 표지를 방출시키는 엔도뉴클레아제로 상기 핵산을 처리하는 단계, 및
3) 유리된 검출가능한 표지를 측정하는 단계로서, 상기 유리된 검출가능한 표지의 존재는 상기 검출 프로브가 상기 핵산의 제1 세그먼트에 특이적으로 혼성화된다는 것을 나타내고, 상기 다형성 부위의 서열이 상기 검출 프로브의 상보체(complement)라는 것을 나타내는 것인 단계를 포함하는 것인 방법.
갑상선암 치료제에 대한 반응의 확률에 대해 개인을 평가하는 방법으로서, 상기 개인으로부터 수득된 핵산 시료, 또는 상기 개인으로부터 유래된 유전형 데이터세트에서 하나 이상의 다형성 마커의 하나 이상의 대립인자가 존재하는지 여부를 결정하는 단계를 포함하고, 상기 하나 이상의 다형성 마커는 rs965513 (서열번호 1), 및 이와 연관 불균형인 마커들로 구성된 군으로부터 선택되고, 상기 하나 이상의 마커의 상기 하나 이상의 대립인자의 존재는 상기 치료제에 대한 양성 반응의 확률을 나타내는 것인 방법.
갑상선암으로 진단된 개인의 예후(prognosis)를 예측하는 방법으로서, 상기 방법은 상기 개인으로부터 수득된 핵산 시료, 또는 상기 개인으로부터 유래된 유전형 데이터세트에서 하나 이상의 다형성 마커의 하나 이상의 대립인자가 존재하는지 여부를 결정하는 단계를 포함하고, 상기 하나 이상의 다형성 마커는 rs965513 (서열번호 1), 및 이와 연관 불균형인 마커들로 구성된 군으로부터 선택되고, 상기 하나 이상의 대립인자의 존재는 상기 개인에서 갑상선암의 악화된 예후를 나타내는 것인 방법.
갑상선암의 치료를 받는 개인의 치료의 진행을 모니터링하는 방법으로서, 상기 방법은 상기 개인으로부터 수득된 핵산 시료 또는 상기 개인으로부터 유래된 유전형 데이터세트에서 하나 이상의 다형성 마커의 하나 이상의 대립인자가 존재하는지 여부를 결정하는 단계를 포함하고, 상기 하나 이상의 다형성 마커는 rs965513 (서열번호 1), 및 이와 연관 불균형인 마커들로 구성된 군으로부터 선택되고, 상기 하나 이상의 대립인자의 존재가 상기 개인의 치료 결과(treatment outcome)를 나타내는 것인 방법.
제34항 내지 제36항 중 어느 한 항에 있어서, 상기 하나 이상의 다형성 마커는 표 2에 표시된 마커들로부터 선택되는 것인 방법.
제1항 내지 제37항 중 어느 한 항에 있어서, 상기 개인의 위험도 평가, 진단, 또는 예후의 판단을 수행하기 위해 비-유전적 정보(non-genetic information)를 분석하는 단계를 더 포함하는 것인 방법.
제38항에 있어서, 상기 비-유전적 정보는 연령, 성별, 민족, 사회경제적 지위, 과거 질병 진단, 개인의 병력(medical history), 갑상선암의 가족력(family history), 생화학적 척도, 및 임상적 척도로부터 선택되는 것인 방법.
제38항 또는 제39항에 있어서, 통합 위험도(combined risk)를 계산하는 단계를 더 포함하는 것인 방법.
개인에서 갑상선암에 대한 감수성을 진단 및/또는 평가하기 위한 시약의 제조에서 올리고뉴클레오티드 프로브의 용도로서, 상기 프로브는 서열번호 1 내지 서열번호 229 중 하나로 표시된 뉴클레오티드 서열을 갖는 핵산의 세그먼트에 혼성화되고, 상기 프로브는 길이가 15 내지 500개의 뉴클레오티드로 구성되는 것인 용도.
개인에서 갑상선암에 대한 감수성을 평가하기 위한 키트로서, 상기 키트는
상기 개인의 게놈에서 하나 이상의 다형성 마커의 하나 이상의 대립인자를 선택적으로 검출하는 시약으로서, 상기 다형성 마커는 rs965513, 및 이와 연관 불균형인 마커들로 구성된 군으로부터 선택되는 것인 시약을 포함하고,
상기 하나 이상의 대립인자의 존재는 갑상선암에 대한 감수성을 나타내는 것인 키트.
제42항에 있어서, 상기 하나 이상의 다형성 마커는 표 2에 표시된 마커들로부터 선택되는 것인 키트.
제42항 또는 제43항에 있어서, 상기 시약은 상기 하나 이상의 다형성 마커를 포함하는 상기 개인의 게놈의 단편에 혼성화하는 하나 이상의 연속된(contiguous) 올리고뉴클레오티드, 완충액 및 검출가능한 표지를 포함하는 것인 키트.
제42항 내지 제44항 중 어느 한 항에 있어서, 상기 시약은 상기 개인으로부터 수득된 게놈 핵산 세그먼트의 반대쪽 가닥에 혼성화하는 한 쌍 이상의 올리고뉴클레오티드를 포함하고, 각 올리고뉴클레오티드 프라이머 쌍은 하나의 다형성 마커를 포함하는 상기 개인의 게놈의 단편을 선택적으로 증폭시키도록 설계되고, 상기 단편은 크기가 30 bp 이상인 것인 키트.
제44항 또는 제45항에 있어서, 상기 하나 이상의 올리고뉴클레오티드는 상기 개인의 게놈에 완전히 상보적인 것인 키트.
제42항 내지 제46항 중 어느 한 항에 있어서, 상기 키트는:
a. 길이가 5 내지 100개의 뉴클레오티드로 구성된 검출 올리고뉴클레오티드 프로브;
b. 길이가 5 내지 100개의 뉴클레오티드로 구성된 인핸서 올리고뉴클레오티드 프로브; 및
c. 엔도뉴클레아제 효소;를 포함하고,
상기 검출 올리고뉴클레오티드 프로브는 서열번호 1 내지 서열번호 229 중 하나로 표시된 뉴클레오티드 서열의 핵산의 제1 세그먼트에 특이적으로 혼성화되고; 및
상기 검출 올리고뉴클레오티드 프로브는 3' 말단에 검출가능한 표지를 포함하고 5' 말단에 퀀칭 모이어티(quenching moiety)를 포함하며;
상기 인핸서 올리고뉴클레오티드는 길이가 5개 내지 100개의 뉴클레오티드로 구성되고, 상기 올리고뉴클레오티드 프로브의 5'에 배열된 상기 뉴클레오티드 서열의 제2 세그먼트에 상보적이어서, 상기 인핸서 올리고뉴클레오티드는 상기 두개의 올리고뉴클레오티드가 모두 상기 핵산에 혼성화되는 경우 상기 검출 올리고뉴클레오티드에 대해 3'에 위치하며;
상기 제1 세그먼트와 상기 제2 세그먼트 간에 단일 염기 갭이 존재하여, 상기 올리고뉴클레오티드 프로브와 상기 인핸서 올리고뉴클레오티드 프로브가 모두 상기 핵산에 혼성화되는 경우, 상기 올리고뉴클레오티드 간에 단일 염기 갭이 존재하며; 및
상기 핵산을 상기 엔도뉴클레아제에 의해 처리하는 단계는 상기 검출 프로브가 상기 핵산에 혼성화된 경우, 상기 검출 프로브의 3'말단으로부터 상기 검출가능한 표지를 절단하여 유리 상태의 검출가능한 표지를 방출하는 것인 키트.
개인에서 갑상선암에 대한 감수성을 결정하기 위한 컴퓨터에서 실행가능한 프로그램(computer executable instructions)이 수록된 컴퓨터-판독가능한 매체로서, 상기 컴퓨터-판독가능한 매체는
하나 이상의 다형성 마커를 나타내는 데이터; 및
상기 컴퓨터-판독가능한 매체 상에 저장되고 상기 하나 이상의 다형성 마커에 대해 개인에서 갑상선암을 발병할 위험도를 결정하기 위해 프로세서에 의해 실행되도록 개조된 루틴(routine);을 포함하고,
상기 하나 이상의 다형성 마커는 rs965513, 및 이와 연관 불균형인 마커들로부터 선택되는 것인 컴퓨터-판독가능한 매체.
제48항에 있어서, 상기 컴퓨터 판독가능한 매체는 두 개 이상의 다형성 마커를 나타내는 데이터를 포함하는 것인 컴퓨터 판독가능한 매체.
제48항 또는 제49항에 있어서, 상기 하나 이상의 다형성 마커를 나타내는 데이터는 상기 하나 이상의 다형성 마커에 대해 갑상선암에 대한 감수성을 나타내는 파라미터를 포함하고, 개인에서 갑상선암을 발병할 위험도는 상기 개인에서 상기 하나 이상의 다형성 마커의 대립인자 상태에 근거하는 것인 컴퓨터 판독가능한 매체.
제48항 내지 제50항 중 어느 한 항에 있어서, 상기 하나 이상의 다형성 마커를 나타내는 데이터는 상기 개인에서 상기 하나 이상의 다형성 마커의 대립인자 상태를 나타내는 데이터를 포함하는 것인 컴퓨터 판독가능한 매체.
제48항 내지 제50항 중 어느 한 항에 있어서, 상기 루틴은 상기 개인에서 상기 하나 이상의 다형성 마커의 대립인자 상태를 나타내는 입력 데이터를 수신하도록 개조된 것인 컴퓨터 판독가능한 매체.
제48항 내지 제52항 중 어느 한 항에 있어서, 상기 하나 이상의 다형성 마커는 표 2에 표시된 마커들로부터 선택되는 것인 컴퓨터 판독가능한 매체.
제48항 내지 제53항 중 어느 한 항에 있어서, 상기 하나 이상의 다형성 마커는 rs965513, rs10759944, rs907580, rs10984103, rs925487, rs7024345 및 rs1443434로 구성된 군으로부터 선택되는 것인 컴퓨터 판독가능한 매체.
제48항 내지 제54항 중 어느 한 항에 있어서, 두 개 이상의 다형성 마커를 포함하는 하나 이상의 일배체형을 나타내는 데이터를 더 포함하는 것인 컴퓨터 판독가능한 매체.
개인에서 갑상선암에 대한 유전적 지표(indicator)를 결정하기 위한 장치로서:
프로세서,
rs965513, 및 이와 연관 불균형인 마커들로 구성된 군으로부터 선택된 하나 이상의 다형성 마커에 대해 하나 이상의 개인에 대한 마커 및/또는 일배체형 정보를 분석하고, 상기 마커 또는 일배체형 정보에 기반한 출력물(output)을 생성하기 위해 상기 프로세서 상에서 실행되도록 개조된 컴퓨터 실행가능한 프로그램이 수록된 컴퓨터 판독가능한 메모리를 포함하고,
상기 출력물은 상기 개인의 갑상선암의 유전적 지표로서 상기 하나 이상의 마커 또는 대립인자의 위험도 척도를 포함하는 것인 장치.
제56항에 있어서, 상기 컴퓨터 판독가능한 메모리는 갑상선암으로 진단된 복수의 개인에서 하나 이상의 다형성 마커의 하나 이상의 대립인자 또는 하나 이상의 일배체형의 빈도를 나타내는 데이터, 및 복수의 기준(reference) 개인에서 하나 이상의 다형성 마커의 하나 이상의 대립인자 또는 하나 이상의 일배체형의 빈도를 나타내는 데이터를 포함하고, 위험도 척도는 상기 개인에 대한 상기 하나 이상의 마커 및/또는 일배체형 상태와 갑상선암으로 진단된 복수의 개인에 대한 상기 하나 이상의 마커 및/또는 일배체형 빈도 정보를 나타내는 데이터의 비교에 기반한 것인 장치.
제56항에 있어서, 상기 컴퓨터 판독가능한 메모리는 상기 하나 이상의 다형성 마커의 하나 이상의 대립인자 또는 하나 이상의 일배체형과 연관된 갑상선암을 발병할 위험도를 나타내는 데이터를 포함하고, 상기 개인에 대한 위험도 척도는 상기 개인에 대한 상기 하나 이상의 다형성 마커 및/또는 하나 이상의 일배체형 상태와 상기 하나 이상의 다형성 마커의 하나 이상의 대립인자 또는 하나 이상의 일배체형과 연관된 갑상선암을 발병할 위험도의 비교에 기반한 것인 장치.
제56항에 있어서, 상기 컴퓨터 판독가능한 메모리는 갑상선암으로 진단된 복수의 개인에서 상기 하나 이상의 다형성 마커의 하나 이상의 대립인자 또는 상기 하나 이상의 일배체형의 빈도를 나타내는 데이터와, 복수의 기준 개인에서 상기 하나 이상의 다형성 마커의 하나 이상의 대립인자 또는 상기 하나 이상의 일배체형의 빈도를 나타내는 데이터를 더 포함하고, 갑상선암을 발병할 위험도는 갑상선암으로 진단된 개인과 기준 개인에서 상기 하나 이상의 대립인자 또는 일배체형의 빈도의 비교에 기반한 것인 장치.
제56항 내지 제59항 중 어느 한 항에 있어서, 상기 하나 이상의 마커 또는 일배체형은 표 2에 표시된 마커들로부터 선택된 하나 이상의 마커를 포함하는 것인 장치.
제56항 내지 제60항 중 어느 한 항에 있어서, 상기 위험도 척도는 오즈비(odds ratio, OR) 또는 상대적 위험도(relative risk, RR)에 의해 특정되는 것인 장치.
제1항 내지 제61항 중 어느 한 항에 있어서, 마커들 간의 연관 불균형은 연관 불균형 척도 r² 및/또는 |D'|의 특정한 수치값을 특징으로 하는 것인 방법, 키트, 용도, 매체 또는 장치.
제1항 내지 제62항 중 어느 한 항에 있어서, 마커들 간의 연관 불균형은 0.1 이상의 r² 값을 특징으로 하는 것인 방법, 키트, 용도, 매체 또는 장치.
제1항 내지 제63항 중 어느 한 항에 있어서, 마커들 간의 연관 불균형은 0.2 이상의 r²값을 특징으로 하는 것인 방법, 키트, 용도, 매체 또는 장치.
제1항 내지 제64항 중 어느 한 항에 있어서, 상기 개인은 유럽계 선조를 포함하는 선조로부터 유래된 것인 방법, 키트, 용도, 매체 또는 장치.