KR20090127939A - 유방암의 위험도 평가, 진단, 예후 및 치료용 마커인 염색체 2 및 염색체 16 상의 유전적 변이 - Google Patents

유방암의 위험도 평가, 진단, 예후 및 치료용 마커인 염색체 2 및 염색체 16 상의 유전적 변이 Download PDF

Info

Publication number
KR20090127939A
KR20090127939A KR1020097022257A KR20097022257A KR20090127939A KR 20090127939 A KR20090127939 A KR 20090127939A KR 1020097022257 A KR1020097022257 A KR 1020097022257A KR 20097022257 A KR20097022257 A KR 20097022257A KR 20090127939 A KR20090127939 A KR 20090127939A
Authority
KR
South Korea
Prior art keywords
markers
breast cancer
allele
individual
alleles
Prior art date
Application number
KR1020097022257A
Other languages
English (en)
Inventor
사이먼 스테이시
패트릭 슐렘
안드래이 마놀래스쿠
Original Assignee
디코드 제네틱스 이에이치에프
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 디코드 제네틱스 이에이치에프 filed Critical 디코드 제네틱스 이에이치에프
Publication of KR20090127939A publication Critical patent/KR20090127939A/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/172Haplotypes
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Engineering & Computer Science (AREA)
  • Immunology (AREA)
  • Pathology (AREA)
  • Analytical Chemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Genetics & Genomics (AREA)
  • Hospice & Palliative Care (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Oncology (AREA)
  • Biotechnology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Peptides Or Proteins (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)

Abstract

본 발명은 유방암의 감수성 변이인 Chr2q14, Chr2q35 및 Chr16q12 상의 특정한 유전적 변이에 관한 것이다. 그와 같은 변이를 이용하여, 유방암의 위험도를 평가하고 유방암에 대한 증가된 감수성 및/또는 감소된 감수성을 진단하는 방법이 개시된다. 본 발명은 또한 유방암에 대한 감수성을 진단하기 위한 키트에 관한 것이다.
Figure P1020097022257
유방암, 유전적 변이, 다형성.

Description

유방암의 위험도 평가, 진단, 예후 및 치료용 마커인 염색체 2 및 염색체 16 상의 유전적 변이{Genetic variants on chr2 and chr16 as markers for use in breast cancer risk assessment, diagnosis, prognosis and treatment}
본 발명은 유방암의 감수성 변이인 Chr2q14, Chr2q35 및 Chr16q12 상의 특정한 유전적 변이에 관한 것이다. 그와 같은 변이를 이용하여, 유방암의 위험도를 평가하고 유방암에 대한 증가된 및/또는 감소된 감수성을 진단하는 방법이 개시된다. 본 발명은 또한 유방암에 대한 감수성을 진단하기 위한 키트에 관한 것이다.
유방암은 현재 전세계적으로 여성에서 가장 흔한 암이다. 현재 전세계적 발생율은 매년 1,151,000명 이상의 진단되노 신규 환자들이다(Parkin et al., 2005). 유방암 발생율은 선진국에서, 특히, 북유럽 민족 기원의 집단에서 가장 높고, 증가되고 있다. 미국에서, 연간 연령-표준화 발생율(annual age-standardized incidence rate)은 세계 평균을 3배 이상 초과하는, 100,000명 당 약 131명이다. 북유럽 국가들에서의 발생율은 유사하게 높다. 2006년에, 미국에서 214,650명의 침습성(invasive) 유방암 신규 환자들이 진단되고, 41,430명의 사람들이 상기 질환으로 사망할 것으로 추정된다[Jemal, et al., (2006), CA Cancer J Clin, 56, 106-30]. 이 수치에, 2006년에 예상되는 추가적인 61,980명의 유관상피내암 및 유소엽 상피내암(ductal and lobular carcinoma in-situ) 진단이 추가되어야 한다. 개인적인 관점에서, 생애 중에 유방암을 발병할 확률은 미국 여성의 경우 13.2%(즉, 8명의 여성 중 1명이 그들의 생애 동안 유방암을 발병함)이다. 대부분의 암의 경우와 같이, 조기 검출 및 적합한 치료가 중요한 인자이다. 전반적으로, 유방암에 대한 5-년 생존률은 88%이다. 그러나, 국소적 침습성 질환(regionally invasive disease) 또는 전이성 질환을 갖는 개인에서, 그 비율은 각각 81% 및 26%로 감소된다[Jemal, et al., (2006), CA Cancer J Clin, 56, 106-30].
점차적으로, 원발성 유방암 또는 재발성 유방암에 대한 고 위험도를 갖는 개인의 식별이 강조되고 있다. 그와 같은 개인들은 보다 집중적인 스크리닝, 예방적 화학요법, 호르몬 요법에 의해 관리될 수 있고, 매우 높은 위험도를 갖는 개인들의 경우, 예방적 외과수술(prophylactic surgery)에 의해 관리될 수 있다. 집단 스크리닝(mass screening) 프로그램은 의료 서비스에 대해 엄청난 경제적 부담이 되나, 예방적 치료법은 연관된 위험 및 삶의 질의 중요성을 갖는다.
유방암에 대한 유전적 소인(genetic predisposition):
유방암에 대한 공지된 위험 인자들의 두개의 주요한 종류는 내분비계 인자 및 유전학이다. 후자와 관련하여, 유방암 환자의 약 12%가 유방암을 갖는 1명 이상의 1촌 친척(first degree relative)를 갖는다[(2001), Lancet, 358, 1389-99]. 잘 알려진, 우세한 유방암 소인 유전자 BRCA1 및 BRCA2는 보인자(carrier)에게 크게 증가된 유방암 위험도를 부여하고, 일생의 침투도(lifetime penetrance) 추정값은 40-80%의 범위이다. BRCA1 및 BRCA2 돌연변이의 존재가 6건 이상의 유방암 케이스를 갖는 가족의 대부분 및 유방암, 및 난소암 또는 남성 유방암을 포함하는 가족의 높은 비율에서 원인일 수 있다. 그러나, 실제로 그와 같은 가족은 매우 드물다. BRCA1 및 BRCA2 돌연빈이는 보다 적은 수의 케이스를 갖는 가족, 또는 유방암 케이스만을 특징으로 하는 가족에서 훨씬 덜 빈번하게 발견된다. BRCA1 돌연변이와 BRCA2 돌연변이가 가족성 유방암(familiar breast cancer)에 대한 위험도의 15-20%를 차지한다. 비-시조 집단(non-founder population)에서, 모든 일반적인 BRCA 돌연변이가 검출될 수 있는 경우, 2-3%의 우발적(incident) 유방암 환자가 하나의 돌연변이를 가질 것으로 예상된다[Gorski, et al., (2005), Breast Cancer Res Treat, 92, 19-24; (2000), Br J Cancer, 83, 1301-8]. 이 낮은 "발견 가능성(chance to find)" 통계값은 명백한 유전적 소인을 갖는 패밀리 외에서 BRCA 돌연변이 테스트의 타당한 사용을 배제한다(Anon[(2003), J Clin Oncol, 21, 2397-406]). 드문, 높은 침투성 돌연변이가 TP53 및 PTEN 유전자에서 일어나는 것으로 알려져있으나, 이들은 함께 유방암에 대한 전체 유전적 위험도의 5% 이하를 차지한다[Easton, (1999), Breast Cancer Res, 1, 14-7]. 유방암에 대한 고 위험도를 부여하는 보다 많은, 보다 일반적인 돌연변이를 확인하기 위한 연관 연구는 대부분 성공하지 못했다[Smith, et al., (2006), Genes Chromosomes Cancer, 45, 646-55].
최근의 역학적 연구는 유방암 케이스의 대다수가 집단의 소인을 갖는 민감한 소수(predisposed, susceptible minority)에서 일어난다는 것을 확인했다[Antoniou, et al., (2002), Br J Cancer, 86, 76-83; Pharoah, et al., (2002), Nat Genet, 31, 33-6]. 쌍생아 연구로부터의 데이터 및 원발성 유방암(primary breast cancer)을 견뎌낸 환자의 반대쪽 유방에서 암의 일정한 높은 발병율의 관찰은 유방암에 대한 규명되지 않은 위험도의 상당한 부분은 내생적 인자, 가장 가능성있게는 유전적 인자와 관련된다는 것을 나타낸다[Lichtenstein, et al., (2000), N Engl J Med, 343, 78-85; Peto and Mack, (2000), Nat Genet, 26, 411-4]. 이 일반적인(widespread) 위험도를 뒷받침하는 유전적 인자의 지식은 매우 한정되어 있다. 분리(segregation) 분석은 유방암에 대한 규명되지 않은 유전적 위험도는 속성상 다유전자성(polygenic)일 가능성이 매우 높고, 위험 대립인자는 저위험도 내지 중간 위험도를 부여하고 상호간 및 호르몬 위험 인자(hormonal risk factor)와 상호작용할 수 있다. 그럼에도 불구하고, 이 연구들은 이 저 위험도 내지 중간 위험도 위험 대립인자들을 포착하는 유전적 프로파일링에 의해 정의될 수 있는 분포의 최고 5분위수와 최저 5분위수 간의 상대적 위험도의 40-배 차이를 예측한다[Antoniou, et al., (2002), Br J Cancer, 86, 76-83; Pharoah, et al., (2002), Nat Genet, 31, 33-6]. 모든 유방암 케이스의 88%는 집단의 소인을 갖는 50%에서 발생하며, 최고 위험도에 있는 집단의 12%가 모든 유방암 케이스의 50%를 차지할 것으로 예상된다[Pharoah, et al., (2002), Nat Genet, 31, 33-6; Pharoah, (2003), Recent Results Cancer Res, 163, 7-18; discussion 264-6]. 따라서, 그와 같이 유전적으로 소인을 갖는 개인의 확인 및 그들을 위한 맞춤화된 의료적 관리 전략의 개발에 초점이 맞춰져 있다.
본 발명자들 및 다른 연구자들은 아이슬란드에서 5촌 이상 친척(5th degree relative)까지 확장되는 유방암의 유의성 있는 가족성 위험도(familiar risk)가 있다는 것을 입증했다[Amundadottir, et al., (2004), PLoS Med, 1, e65; Tulinius, et al., (2002), J Med Genet, 39, 457-62]. 아이슬란드에서 BRCA1 돌연변이의 가족성 위험도에 대한 기여는 최소인 것으로 사료된다[Arason, et al., (1998), J Med Genet, 35, 446-9; Bergthorsson, et al., (1998), Hum Mutat, Suppl 1, S195-7]. BRCA2 유전자의 하나의 시조 돌연변이(founder mutation)(999del5)는 일반적인 아이슬란드 집단에서 0.6-0.8%의 보인자 빈도(carrier frequency)로 존재하고, 여성 유방암 환자에서는 7.7-8.6%의 보인자 빈도로 존재한다[Thorlacius, et al., (1997), Am J Hum Genet, 60, 1079-84; Gudmundsson, et al., (1996), Am J Hum Genet, 58, 749-56]. 이 단일 돌연변이는 1촌 내지 3촌 친척에서 유전성 유방암 위험도의 약 40%를 차지하는 것으로 추정된다[Tulinius, et al., (2002), J Med Genet, 39, 457-62]. 이 추정값은 비-시조(non-founder) 집단에서 통합된 모든 BRCA1 및 BRCA2 돌연변이에서 기인되는 15-25%의 가족성 위험도보다 더 높으나, 약 60%의 아이슬란드 가족성 유방암 위험도가 여전히 설명되지 않는다. BRCA2 999del5에 대해 음성으로 테스트된 환자의 1촌 친척은 유방암에 대한 집단 위험도의 1.72배의 위험도를 갖는다(95% CI 1.49-1.96) [Tulinius, et al., (2002), J Med Genet, 39, 457-62].
유방암의 나머지 유전적 위험도에 기여하는 유전적 인자들에 대한 이해는 매 우 제한적이다. 두 개의 유전자, CHEK2 및 ATM의 변이가 저 침투성(low penetrance) 유방암 위험도 유전자인 것으로 정밀하게 확인되었다[Renwick, et al., (2006), Nat Genet, 38, 873-5; (2004), Am J Hum Genet, 74, 1175-82]. 다수의 다른 유전자들이 관련되었으나, 유방암 위험도에 대한 그들의 기여는 매우 큰 표본 세트를 이용한 분석에서 확인되지 않았다[Breast Cancer Association, (2006), J Natl Cancer Inst, 98, 1382-96].
유전적 위험도는 집단 내의 개체들 중에서 유전자 중 미묘한 차이에 의해 부여된다. 유전자는 가장 빈번하게는 단일 염기 다형성(single nucleotide polymorphisms, SNP) 때문에 개체들 간에 상이하나, 다른 변이도 중요하다. SNP는 인간 게놈에서 평균 1000개의 염기쌍마다 존재한다. 따라서, 250,000개의 염기쌍(bp)을 포함하는 통상적인 인간 유전자는 250개의 상이한 SNP를 포함할 수 있다. 소수의 SNP만이 엑손에 위치하고, 해당 유전자에 의해 코딩된 단백질의 아미노산 서열을 변화시킨다. 대부분의 SNP는 유전자 기능에 거의 또는 전혀 효과를 갖지 않을 수 있고, 다른 SNP는 해당 유전자에 의해 코딩된 mRNA의 전사, 스플라이싱(splicing), 번역, 또는 안정성을 변화시킬 수 있다. 인간에서 추가적인 유전적 다형성이 DNA의 짧거나 또는 긴 스트레치(stretch)의 삽입, 결실, 전위(translocation), 또는 역전에 의해 유발된다. 따라서, 질병 위험도를 부여하는 유전적 다형성은 단백질의 아미노산 서열을 직접적으로 변화시킬 수 있거나, 해당 유전자로부터 생성된 단백질의 양을 증가시킬 수 있거나, 또는 해당 유전자에 의해 생성된 단백질의 양을 감소시킬 수 있다.
일반적인 질환의 위험도를 부여하는 유전적 다형성이 밝혀져서, 그와 같은 위험 인자에 대한 유전적 테스트가 임상 의학에서 중요해지고 있다. 예는 알쯔하이머병의 차등적 진단(differential diagnosis)을 위해 치매 환자에서 apoE4 다형성의 유전적 보인자를 확인하기 위한 아포리포프로테인(apolipoprotein) E 테스트 및 심부 정맥 혈전증에 대한 소인을 테스트하기 위한 Factor V Leiden 테스트이다. 보다 중요하게는, 암의 치료에서, 종양 세포의 유전적 변이의 진단이 개별 환자를 위한 가장 적합한 치료 방법(treatment regime)의 선택을 위해 이용된다. 유방암 환자에서, 에스트로겐 수용체 발현 또는 Her2(heregulin type 2) 수용체 티로신 키나아제 발현의 유전적 변이가 항-에스트로겐 약물(타목시펜) 또는 항-Her2 항체(Herceptiin)이 치료 계획 내에 포함되어야 하는지 여부를 결정한다. 필라델피아 염색체의 만성 골수성 백혈병(chronic myeloid leukemia, CML) 진단에서, Bcr 및 Abl 수용체 티로신 키나아제를 코딩하는 유전자를 융합하는 유전적 전좌(genetic translocation)는 Bcr-Abl 키나아제의 특이적 저해제인 Gleevec(STI571)이 암의 치료를 위해 이용되어야 한다는 것을 나타낸다. 그와 같은 유전적 변화를 갖는 CML 환자의 경우, Bcr-Abl 키나아제의 저해는 종양 세포의 신속한 제거 및 백혈병의 완화를 가져온다.
유방암의 예방 또는 치료를 위해 범용적으로 성공적인 방법은 현재 존재하지 않는다. 유방암의 관리는 현재 일차적 예방(primary prevention), 조기 진단, 적합한 치료 및 이차적 예방(secondary prevention)의 조합에 의존한다. 유전적 검사를 이 관리 영역의 모든 측면에 통합시켜야 하는 임상적 요구가 존재한다. 암 감수성 유전자의 확인은 또한 (예를 들면, 저분자량 또는 고분자량 약물을 이용하여) 처리될 수 있고 보다 효과적인 치료법을 유도할 수 있는 주요한 분자적 경로를 규명할 수 있다.
발명의 요약
본 발명은 유방암의 위험도를 평가하는 방법에 관한 것이다. 위험도 평가는 본 명세서에서 설명되는 바와 같이, 유방암과 연관된 것으로 확인된 특정한 마커 또는 일배체형(haplotype)을 평가하는 것에 의해, 개인에서 유방암에 대한 증가된 감수성을 결정하는 방법, 및 개인에서 유방암에 대한 감소된 감수성을 결정하거나, 또는 유방암에 대한 보호(protection)를 진단하는 방법을 포함한다.
제1 양태에서, 본 발명은 개인으로부터 수득된 핵산 시료 또는 개인으로부터 유래된 유전형 데이터세트(genotype dataset)에서 하나 이상의 다형성 마커의 하나 이상의 대립인자의 존재 또는 부재를 결정하는 단계를 포함하는, 개인에서 유방암에 대한 감수성을 결정하는 방법으로서, 상기 하나 이상의 다형성 마커는 표 10, 표 15 및 표 19 중 하나에 표시된 다형성 마커들, 및 이들과 연관 불균형(linkage disequilibrium)인 마커들로부터 선택되고, 상기 하나 이상의 대립인자의 존재는 상기 개인의 유방암에 대한 감수성을 나타내는 것인 방법에 관한 것이다. 일 구체예에서, 상기 방법은 상기 개인으로부터 수득된 핵산 시료에서 하나 이상의 다형성 마커의 하나 이상의 대립인자의 존재 또는 부재의 결정에 관한 것이다. 또 다른 구체예에서, 상기 방법은 상기 개인으로부터 유래된 유전형 데이터세트에서 하나 이상의 다형성 마커의 하나 이상의 대립인자의 존재 또는 부재의 결정에 관한 것이다. 특정한 구체예에서, 유전형 데이터세트는 특정한 핵산 시료 주형과 관련된 유전형 데이터세트에 담긴 정보에 의해 특정한 개인으로부터 유래될 수 있고, 상기 핵산 시료는 1명의 개인으로부터 유래된 핵산을 포함한다.
다형성 마커의 특정한 감수성 대립인자의 존재의 결정은 그 대립인자에 의해 부여된 특정한 감수성의 존재에 대한 직접적인 표시를 제공한다. 반면에, 그와 같은 감수성 대립인자의 부재의 결정은 유전형 시료 또는 유전형 데이터세트가 유래된 개인에 상기 특정한 감수성이 존재하지 않는다는 표시를 제공한다. SNP 또는 삽입/결실 다형성과 같은 두개의 가능한 대립인자를 갖는 다형성 마커의 특정한 경우에, 특정한 대립인자의 부재의 결정은 (개인에서 특정한 게놈 영역이 결실 또는 중복을 포함하여, 상기 개인의 게놈 내의 특정한 게놈 영역의 단일 카피 또는 두개 이상의 카피가 존재할 수 있는 경우가 아니라면) 개인에서 대안적인 대립인자의 두 개의 카피의 존재를 나타낸다.
제2 양태에서, 본 발명은 개인에서 유방암에 대한 감수성을 진단하는 방법으로서, 상기 방법은 상기 개인으로부터 수득된 핵산 시료에서 하나 이상의 다형성 마커의 하나 이상의 대립인자의 존재 또는 부재를 결정하는 단계를 포함하고, 상기 하나 이상의 다형성 마커는 rs4848543 LD 블럭, rs3803662 LD 블럭, 및 rs13387042 LD 블럭과 연관된 마커들의 군으로부터 선택되고, 상기 하나 이상의 대립인자의 존재는 유방암에 대한 감수성을 나타내는 것인 방법에 관한 것이다. 일 구체예에서, rs4848543 LD 블럭, rs3803662 LD 블럭 및/또는 rs13387042 LD 블럭과 연관된 마커들은 이 LD 블럭들 중 하나 이상 내에 있는 하나 이상의 마커와 연관 불균형인 마커들이다.
또 다른 양태에서, 본 발명은 개인에서 유방암에 대한 감수성을 진단하는 방법으로서, 상기 방법은 개인으로부터 수득된 핵산 시료에서 하나 이상의 다형성 마커의 하나 이상의 대립인자의 존재 또는 부재를 결정하는 단계를 포함하고, 상기 하나 이상의 다형성 마커는 표 10, 표 15 및 표 19에 표시된 다형성 마커들, 및 이들과 연관 불균형인 마커들로부터 선택되는 것인 방법에 관한 것이다. 하나의 특정한 구체예에서, 표 10, 표 15 및 표 19에 열거된 마커들과 연관 불균형인 마커들은 0.2보다 큰 r2의 값을 갖는 마커들이다. 또 다른 구체예에서, 표 10, 표 15 및 표 19에 열거된 마커들과 연관 불균형인 마커들은 HapMap CEPH 집단과 같은 코카서스계 집단에서 0.2보다 큰 r2의 값을 갖는 마커들이다.
또 다른 양태에서, 본 발명은 유방암에 대한 감수성을 평가하기 위해 이용될 마커를 확인하는 방법으로서, 상기 방법은
a. 서열번호 4, 서열번호 5 및 서열번호 6으로 표시된 서열을 갖는 게놈 세그먼트 내의 하나 이상의 마커와 연관 불균형인 하나 이상의 다형성 마커를 확인하는 단계,
b. 유방암으로 진단되거나 또는 유방암에 대한 감수성을 갖는 개인의 시료의 유전형 상태(genotype status)를 결정하는 단계, 및
c. 대조군 개인의 시료의 유전형 상태를 결정하는 단계를 포함하고,
상기 대조군 시료에서의 하나 이상의 다형성의 하나 이상의 대립인자의 빈도 대비, 유방암으로 진단되거나, 또는 유방암에 대한 감수성을 갖는 개인에서 상기 하나 이상의 대립인자의 빈도의 유의성 있는 차이는 상기 하나 이상의 다형성이 유방암에 대한 감수성을 평가하기 위해 유용하다는 것을 나타내는 것인 방법에 관한 것이다. 일 구체예에서, 상기 대조군 시료에서의 상기 하나 이상의 다형성의 하나 이상의 대립인자의 빈도 대비, 유방암으로 진단되거나, 또는 유방암에 대한 감수성을 갖는 개인에서 상기 하나 이상의 대립인자의 빈도의 증가는 상기 하나 이상의 다형성이 유방암에 대한 증가된 감수성을 평가하기 위해 유용하다는 것을 나타낸다. 또 다른 구체예에서, 상기 대조군 시료에서의 상기 하나 이상의 다형성의 하나 이상의 대립인자의 빈도 대비, 유방암으로 진단되거나, 또는 유방암에 대한 감수성을 갖는 개인에서 상기 하나 이상의 대립인자의 빈도의 감소는 상기 하나 이상의 다형성이 유방암에 대한 감소된 감수성 또는 보호를 평가하기 위해 유용하다는 것을 나타낸다. 일 구체예에서, 서열번호 4, 서열번호 5 및 서열번호 6에 표시된 서열을 갖는 게놈 세그먼트 내의 마커들 중 하나 이상과 연관 불균형인 하나 이상의 다형성 마커는 rs4848543 (서열번호 1), rs3803662 (서열번호 3) 및 rs13387042 (서열번호 2)로부터 선택된다.
본 발명은 또한, 유방암에 대한 위험을 갖거나, 또는 유방암으로 진단된 개인으로부터 수득된 핵산 시료에서 하나 이상의 다형성 마커의 하나 이상의 대립인자의 존재 또는 부재를 결정하는 단계를 포함하는, 개인으로부터 수득된 핵산 시료의 유전형을 분석하는 방법으로서, 상기 하나 이상의 마커는 표 10, 표 15 및 표 19에 표시된 마커들, 및 이들과 연관 불균형인 마커들로 구성된 군으로부터 선택되고, 상기 하나 이상의 다형성 마커의 상기 하나 이상의 대립인자의 존재 또는 부재는 유방암의 감수성을 나타내는 것인 방법에 관한 것이다. 일 구체예에서, 상기 하나 이상의 마커는 rs4848543 (서열번호 1), rs3803662 (서열번호 3) 및 rs13387042 (서열번호 2)로부터 선택된다. 또 다른 구체예에서, 유전형 분석은 상기 하나 이상의 다형성 마커를 플랭킹(flanking)하는 뉴클레오티드 프라이머 쌍을 이용한 중합효소 연쇄 반응(PCR)에 의해, 상기 하나 이상의 다형성 마커를 포함하는 핵산의 세그먼트를 증폭하는 단계를 포함한다. 또 다른 구체예에서, 유전형 분석은 대립인자-특이적 프로브 혼성화, 대립인자-특이적 프라이머 연장(primer extension), 대립인자-특이적 증폭, 핵산 서열결정(nucleic acid sequencing), 5'-엑소뉴클레아제 처리(exonuclease digestion), 분자 표지 분석법(molecular beacon assay), 올리고뉴클레오티드 라이게이션 분석법(oligonucleotide ligation assay), 크기 분석, 및 단일 가닥 구조 분석(single-stranded conformation analysis)으로부터 선택된 방법을 이용하여 수행된다. 하나의 바람직한 구체예에서, 상기 방법은 대립인자-특이적 프로브 혼성화를 포함한다. 또 다른 구체예에서, 상기 방법은 DNA 서열결정을 포함한다. 특히 바람직한 구체예에서, 상기 방법은
1) 상기 핵산의 카피를 검출 올리고뉴클레오티드 프로브 및 인핸서 올리고뉴클레오티드 프로브와, 상기 올리고뉴클레오티드 프로브와 상기 핵산 간의 특이적 혼성화 조건 하에 접촉시키는 단계로서,
a) 상기 검출 올리고뉴클레오티드 프로브는 길이가 5 내지 100개의 뉴클레오티드로 구성되고 서열번호 4, 서열번호 5 또는 서열번호 6에 의해 주어진 뉴클레오티드 서열을 갖는 핵산의 제1 세그먼트에 특이적으로 혼성화되고,
b) 상기 검출 올리고뉴클레오티드 프로브는 3' 말단의 검출가능한 표지 및 5' 말단의 퀀칭 모이어티(quenching moiety)를 포함하며,
c) 상기 인핸서 올리고뉴클레오티드는 길이가 5 내지 100개의 뉴클레오티드로 구성되고 상기 올리고뉴클레오티드 프로브의 5'에 배열된 상기 뉴클레오티드 서열의 제2 세그먼트에 상보적이어서, 상기 두개의 올리고뉴클레오티드가 모두 상기 핵산에 혼성화되는 경우 상기 인핸서 올리고뉴클레오티드는 상기 검출 올리고뉴클레오티드에 대해 3' 에 위치하며, 및
d) 상기 제1 세그먼트와 상기 제2 세그먼트 간에 단일 염기 갭(single base gap)이 존재하여, 상기 올리고뉴클레오티드 프로브와 상기 인핸서 올리고뉴클레오티드 프로브가 모두 상기 핵산에 혼성화되는 경우, 상기 올리고뉴클레오티드 간에 단일 염기 갭이 존재하는 것인 단계,
2) 상기 검출 프로브가 상기 핵산에 혼성화되는 경우, 상기 검출 프로브의 3' 말단으로부터 상기 검출가능한 표지를 절단하여 유리된 검출가능한 표지를 방출시키는 엔도뉴클레아제로 상기 핵산을 처리하는 단계, 및
3) 유리된 검출가능한 표지를 측정하는 단계로서, 상기 유리된 검출가능한 표지의 존재는 상기 검출 프로브가 상기 핵산의 제1 세그먼트에 특이적으로 혼성화되고, 상기 다형성 부위의 서열이 상기 검출 프로브의 상보체(complement)라는 것을 나타내는 것인 단계를 포함한다.
본 발명의 또 다른 양태는 유방암 치료제에 대한 반응의 확률에 대해 개인을 평가하는 방법으로서, 상기 개인으로부터 수득된 핵산 시료에서 하나 이상의 다형성 마커의 하나 이상의 대립인자의 존재 또는 부재를 결정하는 단계를 포함하고, 상기 하나 이상의 다형성 마커는 표 10, 표 15 및 표 19에 표시된 다형성 마커들, 및 이들과 연관 불균형인 마커들로 구성된 군으로부터 선택되고, 상기 하나 이상의 마커의 상기 하나 이상의 대립인자의 존재는 상기 치료제에 대한 양성 반응의 확률을 나타내는 것인 방법에 관한 것이다. 일 구체예에서, 상기 치료제는 화학요법제 또는 호르몬 요법제이다. 일 구체예에서, 상기 호르몬 요법제는 선택적 에스트로겐 수용제 조절제(Selective Estrogen Receptor Modulator) 또는 아로마타아제 저해제(Aromatase inhibitor)이다. 바람직한 구체예에서, 상기 선택적 에스트로겐 수용체 조절제는 타목시펜 및 랄록시펜으로부터 선택된다. 일부 구체예에서, 상기 아로마타아제 저해제는 엑세메스탄(Exemestane), 아나스트로졸(Anastrozole) 및 레트로졸(Letrozole)로부터 선택된다. 다른 구체예에서, 상기 선택적 에스트로겐 수용체 조절제는 아로마타아제 저해제와 조합되어 투여된다.
본 발명의 또 다른 양태는 유방암으로 진단된 개인의 예후(prognosis)를 예측하는 방법으로서, 상기 방법은 상기 개인으로부터 수득된 핵산 시료에서 하나 이상의 다형성 마커의 하나 이상의 대립인자의 존재 또는 부재를 결정하는 단계를 포함하고, 상기 하나 이상의 다형성 마커는 표 10, 표 15 및 표 19에 표시된 다형성 마커들, 및 이들과 연관 불균형인 마커들로 구성된 군으로부터 선택되고, 상기 하나 이상의 대립인자의 존재는 상기 개인에서 유방암의 악화된 예후를 나타내는 것인 방법에 관한 것이다. 상기 개인의 예후는 원칙적으로 이차 종양의 형성, 종양의 급속한 확산, 종양의 등급(단계 0 내지 단계 IV) 및 종양의 재발을 포함하나, 이에 한정되지 않는, 질환의 진행의 특징적인 패턴에 관한 것이다.
본 발명은 또한, 유방암의 치료를 받는 개인의 치료의 진행을 모니터링하는 방법으로서, 상기 방법은 상기 개인으로부터 수득된 핵산 시료에서 하나 이상의 다형성 마커의 하나 이상의 대립인자의 존재 또는 부재를 결정하는 단계를 포함하고, 상기 하나 이상의 다형성 마커는 표 10, 표 15 및 표 19에 표시된 마커들, 및 이들과 연관 불균형인 마커들로부터 선택되고, 상기 하나 이상의 대립인자의 존재가 상기 개인의 치료 결과를 나타내는 것인 방법에 관한 것이다. 치료는 외과수술적 치료, 화학요법 치료, 방산선 치료, 유전자 치료 또는 면역치료 중 하나일 수 있다. 상기 치료는 단독으로 또는 조합되어 이용될 수 있다. 예를 들면, 외과수술적 치료는 화학요법 치료 및/또는 방사선요법 치료로 이어질 수 있다. 상기 개인의 치료 결과는 치료의 완료시 상기 개인의 종양의 진행과 관련된다. 그와 같은 결과의 척도는 종양의 재발율 또는 가능성, 종양의 확산, 및 이차 종양의 형성을 포함하나, 이에 한정되지 않는다.
본 발명의 또 다른 양태는 개인에서 유방암에 대한 감수성을 평가하기 위한 키트로서, 상기 키트는 상기 개인의 게놈에서 하나 이상의 다형성 마커의 하나 이상의 대립인자를 선택적으로 검출하는 시약을 포함하고, 상기 다형성 마커는 표 10, 15 및 19에 표시된 마커들, 및 이들과 연관 불균형인 마커들로부터 선택되고, 상기 하나 이상의 대립인자의 존재는 유방암에 대한 감수성을 나타내는 것인 키트에 관한 것이다. 일 구체예에서, 상기 하나 이상의 다형성 마커는 rs4848543 (서열번호 1), rs3803662 (서열번호 3) 또는 rs13387042 (서열번호 2)이다. 또 다른 양태에서, 상기 시약은 상기 하나 이상의 다형성 마커를 포함하는 상기 개인의 게놈의 단편에 혼성화하는 하나 이상의 연속된(contiguous) 올리고뉴클레오티드, 완충액 및 검출가능한 표지를 포함한다. 또 다른 양태에서, 상기 시약은 상기 개인으로부터 수득된 게놈 핵산 세그먼트의 반대쪽 가닥에 혼성화하는 한 쌍 이상의 올리고뉴클레오티드를 포함하고, 상기 각 올리고뉴클레오티드 프라이머 쌍은 하나의 다형성 마커를 포함하는 상기 개인의 게놈의 단편을 선택적으로 증폭시키도록 설계되고, 상기 단편은 크기가 30 bp 이상이다. 또 다른 구체예에서,상기 하나 이상의 올리고뉴클레오티드는 상기 개인의 게놈에 완전히 상보적이다. 또 다른 구체예에서, 상기 올리고뉴클레오티드는 길이가 18개 내지 50개의 뉴클레오티드로 구성된다. 또 다른 구체예에서, 상기 올리고뉴클레오티드는 길이가 20개 내지 30개의 뉴클레오티드로 구성된다. 바람직한 구체예에서, 상기 키트는:
a. 길이가 5 내지 100개의 뉴클레오티드로 구성된 검출 올리고뉴클레오티드 프로브;
b. 길이가 5 내지 100개의 뉴클레오티드로 구성된 인핸서 올리고뉴클레오티드 프로브; 및
c. 엔도뉴클레아제 효소;를 포함하고,
상기 검출 올리고뉴클레오티드 프로브는 서열번호 4, 서열번호 5 또는 서열번호 6으로 표시된 뉴클레오티드 서열의 핵산의 제1 세그먼트에 특이적으로 혼성화되고; 및
상기 검출 올리고뉴클레오티드 프로브는 3' 말단에 검출가능한 표지를 포함하고 5' 말단에 퀀칭 모이어티(quenching moiety)를 포함하며;
상기 인핸서 올리고뉴클레오티드는 길이가 5개 내지 100개의 뉴클레오티드로 구성되고, 상기 올리고뉴클레오티드 프로브의 5'에 배열된 상기 뉴클레오티드 서열의 제2 세그먼트에 상보적이어서, 상기 인핸서 올리고뉴클레오티드는 상기 두개의 올리고뉴클레오티드가 모두 상기 핵산에 혼성화되는 경우 상기 검출 올리고뉴클레오티드에 대해 3'에 위치하며; 및
상기 제1 세그먼트와 상기 제2 세그먼트 간에 단일 염기 갭이 존재하여, 상기 올리고뉴클레오티드 프로브와 상기 인핸서 올리고뉴클레오티드 프로브가 모두 상기 핵산에 혼성화되는 경우, 상기 올리고뉴클레오티드 간에 단일 염기 갭이 존재하며; 및
상기 핵산을 상기 엔도뉴클레아제에 의해 처리하는 단계는 상기 검출 프로브가 상기 핵산에 혼성화된 경우, 상기 검출 프로브의 3'말단으로부터 상기 검출가능한 표지를 절단하여 유리 상태의 검출가능한 표지를 방출시킨다.
본 발명의 또 다른 양태는 개인에서 유방암에 대한 유전적 지표(genetic indicator)를 결정하는 장치로서,
컴퓨터 판독가능한 메모리; 및
상기 컴퓨터 판독가능한 메모리 상에 저장된 루틴(routine)을 포함하고,
상기 루틴은 표 10, 표 15 및 표 19에 표시된 마커들, 및 이들과 연관 불균형인 마커들로부터 선택되는 하나 이상의 다형성 마커에 대해 하나 이상의 개인의 마커 및/또는 일배체형 데이터를 분석하고, 상기 마커 또는 일배체형 정보에 기반한 결과물(output)을 생성하기 위해 프로세서 상에서 실행되도록 개조되고, 상기 결과물은 상기 개인의 유방암의 유전적 지표로서 상기 하나 이상의 마커 및/또는 일배체형의 위험도 척도(risk measure)를 포함하는 것인 장치에 관한 것이다. 일 구체예에서, 상기 루틴은 상기 하나 이상의 마커 대립인자 및/또는 일배체형과 연관된 유방암의 위험도 척도를 더 포함하고, 상기 위험도 척도는 유방암으로 진단된 복수의 개인에서 하나 이상의 다형성 마커의 하나 이상의 대립인자 또는 하나 이상의 일배체형의 빈도의 지표와 복수의 기준(reference) 개인에서 상기 하나 이상의 다형성 마커의 하나 이상의 대립인자 및/또는 일배체형의 빈도의 지표의 비교에 기반하며, 상기 개인의 개별적인 위험도는 상기 하나 이상의 마커 대립인자 및/또는 일배체형에 대한 상기 개인의 보인자 상태(carrier status)와 상기 하나 이상의 마커 대립인자 및/또는 일배체형에 대한 위험도 척도의 비교에 기반한다. 일 구체예에서, 상기 하나 이상의 다형성 마커는 rs4848543 (서열번호 1), rs3803662 (서열번호 3) 또는 rs13387042 (서열번호 2), 및 이들과 연관 불균형인 마커들로부터 선택된다.
본 발명은 또한, 개인에서 유방암에 대한 감수성을 진단 및/또는 평가하기 위한 시약의 제조에서 올리고뉴클레오티드 프로브의 용도로서, 상기 프로브는 서열번호 4, 서열번호 5 또는 서열번호 6으로 표시된 뉴클레오티드 서열을 갖는 핵산의 세그먼트에 혼성화되고, 상기 프로브는 길이가 15 내지 500개의 뉴클레오티드로 구성되는 것인 용도에 관한 것이다.
본 발명은 또한,
a. 하나 이상의 다형성 마커에 대한 식별자(identifier);
b. 유방암으로 진단된 복수의 개인에서 상기 하나 이상의 다형성 마커의 하나 이상의 대립인자의 빈도의 지표(indicator); 및
c. 복수의 기준 개인(reference individual)에서 상기 하나 이상의 다형성 마커의 상기 하나 이상의 대립인자의 빈도의 지표;가 저장되고,
상기 하나 이상의 다형성 마커는 표 10, 표 15 및 표 19에 표시된 다형성 마커들, 및 이들과 연관 불균형인 다형성 마커들로부터 선택되는 것인 컴퓨터-판독가능한 매체(computer-readable medium)에 관한 것이다.
본 발명의 일부 구체예에서, 상기 개인에서 하나 이상의 일배체형의 빈도가 더 평가되고, 상기 일배체형은 둘 이상의 마커를 포함하며, 상기 하나 이상의 일배체형의 존재는 유방암에 대한 감수성을 나타낸다. 일 구체예에서, 상기 일배체형은 유방암에 대한 위험 일배체형(at-risk haplotype)이고, 즉, 상기 일배체형은 유방암을 발병할 증가된 위험도를 부여한다. 일 구체예에서, 상기 일배체형은 표 7, 표 8, 표 9, 표 13, 표 14 및 표 18에 열거된 일배체형의 군으로부터 선택된다.
본 발명의 또 다른 구체예에서, 상기 하나 이상의 다형성 마커의 하나 이상의 대립인자는 표 9 및 표 13에 열거된 일배체형에 의해 정의된 일배체형 백그라운드(haplotype background)의 군으로부터 선택된 일배체형 백그라운드 상에 존재한다. 또 다른 구체예에서, 본 발명의 방법은 유방암에 대한 고 침투성(high penetrance) 유전적 인자를 분석하는 단계를 더 수행하는 것에 관한 것이다. 일 구체예에서, 그와 같은 고 침투성 유전적 인자는 BRCA2 999del5이다. 최근의 증거는 BRCA1 및 BRCA2 변이와 연관된 위험도가 일부 경우에 가족에서 클러스터링(cluster)된 다른 유전적 인자 또는 환경적 인자에 의해 변형된다는 것을 시사한다(Antoniou, A.C., et al. Am J Hum Genet 2008 Mar 18 (Epub ahead of print)). 따라서, 일부 구체예에서, 본 발명이 속하는 기술 분야의 당업자에게 잘 기록되고 알려진(예를 들면, Breast Cancer Mutation Data Base at: http://research.nhgri.nih.gov/bic/ 참조; 또한, 예를 들면, Fackenthal, J.D. & Olopade, O.I., Nature Reviews Cancer 7:937-48 (2007) 및 상기 문헌에서 인용된 참조문헌 참조), BRCA1 및 BRCA2 유전자에서 발견된 고 침투성 돌연변이와 같은, 유방암에 대한 다른 고 침투성 돌연변이가 평가되고 본 명세서에서 유방암과 연관된 것으로 기재된 변이들과 조합될 수 있다.
본 발명의 일 구체예에서, 에스트로겐 수용체 또는 프로게스테론 수용체 상태에 대해 상기 개인을 평가하는 추가적인 단계가 수행된다. 하나의 그와 같은 구체예에서, 에스트로겐 양성 상태 또는 프로게스테론 양성 상태는 rs13387042 대립인자 A 및 rs3803662 대립인자 T, 및 이들과 연관된 마커들, 예를 들면, 표 15 및 표 19에 표시된 마커들과 연관된 증가된 위험도와 연관된다.
또 다른 양태에서, 본 발명은 이전에 유방암으로 진단되었던 개인에서 하나 이상의 제2 원발성 종양(second primary tumor)을 발병할 위험도를 진단하는 방법으로서, 상기 방법은 상기 개인으로부터 수득된 핵산 시료 또는 개인으로부터 유래된 유전형 데이터세트에서 하나 이상의 다형성 마커의 하나 이상의 대립인자의 존재 또는 부재를 결정하는 단계를 포함하고, 상기 하나 이상의 다형성 마커는 rs4848543 LD 블럭, rs13387042 LD 블럭, 및 rs3803662 LD 블럭과 연관된 마커들의 군으로부터 선택되며, 상기 하나 이상의 대립인자의 존재는 하나 이상의 제2 원발성 종양을 발병할 위험도를 나타내는 것인 방법에 관한 것이다. 일 구체예에서, 상기 하나 이상의 다형성 마커는 표 10, 표 15 및 표 19 중 하나에 표시된 마커들로부터 선택된다. 또 다른 구체예에서, 상기 하나 이상의 마커는 rs4848543 LD 블럭과 연관된다. 일 구체예에서, 상기 하나 이상의 다형성 마커는 표 10, 표 15, 표 19, 표 20, 표 21 및 표 22에 열거된 다형성 마커들, 및 이들과 연관 불균형인 마커들로 구성된 군으로부터 선택된다. 또 다른 구체예에서, 상기 하나 이상의 다형성 마커는 마커 rs4848543과, 0.2보다 큰 r2 값에 의해 정의된 강한 연관 불균형인 마커들의 군으로부터 선택된다. 또 다른 구체예에서, 상기 하나 이상의 다형성 마커는 표 7, 표 8 및 표 10에 열거된 마커들의 군으로부터 선택된다. 또 다른 구체예에서, 상기 하나 이상의 다형성 마커는 표 10에 표시된 마커들로부터 선택된다. 또 다른 구체예에서, 상기 하나 이상의 다형성 마커는 STEAP3/TSAP6 유전자와 연관된다. 바람직한 구체예에서, 상기 마커는 rs4848543이다. 다른 구체예에서, 상기 개인에서 하나 이상의 일배체형의 빈도를 평가하는 추가적인 단계가 수행된다. 일 구체예에서, 이 하나 이상의 일배체형은 표 7, 표 8 및 표 9에 열거된 일배체형의 군으로부터 선택된다. 다른 구체예에서, BRCA2 999del5와 같은, 유방암에 대한 고 침투성 유전적 인자가 또한 평가된다.
일부 구체예에서, 본 명세서에 기재된 바와 같은 본 발명에 다른 유방암 표현형은 모든 유방암(All Breast Cancer), 다발성 원발성 유방암(Multiple Primary Breast Cancer), 조기 발병 유방암(early onset Breast Cancer) 또는 유방암을 정의하는 다른 의학적으로 인정되는 진단 방법에 의해 정의된 유방암으로부터 선택될 수 있다. 또 다른 구체예에서, FHS(summed family history)가 유방암과 연관된 표현형이다.
본 명세서에 기재된 바와 같은, 본 발명의 방법, 용도, 키트, 또는 장치의 특정한 구체예에서, 평가대상 개인은 여성이다.
본 명세서에서 유방암에 대한 감수성을 검출하기 위해 유용한 것으로 개시된 마커들은 모두 본 명세서에 기재된 다양한 방법, 키트, 장치 및 용도에서 이용될 수 있다. 따라서, 일부 구체예에서, 본 발명을 실시하기 위해 유용한 하나 이상의 다형성 마커는 표 20, 표 21 및 표 22에 열거된 다형성 마커들, 및 이들과 연관 불균형인 마커들로 구성된 군으로부터 선택될 수 있다. 또 다른 구체예에서, 상기 하나 이상의 다형성 마커는 표 10, 표 15 및 표 19에 열거된 마커들, 및 이들과 연관 불균형인 마커들의 군으로부터 선택된다. 일부 구체예에서, 상기 하나 이상의 다형성 마커는 서열번호 4, 서열번호 5 및 서열번호 6 중 하나에 표시된 서열을 갖는 게놈 세그먼트 내에 위치한다. 하나의 바람직한 구체예에서, 상기 서열번호 4 내의 하나 이상의 마커는 표 20에 표시된 마커들로부터 선택된다. 또 다른 바람직한 구체예에서, 상기 서열번호 5 내의 하나 이상의 마커는 표 21에 표시된 마커들로부터 선택된다. 또 다른 바람직한 구체예에서, 상기 서열번호 6 내의 하나 이상의 마커는 표 22에 표시된 마커들로부터 선택된다. 또 다른 구체예에서, 상기 하나 이상의 다형성 마커는 표 7, 8, 10, 14, 15, 18 및 19에 열거된 마커들의 군으로부터 선택된다. 또 다른 구체예에서, 상기 하나 이상의 다형성 마커는 rs4848543 (서열번호 1), rs3803662 (서열번호 3) 또는 rs13387042 (서열번호 2)와, 0.2보다 큰 r2의 값에 의해 정의된 강한 연관 불균형인 마커들의 군으로부터 선택된다. 바람직한 구체예에서, 상기 하나 이상의 다형성 마커는 rs4848543 (서열번호 1), rs3803662 (서열번호 3) 및 rs13387042 (서열번호 2)로부터 선택된다. 또 다른 바람직한 구체예에서, 상기 하나 이상의 다형성 마커는 rs4848543 (서열번호 1)이다. 또 다른 바람직한 구체예에서, 상기 하나 이상의 다형성 마커는 rs3803662 (서열번호 3)이다. 또 다른 바람직한 구체예에서, 상기 하나 이상의 다형성 마커는 rs13387042 (서열번호 2)이다. 또 다른 구체예에서, 상기 하나 이상의 다형성 마커는 STEAP3/TSAP6 유전자, LOC643714 유전자, 및/또는 TNRC9 유전자와 연관된다(즉, 연관 불균형이다). 하나의 그와 같은 구체예에서, 상기 하나의 다형성 마커는 STEAP3/TSAP6 유전자, LOC643714 유전자, 및/또는 TNRC9 유전자 내에 위치한다. 또 다른 바람직한 구체예에서, 상기 하나 이상의 다형성 마커는 rs4848543, rs13387042, rs3803662, rs12922061, rs4784227 및 rs17271951로부터 선택된다.
본 발명의 특정한 방법, 용도, 키트 또는 장치에서, 하나 이상의 대립인자 또는 일배체형의 존재는 유방암에 대한 증가된 감수성을 나타낸다. 본 발명의 다른 방법에서, 하나 이상의 대립인자 또는 일배체형의 존재는 유방암에 대한 감소된 감수성을 나타낸다. 일 구체예에서, 유방암에 대한 증가된 감수성은 하기로 구성된 일배체형 백그라운드의 군으로부터 선택된 일배체형 백그라운드 상에 존재한다:
(i) rs8955398 대립인자 2, rs4848543 대립인자 1, rs6759589 대립인자 1, rs838066 대립인자 2, rs838100 대립인자 3, rs838086 대립인자 1, rs12711924 대립인자 1 및 rs3731603 대립인자 4;
(ii) rs8955398 대립인자 4, rs4848543 대립인자 1, rs6759589 대립인자 1, rs838066 대립인자 2, rs838100 대립인자 3, rs838086 대립인자 1, rs12711924 대립인자 1 및 rs3731603 대립인자 4;
(iii) rs8955398 대립인자 4, rs4848543 대립인자 1, rs6759589 대립인자 1, rs838066 대립인자 2, rs838100 대립인자 3, rs838086 대립인자 2, rs12711924 대립인자 1 및 rs3731603 대립인자 4;
(iv) rs8955398 대립인자 2, rs4848543 대립인자 1, rs6759589 대립인자 1, rs838066 대립인자 2, rs838100 대립인자 3, rs838086 대립인자 2, rs12711924 대립인자 1 및 rs3731603 대립인자 3;
(v) rs8955398 대립인자 4, rs4848543 대립인자 1, rs6759589 대립인자 1, rs838066 대립인자 2, rs838100 대립인자 3, rs838086 대립인자 1, rs12711924 대립인자 1 및 rs3731603 대립인자 3;
(vi) rs8955398 대립인자 2, rs4848543 대립인자 1, rs6759589 대립인자 1, rs838066 대립인자 2, rs838100 대립인자 3, rs838086 대립인자 1, rs12711924 대립인자 1 및 rs3731603 대립인자 4.
또 다른 구체예에서, 유방암에 대한 증가된 감수성은 하기로 구성된 일배체형 백그라운드의 군으로부터 선택된 일배체형 백그라운드 상에 존재한다:
(i) rs10191184 대립인자 3, rs6435957 대립인자 4, rs10171745 대립인자 3, rs6716542 대립인자 1, rs4491709 대립인자 4, rs12621130 대립인자 1, rs6735174 대립인자 1, rs6435959 대립인자 2, rs2372943 대립인자 3, rs13387042 대립인자 1, rs10490444 대립인자 1, rs13011060 대립인자 3;
(ii) rs10191184 대립인자 3, rs6435957 대립인자 4, rs10171745 대립인자 3, rs6716542 대립인자 3, rs4491709 대립인자 4, rs12621130 대립인자 1, rs6735174 대립인자 2, rs6435959 대립인자 4, rs2372943 대립인자 3, rs13387042 대립인자 1, rs10490444 대립인자 3, rs13011060 대립인자 3;
(iii) rs10191184 대립인자 3, rs6435957 대립인자 2, rs10171745 대립인자 3, rs6716542 대립인자 3, rs4491709 대립인자 4, rs12621130 대립인자 1, rs6735174 대립인자 2, rs6435959 대립인자 4, rs2372943 대립인자 3, rs13387042 대립인자 1, rs10490444 대립인자 3, rs13011060 대립인자 3;
(iv) rs10191184 대립인자 3, rs6435957 대립인자 4, rs10171745 대립인자 3, rs6716542 대립인자 3, rs4491709 대립인자 4, rs12621130 대립인자 1, rs6735174 대립인자 1, rs6435959 대립인자 2, rs2372943 대립인자 3, rs13387042 대립인자 1, rs10490444 대립인자 3, rs13011060 대립인자 3;
(v) rs10191184 대립인자 3, rs6435957 대립인자 4, rs10171745 대립인자 1, rs6716542 대립인자 3, rs4491709 대립인자 2, rs12621130 대립인자 1, rs6735174 대립인자 1, rs6435959 대립인자 2, rs2372943 대립인자 3, rs13387042 대립인자 1, rs10490444 대립인자 1, rs13011060 대립인자 3;
(vi) rs10191184 대립인자 3, rs6435957 대립인자 4, rs10171745 대립인자 3, rs6716542 대립인자 3, rs4491709 대립인자 4, rs12621130 대립인자 1, rs6735174 대립인자 2, rs6435959 대립인자 4, rs2372943 대립인자 3, rs13387042 대립인자 1, rs10490444 대립인자 3, rs13011060 대립인자 1;
(vii) rs10191184 대립인자 3, rs6435957 대립인자 4, rs10171745 대립인자 3, rs6716542 대립인자 1, rs4491709 대립인자 4, rs12621130 대립인자 1, rs6735174 대립인자 1, rs6435959 대립인자 2, rs2372943 대립인자 3, rs13387042 대립인자 1, rs10490444 대립인자 1, rs13011060 대립인자 1;
(viii) rs10191184 대립인자 3, rs6435957 대립인자 2, rs10171745 대립인자 3, rs6716542 대립인자 1, rs4491709 대립인자 4, rs12621130 대립인자 1, rs6735174 대립인자 1, rs6435959 대립인자 2, rs2372943 대립인자 3, rs13387042 대립인자 1, rs10490444 대립인자 1, rs13011060 대립인자 3;
(ix) rs10191184 대립인자 3, rs6435957 대립인자 4, rs10171745 대립인자 3, rs6716542 대립인자 1, rs4491709 대립인자 4, rs12621130 대립인자 1, rs6735174 대립인자 1, rs6435959 대립인자 2, rs2372943 대립인자 3, rs13387042 대립인자 1, rs10490444 대립인자 3, rs13011060 대립인자 1;
(x) rs10191184 대립인자 3, rs6435957 대립인자 2, rs10171745 대립인자 3, rs6716542 대립인자 3, rs4491709 대립인자 4, rs12621130 대립인자 1, rs6735174 대립인자 1, rs6435959 대립인자 2, rs2372943 대립인자 3, rs13387042 대립인자 1, rs10490444 대립인자 1, rs13011060 대립인자 3.
하나의 바람직한 구체예에서, 상기 유방암의 증가된 위험도를 부여하는 하나 이상의 대립인자 또는 일배체형은 rs4848543 대립인자 1이다. 또 다른 구체예에서, 증가된 위험도는 1.25 이상의 위험도, 1.3 이상의 위험도, 1.4 이상의 위험도, 1.5 이상의 위험도, 1.6 이상의 위험도, 1.7 이상의 위험도, 및 2.0 이상의 위험도를 포함한, 1.2 이상의 상대적 위험도 또는 오즈비를 특징으로 한다.
본 발명의 일부 구체예에서, 상기 하나 이상의 대립인자 또는 일배체형의 존재는 유방암에 대한 감수된 감수성(감소된 위험도)을 나타낸다. 상기 하나 이상의 대립인자 또는 일배체형은 예를 들면, 1 미만의 상대적 위험도(relative risk, RR) 또는 오즈비(odds ratio, OR)를 갖는 표 8, 9, 13, 14 및 18에 열거된 마커 대립인자 및 일배체형의 군으로부터 선택될 수 있다. 일 구체예에서, 상기 유방암에 대한 감소된 감수성을 나타내는 하나 이상의 대립인자는 하기로 구성된 일배체형 백그라운드의 군으로부터 선택된 일배체형 백그라운드 상에 존재한다:
(i) rs895398 대립인자 2, rs4848543 대립인자 2, rs6759589 대립인자 3, rs838066 대립인자 4, rs838100 대립인자 1, rs838086 대립인자 1, rs12711924 대립인자 3 및 rs3731603 대립인자 3;
(ii) rs895398 대립인자 2, rs4848543 대립인자 2, rs6759589 대립인자 3, rs838066 대립인자 2, rs838100 대립인자 1, rs838086 대립인자 1, rs12711924 대립인자 3 및 rs3731603 대립인자 3;
(iii) rs895398 대립인자 2, rs4848543 대립인자 2, rs6759589 대립인자 1, rs838066 대립인자 2, rs838100 대립인자 3, rs838086 대립인자 2, rs12711924 대립인자 3 및 rs3731603 대립인자 3;
(iv) rs895398 대립인자 2, rs4848543 대립인자 2, rs6759589 대립인자 3, rs838066 대립인자 4, rs838100 대립인자 3, rs838086 대립인자 2, rs12711924 대립인자 3 및 rs3731603 대립인자 3;
(v) rs895398 대립인자 2, rs4848543 대립인자 2, rs6759589 대립인자 3, rs838066 대립인자 2, rs838100 대립인자 3, rs838086 대립인자 2, rs12711924 대립인자 3 및 rs3731603 대립인자 3;
(vi) rs895398 대립인자 2, rs4848543 대립인자 2, rs6759589 대립인자 1, rs838066 대립인자 2, rs838100 대립인자 3, rs838086 대립인자 1, rs12711924 대립인자 1 및 rs3731603 대립인자 4;
(vii) rs895398 대립인자 2, rs4848543 대립인자 2, rs6759589 대립인자 3, rs838066 대립인자 4, rs838100 대립인자 3, rs838086 대립인자 1, rs12711924 대립인자 1 및 rs3731603 대립인자 4;
(viii) rs895398 대립인자 2, rs4848543 대립인자 2, rs6759589 대립인자 1, rs838066 대립인자 2, rs838100 대립인자 3, rs838086 대립인자 1, rs12711924 대립인자 3 및 rs3731603 대립인자 3; 및
(ix) rs895398 대립인자 2, rs4848543 대립인자 2, rs6759589 대립인자 3, rs838066 대립인자 2, rs838100 대립인자 1, rs838086 대립인자 1, rs12711924 대립인자 1 및 rs3731603 대립인자 4.
또 다른 구체예에서, 유방암에 대한 감소된 감수성은 하기로 구성된 일배체형 백그라운드의 군으로부터 선택된 일배체형 백그라운드 상에 존재한다:
(i) rs10191184 대립인자 3, rs6435957 대립인자 2, rs10171745 대립인자 3, rs6716542 대립인자 3, rs4491709 대립인자 2, rs12621130 대립인자 3, rs6735174 대립인자 1, rs6435959 대립인자 2, rs2372943 대립인자 3, rs13387042 대립인자 3, rs10490444 대립인자 1, rs13011060 대립인자 3;
(ii) rs10191184 대립인자 3, rs6435957 대립인자 4, rs10171745 대립인자 3, rs6716542 대립인자 3, rs4491709 대립인자 4, rs12621130 대립인자 1, rs6735174 대립인자 1, rs6435959 대립인자 4, rs2372943 대립인자 1, rs13387042 대립인자 3, rs10490444 대립인자 3, rs13011060 대립인자 1;
(iii) rs10191184 대립인자 1, rs6435957 대립인자 4, rs10171745 대립인자 3, rs6716542 대립인자 3, rs4491709 대립인자 4, rs12621130 대립인자 1, rs6735174 대립인자 1, rs6435959 대립인자 4, rs2372943 대립인자 1, rs13387042 대립인자 3, rs10490444 대립인자 3, rs13011060 대립인자 1;
(iv) rs10191184 대립인자 3, rs6435957 대립인자 2, rs10171745 대립인자 3, rs6716542 대립인자 3, rs4491709 대립인자 2, rs12621130 대립인자 3, rs6735174 대립인자 1, rs6435959 대립인자 2, rs2372943 대립인자 3, rs13387042 대립인자 3, rs10490444 대립인자 1, rs13011060 대립인자 1;
(v) rs10191184 대립인자 1, rs6435957 대립인자 2, rs10171745 대립인자 1, rs6716542 대립인자 3, rs4491709 대립인자 2, rs12621130 대립인자 1, rs6735174 대립인자 1, rs6435959 대립인자 2, rs2372943 대립인자 3, rs13387042 대립인자 3, rs10490444 대립인자 3, rs13011060 대립인자 3;
(vi) rs10191184 대립인자 3, rs6435957 대립인자 4, rs10171745 대립인자 3, rs6716542 대립인자 3, rs4491709 대립인자 4, rs12621130 대립인자 1, rs6735174 대립인자 1, rs6435959 대립인자 4, rs2372943 대립인자 1, rs13387042 대립인자 3, rs10490444 대립인자 3, rs13011060 대립인자 3;
(vii) rs10191184 대립인자 1, rs6435957 대립인자 2, rs10171745 대립인자 3, rs6716542 대립인자 3, rs4491709 대립인자 4, rs12621130 대립인자 1, rs6735174 대립인자 1, rs6435959 대립인자 4, rs2372943 대립인자 1, rs13387042 대립인자 3, rs10490444 대립인자 3, rs13011060 대립인자 1;
(viii) rs10191184 대립인자 3, rs6435957 대립인자 4, rs10171745 대립인자 3, rs6716542 대립인자 3, rs4491709 대립인자 4, rs12621130 대립인자 1, rs6735174 대립인자 1, rs6435959 대립인자 2, rs2372943 대립인자 3, rs13387042 대립인자 3, rs10490444 대립인자 1, rs13011060 대립인자 3;
(ix) rs10191184 대립인자 3, rs6435957 대립인자 2, rs10171745 대립인자 3, rs6716542 대립인자 3, rs4491709 대립인자 2, rs12621130 대립인자 1, rs6735174 대립인자 1, rs6435959 대립인자 2, rs2372943 대립인자 3, rs13387042 대립인자 3, rs10490444 대립인자 1, rs13011060 대립인자 3;
(x) rs10191184 대립인자 1, rs6435957 대립인자 2, rs10171745 대립인자 3, rs6716542 대립인자 3, rs4491709 대립인자 2, rs12621130 대립인자 3, rs6735174 대립인자 1, rs6435959 대립인자 2, rs2372943 대립인자 3, rs13387042 대립인자 3, rs10490444 대립인자 1, rs13011060 대립인자 3;
(xi) rs10191184 대립인자 3, rs6435957 대립인자 4, rs10171745 대립인자 3, rs6716542 대립인자 3, rs4491709 대립인자 4, rs12621130 대립인자 1, rs6735174 대립인자 1, rs6435959 대립인자 4, rs2372943 대립인자 3, rs13387042 대립인자 3, rs10490444 대립인자 3, rs13011060 대립인자 1.
일부 구체예에서, 감소된 감수성은 0.8 미만의 위험도, 0.7 미만의 위험도, 0.6 미만의 위험도, 및 0.5 미만의 위험도를 포함한, 0.9 미만의 위험도(상대적 위험도 또는 오즈비)를 특징으로 한다.
원칙적으로, 본 명세서에서 유방암과 연관된 것으로 확인된 마커 및 일배체형의 평가는 표 10, 표 15 및 표 19에 표시된 마커들 중 하나와 연관 불균형이 아닌, 유방암에 대한 하나 이상의 위험 변이의 하나 이상의 위험 대립인자의 존재 또는 부재에 대해 개인으로부터 수득된 게놈 DNA를 포함하는 시료 또는 개인으로부터 유래된 유전형 데이터세트를 분석하는 것과 조합될 수 있다. 다시 말하면, 본 명세서에 기재된 위험 인자들 중 어느 것과도 연관되지 않은 유전적 위험 인자들은 복수의 위험 인자에 기반하여 개인에 대한 전체 위험도(overall risk)에 대한 추정값을 수득하기 위해, 본 발명의 위험 인자들과 조합될 수 있다. 또한, 전체 통합 위험도(overall combined risk)를 수득하기 위해, 본 명세서에서 유방암과 연관된 것으로 개시된 두개 이상의 위험 인자의 분석이 통합될 수 있다. 하나의 그와 같은 구체예에서, 개인 또는 개인으로부터 유래된 시료에 대해 rs4848543 (서열번호 1), rs3803662 (서열번호 3) 및 rs13387042 (서열번호 2)의 분석이 수행되고, 전체 위험도 분석이 수행된다. 또 다른 구체예에서, rs3803662 (서열번호 3) 및 rs13387042 (서열번호 2)의 분석이 수행된다.
일부 구체예에서, 본 발명의 방법, 용도, 키트 및 장치는 상기 개인의 위험도 평가, 진단, 또는 예후의 판단을 수행하기 위해 비-유전적 정보(non-genetic information)를 분석하는 단계를 더 포함할 수 있다. 일부 구체예에서, 그와 같은 비-유전적 정보는 연령, 성별, 민족, 사회경제적 지위, 과거 질병 진단, 개인의 병력(medical history), 유방암의 가족력(family history), 생화학적 척도, 및/또는 임상적 척도를 포함한다. 유전적 인자 및 비-유전적 인자에 대한 통합 위험도(combined risk)는 본 발명이 속하는 기술 분야의 당업자에게 공지된 방법을 이용하여 수득될 수 있다.
본 발명의 특정한 구체예에서, 유전적 세그먼트(예를 들면, 마커) 간의 연관 불균형(linkage disequilibrium, LD)은 연관 불균형 척도의 특정한 값을 특징으로 한다. 본 명세서에서 더 설명되는 바와 같이, 연관 불균형은 LD 척도 r2 및 |D'|의 특정한 수치값을 특징으로 할 수 있다. 하나의 바람직한 구체예에서, 연관 불균형은 0.1보다 큰 r2값을 특징으로 한다. 또 다른 바람직한 구체예에서, 연관 불균형은 0.2보다 큰 r2값을 특징으로 한다. 0.3, 0.4, 0.5, 0.6, 0.7, 0.8, 0.9, 0.95, 0.96, 0.97, 0.98, 0.99를 포함하나, 이에 한정되지 않는, r2에 대한 다른 컷오프 값도 가능하다. 또 다른 바람직한 구체예에서, 연관 불균형은 0.5보다 큰 |D'| 값을 특징으로 한다. 또 다른 바람직한 구체예에서, 연관 불균형은 0.8보다 큰 |D'| 값을 특징으로 한다. 0.2, 0.3, 0.4, 0.6, 0.7, 0.8, 0.9, 0.95, 0.96, 0.97, 0.98 및 0.99를 포함하나, 이에 한정되지 않는, |D'|에 대한 다른 컷오프 값도 가능하다. 일부 구체예에서, 연관 불균형은 |D'| 또는 r2에 대한 수치 컷오프 값을 특징으로 한다. 하나의 그와 같은 구체예에서, 연관 불균형은 0.8보다 큰 |D'| 또는 0.2보다 큰 r2의 수치 컷오프 값, 또는 양자 모두를 특징으로 한다. 일부 구체예에서, LD는 특정한 집단에서 결정된다. 일부 그와 같은 구체예에서, 상기 집단은 코카서스계 집단, 중국계 집단, 일본계 집단, 및 아프리카계 집단으로부터 선택된다. 특정한 그와 같은 구체예에서, 상기 집단은 코카서스계 집단, 중국계 집단, 일본계 집단, 및 아프리카계 집단으로부터 선택된다. 일 구체예에서, 상기 집단은 코카서스계 CEPH 집단이다.
본 발명의 방법, 용도, 장치 또는 키트의 특정한 다른 구체예에서, 개체는 특정한 인간 선조(ancestry)로부터 유래한다. 일 구체예에서, 상기 선조는 블랙 아프리카계 선조, 코카서스계 선조 및 중국계 선조로부터 선택된다. 또 다른 구체예에서, 상기 선조는 블랙 아프리카계 선조이다. 또 다른 구체예에서, 상기 선조는 아프리카계 미국인 선조이다. 또 다른 구체예에서, 상기 선조는 유럽계 선조이다. 또 다른 구체예에서, 상기 선조는 코카서스계 선조이다. 특정한 구체예에서, 상기 선조는 유전적 분석 또는 유전형분석을 받는 개인에 의해 자가-보고된다. 다른 구체예에서, 상기 선조는 개인으로부터의 핵산 시료에서 하나 이상의 다형성 마커의 하나 이상의 대립인자를 검출하는 단계를 포함하고, 상기 대립인자의 존재 또는 부재는 상기 개인의 선조를 나타내는 것인 유전적 결정(genetic determination)에 의해 결정된다.
발명의 상세한 설명
하기에서 본 발명의 바람직한 구체예가 설명된다.
본 발명은 유방암과 연관된 것으로 확인된 다형성 변이 및 일배체형을 개시한다. 일정한 다형성 마커(예를 들면, 마커 rs4848543, 마커 rs13387042 및 마커 rs3803662, 및 이들과 연관 불균형인 마커들, rs4848543 LD 블럭, rs13387042 LD 블럭, 및 rs3803662 LD 블럭과 연관된 마커들, 예를 들면, 표 10, 표 15, 표 19, 표 20, 표 21 및 표 22의 마커들, 예를 들면, 표 10, 표 15 및 표 19에 열거된 마커들)에서의 특정한 대립인자 및 그와 같은 대립인자를 포함하는 일배체형이 유방암과 연관된 것으로 확인되었다. 본 명세서에서 보다 상세하게 설명되는 바와 같이, 그와 같은 마커 및 일배체형은 유방암의 위험 관리를 위해 유용하다. 본 발명의 추가적인 응용은 이 마커들의 특정한 대립인자의 존재 또는 부재를 평가하기 위한 키트를 포함한다.
정의
달리 표시되지 않으면, 핵산 서열은 5'에서 3' 방향으로 좌측에서 우측으로 기재된다. 명세서 내에 기재된 수치 범위는 그 범위를 한정하는 수치를 포함하며 정의된 범위 내의 각 정수 또는 비-정수 분수(non-integer fraction)를 포함한다. 달리 정의되지 않으면, 본 명세서에서 사용된 모든 기술 용어 및 과학 용어는 본 발명이 속하는 기술 분야의 통상적인 기술자에 의해 일반적으로 이해되는 것과 동일한 의미를 갖는다.
본 발명에서, 하기의 용어들은 표시된 바와 같은 의미를 갖는다:
본 명세서에 기재된 바와 같이, 종종 "마커(marker)"로 불리는, "다형성 마커(polymorphic marker)"는 게놈 다형성 부위(genomic polymorphic site)를 의미한다. 각 다형성 마커는 다형성 부위에서 특정한 대립인자에 특징적인 두 개 이상의 서열 변이를 갖는다. 따라서, 다형성 마커에 대한 유전적 연관(genetic association)은 특정한 다형성 마커의 하나 이상의 특정한 대립인자에 대해 연관이 있다는 것을 의미한다. 마커는 SNP(single nucleotide polymorphism), 마이크로새틀라이트(microsatellite), 삽입, 결실, 중복 및 전위(translocation)를 포함한, 게놈에서 발견되는 임의의 변이 형태의 대립인자를 포함할 수 있다.
"대립인자(allele)"는 염색체 상에 있는 주어진 유전자 좌(위치)의 뉴클레오티드 서열을 의미한다. 다형성 마커 대립인자는 따라서, 염색체 상의 마커의 조성(즉, 서열)을 의미한다. 개인으로부터의 게놈 DNA는 각 염색체 상의 마커의 각 카피를 대표하는, 임의의 주어진 다형성 마커에 대해 두 개의 대립인자(예를 들면, 대립인자-특이적 서열)를 포함한다. 본 명세서에서 사용된 뉴클레오티드에 대한 서열 코드는 A = 1, C = 2, G = 3, T = 4이다. 마이크로새틀라이트 대립인자(microsatellite allele)의 경우, CEPH 표본(Centre d'Etudes du Polymorphisme Humain, genomics repository, CEPH sample 1347-02)이 기준으로 이용되고, 이 표본에서 각 마이크로새틀라이트의 보다 짧은 대립인자는 0으로 설정되고 다른 표본에서 모든 다른 대립인자는 이 기준에 대비하여 번호가 부여된다. 따라서, 예를 들면, 대립인자 1은 CEPH 표본에서의 보다 짧은 대립인자보다 1 bp 더 길고, 대립인자 2는 CEPH 표본에서의 보다 짧은 대립인자보다 2 bp 더 길며, 대립인자 3은 CEPH 표본에서의 보다 짧은 대립인자보다 3 bp 더 길며, 대립인자 -1은 CEPH 표본에서의 보다 짧은 대립인자보다 1 bp 더 짧고, 대립인자 -2는 CEPH 표본에서의 보다 짧은 대립인자보다 2 bp 더 짧다.
본 명세서에 기재된 서열 코뉴클레오티드 중의성(sequence conucleotide ambiguity)은 IUPAC-IUB에 의해 제안된 바와 같다. 이 코드들은 EMBL, GenBank, 및 PIR 데이터베이스에 의해 사용된 코드들과 양립될 수 있다.
IUB 코드 의미
A 아데노신
C 시티딘
G 구아닌
T 티미딘
R G 또는 A
Y T 또는 C
K G 또는 T
M A 또는 C
S G 또는 C
W A 또는 T
B C G 또는 T
D A G 또는 T
H A C 또는 T
V A C 또는 G
N A C G 또는 T (임의의 염기)
집단(자연 집단 또는 인위적 집단, 예를 들면, 합성 분자들의 라이브러리) 내에서 하나 이상의 서열이 가능한 뉴클레오티드 위치가 본 명세서에서 "다형성 부위(polymorphic site)"로 지칭된다.
"단일 뉴클레오티드 다형성(Single Nucleotide Polymorphism)" 또는 "SNP"는 게놈의 특정한 위치에 있는 단일 뉴클레오티드가 종의 멤버 간에 또는 개체 내에서 쌍을 이루는 염색체 간에 상이할 때 나타나는 DNA 서열 변이이다. 대부분의 SNP 다형성은 두 개의 대립인자를 갖는다. 각 개체는 이 경우, 상기 다형성의 하나의 대립인자에 대해 동형접합(즉, 개체의 두 개의 염색체 카피 모두 SNP 위치에서 동일한 뉴클레오티드를 가짐)이거나, 또는 개체는 이형접합이다(즉, 상기 개체의 두 개의 자매 염색체(sister nucleotide)가 상이한 뉴클레오티드를 포함함). 본 명세서에서 보고된 바와 같이, SNP 명명은 NCBI(the National Center for Biotechnological Information)에 의해 각각의 독특한 SNP에 부여된 공식적인 기준 SNP(Reference SNP, rs) ID 식별 택(tag)을 의미한다.
본 명세서에 기재된 "변이(variant)"는 기준(reference) DNA와 상이한 DNA의 세그먼트를 의미한다. 본 명세서에서 정의된 "마커(marker)" 또는 "다형성 마커(polymorphic marker)"는 변이이다. 기준과 상이한 대립인자(allele)는 "변이" 대립인자로 지칭된다.
"마이크로새틀라이트(microsatellite)"는 특정한 부위에 있는 길이가 2 내지 8개의 뉴클레오티드로 구성된 염기의 작은 반복체(repeat)(예를 들면, CA 반복체)를 복수 개 갖는 다형성 마커이며, 전체 집단에서 반복체 길이의 수는 변한다.
"indel"은 통상적으로 단지 수개의 뉴클레오티드로 구성된 길이의 작은 삽입 또는 결실을 포함하는 다형성의 일반적인 형태이다.
본 명세서에 기재된, "일배체형(haplotype)"은 세그먼트를 따라 배열된 대립인자의 특정한 조합을 특징으로 하는 DNA의 하나의 가닥 내에 있는 게놈 DNA의 세그먼트를 의미한다. 인간과 같은 이배체(diploid) 개체의 경우, 일배체형은 각 다형성 마커 또는 유전자 좌에 대해 대립인자의 쌍 중 하나의 대립인자(one member)를 포함한다. 특정한 구체예에서, 일배체형은 두개 이상의 대립인자, 세개 이상의 대립인자, 네개 이상의 대립인자, 또는 다섯개 이상의 대립인자를 포함할 수 있다. 본 명세서에서 일배체형은 마커 명칭 및 상기 마커의 대립인자로 기재되며, 예를 들면, 일배체형 "1 rs4848543" 또는 "1-rs4848543"은 마커 rs4848543의 대립인자 1(대립인자 A)이 일배체형에 있다는 것을 의미하고, "rs4848543 대립인자 1(rs4848543 allele 1)" 또는 "rs4848543 대립인자 A(rs4848543 allele A)"와 동등하다. 또한, 일배체형에서 대립인자 코드는 개별적인 마커에 대한 것과 같고, 즉, 1 = A, 2 = C, 3 = G 및 4 = T이다.
본 명세서에 기재된 용어 "감수성(susceptibility)"은 개체(또는 개체들의 군)이 평균 개체들보다 유방암을 발병하는 경향이 있거나, 또는 유방암 발병에 저항할 수 있는 능력이 더 약한 것을 의미한다. 상기 용어는 증가된 감수성 및 감소된 감수성을 모두 포함한다. 따라서, 본 발명의 다형성 마커의 특정한 대립인자 및/또는 일배체형은 1보다 큰 상대적 위험도(RR) 또는 오즈비(OR)를 특징으로 하는, 유방암의 증가된 감수성(즉, 증가된 위험도)을 특징으로 할 수 있다. 대안적으로, 본 발명의 마커 및/또는 일배체형은 1 미만의 상대적 위험도 또는 오즈비를 특징으로 하는, 유방암의 감소된 감수성(즉, 감소된 위험도)을 특징으로 한다.
용어 "및/또는"은 본 명세서에서 상기 용어에 의해 연결된 항목들 중 하나 또는 양자 모두가 포함된다는 것을 나타내는 것으로 이해될 것이다. 바꾸어 말하면, 본 명세서에서 상기 용어는 "하나 또는 그 나머지 또는 양자 모두(one or the other or both)"를 의미하는 것으로 이해될 것이다.
연관된 유전적 요소(유전자 및/또는 마커)와 관련하여, 용어 "연관된(associated with)"은 상기 요소들이 연관 불균형 상태에 있다는 것을 의미한다. 바람직하게는, 상기 용어는 상기 요소들이 0.2 보다 큰 연관 불균형 척도 r2 값에 의해 결정된 연관 불균형 상태에 있다는 것을 의미하는 것으로 이해될 것이다.
본 명세서에서 사용된 용어 "참조표(look-up table)"는 하나의 형태의 데이터를 또 다른 형태와 상관시키거나, 또는 하나 이상의 형태의 데이터를 상기 데이터가 관련된 예상되는 결과, 예를 들면, 표현형 또는 성향과 상관시키는 표이다. 예를 들면, 참조표는 하나 이상의 다형성 마커에 대한 대립인자 데이터와, 특정한 대립인자 데이터를 포함하는 개체가 표시할 것 같거나, 또는 그 특정한 대립인자 데이터를 갖지 않는 개인보다 표시할 가능성이 더 높은, 특정한 질병 진단과 같은 특정한 성향 또는 표현형 간의 상관관계를 포함할 수 있다. 참조표는 다면적(multidimensional)일 수 있고, 즉, 참조표는 단일 마커들에 대한 복수 개의 대립인자에 대한 정보를 동시에 포함할 수 있거나, 또는 그들은 복수 개의 마커들에 대한 정보를 포함할 수 있고, 그들은 또한 질병 진단에 대한 세부사항, 인종 정보, 바이오마커, 생화학적 측정값, 치료적 방법, 또는 약물 등과 같은 다른 인자들을 포함할 수 있다.
"컴퓨터-판독가능한 매체(computer-readable medium)"는 상업적으로 구매가능하거나 또는 맞춤-제작된(custom-made) 인터페이스를 이용하여 컴퓨터에 의해 접근될 수 있는 정보 저장 매체이다. 대표적인 컴퓨터-판독가능한 매체는 메모리(예를 들면, RAM, ROM, 플래쉬 메모리, 등), 광학적 저장 매체(예를 들면, CD-ROM), 자기 저장 매체(예를 들면, 컴퓨터 하드 드라이브, 플로피 디스크, 등), 천공 카드(punch card), 또는 기타 상업적으로 구입가능한 매체를 포함한다. 목표 시스템(system of interest)과 매체, 컴퓨터간, 또는 컴퓨터와 저장 또는 저장된 정보의 접근을 위한 컴퓨터-판독가능한 매체 간에 정보가 전달될 수 있다. 그와 같은 전송은 전기적이거나, 또는 IR 링크, 무선 연결 등과 같은 다른 이용가능한 방법에 의해 수행될 수 있다.
"핵산 시료(nucleic acid sample)"는 개체로부터 수득된 핵산을 함유하는 시료이다. 특정한 구체예에서, 즉, 특정한 다형성 마커 및/또는 일배체형의 검출에서, 핵산 시료는 게놈 DNA를 포함한다. 그와 같은 핵산 시료는 혈액 시료, 양수 시료, 뇌척수액 시료, 또는 피부, 근육, 볼 점막 또는 결막 점막, 태반, 위장관 또는 기타 기관으로부터의 조직 시료를 포함한, 게놈 DNA를 포함하는 원천(source)으로부터 수득될 수 있다.
본 명세서에서 사용된 용어 "유방암 치료제(breast cancer therapeutic agent)"는 유방암과 연관된 증상을 개선시키거나 또는 예방하기 위해 이용될 수 있는 작용제를 의미한다.
본 명세서에 기재된 용어 "유방암-연관 핵산(breast cancer-associated nucleic acid)"은 유방암과 연관된 것으로 확인된 핵산을 의미한다. 이는 본 명세서에 기재된 마커 및 일배체형 및 이들과 강한 연관 불균형(LD)인 마커 및 일배체형을 포함하나, 이에 한정되지 않는다. 일 구체예에서, 유방암-연관 핵산은 특정한 게놈 영역 내에 위치하거나 또는 상기 영역과 연관된(즉, 연관 불균형인) 하나 이상의 다형성 마커를 통해 유방암과 연관된 것으로 확인된 LD-블럭과 같은 특정한 게놈 영역을 의미한다.
용어 "모든 유방암(All Breast Cancer)" 또는 "All BC"는 유방암의 특정한 서브 표현형(subphenotype)과 관계없이, 유방암으로 진단된 모든 개체를 의미한다.
용어 "중간 소인(Medium Predisposition)" 유방암 또는 "MedPre" 유방암은 유방암의 서브-표현형을 의미한다. 이 표현형의 정의는 발단자(proband)가 하기 기준 중 하나 이상을 충족시킬 것을 요구한다:
1. 시발자(proband)는 3M(meiotic event)의 유전적 거리 내에 3명 이상의 영향받은(affected) 친척을 포함하는 유방암 케이스의 클러스터(cluster)의 구성원이다.
2. 시발자는 3M 내의 관계된 영향받은 쌍 중 일 구성원이고, 상기 쌍 중 1인은 50세 이전에 진단받았다.
3. 시발자는 3M 내의 관계된 영향받은 쌍 중 일 구성원이고, 상기 쌍 중 1인은 임의의 종류의 2차 원발성 종양을 진단받았다.
4. 시발자는 임의의 종류의 원발성 종양을 진단받았다.
본 명세서에서 제시된 연구에서 분석된 1600명의 아이슬란드 환자들 중에서, 653명이 MedPre 기준을 충족시킨다(40.8%).
본 명세서에 기재된 용어 "다발성 원발성 유방암(Multiple Primary Breast Tumor)" 또는 "MPBC"는 제1 유방암 진단 외에 하나 이상의 원발성 종양이 진단되고, 상기 두 종양은 상기 제1 유방암과 동시에 또는 상기 제1 유방암에 뒤이어 발생하고 반대쪽 유방 또는 같은쪽 유방에서 발생한, 임상적으로 및 조직학적으로 독립적인 원발성 종양으로 확인된 케이스를 의미한다.
본 명세서에서 사용된 용어 "가족력 점수(Family history score" 또는 "FHS"는 상기 질환을 갖는 시발자에 대해 유방암에 걸린 친척의 수에 근거하여 정의된다. 각 시발자에 대해, 영향받은 1촌 친척 1인당 1점이 부여되고, 영향받은 2촌 친척 1인당 0.5점이 부여되며, 영향받은 3촌 친척 1인당 0.25점이 부여된다. 모든 영향받은 친척에 대해 수득된 총합이 총 가족력 점수(summed family history score) 또는 FHS이다.
본 명세서에 기재된, 용어 "rs4848543 LD 블럭" 또는 "rs4848543 연관 불균형 블럭"은 NCBI (National Center for Biotechnology Information) Build 34의 위치 119,987,002와 120,129,001 및 NCBI Build 36의 위치 119,608,327과 120,129,001 사이에 있는 염색체 2 상의 게놈 영역을 의미한다. rs4848543 LD 블럭은 크기가 141,999 bp이다.
본 명세서에서 사용된 용어 "STEAP3 유전자" 또는 "TSAP6 유전자"는 종양 억제자 활성화 경로 6(Tumor Suppressor Activated Pathway 6, TSAP6) 유전자로도 불리는, 전립선의 6-막관통 상피 항원(Six-transmembrane Epithelial Antigen of the Prostate, STEAP3) 유전자를 의미한다. 상기 유전자는 염색체 2q14.2 상에 존재하고, 위치 120076561-120118373 (NCBI Build 34)에 걸친다.
본 명세서에 기재된, 용어 "rs13387042 LD 블럭" 또는 "rs13387042 연관 불균형 블럭"은 NCBI (National Center for Biotechnology Information) Build 34의 위치 218,062,001과 218,141,002 사이에 있는 염색체 2 상의 연관 불균형(LD) 블럭을 의미한다. 상기 LD 블럭은 79,001개의 염기쌍에 걸친다(Build 34).
본 명세서에 기재된, 용어 "rs3803662 LD 블럭" 또는 "rs3803662 연관 불균형 블럭"은 NCBI (National Center for Biotechnology Information) Build 34의 위치 52,291,041과 52,436,127 사이에 있는 염색체 16 상의 연관 불균형(LD) 블럭을 의미한다. 상기 LD 블럭은 145,086개의 염기쌍에 걸친다(Build 34).
본 명세서에 기재된 용어 "Daly 일배체형(Daly haplotype)"은 HapMap 프로젝트에서 분석된 SNP의 추가적인 세트에 대해 효율적인 대리물(surrogate)(r2>0.8)로 확인된, 주어진 LD 블럭(높은 LD의 영역) 내의 이-마커 일배체형(two-marker haplotype)을 의미한다. 이 추가적인 SNP들은 UTAH CEPH (CEU) HapMap 표본에서 5%보다 큰 소수 대립인자 빈도(minor allele frequency)를 가지며, 이들은 Hap300 SNP 칩 상에 존재하지 않고 또한 상기 칩에 존재하는 SNP에 의해 효율적으로 태깅되지도 않는다[Pe'er, et al., (2006), Nat Genet, 38, 663-7].
본 명세서에서 정의된 용어 "에스트로겐 수용체 양성 유방암(estrogen receptor positive breast cancer)" 또는 "ER 양성 유방암"은 에스트로겐 수용체의 발현에 대해 양성으로 결정된 유방암 조직의 시료를 의미한다. 에스트로겐 수용체의 발현은 예를 들면, 방사선면역분석법 또는 면역조직화학법에 의해 결정될 수 있다. 10 fmol/mg 이상의 방사선면역계수 측정값(radioimmunometric measurement) 또는 10% 이상의 양성 핵의 방사선조직화학적 평가가 양성으로 간주된다.
본 명세서에서 정의된 용어 "프로게스테론 수용체 양성 유방암(progesterone receptor positive breast cancer)" 또는 "PR 양성 유방암"은 프로게스테론 수용체의 발현에 대해 양성으로 결정된 유방암 조직의 시료를 의미한다. 프로게스테론 수용체의 발현은 예를 들면, 방사선면역분석법 또는 면역조직화학법에 의해 결정될 수 있다. 10 fmol/mg 이상의 방사선면역계수 측정값 또는 10% 이상의 양성 핵의 면역조직화학적 평가가 양성으로 간주된다.
유방암으로 진단된 개체들의 집단의 연관 분석(association analysis)을 통해, 특정한 다형성 마커의 특정한 대립인자가 유방암과 연관된다는 것이 발견되었다. 암과 연관된 변이에 대한 게놈-전체 분석이 세그먼트 Chr2q14 및 Chr2q35 내에 있는 염색체 2의 두 개의 별개의 영역, 및 염색체 16 상의 영역(Chr16q12)과 유방암의 연관을 밝혔다. 이 영역 내에서 특정한 마커 및 일배체형이 유방암의 증가된 위험도와 연관되는 것으로 확인되었다.
표 1에 표시된 바와 같이, 염색체 2q14.2 상의 마커 rs4848543의 대립인자 A (rs4848543 A 대립인자 또는 rs4848543 1 대립인자 또는 A-rs4848543로도 지칭됨)가 유방암의 증가된 위험도와 연관되는 것으로 확인되었다. 4477명의 암-불포함 집단 대조군(cancer-free population control) 대비, 1598명의 환자에서 MedPre 유방암 표현형의 분석은 8.3x10-8의 p-값으로 1.42의 추정된 상대적 위험도(RR)를 산출했다. 상기 실험에서 사용된 게놈-전체 칩의 일부로 테스트된 317,089개의 SNP 마커에 대한 보정(correction) 후에, p-값은 0.026이었고, 즉, 연관은 게놈-전체 수준에서 유의성이 있었다. 보다 광범위한 All BC 표현형에 대한 연관은 약간 더 약했고, RR-값은 1.16이었다(표 1 참조). 이 결과들은 독립적인 아이슬란드 유방암 코호트에서 재현되었다.
rs4848543 마커는 본 명세서에서 rs4848543 LD 블럭이라 지칭되는 영역 내에 위치한다. 이 SNP 마커, 및 상기 마커와 상관된 마커들(예를 들면, 표 10에 열거된 마커들)은 본 발명의 방법에서 유용하다. 인간 게놈의 국소적 연관 불균형(local linkage disequilibrium) 패턴 때문에, 본 명세서에서 암과 연관된 것으로 확인된 rs4848543과 강한 LD인 다수의 다형성 마커들이 있다. 따라서, 공지된 SNP 또는 마이크로새틀라이트(microsatellite) 또는 indel과 같은 다른 다형성 마커들을 포함한 이 상관된 마커들(예를 들면, 표 10에 열거된 마커들), 및 다른 상관된 SNP 또는 다른 다형성 마커들이 단독으로 또는 조합되어, 본 명세서에 기재된 유방암에 대한 연관을 검출하기 위한 대리 마커(surrogate marker)로서 이용될 수 있다. 특히, rs4848543 LD 블럭 내에 위치한 다른 다형성 마커들이 본 발명의 방법에서 대리 마커로 이용될 수 있는 것으로 예상된다.
게놈-전체 연관 분석을 통해 염색체 2 상의 제2 영역(2q35)이 확인되었다. 마커 rs13387042의 대립인자 A (rs13387042 A 대립인자 또는 rs13387042 1 대립인자 또는 A-rs13387042로도 지칭됨)는 유방암의 증가된 위험도와 연관되는 것으로 확인되었다(표 11 참조). 이 SNP는 STEAP3/TSAP6 유전자 좌(locus)로부터 떨어진 위치에 있는 염색체 2q35 상에 위치한다. 유방암을 갖는 2,181명의 개인들(All BC) 및 12,441명의 집단 대조군의 분석은 rs13387042의 대립인자 A가 4.0x10-5의 p-값으로 1.19의 위험도를 부여한다는 것을 밝혔다. MedPre 유방암의 위험도(RR)는 Any BC의 위험도와 유사한 것으로 확인되었다. rs13387042에 대한 연관을 검출하기 위해 이용될 수 있는 대리 마커가 표 15에 열거된다.
이 결과는 아이슬란드 집단으로부터의 제2의 독립적 표본(583명의 케이스 및 7966명의 대조군)에서 재현되어, 이 제2 그룹에서 AllBC와 연관된 rs13387042의 대립인자 A에 대해 1.20의 RR의 추정치를 생성하였다(P-값corr = 3.8x10-3). 따라서, 독립적인 아이슬란드 표본에서 RR의 매우 유사한 점 추정치(point estimate) 및 2.0x10-7의 전체 P-값corr 으로 최초의 발견이 유의성있게 재현되었고, 이는 테스트된 317,089개의 SNP에 대한 Bonferroni 보정 후 유의성 수준에 가까웠다. rs13387042 대립인자 A 변이의 관찰된 빈도와 상대적 위험도는 아이슬란드 집단에서 15.6%의 추정된 집단 귀속 위험도(population attributable risk)에 해당한다.
스페인 표본 및 스웨덴 표본에서의 재현 연구는 이 발견들을 확인했다. 스페인으로부터의 446명의 유방암 케이스 및 977명의 대조군 표본의 분석은 1.21의 RR을 산출했다(P-값 1.8x10-2; 표 11). A-rs13387042 변이의 빈도는 스페인 대조군 표본에서 더 높아서, 상기 변이는 보다 널리 퍼졌으며 따라서 스페인 추출(Spanish extraction)의 표본에서 보다 높은 유방암 부하(burden)에 기여할 수 있다는 것을 시사했다. 두 개의 스웨덴 코호트, "스웨덴 가족성(Sweden Familial)" 및 "스웨덴 순차성(Sweden Conssecutive)" 도 분석되었다. "스웨덴 순차성(Sweden Consecutive)" 코호트는 유방암에 대해 1.31의 유의성 있는 RR을 보였고(P-값= 2.0x10-4), "스웨덴 가족성(Sweden Familial)" 코호트는 통계적으로 유의성이 없는, 1.11의 상대적 위험도 추정값을 보였다. 그러나, 전반적으로, 통합된 스웨덴 코호트는 1.22의 유의성 있는 상대적 위험도 추정값을 보였다(P-값= 8.1x10-4).
아이슬란드 코호트, 스페인 코호트 및 스웨덴 코호트에 대한 추정값을 Mantel-Haenszel 모델을 이용하여 결합 분석(joint analysis)에서 통합하였다. 결과는 3.8x10-11의 P-값을 갖는 1.20의 추정된 상대적 위험도였다. 이는 조사된 317,089개의 SNP에 대해 보정하기 위해 Bonferroni 방법을 이용한 게놈-전체 유의성에 대한 역치(threshold)보다 훨씬 낮았다. 따라서, 본 발명자들은 rs1338704 대립인자 A가 유럽계 후손의 여러 집단 표본에서 유방암에 대해 유의성있고 재현가능한 위험도를 부여하는 것으로 결론지었다. 전체 집단 귀속 위험도(overall population attributable risk)는 16.4%로 추정되었다.
1600명의 유방암 환자 및 11563명의 대조군으로부터의 데이터를 이용한 추가적인 게놈-전체 SNP 분석은 SNP rs3803662의 대립인자 T(T-rs3803662; rs3803662 대립인자 T)가 Any BC에 대한 1.23-배 증가된 위험도 추정값을 부여한다는 것을 확인하였다(표 16). 이 결과는 594명의 아이슬란드 유방암 환자 및 1433명의 대조군의 제2의 독립적인 코호트에서 확인되었다. 이 두 개의 아이슬란드 표본으로부터의 통합된 데이터는 개인들 간의 혈연관계(relatedness)에 대해 보정되었을 때, 1.23의 상대적 위험도 추정값 및 2.8x10-7 의 P-값을 생성했다. 이는 10.1%의 추정된 집단 귀속 위험도에 해당했다(표 16). rs3803662에 대한 연관을 검출하기 위해 이용될 수 있는 대리 마커들이 표 19에 열거된다.
전술된 스웨덴 코호트 및 스페인 코호트에서 이 발견의 재현 분석 및 네덜란드, 네이메헨(Nijmegen)으로부터의 1384명의 대조군 및 558명의 유방암 환자의 분석을 수행하였다. 표 16에 표시된 바와 같이, 이 3개의 재현 코호트 모두에서 rs3803662 대립인자 T에 대한 유의성있게 증가된 위험도가 관찰되었다. 이 3개의 비-아이슬란드 재현 코호트의 통합된 분석은 1.35의 전체 상대적 위험도 추정값을 보였고 P-값은 5.1x10-12이었다. 아이슬란드 코호트와 재현 코호트의 결합 분석은 2.7x10-17의 P-값을 갖는 1.28의 통합된 상대적 위험도 추정값을 보여주었다. 이는 테스트된 SNP의 갯수에 대해 보정되었을 때, 게놈-전체 유의성에 대한 역치보다 훨씬 낮았다. 상응하는 전체 집단 귀속 위험도는 13.4%였다(표 16).
rs13387042 대립인자 A 및 rs3803662 대립인자 T와 에스트로겐 수용체(ER) 및 프로게스테론 수용체(PR) 상태 간의 연관을 조사하였다. rs13387042 대립인자 A 및 rs3803662 대립인자 T를 포함하는 유의성 있는 유방암 위험도는 ER 양성 종양으로 진단된 환자들에 명확하게 한정되었고 ER 양성 종양과 ER 음성 종양에 대한 OR간의 차이도 유의성이 있었다(표 25). 유사하게, PR 양성 종양으로 진단된 환자들 중에 우세하게 유방암 위험도에 대한 경향이 있었다.
STEAP3/TSAP6의 생물학:
STEAP3/TSAP6에 대한 cDNA는 온도 민감성 p53 유전자를 포함하는 마우스 골수(murine myeloid) LTR6 세포주에서 p53 활성화에 의해 유도된 일련의 mRNA 중 하나로부터 최초로 분리되었다[Amson, et al., (1996), Proc Natl Acad Sci U S A, 93, 3953-7]. 이 마우스 형은 종양 억제자 활성화 경로 6(Tumour Suppressor Activated Pathway 6, TSAP6)으로 명명되었다. 이후에, 상기 유전자는 LTR6 세포에서 활성화된 p53에 의해 유도될 수 있는 것으로 확인되었다[Passer, et al., (2003), Proc Natl Acad Sci U S A, 100, 2284-9]. pHyde로 지칭된 랫트 버전은 상이한 전이성 성향을 갖는 두 개의 세포주에서 차등적으로 발현된 유전자들을 검출하기 위한 실험 동안 전립선암 세포주로부터 분리되었다[Rinaldy and Steiner, (1999), DNA Cell Biol, 18, 829-36]. pHyde cDNA는 랫트 및 인간 전립선 세포주 및 이종이식편(xenograft)에서 아폽토시스(apoptosis)를 유도하는 것으로 확인되었다[Rinaldy, et al., (2000), Gan To Kagaku Ryoho, 27 Suppl 2, 215-22; Steiner, et al., (2000), Cancer Res, 60, 4419-25]. pHyde에 의한 아폽토시스 유도는 이후에 카스파아제-3 경로를 통해 작동하는 것으로 확인되었다[Zhang, et al., (2001), Oncogene, 20, 5982-90]. STEAP3/TSAP6의 하향 조절(down regulation)은 또한 간세포 육종(hepatocellular carcinoma)의 진행과 연관된 것으로 확인되었다[Coulouarn, et al., (2005), J Hepatol, 42, 860-9].
Passer 등은 STEAP3/TSAP6의 인간 버전에 대한 cDNA를 분리하고 그 mRNA가 유방암 세포주 MCF7에서 p53 활성화에 의해 유도가능하다는 것을 확인하였다[Passer, et al., (2003), Proc Natl Acad Sci U S A, 100, 2284-9]. p53에 의한 유도는 전사 수준에서 일어나는 것으로 보이며 -478번 뉴클레오티드와 -357번 뉴클레오티드(accession number AY214461에 의해 정의된 서열) 사이에 있는 STEAP3/TSAP6 프로모터 내의 보존된 p53 반응 요소에 의해 매개되는 것으로 보인다[Passer, et al., (2003), Proc Natl Acad Sci U S A, 100, 2284-9]. 상기 단백질은 488개의 아미노산으로 구성되며, 50-55kDa, 6-pass 막관통(transmembrane) 단백질로 확인되었다[Passer, et al., (2003), Proc Natl Acad Sci U S A, 100, 2284-9]. STEAP3/TSAP6 상에 표적화된 안티센스 RNA는 p53-의존성 아폽토시스를 저해하였고, STEAP3/TSAP6이 아폽토시스의 작동자(effector)로 작용한다는 견해를 더 뒷받침하였다[Passer, et al., (2003), Proc Natl Acad Sci U S A, 100, 2284-9]. STEAP3/TSAP6은 세포 주기 조절 및 아폽토시스에 관여하는 두 개의 단백질, Nix 및 Myt1과 물리적으로 상호작용하였다[Passer, et al., (2003), Proc Natl Acad Sci U S A, 100, 2284-9]. Nix (BNIP3L로도 알려짐)는 미토콘드리아에 존재하는(mitochondrial) Bcl2-관련, 아폽토시스 촉진성(proapoptotic) 단백질이다. Nix 및 STEAP3/TSAP6은 각각 서로의 아폽토시스 촉진성 효과를 강화시킨다[Passer, et al., (2003), Proc Natl Acad Sci U S A, 100, 2284-9]. Myt1은 사이클린(cyclin) 의존성 키나아제 p34cdc2를 인산화시키고 그에 의해 저해하는 것에 의해 세포 주기를 G2/M 체크포인트(checkpoint)에서 차단하기 위해 작용하는 듀얼 특이성(Ser/Thr 및 Tyr) 키나아제이다. Myt1과 TSAP6 간의 상호작용은 Myt1을 그의 저인산화된(hypophosphorylated), 활성 상태로 유지시키는 것에 의해 p34cdc2의 Myt1-의존성 인산화를 촉진한다 [Passer, et al., (2003), Proc Natl Acad Sci U S A, 100, 2284-9].
다소 역설적이나, STEAP3/TSAP6은 최근에 마우스의 nm1054 돌연변이 스트레인에서 소적혈구성, 저색소성 빈혈을 발생시키는 유전자로 확인되었다[Ohgami, et al., (2005), Nat Genet, 37, 1264-9]. 세포외 철(extracellular iron)은 트랜스페린(Tf)에 의해 장, 망상내피 시스템(reticuloendothelial system) 및 간으로부터 체내의 모든 증식 세포로 운반된다. Tf-결합 철은 트랜스페린-수용체(TfR1) 매개 내포작용(endocytosis)에 의해 세포로 들어간다. 철은 산성화에 의해 엔도좀(endosome)에서 Tf로부터 방출되고, 철이 이가 금속 수송체(divalent metal transporter) Dmt1에 의해 세포질로 전달된다. 그 후, Tf 및 TfR1은 세포외 환경으로 리사이클링된다. 환경에 존재하는 철 및 Tf-결합 철은 주로 산성화된 Fe3+ (ferric) 상태로 존재하고 세포질막을 통해 전달될 수 있기 전에 Fe2+ (ferrous) 상태로 환원되어야 한다. 빈혈과의 연관을 통해, STEAP3/TSAP6는 적혈구 계통 세포(erythroid lineage cell)에서 이 반응을 수행하는 주요한 페리리덕타아제(ferrireductase)로 확인되었고, 이는 STEAP3/TSAP6가 철 흡수를 위해 큰 중요성을 갖는다는 것을 시사한다[Ohgami, et al., (2005), Nat Genet, 37, 1264-9]. STEAP3/TSAP6는 또한 구리 환원효소(cupric reductase) 활성 및 이 금속환원효소(metalloreductase) 활성으로서 STEAP 패밀리의 다른 멤버, STEAP2 및 STEAP4에 의해 공유된다[Ohgami, et al., (2006), Blood, 108, 1388-94].
STEAP3/TSAP6는 또한 비-고전적(non-classical) 경로를 통한 단백질의 분비의 자극에 관여하는 것으로 확인되었다. 고전적인 단백질 분비는 분비용 단백질에 대한 NH2-말단 신호 서열에 의해 매개된다. 상기 신호 서열은 상기 단백질을 소포체(endoplasmic reticulum)/골지 경로 및 뒤이은 분비 소포(secretary vesicle)에서 원형질막 통과로 이끈다. 분비 소포의 원형질막으로의 융합 후, 분비된 단백질은 세포외 공간으로 분비된다. 단백질 분비는 또한, 세포내 소포(intracellular vesicle)가 엔도좀의 내강(lumen)으로 분리되어, 소위 다중소포 구조(multivesicular structure)를 형성하는 것인 비-고전적 경로에 의해 수행될 수 있다. 상기 다중소포 구조와 원형질막과의 융합은 이 막-캡슐화 소포의 세포외 공간으로의 분비를 초래한다. 이 소포들은 엑소좀(exosome)으로 알려져 있다. STEAP3/TSAP6은 p53 의존적 방식으로 엑소좀 생성을 자극하는 것으로 확인되었다 [Amzallag, et al., (2004), J Biol Chem, 279, 46104-12; Yu, et al., (2006), Cancer Res, 66, 4795-801]. 엑소좀은 중요한 항-발암성(anti-oncogenic) 반응에 관여될 수 있다. p53-STEAP3/TSAP6 경로 자극에 대한 반응으로 엑소좀에서 분비되는 단백질 중 하나는 유방 종양 세포에서 혈관생성(angiogenesis), 종양 침윤 및 전이에 대한 입증된 저해 효과를 갖는 Maspin(mammary serine protease inhibitor)이다[Sheng, et al., (1996), Proc Natl Acad Sci U S A, 93, 11669-74; Shi, et al., (2001), Cancer Res, 61, 6945-51; Zhang, et al., (1997), Mol Med, 3, 49-59; Zou, et al., (1994), Science, 263, 526-9]. 엑소좀은 TCTP(Translationally Controlled Tumour Protein)/히스타민 방출 인자(Histamine Releasing Factor)와 같은 염증자극 인자(pro-inflammatory factor) 및 Her2/Neu 및 Mart1과 같은 종양-특이적 항원을 포함할 수 있다[Amzallag, et al., (2004), J Biol Chem, 279, 46104-12; Andre, et al., (2002), Lancet, 360, 295-305]. STEAP3/TSAP6-매개 엔도좀 형성은 p53을 발현하도록 유도된 세포들이 인접 세포(neighboring cell)에서 세포 주기 중단(cell cycle arrest), 프로아폽토시스(proapoptosis) 반응 및 사망을 초래하는 것인 소위 "바이스탠더 효과(bystander effect)"를 일으킬 수 있다는 것이 시사되었다[Yu, et al., (2006), Cancer Res, 66, 4795-801].
STEAP3/TSAP6의 가능한 유전적 변이와 암 위험도 간의 관계에 관해 거의 알려진 것이 없다. 전립선암 세포주, 이종이식편 및 종양 시료에서 돌연변이에 대한 스크리닝은 4개의 세포주, 8개의 이종이식편 및 56개의 종양 시료(총 68개의 시료)에서 2개의 미스센스(missense) 돌연변이(Ala184Thr 및 Ile305Thr)를 발견했다. 본 발명자는 STEAP3/TSAP6은 전립선암에서 고전적인 종양 억제자 유전자가 아닌 것으로 결론지었다. 본 발명자들이 아는 바에 따르면, 다른 종류의 암에서 STEAP3/TSAP6 유전적 변이의 연구는 보고된 바 없다.
유방암의 개선된 치료법의 개발을 위한 STEAP3/TSAP6 경로의 이용 가능성
본 발명자들에 의한 STEAP3/TSAP6 LD 블럭 내의 유전적 변이의 발견은 이 유전자가 유방암의 발병에서 공통된 인자라는 것을 나타낸다. 그러므로, STEAP3/TSAP6, 그의 동족체(homologue) 및 STEAP3/TSAP6 경로 상의 다른 요소들을 표적화하는 치료법이 유방암의 치료 또는 예방을 위한 후보로 간주될 수 있다. 그와 같은 표적은 하기를 포함한다: STEAP3/TSAP6 자체(OMIM# 609671); 동족체(homologue) STEAP1 (OMIM# 604415), STEAP2/TIARP/STAMP1 (OMIM# 605094), 및 STEAP4 (NM_024636); 상호작용 단백질(interacting protein) Nix/BNIP3L (OMIM# 605368), Myt1 (OMIM# 602474), TCTP/히스타민 분비 인자(OMIM# 600763); 경로 단백질 p34cdc2 (OMIM# 116940), 사이클린 B1 (OMIM# 123836), HER2/Neu (OMIM# 164870), Maspin (OMIM# 154790); 및 확인되거나 또는 관련될 수 있는 STEP3/TSAP6 경로의 다른 멤버들. 치료법은 STEAP3/TSAP6의 소형 분자 촉진제(agonist) 또는 길항제, 그의 동족체 또는 경로 성분들; 또는 유전자 요법 또는 면역요법 프로토콜에서 트랜스유전자(transgene)으로서 STEAP3/TSAP6, 동족체 또는 경로 성분의 이용을 포함할 수 있다. STEAP3/TSAP6, 그의 동족체 또는 경로 성분들 및/또는 그들의 활성에 영향을 미치는 분자가 또한 그들의 "바이스탠더 효과"의 강화를 통해 세포살상(cytostatic) 또는 세포독성 치료요법(화학요법, 방사선요법, 유전자요법 또는 면역요법)을 위한 아쥬반트(adjuvant)로 개발될 수 있다.
마커 및 일배체형의 평가
집단 내의 게놈 서열은 개인들이 비교될 때 동일하지 않다. 오히려, 게놈은 게놈 상의 다수의 위치에서 개인들 간에 서열 변이성(sequence variability)을 보인다. 그와 같은 서열 상의 변이는 일반적으로 다형성(polymorphism)으로 지칭되며, 각 게놈 내에 다수의 그와 같은 부위들이 있다. 예를 들면, 인간 게놈은 평균적으로 500 bp마다 나타나는 서열 변이를 보인다. 가장 일반적인 서열 변이는 게놈 내의 단일 염기 위치에서의 염기의 변화로 구성되고, 그와 같은 서열 변이, 또는 다형성은 일반적으로 단일 뉴클레오티드 다형성("SNP")로 지칭된다. 이 SNP들은 단일 돌연변이 사건에서 일어난 것으로 사료되며, 따라서, 통상적으로 각 SNP 부위에 두 개의 가능한 대립인자들이 있다; 본래의 대립인자와 돌연변이된 대립인자. 자연적인 유전적 부동(genetic drift) 및 또한 가능한 선택적 압력 때문에, 본래의 돌연변이가 주어진 집단에서 그의 대립인자의 특정한 빈도를 특징으로 하는 다형성을 초래했다. 마이크로새틀라이트, 삽입, 결실, 역전 및 카피수 변화를 포함한, 다수의 다른 종류의 서열 변이가 인간 게놈 내에서 발견된다. 다형성 마이크로새틀라이트는 특정한 부위에 복수 개의 짧은 염기 반복체(small repeat of bases)(예를 들면, CA 반복체, 상보성 가닥 상의 TG)를 가지며, 전체 집단에서 반복체 길이의 수가 변화한다. 일반적인 용어로, 다형성 부위에 대한 서열의 각 버전은 상기 다형성 부위의 특정한 대립인자를 나타낸다. 모든 서열 변이들은 해당 서열 변이의 특징적인, 특정한 다형성 부위에서 일어나는, 다형성으로 지칭될 수 있다. 일반적인 용어로, 다형성은 임의의 수의 특정한 대립인자를 포함할 수 있다. 따라서, 본 발명의 일 구체예에서, 다형성은 임의의 주어진 집단에서 둘 이상의 대립인자의 존재를 특징으로 한다. 또 다른 구체예에서, 다형성은 세개 이상의 대립인자의 존재를 특징으로 한다. 다른 구체예에서, 다형성은 4개 이상의 대립인자, 5개 이상의 대립인자, 6개 이상의 대립인자, 7개 이상의 대립인자, 9개 이상의 대립인자 또는 10개 이상의 대립인자의 존재를 특징으로 한다. 모든 그와 같은 다형성은 본 발명의 방법 및 키트에서 이용될 수 있고, 따라서, 본 발명의 범위 내에 속한다.
일부 경우에, 기준 대립인자(reference allele)를 선택하지 않고, 다형성 부위에서 상이한 대립인자를 지칭할 수 있다. 대안적으로, 특정한 다형성 부위에 대해 기준 서열이 지칭될 수 있다. 기준 대립인자는 종종 "야생형(wild-type)" 대립인자로 지칭되고, 이는 통상적으로 최초의 서열결정된(first sequenced) 대립인자 또는 "영향받지 않은(non-affected)" 개체(예를 들면, 성향(trait)이나 질병 표현형을 보이지 않는 개체)로부터의 대립인자로 선택된다.
본 명세서에서 지칭되는 SNP 마커에 대한 대립인자는 이용된 SNP 분석법에서 다형성 부위에서 그들이 나타나는 경우, 염기 A, C, G 또는 T로 지칭된다. 본 명세서에서 이용된 SNP에 대한 대립인자 코드는 하기와 같다: 1 = A, 2 = C, 3 = G, 4 = T. 그러나, 본 발명이 속하는 기술 분야의 당업자는 반대쪽 DNA 가닥을 분석하거나 또는 판독하는 것에 의해, 각 경우에 상보적 대립인자가 측정될 수 있다는 것을 인식할 것이다. 따라서, A/G 다형성을 포함하는 다형성 부위(다형성 마커)에 대해, 이용되는 분석법은 가능한 두 염기, 즉, A 및 G 중 하나 또는 양자 모두의 백분율 또는 비를 측정할 수 있다. 대안적으로, DNA 주형 상의 반대쪽 가닥을 결정(분석)하는 분석법을 설계하는 것에 의해, 상보적 염기 T 및 C의 존재가 측정될 수 있다. 정량적으로(예를 들면, 상대적 위험도의 측면에서), 동일한 결과가 각 DNA 가닥(+ 가닥 또는 - 가닥)의 측정으로부터 수득될 것이다.
일반적으로, 특정한 서열에 대해 기준 서열이 지정된다. 기준과 상이한 대립인자는 종종 "변이(variant)" 대립인자로 지칭된다. 본 명세서에서 사용된, 변이 서열(variant sequence)은 기준 서열과 상이하나, 그 외에는 실질적으로 유사한 서열을 의미한다. 본 명세서에 기재된 다형성 유전적 마커의 대립인자는 변이(variant)이다. 추가적인 변이들은 폴리펩티드에 영향을 미치는 변화들을 포함할 수 있다. 기준 뉴클레오티드 서열과 비교한 경우, 서열 차이는 프레임 쉬프트(frame shift)를 초래하는, 단일 뉴클레오티드의 삽입 또는 결실, 하나보다 많은 수의 뉴클레오티드의 삽입 또는 결실; 코딩된 아미노산의 변화를 초래하는, 하나 이상의 뉴클레오티드의 변화; 조기 종료 코돈(premature stop codon)의 생성을 초래하는, 하나 이상의 뉴클레오티드의 변화; 뉴클레오티드에 의해 코딩된, 하나 이상의 아미노산의 결실을 초래하는, 수개의 뉴클레오티드의 결실; 해독 프레임(reading frame)의 코딩 서열의 중단(interruption)을 초래하는, 불균등 재조합(unequal recombination) 또는 유전자 전환(gene conversion)과 같은, 하나 또는 수개의 뉴클레오티드의 삽입; 전체 서열 또는 일부 서열의 중복; 전위; 또는 뉴클레오티드 서열의 재배열을 포함한다. 그와 같은 서열 변화는 핵산에 의해 코딩된 폴리펩티드를 변화시킬 수 있다. 예를 들면, 핵산 서열의 변화가 프레임 쉬프트를 유발하는 경우, 프레임 쉬프트는 코딩된 아미노산의 변화를 초래할 수 있고, 및/또는 조기 종료 코돈의 생성을 초래하여, 절단된(truncated) 폴리펩티드의 생성을 유발한다. 대안적으로, 질병 또는 성향과 연관된 다형성은 하나 또는 그 이상의 뉴클레오티드의 동의적 변화(synonymous change)(즉, 아미노산 서열의 변화를 초래하지 않는 변화)일 수 있다. 그와 같은 다형성은 예를 들면, 스플라이싱 부위(splice site)를 변화시키고, mRNA의 안정성 또는 수송에 영향을 미치거나 또는 코딩된 폴리펩티드의 전사 또는 번역에 영향을 미칠 수 있다. 다형성은 또한 증폭 또는 결실과 같은 구조적 변화가 체세포 수준(somatic level)에서 일어날 가능성을 증가시키도록 DNA를 변화시킬 수 있다. 기준 뉴클레오티드 서열에 의해 코딩된 폴리펩티드는 특정한 기준 아미노산 서열을 갖는 "기준(reference)" 폴리펩티드이고, 변이 대립인자에 의해 코딩된 폴리펩티드는 변이 아미노산 서열을 갖는 "변이(variant)" 폴리펩티드로 지칭된다.
일배체형은 세그먼트를 따라 배열된 대립인자의 특정한 조합을 특징으로 하는 DNA의 세그먼트를 의미한다. 인간과 같은 이배체 개체의 경우, 일배체형은 각 다형성 마커 또는 유전자 좌에 대한 1쌍의 대립인자 중 하나의 대립인자를 포함한다. 특정한 구체예에서, 일배체형은 두개 이상의 대립인자, 세개 이상의 대립인자,네개 이상의 대립인자, 또는 다섯개 이상의 대립인자를 포함할 수 있고, 각 대립인자는 세그먼트 상의 특정한 다형성 마커에 대응된다. 일배체형은 다양한 다형성 마커의 조합, 예를 들면, 다형성 부위에 특정한 대립인자를 갖는 SNP와 마이크로새틀라이트의 조합을 포함할 수 있다. 따라서, 일배체형은 다양한 유전적 마커에서 대립인자의 조합을 포함한다.
특정한 다형성 마커 및/또는 일배체형의 검출은 본 발명이 속하는 기술 분야에서 공지된, 다형성 부위에서 서열을 검출하는 방법에 의해 달성될 수 있다. 예를 들면, PCR, LCR, 이중 PCR(nested PCR) 및 핵산 증폭을 위한 기타 기법을 이용한, 형광-기반 기법(Chen, X. et al., Genome Res. 9(5): 492-98 (1999); Kutyavin et al., Nucleic Acid Res. 34: e128 (2006)))과 같은, SNP 및/또는 마이크로새틀라이트 마커의 존재에 대한 유전형분석을 위한 표준 기법이 이용될 수 있다. SNP 유전형분석을 위해 이용할 수 있는 특정한 방법들은 TaqMan 유전형 분석법(genotyping assay) 및 SNPlex 플랫폼(Applied Biosystems), 질량 분석법(예를 들면, Sequenom의 MassARRAY 시스템), 미니-시퀀싱(mini-sequencing) 방법, 실시간 PCR, Bio-Plex 시스템(BioRad), CEQ and SNPstream 시스템(Beckman), Molecular Inversion Probe 어레이 기술(예를 들면, Affymetrix GeneChip), 및 BeadArray Technologies(예를 들면, Illumina GoldenGate 및 Infinium 분석법)를 포함하나, 이에 한정되지 않는다. 상기 방법들 또는 본 발명이 속하는 기술분야의 당업자에게 이용가능한 다른 방법에 의해, 마이크로새틀라이트, SNP 또는 다른 종류의 다형성 마커를 포함한, 다형성 마커에서의 하나 이상의 대립인자가 확인될 수 있다.
본 명세서에 기재된 특정한 방법에서, 연구 대상인 특정한 질병 또는 성향(예를 들면,유방암)에 대한 증가된 감수성(즉, 증가된 위험도)을 갖는 개체는 상기 질병 또는 성향에 대해 증가된 감수성을 부여하는 하나 이상의 다형성 마커의 하나 이상의 대립인자 또는 일배체형(즉, 위험 마커 대립인자 또는 일배체형)이 확인된 개체이다. 일 양태에서, 상기 위험 마커 또는 일배체형은 유방암의 유의성 있는 증가된 위험도(또는 감수성)를 부과하는 마커 또는 일배체형이다. 일 구체예에서, 마커 또는 일배체형과 연관된 유의성은 상대적 위험도(relative risk, RR)에 의해 측정된다. 또 다른 구체예에서, 마커 또는 일배체형과 연관된 유의성은 오즈비(odds ratio, OR)에 의해 측정된다. 또 다른 구체예에서, 유의성은 백분율로 측정된다. 일 구체예에서, 유의성 있는 증가된 위험도는 1.2 이상, 1.3 이상, 1.4 이상, 1.5 이상, 1.6 이상, 1.7 이상, 1.8 이상, 1.9 이상, 2.0 이상, 2.5 이상, 3.0 이상, 4.0 이상, 및 5.0 이상을 포함하나, 이에 한정되지 않는, 1.2 이상의 위험도(상대적 위험도 및/또는 오즈비)로 측정된다. 특정한 구체예에서, 1.2 이상의 위험도(상대적 위험도 및/또는 오즈비)는 유의성이 있다. 또 다른 특정한 구체예에서, 1.3 이상의 위험도는 유의성이 있다. 또 다른 구체예에서, 1.4 이상의 위험도는 유의성이 있다. 또 다른 구체예에서, 약 1.5 이상의 위험도는 유의성이 있다. 또 다른 추가적인 구체예에서, 약 1.7 이상의 위험도는 유의성이 있다. 그러나, 다른 컷오프, 예를 들면, 1.15, 1.25, 1.35 이상 등이 고려되며, 그와 같은 컷오프도 또한 본 발명의 범위 내에 속한다. 다른 구체예에서, 위험도의 유의성 있는 증가는 약 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 100%, 150%, 200%, 300%, 및 500%를 포함하나, 이에 한정되지 않는, 약 20% 이상이다. 하나의 특정한 구체예에서, 위험도의 유의성 있는 증가는 20% 이상이다. 다른 구체예에서, 위험도의 유의성 있는 증가는 30% 이상, 40% 이상, 50% 이상, 60% 이상, 70% 이상, 80% 이상, 90% 이상 및 100% 이상이다. 그러나, 본 발명이 속하는 기술 분야의 당업자에 의해 본 발명의 특징으로 적합한 것으로 간주되는 다른 컷오프 또는 범위도 고려되고, 그들도 본 발명의 범위 내에 속한다. 특정한 구체예에서, 위험의 유의성 있는 증가는 0.05 미만, 0.01 미만, 0.001 미만, 0.0001 미만, 0.00001 미만, 0.000001 미만, 0.0000001 미만, 0.00000001 미만, 또는 0.000000001 미만의 p-값과 같은 p-값을 특징으로 한다.
본 발명의 위험 다형성 마커 또는 일배체형은 하나 이상의 마커의 하나 이상의 대립인자 또는 일배체형이 비교군(대조군)에서의 존재의 빈도 대비 유방암에 대한 위험도를 갖는 개체(질병군(affected))에 보다 빈번하게 존재하고, 상기 마커 또는 일배체형의 존재가 상기 질병 또는 성향에 대한 감수성을 나타내는 것인 마커 또는 일배체형이다. 일 구체예에서, 대조군은 집단 표본(population sample), 즉, 일반적인 집단으로부터의 랜덤 표본일 수 있다. 또 다른 구체예에서, 대조군은 질병에 걸리지 않은 개인, 예를 들면, 유방암으로 진단되지 않은 개인의 군으로 대표된다. 일 구체예에서, 그와 같은, 질병-불포함(disease-free) 대조군은 하나 이상의 특정한 질병-연관 증상의 부재를 특징으로 할 수 있다. 또 다른 구체예에서, 상기 질병-불포함 대조군은 하나 이상의 질병-특이적 위험 인자의 부재를 특징으로 한다. 일 구체예에서, 그와 같은 위험 인자는 하나 이상의 환경적 위험 인자이다. 대표적인 환경적 인자들은 특정한 질병 또는 성향을 발현할 위험도에 영향을 미치는 것으로 알려지거나, 상기 위험도에 영향을 미치는 것으로 고려되는 천연 산물, 미네랄, 또는 기타 화학물질이다. 기타 환경적 위험 인자들은 식음습관(food and drink habit), 주요 거주지의 지리적 위치 및 직업적 위험 인자를 포함하나, 이에 한정되지 않는, 생활방식(lifestyle)과 관련된 위험 인자들이다. 또 다른 구체예에서, 위험 인자는 하나 이상의 유전적 위험 인자를 포함한다.
상관관계에 대한 간단한 검정의 예로서 2 x 2 표(two by two table) 상에서의 Fisher-exact 검정이 있다. 염색체의 코호트가 주어지면, 마커 및 일배체형을 모두 포함하는 염색체, 마커 또는 일배체형을 중 하나를 포함하고, 나머지 하나는 포함하지 않는 염색체 및 마커나 일배체형 중 어느 것도 포함하지 않는 염색체의 갯수로부터 2 x 2 표가 작성된다.
본 발명의 다른 구체예에서, 질병 또는 성향에 대한 감소된 감수성(즉, 감소된 위험도)을 갖는 개체는 상기 질병 또는 성향에 대한 감소된 감수성을 부여하는 하나 이상의 다형성 마커의 하나 이상의 특정한 대립인자 또는 일배체형이 확인된 개체이다. 감소된 위험도를 부여하는 마커 대립인자 및/또는 일배체형은 또한 보호성(protective)인 것으로 표현된다. 일 양태에서, 보호성 마커 또는 일배체형은 질병 또는 성향의 유의성 있는 감소된 위험도(또는 감수성)를 부여하는 마커 또는 일배체형이다. 일 구체예에서, 유의성 있는 감소된 위험도는 0.9 미만, 0.8 미만, 0.7 미만, 0.6 미만, 0.5 미만, 0.4 미만, 0.3 미만, 0.2 미만 및 0.1 미만을 포함하나, 이에 한정되지 않는, 0.9 미만의 상대적 위험도로 측정된다. 하나의 특정한 구체예에서, 유의성 있는 감소된 위험도는 0.7 미만이다. 또 다른 구체예에서, 유의성 있는 감소된 위험도는 0.5 미만이다. 또 다른 구체예에서, 유의성 있는 감소된 위험도는 0.3 미만이다. 또 다른 구체예에서, 위험도(또는 감수성)의 감소는 25% 이상, 30% 이상, 35% 이상, 40% 이상, 45% 이상, 50% 이상, 55% 이상, 60% 이상, 65% 이상, 70% 이상, 75% 이상, 80% 이상, 85% 이상, 90% 이상, 95% 이상 및 98% 이상을 포함하나, 이에 한정되지 않는, 20% 이상이다. 하나의 특정한 구체예에서, 위험도의 유의성 있는 감소는 약 30% 이상이다. 또 다른 구체예에서, 위험도의 유의성 있는 감소는 약 50% 이상이다. 또 다른 구체예에서, 위험도의 유의성 있는 감소는 약 70% 이상이다. 본 발명이 속하는 기술 분야의 당업자에 의해 본 발명의 특징으로 적합한 것으로 간주되는 다른 컷오프 또는 범위도 고려되고, 그들도 본 발명의 범위 내에 속한다.
본 발명이 속하는 기술 분야의 당업자는 연구된 집단에 존재하는 두개의 대립인자를 갖는 마커에 대해, 하나의 대립인자가 상기 집단 내에서 성향 또는 질병을 갖는 개인의 그룹에서 대조군 대비 증가된 빈도로 발견되는 경우, 상기 마커의 나머지 다른 대립인자는 상기 성향 또는 질병을 갖는 개인의 그룹에서 대조군 대비 감소된 빈도로 발견될 것으로 이해할 것이다. 그와 같은 경우에, 상기 마커의 하나의 대립인자(상기 성향 또는 질병을 갖는 개인에서 증가된 빈도로 발견되는 대립인자)은 위험 대립인자(at-risk allele)이고, 나머지 다른 대립인자는 보호성 대립인자(protective allele)일 것이다.
질병 또는 성향(예를 들면, 유방암)과 연관된 유전적 변이가 단독으로 주어진 유전형에 대해 질병의 위험도를 예측하기 위해 이용될 수 있다. SNP와 같은 이대립인자 마커(biallelic marker)의 경우, 3개의 가능한 유전형이 있다: 위험 변이에 대한 동형접합체, 이형접합체(heterozygote), 및 상기 위험 변이의 비-보인자(non-carrier). 복수의 유전자 좌에서의 변이와 연관된 위험도가 전체 위험도를 추정하기 위해 이용될 수 있다. 복수 개의 SNP 변이에 대해, k( = 3 n x 2 p ) 개의 가능한 유전형이 있고; 상기에서 n은 상염색체 유전자좌(autosomal loci)의 갯수이고 p는 성염색체 유전자좌의 갯수이다. 전체 위험도 평가 계산은 통상적으로 상이한 유전적 변의의 상대적 위험도가 곱해진다는 것, 즉, 특정한 유전형 조합과 연관된 전체 위험도(예를 들면, RR 또는 OR)가 각 유전자좌의 유전자형에 대한 위험도 값의 곱이라는 것을 가정한다. 제시된 위험도가 일치된(matched) 성별 및 민족을 갖는 기준 집단 대비 개인, 또는 개인에 대한 특정한 유전형에 대한 상대적 위험도를 나타내는 경우, 통합 위험도(combined risk)는 유전자좌-특이적 위험도 값의 곱이고, 이는 또한 집단 대비 전체 위험도 추정치에 해당한다. 개인에 대한 위험도가 위험 대립인자의 비-보인자에 대한 비교에 근거하는 경우, 통합 위험도는 모든 유전자좌의 유전형의 주어진 조합을 갖는 인간을 상기 유전자좌들에서 위험 변이를 보유하지 않는 개인들의 군에 비교하는 추정치에 해당한다. 위험 변이의 비-보인자들의 그룹은 가장 낮은 추정된 위험도를 가지며 그 자체(즉, 비-보인자)와 비교하여 1.0의 통합 위험도를 가지나, 집단 대비, 1.0 미만의 전체 위험도를 갖는다. 비-보인자 그룹은 잠재적으로 매우 작을 수 있고, 특히, 다수의 유전자좌에 대해 매우 작을 수 있으며, 그 경우, 그의 관련성은 그만큼 작다는 것에 주목해야 한다.
승법 모델(multiplicative model)은 일반적으로 복합 성향(complex trait)의 데이터에 합리적으로 잘 맞는 간명(parsimonious) 모델이다. 승법성(multiplicity)으로부터의 편향은 일반적인 질환에 대한 일반적인 변이에서는 드물게 설명되었으며, 보고된 경우에도, 제안적인 것에 불과하며, 이는 유전자좌 간의 통계적 상호작용을 입증할 수 있기 위해서는 매우 큰 표본 크기가 통상적으로 요구되기 때문이다.
예로서, 전립선 암과 연관된 것으로 개시된 총 8개의 변이를 고려한다(Gudmundsson, J., et al., Nat Genet 39:631-7 (2007), Gudmundsson, J., et al., Nat Genet 39:977-83 (2007); Yeager, M., et al, Nat Genet 39:645-49 (2007), Amundadottir, L., el al., Nat Genet 38:652-8 (2006); Haiman, C.A., et al., Nat Genet 39:638-44 (2007)). 이 유전자좌들 중 7개는 상염색체 상에 있고, 나머지 유전자좌는 염색체 X 상에 있다. 이 때, 이론적인 유전형 조합의 총수는 37 x 21 = 4374이다. 그 유전형 분류(genotypic class) 중 일부는 매우 드무나, 여전히 가능하고, 전체 위험도 평가를 위해 고려되어야 한다. 복수 개의 유전적 변이의 경우에 적용된 승법 모델은 상기 유전적 변이가 "환경적(environmental)" 인자와 명확하게 상관되지 않는다는 것을 가정할 때 비-유전적 위험 변이와의 결합(conjugation)에서 유효할 것으로 보인다. 다시 말하면, 비-유전적 위험 인자와 유전적 위험 인자가 상호작용하지 않는다는 것을 가정할 때, 유전적 변이와 비-유전적 변이는 통합 위험도를 추정하기 위해 승법 모델 하에 평가될 수 있다.
동일한 정량적 접근방법을 이용하여, 본 명세서에 기재된, 유방암과 연관된 복수 개의 변이와 연관된 통합 위험도 또는 전체 위험도가 평가될 수 있다. 하나의 그와 같은 구체예에서, 마커 rs4848543, rs13387042 및 rs3803662 또는 이 마커들과 연관 불균형인 대리 마커들이 평가되고, 유전형 조합(33= 27가지의 가능한 조합)에 대한 위험도가 계산된다. 또 다른 구체예에서, 전체 위험도를 산출하기 위해 상기 마커들 중 두개(예를 들면, 마커 rs13387042 및 rs3803662)에 대한 유전형이 조합될 수 있다. 다른 구체예에서, 유방암에 대한 소인을 부여하는 것으로 알려진 추가적인 마커들(예를 들면, BRCA1, BRCA2, BARD1과 같은, 고 침투성 위험 인자)가 본 명세서에 기재된 하나 이상의 위험 인자들과 조합된다.
연관 불균형(Linkage Disequilibrium)
각 감수분열 사건 동안 각 염색체 쌍에 대해 평균 1회 일어나는, 재조합의 자연적인 현상은 자연이 서열(및 결과적으로 생물학적 기능)에 변화를 제공하는 한가지 방법이다. 재조합은 게놈에서 랜덤하게 일어나지 않는 것으로 발견되었다; 오히려, 재조합율의 빈도에 큰 변화가 있어서, 높은 재조합 빈도를 갖는 작은 영역(따라서, 재조합 핫스팟(recombination hotspot)으로 불림) 및 일반적으로 연관 불균형(LD) 블럭이라 불리는, 낮은 재조합 빈도의 보다 넓은 영역을 생성한다(Myers, S. et al., Biochem Soc Trans 34:526-530 (2006); Jeffreys, A.J., et al.,Nature Genet 29:217-222 (2001); May, C.A., et al., Nature Genet 31:272-275(2002)).
연관 불균형(Linkage Disequilibrium, LD)은 두 개의 유전적 요소의 비-랜덤 조합(non-random assortment)을 의미한다. 예를 들면, 특정한 유전적 요소(예를 들면, 다형성 마커의 대립인자(allele))가 0.50(50%)의 빈도로 집단에서 일어나고, 또 다른 요소가 0.50(50%)의 빈도로 일어나는 경우, 두 요소를 모두 갖는 개인의 예상되는 발생율은 상기 요소들의 랜덤 분포를 가정하면, 0.25(25%)이다. 그러나, 상기 두 요소들이 0.125보다 더 높은 빈도로 함께 나타나는 것으로 발견되는 경우, 상기 요소들은 연관 불균형에 있다고 하며, 이는 그들이 그들의 독립적인 대립인자 빈도가 예측하는 비율보다 더 높은 비율로 함께 유전되는 경향이 있기 때문이다. 개략적으로, LD는 일반적으로 두 요소간의 재조합 사건의 빈도와 상관관계를 갖는다. 집단에서 대립인자 또는 일배체형 빈도는 집단 내의 개체의 유전형을 분석하고 상기 집단에서 각 대립인자 또는 일배체형의 발생 빈도를 결정하는 것에 의해 결정될 수 있다. 이배체(diploid)의 집단, 예를 들면, 인간 집단의 경우, 개인들은 일반적으로 각 유전적 요소(예를 들면, 마커, 일배체형 또는 유전자)에 대해 두 개의 대립인자 또는 대립인자 조합을 가질 것이다.
다수의 상이한 척도들이 연관 불균형(LD)의 강도를 평가하기 위해 제안되었다. 대부분은 이대립인자(biallelic) 부위의 쌍 간의 연관의 강도를 획득한다. LD의 두 개의 중요한 일대일 척도(pairwise measures)는 r2 (△2으로 표시되기도 함) 및 |D'|이다. 두 척도는 모두 0(불균형 없음) 내지 1('완전한' 불균형)의 범위이나, 그들의 해석은 약간 다르다. |D'|는 가능한 일배체형 중 2개 또는 3개만 존재하는 경우, 그 값이 1이고, 모든 4개의 가능한 일배체형이 존재하는 경우는 그 값이 1보다 작은 것으로 정의된다. 따라서, 1보다 작은 |D'|의 값은 두 부위 간에 과거에 재조합이 일어났을 수도 있다는 것을 나타낸다(재발성 돌연변이(recurrent mutation)는 |D'|가 1보다 작게할 수 있으나, 단일 뉴클레오티드 다형성(SNP)의 경우, 이는 통상적으로 재조합보다 가능성이 낮은 것으로 간주됨). 척도 r2는 두 부위간의 통계적 상관성을 나타내고, 두 개의 일배체형만 존재하는 경우 1의 값을 취한다.
r2와, 감수성 유전자 좌와 SNP 간의 연관성을 검출하기 위해 요구되는 표본 크기 간에 단순한 반비례 관계(inverse relationship)가 있기 때문에, r2 측정값은 이론의 여지는 있지만 연관 맵핑(association mapping)에 대한 가장 적합한 척도이다. 이 척도는 부위의 쌍에 대해 정의되나, 일부 적용의 경우, 다수의 다형성 부위를 포함하는 전체 영역에서 LD가 얼마나 강한지를 결정하는 것이 바람직할 수 있다(예를 들면, LD의 강도가 유전자 좌들 간에 또는 집단 전체에 있어서 유의성 있게 상이한지 여부, 또는 하나의 영역에서 특정한 모델 하에서 예측된 것보다 더 크거나 또는 더 작은 LD가 존재하는지 여부). 한 영역에 대해 LD를 측정하는 것은 간단하지 않으나, 하나의 방법은 집단 유전학에서 개발된, 척도 r을 이용하는 것이다. 개략적으로 말하면, r은 데이터에서 확인되는 LD를 생성하기 위해, 특정한 집단 모델 하에서 어느 정도의 재조합이 요구되는지를 측정한다. 이 종류의 방법은 또한 잠재적으로 LD 데이터가 재조합 핫스팟의 존재에 대한 증거를 제공하는지 여부를 결정하는 문제에 대한 통계적으로 엄격한 방식을 제공할 수 있다. 본 명세서에 기재된 방법의 경우, 유의성 있는 r2 값은 0.1 이상, 예를 들면, 0.1 이상, 0.15 이상, 0.2 이상, 0.25 이상, 0.3 이상, 0.35 이상, 0.4 이상, 0.45 이상, 0.5 이상, 0.55 이상, 0.6 이상, 0.65 이상, 0.7 이상, 0.75 이상, 0.8 이상, 0.85 이상, 0.9 이상, 0.91 이상, 0.92 이상, 0.93 이상, 0.94 이상, 0.95 이상, 0.96 이상, 0.97 이상, 0.98 이상, 0.99 이상 또는 1.0 이상일 수 있다. 하나의 바람직한 구체예에서, 유의성 있는 r2 값은 0.2 이상일 수 있다. 대안적으로, 본 명세서에 기재된 연관 불균형은 0.3 이상, 0.4 이상, 0.5 이상, 0.6 이상, 0.7 이상, 0.8 이상, 0.85 이상, 0.9 이상, 0.95 이상, 0.96 이상, 0.97 이상, 0.98 이상, 0.99 이상과 같은, 0.2 이상의 |D'| 값을 특징으로 하는 연관 불균형을 의미한다. 따라서, 연관 불균형은 별개의 마커들의 대립인자 간의 상관관계를 나타낸다. 연관 불균형은 상관 계수(correlation coefficient) 또는 |D'| (1.0 이하의 r2 및 1.0 이하의 |D'|)에 의해 측정된다. 일부 구체예에서, 연관 불균형은 r2 및 |D'| 척도 모두에 대한 값으로 정의된다. 하나의 그와 같은 구체예에서, 유의성 있는 연관 불균형은 0.1보다 큰 r2 및 0.8보다 큰 |D'|으로 정의된다. 또 다른 구체예에서, 유의성 있는 연관 불균형은 0.2보다 큰 r2 및 0.8보다 큰 |D'|으로 정의된다. 또 다른 구체예에서, 유의성 있는 연관 불균형은 0.2보다 큰 r2 및 0.9보다 큰 |D'|으로 정의된다. 연관 불균형을 결정하기 위해 r2 및 |D'| 값의 다른 조합 및 변경(permutation)도 고려되며, 본 발명의 범위 내에 속한다. 연관 불균형은 본 명세서에서 정의된 바와 같이, 하나의 인간 집단에서 결정될 수 있거나, 또는 하나보다 많은 인간 집단으로부터의 개인들을 포함하는 표본의 집합(colleciton)에서 결정될 수 있다. 본 발명의 일 구체예에서, LD는 정의된 바와 같은(http://www.hapmap.org), 하나 이상의 HapMap 집단(코카서스인, 아프리카인, 일본인, 중국인)으로부터의 표본에서 결정된다. 하나의 그와 같은 구체예에서, LD는 HapMap 표본의 CEU 집단에서 결정된다. 또 다른 구체예에서, LD는 YRI 집단에서 결정된다. 또 다른 구체예에서, LD는 아이슬란드 집단으로부터의 표본에서 결정된다.
게놈의 모든 다형성이 집단 수준에서 동일하다면, 모든 상이한 다형성 상태를 평가하기 위해 모든 단일 다형성이 연관(association) 연구에서 조사되어야 할 것이다. 그러나, 다형성 간의 연관 불균형 때문에, 긴밀하게 연관된 다형성들이 강한 상관관계를 가지며, 이는 유의성 있는 연관을 관찰하기 위해 연관 연구에서 조사되어야 하는 다형성의 갯수를 감소시킨다. LD의 또 다른 결과는 이 다형성들이 강한 상관관계를 갖는다는 사실 때문에, 다수의 다형성들이 연관 신호(association signal)를 생성할 수 있다는 것이다.
게놈 LD 맵이 게놈 전체에 대해 생성되었고, 그와 같은 LD 맵이 질병-유전자를 맵핑하기 위한 프레임워크로 작용할 것으로 제안되었다(Risch, N. & Merkiangas, K, Science 273:1516-1517 (1996); Maniatis, N., et al., Proc Natl Acad Sci USA 99:2228-2233 (2002); Reich, DE et al, Nature 411:199-204 (2001)).
현재, 인간 게놈의 많은 부분들이 수개의 공통된 일배체형을 포함하는 일련의 별개의 일배체형 블럭들로 분류될 수 있다는 것이 확립되었다; 이 블럭들의 경우, 연관 불균형 데이터는 재조합을 나타내는 증거를 거의 제공하지 않는다(예를 들면, Wall., J.D. and Pritchard, J.K., Nature Reviews Genetics 4:587-597 (2003); Daly, M. et al., Nature Genet. 29:229-232 (2001); Gabriel, S.B. et al., Science 296:2225-2229 (2002); Patil, N. et al., Science 294:1719-1723 (2001); Dawson, E. et al., Nature 418:544-548 (2002); Phillips, M.S. et al., Nature Genet. 33:382-387 (2003) 참조).
이와 같은 일배체형 블럭을 정의하는 두 가지 주요한 방법들이 있다: 블럭은 한정된 일배체형 다양성을 갖는 DNA의 영역(예를 들면, Daly, M. et al., Nature Genet. 29:229-232 (2001); Patil, N. et al., Science 294:1719-1723 (2001); Dawson, E. et al., Nature 418:544-548 (2002); Zhang, K. et al., Proc. Natl. Acad. Sci. USA 99:7335-7339 (2002) 참조), 또는, 연관 불균형을 이용하여 확인된, 광범위한 과거의 재조합(extensive historical recombination)을 갖는 이행 구역(transition zone) 간의 영역(예를 들면, Gabriel, S.B. et al., Science 296:2225-2229 (2002); Phillips, M.S. et al., Nature Genet. 33:382-387 (2003); Wang, N. et al., Am. J. Hum. Genet. 71:1227-1234 (2002); Stumpf, M.P., and Goldstein, D.B., Curr. Biol. 13:1-8 (2003) 참조)으로 정의될 수 있다. 보다 최근에, 인간 게놈 전체에 대한 재조합률(recombination rate) 및 상응하는 핫스팟의 상세 맵(fine-scale map)이 작성되었다(Myers, S., et al., Science 310:321-32324 (2005); Myers, S. et al., Biochem Soc Trans 34:526530 (2006)). 상기 맵은 게놈 전체에서 재조합의 엄청난 변이를 보여주며, 재조합률은 핫스팟에서 10-60 cM/Mb로 높았고, 개재 영역(intervening region)에서는 재조합률이 0에 가까워서, 제한적인 일배체형 다양성 및 높은 LD의 영역을 나타낸다. 따라서, 상기 맵은 일배체형 블럭 및/또는 LD 블럭을 재조합 핫스팟에 의해 둘러싸인(flanked) 영역으로 정의하기 위해 이용될 수 있다. 본 명세서에서 사용된, 용어 "일배체형 블럭(haplotype block)" 또는 "LD 블럭"은 전술된 특징들에 의해 정의되는 블럭, 또는 그와 같은 영역을 정의하기 위해 본 발명이 속하는 기술 분야의 당업자에 의해 이용되는 다른 대안적인 방법에 의해 정의되는 블럭을 포함한다.
일배체형 블럭을 식별하는 일부 대표적인 방법들이 예를 들면, 미국특허출원공개 제20030099964호, 제20030170665호, 제20040023237호 및 제20040146870호에 개시된다. 일배체형 블럭(LD 블럭)은 단일 마커, 또는 복수 개의 마커를 포함하는 일배체형을 이용하여, 표현형과 일배체형 상태 간의 연관을 맵핑하기 위해 이용될 수 있다. 각 일배체형 블럭에서 주요한 일배체형이 식별되고, 그 후, 일련의 "태깅(tagging)" SNP 또는 마커들(일배체형들을 구별하기 위해 필요한 최소 세트의 SNP 또는 마커)이 식별될 수 있다. 이 태깅 SNP 또는 마커들은 표현형과 일배체형 간의 연관을 확인하기 위해, 개체들의 군(group)으로부터의 표본의 평가에서 이용될 수 있다. 필요한 경우, 인접한 일배체형 블럭들 간에는 연관 불균형이 존재할 수 있기 때문에, 이 블럭들이 동시에 평가될 수 있다.
다양한 집단에서 차등적인 과거의 재조합률(historical rate of assortment) 때문에, 연관 불균형은 집단 간에 다를 수 있다는 것이 잘 알려져 있다. 본 발명의 일부 구체예에서, LD는 코카서스계 표본에서 결정된 LD를 의미한다. 특정한 구체예에서, LD는 HapMap 컨소시움(http://www.hapmap.org에 설명된 바와 같이)으로부터의 코카서스계 CEPH 표본에서 결정된다. 다른 구체예에서, LD는 아프리카계 집단, 아프리카계-미국인 집단, 히스패닉계 집단, 일본계 집단, 중국계 집단에서 결정된다. 일부 구체예에서, LD는 (http://www.hapmap.org)에 기재된 바와 같이, 중국, 일본, 아프리카로부터의 HapMap 표본에서 결정된다.
따라서, 게놈에서 다형성 마커에 대한 관찰된 연관에 대해, 게놈 내의 추가적인 마커들이 또한 연관을 보일 수 있다는 것이 명백하다. 이는 재조합률의 큰 변이에서 관찰된 바와 같이, 게놈 전체에서 LD의 불균등한 분포의 당연한 결과이다. 따라서, 연관을 검출하기 위해 이용되는 마커들은 주어진 질병 또는 성향과 연관된 게놈 영역(즉, 일배체형 블럭 또는 LD 블럭)에 대한 "택(tag)"을 나타낸다. 하나 이상의 원인이 되는(causative)(기능성) 변이 또는 돌연변이가 상기 질병 또는 성향과 연관된 것으로 확인되는 영역 내에 존재할 수 있다. 그와 같은 변이는 연관을 검출하기 위해 이용되는 태깅 마커에 대해 관찰되는 것보다 더 높은 상대적 위험도(RR) 또는 오즈비(OR)를 부여할 수 있다. 따라서, 본 발명은 본 명세서에 기재된 바와 같이, 질병과의 연관을 검출하기 위해 이용되는 마커, 및 상기 마커와 연관 불균형인 마커를 포함한다. 따라서, 본 발명의 특정한 구체예에서, 본 명세서에 기재된 바와 같은, 본 발명의 마커 및/또는 일배체형과 LD인 마커가 대리 마커(surrogate marker)로 이용될 수 있다. 일 구체예에서, 대리 마커는 본 명세서에 기재된 바와 같이, 초기에 상기 질병과 연관된 것으로 확인된 마커 또는 일배체형의 경우보다 더 작은 상대적 위험도(RR) 및/또는 오즈비(OR)을 갖는다. 다른 구체예에서, 대리 마커는 본 명세서에 기재된 바와 같이, 상기 질환과 연관된 것으로 초기에 확인된 마커에 대해 초기에 결정된 RR 또는 OR 값보다 큰 RR 또는 OR 값을 갖는다. 그와 같은 구체예의 예는 본 명세서에 기재된 변이와 같은, 상기 질병과 연관되는 것으로 초기에 확인된 보다 더 일반적인 변이(> 10% 집단 빈도)와 LD인 드물거나, 또는 비교적 드문(< 10% 대립인자의 집단 빈도) 변이일 것이다. 본 명세서에 기재된 바와 같이, 본 발명자들에 의해 발견된 연관을 검출하기 위해 그와 같은 마커들을 식별하고 이용하는 것은 본 발명이 속하는 기술 분야의 당업자에게 잘 알려진 통상적인 방법에 의해 수행될 수 있고, 따라서, 본 발명의 범위에 속한다.
일배체형 빈도의 결정
기대값-극대화 알고리즘(expectation-maximization algorithm)을 이용하여 환자군 및 대조군에서 일배체형의 빈도를 추정할 수 있다(Dempster A. et al., J. R. Stat. Soc. B, 39:1-38 (1977)). 결실된 유전형 및 그 상태(phase)에 따른 불확실성을 처리할 수 있는 이 알고리즘의 구현이 이용될 수 있다. 귀무 가설(null hypothesis) 하에서, 환자와 대조군은 동일한 빈도를 갖는 것으로 가정된다. 가능성 방식(likelihood approach)을 이용하여, 본 명세서에 기재된 마커들을 포함할 수 있는, 후보 위험-일배체형이 대조군에서보다 환자에서 보다 높은 빈도를 가지며, 다른 일배체형의 빈도는 양 군에서 동일한 것으로 가정되는 것인 대안적인 가설이 테스트된다. 양 가설 하에 가능성이 각각 극대화되고, 상응하는 1-df 가능성 비 통계값이 통계적 유의성을 평가하기 위해 이용된다.
연관 영역(linkage region) 내에서 위험 마커와 일배체형 및 보호성 마커와 일배체형을 찾기 위해, 예를 들면, 마커들이 실제 영역에 걸쳐있는 경우, 유전형 분석된 마커들의 모든 가능한 조합의 연관이 연구된다. 통합된 환자군과 대조군이 원래의 환자군 및 대조군과 동일한 크기인 두개의 세트로 무작위로 분류될 수 있다. 그 후, 마커 및 일배체형 분석이 반복되고, 기록된 가장 유의성 있는 p-값이 결정된다. 이 랜덤화 체계(randomization scheme)는 p-값의 경험적 분포를 구성하기 위해 예를 들면, 100회 이상 반복될 수 있다. 바람직한 구체예에서, 0.05 미만의 p-값은 유의성 있는 마커 및/또는 일배체형 연관을 나타낸다.
일배체형 분석
일배체형 분석의 일반적인 방법은 NEsted MOdels에 적용된 가능성-기반 추론(likelihood-based inference)을 이용하는 단계를 포함한다(Gretarsdottir S., et al., Nat. Genet. 35:131-38 (2003)). 상기 방법은 다수의 다형성 마커, SNP 및 마이크로새틀라이트에 대해 이용될 수 있는 프로그램 NEMO에서 구현된다. 상기 방법 및 소프트웨어는 특별히, 상이한 위험도를 부여하는 일배체형 그룹을 식별하는 것을 목적으로 하는 케이스-대조군(case-control) 연구를 위해 설계된다. 상기 방법 및 소프트웨어는 또한 LD 구조를 연구하기 위한 도구이다. NEMO에서, 관찰된 데이터가 이를 결실-데이터(missing-data) 문제로 처리하기 때문에, EM 알고리즘을 이용하여, 최대 가능성 추정치, 가능성 비(likelihood ratio) 및 p-값이 직접 계산된다.
상태(phase)의 불확실성 및 결실된 유전형에 따른 정보 소실을 반영한, 관찰된 데이터에 대해 직접 계산된 가능성에 기반한 가능성 비 테스트가 유효한 p-값을 제공하기 위해 이용될 수 있으나, 정보의 불완전성 때문에 소실된 데이터의 양을 아는 것이 여전히 유용할 것이다. 일배체형 분석의 정보 척도(information measure)는 Nicolae and Kong (Technical Report 537, Department of Statistics, University of Statistics, University of Chicago; Biometrics, 60(2):368-75 (2004))에서 연관성 분석(linkage analysis)를 위해 정의된 정보 척도의 당연한 연장(natural extension)으로 설명되며, NEMO에서 구현된다.
질병에 대한 단일 마커 연관을 위해, 각각의 개별적인 대립인자에 대해 양측 p-값(two-sided p-value)을 계산하기 위해 Fisher exact 테스트가 이용될 수 있다. 통상적으로, 모든 p-값은 특별히 표시되지 않으면, 다중 비교(multiple comparison)에 대해 조정되지 않은 상태로 제시된다. (마이크로새틀라이트, SNP 및 일배체형에 대해) 제시된 빈도는 보인자 빈도(carrier frequency)와 대립되는, 대립인자 빈도(allelic frequency)이다. 연관 분석을 위한 가족으로 동원된 환자들의 혈연관계(relatedness)에 따른 편향을 최소화하기 위해, 환자 목록에서 1촌 및 2촌(first and second-degree) 친척들이 제외될 수 있다. 또한, 혈연관계(sibship)에 대해 Risch, N. & Teng, J. (Genome Res., 8:1273-1288 (1998))에 기재된 분산 조정 절차(variance adjustment procedure), DNA 풀링 (ibid)을 확대하여 일반적인 가족 관계(familial relationship)에 적용될 수 있도록, 상기 테스트가 환자들 간의 잔여 혈연관계(remaining relateteness)에 대해 보정하기 위해 연관에 대해 반복될 수 있고, 비교를 위해 조정된 p-값 및 조정되지 않은 p-값을 제시할 수 있다. 차이는 예상되는 바와 같이 일반적으로 매우 작다. 복수 회의 테스트에 대해 보정된 단일-마커 연관성의 유의성을 평가하기 위해, 본 발명자들은 동일한 유전형 데이터를 이용하여 랜덤화 테스트를 수행할 수 있다. 환자와 대조구의 코호트가 랜덤화되고 연관 분석이 복수 회(예를 들면, 500,000회 이하) 재수행되며, 그 p-값은 본 발명자들이 본래의 환자 및 대조구 코호트를 이용하여 관찰한 p-값과 동일하거나 그보다 더 낮은, 일부 대립인자에 대한 p-값을 생성하는 재현의 일부(fraction of replications)이다.
단일 마커 분석 및 일배체형 분석에 대해, 승법 모델(multiplicative model)(일배체형 상대적 위험도 모델), 즉, 한 사람이 갖는 두 개의 대립인자/일배체형의 위험도들이 곱해진다는 승법 모델을 가정하여 상대적 위험도(RR) 및 집단 귀속 위험도(population attributable risk, PAR)가 계산될 수 있다(Terwilliger, J.D. & Ott, J., Hum. Hered. 42:337-46 (1992) and Falk, C.T. & Rubinstein, P, Ann. Hum. Genet. 51 (Pt 3):227-33 (1987)). 예를 들면, RR이 a 대비 A의 위험도라면, 동형접합체 AA를 갖는 사람의 위험도는 이형접합체 Aa의 위험도의 RR배이고, 동형접합체 aa를 갖는 사람의 RR2배일 것이다. 승법 모델은 분석 및 계산을 단순화하는 유용한 특성을 갖는다- 환자 집단(affected population) 및 대조구 집단 내에서 일배체형은 독립적이고, 즉, 하디-와인버그 평형(Hardy-Weinberg equilibrium)에 있다. 그 결과, 환자(affected)와 대조군 각각의 일배체형 계수(haplotype count)는 다항 분포를 가지나, 대안적인 가설 하에서 상이한 일배체형 빈도를 갖는 다항 분포를 갖는다. 구체적으로, 두개의 일배체형, h i h j 에 대해, risk(h i )/risk(h j ) = (f i /p i )/(f j /p j )이고, 상기에서 fp는 각각 환자 집단 및 대조구 집단에서의 빈도를 나타낸다. 실제 모델이 승법성이 아닌 경우, 일부 검정력 손실(power loss)이 있으나, 이 손실은 극단적인 경우를 제외하고는 작은(mild) 경향이 있다. 가장 중요한 것은, p-값은 귀무 가설 하에 계산되기 때문에, 항상 유효하다는 것이다.
NEMO를 이용한 연관 불균형
마커들의 쌍 간의 LD는 D' 및 r2 의 표준 정의를 이용하여 계산될 수 있다(Lewontin, R., Genetics 49:49-67 (1964); Hill, W.G. & Robertson, A. Theor. Appl. Genet. 22:226-231 (1968)). NEMO를 이용하여, 두 마커 대립인자 조합의 빈도가 최대 가능성(maxium likelihood)에 의해 추정되고 연관 균형으로부터의 편향이 가능성 비 테스트(likelihood ratio test)에 의해 평가된다. D' 및 r2의 정의가 한계 대립인자 확률(marginal allele probability)에 의해 가중된 두 마커의 모든 가능한 대립인자 조합에 대해 평균하는 것에 의해 마이크로새틀라이트를 포함하도록 확대된다. 특정한 영역에서 LD 구조를 규명하기 위해 모든 마커 조합을 도시하는 경우, 본 발명자들은 상단 좌측 코너에 D'을 도시하고, 하단 우측 코너에 p-값을 도시한다. LD 도면(plot)에서, 마커들은 필요한 경우, 그들의 물리적 위치에 따라 도시되지 않고, 등거리로 도시될 수 있다.
위험도 평가 및 진단
주어진 집단 내에서, 사람이 특정된 기간 동안 특정한 질병 또는 성향을 발생시킬 가능성으로 정의된, 질병 또는 성향을 발생시킬 절대 위험도(absolute risk)가 있다. 예를 들면, 여성의 유방암에 대한 평생 절대 위험도(lifetime absolute risk)는 1/9이다. 즉, 9명의 여성 당 1명은 그들의 일생 중 어느 시점에 유방암을 발병할 것이다. 위험도(risk)는 통상적으로 특정인이 아니라, 매우 많은 수의 사람들을 조사하는 것에 의해 측정된다. 위험도는 종종 절대적 위험도(Absolute Risk, AR) 및 상대적 위험도(Relative Risk, RR)로 제시된다. 상대적 위험도는 두개의 변이와 연관된 위험도, 또는 두개의 상이한 사람들의 그룹의 위험도를 비교하기 위해 이용된다. 예를 들면, 상대적 위험도는 특정한 유전형을 갖는 사람들의 그룹과 다른 유전형을 갖는 또 다른 그룹을 비교하기 위해 이용될 수 있다. 질병에 대해, 2의 상대적 위험도는 하나의 그룹이 나머지 그룹보다 질병을 발병할 가능성이 두배 높다는 것을 의미한다. 제시된 위험도는 일치된 성별 및 민족의 집단 대비, 1인, 또는 1인의 특정한 유전형에 대한 상대적 위험도이다. 동일한 성별 및 민족의 2인의 위험도는 단순한 방식으로 비교될 수 있다. 예를 들면, 집단에 비교되는 경우, 제1 개체는 1.5의 상대적 위험도를 가지며, 제2 개체는 0.5의 상대적 위험도를 가지며, 제2 개체 대비 제1 개체의 위험도는 1.5/0.5 = 3이다.
본 명세서에 기재된 바와 같이, 특정한 다형성 마커 및 그와 같은 마커를 포함하는 일배체형이 유방암의 위험도 평가를 위해 유용한 것으로 확인되었다. 위험도 평가는 유방암에 대한 감수성을 진단하기 위한 마커의 이용을 포함할 수 있다. 다형성 마커의 특정한 대립인자는 유방암의 진단을 갖지 않는 개체들에서보다, 유방암의 진단을 갖는 개체들에서 보다 빈번하게 발견된다. 그러므로, 이 마커 대립인자들은 개체에서 유방암, 또는 유방암에 대한 감수성을 검출하기 위한 예측적 가치(predictive value)를 갖는다. 본 발명의 마커와 같은, 위험 마커들을 포함하는 일배체형 블럭 또는 LD 블럭 내의 태깅 마커들(tagging markers)이 일배체형 블럭 또는 LD 블럭 내의 다른 마커 및/또는 일배체형에 대한 대리물(surrogate)로 이용될 수 있다. 1의 r 2 값을 갖는 마커들이 위험 변이(at-risk variant)에 대한 완벽한 대리물이고, 즉, 하나의 마커에 대한 유전형이 나머지 마커에 대한 유전형을 완벽하게 예측한다. 1보다 작은 r 2 값을 갖는 마커들도 위험 변이의 대리물일 수 있거나, 또는 대안적으로 그 위험 변이만큼 높거나 또는 그 변이보다 훨씬 더 높은 상대적 위험도 값을 갖는 변이를 나타낸다. 확인된 위험 변이는 그 자체로 기능적 변이가 아닐 수 있으나, 이 경우, 진정한 기능적 변이와 연관 불균형 관계일 수 있다. 본 발명은 본 명세서에 개시된 마커에 대한 그와 같은 대리 마커(surrogate marker)의 평가를 포함한다. 그와 같은 마커들이 본 발명이 속하는 기술 분야의 당업자에게 잘 알려진 바와 같이, 공개 데이터베이스에 설명(annotate)되고, 맵핑되고, 열거되어 있거나, 또는 대안적으로 개체들의 군에서 본 발명의 마커에 의해 확인된 영역 또는 그 영역의 일부를 서열결정하고, 결과적으로 수득된 서열의 군에서 다형성을 식별하는 것에 의해 용이하게 식별될 수 있다. 그 결과, 본 발명이 속하는 기술 분야의 당업자는 용이하게, 과도한 실험 없이 본 명세서에 기재된 마커 및/또는 일배체형과 연관 불균형인 대리 마커들의 유전형을 분석할 수 있다. 검출된 위험 변이와 LD인 태깅 마커 또는 대리 마커도 개인에서 유방암, 또는 유방암에 대한 감수성에 대한 연관을 검출하기 위한 예측적 가치를 갖는다. 본 발명의 마커들과 LD인 이 태깅 마커들 또는 대리 마커들은 또한 이들이 유사하게 유방암에 대한 감수성을 검출하기 위한 예측적 가치를 갖기 때문에, 일배체형들을 구별하는 다른 마커들을 포함할 수 있다.
특정 구체예에서, 본 발명은 유방암과 연관된 것으로 본 명세서에 기재된 변이의 존재에 대해 개인으로부터 유래된 게놈 DNA를 포함하는 시료를 평가하는 것에 의해 실시될 수 있다. 그와 같은 평가는 당업자에게 잘 알려지고 본 명세서에서 더 설명될 방법을 이용하여, 하나 이상의 다형성 마커의 하나 이상의 대립인자의 존재 또는 부재를 검출하는 단계를 포함하고, 그와 같은 평가의 결과에 근거하여 시료가 유래된 개인이 유방암의 증가된 위험도 또는 감소된 위험도(증가된 감수성 또는 감소된 감수성)를 갖는지 여부를 결정한다. 대안적으로, 본 발명은 유방암과 연관된 것으로 본 명세서에 기재된 하나 이상의 다형성 마커(또는 유방암과 연관된 것으로 본 명세서에서 입증된 하나 이상의 마커와 연관 불균형인 마커)의 유전형 상태에 대한 정보를 포함하는 데이터세트를 이용하여 실시될 수 있다. 다시 말하면, 그와 같은 유전적 상태에 대한 정보, 예를 들면, 특정한 다형성 마커, 또는 복수 개의 마커에서의 유전형 계수(genotype count)의 형태(예를 들면, 특정한 위험 대립인자의 존재 또는 부재의 표시), 또는 하나 이상의 마커에 대한 실제의 유전형의 형태로 유전적 상태에 대한 정보를 포함하는 데이터세트가 유방암과 연관된 것으로 본 발명자들에 의해 입증된 특정한 다형성 마커의 특정한 위험 대립인자의 존재 또는 부재를 위해 조사될 수 있다. 본 명세서에서 입증된, 유방암과 연관된 변이(예를 들면, 마커 대립인자)에 대한 양성 결과는 상기 데이터세트가 유래된 개인이 하나 이상의 유방암의 증가된 감수성(증가된 위험도)을 갖는다는 것을 나타낸다.
본 발명의 특정한 구체예에서, 다형성 마커는 다형성 마커에 대한 유전형 데이터를 다형성의 하나 이상의 대립인자와 질환 간의 상관관계를 포함하는 참조표를 참조하는 것에 의해, 유방암과 상관된다. 일부 구체예에서, 상기 표는 하나의 다형성에 대한 상관관계를 포함한다. 다른 구체예에서, 상기 표는 복수 개의 다형성에 대한 상관관계를 포함한다. 두 시나리오 모두에서, 마커와 유방암 간의 상관관계의 표시를 제공하는 참조표를 참조하는 것에 의해, 유방암에 대한 위험도, 또는 유방암에 대한 감수성이 시료가 유래된 개인에서 확인될 수 있다. 일부 구체예에서, 상관관계가 통계적 척도로서 보고된다. 통계적 척도는 상대적 위험도(RR), 절대 위험도(AR), 또는 오즈비(OR)과 같은 위험도 척도로 보고될 수 있다.
본 발명의 마커 및 일배체형, 예를 들면, 염색체 2q14.2, 염색체 2q35, 및 염색체 16q12 상의 다형성 마커 및 일배체형, 예를 들면, 표 10, 표 15, 표 19, 표20, 표 21 및 표 22에 제시된 마커들, 및 이들과 연관 불균형인 마커들, 예를 들면, 마커 rs4848543, rs13387042 및 rs3803662는 단독으로, 또는 조합되어 유방암의 위험도 평가 및 진단적 목적을 위해 유용할 수 있다. 따라서, 개별적인 마커에 의한 위험도의 증가가 비교적 크지 않은 경우, 즉, 10-30%의 수준인 경우에도, 연관은 유의성 있는 영향을 가질 수 있다. 따라서, 상대적으로 일반적인 변이가 전체 위험도에 대해 유의성 있는 기여도를 가질 수 있거나(집단 귀속 위험도(PAR)이 높음), 또는 마커들의 조합이 마커들의 통합된 위험도에 근거하여, 유방암을 발병할 유의성 있는 통합 위험도(combined risk)를 갖는 개체들의 그룹을 정의하기 위해 이용될 수 있다.
따라서, 본 발명의 일 구체예에서, 복수의 변이(마커 및/또는 일배체형)가 전체 위험도 평가를 위해 이용된다. 일 구체예에서, 이 변이들은 본 명세서에 개시된 변이들로부터 선택된다. 다른 구체예는 유방암에 대한 감수성의 진단을 위해 유용한 것으로 알려진 다른 변이와 조합된 본 발명의 변이의 용도를 포함한다. 그와 같은 구체예에서, 개인에서 복수의 마커 및/또는 일배체형의 유전형 상태(genotype status)가 결정되고, 상기 개인의 상태가 연관된 변이의 집단 빈도, 또는 연령-조화되고(age-matched) 성별-조화된 개체와 같은 임상적으로 건강한 개체에서의 상기 변이의 빈도와 비교된다. 다변량 분석(multivariate analysis) 또는 결합 위험도 분석과 같은, 본 발명이 속하는 기술분야에 공지된 방법들이 복수의 유전자 좌에서의 유전형 상태에 근거하여 부여된 전체 위험도를 결정하기 위해 뒤이어 이용될 수 있다. 그와 같은 분석에 근거한 위험도의 평가가 뒤이어 본 명세서에 개시된 본 발명의 방법 및 키트에서 이용될 수 있다.
전술된 바와 같이, 인간 게놈의 일배체형 블럭 구조는 질병 또는 성향(trait)과 원래 연관된 변이와 연관 불균형인 다수의 변이(마커 및/또는 일배체형)가 상기 질병 또는 성향에 대한 연관을 평가하기 위한 대리 마커(surrogate marker)로 이용될 수 있게 하는 효과를 갖는다. 그와 같은 대리 마커의 갯수는 해당 영역에서 과거의 재조합율(historical recombination rate), 해당 영역에서의 돌연변이 빈도(즉, 해당 영역에서 다형성 부위 또는 마커의 갯수), 및 해당 영역에서 LD의 정도(LD 블럭의 크기)와 같은 인자에 의존적일 것이다. 이 마커들은 통상적으로 본 명세서에 기재된 방법 또는 본 발명이 속하는 기술 분야의 당업자에게 알려진 다른 방법을 이용하여 정의된 LD 블럭 또는 일배체형 블럭의 물리적 경계 내에 위치한다. 그러나, 종종 마커 및 일배체형 연관이 정의된 일배체형 블럭의 물리적 경계를 넘어 연장되는 것으로 발견된다. 그와 같은 경우에, 마커 및/또는 일배체형은 또한 정의된 바와 같은 일배체형 블럭 내에 물리적으로 위치하는 마커 및/또는 일배체형을 위한 대리 마커 및/또는 일배체형으로 이용될 수 있다. 그 결과, 본 발명의 마커 및 일배체형과 LD(통상적으로, 0.4보다 큰 r2을 포함한, 0.3보다 큰 r2을 포함한, 0.2보다 큰 r2과 같은, 0.1보다 큰 r2을 특징으로 함)인 마커 및 일배체형도, 그들이 물리적으로 정의된 바와 같은 일배체형 블럭의 경계 외부에 존재하는 경우에도 본 발명의 범위 내에 속한다. 이는 본 명세서(예를 들면, 표 10, 표 15 및 표 19)에 기재된 마커들을 포함하나, 또한 표 10, 표 15 및 표 19에 열거된 하나 이상의 마커와 강한 LD(예를 들면, 0.1보다 큰 r2, 0.2보다 큰 r2 및/또는 |D'| > 0.8을 특징으로 함)인 다른 마커들을 포함할 수 있다.
본 명세서에 기재된 SNP 마커의 경우, 환자에서 과량으로 존재하는 것으로 확인된 대립인자(위험-대립형질)에 대한 반대 대립인자(opposite allele)는 유방암에서 감소된 빈도로 발견된다. 따라서, 이 마커들 및 일배체형은 유방암에 대해 보호성이고, 즉, 그들은 이 마커들 및/또는 일배체형을 갖는 개인들이 유방암을 발병할 감소된 위험도 또는 유방암에 대한 감소된 감수성을 부여한다.
특정한 일배체형을 포함한, 본 발명의 특정 변이들은 일부 경우에, 다양한 유전적 마커들의 조합, 예를 들면, SNP와 마이크로새틀라이트의 조합을 포함한다. 따라서, 일배체형을 검출하는 것은 본 발명이 속하는 기술 분야에서 알려지고 및/또는 본 명세서에 기재된, 다형성 부위에서의 서열을 검출하는 방법에 의해 달성될 수 있다. 또한, 특정한 일배체형 또는 일련의 마커들과 질병 표현형 간의 상관관계가 표준 기법을 이용하여 검증될 수 있다. 상관관계에 대한 간단한 검정의 예는 2 x 2 표(two by two table) 상에서의 Fisher-exact 검정이다.
특정한 구체예에서, 유방암과 연관된 것으로 확인된 마커 대립인자 또는 일배체형(예를 들면, 표 10, 표 15, 표 19, 표 20, 표 21 및 표 22에 열거된 마커 대립인자, 및 이들과 연관 불균형인 마커들)은 상기 마커 대립인자 또는 일배체형이 건강한 개체(대조군)에서의 존재 대비, 유방암에 대한 위험을 갖는 개체(질병군(affected))에 보다 빈번하게 존재하고, 상기 마커 대립인자 또는 일배체형의 존재는 유방암 또는 유방암에 대한 감수성을 나타내는 것인 마커 대립인자 또는 일배체형이다. 다른 구체에에서, 유방암과 연관된 것으로 확인된 하나 이상의 마커(예를 들면, 표 10, 표 15, 표 19, 표 20, 표 21 및 표 22에 열거된 마커 대립인자, 및 이들과 연관 불균형인 마커들)와 연관 불균형인 위험 마커(at-risk marker)는 건강한 개체(대조군)에서의 존재 대비, 유방암에 대한 위험을 갖는 개체(질병군)에 보다 빈번하게 존재하는 태깅(tagging) 마커이고, 상기 태깅 마커의 존재는 유방암에 대한 증가된 감수성을 나타낸다. 또 다른 구체예에서, 유방암과 연관된 것으로 확인된 하나 이상의 마커(예를 들면, 표 10, 표 15, 표 19, 표 20, 표 21 및 표 22에 열거된 마커 대립인자, 및 이들과 연관 불균형인 마커들)와 연관 불균형인 위험 마커 대립인자(즉, 증가된 감수성을 부여하는 대립인자)는 건강한 개체(대조군)에서의 존재의 빈도 대비, 유방암에 대한 위험을 갖는 개체(질병군)에 보다 빈번하게 존재하는 하나 이상의 대립인자를 포함하는 마커이고, 상기 마커의 존재는 유방암에 대한 증가된 감수성을 나타낸다.
연구 집단(study population)
일반적으로, 본 발명의 방법 및 키트는 임의의 원천 및 임의의 개체으로부터의 핵산 물질(DNA 또는 RNA)를 포함하는 시료로부터 이용될 수 있다. 바람직한 구체예에서, 개체는 인간이다. 개인은 성인, 아동, 또는 태아일 수 있다. 본 발명은 또한, 표적 집단의 구성원인 개체에서 마커 및/또는 일배체형을 평가하는 방법을 제공한다. 일 구체예에서, 그와 같은 표적 집단은 다른 유전적 인자, 바이오마커, 생체물리적 인자(예를 들면, 체중, BMD, 혈압), 또는 전반적인 건강 및/또는 생활방식 파라미터(예를 들면, 질병 또는 관련 질병의 병력, 질병의 과거 진단, 질병의 가족력)에 기반하여, 상기 질병을 발병할 위험도를 갖는 개체들의 집단 또는 그룹이다.
본 발명은 40세 이상, 45세 이상, 또는 50세 이상, 55세 이상, 60세 이상, 65세 이상, 70세 이상, 75세 이상, 80세 이상, 또는 85세 이상의 개인과 같은, 특정한 연령 서브그룹으로부터의 개인을 포함하는 구체예를 제공한다. 본 발명의 다른 구체예는 80세 미만, 75세 미만, 또는 70세 미만, 65세 미만, 60세 미만, 55세 미만, 50세 미만, 45세 미만, 40세 미만, 35세 미만, 또는 30세 미만과 같은, 85세 미만의 개인과 같은, 다른 연령군에 관한 것이다. 다른 구체예는 전술된 임의의 연령 범위에 속하는 발병 연령을 갖는 개인에 관한 것이다. 또한, 특정한 구체예에서, 45세를 초과하나, 60세 미만인 발병 연령과 같은 일정 범위의 연령이 관련된 것일 수 있는 것으로 고려된다. 그러나, 앞서 열거된 연령값에 의해 일괄된 모든 연령 범위를 포함한, 다른 연령 범위도 고려된다. 본 발명은 또한 하나의 성별의 개인, 남성 또는 여성에 관한 것이다. 또 다른 구체예에서, 본 발명은 여성에 관한 것인다.
아이슬란드 집단은 북유럽 선조 기원의 코카서스인 집단이다. 아이슬란드 집단에서 유전적 연관(genetic linkage)과 관련성(association)의 결과를 보고하는 다수의 연구가 최근 수년간 발표되었다. 그와 같은 다수의 연구들은 다른 집단에서, 최초에 아이슬란드 집단에서 특정 질환과 연관된 것으로 확인된 변이의 재현을 보여준다(Stacey, S.N., et al., Nat Genet. May 27 2007 (Epub ahead of print; Helgadottir, A., et al., Science 316:1491-93 (2007); Steinthorsdottir, V., et al., Nat Genet. 39:770-75 (2007); Gudmundsson, J., et al., Nat Genet. 39:631-37 (2007); Amundadottir, L.T., et al., Nat Genet. 38:652-58 (2006); Grant, S.F., et al., Nat Genet. 38:320-23 (2006)). 따라서, 아이슬란드 집단에서의 유전적 발견이 아프리카 및 아시아로부터의 집단을 포함한, 다른 집단에서 재현되었다.
유방암과 연관된 것으로 확인된 본 발명의 마커들은 다른 인간 집단에서 유사한 연관성을 보이는 것으로 사료된다. 따라서, 개별적인 인간 집단을 포함하는 특정한 구체예가 또한 고려되며 본 발명의 범위 내에 속한다. 그와 같은 구체예는 코카서스 집단, 유럽 집단, 미국 집단, 유라시아 집단, 아시아 집단, 중앙/남아시아 집단, 동아시아 집단, 중동 집단, 아프리카 집단, 라틴 아메리카 집단, 및 오세아니아 집단을 포함하나, 이에 한정되지 않는 하나 이상의 인간 집단으로부터의 인간 개체에 관한 것이다. 유럽 집단은 스웨덴 집단, 노르웨이 집단, 핀란드 집단, 러시아 집단, 덴마크 집단, 아이슬란드 집단, 아일랜드 집단, 켈트(Kelt) 집단, 영국 집단, 스코틀랜드 집단, 네덜란드 집단, 벨기에 집단, 프랑스 집단, 독일 집단, 스페인 집단, 포르투갈 집단, 이탈리아 집단, 폴란드 집단, 불가리아 집단, 슬라브 집단, 세르비아 집단, 보스니아 집단, 체코 집단, 그리스 집단, 및 터키 집단을 포함하나, 이에 한정되지 않는다. 다른 구체예에서, 본 발명은 또한 반투(Bantu), 만덴크(Mandenk), 요루바(Yoruba), 산(San), 음부티 피그미(Mbuti Pygmy), 오르카디안(Orcadian), 아디겔(Adygel), 러시안(Russian), 사르디니안(Sardinian), 투스칸(Tuscan), 모자비트(Mozabite), 베두인(Bedouin), 드루즈(Druze), 팔레스티니안(Palestinian), 발로치(Balochi), 브라휘(Brahui), 마크라니(Makrani), 신디(Sindhi), 파탄(Pathan), 부루쇼(Burusho), 하자라(Hazara), 위구르(Uygur), 칼라쉬(Kalash), 한(Han), 다이(Dai), 다우르(Daur), 헤젠(Hezhen), 라후(Lahu), 미아오(Miao), 오로켄(Oroqen), 쉬(She), 투지아(Tujia), 투(Tu), 시보(Xibo), 이(Yi), 몽골란(Mongolan), 낙시(Naxi), 캄보디안(Cambodian), 일본인( Japanese), 야쿠트(Yakut), 멜라네시안(Melanesian), 파푸안(Papuan), 카리티아난(Karitianan), 수루이(Surui), 콜럼비안(Columbian), 마야(Maya) 및 피마(Pima)를 포함하나, 이에 한정되지 않는 특정한 인간 집단에서 실시될 수 있다.
일 구체예에서, 본 발명은 아프리카 후손 또는 계통의 사람을 포함하는 집단과 같은 블랙 아프리카 선조(ancestry)를 포함하는 집단에 관한 것이다. 블랙 아프리가 선조는 흑인(black race)에 속하거나 또는 니그로 인종(negro race)에 속하는, 아프리카계 미국인(African-American), 아프로-아메리칸(Afro-American), 블랙 아메리칸(Black American)으로 자가-보고하는 것에 의해 결정될 수 있다. 예를 들면, 아프리카계 미국인 또는 블랙 아메리칸은 북미에 거주하고 아프리카의 흑인군에 속하는 기원을 갖는 사람들이다. 또 다른 예에서, 블랙 아프리카 선조의 자가-보고된 사람은 한 명 이상의 블랙 아프리카 선조의 부모 또는 한 명 이상의 블랙 아프리카 선조의 조부모를 가질 수 있다.
개체에서 인종적 기여는 또한 유전적 분석에 의해 결정될 수 있다. 선조의 유전적 분석은 Smith et al. (Am J Hum Genet 74, 1001-13 (2004))에 개시된 마커와 같은, 연관되지 않은(unlinked) 마이크로새틀라이트 마커를 이용하여 수행될 수 있다.
특정한 구체예에서, 본 발명은 앞서 기재된 바와 같이, 특정한 집단에서 확인된 마커 및/또는 일배체형에 관한 것이다. 본 발명이 속하는 기술 분야의 당업자는 상이한 집단에 적용되는 경우, 연관 불균형(LD)의 척도는 상이한 결과를 가져올 수 있다는 것을 이해할 것이다. 이는 특정한 게놈 영역에서 LD의 차이를 초래했을 수 있는 차등적 선택 압력(differential selective pressure) 및 상이한 인간 집단의 상이한 집단 역사 때문이다. 일부 마커들, 예를 들면, SNP 마커들이 상이한 집단에서 상이한 집단 빈도를 가지거나, 또는 하나의 집단에서는 다형성이나, 또 다른 집단에서는 다형성이 아니라는 것이 본 발명이 속하는 기술 분야의 당업자에게 잘 알려져 있다. 그러나, 본 발명이 속하는 기술 분야의 당업자는 입수가능한 방법을 적용하고, 본 명세서에서 고려되는 바와 같이, 임의의 인간 집단에서 본 발명을 실시할 것이다. 이는 특정한 집단 내에서 가장 강력한 연관을 제공하는 마커들을 확인하기 위해, 본 발명의 LD 영역에서 다형성 마커를 평가하는 것을 포함할 수 있다. 따라서, 본 발명의 위험 변이는 다양한 인간 집단에서 상이한 일배체형 배경에 상이한 빈도로 존재할 수 있다. 그러나, 당해 분야에서 알려진 방법 및 본 발명의 마커를 이용하여, 본 발명이 임의의 주어진 인간 집단에서 실시될 수 있다.
유전적 검사의 유용성
본 발명이 속하는 기술 분야의 당업자는 본 명세서에 기재된 변이가 일반적으로 그 자체로 특정한 유방암을 발병할 개인의 절대적 확인을 제공하지 않는다는 것을 고려하고 이해할 것이다. 그러나, 본 명세서에 기재된 변이는 본 발명의 위험 또는 보호성 변이를 갖는 개인이 유방암을 발병할 증가된 및/또는 감소된 가능성을 나타낸다. 그러나, 이 정보는 하기에서 보다 상세하게 요약되는 바와 같이, 그 자체로 매우 유용하며, 이 정보는 질병 관리 및 적합한 치료 옵션의 선택을 위해 이용될 수 있기 때문이다.
질병(예를 들면, 유방암)을 발병할 위험도를 부여하는 유전적 변이에 대한 지식은 상기 질환을 발병할 증가된 위험도를 갖는 개체(즉, 위험 변이의 보인자)와 상기 질환을 발병할 감소된 위험도를 갖는 개체(즉, 보호성 변이의 보인자)를 구별하기 위해 유전적 테스트를 적용할 기회를 제공한다. 상기 언급된 두 그룹에 속하는 개체들에 대해, 유전적 테스트의 핵심 가치는 조기 단계에 질병, 또는 질병에 대한 소인을 진단하고 가장 적절한 치료를 제공할 수 있도록 하기 위해 임상의에게 질병의 예후/공격성(aggressiveness)에 대한 정보를 제공할 수 있는 가능성이다.
유방암에 대한 유전 위험도를 예측하는 모델
유방암 위험도 평가의 목표는 고-위험도 여성에서 생존율과 삶의 질을 증가시키면서 비용, 불필요한 개입 및 보다 낮은 위험도의 여성에서 우려를 최소화하기 위해 모든 여성에 대해 맞춤화된 의료 관리 전략의 수립을 위한 합립적인 프레임워크를 제공하는 것이다. 위험도 예측 모델은 주어진 세트의 선천척 위험 특성(예를 들면, 가족력, 과거의 양성 유방 병변(prior benign breast lesion), 과거의 유방 종양)을 갖는 개인에서 유방암에 대한 위험도를 추정한다. 임상에서 가장 일반적으로 이용되는 유방암 위험도 예측 모델은 가족력을 고려하는 것에 의해 유전된 위험 인자들을 추정한다. 위험 추정치는 과거에 유방암으로 진단받은 1명 이상의 가까운 친척을 갖는 개인에 대한 증가된 위험도의 관찰에 근거한다. 위험 추정치는 복잡한 가계도 구조를 고려하지 않는다. 이 모델들은 유방암 소인 돌연변이(breast cancer predisposing mutation)를 갖는 유전자의 보인자와 비-보인자를 구별할 수 없는 추가적인 단점을 갖는다.
보다 정교한 위험도 모델은 특정한 가족력을 다루고 BRCA1 및 BRCA2 돌연변이에 대한 보인자 상태를 고려할 수 있는 능력을 갖는 보다 우수한 메카니즘을 갖는다. 예를 들면, BOADICEA(Breast and Ovarian Analysis of Disease Incidence and Carrier Estimation Algorithm) (Antoniou et al., 2004)는 가계도 분석 프로그램 MENDEL을 통해 개별적인 가계도 구조에 근거하여 가족력을 고려한다. 공지된 BRCA1 및 BRCA2 상태에 대한 정보도 고려된다. BOADICEA 및 현재 사용되는 모든 다른 유방암 위험도 모델의 주요한 한계는 그들이 다른 소인 유전자로부터의 유전형 정보를 고려하지 않는다는 것이다. 현재의 모델들은 위험도의 비-BRCA 유전적 결정인자(genetic determinant)의 지식 부족을 보충하는 대리물(surrogate)로 작용하기 위해 가족력에 크게 의존한다. 따라서, 이용가능한 모델들은 질병의 공지된 가족력이 있는 상황들에 한정된다. 보다 낮은 침투성 유방암 소인 유전자들은 집단에서 비교적 일반적일 수 있고 BRCA1 및 BRCA2 유전자처럼 가족성 클러스터링(familiar clustering)을 주도하는 강한 경향을 보이지 않을 수 있다. 소인성 대립인자(predisposition allele)의 비교적 높은 유전적 부하(genetic load)를 갖는 환자들은 질병의 가족력을 거의 또는 전혀 보이지 않을 수 있다. 따라서, 유전자-기반 테스트를 통해 직접적으로 수득된 유전된 감수성 데이터를 내포시키는 모델을 구축할 필요성이 존재한다. 모델들을 보다 정확하게 만드는 것 외에, 이는 가족력 파라미터에 대한 의존성을 감소시키고 위험도 프로파일링을 가족력이 그와 같은 주요 인자가 아닌 보다 넓은 위험 집단(at-risk populatoin)으로 확장하는 것을 지원할 것이다.
개선된 유전적 위험도 모델의 유방암 일차 예방(primary prevention)의 임상적 관리로의 통합
임상적 일차 예방 옵션은 현재 화학적 예방(chemopreventative)(또는 호르몬) 치료 및 예방적 수술(prophylactic surgery)이다. 고위험군으로 확인된 환자들에게 화학적 예방 요법의 장기 코스가 처방될 수 있다. 이 개념은 심혈관 의학 부분에서는 잘 수용되나, 임상적 종양학에서는 이제 영향을 미치기 시작하고 있다. 가장 널리 이용되는 종양의 화학적 예방제는 선택적 에스트로겐 수용제 조절제(SERM)인 타목시펜이다. 처음에 유방암 재발에 대한 아쥬반트 요법으로 이용되었던 타목시펜은 이제 유방암 예방제로서 입증된 효능을 갖는다(Cuzick et al., 2003; Martino et al., 2004). FDA는 일부 고위험 여성에서 화학적 예방제로서 타목시펜의 이용을 허가했다.
안타깝게도, 장기적인 타목시펜 이용은 자궁내막암(endometrial cancer)에 대한 위험도를 약 2.5배 증가시키고 정맥 혈전증의 위험도를 약 2.0배 증가시킨다. 폐색전증, 뇌졸중, 및 백내장에 대한 위험도도 증가된었다(Cuzick et al., 2003). 따라서, 유방암 발생률을 낮추기 위한 타목시펜 이용의 장점은 전체 사망률의 상응하는 감소로 용이하게 실현되지 못할 수 있다. 랄록시펜이라 불리는 또 다른 SERM은 예방적 모드에서 보다 효과적이고, 자궁내막암에 대한 동일한 위험을 갖지 않는다. 그러나, 랄록시펜으로 장기 치료된 환자에서 혈전증에 대한 위험도는 여전히 증가된다(Cuzick et al., 2003; Martino et al., 2004). 또한, 타목시펜과 랄록시펜은 모두 그들과 연관된 삶의 질 문제를 갖는다. 화학적 예방 모드에서 SERM 요법의 합리적인 위험:이익 분석을 수행하기 위해, 유방암에 대한 가장 높은 위험도를 갖는 개체들을 확인해야 하는 임상적 요구가 있다. 유방암에 대한 위험도의 상당한 부분이 유전적이라는 점을 고려할 때, 유방암에 대해 개인의 위험도를 정량하기 위한 유전적 테스트에 대한 명백한 임상적 요구가 존재한다. 아로마타아제 저해제와 같은, 이용가능해질 수 있는 미래의 암 화학적 예방 치료제로부터 유사한 문제들이 발생할 것을 예상할 수 있다. 또한, 화학적 예방 요법이 보다 안전해지기 때문에, 유전적으로 소인을 가지나, BRCA1 및 BRCA2 보인자와 연관된 크게 증가된 위험도를 갖지 않는 환자들을 확인해야 할 증가된 요구가 존재한다.
유방암에 대한 고위험도를 갖는 것으로 확인된 환자들은 예방적 수술에 대해 고려될 수 있다; 양측 유방절제술 또는 난소절제술 또는 양자 모두. 명백하게, 그와 같은 근치적인 치료법(drastic treatment)은 매우 높은 위험도를 갖는 환자들에게만 권고된다. 실제로, 그와 같은 위험도는 현재 BRCA1, BRCA2, 또는 리-프라우메니 증후군(Li-Fraumeni Syndrome)의 p53, 코우덴 증후군(Cowden's syndrome)의 PTEN과 같은 희귀 유방암 소인성 증후군(rare breast cancer predisposition syndrome)에 관여하는 것으로 알려진 유전자들에 돌연변이를 갖는 개체들에서만 확인될 수 있다.
BRCA1 및 BRCA2 돌연변이의 침투율의 추정치는 그들이 집단-기반 추정치로부터 유래되는 경우보다 다중-케이스 가족(multiple-case family)들로부터 유래될 때 더 높은 경향이 있다. 이는 상이한 돌연변이-보인(mutaion-carrying) 가족들이 유방암에 대한 상이한 침투율을 보이기 때문이다(예를 들면, Thorlacius et al., 1997 참조). 이 변이에 기여하는 주요한 인자들 중 하나는 그 효과가 BRCA1 및 BRCA2 돌연변이의 침투율을 변형시키는 것인 미지의 소인성 유전자(unknown predisposition gene)의 작용이다. 따라서, BRCA1 또는 BRCA2 유전자에 돌연변이를 갖는 개체에 대한 절대적 위험도는 변형시키는 유전자(modifying gene)의 존재 및 작용에 대한 이해 없이 정확하게 정량될 수 없다. BRCA1 및 BRCA2 보인자에 대한 치료 옵션은 가혹할 수 있기 때문에, 가능한 한 가장 정확하게 개별적인 BRCA 보인자에 대한 위험도를 정량하는 것이 중요하다. 따라서, BRCA1 및 BRCA2 보인자에서 유방암의 침투를 변형시키는 효과를 갖는 소인성 유전자(predisposition gene)를 확인하고 이 유전자들에 기반한 개선된 위험도 평가 모델을 수립해야 하는 필요성이 존재한다.
또한, 유방암의 강한 가족력 때문에 유방암에 대한 매우 높은 위험도를 갖는 것으로 인식되나, 알려진 소인성 유전자에서 돌연변이를 확인할 수 없는 개체들이 있다. 그와 같은 경우에, 고 침투성 소인성 유전자를 유전받았는지 여부를 확인하기 위해 개체를 테스트할 수 없기 때문에, 예방적 수술의 고려가 어렵다. 따라서, 개체의 위험도가 정확하게 평가될 수 없다. 따라서, 밝혀지지 않은 고 침투성 소인성 유전자를 확인하고 일차적인 예방 전략에서 사용할 관련된 유전적 테스트를 개발해야 하는 명백한 임상적 요구가 존재한다.
조기 진단
대부분의 서양 국가에서 유방암에 대한 임상적 스크리닝은 정기적인 임상적 유방 검사(clinical breast excamination, CBE) 및 X-선 유방촬영술이다. CBE는 우수한 유방촬영 스크리닝 프로그램에서 사용될 때 부가적인 이익을 거의 갖지 않는다는 것을 나타내는 우수한 증거가 있다. 영국에서, 50세 내지 70세의 여성들은 3년마다 스크리닝 유방촬영술을 받을 수 있다. 미국의 경우, 건강관리 제공자에 따라 다르나, 미국 암협회(the American Cancer Society)는 40세부터 매년 유방촬영 스크리닝을 권장한다. 유방촬영 스크리닝은 50세 이상의 스크리닝된 여성에서 사망율을 감소시키는 입증된 효과를 갖는다.
유전적 검사가 기존의 유방촬영 스크리닝 프로그램에 대한 접근을 감소시키는 수단으로 이용될 것 같지 않다. 그러나, 유방촬영 스크리닝도 단점을 가지며 유전적 검사가 강화된 스크리닝 프로그램을 위한 대상자들을 선별하기 위해 이용되는 것이 고려될 수 있다. 유방촬영 스크리닝의 단점 중 하나는 현재까지 50세 전에 스크리닝된 여성에 대해 개선된 생존율에 대한 유의성 있는 효과를 입증하는 것이 가능하지 않았다는 것이다.
유방촬영술이 50세 미만의 여성에서 덜 효과적인 한가지 이유는 유방 조직의 밀도(density)가 더 어린 여성에서 더 높아서, 종양의 유방촬영에 의한 검출을 더 어렵게한다는 것이다. 그러나, 소인을 갖는 개체에서 유방암은 어린 연령군에서 일어나는 경향이 있고 높은 유방 밀도와 유방암 위험도 간의 명확한 연관이 있다. 따라서, 높은 소인을 갖는 개체가 최고 위험도의 그룹에서 최적 미만으로 작동될 기법에 의해 관리될 수 있기 때문에, 이들에서 유방촬영 스크리닝의 단순한 증가에 따른 문제가 있다. 최근의 연구는 CE-MRI(contrast-enhanced magnetic resonance)가 유방촬영 스크리닝보다 더 민감하고 이 고위험도 그룹에서 보다 조기에 종양을 검출한다는 것을 보여주었다(Warner et al., 2004; Leach et al., 2005). CE-MRI 전략은 통상적인 X-선 유방촬영술과 조합되어 이용될 때 특히 효과적이다 (Leach et al., 2005). CE-MRI는 고 비용을 초래하는 전문 센터(specialist center)를 필요로 하므로, 50세 미만의 스크리닝은 최고 위험도에 있는 개체들로 제한되어야 한다. 현재의 CE-MRI 시험은 BRCA1, BRCA2 또는 p53 돌연변이 또는 질병의 매우 강한 가족력을 갖는 개체들로의 적용에 한정된다. 이 스크리닝 방법(modality)을 보다 넓은 범위의 고-위험군 환자들로 확장하는 것은 유전자-기반 위험도 프로파일링 도구의 제공에 의해 크게 촉진될 것이다.
조기발병 유방암 및 유전적 소인을 갖는 여성에서 발생하는 암이 장년층의, 덜 강한 유전적 소인을 갖는 여성에서 발생한 암보다 더 빠르게 성장한다는 견해를 뒷받침하는 좋은 증거가 있다. 이 증거는 젊은 여성에서 중간암(interval cancer)의 보다 높은 비율의 관찰로부터 유래되며, 즉, 잘 스크리닝된 집단에서 스크리닝을 위한 방문간 간격에 발생하는 암이 젊은 여성들 사이에서 더 높다. 따라서, 방법에 관계 없이, 더 젊은 여성들에서는 스크리닝 간격이 단축되어야 한다는 제안이 있다. 보다 값비싼 방법을 이용한 보다 빈번한 스크리닝이 유방암의 전체 비율이 비교적 낮은 연령군에 대해 요구되는 것으로 보인다는 점에서 역설이 있다. 질병을 발병할 가장 높은 소인을 갖는 젊은 개체들을 조기에 확인하고, 그들을 보다 값비싸고 광범위한 스크리닝 체계로 전달하는 것에 대한 명백한 임상적 필요성이 존재한다.
치료
현재, 원발성 유방암은 외과적 수술, 아쥬반트 화학요법, 방사선요법, 뒤이은 장기적 호르몬 요법에 의해 치료된다. 종종 3개 또는 4개의 치료법의 조합이 이용된다.
동일한 질병 단계에 있는 유방암 환자들이 아쥬반트 화학요법에 대해 매우 상이한 반응을 가져서 전체적인 치료 결과에 광범위한 변이가 초래될 수 있다. 유방암 환자의 아쥬반트 화학요법 치료에 대한 적격(eligibility)을 결정하는 것에 대한 합의된 가이드라인(St Galen 및 NIH 기준)이 수립되었다. 그러나, 전이의 가장 강력한 임상적 및 조직학적 예측자도 유방 종양의 임상적 반응을 정확하게 예측하지 못했다(Goldhirsch et al., 1998; Eifel et al., 2001). 화학요법 또는 호르몬 요법은 전이의 위험도를 약 1/3 감소시키나, 이 치료를 받는 환자의 70-80%는 상기 치료 없이도 생존했을 것이다. 따라서, 유방암 환자의 대다수는 현재 효과적이지 않거나 또는 불필요한 치료법을 제공받고 있다. 임상의들이 가장 높은 효과를 받을 수 있는 환자들에게 보다 적합하게 치료법을 맞춤화할 수 있게 할 예후적 척도(prognostic measure)의 개발에서의 개선에 대한 명백한 임상적 요구가 존재한다. 유전적 소인에 대해 개체들을 프로파일링하는 것이 그들의 치료 결과에 적합한 결과를 밝히고 그에 의해 합리적인 치료 계획을 보조할 수 있을 것으로 기대하는 것은 타당하다.
여러 과거의 연구들이 이 개념을 예시한다: BRCA 돌연변이 보인자인 유방암 환자들은 아쥬반트 화학요법으로 치료되는 경우 보다 우수한 임상적 반응률 및 생존을 보이는 것으로 나타난다[Chappuis, et al., (2002), J Med Genet, 39, 608-10; Goffin, et al., (2003), Cancer, 97, 527-36]. BRCA 돌연변이 보인자들은 비-보인자(non-carrier) 대비 난소암에 대한 백금 화학요법에 대해 개선된 반응을 보인다[Cass, et al., (2003), Cancer, 97, 2187-95]. 관련된 유전자들이 알려지지 않은, 소인을 갖는 환자에 유사한 고려가 적용될 수 있다. 예를 들면, 침윤성 소엽성 유방암(infiltrating lobular breast carcinoma, ILBC)은 강한 가족성 요소(familiar component)를 갖는 것으로 알려져 있으나, 관련된 유전적 변이는 확인되지 않았다. ILBC를 갖는 환자들은 일반적인 화학요법 방식(common chemotherapy regime)에 대한 보다 열등한 반응을 보인다[Mathieu, et al., (2004), Eur J Cancer, 40, 342-51].
유전적 소인 모델(genetic predisposition model)은 치료 전략의 개별화(individualization)를 보조하며, 또한 이 전략들의 수립에서 필수적인 역할을 수행할 수 있다. 예를 들면, BRCA1 및 BRCA2 돌연변이 종양 세포는 그들의 결함있는 DNA 복구 경로의 결과로 폴리(ADP-리보오스) 폴리머라아제(PARP) 저해제에 매우 민감한 것으로 확인되었다[Farmer, et al., (2005), Nature, 434, 917-21]. 이는 BRCA 보인자 환자들에서의 그들의 이용을 목적으로 PARP를 표적으로 하는 소형 분자 약물의 개발을 촉진했다. 이 예로부터, 유전적 소인의 지식이 유전적 위험도 프로파일링과 조합하여 사용될 맞춤화된 화학요법 방식의 개발을 가져올 약물 표적을 확인할 수 있다는 것이 명백하다.
암 화학요법은 정상적인 조직, 특히, 높은 증식성의 조혈 및 장 상피 세포 구획에 대해 잘 알려진, 용량-제한적(dose-limiting) 부작용을 갖는다. 세포독성 약물에 대한 정상 조직의 민감성에 유전에 기반한 개별적인 차이가 존재한다는 것이 예상될 수 있다. 이 인자들을 이해하는 것이 합리적인 치료 계획 및 정상조직을 화학요법의 유해한 효과로부터 보호하도록 설계된 약물의 개발을 보조할 수 있다.
유전적 프로파일링은 또한 개선된 방사선요법 방식에 기여할 수 있다: 표준 방사선 요법 치료를 받은 유방암 환자의 그룹 내에서, 일부 환자들은 정상적으로 내인되는(tolerated) 방사선량에 대해 부작용을 경험할 것이다. 급성 반응은 홍반, 습성 박리(moist desquamation), 부종 및 방사선 폐렴을 포함한다. 모세혈관 확장, 부종, 폐섬유증 및 유방 섬유증을 포함한 장기 반응이 방사선요법 후 수년 뒤에 발생할 수 있다. 급성 반응 및 장기 반응은 모두 이환율의 상당한 원천이며 치명적일 수 있다. 한 연구에서, 87%의 환자들이 방사선요법에 대해 일부 유해한 부작용을 가지며, 11%는 심각한 부작용을 갖는 것으로 확인되었다(LENT/SOMA Grade 3-4); [Hoeller, et al., (2003), Int J Radiat Oncol Biol Phys, 55, 1013-8]. 방사선요법에 대한 부작용을 경험할 확률은 주로 정상 조직 반응에서 구성적인 개별적 차이(constitutive individual difference) 때문이며 이들은 강한 유전적 요소를 갖는다는 견해가 있다. 공지된 유방암 소인 유전자 중 여러개(예를 들면, BRCA1, BRCA2, ATM)가 DNA 이중가닥 절단(double strand break) 복구의 경로에 영향을 미친다. DNA 이중가닥 절단은 방사선요법에 의해 유도되는 주요한 세포독성 병변이다. 이는 이 경로에 속하는 유전자에 변이를 가져서 유방암에 대한 유전적 소인을 갖는 개체들이 방사선요법으로부터 과도한 정상조직 손상을 겪을 보다 높은 위험을 가질 수 있다는 우려를 가져왔다.
집단에서 구성적으로 방사선민감성인(constitutively radiosensitive) 개체들의 존재는 부작용의 빈도를 수용가능한 수준으로 유지시키기 위해, 환자 집단의 대다수에 대해 방사선요법 선량 비율(radiotherapy dose rate)이 제한되어야 한다는 것을 의미한다. 따라서, 방사선요법에 대한 부작용에 대해 증가된 위험을 갖는 개체들을 확인할 수 있는 신뢰할 수 있는 테스트에 대한 임상적 요구가 존재한다. 그와 같은 테스트는 방사선민감성인 개체에 대한 보수적인 치료 또는 대안적인 치료를 의미하여, 비교적 방사선내성(radioresistant)인 대다수의 환자들에 대한 방사선치료 선량의 증가를 가능하게 할 것이다. 유방암 환자들을 단순하게 방사선민감성(radiosensitive), 중간(intermediate) 및 방사선내성(radioresistant) 범주로 분류하기 위한 테스트에 의해 가능해진 선량 증가(dose escalation)는 국소 종양 통제(local tumor control)의 약 35% 증가 및 그에 따른 생존율의 개선을 가져올 것이다(Burnet et al., 1996).
이온화 방사선에 대한 노출은 유방에서 종양발생에 기여하는 입증된 인자이다(Dumitrescu and Cotarla 2005). 공지된 유방암 소인 유전자들은 방사선-유도 DNA 손상에 대한 세포 반응의 경로 성분들을 코딩한다(Narod and Foulkes 2004). 따라서, 이차 원발성 유방 종양에 대한 위험도가 방사선요법 영역 내에 있는 정상 조직의 방사선조사에 의해 증가될 수 있다는 우려가 있다. 방사선 요법으로부터 BRCA 보인자에 대한 측정가능한 증가된 위험도는 없는 것으로 보이나, 그들의 이차 원발성 종양에 대한 위험도는 이미 매우 높다. 이차 원발성 종양에 대한 위험도가 방사선요법으로 치료된 ATM 및 CHEK2 유전자의 유방암 소인성 대립인자의 보인자에서 증가된다는 것을 시사하는 증거가 있다(Bernstein et al., 2004; Broeks et al., 2004). 방사선요법(및, 가능하게는 집중적인 유방촬영 스크리닝)으로부터의 이차 원발성 종양의 위험도는 치료 계획 단계 동안 환자로부터 정확안 유전적 위험도 프로파일을 수득하는 것에 의해 더 잘 정의될 것으로 예상된다.
이차 예방(Secondary Prevention)
단계 1 또는 단계 2 유방암으로 진단된 환자의 약 30%는 그들의 최초 종양의 국소(loco-regional) 또는 원격 전이 재발(distant metastatic recurrence)을 경험할 것이다. 원발성 유방암을 앓았던 환자들은 또한 유방보존 수술(breast-conserving surgery)을 받은 경우, 반대쪽 유방 또는 같은쪽 유방에 이차 원발성 종양을 진단받을 위험도가 크게 증가된다. 이차 예방(secondary prevention)은 재발 또는 이차 원발성 종양의 발생을 예방하기 위해 이용되는 방법을 의미한다. 현재 사용되는 방법은 단독이거나 또는 아로마타아제 저해제와 조합된 타목시펜 또는 또 다른 SERM에 의한 장기 치료, 위험도 저하를 위한 반대쪽 유방의 절제술, 및 위험도-저하를 위한 난소절제술(가족성 유방-난소암의 위험도를 갖는 환자의 경우)을 포함한다. 타목시펜의 사용에 대한 고려사항은 앞서 검토되었다. 위험도 저하를 위한 수술적 옵션을 고려할 때, 고지된(informed) 비용:이익 분석을 수행하기 위해 위험도가 정량화될 수 있어야 한다는 것이 명백하다.
유방암에 대한 공지된 유전적 소인을 갖는 환자들이 대부분의 환자들보다 더 악화될 수 있다는 여러 징후가 있다. CHEK2 유전자 1100delC 변이를 갖는 환자들은 비-보인자 대비 원격 전이의 약 2.8배 증가된 위험도 및 질병 재발의 3.9배 증가된 위험도를 갖는다[de Bock, et al., (2004), J Med Genet, 41, 731-5]. BRCA1 림프절-음성(node-negative) 종양을 갖는 환자들은 BRCA1 돌연변이를 갖지 않는 유사한 환자들보다 전이의 더 높은 위험도를 갖는다[Goffin, et al., (2003), Cancer, 97, 527-36; Moller, et al., (2002), Int J Cancer, 101, 555-9; Eerola, et al., (2001), Int J Cancer, 93, 368-72]. 따라서, 국소 재발 및 전이의 위험도를 평가하고, 그에 의해 이차 예방적 치료의 선택을 안내하기 위해 유전적 프로파일링이 이용될 수 있다.
일반적으로, 원발성 종양 진단을 받은 환자들은 0.7%의 일정한 연별 발생율로 이차 원발성 종양의 위험도를 갖는다(Peto and Mack 2000). BRCA 돌연변이를 갖는 환자들은 대부분의 유방암 환자들보다 이차 원발성 종양에 대해 유의성있게 더 높은 위험도를 가지며, 절대적 위험도는 40-60%의 범위이다(Easton 1999). BRCA 돌연변이의 보인자는 이차 원발성 종양에 대해 크게 증가된 위험도를 갖는다 [Stacey, et al., (2006), PLoS Med, 3, e217; Metcalfe, et al., (2004), J Clin Oncol, 22, 2328-35]. CHEK2 유전자에 돌연변이를 갖는 환자들은 반대쪽 유방암의 약 5.7배 증가된 위험도를 갖는다[de Bock, et al., (2004), J Med Genet, 41, 731-5]. BARD1 Cys557Ser 변이의 보인자는 이차 원발성 종양을 진단받을 가능성이 2.7배 더 높다[Stacey, et al., (2006), PLoS Med, 3, e217]. 유전적 위험도 프로파일링은 환자에서 이차 원발성 종양의 위험도를 평가하기 위해 이용될 수 있고 예방적 수단이 얼마나 공격적이어야 하는지 여부에 대한 결정을 알려줄 것이다.
방법
유방암의 위험도 평가 및 진단 방법이 본 명세서에서 설명되고 본 발명에 포함된다. 본 발명은 또한 유방암의 치료제에 대한 반응의 확률에 대해 개인을 평가하는 방법, 및 유방암에 대한 치료제의 효과를 예측하는 방법을 포함한다. 유방암에 대한 감수성을 검출하기 위해 개체로부터의 시료를 분석하는 키트도 본 발명에 포함된다.
진단 및 스크리닝 분석법
특정한 구체예에서, 본 발명은 유방암을 갖는 개체 또는 유방암에 대한 감수성을 갖는 개체에서 보다 빈번하게 나타나는 유전적 마커의 특정한 대립인자를 검출하는 것에 의해, 유방암, 또는 유방암에 대한 감수성을 진단하거나 또는 상기 진단을 보조하는 방법에 관한 것이다. 특정한 구체예에서, 본 발명은 하나 이상의 다형성 마커(예를 들면, 본 명세서에 기재된 마커)의 하나 이상의 대립인자를 검출하는 것에 의해 유방암에 대한 감수성을 진단하는 방법이다. 본 발명은 특정한 마커의 특정한 대립인자 또는 일배체형의 검출이 유방암에 대한 감수성을 나타내는 것인 방법을 기재한다. 그와 같은 예후적 또는 예측적 분석법은 또한 유방암의 증상의 발생 전에 개체의 예방적 치료를 결정하기 위해 이용될 수 있다. 일부 구체예에서, 본 발명은 의료 전문가에 의해 수행되는 진단과 같은 진단의 임상적 적용 방법에 관한 것이다. 다른 구체예에서, 본 발명은 일반인(layman)에 의해 수행되는 진단 방법 또는 감수성의 결정 방법에 관한 것이다. Molecular Inversion Probe 어레이 기술 (예를 들면, Affymetrix GeneChip), 및 BeadArray Technologies (예를 들면, Illumina GoldenGate and Infinium assays)와 같은 SNP 마커의 고효율 유전형분석(high-throughput genotyping)을 포함한, 유전형분석 기술에서의 최근의 기술적 진전은 개인들이 비교적 낮은 비용으로 그들의 게놈을 백만개 까지의 SNP에 대해 동시에 평가받을 수 있게 한다. 결과적으로 수득된, 개인에게 이용가능하게 된 유전형 정보는 다양한 SNP와 연관된 질병 또는 성향 위험도에 대한 공개 문헌으로부터의 정보와 비교될 수 있다. 따라서, 본 명세서에 기재된 바와 같은, 질병-연관 대립인자의 진단적 응용은 임상적 테스트의 결과에 근거하여 의료전문가에 의해, 또는 자신의 유전형 데이터의 분석을 통해 개인에 의해 수행될 수 있다. 바꾸어 말하면, 유전적 위험도에 근거한 감수성의 진단 또는 평가가 대상자의 유전형에 대한 정보 및 다양한 위험 인자에 대한 발표문헌에 근거하여, 의료 전문가, 유전학 상담자(genetic counselor), 또는 일반인에 의해 이루어질 수 있다. 본 발명에서, 용어 "진단하는(diagnosing)" 및 "감수성을 진단하다(dignose a susceptibility)" 및 "감수성을 결정하다(determine a suceptiblity)"는 전술된 방법을 포함한, 모든 이용가능한 진단 방법을 의미하도록 의도된다.
또한, 특정한 다른 구체예에서, 본 발명은 유방암으로 진단되지 않은 개인 또는 일반적 집단에서보다 유방암으로 진단된 환자에서 덜 빈번하게 나타나는 특정한 유전적 마커 대립인자 또는 일배체형을 검출하는 것에 의해, 유방암에 대한 감소된 감수성을 진단하거나 또는 상기 진단을 보조하는 방법에 관한 것이다.
본 명세서에서 기재되고 예시된 바와 같이, 특정한 마커 대립인자 또는 일배체형(예를 들면, rs4848543 LD 블럭, rs13387042 LD 블럭, rs3803662 LD 블럭, STEAP3/TSAP6 유전자 내에 위치한 마커들, 표 10, 표 15, 표 19, 표 20, 표 21 및 표 22에 열거된 마커들 및 일배체형, 및 이들과 연관 불균형인 마커들)이 유방암(예를 들면, All BC 및/또는 MedPre 유방암)과 연관된다. 일 구체예에서, 상기 마커 대립인자 또는 일배체형은 유방암의 유의성 있는 위험도 또는 그에 대한 감수성을 부여하는 마커 대립인자 또는 일배체형이다. 또 다른 구체예에서, 본 발명은 개인에서 유방암에 대한 감수성을 진단하는 방법으로서, 상기 방법은 상기 개인으로부터 수득된 핵산 시료에서 하나 이상의 다형성 마커의 하나 이상의 대립인자의 존재 또는 부재를 결정하는 단계를 포함하고, 상기 하나 이상의 다형성 마커는 rs4848543 LD 블럭, rs13387042 LD 블럭, rs3803662 LD 블럭, STEAP3/TSAP6 유전자 내에 위치한 마커들, 표 10, 표 15, 표 19, 표 20, 표 21 및 표 22에 열거된 마커들 및 일배체형, 및 이들과 (예를 들면, r2 > 0.2로 정의된) 연관 불균형인 마커들로부터 구성된 군으로부터 선택된다. 또 다른 구체예에서, 본 발명은 하나 이상의 마커 대립인자 또는 일배체형, 예를 들면, rs4848543 LD 블럭, rs13387042 LD 블럭, rs3803662 LD 블럭, STEAP3/TSAP6 유전자 내에 위치한 마커들, 표 10, 표 15, 표 19, 표 20, 표 21 및 표 22에 열거된 마커들 및 일배체형, 또는 이들과 연관 불균형인 마커들을 스크리닝하는 것에 의해, 개인에서 유방암에 대한 감수성을 진단하는 방법에 관한 것이다. 또 다른 구체예에서, 상기 마커 대립인자 또는 일배체형은 건강한 개체(집단 대조군과 같은, 대조군)에서 그의 존재의 빈도 대비, 유방암을 갖거나, 또는 유방암에 대한 감수성을 갖는 개체(질병군, 예를 들면, All BC 또는 MedPre 유방암)에 보다 빈번하게 존재한다. 또 다른 구체예에서, 본 발명은 개인에서 유방암에 대한 감수성을 진단하는 방법으로서, 상기 방법은 개인으로부터 수득된 핵산 시료에서 하나 이상의 다형성 마커의 하나 이상의 대립인자의 존재 또는 부재를 결정하는 단계를 포함하고, 상기 하나 이상의 다형성 마커는 마커 rs4848543, 마커 rs13387042, 마커 rs3803662, 및 이들과 연관 불균형인 마커들로부터 선택되는 것인 방법에 관한 것이다. 일부 구체예에서, 상기 하나 이상의 마커 대립인자 또는 일배체형의 연관의 유의성은 0.05 미만의 p 값을 특징으로 한다. 다른 구체예에서, 연관의 유의성은 보다 작은 p-값, 예를 들면, 0.01 미만, 0.001 미만, 0.0001 미만, 0.00001 미만, 0.000001 미만, 0.0000001 미만, 0.00000001 미만 또는 0.000000001 미만의 p-값과 같은 보다 작은 p-값을 특징으로 한다.
이 구체예들에서, 상기 하나 이상의 마커 대립인자 또는 일배체형의 존재는 유방암의 감수성을 나타낸다. 이 진단 방법들은 유방암과 연관된 하나 이상의 마커 대립인자 또는 일배체형의 존재 또는 부재를 검출하는 단계를 포함한다. 본 명세서에 기재된 일배체형은 다양한 유전적 마커(예를 들면, SNP, 마이크로새틀라이트)에서의 대립인자의 조합을 포함한다. 특정한 일배체형을 구성하는 특정한 유전적 마커 대립인자의 검출은 본 명세서에 기재되고 및/또는 본 발명이 속하는 기술 분야에서 알려진 다양한 방법에 의해 수행될 수 있다. 예를 들면, 유전적 마커는 핵산 수준에서(예를 들면, 직접적인 뉴클레오티드 서열결정에 의해 또는 본 발명이 속하는 기술 분야에서 당업자에게 공지된 다른 수단에 의해) 또는 상기 유전적 마커가 유방암과 연관된 핵산에 의해 코딩된 단백질의 코딩 서열에 영향을 미친다면, 아미노산 수준에서(예를 들면, 단백질 서열결정에 의해 또는 그와 같은 단백질을 인식하는 항체를 이용한 면역분석법에 의해) 검출될 수 있다. 본 발명의 마커 대립인자 또는 일배체형은 유방암과 연관된 게놈 DNA 서열의 단편에 대응된다. 그와 같은 단편은 대상이 되는 다형성 마커 또는 일배체형의 DNA 서열을 포함하나, 또한 상기 마커 또는 일배체형과 강한 LD(linkage disequilibrium)인(예를 들면, 0.2보다 큰 r2 및/또는 0.8보다 큰 |D'|의 값에 의해 결정됨) DNA 세그먼트를 포함할 수 있다.
일 구체예에서, 유방암에 대한 감수성의 진단이 서던 분석(Southern analysis), 노던 분석(Northern analysis), 및/또는 인-시투 혼성화를 포함하나, 이에 한정되지 않는 혼성화 방법을 이용하여 달성될 수 있다(모든 보충물(supplement)을 포함한, Current Protocols in Molecular Biology, Ausubel, F. et al., eds., John Wiley & Sons 참조). 테스트 대상 또는 개체로부터의 생물학적 시료(게놈 DNA, RNA, 또는 cDNA의 "테스트 시료(test sample)")는 유방암을 갖거나 유방암에 대한 감수성을 갖거나 또는 유방암에 대한 소인을 갖는 것으로 의심되는 개체("테스트 개체(test subject)")로부터 수득된다. 상기 개체는 성인, 아동, 또는 태아일 수 있다. 테스트 시료는 혈액 시료, 양수 시료, 뇌척수액 시료, 또는 피부, 근육, 구강점막, 또는 결막 점막, 태반, 위장관 또는 다른 기관으로부터의 조직 시료와 같은, 게놈 DNA를 포함하는 임의의 출처로부터 유래될 수 있다. 태아 세포 또는 조직으로부터의 DNA의 테스트 시료는 양수 천자 또는 융모막 융모 채취법(chorionic villus sampling)과 같은 적합한 방법에 의해 수득될 수 있다. 그 후, DNA, RNA, 또는 cDNA 시료가 검사된다. 특정한 마커 대립인자의 존재는 상기 특정한 대립인자에 대해 특이적인 핵산 프로브의 서열-특이적 혼성화에 의해 표시될 수 있다. 각각 특정한 대립인자에 대해 특이적인, 여러 개의 서열-특이적 핵산 프로브를 사용하는 것에 의해, 하나 이상의 특정한 마커 대립인자 또는 하나 이상의 특정한 일배체형의 존재가 표시될 수 있다. 일 구체예에서, 일배체형은 특정한 일배체형에 대해 특이적인(즉, 상기 일배체형의 특징적인 특정한 마커 대립인자를 포함하는 DNA 가닥에 특이적으로 혼성화하는) 단일 핵산 프로브에 의해 표시될 수 있다. 서열-특이적 프로브는 게놈 DNA, RNA, 또는 cDNA에 혼성화되도록 지시될 수 있다. 본 명세서에서 사용된, "핵산 프로브(nucleic acid probe)"는 상보적 서열에 혼성화되는 DNA 프로브 또는 RNA 프로브일 수 있다. 본 발명이 속하는 기술 분야의 당업자는 테스트 시료로부터의 게놈 서열에 특정한 대립인자가 존재하는 경우에만 서열 특이적 혼성화가 일어나도록 그와 같은 프로브를 설계하는 방법을 알 것이다.
유방암에 대한 감수성을 진단하기 위해, 유방암과 연관된 핵산을 포함하는 테스트 시료, 예를 들면, 게놈 DNA 시료를 하나 이상의 핵산 프로브와 접촉시키는 것에 의해 혼성화 시료가 형성된다. mRNA 또는 게놈 DNA를 검출하기 위한 프로브의 비-한정적인 예는 본 명세서에 기재된 mRNA 또는 게놈 DNA 서열에 혼성화될 수 있는 표지된 핵산 프로브이다. 상기 핵산 프로브는 예를 들면, 전장(full-length) 핵산 분자, 또는 그의 일부, 예를 들면, 적합한 mRNA 또는 게놈 DNA에 엄격한(stringent) 조건 하에 특이적으로 혼성화하기에 충분한 15개 이상, 30개 이상, 50개 이상, 100개 이상, 250개 이상, 또는 500개 이상의 뉴클레오티드로 구성된 길이의 올리고뉴클레오티드일 수 있다. 예를 들면, 상기 핵산 프로브는 선택적으로 본 명세서에 기재된 마커의 하나 이상의 대립인자, 또는 본 명세서에 기재된 하나 이상의 마커 또는 일배체형(예를 들면, 표 10, 표 15, 표 19, 표 20, 표 21 및 표 22에 열거된 마커 및 일배체형, 및 이들과 연관 불균형인 마커들)을 포함한, 본 명세서에 기재된 바와 같은, 서열번호 4, 서열번호 5 또는 서열번호 6에 표시된 뉴클레오티드 서열, rs4848543 LD 블럭, rs13387042 LD 블럭, rs3803662 LD 블럭, 및/또는 STEAP3/TSAP 유전자의 뉴클레오티드 서열의 전부 또는 일부를 포함할 수 있거나, 또는 상기 프로브는 그와 같은 서열의 상보적인 서열을 포함할 수 있다. 특정한 구체예에서, 상기 핵산 프로브는 선택적으로 본 명세서에 기재된 마커의 하나 이상의 대립인자(예를 들면, 표 10, 표 15, 표 19, 표 20, 표 21 및 표 22에 열거된 마커 및 일배체형, 및 이들과 연관 불균형인 마커들) 또는 본 명세서에 기재된 일배체형에 포함된 하나 이상의 대립인자를 포함한, 서열번호 4, 서열번호 5, 또는 서열번호 6에 표시된 뉴클레오티드 서열; 또는 본 명세서에 기재된 rs4848543 LD 블럭, rs13387042 LD 블럭, rs3803662 LD 블럭 및/또는 STEAP3/TSAP6 유전자의 뉴클레오티드 서열의 일부이거나, 또는 상기 프로브는 그와 같은 서열의 상보적인 서열일 수 있다. 본 발명의 진단 분석법에서 이용하기 위한 다른 적합한 프로브가 본 명세서에 기재된다. 혼성화는 당해 기술 분야의 당업자에게 잘 알려진 방법에 의해 수행될 수 있다(예를 들면, 모든 보충물을 포함한, Current Protocols in Molecular Biology, Ausubel, F. et al., eds., John Wiley & Sons 참조). 일 구체예에서, 혼성화는 특이적 혼성화, 즉, 불일치를 포함하지 않는 혼성화(정확한 혼성화)를 의미한다. 일 구체예에서, 상기 특이적 혼성화를 위한 혼성화 조건은 높은 엄격성이다.
존재하는 경우, 특이적 혼성화는 표준 방법을 이용하여 검출된다. 핵산 프로브와 테스트 시료 내의 유방암 연관 핵산 간에 특이적 혼성화가 일어나면, 상기 시료는 상기 핵산 프로브에 존재하는 뉴클레오티드에 상보적인 대립인자를 포함한다. 본 발명의 다른 마커, 또는 본 발명의 일배체형을 구성하는 마커에 대해, 상기 방법이 반복될 수 있거나, 또는 한번에 하나 이상의 마커 대립인자를 검출하기 위해 복수 개의 프로브가 동시에 이용될 수 있다. 특정한 일배체형의 둘 이상의 마커 대립인자를 포함하는 단일 프로브를 설계할 수 있다(예를 들면, 2개, 3개, 4개, 5개, 또는 특정한 일배체형을 구성하는 모든 마커에 상보적인 대립인자를 포함하는 프로브). 시료에서 일배체형의 특정한 마커의 검출은 상기 시료의 원천이 특정한 일배체형(예를 들면, 일배체형)을 가지며 따라서, 유방암에 대해 감수성을 갖는다는 것을 나타낸다.
하나의 바람직한 구체예에서, Kutyavin et al. (Nucleic Acid Res. 34:e128 (2006))에 기재된 바와 같이, 그의 3' 말단에 있는 형광 모이어티(fluorescent moiety) 또는 그룹 및 그의 5' 말단에 있는 퀀처(quencher)를 포함하는 검출 올리고뉴클레오티드 및 인핸서 올리고뉴클레오티드를 이용하는 방법이 적용될 수 있다. 형광 모이어티는 Gig Harbor Green 또는 Yakima Yellow, 또는 다른 적합한 형광 모이어티일 수 있다. 검출 프로브는 검출대상 SNP 다형성을 포함하는 짧은 뉴클레오티드 서열에 혼성화되도록 설계된다. 바람직하게는, 상기 SNP는 검출 프로브의 말단 잔기부터 3' 말단으로부터의 -6 잔기까지 중에 존재한다. 인핸서는 검출 프로브에 대해 3'인 DNA 주형에 혼성화되는 짧은 올리고뉴클레오티드 프로브이다. 상기 프로브들은 검출 프로브와 인핸서 뉴클레오티드 프로브가 모두 주형에 결합된 경우, 상기 검출 프로브와 인핸서 뉴클레오티드 프로브 간에 단일 뉴클레오티드 갭이 존재하도록 설계된다. 상기 갭은 엔도뉴클레아제 IV와 같은, 엔도뉴클레아제에 의해 인식되는 합성 탈염기 부위(synthetic abasic site)를 생성한다. 상기 효소는 완전히 상보적인 검출 프로브로부터 염료를 절단하나, 불일치를 포함하는 검출 프로브는 절단할 수 없다. 따라서, 방출된 형광 모이어티의 형광을 측정하는 것에 의해, 검출 프로브의 뉴클레오티드 서열에 의해 정의된 특정한 대립인자의 존재의 평가가 수행될 수 있다.
검출 프로브는 임의의 적합한 크기일 수 있으나, 바람직하게는 프로브는 비교적 짧다. 일 구체예에서, 상기 프로브는 길이가 5개 내지 100개의 뉴클레오티드로 구성된다. 또 다른 구체예에서, 상기 프로브는 길이가 10개 내지 50개의 뉴클레오티드로 구성되고, 또 다른 구체예에서, 상기 프로브는 길이가 12개 내지 30개의 뉴클레오티드로 구성된다. 다른 길이의 프로브들도 가능하고 본 발명이 속하는 기술 분야의 평균적인 당업자의 기술의 범위 내에 속한다.
바람직한 구체예에서, SNP 다형성을 포함하는 DNA 주형은 검출 전에 중합효소 연쇄 반응(PCR)에 의해 증폭된다. 그와 같은 구체예에서, 증폭된 DNA가 검출 프로프 및 인핸서 프로브에 대한 주형으로 기능한다.
검출 프로브, 인핸서 프로브, 및/또는 PCR에 의한 주형의 증폭을 위해 이용되는 프라이머의 특정한 구체예는 변형된 A 및 변형된 G를 포함한, 변형된 염기의 이용을 포함한다. 변형된 염기의 이용은 주형 DNA에 대한 뉴클레오티드 분자(프로브 및/또는 프라이머)의 용융점을 조정하기 위해, 예를 들면, 상보적인 T와 세개의 수소 결합을 형성할 수 있는 능력을 갖는 변형된 A가 이용될 수 있는, 낮은 비율의 G 또는 C 염기를 포함하는 영역에서 용융점을 높이기 위해, 또는 예를 들면, 상보적인 C와 두 개의 수소 결합만을 형성하는 변형된 G 염기를 이용하는 것에 의해, 높은 비율의 G 또는 C 염기를 포함하는 영역에서 용융점을 낮추기 위해 유용할 수 있다. 바람직한 구체예에서, 검출 뉴클레오티드 프로브의 설계에서 변형된 염기들이 이용된다. 당업자에게 알려진 임의의 변형된 염기가 이 방법에서 선택될 수 있고, 적합한 염기의 선택은 본 명세서의 교시 및 당업자에게 알려진 상업적 출처로부터 이용가능한 공지된 염기에 근거하여 당업자의 범위 내에 속한다.
또 다른 혼성화 방법에서, 유방암과 연관된 다형성의 존재를 확인하기 위해 노던 분석이 이용된다(Current Protocols in Molecular Biology, Ausubel, F. et al., eds., John Wiley & Sons, supra 참조). 노던 분석의 경우, RNA의 테스트 시료가 적합한 수단에 의해 개체로부터 수득된다. 본 명세서에 기재된 바와 같이, 개체로부터의 RNA에 대한 핵산 프로브의 특이적 혼성화는 상기 프로브에 상보적인 특정한 대립인자를 나타낸다. 핵산 프로브의 용도의 대표적인 예를 위해, 예를 들면, 미국특허 제5,288,611호 및 제4,851,330호를 참조한다.
추가적으로, 또는 대안적으로, 펩티드 핵산(peptide nucleic acid, PNA)이 본 명세서에 기재된 혼성화 방법에서 핵산 프로브에 추가하여, 또는 핵산 프로브 대신에 이용될 수 있다. PNA는 유기 염기 (A, G, C, T 또는 U)가 메틸렌 카르보닐 링커를 통해 글리신 질소에 결합된, N-(2-아미노에틸)글리신 유닛과 같은, 펩티드-유사 무기 백본(peptide-like inorganic backbone)을 갖는 DNA 모방체(mimic)이다(예를 들면, Nielsen, P., et al., Bioconjug. Chem. 5:3-7 (1994) 참조). PNA 프로브는 유방암과 연관된 하나 이상의 마커 대립인자 또는 일배체형을 포함하는 것으로 사료되는 시료 내의 분자에 특이적으로 혼성화하도록 설계될 수 있다. 따라서, PNA 프로브의 혼성화는 유방암 또는 유방암에 대한 감수성을 진단할 수 있다.
본 발명의 일 구체예에서, 개체로부터 수득된 게놈 DNA를 포함하는 테스트 시료가 수집되고 본 발명의 하나 이상의 마커 또는 일배체형을 포함하는 단편을 증폭시키기 위해 중합효소 연쇄 반응(PCR)이 이용된다. 본 명세서에 기재된 바와 같이, 유방암과 연관된 특정한 마커 대립인자 또는 일배체형의 확인은 다양한 방법(예를 들면, 서열 분석, 제한효소 처리에 의한 분석, 특이적 혼성화, SSCP(single stranded conformation polymorphism), 전기영동 분석 등)을 이용하여 수행될 수 있다. 또 다른 구체예에서, 진단은 정량적 PCR(kinetic thermal cycling)을 이용한 발현 분석에 의해 수행된다. 이 기법은 예를 들면, TaqMan®(Applied Biosystems, Foster City, CA)과 같은 상업적으로 이용가능한 기술을 이용할 수 있다. 상기 기법은 유방암과 연관된 핵산에 의해 코딩된 폴리펩티드 또는 스플라이싱 변이(splicing variant)의 발현 또는 조성의 변화의 존재를 평가할 수 있다. 또한, 변이의 발현은 물리적으로 또는 기능적으로 상이한 것으로 정량될 수 있다.
본 발명의 또 다른 방법에서, 특정한 대립인자가 기준 서열 대비 제한효소 인식 부위의 생성 또는 제거를 초래하는 경우, 제한효소 처리(restriction digestion)에 의한 분석이 상기 특정한 대립인자를 검출하기 위해 이용될 수 있다. 게놈 DNA를 포함하는 테스트 시료가 개체로부터 수득된다. RFLP(Restriction fragment length polymorphism) 분석은 예를 들면, 전술된 Current Protocols in Molecular Biology에 기재된 바와 같이 수행될 수 있다. 관련된 DNA 단편의 제한효소 처리의 결과 패턴(digestion pattern)이 시료 중의 특정한 대립인자의 존재 또는 부재를 나타낸다.
유방암과 연관된 다형성 부위의 특정한 대립인자(예를 들면, 표 10, 표 15, 표 19, 표 20, 표 21 및/또는 표 22에 열거된 다형성 마커 및 일배체형, 및 이들과 연관 불균형인 마커들)을 검출하기 위해, 서열 분석이 또한 이용될 수 있다. 따라서, 일 구체예에서, 특정한 마커 대립인자 또는 일배체형의 존재 또는 부재의 결정은 서열 분석을 포함한다. 예를 들면, DNA 또는 RNA의 테스트 시료가 테스트 개체로부터 수득될 수 있다. PCR 또는 다른 적합한 방법이 유방암과 연관된 핵산의 일부를 증폭시키기 위해 이용될 수 있고, 그 후, 특정한 대립인자의 존재가 직접 시료 중의 게놈 DNA의 다형성 부위(또는 복수 개의 다형성 부위들)의 서열을 결정하는 것에 의해 검출될 수 있다.
대립인자-특이적 올리고뉴클레오티드가 또한 대립인자-특이적 올리고뉴클레오티드(ASO) 프로브에 의한 증폭된 올리고뉴클레오티드의 도트-블롯 혼성화를 통해 유방암-연관 핵산(예를 들면, 표 10, 표 15, 표 19, 표 20, 표 21 및 표 22에 열거된 다형성 마커 및 일배체형, 및 이들과 연관 불균형인 마커들)에서 특정한 대립인자의 존재를 검출하기 위해 이용될 수 있다(예를 들면, Saiki, R. et al., Nature, 324:163-166 (1986) 참조). "대립인자-특이적 올리고뉴클레오티드(allele-specific oligonucleotide)"(본 명세서에서 "대립인자-특이적 올리고뉴클레오티드 프로브"로도 지칭됨)는 유방암-연관 핵산에 특이적으로 혼성화하고, 다형성 부위(예를 들면, 본 명세서에 기재된 마커 또는 일배체형)에 특이적 대립인자를 포함하는, 약 10-50 bp(base pairs) 또는 약 15-30 bp의 올리고뉴클레오티드이다. 하나 이상의 특정한 유방암-연관 핵산에 대해 특이적인 대립인자-특이적 올리고뉴클레오티드는 표준 방법을 이용하여 제조될 수 있다(예를 들면, Current Protocols in Molecular Biology, supra 참조). 원하는 영역을 증폭시키기 위해 PCR이 이용될 수 있다. 증폭된 영역을 함유한 DNA가 표준 방법(예를 들면, Current Protocols in Molecular Biology, supra 참조)을 이용하여 도트-블롯팅될 수 있고, 상기 블롯이 올리고뉴클레오티드 프로브와 접촉될 수 있다. 그 후, 상기 프로브의 증폭된 영역에 대한 특이적 혼성화의 존재가 검출될 수 있다. 개체로부터의 DNA에 대한 대립인자-특이적 올리고뉴클레오티드 프로브의 특이적 혼성화는 유방암과 연관된 다형성 분위에 특이적 대립인자를 나타낸다(예를 들면, Gibbs, R. et al., Nucleic Acids Res., 17:2437-2448 (1989) 및 WO 93/22456 참조).
LNA(locked nucleic acid)와 같은 유사체의 첨가로, 프라이머 및 프로브의 크기가 8개의 염기까지 감소될 수 있다. LNA는 푸라노오스 고리의 2' 및 4' 위치가 O-메틸렌(옥시-LNA), S-메틸렌(티오-LNA), 또는 아미노 메틸렌(아미노-LNA) 모이어티를 통해 연결되는 것인 이중고리형(bicyclic) DNA 유사체의 신규한 종류이다. 모든 이 LNA 변이에 공통된 것은 상보적 핵산에 대한 친화도이고, 이는 DNA 유사체에 대해 보고된 가장 높은 친화도이다. 예를 들면, 특정한 모든 옥시-LNA 노나머(nonamer)는 상응하는 DNA 노마머에 대한 DNA 및 RNA 모두에 대한 28℃ 대비, 64℃ 및 74℃의 용융점(Tm)을 갖는 것으로 확인되었다. Tm의 실질적인 증가는 또한 LNA 단량체가 표준 DNA 또는 RNA 단량체와 조합되어 이용되는 경우 수득된다. 프라이머 및 프로브의 경우, LNA 단량체가 포함되는 위치(예를 들면, 3' 말단, 5' 말단, 또는 중간)에 따라, Tm은 상당히 증가될 수 있다.
또 다른 구체예에서, 개체로부터의 표적 핵산 서열 세그먼트에 상보적인 올리고뉴클레오티드 프로브의 어레이(array)가 유방암과 연관된 핵산에서 다형성을 식별하기 위해 이용될 수 있다(예를 들면, 표 10, 표 15, 표 19, 표 20, 표 21 및 표 2의 다형성 마커 및 일배체형, 및 이들과 연관 불균형인 마커들). 예를 들면, 올리고뉴클레오티드 어레이가 이용될 수 있다. 올리고뉴클레오티드 어레이는 일반적으로 상이한 공지된 위치에 있는 기판(substrate)의 표면에 결합된 복수 개의 상이한 올리고뉴클레오티드 프로브를 포함한다. "Genechips™"에도 기재된, 이 올리고뉴클레오티드 어레이들은 본 발명이 속하는 기술 분야에서 일반적으로 설명된다(예를 들면, 미국특허 제5,143,854호, PCT 특허출원 공개 WO90/15070 및 92/10092 참조). 이 어레이들은 일반적으로 포토리소그래피 방법과 고상 올리고뉴클레오티드 합성 방법의 조합을 포함하는 기계적 합성 방법, 또는 본 발명이 속하는 기술 분야의 당업자에게 공지된 다른 방법을 이용하여 생산된다(각각의 전체 교시가 참조에 의해 본 명세서에 포함된, Fodor, S. et al., Science, 251:767-773 (1991); Pirrung et al., 미국특허 제5,143,854호(또한, 공개된 PCT 출원 WO 90/15070 참조); 및 Fodor. S. et al., 공개된 PCT 출원 WO 92/10092 및 미국특허 제5,424,186호 참조). 기계적 합성 방법을 이용한 이 어레이들의 합성을 위한 기법들이 예를 들면, 미국특허 제5,384,261호에 기재되며, 그 전체 교시가 참조에 의해 본 명세서에 포함된다.
올리고뉴클레오티드 어레이가 제조되면, 목적 핵산(nucleic acid of interest)이 상기 어레이와 혼성화될 수 있게 된다. 혼성화의 검출은 목적 핵산 중의 특정한 대립인자의 검출이다. 혼성화 및 스캐닝(scanning)은 일반적으로 본 명세서에 기재된 방법 또는 본 발명이 속하는 기술 분야의 당업자에게 알려진 다른 방법, 예를 들면, 각각의 전체 교시가 참조에 의해 본 명세서에 포함된, PCT 출원공개 WO 92/10092 및 WO 95/11995, 및 미국특허 제5,424,186호에 기재된 방법에 의해 수행된다. 요약하면, 하나 이상의 이전에 확인된 다형성 마커를 포함하는, 표적 핵산 서열이 잘-알려진 증폭 기법(예를 들면, PCR)에 의해 증폭된다. 통상적으로 이는 다형성 부위로부터 상류 및 하류인 표적 서열의 두 가닥에 상보적인 프라이머 서열의 이용을 포함한다. 비대칭 PCR(asymmetric PCR) 기법도 이용될 수 있다. 증폭된 표적, 일반적으로 표지를 포함하는 증폭된 표적은 그 후, 서열-특이적 혼성화를 가능하게 하는 적합한 조건 하에 어레이와 혼성화될 수 있게 된다. 혼성화 및 어레이의 세척 후에, 표적 서열이 혼성화된 어레이 상의 위치를 결정하기 위해 어레이가 스캐닝된다. 스캔으로부터 수득된 혼성화 데이터는 통상적으로 어레이 상의 위치의 함수인 형광 강도의 형태이다.
주로 단일 검출 블럭, 예를 들면, 단일 다형성 부위를 검출하기 위한 단일 검출 블럭의 측면에서 설명되나, 어레이는 복수의 검출 블럭을 포함할 수 있고, 따라서, 복수 개의 특정한 다형성(예를 들면, 특정한 일배체형의 복수개의 다형성)을 포함할 수 있다. 대안적인(alternate) 배열로, 일반적으로 검출 블럭은 단일 어레이 또는 복수의 별개의 어레이 내에서 그룹핑될 수 있어서 표적의 어레이로의 혼성화동안 다양한, 최적 조건들이 이용될 수 있는 것으로 이해될 것이다. 예를 들면, A-T 풍부(rich) 세그먼트에 속하는 스트레치(stretch)에 속하는 다형성들과 별개로, 게놈 서열의 G-C 풍부 스트레치에 속하는 다형성의 검출을 제공하는 것이 종종 바람직할 것이다. 이는 각 상황에 대한 혼성화의 별개의 최적화를 가능하게 한다.
다형성의 검출을 위한 올리고뉴클레오티드의 용도의 추가적인 설명이 예를 들면, 참조에 의해 전체 교시가 본 명세서에 포함된, 미국특허 제5,858,659호 및 제5,837,832호에서 확인될 수 있다.
본 발명이 속하는 기술 분야의 당업자에게 이용가능한 핵산 분석의 다른 방법들이 유방암과 연관된 다형성 부위(예를 들면, 표 10, 표 15, 표 19, 표 20, 표 21 및 표 22의 다형성 마커 및 일배체형 및 이들과 연관 불균형인 마커들)에서 특정한 대립인자를 검출하기 위해 이용될 수 있다. 대표적인 방법들은 예를 들면, 직접적인 수동 서열결정(direct manual sequencing) (Church and Gilbert, Proc. Natl. Acad. Sci. USA, 81: 1991-1995 (1988); Sanger, F., et al., Proc. Natl. Acad. Sci. USA, 74:5463-5467 (1977); Beavis, et al., U.S. Patent No. 5,288,644); 자동화된 형광 서열결정(automated fluorescent sequencing); 단일가닥 구조 다형성(SSCP) 분석; CDGE(clamped denaturing gel electrophoresis); DGGE(denaturing gradient gel electrophoresis) (Sheffield, V., et al., Proc. Natl. Acad. Sci. USA, 86:232-236 (1989)), 운동성 변화 분석(mobility shift analysis)(Orita, M., et al., Proc. Natl. Acad. Sci. USA, 86:2766-2770 (1989)), 제한효소 분석(Flavell, R., et al., Cell, 15:25-41 (1978); Geever, R., et al., Proc. Natl. Acad. Sci. USA, 78:5081-5085 (1981)); 헤테로듀플렉스(heteroduplex) 분석; 화학적 불일치 절단(chemical mismatch cleavage, CMC) (Cotton, R., et al., Proc. Natl. Acad. Sci. USA, 85:4397-4401 (1985)); RNase 보호 분석(Myers, R., et al., Science, 230:1242-1246 (1985); E. coli mutS 단백질과 같은, 뉴클레오티드 불일치를 인식하는 폴리펩티드의 이용; 및 대립인자-특이적 PCR을 포함한다.
본 발명의 또 다른 구체예에서, 유방암 또는 유방암에 대한 감수성의 진단은 본 발명의 유전적 마커(들) 또는 일배체형(들)이 폴리펩티드의 조성 또는 발현의 변화를 초래하는 경우들에서, 유방암과 연관된 핵산에 의해 코딩된 폴리펩티드의 발현 및/또는 조성을 조사하는 것에 의해 수행될 수 있다. 따라서, 유방암에 대한 감수성의 진단은 본 발명의 유전적 마커 또는 일배체형이 폴리펩티드의 조성 또는 발현의 변화를 초래하는 경우, 이들 중 하나의 폴리펩티드, 또는 유방암과 연관된 핵산에 의해 코딩되는 또 다른 폴리펩티드의 발현 및/또는 조성을 조사하는 것에 의해 수행될 수 있다. 유방암에 대해 연관을 보이는 본 발명의 일배체형 및 마커들은 하나 이상의 인접 유전자(nearby gene)에 대한 효과를 통해 역할을 수행한다. 이 유전자들에 영향을 미치는 가능한 메카니즘은 예를 들면, 전사에 대한 효과, RNA 스플라이싱에 대한 효과, mRNA의 대안적인 스플라이스(alternative splice) 형태의 상대적 양의 변화, RNA 안정성에 대한 효과, 핵으로부터 세포질로의 이동에 대한 효과, 및 번역의 효율성 및 정확성에 대한 효과를 포함한다.
따라서, 또 다른 구체예에서, 유방암에 대한 연관을 보이는 본 발명의 변이(마커 또는 일배체형)가 인접 유전자의 발현에 영향을 미친다. 유전자 발현에 영향을 미치는 조절성 요소(regulatory element)가 유전자의 프로모터 영역으로부터 멀리 떨어져서, 수십 킬로베이스 또는 심지어 수백 킬로베이스 떨어져서 위치할 수 있다는 것이 잘 알려져 있다. 본 발명의 하나 이상의 다형성 마커의 하나 이상의 대립인자의 존재 또는 부재를 분석하는 것에 의해, 따라서, 그와 같은 인접한 유전자의 발현 수준을 평가할 수 있다. 따라서, 본 발명의 마커 또는 일배체형의 검출이 하나 이상의 STEAP3/TSAP6, LOC643714, 및 TNRC9 유전자의 발현을 평가하기 위해 이용될 수 있다.
ELISA(enzyme linked immunosorbent assay), 웨스턴 블롯(Western blot), 면역침전(immunoprecipitation) 및 면역형광(immunofluorescence)을 포함한 다양한 방법들이 단백질 발현 수준을 검출하기 위해 이용될 수 있다. 개체로부터의 테스트 시료가 유방암과 연관된 핵산에 의해 코딩되는 폴리펩티드의 발현의 변화 및/또는 그의 조성의 변화의 존재에 대해 평가된다. 유방암과 연관된 핵산에 의해 코딩되는 폴리펩티드의 발현의 변화가 예를 들면, 정량적인 폴리펩티드 발현(즉, 생성되는 폴리펩티드의 양)의 변화일 수 있다. 유방암과 연관된 핵산에 의해 코딩되는 폴리펩티드의 조성의 변화는 정성적 폴리펩티드 발현의 변화(예를 들면, 돌연변이 폴리펩티드의 발현 또는 상이한 스플라이싱 변이의 발현)이다. 일 구체예에서, 유방암에 대한 감수성의 진단은 유방암과 연관된 핵산에 의해 코딩되는 특정한 스플라이싱 변이, 또는 스플라이싱 변이의 특정한 패턴을 검출하는 것에 의해 수행된다.
또한, 그와 같은 변화(정량적 및 정성적 변화)가 모두 존재할 수 있다. 본 명세서에서 사용된 폴리펩티드 발현 또는 조성의 "변화(alteration)"는 대조군 시료에서 상기 폴리펩티드의 발현 또는 조성 대비, 테스트 시료 중의 발현 또는 조성의 변화를 의미한다. 대조군 시료는 테스트 시료에 상응하는 시료(예를 들면, 동일한 종류의 세포로부터 유래된 시료)이고, 유방암에 의해 영향받지 않고 및/또는 유방암에 대한 감수성을 갖지 않는 개체로부터 유래된다. 일 구체예에서, 대조군 시료는 본 명세서에 기재된 유방암과 연관된 마커 대립인자 또는 일배체형을 갖지 않는 개체로부터 유래된다. 유사하게, 대조군 시료 대비, 테스트 시료 중에 하나 이상의 상이한 스플라이싱 변이의 존재, 또는 대조군 시료 대비, 테스트 시료 중의 상이한 스플라이싱 변이의 유의성 있게 상이한 양의 존재는 유방암에 대한 감수성을 나타낼 수 있다. 대조군 시료 대비, 테스트 시료 중의 폴리펩티드의 발현 또는 조성의 변화는 특정한 대립인자가 대조군 시료 중의 기준 대비 스플라이스 위치를 변화시키는 경우, 상기 특정한 대립인자를 나타낼 수 있다. 분광분석법, 비색법(colorimetry), 전기영동, 등전점 전기영동법(isoelectric focusing), 및 면역블롯팅(immunoblotting)(예를 들면, 전술된 바와 같은, Current Protocols in Molecular Biology, 특히, 챕터 10 참조)과 같은 면역분석법(immunoassays)(예를 들면, David et al., 미국특허 제4,376,110호)을 포함한, 핵산에 의해 코딩된 폴리펩티드의 발현 또는 조성을 조사하는 다양한 수단이 본 발명이 속하는 기술 분야의 당업자에게 알려져 있고, 이용될 수 있다.
예를 들면, 일 구체예에서, 유방암과 연관된 핵산에 의해 코딩되는 폴리펩티드에 결합할 수 있는 항체(예를 들면, 검출가능한 표지를 갖는 항체)가 이용될 수 있다. 항체는 다중클론 항체 또는 단일클론 항체일 수 있다. 완전한 항체, 또는 그의 단편(예를 들면, Fv, Fab, Fab', F(ab')2)이 이용될 수 있다. 프로브 또는 항체에 대해, 용어 "표지된(labeled)"은 검출가능한 물질을 프로브 또는 항체에 결합(즉, 물리적 연결)시키는 것에 의한 프로브 또는 항체의 직접적인 표지화, 및 직접적으로 표지된 또 다른 시약과의 반응성에 의한 프로브 또는 항체의 간접적 표지화를 포함하도록 의도된다. 간접적 표지화의 예는 표지된 이차 항체(예를 들면, 형광-표지된 이차 항체)를 이용한 일차 항체의 검출 및 형광-표지된 스트렙타비딘에 의해 검출될 수 있는, 비오틴에 의한 DNA 프로브의 말단-표지화(end-labeling)를 포함한다.
이 방법의 일 구체예에서, 테스트 시료 중의 유방암과 연관된 핵산(예를 들면, STEAP3/TSAP6, LOC64371 또는 TNRC9 유전자를 코딩하는 핵산)에 의해 코딩된 폴리펩티드의 수준 또는 양이 대조군 시료 중의 유방암과 연관된 핵산에 의해 코딩된 폴리펩티드의 수준 또는 양과 비교된다. 대조군 시료 중의 폴리펩티드의 수준 또는 양보다 더 높거나 또는 더 낮고, 그 차이가 통계적으로 유의성이 있는, 테스트 시료 중의 폴리펩티드의 수준 또는 양은 상기 핵산에 의해 코딩되는 폴리펩티드의 발현의 변화를 나타내고 발현의 차이를 유발하는 특정한 대립인자 또는 일배체형의 존재를 나타낸다. 대안적으로, 테스트 시료 중의 폴리펩티드의 조성이 대조군 시료 중의 상기 폴리펩티드의 조성과 비교된다. 또 다른 구체예에서, 폴리펩티드의 수준 또는 양과 조성이 모두 테스트 시료 및 대조군 시료에서 평가될 수 있다.
또 다른 구체예에서, 유방암에 대한 감수성의 진단은 추가적인 단백질-기반 분석법, RNA-기반 분석법 또는 DNA-기반 분석법과 조합하여, 하나 이상의 본 발명의 마커 대립인자 또는 일배체형(예를 들면, 표 10, 표 15, 표 19, 표 20, 표 21, 및 표 22의 마커 및 일채체형 및 이들과 연관 불균형인 마커의 연관된 대립인자)을 검출하는 것에 의해 수행된다. 본 발명의 방법은 또한 대상 개체의 가족력 및 위험 인자(예를 들면, 환경적 위험 인자, 생활방식 위험 인자)의 분석과 조합되어 이용될 수 있다.
키트
본 발명의 방법에서 유용한 키트는 본 명세서에 기재된 방법에서 유용한 성분들, 예를 들면, 혼성화 프로브, 제한효소(예를 들면, RFLP 분석용 제한효소), 대립인자-특이적 올리고뉴클레오티드, 본 명세서에 기재된 본 발명의 핵산(예를 들면, 본 발명의 하나 이상의 다형성 마커 및/또는 일배체형을 포함하는 게놈 단편)에 의해 코딩된 변화된 폴리펩티드에 결합하는 항체 또는 본 명세서에 기재된 본 발명의 핵산에 의해 코딩된 변화되지 않은(원형의) 폴리펩티드에 결합하는 항체, 유방암과 연관된 핵산의 증폭을 위한 수단, 유방암과 연관된 핵산의 핵산 서열을 분석하기 위한 수단, 유방암과 연관된 핵산에 코딩되는 폴리펩티드의 아미노산 서열을 분석하기 위한 수단, 등을 포함한다. 본 발명의 키트는 예를 들면, 필요한 완충액, 본 발명의 핵산(예를 들면, 본 명세서에 기재된 하나 이상의 다형성 마커를 포함하는 핵산 세그먼트)을 증폭하기 위한 핵산 프라이머, 및 그와 같은 프라이머 및 필요한 효소(예를 들면, DNA 중합효소)를 이용하여 증폭된 단편의 대립인자-특이적 검출을 위한 시약을 포함할 수 있다. 추가적으로, 키트는 본 발명의 방법과 조합되어 이용될 수 있는 분석법을 위한 시약들, 예를 들면, 본 명세서에 기재된 유방암 진단 분석법에서 이용되는 시약을 제공할 수 있다.
일 구체예에서, 본 발명은 유방암, 또는 유방암에 대한 감수성을 검출하기 위해, 개체로부터의 시료를 분석하는 키트로서, 상기 키트는 상기 개체의 게놈에서 본 발명의 하나 이상의 다형성의 하나 이상의 대립인자를 선택적으로 검출하기 위해 필요한 시약들을 포함하는 것인 키트에 관한 것이다. 특정한 구체예에서, 상기 시약은 본 발명의 하나 이상의 다형성을 포함하는 개체의 게놈의 단편에 혼성화하는 하나 이상의 연속적인 올리고뉴클레오티드(contiguous oligonucleotide)를 포함한다. 또 다른 구체예에서, 상기 시약은 개체로부터 수득된 게놈 세그먼트의 반대쪽 가닥에 혼성화하는 한 쌍 이상의 올리고뉴클레오티드를 포함하고, 상기 각 올리고뉴클레오티드 프라이머 쌍은 하나 이상의 다형성을 포함하는 개체의 게놈의 단편을 선택적으로 증폭시키도록 설계되며, 상기 다형성은 표 10, 표 15, 표 19, 표 20, 표 21 및 표 22에 열거된 다형성 및 이들과 연관 불균형인 다형성 마커로 구성된 군으로부터 선택된다. 또 다른 구체예에서, 상기 단편은 크기가 20 bp 이상이다. 그와 같은 올리고뉴클레오티드 또는 핵산(예를 들면, 올리고뉴클레오티드 프라이머)은 유방암을 나타내는 다형성(예를 들면, SNP 또는 마이크로새틀라이트)을 둘러싼(flanking) 핵산 서열의 부분을 이용하여 설계될 수 있다. 또 다른 구체예에서, 상기 키트는 유방암과 연관된 하나 이상의 특정한 다형성 마커 또는 일배체형을 대입인자-특이적으로 검출할 수 있는 하나 이상의 표지된 핵산, 및 상기 표지의 검출을 위한 시약을 포함한다. 적합한 표지는 예를 들면, 방사성동위원소, 형광 표지, 효소 표지, 효소 보조-인자(co-factor) 표지, 자성 표지(magnetic label), 스핀 표지(spin label), 에피토프 표지(epitope label)를 포함한다.
특정한 구체예에서, 본 발명의 키트의 시약에 의해 검출될 다형성 마커 또는 일배체형은 표 10, 표 15, 표19, 표 20, 표 21 및 표 22에 표시된 마커들로 구성된 군으로부터 선택된, 하나 이상의 마커, 두개 이상의 마커, 세개 이상의 마커, 네개 이상의 마커, 또는 다섯개 이상의 마커를 포함한다. 일 구체예에서, 검출될 마커는 표 10, 표 15 또는 표 19에 열거된 마커들로부터 선택된다. 일 구체예에서, 검출될 마커는 표 10에 열거된 마커들로부터 선택된다. 또 다른 구체예에서, 검출될 마커는 표 15에 열거된 마커들로부터 선택된다. 또 다른 구체예에서, 검출될 마커는 표 19에 열거된 마커들로부터 선택된다. 바람직한 구체예에서, 검출될 마커는 rs4848543, rs13387042 및/또는 rs3803662이다. 다른 바람직한 구체예는 마커 rs4848543을 검출하기 위한 시약을 포함하는 것, 마커 rs13387042를 검출하기 위한 시약을 포함하는 것 및 마커 rs3803662를 검출하기 위한 시약을 포함하는 것을 포함한다. 또 다른 구체예에서, 검출될 마커 또는 일배체형은 표 10, 표 15, 표 19, 표 20, 표 21 및 표 22에 표시된 마커들에 표시된 마커들로 구성된 마커들의 군으로부터의 하나 이상의 마커와 0.2보다 큰 r2 값에 의해 정의된 강한 연관 불균형인 마커들의 군으로부터 선택된 하나 이상의 마커를 포함한다. 또 다른 구체예에서, 검출될 마커 또는 일배체형은 마커 rs4848543, rs13387042 및 rs3803662, 및 이들과 연관 불균형인 마커들로 구성된 마커들의 군으로부터 선택된 하나 이상의 마커를 포함한다.
그와 같은 구체예 중 하나에서, 상기 마커 또는 일배체형의 존재는 유방암에 대한 감수성(증가된 감수성 또는 감소된 감수성)을 나타낸다. 또 다른 구체예에서, 상기 마커는 rs4848543 대립인자 A, rs13387042 대립인자 A, 및/또는 rs3803662 대립인자 T이고, 이들의 존재는 유방암(예를 들면, All BC 및/또는 MedPre 유방암)의 증가된 위험도를 나타낸다. 또 다른 구체예에서, 상기 마커 또는 일배체형의 존재는 유방암 치료제에 대한 반응을 나타낸다. 또 다른 구체예에서, 상기 마커 또는 일배체형의 존재는 유방암 예후를 나타낸다. 또 다른 구체예에서, 상기 마커 또는 일배체형의 존재는 유방암 치료의 진행을 나타낸다. 그와 같은 치료는 수술에 의한 개입, 투약, 방사선요법 또는 기타 수단(예를 들면, 생활방식 변화)을 포함할 수 있다.
본 발명의 다형성과 연관된 유방암의 진단
본 발명의 진단 방법은 전반적으로 유방암에 대한 감수성을 진단하는 것과 관련하여 설명되었으나, 본 발명의 방법은 또한 본 발명의 다형성 마커와 연관된 유방암을 진단하기 위해 이용될 수 있다. 예를 들면, 유방암을 갖거나 또는 유방암과 연관된 위험 인자를 갖는 개체는 상기 개체에서 본 발명의 다형성 또는 일배체형의 존재가 유방암에 대한 기여 인자(contributing factor)였을 수 있는지 여부를 결정하기 위해 평가될 수 있다. 일 구체예에서, 본 발명의 마커 및/또는 일배체형과 연관된 유방암의 확인은 치료 계획을 촉진한다. 예를 들면, 개체가 유방암을 발병하는 비율을 최소화하기 위한 예방적 치료가 적용될 수 있다. 그와 같은 예방적 치료는 또한 개체가 본 발명의 위험 변이에 대해 이형접합형인지 또는 동형접합형인지 여부의 평가를 포함할 수 있다. 본 발명의 다른 구체예에서, 본 발명의 다형성 및/또는 일배체형과 연관된 적합한 유전자 또는 단백질을 표적화하도록 치료법이 설계되고 치료제가 선택될 수 있다.
다른 구체예에서, 본 발명은 개체에서, 본 발명에서 상세하게 설명된 바와 같은 본 발명의 다형성 마커 또는 일배체형의 존재를 확인하는 것에 의해, 개체에서 본 발명의 다형성과 연관된 유방암을 진단하고 확인하는 방법에 관한 것이다. 예를 들면, 본 명세서에 기재된 다형성 마커 및/또는 일배체형은 유방암에 걸리지 않은 개체에서보다 유방암에 걸린 개체에서 보다 빈번하게 발견된다. 따라서, 이 마커들 및/또는 일배체형은 유방암을 진단하기 위한 예측적 가치를 갖는다. 일 구체예에서, 유방암을 검출하기 위한 예측적 가치를 갖는 마커 또는 일배체형은 표 10, 표 15, 표 19, 표 20, 표 21 및 표 22의 마커들로 구성된 군으로부터 선택된 하나 이상의 마커를 포함한다. 또 다른 구체예에서, 유방암을 진단하기 위한 예측적 가치를 갖는 마커들은 마커 rs4848543, rs13387042 및 rs3803662, 및 이들과 연관 불균형인 마커들로부터 선택된다.
또 다른 구체예에서, 유방암을 진단하기 위한 예측적 가치를 갖는 마커 대립인자는 rs4848543 대립인자 A, rs13387042 대립인자 A, 및 rs3803662 대립인자 T, 및 이들과 연관 불균형인 마커들을 포함한다.
따라서, 본 명세서에 기재된 방법들은 개체로부터의 시료에서 마커 또는 일배체형의 특정한 대립인자의 존재 또는 부재를 평가하기 위해 이용될 수 있고, 상기 마커 또는 일배체형의 특정한 대립인자의 존재 또는 부재는 유방암의 감수성을 나타낸다.
본 발명의 일 구체예에서, 본 발명의 다형성 및/또는 일배체형과 연관된 유방암의 진단은 본 발명의 다형성을 검출하는 것에 의해 수행된다. 특정한 다형성이 본 명세서에 기재된다(예를 들면, 표 10, 표 15, 표 19, 표 20, 표 21, 및 표 22, 및 이들과 연관 불균형인 마커들 참조). 유방암이 본 발명의 하나 이상의 다형성과 연관되는지 여부를 결정하기 위해 유방암을 갖는 개체로부터 게놈 DNA, RNA 또는 cDNA의 시료가 수득된다. 그 후, 상기 시료에 본 발명의 다형성의 특정한 대립인자 또는 본 발명의 특정한 일배체형이 존재하는지 여부를 결정하기 위해 상기 DNA, RNA 또는 cDNA 시료가 검사된다. 상기 핵산 시료가 본 발명의 다형성의 대립인자 또는 일배체형을 포함하는 것으로 확인되는 경우, 상기 대립인자 또는 일배체형의 존재는 상기 다형성 및/또는 일배체형과 연관된 유방암을 나타낸다.
서던 분석(Southern analysis), 노던 분석(Northern analysis), 및/또는 인-시투 혼성화(in situ hybridization), 제한효소 처리(restriction digestion) 또는 서열 분석과 같은 혼성화 방법을 포함하나, 이에 한정되지 않는, 본 발명이 속하는 기술 분야의 당업자에게 공지된 방법이 다형성을 검출하기 위해 이용될 수 있다. 본 발명의 다형성과 연관된 유방암의 진단은 또한 ELISA(enzyme linked immunosorbent assay), 웨스턴 블롯, 면역침전 및 면역형광, 또는 본 발명이 속하는 기술 분야의 당업자에게 공지된 다른 방법을 포함한 다양한 방법을 이용하여, 본 발명의 다형성과 연관된 핵산에 의해 코딩된 폴리펩티드의 발현 및/또는 조성을 검사하는 것에 의해 수행될 수 있다.
치료제
본 발명의 변이(예를 들면, 본 발명의 마커 및/또는 일배체형, 예를 들면, 표 10, 표 15 및 표 19에 열거된 마커들)는 유방암에 대한 신규한 치료제 표적을 확인하기 위해 이용될 수 있다. 예를 들면, 유방암과 연관된 변이(마커 및/또는 일배체형)를 포함하는 유전자 또는 상기 변이와 연관 불균형인 유전자(예를 들면, 하나 이상의 STEAP3/TSAP6 유전자, LOC643714 유전자, 및/또는 TNRC9 유전자), 또는 그들의 산물, 및 이 변이 유전자들 또는 그들의 산물에 의해 직접적으로 또는 간접적으로 조절되거나 또는 이들과 상호작용하는 유전자 또는 그들의 산물이 유방암을 치료하는 치료제의 개발을 위해 표적화될 수 있다. 치료제는 하나 이상의, 예를 들면, 표적 유전자 또는 그들의 유전자 산물의 기능 및/또는 수준을 조절할 수 있는, 작은 비-단백질(non-protein) 및 비-핵산 분자, 단백질, 펩티드, 단백질 단편, 핵산(DNA, RNA), PNA(peptide nucleic acid), 또는 그들의 유도체 또는 모방체(mimetics)를 포함할 수 있다.
본 발명의 핵산 및/또는 변이, 또는 그들의 상보적 서열을 포함하는 핵산이 세포, 조직 또는 기관에서 유전자 발현을 조절하기 위한 안티센스 구조물(antisense construct)로서 이용될 수 있다. 안티센스 기법과 연관된 방법은 당업자에게 잘 알려져 있고, AntisenseDrug Technology: Principles, Strategies, and Applications, Crooke, ed., Marcel Dekker Inc., New York (2001)에서 설명되고 검토된다. 일반적으로, 안티센스 핵산 분자는 유전자에 의해 발현되는 mRNA의 영역에 상보적이도록 설계되어, 상기 안티센스 분자가 mRNA에 혼성화되고, 따라서, 상기 mRNA의 단백질로의 번역을 차단한다. 절단제(cleaver) 및 차단제(blocker)를 포함한, 여러 종류의 안티센스 올리고뉴클레오티드가 본 발명이 속하는 기술 분야의 당업자에게 알려져 있다. 전자, 즉, 절단제는 표적 RNA 부위에 결합하고, 상기 표적 RNA를 절단하는, 세포내 뉴클레아제(예를 들면, RnaseH 또는 Rnase L)를 활성화시킨다. 차단제는 표적 RNA에 결합하고, 리보좀의 입체 장애(steric hindrance)에 의해 단백질 번역을 저해한다. 차단제의 예는 핵산, 모르폴리노 화합물, LNA(locked nucleic acid) 및 메틸포스포네이트를 포함한다(Thompson, Drug Discovery Today, 7:912-917 (2002)). 안티센스 올리고뉴클레오티드는 직접적으로 치료제로서 유용하고, 또한 예를 들면, 유전자 넉-아웃(knock-out) 또는 유전자 넉-다운 실험에 의해, 유전자 기능을 결정하고 검증하기 위해 유용하다. 안티센스 기술은 Lavery et al., Curr. Opin. Drug Discov. Devel. 6:561-569 (2003), Stephens et al., Curr. Opin. Mol. Ther. 5:118-122 (2003), Kurreck, Eur. J. Biochem. 270:1628-44 (2003), Dias et al., Mol. Cancer Ter. 1:347-55 (2002), Chen, Methods Mol. Med. 75:621-636 (2003), Wang et al., Curr. Cancer Drug Targets 1:177-96 (2001), 및 Bennett, Antisense Nucleic Acid Drug.Dev. 12:215-24 (2002)에 더 설명된다.
본 명세서에 기재된 변이는 특정한 변이에 특이적인 안티센스 시약의 선택 및 설계를 위해 이용될 수 있다. 본 명세서에 기재된 변이에 대한 정보를 이용하여, 하나 이상의 본 발명의 변이를 포함하는 표적 mRNA를 특이적으로 표적화하는 안티센스 올리고뉴클레오티드 또는 다른 안티센스 분자들이 설계될 수 있다. 이 방식으로, 본 발명의 하나 이상의 변이(마커 및/또는 일배체형)를 포함하는 mRNA 분자의 발현이 저해되거나 또는 차단될 수 있다. 일 구체예에서, 안티센스 분자는 표적 핵산의 특정한 대립인자 형태(즉, 하나 또는 수개의 변이(대립인자 및/또는 일배체형))에 특이적으로 결합하여, 이 특정한 대립인자 또는 일배체형으로부터 기원된 산물의 번역을 저해하나, 상기 표적 핵산 분자의 특정한 다형성 부위에서 다른 변이 또는 대안적인 변이에는 결합하지 않도록 설계된다.
안티센스 분자는 유전자 발현을 저해하고, 따라서, 단백질 발현을 저해하기 위해 mRNA를 불활성화시키기 위해 이용될 수 있기 때문에, 안티센스 분자는 유방암을 치료하기 위해 이용될 수 있다. 방법은 mRNA가 번역되는 능력을 약화시키는, mRNA의 하나 이상의 영역에 상보적인 뉴클레오티드 서열을 포함하는 리보자임(ribozyme)에 의한 절단을 포함할 수 있다. 그와 같은 mRNA 영역은 예를 들면, 단백질-코딩 영역, 특히, 촉매 활성, 기질 및/또는 리간드 결합 부위, 또는 단백질의 다른 기능성 도메인에 상응하는 단백질-코딩 영역을 포함한다.
C. elegans (Fire et al.,Nature 391:806-11 (1998))에서의 최초의 발견 이후, 지난 10년간 RNA 간섭(RNA interference, RNAi) 현상이 활발하게 연구되었고, 최근년에, 인간 질병의 치료에서 RNAi의 잠재적 용도가 활발히 탐구되고 있다(reviewed in Kim & Rossi, Nature Rev. Genet. 8:173-204 (2007)). 유전자 침묵(gene silencing)으로도 불리는, RNA 간섭(RNAi)은 특정한 유전자를 중지(turn off)시키기 위해 이중-가닥 RNA 분자(dsRNA)를 이용하는 것에 기반한다. 세포에서, 세포질 이중가닥-RNA 분자(dsRNA)는 세포성 복합체(cellular complex)에 의해 작은 간섭 RNA(siRNA)로 가공된다. siRNA는 단백질-RNA 복합체를 표적 mRNA 상의 특정한 부위로 표적화되게 하여, 상기 mRNA의 절단을 초래한다(Thompson, Drug Discovery Today, 7:912-917 (2002)). siRNA 분자들은 통상적으로 길이가 약 20개, 21개, 22개 또는 23개의 뉴클레오티드로 구성된다. 따라서, 본 발명의 일 양태는 분리된 핵산 분자, 및 상기 분자들의 RNA 간섭을 위한 용도, 즉, 작은 간섭 RNA 분자(siRNA)로서의 용도에 관한 것이다. 일 구체예에서, 상기 분리된 핵산 분자는 길이가 18개 내지 26개의 뉴클레오티드로 구성되고, 바람직하게는 19개 내지 25개의 뉴클레오티드로 구성되며, 보다 바람직하게는 20개 내지 24개의 뉴클레오티드로 구성되고, 보다 바람직하게는, 21개, 22개 또는 23개의 뉴클레오티드로 구성된다.
RNAi-매개 유전자 침묵을 위한 또 다른 경로는 세포에서 전구체 miRNA(precursor microRNA, pri-miRNA)를 생성하기 위해 가공되는, 내재적으로 코딩된 일차 마이크로RNA(endogenously encoded micorRNA)(pri-miRNA) 전사체에서 기인한다. 이 miRNA 분자들은 핵으로부터 세포질로 유출되고, 세포질에서 성숙 miRNA 분자(mature miRNA)를 생성하기 위해 가공을 거치고, 상기 miRNA는 mRNA의 3' 비번역 영역(untranslated region, UTR) 내의 표적 부위를 인식하는 것에 의해 번역 저해(translational inhibition)를 주도하고, 뒤이어 P-바디(P-body)를 가공하는 것에 의해 mRNA 분해를 주도한다(reviewed in Kim & Rossi, Nature Rev. Genet. 8:173-204 (2007)).
RNAi의 임상적 적용은 바람직하게는 크기가 약 20 내지 23개의 뉴클레오티드로 구성되고, 바람직하게는 2개의 뉴클레오티드로 구성된 3' 오버랩(overlap)을 갖는 것인 합성 siRNA 듀플렉스의 내포(incorporation)를 포함한다. 유전자 발현의 넉다운은 표적 mRNA에 대한 서열-특이적 설계에 의해 확립된다. 그와 같은 분자의 최적 설계 및 합성을 위한 여러 상업적 사이트들이 본 발명이 속하는 기술 분야의 당업자에게 알려져 있다.
다른 적용들은 보다 긴 siRNA 분자(통상적으로 25 내지 30개의 뉴클레오티드로 구성된 길이, 바람직하게는 약 27개의 뉴클레오티드로 구성된 길이), 및 작은 헤어핀 RNA(small hairpin, sh RAN; 통상적으로 약 29개의 뉴클레오티드로 구성된 길이)를 제공한다. 후자는 Amarzguioui et al. (FEBS Lett. 579:5974-81 (2005))에 기재된 바와 같이, 자연적으로 발현된다. 화학적으로 합성된 siRNA 및 shRNA는 인 비보 가공을 위한 기질이며, 일부 경우에, 보다 짧은 설계의 경우보다 더 강력한 유전자 침묵을 제공한다(Kim et al., Nature Biotechnol. 23:222-226 (2005); Siolas et al., Nature Biotechnol. 23:227-231 (2005)). 일반적으로, siRNA의 세포내 농도가 후속 세포 분열에 의해 희석되기 때문에, siRNA는 유전자 발현의 일시적 침묵을 제공한다. 대조적으로, 발현된 shRNA는 shRNA의 전사가 일어나는 동안은, 표적 전사체(target transcript)의 장기적이고 안정적인 넉다운을 매개한다(Marques et al., Nature Biotechnol. 23:559-565 (2006); Brummelkamp et al., Science 296: 550-553 (2002)).
siRNA, miRNA 및 shRNA를 포함하는 RNAi 분자들은 서열-의존적 방식으로 작용하기 때문에, 본 발명의 변이(예를 들면, 표 10, 표 15 및 표 19에 표시된 마커 및 일배체형)는 특정한 대립인자 및/또는 일배체형(예를 들면, 본 명세서에 기재된 마커 및 일배체형)을 포함하는 특이적 핵산 분자를 인식하나, 다른 대립인자 또는 일배체형을 포함하는 핵산 분자는 인식하지 않는 RNAi 시약을 설계하기 위해 이용될 수 있다. 따라서, 이 RNAi 시약은 표적 핵산 분자를 인식하고 파괴시킬 수 있다. 안티센스 시약의 경우와 같이, RNAi 시약은 치료제로서(즉, 질병-연관 유전자 또는 질병-연관 유전자 변이의 중지(turnoff)를 위해) 유용할 수 있으나, 또한 유전자 기능을 규명하고 검증하기 위해 유용할 수 있다(예를 들면, 유전자 넉-아웃 또는 유전자 넉-다운 실험에 의해).
RNAi의 전달은 본 발명이 속하는 기술 분야에서 당업자에게 알려진 다양한 방법에 의해 수행될 수 있다. 비-바이러스 전달(non-viral delivery)을 이용하는 방법은 콜레스테롤, 안정한 핵산-지질 입자(stable nucleic acid-lipid particle, SNALP), 중쇄 항체 단편(Fab), 앱타머(aptamer) 및 나노입자를 포함한다. 바이러스에 의한 전달 방법(viral delivery method)은 렌티바이러스, 아데노바이러스 및 아데노-연관 바이러스(adeno-associated virus)의 이용을 포함한다. 일부 구체예에서, siRNA 분자는 그들의 안정성을 증가시키기 위해 화학적으로 변형된다. 이는 2'-O-메틸푸린 및 2'-플루오로푸린을 포함한, 리보오스의 2' 위치에서의 변형을 포함하고, 이 변형들은 Rnase 활성에 대한 내성을 제공한다. 다른 화학적 변형이 가능하며 본 발명이 속하는 기술 분야의 당업자에게 알려져 있다.
하기의 참조문헌들이 RNAi, 및 RNAi를 이용한 특정한 유전자의 표적화 가능성의 추가적인 요약을 제공한다: Kim & Rossi, Nat. Rev. Genet. 8:173-184 (2007), Chen & Rajewsky, Nat. Rev. Genet. 8: 93-103 (2007), Reynolds, et al., Nat. Biotechnol. 22:326-330 (2004), Chi et al., Proc. Natl. Acad. Sci. USA 100:6343-6346 (2003), Vickers et al., J. Biol. Chem. 278:7108-7118 (2003), Agami, Curr. Opin. Chem. Biol. 6:829-834 (2002), Lavery, et al., Curr. Opin. Drug Discov. Devel. 6:561-569 (2003), Shi, Trends Genet. 19:9-12 (2003), Shuey et al., Drug Discov. Today 7:1040-46 (2002), McManus et al., Nat. Rev. Genet. 3:737-747 (2002), Xia et al., Nat. Biotechnol. 20:1006-10 (2002), Plasterk et al., curr. Opin. Genet. Dev. 10:562-7 (2000), Bosher et al., Nat. Cell Biol. 2:E31-6 (2000), 및 Hunter, Curr. Biol. 9:R440-442 (1999).
유방암의 발병에 대한 증가된 소인(predispotion) 또는 위험도를 초래하는 유전적 결함, 또는 유방암을 유발하는 결함이 유전적 결함을 갖는 개체에게 상기 유전적 결함의 부위에 정상/야생형 뉴클레오티드를 공급하는 복구 서열(repair sequence)을 내포하는 핵산 단편을 투여하는 것에 의해 영구적으로 정정될 수 있다. 그와 같은 부위-특이적 복구 서열은 개체의 게놈 DNA의 내재적 복구를 촉진하기 위해 작용하는 RNA/DNA 올리고뉴클레오티드를 포함(concompass)할 수 있다. 복구 서열의 투여는 음이온성 리포좀 내에 캡슐화된, 폴리에틸렌이민과의 복합체, 아데노바이러스 벡터와 같은 바이러스 벡터 또는 투여되는 핵산의 세포내 흡수를 촉진하기에 적합한 다른 약제학적 조성물과 같은, 적합한 비히클에 의해 수행될 수 있다. 그 후, 키메라 올리고뉴클레오티드가 개체의 게놈으로 정상적인 서열의 내포를 유도하여, 정상/야생형 유전자 산물의 발현을 유도하기 때문에, 유전적 결함이 극복될 수 있다. 상기 교체(replacement)가 유전되고, 따라서, 질환 또는 상태와 연관된 증상의 영구적인 치유 및 경감을 가능하게 한다.
본 발명은 유방암을 치료 및/또는 예방하기 위해 이용될 수 있는 화합물 또는 작용제를 확인(식별, identify)하는 방법을 제공한다. 따라서, 본 발명의 변이는 치료제의 확인 및/또는 개발을 위한 표적으로 유용하다. 특정한 구체예에서, 그와 같은 방법은 작용제 또는 화합물이 본 발명의 하나 이상의 변이(마커 및/또는 일배체형)를 포함하는 핵산, STEAP3/TSAP6 유전자, LOC643714 유전자, 및/또는 TNRC9 유전자 중 하나 이상, 또는 상기 핵산의 코딩된 산물의 활성 및/또는 발현을 조절하는 능력을 분석하는 단계를 포함할 수 있다. 이는 또한 코딩된 핵산 산물의 원치않는 활성 또는 발현을 저해 또는 변화시키는 작용제 또는 화합물을 확인하기 위해 이용될 수 있다. 그와 같은 실험을 수행하기 위한 분석법은 당업자에게 공지된 바와 같이, 세포-기반 시스템 또는 세포-불포함 시스템(cell-free system)에서 수행될 수 있다. 세포-기반 시스템은 본래 목적 핵산 분자를 발현하는 세포, 또는 특정한 원하는 핵산 분자를 발현하도록 유전적으로 변형된 재조합 세포를 포함한다.
환자에서 변이 유전자 발현이 변이-함유 핵산 서열의 발현(예를 들면, 하나 이상의 변이를 함유하는 RNA로 전사되고, 뒤이어 단백질로 번역될 수 있는, 본 발명의 하나 이상의 변이를 포함하는 유전자), 또는 정상적인 전사체의 발현 수준 또는 패턴에 영향을 미치는 변이, 예를 들면, 유전자의 조절 또는 제어 영역의 변이에 따른, 정상/야생형 핵산 서열의 변화된 발현에 의해 평가될 수 있다. 유전자 발현에 대한 분석법은 직접적인 핵산 분석법(mRNA), 발현된 단백질 수준에 대한 분석법, 또는 경로, 예를 들면, 신호 경로(signal pathway)에 관여된 부수적(collateral) 화합물의 분석을 포함한다. 또한, 신호 경로에 대응하여 상향-조절 또는 하향-조절되는 유전자의 발현이 분석될 수 있다. 일 구체예는 루시페라아제와 같은 리포터 유전자를 목적 유전자의 조절 영역에 작동가능하게 연결하는 단계를 포함한다.
일 구체예에서, 세포가 후보 화합물 또는 작용제와 접촉되고, mRAN의 발현이 결정되는 경우, 유전자 발현의 조절제(modulator)가 확인될 수 있다. 후보 화합물 또는 작용제의 존재 하의 mRNA의 발현 수준이 상기 화합물 또는 작용제의 부재 하의 발현 수준에 비교될 수 있다. 이 비교에 근거하여, 유방암을 치료 및/또는 예방하기 위한 후보 화합물 또는 작용제가 변이 유전자의 유전자 발현을 조절하는 화합물 또는 작용제로 확인될 수 있다. mRNA의 발현 또는 코딩된 단백질이 후보 화합물 또는 작용제의 부재시보다 존재 시에 통계적으로 유의성 있게 더 높은 경우, 상기 후보 화합물 또는 작용제는 상기 핵산의 발현의 촉진제 또는 상향-조절제(up-regulator)로 확인된다. 핵산 발현 또는 단백질 수준이 후보 화합물 또는 작용제의 부재시 보다 존재 시에 통계적으로 유의성 있게 더 낮은 경우, 상기 후보 화합물은 상기 핵산의 발현의 저해제 또는 하향-조절제(down-regulator)로 확인된다.
본 발명은 또한 약물(화합물 및/또는 작용제) 스크리닝을 통해 확인된 화합물을 유전자 조절제(즉, 유전자 발현의 촉진제 및/또는 저해제)로 이용한 치료 방법을 제공한다.
치료제에 대한 반응의 확률을 평가하는 방법, 치료의 진행을 모니터링하는 방법 및 유방암의 치료 방법
본 발명이 속하는 기술 분야에서 공지된 바와 같이, 개체들은 특정한 치료(예를 들면, 본 명세서에서 더 설명되는, 치료제 또는 치료 방법)에 대해 차등적 반응을 가질 수 있다. 차등적 반응의 근거는 부분적으로 유전학적으로 결정될 수 있다. 약물유전학(Pharmacogenomics)은 유전적 변이(예를 들면, 본 발명의 변이(마커 및/또는 일배체형))가 변화된 약물 소인(drug disposition) 및/또는 약물의 비정상적인 또는 변화된 작용 때문에, 약물 반응에 어떻게 영향을 미치는지의 문제를 다룬다. 따라서, 차등적 반응의 근거(basis)가 부분적으로 유전학적으로 결정될 수 있다. 약물 반응에 영향을 미치는 유전적 변이에 따른 임상적 결과는 일부 개체(본 발명의 유전적 변이의 보인자 또는 비-보인자)에서 약물의 독성, 또는 약물의 치료적 실패(therapeutic failure)를 초래할 수 있다. 따라서, 본 발명의 변이는 치료제 및/또는 방법이 신체에 대해 작용하는 방식, 또는 신체가 치료제를 대사하는 방식을 결정할 수 있다.
따라서, 일 구체예에서, 본 명세서에 기재된 다형성 부위에서 특정한 대립인자 또는 일배체형의 존재는 특정한 치료 방식(treatment modality)에 대한 상이한 반응,을 나타낸다. 이는 유방암으로 진단되고, 본 발명의 다형성 부위에 특정한 대립인자 또는 일배체형(예를 들면, 본 발명의 위험 대립인자 및/또는 일배체형)을 갖는 환자가 유방암을 치료하기 위해 이용된 특정한 치료제, 약물 및/또는 다른 치료법에 대해 보다 유리하게 또는 보다 불리하게 반응할 것이라는 것을 의미한다. 따라서, 상기 마커 대립인자 또는 일배체형의 존재 또는 부재는 환자에 대해 어떤 치료가 이용되어야 하는지를 결정하는데 도움이 될 수 있다. 예를 들면, 새로 진단된 환자의 경우, 본 발명의 마커 또는 일배체형의 존재가 (예를 들면, 본 명세서에 기재된 바와 같이, 게놈 DNA를 포함하는 혈액 시료 또는 기타 시료로부터 유래된 DNA의 테스트를 통해) 평가될 수 있다. 환자가 마커 대립인자 또는 일배체형에 대해 양성인 경우(즉, 마커의 하나 이상의 특정한 대립인자 또는 일배체형이 존재하는 경우), 의사는 하나의 특정한 치료(예를 들면, 하나의 특정한 치료제 또는 치료제의 조합)를 권고하고, 환자가 마커의 상기 하나 이상의 대립인자 또는 일배체형에 대해 음성인 경우, 다른 코스의 치료(즉각적인 치료가 아닌, 질병의 진행에 대한 지속적인 모니터링이 수행될 것을 권고하는 것을 포함할 수 있음)가 권고될 수 있다. 따라서, 환자의 보인자 상태가 특정한 치료 방식이 적용되어야 하는지 여부를 결정하는 것을 보조하기 위해 이용될 수 있다. 그 가치는 질병을 조기에 진단하고, 임상의에게 가장 적합한 치료를 적용할 수 있도록 질병의 예후/공격성에 대한 정보를 제공할 수 있다는 가능성에 있다.
본 명세서에서 더 설명되는 바와 같이, 현재 유방암의 임상적인 예방 옵션은 주로 화학적 예방(화학요법 또는 호르몬 요법) 및 예방적 수술이다. 가장 일반적인 화학적 예방제는 타목시펜 및 랄록시펜이다; 다른 옵션은 아로마타아제 저해제를 포함한다. 치료 옵션은 또한 방사선 요법을 포함하고, 방사선 요법의 경우, 일부 환자들이 심각한 증상을 경험한다. 본 명세서에 기재된, 본 발명의 마커들은 이 치료 옵션에 대한 반응을 평가하기 위해 또는 이 치료 옵션들 중 하나를 이용한 치료법의 진행을 예측하기 위해 이용될 수 있다. 따라서, 개체의 유전적 상태(genetic status)에 기반하여 적합한 치료 전략을 선택하기 위해 유전적 프로파일링이 이용될 수 있거나, 또는 특정한 치료 옵션의 결과를 예측하기 위해 유전적 프로파일링이 이용될 수 있어서, 치료 옵션 또는 이용가능한 치료 옵션의 조합의 전략적 선택에서 유용할 수 있다.
본 발명은 또한 유방암에 대한 치료의 진행 또는 효과를 모니터링하는 방법에 관한 것이다. 이는 본 발명의 마커 및 일배체형의 유전형 및/또는 일배체형 상태에 근거하여 수행되며, 즉, 본 명세서에 개시된 하나 이상의 다형성 마커의 하나 이상의 대립인자의 부재 또는 존재를 평가하거나, 또는 본 발명의 변이(마커 및 일배체형)와 연관된 유전자의 발현을 모니터링하는 것에 의해 수행될 수 있다. 조직 시료(예를 들면, 말초 혈액 시료, 또는 생검 시료)에서 위험 유전자 mRNA 또는 코딩된 폴리펩티드가 측정될 수 있다. 따라서, 치료 효과를 모니터링하기 위해 발현 수준 및/또는 mRNA 수준이 치료 전 및 치료 동안 측정될 수 있다. 대안적으로 또는 동시에, 치료 효과를 모니터링하기 위해 본 명세서에 개시된 유방암에 대한 하나 이상의 위험 변이의 유전형 및/또는 일배체형 상태가 치료 전 및 치료 동안 측정될 수 있다.
대안적으로, 본 발명의 마커 및 일배체형과 관련된 생물학적 네트워크 또는 대사 경로는 mRNA 및/또는 폴리펩티드 수준을 결정하는 것에 의해 모니터링될 수 있다. 이는 예를 들면, 치료 전과 치료 동안 채취된 시료에서, 상기 네트워크 및/또는 경로에 속하는 여러 유전자들의 발현 수준 또는 폴리펩티드를 모니터링하는 것에 의해 수행될 수 있다. 대안적으로, 상기 생물학적 네트워크 또는 대사 경로에 속하는 대사산물은 치료 전 및 치료 동안 결정될 수 있다. 치료의 효과는 건강한 개체로부터의 상응하는 데이터 대비, 치료 동안 발현 수준/대사산물 수준의 관찰된 변화를 비교하는 것에 의해 결정된다.
또 다른 양태에서, 본 발명의 마커는 임상 시험의 검정력(power) 및 효과를 증가시키기 위해 이용될 수 있다. 따라서, 본 발명의 위험 변이의 보인자인 개체, 즉, 유방암을 발병할 증가된 위험도를 부여하는 하나 이상의 다형성 마커의 하나 이상의 대립인자의 보인자인 개체가 특정한 치료 방식(treatment modality)에 반응할 가능성이 더 높을 수 있다. 일 구체에에서, 특정한 치료(예를 들면, 소형 분자 약물)가 표적화하는 경로 및/또는 대사 네트워크 내의 유전자에 대한 위험 변이를 갖는 개체는 상기 치료에 대해 반응을 보일 가능성이 더 높다. 또 다른 구체예에서, 그 발현 및/또는 기능이 위험 변이에 의해 변화되는 것인 유전자에 대한 위험 변이를 갖는 개체는 상기 유전자, 그의 발현 또는 그의 유전자 산물을 표적화하는 치료 방식에 반응할 가능성이 더 높다.
또 다른 양태에서, 본 발명의 마커 및 일배체형은 특정한 개인을 위한 약제학적 작용제의 선택을 표적화하기 위해 이용될 수 있다. 치료 방식의 맞춤화된 선택(personalized seleciton), 생활방식 변화(예를 들면, 식단의 변화, 운동, 체중 감량 프로그램, 금연, 스트레스를 저하시킨 생활방식 등) 또는 상기 두가지의 조합이 본 발명의 위험 변이의 이용에 의해 실현될 수 있다. 따라서, 본 발명의 특정한 마커에 대한 개체의 상태의 지식은 본 발명의 위험 변이에 의해 영향받은 유전자 또는 유전자 산물을 표적화하는 치료 옵션의 선택을 위해 유용할 수 있다. 변이의 특정한 조합이 하나의 치료 옵션의 선택을 위해 적합할 수 있고, 다른 유전자 변이 조합은 다른 치료 옵션을 표적화할 수 있다. 그와 같은 변이의 조합은 임상적으로 신뢰성있는 정확도로 치료 모듈의 선택을 결정하기 위해 필요한 경우, 하나의 변이, 두개의 변이, 세개의 변이, 또는 네개 또는 그 이상의 변이를 포함할 수 있다.
컴퓨터-구현 양태(Computer-implemented aspects)
본 발명은 또한 본 명세서에서 유방암과 연관된 것으로 기재된 다형성 마커 및 일배체형의 컴퓨터-구현 응용(computer-implemented applicatoin)에 관한 것이다. 그와 같은 응용은 본 명세서에 기재된 바와 같이, 본 발명의 방법에서 유용한 유전형 데이터를 저장, 처리(manipulate)하거나 또는 분석하기 위해 유용할 수 있다. 하나의 예는 개인으로부터 유래된 유전형 정보를 판독가능한 매체(readable media) 상에 저장하여, 제3자(예를 들면, 개인)에게 유전형 정보를 제공할 수 있거나, 또는 유전형 데이터로부터 정보를 수득하기 위해, 예를 들면, 상기 유전형 데이터를 유방암에 대한 증가된 감수성에 기여하는 유전적 위험 인자에 대한 정보에 비교하고, 그와 같은 비교에 근거한 결과를 보고하는 것에 관한 것이다.
하나의 그와 같은 양태는 컴퓨터-판독가능한 매체(computer-readable media)에 관한 것이다. 일반적으로, 그와 같은 매체는 (i) 하나 이상의 다형성 마커 또는 일배체형에 대한 식별자(identifier) 정보; (ii) 유방암을 갖는 개체에서, 상기 하나 이상의 마커의 하나 이상의 대립인자의 빈도, 또는 일배체형의 빈도의 지표(indicator); 및 기준 집단(reference population)에서 상기 하나 이상의 마커의 하나 이상의 대립인자의 빈도, 또는 일배체형의 빈도의 지표를 저장하는 능력을 갖는다. 기준 집단은 질병-불포함(disease-free) 개인의 집단일 수 있다. 대안적으로, 기준 집단은 일반적인 집단으로부터의 랜덤 표본이고, 따라서, 전반적으로 상기 집단을 대표한다. 빈도 지표는 계산된 빈도, 대립인자 및/또는 일배체형 카피의 계수(count), 또는 특정한 매체를 위해 적합한 실제 빈도의 정규화된(normalized) 또는 달리 처리된(manipulated) 값일 수 있다.
선조 정보(ancestry informaton), 성별, 신체적 특성 또는 특징(신장 및 체중 포함)에 대한 정보, 생화학적 측정값, 치료 적용, 치료 결과, 투약, 또는 특정한 개인의 유전형 상태에 관하여 저장 또는 처리되는 것이 바람직한 다른 유용한 정보와 같은, 개인에 대한 추가적인 정보가 상기 매체에 저장될 수 있다.
본 발명은 또한 개인에서 유방암에 대한 감수성을 결정하기 위해 유용한 유전적 데이터의 결정 또는 처리를 위해 적합한 장치에 관한 것이다. 그와 같은 장치는 컴퓨터-판독가능한 메모리, 컴퓨터-판독가능한 메모리 상에 저장된 데이터를 처리하기 위한 루틴(routine), 및 유전적 데이터의 척도를 포함한 결과물(output)을 생성하기 위한 루틴을 포함할 수 있다. 그와 같은 척도는 대립인자 빈도 또는 일배체형 빈도, 유전형 계수(genotype count), 성별, 연령, 표현형 정보, 오즈비(OR) 값 또는 상대적 위험도(RR), 집단 귀속 위험도(PAR), 또는 본래의 유전형 데이터의 직접적인 통계값이거나 또는 유전적 데이터에 근거한 계산에 기반한 다른 유용한 정보를 포함할 수 있다.
특정한 구체예에서, 본 명세서에서 유방암의 증가된 감수성(예를 들면, 증가된 위험도)과 연관된 것으로 확인된 마커들 및 일배체형들은 유전형 데이터의 해석 및/또는 분석을 위해 유용하다. 따라서, 특정한 구체예에서, 본 명세서에서 입증된 바와 같은, 유방암에 대한 위험 대립인자, 또는 위험 일배체형, 또는 본 명세서에서 유방암과 연관된 것으로 입증된 마커들 및/또는 일배체형 중 하나와 LD인 다형성 마커의 대립인자 또는 일배체형의 확인은 해당 유전형 데이터가 기원한 개체가 유방암의 증가된 위험을 갖는다는 것을 나타낸다. 하나의 그와 같은 구체예에서, 유전형 데이터는 본 명세서에서 유방암과 연관된 것으로 확인된 하나 이상의 다형성 마커, 또는 이들과 연관 불균형인 마커에 대해 생성된다. 유전형 데이터는 뒤이어 질병(예를 들면, 유방암)에 대한 위험 척도의 형태(예를 들면, 절대 위험도(AR), 위험도 비(risk ratio, RR), 또는 오즈비(odds ratio, OR))인 유전형 데이터의 해석과 함께, 해당 데이터가 기원한 개체에게 예를 들면, 인터넷을 통해 접근가능한 사용자 인터페이스를 통해 이용가능하다. 또 다른 구체예에서, 개체로부터 유래된 유전형 데이터세트에서 확인된 위험 마커가 평가되고 상기 데이터세트에서 그와 같은 위험 변이의 존재에 의해 부여된 위험도의 평가로부터의 결과가, 예를 들면, 안전한 웹 인터페이스를 통해, 또는 다른 통신 수단에 의해 상기 개체에게 이용가능하다. 그와 같은 위험도 평가의 결과가 수치 형태(예를 들면, 절대 위험도, 상대적 위험도 및/또는 오즈비와 같은 위험도 값, 또는 기준 대비 위험도의 백분율 증가), 그래프 수단에 의해, 또는 해당 유전형 데이터가 유래된 개체에 대한 위험도를 보여주기에 적합한 다른 수단에 의해 보고될 수 있다. 특정한 구체예에서, 위험도 평가의 결과가 제3자, 예를 들면, 의사, 기타 의료인 또는 유전 상담가에게 이용가능하다.
본 발명의 다양한 양태에서 유용한 마커
전술된 방법 및 응용은 모두 본 명세서에서 유방암에 대한 감수성을 평가하기 위해 유용한 것으로 일반적인 용어로 보다 상세하게 설명된 본 발명의 마커 및 일배체형에 의해 실시될 수 있다. 따라서, 이 응용은 일반적으로 표 10, 15, 19, 20, 21 및 22 중 하나에 표시된 마커들, 및 이들과 연관 불균형인 마커들을 이용하여 실시될 수 있다. 특정한 구체예에서, 상기 마커 또는 일배체형은 서열번호 4, 서열번호 5 또는 서열번호 6에 표시된 서열의 게놈 세그먼트 내에 존재한다. 일부 구체예에서, 상기 마커는 rs4848543 LD 블럭, rs13387042 LD 블럭 또는 rs3803662 LD 블럭 내에 존재한다. 특정한 구체예에서, 상기 마커들은 표 10에 표시된 마커들로부터 선택된다. 다른 구체예에서, 상기 마커들은 표 15에 표시된 마커들로부터 선택된다. 다른 구체예에서, 상기 마커들은 표 19에 표시된 마커들로부터 선택된다. 일부 구체예에서, 상기 마커들은 표 7 및 8에 표시된 마커들로부터 선택된다. 일부 구체예에서, 상기 마커들은 표 14에 표시된 마커들로부터 선택된다. 일부 다른 구체예에서, 상기 마커들은 표 18에 표시된 마커들로부터 선택된다. 다른 구체예에서, 상기 마커들은 선택적으로 이들과 연관 불균형인 마커들을 포함한, rs4848543 (서열번호 1), rs13387042 (서열번호 2), 또는 rs3803662 (서열번호 3) 중 하나이다. 일 구체예에서, 상기 마커들은 rs4848543 (서열번호 1), rs13387042 (서열번호 2), 및 rs3803662 (서열번호 3) 중 하나이다. 일부 바람직한 구체예에서, 상기 마커는 rs4848543 (서열번호 1)이다. 다른 바람직한 구체예에서, 상기 마커는 rs13387042 (서열번호 2)이다. 다른 바람직한 구체예에서, 상기 마커는 rs3803662 (서열번호 3)이다. 특정한 구체예에서, 연관 불균형은 0.2보다 큰 r2의 수치값에 의해 정의된다. 또 다른 구체예에서, 상기 마커 또는 일배체형은 rs4848543 대립인자 A, rs13387042 대립인자 A, 및 rs3803662 대립인자 T로부터 선택된 하나 이상의 마커를 포함한다.
핵산 및 폴리펩티드
본 명세서에 기재된 핵산 및 폴리펩티드는 본 발명의 방법 및 키트에서 이용될 수 있다. 본 명세서에서 사용된, "분리된(isolated)" 핵산 분자는 (게놈 서열에서와 같이) 정상적으로 유전자 또는 뉴클레오티드 서열을 둘러싸는(flank) 핵산으로부터 분리되고 및/또는 (예를 들면, RNA 라이브러리에서와 같이) 다른 전사된 서열들로부터 완전하게 또는 부분적으로 정제된 핵산이다. 예를 들면, 본 발명의 분리된 핵산은 핵산이 원래 존재하는 복잡한 세포 매질(cellular milieu), 또는 재조합 기법에 의해 생성되는 경우 배양 배지, 또는 화학적으로 합성되는 경우, 화학적 전구체 또는 다른 화학물질들에 대해 실질적으로 분리될 수 있다. 일부 경우에, 분리된 물질은 조성(예를 들면, 다른 물질을 포함하는 조 추출물), 완충 시스템 또는 시약 혼합물(reagent mix)의 부분을 형성할 것이다. 다른 상황들에서, 상기 물질은 예를 들면, 폴리아크릴아미드 겔 전기영동(PAGE) 또는 컬럼 크로마토그래피(예를 들면, HPLC)에 의해 결정되는 바와 같이, 필수적인 균질성(essential homogeneity)까지 정제될 수 있다. 본 발명의 분리된 핵산 분자는 존재하는 모든 거대분자 종의 약 50% 이상, 약 80% 이상, 또는 약 90% 이상(몰 기준)을 구성할 수 있다. 게놈 DNA에 대해, 용어 "분리된(isolated)"은 또한 본래 게놈 DNA가 결합되어 있는 염색체로부터 분리된 핵산 분자를 의미한다. 예를 들면, 분리된 핵산 분자는 핵산 분자가 유래된 세포의 게놈 DNA에서 상기 핵산 분자를 플랭킹(flank)하는 뉴클레오티드의 약 250 kb, 200 kb, 150 kb, 100 kb, 75 kb, 50 kb, 25 kb, 10 kb, 5 kb, 4 kb, 3 kb, 2 kb, 1 kb, 0.5 kb 또는 0.1 kb 미만을 포함할 수 있다.
핵산 분자는 다른 코딩 서열 또는 조절 서열에 융합될 수 있고, 여전히 분리된 것으로 고려될 수 있다. 따라서, 벡터 내에 포함된 재조합 DNA는 본 명세서에서 사용된 "분리된"의 정의에 포함된다. 또한, 분리된 핵산 분자는 이종(heterologous) 숙주 세포 또는 이종 개체 내의 재조합 DNA 분자, 및 용액 중의 부분적으로 또는 실질적으로 정제된 DNA 분자를 포함한다. "분리된" 핵산 분자는 또한 본 발명의 DNA 분자의 인 비보 및 인 비트로 RNA 전사체를 포함한다. 분리된 핵산 분자 또는 뉴클레오티드 서열은 화학적으로 합성되거나 또는 재조합 수단에 의해 생산된 핵산 분자 또는 뉴클레오티드 서열을 포함할 수 있다. 그와 같은 분리된 뉴클레오티드 서열이 예를 들면, 코딩된 폴리펩티드의 제조에서, 상동성 서열(예를 들면, 다른 포유동물 종으로부터)의 분리를 위해, 유전자 맵핑을 위해(예를 들면, 염색체와의 인 시투 혼성화에 의해), 또는 예를 들면, 노던 블롯 분석 또는 기타 혼성화 기법과 같은 조직 (예를 들면, 인간 조직) 중의 유전자의 발현을 검출하기 위해, 프로브로서 유용하다.
본 발명은 또한 높은 엄격성(stringency)의 혼성화 조건, 예를 들면, 선택적 혼성화를 위한 조건 하에, 본 명세서에 기재된 뉴클레오티드 서열에 혼성화되는 핵산 분자(예를 들면, 본 명세서에 기재된 일배체형과 연관된 다형성 부위를 포함하는 뉴클레오티드 서열에 특이적으로 혼성화하는 핵산 분자)에 관한 것이다. 그와 같은 핵산 분자는 대립인자-특이적 혼성화 또는 서열-특이적 혼성화(예를 들면, 높은 엄격성(stringency) 조건 하에)에 의해 검출 및/또는 분리될 수 있다. 핵산 혼성화를 위한 엄격성 조건 및 방법은 본 발명이 속하는 기술 분야의 당업자에게 잘 알려져 있다(예를 들면, 전체 교시에 참조에 의해 본 명세서에 포함된 Current Protocols in Molecular Biology, Ausubel, F. et al, John Wiley & Sons, (1998), 및 Kraus, M. and Aaronson, S., Methods Enzymol., 200:546-556 (1991) 참조).
두 개의 뉴클레오티드 서열 또는 아미노산 서열 간의 퍼센트 동일성(percent identity)은 최적의 비교 목적을 위해 서열들을 정렬시키는 것에 의해(예를 들면, 제1 서열의 서열에 갭이 도입될 수 있음) 결정될 수 있다. 상응하는 위치의 뉴클레오티드 또는 아미노산이 비교되고, 두 서열 간의 퍼센트 동일성은 상기 서열들 간에 공유된 동일한 위치의 갯수의 함수이다(즉, % 동일성 = 동일한 위치의 갯수(#)/위치의 총 갯수(#) x 100). 특정한 구체예에서, 비교 목적을 위해 정렬된 서열의 길이는 기준 서열의 길이의 30% 이상, 40% 이상, 50% 이상, 60% 이상, 70% 이상, 80% 이상, 90% 이상, 또는 95% 이상이다. 두 서열의 실제적인 비교는 잘 알려진 방법, 예를 들면, 수학적 알고리즘을 이용하여 달성될 수 있다. 그와 같은 수학적 알고리즘의 비-한정적인 예가 Karlin, S. and Altschul, S., Proc. Natl. Acad. Sci. USA, 90:5873-5877 (1993)에 기재된다. 그와 같은 알고리즘이 Altschul, S. et al., Nucleic Acids Res., 25:3389-3402 (1997)에 기재된 바와 같이, NBLAST 및 XBLAST 프로그램(버전 2.0)에 구현된다. BLAST 및 Gapped BLAST 프로그램을 이용하는 경우, 개별적인 프로그램(예를 들면, NBLAST)의 디폴트 파라미터가 이용될 수 있다. ncbi.nlm.nih.gov에서 월드 와이드 웹의 웹사이트를 참조한다. 일 구체예에서, 서열 비교를 위한 파라미터는 score=100, wordlength=12로 설정되거나, 또는 변할 수 있다(예를 들면, W=5 또는 W=20).
다른 예는 Myers and Miller, CABIOS (1989), Torellis, A. and Robotti, C., Comput. Appl. Biosci. 10:3-5 (1994)에 기재된 ADVANCE and ADAM; 및 Pearson, W. and Lipman, D., Proc. Natl. Acad. Sci. USA, 85:2444-48 (1988)에 기재된 FASTA 알고리즘을 포함한다. 또 다른 구체예에서, 두 개의 아미노산 서열간의 퍼센트 동일성(percent identity)은 GCG 소프트웨어 패키지 (Accelrys, Cambridge, UK) 중의 GAP 프로그램을 이용하여 수득될 수 있다.
본 발명은 또한 표 10, 표 15, 표 19, 표 20, 표 21, 및 표 22에 열거된 다형성 마커들, 및 이들과 연관 불균형인 마커들을 포함하는 뉴클레오티드 서열, 및 STEAP3/TSAP6, LOC643714 및 TNRC9 유전자의 뉴클레오티드 서열, 또는 표 10, 표 15, 표 19, 표 20, 표 21, 및 표 22에 열거된 다형성 마커들을 포함하는 뉴클레오티드 서열의 상보체를 포함하거나, 또는 이들로 구성된 뉴클레오티드 서열, 및 이들과 연관 불균형인 마커들, 및 STEAP3/TSAP6, LOC643714 및 TNRC9 유전자, 또는 이들의 단편의 뉴클레오티드 서열을 포함하거나 이들로 구성된 핵산에 높은 엄격성 조건 하에 혼성화하는 단편 또는 일부를 포함하고, 상기 뉴클레오티드 서열은 본 명세서에 기재된 마커 및 일배체형에 포함된 하나 이상의 다형성 대립인자를 포함하는 것인 분리된 핵산 분자를 제공한다. 본 발명의 핵산 단편은 약 15개 이상, 약 18개 이상, 20개, 23개 또는 25개 이상의 뉴클레오티드로 구성된 길이이고, 30개, 40개, 50개, 100개, 200개, 500개, 1000개, 10,000개 또는 그 이상의 뉴클레오티드로 구성된 길이일 수 있다.
본 발명의 핵산 단편은 본 명세서에 기재된 바와 같은 분석법에서 프로브 또는 프라이머로서 이용된다. "프로브(probe)" 또는 "프라이머(primer)"는 핵산 분자의 상보적 가닥에 염기-특이적 방식으로 혼성화하는 올리고뉴클레오티드이다. DNA 및 RNA 외에, 그와 같은 프로브 및 프라이머는 Nielsen, P. et al., Science 254:1497-1500 (1991)에 기재된 바와 같은 PNA(polypeptide nucleic acid)를 포함한다. 프로브 또는 프라이머는 본 명세서에 기재된 하나 이상의 다형성 마커 또는 하나 이상의 일배체형의 하나 이상의 대립인자, 또는 그의 상보체(complement)를 포함한다. 특정한 구체예에서, 프로브 또는 프라이머는 100개 또는 그 미만의 뉴클레오티드를 포함할 수 있고, 예를 들면, 특정한 구체예에서, 6개 내지 50개의 뉴클레오티드, 또는 예를 들면, 12개 내지 30개의 뉴클레오티드를 포함할 수 있다. 다른 구체예에서, 프로브 또는 프라이머는 연속적인 뉴클레오티드 서열 또는 상기 연속적인 뉴클레오티드 서열의 상보체에 약 70% 이상, 약 80% 이상, 약 85% 이상, 약 90% 이상, 또는 약 95% 이상 동일하다. 또 다른 구체예에서, 프로브 또는 프라이머는 연속적인 뉴클레오티드 서열 또는 상기 연속적인 뉴클레오티드 서열의 상보체에 선택적으로 혼성화될 수 있다. 종종, 프로브 또는 프라이머는 표지, 예를 들면, 방사성동위원소, 형광 표지, 효소 표지, 효소 보조-인자 표지, 자성 표지(magnetic label), 스핀 표지, 에피토프 표지를 더 포함한다.
전술된 바와 같은 본 발명의 핵산 분자는 본 발명이 속하는 기술 분야의 당업자에게 잘 알려진 표준 분자생물학 기법을 이용하여 확인되고 분리될 수 있다. 증폭된 DNA는 표지되고(예를 들면, 방사성 표지되고), 인간 세포로부터 유래된 cDNA 라이브러리를 스크리닝하기 위한 프로브로서 이용될 수 있다. 상기 cDNA는 mRNA로부터 유래되고 적합한 벡터에 담길 수 있다. 상응하는 클론들이 분리되고, 인 비보 절제(in vivo excision)에 따라 DNA가 수득되고, 적합한 분자량의 폴리펩티드를 코딩하는 올바른 해독 프레임을 확인하기 위해 본 발명이 속하는 기술 분야에서 인정되는 방법에 의해 클로닝된 삽입물이 한 방향으로 또는 양 방향으로 서열분석될 수 있다. 이 방법들 또는 유사한 방법들을 이용하여, 폴리펩티드 및 상기 폴리펩티드를 코딩하는 DNA가 분리되고, 서열결정되고, 그 특성이 더 규명될 수 있다.
일반적으로, 본 발명의 단리된 핵산 서열은 서던 겔(Southern gel) 상에서 분자량 마커, 및 관련된 유전자 위치를 맵핑하기 위해 표지된 염색체 마커로 이용될 수 있다. 상기 핵산 서열은 또한 유방암 또는 유방암에 대한 감수성을 확인하기 위해 환자에서 내재적 DNA 서열과 비교하기 위해 이용될 수 있고 관련된 DNA 서열을 혼성화하고 발견하기 위해 또는 시료로부터 공지된 서열을 제거하기 위해(예를 들면, 공통 유전자 제거 혼성화법(subtractive hybridization)) 프로브로서 이용될 수 있다. 핵산 서열은 유전자 지문법(genetic fingerprinting)을 위한 프라이머를 수득하기 위해, 면역화 기법을 이용하여 항-폴리펩티드 항체를 생성하기 위해, 및/또는 항-DNA 항체를 생성시키기거나 또는 면역 반응을 유발하기 위해 항원으로서 이용될 수 있다.
항체
유전자 산물의 하나의 형태에 특이적으로 결합하나, 상기 유전자 산물의 다른 형태에는 결합하지 않는 다중클론 항체 및/또는 단일클론 항체가 또한 제공된다. 변이, 또는 다형성 부위 또는 부위들을 포함하는 기준 유전자 산물의 일부에 결합하는 항체도 제공된다. 본 명세서에서 사용된 용어 "항체(antibody)"는 면역글로불린 분자 및 면역글로불린 분자의 면역학적으로 활성인 부분, 즉, 항원에 특이적으로 결합하는 항원-결합 부위를 포함하는 분자를 의미한다. 본 발명의 폴리펩티드에 특이적으로 결합하는 분자는 폴리펩티드 또는 그의 단편에 결합하나, 자연적으로 상기 폴리펩티드를 포함하는 시료, 예를 들면, 생물학적 시료 중의 다른 분자에는 실질적으로 결합하지 않는 분자이다. 면역글로불린 분자의 면역학적 활성 부분의 예는 펩신과 같은 효소에 의해 항체를 처리하는 것에 의해 생성될 수 있는 F(ab) 및 F(ab')2 단편을 포함한다. 본 발명은 본 발명의 폴리펩티드에 결합하는 다중클론 항체 및 단일클론 항체를 제공한다. 본 명세서에서 사용된, 용어 "단일클론 항체(monoclonal antibody)" 또는 "단일클론 항체 조성물(monoclonal antibody composition)"은 본 발명의 폴리펩티드의 특정한 에피토프와 면역반응할 수 있는 항원 결합 부위의 단 하나의 종만을 포함하는 항체 분자의 집단을 의미한다. 따라서, 단일클론 항체 조성물은 일반적으로 그와 면역반응하는 본 발명의 특정한 폴리펩티드에 대한 단일 결합 친화도를 보인다.
다중클론 항체는 적합한 개체를 원하는 면역원(immunogen), 예를 들면, 본 발명의 폴리펩티드 또는 그의 단편으로 면역화시키는 것에 의해 전술된 바와 같이 제조될 수 있다. 면역화된 개체에서 항체 역가(antibody titer)는 시간의 경과에 대해, 표준 기법, 예를 들면, 고정화된 폴리펩티드를 이용한, ELISA(enzyme linked immunosorbent assay)에 의해 모니터링될 수 있다. 필요한 경우, 폴리펩티드에 대한 항체 분자가 포유동물(예를 들면, 혈액)로부터 분리되고, IgG 분획을 수득하기 위힌 단백질 A 크로마토그래피와 같은, 잘 알려진 기법에 의해 더 정제될 수 있다. 면역화 후 적절한 시점에, 예를 들면, 항체 역가가 최고인 시점에, 항체-생성 세포들이 개체로부터 수득되고, Kohler and Milstein, Nature 256:495-497 (1975)에 의해 최초로 개시된 하이브리도마 기법, 인간 B 세포 하이브리도마 기법(Kozbor et al., Immunol. Today 4: 72 (1983)), EBV-하이브리도마 기법(Cole et al., Monoclonal Antibodies and Cancer Therapy, Alan R. Liss,1985, Inc., pp. 77-96) 또는 트리오마(trioma) 기법과 같은 표준 기법에 의해 단일클론 항체를 제조하기 위해 이용될 수 있다. 하이브리도마를 생성하는 기술이 잘 알려져 있다(일반적으로, Current Protocols in Immunology (1994) Collgan et al., (eds.) John Wiley & Sons, Inc., New York, NY 참조). 요약하면, 불멸 세포주(immortal cell line)(일반적으로, 골수종(myeloma))가 전술된 바와 같이 면역원에 의해 면역화된 포유동물로부터의 림프구(일반적으로, 비장림프구(splenocyte))에 융합되고, 결과물인 하이브리도마 세포의 배양 상층액이 본 발명의 폴리펩티드에 결합하는 단일클론 항체를 생성하는 하이브리도마를 확인하기 위해 스크리닝된다.
림프구와 불멸화된 세포주를 융합시키기 위해 이용되는 다수의 잘 알려진 프로토콜이 본 발명의 폴리펩티드에 대한 단일클론 항체를 생성할 목적으로 적용될 수 있다(예를 들면, Current Protocols in Immunology, supra; Galfre et al., Nature 266:55052 (1977); R.H. Kenneth, in Monoclonal Antibodies: A New Dimension In Biological Analyses, Plenum Publishing Corp., New York, New York (1980); 및 Lerner, Yale J. Biol. Med. 54:387-402 (1981) 참조). 또한, 통상적인 당업자는 역시 유용할, 그와 같은 방법의 다양한 변형이 존재한다는 것을 이해할 것이다.
단일클론 항체-분비 하이브리도마 제조의 대안으로, 본 발명의 폴리펩티드에 대한 단일클론 항체가 상기 폴리펩티드로 재조합 조합적 면역글로불린 라이브러리(recombinant combinatorial immunoglobulin library)(예를 들면, 항체 파아지 표시(phage display) 라이브러리)를 스크리닝하고, 그에 의해 상기 폴리펩티드에 결합하는 면역글로불린 라이브러리 구성물을 분리하는 것에 의해 식별되고 분리될 수 있다. 파아지 표시 라이브러리를 생성하고 스크리닝하기 위한 키트가 상업적으로 이용가능하다(예를 들면, the Pharmacia Recombinant Phage Antibody System, Catalog No. 27-9400-01; 및 Stratagene Surf ZAP™ Phage Display Kit, Catalog No. 240612). 추가적으로, 항체 표시 라이브러리를 생성하고 스크리닝하기 위해 이용할 수 있는 특히 유용한 방법 및 시약의 예를, 예를 들면, 미국특허 제5,223,409호; PCT 공개 WO 92/18619; PCT 공개 WO 91/17271; PCT 공개 WO 92/20791; PCT 공개 WO 92/15679; PCT 공개 WO 93/01288; PCT 공개 WO 92/01047; PCT 공개 WO 92/09690; PCT 공개 WO 90/02809; Fuchs et al., Bio/Technology 9: 1370-1372 (1991); Hay et al., Hum. Antibod. Hybridomas 3:81-85 (1992); Huse et al., Science 246: 1275-1281 (1989); 및 Griffiths et al., EMBO J. 12:725-734 (1993)에서 찾을 수 있다.
추가적으로, 표준 재조합 DNA 기법을 이용하여 제조될 수 있는, 인간 부분 및 비-인간(non-human) 부분을 모두 포함하는, 키메라 단일클론 항체 및 인간화(humanized) 단일클론 항체와 같은 재조합 항체가 본 발명의 범위에 속한다. 그와 같은 키메라 항체 및 인간화 단일클론 항체는 본 발명이 속하는 기술 분야에서 알려진 재조합 DNA 기법에 의해 생산될 수 있다.
일반적으로, 본 발명의 항체(예를 들면, 단일크론 항체)는 친화도 크로마토그래피 또는 면역침전과 같은 표준 기법에 의해 본 발명의 폴리펩티드를 분리하기 위해 이용될 수 있다. 폴리펩티드-특이적 항체는 세포로부터 천연 폴리펩티드 및 숙주 세포에서 발현된 재조합기법에 의해 생산된 폴리펩티드의 정제를 촉진할 수 있다. 또한, 본 발명의 폴리펩티드에 대해 특이적인 항체는 폴리펩티드의 양(abundance) 및 발현 패턴을 평가하기 위해 (예를 들면, 세포 용해액, 세포 상층액, 또는 조직 시료에서) 폴리펩티드를 검출하기 위해 이용될 수 있다. 항체는 임상 테스트 절차의 일부로서, 예를 들면, 주어진 치료 계획(treatment regime)의 효능을 결정하기 위해, 조직에서 단백질 수준을 진단 목적으로 모니터링하기 위해 이용될 수 있다. 그의 검출을 촉진하기 위해 항체는 검출가능한 물질에 결합될 수 있다. 검출가능한 물질의 예는 다양한 효소, 보조 그룹(prosthetic group), 형광 물질, 발광 물질, 생물발광 물질, 및 방사성활성 물질을 포함한다. 적합한 효소의 예는 호스래디쉬 퍼옥시다아제(horseradish peroxidase), 알칼리 포스파타아제, 베타-갈락토시다아제, 또는 아세틸콜린에스테라아제를 포함하고; 적합한 보조 그룹 복합체(prothetic group complex)의 예는 스트렙타비딘/비오틴 및 아비딘/비오틴을 포함하며; 적합한 형광 물질의 예는 움벨리페론(umbelliferone), 플루오레세인(fluorescein), 플루오레세인 이소티오시아네이트, 로다민(rhodamine), 디클로로트리아지닐아민 플루오레세인, 단실 클로라이드(dansyl chloride) 또는 피코에리트린(phycoerythrin)을 포함하고; 발광 물질의 예는 루미놀을 포함하며; 생물발광 물질의 예는 루시페라아제, 루시페린, 및 에쿼린(aequorin)을 포함하고, 및 적합한 방사성활성 물질의 예는 125I, 131I, 35S 또는 3H를 포함한다.
항체는 또한 약물유전학 분석에서 유용할 수 있다. 그와 같은 구체에에서, 본 명세서에 따른 핵산에 의해 코딩되는 변이 단백질에 대한 항체, 예를 들면, 하나 이상의 본 발명의 다형성 마커를 포함하는 핵산에 의해 코딩된 변이 단백질에 대한 항체가 변형된 치료 방식을 필요로 하는 개체를 식별하기 위해 이용될 수 있다.
항체는 또한 질병의 활성 단계(active stage)와 같은 질병 상태에서, 또는 단백질의 기능과 관련된 질병, 특히, 유방암에 대한 소인을 갖는 개인에서 변이 단백질의 발현을 평가하기 위해 유용할 수 있다. 본 명세서에 기재된 하나 이상의 다형성 마커 또는 일배체형을 포함하는 핵산에 의해 코딩된 본 발명의 변이 단백질에 특이적인 항체가 상기 변이 단백질의 존재를 스크리닝하기 위해, 예를 들면, 상기 변이 단백질의 존재에 의해 표시된 바와 같이, 유방암에 대한 소인을 스크리닝하기 위해 이용될 수 있다.
항체는 다른 방법들에서 이용될 수 있다. 따라서, 항체는 전기영동 이동성(electrophoretic mobility), 등전점, 트립신 또는 기타 단백질분해효소에 의한 처리와 함께 본 발명의 변이 단백질과 같은 단백질을 평가하기 위한 진단 도구로서, 또는 본 발명이 속하는 기술 분야의 당업자에게 알려진 다른 물리적 분석법(physical assay)에서 이용하기에 유용하다. 항체는 또한 조직형 검사(tissue typing)에서 이용될 수 있다. 하나의 그와 같은 구체예에서, 특정한 변이 단백질이 특정한 조직형에서의 발현과 상관되며, 상기 변이 단백질에 대한 특이적 항체가 상기 특이적 조직형을 식별하기 위해 이용될 수 있다.
변이 단백질을 포함한, 단백질의 세포내 국재화(subcellular localization) 가 또한 항체를 이용하여 결정될 수 있고, 다양한 조직의 세포에서 단백질의 비정상적인 세포내 국재화를 평가하기 위해 적용될 수 있다. 그와 같은 용도는 유전적 테스트에 적용될 수 있으나, 또한, 특정한 치료 방식을 모니터링하기 위해 적용될 수 있다. 치료가 변이 단백질의 발현 수준 또는 존재, 또는 변이 단백질의 비정상적인 조직 분포 또는 발생에 따른 발현(developmental expression)을 정정하는 것을 목적으로 하는 경우, 상기 변이 단백질 또는 그의 단편에 대해 특이적인 항체가 치료 효능을 모니터링하기 위해 이용될 수 있다.
항체는 또한, 예를 들면, 변이 단백질이 결합 분자 또는 파트너에 결합하는 것을 차단하는 것에 의해 변이 단백질 기능의 저해를 위해 유용하다. 그와 같은 용도는 또한 치료가 변이 단백질의 기능을 저해하는 것을 포함하는 치료적 상황에 적용될 수 있다. 항체는 예를 들면, 결합을 차단하거나 또는 경쟁적으로 저해하여, 그에 의해, 단백질의 활성을 조절(즉, 촉진 또는 길항)하기 위해 이용될 수 있다. 특정한 기능을 위해 요구되는 부위를 포함하는 특정한 단백질 단편에 대한 항체, 또는 세포 또는 세포막과 결합된 완전한 단백질에 대한 항체가 제조될 수 있다. 인 비보 투여를 위해, 항체는 방사성 핵종(radionuclide), 효소, 면역원성 에피토프, 또는 세균성 독소를 포함한 세포독성제(디프테리아 또는 리신(ricin)과 같은 식물 독소)와 같은 추가적인 치료적 유효탑재물(therapeutic payload)과 결합될 수 있다. 항체 또는 그의 단편의 인 비보 반감기는 폴리에틸렌 글리콜로의 접합을 통한 페길화(pegylation)에 의해 증가될 수 있다.
본 발명은 또한 본 명세서에 기재된 방법에서 항체를 사용하기 위한 키트에 관한 것이다. 이는 테스트 시료에서 변이 단백질의 존재를 검출하기 위한 키트를 포함하나, 이에 한정되지 않는다. 하나의 바람직한 구체예는 표지된 또는 표지가능한 항체 및 생물학적 시료에서 변이 단백질을 검출하기 위한 화합물 또는 작용제, 상기 시료 중의 변이 단백질의 양 또는 존재 및/또는 부재를 결정하기 위한 수단, 및 상기 시료 중의 변이 단백질의 양과 표준을 비교하기 위한 수단, 및 키트의 사용 설명서를 포함한다.
이하, 본 발명은 하기의 비-한정적인 실시예에 의해 예시될 것이다.
본 발명의 전술된 것들 및 기타 목적, 특징 및 장점이 하기에 기재된 본 발 명의 바람직한 구체예의 보다 구체적인 설명으로부터 명확할 것이다.
도 1은 본 명세서에서 유방암과 연관된 것으로 확인된 마커 rs4848543을 포함하는 염색체 2 상에 있는 영역의 게놈 구조를 보여준다. rs4848543과 연관 불균형인 마커들도 이 영역 내에서 발견되며, 이 영역은 본 명세서에서 rs4848543 LD 블럭으로도 지칭된다. 상기 영역은 광범위한 연관 불균형(높은 LD)을 특징으로 하고, 그의 경계는 높은 재조합의 영역을 특징으로 한다. 코카서스계 CEU HapMap 집단에서 rs4848543과, 0.2보다 큰 LD 척도 r2의 값에 의해 정의된 연관 불균형인 마커들이 NCBI Build 34의 염색체 2 상에 있는 위치 120,023,583 - 20,117,062 및 NCBI Build 36의 위치 119,644,908 - 119,738,387 bp에 걸친다. 상기 두 개의 서열 Build에서, 이 마커들에 의해 걸쳐진 영역은 93,479 bp이다.
도 2는 마커 rs13387042를 포함하는 염색체 2 상에 있는 영역의 게놈 구조를 보여준다. rs13387042와 연관 불균형인 마커들도 이 영역 내에서 발견되며, 이 영역은 본 명세서에서 rs13387042 LD 블럭으로도 지칭된다. 상기 영역은 광범위한 연관 불균형(높은 LD)을 특징으로 하고, 그의 경계는 높은 재조합의 영역을 특징으로 한다. 코카서스계 CEU HapMap 집단에서 rs13387042와, 0.2보다 큰 LD 척도 r2의 값에 의해 정의된 연관 불균형인 마커들이 NCBI Build 34의 염색체 2 상에 있는 위치 218,059,508 - 218,141,061 및 NCBI Build 36의 위치 217,565,211-217,646,764 bp에 걸친다. 상기 두 개의 서열 Build에서, 이 마커들에 의해 걸쳐진 영역은 81,553 bp이다.
도 3은 마커 rs3803662를 포함하는 염색체 16 상에 있는 영역의 게놈 구조를 보여준다. rs3803662와 연관 불균형인 마커들도 이 영역 내에서 발견되며, 이 영역은 본 명세서에서 rs3803662 LD 블럭으로도 지칭된다. 상기 영역은 광범위한 연관 불균형(높은 LD)을 특징으로 하고, 그의 경계는 높은 재조합의 영역을 특징으로 한다. 코카서스계 CEU HapMap 집단에서 rs3803662와, 0.2보다 큰 LD 척도 r2의 값에 의해 정의된 연관 불균형인 마커들이 NCBI Build 34의 염색체 16 상에 있는 위치 52,314,403 - 52,413,602 및 NCBI Build 36의 위치 51,093,311-51,192,501 bp에 걸친다. 상기 두 개의 서열 Build에서, 이 마커들에 의해 걸쳐진 영역은 99,190 bp이다.
환자 및 대조군 선택: 본 연구의 허가는 아이슬란드의 국가 생명윤리 위원회(the National Bioethics Committee) 및 아이슬란드 데이터 보호국(the Icelandic Data Protection Commission) 에 의해 허여되었다. 유방암 진단의 기록은 아이슬란드 암 등록부(Icelandic Cancer Registry, ICR)로부터 수득하였다. 기록은 1955년 1월 1일부터 2005년 12월 31일까지 아이슬란드에서 침윤성 유방암 및 유관내암(ductal carcinoma in situ) 또는 소엽내암(lobular carcinoma in situ)으로 진단된 모든 케이스를 포함했다. ICR은 이 기간동안 진단된 4603명의 개인의 기록을 포함했다. 모든 생존하는 환자(약 2840명)를 포함하는 유병 코호트(prevalence cohort)는 본 연구로의 동원에 적격이었다. 본 발명자들은 2210명의 환자로부터 고지된 동의, 혈액 시료, 및 임상 정보를 수득했고, 이는 약 78%의 수율이었다. 초기의 대조군은 다른 진행중인 deCODE Genetics 게놈-전체 연관 연구에 참여하고 유방암 환자군의 유전형이 분석될 때까지 Illumina SNP 칩 상에서 유전형이 분석된 모든 개인들을 포함했다. 아이슬란드 암 등록부에 2005년말까지 유방암, 전립선암, 또는 대장암 진단을 나타내는 입력을 갖는 개인들은 대조군으로부터 제외시켜, 4477명의 대조군 세트를 준비했다. 대조군의 독립적인 재현 세트는 상기 4477명의 세트 후에 유전형이 분석된 비-유방암 프로젝트로부터의 추가적인 7406명의 개인들로 구성되었다. 본 발명자들은 대상이 되는 SNP의 빈도가 전립선암 및 대장암 환자군에서 대조군과 상이하지 않다는 것을 나타내는 중간 데이터를 수득했기 때문에, 이 7406명의 세트에서 전립선암 환자 및 대장암 환자를 제외시키지 않았다. 각각의 대조군 세트에서, 하기의 표 8, 9 및 14에 열거된 SNP의 빈도에서 성별 간의 차이는 없었다. 따라서, 이 대조군 그룹들은 조사대상 SNP의 집단 빈도의 적절하게 대표했다.
가계(genealogical) 데이터베이스: deCODE Genetics는 아이슬란드인들의 가계의 전산화된 데이터베이스를 관리한다. 기록은 지난 200년 동안 아이슬란드에서 태어난 거의 모든 개인을 포함하며, 상기 기간에 대해, 약 95%의 동안 부모 관계(parental connection)가 알려져 있다[Sigurdardottir, et al., (2000), Am J Hum Genet, 66, 1599-609]. 또한, 거주지 식별자(residence identifier)의 카운티가 인구통계조사 및 교구 기록에 근거하여, 대부분의 개인에 대해 기록되어 있다. 정보는 생물학적 시료 및 ICR 기록에 대해 사용된 개인 식별자(personal identifier)와 일치하는 암호화된 개인 식별자로 관계 데이터베이스에 저장되어, 본 연구 참여자의 유전형 및 표현형을 그들의 가계와 교차-참조(cross-reference)할 수 있다.
시료 처리: 혈액 시료는 EDTA 중에 -20℃에서 보관하였다. DNA는 Qiagen (http://www.quiagen.com) 추출 컬럼 방법을 이용하여 전혈로부터 분리하였다. DNA는 4℃에서 보관하였다.
유전형분석(genotyping): 그 후, 1600명의 환자 시료의 세트를 무작위로 선택하고 International HapMap 프로젝트의 Phase I으로부터 유래된 317,511개의 SNP를 포함하는 Illumina Infinium Hap300 SNP 비드 마이크로어레이(Illumina, San Diego, CA, USA) 상에서 유전형 분석하였다. 4480명의 암-불포함 대조군 시료를 동일한 플랫폼 상에서 유전형 분석하였다. 상기 칩 상에 있는 전체 SNP 중에서, 170개는 유전형을 생성하지 않았고 추가적인 24개의 SNP는 80% 미만의 수율을 보였다. 추가적인 61개의 SNP는 대조군에서 하디-와인버그 평형(Hardy-Weinberg equilibrium)으로부터 매우 유의성 있는 편향을 보였다(p < 1x10-10). 104개의 SNP는 단형성(monomorphic)이었고, 58개의 SNP는 거의 단형성이었다(즉, 환자와 대조군의 통합된 코호트에서 소수 대립인자 빈도는 0.001 미만이었다). 마지막으로, 5개의 마커는 여러 개의 진행중인 상이한 사내 게놈전체 연관 연구에서 특정한 영역 및 가능한 신호의 조사 후에 유전형분석 문제를 갖는 것으로 판단되었다. 상기 문제를 갖는 SNP는 모두 분석에서 제외시켰다. 따라서, 본문에 제시된 최종 연구는 317,089개의 SNP를 이용했다. 98% 미만의 콜 레이트(call rate)를 갖는 칩도 분석에서 배제시켰다.
본 연구에서 조사된 3개의 주요한 SNP의 서열(sequence context)이 하기에 기재된다:
Figure 112009065103457-PCT00001
본 발명자들은 rs4848543 LD 블럭에서 다수의 SNP를 검출하기 위한 분석법을 설계하고 테스트하였다. 이 분석법들은 [Kutyavin, et al., (2006), Nucleic Acids Res, 34, e128]에 개시된 Centaurus SNP 분석 기술에 근거했다. 분석법 및 프라이머는 하기와 같다:
SG02S733
rs895398
(Build 34) chr2:120,058,180
정방향 프라이머: TTGGAACCTCCCACTGCCACA
역방향 프라이머: ACAGCCCAGGTTTCAGGTTGGCAT
VIC-프로브: AGCGACACTG
FAM-프로브: GCGACACCG
인핸서: CCTG*AGATCCAGGCA
SG02S738
rs4848543
(Build 34) chr2:120,061,096
정방향 프라이머: AGGGAGCCCTCGCTTTAAGCATTA
역방향 프라이머: TTTGGGCACATCTAGGAAGACCTC
VIC- 프로브: GAT*CAATACCC
FAM- 프로브: CGAT*CAATACCA
인핸서: TTAATAATTACAGGACATG
SG02S739
rs6759589
(Build 34) chr2:120,064,976
정방향 프라이머: TCAGCAGCCTCTTGTCTCACTAAT
역방향 프라이머: CTTCTTGCCCAGGCAGGACAGA
VIC-프로브: TAGACTGAGCC
FAM-프로브: AAT*AGACTAAGCC
인핸서: CCATCCCCAACTAA
SG02S753
rs895397
(Build 34) chr2:120,072,400
정방향 프라이머: CACTACTAGATCATGGGAGATGCCT
역방향 프라이머: GTTTCCTCAGTTGTAATGTAGACC
VIC-프로브: TT*T*A*ACCCTT
FAM-프로브: GTTTTAACCCCT
인핸서: GCTGCTCGGAAG
SG02S740
rs838102
(Build 34) chr2:120,079,878
정방향 프라이머: GGTTTTGCATCCTTGCTCACTCACAT
역방향 프라이머: GTGCCCTCTGCGTACTTGCGAAT
VIC-프로브: TACTGCCACC
FAM-프로브: CTTACTGCCACT
인핸서: TGTCTCCTCACTC
SG02S741
rs838100
(Build 34) chr2:120,083,710
정방향 프라이머: ACTTACCAACAGCAGGCTGGTG
역방향 프라이머: CCAGAAAGGGTGGCTCACCTCA
VIC-프로브: GTCTGAGGCT
FAM-프로브: GGTCTGAGGTT
인핸서: TCAGGTCACTCG
SG02S734
rs12711924
(Build 34) chr2:120,107,316
정방향 프라이머: AACGCTTATCACAGAGCCAGGTAG
역방향 프라이머: GGAAAACCATGAACACTGTGGCAA
VIC-프로브: CCCGCCGT
FAM-프로브: GCCCGCCAT
인핸서: TTGTCTTTCTTGTGTC
SG02S742
rs3731603
(Build 34) chr2:120,117,062
정방향 프라이머: AACA*CTCTAGGGAGTAAAGCTC
역방향 프라이머: GAGGA*CATTTGGAGTCCCCAAT
VIC-프로브: GACTGTCTTCAA
FAM-프로브: ACTGT*CT*TCAC
인핸서: AAGTCAGTCCTGAG
SG02S728
rs13387042
(Build 34) chr2:218,108,374
정방향 프라이머: CCACTAGTGTGGTGA*AGGAAGATT
역방향 프라이머: GCTACATGA*AGAA*CAGCTAAACC
VIC-프로브: TTTCTGTAGCCT
FAM-프로브: TT*T*CTGTAGCT*T
인핸서: CATTTGCCTTCTTTC
* 는 [Kutyavin, et al., (2006), Nucleic Acids Res, 34, e128]에 기재된 바와 같이, 변형된 염기를 나타낸다.
BRCA2 유전자의 단일 시조(founder) 돌연변이(999del5)는 일반 아이슬란드 집단에서 0.6%-0.8%의 보인자 빈도(carrier frequency)로 존재하고, 여성 유방암 환자에서 7.7%-8.6%의 보인자 빈도로 존재한다[Thorlacius, et al., (1997), Am J Hum Genet, 60, 1079-84; Gudmundsson, et al., (1996), Am J Hum Genet, 58, 749-56]. BRCA2 999del5 돌연변이의 가능한 존재는 DG13S3727로 지정된, 마이크로새틀라이트-타입 PCR 분석법을 이용하여 1499명의 환자에서 결정하였다. 사용된 프라이머는 하기와 같았다:
정방향: TGTGAAAAGCTATTTTTCCAATC
역방향: ATCACGGGTGACAGAGCAA
DG13S3727에 의해 증폭된 서열은 하기와 같다:
DG13S3727 위치=chr13:30703058-30703261
tgtgaaaagctatttttccaatcatgatgaaagtctgaagaaaaatgata
gatttatcgcttctgtgacagacagtgaaaacacaaatcaaagagaagct
gcaagtcatggtaagtcctctgtttagttgaactacaggtttttttgttg
ttgttgttttgattttttttttttgaggtggagtcttgctctgtcacccg
tgat
통계적 방법: 승법(multiplicative) 모델을 가정하여, 본 발명자들은 SNP 대립인자의 상대적 위험도(RR)를 RR=[p/(1-p)]/[s/(1-s)]로 계산하였고, 상기에서 p 및 s는 각각 환자 및 대조군에서 변이의 빈도이다. RR과 연관된 P-값은 표준 가능성 비 카이-스퀘어 통계값(standard likelihood ratio Chi-squared statistic)에 근거하여 계산하였다. 신뢰 구간은 RR의 추정값이 로그-노말(log-normal) 분포를 갖는 것으로 가정하여 계산하였다.
일배체형 빈도는 최대 가능성(maximum likelihood)을 이용하여 추정하고 일반화된 가능성 비 테스트(generalized likelihood ratio test)를 이용하여 케이스와 대조군 간의 차이의 테스트를 수행하였다. NEsted Models을 의미하는 NEMO라 불리는 일배체형 분석 프로그램을 이용하여 모든 일배체형 결과를 계산하였다. 상태(phase) 및 결실된 유전형에 따른 불확실성을 다루기 위해, NEMO는 일배체형 계수(haplotype count)가 EM 알고리즘을 이용하여 먼저 추정되고, 그 후, 추정된 계수를 진정한 계수인 것처럼 다루어 테스트가 수행되고, 종종 문제를 유발할 수 있으며 통계적 유의성을 적절하게 평가하기 위해 랜덤화를 필요로 할 수 있는 것인, 연관 테스트에 대한 일반적인 2-단계 접근방법을 이용하지 않는다는 것을 강조한다. 대신에, NEMO에서는, 최대 가능성 추정값, 가능성 비 및 p-값이 관찰된 데이터로부터 직접 계산되고, 따라서, 상태 및 결실된 유전형에서의 불확실성에 따른 정 보 손실이 가능성 비에 의해 자동적으로 포착된다.
일부 아이슬란드 환자들 및 대조군은 그룹 내 및 그룹 간 모두에서 관계된다. 혈연관계(relatedness)에 대해 연관 결과를 보정하기 위해, 본 발명자들은 아이슬란드 가계를 통해 대립인자를 유전(propagate)시키는 것에 의해 유전형을 시뮬레이션하였다. 각 시뮬레이션을 위해, 본 발명자들은 실제의 유전형에 대한 것과 동일한 방식으로 케이스-대조군 연관 테스트(case-control association test), 즉, 카이-스퀘어 가능성 비 테스트를 수행하였다. 본 발명자들은 N회의 시뮬레이션에 대한 카이-스퀘어 통계값의 평균(상응하는 Z-스코어의 분산과 동일함)을 계산하였고, 상기 값은 귀무 가설(null hypothesis) 하에 독립적인 개인에 대해서 1이어야 하고, 혈연관계의 개인(related individual)에 대해서는 약간 더 클 것으로 예상된다. 그 후, 실제 연관에서의 카이-스퀘어 통계값을 시뮬레이션으로부터 수득된 평균에 의해 나누는 것에 의해 혈연관계에 대한 보정을 적용하였다.
그룹들이 대립인자, 일배체형 및 유전형에 대해 상이한 집단 빈도를 가질 수 있으나, 공통된 상대적 위험도를 갖는 것으로 가정하는 것인 Mantel-Haenszel 모델을 이용하여 복수 개의 케이스-대조군 재현 그룹의 결합 분석을 수행하였다.
모든 P-값은 양측(two-sided) P-값으로 보고된다.
다발성 원발성 유방암의 분석: 다발성 원발성 유방암(MPBC)의 진단 기록을 ICR로부터 수득하였다. 제1 유방암 진단 외에 진단된 원발성 종양들은 임상적으로 및 조직학적으로 반대쪽 유방 또는 같은쪽 유방에서 상기 제1 유방암과 동시에 또 는 그에 뒤이어 발생한 독립적인 원발성 종양으로 확인되었다. 임상적으로 및 조직학적으로 최초 종양의 재발 또는 다발성 단일 원발성 종양(multifocal single primary tumor)으로 분류된 종양들은 배제시켰다. 2005년말까지 ICR 데이터에 2개 이상의 독립적인 원발성 종양의 진단을 갖는 환자들은 MPBC로 간주되었다. 2005년 12월 31일까지 ICR에서 제2의 원발성 종양의 진단을 갖지 않는 환자들은 단일 원발성 유방암(Single Primary Breast Cancer, SPBC)으로 분류하였다. SPBC 대비 MPBC의 위험도는 제1 유방암 진단으로부터 후속 시간(follow up time)까지의 년수를 공변량(covariate)으로 고려하여 로지스틱 회귀(logistic regression)에 의해 결정하였다. NEMO 소프트웨어를 이용한 선형 회귀에 의해 발병 연령 비교를 평가하였다.
가족력 분석: 각각의 영향받은 발단자(affected proband)에 대해, Genealogical Database 및 ICR 기록을 이용하여 가족력 점수(family histroy score)를 부여하였다. Genealogical Database를 참조하여 발단자 주위의 1촌 내지 3촌 친척의 원을 결정하였다. 그 후, 친척들의 질병영향(affection) 상태를 ICR 기록으로부터 결정하였다. 발단자에게 영향받은 1촌 친척 1인당 1점, 영향받은 2촌 친척 1인당 0.5점, 및 영향받은 3촌 친척 1인당 0.25점의 가족력 점수를 부여하였다. 그 후, 각 발단자에 대해 총점을 계산하였다. SNP 마커 유전형과 가족력 점수 간의 잠재적인 관계를 JMP v4 소프트웨어(S.A.S. Institute Inc.) 상에서 Wilcoxon 검정 수행에 의해 테스트하였다.
연관 분석 표현형: 본 발명자들은 연관 분석을 위해 두 개의 관련된 표현형을 이용하였다. 제1 표현형은 유방암으로 진단된 총 1600명의 개인을 포함했다. 이 표현형은 "모든 유방암(All Breast Cancer)"(All BC)로 표시하였다. 제2 표현형은 중간 수준 내지 높은 수준의 소인(predisposition) 특성을 갖는 개인들을 선택하고 "중간 소인(Medium Predisposition)"(MedPre)으로 표시하였다. 이 표현형의 정의는 발단자가 하기 기준 중 하나를 충족시킬 것을 요구했다:
1. 시발자는 3M(meiotic event)의 유전적 거리 내에 3명 이상의 영향받은(affected) 친척을 포함하는 유방암 케이스의 클러스터의 구성원이다.
2. 시발자는 3M 내의 혈연관계의 영향받은 쌍 중 일 구성원이고, 상기 쌍 중 1인은 50세 이전에 진단받았다.
3. 시발자는 3M 내의 혈연관계의 영향받은 쌍 중 일 구성원이고, 상기 쌍 중 1인은 임의의 종류의 2차 원발성 종양을 진단받았다.
4. 시발자는 임의의 종류의 원발성 종양을 진단받았다.
Illumina Hap300 칩 상에서 분석된 1600명의 환자들 중에서, 653명이 MedPre 기준을 충족시켰다(40.8%).
결과
섹션 1: 염색체 2q14.2 상의 rs4848543
rs4848543 대립인자 A는 유방암에 대한 증가된 위험도와 연관된다:
게놈 전체 연관 분석은 rs4848543 대립인자 A가 MedPre 유방암과 연관된다는 것을 보여주었다. 이 SNP에 대한 Illumina 칩 데이터는 1598명의 환자(그 중 653명은 MedPre 표현형 기준을 충족시킴) 및 4477명의 암-불포함(cancer-free) 대조군으로부터 수득하였다. MedPre 유방암과 연관된 rs4848543 대립인자 A에 대한 RR 추정값은 케이스 및 대조군에서 개인들간의 혈연관계에 대해 보정된 경우, 1.42였고, P-값은 8.3x10-8이었다(표 1). 테스트된 317,089개의 SNP에 대한 Bonferroni 보정 후에, 전체 보정된 P-값은 0.026이었다. rs4848543의 A 대립인자는 또한 1.16의 상대적 위험도 추정값으로, AllBC 표현형과 명목적으로 유의성있는(nominally significant) 연관을 보였다(표 1). 아이슬란드 집단으로부터의 독립적인 표본에서 이 결과를 확인하기 위해, 본 발명자들은 rs4848543 SNP에 대해 테스트하기 위해 Centaurus SNP 분석법, SG02S738을 설계하고 검증하였다. SG02S738 분석법을 추가적인 573명의 BC 환자에 대해 수행했고, 이들 중 198명은 MedPre 표현형 정의를 충족시켰다. 이 환자들은 Illumina 칩 또는 SG02S738 분석법을 이용하여 rs4848543에 대해 분석된 7406명의 개인으로 구성된 독립적인 대조군에 대비하여 테스트하였다. 이 제2 그룹에서 MedPre 유방암과 연관된 rs4848543 대립인자 A에 대한 RR 추정값은 1.26(p-값=3.4x10-2)이었다. 따라서, 최초의 발견이 독립적인 아이슬란드 표본에서 명목적 유의성(nominal significance)까지 재현되었다. 최초의 1598명의 환자와 573명의 재현 환자 세트가 통합되고 11883명의 대조군과 비교된 것인 결합 분석(joint analysis)의 결과가 표 1에 표시된다. 상기 결합 분석은 AllBC 표현형에 대한 명목적으로 유의성 있는 위험도를 보이고, MedPre 유방암 표현형에 대해 게놈 -전체적으로 유의성 있는 위험도를 보여주었다. MedPre 유방암에 대한 전체 Bonferroni 보정된 P-값은 0.0095(317,089개의 SNP에 대해 보정됨)였다. AllBCMedPre의 두 개의 표현형의 테스트를 고려해도, 이 값은 게놈-전체적으로 유의했다.
ICR 기록은 1955년부터 시작되기 때문에, 본 발명자들이 동원한 환자들 중 일부는 장기적인 암 생존자였다. rs4848543 대립인자 A 변이를 갖는 환자가 비-보인자와 상이한 장기-생존 확률을 갖는다면, 유병 케이스들 중에서 상기 변이의 빈도가 영향을 받을 수 있다. 이를 조사하기 위해, 본 발명자들은 2000년 1월 1일 이후에 진단받고, 진단으로부터부터 동원까지 5년 미만의 시간을 갖는 833명의 개인들로 구성된 환자의 서브세트를 확인했다. 최근에 진단된 환자들의 이 코호트에서, rs4848543 대립인자 A의 빈도는 0.372945였다. 본 발명자들은 또한 2000년 1월 1일 전에 진단받고 동원시까지 생존한 1338명의 환자들의 그룹을 확인하였다. 이 그룹에서 rs4848543 대립인자 A의 빈도는 0.372749였고, 이는 최근에 진단된 환자들 중의 빈도와 유의성있게 상이하지 않았다(P 값 = 0.99). 따라서, 상이한 생존(survivorship)이 표 1에 표시된 위험도 추정값에 영향을 미쳤다는 강력한 증거는 없다.
본 발명자들은 추가적으로 MedPre 표현형을 갖지 않는 유방암 환자들은 rs4848543 대립인자 A의 증가된 빈도를 보이지 않는다는 것에 주목했다(표 1). 이 관찰의 영향은 하기에서 더 검토된다. 본 발명자들은 rs4848543 대립인자 A와 MedPre 표현형 정의의 다양한 성분들 간의 관계를 조사했다:
rs4848543 대립인자 A는 조기 발병 유방암과 유의성있게 연관되지 않는다:
낮은 진단 연령은 MedPre 표현형의 정의에서 이용되는 기준 중 하나이기 때문에, 본 발명자들은 진단시 연령과 rs4848543 유전형 간의 연관을 조사하였다. Illumina 칩 상에서 분석된 1598명의 환자들 중에서, rs4848543 유전형과 진단 연령 간의 유의성있는 연관은 없었다(표 2).
rs4848543 대립인자 A로부터의 위험도는 유방암의 가족력과 연관된다:
본 연구에서 각 환자 발단자에 대해 가족력 점수를 계산하였다. Genealogical Database를 이용하여, 본 발명자들은 각 발단자의 1촌 내지 3촌 친척의 원을 확인하였다. 그 후, ICR 기록을 참조하여, 본 발명자들은 유방암으로 진단받은 친척을 모두 확인하였다. 그 후, 본 발명자들은 영향받은 1촌 친척 1인당 1점, 영향받은 2촌 친척 1인당 0.5점, 및 영향받은 3촌 친척 1인당 0.25점의 점수를 부여하여, 각 발단자에 대해 합산된 가족력 점수(FHS)를 생성하였다. FHS와 rs4848543 유전형 간의 연관을 조사하기 위해 Illumina 칩 상에서 분석되었던 1598명의 발단자들을 평가하였다. 표 2에 표시된 바와 같이, 증가된 FHS에 대한 경향은 rs4848543의 대립인자 A의 보유(carriage)와 연관되었다. 이 결과는 rs4848543 대립인자 A 변이가 AllBC 환자들 중에서 1.16에 불과한 상대적 위험도를 갖는다는 관찰에만 근거해서는 예상되지 않았다; 이 상대적 위험도 단독으로는 유방암 케이스의 가족성 클러스터링을 생성할 수 없었다[Stacey, et al., (2006), PLoS Med, 3, e217]. 그러나, rs4848543 대립인자 A는 MedPre 표현형을 이용하여 발견되었고, 상기 표현형은 그의 정의에서 가족력의 실질적인 요소를 갖는다. 이 관찰은 rs4848543 대립인자 A가 덜 일반적이고, 보다 높은 침투성의 변이와 연관 불균형일 수 있다는 것을 시사한다. 대안적으로, rs4848543 대립인자 A는 또 다른 고 침투성 소인 결정인자(high penetrance predisposition determinant)와 상호작용을 보여서, 그들의 침투성을 증가시키고, 그에 의해 유방암의 가족력과의 연관을 증가시킬 수 있다.
rs4848543 대립인자 A와 유방암의 가족력 간의 연관은 BRCA2 999del5 돌연변이를 갖는 가족에 의해 (완전히는 아니나) 부분적으로 설명된다:
rs4848543 대립인자 A와 유방암의 가족력 간의 관계를 더 조사하기 위해, 본 발명자들은 잘 규명된 아이슬란드인의(Icelandic) BRCA2 999del5 돌연변이를 갖는 가족들이 rs4848543 대립인자 A를 갖는 환자들이 보이는 가족성 클러스터링을 유발하는지 여부를 조사하였다. 본 발명자들은 1600명의 세트에서 1499명의 환자를 BRCA2 999del5 돌연변이에 대해 분석하였다. 본 발명자들은 전술된 바와 같이, FHS를 재-계산하였고, 이때 BRCA2 999del5 돌연변이를 갖는 것으로 확인된 모든 발단자들을 제외시켰다. 표 2에 표시된 바와 같이, 999del5 돌연변이 보인자의 제거 후에도, rs4848543 대립인자 A와 FHS 간의 연관은 여전히 유의성이 있어서, 상기 연관이 BRCA999del5 돌연변이 가족에 의해 완전히 설명될 수 없다는 것을 시사했다. 그러나, P-값은 999del5 보인자가 배제되지 않은 경우보다 상당히 더 높아서, 본 발명자들이 BRCA2 999del5가 rs4848543 대립인자 A에 의해 보여지는 가족성 클러스터링의 일부에 관여될 수 있다는 것을 추측하게 하였다.
rs4848543 대립인자 A로부터의 위험도는 BRCA2 999del5 돌연변이의 보인자까지 확장된다:
BRCA2 999del5 돌연변이는 아이슬란드에서 가족성 유방암에 대해 그와 같은 상당한 영향을 가지기 때문에, 본 발명자들은 상기 돌연변이와 rs4848543 대립인자 A 변이의 관계를 고려하였다. 한때 가능한 시나리오는 CHEK2와 BRCA 돌연변이 간의 상호작용에 대해 시사되었던 것과 같이, rs4848543 대립인자 A 변이가 BRCA2 999del5 보인자에게 무시할 수 있는 정도의 추가적인 위험도를 부여한다는 것이었다[(2004), Am J Hum Genet, 74, 1175-82; Meijers-Heijboer, et al., (2002), Nat Genet, 31, 55-9]. 상기 시나리오의 경우라면, 영향받은 BRCA2 999del5 보인자들 중에서 rs4848543 대립인자 A 변이의 빈도는 대조군 빈도와 거의 같을 것이다. 반대로, 영향받은 BRCA2 999del5 보인자 중에서 rs4848543 대립인자 A 변이의 빈도가 집단 대조군에서보다 더 높은 경우, rs4848543 대립인자 A가 999del5 돌연변이에 의해 부여된 위험도 외에 BRCA2 보인자에 위험도를 부여한다는 것을 의미할 것이다. BRCA2 999del5 보인자의 수를 최대화하기 위해, 결합 아이슬란드 Illumina 및 재현 환자 세트에 대해 하기 분석을 수행하였다. 데이터의 조사는 rs4848543 대립인자 A 변이의 빈도는 유방암을 갖는 BRCA2 999del5 보인자에서 0.463이었고, 이는 대조군 빈도보다 훨씬 높고, 1.65의 RR에 해당한다는 것을 보여주었다(표 3). 따라 서, BRCA2 999del5 보인자(이미 유방암의 높은 위험도를 가짐)의 경우, 그들의 위험도에 보유한 각각의 rs4848543 대립인자 A 당 1.65의 추정된 인자(estimated factor)가 곱해지게 된다. rs4848543 유전형의 승법 모델로부터의 편향에 대한 증거는 없었다. 이 관찰은 rs4848543 대립인자 A 변이에 의해 부여된 유방암의 증가된 위험도가 BRCA2 999del5 보인자까지 확장된다는 것을 보여준다. BRCA2 999del5는 비-기능성(non-functional) 단백질을 생성하는 널 돌연변이(null mutation)이기 때문에, 이 결과들은 rs4848543 대립인자 A에 의해 부여된 위험도가 상기 돌연변이가 단백질을 비-기능성이 되게 하는 BRCA2 돌연변이 보인자 모두에게 확장된다는 것을 시사한다.
rs4848543 대립인자 A는 BRCA2 999del5와 상승적으로 상호작용할 수 있다:
rs4848543 대립인자 A로부터의 위험도가 BRCA2 999del5 보인자까지 확장된다는 관찰은 상기 변이가 999del5 비-보인자(non-carrier)에게 부여하는 것과 동일한 상대적 위험도를 999del5 보인자에게 부여하는지의 문제를 제기한다. 본 발명자들은 BRCA2 999del5 보인자에서 rs4848543 대립인자 A에 대한 상대적 위험도 추정값(1.65)이 BRCA2 돌연변이의 비-보인자에서 rs4848543 대립인자 A에 대한 상대적 위험도 추정값(1.13, 표 3)보다 약간 더 높다는 것에 주목했다. 따라서, 본 발명자들은 rs4848543 대립인자 A에 의해 부여된 상대적 위험도가 BRCA2 999del5 배경에서 비-999del5 배경에서와 상이한지 여부를 테스트하였다. 표 3에 표시된 바와 같이, rs4848543 대립인자 A에 의해 부여된 상대적 위험도는 비-보인자와 비교하여, 999del5 보인자에서 약 1.46-배 더 높았다. 이 관찰은 rs4848543 대립인자 A가 BRCA2 999del5와 상승적 방식으로 상호작용한다는 해석과 일치한다. BRCA2 999del5는 비-기능성 단백질을 생성하는 널 돌연변이이기 때문에, 이 결과들은 rs4848543 대립인자 A가 BRCA2 단백질을 비-기능성이 되게 하는 모든 BRCA2 돌연변이와 상승적으로 상호작용한다는 것을 시사한다.
BRCA2 999del5와의 잠재적 상호작용은 또한 환자들 중에서 rs4848543의 변이 대립인자의 수와 환자에 의해 보유된 999del5의 수 간에 유의성있는 상관관계가 있는지 여부를 평가하는 것에 의해 조사하였다. 표 4에 표시된 바와 같이, 환자에서 보유된 rs4848543 대립인자 A의 갯수와 BRCA2 999del5 대립인자의 보유 간의 유의성 있는 상관관계가 있었다. 환자에서 rs4848543 대립인자 A와 BRCA2 999del5 대립인자 간의 상관관계가 근본적인 집단 계층화(underlying population stratification) 때문에 일어날 수 있는지 여부를 조사하기 위해, 본 발명자들은 상기 상관관계가 대조군 집단에 존재하는지 여부를 조사하였다. 두 변이에 대해 테스트된 5938명의 대조군에서 상관관계는 없었다. 유방암 환자들은 이 5938명의 대조군의 그룹으로부터 배제시켰다. BRCA2 999del5는 유방암에 대한 강력한 위험 인자이기 때문에, 대조군에서 999del5 보인자가 고갈된 것으로 주장될 수 있다(비교적 작은 수의 여성 보인자들이 유방암에 의해 영향받지 않을 수 있기 때문에). 따라서, 본 발명자들은 두 변이 모두에 대해 테스트되었던 2925명의 남성으로 구성된 대조군을 이용하여 상기 테스트를 반복하였다. 이 그룹에서 rs4848543 대립인자 A와 999del5 보유 간의 상관관계에 대한 증거는 없었다. 따라서, 본 발명자들은 환 자들 중에서 rs4848543 대립인자 A와 999del5의 동시-유전(co-inheritance)을 설명할 수 있는 근본적인 집단 계층화의 증거가 없는 것으로 결론지었다. 따라서, 가장 타당한 설명은 rs4848543 대립인자 A와 999del5가 상승적 방식으로 상호작용한다는 것이다.
그 후, 본 발명자들은 공지된 BRCA2 999del5 환자들이 분석으로부터 제외된 경우 rs4848543 대립인자 A가 가족력과의 연관을 보인다는 관찰로 되돌아갔다(표 2). 본 발명자들은 BRCA2 999del5 보인자가 아니나, MedPre 표현형 기준을 충족시키는 고 위험 환자들이 rs4848543 대립인자 A의 증가된 빈도를 보이는지 여부를 조사하였다. 상기 빈도는 대조군에서보다 이 환자들에서 더 높았고, 1.35의 상대적 위험도에 해당했다(표 3). 따라서, rs4848543 대립인자 A와의 위험도 연관은 999del5 보인자가 아니나, 그럼에도 불구하고 MedPre 특징을 갖는 환자들에까지 확장된다.
표 1에 표시된 바와 같이, MedPre 표현형 정의에 맞지 않는 환자에서 rs4848543 대립인자 A와 연관된 검출가능한 위험도는 없었다. 이는 rs4848543 대립인자 A만이 MedPre 표현형 배경에서 위험도를 부여한다는 것을 시사한다. 이는 rs4848543 대립인자 A 변이의 배경에 비교적 드문, 고 침투성 돌연변이가 존재하는 경우 일어날 수 있다. 대안적으로, rs4848543 대립인자 A 변이는 BRCA2 및 가족성 연관(familiar association)을 갖는 다른, 확인되지 않은 고 침투성 위험도 결정인자의 침투성을 변형시키는 보다 일반적인 대립인자를 나타낼 수 있다. 그와 같은 확인되지 않은 위험도 결정인자는 다른 유전자의 고 침투성 변이, 변이의 다유전 자(polygenic) 조합 또는 심지어 가족에서 집적하는 환경적 위험 인자들일 수 있다. 편의를 위해, 본 발명자들은 그와 같은 가상의(hypothetical) 고 침투성 위험도 결정인자를 BRCAx로 지칭한다. rs4848543 대립인자 A가 변형자 유전자(modifier gene)으로 작용할 수 있다는 견해를 더 조사하기 위해, 본 발명들은 rs4848543 대립인자 A가 MedPre에 걸린, 비-BRCA 보인자에서와 동일한 빈도로 영향받은 BRCA2 999del5 보인자 중에 일어나는지 여부를 연구하였다. 이는 사실상 rs4848543 대립인자 A 변이가 BRCAx를 갖는 개인에 대한 것과 유사한 위험도를 999del5의 보인자에게 부여하는지 여부를 조사하는 것이다. 표 3에 표시된 바와 같이, 이 그룹들 간에 rs4848543 대립인자 A 변이의 빈도의 유의성 있는 차이는 없었다. 그러나, 상대적 위험도의 점 추정값(point estimate)은 1.22여서, 그 효과가 999del5 보인자에서 더 클 수 있다는 것을 시사한다.
rs4848543 대립인자 A 및 rs4848543 LD 블럭 내의 (rs4848543과 연관 불균형인)다수의 다른 마커의 보인자는 다발성 원발성 유방암의 증가된 위험도를 갖는다:
다발성 원발성 유방암의 발생율은 유전적 소인의 지표(indicator)이고 임상적 중요성을 갖는다. 유방암을 앓았던 환자들은 제2의 원발성 종양의 발병에 대해 크게 증가된 위험도를 갖는다. 유전적 소인은 이 증가된 위험의 실질적인 성분을 구성할 수 있다. 따라서, 본 발명자들은 다발성 원발성 유방암(MPBC)이 비-보인자에서보다 rs4848543 대립인자 A 보인자에서 기대되는 것보다 높은 빈도로 나타나는지 여부를 조사하였다. Illumina 칩으로부터의 데이터는 rs4848543 LD 블럭 내의 다른 마커들이 적어도 rs4848543만큼 MPBC를 잘 예측할 수 있다는 것을 나타냈다. 따라서, 본 발명자들은 상기 블럭 내의 마커들에 대해 8개의 분석법을 설계하고 테스트하였다. 로지스틱 회귀를 이용한 MPBC에 대한 위험도의 평가 및 환자 추적(follow-up) 시간의 길이를 보정한 후, 8개의 SNP 중 7개가 단일 원발성 유방암(SPBC) 진단만을 경험한 환자 대비 보인자에서 MPBC의 증가된 위험도를 보였다(표 5). 본 발명자들은 이 7개의 SNP 분석법이 환자가 MPBC의 증가된 위험도를 갖는지 여부를 결정할 수 있는 것으로 결론지었다.
하나의 연관 불균형 블럭 내의 복수 개의 SNP가 All BC 및 MedPre 유방암 표현형과의 연관을 보인다:
SNP rs4848543 대립인자 A는 NCBI Build 34에 근거한 경계 좌표(delimiting coordinate)가 표 6에 표시된 연관 불균형(LD) 블럭에서 발견된다. 상기 LD 블럭은 [McVean, et al., (2004), Science, 304, 581-4; Winckler, et al., (2005), Science, 308, 107-11]에 기재된 가능성 비 테스트를 이용하여 옥스포드 대학교의 수학 유전학 그룹(the Mathematical Genetics Group at the University of Oxford)에 의해 정의된 재조합 핫스팟(recombination hotspot) 간에 전개되는 것으로 정의되었다. Illumina Hap300 칩으로부터의 데이터는 rs4848543 대립인자 A와 동일한 연관 불균형 블럭 내에 존재하고 테스트된 두 개의 유방암 소인과 명목적으로 유의성있는 연관을 보인 다수의 SNP를 밝혔다. 표 7 및 표 8은 Illumina Hap300 칩 상에 존재하는 LD 블럭 내의 모든 SNP의 목록 및 두 개의 표현형에 대해 그들로부터 수득된 연관 값(association value)을 표시한다. 본 발명자들은 또한 HapMap 프로젝트(HapMap 데이터에 대한 모든 참조는 release 20에 대한 것임)에서 분석된 추가적인 세트의 SNP에 대한 효율적인 대리물(r2>0.8)로 확인된 상기 블럭 내의 2-마커 일배체형(two-marker haplotype)을 고려했다. 이 추가적인 SNP는 UTAH CEPH (CEU) HapMap 표본에서 5%보다 높은 소수 대립인자 빈도(minor allele frequency)를 가졌고 그들은 Hap300 SNP 칩 상에 존재하지 않았고 상기 칩 상에 존재하는 SNP에 의해 효율적으로 태깅되지도 않았다[Pe'er, et al., (2006), Nat Genet, 38, 663-7]. 이와 같은 소위 "Daly" 일배체형에 대한 결과가 또한 표 7 및 표 8에 표시된다. MedPre 유방암에 대해, 29개의 개별적인 SNP 또는 2-점(two-point) "Daly" 일배체형이 명목적으로 유의성 있는 p-값을 보였다.
rs4848543 대립인자 A-연관 위험도가 복수 개의 일배체형 배경 상에 존재한다.
rs4848543 대립인자 A가 비교적 드문, 고 침투성 변이를 태깅하는지 또는 다른 고 침투성 결정인자들의 공통된 변형자(common modifier)로 작용하는지 여부를 구별하기 위하여, 본 발명자들은 rs4848543 대립인자 A가 나타나는 일배체형 배경의 다양성을 조사하였다. rs4848543 LD 블럭은 비교적 높은 재조합의 영역을 포함하며, 그의 원위 말단(distal end)은 뉴클레오티드 120034174 주위에 존재했다. 명목적으로 유의성 있는 유방암 위험도를 부여하는 SNP는 이 재조합의 영역에서 (우 측) 말단에 위치한다. 따라서, 본 발명자들은 일배체형 다양성의 분석을 우측 서브-블럭 영역(right-hand sub-block region)에 한정했다. 본 발명자들은 Illumina 칩 상에서 분석된 시료 및 SNP를 이용하여 정의된 영역(nt 120034174 내지 nt 120129001) 내에서 일배체형을 확인하기 위해 NEMO 소프트웨어를 이용하였다. 일배체형을 구별하기 위해 필요하지 않은 중복적인 SNP는 제거하고, 남은 일배체형 각각에 대해 상대적 위험도 및 빈도를 평가하였다. 결과가 표 9에 표시된다. rs4848543 A 대립인자를 갖는 모든 확인된 일배체형은 1보다 큰 상대적 위험도 추정값을 가졌고, 대부분의 경우, RR 추정값은 1보다 유의성있게 더 컸다. 반대로, rs4848543 C 대립인자를 갖는 일배체형은 어느 것도 1보다 큰 RR 추정값을 갖지 않았고, 모든 유의성 있는 추정값은 1 미만이었다(즉, 그들은 보호적(protective)임). 따라서, 본 발명자들은 rs4848543 대립인자 A-포함(bearing) 일배체형으로부터 위험도를 분리시킬 수 없었다. 이는 발병성(pathogenic) 변이(즉, 기계적으로 위험도를 부여하는 변이)는 rs4848543 대립인자 A 또는 rs4848543 대립인자 A와 강한 연관 불균형인 변이라는 것을 시사한다. 복수의 일배체형 배경 상에 발병성 변이의 존재는 그의 빈도가 rs4848543 대립인자 A의 빈도와 근접하게 유사할 수 있다(즉, rs4848543 대립인자 A와 발병성 변이 간의 r2 값은 높다)는 것을 시사한다. 이 관찰은 rs4848543 대립인자 A가 rs4848543 LD 블럭 내에서 드문, 고 침투성 변이의 존재를 나타내지 않으나, 오히려 상기 대립인자가 BRCA2 및 앞서 정의된 BRCAx와 같은 고 침투성 결정인자의 다소 공통된 변형자라는 견해를 지지한다.
다수의 마커들이 rs4848543 대립인자 A와의 상관관계를 통해 BC 위험도 연관을 보일 수 있다:
HapMap 프로젝트 데이터 (release 20)에 대한 참조는 CEU 백인 유럽계 집단 표본에서 rs4848543과 0.2보다 큰 r2 값의 상관관계를 갖는 다수의 공지된 SNP를 밝혔다. 이 SNP들은 rs4848543과 유의성있게 상관되기 때문에, rs4848543 자체에 의해 측정되는 것과 동일한 BC 위험도를 측정하기 위해 이용될 수 있다. 이 SNP들은 표 10에 열거된다.
STEAP3/TSAP6 유전자는 유방암에 대한 관찰된 위험도에 관여될 가능성이 가장 높은 유전자이다:
rs4848543 LD 블럭 영역 내에 현재 3개의 알려진 유전자가 있다. 이들은 하기와 같다;
1. 보체 성분 1q 서브성분-유사 2(Complement Component 1q Subcomponent-like 2) 유전자 C1Ql2 (NM_182528)
2. TSAP6(Tumour Suppressor Activated Pathway 6), pHyde, 및 Dudulin-2로도 알려진 STEAP3(The Six Transmembrane Epithelial Antigen of Prostate 3) 유전자. RefSeq 번호 NM_018234 (이소형 b), NM_182915 (이소형 a), 및 NM_001008410 (AF262322로도 표시됨)에 의해 식별된 이 유전자의 3개의 주요한 공지된 대안적인 전사체가 있다. 이 유전자의 제4 전사체가 개시되었고 식별자 AK024163이 부여되었다.
3. 전사체, AK127773는 STEAP3 유전자와 중첩되고 반대쪽(좌향) 가닥으로부터 전사된다. 이 유전자는 가상 단백질(hypothetical protein) FLJ45874로 표시되었다.
rs4848543 LD 블럭은 비교적 높은 재조합의 영역을 포함하고, 그의 원위 말단은 뉴클레오티드 120034174 주변에 위치한다. 명목적으로 유의성 있는 유방암 위험도를 부여하는 SNP 및 Daly 2-점 일배체형의 대다수는 이 재조합의 영역에서 말단에(우향) 위치한다. 이는 C1Q12 내 및 그 주변의 변이가 연관 신호의 출처가 아니라는 것을 시사한다. 위험도와 강하게 연관된 변이는 STEAP3/TSAP6 유전자의 5' 및 그 내부에 위치한다. 실제로, 명목적으로 유의성 있는 SNP 중 2개, rs838100 및 rs3731603은 상기 유전자의 전사된 서열 내에 존재하고 또 다른 두개, rs838102 및 rs12711924는 STEAP3/TSAP6 인트론 내에 위치한다. 이 두 개의 SNP 중 후자는 IVS4 유전자의 3' 스플라이싱 부위 부근에 위치한다. 이 관찰들, 및 STEAP3/TSAP6 유전자(하기 참조)의 공지된 생물학적 특성(biology)을 고려할 때, 유방암에 대한 관찰된 증가된 위험도에 관여될 가능성이 가장 높은 유전자는 STEAP3/TSAP6이다.
섹션 2: 염색체 2q35 상의 rs13387042
rs13387042 A 대립인자는 아이슬란드에서 유방암에 대한 증가된 위험도와 연관된다:
게놈-전체 연관 분석은 rs13387042 대립인자 A가 Any BC 표현형과 연관된다는 것을 보여주었다(표 11). 이 SNP는 STEAP3/TSAP6 유전자 좌로부터 별개의 위치에 염색체 2q35에 위치한다. 1598명의 환자 및 4475명의 암-불포함 대조군에 대해 이 SNP에 대한 Illumina 칩 데이터를 수득하였다. A-rs13387042에 대한 RR 추정값은 케이스 및 대조군에서 개체들 간의 혈연관계에 대해 보정된 경우, 4.0x10-5의 P-값으로 1.19였다. RR은 MedPre 유방암에서 유사했고, P-값은 4.4x10-3이었다.
그 자체로, 이 결과는 테스트된 317,089개의 SNP에 대한 Bonferroni 보정 후 게놈-전체적으로 유의성있는 것으로 간주될 수준에 도달하지 않았다. 따라서, 본 발명자들은 rs4848543 대립인자 A에 대해서 수행한 바와 같이, 아이슬란드 집단으로부터의 독립적인 표본에서 상기 결과를 확인하고자 하였다. 본 발명자들은 rs13387042 SNP에 대해 테스트하기 위해, SG02S728로 명명된, Centaurus SNP 분석법을 설계하고 테스트하였다. SG02S728 분석법을 추가적인 583명의 환자들 및 Illumina 칩 또는 Centaurus 방법에 의해, rs13387042 대립인자 A에 대해 분석되었던 7966명의 개인들로 구성된 독립적인 대조군에 대해 수행하였다. 7966명의 대조군은 전립선암 또는 대장암으로 진단받은 개인을 포함하나, 유방암으로 진단되었던 개인은 포함하지 않았다. 이는 rs13387042 대립인자 A가 이 암들에 대한 검출가능한 위험도를 부여하지 않는다는 중간 관찰에 의해 정당화되었다(데이터는 제시되지 않음). 이 제2 그룹에서 AnyBC와 연관된 rs13387042의 대립인자 A 에 대한 RR 추정 값은 1.20 (P-valuecorr = 3.8x10-3)이었다. 따라서, RR의 매우 유사한 점 추정치로, 최초의 발견이 독립적인 아이슬란드 표본에서 유의성있게 재현되었다. 최초의 1598명과 583명의 재현 표본이 통합되고 12441명의 대조군과 비교된 것인 결합 분석의 결과가 표 11에 표시된다. 결합 분석은 테스트된 317,089개의 SNP에 대한 Bonferroni 보정 후 유의성의 수준에 근접한, 1.20의 유의성있는 상대적 위험도 추정값(P-valuecorr = 2.0x10-7)을 보였다. rs13387042 대립인자 A 변이의 관찰된 빈도 및 상대적 위험도는 아이슬란드 집단에서 15.6%의 추정된 집단 귀속 위험도에 해당한다.
ICR 기록은 1955년부터 시작되므로, 본 발명자들이 동원한 환자들 중 일부는 장기적인 암 생존자였다. rs13387042 대립인자 A 변이를 갖는 환자가 비-보인자와 상이한 장기-생존 확률을 갖는다면, 유병 케이스들 중에서 상기 변이의 빈도가 영향을 받을 수 있다. 이를 조사하기 위해, 본 발명자들은 2000년 1월 1일 이후에 진단받고, 진단으로부터부터 동원까지 5년 미만의 시간을 갖는 837명의 개인들로 구성된 환자의 서브세트를 확인했다. 최근에 진단된 환자들의 이 코호트에서, rs13387042 대립인자 A의 빈도는 0.498이었다. 본 발명자들은 또한 2000년 1월 1일 전에 진단받고 동원시까지 생존한 1344명의 환자들의 그룹을 확인하였다. 이 그룹에서 rs13387042 대립인자 A의 빈도는 0.492였고, 이는 최근에 진단된 환자들 중의 빈도와 유의성있게 상이하지 않았다(P 값 = 0.71). 따라서, 상이한 생존 율(survivorship)이 표 11에 표시된 위험도 추정값에 영향을 미쳤다는 강력한 증거는 없다.
rs13387042 A 대립인자는 스페인 케이스:대조군 표본에서 유방암에 대한 증가된 위험도와 연관된다:
유방암 위험도에서 rs13387042 대립인자 A의 역할을 더 조사하기 위해, 본 발명자들은 스페인에서 수집된 BC 케이스:대조군 표본의 독립적인 세트를 검사하였다. 스페인 연구 집단은 스페인 자라고자(Zaragoza)에 있는 자라고자 병원의 종양학과로부터 동원된 446명의 유방암 케이스로 구성되었다. 977명의 대조군 세트는 스페인, 자라고바에 있는 대학교 병원에서 수집되고 본 연구에 포함시키기 전에 유방암에 걸리지 않았다는 것을 확인했다. 모든 개인들은 고지된 동의서를 제출했다.
스페인 케이스 및 대조군 시료를 대상으로 SG02S728 Centaurus 분석법을 이용하여 rs13387042에 대해 유전형 분석을 수행하였다. 결과가 표 11에 제시된다. rs13387042의 대립인자 A는 이 집단에서 유방암 위험도와 1.21의 점 추정값으로 유의성 있는 연관을 보였다(P-값 1.8x10-2). rs13387042 대립인자 A 변이의 빈도는 스페인 대조군 표본에서 더 높아서, 상기 변이가 보다 우세하고 따라서 스페인 추출(extraction) 집단에서 보다 높은 유방암 부하(burden)에 기여할 수 있다는 것을 시사했다.
rs13387042 A 대립인자는 스웨덴 케이스/대조군 표본에서 유방암에 대한 증가된 위험도와 연관된다:
유방암의 위험도에서 rs13387042 변이의 A 대립인자의 역할의 추가적인 확인을 추진하기 위해, 본 발명자들은 2개의 스웨덴 코호트에서 SNP를 분석하였다: "스웨덴 가족성(Sweden Familial)" 코호트는 스톡홀름, 카롤린스카 연구소(Karolinska Institute)의 종양유전학 카운셀링 클리닉에 유방암의 가족력 조사를 위해 위임된 346명의 BC 환자들로 구성되었다. 각 환자는 별개의 가족으로부터 유래되었다. "스웨덴 순차적(Sweden Consecutive)" 코호트는 카롤린스카 연구소 유방암 클리닉에 다녔던 482명의 순차적으로 동원된 BC 환자들로 구성되었다. 가족력은 이 제2의 코호트의 선택에서 고려되지 않았다. 대조군은 스톡홀름 지역으로부터 1300명의 수혈자 및 대장암 케이스의 434명의 암-불포함 배우자였다. 대조군에서 A-rs13387042의 빈도에서 성별간에 유의성 있는 차이는 없었고, 수혈자와 암-불포함 대조군 세트 간에 유의성 있는 차이도 없었다.
표 11에 표시된 바와 같이, "스웨덴 순차적" 코호트는 1.31의 유의성 있는 유방암에 대한 상대적 위험도를 보였다(P-값= 2.0x10-4). "스웨덴 가족성" 코호트의 1.11의 상대적 위험도 추정값은 유의성이 없었으며, 아마도 이 그룹은 A-rs13387042의 효과를 무색하게 하는 고-침투성 유전자를 가질 수 있기 때문이다. 전체적으로, 통합된 스웨덴 코호트는 1.22의 유의성있는 상대적 위험도 추정값을 가져왔다(P-값= 8.1x10-4).
아이슬란드 코호트, 스페인 코호트 및 스웨덴 코호트에 대한 추정값은 Mantel-Haenszel 모델을 이용하여 결합 분석에서 통합되었다. 상기 결과는 3.8x10-11의 P-값으로 1.20의 추정된 상대적 위험도였다. 이는 조사된 317,089개의 SNP에 대해 보정하기 위한 Bonferroni 방법을 이용한 게놈-전체 유의성에 대한 역치보다 훨씬 더 낮다. 따라서, 본 발명자들은 A-rs13387042는 유럽 후손의 여러 집단 표본에서 유방암에 대한 유의성있고 재현가능한 위험도를 부여하는 것으로 결론지었다. 전체 집단 기인 위험도는 16.4%였다.
rs13387042 대립인자 A - 연관 위험도가 복수 개의 일배체형 배경에 존재한다:
rs13387042 SNP는 표 12에 NCBI Build 34에 근거한, 경계 좌표가 표시된 연관 불균형(LD) 블럭에서 발견된다. 상기 LD 블럭은 [McVean, et al., (2004), Science, 304, 581-4; Winckler, et al., (2005), Science, 308, 107-11]에 기재된 가능성 비 테스트를 이용하여 옥스포드 대학교의 수학 유전학 그룹에 의해 정의된 재조합 핫스팟 간에 전개되는 것으로 정의되었다. 마커 rs13387042의 대립인자 A가 비교적 드문, 고 침투성 변이 또는 보다 일반적이고 더 낮은 침투성 변이를 태깅하는지 여부를 구분하기 위해, 본 발명자들은 rs13387042 대립인자 A가 나타나는 일배체형 배경의 다양성을 조사하였다. 본 발명자들은 Illumina 칩 상에서 분석된 SNP 및 표본을 이용하여 LD 블럭 내에서 일배체형을 확인하기 위해 NEMO 소프트웨 어를 이용했다. 일배체형을 구별하기 위해 필요하지 않은 중복적인 SNP는 제거하고, 남은 일배체형 각각에 대해 상대적 위험도 및 빈도를 평가하였다. 결과가 표 13에 표시된다. rs13387042 A 대립인자를 갖는 수개의 확인된 일배체형은 1보다 큰 상대적 위험도 추정값을 가졌고, 일부 경우, RR 추정값은 1보다 유의성있게 더 컸다. 반대로, rs13387042 C 대립인자를 갖는 단 하나의 드문 일배체형은 1보다 큰 RR 추정값을 보였고, rs13387042 대립인자 C-포함(bearing) 일배체형에 대한 2개의 명목적으로 유의성 있는 RR 추정값은 1 미만이었다(즉, 그들은 보호성임). rs13387042의 대립인자 A를 갖는 두 개의 일배체형은 1보다 큰 RR 추정값을 생성하지 않았고, 이 추정값들 중 하나는 명목적으로 유의성이 있었다. 정리하면, 이 관찰들은 발병성 변이(즉, 기계적으로 위험도를 부여하는 변이)는 rs13387042 대립인자 A와 강한 연관 불균형이나, rs13387042 대립인자 A 자체는 아닐 수 있다는 것을 시사한다.
rs13387042 LD 블럭 내의 복수 개의 SNP가 BC 위험도와 연관을 보인다:
Illumina Hap300 칩으로부터의 데이터는 rs13387042와 동일한 LD 블럭에 존재하는 다수의 SNP를 밝혔다. 표 14는 llumina Hap300 칩 상에 존재하는 상기 LD 블럭 내에 존재하는 모든 SNP의 목록 및 그들로부터 수득된 단일-점(single-point) 분석 및 2-점 "Daly" 일배체형 분석에 대한 연관 값(association value)을 보여준다. 21개의 SNP 또는 Daly 일배체형이 개체들 간의 가족 관계에 대해 보정된 경우 명목적으로 유의성 있는 P-값을 보였다는 것을 알 수 있다.
다수의 마커들이 rs13387042 대립인자 A와의 상관관계를 통해 BC 위험도 연관을 보일 수 있다:
HapMap 프로젝트 데이터 (release 20)에 대한 참조는 CEU 백인 유럽계 집단 표본에서 rs13387042와 0.2보다 큰 r2 값의 상관관계를 갖는 다수의 공지된 SNP를 밝혔다. 이 SNP들은 rs13387042와 유의성있게 상관되기 때문에, rs13387042 자체에 의해 측정되는 것과 동일한 BC 위험도를 측정하기 위해 이용될 수 있다. 이 SNP들은 표 15에 열거된다.
섹션 3: 염색체 16q12 상의 rs3803662
rs3803662의 T 대립인자는 유방암에 대한 위험도와 연관된다:
1600명의 유방암 환자 및 11563명의 대조군으로부터의 데이터를 이용한 추가적인 게놈전체 SNP 분석은 SNP rs3803662의 대립인자 T가 Any BC에 대한 약 1.23-배 증가된 위험도를 부여한다는 것을 밝혔다(표 16). 이 결과는 594명의 아이슬란드 유방암 환자 및 1433명의 대조군의 제2의 독립적인 코호트에서 확인되었다. 이 두개의 아이슬란드 표본으로부터의 통합된 데이터는 개체들 간의 혈연관계에 대해 보정된 경우, 1.23의 상대적 위험도 추정값 및 2.8x10-7 의 P-값을 생성했다. 이는 10.1%의 추정된 집단 귀속 위험도에 해당했다(표 16).
rs3803662 대립인자 T의 유방암에 대한 위험도와의 연관은 스웨덴, 스페인 및 네덜란드로부터의 독립적인 유방암 케이스:대조군 코호트에서 재현된다.
rs3803662 대립인자 T의 유방암 위험도와의 연관을 확인하기 위해, 본 발명자들은 3개의 독립적인, 외국 코호트에서 상기 발견을 재현하고자 시도하였다. 본 발명자들은 전술된 스웨덴 코호트 및 스페인 코호트로부터의 개인들의 유전형을 분석하였다. 본 발명자들은 또한 네덜란드, 네이메헌(Nijmegen)으로부터의 1384명의 대조군 및 558명의 유방암 케이스의 유전형을 분석하였다. 이 코호트는 2005-2006년에 네덜란드의 동부에서 진단된 유방암 환자들의 집단-기반 등록부 확인으로부터 모집되었다. 이 기간동안 70세 이전에 유방암으로 진단된 모든 환자들에게 본 연구에 참가하도록 요청하였다. 대조군은 집단 등록의 랜덤 표본에 기반하여 2002-2003년에 수행된 조사(survey)(네이메헌 생물의학 연구(Nijmengen Biomedical Study))에서 모집되었다. 표 16에 표시된 바와 같이, rs3803662 대립인자 T에 대한 유의성있게 증가된 위험도는 상기 3개의 재현 코호트 모두에서 관찰되었다. 상기 3개의 비-아이슬란드 재현 코호트의 통합 분석에서, 전체 상대적 위험도 추정값은 1.35였고, P-값은 5.1x10-12였다. 아이슬란드 코호트 및 재현 코호트의 결합 분석은 2.7x10-17의 P-값으로 1.28의 통합된 상대적 위험도 추정값을 보여주었다. 이는 테스트된 SNP의 갯수에 대해 보정된 경우, 게놈-전체 유의성에 대한 역치보다 훨씬 낮다. 상응하는 전체 집단 기인 위험도 추정값은 13.4%였다(표 16).
rs3803662를 포함하는 LD 블럭의 정의 및 잠재적인 후보 유전자의 확인.
rs3803662 SNP는 표 17에 NCBI Build 34에 근거한 경계 좌표가 표시된 연관 불균형(LD) 블럭에서 발견된다. 상기 LD 블럭은 [McVean, et al., (2004), Science, 304, 581-4; Winckler, et al., (2005), Science, 308, 107-11]에 기재된 가능성 비 테스트를 이용하여 옥스포드 대학교의 수학 유전학 그룹에 의해 명명된 재조합 핫스팟 간에 전개되는 것으로 정의되었다. rs3803662는 LOC643714로 표시된 가상(hypothetical) 단백질의 전사체에 존재한다. 따라서, 이 가상 단백질은 잠재적인 암 소인 유전자(cancer predisposition gene)로 관련된다. 공지된 유전자 TNRC9의 5' 말단도 이 블럭에 존재한다. TNRC9은 전사 인자 및 크로마틴 리모델링 작용제(chromatin remodeling agent)를 포함하는 것으로 알려진 일군의 단백질인 크로마틴 연관 HMG(high mobility group) 단백질 패밀리의 일원이다. 원발성 유방암 대비, 전이성 유방암에서 TNRC9 단백질의 감소된 발현이 관찰되었다(Olendrowitz, C. 2006, Bachelor of Science Bioinformatics Thesis, Charite-Universitatsmedizin, Berlin). 이 유전자의 5'말단 부근에 존재하는 SNP 변이의 확인은 상기 변이가 TNRC9 단백질의 기능의 발현을 변화시켜서, 증가된 유방암 위험도를 초래하는 유전적 인자와 연관 불균형일 수 있다는 것을 시사한다,
rs3803662 LD 블럭 내의 복수 개의 SNP가 BC 위험도와의 연관을 보인다:
Illumina Hap300 칩으로부터의 데이터는 rs3803662와 동일한 LD 블럭에 존재하는 다수의 SNP를 밝혔다. 표 18은 llumina Hap300 칩 상에 존재하는 상기 LD 블 럭 내에 존재하는 모든 SNP의 목록을 보여주며, 그들로부터 단일-점 "Daly" 일배체형 분석 및 2-점 "Daly" 일배체형 분석에 대한 연관 값을 수득하였다. 80개의 SNP 또는 Daly 일배체형이 명목적으로 유의성 있는 P-값을 보였다는 것을 알 수 있다.
다수의 마커들이 rs3803662 대립인자 T와의 상관관계를 통해 BC 위험도 연관을 보일 수 있다:
HapMap 프로젝트 데이터 (release 20)에 대한 참조는 CEU 백인 유럽계 집단 표본에서 rs3803662와 0.2보다 큰 r2 값의 상관관계를 갖는 다수의 공지된 SNP를 밝혔다. 이 SNP들은 rs3803662와 유의성있게 상관되기 때문에, rs3803662 자체에 의해 측정되는 것과 동일한 BC 위험도를 측정하기 위해 이용될 수 있다. 이 SNP들은 표 19에 열거된다.
rs3803662 대립인자 T 및/또는 관련 SNP는 여러 상이한 민족에서 유방암에 대한 위험을 부여한다:
상이한 민족 배경으로부터의 환자에서 rs3803662 대립인자 T에 대한 발견의 일반성을 조사하기 위해, 본 발명자들은 다민족 코호트 연구(Multiethnic Cohort study, MEC)로부터의 유방암 환자 및 대조군의 표본에서 연관에 대해 상기 SNP를 테스트하였다. MEC는 하와이 및 로스엔젤레스로부터의 215,000 명 이상의 남성 및 여성(캘리포니아의 다른 지역으로부터의 추가적인 아프리카계 미국인 포함)으로 구성되었고 다른 문헌에 상세하게 설명되었다[Kolonel, et al., (2000), Am J Epidemiol, 151, 346-57]. 상기 코호트는 주로 식습관, 인구통계적 인자, 개인적 거동(personal behavior), 과거의 병력(history of prior medical conditions), 일반적인 암에 대한 가족력, 및 여성의 경우, 임신 기록(reproductive history) 및 외래 호르몬 사용에 관한 상세한 정보를 묻는 26-페이지 자가-보고형 설문지(self-administered questionnaire)를 작성하는 것에 의해 1993년과 1996년 사이에 본 연구에 참여했던 아프리카계 미국인, 하와이 원주민, 일본계 미국인, 라틴계, 및 유럽계 미국인으로 구성되었다. 참가자들은 참여(enrolment) 당시 45세 내지 75세의 연령이었다. MEC에서 우발적 암(incident cancer)은 하와이 및 로스앤젤레스 카운티를 포함하는 집단-기반 암 SEER(Surveillance, Epidemiology, and End Results) 등록부 및 캘리포니아 전 지역을 포함하는 캘리포니아 주 암 등록부(California State Cancer Registry)에 대한 코호트 연결(cohort linkage)에 의해 확인되었다. 1994년부터 시작하여, 상기 코호트에서 유전적 분석을 위한 대조군 풀로 작용할 수 있도록 우발적 유방암 케이스 및 MEC 참가자들의 랜덤 표본에서 혈액 시료를 채취하였다. 네스티드 유방암 케이스-대조군 연구(nested breast cancer case-control study)에서 적격(eligible) 케이스들은 MEC 등록 후부터 2002년 12월 31일까지 우발적 침윤성 암으로 진단받은 여성들로 구성되었다. 대조군은 상기 코호트로의 참가 전 및 2002년 12월 31일까지 유방암으로 진단되지 않은, 유방암을 갖지 않는 참가자들이었다. 대조군은 (5-년 간격으로) 인종/민족 및 연령에 기반하여 케이스에 빈도 조화(frequency match)시켰다. 상기 연구는 서던 캘리포니아 대학교 및 하와이 대학교에서 연구기관 감독 위원회(Institutional Review Board)에 의해 허가되었다.
본 발명자들은 MEC로부터의 유럽계 미국인, 라틴계 및 아프리카계 미국인에서 rs3803662와 연관된 위험도를 조사하였다. rs13387042 SNP와 다른 SNP 간의 상관관계가 상이한 민족에서 다를 수 있기 때문에, 본 발명자들은 이 표본들에서 테스트하기 위해 일군의 SNP를 선택하였다. HapMap 프로젝트 데이터(release 20)로부터 유래된 유럽계 미국인 및 요루바(Yoruba)(아프리카인)에 대한 r2 및 D' 값이 표 23에 표시된다. 이 SNP들에 대해 Centaurus 분석법을 생성하고 MEC 표본에서 유전형분석을 수행하였다. SNP 간의 결과를 더 잘 비교할 수 있도록 하기 위해, 본 발명자들은 일배체형 분석에 의해 결실된 유전형을 고려하여, 일반화된 가능성 비 테스트(generalized likelihood ratio test)를 이용하였다. 이것은 상이한 SNP에 대한 케이스 및 대조군의 수를 동일하게 하는 효과를 가져서, 그들 간의 비교를 보다 용이하게 하였다. 결과가 표 24에 표시된다. 먼저, rs3803662 대립인자 T로부터의 위험도가 유럽계 미국인에서 유의성있게 재현된다는 것이 명백하다. 관련된 SNP들 중 두개, rs4784227 대립인자 T 및 rs17271951 대립인자 C는 유럽계 미국인에서 rs3803662 대립인자 T보다 명목적으로 더 높은 상대적 위험도 및 더 낮은 P-값을 보였다. 이는 최초에 확인된 SNP에 관련된 것이 더 높은 상대적 위험도를 가질 수 있고 따라서 탁월한 질병 위험도 마커를 제공한다는 개념을 예시한다.
rs3803662 대립인자 T 신호는 또한 라틴계 미국인(latina)에서 유의성있게 재현된다. 마커 rs3803662의 T 대립인자는 아프리카계 미국인에서 유의성있게 재현되지 않았고, 실제로, 상기 T-대립인자는 아프리카계 미국인 표본에서 보호성이었다. 이는 rs3803662 대립인자 T와 추정적 발병성 돌연변이(putative pathogenic mutation) 간의 LD 관계가 아프리카계 미국인에서 상당히 상이하다는 것을 시사한다. 본 발명자들은 3개의 관련된 SNP 대립인자, rs12922061 대립인자 T, rs4784227 대립인자 T, 및 rs17271951 대립인자 C가 유럽인에서 rs3803662 대립인자 T와 강한 상관관계를 가지나, 이 상관관계는 요루바 아프리카인에서는 유지되지 않는다는 것에 주목했다(표 24). 그러나, rs3803662 대립인자 T와 달리, 관련된 SNP 대립인자, rs12922061 대립인자 T, rs4784227 대립인자 T, 및 rs17271951 대립인자 C는 모두 유방암에 대해 명목적으로 증가된 상대적 위험도를 보이고, 이들 중 2개는 일측 수준(1-sided level)에서 통계적 유의성을 달성했다(표 24). 이것은 관련된 SNP의 세트를 이용하는 것은 다양한 민족 그룹에서 사용하기에 적합한 위험 마커들을 제공할 수 있다는 것을 보여준다.
rs13387042 대립인자 A 및 rs3803662 대립인자 T는 에스트로겐 수용체 양성 유방암에 대한 증가된 위험도를 부여한다:
본 연구에서 환자들의 의료 기록은 그들이 이용가능한 경우 검토하였다. 통합된 표본 세트를 이용하여, 본 발명자들은 rs13387042 대립인자 A 및 rs3803662 대립인자 T, 진단시 연령(age at diagnosis), 에스트로겐 수용체(ER) 및 프로게스 테론 수용체(PR) 상태 간의 연관에 대해 조사하였다. 어느 변이도 진단시 연령과 연관을 보이지 않았다. rs13387042 대립인자 A 및 rs3803662 대립인자 T를 포함하는 유의성있는 유방암 위험도는 명백하게 ER 양성 종양으로 진단된 환자들에 한정되었고 ER 양성 종양과 ER 음성 종양에 대한 OR의 차이는 유의성이 있었다(표 24). 마찬가지로, PR 양성 종양으로 진단된 환자들에서 우선적으로 유방암 위험도에 대한 경향이 있었으나, PR 양성 OR과 PR 음성 OR 간의 차이는 유의성이 없었다. 이는 ER 양성 종양 및 ER 음성 종양이 다소 상이한 유전적 병인을 가질 수 있다는 것을 시사한다.
Figure 112009065103457-PCT00002
Figure 112009065103457-PCT00003
Figure 112009065103457-PCT00004
Figure 112009065103457-PCT00005
Figure 112009065103457-PCT00006
Figure 112009065103457-PCT00007
Figure 112009065103457-PCT00008
Figure 112009065103457-PCT00009
Figure 112009065103457-PCT00010
Figure 112009065103457-PCT00011
Figure 112009065103457-PCT00012
Figure 112009065103457-PCT00013
Figure 112009065103457-PCT00014
Figure 112009065103457-PCT00015
Figure 112009065103457-PCT00016
Figure 112009065103457-PCT00017
Figure 112009065103457-PCT00018
Figure 112009065103457-PCT00019
Figure 112009065103457-PCT00020
Figure 112009065103457-PCT00021
Figure 112009065103457-PCT00022
Figure 112009065103457-PCT00023
Figure 112009065103457-PCT00025
Figure 112009065103457-PCT00026
Figure 112009065103457-PCT00027
Figure 112009065103457-PCT00028
Figure 112009065103457-PCT00029
Figure 112009065103457-PCT00030
Figure 112009065103457-PCT00031
Figure 112009065103457-PCT00032
Figure 112009065103457-PCT00033
Figure 112009065103457-PCT00034
Figure 112009065103457-PCT00035
Figure 112009065103457-PCT00036
Figure 112009065103457-PCT00037
Figure 112009065103457-PCT00038
Figure 112009065103457-PCT00039
Figure 112009065103457-PCT00040
Figure 112009065103457-PCT00041
Figure 112009065103457-PCT00042
Figure 112009065103457-PCT00043
Figure 112009065103457-PCT00044
Figure 112009065103457-PCT00045
Figure 112009065103457-PCT00046
Figure 112009065103457-PCT00047
Figure 112009065103457-PCT00048
Figure 112009065103457-PCT00049
Figure 112009065103457-PCT00050
Figure 112009065103457-PCT00051
Figure 112009065103457-PCT00052
Figure 112009065103457-PCT00053
Figure 112009065103457-PCT00054
Figure 112009065103457-PCT00055
Figure 112009065103457-PCT00056
Figure 112009065103457-PCT00057
Figure 112009065103457-PCT00058
Figure 112009065103457-PCT00059
Figure 112009065103457-PCT00060
Figure 112009065103457-PCT00061
SEQUENCE LISTING <110> deCODE Genetics ehf <120> GENETIC VARIANTS ON CHR2 AND CHR16 AS MARKERS FOR USE IN BREAST CANCER RISK ASSESSMENT, DIAGNOSIS, PROGNOSIS AND TREATMENT <130> 2506-PC00 <160> 6 <170> PatentIn version 3.5 <210> 1 <211> 600 <212> DNA <213> Homo sapiens <400> 1 caggataaga ttatttctga ggctgcttcc atcagtggtt ctgtgagctg gcccatgtat 60 tcagccagtc agtaggccat caagcatgca tctacgcaag gcactagaag ggttacatac 120 aatgggaaac tgaggcccag aaggaggaaa gatgaagtgc ccaaagttaa ggagataaaa 180 gcagaagtgc aggtaagaga aggagtattc atattactgc aggaatccaa attctacaag 240 aacatacgct tgttctttaa agggagccct cgctttaagc attatttgcc gatcaatacc 300 mattaataat tacaggacat gggcaaatat tctagcaaag gtcctgaggt cttcctagat 360 gtgcccaaaa taacaaggac tccccccgca ggtggcacca aaagtcggag gatgtgttgg 420 aagctgacct tccccacctg tccctgcctc acccacagtc acccacccct ctaggatgta 480 atggtgaatc attcaacaca tgggccacct tgggaagtcg cttaacctct ctcccttttc 540 acgttataaa atgggcatag tcattacaca aatgcataaa tcaacctcaa ttttctcatc 600 <210> 2 <211> 600 <212> DNA <213> Homo sapiens <400> 2 ctgacatagc cgcctgtgca ggtttttggg accaggtctg ccatctgtat tcccaggctg 60 ggctggagca cctgaggcta ctatggttac agaaaggaac ctggcatccg aaggtatagg 120 ctcaaatccc agctctcatg attgctagct ttgaggtttc aggttcattt cttaagtgct 180 ctgagctttg gtgccctcct cttcaaaatg ggaatgagga gcatgtctag ctccctgttt 240 tgttgcagtg aatagctaca tgaagaacag ctaaaccaga acagaaagaa ggcaaatgga 300 rgctacagaa accaaggatt tccttgttga atcgaatctt ccttcaatct tccttcacca 360 cactagtgga tctccctgtg ggagggatgt tgagagtgct ccgtgttttt tttgtttttt 420 tttttttttt ttttgtgatg gagtctcact ctgtcaccca gactggaatg cagtggtgcg 480 atctcggctc actgcaacct ctgcctccca ggttcaagtg attctcctgc ctcagcttcc 540 caagtagcca ggactacagg catatgccat cacacccagc taatttttgt atttttagta 600 <210> 3 <211> 600 <212> DNA <213> Homo sapiens <400> 3 gctagtcctt ggctgttctg tgatcaaatg caattgtttc ccatttctta agaaacagaa 60 tctttattag actcagttct tttcttggtt atttttacaa ttttattgtt ctatggttat 120 taaaaaataa catgtcatat aaattaagcc tagaaacatg gatgtttatc aaagaaagga 180 ttgtcatcca aagcaccaac tatgagagat atctatgtgc aatggtatat agatctgtca 240 tagaagggtt taattatatc tgcctaatga ttttctctcc ttaatgcctc tatagctgtc 300 ycttagcgaa gaataaaact gtggactgac ccccacccat ttgcgaagaa agtactgggt 360 cttcagcttt cattgttcag ccggtggtct ttgtggacaa caccaggggc ccctcctgct 420 gaagactgtc tggacttcct gattttcact cctgtataaa ccccctcccc cattactacc 480 tttgtctcct tggggaaaaa aaatgttttt cacttaagca aaataataac tacccagtat 540 ttgtttctgg agtgaaattg taaacttcat tgtacattct tcctggcttt gatgcttatc 600 <210> 4 <211> 94080 <212> DNA <213> Homo sapiens <400> 4 ggttgacaca aacacgggaa gattctgcag gaaacacaag gcagccacgg cctctgtccc 60 tgagaggagc agtgagggag ccgcagggct gggctgcggc gtgacactag ggacgtgggg 120 ggaatgcaag tgggtccaga cctgggggcc accagtgcag gagcaagggc aggccggcca 180 tcagagctgg gcggggaggg gggcgctgag cttggcgtgg gagtttcccc aacggactgt 240 gtcttccagg gaccctcgcc cctcatgccc ctctgcgtcc tgaagggagg aggcaccacc 300 cctctgtggc atctgctttt tagggctgac gatggaacaa gctcatggac aggagtgaag 360 cccctggcac atagcaggtg ccacagaagg gtggtgaagt ctgccctaga tcagagatca 420 ttcagggggt ctgttaactt ggatgaagaa gaaatacact cttatcacta acatcaggaa 480 ggtaagcaag gaaccacaca tagaattgac aataagtgtg actttgccac caagaagaat 540 cacaaagttt tattttattt tattttattt tattttactt taagttctgg gatacatgtg 600 cagaatgtgc aggtttgtta cataggtata cttgtgccat ggtggtttgc tgcacccatc 660 aacccgttat ctaggtttta agccccgcac gcattaggta tttgtcctaa tgctctcctt 720 cccctcgctc cccaccccca aacaggcccc ggtgtgtgat gttcccctcc ctgtgtccat 780 gtgttctcat tgttcaactc ccacttatga gtgagaacat gtggtgttta gttttctgtt 840 cctgagaatc atagagtttt catagcccag tacaataatc acagatacat gacatagagt 900 tgtgtgacat gtagacccca atagtccggt taatgggatg ctttagttaa aaagtacata 960 gattactgta ttataagttt atgttttagg atattttgat gattactttt tagaaatagt 1020 ttcctttgta acctttattt tacttaatgc atatgaaaga atcattcaga ggaggggtcc 1080 atggcttcac caagatgaaa caggtcattg gcatgaaaaa ggttaaaacg ctgtgccctg 1140 gaaccaggag tttatgatcc aggcctgcag catgctgtat gaccttggcc acataacttc 1200 attgtgcctc agttgcctca actataaaat ggggataata aacctgtgac atatgatgct 1260 tggggggtta aatgtgacaa aagtcttagc actctgtgtg ccatacagtg agggccccag 1320 catgggcatt gatgcaccgt cttgattcct cctgcctttc ccaggtacag ggagcttccc 1380 cagcctgcct gcatctgaga agattccacc agagaaacag aaccaatagg agacatatat 1440 taagagttgt gttgcggcca ggcctggtgg cccatgcctg taatcccttt gggattacac 1500 tttgggatta cagcactttg ggaggccaaa gcgggcctat cacctgagtt caggagttcg 1560 agaccagcct gaccaacgtg gagaaacccc gtccctacta aaaatacaaa attagccagg 1620 cgtggtggca ggcatctgta atcccagcta ctcgggaggc tgaggcagga gaatcacttg 1680 aacttgggag gcggaggttg cagtgagctg agatggtgcc attgcactcc agtctgggca 1740 acaagagcaa aactccatct caaaaaaaaa aaagagagag atgtgttgca agaaatcggc 1800 ttacgtgacc gtgggggctg gatccatagc gcaggctctc aggaggggca gtccagaact 1860 ctcaggctga tgctgcaggc cacaggtggg atttcttctc aagaaagcct cagctctgct 1920 cctaaggcct ttcaactgat tgactcatgc ccactcagat tattgagggc tatctccttt 1980 atttaaggtt aaccggccca gtgcagtggc tcacgcctat aatcccagta ttttggcagg 2040 aagattgctt gaggccagga gtttgagaca ggactggaca acagagcaag agcctcatct 2100 ctacaaaaca taaaaaaatt agcccggtgt ggtggcacac tcctatactc ctagctactc 2160 tggaggccaa gccgggagga tcacttgagc ccaaaagttc aaggctatac tcctagctac 2220 tctggaggcc aagcggggag gatcacttga gcccaaaagt tcaaggctgc agtcagctat 2280 gatcaagcca cttatactcc agcccagaaa acagagtgag accctgtctc taaaacaaca 2340 acaacaaaaa accccaacca attgtagata tcaactacat tgctgtggct tgaatgtctc 2400 ctccaaaact caatctgaaa cttaatccct aatttaatag tattggcagg tgacagggcc 2460 tttcagaggt agttgggtca tgtgggcatt catggattaa tgggttaata gattaatggg 2520 ttatcatggg agtagattag ctatcacaag agtgagtctg ttacaaaaat ccagcttggc 2580 tctctcttgt gagcccctcc ccatacgatg ccctgcactg accattagca agaaagcctt 2640 catcagatgg accccctcaa ccttggacat ctcaatcttc agaactctaa gaaataaatt 2700 tcttttcttt ataaattgcc cagtctctgg tattcagtta tagcaacaga aaatggacta 2760 agatacacat ctacgagata cctccacagc aactcctaga ttagtgttga tggaataact 2820 ggggattgta gcctagccaa gtcgacacct aagaccggcc ctcatgtcac ccaaggacaa 2880 gacagcgagg tcctgaagag tttcatgaag aggaggggaa ggagagagtg gggagctcaa 2940 tgtggacccc tcaattaatt tcccaagtgc tcaatgaggc ctgccccacc tctcatccag 3000 ctccttggcc aggccctgcc cccactcacc tctcttatgt gggacacgtg agcccctcca 3060 gtgtgccagg agcacatggg tacaggcaca catagagaat gccgtgtcca caggaaaccc 3120 agtgagcctg aagggccttg gcgtgccatt tacaggtcac tcacttgggc caggcctcac 3180 tagggatgcc agggtgaaca agacgtggcc agtgctcttg aagggctccc acctggtgga 3240 ggtagcagac aagtaagggg acaaaggccc ctcagaagta cacatctggt gggccgggcg 3300 cggtggctca catctgtaat cccagcactt tgggaggccg aagcaggcat cacttgaggt 3360 caggagttcg tgaccagcct ggccaacagg tgaaacccag tctctactaa aaatacaaaa 3420 attagccaga cgtggtggcg cgtggctgta atcccagcta ctcgggaagc tgaggcagga 3480 gaatcacttg aacccgggag gcggaatttg cagtgagccg agatcacgcc attgcactcc 3540 agcctggaca cagagcgaga ctccatctca aaaaactaaa aaaataaata ataaaaagta 3600 caaattaggt gtggttatcg cctggagagc caggagcatc cttgggaggg gacttgggga 3660 ggggtccgct gggctgctct agcccactct gggccagaat cgtgattcta attgcaggta 3720 ggctttaccc tatcaaagcc ccctgggctg gggactctgt gaagaagcaa gatgtgcttg 3780 aaacctccct ctctgctgaa aaatctagac aagctcctga ccggctgcat tgctgcttca 3840 gcccctcctc agggaagcgg gaggccctgg gtctctacgg gtgctctgtg aaagactgca 3900 gaggctggtg gggctgcatt cctgtctgtc tgcctaggac agtgcctact gacttctgac 3960 tgctgcccca tggtccaggg ctccaggtac accactgcaa tgtcactttg tgcttggggt 4020 tccaactaga caaaagcccc acgttgcaca gcccttgagc cgtcccgggt agcatgcccc 4080 ctggtggccg tgggcagtta ttaccgttaa tcctttcttg cccagatgcc tctagcgtag 4140 gccacagcag ccggccgggt tcgttgtgtc tggaaagacc agagaagggt tcccggagaa 4200 agaggccgtc tgatcggagt tttatgaacc agaggataaa gaaaggaagg gatttctggg 4260 cctcagaaaa ccacatgcca acgcatgggg gtattaagga taggggctct tgaacgccca 4320 ggctggtaaa atctagaacg gcagagggag gaggggtaat ttttctggtt ggtagaaata 4380 aagtggggat gaggaagagc acgaaagtct gtcggcaaac ctgaaagtgg gagcgagctt 4440 ttgtcaaatc cagggtcaac ctgagctctc attaattggg aaactggaga gtcagatcct 4500 ctaaagaaag tggaaatatt tgttctaaag aacccctgcc aggtccccgt ttacgtgact 4560 cataaagagg ccttcaggca gaaaggatcc cagtgcacca gtaacagaag ggctccagga 4620 ccagagggaa tggacaggga accaccaccc acaccaagca caggcccatt gtcggcatga 4680 ggagcctcgc ccctgcagat cacctcccag aggggagcgg atcagagatt aaattccaca 4740 cctttctaca aaatcatagc agtttgaaag tgccaagggg agtaggtgag gaggtttcga 4800 ggcatgtatg cagccgtttg gagacaccag ccatgtcgcc tgagttttct gatgtaatcc 4860 tcataacaac cattccagat ttaagtgatt agtcctgttt tacagatggg gaaactgaag 4920 ctcagagagg ttaagcaact tccccaaggt catacagtag ccaagtagca taagtggtat 4980 tcgaacccag ttctatttgg agccttcaca ggctttttgc tgcattccac aagagtctgt 5040 atattcagaa gcaagtcttc cacagccatc ataagtcatc ctcacagccg gctggcaggg 5100 agggaacatt gccactgtag ctgggatcat agatatcgtg gtctccattt gacggataag 5160 actgaggtct ggaagagagt cagtcagtct gtgtgataag cctgaaccac cctctccttc 5220 agttcctccc ctaacccaac atcctccggg tctggaagga cagtgtcttg agcaacttct 5280 tgcagctata cttctccagc taatagtcta gaaaaccgag cctggtcccg agtctcctcc 5340 tcggggtacg agccgagggc actgatgggg gtcaggaggt gctggctaaa agacggtggt 5400 gcaggtgccc ctggctttaa gcgcgcccag gttataaaaa gcttggttcc catgctggcc 5460 ctaattctcc atgcactgag taccttaggt cccttctctg ggtctgttgc tcccctgtaa 5520 aacaaggggg tgggagaaat gaccttcaag ctcaaacacc atatgtccac ctgggttggt 5580 atagcagatt gcattagttt gttaggactg ttttaacaaa tgccacagac tgagtggctt 5640 aaacaacaga catttattct ctcacagctc tggaggctgg aagtctgaga tcaaggcagt 5700 ggctggcagg gttgtttctc ctgaggcctc tctccttgta gccacccctc ttctccctgt 5760 gtcttcacat ggttgtccct gtgtgtgtgt gtctgtgtcc taatcacctc ttcttataag 5820 gacaccagtc acagaggatt accggccacc cataggactt cattttacct taattatctc 5880 tttaaagtct ccatctccaa attagtcaca ttctgaggta ctgggagtga ggacttaaac 5940 atacgaattt ggaggatagg acacaattca gcctataaca cagatagaag acactgctca 6000 ttttaaaaaa gaagtagcag gctgggcgca gtggcccata cctgtaatcg cagcactttg 6060 ggaggccgag gcgggaggat cacctgaggt caggagttcg agaccagcct ggccaacatg 6120 gtgaaacccc gcgtctacta aaaatacaaa aattagccga gcatggtggc atgctcctgt 6180 aatcccagct actcgggagg ctgaggcagg agaatcactt gaacctggga ggtggaggtt 6240 gcagtgagct gagatcgcac tgctgcactc cagcctgggt gacagagcaa gactccgtct 6300 caaaaaaaaa aaaaaaaaaa gaagtagcag tcccagccct ttaacagcga acttctgata 6360 catttaaaac agaatctgat tctcactttt tcttccaggc ccacttcaat gccactaatg 6420 aggcctatct gtctgcaatc tgatattaga ggccaaaaat aatctttcta tttgccactt 6480 actgggcacc aatgtcctac ctgacacatg ctggctcagg tgggggagga ggtacggtcc 6540 ctggccctag gaacgctcca tcttagaaag agacagaatg tgctggggtc agagtaaaaa 6600 gtgcatgggc ttcagcagca gatcccagca tggctaccac cagctggggg accttgggca 6660 agagccccct gtgagcctca gttttctcac ctggtcaatg ggactcacac tactgcggca 6720 cacattgtgc gcccacattg tctcggtgca caggggccac ccttcaaact gccagggtct 6780 gcacctctgt gcccaaggtg cagaaagggc tggctgccag aacccactct gcattttgcc 6840 tctttgcacc cgaggctgga agagccctgg aatcactgac tcgctggagc atccattcac 6900 cagtggccat gggagctgat gcataaatat tccagcgctc tggtccttcg agagggacac 6960 tctgtgacat gcgttgctca cctgtgacat gcccctccca gcgtctcctg acctcccctc 7020 ccaaatgcac tacttgcact tgctctcatt cccattctgc ttgctcacag gctggatcac 7080 acaagaccac acatgcgtgt acactcgtgc ctgcccatgg caagtattca aaaactgctt 7140 gctattttgt gggtggtggt gaagggaata gtatatttat aatacttcag gccaggaata 7200 tacatctcct ctgttttctg acccttccag gagtagggtg gattccaccc gcttttttgt 7260 aagccctcag aagtgctcca ggctctctgc acacccccag atctcccctg agcttcagcc 7320 ctcacccagc tccccagtca atttggcccc tgtgacgatg ttggtggggg gggcgggggc 7380 aggggaaaca gctggccctg gctcctgaca ggcactctgt tcccatctca gctgcctggc 7440 cctgcctgtg gcatcctcag agacccagtg gtgagtactt ccttggccct ttaggcccct 7500 ttccccaatc cagtagtgag acacggggag gggctggcag agacacaagt ctgccaccct 7560 ttcctggaca gccttctcct ctctggcagc aggaaaccac cccctactcc cactccagac 7620 ctacgctcac actccccgtc aaccccaagt gccactccag tctggggtcc ctccctgagc 7680 tttcataagc attgcaaatg cccaattcct tcattggctg gggagggcaa agcctaaatg 7740 ggcagtgggc tatagatggt ggccttccag gcactggcag caggacactt cagggcatca 7800 ttcaaatgca gaggggagag cattctgccc aagggcaggc ctatttgggg tgggcagggc 7860 agacttacaa tggagactac catacttacg tggctctctg caggccacgt gaccccttcc 7920 ctctgctcca tgtgcccagg attcaaactc aggctagtct gattcccaaa actgtgggcc 7980 tcagttttgg gaaaactgag aaaattgggc ctcagaatag ggatagggat ggagatggag 8040 atggaagaaa ataaaccagg ccctctgcct gatcccctcc ctactttggc tctggggttg 8100 ggagatgctg cagaggcttc atccactctc tgccccgacc ccctaactcc ctctcctgct 8160 ctgtccactg ggctggaccc tgtctgctgg gcctatcagg gctccccgtg tgtcctccac 8220 cagccagcaa tggccagaga gcccagctgg ccccagccta tcccctgccc accctgggcc 8280 ctgctcagag gacaaggctg aactgattct gtcaggaagg gttagtcttg tctcaggcct 8340 ggctgaatgc aaaaggacga gacaaatgca tgtggacagc ctcgatccgg agtgctctgt 8400 caaacatgct ggccacctct ccgggaagat cactcagact ccttgcatcc catcttggga 8460 aggctggcct gaggctccag agagatgttg ggagatgcca ggtgcctgca agccaagggc 8520 cctccgggga agggtgtcag gacccgctgc ttcttgcctc ttgcagagag ggcaacagct 8580 ggctccttct cctgccccag gtgaagactg atcagatact gattccagga tgaatccagc 8640 aacattaggc cctgcctggt cccatggtag catctggctg ggcttttggc ctatagtcga 8700 gtagatagag ggagggctga taactaagtg actacaacag gacctccctg tgtaagggtt 8760 ctagcttatt tccacactct tctggcacag acaggttggc agggcagctg gtagcaggca 8820 cagcagatgg aatgtcagga atgaaatcca caagactcca agcccctccc agggtgagct 8880 tgccacaggc cacaccagga agctgagctc ctcacccaaa gcctgccagt gcctacgtgg 8940 cagtcattcc cttgtcaaca gacttcccac tggcttctct tgctccatta ttaaaagcaa 9000 gaaccaaaaa cttcactgag gggatagaat cccactaata agcatgtcca cgctttgggt 9060 catcttaggg gcacagaaaa tctgagtatc ccccatagca tcaggcagag cagatttctt 9120 gtcaattagc tcagttggtt ggaggctgca gccatgaaca tgctggcctc agggccctca 9180 caacacaggt gggttaggga atgaatgaaa gttcagctat tattcctgcc agagactcca 9240 ggcccaacct ggcctctaat gagctatgtg actttgggca ggcagaaaag tgtctctgct 9300 atggtttgaa ggcatccccc aaaggcctcc aatgcaacag tgttgagaag ggggaccttt 9360 aagaggtacg tgggtcacga gggctctgcc ctcacgaatg gatttgtcct catcgcagga 9420 gcgggctcat tatcatgaga gtgggttggt tataaaattg aatgtggccc cattccttct 9480 ctccctttcc cccatgtaag gccccaccag acatggccct ccagtggtgg agttcccaac 9540 ctccagaacc acgagacaaa tgaactgtta ttttttcata aatgactcag cctgcagtac 9600 tctgttacag catcacaaaa tatgctaaga cacccctgag actcatcggc cacctgtctg 9660 tcagctttgc cgcaaaaatg atttgggagc agctatagtc aactttcctc agactacctc 9720 ctgctggcac attacggcca cctgctgtgt gcctggtgtt tttctaggtt cttggaataa 9780 agtgaacagg ccgggtacgg tggctcacgc ctgtaatccc agcactttaa gaggctgagg 9840 tgggcagatc acctgaggtc aggagttcga gaccagcctg gccaacatgg tgaaaccccg 9900 tctctgctaa aaatacaaaa atgtgctggg catggtggca ggtgcctgta atcccagcta 9960 ctcgggaggc taaggcagga gaatcgcttg aatccgggag gcagaggttg cagtgaaccg 10020 aggtctcgtc agtatactcc agcctgggca ataagagcaa aactccaagt caaaaagaaa 10080 aaagaaaaaa gaaaaaaaaa acagaaagaa agaataaagt gaacaaagca ggcaaaaata 10140 cctgccccca gaaagatcac attcagtgga tgtgcccatg ttccttcctc ttcctaaagc 10200 actcacaaat atcaacattc ccctgaactc accactgaga gtcacttctc agcgtgacaa 10260 tgttgaccag tcttcacctg ctgtgtaaag caggcctgcc ctatagtgac cccccaaaca 10320 ggtgcagaag gcaggtccac catcagccca tggccagcac accagttaga tacctgctgt 10380 tgccaggcag ctgtctgcca gcccgtaggc actagagagc cttggggcct ttcctgagcc 10440 cttttaaaga agtgcttcct ttagacatgg actctcaggc ctgctcagag cggggagggt 10500 gctgctccgc cccaaggcct tccctccatc ctttcctctg gcaatcaccg tgatagcagc 10560 aacgcccagc ctgaggcctt gggtgctgct tccctcagga aaactggcca aagagtagac 10620 agcagatact ttctccatat tcccaccccc acaacacagg ccagcagcac agcagctgta 10680 gacaagattt cataaagaac tggaggacaa gaaaggggag attaaggagc cctaggctct 10740 agggcctggc tcacacaaga atggtcttcc tcctgccaac ttcttggcct ttacaaaggc 10800 cccacctgac ccagcccagc ctcctgggca ctggccaagt tccacaccaa gactaccaga 10860 ccccgccaag tccaggctca agagagaaag ccagaccctc tctccttcca cctacctgag 10920 agaggcctgt cctcaggtgt ctggctcaca gatgggggac ccaactggga gtcactccct 10980 tctggaagcc ccaggcccta taaacaggtc cccggcctca ctgctgggcc tcggcctgga 11040 gacagcggct cagtgcaaca caaccacgcc agagctgatc aggggaaacc cacgcagcag 11100 ttgagggggc tggggctttg cgggtgcagt gaggggactg cttcccttca gtggagttgc 11160 tgccgcaggt gaggggagga agatgaatct gaaggttcta acgtcagccc acaggctgaa 11220 gcgaaggctg gcctgaagtg ttccacctgg gcccccacct gagcggctga agagttctgt 11280 ttcctcaagg cccacagagc tcctcagagg gaagctttag tagctatttc cttaggaagg 11340 caagtatgtg tgcaacattt cctaataaaa tgcaaaggct gttggaggca ctccagcccc 11400 ctcatttagc tctgaggtgt aattaataca taaattaagc tcctgcagac tcacaaatgt 11460 ccaagaaaaa aaatgaaaaa tataattagt ttgcccatct gactccatct gtcagctctg 11520 agctcaatgc tcaacgtagc aaatcctgag ggctttggtc tcgcattggc tgggcccggc 11580 gctgctcctg ccctgctcca gggaagtggg ccctccgcag cagctgccca gagcccgggc 11640 tctggactca gcctccaggg cagcaaggac tctggagtac acagactgca ggctgggagc 11700 cggggcactc ggcagagcag ccaggacctt ctctgtggcc ctgagcgctg gctaggggtg 11760 gcaagggcac cccggggaat ttgcatgtgc ctcttgctgc catgttccta tttgtgcaga 11820 cctggaagtg ggcggcagag ccctgaatgg gctaagactc gccctcctcc tccaacctgt 11880 cacctctgtc gcttactatc tgtaagaaga gaaaggctgc aaaggggaaa gggaactcga 11940 gaggaaggca ccgaggagaa gagaggagac aagagggcat tgggggagca aaggaggcca 12000 ctcacacagg aggattagaa ttaacaacta cccccacccc agctcccccc aacacacact 12060 tacacacgct tgtattacac cggggatctc acacacatcc ggtcactcag tattcagcac 12120 tctaggaaaa gaacaaacaa atggcttgtc tttcatcccc caaaattact tatgtcataa 12180 aattaatcca tatttgtttc agaaacattt aaataagaca taaggggtat ggcattaaac 12240 gtacccccaa atgcctcttc cccttacaag tggggatcat cattaaaaac ttttgtccca 12300 gaagtggtga ctcaggcctg taatcccagc acttagggag gctaaggtgg gaggatcact 12360 tgaggccagg aggtcaagac cagcctgggc aacactgtga ggtcctgtct ctaacagaaa 12420 aaagaacagg aaaatttaaa aggaggaatg aaaacaattg tttaaataat aatttggtgt 12480 gtattattta aagtacatta atatttggtg caatcgtttt tgaaagggag attgtactat 12540 acatgttgtt tggcaactta ggtgctcgct caggcaccag gccacacaca tcttgggcat 12600 tccacatctg ggttttgaaa gtaaaattat aataagaaaa taagcaaagg tcaaaatggg 12660 ttggaaaaaa attatttaca cagtgagttt tctactttat cataccaaga agatgacttc 12720 tctaattatt attatttttt tttaagatgg agtttcactc tgtcacccag gctggagtgc 12780 agtggcgcaa tctcagctca ctgcaacctc cacctcctgg gttcaagcga ttctcctgcc 12840 tcagccttcc aagtagctgg gatgacaggc tcccaccacc acatcaggct aatttttgta 12900 tttttagtag acatggggtt tcatcaggtt ggccagggtg gttgcgaact cctgacttca 12960 ggtgatccac ctgcctcggc ctcccagagt gctgggatta caggcgtgag ccaccgtgca 13020 cccggcccct aattattatt tacgtagaac aatatcaaag atatttttct tcctaactct 13080 atactccttg acaagaaaaa aaaagaaaag aaaggaagag cccgcgatat ataatggtac 13140 atttgaaaat gaagcatttg tatgtgcgct cacatgagta catatatatg tattacatcc 13200 atatgcatgt atgtgcatag actgtttcta gaagaattca caagaaactg gtaacatttg 13260 ttgcctctgg gaaacagatt ggcaactggt agaaggtgac tgacttcatt ataaacatat 13320 tttgtaatgt tttaattttc tgtcacatgc attattactt ttttccttag aaaggatttt 13380 ggttttgtct attttatcgg aagaggcaaa ttttaacaat aaaaacaaaa tgactgacat 13440 tcagccatag tcccacctct ctgaattact cagatctact gatttacatg tagattaaat 13500 gcaaatgagg gtggcactat ggttgattat ttagcagctc agcaatatga ccaatgccct 13560 gttcccttct acccttctgc tctgccccct cggcttgtag actttgtcct tgggcttcct 13620 aacctcattg ctacaagagt caggcacatg atcaaaacaa gacactgccc caaggtagga 13680 aagaagccac ctcttccttc ctatttttag gagaaaaatc tttcccccaa agccctcctg 13740 cagacttagc ccacatatcc cactggccat atttatttcc catgtctatg cctgagccca 13800 tctctggcaa gggaaaggga cccctttgga catcccaggg caagcaggcc tcctcagtgt 13860 tatcagacca actacccctc ttgaaaacaa tgactgtatt cttgtaacca cccaacctca 13920 atccagaaac aaaattcaca gatcacagaa tgtacctaca aaaacatatt tcaaaaaaga 13980 atcaaaacga agccctagct gtcacgtaaa ggagaaagta aaagtaattc aagacaaaag 14040 agtatgtttt ataataagca aaggctcagg cagcagactc tacagaacat aatgaagtgg 14100 tgagatgctt gcagctgcac acggaaatgc caaggttgcc ccatcataca tatagacaga 14160 tgcgggagat gactcaccca gcacgaggcc attgccactg gcggcatgat tttccaaaat 14220 ggcgaacaac tgttggtaaa gcttcaaaca aaacacagtg caacctcccc ttgatttata 14280 cagtaggata cttcctagga aatttagggc atatttaaaa acatgcaaaa agatacttgg 14340 agctcataca tcaaatggaa tgaagtttta ggcttaaaaa ggactttcag ctacataaaa 14400 gtctcatgag acatcagaaa gtcacgtggg acatggagcc atttcctctt agaaaggact 14460 gtctcacaca ttgtaaggta tttagccttc ctagaccccg tttattgaaa gatgatagca 14520 agggccctcc ccacaaaatg tcaaagcccc caccaatttc cagaacacac ttagggaatg 14580 gttctgtccc tttcgagaac tcctggctta ggccaacctg cctctcccag cccaggtgac 14640 ctcagagctg ggtggttgtc tgaacaacat tcaggttctt gcaggaagca tagaaggcga 14700 ttagaggttg gatagatagt caaccgtctg ttcatcacag aagcatttgc acatatttgt 14760 ctctagcttt gcctttgtat acatattttt aaatacaaat aaaatacgta tttaaaatat 14820 ggccaggtgt gttgactcat atctgcaatc ccagcacttt gagaggctga ggtgggagga 14880 tcaacttgag cacatgagtt tgacaccagc tgggcaacat agtgagatcc catctctata 14940 aaaaattagc caggtgtggt ggcatgtgcc tgtggtccca gctactcaag aggctgatgt 15000 gggaggatca cttgagccct ggaggttgag gctgcaggga gcactccagc ctgggcaaca 15060 gtgaaactgt ttcaaaaaaa aaaaaaaaaa aagacaaaca actgatttac cgaatgggca 15120 gaacttcatg gcacatactt ggctttcttt ttctttttcc cccatcactg tttttcagtg 15180 ctggctggtc agctctcctc tttcagccct tggatgacag ctggggctgt cccatagctt 15240 ttcagtcact ttgagctatg tcataactgt ggtcatattt tcaagcatga aaagtacaga 15300 tttgtctcaa tcaaaactca gtctcacaaa agccactttc ctccccagct cagtgcccac 15360 ccagtgggca ggaggagggg caggtctgtt ccttttctcc ctcgctgcca ccctcagtcc 15420 aagttcgggt ggggaagagt tgattagagg atggggcaaa gtcttagagg gccggacgtg 15480 ggtgatccat cacacatacc cattctatct tggcctctag ggtggatttt gaggagcccc 15540 ctccccatga tgatctctgc actccacaag gagttcctcg atgtgacggt gcactctcta 15600 gctggtcttc tgtggcatgc cccctctggt acccagtggt tcacccctcc caaccagcct 15660 ttccctgggg gacctctcct acccagcagg tgagtctcct gagtgggctt ctttcaagat 15720 acctgaaaac ccaactcctg ggaggttcac ttgctccaag gaaacttgta catctttgcc 15780 ttgcctaaga gtggaggagc agcttcccca caactgaccc tgtaatagaa aaaaacaagg 15840 tgttttgcct attctcacac acagaactcc caacaccaga tgtgtggagc atttcccaca 15900 taccaggcaa ttctcccttg gacaccagct gggtgtcctc taattcagtt cagttttgat 15960 cctatctacc tggagatagc atcagatccc acaggtcgat ggctcagtcc tgcgagactg 16020 cccctctaga gatgccaatc tcaagtgcag gttgtgacct gtgctttgaa ccattgacta 16080 tatattgggg ctccctcgac tccctcgttg ggtgagatta atctgctaga gcagctcata 16140 aaactcaggg aaatgctcta tttatgttta ctggtttatt aataaaagat gtaataaaga 16200 atacagataa gcaccagatg aggagataca tagggtaagg tctagagggc cagcagcttc 16260 tgtctctgtg gagttggagt gtaccaccct cccagcaagc agatgtgttc tccaacatgg 16320 aagttctctg aacctcatac ttagctgagg gatttttttt tttttttttt gagacagggt 16380 ctcactccgt cacccaggct ggagtgcagt ggtgccatct cggctcactg caacctccac 16440 ctcccgggta caagtgattc tcgtgcctca gcctcttgag tcgctgggat tacaggcgct 16500 tgccgccaca cccaactaat ttttgtattt ttggtagaga cagagtttca ccgtgttggc 16560 caggctggtc tcaaactcct gatgttaggt gatcccccca cctcggcctc ccaaagagct 16620 gggattacag atgtgtagct cagggatttt tatggagtct tcatcacata ggcatgattg 16680 attttcaagt ccatttccag cccctttctc ctctccagaa aatgggtcat ggggctgaaa 16740 gctccaagct tccaatcatg gcttggtctt tctgctgaca agcccccatc cagaagccca 16800 ccaagagttg cctcaataga acaaaagatc ctccttttac ccaggaagtt ccagggactt 16860 taggagctct gtgtcaggag ctagggtcaa aaaccagata ttagaacaaa agattctcct 16920 agcacctgta tctacaagga tattaggagt gctgtctcgg gaataaggac agagaccaaa 16980 cattggaaca aaagattatc ctgacacttc tatcacttag aaaatcacag ctgacccttc 17040 aacaatgcaa gggttaggag tgctgacaac tgcccaactc ctgcctcgca cacggttgaa 17100 aatttgtgta taacttttga ctcccccaaa gacttaacta caagcctact gttgactgga 17160 atccttatgg gtaacataaa cagtcaatta acagatatat cgtatatatt ttatatactg 17220 tattcttaca ataaagtaag ctagagaaaa gaaaacatta ttaagaaaat cataagagaa 17280 aatatattta tggtgctcta cggtatttat tgataccata ggtctgcacc atgtgtttac 17340 aacatgtatc atctgtctga aacgtcaggc aacctcagct gctgacctta gtctatggta 17400 catatcgagc aattcaactt gttcctgtga ggtcatgacc ttacttctta ggagctcttc 17460 cagcatcact agtggcactt cgtatgggtc ccatgatgct attcaaggtt tacagtattg 17520 cactaaccat gaaaataaat gagaactgag agagatcatg gttttcactg caatatgcaa 17580 tttactggag attgcaatag taaattgtaa attgctatat gcaatctact gctcacgtgg 17640 agatggtcag tatttcatag tgttttaagc agacactcgc aacacgagct caccgcaata 17700 gcaacaggag gtagctacaa aaatattaca gtagtacagt gcttactaca gtgaatttta 17760 tgtagttatg attgaatact tcatctttac atttgtttac atttccctca actacaaatg 17820 gtgccatgta tgatctgtgt tttttgcatg ttttcataaa ttttaacttt ttataataga 17880 tttgtgtaat tttatagtag taacttataa aatagactag tactcgcata tactttatgc 17940 attcatgaca tacctaactt tttgttgttc ttttttgata tttctgggct acacaagggc 18000 agtgacatga tcgtagcgca ctgtaacctg taactgtaag ttttttcaaa ctgtcacaaa 18060 tctcaaaaaa aaaatctaat atatttaatg aaaactatcc aagtataagt tgacccttgc 18120 agttcaaacc tgtgttgttc aagggtcaac cttacaagga ttttaggaac tctgctggga 18180 actggggaca gagagcaatg tgtatatttt gtgttatttc aggtgcgttt gctcatgcct 18240 ataatctcag cactttggga ggctgaaggg ggagaattgc ttgaggccag cagtttgaga 18300 ccagcttggg caacacagag agatcatgtc tctaccaaaa agatcccaaa aattcatatt 18360 ctccctcctc actttacctc acacgatgct ccaaatcagt ctcccacctt aagaattctc 18420 cataagcaaa agcccatctt gaatcccaca ctctcaggga cccttgccac actatccccc 18480 caattttctt ttctttcttt atttatttat ttatctttaa gacagagtct tgctctgtcg 18540 cccaagctgg agtgcagagg tgcgatctcg gctcagtgca acctccacct tctggattca 18600 agcaattctc ctgtctcagc ctcctgagta actgggacta caggtacatg ccaccacagc 18660 tggctaattt atatatatat atatttagta gagatggagt ctcaccatat tggtcagtct 18720 ggtcttgaac tcctgacctc agatgaccca cccgcctcag cctcccaaaa tgctgagatt 18780 acaggtgtga gcccccgtgc ccggcctccc aattttctca ttggccagtc actctggtgc 18840 cctggggact agcatccagc taagggatag atgccagctg ctctctcagt gctatggttt 18900 gaatgtttgt gcgccctcca caattcatgt tgaaaatccc cagcacaaca gtatcgaggg 18960 gtggggtcct taggaggtga tgaggacatg aggcctctgc agtcatgaat ggattagtgc 19020 cctatagaag ggctttagag gctgagtccc accttccatc cctccaccat gtgaggacac 19080 agcatttgtc ccctccagag gatacagcac aggtgccatc ttttaagcag tgagcagccc 19140 tcaccagaca ccaaacctgc cagtgccttg aacttggact tccgtcctct agaactgtga 19200 gaaataactt tccattattt ataaactacc caggctcaag tgttttgtta cagtggcaca 19260 gacgtactaa gacttgtggg tacccacaat tccataagcc attttctttg cttggcctgg 19320 gcatgacccc ctgtgctgtc cccgtgaaga aaaaggataa accaacaaac tctatgaatt 19380 aacttcagtg aatctcgtat gtttctaatc ttctgctttg gagctttggc gataaagaaa 19440 gattaggaaa ttagattaaa aaaaactaac attatcttaa atgacccata ttcccaatca 19500 atatctcttc ccttgaaact tggtgtgtat aaatccaata ctttttaatg tatttgtata 19560 tacatatgta aacatataca aatatataca tcatatatat gtatgtatct gcctaaataa 19620 ccacctggag ttagcaggtt ccatacctgc aggatgcaag cagggatggg cagaggcagg 19680 ctggtcagct tccaggtata tatatatata tatactcgga aaatacttgc tattagtttg 19740 gtggttttat tattaacgta aatgatgtct tgctgcacat attattctgc aagttggttt 19800 tcccacataa tgtgttggac atcttttagc cccatttcac actcttagcc tgccttttgc 19860 acaagagttg ctgtggcaac aagctgcccc caggtgtaac ctgacagctt cacttcagct 19920 gcaccaggta tgtctttctt tctgccccag gcatcacggt atacaggcaa atcttgaagt 19980 gccagggagt caaccctccc tggagcaatc cttgcccaat aggagaagga agccaatgaa 20040 taaatatgcc aggcctcgag gtcttaggcc ctcagtctaa ggcatagtct acatggtttc 20100 tctgggagtc ctcagttaaa ctgagccccg actgcccaca gcaatggcca gtgttaaaag 20160 aacaacctta accagattaa atttaacaca gtttaactga gcaaaggaca attcgtgact 20220 agggcagtct gctgagccag agtaggttta gacagactct ggtggaagat ttatggacag 20280 aaaaaggaaa gtgaagcaca gaaaacagaa gtgaggttca gaaacagctg aatgggtcgc 20340 agctcgtcgt ttgccttatt tgaacacagt ttgaaaagtt ggccaccttt gattggccaa 20400 aactcagtga ttgacacaag agtacgttac agcctgttta catttccctg taggctatag 20460 tttactatgc acagagaaac ctttaggctg aacttaaaat atgtaaggag gaagctttaa 20520 gctaaatttg atttttgttg ttgttgttgt tttgttttgt tttgtttttt gttttttgag 20580 atggagtttc actcttgttg cccaggctgg aatgcagtgg catgatctcg gctcactgca 20640 acctccgcct cccaggttca agtgattctc ctgcctcagc ctcccgagta gctgggatta 20700 caagtgtgca ccatcatgcc caattaattt ttgtatattt agtagagggg gtggtttcac 20760 catgttggcc aggctggtct ctaactcctg acctcaggtg atccatctgc ctcagcctcc 20820 caaagtgctg ggattacagg cgtgagccac cgcgccaggc cactaaacct cagcctccca 20880 aagtgctggg attacaggcg tgagccaccg caccaggcca ctaaacctca gcctcccaaa 20940 gtgctgggat tacaggcgtg agccactgcg ccaggccact aaatttaatt taacagtagc 21000 ttaacacatg gctggatggg cttttcctac ttccttgttt cattcttccc agtcctccaa 21060 ctcttgactc ctagatttat ggacccaaat aaatgactca aatgcagtcc ctttgtctca 21120 ggtttttggt ggaatccaag ctaaaacact aaataaaaaa tgttgttaaa aataagttta 21180 ttttggtcat tattgatcca cttggagtgg tcctcaaaat gggatctagg gaatcggtcc 21240 ctgaggctgg tttctgggaa tccacaaatg caaaactatt tccatagtca cactaaggag 21300 gtgtggcctt ttcaagaaat tacattaccc gtaaagtgca atagacggaa aacagaagcc 21360 catatgagaa tccagctatc ttctagcaag ccagaagtaa aagatgccag gtgcagtgga 21420 tcacatctat aatcccagca ctgaggattg cttgagcctg ggaatttgtg accagcctgg 21480 gcaccatagt gagaccccca tctctacaga taatttttaa aattagccag atgtggtggt 21540 gtgtgcccat gatcccaact actcgggagg ctaggaagga ggatcacctg agtcaggagg 21600 tcaaggctgc agtgagctgt gattgcacta ccacactcca gcctgaatga tagagtgaga 21660 ctctgtcaag aaagaaagaa agaaagaaag aaagaaagaa agaaagaaag aaagaaagaa 21720 agaaagaaag aaagaaagaa agaaggaagg aaggaaggaa ggaaggaagg aaggaaggaa 21780 ggaaggaagg aaggaaggaa agaaagaaaa agagatctgc aaaaaaatgt aaaacaatac 21840 cactcttctc actaaatttt tgtacttgga aaacatagtc atttttcaca aaaatgctat 21900 ttatattaac ataagtattt tgatgtgcaa tggacttatt tttgttattt tcacataaag 21960 attgtttaaa tttcttagtt ttaatttcta atactgtaaa tatcagtaga tataacccat 22020 gtaaacaaaa gctttttggg gtcctcaata attttcaaga gagaaaaaga ttgccaagac 22080 taaaaagttt gatagctatt aatagagttc attgctttta acttctgagt cccatgcata 22140 cttcattatt attattatta ttatttgtaa agacagggtc ttgctgtgtt gcccaggctg 22200 gtctcaaact cccaggctca agtgattctc ccatcttgga ttcccaaagt gctgggatta 22260 caggtatgag ccacagtgcc ctgcctcttc ttttaaaatc taattatgta tttgttatct 22320 cttacatttt tcctatcttt cttttttctg attatggccc aaaaggggaa gatttctgcc 22380 catgctcatg ttactatctt gaaattattt cttttcagac tctctagttc aggaaaaagg 22440 tcccctgcca catcaagtgg ccacggagga gcttgggcct gtgatgtccc ctcccttctg 22500 cctaaatgac cacctggagg cagcaggtta catacgtgga ggatgcaggc ggggatgggc 22560 agaggcagac tggtcagttt ccagggcaca cttcgggggc atacaaggga caaaaatgtg 22620 acggtggctc aggagggcac caaagatggc caaaagcttc tgcttttaag gtggcagtag 22680 gaggcagtta atggaaaaat agaaaccaat caagctacgt ctgccaccaa tgaaaatgaa 22740 ttattattta ttcaacaaaa tataagcttt ttaagaaaaa aaaaatagca aacgctcaac 22800 ccacttgcta agttccgttg gggtataatg gcatcagctc tgagtgccaa cttaccttgg 22860 caaggtggtt gcacgccctg aggatatgta caccttctcc gctgctggcc agctagatga 22920 ccttgagcaa gccacccacc cttctgaact tcgtctattt ggaaaataca gacattaata 22980 cctcatagtt tgtaatgagg ccttagagtc cacatattaa tcgttcagaa cacagctcaa 23040 aaaaatctaa aacttctggt ggggcacagt ggctcacacc tatgatccca gcactttggg 23100 agcctgaggt gggaggatag cttgagccta ggagtttgag accagcctgg acaagataga 23160 aaggccccat ctctatacaa aatataaaaa ttagccaggg gtggtggcac atgcctgtag 23220 tcccagctac tcaagagact aaggtaggag gatcgattga gcccaggagt ttgaggctgc 23280 agtgagctat gatcacacca ctgcactcca gcctgagtga cagagcaaga ccctgtcacc 23340 aagaaaaaaa agagagagag agagagagag aggtggcttc agtgggccga atagcagaga 23400 tccactggga gcattagcaa catcagggcc attgcttcag cagcctggaa ctaaagagga 23460 agaaagcaag aagcttcagg agattgaaca gtaggaagga aggaaggaag gaaggaagga 23520 aggaaggaag gaaggaagga aggaaggaag gaaggaaaga aggaaggaag ggagggaggg 23580 agggagggag ggagggaggg agggggagag ggaagcatat gagaaagcga ggctaggagt 23640 cttggagtca tccttgactc atctcttatt gtagtcattg ccagtactca cagctctcag 23700 acaacagtga ggaaacaagt tattttcaac atttcaggaa gctaaatgga aaccatgcac 23760 acaacaaggt ttcaaagtta attgaggatc aagattttct gctgttgtct ggtaagttat 23820 caattctgat ttttttaaac ctgattacag gcatccacaa aaaaatatgc aactaacatc 23880 atgtttaatg ttgaaagact aaatgctatc ctctgggatt gggagcaagg aaagggtatc 23940 cactctcatc actcctgtgt acttaaaaaa aaaaaagaaa taaaacatat gttcacacaa 24000 aagtctgtat gcaaatgttt atagtggctt tatttataat tcaccccaac tggaaacaac 24060 ctaacatgac cttcagctgg tgaatgaata agcaaaccat ggtacatcca tacaatgaat 24120 tactagacag caaaaaaaga aactggtgat ataggcaaca acctgatgaa tctcaaatgc 24180 actgtgctta gtgaaagaag ccaggcccaa aggactacat actgtatgat tcaatgttgt 24240 gacatactgg aaaaggtaaa attataggaa caaatcagta gttgtcaggg tctagtggct 24300 agggaaataa ttgactacaa aaggacagca agggggaatt ttggggggaa ttggaactgt 24360 tctgtatctc aaagatgggc atgattgatt acatgattat gccaaaattc attcatcaaa 24420 aatgtaaatt tttatgtatg tagatagatt ttattttaag tgaataaaag gaacaggcaa 24480 cttggaagca aaagagcagg agccgggcca ggcctgcggc tagattcaga aatagggtta 24540 gagggaatga tcgaggggaa tgacccaggc agccacagct ctggagagac ggctgcaggt 24600 ggacaaaaag caggtggaag cgcccagcag gaccttgacc agacaggcaa tgggaacata 24660 aaagacagca acagattgca acatcatgtc catgggctcc caaacctgat atctcagaat 24720 cacttccaga gctgattgga aagacagatt ccattgctaa gcatagtggc ctgcacctgt 24780 agttccagct actccagagg gcttgaaccc aggaggttga ggctgcagtg agctatgatc 24840 gcaccacagc gctccagact gggtgacaga atgagacaag tcagaatgaa agaaaggaag 24900 aaacaaagaa agagagaggg ggaaagaaag aaagaaagag agagagaaag aaagagagag 24960 agagaaagaa atagaggggg gaaagaaaga aagagagaaa gaaagagaga gaaagaaaga 25020 aaagaaagaa agaaagaaag agagagagag agaaagaaag aaagagagaa agaaagaaag 25080 agagagagaa agaaagaaag agagagagaa agaaaaggaa ggaaggaagg agaaagagca 25140 aaagagacag agggaaggaa ggaaggaagg aagggaggga gggagggagg gaagagggag 25200 agaaggtgag aaggagggag agagggaggg aagagggaga gaaggtgaga aggaaggagg 25260 gagggaggaa agaaggaagg aggggaggga ggaaggaagg aaggagggga gggaggaagg 25320 aaggaaggaa agaaggaaag aaggaaggaa ggagggaggg agggagggaa gaagggaaag 25380 aaagaaagga aggcagattt ctactgaggc tgcctcttta ttcccctctt tattcccctc 25440 agagaggtca tttaacctct ctgatctctg tggttgctgt agggactaaa ggacacaatc 25500 cttgggaaag tgcttggcac agaacttttc agcttgctat ggggagtgcc agccaccggc 25560 aacaggtgtg actgcagggg aaagccccgt gcaggtgaga gaaaggggcc agaatgagaa 25620 gggctttgta aggctgggac cactatgttg ggtctgctat ggagggggga gctcaggagt 25680 aggcagggca gatttgaaca tgggaagggg aaagctgctg ctggaagcag tggcccatgc 25740 ccaggtgcat ggagaagaga gcctggaagc ctctcttggt ccctctaggc tggcagaggc 25800 agggccccac attggcagtg gtgtgaacaa tttcccctca tcatggggct gctcatggct 25860 gtgaaacatg ggatggcact agatttggtc attaagtaaa taggataaag aaataattgg 25920 aaaatggatc cctgcctgga aggagtggaa ttgttcctgg ggctattgtt gtccggcatc 25980 ctgctttctg agtaatctcc cgagccaggc aaggaaggat gtcaggctta gggctgatga 26040 gaaacttaca cttgaaaaga gctcaaaatt acccatgaca atggaaaagc ctttgtatcc 26100 tgaacagaga gaggaaaaag actctgaatc ttctctgggg cgggaggaga gggaagatag 26160 gagggcagtc tcgagtcaca gaatgtcaaa cccaggaccc ctgtgtcttt ccaagttggg 26220 ggcactggcc agggaaggat cctggttctt ccggtgtctg ggatgatgag gctggtcctc 26280 aggcagtggg aggctggagg agggggaatg tgtgaagacc acatgctttc gcctgcaaga 26340 gcatccatcc atgtcttggt cactgcaatt tacatcctcc cattcaaccc tcagcacacc 26400 caccaaacca agctcctcct tgcaccttga tgggcagaaa gttggagtga tgattatcta 26460 agacagagcc ctgaggtgaa gaactggttt tctggtggag ggggtgaggg gaggatggag 26520 ggagctatcc cttccctgtc cccgcaaatc cttcagcaaa aaatccatag tgttgagtca 26580 aaatgccaat cagatgtgcc tctcagcagc tttaggcctg gactttgacc tcagccccaa 26640 cccccacccc cacaggcact cagcctaagc tcccattctg caccctcccc accctggttt 26700 gcaaaatgca tcaaagcaga agctgtgctt ttgcctttcc ttgtaacttc ttgtctgcaa 26760 gctgtattag atgcttgctg gtgtttaaaa cattttctat ttctctaaaa aaacaagttg 26820 gggcacccca aaatgaagcc tcccaagttc ggtcaaacat gcaagattgc cactcaattt 26880 ctccattcta gatgagaata gcgagtccca aaggctcgtg ggtgtctgcg gcgttgcact 26940 cacttaactc acttgttcaa aatacaggtg ccagggcctc ccccccgagc cacagaacct 27000 aaatccccag aatcaataac tttctttaaa taactagatg cttgatttaa agggaaaact 27060 ctatttaaag tgctgtatcc ctccttaaag acagattgtc ctacacgaag cagctacatg 27120 caaaatgaat tataggagtg tccttggttt tacaaaaaat gaaaagcatt gcaattctcc 27180 aaacatgata agaaaggaat ttttttgtta aactctgaga gcaaaacaat ttactagaag 27240 atacagatgc aagttgagta agcaagccaa taatggagaa aggaggaatt tttacagaag 27300 cagtttttcc tcaccccatc tgcatttcat gtctattaaa acacatgtca tgcaacgaaa 27360 aaatcaaagc agtatggttg ggtacacaca ttagtggctt tctgtatggt tagtgagatg 27420 aaaggacaga gaaagctatg ctggagtcat caggacatgg tagagccctc ttgtgagctg 27480 ctggaacaca tcagttgcac gtacgttctc ttgctggtgc agcccatccg gtcagaatct 27540 gtcgctcaca gtagctgtta ctgaatactg tctgcttctt agctgaaacc ttaccgtagg 27600 accatccggc cctgctcctt tcccgttaac atgtaagttg ttctcagacc ctaccttttc 27660 ccttggtttc tcatggaccg tggccaggac ttgggtgtcc acagccacac ccacaaaaga 27720 agtgcctgtt ccacccagga cctctgggtt aaatgacctc tctgaggcca cacaggatct 27780 acagcacaaa ctcagctcag attataaaac ttgcactctg aacgactgcc ctagccagcc 27840 ccaccaaggc catgaggggc ctcccagagc caagtgcgac ggcttctctt ggcctctgcc 27900 tccttgacct gcaagcaata tttgacccca cttcccttcc cgtctcacac cctcctgacc 27960 tcctcagctc tcctttctgg tctctcttcc cctctcctca cacctccaat tggatcttca 28020 gccttcctct cctctcactc cacatttttc agctggattc ctgtggtttt cactcttatc 28080 tctccctatg cctgccaaat ctgtgtgttc agctgtccga acttctcagc tctacatgtg 28140 tgtttgcaaa ggcttcacca tcctccccac acttcctcta ccagaggctg caccatgggt 28200 cactgggcct caatcttcct gcccactcag gtagaggctc tagggtcagc tttgcctcct 28260 gccggatgct gcactgctgg aatcagctgc ccacacttct ctccttttgt atggtgtcct 28320 cactgaaact tgggcggtgt cccttggagt gccttgagag ctgatgattg ccaccctctc 28380 taagagccta cagacccctg atggatatgt gtcctggagc ccctcacaca agcccagccc 28440 tctgtgttag ctagacagtc aagtgggtgc acacagggct agcaccaccg cggctcagaa 28500 gccaccttcc cctggaagcc actccttata tctgggcact ttctcctctg gactaccctt 28560 gcattgtgtt gttctatagg aggtgctgga gacagtgata agaacccatg gcccctgccc 28620 tcaagaagtt ctccagtttt attggtggga gcaaacaaat aaacagacag acatggagaa 28680 aatgcatcag gtcgggtttg catgcaggaa gttgtcactt gcgagggaat gacagaagca 28740 aaagtgggca gagggagaag ttaaaccaag gtgcagtccc accagaggcc tcagaagaac 28800 ccatgagaag ctctgaaact ggatgggctt tcagagttgt accaaatgga ggcaagaggg 28860 ctggcctcta cccctgtctc atccactaga atgtgggctg ctcccagaga gggtgtgagt 28920 gagttggggc aatacatctg ccttcagtgg aaagcaatta attcccagag agggttgcag 28980 ccattgctcc tccagcagcc agggatatga gtacctgtgt gcagatgggg acctgggcaa 29040 catgccacag catccatgac acggcacaga cagggatgcc caaagtgggg gctggccaag 29100 tcaaagatgg gggaagtaat gaggtgatca tcagatcttc ccatttcacc tgggcattga 29160 cctacatgta ggtgtttttc aagtggacaa tctttagttc cctctgctcc tcatcataca 29220 agtataccag caatggctaa tgttatcttt gcacttgcta catgcccagc tgtgtcttag 29280 ctcttcacat gcatagctta tttaatattc acaagaaccc tacgaattaa gtaatactgg 29340 ctaggcacag tgggtcctgc ctgtaatccc agcactttag aaggtcaagt ttggagaatt 29400 gctagagccc aggagttcaa gaccagcctg ggcaacatgg tgaaacctca tctctacaaa 29460 aaatacaaac aatttgctga gcatgatggc agacacctat agtacctgct actcaggacc 29520 ctgaggtggg aagatcactt aagcctggga ggcagaggct gcagtgagcc aggatcgcac 29580 cactgcactc cagcctggat aacagaatga gaccctgtct caaaataata aataaataag 29640 tgggccaggc acggtggctc ttgcctataa tcccagcact ttgggaggcc aaggcgggtg 29700 gatcacttga agtcgggagt tcaagaccag cctggccaac atagtgaaac cccatctcaa 29760 ctaaaaagac aaaaattagc cgggcatggt ggcacactcc tggaatccca actacttggg 29820 aggctgagac aggagaatca cttgaacctg ggaggcggag gttgcagtga gctgagatca 29880 tgccactgca ctccagcctg ggcaacagag caagactcca tctaaataaa taagtaaata 29940 aataaataaa tacataataa aactattgcc cctgtcttaa tgtaaatgga acatgaggct 30000 tagagaggta aaatgactca aggtcacaca gtaagtcaaa ggctgagcta tctctgccct 30060 ttcttcttcc tggtgtacac ctttcaccct gcaaagctca gtgcctacct tacttgctct 30120 atcaaacctt ccccatttcc ctcagaaaga ccaagtcccc ctcctggtct ctagagaaca 30180 agctgccctg gaccacacac cttggcttcc agccccttca ccatcctaga cgaggtcacc 30240 tagaaggttc catccagact gtgaatgtcc ctctttaact acagtctcca gtgaacccac 30300 aacctcaggg acatatgacc ttggagggtt aagtgggatt tcatttccct gactctggac 30360 ctgggctttg ctagcacacc tctcccacta tgatagcatt cgcttaaggc agctgagccc 30420 cgtcaggggc tccctgagct tgtggtcagc tcaagccatc acatctttct catctgtgct 30480 ctgggaagct gcctctgctt ggtctacaca gctgagacaa tggagcctgg gtgggctcag 30540 gggccccttc tgctgggaac ctgctttgaa acaacatatc cattgcattc actggaggag 30600 catcagaagt agacggtaat ttgtgttttt tcttcactgg atgccctagg gtgggttccc 30660 ccgaagcaga ccctgagatg agcatttatg caactgatcg aggatgtgcc caggagaacc 30720 ggataaggga ctcagagttg gagggaagat actaagaaaa tcatgctcca ggcaaagtcc 30780 cagcctcggc ttgatataaa ttacactgac ttgaggcaag ggagctgggc tctcacaccc 30840 cggctccagt cagccactgt ttcagggctg ccccaggagg acaccagctc ccagcactct 30900 tgccgtctgt gcatgcattc agcacactgg caccccctca aaggccagcc atttaagagg 30960 ggcacaggtg ctggggccac aaagcaccca gagcccagtg atgggtgcac aggcactgta 31020 aaagtgatat gagggccggg tgcagtggct catgcctgta atcctagcac tttgggaggc 31080 tgaggtgggc ggatcaccag gtcaggagat tgagaccatc ctggttaaca cggtgaaacc 31140 ctgtctctac taaaaataca ataaattagc tgggtgtggt ggcacacgcc tgtagtccca 31200 gctactcggg aggctgaggc aggagaatca cttgaaccca ggaggcagag gttgcaatga 31260 gctgagattg caccaccgca ctccagcctg ggcgacagag tgagactcac ctcaaaacaa 31320 aacaaaacaa aacaaaacaa aaaaagggat atgagaggat cagagcagcg tccccttgcc 31380 tcctgttacc aagaaggtac caagccgttg ttccctcagg ttgttcctca ttccatgttg 31440 ctcagccagc caaaatcaga agctgccaag ccacctgggg aaacaaggca cccaccgaag 31500 ctcttgtttt caaaagtttg agctaattaa agttgatgga gctggatttc ccctgaagga 31560 aaggatacca atgtttggga aggttaggat tcagagaaag aagcatttga agtcttcccc 31620 agggcctaga aattaaagtc tagagatttg ggagggtctc tagaagggca ggaacgcagg 31680 ccttcacctg aaccacttcc taagcagata gccaacctca tatgggagat tcctaaaggg 31740 gctgacatca aatcctgaga ctccatagtg aagaccccaa gctgcagcct cgcctggaag 31800 tataggaact taccagagta tccaatgaca ggagaagtcc agagggctct accctgaatg 31860 ttcaccatgg ataagtcctg ccccaaacct gacagataca gatttctcat ctatcttgac 31920 aaatgggaac ttgcagccag tttaatttgc ctcaaagaaa ataaaataat gtgacattcc 31980 ttcaccccca gcaagaacta atccctttct ccagtgctcc tacagcaggg aggacatttc 32040 cctgatattg atttttcatg actgtccttc ctccctagga gaccctgatc tccttaggga 32100 agaggtggtg ctttttaaac catttctgca gcccaggtgc ctatcaaggc cccagcatcc 32160 agtgggtctc aataaatgag acctatcata attaacattc ccctacctca gcacatgact 32220 catcaaagta ttacatgttg tttgcacttc tctaccccct cccccttccc atcacctcaa 32280 agctctccaa gcacacatga gccactgctc ataaatgttg catgaaagaa gggatggatg 32340 gatggatgga tggatggatg gatggatgga tggatggatg aatggatgga tggatagaca 32400 gacagatggc ctgatggatg aggctggtga gcaagtgaaa gagtgcttgt tttagaataa 32460 gctatttagg ccactgccat ttcctgttgg ctgagcaatg agcatgccac agggccaatc 32520 agctctaaat gcaaggcggt gcatggccag aggaaagttc ctgctgtctc tccttcaccc 32580 tgacagccat ggccccaagg gctaacagag gcccttgaga ccaattctgc catcaggaag 32640 gaaaagccct gccaaaatat ttgcattcag aaagttagca tttataacac agtcagagaa 32700 ctatgaaata tcttccaggc caagcactgg gcaatgccat gttggtgggt tctgatgagc 32760 cctgggaaac ttacttgcac cttttcagcc cctaacccta ttacacaggc ccctgcatgg 32820 aacaaatgcc ttcatcctca catgttgctg ttgggagtgt actttgatac agcctctact 32880 caagaacaat ttgggaatac ctatagacat tttactaaca aatgtgcacg ccatttgacc 32940 caggaattct actcctagga attaatcctg cacatatact cacgtatatg tacaaaatcc 33000 ccatatacaa tgtttgtaaa aagcacggtg tgaaagccat ctaactcttc atcagaggga 33060 ctgggtaaat aaaggatgtt ctgcagccat caaaaagaat gaaagttcta catgttctga 33120 tatggaacaa tccccaaaat atattgctaa gaaggaaaaa acaaggtgca gatcagtgtg 33180 catcatttac taccatttgt gatggtctta tatagcacag accagttctg gaaggatcca 33240 taagaatggg tcccaagggc taggtgcggt ggctcatgcc tgtaatccca gcactttggg 33300 aggccgtggc gggcagatca cctggggctg ggagattgag accagcctga tcaacatgga 33360 gatatctcat ctctactaaa aacacaaaat tagccaggcc tggtggcaca tgcttatagt 33420 cccagctact caggaggctg aggcaggaga attgcttgaa cctgggaggc ggaggttgca 33480 gtgagccagg atcgagccat tgcaccccag cctgggcaac aagagtgaaa ctcggtcaca 33540 aaaaaaaaaa aaagaagaat gggtcccagg agttgcctcc aaggaaggga ccatggggac 33600 tggggactga ggactgggag acaagagtag agaaatgctt ctcatattgc acaattttga 33660 atttttttgt atcatgtgta tgtattactt atgcttaatc aaatactcaa ttttaatatt 33720 aatttaaaaa aataataata tccccatcca cccagccagg tgccatagta tctgacattc 33780 tgccaatagg gagtcacaag gttgaagtct tagattgaac attgtttcaa catcatttct 33840 cactggaagc tctttataat gcaagcctta ctagaactgg tttaagtgtg atccaaccta 33900 tcagaccaac tttcctcttt cgggcataca aaaaacttca ctgggcattg actttgtcct 33960 acacacttgc ccaggcactg gagagacagg gagaacaggg ctgacctcac agtcagccag 34020 gtggacagct gcacgcacag agtggtggca gtgcacaggg agtggtggct ctgcacatgg 34080 actgtgggcc ctgcatggga ctagtggcac tgtgtacaga atgatggccc tgtacaagga 34140 gtggcagccc tgcataggga cctatggccc tgcacaggga gtcgtggcct tgcatgaggc 34200 cggtggcggc ctgcacggga ctgatggcac tgcacagaga gtgtggccct gcacaaggag 34260 tggtggccct gcatagggac ttatggccct gcacagggag ttgtggccct gcaaaaggag 34320 tggtggccct gcacagggac ggggcagata taccctgaca tttgaggaga ctgaggcaag 34380 gatataagtg ggagagagtt agaatttcga attctcagac tccttgggtt tcatgctgga 34440 acacgctggc atgagagaac caggccttgg cctgtggccc agctccctcc tcttcccacc 34500 tcctgccctg tcccacccca tcaggggctt gcacacacac acacacagac ccttcagccc 34560 tcagagccaa gctccttgca cacagactct ttccacagtc agcgccctta gctcctgtca 34620 agcctccagg tacacacaaa cctgcgtctc tgctcgcctg cacaaggaag gacccagcca 34680 agtgtcccaa tagggcctgg aagcgatctt gatgccatcc gggcagaaaa tcccaggtgg 34740 agtacagccg gataaagaca gcccaggttt caggttggca tgttcctccg gttctgcaga 34800 tccctcgggc cctggagaag gagatggcca gaggaggata gcaaggcctt ccaaagtgca 34860 gtcccgggtc acagcccacc tgcctggatc taaggacggt gtcgctgagg ctgtggcagt 34920 gggaggttcc aagacacggt gaaggcctga aggagggggt ggcccttgct aagacctgtg 34980 gccagctgac agggctcccc agcactctgt cagtaaggcc cttccaggaa gagggagtgg 35040 ctggacaaga ggctgtgtgt ggaaggcaaa ggggagaagg gagagagagg gctggtaacc 35100 caattcctct tcctgcctcc ctacacttca gcatcaccct gttcacgccc cttgcagatc 35160 tcccacagca ctccctgtgt acacctttgc tgctcaaagg gtctacacaa gccaagcaca 35220 gtggctcttg caaaggtggg aagatgtctt gaggccagga gtttgagacc accctaggca 35280 acatagtaag actctgtctc tattaaaaat aataataatt tttttttttt ttggagacag 35340 agtcttgctg tgttacccag gctggagtgc agtggcgtga tctcggctca ctgcaacctc 35400 cccttcccca gttcaagcta ttcccgtgcc tcagcctccc aagtagctgg gattaccggc 35460 acctcccatc acacccagct aatttttgta tttttagtgg agacagggtt tcaccatgtt 35520 gcccaggctg gtctccaact cctgacccca agcaattcgc ccacctcggc ctcccaaagt 35580 gctgggatta gaggcgtgag ccaccacaac cagccaataa taaaaatttt ttaaagggtg 35640 atctaagatc agcagcatgg cctcggaaat tggaaatgca gaccctctgg ccccacctca 35700 gaaccactga attagaattt gtatttggat aaaagtctca ggtgagttct gcaaactttg 35760 taatttgaga agcactggtc tacaccacac tccagcacct taacgcagct ccatttagca 35820 gtggtggaca ttgcatcatg cagtgcatgg ttccttcttg agtgcagctt atggaaggag 35880 ggggagtgac aggactgaac ttattgttca aatccccttg tggtcttggg gttcttggtt 35940 gctcactgca gagtttatag gtgaaatgag cagctgtcct cacctctcca gcacccttgg 36000 aatggaagag gctgccctga gctgggctgc catctcctgg gtcctcagtc tcaagccgct 36060 ttctgatgtc agtgagctct ttgaagtcag gtccgcatcc tacacagggt aggtacaggg 36120 ggccgggaag gcatagaata cacattaggt tggatctagc atctgatcca cctccccatg 36180 tttcacgaat gggccagtgg gtgagtctta gggagggcta ggccctgcct cttagaggaa 36240 ggcttaaaag gccccaacct actcttcttg gcctggtcag ctggaggcag gcagatgccc 36300 caagttcaga cagtcagata ctcccaccag ggatttgggt ctatggtgag tgacatctag 36360 aagcagggcc agccagaagt ccttcttggg gctgggcaca gtgactcgtg cctgtaatcc 36420 cagcactttg aggggctaag gcaggaggat tgcttgaagc taggagtttg agaccagcct 36480 ggacaacata gcaagaccct catctccaca aaagtaaaaa taataataat aataaccagc 36540 catattagag cattcctata gttccagcaa ctcaagaggc tgaggtggga ggatcactgg 36600 agcccacgag gtcaaggctg cagtgagcta cgattgccct cctacagccc agcaattgca 36660 cacctaaccc cacatacaca taatcaaata gagattatac attcacgatt gaagccaaag 36720 tgttatgaca caaaacttac ccttaggaca tgtcataaga tctgatgttt tatattttta 36780 ttcttttttg ttaaagaaag agcttgttga tccaaccctc taataaagct gaaagccaac 36840 atttgcaaac actggcaggt ggctgcgtgt cagggtgagg tgtcactgaa cagggtgata 36900 aagcaagatc ttgtctctaa aataaataat ataatataat aaatataata taattaagta 36960 gaataatgaa atatcctgct ggccaaggtg gcatccccgc ccccagcagc aaagtcagca 37020 gggccagtgg tggcaagctg gtgtccacac cagtggccac agtgtcatgt ccaggcaatc 37080 tctgccctat gacctcagct gcctttccag ctgtctttgg tttctgcctg tttcccttca 37140 gcctccctag attctgggag gggccggtgt cctgctccag gtaggcagag tccaagtctg 37200 ttgtgggcag aactctgatg atcattgcag gggtgggagg agggatggag ggagcatgat 37260 gctggcagaa cctccatggc atctggggaa ttgaaggctg ttttttgctc agttctcacc 37320 atccaaagca gcatgaacag ttttcaccac gcctctcttg tggatgcctg tgttcctggt 37380 acacacctct gctatgacac ttatcacctg gtattagtta agcatctgcc tccttcattt 37440 gctgtgggta tttagaaagc aatccatatt tcctctctgt atgcctcaat ttctccacct 37500 ttattagagg acccaggata agattatttc tgaggctgct tccatcagtg gttctgtgag 37560 ctggcccatg tattcagcca gtcagtaggc catcaagcat gcatctacgc aaggcactag 37620 aagggttaca tacaatggga aactgaggcc cagaaggagg aaagatgaag tgcccaaagt 37680 taaggagata aaagcagaag tgcaggtaag agaaggagta ttcatattac tgcaggaatc 37740 caaattctac aagaacatac gcttgttctt taaagggagc cctcgcttta agcattattt 37800 gccgatcaat acccattaat aattacagga catgggcaaa tattctagca aaggtcctga 37860 ggtcttccta gatgtgccca aaataacaag gactcccccc gcaggtggca ccaaaagtcg 37920 gaggatgtgt tggaagctga ccttccccac ctgtccctgc ctcacccaca gtcacccacc 37980 cctctaggat gtaatggtga atcattcaac acatgggcca ccttgggaag tcgcttaacc 38040 tctctccctt ttcacgttat aaaatgggca tagtcattac acaaatgcat aaatcaacct 38100 caattttctc atctctaagt gagaaggttg gactggaatt aacaagagga tccttgaagt 38160 tctttcgagc tctgacatcc tcatccattg caaagcggct gtgaaactgg attatgtaag 38220 gtcctgtggc cccaccaatt gtttggcaca tcctgtcttt ttccctagct agataatgat 38280 gtggctgagg gcagggactg tgcccacact caccaggtgc atgtgagtca gcgtctggat 38340 tgtgtggccc cgctggggct gccctggctg tatcacatgc ctcttgtgcc catctcatac 38400 ccctcagcca ccctctgacc acagcattgc ccggcgtgcc ccctgcaggc ttttattctc 38460 ctgcagcccc agggcctcct caacactatg atgtgagtca cctgagaagc ccagtcccac 38520 aggcatgcac agctcaggag tgcaggactg tcaaggactc ttgcagcaac cctcagccat 38580 gtggtaggta tgtggggtgc agggtgggga ggcagtggca tacacactcc ccagaagctt 38640 cagtgggatg gagatcagct caacaacaca cctttgactt gacttcccct ccttctccac 38700 ttcactcccc cagcccctca ccctgctccc tgagctctcc tcccaaataa actgcatgca 38760 tgcaggcaca catgaccagg ctgaggctct gctcttagtg ggataccagg caaagacacc 38820 tgccctaggg attggagcct aagccagagg aggcaggagg gtttagggca ccagccaaga 38880 agtgctttcc agatgctgag tgggatcccg aataagggaa agggcatcta acatagaatg 38940 aggaggagat aacacaaggg tagaaataac caagaaaggg gatttctctc agatggcttt 39000 agaggtgctc ccagccattg ctgggctcac atggctcaca tgtcataatt tttgccaagg 39060 cggtttcact gccaccacca ccccgctcag cctccagtgg cttgtccacc catggctgtg 39120 gcctctaact gggcaggatt ttataggcta ggaagaaaag tagggaatgt taagggagac 39180 ggaagtcaag ttcaacttgg aaccatccca gaatgtccag caggaaaggc ccatggatgt 39240 tataggctac aaccctctca gtgctcagcg gaggaactag gagcagagag ggtgagtaag 39300 tcaaaggcac ccagaccttg tagggaatcc tgtgtccctg caggatgcag aatggatgct 39360 tctgaaccct gccacaccct cagggtacat gtcagagcac gtgtgtggct gggacaatcc 39420 tccatctatg ttcctcactt acaccggctc cagtttagga aacccaaaag gctacaacca 39480 acccaccacc acagtgacca caatgtactt ggtgacacct caccttgaca cgcagccacc 39540 tgccagtgtt cacaaatgtt ggttttcagc tttatgcgag ggtaggatcc aacaagctca 39600 ttctttaatg aaaaagaatg aaattgtaaa atatcagatc ttattacatg tcctaagggt 39660 aacttttatc tcataacact tttgcttcaa tcatgagtgt ataatttcta tttgattttg 39720 tgtctatggg gttaggtgtg caatgtagaa aagcttgaaa accattgcct tatacccatt 39780 tgaaaaatga accaccaaac aaaggcttaa aaacatgaat atttgtcaac caaaaggaga 39840 actcctgggc ctggaagaaa catcacgatt caagtgctgc agcacgaaag aagttgaggc 39900 tggatttgta ttcagcttga ctgtttgtaa agcaccatgc accatgcaac tgccttcagt 39960 tccttttttt tttctttctt tttttttttt tttttttttg agatggagtt tcgttcttgt 40020 cgcccaggct ggagtgcaat ggcacaatct cggctcactg caatctccgc ctcccaggtt 40080 caagagattc tgctgcctta gcttcctgag tagctgggat tgcaggtgcc tgccaccaag 40140 cctggctaat ttttgtattt ttagtagaga tggggttttg ccatgttggc caggctggtc 40200 tcaaactcct gacctcaggt acttggcctc caaagtgctg ggattacagg catgagccac 40260 catgcccagc ctgccttcag ttctaaccac taaaggattc gtgttctcaa ctgagaaaca 40320 gccatatgga ggggcttcct gcaagggcac tgaagatgtc agagatgatg cctgtggagc 40380 acctggcaca gaggagctgc cctgctgact gcagcacagc cagttcacag gggtgagccc 40440 cggcatcagc ttagggagca tcccttcttg cagctcctcc ccctagcaca ctctcccacc 40500 tctgctcgca caggacctct gtccaggagt gcttacggca aggtttctgc ctcaaaaaca 40560 gggcttttgg ggctaactgg gagtgtaagg gtaaaaggaa agcttccact aggccccccc 40620 gattgttcac tggaaatgaa gggacaatag gagattaata ggagaagaag gcatacaaat 40680 gtattaacat acataaacac aggagccatg aaaatatgag gctcaaagaa gagccagatg 40740 actgaagttt aaatagcacc ctcttcatag gagagaggga aatgggggta ggtaattttc 40800 aaggttagta aataattttg agggaaatca aatggaccca gaaggcagac attttcctgt 40860 aaatgtcctc ttaggaagct gaatgggact gcaatttaag ggaaagtgag gggcaaaact 40920 gcattgtgaa caaaggttgt cttattacat aggtaaagtc tccctagtca tccctcaaag 40980 ctgccctcag aagaatagat gaaaagcctg ggcttagtga cagcttttac tcttttctcc 41040 ttgcaggtgg gtggttaatc tttcctggtt atttgatgag atttctaggg agggggcctt 41100 aagacagttg catttctttt ggaaagaagt gtccatagtc agatatggaa attctagaca 41160 gcctcttttt cctgcacttg gggagggggc agaggagaaa caagagaaga ttggaaaatt 41220 cttggttctg aggcagcttc taaggacttg cattttcctt taattcaaag tgctcagcct 41280 gccaacactt cctactttgg ggtatcattc tctgtgaccc cacaggggaa tggggtctgt 41340 cctcagagaa tgggggagga cctcaaggca gcagggcaga actccagggt gagagtcaaa 41400 gatggtttcc tggacctgag actccagtgg ggttcatgct agagtcaccc cagtcttcag 41460 gctcactgcc caaacacgca cttgaggaag tctgtggggg cagctccttg ttttgttcct 41520 cactgtcatt ttccaaaagg cagacaagcc ctggccgcct tatgcccagg gctgagtcca 41580 caccatgcta cacgagcacc tgaggggagg ctcctctcca aagtgcatta ccagggcctg 41640 tgctaaattt ttcagcagcc tcttgtctca ctaatggtcc cgggaaatag actaagcctc 41700 catccccaac taagtgctca ggcctccccc acctctgtcc tgcctgggca agaagcccag 41760 cgccgcccca cagcccagct ctccatgcag cctcagctcc cagtggccct ctgccaagga 41820 cttgcgcctc tgcagtggga tgcagtgcct cattttatcc ataattgtac gtggtccctg 41880 tgtgatgtcc ggggacgtga aaagttgtgt ctcatttcat ttgggatcca gttaaattcc 41940 caaatgctgc aactgagcag gaatctcagt gctcagaggc cagcagtagg aggagtctgg 42000 ctgctgggcc cggacacctg gcctctccgg cctctgacca gctctggcca ttggtcacca 42060 ccctggcttt gttgggtatt aatccaccac actctgcctg gctgatccct gagtcagagc 42120 caggctggga tttgtgggtc tctgagccca ccagcctgtg actcccaaaa agagagcacc 42180 cttgctactt ggaaggcttg ccaccatgcc tagccagcac tcttgctttc taagctgaaa 42240 tcattataag atagtcccct actaccttct acccagaaat gtatcccctc acaaagtata 42300 tgttcccacc ctatcccaat cctaccatcg tgatttctga gtactttcca gaaaactgtc 42360 tccactggct cccaagggca gagcacttcc tccagcctct ggaatgtcca ccatgttgat 42420 ggtgcatgga tgataatgac cccacggatg agctctctcc agtgggatca cgaagggaga 42480 atgggatccc tgactcccca cagaacagct cggcccagct gtgaggttga gcaaatacac 42540 tcaaagctca gcgttaaccc aagtccagcg ctctcagctt acacaggtgg cagcccaatc 42600 ttagtgctcc actcaatcca tgtctatgta tacttaattc tctggaacta aaatggggaa 42660 tagggccagg caccatgact caagcctgta atcccagcac tttgggaggc cgaggtaagt 42720 ggatcaccta aggtcaggag ttcgagacca gcctggccaa catggtgaaa ccccatcttt 42780 actaaagata caaaattagc caggtgtggt ggcgggcgcc tgtaatccca gctacttggg 42840 aggctaaggg aggagaatca cttgaaccca ggaggtggaa attgcagtga gccgagatcg 42900 agccattgcg ctccagccta ggtgacaaga gtgaaactct atcttaaaaa ataaaaataa 42960 aataaaataa atttttttaa aggccggagg gactaagatg ggagtgggaa ggagggaggt 43020 tccagctcaa tcctcaccag cagatattcc tgcatcctcc atacctgagc cttcagacca 43080 atgctcccca ggcccaaagg ggacctccct ttcaagtata aggctcccct aattcctcac 43140 cttaggatct ttaaggcaga tgactgcctt aaagaacata tattccttgc agcaagaaaa 43200 cccaactccc aacaccccac agagtgtggt ctggcctgga caagtctgcc ctaagaaaaa 43260 agcgacaaag acccttagta attgaaacag actttaagta ccataaagat gagctttcaa 43320 tcattaaaaa aaaaaacgtt tactgagcca ggcaccaggc ctaggaacag agaggtgcat 43380 ccaggctgcc atgttaggtg ggcctgggcc ccactgctgg ggtcagaagg tattagaaag 43440 ggtctggtct gctgggcgcg gtggctctca cctgtaatcc cagcacttag ggaggccgag 43500 gcaggcagat cacctgaggt ctgcagctcg agaccagcct ggccaacatg gtgaaacccc 43560 gtctctacta aaaatacaaa aattagttgg gcatagtgat gggcacctgt aatcccagcc 43620 agctactcag gaggctgagg caagagaatt gcctgaaccc aggaggcgga ggttgcagtg 43680 agccaagaaa gcgccactgc actccagcct ggatgacaga gtaagagtcc atctcaaaaa 43740 aaaaataaaa taaagaaagg gtctggaagc tctaggtgac ctcatgctca catctatacg 43800 cacaccttga tacattattt atggatcagg tggcacagca ttgcaggcag cagcagggca 43860 aagacagtgt ggaatcagag tcgggcagcg ttggatggga ttccggttct gccaccactg 43920 gctatgtgat ggaaatctac cacatctctc caagccttgc tgtcctgttt tatcaaatga 43980 ggacattgta ctgaatcaca aggtctgtac aatgcccgtg catgtgcctg gaatcttccc 44040 ctctggtgtc ccctcaatgc ccatggtgct tcctgcacag ggtgtaccat agttgcttgc 44100 tgtctcctgc tgaagcctgc tgtgaagagg gactgtgtgg aggtaaggca gtgggcctct 44160 ccctgtgagg tcctcagggg gctgaaggca aagtcagaag taaaaaaaga gaggggggac 44220 ccatccccaa ccagctgcca tcccagggca ctcagcctaa ggccactgca tttgcatgct 44280 atttacataa atctgcatat acactgtatt cccactctat cttgtaggca attattgcat 44340 ttaggcagct ctgcattcca ggaaggggca caagcagaga tgtgatcccc tgaacttcat 44400 gacaagaagg tacccgaagc tcctctccca cctccagcag caaatgtctc ccctggggct 44460 gtcctgtgtt gtgtttgaac cctgctctgg ggctcctgcc cgccacctgt agtggctacc 44520 atcagaagtt cctgttaatt ggggatggca gggtcaccac atctctactc ttctcccact 44580 tctcagcagt tctaatttaa accaggttag aatcttccca cttggtagtc tggtagggaa 44640 attatagtta acaataattt attaataagt taaaatagcc agaagagaag aactgtaatg 44700 ttcccaacac acacaaaaaa gataaatgtt tgaagtgaag cattgaagtg atgctccaat 44760 tatcctgact tgatcattac atattgcatg caagtaccaa aagatcacat gtacccaaaa 44820 atatatacaa ctatgatata tcaattaatt ttttaattga ttttttttct tattttcctg 44880 tgtagtggca gaatcacagt tcactgcagc ctcaacctcc tggggttcaa acaatcctcc 44940 caactcaacc tcctgagtag ctgggactat aggccctcac aaccatgccc agctaatttt 45000 ttgtgtgttt ttgtagagat gggggtctca ttttgttacc cagctggcct gtaactcccg 45060 ggctcaaggg attctcttgc ctcagccttc caaaatgatg agattacaag tgtgagccac 45120 cgactctggc tgatatatca attttttaaa aaaaaggttc ttctccaggc ttcaatgcga 45180 cttcacctat accaggtgtg agcggccctc atgtccaggt gggtggggcc aggcatctgc 45240 agggacctca ggcttcttgg attgtttggg atggaggccc aaggaggcgg aaggtctggg 45300 gtctcaccca agctggctct ccccaaggaa taagagtaat cacatgggcc tggagcagaa 45360 aagggaagag aagggtcccc aggaatgatg atttctgggg cttcaggaaa gagtgtggaa 45420 ctgaatggca gagctaaggg aagactagga cttacaacca ccaaaatcag gccctccagc 45480 tgggttcggg gccaagggag agtgcagcct ggcttctgcc attctccttt catccccctg 45540 gagcttctga aatccacaga attgtggtga aggacaagga gccaagggct cacaggcgag 45600 gggaggcggg gaattcaatg tgttcaaggc ctacattgca catctgccct tggtttactc 45660 tatctaatgt tcccatttga ccggtaagaa aactgaggct caagattcaa acccaggtcc 45720 ttgtaacttc aaaaaccttg ttctttctag gtgtcaaagt caatagatgg gccacggggc 45780 tagcagtcac ttctcttcct ggacttggca gtcaagggat aggacctgaa ctaaattgcc 45840 tttctacaga cttttcagcc ccaaccagag gcctgctgca ggcagttgtt tgaactcctt 45900 gattaaatgt tcagcccctg gcctgggcgg cagactccca acacacaaga cttactgagt 45960 cccccaaata gacttcaaaa cacagtcctg agactctgcc tgccagttgc ccattaagct 46020 catcccagcc tggcatcttc ctttgttggt ccactctccc tatggctacc agggagaaag 46080 tcttttcaga gatgaataag ggcgtccaga caacagagat gtagtagtag gaggtggaac 46140 caaaacagaa ccaggggtct gaatcctggc tctgccactt tctgagatat gtcacatcag 46200 acaggtgact taacctcctg tgtctcagtt tccaaattca aaaacggaaa atgtattatg 46260 acgatcagat gagttaatac agtcaaaatg cttcttagaa cagcatctgg gatgtagcaa 46320 gcactcaaaa acatattagc tattatgatc acacagagat gcatacctcc taaaatcttt 46380 ctgggctccc accgccagca tgataaagcc tcacttctca ccaaaggcaa atcaggcctc 46440 tcatcatctg cctcctccct ccccagcccc atctcccgaa gcgcctctca gggcacctct 46500 gcccttgcac aaggcagggc ctgttcctag caactctcag agtagcagtg gaagtttcca 46560 acaccaagat ctcagatacc tcaagctggc aggagtgcga ggtccaacaa gaagagattt 46620 tatgaatcag ccagccatgg gggtggggca tggccaggtt tcctgattcc cagaccaggg 46680 tgccaacaac acctactgtt catgtgagaa aaggagaaag aggaggaggg gccactggcg 46740 tcttttgccc acctggggtt cctcgctgtg ggagaggggg aggccagagg acagcaagtt 46800 ccctgagagc ctctcagaga aaaggagggt ttagatcatc acacaggata aggaagaaga 46860 ccttttccaa gggggtggag cagagcctgc ctggaggtaa atttcctttg ggaactgtct 46920 tcttcagtat ttcccttcct ctctgaacac cgtttctttt cctttcagat tatctgacag 46980 ccttttaatg aacacctact aagtgcccag cactttcctg ggaacttaat tcttacaacc 47040 tgttaagagg tctatacact cattttacag tggaggaaat ggagacttag cggagatgtg 47100 aaatttgaac caggtccgtg tggtttcaaa gcctgcgcat gttcctttac cctatggaag 47160 cctccagaag ccaaggtctc atctcccctc ttccctggag gccccaaacc tgggtagctg 47220 tgcccctaga cctttgaggg agggtctcga gccattatct cccttacctt ttcttgcagt 47280 gacttggctt ctcccaggct gccgtaacca gcaaacgcct aaagatggct ctgagacgat 47340 ggccttctgt gtgtgtgtcc atgaaatcag gtagtacacc acacagaacc agactctcag 47400 tgacatgcct gatattccac agacctgcat ccgagctgtg cagatctcag gtagacacaa 47460 ccagtgattg gggatggctg gtaggatctt gcctaggcag gccagggagc tctgtgagga 47520 gtgtttggga gaaaatcccc caggttcatc tccctgcatg gactgcccct gctgggccct 47580 cacactaagc tggtcctggt cctcagtact gagggatcac cacaggtgtg taggccacag 47640 ctcacaggag ccctccacct agcgggtcaa aggtagtgga agatctgaga gtcaggcaga 47700 cctggtccaa atcccggatc tgccatttcc tcactgcatg atactaaaaa agtcacttct 47760 tcatctgaaa aatggggctg atcccaccca ttctgcaggg tctcagtggg gattgaaggg 47820 ggctgacctc aatgtagcac gatgcctgcc ccaggtggga cttcagcaaa ctctctttcc 47880 tttcccttcc ctccccttga aggccaagac caaggaaaca gaattgggca tgccagaaca 47940 tatcccagcc ctgtggggtg tatttacctc cacttctgat cacagtgtgt ttgcgtatga 48000 ccttgaggcc agtgactttt acaccttgcc tatgctgggc tgggctgtga cttggctgtg 48060 acttgcctgc cctgaagcca agcctcagct gacatgtgtc tttccaccac ccctgctgtg 48120 ctgagtgagc accagccacc tgtcccattg ttcctgcccc aggctgtgtg tggagagtgg 48180 tctgacaggg cagacaacac cctacactcc agatgtgttg aggtgagctc tgggggtcag 48240 gaaagaagca gggaggggca cagtgtgaac atcctgtgca gatttccccc caactggccc 48300 cccagctggt tgggttttct tttctcagta actcctggca gaagtccaag gaggcctcct 48360 tctcccaaac cctctgtcct tggctcaaaa atccagcaga ggacgtgcca cgaccacgaa 48420 aggtgacagc agtcaagggg aaagaggact cccttactgg agtgcacaga agtttcctat 48480 ttattttgct tacgcggttg actttttcca aaggctgctt gggacggctt acctcgaaaa 48540 gcttagcaat aaggctagta gtaaatcaga caaaaaaatc atggactggg ggaaagaaag 48600 tagcatttaa atatatttaa taaggacgat atagtcgtga acatgtgcct gagtatcctg 48660 gctaccacag taaaagggga aatatgatca gttatgggaa aagagtaaaa atattaatca 48720 tgattttttt tttcttggag ctttgtgtaa taggcactga tgttgaaaag ggtagagtta 48780 tttttccata tttgtagaaa ttcagaagat tatcagacta tttgcctcac aaggactttt 48840 tagcaagcaa aaagtatgat attgtcatgc accctggtga ggggaagtgt catccagttc 48900 taggtttctg tgaatctacc ttgatgcagg tgttcaggga gtagtgagtt tcctcagttg 48960 taatgtagac cagcgcttct caaacttaaa cacgtataca acctcctagg gggtcttgtt 49020 aaaatgccat tctaatttgg gagctttggg gtggcctgac actctgccat tctaaaaccc 49080 tcccaggcca tcatgatcac caccttccga gcagcaaggg gttaaaaccc aggcatctcc 49140 catgatctag tagtgagtgc ctttctaatc gcccccagct gaaaggcaat gcaatgttat 49200 catagacggg caagaagaat ctcttccttg gctctgtaaa tgcttccggg atgtgctggg 49260 tcagcctccc tccattctgg ttggcgatct tggtctagtc acaagccaag accgttgatc 49320 atacacaaaa gtttaagtac ctactacgcg ccaggaagct ccctcagaaa gatggttggt 49380 cctgctcccc cacccaccct ccaccctggc atcttttatc cactcttcct tcagcaactg 49440 cctttatcaa tgctcccttg agccaaaata aacaaataaa aagcaacttc ctttggaagc 49500 tactccatac tcttgcgctg gccacagtta catctccctg cagatacaca gattctcatg 49560 acacagagct cagacagtgc ttcctctctg gagggctcat gtttcgagag aagactggaa 49620 ggaggacaac cttatgctcc agtagaattc caaattctgg ggtgcaggga catttcgtgt 49680 gtgtatgtgg aggggggggt gtcctaatgc cctgtaagcc acactttata atgctgtaca 49740 atattgggtc accatcatgg gccatggaaa gcagaatctg tgaggttcag tcccaggctc 49800 cagcacccct ttgtcagctg gcctccccgc tcagtgccct ctcccactac ctgccctgcc 49860 tcagctctga ctgctgctga tgtgcctcca cccatcaggt cattgtgatg gcaaagacaa 49920 tgcctccatt tgccctgaat gcagccttac ataggaaaga gcttcctgtg ctccagaact 49980 tggaggagtc ctgcagcacc tggtctagtg gggagagcat cagtggggag cggcaccttt 50040 cctgcagcca cggcccactg ggcaggacca gatccaagtg gcctggcttc tggctagggt 50100 gtcagagtac attggggcat acagcttccc gtggccatct cgttttcatg gaggatttat 50160 tttgtgaagt ggacctgctc tgtcccatcc tataaatgct ggattaatcc aagaagctga 50220 gggtgagcaa catccctctc cttcctgatc aaataagaaa taaatctaga ttttctcctg 50280 gatgctattc tcttcttagc caaacagcta accttgtctt caaggaaaaa gggcaatccc 50340 aggggctctg taaattgaat attcagcaac tccaggggca gacatcccta agtgcataag 50400 tggagcaccc ctctgaatca gcatcacacc agctgggggc ataaaaagga gagcagagta 50460 ggcaggagct gtggggacat ttctgagatg ctaaaagagg caaggaagtg tgaggacggg 50520 tgtgcattca tgcaacaggt atttactgag cacctactat gagccaggca gtgctctatc 50580 cattagagat acggaattga ataaaacata aaaatccctg cccaggagga gctcacattt 50640 ctatgggaga agacagttac tgaaaaacag tccaaaaaac tctattttat agtgtgttca 50700 gaggtaatac aggctatggg gaaaaaaaga aagcaagcag gtacatggat gaggaatggg 50760 ggcgatcagc gtgggcctca cagaaatgat gacctttcag ccaagacttg gaggaggtag 50820 ggagggtacc tggggatgcc tagggtccag gcaaggggaa cggcaggggt caggatcctg 50880 tcagattcat ctgaggtggg actgaatgtg agcagagaga gggagacaga ggatgagggc 50940 agagagaagg ccaatcacac tgggccacgg ctattgcaag gactttactt ttgctggggg 51000 agggggtaga gttttgagca gaggagaaat gcgatctggc aaacatcttg caaggatggc 51060 tctgactgtt ctatccttgg cagaggacac cagagtctgg cccatagaag gtgctcaaca 51120 aagctcagca cattgcactc ctccctggag taggaaaggg ctcgtctgct ttgggaaatt 51180 tggctctcaa gcttctggaa acacctgacc ccatgccagg tgagacaagc tcacactcaa 51240 ggccccctta gtccaacggt cagtggacag aacaagcacc aaaggtcaac ggcgtgggcg 51300 gtggcctctc tgccaaagtg tgtgggccca agtagggtat tcacctccct ccctgtctgt 51360 gagaaatttc agacccctct actttttcca gcaggagttc atgttccttt taagataatc 51420 ctctatagac ctctggcagc ccagccttca aaatgtctcc ccctgtctct cttactcatg 51480 gagagccccg cttccccgcc tcaaaaaaaa gtcttcctct ctcttactca tgcatggaga 51540 gccccacaaa aagacactgg ttcccaggga ttcttccaaa gatgctggaa gacctctcag 51600 tgtttgcatt tcccaagctc ggtttccttg tgctgtcctt gggcattaaa ggaaggctat 51660 tcagccatcc ccatcagcag gagcaggcat caaaagaaca gctactgcag ggggagcata 51720 ttaggggcac cagagggggc taggaactgg gtcttgtctt ctcaaagttt acaacccact 51780 gcaggggcca ctcaccagcc ctggcaccct aagggcagga acctccattg ggcacgtgtg 51840 tctccagcac tgggagcact gtctggcacc tggggcactg tgagtgttga atggataaag 51900 gacctgtaag aattgccata agaggtgttg ccctggggca aggtgggaca ggaaagttct 51960 tgcaagagaa gagaggctct ggccttgggc cctggctgag cagagagctg ggaggtgggt 52020 attcgggtag gaggaaagct gtggaggggg aaagcaaact gcctgcgggg gtgggggggt 52080 tctcggcggg agttgggggt ggagggaaag gcgctttaca gcagcactcc ctccacaggg 52140 agaccagagc tctgcctctt cctccccacc gtgccctttg gggtccagtt gtggggcctt 52200 ccttgaggcc cagctcctgc ctctggcctc cggaggctta tctccccaac agaggctggc 52260 tccccagaaa acaggattct tagacttcct aaaaataacc tgaagctcct tatcagaggc 52320 taatagtgta tgtctcccag gaatactcta gaaagagtac caggggtcag gaacccccac 52380 tcagcctcca cgaatctgag cggaaaagcc cgggtctcct cacctgtaaa gaaaataact 52440 gcagccggca aatgtgacca caggtgagaa ggggcttcgg accagggcgc acacctctag 52500 agaggtgccc acagacagcc tccccttact tacgccctgc ttcgctgcag tgctgtgaag 52560 ccatcggcat tggaagtgcg gagggcagcg ggcagtgccc cagggggaag gggggacggg 52620 tagggtttca gagcccagaa ggcctagaca gggaggcagc tccgggagaa aggtacccgc 52680 catcccaccg gtcttggaac ctgaggactg ctgggaaggg tcaaaagtct gccctaaggg 52740 tggacaaggg acagagattg gggggggacc acaaaggcct gggcgcaacc ttgttgagag 52800 ggaagggatc cggacccaat ctggagccct ggtctcttcc cacctgcaac cgtggctgcc 52860 acttggcctc ggttataaaa tggacaagga ttcgaggtgc tcctcaggtt aagagagggg 52920 ggcctagagg tcaccctggc ctcggtgccc tccgtggccg ggttaagagg aggtcccgga 52980 gttctgctca cttcagccgt gtgccgggca ctgcaaatca ggaagtgttg gcgccggctg 53040 gcgacctccc gcctggggcc aggggaggag ggtggttgga cgctgccacc gctgccgggg 53100 ctgtgcaggg ctgggcgggg agcgaggacc cggcggctcc tgattgcggc cccgggggag 53160 gtggccgagc cggataagct gcggcgggct ggagggcggc cacctcccct gcaggtccgg 53220 ccctcccggg cgggtggggc gcgggggagg aggagcctcg ggccgagcca ccgccttcgc 53280 cgcggacctt cagctgccgc ggtcgctccg agcggcgggc cgcagaggtg agtgtaccct 53340 cccccggtct ccgcggggct gcgtgctgcg cccggtcccc gagacgcccg cccggttgca 53400 ccctgcgccg tcgctgcgcg gacctcgggt gccgccacac gtctggaggc gacttctgtc 53460 ccctgggacc gagccacgtg cgcccggcgg cagagaaacc gggttccggg gcccccaccc 53520 cgtgtgcctt ccttccctag gcgtggaagc cgcttgcgcc gcgcaggtta ggcagggccg 53580 gcggcgacag tggcggggag caggctccgg agccccgggt gcagatgtgg gcgcccctcc 53640 ggatgacccc ggctgagtcc acaggtcccg tgtgccccac ggctggggct ctggccagcg 53700 gtcccaaagg agggctggta gctgtgggcg gggatcttcc aggctcttcc tcgccagacc 53760 tcccagtccc ttcgcagccg aacagggcag ggacaggggc aggtgcaggg gctgggcagg 53820 ggcgcccgac cttggtcccc aggaggaggc tggcctcacc agtgcccgcc tctgcccgcg 53880 gagcccttgc ctggcaaagt tccccctcct gcccggcaaa gctccccctc ctgcccactt 53940 ccccgaaatt tggggacagg ctgcccggag aggtgtggtt ggaactttgg tcactctggg 54000 taaatgaagg ggagggtgtg cccagataat atgcggtttg gggaccagaa agccggatcc 54060 gtggggagaa gcaggaaggt cccgctggag ccctggcaga gggcacagag aggcctccca 54120 aatatccagg gccacctcag agatgggctc cagaagtggg gattctggaa atgcccccag 54180 ggaggtattt ctgtccatca gagtgcagcc ataatataat taacagcaga tattcccatt 54240 tatgtgtgcc aggcatcttg ctaagggctt tgagcacaat atcccagtta atcctcacaa 54300 caggaaggca ccattatctc ttgttaaaaa tggggaaaca gcctcagaga gtccacgtat 54360 tttgcaagga tacacagcta ggaagttgca gaagtagaat ttgaacccag agttatctga 54420 cttggagccc agaggaacct accactgggg cgaaacaggc tgtgtcctca cggggattct 54480 ggcagcccca agaatacagt gctgagagcc agaaggtcca caaaaccaaa gggtctcacc 54540 tgggtgtgtc ctctcagtca cctgcaaggc ttgttaaaaa tatagatccc caagtcccat 54600 ccgaagctga ctgaatcagc taggggcacc tggaggaccc agactatgtc ttactcatct 54660 ctgtccctgg tggcctgcag aggggctggc aaggagcagg tgcttagtga atgtctaatg 54720 ggtaagtggg cggggtgggg tagatggtgt cactagtgtc ctgaaggggg cttaaatgga 54780 gcaggtggcc tcagccaggc aatccggcag caggtatgga agtgacacag tctaatgctg 54840 gcctcagagc cagcagggag ctcaggctgg gccacttgtc cacctggggg ttgaacagcc 54900 tgccccaggt ttgctgaggt ccccaggacc aggccaggtc aagctgggat cacacatgtt 54960 ccctctccag cctagagatg tcaaacaggt agattcctct cccattcata tctcctatcc 55020 ttggcccaca gcccttccct tcttggactt atcagagacc aaggtgctgg gcagggcttc 55080 aggtggttaa aaagtgaaag ttcttgagtg aagtccaaag gcgcacacct gagagctgag 55140 tgggcaaaag gtcgctggct gagtgctggg gatagtctgg ctttggagtc agatggacga 55200 gtccaaatct cagctcctta ccccgtaaca tgaagccctc agctctctga acctctgttt 55260 atttgcaaaa ccttgccaag ggcttcaaac aggatatcct cataaaacaa gtatgcctat 55320 ttgggggact aagtgtgtga agtgctgagt tttaggagtg cagtaaatat cggatccctc 55380 cttcttcacc tcaggtttgc gagttaacca gtgaggggcc ttccaggcct agtgctcttg 55440 tagaccgaac cactagcttt cctagagaag gcaactgagg cctagagagt ggcctccagg 55500 ttccgtgctc tgtggcagag ctggccttgg ctccaagtcc cagggttccc agctcagtct 55560 cagctgatgc ctcccagcct ggcggtctac gctgcctgct acattccctg tccagctaca 55620 aatgaacaac tgagagggct ggggtgagat tcaggcaggc tggggcaagg gaaggaagca 55680 ggtcatttgg ggagtcgggc tctctggtct tccagctgag gctggatcca ctctttcctg 55740 tccacccacg gtgcgtagtg gccaggtctt cctgagctga gcaggttgag cactatgaaa 55800 ctgctttcta gcatctagac cagggagttg cctcttgatt taaaatgagg atgtttacca 55860 gtttaagtag ttattaaaac ctaaggccaa gttggtgcct ttcctccctc taggagttgg 55920 aagggtgtgt gcttttttct gctcctaccc cacccctgcc aaaccatccc aatttgagag 55980 gctgtggaga ttacagaact tggagaggag aggggcaggg atcggggttg gagactagat 56040 ggttttcaaa cattgggcta cagaagtccc tcttcctccc atctgtctcc tgcagctggg 56100 tccacccacc tgtccaacac agcctcccac aggtcccggg cctctttgtg ctccaaccgt 56160 cacatccttg gcatgccaca caccctcacc atcctgcctg aaatgccagt cctcatcact 56220 gacattcagc ctcccatgtg ccagcatccg ggccaaacac tttatctaca ggagctcatt 56280 tgtacctgga gactcttagg aggtcgataa tgttattctc ccaaccatgt gactttccaa 56340 ctccatatgg accccaacct ctttttttcc acccctaacc tgagactcct agccactaac 56400 taactgccac attctcctgt ccaaattctg cctcatcggt tattcattca acaaacactt 56460 accgagcact aactttgagc caggcactct aagaccagct gagtcccact tctggcagga 56520 tgagtgttgt tgtcatcaac caccccacaa acacccgtgc cctctgcgta cttgcgaatc 56580 tgagtgagga gacacggtgg cagtaaggct caggacctat agctcatgtg agtgagcaag 56640 gatgcaaaac caaagacacc cgctcccctc acccactgag ctggagggat caaccactgt 56700 gcctgccatc agggctgatg ggcgactgct tgtggatcac aaactcttgc gttgtcactt 56760 caacccaggg gcagagtgtg ttcctcttca ggtgtggcct ggtctcgtga gccctgcact 56820 gaatgggcca ggcgttcatt gcttcagcac cgtaagaaca ctgtcaccgg agaattgttc 56880 gatactcaac tcttcccagt cagtctgtct tctgcatgcc cacagttacc gggcagcgtg 56940 ggcaacaagt gagcactgat tgttccgcaa tcaggctgtg acttactcca tctctgcctt 57000 ctgcttaatg agagccaggt gggagttcag caaagatcac atgtttaagc cttgttatta 57060 aacacgttaa aaaaatactg ccccaagatt ataaagccga cttcggtaca tataaagaga 57120 tttggggtcg gtgaatgggc ccactaagct ttattttgtg gtgtcagctg tcttggttca 57180 tgtgtagaca gcagggctcc caaagccagc atgctggggt ctgtgaggga acaagcttcc 57240 catttcttgt atttatttat ttatttattt atttatttat tttttggaga cagaatctcg 57300 ctctgtcacc taggttggag tgcagtggtg ccatcttggc tcactgcaac ctctgcctcc 57360 cgatttcaag caattctcct gcttcagcct cctgagcagc tgggattaca ggtgtgctcc 57420 accacaccca gctaattttt gtattattag tagagatggg gttttgccat gttggccagg 57480 ctggttttga actcctgacc tcaggtgatc cacctgcctc ggcctcccaa agtgctggga 57540 ttacaggtgt gagtcaccac agccggctgc ttcccatttc tataagcatc cgactggtgg 57600 ggtggccagt aggctgtggg gagtggtgcg tgattttcct ggtgggcttg agagagtaac 57660 agtatacccc cagtcagggc aagtgtctct ctgaaggtga actctgggtg cacagctaga 57720 ggatacagtg gctgtgagct gggccctcca ggtgaggtct ggcctgccca ttgccacagt 57780 gggcttgctg gcatccaggg gggctttctg ggtgactgcc caggcctgca catgagtcag 57840 tagcacgctg aatgcagtgg agtttgaggg gacccaccac tgtccatcaa atcgccccaa 57900 cctgggtgaa aggccagagc agctgcggga agtgacacca ggccctctgg agatgaccct 57960 ctggcccttg gagatgtctc tggactggcc agaaagaagg tggtgcctgg aactggaagg 58020 gaaggaagca agacagtgct gggcccagca gccagaaatc agggtgatgg gtgggtggag 58080 gggcaggcat ctgggaaagc cctgccctcc tggtgttccc agatctgaag gctggaggct 58140 ggaaaccttg tgtcacctgt gctggtgtga gttccattgg ggctgccgct taccctccca 58200 tgacctttaa catctggcat ggcttgtggg gggtgctgag aggaggagaa gtctcaaggc 58260 tgagggagct cagggtagag ccaaggtctc agtgagaacc ccagggggca gctgtcacag 58320 ctgacctgga gccctccagg aacgcgtact ctccagctcc tgtactctca aaagcaacag 58380 aaaggtttgc tttcctcagg tgcggtttcc tcacagtgca gcttctccaa agagatctgg 58440 agacccccca gcagctttga caggaaaata gagtcctatc caccccacac caacacactg 58500 aagtagagac tctgggcctg gggctgccca gaaacccacc cacttaaact gcccgggcga 58560 ttctggtgtt cacaaatatt tgaaagcact gcctgacacc tgctggctca acaggtgtcc 58620 acctaggctg gagtacagtg gtgccatctc ggctcactgc aacctctgcc tcccaatttc 58680 aagcaattct cgtgcctcag cctcccgagc agctgggatt acaggtgtgc tccaccacac 58740 ccagctaatt tttgtattat tagttcacct aagcagagag cgatgtgagg ggctgtgagg 58800 atgtgcaggg gtggagggca cttaggtccc tccctcagct gaccatagag cacccagagt 58860 ggcagagggg ccacgtgcag tgagtggcca cagcagagca aggaaaggtg cacacaagaa 58920 cagtcctaag gaagacatgt gtttaggggt ttcatattca ctgtttaatc atcaggacag 58980 agagggaaag caacctaccc aacgtcacac agctagcaca tggctggacc ggaattcaca 59040 cacatctctg tccagctagg tcccccaact aacacagctg cctgtctgaa ttcaaagccg 59100 ggagagattg tcaggggtgg gcgttggggg agatggcagg tgccttaagt gcccaaggcc 59160 ttgggctgga tctttaagga agggggattg ggatgggcca ggaggttgtc aagattggag 59220 atggaaagaa tgccattggc tgtggtgggg ggtggagtgg gcagggactg gaaggagggg 59280 tagtggaagt cagtccctgc ctacaggcct gtgttagact ccgcggagat tcaggaatct 59340 agccctgccc acaggggctt tcactccagt agaagagagg agacccaggg ggccacagca 59400 gtcagagaac aatgaggcct tggcttggtg tttggtgatg ataggggaaa cctgcccaga 59460 acctgtttat cagatgctca gggatctgaa aaacaggttc tgcatgtggg cttgagataa 59520 agatgcccgg gatacttaga tgtgccctat tccaagatcg ctaggttcca aacaagttga 59580 aaacaataga atacacttat ccctaagaat gggcttgcac ataattcact tcaacaatgc 59640 aaaagcttcc aaacctccag cctcctttgg gctgccggtg tggcctccaa ggtccactga 59700 aaagccatcc ccagccagca gaaacatgcc tgtgtcttct tcagcccccg tccatgcttt 59760 gccctggaga caagtgctgt catctgtttg tgggtctgtc tgtctgtctg tctgtccgtc 59820 tttctcccca ctgtgagcac tgacaagcaa gtaaagatga caatgaagcc tttgtgggca 59880 ccaaatgctg acagcattat cactaagcca gtggcagcca tggtgactgc aataaatttc 59940 ccccacagaa attgataaat tgccactttc tgcagccatt atgtttgcct ttgtatcccg 60000 aagagtaaac gcctctctcc ctttctctct ctcgctcacg tgtgtgtgcg cgcgttagat 60060 gacatttatt cattttatgc atcctgggtt ctactggtcg tcccacctca gttcctgtag 60120 caaagagact tgagtctgag ccactaatta tcacccgtga ggtttcctcc ccgagcagga 60180 agcagcaggc cagagctgcg ctctctcagt gcactctcca accaagcatc agtcaccact 60240 cccggtccag cccctgtggc caagagctgg cgtgcaggct gcgggaggca gctggctgtg 60300 caagaccctg gcagggccct cgcctcctga gaaaccgaga gtcagaacca aagccaggct 60360 gtcctggttg gagactgagc cagaaagggt ggctcacctc acggtgaggc tgtcgagtga 60420 cctgagagcc tcagaccctc acgtcagccg gatgtcgcac cagcctgctg ttggtaagtc 60480 tggctaggac gcagatccaa gggggcatgg gtcgtgtgca aacccctccc accagctccc 60540 tcaccacctg acccctgccc tgctggaggg tgccccttga atctccagga ggtccgagga 60600 actcgacacc tcccagagat ctgtactgcc ttggaacagg ctgcaaaaag tgcagtatga 60660 aatgggaaat atgtatcagc tgcacgtttt catggccccc tttggaggaa agggagtcca 60720 ggttattaag tcaggaggct tttaaatttc aggggttcaa ggatttatca cacacagttg 60780 cgtgtgtgtg tgtgtgtgtg tgtgtgtgtg tgtgtgtgtg tgtttaagga tgttaatgtt 60840 tatgatgcat ttctgtggaa tgcaggccca ttgggaattg taaatttttc ttattggtaa 60900 ccatttctgc attggtttag cacggaactg ctgctgcaag taaatgaacc agatttttct 60960 ggaatgattc gaaaatctag ctgtttgtaa aaagctctct aaattattca ttcactttta 61020 ttttgcacag ttgtgtgacg gtaaactctt ttccatcaga cgaaacttgc gcgcacgtgt 61080 atttctgcgg ggattggctc gagtgtgctt gagttttctg tattctcttt tgtaggaact 61140 tctcagcctt ccttttaaaa agataataat tttttaatga tgtctaaata atgattccag 61200 gcagtattac aagaaatata acagtaaaac gtttgtaaga gtccatcaga aagggaaaat 61260 gcccacagag aaaaatagaa atctaccaat tagatgtgtg tggctataag tgagctttta 61320 aaccatgatt tgagactggc atcctctggc ctctctgccc tcaggtcagc tgtgggaggc 61380 taggggtggg atagcaaaag ggacctggga tcaggtgggg cttcctggac cccaggccca 61440 gtaagaatga agcctagggg ttctaggata gggggcagcc ctggatttgc agaaacagcc 61500 tgagaatgag gggctggaaa gtatgagttg gagcagctca gtgaggagac agaaaactga 61560 agcagaagaa agcagaagac accagagtct ggtgctgact gggtgactgg ctgttactca 61620 catcctgagc aatgagccac agaccctccc caccccagag gcagcttgaa tgcagggact 61680 ggatgggccc agggcacagt ggatccgggg caggcaagag ccaactcggg gcccagagga 61740 ggacctttaa cctgactggg cctcagtttt ctcttctgca aagtagaagg aattatagcc 61800 ttctgcaggt caaaccctgt gcccacatcc acaggcacga tccccgactt cgcctcgctg 61860 gcacttctct gcatttgact cctggttatt gcagctgtgc ccatgccagg catttgttag 61920 gtgctgggat gtgcctgccc cgctcctctc tgttggggaa gacggaattc atgctgtagg 61980 ggaggcccgg agtttctaca tggggcagtc acagggtggg ggacttccct gaaaacttct 62040 tatttgcata aaatgtgcgc tgcttttgac ttatattgta aatttcagat ccataaaatg 62100 ggaaagactt tgcagaagct gttattcact ttacctgact gggagatgta gattgttcat 62160 atccaagggt gttagtttta atactaacat tagcatgtgg ggaagggtga tcgagatggt 62220 ggggagtagg gccccccacc acctacccct gggacctcta agggaaagta cacaccaccg 62280 tatgctagtt gcatcctgtt acctgtgctg cagagccaag gggccagagg cagggaaatt 62340 aattctgcct tgtaaaggca ctgggccttc ctgttgaatt ttgctacttg cggggaaggc 62400 acttcccagg caaaaagatt aagcctataa cctaagcaga aagcaagcaa gagctttggg 62460 tgggaagtgg ccagagacat agatcaggca gacccaggtt tggaagggcc aaggagacag 62520 cacatctgcc aatggcagca gctgggcctc acctgccctg acacccccac ctaatgggga 62580 ctgggcagaa ccctccaaat ggttgccatg ccctggccca ggagcctcca aaaaccctga 62640 agccattgac tcagcatccc tgaagcctcc ttccatgagt acccccatac caggctgcac 62700 ctcaatgcac cttagatctg gtgtttgatt ttcactttga ccagatctgc agcagtctct 62760 ttgttaatat ttatttccag tgtttacatt catctttgca taagtcctca gtgttactaa 62820 gtttatcaaa tagcgaaatg cttggccagg tctaacaatg tcaccaagct gcagaaggga 62880 ttagaaactc atagtattat tatttcatca ccactgagta caagagagcc ccagctaggt 62940 tctggggaga acagctatga ctcacaaata ctcccctccc aactcacaaa tactcccctt 63000 agaatctagt ccttaaatca ttcaaaccac aaaaatgtat tgagcactta ctgtgtgcta 63060 ggccccggta ggtgttagag gcacagaaat gagtttttta ttggccccca tccaatgagg 63120 tgacagacaa gagaaccagt gtgtgcagcc aatgttaatg tgacaaaaag tgcagagtta 63180 gtcccagagc gtgaagtcct ccctgtccta ggcccaggtg gaggccagga gctgctcccc 63240 gggctgcctg gaccagactt ttgagctctt gggaccctgg cgaacatcaa agctgttgca 63300 aaagtcagag ctcttgcaaa agttggagct ggcccatggc aggtggttga gaagtggcta 63360 catgactctt cccatgcaga gcggttagag ggtggaggcc gatttccagt atccctggga 63420 atccaaagaa agaggccact gaggggcagg ggagggcccc tccgaggctt ccagaaaaag 63480 gcagtgcagc agctgggcaa accaggataa ggcatgcatc cctaagccca aaaatcaggt 63540 gatgtgaggc aggccgagct ccatggcaga catgctgagc tgcctctgtg tgtcttggct 63600 aactctgccc tttcctaacc ccacggctca ccctgcccag gagcagggat gaggcccatc 63660 cctgattcag caaatcctgt gccataacaa ggggaggggt gggggcagcc acagcccaca 63720 agacccacca gtcccagggt ttgtgcagct ccaggtctcc ctggaaagca agaaaccacc 63780 cagctccaga cgctgaggct gcagattcag ctgccactgc ctgatggcct ccaacctggc 63840 tggattaact ggcccatagg gagctggctg cccccacaag ccagctccct ggcctccctg 63900 ggcaaactaa agccctcctc cctggctcca tagcgcccgg tcatcccctc attccagcac 63960 tttgcttctt cctgcattgt gtagctggcc tttctcctaa gagccttaaa agggcaggtc 64020 atctttggcc acctgcatgg ccccggcgcc ttgcttcatg ctgggtacac agcaggtact 64080 ctgggaataa caaataagag aatttgtcag aggaggtttg gcaggatgga ctattgcata 64140 gaactgcaca gactgtgcac tgcacgcctc cagagggcac tctccacagg gattactatg 64200 taaatggcac ctcctaaagt tgtgcagcat agggacccta gggcttgagc atgccccacc 64260 cgcctccgct gcttcaagcc cctggccttg gtgctgactg ttgggctttc ctcttcccct 64320 tcccaaccag cactgaccat catccttccc atacgctggc gatgggtagt aatgaactgt 64380 cccagtgagc agttctccca gactgggctg tcaaagcatg ctagtgagag attcctggat 64440 ggcaggcagg ccatctggat tcttgctcag ccaggaaact ctgtcctctg ggaatatcct 64500 cccagtcagg gtgttagggg gctcctggat ccccaagatc ttcatggtcc cctagaactg 64560 ctcctctccc cagcctgcag tgggcctaat gacccacatg tagccaggga gtggtcccca 64620 tggggtttgt tttattgact cagctaacaa tgccacaatg actctgattg ccttcttctc 64680 acctgagaga cccagctctg ggcagccaag gggtacgtag ggacagagca tatgcatgtg 64740 accctcaaga tctagaggag ctcagagaca gcatggatac tcgaagcccc cgtgagcagg 64800 gaggactttc tggaccaagt gggctgggag ctgggccaac tgtaaagacc cagggaaaaa 64860 aaaagtcaaa actgagttgc tcttgcatgc aagtgagtgg ttagttcatt gactccgtcc 64920 acagcccttt cctgagcagc tactgcagtg gttttcaaag tgtggtcccc acaccagcag 64980 caccagcaat tctggatgtg gagcccagca atatgttttc atcagtcctc caggtgaccc 65040 tgatgcagct caagtttgac ctgatgtgtc ctaagtgctg gggtttgcaa aagtgagttt 65100 tacttagttc tcaccttgag gagcttggag tgggggagaa gatagacagg aaagaaaaca 65160 gtactgtcca gtgagacgta ttgctctgga gggccatgga ggcagaggag cagttggtat 65220 aggcttgatc cttgcaaggg taagtggcct ggagacccca gtggcatgac tgtcctcggc 65280 agggaaccag atgttgggac cagcatcccc tagagggctc aaggagccca gtgccgaccc 65340 cagtgcccca gtgcccagcc accagggctg tggccctgag cagcaggtcc tcctactctt 65400 ccctccaccc cagatcttct gctctgctct tcccccttct tcttcccact cccaagtccc 65460 aaatagtagc aggtcttttc ctccgattgt cttggggaga aatgggcatg tacctccagg 65520 ccattatctt agagcacatt tttagaagat tttaaagtaa atttttccat taggcagaga 65580 acaccgtgta ttgatttggg tgcatctatt tctgctttac ccagacaaaa agatttacaa 65640 aatatcctag agaggaatag aattaaaaat gagtaaattt aacaggctca gagcgtagca 65700 ctttatttgt ctcatataat ccttgccaca cctcattaag gtgaggaaca tcagcccata 65760 gtgcagatga ggaaatgggg ctcaggaagg tgaagtgact tggccgggcc gccagctagc 65820 aagtggtctg gtgggatatg aaattccatc cctctgctgg gcccttgctg gctgaccttg 65880 cagtttacta aggtgactga tcctgaataa atccagagtg ttctaacgtt ttgctgagcc 65940 cgtgtcctgt tggctgcatt gtggggagtg gcctggcctg gctagggaag ctctcagtga 66000 ccaattgtgg cttcagctgt gttatttaga gaatcccagg ggctgaaatg atcctctgcc 66060 tggttaggga agggatgact ttaggaggaa gagggaccta atgccccact tagcagatct 66120 gcagctgtgt gcatgtttcc acctgcacat ccttctataa accctcagcc atgtgggtga 66180 gcagcagacg gtgcctcccc cactccccct ggaacacatc tgccctgttc actgacctgg 66240 gagctggtgg ggtggacctc agaccccagc acttggcaca cacacatcat cccctgggcc 66300 ctggaatggc ttgcatggat ggcagagaaa tagctgtgtg agcaaaggcc aagagaacag 66360 tttagcccaa ggcaccattt ttacaacaac aacaggtaat ggtactgatt atataagcct 66420 cacttgtcca gaggtcacgg ggcttaggaa cctcaattat gtggaaaaca aataggacat 66480 aacttcagaa ggttgcagag ccactgtgct agtgtggtct ttgtgttgct ataaaggaat 66540 acctgaagct ggggaatttg taaagagaaa aggtgttttt caaaaggaag acaaacattt 66600 gaatgctctg gatttattca ggatcagtca ccttagtaac ctgcaaggtc agccagcaag 66660 ggcccagcag aggagtggat tcatatccca cctgaccact tgctagctgg tggcctgggc 66720 aagtcacttc accttcctga gccccatttc ttcatgtgca ccatgtgtgc agagatcacc 66780 tggggagaga ggaagtaaga gagagagaga gggtagggag gtggcaggct ctttttaaca 66840 agctgctctc gaggaaacta atacagtgag aactaacagg gaacttactt gctcctctgc 66900 cctcccccca gccagggagg gaatccaccc ccatgaccca aacacctctt attaggtgca 66960 cctccagtat tggagatcag aattcaacat gaggtttttg ggggacaaac ctccaaacca 67020 cagcagccac caacattggt gttacaaaat ccatccaatg acataggctc atggagcgcg 67080 cttaagctgt catccaaaac atgtttactc ttggtttaca cacactagta gcagtctgcc 67140 atacctcaat ttcctttttt attttaggta acaacttttt aaataacctt actgagctat 67200 gcctcacatc accacgcaat tcacccattc aaatggtgag ttgcatggtg tacccgtgag 67260 gatcactccc cattttctcc aaatccccca ttctggccac cactaatcta ctttctgtct 67320 ctattgattt gtttattcta gacatttata taagtgtaat tatgtaatgt ctggcctttt 67380 gtaattggct tctttccctt aatgctttca aggttcaccc ctgttggatg catacttagt 67440 tctctttatg gctgaatatt aatccaccgg atggataggc cacattttgt ttaaccattc 67500 ctcagttgat ggacgtttga attgtttcca ctttttgggt attatgaata atgggtgaaa 67560 atgtttttgt gtggatatac attcttcctt ctcttggata tatagctagg agtggagttg 67620 ctgggtcata tagaaactgt ttaacgtttt gaagaattcc caggctgttc tccacggtgc 67680 ctgcaccatt ttacaatccc agcagcagtg taggagggtt ctgatttctc cacatcctcc 67740 ctgtctttta aaaaaatata tcattgtagc catcctagtg ggtgtgaagt ggtatctcat 67800 tgtggttttc atttgcattt ccctgagggc taatgatgct gaacatcttt tcatgtgcat 67860 ttgtatatct tttttggaga agtgtctttt ccagtctttt gcccacttta tgtaggttgt 67920 ttgtcttttt aataccgagg tgtaagagtt cttcagatat ttagaaacag gtccccttat 67980 cagttatatg atttcctgaa cttttctcca ttctgagttg gctttgcact ttctcgatgc 68040 tgtgctcttt cgatttcgtc agcagcgaat tagcaggacc tggggggctt taagaggtga 68100 gcaggcagac agacagcgcc cacaaagtcc tgaggatgag agaagaggca gagcttacac 68160 aaaggctctg tgaaaactga agatggaccc caggcaggtt ggggtgatcc ctggggtgct 68220 ggatgaggat ctgattttgt actgcatttt ggaaggattt ctgcccccag aggctacata 68280 ggctccagtg gtgtgtgcag tcaggcagag agatgcacag aacctctaca gtgtgccagg 68340 catggtgtgg ggttctgggt gcatgtggaa caacacacag caatcttgcc ctcccaaagc 68400 tcagggaagt gggggcgggg ggtggacaac gagcacatga gaaaaagacc acaggggaag 68460 aactcccaga aacatcccag ccacagcgca atgccccagg tgtatatggc ccttggctac 68520 ttcatgccct tgagggaaaa tcggtatttt cattttacac ttgatgaaac aggttagaga 68580 aaggactggc gtgtccagta cctcccagtg agaagatact cagagtagac cccagatcca 68640 ggtccttcct ctttccctct ctacacgttt tcagtctaga aaagagttct gtgcgagaat 68700 ttttttgttt ttgtttgttt gtttgagacg gagtctcact ctgtcgccca ggctggagtg 68760 cagtggcgcg atctcggctc actgcaacct ccgcctccca ggttcaagcg attctcctgc 68820 ttcagcctcc ggagtagctg ggattacagg cacgtgccaa cacacccagg taatttttgt 68880 atttttagta gagatggggt atcaccatgt tggccaggct gtgtgcaaga atttatgttt 68940 tcacttgtgg cttgctgagc cctggtgctg gctgtgggca catactcgtt cacccaggga 69000 catgcactgt tgatgggtcc ttgcactctg ggctatcttg ggccccgttt gctcaatgca 69060 ggcccctctt tctgaagcgc ttttcttggg ctcactctca attcgtcaaa gttcggctca 69120 ggcccacctc ctgcaggaat cctcccagtc cccgctgtcc gaagtcagta cccttgtcag 69180 gagaccttaa acactttagt ccactgcctg gccctcccat ggggcaaagg tctccagggt 69240 gtgtgtgcac ttccttgggg cttcttaagg ctcattccct gggattaggg aggacataca 69300 gagcctcctt gcacctacat ttgtttacat attacttata ccacatacaa cgttataggg 69360 cactgctgca taagtgtaca ttttgaatgt attttactta taaagaaata gagcagtaat 69420 aggaacatgt gcccctaaat gtaattttac tgaccagaca aaaaaaattt tttttaattg 69480 aaaataagta gctggacgtg atagcatgcg cctgtagtcc cagctactca gactcagaag 69540 tctgagacaa gagaattgct tgaacctggg aggcagaggt tgcagtgagt cgagatcgcg 69600 ccactgcact ccaggctggc gacacagcga gactccgtct caataaataa ataactaata 69660 aataaacaaa aatttaaaaa aattgaagat aactgtgggc tgcttgagga caagaactgg 69720 gttattttct ctctctttgc tcagtcagtc cccacatggg aggcgtgcga ggcaccccgt 69780 tcttggcctg caggccgccc ccactccatc tggctgcagg gtgccacagc cagcctctga 69840 ttgccagtgg ccccagcacc tcaatccata ccgacctcac agcaaaccct ccgtggccac 69900 agcctgccct ggccactcat gtctgaaagg tgatcggtgt ccatgaagaa gaggccatgg 69960 ggctgtggat gtcatgtggc caactgttag tggcctgcgc aagagcagac aggagctggc 70020 aggcaggccc atgggccagg cgtggctccc agccataaac acaggctgta gccctgccgg 70080 gaagaaggag gggacagaca agcctgggca gagacccaga ggggaccagg acacccgatc 70140 ctccatggca gttctgtcca cagcttggga ggagaggcag gcaggtctgc aggcaggaga 70200 caggcctcgg cccacagagc tgcaatctga tcccatctgc tccctctcca gttctataaa 70260 tagaaccccc agggagccag ggcccagaca gggttagtca caccctcacc tcaggccgca 70320 gggacaggcc tctgggactt ccaagacatg taccacctgt cctgccccca acccctgcca 70380 gccttcagca ggagggttca tgctgagcat caggaggggg cagaagaatt gaacgtggcc 70440 actgtccatg aagaagttag agaagagtac acacaacaca catgcacaca agaataggac 70500 acgtgcacac acacacacac atgcatacaa gattaggaaa cacaagtgca cacacaacca 70560 gtcagaaatg agctctgagc ttttacacat attaactcat ttcatcctca aacagtcttt 70620 agagaggtat aattagtgtt cccgttttaa aggtgaggga actaaggcac agaggagcta 70680 tgtaactcac ccaaaggcac ccagctactg gcatgtgagg ccatgatttc tccccagcag 70740 ccccacccac agcccgtgcc tttaaccacc tgcctgaccc ctcccagcca agtggctccg 70800 tccctacatc agaaaggtca aggaagaggc cgcctaggga gcagtacaag gcagcattac 70860 aacctggcat tttcctgttg cagactgcat tttggtggca agagaagctt tggaggtgct 70920 taacgtttag tttgcattta tcctaccgct gaaaagcagg gacccttagg accataagtc 70980 taggactttt catagcaccc tagactgctg gggatgaaag gggcttggag ctgagctggt 71040 gcagcagctc ctgttagaga agccacccag agaggcccag ggacctccta tgtcccagcg 71100 ccagttaggg gcagacgtgg gaccagctcc cctcggctgc agcggcctcc atatcagctc 71160 cctggaaggg agcagatgcc aagtcaggtt ctgagcaaca ccctcaaggc ccagccctgg 71220 caatcccttc ccacctgtga ttaggtctgg ggttcaacaa aaataggact caaaatctgg 71280 atcttctcgc cttgcttcac tttgggctgg ttcagttttg tttcgaggta aatcattcga 71340 ggtttttcag ggatcctcag atgcatgtct gcgtgaagcc gtcctggctt ccccttcggc 71400 tgccccctgg gcaagagcct gggccatacc tgtgccattc ctgagctctg tctctagctg 71460 ccctatgtcc agtcattggc gatgggtctt attcaagccc cctttccccc aacccacact 71520 agattgtaag ccctcagggt ggggaccgct tctcactcat ccttatatgc ttaggagtgt 71580 tcagcacaaa gtcactcagg agatggcagg cagcggggag agggcagaga cagaggagag 71640 gcttctgtcc agagggttcc tacttaggat catccaaatc atcagcaaat gttggaaaga 71700 tggtctgggg gcctcaggct ggctactctt cctccccatc agggcaaaac tccccggggg 71760 cttgtgtctc cctgtggttg gggacaggcc tgggtgtatc tgtcccagcc ttgactgacc 71820 acaaggggag acttggccct cccgaccaca ggagaagagg gatttgaatt cacctcggcc 71880 caaattgcag atgctggcct gcgagccctg aggccatctg caaggctcct gggctgacat 71940 aactgtcacc cagctcttca tcctccttcc ccggggctga aggggtgcct gcagggtctt 72000 ctgccctccc tccacctggg ccctactgct ggcacggagc ttcatttctg ttggcagcca 72060 gtgtttgctt agtgattact gaatgccgtt tgctgggtgc ttatgatgtg ctcagcactg 72120 ttctaagtgc tttacacaat tgacttattt actcctacaa cctgcccata agggaagtgc 72180 tgccatggtc tcccttttat agctgagaaa actgaggcac agataggtcc atggtcacac 72240 agttaacata aggcagagtc aggaccagaa tccaggcgga ctggctccag agcccggctc 72300 ctggaccgag cagccttgag tagggacctg gtgcagaccc gcctgccgtg gactcactat 72360 aggatgggtc aggaggcccg ttgtcaccta caaaatgtag cccaccaccc aggaaacgct 72420 cccagaacca ggcagaaaat actgtctcct attcacaggg tggctgtgcc tggcgtgagt 72480 gtcttggcgg gtgcctgcat gtctgtgcag gagtgccacc cccatctgtg gactcggaaa 72540 gcatgatccc cacaaaagca acccctcaga gtctcagctc agccaatccc tgttatcctg 72600 tgacaggcag ggccatgttt caaaaccatg ttaaagatga gcaagaggct aaggaagttt 72660 cccatgctgg cagaggcagg acaggaacac atgtcccctg actcttgaca ttgagaatgc 72720 acccccttcc acccacctgg cctcttgtcc cagccagtgt ggtcccagct atgcagctct 72780 ctgggacatc tctggaaagc tcattgttct ctgtctgggc agtaagacgg agtgaggctc 72840 tgactgccga ggcagacaga cctgcctcct gctcttcctc ccctcaatta tttgtgctgc 72900 ctgaaacaag ttcctgagcc tccctgagcc tcagttccct cctctgtaaa gtgggaatga 72960 taactgaatc tacttcctgg ggttcttgtg aggaccagag gcccatcacc cgaggaaagg 73020 cctgacagca gcaatgggtg tatggtaggc atccattaat aggaactgct gctgctgctg 73080 ctgccttata aaaggaaaaa tcacagtttc aaaaacctct taagattgca tgatttgtca 73140 tctgagagca gagattgtga tctccattga caaagatgga agctggggcc cagggaggca 73200 cacagacttg tctgaagaca cacagctgct tcatagcaga gccgggccca gcctcctggt 73260 tcccctgccc catctttatg tcagtccctg gatccactcc ctcacctggt caggtgtcca 73320 gaggttccag gagagtgttg tggaaaagta ggaagaggca gacgcccatg gagggtgttg 73380 aaagccaccc cagctgctct gctgcttcag ggcaggggat cttaagccct gtggaactgt 73440 aggctggtga agcttgtgga cttctgctca gaataatgtt cttacatgca ccagacaaaa 73500 tagcttaggg ttacaaatga aatatattat atggaaacac agcgaaaata ttttttaaaa 73560 aagactacag tagcattagg catgcttctt tattagcaca ttaaatgaca agctctagtg 73620 gcagatctaa tgtctaccat aattttattt ttacttttat tattattatt attattatta 73680 ttattattat tattattatt ttgagatagt cttgctctgt cacccaaact ggagttcagt 73740 ggtgcgatca cttcagtctt caactcctgg gctcaagcga tcctcctgcc tcaatgtcct 73800 gagtagctgg gacgacaggc gtgtgccact gtgcctggct aatttttttt ttattttttt 73860 agagatggga cctccctgtg tggcccaggc tggtcttgaa ctcctgacct caagcgattc 73920 tcctgccttg acctcctgaa gtgctaagat tacaggtgtg agccactgca cctggctagc 73980 atggttttaa atttgtgctc aatttaaatg gtattaggat aaattattta caggtaaatt 74040 tatgatatga tcttggtcag tattaatgaa aaattatgtt gcctaccttc atacttaaag 74100 gaaatagcaa attttagtta gaagttggtg acaattaata tataataatt tttccatcca 74160 agtttactgt agaccgatgg cccgagttca gggtttcctc cacatccact catatcttgg 74220 gctcagcaaa gaagatcaca gggcacccac tctatcttag gggcccattc acttgtctct 74280 cagtcctgcc ctcagagatc aaggtttggt gttcattcat tcattcattc agcaaacact 74340 gagcactgcc tccgtgccag gctatgatac acagtgaggt ccaaggtcag atgagatgag 74400 gtcctgccct caagctgttc accatgcttc agggagagca taagaagaac tgctccaaga 74460 tgcaaaatgt agacaagcat agggacatgc tcacccttcc tggtcatcaa acacccagcg 74520 atggtgaggt tggggttaga tggtcactcc tggctagtga cactgtccat tgcctaatcc 74580 ttttgaaaag aagtatggca ctgcatcaca ttggtcatgg aaattccaga gttccctttc 74640 ccagcactct cactctgcca gtttttcccg aggaaatcat tcagcaggag ggacaaaggg 74700 tggagggcag aagtcatccc tgctcttcct gagtctgtgc tctccccagg gaaggggctg 74760 tgttgtgttc agcttgttcc cctggtgctg acacgtggta gcactcggtg aacacctgct 74820 gggtgaatgt ctgactgccg tgtagttacg atgtataaga ggagggaggt ggcagaaggg 74880 gcagtccagg agccctccac tgaccaggtt cctgacttct cttgcagcca ccaaaatgcc 74940 agaagagatg gacaagccac tgatcagcct ccacctggtg gacagcgata gtagccttgc 75000 caaggtcccc gatgaggccc ccaaagtggg catcctgggt agcggggact ttgcccgctc 75060 cctggccaca cgcctggtgg gctctggctt caaagtggtg gtggggagcc gcaaccccaa 75120 acgcacagcc aggctgtttc cctcagcggc ccaagtgact ttccaagagg aggcagtgag 75180 ctccccggag gtcatctttg tggctgtgtt ccgggagcac tactcttcac tgtgcagtct 75240 cagtgaccag ctggcgggca agatcctggt ggatgtgagc aaccctacag agcaagagca 75300 ccttcagcat cgtgagtcca atgctgagta cctggcctcc ctcttcccca cttgcacagt 75360 ggtcaaggcc ttcaatgtca tctctgcctg gaccctgcag gctggcccaa gggatggtaa 75420 caggcaggta ggttctgggg gaataatacc catcgtaaca ataaatataa atggctaatt 75480 ttcatcgagt gctgccagca tgctcttttt gatatgttat cataactaat cctgcatcac 75540 tgcaaaattc cattttacag aacaggaaat tgtggctcaa agacattaat gatcttactg 75600 aaaattccat agctggtaag ttgggatttg aacccagttc ctatggatct gaaacccatg 75660 ttctttctgc tatggtaaca gggtttccta gagggcaagg aggaaaaggt tgatggcttt 75720 ttgctatttg gagccaagaa ggagagagac ttggctttta gaattggact cagaaggagg 75780 aaagtaacac acttatgtac ccggccctga ggaaggcagg catgtctcaa attttatcgt 75840 atttattcta agggcttcca agaactgatt tctcagaaaa gtcaacagca ggtttttctg 75900 gggctagata atggctccac ggaacagcta gagctgcata cgtttcttgc cacgaggagc 75960 tcttaccaag acaaggtggt ttttaatgcc accttggttt ttaatgcatt ttcttggcga 76020 aagaatgcca gactccatgt gtgagaactt ccaccagtga gtcgagccca ggtgccaggc 76080 tctgtaggac agtttaaagg tgcccagcca tacctgacta cagcacctta aatgcaggct 76140 gcatcatggg actcccaggt atggaccagg aggaacagtg gagagtgttg gatgcagggc 76200 ctggagggaa cggagcaagc aagctggctg gaaaagactt ggaggagggc tttgacctgg 76260 gcccacctca tgctgtcagg ctcagggagc agggagtgca ttccagtctg agggaacaat 76320 ctgaaaaggc acagagataa gaaacaatgc tcctagacct cagttttctc acctgaaaaa 76380 tgaagactat agtacctacc tgcgggctca tggcaaggct gagagatcat atatgtaaag 76440 ctcagcatag agtaggtgtt cagtctgtgt ttggagacta aactgaccaa tgcagtgtca 76500 acaaggccca cggggtgctt ggggatctga ggactgcaat gtgcctgcag ggggacctcg 76560 tgggtcagag cagcgggctt caaggcggag agggcaggct ggagctggct tgtagaaggc 76620 cttatgtgct ggctgagggc tctactgagc cgagggacat catcaagggg ggtgattctg 76680 aactgaggga tggagctgca gccacagctg cccattctgc accatacgca aaactctttt 76740 gctgagcggc tcccagggca ggccacggcc ttggagacag ccatgtcggg ggcccatggg 76800 gactacctgg atgagcattt tgcttgtggt tgctgatgtc cacgagctgg gcaagatgct 76860 tactgtttgc agcttccctc cttgagtagt tggcctggct tggcaggtgg gccagaggct 76920 gggaggcctg ggcagcagag aaaagacccc tagcctggga gctagaaccc cattggctcc 76980 cacctgtacc attgactggc agctcacttg aacaagtccc tgcccctctg gccctcggtt 77040 tcctcagctg ctcagtgagg ccctgcccac tcctgtggcc tgtgacgccg tctgactgcc 77100 ccacttttct cccgcaggtg cccatctgcg gtgaccagcc agaagccaag cgtgctgtct 77160 cggagatggc gctcgccatg ggcttcatgc ccgtggacat gggatccctg gcgtcagcct 77220 gggaggtgga ggccatgccc ctgcgcctcc tcccggcctg gaaggtgccc accctgctgg 77280 ccctggggct cttcgtctgc ttctatgcct acaacttcgt ccgggacgtt ctgcagccct 77340 atgtgcagga aagccagaac aagttcttca agctgcccgt gtccgtggtc aacaccacac 77400 tgccgtgcgt ggcctacgtg ctgctgtcac tcgtgtactt gcccggcgtg ctggcggctg 77460 ccctgcagct gcggcgcggc accaagtacc agcgcttccc cgactggctg gaccactggc 77520 tacagcaccg caagcagatc gggctgctca gcttcttctg cgccgccctg cacgccctct 77580 acagcttctg cttgccgctg cgccgcgccc accgctacga cctggtcaac ctggcagtca 77640 agcaggtacc caccccatgc ccttcctccc tctggcaact cagcacatgc ttgtccagca 77700 cctccccccc ccaccaacca ggtgcagccg atacccacgg gtgcagcctt accaggtgcc 77760 aactgcagat tctgttccaa tggggcagca cccacatcct cctgcccaag attttgagta 77820 tcagtgaaca aagcagatga aaattcctgc ccccatgggt acagcccagt tggggcagac 77880 ttaaacaaaa tacagcagtg agtcatagtg ggcgttgaga ggatcaggag tgctaaggcg 77940 caaaggaaag caagcgtggg cggtgggggt gcaggtttga agatggtcca ggaggacttg 78000 cagagtgagt gctatgtgag cagagctgga aggaggggag aggggccggt ggcctgctgg 78060 ggtgatgttg caggccacgg ggcatagtcc ttgggcagaa gtgtgcctgg tacgttggag 78120 gagcagccag gaggcccatg tggctaaagc tgaacaagga gggggtggca ggcgaggcct 78180 gagaggaaga gcttcagcct taggctccga gtgaaatagg gagctggtga aggtttgaat 78240 ttaggtgttg atcggcctga cattttaagt ggttctctct ggtttttggc tgagaacaga 78300 ctgtaggagg tcaaaggcag ctagctgctg gggccagcga ggaagccgtg catatgccca 78360 gatttgaggc agtggaggct ggaggcagtg ggagcagtgg aggagcaagg agatcctgaa 78420 ggcacatgtg aagctggagt gcatggaatt gccgctggaa tggccccagg gttttgtggg 78480 tgatcaggga tgactctggg gtttgggtct gagcacctga aagagagagt tgccatcagc 78540 tgagatgggg aaggctgcag gagtgagcat tccaggttta ggtttgttgt tgttgttgtt 78600 gttctttgtt tgttttactg ggggtggcac taatcattca tttagaaaat tcatatgggg 78660 cttggttgcc agcagggttc ctgggaagtg gaggaccttc aggccacacc aggtggggac 78720 ccaggcatca gctggcacct gtgcccacag aaacaggccc ctgatgctcc ctcctggtcc 78780 acaagctcat ggggcttgat tcttagtccc aagctcacat cttcagcaac actgtcttta 78840 ttttctccaa attaattcca cctccagtgc ccagccccgg ggctggttga tgcataggtc 78900 ctgcccactc caggacgcta gtcacccaac agggttcagc ccaggtgctg gtgagacact 78960 tctcatccac ccctcattcc agcctggcag cccctgcagc tcctgctcct gctcagaatg 79020 cagggacctt ggtgaggctg ggccctcccc taaacaccta gcacagggcc atcccctccg 79080 agcatggggg attggcagga ctgggaagca gggctgggca cctcctgaga accacagacc 79140 tcagccccta ctcactgtca gggttgctgc ttctctgcca gcagctactc gactgccctc 79200 gtcctttgcc acccacagat accggcatca ttgcatctgt gggctcagaa tttcctaaga 79260 caaaggaaga accccagact tcaggcagaa aagcaagatg cttgatggaa atgagaggaa 79320 gggaagaaat cagtcatgaa cccttaacaa gagctcgctg tgttccagga accattctaa 79380 gagcttcgta caccactgtg aattcattta accccatctc atccctgtag gccaggtgct 79440 attatatcct tatttcatag atgagaaatc tgaggcacag aggggtcaag taacttggcc 79500 aaagtcacac agtcagtaag tagcacagct gggattcaga tccagctatt ttccagatcc 79560 atgcttatac ccacgctgct ttctacaggc aaaccaaatt cacaattgag taaatgattt 79620 cagaactagg tcattcattc actcattcac tgagcaccta ctctgccagg ccctggggcc 79680 acagaaagga gtaagaaaga cacagaccat ctggctcctc gcctcagctg gtgtggggcg 79740 gtgtggaggc ctgaaggcta gaggctggac tcctgctctc cagcatcgct gactggaaca 79800 aagatcttga ccttgagcaa gtcacagccc ctcttttgtc ctcgaggccc tgatgtgtag 79860 atcaagctct ctcctagtgc taatgttttc aatgctcttt gacgatattt tcttactgac 79920 ttctacaaag caccagcccc ttggcaggag gctctgcggg gctccctggg gactagtaca 79980 atgttgctgc ccaggacggg gcagatctgc atggaggagc ccactccctc tcccctgagc 80040 tggcaggtat ttccagcagc agtgggaaag acggggacgg tgcccactac cccccagggt 80100 aaaagacaca ccactgctcc ctccctcccc tgccaccctt caactgcctt tgtctaaatt 80160 ctctgccctg ccaaggctct ccctgatatt ctgttaaccc aattctgccc tgatgcaaat 80220 accagggcac agaggggcgc atgcaaggta attttccccg tgtcccaaaa atctttaggg 80280 ctgcaggccc tggtgaggtt gccaggcaac catccctccc gcaggacgag atcagtcaga 80340 gacaccgaag gcctctcatg caaaggggct taaacttgtt ctgcagagtt cttaagggca 80400 aaaccagggc tgatgtggtt atgtcggggt gggtggtcgg agggaggcag gggcttgaca 80460 cacagcagcc cagatacggg gaggtgccca agcctgggca catccaagca gattctggat 80520 ggtccatggt aagccatgcc cgcggttctg ggcctgggca cctgaggctg ttctgccttc 80580 agccccaaac agcagggact cctgggtggc tcaggcttga tgtgtggctt ctgctgccag 80640 cccatgggca cctcaccaca gggtccccac atggccactc accaccccaa ctgcccacta 80700 ggcccttggg tcaagggagc acattagtct aggcacaaga aactcctcca agatttcctt 80760 acagccctga gtctgcagat taggaggcaa aggtgtatgc cagctgtaga gaaaaccttt 80820 gagaccatgt ttacagacag tattattacc aacaataacc gatatttgta cagggcattt 80880 ggatttgctt gtgtatttcc ctggaaatac acatttcaac atcaaactca aagatcaaga 80940 tcaaagaaat gtttaacctg cacactgttc tcctgttacc ttcaccccgt tctcctatta 81000 ccttcacccc aagctacatc tgcacatggc tggcacagga tggtctgaaa ctctcatctg 81060 accatgtcac tgctgaaaag atccagtgac cccagtgtcc ttgggataat ggtagaaccc 81120 tcactatgca gctagactcc ctccgcagcc tcatctcccc ttctcctgtg acgtgtcaac 81180 acttgggtcc catactgtcc tctaaatggg cagagctcat tcctctcggc ttggaacgcc 81240 caccccagga caccttgaca gcttgcaaac tcctattcct ccttcaaaac cctacctctg 81300 ttaagctccc ccagactatc cccttacttc cccatacctg cctctgtaat ctgttgcatt 81360 ttgtaaatac ttttttatta tttttcttac acactacttc atacccgact cagaggtcca 81420 tgactgggtc ttctacacct tggggtccat ggttcctaac acaggttcac agtgcatgct 81480 cactgagtga ctgattttta aattggccac cacagagcca atatcaggca tcttaagagg 81540 agtgcacgta gagcttggag caagaactag tctaactgcc ttgctgccac taagaacaac 81600 agccatttat tacattaagt gcccactgtg tgcctgttcc atgctactca ttccacaaac 81660 gtaatgcttt tagtcctgca gtaacacagc aagatacaat gatgctatga gccaggaaag 81720 ggactgccca gggtctcatg actgcccacc agtggcagag tcagcgtcag aatccaggcc 81780 tatggtctct atgccccaag gttgcccttc cacaccctgc caccccctcc tcctctgagt 81840 ctggcaggca gtgagttggt accactctct tcccatccat cacccactat gaagacatgg 81900 agaggggcta atgctgcagc ctcactggtc cttcagcgtc tgacctgcaa cctagaggga 81960 aatcccacac ctgaatgctg tctttccatc tcttgttgat gaacactctc cttggccttc 82020 tcaaggagaa ggtggtgaac ttgatcatct ctaaacatag agacttactt actaggggag 82080 ctgttacatc tgcgttccag ttagccatgt gtgccactgg tcaccaggga gctctgagca 82140 caacactgtg gtttaatagg ctggctgaga atctcatgga ctcctaaggc tggcttaggt 82200 tctgtcctca tgcgggtctt tgccatccac tgctccctag cccacctcat ccctcccttc 82260 ccagcgtcac tgcagactgg aaatgttaga ggaaaaaaac aaggcatttt acaagccaat 82320 gtggtatacg tgtgtgtaat catccaaact ctgacttgtg acattaactg cctgatcttc 82380 ccgaggcgca gagaggaatg actaatgaag cagagttaaa gaacaaacaa cttccagcga 82440 ggagatgact tactcaattc atgctgtgag gtgtgagtaa gacttctctg ggcagaggta 82500 cggaggagac ctctctgccc tctgcacgcc tttccagcta atggtgactt caaccacagc 82560 aggcacataa gcaaaatcaa gagaatttca gacatgacct catccaaacc tcctaggtag 82620 agaaactgag gcccagagac agtcttgcca gagtcacatg ccactggtgg tcaggacaag 82680 aggctgggtc cctagactcc tggtccctta gtggcttaaa gtcaccaaag tgagccaggc 82740 ctgccctaaa atagaacaga gccaatcatt tttcacagat tgcaggaaaa gcactcaatg 82800 gatggcattt tctctgtttc tttaaacttt ctcttataag ctgtacaacc attttgctca 82860 gcccagtgga ttcactttta atattttatg tggtaactga gctcgtgttt ttttttttct 82920 gctgaaattg tttctcaaaa aacctgtatg agtcattctg ttttgagagg ctgcctatta 82980 aagtgtagtc acatcttcta atggaaatac tgttccttgt tctgctgaca ttatagaata 83040 aaagtaccag catttcacag tgtttcacag agaacacctt gacttccagg aactctgcta 83100 cccggtctag ttgcaccttg ataaaagttc ttcctcatga gggcactatg cgagtgagtg 83160 ttggctgggc taggaggggg ctcagtggca aggtggggag agaagggtca gaaatctcca 83220 ggttcatagg ggctccccaa tttatatgtc ctggaacttg gtgggggggc ccagatctct 83280 gtgagggcag ggtaagggca ggtatcttta ttttctgtag cccagggcct ggcacacagt 83340 aggtgcttcg taagtggtca ctgaactgct tggtgaatgg ccgtcagtct ctcttgcctg 83400 gcaaagttga gccaaggctg tgtgcctcag gcagaagtag agaactgggt aggaagaggg 83460 gaggctgaga gctttgggtc ggggagtgtt gggggctcag tgtctgtatg tgtctttgta 83520 tgtcctgagt gtgagccagt gatgggggca gtgtggggct ccaggaagac agagggctca 83580 gggtgagaca ggctgggaag ggaagcagcc agtaaggtgt gagctcattg gctgagggga 83640 ttcagagcta ggagagctcc tctctcctgt cctgggattc tggggccgga aaaccgtgag 83700 acggagccat gcttaagggc tgtatttctg gttgactcct tactctgctg atgtgactgt 83760 tctgattggc tgccccgggg cagatatgtg aaagccccag gagccccggt cattggcacc 83820 aggctgagtg ggtcctgatc ccagctctgc atctgttagc tacatgtgac cttgggaaag 83880 tgatttgatc tttgtgcctc atttcctcca tctctaaaat gggctaatag tgatctctac 83940 tttgtggggt ggttttgagg attcgatgag ttaatgcctg agaaacgctt atcacagagc 84000 caggtagcgt caggtgcagt gtgagcgccc gccgtcttgt ctttcttgtg tccttcatca 84060 ttgccctccc ggggcaccag cctttgccac agtgttcatg gttttccttc catccatgtc 84120 aggtcttggc caacaagagc cacctctggg tggaggagga ggtctggcgg atggagatct 84180 acctctccct gggagtgctg gccctcggca cgttgtccct gctggccgtg acctcactgc 84240 cgtccattgc aaactcgctc aactggaggg agttcagctt cgttcaggta aagtagtctc 84300 tagtctgcca gccagcttca gcgtggccct ggcccacctc tcatgagtaa gtgctctgcc 84360 tttgagaact gcctgggctc tgatcatctg cacagcagga ccactcggtg agatgccagg 84420 ccttcctgac ccagagggcc catccaagcc tcttgatagg ggctgcctgc tacaagctta 84480 acctcccaac acatgaggaa gccagacaca ggcatgtgaa aaaattacag accaggacac 84540 tgagccctgg gtccaccatt ctcaagcttc tagaattctt gagctttcca aacaaaattg 84600 aatgacatga agtcattgga cattttgctg gtctaggtag gagtcatcat ctacctagac 84660 atccatctag gtaggagtct agggagtgag cgagcctagc ccaccaccct ccacccctca 84720 tctcaacctg gctctgttgt tccccttaac cccttgattc atgcagcgtg gatgagacac 84780 aagcattagg accccagttt ataggggatg cgacacagct ttttcccaag gatgccattc 84840 ctatgaaaaa atccagaaaa aggaggtctg tcatcagatg aatttgagaa aagatttact 84900 tccccctaag agatcacaat gcactttggc acatcaaaga ttcgaataac atctacaaca 84960 aacaaacctt tgttaatcag acttattgga gtgttagcac cctccccctc cttttttcca 85020 aataacagct atcagcactc cacaagctgg gcgctgtggc atgtggctgg gatcccagct 85080 actaacagag gctgaggtgg gagaatcact tgagcttgag cgattcttcc aggagttaga 85140 agttcaagtg tccagcctgg acatcatagc aagaccttgc ctcttaaaaa aaaaaaaata 85200 ctccacagaa catactctgg gaaatgctgc tagtggcaaa agtttctttt tgcatttgtt 85260 cattcaacaa acatttattg agcacttact gcaggccagg catcctgcta ggcctgtgat 85320 gcaatagaga acaagacagg cagagccatc tttccatgat aaaggaaacg gaggcaggga 85380 cattgtttac atttctttgg catctcccac tgttctccac acagaatctg cggtcagtgt 85440 tggcggatta actcctcccc tcccatgagt gggagctgac taatgctgta tcctgccatt 85500 gtaacagggc agagaacagc catcctatcc acccccacta tcaacagaaa tctgtgcagg 85560 gaggacgtgg tacaggactc agggacagtg acagcgtaat gctcttacgt aatccaaatt 85620 aattgctcct gaccagggat gcttcacatc cattggaaca acacagagtt gtagccgtgt 85680 gttttttaaa gtgtgtctgc ctctgaatct ccctggctct gctcatctca gaaggtccct 85740 ggaggagggc tcatggctga cacatgttag catacgagaa ggggaagaat tttatttatc 85800 tgccactaat ccccatgtgt ctcataccca aatctaggat tttcctcttc ccacctggag 85860 tatccggcgt gcatggttta tccacaatta aagcagactg caggctgctc ccctcaccag 85920 aaagccgctc ccttaagcag ccatagatta catgccctgg ctctgcctgc cagagaaagc 85980 cggtggattt gattttgtta gcaagagctg actgagaccc tagcagctgc attctacttt 86040 acatattaaa gagtggaaat acaaatagga cagtcctttt gccactgcaa gagcaggggg 86100 ggttaggtgg gtagaaaggc aggattttac ttgtggaaat cagtgcctgc cttccatcca 86160 caaaaaccag atgtcaatat ggaggaggca catgtcagcg gcgcctggga agcctgagtt 86220 ccagctttcc ctccccacaa ccctgctctg taactgtggg cagagcatgt ctgctccaag 86280 agcctcagtt tacacccctg aaaaatggag ttaatgcctt acagggattt tatgagccac 86340 agtaagagat tatgtgtgaa agaaaaataa aaagcatttt gctattattc ttagggtatc 86400 tggccacatt tccattatct ctgactaagg taccaaccac cgatttctga gttcagtagg 86460 agacagtgag acagaggcca aggaacccca accctgggcc taaaagtggt ccagtcagtg 86520 tttgcaaact ggcggacact cactagtggg tcatgcaatt gattccatgg atcacaagca 86580 gcattttaaa aatgaaataa aatagaatga caaagaaaac agtggagtgt tttgcatggt 86640 gtcgggatac tttttcagtt atatggaatt gctagtttta tttgcaaatg tagcatacct 86700 cgttgtctac cggacagcag agtaaaacat ggttcttact gtgagtccct gtcaaatagg 86760 ctgaagccag agccctcttg gagaaacaga gataacccag gcctgcctcc catccgtgga 86820 ctcagatgct gagggatggc tctggcaatc tatttttgca gctccctaag tgactgatag 86880 gtgcgcatgc cgcagtgtgt ggcaacttcc agtgcaggaa acacaggcag tggaacccga 86940 agacctgaat ctcagtccca agacccccac ttacctgccc cgcatcatca gacaagtttc 87000 ctaggccctc ggagcttctg ctgctcactt gtgcctgtgt ccaccccata tggtcatcaa 87060 gaggatttga gctggacacg ttaaatgcag gatgcgtgca gccaacagtg gcatgctggc 87120 ttttgaggta agctgcaacc ttctccttta aagttagcgt ggctagtgag aagttacctg 87180 agccccatca ccctccccta cacacatgtc cacagcagac accaggctat ggggacagcc 87240 atggttcttg aggggccttg gctgacccct agatctgtaa tgcttttgtt accggaaaag 87300 ggtcccgatc cagaccccaa gagagggtta ttggacctca cgcgagaaag aattcaggac 87360 ctgtccatag agtaaagtga aagcaagttt attaagaaag caaaggaata aaagaatggc 87420 tactccatag tcagagcagc ggcatggctg ctcagctgct tatacttatt gttacttctt 87480 gattatatgc tgaacgaggg gtggattatt catgagtttt ccaggaaagg gatggcaatt 87540 cccagaacta agggttcctt acctttttag accatatagg gtaacttcct gacattgcca 87600 tggcatttgt aaactgacat ggcgctagtg ggagtgtttt ttaacatgcg aatgcattat 87660 aattagtgta taatgagcaa cgaggtcact ctcgttgcca tgttggtttt ggtgcttttg 87720 gctggcttct ttactgcaag ctgttttatc agcaaggtat ttatgacctg tatcctgagc 87780 cgacctccta tgtcatcccg tgactagcaa cgtttaacct cctgggaatg cagcccagta 87840 ggtctcagcc tcattttacc cagcccccca ttcaggtgaa gtctctctgg tttgaacacc 87900 tcagacactt cgtttagcta aaaaccattg aaacagtgta ttgattccac aaagaggtga 87960 cttgtgcttg catttatcct tttgttccca aatctgtttt caaagtttta catgttgttt 88020 tgtgttcctt tgggtatttt tttttttttt tttttttttt ttttgagacg gagtctcact 88080 ccgtcaccca ggctggagtg cagtggcaca atctcggctc actgcaacct ctgcctcccg 88140 ggttcatgcc attctcctgc ctcagcctcc caagtagctg ggactacagg cgcccggcac 88200 cacacctggc taattttttt tttttttttt ttttgtattt ttagtagaga tggggtttca 88260 ccgtgttagg caggatggtc tcaatctcct gacctcatga tccgcctgcc tcggccttcc 88320 aaagtgctgg gattataggc gtgagccacc gcacccagcc ttcctttggt atttttttgt 88380 tattgttttg gtttggtttg ggttgtgcta agtgtttcaa ttcagccagt tttaactggc 88440 tgttagatat tagactgcaa aatactccag tcagagcagc tcacctgcgc agaaaaatga 88500 gggttcagct tttagaacct aagttctttc ccagagttag aggaactgcc tgtgaccttg 88560 cccactccag ccacctgcct gaaataatga caagaccagc ctgaccccag cttcatgagc 88620 aattgtccaa agcccctttg tgccgtagta attgagcacc agcaggagct acaacgacct 88680 ggctgtttct tttttgctaa caagcttacg tataataaaa atggctctag cttggggatc 88740 ttattaatcg cctcatgaca atccctctcc ttttgggctt ctttgggttc tgggattttt 88800 aaattgttcc caaggagagt ttttgggaaa caaactccct ggaatcatgc aggcttccca 88860 ctgggacagg aaagtcaaag gccctttgtt attggctggc ctttggctgt cagcccttgc 88920 tatgaaccac tggcctgagg ctggaacttc ctgctgtctg caccatggga ttttgaatgg 88980 cacaagaatg aggctatatg aacaggagga gctgactgcc actggtgggc ctgggagcag 89040 cgtctccaca ctgtccctgt gcagagccca gagtgcccag caaaattcat cactctccag 89100 atcaggggct ggggacagtg gcccacacag accaaacact ggagctacag ggcatgtcac 89160 ccgagggaga tgcaaagacc tcactggggc tactaaggct ggctttccag gcctggatgg 89220 gctcccattg ctgcacctcc tgggaaagcc cacgacacag aggtgggcgc caaaaggctc 89280 tcagtggggc tttgtctaag gaacagatag gtccaggtct tcctcaggca agtgacctga 89340 gcagaggggc ccgtgtggac ttttcaccct gaagctagaa gggtgtggtg acgacagtct 89400 cctaaatgag tggctttagt cctagctgcc catcagcctc atccgccgaa ccttaaaaaa 89460 caacagatgc cccgccccaa accaacttaa tctgaatttc tggaagtggg gtttgggcac 89520 tagtatttta cccaagctcc ccgggtgatt ctaatgtgta gcaaggtttg aaaaccacag 89580 tctaaaagcc acagactgtt aaactcttgg ggataaaggg catcacccag ccatcttggc 89640 aacaccaata agtccacaat gaggaggggt gggagggccc acagttagtt agggctgggc 89700 acctggctgg ggaacatcag ggtgattgac ttcaagactt actctttttt ttttttttct 89760 ttttttttga gacggaattt cactcttgtt gcccaggctg gagtgcaatg gcgtgatttt 89820 ggctcactgc aacatccacc tcctgggttc aagcgagtag ctgggattac aggcatgcgc 89880 caccacacct ggctaatttt gtatttttag tagagacggg gacggggttt atccatgtcg 89940 gtcaggctgg tcttgaactc ccaacctcag gtgatctgcc cgcctcggcc tcccaaagtg 90000 ctgggattac aggcgtgagc caccgcaccc agccaagact tattcttgat ggtcagtgct 90060 ggggactttt ttaaccacag tcttccacac taagagatta gaatttagaa aagttggggt 90120 ggctcagaag ttgcagggga tttggaattc ttgacagaca cttctggaag tggcaaggat 90180 ttgcttatgt gcaactgaca gtcaaggagt cttctctttg ggaggtgacc acattaaaat 90240 gataggaatt cactgtgggt gacagcataa agccaatcgt ggcttcctca ctcttcgtgg 90300 tgagccagaa gttgttaaag actgggccaa gaagattcca aaaatggaca caaagccaag 90360 aagaaccaga gagggtgagg aaggatagag aaggttttat ttggttattt tacttgggcc 90420 caagaatgtt gaacgtgaga acctgtctgt gaaattgtag tgtgcagcca ttggaaaatg 90480 tttattatta tctttagcaa aagctttaca agcaattctc ccacaccatg ttctttcact 90540 cactgacgtt cactgtcctg gtgtctgtcc tggagcagga aatgaaggga cacacacaca 90600 cacacaccag ggaggagcaa gaacggggcc caatgtggaa tcagacccac ttagaaacac 90660 ttctgagggg agtgcaaatg agaagcgtct gtcagccgag gctctggatt gatgccaaca 90720 agctgggcta gaagggaatc caggaggctc agtccatgca gaccacccag aggtctcagt 90780 gtgccgccac acttaaatta caccctcgca atgtctcctt ggagaaaatg catatgtgtt 90840 cattgcttga tgggtcatcg ctatttccat ccctgtgtaa tagacgtggg aggtctctcc 90900 caaagctctc agtggctcac cagtgctagc agaattcagt cagagcaccc ctgtgccacg 90960 actccctcgc tctcggtgcc ctctgctgtg tcacttgcct gccctgtcta ggggactaga 91020 tggaggctac tgcaactact cagcgcttcc ccctctgact ttagctttgg aaattactta 91080 tctcccactg aagttgatta agtcgcctgc ccagggttca tatcagttga accagcacca 91140 acagtagaac ctgcatctct tccttcgtgg tccacgagaa ctcgtacatg ccaagaggct 91200 ggagtcatag agcagcactt cccagccatt ttcacattgc atctcttaca gaaagtcatg 91260 ctttgggtgg tggatcagcc actctcggct ggaagtgacc cacaaaagcc cacacattgt 91320 tcaaggggtg tgaagctcca ttgtaaaatg gccgggacca tttccattta gagttgggat 91380 ggtctcttct cccaacggtc actaatctcc tccagatgga agagtaggcc cagcggggtt 91440 tccacccggg ttgtttataa cccagtgtgg ggtgggaggt gaaggtctag catgcacaga 91500 gggcatctgt gtggtgttct ggggctttct atacggtgcc aggtcaccca gaccacaggc 91560 cccgtgagtc cccttcgcta ctggtgccaa atccacgtgc catctgtaaa ttatttactc 91620 tgcatttatc ttcaagctaa tttaaaatca atccactttt tgtctgatct taacttaggc 91680 caaatgttat ctgtgaaatt atgattttgg tatgcaagca gacacttgtt actctaatat 91740 acattaaaat acacacataa ctagtaaaat ttatacacac acacacacac acacatatac 91800 atgtatatgt atatatatat ttagagacag ggtcttgctc tgttacccag gctggagtgc 91860 agtagtgcag tggcacaatc ttggctcact gcaaccttga cctcttgggc tcaagtgatc 91920 ctcccatctc agcctcccaa gtagctggga caacaagcac atgctgccac agcctggcta 91980 atttttttgt attttttgta gaaacagggt ctcactatgt tgcccagggt ggtcttgaac 92040 ccctgggctc aagcagtcca cccacttagg cctcccaaag tgttgggatt acaggcgaga 92100 gccaccgcag caggccttaa atgtttttta aacttctttg aacttaattc catctgaaat 92160 catccagcag cctccagaga taacaaataa caaagttaag gaaaaagcat ggtcatatag 92220 ttattgtatg gaatccgtgt gaattggtgg gtccttagac accttcagca tagaagcatt 92280 attcccattt tcctgttgtg gaagctgagg cacagagagt tgagagttat cataagatca 92340 cactaagaga gtgacaggac tggggttcca acccatagcg gtgagtacta aagccaccct 92400 ccttcccctc cgccaggcca gcagatgagt cgttggcagg atcactgcat ctgtcatccc 92460 ctcgccctca ctccagcctt tttttccctc cacagtcctc actgggcttt gtggccctcg 92520 tgctgagcac actgcacacg ctcacctacg gctggacccg cgccttcgag gagagccgct 92580 acaagttcta cctgcctccc accttcacgc tcacgctgct ggtgccctgc gtcgtcatcc 92640 tggccaaagc cctgtttctc ctgccctgca tcagccgcag actcgccagg atccggagag 92700 gctgggagag ggagagcacc atcaagttca cgctgcccac agaccacgcc ctggccgaga 92760 agacgagcca cgtatgaggt gcctgccctg ggctctggac cccgggcaca cgagggacgg 92820 tgccctgagc ccgttaggtt ttcttttctt ggtggtgcaa agtggtataa ctgtgtgcaa 92880 ataggaggtt tgaggtccaa attcctggga ctcaaatgta tgcagtacta ttcagaatga 92940 tatacacaca tatgtgtata tgtatttaca tatattccac atatataaca ggatttgcaa 93000 ttatacatag ctagctaaaa agttgggtct ctgagatttc aacttgtaga tttaaaaaca 93060 agtgccgtac gttaagagaa gagcagatca tgctattgtg acatttgcag agatatacac 93120 acactttttg tacagaagag gcttgtgctg tggtgggttc gatttatccc tgcccacccc 93180 acccccacaa cttccctttt gctacttccc caaggctctt gcagagctag ggctctgaag 93240 gggagggaag gcaacggctc tgcccagagc catccctgga gcatgtgagc agcggctggt 93300 ctcttccctc cacctggggc agcagcagga ggcctgggga ggaggaaaat caggcagtcg 93360 gcctggagtc tgtgcctggt cctttgcccg gtggtgggag gatggaggga ttgggctgaa 93420 gctgctccac ctcatccttg ctgagtgggg gagacatttt ccctgaaagt cagaagtcac 93480 catagagcct gcaaatggat cctcctgtga gagtgacgtc acctcctttc cagagccatt 93540 agtgagcctg gcttgggaac aagtgtaatt tccttccctc ctttaacctg gcgatgagcg 93600 tcctttaaac cactgtgcct tctcaccctt tccatcttca gtttgaatga ctcccaggaa 93660 ggcctagagc agacccttta gaaatcagcc caagggggag agcaagagaa aacactctag 93720 ggagtaaagc tccccgggcg tcagagttga gccctgcctg ggctgaagga ctgtcttcac 93780 gaagtcagtc ctgaggaaaa atattgggga ctccaaatgt cctctggcag aggacccaga 93840 aaaccacact ggctccaact tcctcctcat ggggcattac acttcaaaac agtggggagc 93900 aacttttcca ccaaagctac aaacctaaaa tgctgctgcc ccaaagcaca agagggaaga 93960 gcaccgccgg ggccacagga cgtctgtcct ccagtcacag gccatccttg ctgctcccta 94020 ctgactctag cttacttccc ctgtgaagaa acaggtgttc tcggctgagc ccccaaccct 94080 <210> 5 <211> 82154 <212> DNA <213> Homo sapiens <400> 5 cattaatagt gataactatt aataatatct gagtgttaac tatgtatcaa acactgtgct 60 atgggctttc tttaactatc tcacttatct ctcacaataa ccctgtgagg caggtactat 120 tacagaaggg gaaacggagg ctaataaaga ttaaatgagt ttcttagggt tgcccaccaa 180 gtggaagatc ctgaatatga atcttacagt ctttctcagc ctgcattctt taccacaagg 240 ctgggactcc cagaggacag catcctctca tgcctgggtg gcaagcagcc agccacagac 300 atgctgaaga actaggggta gctacagtta gaaaacattc attgcttttt caaggaagag 360 ctaaggagac ccaggacgca gatgtgagtt agcagagaac accagcaaat tacttaactt 420 gacagaatta ttttctctcc tgggtcagtt agcttctact tgaccctggt gcttgttgga 480 gtttgtgtca cccccatggc tctgccttct gctctgaagc acaaggttac cattagcata 540 catcaggctg tggttaattt ggctgccccc tctttaagct aaggagacat ggtcagggcc 600 tcagaccctg tgtgtggcca ttcagctttg ccctgttctg tggccacagt ccatgctcta 660 agtactgacc agatgtctta caatgcacac ggcacacagt tatggtctct gtggggatgg 720 gggaataagg tgtggacaaa tctgttcagc tctaaatcct tgaccagagg agcagctcag 780 agcatgaatc cacagggcag tggagccatg tgcaggatca agcacagcgg catcactgac 840 ttgcaggaca ctggagtgct ggggcgtggt tctagagaaa tgccctcaag tcctcgatag 900 atcctaaatg tggttagttc tcttcattac aaagacagtg gaagctgagg tccatgcaga 960 ttaaaaggct aagctgtaca gtaattatga ggtccttttg attagcagaa ctccatctat 1020 tccaaaacaa attcatagaa agacatcttt tctatgccta attgcctttc catctttgtt 1080 gaaaatcaac agaccataaa cgtggagtct gttttgggac ttgacattct gttctgctaa 1140 tctatgtgcc tctctttgcg ccaatacttt actctcttga ttactgtagc tttttagtaa 1200 atcttgacat cagatatttt aagtcctcca actttatttt tgcttctaag ttgttttgtg 1260 tttacataca aaatttagaa tcaatttgtt caatttctac caaaaaagtc tgcttgggtt 1320 ttggttggga ctgcattgaa tccatagatc aactattggg gattaatttt tttctctacg 1380 ttttgactgg tttgtatacc acagattaga ggattctggg atggagcttc agaatccata 1440 gcacaaacat gaagatattc agaacaatta acttttatgc tgatttaaag ctaataagaa 1500 taaatcttta catcaaatat aagccacctg gagccagtat tattgggact tcattgataa 1560 taagattatt tacccaaagg ggaatgattg tcaaagtacc tactgtgagc catatttata 1620 aaatgtaagc catatttgaa aaatacttaa ttttcacaag aagctgatga ggtaggcatt 1680 acctgctgta ctttacaaat ggggaaacta aagtacaaag agatgtagca gttaagctga 1740 ggtcacacag gtaattaaat ggtagcattg tcacttaaac ccaggcttgt ctaattccat 1800 tctgtggtac ttgctgtacc tcaatggttt tcagactgtg tccagagtgc cccaggacct 1860 gagagagaga gagagaaaga aagagaaaaa agagagagag aaagagaaga gagtgagaga 1920 gagtgagtgt gtttgaggga aggaggaaga aagtggtctg gggttcagaa tcccagactt 1980 ggtctcagtg agttttcctt tgtcctattt tgcagatggg gcctccacgt gaaaagtaac 2040 tacaaaacag aaccagaaaa tagtcatgct gttcaagtga gttggcatat cacttcatgc 2100 tactttgaaa taaaatttcc tcttattttc ttatggataa aggtctcgaa aggtttgaga 2160 tgatcacagc ctgtgttaag gctgaccagg gtccagggca gtacagtgga gctgcttttc 2220 ttctggattc tgaaccaccc tcagccttca gggcctgttg tctggtgggc tcatggagtc 2280 accagtgaac gtgaaagcca ctgctcctct ggtgtccatg tctattctga caggtggatc 2340 tcagccccag gttgactgat tgctcgcagg tgaggctact gcctccgcag tgctcaccaa 2400 atgctccggc cgctccagtc tgcacgttcc tgagcttggg ccacctcctg cttttcacag 2460 gcagcttctc ctcgatctcc tcctctcttt tttcttcatg agcctcaccc ttggcagcca 2520 ccccaagaaa ttcagccttc ttcatctcct ttctctctca gaaactggaa agatttttac 2580 tgaattcctg atatttttgt ctttgccaaa acccaaaggc cccaatctgc catgggccaa 2640 gaagtgccca gagaggttgt ttggacaaat ccagaaatga ccttgaatct ttactcagca 2700 cttagatgac aggttctctc cttctccacc acaccctagc acacgtgctt cttgtcggat 2760 caggaaatgt tttattgctt tttttccttt tcactttctc tacccaccct tctttgtgag 2820 cccttcccgg ttatgctgtc cgtattgcct ctcttctgga aaagtaatca gagagtgaaa 2880 atcccaggac aggaagggac cttgggaagg cattaaccag accttttcct ccaggcagca 2940 gccacagtcg ccggggtaaa gaaccctctt ttccatcttt aaactttcat cggtttctgc 3000 atcttctcat tgaagcatct ctgggttttg ctttttgttg tcttatttgt tactttcatt 3060 tttaaaagtt ttctttcatt cagaggtttc ttgagactgc ctggtgcaca tcatgcgtat 3120 ccgctgatag atgctgttgt gacttggtga aacatgttgc gtgctcttca ggcagatgta 3180 tgtcaacaaa cccttttcct ggctcagcca ggatttctgg gagtcagatt tgattatggg 3240 gtgtcatagg taaaaactgg aggctgtctg tggtggccca gctgtgcagt tagctgactt 3300 ggaggaatct ttggctataa ttggatgcca agagtggagg tggcacgaga gatggtacaa 3360 gcctatgatg atgtctaccc aggtgaaaaa tgatctaggt gcttgtaacc atcaccctga 3420 gcattcagtt ctacatccag ctattgtgga acaaaatgat ttatattgat taattgacta 3480 gttggttcat tttagcttga agagtactga tcagctgtgt gcattaggca gtttcttgac 3540 acactgctgt gctgaggaca gatttcccag agcctggatg tgtataattc tacatgctcc 3600 tttttccaag gacttaagca aacagagtca actcctctgt tttccttgtt tgggtatatt 3660 tttgaaaatg tctcttcttc tttcctttca tttacatttt accgttgttt atccaccttt 3720 tcctcttcct tcaaagctct agacctgcct ccctgcctgt tcttagccca cttttgagaa 3780 aggactttcc aaccccatcc tcgaaagggc agggtctctc tccagggctc caacagagtt 3840 ctgaaagaac acggcttcca ccattgtgtc ttctctgttt tgtcaactgc tgaaagactg 3900 acacagtaga caatgctgca gaccccttgg gagatagtcc aagtttaggg tggggaggga 3960 atggtgcatt ctgggtgtcc acatatttgt tgttgcttta ggaagaggag ctgggaggtt 4020 ggagtcgcca cacatgttga aagatgtggc aaaaaacaaa caaacaaaac acctcataga 4080 gagaaatcct gactttgtgc acaagaaaag ggagtgaagt gtgtggggtt tttaaagtgg 4140 tggtgggggg gcattaggag atacccagaa gctctcaaga ttccaaacag tctgcttttc 4200 ttttcagaca ttacactcca agaaaagaaa ctctagtgta taacagaggg gctctgtcaa 4260 aatttaacaa cataaatatt gggcaaatga agttgtttct ctggtgctat ctcaacctgc 4320 caatggagaa atatctcaaa aagtcaagaa ttgaagccat tactcagaga cagcatccta 4380 tggcatggtg atccaaaaca agtacacctc taccttttcc ctttcagccc caaaccccaa 4440 aacactggag aatattgggg caggcaaggc ccgtgaatag gtgagcagag ctggaagaag 4500 agactcctgc ccctggtggg cctcaggcta tttgtggaat gatgtttgtg agatgaacat 4560 gttcgctccc tcacccggat gttttggaca taggagcctg gagtaaagag tgtatatctt 4620 gggctgtcat tttcccgtgt gaaaggtgtt ttgttttctc cccgtttgca caacttgttt 4680 cccttaaact gtgctgtgca tggctaggaa gctcagcaat agactaaaca gtttgcgatc 4740 ccacagtttt gctttctgtt tctcaggcct gacccaacac tccatgggtt ccctagccct 4800 tcgtaggtgc ttcgaaacac tcatggggtc cttgacctga tcccagtggg ggtttgtgtg 4860 tggaagttag ggaacctctc tttgagagtt ctggtgcccc taactctgta gggtctgact 4920 tcacttctgc cccaataaga atgaaaggct ttgccagtag tgcagccctc tcctcccaaa 4980 gtcctagagg caattactct gaaatatgga agaaagaggc acatctgaaa gcccagtgct 5040 gtcttcttgt cctcacatcc ctcaggatct caaggtcagc ctagtagagg cattgcttta 5100 ccatagtagc aactcaggga atatctgtgg aactggattc ctctgaagtt ggacagttgc 5160 tttatccctg ctagaggctc tcactactta gacccacaca gtcctataga tagaagaaac 5220 ctagagagaa ccacctctca cacttttatt ttatacatgg agaaccaaag gcctcaaatg 5280 gtggagtgat ttgctggggt gctacagtca ttgtcacaac ttacattgtg acatgggctt 5340 catatccagt taaaacaaaa gcctctattc actgccccaa ggtgtgaagc cttgtctcca 5400 ggagatggag agtcaatgac tccaaggaga taagacttca gactcttcct gctgcaattt 5460 tttttttttt ttaagtaagt gccaaccaat aactcctggg gaaagtaaaa taatctgggg 5520 gaggaaaatt gttctctcct ggagatggga ctcctctgat ttggaactcc tctgtctgct 5580 ttcacttctt ggataggatt ttaaatccag cacccagcct gctgctgtga agttcacaat 5640 aactttatca cctgagttcc cttggtgctg cagcagatat gagttacaca cctggtcctc 5700 cgagagtggt ttaatccaca ccagagtcct gacttactag tttcttccta ttgcagagcc 5760 tatgcagact gcttctctga gcaccaacat cattatgcac tgtcctttct attcccaaga 5820 cttcctagtt gctgcaagtc aagttcgaca ttcaactatt tcctcggggt ccttttttgg 5880 gagaagcaag gctttgagtt cactctttga cttcaagtga agtccatttt cctcttagac 5940 actaccccag tggttctcac actcaaggaa gcaccaaagt ccctggagga cccgtctaaa 6000 tgaaggatgc taagccccac ctcacagaga ttgatgcagt acgtcccagg aatctgcatg 6060 ttaaaggagc tctgcaggtg attctgatgg aggtggccct tgcaggatgc tttgagaaac 6120 tatatgttct atccctcgaa ctctgcctgc agaacagcct gagatggctc ttccatgctt 6180 tgaccatttg gccctccaca gtagtccctg agctgcgtct tcttcggacc atgagcagaa 6240 tgtgtgtccc ctgactgact gtccttttcc ttgagaacca ggcatagtgg tgcactggta 6300 agagcatgga ctctggagcc acactgggtt tgaattatgt ctctgccact tactagctga 6360 gtgaccctag gcaactttct aaatctctgt gcttttgttt cttcatctgt aaaatgggga 6420 taataatact acttgcccca tagggttgtt atgaagatga accaagttaa tatctctaat 6480 aaatgtctct aaaatcccat gattgcaaaa agtagaaaat atgtcatgta gcctattata 6540 tcattatatt ataaggtgag gctattgaag gcaagagggg aaatgacttg ctgaaggcaa 6600 cagagctggt ctgcagcatg gccaagacca aaaacagctc ttttcgctcc cagataaatt 6660 gtctttttta tttttttccc aaactgcctg tctaaccccc ctttcatctg gttataatga 6720 atgccattgc ttgtgtatag ttgcctacat taatagacaa caatgcaata ttctccttat 6780 ggaaacccta cctagattgg gaggcaccat gaagccactt tttcttcttt ctccatctct 6840 accctgatta gcaaacatct ctaattattg tgactcccaa ccccagtcag atcattttat 6900 tctttttcca gtatctatgc agggaagcct ggcaaaggct taagggatgg ggtggggtgt 6960 agcatgtcag caggatttgg aactatgggc cccatacttt tggcacctgc tgcattttct 7020 ccccacctgc tgcaccataa ttcatctgct tgtatgagtt tagcagaaag agcccccagt 7080 tccctgtaag aaacacatac ggcttttcca ggttacactg tggggattga gaaaatgcac 7140 agtatccatg tctggaaatc aatggacaac tcactgcctg aatcgtttgt gtcttgtaac 7200 ttgcctcaag caacatctgt ctgaaaaatc tggtgctttg ggctaaatga ctggatattc 7260 tcctaaggaa tggcagtgag tgggttaatt tcacctctca tcttacttcc tgcctggccc 7320 ctctaccttg cccaccatgc ctggctttgc tgctgatctt cggctgacct gaaattgaac 7380 accttaactt aaggacaact aagggtgtag gtagattggg aagtatgtgt tcttcttgct 7440 ttgccaataa ttgtcttctg gattcattgg cctttcttct ggtttccttc ttcaacttct 7500 ttaacaaatg acttcagcca tgccaagcct tcttttaagc actttccctc tcactctcct 7560 gtcctataaa gatatctttc ttgaagcccc tccgtgccag gcgtccaaag tgaggcacat 7620 caactcggtc cttgaacgtc tcatgtttat cccaatagat ggtctagatg tggatgaatg 7680 taaaggaaat gtgcaaataa gatactttta aaattcagac agaattatac agggtgggaa 7740 atttcagtat acatagaagg cttaattcaa aatgatataa tgtcaacatt tggtataaga 7800 aattatttat ctggcagaat atatactcac agatgtcaaa atgggtctag agagtagaga 7860 atggaggcaa ttatccagac actgaggccc aaggcacaat acttttaagt aatcatgccc 7920 tcaactggca tttccatagt cttaagccca aaagcattgg gtggaaccat tctataagca 7980 aagcctcagc tatgaaaaca acttttaaaa ttgacattca aaagataaga tcaacaacag 8040 gtgccctttg ctttcggcag taggtgtgtt cttgaaaagt tggttgtcaa tatttccttt 8100 tcccattaat ctaatcacat tctaaatata acagggggct ggatgtttga agaaatcctg 8160 tagttgatct cattgcaaag tccttttaga gaggtaaaaa tagtttgttt tattttcaaa 8220 aattaggttt tcttagacta aaacttcttg gaagtggggg catatcatgt tcctgtatat 8280 tgcctacagg taaagaatgt aagaatgtat ggcttagtca cagagagcta gggcttcaga 8340 aatgctatat gtatcaaata ttttatatct atatttactc tgaagatatg acaatagctt 8400 ttaatgtggg tcgagagata tctaatcttt cgcttctctt tcaaccttcc aaaaccatgc 8460 aatcctcatt ccttcttttc aataacctcc acatgccccc ttcatctgtc ccacccaaag 8520 gaaactcttt taacttacca tttaattgat caactctgat gacctttccc taagctctct 8580 gtgctaaaat aatctggtac tttgggctga agaagtattc tcctaacgat ggaggtaggt 8640 ggcagtcaaa tgacgcagag attatgatag ggccctgtct aggctgtcac ataaggtaac 8700 attagccaca tgtggctact gtgtacttga aatgtgatga atgccattga gaactgaatt 8760 tttaatttaa tttaaaaatg gagtcgcatt tctgttttag gagaacttct aagtatgtct 8820 gaaacaactt gatcatgttt caagtgtaag ttttattaga tctaaatcta aatcaagtat 8880 ttcgaaaaag tattttagca tttgaataga gatgtgctct aagtataaaa cacacagtgg 8940 attttgaaga ttagtaagaa aaaaatgaat gtaaactatt tcattaataa atttttatat 9000 tggttacatg ctgaaatgat aatattttgc atatattggg tgaaattata tatattattt 9060 aaattaactt tccttttttt ttttaaactt tgtgtggcta caaggacact gaaattagaa 9120 acatggctcg aattatgctt gcactgaaca aggctagtct aaggtatgca attgccctgc 9180 ttcttcacta ctttcaagtg taaacaaata tgtcagcatt atccctagaa ggagggttta 9240 ggggttttaa gttgaatact cttcagctga agaaaatcca ttaatctcca gttttattct 9300 tgagttagct ttcaaatcta cattgcgaca ataattactt tgggatcttt gaattttctt 9360 tcatgccttt ctgttctatg aagcccacat gcgtagttta tgcattttcc aatttaggct 9420 agaagtccaa tgtgctgtcc attgcaccac agagcctgtt tgctatgcat ttttaagagt 9480 aaaattttca gaaaatactt aaattaaaaa gatagatttg gaaagcatat ccaaaatgtt 9540 gctttgaact tcttattctg gacaattcct ggactgggga gaaggcatgc ccaagtacac 9600 attgcttgca gtggcacctc caaaccaatg ctggtcggga ctcttcctat tacctcgcaa 9660 cagcaatgac tgggccccat aatacagcca cggtcattat aaaagatcat tacaaagcat 9720 caaattaact gctattaatg aaagccagaa acacgtcatt caggaggtcg aatggctggg 9780 atggaacata cagggttgaa taatggtagg agcctgggtt tggaattaga aaactgggac 9840 aggaatccta cttctgctat gaatccattg caagtgactg ggcaagttgt tcctcactcc 9900 ctactgcctt gctcatctat cagctgagaa tgtcaaggca gaaggtctcc agggctcctg 9960 caggctccta caagccagat ctcaatccgt cttatcctac cctcttcctg acctctagct 10020 acaagaacag caaggcacag ccccctggtt ttgagaatgc taatgcttgc cagcattctt 10080 gtcctgcagg gcatgaagta tagtcctgca caaccagcag gctctgtgac tgcctaacct 10140 catccttggt cactgacctc tgtcttagta gcagttcgtg ccatcctacc tagctttgct 10200 gggtcaagtg cgttcacatc ttaaaaccgt ttgaagcgtt tgtctaatta acatgcagaa 10260 agcatatact gatttttatt ttcaccacca tgtatgtgag ggcctatttt atggcatgca 10320 aagcatctca tttttatttc aattctctgt cttgtaactt taaatgaggc tgaaatttcc 10380 ctccatatgt ttattagcat cttctatttt atctcttata cactgactgt ttgcatcttt 10440 tgccccattt ccctgaatgg tttttttctc aatgatttgt aagcactctt tatatttaaa 10500 tatgttaact ctttcttgtc acatatttta aaccctttct tacaaacgtt gttttccggt 10560 ttgtgactta ccttttaatt ttgctcataa attactttta acttacagat agtaatattt 10620 ttgaaaggtt acattcatca gtctttgtat tgttaaaaag agtctttatt gttatacttt 10680 taaagtagct tttccactcc tagtcagata ctttcacata taatagttgt ctactttcct 10740 cctgaattaa tggggattta ttttggcata tggtgtgaag taagaagcta aattcttttt 10800 cttttctctg catcatcaat gatctcttac actgttaaat aaactagtct tttccttctg 10860 ctttccacac ccatttaacc tagcccactg ttgacatcgt cagagaaaac ttttcatcag 10920 aaagtctgaa cagcacaatt atactgtatc aatccagctt aaattacaca tgattgttag 10980 gatgggtaga aggtatgata aaatggggtg aaagtaaaat gaatgatcat cgatatacat 11040 gatgtcaaaa atttgggtat aactgaagaa ttttagtaat ttaaagattt cagaatttaa 11100 ataatgaaat atctgataca ttcaattgga aatttggttg agatcagctg acttgttaat 11160 tggacttcac tgataaacat ttgccttaaa atctgtagaa tctaaagcag ggtataccta 11220 gtatgcgagt aagacatcat ttctggaatc aagggggctt ttcagtgttg accagatgtt 11280 tatcactgca tgggcaaatg gcccaaggag tatggttgtg gcttggctta tttcttctta 11340 acgcagatgc agttgctttc tttctgggtg gcagtgtgga ggataactgg ggtcggtggg 11400 gacataaagt ctcacaaggg gaggaaagcc cctctgtggg ctctctgggc cagccaccct 11460 ccttacaaag tgggatgtca gcttctgctc tgaccagagt caaagtaggc atcagctatt 11520 gccattactg ttgttgtata atatggtgaa taaaggaaat gtgttatata tatatttttt 11580 tcttattatt atactttaag ttttagggta catgtgcaca atgtgcaggt tagttacata 11640 tgtatacatg tgccatgctg gtgtgctgca cccactaact ggtcatttag cattaggtat 11700 atctcctaaa gctatccctc cccccctccc cccaccccac aacagtcccc agagtgtgat 11760 gttccccttc ctgtgtccat gtgttctcat tgttcaattc ccacctatga gtgagaatat 11820 gtggtgtttg gttttttgtc cttgcgatag tttactgaga atgatgattt ccaatttcat 11880 ccatgtccct acaaaggaca tgaactcatc attttttatg gctgcatagc attccatggt 11940 gtatatgtgc cacattttct taatccagtc tatcattgtg ggacatttgg gttggttcca 12000 agtctttgct attgtgaata gtgccgcaat aaacatacat gtgcatgtgt ctttatagca 12060 gcatgattta tagtcctttg ggtatatacc cagtaatggg atggctgggt caaatggtat 12120 ttctagttct agatccctga ggaatggcca cactgacttc cacaatggtt gaactagttt 12180 acagtcccac caacagtgtc aaagtgttcc tatttctcca catcctctcc agcacctgtt 12240 gtttcctgac tttttaatga ttgccattct aactggtgtg agatggtatc tcattgtggt 12300 tttgatttgc attcctctga tggccagtga tagtgagcat ttttttcatg tgttttttgg 12360 ctgcataaat gtcttctttt gagaagtgtc tgttcatgtc cttcgcccac tttttgatgg 12420 ggttgtttgt ttttttcttg taaatttgtt tgagttcatg gtagattctg gatattagcc 12480 ctttgtcaga tgagtaggtt gcgaaaattt tctcccattt tgtaggtttc ctgttcactc 12540 tgatggtagt ttcttttgct gtgcagaagc tctttagtta atgtgttata ttttaagagc 12600 tcagttatct gttacctatt tgccagtgac aggaactcat gtcttctgag gcagttggtc 12660 tcatttatgg tagatataat taattattat ctaattatta ttgcccttga attatttgaa 12720 gatatcatca ggccctctct taaacacttc cgttcatgtg ctttagcttc tttatatggc 12780 cagccactct ctgtggatat gtccaggttt gttgatgtcc ccttgacatc agccaaccat 12840 aacttaacac tggatgagag ctaagcagtg ctaaacttat cacttccctc gaatgtgtca 12900 ttatactttt attagtgctg cttgggacta gatttccttt ctagcagcca agtcatgttt 12960 tgggctcata tgcagcttgt agctaagaaa gccttgagtt gttttcctat aaaccgtctg 13020 aaactatttt tagaattcaa gttacaactc tgaagtcctg ggtcttactt aatcaatgat 13080 accttctgag ataaatactg aaaatccttc aagtatagaa caaggacatc ctaactctgg 13140 gcatctgatg tctgttaaat gtatcacatt ttatttattt gtatttttta aaggaagtga 13200 gaaggagaag tgagatgctg agcatcaagc tgggcagagt tgtcatgttg tgatctgaga 13260 ttctgtcctg ttcttcagga tttaaggagt cgctaaccaa tgccaagcat gggctcatcg 13320 ggtgcagctg gggaggcaat tacttcaact caggagtttt caaaaacttt ccttatgcct 13380 gctcacagga tttcatggtg tttttcttct ttgttgttac ttttgtggaa aaggaaagtt 13440 accagtgaac aatctctgtg accttcctct caatcccaaa aatatgcttg tgataaatca 13500 gcagtttatt ttaatgcctc atttggaggc attgcttttc caagaatgaa tctttgcata 13560 ttatctgaga catcattttg gtgtaaggta gaattgtacc aggtatgtat ctttgtggcc 13620 aactatactg tcaaaactga gtttcagtca tccaataaaa aggaagctgt ctctgaattc 13680 agatattcct ccattctaag ggaactgaag tataacataa aatacttaac attctttctg 13740 tatatgtgaa aaaaccatac ctaaggaatt ttattattca gcccatgttt ctttattgta 13800 tccagtataa catactcgaa gatgtatata tacacatata tagatataca aagcatctat 13860 acatctagac atgtatatat acatatatat atacacacac gtatatactg tacttcaatc 13920 atctatatta aattgtgata atatcacatt accacatgtt gatggcattc ttgtaatctg 13980 cctgaaatcc atgaaaacac atgcagtggt ctggctcatg ttgtctcagg gagtgcattc 14040 tggctcccag tgatcatcaa ttacttttat aaaagttcac caatcacttg ttggtttccg 14100 gaaaacaaat ttaaagcaaa cattattaat gtcaaactta cacattttgc tttctggaat 14160 caactttttt attttaaaaa ttgagaatat aatttctgtc ttttgtttct ttgggcattt 14220 ttcttattct ccacaattat tcaaagatcc ttagccatag gtctgaaagt gtttgtttca 14280 gctctcatcc cccttccttg caggtaaggc tggcattcca cagccctgga taactcctct 14340 gtgctaggtc tatgcctgct cctgggacac tgaacactcc taggtttgca gggtccacgg 14400 tgtccttcgt gtccctccct gcccagcctc agcaggagcc ccctgctcct agaccactcc 14460 cttactgagt cctgtagatg ttccagcaca cacagtgcct cccttctcaa ggccccagcc 14520 ccagcccctt ctcaggtcat ttgggggctt acatcacctg ctacctgtgt ggagatggag 14580 gtctgtttgc cagcactgcc ttgcttttcc tcctgcccca ctgcatttaa tcactgtgat 14640 aagaggaaac aaagagggaa cgtcattggt cccattcctc tgaatcttga ccacgaaaat 14700 atcttgaatt gcctccgtgt ccccacccaa catcgcctct tgcactgcta cctctgcctg 14760 agtgcacatc agccaagagc caggaaccac tgcccaacca cgacccaggc acagaccctt 14820 atctctagcc tagagaagag gtgtgtttct ttctaatcat ctggtatgta tccaaggaaa 14880 ccataaattg atcattattt ttgtatgtgg aattagaaat attcatatag acatacattc 14940 tttggttttt atttttttat catccctaaa ataaatagca gatgttctca aaatggttta 15000 ttaatttcag tcctaagatt gtataattga ttgaaaccat aaatggcaga cagaagaaca 15060 gcaacagtga aaaccaagat taattctaat aaattcatta caatggcagg aatcaagtgt 15120 actttaagct cactgtaaag ttttcagtgt gttgtggatt cagaggcagt aggtgatgac 15180 ttttattata tattcttaag tacctggttt tggagggtga tggcttgttg gagggaatga 15240 tgctgaagga acataataaa acaatatgat aaatacaggg agagaagaaa gacaaaggaa 15300 aagaggaaac aaatgtcaag aataagatga ataggtaggg gagaagaaaa aataagttgt 15360 cataatttta tattccaagg actacgctag tccttggact acgctggtaa aaagaaatct 15420 aatcatgagg cagagaattt tatttatttc cccattcctt ttggctcgtg gcttgagttt 15480 gctctggctt tcattgaata catgggccaa ggcaggatga gcttctgcct gaaccgctgg 15540 gatgttattc ctgatctcat ggaaagacat gtcgcggctt ctgaccctgt gcctctgtat 15600 cactgtgttc cctgtattcc tgtgcccctc gtattagttt tcacattgct aatgaagaca 15660 taccagagac tgggtaattt ataaaggaaa gaggtttaat ggactcacag ttccacatgg 15720 ctggtgaggc cttacaatca tggcagaagg cgaaggaaga gcaaagggac ttcttacatg 15780 gtggcaggca agaaagagca tgtacagggg aattcccttt tataaaacca tcagatctca 15840 tgagacttat tcattaccag gagaacagta tgggggaaac cgctccccat gattcagtta 15900 tctccacttg gccctaccct tgacacatgg ggattattac aaaatcaagg tgagatttgg 15960 gtggggacac agtgagacta tatcacccct gtatccctgt gtctctatat tcctgtatcc 16020 ctggctgaat gggtcaaagt aatgatcagc ccacagatat gcatttgcct ctgctgagaa 16080 tagaaaggaa tataaatgaa gtctttttct tcatggagct tattaactag atgaagagag 16140 aaagcctgtg ggaaaagaca aatagaacct tcaggttcta tgcagtgagt gcccaagtgg 16200 tgattgtgaa aatgaaagtg cagccctgca gatgagcaga agctcatggt gggacctttc 16260 atgcaagcta tgcagaggag agagcatagg atttggggtt gggacacaca gattcaaatc 16320 atggtcctgc cactttcctg ctacatgaac ttgaccatgt tattttaccc ccatgaagtc 16380 tgagttttca gatgtgtaaa ataataccac taatgcatac ttttttaaaa tttaaattta 16440 aatttttttt tgacactgag tctcactctg tcaccaggct ggagtacagt ggcacgatct 16500 tggctcactg cagcctccac ctcctgggtt caagcaattc tcctgcctca gcctcctgag 16560 tagctggaac tacaggtgtg taccaccatg tccagccaat ttttgtattt ttagtagaga 16620 cggggtttca ccatgttggc caggatggtc tcgatctctt gacctcgtga tccgcctgcc 16680 tcggcctccc aaagtgctgg gattacagat gtgagccact gcgcccagcc taatgtgtac 16740 ttttaaaagc acttttcaaa tacttcatct tgtttaatct tcttggcagt tctgtaaagt 16800 gtgaagcatt gtacaaagtt aactctcatt attatattgg aacccagggt tttcagagga 16860 gaatcctcaa ggagataggg ctttcctgcc ttgtgcccat ataaggttgt ggatcccaag 16920 ggacgaaagc attttcatca gactgggaga ggcaagaaaa ggtcactggc agtatagatt 16980 cttctggagt tcactggcaa cttgtcccac ttcagttctc ccttaatctt tccagatgtg 17040 cagatgtata gcctgggtgg atgagccaaa atgaattcaa ggctaaacag gtcagctggc 17100 tcagcccatg ggaagcatgc tcatcccaaa gcaaaggtct ctggcagaaa tttctctgca 17160 cttatttacc ctgctgtctt cacattgggg tgcggagtct aattcaaaaa ctccaaggca 17220 tgagtccaag ccagggagct gttagaggtg cacatgggag atcttagcaa gagaaaaata 17280 tatgttttaa accctagaaa gaagaaagta aatgcctctc atttacttta aacaaataat 17340 atggccaagg tcacatagca ggaaagtggc aaggggtctg tcctcttttc actgttcaat 17400 catgaccata ttgtcctgga ggcctagggg caggatataa tgaagaaaca tccaattttg 17460 acagagtggg taaatgggat tgtgggactt gtagtgagct gatctgtctt cattcatgta 17520 attatcaata tcatttcaat gaccatgatg ttgatatgga aaatgatgag gatgatagta 17580 cagaaagaac atgaatatta gctgatgtct attgagtgtt tcctgggtgc cagacaccac 17640 cgttaagtgc tgaacaagga ttatagaatt taattctcta gtgacctttt gagataggtt 17700 atatgattgt cagctttcca caaatgagga agccaatatt cagaaggata cggtgctgaa 17760 gcttatgcag taagaaatag tagaagcaga attcaaactc aggcaattga acaccaaaat 17820 tcaagctctt aattactatt tctagaaccc tctgactgac tgattcctcc ctcaccacag 17880 ccaacttttg catcccccat ttctggagag catctcccca catggtatat actcaaaggt 17940 cccatagtga tcctcttccc aaagagcgtg aatgaggggt ttgaaactgc cagaactctg 18000 gtccagagct tggacttttg atgcgaatga tggagaaacc aagaggttga tttcctcagc 18060 cttcaagaga gctcatcctc agctctctaa agctgaccag aaagaggaga gtgggaccta 18120 tgaaaacagc aggagatggg agggcttgaa ttcctaatgc tatacccata ggtcattgtg 18180 ccatggtcct ctgcaccccc aacaccccca acactgatcc tgaaggtctc aacaatcttc 18240 atctgcctct ctcctttcac cttctttaca ctctcattga tagccttggt tttttctata 18300 cctccagtat tcccattccc atgatagcca tttaaggaca gggcacttcc tggtcaccat 18360 aaggaatatt gtgggaatgt tctgctcatg gatattgcat cagaataggt ctggaaatga 18420 aacacaccaa caaagtcaac agaggagagt ccaagcaaag cgtctgttta caaagttgtg 18480 gaaggtttag gggaactcat tatgagatag ttgaagcaac ccagagctag gaacagtggc 18540 gctcttacca caccaaggtt tgaaggagct cgggtttctg gaacccagac atagcagcag 18600 cagttgtgat agaggagttc ctggcagaag ccatagcttt cagttgagaa ggtggtcact 18660 gccaacccat ggctcagctg gaaggtaacc agagaataaa ttccccaaac tctttctctt 18720 cctttcctgt gctctcttat tggtgcctcc cattgagaga acccaaccaa agccagctgt 18780 aagggaaact aatgaggcat ttccatatag ctcagcctgc tgggaaacat gtactataga 18840 aaagggtgga gagcggatct agagaggcaa aaaaattaaa caacggcacc gatgtttaca 18900 tttctttctg atgtagagac ctcataccac ttttctgtac atcttacttt aatgtgtaaa 18960 aaggcctata ggctctttct ctaggttcag taaaagatga actaggaaac atatgccaca 19020 tttgagcttc ctcacagctt ggcccctgca aagctgtccc cttctaagaa ctaagtgccc 19080 tgggtattca gtgctgtgtt gtctggtgac ttcgcagccc tgtcaacatt gtttttctgt 19140 ttgtttgttt gtttaattat actttaagtt ctagggcaca tgtgcacaac gtgcaggttt 19200 gttacatatg tatacatgtg ccatgttggt gtgccgcacc cgttaactcg tcacttacat 19260 taggtatgtc tcctaatggt atccctcccc catccgccta ccccacgaca ggccccagtg 19320 tgtgatgttc cccaccctgt gtccaagtgt tctcattgtt caattcccac ctatgagtga 19380 gaacatgcgg tgtttggttt tctgtctttg cgatagtttg ctcagaatga tggtttccag 19440 cttcatccat gtcactacaa aggacatgaa ctcatccatt ggctcctcct cagaaaggtg 19500 gaaaagcaga acctcttaaa ctgctccagg tttcctggag agccttgcct taaaaaaggc 19560 cctttttttg gggtgggggg gacaccaatg ccgtgactcc ttcaagaatg tgattctagc 19620 aagagactga gctctattct ttttcttcct ccaccctctc ttaaggcaaa ttgagtcaaa 19680 ccatctcagt ctacccacac catccttctt taatttctgt agttaagagc ataaatccct 19740 tccctattct gagtgtggtt catcgaccta cagcatcagc atcacctggg agtctgtcag 19800 aaatgcaaaa tcttaggctc cagcccacat ccctgagcca aatctgcctt ttgcaagatc 19860 cccaggtgat atacatgtac attaatttta ggaggattga tgtagcctgt atgccatggt 19920 aagaggcatg caatgtaatg ttgagtttct ttctttagaa tttatagtag cagccgggac 19980 cggtggctca cgcctgtaat cccagcattc taggaggctg aggctggtgc atcacttgag 20040 gtcaggagtt ggagatcagc ctggcctggc caacatggca aaaccctgcc tttaccaaaa 20100 aatacaaaaa ttagccaggt gtggtggtat gcccccgtag tcccagctac tcaggaggct 20160 gagatgggag agtagcttga acctgggagg cggaggttgc agtgagccaa gatcacacca 20220 ctgcactcca gcctgggtga cagagtgaca tagtgagtcc ctgtctaaaa aaaaaaaaaa 20280 aaaaaaaaaa aaaaaagaat ttatagtagc cacaaaagcc tttttgagta attgaagaaa 20340 ttctgaagtt attgtgtgct ttgaaattta gtatttattg aatagtttat atctttcaaa 20400 aagcttttat aactcattgg agtctcgtca taactccatg aaatacgtaa ggtagataat 20460 aggagccaca ttttccacat gaggatctga ggcatgatta agtaaaatca gtcctctgct 20520 aggtggaatg gttttgagac cagatactag ggctcagaac tcattttaaa gctgttgtgg 20580 cagctatcaa ttctgaagaa agtcaacatg gcatagcatg cctcttacca tggcatacag 20640 gctgtatcaa tcctcctaaa actaatgtac atgcacacca cctgagggtc ttgcaaaagg 20700 cagatttggc tcagggatgt gggctggaac ctaagatttt gcatttctaa tagactccca 20760 ggtgatgctg gtgctgtagc tccctccgtc ccccagcttt cccccatcag tatttctgaa 20820 cacttgatcc acacccaatc tgcctcaaaa tcacttgtgg tggaaaatgc ttgttaaaca 20880 ggtagattgt tgtgccccat accaagacat aatggatttc ttatggtctc taaatgtgag 20940 aatcactttt ttgtattggt ttgaatgttc tgatttaaga gtatgggatg agggaatttt 21000 aggttcattg tgttcacatc agtaggactt aaacctatgg aagactttgc agcagaatag 21060 gaagattatt ctcccagcct acccaacagt tgaaaaacga tcagaaggac ttggaaggga 21120 gcaatggagg attgatgaca atggcaaaga ctgagcagtc cccaggcgtg acaacaaaaa 21180 ggaaagcaat cagctgtgga gagagaaatg gtgttgatga tattatgaaa gtcgggatat 21240 aaacaagaat gagaaaggga ggaatgggga aactgaatga gacagaagca cagaaaaaag 21300 aagaaaggaa aaaagaagga aaaaaggagg aaaagtggga gaagagacag atggagagtg 21360 agagaaggga ggcaggtagg taggcagaag aatgaggaag aaagcaaagg agttgagact 21420 gggaatggac agaaggaaac ctgtacatgc tgtgatctgg gctttctatg ttccctgatc 21480 cagggtcctg agatcttggg gtactcgcca ctgcattgta agtttctgtg gatgaagctg 21540 gcatataaat acatctgtaa agctgtaact cctgggcatt gtccctgaaa ttttactgat 21600 gtctagattc taggtatggg attaaatggg tccacatttt gtgtttttct gagtcaccaa 21660 ttacaacaaa acttgctcat atacttatgc ctatcttaaa aaataattta ttttaataaa 21720 ataataataa ggcaagaaaa aaagacaccc agatttgaaa aagcaaaaaa tgtctttatt 21780 tgcagacaaa atcatgtatg tagaaaatcc taaggaatct acaaattagc tactagaact 21840 aataagaaaa tttaatgatg tctcaggata cagggtcaat atttaaaaat tattgtattt 21900 caacttataa gtgatgaatg tttggataat ggggtttaaa taatccattt acaacaacat 21960 ccaaaatata aaataactag caacagactt tataaaaaca tacaatgaaa attgaagcac 22020 gttgctggga aaaagaaaaa agaaaacaaa attcataaaa agacattata ttcactgaac 22080 agaacactta gtatttttaa gacgtcagtt cttatcaaat ttatgtgtag actcaattca 22140 atcccaatca acattccaac atcaacattt ggctagagag caaagttggg gtcagattgt 22200 gtagggctgt gttaaagagt tgagcattac atgagataat ggatgtgaag aaagtgctta 22260 atagggggtc gtgcagagga agtgctcaag aaatagtatc attgtcatta ttaccattac 22320 tgtattgttg ttattattta acaaatgttt tcaagcccac tttggcttgt gtatgggttg 22380 aggaaaacgc tacccaggca gaaagataaa acttattctc catgcctctt gagaaaagaa 22440 gcagcaatcc ccagatgtag ggaggagggg agccctgctg gcttttagtc agcctcacac 22500 aggaaaggag aggtagagat tctgcagcga acaagaatca tgtccgggac ttcacagaca 22560 gggacactca aaggttggat gatgctcaat tgcagcatcc acctgcaggg gcctcacccc 22620 acttctcact taatgattgt ctctgctgtt agggagccct tgaaagccag gtgttttgtc 22680 tccttcccaa agcctcagaa gatagacggg ggccatgagg gaggtggggg cagggaaggg 22740 ggagttcctg tctgttcttt tctgcccttc cctgtgctct ccacctctat cccctcttcc 22800 ttcccaaaca ggtggcagga atgttaagac tatgaattcc atcaagagca agcagggttc 22860 cttagggcac cagttggtaa gtgtaagagg cctcatccgc ttgcaccagc agcagaaaga 22920 agctgcagga agagtctctt ttgggcatga gaagctaaag gaggctggtg gttttctggt 22980 taactgcaca aggcctgcaa gttctacaga tgtcctttga ggaccagagc agcctccttt 23040 cctcccacac tctccagaca tgggaggcag taggagttca aagcacttct cagaaattga 23100 gcctttggtt ctgctgtcag caaaaggctg tgaagctcag tccccgacac tgggtaggag 23160 aagggtgaat gaagactagg gggtctggtg aaggaagtgg ggaaacaaac tcttcatttt 23220 taaagagagt gacctggcaa aacacagaga agatactttg ggtttggagg aacgtgcaag 23280 aggtcgagag tcactgccga ggggttttga tgcggcactg tgctccggca atgggaaggg 23340 ctgtggtcag gaaacaaagc agcaggtgtg gcccatgtgg aattgtcagg caggatttac 23400 ctgtggtggc ccgtgccgca cagcctggcc caccttctgt ccacctctgc tttccttctt 23460 aggacctcct agaaagaaag ctggaccttc cgaaaagtag cttgggaggc aaataacatt 23520 tatcgaatgc atcaatgtct taggcctcaa gcaagggttt aacatgagaa tctctttgag 23580 ttcccctagc atcctatgag gtagacacta ttaatatccc ccaaggctca gagaagttaa 23640 gtcacttacc aggaaacaca actattaaat caggcctgcg tttgatccca gggatgttaa 23700 atttgaggcc tgagctcttt ccatcatact gcgaagtctc aattgtggca tcactgcaaa 23760 agaaaaacca actgaacgtt gctgtcacat gcagagagag agacaaagaa gagaaagggg 23820 gatgcagcta aatgctgggc tttttgctct tgcaggacca tgccacagag tccaccgtct 23880 ggggagcagg gcctgtgagc tacagattct cgaacaatac aatcatgggt caatgcctgg 23940 gcagagaata ggttctcttt gaagttcatt atctccagaa agcttttcca gcttccagtc 24000 actgcttcac tccagttttc tttcttcttt tttcatcttg gcttatttta gttggcttct 24060 atgcccatga ctatcaccct caaccaaaga cagagaggct ccaatgcagg aggcagacag 24120 atttgggctt gaacccaatg ccgcttcctt gctgtgtgag ctttgtcaag ttattctatt 24180 gcctaatttt tggggattgt attatgttat gttacatgtt atgttttgtt acatgatatt 24240 gtgttatatt actatcttct tcatggtgtt attatattat taagattgat gagataatgt 24300 gtgtcagatt tctagcaggt ttcttggcat attgcaacca ccaatacact gaacatatac 24360 tgtctatgta actttctcag actcagagat ttttgtctct tttatctccc acaattcttt 24420 tcttttcaaa atgtcacttc cagaattttt tcccagaaga atccagtcca ttaaataaga 24480 atgttttttc actaaaattt tctttctgca tactcttagg attgtatgat gttcgtctgt 24540 ctcccccacc tacaacctcc agcagagaga agagggctga gccagtagtg acaagggtgg 24600 gactttcaca tctcttttat tccccctgta gctttttgct aagggctaac tgatttcact 24660 taaaaaaaaa ttttttttta agaggccttc catcctggtc agacttcacc tttttgcacc 24720 ttagtattct cggctagaaa atggaaataa taagtcctcc cccactcact ttacagggtc 24780 atcataaaaa ctcgataaga tatattgttt aaaatattta aaaaccttgg aatgcttcat 24840 gaatataagg cattgttatt caaatacaga gcttcttaag agctttactt tttagctctg 24900 tgatcagtta acttttgatg tggagcaggc aaccacgaat tctcagaggc gtgcaacaat 24960 aaacatttat ttctcacaca tctgtggagc tgagctgatg taggctgggc ttgcttctcc 25020 atctgggggt ggtgtcgttt ggctgaccgt gttgggcctg gctgggttag tatggctcca 25080 catgtttctc atcctcctcc caggattagt gggcagccca agcatgtctt tcttcaaaat 25140 gatgctggat acataagaga gcaagcaaaa acatacatgg cttcttgaag cccaggcttg 25200 gaattggtat gccattgctt ttactggcca agcaagtcac atgggtggca tcagggatgg 25260 gcttatgcat catctactgt gggaggagtt ttctaagtat gatgagggca cagatacagg 25320 gagcggtgac cattacgaac attaatgcga atcctccaca ctgtgtttct tgatctgcca 25380 ggacagggtt ctctgaaggc cagtagaggt tcagtgcttc caaaaaagga tgctgggctc 25440 aggtaggtag acagagttca tcacctctat catgactgat tggctctaag gcccaatgac 25500 aaaactcttt acttctgtaa agtgttagac agtgaagaag atgaaaaggc catcatgaaa 25560 ttcagtctct gcttttagtt tttgtttgaa attcggtctc attgttgtgt ttgttttgtt 25620 ttgttttgtt tttccatatt ttctcccaag ggttattact ttcacaacag tggaaaaata 25680 ttccttatgt tctctcccct ctccttccca ggattccttt agattcctgt gtgtgcctga 25740 gggagctaga agagaaatac ataaaacata taactgtggg actcttgtct gagcccatct 25800 ccattcttaa gtcccattca cccccacaaa agctttcctt agagccaatt atgttcctta 25860 ggctaccata tccccataaa cagacgtgag ccactgtggg ttcctagtaa tgagattttg 25920 tttggcagtt ttatttgcaa atgactccaa agatctgagt aaaacatctt agagcaagaa 25980 attctgggtt agaaattttc aaaccagaac acttcttcaa aggaagatga ggttgagaga 26040 gggggtggcg gtgaggcagg gattgatttt aatgggccag tatccagggc tccagatgtt 26100 tcttcaaaag gaatctccca aattattgag cccaagttac agaataagcg agaaagaaaa 26160 tggtctacag aatctttgat tgggtccgca tgaattcatt aaaagtggtt gtcagggaga 26220 tgtgaggggt ggggaggctt gcacatatgt atattaacac acacacacac acacacacac 26280 gcacacgcac gcacacgtac acaaagagct tggtgtactg gtcttgtcaa atgctttcct 26340 ccctctgtcc ctccccacga aattaaatcc aaggtctgga gttttgccct ttaggttaaa 26400 aacaaaaaaa acaacaaaaa aaacaaactg ctgcttttcc aaaaagcatt aaagagagaa 26460 aaaatataac agcagctact gacttgaatt gaacttaaaa tttcccagga agaatctgct 26520 cagagccgaa ctcagaaact tgttgcaagc tccccagaca tgagaaaata aacttctatt 26580 aagctggcac tgaagtgcct ggaagggtgt tcaaccctta gaacaactct tagctttccg 26640 aggagtttca gggttggaag aacaactttg ccaattctac cctcaacttg gaacaaagca 26700 ttatacatct ggaggagtct ggtggtttaa tgctttcttt tccatccaag attattcatt 26760 cattcaataa atatttagtg agaacatact acctactggg cacggtgcta ggtgttgaga 26820 tgtggtgatc agggtgaaca aaacagacat agtcattgtc ctcctggaat ttgcacttta 26880 ttggaggtag gggagcacaa ttaactaatt acgtttactt gagataagtg tagttaaaga 26940 aacaaacaag atccagagac agaaagtagc aaggacttac aggatgatca gggaagtctt 27000 ttccatgaag gtaacattta aactacataa tgctgatatt ttgaatctga acctgaggat 27060 ctcagaattt tccacttctc cctctgaaac agaggaggtt ttggtccaca ggagaggcta 27120 agggttgatt cagtcaaagt ctttggagtt cagattagcc ctcgcagtta gctagaagtg 27180 gggatggaaa cttaatacac ttgaattcac acacctccgg aagtatttat ggctacttct 27240 ggttctgacg gcaaggtcag gtgaatcaac ttggtcttat gaatatagtt gttttccata 27300 tcccttgttg aaaatagaag caggtttgaa tcaacgtaaa gaggaagttg ttaaacacca 27360 tgagaaactt ccaaatcagg tgtgtcatgg actctttctc tacctgagat aaagatgagt 27420 ctgaataaaa taactgagaa gtggacttag gtgaaaatga gaagatagta aagatgattt 27480 gtcacaaatt gtagggaaca aaatccaaca ccacactaag aaaataatat actatgacaa 27540 ggtgggacct attacaagaa tgccaatttt gttcagtttt agaaaataca ttagaataat 27600 atacattagt ataactcagg aaaaatattg tgattatctc cagagatggt gaaaaagcct 27660 ttgagcaaac tgaacaccta ctcctaacaa aagcactcaa gaatatacaa attaatggct 27720 gtttctttga caagataaga aatatatagt ttggtcttaa caccagtatc tgtgctaatg 27780 agaaaatatt aggggcatat ttattaagat cagaaataaa taatatcctc tctccccttt 27840 atttgacatt gtactggaga tattagccaa tgcaattaaa caaggtaaat taaaggtata 27900 aaaattagaa acaaataagt taaactgtca gtatttgcag atgatatgat agtatacatg 27960 gaaaattcaa tcaattataa aatgaactca aacaataaaa tattttgcta aatttagaaa 28020 agataagaga atttaaaatt aatactcaga aatcaatagt tcttatatac aaaaccgaac 28080 accagttaga ggatatgata gggaaaacct catttaaaat ccaaagggga gaactttaaa 28140 gcttccttaa tgaaacaaaa gtagacctga acaaacagaa agacaacttt ttgctttttt 28200 tttttttttt gcttaggatg ttttaatatc ataaggttgc cattgttctc ttagctaact 28260 tataaattga ctacaatcct aataatcaca ttaaaatttt ttatagtgaa attgatactg 28320 aagttatatg gaaaaaataa gaataactag agaaatatta agaaattaaa agagagctac 28380 aatgaaagat taactctgcc taaatttaaa aggcattcta aagtttctgt gattgaacta 28440 gtaagaacct tgtgcgtaag tggaaagacc aactaatgaa ataaaatatg atctgaaaga 28500 gacccatatg catgtgaaaa tttagtatat aataaaaatg caagttctaa tcacttgata 28560 gtcattcctt taaagagata caatgaaatc cataccttaa accatataaa agaataaacc 28620 tcaaatgtat gaaagatagt atatatagaa aataaaacct tataagtcca caattctagt 28680 tagaagaaaa tatcattaat ttctgacttg atctgacctg ggtctaacta taatttggaa 28740 tcctgtaata ataaatgata atagtaatca aaatgatgat aaagaataaa atttgactag 28800 gtaaagttta gaaacaacaa atttgaatgt tcaaaaatat tatcagcagt aaagtcaaaa 28860 gccaagtgac gaactggtag aaaatgtttc tatatatatc agagataaaa agttaatgtc 28920 cccaaagtat aaagaatttt tgaaattgag aataagcgga aaaccaaaaa ccaatataaa 28980 tgggcaaaag atacgttcat ataatttaag tggtccctaa atatataaaa atatcttcaa 29040 ctttcaaata tccttaaaca tataaacata cattcaaata tgtttcttgt aataagagga 29100 atgaaaatta aatataatga gataccattt ttcacctatc agaatggtaa aacaattttt 29160 tttaaactct taacacactg ttgacaaagc tgtgagaaga aatactctca gtgttaggag 29220 gaatgaaaaa taatgcaact ctttggagag gaagttgcaa tctctaacac aaatacatat 29280 gtgtttctct cttgaggtgg caatccctat tctagaaatt tactctgaag ctatacctct 29340 aacaatatga atatgaaaat acatgtacac aaagttattc actgcagcaa tgtttataat 29400 tgcaaaatat tagaaacaac ctaaaatttc catatgtact agactgaatg tgcaatgata 29460 catccactca atggagtagt atggagttgt gaaacaaatg aggaagatct ttatgcttga 29520 cacagagtga ttttcaggat attttattga gtggaaaaag caaagagcaa aagagtattt 29580 ctgcaatgta tactatacta cattttgtgt aaaaaagaat atatacaatg tatgctatgc 29640 tacgttttgt agaagaggaa gacagatgaa aatagacata tttacaatat ctgtctaatt 29700 ttgctggcag aaacacagga agaataaacc agaaatggat acaatttgtg atctatagag 29760 gatgtgggga aatgggatgg aaaggacgag tggtgggcgt aggggacggc acttctctga 29820 atataccttt tgtatcattt ttagttttgg aaccatgctg acattttacc taccaagaaa 29880 aagcactaac tatatcataa atgaagaaca ttaccacact gaactaggga aaaaatttaa 29940 aaactaatac aagtaacatt tgaactcaat tctttgacta tagaccatca gactaaatac 30000 aaaaggaaac ataaacatta aaatgtagtt aacagttttt gtctaacaca tagtgttagc 30060 aattcagaaa ccactttatg tgaaacgtag aaatgagtga gtgagcaaat gcataactat 30120 attaaggata aaggagagta ggtttctgac tgttgaagac aattaaaaat atgtacagag 30180 ggccgggcac agtgactcat gcctgtaatc cctgcacttt gggaggctga ggcgggtgga 30240 tctcttgagg tcaggagttc gagaccagcc ttgccaccat ggtgaaactc catctctact 30300 aacagtataa aaatttagcc ggccgtgtgg cacgtgcctg taatcccagc tattcaggag 30360 gctgaggaag gagaatcact tgaacccagg aagcggaggt tacagtgagc tgaggattgt 30420 gccattgcac ttcagcctgg gcaacagagt gagacttagt ctcaaaaaaa taaataaata 30480 aaataataac gtacagagga aaatctcgaa tgtaccaata gtaataatct tgggttaaaa 30540 ttgttggcat cagcaaaaac tcatggtttt attaaatata ttaacattta ataaataata 30600 tgtattaata tataatttca tatatacgta catctatatg tatcttatat gtatttcttt 30660 tttatatata acatctgtgt gtgtgtgtgt gtgtgtgtgt gtgtgtgtgt gtacacccct 30720 tcagtcctat gaatagctgt gttcactgaa ggaagcaatg gcacttcaat aaaaacgagc 30780 acatctagtc ccaagacctt gtttctaagt accattcctc aacaaaaaga atcctcaaca 30840 aaaagacatt tcctgaagaa atgtctgatg ccataggctg gttggagcaa agaaggccta 30900 acatgatcgt gaattacctt attgtaccag aaaaaaaaaa aaactatgaa aaaatgatgg 30960 cgatatatca aaaagactca ggatccagtg tgagcagctc ttattgggca agtcttggaa 31020 atttgaacaa caaaatcaac aacggttagt tacacattaa catgtttgac aaaataagaa 31080 tccatgagtc cagactgata taaattaatg agtgaataaa tgaataggtg attgagaaga 31140 aaggaaagct tctcttcaca atagaatgcc aattaacaaa tacaaaagga acaatggagt 31200 tagaaaagag ttagaacact accattttgc agcaattaca ataataatta gtttaggtaa 31260 gaatcatgaa tgggtgatac atttacggag actgtttgat gaggaactgg atattacata 31320 gcctcacagt gtttctcata ggctatttct aattctagag gaaaaatagt aacttcacag 31380 taagaagcat ggtggacacc accttaacca aatgattcaa gttatcaata acaacgggac 31440 aatctgacat gtgtttccca atatacagat gaaaaagagc atagcatcac aattttacaa 31500 cataaatcta agcaaaagga aagaaaagac aaacccaatt gaaggagagc cacattaagt 31560 aattggcttg aactcttcaa aatgcgaagg ttatagaagt caaaggaaag actgggttaa 31620 tattcttcta acactgtaag tctcagccta aatccaaagg cctgagaacc aggagtgcag 31680 acatccaaga gcaggagaag agagatggcc tggctcaagc agagagtcaa tttgcccttc 31740 cttcatcttt ttgttctatt caggccctgg agggattaaa tgatacccag ccttcactgg 31800 ggaaggtaat cttcattact cagtctgctg attcaaatgt taatctcttg cagaaacacc 31860 ctcacagtca cacccagaaa taatgtttta acagctacct ggtcatccct tacctcagtc 31920 aagtcgatac ataattaacc atcatagagc cagaacatgc aataacttgg aaataattca 31980 gtcattgtgc aaggagttac ctagactctg ttttaggctg gaaggtggga gtgagatata 32040 aaatgcatac agtgatcagg aggctacgag tactagaaag aactagaaag ctttaactct 32100 ttcatggcaa taataaaatt caagattgtt actaggaata aactgtacca gagttatgtg 32160 agacccaaac acagtcagaa ttagactttg gaggtatttg ttgaattgaa ctgaacccta 32220 tagctcccca ttgttcatag agtgcctaca acctgtggcc actgcactag gcattcagga 32280 ttcagaatgt tgagaggact atgagaagta acgtggctaa gcatggaacc agagagagtt 32340 ggcccaaccc tttcatttac aaatgaggaa actgatgccc acagtgagac tggcctggcc 32400 caacattaca caaccagttt atggcaaagc aaagagaaac acctgtttgg gtagtgaggg 32460 ttgcctttta ggtgccctga ccccattttt accaccaagg attgaggagg aattgcagta 32520 caaagagaca agagatagaa aaaatttgag cgttgctgct gctatagacc ctccatccag 32580 caaagccttg agagagatat tctaccaccg ggctgggact gtaaactagt tcaaccattg 32640 tggaagacag tgtggcgatt cctcaaggat ctagaactag aaataccgtt tgacccagcc 32700 atcccattac tgggtatata cccaagggat tataaatcat gctgctataa agacacatgc 32760 acacgtatgt ttattgtggc actattcata atagtagact tggaaccaat ccaaatgtcc 32820 atcagtgata gactggatta agaaaatgtg gcacatatac accatggaat accatgcagc 32880 cataaaaaag gatgagttca tgtcctttgt agggacatgg atgaagctgg aaaccatcat 32940 tctgagcaaa ctattgcaag gacagaaaac caaagaccac atgttcccac tcataggtgg 33000 gaattgaaca ttgagaacac ctggacacag ggtgggaaac atcacacact ggggtctgtc 33060 gtggggtggg ggaaggagtg agggatagca ttaggagata cacctaatgt aaatgacgag 33120 ttaatgggtg cagcacacca acatggcaca tgtgtacata tgtaacaaac ctgcacatgt 33180 accctagaac ttaaagtata ataataaaaa taatatatat tctaccaccg ggctgctaac 33240 ttggcaaggg ctgaaagaat ccaaccgaga agaaaatagg ccatcattgt gcccctctcc 33300 acatcaaaat gcaattactg agcttttctt aagagctcag cactgtgcta gatgttgtcc 33360 atgttgatct tcacaactgc agaggctgaa ttactatatg tttatgtgat aactaaatat 33420 tctattatgc ttgcatttgt ctttggtgaa tattattgaa gtcgtttact gctacggttt 33480 cctctgcagt ttttctacta gtccatcaca ctcttctttt tggccctatt tttacccata 33540 ctcagttagt ttcttgtggc aggctacgtg tgtgtgaggt tctgtgtgta tgtgtgtttg 33600 cgcaaacatg gttttgtgtc agtatacctc atagatatga aaacagtttc tgttcaaaca 33660 gtacccacac ttagactcca tattaatctt ggctcaattc tgtgaaaact ggccctgaag 33720 tctgtgaccc cccttactca cctctttacc tcatctcaac caaaagaatc cacttcaaga 33780 acaccttccg cacaagctct tcaaatatct caagttctct tttccagtat ggtgttgcag 33840 ggtgtagtga aaaatgcatg agtttggagt caaacagatt cccgttccat ttctggttgt 33900 atcctatatt accacttgga gttgttggca gtcttaggtg aacacaggag gcaattcttt 33960 ttttacagtg actgacaaag aggtgagcaa gaaatgtgag tctcttattt attcccagcc 34020 cctctatctt aacttgttga aggtaaagac cagtggatct gaatttagat tatttaccct 34080 cccatgtgtg gggaacacac acacgtgcac acacacacca ggctggaatt tcttcagttt 34140 gttcctccgg gtctactcta tacttcatgg aagctgatct tatgacttac atcaatggtc 34200 tcccttgtcc tctggcttct attagatttg gcaaatgggg agccctggca gatcactgaa 34260 gggaggacag aagttgtagt atttattcct gtgatattct ctcctggtgt gtcaccttgg 34320 gctgtctgcg tcccttgaca gaaggtcacc ctcttgtcag gcatcacttt tctcacagtt 34380 ctctctgtct ctgggttcca acaccactcc ctcttcttga cccttaacgc ctaggggtga 34440 ttatagctcc agctgttatt agcacggagg actgcacgat cccttatgat ttcactacac 34500 ccagtaaata gaacctttat taagcttttc ccaaataacc caatttcagt gcactgtctg 34560 ttttctgctt ggactttcac tcacgtatgt gcatgcacac acacacacac atacacacac 34620 gcatgcacac tcatacccac gtactctcta tatacgtgta cattgagtgc tatggaattt 34680 ttagggttct ttgaggacaa cttcctggaa gaagaataat gggagatgtg ctcagaggct 34740 ggtgagcgtt taattgacct ggttgtgagc acaatgggaa tgcttttctg aaccttccat 34800 ttgcctccaa tttagaataa ctgcttagtc agcaacatgt ctccaattaa catgacagat 34860 tttttggacc acagatctct ttgggaatct tatgtaagct gtgaaacttc tcccttaaaa 34920 aacctacata tttaattctg tctgtaattt taggacttca catatcccca aagaccattc 34980 atgatccacc agggttaaag acttgtttta agtaaagaaa atattcacag cctctggagt 35040 agtagacatc tccagagaaa gtctggcatt ctttggtaac tcatggcatt tattacatta 35100 gctttggatg gaacaacccc caacccccaa gtctgagcat gtggtttgat gctgcttcct 35160 ttccattttc actctgctct cttggattct atgtagcaaa aaggtacctt ttctagggtc 35220 acatgtccac ttctcaaact ctgtcttgca ctggggattt gagggtggac tatcagagca 35280 taatggaaga ggcaggaaag gatagcacta attagagaac ttgataggcc ttttgctact 35340 gataaagatt ctgtcctgta tcatccatga ggtttggatt tgcacttcta aaaaatagct 35400 gtgtgttttt gacaatagcc actccctttt tgctcctttc tggtctcttt cctaaatgac 35460 tttccaggat agtataaaat aagcaatcta tttagaggaa caaaacaaag aactacacca 35520 ttagcattaa aatatttcta gggtagttta ggtaacatag aactttgtag ctcagcagtc 35580 ttggaatcac tagactctaa gccccatgta gtcagagact gcctgctttt ataattcatc 35640 cccaacagca ggctattgca taacacattg ttaccaccca caccattttg ttgagtaaat 35700 gaatgcatgc atgaacgaat cagaggattc tgttgtctaa ataaactttg gaggtgactt 35760 agtcttctct tccctctgat gcttagatct tctttatctc tcagttcaac atatattgct 35820 caaatggttc ctaggtgcaa gggatctgga agttattaaa atgaaataga ttttggacca 35880 tgaccttgac aaattatgat ctactaggag agataatatg gaaatcagta taatactaca 35940 gagacagtaa aaaggaaaaa gaaatgtttg cacttaataa ttattccacc attgttccaa 36000 aagtttcaat tatagggaac taagttccac tactaataaa agtcaatacg cattgtatgc 36060 ttactgcatg ctaaatatat tatgtcatta taatatttat gttcaggtgt atactatgat 36120 tgtatgtatt ttacgacaag gaaattgagg ctcagagagg ttaaagaact tgctcaaggt 36180 gacagagcca gtaggtggta gaacaaagac tcctacattc tgacctagtc catatgtaag 36240 cagatttatt gctagaaata tcttgatgtt gcattgaaat ctgcctctcc ttattttcca 36300 tttggaacta attccactct cccgagccag aaaaaccaag cctctcatta cttgaaaaac 36360 caattaatga gttaaattac atcaagttag tttaacagtc agcaattccc tgttgtaatc 36420 atagttaggc tgctaccatt tttgtcccaa tcattggccc acactgaatt ttgtgtctaa 36480 ttcattgctt tctgtctcct taatttcatc ctctgccccc agagatacta tgctgagtat 36540 tgatgctgca gcaacatatt aatttttatg ttttctgact catttacccc aaagccatag 36600 tgcatcaaat gcttttgggt ttgtgaccat tttatctttg gtttcagtca ctgtttatct 36660 ggtcgcatct ttgttcattt aacaaatatt tgctatgaag tgcaagttta gtgggtagca 36720 aacactgctc tggcaagggg tatatgaaga aagacatcat tccttcctcc aagactagtc 36780 ttgtttggaa gctggacaaa caaacagtta caatacaatt aaaatagggt taattaagaa 36840 atgtgccaac tgtcaagggt aatcaaaggg gaccctttca gtctgtccca aggatgctag 36900 gtaagtcttc acagagaaac tggtattagg gctaagatct agcggaggac taggggcttt 36960 ctagacagac aatggaggca ggacacttct gagagaggaa tgaagccttg aggtgtgaga 37020 cagcatgtgg tagagcatgg agggttcagg cacttggagg agttgggtat ggggagaaat 37080 acagagcacc tgtgagagcc tggggcatgg ctggagaggt aggcaggggc cggcttgcaa 37140 agggctttac ctgtcatgct gaagggctaa ctgctgttct ggagaatttg cagagccact 37200 gaaggttttg aagcatccta atgttaggat tcacttcaag ttttagaaag tttagtcttt 37260 tggctcaagg gtggggaggg aataaaagaa gcgagagtga aggcatggga ccagtttaga 37320 gactagtgaa gtctgatgaa aaggagatga gagaagccta aagtggacaa gcagctggac 37380 acggcggctc acacctgtaa tcccagcaat ttgggaggac gaggtgggcg gatcacctgt 37440 agtcgggagt tcaaggccag cctggccaac atggtgaaac cccgtctcta ctaaaaatac 37500 aaaattagct gggtgtggtg gcagacacgt gtaatcccac ctactcagga ggctgaagcg 37560 ggagaatcgc ttgaacctgg gaggcggagg ttgcagtgag ctgagttggc accactgcac 37620 cccagcctgg gcaaaaagag tgaaactctg tctcataata aataaataga gtggacaagg 37680 aaatactgat gggggtgaga aaacaatttg agagacattt gagaagtagt gagataacat 37740 ttggttactg attgaatatg gagtgttagg ataaccctgg gatcctcatt ttgggcaatc 37800 acaaagctac tggctacagc aaaaggaggg gaagaaaagt ggtggtggga gggaggcatg 37860 agaaatttgc tgctggccat gttaagctcc acctcctgtc accaagtggt gatgctcagg 37920 agatgtttgt gtccacagga ggagagtgat ctgggtggga ggtttacatg tccctccttc 37980 catctcccgg tccttctttc cctcctccct ctttctttgt ttggtacttc ctttcttctc 38040 tcttttcttt ttctgccttc ttttgagaat gaaacctaag agtgtttata tgtagaggga 38100 aaaagtggag ctagaagttt aagacacagg aaagggagga aaaatgtcct agtgtgagat 38160 tccaaggagg aagaagggcc aggataaggt ggggagaggg atgcctcttt tgctcattgc 38220 ctttatctgt ctttgtctgt cctggattga ttgtcctatc cttttcttcc acttcgtgtc 38280 ttctcccgta tttctacaca aggcacagtc aaataagggc tggcacgtgc gcatctttgt 38340 gcacacatgt gtgtgcacaa gcattgaggg atgcacaggt gcacacacct tgtagagcct 38400 ctagtagctc aagtcacatt ttttcgcatt tccagattgt aagccttact gaggggcaga 38460 tgggacgttc tcacaggaaa aaggctgacc tcagggagaa agatgtggcc cccacctaca 38520 aaccaatgat gtctactccc aacaggggac gtctttcccc tgcgtgaagc aacaggacag 38580 atttggttag gtgtggcatc gatgtcctaa tctcctatga gcacacaatg aatgaaggtg 38640 gggggctctg ttaactggag ggaatcaggg gctgccctgc aaagcatgtg caaagaaaat 38700 aaatgcaatt ggagtgttgt ctacacatcg tcctcagtgg gcacaaaaga ggcacagtgg 38760 gatggggctc tgacccagtt tccatttggc cagccgactg gaaacagcta ctcactgggc 38820 cactgggttc tttccaaaga acagtgaaga acagtggttt ggggtaggtg ggggcagggg 38880 ctggtggggc aagaatgtca gaagcaaatg caggcgtggc tggtccagta gttccagtac 38940 caaagaagcc gctatctgga agagtgggac aacccatcct aaacatggga agaagaaaca 39000 ggaaatttca aaagatacaa ctactaatta aatgaaagca ctccttaacc acccctttga 39060 taattagatc atcttctcct agaatgagaa ggaatattag tctgactttg ccctccatat 39120 ggagaaacat ggcaggcagg ctctctgtgc ctggagggtc tggccagact ttgtctggca 39180 tgggtatttt gactccagcc tattttttag ggatcctcct gcagctggtc ctcaagaggt 39240 ctgaactttg ccgtctcatt tctaaagcct ctttcagcag gtactggggt tcccaggtcc 39300 agggaagcct ggtcattgct agaacacatg gcaacatcct tcaggaaact cagctcagac 39360 tgtctggaaa gatgctggaa aggctgaatc catgcaagta ttatctaacc agccccaagt 39420 catgttttca cacttagatt tctacaggat attcataaat tctggaaaca aagatattgc 39480 cactttattt tatttttaca cattgagaag tttccttggc aacataacat gtatttgcct 39540 atgtttccaa ggtttatgga tgaatgtggg tggtcaatgg gattcattca ttttgccaag 39600 caaacgatat gtttgaagcc atattaagtg ccaggtacca tagaggatac agatgttcat 39660 aatgtaaact gccctctagc agcttacaga tactacctag gaataatgct tacactgcag 39720 taaacaacat aaggcagaat atatatatat gtctttgtac tcataacaaa atgtaaaagt 39780 caaagtcagg gctcttttaa ctttcttagt agcagaaacc caaattgaac ttaagcagaa 39840 ggggaattat ttatttaaaa cacaaagaaa ttatttattg aaagcaaaca ggaaattgat 39900 tattgcttct tacaactcat gagctaaaag acagagctgg gttcagatac agatatatcc 39960 agagttgtga tgctatcagg acgctgtctg gtaatgaaac caaccacagc acagagcctg 40020 gagtggaggg acagaccaac tctcttcaga tgccacatcc tcacccagca gacctcctcc 40080 tctccagcac ccattcatca aaccttcgag aagaccctgg ttgctactgc aaggctttca 40140 gcaccaaatg ggaaccaact cctcctcctt ggacatggaa tacttgaact ggccattctg 40200 ggacaggggc ctgcccatgt gaatggaggg aggaagaagt gaaatcctta aagggttgct 40260 gggtcagcat atcacaaatt tcccttgccg tgagccagat ctgatgggat ggtattagtc 40320 aataggtaga taataggggg aagagggggt gaagaatgag atggttctac aaaaagaaag 40380 gcagggtgcc agaaggtaga atttgggcaa tagtgagtca cagaattgat tgtgtcttgg 40440 agcccatgga agggagctga ggcacctacg gttggagggg gaggtgggga cccttgggca 40500 cagctaaaga gtctgctttt gggtaggatg tacagagcaa ttagaattat ttagcagtga 40560 cttaaagcca agagaacaaa tctggcttca gagtgttgac atggaagaaa ggaagaggca 40620 aatggaagag gctattccaa agggagaagg tctgagcttg gtggtgcctg ggaaggaagg 40680 acactgcagc caagctgagc ctgtgtccag ctgaacacgg acatttactt ctgcttctga 40740 ggggaaatat tgtcatgtct tatgggtgta cccagcaaaa gatgtttcca ctaaaagact 40800 atagagaatt gcttatttct aaggactgaa ttccgaatgt ttttggtcag gttctctctg 40860 aacagagaac cattgcccct gagcagaagc ggtcttcaca caactagcaa ccatgtagtg 40920 ttttctcatt caaatggcgt ttggtattca cctgcctgtc ctggaacaaa tgcaaagtca 40980 gggttgtttc tagctctccc ccaatattgg aaaaatgctg atgaactgag cctggttcca 41040 ttttacacct gacaaaagga actcagatga gagtgttggt aactgggttt aaggaggagt 41100 cagaggtgac tgctgaaatt tctgccagac tacaactaaa ttaaaaaagg aattcggttt 41160 aagaagccaa tcttcaacta atttgaacat gaggatgctc aacttagaag cctcccatgg 41220 ggccctggag cccagaaggg actgcatact ctttgctcct gcaggtaact cagggctttg 41280 ttctggtgtc tctgacaggc ttctaacctt ctgcaattct gttgccacaa tttctgtggc 41340 accaggagaa aattcatgca tctaggctag ggtggtgctc tcatgtgtct ccaggagagt 41400 gtggcctggg ttagcttaag actaggaatg tgctgacagc tgggaagaaa gtcaaaagaa 41460 ggcatggcat gtggttatgg ggccggaggg accgcttggg gggagaggtg gaagcgctga 41520 catgagcttg ctctgcatcg ctggttccca gaggtggcct gataggagag tgccagctgg 41580 tggtatgccg tgggctctgg ggaaggggct agaatgttgt tgcagcccag aggggctggg 41640 ctagtgagga gcaaaagaaa acataagctg gggggaaact gcctaataga ccaattagga 41700 gacagggttg tgccctaagg gatgggtggg agcagggggt gctagaagta gacagagagt 41760 aactctcagc tctgaacagc gtcccacata ggaggaagaa cactgatgtg aggccaagtg 41820 gcttggaagg gcgttgacac cccattccct acaacaaagg gtttggcaaa ctcatctcat 41880 ttgctacttg tcctataggt aaggatggac accaaaccca aagagacttt tgggatgtgg 41940 ataaaaattg aaaactttgc ctctcattaa tcccttggag aatatagcat ctccttcaaa 42000 ctggactgct ctccttgatc ccttgtcttt acctgaaaat atctttcaag gcctagctca 42060 tgctatcttg gccataggaa ctttccttat cacctccatc aatgctgttt gtccctccac 42120 tagaatcttc tgttttggta ctcctcttac tcagcctcaa gttaaattta tgtgtactgg 42180 ttttaacccc agtacccagt aaaggttctg aatacacgtg atgaaataag tctctcctat 42240 cccatggcac ctagtatagc atttagttgc tatactaatt attataatta gcatttatta 42300 cgggcttact atgtgcaaag tgccattatt ccatttatta ttcacaaaaa tatttagtct 42360 ctactattct ctaatttatt agataaccta atataaatct tttttgtttt gattgttgct 42420 agctgattga aggaaataga attgtggtgt ggtagtaggg gatgttgagt gagtcttcct 42480 cattcttaat atttccttcc actaggataa cgcccctggg ctctcttcat caggggagga 42540 ggagtgactt catctgatag attcggaagg gaaaatgtta cccagtcgct tctcagtcct 42600 ctttctcttg gagcgagccc atctctggag cacatacact ctcccctgct cctgtaggtc 42660 tcgagttctc aggggaaggg tttgccctgt aagagagctt gtccttctcc agtgaggcct 42720 gtcactggga agataattct gtacagtgct gggattcaaa tttagaaagc ccacttgccc 42780 cataattaag ccacattcac cagctttaac aatgacagag gtgatattga gttctccagt 42840 gatattgagt tctccatctg ccttatgctt ttctgcttat ttccccattg gttcagaatt 42900 ctggtgggaa aaggggtgct gtttgtggga tgccttccca ccctcatgtg gccctccata 42960 agttcttcat ccctcattgc attcaataac ttgggtgtgg tgtgggtgga gtgcatgtgc 43020 catatgaccc tctcccttga gtctttgaaa cctatttctt actttatgac tttggacttc 43080 cttttctttg ggagtataaa agtggatacc accattccac cccttacccg tcatcaggag 43140 aagttagttg ggaagcaaag gcggagtgac gtggagggaa gagtctaaaa acagctctac 43200 acttagcttt gtccttgcat tgatgacaag cgatgttgga tcctgaaagg tggggatggg 43260 aggtaggaag acccaggaag ttgctgtgaa ggctaaatcc taaagacagt cactaaaagt 43320 ttccagaagg ggcatctatc actccacagg caagcaagat gagaccatgt tgaaaaggtc 43380 ttaaagaagc cagggaagag gtgaaacatc tctctgtgtg ctgaggacca taccaggtcc 43440 ttcattatca tattctacac attgaaaatg aaggtaagag agcaagcaac ttgccctagg 43500 ctacccaggg aatagggagg aaagtctgga tttgaaccta ctgctgcctg actccgaagc 43560 cctgttcttt ctctcaccct ggaggatgga tgagggtggg atggggcagt taaaagttga 43620 ggggtatctc taggagaaag atgagacaca tgaccattgg gtctaaggag ccagagagag 43680 gccattgtgt ctgagcctgg acagccaagc ttcctagaga cagaggatgg gatgagatga 43740 cttctggctg actctgcctc cttgagctct ttaggatccc ctgcagaatc tcccaaaatg 43800 atgctcattg gaaacagaga gagcacattc aagtaagtat ttgtgccaca ctatgattgt 43860 tccaatgacg tcaagtctgg gatggcaaca gcagcggttc catttctttt cttcaggacc 43920 tggattcttg ctccaaggtc ttccacctcc ctcctcattt tcttccactc ccactgcagg 43980 ctccttcctt ggaggagctg gggcagggag taggggtgga ggttgtgtgt gcacttgtgc 44040 acatgcatgc ctgtctctta tgtgttgctg agtcaggaat gggcaggaag gagaggcttg 44100 gacagcaagg cagccctggg caatctggtg atgaacttga aacgggagag ggtctattgt 44160 gcatttgcac tgactctgtg caggaagggt gggggcaggc caaggaggac tggcttggct 44220 gagacatgag atgtctcagg ggagggtttg gctgaggcag tggaagaatg cttgtcggga 44280 accggcctgc ctggaattgt aacctcccct gctgtctctg caccacactc agagtacagc 44340 tgtatgcctc ttagctggta gattcctttt ctagctgggg acaccgtgga cagggacagt 44400 ggggaagagc attggactca gagacaactt gacatcaagt cctgcttgga atcctatttg 44460 ggtttgtaat tcgttgaagg cagacacaga cataaactaa tccttagttt tcccatccct 44520 tcaataagga gtacaacacc tatcacacaa ggctacaaga ataaaagaga gaacttgtac 44580 aaaggcaggg cctccacttg gcacatctta gatcctagac aaatgctgaa caaggcagca 44640 tggtgtgatg gtgaagggtt acagccagac tgactgactg gtcctgtctt cgtttgaagt 44700 tttgatattt tgttcctcgt gggttttttg catttttact atttatttat ttatttattt 44760 atttatttat tgagagacag agttttactc ttgtttccca ggctggagtg caatggcgtg 44820 atctcggctc actgcaacct ccgcctccca ggttcaagcc attctcctgc ctcagcctcc 44880 tgagtagctg ggattacagg catgtgccac cacatccggc taattttgta tttttagtag 44940 agatggggtt tctccatgtt ggtcagcctg ttctcaaact cccgacctca gatgatccac 45000 ctgcctcagc ctcccaaagt gctgggatta caggtgtgag ccaccacacc cggccaattt 45060 tttttttttt aaaatatggc attaaaatgg tatttatctt gactactgag tttttggtta 45120 accccttaca ttttgtgccc aagacatctc actcatgtta tcctaggccc agcatggctg 45180 gccttgtctc ttaaattcaa atttttaaat ttttcattcc tcaggcttct cacttgtaaa 45240 atagaaataa taatagcatc tcccccacag gcctgtgctg agagtgaaat gtgttactac 45300 acgtgcctca ccttcatttt caacaggacc tattgccagt aagtgctcgt taatgttagc 45360 cattattctt ggcattgctg ttgttattag tgtcagccat cattctctca gccaagagat 45420 ccttccagaa gagaagttct ccatggaggg ggatgggaga tgagctgaac cctggaaaca 45480 gaaatggatc agatcaggga gcctcagtgc cctgaagcca gggcaggggt gcatggggct 45540 tctgcaaaac ccagggccaa gcatgcaggc aagaggcagc cttgccaagc ccttgcagaa 45600 aatgcttgca gtgcaactcc tctctggaga cgccacaagt tgccccgaca gcttttcctt 45660 ttggggcttg tttaacattt caaacaaaaa taaaataaat aactgcagtg tttatggaaa 45720 cctaagacag aaatgaagac gacttagaag aaagttaagt ggaagtgggc caggaggggg 45780 tttagaagat gcccctttcc ttggtgttag cagttttgtg cttcagtttg tcagctcttc 45840 ctactgctct cccctagcaa ctcctctgcc agtgtgcaca aatgcatgtg tgcacacatg 45900 tgcatgtgaa tgcatgtaca cacacatgac acacacacac tcatcccaac gagaggcaca 45960 catttcagac accatctcac acacacacat ttctctcttt ctggaaatgt gtccacccac 46020 tttctccttt atcttcttca ctgtgttttt ttgttttttt ttttttttct ttttagacaa 46080 agaatctaat taactcattc tggccagatg gtgtacatta ctttaactcc ttcactcctg 46140 tgaaaatttt tggcctcaac cttcactctg aatagaccaa gccaaactcg ttttatgtgg 46200 ataagccatt tccaagtcaa agttccgtgg caggaagtgg gagagtgggc agagggagca 46260 ggtccttaca agcaaagact tgtataatgc tttgcctaga tttgcttatc agtatgttaa 46320 atatatgtgg actattttat tcttccacct tttattttgg tatcttcttt gtctatccag 46380 tctcactttg ccagactcca ttatgcaaga gaggctttgc cagaagcaag gatgctgtag 46440 aggaaagtaa tgaaaatgtg aggatttctc agaaggccac atacaatctc taggtctttc 46500 cagtacacac agcttcaaaa gccaggtgct gtgttcccca agcaggtcag ggcatttcca 46560 ggagccctgg attccagaag ctcaggacac ctcagtggta aagagaccct aatgccggtg 46620 acagcacaga ccctggaaac cctagattgc ctccgtgtgt tcctcttggc ctcagcaggg 46680 ctggtttccc cctcctgtag gagcagagga ggctctcctc tcttgagccc agggcctagc 46740 atagtgacca taaggaagca tagaagatcc agctgcagat ttggaaaaca gagccctcat 46800 ctctggaaga gccaaaactg atcctcaaca tgtgccatgc acatcagata tcaaacgctt 46860 cattcatttt gccttcgctg ggtaaccagt gaccttgaga agtcacctct cttgagtctc 46920 aatttcttca agttgggaac attacatgac aggacaggac tgtgaggatt aaatgtaaac 46980 aacatttttt ttttttctat agaacatact gtggggccag caccatgcaa ggtgctttta 47040 tctacaattt atttctttcc cttcccatgc cttctgcctc tttgaataac tgctgcaatg 47100 gctgtagaga gataaatgca gtagaccaag acttttagtg atttttaaac aatgttctag 47160 ggcaaataca tgggtatgtt tacatactcc acaaagtgaa aaaattatgc tagtcagtgt 47220 gcaaagtgtg tttttccaga cctgcaaaaa ctgagatcaa cttccatatt tccaacttcc 47280 atattccctt catcccttaa gctaccaggc agaggatggg agataaaatt tggccataaa 47340 cttgtcatgg gtccatcttg gtcctaatta gaattatcta cttcctaatc cattaactgc 47400 atggatagat agtctgaggg cctcaagggc aagagatgac ttctacccct ccacccatcc 47460 agccctgacc cacccttctc atatacattg gagaaagctc tgctctgtgt aaaacacatc 47520 aagtgcagga catggttctt ttcttcaact atctacagaa atgaatagcg gccctagaga 47580 aatgcaaaag atgcctgcaa tccaaggcca aattggagaa catttcaagg agaactgggc 47640 ctttattgta gagtttggga aatgagtaac atgtagatct gtgaatagat atgtctgagg 47700 aagcaccagg cagcggaaat agctggttgc aggagcagtt tgtcctgccc acctgaatct 47760 tcaggttcct tcagctaagc cttaggagag gaggctggag agctgctttg ctggatcatc 47820 tcctttggcc cccctcagac tagaactgca cctcctctct acctagctct gtgctccaca 47880 ggctgcctct gggctgcact gatgggctcc cttgactgct ggctcctgtt cagggttgga 47940 ggaggaggat gaagtcatgg aatagtgtcc ccatgctggg ctgcaggtac agttgctgct 48000 tctctactga agacccctga cagcaaccct gtcttacagc cagggtgttt gtagttgctc 48060 cctcctccct gtccctttag agtggtgatg gcactatatg ttagatatgg tcagagcagg 48120 agacatcatt ttcccttaat tctattctgc cttgtaaccc ctttcttaga ctctctgctg 48180 agtctctgct tatgtgttgg gattgcattg atgcagatgc tttagggcca cgttgtggag 48240 gatacaagat gatgagacag gaggcagcgt atggtgaatc acttctcaca gctcctaact 48300 aagttctggg cacatgaatg ggtactcagc acatacctac tgaccaagcc tatggagagc 48360 tgaaaactca taggctgact ttgaagcgag gcctttgaaa ccatcgtccc aggggaaata 48420 atctaggtca aagagacggc tgtggcaagg gtgcgagctg gcaagcatga gggctgacaa 48480 agcaggcagc actcctcctg agcagatgac cagccccgca gtgctggatg ggtacgacta 48540 ttccaaaccc tggtgtaatt ctgtcctcta acgtggctgg tttgactcag cactgctggg 48600 gagccacaga gccttcttct ttagcattta tgagctcatt ataagcatcc aagaaaacat 48660 caacaaaggg tgctaagtcc ctctagaact gccttttaaa tttttctttt gtaaaaagaa 48720 tgatgcttta agtaaaacca caacttacag aattcagaca aaaccaggca gcccccaatg 48780 ttgttatccc agctcctctt ggaataaatt tgggaatgaa caaaaagtca cagaagagaa 48840 aactccagcc cacacccaca ccttttctga catagccgcc tgtgcaggtt tttgggacca 48900 ggtctgccat ctgtattccc aggctgggct ggagcacctg aggctactat ggttacagaa 48960 aggaacctgg catccgaagg tataggctca aatcccagct ctcatgattg ctagctttga 49020 ggtttcaggt tcatttctta agtgctctga gctttggtgc cctcctcttc aaaatgggaa 49080 tgaggagcat gtctagctcc ctgttttgtt gcagtgaata gctacatgaa gaacagctaa 49140 accagaacag aaagaaggca aatggaagct acagaaacca aggatttcct tgttgaatcg 49200 aatcttcctt caatcttcct tcaccacact agtggatctc cctgtgggag ggatgttgag 49260 agtgctccgt gttttttttg tttttttttt tttttttttt gtgatggagt ctcactctgt 49320 cacccagact ggaatgcagt ggtgcgatct cggctcactg caacctctgc ctcccaggtt 49380 caagtgattc tcctgcctca gcttcccaag tagccaggac tacaggcata tgccatcaca 49440 cccagctaat ttttgtattt ttagtagaga cggggtttca ccatgttggc caggatggtc 49500 tcgatttctt gaccttgtga tctgcgcacc tctgcctccc aaagtgctgg gattacaggt 49560 gttagccacc acaccagcct tctctgtgtg tttttaatca atagcaatat gtaccatatt 49620 tagtagggac tataaagaaa ttgtgctaga aacacctggt tattttacag aactttgcca 49680 gtgagtacaa aaatatgcgt agcccacaac ctctctcccc tagaaaatac ctcctgtggg 49740 tagaatgaaa tgggtaggtg ttcttaccat tcattagcat ttcaacctgg ctatcttctt 49800 cctagaattc cactactccc aattgcccat gtgtttccaa taaaaccaat tcaattgtgt 49860 accaacttgg tgacaaaacc tttatgtagt tcttctatca ttttgtgggg ttttcaaaga 49920 gggttgctct ttgatatggt ttgatgctgt gtccccaccc aaatctcatc tctaattgta 49980 atctccatgt gtcaggggag gggcctggta ggaggtgatt gaatcatggg ggggggactg 50040 ttcttgtgat agtgagtgag tactcacgag atctggttgt ttgaaagtct gtggcacttc 50100 cccctttgct ctgtctccct ctttctctcc tgccaccatg taagacgtgc cttgcttccc 50160 cttcaccttc tgccatgatt ataagtttcc tgaggcctcc ccagccatgc agaacagtgt 50220 caattaaacc ccttccttat acattaccca gtctcagcta gttctttata gcagtgtgaa 50280 aacagactaa cacactctta aaagtaaatg ttattaccca ccttttacag attaagaaac 50340 ttaatattac atcaaggaat tagtttatag cactggatga tctggcctca aatctccagt 50400 gtgatcagta tcaagctttt ctcactgtat caacagagtt ttcctaacaa atcataagac 50460 acaagtagtt tctccaactt aatctattat acccataatt cacttgcctc cagggaaaaa 50520 aattagatga aacagactgt agtggctttg tgtaaaacag cagctccatt cctttagccc 50580 tattctaaaa caatagacca tgtgctgata gctagctaac ctccattcag tgcttcacta 50640 tgtgtcaggc atttgttcca aacacatttt acatggatta tcccatttaa tctttacact 50700 aaagtataat actcttatta ccccatttta aagaagagaa aactgaggca cagtgagatt 50760 aaggaattca tccagtttct gctgcaagta gggtggctag cattgtaatc tgggcatttg 50820 ccatgaagct gtgcccttaa ccactccact atgtgctata aggtggagct gacttcatgg 50880 gggctaattc aaccagggga gtgtgctcat attaacagat ctgtgaactc cctggtttgt 50940 ttgtgagaca attatctatt tgcttacctg aatcacagca ataatagtta tacctcccac 51000 ttactgcatg cctacttggt agcatgtacc tggacagaag gttttcattt ttatgacaaa 51060 cctgtaaaaa atggcttctt agcctggttt ttcagatgag gagtttgatt ctccatccaa 51120 agtcatatga taaagaagtg gtgaaacagg aattccaacc caagtttgtt ttgttttgtt 51180 tctgaaatcc atagactgga gtagaatctc aaattatatg acatttgtct atgcttattt 51240 tttagtttcc aaggtgatgg attatttaaa aaccaaacga ttttgaatgt aaaacaagct 51300 taattcaatt tacttataaa caatgagcac tgactcttgt atacatttaa gttatgagac 51360 actccaatat taattcgacc cacacttttc tttctataat ctattgctcc caaatattct 51420 atactatctg catgtctgcc ttagatacat aaggatccag ccctttccca tgtgtctctc 51480 aggatggcac ctttgctctg ggccggatgc catggggttc tcagtgatgc gcactgaata 51540 atgcaaatat gaggacataa tcacagaagg aagcccttga aattctaaag ataaggccca 51600 cagaccaggg tactttgaat aagtcagtca tccttttcca aggttatact ttttccccct 51660 aaaataataa ctgcagacac agttctcaaa gcaaacaggt ctggtatagt agaggcattt 51720 ttagacaatt tttttctatc tacttgttaa gcacatttta aaatactgat tgccaataaa 51780 gggctttcca tagaactcaa aattccaagt ctctgtccca agcttctggg agcattcctc 51840 catttttctg tttttatttt ttgagatgga gcctcgctct tgctcaggct ggactgcagt 51900 ggagcgatct cggctcactg caacctctgc ctcctaggtt caagagattc tcccacctca 51960 gcctcctgag tagctgggat tacaggtgca tgccaccatg ctcggctaat ttttgtattt 52020 ttagtagaga tggggtttca ctacgtaggt caggctggtc tagaactcct gacctcaagt 52080 gatccactca ccttggcctc ccaaagtgct gggattacag gcgtgagcca ccccggctgg 52140 tcgcattcct ctatttagtg ttaataccct aagactcccc agctgaccac caaatgtagg 52200 caggtggagg gactgacctc cagggggcac atgtctcagg ttgacaaaca cattttctct 52260 tgatcctttt tttcagtatg atgaagtatt ctacaagact ctcattgaac cttctgatat 52320 cacattctaa ccatttatat aaaagtcaaa agctccttgt cttcaggatt ccaaagttct 52380 tagcacaaag gtccaggaag tgtctgaatt ctttggtgtc tggttcagta tggatgttcg 52440 ggtccctctt agacttgaga tagaacagga aagagatgaa tagacaatga cagaggtaga 52500 gaaagtacca acccttccca ggctgtcggc ttatttgact gtgggaatca ataaaaagta 52560 tttagtgact aaaatagaat ttgaacccag ttcagatctg taagctaaca ttttttaggc 52620 aacaccatac agcctcttca tcattccctg gcctctttca tcctatccct ttttctcccc 52680 cttcctcttt ctctccttta tttctcctta atcatcttgc ttctctttct tatatcttct 52740 cagtaagtaa ataatccaca acctcacagg taaattaaag ttgccattcg cacatctgtt 52800 ggctcccagg tatggttcca ggatactggg aatgttaggt agtgagaaag attcagatga 52860 tattaatttc ctgcaaatgg aatattcatg gcaggcacag tctggccaat tgctcatggc 52920 ctggcgagta cgactagcct cgattgtacc tggtctttgc gaatgtggtg gcatgttcac 52980 tggcatcaca tactccctct catctcctga atggctgacc agtgcttgct tcaagttaga 53040 ttagagtttg agctttgtaa cataagtccc cttctgtctg atcaatgaaa tgagggatag 53100 gtacttgccc gagagttatg ggacctggca tttaacgtga gaacatgcat cttcagaagc 53160 actggtgaga cttcagaatt cctgaaagca ctattcttgc aaggcttgaa tgtaccttct 53220 ccactccacc atgtcctctc ccaaccctac tagcatgata tcaagcttgg gtggagagct 53280 cgcttgcaac tttgtcagat acccatgagc cactctttga atttctgaca atgaacaagt 53340 atgtgggagg ccaaccccat ccaacctgac ccatctgaac ccaatcacat gttttctatt 53400 ttgaaataaa caggcagggt ctcaggaatt ttaagtgagt cctctatatc tttctctatc 53460 ttccttttct tccactaatt attacagaat tgatctgcca gtaattacta ctaaattgaa 53520 tttcaggggc agtgctgtat ctggccccaa taccctaagt ccagtaatag cctggaatgt 53580 tgctgagttg ttaccgtcct taaagggtga agccacaatg atactttcta taacttctat 53640 ttggtctttt taagcccagc acttagaagg attcacttgt ggagaccttt tcatttcttt 53700 caactctaca gcttagtgcc tgaaaggcac atattggtct ctgtgaatct ctacgttaag 53760 aatctgattt gcagcactgg aaaccttgct agtcttagct ctgggctgaa tcccatgaag 53820 ccacgccatg cctagggctt tcatgctgta gtccatacct ctgaagaaaa cggagagaaa 53880 catcttcctc ccttcttccc cccaagtgtg tgtctgttct cgtcagattc ttggcagggt 53940 taccaactct cttctaagca acttggattc acaacagaat gattcctttt caatgccaat 54000 ctaaacaaat gccatcaact cttatcccag ggagtatgaa aaacagaaga gtcctttgtg 54060 actctgattg gctttgtgac ttccttgggg ctggtgttgg tctcaggctt gtgtctcgca 54120 gtcatccaaa atgtgggtgg gccatgtccc accttaactg tggttgtgaa cgcagaggat 54180 tcactcaact ttcagcatgc aacaataatc aaatgcagtt ttatggttca cagagggctc 54240 caccttcatg atttcatttg atcctcctaa caaccctggg agctcagaga gactaaggaa 54300 cttgtctcat atcacatacc caggagttga ctgcacggca tctgatgcca gcttctgtac 54360 cacgtgtcct cctggtgata ctagagtaaa taaaacataa ctagacaagt aaatattttg 54420 tacaaagtaa tctgctaaaa atgtggatgg cattttaggt tatttgttgg tttgggttat 54480 gcctcttctt attttgtaga taactgaaag ctaagagcat tgtcttattt atttatttat 54540 ttatttaggc agagtctcac tctctcaccc aggctggagc gcagtggtgc gatctcagct 54600 cactgcaacc tccacctccc aggttcaagg attctcctgt ctcagcctcc caggtagctg 54660 ggattacagg cccctgccac cacacctggc taatttttct atttttagta gagacagggt 54720 ttcaccatgt tggccaggct ggtctcgaac tcccgacctc aggtgatcca cctgcttcgg 54780 cctcccaaag tgctgggatt acagcacttt gcaatcccat gcgtgagcca ccgcacccgg 54840 cccattgtct gtcttcataa gcagaaggct gtggcacagg gtaggagaag aacatgaaga 54900 caaagttgag gggagttgct tatctcatgc ttcttgctgc tctgcctgaa gcaaaaatgc 54960 tttatggata cttcacttat gatttaaaat aatagctcac attgtgtact tactgtgtgc 55020 caggaactgt gctaattctt tatattatgc ccataaaacc tgcttctgaa gcattggggg 55080 gtttgcactt gccgttccct ctgtctggaa tgcctcccta tgcctacctt catgaacctc 55140 ttccctttac tttccccatc tctgttcagg tgtcacattt ttagttattc tttcctgacc 55200 gctcagtata aagtagctca cacctctacg ttatcacact ccctcttacc tgctctattt 55260 gtctttatag ccctgctcac aattatagtg tacatggatt tcttaatgtg tgctttatct 55320 tccccctccc atcggaatat aaactccttg agagcaagga tgatattttc ccctgctgtt 55380 ttctcagtac caagaagagt gcctggcacg tagtagctgt tcaacaaata tttgctgtgt 55440 aaattatctc attttataga taaggaatct gaggttctaa gggagtaaat cattgacttc 55500 aggggacaca acaggcaaga ggtggaacac agtcatgagc taaggcagtc ccagatcctg 55560 cctgaccctt cactctcttc ctcattcagt gaatcgtaag gcacttgggc tgtttgagca 55620 gtgcccttat ccataccctg cccagtcagg gcctcccaga accaggtaaa aggatctggc 55680 cccctctgcc atcctcccac tggtgccctt cccctcccac ccaccgcaac ccccatctag 55740 ggagaggaaa ctctttttcc acctaaattc cccctctgtc tagttcatcc aagtcatctc 55800 ccttcccacc acactgttta cacttgtggg tctgtgttga tgcatatcac agccccctta 55860 gtcattgttt agccattata ctttgcaggg gtaattttcc atccctctgt ttatattttt 55920 gcttctcctt catgtgctcc ccctcccact tcttaagggc aaaggaagac atgttcagtc 55980 atacaagcaa taatagagtt ataattaaga tgggaacatt ttgccaaaag gaggatttag 56040 ttgtgatttg ttgaatgcca tcctgagtgc attatttaag agcaaattca agctctttca 56100 tgagacttcc tgaacagtgc agtcctctga gcctgctgtc tctatagtct ttgtgtcagc 56160 tttgtggggt caggattgcg cgtgaaggat acatgtttag caaggcctgg ttgctgaaaa 56220 agcttaaaag gaaacttcag ggactatcta ggaagatctt ctgtgatctg ttctctgatt 56280 ttgtgtgctc ttttgtggtt agccattgct cttggtaccg tgtgggactt agcaccctgt 56340 gcctcaaggt aagaacacac ttccagccca gcttcagttt aatgttcact atgagagtct 56400 ccagtaacaa cccacactct gcgtgggatt cactgccttt cccatgtcct ggtgttggac 56460 atacatactg gacagagtta ctgccttttc ccctagtaat taggggaaaa ggaccacatt 56520 ttcccctagt aataggggaa aaggtgtcca gtatcagagc taggtagagc tgaatttgga 56580 tatgaacttg agctgtaccc catggtgtct tttcttgcag tcctagcctc cagcgccttt 56640 agaatttgca ttctgtttgg tgggatgagg acggtggcag tggagacagg gtgagaggag 56700 catggatggg tcctaagcct tcctgtcttc agcagcatct cgtgctctgc ggctctgctg 56760 tgtgcctcag gggctgccca ttttcaggtt gcatttatta gcttcctgga tgctctggct 56820 tccagtaggg tttagcctgt gggaggcact ggatggagat gggagggagg gagagaggac 56880 aagagaagtc atgttatttc tcctttgcct tcccagcctg ggaggtttct ccagtagcag 56940 ctgcctctct tcttggattc cagaccccac tagacaggtg tgctgtggct ccagcttctg 57000 tctggtgttg ctggcccctg gttcacctga ctccagctcc tcctcctcca tgcagctggg 57060 tcctgctgct gcctccctct gctctgcctt gctgtcccct gtcaggcctc tcagctcctc 57120 catcccctgg gttaccaact cgctatactg aaatccttct gttttagaaa ctcatatgtg 57180 attttcattc ttcttggttg gacactgact gatattgagg gatttgtctt agaagtaaag 57240 ctgtgtgagc attttctctt ggtaagttct cattttccct taatcattag aagacacggc 57300 acagtaaacg cgagctcatg agcagaaggc tacatagttg tatacatgtg tgtgcttttt 57360 ttcacaccag agtttgatga agcaaaatac ccaaaggtct tttaaaagta aagaggtttt 57420 aagagtaaag aaatttaaga aaaaaaacaa aaagaagtaa agatggttag gtctcctgtt 57480 tgctctcctt ttgcaatcag tctgtctcgc tctgtgagct gactatgctg cagacttttc 57540 ttttacctcc agcctttcgc ttgtagggtt tgaggctagg ggcggggaga gagagttcag 57600 cccagcaggc agcaaaccct atgtgcaaac acgatgtgtg aacattgtgt gcttggggga 57660 actgggatta tttagctgag aagacacgaa atctcctccc cttatttggg ctttgggatc 57720 tgagttcatt ggaagctgaa atgtaagaga aagaagaaag ggggaaggag tgggacaaag 57780 gagaggggag tgggagatca gactgggcac attctccctc acagagggaa gcgatttctt 57840 tgttaggaaa gcagttctgt tttgagaccc ggatgccttg tttatgctca ggtgtgaagc 57900 tggcttagga attgagttta gcttgcctct gtgcttttat gaatgtgttg gctgctcagc 57960 aaatttagta cagaaacatt ttatgtaagc agaagagaaa attatatttt aaaagttgtt 58020 ttaacagaag gtcagagtat gggattgaga attaaaaaaa aaaaaaaagg aaattctgtg 58080 ttctaggctt taagacagag agtcacacac actaatttag accagctggg gtgatctcac 58140 agggactcca tgggccagag ctgccgttcc tccatggaga gcacatttcc cctagaaatg 58200 tgtactcagg tgcagctgaa gggtctgagg tcatggctgc atccctggcc agggtcctcc 58260 caggctgcag cctctgcttc ctctgttgtc cattggtcta gagccatcct tcgagaccag 58320 agccagacca tgagcgagcc aaatgtgcat gaggacagca tgaattatcc ttggagacca 58380 gggggccctg ttcatccaga cattgtcttt ctttttaaag aagctaaatg cctctttttc 58440 cctctttctt cttgcatgac ctctgggagc ttgggcagta aatttctctg ggacaggttg 58500 tgaggaacct cttcaaagaa gcagagatga gacaaactgt ttatcagttc actctctacc 58560 cctgctgccc tcccaatgct caggtgggcc ctagattcat ccagaagcca gggtgttgtg 58620 cttcatgaaa gggccaatac ccctaatgtg ggacctatac aataaaaggc aagggcagaa 58680 agagagaaga aataaaagga aaaggggtgt cttgagggga gtacatgata gactcctgtg 58740 cctggaaggg actaggaaac ttatactgac tggttcactg catttgctca aagagtattc 58800 atcttcttga gtttgtcagg tgactgtaag agctgggttc aagttctttg gttcactatt 58860 atatgcctag ctgagcacaa tgcctgggac ttagagggaa ggtctgggac ttcaccagga 58920 ttcccaaaat agaacaaagc atttgttatt tgcaaaaggt tcacaaagcc tgaaaaaata 58980 tgtgttgtct ctggtggaaa agtaagggaa tatagcttaa gtacctacta cgctctgact 59040 ctttggattt cacctgcagg gcttttagag gtggataatc agggccatct ttttcggggg 59100 tggggggcga aaacaaccac tgaagaggtg aagaatcttg tagttctaaa aggatcagag 59160 agaggcttaa aacaactttt gcaaactgaa atatgccagc cagcttaaat tagcaaagct 59220 ggaactgtgg cagaatgaat agcccgtgtc tgagtgagag ggaaggaaag ggtctactgt 59280 gtgataggca atggttccaa agtaggagta ggggcctagt gtggtcatgc cttctgatat 59340 gtcaagaaaa ggcaaaaagt tgatatttat ttgaaatatt ctgattttat aggttggtga 59400 tcaattaaaa aactaacaaa tacagttaac aaacatgttt taatgcttgc agacaggatc 59460 cttcctgccg atgtttggcc tttgtcttta atggaatttg ggctgcccca taacagccca 59520 ccctaagcaa aacttctttt ctgcctttct tttatattgt tttttatgga atgtagaggg 59580 atttttctgg aatttttgga acggggaaat tagtgacaat ggtggtgctg agattcctgt 59640 ttatttcttg gcttttcccc aattccctga gggaactcat ttcttttgga tcttccataa 59700 catcggtcac atagttgggc acagagaggg cccacacttg gtacatgttg atgaaataaa 59760 tgtgtcttcc tctaagtcta gctgaatgga gaactgaaat attagggtgg gtgaaagtta 59820 cctaaattgt ttgctgccaa attttgctgt gttctttgtc tccagttctg tgaggtgtgt 59880 gttagatacc tattgctgta taacaaatca cccccaaaac atatctgttt aaagtaacaa 59940 acatttatta tagcacacat ctgtaggtca ggaattcaag tgcctcttag ctggtactct 60000 catggggctg taaaggaaat atcagttggt gctgcagtct catctgaagg atccactcca 60060 aattcattca tgtggttatt ggcaggattc ggttcctcac cctatattgg actgagggcc 60120 tcagttcttc actgattgtt tgaccggagc tctccttcca ttctttgcca tagggcctct 60180 ccatagggca gccccgaaca tgggatctgg tttccattag agcaaacaag caaaggaaag 60240 cagtgcaaga cagaagctgc aatgttttgg taacctaatc tcaggagtga ccctcctgtc 60300 actgcttcta tgctgtattc tagtcattaa aggagaccat ctcacactca aggggagaga 60360 ctacacaagc catagtgctg ccatggcaac acaaccatta ggatgatgcc ttgagccttc 60420 cttcttcata tttcttagac ttcctttctg acctagagga gccagaagga cttgggactt 60480 gtcataccgt ccaatcccaa gaaatgacag gaatgaagga atttttaaaa attcaactca 60540 tttcaacaca cacacaaaaa atgagagaag tgagtcaatt tgagaactga aattctggta 60600 gacttttggg gagacactag aagggccatg ttcatgagta ggaaccatag attctgagtc 60660 aattgggcat gaaagttttt ctcctggtgt cccgatcttg gtcgtatagt gaccaagcat 60720 ccaagaaggg gataacacaa tgttcttaca gtgttttctc tgttgtatta ataactcagg 60780 catcagccag tggaatgggc aaagctaagt gaaggtttga atgccagaca gattctccat 60840 tggctaaacc caatagacat gaataaggaa taaggccagg aatcagcatc cagatatatt 60900 aatttatgaa tctgaggtta ttccaaaaag caagagaaca ggagcaccat tggctgagac 60960 ggacaccaat accaagctct agagagtaat ttcaggcaga aaggaaacct taattaccag 61020 aggttcaagg gataggcaca cagtaagtcc aaataggcag aaagaaggca tcagggataa 61080 tctggcagag actgcattca aggtcaaggg cagggcatcc cagctgctgt tgagactggg 61140 ctccaaggaa gtctccctgg agagactgaa aaacaatcct gggccttaat cactgaggac 61200 tgaaacacaa cataggagaa aactagggct taagagaggc ttggtcaaga aataggcaag 61260 aacctgatta ttggggaaca agagatccac agtcaggctg gaccagtagc aagacagcaa 61320 gagtagacaa aaagttgacc actgccagaa accaagattg gtctctgagt ctggcatggg 61380 gctgaaacta cttgttgaga tcaggctgtc tcacttgcca ggggtagagt catgctggaa 61440 gtggagccag gacagacatt gaaccctggc taccctgtga tcaattgcac tccataccct 61500 ttgatacctc atgggaaaat cagacaagtg ctgttctgaa aggcaattag gtttcatgat 61560 ttcctccccc atccggacat cagcatgaaa ttgggggctt ggcttccaag cccatgttct 61620 tcctttttgt gaagggcagg gtgagacaaa ggacaccaca ggccagagca accctctgct 61680 tccatacagg ccctagaaga gaagtgagga cgcgggtgac ccacacggcc ttctgtgcct 61740 cttcaacagc tactctccca gcctcccatt tctgccaagc cacattctcc acaggactca 61800 aacatttagc tttactttag acttttccag gaatcttccc aaatctcctt tcctcatccc 61860 ccctcacctc ttcctcacca cccacagccc cctcctccac ccccatgtac aacatccggc 61920 ttttactcat gcttgtttct aattatgcat actaatttat tttctttcct tttttcctga 61980 cctgcctata ttttcctact cattctttgg cctccactac cgaaaaatgg aatactcctc 62040 ctgtacaggg tcagggtttt tccttcccca gtgcctaaag ctggattcag tccacagtga 62100 cttctctaat aacagagtgt aagggactcc ttggttgaaa agaaggaaaa accccaactt 62160 gcctttcagg gtctcttcaa tgagcttgat ttgtgttaaa tttaggggct caggaatttc 62220 tgccgatttg cagcacttac tactcctacc cttcccaaca tttgtgcttt atcgaaacaa 62280 ctaaattagg agcagcttga gggtaggggt cagagcacag acattttctg tattgcctgt 62340 agaaactagc acagtacagg caccccctaa gtgcaaaaga agtccttgct gacccagatg 62400 gaattttcct gaagtgagtg ctttgtgtct atctttagaa ctagactttc ctgataaaat 62460 agtcaggaga tttggctgaa ttttccagta ttcaactggc tatgttgggg tcatgtagat 62520 acaaccttta agaacataat gacctttaaa atatctattc ctgaagtcag gtttggtccc 62580 tagtctgtgg gcagatgact gttttcatgg tatgctttgt tcgtgtcctt cctgggtggg 62640 ggaggatttg gggggacagt ttgactctag ttatctacaa agttgagtta tgagaccagc 62700 ccttttcaac tttacctctt gcaaattgat cctgtaataa attgacatga cgaaaacacc 62760 aaagcaacca gagaaatctc acaaaggcaa gaacaccatc acacaagtcc tcaaaatctt 62820 tcccaagatc cactaggggt taatgccact gatctgatac tggggcacag cctaggaggt 62880 tttgctgtct ctgaacgcac atgtctccag cttacagctc acaggccagc tttgtttttg 62940 aacagattgt gttgggggaa gggaggcttc tgagacagag ctgagagtcc ccagcaatgc 63000 catccctggc ttctggccca tctgaatgcc ttactctttc atgtaagcaa gacatgaggt 63060 cctgctgttt gagttggctt tgccctgctc cgtgatttca gttccttgtc tctccagcgt 63120 gtgggctcat ttccgtcctc tgagcactat tgtttttctg acttgaacag tcatccagaa 63180 aacctcagta ataaggcttt tgtatcatta tttactttgc taattatata tgtctttccc 63240 atccccagtg cttgaagaca tcaaattgca gttgaagtaa cggcagaggg aaaagcaagg 63300 gcaacaacaa caaaccactt cactcctctg ggtggaaaca tgcaattgta ccaagaggga 63360 taaggaaaaa actgctcatg tttgcagaaa gaagttggaa taagggcgtg aaagcaggcg 63420 ggctacttta gcatctgatg ccagggatat gagagagtag cccagtgtgt tcattcaaaa 63480 agtaaggctc tgaggccagg accaggaaag atcctggagt ccccagtcac aatggcatga 63540 agcaggatga tgcagagagg ctaagggggt gattcagtgg gttctttacc tataaaaatg 63600 atggaaaccc caacatcagc tgggcaagtg gccctgttca gagctcctgg actcgccatg 63660 actaaaacac tctgttttat ttcgtagttg atatctattg ttcttgcctc ccagcaagca 63720 atggaacagc acctttactt tcctttgaga aactattcct ttcccattct cagggcttgt 63780 gaggatcaag tgaggtcaca taatccagat ctggccaatc agcccatctc atgctactgg 63840 ctacactaat tggtttaggg atagtaaagt actcaaattt gtttactgaa catttagccc 63900 tggaattttg gtgatgggag gtgtagaggg taaactcttg atgatatcat ttgtgtacct 63960 gggtccagcc atgcctgaac ttttcaatta cttgacccag taaatttcct tattcattta 64020 aatgttagag ttgagttttg tctcttataa ctgaaagagt gacatgtgtt tatattaagt 64080 gcaggtcact aatatagtct attggtttcc ccaggcttgt tctccttttc tcaaatagga 64140 ctgatcagat agtaagtgct ccatacctgt aggatacata aaagagcaaa tgaacaagga 64200 gcaggagata tggtggctga cggttggact ataatttttt cttgattttt ctgactttat 64260 tttggctgtg atctaggaag tgaaatccag gtccttctaa accccaattt aactgtggct 64320 cctgagggag attttcagat ctcaaatgat ctgtaagttt aagggaggat gattggtccc 64380 tgtacactct ctgtgagagt tcctttggaa tactggtttc agaatgtaca gccacacagg 64440 taactggatt agggacggcc agtggttttt tatgaatgct attgaagaca ctgaatggaa 64500 gcaattctca ccagaactct ttttgctgtc atctttcagg ggctaagttg acactagaac 64560 caatcaatga tccctgaact gggagaaatg ggtggccttg gctgtgattt ttggttgtgc 64620 tgcacatttc aagatgacaa tattgtttta aattaacctg ttagagtgca cctttcctaa 64680 agaactttac cttgatgtct gagtaagggc agtgcaggag gtcccccaac ttaggggact 64740 gatcatgttc caaaggtcat ttctcagtct ggatgttttc atgagataat gaattccaag 64800 atattgtaag gttcaatatt ataaatggtt cttagtttac taagataatg cattgcctct 64860 ttgtgaagcc ttctctggtt accctaatca aaagtaactt ttctttcctc ttatatgtca 64920 cacagtatta aatgagttgt tttttaaaaa catcttaaaa tcttatactt aagcaattat 64980 gtagattatc ttggagtgtt gagcttattg ctctcattag atgttagtaa atggaaactg 65040 agtccacaat tttcacactg ttctagttct ttttcattct gcttcatttt ctgttgtctc 65100 ctgccaggtg tctgtgctaa ctcatcttgc ctgaggaccc ctaccccatg tctcactggt 65160 ctgcttggct tacttctgaa gcccagcacc accttccctc agtggctctt aacaataaac 65220 cctgacacag aagttctggc tggtccacct attcctttga gtcaggtcac aggtttccct 65280 ccagctaact gatggatgga ctgtccttgg ctcaggggtc cactcttgtt caattagata 65340 cattttgggg gcagggtcag aattcataaa atgcaggcat ttgaagaaca gggaatcaag 65400 gtagagagtt cctagaagac agagcaggga ggtaaaatga aatattctag taaagtatta 65460 atatttgtgg caggatatgg tcttttttct ttctttcttt tcttttgaga tggagtctta 65520 ctctgtcacc caggctggaa tgccctggca taatcttggc tcactgcagc ctccgcctcc 65580 cgggttcaag cgattctcat gcctcagcct ccctagtagc tggtattaca gatgtccgcc 65640 actacaccct gctaattttt gtatttttag tagagacggg gtttcaccat ataggccagg 65700 ctggtctcga actcctgacc tcaagtgatc ccccgccttg gatatggtct taactagaaa 65760 tgaagagatc tgagttcaaa ttcagcattt gtcacatgta ccctctctgg tcccaaggaa 65820 atcaagtaat atctccaatc ttcagatctt tcacatgaag aataaagagt attgatcacc 65880 atatctctac acctccttcc agctctaaga cctccaggac tcacctagaa ccaaattcat 65940 ccccacacag tggcggcagg gtcgtgttgt catgatgatg gcctctttcg gtgaagagag 66000 gttgtcagac acctggagca atgccagaga cattatcctt ccctaggaga gctactgata 66060 agaaaccact ggcagctcct cattcacttc tccatcattc actcttttct cctttctttt 66120 tccttagagg cataaacaag gtgtagatca tcctgttatc cataatgaag gaagatttta 66180 ggatattcca gcttagatcc aggtgtcccc agcttctata ctcactctga agaagtgtac 66240 tttatctact ctttttacac catttatccc attttggcca tttctgaaag gaagatccta 66300 gaagccaggc ctcttggaag aagttggagc tacagcattg ataggaaaac ctgacaccta 66360 gaaaggcaag tcagttcttc ccatgcagtg gctttgggga ctgtaattta acaaagctct 66420 tttttacttg tgtaaagtga tctccattcc acttttttct tgcactgatt ctaattaagt 66480 ggaagcaatt gttatcatca tttaggatta tagttaaaat acccctcaaa ttgtttccat 66540 ttggaatggg accttgtccc attctgctct tgctgaagga agtcttcatg gaatcacagg 66600 actcaacaaa catttctcat taaaaattct ctcctttagg caacagtggc atagaaatcc 66660 ttatgttcta ctgtctgacc cgtatgagaa cagcgcactt ctcaatttat aaaagaggca 66720 ttttccctcc tcctgggaaa aatatttctc ttggtcactt gagtctagca tctaagtcat 66780 ataatgctat tatagccttg ttttgctttt gatttaggtc atatcttctt tttctgatct 66840 ttcttaaagt gaagggacca tttgctatgc tcacaaaaat tctcaaggct ggaactacag 66900 catgctctgg tttctaagcc atacacatcc aggtagaagg gtcaatttaa ttgccaatga 66960 tctcagcctt ttctaacact gttccttaag tttctttggc actgcatggc aagcaactga 67020 gtcatgcatg aaaatttctc ttctagacaa cccataccta cagagggagg atttggttta 67080 ctgcagatgc tgagtgcttc tgatggcaca cattccttct tattaatatc cccctggccc 67140 ataatggttt gtgtggacaa cagctacttc cttcaagggt cctttgcttg gtaaatatat 67200 gcctccagga gctttctggg tagaagcagt cacaaatcac aggggtatct atgaatggca 67260 cggcccatgg aagggctcac actgtcctga tttttctacc ataagagcta aaataaggga 67320 ataggcttcc aggaaataag tcagatgggt tgtctgacta agcacagggg cagggattgg 67380 aggtgagatg acagagaaca gtcagcattg tctccgcttc cgctccaccc tgcagttctg 67440 agctgaacag ataatttatc tgtggcacaa caaagtatat gacttggaag aatgttaaag 67500 atcaagtcca ccttctcctt gtattatatg gctctgagag ccagagaggg gaggtgacct 67560 tcccagaatg tgaatgtggt agagcctagc ttacaattca tgtccaactt aggtgtgaag 67620 ttctatgaga ctatgctgcc ctctgcctca caatgctttc tcccatggga gaggaggctc 67680 agaggtacaa agcagctgca gaaagactct ctcaagctat tgactcttgg atgacaacaa 67740 ttaatgttca acttggcttt acccccaaca tgcactgcac agatgcctgc aggtctacaa 67800 tgccgagacc aagtttgggg ggcatttccg cagctctgtc tattgtcctc ctttcctctt 67860 ctgtggtcat tcttcccaag ggataggcct agtccagggt ggagaaaaac aattcttggt 67920 ggtaggggca ttggaattgt atgggcaggg ttctaggcca actttggcct ttcacaattc 67980 tgctaagcat tgaacagaat tttcacccta atttcacctt cccttccatc ccttccctaa 68040 ttttgctagt gtgtatggag ttgatttgat gagacctcgt cttttttttt ttctcccttg 68100 taacgtgggc cctatcttca agcctatctt catagccttt cttttccaga ccttgccaaa 68160 aagcagtaga agagaggtta caaaatataa gaggaaacct taaaacaaac agggtagaac 68220 tggagggaat cttaaataat gcctaaccca actccatatt ccactgatag gaaactgaga 68280 tcctgagaca ccatccaaat tctgatgtaa tcagcagaac ttaatatgcc actttgagca 68340 cagaaccaag tactttagag gtaagagagg ctatttgttt ccagcacagg ctgaaaccca 68400 catgagaaag ttggacttta agtgaccata gtcacattct gataaattct aaaatgtctc 68460 tctcattttc tctgacatca tattgtcatt tttcatacca caaatgtgtt acagtgaaaa 68520 ccaggtatag gtcaatagat agtaccaaga aaaagaaaag ttatcattct ttaatgctct 68580 ttagtttgaa aactttattt atttctttat tttgatggag gagtagagtg ggtcaagcta 68640 agagttgcct tataaacctg ttgttctcag caaatgagtc agctgagata aaaacattag 68700 tttccttggc gtgtcagcat ctctcccaaa ggagggtatt agttcatggg ttggcattgc 68760 tatcacaaag aaggctctgg cagcacctga ttggcttggc caagcttttc ccagttggcg 68820 tctgggcatc ttcctagcag tgggtcactc acccagcagt gatttggcct cctgttgaca 68880 taaatatgcc taattcaaag cagaaagtca atttgttatt ttgcctaaag aaatgtaact 68940 accaagcagg ctagatttct gtcttggcat aaccaggaaa tctttaccaa taatttatga 69000 tgtggtcacc cttgttgtag gcattatgga agatggaaag atatataagg aatggcgtct 69060 tgcaaaaaga actggacttt tttttttttt tttttttttg tagcaatgtg gagagtaaaa 69120 gcccaggggt caaatggtaa ttatagaagg agattcattt aaagaatgtc ataaggaaat 69180 agaaaataaa ggaaacattg caggaaacca tagggggcta gctgattcat ggaaaatgtg 69240 aggttatggc tgggtctaag aataagtaaa tcattggtga ctatggttgt agaggttagg 69300 acagagaaag ctggagcaac aagcaatcat ctgccagata agaccccggg ctgggtgaat 69360 gcaaggaggg agcggacaat tttgtcttcc aactctgtgg agctggagcc ttatcttagg 69420 agtccagtgg gcctggaggc ctgatcacca accagtgtaa tgttagaata agacttccct 69480 aagcaaatca atgtgatgat tgatacaaac agccatcact ggggcctcct ctatttccaa 69540 tctcttcctc agtttcccag ttctttcaga acctcactgg gaagttcagg gatatatgcc 69600 tgcaggctgg cctggcgcag atggatgatg aagggtcctg ccttgagtgt agggtagagt 69660 gattctgagt gctttccaac agactgtaaa ttaaagacac tccaaaaagc ccctggtggg 69720 gatagatggg gagaaggggt atcactaagt cttcatcttt tcttctaggg ccagggtcag 69780 tggttcaaat aaacatggtg ccccacagag atggcctgtg gccaagtagc tctcagtggg 69840 ttgactcaaa gtcacctgga caggcctggc ggaaacgcag gatggcccag ccctttccta 69900 ataggttttc cagagttgat ccatcattct gcccagaaaa ggggagaata aaaaatagat 69960 cacgagcccc tatgactgtg acttgtgctt ccttggaaat gcaaacaggt gaaggagaaa 70020 atgacacagc tagggtggta gggggcactg gaagtcaaca catttctggg ttcaaatgag 70080 aagggtgagg tgctggcatg gaggaaactg gcactggccg tctccaggca ggactttctg 70140 ggcactgggc aaggccatgg ctttgggagc tgccccaagc tgctggtcgt gccagtgctt 70200 cattcaccct gtgaaatgta ttaattagtg agtggttttg gctcagagag agttgctgtg 70260 gcttcagatg gatatagcag aaaaaaggca aatccatcta caggcgcctc tgagaaatct 70320 cagctcttgt gagcctgaga agagcttcca tagagagaag gcgagacccc agcaaagttg 70380 gacggagaaa attgagacac ccacaccaat tagtatgagt ctatcaatcc agtgccaccg 70440 aaacacaagt ctaagcctaa cagaatctgt gctgcgaata agtaagattg ttggaaacag 70500 aacaaaaaaa aactttgcaa atggtgcttc tttaagcttc tgcagttctc ttctctcact 70560 cccttttcaa aaatggctgt aaaaaaaatt tttggtctgg tttagccaga gcgcgtcaga 70620 gctggtagat gccttcaaaa ctgtgatctc cctttaattg tcagagggta ggctgaggtc 70680 cagggaggta aacagacttt tcctaagctc tgtagctggc tactggcagg attgagggaa 70740 ggtggaacaa gcctcttcat tcccaattca ggtttctttc ttccatccca catctcatgc 70800 aataaacatt tccaaatcta cctgcccagc ggggctaaga gcagagtggt ctccagaata 70860 agtggaatag catctcaggg actgctggtc tgaacacgta ctccgaacat cacagctgct 70920 gccaagcggg cagacgcctt agccccagcc cctctccctg ggctttcctg ggtcttgtcg 70980 acacttctca catcactctg ccttaaattt ttctccccct agaaagagat aacttgcctt 71040 tcattcatgc ctacctaact cagttcaatt caagtacata aatcctgctg acaaccctgg 71100 cagaagcttt atgagtaggg agtaaagatt gtgagaaagg cagggaatta atttataagg 71160 aaggaacaat gggagaggag agaaacaaag agaaggatgc aaagcaatta atgttaattg 71220 atgcttaata tatgccaggc ccagtcatcc tagttatttc atttaatctt taaaataatc 71280 cttgtgttgt catccatgcg ttttcagttg cagttccatg atttaagaaa agcacacagc 71340 cagaaagtgg cagagaaaaa atcatatcct gagtgacagc tttaccggcc cagtgctttc 71400 cattctaaca aatagtagaa agagggaaag agagaagaat cccttggtga taggaataag 71460 gtagagagag gctgtgaaag agagaaacag ggctttgggg gatcctgggt tctgatgctg 71520 acctctgtgt catttctgta tccattgtat gaatgtttat ggaaagtcag ctacgaagca 71580 aattgttcta ggcagggggg tttcagcaga gcttgggaga gcagatggtg ggaggagtgc 71640 atccatagga tagcctgggc tgtgggaata agagaacagc aagtcagggt gagtgctgca 71700 aagacaatat aagagagcga caggcctcag agaacctggg aaaaggaatg aatggggtca 71760 ccttaggaag ttcattagga ggggcctctc tgaagaggtg acctttgagt cgagacctga 71820 ggcactggag ttacaggaaa tgtgatgttg cacgtggaga atttcttgga aatggagcag 71880 caatgtagtc tgaccctatt gttgggccca ttaacttggg caatgtctca ccaaggtgga 71940 ggatggtgac aggtcctcct gggatatggg ccatggcagg acgaggggac aatgtctgta 72000 aaggatttaa aaagagtcat caattctaac gatgtcaatg ataaaatact tctccatatg 72060 cagggggcca tttccatgac ccagctcata aggagtggag agagtgctat cttcctctag 72120 aggcagctcc aggaagcagg agctggtaac ctgggggctg ctctgaaacc ttcaaaaggg 72180 caaatcatgt aggagtctct ggccactttc ttttctgtaa gagaagattc actcaaggtc 72240 aggggaccct aaggacccca gggaatcacc caaaaactcc agccagcccc tagaggaaga 72300 caatccacag agctggcccc atcccttcgg cctgtggcta aggcccatct gcccatggtt 72360 ccttcttgaa gtaattgctg taagaatttg tcattcacaa aaggaagtct ctattgtctc 72420 ttttcggatg tcatgtaacc aatgcgtgtt aaaggtcagt tgcatcagtt ctcttaaatg 72480 gcaattaagc tattgtctga gcaaaccaga ggcatccgga gtgcaagctt cgctcaaacc 72540 tagggacctg ggaaaggctg ggaacagagg agcaagtagg acaccacagg ggagggccgt 72600 ggcttcagga aacgtgggga acaccctgaa ctgtaaaagc agatgcgtca gcagacaaag 72660 ggggtcattt cactaaagcc tcagtgaagc agagaaattc cagactttgc ccatcaccta 72720 ctggcaggct ctccctccct ctgtcccctc cccaccctct cctcaccctt gtctttctct 72780 gcttcattat ctcacgctct ctctttctct cccgcagttt ctctgtctct cagtctcgat 72840 ttctcacatc ctgtttctct ttcttcttta ctctttctcc ctctccttca cctctcctgg 72900 cttcactcca ctccccccac ccactctgtt ccctctcaca ttctcatttg gggatggggg 72960 gcggctgaca aaccggattg ggggggtctg acaaactgga tttaaatttc agctccgcag 73020 cgttctcagc tcttggtctt ggaaatgttc cctgagcttc ggtttttctc atctgaaaat 73080 gaaaaaaata atacctagct ccaagtattg agcttgttgt gaggaatcaa acagataacg 73140 tttctaaaat tccaaacaca gtgcctggtc cacggcagat gcttgactgg tgacagcttc 73200 ctttcccagt gaggcccagg gaagtaggca cagtgcttgg caccctgcaa gcatgcgaca 73260 cagcttcaca aaatacccac agggagccag gagcaccgct tgaattttat ggatgacaaa 73320 attgtggttc aaggaaggta aaagtaccct ggtaggacac gtaattttta aaaagtctat 73380 agctattgat attactatat attaattccc attctgtccc tccggtttct cccctgaaca 73440 ctaatttcca aatccccaac actctatggt ttaaatgata aacgattcac ccaaatactg 73500 tataattttt tttttccttt tgggtcaggg ccatgctctg tcacccaggc tagagtgcag 73560 tggtacaatc gcagctaact gcagcctcaa cctcccaggc ttaagtgatc ctcccacttc 73620 acagcctccc aagtagttgg gactacaggc atgcacaacc acaactagct aatttttaaa 73680 atttttggca aagacagatc tcactacgtt gccctggctg gtctcgaact catggactca 73740 aatgatcctt tctcctcagc ctcccaaagt gcttggatta cagatgtgag ccaccgcaca 73800 tggccatgta caattcttga agaagctgaa actcatcttt ctttctcggt ataagaaaac 73860 tcaggatatg tttggacatc ccctcccatc tgccctccca gcctcctctt ctccaggctg 73920 aaccagatcc tgctgcatct ttctcaaaga ctctcttaca tcctcattat ggtttctgcc 73980 ccagtcctcc atgcttctct gaagtttaga gtcaaaatgc ccttttttgc tttaggggtg 74040 agaccttctc tagcaccgtg tgtctacaac acagagaggg caaacagaga tagtgcttgg 74100 tattttattt ttaaaatttt taatcttgat tatattttgc aatgtttata ccattgcaca 74160 acacacggaa gcattagtca caatttatat agctgatttc atggagctga attctatggt 74220 gtttatagcc gttgagtgtc ttctcccaga aattggaaag atgccccatt tgctgtaaca 74280 cacacgacct ccaccccatt cttttccttt gtaacccaaa ccacaatgtg taattgtgtg 74340 tttattttgt gtttaatgtt tatctcttcg cccaggctct aaggctctat gagggcaggg 74400 atcacatctg tttagttcac ccagatttca ttatatatcc agcattctac actctgtaac 74460 tgcttagtct caactctgac cacacattaa gtcatcaagg gagttaacag aaaaaaaaaa 74520 aaaacaataa acaagcaaaa tgtttactaa tgttccacaa gctcttttga atcaactggt 74580 ccctgtggca cctggggatc cgtagtcatg aaaatcctgc cagggattct tgatccggga 74640 tctggtgatc ctcggcagga caactcacca ttctgttcgg ttgcccgctt gcctcctccc 74700 gctggctcca gcttctgtgc ctacaatgaa ggctgtgccc attccctcac gtgcccgccg 74760 tggcctgaca ccttcctggg cccaccctaa cacattcctc cgttgctttt aacgactgtt 74820 tacagctcgc tacctctagg acgtggcttc tgatgaaaac tgtccagacg ctctgcctcc 74880 ggtgtaattc agagcccagc tctcctcctt aaaattcttt tacgctattt tccacaagca 74940 tgtgcttctg ttggcagtgc cataagtgtg attgatcttt accataagtt ccttgaactt 75000 tgctgtgacc tggatgctaa ggtggcggga gctgcctcca tccccacaat ttgactggta 75060 caacccgaaa gtaggatgat agtctgttct ggtcaaacat taacgtgggg cagggacaat 75120 ggagagaggg tttggtcatc tggcatgctg cagactgcca gaggagctgg aaaggctgag 75180 tatgggaaag gggagggatt tcatggcctc ttcgggcttt gagtatttga agaaactgcc 75240 tatggaagac cagacctgtg ccctgcctcc caagaaacac acagagctta gacggtggaa 75300 gctatctggg gcaaattcag ctccctgtga ggaaggtctt ctagttgtta ggggtgtctt 75360 ggtaggtcag ggagggtttt ccagcatcag tcattttcat accaatctct cggtttttgc 75420 catattcctg taccacccgt gcttttattt acctaatctt ttttatttac cgaattttta 75480 acctaatatt tcctttaaaa caactttaaa ttgacacact ttgtttcatt cctgttttta 75540 aaaagtacct atggcaaaag atatgaatag acacttctca aaagaagaca tgcaagccgc 75600 caacaaacat atggaaaaat gttcatcatc actaattatc agaaaaatgc aaaccaaaat 75660 cacagtgaga tatcatctca caccagttag aatggccatt attaaaaagt caaaaccaac 75720 agatgttggt gaggctgcag agaaaagaga acacttatat attcttgaga atttaaatta 75780 gttcagccac tgtggaaaga agtttggaga tttctcaaag aacttaaaca gaactaccat 75840 ttgacccagc aatcccgtga ctgggtatgt acctaaaaga aaacaaattg ttcaaccaaa 75900 aagacatatg cactcacatg ttcatcatag cactattcac aatagcacgg ttcatggaat 75960 caacgtaggt gcccaccaac aatagattgg ataaagaaaa tgtggtacat atataccatg 76020 gaatactatg cagccatgaa aaagaaggaa atcacgtcct gtacagcaac atggatgcag 76080 agggaggcca ttatccaaag caaattaaca caggaacaga aaaccacata ccacatgttc 76140 tcacttataa gtgggaacta aacatcaggt actcgtggac ataaagatgg caacaatagg 76200 ccaggcacgg tgctgatgcc tgtaatccca gcacttgggg aggctgaggc gggtggatca 76260 tatgaggtca ggagtttgac accagcctag ccaacatggt gaaagcccat ctctactaaa 76320 aatataaaaa ttagctgggt gtggtggcac acacctgaaa tcccagctac tcaggaggct 76380 gaggtgggag aatttcttga acctgggagg cagagattgc agtaagccaa gaaggtgcca 76440 ctgcattcca gcctgggcaa cagagtgaga ctctgtctcc aaaaaaaaaa aaaaaaaaaa 76500 aaaaagatag caacaataga cactggtaac atacccaggt aacaacatac ccaatatatg 76560 catgatatac ccacacaaca tacccaggta acaaacctgc atttgtactg cctggtgggt 76620 gtggtttgtg aaccggtatg tgtggtctgt ggtatgtatg gatgtgtgta gtttgtgaac 76680 tggtgtgtgt ggcatatggt gtgtatgtgg gtaactggca taactggggt atggtaggta 76740 tgggtatgtg tggtatgtga actggtaagt gatatgtatg agtgcgtatg gtgtgtgttg 76800 cgggtggtgt gtgaactggt gtgtggtgtg tggtatgcat cggtgcatgt gatgtgtgaa 76860 ctggtgtgtg tggtatggta tgcatgggtg tgtgtagtgt gtgaactgat atgtgtggtt 76920 tgtgaactgg tatgaactgg tgtggtgtgt gatgtgtggt atgtatgggt gtgtatggtt 76980 tgtaaactgg tgcatgtggt gtgaactggt gtgtggtatg catggagatg tgtggtttgt 77040 gaactggtgt gaattggtgt gtggtgtgtg gtatatatgg atgtgtggta tgtgaacttg 77100 tatgtgtggt gtggtttgga tgtggtgcat gtggtatgtg cagtatgtgg tgagagtgtg 77160 gcgtgtggtg tatgtggtgc atgtggtgtg tttggtatgt ggtatgcgta tggtgtgtgt 77220 ggtgtatggg gcatatgtgg tttgtgtgtg gtgtggtgtt tgtagagtgt ggtgcgcatg 77280 gtgtgtgtgg tatgtggtgt gtgtgtggca tgtggtgtat ggggtgtatg tggtttgtgt 77340 ggggtgtgtg ggatacgtgg ggtatatgtg gtggggtgtg tggtgtctgt gatgtgtggt 77400 atgtatgggg gtatgtggtg tgtgaattgg tgtgtgtggt ttgtaaactg gtgcatgtgg 77460 tgtgaattgg tatgtggtgt gcatggaagt gtgtggtttt tgaactggtg tgaactgctg 77520 tgtggtgtgt ggtatatatg gatgtgtggt atgtgaactt gtatgtgtgg tgtggtttgg 77580 atgtggtata tgtggtgtgt gcagtatatg gtgtgtttgt ggcgtgtggt gtatgtggtg 77640 catgtgtgcg gtatgtagtg tgtgtgtggc gtgtggtgtg tgtggtatag gggtatatgt 77700 ggtttgtgtg gggtgtatgg ggtgcgtgag gtgtgtgtgg tgtgatatgt ggtgtctgtg 77760 gtgtgtggta tgtatggggg tatgtggtgt gtgaattggt gtgtgcacca tggtatgtat 77820 gggtatgtgt ggtctgtgaa ctggtagggg tgctgtggtg gggagtggtg tgtgtggtgt 77880 gtggcatgta tggatgtgtg tggtgtgtgt cttgggagtg agggtgctta tcatgagcag 77940 gtgctgcaga agccctcagg gaagatgact tcactgggag ctgagatgac ctcactgggc 78000 gccctccttc agcagatgcg aggacaggcc cacaggccta aagtcaatta gaggcagatt 78060 tccaagcaga atctacttct cctgacctct gattcagtgc cttttcctga caattttatc 78120 cctgcgaccc cagccttgag aatgcaaaaa actaccccca acttcagcct gaggtcatga 78180 aaccaaccag gagtgcaggc cgtctagggg aggtgcgagt gcccacctac tgggcagcca 78240 ctctgagggc aaagtccacg ggagacacag cttcagccac caccggggct gcgacctgtc 78300 ctcaggatcc tcctcagccc cctccaggag tcctcagctt tctgctttta gccccaaacc 78360 cagattcact ttcccaggcc attcaccgtc tgaggcagcc cagtccgctt tgtccttcct 78420 ccttcccgaa ggctctcagc ccctgggcag tatcagaatt tcactttgat ctccttttcc 78480 ctgggagcca gaatagctta gtctcttcaa aaggagagtt agaaagtgtg ccgttcatct 78540 aataaaaatt aactcctgag agttatccaa tcccaataca ggtcatttcg ctggaggcta 78600 ccccgactag gaaacacatt ttaggacatc agcagaggta aagatgagag caatttgctc 78660 aggcttttac ttggggttaa ggatcactag gccaccagga ccagggatgc cagacaacct 78720 caggtttctt tccaagcttt ctccaaacta ggcctcactt ttatcatttt cctacccctg 78780 ggctctatga ttttgtggtg ttgcttttgt gttttcaaaa acactgcatt cattcattag 78840 ctctgcactt tccctcatgc aatgcacaca gaactgtaaa gacaaatgat aaagcccttt 78900 cccgcttgga tcttgtgttg ttggccaggt tcattcaaaa ggccattgtt tgatggtgat 78960 taagtgtgtt tgttttgaat attcacctaa acaaaaatga tcaatttaca caattcttgg 79020 aattcatggg tgtcttggga aaacttgaag ccacaaaaaa tgttcaatac ataaatgcca 79080 aggacctcct gctgtcaatt aagaccctca tgatagtctt ttgcttattt gctcgttaat 79140 tcatgtaaaa gtggtttgtg agcaaattaa gcatcagttg gcatgccgga catggacaca 79200 tagatacagt ttgtggtctg gaggggaggt ggaaatgaga gtctcacagg ctgccctcgg 79260 cccagaactt ctgtgtggag gttttgcata aaaatcagaa tttctggatt cttataaaaa 79320 ccctaaagtt ctagccccat tagggccact gttccactca cagccctgag taagcctccc 79380 ccatcagccc aggcatggac cctttgtcct gcctctgttg tcactctccc gactgtctca 79440 gacctaacca gctcctcttc tgtttgtgac ttgcccttat gggagcctga gggctcctac 79500 ctactagatg aagctgatgg ggacattctc ccaaatgaga aagcgatgga aagttgtgac 79560 catcagagga agatcagaga tcaagccttg ttgatgtaaa aggaattaaa gttgagaaac 79620 catttcctgc aaccagaatt gtgaaagcat acaacgtagt accaaaggaa aattaccgaa 79680 gcctccttcc ctgaagaacc ttcaggaagg ggaggccagc cgtctgacgt gatcacagtg 79740 atgtcttgcc ctgaaacaag aagcattctt cccaggtcct ttccgccgga ggattcttat 79800 tctgtgatca atgctgagct atgtggatga gtgtttgcgt ggatttcttt taaaactata 79860 ttgctaaata atcttgcccc ctggccccat gcacgttctt tttttttttt ttttttgcac 79920 ccagataaga aaaagacttg aatgtatttt tttctataaa atgcagtcaa tattgttctg 79980 tgagggggaa agaagtagtg gaggatgaag atggaacagg ggatgaggtg gtgaccagca 80040 tgccctcatg gatagacact gagcagggag aggcagggat atgcatggag taagccctct 80100 ctctctctag gacaaagcaa attatgtctt catgccagtg gactctgcat attcattgaa 80160 aaaaataaga tttaattaat ttagggaagc aatatgggct gaccagacag ccaagttctt 80220 caagatagga cagtaaaaca ttttatgtga gagctggcca atgtctggat ggaagaggga 80280 gggccaggga gactggagag atattgaggg ggtgaggagg tttgaggaat ccacagtggg 80340 gtgagcttca tgaccagtgg aatgaaataa gggctattct ggatggacga ccaatgtcag 80400 tgcaaggccc tcaatctctt gggataacac tggagttgga atacatatga aaaaaaaaat 80460 ccacaagtat aaaagaagta agcagaggcc gggcatggtg actcacacct gtaatcccag 80520 cactttggga ggccaaggcg ggcagattgc ctgaggtcag gagttcgtga ccagtctggc 80580 caacatggtg aaaccccgtc tctactaaaa ttagccaggt atggtggcgt gcacctgtaa 80640 tcccagctac tcaggaggct gaagcaggag aattgcttga cccagggagg tcgaggttgc 80700 agtgagccga gatcgcacca ctgcactcta gcctgggcga cagagtgaga ctccatctca 80760 aaaaaagact ggaatagagt acatttgtca taggccaact gcctccatgc tcttgtctca 80820 cagagatgtt tataacaagc ttgagtagct acaactggat actttggtct atatatgctt 80880 tcctcgtgat tctttttttc ctccttctta gcttaaacaa atgcacacag agggaagtgg 80940 ataaactatt agcagagtaa gcacttgcca agaataccgg gggcaccaaa aacacataaa 81000 aacaggcttg gttgggagcc cgatgtgggc agatcacaag gtcaagagat cgagaccatc 81060 ttggccaaca tgatgaaacc ctgtctctag gaaaaataca aaaattagct gggtatggtg 81120 acgcacgcct gtagtcccag ctactcggaa ggttgaggca ggagaatcac tgaaacccag 81180 gagctgcagg ttgcagtgag ccgagattgt gccactgcac tccagcctgg cgacagagtg 81240 agactctgtc tcaaaaaaaa aaaaaaaaaa aaaaagcgag gggatcttgg ggaacctagg 81300 aagaagttac ttaaatttca gcacatgcta tatagttttc aggattagtc cctctctagg 81360 tattcatctg gggctggcgc ctccttggct ggcaggggct ggtgatcggg actccccagc 81420 gagacagatt gcacccagag cagtgaggcc ccgagcgctt cctggagcct ggggaagatg 81480 gcattcattt ttaaagtcca tttattgtgc agttgttgaa agtgggacac agaaatttgg 81540 actgatatgc ctaggccaca tgactactga ttgggccagg gtaaatgcag tctttttgtt 81600 gatggagaag gtcttttctg ggcccagcac aaagcaatgg atcttcagtc ttaagaaatg 81660 cattgaaaac catccttgtg cagtttgggg tccctggtag gccaagagct ggaaaggccc 81720 ttagactctg agtgctgtag ccccccttct aggtgatggt caaaacttga aaacggctct 81780 agactctgga cagaaatgca tgagaattga gtgttcaaag cttggtgctt tgacttcttt 81840 taactttctg tagactgaaa tatgaataag aggaaggcat gaggcccctc tcagtttatg 81900 gagccatagc tccaaacctc ccactttcca acccagcaac cctgtgtgtc ctaggaattg 81960 tagcgggtgt cccagaatgc aaaaatcact ctgctagaac tggaaaagga gacgcctgcc 82020 ttttctagca cgatctttag taaatagatt caggaaatgt gggtcctggt cagagctggt 82080 gccacaagct gagtgccttc aggcagcaga cttagcctct tcaagtccaa tctcatcagt 82140 agtatcaggg ggct 82154 <210> 6 <211> 99791 <212> DNA <213> Homo sapiens <400> 6 ttcagtgagt cgacaccgcg ccactgcact ccagcctggg tgacaaagca agactctatc 60 tcaaaaacaa acaaacaaac aaacaaaaaa aaaaacagag agagaattac taatattttc 120 ttctccaacc ttaatgctca ctccctgagc tatgtggatt atactagtga aagtactgcc 180 ttaacccact aatgtaaaca gattcctttt aagaagcctc cctatcgaga atggtctgta 240 agagacaacc atgtcaacaa gtaaagttcc ttctgccttc cctcctgggg tgggctaaga 300 tggacccttc tcaccattcc caattacctg caggaaggca gcaacagaat agagaaggag 360 ggtaacacag tttcctgtac tttaaatacc tccctgcctc cgcaagtaaa acttgagcca 420 tgccaatgag ggaaaaagtg gccgcgattt cccaggtggc ttagtaatac acagttttct 480 gacacactgc aactccattc tttcctaaaa gttccttcca agcctgtagg cactgtaaga 540 caaacagcta agcacttcct gagtgcctac tatttgccag gctgtatgca gcaccaggaa 600 cacaaaaata aaagctatgg ccattcagga acaagatttc aaaatgaaaa ataggaggaa 660 aatctaacat ggatggaaaa aagccacact tttccatgct tcaagtttag tttccatttc 720 taaaatgtct gtcctcatat gttagccaga aagccagttt ccagcaagac aagcagaaat 780 aaatattatg caagtcaaac ctacaagaat gggtcttcaa gaaagggaaa taattttcgg 840 tcaaaatcta aaaatccata ttcaacaaaa aaagcacaga ttgagaaact aattcaatag 900 caaaaaagga aaattaccat tgatccaggt tgccattttt aataaaaagc agtaaggtct 960 taaagaaaat attagcattg aagttcaacc aaataaatta ctttgtcatc aaaatgaaga 1020 atgccagaaa gttctctgaa atacaatttt taacaaaact gagaaagcag aggaagtatt 1080 ttttaatatt acaaattttt gacaccaaca taagaattcc atgatatcct aaagagcaat 1140 gaacccaggt aatgcagttt ctagaaattt taaaacacta ccaaataata ttgcttcttg 1200 cattaagtat agcattggtt tgctagaata atcctaacaa tgacaatgca atgtacttta 1260 aattggggtc aaaaaacttt tttcttaaag taccagatag tcaagctttt aagctctatg 1320 ggtcatccac agacacactg caactataca aactatatca cccctgttgc aactacacga 1380 aaagcaggaa agcaaccaca gaagacagac aatacataaa caaatgagta tgactgtgtt 1440 ccaataacat tttattaata aaaacaggca actggcccat gggtggtaat ttgctgaaac 1500 ttggtttaaa ttattattag tatctacctt tttttaaaag atgatgtttt ttagggtctt 1560 tccatcatga aaattatgtt tttatgaaag tgatttggga agtattaaaa tacagaataa 1620 agagcaagcc ttgggctatg aagtcaaata ggactgggtt ccaggactgc tgtgtgactt 1680 tgggaaactg acctgccatc tctaggtgtt agtttcctca cttgtaaaat taagatgctg 1740 acagccctca cctcataggg tcactcactg caaggaccac acaagtgaac atgcatacag 1800 cacttagcat agttatggat aaccctgtac ctaccttatt atagcaattg ctatcaactt 1860 tcttctagct tatcattaat gatactataa aaacacccag cataacgcca gcataaggat 1920 gtgaatgaat gagcaaatga aaggagggag ggcaatggca aaattttacc ttggtttcca 1980 agctaaagta taacctgagt tttttaatgc tttacaaaaa ggaaaggcaa tcagaaccat 2040 aattaatatt taagctgtac tgacaggttt tccagggaaa attctataga acttgttatt 2100 ctccaacttc caaaaataag caataaattt tttttaaaga gctgttattt taagacttta 2160 tttgaaccaa agaatgtgtt tatggtaaca acatacatgt tgtaaattaa tcagtttcaa 2220 tgttataaaa taatacttcc aagaataaat gtatcatata atctatgtac ctcatgtcga 2280 taatttaaat aaatacatta aataaataca tcattccgaa gtccgcttta tcattgtttg 2340 taaaatccaa ttgtcatact ctggtatttg ttctccaaaa gaatcatcac tttcatattc 2400 actacagcat gagatgagat atttaataaa taataggaca tcataatcca gggattaagt 2460 agtttctttt agcaaaattt aatatgaggg tagcatatgc cagccgttcc tagttgagca 2520 acaatttctg tgttgggaga ggataacaaa gccaagtatt ttcccataag aagttcacac 2580 tctaaaaggc caggcgcggt ggctcacacc tataatccca gcactttggg tggctgaggc 2640 aggcggatca ctaggtcagg agatcgagac catcctggct aagacggtga aaccccgtct 2700 ctactaaaaa tacaaaaaaa ttagccaggc gtggtggtgg gcacctgtcg ttccagctac 2760 tcaggaggct gaggcaggag aatggcgtga acccaggagg cggagcttgc agtgagccga 2820 gatcgtgtca ctgcactcca gcctaggtga tagagcgaga ctccgtctca aaaaaaaaaa 2880 aaaaaaagaa gttcacactc taaaatgaag agaaatgaga aatgtctatg tgcacacaac 2940 ttcccacata cacacattag ttagagacca cagtcatgcc caccctccag ctcacgtgac 3000 atttcaaagc agagatgaga cttaaaggat ggaagaaatg gcgtttgttt catggatggg 3060 gtaacggagg cttttagggg cttatgggat ggacaagtaa aggatcaatg agacagaaag 3120 gcaaggcaag gcaaggcaag ggactcgatc tcaggaagtg gtgagtggag atgaaagaag 3180 tccaatggaa tggcagtcac tggagatata tttaaagaag agggtctttt tgtttgtttg 3240 tttgtttgtt tgtttgagat agagtcttgc tctgttgccc aggctggagt gcagtggcat 3300 gatcttggct cactgcaacc tctgcctccc gggttcaagc gattctcctg cctcagccac 3360 ccaagtagct gggatttcag gcccgcgcca ccacgcccgg ctaatttttg tatttttagt 3420 agagacgggt ttcaccatgt tggccaggct ggtcttgaac tcctgacctc aaatgctctg 3480 ctcatcttgg ccccacaaag tgctgggatt acaggcgtga accaccgcac ccggccaaga 3540 agagggtctt ttaaagaagc aagataggaa gatccgttaa agagagaact gcataggaag 3600 gaaaaggcct ggctaggatt ccctgaacct tctcatttca ctactctctt gttagtcatc 3660 aatgcagtta agaatcaacg caatcaaatc gaatcacata gtgattaatt tgtgccacca 3720 atagctctaa ttttgttaac ttctcattcc aataaaaata atcatctggt taatccattt 3780 cttcagcggg attacttgtt tgcttgtttc tttagctata ataaactctg aatgccagag 3840 tcaccaaact aagcattaaa caaactgatt gacaattcgg aagcatagga ataattacag 3900 atgatgctag gcaatatcac tagattgggt tttcatgaag ctcgtgactg gattttgcca 3960 caaaaatcac taactgcttt ggcttccaga gaatggcctc atggataagc cccaagttcc 4020 aaaaactaca aaatgtcaaa atcacattca actaattaat aattttatgt cacaataaga 4080 attaggaatc tctagaaggc tgggtacagt agctcatgtc tgtgatccca gcactttggg 4140 agatcgaggc aggcagatca cttaagccca gcagttcaag accagcctgg gcaacatagg 4200 gagaccccgt cctacaaaaa atataaaaat cagctgggca tggtggcaca tgcctgtagt 4260 cccagctacc caggaggctg aggtgggagg attgattgag cccaagagat ggcggctgta 4320 gtgagccatg atcacaccac tgcactccag cctgggtgac agagcaagac cctgtctcaa 4380 aaaaagaaaa gaatttctcg gaaagtctta atttttatct aaacctatct gaaaattcaa 4440 tgatgaattt tatgaactta gccctgaact gacattcctg gtgaaaactg caatcattgt 4500 aggacaagag ccgtcgtgtt aaatgctaag gctattttat acacatccaa tattttggga 4560 gcactgcaat taaaagtctt ctcacactaa aaccaatgca caaagcacct ctcaggttta 4620 agcctcacta ggctgatgcc tgaaacacag caaaatgctc atactcttta tacacatgtc 4680 caaaggtcta gctatcaaaa gacagataaa aaggagcatt ttcccccaac tgatggaagc 4740 aagtccaagg tgaagaaaga ggatagaacg agaaggtaaa ccatctctca aaggtgagaa 4800 atcaacacag agtcaaccaa tgtcttcatc tcaacccaac ccaccaagca atgtatcaga 4860 ttggattgga gacagattgg agactctatg aaagaactgg catgcacaac ccaagaacct 4920 cctggattct tggcccttct tttaaagaag gggggtttct agacaggaat agaacccaca 4980 gagtcatgga agccagcccc ctaccataaa ttgttcataa ccacaagctt attggtcagg 5040 tttataaagt gattcagact ctttagaggc tacaggaagg gtgcagataa gaggacactt 5100 atgctggggt ggggaattat tggagaggcc tccaacaatg agatatcacc tataattaca 5160 ttaaagattt aaaaacatga ttgaatcaca tgttaacaat ctcctaatta gagctctgac 5220 tctccttaga atgtccaaca tccactgcat ctaagaagca ctagtattta ttatgtagta 5280 ttgtttgtgt caaattccca aaaaaggtta tcttgaaggt taatggattt aagtagctgg 5340 aaaccctgat tagagttgcc catagaaatc tgaattctgc tcaaacagtt caaagctgac 5400 aacaaaacag tgatggactc tgaaagtgaa gagacccata gagttcacat gtaatgttaa 5460 aatgttcggc acttcacttc tcaactgggg tacatgtaca cctaagacct acatcttaga 5520 agtttccaga gttacagaat gaactggatc gtgtctcaga ttaacaattg attcaaagaa 5580 tggggataga aagggagcca tgacaaaata aaggaggggg ctgttttgta tcacagcaaa 5640 caaggagatc ctgtgtaaaa gaaattatca aaattgttaa tgccagaggg tagtggctca 5700 tgcctgtaat cccaccattt tggtaggcca aggcagaatt gcttgaggtc agaagtccaa 5760 gacaggactg agaaacacag tgagagtgag accccatctc cacacacaca aaaacatctt 5820 tgcattaaaa aatgaaacta gaggctttaa agaactgctg caggctacgt gacttaaaga 5880 atataagttc tctgccttct ttgtcatcag gagtgcttct gtgattacgt ataggaaggc 5940 aaaccttaaa ggaggtaact gaaatcttta cttcaacata ctcaattgta tgcacacagc 6000 ttggtaagca aaataagtca caaataagca atattgcttc aaaaaccttt tttaaaaaaa 6060 gatacataat caattatttt catattaata gagcaaagga ataccatgaa taatccaaga 6120 taccaggtaa tccagaagtc agatactgag aagtgaaata catcagataa tttttacagt 6180 gtgtctatga tcttaattac attttactaa gcctaatact agtttttctt tcttttttag 6240 aatttctaga ttacattatt tgaaagtaaa taatggcttc aaatcatgtt aggcaacaga 6300 attcccagga aggagtgaag gtaaatcaga tgactgaact atattacaat ttaagctgtg 6360 atgtttgcac aactataaca atattataaa tgagcttgag gtttcttact gaagatgttt 6420 aatatttgat ccaaaatatc gagcagtttt gactaagcac tgtaagcaaa gaaatacgct 6480 atcatagcag gacacctgta agtttccatt gtataagaaa atgtttcctt tgtttaattg 6540 gagagtcaat taaacataca aatatctgaa gacattatta tgaaggctga tttggaggaa 6600 atgtataatg cagatacatt ctgggtgtaa gtattaaatt catacaacca ttctggaaaa 6660 taattcaacg ttgccaagtc aagagcattc cctaaaaccc atgagttcct ctcccaagta 6720 aagacatgag aacaattctt gcacatgtgc aacagcgtgc atacacaagg gtgtttgcag 6780 gacccgccca tgatagcaaa gcactggtaa aaaatcaaat gtccagaggg agtatactca 6840 gaccatggaa tactgtacag tggcaaacca aaagaaagac acctgcatcc acttagaaga 6900 atattacaaa actaatattg aagcggggaa aagcaagtca gaaaataaaa tatataacat 6960 cattccactt ataaagaaac caggaatatg tacaactaag caatatatta ttaggggata 7020 aagagatgta tggtaaaatt ttatataaag aaaaaacaag ggaataataa atgtaaaatt 7080 caggaaagtg actatctctg ggggcaggaa gggagggagt tgcaactgag aagcgcacag 7140 agagaacttc aaaattattg ataactttca acaaagttgg atgttagaca aataggtgat 7200 cattttatta ctattattta aacatgctca taatttaaat tcacatgtat agctatatat 7260 tatgtattat agatataaaa caattcagag gtataaaatg caataaaaaa gtgtacaagc 7320 ccaaatctct agcatactgc caatcaaaag atgattgtta ttcataaagt atctcaaaaa 7380 ggaacattag actatttcca gaaatcctgg ttgctttatt attcatttat tatttattac 7440 cccaggaaga taaattttag gaagtttcta ctttgagtgt ctttcttcta agttgcaaat 7500 acaaataaat gcttatttgg aattataact atactggaag ctcatgtttc aaataaagct 7560 atttatatat agcttcatca ttgtttgaat gcttatcatt gcagcctcat tacaaagaac 7620 atctaaaaga tttttttcca acctaagaaa aaacagtgct ataataaggt atcttacatt 7680 catgggtaaa aatactcctt ttagagaaca taatataatt agtttctatt ccaagtctgt 7740 cagtgtgcac tgttaacctc tgacaattat gcatgaacct tttaattagc atgttatctt 7800 tggtgcaatt aataacttgt acttcatgtt ataggcaaat taaagttttc ccactaaaac 7860 caaattcttc agcatagttc taaaagtgtt ttgccattta aatgaaattt taacattcag 7920 acctcttgct cccaaaacac ataagccatt ttttccaaag ctagacagct tttctctatc 7980 cacgttcttt caaatatttt acctaagaca gagaatctca tattaaattc aatttcacac 8040 ttgccaatca cacacgccca ctcacaattc ctccagatga tgcaatgtgg cctaatgtgt 8100 atgcttatgt atgtacatgt gcacacacaa acaggcataa tgtttaaata catataaaca 8160 cattcattgc taggtattgg ttaaaacaaa caggcttaca gcataccaac ttattaaaca 8220 taatgattga tattagtagt ttcattaatg taattaacct ttagatttga attatcaagt 8280 tcaaagtcta agaccgagag cagtggttct caggccggta caataatggc aagtcatggt 8340 attcaagaga tgagtctaaa aggcccctca gtcctgcccc taccagaaac cagagatatt 8400 tgctgctggt aataatgagg agggggtttc taagtacaag atcagctcta ttctttcatt 8460 ccctggaaat ctgccctcgc ctctgatacc tcaaaaaata tctgttgcat ttccaaggga 8520 aagaacaatg atataagcct tgctgttaaa aaaaaaaaaa aaaatgccac tacttacaag 8580 ataaaaggca aggtgttttg tttttttccc ctttctctta gactaggcat gaataatctc 8640 aaaatatttg tttgtcaata aagtgattaa aataaagtga tagacaagac ataatgatta 8700 gagaaatgaa tcaaagtaat atttgggacc agggtcttac aaatctagag taagtatgtt 8760 gagcagaaat agatactaaa aatttacatt agaacaaaat aaaaatggat ttagtaatgc 8820 tggatttaaa ttggaaatag ctgtttaaac tcatgacctt aaagaaaatt tgtcttggcc 8880 aactgcggtg gctcacgcct gtaatcccag cactttggga ggccaaggca ggcagatcac 8940 ttgaggtcag aagtttgaga ccagcctggc caacatggtg aaatcccatc tctactaaaa 9000 atacaaaaat tagctgggca tggtggtaca tgcctgcagt cccagctgct tggggcgctg 9060 aggcaggaga accgcttgaa cctgggaggt ggaggttgca gtgagccgag atgggaccac 9120 tgcactccag cctgggaaac agacagagaa ggaccctgtc tcaaaaaaaa aaaaaaaaaa 9180 aaagaagaag aagaagaaga aaaagaaaat ttgtcttctg gctctctccc taaaatgaac 9240 taactgggga atcatttcta ccttccagaa gcatttgaat ggaacagctt gatatcatgc 9300 agagcaccta aattttggat gccactatgc tctatcaaag gaatcagagc tcctcagaga 9360 atagctgact ccatgtattg ggtcatgaga aaatcaagat ccactggaac ttgtggttcc 9420 cagaaaacaa cagtgctttc aagaatgcct gggggtaatg ctaaggggac caaagaggac 9480 atttaaaggg actcccgcag gtcatgctgt gaccatctga gcatcgacat gacaatatga 9540 attttaatta attagaacaa gtgcatccca taaaagctga gagtccagga tactcaaaga 9600 gaaacagtaa ggctggctgg gcacggtgac tcatgcctgt aatcccagca ctttgggagg 9660 ccgagaaggg tggatcacga ggtcaggagt tagagaccag cctggccaac atggtgaaac 9720 cctgtctcta ctaaaaatac aaaaattagc tggctgtggt ggcaagcgcc tgtaatccca 9780 gctactcggg aggctgaggc aggaaaattg cttaaacctg ggaggcggag gttgcagtgg 9840 gccaagattg tgccattgca ctccagctct ggacaacaga gcaagactcc atctcggggc 9900 aggagaagaa aaggtaaggc ctactgaaaa cacatttgta tcataatacc aaagaagagt 9960 gactataaga tgtcctaaaa atagatggtg aagtatttaa agattaggat actctctttc 10020 tcctgtgaag tatgtgcttc tttatgagga aagaatcagc atttttcttt ttgtgtgttt 10080 gtaggacaga atgaatgcag agaattctaa cccaaatagt tccagaaaag taggaatata 10140 ccatgaaaga tggcagcaat agtttgaaga gtgagtcaga aaacaagtag tttgagaacc 10200 gttagcctat attctaatga cttgaaagtt tagtgcatgg agaaaaaata tttaatgtaa 10260 agtcatgttt gcctttataa tttcaaagaa tacttaaagc agtatgggaa atgcctaaat 10320 ggacacattc agaactcctg agggaacgag cagaacacag agggcaagag aacttggaat 10380 cagaaattcc acgttcaagc accacgttgc ctattcctca actttaagaa tgatcaatcc 10440 tgccatatct gcctcccagg gtaagtctga ggaactctcc ctgtggttta tgtttgttca 10500 actgtatttg caggtccatc tttaagatag tttgcccatg aagatagcaa ggtacttttt 10560 atgaccctat ctcaaaatca ggacatattc tggtaaagac acataaatat tggctcaaat 10620 ggattttgtt ttacctgaat caaagggatt ttgttttacc tgaatcaaag ggatgaaaat 10680 ttgccccaga aatagttgac caagtaccag gaggtttcaa aggaaaaact aggaagctga 10740 cagattgaat gttcaaaatg attccaaccc aaaatgctct attacccaga acttgactcc 10800 agagataatc caaccaacat gaacctctgt tttctattta ctcagagcat agttgctgct 10860 caatacatcc attcatgcaa caagtgccat attcatgatc ccatgccagg cacgttctat 10920 gtgcttaaga tgcagttagt gacaaaagag gccaaagtcc atgcccttgg tgactgggga 10980 caggcaaagg tggatggcaa taaataagaa tattagatga aggaagtaaa ataagactat 11040 gtcacttaaa atgacttggt gggtagcata cttttgaaag gcttctcaga agaggtgaca 11100 tttttgagct gagacacaaa tgacaaggag ctggcattac aaagagctgg ggaaagaatt 11160 ccttgcagaa gaaagaatca atggaaaagc tctgagttag gaatgtggct ggcatgttat 11220 taaaaaaaaa gaagaagaag aaaagaaggc ttaaacaaag tgaatgccaa gaagtgttaa 11280 gatgtgagct tgcaggggaa ggaaagagct agagaacacg gtgtgagtaa cgtaagcgaa 11340 aacaataaat aatacctttc ttcacatcca aaagctgatc agatttcttt ttccaatgcc 11400 aaaatacatg taagtacata atgtcacgtt gcataccact gcggtggaac acaaggaaag 11460 aagagctata atgcaaacaa acagcaactg actctttggg gagcttaaga aaaaagaagt 11520 ccaggcacca acacaaaagg ctgaataaat cacaacctta ctcaaagaac aatattaagg 11580 gcataggctg tagaaaaggc aactggttca atgcttctca tgccctctga gagctatcac 11640 aattaatggc atcatcttcc aaacaacagg taatacaatg ttacttctgt gttatagaaa 11700 catttgggtt ataactggag atgtatggta tattcatcac aaagatgata atcatttcct 11760 ctttgtgtat tcaatggaca gaaatctcta agactaggcc tctgcttccc aaatattcat 11820 gcaactggaa ctgttacaag ggtaaaggca tgaattaaaa ttatagaaat ctagatgaga 11880 tggaaattga aaatacacta aaacctaaag tctcctatag ttaacatggg ataatatatg 11940 catagttcct aacagcgtac ctacaatcct ataagggctg agtaaatgtt agtttgcttt 12000 ccaaagtaaa agtgacctga tttttctgtg ttgctccccc ttgagatcta aagctaaacc 12060 tctactgaat aaaagcagag tgacttacaa ttgagatagg ccaatctaaa actgaaaagt 12120 ctaaaatgtc aaacttttaa aataagggga tgttcactgc ttatttgact cattaaaaat 12180 aaaaatacct agtgattgtg aatttaaaac tgtagactta tgatttgtgc attttatata 12240 tgttattctt caattagaag ttcaagaaat aataatggga ggcctgtatt aaaccattta 12300 tataaaagtt tctcaaccat aatggaaaga tcaagatgtc tagcataatt tgaaagtatg 12360 tttctatttg acagaaacct tggcttggaa aagttaaact ctaaatattt gtacagaaag 12420 aagtattctg ggtttcattc attaaaagtc attgaccact gcagaaaagg gagagcaaga 12480 gatttacata tatttttctt gacgttttat atgcattagg cctggcaatg aacttgaggt 12540 aggtattact atctccttat ttctaaggga atcagaatac tgtaaacaaa gacatggagc 12600 taaataatgg agtcaaatcc tggcttacta ggctccacat ccatgttgct ccacttatca 12660 gacggccacc caaacataca agtttaacaa attccaaatt attggggcct aaatagacac 12720 ttttttgttt caatattgcc cttcttccct tgtattctga atatcatgtc aaccatgaat 12780 cataagccaa tgcttacaaa tttaacttca cattatgagt tttgagccca actgatgcct 12840 aaccactaaa ccattcatat aacacactga aaagaagcca tttaagaaat gagaaaaata 12900 ggtattgttt tctctgtatg gctgtaaaag ctgagataag aacattttgg caagttcaat 12960 agagccgaaa ggcttgtgaa ggctatggga ggatgagtat attggaagaa gatcagtagg 13020 tcaagaatct aagaagagct atttatgtgg gagacaggaa ttaccttgaa ggaagagcag 13080 agccccagaa gaagaaaaac agaatataac agctaactat aaaaggaccc agggccaggt 13140 gcggtggctt aggcctgtaa tcccagcact ttgggaggcc aaggcgggtg gatcacgaga 13200 tcaggagatc aagaccatcc tggttaacat ggtgaaacct cgtctctacc accaatataa 13260 aaaatcagcc gggcatggtg gcaggcacct gtagtcccag ctacttggga ggttgaggca 13320 ggagaatggc atgaacccgg gaggtggagg ttgcagtgag ccaagatgac agccactgca 13380 ctccatcctg gaccacagag cgagactcca tctcaaaaaa aaaaaaaaaa aaaaaaaaaa 13440 aggacccaag agaatataag tcccatgaaa acagagctcg agtctgtctt gttttgtcac 13500 attacctatt tgatactcaa tatgtaattt aatttctgag tgaataaatt aagcaaatga 13560 ataacttaaa agtatagcta tgaatgttaa aaaaaaaaaa agaaaaagaa aaagaaagaa 13620 aaaagaaaaa attaagtggg gagaggcatg cctatggcct tgtccttggt cctgaataac 13680 tgtttggcca gatagtatgg tttcctaacc ctagctcatg gtgttcaaat tctactagtt 13740 tttctttgtt tgaactttcc atctccatga aactaaaaag tataattttt aagctgcaga 13800 acaaatcatt ccatgtctta ttttctgagg ttacatagct ggctgcatgt actttcaaca 13860 attctatcat gctttgacac ttagaaatat tttccctacc agctttggga agctgggcgg 13920 tttgtgttta ccatcctctc ctgatgttac gctttagttt aaaaataaca gtcattatca 13980 ctcaattatt cagtgatcaa gtgtaacacc aggtgcaaac aaaagttctg agaacactgg 14040 aacatgctct tgttactgca aacgatttaa gagctttgaa tttatgaagc cagtgatcat 14100 gttactctaa attagaagca ggtaaaacag aagaatggca taagctaaat tccttctttt 14160 cgtttcttta cttccttttt ccttttaagg atatctatag caaactatat tagctttcta 14220 ttttctccac tatttgcact agcattaatc aacatccaaa aagtgtacaa attattttat 14280 ctttataatc aatcttctga aatgctaact tgaaaatata aacagcacaa ttactttttt 14340 ctcttttctt tcccatttga aatgtgtgct tgtgtgtgtg tgtgtgtgtg tatctgaatc 14400 tgtacatata aatcaaatac acacacatat acttgtttta aaaaaatcct caaagaatca 14460 atcacatatt acagaactga aggaatattg gagttcatct ggtccaaagt gttggtattg 14520 taaaatcact ttcaaatttc acagttatcc aaatggtaat gaatattaat acctaagaaa 14580 atcaatcaaa gattaacatt aagacattag attttaaaaa tcattgcatt taatattttt 14640 tatccatttt caaatttcag aaactaggtc tatattgtcc tatagatcta acaagcacta 14700 taaaagaaaa attacaaaga tttcccaata tacagataga cacataaatg aaaactttta 14760 attgcaagag aaagggaact ggattcatca gttacatgca tttagaaaaa tctgtctcat 14820 tcatcagcag caatgaagga gaaaagttgg caacagagcc aagtatactt actttctaag 14880 tagccaataa ttggaggcat ttaaaaatct ttttcactaa aatatacatt ttttgctcaa 14940 actccagatt tctgacattt ccttattcta ctgataatga cttcatgtga gcaaaatgga 15000 atgaaagatt gaaaaaaatc agatatatgc tacccataaa ggtttatcaa tatgatatat 15060 ctaaacattt atgtacttat tggtttaact tagttgatat aaatgaatat gcatatcata 15120 cacatcatgt gaacagaaga gcagatcagt ggctgggggt aggggattaa ctgcaaaggg 15180 gtacaaggaa acttgtggtg atggaaatgt tctatattta ttatgtggtg gttgttcaca 15240 actgtacatg tttgtcaaaa cttaccaata gcacatttaa aattggcaga ttttattgta 15300 tgtaacatat ctgactcccc gaccaaaaaa accaaaactc tgttatacca tgacacctaa 15360 aaataattcc tacagagact tacctagaac atcatggaca ctcaaatatt aaccatgacc 15420 caagaaaaca ctataaagta tgcataaaca gtgattctcc tataaaatct acacacatac 15480 acaatatgtt aagaaatgag tacaaaaatt aggggagcta ccataataca tggcagaaac 15540 agatttcctg ccccctgcca taactatcat ttaccaacat tcaatcgaat ttaagaattg 15600 ggggaatttc agagagtatc ctaattcact tcctaattca cttcctctag ataccaccac 15660 tcaaagattc ccgtggttcc cagagccttc acttgacatt catacaactt tgaccaggaa 15720 agaagggtgc gccacctcca cctgtgcctc tgcctctata ctagaaagga ttaggcagag 15780 aaagagattc aaatactgga aggaaaagaa ggtattggga agccaggatg gtttgttggg 15840 gcaaagtatt ctcttgtcat acagatggct ctcttcttgg tggtgcccca gcccaccctc 15900 aagggtgtct ataagtagga gaagagaaaa gcactaatga tgattataac ataattaaat 15960 aatttatgaa ggataaaata tcagagtcat gagagctctg aaagaatagg tagactacat 16020 gcatcttacc tacacattga gtattaaaaa tcctagctgc cctctgcagt gatgccccac 16080 ccagaagacc aatccattgg aactattgca atctgatcag attaaacaca ccaaggtcac 16140 tctgaaagta tggaggaaaa caccaaatta agaacaaaat aatactttta aaatataaac 16200 cagtttaaaa gtatcaaaaa cgtttctatt tagtccatct ctgatctctc tcccaaacct 16260 ctgaccgaaa gagacacaga tttttgcttc taaaaacaaa gtatatttta ccaacaggat 16320 aatataagtg ctttcaattt tatctaataa aaagtagggc aaagtgaaaa acaggtgcct 16380 ctacagatgg agtatactaa atacatgtaa cacttctgat aatgttgaac caccccctcc 16440 ccttttggaa tttgaaacat cccgcataag atctgcattt ttcaaatatt gctaaatatt 16500 tagagtctaa aaagatgaga ttcattattt tgcacagtaa cacatctcct aataatattt 16560 caggccagtt ttgaagaact gaaattgata tcttttccgt atatacttaa cctcctacag 16620 atttatttga ttctcaataa ttactattct ctggtaaaag gcatatgtta ttacagtaca 16680 ctgcactccc acaagctgcc cattcagtgt attttaataa atctctgcca gagctgtata 16740 aatttgatcc tgtttaaatt taataaggat cagaatatat caaagcacaa atacccatgg 16800 gagaaataga tattttgcat agttattgaa tggcctattc agggatacaa tatgtaagac 16860 ccagaccatc aaccttgaat taaaaagaga gattaatgcg ttcaaagccg gctacttgtt 16920 aaataacata tgaaattagt atttaataaa acgtcttctc tatattgttg ctaatggtat 16980 ccatcctagt acagctttaa tatcaatatt ctcatacaga attctaatat ttacaagaat 17040 tgtcagcaat gtatttctta aatatctaca ttatcttgat aaaatgcaac actgtatgga 17100 acagagatga agaatacctc atagtaattt ggaattgttg agtttaatgt tcatttgagt 17160 aatataaata aaaagaacaa ccactttgct ggatatagtt ttcacagatt acaagcctga 17220 tgatcaatga actgctttcc cattctcttc tgtagctgga tatgtttctg atttgaatcg 17280 tatttcaata atcattaata tcctgtggtt gagcaaatca tttcaatttt ttccaaccaa 17340 aatctacact tgagtgtaaa caccaatggc aatgattaat gagcctggat ttagaggctg 17400 ttagaagata caggtagcaa aatgtcaggt atcaggaaat ccttcctcat agtaaggacg 17460 actcacaaga caactattgc caggaagatc aaagggaaat ggtatcatgc gaggcatgta 17520 gaaccaacct gttctagcgc taaatgcacc agacagatgg atgggctaat ccgtcttcag 17580 ttatctacaa atactgcggg ggccacaaat tgtttaaagc cactgaaact gacattcact 17640 catgcatgtt atatttgaat ctacacctca ttattcccaa ccactttcat cttattctta 17700 aactagaaat gtaagggtta gtgcattcat cagacaaact gataaaagac actatctggt 17760 tagcctgtcc agatccatta gaaacctcac cagaagatta ggtcttactt tcagataggt 17820 agttatcagg taatgaagtc tctcctcaat gcgcctggct cccgagcgag gttggcactt 17880 catcctccac tacatcttct atgagtatct aaatcctctc taccctcttc tgactcttct 17940 gtcctctgct ggatggggtt cagtgagaga aatgcatcct agctgagcag acgaaaaaaa 18000 aaacaacatg gttgggcaat cagctatttg tcacactgag aagacatcac ttcttaccaa 18060 gcaagaagta gtagaatggg ctgggcgcag tcgctcacac ctgtaatccc agcactttgg 18120 gaggccaaca cagcaggagc tcttgggcct gggagttcaa gaccaacttg ggcaatgtat 18180 tgagagctta tctctacaaa aaaaaaatta aaaaattaga tgagcagggt ggcacgcatc 18240 cacagtccca gctactcaag aggttgaggt gggaggattg cttgagcctg ggaggtcaag 18300 gctgcggtga gcacagtgag cactggtcac accactgcac tccagcctgc gtgacagagc 18360 aagactctgt ctcaaaaaca aaaaaaaaaa aaaaagaaga agaagaagga gaagaaatag 18420 tagtagatga gctacaaata caatgcccca atggctgaag gaaactgaag tatggatgca 18480 gatatgacat gtcccatata tctaatttta tgaaatatgg gtatataaaa tccaaacata 18540 aaaatcagat ccataagact aatgagtgta gttaaaattt cctgaaatag tatttctaaa 18600 tatatttaaa aactagcatt ggttgaacac cttcagtttt ccaataaaat tgtgtaattt 18660 attatgctat aatttttctt taaaactttt attttaaaag cccaggcttg gcagcctggc 18720 caagactagc accttatctt acacaaaata cagtgctctg cctcttaaca aatatagatg 18780 taaccactgc cagctgttta caacaagcaa aagctgggaa gccctattag gtgttatgtt 18840 tgttctgctc gtgttaatag actcatgttc aatgtcagct cttcttccta gatcagtgtc 18900 tgccaaattt cagttatttg tatatcactt tcatgcattt tgccatttaa agcaggtcca 18960 cactcttcct tatccaaaac cttagggcca gatgtatttt acagttgaaa gttttcaaga 19020 ttaggaaagt aatatggtgc atattccctt attacataat acctctagtg gtctgaggca 19080 gcaccccata gtcaaacatg tggacatttt tgtagcaaaa tgtctgaata ttcacataaa 19140 gataaataca ggaaaaaaaa gtttcatgtg aattcaggtc aagttttgat gcaaatgtgt 19200 aaccctaaac atttttttta atttgttttt cagagcattt agaatttgga attatggcta 19260 aggtatagta ttgtgagcct ttatttttct ttaattcatg catttgcata aaaattaata 19320 tgcttttttg ttaacaaaag gacactttat ttcatacatg gaaaactggt attcctttct 19380 ataaatagca cataactatc aaaataaata caataaatac aaaataatct atttaattct 19440 agcaaaccaa agctacagaa gggttgtaac tgggtcctgt atgatctcct ccgtctctcc 19500 ctctctctct cttcccctat aatgtgtctc aatctctctg ctaaaaaaga gattagcaag 19560 tattaggtgt taaagacata ttcgcaccaa actgagattt tctcactgat gtaataagaa 19620 agcctgaaag gaaaatggaa atgctttcta tgtaattcaa tatggtttaa aaacatatcc 19680 ttgtagctaa aaatcaagct acagcctacc aatggtagaa gcccagtacc acctgcctag 19740 cttccatcta tcctatgcca accagcacac catgtttgct catgtccctg gccagttcta 19800 ccttctctgc cagatatttg gaaacataca agggttgtag tattcagctg gaaaaaaaaa 19860 aagttcagtg gtataagacc acaggggtcc aggaagtgct tcattttaca taaagcccat 19920 tttactttat gccccttaaa tatgttttgc ctttgtgcat ggccatctgt gccgatgaca 19980 ctgttaccac tagagtacct aaatatgagt gcagtgatca actgtgcgta cacagcttca 20040 gtggatgcaa gtatgatctc tccgatgatc ctgggtccct tcagaggcct ttggatggtt 20100 ctgagcagta gaactcaaac tgtgatccca ggaaggcagc atcagcatca cctagcaact 20160 tgttagaaat gcaaattctt gggccctacc ccagacctac tgaatcagaa actctgggtg 20220 tggagcggca acatggattc taacaaggcg ttcaggtgac tctcatgctc agtgaagttt 20280 gaaaagcctg tgggtaacga gcacagtctc tggaacctgc ctgttgattt gaaggaatcc 20340 cagatcaatc acctcctcac ctgagacttt gaacaagtta tttaatttca gccatgcttc 20400 catttccgtt tctgttaact gggacattaa tagtacttac cttatagagt cgtggaggat 20460 taaatttatt aatacagata gagtacttag aatagttcct gaaaatactg cacaaatatc 20520 aatagtattc catgtaagct acataaaacc tttacttaca gctaaataat agtattttct 20580 ccaaataata aagacaatta ataactacaa gcttcatttg atgctcagaa tgaggttcat 20640 aggctttgtc tcctaataaa gtggaagtgt ggaacttcag cagagacagc caaatgtcag 20700 gccacaggcc agatgcagac tttagacagt ttccaaatag tgctaacatt taaaaatgtt 20760 aaaatatcac agaaatcaaa atttctggtt ccccttgaaa aatcaggacc tcagacaaca 20820 ctactctagg attccctaga gctactggca ggcagagtgg aggagcaacc acctcctttg 20880 aagaagtctc gtctcttgca gtctcacaca aatgggcagt tcagttgcag tcatgtacca 20940 tcttcctcac acctatgaca caggggtttg tgagccctgt ccttctgcaa actctaaggc 21000 ctctaagtgt gtcctctgtg tgcaggacag ggtgacagct gtcccactgg gaaagcaagg 21060 gagttcccaa gacactggtc tttcatgcaa caacagggag agtcccagga aacctgggaa 21120 aaaatggtca ccctatctgt gcagatggtt cccaagtcta caatccaagt gtctctccta 21180 tctggtccct gtttccaagt accatgagaa gcattttttt gtttgtttgt tttttgtttt 21240 ttgcgaatcc cacttttgcc tcaaaacaca ctttccttca cgtttatcat gtgctattca 21300 agcacttcat ggatgaaggc ctcctctata gcaggcacag tcctggacac tggagatgaa 21360 gcaacgaaca aaagagacag aaatctctgc cttcgccagg ttatgttcta gcatggagga 21420 gagagacaat gaataaataa ggcagaggga atgttgaatg gtagtaagtg cctggagaaa 21480 acggaagcaa ggcaggagga cggagagtat cagggaaagc aatgaggtgc ccatcaaagt 21540 cctccctgag aaaagggaca tctgaggaaa gacttgaaga gaatgaacaa ttgagccatg 21600 caaatatctg atgcaacggt atttggggca gaggaaaaca ggacctgggc cttgaggtgg 21660 gcgtgtgcca ggggtttcca agtgatcaag aagagcgggg tatgtggtgg gagggaagtc 21720 agacaggcct tgatgaggtc aaggaaataa tgtccaccac tgagttaaga ccaggctttc 21780 ctctgaatga atcagggagc cattggagag ctccaagcag aggagtcaca gggacctagc 21840 ttacttattt ttctcaaata gccatcgaca tctagttgtt ttgacttgtt attcaaggag 21900 gtcagtccaa ggaaactaga ttccccacct tctataattt cagcatcccc tctcattgaa 21960 gacaggaacc acgtttaaca tcaatgagtc ctgtgggaat aaagactgac agggaaccaa 22020 acagcaaaag ggaagactta cctcagttta tttatgggga tttatatact gcaaactaat 22080 actctatttc actggaatat ttgtgtttat gaagacatcc tgatgaacga gacttttttt 22140 ttcagttcat gaaattttca ccataaaaga accctgaatt cctattttga aatccattgt 22200 gccattttta ttctgcctgt atttgaatat agcatcaata tttaactact cattaaatga 22260 attgtgactt ttatagtgaa aatgtcagtc tttgcagttc attagattca tttaaagcat 22320 agctgcttga tatttttttt ccctggaaga ataaaagaac tgtgaattga agacataaac 22380 tttaaattta agcatgtgtt ttcttcaaaa ttaacattca ggatctgtaa cattattcat 22440 gagattgagg ggctgtttgc atctttctgc atttacttag tgactgtcgt cttttatgga 22500 gtatagagct gtttatcaca gttggatatg accagtggaa tgtcactgtg gacattaaga 22560 tgccataagc tattatgaat ctctacaatt ctgcatgtag tattaaaaac attatcttga 22620 actatggcat cagaaaaaat aaaccctgga agatgtcaaa tttaataact cactgaatcc 22680 aatagggcct aaaagtggtc tatttgagtt ttaaaaaata attctgataa gactttagac 22740 tgcctgaaag aaaatgatat attaaaaatg gaatttgaga aatgaattca aatgaatttt 22800 ttagatgttt gcaattcttt cttcctaaaa ttactatgat ttacatgtat ggagcagtaa 22860 atgcaaatga tttccaatca ccacgggtac gtgtactcaa ttacaaagtc tcttaatgag 22920 cattgaaaag atttcagcat tcactgaaca agacataaag caaatgaact cttcagtgcc 22980 ctccccttcc cacagagggc tgaaagggac tcactcttgt tacaagaaca cggccactcc 23040 tccctctctt cctcttccca gtccatccct caccccagtt tcagccacca tccaaaaaga 23100 aatcgcagca tggcccttga agcacattga gcttaaaagt gcctagaaga taaagcctaa 23160 acttcagcac gacaggcaag acctttcaaa atctggcctc gaccatcctc tctgggtctc 23220 ctttctgaga acccctattt tctgcctttt cacaactcca cacttatgca tgatgctgtt 23280 ttccctccct ggctcaccca ccccagtgtt cttcttctgt gatggtaacc tccccagaaa 23340 gtctcttgag ctagagtgat cattattaaa ttaaaaaaaa aaaaatccta ctttgttcta 23400 ttctgatttc aaaaacctga aaggcaagat atttgaggga aaaaagagaa tattgttttg 23460 ttgcttttta aaaaataaat ttgcaggtcc tgacaatccc gtgctttgtg tgtgctgatc 23520 acactgcaat ctaatcaggt acagtaaata aaatgacttg agaacctttc tgacgaatgc 23580 aaaggctgat gatattttgt gggtggaggg ctattcatgt atcttctttg agtatactaa 23640 agatccattt aattaagttt ggggaggggg gttctctatc ttttcctctg tccttttttc 23700 ctgaagctct cctactggaa agggaatgga agaaaacctt atgtggagtc cggagtgcct 23760 acctaaatta ctaagacaat aaaggacata caaaagaaga taatcaaatg ttactttggg 23820 tacttgaaca cttgctaaga gcatgcatcc tgcagtcagt aacattacca tctatactca 23880 gagggcaaac gctaatttca aatccagagc aatgtcaagg atttatcact gcaacccaaa 23940 gtatctttgc tatcaaagac agtgggggca tgaactacaa aggcaataac taaaaagagg 24000 ggctcatctc acacctctac tcctctccaa tattgggaag tccatttgag ttctagagag 24060 tgcacatgcc aaaatgcaag tgcgtgcatg cctgcgtaca cacacacaca cgcacaccat 24120 tccaacattt tcccatattt tgtccactcc ctctcttcct tgttatgggt agcagcagtg 24180 ataatgcact ttaatggaaa cctgcctaat gaacccaaaa ggaaaacgat taggaaaaaa 24240 atatgcaata catcgcattg aaaggtgccc ataattaaat tacttgttac cgtttttaaa 24300 tagtgcaaat attagtatgc ccacaaagaa ctaaaggttt gtttgtttta atctagatct 24360 tccagaattg gctgttcagg aactgcccat gttgcccaaa gtagctactt tttataagaa 24420 tttcccactg cctttgaaat attctctgac attcccattg gcttaagtat tctcatactt 24480 ttctgcctaa atttgtagtt tcccaagttt aattacccca gaacaatctg gtcatcaata 24540 accaaataaa agaggatggt atttttttcc ctcataaatc tattcatcaa gattcgacca 24600 agcctgcctg gaatgtccag cgaaagcttc aataatcagg gagaaatgag ttgcagaaac 24660 tcaaagagaa cagaatagcc aaggcaggag attacgaagc caggagatga gggcacactg 24720 aattaaacat tcttaagcag acttacatac ataatgaatt ggtcaattct gtccaatgtt 24780 tctgaaagag attacccttc caacaagcca aatgagtgtt caaggatggt agctcggatg 24840 gattcctgaa caaaataagt gttaatcact ttatctcccc caatcttttt tgtgaagaag 24900 agcaactttt catttccata aagccttgaa atcgttggtc ggcaggggat gggggtggtg 24960 ggggagggct ggttagagga tacagacaat gaagtccctg aaaaggggga tttcctgaca 25020 ataaacccct gatcagagcc agagagggga cattgttgtc ttcagcactc ccctctcctt 25080 tgggaattcc aggcgtagta gagagaagag ggtcacagtg acaactgctt gggaaggctc 25140 taaccaggta gtctttgcga ttttctgttt gggaaaagct ggcctacaac aatacatttt 25200 cttggaatgt gttcttttaa acaaattgct acagactttc ttaagacatc ctgtcaattg 25260 ttccaaaaat gtgtaatcag cttatgaaat ctttaagcaa agaacattaa atgttagcat 25320 aaaatctcat aactagttat gtattgagat tctcctacac accaggcaca gtgctgggca 25380 ctaaacacat agcagcgaac aaacgaaaca cagcggtcac tactgtctgg aaatcacagt 25440 taggaaagac aaaactgctt cttaaatctc tgtgcactcc atgccagaca cagtagccat 25500 tccataaata tttgaggaat gaatgaataa aaagacttca gagcttgagg ttcatgtgac 25560 tcaagattta aaaataaaaa aataaaaaag taaaagaaaa gaaaaagcta gcaggtatac 25620 tagaaccaaa cacacaaaat aatgagccag agtgtgctcc cacaatatta ggagaaatgg 25680 aacaagaaat caaaaccctc gacatattgc tcctatttat tattttaata tcatcgttgc 25740 acagaaccag tcattggtgg tgctttaaca attcctccta aatagctttg tgacttagtc 25800 caagcaccca gagacagatg agccccaatt caggcaagtc ccctgttgaa ggacaactat 25860 tttctcaaat gaacaaagat cttctcttct caatccgcca gatcacacag ctttataagt 25920 ttgaaaagtc tttttgctaa cctagaggta ttctctaaca gaaagaggga gatggaaaaa 25980 gaaaacatct gcaaggtgct gaaacacgcg tagattattt tacctgatcc aggagcctcc 26040 ttccctggtg actacctact cctcagaatg agtgctggcc ttcttagcta ttctggggaa 26100 cacaatgatg gaggctcctt ttagctccat caggccctag agaaataact gccctatatt 26160 tagatagatg ccctttgtaa caaaggaata attcatccca gttagcactt tctaaatgac 26220 agaaccagaa agttttcgaa aatattcttc tagctcagtg gctctgaacc aggggacgtt 26280 cggcaatatc taaagacata ttttgttgtc acaactgggg gtgctgctgg catctagtgg 26340 gtagaggcca gggatgctgc taaacctcct atgatacaca ggaaagttcc ccaaaacaaa 26400 gaactattta gcccaaaaca tcaacagtgc tgagatgaag aaatcctgct taagttatac 26460 attaaataaa gaacagcagg gcatctactg gtgaccccag atagttctgt taaaatattc 26520 tgaagtagga ttcttctccc agagtctatg ttcagcaact taaccagatg ttaaaaactg 26580 acccgatctt aggatgttaa caatatttta aaataatact gatggtaatg gtaacattaa 26640 tgaaatgctt ggtatacaga gagttatagt gcatatttac aatgacccta tgttgcaaat 26700 gttattagtg tcctctagaa ggtaactgta ttaatcacat acaataactc tatggagtag 26760 gtgggtttat aaccccctag gaagtgtgtg ctgtgggcaa gacttgatct gttttttttt 26820 tcaccaccat ctgtccagca cccagcagag tgaaatctcc atttcagaaa tgatgatgct 26880 gagaggctca ggaacatgcc agagatcaca gggccaataa atggtggaac cccagttcaa 26940 accgggcaga ctgcctggtt ccctagcctc tctctctcgc accgtgccag ccggccaact 27000 gcttcatatg tggagtcatt gaaacctatt agacctcttg agtctaacct tagataagca 27060 gaaccaacct aagggggaag gaattaggct gctttccaaa gttaccaaaa gtttcccaat 27120 attcaagaga ctgattaaac aaaccagtga ccccaagaca atggtgaagt acatttgtat 27180 tgccatgaga cacttgaaag caatctaaga gggtggctgg ttttataaga ggttaactgc 27240 ttctcagttt gagcaagact catgtggcac caggcactag gcaccgggca ggcttcctga 27300 agctaaaatg gccactttct caaaggacaa atgccctgca tgagtgcaga aactctttgc 27360 aaccactagg gagctaactc agggatcatg ggatttacat gtggaccaga caacaacttg 27420 gccaccagtc caatggatcc ccagtgccaa gttaacctta gcacagtctt cgggtaaaat 27480 ctagatcaat gctgattatg tcaggaggtc aactttcagg aattaatact ttttgaatga 27540 taagagagtg caaacattaa tttaaagtct cagagagtat actaattttc ctgttttcat 27600 catttcagta gattctataa ttctaggggg aaatatccca taagaaataa attctagcaa 27660 gtactgtaaa taaagaattg tatccacctt tataaaaaga ctaaaagaag aagagataag 27720 agcttgtttt ttagttttac aatattgaca tagtaggctt tatttttttt taaatgtgga 27780 aatttccctt ttagaacgat aagaatacta gcctggacac tatacaaaca tagtcattgt 27840 acttataagt gctttaagta tttattcata gcctgccttt ctctacaaag gaagtgaggt 27900 gacttttaaa agcatatgtg atttttaaaa ggtaagtaac aggtgaatca aagcaaggaa 27960 aaagtaaatt tgagaaaata ataaagccta gatggccagc acacaggaat gcatatccta 28020 ctgccctaga cagctactaa atgggtttcc tgtttgactc caagcttctt ggccatcaat 28080 gcaaagaaag aacaagaatg gtaagattaa tgcccagtaa gatacagcga agtggatttt 28140 tttcagttct tcttgatata gtaacctaag aagattctct gtaaatcatc atttaaaaag 28200 acaccatgag gtgtaatgag ctatacattg taaatagaac tttttaaaaa aaatgatgtt 28260 cacgaaacta ttactcataa tcctctcaat acaaagtgaa gccttaatca gtgtgcaatt 28320 caataaagca gagagggcct gtgaaggcaa ctgtgaagtg gggtgccaca taatatgcca 28380 tcgtgagcat tcagctctct cacaagtctg gcagaaatct cttatcaaat taggttatct 28440 ggatgaacgg aaggaagcaa ggcatcttct tcatgccatt ctccttagat atattatttc 28500 ttccaacaga ttttattaac acaaactggg cagcagggac ttcaagaagg acaaaaatcc 28560 tgtgtcaaaa ccattacata tgttggcaac atttatcatc aggaaaagcg tcccaggaag 28620 ttgaattcta atgtatgtgt ggtgttacaa tggaaatttt agtgtgcaac tggaatcagg 28680 ccatgagttt tgcctgtcat caaatgtatc tgttaactta gggttgaact gccccccacc 28740 ccactttttt tttttttgag acagtgtctc actctcttgc ccaggctaaa gtgcagtgcc 28800 atgatctcaa cccactgcaa cctccgcctc ccaggttcaa gcaattctcc ggcctcaatc 28860 tcccgagtag ctgggattac aggtgcctgc caccacgccc ggctactttt tatatttgta 28920 gtagagacgg ggtttcacca tgttggtcat ggttggccag gatggtctgg aactcctgac 28980 ctcaggtgat atgccctgcc tcggcctccc aaagtgttgg gaatgtaggc gtgagccacc 29040 atgcctggcc cctctttttt ttttttcttt tttttctaac tacacccttc tctttttcct 29100 ctctacaact gaatggtctt tctccctgat ataagaatct tctagatcac tcccatccat 29160 tgcattcttc ttggtcttct gttatcactc ttcttactca tcttactagc ttttaacttg 29220 actacgtttt cctttacttg gtttctgcct tggacttcca caagcttcac cctaataatc 29280 atgcagcctt gaaaaacatg gaggaaggaa aatgctgtca cctgccatct tgtacctgtt 29340 taaagctcca ctgttttcag tgtttaaact atgaagaaag gctccgatga tttaagctgt 29400 atagtcaaaa ctacagtgtc ttctaggaat ctaggattga gacaagatgt aaaaagagga 29460 acatgtaata tattatttta ccccactggc aattagaaat cgttagccaa agccaggatt 29520 ggggaggata ttcgaaaagt tattaatgca gacagagcaa ggcttttatg ccaccaagaa 29580 agttatttat tataaacaat gggttttgag tcacatggac aatagctatt ttaaaaacaa 29640 cgaatatatc caggaaaggt gcaaaaatat aaaggcaggc aatcctagtt tgtggtgctg 29700 atctattacc actgcaatga ctgtcaatag tgaccctgag cagaactcaa acagttaaga 29760 aaactcacca cctgttttcc aaggaatttt atttttgctt aaggtggtaa gtttgatact 29820 aaatacggag ggtgttcaat gtcaagttga ggacatagca atttaccctg caggccagtg 29880 ttcctagtgt ctactattca tattagatta acttaagtgg tgtataaaaa actttttaaa 29940 agtttaatag ctatgcattt attgtatggg taatctttac acattgcaag caatacaggg 30000 tcgccatatg caatggtgat acaaattaaa aagtgggtca atgtaaaaaa ttataaataa 30060 tagcagtgat aggtagatac agcagaaatg aatgtggcaa atctgcgaac acattgcaag 30120 acactggaag tgttcagaag gaaaatggta gctgtctaag ctatccttta gaagattaaa 30180 ccagaagtaa agcatagatt ccattgaagg tgagaaaaga tgacaagcag ggagagaggc 30240 ctgggctagg atactgatgg ctgaaagaaa agaaaaagat tatcagaagc ataataaaga 30300 agacatgaag actccctgga ctaagggaat gaaagaagcc aagtaatcta aattaatttt 30360 gaagttttgc acctggaaat acggcactga aaaaaacaga aattcaaagg ggagtttggg 30420 gggcagtggg gatacaggtt gccctctggc ttatgctgga tttgaactga cggcagacag 30480 ggaagcggtc atagcctgga gagagccact atgcaggaga tgagaaatgt agatcacagt 30540 agagatgagg atttgagacc ctggggtaaa ttgcaaaaat ggccacaatt ctccacacct 30600 ctgtctatcc atgcccttct gtaatgtaat tttgtggctc ctcccatcaa gaaatggatt 30660 ctgcgtcctc tcccctagaa cctgggctgg cccagtgact tgctttagcc agtagaatgt 30720 agtagaagga acagtgtgcc atttctgggc ctggactcaa gggttcttgt gtactttcct 30780 gctgtccgaa atactgccat catgaacaag cccaggctgg cgtgctggag gtgaaagata 30840 catgccagag aactgaggga ccccggtgga cagccagcca acctcctgaa gcaaaccctc 30900 cctgccaatc tgcagttgac tgcaaacaca taagagaccc agaataggat aagcactgcc 30960 cttctgagcc caacctaaat tgctgacatg cagaatcaga aacaaaatat gtgtttttga 31020 agtcacaaag tttagaggcg gtttatcact cgcgatagat aactggtaca gacaacacgg 31080 gtctgcctag aaagtgaaaa acatacgaag gcaaaacagt aagaggtcaa gctttaggag 31140 gatattccca attcctagga agaaggggga aagctgtaga caagacaaca gggcaatggc 31200 aatcagaaac attcaagtat ataatatcag ggaaccagga acatgggggc aggggacaca 31260 gaggataaaa gtgggggtag gagaagtcaa ggactcatca gggaagtata gcactgggct 31320 tagcagagaa tctgcctaga gaaggcactg gtatttttgc atgaatgatt gaagtttgat 31380 ctgtcaaggc agagctcgct ggagaagagt gagaagacag tgtcagtaac gtaacaagga 31440 atagaagtgg tctatggagt gttaaggagg gcctgggtgg gaaagatatg gaaccctagg 31500 taaagattac ttgtttgaag aatcattcag agagatgttg aagacgaggt caacagagtt 31560 ggacaaaagt gtaaatgtga atggtccttt ctctaggacc ctacaatcac aagtgtggct 31620 gggaccatcc atgccagcat cacttgggaa tttgttagca atgcccactc tcaggcccac 31680 cccagaccca ctacctgtct tttatccaca tccccatgtg ccattcaagt ttgagaagct 31740 ctgctctagg aagtacaaag acaaggaact gaagagcatt taatgacatc ttgagaaagt 31800 cattctgttt tgaattccct ttcaatcccc cagataaaat aacacaaagt cttgccttgg 31860 tactaagcca tcttcgacac ctccctaaca cttgcaaatc tcccttttca acagagttca 31920 acagagagca gagccttagg caagcaaggt ctccagtgag atttgaaaaa cactgtttac 31980 accccttttg tgtttatttt taggattttc ttttatgtgt ggaaagcaat caggttttcc 32040 atttgcagta gtcttaattt cacattaatt tatttaagag aaaaaaagag gtaaataaaa 32100 atatgtagca tataataatg tggatgcaaa tgagaagaca gcaaaagttg ttacaagtga 32160 ggtggcactc aaagcgaaga ctggaaaatc tatagtggaa gtcagaagac atctgggcac 32220 atttgaaggt agaaaggcaa gagacaggaa agatgggagc tgtttgcaga acaaagaata 32280 ttcaacaggc aggaaggact gttggaagga tttatcccag agtagaagct gccctctctg 32340 ggcctggaag aaagaaagat ctggtccctg aatgggtgag gatgacaaat cagagatcta 32400 aggcagataa tatcaaattc ttcataagta aaagattgga ggtcccctct aaaatgaggg 32460 taggttggtt tgactgggac tgcaaaagag tatgaaagac ttggaatatc cattgtggac 32520 aatgaccaag agaacaaaca gatgaaaagg attccgcagc aaaggcccag ggacagtcag 32580 gcagcattaa tttttagtaa ggaaaatgga cacagtttat cccaaagctg agaaatgaaa 32640 ctctaaggct gacacaaaaa atacaacagc aaagaaaggg ggcagaggag attaggtagt 32700 agtggcaagc atagctgaca agtcctcata gtcaaggtta catacaaagt caaaggttgg 32760 ctaggtgcag tggctcatgt ctgtaattcc aactctttgc agggccatgg cgagaggatc 32820 acttgaggcc aggagttcaa gaccagtctg gtcaacatag tgagacccca tctctacaaa 32880 aatattaaaa attagctggg tatggggtgt gcacttgcag tcctagctac tcaggaagct 32940 aaatcaggag gtttgcttga acccaggagt ttgaggctgc agtggctatg atcacaccac 33000 tgcactccag ccggggcaac acaacaagac cctgactctt aaaaaaaaca aaaaagagtt 33060 aatggaaaag gccagtagac tggactctgg gaacaagatt ctcagtggat atagggatat 33120 aagaagtgag aaataaacta ggtttgatca aaaaggaaaa acatcatgtt tttaaaaaac 33180 tggtttttaa aatgtcaact aaatattaac tagtgttcaa aattttgtta ccaagagttg 33240 ggacttgata aatggcacta caaaaactca ggaaaaattt tgaaaagaag agaaatttgg 33300 gcctaaaatg caggtaatca attaaaatta ggacataatg atgtgtggtt cttgcaaaga 33360 acataaatca ctgggtattt taagtgtgcc caaaataaaa tcccaaaact gaagaaaggc 33420 ctgaaaagat ataaatctta ttacagtgtg tctctctcac caaaagagga tcatccaaga 33480 agcacataaa aactaaaact ttgaagttta ggaaaaacaa gaacactaca gagtatacat 33540 aaaatttcaa acttggagat acccaagaag ggtttctcag acctcaccca tcgctcactc 33600 acacacagca cacttgctga actacctggt gtcccttcct ctccactcac tccttccaca 33660 gtaattgaga gtttcactgg gcacatggcc agccacaata taaagtacat ttcctgagta 33720 cccaagtgtg gccatgtgat gaaggctagc cagtgagata taagcaaagt ggcatgtggc 33780 agcttctgga aacctccgtt tgcccttgat ccccttcaat ccccttcgtc cttcttgctg 33840 gtcaaaccat ggaggttgac tagaggtcaa ccttgagcca taaggataag ggtcacagga 33900 tagctagagg cagcttggct cttcagtgtt taagaagcct ccatactagc cttggactac 33960 ttccctctag atttggttag ggaaacaaga aatgagtatc tacttcattt aagacgttgc 34020 tgttcaagat tttttctatt acatgtaagt tgaaccctaa tgtaccctct ttgctattat 34080 gggggcctcc tattccttga ccatttcttc aatggcctga atagttggat taaaagcagt 34140 cacttcaata ccacatttcc ctcaactcct gttctctcat ccctgcctag gcaaaatcca 34200 ccaccaagtc agcttcataa tcattgttct cttcctgcca ccaacacatc aaatactgat 34260 aaaaaaaatt aaaaataaaa tgtaaactta aacacttcta atagggatca tcacaactgt 34320 agtccaactc cttgaaaatg gacaagtgac ttcactgctg cattcctatt gcctagaagt 34380 gtctgaccca tactatgtca acacatattc actcaaatac taaactacaa ccagatcttc 34440 tgctcaacag tatttttatt catctctagt tcacttctta ccacatttta tgtgccaggc 34500 acttctctaa atgtgagatg taccatgtgc atcaaagtaa atacaccccc tatcctcatg 34560 aagtttacat ttcagtggaa agagatcaac aagagcagat gaataaatga ataatcaaga 34620 aattcaaata gggtacatgc tatgaacaaa attatgaagg tagagagata ttaattagag 34680 agatggggaa aaggatattt tagaaattga gattttttta atggtcagga catacttgaa 34740 ggtgatatct gggctcagac ataggtgctg agaagaggcc agccaagtga agacatttgg 34800 ggagagggct ctagacagag agaatatcaa gttcaaaaag atgggatgaa ggctggtacc 34860 gttaaaacac ataaagcgag ggtagagggg aggagtggta agaaaatgag gtaggaaaag 34920 tacacaggga tagatctcag gcttgtcaat caattcccat gcccatacat attgttctct 34980 ctctctctcc tctcttcccc aacatctttt ctactgaaat agatatacac tatatatata 35040 tatatatata tatatatata tatatatata tatatatata catgtgtata tatagaacaa 35100 gatatatttc tcactctata tccatacagc cactgagaat cttattccca tagtccaatc 35160 cactggccct tttccttaac tcttgacatt tttaagagtc aaggtcttgc tgtgtttccc 35220 aggctggaag tgcagtggtg tgtgtgtctg tgtgtgtgtg tgtgtacata tatatgtata 35280 tatacacatg tgtgcacata tttacatatt ttatatatat atgaatcttc agccatcttc 35340 cctttctttc ctattatcac aaagaaatag ttaccaaggc ttcatttaag ggctaactct 35400 cctttatcta cagtgttcgt tccaacagca actgaccacc caatccatca ttcaatagct 35460 ctctcactct ctctctaatc tcttcttcaa acatgttcag acattgtctt gaaaatatct 35520 tctcattagc cccacttcaa aatgtcaccc tctacctata cacacatata tgtatgtaaa 35580 cacatacata tgcaaatgta ccgagacaca cacatacaca gtttactagt acctactcaa 35640 tacaacctag gatctttcac cagacattct agtgtctcca cagtttgttc tcaaccaacc 35700 acatctccca ccatggaaag agaaaatctc atatccatag aatatccagg tgacctatag 35760 gtttcttgaa ggcagaccac atccaatctc agcctcaaca agaagggcgt tcctaatata 35820 aacaatattt atgatattta cattacataa gcacaggctc attttggttt ccacaaagaa 35880 taataataaa catagacaat ggaaatcctc agaaatcttc aaaatcatca agcttcactc 35940 cagttagccg tttcaatgga ctttgctttc ctatcctaca cccacattct ctcattgtga 36000 catcagcact ttgtttttcc tccaaagaac cactgctcca tactcttagc tcctgtggct 36060 tccaagaaga tgacagtgtc cagctccccc actggtatgc ctacgtggct acgagcctgg 36120 gcatgggacc caagtctatc caatgagact tgatccagaa aagctgctga aacatgcaag 36180 aaagaatctc tccctcttga agaggctgag ctgtgagaat gtaacttgga gctgctgctg 36240 gacaacttcc cactacttga gtacagcctg gctgatatga taaaaaaaaa aaaaaaaaaa 36300 aaagaaagaa aaagaaaaaa acagatgaaa gcagagctaa tataagaaag tcttgatagc 36360 atcccttgag actctagatc cagctatgcc tgaaacaaaa cttacaatcc cttttctatt 36420 taactcagtt tgactgaagt ctttttctca cttgcaacca aagcattttt actaaaacaa 36480 tcattttaac cacttttcca ttaaacattt ttattagaat ttttaaataa gtcaaataat 36540 aagggttgaa tctctcatta aagataagtt ggcatcaagg agcagcacga tggatctacc 36600 gagtatattt tattaactgt ttgatatttc tagatttaac tcatcccctt ttgaagaaga 36660 tcaacttcca accaatcata catatttaat aaaagttttc tagtcaggtc agcattttga 36720 acttctactt cctacaccta ggagattttt taaagaaact gtagaatttt tattattcta 36780 cagtaaatcc cttgcttatt acaaattagc tgtagaaatt gctggaaaaa atctcacaat 36840 ttggtacagt tatactacat ccatttaaaa taaattgaat tttaaaactc actcttatca 36900 ccatctttga cataattctt ctgcataaac aatttagtca atgtagataa ggctacatta 36960 aatttgcaac atttggaata gaaggaccca gcttaaaacc tcactccccc aaaagaatga 37020 gtatatatca ttcaaatatg aatttagagt aaaaactcaa atgtgtcttc atattagccc 37080 atttgtctat cttcaaattc ttcttttaca aacaaagcaa aattgaatta agattaaaga 37140 tagaatgtta atcatacaag aagggccatt ttccagggcc tggcatgttt tacacaagca 37200 tgaaacatat ttaagagaac atggcctccc tgaggaagag attaaggata caaacctagg 37260 aaacaaagaa aataaaacga tctacctcaa agggataaga ttaacctgtg agaagctcat 37320 gcggacctta aataaaagcc tctactcctt atatttttaa acaggatttt tctttttttt 37380 ttagagcact aattccacct tcaaaatata tttgagtttg taagtatact caacaaaaat 37440 cctgtccttt cttattaacc atactcaaaa cagattctct aaaatagtta tgacaccatt 37500 aacatttcat gaaatccaaa acaaatgtgt cttccaaaaa aataaatgtt ttcattcata 37560 aatggctaat atggttttaa attatgttat cacaaatttt gcatcattcc cccttaataa 37620 ccatttaaga atgtttcctt ccaaatagct attaagagag aaaggatgtt tcatcatgca 37680 tacacacaca taaacacaca ctccttgttt atgtcattgt ttttaatggt gcagtaggat 37740 ttccaaattc ttcaagtttc acacattcaa gaatgtttcc ttccaaataa ctattaagag 37800 agaaaggatg tttcatcatg caaacacaca cataagcaca cattccttgt ttatgtcatt 37860 gtttttaaca gtgcagtagg atttccaaat tctctgtttc acatgttact tcctaaatta 37920 ctgcctcact gactgggaag ttgaattggc aacaccagcc aatcctcagg tccaaggatg 37980 ttgtccttgc atttcctgtc tccttcctct tgaaggactc aaattcattt cattcatctg 38040 ctttactaca aacagaaaga ctccatcttt ggttgttcag ccccaaactc tctcttgagt 38100 tccagtgcat gactctgtga gaatatacca ctgaaatatc caaaatgagc ttgatctggt 38160 tatctttcct caaaaccagc ttctcctctc tccgctctgc ttccactcaa ggtcttacca 38220 ttcgtccagg ccccaaattc aaacaccctc aatcgtttct gcttcctctt tctgccttcc 38280 agtcgggagg ttctgtttag tgctttcttt tcttttgcat ccaaattcac atctccttga 38340 ttcaaatcct tcccatacct tacctcaact gggtgatggc atcctactcc cggtctctcc 38400 tactcttgcc ggggcctaca ccattctact caaaaggtca gatcaatctt tacaaaagta 38460 aaactctaac caatccaccg gtccacttaa aatttttcag gctgggcgca gtggttcaca 38520 cctgtaatct cagcactttg ggaggtcaaa ggcaggagga tcactggcgg ccaagagttc 38580 aagaccaacc ctggtgacac agcaagaccc tatctctgca aaaaataaaa tgaaaaagtt 38640 agccaagcat agcgaacaca cacctgtggt cccagctact caggaggcct gagtagctgg 38700 gaccacaggt atgtgtgcat ctcttgagcc tgggaaattg agactacaat aagccatggt 38760 cactgcactc aagcctgggt gacacagcaa gactccatct caaaaaatat ttatgtgtat 38820 atatatattc ctcgaatgca ctcagttgca gacaccgttg actttccaac agccttcttc 38880 cttgctaaca gagcataaca ctaattaatt atgctcacgt agcaatgccc agcctcaagg 38940 gatattggat tggtctaaac tgatcaaagt aatcttcctc tttgctagtg agtagcctag 39000 ggttggtacg caacccattt ctgaccaata agataaaaga gacggtctag tggaaaagct 39060 tttccttctt gccaagagat gtacaggaag agaaagtact catttgtgac cactcccacc 39120 accatcacct tgcttcttat tttgtgtgtt ttcatgtgac gatgtgacac ccagagctac 39180 agcagccaac ttgtagccat gggaagactg ataaaactcc aaggatagca gaataaaaag 39240 aaaatcaaag aagggctctt caagacatga ttgaaccatc caaaacaacc tggcactgcc 39300 aacccaaaga cttctttgaa ggtaaacaag tgtcttttat ggtttatgcc accatttgtt 39360 gagttttctg ttctctgcag cccaaagcac tctaactgat aaacttagaa agagcaaact 39420 cttgacctta gaaggccctc tgcttgatgt gctactcaaa gtgtagtcta cagacccaca 39480 accttagcat tgcctgggag cccagccctg ggcccatgaa tcagaatctc caagggtaaa 39540 gtccaaaagc ctgtgttata acaagctccc aggtggttct tgtgcatggt aaagtttgag 39600 aaacactgcc ctacaaaatg atcacaaatt attttttacc atctcagcta ctaccgtaca 39660 tagcatgaga tgcacttgat ctgcaatttg tctggtggca gtaacctttc cgggtttgag 39720 catcatttgt tgctccttta gtttcttctc ctcttaatca aaatcttcaa acttgaagcc 39780 ttcaggtcct gagaggatta caaaggtctg aatatgagac aggctgtgaa acaggccgtg 39840 atgaactatg gggtacaggc acatctgaag gacaccgagc agatgttgcc atacaaggat 39900 attggttcag tgttgccaga tgtctaaaga aaagctggaa tccagattta tatgcaaagt 39960 tttttagata tagacaacca agcctttttt aatactctgc agattaaaca aattttcaag 40020 tggattcaca tccagctgag tttgtgacat gaagtagatt ccttgaaata tcgacacata 40080 ctttgaaaac tgtgaccacc tacatgcatt gacttcattt gaaatgacta aaattaattt 40140 tctttggcta actatatgct agtctctact gagcacaggg tcttcatcag tagcccagca 40200 tctggagtgg tcaaatagtt tgtggacctc tagttaggag cagcaggact gttttatcca 40260 ttagtcacta tacaccacac acttagaact gcaagcttct catgggccca caacaatgtt 40320 taaaatgtga gaaaaaaata aactggccac acatcaccag aaaactacaa aattacaact 40380 aatagatgtg aagctaaata tttacaaaat gtaaactaag tcaacggatc catatcaact 40440 cagatatggt atcatatcac attagattaa atgcaggatg tggatgcatt ttaatgtttg 40500 atggggcatg gaagggagct cagatcaata gtgcttagag ctgccaaggt tctaaaaagg 40560 ccctgggtac caacctgaag ccaaccattc tgtggtaagt ctggtcttca caggtgtcac 40620 aaatttcttt acgcagctct actccattct attgaactgt ctacatagtt ggacatggga 40680 gcagaactgt ccacatagtt gcatgtaaac cataaatgac ttattaaaaa gttatgtttg 40740 gatcctcatc tacatatgaa tttaagacaa gaagtacaag aatcagcaca caagcaagtt 40800 ttgagggtcc cacataatga ttttaattat tttttgttaa tttattccaa catttaaaat 40860 tcatgataat tcacataaaa acccagatta tcatcctctt gaaaaaagaa ttgtaaagta 40920 tagagatatt ggacccaaat gttggcatgg caacactcta ctaatgctga cgaaggctat 40980 ccctttaaat ggggtatgtt ctctacttgg ccgcaaaccc tgtctccatg taggctaact 41040 tgctgtccca agagacaatt gagtttatgc cccctagttt aaggctctta ggaaaacctt 41100 atttcttttt cacaatgtgg cttcaatatc ttacgtgaag acctgtcgtg ataggataca 41160 ggaatctctc aatctaagaa gagtttcaat caaattcccc ccaatatgtt ctcaatttga 41220 accatgatcc ccaagaagat tgacaaatga caaattaccc tgcagtttct tttgcccttc 41280 aagctagcca aggcagaagc ccaatcaggt ggagtcaaag cactaatata agaatgtctt 41340 aattaatcaa agtgatcaat aaataataca cataataatt agaaagcaaa gtctgggact 41400 gatagaataa aaacaacata gcactaatct aagtaagggt gagaggtcaa tagccataat 41460 tcaaaaggaa aagccctaaa aatatgcaga aatagctagt aactggagtt tagtccaagt 41520 ttgttaacaa cccactgtat gatttcacct cacacccaca ttaaacacag tatcttattt 41580 tgggatggca gaattctgac aactacaggt tgagtatccc ttatctgaaa tgcttagatc 41640 tagaagtttc agatttaggg gttctttgga ttttggaata tttgcattat acttaccagt 41700 tcagcatccc taatccaaaa atctgaaatc cgaaatgttc caatgagcat ttcctttgac 41760 tgtcacatca gtgctctaaa aagttttgga ttttggagta tgttggattt cagattagtg 41820 ctaaattata tttgctaatt gatattctgt gtattgtttt cttactggtg aaaagacaaa 41880 ttgaactcag gaaagaaaaa ttacaaatat atagtcaaag agtcaccaga tcatttgagc 41940 aacataatga gtttttattt cttaatatac agggtttaat ttgttaacca caccagaaaa 42000 agaaatgttc aaacagtcga ctttctactt gaaattaaaa tggaaattag cccttaggaa 42060 acagtgatga ctttaagttt atacatcagt ggctggttca tgaattatta actgatttta 42120 atgatcctgg ctatatttta tttgaagtta ttctcctact tgcaacgact tttgaaccca 42180 caaaactctt tcatccattc tccacagaca cagtacactt tcatgagcac tgacatttga 42240 aaaggatcca tatactcaca gaatgtaaag ataatacaca tgcatataat tgatacaaag 42300 gactctggtc atttgttaaa gagagtaatg aatgaaaccc tattattcac ggtttgtaaa 42360 taaatttaaa gataagcgct aactttcact tgttaagcct agagccaaga gttcggtgtt 42420 tcttctaaag tttcccagat ggtcattaaa acaagagagg gaagaaacat actttctttg 42480 aaatccatca tttcccatcc agaaagataa tacatgtcat caaaagttaa gtctttagag 42540 attaattaat aatgtgagta ttttcaaata aaataaatgc atgtctttat atgctagttt 42600 ttacattttc agtataaacc tatattgaac agcaccactt cagacacaca aattagctgt 42660 gaaacaaaat gctataaacc tttaattagc acttgctgct ttatacccat aaagttaata 42720 cttcctcttc tactatattc tctgtaaagg aaaattatgg gaaataaaat tgtgtttttc 42780 acttccgaaa ataaaagtag caaaatatag tattgtggct cagtttaaag atagttatat 42840 ttttacttgc aaggaagtca atacaaagat cccttacaat aagtataatt tgattcctac 42900 caatattaag cgctatgtct aactttcata acttgggtac acagagcact gatgacgatc 42960 agattgctaa ataagtaaga aagcaagtta tttcaggcaa atagctgcat taagaaaata 43020 cgacagtaag ccaacttgta tccacactcc tgaagctgaa caagcatctc aataaataat 43080 gtctgttttc aagctttata taccctccct gaaataaatg ttctgagctt aaatagactc 43140 aaaatagcct ttctcagaaa ataaaaaaga gacacacaca aaacaccccc aatttcctct 43200 ggtcccttga agtacccttg ggatcccagt gaacagagat ttgccacgca ttgcagtgac 43260 tgcatttgta caataggttt ctattttggt gtcattcgag tgttgcagat cttaaatcag 43320 agaaagaagg agttacatta ggcaaggtaa tggcttccaa aaataagagc atgcccagtt 43380 tatacaaggc ttgcatccac atgctaagtt gtaaggagat aaataatacc ccactggaac 43440 aattaggtag attctcagaa acactacata cttaattagg ctgcctaagt cccttactga 43500 gcatacatgg gggacttttt aaagcattta ataacctgag taaatccaaa atcagaggac 43560 acaaactaat ccttaactct ggctccagcg atcggccttt tcttgcctct ctataaatgc 43620 ttagcgtagc ccttagaatt cggagagcag gaacgctcca accaccaaag ggttaaagca 43680 cacggaataa agtcccctcg atctatattt tttgggaggc ccctctgtgc cagacgctga 43740 gctgggcgat gatgacacgc gagggcgagc aagagagacc ctaatggtct tttacaaact 43800 tcagcactag agttgggaac gcagtataaa caaatagaaa ggaacacgag cctccatcag 43860 ccacggggca cagcaaactg ttcctcactc tagatgcaat tcctcctctt cctgttattt 43920 attcattagt tttgtttagc acctttcttt cagcaggctc cttatttcct cctgttatcc 43980 aagcaatcac aaacaaacta cgatttgaaa gaaaaagaga gggaggaggg aggagcagga 44040 ggaaggggaa agaaaaccac attcaaaagg cacaggccat tcagagcccg gctgtttctc 44100 tgaatctcgc cctcagggtg atgttttcga caaattcggc gctgggggct tcagggagga 44160 cagaggacac cggatggtgg gggggaattc cgcgcggccc gggtaccagg gctgcgactc 44220 tcgcccgcct cgctgctccg agcgacgccc gctgcccttc tgaggtccac ctcgccacct 44280 ggaacgctcg gtcctcgaag ttggcgcagg gggaggtgga gaaggtggag tgaccccagg 44340 gtgtggtgtg gaggtctcca atcccgatct ccccgaaatg caaaacttag cccccccaaa 44400 aaaatgagag gaaagaagcc acttactcta agcggggagg ggcgggcacc ccggttccga 44460 ggtccaaagt gccctaacga aagggcagca aaggccacct gcggggtccc accacttccc 44520 cccactcccc tgtccaggca tactcaaaag tttgttcctt tccgtccgta agcggccccg 44580 aggccggctc tggagtaggt gggggaggta agaaggactg ggggtggggg agggcaagat 44640 catcggacca ggagatcagg gacccctgcg tagcccccac tcagtccagg ggggctgcga 44700 tcgtgtttac taataacagc aacaaacaat cacacgccag cccttctttc agtcctcggg 44760 ctctcttcgc tttttggggg cagcaaagga gagtctggcg gggaggtggg agggagcgga 44820 ggggctgagg agagcgccgg ctgggggaca aaaagcggcg tgggatgggg cagaaagaga 44880 agcggggaga gctggacaga gacgaaggct caaaggtaga agagacatgg gaggaaagag 44940 gccaaagaaa agtgcagcag gcggtgagcc cgagcgcggg gcgcgcccag gatggggagg 45000 tggcccccgc cccccggccc accggcccag cccggtcacc ttgctgtagc cgtagtaccc 45060 caggcactgc gcgaagtcca ggctggcagg gtccccggcc gccgcggggt agaacctcac 45120 atccatgccg aagctgggcc cggggccggg ggccgggact ggggttcgcc ggggccggga 45180 cccgcctcct cgccgccgct agatccaccg tcgagggcgc ccgggggtgg cgcgtgggac 45240 tcgcggccgg aggggcgccg ggacccagag cccgaggagc tcgggagccg cggccgccgc 45300 acacaaaggc gcggccacgc gagccgcggg agagcgggag gcggccgggg ggacgcgccc 45360 cgccggggca ccgaggcagc gctgcgcgcg ggccgggcgc cgggggcgcg gggcgcggcg 45420 ctggggcccg ggtcggcgag gcgagttcag gtgcgctggg cgaggctggg acggcggcgg 45480 cggcggcggc tggccccgct cctcctcctc ctccccgggc ggactgagga gacgagccgc 45540 ggagacaagg ggcccggccc ctcccctcct tctccccctc ctgcctcagc cgccggtccc 45600 ctccccgcgc cgccgccgct ccgcccctcc caccgcgggc agctggcgcg ccgcccgccc 45660 cgccggtgcg ctcctcggcc cggaccgcct ccgggagcgc ccaccccgcc ccgccggccc 45720 catcaccccc gccgcggccg ccccctctcc ggggcccctc ttctccctac ctcgcccccc 45780 ttcccgctcc ggtcctcttt gtccccactg cctcggagcg ctcctctctc ccctcctttc 45840 ctcggccgaa gcggacgcca gccctgcgtc ccgtgtgtcc caccctcctc ctgcgcgacc 45900 acagcttccc cgggccccag catccccaag ccgtctgctc ccttcctgtc gctttcctcc 45960 ccatgacccc cttccttctt catgggtgcc tgtccccggg cccctctcct cgaccccgcc 46020 ttgcctttcg aatgtcccct gcgtggacac acctaaccca gacgccaacc tgcacgagtg 46080 tctcccggta gccgggagcc gggaccccaa gttcacctgt aggatttccc agaaggggtg 46140 ttggggcctg acctttcaca ggtaggcaga cttgaagctt cccaggtgaa gcctcgtgtc 46200 ggttctcttc gtattctctt tgctcttgtt tgtattcgaa aggcatttga gtaactggat 46260 ctaggcagat cattcactgc tctgggagag aaaatgtccc tattttccta aaaggtccta 46320 gctgattaac ttccccactc tacactcacc cacccctctt tatttcttta tctttcttaa 46380 gctccatctt tttatttaat tttttttctc atcggcttta ttgctttgag ttaatctgag 46440 agtttggcct tcagccttgg cgaagggaag gggctttata ctaaatggga acgttgtgga 46500 gaggccgtga gatctgcgcc ctccccagtt tagttatctg ccagctactt taaccagagt 46560 ggcgacattc tgaaatattt cctatgacac tcgctaacag tttcatcccc tggtcacacc 46620 ttgctggccc agggcctgag ctttttcaga caagcatgac atgggttttc ttttcatttc 46680 ttctgttctc cagagtagat cgggcttgtg acacctgtgt gtgtaccttc actcaatatt 46740 atctttctgg aacggagcag aaaaaaataa acttcaatta ggtgaaagtt tgtgtatttg 46800 ctcttctctt agcaaaaact tgggtcagga gactactgca tgagagagca gtgtgtgttg 46860 agaaaagaaa caactgccca cgttgtccct gggttgactc tgatccccac cctcccgaaa 46920 aagctttggt ttcccctccc tagtctccat ttaacgttga caacccagcg gtgctcccta 46980 atggcccagc aggttgcaca aattgacagt gagctgagat attatcagga caacacccca 47040 ttgagcaagt tcttgaaacg cagaagtgga ggccctttct ctgggccact gggcgcctgt 47100 ggcctttcca ccaatcagag ctggaggttg cagtggccac ctgttgtctc gcaagagaac 47160 atcttttaag tttcgctatt agtatttaac aatggcctac agagcaggat ctggccacag 47220 gagaggagca gtgtgatgat ctggggtacc aaaaaagaat tttttaaaaa aaaaatttta 47280 cagatagctc ttacaaggag ccaaaactct ggaaagctaa gtttttcttt gcacactcac 47340 aatcctcacc ttctgctcat tctgttttgc atctgaagca atctgagctt gattaaagga 47400 tgaagaaaag tataatcaaa gttacagaga ctaaacctga acttgtaatc agacttcgag 47460 gatcaggaat ataaatacgc ttcgcagtgg aaacccgcta gctgcaagaa tgggaattgc 47520 aagtgggctg atgtactgca ttcagctttg ggcggtagag cctagaaaat gaagcgagaa 47580 ctttacccct aaggctctca ggagttagga atgctcggtg acaatcccta actcctggcc 47640 attgttttgg aaaagtcttt ctcttaaatt tcccttccct gttaggatgc aaataccttt 47700 gtgaagggaa caatactcat ctgtctgcat tttattattt gatttaggat ataaggtaag 47760 caaaagatct gagtttagat tttgatttag agggagggga agaatccggg tgatgagctg 47820 aagatgtgta tgttgaggca tttagaatga gaaaatcact ggaacagaaa aagggcattg 47880 gtgaaggctg ctgacttgac gatttagccc aatctccacg catttggcag ctatctttat 47940 ttattgtttt tttttttttt ttttttttga gtacctacca tgtgccagac atgattttag 48000 gcacttgtga atgagaaaga ggattcaatt cccgacatga cacatataga agtcctcaaa 48060 gaggactatg attttggctc ttggaacaca aaatacacac gaactcacat gcacacgtgt 48120 atacatgccc tgaaccatcc cagtcacctg gagatactgt catggcacag ccactagctg 48180 ctgttgagag aagcgacatg aaaaacaaac tcacatacag tgtgaaggat gccagcttct 48240 acacccccat ggtatttgta taagaaggct caagggatga ggcagtgcat cccttgctac 48300 atcattgctg gatcccaaga acctcagacc atgcttgata catagtttgt ttgcaggaaa 48360 taaatattca ttaaagaaag aaagtttaga aagaacatgg gaaggaagaa ggaaaaaaac 48420 acagaatgtt ttaatagtgt aatttatttg cagggaacct taaggcagga tttgagaaga 48480 gtatatccag gacctctgat gtgaattaga acaatctact ttgggtgggg tgggggcctt 48540 ttgcaccctg ctgttgtaga cccttcgcag acataaaaac taagatccta tgtggtttcc 48600 tttagaactg atctgattac actctccatt gctttcgcac tatcatctaa ttttaagagt 48660 tccagtggtt ttgaagacta tccattaaaa actttagaat aatgctttaa aaaattaaat 48720 gcaattgtaa ctgtcatggt atttgttatc ttaagggtgt cactattttc agtctgtcag 48780 cagtcttgtt tctgaaagcc atagacaaag gtttccttta tactggatta gccttgaatt 48840 tgaagaacct tctccaagaa catatcttaa atatgctttg aatttatgct gaacaatgct 48900 aacagttatt gatttagaag ggcagcagaa gaatcaattc tgcagccaaa atacaacttc 48960 tgggcataag aaaattcctt tagggttttg agatgattcg gatcaaaact gtccatctta 49020 ttataatgct tgatgtttct aattaaatag ttgatgtcat ccaagaatcc cttaaaaatg 49080 gggagaaaat acacaaactt tacattgtgg gaaaactacc ttacatcttg acggaacctg 49140 aaaactttct ctactttatc tggtttcaaa ttatgcaaga aagtccccat gaggacttca 49200 ttaaacctgc cagagtttta taaccaaaaa cctcactgga acccccactt ttacgaatct 49260 atgaaagtaa tttaacccct ctgtgttctg cttgcccaag atcagatgca aatactatta 49320 aacagtatat acagtttaat tctcttgagt tttggtgatg aaaaatccta tccaaatatt 49380 atgatccttg caatacgtaa tgtaaccaaa ttaacgatag ctccaggtgg aaattaacaa 49440 ggccagggct actcacgttt cctctcatct attcccatag taacagctaa tgtattatat 49500 tgctaaaata tcttatattc agttttatgt ctgaacttgg tgttgtgtca taaagcgtag 49560 cattcctatc cagactggat tcttaatatg tgtatcctca tgaaatttag gagagtttcg 49620 tgtctgcaaa tcaacacttc atgtgcatag tctaaaccac atgcagataa aagcaagtca 49680 gaacctacca agactctcac catagtgaac ctacacatgg tatagaggaa gaattcttac 49740 ctgggagacc tgatgacaca ttaccagtgc aggacctaaa gcgaatcacc atagagagat 49800 ccacacagga attatagtgt gaaaaaaaat ccccaatcat agacattgtt agcttcagtt 49860 ttcagtgaat ctaaactctt ctagtatgaa aatgtgagct attttgatat ttttactttg 49920 gtcaaaaaaa cacagaaatc caaaaaatac agaaatctgg gaaatgggat aaaaataagc 49980 aaacttttcc ttcatgataa taaatatata ttcagttgtg tacatgaggt tgtttcccat 50040 actactacaa ttttagtcct attggtctct gtattaccag gcacaagaag ggctctagaa 50100 aactaatcat tttgtcagtt gactattact tttacaaaga atagataaca cccataggtt 50160 ctgacagata catagtaatt atggaacagt cacctccaac accctggtag caaaaaacta 50220 ttaagccaag aattcattac cacaaatatg gaatgcagca agtatttgct tgtgacctaa 50280 gtagctcttc aataaagata ttttagaaac caaaacactc cacacaatca ggaggtgtgc 50340 aattttcact gtatttacac tctgccttaa aaaaaaattt gtatgttgtc ctgcctgttt 50400 tctgaaatat attctatttc ttttaaagtg aaagaatgac ctcttttgca ggaacgattt 50460 tcagagacag cgtgtttatc aaatggtttc tctgctttca taaaaacaat ttattttcac 50520 tgaactcttc acgataagca tcaaagccag gaagaatgta caatgaagtt tacaatttca 50580 ctccagaaac aaatactggg tagttattat tttgcttaag tgaaaaacat tttttttccc 50640 caaggagaca aaggtagtaa tgggggaggg ggtttataca ggagtgaaaa tcaggaagtc 50700 cagacagtct tcagcaggag gggcccctgg tgttgtccac aaagaccacc ggctgaacaa 50760 tgaaagctga agacccagta ctttcttcgc aaatgggtgg gggtcagtcc acagttttat 50820 tcttcgctaa gagacagcta tagaggcatt aaggagagaa aatcattagg cagatataat 50880 taaacccttc tatgacagat ctatatacca ttgcacatag atatctctca tagttggtgc 50940 tttggatgac aatcctttct ttgataaaca tccatgtttc taggcttaat ttatatgaca 51000 tgttattttt taataaccat agaacaataa aattgtaaaa ataaccaaga aaagaactga 51060 gtctaataaa gattctgttt cttaagaaat gggaaacaat tgcatttgat cacagaacag 51120 ccaaggacta gcagcaaaat aatctctcct aatttacata gatctgtgcg tgccaaacag 51180 atgagtgttt gcttttcgag taatagtgca ggtgcgtatc ctgcagtgac taaatctcta 51240 actcatcaaa ctgtttcgcc agaatgggac atgccctctt tttctggaac agtttcaagt 51300 tttctcccca gcattccagc cacctgttta tggagttcat cctcgggaga agatgcatgc 51360 aattagaaac aagaaaatga aaataaatga ccttgtttgt tatttataac aaagaaactc 51420 tgcaaaatta atgctgtgaa gcttgacctc ctgacccagg aaaaagagcc acctcatggc 51480 tttgtggcca atggacaata gtctggcagc tcccattgtc cagccaccct gacttttgga 51540 tggtcattaa agccacatat ccaaaatatt aaatgtttta caagttagat tagaggattt 51600 gcacttttta aaatgcgtgt tttaaaaact gaggttagtt agcacaagag attttctttt 51660 taaggacagc aggtaaaaat catttagctt catctactcc atctatcctg tgtcaacaac 51720 atgttgaagg aaaggaaaag atttaaaaat tctgaactag tgctttggga attgaagaat 51780 ggttaaatat ataatagaaa tcaaatagaa aggtggtctt tgaaagtggt tcagggaaaa 51840 cattgtgttt cctccctgct gaggcctcag ggaggaaagg gggaattaca atgttctgtt 51900 acataaatgc agtgtggatg gtgcccccta gagttgtgcg atgaaatagc attgctgttt 51960 ttccttccac ctcttatccc aacccacaca tctagaagcc cagggcagga aggaaatgaa 52020 ggtggtaatg gagttttgaa gactcttcag aactggtgct tgggtggaac atcttgaggt 52080 aggatggcga ctgaaaatga cactctctgg tgtggctgat tctgaagctg gcctctccta 52140 ctgcatcttg cctctttccc catttggtct cctccttcat tcacccacaa caaattccat 52200 gagtgtcctc tattagtcta aaccttagag taaaatccgt gtttgatttt tttccatcca 52260 agttgcttat ttattggcca atctgcccag tgctactaca tctttaattg ttttattttt 52320 ccccaggagg aagtaactgt ttattcaaga aggttctcta ctgttcctca aaatgtcttc 52380 ttcactgtga aataaagtca gtttcataag gcatgcagat tgtcatgcaa acaccaccct 52440 gagcattcta gatcatacct cctcaccttc ccttttcttt ctgatcccct gagggtagct 52500 cattatatgc ccctccctac cccttcttgg gaatgctgca gccataaatc tggagaggtc 52560 attagaatta cgaactctgg ttggtgtctc acatacctac aacagcaaca acaacaacac 52620 aattatagcc actgtagagc caatgtcctg gttaatgttt gtgtaactgg ccaattctca 52680 ggcccagaga aaggagttta agaaagtttt tgcatctcac cagtctaaaa cttcttctgc 52740 agtccaaaac cacatttcaa ctattgttta actgaaagac tgagccctct taatctggaa 52800 ccaccaacta aattccccct gtgtgcttaa acaccaagtt agagagctgt gttcagtgcc 52860 agtgagaaaa agtagagtgt gattacccca tcttacccac agctgaaacc tgtgtcattt 52920 atttttcaac aaatgctgac tgtgcctttc taactatatg ctcctacgtt tccagaaatg 52980 ggaaaaagca tgatccctgt ttatactaaa catgacaaga catgaggaaa gtagtataat 53040 aatgaaatat tgtaatgagt gccataggaa aagcattctt aggctagtgt agtcaacaaa 53100 catttattta cagaaattgt tacaggtaat atgttagtgt gctgcttaga aaaggcgggg 53160 atcatttatg atcaggataa tcagaggaaa cttcatggag aaggcatttg aaagtagata 53220 gcattttggt gaggcaaaag ggatgaaaaa atacactagt ggagggagat tttgaacaca 53280 gttattagag agaaaatatt ccatgtgtgg tgggaatttt gggttgcatc agccatttgt 53340 tgggtagatt aagcttcagt aacaaataac ctttaatatc ttagtgggtt accagcacag 53400 aggactattt ctcagccccg ttccagtcca ccacccatca gctgctgttc atttgcacat 53460 cttcatctca ggaccaaagc tgaaaaagaa gcttctatct ggggcatgtg ggtcttgtag 53520 cagaggaaaa agagagagtg gaaacccgct acagttgtca aagctgctca cctcattccc 53580 gctcactttt cactgggcaa agcaaatcag atggccaagc cccatgtcaa tggggcagaa 53640 agtatgatcc tcccggaggg actggtctgg caaagagtaa ggaggagtcc cctattttgc 53700 aataatgtag tcggtgccat ggaaagagtg ttttagagac ctaccaaaag tttcaggcag 53760 caagcaaaat tgtttagtaa aaggagtgag tgagtgttga ggggaagagt ttggtgagat 53820 aagatgccgg gaagtgatag ggggaaggag acaggctggg aagtgaaaca ttataaagta 53880 ttgaaggctg ggcagctgag ttagattcga tgcaaaagga tgtatgatgg catgaaaaaa 53940 cgcagctgtg agttctgatc taaagtttgt tttgacccat atagagcaga ctcatttaac 54000 atttaattag tttatactgt gtgtcagttg tggtggcagg tagacatttg catagatcta 54060 tattttaaat tttgatcctc atgacacctc tctgggttag ataagtatta ttctctttgt 54120 taagctgaag gaggctcacc aaggttgaat gacttgctta aggacacaaa agcagcacac 54180 agaactgtga tgcaaagtga ggtctttcta ctgcatcact gcagggcaaa gaaattaaaa 54240 tgtcaccttt ctttagtatt gacttgttat tctttatctt ctccttaaat acacagtctg 54300 aaagcaaggt taatatgatg ctttttctca tattaattaa aatgatgttt atataactaa 54360 tccttgcata gtacaacttc ataagtgaat aaaaaagaga cagatcttta actgaggtat 54420 ttattataaa atttcgtggc agagacagtt acttctaacc aaatacagaa tgctctccac 54480 tatgtatttc ccagtttttc ctgctgttag gtgaggagca gctgaggcaa taaagaattg 54540 gtgtgcttcc tccatatctt tcttgacctg ctgtggtgtc cttggaagac acatgcacca 54600 gatggaagaa gacaattcat gcctcagaat tcacatgagc gaaaccatgt cttgatggta 54660 ttgcactaca agatatccag tgtctatttg ttacagcagc atagcccaac ctatcctgat 54720 taatacagat ccttctgact ttaattgata caaggaaagt gaccatatct gtcttgcaca 54780 tcctcttatc cctactgctg aatacaggac ctcccacata atatatgctc aataaagttt 54840 gattagtgga aaatgaatga atctcaaatt gagtctggcc tctgtctact atttggttaa 54900 accacttatt tactgctttt agaaaccagt ggttgatcaa tctttttgat atatcatttc 54960 atcagatcac tcctcagatt aagactttat tatatattta atcaatttta aactccttcc 55020 tttgacattc aaggtcccca taatctcacc tagattccta caactttacc aatttattgc 55080 tctaatccaa tctaacctat cactactggc ctgtgacccc tggtcactat attcactgtt 55140 ctagggacaa acatttagtg ttcttaagca aatcatttca agtctctgag cctcagtttc 55200 tcattctgta aagttgttat ttgtagcaaa agacataatg catacaaaag tttaagttat 55260 gcagcattat gaaaatccaa atttattttg tacttgttgt tggtatatat taaataaatt 55320 gatagatcag aggagtgaca ttaaaaaatg tgttgccatt tcagtagcac atttgtcaaa 55380 atctcccatg acaatcttgc atggaattgc tgtctaggga gaaatggtaa aggaaaccag 55440 ggagaccctg ttggttatct actccaaatt cattccctct tttttttctt aactctacct 55500 ctattttatt taagttctgc ccttctcctt gggaccatat ttatctaggg aggatccttt 55560 acaatggccc tattttcact gccaatgatt actgtagtca tgaactctga tgcgtttctg 55620 gttgataagt tgtggaaaag agtgtaagag ggcttctaag aagggtttct gtgcttttaa 55680 aaagaaacac tcagaaaata tataataatt tcttcttctg gacagtgtca tgtctcgaaa 55740 tgttgcagcc agctcatcag catgaaagga tctctagccc gaggtcagag ctgacacgct 55800 gagatgagaa tggaggggca gaaacacgga aagaacatag atccttgatg atgtcaggag 55860 tcactgatta actaaccctg gagctccttc tgtcctgatt tctagttatg tgaaataact 55920 cataatctta tcttttgatc taattgagtc ctagttttct gttacgtgca atggaaagca 55980 gtgaaaccct cttagactga gtccattagg gtacccgtaa caaaatacta taggctgggt 56040 ggctttcata acagaaattc atattctcat ggttatgaag gctggaagtc ccagatcaag 56100 gtgcagcagg tttagattct cttgaagcct ctctccttgg cttgcggatg gccaccttct 56160 tgctgtgtcc tcacatggcc ctccctctgt gagtgcacat ctctggtgtc tcttcctctc 56220 tcataaagtc acaaggcaga tttgattagg gcccacccta agggcctcat tttaacctaa 56280 ccacctcttt aaaggctctg tctccaaata cagtcacatt ctgaggtact gggggttaga 56340 gctttgaaat atgaattttt tttttctttt attttttttt tgagatggag tctcactctg 56400 tcgcctaggc tggagtccag cagtgtgatc ttggctcact gcaacctccg cctcctgtgt 56460 ttaagtgatt ctcctgcctc agcctcccga gtagctggga ttacaggcac atgccaccac 56520 acccggctaa tttttgtatt tttagtagag atgggtttca ccatgttggt caggctggtc 56580 tcgaactctt gacctcaagt gatccgccca cctcggcctc ccaaagtgct gggattacag 56640 gcgtgagcca ccgcacctgg cccaaatatg aattttgtgg gggacacagt tcagcctata 56700 acatttgctc aagccaaaaa aaggagttta aaatttcaga aaaaagcctc acagactcca 56760 agtgcacttt atcaaagtca gacatccaga gaactgggaa gccaataggc agctaatctc 56820 ttcatgtttt tccctcttca tggcttcaat tttacatttc tctcagcatg catgctttgg 56880 ttttttcttt ctcctcaccc ttctgcttat acaaagctca tcatgagtgc ccgatgatgg 56940 gcttcagccc ctaagtcaca tgacccttat gtttggctac ccctagctag caaactcagg 57000 ctccatgcct ctttgtgaaa ttcttgagat agagaatctg attggcccag tttgtatcaa 57060 gtgtttatcc ttgatccaat aggctgtggc caggggcatg ggtcaggcgg tacacaaggg 57120 ctgcctcttg tgatctgtgg ctaagttagc tcacccagag gacttgaatg ggaataaatt 57180 ccttagcagc tctagtggaa gagggtaatg tggataaaat tatagtgtag tcaagtggat 57240 ttgaagcaga tgaaacagtc atacacaaag gtgttgattc attactgaca ggctgtaaga 57300 agtctttagt aaagtcccac tttatcttgc cctcggttct gatttttttt ttaatgttcc 57360 caatatttta ataaacagat taggacatag aaaatatacc tacgaatttt tagttgacaa 57420 aatgatggaa acatttgtta agatagttag aaatgagatt cagactcaaa atcatcttaa 57480 agggctagaa atctgtgtag aatcaataag ataaaaatta gctcacataa atattaactt 57540 ccaaatttgg atttcagtgc tcacttgcaa agtgatggaa tggagttttc aaaatgaact 57600 cttaaataaa ttatagcact ctgtggatat gtgtctctct ttccaagaag gaagtccttt 57660 ttaattagtc gcatgctaaa gttagtttgg ctaagtaaat gttttcctag ggttgggaga 57720 tttctataat ttcagtttcc cttttgtttg cagatcaagt agtttaaatg acccagtaaa 57780 taatttggag tcaccacagt taactcacca accttgaaaa tccctgaacc aagaggcccc 57840 ttgatactgt aagggagggc taccataatt aatagcataa gtctaaccag ggtaccatac 57900 ctttccctat attgctggat attctgtaag tttggctttc ccaaattagg acacagagat 57960 aaggataaac tcactttcca gctatttcgt tatgcctttt ttatttcttt caacttttgg 58020 aaatgacctt atgaatttcc tcttattatg aaatatatct ttattgaaaa ctggagtcca 58080 aacattacaa aaaatacata gcataggaag tgaaatgaaa tactgcataa ccaatgtaaa 58140 tgattaggtg actcctcttt cagattacat tcctgagcat tttctaacaa attatcaata 58200 tttttatttt aatgaatata gaatcacacc ctacttattc ttttgtaatt tgcttttccc 58260 atgtaataat atggcctgca ggctgtaatg atagacttgt tttttgcaga acaatccatt 58320 agccaagggc aactagaaaa gccagacaaa atattcgatt gatttggttt gaaggcgtga 58380 gagagctacc atgtctgcaa ggacttgagg ggctaagatt tttgagaaaa gggaagtaca 58440 aggagtgtgc tcgacattca gtctgctttc ttctcaaggt ctttagctga ttcacaagta 58500 gtggctgaga gcagagaagc tgagctaagc ttctggtagt cttatcatac tgaagggaaa 58560 aattagaatt cagagcccta aaaggaaaag agtccgtgat aagcatccca aggtttttgt 58620 tgacgtccac caagggctat accctagaac ataggagtga accagaaata gaccaaccct 58680 cacaaagaac aaagtctagc tttgattaaa cattatccgt gattggatta ggtgatctgc 58740 ctctatgcta acagtttact aaaaataaaa atgaatcttc cttgaaagaa aataaaatta 58800 ccaagaggct caaattatct taatcttata tacacatctg gcatctaatt tcaaactacc 58860 agtcatttaa ggagacaaga ccacatgact gaagaaatag atgagagggg cggaccctaa 58920 gagtgtcggg atattggagt tgctagacat tgactttaaa ataactgtga ttacatggtc 58980 attctccact cacattactc aagagatact tagtacatgg acttagcaca tgagctgtgt 59040 atgtaatagt ccctcaacaa atatttaatg atatgaactg ataatccaaa ataatggtac 59100 taatatattt gcaattttaa cctaagtaat atatgggcaa ttggggtttc tgaacaccct 59160 attaagtctt actgtctgag ggctccatta aatcacctca ggttccttga gatgatttaa 59220 tggagcccac agacactaaa ttacatggag aaagtcactc ttttctattt tttttaagag 59280 aaggttctca ctctgttgtc caggctgtag tgcagtagtg caatcatagc tcactgcagc 59340 ctcaaactcc tgggctcaag tgatcctcct gcctcagcct cttgagtagc tgggactaca 59400 ggcatgcatc atcatatcta actaagtttc taacaaaaat tttgtaaaga cagggtctca 59460 ctatgttgcc caagctagtc ttaaactcct ggcctcaagt gatcctctta cctcccaaag 59520 tgctagaatt ataggtgtga gatacctggc cccttttctg tttcctttta gtccttctga 59580 ttatgccata gagggagtct cagcttggtg ctgacgtgtc ttttatacca tcctaatgct 59640 atttgatttt tttttttttt aacagagaaa gatctcaagc ttctcagtca atgtcttggt 59700 atctctactc tggtgttctt aaggaaaatg ctatgggctc ctttggacat ctggtaaagt 59760 ctatgaaccc tatatcaaaa taatgcttgt aaattcttac aataaaatac ctagtattac 59820 aaagtaaaga atatgttgaa atacagttcc atccaccatc cttttgccac tacagtttgt 59880 gattgttgta tttattttca tggttacttt ctacttatgg aaagtgcaat tggtttctgt 59940 ttatagtcat gacatacaat ttgcatttta aatacatttg tttaaattaa agagggaaga 60000 tgaattaagg aaataagtaa aagtaggaaa tatgacaaag ctaaaagtgg tgtgctgtga 60060 ttgagtgacg aatgcagact taacccaaga gatgacttta ttaatgggaa tttcaggcac 60120 cctttcacat tggggactgt actaaaccag gcttgacaca agcctcactt gtccatcagt 60180 caatgtccat tgattgagca gccccaccaa gtaccagaca ctgttccagg tgtgagggca 60240 gggcattgag caaggcaatt tattctcaag gtgtttacat tgtagggaaa ggatatagac 60300 aagaggcagg ccaaaacatt caattaaaag gtaacttcag atactgattt ttgtcctgaa 60360 gggcaaaagg gtgactagca gggtgactag agagggagtg acttggggta ggtgtaggac 60420 agtagcagtg gggtttgtgg cttggcccag ggctgcatta gaaaaagacc aggctcccac 60480 tgcagcagtg cccggaaaaa tgcagagacg agccaggatt tctggatcat taccatgagg 60540 aagggaataa atgtgtgttc tctttcagtt gctcctcttg acacctgggt aaatggctgt 60600 ttacacaggc agatcaccca gccgctccct caaaggtaaa cagctgcttt ctgcctcccc 60660 tgctagcaca gattggggcc ctgaaacagt gtgtacccag gcaaaagagg aggtattctc 60720 catttaggtt tccattcatt cattcaggca agatttcttg agtgcctcct aaaatgcagg 60780 caccaaggta ggtactggga acacagtaag gaacaataaa gaggtccctc ctcccccacc 60840 tctctctcct ctccacttag aatccaagct agaggtgtgc ctcagagtct caggccactc 60900 ctctcatgat acagatggaa atatcagaat cagaagaggc aaagtgactt gcccaagacc 60960 cggagctagc ccacttcaag caagtcaggt ctcaaaacgg tgccagctgc tttcattgcc 61020 tactacctga cttgctcaat cttggtcagt atttggattg gcacttttta gtgtattctc 61080 cattactaga ctattatggc ttagggaagg agaaaccaga ggtccatcct acaagcacac 61140 tgaaatgtaa tccaattcta agtccccgta ttacaacatg gactattgtg actgaccaca 61200 tttgccttat atttaccttc ttccgcaggg atatgcccga tttcagtttc ccatgttgaa 61260 atagcctaca gttgagacaa acatacatta catttaagca taccttccat tttttataag 61320 gtactatatt tttaattgtt tcaatcactg tgaaattaac aaatgttcat gagcacccac 61380 tgtgggagct cacagtgtgg gagttccgcc ctggtggagg tactgggatt taatgataaa 61440 ccaaagacaa atatatgctc aatctggtct ctgccctcat atctagtctg ggaggtaagc 61500 atttgtcaaa taatcgcaca tatatgattg tgtatgtatg tataaaacta aacgctgtca 61560 gttgtttaat ttaaaaaggt caaaaagaag tttgctttga agaatgagat caaggaataa 61620 aaattagtca gttaaaaaaa attacatata taaacataaa tttaccacca taatagatac 61680 ttgttttagt gcaggtcctc cgtgatgcac actaagacag gaataaacag gtaagggatt 61740 tattggggaa aatgcctgtg agtgaaaatt ggaggtcaag cacgatggct catgcatata 61800 atcccagcac tttgggaggc cgaggtaggt aggctgcttg agcccaggag ttcaaaatga 61860 gcctgggaaa cacagcaaaa ccccatctct acaaaaaaac atacaaaaat tagccagcta 61920 tggtgccgca tgcctgtcat cccacctact gggaggctga ggtgggagaa tcacttgagc 61980 cagggagttc caggctacag tgagtcttga tcacgccact gtgctccagc ctgggcaaca 62040 gaccgagacc gtgtctcaaa aaaataaata aataaaataa aataaatgaa aagaaaaagt 62100 aaaagaaaat ggtgggggag gctggagaag gccaggaaag ccatcagact gggaagtagt 62160 tctgtgaaga ggagagagga ggatggatgg tcttagattc agtgtcatcc taaggaagtt 62220 ctggcaaggc cacatttgcc catcagaaga gtcccccttt ctcaaggatg gaactggctt 62280 agttttcctg ctgggcttag ctacaagctg ggaacagcca ttgggaagtg tggtctctgc 62340 agacatgtgg tgatggattt ggagtacagc agctggggct gtccatcagt aagggatcta 62400 agaattacat gctcatggcc actgcaatgc taaaatagag caaaacacaa taaaaacaag 62460 ataaattaga gggacatgat ctggtctggg acaaggaaga ttgtttcaga aaatagtctc 62520 tgtcttacat tcacaaggga aaagagcaat gttccagaaa gagtggcgag tgcaaaggcc 62580 ctgtggcaga aggcagcatg ggatgttcaa gaaactgaaa gaaggccaga gcagcctaat 62640 ggaaataata taggagagag tggaatggga ggctgagagg tgagcattgc tggggacccc 62700 tacaaggcct ttaaggagag gacattgttt taaacacaca tctaaaactc actacttaca 62760 tgacagacat agggcagagg gtggagtact aggcgtgtgc ctgggtttcc aggtggctga 62820 actgtagcat gactggcggg actgaaggag tggagaggct aaggtcttga tgtcacctac 62880 ttttgttagg attagaacag gggtcacaaa ctgttggacc ccatggcaaa tgtaattttc 62940 tttttcaatt ttttattttt tgagacagtc tcactctgtc acacaggcta gagtgcagtg 63000 gcatgatctc agctcgcggc agcctcaaac tccctggctc aagccatgct cccccacctc 63060 agcctcctga gtagctggga ctacaggcac atgccactcc acccggctaa ttttttttct 63120 ttttcttttt tgtagagatg gggtctcacc ttgttgttca ggttgatctc gaattcttgg 63180 gctcaagcag tcctcccatc taggcttccc aaaatgctgg gattacagac atgagccact 63240 gcacccagcc acaaagataa cctaaagatg tgtttacttt gacccaggca gtagtttaaa 63300 aaagttttaa tttgttgttc acatttaaaa actggacaat ttctacataa aaatctgaat 63360 tactcatgtc tcttaaaaaa ataacatcta gcaatggtag gcccacattc cttcctgaaa 63420 ataattagct gggaaagagt agggactgac ccctttagac acggtataaa tagcatggga 63480 gttgatcagt aaatatttgc tgaatgaaag aatacatgaa tgaaaagtca gagccctata 63540 ggtcagcatg gacggcggta aaggaacctg gctgagcctg aaagagaatg tgatctaaga 63600 ttaaatccag gatatgctgg taaatgttta acagccaact ctttggggag gaaaaaagtc 63660 ccaatttgta gtgtttgccg attattgtga tgtaaatact cccatcatga ccaatttcaa 63720 gctaccaaca tgctgacact gaacttggag ttggaaggag atgaacaggc ataatcaggt 63780 ctcgtgagat ggcccaagcc ggccccagca ctccactgtt atatatgagg ctagaattac 63840 tacataactg gaatagcaac tttctggacc atatgcctgg aacacagcag gtgctgaata 63900 aatgtttgtt gatccaggaa ctgactgtgt tgaagcccac agatgggaaa tcagtagaag 63960 gcaggtaaga gtaaaaagaa gggcagagaa ttgggggtac agacccctga accataagtc 64020 agaggaatgt tgtacatgtt ttcagatccc tcactggtca aatgaaggca aagggttaga 64080 tctctccaaa tctttagagg gacatgatgt aactccatta agtaactcag tgattttcaa 64140 cattaaaaag tgtaattatc ttttcaaact aaatattaca aataaattct gataaaagga 64200 aatgtacgtc tgttgagacc cctgatccta taactggttt agtattccct gaagccactt 64260 gtagtagcct attcacatgg ggactcccca gtgaacattt cctcatatcc acactcttgt 64320 gaaggtcctt caccttgaat ctggactggg cctatggcct gatttgatgc atagaatgca 64380 cagatgagaa taggtgggtt tctggcataa gctcaaagaa ggcacagtgg cttccagagc 64440 cctgagctac tagtaagaaa gtccagctac cctgctggga aggccatgga gagaggccat 64500 ggggagctca tagagaaaga gagggaccct gagactacat ggagctagga agaacaacac 64560 ccagccatcc cagtgtccca gctgagcccc actccaaacc catctgccaa ctgagcacat 64620 ctacaagagt aaccactgac aggccagcac aagcccagcc aagtccagtt caaattgcag 64680 attgtaagca aataaagcag ttgatgtttt aaggttttta gatgatctta gagtttagat 64740 tatgttaagt atgtgagatc cctaaatagc catcaataaa aaaattgatc agtacaatgg 64800 agaactgcac aactattaaa agaagaaggc aaatccatgt ttaccgacat gaaagaaaat 64860 caccaagatt taccctaaca tgacaaagca agattcagaa gaatctgtag ggtatagtac 64920 gggatttgcc attgcatgaa aaagggaagg taagtatttg tgcatgcgtg catgtgcatt 64980 tgtgtgtgtg tgtgtgtgtg tgtgactata aatttgtaaa tgcatagaag atttctggaa 65040 agatacataa gacattagaa cagactggaa gacttgaaga agaggggaga ttgtgtatcc 65100 ttttgtacat attttcattg tgtatccttt tgtacatatt tttaccttat ttgcaggtat 65160 cacttattca aatcatagaa ataacatttt aacaaaaaag tgaggcctgc ttatataatg 65220 ttgaagacaa ctagctacca cactatggga acacactatt atattaaact tgatgattcg 65280 agttttgcct aaattttact cagaatcgaa tacaagaata gaggaaagaa tttaaaaccc 65340 atctggctaa tgcataccct tgccaactat tctattagaa aggaagatgg cagtggggag 65400 ggggttctta caatggaaaa ggtattggct tccctagtgc ctgaggtcgg gttctccaag 65460 aagcaaattc agagtgaagg attttaatga gagtaatcta tgtgggaagt ggtcccaaga 65520 agcaccaaaa cagaagtggg gaaaggacac agagaaggaa aggaagtcac tgaagggact 65580 gtgagttacc tttgtgggca actggggttt cgtcccactg gggacctctg ggagacactg 65640 taggacatgt ttcagggtgt cccatcctaa gtgggaggaa tctggagaat ttatactctg 65700 ctcccagggg catcaattct ccagtgtttc cagtcagctc tgcttgctgg ctgagatacc 65760 agagcaagtg ctggtctggg gaagttgtca gcgtgtagag gaggtgagta ctgagcagat 65820 acaggcaggg cactgtcagt gcatttgctt acctagacag caaagccaga gacaaaagct 65880 cgtgtgctta tgtggcagga gagagagagc gaaccatgca gggaagtgca ttactttatg 65940 attttttttt tttttgagat ggagttttgc tcttgttgac caggctggag tgcagtggtg 66000 ctatatcagt tcactgcaac gtctccctcc cagtttcaag caattctcct gccctcagcc 66060 tcccaggtag ctgggattac aggcgctcat caccaagcct ggctattttt tttttttttg 66120 tattttttag tggagatgga gttttgccat gttggccagg ctggtctcaa actcctgacc 66180 tcaggtgatc cacctgcctc agcctcccaa agtgctggga ttacaggcgt gagccaccgt 66240 gcccagccaa caagttgatt ttttagtttt atcagatgtt ttctaggaga ccataggaag 66300 ctactttgtc tacacattac gcctctgtaa aagaggaagg aagaaatttc caggggactt 66360 cggctcctct gcacttctgc attgtccatg taaaggtgct tattgagtat ggattgtggt 66420 gtcttgcacc ttggtggcag caggaaagtc ccggggcagg aagtgagtgg tacataatgc 66480 aggagagggg agaggaggtg cctgataacc ctgagagtct gggagctgct gccccagtga 66540 gctcctccat ctgtaacact ggcggaaact gtagtaagca ggctttacaa cagtgggaaa 66600 catgcatgcc gatgtcaggg cctcccatcc aaaagcaagg ccaggatgga tccagggtgg 66660 tgaataaatg aaacctaatc cagaacctaa caaaggagac tgcgccaagg ctaagaggag 66720 tgccctgaca gttcacagca tcttagagca cattgcacca cattatgcta tttcaccaag 66780 gagaaaattc ataaacattt ttaaaagtag attctcaaga ctagacatta ttttaatatt 66840 gcttattgat gattataagg taaagaatgt tggtgagcag gtagaaaaga aaggtaatta 66900 ctaggaccta attctggttc tccagaaata gatcatagtg taccaacaaa tttccatttt 66960 tgatagaatt actttgctga tatacattga tctaagcatt gcttctggcc atgtcactga 67020 taatattttt ctggacaaca tgccaaaaca caggtggaat gactgtacag tcaaaaatat 67080 tttttgacta tacagcagat ttcaatcaac tatactcagc tctctagaga tatgccacag 67140 gtgcttgttt ttactcttgt gtttattgta ttcgatattc tttcctcaat gatttggaag 67200 aagatgtagc aggcatactc accacattta tggaaggaat cattggcatg tttgatggca 67260 gaatcaggat tcaaattgta ctgacaggtc aggatgttag gtcaacacca accatatgca 67320 atttaagagt aatagaatct gtatttaaca ttaaaaagtc agttgtgttg gcacaggatt 67380 ggggagttgg attgacagca attgagttgg aaaagacctg tgggttttaa ttaacccaaa 67440 gttcaataag atccaacaat gaaacagctt attttttaaa gcaattttag gctgcagtaa 67500 taaaagcctt attctcagct gaagagcagt gatgatccta atagattctg tgaggctaca 67560 tctggagtat tgtgtactca gttctgggtg aaagagtgag caattacata caggagggat 67620 ttcaaatgca tgtcacacaa ggactggtta tcagcaccgg ggataaatgc gaacaaaatg 67680 ataatatttt acaggaataa tagtgacctc catctatttg atgagtattc aggtgtaaaa 67740 gggagtaaac ctattctttt tgctctatgc tttagtcagc tatggtcaca ttaataccat 67800 gttggcttgt aataacatct atttatctct tatgcattca cagataagct ggagtttgtc 67860 tgatctaatg taggcttggc tgggcttggc tccaggccat gattgtggtt caggtttgct 67920 gcatgtgttt ctttttcttt gggaatcagt aggtgcccct gggaatattt ttcttacagt 67980 gatagaagag gcacacgagg gtgcatgcat taaaagcctc tgctgatatc atgtctgcca 68040 atatccattg cccaagttaa gccatcccaa atttaagggg cttcagccac tgtgaggcca 68100 tgggaaggga actgcatgta ttcctattat ggagtagtgg aacaaataat ttaatttatt 68160 ccactccaga ctagcaggtc aaaatgaggg tcagtggtct gaagctatag gaagatagat 68220 tttggtaata aaaaactgga tgatcgttgg aactgtccaa agatggatgc aaacaactga 68280 agtctttgtc ccagaaggga ttagacagag ttcaatgggt catttcccaa gagcatccca 68340 gatggaattc cggtgtcatt tggaaagtta gagactgagc cagttagtat ctttcctact 68400 ccaacatcct caaattccat agtcctgttc tatcccatac tcttcctctt gactctgaca 68460 tcctgaggct tttactctct gtgccattcc ttggggaacc taattatata tggcttcttt 68520 gtgtctctaa gagattccat gagtatttct tgtcttccta attgctttgg aagcatttca 68580 gtgtgcaggc tgagtcttaa gtttctctta aattgcctat agctattagc tcagtgtcag 68640 gcaccaagcc cttagcatgg cattaaatca tcacccaaca cccagtgcag cctcaaacca 68700 tctttgcagc ctctctccta cctttcccat cttattatcc agccgaattg agatacctgt 68760 ccttcccgat acacagcccc tgcttttcaa gtctttgctc acttatagac cattatcctc 68820 ccttgtctag accccatcca tcccactcag tgcaaaccaa gtgctacctt ttccaagatg 68880 ttttcactga tgctccaacc aaaaagaagt ttctctacct cttctgggtg gtcttaacac 68940 ttctcatggt attcgagatg tttgtggtat agaaaagtga ttctccactc taactatcca 69000 tgatgacttg agaatactta aatcatacac gcccaggtcc catcccaaga tagtctcata 69060 ttattgatct ggaaacagaa actccaagta atagcagtgt cagcaataaa gcaggaactc 69120 acatagcaaa gtgtatggaa ataagttatt ccagggttgg tatggcagtt taatgatgcc 69180 accaagaacc taggctcttt cttcctgatc tgccattccc aatatatcag caatgtcttt 69240 cctcatggtt gcaaaacagc tgctatggct ccaagcatca catcctcaca ccagcatacc 69300 aggaaggaac aaagcaagca taggaaaagt gttcttctca catatctctc ttgctcgaga 69360 aagagaacca agaagtttcc tgcaaggaac aaagcaagca taggaaaagt gttcttctca 69420 catatctctc ttgctcgaga aagagaacca ggaagtttcc tgcagacatt tcctcacacc 69480 tcattggctg gaactgggtc acatgcacat ccttgaacta tcattggcaa agggaaatgg 69540 gtcatcaaaa ttgcttaagg ccaagcagga gccattgttg gggttaaact gtcctgaaca 69600 aaatctaggc tctgaatgat aggcaagaaa gaagagggga tggccacaac ttcctttaca 69660 cggtgaataa caagagcagc ttaagtaagt agatgcccct atggggcagt aatcttgctg 69720 tgggcagaaa catgtccatg cacacagaag ctttaggaat cttcagagag gttccatagt 69780 cacttgtgaa ccactgaagc ctctttctcc aagccattgt cttgaatgct gtttttaact 69840 gattacaatg catgcagctc ccgtgcccca cttattttag cttttgagga tgttcatttc 69900 cccggaatct ccaaatataa atcaggtttt cacagaaaac cacagagccc tcacaggtgt 69960 ggaaatcatc taaagatatg ctaatgattt gggtttctag aaaaatgtat atctatgaag 70020 gaggcaggga ttaagcacag ctagtatgta tgattttttc ttttcctttc atcacctgta 70080 ataaggcagg atggagactg aatgtatcag acaaaacagg gatcaaatac tagtttcaac 70140 atttgctgcc tgtttgacct tgggcaaatt ctttaacctc tctgagcctt ggtgccttgt 70200 tctcctcatg cataaaatga accctcctgc agggatgata tgtagaccaa cactgataat 70260 aatgacagta ataccagtta ccctgtcatg ggtgtccatt ccatgacagg cctgactcta 70320 ggcattttat acacattctc ttcttttttt tttttttgag acatggtctt gctttgttgc 70380 ttaggctgga gtggagtggt gcaattgcag ctcactgtag cctcaaactc ctgggctcaa 70440 gtgatcctac catctcagcc tcctgtctga atagctggga ctacaaattt cagctaattt 70500 tttttttcat ttttttgtag aggctgaggt tttgctatat tgcccaggct ggttctcaaa 70560 cttctagcct caagtgatcc tcctgctttg gcctcccaaa ttacaggcat gagccactgc 70620 acctggccac gtcatcgtca caaaaaatgc aatgagttag gggcttgtgt tgctcccaac 70680 gtttagagta ttgaagggac cagcccaaag tcacaaagct aatgggcaag ggttgaatcc 70740 atatgtctga ctccaaagcc agttctgcag catattaatt gcatatttct tggtttcttt 70800 ttttttcctc caattatttg gtgctatgcc aaaatcatca gaattgttcc tgtaggcatt 70860 ccttttctta attacatatt gcattgttct ctttctcact ttcccttgtt tgatccaagg 70920 taaattttta gtctttttaa aaatgctcat acattataaa tccttgctaa tatacagttc 70980 tttcagactg tcctgccttg cttgaggaag cagatgtggg tcagggagaa agaaggaccg 71040 atgaactcaa atagcctttt cacttttatt ctctcttttc acttcaaaat gctgtgtcat 71100 cagtgaatcc cctcctcata atctcttctt tcctggagaa taccagccta gtttcacttc 71160 ccttgtaaaa tatccacaga tctttgtgcc ccaatcactt tggctgtatt gcactgggcc 71220 ttgctaatgg cacaatatcc ttttcataat aaggtatccc acatgacaca gtagactttt 71280 gtacctggcc agaatcacta cattcatcgc agataccatg tgctgtctat tggataccct 71340 cattttctct tttcaggaag ggctggtgtc agctttcctc ctgcctctta tgaaccagga 71400 aatttttctc cctgtatctt ggggctgctg ttttccagcc tctgccaagt ttccattttt 71460 gtgggacatc agttgaccgg catacccgta ccctggacgg ggacttgggt taactgaggg 71520 ttggcattct ccccaaagcc tgttctgcat atatttttga aaacctattg gttttctgcc 71580 taccttcttt cctccatgag tagacttcaa tgaacacatc actctctttc ttcggtaatt 71640 acctggtctc acctgctcat cataaaagag ctattcttat tgttagggct gacagattca 71700 ctttgcaggt gatttaatct gcatctgtag tgtccacaga acatattcta gaagttaaaa 71760 gtacataata taatgaaaac cctgatgcaa cttttgcttg aaatatgagt atagcaaaga 71820 catttgagag aagagcctga aaataggtta atagtagttt aattgtatct aataagagct 71880 accattgatt aagcctataa taatactagt aactccccta aatatgctct acacattact 71940 tcatttaatc tacataataa cactcagagg aatgtattac catcccagat ttacagagta 72000 aatgtattac catcccagat tcacagagaa aattaaggct aagaatgtta ggtaattggc 72060 cgagtagcct gcagctagta agtatcagag aacggatttg aacccaggcc ttggctggtt 72120 tccaagtcca caagcttagc tgctgctacc cagcttcact gatttttgtt ccgtgcactg 72180 cctctaggat gtttccgtat ttgccttctg gttaatattt actccctcct ccctagcaca 72240 ccacattaag ggtgtggcat gggcttttca cttcctgaat gtttgttact cagtttcaac 72300 cagctttact ctctttcaaa gtgacataaa agtgacagcc ctttaagctc acagaaaaac 72360 aggagctgat tccagtacgc gattgactac catgcaagat tttgtctttc cttttatatt 72420 gttgaagatt ccttgatggc aacatggccc acacattatc taacctccag acaatcccag 72480 aggatctgca ggaaaccacc aagcacccca gaggggtcac tggcaacaaa tggattaagg 72540 aaatggcctg atttatggga ttattggggg tcggggtgga gaattataga caattttgtt 72600 tctactgcag aatcagcatg atagagtgaa tatggacttt ggagtcaggc ccaggcctgt 72660 aggatgacct gggaagcagt ctaggcagct ttggcccact tcagcttgta agatagagat 72720 aatacatcat cctagaaata tcgcatggat tatcagattt tgtatataaa gtccccagca 72780 gacacctggc acacagtaag tgctcccaaa accaaagcaa cagttcttag aagcttagct 72840 tggctcaggc tgaagtctca aatgatctag ggttcactct ccagccattt ctaagccatt 72900 gagtgaaact ggacatgtta gttctggtgt tgacttcagt atcctaagtt gggaaataga 72960 actcatcatt ccactcctcc ttttaagtat tttgataaga ataaccgaga agtccatgta 73020 gcattttgaa aatataaaat actattagat tggttttgtt ttgttttcat aggaaagaga 73080 aaggaagaag gaagggagag gagaaaaaga gaaaagaatt caggactgat attttcaaat 73140 ttccaaagtg agcaagattg gtgtttggta ctctttgatc tctccttttc ttaaaaaaaa 73200 gggggatgag tgtgttagag tcctacccca tctagaatta gagagagagg gaaacagaga 73260 ggtaaaaata tccttcctat tatccctcaa attttgccac agagaaaaca actcactctg 73320 cttttgtatc aatgacctta ctgcctcagt gtcctcatct gtcgaaatgt gtttaggaat 73380 agttgccctg cacacctgtc caaggtgtta gaagagccag atagataaga caatggggaa 73440 acttattttg aaaatcaagt agtattaaaa tcaaggtgga gagaaggaac accaggccaa 73500 gagtgagcaa atctgcattt gaacctgggc ttggatgatc agcagctttg tgactttggg 73560 caagtcattt cacctctcca cactgcaggt tcctcatctt gcaatgtgga aagcagaacc 73620 tctccgggtt ggaggatcct gtgggatccc acgtgagtca gcaccttgaa attgcacata 73680 cagggcacat catttctacc atcacctaag gtcaatccca ggttattgct ggccttttgg 73740 tttgctatgt tttccacctt tctcacaaat taaaaatgca gacatgtaaa ttctctatct 73800 atgtgcactt caggaacttt caagatccct ttagggttat atctttcctt agcctcttgc 73860 aaacctgaaa gcaaggtgac tgtaggacaa actgtgtggg cactggatgg ggaatgcatg 73920 cctctggtag aaggggaagc cagaattcag agccaaagaa caggcaccat gcaggactat 73980 gagtccagga tgtccaaatc tgacttctaa aggaatgcca gtgatactga ttgtttttaa 74040 tataaaatct accatttaca aaatacaggc tcaagaacaa ttgtaaacac tgcacagggc 74100 aagttttatt gtttttctta aaagagctga aaaccataat caagtgcatc tgccctttgt 74160 tgtagattgg ggcctgcaat ctagggagta gagaaaggct gcctgactgg ttagcaattg 74220 aaacacagag ctggggccat ctagtccgaa tgcagtgttc atcgttcttt gctaaacaca 74280 aggtgaccgt ggttgttgtg gttagcaagg tcacctagct tcctaggcag accttattcc 74340 accacaatgg gcttcctttg ctagaaagga catggaaaaa ggagtgacaa aagaggagaa 74400 agagctagtg aaggaaagag aggaagagag aggaaggtcc ccagttgtta ttacctaggg 74460 agtgcccagc atgcctttca gaggaacaca ggtgcctacc cctttctcct gcctgctaca 74520 gcccaccacc accaataaca actgtgcacc ctcactgttg cccccatgca tggagcagag 74580 atagagcaca gatagggaga aaagaatttt caagggtgag ttggaatagt gacttctgca 74640 agcctggtag gtttgtctct tttccggtat ccttgccact gcaccaggtg aaggggaagc 74700 agactgtaaa atactttgaa tattatcaag gttatttggg gaaaaaaaac agcaacgacc 74760 tcacctgatt gtgccaggtt tgtgatagga atctgggggg aagttgtcct caatgacctc 74820 catttcttga atgacccgtg gcccacctgc tacctctgag atgagtcagg ggacacaact 74880 ttcttgattt ccatcatcat ttgcctgcta ctgctgcaga gactcaagtg gaaaatgtca 74940 cttcttgaag tcatggcttt ggtgtctggt gacagggagt agatagagtt tggacagagc 75000 cacttgtgag ctgcgtggtt taatctctct gaacttcagt gtctctagct ctaaaatggg 75060 ggtagcagcc tcaatgagca aattaaagca aaataacaaa tgtaaagcac ttatcccaag 75120 acaaggcaca tgagaagtat tcaacaaagg acagctctag ttatggtggt gatggtctct 75180 aaagcttcca gactcagatt cctaaccaga cagccatgag acatggtccc cacagtggca 75240 aaagggtagg ctccaggctg cctaagttta aatatcctga ctctaccact tcagcaaggt 75300 actaaactct gtgcttcttg cctcatctgt aagatggaga tacctcattg ggctgttggg 75360 aagattgaca ggggtcaccc ttataatgtg ctcagcacaa tgcttggacc aggatggatg 75420 ctgcttgggt gatgttatca tccaggtggg cactgtggaa cacagactga tacttaagtt 75480 cagcacttgc ctcatggagc ttacagtcca gatagaatag gtgcacatga gatttttctc 75540 agcaaagttg tagtcagtgc tgcccgtgcc acccatctgg tctcagcatt gctgctcatg 75600 tgcactgtcg tgacccatct ttctgctgct gaccttaaga aaccttgcct taaggtatgc 75660 tttggggaaa ccaaattatg acagatataa actgaagtgc caagacgaat ctttcaaagt 75720 gctgtgatgt ccagatacgt ggcaagtgcc aggaatttgt gtttgggccc actgggagag 75780 aggtcctttt ccccggcttc ccgcagtgga aagctgctgt atgtctgata cctgtgctcc 75840 aaatctaccc tcgagttctt atttggcaac aggcttgctt agcaatgtcc ctggggtcag 75900 ggagccacgg gtgggctgat gcaagaaact gcagttgtgt ctctaggctg cgacagcatc 75960 acagctgtga gcttctcaat ttaaactcaa catctgggca caagaggaag caccctccat 76020 ccaggcaagt tgaagttttc tttcctgtat ctttaacaga ggttaaaatg taaacacaaa 76080 acaaagcaaa acccaactta actctctggg tcctgtttct gttaaaaaca ttttttaaaa 76140 aataataata attagaacaa tagacccagc tgagagaagt ctgtctcata ataacaagag 76200 agactaaaac acgctctccc acaaacagat aaggaaatag tgagctaaaa agtaaaactt 76260 aagagtgcta cttctcaact cagtaattga ttcatgaata agctctagcc caattttcta 76320 tgaaaaataa caacatagag aaaagaaaag ccactcagat gcagctatgt cacccaagtg 76380 ttcactggag aaatttaata tgtgtcagag aaaaatctgc cttctccaaa acattgcccc 76440 ctccaaaaaa aatgcttctc gttgtgggat tttttcctcc acactgacag agagtttgaa 76500 agtaaagcag ccgactagag tgtgggtgcc cacgccttag aacaaagaga ttaaagaata 76560 ggcttttctt caaataaatt cgattttttt gcaacaaatt cagggcctgg acagtttaat 76620 gaagaataaa aaatgctcag acccctctct ttcagctttt ccaaacaaac acagtcattt 76680 ccaaccactc acaggtgttt ttcttcccaa aacaaacaca gaaacaaata tttacagagt 76740 tatgaaaatt caatagaagt cacaggggca caaatttcct cacctgcatc caagatctct 76800 ggcctgggat tatcaaacag aacgtcacac ctactttcca ttacgggaca ggaaatcttt 76860 gagccaaaga gaatcagtct gcagaatgtg ttcgtaagga taaaggcctc atcttttcaa 76920 gaaagtgttt gcagctccaa ggaagaatgg actttggaca aaggaaacac cagtgacttt 76980 ttcctcatct gcccatacgt gcagaaatgc ccttgaagag ctcatgactg ccttgcgaat 77040 taatccctat gttgaccaac aacacaaaga gtggtgctga ctaccacact gaccaccagg 77100 aataatttcc tacttaggtg tttgcgggaa aggctgttgt ttgcttttct caaatgtccc 77160 ggatgtgaac aggtctcaaa attaggaaat gcagctggga atggctgcta tcaacaaccc 77220 ttatttcatc ttttttcttt cttcaataga gctagagaag caggcaagaa aagaaaataa 77280 tgcaattatg aaaggaggga ggaaagacag agggaaggca gcggggcaga agggaagcgg 77340 aaaaaagatg ggagagaaag gaagaaaggg agggcagaat ggggacaaaa gatggcaggg 77400 agggagcgag ggaggaagga gcagaaagga gagggaagaa gaaaggaagg aaggagagag 77460 gcagagagag agacaaaaag aaagaatgag agagaaacct gctgttgtca gaacctgact 77520 ggtttacgct gaggaaccag atagcctctc agtgaaaagc tgagattaag ctcacaacat 77580 aatttccatt atgttaatgt tgctttaaaa tatattgcac agagtgctgc aacaatcaaa 77640 ttatcaatta taatgtctac tcagagtaga aaagtgttgc aaacagaggg ctgattactg 77700 cttcagtaca tccaatctgc atactcattg ttcagtacag ggaaaacaaa ttatcttgtg 77760 ttggccccag ttcaaattta attaaatgag tgcaaagcaa ttataataaa gtacaatagt 77820 gtagtaatga aaggaaaata actcattaac ctattaatct ttatttatgt tcctctcaaa 77880 taactatgta atttctttat caccgcatcc cataagaaaa agtagggtct cgctgctcat 77940 ggcctggttt aacaggttct atttggttaa gatgcctttg tgggcaccat ttatactcac 78000 tttgcttagc tttggggcca cgcacccccc agctgtctgt catgctccct gcccacacgt 78060 atgcgtacct gatctagatt tagcgctcct ctcccacttt tccctgacac ttgtcagtta 78120 cagaaggtaa atctctctgg aagtgagaag tgcttaccac agcatatggg aaagaggcat 78180 cttccagcat ctggtatgta aggcaatgca aaaaagggga gaggacagaa tcacttctgg 78240 tttagagaga gcccagtgct tgacagctga agagattcca ctaaaagcta acactccact 78300 gtgctttcca gttaataaag ctttttacat gtatgatttc actgaggcct cctgataaca 78360 ctgtgagggt gcctgatgta cagatgagga aacagaatga tggagtagaa aagtatggtg 78420 tccaagcctt gctactcatg agtagcagat ccaggattct aatttaggtc tacagcccct 78480 aaatcttcat ttcattcccc tagaaccttg ctactcaaag tgtggtccag ggaccaggag 78540 cattggcgcc acctggaagc tcattggaat cttgggcctc accctagacc tgcagaataa 78600 gactccacat tttataagat cctctagtga ttctcacaca ctgaagttta agaagcactg 78660 gaactattgg atagtacact gccttttgag agaatggtga ctcaggcaaa tctcccagca 78720 actacttggt taagcatttc cttgcaattt gcaacacctt gagatgacct tgagatgatc 78780 ttgggtgatc aaggttgatt ctggcttcca ttttcatgtt atctgaagac agggctggaa 78840 gtagaggaca tagtaaaagc agaaatgatt tctctttctg gatccacagc agacccgaaa 78900 atcttcccct ttttcttcca aagagaattt gtgaaataga gagaaaggag aggggagaaa 78960 ctgatgaatt aaggaaggaa acagacactc gttaagtttc taccctgttc ttggaggttt 79020 tccatgtatt ccttcattta atcttcacaa caagcacctt tttaagataa ggtgactgac 79080 gacaggttta agtgatatgc ccaaggtcac ccacactgct gggtaacaga aatggtattt 79140 ggcttggatt caaagtttac actttcactg tactctattt tctcttaaaa aaaaaaaagg 79200 aaaagggaag gaaatcaaga tgaaataaaa gggtggtgtg gtagtcatta gtgctgttca 79260 ccaagaatct ccagttttta gtctctgagg tatgtgaagg attatacttc ctgccctgct 79320 tagaagtagg tgggagccat gtaaataggt ttggccaatg aattggcagc agcggtttca 79380 tgtttcattt tcagatcaaa tatttaattg cttgtggaca ccttacagag ctatctctct 79440 ttcctctgcc atgaaaattg ccaatattca agatggtggt tgcatcataa acctgtatcc 79500 atagtgagtg aatatgctca ccagagaccc ccaccaacct atgatagaca cataatgaga 79560 gtgataaaag caataaacct ttgtgttatt ttgagcccct gaagtgtgat ggttgcttgc 79620 tactgtagca tcactgagcc catccccact cttccagatg ctaggaagac gtgtgaaggg 79680 aaacagttaa catttctaca ctgcaacttt ttcacttgag actcacagca ttcctatgag 79740 aaaggtaagg aatggctatt atttattatg tatttataaa ttactattta cagataattt 79800 aacactgaca tagcagttta agtgtcctgc ccaagatcac aaagtttata agtggaaggg 79860 ctaggtttgg agcacaaggc ttgtaatgac tgatctttct tcaatgcaga acacttcctc 79920 caaaaaagga ctggagcacc attacctgcc cttgggtata ctcagattgg tatatctagc 79980 tttgtactca cactcctctt cccccaccac tcaggaggaa tccaagttat tgggcaaaaa 80040 tcaggccaag gaaaaacaag tacatgcagt tgccagcaga tgacgacatt gggtctttgc 80100 tagagaaacc accagagaaa gttcacagtg ataaccctca atgaagtcaa ctgtaaggag 80160 cttcattgtc cagtttgagt gttttttgtt ttttgtttga gaaagggtct tactgcatcg 80220 cccaggctgg agtgcagtgg cacaatcact gctcattgca gcctcaacat cctgggctca 80280 agcgatcctc ctacctcagc ctcccaagta gttagaacca caggtgcgtg ctaccccacc 80340 cagcaaattt aatttttttt tttttttttt tagagacagg gtctccctat gttgctcaat 80400 ctcgtctcta actcctggga tcaagcgatc ttcctacgtt ggcctcccaa agtgctggga 80460 ttataggtgt gagccaccat gcctggcctg tgttcatctt tcatgtgatt gtttttgcaa 80520 gatagaaagg caaaagttag tagtagcagg attgaccttt gtaatatgat cttaaaaata 80580 ttgtctccta atttgcatat ggaagaatct caactaaata acctcctttt aaccagttca 80640 ctaaacaaac caaagttctc cctttttcct ataaaacatg cttctaatgc aggttagagg 80700 ctcttggcaa gtaggctact gtccagcatg tccaaggtcc tgctctccca tctttgagtg 80760 ctatgtttac taagagtcta ttaggttcat tcccaggctt gtttatgctc actgtatttc 80820 ttattgtcat tatgtacctt aatgtaatgt gagtcagaaa aaaacatatt tctgtgaaga 80880 ctggatagaa cgctttggaa agatttgata aaagcaagtt actaaaaaga gtgttggcag 80940 acctgtaaca aaaaattgac aaaagttatg gtctatgtgg aacctgccct cagaatgttc 81000 ttttagtttc ccaaggcttc acattctgtg ttaaagaaac aaactgaaat tcatggacaa 81060 tgcattgcga gtgtgattta tacaagaaag gcaatctaga cgtcttagca atggaatgta 81120 accatgtttt ttaaaagcct aagtcatata tcaaatgatt gtcaaaacga taacccaaaa 81180 caatgtatag gttttgtgtt aaaataaaat gaaatattta aagtatggat cgtttttaat 81240 catttctgaa ttcaagccct acctatttgt cccaattgct tctgatataa ggactttcac 81300 ataattactt ttcctgtttg ccattttccc atttcccctt ccacagacat actgtgctac 81360 ctttaagtgc gaggtctttc acatatcttt ttttatccaa ttacctcatt caacaatatt 81420 tattttaaaa aattttttaa agagatggga tctgcctatg ttgcccaggt tggtctcaaa 81480 ctcctgggtt caagcagtcc tcccaccttg gcctcccaaa gtgctgggtt acaggcatga 81540 gccaacacat ctggccctct acaaatattt cctggacaat tactatgtgc caagcactgg 81600 cctgggtcct gggcatagac caacgaactg tagagccaac agtagagaaa acagacttta 81660 aataatgaga gaatcatcat ttaataataa ctgtggtgtg cgttatggag aaattcagag 81720 ttcactctgt ttttatataa ctcagacctg ggatggattt cctacttctg aatggtaaag 81780 taagtgtctg agtagatgag ccaccagcct tcttccttgt attctatttt taatgcagtt 81840 tctttgggcc aaatgatcac cgtcatcctt accagctcca gactgtgatt ccatagtggc 81900 tggattgcct tggagcttag agcaggttat ttcagtttac tccatggata ttctctccac 81960 tcttctccac ttcatgatgg ttaatattga gtgtcaactt gattggattg aaggatgcaa 82020 attattgttc ctgggagtgt ctatgaaggt gttgccaaag gagattaaca tttgagtcag 82080 tggactgggg aaggcagact caccctcaat ctgggtgggc acaatttaat cagctgccag 82140 cgtaaccaca ataaaagcag gcaaagaacg tgaaaagact agactcgttt agtcttctgg 82200 cctacatctt tctcctgtgc tggatgcttc ctgccctcaa acatcagact ccaagttctt 82260 caattctggc ttccctgatc ctcagcttgc agacggccta ttgtgggacc tcatcctgtg 82320 accgtgagtc aacgctcgtt aataaactcc cttttatata tacatctatc ctattaattc 82380 catccctcta gagaacccta agatatctct attctgttcc ccaagaggtg gacctttatg 82440 gacccaatca actgcctccc tcaccctgtg cctccaggtg gcttggaaag caggaggcga 82500 tgaaggctgt gggttttgtt ctctatctat ctatctgcag aattgtcaag tgttggcagc 82560 ctctctcttg gcaaagccac cacccttgtc aagcagcact ctctttatag ctactctcta 82620 ggtcagggat tgtcaaacaa ggcccagact aaggggtggc aagcaaagtg ccttggaagc 82680 caaggttacc ctcggagtta tgcaaatgca gggcctgaga gtccattctt tcttaaattt 82740 tgcaccctgg acacctcact tgccttaccc ttgtcccggc cttgatgaaa acttcctttg 82800 taaaggacta gagaataaat attttaggct ttgtaggaca cacagtttct gatgcaagta 82860 ttcaattctg cttttgaaat gtgagggcag tcatagacaa tatgtaaaca aatgggcaca 82920 gctgtgtttc aataaaactt tattttcaga aacaggtaca gggccaggtt tgatccatgg 82980 gccatggttt gccaacacct gctctaagtg atacagttcc ccatggttgc ttactctggg 83040 acagcacggt cccttgtggt ttcctttaat cctgctcaca tctttgcaaa aagccccttt 83100 actaagctcc cctcgaatta tccaaattga gtgtgccatc tgtttcttgc taggacccta 83160 attgatgcac ttggctttgc atttctccaa cacaggcttt aattgcaaag taacaacaac 83220 aaaaaaaaca agaaaatgga gactacaacc aattactctg tagcagggaa gtggtggtgt 83280 ttacatgtat tcatccattc ccaaatatga tagaatattt cacaaagttg cagtacactc 83340 ttaaagttga tgggagctga aataaataag cctttttttt tcccctgggg cctgcactct 83400 caaccctgct gccctacttg tcctcttcta atggaatgga ggtctattct aattaaacaa 83460 gaaaacacat cttttcacaa agggagaacg gaggacattg tactctgttc ctcaaagaaa 83520 gcatgcttta ataagaatcc ttttataatc cctgctttta tttgtagctt cccaaagctt 83580 ttgctggtaa taaaaggatt gtaaagttga caaatataag cagggacaaa gaagtttggg 83640 gagataatgc tctagtgaat gggctagtat ttgaaagttt attgatcctg caacacctag 83700 aagatgatca cgaagagcca atgctgccat caatcagggt gatatttcta ttacaaagta 83760 aaagcccttc caggcagggc tatccatttc tcatatcatg taagaattat gctttgtgct 83820 gagaaaaata attcaggcca aaatgcaggg cttggcatct gaagatctgg attcaaatct 83880 ggcttcatag aacttctaac ctacttcttt atcatatgga agcagcaaat agagctgtaa 83940 caaatgcaat gtgttctgtt gtggggttgc agacatctgc tgtcattcca ccactatgac 84000 tatcacaagt agcatccatt actcctggaa aaagccaccc attttcactg aggttccctc 84060 actctcacac ttaaagcctc acactttcca cttctggtgg agctccatct ctgtggcaag 84120 ggtggaacat gtgaccaagc ctagaccaat taatatactg tataccttgg gcagagagat 84180 ttgtttaatt ataggcaaat gatccagtta cagccaatga gactttctag gaaagtgatt 84240 agacaggctg tcctttctca ctaggcttga atgtgagggc tggaactgct gcagccattg 84300 tggatatatg gggagcctga ggctgaagtc aacagagtag aaggatgaca ttgttcaagc 84360 cccacataga gccatgccta aagctggtat tggttgggag aaaatataga caagttttca 84420 caatttcctt tatctaaacc ctttgtaatg tgactttgca gattctccca ttgagaacat 84480 taagagatgg aaactacttc ctactccttg aatatggact gctcttgtag cttgctttga 84540 cccatgcatt ccagtggaag tgatggtgtg cacttttgct gtcagaatcc tgcaccatgc 84600 agaaaagcct aggtgaacct gctggaggat gagagacaat gtggatgaga gccaaggcat 84660 cccagccaac agccagaagt agtgttgcct agctgaccca cagctaactg cagatcaata 84720 agggagccca gttcagacca gaagaaacat ccaactgagc ccagcttaaa ttgctgactt 84780 gcagattttc tgcgaaataa acagttgttt taagctactg tatgttgagg tgatttatta 84840 ttcatcaata actgatacac atcccatccc tgaatttttc atttatatga accgataatt 84900 ttatttttga tgtagtcagt taggaatggg ttttctgtga cttgaaataa aacaattctt 84960 aacacattaa agatgtgtct ttatttcccc cactagatag catcattagg gattctgtct 85020 tatccttatc caaagcactt gccctatctg gatccaaagc tgagtgactg atcaataact 85080 acttagtgat tgactatgtc atattgacag attcacaaat cacattttga agagcaaaga 85140 atatatttgc tcttgagtct ccaatgtcat ctgtagggca attgtacttt atttggctta 85200 gagcctcaac agaaatttgg aagatacaag gtgcttctcc aaccatcaca atagctgaaa 85260 acaaatacat ctgagacatt gtatctaagg aacccaactc tgccatctcc ctcaagggaa 85320 cccagaaaaa tctgggcttt aatcctaccc tccttgctat aaaaacctga aatgatgtca 85380 tctttttctt tctaaaataa aataaaggca tgtagtgctt ctaggcaaga ggtctagatg 85440 tatctgcctt tcctgtcctc caggacacca tccacttatt gctacaactt gctgcattat 85500 tcctgcaatt tattttcttc tttttgcaca aaaaaaaaag gaagaaaaaa ctaaagcagg 85560 gattccatag aattcatcct ctactttagt aaaaaggtag aatccacctg acctattctg 85620 tatgtcagag tggaatccag cagccatttc tctccaatta ttgaaaaatt gtgtgtgtgt 85680 gtgtgtgcgt gtgtgcgtgt gtgtgtgtgt gtagagagag agagaaaaaa aaggtagata 85740 tacaccagca tttttattct taaataagag gataatcagg cttactccca cccaagtgag 85800 tttacacttt aaattcttaa atggctggtt tttttttccc tcagatctgc agacgaaggt 85860 ccaaaggaag aagattttgt tgaagactga aaagagaaat atacttggtg gacagagata 85920 actcctttca gcacagaggt caggtaaggg aatcacagac tgacatttac ccttctctct 85980 gaactctccc aggcctcaac agctcctaat ctttcctttc ttcattctcc ctcctcctca 86040 ttcacatctc tttccccaag aagactcaag aaaaagtcca agataagaaa ttccatttat 86100 aagaaaagga aggcacaggt taatttggtt tatctcctcc aacctcaaca atggatgtga 86160 gttctgacaa ttgcttgtgg ccagaaccaa tcaaactttc cttcctcatt agatgacaag 86220 gctgcagcat gaagaagatg ccatattgtg gaattgggtg tcaaggagaa gacattcgaa 86280 ggtgcatgaa cagagtgaag gtggtgcaag caagtgcaga ggaggtgggg agactggagt 86340 gctgggaaaa gggtcagcag aagctagcaa acatgaaaga cacaacacaa aacaagcagt 86400 tgtgcaaatt aggatgataa ggggggagtg gtcaaaggtg tgtttctcat ggctcaacca 86460 gtgcaaactc agtcttatga ccctacatga ctgactgcac ctggcctctg catcccttca 86520 gcctcttccc caaaaggact cctccttatt gccagccaca caagccttcc ttcatttcct 86580 ctaacaggcc agacttgttc ctggctcccg gtcttggcat tcactgtttt ttctgccata 86640 gctggctcct tcccaaacat ggaatctcag cccaaacaat atctcctctg agacaccagc 86700 cttgatcacc tttatacaat acagatctgc tcctgcccat cactttctat ctcatgaccc 86760 tacaatgtgc cccttcgtga tagctcacac cagctaaaac catcttgttt gtggattgct 86820 cacttgcccc ctgcctgtct ctagctctag gaggtcggct ccctgtcact gtctggtcta 86880 ctgtgtcgta ccacccatgc ccagcaccta gccttgcaca ttataggact taatgcaaac 86940 ttcttgactg aaagaaaaat gaagaaactc agccttggga gagaaaacaa ccattaaatg 87000 attatttaat aaaatagagt attaatctat tttatattaa ttattaattt agttcataaa 87060 atattaattg tctttacaac gaatgtgtcc ttagtcattg gtgtttgtgc tttgtgaatc 87120 ttcacatccc atggggccag taatgggggt gggggtgtag tgtgggaagt ggggcaggga 87180 accaatctgg cctgcagggg ttacctgccc catgggtgcc tgcaggcttc atgtggtttc 87240 agtggcatgg caccctgatg ggaagagtgg ctcagaattg gtggagtatg gtgataataa 87300 aaagcaaaac aacttttagt tgattattgt tttttaattc tataccgact atggcccctt 87360 cactacctgc accctgtgag gagagttttc ccacatctgt cccactccca ccctcacact 87420 ccactggttt tttccccctt cttgagtgaa cacacgcact ggaagagcag gtgtccttga 87480 agggaggacc agctccatga caggacacat gtcctcccaa acacaaacat acgcaaacac 87540 agaacaaatt agaatctatc ctggctcctg agaacacttg ctctcaggcc actaaagcac 87600 cttgataata aattgtcctg tgcctgctac ctctgtctcc acctgctcct ggcagaaatc 87660 tcttccctca ttccagccac tctctggagg gcaggcaggg ttctgtttat ccatgtccac 87720 aggccatgcc aaccaatggc tcatggcttc cccacttcca ggaaagccac atggcccagg 87780 atacaataga gtagggaatg agtaggagga gaactggtct ctttatccca gcaatatgga 87840 ccttgtgatg gaaagagacc taaagacagt cacatttact tctcatctct acccgggccc 87900 tttcacacct aacagagtat ggcaattggt acatggatag cactgagctg agtgacccat 87960 cattacttcc tgccatcgga cacttatgtt ccatcccagt agggttccct agtcacaatg 88020 aagatccagt ctctatgcta cctccatctg atttcttcct tgatctctac tccttttatc 88080 ccactaacaa attttgtatt attacttttc atttattcaa aagtatacat ttgtttgtgc 88140 acaaaaaaat acaatttctt tttttgtatg gttcagattt aaatcccaca tacatgatat 88200 atgcaagcaa gttgctttgc tggggagatt tgtgaaattt cctcacactc atgttgtaag 88260 ctactttgtg gtcctcatct cttttcacat ggacagcact cttacagaaa ttaagaactt 88320 tatttttttg tagaaaacca gatgtaagcc cattgaaagg agaaaccttg gctatctttg 88380 tcattataat aaatctagta tgaaattgtt ggttagaaaa tattaaatga aaggaagaca 88440 gagaaggagg gaagaggaag gtaagaaggg aggagggagc tagagaaaag ggggcgggag 88500 ggagaaaaga aattaagttg tcctgaaact caactgctag gacagttact gtgagtaaag 88560 aggaaataac agtttataga aaaatatgtt tcttattttg aaaaaaaaaa gtttggaata 88620 aaacaaaaaa tacaaagacc cctatttttt agaattatga ggagttggag gagtcactta 88680 aatgtttgtt aaacatcact acttctacct ataaagggga aaatacttat aaagggaaaa 88740 ttttaactag agtgatattt gggacttaaa atgtctggta ccaattttat ccatttctca 88800 tcccagagca ggaagtttgc attgtttatg actgaatatt caagtatctt tcccccacta 88860 ggatttactg taggttcgtg gtagtgacag gggatttaaa tgaaaatttt taggtctcgg 88920 tcagtaaaac gacctgtgtc agcctagaga aagaggaaga gaggagacag ggttgaccca 88980 gcgctggacg agtctgaaga tgtgcatggg gagaaaataa ttgagctcat gtgacccaaa 89040 gtcaagtgta ctctgggttt aggtctcagc tgcagtattt atcggactgt gaggatcatt 89100 tcagctccct gagcctcagt ttactactca tctacagaat ggaattaata acattaaatg 89160 agatgatgca tcactagaca tttagctcag atcatggcat gtattacata tgccacaact 89220 gttagctagt gttatgataa tctttgttat tattatggtc aagatgccta ctgcaagact 89280 aaatatatat caaatgtttt ctgttgagca tacaacttga gcatattttc caacttacct 89340 tacagttcca tgtacccacg tggctggatt ctgaacaatg accacttcca gaccggactt 89400 acaaaatctc tctccacact ctctcatttc cctcatcttc cgagaagatc caatggagga 89460 cttcaaagtc ctagaagatg gcaaagcgac aagacagaaa gaatgtcatc catgaatgac 89520 cacgtggagc agagctccca ctccctgccc tgctgtccca cattgcacaa gaatgtgaca 89580 tagaaacaca atttcatttc tcttatgtca cggaaatttg aggactcttc cttatagttg 89640 ctagtattaa ttaccctagc taatgccaag gaagaccaaa aagtctttcc aatgctttgt 89700 aaggactaac cagaagacac acataaacac agctttgctc aaattcattt ttgtcacaaa 89760 tcacttcttc agggcctcag aatgtgaatt ccagctgctc tgtcaaccaa tgtctagaaa 89820 catttttgct gttgagtgca aagtcttcat tcatgagggt gctctccaaa cgcattcatt 89880 ccatggtgtt catttcttgg tatagaagca tatgaggaac agcacactcc ctggatctat 89940 atactacatt acctgtatta ataagaatgc taggctgtac ccattcatta tctaccagcc 90000 cgccagacaa aatgattcac cctagactta caggttgaag tcaattgagt atcctttgaa 90060 ctggagggag aggcgcttcc ataaagtggt gagagcttta tggcagaaag ttctattaat 90120 gaccccactt cagtgcttat caggagcagg ccatataatc ccttcccgga attacatgct 90180 ggtcggttca gataaataac ccagatctct gtcatttata atccaaaacg ttaacaatta 90240 atttccaaaa tcaatcctga agggggctag aagcctaaat cgctaggtcc aggcagaccc 90300 cactccatga atttctcatg agtcaaaatt taagcctcga aacttgtaac taactgttgt 90360 caagacacag ctgacttagg caatcaagac aacagtattc agcagtaacc tgggtgaaac 90420 atactctaag tgtgaattaa taagtcggct gacaccaggc cccagatgtt tcccactctg 90480 gcaatatgcc tgaagtgatg ataagcagat ttacatactt aactaatatg tttatttaaa 90540 agaaatttcc aaatccaaaa taacatccag atttcttatt tggctgcaga tcaaaagaca 90600 tcctatcaat aaagacagaa tccaggataa accttttcaa catctgctta aaaccaaaca 90660 acagatttga gagttttggt aaaacttaat tgcagacaaa tttcactgcc tcttacataa 90720 atatatattt tcatgtccct ggggtggttc tgacctcatc aattttcgtg ttcacaatac 90780 acaacattgt tcttttacca gcaccaacaa ttctgccttt atggagaatt cccatcccaa 90840 ggttttcttt cagactgaag gataaacaga ctttctctct ggccaggaaa agtcgaacaa 90900 aagtcagggg catgtgctaa cacttggaat gttgtagaaa agaaaaatcg acccctctac 90960 cagtaagatc tttgtttttc tataaatatt agaaagcatt tatttggtct ccatctccga 91020 taaatctgga aggagaatag aaaagtagag atgctccttg agtattacat tttttttttt 91080 tcttttcggt ggtgttgatt ccccaaggga gagcttagta actggatcaa agtcttaaca 91140 gatctgtgtg cttgtgaagg agatgataat aggaggggtg ttggccatag tagcacttat 91200 ccctttagtg tgaattagtt cactttcttc aggtcttagc tgtctgaaat tggaccatga 91260 tccttgggca ctgagacatt tttctcccat ctggccagtg ctgcaattga gctaaggatt 91320 tggttcagag actcttgttg cctggggatc tgtttaatgt caagaccgat attagctggt 91380 tgaccctggg gtcgggtgac ttagagagtc agaagtcatc catgtttgct gctgctccac 91440 cctttgaact tagtcatgat aaactcctgg gtccaatcct gttacagcca aaatagcaag 91500 aaaagagtgg tagaagcaat cagaaaaatg catagtaagg caccaatgag ataccatctt 91560 cctcttctca attggcatac actttaaaat agcggtgttc agtcttttgg cttccctggg 91620 ccacactgga agaagaattg tcttgggcca cacataaaat acactaacac caatgataac 91680 tgatgggcaa aaaaaaaaaa aaagaatcac aaaaaatttc tcataatgtt ttaagaaagt 91740 ttacaaattt gtgttgggcc gcattcaaag ccatcctggg ccacatgcag gacaagcttg 91800 ctttaaaata tcccatttga agacagttca gatctcccca gttatagatg atttatcaaa 91860 taactatgta tgtatgaaat taatatatca aaagccttaa aacatttcca acctttgacc 91920 aaaaaattgt tcttctagga tgtatcttaa gacataatta tgatttgtgc acaaatttag 91980 ctatgaaaat gtagttttac ttatgatatg acaaaaatat cacaaatgac ctaggtgtca 92040 aacaatagag accagttaat taaatgatgt tccacaactt atataattat taaaaacatt 92100 taggatattt acatttaata aaacccatag tgagggcatt tagattgttt ctaatttgga 92160 cttttatgaa taaagctact atgaaattat tgtatagttt ttctttttat aaatagatgc 92220 tttcatctgt tttgggtaac cctccatgag taaaatagct ggattatatg ggaaataaat 92280 gtttaacttt ataaagaact accaaacttg tttccaaagt gattatatca ttttacaaca 92340 ctgcaacaat gtatgaaaat tctagttgct ccacctcctt ctcaatactt ggtttcccaa 92400 tcattttaat tttagccatt ctggcaggtg tgtagtgata tgtcattatc gttttaattt 92460 acattcccct aataattaag aatgtgagca tcttttcatg tgcttattct ccacttgggt 92520 attttatttt gtgagttgac tattcaaatc ttcttttcat tttttattag gtcatttgtc 92580 ttattgagtt gtaggagttc ttcatatatt ctggatataa gccctttgtc agatgttttg 92640 caaatattat ctcccaacct gtggttttca ttttcatttt gtttatagtt tctttctttc 92700 tttctttctt tctttctttc tttctttctt tctttctttc tttctttctc tttctttctt 92760 ttctttcttc ctttatttct ttttcttttc tttttttttt ttttggtgag acagtctcac 92820 tccatcaccc agactgcagt gcagtggcac catctcacct cactgtaacc tccacctgct 92880 gggttcaagt gattctcatg tagcagcccg gattacaggc acttgccacc acactcagct 92940 aatttttgta tttttagtag agacagggtt ttgccatgct ggccagcctg gtctctaact 93000 cttgacctca agagatctgc ccacctcggc ctctcaaagt gctgggatta caggcgtgag 93060 ctaccgtgac tggcttcatc atagtatctt tctaagtaca gaaattttga acttaagttg 93120 cttttgagaa aaagaaatgt tgtggtgctt agtgaaaaga ttcaagagca cctgcctttc 93180 aacccctgct cagcctctgt ttttttactt ggctgccaac tctcttgctg tgtggacttt 93240 tcctcatcaa tccaaccatc tggtgcctac tggtggaagc tgtgagtggg taaaggccaa 93300 tgaggtgtca gggaacaaca gtagaaacag aagccaaacc taacctgccc tggagcttcc 93360 catgtgctct agaaagggaa gtgccttgtc tgctgaggca ccttctagta ctttccagct 93420 ttaaacgaag catggatctt ttccttcaca attaacaaaa gcccttgttc aggtatgttt 93480 ggcacgtgct gtcatgcttc tttgtcacaa gcaaaacaag aaactaggga tccttcaaaa 93540 ttctattaga aaatagacct ttcaggaaat gttgcagaat tggctttctg ggatatggga 93600 ccaaatattc cttcattccc tgagaattga cttctttctg ctgtatgctc caaatgaact 93660 ccatatatac atacctcatc atgcctctaa atttttaggg cacacatttc tttacatgtc 93720 tacctcctgc aattacactg gaagcccctt gaaagcatga ccatgttttg tacatctttg 93780 tatgtatagt gcctgtctta gtccatttct attgctgtaa gaaaatacct taaatctggt 93840 aaattataaa tcatagagat ttatttctca caatcctgac gactgggaag tccaacatca 93900 gggcaccaga agatttgatg tctgcagagg gctgtctctg ctttcaagat ggtgccttct 93960 tggtgcatcc tcacatagca aaatgacaga gagtaaaaag gactaaacag acttctttaa 94020 gatgttttac aagggcacta attccattca taagggcagg gcctcataac ctaatcacct 94080 cctaatggcc ccacctctta ataccattgc attggtgatt aagttttaca aattttagaa 94140 agacacaaac attcaaacca tagcagtgcc taccacagaa ctgatacaga atgagaactc 94200 aatggatact acttgaatgg ctgaatgaat gaagtgaatt aattgttcgt atccccaaat 94260 ctgagagata tctctctgtt taataatcta ttttgttaaa actttgctct ggagttggac 94320 agacctggga tcacatctca gctccagttc ttgctagctg tgtaactgag acaaagttct 94380 cagcttcctt tgagtcccat ggcttattaa aggggaacaa tggttataat tataataact 94440 acctcatgag tgtgtatgga ctcaatgagt taacacaaag tgtgtaagcc agtgcctggt 94500 tcttagtaag tgctctgtaa atgttagctt tggttattta catgctgtgt tttatgtgac 94560 ccatttctta tgaaataatg tttgctacaa gtagaagatg atggtgatgg ccaaatgtgc 94620 attatatatt ttagtgttca taacaaccag ttattattat ccttttttca gttgtaattg 94680 aagtgacatg cgtgaggtca caaagccagt gataaagctg ggattcagac tcaggctgac 94740 catactttaa tctctaaaca tagtcactct gtcccttcac acaggaaagc attctctgat 94800 ttggaggaga gaattcctgt agccaaggat ggtggcataa gccatagaca tggggctgtc 94860 aaattgctta gcctagaaga acaagagtca gccaactttg gggactccct gttctatccc 94920 cctccctctt atggcaatag gattaagttc tgtgtattag tccattttca tgaggctgat 94980 aaagacatac caaagactgg gtaatttact taaaaaaaaa aaaaaagagg tttaatggac 95040 tcagagttcc acatggctgg ggaggcctca caatcatggc agaagacaaa agtcacatct 95100 tacatggtgg cagacaagag agaatgagag ccaagtgaaa gggggatctc tctttataaa 95160 accatcagat ctcgtgagac ttactcacta ccatgagaac agtatgagga aactgtcccc 95220 catgattcat ttctctccca ccaggtccct cccacaacac ttaggaatta tgggatctac 95280 aattcaagat gagatttggg tggggacaca gccaaatcat atcaagtata ttgcagaaaa 95340 catgaataac agtggctaaa acaagataca attttttttc tcttacataa gaaaagagca 95400 gcctaaagct tatttagcct aaagctggta tggtgggttc cagtccacag gaccagggtt 95460 ctactttttt gctccttgaa aataagcatc caggagaaat gctgttcttc ctcacggggc 95520 ctgagattct cctctcctac caagtgtcac ctttctgctg gtctgcagaa actcctctgt 95580 ctcttcaggc agcagcacca gatacaccaa gcagaccaaa acaacatcac aaaggctctg 95640 aaaattaaac tgtctttgta accacagtcc acgaaactat gccaagacct ccgtgctaaa 95700 cctaaacagg ctgactgcct gctaaaataa aagattaaaa caggatccag agtctcctaa 95760 tataatagcc aaaatgttca gtatacagta aaaagccatg acactgagaa ccaagcaaaa 95820 cacaagtgaa ctaaaaaaga ccatcaactg acagccatgc tcagatgaat cagatgctgg 95880 aattgcctaa caaggatttt aaaggagaca gaaatgcttc aacaatcaat tacacattct 95940 cttgaaacaa ataaaaaaaa tataaaatct gggcaaaaaa tagttttttt atttttttaa 96000 aaaaaggaaa ccacagaact ctaaaatatg cagaaactct aaaataaaac agaaatagaa 96060 agggcatgtc tcctagccag atcagccatt caaagaagtg cagaagaact attcaatgat 96120 tttcacctaa tttccttggc tactttccag ctgcaaggaa tgctgggaaa tgtagtcttt 96180 aagcaggcac accaatgata gactggattt ttgtttacca ggtaaaagga aagaatatgt 96240 atcgggttac taagctaccc aggtctgccc ctgacacaaa gggctcatac attgggaaca 96300 aaatcaaggc tctgggagtt tacattggaa tatgatctta ctgtggataa gaccaaagaa 96360 atcctgtgca cacggatgag gattataaat cctggttcag gctggcatga tccacagttg 96420 ccacgattcc tgtatgcctg cagaaagaca acttaatgtg gcctaatgtt actaacatct 96480 cgacaggctc accttttgag ggaaggccat ttaattacct gattaatttg ctcatcttaa 96540 ttaacttgtt cctattgttg ataaccttgt attgattgct ctgctggtag taattagaaa 96600 actggtaaag aagtaaggag agaagcccaa agaggggggc agcacagcac acagattgtc 96660 ttcctgtctc ctaagaatct actgtgtagg ctgtgagctt agcatatttg cttctctttt 96720 taggtaaata tgttatagac acaaatgatg ttctctgttg attatttata accactccac 96780 gttccttctt agagtatctg cccttttcat tttttcaaag actcagctct catgagcccc 96840 acatgacctg ctacccccat caaccacagc tgattggata agcacctgac ctagactgtg 96900 ccagtcacat ttgattgttt cagatttctg aatcagagca tgaagaaaca gtaccagtta 96960 actttggatg ctgaaactat aggacgatgc agacttggaa ggtggacaag gtagctattt 97020 cgtgatagcc accatggacc ctgtattccc accaacaatc agagagcact tgtcagttaa 97080 gttcaccaga ctcctaatgg cattatagtt ctcccaccaa acttcttgcc ccagggtgta 97140 tggactatct ctgattattt gatagaagtt tccctgtaca ttagctgact caagttcatt 97200 gccatttttt gcaacccaaa gagtcccttc tataacaaag cactctcatc attgacttct 97260 ctctatctta gttttaagtg tctctggtga aaatgcaaat ttaaaggacc tattaaaaac 97320 aacagagtgg gagttgctat caaataaagt ataaactgct aaactgctaa ggcctctatc 97380 aagaccaatg ctgtgctaac tctttccaac ccagtaaaac gaggctttat tgtccaccac 97440 taacatgtca ccacctcccc tattgacttc agtcctttgg gaccccctaa ctctcatacc 97500 ccacccagct tccgagaact ctattgcctc ccagaagtaa tcatagtcaa cacttagtgg 97560 tagttatttt ggcttgaggc catggccttg caaagctggt attgaagtga tgctctcata 97620 tctaatttga ctgaattgag tgttccagta agactggtga tgttttcctt gcttcagggt 97680 ccatcctaat gagcaaatgc tgccttactt tcacagaagg ctgcaaatgt agacttgtaa 97740 agaaaatctt tacaaacact tcttggtgtc ttagagatca cccaacacaa ttacacatgg 97800 ggatatgctg ggaagtacta aaataaacct gatttatcct tcacatatgc ctttcatttg 97860 ctattgtggc ttcaaagctc aaaaaaaata gagagatgtt tctctaaact ttcactattt 97920 attaactgag aatgtaacgg aagtgaaaca gccaacaaaa attaaaagca gcttactcag 97980 ggatacagag tcatgactat gtggagcccc atatctttac ttctttgtct aaagtcctca 98040 taagcactgt ctgagtttgc atgagtccta caaactagaa caactcccaa cttcattgag 98100 aagaatgagg acatctttgc aaagaaggca gaggaaagcc acatgctact tgtaacactt 98160 tgatggctac ccagtgccaa ggtttttttt ttttttttta acaatcctga cagcagaaat 98220 ctggaagctt gatcctagaa gactgaagag cccccaacat gaccctgaac tctcacataa 98280 gagaggaact cttagttcgt ttgccattaa gagaaaacca cagactaggt catttataat 98340 gaacagaaat ttattttctc acagttctaa atgctgggac atccaagatc atgggacccg 98400 catccgacaa gagtgttcta gctgcatcat tccatggtgg aatggccaga gagggtgagg 98460 gagagaagca aaagggggcc aaactcatcc ctctgtaagg aactccctcc tgagataaca 98520 gcattaatca ttcatcaggg cagagccctc acggcctaat caccttttaa aggtcctatc 98580 tcttaatact gttataatta aacttcaacc tacatttggg agggaacaaa cattcaagcc 98640 acagtagaaa ccagcttctt tttctgttgt taaagcaaca ctttttttct tctctgttac 98700 ttgcagccta accagatcct aataaataca caagcttcta tgtcgacaaa tatgtctaca 98760 atgctgttta aatggcagca tggtattcta ggatagggaa gggccaccat ttactcaacc 98820 agcccattct tggaggatgt ttaagctatt tccaatattt tgctatgttc aacaaagtat 98880 taaggatctc cctagtagct aagcacccat gtaaatcctt agatatctta ggataaacct 98940 gtaaactagt ttatgtgtcc tagtttagct gggcccagct ggaccatcac acatatttaa 99000 atttttttga aacttattgc caacatgcat ctccagagag gtagtacacc aaattatgct 99060 cctacaaaag ttgcagaaac ttgcctgtct atccatactg tcacccacaa tggtgattat 99120 tactttttat ctgtgacaat ttgatttatg ctgggatttt gcagccagca ccaaggtagc 99180 atgttgtctc tcagtctaat aataatttcc ctctccctca tcatcatcac cagcactacc 99240 aatttctctg cactatgggt actaacatca aaaatgttcc catcacattt acttcatttt 99300 gaggaaaaga acagttacta ccattcattc attcactcat cacaccaata ttactgaatc 99360 ctaccctgga ccagcattgt tatggtagat cttgataata tagtgacaga caataccatc 99420 cttcccacca tttacatagt agactgcctg gggctcatag tctactcaca tctcagcaca 99480 tgagatagtc ccattatcac attctcttct atctctctca caggcactca ctcaccagcc 99540 atggagaact taatgggcat taggttctta atcctgctgg gtataattgg agataaccac 99600 cctggctgac tgagcactat accaggctac tcatggatga tttggttatt agacgtaatc 99660 agagtggccc ttgtatgcta aaaaggagac tcagtctcca tcccatggaa gattacattt 99720 ttctgactgc catccctcag atctagatgg tattgtctcc ctgacatcca aatatcttca 99780 atcatataac c 99791

Claims (56)

  1. 개인으로부터 수득된 핵산 시료 또는 개인으로부터 유래된 유전형 데이터세트(genotype dataset)에서 하나 이상의 다형성 마커의 하나 이상의 대립인자의 존재 또는 부재를 결정하는 단계를 포함하는, 개인에서 유방암에 대한 감수성을 결정하는 방법으로서, 상기 하나 이상의 다형성 마커는 표 10, 표 15 및 표 19 중 하나에 표시된 다형성 마커들, 및 이들과 연관 불균형(linkage disequilibrium)인 마커들로부터 선택되고, 상기 하나 이상의 대립인자의 존재는 상기 개인의 유방암에 대한 감수성을 나타내는 것인 방법.
  2. 제1항에 있어서, 상기 하나 이상의 다형성 마커는 서열번호 4, 서열번호 5 또는 서열번호 6으로 표시된 서열을 갖는 게놈 세그먼트 내에 위치하는 것인 방법.
  3. 제1항 또는 제2항에 있어서, 상기 하나 이상의 다형성 마커는 표 10, 표 15 및 표 19 중 하나에 표시된 마커들로부터 선택되는 것인 방법.
  4. 제1항 내지 제3항 중 어느 한 항에 있어서, 상기 하나 이상의 다형성 마커는 rs4848543 (서열번호 1), rs3803662 (서열번호 3) 및 rs13387042 (서열번호 2)로부터 선택되는 것인 방법.
  5. 제1항 내지 제4항 중 어느 한 항에 있어서, 상기 개인에서 하나 이상의 일배체형의 빈도를 평가하는 단계를 더 포함하는 것인 방법.
  6. 제1항 내지 제5항 중 어느 한 항에 있어서, 상기 하나 이상의 대립인자 또는 일배체형의 존재에 의해 부여된 감수성은 증가된 감수성인 것인 방법.
  7. 제6항에 있어서, 마커 rs4848543의 대립인자 A, 마커 rs3803662의 대립인자 T 및/또는 마커 rs13387042의 대립인자 A의 존재는 유방암에 대한 증가된 감수성을 나타내는 것인 방법.
  8. 제6항 또는 제7항에 있어서, 상기 하나 이상의 대립인자 또는 일배체형의 존재는 1.20 이상의 상대적 위험도(relative risk, RR) 또는 오즈비(odds ratio, OR)를 갖는 유방암에 대한 증가된 감수성을 나타내는 것인 방법.
  9. 제6항 또는 제7항에 있어서, 상기 하나 이상의 대립인자 또는 일배체형의 존재는 1.25 이상의 상대적 위험도(RR) 또는 오즈비(odds ratio, OR)를 갖는 증가된 감수성을 나타내는 것인 방법.
  10. 제1항 내지 제5항 중 어느 한 항에 있어서, 상기 하나 이상의 대립인자 또는 일배체형의 존재에 의해 부여된 감수성은 감소된 감수성인 것인 방법.
  11. 제1항 내지 제10항 중 어느 한 항에 있어서, 표 10, 표 15 및 표 19에 표시된 마커들 중 하나와 연관 불균형이 아닌, 유방암에 대한 하나 이상의 위험 변이의 하나 이상의 위험 대립인자의 존재 또는 부재에 대해 개인으로부터 수득된 게놈 DNA를 포함하는 시료 또는 개인으로부터 유래된 유전형 데이터세트를 분석하는 단계를 더 포함하는 것인 방법.
  12. 제1항 내지 제9항 중 어느 한 항에 있어서, 두개 이상의 다형성 마커에서 하나 이상의 대립인자의 존재 또는 부재를 결정하는 단계를 포함하고, 상기 두개 이상의 다형성 마커에서 상기 하나 이상의 대립인자의 존재는 유방암에 대한 증가된 감수성을 나타내는 것인 방법.
  13. 제1항 내지 제12항 중 어느 한 항에 있어서, 상기 개인으로부터 수득된 핵산 시료 또는 상기 개인으로부터 유래된 유전형 데이터세트에서 유방암에 대한 하나 이상의 고 침투성 유전적 인자(high penetrant genetic factor)의 존재 또는 부재를 결정하는 단계를 더 포함하는 것인 방법.
  14. 제13항에 있어서, 상기 고 침투성 유전적 인자는 BRCA2 999del5인 것인 방법.
  15. 제1항 내지 제14항 중 어느 한 항에 있어서, 에스트로겐 수용체 또는 프로게스테론 수용체 상태에 대해 상기 개인을 평가하는 단계를 더 포함하는 것인 방법.
  16. 제15항에 있어서, 상기 개인에서 에스트로겐 수용체 양성 상태 또는 프로게스테론 수용체 양성 상태는 유방암의 증가된 위험도와 연관된 것인 방법.
  17. 제16항에 있어서, 상기 유방암의 증가된 위험도는 rs13387042 대립인자 A 및/또는 rs3803662 대립인자 T, 및 이들과 연관 불균형인 마커들과 연관된 것인 방법.
  18. 제1항 내지 제17항 중 어느 한 항에 있어서, 상기 개인의 위험도 평가, 진단, 또는 예후의 판단을 수행하기 위해 비-유전적 정보(non-genetic information)를 분석하는 단계를 더 포함하는 것인 방법.
  19. 제18항에 있어서, 상기 비-유전적 정보는 연령, 성별, 민족, 사회경제적 지위, 과거 질병 진단, 개인의 병력(medical history), 유방암의 가족력(family history), 생화학적 척도, 및 임상적 척도로부터 선택되는 것인 방법.
  20. 제11항 내지 제19항 중 어느 한 항에 있어서, 통합 위험도(combined risk)를 계산하는 단계를 더 포함하는 것인 방법.
  21. 개인으로부터 수득된 핵산 시료 또는 개인으로부터 유래된 유전형 데이터세트에서 하나 이상의 다형성 마커의 하나 이상의 대립인자의 존재 또는 부재를 결정하는 단계를 포함하는, 이전에 유방암으로 진단되었던 개인에서 하나 이상의 제2 원발성 종양(second primary tumor)을 발병할 위험도를 결정하는 방법으로서, 상기 하나 이상의 다형성 마커는 표 10, 표 15 및 표 19 중 하나에 표시된 다형성 마커들, 및 이들과 연관 불균형인 마커들로부터 선택되고,
    상기 하나 이상의 대립인자의 존재는 하나 이상의 제2 원발성 종양을 발병할 위험도를 나타내는 것인 방법.
  22. 제20항에 있어서, 상기 하나 이상의 다형성 마커는 rs4848543 (서열번호 1), 및 그와 연관 불균형인 마커들인 것인 방법.
  23. 개인에서 유방암에 대한 감수성을 평가하기 위한 키트로서, 상기 키트는 상기 개인의 게놈에서 하나 이상의 다형성 마커의 하나 이상의 대립인자를 선택적으로 검출하는 시약을 포함하고, 상기 다형성 마커는 표 10, 15 및 19에 표시된 마커들, 및 이들과 연관 불균형인 마커들로부터 선택되고, 상기 하나 이상의 대립인자의 존재는 유방암에 대한 감수성을 나타내는 것인 키트.
  24. 제23항에 있어서, 상기 하나 이상의 다형성 마커는 rs4848543 (서열번호 1), rs3803662 (서열번호 3) 또는 rs13387042 (서열번호 2)인 것인 키트.
  25. 제23항 또는 제24항에 있어서, 상기 시약은 상기 하나 이상의 다형성 마커를 포함하는 상기 개인의 게놈의 단편에 혼성화하는 하나 이상의 연속된(contiguous) 올리고뉴클레오티드, 완충액 및 검출가능한 표지를 포함하는 것인 키트.
  26. 제23항 내지 제25항 중 어느 한 항에 있어서, 상기 시약은 상기 개인으로부터 수득된 게놈 핵산 세그먼트의 반대쪽 가닥에 혼성화하는 한 쌍 이상의 올리고뉴클레오티드를 포함하고, 상기 각 올리고뉴클레오티드 프라이머 쌍은 하나의 다형성 마커를 포함하는 상기 개인의 게놈의 단편을 선택적으로 증폭시키도록 설계되고, 상기 단편은 크기가 30 bp 이상인 것인 키트.
  27. 제25항 또는 제26항에 있어서, 상기 하나 이상의 올리고뉴클레오티드는 상기 개인의 게놈에 완전히 상보적인 것인 키트.
  28. 제23항 내지 제27항 중 어느 한 항에 있어서, 상기 키트는:
    d. 길이가 5 내지 100개의 뉴클레오티드로 구성된 검출 올리고뉴클레오티드 프로브;
    e. 길이가 5 내지 100개의 뉴클레오티드로 구성된 인핸서 올리고뉴클레오티드 프로브; 및
    f. 엔도뉴클레아제 효소;를 포함하고,
    상기 검출 올리고뉴클레오티드 프로브는 서열번호 4, 서열번호 5 또는 서열번호 6으로 표시된 뉴클레오티드 서열의 핵산의 제1 세그먼트에 특이적으로 혼성화되고; 및
    상기 검출 올리고뉴클레오티드 프로브는 3' 말단에 검출가능한 표지를 포함하고 5' 말단에 퀀칭 모이어티(quenching moiety)를 포함하며;
    상기 인핸서 올리고뉴클레오티드는 길이가 5개 내지 100개의 뉴클레오티드로 구성되고, 상기 올리고뉴클레오티드 프로브의 5'에 배열된 상기 뉴클레오티드 서열의 제2 세그먼트에 상보적이어서, 상기 인핸서 올리고뉴클레오티드는 상기 두개의 올리고뉴클레오티드가 모두 상기 핵산에 혼성화되는 경우 상기 검출 올리고뉴클레오티드에 대해 3'에 위치하며; 및
    상기 제1 세그먼트와 상기 제2 세그먼트 간에 단일 염기 갭이 존재하여, 상기 올리고뉴클레오티드 프로브와 상기 인핸서 올리고뉴클레오티드 프로브가 모두 상기 핵산에 혼성화되는 경우, 상기 올리고뉴클레오티드 간에 단일 염기 갭이 존재하며; 및
    상기 핵산을 상기 엔도뉴클레아제에 의해 처리하는 단계는 상기 검출 프로브가 상기 핵산에 혼성화된 경우, 상기 검출 프로브의 3'말단으로부터 상기 검출가능한 표지를 절단하여 유리 상태의 검출가능한 표지를 방출시키는 것인 키트.
  29. 개인에서 유방암에 대한 유전적 지표(genetic indicator)를 결정하는 장치로 서,
    컴퓨터 판독가능한 메모리; 및
    상기 컴퓨터 판독가능한 메모리 상에 저장된 루틴(routine)을 포함하고,
    상기 루틴은 표 10, 표 15 및 표 19에 표시된 마커들, 및 이들과 연관 불균형인 마커들로부터 선택되는 하나 이상의 다형성 마커에 대해 하나 이상의 다형성 마커 및/또는 일배체형 정보를 분석하고, 상기 마커 또는 일배체형 정보에 기반한 결과물(output)을 생성하기 위해 프로세서 상에서 실행되도록 개조되고, 상기 결과물은 상기 개인의 유방암의 유전적 지표로서 상기 하나 이상의 마커 또는 일배체형의 개별적인 위험도 척도(risk measure)를 포함하는 것인 장치.
  30. 제29항에 있어서, 상기 루틴은 상기 하나 이상의 마커 대립인자 및/또는 일배체형과 연관된 유방암의 위험도 척도를 더 포함하고, 상기 위험도 척도는 유방암으로 진단된 복수의 개인에서 하나 이상의 다형성 마커의 하나 이상의 대립인자 및/또는 하나 이상의 일배체형의 빈도의 지표와 복수의 기준(reference) 개인에서 상기 하나 이상의 다형성 마커의 하나 이상의 대립인자 및/또는 일배체형의 빈도의 지표의 비교에 기반하며, 상기 개인의 개별적인 위험도는 상기 하나 이상의 마커 대립인자 및/또는 일배체형에 대한 상기 개인의 보인자 상태(carrier status)와 상기 하나 이상의 마커 대립인자 및/또는 일배체형에 대한 위험도 척도의 비교에 기반하는 것인 장치.
  31. 제29항 또는 제30항에 있어서, 상기 하나 이상의 다형성 마커는 rs4848543 (서열번호 1), rs3803662 (서열번호 3) 또는 rs13387042 (서열번호 2), 및 이들과 연관 불균형인 마커들로부터 선택되는 것인 장치.
  32. 제1항 내지 제31항 중 어느 한 항에 있어서, 마커들 간의 연관 불균형은 r2 및/또는 |D'|의 특정한 수치값을 특징으로 하는 것인 방법, 키트, 또는 장치.
  33. 제1항 내지 제32항 중 어느 한 항에 있어서, 연관 불균형은 0.2 이상의 r2값을 특징으로 하는 것인 방법, 키트, 또는 장치.
  34. 유방암에 대한 감수성을 평가하기 위해 이용될 마커를 확인하는 방법으로서, 상기 방법은
    d. 서열번호 4, 서열번호 5 및 서열번호 6으로 표시된 서열을 갖는 게놈 세그먼트 내의 하나 이상의 마커와 연관 불균형인 하나 이상의 다형성 마커를 확인하는 단계,
    e. 유방암으로 진단되거나 또는 유방암에 대한 감수성을 갖는 개인의 시료의 유전형 상태(genotype status)를 결정하는 단계, 및
    f. 대조군 개인의 시료의 유전형 상태를 결정하는 단계를 포함하고,
    상기 대조군 시료에서의 하나 이상의 다형성의 하나 이상의 대립인자의 빈도 대비, 유방암으로 진단되거나, 또는 유방암에 대한 감수성을 갖는 개인에서 상기 하나 이상의 대립인자의 빈도의 유의성 있는 차이는 상기 하나 이상의 다형성이 유방암에 대한 감수성을 평가하기 위해 유용하다는 것을 나타내는 것인 방법.
  35. 제34항에 있어서, 상기 대조군 시료에서의 상기 하나 이상의 다형성의 하나 이상의 대립인자의 빈도 대비, 유방암으로 진단되거나, 또는 유방암에 대한 감수성을 갖는 개인에서 상기 하나 이상의 대립인자의 빈도의 증가는 상기 하나 이상의 다형성이 유방암에 대한 증가된 감수성을 평가하기 위해 유용하다는 것을 나타내는 것인 방법.
  36. 제34항 또는 제35항에 있어서, 상기 대조군 시료에서의 상기 하나 이상의 다형성의 하나 이상의 대립인자의 빈도 대비, 유방암으로 진단되거나, 또는 유방암에 대한 감수성을 갖는 개인에서 상기 하나 이상의 대립인자의 빈도의 감소는 상기 하나 이상의 다형성이 유방암에 대한 감소된 감수성 또는 보호를 평가하기 위해 유용하다는 것을 나타내는 것인 방법.
  37. 제34항 내지 제36항 중 어느 한 항에 있어서, 상기 서열번호 4 내의 하나 이상의 마커는 표 20에 표시된 마커들로부터 선택되는 것인 방법.
  38. 제34항 내지 제36항 중 어느 한 항에 있어서, 상기 서열번호 5 내의 하나 이 상의 마커는 표 21에 표시된 마커들로부터 선택되는 것인 방법.
  39. 제34항 내지 제36항 중 어느 한 항에 있어서, 상기 서열번호 6내의 하나 이상의 마커는 표 22에 표시된 마커들로부터 선택되는 것인 방법.
  40. 제34항 내지 제36항 중 어느 한 항에 있어서, 서열번호 4, 서열번호 5 및 서열번호 6에 표시된 서열을 갖는 게놈 세그먼트 내의 하나 이상의 마커와 연관 불균형인 하나 이상의 다형성 마커는 rs4848543 (서열번호 1), rs3803662 (서열번호 3) 및 rs13387042 (서열번호 2)로부터 선택되는 것인 방법.
  41. 유방암에 대한 위험을 갖거나, 또는 유방암으로 진단된 개인으로부터 수득된 핵산 시료에서 하나 이상의 다형성 마커의 하나 이상의 대립인자의 존재 또는 부재를 결정하는 단계를 포함하는, 개인으로부터 수득된 핵산 시료의 유전형을 분석하는 방법으로서, 상기 하나 이상의 마커는 표 10, 표 15 및 표 19에 표시된 마커들, 및 이들과 연관 불균형인 마커들로 구성된 군으로부터 선택되고, 상기 하나 이상의 다형성 마커의 상기 하나 이상의 대립인자의 존재 또는 부재는 유방암의 감수성을 나타내는 것인 방법.
  42. 제41항에 있어서, 상기 하나 이상의 마커는 rs4848543 (서열번호 1), rs3803662 (서열번호 3) 및 rs13387042 (서열번호 2)로부터 선택되는 것인 방법.
  43. 제41항 또는 제42항에 있어서, 유전형 분석은 상기 하나 이상의 다형성 마커를 플랭킹(flanking)하는 뉴클레오티드 프라이머 쌍을 이용한 중합효소 연쇄 반응(PCR)에 의해, 상기 하나 이상의 다형성 마커를 포함하는 핵산의 세그먼트를 증폭하는 단계를 포함하는 것인 방법.
  44. 제41항 내지 제43항 중 어느 한 항에 있어서, 유전형 분석은 대립인자-특이적 프로브 혼성화, 대립인자-특이적 프라이머 연장(primer extension), 대립인자-특이적 증폭, 핵산 서열결정(nucleic acid sequencing), 5'-엑소뉴클레아제 처리(exonuclease digestion), 분자 표지 분석법(molecular beacon assay), 올리고뉴클레오티드 라이게이션 분석법(oligonucleotide ligation assay), 크기 분석, 및 단일 가닥 구조 분석(single-stranded conformation analysis)으로부터 선택된 방법을 이용하여 수행되는 것인 방법.
  45. 제44항에 있어서, 상기 방법은 대립인자-특이적 프로브 혼성화를 포함하는 것인 방법.
  46. 제45항에 있어서, 상기 방법은 DNA 서열결정을 포함하는 것인 방법.
  47. 제41항 내지 제45항 중 어느 한 항에 있어서,
    3) 상기 핵산의 카피를 검출 올리고뉴클레오티드 프로브 및 인핸서 올리고뉴클레오티드 프로브와, 상기 올리고뉴클레오티드 프로브와 상기 핵산 간의 특이적 혼성화 조건 하에 접촉시키는 단계로서,
    a) 상기 검출 올리고뉴클레오티드 프로브는 길이가 5 내지 100개의 뉴클레오티드로 구성되고 서열번호 4, 서열번호 5 또는 서열번호 6에 의해 주어진 뉴클레오티드 서열을 갖는 핵산의 제1 세그먼트에 특이적으로 혼성화되고,
    b) 상기 검출 올리고뉴클레오티드 프로브는 3' 말단의 검출가능한 표지 및 5' 말단의 퀀칭 모이어티(quenching moiety)를 포함하며,
    c) 상기 인핸서 올리고뉴클레오티드는 길이가 5 내지 100개의 뉴클레오티드로 구성되고 상기 올리고뉴클레오티드 프로브의 5'에 배열된 상기 뉴클레오티드 서열의 제2 세그먼트에 상보적이어서, 상기 두개의 올리고뉴클레오티드가 모두 상기 핵산에 혼성화되는 경우 상기 인핸서 올리고뉴클레오티드는 상기 검출 올리고뉴클레오티드에 대해 3' 에 위치하며, 및
    d) 상기 제1 세그먼트와 상기 제2 세그먼트 간에 단일 염기 갭(single base gap)이 존재하여, 상기 올리고뉴클레오티드 프로브와 상기 인핸서 올리고뉴클레오티드 프로브가 모두 상기 핵산에 혼성화되는 경우, 상기 올리고뉴클레오티드 간에 단일 염기 갭이 존재하는 것인 단계,
    4) 상기 검출 프로브가 상기 핵산에 혼성화되는 경우, 상기 검출 프로브의 3' 말단으로부터 상기 검출가능한 표지를 절단하여 유리된 검출가능한 표지를 방출시키는 엔도뉴클레아제로 상기 핵산을 처리하는 단계, 및
    5) 유리된 검출가능한 표지를 측정하는 단계로서, 상기 유리된 검출가능한 표지의 존재는 상기 검출 프로브가 상기 핵산의 제1 세그먼트에 특이적으로 혼성화되고, 상기 다형성 부위의 서열이 상기 검출 프로브의 상보체(complement)라는 것을 나타내는 것인 단계를 포함하는 것인 방법.
  48. 유방암 치료제에 대한 반응의 확률에 대해 개인을 평가하는 방법으로서, 상기 개인으로부터 수득된 핵산 시료에서 하나 이상의 다형성 마커의 하나 이상의 대립인자의 존재 또는 부재를 결정하는 단계를 포함하고, 상기 하나 이상의 다형성 마커는 표 10, 표 15 및 표 19에 표시된 마커들, 및 이들과 연관 불균형인 마커들로 구성된 군으로부터 선택되고, 상기 하나 이상의 마커의 상기 하나 이상의 대립인자의 존재는 상기 치료제에 대한 양성 반응의 확률을 나타내는 것인 방법.
  49. 유방암으로 진단된 개인의 예후(prognosis)를 예측하는 방법으로서, 상기 방법은 상기 개인으로부터 수득된 핵산 시료에서 하나 이상의 다형성 마커의 하나 이상의 대립인자의 존재 또는 부재를 결정하는 단계를 포함하고, 상기 하나 이상의 다형성 마커는 표 10, 표 15 및 표 19에 표시된 마커들, 및 이들과 연관 불균형인 마커들로 구성된 군으로부터 선택되고, 상기 하나 이상의 대립인자의 존재는 상기 개인에서 유방암의 악화된 예후를 나타내는 것인 방법.
  50. 유방암의 치료를 받는 개인의 치료의 진행을 모니터링하는 방법으로서, 상기 방법은 상기 개인으로부터 수득된 핵산 시료에서 하나 이상의 다형성 마커의 하나 이상의 대립인자의 존재 또는 부재를 결정하는 단계를 포함하고, 상기 하나 이상의 다형성 마커는 표 10, 표 15 및 표 19에 표시된 마커들, 및 이들과 연관 불균형인 마커들로부터 선택되고, 상기 하나 이상의 대립인자의 존재가 상기 개인의 치료 결과를 나타내는 것인 방법.
  51. 제48항 내지 제50항 중 어느 한 항에 있어서, 상기 하나 이상의 다형성 마커는 rs4848543 (서열번호 1), rs3803662 (서열번호 3) 및 rs13387042 (서열번호 2)로부터 선택되는 것인 방법.
  52. 개인에서 유방암에 대한 감수성을 진단 및/또는 평가하기 위한 시약의 제조에서 올리고뉴클레오티드 프로브의 용도로서, 상기 프로브는 서열번호 4, 서열번호 5 또는 서열번호 6으로 표시된 뉴클레오티드 서열을 갖는 핵산의 세그먼트에 혼성화되고, 상기 프로브는 길이가 15 내지 500개의 뉴클레오티드로 구성되는 것인 용도.
  53. a. 하나 이상의 다형성 마커에 대한 식별자(identifier);
    b. 유방암으로 진단된 복수의 개인에서 상기 하나 이상의 다형성 마커의 하나 이상의 대립인자의 빈도의 지표(indicator); 및
    c. 복수의 기준 개인(reference individual)에서 상기 하나 이상의 다형성 마커의 상기 하나 이상의 대립인자의 빈도의 지표;가 저장되고,
    상기 하나 이상의 다형성 마커는 표 10, 표 15 및 표 19에 표시된 다형성 마커들, 및 이들과 연관 불균형인 다형성 마커들로부터 선택되는 것인 컴퓨터-판독가능한 매체(computer-readable medium).
  54. 제53항에 있어서, 상기 다형성 마커는 rs4848543 (서열번호 1), rs3803662 (서열번호 3) 및 rs13387042 (서열번호 2), 및 이들과 연관 불균형인 마커들로부터 선택되는 것인 매체.
  55. 제53항 또는 제54항에 있어서, 상기 복수의 개인들의 선조에 대한 정보를 더 포함하는 것인 키트.
  56. 제53항 내지 제55항 중 어느 한 항에 있어서, 연관 불균형은 0.2 이상의 r2 수치값 및/또는 0.8 이상의 |D'|의 값을 특징으로 하는 것인 매체.
KR1020097022257A 2007-03-26 2008-03-26 유방암의 위험도 평가, 진단, 예후 및 치료용 마커인 염색체 2 및 염색체 16 상의 유전적 변이 KR20090127939A (ko)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
IS8625 2007-03-26
IS8625 2007-03-26
IS8648 2007-05-25
IS8648 2007-05-25

Publications (1)

Publication Number Publication Date
KR20090127939A true KR20090127939A (ko) 2009-12-14

Family

ID=39563444

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020097022257A KR20090127939A (ko) 2007-03-26 2008-03-26 유방암의 위험도 평가, 진단, 예후 및 치료용 마커인 염색체 2 및 염색체 16 상의 유전적 변이

Country Status (13)

Country Link
US (1) US20110117545A1 (ko)
EP (3) EP2540840A3 (ko)
JP (1) JP5676245B2 (ko)
KR (1) KR20090127939A (ko)
CN (1) CN101874120B (ko)
AU (1) AU2008231425B2 (ko)
CA (1) CA2681928A1 (ko)
EA (1) EA019953B1 (ko)
IL (1) IL201217A (ko)
MX (1) MX2009010439A (ko)
NZ (1) NZ580490A (ko)
WO (1) WO2008117314A2 (ko)
ZA (1) ZA200907471B (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101390590B1 (ko) * 2012-06-28 2014-04-30 서울대학교산학협력단 췌장암 재발 예후 예측용 마커 및 이의 용도

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2006320559B2 (en) 2005-11-29 2012-01-19 Cambridge Enterprise Limited Markers for breast cancer
AU2009269542A1 (en) 2008-07-07 2010-01-14 Decode Genetics Ehf Genetic variants for breast cancer risk assessment
JP2012504410A (ja) * 2008-10-03 2012-02-23 マース インコーポレーテッド イヌにおける肝臓の銅蓄積についての遺伝子検査およびペット用低銅食餌
AU2010256343B2 (en) * 2009-06-01 2014-01-30 Genetic Technologies Limited Methods for breast cancer risk assessment
US8356023B2 (en) * 2009-07-28 2013-01-15 Ancestry.Com Operations Inc. Collaborative systems and methods for constructing representations of data
US20140329719A1 (en) * 2011-06-16 2014-11-06 Illumina, Inc. Genetic variants for predicting risk of breast cancer
GB201120989D0 (en) 2011-12-06 2012-01-18 Mars Inc Genetic test
WO2014164730A2 (en) * 2013-03-12 2014-10-09 The Board Of Trustees Of The Leland Stanford Junior University Modulation of cellular dna repair activity to intercept malignancy
JP6820838B2 (ja) 2014-09-30 2021-01-27 ジェネティック テクノロジーズ リミテッド 乳癌発症リスクを評価する方法
CA3018186C (en) * 2016-03-29 2023-06-13 Regeneron Pharmaceuticals, Inc. Genetic variant-phenotype analysis system and methods of use
CN108588263B (zh) * 2018-06-07 2022-02-01 中国农业科学院烟草研究所 一种用于定位和克隆植物中控制同一性状的双隐性基因的方法
CN108676890B (zh) * 2018-07-12 2022-01-28 吉林大学 一种女性乳腺恶性肿瘤易感性预测试剂盒及系统
US10395772B1 (en) * 2018-10-17 2019-08-27 Tempus Labs Mobile supplementation, extraction, and analysis of health records
KR102091790B1 (ko) * 2019-09-02 2020-03-20 주식회사 클리노믹스 피검사자와 생물체 간의 유전자 정보를 이용한 유전적 띠 제공 시스템 및 그 방법
CA3154157A1 (en) 2019-09-13 2021-03-18 23Andme, Inc. Methods and systems for determining and displaying pedigrees

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4376110A (en) * 1980-08-04 1983-03-08 Hybritech, Incorporated Immunometric assays using monoclonal antibodies
US5223409A (en) * 1988-09-02 1993-06-29 Protein Engineering Corp. Directed evolution of novel binding proteins
US5143854A (en) * 1989-06-07 1992-09-01 Affymax Technologies N.V. Large scale photolithographic solid phase synthesis of polypeptides and receptor binding screening thereof
US5424186A (en) * 1989-06-07 1995-06-13 Affymax Technologies N.V. Very large scale immobilized polymer synthesis
US5288644A (en) * 1990-04-04 1994-02-22 The Rockefeller University Instrument and method for the sequencing of genome
US5837832A (en) * 1993-06-25 1998-11-17 Affymetrix, Inc. Arrays of nucleic acid probes on biological chips
US5858659A (en) * 1995-11-29 1999-01-12 Affymetrix, Inc. Polymorphism detection
AU785425B2 (en) * 2001-03-30 2007-05-17 Genetic Technologies Limited Methods of genomic analysis
AU2002324649A1 (en) * 2001-08-04 2003-02-24 General Hospital Corporation Haplotype map of the human genome and uses therefor
US20040023237A1 (en) * 2001-11-26 2004-02-05 Perelegen Sciences Inc. Methods for genomic analysis
US20040146870A1 (en) * 2003-01-27 2004-07-29 Guochun Liao Systems and methods for predicting specific genetic loci that affect phenotypic traits
PL214402B1 (pl) * 2003-08-11 2013-07-31 Tomasz Byrski Zastosowanie selenu albo jego zwiazku do otrzymywania srodka do obnizania odziedziczonego ryzyka zachorowania na raka piersi lub jajnika
WO2006050573A1 (en) * 2004-11-11 2006-05-18 Garvan Institute Of Medical Research Method of diagnosing cancer and reagents therefor
KR101138862B1 (ko) * 2005-02-14 2012-05-14 삼성전자주식회사 단일염기 다형을 포함하는 유방암과 관련된 폴리뉴클레오티드, 그를 포함하는 마이크로어레이 및 진단 키트 및 그를이용한 유방암 진단 방법
KR101206028B1 (ko) * 2005-03-05 2012-11-28 삼성전자주식회사 유방암 특이적 다형성 서열을 이용한 유방암의 진단방법,유방암 특이적인 폴리뉴클레오티드 및 상기 폴리뉴클레오티드가 고정되어 있는 마이크로어레이
US7858303B2 (en) * 2005-03-14 2010-12-28 Wisconsin Alumni Research Foundation Method of analyzing breast cancer susceptibility and resistance
US20090118175A1 (en) * 2005-05-06 2009-05-07 Macina Roberto A Compositions and Methods for Detection, Prognosis and Treatment of Breast Cancer

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101390590B1 (ko) * 2012-06-28 2014-04-30 서울대학교산학협력단 췌장암 재발 예후 예측용 마커 및 이의 용도

Also Published As

Publication number Publication date
CN101874120A (zh) 2010-10-27
WO2008117314A2 (en) 2008-10-02
NZ580490A (en) 2012-08-31
EP2540840A3 (en) 2013-05-15
MX2009010439A (es) 2009-10-20
CA2681928A1 (en) 2008-10-02
AU2008231425A1 (en) 2008-10-02
EA200970891A1 (ru) 2010-04-30
EP2540840A2 (en) 2013-01-02
JP2010522555A (ja) 2010-07-08
CN101874120B (zh) 2015-01-14
ZA200907471B (en) 2014-03-26
AU2008231425B2 (en) 2014-03-20
EP2137324A2 (en) 2009-12-30
US20110117545A1 (en) 2011-05-19
WO2008117314A3 (en) 2008-12-18
EA019953B1 (ru) 2014-07-30
IL201217A (en) 2014-03-31
EP2527466A3 (en) 2013-05-15
EP2527466A2 (en) 2012-11-28
IL201217A0 (en) 2010-05-31
JP5676245B2 (ja) 2015-02-25

Similar Documents

Publication Publication Date Title
CN101874120B (zh) 作为用于乳腺癌风险评估、诊断、预后和治疗的标记的chr2和chr16的遗传性变型
DK2471954T3 (en) Susceptibility genetic variants associated with cardiovascular diseases
AU781437B2 (en) A novel BAP28 gene and protein
CN101784675B (zh) 用于剥脱性综合征和青光眼的诊断、预后和治疗的标记物的chr 15q24上的遗传变异
CN101641451A (zh) chr8q24.21上的癌症易感性变体
KR20110036608A (ko) 유방암 위험도 평가를 위한 유전적 변이
US20090305284A1 (en) Methods for Identifying Risk of Breast Cancer and Treatments Thereof
KR20110081807A (ko) 갑상선암의 위험도 평가를 위해 유용한 유전적 변이
KR20100017865A (ko) 유방암의 위험도 평가, 진단, 예후 및 치료용 마커인 염색체 5p12 및 염색체 10q26 상의 유전적 변이
KR20110015409A (ko) 염증성 장 질환에 대한 유전자 발현 마커
KR102481305B1 (ko) 유전자에 기반한 염증성 장 질환의 진단
KR20060045950A (ko) 혈액학적 악성종양에 대한 예후
AU2016325030A1 (en) Novel biomarkers and methods of treating cancer
WO2006022629A1 (en) Methods of identifying risk of type ii diabetes and treatments thereof
KR20090087486A (ko) 타입 2 당뇨병의 유전적 감수성 변이
CN101631876A (zh) 2型糖尿病的遗传易感性变体
AU2023203393A1 (en) Compositions and methods for screening and identifying clinically aggressive prostate cancer
CA2497597A1 (en) Methods for identifying subjects at risk of melanoma and treatments
IL179831A (en) In vitro method for detecting the presence or possibility of autism or autism disorder, and in vitro method for selecting compounds with biological activity on autism or autism disorders
DK2951317T3 (en) PROCEDURE FOR PREDICTING THE BENEFIT OF INCLUSING TAXAN IN A CHEMOTHERAPY PLAN FOR BREAST CANCER PATIENTS
WO2006022636A1 (en) Methods for identifying risk of type ii diabetes and treatments thereof
KR20190126812A (ko) 질환 진단용 바이오마커
WO2006022634A1 (en) Methods for identifying risk of type ii diabetes and treatments thereof
TW202227102A (zh) 治療脂肪肝病之方法
WO2006022638A1 (en) Methods for identifying risk of type ii diabetes and treatments thereof

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E902 Notification of reason for refusal
E601 Decision to refuse application