KR20090127939A - 유방암의 위험도 평가, 진단, 예후 및 치료용 마커인 염색체 2 및 염색체 16 상의 유전적 변이 - Google Patents
유방암의 위험도 평가, 진단, 예후 및 치료용 마커인 염색체 2 및 염색체 16 상의 유전적 변이 Download PDFInfo
- Publication number
- KR20090127939A KR20090127939A KR1020097022257A KR20097022257A KR20090127939A KR 20090127939 A KR20090127939 A KR 20090127939A KR 1020097022257 A KR1020097022257 A KR 1020097022257A KR 20097022257 A KR20097022257 A KR 20097022257A KR 20090127939 A KR20090127939 A KR 20090127939A
- Authority
- KR
- South Korea
- Prior art keywords
- markers
- breast cancer
- allele
- individual
- alleles
- Prior art date
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
- C12Q1/6883—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
- C12Q1/6886—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/172—Haplotypes
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Organic Chemistry (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Engineering & Computer Science (AREA)
- Immunology (AREA)
- Pathology (AREA)
- Analytical Chemistry (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Genetics & Genomics (AREA)
- Hospice & Palliative Care (AREA)
- Biochemistry (AREA)
- Microbiology (AREA)
- Molecular Biology (AREA)
- Biophysics (AREA)
- Physics & Mathematics (AREA)
- Oncology (AREA)
- Biotechnology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Peptides Or Proteins (AREA)
- Apparatus Associated With Microorganisms And Enzymes (AREA)
Abstract
Description
본 발명은 유방암의 감수성 변이인 Chr2q14, Chr2q35 및 Chr16q12 상의 특정한 유전적 변이에 관한 것이다. 그와 같은 변이를 이용하여, 유방암의 위험도를 평가하고 유방암에 대한 증가된 및/또는 감소된 감수성을 진단하는 방법이 개시된다. 본 발명은 또한 유방암에 대한 감수성을 진단하기 위한 키트에 관한 것이다.
유방암은 현재 전세계적으로 여성에서 가장 흔한 암이다. 현재 전세계적 발생율은 매년 1,151,000명 이상의 진단되노 신규 환자들이다(Parkin et al., 2005). 유방암 발생율은 선진국에서, 특히, 북유럽 민족 기원의 집단에서 가장 높고, 증가되고 있다. 미국에서, 연간 연령-표준화 발생율(annual age-standardized incidence rate)은 세계 평균을 3배 이상 초과하는, 100,000명 당 약 131명이다. 북유럽 국가들에서의 발생율은 유사하게 높다. 2006년에, 미국에서 214,650명의 침습성(invasive) 유방암 신규 환자들이 진단되고, 41,430명의 사람들이 상기 질환으로 사망할 것으로 추정된다[Jemal, et al., (2006), CA Cancer J Clin, 56, 106-30]. 이 수치에, 2006년에 예상되는 추가적인 61,980명의 유관상피내암 및 유소엽 상피내암(ductal and lobular carcinoma in-situ) 진단이 추가되어야 한다. 개인적인 관점에서, 생애 중에 유방암을 발병할 확률은 미국 여성의 경우 13.2%(즉, 8명의 여성 중 1명이 그들의 생애 동안 유방암을 발병함)이다. 대부분의 암의 경우와 같이, 조기 검출 및 적합한 치료가 중요한 인자이다. 전반적으로, 유방암에 대한 5-년 생존률은 88%이다. 그러나, 국소적 침습성 질환(regionally invasive disease) 또는 전이성 질환을 갖는 개인에서, 그 비율은 각각 81% 및 26%로 감소된다[Jemal, et al., (2006), CA Cancer J Clin, 56, 106-30].
점차적으로, 원발성 유방암 또는 재발성 유방암에 대한 고 위험도를 갖는 개인의 식별이 강조되고 있다. 그와 같은 개인들은 보다 집중적인 스크리닝, 예방적 화학요법, 호르몬 요법에 의해 관리될 수 있고, 매우 높은 위험도를 갖는 개인들의 경우, 예방적 외과수술(prophylactic surgery)에 의해 관리될 수 있다. 집단 스크리닝(mass screening) 프로그램은 의료 서비스에 대해 엄청난 경제적 부담이 되나, 예방적 치료법은 연관된 위험 및 삶의 질의 중요성을 갖는다.
유방암에 대한 유전적 소인(genetic predisposition):
유방암에 대한 공지된 위험 인자들의 두개의 주요한 종류는 내분비계 인자 및 유전학이다. 후자와 관련하여, 유방암 환자의 약 12%가 유방암을 갖는 1명 이상의 1촌 친척(first degree relative)를 갖는다[(2001), Lancet, 358, 1389-99]. 잘 알려진, 우세한 유방암 소인 유전자 BRCA1 및 BRCA2는 보인자(carrier)에게 크게 증가된 유방암 위험도를 부여하고, 일생의 침투도(lifetime penetrance) 추정값은 40-80%의 범위이다. BRCA1 및 BRCA2 돌연변이의 존재가 6건 이상의 유방암 케이스를 갖는 가족의 대부분 및 유방암, 및 난소암 또는 남성 유방암을 포함하는 가족의 높은 비율에서 원인일 수 있다. 그러나, 실제로 그와 같은 가족은 매우 드물다. BRCA1 및 BRCA2 돌연빈이는 보다 적은 수의 케이스를 갖는 가족, 또는 유방암 케이스만을 특징으로 하는 가족에서 훨씬 덜 빈번하게 발견된다. BRCA1 돌연변이와 BRCA2 돌연변이가 가족성 유방암(familiar breast cancer)에 대한 위험도의 15-20%를 차지한다. 비-시조 집단(non-founder population)에서, 모든 일반적인 BRCA 돌연변이가 검출될 수 있는 경우, 2-3%의 우발적(incident) 유방암 환자가 하나의 돌연변이를 가질 것으로 예상된다[Gorski, et al., (2005), Breast Cancer Res Treat, 92, 19-24; (2000), Br J Cancer, 83, 1301-8]. 이 낮은 "발견 가능성(chance to find)" 통계값은 명백한 유전적 소인을 갖는 패밀리 외에서 BRCA 돌연변이 테스트의 타당한 사용을 배제한다(Anon[(2003), J Clin Oncol, 21, 2397-406]). 드문, 높은 침투성 돌연변이가 TP53 및 PTEN 유전자에서 일어나는 것으로 알려져있으나, 이들은 함께 유방암에 대한 전체 유전적 위험도의 5% 이하를 차지한다[Easton, (1999), Breast Cancer Res, 1, 14-7]. 유방암에 대한 고 위험도를 부여하는 보다 많은, 보다 일반적인 돌연변이를 확인하기 위한 연관 연구는 대부분 성공하지 못했다[Smith, et al., (2006), Genes Chromosomes Cancer, 45, 646-55].
최근의 역학적 연구는 유방암 케이스의 대다수가 집단의 소인을 갖는 민감한 소수(predisposed, susceptible minority)에서 일어난다는 것을 확인했다[Antoniou, et al., (2002), Br J Cancer, 86, 76-83; Pharoah, et al., (2002), Nat Genet, 31, 33-6]. 쌍생아 연구로부터의 데이터 및 원발성 유방암(primary breast cancer)을 견뎌낸 환자의 반대쪽 유방에서 암의 일정한 높은 발병율의 관찰은 유방암에 대한 규명되지 않은 위험도의 상당한 부분은 내생적 인자, 가장 가능성있게는 유전적 인자와 관련된다는 것을 나타낸다[Lichtenstein, et al., (2000), N Engl J Med, 343, 78-85; Peto and Mack, (2000), Nat Genet, 26, 411-4]. 이 일반적인(widespread) 위험도를 뒷받침하는 유전적 인자의 지식은 매우 한정되어 있다. 분리(segregation) 분석은 유방암에 대한 규명되지 않은 유전적 위험도는 속성상 다유전자성(polygenic)일 가능성이 매우 높고, 위험 대립인자는 저위험도 내지 중간 위험도를 부여하고 상호간 및 호르몬 위험 인자(hormonal risk factor)와 상호작용할 수 있다. 그럼에도 불구하고, 이 연구들은 이 저 위험도 내지 중간 위험도 위험 대립인자들을 포착하는 유전적 프로파일링에 의해 정의될 수 있는 분포의 최고 5분위수와 최저 5분위수 간의 상대적 위험도의 40-배 차이를 예측한다[Antoniou, et al., (2002), Br J Cancer, 86, 76-83; Pharoah, et al., (2002), Nat Genet, 31, 33-6]. 모든 유방암 케이스의 88%는 집단의 소인을 갖는 50%에서 발생하며, 최고 위험도에 있는 집단의 12%가 모든 유방암 케이스의 50%를 차지할 것으로 예상된다[Pharoah, et al., (2002), Nat Genet, 31, 33-6; Pharoah, (2003), Recent Results Cancer Res, 163, 7-18; discussion 264-6]. 따라서, 그와 같이 유전적으로 소인을 갖는 개인의 확인 및 그들을 위한 맞춤화된 의료적 관리 전략의 개발에 초점이 맞춰져 있다.
본 발명자들 및 다른 연구자들은 아이슬란드에서 5촌 이상 친척(5th degree relative)까지 확장되는 유방암의 유의성 있는 가족성 위험도(familiar risk)가 있다는 것을 입증했다[Amundadottir, et al., (2004), PLoS Med, 1, e65; Tulinius, et al., (2002), J Med Genet, 39, 457-62]. 아이슬란드에서 BRCA1 돌연변이의 가족성 위험도에 대한 기여는 최소인 것으로 사료된다[Arason, et al., (1998), J Med Genet, 35, 446-9; Bergthorsson, et al., (1998), Hum Mutat, Suppl 1, S195-7]. BRCA2 유전자의 하나의 시조 돌연변이(founder mutation)(999del5)는 일반적인 아이슬란드 집단에서 0.6-0.8%의 보인자 빈도(carrier frequency)로 존재하고, 여성 유방암 환자에서는 7.7-8.6%의 보인자 빈도로 존재한다[Thorlacius, et al., (1997), Am J Hum Genet, 60, 1079-84; Gudmundsson, et al., (1996), Am J Hum Genet, 58, 749-56]. 이 단일 돌연변이는 1촌 내지 3촌 친척에서 유전성 유방암 위험도의 약 40%를 차지하는 것으로 추정된다[Tulinius, et al., (2002), J Med Genet, 39, 457-62]. 이 추정값은 비-시조(non-founder) 집단에서 통합된 모든 BRCA1 및 BRCA2 돌연변이에서 기인되는 15-25%의 가족성 위험도보다 더 높으나, 약 60%의 아이슬란드 가족성 유방암 위험도가 여전히 설명되지 않는다. BRCA2 999del5에 대해 음성으로 테스트된 환자의 1촌 친척은 유방암에 대한 집단 위험도의 1.72배의 위험도를 갖는다(95% CI 1.49-1.96) [Tulinius, et al., (2002), J Med Genet, 39, 457-62].
유방암의 나머지 유전적 위험도에 기여하는 유전적 인자들에 대한 이해는 매 우 제한적이다. 두 개의 유전자, CHEK2 및 ATM의 변이가 저 침투성(low penetrance) 유방암 위험도 유전자인 것으로 정밀하게 확인되었다[Renwick, et al., (2006), Nat Genet, 38, 873-5; (2004), Am J Hum Genet, 74, 1175-82]. 다수의 다른 유전자들이 관련되었으나, 유방암 위험도에 대한 그들의 기여는 매우 큰 표본 세트를 이용한 분석에서 확인되지 않았다[Breast Cancer Association, (2006), J Natl Cancer Inst, 98, 1382-96].
유전적 위험도는 집단 내의 개체들 중에서 유전자 중 미묘한 차이에 의해 부여된다. 유전자는 가장 빈번하게는 단일 염기 다형성(single nucleotide polymorphisms, SNP) 때문에 개체들 간에 상이하나, 다른 변이도 중요하다. SNP는 인간 게놈에서 평균 1000개의 염기쌍마다 존재한다. 따라서, 250,000개의 염기쌍(bp)을 포함하는 통상적인 인간 유전자는 250개의 상이한 SNP를 포함할 수 있다. 소수의 SNP만이 엑손에 위치하고, 해당 유전자에 의해 코딩된 단백질의 아미노산 서열을 변화시킨다. 대부분의 SNP는 유전자 기능에 거의 또는 전혀 효과를 갖지 않을 수 있고, 다른 SNP는 해당 유전자에 의해 코딩된 mRNA의 전사, 스플라이싱(splicing), 번역, 또는 안정성을 변화시킬 수 있다. 인간에서 추가적인 유전적 다형성이 DNA의 짧거나 또는 긴 스트레치(stretch)의 삽입, 결실, 전위(translocation), 또는 역전에 의해 유발된다. 따라서, 질병 위험도를 부여하는 유전적 다형성은 단백질의 아미노산 서열을 직접적으로 변화시킬 수 있거나, 해당 유전자로부터 생성된 단백질의 양을 증가시킬 수 있거나, 또는 해당 유전자에 의해 생성된 단백질의 양을 감소시킬 수 있다.
일반적인 질환의 위험도를 부여하는 유전적 다형성이 밝혀져서, 그와 같은 위험 인자에 대한 유전적 테스트가 임상 의학에서 중요해지고 있다. 예는 알쯔하이머병의 차등적 진단(differential diagnosis)을 위해 치매 환자에서 apoE4 다형성의 유전적 보인자를 확인하기 위한 아포리포프로테인(apolipoprotein) E 테스트 및 심부 정맥 혈전증에 대한 소인을 테스트하기 위한 Factor V Leiden 테스트이다. 보다 중요하게는, 암의 치료에서, 종양 세포의 유전적 변이의 진단이 개별 환자를 위한 가장 적합한 치료 방법(treatment regime)의 선택을 위해 이용된다. 유방암 환자에서, 에스트로겐 수용체 발현 또는 Her2(heregulin type 2) 수용체 티로신 키나아제 발현의 유전적 변이가 항-에스트로겐 약물(타목시펜) 또는 항-Her2 항체(Herceptiin)이 치료 계획 내에 포함되어야 하는지 여부를 결정한다. 필라델피아 염색체의 만성 골수성 백혈병(chronic myeloid leukemia, CML) 진단에서, Bcr 및 Abl 수용체 티로신 키나아제를 코딩하는 유전자를 융합하는 유전적 전좌(genetic translocation)는 Bcr-Abl 키나아제의 특이적 저해제인 Gleevec(STI571)이 암의 치료를 위해 이용되어야 한다는 것을 나타낸다. 그와 같은 유전적 변화를 갖는 CML 환자의 경우, Bcr-Abl 키나아제의 저해는 종양 세포의 신속한 제거 및 백혈병의 완화를 가져온다.
유방암의 예방 또는 치료를 위해 범용적으로 성공적인 방법은 현재 존재하지 않는다. 유방암의 관리는 현재 일차적 예방(primary prevention), 조기 진단, 적합한 치료 및 이차적 예방(secondary prevention)의 조합에 의존한다. 유전적 검사를 이 관리 영역의 모든 측면에 통합시켜야 하는 임상적 요구가 존재한다. 암 감수성 유전자의 확인은 또한 (예를 들면, 저분자량 또는 고분자량 약물을 이용하여) 처리될 수 있고 보다 효과적인 치료법을 유도할 수 있는 주요한 분자적 경로를 규명할 수 있다.
발명의 요약
본 발명은 유방암의 위험도를 평가하는 방법에 관한 것이다. 위험도 평가는 본 명세서에서 설명되는 바와 같이, 유방암과 연관된 것으로 확인된 특정한 마커 또는 일배체형(haplotype)을 평가하는 것에 의해, 개인에서 유방암에 대한 증가된 감수성을 결정하는 방법, 및 개인에서 유방암에 대한 감소된 감수성을 결정하거나, 또는 유방암에 대한 보호(protection)를 진단하는 방법을 포함한다.
제1 양태에서, 본 발명은 개인으로부터 수득된 핵산 시료 또는 개인으로부터 유래된 유전형 데이터세트(genotype dataset)에서 하나 이상의 다형성 마커의 하나 이상의 대립인자의 존재 또는 부재를 결정하는 단계를 포함하는, 개인에서 유방암에 대한 감수성을 결정하는 방법으로서, 상기 하나 이상의 다형성 마커는 표 10, 표 15 및 표 19 중 하나에 표시된 다형성 마커들, 및 이들과 연관 불균형(linkage disequilibrium)인 마커들로부터 선택되고, 상기 하나 이상의 대립인자의 존재는 상기 개인의 유방암에 대한 감수성을 나타내는 것인 방법에 관한 것이다. 일 구체예에서, 상기 방법은 상기 개인으로부터 수득된 핵산 시료에서 하나 이상의 다형성 마커의 하나 이상의 대립인자의 존재 또는 부재의 결정에 관한 것이다. 또 다른 구체예에서, 상기 방법은 상기 개인으로부터 유래된 유전형 데이터세트에서 하나 이상의 다형성 마커의 하나 이상의 대립인자의 존재 또는 부재의 결정에 관한 것이다. 특정한 구체예에서, 유전형 데이터세트는 특정한 핵산 시료 주형과 관련된 유전형 데이터세트에 담긴 정보에 의해 특정한 개인으로부터 유래될 수 있고, 상기 핵산 시료는 1명의 개인으로부터 유래된 핵산을 포함한다.
다형성 마커의 특정한 감수성 대립인자의 존재의 결정은 그 대립인자에 의해 부여된 특정한 감수성의 존재에 대한 직접적인 표시를 제공한다. 반면에, 그와 같은 감수성 대립인자의 부재의 결정은 유전형 시료 또는 유전형 데이터세트가 유래된 개인에 상기 특정한 감수성이 존재하지 않는다는 표시를 제공한다. SNP 또는 삽입/결실 다형성과 같은 두개의 가능한 대립인자를 갖는 다형성 마커의 특정한 경우에, 특정한 대립인자의 부재의 결정은 (개인에서 특정한 게놈 영역이 결실 또는 중복을 포함하여, 상기 개인의 게놈 내의 특정한 게놈 영역의 단일 카피 또는 두개 이상의 카피가 존재할 수 있는 경우가 아니라면) 개인에서 대안적인 대립인자의 두 개의 카피의 존재를 나타낸다.
제2 양태에서, 본 발명은 개인에서 유방암에 대한 감수성을 진단하는 방법으로서, 상기 방법은 상기 개인으로부터 수득된 핵산 시료에서 하나 이상의 다형성 마커의 하나 이상의 대립인자의 존재 또는 부재를 결정하는 단계를 포함하고, 상기 하나 이상의 다형성 마커는 rs4848543 LD 블럭, rs3803662 LD 블럭, 및 rs13387042 LD 블럭과 연관된 마커들의 군으로부터 선택되고, 상기 하나 이상의 대립인자의 존재는 유방암에 대한 감수성을 나타내는 것인 방법에 관한 것이다. 일 구체예에서, rs4848543 LD 블럭, rs3803662 LD 블럭 및/또는 rs13387042 LD 블럭과 연관된 마커들은 이 LD 블럭들 중 하나 이상 내에 있는 하나 이상의 마커와 연관 불균형인 마커들이다.
또 다른 양태에서, 본 발명은 개인에서 유방암에 대한 감수성을 진단하는 방법으로서, 상기 방법은 개인으로부터 수득된 핵산 시료에서 하나 이상의 다형성 마커의 하나 이상의 대립인자의 존재 또는 부재를 결정하는 단계를 포함하고, 상기 하나 이상의 다형성 마커는 표 10, 표 15 및 표 19에 표시된 다형성 마커들, 및 이들과 연관 불균형인 마커들로부터 선택되는 것인 방법에 관한 것이다. 하나의 특정한 구체예에서, 표 10, 표 15 및 표 19에 열거된 마커들과 연관 불균형인 마커들은 0.2보다 큰 r2의 값을 갖는 마커들이다. 또 다른 구체예에서, 표 10, 표 15 및 표 19에 열거된 마커들과 연관 불균형인 마커들은 HapMap CEPH 집단과 같은 코카서스계 집단에서 0.2보다 큰 r2의 값을 갖는 마커들이다.
또 다른 양태에서, 본 발명은 유방암에 대한 감수성을 평가하기 위해 이용될 마커를 확인하는 방법으로서, 상기 방법은
a. 서열번호 4, 서열번호 5 및 서열번호 6으로 표시된 서열을 갖는 게놈 세그먼트 내의 하나 이상의 마커와 연관 불균형인 하나 이상의 다형성 마커를 확인하는 단계,
b. 유방암으로 진단되거나 또는 유방암에 대한 감수성을 갖는 개인의 시료의 유전형 상태(genotype status)를 결정하는 단계, 및
c. 대조군 개인의 시료의 유전형 상태를 결정하는 단계를 포함하고,
상기 대조군 시료에서의 하나 이상의 다형성의 하나 이상의 대립인자의 빈도 대비, 유방암으로 진단되거나, 또는 유방암에 대한 감수성을 갖는 개인에서 상기 하나 이상의 대립인자의 빈도의 유의성 있는 차이는 상기 하나 이상의 다형성이 유방암에 대한 감수성을 평가하기 위해 유용하다는 것을 나타내는 것인 방법에 관한 것이다. 일 구체예에서, 상기 대조군 시료에서의 상기 하나 이상의 다형성의 하나 이상의 대립인자의 빈도 대비, 유방암으로 진단되거나, 또는 유방암에 대한 감수성을 갖는 개인에서 상기 하나 이상의 대립인자의 빈도의 증가는 상기 하나 이상의 다형성이 유방암에 대한 증가된 감수성을 평가하기 위해 유용하다는 것을 나타낸다. 또 다른 구체예에서, 상기 대조군 시료에서의 상기 하나 이상의 다형성의 하나 이상의 대립인자의 빈도 대비, 유방암으로 진단되거나, 또는 유방암에 대한 감수성을 갖는 개인에서 상기 하나 이상의 대립인자의 빈도의 감소는 상기 하나 이상의 다형성이 유방암에 대한 감소된 감수성 또는 보호를 평가하기 위해 유용하다는 것을 나타낸다. 일 구체예에서, 서열번호 4, 서열번호 5 및 서열번호 6에 표시된 서열을 갖는 게놈 세그먼트 내의 마커들 중 하나 이상과 연관 불균형인 하나 이상의 다형성 마커는 rs4848543 (서열번호 1), rs3803662 (서열번호 3) 및 rs13387042 (서열번호 2)로부터 선택된다.
본 발명은 또한, 유방암에 대한 위험을 갖거나, 또는 유방암으로 진단된 개인으로부터 수득된 핵산 시료에서 하나 이상의 다형성 마커의 하나 이상의 대립인자의 존재 또는 부재를 결정하는 단계를 포함하는, 개인으로부터 수득된 핵산 시료의 유전형을 분석하는 방법으로서, 상기 하나 이상의 마커는 표 10, 표 15 및 표 19에 표시된 마커들, 및 이들과 연관 불균형인 마커들로 구성된 군으로부터 선택되고, 상기 하나 이상의 다형성 마커의 상기 하나 이상의 대립인자의 존재 또는 부재는 유방암의 감수성을 나타내는 것인 방법에 관한 것이다. 일 구체예에서, 상기 하나 이상의 마커는 rs4848543 (서열번호 1), rs3803662 (서열번호 3) 및 rs13387042 (서열번호 2)로부터 선택된다. 또 다른 구체예에서, 유전형 분석은 상기 하나 이상의 다형성 마커를 플랭킹(flanking)하는 뉴클레오티드 프라이머 쌍을 이용한 중합효소 연쇄 반응(PCR)에 의해, 상기 하나 이상의 다형성 마커를 포함하는 핵산의 세그먼트를 증폭하는 단계를 포함한다. 또 다른 구체예에서, 유전형 분석은 대립인자-특이적 프로브 혼성화, 대립인자-특이적 프라이머 연장(primer extension), 대립인자-특이적 증폭, 핵산 서열결정(nucleic acid sequencing), 5'-엑소뉴클레아제 처리(exonuclease digestion), 분자 표지 분석법(molecular beacon assay), 올리고뉴클레오티드 라이게이션 분석법(oligonucleotide ligation assay), 크기 분석, 및 단일 가닥 구조 분석(single-stranded conformation analysis)으로부터 선택된 방법을 이용하여 수행된다. 하나의 바람직한 구체예에서, 상기 방법은 대립인자-특이적 프로브 혼성화를 포함한다. 또 다른 구체예에서, 상기 방법은 DNA 서열결정을 포함한다. 특히 바람직한 구체예에서, 상기 방법은
1) 상기 핵산의 카피를 검출 올리고뉴클레오티드 프로브 및 인핸서 올리고뉴클레오티드 프로브와, 상기 올리고뉴클레오티드 프로브와 상기 핵산 간의 특이적 혼성화 조건 하에 접촉시키는 단계로서,
a) 상기 검출 올리고뉴클레오티드 프로브는 길이가 5 내지 100개의 뉴클레오티드로 구성되고 서열번호 4, 서열번호 5 또는 서열번호 6에 의해 주어진 뉴클레오티드 서열을 갖는 핵산의 제1 세그먼트에 특이적으로 혼성화되고,
b) 상기 검출 올리고뉴클레오티드 프로브는 3' 말단의 검출가능한 표지 및 5' 말단의 퀀칭 모이어티(quenching moiety)를 포함하며,
c) 상기 인핸서 올리고뉴클레오티드는 길이가 5 내지 100개의 뉴클레오티드로 구성되고 상기 올리고뉴클레오티드 프로브의 5'에 배열된 상기 뉴클레오티드 서열의 제2 세그먼트에 상보적이어서, 상기 두개의 올리고뉴클레오티드가 모두 상기 핵산에 혼성화되는 경우 상기 인핸서 올리고뉴클레오티드는 상기 검출 올리고뉴클레오티드에 대해 3' 에 위치하며, 및
d) 상기 제1 세그먼트와 상기 제2 세그먼트 간에 단일 염기 갭(single base gap)이 존재하여, 상기 올리고뉴클레오티드 프로브와 상기 인핸서 올리고뉴클레오티드 프로브가 모두 상기 핵산에 혼성화되는 경우, 상기 올리고뉴클레오티드 간에 단일 염기 갭이 존재하는 것인 단계,
2) 상기 검출 프로브가 상기 핵산에 혼성화되는 경우, 상기 검출 프로브의 3' 말단으로부터 상기 검출가능한 표지를 절단하여 유리된 검출가능한 표지를 방출시키는 엔도뉴클레아제로 상기 핵산을 처리하는 단계, 및
3) 유리된 검출가능한 표지를 측정하는 단계로서, 상기 유리된 검출가능한 표지의 존재는 상기 검출 프로브가 상기 핵산의 제1 세그먼트에 특이적으로 혼성화되고, 상기 다형성 부위의 서열이 상기 검출 프로브의 상보체(complement)라는 것을 나타내는 것인 단계를 포함한다.
본 발명의 또 다른 양태는 유방암 치료제에 대한 반응의 확률에 대해 개인을 평가하는 방법으로서, 상기 개인으로부터 수득된 핵산 시료에서 하나 이상의 다형성 마커의 하나 이상의 대립인자의 존재 또는 부재를 결정하는 단계를 포함하고, 상기 하나 이상의 다형성 마커는 표 10, 표 15 및 표 19에 표시된 다형성 마커들, 및 이들과 연관 불균형인 마커들로 구성된 군으로부터 선택되고, 상기 하나 이상의 마커의 상기 하나 이상의 대립인자의 존재는 상기 치료제에 대한 양성 반응의 확률을 나타내는 것인 방법에 관한 것이다. 일 구체예에서, 상기 치료제는 화학요법제 또는 호르몬 요법제이다. 일 구체예에서, 상기 호르몬 요법제는 선택적 에스트로겐 수용제 조절제(Selective Estrogen Receptor Modulator) 또는 아로마타아제 저해제(Aromatase inhibitor)이다. 바람직한 구체예에서, 상기 선택적 에스트로겐 수용체 조절제는 타목시펜 및 랄록시펜으로부터 선택된다. 일부 구체예에서, 상기 아로마타아제 저해제는 엑세메스탄(Exemestane), 아나스트로졸(Anastrozole) 및 레트로졸(Letrozole)로부터 선택된다. 다른 구체예에서, 상기 선택적 에스트로겐 수용체 조절제는 아로마타아제 저해제와 조합되어 투여된다.
본 발명의 또 다른 양태는 유방암으로 진단된 개인의 예후(prognosis)를 예측하는 방법으로서, 상기 방법은 상기 개인으로부터 수득된 핵산 시료에서 하나 이상의 다형성 마커의 하나 이상의 대립인자의 존재 또는 부재를 결정하는 단계를 포함하고, 상기 하나 이상의 다형성 마커는 표 10, 표 15 및 표 19에 표시된 다형성 마커들, 및 이들과 연관 불균형인 마커들로 구성된 군으로부터 선택되고, 상기 하나 이상의 대립인자의 존재는 상기 개인에서 유방암의 악화된 예후를 나타내는 것인 방법에 관한 것이다. 상기 개인의 예후는 원칙적으로 이차 종양의 형성, 종양의 급속한 확산, 종양의 등급(단계 0 내지 단계 IV) 및 종양의 재발을 포함하나, 이에 한정되지 않는, 질환의 진행의 특징적인 패턴에 관한 것이다.
본 발명은 또한, 유방암의 치료를 받는 개인의 치료의 진행을 모니터링하는 방법으로서, 상기 방법은 상기 개인으로부터 수득된 핵산 시료에서 하나 이상의 다형성 마커의 하나 이상의 대립인자의 존재 또는 부재를 결정하는 단계를 포함하고, 상기 하나 이상의 다형성 마커는 표 10, 표 15 및 표 19에 표시된 마커들, 및 이들과 연관 불균형인 마커들로부터 선택되고, 상기 하나 이상의 대립인자의 존재가 상기 개인의 치료 결과를 나타내는 것인 방법에 관한 것이다. 치료는 외과수술적 치료, 화학요법 치료, 방산선 치료, 유전자 치료 또는 면역치료 중 하나일 수 있다. 상기 치료는 단독으로 또는 조합되어 이용될 수 있다. 예를 들면, 외과수술적 치료는 화학요법 치료 및/또는 방사선요법 치료로 이어질 수 있다. 상기 개인의 치료 결과는 치료의 완료시 상기 개인의 종양의 진행과 관련된다. 그와 같은 결과의 척도는 종양의 재발율 또는 가능성, 종양의 확산, 및 이차 종양의 형성을 포함하나, 이에 한정되지 않는다.
본 발명의 또 다른 양태는 개인에서 유방암에 대한 감수성을 평가하기 위한 키트로서, 상기 키트는 상기 개인의 게놈에서 하나 이상의 다형성 마커의 하나 이상의 대립인자를 선택적으로 검출하는 시약을 포함하고, 상기 다형성 마커는 표 10, 15 및 19에 표시된 마커들, 및 이들과 연관 불균형인 마커들로부터 선택되고, 상기 하나 이상의 대립인자의 존재는 유방암에 대한 감수성을 나타내는 것인 키트에 관한 것이다. 일 구체예에서, 상기 하나 이상의 다형성 마커는 rs4848543 (서열번호 1), rs3803662 (서열번호 3) 또는 rs13387042 (서열번호 2)이다. 또 다른 양태에서, 상기 시약은 상기 하나 이상의 다형성 마커를 포함하는 상기 개인의 게놈의 단편에 혼성화하는 하나 이상의 연속된(contiguous) 올리고뉴클레오티드, 완충액 및 검출가능한 표지를 포함한다. 또 다른 양태에서, 상기 시약은 상기 개인으로부터 수득된 게놈 핵산 세그먼트의 반대쪽 가닥에 혼성화하는 한 쌍 이상의 올리고뉴클레오티드를 포함하고, 상기 각 올리고뉴클레오티드 프라이머 쌍은 하나의 다형성 마커를 포함하는 상기 개인의 게놈의 단편을 선택적으로 증폭시키도록 설계되고, 상기 단편은 크기가 30 bp 이상이다. 또 다른 구체예에서,상기 하나 이상의 올리고뉴클레오티드는 상기 개인의 게놈에 완전히 상보적이다. 또 다른 구체예에서, 상기 올리고뉴클레오티드는 길이가 18개 내지 50개의 뉴클레오티드로 구성된다. 또 다른 구체예에서, 상기 올리고뉴클레오티드는 길이가 20개 내지 30개의 뉴클레오티드로 구성된다. 바람직한 구체예에서, 상기 키트는:
a. 길이가 5 내지 100개의 뉴클레오티드로 구성된 검출 올리고뉴클레오티드 프로브;
b. 길이가 5 내지 100개의 뉴클레오티드로 구성된 인핸서 올리고뉴클레오티드 프로브; 및
c. 엔도뉴클레아제 효소;를 포함하고,
상기 검출 올리고뉴클레오티드 프로브는 서열번호 4, 서열번호 5 또는 서열번호 6으로 표시된 뉴클레오티드 서열의 핵산의 제1 세그먼트에 특이적으로 혼성화되고; 및
상기 검출 올리고뉴클레오티드 프로브는 3' 말단에 검출가능한 표지를 포함하고 5' 말단에 퀀칭 모이어티(quenching moiety)를 포함하며;
상기 인핸서 올리고뉴클레오티드는 길이가 5개 내지 100개의 뉴클레오티드로 구성되고, 상기 올리고뉴클레오티드 프로브의 5'에 배열된 상기 뉴클레오티드 서열의 제2 세그먼트에 상보적이어서, 상기 인핸서 올리고뉴클레오티드는 상기 두개의 올리고뉴클레오티드가 모두 상기 핵산에 혼성화되는 경우 상기 검출 올리고뉴클레오티드에 대해 3'에 위치하며; 및
상기 제1 세그먼트와 상기 제2 세그먼트 간에 단일 염기 갭이 존재하여, 상기 올리고뉴클레오티드 프로브와 상기 인핸서 올리고뉴클레오티드 프로브가 모두 상기 핵산에 혼성화되는 경우, 상기 올리고뉴클레오티드 간에 단일 염기 갭이 존재하며; 및
상기 핵산을 상기 엔도뉴클레아제에 의해 처리하는 단계는 상기 검출 프로브가 상기 핵산에 혼성화된 경우, 상기 검출 프로브의 3'말단으로부터 상기 검출가능한 표지를 절단하여 유리 상태의 검출가능한 표지를 방출시킨다.
본 발명의 또 다른 양태는 개인에서 유방암에 대한 유전적 지표(genetic indicator)를 결정하는 장치로서,
컴퓨터 판독가능한 메모리; 및
상기 컴퓨터 판독가능한 메모리 상에 저장된 루틴(routine)을 포함하고,
상기 루틴은 표 10, 표 15 및 표 19에 표시된 마커들, 및 이들과 연관 불균형인 마커들로부터 선택되는 하나 이상의 다형성 마커에 대해 하나 이상의 개인의 마커 및/또는 일배체형 데이터를 분석하고, 상기 마커 또는 일배체형 정보에 기반한 결과물(output)을 생성하기 위해 프로세서 상에서 실행되도록 개조되고, 상기 결과물은 상기 개인의 유방암의 유전적 지표로서 상기 하나 이상의 마커 및/또는 일배체형의 위험도 척도(risk measure)를 포함하는 것인 장치에 관한 것이다. 일 구체예에서, 상기 루틴은 상기 하나 이상의 마커 대립인자 및/또는 일배체형과 연관된 유방암의 위험도 척도를 더 포함하고, 상기 위험도 척도는 유방암으로 진단된 복수의 개인에서 하나 이상의 다형성 마커의 하나 이상의 대립인자 또는 하나 이상의 일배체형의 빈도의 지표와 복수의 기준(reference) 개인에서 상기 하나 이상의 다형성 마커의 하나 이상의 대립인자 및/또는 일배체형의 빈도의 지표의 비교에 기반하며, 상기 개인의 개별적인 위험도는 상기 하나 이상의 마커 대립인자 및/또는 일배체형에 대한 상기 개인의 보인자 상태(carrier status)와 상기 하나 이상의 마커 대립인자 및/또는 일배체형에 대한 위험도 척도의 비교에 기반한다. 일 구체예에서, 상기 하나 이상의 다형성 마커는 rs4848543 (서열번호 1), rs3803662 (서열번호 3) 또는 rs13387042 (서열번호 2), 및 이들과 연관 불균형인 마커들로부터 선택된다.
본 발명은 또한, 개인에서 유방암에 대한 감수성을 진단 및/또는 평가하기 위한 시약의 제조에서 올리고뉴클레오티드 프로브의 용도로서, 상기 프로브는 서열번호 4, 서열번호 5 또는 서열번호 6으로 표시된 뉴클레오티드 서열을 갖는 핵산의 세그먼트에 혼성화되고, 상기 프로브는 길이가 15 내지 500개의 뉴클레오티드로 구성되는 것인 용도에 관한 것이다.
본 발명은 또한,
a. 하나 이상의 다형성 마커에 대한 식별자(identifier);
b. 유방암으로 진단된 복수의 개인에서 상기 하나 이상의 다형성 마커의 하나 이상의 대립인자의 빈도의 지표(indicator); 및
c. 복수의 기준 개인(reference individual)에서 상기 하나 이상의 다형성 마커의 상기 하나 이상의 대립인자의 빈도의 지표;가 저장되고,
상기 하나 이상의 다형성 마커는 표 10, 표 15 및 표 19에 표시된 다형성 마커들, 및 이들과 연관 불균형인 다형성 마커들로부터 선택되는 것인 컴퓨터-판독가능한 매체(computer-readable medium)에 관한 것이다.
본 발명의 일부 구체예에서, 상기 개인에서 하나 이상의 일배체형의 빈도가 더 평가되고, 상기 일배체형은 둘 이상의 마커를 포함하며, 상기 하나 이상의 일배체형의 존재는 유방암에 대한 감수성을 나타낸다. 일 구체예에서, 상기 일배체형은 유방암에 대한 위험 일배체형(at-risk haplotype)이고, 즉, 상기 일배체형은 유방암을 발병할 증가된 위험도를 부여한다. 일 구체예에서, 상기 일배체형은 표 7, 표 8, 표 9, 표 13, 표 14 및 표 18에 열거된 일배체형의 군으로부터 선택된다.
본 발명의 또 다른 구체예에서, 상기 하나 이상의 다형성 마커의 하나 이상의 대립인자는 표 9 및 표 13에 열거된 일배체형에 의해 정의된 일배체형 백그라운드(haplotype background)의 군으로부터 선택된 일배체형 백그라운드 상에 존재한다. 또 다른 구체예에서, 본 발명의 방법은 유방암에 대한 고 침투성(high penetrance) 유전적 인자를 분석하는 단계를 더 수행하는 것에 관한 것이다. 일 구체예에서, 그와 같은 고 침투성 유전적 인자는 BRCA2 999del5이다. 최근의 증거는 BRCA1 및 BRCA2 변이와 연관된 위험도가 일부 경우에 가족에서 클러스터링(cluster)된 다른 유전적 인자 또는 환경적 인자에 의해 변형된다는 것을 시사한다(Antoniou, A.C., et al. Am J Hum Genet 2008 Mar 18 (Epub ahead of print)). 따라서, 일부 구체예에서, 본 발명이 속하는 기술 분야의 당업자에게 잘 기록되고 알려진(예를 들면, Breast Cancer Mutation Data Base at: http://research.nhgri.nih.gov/bic/ 참조; 또한, 예를 들면, Fackenthal, J.D. & Olopade, O.I., Nature Reviews Cancer 7:937-48 (2007) 및 상기 문헌에서 인용된 참조문헌 참조), BRCA1 및 BRCA2 유전자에서 발견된 고 침투성 돌연변이와 같은, 유방암에 대한 다른 고 침투성 돌연변이가 평가되고 본 명세서에서 유방암과 연관된 것으로 기재된 변이들과 조합될 수 있다.
본 발명의 일 구체예에서, 에스트로겐 수용체 또는 프로게스테론 수용체 상태에 대해 상기 개인을 평가하는 추가적인 단계가 수행된다. 하나의 그와 같은 구체예에서, 에스트로겐 양성 상태 또는 프로게스테론 양성 상태는 rs13387042 대립인자 A 및 rs3803662 대립인자 T, 및 이들과 연관된 마커들, 예를 들면, 표 15 및 표 19에 표시된 마커들과 연관된 증가된 위험도와 연관된다.
또 다른 양태에서, 본 발명은 이전에 유방암으로 진단되었던 개인에서 하나 이상의 제2 원발성 종양(second primary tumor)을 발병할 위험도를 진단하는 방법으로서, 상기 방법은 상기 개인으로부터 수득된 핵산 시료 또는 개인으로부터 유래된 유전형 데이터세트에서 하나 이상의 다형성 마커의 하나 이상의 대립인자의 존재 또는 부재를 결정하는 단계를 포함하고, 상기 하나 이상의 다형성 마커는 rs4848543 LD 블럭, rs13387042 LD 블럭, 및 rs3803662 LD 블럭과 연관된 마커들의 군으로부터 선택되며, 상기 하나 이상의 대립인자의 존재는 하나 이상의 제2 원발성 종양을 발병할 위험도를 나타내는 것인 방법에 관한 것이다. 일 구체예에서, 상기 하나 이상의 다형성 마커는 표 10, 표 15 및 표 19 중 하나에 표시된 마커들로부터 선택된다. 또 다른 구체예에서, 상기 하나 이상의 마커는 rs4848543 LD 블럭과 연관된다. 일 구체예에서, 상기 하나 이상의 다형성 마커는 표 10, 표 15, 표 19, 표 20, 표 21 및 표 22에 열거된 다형성 마커들, 및 이들과 연관 불균형인 마커들로 구성된 군으로부터 선택된다. 또 다른 구체예에서, 상기 하나 이상의 다형성 마커는 마커 rs4848543과, 0.2보다 큰 r2 값에 의해 정의된 강한 연관 불균형인 마커들의 군으로부터 선택된다. 또 다른 구체예에서, 상기 하나 이상의 다형성 마커는 표 7, 표 8 및 표 10에 열거된 마커들의 군으로부터 선택된다. 또 다른 구체예에서, 상기 하나 이상의 다형성 마커는 표 10에 표시된 마커들로부터 선택된다. 또 다른 구체예에서, 상기 하나 이상의 다형성 마커는 STEAP3/TSAP6 유전자와 연관된다. 바람직한 구체예에서, 상기 마커는 rs4848543이다. 다른 구체예에서, 상기 개인에서 하나 이상의 일배체형의 빈도를 평가하는 추가적인 단계가 수행된다. 일 구체예에서, 이 하나 이상의 일배체형은 표 7, 표 8 및 표 9에 열거된 일배체형의 군으로부터 선택된다. 다른 구체예에서, BRCA2 999del5와 같은, 유방암에 대한 고 침투성 유전적 인자가 또한 평가된다.
일부 구체예에서, 본 명세서에 기재된 바와 같은 본 발명에 다른 유방암 표현형은 모든 유방암(All Breast Cancer), 다발성 원발성 유방암(Multiple Primary Breast Cancer), 조기 발병 유방암(early onset Breast Cancer) 또는 유방암을 정의하는 다른 의학적으로 인정되는 진단 방법에 의해 정의된 유방암으로부터 선택될 수 있다. 또 다른 구체예에서, FHS(summed family history)가 유방암과 연관된 표현형이다.
본 명세서에 기재된 바와 같은, 본 발명의 방법, 용도, 키트, 또는 장치의 특정한 구체예에서, 평가대상 개인은 여성이다.
본 명세서에서 유방암에 대한 감수성을 검출하기 위해 유용한 것으로 개시된 마커들은 모두 본 명세서에 기재된 다양한 방법, 키트, 장치 및 용도에서 이용될 수 있다. 따라서, 일부 구체예에서, 본 발명을 실시하기 위해 유용한 하나 이상의 다형성 마커는 표 20, 표 21 및 표 22에 열거된 다형성 마커들, 및 이들과 연관 불균형인 마커들로 구성된 군으로부터 선택될 수 있다. 또 다른 구체예에서, 상기 하나 이상의 다형성 마커는 표 10, 표 15 및 표 19에 열거된 마커들, 및 이들과 연관 불균형인 마커들의 군으로부터 선택된다. 일부 구체예에서, 상기 하나 이상의 다형성 마커는 서열번호 4, 서열번호 5 및 서열번호 6 중 하나에 표시된 서열을 갖는 게놈 세그먼트 내에 위치한다. 하나의 바람직한 구체예에서, 상기 서열번호 4 내의 하나 이상의 마커는 표 20에 표시된 마커들로부터 선택된다. 또 다른 바람직한 구체예에서, 상기 서열번호 5 내의 하나 이상의 마커는 표 21에 표시된 마커들로부터 선택된다. 또 다른 바람직한 구체예에서, 상기 서열번호 6 내의 하나 이상의 마커는 표 22에 표시된 마커들로부터 선택된다. 또 다른 구체예에서, 상기 하나 이상의 다형성 마커는 표 7, 8, 10, 14, 15, 18 및 19에 열거된 마커들의 군으로부터 선택된다. 또 다른 구체예에서, 상기 하나 이상의 다형성 마커는 rs4848543 (서열번호 1), rs3803662 (서열번호 3) 또는 rs13387042 (서열번호 2)와, 0.2보다 큰 r2의 값에 의해 정의된 강한 연관 불균형인 마커들의 군으로부터 선택된다. 바람직한 구체예에서, 상기 하나 이상의 다형성 마커는 rs4848543 (서열번호 1), rs3803662 (서열번호 3) 및 rs13387042 (서열번호 2)로부터 선택된다. 또 다른 바람직한 구체예에서, 상기 하나 이상의 다형성 마커는 rs4848543 (서열번호 1)이다. 또 다른 바람직한 구체예에서, 상기 하나 이상의 다형성 마커는 rs3803662 (서열번호 3)이다. 또 다른 바람직한 구체예에서, 상기 하나 이상의 다형성 마커는 rs13387042 (서열번호 2)이다. 또 다른 구체예에서, 상기 하나 이상의 다형성 마커는 STEAP3/TSAP6 유전자, LOC643714 유전자, 및/또는 TNRC9 유전자와 연관된다(즉, 연관 불균형이다). 하나의 그와 같은 구체예에서, 상기 하나의 다형성 마커는 STEAP3/TSAP6 유전자, LOC643714 유전자, 및/또는 TNRC9 유전자 내에 위치한다. 또 다른 바람직한 구체예에서, 상기 하나 이상의 다형성 마커는 rs4848543, rs13387042, rs3803662, rs12922061, rs4784227 및 rs17271951로부터 선택된다.
본 발명의 특정한 방법, 용도, 키트 또는 장치에서, 하나 이상의 대립인자 또는 일배체형의 존재는 유방암에 대한 증가된 감수성을 나타낸다. 본 발명의 다른 방법에서, 하나 이상의 대립인자 또는 일배체형의 존재는 유방암에 대한 감소된 감수성을 나타낸다. 일 구체예에서, 유방암에 대한 증가된 감수성은 하기로 구성된 일배체형 백그라운드의 군으로부터 선택된 일배체형 백그라운드 상에 존재한다:
(i) rs8955398 대립인자 2, rs4848543 대립인자 1, rs6759589 대립인자 1, rs838066 대립인자 2, rs838100 대립인자 3, rs838086 대립인자 1, rs12711924 대립인자 1 및 rs3731603 대립인자 4;
(ii) rs8955398 대립인자 4, rs4848543 대립인자 1, rs6759589 대립인자 1, rs838066 대립인자 2, rs838100 대립인자 3, rs838086 대립인자 1, rs12711924 대립인자 1 및 rs3731603 대립인자 4;
(iii) rs8955398 대립인자 4, rs4848543 대립인자 1, rs6759589 대립인자 1, rs838066 대립인자 2, rs838100 대립인자 3, rs838086 대립인자 2, rs12711924 대립인자 1 및 rs3731603 대립인자 4;
(iv) rs8955398 대립인자 2, rs4848543 대립인자 1, rs6759589 대립인자 1, rs838066 대립인자 2, rs838100 대립인자 3, rs838086 대립인자 2, rs12711924 대립인자 1 및 rs3731603 대립인자 3;
(v) rs8955398 대립인자 4, rs4848543 대립인자 1, rs6759589 대립인자 1, rs838066 대립인자 2, rs838100 대립인자 3, rs838086 대립인자 1, rs12711924 대립인자 1 및 rs3731603 대립인자 3;
(vi) rs8955398 대립인자 2, rs4848543 대립인자 1, rs6759589 대립인자 1, rs838066 대립인자 2, rs838100 대립인자 3, rs838086 대립인자 1, rs12711924 대립인자 1 및 rs3731603 대립인자 4.
또 다른 구체예에서, 유방암에 대한 증가된 감수성은 하기로 구성된 일배체형 백그라운드의 군으로부터 선택된 일배체형 백그라운드 상에 존재한다:
(i) rs10191184 대립인자 3, rs6435957 대립인자 4, rs10171745 대립인자 3, rs6716542 대립인자 1, rs4491709 대립인자 4, rs12621130 대립인자 1, rs6735174 대립인자 1, rs6435959 대립인자 2, rs2372943 대립인자 3, rs13387042 대립인자 1, rs10490444 대립인자 1, rs13011060 대립인자 3;
(ii) rs10191184 대립인자 3, rs6435957 대립인자 4, rs10171745 대립인자 3, rs6716542 대립인자 3, rs4491709 대립인자 4, rs12621130 대립인자 1, rs6735174 대립인자 2, rs6435959 대립인자 4, rs2372943 대립인자 3, rs13387042 대립인자 1, rs10490444 대립인자 3, rs13011060 대립인자 3;
(iii) rs10191184 대립인자 3, rs6435957 대립인자 2, rs10171745 대립인자 3, rs6716542 대립인자 3, rs4491709 대립인자 4, rs12621130 대립인자 1, rs6735174 대립인자 2, rs6435959 대립인자 4, rs2372943 대립인자 3, rs13387042 대립인자 1, rs10490444 대립인자 3, rs13011060 대립인자 3;
(iv) rs10191184 대립인자 3, rs6435957 대립인자 4, rs10171745 대립인자 3, rs6716542 대립인자 3, rs4491709 대립인자 4, rs12621130 대립인자 1, rs6735174 대립인자 1, rs6435959 대립인자 2, rs2372943 대립인자 3, rs13387042 대립인자 1, rs10490444 대립인자 3, rs13011060 대립인자 3;
(v) rs10191184 대립인자 3, rs6435957 대립인자 4, rs10171745 대립인자 1, rs6716542 대립인자 3, rs4491709 대립인자 2, rs12621130 대립인자 1, rs6735174 대립인자 1, rs6435959 대립인자 2, rs2372943 대립인자 3, rs13387042 대립인자 1, rs10490444 대립인자 1, rs13011060 대립인자 3;
(vi) rs10191184 대립인자 3, rs6435957 대립인자 4, rs10171745 대립인자 3, rs6716542 대립인자 3, rs4491709 대립인자 4, rs12621130 대립인자 1, rs6735174 대립인자 2, rs6435959 대립인자 4, rs2372943 대립인자 3, rs13387042 대립인자 1, rs10490444 대립인자 3, rs13011060 대립인자 1;
(vii) rs10191184 대립인자 3, rs6435957 대립인자 4, rs10171745 대립인자 3, rs6716542 대립인자 1, rs4491709 대립인자 4, rs12621130 대립인자 1, rs6735174 대립인자 1, rs6435959 대립인자 2, rs2372943 대립인자 3, rs13387042 대립인자 1, rs10490444 대립인자 1, rs13011060 대립인자 1;
(viii) rs10191184 대립인자 3, rs6435957 대립인자 2, rs10171745 대립인자 3, rs6716542 대립인자 1, rs4491709 대립인자 4, rs12621130 대립인자 1, rs6735174 대립인자 1, rs6435959 대립인자 2, rs2372943 대립인자 3, rs13387042 대립인자 1, rs10490444 대립인자 1, rs13011060 대립인자 3;
(ix) rs10191184 대립인자 3, rs6435957 대립인자 4, rs10171745 대립인자 3, rs6716542 대립인자 1, rs4491709 대립인자 4, rs12621130 대립인자 1, rs6735174 대립인자 1, rs6435959 대립인자 2, rs2372943 대립인자 3, rs13387042 대립인자 1, rs10490444 대립인자 3, rs13011060 대립인자 1;
(x) rs10191184 대립인자 3, rs6435957 대립인자 2, rs10171745 대립인자 3, rs6716542 대립인자 3, rs4491709 대립인자 4, rs12621130 대립인자 1, rs6735174 대립인자 1, rs6435959 대립인자 2, rs2372943 대립인자 3, rs13387042 대립인자 1, rs10490444 대립인자 1, rs13011060 대립인자 3.
하나의 바람직한 구체예에서, 상기 유방암의 증가된 위험도를 부여하는 하나 이상의 대립인자 또는 일배체형은 rs4848543 대립인자 1이다. 또 다른 구체예에서, 증가된 위험도는 1.25 이상의 위험도, 1.3 이상의 위험도, 1.4 이상의 위험도, 1.5 이상의 위험도, 1.6 이상의 위험도, 1.7 이상의 위험도, 및 2.0 이상의 위험도를 포함한, 1.2 이상의 상대적 위험도 또는 오즈비를 특징으로 한다.
본 발명의 일부 구체예에서, 상기 하나 이상의 대립인자 또는 일배체형의 존재는 유방암에 대한 감수된 감수성(감소된 위험도)을 나타낸다. 상기 하나 이상의 대립인자 또는 일배체형은 예를 들면, 1 미만의 상대적 위험도(relative risk, RR) 또는 오즈비(odds ratio, OR)를 갖는 표 8, 9, 13, 14 및 18에 열거된 마커 대립인자 및 일배체형의 군으로부터 선택될 수 있다. 일 구체예에서, 상기 유방암에 대한 감소된 감수성을 나타내는 하나 이상의 대립인자는 하기로 구성된 일배체형 백그라운드의 군으로부터 선택된 일배체형 백그라운드 상에 존재한다:
(i) rs895398 대립인자 2, rs4848543 대립인자 2, rs6759589 대립인자 3, rs838066 대립인자 4, rs838100 대립인자 1, rs838086 대립인자 1, rs12711924 대립인자 3 및 rs3731603 대립인자 3;
(ii) rs895398 대립인자 2, rs4848543 대립인자 2, rs6759589 대립인자 3, rs838066 대립인자 2, rs838100 대립인자 1, rs838086 대립인자 1, rs12711924 대립인자 3 및 rs3731603 대립인자 3;
(iii) rs895398 대립인자 2, rs4848543 대립인자 2, rs6759589 대립인자 1, rs838066 대립인자 2, rs838100 대립인자 3, rs838086 대립인자 2, rs12711924 대립인자 3 및 rs3731603 대립인자 3;
(iv) rs895398 대립인자 2, rs4848543 대립인자 2, rs6759589 대립인자 3, rs838066 대립인자 4, rs838100 대립인자 3, rs838086 대립인자 2, rs12711924 대립인자 3 및 rs3731603 대립인자 3;
(v) rs895398 대립인자 2, rs4848543 대립인자 2, rs6759589 대립인자 3, rs838066 대립인자 2, rs838100 대립인자 3, rs838086 대립인자 2, rs12711924 대립인자 3 및 rs3731603 대립인자 3;
(vi) rs895398 대립인자 2, rs4848543 대립인자 2, rs6759589 대립인자 1, rs838066 대립인자 2, rs838100 대립인자 3, rs838086 대립인자 1, rs12711924 대립인자 1 및 rs3731603 대립인자 4;
(vii) rs895398 대립인자 2, rs4848543 대립인자 2, rs6759589 대립인자 3, rs838066 대립인자 4, rs838100 대립인자 3, rs838086 대립인자 1, rs12711924 대립인자 1 및 rs3731603 대립인자 4;
(viii) rs895398 대립인자 2, rs4848543 대립인자 2, rs6759589 대립인자 1, rs838066 대립인자 2, rs838100 대립인자 3, rs838086 대립인자 1, rs12711924 대립인자 3 및 rs3731603 대립인자 3; 및
(ix) rs895398 대립인자 2, rs4848543 대립인자 2, rs6759589 대립인자 3, rs838066 대립인자 2, rs838100 대립인자 1, rs838086 대립인자 1, rs12711924 대립인자 1 및 rs3731603 대립인자 4.
또 다른 구체예에서, 유방암에 대한 감소된 감수성은 하기로 구성된 일배체형 백그라운드의 군으로부터 선택된 일배체형 백그라운드 상에 존재한다:
(i) rs10191184 대립인자 3, rs6435957 대립인자 2, rs10171745 대립인자 3, rs6716542 대립인자 3, rs4491709 대립인자 2, rs12621130 대립인자 3, rs6735174 대립인자 1, rs6435959 대립인자 2, rs2372943 대립인자 3, rs13387042 대립인자 3, rs10490444 대립인자 1, rs13011060 대립인자 3;
(ii) rs10191184 대립인자 3, rs6435957 대립인자 4, rs10171745 대립인자 3, rs6716542 대립인자 3, rs4491709 대립인자 4, rs12621130 대립인자 1, rs6735174 대립인자 1, rs6435959 대립인자 4, rs2372943 대립인자 1, rs13387042 대립인자 3, rs10490444 대립인자 3, rs13011060 대립인자 1;
(iii) rs10191184 대립인자 1, rs6435957 대립인자 4, rs10171745 대립인자 3, rs6716542 대립인자 3, rs4491709 대립인자 4, rs12621130 대립인자 1, rs6735174 대립인자 1, rs6435959 대립인자 4, rs2372943 대립인자 1, rs13387042 대립인자 3, rs10490444 대립인자 3, rs13011060 대립인자 1;
(iv) rs10191184 대립인자 3, rs6435957 대립인자 2, rs10171745 대립인자 3, rs6716542 대립인자 3, rs4491709 대립인자 2, rs12621130 대립인자 3, rs6735174 대립인자 1, rs6435959 대립인자 2, rs2372943 대립인자 3, rs13387042 대립인자 3, rs10490444 대립인자 1, rs13011060 대립인자 1;
(v) rs10191184 대립인자 1, rs6435957 대립인자 2, rs10171745 대립인자 1, rs6716542 대립인자 3, rs4491709 대립인자 2, rs12621130 대립인자 1, rs6735174 대립인자 1, rs6435959 대립인자 2, rs2372943 대립인자 3, rs13387042 대립인자 3, rs10490444 대립인자 3, rs13011060 대립인자 3;
(vi) rs10191184 대립인자 3, rs6435957 대립인자 4, rs10171745 대립인자 3, rs6716542 대립인자 3, rs4491709 대립인자 4, rs12621130 대립인자 1, rs6735174 대립인자 1, rs6435959 대립인자 4, rs2372943 대립인자 1, rs13387042 대립인자 3, rs10490444 대립인자 3, rs13011060 대립인자 3;
(vii) rs10191184 대립인자 1, rs6435957 대립인자 2, rs10171745 대립인자 3, rs6716542 대립인자 3, rs4491709 대립인자 4, rs12621130 대립인자 1, rs6735174 대립인자 1, rs6435959 대립인자 4, rs2372943 대립인자 1, rs13387042 대립인자 3, rs10490444 대립인자 3, rs13011060 대립인자 1;
(viii) rs10191184 대립인자 3, rs6435957 대립인자 4, rs10171745 대립인자 3, rs6716542 대립인자 3, rs4491709 대립인자 4, rs12621130 대립인자 1, rs6735174 대립인자 1, rs6435959 대립인자 2, rs2372943 대립인자 3, rs13387042 대립인자 3, rs10490444 대립인자 1, rs13011060 대립인자 3;
(ix) rs10191184 대립인자 3, rs6435957 대립인자 2, rs10171745 대립인자 3, rs6716542 대립인자 3, rs4491709 대립인자 2, rs12621130 대립인자 1, rs6735174 대립인자 1, rs6435959 대립인자 2, rs2372943 대립인자 3, rs13387042 대립인자 3, rs10490444 대립인자 1, rs13011060 대립인자 3;
(x) rs10191184 대립인자 1, rs6435957 대립인자 2, rs10171745 대립인자 3, rs6716542 대립인자 3, rs4491709 대립인자 2, rs12621130 대립인자 3, rs6735174 대립인자 1, rs6435959 대립인자 2, rs2372943 대립인자 3, rs13387042 대립인자 3, rs10490444 대립인자 1, rs13011060 대립인자 3;
(xi) rs10191184 대립인자 3, rs6435957 대립인자 4, rs10171745 대립인자 3, rs6716542 대립인자 3, rs4491709 대립인자 4, rs12621130 대립인자 1, rs6735174 대립인자 1, rs6435959 대립인자 4, rs2372943 대립인자 3, rs13387042 대립인자 3, rs10490444 대립인자 3, rs13011060 대립인자 1.
일부 구체예에서, 감소된 감수성은 0.8 미만의 위험도, 0.7 미만의 위험도, 0.6 미만의 위험도, 및 0.5 미만의 위험도를 포함한, 0.9 미만의 위험도(상대적 위험도 또는 오즈비)를 특징으로 한다.
원칙적으로, 본 명세서에서 유방암과 연관된 것으로 확인된 마커 및 일배체형의 평가는 표 10, 표 15 및 표 19에 표시된 마커들 중 하나와 연관 불균형이 아닌, 유방암에 대한 하나 이상의 위험 변이의 하나 이상의 위험 대립인자의 존재 또는 부재에 대해 개인으로부터 수득된 게놈 DNA를 포함하는 시료 또는 개인으로부터 유래된 유전형 데이터세트를 분석하는 것과 조합될 수 있다. 다시 말하면, 본 명세서에 기재된 위험 인자들 중 어느 것과도 연관되지 않은 유전적 위험 인자들은 복수의 위험 인자에 기반하여 개인에 대한 전체 위험도(overall risk)에 대한 추정값을 수득하기 위해, 본 발명의 위험 인자들과 조합될 수 있다. 또한, 전체 통합 위험도(overall combined risk)를 수득하기 위해, 본 명세서에서 유방암과 연관된 것으로 개시된 두개 이상의 위험 인자의 분석이 통합될 수 있다. 하나의 그와 같은 구체예에서, 개인 또는 개인으로부터 유래된 시료에 대해 rs4848543 (서열번호 1), rs3803662 (서열번호 3) 및 rs13387042 (서열번호 2)의 분석이 수행되고, 전체 위험도 분석이 수행된다. 또 다른 구체예에서, rs3803662 (서열번호 3) 및 rs13387042 (서열번호 2)의 분석이 수행된다.
일부 구체예에서, 본 발명의 방법, 용도, 키트 및 장치는 상기 개인의 위험도 평가, 진단, 또는 예후의 판단을 수행하기 위해 비-유전적 정보(non-genetic information)를 분석하는 단계를 더 포함할 수 있다. 일부 구체예에서, 그와 같은 비-유전적 정보는 연령, 성별, 민족, 사회경제적 지위, 과거 질병 진단, 개인의 병력(medical history), 유방암의 가족력(family history), 생화학적 척도, 및/또는 임상적 척도를 포함한다. 유전적 인자 및 비-유전적 인자에 대한 통합 위험도(combined risk)는 본 발명이 속하는 기술 분야의 당업자에게 공지된 방법을 이용하여 수득될 수 있다.
본 발명의 특정한 구체예에서, 유전적 세그먼트(예를 들면, 마커) 간의 연관 불균형(linkage disequilibrium, LD)은 연관 불균형 척도의 특정한 값을 특징으로 한다. 본 명세서에서 더 설명되는 바와 같이, 연관 불균형은 LD 척도 r2 및 |D'|의 특정한 수치값을 특징으로 할 수 있다. 하나의 바람직한 구체예에서, 연관 불균형은 0.1보다 큰 r2값을 특징으로 한다. 또 다른 바람직한 구체예에서, 연관 불균형은 0.2보다 큰 r2값을 특징으로 한다. 0.3, 0.4, 0.5, 0.6, 0.7, 0.8, 0.9, 0.95, 0.96, 0.97, 0.98, 0.99를 포함하나, 이에 한정되지 않는, r2에 대한 다른 컷오프 값도 가능하다. 또 다른 바람직한 구체예에서, 연관 불균형은 0.5보다 큰 |D'| 값을 특징으로 한다. 또 다른 바람직한 구체예에서, 연관 불균형은 0.8보다 큰 |D'| 값을 특징으로 한다. 0.2, 0.3, 0.4, 0.6, 0.7, 0.8, 0.9, 0.95, 0.96, 0.97, 0.98 및 0.99를 포함하나, 이에 한정되지 않는, |D'|에 대한 다른 컷오프 값도 가능하다. 일부 구체예에서, 연관 불균형은 |D'| 또는 r2에 대한 수치 컷오프 값을 특징으로 한다. 하나의 그와 같은 구체예에서, 연관 불균형은 0.8보다 큰 |D'| 또는 0.2보다 큰 r2의 수치 컷오프 값, 또는 양자 모두를 특징으로 한다. 일부 구체예에서, LD는 특정한 집단에서 결정된다. 일부 그와 같은 구체예에서, 상기 집단은 코카서스계 집단, 중국계 집단, 일본계 집단, 및 아프리카계 집단으로부터 선택된다. 특정한 그와 같은 구체예에서, 상기 집단은 코카서스계 집단, 중국계 집단, 일본계 집단, 및 아프리카계 집단으로부터 선택된다. 일 구체예에서, 상기 집단은 코카서스계 CEPH 집단이다.
본 발명의 방법, 용도, 장치 또는 키트의 특정한 다른 구체예에서, 개체는 특정한 인간 선조(ancestry)로부터 유래한다. 일 구체예에서, 상기 선조는 블랙 아프리카계 선조, 코카서스계 선조 및 중국계 선조로부터 선택된다. 또 다른 구체예에서, 상기 선조는 블랙 아프리카계 선조이다. 또 다른 구체예에서, 상기 선조는 아프리카계 미국인 선조이다. 또 다른 구체예에서, 상기 선조는 유럽계 선조이다. 또 다른 구체예에서, 상기 선조는 코카서스계 선조이다. 특정한 구체예에서, 상기 선조는 유전적 분석 또는 유전형분석을 받는 개인에 의해 자가-보고된다. 다른 구체예에서, 상기 선조는 개인으로부터의 핵산 시료에서 하나 이상의 다형성 마커의 하나 이상의 대립인자를 검출하는 단계를 포함하고, 상기 대립인자의 존재 또는 부재는 상기 개인의 선조를 나타내는 것인 유전적 결정(genetic determination)에 의해 결정된다.
발명의 상세한 설명
하기에서 본 발명의 바람직한 구체예가 설명된다.
본 발명은 유방암과 연관된 것으로 확인된 다형성 변이 및 일배체형을 개시한다. 일정한 다형성 마커(예를 들면, 마커 rs4848543, 마커 rs13387042 및 마커 rs3803662, 및 이들과 연관 불균형인 마커들, rs4848543 LD 블럭, rs13387042 LD 블럭, 및 rs3803662 LD 블럭과 연관된 마커들, 예를 들면, 표 10, 표 15, 표 19, 표 20, 표 21 및 표 22의 마커들, 예를 들면, 표 10, 표 15 및 표 19에 열거된 마커들)에서의 특정한 대립인자 및 그와 같은 대립인자를 포함하는 일배체형이 유방암과 연관된 것으로 확인되었다. 본 명세서에서 보다 상세하게 설명되는 바와 같이, 그와 같은 마커 및 일배체형은 유방암의 위험 관리를 위해 유용하다. 본 발명의 추가적인 응용은 이 마커들의 특정한 대립인자의 존재 또는 부재를 평가하기 위한 키트를 포함한다.
정의
달리 표시되지 않으면, 핵산 서열은 5'에서 3' 방향으로 좌측에서 우측으로 기재된다. 명세서 내에 기재된 수치 범위는 그 범위를 한정하는 수치를 포함하며 정의된 범위 내의 각 정수 또는 비-정수 분수(non-integer fraction)를 포함한다. 달리 정의되지 않으면, 본 명세서에서 사용된 모든 기술 용어 및 과학 용어는 본 발명이 속하는 기술 분야의 통상적인 기술자에 의해 일반적으로 이해되는 것과 동일한 의미를 갖는다.
본 발명에서, 하기의 용어들은 표시된 바와 같은 의미를 갖는다:
본 명세서에 기재된 바와 같이, 종종 "마커(marker)"로 불리는, "다형성 마커(polymorphic marker)"는 게놈 다형성 부위(genomic polymorphic site)를 의미한다. 각 다형성 마커는 다형성 부위에서 특정한 대립인자에 특징적인 두 개 이상의 서열 변이를 갖는다. 따라서, 다형성 마커에 대한 유전적 연관(genetic association)은 특정한 다형성 마커의 하나 이상의 특정한 대립인자에 대해 연관이 있다는 것을 의미한다. 마커는 SNP(single nucleotide polymorphism), 마이크로새틀라이트(microsatellite), 삽입, 결실, 중복 및 전위(translocation)를 포함한, 게놈에서 발견되는 임의의 변이 형태의 대립인자를 포함할 수 있다.
"대립인자(allele)"는 염색체 상에 있는 주어진 유전자 좌(위치)의 뉴클레오티드 서열을 의미한다. 다형성 마커 대립인자는 따라서, 염색체 상의 마커의 조성(즉, 서열)을 의미한다. 개인으로부터의 게놈 DNA는 각 염색체 상의 마커의 각 카피를 대표하는, 임의의 주어진 다형성 마커에 대해 두 개의 대립인자(예를 들면, 대립인자-특이적 서열)를 포함한다. 본 명세서에서 사용된 뉴클레오티드에 대한 서열 코드는 A = 1, C = 2, G = 3, T = 4이다. 마이크로새틀라이트 대립인자(microsatellite allele)의 경우, CEPH 표본(Centre d'Etudes du Polymorphisme Humain, genomics repository, CEPH sample 1347-02)이 기준으로 이용되고, 이 표본에서 각 마이크로새틀라이트의 보다 짧은 대립인자는 0으로 설정되고 다른 표본에서 모든 다른 대립인자는 이 기준에 대비하여 번호가 부여된다. 따라서, 예를 들면, 대립인자 1은 CEPH 표본에서의 보다 짧은 대립인자보다 1 bp 더 길고, 대립인자 2는 CEPH 표본에서의 보다 짧은 대립인자보다 2 bp 더 길며, 대립인자 3은 CEPH 표본에서의 보다 짧은 대립인자보다 3 bp 더 길며, 대립인자 -1은 CEPH 표본에서의 보다 짧은 대립인자보다 1 bp 더 짧고, 대립인자 -2는 CEPH 표본에서의 보다 짧은 대립인자보다 2 bp 더 짧다.
본 명세서에 기재된 서열 코뉴클레오티드 중의성(sequence conucleotide ambiguity)은 IUPAC-IUB에 의해 제안된 바와 같다. 이 코드들은 EMBL, GenBank, 및 PIR 데이터베이스에 의해 사용된 코드들과 양립될 수 있다.
IUB 코드 | 의미 |
A | 아데노신 |
C | 시티딘 |
G | 구아닌 |
T | 티미딘 |
R | G 또는 A |
Y | T 또는 C |
K | G 또는 T |
M | A 또는 C |
S | G 또는 C |
W | A 또는 T |
B | C G 또는 T |
D | A G 또는 T |
H | A C 또는 T |
V | A C 또는 G |
N | A C G 또는 T (임의의 염기) |
집단(자연 집단 또는 인위적 집단, 예를 들면, 합성 분자들의 라이브러리) 내에서 하나 이상의 서열이 가능한 뉴클레오티드 위치가 본 명세서에서 "다형성 부위(polymorphic site)"로 지칭된다.
"단일 뉴클레오티드 다형성(Single Nucleotide Polymorphism)" 또는 "SNP"는 게놈의 특정한 위치에 있는 단일 뉴클레오티드가 종의 멤버 간에 또는 개체 내에서 쌍을 이루는 염색체 간에 상이할 때 나타나는 DNA 서열 변이이다. 대부분의 SNP 다형성은 두 개의 대립인자를 갖는다. 각 개체는 이 경우, 상기 다형성의 하나의 대립인자에 대해 동형접합(즉, 개체의 두 개의 염색체 카피 모두 SNP 위치에서 동일한 뉴클레오티드를 가짐)이거나, 또는 개체는 이형접합이다(즉, 상기 개체의 두 개의 자매 염색체(sister nucleotide)가 상이한 뉴클레오티드를 포함함). 본 명세서에서 보고된 바와 같이, SNP 명명은 NCBI(the National Center for Biotechnological Information)에 의해 각각의 독특한 SNP에 부여된 공식적인 기준 SNP(Reference SNP, rs) ID 식별 택(tag)을 의미한다.
본 명세서에 기재된 "변이(variant)"는 기준(reference) DNA와 상이한 DNA의 세그먼트를 의미한다. 본 명세서에서 정의된 "마커(marker)" 또는 "다형성 마커(polymorphic marker)"는 변이이다. 기준과 상이한 대립인자(allele)는 "변이" 대립인자로 지칭된다.
"마이크로새틀라이트(microsatellite)"는 특정한 부위에 있는 길이가 2 내지 8개의 뉴클레오티드로 구성된 염기의 작은 반복체(repeat)(예를 들면, CA 반복체)를 복수 개 갖는 다형성 마커이며, 전체 집단에서 반복체 길이의 수는 변한다.
"indel"은 통상적으로 단지 수개의 뉴클레오티드로 구성된 길이의 작은 삽입 또는 결실을 포함하는 다형성의 일반적인 형태이다.
본 명세서에 기재된, "일배체형(haplotype)"은 세그먼트를 따라 배열된 대립인자의 특정한 조합을 특징으로 하는 DNA의 하나의 가닥 내에 있는 게놈 DNA의 세그먼트를 의미한다. 인간과 같은 이배체(diploid) 개체의 경우, 일배체형은 각 다형성 마커 또는 유전자 좌에 대해 대립인자의 쌍 중 하나의 대립인자(one member)를 포함한다. 특정한 구체예에서, 일배체형은 두개 이상의 대립인자, 세개 이상의 대립인자, 네개 이상의 대립인자, 또는 다섯개 이상의 대립인자를 포함할 수 있다. 본 명세서에서 일배체형은 마커 명칭 및 상기 마커의 대립인자로 기재되며, 예를 들면, 일배체형 "1 rs4848543" 또는 "1-rs4848543"은 마커 rs4848543의 대립인자 1(대립인자 A)이 일배체형에 있다는 것을 의미하고, "rs4848543 대립인자 1(rs4848543 allele 1)" 또는 "rs4848543 대립인자 A(rs4848543 allele A)"와 동등하다. 또한, 일배체형에서 대립인자 코드는 개별적인 마커에 대한 것과 같고, 즉, 1 = A, 2 = C, 3 = G 및 4 = T이다.
본 명세서에 기재된 용어 "감수성(susceptibility)"은 개체(또는 개체들의 군)이 평균 개체들보다 유방암을 발병하는 경향이 있거나, 또는 유방암 발병에 저항할 수 있는 능력이 더 약한 것을 의미한다. 상기 용어는 증가된 감수성 및 감소된 감수성을 모두 포함한다. 따라서, 본 발명의 다형성 마커의 특정한 대립인자 및/또는 일배체형은 1보다 큰 상대적 위험도(RR) 또는 오즈비(OR)를 특징으로 하는, 유방암의 증가된 감수성(즉, 증가된 위험도)을 특징으로 할 수 있다. 대안적으로, 본 발명의 마커 및/또는 일배체형은 1 미만의 상대적 위험도 또는 오즈비를 특징으로 하는, 유방암의 감소된 감수성(즉, 감소된 위험도)을 특징으로 한다.
용어 "및/또는"은 본 명세서에서 상기 용어에 의해 연결된 항목들 중 하나 또는 양자 모두가 포함된다는 것을 나타내는 것으로 이해될 것이다. 바꾸어 말하면, 본 명세서에서 상기 용어는 "하나 또는 그 나머지 또는 양자 모두(one or the other or both)"를 의미하는 것으로 이해될 것이다.
연관된 유전적 요소(유전자 및/또는 마커)와 관련하여, 용어 "연관된(associated with)"은 상기 요소들이 연관 불균형 상태에 있다는 것을 의미한다. 바람직하게는, 상기 용어는 상기 요소들이 0.2 보다 큰 연관 불균형 척도 r2 값에 의해 결정된 연관 불균형 상태에 있다는 것을 의미하는 것으로 이해될 것이다.
본 명세서에서 사용된 용어 "참조표(look-up table)"는 하나의 형태의 데이터를 또 다른 형태와 상관시키거나, 또는 하나 이상의 형태의 데이터를 상기 데이터가 관련된 예상되는 결과, 예를 들면, 표현형 또는 성향과 상관시키는 표이다. 예를 들면, 참조표는 하나 이상의 다형성 마커에 대한 대립인자 데이터와, 특정한 대립인자 데이터를 포함하는 개체가 표시할 것 같거나, 또는 그 특정한 대립인자 데이터를 갖지 않는 개인보다 표시할 가능성이 더 높은, 특정한 질병 진단과 같은 특정한 성향 또는 표현형 간의 상관관계를 포함할 수 있다. 참조표는 다면적(multidimensional)일 수 있고, 즉, 참조표는 단일 마커들에 대한 복수 개의 대립인자에 대한 정보를 동시에 포함할 수 있거나, 또는 그들은 복수 개의 마커들에 대한 정보를 포함할 수 있고, 그들은 또한 질병 진단에 대한 세부사항, 인종 정보, 바이오마커, 생화학적 측정값, 치료적 방법, 또는 약물 등과 같은 다른 인자들을 포함할 수 있다.
"컴퓨터-판독가능한 매체(computer-readable medium)"는 상업적으로 구매가능하거나 또는 맞춤-제작된(custom-made) 인터페이스를 이용하여 컴퓨터에 의해 접근될 수 있는 정보 저장 매체이다. 대표적인 컴퓨터-판독가능한 매체는 메모리(예를 들면, RAM, ROM, 플래쉬 메모리, 등), 광학적 저장 매체(예를 들면, CD-ROM), 자기 저장 매체(예를 들면, 컴퓨터 하드 드라이브, 플로피 디스크, 등), 천공 카드(punch card), 또는 기타 상업적으로 구입가능한 매체를 포함한다. 목표 시스템(system of interest)과 매체, 컴퓨터간, 또는 컴퓨터와 저장 또는 저장된 정보의 접근을 위한 컴퓨터-판독가능한 매체 간에 정보가 전달될 수 있다. 그와 같은 전송은 전기적이거나, 또는 IR 링크, 무선 연결 등과 같은 다른 이용가능한 방법에 의해 수행될 수 있다.
"핵산 시료(nucleic acid sample)"는 개체로부터 수득된 핵산을 함유하는 시료이다. 특정한 구체예에서, 즉, 특정한 다형성 마커 및/또는 일배체형의 검출에서, 핵산 시료는 게놈 DNA를 포함한다. 그와 같은 핵산 시료는 혈액 시료, 양수 시료, 뇌척수액 시료, 또는 피부, 근육, 볼 점막 또는 결막 점막, 태반, 위장관 또는 기타 기관으로부터의 조직 시료를 포함한, 게놈 DNA를 포함하는 원천(source)으로부터 수득될 수 있다.
본 명세서에서 사용된 용어 "유방암 치료제(breast cancer therapeutic agent)"는 유방암과 연관된 증상을 개선시키거나 또는 예방하기 위해 이용될 수 있는 작용제를 의미한다.
본 명세서에 기재된 용어 "유방암-연관 핵산(breast cancer-associated nucleic acid)"은 유방암과 연관된 것으로 확인된 핵산을 의미한다. 이는 본 명세서에 기재된 마커 및 일배체형 및 이들과 강한 연관 불균형(LD)인 마커 및 일배체형을 포함하나, 이에 한정되지 않는다. 일 구체예에서, 유방암-연관 핵산은 특정한 게놈 영역 내에 위치하거나 또는 상기 영역과 연관된(즉, 연관 불균형인) 하나 이상의 다형성 마커를 통해 유방암과 연관된 것으로 확인된 LD-블럭과 같은 특정한 게놈 영역을 의미한다.
용어 "모든 유방암(All Breast Cancer)" 또는 "All BC"는 유방암의 특정한 서브 표현형(subphenotype)과 관계없이, 유방암으로 진단된 모든 개체를 의미한다.
용어 "중간 소인(Medium Predisposition)" 유방암 또는 "MedPre" 유방암은 유방암의 서브-표현형을 의미한다. 이 표현형의 정의는 발단자(proband)가 하기 기준 중 하나 이상을 충족시킬 것을 요구한다:
1. 시발자(proband)는 3M(meiotic event)의 유전적 거리 내에 3명 이상의 영향받은(affected) 친척을 포함하는 유방암 케이스의 클러스터(cluster)의 구성원이다.
2. 시발자는 3M 내의 관계된 영향받은 쌍 중 일 구성원이고, 상기 쌍 중 1인은 50세 이전에 진단받았다.
3. 시발자는 3M 내의 관계된 영향받은 쌍 중 일 구성원이고, 상기 쌍 중 1인은 임의의 종류의 2차 원발성 종양을 진단받았다.
4. 시발자는 임의의 종류의 원발성 종양을 진단받았다.
본 명세서에서 제시된 연구에서 분석된 1600명의 아이슬란드 환자들 중에서, 653명이 MedPre 기준을 충족시킨다(40.8%).
본 명세서에 기재된 용어 "다발성 원발성 유방암(Multiple Primary Breast Tumor)" 또는 "MPBC"는 제1 유방암 진단 외에 하나 이상의 원발성 종양이 진단되고, 상기 두 종양은 상기 제1 유방암과 동시에 또는 상기 제1 유방암에 뒤이어 발생하고 반대쪽 유방 또는 같은쪽 유방에서 발생한, 임상적으로 및 조직학적으로 독립적인 원발성 종양으로 확인된 케이스를 의미한다.
본 명세서에서 사용된 용어 "가족력 점수(Family history score" 또는 "FHS"는 상기 질환을 갖는 시발자에 대해 유방암에 걸린 친척의 수에 근거하여 정의된다. 각 시발자에 대해, 영향받은 1촌 친척 1인당 1점이 부여되고, 영향받은 2촌 친척 1인당 0.5점이 부여되며, 영향받은 3촌 친척 1인당 0.25점이 부여된다. 모든 영향받은 친척에 대해 수득된 총합이 총 가족력 점수(summed family history score) 또는 FHS이다.
본 명세서에 기재된, 용어 "rs4848543 LD 블럭" 또는 "rs4848543 연관 불균형 블럭"은 NCBI (National Center for Biotechnology Information) Build 34의 위치 119,987,002와 120,129,001 및 NCBI Build 36의 위치 119,608,327과 120,129,001 사이에 있는 염색체 2 상의 게놈 영역을 의미한다. rs4848543 LD 블럭은 크기가 141,999 bp이다.
본 명세서에서 사용된 용어 "STEAP3 유전자" 또는 "TSAP6 유전자"는 종양 억제자 활성화 경로 6(Tumor Suppressor Activated Pathway 6, TSAP6) 유전자로도 불리는, 전립선의 6-막관통 상피 항원(Six-transmembrane Epithelial Antigen of the Prostate, STEAP3) 유전자를 의미한다. 상기 유전자는 염색체 2q14.2 상에 존재하고, 위치 120076561-120118373 (NCBI Build 34)에 걸친다.
본 명세서에 기재된, 용어 "rs13387042 LD 블럭" 또는 "rs13387042 연관 불균형 블럭"은 NCBI (National Center for Biotechnology Information) Build 34의 위치 218,062,001과 218,141,002 사이에 있는 염색체 2 상의 연관 불균형(LD) 블럭을 의미한다. 상기 LD 블럭은 79,001개의 염기쌍에 걸친다(Build 34).
본 명세서에 기재된, 용어 "rs3803662 LD 블럭" 또는 "rs3803662 연관 불균형 블럭"은 NCBI (National Center for Biotechnology Information) Build 34의 위치 52,291,041과 52,436,127 사이에 있는 염색체 16 상의 연관 불균형(LD) 블럭을 의미한다. 상기 LD 블럭은 145,086개의 염기쌍에 걸친다(Build 34).
본 명세서에 기재된 용어 "Daly 일배체형(Daly haplotype)"은 HapMap 프로젝트에서 분석된 SNP의 추가적인 세트에 대해 효율적인 대리물(surrogate)(r2>0.8)로 확인된, 주어진 LD 블럭(높은 LD의 영역) 내의 이-마커 일배체형(two-marker haplotype)을 의미한다. 이 추가적인 SNP들은 UTAH CEPH (CEU) HapMap 표본에서 5%보다 큰 소수 대립인자 빈도(minor allele frequency)를 가지며, 이들은 Hap300 SNP 칩 상에 존재하지 않고 또한 상기 칩에 존재하는 SNP에 의해 효율적으로 태깅되지도 않는다[Pe'er, et al., (2006), Nat Genet, 38, 663-7].
본 명세서에서 정의된 용어 "에스트로겐 수용체 양성 유방암(estrogen receptor positive breast cancer)" 또는 "ER 양성 유방암"은 에스트로겐 수용체의 발현에 대해 양성으로 결정된 유방암 조직의 시료를 의미한다. 에스트로겐 수용체의 발현은 예를 들면, 방사선면역분석법 또는 면역조직화학법에 의해 결정될 수 있다. 10 fmol/mg 이상의 방사선면역계수 측정값(radioimmunometric measurement) 또는 10% 이상의 양성 핵의 방사선조직화학적 평가가 양성으로 간주된다.
본 명세서에서 정의된 용어 "프로게스테론 수용체 양성 유방암(progesterone receptor positive breast cancer)" 또는 "PR 양성 유방암"은 프로게스테론 수용체의 발현에 대해 양성으로 결정된 유방암 조직의 시료를 의미한다. 프로게스테론 수용체의 발현은 예를 들면, 방사선면역분석법 또는 면역조직화학법에 의해 결정될 수 있다. 10 fmol/mg 이상의 방사선면역계수 측정값 또는 10% 이상의 양성 핵의 면역조직화학적 평가가 양성으로 간주된다.
유방암으로 진단된 개체들의 집단의 연관 분석(association analysis)을 통해, 특정한 다형성 마커의 특정한 대립인자가 유방암과 연관된다는 것이 발견되었다. 암과 연관된 변이에 대한 게놈-전체 분석이 세그먼트 Chr2q14 및 Chr2q35 내에 있는 염색체 2의 두 개의 별개의 영역, 및 염색체 16 상의 영역(Chr16q12)과 유방암의 연관을 밝혔다. 이 영역 내에서 특정한 마커 및 일배체형이 유방암의 증가된 위험도와 연관되는 것으로 확인되었다.
표 1에 표시된 바와 같이, 염색체 2q14.2 상의 마커 rs4848543의 대립인자 A (rs4848543 A 대립인자 또는 rs4848543 1 대립인자 또는 A-rs4848543로도 지칭됨)가 유방암의 증가된 위험도와 연관되는 것으로 확인되었다. 4477명의 암-불포함 집단 대조군(cancer-free population control) 대비, 1598명의 환자에서 MedPre 유방암 표현형의 분석은 8.3x10-8의 p-값으로 1.42의 추정된 상대적 위험도(RR)를 산출했다. 상기 실험에서 사용된 게놈-전체 칩의 일부로 테스트된 317,089개의 SNP 마커에 대한 보정(correction) 후에, p-값은 0.026이었고, 즉, 연관은 게놈-전체 수준에서 유의성이 있었다. 보다 광범위한 All BC 표현형에 대한 연관은 약간 더 약했고, RR-값은 1.16이었다(표 1 참조). 이 결과들은 독립적인 아이슬란드 유방암 코호트에서 재현되었다.
rs4848543 마커는 본 명세서에서 rs4848543 LD 블럭이라 지칭되는 영역 내에 위치한다. 이 SNP 마커, 및 상기 마커와 상관된 마커들(예를 들면, 표 10에 열거된 마커들)은 본 발명의 방법에서 유용하다. 인간 게놈의 국소적 연관 불균형(local linkage disequilibrium) 패턴 때문에, 본 명세서에서 암과 연관된 것으로 확인된 rs4848543과 강한 LD인 다수의 다형성 마커들이 있다. 따라서, 공지된 SNP 또는 마이크로새틀라이트(microsatellite) 또는 indel과 같은 다른 다형성 마커들을 포함한 이 상관된 마커들(예를 들면, 표 10에 열거된 마커들), 및 다른 상관된 SNP 또는 다른 다형성 마커들이 단독으로 또는 조합되어, 본 명세서에 기재된 유방암에 대한 연관을 검출하기 위한 대리 마커(surrogate marker)로서 이용될 수 있다. 특히, rs4848543 LD 블럭 내에 위치한 다른 다형성 마커들이 본 발명의 방법에서 대리 마커로 이용될 수 있는 것으로 예상된다.
게놈-전체 연관 분석을 통해 염색체 2 상의 제2 영역(2q35)이 확인되었다. 마커 rs13387042의 대립인자 A (rs13387042 A 대립인자 또는 rs13387042 1 대립인자 또는 A-rs13387042로도 지칭됨)는 유방암의 증가된 위험도와 연관되는 것으로 확인되었다(표 11 참조). 이 SNP는 STEAP3/TSAP6 유전자 좌(locus)로부터 떨어진 위치에 있는 염색체 2q35 상에 위치한다. 유방암을 갖는 2,181명의 개인들(All BC) 및 12,441명의 집단 대조군의 분석은 rs13387042의 대립인자 A가 4.0x10-5의 p-값으로 1.19의 위험도를 부여한다는 것을 밝혔다. MedPre 유방암의 위험도(RR)는 Any BC의 위험도와 유사한 것으로 확인되었다. rs13387042에 대한 연관을 검출하기 위해 이용될 수 있는 대리 마커가 표 15에 열거된다.
이 결과는 아이슬란드 집단으로부터의 제2의 독립적 표본(583명의 케이스 및 7966명의 대조군)에서 재현되어, 이 제2 그룹에서 AllBC와 연관된 rs13387042의 대립인자 A에 대해 1.20의 RR의 추정치를 생성하였다(P-값corr = 3.8x10-3). 따라서, 독립적인 아이슬란드 표본에서 RR의 매우 유사한 점 추정치(point estimate) 및 2.0x10-7의 전체 P-값corr 으로 최초의 발견이 유의성있게 재현되었고, 이는 테스트된 317,089개의 SNP에 대한 Bonferroni 보정 후 유의성 수준에 가까웠다. rs13387042 대립인자 A 변이의 관찰된 빈도와 상대적 위험도는 아이슬란드 집단에서 15.6%의 추정된 집단 귀속 위험도(population attributable risk)에 해당한다.
스페인 표본 및 스웨덴 표본에서의 재현 연구는 이 발견들을 확인했다. 스페인으로부터의 446명의 유방암 케이스 및 977명의 대조군 표본의 분석은 1.21의 RR을 산출했다(P-값 1.8x10-2; 표 11). A-rs13387042 변이의 빈도는 스페인 대조군 표본에서 더 높아서, 상기 변이는 보다 널리 퍼졌으며 따라서 스페인 추출(Spanish extraction)의 표본에서 보다 높은 유방암 부하(burden)에 기여할 수 있다는 것을 시사했다. 두 개의 스웨덴 코호트, "스웨덴 가족성(Sweden Familial)" 및 "스웨덴 순차성(Sweden Conssecutive)" 도 분석되었다. "스웨덴 순차성(Sweden Consecutive)" 코호트는 유방암에 대해 1.31의 유의성 있는 RR을 보였고(P-값= 2.0x10-4), "스웨덴 가족성(Sweden Familial)" 코호트는 통계적으로 유의성이 없는, 1.11의 상대적 위험도 추정값을 보였다. 그러나, 전반적으로, 통합된 스웨덴 코호트는 1.22의 유의성 있는 상대적 위험도 추정값을 보였다(P-값= 8.1x10-4).
아이슬란드 코호트, 스페인 코호트 및 스웨덴 코호트에 대한 추정값을 Mantel-Haenszel 모델을 이용하여 결합 분석(joint analysis)에서 통합하였다. 결과는 3.8x10-11의 P-값을 갖는 1.20의 추정된 상대적 위험도였다. 이는 조사된 317,089개의 SNP에 대해 보정하기 위해 Bonferroni 방법을 이용한 게놈-전체 유의성에 대한 역치(threshold)보다 훨씬 낮았다. 따라서, 본 발명자들은 rs1338704 대립인자 A가 유럽계 후손의 여러 집단 표본에서 유방암에 대해 유의성있고 재현가능한 위험도를 부여하는 것으로 결론지었다. 전체 집단 귀속 위험도(overall population attributable risk)는 16.4%로 추정되었다.
1600명의 유방암 환자 및 11563명의 대조군으로부터의 데이터를 이용한 추가적인 게놈-전체 SNP 분석은 SNP rs3803662의 대립인자 T(T-rs3803662; rs3803662 대립인자 T)가 Any BC에 대한 1.23-배 증가된 위험도 추정값을 부여한다는 것을 확인하였다(표 16). 이 결과는 594명의 아이슬란드 유방암 환자 및 1433명의 대조군의 제2의 독립적인 코호트에서 확인되었다. 이 두 개의 아이슬란드 표본으로부터의 통합된 데이터는 개인들 간의 혈연관계(relatedness)에 대해 보정되었을 때, 1.23의 상대적 위험도 추정값 및 2.8x10-7 의 P-값을 생성했다. 이는 10.1%의 추정된 집단 귀속 위험도에 해당했다(표 16). rs3803662에 대한 연관을 검출하기 위해 이용될 수 있는 대리 마커들이 표 19에 열거된다.
전술된 스웨덴 코호트 및 스페인 코호트에서 이 발견의 재현 분석 및 네덜란드, 네이메헨(Nijmegen)으로부터의 1384명의 대조군 및 558명의 유방암 환자의 분석을 수행하였다. 표 16에 표시된 바와 같이, 이 3개의 재현 코호트 모두에서 rs3803662 대립인자 T에 대한 유의성있게 증가된 위험도가 관찰되었다. 이 3개의 비-아이슬란드 재현 코호트의 통합된 분석은 1.35의 전체 상대적 위험도 추정값을 보였고 P-값은 5.1x10-12이었다. 아이슬란드 코호트와 재현 코호트의 결합 분석은 2.7x10-17의 P-값을 갖는 1.28의 통합된 상대적 위험도 추정값을 보여주었다. 이는 테스트된 SNP의 갯수에 대해 보정되었을 때, 게놈-전체 유의성에 대한 역치보다 훨씬 낮았다. 상응하는 전체 집단 귀속 위험도는 13.4%였다(표 16).
rs13387042 대립인자 A 및 rs3803662 대립인자 T와 에스트로겐 수용체(ER) 및 프로게스테론 수용체(PR) 상태 간의 연관을 조사하였다. rs13387042 대립인자 A 및 rs3803662 대립인자 T를 포함하는 유의성 있는 유방암 위험도는 ER 양성 종양으로 진단된 환자들에 명확하게 한정되었고 ER 양성 종양과 ER 음성 종양에 대한 OR간의 차이도 유의성이 있었다(표 25). 유사하게, PR 양성 종양으로 진단된 환자들 중에 우세하게 유방암 위험도에 대한 경향이 있었다.
STEAP3/TSAP6의 생물학:
STEAP3/TSAP6에 대한 cDNA는 온도 민감성 p53 유전자를 포함하는 마우스 골수(murine myeloid) LTR6 세포주에서 p53 활성화에 의해 유도된 일련의 mRNA 중 하나로부터 최초로 분리되었다[Amson, et al., (1996), Proc Natl Acad Sci U S A, 93, 3953-7]. 이 마우스 형은 종양 억제자 활성화 경로 6(Tumour Suppressor Activated Pathway 6, TSAP6)으로 명명되었다. 이후에, 상기 유전자는 LTR6 세포에서 활성화된 p53에 의해 유도될 수 있는 것으로 확인되었다[Passer, et al., (2003), Proc Natl Acad Sci U S A, 100, 2284-9]. pHyde로 지칭된 랫트 버전은 상이한 전이성 성향을 갖는 두 개의 세포주에서 차등적으로 발현된 유전자들을 검출하기 위한 실험 동안 전립선암 세포주로부터 분리되었다[Rinaldy and Steiner, (1999), DNA Cell Biol, 18, 829-36]. pHyde cDNA는 랫트 및 인간 전립선 세포주 및 이종이식편(xenograft)에서 아폽토시스(apoptosis)를 유도하는 것으로 확인되었다[Rinaldy, et al., (2000), Gan To Kagaku Ryoho, 27 Suppl 2, 215-22; Steiner, et al., (2000), Cancer Res, 60, 4419-25]. pHyde에 의한 아폽토시스 유도는 이후에 카스파아제-3 경로를 통해 작동하는 것으로 확인되었다[Zhang, et al., (2001), Oncogene, 20, 5982-90]. STEAP3/TSAP6의 하향 조절(down regulation)은 또한 간세포 육종(hepatocellular carcinoma)의 진행과 연관된 것으로 확인되었다[Coulouarn, et al., (2005), J Hepatol, 42, 860-9].
Passer 등은 STEAP3/TSAP6의 인간 버전에 대한 cDNA를 분리하고 그 mRNA가 유방암 세포주 MCF7에서 p53 활성화에 의해 유도가능하다는 것을 확인하였다[Passer, et al., (2003), Proc Natl Acad Sci U S A, 100, 2284-9]. p53에 의한 유도는 전사 수준에서 일어나는 것으로 보이며 -478번 뉴클레오티드와 -357번 뉴클레오티드(accession number AY214461에 의해 정의된 서열) 사이에 있는 STEAP3/TSAP6 프로모터 내의 보존된 p53 반응 요소에 의해 매개되는 것으로 보인다[Passer, et al., (2003), Proc Natl Acad Sci U S A, 100, 2284-9]. 상기 단백질은 488개의 아미노산으로 구성되며, 50-55kDa, 6-pass 막관통(transmembrane) 단백질로 확인되었다[Passer, et al., (2003), Proc Natl Acad Sci U S A, 100, 2284-9]. STEAP3/TSAP6 상에 표적화된 안티센스 RNA는 p53-의존성 아폽토시스를 저해하였고, STEAP3/TSAP6이 아폽토시스의 작동자(effector)로 작용한다는 견해를 더 뒷받침하였다[Passer, et al., (2003), Proc Natl Acad Sci U S A, 100, 2284-9]. STEAP3/TSAP6은 세포 주기 조절 및 아폽토시스에 관여하는 두 개의 단백질, Nix 및 Myt1과 물리적으로 상호작용하였다[Passer, et al., (2003), Proc Natl Acad Sci U S A, 100, 2284-9]. Nix (BNIP3L로도 알려짐)는 미토콘드리아에 존재하는(mitochondrial) Bcl2-관련, 아폽토시스 촉진성(proapoptotic) 단백질이다. Nix 및 STEAP3/TSAP6은 각각 서로의 아폽토시스 촉진성 효과를 강화시킨다[Passer, et al., (2003), Proc Natl Acad Sci U S A, 100, 2284-9]. Myt1은 사이클린(cyclin) 의존성 키나아제 p34cdc2를 인산화시키고 그에 의해 저해하는 것에 의해 세포 주기를 G2/M 체크포인트(checkpoint)에서 차단하기 위해 작용하는 듀얼 특이성(Ser/Thr 및 Tyr) 키나아제이다. Myt1과 TSAP6 간의 상호작용은 Myt1을 그의 저인산화된(hypophosphorylated), 활성 상태로 유지시키는 것에 의해 p34cdc2의 Myt1-의존성 인산화를 촉진한다 [Passer, et al., (2003), Proc Natl Acad Sci U S A, 100, 2284-9].
다소 역설적이나, STEAP3/TSAP6은 최근에 마우스의 nm1054 돌연변이 스트레인에서 소적혈구성, 저색소성 빈혈을 발생시키는 유전자로 확인되었다[Ohgami, et al., (2005), Nat Genet, 37, 1264-9]. 세포외 철(extracellular iron)은 트랜스페린(Tf)에 의해 장, 망상내피 시스템(reticuloendothelial system) 및 간으로부터 체내의 모든 증식 세포로 운반된다. Tf-결합 철은 트랜스페린-수용체(TfR1) 매개 내포작용(endocytosis)에 의해 세포로 들어간다. 철은 산성화에 의해 엔도좀(endosome)에서 Tf로부터 방출되고, 철이 이가 금속 수송체(divalent metal transporter) Dmt1에 의해 세포질로 전달된다. 그 후, Tf 및 TfR1은 세포외 환경으로 리사이클링된다. 환경에 존재하는 철 및 Tf-결합 철은 주로 산성화된 Fe3+ (ferric) 상태로 존재하고 세포질막을 통해 전달될 수 있기 전에 Fe2+ (ferrous) 상태로 환원되어야 한다. 빈혈과의 연관을 통해, STEAP3/TSAP6는 적혈구 계통 세포(erythroid lineage cell)에서 이 반응을 수행하는 주요한 페리리덕타아제(ferrireductase)로 확인되었고, 이는 STEAP3/TSAP6가 철 흡수를 위해 큰 중요성을 갖는다는 것을 시사한다[Ohgami, et al., (2005), Nat Genet, 37, 1264-9]. STEAP3/TSAP6는 또한 구리 환원효소(cupric reductase) 활성 및 이 금속환원효소(metalloreductase) 활성으로서 STEAP 패밀리의 다른 멤버, STEAP2 및 STEAP4에 의해 공유된다[Ohgami, et al., (2006), Blood, 108, 1388-94].
STEAP3/TSAP6는 또한 비-고전적(non-classical) 경로를 통한 단백질의 분비의 자극에 관여하는 것으로 확인되었다. 고전적인 단백질 분비는 분비용 단백질에 대한 NH2-말단 신호 서열에 의해 매개된다. 상기 신호 서열은 상기 단백질을 소포체(endoplasmic reticulum)/골지 경로 및 뒤이은 분비 소포(secretary vesicle)에서 원형질막 통과로 이끈다. 분비 소포의 원형질막으로의 융합 후, 분비된 단백질은 세포외 공간으로 분비된다. 단백질 분비는 또한, 세포내 소포(intracellular vesicle)가 엔도좀의 내강(lumen)으로 분리되어, 소위 다중소포 구조(multivesicular structure)를 형성하는 것인 비-고전적 경로에 의해 수행될 수 있다. 상기 다중소포 구조와 원형질막과의 융합은 이 막-캡슐화 소포의 세포외 공간으로의 분비를 초래한다. 이 소포들은 엑소좀(exosome)으로 알려져 있다. STEAP3/TSAP6은 p53 의존적 방식으로 엑소좀 생성을 자극하는 것으로 확인되었다 [Amzallag, et al., (2004), J Biol Chem, 279, 46104-12; Yu, et al., (2006), Cancer Res, 66, 4795-801]. 엑소좀은 중요한 항-발암성(anti-oncogenic) 반응에 관여될 수 있다. p53-STEAP3/TSAP6 경로 자극에 대한 반응으로 엑소좀에서 분비되는 단백질 중 하나는 유방 종양 세포에서 혈관생성(angiogenesis), 종양 침윤 및 전이에 대한 입증된 저해 효과를 갖는 Maspin(mammary serine protease inhibitor)이다[Sheng, et al., (1996), Proc Natl Acad Sci U S A, 93, 11669-74; Shi, et al., (2001), Cancer Res, 61, 6945-51; Zhang, et al., (1997), Mol Med, 3, 49-59; Zou, et al., (1994), Science, 263, 526-9]. 엑소좀은 TCTP(Translationally Controlled Tumour Protein)/히스타민 방출 인자(Histamine Releasing Factor)와 같은 염증자극 인자(pro-inflammatory factor) 및 Her2/Neu 및 Mart1과 같은 종양-특이적 항원을 포함할 수 있다[Amzallag, et al., (2004), J Biol Chem, 279, 46104-12; Andre, et al., (2002), Lancet, 360, 295-305]. STEAP3/TSAP6-매개 엔도좀 형성은 p53을 발현하도록 유도된 세포들이 인접 세포(neighboring cell)에서 세포 주기 중단(cell cycle arrest), 프로아폽토시스(proapoptosis) 반응 및 사망을 초래하는 것인 소위 "바이스탠더 효과(bystander effect)"를 일으킬 수 있다는 것이 시사되었다[Yu, et al., (2006), Cancer Res, 66, 4795-801].
STEAP3/TSAP6의 가능한 유전적 변이와 암 위험도 간의 관계에 관해 거의 알려진 것이 없다. 전립선암 세포주, 이종이식편 및 종양 시료에서 돌연변이에 대한 스크리닝은 4개의 세포주, 8개의 이종이식편 및 56개의 종양 시료(총 68개의 시료)에서 2개의 미스센스(missense) 돌연변이(Ala184Thr 및 Ile305Thr)를 발견했다. 본 발명자는 STEAP3/TSAP6은 전립선암에서 고전적인 종양 억제자 유전자가 아닌 것으로 결론지었다. 본 발명자들이 아는 바에 따르면, 다른 종류의 암에서 STEAP3/TSAP6 유전적 변이의 연구는 보고된 바 없다.
유방암의 개선된 치료법의 개발을 위한 STEAP3/TSAP6 경로의 이용 가능성
본 발명자들에 의한 STEAP3/TSAP6 LD 블럭 내의 유전적 변이의 발견은 이 유전자가 유방암의 발병에서 공통된 인자라는 것을 나타낸다. 그러므로, STEAP3/TSAP6, 그의 동족체(homologue) 및 STEAP3/TSAP6 경로 상의 다른 요소들을 표적화하는 치료법이 유방암의 치료 또는 예방을 위한 후보로 간주될 수 있다. 그와 같은 표적은 하기를 포함한다: STEAP3/TSAP6 자체(OMIM# 609671); 동족체(homologue) STEAP1 (OMIM# 604415), STEAP2/TIARP/STAMP1 (OMIM# 605094), 및 STEAP4 (NM_024636); 상호작용 단백질(interacting protein) Nix/BNIP3L (OMIM# 605368), Myt1 (OMIM# 602474), TCTP/히스타민 분비 인자(OMIM# 600763); 경로 단백질 p34cdc2 (OMIM# 116940), 사이클린 B1 (OMIM# 123836), HER2/Neu (OMIM# 164870), Maspin (OMIM# 154790); 및 확인되거나 또는 관련될 수 있는 STEP3/TSAP6 경로의 다른 멤버들. 치료법은 STEAP3/TSAP6의 소형 분자 촉진제(agonist) 또는 길항제, 그의 동족체 또는 경로 성분들; 또는 유전자 요법 또는 면역요법 프로토콜에서 트랜스유전자(transgene)으로서 STEAP3/TSAP6, 동족체 또는 경로 성분의 이용을 포함할 수 있다. STEAP3/TSAP6, 그의 동족체 또는 경로 성분들 및/또는 그들의 활성에 영향을 미치는 분자가 또한 그들의 "바이스탠더 효과"의 강화를 통해 세포살상(cytostatic) 또는 세포독성 치료요법(화학요법, 방사선요법, 유전자요법 또는 면역요법)을 위한 아쥬반트(adjuvant)로 개발될 수 있다.
마커 및 일배체형의 평가
집단 내의 게놈 서열은 개인들이 비교될 때 동일하지 않다. 오히려, 게놈은 게놈 상의 다수의 위치에서 개인들 간에 서열 변이성(sequence variability)을 보인다. 그와 같은 서열 상의 변이는 일반적으로 다형성(polymorphism)으로 지칭되며, 각 게놈 내에 다수의 그와 같은 부위들이 있다. 예를 들면, 인간 게놈은 평균적으로 500 bp마다 나타나는 서열 변이를 보인다. 가장 일반적인 서열 변이는 게놈 내의 단일 염기 위치에서의 염기의 변화로 구성되고, 그와 같은 서열 변이, 또는 다형성은 일반적으로 단일 뉴클레오티드 다형성("SNP")로 지칭된다. 이 SNP들은 단일 돌연변이 사건에서 일어난 것으로 사료되며, 따라서, 통상적으로 각 SNP 부위에 두 개의 가능한 대립인자들이 있다; 본래의 대립인자와 돌연변이된 대립인자. 자연적인 유전적 부동(genetic drift) 및 또한 가능한 선택적 압력 때문에, 본래의 돌연변이가 주어진 집단에서 그의 대립인자의 특정한 빈도를 특징으로 하는 다형성을 초래했다. 마이크로새틀라이트, 삽입, 결실, 역전 및 카피수 변화를 포함한, 다수의 다른 종류의 서열 변이가 인간 게놈 내에서 발견된다. 다형성 마이크로새틀라이트는 특정한 부위에 복수 개의 짧은 염기 반복체(small repeat of bases)(예를 들면, CA 반복체, 상보성 가닥 상의 TG)를 가지며, 전체 집단에서 반복체 길이의 수가 변화한다. 일반적인 용어로, 다형성 부위에 대한 서열의 각 버전은 상기 다형성 부위의 특정한 대립인자를 나타낸다. 모든 서열 변이들은 해당 서열 변이의 특징적인, 특정한 다형성 부위에서 일어나는, 다형성으로 지칭될 수 있다. 일반적인 용어로, 다형성은 임의의 수의 특정한 대립인자를 포함할 수 있다. 따라서, 본 발명의 일 구체예에서, 다형성은 임의의 주어진 집단에서 둘 이상의 대립인자의 존재를 특징으로 한다. 또 다른 구체예에서, 다형성은 세개 이상의 대립인자의 존재를 특징으로 한다. 다른 구체예에서, 다형성은 4개 이상의 대립인자, 5개 이상의 대립인자, 6개 이상의 대립인자, 7개 이상의 대립인자, 9개 이상의 대립인자 또는 10개 이상의 대립인자의 존재를 특징으로 한다. 모든 그와 같은 다형성은 본 발명의 방법 및 키트에서 이용될 수 있고, 따라서, 본 발명의 범위 내에 속한다.
일부 경우에, 기준 대립인자(reference allele)를 선택하지 않고, 다형성 부위에서 상이한 대립인자를 지칭할 수 있다. 대안적으로, 특정한 다형성 부위에 대해 기준 서열이 지칭될 수 있다. 기준 대립인자는 종종 "야생형(wild-type)" 대립인자로 지칭되고, 이는 통상적으로 최초의 서열결정된(first sequenced) 대립인자 또는 "영향받지 않은(non-affected)" 개체(예를 들면, 성향(trait)이나 질병 표현형을 보이지 않는 개체)로부터의 대립인자로 선택된다.
본 명세서에서 지칭되는 SNP 마커에 대한 대립인자는 이용된 SNP 분석법에서 다형성 부위에서 그들이 나타나는 경우, 염기 A, C, G 또는 T로 지칭된다. 본 명세서에서 이용된 SNP에 대한 대립인자 코드는 하기와 같다: 1 = A, 2 = C, 3 = G, 4 = T. 그러나, 본 발명이 속하는 기술 분야의 당업자는 반대쪽 DNA 가닥을 분석하거나 또는 판독하는 것에 의해, 각 경우에 상보적 대립인자가 측정될 수 있다는 것을 인식할 것이다. 따라서, A/G 다형성을 포함하는 다형성 부위(다형성 마커)에 대해, 이용되는 분석법은 가능한 두 염기, 즉, A 및 G 중 하나 또는 양자 모두의 백분율 또는 비를 측정할 수 있다. 대안적으로, DNA 주형 상의 반대쪽 가닥을 결정(분석)하는 분석법을 설계하는 것에 의해, 상보적 염기 T 및 C의 존재가 측정될 수 있다. 정량적으로(예를 들면, 상대적 위험도의 측면에서), 동일한 결과가 각 DNA 가닥(+ 가닥 또는 - 가닥)의 측정으로부터 수득될 것이다.
일반적으로, 특정한 서열에 대해 기준 서열이 지정된다. 기준과 상이한 대립인자는 종종 "변이(variant)" 대립인자로 지칭된다. 본 명세서에서 사용된, 변이 서열(variant sequence)은 기준 서열과 상이하나, 그 외에는 실질적으로 유사한 서열을 의미한다. 본 명세서에 기재된 다형성 유전적 마커의 대립인자는 변이(variant)이다. 추가적인 변이들은 폴리펩티드에 영향을 미치는 변화들을 포함할 수 있다. 기준 뉴클레오티드 서열과 비교한 경우, 서열 차이는 프레임 쉬프트(frame shift)를 초래하는, 단일 뉴클레오티드의 삽입 또는 결실, 하나보다 많은 수의 뉴클레오티드의 삽입 또는 결실; 코딩된 아미노산의 변화를 초래하는, 하나 이상의 뉴클레오티드의 변화; 조기 종료 코돈(premature stop codon)의 생성을 초래하는, 하나 이상의 뉴클레오티드의 변화; 뉴클레오티드에 의해 코딩된, 하나 이상의 아미노산의 결실을 초래하는, 수개의 뉴클레오티드의 결실; 해독 프레임(reading frame)의 코딩 서열의 중단(interruption)을 초래하는, 불균등 재조합(unequal recombination) 또는 유전자 전환(gene conversion)과 같은, 하나 또는 수개의 뉴클레오티드의 삽입; 전체 서열 또는 일부 서열의 중복; 전위; 또는 뉴클레오티드 서열의 재배열을 포함한다. 그와 같은 서열 변화는 핵산에 의해 코딩된 폴리펩티드를 변화시킬 수 있다. 예를 들면, 핵산 서열의 변화가 프레임 쉬프트를 유발하는 경우, 프레임 쉬프트는 코딩된 아미노산의 변화를 초래할 수 있고, 및/또는 조기 종료 코돈의 생성을 초래하여, 절단된(truncated) 폴리펩티드의 생성을 유발한다. 대안적으로, 질병 또는 성향과 연관된 다형성은 하나 또는 그 이상의 뉴클레오티드의 동의적 변화(synonymous change)(즉, 아미노산 서열의 변화를 초래하지 않는 변화)일 수 있다. 그와 같은 다형성은 예를 들면, 스플라이싱 부위(splice site)를 변화시키고, mRNA의 안정성 또는 수송에 영향을 미치거나 또는 코딩된 폴리펩티드의 전사 또는 번역에 영향을 미칠 수 있다. 다형성은 또한 증폭 또는 결실과 같은 구조적 변화가 체세포 수준(somatic level)에서 일어날 가능성을 증가시키도록 DNA를 변화시킬 수 있다. 기준 뉴클레오티드 서열에 의해 코딩된 폴리펩티드는 특정한 기준 아미노산 서열을 갖는 "기준(reference)" 폴리펩티드이고, 변이 대립인자에 의해 코딩된 폴리펩티드는 변이 아미노산 서열을 갖는 "변이(variant)" 폴리펩티드로 지칭된다.
일배체형은 세그먼트를 따라 배열된 대립인자의 특정한 조합을 특징으로 하는 DNA의 세그먼트를 의미한다. 인간과 같은 이배체 개체의 경우, 일배체형은 각 다형성 마커 또는 유전자 좌에 대한 1쌍의 대립인자 중 하나의 대립인자를 포함한다. 특정한 구체예에서, 일배체형은 두개 이상의 대립인자, 세개 이상의 대립인자,네개 이상의 대립인자, 또는 다섯개 이상의 대립인자를 포함할 수 있고, 각 대립인자는 세그먼트 상의 특정한 다형성 마커에 대응된다. 일배체형은 다양한 다형성 마커의 조합, 예를 들면, 다형성 부위에 특정한 대립인자를 갖는 SNP와 마이크로새틀라이트의 조합을 포함할 수 있다. 따라서, 일배체형은 다양한 유전적 마커에서 대립인자의 조합을 포함한다.
특정한 다형성 마커 및/또는 일배체형의 검출은 본 발명이 속하는 기술 분야에서 공지된, 다형성 부위에서 서열을 검출하는 방법에 의해 달성될 수 있다. 예를 들면, PCR, LCR, 이중 PCR(nested PCR) 및 핵산 증폭을 위한 기타 기법을 이용한, 형광-기반 기법(Chen, X. et al., Genome Res. 9(5): 492-98 (1999); Kutyavin et al., Nucleic Acid Res. 34: e128 (2006)))과 같은, SNP 및/또는 마이크로새틀라이트 마커의 존재에 대한 유전형분석을 위한 표준 기법이 이용될 수 있다. SNP 유전형분석을 위해 이용할 수 있는 특정한 방법들은 TaqMan 유전형 분석법(genotyping assay) 및 SNPlex 플랫폼(Applied Biosystems), 질량 분석법(예를 들면, Sequenom의 MassARRAY 시스템), 미니-시퀀싱(mini-sequencing) 방법, 실시간 PCR, Bio-Plex 시스템(BioRad), CEQ and SNPstream 시스템(Beckman), Molecular Inversion Probe 어레이 기술(예를 들면, Affymetrix GeneChip), 및 BeadArray Technologies(예를 들면, Illumina GoldenGate 및 Infinium 분석법)를 포함하나, 이에 한정되지 않는다. 상기 방법들 또는 본 발명이 속하는 기술분야의 당업자에게 이용가능한 다른 방법에 의해, 마이크로새틀라이트, SNP 또는 다른 종류의 다형성 마커를 포함한, 다형성 마커에서의 하나 이상의 대립인자가 확인될 수 있다.
본 명세서에 기재된 특정한 방법에서, 연구 대상인 특정한 질병 또는 성향(예를 들면,유방암)에 대한 증가된 감수성(즉, 증가된 위험도)을 갖는 개체는 상기 질병 또는 성향에 대해 증가된 감수성을 부여하는 하나 이상의 다형성 마커의 하나 이상의 대립인자 또는 일배체형(즉, 위험 마커 대립인자 또는 일배체형)이 확인된 개체이다. 일 양태에서, 상기 위험 마커 또는 일배체형은 유방암의 유의성 있는 증가된 위험도(또는 감수성)를 부과하는 마커 또는 일배체형이다. 일 구체예에서, 마커 또는 일배체형과 연관된 유의성은 상대적 위험도(relative risk, RR)에 의해 측정된다. 또 다른 구체예에서, 마커 또는 일배체형과 연관된 유의성은 오즈비(odds ratio, OR)에 의해 측정된다. 또 다른 구체예에서, 유의성은 백분율로 측정된다. 일 구체예에서, 유의성 있는 증가된 위험도는 1.2 이상, 1.3 이상, 1.4 이상, 1.5 이상, 1.6 이상, 1.7 이상, 1.8 이상, 1.9 이상, 2.0 이상, 2.5 이상, 3.0 이상, 4.0 이상, 및 5.0 이상을 포함하나, 이에 한정되지 않는, 1.2 이상의 위험도(상대적 위험도 및/또는 오즈비)로 측정된다. 특정한 구체예에서, 1.2 이상의 위험도(상대적 위험도 및/또는 오즈비)는 유의성이 있다. 또 다른 특정한 구체예에서, 1.3 이상의 위험도는 유의성이 있다. 또 다른 구체예에서, 1.4 이상의 위험도는 유의성이 있다. 또 다른 구체예에서, 약 1.5 이상의 위험도는 유의성이 있다. 또 다른 추가적인 구체예에서, 약 1.7 이상의 위험도는 유의성이 있다. 그러나, 다른 컷오프, 예를 들면, 1.15, 1.25, 1.35 이상 등이 고려되며, 그와 같은 컷오프도 또한 본 발명의 범위 내에 속한다. 다른 구체예에서, 위험도의 유의성 있는 증가는 약 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 100%, 150%, 200%, 300%, 및 500%를 포함하나, 이에 한정되지 않는, 약 20% 이상이다. 하나의 특정한 구체예에서, 위험도의 유의성 있는 증가는 20% 이상이다. 다른 구체예에서, 위험도의 유의성 있는 증가는 30% 이상, 40% 이상, 50% 이상, 60% 이상, 70% 이상, 80% 이상, 90% 이상 및 100% 이상이다. 그러나, 본 발명이 속하는 기술 분야의 당업자에 의해 본 발명의 특징으로 적합한 것으로 간주되는 다른 컷오프 또는 범위도 고려되고, 그들도 본 발명의 범위 내에 속한다. 특정한 구체예에서, 위험의 유의성 있는 증가는 0.05 미만, 0.01 미만, 0.001 미만, 0.0001 미만, 0.00001 미만, 0.000001 미만, 0.0000001 미만, 0.00000001 미만, 또는 0.000000001 미만의 p-값과 같은 p-값을 특징으로 한다.
본 발명의 위험 다형성 마커 또는 일배체형은 하나 이상의 마커의 하나 이상의 대립인자 또는 일배체형이 비교군(대조군)에서의 존재의 빈도 대비 유방암에 대한 위험도를 갖는 개체(질병군(affected))에 보다 빈번하게 존재하고, 상기 마커 또는 일배체형의 존재가 상기 질병 또는 성향에 대한 감수성을 나타내는 것인 마커 또는 일배체형이다. 일 구체예에서, 대조군은 집단 표본(population sample), 즉, 일반적인 집단으로부터의 랜덤 표본일 수 있다. 또 다른 구체예에서, 대조군은 질병에 걸리지 않은 개인, 예를 들면, 유방암으로 진단되지 않은 개인의 군으로 대표된다. 일 구체예에서, 그와 같은, 질병-불포함(disease-free) 대조군은 하나 이상의 특정한 질병-연관 증상의 부재를 특징으로 할 수 있다. 또 다른 구체예에서, 상기 질병-불포함 대조군은 하나 이상의 질병-특이적 위험 인자의 부재를 특징으로 한다. 일 구체예에서, 그와 같은 위험 인자는 하나 이상의 환경적 위험 인자이다. 대표적인 환경적 인자들은 특정한 질병 또는 성향을 발현할 위험도에 영향을 미치는 것으로 알려지거나, 상기 위험도에 영향을 미치는 것으로 고려되는 천연 산물, 미네랄, 또는 기타 화학물질이다. 기타 환경적 위험 인자들은 식음습관(food and drink habit), 주요 거주지의 지리적 위치 및 직업적 위험 인자를 포함하나, 이에 한정되지 않는, 생활방식(lifestyle)과 관련된 위험 인자들이다. 또 다른 구체예에서, 위험 인자는 하나 이상의 유전적 위험 인자를 포함한다.
상관관계에 대한 간단한 검정의 예로서 2 x 2 표(two by two table) 상에서의 Fisher-exact 검정이 있다. 염색체의 코호트가 주어지면, 마커 및 일배체형을 모두 포함하는 염색체, 마커 또는 일배체형을 중 하나를 포함하고, 나머지 하나는 포함하지 않는 염색체 및 마커나 일배체형 중 어느 것도 포함하지 않는 염색체의 갯수로부터 2 x 2 표가 작성된다.
본 발명의 다른 구체예에서, 질병 또는 성향에 대한 감소된 감수성(즉, 감소된 위험도)을 갖는 개체는 상기 질병 또는 성향에 대한 감소된 감수성을 부여하는 하나 이상의 다형성 마커의 하나 이상의 특정한 대립인자 또는 일배체형이 확인된 개체이다. 감소된 위험도를 부여하는 마커 대립인자 및/또는 일배체형은 또한 보호성(protective)인 것으로 표현된다. 일 양태에서, 보호성 마커 또는 일배체형은 질병 또는 성향의 유의성 있는 감소된 위험도(또는 감수성)를 부여하는 마커 또는 일배체형이다. 일 구체예에서, 유의성 있는 감소된 위험도는 0.9 미만, 0.8 미만, 0.7 미만, 0.6 미만, 0.5 미만, 0.4 미만, 0.3 미만, 0.2 미만 및 0.1 미만을 포함하나, 이에 한정되지 않는, 0.9 미만의 상대적 위험도로 측정된다. 하나의 특정한 구체예에서, 유의성 있는 감소된 위험도는 0.7 미만이다. 또 다른 구체예에서, 유의성 있는 감소된 위험도는 0.5 미만이다. 또 다른 구체예에서, 유의성 있는 감소된 위험도는 0.3 미만이다. 또 다른 구체예에서, 위험도(또는 감수성)의 감소는 25% 이상, 30% 이상, 35% 이상, 40% 이상, 45% 이상, 50% 이상, 55% 이상, 60% 이상, 65% 이상, 70% 이상, 75% 이상, 80% 이상, 85% 이상, 90% 이상, 95% 이상 및 98% 이상을 포함하나, 이에 한정되지 않는, 20% 이상이다. 하나의 특정한 구체예에서, 위험도의 유의성 있는 감소는 약 30% 이상이다. 또 다른 구체예에서, 위험도의 유의성 있는 감소는 약 50% 이상이다. 또 다른 구체예에서, 위험도의 유의성 있는 감소는 약 70% 이상이다. 본 발명이 속하는 기술 분야의 당업자에 의해 본 발명의 특징으로 적합한 것으로 간주되는 다른 컷오프 또는 범위도 고려되고, 그들도 본 발명의 범위 내에 속한다.
본 발명이 속하는 기술 분야의 당업자는 연구된 집단에 존재하는 두개의 대립인자를 갖는 마커에 대해, 하나의 대립인자가 상기 집단 내에서 성향 또는 질병을 갖는 개인의 그룹에서 대조군 대비 증가된 빈도로 발견되는 경우, 상기 마커의 나머지 다른 대립인자는 상기 성향 또는 질병을 갖는 개인의 그룹에서 대조군 대비 감소된 빈도로 발견될 것으로 이해할 것이다. 그와 같은 경우에, 상기 마커의 하나의 대립인자(상기 성향 또는 질병을 갖는 개인에서 증가된 빈도로 발견되는 대립인자)은 위험 대립인자(at-risk allele)이고, 나머지 다른 대립인자는 보호성 대립인자(protective allele)일 것이다.
질병 또는 성향(예를 들면, 유방암)과 연관된 유전적 변이가 단독으로 주어진 유전형에 대해 질병의 위험도를 예측하기 위해 이용될 수 있다. SNP와 같은 이대립인자 마커(biallelic marker)의 경우, 3개의 가능한 유전형이 있다: 위험 변이에 대한 동형접합체, 이형접합체(heterozygote), 및 상기 위험 변이의 비-보인자(non-carrier). 복수의 유전자 좌에서의 변이와 연관된 위험도가 전체 위험도를 추정하기 위해 이용될 수 있다. 복수 개의 SNP 변이에 대해, k( = 3 n x 2 p ) 개의 가능한 유전형이 있고; 상기에서 n은 상염색체 유전자좌(autosomal loci)의 갯수이고 p는 성염색체 유전자좌의 갯수이다. 전체 위험도 평가 계산은 통상적으로 상이한 유전적 변의의 상대적 위험도가 곱해진다는 것, 즉, 특정한 유전형 조합과 연관된 전체 위험도(예를 들면, RR 또는 OR)가 각 유전자좌의 유전자형에 대한 위험도 값의 곱이라는 것을 가정한다. 제시된 위험도가 일치된(matched) 성별 및 민족을 갖는 기준 집단 대비 개인, 또는 개인에 대한 특정한 유전형에 대한 상대적 위험도를 나타내는 경우, 통합 위험도(combined risk)는 유전자좌-특이적 위험도 값의 곱이고, 이는 또한 집단 대비 전체 위험도 추정치에 해당한다. 개인에 대한 위험도가 위험 대립인자의 비-보인자에 대한 비교에 근거하는 경우, 통합 위험도는 모든 유전자좌의 유전형의 주어진 조합을 갖는 인간을 상기 유전자좌들에서 위험 변이를 보유하지 않는 개인들의 군에 비교하는 추정치에 해당한다. 위험 변이의 비-보인자들의 그룹은 가장 낮은 추정된 위험도를 가지며 그 자체(즉, 비-보인자)와 비교하여 1.0의 통합 위험도를 가지나, 집단 대비, 1.0 미만의 전체 위험도를 갖는다. 비-보인자 그룹은 잠재적으로 매우 작을 수 있고, 특히, 다수의 유전자좌에 대해 매우 작을 수 있으며, 그 경우, 그의 관련성은 그만큼 작다는 것에 주목해야 한다.
승법 모델(multiplicative model)은 일반적으로 복합 성향(complex trait)의 데이터에 합리적으로 잘 맞는 간명(parsimonious) 모델이다. 승법성(multiplicity)으로부터의 편향은 일반적인 질환에 대한 일반적인 변이에서는 드물게 설명되었으며, 보고된 경우에도, 제안적인 것에 불과하며, 이는 유전자좌 간의 통계적 상호작용을 입증할 수 있기 위해서는 매우 큰 표본 크기가 통상적으로 요구되기 때문이다.
예로서, 전립선 암과 연관된 것으로 개시된 총 8개의 변이를 고려한다(Gudmundsson, J., et al., Nat Genet 39:631-7 (2007), Gudmundsson, J., et al., Nat Genet 39:977-83 (2007); Yeager, M., et al, Nat Genet 39:645-49 (2007), Amundadottir, L., el al., Nat Genet 38:652-8 (2006); Haiman, C.A., et al., Nat Genet 39:638-44 (2007)). 이 유전자좌들 중 7개는 상염색체 상에 있고, 나머지 유전자좌는 염색체 X 상에 있다. 이 때, 이론적인 유전형 조합의 총수는 37 x 21 = 4374이다. 그 유전형 분류(genotypic class) 중 일부는 매우 드무나, 여전히 가능하고, 전체 위험도 평가를 위해 고려되어야 한다. 복수 개의 유전적 변이의 경우에 적용된 승법 모델은 상기 유전적 변이가 "환경적(environmental)" 인자와 명확하게 상관되지 않는다는 것을 가정할 때 비-유전적 위험 변이와의 결합(conjugation)에서 유효할 것으로 보인다. 다시 말하면, 비-유전적 위험 인자와 유전적 위험 인자가 상호작용하지 않는다는 것을 가정할 때, 유전적 변이와 비-유전적 변이는 통합 위험도를 추정하기 위해 승법 모델 하에 평가될 수 있다.
동일한 정량적 접근방법을 이용하여, 본 명세서에 기재된, 유방암과 연관된 복수 개의 변이와 연관된 통합 위험도 또는 전체 위험도가 평가될 수 있다. 하나의 그와 같은 구체예에서, 마커 rs4848543, rs13387042 및 rs3803662 또는 이 마커들과 연관 불균형인 대리 마커들이 평가되고, 유전형 조합(33= 27가지의 가능한 조합)에 대한 위험도가 계산된다. 또 다른 구체예에서, 전체 위험도를 산출하기 위해 상기 마커들 중 두개(예를 들면, 마커 rs13387042 및 rs3803662)에 대한 유전형이 조합될 수 있다. 다른 구체예에서, 유방암에 대한 소인을 부여하는 것으로 알려진 추가적인 마커들(예를 들면, BRCA1, BRCA2, BARD1과 같은, 고 침투성 위험 인자)가 본 명세서에 기재된 하나 이상의 위험 인자들과 조합된다.
연관 불균형(Linkage Disequilibrium)
각 감수분열 사건 동안 각 염색체 쌍에 대해 평균 1회 일어나는, 재조합의 자연적인 현상은 자연이 서열(및 결과적으로 생물학적 기능)에 변화를 제공하는 한가지 방법이다. 재조합은 게놈에서 랜덤하게 일어나지 않는 것으로 발견되었다; 오히려, 재조합율의 빈도에 큰 변화가 있어서, 높은 재조합 빈도를 갖는 작은 영역(따라서, 재조합 핫스팟(recombination hotspot)으로 불림) 및 일반적으로 연관 불균형(LD) 블럭이라 불리는, 낮은 재조합 빈도의 보다 넓은 영역을 생성한다(Myers, S. et al., Biochem Soc Trans 34:526-530 (2006); Jeffreys, A.J., et al.,Nature Genet 29:217-222 (2001); May, C.A., et al., Nature Genet 31:272-275(2002)).
연관 불균형(Linkage Disequilibrium, LD)은 두 개의 유전적 요소의 비-랜덤 조합(non-random assortment)을 의미한다. 예를 들면, 특정한 유전적 요소(예를 들면, 다형성 마커의 대립인자(allele))가 0.50(50%)의 빈도로 집단에서 일어나고, 또 다른 요소가 0.50(50%)의 빈도로 일어나는 경우, 두 요소를 모두 갖는 개인의 예상되는 발생율은 상기 요소들의 랜덤 분포를 가정하면, 0.25(25%)이다. 그러나, 상기 두 요소들이 0.125보다 더 높은 빈도로 함께 나타나는 것으로 발견되는 경우, 상기 요소들은 연관 불균형에 있다고 하며, 이는 그들이 그들의 독립적인 대립인자 빈도가 예측하는 비율보다 더 높은 비율로 함께 유전되는 경향이 있기 때문이다. 개략적으로, LD는 일반적으로 두 요소간의 재조합 사건의 빈도와 상관관계를 갖는다. 집단에서 대립인자 또는 일배체형 빈도는 집단 내의 개체의 유전형을 분석하고 상기 집단에서 각 대립인자 또는 일배체형의 발생 빈도를 결정하는 것에 의해 결정될 수 있다. 이배체(diploid)의 집단, 예를 들면, 인간 집단의 경우, 개인들은 일반적으로 각 유전적 요소(예를 들면, 마커, 일배체형 또는 유전자)에 대해 두 개의 대립인자 또는 대립인자 조합을 가질 것이다.
다수의 상이한 척도들이 연관 불균형(LD)의 강도를 평가하기 위해 제안되었다. 대부분은 이대립인자(biallelic) 부위의 쌍 간의 연관의 강도를 획득한다. LD의 두 개의 중요한 일대일 척도(pairwise measures)는 r2 (△2으로 표시되기도 함) 및 |D'|이다. 두 척도는 모두 0(불균형 없음) 내지 1('완전한' 불균형)의 범위이나, 그들의 해석은 약간 다르다. |D'|는 가능한 일배체형 중 2개 또는 3개만 존재하는 경우, 그 값이 1이고, 모든 4개의 가능한 일배체형이 존재하는 경우는 그 값이 1보다 작은 것으로 정의된다. 따라서, 1보다 작은 |D'|의 값은 두 부위 간에 과거에 재조합이 일어났을 수도 있다는 것을 나타낸다(재발성 돌연변이(recurrent mutation)는 |D'|가 1보다 작게할 수 있으나, 단일 뉴클레오티드 다형성(SNP)의 경우, 이는 통상적으로 재조합보다 가능성이 낮은 것으로 간주됨). 척도 r2는 두 부위간의 통계적 상관성을 나타내고, 두 개의 일배체형만 존재하는 경우 1의 값을 취한다.
r2와, 감수성 유전자 좌와 SNP 간의 연관성을 검출하기 위해 요구되는 표본 크기 간에 단순한 반비례 관계(inverse relationship)가 있기 때문에, r2 측정값은 이론의 여지는 있지만 연관 맵핑(association mapping)에 대한 가장 적합한 척도이다. 이 척도는 부위의 쌍에 대해 정의되나, 일부 적용의 경우, 다수의 다형성 부위를 포함하는 전체 영역에서 LD가 얼마나 강한지를 결정하는 것이 바람직할 수 있다(예를 들면, LD의 강도가 유전자 좌들 간에 또는 집단 전체에 있어서 유의성 있게 상이한지 여부, 또는 하나의 영역에서 특정한 모델 하에서 예측된 것보다 더 크거나 또는 더 작은 LD가 존재하는지 여부). 한 영역에 대해 LD를 측정하는 것은 간단하지 않으나, 하나의 방법은 집단 유전학에서 개발된, 척도 r을 이용하는 것이다. 개략적으로 말하면, r은 데이터에서 확인되는 LD를 생성하기 위해, 특정한 집단 모델 하에서 어느 정도의 재조합이 요구되는지를 측정한다. 이 종류의 방법은 또한 잠재적으로 LD 데이터가 재조합 핫스팟의 존재에 대한 증거를 제공하는지 여부를 결정하는 문제에 대한 통계적으로 엄격한 방식을 제공할 수 있다. 본 명세서에 기재된 방법의 경우, 유의성 있는 r2 값은 0.1 이상, 예를 들면, 0.1 이상, 0.15 이상, 0.2 이상, 0.25 이상, 0.3 이상, 0.35 이상, 0.4 이상, 0.45 이상, 0.5 이상, 0.55 이상, 0.6 이상, 0.65 이상, 0.7 이상, 0.75 이상, 0.8 이상, 0.85 이상, 0.9 이상, 0.91 이상, 0.92 이상, 0.93 이상, 0.94 이상, 0.95 이상, 0.96 이상, 0.97 이상, 0.98 이상, 0.99 이상 또는 1.0 이상일 수 있다. 하나의 바람직한 구체예에서, 유의성 있는 r2 값은 0.2 이상일 수 있다. 대안적으로, 본 명세서에 기재된 연관 불균형은 0.3 이상, 0.4 이상, 0.5 이상, 0.6 이상, 0.7 이상, 0.8 이상, 0.85 이상, 0.9 이상, 0.95 이상, 0.96 이상, 0.97 이상, 0.98 이상, 0.99 이상과 같은, 0.2 이상의 |D'| 값을 특징으로 하는 연관 불균형을 의미한다. 따라서, 연관 불균형은 별개의 마커들의 대립인자 간의 상관관계를 나타낸다. 연관 불균형은 상관 계수(correlation coefficient) 또는 |D'| (1.0 이하의 r2 및 1.0 이하의 |D'|)에 의해 측정된다. 일부 구체예에서, 연관 불균형은 r2 및 |D'| 척도 모두에 대한 값으로 정의된다. 하나의 그와 같은 구체예에서, 유의성 있는 연관 불균형은 0.1보다 큰 r2 및 0.8보다 큰 |D'|으로 정의된다. 또 다른 구체예에서, 유의성 있는 연관 불균형은 0.2보다 큰 r2 및 0.8보다 큰 |D'|으로 정의된다. 또 다른 구체예에서, 유의성 있는 연관 불균형은 0.2보다 큰 r2 및 0.9보다 큰 |D'|으로 정의된다. 연관 불균형을 결정하기 위해 r2 및 |D'| 값의 다른 조합 및 변경(permutation)도 고려되며, 본 발명의 범위 내에 속한다. 연관 불균형은 본 명세서에서 정의된 바와 같이, 하나의 인간 집단에서 결정될 수 있거나, 또는 하나보다 많은 인간 집단으로부터의 개인들을 포함하는 표본의 집합(colleciton)에서 결정될 수 있다. 본 발명의 일 구체예에서, LD는 정의된 바와 같은(http://www.hapmap.org), 하나 이상의 HapMap 집단(코카서스인, 아프리카인, 일본인, 중국인)으로부터의 표본에서 결정된다. 하나의 그와 같은 구체예에서, LD는 HapMap 표본의 CEU 집단에서 결정된다. 또 다른 구체예에서, LD는 YRI 집단에서 결정된다. 또 다른 구체예에서, LD는 아이슬란드 집단으로부터의 표본에서 결정된다.
게놈의 모든 다형성이 집단 수준에서 동일하다면, 모든 상이한 다형성 상태를 평가하기 위해 모든 단일 다형성이 연관(association) 연구에서 조사되어야 할 것이다. 그러나, 다형성 간의 연관 불균형 때문에, 긴밀하게 연관된 다형성들이 강한 상관관계를 가지며, 이는 유의성 있는 연관을 관찰하기 위해 연관 연구에서 조사되어야 하는 다형성의 갯수를 감소시킨다. LD의 또 다른 결과는 이 다형성들이 강한 상관관계를 갖는다는 사실 때문에, 다수의 다형성들이 연관 신호(association signal)를 생성할 수 있다는 것이다.
게놈 LD 맵이 게놈 전체에 대해 생성되었고, 그와 같은 LD 맵이 질병-유전자를 맵핑하기 위한 프레임워크로 작용할 것으로 제안되었다(Risch, N. & Merkiangas, K, Science 273:1516-1517 (1996); Maniatis, N., et al., Proc Natl Acad Sci USA 99:2228-2233 (2002); Reich, DE et al, Nature 411:199-204 (2001)).
현재, 인간 게놈의 많은 부분들이 수개의 공통된 일배체형을 포함하는 일련의 별개의 일배체형 블럭들로 분류될 수 있다는 것이 확립되었다; 이 블럭들의 경우, 연관 불균형 데이터는 재조합을 나타내는 증거를 거의 제공하지 않는다(예를 들면, Wall., J.D. and Pritchard, J.K., Nature Reviews Genetics 4:587-597 (2003); Daly, M. et al., Nature Genet. 29:229-232 (2001); Gabriel, S.B. et al., Science 296:2225-2229 (2002); Patil, N. et al., Science 294:1719-1723 (2001); Dawson, E. et al., Nature 418:544-548 (2002); Phillips, M.S. et al., Nature Genet. 33:382-387 (2003) 참조).
이와 같은 일배체형 블럭을 정의하는 두 가지 주요한 방법들이 있다: 블럭은 한정된 일배체형 다양성을 갖는 DNA의 영역(예를 들면, Daly, M. et al., Nature Genet. 29:229-232 (2001); Patil, N. et al., Science 294:1719-1723 (2001); Dawson, E. et al., Nature 418:544-548 (2002); Zhang, K. et al., Proc. Natl. Acad. Sci. USA 99:7335-7339 (2002) 참조), 또는, 연관 불균형을 이용하여 확인된, 광범위한 과거의 재조합(extensive historical recombination)을 갖는 이행 구역(transition zone) 간의 영역(예를 들면, Gabriel, S.B. et al., Science 296:2225-2229 (2002); Phillips, M.S. et al., Nature Genet. 33:382-387 (2003); Wang, N. et al., Am. J. Hum. Genet. 71:1227-1234 (2002); Stumpf, M.P., and Goldstein, D.B., Curr. Biol. 13:1-8 (2003) 참조)으로 정의될 수 있다. 보다 최근에, 인간 게놈 전체에 대한 재조합률(recombination rate) 및 상응하는 핫스팟의 상세 맵(fine-scale map)이 작성되었다(Myers, S., et al., Science 310:321-32324 (2005); Myers, S. et al., Biochem Soc Trans 34:526530 (2006)). 상기 맵은 게놈 전체에서 재조합의 엄청난 변이를 보여주며, 재조합률은 핫스팟에서 10-60 cM/Mb로 높았고, 개재 영역(intervening region)에서는 재조합률이 0에 가까워서, 제한적인 일배체형 다양성 및 높은 LD의 영역을 나타낸다. 따라서, 상기 맵은 일배체형 블럭 및/또는 LD 블럭을 재조합 핫스팟에 의해 둘러싸인(flanked) 영역으로 정의하기 위해 이용될 수 있다. 본 명세서에서 사용된, 용어 "일배체형 블럭(haplotype block)" 또는 "LD 블럭"은 전술된 특징들에 의해 정의되는 블럭, 또는 그와 같은 영역을 정의하기 위해 본 발명이 속하는 기술 분야의 당업자에 의해 이용되는 다른 대안적인 방법에 의해 정의되는 블럭을 포함한다.
일배체형 블럭을 식별하는 일부 대표적인 방법들이 예를 들면, 미국특허출원공개 제20030099964호, 제20030170665호, 제20040023237호 및 제20040146870호에 개시된다. 일배체형 블럭(LD 블럭)은 단일 마커, 또는 복수 개의 마커를 포함하는 일배체형을 이용하여, 표현형과 일배체형 상태 간의 연관을 맵핑하기 위해 이용될 수 있다. 각 일배체형 블럭에서 주요한 일배체형이 식별되고, 그 후, 일련의 "태깅(tagging)" SNP 또는 마커들(일배체형들을 구별하기 위해 필요한 최소 세트의 SNP 또는 마커)이 식별될 수 있다. 이 태깅 SNP 또는 마커들은 표현형과 일배체형 간의 연관을 확인하기 위해, 개체들의 군(group)으로부터의 표본의 평가에서 이용될 수 있다. 필요한 경우, 인접한 일배체형 블럭들 간에는 연관 불균형이 존재할 수 있기 때문에, 이 블럭들이 동시에 평가될 수 있다.
다양한 집단에서 차등적인 과거의 재조합률(historical rate of assortment) 때문에, 연관 불균형은 집단 간에 다를 수 있다는 것이 잘 알려져 있다. 본 발명의 일부 구체예에서, LD는 코카서스계 표본에서 결정된 LD를 의미한다. 특정한 구체예에서, LD는 HapMap 컨소시움(http://www.hapmap.org에 설명된 바와 같이)으로부터의 코카서스계 CEPH 표본에서 결정된다. 다른 구체예에서, LD는 아프리카계 집단, 아프리카계-미국인 집단, 히스패닉계 집단, 일본계 집단, 중국계 집단에서 결정된다. 일부 구체예에서, LD는 (http://www.hapmap.org)에 기재된 바와 같이, 중국, 일본, 아프리카로부터의 HapMap 표본에서 결정된다.
따라서, 게놈에서 다형성 마커에 대한 관찰된 연관에 대해, 게놈 내의 추가적인 마커들이 또한 연관을 보일 수 있다는 것이 명백하다. 이는 재조합률의 큰 변이에서 관찰된 바와 같이, 게놈 전체에서 LD의 불균등한 분포의 당연한 결과이다. 따라서, 연관을 검출하기 위해 이용되는 마커들은 주어진 질병 또는 성향과 연관된 게놈 영역(즉, 일배체형 블럭 또는 LD 블럭)에 대한 "택(tag)"을 나타낸다. 하나 이상의 원인이 되는(causative)(기능성) 변이 또는 돌연변이가 상기 질병 또는 성향과 연관된 것으로 확인되는 영역 내에 존재할 수 있다. 그와 같은 변이는 연관을 검출하기 위해 이용되는 태깅 마커에 대해 관찰되는 것보다 더 높은 상대적 위험도(RR) 또는 오즈비(OR)를 부여할 수 있다. 따라서, 본 발명은 본 명세서에 기재된 바와 같이, 질병과의 연관을 검출하기 위해 이용되는 마커, 및 상기 마커와 연관 불균형인 마커를 포함한다. 따라서, 본 발명의 특정한 구체예에서, 본 명세서에 기재된 바와 같은, 본 발명의 마커 및/또는 일배체형과 LD인 마커가 대리 마커(surrogate marker)로 이용될 수 있다. 일 구체예에서, 대리 마커는 본 명세서에 기재된 바와 같이, 초기에 상기 질병과 연관된 것으로 확인된 마커 또는 일배체형의 경우보다 더 작은 상대적 위험도(RR) 및/또는 오즈비(OR)을 갖는다. 다른 구체예에서, 대리 마커는 본 명세서에 기재된 바와 같이, 상기 질환과 연관된 것으로 초기에 확인된 마커에 대해 초기에 결정된 RR 또는 OR 값보다 큰 RR 또는 OR 값을 갖는다. 그와 같은 구체예의 예는 본 명세서에 기재된 변이와 같은, 상기 질병과 연관되는 것으로 초기에 확인된 보다 더 일반적인 변이(> 10% 집단 빈도)와 LD인 드물거나, 또는 비교적 드문(< 10% 대립인자의 집단 빈도) 변이일 것이다. 본 명세서에 기재된 바와 같이, 본 발명자들에 의해 발견된 연관을 검출하기 위해 그와 같은 마커들을 식별하고 이용하는 것은 본 발명이 속하는 기술 분야의 당업자에게 잘 알려진 통상적인 방법에 의해 수행될 수 있고, 따라서, 본 발명의 범위에 속한다.
일배체형 빈도의 결정
기대값-극대화 알고리즘(expectation-maximization algorithm)을 이용하여 환자군 및 대조군에서 일배체형의 빈도를 추정할 수 있다(Dempster A. et al., J. R. Stat. Soc. B, 39:1-38 (1977)). 결실된 유전형 및 그 상태(phase)에 따른 불확실성을 처리할 수 있는 이 알고리즘의 구현이 이용될 수 있다. 귀무 가설(null hypothesis) 하에서, 환자와 대조군은 동일한 빈도를 갖는 것으로 가정된다. 가능성 방식(likelihood approach)을 이용하여, 본 명세서에 기재된 마커들을 포함할 수 있는, 후보 위험-일배체형이 대조군에서보다 환자에서 보다 높은 빈도를 가지며, 다른 일배체형의 빈도는 양 군에서 동일한 것으로 가정되는 것인 대안적인 가설이 테스트된다. 양 가설 하에 가능성이 각각 극대화되고, 상응하는 1-df 가능성 비 통계값이 통계적 유의성을 평가하기 위해 이용된다.
연관 영역(linkage region) 내에서 위험 마커와 일배체형 및 보호성 마커와 일배체형을 찾기 위해, 예를 들면, 마커들이 실제 영역에 걸쳐있는 경우, 유전형 분석된 마커들의 모든 가능한 조합의 연관이 연구된다. 통합된 환자군과 대조군이 원래의 환자군 및 대조군과 동일한 크기인 두개의 세트로 무작위로 분류될 수 있다. 그 후, 마커 및 일배체형 분석이 반복되고, 기록된 가장 유의성 있는 p-값이 결정된다. 이 랜덤화 체계(randomization scheme)는 p-값의 경험적 분포를 구성하기 위해 예를 들면, 100회 이상 반복될 수 있다. 바람직한 구체예에서, 0.05 미만의 p-값은 유의성 있는 마커 및/또는 일배체형 연관을 나타낸다.
일배체형 분석
일배체형 분석의 일반적인 방법은 NEsted MOdels에 적용된 가능성-기반 추론(likelihood-based inference)을 이용하는 단계를 포함한다(Gretarsdottir S., et al., Nat. Genet. 35:131-38 (2003)). 상기 방법은 다수의 다형성 마커, SNP 및 마이크로새틀라이트에 대해 이용될 수 있는 프로그램 NEMO에서 구현된다. 상기 방법 및 소프트웨어는 특별히, 상이한 위험도를 부여하는 일배체형 그룹을 식별하는 것을 목적으로 하는 케이스-대조군(case-control) 연구를 위해 설계된다. 상기 방법 및 소프트웨어는 또한 LD 구조를 연구하기 위한 도구이다. NEMO에서, 관찰된 데이터가 이를 결실-데이터(missing-data) 문제로 처리하기 때문에, EM 알고리즘을 이용하여, 최대 가능성 추정치, 가능성 비(likelihood ratio) 및 p-값이 직접 계산된다.
상태(phase)의 불확실성 및 결실된 유전형에 따른 정보 소실을 반영한, 관찰된 데이터에 대해 직접 계산된 가능성에 기반한 가능성 비 테스트가 유효한 p-값을 제공하기 위해 이용될 수 있으나, 정보의 불완전성 때문에 소실된 데이터의 양을 아는 것이 여전히 유용할 것이다. 일배체형 분석의 정보 척도(information measure)는 Nicolae and Kong (Technical Report 537, Department of Statistics, University of Statistics, University of Chicago; Biometrics, 60(2):368-75 (2004))에서 연관성 분석(linkage analysis)를 위해 정의된 정보 척도의 당연한 연장(natural extension)으로 설명되며, NEMO에서 구현된다.
질병에 대한 단일 마커 연관을 위해, 각각의 개별적인 대립인자에 대해 양측 p-값(two-sided p-value)을 계산하기 위해 Fisher exact 테스트가 이용될 수 있다. 통상적으로, 모든 p-값은 특별히 표시되지 않으면, 다중 비교(multiple comparison)에 대해 조정되지 않은 상태로 제시된다. (마이크로새틀라이트, SNP 및 일배체형에 대해) 제시된 빈도는 보인자 빈도(carrier frequency)와 대립되는, 대립인자 빈도(allelic frequency)이다. 연관 분석을 위한 가족으로 동원된 환자들의 혈연관계(relatedness)에 따른 편향을 최소화하기 위해, 환자 목록에서 1촌 및 2촌(first and second-degree) 친척들이 제외될 수 있다. 또한, 혈연관계(sibship)에 대해 Risch, N. & Teng, J. (Genome Res., 8:1273-1288 (1998))에 기재된 분산 조정 절차(variance adjustment procedure), DNA 풀링 (ibid)을 확대하여 일반적인 가족 관계(familial relationship)에 적용될 수 있도록, 상기 테스트가 환자들 간의 잔여 혈연관계(remaining relateteness)에 대해 보정하기 위해 연관에 대해 반복될 수 있고, 비교를 위해 조정된 p-값 및 조정되지 않은 p-값을 제시할 수 있다. 차이는 예상되는 바와 같이 일반적으로 매우 작다. 복수 회의 테스트에 대해 보정된 단일-마커 연관성의 유의성을 평가하기 위해, 본 발명자들은 동일한 유전형 데이터를 이용하여 랜덤화 테스트를 수행할 수 있다. 환자와 대조구의 코호트가 랜덤화되고 연관 분석이 복수 회(예를 들면, 500,000회 이하) 재수행되며, 그 p-값은 본 발명자들이 본래의 환자 및 대조구 코호트를 이용하여 관찰한 p-값과 동일하거나 그보다 더 낮은, 일부 대립인자에 대한 p-값을 생성하는 재현의 일부(fraction of replications)이다.
단일 마커 분석 및 일배체형 분석에 대해, 승법 모델(multiplicative model)(일배체형 상대적 위험도 모델), 즉, 한 사람이 갖는 두 개의 대립인자/일배체형의 위험도들이 곱해진다는 승법 모델을 가정하여 상대적 위험도(RR) 및 집단 귀속 위험도(population attributable risk, PAR)가 계산될 수 있다(Terwilliger, J.D. & Ott, J., Hum. Hered. 42:337-46 (1992) and Falk, C.T. & Rubinstein, P, Ann. Hum. Genet. 51 (Pt 3):227-33 (1987)). 예를 들면, RR이 a 대비 A의 위험도라면, 동형접합체 AA를 갖는 사람의 위험도는 이형접합체 Aa의 위험도의 RR배이고, 동형접합체 aa를 갖는 사람의 RR2배일 것이다. 승법 모델은 분석 및 계산을 단순화하는 유용한 특성을 갖는다- 환자 집단(affected population) 및 대조구 집단 내에서 일배체형은 독립적이고, 즉, 하디-와인버그 평형(Hardy-Weinberg equilibrium)에 있다. 그 결과, 환자(affected)와 대조군 각각의 일배체형 계수(haplotype count)는 다항 분포를 가지나, 대안적인 가설 하에서 상이한 일배체형 빈도를 갖는 다항 분포를 갖는다. 구체적으로, 두개의 일배체형, h i 및 h j 에 대해, risk(h i )/risk(h j ) = (f i /p i )/(f j /p j )이고, 상기에서 f와 p는 각각 환자 집단 및 대조구 집단에서의 빈도를 나타낸다. 실제 모델이 승법성이 아닌 경우, 일부 검정력 손실(power loss)이 있으나, 이 손실은 극단적인 경우를 제외하고는 작은(mild) 경향이 있다. 가장 중요한 것은, p-값은 귀무 가설 하에 계산되기 때문에, 항상 유효하다는 것이다.
NEMO를 이용한 연관 불균형
마커들의 쌍 간의 LD는 D' 및 r2 의 표준 정의를 이용하여 계산될 수 있다(Lewontin, R., Genetics 49:49-67 (1964); Hill, W.G. & Robertson, A. Theor. Appl. Genet. 22:226-231 (1968)). NEMO를 이용하여, 두 마커 대립인자 조합의 빈도가 최대 가능성(maxium likelihood)에 의해 추정되고 연관 균형으로부터의 편향이 가능성 비 테스트(likelihood ratio test)에 의해 평가된다. D' 및 r2의 정의가 한계 대립인자 확률(marginal allele probability)에 의해 가중된 두 마커의 모든 가능한 대립인자 조합에 대해 평균하는 것에 의해 마이크로새틀라이트를 포함하도록 확대된다. 특정한 영역에서 LD 구조를 규명하기 위해 모든 마커 조합을 도시하는 경우, 본 발명자들은 상단 좌측 코너에 D'을 도시하고, 하단 우측 코너에 p-값을 도시한다. LD 도면(plot)에서, 마커들은 필요한 경우, 그들의 물리적 위치에 따라 도시되지 않고, 등거리로 도시될 수 있다.
위험도 평가 및 진단
주어진 집단 내에서, 사람이 특정된 기간 동안 특정한 질병 또는 성향을 발생시킬 가능성으로 정의된, 질병 또는 성향을 발생시킬 절대 위험도(absolute risk)가 있다. 예를 들면, 여성의 유방암에 대한 평생 절대 위험도(lifetime absolute risk)는 1/9이다. 즉, 9명의 여성 당 1명은 그들의 일생 중 어느 시점에 유방암을 발병할 것이다. 위험도(risk)는 통상적으로 특정인이 아니라, 매우 많은 수의 사람들을 조사하는 것에 의해 측정된다. 위험도는 종종 절대적 위험도(Absolute Risk, AR) 및 상대적 위험도(Relative Risk, RR)로 제시된다. 상대적 위험도는 두개의 변이와 연관된 위험도, 또는 두개의 상이한 사람들의 그룹의 위험도를 비교하기 위해 이용된다. 예를 들면, 상대적 위험도는 특정한 유전형을 갖는 사람들의 그룹과 다른 유전형을 갖는 또 다른 그룹을 비교하기 위해 이용될 수 있다. 질병에 대해, 2의 상대적 위험도는 하나의 그룹이 나머지 그룹보다 질병을 발병할 가능성이 두배 높다는 것을 의미한다. 제시된 위험도는 일치된 성별 및 민족의 집단 대비, 1인, 또는 1인의 특정한 유전형에 대한 상대적 위험도이다. 동일한 성별 및 민족의 2인의 위험도는 단순한 방식으로 비교될 수 있다. 예를 들면, 집단에 비교되는 경우, 제1 개체는 1.5의 상대적 위험도를 가지며, 제2 개체는 0.5의 상대적 위험도를 가지며, 제2 개체 대비 제1 개체의 위험도는 1.5/0.5 = 3이다.
본 명세서에 기재된 바와 같이, 특정한 다형성 마커 및 그와 같은 마커를 포함하는 일배체형이 유방암의 위험도 평가를 위해 유용한 것으로 확인되었다. 위험도 평가는 유방암에 대한 감수성을 진단하기 위한 마커의 이용을 포함할 수 있다. 다형성 마커의 특정한 대립인자는 유방암의 진단을 갖지 않는 개체들에서보다, 유방암의 진단을 갖는 개체들에서 보다 빈번하게 발견된다. 그러므로, 이 마커 대립인자들은 개체에서 유방암, 또는 유방암에 대한 감수성을 검출하기 위한 예측적 가치(predictive value)를 갖는다. 본 발명의 마커와 같은, 위험 마커들을 포함하는 일배체형 블럭 또는 LD 블럭 내의 태깅 마커들(tagging markers)이 일배체형 블럭 또는 LD 블럭 내의 다른 마커 및/또는 일배체형에 대한 대리물(surrogate)로 이용될 수 있다. 1의 r 2 값을 갖는 마커들이 위험 변이(at-risk variant)에 대한 완벽한 대리물이고, 즉, 하나의 마커에 대한 유전형이 나머지 마커에 대한 유전형을 완벽하게 예측한다. 1보다 작은 r 2 값을 갖는 마커들도 위험 변이의 대리물일 수 있거나, 또는 대안적으로 그 위험 변이만큼 높거나 또는 그 변이보다 훨씬 더 높은 상대적 위험도 값을 갖는 변이를 나타낸다. 확인된 위험 변이는 그 자체로 기능적 변이가 아닐 수 있으나, 이 경우, 진정한 기능적 변이와 연관 불균형 관계일 수 있다. 본 발명은 본 명세서에 개시된 마커에 대한 그와 같은 대리 마커(surrogate marker)의 평가를 포함한다. 그와 같은 마커들이 본 발명이 속하는 기술 분야의 당업자에게 잘 알려진 바와 같이, 공개 데이터베이스에 설명(annotate)되고, 맵핑되고, 열거되어 있거나, 또는 대안적으로 개체들의 군에서 본 발명의 마커에 의해 확인된 영역 또는 그 영역의 일부를 서열결정하고, 결과적으로 수득된 서열의 군에서 다형성을 식별하는 것에 의해 용이하게 식별될 수 있다. 그 결과, 본 발명이 속하는 기술 분야의 당업자는 용이하게, 과도한 실험 없이 본 명세서에 기재된 마커 및/또는 일배체형과 연관 불균형인 대리 마커들의 유전형을 분석할 수 있다. 검출된 위험 변이와 LD인 태깅 마커 또는 대리 마커도 개인에서 유방암, 또는 유방암에 대한 감수성에 대한 연관을 검출하기 위한 예측적 가치를 갖는다. 본 발명의 마커들과 LD인 이 태깅 마커들 또는 대리 마커들은 또한 이들이 유사하게 유방암에 대한 감수성을 검출하기 위한 예측적 가치를 갖기 때문에, 일배체형들을 구별하는 다른 마커들을 포함할 수 있다.
특정 구체예에서, 본 발명은 유방암과 연관된 것으로 본 명세서에 기재된 변이의 존재에 대해 개인으로부터 유래된 게놈 DNA를 포함하는 시료를 평가하는 것에 의해 실시될 수 있다. 그와 같은 평가는 당업자에게 잘 알려지고 본 명세서에서 더 설명될 방법을 이용하여, 하나 이상의 다형성 마커의 하나 이상의 대립인자의 존재 또는 부재를 검출하는 단계를 포함하고, 그와 같은 평가의 결과에 근거하여 시료가 유래된 개인이 유방암의 증가된 위험도 또는 감소된 위험도(증가된 감수성 또는 감소된 감수성)를 갖는지 여부를 결정한다. 대안적으로, 본 발명은 유방암과 연관된 것으로 본 명세서에 기재된 하나 이상의 다형성 마커(또는 유방암과 연관된 것으로 본 명세서에서 입증된 하나 이상의 마커와 연관 불균형인 마커)의 유전형 상태에 대한 정보를 포함하는 데이터세트를 이용하여 실시될 수 있다. 다시 말하면, 그와 같은 유전적 상태에 대한 정보, 예를 들면, 특정한 다형성 마커, 또는 복수 개의 마커에서의 유전형 계수(genotype count)의 형태(예를 들면, 특정한 위험 대립인자의 존재 또는 부재의 표시), 또는 하나 이상의 마커에 대한 실제의 유전형의 형태로 유전적 상태에 대한 정보를 포함하는 데이터세트가 유방암과 연관된 것으로 본 발명자들에 의해 입증된 특정한 다형성 마커의 특정한 위험 대립인자의 존재 또는 부재를 위해 조사될 수 있다. 본 명세서에서 입증된, 유방암과 연관된 변이(예를 들면, 마커 대립인자)에 대한 양성 결과는 상기 데이터세트가 유래된 개인이 하나 이상의 유방암의 증가된 감수성(증가된 위험도)을 갖는다는 것을 나타낸다.
본 발명의 특정한 구체예에서, 다형성 마커는 다형성 마커에 대한 유전형 데이터를 다형성의 하나 이상의 대립인자와 질환 간의 상관관계를 포함하는 참조표를 참조하는 것에 의해, 유방암과 상관된다. 일부 구체예에서, 상기 표는 하나의 다형성에 대한 상관관계를 포함한다. 다른 구체예에서, 상기 표는 복수 개의 다형성에 대한 상관관계를 포함한다. 두 시나리오 모두에서, 마커와 유방암 간의 상관관계의 표시를 제공하는 참조표를 참조하는 것에 의해, 유방암에 대한 위험도, 또는 유방암에 대한 감수성이 시료가 유래된 개인에서 확인될 수 있다. 일부 구체예에서, 상관관계가 통계적 척도로서 보고된다. 통계적 척도는 상대적 위험도(RR), 절대 위험도(AR), 또는 오즈비(OR)과 같은 위험도 척도로 보고될 수 있다.
본 발명의 마커 및 일배체형, 예를 들면, 염색체 2q14.2, 염색체 2q35, 및 염색체 16q12 상의 다형성 마커 및 일배체형, 예를 들면, 표 10, 표 15, 표 19, 표20, 표 21 및 표 22에 제시된 마커들, 및 이들과 연관 불균형인 마커들, 예를 들면, 마커 rs4848543, rs13387042 및 rs3803662는 단독으로, 또는 조합되어 유방암의 위험도 평가 및 진단적 목적을 위해 유용할 수 있다. 따라서, 개별적인 마커에 의한 위험도의 증가가 비교적 크지 않은 경우, 즉, 10-30%의 수준인 경우에도, 연관은 유의성 있는 영향을 가질 수 있다. 따라서, 상대적으로 일반적인 변이가 전체 위험도에 대해 유의성 있는 기여도를 가질 수 있거나(집단 귀속 위험도(PAR)이 높음), 또는 마커들의 조합이 마커들의 통합된 위험도에 근거하여, 유방암을 발병할 유의성 있는 통합 위험도(combined risk)를 갖는 개체들의 그룹을 정의하기 위해 이용될 수 있다.
따라서, 본 발명의 일 구체예에서, 복수의 변이(마커 및/또는 일배체형)가 전체 위험도 평가를 위해 이용된다. 일 구체예에서, 이 변이들은 본 명세서에 개시된 변이들로부터 선택된다. 다른 구체예는 유방암에 대한 감수성의 진단을 위해 유용한 것으로 알려진 다른 변이와 조합된 본 발명의 변이의 용도를 포함한다. 그와 같은 구체예에서, 개인에서 복수의 마커 및/또는 일배체형의 유전형 상태(genotype status)가 결정되고, 상기 개인의 상태가 연관된 변이의 집단 빈도, 또는 연령-조화되고(age-matched) 성별-조화된 개체와 같은 임상적으로 건강한 개체에서의 상기 변이의 빈도와 비교된다. 다변량 분석(multivariate analysis) 또는 결합 위험도 분석과 같은, 본 발명이 속하는 기술분야에 공지된 방법들이 복수의 유전자 좌에서의 유전형 상태에 근거하여 부여된 전체 위험도를 결정하기 위해 뒤이어 이용될 수 있다. 그와 같은 분석에 근거한 위험도의 평가가 뒤이어 본 명세서에 개시된 본 발명의 방법 및 키트에서 이용될 수 있다.
전술된 바와 같이, 인간 게놈의 일배체형 블럭 구조는 질병 또는 성향(trait)과 원래 연관된 변이와 연관 불균형인 다수의 변이(마커 및/또는 일배체형)가 상기 질병 또는 성향에 대한 연관을 평가하기 위한 대리 마커(surrogate marker)로 이용될 수 있게 하는 효과를 갖는다. 그와 같은 대리 마커의 갯수는 해당 영역에서 과거의 재조합율(historical recombination rate), 해당 영역에서의 돌연변이 빈도(즉, 해당 영역에서 다형성 부위 또는 마커의 갯수), 및 해당 영역에서 LD의 정도(LD 블럭의 크기)와 같은 인자에 의존적일 것이다. 이 마커들은 통상적으로 본 명세서에 기재된 방법 또는 본 발명이 속하는 기술 분야의 당업자에게 알려진 다른 방법을 이용하여 정의된 LD 블럭 또는 일배체형 블럭의 물리적 경계 내에 위치한다. 그러나, 종종 마커 및 일배체형 연관이 정의된 일배체형 블럭의 물리적 경계를 넘어 연장되는 것으로 발견된다. 그와 같은 경우에, 마커 및/또는 일배체형은 또한 정의된 바와 같은 일배체형 블럭 내에 물리적으로 위치하는 마커 및/또는 일배체형을 위한 대리 마커 및/또는 일배체형으로 이용될 수 있다. 그 결과, 본 발명의 마커 및 일배체형과 LD(통상적으로, 0.4보다 큰 r2을 포함한, 0.3보다 큰 r2을 포함한, 0.2보다 큰 r2과 같은, 0.1보다 큰 r2을 특징으로 함)인 마커 및 일배체형도, 그들이 물리적으로 정의된 바와 같은 일배체형 블럭의 경계 외부에 존재하는 경우에도 본 발명의 범위 내에 속한다. 이는 본 명세서(예를 들면, 표 10, 표 15 및 표 19)에 기재된 마커들을 포함하나, 또한 표 10, 표 15 및 표 19에 열거된 하나 이상의 마커와 강한 LD(예를 들면, 0.1보다 큰 r2, 0.2보다 큰 r2 및/또는 |D'| > 0.8을 특징으로 함)인 다른 마커들을 포함할 수 있다.
본 명세서에 기재된 SNP 마커의 경우, 환자에서 과량으로 존재하는 것으로 확인된 대립인자(위험-대립형질)에 대한 반대 대립인자(opposite allele)는 유방암에서 감소된 빈도로 발견된다. 따라서, 이 마커들 및 일배체형은 유방암에 대해 보호성이고, 즉, 그들은 이 마커들 및/또는 일배체형을 갖는 개인들이 유방암을 발병할 감소된 위험도 또는 유방암에 대한 감소된 감수성을 부여한다.
특정한 일배체형을 포함한, 본 발명의 특정 변이들은 일부 경우에, 다양한 유전적 마커들의 조합, 예를 들면, SNP와 마이크로새틀라이트의 조합을 포함한다. 따라서, 일배체형을 검출하는 것은 본 발명이 속하는 기술 분야에서 알려지고 및/또는 본 명세서에 기재된, 다형성 부위에서의 서열을 검출하는 방법에 의해 달성될 수 있다. 또한, 특정한 일배체형 또는 일련의 마커들과 질병 표현형 간의 상관관계가 표준 기법을 이용하여 검증될 수 있다. 상관관계에 대한 간단한 검정의 예는 2 x 2 표(two by two table) 상에서의 Fisher-exact 검정이다.
특정한 구체예에서, 유방암과 연관된 것으로 확인된 마커 대립인자 또는 일배체형(예를 들면, 표 10, 표 15, 표 19, 표 20, 표 21 및 표 22에 열거된 마커 대립인자, 및 이들과 연관 불균형인 마커들)은 상기 마커 대립인자 또는 일배체형이 건강한 개체(대조군)에서의 존재 대비, 유방암에 대한 위험을 갖는 개체(질병군(affected))에 보다 빈번하게 존재하고, 상기 마커 대립인자 또는 일배체형의 존재는 유방암 또는 유방암에 대한 감수성을 나타내는 것인 마커 대립인자 또는 일배체형이다. 다른 구체에에서, 유방암과 연관된 것으로 확인된 하나 이상의 마커(예를 들면, 표 10, 표 15, 표 19, 표 20, 표 21 및 표 22에 열거된 마커 대립인자, 및 이들과 연관 불균형인 마커들)와 연관 불균형인 위험 마커(at-risk marker)는 건강한 개체(대조군)에서의 존재 대비, 유방암에 대한 위험을 갖는 개체(질병군)에 보다 빈번하게 존재하는 태깅(tagging) 마커이고, 상기 태깅 마커의 존재는 유방암에 대한 증가된 감수성을 나타낸다. 또 다른 구체예에서, 유방암과 연관된 것으로 확인된 하나 이상의 마커(예를 들면, 표 10, 표 15, 표 19, 표 20, 표 21 및 표 22에 열거된 마커 대립인자, 및 이들과 연관 불균형인 마커들)와 연관 불균형인 위험 마커 대립인자(즉, 증가된 감수성을 부여하는 대립인자)는 건강한 개체(대조군)에서의 존재의 빈도 대비, 유방암에 대한 위험을 갖는 개체(질병군)에 보다 빈번하게 존재하는 하나 이상의 대립인자를 포함하는 마커이고, 상기 마커의 존재는 유방암에 대한 증가된 감수성을 나타낸다.
연구 집단(study population)
일반적으로, 본 발명의 방법 및 키트는 임의의 원천 및 임의의 개체으로부터의 핵산 물질(DNA 또는 RNA)를 포함하는 시료로부터 이용될 수 있다. 바람직한 구체예에서, 개체는 인간이다. 개인은 성인, 아동, 또는 태아일 수 있다. 본 발명은 또한, 표적 집단의 구성원인 개체에서 마커 및/또는 일배체형을 평가하는 방법을 제공한다. 일 구체예에서, 그와 같은 표적 집단은 다른 유전적 인자, 바이오마커, 생체물리적 인자(예를 들면, 체중, BMD, 혈압), 또는 전반적인 건강 및/또는 생활방식 파라미터(예를 들면, 질병 또는 관련 질병의 병력, 질병의 과거 진단, 질병의 가족력)에 기반하여, 상기 질병을 발병할 위험도를 갖는 개체들의 집단 또는 그룹이다.
본 발명은 40세 이상, 45세 이상, 또는 50세 이상, 55세 이상, 60세 이상, 65세 이상, 70세 이상, 75세 이상, 80세 이상, 또는 85세 이상의 개인과 같은, 특정한 연령 서브그룹으로부터의 개인을 포함하는 구체예를 제공한다. 본 발명의 다른 구체예는 80세 미만, 75세 미만, 또는 70세 미만, 65세 미만, 60세 미만, 55세 미만, 50세 미만, 45세 미만, 40세 미만, 35세 미만, 또는 30세 미만과 같은, 85세 미만의 개인과 같은, 다른 연령군에 관한 것이다. 다른 구체예는 전술된 임의의 연령 범위에 속하는 발병 연령을 갖는 개인에 관한 것이다. 또한, 특정한 구체예에서, 45세를 초과하나, 60세 미만인 발병 연령과 같은 일정 범위의 연령이 관련된 것일 수 있는 것으로 고려된다. 그러나, 앞서 열거된 연령값에 의해 일괄된 모든 연령 범위를 포함한, 다른 연령 범위도 고려된다. 본 발명은 또한 하나의 성별의 개인, 남성 또는 여성에 관한 것이다. 또 다른 구체예에서, 본 발명은 여성에 관한 것인다.
아이슬란드 집단은 북유럽 선조 기원의 코카서스인 집단이다. 아이슬란드 집단에서 유전적 연관(genetic linkage)과 관련성(association)의 결과를 보고하는 다수의 연구가 최근 수년간 발표되었다. 그와 같은 다수의 연구들은 다른 집단에서, 최초에 아이슬란드 집단에서 특정 질환과 연관된 것으로 확인된 변이의 재현을 보여준다(Stacey, S.N., et al., Nat Genet. May 27 2007 (Epub ahead of print; Helgadottir, A., et al., Science 316:1491-93 (2007); Steinthorsdottir, V., et al., Nat Genet. 39:770-75 (2007); Gudmundsson, J., et al., Nat Genet. 39:631-37 (2007); Amundadottir, L.T., et al., Nat Genet. 38:652-58 (2006); Grant, S.F., et al., Nat Genet. 38:320-23 (2006)). 따라서, 아이슬란드 집단에서의 유전적 발견이 아프리카 및 아시아로부터의 집단을 포함한, 다른 집단에서 재현되었다.
유방암과 연관된 것으로 확인된 본 발명의 마커들은 다른 인간 집단에서 유사한 연관성을 보이는 것으로 사료된다. 따라서, 개별적인 인간 집단을 포함하는 특정한 구체예가 또한 고려되며 본 발명의 범위 내에 속한다. 그와 같은 구체예는 코카서스 집단, 유럽 집단, 미국 집단, 유라시아 집단, 아시아 집단, 중앙/남아시아 집단, 동아시아 집단, 중동 집단, 아프리카 집단, 라틴 아메리카 집단, 및 오세아니아 집단을 포함하나, 이에 한정되지 않는 하나 이상의 인간 집단으로부터의 인간 개체에 관한 것이다. 유럽 집단은 스웨덴 집단, 노르웨이 집단, 핀란드 집단, 러시아 집단, 덴마크 집단, 아이슬란드 집단, 아일랜드 집단, 켈트(Kelt) 집단, 영국 집단, 스코틀랜드 집단, 네덜란드 집단, 벨기에 집단, 프랑스 집단, 독일 집단, 스페인 집단, 포르투갈 집단, 이탈리아 집단, 폴란드 집단, 불가리아 집단, 슬라브 집단, 세르비아 집단, 보스니아 집단, 체코 집단, 그리스 집단, 및 터키 집단을 포함하나, 이에 한정되지 않는다. 다른 구체예에서, 본 발명은 또한 반투(Bantu), 만덴크(Mandenk), 요루바(Yoruba), 산(San), 음부티 피그미(Mbuti Pygmy), 오르카디안(Orcadian), 아디겔(Adygel), 러시안(Russian), 사르디니안(Sardinian), 투스칸(Tuscan), 모자비트(Mozabite), 베두인(Bedouin), 드루즈(Druze), 팔레스티니안(Palestinian), 발로치(Balochi), 브라휘(Brahui), 마크라니(Makrani), 신디(Sindhi), 파탄(Pathan), 부루쇼(Burusho), 하자라(Hazara), 위구르(Uygur), 칼라쉬(Kalash), 한(Han), 다이(Dai), 다우르(Daur), 헤젠(Hezhen), 라후(Lahu), 미아오(Miao), 오로켄(Oroqen), 쉬(She), 투지아(Tujia), 투(Tu), 시보(Xibo), 이(Yi), 몽골란(Mongolan), 낙시(Naxi), 캄보디안(Cambodian), 일본인( Japanese), 야쿠트(Yakut), 멜라네시안(Melanesian), 파푸안(Papuan), 카리티아난(Karitianan), 수루이(Surui), 콜럼비안(Columbian), 마야(Maya) 및 피마(Pima)를 포함하나, 이에 한정되지 않는 특정한 인간 집단에서 실시될 수 있다.
일 구체예에서, 본 발명은 아프리카 후손 또는 계통의 사람을 포함하는 집단과 같은 블랙 아프리카 선조(ancestry)를 포함하는 집단에 관한 것이다. 블랙 아프리가 선조는 흑인(black race)에 속하거나 또는 니그로 인종(negro race)에 속하는, 아프리카계 미국인(African-American), 아프로-아메리칸(Afro-American), 블랙 아메리칸(Black American)으로 자가-보고하는 것에 의해 결정될 수 있다. 예를 들면, 아프리카계 미국인 또는 블랙 아메리칸은 북미에 거주하고 아프리카의 흑인군에 속하는 기원을 갖는 사람들이다. 또 다른 예에서, 블랙 아프리카 선조의 자가-보고된 사람은 한 명 이상의 블랙 아프리카 선조의 부모 또는 한 명 이상의 블랙 아프리카 선조의 조부모를 가질 수 있다.
개체에서 인종적 기여는 또한 유전적 분석에 의해 결정될 수 있다. 선조의 유전적 분석은 Smith et al. (Am J Hum Genet 74, 1001-13 (2004))에 개시된 마커와 같은, 연관되지 않은(unlinked) 마이크로새틀라이트 마커를 이용하여 수행될 수 있다.
특정한 구체예에서, 본 발명은 앞서 기재된 바와 같이, 특정한 집단에서 확인된 마커 및/또는 일배체형에 관한 것이다. 본 발명이 속하는 기술 분야의 당업자는 상이한 집단에 적용되는 경우, 연관 불균형(LD)의 척도는 상이한 결과를 가져올 수 있다는 것을 이해할 것이다. 이는 특정한 게놈 영역에서 LD의 차이를 초래했을 수 있는 차등적 선택 압력(differential selective pressure) 및 상이한 인간 집단의 상이한 집단 역사 때문이다. 일부 마커들, 예를 들면, SNP 마커들이 상이한 집단에서 상이한 집단 빈도를 가지거나, 또는 하나의 집단에서는 다형성이나, 또 다른 집단에서는 다형성이 아니라는 것이 본 발명이 속하는 기술 분야의 당업자에게 잘 알려져 있다. 그러나, 본 발명이 속하는 기술 분야의 당업자는 입수가능한 방법을 적용하고, 본 명세서에서 고려되는 바와 같이, 임의의 인간 집단에서 본 발명을 실시할 것이다. 이는 특정한 집단 내에서 가장 강력한 연관을 제공하는 마커들을 확인하기 위해, 본 발명의 LD 영역에서 다형성 마커를 평가하는 것을 포함할 수 있다. 따라서, 본 발명의 위험 변이는 다양한 인간 집단에서 상이한 일배체형 배경에 상이한 빈도로 존재할 수 있다. 그러나, 당해 분야에서 알려진 방법 및 본 발명의 마커를 이용하여, 본 발명이 임의의 주어진 인간 집단에서 실시될 수 있다.
유전적 검사의 유용성
본 발명이 속하는 기술 분야의 당업자는 본 명세서에 기재된 변이가 일반적으로 그 자체로 특정한 유방암을 발병할 개인의 절대적 확인을 제공하지 않는다는 것을 고려하고 이해할 것이다. 그러나, 본 명세서에 기재된 변이는 본 발명의 위험 또는 보호성 변이를 갖는 개인이 유방암을 발병할 증가된 및/또는 감소된 가능성을 나타낸다. 그러나, 이 정보는 하기에서 보다 상세하게 요약되는 바와 같이, 그 자체로 매우 유용하며, 이 정보는 질병 관리 및 적합한 치료 옵션의 선택을 위해 이용될 수 있기 때문이다.
질병(예를 들면, 유방암)을 발병할 위험도를 부여하는 유전적 변이에 대한 지식은 상기 질환을 발병할 증가된 위험도를 갖는 개체(즉, 위험 변이의 보인자)와 상기 질환을 발병할 감소된 위험도를 갖는 개체(즉, 보호성 변이의 보인자)를 구별하기 위해 유전적 테스트를 적용할 기회를 제공한다. 상기 언급된 두 그룹에 속하는 개체들에 대해, 유전적 테스트의 핵심 가치는 조기 단계에 질병, 또는 질병에 대한 소인을 진단하고 가장 적절한 치료를 제공할 수 있도록 하기 위해 임상의에게 질병의 예후/공격성(aggressiveness)에 대한 정보를 제공할 수 있는 가능성이다.
유방암에 대한 유전 위험도를 예측하는 모델
유방암 위험도 평가의 목표는 고-위험도 여성에서 생존율과 삶의 질을 증가시키면서 비용, 불필요한 개입 및 보다 낮은 위험도의 여성에서 우려를 최소화하기 위해 모든 여성에 대해 맞춤화된 의료 관리 전략의 수립을 위한 합립적인 프레임워크를 제공하는 것이다. 위험도 예측 모델은 주어진 세트의 선천척 위험 특성(예를 들면, 가족력, 과거의 양성 유방 병변(prior benign breast lesion), 과거의 유방 종양)을 갖는 개인에서 유방암에 대한 위험도를 추정한다. 임상에서 가장 일반적으로 이용되는 유방암 위험도 예측 모델은 가족력을 고려하는 것에 의해 유전된 위험 인자들을 추정한다. 위험 추정치는 과거에 유방암으로 진단받은 1명 이상의 가까운 친척을 갖는 개인에 대한 증가된 위험도의 관찰에 근거한다. 위험 추정치는 복잡한 가계도 구조를 고려하지 않는다. 이 모델들은 유방암 소인 돌연변이(breast cancer predisposing mutation)를 갖는 유전자의 보인자와 비-보인자를 구별할 수 없는 추가적인 단점을 갖는다.
보다 정교한 위험도 모델은 특정한 가족력을 다루고 BRCA1 및 BRCA2 돌연변이에 대한 보인자 상태를 고려할 수 있는 능력을 갖는 보다 우수한 메카니즘을 갖는다. 예를 들면, BOADICEA(Breast and Ovarian Analysis of Disease Incidence and Carrier Estimation Algorithm) (Antoniou et al., 2004)는 가계도 분석 프로그램 MENDEL을 통해 개별적인 가계도 구조에 근거하여 가족력을 고려한다. 공지된 BRCA1 및 BRCA2 상태에 대한 정보도 고려된다. BOADICEA 및 현재 사용되는 모든 다른 유방암 위험도 모델의 주요한 한계는 그들이 다른 소인 유전자로부터의 유전형 정보를 고려하지 않는다는 것이다. 현재의 모델들은 위험도의 비-BRCA 유전적 결정인자(genetic determinant)의 지식 부족을 보충하는 대리물(surrogate)로 작용하기 위해 가족력에 크게 의존한다. 따라서, 이용가능한 모델들은 질병의 공지된 가족력이 있는 상황들에 한정된다. 보다 낮은 침투성 유방암 소인 유전자들은 집단에서 비교적 일반적일 수 있고 BRCA1 및 BRCA2 유전자처럼 가족성 클러스터링(familiar clustering)을 주도하는 강한 경향을 보이지 않을 수 있다. 소인성 대립인자(predisposition allele)의 비교적 높은 유전적 부하(genetic load)를 갖는 환자들은 질병의 가족력을 거의 또는 전혀 보이지 않을 수 있다. 따라서, 유전자-기반 테스트를 통해 직접적으로 수득된 유전된 감수성 데이터를 내포시키는 모델을 구축할 필요성이 존재한다. 모델들을 보다 정확하게 만드는 것 외에, 이는 가족력 파라미터에 대한 의존성을 감소시키고 위험도 프로파일링을 가족력이 그와 같은 주요 인자가 아닌 보다 넓은 위험 집단(at-risk populatoin)으로 확장하는 것을 지원할 것이다.
개선된 유전적 위험도 모델의 유방암 일차 예방(primary prevention)의 임상적 관리로의 통합
임상적 일차 예방 옵션은 현재 화학적 예방(chemopreventative)(또는 호르몬) 치료 및 예방적 수술(prophylactic surgery)이다. 고위험군으로 확인된 환자들에게 화학적 예방 요법의 장기 코스가 처방될 수 있다. 이 개념은 심혈관 의학 부분에서는 잘 수용되나, 임상적 종양학에서는 이제 영향을 미치기 시작하고 있다. 가장 널리 이용되는 종양의 화학적 예방제는 선택적 에스트로겐 수용제 조절제(SERM)인 타목시펜이다. 처음에 유방암 재발에 대한 아쥬반트 요법으로 이용되었던 타목시펜은 이제 유방암 예방제로서 입증된 효능을 갖는다(Cuzick et al., 2003; Martino et al., 2004). FDA는 일부 고위험 여성에서 화학적 예방제로서 타목시펜의 이용을 허가했다.
안타깝게도, 장기적인 타목시펜 이용은 자궁내막암(endometrial cancer)에 대한 위험도를 약 2.5배 증가시키고 정맥 혈전증의 위험도를 약 2.0배 증가시킨다. 폐색전증, 뇌졸중, 및 백내장에 대한 위험도도 증가된었다(Cuzick et al., 2003). 따라서, 유방암 발생률을 낮추기 위한 타목시펜 이용의 장점은 전체 사망률의 상응하는 감소로 용이하게 실현되지 못할 수 있다. 랄록시펜이라 불리는 또 다른 SERM은 예방적 모드에서 보다 효과적이고, 자궁내막암에 대한 동일한 위험을 갖지 않는다. 그러나, 랄록시펜으로 장기 치료된 환자에서 혈전증에 대한 위험도는 여전히 증가된다(Cuzick et al., 2003; Martino et al., 2004). 또한, 타목시펜과 랄록시펜은 모두 그들과 연관된 삶의 질 문제를 갖는다. 화학적 예방 모드에서 SERM 요법의 합리적인 위험:이익 분석을 수행하기 위해, 유방암에 대한 가장 높은 위험도를 갖는 개체들을 확인해야 하는 임상적 요구가 있다. 유방암에 대한 위험도의 상당한 부분이 유전적이라는 점을 고려할 때, 유방암에 대해 개인의 위험도를 정량하기 위한 유전적 테스트에 대한 명백한 임상적 요구가 존재한다. 아로마타아제 저해제와 같은, 이용가능해질 수 있는 미래의 암 화학적 예방 치료제로부터 유사한 문제들이 발생할 것을 예상할 수 있다. 또한, 화학적 예방 요법이 보다 안전해지기 때문에, 유전적으로 소인을 가지나, BRCA1 및 BRCA2 보인자와 연관된 크게 증가된 위험도를 갖지 않는 환자들을 확인해야 할 증가된 요구가 존재한다.
유방암에 대한 고위험도를 갖는 것으로 확인된 환자들은 예방적 수술에 대해 고려될 수 있다; 양측 유방절제술 또는 난소절제술 또는 양자 모두. 명백하게, 그와 같은 근치적인 치료법(drastic treatment)은 매우 높은 위험도를 갖는 환자들에게만 권고된다. 실제로, 그와 같은 위험도는 현재 BRCA1, BRCA2, 또는 리-프라우메니 증후군(Li-Fraumeni Syndrome)의 p53, 코우덴 증후군(Cowden's syndrome)의 PTEN과 같은 희귀 유방암 소인성 증후군(rare breast cancer predisposition syndrome)에 관여하는 것으로 알려진 유전자들에 돌연변이를 갖는 개체들에서만 확인될 수 있다.
BRCA1 및 BRCA2 돌연변이의 침투율의 추정치는 그들이 집단-기반 추정치로부터 유래되는 경우보다 다중-케이스 가족(multiple-case family)들로부터 유래될 때 더 높은 경향이 있다. 이는 상이한 돌연변이-보인(mutaion-carrying) 가족들이 유방암에 대한 상이한 침투율을 보이기 때문이다(예를 들면, Thorlacius et al., 1997 참조). 이 변이에 기여하는 주요한 인자들 중 하나는 그 효과가 BRCA1 및 BRCA2 돌연변이의 침투율을 변형시키는 것인 미지의 소인성 유전자(unknown predisposition gene)의 작용이다. 따라서, BRCA1 또는 BRCA2 유전자에 돌연변이를 갖는 개체에 대한 절대적 위험도는 변형시키는 유전자(modifying gene)의 존재 및 작용에 대한 이해 없이 정확하게 정량될 수 없다. BRCA1 및 BRCA2 보인자에 대한 치료 옵션은 가혹할 수 있기 때문에, 가능한 한 가장 정확하게 개별적인 BRCA 보인자에 대한 위험도를 정량하는 것이 중요하다. 따라서, BRCA1 및 BRCA2 보인자에서 유방암의 침투를 변형시키는 효과를 갖는 소인성 유전자(predisposition gene)를 확인하고 이 유전자들에 기반한 개선된 위험도 평가 모델을 수립해야 하는 필요성이 존재한다.
또한, 유방암의 강한 가족력 때문에 유방암에 대한 매우 높은 위험도를 갖는 것으로 인식되나, 알려진 소인성 유전자에서 돌연변이를 확인할 수 없는 개체들이 있다. 그와 같은 경우에, 고 침투성 소인성 유전자를 유전받았는지 여부를 확인하기 위해 개체를 테스트할 수 없기 때문에, 예방적 수술의 고려가 어렵다. 따라서, 개체의 위험도가 정확하게 평가될 수 없다. 따라서, 밝혀지지 않은 고 침투성 소인성 유전자를 확인하고 일차적인 예방 전략에서 사용할 관련된 유전적 테스트를 개발해야 하는 명백한 임상적 요구가 존재한다.
조기 진단
대부분의 서양 국가에서 유방암에 대한 임상적 스크리닝은 정기적인 임상적 유방 검사(clinical breast excamination, CBE) 및 X-선 유방촬영술이다. CBE는 우수한 유방촬영 스크리닝 프로그램에서 사용될 때 부가적인 이익을 거의 갖지 않는다는 것을 나타내는 우수한 증거가 있다. 영국에서, 50세 내지 70세의 여성들은 3년마다 스크리닝 유방촬영술을 받을 수 있다. 미국의 경우, 건강관리 제공자에 따라 다르나, 미국 암협회(the American Cancer Society)는 40세부터 매년 유방촬영 스크리닝을 권장한다. 유방촬영 스크리닝은 50세 이상의 스크리닝된 여성에서 사망율을 감소시키는 입증된 효과를 갖는다.
유전적 검사가 기존의 유방촬영 스크리닝 프로그램에 대한 접근을 감소시키는 수단으로 이용될 것 같지 않다. 그러나, 유방촬영 스크리닝도 단점을 가지며 유전적 검사가 강화된 스크리닝 프로그램을 위한 대상자들을 선별하기 위해 이용되는 것이 고려될 수 있다. 유방촬영 스크리닝의 단점 중 하나는 현재까지 50세 전에 스크리닝된 여성에 대해 개선된 생존율에 대한 유의성 있는 효과를 입증하는 것이 가능하지 않았다는 것이다.
유방촬영술이 50세 미만의 여성에서 덜 효과적인 한가지 이유는 유방 조직의 밀도(density)가 더 어린 여성에서 더 높아서, 종양의 유방촬영에 의한 검출을 더 어렵게한다는 것이다. 그러나, 소인을 갖는 개체에서 유방암은 어린 연령군에서 일어나는 경향이 있고 높은 유방 밀도와 유방암 위험도 간의 명확한 연관이 있다. 따라서, 높은 소인을 갖는 개체가 최고 위험도의 그룹에서 최적 미만으로 작동될 기법에 의해 관리될 수 있기 때문에, 이들에서 유방촬영 스크리닝의 단순한 증가에 따른 문제가 있다. 최근의 연구는 CE-MRI(contrast-enhanced magnetic resonance)가 유방촬영 스크리닝보다 더 민감하고 이 고위험도 그룹에서 보다 조기에 종양을 검출한다는 것을 보여주었다(Warner et al., 2004; Leach et al., 2005). CE-MRI 전략은 통상적인 X-선 유방촬영술과 조합되어 이용될 때 특히 효과적이다 (Leach et al., 2005). CE-MRI는 고 비용을 초래하는 전문 센터(specialist center)를 필요로 하므로, 50세 미만의 스크리닝은 최고 위험도에 있는 개체들로 제한되어야 한다. 현재의 CE-MRI 시험은 BRCA1, BRCA2 또는 p53 돌연변이 또는 질병의 매우 강한 가족력을 갖는 개체들로의 적용에 한정된다. 이 스크리닝 방법(modality)을 보다 넓은 범위의 고-위험군 환자들로 확장하는 것은 유전자-기반 위험도 프로파일링 도구의 제공에 의해 크게 촉진될 것이다.
조기발병 유방암 및 유전적 소인을 갖는 여성에서 발생하는 암이 장년층의, 덜 강한 유전적 소인을 갖는 여성에서 발생한 암보다 더 빠르게 성장한다는 견해를 뒷받침하는 좋은 증거가 있다. 이 증거는 젊은 여성에서 중간암(interval cancer)의 보다 높은 비율의 관찰로부터 유래되며, 즉, 잘 스크리닝된 집단에서 스크리닝을 위한 방문간 간격에 발생하는 암이 젊은 여성들 사이에서 더 높다. 따라서, 방법에 관계 없이, 더 젊은 여성들에서는 스크리닝 간격이 단축되어야 한다는 제안이 있다. 보다 값비싼 방법을 이용한 보다 빈번한 스크리닝이 유방암의 전체 비율이 비교적 낮은 연령군에 대해 요구되는 것으로 보인다는 점에서 역설이 있다. 질병을 발병할 가장 높은 소인을 갖는 젊은 개체들을 조기에 확인하고, 그들을 보다 값비싸고 광범위한 스크리닝 체계로 전달하는 것에 대한 명백한 임상적 필요성이 존재한다.
치료
현재, 원발성 유방암은 외과적 수술, 아쥬반트 화학요법, 방사선요법, 뒤이은 장기적 호르몬 요법에 의해 치료된다. 종종 3개 또는 4개의 치료법의 조합이 이용된다.
동일한 질병 단계에 있는 유방암 환자들이 아쥬반트 화학요법에 대해 매우 상이한 반응을 가져서 전체적인 치료 결과에 광범위한 변이가 초래될 수 있다. 유방암 환자의 아쥬반트 화학요법 치료에 대한 적격(eligibility)을 결정하는 것에 대한 합의된 가이드라인(St Galen 및 NIH 기준)이 수립되었다. 그러나, 전이의 가장 강력한 임상적 및 조직학적 예측자도 유방 종양의 임상적 반응을 정확하게 예측하지 못했다(Goldhirsch et al., 1998; Eifel et al., 2001). 화학요법 또는 호르몬 요법은 전이의 위험도를 약 1/3 감소시키나, 이 치료를 받는 환자의 70-80%는 상기 치료 없이도 생존했을 것이다. 따라서, 유방암 환자의 대다수는 현재 효과적이지 않거나 또는 불필요한 치료법을 제공받고 있다. 임상의들이 가장 높은 효과를 받을 수 있는 환자들에게 보다 적합하게 치료법을 맞춤화할 수 있게 할 예후적 척도(prognostic measure)의 개발에서의 개선에 대한 명백한 임상적 요구가 존재한다. 유전적 소인에 대해 개체들을 프로파일링하는 것이 그들의 치료 결과에 적합한 결과를 밝히고 그에 의해 합리적인 치료 계획을 보조할 수 있을 것으로 기대하는 것은 타당하다.
여러 과거의 연구들이 이 개념을 예시한다: BRCA 돌연변이 보인자인 유방암 환자들은 아쥬반트 화학요법으로 치료되는 경우 보다 우수한 임상적 반응률 및 생존을 보이는 것으로 나타난다[Chappuis, et al., (2002), J Med Genet, 39, 608-10; Goffin, et al., (2003), Cancer, 97, 527-36]. BRCA 돌연변이 보인자들은 비-보인자(non-carrier) 대비 난소암에 대한 백금 화학요법에 대해 개선된 반응을 보인다[Cass, et al., (2003), Cancer, 97, 2187-95]. 관련된 유전자들이 알려지지 않은, 소인을 갖는 환자에 유사한 고려가 적용될 수 있다. 예를 들면, 침윤성 소엽성 유방암(infiltrating lobular breast carcinoma, ILBC)은 강한 가족성 요소(familiar component)를 갖는 것으로 알려져 있으나, 관련된 유전적 변이는 확인되지 않았다. ILBC를 갖는 환자들은 일반적인 화학요법 방식(common chemotherapy regime)에 대한 보다 열등한 반응을 보인다[Mathieu, et al., (2004), Eur J Cancer, 40, 342-51].
유전적 소인 모델(genetic predisposition model)은 치료 전략의 개별화(individualization)를 보조하며, 또한 이 전략들의 수립에서 필수적인 역할을 수행할 수 있다. 예를 들면, BRCA1 및 BRCA2 돌연변이 종양 세포는 그들의 결함있는 DNA 복구 경로의 결과로 폴리(ADP-리보오스) 폴리머라아제(PARP) 저해제에 매우 민감한 것으로 확인되었다[Farmer, et al., (2005), Nature, 434, 917-21]. 이는 BRCA 보인자 환자들에서의 그들의 이용을 목적으로 PARP를 표적으로 하는 소형 분자 약물의 개발을 촉진했다. 이 예로부터, 유전적 소인의 지식이 유전적 위험도 프로파일링과 조합하여 사용될 맞춤화된 화학요법 방식의 개발을 가져올 약물 표적을 확인할 수 있다는 것이 명백하다.
암 화학요법은 정상적인 조직, 특히, 높은 증식성의 조혈 및 장 상피 세포 구획에 대해 잘 알려진, 용량-제한적(dose-limiting) 부작용을 갖는다. 세포독성 약물에 대한 정상 조직의 민감성에 유전에 기반한 개별적인 차이가 존재한다는 것이 예상될 수 있다. 이 인자들을 이해하는 것이 합리적인 치료 계획 및 정상조직을 화학요법의 유해한 효과로부터 보호하도록 설계된 약물의 개발을 보조할 수 있다.
유전적 프로파일링은 또한 개선된 방사선요법 방식에 기여할 수 있다: 표준 방사선 요법 치료를 받은 유방암 환자의 그룹 내에서, 일부 환자들은 정상적으로 내인되는(tolerated) 방사선량에 대해 부작용을 경험할 것이다. 급성 반응은 홍반, 습성 박리(moist desquamation), 부종 및 방사선 폐렴을 포함한다. 모세혈관 확장, 부종, 폐섬유증 및 유방 섬유증을 포함한 장기 반응이 방사선요법 후 수년 뒤에 발생할 수 있다. 급성 반응 및 장기 반응은 모두 이환율의 상당한 원천이며 치명적일 수 있다. 한 연구에서, 87%의 환자들이 방사선요법에 대해 일부 유해한 부작용을 가지며, 11%는 심각한 부작용을 갖는 것으로 확인되었다(LENT/SOMA Grade 3-4); [Hoeller, et al., (2003), Int J Radiat Oncol Biol Phys, 55, 1013-8]. 방사선요법에 대한 부작용을 경험할 확률은 주로 정상 조직 반응에서 구성적인 개별적 차이(constitutive individual difference) 때문이며 이들은 강한 유전적 요소를 갖는다는 견해가 있다. 공지된 유방암 소인 유전자 중 여러개(예를 들면, BRCA1, BRCA2, ATM)가 DNA 이중가닥 절단(double strand break) 복구의 경로에 영향을 미친다. DNA 이중가닥 절단은 방사선요법에 의해 유도되는 주요한 세포독성 병변이다. 이는 이 경로에 속하는 유전자에 변이를 가져서 유방암에 대한 유전적 소인을 갖는 개체들이 방사선요법으로부터 과도한 정상조직 손상을 겪을 보다 높은 위험을 가질 수 있다는 우려를 가져왔다.
집단에서 구성적으로 방사선민감성인(constitutively radiosensitive) 개체들의 존재는 부작용의 빈도를 수용가능한 수준으로 유지시키기 위해, 환자 집단의 대다수에 대해 방사선요법 선량 비율(radiotherapy dose rate)이 제한되어야 한다는 것을 의미한다. 따라서, 방사선요법에 대한 부작용에 대해 증가된 위험을 갖는 개체들을 확인할 수 있는 신뢰할 수 있는 테스트에 대한 임상적 요구가 존재한다. 그와 같은 테스트는 방사선민감성인 개체에 대한 보수적인 치료 또는 대안적인 치료를 의미하여, 비교적 방사선내성(radioresistant)인 대다수의 환자들에 대한 방사선치료 선량의 증가를 가능하게 할 것이다. 유방암 환자들을 단순하게 방사선민감성(radiosensitive), 중간(intermediate) 및 방사선내성(radioresistant) 범주로 분류하기 위한 테스트에 의해 가능해진 선량 증가(dose escalation)는 국소 종양 통제(local tumor control)의 약 35% 증가 및 그에 따른 생존율의 개선을 가져올 것이다(Burnet et al., 1996).
이온화 방사선에 대한 노출은 유방에서 종양발생에 기여하는 입증된 인자이다(Dumitrescu and Cotarla 2005). 공지된 유방암 소인 유전자들은 방사선-유도 DNA 손상에 대한 세포 반응의 경로 성분들을 코딩한다(Narod and Foulkes 2004). 따라서, 이차 원발성 유방 종양에 대한 위험도가 방사선요법 영역 내에 있는 정상 조직의 방사선조사에 의해 증가될 수 있다는 우려가 있다. 방사선 요법으로부터 BRCA 보인자에 대한 측정가능한 증가된 위험도는 없는 것으로 보이나, 그들의 이차 원발성 종양에 대한 위험도는 이미 매우 높다. 이차 원발성 종양에 대한 위험도가 방사선요법으로 치료된 ATM 및 CHEK2 유전자의 유방암 소인성 대립인자의 보인자에서 증가된다는 것을 시사하는 증거가 있다(Bernstein et al., 2004; Broeks et al., 2004). 방사선요법(및, 가능하게는 집중적인 유방촬영 스크리닝)으로부터의 이차 원발성 종양의 위험도는 치료 계획 단계 동안 환자로부터 정확안 유전적 위험도 프로파일을 수득하는 것에 의해 더 잘 정의될 것으로 예상된다.
이차 예방(Secondary Prevention)
단계 1 또는 단계 2 유방암으로 진단된 환자의 약 30%는 그들의 최초 종양의 국소(loco-regional) 또는 원격 전이 재발(distant metastatic recurrence)을 경험할 것이다. 원발성 유방암을 앓았던 환자들은 또한 유방보존 수술(breast-conserving surgery)을 받은 경우, 반대쪽 유방 또는 같은쪽 유방에 이차 원발성 종양을 진단받을 위험도가 크게 증가된다. 이차 예방(secondary prevention)은 재발 또는 이차 원발성 종양의 발생을 예방하기 위해 이용되는 방법을 의미한다. 현재 사용되는 방법은 단독이거나 또는 아로마타아제 저해제와 조합된 타목시펜 또는 또 다른 SERM에 의한 장기 치료, 위험도 저하를 위한 반대쪽 유방의 절제술, 및 위험도-저하를 위한 난소절제술(가족성 유방-난소암의 위험도를 갖는 환자의 경우)을 포함한다. 타목시펜의 사용에 대한 고려사항은 앞서 검토되었다. 위험도 저하를 위한 수술적 옵션을 고려할 때, 고지된(informed) 비용:이익 분석을 수행하기 위해 위험도가 정량화될 수 있어야 한다는 것이 명백하다.
유방암에 대한 공지된 유전적 소인을 갖는 환자들이 대부분의 환자들보다 더 악화될 수 있다는 여러 징후가 있다. CHEK2 유전자 1100delC 변이를 갖는 환자들은 비-보인자 대비 원격 전이의 약 2.8배 증가된 위험도 및 질병 재발의 3.9배 증가된 위험도를 갖는다[de Bock, et al., (2004), J Med Genet, 41, 731-5]. BRCA1 림프절-음성(node-negative) 종양을 갖는 환자들은 BRCA1 돌연변이를 갖지 않는 유사한 환자들보다 전이의 더 높은 위험도를 갖는다[Goffin, et al., (2003), Cancer, 97, 527-36; Moller, et al., (2002), Int J Cancer, 101, 555-9; Eerola, et al., (2001), Int J Cancer, 93, 368-72]. 따라서, 국소 재발 및 전이의 위험도를 평가하고, 그에 의해 이차 예방적 치료의 선택을 안내하기 위해 유전적 프로파일링이 이용될 수 있다.
일반적으로, 원발성 종양 진단을 받은 환자들은 0.7%의 일정한 연별 발생율로 이차 원발성 종양의 위험도를 갖는다(Peto and Mack 2000). BRCA 돌연변이를 갖는 환자들은 대부분의 유방암 환자들보다 이차 원발성 종양에 대해 유의성있게 더 높은 위험도를 가지며, 절대적 위험도는 40-60%의 범위이다(Easton 1999). BRCA 돌연변이의 보인자는 이차 원발성 종양에 대해 크게 증가된 위험도를 갖는다 [Stacey, et al., (2006), PLoS Med, 3, e217; Metcalfe, et al., (2004), J Clin Oncol, 22, 2328-35]. CHEK2 유전자에 돌연변이를 갖는 환자들은 반대쪽 유방암의 약 5.7배 증가된 위험도를 갖는다[de Bock, et al., (2004), J Med Genet, 41, 731-5]. BARD1 Cys557Ser 변이의 보인자는 이차 원발성 종양을 진단받을 가능성이 2.7배 더 높다[Stacey, et al., (2006), PLoS Med, 3, e217]. 유전적 위험도 프로파일링은 환자에서 이차 원발성 종양의 위험도를 평가하기 위해 이용될 수 있고 예방적 수단이 얼마나 공격적이어야 하는지 여부에 대한 결정을 알려줄 것이다.
방법
유방암의 위험도 평가 및 진단 방법이 본 명세서에서 설명되고 본 발명에 포함된다. 본 발명은 또한 유방암의 치료제에 대한 반응의 확률에 대해 개인을 평가하는 방법, 및 유방암에 대한 치료제의 효과를 예측하는 방법을 포함한다. 유방암에 대한 감수성을 검출하기 위해 개체로부터의 시료를 분석하는 키트도 본 발명에 포함된다.
진단 및 스크리닝 분석법
특정한 구체예에서, 본 발명은 유방암을 갖는 개체 또는 유방암에 대한 감수성을 갖는 개체에서 보다 빈번하게 나타나는 유전적 마커의 특정한 대립인자를 검출하는 것에 의해, 유방암, 또는 유방암에 대한 감수성을 진단하거나 또는 상기 진단을 보조하는 방법에 관한 것이다. 특정한 구체예에서, 본 발명은 하나 이상의 다형성 마커(예를 들면, 본 명세서에 기재된 마커)의 하나 이상의 대립인자를 검출하는 것에 의해 유방암에 대한 감수성을 진단하는 방법이다. 본 발명은 특정한 마커의 특정한 대립인자 또는 일배체형의 검출이 유방암에 대한 감수성을 나타내는 것인 방법을 기재한다. 그와 같은 예후적 또는 예측적 분석법은 또한 유방암의 증상의 발생 전에 개체의 예방적 치료를 결정하기 위해 이용될 수 있다. 일부 구체예에서, 본 발명은 의료 전문가에 의해 수행되는 진단과 같은 진단의 임상적 적용 방법에 관한 것이다. 다른 구체예에서, 본 발명은 일반인(layman)에 의해 수행되는 진단 방법 또는 감수성의 결정 방법에 관한 것이다. Molecular Inversion Probe 어레이 기술 (예를 들면, Affymetrix GeneChip), 및 BeadArray Technologies (예를 들면, Illumina GoldenGate and Infinium assays)와 같은 SNP 마커의 고효율 유전형분석(high-throughput genotyping)을 포함한, 유전형분석 기술에서의 최근의 기술적 진전은 개인들이 비교적 낮은 비용으로 그들의 게놈을 백만개 까지의 SNP에 대해 동시에 평가받을 수 있게 한다. 결과적으로 수득된, 개인에게 이용가능하게 된 유전형 정보는 다양한 SNP와 연관된 질병 또는 성향 위험도에 대한 공개 문헌으로부터의 정보와 비교될 수 있다. 따라서, 본 명세서에 기재된 바와 같은, 질병-연관 대립인자의 진단적 응용은 임상적 테스트의 결과에 근거하여 의료전문가에 의해, 또는 자신의 유전형 데이터의 분석을 통해 개인에 의해 수행될 수 있다. 바꾸어 말하면, 유전적 위험도에 근거한 감수성의 진단 또는 평가가 대상자의 유전형에 대한 정보 및 다양한 위험 인자에 대한 발표문헌에 근거하여, 의료 전문가, 유전학 상담자(genetic counselor), 또는 일반인에 의해 이루어질 수 있다. 본 발명에서, 용어 "진단하는(diagnosing)" 및 "감수성을 진단하다(dignose a susceptibility)" 및 "감수성을 결정하다(determine a suceptiblity)"는 전술된 방법을 포함한, 모든 이용가능한 진단 방법을 의미하도록 의도된다.
또한, 특정한 다른 구체예에서, 본 발명은 유방암으로 진단되지 않은 개인 또는 일반적 집단에서보다 유방암으로 진단된 환자에서 덜 빈번하게 나타나는 특정한 유전적 마커 대립인자 또는 일배체형을 검출하는 것에 의해, 유방암에 대한 감소된 감수성을 진단하거나 또는 상기 진단을 보조하는 방법에 관한 것이다.
본 명세서에서 기재되고 예시된 바와 같이, 특정한 마커 대립인자 또는 일배체형(예를 들면, rs4848543 LD 블럭, rs13387042 LD 블럭, rs3803662 LD 블럭, STEAP3/TSAP6 유전자 내에 위치한 마커들, 표 10, 표 15, 표 19, 표 20, 표 21 및 표 22에 열거된 마커들 및 일배체형, 및 이들과 연관 불균형인 마커들)이 유방암(예를 들면, All BC 및/또는 MedPre 유방암)과 연관된다. 일 구체예에서, 상기 마커 대립인자 또는 일배체형은 유방암의 유의성 있는 위험도 또는 그에 대한 감수성을 부여하는 마커 대립인자 또는 일배체형이다. 또 다른 구체예에서, 본 발명은 개인에서 유방암에 대한 감수성을 진단하는 방법으로서, 상기 방법은 상기 개인으로부터 수득된 핵산 시료에서 하나 이상의 다형성 마커의 하나 이상의 대립인자의 존재 또는 부재를 결정하는 단계를 포함하고, 상기 하나 이상의 다형성 마커는 rs4848543 LD 블럭, rs13387042 LD 블럭, rs3803662 LD 블럭, STEAP3/TSAP6 유전자 내에 위치한 마커들, 표 10, 표 15, 표 19, 표 20, 표 21 및 표 22에 열거된 마커들 및 일배체형, 및 이들과 (예를 들면, r2 > 0.2로 정의된) 연관 불균형인 마커들로부터 구성된 군으로부터 선택된다. 또 다른 구체예에서, 본 발명은 하나 이상의 마커 대립인자 또는 일배체형, 예를 들면, rs4848543 LD 블럭, rs13387042 LD 블럭, rs3803662 LD 블럭, STEAP3/TSAP6 유전자 내에 위치한 마커들, 표 10, 표 15, 표 19, 표 20, 표 21 및 표 22에 열거된 마커들 및 일배체형, 또는 이들과 연관 불균형인 마커들을 스크리닝하는 것에 의해, 개인에서 유방암에 대한 감수성을 진단하는 방법에 관한 것이다. 또 다른 구체예에서, 상기 마커 대립인자 또는 일배체형은 건강한 개체(집단 대조군과 같은, 대조군)에서 그의 존재의 빈도 대비, 유방암을 갖거나, 또는 유방암에 대한 감수성을 갖는 개체(질병군, 예를 들면, All BC 또는 MedPre 유방암)에 보다 빈번하게 존재한다. 또 다른 구체예에서, 본 발명은 개인에서 유방암에 대한 감수성을 진단하는 방법으로서, 상기 방법은 개인으로부터 수득된 핵산 시료에서 하나 이상의 다형성 마커의 하나 이상의 대립인자의 존재 또는 부재를 결정하는 단계를 포함하고, 상기 하나 이상의 다형성 마커는 마커 rs4848543, 마커 rs13387042, 마커 rs3803662, 및 이들과 연관 불균형인 마커들로부터 선택되는 것인 방법에 관한 것이다. 일부 구체예에서, 상기 하나 이상의 마커 대립인자 또는 일배체형의 연관의 유의성은 0.05 미만의 p 값을 특징으로 한다. 다른 구체예에서, 연관의 유의성은 보다 작은 p-값, 예를 들면, 0.01 미만, 0.001 미만, 0.0001 미만, 0.00001 미만, 0.000001 미만, 0.0000001 미만, 0.00000001 미만 또는 0.000000001 미만의 p-값과 같은 보다 작은 p-값을 특징으로 한다.
이 구체예들에서, 상기 하나 이상의 마커 대립인자 또는 일배체형의 존재는 유방암의 감수성을 나타낸다. 이 진단 방법들은 유방암과 연관된 하나 이상의 마커 대립인자 또는 일배체형의 존재 또는 부재를 검출하는 단계를 포함한다. 본 명세서에 기재된 일배체형은 다양한 유전적 마커(예를 들면, SNP, 마이크로새틀라이트)에서의 대립인자의 조합을 포함한다. 특정한 일배체형을 구성하는 특정한 유전적 마커 대립인자의 검출은 본 명세서에 기재되고 및/또는 본 발명이 속하는 기술 분야에서 알려진 다양한 방법에 의해 수행될 수 있다. 예를 들면, 유전적 마커는 핵산 수준에서(예를 들면, 직접적인 뉴클레오티드 서열결정에 의해 또는 본 발명이 속하는 기술 분야에서 당업자에게 공지된 다른 수단에 의해) 또는 상기 유전적 마커가 유방암과 연관된 핵산에 의해 코딩된 단백질의 코딩 서열에 영향을 미친다면, 아미노산 수준에서(예를 들면, 단백질 서열결정에 의해 또는 그와 같은 단백질을 인식하는 항체를 이용한 면역분석법에 의해) 검출될 수 있다. 본 발명의 마커 대립인자 또는 일배체형은 유방암과 연관된 게놈 DNA 서열의 단편에 대응된다. 그와 같은 단편은 대상이 되는 다형성 마커 또는 일배체형의 DNA 서열을 포함하나, 또한 상기 마커 또는 일배체형과 강한 LD(linkage disequilibrium)인(예를 들면, 0.2보다 큰 r2 및/또는 0.8보다 큰 |D'|의 값에 의해 결정됨) DNA 세그먼트를 포함할 수 있다.
일 구체예에서, 유방암에 대한 감수성의 진단이 서던 분석(Southern analysis), 노던 분석(Northern analysis), 및/또는 인-시투 혼성화를 포함하나, 이에 한정되지 않는 혼성화 방법을 이용하여 달성될 수 있다(모든 보충물(supplement)을 포함한, Current Protocols in Molecular Biology, Ausubel, F. et al., eds., John Wiley & Sons 참조). 테스트 대상 또는 개체로부터의 생물학적 시료(게놈 DNA, RNA, 또는 cDNA의 "테스트 시료(test sample)")는 유방암을 갖거나 유방암에 대한 감수성을 갖거나 또는 유방암에 대한 소인을 갖는 것으로 의심되는 개체("테스트 개체(test subject)")로부터 수득된다. 상기 개체는 성인, 아동, 또는 태아일 수 있다. 테스트 시료는 혈액 시료, 양수 시료, 뇌척수액 시료, 또는 피부, 근육, 구강점막, 또는 결막 점막, 태반, 위장관 또는 다른 기관으로부터의 조직 시료와 같은, 게놈 DNA를 포함하는 임의의 출처로부터 유래될 수 있다. 태아 세포 또는 조직으로부터의 DNA의 테스트 시료는 양수 천자 또는 융모막 융모 채취법(chorionic villus sampling)과 같은 적합한 방법에 의해 수득될 수 있다. 그 후, DNA, RNA, 또는 cDNA 시료가 검사된다. 특정한 마커 대립인자의 존재는 상기 특정한 대립인자에 대해 특이적인 핵산 프로브의 서열-특이적 혼성화에 의해 표시될 수 있다. 각각 특정한 대립인자에 대해 특이적인, 여러 개의 서열-특이적 핵산 프로브를 사용하는 것에 의해, 하나 이상의 특정한 마커 대립인자 또는 하나 이상의 특정한 일배체형의 존재가 표시될 수 있다. 일 구체예에서, 일배체형은 특정한 일배체형에 대해 특이적인(즉, 상기 일배체형의 특징적인 특정한 마커 대립인자를 포함하는 DNA 가닥에 특이적으로 혼성화하는) 단일 핵산 프로브에 의해 표시될 수 있다. 서열-특이적 프로브는 게놈 DNA, RNA, 또는 cDNA에 혼성화되도록 지시될 수 있다. 본 명세서에서 사용된, "핵산 프로브(nucleic acid probe)"는 상보적 서열에 혼성화되는 DNA 프로브 또는 RNA 프로브일 수 있다. 본 발명이 속하는 기술 분야의 당업자는 테스트 시료로부터의 게놈 서열에 특정한 대립인자가 존재하는 경우에만 서열 특이적 혼성화가 일어나도록 그와 같은 프로브를 설계하는 방법을 알 것이다.
유방암에 대한 감수성을 진단하기 위해, 유방암과 연관된 핵산을 포함하는 테스트 시료, 예를 들면, 게놈 DNA 시료를 하나 이상의 핵산 프로브와 접촉시키는 것에 의해 혼성화 시료가 형성된다. mRNA 또는 게놈 DNA를 검출하기 위한 프로브의 비-한정적인 예는 본 명세서에 기재된 mRNA 또는 게놈 DNA 서열에 혼성화될 수 있는 표지된 핵산 프로브이다. 상기 핵산 프로브는 예를 들면, 전장(full-length) 핵산 분자, 또는 그의 일부, 예를 들면, 적합한 mRNA 또는 게놈 DNA에 엄격한(stringent) 조건 하에 특이적으로 혼성화하기에 충분한 15개 이상, 30개 이상, 50개 이상, 100개 이상, 250개 이상, 또는 500개 이상의 뉴클레오티드로 구성된 길이의 올리고뉴클레오티드일 수 있다. 예를 들면, 상기 핵산 프로브는 선택적으로 본 명세서에 기재된 마커의 하나 이상의 대립인자, 또는 본 명세서에 기재된 하나 이상의 마커 또는 일배체형(예를 들면, 표 10, 표 15, 표 19, 표 20, 표 21 및 표 22에 열거된 마커 및 일배체형, 및 이들과 연관 불균형인 마커들)을 포함한, 본 명세서에 기재된 바와 같은, 서열번호 4, 서열번호 5 또는 서열번호 6에 표시된 뉴클레오티드 서열, rs4848543 LD 블럭, rs13387042 LD 블럭, rs3803662 LD 블럭, 및/또는 STEAP3/TSAP 유전자의 뉴클레오티드 서열의 전부 또는 일부를 포함할 수 있거나, 또는 상기 프로브는 그와 같은 서열의 상보적인 서열을 포함할 수 있다. 특정한 구체예에서, 상기 핵산 프로브는 선택적으로 본 명세서에 기재된 마커의 하나 이상의 대립인자(예를 들면, 표 10, 표 15, 표 19, 표 20, 표 21 및 표 22에 열거된 마커 및 일배체형, 및 이들과 연관 불균형인 마커들) 또는 본 명세서에 기재된 일배체형에 포함된 하나 이상의 대립인자를 포함한, 서열번호 4, 서열번호 5, 또는 서열번호 6에 표시된 뉴클레오티드 서열; 또는 본 명세서에 기재된 rs4848543 LD 블럭, rs13387042 LD 블럭, rs3803662 LD 블럭 및/또는 STEAP3/TSAP6 유전자의 뉴클레오티드 서열의 일부이거나, 또는 상기 프로브는 그와 같은 서열의 상보적인 서열일 수 있다. 본 발명의 진단 분석법에서 이용하기 위한 다른 적합한 프로브가 본 명세서에 기재된다. 혼성화는 당해 기술 분야의 당업자에게 잘 알려진 방법에 의해 수행될 수 있다(예를 들면, 모든 보충물을 포함한, Current Protocols in Molecular Biology, Ausubel, F. et al., eds., John Wiley & Sons 참조). 일 구체예에서, 혼성화는 특이적 혼성화, 즉, 불일치를 포함하지 않는 혼성화(정확한 혼성화)를 의미한다. 일 구체예에서, 상기 특이적 혼성화를 위한 혼성화 조건은 높은 엄격성이다.
존재하는 경우, 특이적 혼성화는 표준 방법을 이용하여 검출된다. 핵산 프로브와 테스트 시료 내의 유방암 연관 핵산 간에 특이적 혼성화가 일어나면, 상기 시료는 상기 핵산 프로브에 존재하는 뉴클레오티드에 상보적인 대립인자를 포함한다. 본 발명의 다른 마커, 또는 본 발명의 일배체형을 구성하는 마커에 대해, 상기 방법이 반복될 수 있거나, 또는 한번에 하나 이상의 마커 대립인자를 검출하기 위해 복수 개의 프로브가 동시에 이용될 수 있다. 특정한 일배체형의 둘 이상의 마커 대립인자를 포함하는 단일 프로브를 설계할 수 있다(예를 들면, 2개, 3개, 4개, 5개, 또는 특정한 일배체형을 구성하는 모든 마커에 상보적인 대립인자를 포함하는 프로브). 시료에서 일배체형의 특정한 마커의 검출은 상기 시료의 원천이 특정한 일배체형(예를 들면, 일배체형)을 가지며 따라서, 유방암에 대해 감수성을 갖는다는 것을 나타낸다.
하나의 바람직한 구체예에서, Kutyavin et al. (Nucleic Acid Res. 34:e128 (2006))에 기재된 바와 같이, 그의 3' 말단에 있는 형광 모이어티(fluorescent moiety) 또는 그룹 및 그의 5' 말단에 있는 퀀처(quencher)를 포함하는 검출 올리고뉴클레오티드 및 인핸서 올리고뉴클레오티드를 이용하는 방법이 적용될 수 있다. 형광 모이어티는 Gig Harbor Green 또는 Yakima Yellow, 또는 다른 적합한 형광 모이어티일 수 있다. 검출 프로브는 검출대상 SNP 다형성을 포함하는 짧은 뉴클레오티드 서열에 혼성화되도록 설계된다. 바람직하게는, 상기 SNP는 검출 프로브의 말단 잔기부터 3' 말단으로부터의 -6 잔기까지 중에 존재한다. 인핸서는 검출 프로브에 대해 3'인 DNA 주형에 혼성화되는 짧은 올리고뉴클레오티드 프로브이다. 상기 프로브들은 검출 프로브와 인핸서 뉴클레오티드 프로브가 모두 주형에 결합된 경우, 상기 검출 프로브와 인핸서 뉴클레오티드 프로브 간에 단일 뉴클레오티드 갭이 존재하도록 설계된다. 상기 갭은 엔도뉴클레아제 IV와 같은, 엔도뉴클레아제에 의해 인식되는 합성 탈염기 부위(synthetic abasic site)를 생성한다. 상기 효소는 완전히 상보적인 검출 프로브로부터 염료를 절단하나, 불일치를 포함하는 검출 프로브는 절단할 수 없다. 따라서, 방출된 형광 모이어티의 형광을 측정하는 것에 의해, 검출 프로브의 뉴클레오티드 서열에 의해 정의된 특정한 대립인자의 존재의 평가가 수행될 수 있다.
검출 프로브는 임의의 적합한 크기일 수 있으나, 바람직하게는 프로브는 비교적 짧다. 일 구체예에서, 상기 프로브는 길이가 5개 내지 100개의 뉴클레오티드로 구성된다. 또 다른 구체예에서, 상기 프로브는 길이가 10개 내지 50개의 뉴클레오티드로 구성되고, 또 다른 구체예에서, 상기 프로브는 길이가 12개 내지 30개의 뉴클레오티드로 구성된다. 다른 길이의 프로브들도 가능하고 본 발명이 속하는 기술 분야의 평균적인 당업자의 기술의 범위 내에 속한다.
바람직한 구체예에서, SNP 다형성을 포함하는 DNA 주형은 검출 전에 중합효소 연쇄 반응(PCR)에 의해 증폭된다. 그와 같은 구체예에서, 증폭된 DNA가 검출 프로프 및 인핸서 프로브에 대한 주형으로 기능한다.
검출 프로브, 인핸서 프로브, 및/또는 PCR에 의한 주형의 증폭을 위해 이용되는 프라이머의 특정한 구체예는 변형된 A 및 변형된 G를 포함한, 변형된 염기의 이용을 포함한다. 변형된 염기의 이용은 주형 DNA에 대한 뉴클레오티드 분자(프로브 및/또는 프라이머)의 용융점을 조정하기 위해, 예를 들면, 상보적인 T와 세개의 수소 결합을 형성할 수 있는 능력을 갖는 변형된 A가 이용될 수 있는, 낮은 비율의 G 또는 C 염기를 포함하는 영역에서 용융점을 높이기 위해, 또는 예를 들면, 상보적인 C와 두 개의 수소 결합만을 형성하는 변형된 G 염기를 이용하는 것에 의해, 높은 비율의 G 또는 C 염기를 포함하는 영역에서 용융점을 낮추기 위해 유용할 수 있다. 바람직한 구체예에서, 검출 뉴클레오티드 프로브의 설계에서 변형된 염기들이 이용된다. 당업자에게 알려진 임의의 변형된 염기가 이 방법에서 선택될 수 있고, 적합한 염기의 선택은 본 명세서의 교시 및 당업자에게 알려진 상업적 출처로부터 이용가능한 공지된 염기에 근거하여 당업자의 범위 내에 속한다.
또 다른 혼성화 방법에서, 유방암과 연관된 다형성의 존재를 확인하기 위해 노던 분석이 이용된다(Current Protocols in Molecular Biology, Ausubel, F. et al., eds., John Wiley & Sons, supra 참조). 노던 분석의 경우, RNA의 테스트 시료가 적합한 수단에 의해 개체로부터 수득된다. 본 명세서에 기재된 바와 같이, 개체로부터의 RNA에 대한 핵산 프로브의 특이적 혼성화는 상기 프로브에 상보적인 특정한 대립인자를 나타낸다. 핵산 프로브의 용도의 대표적인 예를 위해, 예를 들면, 미국특허 제5,288,611호 및 제4,851,330호를 참조한다.
추가적으로, 또는 대안적으로, 펩티드 핵산(peptide nucleic acid, PNA)이 본 명세서에 기재된 혼성화 방법에서 핵산 프로브에 추가하여, 또는 핵산 프로브 대신에 이용될 수 있다. PNA는 유기 염기 (A, G, C, T 또는 U)가 메틸렌 카르보닐 링커를 통해 글리신 질소에 결합된, N-(2-아미노에틸)글리신 유닛과 같은, 펩티드-유사 무기 백본(peptide-like inorganic backbone)을 갖는 DNA 모방체(mimic)이다(예를 들면, Nielsen, P., et al., Bioconjug. Chem. 5:3-7 (1994) 참조). PNA 프로브는 유방암과 연관된 하나 이상의 마커 대립인자 또는 일배체형을 포함하는 것으로 사료되는 시료 내의 분자에 특이적으로 혼성화하도록 설계될 수 있다. 따라서, PNA 프로브의 혼성화는 유방암 또는 유방암에 대한 감수성을 진단할 수 있다.
본 발명의 일 구체예에서, 개체로부터 수득된 게놈 DNA를 포함하는 테스트 시료가 수집되고 본 발명의 하나 이상의 마커 또는 일배체형을 포함하는 단편을 증폭시키기 위해 중합효소 연쇄 반응(PCR)이 이용된다. 본 명세서에 기재된 바와 같이, 유방암과 연관된 특정한 마커 대립인자 또는 일배체형의 확인은 다양한 방법(예를 들면, 서열 분석, 제한효소 처리에 의한 분석, 특이적 혼성화, SSCP(single stranded conformation polymorphism), 전기영동 분석 등)을 이용하여 수행될 수 있다. 또 다른 구체예에서, 진단은 정량적 PCR(kinetic thermal cycling)을 이용한 발현 분석에 의해 수행된다. 이 기법은 예를 들면, TaqMan®(Applied Biosystems, Foster City, CA)과 같은 상업적으로 이용가능한 기술을 이용할 수 있다. 상기 기법은 유방암과 연관된 핵산에 의해 코딩된 폴리펩티드 또는 스플라이싱 변이(splicing variant)의 발현 또는 조성의 변화의 존재를 평가할 수 있다. 또한, 변이의 발현은 물리적으로 또는 기능적으로 상이한 것으로 정량될 수 있다.
본 발명의 또 다른 방법에서, 특정한 대립인자가 기준 서열 대비 제한효소 인식 부위의 생성 또는 제거를 초래하는 경우, 제한효소 처리(restriction digestion)에 의한 분석이 상기 특정한 대립인자를 검출하기 위해 이용될 수 있다. 게놈 DNA를 포함하는 테스트 시료가 개체로부터 수득된다. RFLP(Restriction fragment length polymorphism) 분석은 예를 들면, 전술된 Current Protocols in Molecular Biology에 기재된 바와 같이 수행될 수 있다. 관련된 DNA 단편의 제한효소 처리의 결과 패턴(digestion pattern)이 시료 중의 특정한 대립인자의 존재 또는 부재를 나타낸다.
유방암과 연관된 다형성 부위의 특정한 대립인자(예를 들면, 표 10, 표 15, 표 19, 표 20, 표 21 및/또는 표 22에 열거된 다형성 마커 및 일배체형, 및 이들과 연관 불균형인 마커들)을 검출하기 위해, 서열 분석이 또한 이용될 수 있다. 따라서, 일 구체예에서, 특정한 마커 대립인자 또는 일배체형의 존재 또는 부재의 결정은 서열 분석을 포함한다. 예를 들면, DNA 또는 RNA의 테스트 시료가 테스트 개체로부터 수득될 수 있다. PCR 또는 다른 적합한 방법이 유방암과 연관된 핵산의 일부를 증폭시키기 위해 이용될 수 있고, 그 후, 특정한 대립인자의 존재가 직접 시료 중의 게놈 DNA의 다형성 부위(또는 복수 개의 다형성 부위들)의 서열을 결정하는 것에 의해 검출될 수 있다.
대립인자-특이적 올리고뉴클레오티드가 또한 대립인자-특이적 올리고뉴클레오티드(ASO) 프로브에 의한 증폭된 올리고뉴클레오티드의 도트-블롯 혼성화를 통해 유방암-연관 핵산(예를 들면, 표 10, 표 15, 표 19, 표 20, 표 21 및 표 22에 열거된 다형성 마커 및 일배체형, 및 이들과 연관 불균형인 마커들)에서 특정한 대립인자의 존재를 검출하기 위해 이용될 수 있다(예를 들면, Saiki, R. et al., Nature, 324:163-166 (1986) 참조). "대립인자-특이적 올리고뉴클레오티드(allele-specific oligonucleotide)"(본 명세서에서 "대립인자-특이적 올리고뉴클레오티드 프로브"로도 지칭됨)는 유방암-연관 핵산에 특이적으로 혼성화하고, 다형성 부위(예를 들면, 본 명세서에 기재된 마커 또는 일배체형)에 특이적 대립인자를 포함하는, 약 10-50 bp(base pairs) 또는 약 15-30 bp의 올리고뉴클레오티드이다. 하나 이상의 특정한 유방암-연관 핵산에 대해 특이적인 대립인자-특이적 올리고뉴클레오티드는 표준 방법을 이용하여 제조될 수 있다(예를 들면, Current Protocols in Molecular Biology, supra 참조). 원하는 영역을 증폭시키기 위해 PCR이 이용될 수 있다. 증폭된 영역을 함유한 DNA가 표준 방법(예를 들면, Current Protocols in Molecular Biology, supra 참조)을 이용하여 도트-블롯팅될 수 있고, 상기 블롯이 올리고뉴클레오티드 프로브와 접촉될 수 있다. 그 후, 상기 프로브의 증폭된 영역에 대한 특이적 혼성화의 존재가 검출될 수 있다. 개체로부터의 DNA에 대한 대립인자-특이적 올리고뉴클레오티드 프로브의 특이적 혼성화는 유방암과 연관된 다형성 분위에 특이적 대립인자를 나타낸다(예를 들면, Gibbs, R. et al., Nucleic Acids Res., 17:2437-2448 (1989) 및 WO 93/22456 참조).
LNA(locked nucleic acid)와 같은 유사체의 첨가로, 프라이머 및 프로브의 크기가 8개의 염기까지 감소될 수 있다. LNA는 푸라노오스 고리의 2' 및 4' 위치가 O-메틸렌(옥시-LNA), S-메틸렌(티오-LNA), 또는 아미노 메틸렌(아미노-LNA) 모이어티를 통해 연결되는 것인 이중고리형(bicyclic) DNA 유사체의 신규한 종류이다. 모든 이 LNA 변이에 공통된 것은 상보적 핵산에 대한 친화도이고, 이는 DNA 유사체에 대해 보고된 가장 높은 친화도이다. 예를 들면, 특정한 모든 옥시-LNA 노나머(nonamer)는 상응하는 DNA 노마머에 대한 DNA 및 RNA 모두에 대한 28℃ 대비, 64℃ 및 74℃의 용융점(Tm)을 갖는 것으로 확인되었다. Tm의 실질적인 증가는 또한 LNA 단량체가 표준 DNA 또는 RNA 단량체와 조합되어 이용되는 경우 수득된다. 프라이머 및 프로브의 경우, LNA 단량체가 포함되는 위치(예를 들면, 3' 말단, 5' 말단, 또는 중간)에 따라, Tm은 상당히 증가될 수 있다.
또 다른 구체예에서, 개체로부터의 표적 핵산 서열 세그먼트에 상보적인 올리고뉴클레오티드 프로브의 어레이(array)가 유방암과 연관된 핵산에서 다형성을 식별하기 위해 이용될 수 있다(예를 들면, 표 10, 표 15, 표 19, 표 20, 표 21 및 표 2의 다형성 마커 및 일배체형, 및 이들과 연관 불균형인 마커들). 예를 들면, 올리고뉴클레오티드 어레이가 이용될 수 있다. 올리고뉴클레오티드 어레이는 일반적으로 상이한 공지된 위치에 있는 기판(substrate)의 표면에 결합된 복수 개의 상이한 올리고뉴클레오티드 프로브를 포함한다. "Genechips™"에도 기재된, 이 올리고뉴클레오티드 어레이들은 본 발명이 속하는 기술 분야에서 일반적으로 설명된다(예를 들면, 미국특허 제5,143,854호, PCT 특허출원 공개 WO90/15070 및 92/10092 참조). 이 어레이들은 일반적으로 포토리소그래피 방법과 고상 올리고뉴클레오티드 합성 방법의 조합을 포함하는 기계적 합성 방법, 또는 본 발명이 속하는 기술 분야의 당업자에게 공지된 다른 방법을 이용하여 생산된다(각각의 전체 교시가 참조에 의해 본 명세서에 포함된, Fodor, S. et al., Science, 251:767-773 (1991); Pirrung et al., 미국특허 제5,143,854호(또한, 공개된 PCT 출원 WO 90/15070 참조); 및 Fodor. S. et al., 공개된 PCT 출원 WO 92/10092 및 미국특허 제5,424,186호 참조). 기계적 합성 방법을 이용한 이 어레이들의 합성을 위한 기법들이 예를 들면, 미국특허 제5,384,261호에 기재되며, 그 전체 교시가 참조에 의해 본 명세서에 포함된다.
올리고뉴클레오티드 어레이가 제조되면, 목적 핵산(nucleic acid of interest)이 상기 어레이와 혼성화될 수 있게 된다. 혼성화의 검출은 목적 핵산 중의 특정한 대립인자의 검출이다. 혼성화 및 스캐닝(scanning)은 일반적으로 본 명세서에 기재된 방법 또는 본 발명이 속하는 기술 분야의 당업자에게 알려진 다른 방법, 예를 들면, 각각의 전체 교시가 참조에 의해 본 명세서에 포함된, PCT 출원공개 WO 92/10092 및 WO 95/11995, 및 미국특허 제5,424,186호에 기재된 방법에 의해 수행된다. 요약하면, 하나 이상의 이전에 확인된 다형성 마커를 포함하는, 표적 핵산 서열이 잘-알려진 증폭 기법(예를 들면, PCR)에 의해 증폭된다. 통상적으로 이는 다형성 부위로부터 상류 및 하류인 표적 서열의 두 가닥에 상보적인 프라이머 서열의 이용을 포함한다. 비대칭 PCR(asymmetric PCR) 기법도 이용될 수 있다. 증폭된 표적, 일반적으로 표지를 포함하는 증폭된 표적은 그 후, 서열-특이적 혼성화를 가능하게 하는 적합한 조건 하에 어레이와 혼성화될 수 있게 된다. 혼성화 및 어레이의 세척 후에, 표적 서열이 혼성화된 어레이 상의 위치를 결정하기 위해 어레이가 스캐닝된다. 스캔으로부터 수득된 혼성화 데이터는 통상적으로 어레이 상의 위치의 함수인 형광 강도의 형태이다.
주로 단일 검출 블럭, 예를 들면, 단일 다형성 부위를 검출하기 위한 단일 검출 블럭의 측면에서 설명되나, 어레이는 복수의 검출 블럭을 포함할 수 있고, 따라서, 복수 개의 특정한 다형성(예를 들면, 특정한 일배체형의 복수개의 다형성)을 포함할 수 있다. 대안적인(alternate) 배열로, 일반적으로 검출 블럭은 단일 어레이 또는 복수의 별개의 어레이 내에서 그룹핑될 수 있어서 표적의 어레이로의 혼성화동안 다양한, 최적 조건들이 이용될 수 있는 것으로 이해될 것이다. 예를 들면, A-T 풍부(rich) 세그먼트에 속하는 스트레치(stretch)에 속하는 다형성들과 별개로, 게놈 서열의 G-C 풍부 스트레치에 속하는 다형성의 검출을 제공하는 것이 종종 바람직할 것이다. 이는 각 상황에 대한 혼성화의 별개의 최적화를 가능하게 한다.
다형성의 검출을 위한 올리고뉴클레오티드의 용도의 추가적인 설명이 예를 들면, 참조에 의해 전체 교시가 본 명세서에 포함된, 미국특허 제5,858,659호 및 제5,837,832호에서 확인될 수 있다.
본 발명이 속하는 기술 분야의 당업자에게 이용가능한 핵산 분석의 다른 방법들이 유방암과 연관된 다형성 부위(예를 들면, 표 10, 표 15, 표 19, 표 20, 표 21 및 표 22의 다형성 마커 및 일배체형 및 이들과 연관 불균형인 마커들)에서 특정한 대립인자를 검출하기 위해 이용될 수 있다. 대표적인 방법들은 예를 들면, 직접적인 수동 서열결정(direct manual sequencing) (Church and Gilbert, Proc. Natl. Acad. Sci. USA, 81: 1991-1995 (1988); Sanger, F., et al., Proc. Natl. Acad. Sci. USA, 74:5463-5467 (1977); Beavis, et al., U.S. Patent No. 5,288,644); 자동화된 형광 서열결정(automated fluorescent sequencing); 단일가닥 구조 다형성(SSCP) 분석; CDGE(clamped denaturing gel electrophoresis); DGGE(denaturing gradient gel electrophoresis) (Sheffield, V., et al., Proc. Natl. Acad. Sci. USA, 86:232-236 (1989)), 운동성 변화 분석(mobility shift analysis)(Orita, M., et al., Proc. Natl. Acad. Sci. USA, 86:2766-2770 (1989)), 제한효소 분석(Flavell, R., et al., Cell, 15:25-41 (1978); Geever, R., et al., Proc. Natl. Acad. Sci. USA, 78:5081-5085 (1981)); 헤테로듀플렉스(heteroduplex) 분석; 화학적 불일치 절단(chemical mismatch cleavage, CMC) (Cotton, R., et al., Proc. Natl. Acad. Sci. USA, 85:4397-4401 (1985)); RNase 보호 분석(Myers, R., et al., Science, 230:1242-1246 (1985); E. coli mutS 단백질과 같은, 뉴클레오티드 불일치를 인식하는 폴리펩티드의 이용; 및 대립인자-특이적 PCR을 포함한다.
본 발명의 또 다른 구체예에서, 유방암 또는 유방암에 대한 감수성의 진단은 본 발명의 유전적 마커(들) 또는 일배체형(들)이 폴리펩티드의 조성 또는 발현의 변화를 초래하는 경우들에서, 유방암과 연관된 핵산에 의해 코딩된 폴리펩티드의 발현 및/또는 조성을 조사하는 것에 의해 수행될 수 있다. 따라서, 유방암에 대한 감수성의 진단은 본 발명의 유전적 마커 또는 일배체형이 폴리펩티드의 조성 또는 발현의 변화를 초래하는 경우, 이들 중 하나의 폴리펩티드, 또는 유방암과 연관된 핵산에 의해 코딩되는 또 다른 폴리펩티드의 발현 및/또는 조성을 조사하는 것에 의해 수행될 수 있다. 유방암에 대해 연관을 보이는 본 발명의 일배체형 및 마커들은 하나 이상의 인접 유전자(nearby gene)에 대한 효과를 통해 역할을 수행한다. 이 유전자들에 영향을 미치는 가능한 메카니즘은 예를 들면, 전사에 대한 효과, RNA 스플라이싱에 대한 효과, mRNA의 대안적인 스플라이스(alternative splice) 형태의 상대적 양의 변화, RNA 안정성에 대한 효과, 핵으로부터 세포질로의 이동에 대한 효과, 및 번역의 효율성 및 정확성에 대한 효과를 포함한다.
따라서, 또 다른 구체예에서, 유방암에 대한 연관을 보이는 본 발명의 변이(마커 또는 일배체형)가 인접 유전자의 발현에 영향을 미친다. 유전자 발현에 영향을 미치는 조절성 요소(regulatory element)가 유전자의 프로모터 영역으로부터 멀리 떨어져서, 수십 킬로베이스 또는 심지어 수백 킬로베이스 떨어져서 위치할 수 있다는 것이 잘 알려져 있다. 본 발명의 하나 이상의 다형성 마커의 하나 이상의 대립인자의 존재 또는 부재를 분석하는 것에 의해, 따라서, 그와 같은 인접한 유전자의 발현 수준을 평가할 수 있다. 따라서, 본 발명의 마커 또는 일배체형의 검출이 하나 이상의 STEAP3/TSAP6, LOC643714, 및 TNRC9 유전자의 발현을 평가하기 위해 이용될 수 있다.
ELISA(enzyme linked immunosorbent assay), 웨스턴 블롯(Western blot), 면역침전(immunoprecipitation) 및 면역형광(immunofluorescence)을 포함한 다양한 방법들이 단백질 발현 수준을 검출하기 위해 이용될 수 있다. 개체로부터의 테스트 시료가 유방암과 연관된 핵산에 의해 코딩되는 폴리펩티드의 발현의 변화 및/또는 그의 조성의 변화의 존재에 대해 평가된다. 유방암과 연관된 핵산에 의해 코딩되는 폴리펩티드의 발현의 변화가 예를 들면, 정량적인 폴리펩티드 발현(즉, 생성되는 폴리펩티드의 양)의 변화일 수 있다. 유방암과 연관된 핵산에 의해 코딩되는 폴리펩티드의 조성의 변화는 정성적 폴리펩티드 발현의 변화(예를 들면, 돌연변이 폴리펩티드의 발현 또는 상이한 스플라이싱 변이의 발현)이다. 일 구체예에서, 유방암에 대한 감수성의 진단은 유방암과 연관된 핵산에 의해 코딩되는 특정한 스플라이싱 변이, 또는 스플라이싱 변이의 특정한 패턴을 검출하는 것에 의해 수행된다.
또한, 그와 같은 변화(정량적 및 정성적 변화)가 모두 존재할 수 있다. 본 명세서에서 사용된 폴리펩티드 발현 또는 조성의 "변화(alteration)"는 대조군 시료에서 상기 폴리펩티드의 발현 또는 조성 대비, 테스트 시료 중의 발현 또는 조성의 변화를 의미한다. 대조군 시료는 테스트 시료에 상응하는 시료(예를 들면, 동일한 종류의 세포로부터 유래된 시료)이고, 유방암에 의해 영향받지 않고 및/또는 유방암에 대한 감수성을 갖지 않는 개체로부터 유래된다. 일 구체예에서, 대조군 시료는 본 명세서에 기재된 유방암과 연관된 마커 대립인자 또는 일배체형을 갖지 않는 개체로부터 유래된다. 유사하게, 대조군 시료 대비, 테스트 시료 중에 하나 이상의 상이한 스플라이싱 변이의 존재, 또는 대조군 시료 대비, 테스트 시료 중의 상이한 스플라이싱 변이의 유의성 있게 상이한 양의 존재는 유방암에 대한 감수성을 나타낼 수 있다. 대조군 시료 대비, 테스트 시료 중의 폴리펩티드의 발현 또는 조성의 변화는 특정한 대립인자가 대조군 시료 중의 기준 대비 스플라이스 위치를 변화시키는 경우, 상기 특정한 대립인자를 나타낼 수 있다. 분광분석법, 비색법(colorimetry), 전기영동, 등전점 전기영동법(isoelectric focusing), 및 면역블롯팅(immunoblotting)(예를 들면, 전술된 바와 같은, Current Protocols in Molecular Biology, 특히, 챕터 10 참조)과 같은 면역분석법(immunoassays)(예를 들면, David et al., 미국특허 제4,376,110호)을 포함한, 핵산에 의해 코딩된 폴리펩티드의 발현 또는 조성을 조사하는 다양한 수단이 본 발명이 속하는 기술 분야의 당업자에게 알려져 있고, 이용될 수 있다.
예를 들면, 일 구체예에서, 유방암과 연관된 핵산에 의해 코딩되는 폴리펩티드에 결합할 수 있는 항체(예를 들면, 검출가능한 표지를 갖는 항체)가 이용될 수 있다. 항체는 다중클론 항체 또는 단일클론 항체일 수 있다. 완전한 항체, 또는 그의 단편(예를 들면, Fv, Fab, Fab', F(ab')2)이 이용될 수 있다. 프로브 또는 항체에 대해, 용어 "표지된(labeled)"은 검출가능한 물질을 프로브 또는 항체에 결합(즉, 물리적 연결)시키는 것에 의한 프로브 또는 항체의 직접적인 표지화, 및 직접적으로 표지된 또 다른 시약과의 반응성에 의한 프로브 또는 항체의 간접적 표지화를 포함하도록 의도된다. 간접적 표지화의 예는 표지된 이차 항체(예를 들면, 형광-표지된 이차 항체)를 이용한 일차 항체의 검출 및 형광-표지된 스트렙타비딘에 의해 검출될 수 있는, 비오틴에 의한 DNA 프로브의 말단-표지화(end-labeling)를 포함한다.
이 방법의 일 구체예에서, 테스트 시료 중의 유방암과 연관된 핵산(예를 들면, STEAP3/TSAP6, LOC64371 또는 TNRC9 유전자를 코딩하는 핵산)에 의해 코딩된 폴리펩티드의 수준 또는 양이 대조군 시료 중의 유방암과 연관된 핵산에 의해 코딩된 폴리펩티드의 수준 또는 양과 비교된다. 대조군 시료 중의 폴리펩티드의 수준 또는 양보다 더 높거나 또는 더 낮고, 그 차이가 통계적으로 유의성이 있는, 테스트 시료 중의 폴리펩티드의 수준 또는 양은 상기 핵산에 의해 코딩되는 폴리펩티드의 발현의 변화를 나타내고 발현의 차이를 유발하는 특정한 대립인자 또는 일배체형의 존재를 나타낸다. 대안적으로, 테스트 시료 중의 폴리펩티드의 조성이 대조군 시료 중의 상기 폴리펩티드의 조성과 비교된다. 또 다른 구체예에서, 폴리펩티드의 수준 또는 양과 조성이 모두 테스트 시료 및 대조군 시료에서 평가될 수 있다.
또 다른 구체예에서, 유방암에 대한 감수성의 진단은 추가적인 단백질-기반 분석법, RNA-기반 분석법 또는 DNA-기반 분석법과 조합하여, 하나 이상의 본 발명의 마커 대립인자 또는 일배체형(예를 들면, 표 10, 표 15, 표 19, 표 20, 표 21, 및 표 22의 마커 및 일채체형 및 이들과 연관 불균형인 마커의 연관된 대립인자)을 검출하는 것에 의해 수행된다. 본 발명의 방법은 또한 대상 개체의 가족력 및 위험 인자(예를 들면, 환경적 위험 인자, 생활방식 위험 인자)의 분석과 조합되어 이용될 수 있다.
키트
본 발명의 방법에서 유용한 키트는 본 명세서에 기재된 방법에서 유용한 성분들, 예를 들면, 혼성화 프로브, 제한효소(예를 들면, RFLP 분석용 제한효소), 대립인자-특이적 올리고뉴클레오티드, 본 명세서에 기재된 본 발명의 핵산(예를 들면, 본 발명의 하나 이상의 다형성 마커 및/또는 일배체형을 포함하는 게놈 단편)에 의해 코딩된 변화된 폴리펩티드에 결합하는 항체 또는 본 명세서에 기재된 본 발명의 핵산에 의해 코딩된 변화되지 않은(원형의) 폴리펩티드에 결합하는 항체, 유방암과 연관된 핵산의 증폭을 위한 수단, 유방암과 연관된 핵산의 핵산 서열을 분석하기 위한 수단, 유방암과 연관된 핵산에 코딩되는 폴리펩티드의 아미노산 서열을 분석하기 위한 수단, 등을 포함한다. 본 발명의 키트는 예를 들면, 필요한 완충액, 본 발명의 핵산(예를 들면, 본 명세서에 기재된 하나 이상의 다형성 마커를 포함하는 핵산 세그먼트)을 증폭하기 위한 핵산 프라이머, 및 그와 같은 프라이머 및 필요한 효소(예를 들면, DNA 중합효소)를 이용하여 증폭된 단편의 대립인자-특이적 검출을 위한 시약을 포함할 수 있다. 추가적으로, 키트는 본 발명의 방법과 조합되어 이용될 수 있는 분석법을 위한 시약들, 예를 들면, 본 명세서에 기재된 유방암 진단 분석법에서 이용되는 시약을 제공할 수 있다.
일 구체예에서, 본 발명은 유방암, 또는 유방암에 대한 감수성을 검출하기 위해, 개체로부터의 시료를 분석하는 키트로서, 상기 키트는 상기 개체의 게놈에서 본 발명의 하나 이상의 다형성의 하나 이상의 대립인자를 선택적으로 검출하기 위해 필요한 시약들을 포함하는 것인 키트에 관한 것이다. 특정한 구체예에서, 상기 시약은 본 발명의 하나 이상의 다형성을 포함하는 개체의 게놈의 단편에 혼성화하는 하나 이상의 연속적인 올리고뉴클레오티드(contiguous oligonucleotide)를 포함한다. 또 다른 구체예에서, 상기 시약은 개체로부터 수득된 게놈 세그먼트의 반대쪽 가닥에 혼성화하는 한 쌍 이상의 올리고뉴클레오티드를 포함하고, 상기 각 올리고뉴클레오티드 프라이머 쌍은 하나 이상의 다형성을 포함하는 개체의 게놈의 단편을 선택적으로 증폭시키도록 설계되며, 상기 다형성은 표 10, 표 15, 표 19, 표 20, 표 21 및 표 22에 열거된 다형성 및 이들과 연관 불균형인 다형성 마커로 구성된 군으로부터 선택된다. 또 다른 구체예에서, 상기 단편은 크기가 20 bp 이상이다. 그와 같은 올리고뉴클레오티드 또는 핵산(예를 들면, 올리고뉴클레오티드 프라이머)은 유방암을 나타내는 다형성(예를 들면, SNP 또는 마이크로새틀라이트)을 둘러싼(flanking) 핵산 서열의 부분을 이용하여 설계될 수 있다. 또 다른 구체예에서, 상기 키트는 유방암과 연관된 하나 이상의 특정한 다형성 마커 또는 일배체형을 대입인자-특이적으로 검출할 수 있는 하나 이상의 표지된 핵산, 및 상기 표지의 검출을 위한 시약을 포함한다. 적합한 표지는 예를 들면, 방사성동위원소, 형광 표지, 효소 표지, 효소 보조-인자(co-factor) 표지, 자성 표지(magnetic label), 스핀 표지(spin label), 에피토프 표지(epitope label)를 포함한다.
특정한 구체예에서, 본 발명의 키트의 시약에 의해 검출될 다형성 마커 또는 일배체형은 표 10, 표 15, 표19, 표 20, 표 21 및 표 22에 표시된 마커들로 구성된 군으로부터 선택된, 하나 이상의 마커, 두개 이상의 마커, 세개 이상의 마커, 네개 이상의 마커, 또는 다섯개 이상의 마커를 포함한다. 일 구체예에서, 검출될 마커는 표 10, 표 15 또는 표 19에 열거된 마커들로부터 선택된다. 일 구체예에서, 검출될 마커는 표 10에 열거된 마커들로부터 선택된다. 또 다른 구체예에서, 검출될 마커는 표 15에 열거된 마커들로부터 선택된다. 또 다른 구체예에서, 검출될 마커는 표 19에 열거된 마커들로부터 선택된다. 바람직한 구체예에서, 검출될 마커는 rs4848543, rs13387042 및/또는 rs3803662이다. 다른 바람직한 구체예는 마커 rs4848543을 검출하기 위한 시약을 포함하는 것, 마커 rs13387042를 검출하기 위한 시약을 포함하는 것 및 마커 rs3803662를 검출하기 위한 시약을 포함하는 것을 포함한다. 또 다른 구체예에서, 검출될 마커 또는 일배체형은 표 10, 표 15, 표 19, 표 20, 표 21 및 표 22에 표시된 마커들에 표시된 마커들로 구성된 마커들의 군으로부터의 하나 이상의 마커와 0.2보다 큰 r2 값에 의해 정의된 강한 연관 불균형인 마커들의 군으로부터 선택된 하나 이상의 마커를 포함한다. 또 다른 구체예에서, 검출될 마커 또는 일배체형은 마커 rs4848543, rs13387042 및 rs3803662, 및 이들과 연관 불균형인 마커들로 구성된 마커들의 군으로부터 선택된 하나 이상의 마커를 포함한다.
그와 같은 구체예 중 하나에서, 상기 마커 또는 일배체형의 존재는 유방암에 대한 감수성(증가된 감수성 또는 감소된 감수성)을 나타낸다. 또 다른 구체예에서, 상기 마커는 rs4848543 대립인자 A, rs13387042 대립인자 A, 및/또는 rs3803662 대립인자 T이고, 이들의 존재는 유방암(예를 들면, All BC 및/또는 MedPre 유방암)의 증가된 위험도를 나타낸다. 또 다른 구체예에서, 상기 마커 또는 일배체형의 존재는 유방암 치료제에 대한 반응을 나타낸다. 또 다른 구체예에서, 상기 마커 또는 일배체형의 존재는 유방암 예후를 나타낸다. 또 다른 구체예에서, 상기 마커 또는 일배체형의 존재는 유방암 치료의 진행을 나타낸다. 그와 같은 치료는 수술에 의한 개입, 투약, 방사선요법 또는 기타 수단(예를 들면, 생활방식 변화)을 포함할 수 있다.
본 발명의 다형성과 연관된 유방암의 진단
본 발명의 진단 방법은 전반적으로 유방암에 대한 감수성을 진단하는 것과 관련하여 설명되었으나, 본 발명의 방법은 또한 본 발명의 다형성 마커와 연관된 유방암을 진단하기 위해 이용될 수 있다. 예를 들면, 유방암을 갖거나 또는 유방암과 연관된 위험 인자를 갖는 개체는 상기 개체에서 본 발명의 다형성 또는 일배체형의 존재가 유방암에 대한 기여 인자(contributing factor)였을 수 있는지 여부를 결정하기 위해 평가될 수 있다. 일 구체예에서, 본 발명의 마커 및/또는 일배체형과 연관된 유방암의 확인은 치료 계획을 촉진한다. 예를 들면, 개체가 유방암을 발병하는 비율을 최소화하기 위한 예방적 치료가 적용될 수 있다. 그와 같은 예방적 치료는 또한 개체가 본 발명의 위험 변이에 대해 이형접합형인지 또는 동형접합형인지 여부의 평가를 포함할 수 있다. 본 발명의 다른 구체예에서, 본 발명의 다형성 및/또는 일배체형과 연관된 적합한 유전자 또는 단백질을 표적화하도록 치료법이 설계되고 치료제가 선택될 수 있다.
다른 구체예에서, 본 발명은 개체에서, 본 발명에서 상세하게 설명된 바와 같은 본 발명의 다형성 마커 또는 일배체형의 존재를 확인하는 것에 의해, 개체에서 본 발명의 다형성과 연관된 유방암을 진단하고 확인하는 방법에 관한 것이다. 예를 들면, 본 명세서에 기재된 다형성 마커 및/또는 일배체형은 유방암에 걸리지 않은 개체에서보다 유방암에 걸린 개체에서 보다 빈번하게 발견된다. 따라서, 이 마커들 및/또는 일배체형은 유방암을 진단하기 위한 예측적 가치를 갖는다. 일 구체예에서, 유방암을 검출하기 위한 예측적 가치를 갖는 마커 또는 일배체형은 표 10, 표 15, 표 19, 표 20, 표 21 및 표 22의 마커들로 구성된 군으로부터 선택된 하나 이상의 마커를 포함한다. 또 다른 구체예에서, 유방암을 진단하기 위한 예측적 가치를 갖는 마커들은 마커 rs4848543, rs13387042 및 rs3803662, 및 이들과 연관 불균형인 마커들로부터 선택된다.
또 다른 구체예에서, 유방암을 진단하기 위한 예측적 가치를 갖는 마커 대립인자는 rs4848543 대립인자 A, rs13387042 대립인자 A, 및 rs3803662 대립인자 T, 및 이들과 연관 불균형인 마커들을 포함한다.
따라서, 본 명세서에 기재된 방법들은 개체로부터의 시료에서 마커 또는 일배체형의 특정한 대립인자의 존재 또는 부재를 평가하기 위해 이용될 수 있고, 상기 마커 또는 일배체형의 특정한 대립인자의 존재 또는 부재는 유방암의 감수성을 나타낸다.
본 발명의 일 구체예에서, 본 발명의 다형성 및/또는 일배체형과 연관된 유방암의 진단은 본 발명의 다형성을 검출하는 것에 의해 수행된다. 특정한 다형성이 본 명세서에 기재된다(예를 들면, 표 10, 표 15, 표 19, 표 20, 표 21, 및 표 22, 및 이들과 연관 불균형인 마커들 참조). 유방암이 본 발명의 하나 이상의 다형성과 연관되는지 여부를 결정하기 위해 유방암을 갖는 개체로부터 게놈 DNA, RNA 또는 cDNA의 시료가 수득된다. 그 후, 상기 시료에 본 발명의 다형성의 특정한 대립인자 또는 본 발명의 특정한 일배체형이 존재하는지 여부를 결정하기 위해 상기 DNA, RNA 또는 cDNA 시료가 검사된다. 상기 핵산 시료가 본 발명의 다형성의 대립인자 또는 일배체형을 포함하는 것으로 확인되는 경우, 상기 대립인자 또는 일배체형의 존재는 상기 다형성 및/또는 일배체형과 연관된 유방암을 나타낸다.
서던 분석(Southern analysis), 노던 분석(Northern analysis), 및/또는 인-시투 혼성화(in situ hybridization), 제한효소 처리(restriction digestion) 또는 서열 분석과 같은 혼성화 방법을 포함하나, 이에 한정되지 않는, 본 발명이 속하는 기술 분야의 당업자에게 공지된 방법이 다형성을 검출하기 위해 이용될 수 있다. 본 발명의 다형성과 연관된 유방암의 진단은 또한 ELISA(enzyme linked immunosorbent assay), 웨스턴 블롯, 면역침전 및 면역형광, 또는 본 발명이 속하는 기술 분야의 당업자에게 공지된 다른 방법을 포함한 다양한 방법을 이용하여, 본 발명의 다형성과 연관된 핵산에 의해 코딩된 폴리펩티드의 발현 및/또는 조성을 검사하는 것에 의해 수행될 수 있다.
치료제
본 발명의 변이(예를 들면, 본 발명의 마커 및/또는 일배체형, 예를 들면, 표 10, 표 15 및 표 19에 열거된 마커들)는 유방암에 대한 신규한 치료제 표적을 확인하기 위해 이용될 수 있다. 예를 들면, 유방암과 연관된 변이(마커 및/또는 일배체형)를 포함하는 유전자 또는 상기 변이와 연관 불균형인 유전자(예를 들면, 하나 이상의 STEAP3/TSAP6 유전자, LOC643714 유전자, 및/또는 TNRC9 유전자), 또는 그들의 산물, 및 이 변이 유전자들 또는 그들의 산물에 의해 직접적으로 또는 간접적으로 조절되거나 또는 이들과 상호작용하는 유전자 또는 그들의 산물이 유방암을 치료하는 치료제의 개발을 위해 표적화될 수 있다. 치료제는 하나 이상의, 예를 들면, 표적 유전자 또는 그들의 유전자 산물의 기능 및/또는 수준을 조절할 수 있는, 작은 비-단백질(non-protein) 및 비-핵산 분자, 단백질, 펩티드, 단백질 단편, 핵산(DNA, RNA), PNA(peptide nucleic acid), 또는 그들의 유도체 또는 모방체(mimetics)를 포함할 수 있다.
본 발명의 핵산 및/또는 변이, 또는 그들의 상보적 서열을 포함하는 핵산이 세포, 조직 또는 기관에서 유전자 발현을 조절하기 위한 안티센스 구조물(antisense construct)로서 이용될 수 있다. 안티센스 기법과 연관된 방법은 당업자에게 잘 알려져 있고, AntisenseDrug Technology: Principles, Strategies, and Applications, Crooke, ed., Marcel Dekker Inc., New York (2001)에서 설명되고 검토된다. 일반적으로, 안티센스 핵산 분자는 유전자에 의해 발현되는 mRNA의 영역에 상보적이도록 설계되어, 상기 안티센스 분자가 mRNA에 혼성화되고, 따라서, 상기 mRNA의 단백질로의 번역을 차단한다. 절단제(cleaver) 및 차단제(blocker)를 포함한, 여러 종류의 안티센스 올리고뉴클레오티드가 본 발명이 속하는 기술 분야의 당업자에게 알려져 있다. 전자, 즉, 절단제는 표적 RNA 부위에 결합하고, 상기 표적 RNA를 절단하는, 세포내 뉴클레아제(예를 들면, RnaseH 또는 Rnase L)를 활성화시킨다. 차단제는 표적 RNA에 결합하고, 리보좀의 입체 장애(steric hindrance)에 의해 단백질 번역을 저해한다. 차단제의 예는 핵산, 모르폴리노 화합물, LNA(locked nucleic acid) 및 메틸포스포네이트를 포함한다(Thompson, Drug Discovery Today, 7:912-917 (2002)). 안티센스 올리고뉴클레오티드는 직접적으로 치료제로서 유용하고, 또한 예를 들면, 유전자 넉-아웃(knock-out) 또는 유전자 넉-다운 실험에 의해, 유전자 기능을 결정하고 검증하기 위해 유용하다. 안티센스 기술은 Lavery et al., Curr. Opin. Drug Discov. Devel. 6:561-569 (2003), Stephens et al., Curr. Opin. Mol. Ther. 5:118-122 (2003), Kurreck, Eur. J. Biochem. 270:1628-44 (2003), Dias et al., Mol. Cancer Ter. 1:347-55 (2002), Chen, Methods Mol. Med. 75:621-636 (2003), Wang et al., Curr. Cancer Drug Targets 1:177-96 (2001), 및 Bennett, Antisense Nucleic Acid Drug.Dev. 12:215-24 (2002)에 더 설명된다.
본 명세서에 기재된 변이는 특정한 변이에 특이적인 안티센스 시약의 선택 및 설계를 위해 이용될 수 있다. 본 명세서에 기재된 변이에 대한 정보를 이용하여, 하나 이상의 본 발명의 변이를 포함하는 표적 mRNA를 특이적으로 표적화하는 안티센스 올리고뉴클레오티드 또는 다른 안티센스 분자들이 설계될 수 있다. 이 방식으로, 본 발명의 하나 이상의 변이(마커 및/또는 일배체형)를 포함하는 mRNA 분자의 발현이 저해되거나 또는 차단될 수 있다. 일 구체예에서, 안티센스 분자는 표적 핵산의 특정한 대립인자 형태(즉, 하나 또는 수개의 변이(대립인자 및/또는 일배체형))에 특이적으로 결합하여, 이 특정한 대립인자 또는 일배체형으로부터 기원된 산물의 번역을 저해하나, 상기 표적 핵산 분자의 특정한 다형성 부위에서 다른 변이 또는 대안적인 변이에는 결합하지 않도록 설계된다.
안티센스 분자는 유전자 발현을 저해하고, 따라서, 단백질 발현을 저해하기 위해 mRNA를 불활성화시키기 위해 이용될 수 있기 때문에, 안티센스 분자는 유방암을 치료하기 위해 이용될 수 있다. 방법은 mRNA가 번역되는 능력을 약화시키는, mRNA의 하나 이상의 영역에 상보적인 뉴클레오티드 서열을 포함하는 리보자임(ribozyme)에 의한 절단을 포함할 수 있다. 그와 같은 mRNA 영역은 예를 들면, 단백질-코딩 영역, 특히, 촉매 활성, 기질 및/또는 리간드 결합 부위, 또는 단백질의 다른 기능성 도메인에 상응하는 단백질-코딩 영역을 포함한다.
C. elegans (Fire et al.,Nature 391:806-11 (1998))에서의 최초의 발견 이후, 지난 10년간 RNA 간섭(RNA interference, RNAi) 현상이 활발하게 연구되었고, 최근년에, 인간 질병의 치료에서 RNAi의 잠재적 용도가 활발히 탐구되고 있다(reviewed in Kim & Rossi, Nature Rev. Genet. 8:173-204 (2007)). 유전자 침묵(gene silencing)으로도 불리는, RNA 간섭(RNAi)은 특정한 유전자를 중지(turn off)시키기 위해 이중-가닥 RNA 분자(dsRNA)를 이용하는 것에 기반한다. 세포에서, 세포질 이중가닥-RNA 분자(dsRNA)는 세포성 복합체(cellular complex)에 의해 작은 간섭 RNA(siRNA)로 가공된다. siRNA는 단백질-RNA 복합체를 표적 mRNA 상의 특정한 부위로 표적화되게 하여, 상기 mRNA의 절단을 초래한다(Thompson, Drug Discovery Today, 7:912-917 (2002)). siRNA 분자들은 통상적으로 길이가 약 20개, 21개, 22개 또는 23개의 뉴클레오티드로 구성된다. 따라서, 본 발명의 일 양태는 분리된 핵산 분자, 및 상기 분자들의 RNA 간섭을 위한 용도, 즉, 작은 간섭 RNA 분자(siRNA)로서의 용도에 관한 것이다. 일 구체예에서, 상기 분리된 핵산 분자는 길이가 18개 내지 26개의 뉴클레오티드로 구성되고, 바람직하게는 19개 내지 25개의 뉴클레오티드로 구성되며, 보다 바람직하게는 20개 내지 24개의 뉴클레오티드로 구성되고, 보다 바람직하게는, 21개, 22개 또는 23개의 뉴클레오티드로 구성된다.
RNAi-매개 유전자 침묵을 위한 또 다른 경로는 세포에서 전구체 miRNA(precursor microRNA, pri-miRNA)를 생성하기 위해 가공되는, 내재적으로 코딩된 일차 마이크로RNA(endogenously encoded micorRNA)(pri-miRNA) 전사체에서 기인한다. 이 miRNA 분자들은 핵으로부터 세포질로 유출되고, 세포질에서 성숙 miRNA 분자(mature miRNA)를 생성하기 위해 가공을 거치고, 상기 miRNA는 mRNA의 3' 비번역 영역(untranslated region, UTR) 내의 표적 부위를 인식하는 것에 의해 번역 저해(translational inhibition)를 주도하고, 뒤이어 P-바디(P-body)를 가공하는 것에 의해 mRNA 분해를 주도한다(reviewed in Kim & Rossi, Nature Rev. Genet. 8:173-204 (2007)).
RNAi의 임상적 적용은 바람직하게는 크기가 약 20 내지 23개의 뉴클레오티드로 구성되고, 바람직하게는 2개의 뉴클레오티드로 구성된 3' 오버랩(overlap)을 갖는 것인 합성 siRNA 듀플렉스의 내포(incorporation)를 포함한다. 유전자 발현의 넉다운은 표적 mRNA에 대한 서열-특이적 설계에 의해 확립된다. 그와 같은 분자의 최적 설계 및 합성을 위한 여러 상업적 사이트들이 본 발명이 속하는 기술 분야의 당업자에게 알려져 있다.
다른 적용들은 보다 긴 siRNA 분자(통상적으로 25 내지 30개의 뉴클레오티드로 구성된 길이, 바람직하게는 약 27개의 뉴클레오티드로 구성된 길이), 및 작은 헤어핀 RNA(small hairpin, sh RAN; 통상적으로 약 29개의 뉴클레오티드로 구성된 길이)를 제공한다. 후자는 Amarzguioui et al. (FEBS Lett. 579:5974-81 (2005))에 기재된 바와 같이, 자연적으로 발현된다. 화학적으로 합성된 siRNA 및 shRNA는 인 비보 가공을 위한 기질이며, 일부 경우에, 보다 짧은 설계의 경우보다 더 강력한 유전자 침묵을 제공한다(Kim et al., Nature Biotechnol. 23:222-226 (2005); Siolas et al., Nature Biotechnol. 23:227-231 (2005)). 일반적으로, siRNA의 세포내 농도가 후속 세포 분열에 의해 희석되기 때문에, siRNA는 유전자 발현의 일시적 침묵을 제공한다. 대조적으로, 발현된 shRNA는 shRNA의 전사가 일어나는 동안은, 표적 전사체(target transcript)의 장기적이고 안정적인 넉다운을 매개한다(Marques et al., Nature Biotechnol. 23:559-565 (2006); Brummelkamp et al., Science 296: 550-553 (2002)).
siRNA, miRNA 및 shRNA를 포함하는 RNAi 분자들은 서열-의존적 방식으로 작용하기 때문에, 본 발명의 변이(예를 들면, 표 10, 표 15 및 표 19에 표시된 마커 및 일배체형)는 특정한 대립인자 및/또는 일배체형(예를 들면, 본 명세서에 기재된 마커 및 일배체형)을 포함하는 특이적 핵산 분자를 인식하나, 다른 대립인자 또는 일배체형을 포함하는 핵산 분자는 인식하지 않는 RNAi 시약을 설계하기 위해 이용될 수 있다. 따라서, 이 RNAi 시약은 표적 핵산 분자를 인식하고 파괴시킬 수 있다. 안티센스 시약의 경우와 같이, RNAi 시약은 치료제로서(즉, 질병-연관 유전자 또는 질병-연관 유전자 변이의 중지(turnoff)를 위해) 유용할 수 있으나, 또한 유전자 기능을 규명하고 검증하기 위해 유용할 수 있다(예를 들면, 유전자 넉-아웃 또는 유전자 넉-다운 실험에 의해).
RNAi의 전달은 본 발명이 속하는 기술 분야에서 당업자에게 알려진 다양한 방법에 의해 수행될 수 있다. 비-바이러스 전달(non-viral delivery)을 이용하는 방법은 콜레스테롤, 안정한 핵산-지질 입자(stable nucleic acid-lipid particle, SNALP), 중쇄 항체 단편(Fab), 앱타머(aptamer) 및 나노입자를 포함한다. 바이러스에 의한 전달 방법(viral delivery method)은 렌티바이러스, 아데노바이러스 및 아데노-연관 바이러스(adeno-associated virus)의 이용을 포함한다. 일부 구체예에서, siRNA 분자는 그들의 안정성을 증가시키기 위해 화학적으로 변형된다. 이는 2'-O-메틸푸린 및 2'-플루오로푸린을 포함한, 리보오스의 2' 위치에서의 변형을 포함하고, 이 변형들은 Rnase 활성에 대한 내성을 제공한다. 다른 화학적 변형이 가능하며 본 발명이 속하는 기술 분야의 당업자에게 알려져 있다.
하기의 참조문헌들이 RNAi, 및 RNAi를 이용한 특정한 유전자의 표적화 가능성의 추가적인 요약을 제공한다: Kim & Rossi, Nat. Rev. Genet. 8:173-184 (2007), Chen & Rajewsky, Nat. Rev. Genet. 8: 93-103 (2007), Reynolds, et al., Nat. Biotechnol. 22:326-330 (2004), Chi et al., Proc. Natl. Acad. Sci. USA 100:6343-6346 (2003), Vickers et al., J. Biol. Chem. 278:7108-7118 (2003), Agami, Curr. Opin. Chem. Biol. 6:829-834 (2002), Lavery, et al., Curr. Opin. Drug Discov. Devel. 6:561-569 (2003), Shi, Trends Genet. 19:9-12 (2003), Shuey et al., Drug Discov. Today 7:1040-46 (2002), McManus et al., Nat. Rev. Genet. 3:737-747 (2002), Xia et al., Nat. Biotechnol. 20:1006-10 (2002), Plasterk et al., curr. Opin. Genet. Dev. 10:562-7 (2000), Bosher et al., Nat. Cell Biol. 2:E31-6 (2000), 및 Hunter, Curr. Biol. 9:R440-442 (1999).
유방암의 발병에 대한 증가된 소인(predispotion) 또는 위험도를 초래하는 유전적 결함, 또는 유방암을 유발하는 결함이 유전적 결함을 갖는 개체에게 상기 유전적 결함의 부위에 정상/야생형 뉴클레오티드를 공급하는 복구 서열(repair sequence)을 내포하는 핵산 단편을 투여하는 것에 의해 영구적으로 정정될 수 있다. 그와 같은 부위-특이적 복구 서열은 개체의 게놈 DNA의 내재적 복구를 촉진하기 위해 작용하는 RNA/DNA 올리고뉴클레오티드를 포함(concompass)할 수 있다. 복구 서열의 투여는 음이온성 리포좀 내에 캡슐화된, 폴리에틸렌이민과의 복합체, 아데노바이러스 벡터와 같은 바이러스 벡터 또는 투여되는 핵산의 세포내 흡수를 촉진하기에 적합한 다른 약제학적 조성물과 같은, 적합한 비히클에 의해 수행될 수 있다. 그 후, 키메라 올리고뉴클레오티드가 개체의 게놈으로 정상적인 서열의 내포를 유도하여, 정상/야생형 유전자 산물의 발현을 유도하기 때문에, 유전적 결함이 극복될 수 있다. 상기 교체(replacement)가 유전되고, 따라서, 질환 또는 상태와 연관된 증상의 영구적인 치유 및 경감을 가능하게 한다.
본 발명은 유방암을 치료 및/또는 예방하기 위해 이용될 수 있는 화합물 또는 작용제를 확인(식별, identify)하는 방법을 제공한다. 따라서, 본 발명의 변이는 치료제의 확인 및/또는 개발을 위한 표적으로 유용하다. 특정한 구체예에서, 그와 같은 방법은 작용제 또는 화합물이 본 발명의 하나 이상의 변이(마커 및/또는 일배체형)를 포함하는 핵산, STEAP3/TSAP6 유전자, LOC643714 유전자, 및/또는 TNRC9 유전자 중 하나 이상, 또는 상기 핵산의 코딩된 산물의 활성 및/또는 발현을 조절하는 능력을 분석하는 단계를 포함할 수 있다. 이는 또한 코딩된 핵산 산물의 원치않는 활성 또는 발현을 저해 또는 변화시키는 작용제 또는 화합물을 확인하기 위해 이용될 수 있다. 그와 같은 실험을 수행하기 위한 분석법은 당업자에게 공지된 바와 같이, 세포-기반 시스템 또는 세포-불포함 시스템(cell-free system)에서 수행될 수 있다. 세포-기반 시스템은 본래 목적 핵산 분자를 발현하는 세포, 또는 특정한 원하는 핵산 분자를 발현하도록 유전적으로 변형된 재조합 세포를 포함한다.
환자에서 변이 유전자 발현이 변이-함유 핵산 서열의 발현(예를 들면, 하나 이상의 변이를 함유하는 RNA로 전사되고, 뒤이어 단백질로 번역될 수 있는, 본 발명의 하나 이상의 변이를 포함하는 유전자), 또는 정상적인 전사체의 발현 수준 또는 패턴에 영향을 미치는 변이, 예를 들면, 유전자의 조절 또는 제어 영역의 변이에 따른, 정상/야생형 핵산 서열의 변화된 발현에 의해 평가될 수 있다. 유전자 발현에 대한 분석법은 직접적인 핵산 분석법(mRNA), 발현된 단백질 수준에 대한 분석법, 또는 경로, 예를 들면, 신호 경로(signal pathway)에 관여된 부수적(collateral) 화합물의 분석을 포함한다. 또한, 신호 경로에 대응하여 상향-조절 또는 하향-조절되는 유전자의 발현이 분석될 수 있다. 일 구체예는 루시페라아제와 같은 리포터 유전자를 목적 유전자의 조절 영역에 작동가능하게 연결하는 단계를 포함한다.
일 구체예에서, 세포가 후보 화합물 또는 작용제와 접촉되고, mRAN의 발현이 결정되는 경우, 유전자 발현의 조절제(modulator)가 확인될 수 있다. 후보 화합물 또는 작용제의 존재 하의 mRNA의 발현 수준이 상기 화합물 또는 작용제의 부재 하의 발현 수준에 비교될 수 있다. 이 비교에 근거하여, 유방암을 치료 및/또는 예방하기 위한 후보 화합물 또는 작용제가 변이 유전자의 유전자 발현을 조절하는 화합물 또는 작용제로 확인될 수 있다. mRNA의 발현 또는 코딩된 단백질이 후보 화합물 또는 작용제의 부재시보다 존재 시에 통계적으로 유의성 있게 더 높은 경우, 상기 후보 화합물 또는 작용제는 상기 핵산의 발현의 촉진제 또는 상향-조절제(up-regulator)로 확인된다. 핵산 발현 또는 단백질 수준이 후보 화합물 또는 작용제의 부재시 보다 존재 시에 통계적으로 유의성 있게 더 낮은 경우, 상기 후보 화합물은 상기 핵산의 발현의 저해제 또는 하향-조절제(down-regulator)로 확인된다.
본 발명은 또한 약물(화합물 및/또는 작용제) 스크리닝을 통해 확인된 화합물을 유전자 조절제(즉, 유전자 발현의 촉진제 및/또는 저해제)로 이용한 치료 방법을 제공한다.
치료제에 대한 반응의 확률을 평가하는 방법, 치료의 진행을 모니터링하는 방법 및 유방암의 치료 방법
본 발명이 속하는 기술 분야에서 공지된 바와 같이, 개체들은 특정한 치료(예를 들면, 본 명세서에서 더 설명되는, 치료제 또는 치료 방법)에 대해 차등적 반응을 가질 수 있다. 차등적 반응의 근거는 부분적으로 유전학적으로 결정될 수 있다. 약물유전학(Pharmacogenomics)은 유전적 변이(예를 들면, 본 발명의 변이(마커 및/또는 일배체형))가 변화된 약물 소인(drug disposition) 및/또는 약물의 비정상적인 또는 변화된 작용 때문에, 약물 반응에 어떻게 영향을 미치는지의 문제를 다룬다. 따라서, 차등적 반응의 근거(basis)가 부분적으로 유전학적으로 결정될 수 있다. 약물 반응에 영향을 미치는 유전적 변이에 따른 임상적 결과는 일부 개체(본 발명의 유전적 변이의 보인자 또는 비-보인자)에서 약물의 독성, 또는 약물의 치료적 실패(therapeutic failure)를 초래할 수 있다. 따라서, 본 발명의 변이는 치료제 및/또는 방법이 신체에 대해 작용하는 방식, 또는 신체가 치료제를 대사하는 방식을 결정할 수 있다.
따라서, 일 구체예에서, 본 명세서에 기재된 다형성 부위에서 특정한 대립인자 또는 일배체형의 존재는 특정한 치료 방식(treatment modality)에 대한 상이한 반응,을 나타낸다. 이는 유방암으로 진단되고, 본 발명의 다형성 부위에 특정한 대립인자 또는 일배체형(예를 들면, 본 발명의 위험 대립인자 및/또는 일배체형)을 갖는 환자가 유방암을 치료하기 위해 이용된 특정한 치료제, 약물 및/또는 다른 치료법에 대해 보다 유리하게 또는 보다 불리하게 반응할 것이라는 것을 의미한다. 따라서, 상기 마커 대립인자 또는 일배체형의 존재 또는 부재는 환자에 대해 어떤 치료가 이용되어야 하는지를 결정하는데 도움이 될 수 있다. 예를 들면, 새로 진단된 환자의 경우, 본 발명의 마커 또는 일배체형의 존재가 (예를 들면, 본 명세서에 기재된 바와 같이, 게놈 DNA를 포함하는 혈액 시료 또는 기타 시료로부터 유래된 DNA의 테스트를 통해) 평가될 수 있다. 환자가 마커 대립인자 또는 일배체형에 대해 양성인 경우(즉, 마커의 하나 이상의 특정한 대립인자 또는 일배체형이 존재하는 경우), 의사는 하나의 특정한 치료(예를 들면, 하나의 특정한 치료제 또는 치료제의 조합)를 권고하고, 환자가 마커의 상기 하나 이상의 대립인자 또는 일배체형에 대해 음성인 경우, 다른 코스의 치료(즉각적인 치료가 아닌, 질병의 진행에 대한 지속적인 모니터링이 수행될 것을 권고하는 것을 포함할 수 있음)가 권고될 수 있다. 따라서, 환자의 보인자 상태가 특정한 치료 방식이 적용되어야 하는지 여부를 결정하는 것을 보조하기 위해 이용될 수 있다. 그 가치는 질병을 조기에 진단하고, 임상의에게 가장 적합한 치료를 적용할 수 있도록 질병의 예후/공격성에 대한 정보를 제공할 수 있다는 가능성에 있다.
본 명세서에서 더 설명되는 바와 같이, 현재 유방암의 임상적인 예방 옵션은 주로 화학적 예방(화학요법 또는 호르몬 요법) 및 예방적 수술이다. 가장 일반적인 화학적 예방제는 타목시펜 및 랄록시펜이다; 다른 옵션은 아로마타아제 저해제를 포함한다. 치료 옵션은 또한 방사선 요법을 포함하고, 방사선 요법의 경우, 일부 환자들이 심각한 증상을 경험한다. 본 명세서에 기재된, 본 발명의 마커들은 이 치료 옵션에 대한 반응을 평가하기 위해 또는 이 치료 옵션들 중 하나를 이용한 치료법의 진행을 예측하기 위해 이용될 수 있다. 따라서, 개체의 유전적 상태(genetic status)에 기반하여 적합한 치료 전략을 선택하기 위해 유전적 프로파일링이 이용될 수 있거나, 또는 특정한 치료 옵션의 결과를 예측하기 위해 유전적 프로파일링이 이용될 수 있어서, 치료 옵션 또는 이용가능한 치료 옵션의 조합의 전략적 선택에서 유용할 수 있다.
본 발명은 또한 유방암에 대한 치료의 진행 또는 효과를 모니터링하는 방법에 관한 것이다. 이는 본 발명의 마커 및 일배체형의 유전형 및/또는 일배체형 상태에 근거하여 수행되며, 즉, 본 명세서에 개시된 하나 이상의 다형성 마커의 하나 이상의 대립인자의 부재 또는 존재를 평가하거나, 또는 본 발명의 변이(마커 및 일배체형)와 연관된 유전자의 발현을 모니터링하는 것에 의해 수행될 수 있다. 조직 시료(예를 들면, 말초 혈액 시료, 또는 생검 시료)에서 위험 유전자 mRNA 또는 코딩된 폴리펩티드가 측정될 수 있다. 따라서, 치료 효과를 모니터링하기 위해 발현 수준 및/또는 mRNA 수준이 치료 전 및 치료 동안 측정될 수 있다. 대안적으로 또는 동시에, 치료 효과를 모니터링하기 위해 본 명세서에 개시된 유방암에 대한 하나 이상의 위험 변이의 유전형 및/또는 일배체형 상태가 치료 전 및 치료 동안 측정될 수 있다.
대안적으로, 본 발명의 마커 및 일배체형과 관련된 생물학적 네트워크 또는 대사 경로는 mRNA 및/또는 폴리펩티드 수준을 결정하는 것에 의해 모니터링될 수 있다. 이는 예를 들면, 치료 전과 치료 동안 채취된 시료에서, 상기 네트워크 및/또는 경로에 속하는 여러 유전자들의 발현 수준 또는 폴리펩티드를 모니터링하는 것에 의해 수행될 수 있다. 대안적으로, 상기 생물학적 네트워크 또는 대사 경로에 속하는 대사산물은 치료 전 및 치료 동안 결정될 수 있다. 치료의 효과는 건강한 개체로부터의 상응하는 데이터 대비, 치료 동안 발현 수준/대사산물 수준의 관찰된 변화를 비교하는 것에 의해 결정된다.
또 다른 양태에서, 본 발명의 마커는 임상 시험의 검정력(power) 및 효과를 증가시키기 위해 이용될 수 있다. 따라서, 본 발명의 위험 변이의 보인자인 개체, 즉, 유방암을 발병할 증가된 위험도를 부여하는 하나 이상의 다형성 마커의 하나 이상의 대립인자의 보인자인 개체가 특정한 치료 방식(treatment modality)에 반응할 가능성이 더 높을 수 있다. 일 구체에에서, 특정한 치료(예를 들면, 소형 분자 약물)가 표적화하는 경로 및/또는 대사 네트워크 내의 유전자에 대한 위험 변이를 갖는 개체는 상기 치료에 대해 반응을 보일 가능성이 더 높다. 또 다른 구체예에서, 그 발현 및/또는 기능이 위험 변이에 의해 변화되는 것인 유전자에 대한 위험 변이를 갖는 개체는 상기 유전자, 그의 발현 또는 그의 유전자 산물을 표적화하는 치료 방식에 반응할 가능성이 더 높다.
또 다른 양태에서, 본 발명의 마커 및 일배체형은 특정한 개인을 위한 약제학적 작용제의 선택을 표적화하기 위해 이용될 수 있다. 치료 방식의 맞춤화된 선택(personalized seleciton), 생활방식 변화(예를 들면, 식단의 변화, 운동, 체중 감량 프로그램, 금연, 스트레스를 저하시킨 생활방식 등) 또는 상기 두가지의 조합이 본 발명의 위험 변이의 이용에 의해 실현될 수 있다. 따라서, 본 발명의 특정한 마커에 대한 개체의 상태의 지식은 본 발명의 위험 변이에 의해 영향받은 유전자 또는 유전자 산물을 표적화하는 치료 옵션의 선택을 위해 유용할 수 있다. 변이의 특정한 조합이 하나의 치료 옵션의 선택을 위해 적합할 수 있고, 다른 유전자 변이 조합은 다른 치료 옵션을 표적화할 수 있다. 그와 같은 변이의 조합은 임상적으로 신뢰성있는 정확도로 치료 모듈의 선택을 결정하기 위해 필요한 경우, 하나의 변이, 두개의 변이, 세개의 변이, 또는 네개 또는 그 이상의 변이를 포함할 수 있다.
컴퓨터-구현 양태(Computer-implemented aspects)
본 발명은 또한 본 명세서에서 유방암과 연관된 것으로 기재된 다형성 마커 및 일배체형의 컴퓨터-구현 응용(computer-implemented applicatoin)에 관한 것이다. 그와 같은 응용은 본 명세서에 기재된 바와 같이, 본 발명의 방법에서 유용한 유전형 데이터를 저장, 처리(manipulate)하거나 또는 분석하기 위해 유용할 수 있다. 하나의 예는 개인으로부터 유래된 유전형 정보를 판독가능한 매체(readable media) 상에 저장하여, 제3자(예를 들면, 개인)에게 유전형 정보를 제공할 수 있거나, 또는 유전형 데이터로부터 정보를 수득하기 위해, 예를 들면, 상기 유전형 데이터를 유방암에 대한 증가된 감수성에 기여하는 유전적 위험 인자에 대한 정보에 비교하고, 그와 같은 비교에 근거한 결과를 보고하는 것에 관한 것이다.
하나의 그와 같은 양태는 컴퓨터-판독가능한 매체(computer-readable media)에 관한 것이다. 일반적으로, 그와 같은 매체는 (i) 하나 이상의 다형성 마커 또는 일배체형에 대한 식별자(identifier) 정보; (ii) 유방암을 갖는 개체에서, 상기 하나 이상의 마커의 하나 이상의 대립인자의 빈도, 또는 일배체형의 빈도의 지표(indicator); 및 기준 집단(reference population)에서 상기 하나 이상의 마커의 하나 이상의 대립인자의 빈도, 또는 일배체형의 빈도의 지표를 저장하는 능력을 갖는다. 기준 집단은 질병-불포함(disease-free) 개인의 집단일 수 있다. 대안적으로, 기준 집단은 일반적인 집단으로부터의 랜덤 표본이고, 따라서, 전반적으로 상기 집단을 대표한다. 빈도 지표는 계산된 빈도, 대립인자 및/또는 일배체형 카피의 계수(count), 또는 특정한 매체를 위해 적합한 실제 빈도의 정규화된(normalized) 또는 달리 처리된(manipulated) 값일 수 있다.
선조 정보(ancestry informaton), 성별, 신체적 특성 또는 특징(신장 및 체중 포함)에 대한 정보, 생화학적 측정값, 치료 적용, 치료 결과, 투약, 또는 특정한 개인의 유전형 상태에 관하여 저장 또는 처리되는 것이 바람직한 다른 유용한 정보와 같은, 개인에 대한 추가적인 정보가 상기 매체에 저장될 수 있다.
본 발명은 또한 개인에서 유방암에 대한 감수성을 결정하기 위해 유용한 유전적 데이터의 결정 또는 처리를 위해 적합한 장치에 관한 것이다. 그와 같은 장치는 컴퓨터-판독가능한 메모리, 컴퓨터-판독가능한 메모리 상에 저장된 데이터를 처리하기 위한 루틴(routine), 및 유전적 데이터의 척도를 포함한 결과물(output)을 생성하기 위한 루틴을 포함할 수 있다. 그와 같은 척도는 대립인자 빈도 또는 일배체형 빈도, 유전형 계수(genotype count), 성별, 연령, 표현형 정보, 오즈비(OR) 값 또는 상대적 위험도(RR), 집단 귀속 위험도(PAR), 또는 본래의 유전형 데이터의 직접적인 통계값이거나 또는 유전적 데이터에 근거한 계산에 기반한 다른 유용한 정보를 포함할 수 있다.
특정한 구체예에서, 본 명세서에서 유방암의 증가된 감수성(예를 들면, 증가된 위험도)과 연관된 것으로 확인된 마커들 및 일배체형들은 유전형 데이터의 해석 및/또는 분석을 위해 유용하다. 따라서, 특정한 구체예에서, 본 명세서에서 입증된 바와 같은, 유방암에 대한 위험 대립인자, 또는 위험 일배체형, 또는 본 명세서에서 유방암과 연관된 것으로 입증된 마커들 및/또는 일배체형 중 하나와 LD인 다형성 마커의 대립인자 또는 일배체형의 확인은 해당 유전형 데이터가 기원한 개체가 유방암의 증가된 위험을 갖는다는 것을 나타낸다. 하나의 그와 같은 구체예에서, 유전형 데이터는 본 명세서에서 유방암과 연관된 것으로 확인된 하나 이상의 다형성 마커, 또는 이들과 연관 불균형인 마커에 대해 생성된다. 유전형 데이터는 뒤이어 질병(예를 들면, 유방암)에 대한 위험 척도의 형태(예를 들면, 절대 위험도(AR), 위험도 비(risk ratio, RR), 또는 오즈비(odds ratio, OR))인 유전형 데이터의 해석과 함께, 해당 데이터가 기원한 개체에게 예를 들면, 인터넷을 통해 접근가능한 사용자 인터페이스를 통해 이용가능하다. 또 다른 구체예에서, 개체로부터 유래된 유전형 데이터세트에서 확인된 위험 마커가 평가되고 상기 데이터세트에서 그와 같은 위험 변이의 존재에 의해 부여된 위험도의 평가로부터의 결과가, 예를 들면, 안전한 웹 인터페이스를 통해, 또는 다른 통신 수단에 의해 상기 개체에게 이용가능하다. 그와 같은 위험도 평가의 결과가 수치 형태(예를 들면, 절대 위험도, 상대적 위험도 및/또는 오즈비와 같은 위험도 값, 또는 기준 대비 위험도의 백분율 증가), 그래프 수단에 의해, 또는 해당 유전형 데이터가 유래된 개체에 대한 위험도를 보여주기에 적합한 다른 수단에 의해 보고될 수 있다. 특정한 구체예에서, 위험도 평가의 결과가 제3자, 예를 들면, 의사, 기타 의료인 또는 유전 상담가에게 이용가능하다.
본 발명의 다양한 양태에서 유용한 마커
전술된 방법 및 응용은 모두 본 명세서에서 유방암에 대한 감수성을 평가하기 위해 유용한 것으로 일반적인 용어로 보다 상세하게 설명된 본 발명의 마커 및 일배체형에 의해 실시될 수 있다. 따라서, 이 응용은 일반적으로 표 10, 15, 19, 20, 21 및 22 중 하나에 표시된 마커들, 및 이들과 연관 불균형인 마커들을 이용하여 실시될 수 있다. 특정한 구체예에서, 상기 마커 또는 일배체형은 서열번호 4, 서열번호 5 또는 서열번호 6에 표시된 서열의 게놈 세그먼트 내에 존재한다. 일부 구체예에서, 상기 마커는 rs4848543 LD 블럭, rs13387042 LD 블럭 또는 rs3803662 LD 블럭 내에 존재한다. 특정한 구체예에서, 상기 마커들은 표 10에 표시된 마커들로부터 선택된다. 다른 구체예에서, 상기 마커들은 표 15에 표시된 마커들로부터 선택된다. 다른 구체예에서, 상기 마커들은 표 19에 표시된 마커들로부터 선택된다. 일부 구체예에서, 상기 마커들은 표 7 및 8에 표시된 마커들로부터 선택된다. 일부 구체예에서, 상기 마커들은 표 14에 표시된 마커들로부터 선택된다. 일부 다른 구체예에서, 상기 마커들은 표 18에 표시된 마커들로부터 선택된다. 다른 구체예에서, 상기 마커들은 선택적으로 이들과 연관 불균형인 마커들을 포함한, rs4848543 (서열번호 1), rs13387042 (서열번호 2), 또는 rs3803662 (서열번호 3) 중 하나이다. 일 구체예에서, 상기 마커들은 rs4848543 (서열번호 1), rs13387042 (서열번호 2), 및 rs3803662 (서열번호 3) 중 하나이다. 일부 바람직한 구체예에서, 상기 마커는 rs4848543 (서열번호 1)이다. 다른 바람직한 구체예에서, 상기 마커는 rs13387042 (서열번호 2)이다. 다른 바람직한 구체예에서, 상기 마커는 rs3803662 (서열번호 3)이다. 특정한 구체예에서, 연관 불균형은 0.2보다 큰 r2의 수치값에 의해 정의된다. 또 다른 구체예에서, 상기 마커 또는 일배체형은 rs4848543 대립인자 A, rs13387042 대립인자 A, 및 rs3803662 대립인자 T로부터 선택된 하나 이상의 마커를 포함한다.
핵산 및 폴리펩티드
본 명세서에 기재된 핵산 및 폴리펩티드는 본 발명의 방법 및 키트에서 이용될 수 있다. 본 명세서에서 사용된, "분리된(isolated)" 핵산 분자는 (게놈 서열에서와 같이) 정상적으로 유전자 또는 뉴클레오티드 서열을 둘러싸는(flank) 핵산으로부터 분리되고 및/또는 (예를 들면, RNA 라이브러리에서와 같이) 다른 전사된 서열들로부터 완전하게 또는 부분적으로 정제된 핵산이다. 예를 들면, 본 발명의 분리된 핵산은 핵산이 원래 존재하는 복잡한 세포 매질(cellular milieu), 또는 재조합 기법에 의해 생성되는 경우 배양 배지, 또는 화학적으로 합성되는 경우, 화학적 전구체 또는 다른 화학물질들에 대해 실질적으로 분리될 수 있다. 일부 경우에, 분리된 물질은 조성(예를 들면, 다른 물질을 포함하는 조 추출물), 완충 시스템 또는 시약 혼합물(reagent mix)의 부분을 형성할 것이다. 다른 상황들에서, 상기 물질은 예를 들면, 폴리아크릴아미드 겔 전기영동(PAGE) 또는 컬럼 크로마토그래피(예를 들면, HPLC)에 의해 결정되는 바와 같이, 필수적인 균질성(essential homogeneity)까지 정제될 수 있다. 본 발명의 분리된 핵산 분자는 존재하는 모든 거대분자 종의 약 50% 이상, 약 80% 이상, 또는 약 90% 이상(몰 기준)을 구성할 수 있다. 게놈 DNA에 대해, 용어 "분리된(isolated)"은 또한 본래 게놈 DNA가 결합되어 있는 염색체로부터 분리된 핵산 분자를 의미한다. 예를 들면, 분리된 핵산 분자는 핵산 분자가 유래된 세포의 게놈 DNA에서 상기 핵산 분자를 플랭킹(flank)하는 뉴클레오티드의 약 250 kb, 200 kb, 150 kb, 100 kb, 75 kb, 50 kb, 25 kb, 10 kb, 5 kb, 4 kb, 3 kb, 2 kb, 1 kb, 0.5 kb 또는 0.1 kb 미만을 포함할 수 있다.
핵산 분자는 다른 코딩 서열 또는 조절 서열에 융합될 수 있고, 여전히 분리된 것으로 고려될 수 있다. 따라서, 벡터 내에 포함된 재조합 DNA는 본 명세서에서 사용된 "분리된"의 정의에 포함된다. 또한, 분리된 핵산 분자는 이종(heterologous) 숙주 세포 또는 이종 개체 내의 재조합 DNA 분자, 및 용액 중의 부분적으로 또는 실질적으로 정제된 DNA 분자를 포함한다. "분리된" 핵산 분자는 또한 본 발명의 DNA 분자의 인 비보 및 인 비트로 RNA 전사체를 포함한다. 분리된 핵산 분자 또는 뉴클레오티드 서열은 화학적으로 합성되거나 또는 재조합 수단에 의해 생산된 핵산 분자 또는 뉴클레오티드 서열을 포함할 수 있다. 그와 같은 분리된 뉴클레오티드 서열이 예를 들면, 코딩된 폴리펩티드의 제조에서, 상동성 서열(예를 들면, 다른 포유동물 종으로부터)의 분리를 위해, 유전자 맵핑을 위해(예를 들면, 염색체와의 인 시투 혼성화에 의해), 또는 예를 들면, 노던 블롯 분석 또는 기타 혼성화 기법과 같은 조직 (예를 들면, 인간 조직) 중의 유전자의 발현을 검출하기 위해, 프로브로서 유용하다.
본 발명은 또한 높은 엄격성(stringency)의 혼성화 조건, 예를 들면, 선택적 혼성화를 위한 조건 하에, 본 명세서에 기재된 뉴클레오티드 서열에 혼성화되는 핵산 분자(예를 들면, 본 명세서에 기재된 일배체형과 연관된 다형성 부위를 포함하는 뉴클레오티드 서열에 특이적으로 혼성화하는 핵산 분자)에 관한 것이다. 그와 같은 핵산 분자는 대립인자-특이적 혼성화 또는 서열-특이적 혼성화(예를 들면, 높은 엄격성(stringency) 조건 하에)에 의해 검출 및/또는 분리될 수 있다. 핵산 혼성화를 위한 엄격성 조건 및 방법은 본 발명이 속하는 기술 분야의 당업자에게 잘 알려져 있다(예를 들면, 전체 교시에 참조에 의해 본 명세서에 포함된 Current Protocols in Molecular Biology, Ausubel, F. et al, John Wiley & Sons, (1998), 및 Kraus, M. and Aaronson, S., Methods Enzymol., 200:546-556 (1991) 참조).
두 개의 뉴클레오티드 서열 또는 아미노산 서열 간의 퍼센트 동일성(percent identity)은 최적의 비교 목적을 위해 서열들을 정렬시키는 것에 의해(예를 들면, 제1 서열의 서열에 갭이 도입될 수 있음) 결정될 수 있다. 상응하는 위치의 뉴클레오티드 또는 아미노산이 비교되고, 두 서열 간의 퍼센트 동일성은 상기 서열들 간에 공유된 동일한 위치의 갯수의 함수이다(즉, % 동일성 = 동일한 위치의 갯수(#)/위치의 총 갯수(#) x 100). 특정한 구체예에서, 비교 목적을 위해 정렬된 서열의 길이는 기준 서열의 길이의 30% 이상, 40% 이상, 50% 이상, 60% 이상, 70% 이상, 80% 이상, 90% 이상, 또는 95% 이상이다. 두 서열의 실제적인 비교는 잘 알려진 방법, 예를 들면, 수학적 알고리즘을 이용하여 달성될 수 있다. 그와 같은 수학적 알고리즘의 비-한정적인 예가 Karlin, S. and Altschul, S., Proc. Natl. Acad. Sci. USA, 90:5873-5877 (1993)에 기재된다. 그와 같은 알고리즘이 Altschul, S. et al., Nucleic Acids Res., 25:3389-3402 (1997)에 기재된 바와 같이, NBLAST 및 XBLAST 프로그램(버전 2.0)에 구현된다. BLAST 및 Gapped BLAST 프로그램을 이용하는 경우, 개별적인 프로그램(예를 들면, NBLAST)의 디폴트 파라미터가 이용될 수 있다. ncbi.nlm.nih.gov에서 월드 와이드 웹의 웹사이트를 참조한다. 일 구체예에서, 서열 비교를 위한 파라미터는 score=100, wordlength=12로 설정되거나, 또는 변할 수 있다(예를 들면, W=5 또는 W=20).
다른 예는 Myers and Miller, CABIOS (1989), Torellis, A. and Robotti, C., Comput. Appl. Biosci. 10:3-5 (1994)에 기재된 ADVANCE and ADAM; 및 Pearson, W. and Lipman, D., Proc. Natl. Acad. Sci. USA, 85:2444-48 (1988)에 기재된 FASTA 알고리즘을 포함한다. 또 다른 구체예에서, 두 개의 아미노산 서열간의 퍼센트 동일성(percent identity)은 GCG 소프트웨어 패키지 (Accelrys, Cambridge, UK) 중의 GAP 프로그램을 이용하여 수득될 수 있다.
본 발명은 또한 표 10, 표 15, 표 19, 표 20, 표 21, 및 표 22에 열거된 다형성 마커들, 및 이들과 연관 불균형인 마커들을 포함하는 뉴클레오티드 서열, 및 STEAP3/TSAP6, LOC643714 및 TNRC9 유전자의 뉴클레오티드 서열, 또는 표 10, 표 15, 표 19, 표 20, 표 21, 및 표 22에 열거된 다형성 마커들을 포함하는 뉴클레오티드 서열의 상보체를 포함하거나, 또는 이들로 구성된 뉴클레오티드 서열, 및 이들과 연관 불균형인 마커들, 및 STEAP3/TSAP6, LOC643714 및 TNRC9 유전자, 또는 이들의 단편의 뉴클레오티드 서열을 포함하거나 이들로 구성된 핵산에 높은 엄격성 조건 하에 혼성화하는 단편 또는 일부를 포함하고, 상기 뉴클레오티드 서열은 본 명세서에 기재된 마커 및 일배체형에 포함된 하나 이상의 다형성 대립인자를 포함하는 것인 분리된 핵산 분자를 제공한다. 본 발명의 핵산 단편은 약 15개 이상, 약 18개 이상, 20개, 23개 또는 25개 이상의 뉴클레오티드로 구성된 길이이고, 30개, 40개, 50개, 100개, 200개, 500개, 1000개, 10,000개 또는 그 이상의 뉴클레오티드로 구성된 길이일 수 있다.
본 발명의 핵산 단편은 본 명세서에 기재된 바와 같은 분석법에서 프로브 또는 프라이머로서 이용된다. "프로브(probe)" 또는 "프라이머(primer)"는 핵산 분자의 상보적 가닥에 염기-특이적 방식으로 혼성화하는 올리고뉴클레오티드이다. DNA 및 RNA 외에, 그와 같은 프로브 및 프라이머는 Nielsen, P. et al., Science 254:1497-1500 (1991)에 기재된 바와 같은 PNA(polypeptide nucleic acid)를 포함한다. 프로브 또는 프라이머는 본 명세서에 기재된 하나 이상의 다형성 마커 또는 하나 이상의 일배체형의 하나 이상의 대립인자, 또는 그의 상보체(complement)를 포함한다. 특정한 구체예에서, 프로브 또는 프라이머는 100개 또는 그 미만의 뉴클레오티드를 포함할 수 있고, 예를 들면, 특정한 구체예에서, 6개 내지 50개의 뉴클레오티드, 또는 예를 들면, 12개 내지 30개의 뉴클레오티드를 포함할 수 있다. 다른 구체예에서, 프로브 또는 프라이머는 연속적인 뉴클레오티드 서열 또는 상기 연속적인 뉴클레오티드 서열의 상보체에 약 70% 이상, 약 80% 이상, 약 85% 이상, 약 90% 이상, 또는 약 95% 이상 동일하다. 또 다른 구체예에서, 프로브 또는 프라이머는 연속적인 뉴클레오티드 서열 또는 상기 연속적인 뉴클레오티드 서열의 상보체에 선택적으로 혼성화될 수 있다. 종종, 프로브 또는 프라이머는 표지, 예를 들면, 방사성동위원소, 형광 표지, 효소 표지, 효소 보조-인자 표지, 자성 표지(magnetic label), 스핀 표지, 에피토프 표지를 더 포함한다.
전술된 바와 같은 본 발명의 핵산 분자는 본 발명이 속하는 기술 분야의 당업자에게 잘 알려진 표준 분자생물학 기법을 이용하여 확인되고 분리될 수 있다. 증폭된 DNA는 표지되고(예를 들면, 방사성 표지되고), 인간 세포로부터 유래된 cDNA 라이브러리를 스크리닝하기 위한 프로브로서 이용될 수 있다. 상기 cDNA는 mRNA로부터 유래되고 적합한 벡터에 담길 수 있다. 상응하는 클론들이 분리되고, 인 비보 절제(in vivo excision)에 따라 DNA가 수득되고, 적합한 분자량의 폴리펩티드를 코딩하는 올바른 해독 프레임을 확인하기 위해 본 발명이 속하는 기술 분야에서 인정되는 방법에 의해 클로닝된 삽입물이 한 방향으로 또는 양 방향으로 서열분석될 수 있다. 이 방법들 또는 유사한 방법들을 이용하여, 폴리펩티드 및 상기 폴리펩티드를 코딩하는 DNA가 분리되고, 서열결정되고, 그 특성이 더 규명될 수 있다.
일반적으로, 본 발명의 단리된 핵산 서열은 서던 겔(Southern gel) 상에서 분자량 마커, 및 관련된 유전자 위치를 맵핑하기 위해 표지된 염색체 마커로 이용될 수 있다. 상기 핵산 서열은 또한 유방암 또는 유방암에 대한 감수성을 확인하기 위해 환자에서 내재적 DNA 서열과 비교하기 위해 이용될 수 있고 관련된 DNA 서열을 혼성화하고 발견하기 위해 또는 시료로부터 공지된 서열을 제거하기 위해(예를 들면, 공통 유전자 제거 혼성화법(subtractive hybridization)) 프로브로서 이용될 수 있다. 핵산 서열은 유전자 지문법(genetic fingerprinting)을 위한 프라이머를 수득하기 위해, 면역화 기법을 이용하여 항-폴리펩티드 항체를 생성하기 위해, 및/또는 항-DNA 항체를 생성시키기거나 또는 면역 반응을 유발하기 위해 항원으로서 이용될 수 있다.
항체
유전자 산물의 하나의 형태에 특이적으로 결합하나, 상기 유전자 산물의 다른 형태에는 결합하지 않는 다중클론 항체 및/또는 단일클론 항체가 또한 제공된다. 변이, 또는 다형성 부위 또는 부위들을 포함하는 기준 유전자 산물의 일부에 결합하는 항체도 제공된다. 본 명세서에서 사용된 용어 "항체(antibody)"는 면역글로불린 분자 및 면역글로불린 분자의 면역학적으로 활성인 부분, 즉, 항원에 특이적으로 결합하는 항원-결합 부위를 포함하는 분자를 의미한다. 본 발명의 폴리펩티드에 특이적으로 결합하는 분자는 폴리펩티드 또는 그의 단편에 결합하나, 자연적으로 상기 폴리펩티드를 포함하는 시료, 예를 들면, 생물학적 시료 중의 다른 분자에는 실질적으로 결합하지 않는 분자이다. 면역글로불린 분자의 면역학적 활성 부분의 예는 펩신과 같은 효소에 의해 항체를 처리하는 것에 의해 생성될 수 있는 F(ab) 및 F(ab')2 단편을 포함한다. 본 발명은 본 발명의 폴리펩티드에 결합하는 다중클론 항체 및 단일클론 항체를 제공한다. 본 명세서에서 사용된, 용어 "단일클론 항체(monoclonal antibody)" 또는 "단일클론 항체 조성물(monoclonal antibody composition)"은 본 발명의 폴리펩티드의 특정한 에피토프와 면역반응할 수 있는 항원 결합 부위의 단 하나의 종만을 포함하는 항체 분자의 집단을 의미한다. 따라서, 단일클론 항체 조성물은 일반적으로 그와 면역반응하는 본 발명의 특정한 폴리펩티드에 대한 단일 결합 친화도를 보인다.
다중클론 항체는 적합한 개체를 원하는 면역원(immunogen), 예를 들면, 본 발명의 폴리펩티드 또는 그의 단편으로 면역화시키는 것에 의해 전술된 바와 같이 제조될 수 있다. 면역화된 개체에서 항체 역가(antibody titer)는 시간의 경과에 대해, 표준 기법, 예를 들면, 고정화된 폴리펩티드를 이용한, ELISA(enzyme linked immunosorbent assay)에 의해 모니터링될 수 있다. 필요한 경우, 폴리펩티드에 대한 항체 분자가 포유동물(예를 들면, 혈액)로부터 분리되고, IgG 분획을 수득하기 위힌 단백질 A 크로마토그래피와 같은, 잘 알려진 기법에 의해 더 정제될 수 있다. 면역화 후 적절한 시점에, 예를 들면, 항체 역가가 최고인 시점에, 항체-생성 세포들이 개체로부터 수득되고, Kohler and Milstein, Nature 256:495-497 (1975)에 의해 최초로 개시된 하이브리도마 기법, 인간 B 세포 하이브리도마 기법(Kozbor et al., Immunol. Today 4: 72 (1983)), EBV-하이브리도마 기법(Cole et al., Monoclonal Antibodies and Cancer Therapy, Alan R. Liss,1985, Inc., pp. 77-96) 또는 트리오마(trioma) 기법과 같은 표준 기법에 의해 단일클론 항체를 제조하기 위해 이용될 수 있다. 하이브리도마를 생성하는 기술이 잘 알려져 있다(일반적으로, Current Protocols in Immunology (1994) Collgan et al., (eds.) John Wiley & Sons, Inc., New York, NY 참조). 요약하면, 불멸 세포주(immortal cell line)(일반적으로, 골수종(myeloma))가 전술된 바와 같이 면역원에 의해 면역화된 포유동물로부터의 림프구(일반적으로, 비장림프구(splenocyte))에 융합되고, 결과물인 하이브리도마 세포의 배양 상층액이 본 발명의 폴리펩티드에 결합하는 단일클론 항체를 생성하는 하이브리도마를 확인하기 위해 스크리닝된다.
림프구와 불멸화된 세포주를 융합시키기 위해 이용되는 다수의 잘 알려진 프로토콜이 본 발명의 폴리펩티드에 대한 단일클론 항체를 생성할 목적으로 적용될 수 있다(예를 들면, Current Protocols in Immunology, supra; Galfre et al., Nature 266:55052 (1977); R.H. Kenneth, in Monoclonal Antibodies: A New Dimension In Biological Analyses, Plenum Publishing Corp., New York, New York (1980); 및 Lerner, Yale J. Biol. Med. 54:387-402 (1981) 참조). 또한, 통상적인 당업자는 역시 유용할, 그와 같은 방법의 다양한 변형이 존재한다는 것을 이해할 것이다.
단일클론 항체-분비 하이브리도마 제조의 대안으로, 본 발명의 폴리펩티드에 대한 단일클론 항체가 상기 폴리펩티드로 재조합 조합적 면역글로불린 라이브러리(recombinant combinatorial immunoglobulin library)(예를 들면, 항체 파아지 표시(phage display) 라이브러리)를 스크리닝하고, 그에 의해 상기 폴리펩티드에 결합하는 면역글로불린 라이브러리 구성물을 분리하는 것에 의해 식별되고 분리될 수 있다. 파아지 표시 라이브러리를 생성하고 스크리닝하기 위한 키트가 상업적으로 이용가능하다(예를 들면, the Pharmacia Recombinant Phage Antibody System, Catalog No. 27-9400-01; 및 Stratagene Surf ZAP™ Phage Display Kit, Catalog No. 240612). 추가적으로, 항체 표시 라이브러리를 생성하고 스크리닝하기 위해 이용할 수 있는 특히 유용한 방법 및 시약의 예를, 예를 들면, 미국특허 제5,223,409호; PCT 공개 WO 92/18619; PCT 공개 WO 91/17271; PCT 공개 WO 92/20791; PCT 공개 WO 92/15679; PCT 공개 WO 93/01288; PCT 공개 WO 92/01047; PCT 공개 WO 92/09690; PCT 공개 WO 90/02809; Fuchs et al., Bio/Technology 9: 1370-1372 (1991); Hay et al., Hum. Antibod. Hybridomas 3:81-85 (1992); Huse et al., Science 246: 1275-1281 (1989); 및 Griffiths et al., EMBO J. 12:725-734 (1993)에서 찾을 수 있다.
추가적으로, 표준 재조합 DNA 기법을 이용하여 제조될 수 있는, 인간 부분 및 비-인간(non-human) 부분을 모두 포함하는, 키메라 단일클론 항체 및 인간화(humanized) 단일클론 항체와 같은 재조합 항체가 본 발명의 범위에 속한다. 그와 같은 키메라 항체 및 인간화 단일클론 항체는 본 발명이 속하는 기술 분야에서 알려진 재조합 DNA 기법에 의해 생산될 수 있다.
일반적으로, 본 발명의 항체(예를 들면, 단일크론 항체)는 친화도 크로마토그래피 또는 면역침전과 같은 표준 기법에 의해 본 발명의 폴리펩티드를 분리하기 위해 이용될 수 있다. 폴리펩티드-특이적 항체는 세포로부터 천연 폴리펩티드 및 숙주 세포에서 발현된 재조합기법에 의해 생산된 폴리펩티드의 정제를 촉진할 수 있다. 또한, 본 발명의 폴리펩티드에 대해 특이적인 항체는 폴리펩티드의 양(abundance) 및 발현 패턴을 평가하기 위해 (예를 들면, 세포 용해액, 세포 상층액, 또는 조직 시료에서) 폴리펩티드를 검출하기 위해 이용될 수 있다. 항체는 임상 테스트 절차의 일부로서, 예를 들면, 주어진 치료 계획(treatment regime)의 효능을 결정하기 위해, 조직에서 단백질 수준을 진단 목적으로 모니터링하기 위해 이용될 수 있다. 그의 검출을 촉진하기 위해 항체는 검출가능한 물질에 결합될 수 있다. 검출가능한 물질의 예는 다양한 효소, 보조 그룹(prosthetic group), 형광 물질, 발광 물질, 생물발광 물질, 및 방사성활성 물질을 포함한다. 적합한 효소의 예는 호스래디쉬 퍼옥시다아제(horseradish peroxidase), 알칼리 포스파타아제, 베타-갈락토시다아제, 또는 아세틸콜린에스테라아제를 포함하고; 적합한 보조 그룹 복합체(prothetic group complex)의 예는 스트렙타비딘/비오틴 및 아비딘/비오틴을 포함하며; 적합한 형광 물질의 예는 움벨리페론(umbelliferone), 플루오레세인(fluorescein), 플루오레세인 이소티오시아네이트, 로다민(rhodamine), 디클로로트리아지닐아민 플루오레세인, 단실 클로라이드(dansyl chloride) 또는 피코에리트린(phycoerythrin)을 포함하고; 발광 물질의 예는 루미놀을 포함하며; 생물발광 물질의 예는 루시페라아제, 루시페린, 및 에쿼린(aequorin)을 포함하고, 및 적합한 방사성활성 물질의 예는 125I, 131I, 35S 또는 3H를 포함한다.
항체는 또한 약물유전학 분석에서 유용할 수 있다. 그와 같은 구체에에서, 본 명세서에 따른 핵산에 의해 코딩되는 변이 단백질에 대한 항체, 예를 들면, 하나 이상의 본 발명의 다형성 마커를 포함하는 핵산에 의해 코딩된 변이 단백질에 대한 항체가 변형된 치료 방식을 필요로 하는 개체를 식별하기 위해 이용될 수 있다.
항체는 또한 질병의 활성 단계(active stage)와 같은 질병 상태에서, 또는 단백질의 기능과 관련된 질병, 특히, 유방암에 대한 소인을 갖는 개인에서 변이 단백질의 발현을 평가하기 위해 유용할 수 있다. 본 명세서에 기재된 하나 이상의 다형성 마커 또는 일배체형을 포함하는 핵산에 의해 코딩된 본 발명의 변이 단백질에 특이적인 항체가 상기 변이 단백질의 존재를 스크리닝하기 위해, 예를 들면, 상기 변이 단백질의 존재에 의해 표시된 바와 같이, 유방암에 대한 소인을 스크리닝하기 위해 이용될 수 있다.
항체는 다른 방법들에서 이용될 수 있다. 따라서, 항체는 전기영동 이동성(electrophoretic mobility), 등전점, 트립신 또는 기타 단백질분해효소에 의한 처리와 함께 본 발명의 변이 단백질과 같은 단백질을 평가하기 위한 진단 도구로서, 또는 본 발명이 속하는 기술 분야의 당업자에게 알려진 다른 물리적 분석법(physical assay)에서 이용하기에 유용하다. 항체는 또한 조직형 검사(tissue typing)에서 이용될 수 있다. 하나의 그와 같은 구체예에서, 특정한 변이 단백질이 특정한 조직형에서의 발현과 상관되며, 상기 변이 단백질에 대한 특이적 항체가 상기 특이적 조직형을 식별하기 위해 이용될 수 있다.
변이 단백질을 포함한, 단백질의 세포내 국재화(subcellular localization) 가 또한 항체를 이용하여 결정될 수 있고, 다양한 조직의 세포에서 단백질의 비정상적인 세포내 국재화를 평가하기 위해 적용될 수 있다. 그와 같은 용도는 유전적 테스트에 적용될 수 있으나, 또한, 특정한 치료 방식을 모니터링하기 위해 적용될 수 있다. 치료가 변이 단백질의 발현 수준 또는 존재, 또는 변이 단백질의 비정상적인 조직 분포 또는 발생에 따른 발현(developmental expression)을 정정하는 것을 목적으로 하는 경우, 상기 변이 단백질 또는 그의 단편에 대해 특이적인 항체가 치료 효능을 모니터링하기 위해 이용될 수 있다.
항체는 또한, 예를 들면, 변이 단백질이 결합 분자 또는 파트너에 결합하는 것을 차단하는 것에 의해 변이 단백질 기능의 저해를 위해 유용하다. 그와 같은 용도는 또한 치료가 변이 단백질의 기능을 저해하는 것을 포함하는 치료적 상황에 적용될 수 있다. 항체는 예를 들면, 결합을 차단하거나 또는 경쟁적으로 저해하여, 그에 의해, 단백질의 활성을 조절(즉, 촉진 또는 길항)하기 위해 이용될 수 있다. 특정한 기능을 위해 요구되는 부위를 포함하는 특정한 단백질 단편에 대한 항체, 또는 세포 또는 세포막과 결합된 완전한 단백질에 대한 항체가 제조될 수 있다. 인 비보 투여를 위해, 항체는 방사성 핵종(radionuclide), 효소, 면역원성 에피토프, 또는 세균성 독소를 포함한 세포독성제(디프테리아 또는 리신(ricin)과 같은 식물 독소)와 같은 추가적인 치료적 유효탑재물(therapeutic payload)과 결합될 수 있다. 항체 또는 그의 단편의 인 비보 반감기는 폴리에틸렌 글리콜로의 접합을 통한 페길화(pegylation)에 의해 증가될 수 있다.
본 발명은 또한 본 명세서에 기재된 방법에서 항체를 사용하기 위한 키트에 관한 것이다. 이는 테스트 시료에서 변이 단백질의 존재를 검출하기 위한 키트를 포함하나, 이에 한정되지 않는다. 하나의 바람직한 구체예는 표지된 또는 표지가능한 항체 및 생물학적 시료에서 변이 단백질을 검출하기 위한 화합물 또는 작용제, 상기 시료 중의 변이 단백질의 양 또는 존재 및/또는 부재를 결정하기 위한 수단, 및 상기 시료 중의 변이 단백질의 양과 표준을 비교하기 위한 수단, 및 키트의 사용 설명서를 포함한다.
이하, 본 발명은 하기의 비-한정적인 실시예에 의해 예시될 것이다.
본 발명의 전술된 것들 및 기타 목적, 특징 및 장점이 하기에 기재된 본 발 명의 바람직한 구체예의 보다 구체적인 설명으로부터 명확할 것이다.
도 1은 본 명세서에서 유방암과 연관된 것으로 확인된 마커 rs4848543을 포함하는 염색체 2 상에 있는 영역의 게놈 구조를 보여준다. rs4848543과 연관 불균형인 마커들도 이 영역 내에서 발견되며, 이 영역은 본 명세서에서 rs4848543 LD 블럭으로도 지칭된다. 상기 영역은 광범위한 연관 불균형(높은 LD)을 특징으로 하고, 그의 경계는 높은 재조합의 영역을 특징으로 한다. 코카서스계 CEU HapMap 집단에서 rs4848543과, 0.2보다 큰 LD 척도 r2의 값에 의해 정의된 연관 불균형인 마커들이 NCBI Build 34의 염색체 2 상에 있는 위치 120,023,583 - 20,117,062 및 NCBI Build 36의 위치 119,644,908 - 119,738,387 bp에 걸친다. 상기 두 개의 서열 Build에서, 이 마커들에 의해 걸쳐진 영역은 93,479 bp이다.
도 2는 마커 rs13387042를 포함하는 염색체 2 상에 있는 영역의 게놈 구조를 보여준다. rs13387042와 연관 불균형인 마커들도 이 영역 내에서 발견되며, 이 영역은 본 명세서에서 rs13387042 LD 블럭으로도 지칭된다. 상기 영역은 광범위한 연관 불균형(높은 LD)을 특징으로 하고, 그의 경계는 높은 재조합의 영역을 특징으로 한다. 코카서스계 CEU HapMap 집단에서 rs13387042와, 0.2보다 큰 LD 척도 r2의 값에 의해 정의된 연관 불균형인 마커들이 NCBI Build 34의 염색체 2 상에 있는 위치 218,059,508 - 218,141,061 및 NCBI Build 36의 위치 217,565,211-217,646,764 bp에 걸친다. 상기 두 개의 서열 Build에서, 이 마커들에 의해 걸쳐진 영역은 81,553 bp이다.
도 3은 마커 rs3803662를 포함하는 염색체 16 상에 있는 영역의 게놈 구조를 보여준다. rs3803662와 연관 불균형인 마커들도 이 영역 내에서 발견되며, 이 영역은 본 명세서에서 rs3803662 LD 블럭으로도 지칭된다. 상기 영역은 광범위한 연관 불균형(높은 LD)을 특징으로 하고, 그의 경계는 높은 재조합의 영역을 특징으로 한다. 코카서스계 CEU HapMap 집단에서 rs3803662와, 0.2보다 큰 LD 척도 r2의 값에 의해 정의된 연관 불균형인 마커들이 NCBI Build 34의 염색체 16 상에 있는 위치 52,314,403 - 52,413,602 및 NCBI Build 36의 위치 51,093,311-51,192,501 bp에 걸친다. 상기 두 개의 서열 Build에서, 이 마커들에 의해 걸쳐진 영역은 99,190 bp이다.
환자 및 대조군 선택: 본 연구의 허가는 아이슬란드의 국가 생명윤리 위원회(the National Bioethics Committee) 및 아이슬란드 데이터 보호국(the Icelandic Data Protection Commission) 에 의해 허여되었다. 유방암 진단의 기록은 아이슬란드 암 등록부(Icelandic Cancer Registry, ICR)로부터 수득하였다. 기록은 1955년 1월 1일부터 2005년 12월 31일까지 아이슬란드에서 침윤성 유방암 및 유관내암(ductal carcinoma in situ) 또는 소엽내암(lobular carcinoma in situ)으로 진단된 모든 케이스를 포함했다. ICR은 이 기간동안 진단된 4603명의 개인의 기록을 포함했다. 모든 생존하는 환자(약 2840명)를 포함하는 유병 코호트(prevalence cohort)는 본 연구로의 동원에 적격이었다. 본 발명자들은 2210명의 환자로부터 고지된 동의, 혈액 시료, 및 임상 정보를 수득했고, 이는 약 78%의 수율이었다. 초기의 대조군은 다른 진행중인 deCODE Genetics 게놈-전체 연관 연구에 참여하고 유방암 환자군의 유전형이 분석될 때까지 Illumina SNP 칩 상에서 유전형이 분석된 모든 개인들을 포함했다. 아이슬란드 암 등록부에 2005년말까지 유방암, 전립선암, 또는 대장암 진단을 나타내는 입력을 갖는 개인들은 대조군으로부터 제외시켜, 4477명의 대조군 세트를 준비했다. 대조군의 독립적인 재현 세트는 상기 4477명의 세트 후에 유전형이 분석된 비-유방암 프로젝트로부터의 추가적인 7406명의 개인들로 구성되었다. 본 발명자들은 대상이 되는 SNP의 빈도가 전립선암 및 대장암 환자군에서 대조군과 상이하지 않다는 것을 나타내는 중간 데이터를 수득했기 때문에, 이 7406명의 세트에서 전립선암 환자 및 대장암 환자를 제외시키지 않았다. 각각의 대조군 세트에서, 하기의 표 8, 9 및 14에 열거된 SNP의 빈도에서 성별 간의 차이는 없었다. 따라서, 이 대조군 그룹들은 조사대상 SNP의 집단 빈도의 적절하게 대표했다.
가계(genealogical) 데이터베이스: deCODE Genetics는 아이슬란드인들의 가계의 전산화된 데이터베이스를 관리한다. 기록은 지난 200년 동안 아이슬란드에서 태어난 거의 모든 개인을 포함하며, 상기 기간에 대해, 약 95%의 동안 부모 관계(parental connection)가 알려져 있다[Sigurdardottir, et al., (2000), Am J Hum Genet, 66, 1599-609]. 또한, 거주지 식별자(residence identifier)의 카운티가 인구통계조사 및 교구 기록에 근거하여, 대부분의 개인에 대해 기록되어 있다. 정보는 생물학적 시료 및 ICR 기록에 대해 사용된 개인 식별자(personal identifier)와 일치하는 암호화된 개인 식별자로 관계 데이터베이스에 저장되어, 본 연구 참여자의 유전형 및 표현형을 그들의 가계와 교차-참조(cross-reference)할 수 있다.
시료 처리: 혈액 시료는 EDTA 중에 -20℃에서 보관하였다. DNA는 Qiagen (http://www.quiagen.com) 추출 컬럼 방법을 이용하여 전혈로부터 분리하였다. DNA는 4℃에서 보관하였다.
유전형분석(genotyping): 그 후, 1600명의 환자 시료의 세트를 무작위로 선택하고 International HapMap 프로젝트의 Phase I으로부터 유래된 317,511개의 SNP를 포함하는 Illumina Infinium Hap300 SNP 비드 마이크로어레이(Illumina, San Diego, CA, USA) 상에서 유전형 분석하였다. 4480명의 암-불포함 대조군 시료를 동일한 플랫폼 상에서 유전형 분석하였다. 상기 칩 상에 있는 전체 SNP 중에서, 170개는 유전형을 생성하지 않았고 추가적인 24개의 SNP는 80% 미만의 수율을 보였다. 추가적인 61개의 SNP는 대조군에서 하디-와인버그 평형(Hardy-Weinberg equilibrium)으로부터 매우 유의성 있는 편향을 보였다(p < 1x10-10). 104개의 SNP는 단형성(monomorphic)이었고, 58개의 SNP는 거의 단형성이었다(즉, 환자와 대조군의 통합된 코호트에서 소수 대립인자 빈도는 0.001 미만이었다). 마지막으로, 5개의 마커는 여러 개의 진행중인 상이한 사내 게놈전체 연관 연구에서 특정한 영역 및 가능한 신호의 조사 후에 유전형분석 문제를 갖는 것으로 판단되었다. 상기 문제를 갖는 SNP는 모두 분석에서 제외시켰다. 따라서, 본문에 제시된 최종 연구는 317,089개의 SNP를 이용했다. 98% 미만의 콜 레이트(call rate)를 갖는 칩도 분석에서 배제시켰다.
본 연구에서 조사된 3개의 주요한 SNP의 서열(sequence context)이 하기에 기재된다:
본 발명자들은 rs4848543 LD 블럭에서 다수의 SNP를 검출하기 위한 분석법을 설계하고 테스트하였다. 이 분석법들은 [Kutyavin, et al., (2006), Nucleic Acids Res, 34, e128]에 개시된 Centaurus SNP 분석 기술에 근거했다. 분석법 및 프라이머는 하기와 같다:
SG02S733
rs895398
(Build 34) chr2:120,058,180
정방향 프라이머: TTGGAACCTCCCACTGCCACA
역방향 프라이머: ACAGCCCAGGTTTCAGGTTGGCAT
VIC-프로브: AGCGACACTG
FAM-프로브: GCGACACCG
인핸서: CCTG*AGATCCAGGCA
SG02S738
rs4848543
(Build 34) chr2:120,061,096
정방향 프라이머: AGGGAGCCCTCGCTTTAAGCATTA
역방향 프라이머: TTTGGGCACATCTAGGAAGACCTC
VIC- 프로브: GAT*CAATACCC
FAM- 프로브: CGAT*CAATACCA
인핸서: TTAATAATTACAGGACATG
SG02S739
rs6759589
(Build 34) chr2:120,064,976
정방향 프라이머: TCAGCAGCCTCTTGTCTCACTAAT
역방향 프라이머: CTTCTTGCCCAGGCAGGACAGA
VIC-프로브: TAGACTGAGCC
FAM-프로브: AAT*AGACTAAGCC
인핸서: CCATCCCCAACTAA
SG02S753
rs895397
(Build 34) chr2:120,072,400
정방향 프라이머: CACTACTAGATCATGGGAGATGCCT
역방향 프라이머: GTTTCCTCAGTTGTAATGTAGACC
VIC-프로브: TT*T*A*ACCCTT
FAM-프로브: GTTTTAACCCCT
인핸서: GCTGCTCGGAAG
SG02S740
rs838102
(Build 34) chr2:120,079,878
정방향 프라이머: GGTTTTGCATCCTTGCTCACTCACAT
역방향 프라이머: GTGCCCTCTGCGTACTTGCGAAT
VIC-프로브: TACTGCCACC
FAM-프로브: CTTACTGCCACT
인핸서: TGTCTCCTCACTC
SG02S741
rs838100
(Build 34) chr2:120,083,710
정방향 프라이머: ACTTACCAACAGCAGGCTGGTG
역방향 프라이머: CCAGAAAGGGTGGCTCACCTCA
VIC-프로브: GTCTGAGGCT
FAM-프로브: GGTCTGAGGTT
인핸서: TCAGGTCACTCG
SG02S734
rs12711924
(Build 34) chr2:120,107,316
정방향 프라이머: AACGCTTATCACAGAGCCAGGTAG
역방향 프라이머: GGAAAACCATGAACACTGTGGCAA
VIC-프로브: CCCGCCGT
FAM-프로브: GCCCGCCAT
인핸서: TTGTCTTTCTTGTGTC
SG02S742
rs3731603
(Build 34) chr2:120,117,062
정방향 프라이머: AACA*CTCTAGGGAGTAAAGCTC
역방향 프라이머: GAGGA*CATTTGGAGTCCCCAAT
VIC-프로브: GACTGTCTTCAA
FAM-프로브: ACTGT*CT*TCAC
인핸서: AAGTCAGTCCTGAG
SG02S728
rs13387042
(Build 34) chr2:218,108,374
정방향 프라이머: CCACTAGTGTGGTGA*AGGAAGATT
역방향 프라이머: GCTACATGA*AGAA*CAGCTAAACC
VIC-프로브: TTTCTGTAGCCT
FAM-프로브: TT*T*CTGTAGCT*T
인핸서: CATTTGCCTTCTTTC
* 는 [Kutyavin, et al., (2006), Nucleic Acids Res, 34, e128]에 기재된 바와 같이, 변형된 염기를 나타낸다.
BRCA2 유전자의 단일 시조(founder) 돌연변이(999del5)는 일반 아이슬란드 집단에서 0.6%-0.8%의 보인자 빈도(carrier frequency)로 존재하고, 여성 유방암 환자에서 7.7%-8.6%의 보인자 빈도로 존재한다[Thorlacius, et al., (1997), Am J Hum Genet, 60, 1079-84; Gudmundsson, et al., (1996), Am J Hum Genet, 58, 749-56]. BRCA2 999del5 돌연변이의 가능한 존재는 DG13S3727로 지정된, 마이크로새틀라이트-타입 PCR 분석법을 이용하여 1499명의 환자에서 결정하였다. 사용된 프라이머는 하기와 같았다:
정방향: TGTGAAAAGCTATTTTTCCAATC
역방향: ATCACGGGTGACAGAGCAA
DG13S3727에 의해 증폭된 서열은 하기와 같다:
DG13S3727 위치=chr13:30703058-30703261
tgtgaaaagctatttttccaatcatgatgaaagtctgaagaaaaatgata
gatttatcgcttctgtgacagacagtgaaaacacaaatcaaagagaagct
gcaagtcatggtaagtcctctgtttagttgaactacaggtttttttgttg
ttgttgttttgattttttttttttgaggtggagtcttgctctgtcacccg
tgat
통계적 방법: 승법(multiplicative) 모델을 가정하여, 본 발명자들은 SNP 대립인자의 상대적 위험도(RR)를 RR=[p/(1-p)]/[s/(1-s)]로 계산하였고, 상기에서 p 및 s는 각각 환자 및 대조군에서 변이의 빈도이다. RR과 연관된 P-값은 표준 가능성 비 카이-스퀘어 통계값(standard likelihood ratio Chi-squared statistic)에 근거하여 계산하였다. 신뢰 구간은 RR의 추정값이 로그-노말(log-normal) 분포를 갖는 것으로 가정하여 계산하였다.
일배체형 빈도는 최대 가능성(maximum likelihood)을 이용하여 추정하고 일반화된 가능성 비 테스트(generalized likelihood ratio test)를 이용하여 케이스와 대조군 간의 차이의 테스트를 수행하였다. NEsted Models을 의미하는 NEMO라 불리는 일배체형 분석 프로그램을 이용하여 모든 일배체형 결과를 계산하였다. 상태(phase) 및 결실된 유전형에 따른 불확실성을 다루기 위해, NEMO는 일배체형 계수(haplotype count)가 EM 알고리즘을 이용하여 먼저 추정되고, 그 후, 추정된 계수를 진정한 계수인 것처럼 다루어 테스트가 수행되고, 종종 문제를 유발할 수 있으며 통계적 유의성을 적절하게 평가하기 위해 랜덤화를 필요로 할 수 있는 것인, 연관 테스트에 대한 일반적인 2-단계 접근방법을 이용하지 않는다는 것을 강조한다. 대신에, NEMO에서는, 최대 가능성 추정값, 가능성 비 및 p-값이 관찰된 데이터로부터 직접 계산되고, 따라서, 상태 및 결실된 유전형에서의 불확실성에 따른 정 보 손실이 가능성 비에 의해 자동적으로 포착된다.
일부 아이슬란드 환자들 및 대조군은 그룹 내 및 그룹 간 모두에서 관계된다. 혈연관계(relatedness)에 대해 연관 결과를 보정하기 위해, 본 발명자들은 아이슬란드 가계를 통해 대립인자를 유전(propagate)시키는 것에 의해 유전형을 시뮬레이션하였다. 각 시뮬레이션을 위해, 본 발명자들은 실제의 유전형에 대한 것과 동일한 방식으로 케이스-대조군 연관 테스트(case-control association test), 즉, 카이-스퀘어 가능성 비 테스트를 수행하였다. 본 발명자들은 N회의 시뮬레이션에 대한 카이-스퀘어 통계값의 평균(상응하는 Z-스코어의 분산과 동일함)을 계산하였고, 상기 값은 귀무 가설(null hypothesis) 하에 독립적인 개인에 대해서 1이어야 하고, 혈연관계의 개인(related individual)에 대해서는 약간 더 클 것으로 예상된다. 그 후, 실제 연관에서의 카이-스퀘어 통계값을 시뮬레이션으로부터 수득된 평균에 의해 나누는 것에 의해 혈연관계에 대한 보정을 적용하였다.
그룹들이 대립인자, 일배체형 및 유전형에 대해 상이한 집단 빈도를 가질 수 있으나, 공통된 상대적 위험도를 갖는 것으로 가정하는 것인 Mantel-Haenszel 모델을 이용하여 복수 개의 케이스-대조군 재현 그룹의 결합 분석을 수행하였다.
모든 P-값은 양측(two-sided) P-값으로 보고된다.
다발성 원발성 유방암의 분석: 다발성 원발성 유방암(MPBC)의 진단 기록을 ICR로부터 수득하였다. 제1 유방암 진단 외에 진단된 원발성 종양들은 임상적으로 및 조직학적으로 반대쪽 유방 또는 같은쪽 유방에서 상기 제1 유방암과 동시에 또 는 그에 뒤이어 발생한 독립적인 원발성 종양으로 확인되었다. 임상적으로 및 조직학적으로 최초 종양의 재발 또는 다발성 단일 원발성 종양(multifocal single primary tumor)으로 분류된 종양들은 배제시켰다. 2005년말까지 ICR 데이터에 2개 이상의 독립적인 원발성 종양의 진단을 갖는 환자들은 MPBC로 간주되었다. 2005년 12월 31일까지 ICR에서 제2의 원발성 종양의 진단을 갖지 않는 환자들은 단일 원발성 유방암(Single Primary Breast Cancer, SPBC)으로 분류하였다. SPBC 대비 MPBC의 위험도는 제1 유방암 진단으로부터 후속 시간(follow up time)까지의 년수를 공변량(covariate)으로 고려하여 로지스틱 회귀(logistic regression)에 의해 결정하였다. NEMO 소프트웨어를 이용한 선형 회귀에 의해 발병 연령 비교를 평가하였다.
가족력 분석: 각각의 영향받은 발단자(affected proband)에 대해, Genealogical Database 및 ICR 기록을 이용하여 가족력 점수(family histroy score)를 부여하였다. Genealogical Database를 참조하여 발단자 주위의 1촌 내지 3촌 친척의 원을 결정하였다. 그 후, 친척들의 질병영향(affection) 상태를 ICR 기록으로부터 결정하였다. 발단자에게 영향받은 1촌 친척 1인당 1점, 영향받은 2촌 친척 1인당 0.5점, 및 영향받은 3촌 친척 1인당 0.25점의 가족력 점수를 부여하였다. 그 후, 각 발단자에 대해 총점을 계산하였다. SNP 마커 유전형과 가족력 점수 간의 잠재적인 관계를 JMP v4 소프트웨어(S.A.S. Institute Inc.) 상에서 Wilcoxon 검정 수행에 의해 테스트하였다.
연관 분석 표현형: 본 발명자들은 연관 분석을 위해 두 개의 관련된 표현형을 이용하였다. 제1 표현형은 유방암으로 진단된 총 1600명의 개인을 포함했다. 이 표현형은 "모든 유방암(All Breast Cancer)"(All BC)로 표시하였다. 제2 표현형은 중간 수준 내지 높은 수준의 소인(predisposition) 특성을 갖는 개인들을 선택하고 "중간 소인(Medium Predisposition)"(MedPre)으로 표시하였다. 이 표현형의 정의는 발단자가 하기 기준 중 하나를 충족시킬 것을 요구했다:
1. 시발자는 3M(meiotic event)의 유전적 거리 내에 3명 이상의 영향받은(affected) 친척을 포함하는 유방암 케이스의 클러스터의 구성원이다.
2. 시발자는 3M 내의 혈연관계의 영향받은 쌍 중 일 구성원이고, 상기 쌍 중 1인은 50세 이전에 진단받았다.
3. 시발자는 3M 내의 혈연관계의 영향받은 쌍 중 일 구성원이고, 상기 쌍 중 1인은 임의의 종류의 2차 원발성 종양을 진단받았다.
4. 시발자는 임의의 종류의 원발성 종양을 진단받았다.
Illumina Hap300 칩 상에서 분석된 1600명의 환자들 중에서, 653명이 MedPre 기준을 충족시켰다(40.8%).
결과
섹션 1: 염색체 2q14.2 상의 rs4848543
rs4848543 대립인자 A는 유방암에 대한 증가된 위험도와 연관된다:
게놈 전체 연관 분석은 rs4848543 대립인자 A가 MedPre 유방암과 연관된다는 것을 보여주었다. 이 SNP에 대한 Illumina 칩 데이터는 1598명의 환자(그 중 653명은 MedPre 표현형 기준을 충족시킴) 및 4477명의 암-불포함(cancer-free) 대조군으로부터 수득하였다. MedPre 유방암과 연관된 rs4848543 대립인자 A에 대한 RR 추정값은 케이스 및 대조군에서 개인들간의 혈연관계에 대해 보정된 경우, 1.42였고, P-값은 8.3x10-8이었다(표 1). 테스트된 317,089개의 SNP에 대한 Bonferroni 보정 후에, 전체 보정된 P-값은 0.026이었다. rs4848543의 A 대립인자는 또한 1.16의 상대적 위험도 추정값으로, AllBC 표현형과 명목적으로 유의성있는(nominally significant) 연관을 보였다(표 1). 아이슬란드 집단으로부터의 독립적인 표본에서 이 결과를 확인하기 위해, 본 발명자들은 rs4848543 SNP에 대해 테스트하기 위해 Centaurus SNP 분석법, SG02S738을 설계하고 검증하였다. SG02S738 분석법을 추가적인 573명의 BC 환자에 대해 수행했고, 이들 중 198명은 MedPre 표현형 정의를 충족시켰다. 이 환자들은 Illumina 칩 또는 SG02S738 분석법을 이용하여 rs4848543에 대해 분석된 7406명의 개인으로 구성된 독립적인 대조군에 대비하여 테스트하였다. 이 제2 그룹에서 MedPre 유방암과 연관된 rs4848543 대립인자 A에 대한 RR 추정값은 1.26(p-값=3.4x10-2)이었다. 따라서, 최초의 발견이 독립적인 아이슬란드 표본에서 명목적 유의성(nominal significance)까지 재현되었다. 최초의 1598명의 환자와 573명의 재현 환자 세트가 통합되고 11883명의 대조군과 비교된 것인 결합 분석(joint analysis)의 결과가 표 1에 표시된다. 상기 결합 분석은 AllBC 표현형에 대한 명목적으로 유의성 있는 위험도를 보이고, MedPre 유방암 표현형에 대해 게놈 -전체적으로 유의성 있는 위험도를 보여주었다. MedPre 유방암에 대한 전체 Bonferroni 보정된 P-값은 0.0095(317,089개의 SNP에 대해 보정됨)였다. AllBC 및 MedPre의 두 개의 표현형의 테스트를 고려해도, 이 값은 게놈-전체적으로 유의했다.
ICR 기록은 1955년부터 시작되기 때문에, 본 발명자들이 동원한 환자들 중 일부는 장기적인 암 생존자였다. rs4848543 대립인자 A 변이를 갖는 환자가 비-보인자와 상이한 장기-생존 확률을 갖는다면, 유병 케이스들 중에서 상기 변이의 빈도가 영향을 받을 수 있다. 이를 조사하기 위해, 본 발명자들은 2000년 1월 1일 이후에 진단받고, 진단으로부터부터 동원까지 5년 미만의 시간을 갖는 833명의 개인들로 구성된 환자의 서브세트를 확인했다. 최근에 진단된 환자들의 이 코호트에서, rs4848543 대립인자 A의 빈도는 0.372945였다. 본 발명자들은 또한 2000년 1월 1일 전에 진단받고 동원시까지 생존한 1338명의 환자들의 그룹을 확인하였다. 이 그룹에서 rs4848543 대립인자 A의 빈도는 0.372749였고, 이는 최근에 진단된 환자들 중의 빈도와 유의성있게 상이하지 않았다(P 값 = 0.99). 따라서, 상이한 생존(survivorship)이 표 1에 표시된 위험도 추정값에 영향을 미쳤다는 강력한 증거는 없다.
본 발명자들은 추가적으로 MedPre 표현형을 갖지 않는 유방암 환자들은 rs4848543 대립인자 A의 증가된 빈도를 보이지 않는다는 것에 주목했다(표 1). 이 관찰의 영향은 하기에서 더 검토된다. 본 발명자들은 rs4848543 대립인자 A와 MedPre 표현형 정의의 다양한 성분들 간의 관계를 조사했다:
rs4848543 대립인자 A는 조기 발병 유방암과 유의성있게 연관되지 않는다:
낮은 진단 연령은 MedPre 표현형의 정의에서 이용되는 기준 중 하나이기 때문에, 본 발명자들은 진단시 연령과 rs4848543 유전형 간의 연관을 조사하였다. Illumina 칩 상에서 분석된 1598명의 환자들 중에서, rs4848543 유전형과 진단 연령 간의 유의성있는 연관은 없었다(표 2).
rs4848543 대립인자 A로부터의 위험도는 유방암의 가족력과 연관된다:
본 연구에서 각 환자 발단자에 대해 가족력 점수를 계산하였다. Genealogical Database를 이용하여, 본 발명자들은 각 발단자의 1촌 내지 3촌 친척의 원을 확인하였다. 그 후, ICR 기록을 참조하여, 본 발명자들은 유방암으로 진단받은 친척을 모두 확인하였다. 그 후, 본 발명자들은 영향받은 1촌 친척 1인당 1점, 영향받은 2촌 친척 1인당 0.5점, 및 영향받은 3촌 친척 1인당 0.25점의 점수를 부여하여, 각 발단자에 대해 합산된 가족력 점수(FHS)를 생성하였다. FHS와 rs4848543 유전형 간의 연관을 조사하기 위해 Illumina 칩 상에서 분석되었던 1598명의 발단자들을 평가하였다. 표 2에 표시된 바와 같이, 증가된 FHS에 대한 경향은 rs4848543의 대립인자 A의 보유(carriage)와 연관되었다. 이 결과는 rs4848543 대립인자 A 변이가 AllBC 환자들 중에서 1.16에 불과한 상대적 위험도를 갖는다는 관찰에만 근거해서는 예상되지 않았다; 이 상대적 위험도 단독으로는 유방암 케이스의 가족성 클러스터링을 생성할 수 없었다[Stacey, et al., (2006), PLoS Med, 3, e217]. 그러나, rs4848543 대립인자 A는 MedPre 표현형을 이용하여 발견되었고, 상기 표현형은 그의 정의에서 가족력의 실질적인 요소를 갖는다. 이 관찰은 rs4848543 대립인자 A가 덜 일반적이고, 보다 높은 침투성의 변이와 연관 불균형일 수 있다는 것을 시사한다. 대안적으로, rs4848543 대립인자 A는 또 다른 고 침투성 소인 결정인자(high penetrance predisposition determinant)와 상호작용을 보여서, 그들의 침투성을 증가시키고, 그에 의해 유방암의 가족력과의 연관을 증가시킬 수 있다.
rs4848543 대립인자 A와 유방암의 가족력 간의 연관은 BRCA2 999del5 돌연변이를 갖는 가족에 의해 (완전히는 아니나) 부분적으로 설명된다:
rs4848543 대립인자 A와 유방암의 가족력 간의 관계를 더 조사하기 위해, 본 발명자들은 잘 규명된 아이슬란드인의(Icelandic) BRCA2 999del5 돌연변이를 갖는 가족들이 rs4848543 대립인자 A를 갖는 환자들이 보이는 가족성 클러스터링을 유발하는지 여부를 조사하였다. 본 발명자들은 1600명의 세트에서 1499명의 환자를 BRCA2 999del5 돌연변이에 대해 분석하였다. 본 발명자들은 전술된 바와 같이, FHS를 재-계산하였고, 이때 BRCA2 999del5 돌연변이를 갖는 것으로 확인된 모든 발단자들을 제외시켰다. 표 2에 표시된 바와 같이, 999del5 돌연변이 보인자의 제거 후에도, rs4848543 대립인자 A와 FHS 간의 연관은 여전히 유의성이 있어서, 상기 연관이 BRCA999del5 돌연변이 가족에 의해 완전히 설명될 수 없다는 것을 시사했다. 그러나, P-값은 999del5 보인자가 배제되지 않은 경우보다 상당히 더 높아서, 본 발명자들이 BRCA2 999del5가 rs4848543 대립인자 A에 의해 보여지는 가족성 클러스터링의 일부에 관여될 수 있다는 것을 추측하게 하였다.
rs4848543 대립인자 A로부터의 위험도는 BRCA2 999del5 돌연변이의 보인자까지 확장된다:
BRCA2 999del5 돌연변이는 아이슬란드에서 가족성 유방암에 대해 그와 같은 상당한 영향을 가지기 때문에, 본 발명자들은 상기 돌연변이와 rs4848543 대립인자 A 변이의 관계를 고려하였다. 한때 가능한 시나리오는 CHEK2와 BRCA 돌연변이 간의 상호작용에 대해 시사되었던 것과 같이, rs4848543 대립인자 A 변이가 BRCA2 999del5 보인자에게 무시할 수 있는 정도의 추가적인 위험도를 부여한다는 것이었다[(2004), Am J Hum Genet, 74, 1175-82; Meijers-Heijboer, et al., (2002), Nat Genet, 31, 55-9]. 상기 시나리오의 경우라면, 영향받은 BRCA2 999del5 보인자들 중에서 rs4848543 대립인자 A 변이의 빈도는 대조군 빈도와 거의 같을 것이다. 반대로, 영향받은 BRCA2 999del5 보인자 중에서 rs4848543 대립인자 A 변이의 빈도가 집단 대조군에서보다 더 높은 경우, rs4848543 대립인자 A가 999del5 돌연변이에 의해 부여된 위험도 외에 BRCA2 보인자에 위험도를 부여한다는 것을 의미할 것이다. BRCA2 999del5 보인자의 수를 최대화하기 위해, 결합 아이슬란드 Illumina 및 재현 환자 세트에 대해 하기 분석을 수행하였다. 데이터의 조사는 rs4848543 대립인자 A 변이의 빈도는 유방암을 갖는 BRCA2 999del5 보인자에서 0.463이었고, 이는 대조군 빈도보다 훨씬 높고, 1.65의 RR에 해당한다는 것을 보여주었다(표 3). 따라 서, BRCA2 999del5 보인자(이미 유방암의 높은 위험도를 가짐)의 경우, 그들의 위험도에 보유한 각각의 rs4848543 대립인자 A 당 1.65의 추정된 인자(estimated factor)가 곱해지게 된다. rs4848543 유전형의 승법 모델로부터의 편향에 대한 증거는 없었다. 이 관찰은 rs4848543 대립인자 A 변이에 의해 부여된 유방암의 증가된 위험도가 BRCA2 999del5 보인자까지 확장된다는 것을 보여준다. BRCA2 999del5는 비-기능성(non-functional) 단백질을 생성하는 널 돌연변이(null mutation)이기 때문에, 이 결과들은 rs4848543 대립인자 A에 의해 부여된 위험도가 상기 돌연변이가 단백질을 비-기능성이 되게 하는 BRCA2 돌연변이 보인자 모두에게 확장된다는 것을 시사한다.
rs4848543 대립인자 A는 BRCA2 999del5와 상승적으로 상호작용할 수 있다:
rs4848543 대립인자 A로부터의 위험도가 BRCA2 999del5 보인자까지 확장된다는 관찰은 상기 변이가 999del5 비-보인자(non-carrier)에게 부여하는 것과 동일한 상대적 위험도를 999del5 보인자에게 부여하는지의 문제를 제기한다. 본 발명자들은 BRCA2 999del5 보인자에서 rs4848543 대립인자 A에 대한 상대적 위험도 추정값(1.65)이 BRCA2 돌연변이의 비-보인자에서 rs4848543 대립인자 A에 대한 상대적 위험도 추정값(1.13, 표 3)보다 약간 더 높다는 것에 주목했다. 따라서, 본 발명자들은 rs4848543 대립인자 A에 의해 부여된 상대적 위험도가 BRCA2 999del5 배경에서 비-999del5 배경에서와 상이한지 여부를 테스트하였다. 표 3에 표시된 바와 같이, rs4848543 대립인자 A에 의해 부여된 상대적 위험도는 비-보인자와 비교하여, 999del5 보인자에서 약 1.46-배 더 높았다. 이 관찰은 rs4848543 대립인자 A가 BRCA2 999del5와 상승적 방식으로 상호작용한다는 해석과 일치한다. BRCA2 999del5는 비-기능성 단백질을 생성하는 널 돌연변이이기 때문에, 이 결과들은 rs4848543 대립인자 A가 BRCA2 단백질을 비-기능성이 되게 하는 모든 BRCA2 돌연변이와 상승적으로 상호작용한다는 것을 시사한다.
BRCA2 999del5와의 잠재적 상호작용은 또한 환자들 중에서 rs4848543의 변이 대립인자의 수와 환자에 의해 보유된 999del5의 수 간에 유의성있는 상관관계가 있는지 여부를 평가하는 것에 의해 조사하였다. 표 4에 표시된 바와 같이, 환자에서 보유된 rs4848543 대립인자 A의 갯수와 BRCA2 999del5 대립인자의 보유 간의 유의성 있는 상관관계가 있었다. 환자에서 rs4848543 대립인자 A와 BRCA2 999del5 대립인자 간의 상관관계가 근본적인 집단 계층화(underlying population stratification) 때문에 일어날 수 있는지 여부를 조사하기 위해, 본 발명자들은 상기 상관관계가 대조군 집단에 존재하는지 여부를 조사하였다. 두 변이에 대해 테스트된 5938명의 대조군에서 상관관계는 없었다. 유방암 환자들은 이 5938명의 대조군의 그룹으로부터 배제시켰다. BRCA2 999del5는 유방암에 대한 강력한 위험 인자이기 때문에, 대조군에서 999del5 보인자가 고갈된 것으로 주장될 수 있다(비교적 작은 수의 여성 보인자들이 유방암에 의해 영향받지 않을 수 있기 때문에). 따라서, 본 발명자들은 두 변이 모두에 대해 테스트되었던 2925명의 남성으로 구성된 대조군을 이용하여 상기 테스트를 반복하였다. 이 그룹에서 rs4848543 대립인자 A와 999del5 보유 간의 상관관계에 대한 증거는 없었다. 따라서, 본 발명자들은 환 자들 중에서 rs4848543 대립인자 A와 999del5의 동시-유전(co-inheritance)을 설명할 수 있는 근본적인 집단 계층화의 증거가 없는 것으로 결론지었다. 따라서, 가장 타당한 설명은 rs4848543 대립인자 A와 999del5가 상승적 방식으로 상호작용한다는 것이다.
그 후, 본 발명자들은 공지된 BRCA2 999del5 환자들이 분석으로부터 제외된 경우 rs4848543 대립인자 A가 가족력과의 연관을 보인다는 관찰로 되돌아갔다(표 2). 본 발명자들은 BRCA2 999del5 보인자가 아니나, MedPre 표현형 기준을 충족시키는 고 위험 환자들이 rs4848543 대립인자 A의 증가된 빈도를 보이는지 여부를 조사하였다. 상기 빈도는 대조군에서보다 이 환자들에서 더 높았고, 1.35의 상대적 위험도에 해당했다(표 3). 따라서, rs4848543 대립인자 A와의 위험도 연관은 999del5 보인자가 아니나, 그럼에도 불구하고 MedPre 특징을 갖는 환자들에까지 확장된다.
표 1에 표시된 바와 같이, MedPre 표현형 정의에 맞지 않는 환자에서 rs4848543 대립인자 A와 연관된 검출가능한 위험도는 없었다. 이는 rs4848543 대립인자 A만이 MedPre 표현형 배경에서 위험도를 부여한다는 것을 시사한다. 이는 rs4848543 대립인자 A 변이의 배경에 비교적 드문, 고 침투성 돌연변이가 존재하는 경우 일어날 수 있다. 대안적으로, rs4848543 대립인자 A 변이는 BRCA2 및 가족성 연관(familiar association)을 갖는 다른, 확인되지 않은 고 침투성 위험도 결정인자의 침투성을 변형시키는 보다 일반적인 대립인자를 나타낼 수 있다. 그와 같은 확인되지 않은 위험도 결정인자는 다른 유전자의 고 침투성 변이, 변이의 다유전 자(polygenic) 조합 또는 심지어 가족에서 집적하는 환경적 위험 인자들일 수 있다. 편의를 위해, 본 발명자들은 그와 같은 가상의(hypothetical) 고 침투성 위험도 결정인자를 BRCAx로 지칭한다. rs4848543 대립인자 A가 변형자 유전자(modifier gene)으로 작용할 수 있다는 견해를 더 조사하기 위해, 본 발명들은 rs4848543 대립인자 A가 MedPre에 걸린, 비-BRCA 보인자에서와 동일한 빈도로 영향받은 BRCA2 999del5 보인자 중에 일어나는지 여부를 연구하였다. 이는 사실상 rs4848543 대립인자 A 변이가 BRCAx를 갖는 개인에 대한 것과 유사한 위험도를 999del5의 보인자에게 부여하는지 여부를 조사하는 것이다. 표 3에 표시된 바와 같이, 이 그룹들 간에 rs4848543 대립인자 A 변이의 빈도의 유의성 있는 차이는 없었다. 그러나, 상대적 위험도의 점 추정값(point estimate)은 1.22여서, 그 효과가 999del5 보인자에서 더 클 수 있다는 것을 시사한다.
rs4848543 대립인자 A 및 rs4848543 LD 블럭 내의 (rs4848543과 연관 불균형인)다수의 다른 마커의 보인자는 다발성 원발성 유방암의 증가된 위험도를 갖는다:
다발성 원발성 유방암의 발생율은 유전적 소인의 지표(indicator)이고 임상적 중요성을 갖는다. 유방암을 앓았던 환자들은 제2의 원발성 종양의 발병에 대해 크게 증가된 위험도를 갖는다. 유전적 소인은 이 증가된 위험의 실질적인 성분을 구성할 수 있다. 따라서, 본 발명자들은 다발성 원발성 유방암(MPBC)이 비-보인자에서보다 rs4848543 대립인자 A 보인자에서 기대되는 것보다 높은 빈도로 나타나는지 여부를 조사하였다. Illumina 칩으로부터의 데이터는 rs4848543 LD 블럭 내의 다른 마커들이 적어도 rs4848543만큼 MPBC를 잘 예측할 수 있다는 것을 나타냈다. 따라서, 본 발명자들은 상기 블럭 내의 마커들에 대해 8개의 분석법을 설계하고 테스트하였다. 로지스틱 회귀를 이용한 MPBC에 대한 위험도의 평가 및 환자 추적(follow-up) 시간의 길이를 보정한 후, 8개의 SNP 중 7개가 단일 원발성 유방암(SPBC) 진단만을 경험한 환자 대비 보인자에서 MPBC의 증가된 위험도를 보였다(표 5). 본 발명자들은 이 7개의 SNP 분석법이 환자가 MPBC의 증가된 위험도를 갖는지 여부를 결정할 수 있는 것으로 결론지었다.
하나의 연관 불균형 블럭 내의 복수 개의 SNP가 All BC 및 MedPre 유방암 표현형과의 연관을 보인다:
SNP rs4848543 대립인자 A는 NCBI Build 34에 근거한 경계 좌표(delimiting coordinate)가 표 6에 표시된 연관 불균형(LD) 블럭에서 발견된다. 상기 LD 블럭은 [McVean, et al., (2004), Science, 304, 581-4; Winckler, et al., (2005), Science, 308, 107-11]에 기재된 가능성 비 테스트를 이용하여 옥스포드 대학교의 수학 유전학 그룹(the Mathematical Genetics Group at the University of Oxford)에 의해 정의된 재조합 핫스팟(recombination hotspot) 간에 전개되는 것으로 정의되었다. Illumina Hap300 칩으로부터의 데이터는 rs4848543 대립인자 A와 동일한 연관 불균형 블럭 내에 존재하고 테스트된 두 개의 유방암 소인과 명목적으로 유의성있는 연관을 보인 다수의 SNP를 밝혔다. 표 7 및 표 8은 Illumina Hap300 칩 상에 존재하는 LD 블럭 내의 모든 SNP의 목록 및 두 개의 표현형에 대해 그들로부터 수득된 연관 값(association value)을 표시한다. 본 발명자들은 또한 HapMap 프로젝트(HapMap 데이터에 대한 모든 참조는 release 20에 대한 것임)에서 분석된 추가적인 세트의 SNP에 대한 효율적인 대리물(r2>0.8)로 확인된 상기 블럭 내의 2-마커 일배체형(two-marker haplotype)을 고려했다. 이 추가적인 SNP는 UTAH CEPH (CEU) HapMap 표본에서 5%보다 높은 소수 대립인자 빈도(minor allele frequency)를 가졌고 그들은 Hap300 SNP 칩 상에 존재하지 않았고 상기 칩 상에 존재하는 SNP에 의해 효율적으로 태깅되지도 않았다[Pe'er, et al., (2006), Nat Genet, 38, 663-7]. 이와 같은 소위 "Daly" 일배체형에 대한 결과가 또한 표 7 및 표 8에 표시된다. MedPre 유방암에 대해, 29개의 개별적인 SNP 또는 2-점(two-point) "Daly" 일배체형이 명목적으로 유의성 있는 p-값을 보였다.
rs4848543 대립인자 A-연관 위험도가 복수 개의 일배체형 배경 상에 존재한다.
rs4848543 대립인자 A가 비교적 드문, 고 침투성 변이를 태깅하는지 또는 다른 고 침투성 결정인자들의 공통된 변형자(common modifier)로 작용하는지 여부를 구별하기 위하여, 본 발명자들은 rs4848543 대립인자 A가 나타나는 일배체형 배경의 다양성을 조사하였다. rs4848543 LD 블럭은 비교적 높은 재조합의 영역을 포함하며, 그의 원위 말단(distal end)은 뉴클레오티드 120034174 주위에 존재했다. 명목적으로 유의성 있는 유방암 위험도를 부여하는 SNP는 이 재조합의 영역에서 (우 측) 말단에 위치한다. 따라서, 본 발명자들은 일배체형 다양성의 분석을 우측 서브-블럭 영역(right-hand sub-block region)에 한정했다. 본 발명자들은 Illumina 칩 상에서 분석된 시료 및 SNP를 이용하여 정의된 영역(nt 120034174 내지 nt 120129001) 내에서 일배체형을 확인하기 위해 NEMO 소프트웨어를 이용하였다. 일배체형을 구별하기 위해 필요하지 않은 중복적인 SNP는 제거하고, 남은 일배체형 각각에 대해 상대적 위험도 및 빈도를 평가하였다. 결과가 표 9에 표시된다. rs4848543 A 대립인자를 갖는 모든 확인된 일배체형은 1보다 큰 상대적 위험도 추정값을 가졌고, 대부분의 경우, RR 추정값은 1보다 유의성있게 더 컸다. 반대로, rs4848543 C 대립인자를 갖는 일배체형은 어느 것도 1보다 큰 RR 추정값을 갖지 않았고, 모든 유의성 있는 추정값은 1 미만이었다(즉, 그들은 보호적(protective)임). 따라서, 본 발명자들은 rs4848543 대립인자 A-포함(bearing) 일배체형으로부터 위험도를 분리시킬 수 없었다. 이는 발병성(pathogenic) 변이(즉, 기계적으로 위험도를 부여하는 변이)는 rs4848543 대립인자 A 또는 rs4848543 대립인자 A와 강한 연관 불균형인 변이라는 것을 시사한다. 복수의 일배체형 배경 상에 발병성 변이의 존재는 그의 빈도가 rs4848543 대립인자 A의 빈도와 근접하게 유사할 수 있다(즉, rs4848543 대립인자 A와 발병성 변이 간의 r2 값은 높다)는 것을 시사한다. 이 관찰은 rs4848543 대립인자 A가 rs4848543 LD 블럭 내에서 드문, 고 침투성 변이의 존재를 나타내지 않으나, 오히려 상기 대립인자가 BRCA2 및 앞서 정의된 BRCAx와 같은 고 침투성 결정인자의 다소 공통된 변형자라는 견해를 지지한다.
다수의 마커들이 rs4848543 대립인자 A와의 상관관계를 통해 BC 위험도 연관을 보일 수 있다:
HapMap 프로젝트 데이터 (release 20)에 대한 참조는 CEU 백인 유럽계 집단 표본에서 rs4848543과 0.2보다 큰 r2 값의 상관관계를 갖는 다수의 공지된 SNP를 밝혔다. 이 SNP들은 rs4848543과 유의성있게 상관되기 때문에, rs4848543 자체에 의해 측정되는 것과 동일한 BC 위험도를 측정하기 위해 이용될 수 있다. 이 SNP들은 표 10에 열거된다.
STEAP3/TSAP6 유전자는 유방암에 대한 관찰된 위험도에 관여될 가능성이 가장 높은 유전자이다:
rs4848543 LD 블럭 영역 내에 현재 3개의 알려진 유전자가 있다. 이들은 하기와 같다;
1. 보체 성분 1q 서브성분-유사 2(Complement Component 1q Subcomponent-like 2) 유전자 C1Ql2 (NM_182528)
2. TSAP6(Tumour Suppressor Activated Pathway 6), pHyde, 및 Dudulin-2로도 알려진 STEAP3(The Six Transmembrane Epithelial Antigen of Prostate 3) 유전자. RefSeq 번호 NM_018234 (이소형 b), NM_182915 (이소형 a), 및 NM_001008410 (AF262322로도 표시됨)에 의해 식별된 이 유전자의 3개의 주요한 공지된 대안적인 전사체가 있다. 이 유전자의 제4 전사체가 개시되었고 식별자 AK024163이 부여되었다.
3. 전사체, AK127773는 STEAP3 유전자와 중첩되고 반대쪽(좌향) 가닥으로부터 전사된다. 이 유전자는 가상 단백질(hypothetical protein) FLJ45874로 표시되었다.
rs4848543 LD 블럭은 비교적 높은 재조합의 영역을 포함하고, 그의 원위 말단은 뉴클레오티드 120034174 주변에 위치한다. 명목적으로 유의성 있는 유방암 위험도를 부여하는 SNP 및 Daly 2-점 일배체형의 대다수는 이 재조합의 영역에서 말단에(우향) 위치한다. 이는 C1Q12 내 및 그 주변의 변이가 연관 신호의 출처가 아니라는 것을 시사한다. 위험도와 강하게 연관된 변이는 STEAP3/TSAP6 유전자의 5' 및 그 내부에 위치한다. 실제로, 명목적으로 유의성 있는 SNP 중 2개, rs838100 및 rs3731603은 상기 유전자의 전사된 서열 내에 존재하고 또 다른 두개, rs838102 및 rs12711924는 STEAP3/TSAP6 인트론 내에 위치한다. 이 두 개의 SNP 중 후자는 IVS4 유전자의 3' 스플라이싱 부위 부근에 위치한다. 이 관찰들, 및 STEAP3/TSAP6 유전자(하기 참조)의 공지된 생물학적 특성(biology)을 고려할 때, 유방암에 대한 관찰된 증가된 위험도에 관여될 가능성이 가장 높은 유전자는 STEAP3/TSAP6이다.
섹션 2: 염색체 2q35 상의 rs13387042
rs13387042 A 대립인자는 아이슬란드에서 유방암에 대한 증가된 위험도와 연관된다:
게놈-전체 연관 분석은 rs13387042 대립인자 A가 Any BC 표현형과 연관된다는 것을 보여주었다(표 11). 이 SNP는 STEAP3/TSAP6 유전자 좌로부터 별개의 위치에 염색체 2q35에 위치한다. 1598명의 환자 및 4475명의 암-불포함 대조군에 대해 이 SNP에 대한 Illumina 칩 데이터를 수득하였다. A-rs13387042에 대한 RR 추정값은 케이스 및 대조군에서 개체들 간의 혈연관계에 대해 보정된 경우, 4.0x10-5의 P-값으로 1.19였다. RR은 MedPre 유방암에서 유사했고, P-값은 4.4x10-3이었다.
그 자체로, 이 결과는 테스트된 317,089개의 SNP에 대한 Bonferroni 보정 후 게놈-전체적으로 유의성있는 것으로 간주될 수준에 도달하지 않았다. 따라서, 본 발명자들은 rs4848543 대립인자 A에 대해서 수행한 바와 같이, 아이슬란드 집단으로부터의 독립적인 표본에서 상기 결과를 확인하고자 하였다. 본 발명자들은 rs13387042 SNP에 대해 테스트하기 위해, SG02S728로 명명된, Centaurus SNP 분석법을 설계하고 테스트하였다. SG02S728 분석법을 추가적인 583명의 환자들 및 Illumina 칩 또는 Centaurus 방법에 의해, rs13387042 대립인자 A에 대해 분석되었던 7966명의 개인들로 구성된 독립적인 대조군에 대해 수행하였다. 7966명의 대조군은 전립선암 또는 대장암으로 진단받은 개인을 포함하나, 유방암으로 진단되었던 개인은 포함하지 않았다. 이는 rs13387042 대립인자 A가 이 암들에 대한 검출가능한 위험도를 부여하지 않는다는 중간 관찰에 의해 정당화되었다(데이터는 제시되지 않음). 이 제2 그룹에서 AnyBC와 연관된 rs13387042의 대립인자 A 에 대한 RR 추정 값은 1.20 (P-valuecorr = 3.8x10-3)이었다. 따라서, RR의 매우 유사한 점 추정치로, 최초의 발견이 독립적인 아이슬란드 표본에서 유의성있게 재현되었다. 최초의 1598명과 583명의 재현 표본이 통합되고 12441명의 대조군과 비교된 것인 결합 분석의 결과가 표 11에 표시된다. 결합 분석은 테스트된 317,089개의 SNP에 대한 Bonferroni 보정 후 유의성의 수준에 근접한, 1.20의 유의성있는 상대적 위험도 추정값(P-valuecorr = 2.0x10-7)을 보였다. rs13387042 대립인자 A 변이의 관찰된 빈도 및 상대적 위험도는 아이슬란드 집단에서 15.6%의 추정된 집단 귀속 위험도에 해당한다.
ICR 기록은 1955년부터 시작되므로, 본 발명자들이 동원한 환자들 중 일부는 장기적인 암 생존자였다. rs13387042 대립인자 A 변이를 갖는 환자가 비-보인자와 상이한 장기-생존 확률을 갖는다면, 유병 케이스들 중에서 상기 변이의 빈도가 영향을 받을 수 있다. 이를 조사하기 위해, 본 발명자들은 2000년 1월 1일 이후에 진단받고, 진단으로부터부터 동원까지 5년 미만의 시간을 갖는 837명의 개인들로 구성된 환자의 서브세트를 확인했다. 최근에 진단된 환자들의 이 코호트에서, rs13387042 대립인자 A의 빈도는 0.498이었다. 본 발명자들은 또한 2000년 1월 1일 전에 진단받고 동원시까지 생존한 1344명의 환자들의 그룹을 확인하였다. 이 그룹에서 rs13387042 대립인자 A의 빈도는 0.492였고, 이는 최근에 진단된 환자들 중의 빈도와 유의성있게 상이하지 않았다(P 값 = 0.71). 따라서, 상이한 생존 율(survivorship)이 표 11에 표시된 위험도 추정값에 영향을 미쳤다는 강력한 증거는 없다.
rs13387042 A 대립인자는 스페인 케이스:대조군 표본에서 유방암에 대한 증가된 위험도와 연관된다:
유방암 위험도에서 rs13387042 대립인자 A의 역할을 더 조사하기 위해, 본 발명자들은 스페인에서 수집된 BC 케이스:대조군 표본의 독립적인 세트를 검사하였다. 스페인 연구 집단은 스페인 자라고자(Zaragoza)에 있는 자라고자 병원의 종양학과로부터 동원된 446명의 유방암 케이스로 구성되었다. 977명의 대조군 세트는 스페인, 자라고바에 있는 대학교 병원에서 수집되고 본 연구에 포함시키기 전에 유방암에 걸리지 않았다는 것을 확인했다. 모든 개인들은 고지된 동의서를 제출했다.
스페인 케이스 및 대조군 시료를 대상으로 SG02S728 Centaurus 분석법을 이용하여 rs13387042에 대해 유전형 분석을 수행하였다. 결과가 표 11에 제시된다. rs13387042의 대립인자 A는 이 집단에서 유방암 위험도와 1.21의 점 추정값으로 유의성 있는 연관을 보였다(P-값 1.8x10-2). rs13387042 대립인자 A 변이의 빈도는 스페인 대조군 표본에서 더 높아서, 상기 변이가 보다 우세하고 따라서 스페인 추출(extraction) 집단에서 보다 높은 유방암 부하(burden)에 기여할 수 있다는 것을 시사했다.
rs13387042 A 대립인자는 스웨덴 케이스/대조군 표본에서 유방암에 대한 증가된 위험도와 연관된다:
유방암의 위험도에서 rs13387042 변이의 A 대립인자의 역할의 추가적인 확인을 추진하기 위해, 본 발명자들은 2개의 스웨덴 코호트에서 SNP를 분석하였다: "스웨덴 가족성(Sweden Familial)" 코호트는 스톡홀름, 카롤린스카 연구소(Karolinska Institute)의 종양유전학 카운셀링 클리닉에 유방암의 가족력 조사를 위해 위임된 346명의 BC 환자들로 구성되었다. 각 환자는 별개의 가족으로부터 유래되었다. "스웨덴 순차적(Sweden Consecutive)" 코호트는 카롤린스카 연구소 유방암 클리닉에 다녔던 482명의 순차적으로 동원된 BC 환자들로 구성되었다. 가족력은 이 제2의 코호트의 선택에서 고려되지 않았다. 대조군은 스톡홀름 지역으로부터 1300명의 수혈자 및 대장암 케이스의 434명의 암-불포함 배우자였다. 대조군에서 A-rs13387042의 빈도에서 성별간에 유의성 있는 차이는 없었고, 수혈자와 암-불포함 대조군 세트 간에 유의성 있는 차이도 없었다.
표 11에 표시된 바와 같이, "스웨덴 순차적" 코호트는 1.31의 유의성 있는 유방암에 대한 상대적 위험도를 보였다(P-값= 2.0x10-4). "스웨덴 가족성" 코호트의 1.11의 상대적 위험도 추정값은 유의성이 없었으며, 아마도 이 그룹은 A-rs13387042의 효과를 무색하게 하는 고-침투성 유전자를 가질 수 있기 때문이다. 전체적으로, 통합된 스웨덴 코호트는 1.22의 유의성있는 상대적 위험도 추정값을 가져왔다(P-값= 8.1x10-4).
아이슬란드 코호트, 스페인 코호트 및 스웨덴 코호트에 대한 추정값은 Mantel-Haenszel 모델을 이용하여 결합 분석에서 통합되었다. 상기 결과는 3.8x10-11의 P-값으로 1.20의 추정된 상대적 위험도였다. 이는 조사된 317,089개의 SNP에 대해 보정하기 위한 Bonferroni 방법을 이용한 게놈-전체 유의성에 대한 역치보다 훨씬 더 낮다. 따라서, 본 발명자들은 A-rs13387042는 유럽 후손의 여러 집단 표본에서 유방암에 대한 유의성있고 재현가능한 위험도를 부여하는 것으로 결론지었다. 전체 집단 기인 위험도는 16.4%였다.
rs13387042 대립인자 A - 연관 위험도가 복수 개의 일배체형 배경에
존재한다:
rs13387042 SNP는 표 12에 NCBI Build 34에 근거한, 경계 좌표가 표시된 연관 불균형(LD) 블럭에서 발견된다. 상기 LD 블럭은 [McVean, et al., (2004), Science, 304, 581-4; Winckler, et al., (2005), Science, 308, 107-11]에 기재된 가능성 비 테스트를 이용하여 옥스포드 대학교의 수학 유전학 그룹에 의해 정의된 재조합 핫스팟 간에 전개되는 것으로 정의되었다. 마커 rs13387042의 대립인자 A가 비교적 드문, 고 침투성 변이 또는 보다 일반적이고 더 낮은 침투성 변이를 태깅하는지 여부를 구분하기 위해, 본 발명자들은 rs13387042 대립인자 A가 나타나는 일배체형 배경의 다양성을 조사하였다. 본 발명자들은 Illumina 칩 상에서 분석된 SNP 및 표본을 이용하여 LD 블럭 내에서 일배체형을 확인하기 위해 NEMO 소프트웨 어를 이용했다. 일배체형을 구별하기 위해 필요하지 않은 중복적인 SNP는 제거하고, 남은 일배체형 각각에 대해 상대적 위험도 및 빈도를 평가하였다. 결과가 표 13에 표시된다. rs13387042 A 대립인자를 갖는 수개의 확인된 일배체형은 1보다 큰 상대적 위험도 추정값을 가졌고, 일부 경우, RR 추정값은 1보다 유의성있게 더 컸다. 반대로, rs13387042 C 대립인자를 갖는 단 하나의 드문 일배체형은 1보다 큰 RR 추정값을 보였고, rs13387042 대립인자 C-포함(bearing) 일배체형에 대한 2개의 명목적으로 유의성 있는 RR 추정값은 1 미만이었다(즉, 그들은 보호성임). rs13387042의 대립인자 A를 갖는 두 개의 일배체형은 1보다 큰 RR 추정값을 생성하지 않았고, 이 추정값들 중 하나는 명목적으로 유의성이 있었다. 정리하면, 이 관찰들은 발병성 변이(즉, 기계적으로 위험도를 부여하는 변이)는 rs13387042 대립인자 A와 강한 연관 불균형이나, rs13387042 대립인자 A 자체는 아닐 수 있다는 것을 시사한다.
rs13387042 LD 블럭 내의 복수 개의 SNP가 BC 위험도와 연관을 보인다:
Illumina Hap300 칩으로부터의 데이터는 rs13387042와 동일한 LD 블럭에 존재하는 다수의 SNP를 밝혔다. 표 14는 llumina Hap300 칩 상에 존재하는 상기 LD 블럭 내에 존재하는 모든 SNP의 목록 및 그들로부터 수득된 단일-점(single-point) 분석 및 2-점 "Daly" 일배체형 분석에 대한 연관 값(association value)을 보여준다. 21개의 SNP 또는 Daly 일배체형이 개체들 간의 가족 관계에 대해 보정된 경우 명목적으로 유의성 있는 P-값을 보였다는 것을 알 수 있다.
다수의 마커들이 rs13387042 대립인자 A와의 상관관계를 통해 BC 위험도 연관을 보일 수 있다:
HapMap 프로젝트 데이터 (release 20)에 대한 참조는 CEU 백인 유럽계 집단 표본에서 rs13387042와 0.2보다 큰 r2 값의 상관관계를 갖는 다수의 공지된 SNP를 밝혔다. 이 SNP들은 rs13387042와 유의성있게 상관되기 때문에, rs13387042 자체에 의해 측정되는 것과 동일한 BC 위험도를 측정하기 위해 이용될 수 있다. 이 SNP들은 표 15에 열거된다.
섹션 3: 염색체 16q12 상의 rs3803662
rs3803662의 T 대립인자는 유방암에 대한 위험도와 연관된다:
1600명의 유방암 환자 및 11563명의 대조군으로부터의 데이터를 이용한 추가적인 게놈전체 SNP 분석은 SNP rs3803662의 대립인자 T가 Any BC에 대한 약 1.23-배 증가된 위험도를 부여한다는 것을 밝혔다(표 16). 이 결과는 594명의 아이슬란드 유방암 환자 및 1433명의 대조군의 제2의 독립적인 코호트에서 확인되었다. 이 두개의 아이슬란드 표본으로부터의 통합된 데이터는 개체들 간의 혈연관계에 대해 보정된 경우, 1.23의 상대적 위험도 추정값 및 2.8x10-7 의 P-값을 생성했다. 이는 10.1%의 추정된 집단 귀속 위험도에 해당했다(표 16).
rs3803662 대립인자 T의 유방암에 대한 위험도와의 연관은 스웨덴, 스페인 및 네덜란드로부터의 독립적인 유방암 케이스:대조군 코호트에서 재현된다.
rs3803662 대립인자 T의 유방암 위험도와의 연관을 확인하기 위해, 본 발명자들은 3개의 독립적인, 외국 코호트에서 상기 발견을 재현하고자 시도하였다. 본 발명자들은 전술된 스웨덴 코호트 및 스페인 코호트로부터의 개인들의 유전형을 분석하였다. 본 발명자들은 또한 네덜란드, 네이메헌(Nijmegen)으로부터의 1384명의 대조군 및 558명의 유방암 케이스의 유전형을 분석하였다. 이 코호트는 2005-2006년에 네덜란드의 동부에서 진단된 유방암 환자들의 집단-기반 등록부 확인으로부터 모집되었다. 이 기간동안 70세 이전에 유방암으로 진단된 모든 환자들에게 본 연구에 참가하도록 요청하였다. 대조군은 집단 등록의 랜덤 표본에 기반하여 2002-2003년에 수행된 조사(survey)(네이메헌 생물의학 연구(Nijmengen Biomedical Study))에서 모집되었다. 표 16에 표시된 바와 같이, rs3803662 대립인자 T에 대한 유의성있게 증가된 위험도는 상기 3개의 재현 코호트 모두에서 관찰되었다. 상기 3개의 비-아이슬란드 재현 코호트의 통합 분석에서, 전체 상대적 위험도 추정값은 1.35였고, P-값은 5.1x10-12였다. 아이슬란드 코호트 및 재현 코호트의 결합 분석은 2.7x10-17의 P-값으로 1.28의 통합된 상대적 위험도 추정값을 보여주었다. 이는 테스트된 SNP의 갯수에 대해 보정된 경우, 게놈-전체 유의성에 대한 역치보다 훨씬 낮다. 상응하는 전체 집단 기인 위험도 추정값은 13.4%였다(표 16).
rs3803662를 포함하는 LD 블럭의 정의 및 잠재적인 후보 유전자의 확인.
rs3803662 SNP는 표 17에 NCBI Build 34에 근거한 경계 좌표가 표시된 연관 불균형(LD) 블럭에서 발견된다. 상기 LD 블럭은 [McVean, et al., (2004), Science, 304, 581-4; Winckler, et al., (2005), Science, 308, 107-11]에 기재된 가능성 비 테스트를 이용하여 옥스포드 대학교의 수학 유전학 그룹에 의해 명명된 재조합 핫스팟 간에 전개되는 것으로 정의되었다. rs3803662는 LOC643714로 표시된 가상(hypothetical) 단백질의 전사체에 존재한다. 따라서, 이 가상 단백질은 잠재적인 암 소인 유전자(cancer predisposition gene)로 관련된다. 공지된 유전자 TNRC9의 5' 말단도 이 블럭에 존재한다. TNRC9은 전사 인자 및 크로마틴 리모델링 작용제(chromatin remodeling agent)를 포함하는 것으로 알려진 일군의 단백질인 크로마틴 연관 HMG(high mobility group) 단백질 패밀리의 일원이다. 원발성 유방암 대비, 전이성 유방암에서 TNRC9 단백질의 감소된 발현이 관찰되었다(Olendrowitz, C. 2006, Bachelor of Science Bioinformatics Thesis, Charite-Universitatsmedizin, Berlin). 이 유전자의 5'말단 부근에 존재하는 SNP 변이의 확인은 상기 변이가 TNRC9 단백질의 기능의 발현을 변화시켜서, 증가된 유방암 위험도를 초래하는 유전적 인자와 연관 불균형일 수 있다는 것을 시사한다,
rs3803662 LD 블럭 내의 복수 개의 SNP가 BC 위험도와의 연관을 보인다:
Illumina Hap300 칩으로부터의 데이터는 rs3803662와 동일한 LD 블럭에 존재하는 다수의 SNP를 밝혔다. 표 18은 llumina Hap300 칩 상에 존재하는 상기 LD 블 럭 내에 존재하는 모든 SNP의 목록을 보여주며, 그들로부터 단일-점 "Daly" 일배체형 분석 및 2-점 "Daly" 일배체형 분석에 대한 연관 값을 수득하였다. 80개의 SNP 또는 Daly 일배체형이 명목적으로 유의성 있는 P-값을 보였다는 것을 알 수 있다.
다수의 마커들이 rs3803662 대립인자 T와의 상관관계를 통해 BC 위험도 연관을 보일 수 있다:
HapMap 프로젝트 데이터 (release 20)에 대한 참조는 CEU 백인 유럽계 집단 표본에서 rs3803662와 0.2보다 큰 r2 값의 상관관계를 갖는 다수의 공지된 SNP를 밝혔다. 이 SNP들은 rs3803662와 유의성있게 상관되기 때문에, rs3803662 자체에 의해 측정되는 것과 동일한 BC 위험도를 측정하기 위해 이용될 수 있다. 이 SNP들은 표 19에 열거된다.
rs3803662 대립인자 T 및/또는 관련 SNP는 여러 상이한 민족에서 유방암에 대한 위험을 부여한다:
상이한 민족 배경으로부터의 환자에서 rs3803662 대립인자 T에 대한 발견의 일반성을 조사하기 위해, 본 발명자들은 다민족 코호트 연구(Multiethnic Cohort study, MEC)로부터의 유방암 환자 및 대조군의 표본에서 연관에 대해 상기 SNP를 테스트하였다. MEC는 하와이 및 로스엔젤레스로부터의 215,000 명 이상의 남성 및 여성(캘리포니아의 다른 지역으로부터의 추가적인 아프리카계 미국인 포함)으로 구성되었고 다른 문헌에 상세하게 설명되었다[Kolonel, et al., (2000), Am J Epidemiol, 151, 346-57]. 상기 코호트는 주로 식습관, 인구통계적 인자, 개인적 거동(personal behavior), 과거의 병력(history of prior medical conditions), 일반적인 암에 대한 가족력, 및 여성의 경우, 임신 기록(reproductive history) 및 외래 호르몬 사용에 관한 상세한 정보를 묻는 26-페이지 자가-보고형 설문지(self-administered questionnaire)를 작성하는 것에 의해 1993년과 1996년 사이에 본 연구에 참여했던 아프리카계 미국인, 하와이 원주민, 일본계 미국인, 라틴계, 및 유럽계 미국인으로 구성되었다. 참가자들은 참여(enrolment) 당시 45세 내지 75세의 연령이었다. MEC에서 우발적 암(incident cancer)은 하와이 및 로스앤젤레스 카운티를 포함하는 집단-기반 암 SEER(Surveillance, Epidemiology, and End Results) 등록부 및 캘리포니아 전 지역을 포함하는 캘리포니아 주 암 등록부(California State Cancer Registry)에 대한 코호트 연결(cohort linkage)에 의해 확인되었다. 1994년부터 시작하여, 상기 코호트에서 유전적 분석을 위한 대조군 풀로 작용할 수 있도록 우발적 유방암 케이스 및 MEC 참가자들의 랜덤 표본에서 혈액 시료를 채취하였다. 네스티드 유방암 케이스-대조군 연구(nested breast cancer case-control study)에서 적격(eligible) 케이스들은 MEC 등록 후부터 2002년 12월 31일까지 우발적 침윤성 암으로 진단받은 여성들로 구성되었다. 대조군은 상기 코호트로의 참가 전 및 2002년 12월 31일까지 유방암으로 진단되지 않은, 유방암을 갖지 않는 참가자들이었다. 대조군은 (5-년 간격으로) 인종/민족 및 연령에 기반하여 케이스에 빈도 조화(frequency match)시켰다. 상기 연구는 서던 캘리포니아 대학교 및 하와이 대학교에서 연구기관 감독 위원회(Institutional Review Board)에 의해 허가되었다.
본 발명자들은 MEC로부터의 유럽계 미국인, 라틴계 및 아프리카계 미국인에서 rs3803662와 연관된 위험도를 조사하였다. rs13387042 SNP와 다른 SNP 간의 상관관계가 상이한 민족에서 다를 수 있기 때문에, 본 발명자들은 이 표본들에서 테스트하기 위해 일군의 SNP를 선택하였다. HapMap 프로젝트 데이터(release 20)로부터 유래된 유럽계 미국인 및 요루바(Yoruba)(아프리카인)에 대한 r2 및 D' 값이 표 23에 표시된다. 이 SNP들에 대해 Centaurus 분석법을 생성하고 MEC 표본에서 유전형분석을 수행하였다. SNP 간의 결과를 더 잘 비교할 수 있도록 하기 위해, 본 발명자들은 일배체형 분석에 의해 결실된 유전형을 고려하여, 일반화된 가능성 비 테스트(generalized likelihood ratio test)를 이용하였다. 이것은 상이한 SNP에 대한 케이스 및 대조군의 수를 동일하게 하는 효과를 가져서, 그들 간의 비교를 보다 용이하게 하였다. 결과가 표 24에 표시된다. 먼저, rs3803662 대립인자 T로부터의 위험도가 유럽계 미국인에서 유의성있게 재현된다는 것이 명백하다. 관련된 SNP들 중 두개, rs4784227 대립인자 T 및 rs17271951 대립인자 C는 유럽계 미국인에서 rs3803662 대립인자 T보다 명목적으로 더 높은 상대적 위험도 및 더 낮은 P-값을 보였다. 이는 최초에 확인된 SNP에 관련된 것이 더 높은 상대적 위험도를 가질 수 있고 따라서 탁월한 질병 위험도 마커를 제공한다는 개념을 예시한다.
rs3803662 대립인자 T 신호는 또한 라틴계 미국인(latina)에서 유의성있게 재현된다. 마커 rs3803662의 T 대립인자는 아프리카계 미국인에서 유의성있게 재현되지 않았고, 실제로, 상기 T-대립인자는 아프리카계 미국인 표본에서 보호성이었다. 이는 rs3803662 대립인자 T와 추정적 발병성 돌연변이(putative pathogenic mutation) 간의 LD 관계가 아프리카계 미국인에서 상당히 상이하다는 것을 시사한다. 본 발명자들은 3개의 관련된 SNP 대립인자, rs12922061 대립인자 T, rs4784227 대립인자 T, 및 rs17271951 대립인자 C가 유럽인에서 rs3803662 대립인자 T와 강한 상관관계를 가지나, 이 상관관계는 요루바 아프리카인에서는 유지되지 않는다는 것에 주목했다(표 24). 그러나, rs3803662 대립인자 T와 달리, 관련된 SNP 대립인자, rs12922061 대립인자 T, rs4784227 대립인자 T, 및 rs17271951 대립인자 C는 모두 유방암에 대해 명목적으로 증가된 상대적 위험도를 보이고, 이들 중 2개는 일측 수준(1-sided level)에서 통계적 유의성을 달성했다(표 24). 이것은 관련된 SNP의 세트를 이용하는 것은 다양한 민족 그룹에서 사용하기에 적합한 위험 마커들을 제공할 수 있다는 것을 보여준다.
rs13387042 대립인자 A 및 rs3803662 대립인자 T는 에스트로겐 수용체 양성 유방암에 대한 증가된 위험도를 부여한다:
본 연구에서 환자들의 의료 기록은 그들이 이용가능한 경우 검토하였다. 통합된 표본 세트를 이용하여, 본 발명자들은 rs13387042 대립인자 A 및 rs3803662 대립인자 T, 진단시 연령(age at diagnosis), 에스트로겐 수용체(ER) 및 프로게스 테론 수용체(PR) 상태 간의 연관에 대해 조사하였다. 어느 변이도 진단시 연령과 연관을 보이지 않았다. rs13387042 대립인자 A 및 rs3803662 대립인자 T를 포함하는 유의성있는 유방암 위험도는 명백하게 ER 양성 종양으로 진단된 환자들에 한정되었고 ER 양성 종양과 ER 음성 종양에 대한 OR의 차이는 유의성이 있었다(표 24). 마찬가지로, PR 양성 종양으로 진단된 환자들에서 우선적으로 유방암 위험도에 대한 경향이 있었으나, PR 양성 OR과 PR 음성 OR 간의 차이는 유의성이 없었다. 이는 ER 양성 종양 및 ER 음성 종양이 다소 상이한 유전적 병인을 가질 수 있다는 것을 시사한다.
표
SEQUENCE LISTING
<110> deCODE Genetics ehf
<120> GENETIC VARIANTS ON CHR2 AND CHR16 AS MARKERS FOR USE IN BREAST
CANCER RISK ASSESSMENT, DIAGNOSIS, PROGNOSIS AND TREATMENT
<130> 2506-PC00
<160> 6
<170> PatentIn version 3.5
<210> 1
<211> 600
<212> DNA
<213> Homo sapiens
<400> 1
caggataaga ttatttctga ggctgcttcc atcagtggtt ctgtgagctg gcccatgtat 60
tcagccagtc agtaggccat caagcatgca tctacgcaag gcactagaag ggttacatac 120
aatgggaaac tgaggcccag aaggaggaaa gatgaagtgc ccaaagttaa ggagataaaa 180
gcagaagtgc aggtaagaga aggagtattc atattactgc aggaatccaa attctacaag 240
aacatacgct tgttctttaa agggagccct cgctttaagc attatttgcc gatcaatacc 300
mattaataat tacaggacat gggcaaatat tctagcaaag gtcctgaggt cttcctagat 360
gtgcccaaaa taacaaggac tccccccgca ggtggcacca aaagtcggag gatgtgttgg 420
aagctgacct tccccacctg tccctgcctc acccacagtc acccacccct ctaggatgta 480
atggtgaatc attcaacaca tgggccacct tgggaagtcg cttaacctct ctcccttttc 540
acgttataaa atgggcatag tcattacaca aatgcataaa tcaacctcaa ttttctcatc 600
<210> 2
<211> 600
<212> DNA
<213> Homo sapiens
<400> 2
ctgacatagc cgcctgtgca ggtttttggg accaggtctg ccatctgtat tcccaggctg 60
ggctggagca cctgaggcta ctatggttac agaaaggaac ctggcatccg aaggtatagg 120
ctcaaatccc agctctcatg attgctagct ttgaggtttc aggttcattt cttaagtgct 180
ctgagctttg gtgccctcct cttcaaaatg ggaatgagga gcatgtctag ctccctgttt 240
tgttgcagtg aatagctaca tgaagaacag ctaaaccaga acagaaagaa ggcaaatgga 300
rgctacagaa accaaggatt tccttgttga atcgaatctt ccttcaatct tccttcacca 360
cactagtgga tctccctgtg ggagggatgt tgagagtgct ccgtgttttt tttgtttttt 420
tttttttttt ttttgtgatg gagtctcact ctgtcaccca gactggaatg cagtggtgcg 480
atctcggctc actgcaacct ctgcctccca ggttcaagtg attctcctgc ctcagcttcc 540
caagtagcca ggactacagg catatgccat cacacccagc taatttttgt atttttagta 600
<210> 3
<211> 600
<212> DNA
<213> Homo sapiens
<400> 3
gctagtcctt ggctgttctg tgatcaaatg caattgtttc ccatttctta agaaacagaa 60
tctttattag actcagttct tttcttggtt atttttacaa ttttattgtt ctatggttat 120
taaaaaataa catgtcatat aaattaagcc tagaaacatg gatgtttatc aaagaaagga 180
ttgtcatcca aagcaccaac tatgagagat atctatgtgc aatggtatat agatctgtca 240
tagaagggtt taattatatc tgcctaatga ttttctctcc ttaatgcctc tatagctgtc 300
ycttagcgaa gaataaaact gtggactgac ccccacccat ttgcgaagaa agtactgggt 360
cttcagcttt cattgttcag ccggtggtct ttgtggacaa caccaggggc ccctcctgct 420
gaagactgtc tggacttcct gattttcact cctgtataaa ccccctcccc cattactacc 480
tttgtctcct tggggaaaaa aaatgttttt cacttaagca aaataataac tacccagtat 540
ttgtttctgg agtgaaattg taaacttcat tgtacattct tcctggcttt gatgcttatc 600
<210> 4
<211> 94080
<212> DNA
<213> Homo sapiens
<400> 4
ggttgacaca aacacgggaa gattctgcag gaaacacaag gcagccacgg cctctgtccc 60
tgagaggagc agtgagggag ccgcagggct gggctgcggc gtgacactag ggacgtgggg 120
ggaatgcaag tgggtccaga cctgggggcc accagtgcag gagcaagggc aggccggcca 180
tcagagctgg gcggggaggg gggcgctgag cttggcgtgg gagtttcccc aacggactgt 240
gtcttccagg gaccctcgcc cctcatgccc ctctgcgtcc tgaagggagg aggcaccacc 300
cctctgtggc atctgctttt tagggctgac gatggaacaa gctcatggac aggagtgaag 360
cccctggcac atagcaggtg ccacagaagg gtggtgaagt ctgccctaga tcagagatca 420
ttcagggggt ctgttaactt ggatgaagaa gaaatacact cttatcacta acatcaggaa 480
ggtaagcaag gaaccacaca tagaattgac aataagtgtg actttgccac caagaagaat 540
cacaaagttt tattttattt tattttattt tattttactt taagttctgg gatacatgtg 600
cagaatgtgc aggtttgtta cataggtata cttgtgccat ggtggtttgc tgcacccatc 660
aacccgttat ctaggtttta agccccgcac gcattaggta tttgtcctaa tgctctcctt 720
cccctcgctc cccaccccca aacaggcccc ggtgtgtgat gttcccctcc ctgtgtccat 780
gtgttctcat tgttcaactc ccacttatga gtgagaacat gtggtgttta gttttctgtt 840
cctgagaatc atagagtttt catagcccag tacaataatc acagatacat gacatagagt 900
tgtgtgacat gtagacccca atagtccggt taatgggatg ctttagttaa aaagtacata 960
gattactgta ttataagttt atgttttagg atattttgat gattactttt tagaaatagt 1020
ttcctttgta acctttattt tacttaatgc atatgaaaga atcattcaga ggaggggtcc 1080
atggcttcac caagatgaaa caggtcattg gcatgaaaaa ggttaaaacg ctgtgccctg 1140
gaaccaggag tttatgatcc aggcctgcag catgctgtat gaccttggcc acataacttc 1200
attgtgcctc agttgcctca actataaaat ggggataata aacctgtgac atatgatgct 1260
tggggggtta aatgtgacaa aagtcttagc actctgtgtg ccatacagtg agggccccag 1320
catgggcatt gatgcaccgt cttgattcct cctgcctttc ccaggtacag ggagcttccc 1380
cagcctgcct gcatctgaga agattccacc agagaaacag aaccaatagg agacatatat 1440
taagagttgt gttgcggcca ggcctggtgg cccatgcctg taatcccttt gggattacac 1500
tttgggatta cagcactttg ggaggccaaa gcgggcctat cacctgagtt caggagttcg 1560
agaccagcct gaccaacgtg gagaaacccc gtccctacta aaaatacaaa attagccagg 1620
cgtggtggca ggcatctgta atcccagcta ctcgggaggc tgaggcagga gaatcacttg 1680
aacttgggag gcggaggttg cagtgagctg agatggtgcc attgcactcc agtctgggca 1740
acaagagcaa aactccatct caaaaaaaaa aaagagagag atgtgttgca agaaatcggc 1800
ttacgtgacc gtgggggctg gatccatagc gcaggctctc aggaggggca gtccagaact 1860
ctcaggctga tgctgcaggc cacaggtggg atttcttctc aagaaagcct cagctctgct 1920
cctaaggcct ttcaactgat tgactcatgc ccactcagat tattgagggc tatctccttt 1980
atttaaggtt aaccggccca gtgcagtggc tcacgcctat aatcccagta ttttggcagg 2040
aagattgctt gaggccagga gtttgagaca ggactggaca acagagcaag agcctcatct 2100
ctacaaaaca taaaaaaatt agcccggtgt ggtggcacac tcctatactc ctagctactc 2160
tggaggccaa gccgggagga tcacttgagc ccaaaagttc aaggctatac tcctagctac 2220
tctggaggcc aagcggggag gatcacttga gcccaaaagt tcaaggctgc agtcagctat 2280
gatcaagcca cttatactcc agcccagaaa acagagtgag accctgtctc taaaacaaca 2340
acaacaaaaa accccaacca attgtagata tcaactacat tgctgtggct tgaatgtctc 2400
ctccaaaact caatctgaaa cttaatccct aatttaatag tattggcagg tgacagggcc 2460
tttcagaggt agttgggtca tgtgggcatt catggattaa tgggttaata gattaatggg 2520
ttatcatggg agtagattag ctatcacaag agtgagtctg ttacaaaaat ccagcttggc 2580
tctctcttgt gagcccctcc ccatacgatg ccctgcactg accattagca agaaagcctt 2640
catcagatgg accccctcaa ccttggacat ctcaatcttc agaactctaa gaaataaatt 2700
tcttttcttt ataaattgcc cagtctctgg tattcagtta tagcaacaga aaatggacta 2760
agatacacat ctacgagata cctccacagc aactcctaga ttagtgttga tggaataact 2820
ggggattgta gcctagccaa gtcgacacct aagaccggcc ctcatgtcac ccaaggacaa 2880
gacagcgagg tcctgaagag tttcatgaag aggaggggaa ggagagagtg gggagctcaa 2940
tgtggacccc tcaattaatt tcccaagtgc tcaatgaggc ctgccccacc tctcatccag 3000
ctccttggcc aggccctgcc cccactcacc tctcttatgt gggacacgtg agcccctcca 3060
gtgtgccagg agcacatggg tacaggcaca catagagaat gccgtgtcca caggaaaccc 3120
agtgagcctg aagggccttg gcgtgccatt tacaggtcac tcacttgggc caggcctcac 3180
tagggatgcc agggtgaaca agacgtggcc agtgctcttg aagggctccc acctggtgga 3240
ggtagcagac aagtaagggg acaaaggccc ctcagaagta cacatctggt gggccgggcg 3300
cggtggctca catctgtaat cccagcactt tgggaggccg aagcaggcat cacttgaggt 3360
caggagttcg tgaccagcct ggccaacagg tgaaacccag tctctactaa aaatacaaaa 3420
attagccaga cgtggtggcg cgtggctgta atcccagcta ctcgggaagc tgaggcagga 3480
gaatcacttg aacccgggag gcggaatttg cagtgagccg agatcacgcc attgcactcc 3540
agcctggaca cagagcgaga ctccatctca aaaaactaaa aaaataaata ataaaaagta 3600
caaattaggt gtggttatcg cctggagagc caggagcatc cttgggaggg gacttgggga 3660
ggggtccgct gggctgctct agcccactct gggccagaat cgtgattcta attgcaggta 3720
ggctttaccc tatcaaagcc ccctgggctg gggactctgt gaagaagcaa gatgtgcttg 3780
aaacctccct ctctgctgaa aaatctagac aagctcctga ccggctgcat tgctgcttca 3840
gcccctcctc agggaagcgg gaggccctgg gtctctacgg gtgctctgtg aaagactgca 3900
gaggctggtg gggctgcatt cctgtctgtc tgcctaggac agtgcctact gacttctgac 3960
tgctgcccca tggtccaggg ctccaggtac accactgcaa tgtcactttg tgcttggggt 4020
tccaactaga caaaagcccc acgttgcaca gcccttgagc cgtcccgggt agcatgcccc 4080
ctggtggccg tgggcagtta ttaccgttaa tcctttcttg cccagatgcc tctagcgtag 4140
gccacagcag ccggccgggt tcgttgtgtc tggaaagacc agagaagggt tcccggagaa 4200
agaggccgtc tgatcggagt tttatgaacc agaggataaa gaaaggaagg gatttctggg 4260
cctcagaaaa ccacatgcca acgcatgggg gtattaagga taggggctct tgaacgccca 4320
ggctggtaaa atctagaacg gcagagggag gaggggtaat ttttctggtt ggtagaaata 4380
aagtggggat gaggaagagc acgaaagtct gtcggcaaac ctgaaagtgg gagcgagctt 4440
ttgtcaaatc cagggtcaac ctgagctctc attaattggg aaactggaga gtcagatcct 4500
ctaaagaaag tggaaatatt tgttctaaag aacccctgcc aggtccccgt ttacgtgact 4560
cataaagagg ccttcaggca gaaaggatcc cagtgcacca gtaacagaag ggctccagga 4620
ccagagggaa tggacaggga accaccaccc acaccaagca caggcccatt gtcggcatga 4680
ggagcctcgc ccctgcagat cacctcccag aggggagcgg atcagagatt aaattccaca 4740
cctttctaca aaatcatagc agtttgaaag tgccaagggg agtaggtgag gaggtttcga 4800
ggcatgtatg cagccgtttg gagacaccag ccatgtcgcc tgagttttct gatgtaatcc 4860
tcataacaac cattccagat ttaagtgatt agtcctgttt tacagatggg gaaactgaag 4920
ctcagagagg ttaagcaact tccccaaggt catacagtag ccaagtagca taagtggtat 4980
tcgaacccag ttctatttgg agccttcaca ggctttttgc tgcattccac aagagtctgt 5040
atattcagaa gcaagtcttc cacagccatc ataagtcatc ctcacagccg gctggcaggg 5100
agggaacatt gccactgtag ctgggatcat agatatcgtg gtctccattt gacggataag 5160
actgaggtct ggaagagagt cagtcagtct gtgtgataag cctgaaccac cctctccttc 5220
agttcctccc ctaacccaac atcctccggg tctggaagga cagtgtcttg agcaacttct 5280
tgcagctata cttctccagc taatagtcta gaaaaccgag cctggtcccg agtctcctcc 5340
tcggggtacg agccgagggc actgatgggg gtcaggaggt gctggctaaa agacggtggt 5400
gcaggtgccc ctggctttaa gcgcgcccag gttataaaaa gcttggttcc catgctggcc 5460
ctaattctcc atgcactgag taccttaggt cccttctctg ggtctgttgc tcccctgtaa 5520
aacaaggggg tgggagaaat gaccttcaag ctcaaacacc atatgtccac ctgggttggt 5580
atagcagatt gcattagttt gttaggactg ttttaacaaa tgccacagac tgagtggctt 5640
aaacaacaga catttattct ctcacagctc tggaggctgg aagtctgaga tcaaggcagt 5700
ggctggcagg gttgtttctc ctgaggcctc tctccttgta gccacccctc ttctccctgt 5760
gtcttcacat ggttgtccct gtgtgtgtgt gtctgtgtcc taatcacctc ttcttataag 5820
gacaccagtc acagaggatt accggccacc cataggactt cattttacct taattatctc 5880
tttaaagtct ccatctccaa attagtcaca ttctgaggta ctgggagtga ggacttaaac 5940
atacgaattt ggaggatagg acacaattca gcctataaca cagatagaag acactgctca 6000
ttttaaaaaa gaagtagcag gctgggcgca gtggcccata cctgtaatcg cagcactttg 6060
ggaggccgag gcgggaggat cacctgaggt caggagttcg agaccagcct ggccaacatg 6120
gtgaaacccc gcgtctacta aaaatacaaa aattagccga gcatggtggc atgctcctgt 6180
aatcccagct actcgggagg ctgaggcagg agaatcactt gaacctggga ggtggaggtt 6240
gcagtgagct gagatcgcac tgctgcactc cagcctgggt gacagagcaa gactccgtct 6300
caaaaaaaaa aaaaaaaaaa gaagtagcag tcccagccct ttaacagcga acttctgata 6360
catttaaaac agaatctgat tctcactttt tcttccaggc ccacttcaat gccactaatg 6420
aggcctatct gtctgcaatc tgatattaga ggccaaaaat aatctttcta tttgccactt 6480
actgggcacc aatgtcctac ctgacacatg ctggctcagg tgggggagga ggtacggtcc 6540
ctggccctag gaacgctcca tcttagaaag agacagaatg tgctggggtc agagtaaaaa 6600
gtgcatgggc ttcagcagca gatcccagca tggctaccac cagctggggg accttgggca 6660
agagccccct gtgagcctca gttttctcac ctggtcaatg ggactcacac tactgcggca 6720
cacattgtgc gcccacattg tctcggtgca caggggccac ccttcaaact gccagggtct 6780
gcacctctgt gcccaaggtg cagaaagggc tggctgccag aacccactct gcattttgcc 6840
tctttgcacc cgaggctgga agagccctgg aatcactgac tcgctggagc atccattcac 6900
cagtggccat gggagctgat gcataaatat tccagcgctc tggtccttcg agagggacac 6960
tctgtgacat gcgttgctca cctgtgacat gcccctccca gcgtctcctg acctcccctc 7020
ccaaatgcac tacttgcact tgctctcatt cccattctgc ttgctcacag gctggatcac 7080
acaagaccac acatgcgtgt acactcgtgc ctgcccatgg caagtattca aaaactgctt 7140
gctattttgt gggtggtggt gaagggaata gtatatttat aatacttcag gccaggaata 7200
tacatctcct ctgttttctg acccttccag gagtagggtg gattccaccc gcttttttgt 7260
aagccctcag aagtgctcca ggctctctgc acacccccag atctcccctg agcttcagcc 7320
ctcacccagc tccccagtca atttggcccc tgtgacgatg ttggtggggg gggcgggggc 7380
aggggaaaca gctggccctg gctcctgaca ggcactctgt tcccatctca gctgcctggc 7440
cctgcctgtg gcatcctcag agacccagtg gtgagtactt ccttggccct ttaggcccct 7500
ttccccaatc cagtagtgag acacggggag gggctggcag agacacaagt ctgccaccct 7560
ttcctggaca gccttctcct ctctggcagc aggaaaccac cccctactcc cactccagac 7620
ctacgctcac actccccgtc aaccccaagt gccactccag tctggggtcc ctccctgagc 7680
tttcataagc attgcaaatg cccaattcct tcattggctg gggagggcaa agcctaaatg 7740
ggcagtgggc tatagatggt ggccttccag gcactggcag caggacactt cagggcatca 7800
ttcaaatgca gaggggagag cattctgccc aagggcaggc ctatttgggg tgggcagggc 7860
agacttacaa tggagactac catacttacg tggctctctg caggccacgt gaccccttcc 7920
ctctgctcca tgtgcccagg attcaaactc aggctagtct gattcccaaa actgtgggcc 7980
tcagttttgg gaaaactgag aaaattgggc ctcagaatag ggatagggat ggagatggag 8040
atggaagaaa ataaaccagg ccctctgcct gatcccctcc ctactttggc tctggggttg 8100
ggagatgctg cagaggcttc atccactctc tgccccgacc ccctaactcc ctctcctgct 8160
ctgtccactg ggctggaccc tgtctgctgg gcctatcagg gctccccgtg tgtcctccac 8220
cagccagcaa tggccagaga gcccagctgg ccccagccta tcccctgccc accctgggcc 8280
ctgctcagag gacaaggctg aactgattct gtcaggaagg gttagtcttg tctcaggcct 8340
ggctgaatgc aaaaggacga gacaaatgca tgtggacagc ctcgatccgg agtgctctgt 8400
caaacatgct ggccacctct ccgggaagat cactcagact ccttgcatcc catcttggga 8460
aggctggcct gaggctccag agagatgttg ggagatgcca ggtgcctgca agccaagggc 8520
cctccgggga agggtgtcag gacccgctgc ttcttgcctc ttgcagagag ggcaacagct 8580
ggctccttct cctgccccag gtgaagactg atcagatact gattccagga tgaatccagc 8640
aacattaggc cctgcctggt cccatggtag catctggctg ggcttttggc ctatagtcga 8700
gtagatagag ggagggctga taactaagtg actacaacag gacctccctg tgtaagggtt 8760
ctagcttatt tccacactct tctggcacag acaggttggc agggcagctg gtagcaggca 8820
cagcagatgg aatgtcagga atgaaatcca caagactcca agcccctccc agggtgagct 8880
tgccacaggc cacaccagga agctgagctc ctcacccaaa gcctgccagt gcctacgtgg 8940
cagtcattcc cttgtcaaca gacttcccac tggcttctct tgctccatta ttaaaagcaa 9000
gaaccaaaaa cttcactgag gggatagaat cccactaata agcatgtcca cgctttgggt 9060
catcttaggg gcacagaaaa tctgagtatc ccccatagca tcaggcagag cagatttctt 9120
gtcaattagc tcagttggtt ggaggctgca gccatgaaca tgctggcctc agggccctca 9180
caacacaggt gggttaggga atgaatgaaa gttcagctat tattcctgcc agagactcca 9240
ggcccaacct ggcctctaat gagctatgtg actttgggca ggcagaaaag tgtctctgct 9300
atggtttgaa ggcatccccc aaaggcctcc aatgcaacag tgttgagaag ggggaccttt 9360
aagaggtacg tgggtcacga gggctctgcc ctcacgaatg gatttgtcct catcgcagga 9420
gcgggctcat tatcatgaga gtgggttggt tataaaattg aatgtggccc cattccttct 9480
ctccctttcc cccatgtaag gccccaccag acatggccct ccagtggtgg agttcccaac 9540
ctccagaacc acgagacaaa tgaactgtta ttttttcata aatgactcag cctgcagtac 9600
tctgttacag catcacaaaa tatgctaaga cacccctgag actcatcggc cacctgtctg 9660
tcagctttgc cgcaaaaatg atttgggagc agctatagtc aactttcctc agactacctc 9720
ctgctggcac attacggcca cctgctgtgt gcctggtgtt tttctaggtt cttggaataa 9780
agtgaacagg ccgggtacgg tggctcacgc ctgtaatccc agcactttaa gaggctgagg 9840
tgggcagatc acctgaggtc aggagttcga gaccagcctg gccaacatgg tgaaaccccg 9900
tctctgctaa aaatacaaaa atgtgctggg catggtggca ggtgcctgta atcccagcta 9960
ctcgggaggc taaggcagga gaatcgcttg aatccgggag gcagaggttg cagtgaaccg 10020
aggtctcgtc agtatactcc agcctgggca ataagagcaa aactccaagt caaaaagaaa 10080
aaagaaaaaa gaaaaaaaaa acagaaagaa agaataaagt gaacaaagca ggcaaaaata 10140
cctgccccca gaaagatcac attcagtgga tgtgcccatg ttccttcctc ttcctaaagc 10200
actcacaaat atcaacattc ccctgaactc accactgaga gtcacttctc agcgtgacaa 10260
tgttgaccag tcttcacctg ctgtgtaaag caggcctgcc ctatagtgac cccccaaaca 10320
ggtgcagaag gcaggtccac catcagccca tggccagcac accagttaga tacctgctgt 10380
tgccaggcag ctgtctgcca gcccgtaggc actagagagc cttggggcct ttcctgagcc 10440
cttttaaaga agtgcttcct ttagacatgg actctcaggc ctgctcagag cggggagggt 10500
gctgctccgc cccaaggcct tccctccatc ctttcctctg gcaatcaccg tgatagcagc 10560
aacgcccagc ctgaggcctt gggtgctgct tccctcagga aaactggcca aagagtagac 10620
agcagatact ttctccatat tcccaccccc acaacacagg ccagcagcac agcagctgta 10680
gacaagattt cataaagaac tggaggacaa gaaaggggag attaaggagc cctaggctct 10740
agggcctggc tcacacaaga atggtcttcc tcctgccaac ttcttggcct ttacaaaggc 10800
cccacctgac ccagcccagc ctcctgggca ctggccaagt tccacaccaa gactaccaga 10860
ccccgccaag tccaggctca agagagaaag ccagaccctc tctccttcca cctacctgag 10920
agaggcctgt cctcaggtgt ctggctcaca gatgggggac ccaactggga gtcactccct 10980
tctggaagcc ccaggcccta taaacaggtc cccggcctca ctgctgggcc tcggcctgga 11040
gacagcggct cagtgcaaca caaccacgcc agagctgatc aggggaaacc cacgcagcag 11100
ttgagggggc tggggctttg cgggtgcagt gaggggactg cttcccttca gtggagttgc 11160
tgccgcaggt gaggggagga agatgaatct gaaggttcta acgtcagccc acaggctgaa 11220
gcgaaggctg gcctgaagtg ttccacctgg gcccccacct gagcggctga agagttctgt 11280
ttcctcaagg cccacagagc tcctcagagg gaagctttag tagctatttc cttaggaagg 11340
caagtatgtg tgcaacattt cctaataaaa tgcaaaggct gttggaggca ctccagcccc 11400
ctcatttagc tctgaggtgt aattaataca taaattaagc tcctgcagac tcacaaatgt 11460
ccaagaaaaa aaatgaaaaa tataattagt ttgcccatct gactccatct gtcagctctg 11520
agctcaatgc tcaacgtagc aaatcctgag ggctttggtc tcgcattggc tgggcccggc 11580
gctgctcctg ccctgctcca gggaagtggg ccctccgcag cagctgccca gagcccgggc 11640
tctggactca gcctccaggg cagcaaggac tctggagtac acagactgca ggctgggagc 11700
cggggcactc ggcagagcag ccaggacctt ctctgtggcc ctgagcgctg gctaggggtg 11760
gcaagggcac cccggggaat ttgcatgtgc ctcttgctgc catgttccta tttgtgcaga 11820
cctggaagtg ggcggcagag ccctgaatgg gctaagactc gccctcctcc tccaacctgt 11880
cacctctgtc gcttactatc tgtaagaaga gaaaggctgc aaaggggaaa gggaactcga 11940
gaggaaggca ccgaggagaa gagaggagac aagagggcat tgggggagca aaggaggcca 12000
ctcacacagg aggattagaa ttaacaacta cccccacccc agctcccccc aacacacact 12060
tacacacgct tgtattacac cggggatctc acacacatcc ggtcactcag tattcagcac 12120
tctaggaaaa gaacaaacaa atggcttgtc tttcatcccc caaaattact tatgtcataa 12180
aattaatcca tatttgtttc agaaacattt aaataagaca taaggggtat ggcattaaac 12240
gtacccccaa atgcctcttc cccttacaag tggggatcat cattaaaaac ttttgtccca 12300
gaagtggtga ctcaggcctg taatcccagc acttagggag gctaaggtgg gaggatcact 12360
tgaggccagg aggtcaagac cagcctgggc aacactgtga ggtcctgtct ctaacagaaa 12420
aaagaacagg aaaatttaaa aggaggaatg aaaacaattg tttaaataat aatttggtgt 12480
gtattattta aagtacatta atatttggtg caatcgtttt tgaaagggag attgtactat 12540
acatgttgtt tggcaactta ggtgctcgct caggcaccag gccacacaca tcttgggcat 12600
tccacatctg ggttttgaaa gtaaaattat aataagaaaa taagcaaagg tcaaaatggg 12660
ttggaaaaaa attatttaca cagtgagttt tctactttat cataccaaga agatgacttc 12720
tctaattatt attatttttt tttaagatgg agtttcactc tgtcacccag gctggagtgc 12780
agtggcgcaa tctcagctca ctgcaacctc cacctcctgg gttcaagcga ttctcctgcc 12840
tcagccttcc aagtagctgg gatgacaggc tcccaccacc acatcaggct aatttttgta 12900
tttttagtag acatggggtt tcatcaggtt ggccagggtg gttgcgaact cctgacttca 12960
ggtgatccac ctgcctcggc ctcccagagt gctgggatta caggcgtgag ccaccgtgca 13020
cccggcccct aattattatt tacgtagaac aatatcaaag atatttttct tcctaactct 13080
atactccttg acaagaaaaa aaaagaaaag aaaggaagag cccgcgatat ataatggtac 13140
atttgaaaat gaagcatttg tatgtgcgct cacatgagta catatatatg tattacatcc 13200
atatgcatgt atgtgcatag actgtttcta gaagaattca caagaaactg gtaacatttg 13260
ttgcctctgg gaaacagatt ggcaactggt agaaggtgac tgacttcatt ataaacatat 13320
tttgtaatgt tttaattttc tgtcacatgc attattactt ttttccttag aaaggatttt 13380
ggttttgtct attttatcgg aagaggcaaa ttttaacaat aaaaacaaaa tgactgacat 13440
tcagccatag tcccacctct ctgaattact cagatctact gatttacatg tagattaaat 13500
gcaaatgagg gtggcactat ggttgattat ttagcagctc agcaatatga ccaatgccct 13560
gttcccttct acccttctgc tctgccccct cggcttgtag actttgtcct tgggcttcct 13620
aacctcattg ctacaagagt caggcacatg atcaaaacaa gacactgccc caaggtagga 13680
aagaagccac ctcttccttc ctatttttag gagaaaaatc tttcccccaa agccctcctg 13740
cagacttagc ccacatatcc cactggccat atttatttcc catgtctatg cctgagccca 13800
tctctggcaa gggaaaggga cccctttgga catcccaggg caagcaggcc tcctcagtgt 13860
tatcagacca actacccctc ttgaaaacaa tgactgtatt cttgtaacca cccaacctca 13920
atccagaaac aaaattcaca gatcacagaa tgtacctaca aaaacatatt tcaaaaaaga 13980
atcaaaacga agccctagct gtcacgtaaa ggagaaagta aaagtaattc aagacaaaag 14040
agtatgtttt ataataagca aaggctcagg cagcagactc tacagaacat aatgaagtgg 14100
tgagatgctt gcagctgcac acggaaatgc caaggttgcc ccatcataca tatagacaga 14160
tgcgggagat gactcaccca gcacgaggcc attgccactg gcggcatgat tttccaaaat 14220
ggcgaacaac tgttggtaaa gcttcaaaca aaacacagtg caacctcccc ttgatttata 14280
cagtaggata cttcctagga aatttagggc atatttaaaa acatgcaaaa agatacttgg 14340
agctcataca tcaaatggaa tgaagtttta ggcttaaaaa ggactttcag ctacataaaa 14400
gtctcatgag acatcagaaa gtcacgtggg acatggagcc atttcctctt agaaaggact 14460
gtctcacaca ttgtaaggta tttagccttc ctagaccccg tttattgaaa gatgatagca 14520
agggccctcc ccacaaaatg tcaaagcccc caccaatttc cagaacacac ttagggaatg 14580
gttctgtccc tttcgagaac tcctggctta ggccaacctg cctctcccag cccaggtgac 14640
ctcagagctg ggtggttgtc tgaacaacat tcaggttctt gcaggaagca tagaaggcga 14700
ttagaggttg gatagatagt caaccgtctg ttcatcacag aagcatttgc acatatttgt 14760
ctctagcttt gcctttgtat acatattttt aaatacaaat aaaatacgta tttaaaatat 14820
ggccaggtgt gttgactcat atctgcaatc ccagcacttt gagaggctga ggtgggagga 14880
tcaacttgag cacatgagtt tgacaccagc tgggcaacat agtgagatcc catctctata 14940
aaaaattagc caggtgtggt ggcatgtgcc tgtggtccca gctactcaag aggctgatgt 15000
gggaggatca cttgagccct ggaggttgag gctgcaggga gcactccagc ctgggcaaca 15060
gtgaaactgt ttcaaaaaaa aaaaaaaaaa aagacaaaca actgatttac cgaatgggca 15120
gaacttcatg gcacatactt ggctttcttt ttctttttcc cccatcactg tttttcagtg 15180
ctggctggtc agctctcctc tttcagccct tggatgacag ctggggctgt cccatagctt 15240
ttcagtcact ttgagctatg tcataactgt ggtcatattt tcaagcatga aaagtacaga 15300
tttgtctcaa tcaaaactca gtctcacaaa agccactttc ctccccagct cagtgcccac 15360
ccagtgggca ggaggagggg caggtctgtt ccttttctcc ctcgctgcca ccctcagtcc 15420
aagttcgggt ggggaagagt tgattagagg atggggcaaa gtcttagagg gccggacgtg 15480
ggtgatccat cacacatacc cattctatct tggcctctag ggtggatttt gaggagcccc 15540
ctccccatga tgatctctgc actccacaag gagttcctcg atgtgacggt gcactctcta 15600
gctggtcttc tgtggcatgc cccctctggt acccagtggt tcacccctcc caaccagcct 15660
ttccctgggg gacctctcct acccagcagg tgagtctcct gagtgggctt ctttcaagat 15720
acctgaaaac ccaactcctg ggaggttcac ttgctccaag gaaacttgta catctttgcc 15780
ttgcctaaga gtggaggagc agcttcccca caactgaccc tgtaatagaa aaaaacaagg 15840
tgttttgcct attctcacac acagaactcc caacaccaga tgtgtggagc atttcccaca 15900
taccaggcaa ttctcccttg gacaccagct gggtgtcctc taattcagtt cagttttgat 15960
cctatctacc tggagatagc atcagatccc acaggtcgat ggctcagtcc tgcgagactg 16020
cccctctaga gatgccaatc tcaagtgcag gttgtgacct gtgctttgaa ccattgacta 16080
tatattgggg ctccctcgac tccctcgttg ggtgagatta atctgctaga gcagctcata 16140
aaactcaggg aaatgctcta tttatgttta ctggtttatt aataaaagat gtaataaaga 16200
atacagataa gcaccagatg aggagataca tagggtaagg tctagagggc cagcagcttc 16260
tgtctctgtg gagttggagt gtaccaccct cccagcaagc agatgtgttc tccaacatgg 16320
aagttctctg aacctcatac ttagctgagg gatttttttt tttttttttt gagacagggt 16380
ctcactccgt cacccaggct ggagtgcagt ggtgccatct cggctcactg caacctccac 16440
ctcccgggta caagtgattc tcgtgcctca gcctcttgag tcgctgggat tacaggcgct 16500
tgccgccaca cccaactaat ttttgtattt ttggtagaga cagagtttca ccgtgttggc 16560
caggctggtc tcaaactcct gatgttaggt gatcccccca cctcggcctc ccaaagagct 16620
gggattacag atgtgtagct cagggatttt tatggagtct tcatcacata ggcatgattg 16680
attttcaagt ccatttccag cccctttctc ctctccagaa aatgggtcat ggggctgaaa 16740
gctccaagct tccaatcatg gcttggtctt tctgctgaca agcccccatc cagaagccca 16800
ccaagagttg cctcaataga acaaaagatc ctccttttac ccaggaagtt ccagggactt 16860
taggagctct gtgtcaggag ctagggtcaa aaaccagata ttagaacaaa agattctcct 16920
agcacctgta tctacaagga tattaggagt gctgtctcgg gaataaggac agagaccaaa 16980
cattggaaca aaagattatc ctgacacttc tatcacttag aaaatcacag ctgacccttc 17040
aacaatgcaa gggttaggag tgctgacaac tgcccaactc ctgcctcgca cacggttgaa 17100
aatttgtgta taacttttga ctcccccaaa gacttaacta caagcctact gttgactgga 17160
atccttatgg gtaacataaa cagtcaatta acagatatat cgtatatatt ttatatactg 17220
tattcttaca ataaagtaag ctagagaaaa gaaaacatta ttaagaaaat cataagagaa 17280
aatatattta tggtgctcta cggtatttat tgataccata ggtctgcacc atgtgtttac 17340
aacatgtatc atctgtctga aacgtcaggc aacctcagct gctgacctta gtctatggta 17400
catatcgagc aattcaactt gttcctgtga ggtcatgacc ttacttctta ggagctcttc 17460
cagcatcact agtggcactt cgtatgggtc ccatgatgct attcaaggtt tacagtattg 17520
cactaaccat gaaaataaat gagaactgag agagatcatg gttttcactg caatatgcaa 17580
tttactggag attgcaatag taaattgtaa attgctatat gcaatctact gctcacgtgg 17640
agatggtcag tatttcatag tgttttaagc agacactcgc aacacgagct caccgcaata 17700
gcaacaggag gtagctacaa aaatattaca gtagtacagt gcttactaca gtgaatttta 17760
tgtagttatg attgaatact tcatctttac atttgtttac atttccctca actacaaatg 17820
gtgccatgta tgatctgtgt tttttgcatg ttttcataaa ttttaacttt ttataataga 17880
tttgtgtaat tttatagtag taacttataa aatagactag tactcgcata tactttatgc 17940
attcatgaca tacctaactt tttgttgttc ttttttgata tttctgggct acacaagggc 18000
agtgacatga tcgtagcgca ctgtaacctg taactgtaag ttttttcaaa ctgtcacaaa 18060
tctcaaaaaa aaaatctaat atatttaatg aaaactatcc aagtataagt tgacccttgc 18120
agttcaaacc tgtgttgttc aagggtcaac cttacaagga ttttaggaac tctgctggga 18180
actggggaca gagagcaatg tgtatatttt gtgttatttc aggtgcgttt gctcatgcct 18240
ataatctcag cactttggga ggctgaaggg ggagaattgc ttgaggccag cagtttgaga 18300
ccagcttggg caacacagag agatcatgtc tctaccaaaa agatcccaaa aattcatatt 18360
ctccctcctc actttacctc acacgatgct ccaaatcagt ctcccacctt aagaattctc 18420
cataagcaaa agcccatctt gaatcccaca ctctcaggga cccttgccac actatccccc 18480
caattttctt ttctttcttt atttatttat ttatctttaa gacagagtct tgctctgtcg 18540
cccaagctgg agtgcagagg tgcgatctcg gctcagtgca acctccacct tctggattca 18600
agcaattctc ctgtctcagc ctcctgagta actgggacta caggtacatg ccaccacagc 18660
tggctaattt atatatatat atatttagta gagatggagt ctcaccatat tggtcagtct 18720
ggtcttgaac tcctgacctc agatgaccca cccgcctcag cctcccaaaa tgctgagatt 18780
acaggtgtga gcccccgtgc ccggcctccc aattttctca ttggccagtc actctggtgc 18840
cctggggact agcatccagc taagggatag atgccagctg ctctctcagt gctatggttt 18900
gaatgtttgt gcgccctcca caattcatgt tgaaaatccc cagcacaaca gtatcgaggg 18960
gtggggtcct taggaggtga tgaggacatg aggcctctgc agtcatgaat ggattagtgc 19020
cctatagaag ggctttagag gctgagtccc accttccatc cctccaccat gtgaggacac 19080
agcatttgtc ccctccagag gatacagcac aggtgccatc ttttaagcag tgagcagccc 19140
tcaccagaca ccaaacctgc cagtgccttg aacttggact tccgtcctct agaactgtga 19200
gaaataactt tccattattt ataaactacc caggctcaag tgttttgtta cagtggcaca 19260
gacgtactaa gacttgtggg tacccacaat tccataagcc attttctttg cttggcctgg 19320
gcatgacccc ctgtgctgtc cccgtgaaga aaaaggataa accaacaaac tctatgaatt 19380
aacttcagtg aatctcgtat gtttctaatc ttctgctttg gagctttggc gataaagaaa 19440
gattaggaaa ttagattaaa aaaaactaac attatcttaa atgacccata ttcccaatca 19500
atatctcttc ccttgaaact tggtgtgtat aaatccaata ctttttaatg tatttgtata 19560
tacatatgta aacatataca aatatataca tcatatatat gtatgtatct gcctaaataa 19620
ccacctggag ttagcaggtt ccatacctgc aggatgcaag cagggatggg cagaggcagg 19680
ctggtcagct tccaggtata tatatatata tatactcgga aaatacttgc tattagtttg 19740
gtggttttat tattaacgta aatgatgtct tgctgcacat attattctgc aagttggttt 19800
tcccacataa tgtgttggac atcttttagc cccatttcac actcttagcc tgccttttgc 19860
acaagagttg ctgtggcaac aagctgcccc caggtgtaac ctgacagctt cacttcagct 19920
gcaccaggta tgtctttctt tctgccccag gcatcacggt atacaggcaa atcttgaagt 19980
gccagggagt caaccctccc tggagcaatc cttgcccaat aggagaagga agccaatgaa 20040
taaatatgcc aggcctcgag gtcttaggcc ctcagtctaa ggcatagtct acatggtttc 20100
tctgggagtc ctcagttaaa ctgagccccg actgcccaca gcaatggcca gtgttaaaag 20160
aacaacctta accagattaa atttaacaca gtttaactga gcaaaggaca attcgtgact 20220
agggcagtct gctgagccag agtaggttta gacagactct ggtggaagat ttatggacag 20280
aaaaaggaaa gtgaagcaca gaaaacagaa gtgaggttca gaaacagctg aatgggtcgc 20340
agctcgtcgt ttgccttatt tgaacacagt ttgaaaagtt ggccaccttt gattggccaa 20400
aactcagtga ttgacacaag agtacgttac agcctgttta catttccctg taggctatag 20460
tttactatgc acagagaaac ctttaggctg aacttaaaat atgtaaggag gaagctttaa 20520
gctaaatttg atttttgttg ttgttgttgt tttgttttgt tttgtttttt gttttttgag 20580
atggagtttc actcttgttg cccaggctgg aatgcagtgg catgatctcg gctcactgca 20640
acctccgcct cccaggttca agtgattctc ctgcctcagc ctcccgagta gctgggatta 20700
caagtgtgca ccatcatgcc caattaattt ttgtatattt agtagagggg gtggtttcac 20760
catgttggcc aggctggtct ctaactcctg acctcaggtg atccatctgc ctcagcctcc 20820
caaagtgctg ggattacagg cgtgagccac cgcgccaggc cactaaacct cagcctccca 20880
aagtgctggg attacaggcg tgagccaccg caccaggcca ctaaacctca gcctcccaaa 20940
gtgctgggat tacaggcgtg agccactgcg ccaggccact aaatttaatt taacagtagc 21000
ttaacacatg gctggatggg cttttcctac ttccttgttt cattcttccc agtcctccaa 21060
ctcttgactc ctagatttat ggacccaaat aaatgactca aatgcagtcc ctttgtctca 21120
ggtttttggt ggaatccaag ctaaaacact aaataaaaaa tgttgttaaa aataagttta 21180
ttttggtcat tattgatcca cttggagtgg tcctcaaaat gggatctagg gaatcggtcc 21240
ctgaggctgg tttctgggaa tccacaaatg caaaactatt tccatagtca cactaaggag 21300
gtgtggcctt ttcaagaaat tacattaccc gtaaagtgca atagacggaa aacagaagcc 21360
catatgagaa tccagctatc ttctagcaag ccagaagtaa aagatgccag gtgcagtgga 21420
tcacatctat aatcccagca ctgaggattg cttgagcctg ggaatttgtg accagcctgg 21480
gcaccatagt gagaccccca tctctacaga taatttttaa aattagccag atgtggtggt 21540
gtgtgcccat gatcccaact actcgggagg ctaggaagga ggatcacctg agtcaggagg 21600
tcaaggctgc agtgagctgt gattgcacta ccacactcca gcctgaatga tagagtgaga 21660
ctctgtcaag aaagaaagaa agaaagaaag aaagaaagaa agaaagaaag aaagaaagaa 21720
agaaagaaag aaagaaagaa agaaggaagg aaggaaggaa ggaaggaagg aaggaaggaa 21780
ggaaggaagg aaggaaggaa agaaagaaaa agagatctgc aaaaaaatgt aaaacaatac 21840
cactcttctc actaaatttt tgtacttgga aaacatagtc atttttcaca aaaatgctat 21900
ttatattaac ataagtattt tgatgtgcaa tggacttatt tttgttattt tcacataaag 21960
attgtttaaa tttcttagtt ttaatttcta atactgtaaa tatcagtaga tataacccat 22020
gtaaacaaaa gctttttggg gtcctcaata attttcaaga gagaaaaaga ttgccaagac 22080
taaaaagttt gatagctatt aatagagttc attgctttta acttctgagt cccatgcata 22140
cttcattatt attattatta ttatttgtaa agacagggtc ttgctgtgtt gcccaggctg 22200
gtctcaaact cccaggctca agtgattctc ccatcttgga ttcccaaagt gctgggatta 22260
caggtatgag ccacagtgcc ctgcctcttc ttttaaaatc taattatgta tttgttatct 22320
cttacatttt tcctatcttt cttttttctg attatggccc aaaaggggaa gatttctgcc 22380
catgctcatg ttactatctt gaaattattt cttttcagac tctctagttc aggaaaaagg 22440
tcccctgcca catcaagtgg ccacggagga gcttgggcct gtgatgtccc ctcccttctg 22500
cctaaatgac cacctggagg cagcaggtta catacgtgga ggatgcaggc ggggatgggc 22560
agaggcagac tggtcagttt ccagggcaca cttcgggggc atacaaggga caaaaatgtg 22620
acggtggctc aggagggcac caaagatggc caaaagcttc tgcttttaag gtggcagtag 22680
gaggcagtta atggaaaaat agaaaccaat caagctacgt ctgccaccaa tgaaaatgaa 22740
ttattattta ttcaacaaaa tataagcttt ttaagaaaaa aaaaatagca aacgctcaac 22800
ccacttgcta agttccgttg gggtataatg gcatcagctc tgagtgccaa cttaccttgg 22860
caaggtggtt gcacgccctg aggatatgta caccttctcc gctgctggcc agctagatga 22920
ccttgagcaa gccacccacc cttctgaact tcgtctattt ggaaaataca gacattaata 22980
cctcatagtt tgtaatgagg ccttagagtc cacatattaa tcgttcagaa cacagctcaa 23040
aaaaatctaa aacttctggt ggggcacagt ggctcacacc tatgatccca gcactttggg 23100
agcctgaggt gggaggatag cttgagccta ggagtttgag accagcctgg acaagataga 23160
aaggccccat ctctatacaa aatataaaaa ttagccaggg gtggtggcac atgcctgtag 23220
tcccagctac tcaagagact aaggtaggag gatcgattga gcccaggagt ttgaggctgc 23280
agtgagctat gatcacacca ctgcactcca gcctgagtga cagagcaaga ccctgtcacc 23340
aagaaaaaaa agagagagag agagagagag aggtggcttc agtgggccga atagcagaga 23400
tccactggga gcattagcaa catcagggcc attgcttcag cagcctggaa ctaaagagga 23460
agaaagcaag aagcttcagg agattgaaca gtaggaagga aggaaggaag gaaggaagga 23520
aggaaggaag gaaggaagga aggaaggaag gaaggaaaga aggaaggaag ggagggaggg 23580
agggagggag ggagggaggg agggggagag ggaagcatat gagaaagcga ggctaggagt 23640
cttggagtca tccttgactc atctcttatt gtagtcattg ccagtactca cagctctcag 23700
acaacagtga ggaaacaagt tattttcaac atttcaggaa gctaaatgga aaccatgcac 23760
acaacaaggt ttcaaagtta attgaggatc aagattttct gctgttgtct ggtaagttat 23820
caattctgat ttttttaaac ctgattacag gcatccacaa aaaaatatgc aactaacatc 23880
atgtttaatg ttgaaagact aaatgctatc ctctgggatt gggagcaagg aaagggtatc 23940
cactctcatc actcctgtgt acttaaaaaa aaaaaagaaa taaaacatat gttcacacaa 24000
aagtctgtat gcaaatgttt atagtggctt tatttataat tcaccccaac tggaaacaac 24060
ctaacatgac cttcagctgg tgaatgaata agcaaaccat ggtacatcca tacaatgaat 24120
tactagacag caaaaaaaga aactggtgat ataggcaaca acctgatgaa tctcaaatgc 24180
actgtgctta gtgaaagaag ccaggcccaa aggactacat actgtatgat tcaatgttgt 24240
gacatactgg aaaaggtaaa attataggaa caaatcagta gttgtcaggg tctagtggct 24300
agggaaataa ttgactacaa aaggacagca agggggaatt ttggggggaa ttggaactgt 24360
tctgtatctc aaagatgggc atgattgatt acatgattat gccaaaattc attcatcaaa 24420
aatgtaaatt tttatgtatg tagatagatt ttattttaag tgaataaaag gaacaggcaa 24480
cttggaagca aaagagcagg agccgggcca ggcctgcggc tagattcaga aatagggtta 24540
gagggaatga tcgaggggaa tgacccaggc agccacagct ctggagagac ggctgcaggt 24600
ggacaaaaag caggtggaag cgcccagcag gaccttgacc agacaggcaa tgggaacata 24660
aaagacagca acagattgca acatcatgtc catgggctcc caaacctgat atctcagaat 24720
cacttccaga gctgattgga aagacagatt ccattgctaa gcatagtggc ctgcacctgt 24780
agttccagct actccagagg gcttgaaccc aggaggttga ggctgcagtg agctatgatc 24840
gcaccacagc gctccagact gggtgacaga atgagacaag tcagaatgaa agaaaggaag 24900
aaacaaagaa agagagaggg ggaaagaaag aaagaaagag agagagaaag aaagagagag 24960
agagaaagaa atagaggggg gaaagaaaga aagagagaaa gaaagagaga gaaagaaaga 25020
aaagaaagaa agaaagaaag agagagagag agaaagaaag aaagagagaa agaaagaaag 25080
agagagagaa agaaagaaag agagagagaa agaaaaggaa ggaaggaagg agaaagagca 25140
aaagagacag agggaaggaa ggaaggaagg aagggaggga gggagggagg gaagagggag 25200
agaaggtgag aaggagggag agagggaggg aagagggaga gaaggtgaga aggaaggagg 25260
gagggaggaa agaaggaagg aggggaggga ggaaggaagg aaggagggga gggaggaagg 25320
aaggaaggaa agaaggaaag aaggaaggaa ggagggaggg agggagggaa gaagggaaag 25380
aaagaaagga aggcagattt ctactgaggc tgcctcttta ttcccctctt tattcccctc 25440
agagaggtca tttaacctct ctgatctctg tggttgctgt agggactaaa ggacacaatc 25500
cttgggaaag tgcttggcac agaacttttc agcttgctat ggggagtgcc agccaccggc 25560
aacaggtgtg actgcagggg aaagccccgt gcaggtgaga gaaaggggcc agaatgagaa 25620
gggctttgta aggctgggac cactatgttg ggtctgctat ggagggggga gctcaggagt 25680
aggcagggca gatttgaaca tgggaagggg aaagctgctg ctggaagcag tggcccatgc 25740
ccaggtgcat ggagaagaga gcctggaagc ctctcttggt ccctctaggc tggcagaggc 25800
agggccccac attggcagtg gtgtgaacaa tttcccctca tcatggggct gctcatggct 25860
gtgaaacatg ggatggcact agatttggtc attaagtaaa taggataaag aaataattgg 25920
aaaatggatc cctgcctgga aggagtggaa ttgttcctgg ggctattgtt gtccggcatc 25980
ctgctttctg agtaatctcc cgagccaggc aaggaaggat gtcaggctta gggctgatga 26040
gaaacttaca cttgaaaaga gctcaaaatt acccatgaca atggaaaagc ctttgtatcc 26100
tgaacagaga gaggaaaaag actctgaatc ttctctgggg cgggaggaga gggaagatag 26160
gagggcagtc tcgagtcaca gaatgtcaaa cccaggaccc ctgtgtcttt ccaagttggg 26220
ggcactggcc agggaaggat cctggttctt ccggtgtctg ggatgatgag gctggtcctc 26280
aggcagtggg aggctggagg agggggaatg tgtgaagacc acatgctttc gcctgcaaga 26340
gcatccatcc atgtcttggt cactgcaatt tacatcctcc cattcaaccc tcagcacacc 26400
caccaaacca agctcctcct tgcaccttga tgggcagaaa gttggagtga tgattatcta 26460
agacagagcc ctgaggtgaa gaactggttt tctggtggag ggggtgaggg gaggatggag 26520
ggagctatcc cttccctgtc cccgcaaatc cttcagcaaa aaatccatag tgttgagtca 26580
aaatgccaat cagatgtgcc tctcagcagc tttaggcctg gactttgacc tcagccccaa 26640
cccccacccc cacaggcact cagcctaagc tcccattctg caccctcccc accctggttt 26700
gcaaaatgca tcaaagcaga agctgtgctt ttgcctttcc ttgtaacttc ttgtctgcaa 26760
gctgtattag atgcttgctg gtgtttaaaa cattttctat ttctctaaaa aaacaagttg 26820
gggcacccca aaatgaagcc tcccaagttc ggtcaaacat gcaagattgc cactcaattt 26880
ctccattcta gatgagaata gcgagtccca aaggctcgtg ggtgtctgcg gcgttgcact 26940
cacttaactc acttgttcaa aatacaggtg ccagggcctc ccccccgagc cacagaacct 27000
aaatccccag aatcaataac tttctttaaa taactagatg cttgatttaa agggaaaact 27060
ctatttaaag tgctgtatcc ctccttaaag acagattgtc ctacacgaag cagctacatg 27120
caaaatgaat tataggagtg tccttggttt tacaaaaaat gaaaagcatt gcaattctcc 27180
aaacatgata agaaaggaat ttttttgtta aactctgaga gcaaaacaat ttactagaag 27240
atacagatgc aagttgagta agcaagccaa taatggagaa aggaggaatt tttacagaag 27300
cagtttttcc tcaccccatc tgcatttcat gtctattaaa acacatgtca tgcaacgaaa 27360
aaatcaaagc agtatggttg ggtacacaca ttagtggctt tctgtatggt tagtgagatg 27420
aaaggacaga gaaagctatg ctggagtcat caggacatgg tagagccctc ttgtgagctg 27480
ctggaacaca tcagttgcac gtacgttctc ttgctggtgc agcccatccg gtcagaatct 27540
gtcgctcaca gtagctgtta ctgaatactg tctgcttctt agctgaaacc ttaccgtagg 27600
accatccggc cctgctcctt tcccgttaac atgtaagttg ttctcagacc ctaccttttc 27660
ccttggtttc tcatggaccg tggccaggac ttgggtgtcc acagccacac ccacaaaaga 27720
agtgcctgtt ccacccagga cctctgggtt aaatgacctc tctgaggcca cacaggatct 27780
acagcacaaa ctcagctcag attataaaac ttgcactctg aacgactgcc ctagccagcc 27840
ccaccaaggc catgaggggc ctcccagagc caagtgcgac ggcttctctt ggcctctgcc 27900
tccttgacct gcaagcaata tttgacccca cttcccttcc cgtctcacac cctcctgacc 27960
tcctcagctc tcctttctgg tctctcttcc cctctcctca cacctccaat tggatcttca 28020
gccttcctct cctctcactc cacatttttc agctggattc ctgtggtttt cactcttatc 28080
tctccctatg cctgccaaat ctgtgtgttc agctgtccga acttctcagc tctacatgtg 28140
tgtttgcaaa ggcttcacca tcctccccac acttcctcta ccagaggctg caccatgggt 28200
cactgggcct caatcttcct gcccactcag gtagaggctc tagggtcagc tttgcctcct 28260
gccggatgct gcactgctgg aatcagctgc ccacacttct ctccttttgt atggtgtcct 28320
cactgaaact tgggcggtgt cccttggagt gccttgagag ctgatgattg ccaccctctc 28380
taagagccta cagacccctg atggatatgt gtcctggagc ccctcacaca agcccagccc 28440
tctgtgttag ctagacagtc aagtgggtgc acacagggct agcaccaccg cggctcagaa 28500
gccaccttcc cctggaagcc actccttata tctgggcact ttctcctctg gactaccctt 28560
gcattgtgtt gttctatagg aggtgctgga gacagtgata agaacccatg gcccctgccc 28620
tcaagaagtt ctccagtttt attggtggga gcaaacaaat aaacagacag acatggagaa 28680
aatgcatcag gtcgggtttg catgcaggaa gttgtcactt gcgagggaat gacagaagca 28740
aaagtgggca gagggagaag ttaaaccaag gtgcagtccc accagaggcc tcagaagaac 28800
ccatgagaag ctctgaaact ggatgggctt tcagagttgt accaaatgga ggcaagaggg 28860
ctggcctcta cccctgtctc atccactaga atgtgggctg ctcccagaga gggtgtgagt 28920
gagttggggc aatacatctg ccttcagtgg aaagcaatta attcccagag agggttgcag 28980
ccattgctcc tccagcagcc agggatatga gtacctgtgt gcagatgggg acctgggcaa 29040
catgccacag catccatgac acggcacaga cagggatgcc caaagtgggg gctggccaag 29100
tcaaagatgg gggaagtaat gaggtgatca tcagatcttc ccatttcacc tgggcattga 29160
cctacatgta ggtgtttttc aagtggacaa tctttagttc cctctgctcc tcatcataca 29220
agtataccag caatggctaa tgttatcttt gcacttgcta catgcccagc tgtgtcttag 29280
ctcttcacat gcatagctta tttaatattc acaagaaccc tacgaattaa gtaatactgg 29340
ctaggcacag tgggtcctgc ctgtaatccc agcactttag aaggtcaagt ttggagaatt 29400
gctagagccc aggagttcaa gaccagcctg ggcaacatgg tgaaacctca tctctacaaa 29460
aaatacaaac aatttgctga gcatgatggc agacacctat agtacctgct actcaggacc 29520
ctgaggtggg aagatcactt aagcctggga ggcagaggct gcagtgagcc aggatcgcac 29580
cactgcactc cagcctggat aacagaatga gaccctgtct caaaataata aataaataag 29640
tgggccaggc acggtggctc ttgcctataa tcccagcact ttgggaggcc aaggcgggtg 29700
gatcacttga agtcgggagt tcaagaccag cctggccaac atagtgaaac cccatctcaa 29760
ctaaaaagac aaaaattagc cgggcatggt ggcacactcc tggaatccca actacttggg 29820
aggctgagac aggagaatca cttgaacctg ggaggcggag gttgcagtga gctgagatca 29880
tgccactgca ctccagcctg ggcaacagag caagactcca tctaaataaa taagtaaata 29940
aataaataaa tacataataa aactattgcc cctgtcttaa tgtaaatgga acatgaggct 30000
tagagaggta aaatgactca aggtcacaca gtaagtcaaa ggctgagcta tctctgccct 30060
ttcttcttcc tggtgtacac ctttcaccct gcaaagctca gtgcctacct tacttgctct 30120
atcaaacctt ccccatttcc ctcagaaaga ccaagtcccc ctcctggtct ctagagaaca 30180
agctgccctg gaccacacac cttggcttcc agccccttca ccatcctaga cgaggtcacc 30240
tagaaggttc catccagact gtgaatgtcc ctctttaact acagtctcca gtgaacccac 30300
aacctcaggg acatatgacc ttggagggtt aagtgggatt tcatttccct gactctggac 30360
ctgggctttg ctagcacacc tctcccacta tgatagcatt cgcttaaggc agctgagccc 30420
cgtcaggggc tccctgagct tgtggtcagc tcaagccatc acatctttct catctgtgct 30480
ctgggaagct gcctctgctt ggtctacaca gctgagacaa tggagcctgg gtgggctcag 30540
gggccccttc tgctgggaac ctgctttgaa acaacatatc cattgcattc actggaggag 30600
catcagaagt agacggtaat ttgtgttttt tcttcactgg atgccctagg gtgggttccc 30660
ccgaagcaga ccctgagatg agcatttatg caactgatcg aggatgtgcc caggagaacc 30720
ggataaggga ctcagagttg gagggaagat actaagaaaa tcatgctcca ggcaaagtcc 30780
cagcctcggc ttgatataaa ttacactgac ttgaggcaag ggagctgggc tctcacaccc 30840
cggctccagt cagccactgt ttcagggctg ccccaggagg acaccagctc ccagcactct 30900
tgccgtctgt gcatgcattc agcacactgg caccccctca aaggccagcc atttaagagg 30960
ggcacaggtg ctggggccac aaagcaccca gagcccagtg atgggtgcac aggcactgta 31020
aaagtgatat gagggccggg tgcagtggct catgcctgta atcctagcac tttgggaggc 31080
tgaggtgggc ggatcaccag gtcaggagat tgagaccatc ctggttaaca cggtgaaacc 31140
ctgtctctac taaaaataca ataaattagc tgggtgtggt ggcacacgcc tgtagtccca 31200
gctactcggg aggctgaggc aggagaatca cttgaaccca ggaggcagag gttgcaatga 31260
gctgagattg caccaccgca ctccagcctg ggcgacagag tgagactcac ctcaaaacaa 31320
aacaaaacaa aacaaaacaa aaaaagggat atgagaggat cagagcagcg tccccttgcc 31380
tcctgttacc aagaaggtac caagccgttg ttccctcagg ttgttcctca ttccatgttg 31440
ctcagccagc caaaatcaga agctgccaag ccacctgggg aaacaaggca cccaccgaag 31500
ctcttgtttt caaaagtttg agctaattaa agttgatgga gctggatttc ccctgaagga 31560
aaggatacca atgtttggga aggttaggat tcagagaaag aagcatttga agtcttcccc 31620
agggcctaga aattaaagtc tagagatttg ggagggtctc tagaagggca ggaacgcagg 31680
ccttcacctg aaccacttcc taagcagata gccaacctca tatgggagat tcctaaaggg 31740
gctgacatca aatcctgaga ctccatagtg aagaccccaa gctgcagcct cgcctggaag 31800
tataggaact taccagagta tccaatgaca ggagaagtcc agagggctct accctgaatg 31860
ttcaccatgg ataagtcctg ccccaaacct gacagataca gatttctcat ctatcttgac 31920
aaatgggaac ttgcagccag tttaatttgc ctcaaagaaa ataaaataat gtgacattcc 31980
ttcaccccca gcaagaacta atccctttct ccagtgctcc tacagcaggg aggacatttc 32040
cctgatattg atttttcatg actgtccttc ctccctagga gaccctgatc tccttaggga 32100
agaggtggtg ctttttaaac catttctgca gcccaggtgc ctatcaaggc cccagcatcc 32160
agtgggtctc aataaatgag acctatcata attaacattc ccctacctca gcacatgact 32220
catcaaagta ttacatgttg tttgcacttc tctaccccct cccccttccc atcacctcaa 32280
agctctccaa gcacacatga gccactgctc ataaatgttg catgaaagaa gggatggatg 32340
gatggatgga tggatggatg gatggatgga tggatggatg aatggatgga tggatagaca 32400
gacagatggc ctgatggatg aggctggtga gcaagtgaaa gagtgcttgt tttagaataa 32460
gctatttagg ccactgccat ttcctgttgg ctgagcaatg agcatgccac agggccaatc 32520
agctctaaat gcaaggcggt gcatggccag aggaaagttc ctgctgtctc tccttcaccc 32580
tgacagccat ggccccaagg gctaacagag gcccttgaga ccaattctgc catcaggaag 32640
gaaaagccct gccaaaatat ttgcattcag aaagttagca tttataacac agtcagagaa 32700
ctatgaaata tcttccaggc caagcactgg gcaatgccat gttggtgggt tctgatgagc 32760
cctgggaaac ttacttgcac cttttcagcc cctaacccta ttacacaggc ccctgcatgg 32820
aacaaatgcc ttcatcctca catgttgctg ttgggagtgt actttgatac agcctctact 32880
caagaacaat ttgggaatac ctatagacat tttactaaca aatgtgcacg ccatttgacc 32940
caggaattct actcctagga attaatcctg cacatatact cacgtatatg tacaaaatcc 33000
ccatatacaa tgtttgtaaa aagcacggtg tgaaagccat ctaactcttc atcagaggga 33060
ctgggtaaat aaaggatgtt ctgcagccat caaaaagaat gaaagttcta catgttctga 33120
tatggaacaa tccccaaaat atattgctaa gaaggaaaaa acaaggtgca gatcagtgtg 33180
catcatttac taccatttgt gatggtctta tatagcacag accagttctg gaaggatcca 33240
taagaatggg tcccaagggc taggtgcggt ggctcatgcc tgtaatccca gcactttggg 33300
aggccgtggc gggcagatca cctggggctg ggagattgag accagcctga tcaacatgga 33360
gatatctcat ctctactaaa aacacaaaat tagccaggcc tggtggcaca tgcttatagt 33420
cccagctact caggaggctg aggcaggaga attgcttgaa cctgggaggc ggaggttgca 33480
gtgagccagg atcgagccat tgcaccccag cctgggcaac aagagtgaaa ctcggtcaca 33540
aaaaaaaaaa aaagaagaat gggtcccagg agttgcctcc aaggaaggga ccatggggac 33600
tggggactga ggactgggag acaagagtag agaaatgctt ctcatattgc acaattttga 33660
atttttttgt atcatgtgta tgtattactt atgcttaatc aaatactcaa ttttaatatt 33720
aatttaaaaa aataataata tccccatcca cccagccagg tgccatagta tctgacattc 33780
tgccaatagg gagtcacaag gttgaagtct tagattgaac attgtttcaa catcatttct 33840
cactggaagc tctttataat gcaagcctta ctagaactgg tttaagtgtg atccaaccta 33900
tcagaccaac tttcctcttt cgggcataca aaaaacttca ctgggcattg actttgtcct 33960
acacacttgc ccaggcactg gagagacagg gagaacaggg ctgacctcac agtcagccag 34020
gtggacagct gcacgcacag agtggtggca gtgcacaggg agtggtggct ctgcacatgg 34080
actgtgggcc ctgcatggga ctagtggcac tgtgtacaga atgatggccc tgtacaagga 34140
gtggcagccc tgcataggga cctatggccc tgcacaggga gtcgtggcct tgcatgaggc 34200
cggtggcggc ctgcacggga ctgatggcac tgcacagaga gtgtggccct gcacaaggag 34260
tggtggccct gcatagggac ttatggccct gcacagggag ttgtggccct gcaaaaggag 34320
tggtggccct gcacagggac ggggcagata taccctgaca tttgaggaga ctgaggcaag 34380
gatataagtg ggagagagtt agaatttcga attctcagac tccttgggtt tcatgctgga 34440
acacgctggc atgagagaac caggccttgg cctgtggccc agctccctcc tcttcccacc 34500
tcctgccctg tcccacccca tcaggggctt gcacacacac acacacagac ccttcagccc 34560
tcagagccaa gctccttgca cacagactct ttccacagtc agcgccctta gctcctgtca 34620
agcctccagg tacacacaaa cctgcgtctc tgctcgcctg cacaaggaag gacccagcca 34680
agtgtcccaa tagggcctgg aagcgatctt gatgccatcc gggcagaaaa tcccaggtgg 34740
agtacagccg gataaagaca gcccaggttt caggttggca tgttcctccg gttctgcaga 34800
tccctcgggc cctggagaag gagatggcca gaggaggata gcaaggcctt ccaaagtgca 34860
gtcccgggtc acagcccacc tgcctggatc taaggacggt gtcgctgagg ctgtggcagt 34920
gggaggttcc aagacacggt gaaggcctga aggagggggt ggcccttgct aagacctgtg 34980
gccagctgac agggctcccc agcactctgt cagtaaggcc cttccaggaa gagggagtgg 35040
ctggacaaga ggctgtgtgt ggaaggcaaa ggggagaagg gagagagagg gctggtaacc 35100
caattcctct tcctgcctcc ctacacttca gcatcaccct gttcacgccc cttgcagatc 35160
tcccacagca ctccctgtgt acacctttgc tgctcaaagg gtctacacaa gccaagcaca 35220
gtggctcttg caaaggtggg aagatgtctt gaggccagga gtttgagacc accctaggca 35280
acatagtaag actctgtctc tattaaaaat aataataatt tttttttttt ttggagacag 35340
agtcttgctg tgttacccag gctggagtgc agtggcgtga tctcggctca ctgcaacctc 35400
cccttcccca gttcaagcta ttcccgtgcc tcagcctccc aagtagctgg gattaccggc 35460
acctcccatc acacccagct aatttttgta tttttagtgg agacagggtt tcaccatgtt 35520
gcccaggctg gtctccaact cctgacccca agcaattcgc ccacctcggc ctcccaaagt 35580
gctgggatta gaggcgtgag ccaccacaac cagccaataa taaaaatttt ttaaagggtg 35640
atctaagatc agcagcatgg cctcggaaat tggaaatgca gaccctctgg ccccacctca 35700
gaaccactga attagaattt gtatttggat aaaagtctca ggtgagttct gcaaactttg 35760
taatttgaga agcactggtc tacaccacac tccagcacct taacgcagct ccatttagca 35820
gtggtggaca ttgcatcatg cagtgcatgg ttccttcttg agtgcagctt atggaaggag 35880
ggggagtgac aggactgaac ttattgttca aatccccttg tggtcttggg gttcttggtt 35940
gctcactgca gagtttatag gtgaaatgag cagctgtcct cacctctcca gcacccttgg 36000
aatggaagag gctgccctga gctgggctgc catctcctgg gtcctcagtc tcaagccgct 36060
ttctgatgtc agtgagctct ttgaagtcag gtccgcatcc tacacagggt aggtacaggg 36120
ggccgggaag gcatagaata cacattaggt tggatctagc atctgatcca cctccccatg 36180
tttcacgaat gggccagtgg gtgagtctta gggagggcta ggccctgcct cttagaggaa 36240
ggcttaaaag gccccaacct actcttcttg gcctggtcag ctggaggcag gcagatgccc 36300
caagttcaga cagtcagata ctcccaccag ggatttgggt ctatggtgag tgacatctag 36360
aagcagggcc agccagaagt ccttcttggg gctgggcaca gtgactcgtg cctgtaatcc 36420
cagcactttg aggggctaag gcaggaggat tgcttgaagc taggagtttg agaccagcct 36480
ggacaacata gcaagaccct catctccaca aaagtaaaaa taataataat aataaccagc 36540
catattagag cattcctata gttccagcaa ctcaagaggc tgaggtggga ggatcactgg 36600
agcccacgag gtcaaggctg cagtgagcta cgattgccct cctacagccc agcaattgca 36660
cacctaaccc cacatacaca taatcaaata gagattatac attcacgatt gaagccaaag 36720
tgttatgaca caaaacttac ccttaggaca tgtcataaga tctgatgttt tatattttta 36780
ttcttttttg ttaaagaaag agcttgttga tccaaccctc taataaagct gaaagccaac 36840
atttgcaaac actggcaggt ggctgcgtgt cagggtgagg tgtcactgaa cagggtgata 36900
aagcaagatc ttgtctctaa aataaataat ataatataat aaatataata taattaagta 36960
gaataatgaa atatcctgct ggccaaggtg gcatccccgc ccccagcagc aaagtcagca 37020
gggccagtgg tggcaagctg gtgtccacac cagtggccac agtgtcatgt ccaggcaatc 37080
tctgccctat gacctcagct gcctttccag ctgtctttgg tttctgcctg tttcccttca 37140
gcctccctag attctgggag gggccggtgt cctgctccag gtaggcagag tccaagtctg 37200
ttgtgggcag aactctgatg atcattgcag gggtgggagg agggatggag ggagcatgat 37260
gctggcagaa cctccatggc atctggggaa ttgaaggctg ttttttgctc agttctcacc 37320
atccaaagca gcatgaacag ttttcaccac gcctctcttg tggatgcctg tgttcctggt 37380
acacacctct gctatgacac ttatcacctg gtattagtta agcatctgcc tccttcattt 37440
gctgtgggta tttagaaagc aatccatatt tcctctctgt atgcctcaat ttctccacct 37500
ttattagagg acccaggata agattatttc tgaggctgct tccatcagtg gttctgtgag 37560
ctggcccatg tattcagcca gtcagtaggc catcaagcat gcatctacgc aaggcactag 37620
aagggttaca tacaatggga aactgaggcc cagaaggagg aaagatgaag tgcccaaagt 37680
taaggagata aaagcagaag tgcaggtaag agaaggagta ttcatattac tgcaggaatc 37740
caaattctac aagaacatac gcttgttctt taaagggagc cctcgcttta agcattattt 37800
gccgatcaat acccattaat aattacagga catgggcaaa tattctagca aaggtcctga 37860
ggtcttccta gatgtgccca aaataacaag gactcccccc gcaggtggca ccaaaagtcg 37920
gaggatgtgt tggaagctga ccttccccac ctgtccctgc ctcacccaca gtcacccacc 37980
cctctaggat gtaatggtga atcattcaac acatgggcca ccttgggaag tcgcttaacc 38040
tctctccctt ttcacgttat aaaatgggca tagtcattac acaaatgcat aaatcaacct 38100
caattttctc atctctaagt gagaaggttg gactggaatt aacaagagga tccttgaagt 38160
tctttcgagc tctgacatcc tcatccattg caaagcggct gtgaaactgg attatgtaag 38220
gtcctgtggc cccaccaatt gtttggcaca tcctgtcttt ttccctagct agataatgat 38280
gtggctgagg gcagggactg tgcccacact caccaggtgc atgtgagtca gcgtctggat 38340
tgtgtggccc cgctggggct gccctggctg tatcacatgc ctcttgtgcc catctcatac 38400
ccctcagcca ccctctgacc acagcattgc ccggcgtgcc ccctgcaggc ttttattctc 38460
ctgcagcccc agggcctcct caacactatg atgtgagtca cctgagaagc ccagtcccac 38520
aggcatgcac agctcaggag tgcaggactg tcaaggactc ttgcagcaac cctcagccat 38580
gtggtaggta tgtggggtgc agggtgggga ggcagtggca tacacactcc ccagaagctt 38640
cagtgggatg gagatcagct caacaacaca cctttgactt gacttcccct ccttctccac 38700
ttcactcccc cagcccctca ccctgctccc tgagctctcc tcccaaataa actgcatgca 38760
tgcaggcaca catgaccagg ctgaggctct gctcttagtg ggataccagg caaagacacc 38820
tgccctaggg attggagcct aagccagagg aggcaggagg gtttagggca ccagccaaga 38880
agtgctttcc agatgctgag tgggatcccg aataagggaa agggcatcta acatagaatg 38940
aggaggagat aacacaaggg tagaaataac caagaaaggg gatttctctc agatggcttt 39000
agaggtgctc ccagccattg ctgggctcac atggctcaca tgtcataatt tttgccaagg 39060
cggtttcact gccaccacca ccccgctcag cctccagtgg cttgtccacc catggctgtg 39120
gcctctaact gggcaggatt ttataggcta ggaagaaaag tagggaatgt taagggagac 39180
ggaagtcaag ttcaacttgg aaccatccca gaatgtccag caggaaaggc ccatggatgt 39240
tataggctac aaccctctca gtgctcagcg gaggaactag gagcagagag ggtgagtaag 39300
tcaaaggcac ccagaccttg tagggaatcc tgtgtccctg caggatgcag aatggatgct 39360
tctgaaccct gccacaccct cagggtacat gtcagagcac gtgtgtggct gggacaatcc 39420
tccatctatg ttcctcactt acaccggctc cagtttagga aacccaaaag gctacaacca 39480
acccaccacc acagtgacca caatgtactt ggtgacacct caccttgaca cgcagccacc 39540
tgccagtgtt cacaaatgtt ggttttcagc tttatgcgag ggtaggatcc aacaagctca 39600
ttctttaatg aaaaagaatg aaattgtaaa atatcagatc ttattacatg tcctaagggt 39660
aacttttatc tcataacact tttgcttcaa tcatgagtgt ataatttcta tttgattttg 39720
tgtctatggg gttaggtgtg caatgtagaa aagcttgaaa accattgcct tatacccatt 39780
tgaaaaatga accaccaaac aaaggcttaa aaacatgaat atttgtcaac caaaaggaga 39840
actcctgggc ctggaagaaa catcacgatt caagtgctgc agcacgaaag aagttgaggc 39900
tggatttgta ttcagcttga ctgtttgtaa agcaccatgc accatgcaac tgccttcagt 39960
tccttttttt tttctttctt tttttttttt tttttttttg agatggagtt tcgttcttgt 40020
cgcccaggct ggagtgcaat ggcacaatct cggctcactg caatctccgc ctcccaggtt 40080
caagagattc tgctgcctta gcttcctgag tagctgggat tgcaggtgcc tgccaccaag 40140
cctggctaat ttttgtattt ttagtagaga tggggttttg ccatgttggc caggctggtc 40200
tcaaactcct gacctcaggt acttggcctc caaagtgctg ggattacagg catgagccac 40260
catgcccagc ctgccttcag ttctaaccac taaaggattc gtgttctcaa ctgagaaaca 40320
gccatatgga ggggcttcct gcaagggcac tgaagatgtc agagatgatg cctgtggagc 40380
acctggcaca gaggagctgc cctgctgact gcagcacagc cagttcacag gggtgagccc 40440
cggcatcagc ttagggagca tcccttcttg cagctcctcc ccctagcaca ctctcccacc 40500
tctgctcgca caggacctct gtccaggagt gcttacggca aggtttctgc ctcaaaaaca 40560
gggcttttgg ggctaactgg gagtgtaagg gtaaaaggaa agcttccact aggccccccc 40620
gattgttcac tggaaatgaa gggacaatag gagattaata ggagaagaag gcatacaaat 40680
gtattaacat acataaacac aggagccatg aaaatatgag gctcaaagaa gagccagatg 40740
actgaagttt aaatagcacc ctcttcatag gagagaggga aatgggggta ggtaattttc 40800
aaggttagta aataattttg agggaaatca aatggaccca gaaggcagac attttcctgt 40860
aaatgtcctc ttaggaagct gaatgggact gcaatttaag ggaaagtgag gggcaaaact 40920
gcattgtgaa caaaggttgt cttattacat aggtaaagtc tccctagtca tccctcaaag 40980
ctgccctcag aagaatagat gaaaagcctg ggcttagtga cagcttttac tcttttctcc 41040
ttgcaggtgg gtggttaatc tttcctggtt atttgatgag atttctaggg agggggcctt 41100
aagacagttg catttctttt ggaaagaagt gtccatagtc agatatggaa attctagaca 41160
gcctcttttt cctgcacttg gggagggggc agaggagaaa caagagaaga ttggaaaatt 41220
cttggttctg aggcagcttc taaggacttg cattttcctt taattcaaag tgctcagcct 41280
gccaacactt cctactttgg ggtatcattc tctgtgaccc cacaggggaa tggggtctgt 41340
cctcagagaa tgggggagga cctcaaggca gcagggcaga actccagggt gagagtcaaa 41400
gatggtttcc tggacctgag actccagtgg ggttcatgct agagtcaccc cagtcttcag 41460
gctcactgcc caaacacgca cttgaggaag tctgtggggg cagctccttg ttttgttcct 41520
cactgtcatt ttccaaaagg cagacaagcc ctggccgcct tatgcccagg gctgagtcca 41580
caccatgcta cacgagcacc tgaggggagg ctcctctcca aagtgcatta ccagggcctg 41640
tgctaaattt ttcagcagcc tcttgtctca ctaatggtcc cgggaaatag actaagcctc 41700
catccccaac taagtgctca ggcctccccc acctctgtcc tgcctgggca agaagcccag 41760
cgccgcccca cagcccagct ctccatgcag cctcagctcc cagtggccct ctgccaagga 41820
cttgcgcctc tgcagtggga tgcagtgcct cattttatcc ataattgtac gtggtccctg 41880
tgtgatgtcc ggggacgtga aaagttgtgt ctcatttcat ttgggatcca gttaaattcc 41940
caaatgctgc aactgagcag gaatctcagt gctcagaggc cagcagtagg aggagtctgg 42000
ctgctgggcc cggacacctg gcctctccgg cctctgacca gctctggcca ttggtcacca 42060
ccctggcttt gttgggtatt aatccaccac actctgcctg gctgatccct gagtcagagc 42120
caggctggga tttgtgggtc tctgagccca ccagcctgtg actcccaaaa agagagcacc 42180
cttgctactt ggaaggcttg ccaccatgcc tagccagcac tcttgctttc taagctgaaa 42240
tcattataag atagtcccct actaccttct acccagaaat gtatcccctc acaaagtata 42300
tgttcccacc ctatcccaat cctaccatcg tgatttctga gtactttcca gaaaactgtc 42360
tccactggct cccaagggca gagcacttcc tccagcctct ggaatgtcca ccatgttgat 42420
ggtgcatgga tgataatgac cccacggatg agctctctcc agtgggatca cgaagggaga 42480
atgggatccc tgactcccca cagaacagct cggcccagct gtgaggttga gcaaatacac 42540
tcaaagctca gcgttaaccc aagtccagcg ctctcagctt acacaggtgg cagcccaatc 42600
ttagtgctcc actcaatcca tgtctatgta tacttaattc tctggaacta aaatggggaa 42660
tagggccagg caccatgact caagcctgta atcccagcac tttgggaggc cgaggtaagt 42720
ggatcaccta aggtcaggag ttcgagacca gcctggccaa catggtgaaa ccccatcttt 42780
actaaagata caaaattagc caggtgtggt ggcgggcgcc tgtaatccca gctacttggg 42840
aggctaaggg aggagaatca cttgaaccca ggaggtggaa attgcagtga gccgagatcg 42900
agccattgcg ctccagccta ggtgacaaga gtgaaactct atcttaaaaa ataaaaataa 42960
aataaaataa atttttttaa aggccggagg gactaagatg ggagtgggaa ggagggaggt 43020
tccagctcaa tcctcaccag cagatattcc tgcatcctcc atacctgagc cttcagacca 43080
atgctcccca ggcccaaagg ggacctccct ttcaagtata aggctcccct aattcctcac 43140
cttaggatct ttaaggcaga tgactgcctt aaagaacata tattccttgc agcaagaaaa 43200
cccaactccc aacaccccac agagtgtggt ctggcctgga caagtctgcc ctaagaaaaa 43260
agcgacaaag acccttagta attgaaacag actttaagta ccataaagat gagctttcaa 43320
tcattaaaaa aaaaaacgtt tactgagcca ggcaccaggc ctaggaacag agaggtgcat 43380
ccaggctgcc atgttaggtg ggcctgggcc ccactgctgg ggtcagaagg tattagaaag 43440
ggtctggtct gctgggcgcg gtggctctca cctgtaatcc cagcacttag ggaggccgag 43500
gcaggcagat cacctgaggt ctgcagctcg agaccagcct ggccaacatg gtgaaacccc 43560
gtctctacta aaaatacaaa aattagttgg gcatagtgat gggcacctgt aatcccagcc 43620
agctactcag gaggctgagg caagagaatt gcctgaaccc aggaggcgga ggttgcagtg 43680
agccaagaaa gcgccactgc actccagcct ggatgacaga gtaagagtcc atctcaaaaa 43740
aaaaataaaa taaagaaagg gtctggaagc tctaggtgac ctcatgctca catctatacg 43800
cacaccttga tacattattt atggatcagg tggcacagca ttgcaggcag cagcagggca 43860
aagacagtgt ggaatcagag tcgggcagcg ttggatggga ttccggttct gccaccactg 43920
gctatgtgat ggaaatctac cacatctctc caagccttgc tgtcctgttt tatcaaatga 43980
ggacattgta ctgaatcaca aggtctgtac aatgcccgtg catgtgcctg gaatcttccc 44040
ctctggtgtc ccctcaatgc ccatggtgct tcctgcacag ggtgtaccat agttgcttgc 44100
tgtctcctgc tgaagcctgc tgtgaagagg gactgtgtgg aggtaaggca gtgggcctct 44160
ccctgtgagg tcctcagggg gctgaaggca aagtcagaag taaaaaaaga gaggggggac 44220
ccatccccaa ccagctgcca tcccagggca ctcagcctaa ggccactgca tttgcatgct 44280
atttacataa atctgcatat acactgtatt cccactctat cttgtaggca attattgcat 44340
ttaggcagct ctgcattcca ggaaggggca caagcagaga tgtgatcccc tgaacttcat 44400
gacaagaagg tacccgaagc tcctctccca cctccagcag caaatgtctc ccctggggct 44460
gtcctgtgtt gtgtttgaac cctgctctgg ggctcctgcc cgccacctgt agtggctacc 44520
atcagaagtt cctgttaatt ggggatggca gggtcaccac atctctactc ttctcccact 44580
tctcagcagt tctaatttaa accaggttag aatcttccca cttggtagtc tggtagggaa 44640
attatagtta acaataattt attaataagt taaaatagcc agaagagaag aactgtaatg 44700
ttcccaacac acacaaaaaa gataaatgtt tgaagtgaag cattgaagtg atgctccaat 44760
tatcctgact tgatcattac atattgcatg caagtaccaa aagatcacat gtacccaaaa 44820
atatatacaa ctatgatata tcaattaatt ttttaattga ttttttttct tattttcctg 44880
tgtagtggca gaatcacagt tcactgcagc ctcaacctcc tggggttcaa acaatcctcc 44940
caactcaacc tcctgagtag ctgggactat aggccctcac aaccatgccc agctaatttt 45000
ttgtgtgttt ttgtagagat gggggtctca ttttgttacc cagctggcct gtaactcccg 45060
ggctcaaggg attctcttgc ctcagccttc caaaatgatg agattacaag tgtgagccac 45120
cgactctggc tgatatatca attttttaaa aaaaaggttc ttctccaggc ttcaatgcga 45180
cttcacctat accaggtgtg agcggccctc atgtccaggt gggtggggcc aggcatctgc 45240
agggacctca ggcttcttgg attgtttggg atggaggccc aaggaggcgg aaggtctggg 45300
gtctcaccca agctggctct ccccaaggaa taagagtaat cacatgggcc tggagcagaa 45360
aagggaagag aagggtcccc aggaatgatg atttctgggg cttcaggaaa gagtgtggaa 45420
ctgaatggca gagctaaggg aagactagga cttacaacca ccaaaatcag gccctccagc 45480
tgggttcggg gccaagggag agtgcagcct ggcttctgcc attctccttt catccccctg 45540
gagcttctga aatccacaga attgtggtga aggacaagga gccaagggct cacaggcgag 45600
gggaggcggg gaattcaatg tgttcaaggc ctacattgca catctgccct tggtttactc 45660
tatctaatgt tcccatttga ccggtaagaa aactgaggct caagattcaa acccaggtcc 45720
ttgtaacttc aaaaaccttg ttctttctag gtgtcaaagt caatagatgg gccacggggc 45780
tagcagtcac ttctcttcct ggacttggca gtcaagggat aggacctgaa ctaaattgcc 45840
tttctacaga cttttcagcc ccaaccagag gcctgctgca ggcagttgtt tgaactcctt 45900
gattaaatgt tcagcccctg gcctgggcgg cagactccca acacacaaga cttactgagt 45960
cccccaaata gacttcaaaa cacagtcctg agactctgcc tgccagttgc ccattaagct 46020
catcccagcc tggcatcttc ctttgttggt ccactctccc tatggctacc agggagaaag 46080
tcttttcaga gatgaataag ggcgtccaga caacagagat gtagtagtag gaggtggaac 46140
caaaacagaa ccaggggtct gaatcctggc tctgccactt tctgagatat gtcacatcag 46200
acaggtgact taacctcctg tgtctcagtt tccaaattca aaaacggaaa atgtattatg 46260
acgatcagat gagttaatac agtcaaaatg cttcttagaa cagcatctgg gatgtagcaa 46320
gcactcaaaa acatattagc tattatgatc acacagagat gcatacctcc taaaatcttt 46380
ctgggctccc accgccagca tgataaagcc tcacttctca ccaaaggcaa atcaggcctc 46440
tcatcatctg cctcctccct ccccagcccc atctcccgaa gcgcctctca gggcacctct 46500
gcccttgcac aaggcagggc ctgttcctag caactctcag agtagcagtg gaagtttcca 46560
acaccaagat ctcagatacc tcaagctggc aggagtgcga ggtccaacaa gaagagattt 46620
tatgaatcag ccagccatgg gggtggggca tggccaggtt tcctgattcc cagaccaggg 46680
tgccaacaac acctactgtt catgtgagaa aaggagaaag aggaggaggg gccactggcg 46740
tcttttgccc acctggggtt cctcgctgtg ggagaggggg aggccagagg acagcaagtt 46800
ccctgagagc ctctcagaga aaaggagggt ttagatcatc acacaggata aggaagaaga 46860
ccttttccaa gggggtggag cagagcctgc ctggaggtaa atttcctttg ggaactgtct 46920
tcttcagtat ttcccttcct ctctgaacac cgtttctttt cctttcagat tatctgacag 46980
ccttttaatg aacacctact aagtgcccag cactttcctg ggaacttaat tcttacaacc 47040
tgttaagagg tctatacact cattttacag tggaggaaat ggagacttag cggagatgtg 47100
aaatttgaac caggtccgtg tggtttcaaa gcctgcgcat gttcctttac cctatggaag 47160
cctccagaag ccaaggtctc atctcccctc ttccctggag gccccaaacc tgggtagctg 47220
tgcccctaga cctttgaggg agggtctcga gccattatct cccttacctt ttcttgcagt 47280
gacttggctt ctcccaggct gccgtaacca gcaaacgcct aaagatggct ctgagacgat 47340
ggccttctgt gtgtgtgtcc atgaaatcag gtagtacacc acacagaacc agactctcag 47400
tgacatgcct gatattccac agacctgcat ccgagctgtg cagatctcag gtagacacaa 47460
ccagtgattg gggatggctg gtaggatctt gcctaggcag gccagggagc tctgtgagga 47520
gtgtttggga gaaaatcccc caggttcatc tccctgcatg gactgcccct gctgggccct 47580
cacactaagc tggtcctggt cctcagtact gagggatcac cacaggtgtg taggccacag 47640
ctcacaggag ccctccacct agcgggtcaa aggtagtgga agatctgaga gtcaggcaga 47700
cctggtccaa atcccggatc tgccatttcc tcactgcatg atactaaaaa agtcacttct 47760
tcatctgaaa aatggggctg atcccaccca ttctgcaggg tctcagtggg gattgaaggg 47820
ggctgacctc aatgtagcac gatgcctgcc ccaggtggga cttcagcaaa ctctctttcc 47880
tttcccttcc ctccccttga aggccaagac caaggaaaca gaattgggca tgccagaaca 47940
tatcccagcc ctgtggggtg tatttacctc cacttctgat cacagtgtgt ttgcgtatga 48000
ccttgaggcc agtgactttt acaccttgcc tatgctgggc tgggctgtga cttggctgtg 48060
acttgcctgc cctgaagcca agcctcagct gacatgtgtc tttccaccac ccctgctgtg 48120
ctgagtgagc accagccacc tgtcccattg ttcctgcccc aggctgtgtg tggagagtgg 48180
tctgacaggg cagacaacac cctacactcc agatgtgttg aggtgagctc tgggggtcag 48240
gaaagaagca gggaggggca cagtgtgaac atcctgtgca gatttccccc caactggccc 48300
cccagctggt tgggttttct tttctcagta actcctggca gaagtccaag gaggcctcct 48360
tctcccaaac cctctgtcct tggctcaaaa atccagcaga ggacgtgcca cgaccacgaa 48420
aggtgacagc agtcaagggg aaagaggact cccttactgg agtgcacaga agtttcctat 48480
ttattttgct tacgcggttg actttttcca aaggctgctt gggacggctt acctcgaaaa 48540
gcttagcaat aaggctagta gtaaatcaga caaaaaaatc atggactggg ggaaagaaag 48600
tagcatttaa atatatttaa taaggacgat atagtcgtga acatgtgcct gagtatcctg 48660
gctaccacag taaaagggga aatatgatca gttatgggaa aagagtaaaa atattaatca 48720
tgattttttt tttcttggag ctttgtgtaa taggcactga tgttgaaaag ggtagagtta 48780
tttttccata tttgtagaaa ttcagaagat tatcagacta tttgcctcac aaggactttt 48840
tagcaagcaa aaagtatgat attgtcatgc accctggtga ggggaagtgt catccagttc 48900
taggtttctg tgaatctacc ttgatgcagg tgttcaggga gtagtgagtt tcctcagttg 48960
taatgtagac cagcgcttct caaacttaaa cacgtataca acctcctagg gggtcttgtt 49020
aaaatgccat tctaatttgg gagctttggg gtggcctgac actctgccat tctaaaaccc 49080
tcccaggcca tcatgatcac caccttccga gcagcaaggg gttaaaaccc aggcatctcc 49140
catgatctag tagtgagtgc ctttctaatc gcccccagct gaaaggcaat gcaatgttat 49200
catagacggg caagaagaat ctcttccttg gctctgtaaa tgcttccggg atgtgctggg 49260
tcagcctccc tccattctgg ttggcgatct tggtctagtc acaagccaag accgttgatc 49320
atacacaaaa gtttaagtac ctactacgcg ccaggaagct ccctcagaaa gatggttggt 49380
cctgctcccc cacccaccct ccaccctggc atcttttatc cactcttcct tcagcaactg 49440
cctttatcaa tgctcccttg agccaaaata aacaaataaa aagcaacttc ctttggaagc 49500
tactccatac tcttgcgctg gccacagtta catctccctg cagatacaca gattctcatg 49560
acacagagct cagacagtgc ttcctctctg gagggctcat gtttcgagag aagactggaa 49620
ggaggacaac cttatgctcc agtagaattc caaattctgg ggtgcaggga catttcgtgt 49680
gtgtatgtgg aggggggggt gtcctaatgc cctgtaagcc acactttata atgctgtaca 49740
atattgggtc accatcatgg gccatggaaa gcagaatctg tgaggttcag tcccaggctc 49800
cagcacccct ttgtcagctg gcctccccgc tcagtgccct ctcccactac ctgccctgcc 49860
tcagctctga ctgctgctga tgtgcctcca cccatcaggt cattgtgatg gcaaagacaa 49920
tgcctccatt tgccctgaat gcagccttac ataggaaaga gcttcctgtg ctccagaact 49980
tggaggagtc ctgcagcacc tggtctagtg gggagagcat cagtggggag cggcaccttt 50040
cctgcagcca cggcccactg ggcaggacca gatccaagtg gcctggcttc tggctagggt 50100
gtcagagtac attggggcat acagcttccc gtggccatct cgttttcatg gaggatttat 50160
tttgtgaagt ggacctgctc tgtcccatcc tataaatgct ggattaatcc aagaagctga 50220
gggtgagcaa catccctctc cttcctgatc aaataagaaa taaatctaga ttttctcctg 50280
gatgctattc tcttcttagc caaacagcta accttgtctt caaggaaaaa gggcaatccc 50340
aggggctctg taaattgaat attcagcaac tccaggggca gacatcccta agtgcataag 50400
tggagcaccc ctctgaatca gcatcacacc agctgggggc ataaaaagga gagcagagta 50460
ggcaggagct gtggggacat ttctgagatg ctaaaagagg caaggaagtg tgaggacggg 50520
tgtgcattca tgcaacaggt atttactgag cacctactat gagccaggca gtgctctatc 50580
cattagagat acggaattga ataaaacata aaaatccctg cccaggagga gctcacattt 50640
ctatgggaga agacagttac tgaaaaacag tccaaaaaac tctattttat agtgtgttca 50700
gaggtaatac aggctatggg gaaaaaaaga aagcaagcag gtacatggat gaggaatggg 50760
ggcgatcagc gtgggcctca cagaaatgat gacctttcag ccaagacttg gaggaggtag 50820
ggagggtacc tggggatgcc tagggtccag gcaaggggaa cggcaggggt caggatcctg 50880
tcagattcat ctgaggtggg actgaatgtg agcagagaga gggagacaga ggatgagggc 50940
agagagaagg ccaatcacac tgggccacgg ctattgcaag gactttactt ttgctggggg 51000
agggggtaga gttttgagca gaggagaaat gcgatctggc aaacatcttg caaggatggc 51060
tctgactgtt ctatccttgg cagaggacac cagagtctgg cccatagaag gtgctcaaca 51120
aagctcagca cattgcactc ctccctggag taggaaaggg ctcgtctgct ttgggaaatt 51180
tggctctcaa gcttctggaa acacctgacc ccatgccagg tgagacaagc tcacactcaa 51240
ggccccctta gtccaacggt cagtggacag aacaagcacc aaaggtcaac ggcgtgggcg 51300
gtggcctctc tgccaaagtg tgtgggccca agtagggtat tcacctccct ccctgtctgt 51360
gagaaatttc agacccctct actttttcca gcaggagttc atgttccttt taagataatc 51420
ctctatagac ctctggcagc ccagccttca aaatgtctcc ccctgtctct cttactcatg 51480
gagagccccg cttccccgcc tcaaaaaaaa gtcttcctct ctcttactca tgcatggaga 51540
gccccacaaa aagacactgg ttcccaggga ttcttccaaa gatgctggaa gacctctcag 51600
tgtttgcatt tcccaagctc ggtttccttg tgctgtcctt gggcattaaa ggaaggctat 51660
tcagccatcc ccatcagcag gagcaggcat caaaagaaca gctactgcag ggggagcata 51720
ttaggggcac cagagggggc taggaactgg gtcttgtctt ctcaaagttt acaacccact 51780
gcaggggcca ctcaccagcc ctggcaccct aagggcagga acctccattg ggcacgtgtg 51840
tctccagcac tgggagcact gtctggcacc tggggcactg tgagtgttga atggataaag 51900
gacctgtaag aattgccata agaggtgttg ccctggggca aggtgggaca ggaaagttct 51960
tgcaagagaa gagaggctct ggccttgggc cctggctgag cagagagctg ggaggtgggt 52020
attcgggtag gaggaaagct gtggaggggg aaagcaaact gcctgcgggg gtgggggggt 52080
tctcggcggg agttgggggt ggagggaaag gcgctttaca gcagcactcc ctccacaggg 52140
agaccagagc tctgcctctt cctccccacc gtgccctttg gggtccagtt gtggggcctt 52200
ccttgaggcc cagctcctgc ctctggcctc cggaggctta tctccccaac agaggctggc 52260
tccccagaaa acaggattct tagacttcct aaaaataacc tgaagctcct tatcagaggc 52320
taatagtgta tgtctcccag gaatactcta gaaagagtac caggggtcag gaacccccac 52380
tcagcctcca cgaatctgag cggaaaagcc cgggtctcct cacctgtaaa gaaaataact 52440
gcagccggca aatgtgacca caggtgagaa ggggcttcgg accagggcgc acacctctag 52500
agaggtgccc acagacagcc tccccttact tacgccctgc ttcgctgcag tgctgtgaag 52560
ccatcggcat tggaagtgcg gagggcagcg ggcagtgccc cagggggaag gggggacggg 52620
tagggtttca gagcccagaa ggcctagaca gggaggcagc tccgggagaa aggtacccgc 52680
catcccaccg gtcttggaac ctgaggactg ctgggaaggg tcaaaagtct gccctaaggg 52740
tggacaaggg acagagattg gggggggacc acaaaggcct gggcgcaacc ttgttgagag 52800
ggaagggatc cggacccaat ctggagccct ggtctcttcc cacctgcaac cgtggctgcc 52860
acttggcctc ggttataaaa tggacaagga ttcgaggtgc tcctcaggtt aagagagggg 52920
ggcctagagg tcaccctggc ctcggtgccc tccgtggccg ggttaagagg aggtcccgga 52980
gttctgctca cttcagccgt gtgccgggca ctgcaaatca ggaagtgttg gcgccggctg 53040
gcgacctccc gcctggggcc aggggaggag ggtggttgga cgctgccacc gctgccgggg 53100
ctgtgcaggg ctgggcgggg agcgaggacc cggcggctcc tgattgcggc cccgggggag 53160
gtggccgagc cggataagct gcggcgggct ggagggcggc cacctcccct gcaggtccgg 53220
ccctcccggg cgggtggggc gcgggggagg aggagcctcg ggccgagcca ccgccttcgc 53280
cgcggacctt cagctgccgc ggtcgctccg agcggcgggc cgcagaggtg agtgtaccct 53340
cccccggtct ccgcggggct gcgtgctgcg cccggtcccc gagacgcccg cccggttgca 53400
ccctgcgccg tcgctgcgcg gacctcgggt gccgccacac gtctggaggc gacttctgtc 53460
ccctgggacc gagccacgtg cgcccggcgg cagagaaacc gggttccggg gcccccaccc 53520
cgtgtgcctt ccttccctag gcgtggaagc cgcttgcgcc gcgcaggtta ggcagggccg 53580
gcggcgacag tggcggggag caggctccgg agccccgggt gcagatgtgg gcgcccctcc 53640
ggatgacccc ggctgagtcc acaggtcccg tgtgccccac ggctggggct ctggccagcg 53700
gtcccaaagg agggctggta gctgtgggcg gggatcttcc aggctcttcc tcgccagacc 53760
tcccagtccc ttcgcagccg aacagggcag ggacaggggc aggtgcaggg gctgggcagg 53820
ggcgcccgac cttggtcccc aggaggaggc tggcctcacc agtgcccgcc tctgcccgcg 53880
gagcccttgc ctggcaaagt tccccctcct gcccggcaaa gctccccctc ctgcccactt 53940
ccccgaaatt tggggacagg ctgcccggag aggtgtggtt ggaactttgg tcactctggg 54000
taaatgaagg ggagggtgtg cccagataat atgcggtttg gggaccagaa agccggatcc 54060
gtggggagaa gcaggaaggt cccgctggag ccctggcaga gggcacagag aggcctccca 54120
aatatccagg gccacctcag agatgggctc cagaagtggg gattctggaa atgcccccag 54180
ggaggtattt ctgtccatca gagtgcagcc ataatataat taacagcaga tattcccatt 54240
tatgtgtgcc aggcatcttg ctaagggctt tgagcacaat atcccagtta atcctcacaa 54300
caggaaggca ccattatctc ttgttaaaaa tggggaaaca gcctcagaga gtccacgtat 54360
tttgcaagga tacacagcta ggaagttgca gaagtagaat ttgaacccag agttatctga 54420
cttggagccc agaggaacct accactgggg cgaaacaggc tgtgtcctca cggggattct 54480
ggcagcccca agaatacagt gctgagagcc agaaggtcca caaaaccaaa gggtctcacc 54540
tgggtgtgtc ctctcagtca cctgcaaggc ttgttaaaaa tatagatccc caagtcccat 54600
ccgaagctga ctgaatcagc taggggcacc tggaggaccc agactatgtc ttactcatct 54660
ctgtccctgg tggcctgcag aggggctggc aaggagcagg tgcttagtga atgtctaatg 54720
ggtaagtggg cggggtgggg tagatggtgt cactagtgtc ctgaaggggg cttaaatgga 54780
gcaggtggcc tcagccaggc aatccggcag caggtatgga agtgacacag tctaatgctg 54840
gcctcagagc cagcagggag ctcaggctgg gccacttgtc cacctggggg ttgaacagcc 54900
tgccccaggt ttgctgaggt ccccaggacc aggccaggtc aagctgggat cacacatgtt 54960
ccctctccag cctagagatg tcaaacaggt agattcctct cccattcata tctcctatcc 55020
ttggcccaca gcccttccct tcttggactt atcagagacc aaggtgctgg gcagggcttc 55080
aggtggttaa aaagtgaaag ttcttgagtg aagtccaaag gcgcacacct gagagctgag 55140
tgggcaaaag gtcgctggct gagtgctggg gatagtctgg ctttggagtc agatggacga 55200
gtccaaatct cagctcctta ccccgtaaca tgaagccctc agctctctga acctctgttt 55260
atttgcaaaa ccttgccaag ggcttcaaac aggatatcct cataaaacaa gtatgcctat 55320
ttgggggact aagtgtgtga agtgctgagt tttaggagtg cagtaaatat cggatccctc 55380
cttcttcacc tcaggtttgc gagttaacca gtgaggggcc ttccaggcct agtgctcttg 55440
tagaccgaac cactagcttt cctagagaag gcaactgagg cctagagagt ggcctccagg 55500
ttccgtgctc tgtggcagag ctggccttgg ctccaagtcc cagggttccc agctcagtct 55560
cagctgatgc ctcccagcct ggcggtctac gctgcctgct acattccctg tccagctaca 55620
aatgaacaac tgagagggct ggggtgagat tcaggcaggc tggggcaagg gaaggaagca 55680
ggtcatttgg ggagtcgggc tctctggtct tccagctgag gctggatcca ctctttcctg 55740
tccacccacg gtgcgtagtg gccaggtctt cctgagctga gcaggttgag cactatgaaa 55800
ctgctttcta gcatctagac cagggagttg cctcttgatt taaaatgagg atgtttacca 55860
gtttaagtag ttattaaaac ctaaggccaa gttggtgcct ttcctccctc taggagttgg 55920
aagggtgtgt gcttttttct gctcctaccc cacccctgcc aaaccatccc aatttgagag 55980
gctgtggaga ttacagaact tggagaggag aggggcaggg atcggggttg gagactagat 56040
ggttttcaaa cattgggcta cagaagtccc tcttcctccc atctgtctcc tgcagctggg 56100
tccacccacc tgtccaacac agcctcccac aggtcccggg cctctttgtg ctccaaccgt 56160
cacatccttg gcatgccaca caccctcacc atcctgcctg aaatgccagt cctcatcact 56220
gacattcagc ctcccatgtg ccagcatccg ggccaaacac tttatctaca ggagctcatt 56280
tgtacctgga gactcttagg aggtcgataa tgttattctc ccaaccatgt gactttccaa 56340
ctccatatgg accccaacct ctttttttcc acccctaacc tgagactcct agccactaac 56400
taactgccac attctcctgt ccaaattctg cctcatcggt tattcattca acaaacactt 56460
accgagcact aactttgagc caggcactct aagaccagct gagtcccact tctggcagga 56520
tgagtgttgt tgtcatcaac caccccacaa acacccgtgc cctctgcgta cttgcgaatc 56580
tgagtgagga gacacggtgg cagtaaggct caggacctat agctcatgtg agtgagcaag 56640
gatgcaaaac caaagacacc cgctcccctc acccactgag ctggagggat caaccactgt 56700
gcctgccatc agggctgatg ggcgactgct tgtggatcac aaactcttgc gttgtcactt 56760
caacccaggg gcagagtgtg ttcctcttca ggtgtggcct ggtctcgtga gccctgcact 56820
gaatgggcca ggcgttcatt gcttcagcac cgtaagaaca ctgtcaccgg agaattgttc 56880
gatactcaac tcttcccagt cagtctgtct tctgcatgcc cacagttacc gggcagcgtg 56940
ggcaacaagt gagcactgat tgttccgcaa tcaggctgtg acttactcca tctctgcctt 57000
ctgcttaatg agagccaggt gggagttcag caaagatcac atgtttaagc cttgttatta 57060
aacacgttaa aaaaatactg ccccaagatt ataaagccga cttcggtaca tataaagaga 57120
tttggggtcg gtgaatgggc ccactaagct ttattttgtg gtgtcagctg tcttggttca 57180
tgtgtagaca gcagggctcc caaagccagc atgctggggt ctgtgaggga acaagcttcc 57240
catttcttgt atttatttat ttatttattt atttatttat tttttggaga cagaatctcg 57300
ctctgtcacc taggttggag tgcagtggtg ccatcttggc tcactgcaac ctctgcctcc 57360
cgatttcaag caattctcct gcttcagcct cctgagcagc tgggattaca ggtgtgctcc 57420
accacaccca gctaattttt gtattattag tagagatggg gttttgccat gttggccagg 57480
ctggttttga actcctgacc tcaggtgatc cacctgcctc ggcctcccaa agtgctggga 57540
ttacaggtgt gagtcaccac agccggctgc ttcccatttc tataagcatc cgactggtgg 57600
ggtggccagt aggctgtggg gagtggtgcg tgattttcct ggtgggcttg agagagtaac 57660
agtatacccc cagtcagggc aagtgtctct ctgaaggtga actctgggtg cacagctaga 57720
ggatacagtg gctgtgagct gggccctcca ggtgaggtct ggcctgccca ttgccacagt 57780
gggcttgctg gcatccaggg gggctttctg ggtgactgcc caggcctgca catgagtcag 57840
tagcacgctg aatgcagtgg agtttgaggg gacccaccac tgtccatcaa atcgccccaa 57900
cctgggtgaa aggccagagc agctgcggga agtgacacca ggccctctgg agatgaccct 57960
ctggcccttg gagatgtctc tggactggcc agaaagaagg tggtgcctgg aactggaagg 58020
gaaggaagca agacagtgct gggcccagca gccagaaatc agggtgatgg gtgggtggag 58080
gggcaggcat ctgggaaagc cctgccctcc tggtgttccc agatctgaag gctggaggct 58140
ggaaaccttg tgtcacctgt gctggtgtga gttccattgg ggctgccgct taccctccca 58200
tgacctttaa catctggcat ggcttgtggg gggtgctgag aggaggagaa gtctcaaggc 58260
tgagggagct cagggtagag ccaaggtctc agtgagaacc ccagggggca gctgtcacag 58320
ctgacctgga gccctccagg aacgcgtact ctccagctcc tgtactctca aaagcaacag 58380
aaaggtttgc tttcctcagg tgcggtttcc tcacagtgca gcttctccaa agagatctgg 58440
agacccccca gcagctttga caggaaaata gagtcctatc caccccacac caacacactg 58500
aagtagagac tctgggcctg gggctgccca gaaacccacc cacttaaact gcccgggcga 58560
ttctggtgtt cacaaatatt tgaaagcact gcctgacacc tgctggctca acaggtgtcc 58620
acctaggctg gagtacagtg gtgccatctc ggctcactgc aacctctgcc tcccaatttc 58680
aagcaattct cgtgcctcag cctcccgagc agctgggatt acaggtgtgc tccaccacac 58740
ccagctaatt tttgtattat tagttcacct aagcagagag cgatgtgagg ggctgtgagg 58800
atgtgcaggg gtggagggca cttaggtccc tccctcagct gaccatagag cacccagagt 58860
ggcagagggg ccacgtgcag tgagtggcca cagcagagca aggaaaggtg cacacaagaa 58920
cagtcctaag gaagacatgt gtttaggggt ttcatattca ctgtttaatc atcaggacag 58980
agagggaaag caacctaccc aacgtcacac agctagcaca tggctggacc ggaattcaca 59040
cacatctctg tccagctagg tcccccaact aacacagctg cctgtctgaa ttcaaagccg 59100
ggagagattg tcaggggtgg gcgttggggg agatggcagg tgccttaagt gcccaaggcc 59160
ttgggctgga tctttaagga agggggattg ggatgggcca ggaggttgtc aagattggag 59220
atggaaagaa tgccattggc tgtggtgggg ggtggagtgg gcagggactg gaaggagggg 59280
tagtggaagt cagtccctgc ctacaggcct gtgttagact ccgcggagat tcaggaatct 59340
agccctgccc acaggggctt tcactccagt agaagagagg agacccaggg ggccacagca 59400
gtcagagaac aatgaggcct tggcttggtg tttggtgatg ataggggaaa cctgcccaga 59460
acctgtttat cagatgctca gggatctgaa aaacaggttc tgcatgtggg cttgagataa 59520
agatgcccgg gatacttaga tgtgccctat tccaagatcg ctaggttcca aacaagttga 59580
aaacaataga atacacttat ccctaagaat gggcttgcac ataattcact tcaacaatgc 59640
aaaagcttcc aaacctccag cctcctttgg gctgccggtg tggcctccaa ggtccactga 59700
aaagccatcc ccagccagca gaaacatgcc tgtgtcttct tcagcccccg tccatgcttt 59760
gccctggaga caagtgctgt catctgtttg tgggtctgtc tgtctgtctg tctgtccgtc 59820
tttctcccca ctgtgagcac tgacaagcaa gtaaagatga caatgaagcc tttgtgggca 59880
ccaaatgctg acagcattat cactaagcca gtggcagcca tggtgactgc aataaatttc 59940
ccccacagaa attgataaat tgccactttc tgcagccatt atgtttgcct ttgtatcccg 60000
aagagtaaac gcctctctcc ctttctctct ctcgctcacg tgtgtgtgcg cgcgttagat 60060
gacatttatt cattttatgc atcctgggtt ctactggtcg tcccacctca gttcctgtag 60120
caaagagact tgagtctgag ccactaatta tcacccgtga ggtttcctcc ccgagcagga 60180
agcagcaggc cagagctgcg ctctctcagt gcactctcca accaagcatc agtcaccact 60240
cccggtccag cccctgtggc caagagctgg cgtgcaggct gcgggaggca gctggctgtg 60300
caagaccctg gcagggccct cgcctcctga gaaaccgaga gtcagaacca aagccaggct 60360
gtcctggttg gagactgagc cagaaagggt ggctcacctc acggtgaggc tgtcgagtga 60420
cctgagagcc tcagaccctc acgtcagccg gatgtcgcac cagcctgctg ttggtaagtc 60480
tggctaggac gcagatccaa gggggcatgg gtcgtgtgca aacccctccc accagctccc 60540
tcaccacctg acccctgccc tgctggaggg tgccccttga atctccagga ggtccgagga 60600
actcgacacc tcccagagat ctgtactgcc ttggaacagg ctgcaaaaag tgcagtatga 60660
aatgggaaat atgtatcagc tgcacgtttt catggccccc tttggaggaa agggagtcca 60720
ggttattaag tcaggaggct tttaaatttc aggggttcaa ggatttatca cacacagttg 60780
cgtgtgtgtg tgtgtgtgtg tgtgtgtgtg tgtgtgtgtg tgtttaagga tgttaatgtt 60840
tatgatgcat ttctgtggaa tgcaggccca ttgggaattg taaatttttc ttattggtaa 60900
ccatttctgc attggtttag cacggaactg ctgctgcaag taaatgaacc agatttttct 60960
ggaatgattc gaaaatctag ctgtttgtaa aaagctctct aaattattca ttcactttta 61020
ttttgcacag ttgtgtgacg gtaaactctt ttccatcaga cgaaacttgc gcgcacgtgt 61080
atttctgcgg ggattggctc gagtgtgctt gagttttctg tattctcttt tgtaggaact 61140
tctcagcctt ccttttaaaa agataataat tttttaatga tgtctaaata atgattccag 61200
gcagtattac aagaaatata acagtaaaac gtttgtaaga gtccatcaga aagggaaaat 61260
gcccacagag aaaaatagaa atctaccaat tagatgtgtg tggctataag tgagctttta 61320
aaccatgatt tgagactggc atcctctggc ctctctgccc tcaggtcagc tgtgggaggc 61380
taggggtggg atagcaaaag ggacctggga tcaggtgggg cttcctggac cccaggccca 61440
gtaagaatga agcctagggg ttctaggata gggggcagcc ctggatttgc agaaacagcc 61500
tgagaatgag gggctggaaa gtatgagttg gagcagctca gtgaggagac agaaaactga 61560
agcagaagaa agcagaagac accagagtct ggtgctgact gggtgactgg ctgttactca 61620
catcctgagc aatgagccac agaccctccc caccccagag gcagcttgaa tgcagggact 61680
ggatgggccc agggcacagt ggatccgggg caggcaagag ccaactcggg gcccagagga 61740
ggacctttaa cctgactggg cctcagtttt ctcttctgca aagtagaagg aattatagcc 61800
ttctgcaggt caaaccctgt gcccacatcc acaggcacga tccccgactt cgcctcgctg 61860
gcacttctct gcatttgact cctggttatt gcagctgtgc ccatgccagg catttgttag 61920
gtgctgggat gtgcctgccc cgctcctctc tgttggggaa gacggaattc atgctgtagg 61980
ggaggcccgg agtttctaca tggggcagtc acagggtggg ggacttccct gaaaacttct 62040
tatttgcata aaatgtgcgc tgcttttgac ttatattgta aatttcagat ccataaaatg 62100
ggaaagactt tgcagaagct gttattcact ttacctgact gggagatgta gattgttcat 62160
atccaagggt gttagtttta atactaacat tagcatgtgg ggaagggtga tcgagatggt 62220
ggggagtagg gccccccacc acctacccct gggacctcta agggaaagta cacaccaccg 62280
tatgctagtt gcatcctgtt acctgtgctg cagagccaag gggccagagg cagggaaatt 62340
aattctgcct tgtaaaggca ctgggccttc ctgttgaatt ttgctacttg cggggaaggc 62400
acttcccagg caaaaagatt aagcctataa cctaagcaga aagcaagcaa gagctttggg 62460
tgggaagtgg ccagagacat agatcaggca gacccaggtt tggaagggcc aaggagacag 62520
cacatctgcc aatggcagca gctgggcctc acctgccctg acacccccac ctaatgggga 62580
ctgggcagaa ccctccaaat ggttgccatg ccctggccca ggagcctcca aaaaccctga 62640
agccattgac tcagcatccc tgaagcctcc ttccatgagt acccccatac caggctgcac 62700
ctcaatgcac cttagatctg gtgtttgatt ttcactttga ccagatctgc agcagtctct 62760
ttgttaatat ttatttccag tgtttacatt catctttgca taagtcctca gtgttactaa 62820
gtttatcaaa tagcgaaatg cttggccagg tctaacaatg tcaccaagct gcagaaggga 62880
ttagaaactc atagtattat tatttcatca ccactgagta caagagagcc ccagctaggt 62940
tctggggaga acagctatga ctcacaaata ctcccctccc aactcacaaa tactcccctt 63000
agaatctagt ccttaaatca ttcaaaccac aaaaatgtat tgagcactta ctgtgtgcta 63060
ggccccggta ggtgttagag gcacagaaat gagtttttta ttggccccca tccaatgagg 63120
tgacagacaa gagaaccagt gtgtgcagcc aatgttaatg tgacaaaaag tgcagagtta 63180
gtcccagagc gtgaagtcct ccctgtccta ggcccaggtg gaggccagga gctgctcccc 63240
gggctgcctg gaccagactt ttgagctctt gggaccctgg cgaacatcaa agctgttgca 63300
aaagtcagag ctcttgcaaa agttggagct ggcccatggc aggtggttga gaagtggcta 63360
catgactctt cccatgcaga gcggttagag ggtggaggcc gatttccagt atccctggga 63420
atccaaagaa agaggccact gaggggcagg ggagggcccc tccgaggctt ccagaaaaag 63480
gcagtgcagc agctgggcaa accaggataa ggcatgcatc cctaagccca aaaatcaggt 63540
gatgtgaggc aggccgagct ccatggcaga catgctgagc tgcctctgtg tgtcttggct 63600
aactctgccc tttcctaacc ccacggctca ccctgcccag gagcagggat gaggcccatc 63660
cctgattcag caaatcctgt gccataacaa ggggaggggt gggggcagcc acagcccaca 63720
agacccacca gtcccagggt ttgtgcagct ccaggtctcc ctggaaagca agaaaccacc 63780
cagctccaga cgctgaggct gcagattcag ctgccactgc ctgatggcct ccaacctggc 63840
tggattaact ggcccatagg gagctggctg cccccacaag ccagctccct ggcctccctg 63900
ggcaaactaa agccctcctc cctggctcca tagcgcccgg tcatcccctc attccagcac 63960
tttgcttctt cctgcattgt gtagctggcc tttctcctaa gagccttaaa agggcaggtc 64020
atctttggcc acctgcatgg ccccggcgcc ttgcttcatg ctgggtacac agcaggtact 64080
ctgggaataa caaataagag aatttgtcag aggaggtttg gcaggatgga ctattgcata 64140
gaactgcaca gactgtgcac tgcacgcctc cagagggcac tctccacagg gattactatg 64200
taaatggcac ctcctaaagt tgtgcagcat agggacccta gggcttgagc atgccccacc 64260
cgcctccgct gcttcaagcc cctggccttg gtgctgactg ttgggctttc ctcttcccct 64320
tcccaaccag cactgaccat catccttccc atacgctggc gatgggtagt aatgaactgt 64380
cccagtgagc agttctccca gactgggctg tcaaagcatg ctagtgagag attcctggat 64440
ggcaggcagg ccatctggat tcttgctcag ccaggaaact ctgtcctctg ggaatatcct 64500
cccagtcagg gtgttagggg gctcctggat ccccaagatc ttcatggtcc cctagaactg 64560
ctcctctccc cagcctgcag tgggcctaat gacccacatg tagccaggga gtggtcccca 64620
tggggtttgt tttattgact cagctaacaa tgccacaatg actctgattg ccttcttctc 64680
acctgagaga cccagctctg ggcagccaag gggtacgtag ggacagagca tatgcatgtg 64740
accctcaaga tctagaggag ctcagagaca gcatggatac tcgaagcccc cgtgagcagg 64800
gaggactttc tggaccaagt gggctgggag ctgggccaac tgtaaagacc cagggaaaaa 64860
aaaagtcaaa actgagttgc tcttgcatgc aagtgagtgg ttagttcatt gactccgtcc 64920
acagcccttt cctgagcagc tactgcagtg gttttcaaag tgtggtcccc acaccagcag 64980
caccagcaat tctggatgtg gagcccagca atatgttttc atcagtcctc caggtgaccc 65040
tgatgcagct caagtttgac ctgatgtgtc ctaagtgctg gggtttgcaa aagtgagttt 65100
tacttagttc tcaccttgag gagcttggag tgggggagaa gatagacagg aaagaaaaca 65160
gtactgtcca gtgagacgta ttgctctgga gggccatgga ggcagaggag cagttggtat 65220
aggcttgatc cttgcaaggg taagtggcct ggagacccca gtggcatgac tgtcctcggc 65280
agggaaccag atgttgggac cagcatcccc tagagggctc aaggagccca gtgccgaccc 65340
cagtgcccca gtgcccagcc accagggctg tggccctgag cagcaggtcc tcctactctt 65400
ccctccaccc cagatcttct gctctgctct tcccccttct tcttcccact cccaagtccc 65460
aaatagtagc aggtcttttc ctccgattgt cttggggaga aatgggcatg tacctccagg 65520
ccattatctt agagcacatt tttagaagat tttaaagtaa atttttccat taggcagaga 65580
acaccgtgta ttgatttggg tgcatctatt tctgctttac ccagacaaaa agatttacaa 65640
aatatcctag agaggaatag aattaaaaat gagtaaattt aacaggctca gagcgtagca 65700
ctttatttgt ctcatataat ccttgccaca cctcattaag gtgaggaaca tcagcccata 65760
gtgcagatga ggaaatgggg ctcaggaagg tgaagtgact tggccgggcc gccagctagc 65820
aagtggtctg gtgggatatg aaattccatc cctctgctgg gcccttgctg gctgaccttg 65880
cagtttacta aggtgactga tcctgaataa atccagagtg ttctaacgtt ttgctgagcc 65940
cgtgtcctgt tggctgcatt gtggggagtg gcctggcctg gctagggaag ctctcagtga 66000
ccaattgtgg cttcagctgt gttatttaga gaatcccagg ggctgaaatg atcctctgcc 66060
tggttaggga agggatgact ttaggaggaa gagggaccta atgccccact tagcagatct 66120
gcagctgtgt gcatgtttcc acctgcacat ccttctataa accctcagcc atgtgggtga 66180
gcagcagacg gtgcctcccc cactccccct ggaacacatc tgccctgttc actgacctgg 66240
gagctggtgg ggtggacctc agaccccagc acttggcaca cacacatcat cccctgggcc 66300
ctggaatggc ttgcatggat ggcagagaaa tagctgtgtg agcaaaggcc aagagaacag 66360
tttagcccaa ggcaccattt ttacaacaac aacaggtaat ggtactgatt atataagcct 66420
cacttgtcca gaggtcacgg ggcttaggaa cctcaattat gtggaaaaca aataggacat 66480
aacttcagaa ggttgcagag ccactgtgct agtgtggtct ttgtgttgct ataaaggaat 66540
acctgaagct ggggaatttg taaagagaaa aggtgttttt caaaaggaag acaaacattt 66600
gaatgctctg gatttattca ggatcagtca ccttagtaac ctgcaaggtc agccagcaag 66660
ggcccagcag aggagtggat tcatatccca cctgaccact tgctagctgg tggcctgggc 66720
aagtcacttc accttcctga gccccatttc ttcatgtgca ccatgtgtgc agagatcacc 66780
tggggagaga ggaagtaaga gagagagaga gggtagggag gtggcaggct ctttttaaca 66840
agctgctctc gaggaaacta atacagtgag aactaacagg gaacttactt gctcctctgc 66900
cctcccccca gccagggagg gaatccaccc ccatgaccca aacacctctt attaggtgca 66960
cctccagtat tggagatcag aattcaacat gaggtttttg ggggacaaac ctccaaacca 67020
cagcagccac caacattggt gttacaaaat ccatccaatg acataggctc atggagcgcg 67080
cttaagctgt catccaaaac atgtttactc ttggtttaca cacactagta gcagtctgcc 67140
atacctcaat ttcctttttt attttaggta acaacttttt aaataacctt actgagctat 67200
gcctcacatc accacgcaat tcacccattc aaatggtgag ttgcatggtg tacccgtgag 67260
gatcactccc cattttctcc aaatccccca ttctggccac cactaatcta ctttctgtct 67320
ctattgattt gtttattcta gacatttata taagtgtaat tatgtaatgt ctggcctttt 67380
gtaattggct tctttccctt aatgctttca aggttcaccc ctgttggatg catacttagt 67440
tctctttatg gctgaatatt aatccaccgg atggataggc cacattttgt ttaaccattc 67500
ctcagttgat ggacgtttga attgtttcca ctttttgggt attatgaata atgggtgaaa 67560
atgtttttgt gtggatatac attcttcctt ctcttggata tatagctagg agtggagttg 67620
ctgggtcata tagaaactgt ttaacgtttt gaagaattcc caggctgttc tccacggtgc 67680
ctgcaccatt ttacaatccc agcagcagtg taggagggtt ctgatttctc cacatcctcc 67740
ctgtctttta aaaaaatata tcattgtagc catcctagtg ggtgtgaagt ggtatctcat 67800
tgtggttttc atttgcattt ccctgagggc taatgatgct gaacatcttt tcatgtgcat 67860
ttgtatatct tttttggaga agtgtctttt ccagtctttt gcccacttta tgtaggttgt 67920
ttgtcttttt aataccgagg tgtaagagtt cttcagatat ttagaaacag gtccccttat 67980
cagttatatg atttcctgaa cttttctcca ttctgagttg gctttgcact ttctcgatgc 68040
tgtgctcttt cgatttcgtc agcagcgaat tagcaggacc tggggggctt taagaggtga 68100
gcaggcagac agacagcgcc cacaaagtcc tgaggatgag agaagaggca gagcttacac 68160
aaaggctctg tgaaaactga agatggaccc caggcaggtt ggggtgatcc ctggggtgct 68220
ggatgaggat ctgattttgt actgcatttt ggaaggattt ctgcccccag aggctacata 68280
ggctccagtg gtgtgtgcag tcaggcagag agatgcacag aacctctaca gtgtgccagg 68340
catggtgtgg ggttctgggt gcatgtggaa caacacacag caatcttgcc ctcccaaagc 68400
tcagggaagt gggggcgggg ggtggacaac gagcacatga gaaaaagacc acaggggaag 68460
aactcccaga aacatcccag ccacagcgca atgccccagg tgtatatggc ccttggctac 68520
ttcatgccct tgagggaaaa tcggtatttt cattttacac ttgatgaaac aggttagaga 68580
aaggactggc gtgtccagta cctcccagtg agaagatact cagagtagac cccagatcca 68640
ggtccttcct ctttccctct ctacacgttt tcagtctaga aaagagttct gtgcgagaat 68700
ttttttgttt ttgtttgttt gtttgagacg gagtctcact ctgtcgccca ggctggagtg 68760
cagtggcgcg atctcggctc actgcaacct ccgcctccca ggttcaagcg attctcctgc 68820
ttcagcctcc ggagtagctg ggattacagg cacgtgccaa cacacccagg taatttttgt 68880
atttttagta gagatggggt atcaccatgt tggccaggct gtgtgcaaga atttatgttt 68940
tcacttgtgg cttgctgagc cctggtgctg gctgtgggca catactcgtt cacccaggga 69000
catgcactgt tgatgggtcc ttgcactctg ggctatcttg ggccccgttt gctcaatgca 69060
ggcccctctt tctgaagcgc ttttcttggg ctcactctca attcgtcaaa gttcggctca 69120
ggcccacctc ctgcaggaat cctcccagtc cccgctgtcc gaagtcagta cccttgtcag 69180
gagaccttaa acactttagt ccactgcctg gccctcccat ggggcaaagg tctccagggt 69240
gtgtgtgcac ttccttgggg cttcttaagg ctcattccct gggattaggg aggacataca 69300
gagcctcctt gcacctacat ttgtttacat attacttata ccacatacaa cgttataggg 69360
cactgctgca taagtgtaca ttttgaatgt attttactta taaagaaata gagcagtaat 69420
aggaacatgt gcccctaaat gtaattttac tgaccagaca aaaaaaattt tttttaattg 69480
aaaataagta gctggacgtg atagcatgcg cctgtagtcc cagctactca gactcagaag 69540
tctgagacaa gagaattgct tgaacctggg aggcagaggt tgcagtgagt cgagatcgcg 69600
ccactgcact ccaggctggc gacacagcga gactccgtct caataaataa ataactaata 69660
aataaacaaa aatttaaaaa aattgaagat aactgtgggc tgcttgagga caagaactgg 69720
gttattttct ctctctttgc tcagtcagtc cccacatggg aggcgtgcga ggcaccccgt 69780
tcttggcctg caggccgccc ccactccatc tggctgcagg gtgccacagc cagcctctga 69840
ttgccagtgg ccccagcacc tcaatccata ccgacctcac agcaaaccct ccgtggccac 69900
agcctgccct ggccactcat gtctgaaagg tgatcggtgt ccatgaagaa gaggccatgg 69960
ggctgtggat gtcatgtggc caactgttag tggcctgcgc aagagcagac aggagctggc 70020
aggcaggccc atgggccagg cgtggctccc agccataaac acaggctgta gccctgccgg 70080
gaagaaggag gggacagaca agcctgggca gagacccaga ggggaccagg acacccgatc 70140
ctccatggca gttctgtcca cagcttggga ggagaggcag gcaggtctgc aggcaggaga 70200
caggcctcgg cccacagagc tgcaatctga tcccatctgc tccctctcca gttctataaa 70260
tagaaccccc agggagccag ggcccagaca gggttagtca caccctcacc tcaggccgca 70320
gggacaggcc tctgggactt ccaagacatg taccacctgt cctgccccca acccctgcca 70380
gccttcagca ggagggttca tgctgagcat caggaggggg cagaagaatt gaacgtggcc 70440
actgtccatg aagaagttag agaagagtac acacaacaca catgcacaca agaataggac 70500
acgtgcacac acacacacac atgcatacaa gattaggaaa cacaagtgca cacacaacca 70560
gtcagaaatg agctctgagc ttttacacat attaactcat ttcatcctca aacagtcttt 70620
agagaggtat aattagtgtt cccgttttaa aggtgaggga actaaggcac agaggagcta 70680
tgtaactcac ccaaaggcac ccagctactg gcatgtgagg ccatgatttc tccccagcag 70740
ccccacccac agcccgtgcc tttaaccacc tgcctgaccc ctcccagcca agtggctccg 70800
tccctacatc agaaaggtca aggaagaggc cgcctaggga gcagtacaag gcagcattac 70860
aacctggcat tttcctgttg cagactgcat tttggtggca agagaagctt tggaggtgct 70920
taacgtttag tttgcattta tcctaccgct gaaaagcagg gacccttagg accataagtc 70980
taggactttt catagcaccc tagactgctg gggatgaaag gggcttggag ctgagctggt 71040
gcagcagctc ctgttagaga agccacccag agaggcccag ggacctccta tgtcccagcg 71100
ccagttaggg gcagacgtgg gaccagctcc cctcggctgc agcggcctcc atatcagctc 71160
cctggaaggg agcagatgcc aagtcaggtt ctgagcaaca ccctcaaggc ccagccctgg 71220
caatcccttc ccacctgtga ttaggtctgg ggttcaacaa aaataggact caaaatctgg 71280
atcttctcgc cttgcttcac tttgggctgg ttcagttttg tttcgaggta aatcattcga 71340
ggtttttcag ggatcctcag atgcatgtct gcgtgaagcc gtcctggctt ccccttcggc 71400
tgccccctgg gcaagagcct gggccatacc tgtgccattc ctgagctctg tctctagctg 71460
ccctatgtcc agtcattggc gatgggtctt attcaagccc cctttccccc aacccacact 71520
agattgtaag ccctcagggt ggggaccgct tctcactcat ccttatatgc ttaggagtgt 71580
tcagcacaaa gtcactcagg agatggcagg cagcggggag agggcagaga cagaggagag 71640
gcttctgtcc agagggttcc tacttaggat catccaaatc atcagcaaat gttggaaaga 71700
tggtctgggg gcctcaggct ggctactctt cctccccatc agggcaaaac tccccggggg 71760
cttgtgtctc cctgtggttg gggacaggcc tgggtgtatc tgtcccagcc ttgactgacc 71820
acaaggggag acttggccct cccgaccaca ggagaagagg gatttgaatt cacctcggcc 71880
caaattgcag atgctggcct gcgagccctg aggccatctg caaggctcct gggctgacat 71940
aactgtcacc cagctcttca tcctccttcc ccggggctga aggggtgcct gcagggtctt 72000
ctgccctccc tccacctggg ccctactgct ggcacggagc ttcatttctg ttggcagcca 72060
gtgtttgctt agtgattact gaatgccgtt tgctgggtgc ttatgatgtg ctcagcactg 72120
ttctaagtgc tttacacaat tgacttattt actcctacaa cctgcccata agggaagtgc 72180
tgccatggtc tcccttttat agctgagaaa actgaggcac agataggtcc atggtcacac 72240
agttaacata aggcagagtc aggaccagaa tccaggcgga ctggctccag agcccggctc 72300
ctggaccgag cagccttgag tagggacctg gtgcagaccc gcctgccgtg gactcactat 72360
aggatgggtc aggaggcccg ttgtcaccta caaaatgtag cccaccaccc aggaaacgct 72420
cccagaacca ggcagaaaat actgtctcct attcacaggg tggctgtgcc tggcgtgagt 72480
gtcttggcgg gtgcctgcat gtctgtgcag gagtgccacc cccatctgtg gactcggaaa 72540
gcatgatccc cacaaaagca acccctcaga gtctcagctc agccaatccc tgttatcctg 72600
tgacaggcag ggccatgttt caaaaccatg ttaaagatga gcaagaggct aaggaagttt 72660
cccatgctgg cagaggcagg acaggaacac atgtcccctg actcttgaca ttgagaatgc 72720
acccccttcc acccacctgg cctcttgtcc cagccagtgt ggtcccagct atgcagctct 72780
ctgggacatc tctggaaagc tcattgttct ctgtctgggc agtaagacgg agtgaggctc 72840
tgactgccga ggcagacaga cctgcctcct gctcttcctc ccctcaatta tttgtgctgc 72900
ctgaaacaag ttcctgagcc tccctgagcc tcagttccct cctctgtaaa gtgggaatga 72960
taactgaatc tacttcctgg ggttcttgtg aggaccagag gcccatcacc cgaggaaagg 73020
cctgacagca gcaatgggtg tatggtaggc atccattaat aggaactgct gctgctgctg 73080
ctgccttata aaaggaaaaa tcacagtttc aaaaacctct taagattgca tgatttgtca 73140
tctgagagca gagattgtga tctccattga caaagatgga agctggggcc cagggaggca 73200
cacagacttg tctgaagaca cacagctgct tcatagcaga gccgggccca gcctcctggt 73260
tcccctgccc catctttatg tcagtccctg gatccactcc ctcacctggt caggtgtcca 73320
gaggttccag gagagtgttg tggaaaagta ggaagaggca gacgcccatg gagggtgttg 73380
aaagccaccc cagctgctct gctgcttcag ggcaggggat cttaagccct gtggaactgt 73440
aggctggtga agcttgtgga cttctgctca gaataatgtt cttacatgca ccagacaaaa 73500
tagcttaggg ttacaaatga aatatattat atggaaacac agcgaaaata ttttttaaaa 73560
aagactacag tagcattagg catgcttctt tattagcaca ttaaatgaca agctctagtg 73620
gcagatctaa tgtctaccat aattttattt ttacttttat tattattatt attattatta 73680
ttattattat tattattatt ttgagatagt cttgctctgt cacccaaact ggagttcagt 73740
ggtgcgatca cttcagtctt caactcctgg gctcaagcga tcctcctgcc tcaatgtcct 73800
gagtagctgg gacgacaggc gtgtgccact gtgcctggct aatttttttt ttattttttt 73860
agagatggga cctccctgtg tggcccaggc tggtcttgaa ctcctgacct caagcgattc 73920
tcctgccttg acctcctgaa gtgctaagat tacaggtgtg agccactgca cctggctagc 73980
atggttttaa atttgtgctc aatttaaatg gtattaggat aaattattta caggtaaatt 74040
tatgatatga tcttggtcag tattaatgaa aaattatgtt gcctaccttc atacttaaag 74100
gaaatagcaa attttagtta gaagttggtg acaattaata tataataatt tttccatcca 74160
agtttactgt agaccgatgg cccgagttca gggtttcctc cacatccact catatcttgg 74220
gctcagcaaa gaagatcaca gggcacccac tctatcttag gggcccattc acttgtctct 74280
cagtcctgcc ctcagagatc aaggtttggt gttcattcat tcattcattc agcaaacact 74340
gagcactgcc tccgtgccag gctatgatac acagtgaggt ccaaggtcag atgagatgag 74400
gtcctgccct caagctgttc accatgcttc agggagagca taagaagaac tgctccaaga 74460
tgcaaaatgt agacaagcat agggacatgc tcacccttcc tggtcatcaa acacccagcg 74520
atggtgaggt tggggttaga tggtcactcc tggctagtga cactgtccat tgcctaatcc 74580
ttttgaaaag aagtatggca ctgcatcaca ttggtcatgg aaattccaga gttccctttc 74640
ccagcactct cactctgcca gtttttcccg aggaaatcat tcagcaggag ggacaaaggg 74700
tggagggcag aagtcatccc tgctcttcct gagtctgtgc tctccccagg gaaggggctg 74760
tgttgtgttc agcttgttcc cctggtgctg acacgtggta gcactcggtg aacacctgct 74820
gggtgaatgt ctgactgccg tgtagttacg atgtataaga ggagggaggt ggcagaaggg 74880
gcagtccagg agccctccac tgaccaggtt cctgacttct cttgcagcca ccaaaatgcc 74940
agaagagatg gacaagccac tgatcagcct ccacctggtg gacagcgata gtagccttgc 75000
caaggtcccc gatgaggccc ccaaagtggg catcctgggt agcggggact ttgcccgctc 75060
cctggccaca cgcctggtgg gctctggctt caaagtggtg gtggggagcc gcaaccccaa 75120
acgcacagcc aggctgtttc cctcagcggc ccaagtgact ttccaagagg aggcagtgag 75180
ctccccggag gtcatctttg tggctgtgtt ccgggagcac tactcttcac tgtgcagtct 75240
cagtgaccag ctggcgggca agatcctggt ggatgtgagc aaccctacag agcaagagca 75300
ccttcagcat cgtgagtcca atgctgagta cctggcctcc ctcttcccca cttgcacagt 75360
ggtcaaggcc ttcaatgtca tctctgcctg gaccctgcag gctggcccaa gggatggtaa 75420
caggcaggta ggttctgggg gaataatacc catcgtaaca ataaatataa atggctaatt 75480
ttcatcgagt gctgccagca tgctcttttt gatatgttat cataactaat cctgcatcac 75540
tgcaaaattc cattttacag aacaggaaat tgtggctcaa agacattaat gatcttactg 75600
aaaattccat agctggtaag ttgggatttg aacccagttc ctatggatct gaaacccatg 75660
ttctttctgc tatggtaaca gggtttccta gagggcaagg aggaaaaggt tgatggcttt 75720
ttgctatttg gagccaagaa ggagagagac ttggctttta gaattggact cagaaggagg 75780
aaagtaacac acttatgtac ccggccctga ggaaggcagg catgtctcaa attttatcgt 75840
atttattcta agggcttcca agaactgatt tctcagaaaa gtcaacagca ggtttttctg 75900
gggctagata atggctccac ggaacagcta gagctgcata cgtttcttgc cacgaggagc 75960
tcttaccaag acaaggtggt ttttaatgcc accttggttt ttaatgcatt ttcttggcga 76020
aagaatgcca gactccatgt gtgagaactt ccaccagtga gtcgagccca ggtgccaggc 76080
tctgtaggac agtttaaagg tgcccagcca tacctgacta cagcacctta aatgcaggct 76140
gcatcatggg actcccaggt atggaccagg aggaacagtg gagagtgttg gatgcagggc 76200
ctggagggaa cggagcaagc aagctggctg gaaaagactt ggaggagggc tttgacctgg 76260
gcccacctca tgctgtcagg ctcagggagc agggagtgca ttccagtctg agggaacaat 76320
ctgaaaaggc acagagataa gaaacaatgc tcctagacct cagttttctc acctgaaaaa 76380
tgaagactat agtacctacc tgcgggctca tggcaaggct gagagatcat atatgtaaag 76440
ctcagcatag agtaggtgtt cagtctgtgt ttggagacta aactgaccaa tgcagtgtca 76500
acaaggccca cggggtgctt ggggatctga ggactgcaat gtgcctgcag ggggacctcg 76560
tgggtcagag cagcgggctt caaggcggag agggcaggct ggagctggct tgtagaaggc 76620
cttatgtgct ggctgagggc tctactgagc cgagggacat catcaagggg ggtgattctg 76680
aactgaggga tggagctgca gccacagctg cccattctgc accatacgca aaactctttt 76740
gctgagcggc tcccagggca ggccacggcc ttggagacag ccatgtcggg ggcccatggg 76800
gactacctgg atgagcattt tgcttgtggt tgctgatgtc cacgagctgg gcaagatgct 76860
tactgtttgc agcttccctc cttgagtagt tggcctggct tggcaggtgg gccagaggct 76920
gggaggcctg ggcagcagag aaaagacccc tagcctggga gctagaaccc cattggctcc 76980
cacctgtacc attgactggc agctcacttg aacaagtccc tgcccctctg gccctcggtt 77040
tcctcagctg ctcagtgagg ccctgcccac tcctgtggcc tgtgacgccg tctgactgcc 77100
ccacttttct cccgcaggtg cccatctgcg gtgaccagcc agaagccaag cgtgctgtct 77160
cggagatggc gctcgccatg ggcttcatgc ccgtggacat gggatccctg gcgtcagcct 77220
gggaggtgga ggccatgccc ctgcgcctcc tcccggcctg gaaggtgccc accctgctgg 77280
ccctggggct cttcgtctgc ttctatgcct acaacttcgt ccgggacgtt ctgcagccct 77340
atgtgcagga aagccagaac aagttcttca agctgcccgt gtccgtggtc aacaccacac 77400
tgccgtgcgt ggcctacgtg ctgctgtcac tcgtgtactt gcccggcgtg ctggcggctg 77460
ccctgcagct gcggcgcggc accaagtacc agcgcttccc cgactggctg gaccactggc 77520
tacagcaccg caagcagatc gggctgctca gcttcttctg cgccgccctg cacgccctct 77580
acagcttctg cttgccgctg cgccgcgccc accgctacga cctggtcaac ctggcagtca 77640
agcaggtacc caccccatgc ccttcctccc tctggcaact cagcacatgc ttgtccagca 77700
cctccccccc ccaccaacca ggtgcagccg atacccacgg gtgcagcctt accaggtgcc 77760
aactgcagat tctgttccaa tggggcagca cccacatcct cctgcccaag attttgagta 77820
tcagtgaaca aagcagatga aaattcctgc ccccatgggt acagcccagt tggggcagac 77880
ttaaacaaaa tacagcagtg agtcatagtg ggcgttgaga ggatcaggag tgctaaggcg 77940
caaaggaaag caagcgtggg cggtgggggt gcaggtttga agatggtcca ggaggacttg 78000
cagagtgagt gctatgtgag cagagctgga aggaggggag aggggccggt ggcctgctgg 78060
ggtgatgttg caggccacgg ggcatagtcc ttgggcagaa gtgtgcctgg tacgttggag 78120
gagcagccag gaggcccatg tggctaaagc tgaacaagga gggggtggca ggcgaggcct 78180
gagaggaaga gcttcagcct taggctccga gtgaaatagg gagctggtga aggtttgaat 78240
ttaggtgttg atcggcctga cattttaagt ggttctctct ggtttttggc tgagaacaga 78300
ctgtaggagg tcaaaggcag ctagctgctg gggccagcga ggaagccgtg catatgccca 78360
gatttgaggc agtggaggct ggaggcagtg ggagcagtgg aggagcaagg agatcctgaa 78420
ggcacatgtg aagctggagt gcatggaatt gccgctggaa tggccccagg gttttgtggg 78480
tgatcaggga tgactctggg gtttgggtct gagcacctga aagagagagt tgccatcagc 78540
tgagatgggg aaggctgcag gagtgagcat tccaggttta ggtttgttgt tgttgttgtt 78600
gttctttgtt tgttttactg ggggtggcac taatcattca tttagaaaat tcatatgggg 78660
cttggttgcc agcagggttc ctgggaagtg gaggaccttc aggccacacc aggtggggac 78720
ccaggcatca gctggcacct gtgcccacag aaacaggccc ctgatgctcc ctcctggtcc 78780
acaagctcat ggggcttgat tcttagtccc aagctcacat cttcagcaac actgtcttta 78840
ttttctccaa attaattcca cctccagtgc ccagccccgg ggctggttga tgcataggtc 78900
ctgcccactc caggacgcta gtcacccaac agggttcagc ccaggtgctg gtgagacact 78960
tctcatccac ccctcattcc agcctggcag cccctgcagc tcctgctcct gctcagaatg 79020
cagggacctt ggtgaggctg ggccctcccc taaacaccta gcacagggcc atcccctccg 79080
agcatggggg attggcagga ctgggaagca gggctgggca cctcctgaga accacagacc 79140
tcagccccta ctcactgtca gggttgctgc ttctctgcca gcagctactc gactgccctc 79200
gtcctttgcc acccacagat accggcatca ttgcatctgt gggctcagaa tttcctaaga 79260
caaaggaaga accccagact tcaggcagaa aagcaagatg cttgatggaa atgagaggaa 79320
gggaagaaat cagtcatgaa cccttaacaa gagctcgctg tgttccagga accattctaa 79380
gagcttcgta caccactgtg aattcattta accccatctc atccctgtag gccaggtgct 79440
attatatcct tatttcatag atgagaaatc tgaggcacag aggggtcaag taacttggcc 79500
aaagtcacac agtcagtaag tagcacagct gggattcaga tccagctatt ttccagatcc 79560
atgcttatac ccacgctgct ttctacaggc aaaccaaatt cacaattgag taaatgattt 79620
cagaactagg tcattcattc actcattcac tgagcaccta ctctgccagg ccctggggcc 79680
acagaaagga gtaagaaaga cacagaccat ctggctcctc gcctcagctg gtgtggggcg 79740
gtgtggaggc ctgaaggcta gaggctggac tcctgctctc cagcatcgct gactggaaca 79800
aagatcttga ccttgagcaa gtcacagccc ctcttttgtc ctcgaggccc tgatgtgtag 79860
atcaagctct ctcctagtgc taatgttttc aatgctcttt gacgatattt tcttactgac 79920
ttctacaaag caccagcccc ttggcaggag gctctgcggg gctccctggg gactagtaca 79980
atgttgctgc ccaggacggg gcagatctgc atggaggagc ccactccctc tcccctgagc 80040
tggcaggtat ttccagcagc agtgggaaag acggggacgg tgcccactac cccccagggt 80100
aaaagacaca ccactgctcc ctccctcccc tgccaccctt caactgcctt tgtctaaatt 80160
ctctgccctg ccaaggctct ccctgatatt ctgttaaccc aattctgccc tgatgcaaat 80220
accagggcac agaggggcgc atgcaaggta attttccccg tgtcccaaaa atctttaggg 80280
ctgcaggccc tggtgaggtt gccaggcaac catccctccc gcaggacgag atcagtcaga 80340
gacaccgaag gcctctcatg caaaggggct taaacttgtt ctgcagagtt cttaagggca 80400
aaaccagggc tgatgtggtt atgtcggggt gggtggtcgg agggaggcag gggcttgaca 80460
cacagcagcc cagatacggg gaggtgccca agcctgggca catccaagca gattctggat 80520
ggtccatggt aagccatgcc cgcggttctg ggcctgggca cctgaggctg ttctgccttc 80580
agccccaaac agcagggact cctgggtggc tcaggcttga tgtgtggctt ctgctgccag 80640
cccatgggca cctcaccaca gggtccccac atggccactc accaccccaa ctgcccacta 80700
ggcccttggg tcaagggagc acattagtct aggcacaaga aactcctcca agatttcctt 80760
acagccctga gtctgcagat taggaggcaa aggtgtatgc cagctgtaga gaaaaccttt 80820
gagaccatgt ttacagacag tattattacc aacaataacc gatatttgta cagggcattt 80880
ggatttgctt gtgtatttcc ctggaaatac acatttcaac atcaaactca aagatcaaga 80940
tcaaagaaat gtttaacctg cacactgttc tcctgttacc ttcaccccgt tctcctatta 81000
ccttcacccc aagctacatc tgcacatggc tggcacagga tggtctgaaa ctctcatctg 81060
accatgtcac tgctgaaaag atccagtgac cccagtgtcc ttgggataat ggtagaaccc 81120
tcactatgca gctagactcc ctccgcagcc tcatctcccc ttctcctgtg acgtgtcaac 81180
acttgggtcc catactgtcc tctaaatggg cagagctcat tcctctcggc ttggaacgcc 81240
caccccagga caccttgaca gcttgcaaac tcctattcct ccttcaaaac cctacctctg 81300
ttaagctccc ccagactatc cccttacttc cccatacctg cctctgtaat ctgttgcatt 81360
ttgtaaatac ttttttatta tttttcttac acactacttc atacccgact cagaggtcca 81420
tgactgggtc ttctacacct tggggtccat ggttcctaac acaggttcac agtgcatgct 81480
cactgagtga ctgattttta aattggccac cacagagcca atatcaggca tcttaagagg 81540
agtgcacgta gagcttggag caagaactag tctaactgcc ttgctgccac taagaacaac 81600
agccatttat tacattaagt gcccactgtg tgcctgttcc atgctactca ttccacaaac 81660
gtaatgcttt tagtcctgca gtaacacagc aagatacaat gatgctatga gccaggaaag 81720
ggactgccca gggtctcatg actgcccacc agtggcagag tcagcgtcag aatccaggcc 81780
tatggtctct atgccccaag gttgcccttc cacaccctgc caccccctcc tcctctgagt 81840
ctggcaggca gtgagttggt accactctct tcccatccat cacccactat gaagacatgg 81900
agaggggcta atgctgcagc ctcactggtc cttcagcgtc tgacctgcaa cctagaggga 81960
aatcccacac ctgaatgctg tctttccatc tcttgttgat gaacactctc cttggccttc 82020
tcaaggagaa ggtggtgaac ttgatcatct ctaaacatag agacttactt actaggggag 82080
ctgttacatc tgcgttccag ttagccatgt gtgccactgg tcaccaggga gctctgagca 82140
caacactgtg gtttaatagg ctggctgaga atctcatgga ctcctaaggc tggcttaggt 82200
tctgtcctca tgcgggtctt tgccatccac tgctccctag cccacctcat ccctcccttc 82260
ccagcgtcac tgcagactgg aaatgttaga ggaaaaaaac aaggcatttt acaagccaat 82320
gtggtatacg tgtgtgtaat catccaaact ctgacttgtg acattaactg cctgatcttc 82380
ccgaggcgca gagaggaatg actaatgaag cagagttaaa gaacaaacaa cttccagcga 82440
ggagatgact tactcaattc atgctgtgag gtgtgagtaa gacttctctg ggcagaggta 82500
cggaggagac ctctctgccc tctgcacgcc tttccagcta atggtgactt caaccacagc 82560
aggcacataa gcaaaatcaa gagaatttca gacatgacct catccaaacc tcctaggtag 82620
agaaactgag gcccagagac agtcttgcca gagtcacatg ccactggtgg tcaggacaag 82680
aggctgggtc cctagactcc tggtccctta gtggcttaaa gtcaccaaag tgagccaggc 82740
ctgccctaaa atagaacaga gccaatcatt tttcacagat tgcaggaaaa gcactcaatg 82800
gatggcattt tctctgtttc tttaaacttt ctcttataag ctgtacaacc attttgctca 82860
gcccagtgga ttcactttta atattttatg tggtaactga gctcgtgttt ttttttttct 82920
gctgaaattg tttctcaaaa aacctgtatg agtcattctg ttttgagagg ctgcctatta 82980
aagtgtagtc acatcttcta atggaaatac tgttccttgt tctgctgaca ttatagaata 83040
aaagtaccag catttcacag tgtttcacag agaacacctt gacttccagg aactctgcta 83100
cccggtctag ttgcaccttg ataaaagttc ttcctcatga gggcactatg cgagtgagtg 83160
ttggctgggc taggaggggg ctcagtggca aggtggggag agaagggtca gaaatctcca 83220
ggttcatagg ggctccccaa tttatatgtc ctggaacttg gtgggggggc ccagatctct 83280
gtgagggcag ggtaagggca ggtatcttta ttttctgtag cccagggcct ggcacacagt 83340
aggtgcttcg taagtggtca ctgaactgct tggtgaatgg ccgtcagtct ctcttgcctg 83400
gcaaagttga gccaaggctg tgtgcctcag gcagaagtag agaactgggt aggaagaggg 83460
gaggctgaga gctttgggtc ggggagtgtt gggggctcag tgtctgtatg tgtctttgta 83520
tgtcctgagt gtgagccagt gatgggggca gtgtggggct ccaggaagac agagggctca 83580
gggtgagaca ggctgggaag ggaagcagcc agtaaggtgt gagctcattg gctgagggga 83640
ttcagagcta ggagagctcc tctctcctgt cctgggattc tggggccgga aaaccgtgag 83700
acggagccat gcttaagggc tgtatttctg gttgactcct tactctgctg atgtgactgt 83760
tctgattggc tgccccgggg cagatatgtg aaagccccag gagccccggt cattggcacc 83820
aggctgagtg ggtcctgatc ccagctctgc atctgttagc tacatgtgac cttgggaaag 83880
tgatttgatc tttgtgcctc atttcctcca tctctaaaat gggctaatag tgatctctac 83940
tttgtggggt ggttttgagg attcgatgag ttaatgcctg agaaacgctt atcacagagc 84000
caggtagcgt caggtgcagt gtgagcgccc gccgtcttgt ctttcttgtg tccttcatca 84060
ttgccctccc ggggcaccag cctttgccac agtgttcatg gttttccttc catccatgtc 84120
aggtcttggc caacaagagc cacctctggg tggaggagga ggtctggcgg atggagatct 84180
acctctccct gggagtgctg gccctcggca cgttgtccct gctggccgtg acctcactgc 84240
cgtccattgc aaactcgctc aactggaggg agttcagctt cgttcaggta aagtagtctc 84300
tagtctgcca gccagcttca gcgtggccct ggcccacctc tcatgagtaa gtgctctgcc 84360
tttgagaact gcctgggctc tgatcatctg cacagcagga ccactcggtg agatgccagg 84420
ccttcctgac ccagagggcc catccaagcc tcttgatagg ggctgcctgc tacaagctta 84480
acctcccaac acatgaggaa gccagacaca ggcatgtgaa aaaattacag accaggacac 84540
tgagccctgg gtccaccatt ctcaagcttc tagaattctt gagctttcca aacaaaattg 84600
aatgacatga agtcattgga cattttgctg gtctaggtag gagtcatcat ctacctagac 84660
atccatctag gtaggagtct agggagtgag cgagcctagc ccaccaccct ccacccctca 84720
tctcaacctg gctctgttgt tccccttaac cccttgattc atgcagcgtg gatgagacac 84780
aagcattagg accccagttt ataggggatg cgacacagct ttttcccaag gatgccattc 84840
ctatgaaaaa atccagaaaa aggaggtctg tcatcagatg aatttgagaa aagatttact 84900
tccccctaag agatcacaat gcactttggc acatcaaaga ttcgaataac atctacaaca 84960
aacaaacctt tgttaatcag acttattgga gtgttagcac cctccccctc cttttttcca 85020
aataacagct atcagcactc cacaagctgg gcgctgtggc atgtggctgg gatcccagct 85080
actaacagag gctgaggtgg gagaatcact tgagcttgag cgattcttcc aggagttaga 85140
agttcaagtg tccagcctgg acatcatagc aagaccttgc ctcttaaaaa aaaaaaaata 85200
ctccacagaa catactctgg gaaatgctgc tagtggcaaa agtttctttt tgcatttgtt 85260
cattcaacaa acatttattg agcacttact gcaggccagg catcctgcta ggcctgtgat 85320
gcaatagaga acaagacagg cagagccatc tttccatgat aaaggaaacg gaggcaggga 85380
cattgtttac atttctttgg catctcccac tgttctccac acagaatctg cggtcagtgt 85440
tggcggatta actcctcccc tcccatgagt gggagctgac taatgctgta tcctgccatt 85500
gtaacagggc agagaacagc catcctatcc acccccacta tcaacagaaa tctgtgcagg 85560
gaggacgtgg tacaggactc agggacagtg acagcgtaat gctcttacgt aatccaaatt 85620
aattgctcct gaccagggat gcttcacatc cattggaaca acacagagtt gtagccgtgt 85680
gttttttaaa gtgtgtctgc ctctgaatct ccctggctct gctcatctca gaaggtccct 85740
ggaggagggc tcatggctga cacatgttag catacgagaa ggggaagaat tttatttatc 85800
tgccactaat ccccatgtgt ctcataccca aatctaggat tttcctcttc ccacctggag 85860
tatccggcgt gcatggttta tccacaatta aagcagactg caggctgctc ccctcaccag 85920
aaagccgctc ccttaagcag ccatagatta catgccctgg ctctgcctgc cagagaaagc 85980
cggtggattt gattttgtta gcaagagctg actgagaccc tagcagctgc attctacttt 86040
acatattaaa gagtggaaat acaaatagga cagtcctttt gccactgcaa gagcaggggg 86100
ggttaggtgg gtagaaaggc aggattttac ttgtggaaat cagtgcctgc cttccatcca 86160
caaaaaccag atgtcaatat ggaggaggca catgtcagcg gcgcctggga agcctgagtt 86220
ccagctttcc ctccccacaa ccctgctctg taactgtggg cagagcatgt ctgctccaag 86280
agcctcagtt tacacccctg aaaaatggag ttaatgcctt acagggattt tatgagccac 86340
agtaagagat tatgtgtgaa agaaaaataa aaagcatttt gctattattc ttagggtatc 86400
tggccacatt tccattatct ctgactaagg taccaaccac cgatttctga gttcagtagg 86460
agacagtgag acagaggcca aggaacccca accctgggcc taaaagtggt ccagtcagtg 86520
tttgcaaact ggcggacact cactagtggg tcatgcaatt gattccatgg atcacaagca 86580
gcattttaaa aatgaaataa aatagaatga caaagaaaac agtggagtgt tttgcatggt 86640
gtcgggatac tttttcagtt atatggaatt gctagtttta tttgcaaatg tagcatacct 86700
cgttgtctac cggacagcag agtaaaacat ggttcttact gtgagtccct gtcaaatagg 86760
ctgaagccag agccctcttg gagaaacaga gataacccag gcctgcctcc catccgtgga 86820
ctcagatgct gagggatggc tctggcaatc tatttttgca gctccctaag tgactgatag 86880
gtgcgcatgc cgcagtgtgt ggcaacttcc agtgcaggaa acacaggcag tggaacccga 86940
agacctgaat ctcagtccca agacccccac ttacctgccc cgcatcatca gacaagtttc 87000
ctaggccctc ggagcttctg ctgctcactt gtgcctgtgt ccaccccata tggtcatcaa 87060
gaggatttga gctggacacg ttaaatgcag gatgcgtgca gccaacagtg gcatgctggc 87120
ttttgaggta agctgcaacc ttctccttta aagttagcgt ggctagtgag aagttacctg 87180
agccccatca ccctccccta cacacatgtc cacagcagac accaggctat ggggacagcc 87240
atggttcttg aggggccttg gctgacccct agatctgtaa tgcttttgtt accggaaaag 87300
ggtcccgatc cagaccccaa gagagggtta ttggacctca cgcgagaaag aattcaggac 87360
ctgtccatag agtaaagtga aagcaagttt attaagaaag caaaggaata aaagaatggc 87420
tactccatag tcagagcagc ggcatggctg ctcagctgct tatacttatt gttacttctt 87480
gattatatgc tgaacgaggg gtggattatt catgagtttt ccaggaaagg gatggcaatt 87540
cccagaacta agggttcctt acctttttag accatatagg gtaacttcct gacattgcca 87600
tggcatttgt aaactgacat ggcgctagtg ggagtgtttt ttaacatgcg aatgcattat 87660
aattagtgta taatgagcaa cgaggtcact ctcgttgcca tgttggtttt ggtgcttttg 87720
gctggcttct ttactgcaag ctgttttatc agcaaggtat ttatgacctg tatcctgagc 87780
cgacctccta tgtcatcccg tgactagcaa cgtttaacct cctgggaatg cagcccagta 87840
ggtctcagcc tcattttacc cagcccccca ttcaggtgaa gtctctctgg tttgaacacc 87900
tcagacactt cgtttagcta aaaaccattg aaacagtgta ttgattccac aaagaggtga 87960
cttgtgcttg catttatcct tttgttccca aatctgtttt caaagtttta catgttgttt 88020
tgtgttcctt tgggtatttt tttttttttt tttttttttt ttttgagacg gagtctcact 88080
ccgtcaccca ggctggagtg cagtggcaca atctcggctc actgcaacct ctgcctcccg 88140
ggttcatgcc attctcctgc ctcagcctcc caagtagctg ggactacagg cgcccggcac 88200
cacacctggc taattttttt tttttttttt ttttgtattt ttagtagaga tggggtttca 88260
ccgtgttagg caggatggtc tcaatctcct gacctcatga tccgcctgcc tcggccttcc 88320
aaagtgctgg gattataggc gtgagccacc gcacccagcc ttcctttggt atttttttgt 88380
tattgttttg gtttggtttg ggttgtgcta agtgtttcaa ttcagccagt tttaactggc 88440
tgttagatat tagactgcaa aatactccag tcagagcagc tcacctgcgc agaaaaatga 88500
gggttcagct tttagaacct aagttctttc ccagagttag aggaactgcc tgtgaccttg 88560
cccactccag ccacctgcct gaaataatga caagaccagc ctgaccccag cttcatgagc 88620
aattgtccaa agcccctttg tgccgtagta attgagcacc agcaggagct acaacgacct 88680
ggctgtttct tttttgctaa caagcttacg tataataaaa atggctctag cttggggatc 88740
ttattaatcg cctcatgaca atccctctcc ttttgggctt ctttgggttc tgggattttt 88800
aaattgttcc caaggagagt ttttgggaaa caaactccct ggaatcatgc aggcttccca 88860
ctgggacagg aaagtcaaag gccctttgtt attggctggc ctttggctgt cagcccttgc 88920
tatgaaccac tggcctgagg ctggaacttc ctgctgtctg caccatggga ttttgaatgg 88980
cacaagaatg aggctatatg aacaggagga gctgactgcc actggtgggc ctgggagcag 89040
cgtctccaca ctgtccctgt gcagagccca gagtgcccag caaaattcat cactctccag 89100
atcaggggct ggggacagtg gcccacacag accaaacact ggagctacag ggcatgtcac 89160
ccgagggaga tgcaaagacc tcactggggc tactaaggct ggctttccag gcctggatgg 89220
gctcccattg ctgcacctcc tgggaaagcc cacgacacag aggtgggcgc caaaaggctc 89280
tcagtggggc tttgtctaag gaacagatag gtccaggtct tcctcaggca agtgacctga 89340
gcagaggggc ccgtgtggac ttttcaccct gaagctagaa gggtgtggtg acgacagtct 89400
cctaaatgag tggctttagt cctagctgcc catcagcctc atccgccgaa ccttaaaaaa 89460
caacagatgc cccgccccaa accaacttaa tctgaatttc tggaagtggg gtttgggcac 89520
tagtatttta cccaagctcc ccgggtgatt ctaatgtgta gcaaggtttg aaaaccacag 89580
tctaaaagcc acagactgtt aaactcttgg ggataaaggg catcacccag ccatcttggc 89640
aacaccaata agtccacaat gaggaggggt gggagggccc acagttagtt agggctgggc 89700
acctggctgg ggaacatcag ggtgattgac ttcaagactt actctttttt ttttttttct 89760
ttttttttga gacggaattt cactcttgtt gcccaggctg gagtgcaatg gcgtgatttt 89820
ggctcactgc aacatccacc tcctgggttc aagcgagtag ctgggattac aggcatgcgc 89880
caccacacct ggctaatttt gtatttttag tagagacggg gacggggttt atccatgtcg 89940
gtcaggctgg tcttgaactc ccaacctcag gtgatctgcc cgcctcggcc tcccaaagtg 90000
ctgggattac aggcgtgagc caccgcaccc agccaagact tattcttgat ggtcagtgct 90060
ggggactttt ttaaccacag tcttccacac taagagatta gaatttagaa aagttggggt 90120
ggctcagaag ttgcagggga tttggaattc ttgacagaca cttctggaag tggcaaggat 90180
ttgcttatgt gcaactgaca gtcaaggagt cttctctttg ggaggtgacc acattaaaat 90240
gataggaatt cactgtgggt gacagcataa agccaatcgt ggcttcctca ctcttcgtgg 90300
tgagccagaa gttgttaaag actgggccaa gaagattcca aaaatggaca caaagccaag 90360
aagaaccaga gagggtgagg aaggatagag aaggttttat ttggttattt tacttgggcc 90420
caagaatgtt gaacgtgaga acctgtctgt gaaattgtag tgtgcagcca ttggaaaatg 90480
tttattatta tctttagcaa aagctttaca agcaattctc ccacaccatg ttctttcact 90540
cactgacgtt cactgtcctg gtgtctgtcc tggagcagga aatgaaggga cacacacaca 90600
cacacaccag ggaggagcaa gaacggggcc caatgtggaa tcagacccac ttagaaacac 90660
ttctgagggg agtgcaaatg agaagcgtct gtcagccgag gctctggatt gatgccaaca 90720
agctgggcta gaagggaatc caggaggctc agtccatgca gaccacccag aggtctcagt 90780
gtgccgccac acttaaatta caccctcgca atgtctcctt ggagaaaatg catatgtgtt 90840
cattgcttga tgggtcatcg ctatttccat ccctgtgtaa tagacgtggg aggtctctcc 90900
caaagctctc agtggctcac cagtgctagc agaattcagt cagagcaccc ctgtgccacg 90960
actccctcgc tctcggtgcc ctctgctgtg tcacttgcct gccctgtcta ggggactaga 91020
tggaggctac tgcaactact cagcgcttcc ccctctgact ttagctttgg aaattactta 91080
tctcccactg aagttgatta agtcgcctgc ccagggttca tatcagttga accagcacca 91140
acagtagaac ctgcatctct tccttcgtgg tccacgagaa ctcgtacatg ccaagaggct 91200
ggagtcatag agcagcactt cccagccatt ttcacattgc atctcttaca gaaagtcatg 91260
ctttgggtgg tggatcagcc actctcggct ggaagtgacc cacaaaagcc cacacattgt 91320
tcaaggggtg tgaagctcca ttgtaaaatg gccgggacca tttccattta gagttgggat 91380
ggtctcttct cccaacggtc actaatctcc tccagatgga agagtaggcc cagcggggtt 91440
tccacccggg ttgtttataa cccagtgtgg ggtgggaggt gaaggtctag catgcacaga 91500
gggcatctgt gtggtgttct ggggctttct atacggtgcc aggtcaccca gaccacaggc 91560
cccgtgagtc cccttcgcta ctggtgccaa atccacgtgc catctgtaaa ttatttactc 91620
tgcatttatc ttcaagctaa tttaaaatca atccactttt tgtctgatct taacttaggc 91680
caaatgttat ctgtgaaatt atgattttgg tatgcaagca gacacttgtt actctaatat 91740
acattaaaat acacacataa ctagtaaaat ttatacacac acacacacac acacatatac 91800
atgtatatgt atatatatat ttagagacag ggtcttgctc tgttacccag gctggagtgc 91860
agtagtgcag tggcacaatc ttggctcact gcaaccttga cctcttgggc tcaagtgatc 91920
ctcccatctc agcctcccaa gtagctggga caacaagcac atgctgccac agcctggcta 91980
atttttttgt attttttgta gaaacagggt ctcactatgt tgcccagggt ggtcttgaac 92040
ccctgggctc aagcagtcca cccacttagg cctcccaaag tgttgggatt acaggcgaga 92100
gccaccgcag caggccttaa atgtttttta aacttctttg aacttaattc catctgaaat 92160
catccagcag cctccagaga taacaaataa caaagttaag gaaaaagcat ggtcatatag 92220
ttattgtatg gaatccgtgt gaattggtgg gtccttagac accttcagca tagaagcatt 92280
attcccattt tcctgttgtg gaagctgagg cacagagagt tgagagttat cataagatca 92340
cactaagaga gtgacaggac tggggttcca acccatagcg gtgagtacta aagccaccct 92400
ccttcccctc cgccaggcca gcagatgagt cgttggcagg atcactgcat ctgtcatccc 92460
ctcgccctca ctccagcctt tttttccctc cacagtcctc actgggcttt gtggccctcg 92520
tgctgagcac actgcacacg ctcacctacg gctggacccg cgccttcgag gagagccgct 92580
acaagttcta cctgcctccc accttcacgc tcacgctgct ggtgccctgc gtcgtcatcc 92640
tggccaaagc cctgtttctc ctgccctgca tcagccgcag actcgccagg atccggagag 92700
gctgggagag ggagagcacc atcaagttca cgctgcccac agaccacgcc ctggccgaga 92760
agacgagcca cgtatgaggt gcctgccctg ggctctggac cccgggcaca cgagggacgg 92820
tgccctgagc ccgttaggtt ttcttttctt ggtggtgcaa agtggtataa ctgtgtgcaa 92880
ataggaggtt tgaggtccaa attcctggga ctcaaatgta tgcagtacta ttcagaatga 92940
tatacacaca tatgtgtata tgtatttaca tatattccac atatataaca ggatttgcaa 93000
ttatacatag ctagctaaaa agttgggtct ctgagatttc aacttgtaga tttaaaaaca 93060
agtgccgtac gttaagagaa gagcagatca tgctattgtg acatttgcag agatatacac 93120
acactttttg tacagaagag gcttgtgctg tggtgggttc gatttatccc tgcccacccc 93180
acccccacaa cttccctttt gctacttccc caaggctctt gcagagctag ggctctgaag 93240
gggagggaag gcaacggctc tgcccagagc catccctgga gcatgtgagc agcggctggt 93300
ctcttccctc cacctggggc agcagcagga ggcctgggga ggaggaaaat caggcagtcg 93360
gcctggagtc tgtgcctggt cctttgcccg gtggtgggag gatggaggga ttgggctgaa 93420
gctgctccac ctcatccttg ctgagtgggg gagacatttt ccctgaaagt cagaagtcac 93480
catagagcct gcaaatggat cctcctgtga gagtgacgtc acctcctttc cagagccatt 93540
agtgagcctg gcttgggaac aagtgtaatt tccttccctc ctttaacctg gcgatgagcg 93600
tcctttaaac cactgtgcct tctcaccctt tccatcttca gtttgaatga ctcccaggaa 93660
ggcctagagc agacccttta gaaatcagcc caagggggag agcaagagaa aacactctag 93720
ggagtaaagc tccccgggcg tcagagttga gccctgcctg ggctgaagga ctgtcttcac 93780
gaagtcagtc ctgaggaaaa atattgggga ctccaaatgt cctctggcag aggacccaga 93840
aaaccacact ggctccaact tcctcctcat ggggcattac acttcaaaac agtggggagc 93900
aacttttcca ccaaagctac aaacctaaaa tgctgctgcc ccaaagcaca agagggaaga 93960
gcaccgccgg ggccacagga cgtctgtcct ccagtcacag gccatccttg ctgctcccta 94020
ctgactctag cttacttccc ctgtgaagaa acaggtgttc tcggctgagc ccccaaccct 94080
<210> 5
<211> 82154
<212> DNA
<213> Homo sapiens
<400> 5
cattaatagt gataactatt aataatatct gagtgttaac tatgtatcaa acactgtgct 60
atgggctttc tttaactatc tcacttatct ctcacaataa ccctgtgagg caggtactat 120
tacagaaggg gaaacggagg ctaataaaga ttaaatgagt ttcttagggt tgcccaccaa 180
gtggaagatc ctgaatatga atcttacagt ctttctcagc ctgcattctt taccacaagg 240
ctgggactcc cagaggacag catcctctca tgcctgggtg gcaagcagcc agccacagac 300
atgctgaaga actaggggta gctacagtta gaaaacattc attgcttttt caaggaagag 360
ctaaggagac ccaggacgca gatgtgagtt agcagagaac accagcaaat tacttaactt 420
gacagaatta ttttctctcc tgggtcagtt agcttctact tgaccctggt gcttgttgga 480
gtttgtgtca cccccatggc tctgccttct gctctgaagc acaaggttac cattagcata 540
catcaggctg tggttaattt ggctgccccc tctttaagct aaggagacat ggtcagggcc 600
tcagaccctg tgtgtggcca ttcagctttg ccctgttctg tggccacagt ccatgctcta 660
agtactgacc agatgtctta caatgcacac ggcacacagt tatggtctct gtggggatgg 720
gggaataagg tgtggacaaa tctgttcagc tctaaatcct tgaccagagg agcagctcag 780
agcatgaatc cacagggcag tggagccatg tgcaggatca agcacagcgg catcactgac 840
ttgcaggaca ctggagtgct ggggcgtggt tctagagaaa tgccctcaag tcctcgatag 900
atcctaaatg tggttagttc tcttcattac aaagacagtg gaagctgagg tccatgcaga 960
ttaaaaggct aagctgtaca gtaattatga ggtccttttg attagcagaa ctccatctat 1020
tccaaaacaa attcatagaa agacatcttt tctatgccta attgcctttc catctttgtt 1080
gaaaatcaac agaccataaa cgtggagtct gttttgggac ttgacattct gttctgctaa 1140
tctatgtgcc tctctttgcg ccaatacttt actctcttga ttactgtagc tttttagtaa 1200
atcttgacat cagatatttt aagtcctcca actttatttt tgcttctaag ttgttttgtg 1260
tttacataca aaatttagaa tcaatttgtt caatttctac caaaaaagtc tgcttgggtt 1320
ttggttggga ctgcattgaa tccatagatc aactattggg gattaatttt tttctctacg 1380
ttttgactgg tttgtatacc acagattaga ggattctggg atggagcttc agaatccata 1440
gcacaaacat gaagatattc agaacaatta acttttatgc tgatttaaag ctaataagaa 1500
taaatcttta catcaaatat aagccacctg gagccagtat tattgggact tcattgataa 1560
taagattatt tacccaaagg ggaatgattg tcaaagtacc tactgtgagc catatttata 1620
aaatgtaagc catatttgaa aaatacttaa ttttcacaag aagctgatga ggtaggcatt 1680
acctgctgta ctttacaaat ggggaaacta aagtacaaag agatgtagca gttaagctga 1740
ggtcacacag gtaattaaat ggtagcattg tcacttaaac ccaggcttgt ctaattccat 1800
tctgtggtac ttgctgtacc tcaatggttt tcagactgtg tccagagtgc cccaggacct 1860
gagagagaga gagagaaaga aagagaaaaa agagagagag aaagagaaga gagtgagaga 1920
gagtgagtgt gtttgaggga aggaggaaga aagtggtctg gggttcagaa tcccagactt 1980
ggtctcagtg agttttcctt tgtcctattt tgcagatggg gcctccacgt gaaaagtaac 2040
tacaaaacag aaccagaaaa tagtcatgct gttcaagtga gttggcatat cacttcatgc 2100
tactttgaaa taaaatttcc tcttattttc ttatggataa aggtctcgaa aggtttgaga 2160
tgatcacagc ctgtgttaag gctgaccagg gtccagggca gtacagtgga gctgcttttc 2220
ttctggattc tgaaccaccc tcagccttca gggcctgttg tctggtgggc tcatggagtc 2280
accagtgaac gtgaaagcca ctgctcctct ggtgtccatg tctattctga caggtggatc 2340
tcagccccag gttgactgat tgctcgcagg tgaggctact gcctccgcag tgctcaccaa 2400
atgctccggc cgctccagtc tgcacgttcc tgagcttggg ccacctcctg cttttcacag 2460
gcagcttctc ctcgatctcc tcctctcttt tttcttcatg agcctcaccc ttggcagcca 2520
ccccaagaaa ttcagccttc ttcatctcct ttctctctca gaaactggaa agatttttac 2580
tgaattcctg atatttttgt ctttgccaaa acccaaaggc cccaatctgc catgggccaa 2640
gaagtgccca gagaggttgt ttggacaaat ccagaaatga ccttgaatct ttactcagca 2700
cttagatgac aggttctctc cttctccacc acaccctagc acacgtgctt cttgtcggat 2760
caggaaatgt tttattgctt tttttccttt tcactttctc tacccaccct tctttgtgag 2820
cccttcccgg ttatgctgtc cgtattgcct ctcttctgga aaagtaatca gagagtgaaa 2880
atcccaggac aggaagggac cttgggaagg cattaaccag accttttcct ccaggcagca 2940
gccacagtcg ccggggtaaa gaaccctctt ttccatcttt aaactttcat cggtttctgc 3000
atcttctcat tgaagcatct ctgggttttg ctttttgttg tcttatttgt tactttcatt 3060
tttaaaagtt ttctttcatt cagaggtttc ttgagactgc ctggtgcaca tcatgcgtat 3120
ccgctgatag atgctgttgt gacttggtga aacatgttgc gtgctcttca ggcagatgta 3180
tgtcaacaaa cccttttcct ggctcagcca ggatttctgg gagtcagatt tgattatggg 3240
gtgtcatagg taaaaactgg aggctgtctg tggtggccca gctgtgcagt tagctgactt 3300
ggaggaatct ttggctataa ttggatgcca agagtggagg tggcacgaga gatggtacaa 3360
gcctatgatg atgtctaccc aggtgaaaaa tgatctaggt gcttgtaacc atcaccctga 3420
gcattcagtt ctacatccag ctattgtgga acaaaatgat ttatattgat taattgacta 3480
gttggttcat tttagcttga agagtactga tcagctgtgt gcattaggca gtttcttgac 3540
acactgctgt gctgaggaca gatttcccag agcctggatg tgtataattc tacatgctcc 3600
tttttccaag gacttaagca aacagagtca actcctctgt tttccttgtt tgggtatatt 3660
tttgaaaatg tctcttcttc tttcctttca tttacatttt accgttgttt atccaccttt 3720
tcctcttcct tcaaagctct agacctgcct ccctgcctgt tcttagccca cttttgagaa 3780
aggactttcc aaccccatcc tcgaaagggc agggtctctc tccagggctc caacagagtt 3840
ctgaaagaac acggcttcca ccattgtgtc ttctctgttt tgtcaactgc tgaaagactg 3900
acacagtaga caatgctgca gaccccttgg gagatagtcc aagtttaggg tggggaggga 3960
atggtgcatt ctgggtgtcc acatatttgt tgttgcttta ggaagaggag ctgggaggtt 4020
ggagtcgcca cacatgttga aagatgtggc aaaaaacaaa caaacaaaac acctcataga 4080
gagaaatcct gactttgtgc acaagaaaag ggagtgaagt gtgtggggtt tttaaagtgg 4140
tggtgggggg gcattaggag atacccagaa gctctcaaga ttccaaacag tctgcttttc 4200
ttttcagaca ttacactcca agaaaagaaa ctctagtgta taacagaggg gctctgtcaa 4260
aatttaacaa cataaatatt gggcaaatga agttgtttct ctggtgctat ctcaacctgc 4320
caatggagaa atatctcaaa aagtcaagaa ttgaagccat tactcagaga cagcatccta 4380
tggcatggtg atccaaaaca agtacacctc taccttttcc ctttcagccc caaaccccaa 4440
aacactggag aatattgggg caggcaaggc ccgtgaatag gtgagcagag ctggaagaag 4500
agactcctgc ccctggtggg cctcaggcta tttgtggaat gatgtttgtg agatgaacat 4560
gttcgctccc tcacccggat gttttggaca taggagcctg gagtaaagag tgtatatctt 4620
gggctgtcat tttcccgtgt gaaaggtgtt ttgttttctc cccgtttgca caacttgttt 4680
cccttaaact gtgctgtgca tggctaggaa gctcagcaat agactaaaca gtttgcgatc 4740
ccacagtttt gctttctgtt tctcaggcct gacccaacac tccatgggtt ccctagccct 4800
tcgtaggtgc ttcgaaacac tcatggggtc cttgacctga tcccagtggg ggtttgtgtg 4860
tggaagttag ggaacctctc tttgagagtt ctggtgcccc taactctgta gggtctgact 4920
tcacttctgc cccaataaga atgaaaggct ttgccagtag tgcagccctc tcctcccaaa 4980
gtcctagagg caattactct gaaatatgga agaaagaggc acatctgaaa gcccagtgct 5040
gtcttcttgt cctcacatcc ctcaggatct caaggtcagc ctagtagagg cattgcttta 5100
ccatagtagc aactcaggga atatctgtgg aactggattc ctctgaagtt ggacagttgc 5160
tttatccctg ctagaggctc tcactactta gacccacaca gtcctataga tagaagaaac 5220
ctagagagaa ccacctctca cacttttatt ttatacatgg agaaccaaag gcctcaaatg 5280
gtggagtgat ttgctggggt gctacagtca ttgtcacaac ttacattgtg acatgggctt 5340
catatccagt taaaacaaaa gcctctattc actgccccaa ggtgtgaagc cttgtctcca 5400
ggagatggag agtcaatgac tccaaggaga taagacttca gactcttcct gctgcaattt 5460
tttttttttt ttaagtaagt gccaaccaat aactcctggg gaaagtaaaa taatctgggg 5520
gaggaaaatt gttctctcct ggagatggga ctcctctgat ttggaactcc tctgtctgct 5580
ttcacttctt ggataggatt ttaaatccag cacccagcct gctgctgtga agttcacaat 5640
aactttatca cctgagttcc cttggtgctg cagcagatat gagttacaca cctggtcctc 5700
cgagagtggt ttaatccaca ccagagtcct gacttactag tttcttccta ttgcagagcc 5760
tatgcagact gcttctctga gcaccaacat cattatgcac tgtcctttct attcccaaga 5820
cttcctagtt gctgcaagtc aagttcgaca ttcaactatt tcctcggggt ccttttttgg 5880
gagaagcaag gctttgagtt cactctttga cttcaagtga agtccatttt cctcttagac 5940
actaccccag tggttctcac actcaaggaa gcaccaaagt ccctggagga cccgtctaaa 6000
tgaaggatgc taagccccac ctcacagaga ttgatgcagt acgtcccagg aatctgcatg 6060
ttaaaggagc tctgcaggtg attctgatgg aggtggccct tgcaggatgc tttgagaaac 6120
tatatgttct atccctcgaa ctctgcctgc agaacagcct gagatggctc ttccatgctt 6180
tgaccatttg gccctccaca gtagtccctg agctgcgtct tcttcggacc atgagcagaa 6240
tgtgtgtccc ctgactgact gtccttttcc ttgagaacca ggcatagtgg tgcactggta 6300
agagcatgga ctctggagcc acactgggtt tgaattatgt ctctgccact tactagctga 6360
gtgaccctag gcaactttct aaatctctgt gcttttgttt cttcatctgt aaaatgggga 6420
taataatact acttgcccca tagggttgtt atgaagatga accaagttaa tatctctaat 6480
aaatgtctct aaaatcccat gattgcaaaa agtagaaaat atgtcatgta gcctattata 6540
tcattatatt ataaggtgag gctattgaag gcaagagggg aaatgacttg ctgaaggcaa 6600
cagagctggt ctgcagcatg gccaagacca aaaacagctc ttttcgctcc cagataaatt 6660
gtctttttta tttttttccc aaactgcctg tctaaccccc ctttcatctg gttataatga 6720
atgccattgc ttgtgtatag ttgcctacat taatagacaa caatgcaata ttctccttat 6780
ggaaacccta cctagattgg gaggcaccat gaagccactt tttcttcttt ctccatctct 6840
accctgatta gcaaacatct ctaattattg tgactcccaa ccccagtcag atcattttat 6900
tctttttcca gtatctatgc agggaagcct ggcaaaggct taagggatgg ggtggggtgt 6960
agcatgtcag caggatttgg aactatgggc cccatacttt tggcacctgc tgcattttct 7020
ccccacctgc tgcaccataa ttcatctgct tgtatgagtt tagcagaaag agcccccagt 7080
tccctgtaag aaacacatac ggcttttcca ggttacactg tggggattga gaaaatgcac 7140
agtatccatg tctggaaatc aatggacaac tcactgcctg aatcgtttgt gtcttgtaac 7200
ttgcctcaag caacatctgt ctgaaaaatc tggtgctttg ggctaaatga ctggatattc 7260
tcctaaggaa tggcagtgag tgggttaatt tcacctctca tcttacttcc tgcctggccc 7320
ctctaccttg cccaccatgc ctggctttgc tgctgatctt cggctgacct gaaattgaac 7380
accttaactt aaggacaact aagggtgtag gtagattggg aagtatgtgt tcttcttgct 7440
ttgccaataa ttgtcttctg gattcattgg cctttcttct ggtttccttc ttcaacttct 7500
ttaacaaatg acttcagcca tgccaagcct tcttttaagc actttccctc tcactctcct 7560
gtcctataaa gatatctttc ttgaagcccc tccgtgccag gcgtccaaag tgaggcacat 7620
caactcggtc cttgaacgtc tcatgtttat cccaatagat ggtctagatg tggatgaatg 7680
taaaggaaat gtgcaaataa gatactttta aaattcagac agaattatac agggtgggaa 7740
atttcagtat acatagaagg cttaattcaa aatgatataa tgtcaacatt tggtataaga 7800
aattatttat ctggcagaat atatactcac agatgtcaaa atgggtctag agagtagaga 7860
atggaggcaa ttatccagac actgaggccc aaggcacaat acttttaagt aatcatgccc 7920
tcaactggca tttccatagt cttaagccca aaagcattgg gtggaaccat tctataagca 7980
aagcctcagc tatgaaaaca acttttaaaa ttgacattca aaagataaga tcaacaacag 8040
gtgccctttg ctttcggcag taggtgtgtt cttgaaaagt tggttgtcaa tatttccttt 8100
tcccattaat ctaatcacat tctaaatata acagggggct ggatgtttga agaaatcctg 8160
tagttgatct cattgcaaag tccttttaga gaggtaaaaa tagtttgttt tattttcaaa 8220
aattaggttt tcttagacta aaacttcttg gaagtggggg catatcatgt tcctgtatat 8280
tgcctacagg taaagaatgt aagaatgtat ggcttagtca cagagagcta gggcttcaga 8340
aatgctatat gtatcaaata ttttatatct atatttactc tgaagatatg acaatagctt 8400
ttaatgtggg tcgagagata tctaatcttt cgcttctctt tcaaccttcc aaaaccatgc 8460
aatcctcatt ccttcttttc aataacctcc acatgccccc ttcatctgtc ccacccaaag 8520
gaaactcttt taacttacca tttaattgat caactctgat gacctttccc taagctctct 8580
gtgctaaaat aatctggtac tttgggctga agaagtattc tcctaacgat ggaggtaggt 8640
ggcagtcaaa tgacgcagag attatgatag ggccctgtct aggctgtcac ataaggtaac 8700
attagccaca tgtggctact gtgtacttga aatgtgatga atgccattga gaactgaatt 8760
tttaatttaa tttaaaaatg gagtcgcatt tctgttttag gagaacttct aagtatgtct 8820
gaaacaactt gatcatgttt caagtgtaag ttttattaga tctaaatcta aatcaagtat 8880
ttcgaaaaag tattttagca tttgaataga gatgtgctct aagtataaaa cacacagtgg 8940
attttgaaga ttagtaagaa aaaaatgaat gtaaactatt tcattaataa atttttatat 9000
tggttacatg ctgaaatgat aatattttgc atatattggg tgaaattata tatattattt 9060
aaattaactt tccttttttt ttttaaactt tgtgtggcta caaggacact gaaattagaa 9120
acatggctcg aattatgctt gcactgaaca aggctagtct aaggtatgca attgccctgc 9180
ttcttcacta ctttcaagtg taaacaaata tgtcagcatt atccctagaa ggagggttta 9240
ggggttttaa gttgaatact cttcagctga agaaaatcca ttaatctcca gttttattct 9300
tgagttagct ttcaaatcta cattgcgaca ataattactt tgggatcttt gaattttctt 9360
tcatgccttt ctgttctatg aagcccacat gcgtagttta tgcattttcc aatttaggct 9420
agaagtccaa tgtgctgtcc attgcaccac agagcctgtt tgctatgcat ttttaagagt 9480
aaaattttca gaaaatactt aaattaaaaa gatagatttg gaaagcatat ccaaaatgtt 9540
gctttgaact tcttattctg gacaattcct ggactgggga gaaggcatgc ccaagtacac 9600
attgcttgca gtggcacctc caaaccaatg ctggtcggga ctcttcctat tacctcgcaa 9660
cagcaatgac tgggccccat aatacagcca cggtcattat aaaagatcat tacaaagcat 9720
caaattaact gctattaatg aaagccagaa acacgtcatt caggaggtcg aatggctggg 9780
atggaacata cagggttgaa taatggtagg agcctgggtt tggaattaga aaactgggac 9840
aggaatccta cttctgctat gaatccattg caagtgactg ggcaagttgt tcctcactcc 9900
ctactgcctt gctcatctat cagctgagaa tgtcaaggca gaaggtctcc agggctcctg 9960
caggctccta caagccagat ctcaatccgt cttatcctac cctcttcctg acctctagct 10020
acaagaacag caaggcacag ccccctggtt ttgagaatgc taatgcttgc cagcattctt 10080
gtcctgcagg gcatgaagta tagtcctgca caaccagcag gctctgtgac tgcctaacct 10140
catccttggt cactgacctc tgtcttagta gcagttcgtg ccatcctacc tagctttgct 10200
gggtcaagtg cgttcacatc ttaaaaccgt ttgaagcgtt tgtctaatta acatgcagaa 10260
agcatatact gatttttatt ttcaccacca tgtatgtgag ggcctatttt atggcatgca 10320
aagcatctca tttttatttc aattctctgt cttgtaactt taaatgaggc tgaaatttcc 10380
ctccatatgt ttattagcat cttctatttt atctcttata cactgactgt ttgcatcttt 10440
tgccccattt ccctgaatgg tttttttctc aatgatttgt aagcactctt tatatttaaa 10500
tatgttaact ctttcttgtc acatatttta aaccctttct tacaaacgtt gttttccggt 10560
ttgtgactta ccttttaatt ttgctcataa attactttta acttacagat agtaatattt 10620
ttgaaaggtt acattcatca gtctttgtat tgttaaaaag agtctttatt gttatacttt 10680
taaagtagct tttccactcc tagtcagata ctttcacata taatagttgt ctactttcct 10740
cctgaattaa tggggattta ttttggcata tggtgtgaag taagaagcta aattcttttt 10800
cttttctctg catcatcaat gatctcttac actgttaaat aaactagtct tttccttctg 10860
ctttccacac ccatttaacc tagcccactg ttgacatcgt cagagaaaac ttttcatcag 10920
aaagtctgaa cagcacaatt atactgtatc aatccagctt aaattacaca tgattgttag 10980
gatgggtaga aggtatgata aaatggggtg aaagtaaaat gaatgatcat cgatatacat 11040
gatgtcaaaa atttgggtat aactgaagaa ttttagtaat ttaaagattt cagaatttaa 11100
ataatgaaat atctgataca ttcaattgga aatttggttg agatcagctg acttgttaat 11160
tggacttcac tgataaacat ttgccttaaa atctgtagaa tctaaagcag ggtataccta 11220
gtatgcgagt aagacatcat ttctggaatc aagggggctt ttcagtgttg accagatgtt 11280
tatcactgca tgggcaaatg gcccaaggag tatggttgtg gcttggctta tttcttctta 11340
acgcagatgc agttgctttc tttctgggtg gcagtgtgga ggataactgg ggtcggtggg 11400
gacataaagt ctcacaaggg gaggaaagcc cctctgtggg ctctctgggc cagccaccct 11460
ccttacaaag tgggatgtca gcttctgctc tgaccagagt caaagtaggc atcagctatt 11520
gccattactg ttgttgtata atatggtgaa taaaggaaat gtgttatata tatatttttt 11580
tcttattatt atactttaag ttttagggta catgtgcaca atgtgcaggt tagttacata 11640
tgtatacatg tgccatgctg gtgtgctgca cccactaact ggtcatttag cattaggtat 11700
atctcctaaa gctatccctc cccccctccc cccaccccac aacagtcccc agagtgtgat 11760
gttccccttc ctgtgtccat gtgttctcat tgttcaattc ccacctatga gtgagaatat 11820
gtggtgtttg gttttttgtc cttgcgatag tttactgaga atgatgattt ccaatttcat 11880
ccatgtccct acaaaggaca tgaactcatc attttttatg gctgcatagc attccatggt 11940
gtatatgtgc cacattttct taatccagtc tatcattgtg ggacatttgg gttggttcca 12000
agtctttgct attgtgaata gtgccgcaat aaacatacat gtgcatgtgt ctttatagca 12060
gcatgattta tagtcctttg ggtatatacc cagtaatggg atggctgggt caaatggtat 12120
ttctagttct agatccctga ggaatggcca cactgacttc cacaatggtt gaactagttt 12180
acagtcccac caacagtgtc aaagtgttcc tatttctcca catcctctcc agcacctgtt 12240
gtttcctgac tttttaatga ttgccattct aactggtgtg agatggtatc tcattgtggt 12300
tttgatttgc attcctctga tggccagtga tagtgagcat ttttttcatg tgttttttgg 12360
ctgcataaat gtcttctttt gagaagtgtc tgttcatgtc cttcgcccac tttttgatgg 12420
ggttgtttgt ttttttcttg taaatttgtt tgagttcatg gtagattctg gatattagcc 12480
ctttgtcaga tgagtaggtt gcgaaaattt tctcccattt tgtaggtttc ctgttcactc 12540
tgatggtagt ttcttttgct gtgcagaagc tctttagtta atgtgttata ttttaagagc 12600
tcagttatct gttacctatt tgccagtgac aggaactcat gtcttctgag gcagttggtc 12660
tcatttatgg tagatataat taattattat ctaattatta ttgcccttga attatttgaa 12720
gatatcatca ggccctctct taaacacttc cgttcatgtg ctttagcttc tttatatggc 12780
cagccactct ctgtggatat gtccaggttt gttgatgtcc ccttgacatc agccaaccat 12840
aacttaacac tggatgagag ctaagcagtg ctaaacttat cacttccctc gaatgtgtca 12900
ttatactttt attagtgctg cttgggacta gatttccttt ctagcagcca agtcatgttt 12960
tgggctcata tgcagcttgt agctaagaaa gccttgagtt gttttcctat aaaccgtctg 13020
aaactatttt tagaattcaa gttacaactc tgaagtcctg ggtcttactt aatcaatgat 13080
accttctgag ataaatactg aaaatccttc aagtatagaa caaggacatc ctaactctgg 13140
gcatctgatg tctgttaaat gtatcacatt ttatttattt gtatttttta aaggaagtga 13200
gaaggagaag tgagatgctg agcatcaagc tgggcagagt tgtcatgttg tgatctgaga 13260
ttctgtcctg ttcttcagga tttaaggagt cgctaaccaa tgccaagcat gggctcatcg 13320
ggtgcagctg gggaggcaat tacttcaact caggagtttt caaaaacttt ccttatgcct 13380
gctcacagga tttcatggtg tttttcttct ttgttgttac ttttgtggaa aaggaaagtt 13440
accagtgaac aatctctgtg accttcctct caatcccaaa aatatgcttg tgataaatca 13500
gcagtttatt ttaatgcctc atttggaggc attgcttttc caagaatgaa tctttgcata 13560
ttatctgaga catcattttg gtgtaaggta gaattgtacc aggtatgtat ctttgtggcc 13620
aactatactg tcaaaactga gtttcagtca tccaataaaa aggaagctgt ctctgaattc 13680
agatattcct ccattctaag ggaactgaag tataacataa aatacttaac attctttctg 13740
tatatgtgaa aaaaccatac ctaaggaatt ttattattca gcccatgttt ctttattgta 13800
tccagtataa catactcgaa gatgtatata tacacatata tagatataca aagcatctat 13860
acatctagac atgtatatat acatatatat atacacacac gtatatactg tacttcaatc 13920
atctatatta aattgtgata atatcacatt accacatgtt gatggcattc ttgtaatctg 13980
cctgaaatcc atgaaaacac atgcagtggt ctggctcatg ttgtctcagg gagtgcattc 14040
tggctcccag tgatcatcaa ttacttttat aaaagttcac caatcacttg ttggtttccg 14100
gaaaacaaat ttaaagcaaa cattattaat gtcaaactta cacattttgc tttctggaat 14160
caactttttt attttaaaaa ttgagaatat aatttctgtc ttttgtttct ttgggcattt 14220
ttcttattct ccacaattat tcaaagatcc ttagccatag gtctgaaagt gtttgtttca 14280
gctctcatcc cccttccttg caggtaaggc tggcattcca cagccctgga taactcctct 14340
gtgctaggtc tatgcctgct cctgggacac tgaacactcc taggtttgca gggtccacgg 14400
tgtccttcgt gtccctccct gcccagcctc agcaggagcc ccctgctcct agaccactcc 14460
cttactgagt cctgtagatg ttccagcaca cacagtgcct cccttctcaa ggccccagcc 14520
ccagcccctt ctcaggtcat ttgggggctt acatcacctg ctacctgtgt ggagatggag 14580
gtctgtttgc cagcactgcc ttgcttttcc tcctgcccca ctgcatttaa tcactgtgat 14640
aagaggaaac aaagagggaa cgtcattggt cccattcctc tgaatcttga ccacgaaaat 14700
atcttgaatt gcctccgtgt ccccacccaa catcgcctct tgcactgcta cctctgcctg 14760
agtgcacatc agccaagagc caggaaccac tgcccaacca cgacccaggc acagaccctt 14820
atctctagcc tagagaagag gtgtgtttct ttctaatcat ctggtatgta tccaaggaaa 14880
ccataaattg atcattattt ttgtatgtgg aattagaaat attcatatag acatacattc 14940
tttggttttt atttttttat catccctaaa ataaatagca gatgttctca aaatggttta 15000
ttaatttcag tcctaagatt gtataattga ttgaaaccat aaatggcaga cagaagaaca 15060
gcaacagtga aaaccaagat taattctaat aaattcatta caatggcagg aatcaagtgt 15120
actttaagct cactgtaaag ttttcagtgt gttgtggatt cagaggcagt aggtgatgac 15180
ttttattata tattcttaag tacctggttt tggagggtga tggcttgttg gagggaatga 15240
tgctgaagga acataataaa acaatatgat aaatacaggg agagaagaaa gacaaaggaa 15300
aagaggaaac aaatgtcaag aataagatga ataggtaggg gagaagaaaa aataagttgt 15360
cataatttta tattccaagg actacgctag tccttggact acgctggtaa aaagaaatct 15420
aatcatgagg cagagaattt tatttatttc cccattcctt ttggctcgtg gcttgagttt 15480
gctctggctt tcattgaata catgggccaa ggcaggatga gcttctgcct gaaccgctgg 15540
gatgttattc ctgatctcat ggaaagacat gtcgcggctt ctgaccctgt gcctctgtat 15600
cactgtgttc cctgtattcc tgtgcccctc gtattagttt tcacattgct aatgaagaca 15660
taccagagac tgggtaattt ataaaggaaa gaggtttaat ggactcacag ttccacatgg 15720
ctggtgaggc cttacaatca tggcagaagg cgaaggaaga gcaaagggac ttcttacatg 15780
gtggcaggca agaaagagca tgtacagggg aattcccttt tataaaacca tcagatctca 15840
tgagacttat tcattaccag gagaacagta tgggggaaac cgctccccat gattcagtta 15900
tctccacttg gccctaccct tgacacatgg ggattattac aaaatcaagg tgagatttgg 15960
gtggggacac agtgagacta tatcacccct gtatccctgt gtctctatat tcctgtatcc 16020
ctggctgaat gggtcaaagt aatgatcagc ccacagatat gcatttgcct ctgctgagaa 16080
tagaaaggaa tataaatgaa gtctttttct tcatggagct tattaactag atgaagagag 16140
aaagcctgtg ggaaaagaca aatagaacct tcaggttcta tgcagtgagt gcccaagtgg 16200
tgattgtgaa aatgaaagtg cagccctgca gatgagcaga agctcatggt gggacctttc 16260
atgcaagcta tgcagaggag agagcatagg atttggggtt gggacacaca gattcaaatc 16320
atggtcctgc cactttcctg ctacatgaac ttgaccatgt tattttaccc ccatgaagtc 16380
tgagttttca gatgtgtaaa ataataccac taatgcatac ttttttaaaa tttaaattta 16440
aatttttttt tgacactgag tctcactctg tcaccaggct ggagtacagt ggcacgatct 16500
tggctcactg cagcctccac ctcctgggtt caagcaattc tcctgcctca gcctcctgag 16560
tagctggaac tacaggtgtg taccaccatg tccagccaat ttttgtattt ttagtagaga 16620
cggggtttca ccatgttggc caggatggtc tcgatctctt gacctcgtga tccgcctgcc 16680
tcggcctccc aaagtgctgg gattacagat gtgagccact gcgcccagcc taatgtgtac 16740
ttttaaaagc acttttcaaa tacttcatct tgtttaatct tcttggcagt tctgtaaagt 16800
gtgaagcatt gtacaaagtt aactctcatt attatattgg aacccagggt tttcagagga 16860
gaatcctcaa ggagataggg ctttcctgcc ttgtgcccat ataaggttgt ggatcccaag 16920
ggacgaaagc attttcatca gactgggaga ggcaagaaaa ggtcactggc agtatagatt 16980
cttctggagt tcactggcaa cttgtcccac ttcagttctc ccttaatctt tccagatgtg 17040
cagatgtata gcctgggtgg atgagccaaa atgaattcaa ggctaaacag gtcagctggc 17100
tcagcccatg ggaagcatgc tcatcccaaa gcaaaggtct ctggcagaaa tttctctgca 17160
cttatttacc ctgctgtctt cacattgggg tgcggagtct aattcaaaaa ctccaaggca 17220
tgagtccaag ccagggagct gttagaggtg cacatgggag atcttagcaa gagaaaaata 17280
tatgttttaa accctagaaa gaagaaagta aatgcctctc atttacttta aacaaataat 17340
atggccaagg tcacatagca ggaaagtggc aaggggtctg tcctcttttc actgttcaat 17400
catgaccata ttgtcctgga ggcctagggg caggatataa tgaagaaaca tccaattttg 17460
acagagtggg taaatgggat tgtgggactt gtagtgagct gatctgtctt cattcatgta 17520
attatcaata tcatttcaat gaccatgatg ttgatatgga aaatgatgag gatgatagta 17580
cagaaagaac atgaatatta gctgatgtct attgagtgtt tcctgggtgc cagacaccac 17640
cgttaagtgc tgaacaagga ttatagaatt taattctcta gtgacctttt gagataggtt 17700
atatgattgt cagctttcca caaatgagga agccaatatt cagaaggata cggtgctgaa 17760
gcttatgcag taagaaatag tagaagcaga attcaaactc aggcaattga acaccaaaat 17820
tcaagctctt aattactatt tctagaaccc tctgactgac tgattcctcc ctcaccacag 17880
ccaacttttg catcccccat ttctggagag catctcccca catggtatat actcaaaggt 17940
cccatagtga tcctcttccc aaagagcgtg aatgaggggt ttgaaactgc cagaactctg 18000
gtccagagct tggacttttg atgcgaatga tggagaaacc aagaggttga tttcctcagc 18060
cttcaagaga gctcatcctc agctctctaa agctgaccag aaagaggaga gtgggaccta 18120
tgaaaacagc aggagatggg agggcttgaa ttcctaatgc tatacccata ggtcattgtg 18180
ccatggtcct ctgcaccccc aacaccccca acactgatcc tgaaggtctc aacaatcttc 18240
atctgcctct ctcctttcac cttctttaca ctctcattga tagccttggt tttttctata 18300
cctccagtat tcccattccc atgatagcca tttaaggaca gggcacttcc tggtcaccat 18360
aaggaatatt gtgggaatgt tctgctcatg gatattgcat cagaataggt ctggaaatga 18420
aacacaccaa caaagtcaac agaggagagt ccaagcaaag cgtctgttta caaagttgtg 18480
gaaggtttag gggaactcat tatgagatag ttgaagcaac ccagagctag gaacagtggc 18540
gctcttacca caccaaggtt tgaaggagct cgggtttctg gaacccagac atagcagcag 18600
cagttgtgat agaggagttc ctggcagaag ccatagcttt cagttgagaa ggtggtcact 18660
gccaacccat ggctcagctg gaaggtaacc agagaataaa ttccccaaac tctttctctt 18720
cctttcctgt gctctcttat tggtgcctcc cattgagaga acccaaccaa agccagctgt 18780
aagggaaact aatgaggcat ttccatatag ctcagcctgc tgggaaacat gtactataga 18840
aaagggtgga gagcggatct agagaggcaa aaaaattaaa caacggcacc gatgtttaca 18900
tttctttctg atgtagagac ctcataccac ttttctgtac atcttacttt aatgtgtaaa 18960
aaggcctata ggctctttct ctaggttcag taaaagatga actaggaaac atatgccaca 19020
tttgagcttc ctcacagctt ggcccctgca aagctgtccc cttctaagaa ctaagtgccc 19080
tgggtattca gtgctgtgtt gtctggtgac ttcgcagccc tgtcaacatt gtttttctgt 19140
ttgtttgttt gtttaattat actttaagtt ctagggcaca tgtgcacaac gtgcaggttt 19200
gttacatatg tatacatgtg ccatgttggt gtgccgcacc cgttaactcg tcacttacat 19260
taggtatgtc tcctaatggt atccctcccc catccgccta ccccacgaca ggccccagtg 19320
tgtgatgttc cccaccctgt gtccaagtgt tctcattgtt caattcccac ctatgagtga 19380
gaacatgcgg tgtttggttt tctgtctttg cgatagtttg ctcagaatga tggtttccag 19440
cttcatccat gtcactacaa aggacatgaa ctcatccatt ggctcctcct cagaaaggtg 19500
gaaaagcaga acctcttaaa ctgctccagg tttcctggag agccttgcct taaaaaaggc 19560
cctttttttg gggtgggggg gacaccaatg ccgtgactcc ttcaagaatg tgattctagc 19620
aagagactga gctctattct ttttcttcct ccaccctctc ttaaggcaaa ttgagtcaaa 19680
ccatctcagt ctacccacac catccttctt taatttctgt agttaagagc ataaatccct 19740
tccctattct gagtgtggtt catcgaccta cagcatcagc atcacctggg agtctgtcag 19800
aaatgcaaaa tcttaggctc cagcccacat ccctgagcca aatctgcctt ttgcaagatc 19860
cccaggtgat atacatgtac attaatttta ggaggattga tgtagcctgt atgccatggt 19920
aagaggcatg caatgtaatg ttgagtttct ttctttagaa tttatagtag cagccgggac 19980
cggtggctca cgcctgtaat cccagcattc taggaggctg aggctggtgc atcacttgag 20040
gtcaggagtt ggagatcagc ctggcctggc caacatggca aaaccctgcc tttaccaaaa 20100
aatacaaaaa ttagccaggt gtggtggtat gcccccgtag tcccagctac tcaggaggct 20160
gagatgggag agtagcttga acctgggagg cggaggttgc agtgagccaa gatcacacca 20220
ctgcactcca gcctgggtga cagagtgaca tagtgagtcc ctgtctaaaa aaaaaaaaaa 20280
aaaaaaaaaa aaaaaagaat ttatagtagc cacaaaagcc tttttgagta attgaagaaa 20340
ttctgaagtt attgtgtgct ttgaaattta gtatttattg aatagtttat atctttcaaa 20400
aagcttttat aactcattgg agtctcgtca taactccatg aaatacgtaa ggtagataat 20460
aggagccaca ttttccacat gaggatctga ggcatgatta agtaaaatca gtcctctgct 20520
aggtggaatg gttttgagac cagatactag ggctcagaac tcattttaaa gctgttgtgg 20580
cagctatcaa ttctgaagaa agtcaacatg gcatagcatg cctcttacca tggcatacag 20640
gctgtatcaa tcctcctaaa actaatgtac atgcacacca cctgagggtc ttgcaaaagg 20700
cagatttggc tcagggatgt gggctggaac ctaagatttt gcatttctaa tagactccca 20760
ggtgatgctg gtgctgtagc tccctccgtc ccccagcttt cccccatcag tatttctgaa 20820
cacttgatcc acacccaatc tgcctcaaaa tcacttgtgg tggaaaatgc ttgttaaaca 20880
ggtagattgt tgtgccccat accaagacat aatggatttc ttatggtctc taaatgtgag 20940
aatcactttt ttgtattggt ttgaatgttc tgatttaaga gtatgggatg agggaatttt 21000
aggttcattg tgttcacatc agtaggactt aaacctatgg aagactttgc agcagaatag 21060
gaagattatt ctcccagcct acccaacagt tgaaaaacga tcagaaggac ttggaaggga 21120
gcaatggagg attgatgaca atggcaaaga ctgagcagtc cccaggcgtg acaacaaaaa 21180
ggaaagcaat cagctgtgga gagagaaatg gtgttgatga tattatgaaa gtcgggatat 21240
aaacaagaat gagaaaggga ggaatgggga aactgaatga gacagaagca cagaaaaaag 21300
aagaaaggaa aaaagaagga aaaaaggagg aaaagtggga gaagagacag atggagagtg 21360
agagaaggga ggcaggtagg taggcagaag aatgaggaag aaagcaaagg agttgagact 21420
gggaatggac agaaggaaac ctgtacatgc tgtgatctgg gctttctatg ttccctgatc 21480
cagggtcctg agatcttggg gtactcgcca ctgcattgta agtttctgtg gatgaagctg 21540
gcatataaat acatctgtaa agctgtaact cctgggcatt gtccctgaaa ttttactgat 21600
gtctagattc taggtatggg attaaatggg tccacatttt gtgtttttct gagtcaccaa 21660
ttacaacaaa acttgctcat atacttatgc ctatcttaaa aaataattta ttttaataaa 21720
ataataataa ggcaagaaaa aaagacaccc agatttgaaa aagcaaaaaa tgtctttatt 21780
tgcagacaaa atcatgtatg tagaaaatcc taaggaatct acaaattagc tactagaact 21840
aataagaaaa tttaatgatg tctcaggata cagggtcaat atttaaaaat tattgtattt 21900
caacttataa gtgatgaatg tttggataat ggggtttaaa taatccattt acaacaacat 21960
ccaaaatata aaataactag caacagactt tataaaaaca tacaatgaaa attgaagcac 22020
gttgctggga aaaagaaaaa agaaaacaaa attcataaaa agacattata ttcactgaac 22080
agaacactta gtatttttaa gacgtcagtt cttatcaaat ttatgtgtag actcaattca 22140
atcccaatca acattccaac atcaacattt ggctagagag caaagttggg gtcagattgt 22200
gtagggctgt gttaaagagt tgagcattac atgagataat ggatgtgaag aaagtgctta 22260
atagggggtc gtgcagagga agtgctcaag aaatagtatc attgtcatta ttaccattac 22320
tgtattgttg ttattattta acaaatgttt tcaagcccac tttggcttgt gtatgggttg 22380
aggaaaacgc tacccaggca gaaagataaa acttattctc catgcctctt gagaaaagaa 22440
gcagcaatcc ccagatgtag ggaggagggg agccctgctg gcttttagtc agcctcacac 22500
aggaaaggag aggtagagat tctgcagcga acaagaatca tgtccgggac ttcacagaca 22560
gggacactca aaggttggat gatgctcaat tgcagcatcc acctgcaggg gcctcacccc 22620
acttctcact taatgattgt ctctgctgtt agggagccct tgaaagccag gtgttttgtc 22680
tccttcccaa agcctcagaa gatagacggg ggccatgagg gaggtggggg cagggaaggg 22740
ggagttcctg tctgttcttt tctgcccttc cctgtgctct ccacctctat cccctcttcc 22800
ttcccaaaca ggtggcagga atgttaagac tatgaattcc atcaagagca agcagggttc 22860
cttagggcac cagttggtaa gtgtaagagg cctcatccgc ttgcaccagc agcagaaaga 22920
agctgcagga agagtctctt ttgggcatga gaagctaaag gaggctggtg gttttctggt 22980
taactgcaca aggcctgcaa gttctacaga tgtcctttga ggaccagagc agcctccttt 23040
cctcccacac tctccagaca tgggaggcag taggagttca aagcacttct cagaaattga 23100
gcctttggtt ctgctgtcag caaaaggctg tgaagctcag tccccgacac tgggtaggag 23160
aagggtgaat gaagactagg gggtctggtg aaggaagtgg ggaaacaaac tcttcatttt 23220
taaagagagt gacctggcaa aacacagaga agatactttg ggtttggagg aacgtgcaag 23280
aggtcgagag tcactgccga ggggttttga tgcggcactg tgctccggca atgggaaggg 23340
ctgtggtcag gaaacaaagc agcaggtgtg gcccatgtgg aattgtcagg caggatttac 23400
ctgtggtggc ccgtgccgca cagcctggcc caccttctgt ccacctctgc tttccttctt 23460
aggacctcct agaaagaaag ctggaccttc cgaaaagtag cttgggaggc aaataacatt 23520
tatcgaatgc atcaatgtct taggcctcaa gcaagggttt aacatgagaa tctctttgag 23580
ttcccctagc atcctatgag gtagacacta ttaatatccc ccaaggctca gagaagttaa 23640
gtcacttacc aggaaacaca actattaaat caggcctgcg tttgatccca gggatgttaa 23700
atttgaggcc tgagctcttt ccatcatact gcgaagtctc aattgtggca tcactgcaaa 23760
agaaaaacca actgaacgtt gctgtcacat gcagagagag agacaaagaa gagaaagggg 23820
gatgcagcta aatgctgggc tttttgctct tgcaggacca tgccacagag tccaccgtct 23880
ggggagcagg gcctgtgagc tacagattct cgaacaatac aatcatgggt caatgcctgg 23940
gcagagaata ggttctcttt gaagttcatt atctccagaa agcttttcca gcttccagtc 24000
actgcttcac tccagttttc tttcttcttt tttcatcttg gcttatttta gttggcttct 24060
atgcccatga ctatcaccct caaccaaaga cagagaggct ccaatgcagg aggcagacag 24120
atttgggctt gaacccaatg ccgcttcctt gctgtgtgag ctttgtcaag ttattctatt 24180
gcctaatttt tggggattgt attatgttat gttacatgtt atgttttgtt acatgatatt 24240
gtgttatatt actatcttct tcatggtgtt attatattat taagattgat gagataatgt 24300
gtgtcagatt tctagcaggt ttcttggcat attgcaacca ccaatacact gaacatatac 24360
tgtctatgta actttctcag actcagagat ttttgtctct tttatctccc acaattcttt 24420
tcttttcaaa atgtcacttc cagaattttt tcccagaaga atccagtcca ttaaataaga 24480
atgttttttc actaaaattt tctttctgca tactcttagg attgtatgat gttcgtctgt 24540
ctcccccacc tacaacctcc agcagagaga agagggctga gccagtagtg acaagggtgg 24600
gactttcaca tctcttttat tccccctgta gctttttgct aagggctaac tgatttcact 24660
taaaaaaaaa ttttttttta agaggccttc catcctggtc agacttcacc tttttgcacc 24720
ttagtattct cggctagaaa atggaaataa taagtcctcc cccactcact ttacagggtc 24780
atcataaaaa ctcgataaga tatattgttt aaaatattta aaaaccttgg aatgcttcat 24840
gaatataagg cattgttatt caaatacaga gcttcttaag agctttactt tttagctctg 24900
tgatcagtta acttttgatg tggagcaggc aaccacgaat tctcagaggc gtgcaacaat 24960
aaacatttat ttctcacaca tctgtggagc tgagctgatg taggctgggc ttgcttctcc 25020
atctgggggt ggtgtcgttt ggctgaccgt gttgggcctg gctgggttag tatggctcca 25080
catgtttctc atcctcctcc caggattagt gggcagccca agcatgtctt tcttcaaaat 25140
gatgctggat acataagaga gcaagcaaaa acatacatgg cttcttgaag cccaggcttg 25200
gaattggtat gccattgctt ttactggcca agcaagtcac atgggtggca tcagggatgg 25260
gcttatgcat catctactgt gggaggagtt ttctaagtat gatgagggca cagatacagg 25320
gagcggtgac cattacgaac attaatgcga atcctccaca ctgtgtttct tgatctgcca 25380
ggacagggtt ctctgaaggc cagtagaggt tcagtgcttc caaaaaagga tgctgggctc 25440
aggtaggtag acagagttca tcacctctat catgactgat tggctctaag gcccaatgac 25500
aaaactcttt acttctgtaa agtgttagac agtgaagaag atgaaaaggc catcatgaaa 25560
ttcagtctct gcttttagtt tttgtttgaa attcggtctc attgttgtgt ttgttttgtt 25620
ttgttttgtt tttccatatt ttctcccaag ggttattact ttcacaacag tggaaaaata 25680
ttccttatgt tctctcccct ctccttccca ggattccttt agattcctgt gtgtgcctga 25740
gggagctaga agagaaatac ataaaacata taactgtggg actcttgtct gagcccatct 25800
ccattcttaa gtcccattca cccccacaaa agctttcctt agagccaatt atgttcctta 25860
ggctaccata tccccataaa cagacgtgag ccactgtggg ttcctagtaa tgagattttg 25920
tttggcagtt ttatttgcaa atgactccaa agatctgagt aaaacatctt agagcaagaa 25980
attctgggtt agaaattttc aaaccagaac acttcttcaa aggaagatga ggttgagaga 26040
gggggtggcg gtgaggcagg gattgatttt aatgggccag tatccagggc tccagatgtt 26100
tcttcaaaag gaatctccca aattattgag cccaagttac agaataagcg agaaagaaaa 26160
tggtctacag aatctttgat tgggtccgca tgaattcatt aaaagtggtt gtcagggaga 26220
tgtgaggggt ggggaggctt gcacatatgt atattaacac acacacacac acacacacac 26280
gcacacgcac gcacacgtac acaaagagct tggtgtactg gtcttgtcaa atgctttcct 26340
ccctctgtcc ctccccacga aattaaatcc aaggtctgga gttttgccct ttaggttaaa 26400
aacaaaaaaa acaacaaaaa aaacaaactg ctgcttttcc aaaaagcatt aaagagagaa 26460
aaaatataac agcagctact gacttgaatt gaacttaaaa tttcccagga agaatctgct 26520
cagagccgaa ctcagaaact tgttgcaagc tccccagaca tgagaaaata aacttctatt 26580
aagctggcac tgaagtgcct ggaagggtgt tcaaccctta gaacaactct tagctttccg 26640
aggagtttca gggttggaag aacaactttg ccaattctac cctcaacttg gaacaaagca 26700
ttatacatct ggaggagtct ggtggtttaa tgctttcttt tccatccaag attattcatt 26760
cattcaataa atatttagtg agaacatact acctactggg cacggtgcta ggtgttgaga 26820
tgtggtgatc agggtgaaca aaacagacat agtcattgtc ctcctggaat ttgcacttta 26880
ttggaggtag gggagcacaa ttaactaatt acgtttactt gagataagtg tagttaaaga 26940
aacaaacaag atccagagac agaaagtagc aaggacttac aggatgatca gggaagtctt 27000
ttccatgaag gtaacattta aactacataa tgctgatatt ttgaatctga acctgaggat 27060
ctcagaattt tccacttctc cctctgaaac agaggaggtt ttggtccaca ggagaggcta 27120
agggttgatt cagtcaaagt ctttggagtt cagattagcc ctcgcagtta gctagaagtg 27180
gggatggaaa cttaatacac ttgaattcac acacctccgg aagtatttat ggctacttct 27240
ggttctgacg gcaaggtcag gtgaatcaac ttggtcttat gaatatagtt gttttccata 27300
tcccttgttg aaaatagaag caggtttgaa tcaacgtaaa gaggaagttg ttaaacacca 27360
tgagaaactt ccaaatcagg tgtgtcatgg actctttctc tacctgagat aaagatgagt 27420
ctgaataaaa taactgagaa gtggacttag gtgaaaatga gaagatagta aagatgattt 27480
gtcacaaatt gtagggaaca aaatccaaca ccacactaag aaaataatat actatgacaa 27540
ggtgggacct attacaagaa tgccaatttt gttcagtttt agaaaataca ttagaataat 27600
atacattagt ataactcagg aaaaatattg tgattatctc cagagatggt gaaaaagcct 27660
ttgagcaaac tgaacaccta ctcctaacaa aagcactcaa gaatatacaa attaatggct 27720
gtttctttga caagataaga aatatatagt ttggtcttaa caccagtatc tgtgctaatg 27780
agaaaatatt aggggcatat ttattaagat cagaaataaa taatatcctc tctccccttt 27840
atttgacatt gtactggaga tattagccaa tgcaattaaa caaggtaaat taaaggtata 27900
aaaattagaa acaaataagt taaactgtca gtatttgcag atgatatgat agtatacatg 27960
gaaaattcaa tcaattataa aatgaactca aacaataaaa tattttgcta aatttagaaa 28020
agataagaga atttaaaatt aatactcaga aatcaatagt tcttatatac aaaaccgaac 28080
accagttaga ggatatgata gggaaaacct catttaaaat ccaaagggga gaactttaaa 28140
gcttccttaa tgaaacaaaa gtagacctga acaaacagaa agacaacttt ttgctttttt 28200
tttttttttt gcttaggatg ttttaatatc ataaggttgc cattgttctc ttagctaact 28260
tataaattga ctacaatcct aataatcaca ttaaaatttt ttatagtgaa attgatactg 28320
aagttatatg gaaaaaataa gaataactag agaaatatta agaaattaaa agagagctac 28380
aatgaaagat taactctgcc taaatttaaa aggcattcta aagtttctgt gattgaacta 28440
gtaagaacct tgtgcgtaag tggaaagacc aactaatgaa ataaaatatg atctgaaaga 28500
gacccatatg catgtgaaaa tttagtatat aataaaaatg caagttctaa tcacttgata 28560
gtcattcctt taaagagata caatgaaatc cataccttaa accatataaa agaataaacc 28620
tcaaatgtat gaaagatagt atatatagaa aataaaacct tataagtcca caattctagt 28680
tagaagaaaa tatcattaat ttctgacttg atctgacctg ggtctaacta taatttggaa 28740
tcctgtaata ataaatgata atagtaatca aaatgatgat aaagaataaa atttgactag 28800
gtaaagttta gaaacaacaa atttgaatgt tcaaaaatat tatcagcagt aaagtcaaaa 28860
gccaagtgac gaactggtag aaaatgtttc tatatatatc agagataaaa agttaatgtc 28920
cccaaagtat aaagaatttt tgaaattgag aataagcgga aaaccaaaaa ccaatataaa 28980
tgggcaaaag atacgttcat ataatttaag tggtccctaa atatataaaa atatcttcaa 29040
ctttcaaata tccttaaaca tataaacata cattcaaata tgtttcttgt aataagagga 29100
atgaaaatta aatataatga gataccattt ttcacctatc agaatggtaa aacaattttt 29160
tttaaactct taacacactg ttgacaaagc tgtgagaaga aatactctca gtgttaggag 29220
gaatgaaaaa taatgcaact ctttggagag gaagttgcaa tctctaacac aaatacatat 29280
gtgtttctct cttgaggtgg caatccctat tctagaaatt tactctgaag ctatacctct 29340
aacaatatga atatgaaaat acatgtacac aaagttattc actgcagcaa tgtttataat 29400
tgcaaaatat tagaaacaac ctaaaatttc catatgtact agactgaatg tgcaatgata 29460
catccactca atggagtagt atggagttgt gaaacaaatg aggaagatct ttatgcttga 29520
cacagagtga ttttcaggat attttattga gtggaaaaag caaagagcaa aagagtattt 29580
ctgcaatgta tactatacta cattttgtgt aaaaaagaat atatacaatg tatgctatgc 29640
tacgttttgt agaagaggaa gacagatgaa aatagacata tttacaatat ctgtctaatt 29700
ttgctggcag aaacacagga agaataaacc agaaatggat acaatttgtg atctatagag 29760
gatgtgggga aatgggatgg aaaggacgag tggtgggcgt aggggacggc acttctctga 29820
atataccttt tgtatcattt ttagttttgg aaccatgctg acattttacc taccaagaaa 29880
aagcactaac tatatcataa atgaagaaca ttaccacact gaactaggga aaaaatttaa 29940
aaactaatac aagtaacatt tgaactcaat tctttgacta tagaccatca gactaaatac 30000
aaaaggaaac ataaacatta aaatgtagtt aacagttttt gtctaacaca tagtgttagc 30060
aattcagaaa ccactttatg tgaaacgtag aaatgagtga gtgagcaaat gcataactat 30120
attaaggata aaggagagta ggtttctgac tgttgaagac aattaaaaat atgtacagag 30180
ggccgggcac agtgactcat gcctgtaatc cctgcacttt gggaggctga ggcgggtgga 30240
tctcttgagg tcaggagttc gagaccagcc ttgccaccat ggtgaaactc catctctact 30300
aacagtataa aaatttagcc ggccgtgtgg cacgtgcctg taatcccagc tattcaggag 30360
gctgaggaag gagaatcact tgaacccagg aagcggaggt tacagtgagc tgaggattgt 30420
gccattgcac ttcagcctgg gcaacagagt gagacttagt ctcaaaaaaa taaataaata 30480
aaataataac gtacagagga aaatctcgaa tgtaccaata gtaataatct tgggttaaaa 30540
ttgttggcat cagcaaaaac tcatggtttt attaaatata ttaacattta ataaataata 30600
tgtattaata tataatttca tatatacgta catctatatg tatcttatat gtatttcttt 30660
tttatatata acatctgtgt gtgtgtgtgt gtgtgtgtgt gtgtgtgtgt gtacacccct 30720
tcagtcctat gaatagctgt gttcactgaa ggaagcaatg gcacttcaat aaaaacgagc 30780
acatctagtc ccaagacctt gtttctaagt accattcctc aacaaaaaga atcctcaaca 30840
aaaagacatt tcctgaagaa atgtctgatg ccataggctg gttggagcaa agaaggccta 30900
acatgatcgt gaattacctt attgtaccag aaaaaaaaaa aaactatgaa aaaatgatgg 30960
cgatatatca aaaagactca ggatccagtg tgagcagctc ttattgggca agtcttggaa 31020
atttgaacaa caaaatcaac aacggttagt tacacattaa catgtttgac aaaataagaa 31080
tccatgagtc cagactgata taaattaatg agtgaataaa tgaataggtg attgagaaga 31140
aaggaaagct tctcttcaca atagaatgcc aattaacaaa tacaaaagga acaatggagt 31200
tagaaaagag ttagaacact accattttgc agcaattaca ataataatta gtttaggtaa 31260
gaatcatgaa tgggtgatac atttacggag actgtttgat gaggaactgg atattacata 31320
gcctcacagt gtttctcata ggctatttct aattctagag gaaaaatagt aacttcacag 31380
taagaagcat ggtggacacc accttaacca aatgattcaa gttatcaata acaacgggac 31440
aatctgacat gtgtttccca atatacagat gaaaaagagc atagcatcac aattttacaa 31500
cataaatcta agcaaaagga aagaaaagac aaacccaatt gaaggagagc cacattaagt 31560
aattggcttg aactcttcaa aatgcgaagg ttatagaagt caaaggaaag actgggttaa 31620
tattcttcta acactgtaag tctcagccta aatccaaagg cctgagaacc aggagtgcag 31680
acatccaaga gcaggagaag agagatggcc tggctcaagc agagagtcaa tttgcccttc 31740
cttcatcttt ttgttctatt caggccctgg agggattaaa tgatacccag ccttcactgg 31800
ggaaggtaat cttcattact cagtctgctg attcaaatgt taatctcttg cagaaacacc 31860
ctcacagtca cacccagaaa taatgtttta acagctacct ggtcatccct tacctcagtc 31920
aagtcgatac ataattaacc atcatagagc cagaacatgc aataacttgg aaataattca 31980
gtcattgtgc aaggagttac ctagactctg ttttaggctg gaaggtggga gtgagatata 32040
aaatgcatac agtgatcagg aggctacgag tactagaaag aactagaaag ctttaactct 32100
ttcatggcaa taataaaatt caagattgtt actaggaata aactgtacca gagttatgtg 32160
agacccaaac acagtcagaa ttagactttg gaggtatttg ttgaattgaa ctgaacccta 32220
tagctcccca ttgttcatag agtgcctaca acctgtggcc actgcactag gcattcagga 32280
ttcagaatgt tgagaggact atgagaagta acgtggctaa gcatggaacc agagagagtt 32340
ggcccaaccc tttcatttac aaatgaggaa actgatgccc acagtgagac tggcctggcc 32400
caacattaca caaccagttt atggcaaagc aaagagaaac acctgtttgg gtagtgaggg 32460
ttgcctttta ggtgccctga ccccattttt accaccaagg attgaggagg aattgcagta 32520
caaagagaca agagatagaa aaaatttgag cgttgctgct gctatagacc ctccatccag 32580
caaagccttg agagagatat tctaccaccg ggctgggact gtaaactagt tcaaccattg 32640
tggaagacag tgtggcgatt cctcaaggat ctagaactag aaataccgtt tgacccagcc 32700
atcccattac tgggtatata cccaagggat tataaatcat gctgctataa agacacatgc 32760
acacgtatgt ttattgtggc actattcata atagtagact tggaaccaat ccaaatgtcc 32820
atcagtgata gactggatta agaaaatgtg gcacatatac accatggaat accatgcagc 32880
cataaaaaag gatgagttca tgtcctttgt agggacatgg atgaagctgg aaaccatcat 32940
tctgagcaaa ctattgcaag gacagaaaac caaagaccac atgttcccac tcataggtgg 33000
gaattgaaca ttgagaacac ctggacacag ggtgggaaac atcacacact ggggtctgtc 33060
gtggggtggg ggaaggagtg agggatagca ttaggagata cacctaatgt aaatgacgag 33120
ttaatgggtg cagcacacca acatggcaca tgtgtacata tgtaacaaac ctgcacatgt 33180
accctagaac ttaaagtata ataataaaaa taatatatat tctaccaccg ggctgctaac 33240
ttggcaaggg ctgaaagaat ccaaccgaga agaaaatagg ccatcattgt gcccctctcc 33300
acatcaaaat gcaattactg agcttttctt aagagctcag cactgtgcta gatgttgtcc 33360
atgttgatct tcacaactgc agaggctgaa ttactatatg tttatgtgat aactaaatat 33420
tctattatgc ttgcatttgt ctttggtgaa tattattgaa gtcgtttact gctacggttt 33480
cctctgcagt ttttctacta gtccatcaca ctcttctttt tggccctatt tttacccata 33540
ctcagttagt ttcttgtggc aggctacgtg tgtgtgaggt tctgtgtgta tgtgtgtttg 33600
cgcaaacatg gttttgtgtc agtatacctc atagatatga aaacagtttc tgttcaaaca 33660
gtacccacac ttagactcca tattaatctt ggctcaattc tgtgaaaact ggccctgaag 33720
tctgtgaccc cccttactca cctctttacc tcatctcaac caaaagaatc cacttcaaga 33780
acaccttccg cacaagctct tcaaatatct caagttctct tttccagtat ggtgttgcag 33840
ggtgtagtga aaaatgcatg agtttggagt caaacagatt cccgttccat ttctggttgt 33900
atcctatatt accacttgga gttgttggca gtcttaggtg aacacaggag gcaattcttt 33960
ttttacagtg actgacaaag aggtgagcaa gaaatgtgag tctcttattt attcccagcc 34020
cctctatctt aacttgttga aggtaaagac cagtggatct gaatttagat tatttaccct 34080
cccatgtgtg gggaacacac acacgtgcac acacacacca ggctggaatt tcttcagttt 34140
gttcctccgg gtctactcta tacttcatgg aagctgatct tatgacttac atcaatggtc 34200
tcccttgtcc tctggcttct attagatttg gcaaatgggg agccctggca gatcactgaa 34260
gggaggacag aagttgtagt atttattcct gtgatattct ctcctggtgt gtcaccttgg 34320
gctgtctgcg tcccttgaca gaaggtcacc ctcttgtcag gcatcacttt tctcacagtt 34380
ctctctgtct ctgggttcca acaccactcc ctcttcttga cccttaacgc ctaggggtga 34440
ttatagctcc agctgttatt agcacggagg actgcacgat cccttatgat ttcactacac 34500
ccagtaaata gaacctttat taagcttttc ccaaataacc caatttcagt gcactgtctg 34560
ttttctgctt ggactttcac tcacgtatgt gcatgcacac acacacacac atacacacac 34620
gcatgcacac tcatacccac gtactctcta tatacgtgta cattgagtgc tatggaattt 34680
ttagggttct ttgaggacaa cttcctggaa gaagaataat gggagatgtg ctcagaggct 34740
ggtgagcgtt taattgacct ggttgtgagc acaatgggaa tgcttttctg aaccttccat 34800
ttgcctccaa tttagaataa ctgcttagtc agcaacatgt ctccaattaa catgacagat 34860
tttttggacc acagatctct ttgggaatct tatgtaagct gtgaaacttc tcccttaaaa 34920
aacctacata tttaattctg tctgtaattt taggacttca catatcccca aagaccattc 34980
atgatccacc agggttaaag acttgtttta agtaaagaaa atattcacag cctctggagt 35040
agtagacatc tccagagaaa gtctggcatt ctttggtaac tcatggcatt tattacatta 35100
gctttggatg gaacaacccc caacccccaa gtctgagcat gtggtttgat gctgcttcct 35160
ttccattttc actctgctct cttggattct atgtagcaaa aaggtacctt ttctagggtc 35220
acatgtccac ttctcaaact ctgtcttgca ctggggattt gagggtggac tatcagagca 35280
taatggaaga ggcaggaaag gatagcacta attagagaac ttgataggcc ttttgctact 35340
gataaagatt ctgtcctgta tcatccatga ggtttggatt tgcacttcta aaaaatagct 35400
gtgtgttttt gacaatagcc actccctttt tgctcctttc tggtctcttt cctaaatgac 35460
tttccaggat agtataaaat aagcaatcta tttagaggaa caaaacaaag aactacacca 35520
ttagcattaa aatatttcta gggtagttta ggtaacatag aactttgtag ctcagcagtc 35580
ttggaatcac tagactctaa gccccatgta gtcagagact gcctgctttt ataattcatc 35640
cccaacagca ggctattgca taacacattg ttaccaccca caccattttg ttgagtaaat 35700
gaatgcatgc atgaacgaat cagaggattc tgttgtctaa ataaactttg gaggtgactt 35760
agtcttctct tccctctgat gcttagatct tctttatctc tcagttcaac atatattgct 35820
caaatggttc ctaggtgcaa gggatctgga agttattaaa atgaaataga ttttggacca 35880
tgaccttgac aaattatgat ctactaggag agataatatg gaaatcagta taatactaca 35940
gagacagtaa aaaggaaaaa gaaatgtttg cacttaataa ttattccacc attgttccaa 36000
aagtttcaat tatagggaac taagttccac tactaataaa agtcaatacg cattgtatgc 36060
ttactgcatg ctaaatatat tatgtcatta taatatttat gttcaggtgt atactatgat 36120
tgtatgtatt ttacgacaag gaaattgagg ctcagagagg ttaaagaact tgctcaaggt 36180
gacagagcca gtaggtggta gaacaaagac tcctacattc tgacctagtc catatgtaag 36240
cagatttatt gctagaaata tcttgatgtt gcattgaaat ctgcctctcc ttattttcca 36300
tttggaacta attccactct cccgagccag aaaaaccaag cctctcatta cttgaaaaac 36360
caattaatga gttaaattac atcaagttag tttaacagtc agcaattccc tgttgtaatc 36420
atagttaggc tgctaccatt tttgtcccaa tcattggccc acactgaatt ttgtgtctaa 36480
ttcattgctt tctgtctcct taatttcatc ctctgccccc agagatacta tgctgagtat 36540
tgatgctgca gcaacatatt aatttttatg ttttctgact catttacccc aaagccatag 36600
tgcatcaaat gcttttgggt ttgtgaccat tttatctttg gtttcagtca ctgtttatct 36660
ggtcgcatct ttgttcattt aacaaatatt tgctatgaag tgcaagttta gtgggtagca 36720
aacactgctc tggcaagggg tatatgaaga aagacatcat tccttcctcc aagactagtc 36780
ttgtttggaa gctggacaaa caaacagtta caatacaatt aaaatagggt taattaagaa 36840
atgtgccaac tgtcaagggt aatcaaaggg gaccctttca gtctgtccca aggatgctag 36900
gtaagtcttc acagagaaac tggtattagg gctaagatct agcggaggac taggggcttt 36960
ctagacagac aatggaggca ggacacttct gagagaggaa tgaagccttg aggtgtgaga 37020
cagcatgtgg tagagcatgg agggttcagg cacttggagg agttgggtat ggggagaaat 37080
acagagcacc tgtgagagcc tggggcatgg ctggagaggt aggcaggggc cggcttgcaa 37140
agggctttac ctgtcatgct gaagggctaa ctgctgttct ggagaatttg cagagccact 37200
gaaggttttg aagcatccta atgttaggat tcacttcaag ttttagaaag tttagtcttt 37260
tggctcaagg gtggggaggg aataaaagaa gcgagagtga aggcatggga ccagtttaga 37320
gactagtgaa gtctgatgaa aaggagatga gagaagccta aagtggacaa gcagctggac 37380
acggcggctc acacctgtaa tcccagcaat ttgggaggac gaggtgggcg gatcacctgt 37440
agtcgggagt tcaaggccag cctggccaac atggtgaaac cccgtctcta ctaaaaatac 37500
aaaattagct gggtgtggtg gcagacacgt gtaatcccac ctactcagga ggctgaagcg 37560
ggagaatcgc ttgaacctgg gaggcggagg ttgcagtgag ctgagttggc accactgcac 37620
cccagcctgg gcaaaaagag tgaaactctg tctcataata aataaataga gtggacaagg 37680
aaatactgat gggggtgaga aaacaatttg agagacattt gagaagtagt gagataacat 37740
ttggttactg attgaatatg gagtgttagg ataaccctgg gatcctcatt ttgggcaatc 37800
acaaagctac tggctacagc aaaaggaggg gaagaaaagt ggtggtggga gggaggcatg 37860
agaaatttgc tgctggccat gttaagctcc acctcctgtc accaagtggt gatgctcagg 37920
agatgtttgt gtccacagga ggagagtgat ctgggtggga ggtttacatg tccctccttc 37980
catctcccgg tccttctttc cctcctccct ctttctttgt ttggtacttc ctttcttctc 38040
tcttttcttt ttctgccttc ttttgagaat gaaacctaag agtgtttata tgtagaggga 38100
aaaagtggag ctagaagttt aagacacagg aaagggagga aaaatgtcct agtgtgagat 38160
tccaaggagg aagaagggcc aggataaggt ggggagaggg atgcctcttt tgctcattgc 38220
ctttatctgt ctttgtctgt cctggattga ttgtcctatc cttttcttcc acttcgtgtc 38280
ttctcccgta tttctacaca aggcacagtc aaataagggc tggcacgtgc gcatctttgt 38340
gcacacatgt gtgtgcacaa gcattgaggg atgcacaggt gcacacacct tgtagagcct 38400
ctagtagctc aagtcacatt ttttcgcatt tccagattgt aagccttact gaggggcaga 38460
tgggacgttc tcacaggaaa aaggctgacc tcagggagaa agatgtggcc cccacctaca 38520
aaccaatgat gtctactccc aacaggggac gtctttcccc tgcgtgaagc aacaggacag 38580
atttggttag gtgtggcatc gatgtcctaa tctcctatga gcacacaatg aatgaaggtg 38640
gggggctctg ttaactggag ggaatcaggg gctgccctgc aaagcatgtg caaagaaaat 38700
aaatgcaatt ggagtgttgt ctacacatcg tcctcagtgg gcacaaaaga ggcacagtgg 38760
gatggggctc tgacccagtt tccatttggc cagccgactg gaaacagcta ctcactgggc 38820
cactgggttc tttccaaaga acagtgaaga acagtggttt ggggtaggtg ggggcagggg 38880
ctggtggggc aagaatgtca gaagcaaatg caggcgtggc tggtccagta gttccagtac 38940
caaagaagcc gctatctgga agagtgggac aacccatcct aaacatggga agaagaaaca 39000
ggaaatttca aaagatacaa ctactaatta aatgaaagca ctccttaacc acccctttga 39060
taattagatc atcttctcct agaatgagaa ggaatattag tctgactttg ccctccatat 39120
ggagaaacat ggcaggcagg ctctctgtgc ctggagggtc tggccagact ttgtctggca 39180
tgggtatttt gactccagcc tattttttag ggatcctcct gcagctggtc ctcaagaggt 39240
ctgaactttg ccgtctcatt tctaaagcct ctttcagcag gtactggggt tcccaggtcc 39300
agggaagcct ggtcattgct agaacacatg gcaacatcct tcaggaaact cagctcagac 39360
tgtctggaaa gatgctggaa aggctgaatc catgcaagta ttatctaacc agccccaagt 39420
catgttttca cacttagatt tctacaggat attcataaat tctggaaaca aagatattgc 39480
cactttattt tatttttaca cattgagaag tttccttggc aacataacat gtatttgcct 39540
atgtttccaa ggtttatgga tgaatgtggg tggtcaatgg gattcattca ttttgccaag 39600
caaacgatat gtttgaagcc atattaagtg ccaggtacca tagaggatac agatgttcat 39660
aatgtaaact gccctctagc agcttacaga tactacctag gaataatgct tacactgcag 39720
taaacaacat aaggcagaat atatatatat gtctttgtac tcataacaaa atgtaaaagt 39780
caaagtcagg gctcttttaa ctttcttagt agcagaaacc caaattgaac ttaagcagaa 39840
ggggaattat ttatttaaaa cacaaagaaa ttatttattg aaagcaaaca ggaaattgat 39900
tattgcttct tacaactcat gagctaaaag acagagctgg gttcagatac agatatatcc 39960
agagttgtga tgctatcagg acgctgtctg gtaatgaaac caaccacagc acagagcctg 40020
gagtggaggg acagaccaac tctcttcaga tgccacatcc tcacccagca gacctcctcc 40080
tctccagcac ccattcatca aaccttcgag aagaccctgg ttgctactgc aaggctttca 40140
gcaccaaatg ggaaccaact cctcctcctt ggacatggaa tacttgaact ggccattctg 40200
ggacaggggc ctgcccatgt gaatggaggg aggaagaagt gaaatcctta aagggttgct 40260
gggtcagcat atcacaaatt tcccttgccg tgagccagat ctgatgggat ggtattagtc 40320
aataggtaga taataggggg aagagggggt gaagaatgag atggttctac aaaaagaaag 40380
gcagggtgcc agaaggtaga atttgggcaa tagtgagtca cagaattgat tgtgtcttgg 40440
agcccatgga agggagctga ggcacctacg gttggagggg gaggtgggga cccttgggca 40500
cagctaaaga gtctgctttt gggtaggatg tacagagcaa ttagaattat ttagcagtga 40560
cttaaagcca agagaacaaa tctggcttca gagtgttgac atggaagaaa ggaagaggca 40620
aatggaagag gctattccaa agggagaagg tctgagcttg gtggtgcctg ggaaggaagg 40680
acactgcagc caagctgagc ctgtgtccag ctgaacacgg acatttactt ctgcttctga 40740
ggggaaatat tgtcatgtct tatgggtgta cccagcaaaa gatgtttcca ctaaaagact 40800
atagagaatt gcttatttct aaggactgaa ttccgaatgt ttttggtcag gttctctctg 40860
aacagagaac cattgcccct gagcagaagc ggtcttcaca caactagcaa ccatgtagtg 40920
ttttctcatt caaatggcgt ttggtattca cctgcctgtc ctggaacaaa tgcaaagtca 40980
gggttgtttc tagctctccc ccaatattgg aaaaatgctg atgaactgag cctggttcca 41040
ttttacacct gacaaaagga actcagatga gagtgttggt aactgggttt aaggaggagt 41100
cagaggtgac tgctgaaatt tctgccagac tacaactaaa ttaaaaaagg aattcggttt 41160
aagaagccaa tcttcaacta atttgaacat gaggatgctc aacttagaag cctcccatgg 41220
ggccctggag cccagaaggg actgcatact ctttgctcct gcaggtaact cagggctttg 41280
ttctggtgtc tctgacaggc ttctaacctt ctgcaattct gttgccacaa tttctgtggc 41340
accaggagaa aattcatgca tctaggctag ggtggtgctc tcatgtgtct ccaggagagt 41400
gtggcctggg ttagcttaag actaggaatg tgctgacagc tgggaagaaa gtcaaaagaa 41460
ggcatggcat gtggttatgg ggccggaggg accgcttggg gggagaggtg gaagcgctga 41520
catgagcttg ctctgcatcg ctggttccca gaggtggcct gataggagag tgccagctgg 41580
tggtatgccg tgggctctgg ggaaggggct agaatgttgt tgcagcccag aggggctggg 41640
ctagtgagga gcaaaagaaa acataagctg gggggaaact gcctaataga ccaattagga 41700
gacagggttg tgccctaagg gatgggtggg agcagggggt gctagaagta gacagagagt 41760
aactctcagc tctgaacagc gtcccacata ggaggaagaa cactgatgtg aggccaagtg 41820
gcttggaagg gcgttgacac cccattccct acaacaaagg gtttggcaaa ctcatctcat 41880
ttgctacttg tcctataggt aaggatggac accaaaccca aagagacttt tgggatgtgg 41940
ataaaaattg aaaactttgc ctctcattaa tcccttggag aatatagcat ctccttcaaa 42000
ctggactgct ctccttgatc ccttgtcttt acctgaaaat atctttcaag gcctagctca 42060
tgctatcttg gccataggaa ctttccttat cacctccatc aatgctgttt gtccctccac 42120
tagaatcttc tgttttggta ctcctcttac tcagcctcaa gttaaattta tgtgtactgg 42180
ttttaacccc agtacccagt aaaggttctg aatacacgtg atgaaataag tctctcctat 42240
cccatggcac ctagtatagc atttagttgc tatactaatt attataatta gcatttatta 42300
cgggcttact atgtgcaaag tgccattatt ccatttatta ttcacaaaaa tatttagtct 42360
ctactattct ctaatttatt agataaccta atataaatct tttttgtttt gattgttgct 42420
agctgattga aggaaataga attgtggtgt ggtagtaggg gatgttgagt gagtcttcct 42480
cattcttaat atttccttcc actaggataa cgcccctggg ctctcttcat caggggagga 42540
ggagtgactt catctgatag attcggaagg gaaaatgtta cccagtcgct tctcagtcct 42600
ctttctcttg gagcgagccc atctctggag cacatacact ctcccctgct cctgtaggtc 42660
tcgagttctc aggggaaggg tttgccctgt aagagagctt gtccttctcc agtgaggcct 42720
gtcactggga agataattct gtacagtgct gggattcaaa tttagaaagc ccacttgccc 42780
cataattaag ccacattcac cagctttaac aatgacagag gtgatattga gttctccagt 42840
gatattgagt tctccatctg ccttatgctt ttctgcttat ttccccattg gttcagaatt 42900
ctggtgggaa aaggggtgct gtttgtggga tgccttccca ccctcatgtg gccctccata 42960
agttcttcat ccctcattgc attcaataac ttgggtgtgg tgtgggtgga gtgcatgtgc 43020
catatgaccc tctcccttga gtctttgaaa cctatttctt actttatgac tttggacttc 43080
cttttctttg ggagtataaa agtggatacc accattccac cccttacccg tcatcaggag 43140
aagttagttg ggaagcaaag gcggagtgac gtggagggaa gagtctaaaa acagctctac 43200
acttagcttt gtccttgcat tgatgacaag cgatgttgga tcctgaaagg tggggatggg 43260
aggtaggaag acccaggaag ttgctgtgaa ggctaaatcc taaagacagt cactaaaagt 43320
ttccagaagg ggcatctatc actccacagg caagcaagat gagaccatgt tgaaaaggtc 43380
ttaaagaagc cagggaagag gtgaaacatc tctctgtgtg ctgaggacca taccaggtcc 43440
ttcattatca tattctacac attgaaaatg aaggtaagag agcaagcaac ttgccctagg 43500
ctacccaggg aatagggagg aaagtctgga tttgaaccta ctgctgcctg actccgaagc 43560
cctgttcttt ctctcaccct ggaggatgga tgagggtggg atggggcagt taaaagttga 43620
ggggtatctc taggagaaag atgagacaca tgaccattgg gtctaaggag ccagagagag 43680
gccattgtgt ctgagcctgg acagccaagc ttcctagaga cagaggatgg gatgagatga 43740
cttctggctg actctgcctc cttgagctct ttaggatccc ctgcagaatc tcccaaaatg 43800
atgctcattg gaaacagaga gagcacattc aagtaagtat ttgtgccaca ctatgattgt 43860
tccaatgacg tcaagtctgg gatggcaaca gcagcggttc catttctttt cttcaggacc 43920
tggattcttg ctccaaggtc ttccacctcc ctcctcattt tcttccactc ccactgcagg 43980
ctccttcctt ggaggagctg gggcagggag taggggtgga ggttgtgtgt gcacttgtgc 44040
acatgcatgc ctgtctctta tgtgttgctg agtcaggaat gggcaggaag gagaggcttg 44100
gacagcaagg cagccctggg caatctggtg atgaacttga aacgggagag ggtctattgt 44160
gcatttgcac tgactctgtg caggaagggt gggggcaggc caaggaggac tggcttggct 44220
gagacatgag atgtctcagg ggagggtttg gctgaggcag tggaagaatg cttgtcggga 44280
accggcctgc ctggaattgt aacctcccct gctgtctctg caccacactc agagtacagc 44340
tgtatgcctc ttagctggta gattcctttt ctagctgggg acaccgtgga cagggacagt 44400
ggggaagagc attggactca gagacaactt gacatcaagt cctgcttgga atcctatttg 44460
ggtttgtaat tcgttgaagg cagacacaga cataaactaa tccttagttt tcccatccct 44520
tcaataagga gtacaacacc tatcacacaa ggctacaaga ataaaagaga gaacttgtac 44580
aaaggcaggg cctccacttg gcacatctta gatcctagac aaatgctgaa caaggcagca 44640
tggtgtgatg gtgaagggtt acagccagac tgactgactg gtcctgtctt cgtttgaagt 44700
tttgatattt tgttcctcgt gggttttttg catttttact atttatttat ttatttattt 44760
atttatttat tgagagacag agttttactc ttgtttccca ggctggagtg caatggcgtg 44820
atctcggctc actgcaacct ccgcctccca ggttcaagcc attctcctgc ctcagcctcc 44880
tgagtagctg ggattacagg catgtgccac cacatccggc taattttgta tttttagtag 44940
agatggggtt tctccatgtt ggtcagcctg ttctcaaact cccgacctca gatgatccac 45000
ctgcctcagc ctcccaaagt gctgggatta caggtgtgag ccaccacacc cggccaattt 45060
tttttttttt aaaatatggc attaaaatgg tatttatctt gactactgag tttttggtta 45120
accccttaca ttttgtgccc aagacatctc actcatgtta tcctaggccc agcatggctg 45180
gccttgtctc ttaaattcaa atttttaaat ttttcattcc tcaggcttct cacttgtaaa 45240
atagaaataa taatagcatc tcccccacag gcctgtgctg agagtgaaat gtgttactac 45300
acgtgcctca ccttcatttt caacaggacc tattgccagt aagtgctcgt taatgttagc 45360
cattattctt ggcattgctg ttgttattag tgtcagccat cattctctca gccaagagat 45420
ccttccagaa gagaagttct ccatggaggg ggatgggaga tgagctgaac cctggaaaca 45480
gaaatggatc agatcaggga gcctcagtgc cctgaagcca gggcaggggt gcatggggct 45540
tctgcaaaac ccagggccaa gcatgcaggc aagaggcagc cttgccaagc ccttgcagaa 45600
aatgcttgca gtgcaactcc tctctggaga cgccacaagt tgccccgaca gcttttcctt 45660
ttggggcttg tttaacattt caaacaaaaa taaaataaat aactgcagtg tttatggaaa 45720
cctaagacag aaatgaagac gacttagaag aaagttaagt ggaagtgggc caggaggggg 45780
tttagaagat gcccctttcc ttggtgttag cagttttgtg cttcagtttg tcagctcttc 45840
ctactgctct cccctagcaa ctcctctgcc agtgtgcaca aatgcatgtg tgcacacatg 45900
tgcatgtgaa tgcatgtaca cacacatgac acacacacac tcatcccaac gagaggcaca 45960
catttcagac accatctcac acacacacat ttctctcttt ctggaaatgt gtccacccac 46020
tttctccttt atcttcttca ctgtgttttt ttgttttttt ttttttttct ttttagacaa 46080
agaatctaat taactcattc tggccagatg gtgtacatta ctttaactcc ttcactcctg 46140
tgaaaatttt tggcctcaac cttcactctg aatagaccaa gccaaactcg ttttatgtgg 46200
ataagccatt tccaagtcaa agttccgtgg caggaagtgg gagagtgggc agagggagca 46260
ggtccttaca agcaaagact tgtataatgc tttgcctaga tttgcttatc agtatgttaa 46320
atatatgtgg actattttat tcttccacct tttattttgg tatcttcttt gtctatccag 46380
tctcactttg ccagactcca ttatgcaaga gaggctttgc cagaagcaag gatgctgtag 46440
aggaaagtaa tgaaaatgtg aggatttctc agaaggccac atacaatctc taggtctttc 46500
cagtacacac agcttcaaaa gccaggtgct gtgttcccca agcaggtcag ggcatttcca 46560
ggagccctgg attccagaag ctcaggacac ctcagtggta aagagaccct aatgccggtg 46620
acagcacaga ccctggaaac cctagattgc ctccgtgtgt tcctcttggc ctcagcaggg 46680
ctggtttccc cctcctgtag gagcagagga ggctctcctc tcttgagccc agggcctagc 46740
atagtgacca taaggaagca tagaagatcc agctgcagat ttggaaaaca gagccctcat 46800
ctctggaaga gccaaaactg atcctcaaca tgtgccatgc acatcagata tcaaacgctt 46860
cattcatttt gccttcgctg ggtaaccagt gaccttgaga agtcacctct cttgagtctc 46920
aatttcttca agttgggaac attacatgac aggacaggac tgtgaggatt aaatgtaaac 46980
aacatttttt ttttttctat agaacatact gtggggccag caccatgcaa ggtgctttta 47040
tctacaattt atttctttcc cttcccatgc cttctgcctc tttgaataac tgctgcaatg 47100
gctgtagaga gataaatgca gtagaccaag acttttagtg atttttaaac aatgttctag 47160
ggcaaataca tgggtatgtt tacatactcc acaaagtgaa aaaattatgc tagtcagtgt 47220
gcaaagtgtg tttttccaga cctgcaaaaa ctgagatcaa cttccatatt tccaacttcc 47280
atattccctt catcccttaa gctaccaggc agaggatggg agataaaatt tggccataaa 47340
cttgtcatgg gtccatcttg gtcctaatta gaattatcta cttcctaatc cattaactgc 47400
atggatagat agtctgaggg cctcaagggc aagagatgac ttctacccct ccacccatcc 47460
agccctgacc cacccttctc atatacattg gagaaagctc tgctctgtgt aaaacacatc 47520
aagtgcagga catggttctt ttcttcaact atctacagaa atgaatagcg gccctagaga 47580
aatgcaaaag atgcctgcaa tccaaggcca aattggagaa catttcaagg agaactgggc 47640
ctttattgta gagtttggga aatgagtaac atgtagatct gtgaatagat atgtctgagg 47700
aagcaccagg cagcggaaat agctggttgc aggagcagtt tgtcctgccc acctgaatct 47760
tcaggttcct tcagctaagc cttaggagag gaggctggag agctgctttg ctggatcatc 47820
tcctttggcc cccctcagac tagaactgca cctcctctct acctagctct gtgctccaca 47880
ggctgcctct gggctgcact gatgggctcc cttgactgct ggctcctgtt cagggttgga 47940
ggaggaggat gaagtcatgg aatagtgtcc ccatgctggg ctgcaggtac agttgctgct 48000
tctctactga agacccctga cagcaaccct gtcttacagc cagggtgttt gtagttgctc 48060
cctcctccct gtccctttag agtggtgatg gcactatatg ttagatatgg tcagagcagg 48120
agacatcatt ttcccttaat tctattctgc cttgtaaccc ctttcttaga ctctctgctg 48180
agtctctgct tatgtgttgg gattgcattg atgcagatgc tttagggcca cgttgtggag 48240
gatacaagat gatgagacag gaggcagcgt atggtgaatc acttctcaca gctcctaact 48300
aagttctggg cacatgaatg ggtactcagc acatacctac tgaccaagcc tatggagagc 48360
tgaaaactca taggctgact ttgaagcgag gcctttgaaa ccatcgtccc aggggaaata 48420
atctaggtca aagagacggc tgtggcaagg gtgcgagctg gcaagcatga gggctgacaa 48480
agcaggcagc actcctcctg agcagatgac cagccccgca gtgctggatg ggtacgacta 48540
ttccaaaccc tggtgtaatt ctgtcctcta acgtggctgg tttgactcag cactgctggg 48600
gagccacaga gccttcttct ttagcattta tgagctcatt ataagcatcc aagaaaacat 48660
caacaaaggg tgctaagtcc ctctagaact gccttttaaa tttttctttt gtaaaaagaa 48720
tgatgcttta agtaaaacca caacttacag aattcagaca aaaccaggca gcccccaatg 48780
ttgttatccc agctcctctt ggaataaatt tgggaatgaa caaaaagtca cagaagagaa 48840
aactccagcc cacacccaca ccttttctga catagccgcc tgtgcaggtt tttgggacca 48900
ggtctgccat ctgtattccc aggctgggct ggagcacctg aggctactat ggttacagaa 48960
aggaacctgg catccgaagg tataggctca aatcccagct ctcatgattg ctagctttga 49020
ggtttcaggt tcatttctta agtgctctga gctttggtgc cctcctcttc aaaatgggaa 49080
tgaggagcat gtctagctcc ctgttttgtt gcagtgaata gctacatgaa gaacagctaa 49140
accagaacag aaagaaggca aatggaagct acagaaacca aggatttcct tgttgaatcg 49200
aatcttcctt caatcttcct tcaccacact agtggatctc cctgtgggag ggatgttgag 49260
agtgctccgt gttttttttg tttttttttt tttttttttt gtgatggagt ctcactctgt 49320
cacccagact ggaatgcagt ggtgcgatct cggctcactg caacctctgc ctcccaggtt 49380
caagtgattc tcctgcctca gcttcccaag tagccaggac tacaggcata tgccatcaca 49440
cccagctaat ttttgtattt ttagtagaga cggggtttca ccatgttggc caggatggtc 49500
tcgatttctt gaccttgtga tctgcgcacc tctgcctccc aaagtgctgg gattacaggt 49560
gttagccacc acaccagcct tctctgtgtg tttttaatca atagcaatat gtaccatatt 49620
tagtagggac tataaagaaa ttgtgctaga aacacctggt tattttacag aactttgcca 49680
gtgagtacaa aaatatgcgt agcccacaac ctctctcccc tagaaaatac ctcctgtggg 49740
tagaatgaaa tgggtaggtg ttcttaccat tcattagcat ttcaacctgg ctatcttctt 49800
cctagaattc cactactccc aattgcccat gtgtttccaa taaaaccaat tcaattgtgt 49860
accaacttgg tgacaaaacc tttatgtagt tcttctatca ttttgtgggg ttttcaaaga 49920
gggttgctct ttgatatggt ttgatgctgt gtccccaccc aaatctcatc tctaattgta 49980
atctccatgt gtcaggggag gggcctggta ggaggtgatt gaatcatggg ggggggactg 50040
ttcttgtgat agtgagtgag tactcacgag atctggttgt ttgaaagtct gtggcacttc 50100
cccctttgct ctgtctccct ctttctctcc tgccaccatg taagacgtgc cttgcttccc 50160
cttcaccttc tgccatgatt ataagtttcc tgaggcctcc ccagccatgc agaacagtgt 50220
caattaaacc ccttccttat acattaccca gtctcagcta gttctttata gcagtgtgaa 50280
aacagactaa cacactctta aaagtaaatg ttattaccca ccttttacag attaagaaac 50340
ttaatattac atcaaggaat tagtttatag cactggatga tctggcctca aatctccagt 50400
gtgatcagta tcaagctttt ctcactgtat caacagagtt ttcctaacaa atcataagac 50460
acaagtagtt tctccaactt aatctattat acccataatt cacttgcctc cagggaaaaa 50520
aattagatga aacagactgt agtggctttg tgtaaaacag cagctccatt cctttagccc 50580
tattctaaaa caatagacca tgtgctgata gctagctaac ctccattcag tgcttcacta 50640
tgtgtcaggc atttgttcca aacacatttt acatggatta tcccatttaa tctttacact 50700
aaagtataat actcttatta ccccatttta aagaagagaa aactgaggca cagtgagatt 50760
aaggaattca tccagtttct gctgcaagta gggtggctag cattgtaatc tgggcatttg 50820
ccatgaagct gtgcccttaa ccactccact atgtgctata aggtggagct gacttcatgg 50880
gggctaattc aaccagggga gtgtgctcat attaacagat ctgtgaactc cctggtttgt 50940
ttgtgagaca attatctatt tgcttacctg aatcacagca ataatagtta tacctcccac 51000
ttactgcatg cctacttggt agcatgtacc tggacagaag gttttcattt ttatgacaaa 51060
cctgtaaaaa atggcttctt agcctggttt ttcagatgag gagtttgatt ctccatccaa 51120
agtcatatga taaagaagtg gtgaaacagg aattccaacc caagtttgtt ttgttttgtt 51180
tctgaaatcc atagactgga gtagaatctc aaattatatg acatttgtct atgcttattt 51240
tttagtttcc aaggtgatgg attatttaaa aaccaaacga ttttgaatgt aaaacaagct 51300
taattcaatt tacttataaa caatgagcac tgactcttgt atacatttaa gttatgagac 51360
actccaatat taattcgacc cacacttttc tttctataat ctattgctcc caaatattct 51420
atactatctg catgtctgcc ttagatacat aaggatccag ccctttccca tgtgtctctc 51480
aggatggcac ctttgctctg ggccggatgc catggggttc tcagtgatgc gcactgaata 51540
atgcaaatat gaggacataa tcacagaagg aagcccttga aattctaaag ataaggccca 51600
cagaccaggg tactttgaat aagtcagtca tccttttcca aggttatact ttttccccct 51660
aaaataataa ctgcagacac agttctcaaa gcaaacaggt ctggtatagt agaggcattt 51720
ttagacaatt tttttctatc tacttgttaa gcacatttta aaatactgat tgccaataaa 51780
gggctttcca tagaactcaa aattccaagt ctctgtccca agcttctggg agcattcctc 51840
catttttctg tttttatttt ttgagatgga gcctcgctct tgctcaggct ggactgcagt 51900
ggagcgatct cggctcactg caacctctgc ctcctaggtt caagagattc tcccacctca 51960
gcctcctgag tagctgggat tacaggtgca tgccaccatg ctcggctaat ttttgtattt 52020
ttagtagaga tggggtttca ctacgtaggt caggctggtc tagaactcct gacctcaagt 52080
gatccactca ccttggcctc ccaaagtgct gggattacag gcgtgagcca ccccggctgg 52140
tcgcattcct ctatttagtg ttaataccct aagactcccc agctgaccac caaatgtagg 52200
caggtggagg gactgacctc cagggggcac atgtctcagg ttgacaaaca cattttctct 52260
tgatcctttt tttcagtatg atgaagtatt ctacaagact ctcattgaac cttctgatat 52320
cacattctaa ccatttatat aaaagtcaaa agctccttgt cttcaggatt ccaaagttct 52380
tagcacaaag gtccaggaag tgtctgaatt ctttggtgtc tggttcagta tggatgttcg 52440
ggtccctctt agacttgaga tagaacagga aagagatgaa tagacaatga cagaggtaga 52500
gaaagtacca acccttccca ggctgtcggc ttatttgact gtgggaatca ataaaaagta 52560
tttagtgact aaaatagaat ttgaacccag ttcagatctg taagctaaca ttttttaggc 52620
aacaccatac agcctcttca tcattccctg gcctctttca tcctatccct ttttctcccc 52680
cttcctcttt ctctccttta tttctcctta atcatcttgc ttctctttct tatatcttct 52740
cagtaagtaa ataatccaca acctcacagg taaattaaag ttgccattcg cacatctgtt 52800
ggctcccagg tatggttcca ggatactggg aatgttaggt agtgagaaag attcagatga 52860
tattaatttc ctgcaaatgg aatattcatg gcaggcacag tctggccaat tgctcatggc 52920
ctggcgagta cgactagcct cgattgtacc tggtctttgc gaatgtggtg gcatgttcac 52980
tggcatcaca tactccctct catctcctga atggctgacc agtgcttgct tcaagttaga 53040
ttagagtttg agctttgtaa cataagtccc cttctgtctg atcaatgaaa tgagggatag 53100
gtacttgccc gagagttatg ggacctggca tttaacgtga gaacatgcat cttcagaagc 53160
actggtgaga cttcagaatt cctgaaagca ctattcttgc aaggcttgaa tgtaccttct 53220
ccactccacc atgtcctctc ccaaccctac tagcatgata tcaagcttgg gtggagagct 53280
cgcttgcaac tttgtcagat acccatgagc cactctttga atttctgaca atgaacaagt 53340
atgtgggagg ccaaccccat ccaacctgac ccatctgaac ccaatcacat gttttctatt 53400
ttgaaataaa caggcagggt ctcaggaatt ttaagtgagt cctctatatc tttctctatc 53460
ttccttttct tccactaatt attacagaat tgatctgcca gtaattacta ctaaattgaa 53520
tttcaggggc agtgctgtat ctggccccaa taccctaagt ccagtaatag cctggaatgt 53580
tgctgagttg ttaccgtcct taaagggtga agccacaatg atactttcta taacttctat 53640
ttggtctttt taagcccagc acttagaagg attcacttgt ggagaccttt tcatttcttt 53700
caactctaca gcttagtgcc tgaaaggcac atattggtct ctgtgaatct ctacgttaag 53760
aatctgattt gcagcactgg aaaccttgct agtcttagct ctgggctgaa tcccatgaag 53820
ccacgccatg cctagggctt tcatgctgta gtccatacct ctgaagaaaa cggagagaaa 53880
catcttcctc ccttcttccc cccaagtgtg tgtctgttct cgtcagattc ttggcagggt 53940
taccaactct cttctaagca acttggattc acaacagaat gattcctttt caatgccaat 54000
ctaaacaaat gccatcaact cttatcccag ggagtatgaa aaacagaaga gtcctttgtg 54060
actctgattg gctttgtgac ttccttgggg ctggtgttgg tctcaggctt gtgtctcgca 54120
gtcatccaaa atgtgggtgg gccatgtccc accttaactg tggttgtgaa cgcagaggat 54180
tcactcaact ttcagcatgc aacaataatc aaatgcagtt ttatggttca cagagggctc 54240
caccttcatg atttcatttg atcctcctaa caaccctggg agctcagaga gactaaggaa 54300
cttgtctcat atcacatacc caggagttga ctgcacggca tctgatgcca gcttctgtac 54360
cacgtgtcct cctggtgata ctagagtaaa taaaacataa ctagacaagt aaatattttg 54420
tacaaagtaa tctgctaaaa atgtggatgg cattttaggt tatttgttgg tttgggttat 54480
gcctcttctt attttgtaga taactgaaag ctaagagcat tgtcttattt atttatttat 54540
ttatttaggc agagtctcac tctctcaccc aggctggagc gcagtggtgc gatctcagct 54600
cactgcaacc tccacctccc aggttcaagg attctcctgt ctcagcctcc caggtagctg 54660
ggattacagg cccctgccac cacacctggc taatttttct atttttagta gagacagggt 54720
ttcaccatgt tggccaggct ggtctcgaac tcccgacctc aggtgatcca cctgcttcgg 54780
cctcccaaag tgctgggatt acagcacttt gcaatcccat gcgtgagcca ccgcacccgg 54840
cccattgtct gtcttcataa gcagaaggct gtggcacagg gtaggagaag aacatgaaga 54900
caaagttgag gggagttgct tatctcatgc ttcttgctgc tctgcctgaa gcaaaaatgc 54960
tttatggata cttcacttat gatttaaaat aatagctcac attgtgtact tactgtgtgc 55020
caggaactgt gctaattctt tatattatgc ccataaaacc tgcttctgaa gcattggggg 55080
gtttgcactt gccgttccct ctgtctggaa tgcctcccta tgcctacctt catgaacctc 55140
ttccctttac tttccccatc tctgttcagg tgtcacattt ttagttattc tttcctgacc 55200
gctcagtata aagtagctca cacctctacg ttatcacact ccctcttacc tgctctattt 55260
gtctttatag ccctgctcac aattatagtg tacatggatt tcttaatgtg tgctttatct 55320
tccccctccc atcggaatat aaactccttg agagcaagga tgatattttc ccctgctgtt 55380
ttctcagtac caagaagagt gcctggcacg tagtagctgt tcaacaaata tttgctgtgt 55440
aaattatctc attttataga taaggaatct gaggttctaa gggagtaaat cattgacttc 55500
aggggacaca acaggcaaga ggtggaacac agtcatgagc taaggcagtc ccagatcctg 55560
cctgaccctt cactctcttc ctcattcagt gaatcgtaag gcacttgggc tgtttgagca 55620
gtgcccttat ccataccctg cccagtcagg gcctcccaga accaggtaaa aggatctggc 55680
cccctctgcc atcctcccac tggtgccctt cccctcccac ccaccgcaac ccccatctag 55740
ggagaggaaa ctctttttcc acctaaattc cccctctgtc tagttcatcc aagtcatctc 55800
ccttcccacc acactgttta cacttgtggg tctgtgttga tgcatatcac agccccctta 55860
gtcattgttt agccattata ctttgcaggg gtaattttcc atccctctgt ttatattttt 55920
gcttctcctt catgtgctcc ccctcccact tcttaagggc aaaggaagac atgttcagtc 55980
atacaagcaa taatagagtt ataattaaga tgggaacatt ttgccaaaag gaggatttag 56040
ttgtgatttg ttgaatgcca tcctgagtgc attatttaag agcaaattca agctctttca 56100
tgagacttcc tgaacagtgc agtcctctga gcctgctgtc tctatagtct ttgtgtcagc 56160
tttgtggggt caggattgcg cgtgaaggat acatgtttag caaggcctgg ttgctgaaaa 56220
agcttaaaag gaaacttcag ggactatcta ggaagatctt ctgtgatctg ttctctgatt 56280
ttgtgtgctc ttttgtggtt agccattgct cttggtaccg tgtgggactt agcaccctgt 56340
gcctcaaggt aagaacacac ttccagccca gcttcagttt aatgttcact atgagagtct 56400
ccagtaacaa cccacactct gcgtgggatt cactgccttt cccatgtcct ggtgttggac 56460
atacatactg gacagagtta ctgccttttc ccctagtaat taggggaaaa ggaccacatt 56520
ttcccctagt aataggggaa aaggtgtcca gtatcagagc taggtagagc tgaatttgga 56580
tatgaacttg agctgtaccc catggtgtct tttcttgcag tcctagcctc cagcgccttt 56640
agaatttgca ttctgtttgg tgggatgagg acggtggcag tggagacagg gtgagaggag 56700
catggatggg tcctaagcct tcctgtcttc agcagcatct cgtgctctgc ggctctgctg 56760
tgtgcctcag gggctgccca ttttcaggtt gcatttatta gcttcctgga tgctctggct 56820
tccagtaggg tttagcctgt gggaggcact ggatggagat gggagggagg gagagaggac 56880
aagagaagtc atgttatttc tcctttgcct tcccagcctg ggaggtttct ccagtagcag 56940
ctgcctctct tcttggattc cagaccccac tagacaggtg tgctgtggct ccagcttctg 57000
tctggtgttg ctggcccctg gttcacctga ctccagctcc tcctcctcca tgcagctggg 57060
tcctgctgct gcctccctct gctctgcctt gctgtcccct gtcaggcctc tcagctcctc 57120
catcccctgg gttaccaact cgctatactg aaatccttct gttttagaaa ctcatatgtg 57180
attttcattc ttcttggttg gacactgact gatattgagg gatttgtctt agaagtaaag 57240
ctgtgtgagc attttctctt ggtaagttct cattttccct taatcattag aagacacggc 57300
acagtaaacg cgagctcatg agcagaaggc tacatagttg tatacatgtg tgtgcttttt 57360
ttcacaccag agtttgatga agcaaaatac ccaaaggtct tttaaaagta aagaggtttt 57420
aagagtaaag aaatttaaga aaaaaaacaa aaagaagtaa agatggttag gtctcctgtt 57480
tgctctcctt ttgcaatcag tctgtctcgc tctgtgagct gactatgctg cagacttttc 57540
ttttacctcc agcctttcgc ttgtagggtt tgaggctagg ggcggggaga gagagttcag 57600
cccagcaggc agcaaaccct atgtgcaaac acgatgtgtg aacattgtgt gcttggggga 57660
actgggatta tttagctgag aagacacgaa atctcctccc cttatttggg ctttgggatc 57720
tgagttcatt ggaagctgaa atgtaagaga aagaagaaag ggggaaggag tgggacaaag 57780
gagaggggag tgggagatca gactgggcac attctccctc acagagggaa gcgatttctt 57840
tgttaggaaa gcagttctgt tttgagaccc ggatgccttg tttatgctca ggtgtgaagc 57900
tggcttagga attgagttta gcttgcctct gtgcttttat gaatgtgttg gctgctcagc 57960
aaatttagta cagaaacatt ttatgtaagc agaagagaaa attatatttt aaaagttgtt 58020
ttaacagaag gtcagagtat gggattgaga attaaaaaaa aaaaaaaagg aaattctgtg 58080
ttctaggctt taagacagag agtcacacac actaatttag accagctggg gtgatctcac 58140
agggactcca tgggccagag ctgccgttcc tccatggaga gcacatttcc cctagaaatg 58200
tgtactcagg tgcagctgaa gggtctgagg tcatggctgc atccctggcc agggtcctcc 58260
caggctgcag cctctgcttc ctctgttgtc cattggtcta gagccatcct tcgagaccag 58320
agccagacca tgagcgagcc aaatgtgcat gaggacagca tgaattatcc ttggagacca 58380
gggggccctg ttcatccaga cattgtcttt ctttttaaag aagctaaatg cctctttttc 58440
cctctttctt cttgcatgac ctctgggagc ttgggcagta aatttctctg ggacaggttg 58500
tgaggaacct cttcaaagaa gcagagatga gacaaactgt ttatcagttc actctctacc 58560
cctgctgccc tcccaatgct caggtgggcc ctagattcat ccagaagcca gggtgttgtg 58620
cttcatgaaa gggccaatac ccctaatgtg ggacctatac aataaaaggc aagggcagaa 58680
agagagaaga aataaaagga aaaggggtgt cttgagggga gtacatgata gactcctgtg 58740
cctggaaggg actaggaaac ttatactgac tggttcactg catttgctca aagagtattc 58800
atcttcttga gtttgtcagg tgactgtaag agctgggttc aagttctttg gttcactatt 58860
atatgcctag ctgagcacaa tgcctgggac ttagagggaa ggtctgggac ttcaccagga 58920
ttcccaaaat agaacaaagc atttgttatt tgcaaaaggt tcacaaagcc tgaaaaaata 58980
tgtgttgtct ctggtggaaa agtaagggaa tatagcttaa gtacctacta cgctctgact 59040
ctttggattt cacctgcagg gcttttagag gtggataatc agggccatct ttttcggggg 59100
tggggggcga aaacaaccac tgaagaggtg aagaatcttg tagttctaaa aggatcagag 59160
agaggcttaa aacaactttt gcaaactgaa atatgccagc cagcttaaat tagcaaagct 59220
ggaactgtgg cagaatgaat agcccgtgtc tgagtgagag ggaaggaaag ggtctactgt 59280
gtgataggca atggttccaa agtaggagta ggggcctagt gtggtcatgc cttctgatat 59340
gtcaagaaaa ggcaaaaagt tgatatttat ttgaaatatt ctgattttat aggttggtga 59400
tcaattaaaa aactaacaaa tacagttaac aaacatgttt taatgcttgc agacaggatc 59460
cttcctgccg atgtttggcc tttgtcttta atggaatttg ggctgcccca taacagccca 59520
ccctaagcaa aacttctttt ctgcctttct tttatattgt tttttatgga atgtagaggg 59580
atttttctgg aatttttgga acggggaaat tagtgacaat ggtggtgctg agattcctgt 59640
ttatttcttg gcttttcccc aattccctga gggaactcat ttcttttgga tcttccataa 59700
catcggtcac atagttgggc acagagaggg cccacacttg gtacatgttg atgaaataaa 59760
tgtgtcttcc tctaagtcta gctgaatgga gaactgaaat attagggtgg gtgaaagtta 59820
cctaaattgt ttgctgccaa attttgctgt gttctttgtc tccagttctg tgaggtgtgt 59880
gttagatacc tattgctgta taacaaatca cccccaaaac atatctgttt aaagtaacaa 59940
acatttatta tagcacacat ctgtaggtca ggaattcaag tgcctcttag ctggtactct 60000
catggggctg taaaggaaat atcagttggt gctgcagtct catctgaagg atccactcca 60060
aattcattca tgtggttatt ggcaggattc ggttcctcac cctatattgg actgagggcc 60120
tcagttcttc actgattgtt tgaccggagc tctccttcca ttctttgcca tagggcctct 60180
ccatagggca gccccgaaca tgggatctgg tttccattag agcaaacaag caaaggaaag 60240
cagtgcaaga cagaagctgc aatgttttgg taacctaatc tcaggagtga ccctcctgtc 60300
actgcttcta tgctgtattc tagtcattaa aggagaccat ctcacactca aggggagaga 60360
ctacacaagc catagtgctg ccatggcaac acaaccatta ggatgatgcc ttgagccttc 60420
cttcttcata tttcttagac ttcctttctg acctagagga gccagaagga cttgggactt 60480
gtcataccgt ccaatcccaa gaaatgacag gaatgaagga atttttaaaa attcaactca 60540
tttcaacaca cacacaaaaa atgagagaag tgagtcaatt tgagaactga aattctggta 60600
gacttttggg gagacactag aagggccatg ttcatgagta ggaaccatag attctgagtc 60660
aattgggcat gaaagttttt ctcctggtgt cccgatcttg gtcgtatagt gaccaagcat 60720
ccaagaaggg gataacacaa tgttcttaca gtgttttctc tgttgtatta ataactcagg 60780
catcagccag tggaatgggc aaagctaagt gaaggtttga atgccagaca gattctccat 60840
tggctaaacc caatagacat gaataaggaa taaggccagg aatcagcatc cagatatatt 60900
aatttatgaa tctgaggtta ttccaaaaag caagagaaca ggagcaccat tggctgagac 60960
ggacaccaat accaagctct agagagtaat ttcaggcaga aaggaaacct taattaccag 61020
aggttcaagg gataggcaca cagtaagtcc aaataggcag aaagaaggca tcagggataa 61080
tctggcagag actgcattca aggtcaaggg cagggcatcc cagctgctgt tgagactggg 61140
ctccaaggaa gtctccctgg agagactgaa aaacaatcct gggccttaat cactgaggac 61200
tgaaacacaa cataggagaa aactagggct taagagaggc ttggtcaaga aataggcaag 61260
aacctgatta ttggggaaca agagatccac agtcaggctg gaccagtagc aagacagcaa 61320
gagtagacaa aaagttgacc actgccagaa accaagattg gtctctgagt ctggcatggg 61380
gctgaaacta cttgttgaga tcaggctgtc tcacttgcca ggggtagagt catgctggaa 61440
gtggagccag gacagacatt gaaccctggc taccctgtga tcaattgcac tccataccct 61500
ttgatacctc atgggaaaat cagacaagtg ctgttctgaa aggcaattag gtttcatgat 61560
ttcctccccc atccggacat cagcatgaaa ttgggggctt ggcttccaag cccatgttct 61620
tcctttttgt gaagggcagg gtgagacaaa ggacaccaca ggccagagca accctctgct 61680
tccatacagg ccctagaaga gaagtgagga cgcgggtgac ccacacggcc ttctgtgcct 61740
cttcaacagc tactctccca gcctcccatt tctgccaagc cacattctcc acaggactca 61800
aacatttagc tttactttag acttttccag gaatcttccc aaatctcctt tcctcatccc 61860
ccctcacctc ttcctcacca cccacagccc cctcctccac ccccatgtac aacatccggc 61920
ttttactcat gcttgtttct aattatgcat actaatttat tttctttcct tttttcctga 61980
cctgcctata ttttcctact cattctttgg cctccactac cgaaaaatgg aatactcctc 62040
ctgtacaggg tcagggtttt tccttcccca gtgcctaaag ctggattcag tccacagtga 62100
cttctctaat aacagagtgt aagggactcc ttggttgaaa agaaggaaaa accccaactt 62160
gcctttcagg gtctcttcaa tgagcttgat ttgtgttaaa tttaggggct caggaatttc 62220
tgccgatttg cagcacttac tactcctacc cttcccaaca tttgtgcttt atcgaaacaa 62280
ctaaattagg agcagcttga gggtaggggt cagagcacag acattttctg tattgcctgt 62340
agaaactagc acagtacagg caccccctaa gtgcaaaaga agtccttgct gacccagatg 62400
gaattttcct gaagtgagtg ctttgtgtct atctttagaa ctagactttc ctgataaaat 62460
agtcaggaga tttggctgaa ttttccagta ttcaactggc tatgttgggg tcatgtagat 62520
acaaccttta agaacataat gacctttaaa atatctattc ctgaagtcag gtttggtccc 62580
tagtctgtgg gcagatgact gttttcatgg tatgctttgt tcgtgtcctt cctgggtggg 62640
ggaggatttg gggggacagt ttgactctag ttatctacaa agttgagtta tgagaccagc 62700
ccttttcaac tttacctctt gcaaattgat cctgtaataa attgacatga cgaaaacacc 62760
aaagcaacca gagaaatctc acaaaggcaa gaacaccatc acacaagtcc tcaaaatctt 62820
tcccaagatc cactaggggt taatgccact gatctgatac tggggcacag cctaggaggt 62880
tttgctgtct ctgaacgcac atgtctccag cttacagctc acaggccagc tttgtttttg 62940
aacagattgt gttgggggaa gggaggcttc tgagacagag ctgagagtcc ccagcaatgc 63000
catccctggc ttctggccca tctgaatgcc ttactctttc atgtaagcaa gacatgaggt 63060
cctgctgttt gagttggctt tgccctgctc cgtgatttca gttccttgtc tctccagcgt 63120
gtgggctcat ttccgtcctc tgagcactat tgtttttctg acttgaacag tcatccagaa 63180
aacctcagta ataaggcttt tgtatcatta tttactttgc taattatata tgtctttccc 63240
atccccagtg cttgaagaca tcaaattgca gttgaagtaa cggcagaggg aaaagcaagg 63300
gcaacaacaa caaaccactt cactcctctg ggtggaaaca tgcaattgta ccaagaggga 63360
taaggaaaaa actgctcatg tttgcagaaa gaagttggaa taagggcgtg aaagcaggcg 63420
ggctacttta gcatctgatg ccagggatat gagagagtag cccagtgtgt tcattcaaaa 63480
agtaaggctc tgaggccagg accaggaaag atcctggagt ccccagtcac aatggcatga 63540
agcaggatga tgcagagagg ctaagggggt gattcagtgg gttctttacc tataaaaatg 63600
atggaaaccc caacatcagc tgggcaagtg gccctgttca gagctcctgg actcgccatg 63660
actaaaacac tctgttttat ttcgtagttg atatctattg ttcttgcctc ccagcaagca 63720
atggaacagc acctttactt tcctttgaga aactattcct ttcccattct cagggcttgt 63780
gaggatcaag tgaggtcaca taatccagat ctggccaatc agcccatctc atgctactgg 63840
ctacactaat tggtttaggg atagtaaagt actcaaattt gtttactgaa catttagccc 63900
tggaattttg gtgatgggag gtgtagaggg taaactcttg atgatatcat ttgtgtacct 63960
gggtccagcc atgcctgaac ttttcaatta cttgacccag taaatttcct tattcattta 64020
aatgttagag ttgagttttg tctcttataa ctgaaagagt gacatgtgtt tatattaagt 64080
gcaggtcact aatatagtct attggtttcc ccaggcttgt tctccttttc tcaaatagga 64140
ctgatcagat agtaagtgct ccatacctgt aggatacata aaagagcaaa tgaacaagga 64200
gcaggagata tggtggctga cggttggact ataatttttt cttgattttt ctgactttat 64260
tttggctgtg atctaggaag tgaaatccag gtccttctaa accccaattt aactgtggct 64320
cctgagggag attttcagat ctcaaatgat ctgtaagttt aagggaggat gattggtccc 64380
tgtacactct ctgtgagagt tcctttggaa tactggtttc agaatgtaca gccacacagg 64440
taactggatt agggacggcc agtggttttt tatgaatgct attgaagaca ctgaatggaa 64500
gcaattctca ccagaactct ttttgctgtc atctttcagg ggctaagttg acactagaac 64560
caatcaatga tccctgaact gggagaaatg ggtggccttg gctgtgattt ttggttgtgc 64620
tgcacatttc aagatgacaa tattgtttta aattaacctg ttagagtgca cctttcctaa 64680
agaactttac cttgatgtct gagtaagggc agtgcaggag gtcccccaac ttaggggact 64740
gatcatgttc caaaggtcat ttctcagtct ggatgttttc atgagataat gaattccaag 64800
atattgtaag gttcaatatt ataaatggtt cttagtttac taagataatg cattgcctct 64860
ttgtgaagcc ttctctggtt accctaatca aaagtaactt ttctttcctc ttatatgtca 64920
cacagtatta aatgagttgt tttttaaaaa catcttaaaa tcttatactt aagcaattat 64980
gtagattatc ttggagtgtt gagcttattg ctctcattag atgttagtaa atggaaactg 65040
agtccacaat tttcacactg ttctagttct ttttcattct gcttcatttt ctgttgtctc 65100
ctgccaggtg tctgtgctaa ctcatcttgc ctgaggaccc ctaccccatg tctcactggt 65160
ctgcttggct tacttctgaa gcccagcacc accttccctc agtggctctt aacaataaac 65220
cctgacacag aagttctggc tggtccacct attcctttga gtcaggtcac aggtttccct 65280
ccagctaact gatggatgga ctgtccttgg ctcaggggtc cactcttgtt caattagata 65340
cattttgggg gcagggtcag aattcataaa atgcaggcat ttgaagaaca gggaatcaag 65400
gtagagagtt cctagaagac agagcaggga ggtaaaatga aatattctag taaagtatta 65460
atatttgtgg caggatatgg tcttttttct ttctttcttt tcttttgaga tggagtctta 65520
ctctgtcacc caggctggaa tgccctggca taatcttggc tcactgcagc ctccgcctcc 65580
cgggttcaag cgattctcat gcctcagcct ccctagtagc tggtattaca gatgtccgcc 65640
actacaccct gctaattttt gtatttttag tagagacggg gtttcaccat ataggccagg 65700
ctggtctcga actcctgacc tcaagtgatc ccccgccttg gatatggtct taactagaaa 65760
tgaagagatc tgagttcaaa ttcagcattt gtcacatgta ccctctctgg tcccaaggaa 65820
atcaagtaat atctccaatc ttcagatctt tcacatgaag aataaagagt attgatcacc 65880
atatctctac acctccttcc agctctaaga cctccaggac tcacctagaa ccaaattcat 65940
ccccacacag tggcggcagg gtcgtgttgt catgatgatg gcctctttcg gtgaagagag 66000
gttgtcagac acctggagca atgccagaga cattatcctt ccctaggaga gctactgata 66060
agaaaccact ggcagctcct cattcacttc tccatcattc actcttttct cctttctttt 66120
tccttagagg cataaacaag gtgtagatca tcctgttatc cataatgaag gaagatttta 66180
ggatattcca gcttagatcc aggtgtcccc agcttctata ctcactctga agaagtgtac 66240
tttatctact ctttttacac catttatccc attttggcca tttctgaaag gaagatccta 66300
gaagccaggc ctcttggaag aagttggagc tacagcattg ataggaaaac ctgacaccta 66360
gaaaggcaag tcagttcttc ccatgcagtg gctttgggga ctgtaattta acaaagctct 66420
tttttacttg tgtaaagtga tctccattcc acttttttct tgcactgatt ctaattaagt 66480
ggaagcaatt gttatcatca tttaggatta tagttaaaat acccctcaaa ttgtttccat 66540
ttggaatggg accttgtccc attctgctct tgctgaagga agtcttcatg gaatcacagg 66600
actcaacaaa catttctcat taaaaattct ctcctttagg caacagtggc atagaaatcc 66660
ttatgttcta ctgtctgacc cgtatgagaa cagcgcactt ctcaatttat aaaagaggca 66720
ttttccctcc tcctgggaaa aatatttctc ttggtcactt gagtctagca tctaagtcat 66780
ataatgctat tatagccttg ttttgctttt gatttaggtc atatcttctt tttctgatct 66840
ttcttaaagt gaagggacca tttgctatgc tcacaaaaat tctcaaggct ggaactacag 66900
catgctctgg tttctaagcc atacacatcc aggtagaagg gtcaatttaa ttgccaatga 66960
tctcagcctt ttctaacact gttccttaag tttctttggc actgcatggc aagcaactga 67020
gtcatgcatg aaaatttctc ttctagacaa cccataccta cagagggagg atttggttta 67080
ctgcagatgc tgagtgcttc tgatggcaca cattccttct tattaatatc cccctggccc 67140
ataatggttt gtgtggacaa cagctacttc cttcaagggt cctttgcttg gtaaatatat 67200
gcctccagga gctttctggg tagaagcagt cacaaatcac aggggtatct atgaatggca 67260
cggcccatgg aagggctcac actgtcctga tttttctacc ataagagcta aaataaggga 67320
ataggcttcc aggaaataag tcagatgggt tgtctgacta agcacagggg cagggattgg 67380
aggtgagatg acagagaaca gtcagcattg tctccgcttc cgctccaccc tgcagttctg 67440
agctgaacag ataatttatc tgtggcacaa caaagtatat gacttggaag aatgttaaag 67500
atcaagtcca ccttctcctt gtattatatg gctctgagag ccagagaggg gaggtgacct 67560
tcccagaatg tgaatgtggt agagcctagc ttacaattca tgtccaactt aggtgtgaag 67620
ttctatgaga ctatgctgcc ctctgcctca caatgctttc tcccatggga gaggaggctc 67680
agaggtacaa agcagctgca gaaagactct ctcaagctat tgactcttgg atgacaacaa 67740
ttaatgttca acttggcttt acccccaaca tgcactgcac agatgcctgc aggtctacaa 67800
tgccgagacc aagtttgggg ggcatttccg cagctctgtc tattgtcctc ctttcctctt 67860
ctgtggtcat tcttcccaag ggataggcct agtccagggt ggagaaaaac aattcttggt 67920
ggtaggggca ttggaattgt atgggcaggg ttctaggcca actttggcct ttcacaattc 67980
tgctaagcat tgaacagaat tttcacccta atttcacctt cccttccatc ccttccctaa 68040
ttttgctagt gtgtatggag ttgatttgat gagacctcgt cttttttttt ttctcccttg 68100
taacgtgggc cctatcttca agcctatctt catagccttt cttttccaga ccttgccaaa 68160
aagcagtaga agagaggtta caaaatataa gaggaaacct taaaacaaac agggtagaac 68220
tggagggaat cttaaataat gcctaaccca actccatatt ccactgatag gaaactgaga 68280
tcctgagaca ccatccaaat tctgatgtaa tcagcagaac ttaatatgcc actttgagca 68340
cagaaccaag tactttagag gtaagagagg ctatttgttt ccagcacagg ctgaaaccca 68400
catgagaaag ttggacttta agtgaccata gtcacattct gataaattct aaaatgtctc 68460
tctcattttc tctgacatca tattgtcatt tttcatacca caaatgtgtt acagtgaaaa 68520
ccaggtatag gtcaatagat agtaccaaga aaaagaaaag ttatcattct ttaatgctct 68580
ttagtttgaa aactttattt atttctttat tttgatggag gagtagagtg ggtcaagcta 68640
agagttgcct tataaacctg ttgttctcag caaatgagtc agctgagata aaaacattag 68700
tttccttggc gtgtcagcat ctctcccaaa ggagggtatt agttcatggg ttggcattgc 68760
tatcacaaag aaggctctgg cagcacctga ttggcttggc caagcttttc ccagttggcg 68820
tctgggcatc ttcctagcag tgggtcactc acccagcagt gatttggcct cctgttgaca 68880
taaatatgcc taattcaaag cagaaagtca atttgttatt ttgcctaaag aaatgtaact 68940
accaagcagg ctagatttct gtcttggcat aaccaggaaa tctttaccaa taatttatga 69000
tgtggtcacc cttgttgtag gcattatgga agatggaaag atatataagg aatggcgtct 69060
tgcaaaaaga actggacttt tttttttttt tttttttttg tagcaatgtg gagagtaaaa 69120
gcccaggggt caaatggtaa ttatagaagg agattcattt aaagaatgtc ataaggaaat 69180
agaaaataaa ggaaacattg caggaaacca tagggggcta gctgattcat ggaaaatgtg 69240
aggttatggc tgggtctaag aataagtaaa tcattggtga ctatggttgt agaggttagg 69300
acagagaaag ctggagcaac aagcaatcat ctgccagata agaccccggg ctgggtgaat 69360
gcaaggaggg agcggacaat tttgtcttcc aactctgtgg agctggagcc ttatcttagg 69420
agtccagtgg gcctggaggc ctgatcacca accagtgtaa tgttagaata agacttccct 69480
aagcaaatca atgtgatgat tgatacaaac agccatcact ggggcctcct ctatttccaa 69540
tctcttcctc agtttcccag ttctttcaga acctcactgg gaagttcagg gatatatgcc 69600
tgcaggctgg cctggcgcag atggatgatg aagggtcctg ccttgagtgt agggtagagt 69660
gattctgagt gctttccaac agactgtaaa ttaaagacac tccaaaaagc ccctggtggg 69720
gatagatggg gagaaggggt atcactaagt cttcatcttt tcttctaggg ccagggtcag 69780
tggttcaaat aaacatggtg ccccacagag atggcctgtg gccaagtagc tctcagtggg 69840
ttgactcaaa gtcacctgga caggcctggc ggaaacgcag gatggcccag ccctttccta 69900
ataggttttc cagagttgat ccatcattct gcccagaaaa ggggagaata aaaaatagat 69960
cacgagcccc tatgactgtg acttgtgctt ccttggaaat gcaaacaggt gaaggagaaa 70020
atgacacagc tagggtggta gggggcactg gaagtcaaca catttctggg ttcaaatgag 70080
aagggtgagg tgctggcatg gaggaaactg gcactggccg tctccaggca ggactttctg 70140
ggcactgggc aaggccatgg ctttgggagc tgccccaagc tgctggtcgt gccagtgctt 70200
cattcaccct gtgaaatgta ttaattagtg agtggttttg gctcagagag agttgctgtg 70260
gcttcagatg gatatagcag aaaaaaggca aatccatcta caggcgcctc tgagaaatct 70320
cagctcttgt gagcctgaga agagcttcca tagagagaag gcgagacccc agcaaagttg 70380
gacggagaaa attgagacac ccacaccaat tagtatgagt ctatcaatcc agtgccaccg 70440
aaacacaagt ctaagcctaa cagaatctgt gctgcgaata agtaagattg ttggaaacag 70500
aacaaaaaaa aactttgcaa atggtgcttc tttaagcttc tgcagttctc ttctctcact 70560
cccttttcaa aaatggctgt aaaaaaaatt tttggtctgg tttagccaga gcgcgtcaga 70620
gctggtagat gccttcaaaa ctgtgatctc cctttaattg tcagagggta ggctgaggtc 70680
cagggaggta aacagacttt tcctaagctc tgtagctggc tactggcagg attgagggaa 70740
ggtggaacaa gcctcttcat tcccaattca ggtttctttc ttccatccca catctcatgc 70800
aataaacatt tccaaatcta cctgcccagc ggggctaaga gcagagtggt ctccagaata 70860
agtggaatag catctcaggg actgctggtc tgaacacgta ctccgaacat cacagctgct 70920
gccaagcggg cagacgcctt agccccagcc cctctccctg ggctttcctg ggtcttgtcg 70980
acacttctca catcactctg ccttaaattt ttctccccct agaaagagat aacttgcctt 71040
tcattcatgc ctacctaact cagttcaatt caagtacata aatcctgctg acaaccctgg 71100
cagaagcttt atgagtaggg agtaaagatt gtgagaaagg cagggaatta atttataagg 71160
aaggaacaat gggagaggag agaaacaaag agaaggatgc aaagcaatta atgttaattg 71220
atgcttaata tatgccaggc ccagtcatcc tagttatttc atttaatctt taaaataatc 71280
cttgtgttgt catccatgcg ttttcagttg cagttccatg atttaagaaa agcacacagc 71340
cagaaagtgg cagagaaaaa atcatatcct gagtgacagc tttaccggcc cagtgctttc 71400
cattctaaca aatagtagaa agagggaaag agagaagaat cccttggtga taggaataag 71460
gtagagagag gctgtgaaag agagaaacag ggctttgggg gatcctgggt tctgatgctg 71520
acctctgtgt catttctgta tccattgtat gaatgtttat ggaaagtcag ctacgaagca 71580
aattgttcta ggcagggggg tttcagcaga gcttgggaga gcagatggtg ggaggagtgc 71640
atccatagga tagcctgggc tgtgggaata agagaacagc aagtcagggt gagtgctgca 71700
aagacaatat aagagagcga caggcctcag agaacctggg aaaaggaatg aatggggtca 71760
ccttaggaag ttcattagga ggggcctctc tgaagaggtg acctttgagt cgagacctga 71820
ggcactggag ttacaggaaa tgtgatgttg cacgtggaga atttcttgga aatggagcag 71880
caatgtagtc tgaccctatt gttgggccca ttaacttggg caatgtctca ccaaggtgga 71940
ggatggtgac aggtcctcct gggatatggg ccatggcagg acgaggggac aatgtctgta 72000
aaggatttaa aaagagtcat caattctaac gatgtcaatg ataaaatact tctccatatg 72060
cagggggcca tttccatgac ccagctcata aggagtggag agagtgctat cttcctctag 72120
aggcagctcc aggaagcagg agctggtaac ctgggggctg ctctgaaacc ttcaaaaggg 72180
caaatcatgt aggagtctct ggccactttc ttttctgtaa gagaagattc actcaaggtc 72240
aggggaccct aaggacccca gggaatcacc caaaaactcc agccagcccc tagaggaaga 72300
caatccacag agctggcccc atcccttcgg cctgtggcta aggcccatct gcccatggtt 72360
ccttcttgaa gtaattgctg taagaatttg tcattcacaa aaggaagtct ctattgtctc 72420
ttttcggatg tcatgtaacc aatgcgtgtt aaaggtcagt tgcatcagtt ctcttaaatg 72480
gcaattaagc tattgtctga gcaaaccaga ggcatccgga gtgcaagctt cgctcaaacc 72540
tagggacctg ggaaaggctg ggaacagagg agcaagtagg acaccacagg ggagggccgt 72600
ggcttcagga aacgtgggga acaccctgaa ctgtaaaagc agatgcgtca gcagacaaag 72660
ggggtcattt cactaaagcc tcagtgaagc agagaaattc cagactttgc ccatcaccta 72720
ctggcaggct ctccctccct ctgtcccctc cccaccctct cctcaccctt gtctttctct 72780
gcttcattat ctcacgctct ctctttctct cccgcagttt ctctgtctct cagtctcgat 72840
ttctcacatc ctgtttctct ttcttcttta ctctttctcc ctctccttca cctctcctgg 72900
cttcactcca ctccccccac ccactctgtt ccctctcaca ttctcatttg gggatggggg 72960
gcggctgaca aaccggattg ggggggtctg acaaactgga tttaaatttc agctccgcag 73020
cgttctcagc tcttggtctt ggaaatgttc cctgagcttc ggtttttctc atctgaaaat 73080
gaaaaaaata atacctagct ccaagtattg agcttgttgt gaggaatcaa acagataacg 73140
tttctaaaat tccaaacaca gtgcctggtc cacggcagat gcttgactgg tgacagcttc 73200
ctttcccagt gaggcccagg gaagtaggca cagtgcttgg caccctgcaa gcatgcgaca 73260
cagcttcaca aaatacccac agggagccag gagcaccgct tgaattttat ggatgacaaa 73320
attgtggttc aaggaaggta aaagtaccct ggtaggacac gtaattttta aaaagtctat 73380
agctattgat attactatat attaattccc attctgtccc tccggtttct cccctgaaca 73440
ctaatttcca aatccccaac actctatggt ttaaatgata aacgattcac ccaaatactg 73500
tataattttt tttttccttt tgggtcaggg ccatgctctg tcacccaggc tagagtgcag 73560
tggtacaatc gcagctaact gcagcctcaa cctcccaggc ttaagtgatc ctcccacttc 73620
acagcctccc aagtagttgg gactacaggc atgcacaacc acaactagct aatttttaaa 73680
atttttggca aagacagatc tcactacgtt gccctggctg gtctcgaact catggactca 73740
aatgatcctt tctcctcagc ctcccaaagt gcttggatta cagatgtgag ccaccgcaca 73800
tggccatgta caattcttga agaagctgaa actcatcttt ctttctcggt ataagaaaac 73860
tcaggatatg tttggacatc ccctcccatc tgccctccca gcctcctctt ctccaggctg 73920
aaccagatcc tgctgcatct ttctcaaaga ctctcttaca tcctcattat ggtttctgcc 73980
ccagtcctcc atgcttctct gaagtttaga gtcaaaatgc ccttttttgc tttaggggtg 74040
agaccttctc tagcaccgtg tgtctacaac acagagaggg caaacagaga tagtgcttgg 74100
tattttattt ttaaaatttt taatcttgat tatattttgc aatgtttata ccattgcaca 74160
acacacggaa gcattagtca caatttatat agctgatttc atggagctga attctatggt 74220
gtttatagcc gttgagtgtc ttctcccaga aattggaaag atgccccatt tgctgtaaca 74280
cacacgacct ccaccccatt cttttccttt gtaacccaaa ccacaatgtg taattgtgtg 74340
tttattttgt gtttaatgtt tatctcttcg cccaggctct aaggctctat gagggcaggg 74400
atcacatctg tttagttcac ccagatttca ttatatatcc agcattctac actctgtaac 74460
tgcttagtct caactctgac cacacattaa gtcatcaagg gagttaacag aaaaaaaaaa 74520
aaaacaataa acaagcaaaa tgtttactaa tgttccacaa gctcttttga atcaactggt 74580
ccctgtggca cctggggatc cgtagtcatg aaaatcctgc cagggattct tgatccggga 74640
tctggtgatc ctcggcagga caactcacca ttctgttcgg ttgcccgctt gcctcctccc 74700
gctggctcca gcttctgtgc ctacaatgaa ggctgtgccc attccctcac gtgcccgccg 74760
tggcctgaca ccttcctggg cccaccctaa cacattcctc cgttgctttt aacgactgtt 74820
tacagctcgc tacctctagg acgtggcttc tgatgaaaac tgtccagacg ctctgcctcc 74880
ggtgtaattc agagcccagc tctcctcctt aaaattcttt tacgctattt tccacaagca 74940
tgtgcttctg ttggcagtgc cataagtgtg attgatcttt accataagtt ccttgaactt 75000
tgctgtgacc tggatgctaa ggtggcggga gctgcctcca tccccacaat ttgactggta 75060
caacccgaaa gtaggatgat agtctgttct ggtcaaacat taacgtgggg cagggacaat 75120
ggagagaggg tttggtcatc tggcatgctg cagactgcca gaggagctgg aaaggctgag 75180
tatgggaaag gggagggatt tcatggcctc ttcgggcttt gagtatttga agaaactgcc 75240
tatggaagac cagacctgtg ccctgcctcc caagaaacac acagagctta gacggtggaa 75300
gctatctggg gcaaattcag ctccctgtga ggaaggtctt ctagttgtta ggggtgtctt 75360
ggtaggtcag ggagggtttt ccagcatcag tcattttcat accaatctct cggtttttgc 75420
catattcctg taccacccgt gcttttattt acctaatctt ttttatttac cgaattttta 75480
acctaatatt tcctttaaaa caactttaaa ttgacacact ttgtttcatt cctgttttta 75540
aaaagtacct atggcaaaag atatgaatag acacttctca aaagaagaca tgcaagccgc 75600
caacaaacat atggaaaaat gttcatcatc actaattatc agaaaaatgc aaaccaaaat 75660
cacagtgaga tatcatctca caccagttag aatggccatt attaaaaagt caaaaccaac 75720
agatgttggt gaggctgcag agaaaagaga acacttatat attcttgaga atttaaatta 75780
gttcagccac tgtggaaaga agtttggaga tttctcaaag aacttaaaca gaactaccat 75840
ttgacccagc aatcccgtga ctgggtatgt acctaaaaga aaacaaattg ttcaaccaaa 75900
aagacatatg cactcacatg ttcatcatag cactattcac aatagcacgg ttcatggaat 75960
caacgtaggt gcccaccaac aatagattgg ataaagaaaa tgtggtacat atataccatg 76020
gaatactatg cagccatgaa aaagaaggaa atcacgtcct gtacagcaac atggatgcag 76080
agggaggcca ttatccaaag caaattaaca caggaacaga aaaccacata ccacatgttc 76140
tcacttataa gtgggaacta aacatcaggt actcgtggac ataaagatgg caacaatagg 76200
ccaggcacgg tgctgatgcc tgtaatccca gcacttgggg aggctgaggc gggtggatca 76260
tatgaggtca ggagtttgac accagcctag ccaacatggt gaaagcccat ctctactaaa 76320
aatataaaaa ttagctgggt gtggtggcac acacctgaaa tcccagctac tcaggaggct 76380
gaggtgggag aatttcttga acctgggagg cagagattgc agtaagccaa gaaggtgcca 76440
ctgcattcca gcctgggcaa cagagtgaga ctctgtctcc aaaaaaaaaa aaaaaaaaaa 76500
aaaaagatag caacaataga cactggtaac atacccaggt aacaacatac ccaatatatg 76560
catgatatac ccacacaaca tacccaggta acaaacctgc atttgtactg cctggtgggt 76620
gtggtttgtg aaccggtatg tgtggtctgt ggtatgtatg gatgtgtgta gtttgtgaac 76680
tggtgtgtgt ggcatatggt gtgtatgtgg gtaactggca taactggggt atggtaggta 76740
tgggtatgtg tggtatgtga actggtaagt gatatgtatg agtgcgtatg gtgtgtgttg 76800
cgggtggtgt gtgaactggt gtgtggtgtg tggtatgcat cggtgcatgt gatgtgtgaa 76860
ctggtgtgtg tggtatggta tgcatgggtg tgtgtagtgt gtgaactgat atgtgtggtt 76920
tgtgaactgg tatgaactgg tgtggtgtgt gatgtgtggt atgtatgggt gtgtatggtt 76980
tgtaaactgg tgcatgtggt gtgaactggt gtgtggtatg catggagatg tgtggtttgt 77040
gaactggtgt gaattggtgt gtggtgtgtg gtatatatgg atgtgtggta tgtgaacttg 77100
tatgtgtggt gtggtttgga tgtggtgcat gtggtatgtg cagtatgtgg tgagagtgtg 77160
gcgtgtggtg tatgtggtgc atgtggtgtg tttggtatgt ggtatgcgta tggtgtgtgt 77220
ggtgtatggg gcatatgtgg tttgtgtgtg gtgtggtgtt tgtagagtgt ggtgcgcatg 77280
gtgtgtgtgg tatgtggtgt gtgtgtggca tgtggtgtat ggggtgtatg tggtttgtgt 77340
ggggtgtgtg ggatacgtgg ggtatatgtg gtggggtgtg tggtgtctgt gatgtgtggt 77400
atgtatgggg gtatgtggtg tgtgaattgg tgtgtgtggt ttgtaaactg gtgcatgtgg 77460
tgtgaattgg tatgtggtgt gcatggaagt gtgtggtttt tgaactggtg tgaactgctg 77520
tgtggtgtgt ggtatatatg gatgtgtggt atgtgaactt gtatgtgtgg tgtggtttgg 77580
atgtggtata tgtggtgtgt gcagtatatg gtgtgtttgt ggcgtgtggt gtatgtggtg 77640
catgtgtgcg gtatgtagtg tgtgtgtggc gtgtggtgtg tgtggtatag gggtatatgt 77700
ggtttgtgtg gggtgtatgg ggtgcgtgag gtgtgtgtgg tgtgatatgt ggtgtctgtg 77760
gtgtgtggta tgtatggggg tatgtggtgt gtgaattggt gtgtgcacca tggtatgtat 77820
gggtatgtgt ggtctgtgaa ctggtagggg tgctgtggtg gggagtggtg tgtgtggtgt 77880
gtggcatgta tggatgtgtg tggtgtgtgt cttgggagtg agggtgctta tcatgagcag 77940
gtgctgcaga agccctcagg gaagatgact tcactgggag ctgagatgac ctcactgggc 78000
gccctccttc agcagatgcg aggacaggcc cacaggccta aagtcaatta gaggcagatt 78060
tccaagcaga atctacttct cctgacctct gattcagtgc cttttcctga caattttatc 78120
cctgcgaccc cagccttgag aatgcaaaaa actaccccca acttcagcct gaggtcatga 78180
aaccaaccag gagtgcaggc cgtctagggg aggtgcgagt gcccacctac tgggcagcca 78240
ctctgagggc aaagtccacg ggagacacag cttcagccac caccggggct gcgacctgtc 78300
ctcaggatcc tcctcagccc cctccaggag tcctcagctt tctgctttta gccccaaacc 78360
cagattcact ttcccaggcc attcaccgtc tgaggcagcc cagtccgctt tgtccttcct 78420
ccttcccgaa ggctctcagc ccctgggcag tatcagaatt tcactttgat ctccttttcc 78480
ctgggagcca gaatagctta gtctcttcaa aaggagagtt agaaagtgtg ccgttcatct 78540
aataaaaatt aactcctgag agttatccaa tcccaataca ggtcatttcg ctggaggcta 78600
ccccgactag gaaacacatt ttaggacatc agcagaggta aagatgagag caatttgctc 78660
aggcttttac ttggggttaa ggatcactag gccaccagga ccagggatgc cagacaacct 78720
caggtttctt tccaagcttt ctccaaacta ggcctcactt ttatcatttt cctacccctg 78780
ggctctatga ttttgtggtg ttgcttttgt gttttcaaaa acactgcatt cattcattag 78840
ctctgcactt tccctcatgc aatgcacaca gaactgtaaa gacaaatgat aaagcccttt 78900
cccgcttgga tcttgtgttg ttggccaggt tcattcaaaa ggccattgtt tgatggtgat 78960
taagtgtgtt tgttttgaat attcacctaa acaaaaatga tcaatttaca caattcttgg 79020
aattcatggg tgtcttggga aaacttgaag ccacaaaaaa tgttcaatac ataaatgcca 79080
aggacctcct gctgtcaatt aagaccctca tgatagtctt ttgcttattt gctcgttaat 79140
tcatgtaaaa gtggtttgtg agcaaattaa gcatcagttg gcatgccgga catggacaca 79200
tagatacagt ttgtggtctg gaggggaggt ggaaatgaga gtctcacagg ctgccctcgg 79260
cccagaactt ctgtgtggag gttttgcata aaaatcagaa tttctggatt cttataaaaa 79320
ccctaaagtt ctagccccat tagggccact gttccactca cagccctgag taagcctccc 79380
ccatcagccc aggcatggac cctttgtcct gcctctgttg tcactctccc gactgtctca 79440
gacctaacca gctcctcttc tgtttgtgac ttgcccttat gggagcctga gggctcctac 79500
ctactagatg aagctgatgg ggacattctc ccaaatgaga aagcgatgga aagttgtgac 79560
catcagagga agatcagaga tcaagccttg ttgatgtaaa aggaattaaa gttgagaaac 79620
catttcctgc aaccagaatt gtgaaagcat acaacgtagt accaaaggaa aattaccgaa 79680
gcctccttcc ctgaagaacc ttcaggaagg ggaggccagc cgtctgacgt gatcacagtg 79740
atgtcttgcc ctgaaacaag aagcattctt cccaggtcct ttccgccgga ggattcttat 79800
tctgtgatca atgctgagct atgtggatga gtgtttgcgt ggatttcttt taaaactata 79860
ttgctaaata atcttgcccc ctggccccat gcacgttctt tttttttttt ttttttgcac 79920
ccagataaga aaaagacttg aatgtatttt tttctataaa atgcagtcaa tattgttctg 79980
tgagggggaa agaagtagtg gaggatgaag atggaacagg ggatgaggtg gtgaccagca 80040
tgccctcatg gatagacact gagcagggag aggcagggat atgcatggag taagccctct 80100
ctctctctag gacaaagcaa attatgtctt catgccagtg gactctgcat attcattgaa 80160
aaaaataaga tttaattaat ttagggaagc aatatgggct gaccagacag ccaagttctt 80220
caagatagga cagtaaaaca ttttatgtga gagctggcca atgtctggat ggaagaggga 80280
gggccaggga gactggagag atattgaggg ggtgaggagg tttgaggaat ccacagtggg 80340
gtgagcttca tgaccagtgg aatgaaataa gggctattct ggatggacga ccaatgtcag 80400
tgcaaggccc tcaatctctt gggataacac tggagttgga atacatatga aaaaaaaaat 80460
ccacaagtat aaaagaagta agcagaggcc gggcatggtg actcacacct gtaatcccag 80520
cactttggga ggccaaggcg ggcagattgc ctgaggtcag gagttcgtga ccagtctggc 80580
caacatggtg aaaccccgtc tctactaaaa ttagccaggt atggtggcgt gcacctgtaa 80640
tcccagctac tcaggaggct gaagcaggag aattgcttga cccagggagg tcgaggttgc 80700
agtgagccga gatcgcacca ctgcactcta gcctgggcga cagagtgaga ctccatctca 80760
aaaaaagact ggaatagagt acatttgtca taggccaact gcctccatgc tcttgtctca 80820
cagagatgtt tataacaagc ttgagtagct acaactggat actttggtct atatatgctt 80880
tcctcgtgat tctttttttc ctccttctta gcttaaacaa atgcacacag agggaagtgg 80940
ataaactatt agcagagtaa gcacttgcca agaataccgg gggcaccaaa aacacataaa 81000
aacaggcttg gttgggagcc cgatgtgggc agatcacaag gtcaagagat cgagaccatc 81060
ttggccaaca tgatgaaacc ctgtctctag gaaaaataca aaaattagct gggtatggtg 81120
acgcacgcct gtagtcccag ctactcggaa ggttgaggca ggagaatcac tgaaacccag 81180
gagctgcagg ttgcagtgag ccgagattgt gccactgcac tccagcctgg cgacagagtg 81240
agactctgtc tcaaaaaaaa aaaaaaaaaa aaaaagcgag gggatcttgg ggaacctagg 81300
aagaagttac ttaaatttca gcacatgcta tatagttttc aggattagtc cctctctagg 81360
tattcatctg gggctggcgc ctccttggct ggcaggggct ggtgatcggg actccccagc 81420
gagacagatt gcacccagag cagtgaggcc ccgagcgctt cctggagcct ggggaagatg 81480
gcattcattt ttaaagtcca tttattgtgc agttgttgaa agtgggacac agaaatttgg 81540
actgatatgc ctaggccaca tgactactga ttgggccagg gtaaatgcag tctttttgtt 81600
gatggagaag gtcttttctg ggcccagcac aaagcaatgg atcttcagtc ttaagaaatg 81660
cattgaaaac catccttgtg cagtttgggg tccctggtag gccaagagct ggaaaggccc 81720
ttagactctg agtgctgtag ccccccttct aggtgatggt caaaacttga aaacggctct 81780
agactctgga cagaaatgca tgagaattga gtgttcaaag cttggtgctt tgacttcttt 81840
taactttctg tagactgaaa tatgaataag aggaaggcat gaggcccctc tcagtttatg 81900
gagccatagc tccaaacctc ccactttcca acccagcaac cctgtgtgtc ctaggaattg 81960
tagcgggtgt cccagaatgc aaaaatcact ctgctagaac tggaaaagga gacgcctgcc 82020
ttttctagca cgatctttag taaatagatt caggaaatgt gggtcctggt cagagctggt 82080
gccacaagct gagtgccttc aggcagcaga cttagcctct tcaagtccaa tctcatcagt 82140
agtatcaggg ggct 82154
<210> 6
<211> 99791
<212> DNA
<213> Homo sapiens
<400> 6
ttcagtgagt cgacaccgcg ccactgcact ccagcctggg tgacaaagca agactctatc 60
tcaaaaacaa acaaacaaac aaacaaaaaa aaaaacagag agagaattac taatattttc 120
ttctccaacc ttaatgctca ctccctgagc tatgtggatt atactagtga aagtactgcc 180
ttaacccact aatgtaaaca gattcctttt aagaagcctc cctatcgaga atggtctgta 240
agagacaacc atgtcaacaa gtaaagttcc ttctgccttc cctcctgggg tgggctaaga 300
tggacccttc tcaccattcc caattacctg caggaaggca gcaacagaat agagaaggag 360
ggtaacacag tttcctgtac tttaaatacc tccctgcctc cgcaagtaaa acttgagcca 420
tgccaatgag ggaaaaagtg gccgcgattt cccaggtggc ttagtaatac acagttttct 480
gacacactgc aactccattc tttcctaaaa gttccttcca agcctgtagg cactgtaaga 540
caaacagcta agcacttcct gagtgcctac tatttgccag gctgtatgca gcaccaggaa 600
cacaaaaata aaagctatgg ccattcagga acaagatttc aaaatgaaaa ataggaggaa 660
aatctaacat ggatggaaaa aagccacact tttccatgct tcaagtttag tttccatttc 720
taaaatgtct gtcctcatat gttagccaga aagccagttt ccagcaagac aagcagaaat 780
aaatattatg caagtcaaac ctacaagaat gggtcttcaa gaaagggaaa taattttcgg 840
tcaaaatcta aaaatccata ttcaacaaaa aaagcacaga ttgagaaact aattcaatag 900
caaaaaagga aaattaccat tgatccaggt tgccattttt aataaaaagc agtaaggtct 960
taaagaaaat attagcattg aagttcaacc aaataaatta ctttgtcatc aaaatgaaga 1020
atgccagaaa gttctctgaa atacaatttt taacaaaact gagaaagcag aggaagtatt 1080
ttttaatatt acaaattttt gacaccaaca taagaattcc atgatatcct aaagagcaat 1140
gaacccaggt aatgcagttt ctagaaattt taaaacacta ccaaataata ttgcttcttg 1200
cattaagtat agcattggtt tgctagaata atcctaacaa tgacaatgca atgtacttta 1260
aattggggtc aaaaaacttt tttcttaaag taccagatag tcaagctttt aagctctatg 1320
ggtcatccac agacacactg caactataca aactatatca cccctgttgc aactacacga 1380
aaagcaggaa agcaaccaca gaagacagac aatacataaa caaatgagta tgactgtgtt 1440
ccaataacat tttattaata aaaacaggca actggcccat gggtggtaat ttgctgaaac 1500
ttggtttaaa ttattattag tatctacctt tttttaaaag atgatgtttt ttagggtctt 1560
tccatcatga aaattatgtt tttatgaaag tgatttggga agtattaaaa tacagaataa 1620
agagcaagcc ttgggctatg aagtcaaata ggactgggtt ccaggactgc tgtgtgactt 1680
tgggaaactg acctgccatc tctaggtgtt agtttcctca cttgtaaaat taagatgctg 1740
acagccctca cctcataggg tcactcactg caaggaccac acaagtgaac atgcatacag 1800
cacttagcat agttatggat aaccctgtac ctaccttatt atagcaattg ctatcaactt 1860
tcttctagct tatcattaat gatactataa aaacacccag cataacgcca gcataaggat 1920
gtgaatgaat gagcaaatga aaggagggag ggcaatggca aaattttacc ttggtttcca 1980
agctaaagta taacctgagt tttttaatgc tttacaaaaa ggaaaggcaa tcagaaccat 2040
aattaatatt taagctgtac tgacaggttt tccagggaaa attctataga acttgttatt 2100
ctccaacttc caaaaataag caataaattt tttttaaaga gctgttattt taagacttta 2160
tttgaaccaa agaatgtgtt tatggtaaca acatacatgt tgtaaattaa tcagtttcaa 2220
tgttataaaa taatacttcc aagaataaat gtatcatata atctatgtac ctcatgtcga 2280
taatttaaat aaatacatta aataaataca tcattccgaa gtccgcttta tcattgtttg 2340
taaaatccaa ttgtcatact ctggtatttg ttctccaaaa gaatcatcac tttcatattc 2400
actacagcat gagatgagat atttaataaa taataggaca tcataatcca gggattaagt 2460
agtttctttt agcaaaattt aatatgaggg tagcatatgc cagccgttcc tagttgagca 2520
acaatttctg tgttgggaga ggataacaaa gccaagtatt ttcccataag aagttcacac 2580
tctaaaaggc caggcgcggt ggctcacacc tataatccca gcactttggg tggctgaggc 2640
aggcggatca ctaggtcagg agatcgagac catcctggct aagacggtga aaccccgtct 2700
ctactaaaaa tacaaaaaaa ttagccaggc gtggtggtgg gcacctgtcg ttccagctac 2760
tcaggaggct gaggcaggag aatggcgtga acccaggagg cggagcttgc agtgagccga 2820
gatcgtgtca ctgcactcca gcctaggtga tagagcgaga ctccgtctca aaaaaaaaaa 2880
aaaaaaagaa gttcacactc taaaatgaag agaaatgaga aatgtctatg tgcacacaac 2940
ttcccacata cacacattag ttagagacca cagtcatgcc caccctccag ctcacgtgac 3000
atttcaaagc agagatgaga cttaaaggat ggaagaaatg gcgtttgttt catggatggg 3060
gtaacggagg cttttagggg cttatgggat ggacaagtaa aggatcaatg agacagaaag 3120
gcaaggcaag gcaaggcaag ggactcgatc tcaggaagtg gtgagtggag atgaaagaag 3180
tccaatggaa tggcagtcac tggagatata tttaaagaag agggtctttt tgtttgtttg 3240
tttgtttgtt tgtttgagat agagtcttgc tctgttgccc aggctggagt gcagtggcat 3300
gatcttggct cactgcaacc tctgcctccc gggttcaagc gattctcctg cctcagccac 3360
ccaagtagct gggatttcag gcccgcgcca ccacgcccgg ctaatttttg tatttttagt 3420
agagacgggt ttcaccatgt tggccaggct ggtcttgaac tcctgacctc aaatgctctg 3480
ctcatcttgg ccccacaaag tgctgggatt acaggcgtga accaccgcac ccggccaaga 3540
agagggtctt ttaaagaagc aagataggaa gatccgttaa agagagaact gcataggaag 3600
gaaaaggcct ggctaggatt ccctgaacct tctcatttca ctactctctt gttagtcatc 3660
aatgcagtta agaatcaacg caatcaaatc gaatcacata gtgattaatt tgtgccacca 3720
atagctctaa ttttgttaac ttctcattcc aataaaaata atcatctggt taatccattt 3780
cttcagcggg attacttgtt tgcttgtttc tttagctata ataaactctg aatgccagag 3840
tcaccaaact aagcattaaa caaactgatt gacaattcgg aagcatagga ataattacag 3900
atgatgctag gcaatatcac tagattgggt tttcatgaag ctcgtgactg gattttgcca 3960
caaaaatcac taactgcttt ggcttccaga gaatggcctc atggataagc cccaagttcc 4020
aaaaactaca aaatgtcaaa atcacattca actaattaat aattttatgt cacaataaga 4080
attaggaatc tctagaaggc tgggtacagt agctcatgtc tgtgatccca gcactttggg 4140
agatcgaggc aggcagatca cttaagccca gcagttcaag accagcctgg gcaacatagg 4200
gagaccccgt cctacaaaaa atataaaaat cagctgggca tggtggcaca tgcctgtagt 4260
cccagctacc caggaggctg aggtgggagg attgattgag cccaagagat ggcggctgta 4320
gtgagccatg atcacaccac tgcactccag cctgggtgac agagcaagac cctgtctcaa 4380
aaaaagaaaa gaatttctcg gaaagtctta atttttatct aaacctatct gaaaattcaa 4440
tgatgaattt tatgaactta gccctgaact gacattcctg gtgaaaactg caatcattgt 4500
aggacaagag ccgtcgtgtt aaatgctaag gctattttat acacatccaa tattttggga 4560
gcactgcaat taaaagtctt ctcacactaa aaccaatgca caaagcacct ctcaggttta 4620
agcctcacta ggctgatgcc tgaaacacag caaaatgctc atactcttta tacacatgtc 4680
caaaggtcta gctatcaaaa gacagataaa aaggagcatt ttcccccaac tgatggaagc 4740
aagtccaagg tgaagaaaga ggatagaacg agaaggtaaa ccatctctca aaggtgagaa 4800
atcaacacag agtcaaccaa tgtcttcatc tcaacccaac ccaccaagca atgtatcaga 4860
ttggattgga gacagattgg agactctatg aaagaactgg catgcacaac ccaagaacct 4920
cctggattct tggcccttct tttaaagaag gggggtttct agacaggaat agaacccaca 4980
gagtcatgga agccagcccc ctaccataaa ttgttcataa ccacaagctt attggtcagg 5040
tttataaagt gattcagact ctttagaggc tacaggaagg gtgcagataa gaggacactt 5100
atgctggggt ggggaattat tggagaggcc tccaacaatg agatatcacc tataattaca 5160
ttaaagattt aaaaacatga ttgaatcaca tgttaacaat ctcctaatta gagctctgac 5220
tctccttaga atgtccaaca tccactgcat ctaagaagca ctagtattta ttatgtagta 5280
ttgtttgtgt caaattccca aaaaaggtta tcttgaaggt taatggattt aagtagctgg 5340
aaaccctgat tagagttgcc catagaaatc tgaattctgc tcaaacagtt caaagctgac 5400
aacaaaacag tgatggactc tgaaagtgaa gagacccata gagttcacat gtaatgttaa 5460
aatgttcggc acttcacttc tcaactgggg tacatgtaca cctaagacct acatcttaga 5520
agtttccaga gttacagaat gaactggatc gtgtctcaga ttaacaattg attcaaagaa 5580
tggggataga aagggagcca tgacaaaata aaggaggggg ctgttttgta tcacagcaaa 5640
caaggagatc ctgtgtaaaa gaaattatca aaattgttaa tgccagaggg tagtggctca 5700
tgcctgtaat cccaccattt tggtaggcca aggcagaatt gcttgaggtc agaagtccaa 5760
gacaggactg agaaacacag tgagagtgag accccatctc cacacacaca aaaacatctt 5820
tgcattaaaa aatgaaacta gaggctttaa agaactgctg caggctacgt gacttaaaga 5880
atataagttc tctgccttct ttgtcatcag gagtgcttct gtgattacgt ataggaaggc 5940
aaaccttaaa ggaggtaact gaaatcttta cttcaacata ctcaattgta tgcacacagc 6000
ttggtaagca aaataagtca caaataagca atattgcttc aaaaaccttt tttaaaaaaa 6060
gatacataat caattatttt catattaata gagcaaagga ataccatgaa taatccaaga 6120
taccaggtaa tccagaagtc agatactgag aagtgaaata catcagataa tttttacagt 6180
gtgtctatga tcttaattac attttactaa gcctaatact agtttttctt tcttttttag 6240
aatttctaga ttacattatt tgaaagtaaa taatggcttc aaatcatgtt aggcaacaga 6300
attcccagga aggagtgaag gtaaatcaga tgactgaact atattacaat ttaagctgtg 6360
atgtttgcac aactataaca atattataaa tgagcttgag gtttcttact gaagatgttt 6420
aatatttgat ccaaaatatc gagcagtttt gactaagcac tgtaagcaaa gaaatacgct 6480
atcatagcag gacacctgta agtttccatt gtataagaaa atgtttcctt tgtttaattg 6540
gagagtcaat taaacataca aatatctgaa gacattatta tgaaggctga tttggaggaa 6600
atgtataatg cagatacatt ctgggtgtaa gtattaaatt catacaacca ttctggaaaa 6660
taattcaacg ttgccaagtc aagagcattc cctaaaaccc atgagttcct ctcccaagta 6720
aagacatgag aacaattctt gcacatgtgc aacagcgtgc atacacaagg gtgtttgcag 6780
gacccgccca tgatagcaaa gcactggtaa aaaatcaaat gtccagaggg agtatactca 6840
gaccatggaa tactgtacag tggcaaacca aaagaaagac acctgcatcc acttagaaga 6900
atattacaaa actaatattg aagcggggaa aagcaagtca gaaaataaaa tatataacat 6960
cattccactt ataaagaaac caggaatatg tacaactaag caatatatta ttaggggata 7020
aagagatgta tggtaaaatt ttatataaag aaaaaacaag ggaataataa atgtaaaatt 7080
caggaaagtg actatctctg ggggcaggaa gggagggagt tgcaactgag aagcgcacag 7140
agagaacttc aaaattattg ataactttca acaaagttgg atgttagaca aataggtgat 7200
cattttatta ctattattta aacatgctca taatttaaat tcacatgtat agctatatat 7260
tatgtattat agatataaaa caattcagag gtataaaatg caataaaaaa gtgtacaagc 7320
ccaaatctct agcatactgc caatcaaaag atgattgtta ttcataaagt atctcaaaaa 7380
ggaacattag actatttcca gaaatcctgg ttgctttatt attcatttat tatttattac 7440
cccaggaaga taaattttag gaagtttcta ctttgagtgt ctttcttcta agttgcaaat 7500
acaaataaat gcttatttgg aattataact atactggaag ctcatgtttc aaataaagct 7560
atttatatat agcttcatca ttgtttgaat gcttatcatt gcagcctcat tacaaagaac 7620
atctaaaaga tttttttcca acctaagaaa aaacagtgct ataataaggt atcttacatt 7680
catgggtaaa aatactcctt ttagagaaca taatataatt agtttctatt ccaagtctgt 7740
cagtgtgcac tgttaacctc tgacaattat gcatgaacct tttaattagc atgttatctt 7800
tggtgcaatt aataacttgt acttcatgtt ataggcaaat taaagttttc ccactaaaac 7860
caaattcttc agcatagttc taaaagtgtt ttgccattta aatgaaattt taacattcag 7920
acctcttgct cccaaaacac ataagccatt ttttccaaag ctagacagct tttctctatc 7980
cacgttcttt caaatatttt acctaagaca gagaatctca tattaaattc aatttcacac 8040
ttgccaatca cacacgccca ctcacaattc ctccagatga tgcaatgtgg cctaatgtgt 8100
atgcttatgt atgtacatgt gcacacacaa acaggcataa tgtttaaata catataaaca 8160
cattcattgc taggtattgg ttaaaacaaa caggcttaca gcataccaac ttattaaaca 8220
taatgattga tattagtagt ttcattaatg taattaacct ttagatttga attatcaagt 8280
tcaaagtcta agaccgagag cagtggttct caggccggta caataatggc aagtcatggt 8340
attcaagaga tgagtctaaa aggcccctca gtcctgcccc taccagaaac cagagatatt 8400
tgctgctggt aataatgagg agggggtttc taagtacaag atcagctcta ttctttcatt 8460
ccctggaaat ctgccctcgc ctctgatacc tcaaaaaata tctgttgcat ttccaaggga 8520
aagaacaatg atataagcct tgctgttaaa aaaaaaaaaa aaaatgccac tacttacaag 8580
ataaaaggca aggtgttttg tttttttccc ctttctctta gactaggcat gaataatctc 8640
aaaatatttg tttgtcaata aagtgattaa aataaagtga tagacaagac ataatgatta 8700
gagaaatgaa tcaaagtaat atttgggacc agggtcttac aaatctagag taagtatgtt 8760
gagcagaaat agatactaaa aatttacatt agaacaaaat aaaaatggat ttagtaatgc 8820
tggatttaaa ttggaaatag ctgtttaaac tcatgacctt aaagaaaatt tgtcttggcc 8880
aactgcggtg gctcacgcct gtaatcccag cactttggga ggccaaggca ggcagatcac 8940
ttgaggtcag aagtttgaga ccagcctggc caacatggtg aaatcccatc tctactaaaa 9000
atacaaaaat tagctgggca tggtggtaca tgcctgcagt cccagctgct tggggcgctg 9060
aggcaggaga accgcttgaa cctgggaggt ggaggttgca gtgagccgag atgggaccac 9120
tgcactccag cctgggaaac agacagagaa ggaccctgtc tcaaaaaaaa aaaaaaaaaa 9180
aaagaagaag aagaagaaga aaaagaaaat ttgtcttctg gctctctccc taaaatgaac 9240
taactgggga atcatttcta ccttccagaa gcatttgaat ggaacagctt gatatcatgc 9300
agagcaccta aattttggat gccactatgc tctatcaaag gaatcagagc tcctcagaga 9360
atagctgact ccatgtattg ggtcatgaga aaatcaagat ccactggaac ttgtggttcc 9420
cagaaaacaa cagtgctttc aagaatgcct gggggtaatg ctaaggggac caaagaggac 9480
atttaaaggg actcccgcag gtcatgctgt gaccatctga gcatcgacat gacaatatga 9540
attttaatta attagaacaa gtgcatccca taaaagctga gagtccagga tactcaaaga 9600
gaaacagtaa ggctggctgg gcacggtgac tcatgcctgt aatcccagca ctttgggagg 9660
ccgagaaggg tggatcacga ggtcaggagt tagagaccag cctggccaac atggtgaaac 9720
cctgtctcta ctaaaaatac aaaaattagc tggctgtggt ggcaagcgcc tgtaatccca 9780
gctactcggg aggctgaggc aggaaaattg cttaaacctg ggaggcggag gttgcagtgg 9840
gccaagattg tgccattgca ctccagctct ggacaacaga gcaagactcc atctcggggc 9900
aggagaagaa aaggtaaggc ctactgaaaa cacatttgta tcataatacc aaagaagagt 9960
gactataaga tgtcctaaaa atagatggtg aagtatttaa agattaggat actctctttc 10020
tcctgtgaag tatgtgcttc tttatgagga aagaatcagc atttttcttt ttgtgtgttt 10080
gtaggacaga atgaatgcag agaattctaa cccaaatagt tccagaaaag taggaatata 10140
ccatgaaaga tggcagcaat agtttgaaga gtgagtcaga aaacaagtag tttgagaacc 10200
gttagcctat attctaatga cttgaaagtt tagtgcatgg agaaaaaata tttaatgtaa 10260
agtcatgttt gcctttataa tttcaaagaa tacttaaagc agtatgggaa atgcctaaat 10320
ggacacattc agaactcctg agggaacgag cagaacacag agggcaagag aacttggaat 10380
cagaaattcc acgttcaagc accacgttgc ctattcctca actttaagaa tgatcaatcc 10440
tgccatatct gcctcccagg gtaagtctga ggaactctcc ctgtggttta tgtttgttca 10500
actgtatttg caggtccatc tttaagatag tttgcccatg aagatagcaa ggtacttttt 10560
atgaccctat ctcaaaatca ggacatattc tggtaaagac acataaatat tggctcaaat 10620
ggattttgtt ttacctgaat caaagggatt ttgttttacc tgaatcaaag ggatgaaaat 10680
ttgccccaga aatagttgac caagtaccag gaggtttcaa aggaaaaact aggaagctga 10740
cagattgaat gttcaaaatg attccaaccc aaaatgctct attacccaga acttgactcc 10800
agagataatc caaccaacat gaacctctgt tttctattta ctcagagcat agttgctgct 10860
caatacatcc attcatgcaa caagtgccat attcatgatc ccatgccagg cacgttctat 10920
gtgcttaaga tgcagttagt gacaaaagag gccaaagtcc atgcccttgg tgactgggga 10980
caggcaaagg tggatggcaa taaataagaa tattagatga aggaagtaaa ataagactat 11040
gtcacttaaa atgacttggt gggtagcata cttttgaaag gcttctcaga agaggtgaca 11100
tttttgagct gagacacaaa tgacaaggag ctggcattac aaagagctgg ggaaagaatt 11160
ccttgcagaa gaaagaatca atggaaaagc tctgagttag gaatgtggct ggcatgttat 11220
taaaaaaaaa gaagaagaag aaaagaaggc ttaaacaaag tgaatgccaa gaagtgttaa 11280
gatgtgagct tgcaggggaa ggaaagagct agagaacacg gtgtgagtaa cgtaagcgaa 11340
aacaataaat aatacctttc ttcacatcca aaagctgatc agatttcttt ttccaatgcc 11400
aaaatacatg taagtacata atgtcacgtt gcataccact gcggtggaac acaaggaaag 11460
aagagctata atgcaaacaa acagcaactg actctttggg gagcttaaga aaaaagaagt 11520
ccaggcacca acacaaaagg ctgaataaat cacaacctta ctcaaagaac aatattaagg 11580
gcataggctg tagaaaaggc aactggttca atgcttctca tgccctctga gagctatcac 11640
aattaatggc atcatcttcc aaacaacagg taatacaatg ttacttctgt gttatagaaa 11700
catttgggtt ataactggag atgtatggta tattcatcac aaagatgata atcatttcct 11760
ctttgtgtat tcaatggaca gaaatctcta agactaggcc tctgcttccc aaatattcat 11820
gcaactggaa ctgttacaag ggtaaaggca tgaattaaaa ttatagaaat ctagatgaga 11880
tggaaattga aaatacacta aaacctaaag tctcctatag ttaacatggg ataatatatg 11940
catagttcct aacagcgtac ctacaatcct ataagggctg agtaaatgtt agtttgcttt 12000
ccaaagtaaa agtgacctga tttttctgtg ttgctccccc ttgagatcta aagctaaacc 12060
tctactgaat aaaagcagag tgacttacaa ttgagatagg ccaatctaaa actgaaaagt 12120
ctaaaatgtc aaacttttaa aataagggga tgttcactgc ttatttgact cattaaaaat 12180
aaaaatacct agtgattgtg aatttaaaac tgtagactta tgatttgtgc attttatata 12240
tgttattctt caattagaag ttcaagaaat aataatggga ggcctgtatt aaaccattta 12300
tataaaagtt tctcaaccat aatggaaaga tcaagatgtc tagcataatt tgaaagtatg 12360
tttctatttg acagaaacct tggcttggaa aagttaaact ctaaatattt gtacagaaag 12420
aagtattctg ggtttcattc attaaaagtc attgaccact gcagaaaagg gagagcaaga 12480
gatttacata tatttttctt gacgttttat atgcattagg cctggcaatg aacttgaggt 12540
aggtattact atctccttat ttctaaggga atcagaatac tgtaaacaaa gacatggagc 12600
taaataatgg agtcaaatcc tggcttacta ggctccacat ccatgttgct ccacttatca 12660
gacggccacc caaacataca agtttaacaa attccaaatt attggggcct aaatagacac 12720
ttttttgttt caatattgcc cttcttccct tgtattctga atatcatgtc aaccatgaat 12780
cataagccaa tgcttacaaa tttaacttca cattatgagt tttgagccca actgatgcct 12840
aaccactaaa ccattcatat aacacactga aaagaagcca tttaagaaat gagaaaaata 12900
ggtattgttt tctctgtatg gctgtaaaag ctgagataag aacattttgg caagttcaat 12960
agagccgaaa ggcttgtgaa ggctatggga ggatgagtat attggaagaa gatcagtagg 13020
tcaagaatct aagaagagct atttatgtgg gagacaggaa ttaccttgaa ggaagagcag 13080
agccccagaa gaagaaaaac agaatataac agctaactat aaaaggaccc agggccaggt 13140
gcggtggctt aggcctgtaa tcccagcact ttgggaggcc aaggcgggtg gatcacgaga 13200
tcaggagatc aagaccatcc tggttaacat ggtgaaacct cgtctctacc accaatataa 13260
aaaatcagcc gggcatggtg gcaggcacct gtagtcccag ctacttggga ggttgaggca 13320
ggagaatggc atgaacccgg gaggtggagg ttgcagtgag ccaagatgac agccactgca 13380
ctccatcctg gaccacagag cgagactcca tctcaaaaaa aaaaaaaaaa aaaaaaaaaa 13440
aggacccaag agaatataag tcccatgaaa acagagctcg agtctgtctt gttttgtcac 13500
attacctatt tgatactcaa tatgtaattt aatttctgag tgaataaatt aagcaaatga 13560
ataacttaaa agtatagcta tgaatgttaa aaaaaaaaaa agaaaaagaa aaagaaagaa 13620
aaaagaaaaa attaagtggg gagaggcatg cctatggcct tgtccttggt cctgaataac 13680
tgtttggcca gatagtatgg tttcctaacc ctagctcatg gtgttcaaat tctactagtt 13740
tttctttgtt tgaactttcc atctccatga aactaaaaag tataattttt aagctgcaga 13800
acaaatcatt ccatgtctta ttttctgagg ttacatagct ggctgcatgt actttcaaca 13860
attctatcat gctttgacac ttagaaatat tttccctacc agctttggga agctgggcgg 13920
tttgtgttta ccatcctctc ctgatgttac gctttagttt aaaaataaca gtcattatca 13980
ctcaattatt cagtgatcaa gtgtaacacc aggtgcaaac aaaagttctg agaacactgg 14040
aacatgctct tgttactgca aacgatttaa gagctttgaa tttatgaagc cagtgatcat 14100
gttactctaa attagaagca ggtaaaacag aagaatggca taagctaaat tccttctttt 14160
cgtttcttta cttccttttt ccttttaagg atatctatag caaactatat tagctttcta 14220
ttttctccac tatttgcact agcattaatc aacatccaaa aagtgtacaa attattttat 14280
ctttataatc aatcttctga aatgctaact tgaaaatata aacagcacaa ttactttttt 14340
ctcttttctt tcccatttga aatgtgtgct tgtgtgtgtg tgtgtgtgtg tatctgaatc 14400
tgtacatata aatcaaatac acacacatat acttgtttta aaaaaatcct caaagaatca 14460
atcacatatt acagaactga aggaatattg gagttcatct ggtccaaagt gttggtattg 14520
taaaatcact ttcaaatttc acagttatcc aaatggtaat gaatattaat acctaagaaa 14580
atcaatcaaa gattaacatt aagacattag attttaaaaa tcattgcatt taatattttt 14640
tatccatttt caaatttcag aaactaggtc tatattgtcc tatagatcta acaagcacta 14700
taaaagaaaa attacaaaga tttcccaata tacagataga cacataaatg aaaactttta 14760
attgcaagag aaagggaact ggattcatca gttacatgca tttagaaaaa tctgtctcat 14820
tcatcagcag caatgaagga gaaaagttgg caacagagcc aagtatactt actttctaag 14880
tagccaataa ttggaggcat ttaaaaatct ttttcactaa aatatacatt ttttgctcaa 14940
actccagatt tctgacattt ccttattcta ctgataatga cttcatgtga gcaaaatgga 15000
atgaaagatt gaaaaaaatc agatatatgc tacccataaa ggtttatcaa tatgatatat 15060
ctaaacattt atgtacttat tggtttaact tagttgatat aaatgaatat gcatatcata 15120
cacatcatgt gaacagaaga gcagatcagt ggctgggggt aggggattaa ctgcaaaggg 15180
gtacaaggaa acttgtggtg atggaaatgt tctatattta ttatgtggtg gttgttcaca 15240
actgtacatg tttgtcaaaa cttaccaata gcacatttaa aattggcaga ttttattgta 15300
tgtaacatat ctgactcccc gaccaaaaaa accaaaactc tgttatacca tgacacctaa 15360
aaataattcc tacagagact tacctagaac atcatggaca ctcaaatatt aaccatgacc 15420
caagaaaaca ctataaagta tgcataaaca gtgattctcc tataaaatct acacacatac 15480
acaatatgtt aagaaatgag tacaaaaatt aggggagcta ccataataca tggcagaaac 15540
agatttcctg ccccctgcca taactatcat ttaccaacat tcaatcgaat ttaagaattg 15600
ggggaatttc agagagtatc ctaattcact tcctaattca cttcctctag ataccaccac 15660
tcaaagattc ccgtggttcc cagagccttc acttgacatt catacaactt tgaccaggaa 15720
agaagggtgc gccacctcca cctgtgcctc tgcctctata ctagaaagga ttaggcagag 15780
aaagagattc aaatactgga aggaaaagaa ggtattggga agccaggatg gtttgttggg 15840
gcaaagtatt ctcttgtcat acagatggct ctcttcttgg tggtgcccca gcccaccctc 15900
aagggtgtct ataagtagga gaagagaaaa gcactaatga tgattataac ataattaaat 15960
aatttatgaa ggataaaata tcagagtcat gagagctctg aaagaatagg tagactacat 16020
gcatcttacc tacacattga gtattaaaaa tcctagctgc cctctgcagt gatgccccac 16080
ccagaagacc aatccattgg aactattgca atctgatcag attaaacaca ccaaggtcac 16140
tctgaaagta tggaggaaaa caccaaatta agaacaaaat aatactttta aaatataaac 16200
cagtttaaaa gtatcaaaaa cgtttctatt tagtccatct ctgatctctc tcccaaacct 16260
ctgaccgaaa gagacacaga tttttgcttc taaaaacaaa gtatatttta ccaacaggat 16320
aatataagtg ctttcaattt tatctaataa aaagtagggc aaagtgaaaa acaggtgcct 16380
ctacagatgg agtatactaa atacatgtaa cacttctgat aatgttgaac caccccctcc 16440
ccttttggaa tttgaaacat cccgcataag atctgcattt ttcaaatatt gctaaatatt 16500
tagagtctaa aaagatgaga ttcattattt tgcacagtaa cacatctcct aataatattt 16560
caggccagtt ttgaagaact gaaattgata tcttttccgt atatacttaa cctcctacag 16620
atttatttga ttctcaataa ttactattct ctggtaaaag gcatatgtta ttacagtaca 16680
ctgcactccc acaagctgcc cattcagtgt attttaataa atctctgcca gagctgtata 16740
aatttgatcc tgtttaaatt taataaggat cagaatatat caaagcacaa atacccatgg 16800
gagaaataga tattttgcat agttattgaa tggcctattc agggatacaa tatgtaagac 16860
ccagaccatc aaccttgaat taaaaagaga gattaatgcg ttcaaagccg gctacttgtt 16920
aaataacata tgaaattagt atttaataaa acgtcttctc tatattgttg ctaatggtat 16980
ccatcctagt acagctttaa tatcaatatt ctcatacaga attctaatat ttacaagaat 17040
tgtcagcaat gtatttctta aatatctaca ttatcttgat aaaatgcaac actgtatgga 17100
acagagatga agaatacctc atagtaattt ggaattgttg agtttaatgt tcatttgagt 17160
aatataaata aaaagaacaa ccactttgct ggatatagtt ttcacagatt acaagcctga 17220
tgatcaatga actgctttcc cattctcttc tgtagctgga tatgtttctg atttgaatcg 17280
tatttcaata atcattaata tcctgtggtt gagcaaatca tttcaatttt ttccaaccaa 17340
aatctacact tgagtgtaaa caccaatggc aatgattaat gagcctggat ttagaggctg 17400
ttagaagata caggtagcaa aatgtcaggt atcaggaaat ccttcctcat agtaaggacg 17460
actcacaaga caactattgc caggaagatc aaagggaaat ggtatcatgc gaggcatgta 17520
gaaccaacct gttctagcgc taaatgcacc agacagatgg atgggctaat ccgtcttcag 17580
ttatctacaa atactgcggg ggccacaaat tgtttaaagc cactgaaact gacattcact 17640
catgcatgtt atatttgaat ctacacctca ttattcccaa ccactttcat cttattctta 17700
aactagaaat gtaagggtta gtgcattcat cagacaaact gataaaagac actatctggt 17760
tagcctgtcc agatccatta gaaacctcac cagaagatta ggtcttactt tcagataggt 17820
agttatcagg taatgaagtc tctcctcaat gcgcctggct cccgagcgag gttggcactt 17880
catcctccac tacatcttct atgagtatct aaatcctctc taccctcttc tgactcttct 17940
gtcctctgct ggatggggtt cagtgagaga aatgcatcct agctgagcag acgaaaaaaa 18000
aaacaacatg gttgggcaat cagctatttg tcacactgag aagacatcac ttcttaccaa 18060
gcaagaagta gtagaatggg ctgggcgcag tcgctcacac ctgtaatccc agcactttgg 18120
gaggccaaca cagcaggagc tcttgggcct gggagttcaa gaccaacttg ggcaatgtat 18180
tgagagctta tctctacaaa aaaaaaatta aaaaattaga tgagcagggt ggcacgcatc 18240
cacagtccca gctactcaag aggttgaggt gggaggattg cttgagcctg ggaggtcaag 18300
gctgcggtga gcacagtgag cactggtcac accactgcac tccagcctgc gtgacagagc 18360
aagactctgt ctcaaaaaca aaaaaaaaaa aaaaagaaga agaagaagga gaagaaatag 18420
tagtagatga gctacaaata caatgcccca atggctgaag gaaactgaag tatggatgca 18480
gatatgacat gtcccatata tctaatttta tgaaatatgg gtatataaaa tccaaacata 18540
aaaatcagat ccataagact aatgagtgta gttaaaattt cctgaaatag tatttctaaa 18600
tatatttaaa aactagcatt ggttgaacac cttcagtttt ccaataaaat tgtgtaattt 18660
attatgctat aatttttctt taaaactttt attttaaaag cccaggcttg gcagcctggc 18720
caagactagc accttatctt acacaaaata cagtgctctg cctcttaaca aatatagatg 18780
taaccactgc cagctgttta caacaagcaa aagctgggaa gccctattag gtgttatgtt 18840
tgttctgctc gtgttaatag actcatgttc aatgtcagct cttcttccta gatcagtgtc 18900
tgccaaattt cagttatttg tatatcactt tcatgcattt tgccatttaa agcaggtcca 18960
cactcttcct tatccaaaac cttagggcca gatgtatttt acagttgaaa gttttcaaga 19020
ttaggaaagt aatatggtgc atattccctt attacataat acctctagtg gtctgaggca 19080
gcaccccata gtcaaacatg tggacatttt tgtagcaaaa tgtctgaata ttcacataaa 19140
gataaataca ggaaaaaaaa gtttcatgtg aattcaggtc aagttttgat gcaaatgtgt 19200
aaccctaaac atttttttta atttgttttt cagagcattt agaatttgga attatggcta 19260
aggtatagta ttgtgagcct ttatttttct ttaattcatg catttgcata aaaattaata 19320
tgcttttttg ttaacaaaag gacactttat ttcatacatg gaaaactggt attcctttct 19380
ataaatagca cataactatc aaaataaata caataaatac aaaataatct atttaattct 19440
agcaaaccaa agctacagaa gggttgtaac tgggtcctgt atgatctcct ccgtctctcc 19500
ctctctctct cttcccctat aatgtgtctc aatctctctg ctaaaaaaga gattagcaag 19560
tattaggtgt taaagacata ttcgcaccaa actgagattt tctcactgat gtaataagaa 19620
agcctgaaag gaaaatggaa atgctttcta tgtaattcaa tatggtttaa aaacatatcc 19680
ttgtagctaa aaatcaagct acagcctacc aatggtagaa gcccagtacc acctgcctag 19740
cttccatcta tcctatgcca accagcacac catgtttgct catgtccctg gccagttcta 19800
ccttctctgc cagatatttg gaaacataca agggttgtag tattcagctg gaaaaaaaaa 19860
aagttcagtg gtataagacc acaggggtcc aggaagtgct tcattttaca taaagcccat 19920
tttactttat gccccttaaa tatgttttgc ctttgtgcat ggccatctgt gccgatgaca 19980
ctgttaccac tagagtacct aaatatgagt gcagtgatca actgtgcgta cacagcttca 20040
gtggatgcaa gtatgatctc tccgatgatc ctgggtccct tcagaggcct ttggatggtt 20100
ctgagcagta gaactcaaac tgtgatccca ggaaggcagc atcagcatca cctagcaact 20160
tgttagaaat gcaaattctt gggccctacc ccagacctac tgaatcagaa actctgggtg 20220
tggagcggca acatggattc taacaaggcg ttcaggtgac tctcatgctc agtgaagttt 20280
gaaaagcctg tgggtaacga gcacagtctc tggaacctgc ctgttgattt gaaggaatcc 20340
cagatcaatc acctcctcac ctgagacttt gaacaagtta tttaatttca gccatgcttc 20400
catttccgtt tctgttaact gggacattaa tagtacttac cttatagagt cgtggaggat 20460
taaatttatt aatacagata gagtacttag aatagttcct gaaaatactg cacaaatatc 20520
aatagtattc catgtaagct acataaaacc tttacttaca gctaaataat agtattttct 20580
ccaaataata aagacaatta ataactacaa gcttcatttg atgctcagaa tgaggttcat 20640
aggctttgtc tcctaataaa gtggaagtgt ggaacttcag cagagacagc caaatgtcag 20700
gccacaggcc agatgcagac tttagacagt ttccaaatag tgctaacatt taaaaatgtt 20760
aaaatatcac agaaatcaaa atttctggtt ccccttgaaa aatcaggacc tcagacaaca 20820
ctactctagg attccctaga gctactggca ggcagagtgg aggagcaacc acctcctttg 20880
aagaagtctc gtctcttgca gtctcacaca aatgggcagt tcagttgcag tcatgtacca 20940
tcttcctcac acctatgaca caggggtttg tgagccctgt ccttctgcaa actctaaggc 21000
ctctaagtgt gtcctctgtg tgcaggacag ggtgacagct gtcccactgg gaaagcaagg 21060
gagttcccaa gacactggtc tttcatgcaa caacagggag agtcccagga aacctgggaa 21120
aaaatggtca ccctatctgt gcagatggtt cccaagtcta caatccaagt gtctctccta 21180
tctggtccct gtttccaagt accatgagaa gcattttttt gtttgtttgt tttttgtttt 21240
ttgcgaatcc cacttttgcc tcaaaacaca ctttccttca cgtttatcat gtgctattca 21300
agcacttcat ggatgaaggc ctcctctata gcaggcacag tcctggacac tggagatgaa 21360
gcaacgaaca aaagagacag aaatctctgc cttcgccagg ttatgttcta gcatggagga 21420
gagagacaat gaataaataa ggcagaggga atgttgaatg gtagtaagtg cctggagaaa 21480
acggaagcaa ggcaggagga cggagagtat cagggaaagc aatgaggtgc ccatcaaagt 21540
cctccctgag aaaagggaca tctgaggaaa gacttgaaga gaatgaacaa ttgagccatg 21600
caaatatctg atgcaacggt atttggggca gaggaaaaca ggacctgggc cttgaggtgg 21660
gcgtgtgcca ggggtttcca agtgatcaag aagagcgggg tatgtggtgg gagggaagtc 21720
agacaggcct tgatgaggtc aaggaaataa tgtccaccac tgagttaaga ccaggctttc 21780
ctctgaatga atcagggagc cattggagag ctccaagcag aggagtcaca gggacctagc 21840
ttacttattt ttctcaaata gccatcgaca tctagttgtt ttgacttgtt attcaaggag 21900
gtcagtccaa ggaaactaga ttccccacct tctataattt cagcatcccc tctcattgaa 21960
gacaggaacc acgtttaaca tcaatgagtc ctgtgggaat aaagactgac agggaaccaa 22020
acagcaaaag ggaagactta cctcagttta tttatgggga tttatatact gcaaactaat 22080
actctatttc actggaatat ttgtgtttat gaagacatcc tgatgaacga gacttttttt 22140
ttcagttcat gaaattttca ccataaaaga accctgaatt cctattttga aatccattgt 22200
gccattttta ttctgcctgt atttgaatat agcatcaata tttaactact cattaaatga 22260
attgtgactt ttatagtgaa aatgtcagtc tttgcagttc attagattca tttaaagcat 22320
agctgcttga tatttttttt ccctggaaga ataaaagaac tgtgaattga agacataaac 22380
tttaaattta agcatgtgtt ttcttcaaaa ttaacattca ggatctgtaa cattattcat 22440
gagattgagg ggctgtttgc atctttctgc atttacttag tgactgtcgt cttttatgga 22500
gtatagagct gtttatcaca gttggatatg accagtggaa tgtcactgtg gacattaaga 22560
tgccataagc tattatgaat ctctacaatt ctgcatgtag tattaaaaac attatcttga 22620
actatggcat cagaaaaaat aaaccctgga agatgtcaaa tttaataact cactgaatcc 22680
aatagggcct aaaagtggtc tatttgagtt ttaaaaaata attctgataa gactttagac 22740
tgcctgaaag aaaatgatat attaaaaatg gaatttgaga aatgaattca aatgaatttt 22800
ttagatgttt gcaattcttt cttcctaaaa ttactatgat ttacatgtat ggagcagtaa 22860
atgcaaatga tttccaatca ccacgggtac gtgtactcaa ttacaaagtc tcttaatgag 22920
cattgaaaag atttcagcat tcactgaaca agacataaag caaatgaact cttcagtgcc 22980
ctccccttcc cacagagggc tgaaagggac tcactcttgt tacaagaaca cggccactcc 23040
tccctctctt cctcttccca gtccatccct caccccagtt tcagccacca tccaaaaaga 23100
aatcgcagca tggcccttga agcacattga gcttaaaagt gcctagaaga taaagcctaa 23160
acttcagcac gacaggcaag acctttcaaa atctggcctc gaccatcctc tctgggtctc 23220
ctttctgaga acccctattt tctgcctttt cacaactcca cacttatgca tgatgctgtt 23280
ttccctccct ggctcaccca ccccagtgtt cttcttctgt gatggtaacc tccccagaaa 23340
gtctcttgag ctagagtgat cattattaaa ttaaaaaaaa aaaaatccta ctttgttcta 23400
ttctgatttc aaaaacctga aaggcaagat atttgaggga aaaaagagaa tattgttttg 23460
ttgcttttta aaaaataaat ttgcaggtcc tgacaatccc gtgctttgtg tgtgctgatc 23520
acactgcaat ctaatcaggt acagtaaata aaatgacttg agaacctttc tgacgaatgc 23580
aaaggctgat gatattttgt gggtggaggg ctattcatgt atcttctttg agtatactaa 23640
agatccattt aattaagttt ggggaggggg gttctctatc ttttcctctg tccttttttc 23700
ctgaagctct cctactggaa agggaatgga agaaaacctt atgtggagtc cggagtgcct 23760
acctaaatta ctaagacaat aaaggacata caaaagaaga taatcaaatg ttactttggg 23820
tacttgaaca cttgctaaga gcatgcatcc tgcagtcagt aacattacca tctatactca 23880
gagggcaaac gctaatttca aatccagagc aatgtcaagg atttatcact gcaacccaaa 23940
gtatctttgc tatcaaagac agtgggggca tgaactacaa aggcaataac taaaaagagg 24000
ggctcatctc acacctctac tcctctccaa tattgggaag tccatttgag ttctagagag 24060
tgcacatgcc aaaatgcaag tgcgtgcatg cctgcgtaca cacacacaca cgcacaccat 24120
tccaacattt tcccatattt tgtccactcc ctctcttcct tgttatgggt agcagcagtg 24180
ataatgcact ttaatggaaa cctgcctaat gaacccaaaa ggaaaacgat taggaaaaaa 24240
atatgcaata catcgcattg aaaggtgccc ataattaaat tacttgttac cgtttttaaa 24300
tagtgcaaat attagtatgc ccacaaagaa ctaaaggttt gtttgtttta atctagatct 24360
tccagaattg gctgttcagg aactgcccat gttgcccaaa gtagctactt tttataagaa 24420
tttcccactg cctttgaaat attctctgac attcccattg gcttaagtat tctcatactt 24480
ttctgcctaa atttgtagtt tcccaagttt aattacccca gaacaatctg gtcatcaata 24540
accaaataaa agaggatggt atttttttcc ctcataaatc tattcatcaa gattcgacca 24600
agcctgcctg gaatgtccag cgaaagcttc aataatcagg gagaaatgag ttgcagaaac 24660
tcaaagagaa cagaatagcc aaggcaggag attacgaagc caggagatga gggcacactg 24720
aattaaacat tcttaagcag acttacatac ataatgaatt ggtcaattct gtccaatgtt 24780
tctgaaagag attacccttc caacaagcca aatgagtgtt caaggatggt agctcggatg 24840
gattcctgaa caaaataagt gttaatcact ttatctcccc caatcttttt tgtgaagaag 24900
agcaactttt catttccata aagccttgaa atcgttggtc ggcaggggat gggggtggtg 24960
ggggagggct ggttagagga tacagacaat gaagtccctg aaaaggggga tttcctgaca 25020
ataaacccct gatcagagcc agagagggga cattgttgtc ttcagcactc ccctctcctt 25080
tgggaattcc aggcgtagta gagagaagag ggtcacagtg acaactgctt gggaaggctc 25140
taaccaggta gtctttgcga ttttctgttt gggaaaagct ggcctacaac aatacatttt 25200
cttggaatgt gttcttttaa acaaattgct acagactttc ttaagacatc ctgtcaattg 25260
ttccaaaaat gtgtaatcag cttatgaaat ctttaagcaa agaacattaa atgttagcat 25320
aaaatctcat aactagttat gtattgagat tctcctacac accaggcaca gtgctgggca 25380
ctaaacacat agcagcgaac aaacgaaaca cagcggtcac tactgtctgg aaatcacagt 25440
taggaaagac aaaactgctt cttaaatctc tgtgcactcc atgccagaca cagtagccat 25500
tccataaata tttgaggaat gaatgaataa aaagacttca gagcttgagg ttcatgtgac 25560
tcaagattta aaaataaaaa aataaaaaag taaaagaaaa gaaaaagcta gcaggtatac 25620
tagaaccaaa cacacaaaat aatgagccag agtgtgctcc cacaatatta ggagaaatgg 25680
aacaagaaat caaaaccctc gacatattgc tcctatttat tattttaata tcatcgttgc 25740
acagaaccag tcattggtgg tgctttaaca attcctccta aatagctttg tgacttagtc 25800
caagcaccca gagacagatg agccccaatt caggcaagtc ccctgttgaa ggacaactat 25860
tttctcaaat gaacaaagat cttctcttct caatccgcca gatcacacag ctttataagt 25920
ttgaaaagtc tttttgctaa cctagaggta ttctctaaca gaaagaggga gatggaaaaa 25980
gaaaacatct gcaaggtgct gaaacacgcg tagattattt tacctgatcc aggagcctcc 26040
ttccctggtg actacctact cctcagaatg agtgctggcc ttcttagcta ttctggggaa 26100
cacaatgatg gaggctcctt ttagctccat caggccctag agaaataact gccctatatt 26160
tagatagatg ccctttgtaa caaaggaata attcatccca gttagcactt tctaaatgac 26220
agaaccagaa agttttcgaa aatattcttc tagctcagtg gctctgaacc aggggacgtt 26280
cggcaatatc taaagacata ttttgttgtc acaactgggg gtgctgctgg catctagtgg 26340
gtagaggcca gggatgctgc taaacctcct atgatacaca ggaaagttcc ccaaaacaaa 26400
gaactattta gcccaaaaca tcaacagtgc tgagatgaag aaatcctgct taagttatac 26460
attaaataaa gaacagcagg gcatctactg gtgaccccag atagttctgt taaaatattc 26520
tgaagtagga ttcttctccc agagtctatg ttcagcaact taaccagatg ttaaaaactg 26580
acccgatctt aggatgttaa caatatttta aaataatact gatggtaatg gtaacattaa 26640
tgaaatgctt ggtatacaga gagttatagt gcatatttac aatgacccta tgttgcaaat 26700
gttattagtg tcctctagaa ggtaactgta ttaatcacat acaataactc tatggagtag 26760
gtgggtttat aaccccctag gaagtgtgtg ctgtgggcaa gacttgatct gttttttttt 26820
tcaccaccat ctgtccagca cccagcagag tgaaatctcc atttcagaaa tgatgatgct 26880
gagaggctca ggaacatgcc agagatcaca gggccaataa atggtggaac cccagttcaa 26940
accgggcaga ctgcctggtt ccctagcctc tctctctcgc accgtgccag ccggccaact 27000
gcttcatatg tggagtcatt gaaacctatt agacctcttg agtctaacct tagataagca 27060
gaaccaacct aagggggaag gaattaggct gctttccaaa gttaccaaaa gtttcccaat 27120
attcaagaga ctgattaaac aaaccagtga ccccaagaca atggtgaagt acatttgtat 27180
tgccatgaga cacttgaaag caatctaaga gggtggctgg ttttataaga ggttaactgc 27240
ttctcagttt gagcaagact catgtggcac caggcactag gcaccgggca ggcttcctga 27300
agctaaaatg gccactttct caaaggacaa atgccctgca tgagtgcaga aactctttgc 27360
aaccactagg gagctaactc agggatcatg ggatttacat gtggaccaga caacaacttg 27420
gccaccagtc caatggatcc ccagtgccaa gttaacctta gcacagtctt cgggtaaaat 27480
ctagatcaat gctgattatg tcaggaggtc aactttcagg aattaatact ttttgaatga 27540
taagagagtg caaacattaa tttaaagtct cagagagtat actaattttc ctgttttcat 27600
catttcagta gattctataa ttctaggggg aaatatccca taagaaataa attctagcaa 27660
gtactgtaaa taaagaattg tatccacctt tataaaaaga ctaaaagaag aagagataag 27720
agcttgtttt ttagttttac aatattgaca tagtaggctt tatttttttt taaatgtgga 27780
aatttccctt ttagaacgat aagaatacta gcctggacac tatacaaaca tagtcattgt 27840
acttataagt gctttaagta tttattcata gcctgccttt ctctacaaag gaagtgaggt 27900
gacttttaaa agcatatgtg atttttaaaa ggtaagtaac aggtgaatca aagcaaggaa 27960
aaagtaaatt tgagaaaata ataaagccta gatggccagc acacaggaat gcatatccta 28020
ctgccctaga cagctactaa atgggtttcc tgtttgactc caagcttctt ggccatcaat 28080
gcaaagaaag aacaagaatg gtaagattaa tgcccagtaa gatacagcga agtggatttt 28140
tttcagttct tcttgatata gtaacctaag aagattctct gtaaatcatc atttaaaaag 28200
acaccatgag gtgtaatgag ctatacattg taaatagaac tttttaaaaa aaatgatgtt 28260
cacgaaacta ttactcataa tcctctcaat acaaagtgaa gccttaatca gtgtgcaatt 28320
caataaagca gagagggcct gtgaaggcaa ctgtgaagtg gggtgccaca taatatgcca 28380
tcgtgagcat tcagctctct cacaagtctg gcagaaatct cttatcaaat taggttatct 28440
ggatgaacgg aaggaagcaa ggcatcttct tcatgccatt ctccttagat atattatttc 28500
ttccaacaga ttttattaac acaaactggg cagcagggac ttcaagaagg acaaaaatcc 28560
tgtgtcaaaa ccattacata tgttggcaac atttatcatc aggaaaagcg tcccaggaag 28620
ttgaattcta atgtatgtgt ggtgttacaa tggaaatttt agtgtgcaac tggaatcagg 28680
ccatgagttt tgcctgtcat caaatgtatc tgttaactta gggttgaact gccccccacc 28740
ccactttttt tttttttgag acagtgtctc actctcttgc ccaggctaaa gtgcagtgcc 28800
atgatctcaa cccactgcaa cctccgcctc ccaggttcaa gcaattctcc ggcctcaatc 28860
tcccgagtag ctgggattac aggtgcctgc caccacgccc ggctactttt tatatttgta 28920
gtagagacgg ggtttcacca tgttggtcat ggttggccag gatggtctgg aactcctgac 28980
ctcaggtgat atgccctgcc tcggcctccc aaagtgttgg gaatgtaggc gtgagccacc 29040
atgcctggcc cctctttttt ttttttcttt tttttctaac tacacccttc tctttttcct 29100
ctctacaact gaatggtctt tctccctgat ataagaatct tctagatcac tcccatccat 29160
tgcattcttc ttggtcttct gttatcactc ttcttactca tcttactagc ttttaacttg 29220
actacgtttt cctttacttg gtttctgcct tggacttcca caagcttcac cctaataatc 29280
atgcagcctt gaaaaacatg gaggaaggaa aatgctgtca cctgccatct tgtacctgtt 29340
taaagctcca ctgttttcag tgtttaaact atgaagaaag gctccgatga tttaagctgt 29400
atagtcaaaa ctacagtgtc ttctaggaat ctaggattga gacaagatgt aaaaagagga 29460
acatgtaata tattatttta ccccactggc aattagaaat cgttagccaa agccaggatt 29520
ggggaggata ttcgaaaagt tattaatgca gacagagcaa ggcttttatg ccaccaagaa 29580
agttatttat tataaacaat gggttttgag tcacatggac aatagctatt ttaaaaacaa 29640
cgaatatatc caggaaaggt gcaaaaatat aaaggcaggc aatcctagtt tgtggtgctg 29700
atctattacc actgcaatga ctgtcaatag tgaccctgag cagaactcaa acagttaaga 29760
aaactcacca cctgttttcc aaggaatttt atttttgctt aaggtggtaa gtttgatact 29820
aaatacggag ggtgttcaat gtcaagttga ggacatagca atttaccctg caggccagtg 29880
ttcctagtgt ctactattca tattagatta acttaagtgg tgtataaaaa actttttaaa 29940
agtttaatag ctatgcattt attgtatggg taatctttac acattgcaag caatacaggg 30000
tcgccatatg caatggtgat acaaattaaa aagtgggtca atgtaaaaaa ttataaataa 30060
tagcagtgat aggtagatac agcagaaatg aatgtggcaa atctgcgaac acattgcaag 30120
acactggaag tgttcagaag gaaaatggta gctgtctaag ctatccttta gaagattaaa 30180
ccagaagtaa agcatagatt ccattgaagg tgagaaaaga tgacaagcag ggagagaggc 30240
ctgggctagg atactgatgg ctgaaagaaa agaaaaagat tatcagaagc ataataaaga 30300
agacatgaag actccctgga ctaagggaat gaaagaagcc aagtaatcta aattaatttt 30360
gaagttttgc acctggaaat acggcactga aaaaaacaga aattcaaagg ggagtttggg 30420
gggcagtggg gatacaggtt gccctctggc ttatgctgga tttgaactga cggcagacag 30480
ggaagcggtc atagcctgga gagagccact atgcaggaga tgagaaatgt agatcacagt 30540
agagatgagg atttgagacc ctggggtaaa ttgcaaaaat ggccacaatt ctccacacct 30600
ctgtctatcc atgcccttct gtaatgtaat tttgtggctc ctcccatcaa gaaatggatt 30660
ctgcgtcctc tcccctagaa cctgggctgg cccagtgact tgctttagcc agtagaatgt 30720
agtagaagga acagtgtgcc atttctgggc ctggactcaa gggttcttgt gtactttcct 30780
gctgtccgaa atactgccat catgaacaag cccaggctgg cgtgctggag gtgaaagata 30840
catgccagag aactgaggga ccccggtgga cagccagcca acctcctgaa gcaaaccctc 30900
cctgccaatc tgcagttgac tgcaaacaca taagagaccc agaataggat aagcactgcc 30960
cttctgagcc caacctaaat tgctgacatg cagaatcaga aacaaaatat gtgtttttga 31020
agtcacaaag tttagaggcg gtttatcact cgcgatagat aactggtaca gacaacacgg 31080
gtctgcctag aaagtgaaaa acatacgaag gcaaaacagt aagaggtcaa gctttaggag 31140
gatattccca attcctagga agaaggggga aagctgtaga caagacaaca gggcaatggc 31200
aatcagaaac attcaagtat ataatatcag ggaaccagga acatgggggc aggggacaca 31260
gaggataaaa gtgggggtag gagaagtcaa ggactcatca gggaagtata gcactgggct 31320
tagcagagaa tctgcctaga gaaggcactg gtatttttgc atgaatgatt gaagtttgat 31380
ctgtcaaggc agagctcgct ggagaagagt gagaagacag tgtcagtaac gtaacaagga 31440
atagaagtgg tctatggagt gttaaggagg gcctgggtgg gaaagatatg gaaccctagg 31500
taaagattac ttgtttgaag aatcattcag agagatgttg aagacgaggt caacagagtt 31560
ggacaaaagt gtaaatgtga atggtccttt ctctaggacc ctacaatcac aagtgtggct 31620
gggaccatcc atgccagcat cacttgggaa tttgttagca atgcccactc tcaggcccac 31680
cccagaccca ctacctgtct tttatccaca tccccatgtg ccattcaagt ttgagaagct 31740
ctgctctagg aagtacaaag acaaggaact gaagagcatt taatgacatc ttgagaaagt 31800
cattctgttt tgaattccct ttcaatcccc cagataaaat aacacaaagt cttgccttgg 31860
tactaagcca tcttcgacac ctccctaaca cttgcaaatc tcccttttca acagagttca 31920
acagagagca gagccttagg caagcaaggt ctccagtgag atttgaaaaa cactgtttac 31980
accccttttg tgtttatttt taggattttc ttttatgtgt ggaaagcaat caggttttcc 32040
atttgcagta gtcttaattt cacattaatt tatttaagag aaaaaaagag gtaaataaaa 32100
atatgtagca tataataatg tggatgcaaa tgagaagaca gcaaaagttg ttacaagtga 32160
ggtggcactc aaagcgaaga ctggaaaatc tatagtggaa gtcagaagac atctgggcac 32220
atttgaaggt agaaaggcaa gagacaggaa agatgggagc tgtttgcaga acaaagaata 32280
ttcaacaggc aggaaggact gttggaagga tttatcccag agtagaagct gccctctctg 32340
ggcctggaag aaagaaagat ctggtccctg aatgggtgag gatgacaaat cagagatcta 32400
aggcagataa tatcaaattc ttcataagta aaagattgga ggtcccctct aaaatgaggg 32460
taggttggtt tgactgggac tgcaaaagag tatgaaagac ttggaatatc cattgtggac 32520
aatgaccaag agaacaaaca gatgaaaagg attccgcagc aaaggcccag ggacagtcag 32580
gcagcattaa tttttagtaa ggaaaatgga cacagtttat cccaaagctg agaaatgaaa 32640
ctctaaggct gacacaaaaa atacaacagc aaagaaaggg ggcagaggag attaggtagt 32700
agtggcaagc atagctgaca agtcctcata gtcaaggtta catacaaagt caaaggttgg 32760
ctaggtgcag tggctcatgt ctgtaattcc aactctttgc agggccatgg cgagaggatc 32820
acttgaggcc aggagttcaa gaccagtctg gtcaacatag tgagacccca tctctacaaa 32880
aatattaaaa attagctggg tatggggtgt gcacttgcag tcctagctac tcaggaagct 32940
aaatcaggag gtttgcttga acccaggagt ttgaggctgc agtggctatg atcacaccac 33000
tgcactccag ccggggcaac acaacaagac cctgactctt aaaaaaaaca aaaaagagtt 33060
aatggaaaag gccagtagac tggactctgg gaacaagatt ctcagtggat atagggatat 33120
aagaagtgag aaataaacta ggtttgatca aaaaggaaaa acatcatgtt tttaaaaaac 33180
tggtttttaa aatgtcaact aaatattaac tagtgttcaa aattttgtta ccaagagttg 33240
ggacttgata aatggcacta caaaaactca ggaaaaattt tgaaaagaag agaaatttgg 33300
gcctaaaatg caggtaatca attaaaatta ggacataatg atgtgtggtt cttgcaaaga 33360
acataaatca ctgggtattt taagtgtgcc caaaataaaa tcccaaaact gaagaaaggc 33420
ctgaaaagat ataaatctta ttacagtgtg tctctctcac caaaagagga tcatccaaga 33480
agcacataaa aactaaaact ttgaagttta ggaaaaacaa gaacactaca gagtatacat 33540
aaaatttcaa acttggagat acccaagaag ggtttctcag acctcaccca tcgctcactc 33600
acacacagca cacttgctga actacctggt gtcccttcct ctccactcac tccttccaca 33660
gtaattgaga gtttcactgg gcacatggcc agccacaata taaagtacat ttcctgagta 33720
cccaagtgtg gccatgtgat gaaggctagc cagtgagata taagcaaagt ggcatgtggc 33780
agcttctgga aacctccgtt tgcccttgat ccccttcaat ccccttcgtc cttcttgctg 33840
gtcaaaccat ggaggttgac tagaggtcaa ccttgagcca taaggataag ggtcacagga 33900
tagctagagg cagcttggct cttcagtgtt taagaagcct ccatactagc cttggactac 33960
ttccctctag atttggttag ggaaacaaga aatgagtatc tacttcattt aagacgttgc 34020
tgttcaagat tttttctatt acatgtaagt tgaaccctaa tgtaccctct ttgctattat 34080
gggggcctcc tattccttga ccatttcttc aatggcctga atagttggat taaaagcagt 34140
cacttcaata ccacatttcc ctcaactcct gttctctcat ccctgcctag gcaaaatcca 34200
ccaccaagtc agcttcataa tcattgttct cttcctgcca ccaacacatc aaatactgat 34260
aaaaaaaatt aaaaataaaa tgtaaactta aacacttcta atagggatca tcacaactgt 34320
agtccaactc cttgaaaatg gacaagtgac ttcactgctg cattcctatt gcctagaagt 34380
gtctgaccca tactatgtca acacatattc actcaaatac taaactacaa ccagatcttc 34440
tgctcaacag tatttttatt catctctagt tcacttctta ccacatttta tgtgccaggc 34500
acttctctaa atgtgagatg taccatgtgc atcaaagtaa atacaccccc tatcctcatg 34560
aagtttacat ttcagtggaa agagatcaac aagagcagat gaataaatga ataatcaaga 34620
aattcaaata gggtacatgc tatgaacaaa attatgaagg tagagagata ttaattagag 34680
agatggggaa aaggatattt tagaaattga gattttttta atggtcagga catacttgaa 34740
ggtgatatct gggctcagac ataggtgctg agaagaggcc agccaagtga agacatttgg 34800
ggagagggct ctagacagag agaatatcaa gttcaaaaag atgggatgaa ggctggtacc 34860
gttaaaacac ataaagcgag ggtagagggg aggagtggta agaaaatgag gtaggaaaag 34920
tacacaggga tagatctcag gcttgtcaat caattcccat gcccatacat attgttctct 34980
ctctctctcc tctcttcccc aacatctttt ctactgaaat agatatacac tatatatata 35040
tatatatata tatatatata tatatatata tatatatata catgtgtata tatagaacaa 35100
gatatatttc tcactctata tccatacagc cactgagaat cttattccca tagtccaatc 35160
cactggccct tttccttaac tcttgacatt tttaagagtc aaggtcttgc tgtgtttccc 35220
aggctggaag tgcagtggtg tgtgtgtctg tgtgtgtgtg tgtgtacata tatatgtata 35280
tatacacatg tgtgcacata tttacatatt ttatatatat atgaatcttc agccatcttc 35340
cctttctttc ctattatcac aaagaaatag ttaccaaggc ttcatttaag ggctaactct 35400
cctttatcta cagtgttcgt tccaacagca actgaccacc caatccatca ttcaatagct 35460
ctctcactct ctctctaatc tcttcttcaa acatgttcag acattgtctt gaaaatatct 35520
tctcattagc cccacttcaa aatgtcaccc tctacctata cacacatata tgtatgtaaa 35580
cacatacata tgcaaatgta ccgagacaca cacatacaca gtttactagt acctactcaa 35640
tacaacctag gatctttcac cagacattct agtgtctcca cagtttgttc tcaaccaacc 35700
acatctccca ccatggaaag agaaaatctc atatccatag aatatccagg tgacctatag 35760
gtttcttgaa ggcagaccac atccaatctc agcctcaaca agaagggcgt tcctaatata 35820
aacaatattt atgatattta cattacataa gcacaggctc attttggttt ccacaaagaa 35880
taataataaa catagacaat ggaaatcctc agaaatcttc aaaatcatca agcttcactc 35940
cagttagccg tttcaatgga ctttgctttc ctatcctaca cccacattct ctcattgtga 36000
catcagcact ttgtttttcc tccaaagaac cactgctcca tactcttagc tcctgtggct 36060
tccaagaaga tgacagtgtc cagctccccc actggtatgc ctacgtggct acgagcctgg 36120
gcatgggacc caagtctatc caatgagact tgatccagaa aagctgctga aacatgcaag 36180
aaagaatctc tccctcttga agaggctgag ctgtgagaat gtaacttgga gctgctgctg 36240
gacaacttcc cactacttga gtacagcctg gctgatatga taaaaaaaaa aaaaaaaaaa 36300
aaagaaagaa aaagaaaaaa acagatgaaa gcagagctaa tataagaaag tcttgatagc 36360
atcccttgag actctagatc cagctatgcc tgaaacaaaa cttacaatcc cttttctatt 36420
taactcagtt tgactgaagt ctttttctca cttgcaacca aagcattttt actaaaacaa 36480
tcattttaac cacttttcca ttaaacattt ttattagaat ttttaaataa gtcaaataat 36540
aagggttgaa tctctcatta aagataagtt ggcatcaagg agcagcacga tggatctacc 36600
gagtatattt tattaactgt ttgatatttc tagatttaac tcatcccctt ttgaagaaga 36660
tcaacttcca accaatcata catatttaat aaaagttttc tagtcaggtc agcattttga 36720
acttctactt cctacaccta ggagattttt taaagaaact gtagaatttt tattattcta 36780
cagtaaatcc cttgcttatt acaaattagc tgtagaaatt gctggaaaaa atctcacaat 36840
ttggtacagt tatactacat ccatttaaaa taaattgaat tttaaaactc actcttatca 36900
ccatctttga cataattctt ctgcataaac aatttagtca atgtagataa ggctacatta 36960
aatttgcaac atttggaata gaaggaccca gcttaaaacc tcactccccc aaaagaatga 37020
gtatatatca ttcaaatatg aatttagagt aaaaactcaa atgtgtcttc atattagccc 37080
atttgtctat cttcaaattc ttcttttaca aacaaagcaa aattgaatta agattaaaga 37140
tagaatgtta atcatacaag aagggccatt ttccagggcc tggcatgttt tacacaagca 37200
tgaaacatat ttaagagaac atggcctccc tgaggaagag attaaggata caaacctagg 37260
aaacaaagaa aataaaacga tctacctcaa agggataaga ttaacctgtg agaagctcat 37320
gcggacctta aataaaagcc tctactcctt atatttttaa acaggatttt tctttttttt 37380
ttagagcact aattccacct tcaaaatata tttgagtttg taagtatact caacaaaaat 37440
cctgtccttt cttattaacc atactcaaaa cagattctct aaaatagtta tgacaccatt 37500
aacatttcat gaaatccaaa acaaatgtgt cttccaaaaa aataaatgtt ttcattcata 37560
aatggctaat atggttttaa attatgttat cacaaatttt gcatcattcc cccttaataa 37620
ccatttaaga atgtttcctt ccaaatagct attaagagag aaaggatgtt tcatcatgca 37680
tacacacaca taaacacaca ctccttgttt atgtcattgt ttttaatggt gcagtaggat 37740
ttccaaattc ttcaagtttc acacattcaa gaatgtttcc ttccaaataa ctattaagag 37800
agaaaggatg tttcatcatg caaacacaca cataagcaca cattccttgt ttatgtcatt 37860
gtttttaaca gtgcagtagg atttccaaat tctctgtttc acatgttact tcctaaatta 37920
ctgcctcact gactgggaag ttgaattggc aacaccagcc aatcctcagg tccaaggatg 37980
ttgtccttgc atttcctgtc tccttcctct tgaaggactc aaattcattt cattcatctg 38040
ctttactaca aacagaaaga ctccatcttt ggttgttcag ccccaaactc tctcttgagt 38100
tccagtgcat gactctgtga gaatatacca ctgaaatatc caaaatgagc ttgatctggt 38160
tatctttcct caaaaccagc ttctcctctc tccgctctgc ttccactcaa ggtcttacca 38220
ttcgtccagg ccccaaattc aaacaccctc aatcgtttct gcttcctctt tctgccttcc 38280
agtcgggagg ttctgtttag tgctttcttt tcttttgcat ccaaattcac atctccttga 38340
ttcaaatcct tcccatacct tacctcaact gggtgatggc atcctactcc cggtctctcc 38400
tactcttgcc ggggcctaca ccattctact caaaaggtca gatcaatctt tacaaaagta 38460
aaactctaac caatccaccg gtccacttaa aatttttcag gctgggcgca gtggttcaca 38520
cctgtaatct cagcactttg ggaggtcaaa ggcaggagga tcactggcgg ccaagagttc 38580
aagaccaacc ctggtgacac agcaagaccc tatctctgca aaaaataaaa tgaaaaagtt 38640
agccaagcat agcgaacaca cacctgtggt cccagctact caggaggcct gagtagctgg 38700
gaccacaggt atgtgtgcat ctcttgagcc tgggaaattg agactacaat aagccatggt 38760
cactgcactc aagcctgggt gacacagcaa gactccatct caaaaaatat ttatgtgtat 38820
atatatattc ctcgaatgca ctcagttgca gacaccgttg actttccaac agccttcttc 38880
cttgctaaca gagcataaca ctaattaatt atgctcacgt agcaatgccc agcctcaagg 38940
gatattggat tggtctaaac tgatcaaagt aatcttcctc tttgctagtg agtagcctag 39000
ggttggtacg caacccattt ctgaccaata agataaaaga gacggtctag tggaaaagct 39060
tttccttctt gccaagagat gtacaggaag agaaagtact catttgtgac cactcccacc 39120
accatcacct tgcttcttat tttgtgtgtt ttcatgtgac gatgtgacac ccagagctac 39180
agcagccaac ttgtagccat gggaagactg ataaaactcc aaggatagca gaataaaaag 39240
aaaatcaaag aagggctctt caagacatga ttgaaccatc caaaacaacc tggcactgcc 39300
aacccaaaga cttctttgaa ggtaaacaag tgtcttttat ggtttatgcc accatttgtt 39360
gagttttctg ttctctgcag cccaaagcac tctaactgat aaacttagaa agagcaaact 39420
cttgacctta gaaggccctc tgcttgatgt gctactcaaa gtgtagtcta cagacccaca 39480
accttagcat tgcctgggag cccagccctg ggcccatgaa tcagaatctc caagggtaaa 39540
gtccaaaagc ctgtgttata acaagctccc aggtggttct tgtgcatggt aaagtttgag 39600
aaacactgcc ctacaaaatg atcacaaatt attttttacc atctcagcta ctaccgtaca 39660
tagcatgaga tgcacttgat ctgcaatttg tctggtggca gtaacctttc cgggtttgag 39720
catcatttgt tgctccttta gtttcttctc ctcttaatca aaatcttcaa acttgaagcc 39780
ttcaggtcct gagaggatta caaaggtctg aatatgagac aggctgtgaa acaggccgtg 39840
atgaactatg gggtacaggc acatctgaag gacaccgagc agatgttgcc atacaaggat 39900
attggttcag tgttgccaga tgtctaaaga aaagctggaa tccagattta tatgcaaagt 39960
tttttagata tagacaacca agcctttttt aatactctgc agattaaaca aattttcaag 40020
tggattcaca tccagctgag tttgtgacat gaagtagatt ccttgaaata tcgacacata 40080
ctttgaaaac tgtgaccacc tacatgcatt gacttcattt gaaatgacta aaattaattt 40140
tctttggcta actatatgct agtctctact gagcacaggg tcttcatcag tagcccagca 40200
tctggagtgg tcaaatagtt tgtggacctc tagttaggag cagcaggact gttttatcca 40260
ttagtcacta tacaccacac acttagaact gcaagcttct catgggccca caacaatgtt 40320
taaaatgtga gaaaaaaata aactggccac acatcaccag aaaactacaa aattacaact 40380
aatagatgtg aagctaaata tttacaaaat gtaaactaag tcaacggatc catatcaact 40440
cagatatggt atcatatcac attagattaa atgcaggatg tggatgcatt ttaatgtttg 40500
atggggcatg gaagggagct cagatcaata gtgcttagag ctgccaaggt tctaaaaagg 40560
ccctgggtac caacctgaag ccaaccattc tgtggtaagt ctggtcttca caggtgtcac 40620
aaatttcttt acgcagctct actccattct attgaactgt ctacatagtt ggacatggga 40680
gcagaactgt ccacatagtt gcatgtaaac cataaatgac ttattaaaaa gttatgtttg 40740
gatcctcatc tacatatgaa tttaagacaa gaagtacaag aatcagcaca caagcaagtt 40800
ttgagggtcc cacataatga ttttaattat tttttgttaa tttattccaa catttaaaat 40860
tcatgataat tcacataaaa acccagatta tcatcctctt gaaaaaagaa ttgtaaagta 40920
tagagatatt ggacccaaat gttggcatgg caacactcta ctaatgctga cgaaggctat 40980
ccctttaaat ggggtatgtt ctctacttgg ccgcaaaccc tgtctccatg taggctaact 41040
tgctgtccca agagacaatt gagtttatgc cccctagttt aaggctctta ggaaaacctt 41100
atttcttttt cacaatgtgg cttcaatatc ttacgtgaag acctgtcgtg ataggataca 41160
ggaatctctc aatctaagaa gagtttcaat caaattcccc ccaatatgtt ctcaatttga 41220
accatgatcc ccaagaagat tgacaaatga caaattaccc tgcagtttct tttgcccttc 41280
aagctagcca aggcagaagc ccaatcaggt ggagtcaaag cactaatata agaatgtctt 41340
aattaatcaa agtgatcaat aaataataca cataataatt agaaagcaaa gtctgggact 41400
gatagaataa aaacaacata gcactaatct aagtaagggt gagaggtcaa tagccataat 41460
tcaaaaggaa aagccctaaa aatatgcaga aatagctagt aactggagtt tagtccaagt 41520
ttgttaacaa cccactgtat gatttcacct cacacccaca ttaaacacag tatcttattt 41580
tgggatggca gaattctgac aactacaggt tgagtatccc ttatctgaaa tgcttagatc 41640
tagaagtttc agatttaggg gttctttgga ttttggaata tttgcattat acttaccagt 41700
tcagcatccc taatccaaaa atctgaaatc cgaaatgttc caatgagcat ttcctttgac 41760
tgtcacatca gtgctctaaa aagttttgga ttttggagta tgttggattt cagattagtg 41820
ctaaattata tttgctaatt gatattctgt gtattgtttt cttactggtg aaaagacaaa 41880
ttgaactcag gaaagaaaaa ttacaaatat atagtcaaag agtcaccaga tcatttgagc 41940
aacataatga gtttttattt cttaatatac agggtttaat ttgttaacca caccagaaaa 42000
agaaatgttc aaacagtcga ctttctactt gaaattaaaa tggaaattag cccttaggaa 42060
acagtgatga ctttaagttt atacatcagt ggctggttca tgaattatta actgatttta 42120
atgatcctgg ctatatttta tttgaagtta ttctcctact tgcaacgact tttgaaccca 42180
caaaactctt tcatccattc tccacagaca cagtacactt tcatgagcac tgacatttga 42240
aaaggatcca tatactcaca gaatgtaaag ataatacaca tgcatataat tgatacaaag 42300
gactctggtc atttgttaaa gagagtaatg aatgaaaccc tattattcac ggtttgtaaa 42360
taaatttaaa gataagcgct aactttcact tgttaagcct agagccaaga gttcggtgtt 42420
tcttctaaag tttcccagat ggtcattaaa acaagagagg gaagaaacat actttctttg 42480
aaatccatca tttcccatcc agaaagataa tacatgtcat caaaagttaa gtctttagag 42540
attaattaat aatgtgagta ttttcaaata aaataaatgc atgtctttat atgctagttt 42600
ttacattttc agtataaacc tatattgaac agcaccactt cagacacaca aattagctgt 42660
gaaacaaaat gctataaacc tttaattagc acttgctgct ttatacccat aaagttaata 42720
cttcctcttc tactatattc tctgtaaagg aaaattatgg gaaataaaat tgtgtttttc 42780
acttccgaaa ataaaagtag caaaatatag tattgtggct cagtttaaag atagttatat 42840
ttttacttgc aaggaagtca atacaaagat cccttacaat aagtataatt tgattcctac 42900
caatattaag cgctatgtct aactttcata acttgggtac acagagcact gatgacgatc 42960
agattgctaa ataagtaaga aagcaagtta tttcaggcaa atagctgcat taagaaaata 43020
cgacagtaag ccaacttgta tccacactcc tgaagctgaa caagcatctc aataaataat 43080
gtctgttttc aagctttata taccctccct gaaataaatg ttctgagctt aaatagactc 43140
aaaatagcct ttctcagaaa ataaaaaaga gacacacaca aaacaccccc aatttcctct 43200
ggtcccttga agtacccttg ggatcccagt gaacagagat ttgccacgca ttgcagtgac 43260
tgcatttgta caataggttt ctattttggt gtcattcgag tgttgcagat cttaaatcag 43320
agaaagaagg agttacatta ggcaaggtaa tggcttccaa aaataagagc atgcccagtt 43380
tatacaaggc ttgcatccac atgctaagtt gtaaggagat aaataatacc ccactggaac 43440
aattaggtag attctcagaa acactacata cttaattagg ctgcctaagt cccttactga 43500
gcatacatgg gggacttttt aaagcattta ataacctgag taaatccaaa atcagaggac 43560
acaaactaat ccttaactct ggctccagcg atcggccttt tcttgcctct ctataaatgc 43620
ttagcgtagc ccttagaatt cggagagcag gaacgctcca accaccaaag ggttaaagca 43680
cacggaataa agtcccctcg atctatattt tttgggaggc ccctctgtgc cagacgctga 43740
gctgggcgat gatgacacgc gagggcgagc aagagagacc ctaatggtct tttacaaact 43800
tcagcactag agttgggaac gcagtataaa caaatagaaa ggaacacgag cctccatcag 43860
ccacggggca cagcaaactg ttcctcactc tagatgcaat tcctcctctt cctgttattt 43920
attcattagt tttgtttagc acctttcttt cagcaggctc cttatttcct cctgttatcc 43980
aagcaatcac aaacaaacta cgatttgaaa gaaaaagaga gggaggaggg aggagcagga 44040
ggaaggggaa agaaaaccac attcaaaagg cacaggccat tcagagcccg gctgtttctc 44100
tgaatctcgc cctcagggtg atgttttcga caaattcggc gctgggggct tcagggagga 44160
cagaggacac cggatggtgg gggggaattc cgcgcggccc gggtaccagg gctgcgactc 44220
tcgcccgcct cgctgctccg agcgacgccc gctgcccttc tgaggtccac ctcgccacct 44280
ggaacgctcg gtcctcgaag ttggcgcagg gggaggtgga gaaggtggag tgaccccagg 44340
gtgtggtgtg gaggtctcca atcccgatct ccccgaaatg caaaacttag cccccccaaa 44400
aaaatgagag gaaagaagcc acttactcta agcggggagg ggcgggcacc ccggttccga 44460
ggtccaaagt gccctaacga aagggcagca aaggccacct gcggggtccc accacttccc 44520
cccactcccc tgtccaggca tactcaaaag tttgttcctt tccgtccgta agcggccccg 44580
aggccggctc tggagtaggt gggggaggta agaaggactg ggggtggggg agggcaagat 44640
catcggacca ggagatcagg gacccctgcg tagcccccac tcagtccagg ggggctgcga 44700
tcgtgtttac taataacagc aacaaacaat cacacgccag cccttctttc agtcctcggg 44760
ctctcttcgc tttttggggg cagcaaagga gagtctggcg gggaggtggg agggagcgga 44820
ggggctgagg agagcgccgg ctgggggaca aaaagcggcg tgggatgggg cagaaagaga 44880
agcggggaga gctggacaga gacgaaggct caaaggtaga agagacatgg gaggaaagag 44940
gccaaagaaa agtgcagcag gcggtgagcc cgagcgcggg gcgcgcccag gatggggagg 45000
tggcccccgc cccccggccc accggcccag cccggtcacc ttgctgtagc cgtagtaccc 45060
caggcactgc gcgaagtcca ggctggcagg gtccccggcc gccgcggggt agaacctcac 45120
atccatgccg aagctgggcc cggggccggg ggccgggact ggggttcgcc ggggccggga 45180
cccgcctcct cgccgccgct agatccaccg tcgagggcgc ccgggggtgg cgcgtgggac 45240
tcgcggccgg aggggcgccg ggacccagag cccgaggagc tcgggagccg cggccgccgc 45300
acacaaaggc gcggccacgc gagccgcggg agagcgggag gcggccgggg ggacgcgccc 45360
cgccggggca ccgaggcagc gctgcgcgcg ggccgggcgc cgggggcgcg gggcgcggcg 45420
ctggggcccg ggtcggcgag gcgagttcag gtgcgctggg cgaggctggg acggcggcgg 45480
cggcggcggc tggccccgct cctcctcctc ctccccgggc ggactgagga gacgagccgc 45540
ggagacaagg ggcccggccc ctcccctcct tctccccctc ctgcctcagc cgccggtccc 45600
ctccccgcgc cgccgccgct ccgcccctcc caccgcgggc agctggcgcg ccgcccgccc 45660
cgccggtgcg ctcctcggcc cggaccgcct ccgggagcgc ccaccccgcc ccgccggccc 45720
catcaccccc gccgcggccg ccccctctcc ggggcccctc ttctccctac ctcgcccccc 45780
ttcccgctcc ggtcctcttt gtccccactg cctcggagcg ctcctctctc ccctcctttc 45840
ctcggccgaa gcggacgcca gccctgcgtc ccgtgtgtcc caccctcctc ctgcgcgacc 45900
acagcttccc cgggccccag catccccaag ccgtctgctc ccttcctgtc gctttcctcc 45960
ccatgacccc cttccttctt catgggtgcc tgtccccggg cccctctcct cgaccccgcc 46020
ttgcctttcg aatgtcccct gcgtggacac acctaaccca gacgccaacc tgcacgagtg 46080
tctcccggta gccgggagcc gggaccccaa gttcacctgt aggatttccc agaaggggtg 46140
ttggggcctg acctttcaca ggtaggcaga cttgaagctt cccaggtgaa gcctcgtgtc 46200
ggttctcttc gtattctctt tgctcttgtt tgtattcgaa aggcatttga gtaactggat 46260
ctaggcagat cattcactgc tctgggagag aaaatgtccc tattttccta aaaggtccta 46320
gctgattaac ttccccactc tacactcacc cacccctctt tatttcttta tctttcttaa 46380
gctccatctt tttatttaat tttttttctc atcggcttta ttgctttgag ttaatctgag 46440
agtttggcct tcagccttgg cgaagggaag gggctttata ctaaatggga acgttgtgga 46500
gaggccgtga gatctgcgcc ctccccagtt tagttatctg ccagctactt taaccagagt 46560
ggcgacattc tgaaatattt cctatgacac tcgctaacag tttcatcccc tggtcacacc 46620
ttgctggccc agggcctgag ctttttcaga caagcatgac atgggttttc ttttcatttc 46680
ttctgttctc cagagtagat cgggcttgtg acacctgtgt gtgtaccttc actcaatatt 46740
atctttctgg aacggagcag aaaaaaataa acttcaatta ggtgaaagtt tgtgtatttg 46800
ctcttctctt agcaaaaact tgggtcagga gactactgca tgagagagca gtgtgtgttg 46860
agaaaagaaa caactgccca cgttgtccct gggttgactc tgatccccac cctcccgaaa 46920
aagctttggt ttcccctccc tagtctccat ttaacgttga caacccagcg gtgctcccta 46980
atggcccagc aggttgcaca aattgacagt gagctgagat attatcagga caacacccca 47040
ttgagcaagt tcttgaaacg cagaagtgga ggccctttct ctgggccact gggcgcctgt 47100
ggcctttcca ccaatcagag ctggaggttg cagtggccac ctgttgtctc gcaagagaac 47160
atcttttaag tttcgctatt agtatttaac aatggcctac agagcaggat ctggccacag 47220
gagaggagca gtgtgatgat ctggggtacc aaaaaagaat tttttaaaaa aaaaatttta 47280
cagatagctc ttacaaggag ccaaaactct ggaaagctaa gtttttcttt gcacactcac 47340
aatcctcacc ttctgctcat tctgttttgc atctgaagca atctgagctt gattaaagga 47400
tgaagaaaag tataatcaaa gttacagaga ctaaacctga acttgtaatc agacttcgag 47460
gatcaggaat ataaatacgc ttcgcagtgg aaacccgcta gctgcaagaa tgggaattgc 47520
aagtgggctg atgtactgca ttcagctttg ggcggtagag cctagaaaat gaagcgagaa 47580
ctttacccct aaggctctca ggagttagga atgctcggtg acaatcccta actcctggcc 47640
attgttttgg aaaagtcttt ctcttaaatt tcccttccct gttaggatgc aaataccttt 47700
gtgaagggaa caatactcat ctgtctgcat tttattattt gatttaggat ataaggtaag 47760
caaaagatct gagtttagat tttgatttag agggagggga agaatccggg tgatgagctg 47820
aagatgtgta tgttgaggca tttagaatga gaaaatcact ggaacagaaa aagggcattg 47880
gtgaaggctg ctgacttgac gatttagccc aatctccacg catttggcag ctatctttat 47940
ttattgtttt tttttttttt ttttttttga gtacctacca tgtgccagac atgattttag 48000
gcacttgtga atgagaaaga ggattcaatt cccgacatga cacatataga agtcctcaaa 48060
gaggactatg attttggctc ttggaacaca aaatacacac gaactcacat gcacacgtgt 48120
atacatgccc tgaaccatcc cagtcacctg gagatactgt catggcacag ccactagctg 48180
ctgttgagag aagcgacatg aaaaacaaac tcacatacag tgtgaaggat gccagcttct 48240
acacccccat ggtatttgta taagaaggct caagggatga ggcagtgcat cccttgctac 48300
atcattgctg gatcccaaga acctcagacc atgcttgata catagtttgt ttgcaggaaa 48360
taaatattca ttaaagaaag aaagtttaga aagaacatgg gaaggaagaa ggaaaaaaac 48420
acagaatgtt ttaatagtgt aatttatttg cagggaacct taaggcagga tttgagaaga 48480
gtatatccag gacctctgat gtgaattaga acaatctact ttgggtgggg tgggggcctt 48540
ttgcaccctg ctgttgtaga cccttcgcag acataaaaac taagatccta tgtggtttcc 48600
tttagaactg atctgattac actctccatt gctttcgcac tatcatctaa ttttaagagt 48660
tccagtggtt ttgaagacta tccattaaaa actttagaat aatgctttaa aaaattaaat 48720
gcaattgtaa ctgtcatggt atttgttatc ttaagggtgt cactattttc agtctgtcag 48780
cagtcttgtt tctgaaagcc atagacaaag gtttccttta tactggatta gccttgaatt 48840
tgaagaacct tctccaagaa catatcttaa atatgctttg aatttatgct gaacaatgct 48900
aacagttatt gatttagaag ggcagcagaa gaatcaattc tgcagccaaa atacaacttc 48960
tgggcataag aaaattcctt tagggttttg agatgattcg gatcaaaact gtccatctta 49020
ttataatgct tgatgtttct aattaaatag ttgatgtcat ccaagaatcc cttaaaaatg 49080
gggagaaaat acacaaactt tacattgtgg gaaaactacc ttacatcttg acggaacctg 49140
aaaactttct ctactttatc tggtttcaaa ttatgcaaga aagtccccat gaggacttca 49200
ttaaacctgc cagagtttta taaccaaaaa cctcactgga acccccactt ttacgaatct 49260
atgaaagtaa tttaacccct ctgtgttctg cttgcccaag atcagatgca aatactatta 49320
aacagtatat acagtttaat tctcttgagt tttggtgatg aaaaatccta tccaaatatt 49380
atgatccttg caatacgtaa tgtaaccaaa ttaacgatag ctccaggtgg aaattaacaa 49440
ggccagggct actcacgttt cctctcatct attcccatag taacagctaa tgtattatat 49500
tgctaaaata tcttatattc agttttatgt ctgaacttgg tgttgtgtca taaagcgtag 49560
cattcctatc cagactggat tcttaatatg tgtatcctca tgaaatttag gagagtttcg 49620
tgtctgcaaa tcaacacttc atgtgcatag tctaaaccac atgcagataa aagcaagtca 49680
gaacctacca agactctcac catagtgaac ctacacatgg tatagaggaa gaattcttac 49740
ctgggagacc tgatgacaca ttaccagtgc aggacctaaa gcgaatcacc atagagagat 49800
ccacacagga attatagtgt gaaaaaaaat ccccaatcat agacattgtt agcttcagtt 49860
ttcagtgaat ctaaactctt ctagtatgaa aatgtgagct attttgatat ttttactttg 49920
gtcaaaaaaa cacagaaatc caaaaaatac agaaatctgg gaaatgggat aaaaataagc 49980
aaacttttcc ttcatgataa taaatatata ttcagttgtg tacatgaggt tgtttcccat 50040
actactacaa ttttagtcct attggtctct gtattaccag gcacaagaag ggctctagaa 50100
aactaatcat tttgtcagtt gactattact tttacaaaga atagataaca cccataggtt 50160
ctgacagata catagtaatt atggaacagt cacctccaac accctggtag caaaaaacta 50220
ttaagccaag aattcattac cacaaatatg gaatgcagca agtatttgct tgtgacctaa 50280
gtagctcttc aataaagata ttttagaaac caaaacactc cacacaatca ggaggtgtgc 50340
aattttcact gtatttacac tctgccttaa aaaaaaattt gtatgttgtc ctgcctgttt 50400
tctgaaatat attctatttc ttttaaagtg aaagaatgac ctcttttgca ggaacgattt 50460
tcagagacag cgtgtttatc aaatggtttc tctgctttca taaaaacaat ttattttcac 50520
tgaactcttc acgataagca tcaaagccag gaagaatgta caatgaagtt tacaatttca 50580
ctccagaaac aaatactggg tagttattat tttgcttaag tgaaaaacat tttttttccc 50640
caaggagaca aaggtagtaa tgggggaggg ggtttataca ggagtgaaaa tcaggaagtc 50700
cagacagtct tcagcaggag gggcccctgg tgttgtccac aaagaccacc ggctgaacaa 50760
tgaaagctga agacccagta ctttcttcgc aaatgggtgg gggtcagtcc acagttttat 50820
tcttcgctaa gagacagcta tagaggcatt aaggagagaa aatcattagg cagatataat 50880
taaacccttc tatgacagat ctatatacca ttgcacatag atatctctca tagttggtgc 50940
tttggatgac aatcctttct ttgataaaca tccatgtttc taggcttaat ttatatgaca 51000
tgttattttt taataaccat agaacaataa aattgtaaaa ataaccaaga aaagaactga 51060
gtctaataaa gattctgttt cttaagaaat gggaaacaat tgcatttgat cacagaacag 51120
ccaaggacta gcagcaaaat aatctctcct aatttacata gatctgtgcg tgccaaacag 51180
atgagtgttt gcttttcgag taatagtgca ggtgcgtatc ctgcagtgac taaatctcta 51240
actcatcaaa ctgtttcgcc agaatgggac atgccctctt tttctggaac agtttcaagt 51300
tttctcccca gcattccagc cacctgttta tggagttcat cctcgggaga agatgcatgc 51360
aattagaaac aagaaaatga aaataaatga ccttgtttgt tatttataac aaagaaactc 51420
tgcaaaatta atgctgtgaa gcttgacctc ctgacccagg aaaaagagcc acctcatggc 51480
tttgtggcca atggacaata gtctggcagc tcccattgtc cagccaccct gacttttgga 51540
tggtcattaa agccacatat ccaaaatatt aaatgtttta caagttagat tagaggattt 51600
gcacttttta aaatgcgtgt tttaaaaact gaggttagtt agcacaagag attttctttt 51660
taaggacagc aggtaaaaat catttagctt catctactcc atctatcctg tgtcaacaac 51720
atgttgaagg aaaggaaaag atttaaaaat tctgaactag tgctttggga attgaagaat 51780
ggttaaatat ataatagaaa tcaaatagaa aggtggtctt tgaaagtggt tcagggaaaa 51840
cattgtgttt cctccctgct gaggcctcag ggaggaaagg gggaattaca atgttctgtt 51900
acataaatgc agtgtggatg gtgcccccta gagttgtgcg atgaaatagc attgctgttt 51960
ttccttccac ctcttatccc aacccacaca tctagaagcc cagggcagga aggaaatgaa 52020
ggtggtaatg gagttttgaa gactcttcag aactggtgct tgggtggaac atcttgaggt 52080
aggatggcga ctgaaaatga cactctctgg tgtggctgat tctgaagctg gcctctccta 52140
ctgcatcttg cctctttccc catttggtct cctccttcat tcacccacaa caaattccat 52200
gagtgtcctc tattagtcta aaccttagag taaaatccgt gtttgatttt tttccatcca 52260
agttgcttat ttattggcca atctgcccag tgctactaca tctttaattg ttttattttt 52320
ccccaggagg aagtaactgt ttattcaaga aggttctcta ctgttcctca aaatgtcttc 52380
ttcactgtga aataaagtca gtttcataag gcatgcagat tgtcatgcaa acaccaccct 52440
gagcattcta gatcatacct cctcaccttc ccttttcttt ctgatcccct gagggtagct 52500
cattatatgc ccctccctac cccttcttgg gaatgctgca gccataaatc tggagaggtc 52560
attagaatta cgaactctgg ttggtgtctc acatacctac aacagcaaca acaacaacac 52620
aattatagcc actgtagagc caatgtcctg gttaatgttt gtgtaactgg ccaattctca 52680
ggcccagaga aaggagttta agaaagtttt tgcatctcac cagtctaaaa cttcttctgc 52740
agtccaaaac cacatttcaa ctattgttta actgaaagac tgagccctct taatctggaa 52800
ccaccaacta aattccccct gtgtgcttaa acaccaagtt agagagctgt gttcagtgcc 52860
agtgagaaaa agtagagtgt gattacccca tcttacccac agctgaaacc tgtgtcattt 52920
atttttcaac aaatgctgac tgtgcctttc taactatatg ctcctacgtt tccagaaatg 52980
ggaaaaagca tgatccctgt ttatactaaa catgacaaga catgaggaaa gtagtataat 53040
aatgaaatat tgtaatgagt gccataggaa aagcattctt aggctagtgt agtcaacaaa 53100
catttattta cagaaattgt tacaggtaat atgttagtgt gctgcttaga aaaggcgggg 53160
atcatttatg atcaggataa tcagaggaaa cttcatggag aaggcatttg aaagtagata 53220
gcattttggt gaggcaaaag ggatgaaaaa atacactagt ggagggagat tttgaacaca 53280
gttattagag agaaaatatt ccatgtgtgg tgggaatttt gggttgcatc agccatttgt 53340
tgggtagatt aagcttcagt aacaaataac ctttaatatc ttagtgggtt accagcacag 53400
aggactattt ctcagccccg ttccagtcca ccacccatca gctgctgttc atttgcacat 53460
cttcatctca ggaccaaagc tgaaaaagaa gcttctatct ggggcatgtg ggtcttgtag 53520
cagaggaaaa agagagagtg gaaacccgct acagttgtca aagctgctca cctcattccc 53580
gctcactttt cactgggcaa agcaaatcag atggccaagc cccatgtcaa tggggcagaa 53640
agtatgatcc tcccggaggg actggtctgg caaagagtaa ggaggagtcc cctattttgc 53700
aataatgtag tcggtgccat ggaaagagtg ttttagagac ctaccaaaag tttcaggcag 53760
caagcaaaat tgtttagtaa aaggagtgag tgagtgttga ggggaagagt ttggtgagat 53820
aagatgccgg gaagtgatag ggggaaggag acaggctggg aagtgaaaca ttataaagta 53880
ttgaaggctg ggcagctgag ttagattcga tgcaaaagga tgtatgatgg catgaaaaaa 53940
cgcagctgtg agttctgatc taaagtttgt tttgacccat atagagcaga ctcatttaac 54000
atttaattag tttatactgt gtgtcagttg tggtggcagg tagacatttg catagatcta 54060
tattttaaat tttgatcctc atgacacctc tctgggttag ataagtatta ttctctttgt 54120
taagctgaag gaggctcacc aaggttgaat gacttgctta aggacacaaa agcagcacac 54180
agaactgtga tgcaaagtga ggtctttcta ctgcatcact gcagggcaaa gaaattaaaa 54240
tgtcaccttt ctttagtatt gacttgttat tctttatctt ctccttaaat acacagtctg 54300
aaagcaaggt taatatgatg ctttttctca tattaattaa aatgatgttt atataactaa 54360
tccttgcata gtacaacttc ataagtgaat aaaaaagaga cagatcttta actgaggtat 54420
ttattataaa atttcgtggc agagacagtt acttctaacc aaatacagaa tgctctccac 54480
tatgtatttc ccagtttttc ctgctgttag gtgaggagca gctgaggcaa taaagaattg 54540
gtgtgcttcc tccatatctt tcttgacctg ctgtggtgtc cttggaagac acatgcacca 54600
gatggaagaa gacaattcat gcctcagaat tcacatgagc gaaaccatgt cttgatggta 54660
ttgcactaca agatatccag tgtctatttg ttacagcagc atagcccaac ctatcctgat 54720
taatacagat ccttctgact ttaattgata caaggaaagt gaccatatct gtcttgcaca 54780
tcctcttatc cctactgctg aatacaggac ctcccacata atatatgctc aataaagttt 54840
gattagtgga aaatgaatga atctcaaatt gagtctggcc tctgtctact atttggttaa 54900
accacttatt tactgctttt agaaaccagt ggttgatcaa tctttttgat atatcatttc 54960
atcagatcac tcctcagatt aagactttat tatatattta atcaatttta aactccttcc 55020
tttgacattc aaggtcccca taatctcacc tagattccta caactttacc aatttattgc 55080
tctaatccaa tctaacctat cactactggc ctgtgacccc tggtcactat attcactgtt 55140
ctagggacaa acatttagtg ttcttaagca aatcatttca agtctctgag cctcagtttc 55200
tcattctgta aagttgttat ttgtagcaaa agacataatg catacaaaag tttaagttat 55260
gcagcattat gaaaatccaa atttattttg tacttgttgt tggtatatat taaataaatt 55320
gatagatcag aggagtgaca ttaaaaaatg tgttgccatt tcagtagcac atttgtcaaa 55380
atctcccatg acaatcttgc atggaattgc tgtctaggga gaaatggtaa aggaaaccag 55440
ggagaccctg ttggttatct actccaaatt cattccctct tttttttctt aactctacct 55500
ctattttatt taagttctgc ccttctcctt gggaccatat ttatctaggg aggatccttt 55560
acaatggccc tattttcact gccaatgatt actgtagtca tgaactctga tgcgtttctg 55620
gttgataagt tgtggaaaag agtgtaagag ggcttctaag aagggtttct gtgcttttaa 55680
aaagaaacac tcagaaaata tataataatt tcttcttctg gacagtgtca tgtctcgaaa 55740
tgttgcagcc agctcatcag catgaaagga tctctagccc gaggtcagag ctgacacgct 55800
gagatgagaa tggaggggca gaaacacgga aagaacatag atccttgatg atgtcaggag 55860
tcactgatta actaaccctg gagctccttc tgtcctgatt tctagttatg tgaaataact 55920
cataatctta tcttttgatc taattgagtc ctagttttct gttacgtgca atggaaagca 55980
gtgaaaccct cttagactga gtccattagg gtacccgtaa caaaatacta taggctgggt 56040
ggctttcata acagaaattc atattctcat ggttatgaag gctggaagtc ccagatcaag 56100
gtgcagcagg tttagattct cttgaagcct ctctccttgg cttgcggatg gccaccttct 56160
tgctgtgtcc tcacatggcc ctccctctgt gagtgcacat ctctggtgtc tcttcctctc 56220
tcataaagtc acaaggcaga tttgattagg gcccacccta agggcctcat tttaacctaa 56280
ccacctcttt aaaggctctg tctccaaata cagtcacatt ctgaggtact gggggttaga 56340
gctttgaaat atgaattttt tttttctttt attttttttt tgagatggag tctcactctg 56400
tcgcctaggc tggagtccag cagtgtgatc ttggctcact gcaacctccg cctcctgtgt 56460
ttaagtgatt ctcctgcctc agcctcccga gtagctggga ttacaggcac atgccaccac 56520
acccggctaa tttttgtatt tttagtagag atgggtttca ccatgttggt caggctggtc 56580
tcgaactctt gacctcaagt gatccgccca cctcggcctc ccaaagtgct gggattacag 56640
gcgtgagcca ccgcacctgg cccaaatatg aattttgtgg gggacacagt tcagcctata 56700
acatttgctc aagccaaaaa aaggagttta aaatttcaga aaaaagcctc acagactcca 56760
agtgcacttt atcaaagtca gacatccaga gaactgggaa gccaataggc agctaatctc 56820
ttcatgtttt tccctcttca tggcttcaat tttacatttc tctcagcatg catgctttgg 56880
ttttttcttt ctcctcaccc ttctgcttat acaaagctca tcatgagtgc ccgatgatgg 56940
gcttcagccc ctaagtcaca tgacccttat gtttggctac ccctagctag caaactcagg 57000
ctccatgcct ctttgtgaaa ttcttgagat agagaatctg attggcccag tttgtatcaa 57060
gtgtttatcc ttgatccaat aggctgtggc caggggcatg ggtcaggcgg tacacaaggg 57120
ctgcctcttg tgatctgtgg ctaagttagc tcacccagag gacttgaatg ggaataaatt 57180
ccttagcagc tctagtggaa gagggtaatg tggataaaat tatagtgtag tcaagtggat 57240
ttgaagcaga tgaaacagtc atacacaaag gtgttgattc attactgaca ggctgtaaga 57300
agtctttagt aaagtcccac tttatcttgc cctcggttct gatttttttt ttaatgttcc 57360
caatatttta ataaacagat taggacatag aaaatatacc tacgaatttt tagttgacaa 57420
aatgatggaa acatttgtta agatagttag aaatgagatt cagactcaaa atcatcttaa 57480
agggctagaa atctgtgtag aatcaataag ataaaaatta gctcacataa atattaactt 57540
ccaaatttgg atttcagtgc tcacttgcaa agtgatggaa tggagttttc aaaatgaact 57600
cttaaataaa ttatagcact ctgtggatat gtgtctctct ttccaagaag gaagtccttt 57660
ttaattagtc gcatgctaaa gttagtttgg ctaagtaaat gttttcctag ggttgggaga 57720
tttctataat ttcagtttcc cttttgtttg cagatcaagt agtttaaatg acccagtaaa 57780
taatttggag tcaccacagt taactcacca accttgaaaa tccctgaacc aagaggcccc 57840
ttgatactgt aagggagggc taccataatt aatagcataa gtctaaccag ggtaccatac 57900
ctttccctat attgctggat attctgtaag tttggctttc ccaaattagg acacagagat 57960
aaggataaac tcactttcca gctatttcgt tatgcctttt ttatttcttt caacttttgg 58020
aaatgacctt atgaatttcc tcttattatg aaatatatct ttattgaaaa ctggagtcca 58080
aacattacaa aaaatacata gcataggaag tgaaatgaaa tactgcataa ccaatgtaaa 58140
tgattaggtg actcctcttt cagattacat tcctgagcat tttctaacaa attatcaata 58200
tttttatttt aatgaatata gaatcacacc ctacttattc ttttgtaatt tgcttttccc 58260
atgtaataat atggcctgca ggctgtaatg atagacttgt tttttgcaga acaatccatt 58320
agccaagggc aactagaaaa gccagacaaa atattcgatt gatttggttt gaaggcgtga 58380
gagagctacc atgtctgcaa ggacttgagg ggctaagatt tttgagaaaa gggaagtaca 58440
aggagtgtgc tcgacattca gtctgctttc ttctcaaggt ctttagctga ttcacaagta 58500
gtggctgaga gcagagaagc tgagctaagc ttctggtagt cttatcatac tgaagggaaa 58560
aattagaatt cagagcccta aaaggaaaag agtccgtgat aagcatccca aggtttttgt 58620
tgacgtccac caagggctat accctagaac ataggagtga accagaaata gaccaaccct 58680
cacaaagaac aaagtctagc tttgattaaa cattatccgt gattggatta ggtgatctgc 58740
ctctatgcta acagtttact aaaaataaaa atgaatcttc cttgaaagaa aataaaatta 58800
ccaagaggct caaattatct taatcttata tacacatctg gcatctaatt tcaaactacc 58860
agtcatttaa ggagacaaga ccacatgact gaagaaatag atgagagggg cggaccctaa 58920
gagtgtcggg atattggagt tgctagacat tgactttaaa ataactgtga ttacatggtc 58980
attctccact cacattactc aagagatact tagtacatgg acttagcaca tgagctgtgt 59040
atgtaatagt ccctcaacaa atatttaatg atatgaactg ataatccaaa ataatggtac 59100
taatatattt gcaattttaa cctaagtaat atatgggcaa ttggggtttc tgaacaccct 59160
attaagtctt actgtctgag ggctccatta aatcacctca ggttccttga gatgatttaa 59220
tggagcccac agacactaaa ttacatggag aaagtcactc ttttctattt tttttaagag 59280
aaggttctca ctctgttgtc caggctgtag tgcagtagtg caatcatagc tcactgcagc 59340
ctcaaactcc tgggctcaag tgatcctcct gcctcagcct cttgagtagc tgggactaca 59400
ggcatgcatc atcatatcta actaagtttc taacaaaaat tttgtaaaga cagggtctca 59460
ctatgttgcc caagctagtc ttaaactcct ggcctcaagt gatcctctta cctcccaaag 59520
tgctagaatt ataggtgtga gatacctggc cccttttctg tttcctttta gtccttctga 59580
ttatgccata gagggagtct cagcttggtg ctgacgtgtc ttttatacca tcctaatgct 59640
atttgatttt tttttttttt aacagagaaa gatctcaagc ttctcagtca atgtcttggt 59700
atctctactc tggtgttctt aaggaaaatg ctatgggctc ctttggacat ctggtaaagt 59760
ctatgaaccc tatatcaaaa taatgcttgt aaattcttac aataaaatac ctagtattac 59820
aaagtaaaga atatgttgaa atacagttcc atccaccatc cttttgccac tacagtttgt 59880
gattgttgta tttattttca tggttacttt ctacttatgg aaagtgcaat tggtttctgt 59940
ttatagtcat gacatacaat ttgcatttta aatacatttg tttaaattaa agagggaaga 60000
tgaattaagg aaataagtaa aagtaggaaa tatgacaaag ctaaaagtgg tgtgctgtga 60060
ttgagtgacg aatgcagact taacccaaga gatgacttta ttaatgggaa tttcaggcac 60120
cctttcacat tggggactgt actaaaccag gcttgacaca agcctcactt gtccatcagt 60180
caatgtccat tgattgagca gccccaccaa gtaccagaca ctgttccagg tgtgagggca 60240
gggcattgag caaggcaatt tattctcaag gtgtttacat tgtagggaaa ggatatagac 60300
aagaggcagg ccaaaacatt caattaaaag gtaacttcag atactgattt ttgtcctgaa 60360
gggcaaaagg gtgactagca gggtgactag agagggagtg acttggggta ggtgtaggac 60420
agtagcagtg gggtttgtgg cttggcccag ggctgcatta gaaaaagacc aggctcccac 60480
tgcagcagtg cccggaaaaa tgcagagacg agccaggatt tctggatcat taccatgagg 60540
aagggaataa atgtgtgttc tctttcagtt gctcctcttg acacctgggt aaatggctgt 60600
ttacacaggc agatcaccca gccgctccct caaaggtaaa cagctgcttt ctgcctcccc 60660
tgctagcaca gattggggcc ctgaaacagt gtgtacccag gcaaaagagg aggtattctc 60720
catttaggtt tccattcatt cattcaggca agatttcttg agtgcctcct aaaatgcagg 60780
caccaaggta ggtactggga acacagtaag gaacaataaa gaggtccctc ctcccccacc 60840
tctctctcct ctccacttag aatccaagct agaggtgtgc ctcagagtct caggccactc 60900
ctctcatgat acagatggaa atatcagaat cagaagaggc aaagtgactt gcccaagacc 60960
cggagctagc ccacttcaag caagtcaggt ctcaaaacgg tgccagctgc tttcattgcc 61020
tactacctga cttgctcaat cttggtcagt atttggattg gcacttttta gtgtattctc 61080
cattactaga ctattatggc ttagggaagg agaaaccaga ggtccatcct acaagcacac 61140
tgaaatgtaa tccaattcta agtccccgta ttacaacatg gactattgtg actgaccaca 61200
tttgccttat atttaccttc ttccgcaggg atatgcccga tttcagtttc ccatgttgaa 61260
atagcctaca gttgagacaa acatacatta catttaagca taccttccat tttttataag 61320
gtactatatt tttaattgtt tcaatcactg tgaaattaac aaatgttcat gagcacccac 61380
tgtgggagct cacagtgtgg gagttccgcc ctggtggagg tactgggatt taatgataaa 61440
ccaaagacaa atatatgctc aatctggtct ctgccctcat atctagtctg ggaggtaagc 61500
atttgtcaaa taatcgcaca tatatgattg tgtatgtatg tataaaacta aacgctgtca 61560
gttgtttaat ttaaaaaggt caaaaagaag tttgctttga agaatgagat caaggaataa 61620
aaattagtca gttaaaaaaa attacatata taaacataaa tttaccacca taatagatac 61680
ttgttttagt gcaggtcctc cgtgatgcac actaagacag gaataaacag gtaagggatt 61740
tattggggaa aatgcctgtg agtgaaaatt ggaggtcaag cacgatggct catgcatata 61800
atcccagcac tttgggaggc cgaggtaggt aggctgcttg agcccaggag ttcaaaatga 61860
gcctgggaaa cacagcaaaa ccccatctct acaaaaaaac atacaaaaat tagccagcta 61920
tggtgccgca tgcctgtcat cccacctact gggaggctga ggtgggagaa tcacttgagc 61980
cagggagttc caggctacag tgagtcttga tcacgccact gtgctccagc ctgggcaaca 62040
gaccgagacc gtgtctcaaa aaaataaata aataaaataa aataaatgaa aagaaaaagt 62100
aaaagaaaat ggtgggggag gctggagaag gccaggaaag ccatcagact gggaagtagt 62160
tctgtgaaga ggagagagga ggatggatgg tcttagattc agtgtcatcc taaggaagtt 62220
ctggcaaggc cacatttgcc catcagaaga gtcccccttt ctcaaggatg gaactggctt 62280
agttttcctg ctgggcttag ctacaagctg ggaacagcca ttgggaagtg tggtctctgc 62340
agacatgtgg tgatggattt ggagtacagc agctggggct gtccatcagt aagggatcta 62400
agaattacat gctcatggcc actgcaatgc taaaatagag caaaacacaa taaaaacaag 62460
ataaattaga gggacatgat ctggtctggg acaaggaaga ttgtttcaga aaatagtctc 62520
tgtcttacat tcacaaggga aaagagcaat gttccagaaa gagtggcgag tgcaaaggcc 62580
ctgtggcaga aggcagcatg ggatgttcaa gaaactgaaa gaaggccaga gcagcctaat 62640
ggaaataata taggagagag tggaatggga ggctgagagg tgagcattgc tggggacccc 62700
tacaaggcct ttaaggagag gacattgttt taaacacaca tctaaaactc actacttaca 62760
tgacagacat agggcagagg gtggagtact aggcgtgtgc ctgggtttcc aggtggctga 62820
actgtagcat gactggcggg actgaaggag tggagaggct aaggtcttga tgtcacctac 62880
ttttgttagg attagaacag gggtcacaaa ctgttggacc ccatggcaaa tgtaattttc 62940
tttttcaatt ttttattttt tgagacagtc tcactctgtc acacaggcta gagtgcagtg 63000
gcatgatctc agctcgcggc agcctcaaac tccctggctc aagccatgct cccccacctc 63060
agcctcctga gtagctggga ctacaggcac atgccactcc acccggctaa ttttttttct 63120
ttttcttttt tgtagagatg gggtctcacc ttgttgttca ggttgatctc gaattcttgg 63180
gctcaagcag tcctcccatc taggcttccc aaaatgctgg gattacagac atgagccact 63240
gcacccagcc acaaagataa cctaaagatg tgtttacttt gacccaggca gtagtttaaa 63300
aaagttttaa tttgttgttc acatttaaaa actggacaat ttctacataa aaatctgaat 63360
tactcatgtc tcttaaaaaa ataacatcta gcaatggtag gcccacattc cttcctgaaa 63420
ataattagct gggaaagagt agggactgac ccctttagac acggtataaa tagcatggga 63480
gttgatcagt aaatatttgc tgaatgaaag aatacatgaa tgaaaagtca gagccctata 63540
ggtcagcatg gacggcggta aaggaacctg gctgagcctg aaagagaatg tgatctaaga 63600
ttaaatccag gatatgctgg taaatgttta acagccaact ctttggggag gaaaaaagtc 63660
ccaatttgta gtgtttgccg attattgtga tgtaaatact cccatcatga ccaatttcaa 63720
gctaccaaca tgctgacact gaacttggag ttggaaggag atgaacaggc ataatcaggt 63780
ctcgtgagat ggcccaagcc ggccccagca ctccactgtt atatatgagg ctagaattac 63840
tacataactg gaatagcaac tttctggacc atatgcctgg aacacagcag gtgctgaata 63900
aatgtttgtt gatccaggaa ctgactgtgt tgaagcccac agatgggaaa tcagtagaag 63960
gcaggtaaga gtaaaaagaa gggcagagaa ttgggggtac agacccctga accataagtc 64020
agaggaatgt tgtacatgtt ttcagatccc tcactggtca aatgaaggca aagggttaga 64080
tctctccaaa tctttagagg gacatgatgt aactccatta agtaactcag tgattttcaa 64140
cattaaaaag tgtaattatc ttttcaaact aaatattaca aataaattct gataaaagga 64200
aatgtacgtc tgttgagacc cctgatccta taactggttt agtattccct gaagccactt 64260
gtagtagcct attcacatgg ggactcccca gtgaacattt cctcatatcc acactcttgt 64320
gaaggtcctt caccttgaat ctggactggg cctatggcct gatttgatgc atagaatgca 64380
cagatgagaa taggtgggtt tctggcataa gctcaaagaa ggcacagtgg cttccagagc 64440
cctgagctac tagtaagaaa gtccagctac cctgctggga aggccatgga gagaggccat 64500
ggggagctca tagagaaaga gagggaccct gagactacat ggagctagga agaacaacac 64560
ccagccatcc cagtgtccca gctgagcccc actccaaacc catctgccaa ctgagcacat 64620
ctacaagagt aaccactgac aggccagcac aagcccagcc aagtccagtt caaattgcag 64680
attgtaagca aataaagcag ttgatgtttt aaggttttta gatgatctta gagtttagat 64740
tatgttaagt atgtgagatc cctaaatagc catcaataaa aaaattgatc agtacaatgg 64800
agaactgcac aactattaaa agaagaaggc aaatccatgt ttaccgacat gaaagaaaat 64860
caccaagatt taccctaaca tgacaaagca agattcagaa gaatctgtag ggtatagtac 64920
gggatttgcc attgcatgaa aaagggaagg taagtatttg tgcatgcgtg catgtgcatt 64980
tgtgtgtgtg tgtgtgtgtg tgtgactata aatttgtaaa tgcatagaag atttctggaa 65040
agatacataa gacattagaa cagactggaa gacttgaaga agaggggaga ttgtgtatcc 65100
ttttgtacat attttcattg tgtatccttt tgtacatatt tttaccttat ttgcaggtat 65160
cacttattca aatcatagaa ataacatttt aacaaaaaag tgaggcctgc ttatataatg 65220
ttgaagacaa ctagctacca cactatggga acacactatt atattaaact tgatgattcg 65280
agttttgcct aaattttact cagaatcgaa tacaagaata gaggaaagaa tttaaaaccc 65340
atctggctaa tgcataccct tgccaactat tctattagaa aggaagatgg cagtggggag 65400
ggggttctta caatggaaaa ggtattggct tccctagtgc ctgaggtcgg gttctccaag 65460
aagcaaattc agagtgaagg attttaatga gagtaatcta tgtgggaagt ggtcccaaga 65520
agcaccaaaa cagaagtggg gaaaggacac agagaaggaa aggaagtcac tgaagggact 65580
gtgagttacc tttgtgggca actggggttt cgtcccactg gggacctctg ggagacactg 65640
taggacatgt ttcagggtgt cccatcctaa gtgggaggaa tctggagaat ttatactctg 65700
ctcccagggg catcaattct ccagtgtttc cagtcagctc tgcttgctgg ctgagatacc 65760
agagcaagtg ctggtctggg gaagttgtca gcgtgtagag gaggtgagta ctgagcagat 65820
acaggcaggg cactgtcagt gcatttgctt acctagacag caaagccaga gacaaaagct 65880
cgtgtgctta tgtggcagga gagagagagc gaaccatgca gggaagtgca ttactttatg 65940
attttttttt tttttgagat ggagttttgc tcttgttgac caggctggag tgcagtggtg 66000
ctatatcagt tcactgcaac gtctccctcc cagtttcaag caattctcct gccctcagcc 66060
tcccaggtag ctgggattac aggcgctcat caccaagcct ggctattttt tttttttttg 66120
tattttttag tggagatgga gttttgccat gttggccagg ctggtctcaa actcctgacc 66180
tcaggtgatc cacctgcctc agcctcccaa agtgctggga ttacaggcgt gagccaccgt 66240
gcccagccaa caagttgatt ttttagtttt atcagatgtt ttctaggaga ccataggaag 66300
ctactttgtc tacacattac gcctctgtaa aagaggaagg aagaaatttc caggggactt 66360
cggctcctct gcacttctgc attgtccatg taaaggtgct tattgagtat ggattgtggt 66420
gtcttgcacc ttggtggcag caggaaagtc ccggggcagg aagtgagtgg tacataatgc 66480
aggagagggg agaggaggtg cctgataacc ctgagagtct gggagctgct gccccagtga 66540
gctcctccat ctgtaacact ggcggaaact gtagtaagca ggctttacaa cagtgggaaa 66600
catgcatgcc gatgtcaggg cctcccatcc aaaagcaagg ccaggatgga tccagggtgg 66660
tgaataaatg aaacctaatc cagaacctaa caaaggagac tgcgccaagg ctaagaggag 66720
tgccctgaca gttcacagca tcttagagca cattgcacca cattatgcta tttcaccaag 66780
gagaaaattc ataaacattt ttaaaagtag attctcaaga ctagacatta ttttaatatt 66840
gcttattgat gattataagg taaagaatgt tggtgagcag gtagaaaaga aaggtaatta 66900
ctaggaccta attctggttc tccagaaata gatcatagtg taccaacaaa tttccatttt 66960
tgatagaatt actttgctga tatacattga tctaagcatt gcttctggcc atgtcactga 67020
taatattttt ctggacaaca tgccaaaaca caggtggaat gactgtacag tcaaaaatat 67080
tttttgacta tacagcagat ttcaatcaac tatactcagc tctctagaga tatgccacag 67140
gtgcttgttt ttactcttgt gtttattgta ttcgatattc tttcctcaat gatttggaag 67200
aagatgtagc aggcatactc accacattta tggaaggaat cattggcatg tttgatggca 67260
gaatcaggat tcaaattgta ctgacaggtc aggatgttag gtcaacacca accatatgca 67320
atttaagagt aatagaatct gtatttaaca ttaaaaagtc agttgtgttg gcacaggatt 67380
ggggagttgg attgacagca attgagttgg aaaagacctg tgggttttaa ttaacccaaa 67440
gttcaataag atccaacaat gaaacagctt attttttaaa gcaattttag gctgcagtaa 67500
taaaagcctt attctcagct gaagagcagt gatgatccta atagattctg tgaggctaca 67560
tctggagtat tgtgtactca gttctgggtg aaagagtgag caattacata caggagggat 67620
ttcaaatgca tgtcacacaa ggactggtta tcagcaccgg ggataaatgc gaacaaaatg 67680
ataatatttt acaggaataa tagtgacctc catctatttg atgagtattc aggtgtaaaa 67740
gggagtaaac ctattctttt tgctctatgc tttagtcagc tatggtcaca ttaataccat 67800
gttggcttgt aataacatct atttatctct tatgcattca cagataagct ggagtttgtc 67860
tgatctaatg taggcttggc tgggcttggc tccaggccat gattgtggtt caggtttgct 67920
gcatgtgttt ctttttcttt gggaatcagt aggtgcccct gggaatattt ttcttacagt 67980
gatagaagag gcacacgagg gtgcatgcat taaaagcctc tgctgatatc atgtctgcca 68040
atatccattg cccaagttaa gccatcccaa atttaagggg cttcagccac tgtgaggcca 68100
tgggaaggga actgcatgta ttcctattat ggagtagtgg aacaaataat ttaatttatt 68160
ccactccaga ctagcaggtc aaaatgaggg tcagtggtct gaagctatag gaagatagat 68220
tttggtaata aaaaactgga tgatcgttgg aactgtccaa agatggatgc aaacaactga 68280
agtctttgtc ccagaaggga ttagacagag ttcaatgggt catttcccaa gagcatccca 68340
gatggaattc cggtgtcatt tggaaagtta gagactgagc cagttagtat ctttcctact 68400
ccaacatcct caaattccat agtcctgttc tatcccatac tcttcctctt gactctgaca 68460
tcctgaggct tttactctct gtgccattcc ttggggaacc taattatata tggcttcttt 68520
gtgtctctaa gagattccat gagtatttct tgtcttccta attgctttgg aagcatttca 68580
gtgtgcaggc tgagtcttaa gtttctctta aattgcctat agctattagc tcagtgtcag 68640
gcaccaagcc cttagcatgg cattaaatca tcacccaaca cccagtgcag cctcaaacca 68700
tctttgcagc ctctctccta cctttcccat cttattatcc agccgaattg agatacctgt 68760
ccttcccgat acacagcccc tgcttttcaa gtctttgctc acttatagac cattatcctc 68820
ccttgtctag accccatcca tcccactcag tgcaaaccaa gtgctacctt ttccaagatg 68880
ttttcactga tgctccaacc aaaaagaagt ttctctacct cttctgggtg gtcttaacac 68940
ttctcatggt attcgagatg tttgtggtat agaaaagtga ttctccactc taactatcca 69000
tgatgacttg agaatactta aatcatacac gcccaggtcc catcccaaga tagtctcata 69060
ttattgatct ggaaacagaa actccaagta atagcagtgt cagcaataaa gcaggaactc 69120
acatagcaaa gtgtatggaa ataagttatt ccagggttgg tatggcagtt taatgatgcc 69180
accaagaacc taggctcttt cttcctgatc tgccattccc aatatatcag caatgtcttt 69240
cctcatggtt gcaaaacagc tgctatggct ccaagcatca catcctcaca ccagcatacc 69300
aggaaggaac aaagcaagca taggaaaagt gttcttctca catatctctc ttgctcgaga 69360
aagagaacca agaagtttcc tgcaaggaac aaagcaagca taggaaaagt gttcttctca 69420
catatctctc ttgctcgaga aagagaacca ggaagtttcc tgcagacatt tcctcacacc 69480
tcattggctg gaactgggtc acatgcacat ccttgaacta tcattggcaa agggaaatgg 69540
gtcatcaaaa ttgcttaagg ccaagcagga gccattgttg gggttaaact gtcctgaaca 69600
aaatctaggc tctgaatgat aggcaagaaa gaagagggga tggccacaac ttcctttaca 69660
cggtgaataa caagagcagc ttaagtaagt agatgcccct atggggcagt aatcttgctg 69720
tgggcagaaa catgtccatg cacacagaag ctttaggaat cttcagagag gttccatagt 69780
cacttgtgaa ccactgaagc ctctttctcc aagccattgt cttgaatgct gtttttaact 69840
gattacaatg catgcagctc ccgtgcccca cttattttag cttttgagga tgttcatttc 69900
cccggaatct ccaaatataa atcaggtttt cacagaaaac cacagagccc tcacaggtgt 69960
ggaaatcatc taaagatatg ctaatgattt gggtttctag aaaaatgtat atctatgaag 70020
gaggcaggga ttaagcacag ctagtatgta tgattttttc ttttcctttc atcacctgta 70080
ataaggcagg atggagactg aatgtatcag acaaaacagg gatcaaatac tagtttcaac 70140
atttgctgcc tgtttgacct tgggcaaatt ctttaacctc tctgagcctt ggtgccttgt 70200
tctcctcatg cataaaatga accctcctgc agggatgata tgtagaccaa cactgataat 70260
aatgacagta ataccagtta ccctgtcatg ggtgtccatt ccatgacagg cctgactcta 70320
ggcattttat acacattctc ttcttttttt tttttttgag acatggtctt gctttgttgc 70380
ttaggctgga gtggagtggt gcaattgcag ctcactgtag cctcaaactc ctgggctcaa 70440
gtgatcctac catctcagcc tcctgtctga atagctggga ctacaaattt cagctaattt 70500
tttttttcat ttttttgtag aggctgaggt tttgctatat tgcccaggct ggttctcaaa 70560
cttctagcct caagtgatcc tcctgctttg gcctcccaaa ttacaggcat gagccactgc 70620
acctggccac gtcatcgtca caaaaaatgc aatgagttag gggcttgtgt tgctcccaac 70680
gtttagagta ttgaagggac cagcccaaag tcacaaagct aatgggcaag ggttgaatcc 70740
atatgtctga ctccaaagcc agttctgcag catattaatt gcatatttct tggtttcttt 70800
ttttttcctc caattatttg gtgctatgcc aaaatcatca gaattgttcc tgtaggcatt 70860
ccttttctta attacatatt gcattgttct ctttctcact ttcccttgtt tgatccaagg 70920
taaattttta gtctttttaa aaatgctcat acattataaa tccttgctaa tatacagttc 70980
tttcagactg tcctgccttg cttgaggaag cagatgtggg tcagggagaa agaaggaccg 71040
atgaactcaa atagcctttt cacttttatt ctctcttttc acttcaaaat gctgtgtcat 71100
cagtgaatcc cctcctcata atctcttctt tcctggagaa taccagccta gtttcacttc 71160
ccttgtaaaa tatccacaga tctttgtgcc ccaatcactt tggctgtatt gcactgggcc 71220
ttgctaatgg cacaatatcc ttttcataat aaggtatccc acatgacaca gtagactttt 71280
gtacctggcc agaatcacta cattcatcgc agataccatg tgctgtctat tggataccct 71340
cattttctct tttcaggaag ggctggtgtc agctttcctc ctgcctctta tgaaccagga 71400
aatttttctc cctgtatctt ggggctgctg ttttccagcc tctgccaagt ttccattttt 71460
gtgggacatc agttgaccgg catacccgta ccctggacgg ggacttgggt taactgaggg 71520
ttggcattct ccccaaagcc tgttctgcat atatttttga aaacctattg gttttctgcc 71580
taccttcttt cctccatgag tagacttcaa tgaacacatc actctctttc ttcggtaatt 71640
acctggtctc acctgctcat cataaaagag ctattcttat tgttagggct gacagattca 71700
ctttgcaggt gatttaatct gcatctgtag tgtccacaga acatattcta gaagttaaaa 71760
gtacataata taatgaaaac cctgatgcaa cttttgcttg aaatatgagt atagcaaaga 71820
catttgagag aagagcctga aaataggtta atagtagttt aattgtatct aataagagct 71880
accattgatt aagcctataa taatactagt aactccccta aatatgctct acacattact 71940
tcatttaatc tacataataa cactcagagg aatgtattac catcccagat ttacagagta 72000
aatgtattac catcccagat tcacagagaa aattaaggct aagaatgtta ggtaattggc 72060
cgagtagcct gcagctagta agtatcagag aacggatttg aacccaggcc ttggctggtt 72120
tccaagtcca caagcttagc tgctgctacc cagcttcact gatttttgtt ccgtgcactg 72180
cctctaggat gtttccgtat ttgccttctg gttaatattt actccctcct ccctagcaca 72240
ccacattaag ggtgtggcat gggcttttca cttcctgaat gtttgttact cagtttcaac 72300
cagctttact ctctttcaaa gtgacataaa agtgacagcc ctttaagctc acagaaaaac 72360
aggagctgat tccagtacgc gattgactac catgcaagat tttgtctttc cttttatatt 72420
gttgaagatt ccttgatggc aacatggccc acacattatc taacctccag acaatcccag 72480
aggatctgca ggaaaccacc aagcacccca gaggggtcac tggcaacaaa tggattaagg 72540
aaatggcctg atttatggga ttattggggg tcggggtgga gaattataga caattttgtt 72600
tctactgcag aatcagcatg atagagtgaa tatggacttt ggagtcaggc ccaggcctgt 72660
aggatgacct gggaagcagt ctaggcagct ttggcccact tcagcttgta agatagagat 72720
aatacatcat cctagaaata tcgcatggat tatcagattt tgtatataaa gtccccagca 72780
gacacctggc acacagtaag tgctcccaaa accaaagcaa cagttcttag aagcttagct 72840
tggctcaggc tgaagtctca aatgatctag ggttcactct ccagccattt ctaagccatt 72900
gagtgaaact ggacatgtta gttctggtgt tgacttcagt atcctaagtt gggaaataga 72960
actcatcatt ccactcctcc ttttaagtat tttgataaga ataaccgaga agtccatgta 73020
gcattttgaa aatataaaat actattagat tggttttgtt ttgttttcat aggaaagaga 73080
aaggaagaag gaagggagag gagaaaaaga gaaaagaatt caggactgat attttcaaat 73140
ttccaaagtg agcaagattg gtgtttggta ctctttgatc tctccttttc ttaaaaaaaa 73200
gggggatgag tgtgttagag tcctacccca tctagaatta gagagagagg gaaacagaga 73260
ggtaaaaata tccttcctat tatccctcaa attttgccac agagaaaaca actcactctg 73320
cttttgtatc aatgacctta ctgcctcagt gtcctcatct gtcgaaatgt gtttaggaat 73380
agttgccctg cacacctgtc caaggtgtta gaagagccag atagataaga caatggggaa 73440
acttattttg aaaatcaagt agtattaaaa tcaaggtgga gagaaggaac accaggccaa 73500
gagtgagcaa atctgcattt gaacctgggc ttggatgatc agcagctttg tgactttggg 73560
caagtcattt cacctctcca cactgcaggt tcctcatctt gcaatgtgga aagcagaacc 73620
tctccgggtt ggaggatcct gtgggatccc acgtgagtca gcaccttgaa attgcacata 73680
cagggcacat catttctacc atcacctaag gtcaatccca ggttattgct ggccttttgg 73740
tttgctatgt tttccacctt tctcacaaat taaaaatgca gacatgtaaa ttctctatct 73800
atgtgcactt caggaacttt caagatccct ttagggttat atctttcctt agcctcttgc 73860
aaacctgaaa gcaaggtgac tgtaggacaa actgtgtggg cactggatgg ggaatgcatg 73920
cctctggtag aaggggaagc cagaattcag agccaaagaa caggcaccat gcaggactat 73980
gagtccagga tgtccaaatc tgacttctaa aggaatgcca gtgatactga ttgtttttaa 74040
tataaaatct accatttaca aaatacaggc tcaagaacaa ttgtaaacac tgcacagggc 74100
aagttttatt gtttttctta aaagagctga aaaccataat caagtgcatc tgccctttgt 74160
tgtagattgg ggcctgcaat ctagggagta gagaaaggct gcctgactgg ttagcaattg 74220
aaacacagag ctggggccat ctagtccgaa tgcagtgttc atcgttcttt gctaaacaca 74280
aggtgaccgt ggttgttgtg gttagcaagg tcacctagct tcctaggcag accttattcc 74340
accacaatgg gcttcctttg ctagaaagga catggaaaaa ggagtgacaa aagaggagaa 74400
agagctagtg aaggaaagag aggaagagag aggaaggtcc ccagttgtta ttacctaggg 74460
agtgcccagc atgcctttca gaggaacaca ggtgcctacc cctttctcct gcctgctaca 74520
gcccaccacc accaataaca actgtgcacc ctcactgttg cccccatgca tggagcagag 74580
atagagcaca gatagggaga aaagaatttt caagggtgag ttggaatagt gacttctgca 74640
agcctggtag gtttgtctct tttccggtat ccttgccact gcaccaggtg aaggggaagc 74700
agactgtaaa atactttgaa tattatcaag gttatttggg gaaaaaaaac agcaacgacc 74760
tcacctgatt gtgccaggtt tgtgatagga atctgggggg aagttgtcct caatgacctc 74820
catttcttga atgacccgtg gcccacctgc tacctctgag atgagtcagg ggacacaact 74880
ttcttgattt ccatcatcat ttgcctgcta ctgctgcaga gactcaagtg gaaaatgtca 74940
cttcttgaag tcatggcttt ggtgtctggt gacagggagt agatagagtt tggacagagc 75000
cacttgtgag ctgcgtggtt taatctctct gaacttcagt gtctctagct ctaaaatggg 75060
ggtagcagcc tcaatgagca aattaaagca aaataacaaa tgtaaagcac ttatcccaag 75120
acaaggcaca tgagaagtat tcaacaaagg acagctctag ttatggtggt gatggtctct 75180
aaagcttcca gactcagatt cctaaccaga cagccatgag acatggtccc cacagtggca 75240
aaagggtagg ctccaggctg cctaagttta aatatcctga ctctaccact tcagcaaggt 75300
actaaactct gtgcttcttg cctcatctgt aagatggaga tacctcattg ggctgttggg 75360
aagattgaca ggggtcaccc ttataatgtg ctcagcacaa tgcttggacc aggatggatg 75420
ctgcttgggt gatgttatca tccaggtggg cactgtggaa cacagactga tacttaagtt 75480
cagcacttgc ctcatggagc ttacagtcca gatagaatag gtgcacatga gatttttctc 75540
agcaaagttg tagtcagtgc tgcccgtgcc acccatctgg tctcagcatt gctgctcatg 75600
tgcactgtcg tgacccatct ttctgctgct gaccttaaga aaccttgcct taaggtatgc 75660
tttggggaaa ccaaattatg acagatataa actgaagtgc caagacgaat ctttcaaagt 75720
gctgtgatgt ccagatacgt ggcaagtgcc aggaatttgt gtttgggccc actgggagag 75780
aggtcctttt ccccggcttc ccgcagtgga aagctgctgt atgtctgata cctgtgctcc 75840
aaatctaccc tcgagttctt atttggcaac aggcttgctt agcaatgtcc ctggggtcag 75900
ggagccacgg gtgggctgat gcaagaaact gcagttgtgt ctctaggctg cgacagcatc 75960
acagctgtga gcttctcaat ttaaactcaa catctgggca caagaggaag caccctccat 76020
ccaggcaagt tgaagttttc tttcctgtat ctttaacaga ggttaaaatg taaacacaaa 76080
acaaagcaaa acccaactta actctctggg tcctgtttct gttaaaaaca ttttttaaaa 76140
aataataata attagaacaa tagacccagc tgagagaagt ctgtctcata ataacaagag 76200
agactaaaac acgctctccc acaaacagat aaggaaatag tgagctaaaa agtaaaactt 76260
aagagtgcta cttctcaact cagtaattga ttcatgaata agctctagcc caattttcta 76320
tgaaaaataa caacatagag aaaagaaaag ccactcagat gcagctatgt cacccaagtg 76380
ttcactggag aaatttaata tgtgtcagag aaaaatctgc cttctccaaa acattgcccc 76440
ctccaaaaaa aatgcttctc gttgtgggat tttttcctcc acactgacag agagtttgaa 76500
agtaaagcag ccgactagag tgtgggtgcc cacgccttag aacaaagaga ttaaagaata 76560
ggcttttctt caaataaatt cgattttttt gcaacaaatt cagggcctgg acagtttaat 76620
gaagaataaa aaatgctcag acccctctct ttcagctttt ccaaacaaac acagtcattt 76680
ccaaccactc acaggtgttt ttcttcccaa aacaaacaca gaaacaaata tttacagagt 76740
tatgaaaatt caatagaagt cacaggggca caaatttcct cacctgcatc caagatctct 76800
ggcctgggat tatcaaacag aacgtcacac ctactttcca ttacgggaca ggaaatcttt 76860
gagccaaaga gaatcagtct gcagaatgtg ttcgtaagga taaaggcctc atcttttcaa 76920
gaaagtgttt gcagctccaa ggaagaatgg actttggaca aaggaaacac cagtgacttt 76980
ttcctcatct gcccatacgt gcagaaatgc ccttgaagag ctcatgactg ccttgcgaat 77040
taatccctat gttgaccaac aacacaaaga gtggtgctga ctaccacact gaccaccagg 77100
aataatttcc tacttaggtg tttgcgggaa aggctgttgt ttgcttttct caaatgtccc 77160
ggatgtgaac aggtctcaaa attaggaaat gcagctggga atggctgcta tcaacaaccc 77220
ttatttcatc ttttttcttt cttcaataga gctagagaag caggcaagaa aagaaaataa 77280
tgcaattatg aaaggaggga ggaaagacag agggaaggca gcggggcaga agggaagcgg 77340
aaaaaagatg ggagagaaag gaagaaaggg agggcagaat ggggacaaaa gatggcaggg 77400
agggagcgag ggaggaagga gcagaaagga gagggaagaa gaaaggaagg aaggagagag 77460
gcagagagag agacaaaaag aaagaatgag agagaaacct gctgttgtca gaacctgact 77520
ggtttacgct gaggaaccag atagcctctc agtgaaaagc tgagattaag ctcacaacat 77580
aatttccatt atgttaatgt tgctttaaaa tatattgcac agagtgctgc aacaatcaaa 77640
ttatcaatta taatgtctac tcagagtaga aaagtgttgc aaacagaggg ctgattactg 77700
cttcagtaca tccaatctgc atactcattg ttcagtacag ggaaaacaaa ttatcttgtg 77760
ttggccccag ttcaaattta attaaatgag tgcaaagcaa ttataataaa gtacaatagt 77820
gtagtaatga aaggaaaata actcattaac ctattaatct ttatttatgt tcctctcaaa 77880
taactatgta atttctttat caccgcatcc cataagaaaa agtagggtct cgctgctcat 77940
ggcctggttt aacaggttct atttggttaa gatgcctttg tgggcaccat ttatactcac 78000
tttgcttagc tttggggcca cgcacccccc agctgtctgt catgctccct gcccacacgt 78060
atgcgtacct gatctagatt tagcgctcct ctcccacttt tccctgacac ttgtcagtta 78120
cagaaggtaa atctctctgg aagtgagaag tgcttaccac agcatatggg aaagaggcat 78180
cttccagcat ctggtatgta aggcaatgca aaaaagggga gaggacagaa tcacttctgg 78240
tttagagaga gcccagtgct tgacagctga agagattcca ctaaaagcta acactccact 78300
gtgctttcca gttaataaag ctttttacat gtatgatttc actgaggcct cctgataaca 78360
ctgtgagggt gcctgatgta cagatgagga aacagaatga tggagtagaa aagtatggtg 78420
tccaagcctt gctactcatg agtagcagat ccaggattct aatttaggtc tacagcccct 78480
aaatcttcat ttcattcccc tagaaccttg ctactcaaag tgtggtccag ggaccaggag 78540
cattggcgcc acctggaagc tcattggaat cttgggcctc accctagacc tgcagaataa 78600
gactccacat tttataagat cctctagtga ttctcacaca ctgaagttta agaagcactg 78660
gaactattgg atagtacact gccttttgag agaatggtga ctcaggcaaa tctcccagca 78720
actacttggt taagcatttc cttgcaattt gcaacacctt gagatgacct tgagatgatc 78780
ttgggtgatc aaggttgatt ctggcttcca ttttcatgtt atctgaagac agggctggaa 78840
gtagaggaca tagtaaaagc agaaatgatt tctctttctg gatccacagc agacccgaaa 78900
atcttcccct ttttcttcca aagagaattt gtgaaataga gagaaaggag aggggagaaa 78960
ctgatgaatt aaggaaggaa acagacactc gttaagtttc taccctgttc ttggaggttt 79020
tccatgtatt ccttcattta atcttcacaa caagcacctt tttaagataa ggtgactgac 79080
gacaggttta agtgatatgc ccaaggtcac ccacactgct gggtaacaga aatggtattt 79140
ggcttggatt caaagtttac actttcactg tactctattt tctcttaaaa aaaaaaaagg 79200
aaaagggaag gaaatcaaga tgaaataaaa gggtggtgtg gtagtcatta gtgctgttca 79260
ccaagaatct ccagttttta gtctctgagg tatgtgaagg attatacttc ctgccctgct 79320
tagaagtagg tgggagccat gtaaataggt ttggccaatg aattggcagc agcggtttca 79380
tgtttcattt tcagatcaaa tatttaattg cttgtggaca ccttacagag ctatctctct 79440
ttcctctgcc atgaaaattg ccaatattca agatggtggt tgcatcataa acctgtatcc 79500
atagtgagtg aatatgctca ccagagaccc ccaccaacct atgatagaca cataatgaga 79560
gtgataaaag caataaacct ttgtgttatt ttgagcccct gaagtgtgat ggttgcttgc 79620
tactgtagca tcactgagcc catccccact cttccagatg ctaggaagac gtgtgaaggg 79680
aaacagttaa catttctaca ctgcaacttt ttcacttgag actcacagca ttcctatgag 79740
aaaggtaagg aatggctatt atttattatg tatttataaa ttactattta cagataattt 79800
aacactgaca tagcagttta agtgtcctgc ccaagatcac aaagtttata agtggaaggg 79860
ctaggtttgg agcacaaggc ttgtaatgac tgatctttct tcaatgcaga acacttcctc 79920
caaaaaagga ctggagcacc attacctgcc cttgggtata ctcagattgg tatatctagc 79980
tttgtactca cactcctctt cccccaccac tcaggaggaa tccaagttat tgggcaaaaa 80040
tcaggccaag gaaaaacaag tacatgcagt tgccagcaga tgacgacatt gggtctttgc 80100
tagagaaacc accagagaaa gttcacagtg ataaccctca atgaagtcaa ctgtaaggag 80160
cttcattgtc cagtttgagt gttttttgtt ttttgtttga gaaagggtct tactgcatcg 80220
cccaggctgg agtgcagtgg cacaatcact gctcattgca gcctcaacat cctgggctca 80280
agcgatcctc ctacctcagc ctcccaagta gttagaacca caggtgcgtg ctaccccacc 80340
cagcaaattt aatttttttt tttttttttt tagagacagg gtctccctat gttgctcaat 80400
ctcgtctcta actcctggga tcaagcgatc ttcctacgtt ggcctcccaa agtgctggga 80460
ttataggtgt gagccaccat gcctggcctg tgttcatctt tcatgtgatt gtttttgcaa 80520
gatagaaagg caaaagttag tagtagcagg attgaccttt gtaatatgat cttaaaaata 80580
ttgtctccta atttgcatat ggaagaatct caactaaata acctcctttt aaccagttca 80640
ctaaacaaac caaagttctc cctttttcct ataaaacatg cttctaatgc aggttagagg 80700
ctcttggcaa gtaggctact gtccagcatg tccaaggtcc tgctctccca tctttgagtg 80760
ctatgtttac taagagtcta ttaggttcat tcccaggctt gtttatgctc actgtatttc 80820
ttattgtcat tatgtacctt aatgtaatgt gagtcagaaa aaaacatatt tctgtgaaga 80880
ctggatagaa cgctttggaa agatttgata aaagcaagtt actaaaaaga gtgttggcag 80940
acctgtaaca aaaaattgac aaaagttatg gtctatgtgg aacctgccct cagaatgttc 81000
ttttagtttc ccaaggcttc acattctgtg ttaaagaaac aaactgaaat tcatggacaa 81060
tgcattgcga gtgtgattta tacaagaaag gcaatctaga cgtcttagca atggaatgta 81120
accatgtttt ttaaaagcct aagtcatata tcaaatgatt gtcaaaacga taacccaaaa 81180
caatgtatag gttttgtgtt aaaataaaat gaaatattta aagtatggat cgtttttaat 81240
catttctgaa ttcaagccct acctatttgt cccaattgct tctgatataa ggactttcac 81300
ataattactt ttcctgtttg ccattttccc atttcccctt ccacagacat actgtgctac 81360
ctttaagtgc gaggtctttc acatatcttt ttttatccaa ttacctcatt caacaatatt 81420
tattttaaaa aattttttaa agagatggga tctgcctatg ttgcccaggt tggtctcaaa 81480
ctcctgggtt caagcagtcc tcccaccttg gcctcccaaa gtgctgggtt acaggcatga 81540
gccaacacat ctggccctct acaaatattt cctggacaat tactatgtgc caagcactgg 81600
cctgggtcct gggcatagac caacgaactg tagagccaac agtagagaaa acagacttta 81660
aataatgaga gaatcatcat ttaataataa ctgtggtgtg cgttatggag aaattcagag 81720
ttcactctgt ttttatataa ctcagacctg ggatggattt cctacttctg aatggtaaag 81780
taagtgtctg agtagatgag ccaccagcct tcttccttgt attctatttt taatgcagtt 81840
tctttgggcc aaatgatcac cgtcatcctt accagctcca gactgtgatt ccatagtggc 81900
tggattgcct tggagcttag agcaggttat ttcagtttac tccatggata ttctctccac 81960
tcttctccac ttcatgatgg ttaatattga gtgtcaactt gattggattg aaggatgcaa 82020
attattgttc ctgggagtgt ctatgaaggt gttgccaaag gagattaaca tttgagtcag 82080
tggactgggg aaggcagact caccctcaat ctgggtgggc acaatttaat cagctgccag 82140
cgtaaccaca ataaaagcag gcaaagaacg tgaaaagact agactcgttt agtcttctgg 82200
cctacatctt tctcctgtgc tggatgcttc ctgccctcaa acatcagact ccaagttctt 82260
caattctggc ttccctgatc ctcagcttgc agacggccta ttgtgggacc tcatcctgtg 82320
accgtgagtc aacgctcgtt aataaactcc cttttatata tacatctatc ctattaattc 82380
catccctcta gagaacccta agatatctct attctgttcc ccaagaggtg gacctttatg 82440
gacccaatca actgcctccc tcaccctgtg cctccaggtg gcttggaaag caggaggcga 82500
tgaaggctgt gggttttgtt ctctatctat ctatctgcag aattgtcaag tgttggcagc 82560
ctctctcttg gcaaagccac cacccttgtc aagcagcact ctctttatag ctactctcta 82620
ggtcagggat tgtcaaacaa ggcccagact aaggggtggc aagcaaagtg ccttggaagc 82680
caaggttacc ctcggagtta tgcaaatgca gggcctgaga gtccattctt tcttaaattt 82740
tgcaccctgg acacctcact tgccttaccc ttgtcccggc cttgatgaaa acttcctttg 82800
taaaggacta gagaataaat attttaggct ttgtaggaca cacagtttct gatgcaagta 82860
ttcaattctg cttttgaaat gtgagggcag tcatagacaa tatgtaaaca aatgggcaca 82920
gctgtgtttc aataaaactt tattttcaga aacaggtaca gggccaggtt tgatccatgg 82980
gccatggttt gccaacacct gctctaagtg atacagttcc ccatggttgc ttactctggg 83040
acagcacggt cccttgtggt ttcctttaat cctgctcaca tctttgcaaa aagccccttt 83100
actaagctcc cctcgaatta tccaaattga gtgtgccatc tgtttcttgc taggacccta 83160
attgatgcac ttggctttgc atttctccaa cacaggcttt aattgcaaag taacaacaac 83220
aaaaaaaaca agaaaatgga gactacaacc aattactctg tagcagggaa gtggtggtgt 83280
ttacatgtat tcatccattc ccaaatatga tagaatattt cacaaagttg cagtacactc 83340
ttaaagttga tgggagctga aataaataag cctttttttt tcccctgggg cctgcactct 83400
caaccctgct gccctacttg tcctcttcta atggaatgga ggtctattct aattaaacaa 83460
gaaaacacat cttttcacaa agggagaacg gaggacattg tactctgttc ctcaaagaaa 83520
gcatgcttta ataagaatcc ttttataatc cctgctttta tttgtagctt cccaaagctt 83580
ttgctggtaa taaaaggatt gtaaagttga caaatataag cagggacaaa gaagtttggg 83640
gagataatgc tctagtgaat gggctagtat ttgaaagttt attgatcctg caacacctag 83700
aagatgatca cgaagagcca atgctgccat caatcagggt gatatttcta ttacaaagta 83760
aaagcccttc caggcagggc tatccatttc tcatatcatg taagaattat gctttgtgct 83820
gagaaaaata attcaggcca aaatgcaggg cttggcatct gaagatctgg attcaaatct 83880
ggcttcatag aacttctaac ctacttcttt atcatatgga agcagcaaat agagctgtaa 83940
caaatgcaat gtgttctgtt gtggggttgc agacatctgc tgtcattcca ccactatgac 84000
tatcacaagt agcatccatt actcctggaa aaagccaccc attttcactg aggttccctc 84060
actctcacac ttaaagcctc acactttcca cttctggtgg agctccatct ctgtggcaag 84120
ggtggaacat gtgaccaagc ctagaccaat taatatactg tataccttgg gcagagagat 84180
ttgtttaatt ataggcaaat gatccagtta cagccaatga gactttctag gaaagtgatt 84240
agacaggctg tcctttctca ctaggcttga atgtgagggc tggaactgct gcagccattg 84300
tggatatatg gggagcctga ggctgaagtc aacagagtag aaggatgaca ttgttcaagc 84360
cccacataga gccatgccta aagctggtat tggttgggag aaaatataga caagttttca 84420
caatttcctt tatctaaacc ctttgtaatg tgactttgca gattctccca ttgagaacat 84480
taagagatgg aaactacttc ctactccttg aatatggact gctcttgtag cttgctttga 84540
cccatgcatt ccagtggaag tgatggtgtg cacttttgct gtcagaatcc tgcaccatgc 84600
agaaaagcct aggtgaacct gctggaggat gagagacaat gtggatgaga gccaaggcat 84660
cccagccaac agccagaagt agtgttgcct agctgaccca cagctaactg cagatcaata 84720
agggagccca gttcagacca gaagaaacat ccaactgagc ccagcttaaa ttgctgactt 84780
gcagattttc tgcgaaataa acagttgttt taagctactg tatgttgagg tgatttatta 84840
ttcatcaata actgatacac atcccatccc tgaatttttc atttatatga accgataatt 84900
ttatttttga tgtagtcagt taggaatggg ttttctgtga cttgaaataa aacaattctt 84960
aacacattaa agatgtgtct ttatttcccc cactagatag catcattagg gattctgtct 85020
tatccttatc caaagcactt gccctatctg gatccaaagc tgagtgactg atcaataact 85080
acttagtgat tgactatgtc atattgacag attcacaaat cacattttga agagcaaaga 85140
atatatttgc tcttgagtct ccaatgtcat ctgtagggca attgtacttt atttggctta 85200
gagcctcaac agaaatttgg aagatacaag gtgcttctcc aaccatcaca atagctgaaa 85260
acaaatacat ctgagacatt gtatctaagg aacccaactc tgccatctcc ctcaagggaa 85320
cccagaaaaa tctgggcttt aatcctaccc tccttgctat aaaaacctga aatgatgtca 85380
tctttttctt tctaaaataa aataaaggca tgtagtgctt ctaggcaaga ggtctagatg 85440
tatctgcctt tcctgtcctc caggacacca tccacttatt gctacaactt gctgcattat 85500
tcctgcaatt tattttcttc tttttgcaca aaaaaaaaag gaagaaaaaa ctaaagcagg 85560
gattccatag aattcatcct ctactttagt aaaaaggtag aatccacctg acctattctg 85620
tatgtcagag tggaatccag cagccatttc tctccaatta ttgaaaaatt gtgtgtgtgt 85680
gtgtgtgcgt gtgtgcgtgt gtgtgtgtgt gtagagagag agagaaaaaa aaggtagata 85740
tacaccagca tttttattct taaataagag gataatcagg cttactccca cccaagtgag 85800
tttacacttt aaattcttaa atggctggtt tttttttccc tcagatctgc agacgaaggt 85860
ccaaaggaag aagattttgt tgaagactga aaagagaaat atacttggtg gacagagata 85920
actcctttca gcacagaggt caggtaaggg aatcacagac tgacatttac ccttctctct 85980
gaactctccc aggcctcaac agctcctaat ctttcctttc ttcattctcc ctcctcctca 86040
ttcacatctc tttccccaag aagactcaag aaaaagtcca agataagaaa ttccatttat 86100
aagaaaagga aggcacaggt taatttggtt tatctcctcc aacctcaaca atggatgtga 86160
gttctgacaa ttgcttgtgg ccagaaccaa tcaaactttc cttcctcatt agatgacaag 86220
gctgcagcat gaagaagatg ccatattgtg gaattgggtg tcaaggagaa gacattcgaa 86280
ggtgcatgaa cagagtgaag gtggtgcaag caagtgcaga ggaggtgggg agactggagt 86340
gctgggaaaa gggtcagcag aagctagcaa acatgaaaga cacaacacaa aacaagcagt 86400
tgtgcaaatt aggatgataa ggggggagtg gtcaaaggtg tgtttctcat ggctcaacca 86460
gtgcaaactc agtcttatga ccctacatga ctgactgcac ctggcctctg catcccttca 86520
gcctcttccc caaaaggact cctccttatt gccagccaca caagccttcc ttcatttcct 86580
ctaacaggcc agacttgttc ctggctcccg gtcttggcat tcactgtttt ttctgccata 86640
gctggctcct tcccaaacat ggaatctcag cccaaacaat atctcctctg agacaccagc 86700
cttgatcacc tttatacaat acagatctgc tcctgcccat cactttctat ctcatgaccc 86760
tacaatgtgc cccttcgtga tagctcacac cagctaaaac catcttgttt gtggattgct 86820
cacttgcccc ctgcctgtct ctagctctag gaggtcggct ccctgtcact gtctggtcta 86880
ctgtgtcgta ccacccatgc ccagcaccta gccttgcaca ttataggact taatgcaaac 86940
ttcttgactg aaagaaaaat gaagaaactc agccttggga gagaaaacaa ccattaaatg 87000
attatttaat aaaatagagt attaatctat tttatattaa ttattaattt agttcataaa 87060
atattaattg tctttacaac gaatgtgtcc ttagtcattg gtgtttgtgc tttgtgaatc 87120
ttcacatccc atggggccag taatgggggt gggggtgtag tgtgggaagt ggggcaggga 87180
accaatctgg cctgcagggg ttacctgccc catgggtgcc tgcaggcttc atgtggtttc 87240
agtggcatgg caccctgatg ggaagagtgg ctcagaattg gtggagtatg gtgataataa 87300
aaagcaaaac aacttttagt tgattattgt tttttaattc tataccgact atggcccctt 87360
cactacctgc accctgtgag gagagttttc ccacatctgt cccactccca ccctcacact 87420
ccactggttt tttccccctt cttgagtgaa cacacgcact ggaagagcag gtgtccttga 87480
agggaggacc agctccatga caggacacat gtcctcccaa acacaaacat acgcaaacac 87540
agaacaaatt agaatctatc ctggctcctg agaacacttg ctctcaggcc actaaagcac 87600
cttgataata aattgtcctg tgcctgctac ctctgtctcc acctgctcct ggcagaaatc 87660
tcttccctca ttccagccac tctctggagg gcaggcaggg ttctgtttat ccatgtccac 87720
aggccatgcc aaccaatggc tcatggcttc cccacttcca ggaaagccac atggcccagg 87780
atacaataga gtagggaatg agtaggagga gaactggtct ctttatccca gcaatatgga 87840
ccttgtgatg gaaagagacc taaagacagt cacatttact tctcatctct acccgggccc 87900
tttcacacct aacagagtat ggcaattggt acatggatag cactgagctg agtgacccat 87960
cattacttcc tgccatcgga cacttatgtt ccatcccagt agggttccct agtcacaatg 88020
aagatccagt ctctatgcta cctccatctg atttcttcct tgatctctac tccttttatc 88080
ccactaacaa attttgtatt attacttttc atttattcaa aagtatacat ttgtttgtgc 88140
acaaaaaaat acaatttctt tttttgtatg gttcagattt aaatcccaca tacatgatat 88200
atgcaagcaa gttgctttgc tggggagatt tgtgaaattt cctcacactc atgttgtaag 88260
ctactttgtg gtcctcatct cttttcacat ggacagcact cttacagaaa ttaagaactt 88320
tatttttttg tagaaaacca gatgtaagcc cattgaaagg agaaaccttg gctatctttg 88380
tcattataat aaatctagta tgaaattgtt ggttagaaaa tattaaatga aaggaagaca 88440
gagaaggagg gaagaggaag gtaagaaggg aggagggagc tagagaaaag ggggcgggag 88500
ggagaaaaga aattaagttg tcctgaaact caactgctag gacagttact gtgagtaaag 88560
aggaaataac agtttataga aaaatatgtt tcttattttg aaaaaaaaaa gtttggaata 88620
aaacaaaaaa tacaaagacc cctatttttt agaattatga ggagttggag gagtcactta 88680
aatgtttgtt aaacatcact acttctacct ataaagggga aaatacttat aaagggaaaa 88740
ttttaactag agtgatattt gggacttaaa atgtctggta ccaattttat ccatttctca 88800
tcccagagca ggaagtttgc attgtttatg actgaatatt caagtatctt tcccccacta 88860
ggatttactg taggttcgtg gtagtgacag gggatttaaa tgaaaatttt taggtctcgg 88920
tcagtaaaac gacctgtgtc agcctagaga aagaggaaga gaggagacag ggttgaccca 88980
gcgctggacg agtctgaaga tgtgcatggg gagaaaataa ttgagctcat gtgacccaaa 89040
gtcaagtgta ctctgggttt aggtctcagc tgcagtattt atcggactgt gaggatcatt 89100
tcagctccct gagcctcagt ttactactca tctacagaat ggaattaata acattaaatg 89160
agatgatgca tcactagaca tttagctcag atcatggcat gtattacata tgccacaact 89220
gttagctagt gttatgataa tctttgttat tattatggtc aagatgccta ctgcaagact 89280
aaatatatat caaatgtttt ctgttgagca tacaacttga gcatattttc caacttacct 89340
tacagttcca tgtacccacg tggctggatt ctgaacaatg accacttcca gaccggactt 89400
acaaaatctc tctccacact ctctcatttc cctcatcttc cgagaagatc caatggagga 89460
cttcaaagtc ctagaagatg gcaaagcgac aagacagaaa gaatgtcatc catgaatgac 89520
cacgtggagc agagctccca ctccctgccc tgctgtccca cattgcacaa gaatgtgaca 89580
tagaaacaca atttcatttc tcttatgtca cggaaatttg aggactcttc cttatagttg 89640
ctagtattaa ttaccctagc taatgccaag gaagaccaaa aagtctttcc aatgctttgt 89700
aaggactaac cagaagacac acataaacac agctttgctc aaattcattt ttgtcacaaa 89760
tcacttcttc agggcctcag aatgtgaatt ccagctgctc tgtcaaccaa tgtctagaaa 89820
catttttgct gttgagtgca aagtcttcat tcatgagggt gctctccaaa cgcattcatt 89880
ccatggtgtt catttcttgg tatagaagca tatgaggaac agcacactcc ctggatctat 89940
atactacatt acctgtatta ataagaatgc taggctgtac ccattcatta tctaccagcc 90000
cgccagacaa aatgattcac cctagactta caggttgaag tcaattgagt atcctttgaa 90060
ctggagggag aggcgcttcc ataaagtggt gagagcttta tggcagaaag ttctattaat 90120
gaccccactt cagtgcttat caggagcagg ccatataatc ccttcccgga attacatgct 90180
ggtcggttca gataaataac ccagatctct gtcatttata atccaaaacg ttaacaatta 90240
atttccaaaa tcaatcctga agggggctag aagcctaaat cgctaggtcc aggcagaccc 90300
cactccatga atttctcatg agtcaaaatt taagcctcga aacttgtaac taactgttgt 90360
caagacacag ctgacttagg caatcaagac aacagtattc agcagtaacc tgggtgaaac 90420
atactctaag tgtgaattaa taagtcggct gacaccaggc cccagatgtt tcccactctg 90480
gcaatatgcc tgaagtgatg ataagcagat ttacatactt aactaatatg tttatttaaa 90540
agaaatttcc aaatccaaaa taacatccag atttcttatt tggctgcaga tcaaaagaca 90600
tcctatcaat aaagacagaa tccaggataa accttttcaa catctgctta aaaccaaaca 90660
acagatttga gagttttggt aaaacttaat tgcagacaaa tttcactgcc tcttacataa 90720
atatatattt tcatgtccct ggggtggttc tgacctcatc aattttcgtg ttcacaatac 90780
acaacattgt tcttttacca gcaccaacaa ttctgccttt atggagaatt cccatcccaa 90840
ggttttcttt cagactgaag gataaacaga ctttctctct ggccaggaaa agtcgaacaa 90900
aagtcagggg catgtgctaa cacttggaat gttgtagaaa agaaaaatcg acccctctac 90960
cagtaagatc tttgtttttc tataaatatt agaaagcatt tatttggtct ccatctccga 91020
taaatctgga aggagaatag aaaagtagag atgctccttg agtattacat tttttttttt 91080
tcttttcggt ggtgttgatt ccccaaggga gagcttagta actggatcaa agtcttaaca 91140
gatctgtgtg cttgtgaagg agatgataat aggaggggtg ttggccatag tagcacttat 91200
ccctttagtg tgaattagtt cactttcttc aggtcttagc tgtctgaaat tggaccatga 91260
tccttgggca ctgagacatt tttctcccat ctggccagtg ctgcaattga gctaaggatt 91320
tggttcagag actcttgttg cctggggatc tgtttaatgt caagaccgat attagctggt 91380
tgaccctggg gtcgggtgac ttagagagtc agaagtcatc catgtttgct gctgctccac 91440
cctttgaact tagtcatgat aaactcctgg gtccaatcct gttacagcca aaatagcaag 91500
aaaagagtgg tagaagcaat cagaaaaatg catagtaagg caccaatgag ataccatctt 91560
cctcttctca attggcatac actttaaaat agcggtgttc agtcttttgg cttccctggg 91620
ccacactgga agaagaattg tcttgggcca cacataaaat acactaacac caatgataac 91680
tgatgggcaa aaaaaaaaaa aaagaatcac aaaaaatttc tcataatgtt ttaagaaagt 91740
ttacaaattt gtgttgggcc gcattcaaag ccatcctggg ccacatgcag gacaagcttg 91800
ctttaaaata tcccatttga agacagttca gatctcccca gttatagatg atttatcaaa 91860
taactatgta tgtatgaaat taatatatca aaagccttaa aacatttcca acctttgacc 91920
aaaaaattgt tcttctagga tgtatcttaa gacataatta tgatttgtgc acaaatttag 91980
ctatgaaaat gtagttttac ttatgatatg acaaaaatat cacaaatgac ctaggtgtca 92040
aacaatagag accagttaat taaatgatgt tccacaactt atataattat taaaaacatt 92100
taggatattt acatttaata aaacccatag tgagggcatt tagattgttt ctaatttgga 92160
cttttatgaa taaagctact atgaaattat tgtatagttt ttctttttat aaatagatgc 92220
tttcatctgt tttgggtaac cctccatgag taaaatagct ggattatatg ggaaataaat 92280
gtttaacttt ataaagaact accaaacttg tttccaaagt gattatatca ttttacaaca 92340
ctgcaacaat gtatgaaaat tctagttgct ccacctcctt ctcaatactt ggtttcccaa 92400
tcattttaat tttagccatt ctggcaggtg tgtagtgata tgtcattatc gttttaattt 92460
acattcccct aataattaag aatgtgagca tcttttcatg tgcttattct ccacttgggt 92520
attttatttt gtgagttgac tattcaaatc ttcttttcat tttttattag gtcatttgtc 92580
ttattgagtt gtaggagttc ttcatatatt ctggatataa gccctttgtc agatgttttg 92640
caaatattat ctcccaacct gtggttttca ttttcatttt gtttatagtt tctttctttc 92700
tttctttctt tctttctttc tttctttctt tctttctttc tttctttctc tttctttctt 92760
ttctttcttc ctttatttct ttttcttttc tttttttttt ttttggtgag acagtctcac 92820
tccatcaccc agactgcagt gcagtggcac catctcacct cactgtaacc tccacctgct 92880
gggttcaagt gattctcatg tagcagcccg gattacaggc acttgccacc acactcagct 92940
aatttttgta tttttagtag agacagggtt ttgccatgct ggccagcctg gtctctaact 93000
cttgacctca agagatctgc ccacctcggc ctctcaaagt gctgggatta caggcgtgag 93060
ctaccgtgac tggcttcatc atagtatctt tctaagtaca gaaattttga acttaagttg 93120
cttttgagaa aaagaaatgt tgtggtgctt agtgaaaaga ttcaagagca cctgcctttc 93180
aacccctgct cagcctctgt ttttttactt ggctgccaac tctcttgctg tgtggacttt 93240
tcctcatcaa tccaaccatc tggtgcctac tggtggaagc tgtgagtggg taaaggccaa 93300
tgaggtgtca gggaacaaca gtagaaacag aagccaaacc taacctgccc tggagcttcc 93360
catgtgctct agaaagggaa gtgccttgtc tgctgaggca ccttctagta ctttccagct 93420
ttaaacgaag catggatctt ttccttcaca attaacaaaa gcccttgttc aggtatgttt 93480
ggcacgtgct gtcatgcttc tttgtcacaa gcaaaacaag aaactaggga tccttcaaaa 93540
ttctattaga aaatagacct ttcaggaaat gttgcagaat tggctttctg ggatatggga 93600
ccaaatattc cttcattccc tgagaattga cttctttctg ctgtatgctc caaatgaact 93660
ccatatatac atacctcatc atgcctctaa atttttaggg cacacatttc tttacatgtc 93720
tacctcctgc aattacactg gaagcccctt gaaagcatga ccatgttttg tacatctttg 93780
tatgtatagt gcctgtctta gtccatttct attgctgtaa gaaaatacct taaatctggt 93840
aaattataaa tcatagagat ttatttctca caatcctgac gactgggaag tccaacatca 93900
gggcaccaga agatttgatg tctgcagagg gctgtctctg ctttcaagat ggtgccttct 93960
tggtgcatcc tcacatagca aaatgacaga gagtaaaaag gactaaacag acttctttaa 94020
gatgttttac aagggcacta attccattca taagggcagg gcctcataac ctaatcacct 94080
cctaatggcc ccacctctta ataccattgc attggtgatt aagttttaca aattttagaa 94140
agacacaaac attcaaacca tagcagtgcc taccacagaa ctgatacaga atgagaactc 94200
aatggatact acttgaatgg ctgaatgaat gaagtgaatt aattgttcgt atccccaaat 94260
ctgagagata tctctctgtt taataatcta ttttgttaaa actttgctct ggagttggac 94320
agacctggga tcacatctca gctccagttc ttgctagctg tgtaactgag acaaagttct 94380
cagcttcctt tgagtcccat ggcttattaa aggggaacaa tggttataat tataataact 94440
acctcatgag tgtgtatgga ctcaatgagt taacacaaag tgtgtaagcc agtgcctggt 94500
tcttagtaag tgctctgtaa atgttagctt tggttattta catgctgtgt tttatgtgac 94560
ccatttctta tgaaataatg tttgctacaa gtagaagatg atggtgatgg ccaaatgtgc 94620
attatatatt ttagtgttca taacaaccag ttattattat ccttttttca gttgtaattg 94680
aagtgacatg cgtgaggtca caaagccagt gataaagctg ggattcagac tcaggctgac 94740
catactttaa tctctaaaca tagtcactct gtcccttcac acaggaaagc attctctgat 94800
ttggaggaga gaattcctgt agccaaggat ggtggcataa gccatagaca tggggctgtc 94860
aaattgctta gcctagaaga acaagagtca gccaactttg gggactccct gttctatccc 94920
cctccctctt atggcaatag gattaagttc tgtgtattag tccattttca tgaggctgat 94980
aaagacatac caaagactgg gtaatttact taaaaaaaaa aaaaaagagg tttaatggac 95040
tcagagttcc acatggctgg ggaggcctca caatcatggc agaagacaaa agtcacatct 95100
tacatggtgg cagacaagag agaatgagag ccaagtgaaa gggggatctc tctttataaa 95160
accatcagat ctcgtgagac ttactcacta ccatgagaac agtatgagga aactgtcccc 95220
catgattcat ttctctccca ccaggtccct cccacaacac ttaggaatta tgggatctac 95280
aattcaagat gagatttggg tggggacaca gccaaatcat atcaagtata ttgcagaaaa 95340
catgaataac agtggctaaa acaagataca attttttttc tcttacataa gaaaagagca 95400
gcctaaagct tatttagcct aaagctggta tggtgggttc cagtccacag gaccagggtt 95460
ctactttttt gctccttgaa aataagcatc caggagaaat gctgttcttc ctcacggggc 95520
ctgagattct cctctcctac caagtgtcac ctttctgctg gtctgcagaa actcctctgt 95580
ctcttcaggc agcagcacca gatacaccaa gcagaccaaa acaacatcac aaaggctctg 95640
aaaattaaac tgtctttgta accacagtcc acgaaactat gccaagacct ccgtgctaaa 95700
cctaaacagg ctgactgcct gctaaaataa aagattaaaa caggatccag agtctcctaa 95760
tataatagcc aaaatgttca gtatacagta aaaagccatg acactgagaa ccaagcaaaa 95820
cacaagtgaa ctaaaaaaga ccatcaactg acagccatgc tcagatgaat cagatgctgg 95880
aattgcctaa caaggatttt aaaggagaca gaaatgcttc aacaatcaat tacacattct 95940
cttgaaacaa ataaaaaaaa tataaaatct gggcaaaaaa tagttttttt atttttttaa 96000
aaaaaggaaa ccacagaact ctaaaatatg cagaaactct aaaataaaac agaaatagaa 96060
agggcatgtc tcctagccag atcagccatt caaagaagtg cagaagaact attcaatgat 96120
tttcacctaa tttccttggc tactttccag ctgcaaggaa tgctgggaaa tgtagtcttt 96180
aagcaggcac accaatgata gactggattt ttgtttacca ggtaaaagga aagaatatgt 96240
atcgggttac taagctaccc aggtctgccc ctgacacaaa gggctcatac attgggaaca 96300
aaatcaaggc tctgggagtt tacattggaa tatgatctta ctgtggataa gaccaaagaa 96360
atcctgtgca cacggatgag gattataaat cctggttcag gctggcatga tccacagttg 96420
ccacgattcc tgtatgcctg cagaaagaca acttaatgtg gcctaatgtt actaacatct 96480
cgacaggctc accttttgag ggaaggccat ttaattacct gattaatttg ctcatcttaa 96540
ttaacttgtt cctattgttg ataaccttgt attgattgct ctgctggtag taattagaaa 96600
actggtaaag aagtaaggag agaagcccaa agaggggggc agcacagcac acagattgtc 96660
ttcctgtctc ctaagaatct actgtgtagg ctgtgagctt agcatatttg cttctctttt 96720
taggtaaata tgttatagac acaaatgatg ttctctgttg attatttata accactccac 96780
gttccttctt agagtatctg cccttttcat tttttcaaag actcagctct catgagcccc 96840
acatgacctg ctacccccat caaccacagc tgattggata agcacctgac ctagactgtg 96900
ccagtcacat ttgattgttt cagatttctg aatcagagca tgaagaaaca gtaccagtta 96960
actttggatg ctgaaactat aggacgatgc agacttggaa ggtggacaag gtagctattt 97020
cgtgatagcc accatggacc ctgtattccc accaacaatc agagagcact tgtcagttaa 97080
gttcaccaga ctcctaatgg cattatagtt ctcccaccaa acttcttgcc ccagggtgta 97140
tggactatct ctgattattt gatagaagtt tccctgtaca ttagctgact caagttcatt 97200
gccatttttt gcaacccaaa gagtcccttc tataacaaag cactctcatc attgacttct 97260
ctctatctta gttttaagtg tctctggtga aaatgcaaat ttaaaggacc tattaaaaac 97320
aacagagtgg gagttgctat caaataaagt ataaactgct aaactgctaa ggcctctatc 97380
aagaccaatg ctgtgctaac tctttccaac ccagtaaaac gaggctttat tgtccaccac 97440
taacatgtca ccacctcccc tattgacttc agtcctttgg gaccccctaa ctctcatacc 97500
ccacccagct tccgagaact ctattgcctc ccagaagtaa tcatagtcaa cacttagtgg 97560
tagttatttt ggcttgaggc catggccttg caaagctggt attgaagtga tgctctcata 97620
tctaatttga ctgaattgag tgttccagta agactggtga tgttttcctt gcttcagggt 97680
ccatcctaat gagcaaatgc tgccttactt tcacagaagg ctgcaaatgt agacttgtaa 97740
agaaaatctt tacaaacact tcttggtgtc ttagagatca cccaacacaa ttacacatgg 97800
ggatatgctg ggaagtacta aaataaacct gatttatcct tcacatatgc ctttcatttg 97860
ctattgtggc ttcaaagctc aaaaaaaata gagagatgtt tctctaaact ttcactattt 97920
attaactgag aatgtaacgg aagtgaaaca gccaacaaaa attaaaagca gcttactcag 97980
ggatacagag tcatgactat gtggagcccc atatctttac ttctttgtct aaagtcctca 98040
taagcactgt ctgagtttgc atgagtccta caaactagaa caactcccaa cttcattgag 98100
aagaatgagg acatctttgc aaagaaggca gaggaaagcc acatgctact tgtaacactt 98160
tgatggctac ccagtgccaa ggtttttttt ttttttttta acaatcctga cagcagaaat 98220
ctggaagctt gatcctagaa gactgaagag cccccaacat gaccctgaac tctcacataa 98280
gagaggaact cttagttcgt ttgccattaa gagaaaacca cagactaggt catttataat 98340
gaacagaaat ttattttctc acagttctaa atgctgggac atccaagatc atgggacccg 98400
catccgacaa gagtgttcta gctgcatcat tccatggtgg aatggccaga gagggtgagg 98460
gagagaagca aaagggggcc aaactcatcc ctctgtaagg aactccctcc tgagataaca 98520
gcattaatca ttcatcaggg cagagccctc acggcctaat caccttttaa aggtcctatc 98580
tcttaatact gttataatta aacttcaacc tacatttggg agggaacaaa cattcaagcc 98640
acagtagaaa ccagcttctt tttctgttgt taaagcaaca ctttttttct tctctgttac 98700
ttgcagccta accagatcct aataaataca caagcttcta tgtcgacaaa tatgtctaca 98760
atgctgttta aatggcagca tggtattcta ggatagggaa gggccaccat ttactcaacc 98820
agcccattct tggaggatgt ttaagctatt tccaatattt tgctatgttc aacaaagtat 98880
taaggatctc cctagtagct aagcacccat gtaaatcctt agatatctta ggataaacct 98940
gtaaactagt ttatgtgtcc tagtttagct gggcccagct ggaccatcac acatatttaa 99000
atttttttga aacttattgc caacatgcat ctccagagag gtagtacacc aaattatgct 99060
cctacaaaag ttgcagaaac ttgcctgtct atccatactg tcacccacaa tggtgattat 99120
tactttttat ctgtgacaat ttgatttatg ctgggatttt gcagccagca ccaaggtagc 99180
atgttgtctc tcagtctaat aataatttcc ctctccctca tcatcatcac cagcactacc 99240
aatttctctg cactatgggt actaacatca aaaatgttcc catcacattt acttcatttt 99300
gaggaaaaga acagttacta ccattcattc attcactcat cacaccaata ttactgaatc 99360
ctaccctgga ccagcattgt tatggtagat cttgataata tagtgacaga caataccatc 99420
cttcccacca tttacatagt agactgcctg gggctcatag tctactcaca tctcagcaca 99480
tgagatagtc ccattatcac attctcttct atctctctca caggcactca ctcaccagcc 99540
atggagaact taatgggcat taggttctta atcctgctgg gtataattgg agataaccac 99600
cctggctgac tgagcactat accaggctac tcatggatga tttggttatt agacgtaatc 99660
agagtggccc ttgtatgcta aaaaggagac tcagtctcca tcccatggaa gattacattt 99720
ttctgactgc catccctcag atctagatgg tattgtctcc ctgacatcca aatatcttca 99780
atcatataac c 99791
Claims (56)
- 개인으로부터 수득된 핵산 시료 또는 개인으로부터 유래된 유전형 데이터세트(genotype dataset)에서 하나 이상의 다형성 마커의 하나 이상의 대립인자의 존재 또는 부재를 결정하는 단계를 포함하는, 개인에서 유방암에 대한 감수성을 결정하는 방법으로서, 상기 하나 이상의 다형성 마커는 표 10, 표 15 및 표 19 중 하나에 표시된 다형성 마커들, 및 이들과 연관 불균형(linkage disequilibrium)인 마커들로부터 선택되고, 상기 하나 이상의 대립인자의 존재는 상기 개인의 유방암에 대한 감수성을 나타내는 것인 방법.
- 제1항에 있어서, 상기 하나 이상의 다형성 마커는 서열번호 4, 서열번호 5 또는 서열번호 6으로 표시된 서열을 갖는 게놈 세그먼트 내에 위치하는 것인 방법.
- 제1항 또는 제2항에 있어서, 상기 하나 이상의 다형성 마커는 표 10, 표 15 및 표 19 중 하나에 표시된 마커들로부터 선택되는 것인 방법.
- 제1항 내지 제3항 중 어느 한 항에 있어서, 상기 하나 이상의 다형성 마커는 rs4848543 (서열번호 1), rs3803662 (서열번호 3) 및 rs13387042 (서열번호 2)로부터 선택되는 것인 방법.
- 제1항 내지 제4항 중 어느 한 항에 있어서, 상기 개인에서 하나 이상의 일배체형의 빈도를 평가하는 단계를 더 포함하는 것인 방법.
- 제1항 내지 제5항 중 어느 한 항에 있어서, 상기 하나 이상의 대립인자 또는 일배체형의 존재에 의해 부여된 감수성은 증가된 감수성인 것인 방법.
- 제6항에 있어서, 마커 rs4848543의 대립인자 A, 마커 rs3803662의 대립인자 T 및/또는 마커 rs13387042의 대립인자 A의 존재는 유방암에 대한 증가된 감수성을 나타내는 것인 방법.
- 제6항 또는 제7항에 있어서, 상기 하나 이상의 대립인자 또는 일배체형의 존재는 1.20 이상의 상대적 위험도(relative risk, RR) 또는 오즈비(odds ratio, OR)를 갖는 유방암에 대한 증가된 감수성을 나타내는 것인 방법.
- 제6항 또는 제7항에 있어서, 상기 하나 이상의 대립인자 또는 일배체형의 존재는 1.25 이상의 상대적 위험도(RR) 또는 오즈비(odds ratio, OR)를 갖는 증가된 감수성을 나타내는 것인 방법.
- 제1항 내지 제5항 중 어느 한 항에 있어서, 상기 하나 이상의 대립인자 또는 일배체형의 존재에 의해 부여된 감수성은 감소된 감수성인 것인 방법.
- 제1항 내지 제10항 중 어느 한 항에 있어서, 표 10, 표 15 및 표 19에 표시된 마커들 중 하나와 연관 불균형이 아닌, 유방암에 대한 하나 이상의 위험 변이의 하나 이상의 위험 대립인자의 존재 또는 부재에 대해 개인으로부터 수득된 게놈 DNA를 포함하는 시료 또는 개인으로부터 유래된 유전형 데이터세트를 분석하는 단계를 더 포함하는 것인 방법.
- 제1항 내지 제9항 중 어느 한 항에 있어서, 두개 이상의 다형성 마커에서 하나 이상의 대립인자의 존재 또는 부재를 결정하는 단계를 포함하고, 상기 두개 이상의 다형성 마커에서 상기 하나 이상의 대립인자의 존재는 유방암에 대한 증가된 감수성을 나타내는 것인 방법.
- 제1항 내지 제12항 중 어느 한 항에 있어서, 상기 개인으로부터 수득된 핵산 시료 또는 상기 개인으로부터 유래된 유전형 데이터세트에서 유방암에 대한 하나 이상의 고 침투성 유전적 인자(high penetrant genetic factor)의 존재 또는 부재를 결정하는 단계를 더 포함하는 것인 방법.
- 제13항에 있어서, 상기 고 침투성 유전적 인자는 BRCA2 999del5인 것인 방법.
- 제1항 내지 제14항 중 어느 한 항에 있어서, 에스트로겐 수용체 또는 프로게스테론 수용체 상태에 대해 상기 개인을 평가하는 단계를 더 포함하는 것인 방법.
- 제15항에 있어서, 상기 개인에서 에스트로겐 수용체 양성 상태 또는 프로게스테론 수용체 양성 상태는 유방암의 증가된 위험도와 연관된 것인 방법.
- 제16항에 있어서, 상기 유방암의 증가된 위험도는 rs13387042 대립인자 A 및/또는 rs3803662 대립인자 T, 및 이들과 연관 불균형인 마커들과 연관된 것인 방법.
- 제1항 내지 제17항 중 어느 한 항에 있어서, 상기 개인의 위험도 평가, 진단, 또는 예후의 판단을 수행하기 위해 비-유전적 정보(non-genetic information)를 분석하는 단계를 더 포함하는 것인 방법.
- 제18항에 있어서, 상기 비-유전적 정보는 연령, 성별, 민족, 사회경제적 지위, 과거 질병 진단, 개인의 병력(medical history), 유방암의 가족력(family history), 생화학적 척도, 및 임상적 척도로부터 선택되는 것인 방법.
- 제11항 내지 제19항 중 어느 한 항에 있어서, 통합 위험도(combined risk)를 계산하는 단계를 더 포함하는 것인 방법.
- 개인으로부터 수득된 핵산 시료 또는 개인으로부터 유래된 유전형 데이터세트에서 하나 이상의 다형성 마커의 하나 이상의 대립인자의 존재 또는 부재를 결정하는 단계를 포함하는, 이전에 유방암으로 진단되었던 개인에서 하나 이상의 제2 원발성 종양(second primary tumor)을 발병할 위험도를 결정하는 방법으로서, 상기 하나 이상의 다형성 마커는 표 10, 표 15 및 표 19 중 하나에 표시된 다형성 마커들, 및 이들과 연관 불균형인 마커들로부터 선택되고,상기 하나 이상의 대립인자의 존재는 하나 이상의 제2 원발성 종양을 발병할 위험도를 나타내는 것인 방법.
- 제20항에 있어서, 상기 하나 이상의 다형성 마커는 rs4848543 (서열번호 1), 및 그와 연관 불균형인 마커들인 것인 방법.
- 개인에서 유방암에 대한 감수성을 평가하기 위한 키트로서, 상기 키트는 상기 개인의 게놈에서 하나 이상의 다형성 마커의 하나 이상의 대립인자를 선택적으로 검출하는 시약을 포함하고, 상기 다형성 마커는 표 10, 15 및 19에 표시된 마커들, 및 이들과 연관 불균형인 마커들로부터 선택되고, 상기 하나 이상의 대립인자의 존재는 유방암에 대한 감수성을 나타내는 것인 키트.
- 제23항에 있어서, 상기 하나 이상의 다형성 마커는 rs4848543 (서열번호 1), rs3803662 (서열번호 3) 또는 rs13387042 (서열번호 2)인 것인 키트.
- 제23항 또는 제24항에 있어서, 상기 시약은 상기 하나 이상의 다형성 마커를 포함하는 상기 개인의 게놈의 단편에 혼성화하는 하나 이상의 연속된(contiguous) 올리고뉴클레오티드, 완충액 및 검출가능한 표지를 포함하는 것인 키트.
- 제23항 내지 제25항 중 어느 한 항에 있어서, 상기 시약은 상기 개인으로부터 수득된 게놈 핵산 세그먼트의 반대쪽 가닥에 혼성화하는 한 쌍 이상의 올리고뉴클레오티드를 포함하고, 상기 각 올리고뉴클레오티드 프라이머 쌍은 하나의 다형성 마커를 포함하는 상기 개인의 게놈의 단편을 선택적으로 증폭시키도록 설계되고, 상기 단편은 크기가 30 bp 이상인 것인 키트.
- 제25항 또는 제26항에 있어서, 상기 하나 이상의 올리고뉴클레오티드는 상기 개인의 게놈에 완전히 상보적인 것인 키트.
- 제23항 내지 제27항 중 어느 한 항에 있어서, 상기 키트는:d. 길이가 5 내지 100개의 뉴클레오티드로 구성된 검출 올리고뉴클레오티드 프로브;e. 길이가 5 내지 100개의 뉴클레오티드로 구성된 인핸서 올리고뉴클레오티드 프로브; 및f. 엔도뉴클레아제 효소;를 포함하고,상기 검출 올리고뉴클레오티드 프로브는 서열번호 4, 서열번호 5 또는 서열번호 6으로 표시된 뉴클레오티드 서열의 핵산의 제1 세그먼트에 특이적으로 혼성화되고; 및상기 검출 올리고뉴클레오티드 프로브는 3' 말단에 검출가능한 표지를 포함하고 5' 말단에 퀀칭 모이어티(quenching moiety)를 포함하며;상기 인핸서 올리고뉴클레오티드는 길이가 5개 내지 100개의 뉴클레오티드로 구성되고, 상기 올리고뉴클레오티드 프로브의 5'에 배열된 상기 뉴클레오티드 서열의 제2 세그먼트에 상보적이어서, 상기 인핸서 올리고뉴클레오티드는 상기 두개의 올리고뉴클레오티드가 모두 상기 핵산에 혼성화되는 경우 상기 검출 올리고뉴클레오티드에 대해 3'에 위치하며; 및상기 제1 세그먼트와 상기 제2 세그먼트 간에 단일 염기 갭이 존재하여, 상기 올리고뉴클레오티드 프로브와 상기 인핸서 올리고뉴클레오티드 프로브가 모두 상기 핵산에 혼성화되는 경우, 상기 올리고뉴클레오티드 간에 단일 염기 갭이 존재하며; 및상기 핵산을 상기 엔도뉴클레아제에 의해 처리하는 단계는 상기 검출 프로브가 상기 핵산에 혼성화된 경우, 상기 검출 프로브의 3'말단으로부터 상기 검출가능한 표지를 절단하여 유리 상태의 검출가능한 표지를 방출시키는 것인 키트.
- 개인에서 유방암에 대한 유전적 지표(genetic indicator)를 결정하는 장치로 서,컴퓨터 판독가능한 메모리; 및상기 컴퓨터 판독가능한 메모리 상에 저장된 루틴(routine)을 포함하고,상기 루틴은 표 10, 표 15 및 표 19에 표시된 마커들, 및 이들과 연관 불균형인 마커들로부터 선택되는 하나 이상의 다형성 마커에 대해 하나 이상의 다형성 마커 및/또는 일배체형 정보를 분석하고, 상기 마커 또는 일배체형 정보에 기반한 결과물(output)을 생성하기 위해 프로세서 상에서 실행되도록 개조되고, 상기 결과물은 상기 개인의 유방암의 유전적 지표로서 상기 하나 이상의 마커 또는 일배체형의 개별적인 위험도 척도(risk measure)를 포함하는 것인 장치.
- 제29항에 있어서, 상기 루틴은 상기 하나 이상의 마커 대립인자 및/또는 일배체형과 연관된 유방암의 위험도 척도를 더 포함하고, 상기 위험도 척도는 유방암으로 진단된 복수의 개인에서 하나 이상의 다형성 마커의 하나 이상의 대립인자 및/또는 하나 이상의 일배체형의 빈도의 지표와 복수의 기준(reference) 개인에서 상기 하나 이상의 다형성 마커의 하나 이상의 대립인자 및/또는 일배체형의 빈도의 지표의 비교에 기반하며, 상기 개인의 개별적인 위험도는 상기 하나 이상의 마커 대립인자 및/또는 일배체형에 대한 상기 개인의 보인자 상태(carrier status)와 상기 하나 이상의 마커 대립인자 및/또는 일배체형에 대한 위험도 척도의 비교에 기반하는 것인 장치.
- 제29항 또는 제30항에 있어서, 상기 하나 이상의 다형성 마커는 rs4848543 (서열번호 1), rs3803662 (서열번호 3) 또는 rs13387042 (서열번호 2), 및 이들과 연관 불균형인 마커들로부터 선택되는 것인 장치.
- 제1항 내지 제31항 중 어느 한 항에 있어서, 마커들 간의 연관 불균형은 r2 및/또는 |D'|의 특정한 수치값을 특징으로 하는 것인 방법, 키트, 또는 장치.
- 제1항 내지 제32항 중 어느 한 항에 있어서, 연관 불균형은 0.2 이상의 r2값을 특징으로 하는 것인 방법, 키트, 또는 장치.
- 유방암에 대한 감수성을 평가하기 위해 이용될 마커를 확인하는 방법으로서, 상기 방법은d. 서열번호 4, 서열번호 5 및 서열번호 6으로 표시된 서열을 갖는 게놈 세그먼트 내의 하나 이상의 마커와 연관 불균형인 하나 이상의 다형성 마커를 확인하는 단계,e. 유방암으로 진단되거나 또는 유방암에 대한 감수성을 갖는 개인의 시료의 유전형 상태(genotype status)를 결정하는 단계, 및f. 대조군 개인의 시료의 유전형 상태를 결정하는 단계를 포함하고,상기 대조군 시료에서의 하나 이상의 다형성의 하나 이상의 대립인자의 빈도 대비, 유방암으로 진단되거나, 또는 유방암에 대한 감수성을 갖는 개인에서 상기 하나 이상의 대립인자의 빈도의 유의성 있는 차이는 상기 하나 이상의 다형성이 유방암에 대한 감수성을 평가하기 위해 유용하다는 것을 나타내는 것인 방법.
- 제34항에 있어서, 상기 대조군 시료에서의 상기 하나 이상의 다형성의 하나 이상의 대립인자의 빈도 대비, 유방암으로 진단되거나, 또는 유방암에 대한 감수성을 갖는 개인에서 상기 하나 이상의 대립인자의 빈도의 증가는 상기 하나 이상의 다형성이 유방암에 대한 증가된 감수성을 평가하기 위해 유용하다는 것을 나타내는 것인 방법.
- 제34항 또는 제35항에 있어서, 상기 대조군 시료에서의 상기 하나 이상의 다형성의 하나 이상의 대립인자의 빈도 대비, 유방암으로 진단되거나, 또는 유방암에 대한 감수성을 갖는 개인에서 상기 하나 이상의 대립인자의 빈도의 감소는 상기 하나 이상의 다형성이 유방암에 대한 감소된 감수성 또는 보호를 평가하기 위해 유용하다는 것을 나타내는 것인 방법.
- 제34항 내지 제36항 중 어느 한 항에 있어서, 상기 서열번호 4 내의 하나 이상의 마커는 표 20에 표시된 마커들로부터 선택되는 것인 방법.
- 제34항 내지 제36항 중 어느 한 항에 있어서, 상기 서열번호 5 내의 하나 이 상의 마커는 표 21에 표시된 마커들로부터 선택되는 것인 방법.
- 제34항 내지 제36항 중 어느 한 항에 있어서, 상기 서열번호 6내의 하나 이상의 마커는 표 22에 표시된 마커들로부터 선택되는 것인 방법.
- 제34항 내지 제36항 중 어느 한 항에 있어서, 서열번호 4, 서열번호 5 및 서열번호 6에 표시된 서열을 갖는 게놈 세그먼트 내의 하나 이상의 마커와 연관 불균형인 하나 이상의 다형성 마커는 rs4848543 (서열번호 1), rs3803662 (서열번호 3) 및 rs13387042 (서열번호 2)로부터 선택되는 것인 방법.
- 유방암에 대한 위험을 갖거나, 또는 유방암으로 진단된 개인으로부터 수득된 핵산 시료에서 하나 이상의 다형성 마커의 하나 이상의 대립인자의 존재 또는 부재를 결정하는 단계를 포함하는, 개인으로부터 수득된 핵산 시료의 유전형을 분석하는 방법으로서, 상기 하나 이상의 마커는 표 10, 표 15 및 표 19에 표시된 마커들, 및 이들과 연관 불균형인 마커들로 구성된 군으로부터 선택되고, 상기 하나 이상의 다형성 마커의 상기 하나 이상의 대립인자의 존재 또는 부재는 유방암의 감수성을 나타내는 것인 방법.
- 제41항에 있어서, 상기 하나 이상의 마커는 rs4848543 (서열번호 1), rs3803662 (서열번호 3) 및 rs13387042 (서열번호 2)로부터 선택되는 것인 방법.
- 제41항 또는 제42항에 있어서, 유전형 분석은 상기 하나 이상의 다형성 마커를 플랭킹(flanking)하는 뉴클레오티드 프라이머 쌍을 이용한 중합효소 연쇄 반응(PCR)에 의해, 상기 하나 이상의 다형성 마커를 포함하는 핵산의 세그먼트를 증폭하는 단계를 포함하는 것인 방법.
- 제41항 내지 제43항 중 어느 한 항에 있어서, 유전형 분석은 대립인자-특이적 프로브 혼성화, 대립인자-특이적 프라이머 연장(primer extension), 대립인자-특이적 증폭, 핵산 서열결정(nucleic acid sequencing), 5'-엑소뉴클레아제 처리(exonuclease digestion), 분자 표지 분석법(molecular beacon assay), 올리고뉴클레오티드 라이게이션 분석법(oligonucleotide ligation assay), 크기 분석, 및 단일 가닥 구조 분석(single-stranded conformation analysis)으로부터 선택된 방법을 이용하여 수행되는 것인 방법.
- 제44항에 있어서, 상기 방법은 대립인자-특이적 프로브 혼성화를 포함하는 것인 방법.
- 제45항에 있어서, 상기 방법은 DNA 서열결정을 포함하는 것인 방법.
- 제41항 내지 제45항 중 어느 한 항에 있어서,3) 상기 핵산의 카피를 검출 올리고뉴클레오티드 프로브 및 인핸서 올리고뉴클레오티드 프로브와, 상기 올리고뉴클레오티드 프로브와 상기 핵산 간의 특이적 혼성화 조건 하에 접촉시키는 단계로서,a) 상기 검출 올리고뉴클레오티드 프로브는 길이가 5 내지 100개의 뉴클레오티드로 구성되고 서열번호 4, 서열번호 5 또는 서열번호 6에 의해 주어진 뉴클레오티드 서열을 갖는 핵산의 제1 세그먼트에 특이적으로 혼성화되고,b) 상기 검출 올리고뉴클레오티드 프로브는 3' 말단의 검출가능한 표지 및 5' 말단의 퀀칭 모이어티(quenching moiety)를 포함하며,c) 상기 인핸서 올리고뉴클레오티드는 길이가 5 내지 100개의 뉴클레오티드로 구성되고 상기 올리고뉴클레오티드 프로브의 5'에 배열된 상기 뉴클레오티드 서열의 제2 세그먼트에 상보적이어서, 상기 두개의 올리고뉴클레오티드가 모두 상기 핵산에 혼성화되는 경우 상기 인핸서 올리고뉴클레오티드는 상기 검출 올리고뉴클레오티드에 대해 3' 에 위치하며, 및d) 상기 제1 세그먼트와 상기 제2 세그먼트 간에 단일 염기 갭(single base gap)이 존재하여, 상기 올리고뉴클레오티드 프로브와 상기 인핸서 올리고뉴클레오티드 프로브가 모두 상기 핵산에 혼성화되는 경우, 상기 올리고뉴클레오티드 간에 단일 염기 갭이 존재하는 것인 단계,4) 상기 검출 프로브가 상기 핵산에 혼성화되는 경우, 상기 검출 프로브의 3' 말단으로부터 상기 검출가능한 표지를 절단하여 유리된 검출가능한 표지를 방출시키는 엔도뉴클레아제로 상기 핵산을 처리하는 단계, 및5) 유리된 검출가능한 표지를 측정하는 단계로서, 상기 유리된 검출가능한 표지의 존재는 상기 검출 프로브가 상기 핵산의 제1 세그먼트에 특이적으로 혼성화되고, 상기 다형성 부위의 서열이 상기 검출 프로브의 상보체(complement)라는 것을 나타내는 것인 단계를 포함하는 것인 방법.
- 유방암 치료제에 대한 반응의 확률에 대해 개인을 평가하는 방법으로서, 상기 개인으로부터 수득된 핵산 시료에서 하나 이상의 다형성 마커의 하나 이상의 대립인자의 존재 또는 부재를 결정하는 단계를 포함하고, 상기 하나 이상의 다형성 마커는 표 10, 표 15 및 표 19에 표시된 마커들, 및 이들과 연관 불균형인 마커들로 구성된 군으로부터 선택되고, 상기 하나 이상의 마커의 상기 하나 이상의 대립인자의 존재는 상기 치료제에 대한 양성 반응의 확률을 나타내는 것인 방법.
- 유방암으로 진단된 개인의 예후(prognosis)를 예측하는 방법으로서, 상기 방법은 상기 개인으로부터 수득된 핵산 시료에서 하나 이상의 다형성 마커의 하나 이상의 대립인자의 존재 또는 부재를 결정하는 단계를 포함하고, 상기 하나 이상의 다형성 마커는 표 10, 표 15 및 표 19에 표시된 마커들, 및 이들과 연관 불균형인 마커들로 구성된 군으로부터 선택되고, 상기 하나 이상의 대립인자의 존재는 상기 개인에서 유방암의 악화된 예후를 나타내는 것인 방법.
- 유방암의 치료를 받는 개인의 치료의 진행을 모니터링하는 방법으로서, 상기 방법은 상기 개인으로부터 수득된 핵산 시료에서 하나 이상의 다형성 마커의 하나 이상의 대립인자의 존재 또는 부재를 결정하는 단계를 포함하고, 상기 하나 이상의 다형성 마커는 표 10, 표 15 및 표 19에 표시된 마커들, 및 이들과 연관 불균형인 마커들로부터 선택되고, 상기 하나 이상의 대립인자의 존재가 상기 개인의 치료 결과를 나타내는 것인 방법.
- 제48항 내지 제50항 중 어느 한 항에 있어서, 상기 하나 이상의 다형성 마커는 rs4848543 (서열번호 1), rs3803662 (서열번호 3) 및 rs13387042 (서열번호 2)로부터 선택되는 것인 방법.
- 개인에서 유방암에 대한 감수성을 진단 및/또는 평가하기 위한 시약의 제조에서 올리고뉴클레오티드 프로브의 용도로서, 상기 프로브는 서열번호 4, 서열번호 5 또는 서열번호 6으로 표시된 뉴클레오티드 서열을 갖는 핵산의 세그먼트에 혼성화되고, 상기 프로브는 길이가 15 내지 500개의 뉴클레오티드로 구성되는 것인 용도.
- a. 하나 이상의 다형성 마커에 대한 식별자(identifier);b. 유방암으로 진단된 복수의 개인에서 상기 하나 이상의 다형성 마커의 하나 이상의 대립인자의 빈도의 지표(indicator); 및c. 복수의 기준 개인(reference individual)에서 상기 하나 이상의 다형성 마커의 상기 하나 이상의 대립인자의 빈도의 지표;가 저장되고,상기 하나 이상의 다형성 마커는 표 10, 표 15 및 표 19에 표시된 다형성 마커들, 및 이들과 연관 불균형인 다형성 마커들로부터 선택되는 것인 컴퓨터-판독가능한 매체(computer-readable medium).
- 제53항에 있어서, 상기 다형성 마커는 rs4848543 (서열번호 1), rs3803662 (서열번호 3) 및 rs13387042 (서열번호 2), 및 이들과 연관 불균형인 마커들로부터 선택되는 것인 매체.
- 제53항 또는 제54항에 있어서, 상기 복수의 개인들의 선조에 대한 정보를 더 포함하는 것인 키트.
- 제53항 내지 제55항 중 어느 한 항에 있어서, 연관 불균형은 0.2 이상의 r2 수치값 및/또는 0.8 이상의 |D'|의 값을 특징으로 하는 것인 매체.
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
IS8625 | 2007-03-26 | ||
IS8625 | 2007-03-26 | ||
IS8648 | 2007-05-25 | ||
IS8648 | 2007-05-25 |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20090127939A true KR20090127939A (ko) | 2009-12-14 |
Family
ID=39563444
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020097022257A KR20090127939A (ko) | 2007-03-26 | 2008-03-26 | 유방암의 위험도 평가, 진단, 예후 및 치료용 마커인 염색체 2 및 염색체 16 상의 유전적 변이 |
Country Status (13)
Country | Link |
---|---|
US (1) | US20110117545A1 (ko) |
EP (3) | EP2540840A3 (ko) |
JP (1) | JP5676245B2 (ko) |
KR (1) | KR20090127939A (ko) |
CN (1) | CN101874120B (ko) |
AU (1) | AU2008231425B2 (ko) |
CA (1) | CA2681928A1 (ko) |
EA (1) | EA019953B1 (ko) |
IL (1) | IL201217A (ko) |
MX (1) | MX2009010439A (ko) |
NZ (1) | NZ580490A (ko) |
WO (1) | WO2008117314A2 (ko) |
ZA (1) | ZA200907471B (ko) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101390590B1 (ko) * | 2012-06-28 | 2014-04-30 | 서울대학교산학협력단 | 췌장암 재발 예후 예측용 마커 및 이의 용도 |
Families Citing this family (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AU2006320559B2 (en) | 2005-11-29 | 2012-01-19 | Cambridge Enterprise Limited | Markers for breast cancer |
AU2009269542A1 (en) | 2008-07-07 | 2010-01-14 | Decode Genetics Ehf | Genetic variants for breast cancer risk assessment |
JP2012504410A (ja) * | 2008-10-03 | 2012-02-23 | マース インコーポレーテッド | イヌにおける肝臓の銅蓄積についての遺伝子検査およびペット用低銅食餌 |
AU2010256343B2 (en) * | 2009-06-01 | 2014-01-30 | Genetic Technologies Limited | Methods for breast cancer risk assessment |
US8356023B2 (en) * | 2009-07-28 | 2013-01-15 | Ancestry.Com Operations Inc. | Collaborative systems and methods for constructing representations of data |
US20140329719A1 (en) * | 2011-06-16 | 2014-11-06 | Illumina, Inc. | Genetic variants for predicting risk of breast cancer |
GB201120989D0 (en) | 2011-12-06 | 2012-01-18 | Mars Inc | Genetic test |
WO2014164730A2 (en) * | 2013-03-12 | 2014-10-09 | The Board Of Trustees Of The Leland Stanford Junior University | Modulation of cellular dna repair activity to intercept malignancy |
JP6820838B2 (ja) | 2014-09-30 | 2021-01-27 | ジェネティック テクノロジーズ リミテッド | 乳癌発症リスクを評価する方法 |
CA3018186C (en) * | 2016-03-29 | 2023-06-13 | Regeneron Pharmaceuticals, Inc. | Genetic variant-phenotype analysis system and methods of use |
CN108588263B (zh) * | 2018-06-07 | 2022-02-01 | 中国农业科学院烟草研究所 | 一种用于定位和克隆植物中控制同一性状的双隐性基因的方法 |
CN108676890B (zh) * | 2018-07-12 | 2022-01-28 | 吉林大学 | 一种女性乳腺恶性肿瘤易感性预测试剂盒及系统 |
US10395772B1 (en) * | 2018-10-17 | 2019-08-27 | Tempus Labs | Mobile supplementation, extraction, and analysis of health records |
KR102091790B1 (ko) * | 2019-09-02 | 2020-03-20 | 주식회사 클리노믹스 | 피검사자와 생물체 간의 유전자 정보를 이용한 유전적 띠 제공 시스템 및 그 방법 |
CA3154157A1 (en) | 2019-09-13 | 2021-03-18 | 23Andme, Inc. | Methods and systems for determining and displaying pedigrees |
Family Cites Families (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4376110A (en) * | 1980-08-04 | 1983-03-08 | Hybritech, Incorporated | Immunometric assays using monoclonal antibodies |
US5223409A (en) * | 1988-09-02 | 1993-06-29 | Protein Engineering Corp. | Directed evolution of novel binding proteins |
US5143854A (en) * | 1989-06-07 | 1992-09-01 | Affymax Technologies N.V. | Large scale photolithographic solid phase synthesis of polypeptides and receptor binding screening thereof |
US5424186A (en) * | 1989-06-07 | 1995-06-13 | Affymax Technologies N.V. | Very large scale immobilized polymer synthesis |
US5288644A (en) * | 1990-04-04 | 1994-02-22 | The Rockefeller University | Instrument and method for the sequencing of genome |
US5837832A (en) * | 1993-06-25 | 1998-11-17 | Affymetrix, Inc. | Arrays of nucleic acid probes on biological chips |
US5858659A (en) * | 1995-11-29 | 1999-01-12 | Affymetrix, Inc. | Polymorphism detection |
AU785425B2 (en) * | 2001-03-30 | 2007-05-17 | Genetic Technologies Limited | Methods of genomic analysis |
AU2002324649A1 (en) * | 2001-08-04 | 2003-02-24 | General Hospital Corporation | Haplotype map of the human genome and uses therefor |
US20040023237A1 (en) * | 2001-11-26 | 2004-02-05 | Perelegen Sciences Inc. | Methods for genomic analysis |
US20040146870A1 (en) * | 2003-01-27 | 2004-07-29 | Guochun Liao | Systems and methods for predicting specific genetic loci that affect phenotypic traits |
PL214402B1 (pl) * | 2003-08-11 | 2013-07-31 | Tomasz Byrski | Zastosowanie selenu albo jego zwiazku do otrzymywania srodka do obnizania odziedziczonego ryzyka zachorowania na raka piersi lub jajnika |
WO2006050573A1 (en) * | 2004-11-11 | 2006-05-18 | Garvan Institute Of Medical Research | Method of diagnosing cancer and reagents therefor |
KR101138862B1 (ko) * | 2005-02-14 | 2012-05-14 | 삼성전자주식회사 | 단일염기 다형을 포함하는 유방암과 관련된 폴리뉴클레오티드, 그를 포함하는 마이크로어레이 및 진단 키트 및 그를이용한 유방암 진단 방법 |
KR101206028B1 (ko) * | 2005-03-05 | 2012-11-28 | 삼성전자주식회사 | 유방암 특이적 다형성 서열을 이용한 유방암의 진단방법,유방암 특이적인 폴리뉴클레오티드 및 상기 폴리뉴클레오티드가 고정되어 있는 마이크로어레이 |
US7858303B2 (en) * | 2005-03-14 | 2010-12-28 | Wisconsin Alumni Research Foundation | Method of analyzing breast cancer susceptibility and resistance |
US20090118175A1 (en) * | 2005-05-06 | 2009-05-07 | Macina Roberto A | Compositions and Methods for Detection, Prognosis and Treatment of Breast Cancer |
-
2008
- 2008-03-26 US US12/302,473 patent/US20110117545A1/en not_active Abandoned
- 2008-03-26 MX MX2009010439A patent/MX2009010439A/es active IP Right Grant
- 2008-03-26 NZ NZ580490A patent/NZ580490A/xx not_active IP Right Cessation
- 2008-03-26 WO PCT/IS2008/000009 patent/WO2008117314A2/en active Application Filing
- 2008-03-26 EP EP12153875.5A patent/EP2540840A3/en not_active Withdrawn
- 2008-03-26 CN CN200880016394.2A patent/CN101874120B/zh not_active Expired - Fee Related
- 2008-03-26 AU AU2008231425A patent/AU2008231425B2/en not_active Ceased
- 2008-03-26 EP EP12153902.7A patent/EP2527466A3/en not_active Withdrawn
- 2008-03-26 JP JP2010500445A patent/JP5676245B2/ja not_active Expired - Fee Related
- 2008-03-26 KR KR1020097022257A patent/KR20090127939A/ko not_active Application Discontinuation
- 2008-03-26 EP EP08720170A patent/EP2137324A2/en not_active Withdrawn
- 2008-03-26 CA CA002681928A patent/CA2681928A1/en not_active Abandoned
- 2008-03-26 EA EA200970891A patent/EA019953B1/ru not_active IP Right Cessation
-
2009
- 2009-09-29 IL IL201217A patent/IL201217A/en not_active IP Right Cessation
- 2009-10-23 ZA ZA2009/07471A patent/ZA200907471B/en unknown
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101390590B1 (ko) * | 2012-06-28 | 2014-04-30 | 서울대학교산학협력단 | 췌장암 재발 예후 예측용 마커 및 이의 용도 |
Also Published As
Publication number | Publication date |
---|---|
CN101874120A (zh) | 2010-10-27 |
WO2008117314A2 (en) | 2008-10-02 |
NZ580490A (en) | 2012-08-31 |
EP2540840A3 (en) | 2013-05-15 |
MX2009010439A (es) | 2009-10-20 |
CA2681928A1 (en) | 2008-10-02 |
AU2008231425A1 (en) | 2008-10-02 |
EA200970891A1 (ru) | 2010-04-30 |
EP2540840A2 (en) | 2013-01-02 |
JP2010522555A (ja) | 2010-07-08 |
CN101874120B (zh) | 2015-01-14 |
ZA200907471B (en) | 2014-03-26 |
AU2008231425B2 (en) | 2014-03-20 |
EP2137324A2 (en) | 2009-12-30 |
US20110117545A1 (en) | 2011-05-19 |
WO2008117314A3 (en) | 2008-12-18 |
EA019953B1 (ru) | 2014-07-30 |
IL201217A (en) | 2014-03-31 |
EP2527466A3 (en) | 2013-05-15 |
EP2527466A2 (en) | 2012-11-28 |
IL201217A0 (en) | 2010-05-31 |
JP5676245B2 (ja) | 2015-02-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101874120B (zh) | 作为用于乳腺癌风险评估、诊断、预后和治疗的标记的chr2和chr16的遗传性变型 | |
DK2471954T3 (en) | Susceptibility genetic variants associated with cardiovascular diseases | |
AU781437B2 (en) | A novel BAP28 gene and protein | |
CN101784675B (zh) | 用于剥脱性综合征和青光眼的诊断、预后和治疗的标记物的chr 15q24上的遗传变异 | |
CN101641451A (zh) | chr8q24.21上的癌症易感性变体 | |
KR20110036608A (ko) | 유방암 위험도 평가를 위한 유전적 변이 | |
US20090305284A1 (en) | Methods for Identifying Risk of Breast Cancer and Treatments Thereof | |
KR20110081807A (ko) | 갑상선암의 위험도 평가를 위해 유용한 유전적 변이 | |
KR20100017865A (ko) | 유방암의 위험도 평가, 진단, 예후 및 치료용 마커인 염색체 5p12 및 염색체 10q26 상의 유전적 변이 | |
KR20110015409A (ko) | 염증성 장 질환에 대한 유전자 발현 마커 | |
KR102481305B1 (ko) | 유전자에 기반한 염증성 장 질환의 진단 | |
KR20060045950A (ko) | 혈액학적 악성종양에 대한 예후 | |
AU2016325030A1 (en) | Novel biomarkers and methods of treating cancer | |
WO2006022629A1 (en) | Methods of identifying risk of type ii diabetes and treatments thereof | |
KR20090087486A (ko) | 타입 2 당뇨병의 유전적 감수성 변이 | |
CN101631876A (zh) | 2型糖尿病的遗传易感性变体 | |
AU2023203393A1 (en) | Compositions and methods for screening and identifying clinically aggressive prostate cancer | |
CA2497597A1 (en) | Methods for identifying subjects at risk of melanoma and treatments | |
IL179831A (en) | In vitro method for detecting the presence or possibility of autism or autism disorder, and in vitro method for selecting compounds with biological activity on autism or autism disorders | |
DK2951317T3 (en) | PROCEDURE FOR PREDICTING THE BENEFIT OF INCLUSING TAXAN IN A CHEMOTHERAPY PLAN FOR BREAST CANCER PATIENTS | |
WO2006022636A1 (en) | Methods for identifying risk of type ii diabetes and treatments thereof | |
KR20190126812A (ko) | 질환 진단용 바이오마커 | |
WO2006022634A1 (en) | Methods for identifying risk of type ii diabetes and treatments thereof | |
TW202227102A (zh) | 治療脂肪肝病之方法 | |
WO2006022638A1 (en) | Methods for identifying risk of type ii diabetes and treatments thereof |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E902 | Notification of reason for refusal | ||
E601 | Decision to refuse application |