KR20240054194A - 혈액 내 rna의 엑손-접합 정보를 이용한 암 진단 방법 - Google Patents

혈액 내 rna의 엑손-접합 정보를 이용한 암 진단 방법 Download PDF

Info

Publication number
KR20240054194A
KR20240054194A KR1020230138881A KR20230138881A KR20240054194A KR 20240054194 A KR20240054194 A KR 20240054194A KR 1020230138881 A KR1020230138881 A KR 1020230138881A KR 20230138881 A KR20230138881 A KR 20230138881A KR 20240054194 A KR20240054194 A KR 20240054194A
Authority
KR
South Korea
Prior art keywords
cancer
exon
blood
individual
junction
Prior art date
Application number
KR1020230138881A
Other languages
English (en)
Inventor
안태진
안은용
박성민
김사라
Original Assignee
주식회사 포어텔마이헬스
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 포어텔마이헬스 filed Critical 주식회사 포어텔마이헬스
Publication of KR20240054194A publication Critical patent/KR20240054194A/ko

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2535/00Reactions characterised by the assay type for determining the identity of a nucleotide base or a sequence of oligonucleotides
    • C12Q2535/122Massive parallel sequencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/158Expression markers

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Public Health (AREA)
  • Data Mining & Analysis (AREA)
  • General Health & Medical Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Pathology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Analytical Chemistry (AREA)
  • Biomedical Technology (AREA)
  • Epidemiology (AREA)
  • Organic Chemistry (AREA)
  • Databases & Information Systems (AREA)
  • Biotechnology (AREA)
  • Software Systems (AREA)
  • Biophysics (AREA)
  • Evolutionary Biology (AREA)
  • Wood Science & Technology (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Genetics & Genomics (AREA)
  • Evolutionary Computation (AREA)
  • Primary Health Care (AREA)
  • General Engineering & Computer Science (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Zoology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Immunology (AREA)
  • Mathematical Physics (AREA)
  • General Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Bioethics (AREA)
  • Biochemistry (AREA)
  • Molecular Biology (AREA)
  • Hospice & Palliative Care (AREA)

Abstract

본 발명은 혈액 내 RNA의 엑손-접합 정보를 이용한 암 진단 방법에 관한 것으로서, 보다 구체적으로는 개체의 혈액의 무핵세포 또는 엑소좀에서 분리한 RNA; 또는 cfRNA를 분리하고, 이의 전사체 데이터를 얻은 다음 엑손-접합에서의 염기서열 발현정보를 이용하여 암 보유 여부를 결정하는, 개체에서 암 진단에 필요한 정보를 제공하기 위해 전사체를 분석하는 방법에 관한 것이다. 본 발명의 방법은 암의 진단에 필요한 정보를 제공할 수 있어 항암 치료 요법에 유용하게 이용될 수 있다.

Description

혈액 내 RNA의 엑손-접합 정보를 이용한 암 진단 방법 {Method for diagnosing cancer using exon-junction information of RNA in blood}
본 발명은 혈액 내 RNA의 엑손-접합 정보를 이용한 암 진단 방법에 관한 것으로서, 보다 구체적으로는 (a) (i) 개체의 혈액의 무핵세포(anucleated cells)에서 분리한 전체 RNA 또는 이의 일부, (ii) 개체의 혈액의 엑소좀(exosome)에서 분리한 전체 RNA 또는 이의 일부, 및 (iii) 개체의 혈액에서 분리한 전체 cfRNA(cell-free RNA) 또는 이의 일부로 이루어진 군에서 선택된 하나 이상의 RNA를 분리하는 단계; (b) 상기 (a) 단계에서 분리한 RNA에 대한 상보적 DNA (cDNA)을 합성하는 단계; (c) 상기 cDNA의 염기서열정보를 수득하는 단계; (d) 상기 cDNA 염기서열정보를 미리 정해진 엑손-접합(exon-junction) 라이브러리와 대비하여 각 엑손-접합에서의 염기서열 발현정보를 수득하는 단계; 및 (e) 상기 각 엑손-접합에서의 염기서열 발현정보를 바탕으로 암 보유 여부를 결정하는 단계를 포함하는, 개체에서 암 진단에 필요한 정보를 제공하기 위해 전사체를 분석하는 방법에 관한 것이다.
차세대 염기서열 분석(Next-Generation Sequencing, NGS) 기술을 사용하여 환자의 혈액 내의 엑소좀, 순환성 종양세포 (Circulating Tumor Cell, CTCs), 순환 종양성 DNA (ctDNA) 등의 핵산 정보를 분석하는 액체생검 (Liquid Biopsy) 기술이 암 질환 진단 및 치료에 도입되고 있다 [1].
액체 생검은 비침습성 기술로, 조직 생검 (Tissue Biopsy)에 비해 채취에 편리하고 소량의 혈액으로 빠른 분석이 가능하여 조직생검 없이 액체 생검으로 암 판별과 모니터링이 가능해졌다 [2].
그러나 액체생검은 혈액 내 존재하는 분자 수가 적은 한계로 인해 기존 기술로는 암 검출 민감도가 낮다 [3, 4, 5]. 따라서 효과적인 암 조기 판별 스크리닝을 위해서는 암에서도 혈액 내 존재하는 분자 수가 많은 바이오 마커를 활용하여 민감도를 높일 필요성이 있다.
이에 본 발명자들은 효과적인 암 조기 판별 스크리닝을 위해서는 암에서도 혈액 내 존재하는 분자 수가 많은 바이오 마커를 활용하기 위해 연구하던 중, 혈소판과 같은 무핵세포, 엑소좀과 같은 세포 유래 막 구조물, 또는 무세포 RNA에서 전사체 (transcriptome) 데이터를 확보하고 이를 분석하여 엑손 접합 정보를 바이오마커로 이용하면 피험자의 암과 정상 여부를 판별할 수 있다는 점, 특히 사전 학습된 암 여부 판별 모형 기반의 머신러닝 알고리즘을 이용하여 분석하여 엑손 접합 정보를 바이오마커로 이용하면 피험자의 암과 정상 여부를 판별할 수 있다는 점을 확인하여 본 발명을 완성하였다.
따라서, 본 발명의 목적은
(a) (i) 개체의 혈액의 무핵세포(anucleated cells)에서 분리한 전체 RNA 또는 이의 일부, (ii) 개체의 혈액의 엑소좀(exosome)에서 분리한 전체 RNA 또는 이의 일부, 및 (iii) 개체의 혈액에서 분리한 전체 cfRNA(cell-free RNA) 또는 이의 일부로 이루어진 군에서 선택된 하나 이상의 RNA를 분리하는 단계
(b) 상기 (a) 단계에서 분리한 RNA에 대한 상보적 DNA (cDNA)을 합성하는 단계;
(c) 상기 cDNA의 염기서열정보를 수득하는 단계;
(d) 상기 cDNA 염기서열정보를 미리 정해진 엑손-접합(exon-junction) 라이브러리와 대비하여 각 엑손-접합에서의 염기서열 발현정보를 수득하는 단계; 및
(e) 상기 각 엑손-접합에서의 염기서열 발현정보를 바탕으로 암 보유 여부를 결정하는 단계를 포함하는, 개체에서 암 진단에 필요한 정보를 제공하기 위해 전사체를 분석하는 방법을 제공하는 것이다.
본 발명의 다른 목적은 단수 또는 복수의 엑손-접합을 유효성분으로 포함하는 암 진단용 조성물이며, 상기 엑손-접합은 (i) 개체의 혈액의 무핵세포에서 분리한 RNA 또는 이의 일부, (ii) 개체의 혈액의 엑소좀에서 분리한 전체 RNA 또는 이의 일부, 및 (iii) 개체의 혈액에서 분리한 전체 cfRNA 또는 이의 일부에서 검출하는 것을 특징으로 하는 암 진단용 조성물을 제공하는 것이다.
본 발명의 또다른 목적은 상기 조성물을 포함하는 암 진단 키트를 제공하는 것이다.
본 발명의 또다른 목적은 단수 또는 복수의 엑손-접합을 검출할 수 있는 제제를 포함하는, 암 진단용 조성물이며, 상기 엑손-접합은 (i) 개체의 혈액의 무핵세포에서 분리한 전체 RNA 또는 이의 일부, (ii) 개체의 혈액의 엑소좀에서 분리한 전체 RNA 또는 이의 일부, 및 (iii) 개체의 혈액에서 분리한 전체 cfRNA 또는 이의 일부에서 검출하는 것을 특징으로 하는 암 진단용 조성물을 제공하는 것이다.
상기와 같은 목적을 달성하기 위하여, 본 발명은 (a) (i) 개체의 혈액의 무핵세포(anucleated cells)에서 분리한 전체 RNA 또는 이의 일부, (ii) 개체의 혈액의 엑소좀(exosome)에서 분리한 전체 RNA 또는 이의 일부, 및 (iii) 개체의 혈액에서 분리한 전체 cfRNA(cell-free RNA) 또는 이의 일부로 이루어진 군에서 선택된 하나 이상의 RNA를 분리하는 단계;
(b) 상기 (a) 단계에서 분리한 RNA에 대한 상보적 DNA (cDNA)을 합성하는 단계;
(c) 상기 cDNA의 염기서열정보를 수득하는 단계;
(d) 상기 cDNA 염기서열정보를 미리 정해진 엑손-접합(exon-junction) 라이브러리와 대비하여 각 엑손-접합에서의 염기서열 발현정보를 수득하는 단계; 및
(e) 상기 각 엑손-접합에서의 염기서열 발현정보를 바탕으로 암 보유 여부를 결정하는 단계를 포함하는, 개체에서 암 진단에 필요한 정보를 제공하기 위해 전사체를 분석하는 방법을 제공한다.
또한, 본 발명의 다른 목적을 달성하기 위하여, 본 발명은 단수 또는 복수의 엑손-접합을 유효성분으로 포함하는 암 진단용 조성물이며, 상기 엑손-접합은 (i) 개체의 혈액의 무핵세포에서 분리한 RNA 또는 이의 일부, (ii) 개체의 혈액의 엑소좀에서 분리한 전체 RNA 또는 이의 일부, 및 (iii) 개체의 혈액에서 분리한 전체 cfRNA 또는 이의 일부에서 검출하는 것을 특징으로 하는 암 진단용 조성물을 제공한다.
본 발명의 또다른 목적을 달성하기 위하여, 본 발명은 상기 조성물을 포함하는 암 진단 키트를 제공한다.
본 발명의 또다른 목적을 달성하기 위하여, 본 발명은 단수 또는 복수의 엑손-접합을 검출할 수 있는 제제를 포함하는, 암 진단용 조성물이며, 상기 엑손-접합은 (i) 개체의 혈액의 무핵세포에서 분리한 전체 RNA 또는 이의 일부, (ii) 개체의 혈액의 엑소좀에서 분리한 전체 RNA 또는 이의 일부, 및 (iii) 개체의 혈액에서 분리한 전체 cfRNA 또는 이의 일부에서 검출하는 것을 특징으로 하는 암 진단용 조성물을 제공한다.
다른 정의가 없는 한, 본 명세서에 사용된 모든 기술적 및 과학적 용어는 당업자들에 의해 통상적으로 이해되는 동일한 의미를 가진다. 다음의 참고문헌은 본 발명의 명세서에 사용된 여러 용어들의 일반적인 정의를 갖는 기술(skill)의 하나를 제공한다: Singleton et al., DICTIONARY OF MICROBIOLOGY AND MOLECULAR BIOLOTY(2th ed. 1994); THE CAMBRIDGE DICTIONARY OF SCIENCE AND TECHNOLOGY(Walkered., 1988); 및 Hale & Marham, THE HARPER COLLINS DICTIONARY OF BIOLOGY
이하, 본 발명을 상세히 설명한다.
지혈과 응고에 주된 역할을 하는 것으로 알려진 혈소판은 암의 성장, 전이, 면역 회피에 도움을 주며, 암 세포는 혈소판의 RNA 발현 과정에 직접 또는 간접적으로 영향을 미쳐 혈소판의 발현을 변화시키는 것으로 보고되었다. 하나의 암 세포가 수만 개의 혈소판을 변화시킬 수 있으므로 혈소판의 전사체 정보는 암 판별을 돕는 바이오마커로서 본 발명에 활용될 수 있다. 특히 암 세포들에 의하여 변화된 혈소판 세포의 RNA는 선택적 스플라이싱(alternative splicing)패턴이 암 특이적으로 변화할 수 있기에 이를 암을 진단하는 바이오마커로 본 발명에서 활용하고자 한다. 또한, 혈소판은 혈액 내의 대표적인 무핵세포 (anucleated cell로서 엑소좀과 cfRNA의 주요한 소스 (source)로 알려져 있다 (Mol Oncol. 2021 Jun; 15(6): 1727-1743).
따라서, 본 발명은
(a) (i) 개체의 혈액의 무핵세포에서 분리한 전체 RNA 또는 이의 일부, (ii) 개체의 혈액의 엑소좀에서 분리한 전체 RNA 또는 이의 일부, 및 (iii) 개체의 혈액에서 분리한 전체 cfRNA 또는 이의 일부로 이루어진 군에서 선택된 하나 이상의 RNA를 분리하는 단계;
(b) 상기 (a) 단계에서 분리한 RNA에 대한 상보적 DNA (cDNA)을 합성하는 단계;
(c) 상기 cDNA의 염기서열정보를 수득하는 단계;
(d) 상기 cDNA 염기서열정보를 미리 정해진 엑손-접합 라이브러리와 대비하여 각 엑손-접합에서의 염기서열 발현정보를 수득하는 단계; 및
(e) 상기 각 엑손-접합에서의 염기서열 발현정보를 바탕으로 암 보유 여부를 결정하는 단계를 포함하는, 개체에서 암 진단에 필요한 정보를 제공하기 위해 전사체를 분석하는 방법을 제공한다.
(a) 단계는 (i) 개체의 혈액의 무핵세포에서 분리한 전체 RNA 또는 이의 일부, (ii) 개체의 혈액의 엑소좀에서 분리한 전체 RNA 또는 이의 일부, 및 (iii) 개체의 혈액에서 분리한 전체 cfRNA 또는 이의 일부로 이루어진 군에서 선택된 하나 이상의 RNA를 분리하는 단계이다.
샘플은 예컨대 공지되거나 또는 의심되는 개체에서 분리된 것일 수 있다. 샘플은 개체로부터 원래 분리된 형태일 수 있거나 또는 세포와 같은 성분을 제거 또는 부가하기 위해 또는 또 다른 성분과 비교하여 한 성분을 풍부화시키기 위해 추가로 프로세싱시킬 수 있다. 샘플은 개체로부터 분리 또는 수득될 수 있고, 샘플 분석 장치로 수송될 수 있다. 샘플은 원하는 온도, 예를 들어, 실온, 4℃, -20℃, 및/또는 -80℃ 하에 보존 및 선적될 수 있다.
예를 들어, 샘플은 액체 생검(liquid biopsy)을 위해 개체로부터 혈액 샘플을 채취하고, 이 때, 채취한 혈액은 품질 관리(Quality Check, QC) 지표를 확인하여 사용 여부를 결정할 수 있고, 이로써 판별의 정확도를 높일 수 있다. 이 후, 채취한 혈액 샘플로부터 혈소판과 같은 무핵세포, 엑소좀 및 cfRNA로 이루어진 군에서 선택된 하나 이상을 분리한다. 분리하는 방법으로 당업계에 공지된 방법에 의할 수 있으며, 바람직하게는 원심분리 등을 통하여 이들을 분리할 수 있다. cfRNA의 경우 혈액, 혈장, 혈청 또는 이들의 분획에서 직접 cDNA 합성에 이용될 수 있다.
개체는 인간, 포유동물, 동물, 애완용 동물, 서비스 동물, 또는 애완동물일 수 있다. 개체는 질환이 있을 수 있다. 개체는 질환 또는 검출 가능한 질환 증상이 없을 수 없다. 개체는 하나 이상의 요법, 예를 들어, 수술, 처치, 투약, 화학요법, 항체, 백신 또는 생물 제제 중 어느 하나 이상으로 치료받은 적이 있을 수 있다. 개체는 차도가 있을 수 있거나 또는 그렇지 않을 수 있다.
본 발명에서 상기 '무핵세포'는 핵이 존재하지 않는 세포로서 세포분열을 통해 딸세포를 생성하지 못하는 세포를 의미한다. 상기 무핵세포는 혈소판, 적혈구 그리고 불완전한 세포분열로 인해 핵을 보유하지 못한 일체의 세포를 포함하며, 바람직하게는 혈소판 또는 적혈구일 수 있고, 가장 바람직하게는 혈소판일 수 있다.
본 발명에서 상기 '엑소좀'은 나노 단위 크기(예컨대, 50-90 nm)를 갖는 소낭 구조를 갖는 세포밖 소포체를 의미하며, 유래되는 세포의 세포막 성분으로 이루어진 지질이중막에 의해 엑소좀 내부와 외부가 분리된 구조를 가지며, 세포의 세포막 지질, 세포막 단백질, 핵산 및 세포 성분 등을 가지고 있다. 본 발명에서 엑소좀의 유래는 특별히 제한되지는 않으나, 바람직하게는 혈액으로부터 분리된 것일 수 있다. 엑소좀은 세포 간의 mRNA, miRNA, DNA, 및 단백질의 운송을 매개하고 세포 내외의 신호전달 및 상호작용에 중요한 역할을 한다. 엑소좀은 당업계에 알려진 방법을 제한 없이 사용하여 분리될 수 있으며, 예를 들어, 초원심분리(ultra-centrifugation isolation), 크기별 제외법(size exclusion), 면역친화성 분리(immunoaffinity isolation), 미세유체 기술(microfluidics chip) 및 폴리머를 이용한 방법(polymeric method) 등을 사용하여 엑소좀을 분리할 수 있다. 또한, 시판중인 엑소좀 분리용 키트(예컨대, Exo2DTM EV isolation kit)를 사용하여 엑소좀을 분리할 수 있다.
무핵세포 및/또는 엑소좀으로부터 RNA의 분리는 당업계에 공지된 다양한 방법을 통해 이루어질 수 있다. 예를 들어 RNA의 분리 방법으로는, 티오시안산구아니딘·염화세슘 초원심법, 티오시안산구아니딘·핫 페놀법, 구아니딘 염산법, 산성 티오시안산구아니딘·페놀·클로로포름법 (Chomczynski, P. and Sacchi, N., Anal. Biochem. (1987), 162, 156-159) 등을 포함하며 이에 제한되지 않는다. 또한, 시판되는 RNA 추출용 시약 (예를 들어, RNA queous kit (Ambion Inc., Austin, TX), Micro-to-midi total RNA purification system (Invitrogen), NucleoSpin RNA II (BD Biosciences Clontech, Palo Alto, CA), RNeasy mini kit (Qiagen), GenElute mammalian total RNA kit (Sigma-Aldrich, and Trizol LS reagent (Invitrogen)) 등을 시약으로 첨부된 프로토콜에 따라 사용할 수도 있다. 상기 당업계에 공지된 RNA의 분리에 관하여, 이에 대한 구체적인 방법은 Joseph Sambrook, et al.,MolecularCloning, A LaboratoryManual, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y.(2001)에 개시되어 있으며, 이 문헌은 본 명세서에 참조로써 삽입된다.
분리된 RNA 분획은, 필요에 따라 추가로 mRNA만으로 정제하여 사용될 수 있다. 정제방법은 공지의 RNA 정제법이라면 특별히 제한되지 않지만, 예를 들어 비오틴화한 올리고 (dT) 프로브에 mRNA를 흡착시켜, 또한 스트렙토아비딘을 고정화한 상자성 입자에, 비오틴/스트렙토아비딘의 결합을 사용하여 mRNA를 포착하여 세정 조작한 후, mRNA를 용출함으로써, mRNA를 정제할 수 있다. 또한, 올리고 (dT) 셀룰로오스 칼럼에 mRNA를 흡착시키고, 다음으로 이것을 용출하여 정제하는 방법도 채용할 수 있다. 다만, 본 발명의 방법을 위해서는, 상기 mRNA의 정제공정은 필수가 아니라 선택적으로 수행될 수 있다.
(b) 단계는 상기 (a) 단계에서 분리한 RNA에 대한 상보적 DNA (cDNA)을 합성하는 단계이다.
RNA로부터 cDNA를 합성하는 방법은 당업계에 공지된 방법에 따라 제한없이 수행될 수 있다. 예를 들어, RNA에 역전사 효소와 디옥시리보뉴클레오티드를 첨가하여 mRNA 사슬을 주형으로 1차 DNA 가닥을 복사한다. 이후, RNA 분해효소 (RNase H)를 처리하여 DNA-RNA 혼성 double strands로부터 mRNA를 제거한다. 이후, DNA중합효소를 처리하여 역전사에 의해 만들어진 DNA 가닥을 주형으로 하여 DNA의 두 번째 가닥을 형성하여 템플릿을 완성하는 방법에 따라 cDNA가 합성될 수 있다.
(c) 단계는 상기 cDNA의 염기서열정보를 수득하는 단계이다.
본 발명의 하나의 양태에서 염기서열정보를 분석하는 것은 당업계에 공지된 염기서열정보 분석 방법에 의해서 수행될 수 있다. 염기서열정보 분석은 상보적 cDNA의 한 쪽 사슬(strand) 또는 이들 각각의 서열을 해독한다. 서열 해독은 대량의 단편, 바람직하게는 적어도 10000개이상, 적어도 20000개이상, 적어도 30000개이상, 적어도 40000개이상, 적어도 50000개이상, 적어도 100000개이상, 적어도 1000000개 이상의 단편을 해독하므로 이에 적합한 해독 방법이 바람직하다.
염기서열정보 분석은 당업계에 공지된 염기서열정보 분석법이 사용될 수 있으나, 각 단편의 서열을 충분한 수량으로 해독하기 위하여 대량의 서열해독이 가능한 방법이라면 제한없이 사용될 수 있다. 본 발명의 상기 염기서열의 분석은 이에 제한되지는 않으나, 차세대 염기서열 분석법 (Next-Generation Sequencing, NGS)에 의해서 수행될 수 있다. 차세대 염기서열 분석법이 사용되는 경우 대량의 서열을 수 시간 내에 적은 비용으로 해독할 수 있다는 장점이 있으며, 충분한 양의 서열을 읽는 경우 정확도가 아주 높으며 해독된 데이터를 정성, 정량적으로 분석이 가능하다.
본 발명에서 상기 분석된 염기서열정보는 리드(reads)로도 불릴 수 있다.
한편, 엑손 접합 부위의 염기서열 분석을 위하여 적절한 어댑터(adapter)를 부착할 수도 있다.
(d) 단계는 상기 cDNA 염기서열정보를 미리 정해진 엑손-접합(exon-junction) 라이브러리와 대비하여 각 엑손-접합에서의 염기서열 발현정보를 수득하는 단계이다.
상기 (d) 단계에서는 상기 (c) 단계에서 수득된 염기서열정보에서 엑손-접합에 의해서 생긴 서열의 발현정보를 수득한다. 예를 들어, 상기 (c) 단계에서의 염기서열정보 분석이 NGS에 의해서 수행된 경우, 미리 정해진 엑손-접합 라이브러리에 정렬(alignment)되는 염기서열의 빈도, 즉 리드수(read-count)를 계수한다. 즉, 한 개 샘플 해독으로 얻은 모든 서열에서 미리 정해진 엑손-접합 라이브러리와 대비하여 각각 다른 엑손-접합 종류에 대해서 해당 서열의 리드의 수를 계수한다.
상기 염기서열정보에서 엑손-접합에 의해 생긴 서열의 발현정보, 즉, 리드수는 한 유전자 내에 존재하는 서로 다른 두 개의 엑손들의 최말단에 맵핑된 염기서열(리드), 즉 상위 엑손의 끝 부분과 하위 엑손의 시작 부분으로부터 최소 1개 이상의 연속된 엑손 영역의 염기쌍을 포함하는 염기서열(리드)의 수이며, 이 때 서로 다른 두 개의 엑손들의 경우 참조 유전체 상에서 바로 인접한 엑손이 아니어도 된다. 또한 해독되지 아니하는 인트론 부분을 포함하는 서열의 경우는 상기 엑손-접합에서의 염기서열 발현정보, 즉 리드수로 계수하지 아니한다(도 4 참고).
계수된 각 값은 다른 샘플들의 값과 비교하기 위해 정규화될 수 있다. 이 정규화는 각 샘플마다 해독된 양이 다를 경우 샘플간의 직접적인 정량적인 비교를 위해 해독된 양에 비례하는 값으로 집계된 각 값을 나누는 것이다. 이 때, 해독된 양에 비례하는 값은 각 샘플의 해독된 전체 서열수, house keeping 유전자 영역에 맵핑된 서열수 등 다양한 값이 가능하다.
본 발명에서 상기 미리 정해진 엑손-접합 라이브러리는 표 1에 기재된 유전자 및 해당 염색체에서의 위치 정보로 표시되는 엑손-접합 부위에 대한 정보를 나타낸다. 하기 표 1에서 각각의 유전자 및 해당 염색체가 표시되어 있고, 엑손 접합이 되는 상위 위치의 엑손의 끝 부분 (position 1) 및 하위 위치 엑손의 시작 부분 (position 2)이 해당 염색체에서의 위치 번호로 표시되어 있다. 즉, 본 발명에서 상기 미리 정해진 엑손-접합 라이브러리는 하기 표 1에 기재된 각 염색체에서 position 1 및 position 2의 접합부일 수 있다(도 3 참고).
본 발명의 일양태에서, 상기 엑손-접합에서의 염기서열의 발현정보, 즉, 리드수는 하기 표 1에서 position 1 및 position 2의 각 염기를 포함하면서 5'방향 및/또는 3'방향으로 연속되는 2 이상의 염기를 포함하는 서열에 정렬(alignment)되는 서열정보(리드)인 것을 특징으로 할 수 있다.
본 발명의 다른 일양태에서, 상기 엑손-접합에서의 염기서열의 발현정보, 즉, 리드수는 하기 표 1에서 position 1 및 position 2의 각 염기를 포함하면서 5'방향 및/또는 3'방향으로 연속되는 2 이상 내지 300 이하의 염기를 포함하는 서열에 정렬(alignment)되는 서열정보(리드)인 것을 특징으로 할 수 있다.
본 발명의 다른 일양태에서, 상기 엑손-접합에서의 염기서열의 발현정보, 즉, 리드수는 하기 표 1에서 position 1 및 position 2의 각 염기를 포함하면서 5'방향 및/또는 3'방향으로 연속되는 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, 100, 110, 120, 130, 140, 150, 160, 170, 180, 190, 200, 210, 220, 230, 240, 250, 260, 270, 280, 290 또는 300 염기를 포함하는 서열에 정렬(alignment)되는 서열정보(리드)인 것을 특징으로 할 수 있다.
엑손-접합 번호 유전자 염색체 Strand Position1 Position2
1 ITGA2B 17 - 44385209 44385286
2 TRDC 14 + 22463210 22463774
3 TRAF3IP3 1 + 209779374 209780470
4 FCGR2A 1 + 161506591 161509820
5 PCSK6 15 - 101389564 101393212
6 TRAC 14 + 22549682 22550557
7 PTPRC 1 + 198713072 198716682
8 IFI27 14 + 94114880 94115781
9 TRBC1 7 + 142792539 142792692
10 RPL5 1 + 92832117 92833389
11 TLN1 9 - 35713043 35713196
12 SPARC 5 - 151673216 151686865
13 HLA-DRB1 6 - 32579104 32580247
14 LUC7L3 17 + 50744813 50745720
15 LOC728975 11 - 65181072 65181225
16 TRBC1 7 + 142792080 142792522
17 GAS5 1 - 173865894 173866177
18 TRDC 14 + 22464323 22465533
19 LUC7L3 17 + 50719831 50736960
20 HBD 11 - 5234213 5234342
21 TLN1 9 - 35714081 35714239
22 TRBC1 7 + 142792798 142793121
23 DEFA1 8 - 6977879 6978460
24 GAS5 1 - 173866206 173866528
25 OSBP2 22 + 30893566 30893638
26 CRIP1 14 + 105488388 105488471
27 HLA-DRB1 6 - 32580856 32581557
28 TRAF3IP3 1 + 209781458 209782056
29 GNLY 2 + 85694470 85695320
30 GZMA 5 + 55108394 55110021
31 HSP90B1 12 + 103947430 103947633
32 RPS17 15 - 82538985 82539981
33 TRAC 14 + 22550664 22551605
34 CD3D 11 - 118339227 118339451
35 FCGR2A 1 + 161510074 161510834
36 RPL21 13 + 27256334 27256436
37 U2SURP 3 + 143014409 143016257
38 GIMAP7 7 + 150514945 150519934
39 NKG7 19 - 51371835 51371940
40 KLRK1 12 - 10373231 10378132
41 IL2RG X - 71110688 71110897
42 KLRB1 12 - 9595421 9598046
43 TRIM58 1 + 247860712 247864705
44 TLN1 9 - 35713298 35713953
45 ITGA2B 17 - 44385076 44385164
46 NKG7 19 - 51372074 51372161
47 U2SURP 3 + 143012353 143014311
48 HLA-DRB1 6 - 32581838 32584109
49 TLN1 9 - 35714687 35714760
50 TRDC 14 + 22463839 22464204
51 IGHM 14 - 105852263 105854405
52 RPL22 1 - 6186816 6192930
53 ITGA2B 17 - 44384354 44384538
54 DEFA3 8 - 7016862 7018222
55 IFI27 14 + 94115942 94116442
56 KLRB1 12 - 9598161 9598499
57 TRIM58 1 + 247857666 247860617
58 DEFA1B 8 - 6996996 6997577
59 IL7R 5 + 35860990 35867306
60 IL7R 5 + 35867463 35871056
61 IL2RG X - 71111050 71111425
62 ZYX 7 + 143382447 143382593
63 PTPRC 1 + 198732390 198732480
64 SEPTIN5 22 + 19718818 19719602
65 TLN1 9 - 35715187 35716390
66 SIAH2 3 - 150742698 150762433
67 RSRP1 1 - 25242705 25243550
68 RPL23A 17 + 28720030 28720707
69 ITGA2B 17 - 44384585 44384948
70 LUC7L3 17 + 50740345 50741102
71 TRAF3IP3 1 + 209780606 209781345
72 FLNA X - 154354711 154354825
73 FLNA X - 154361787 154361979
74 GNAS 20 + 58889353 58895612
75 PTPRC 1 + 198709824 198712953
76 DEFA1B 8 - 6997763 6999123
77 IL7R 5 + 35874542 35875512
78 LY86 6 + 6625012 6626293
79 TLN1 9 - 35711792 35712005
80 FLNA X - 154366224 154366308
81 FLNA X - 154362148 154362242
82 LCK 1 + 32279747 32279841
83 ITGA2B 17 - 44381061 44383493
84 CRIP1 14 + 105488260 105488331
85 PLEKHO1 1 + 150150287 150150912
86 TLN1 9 - 35714373 35714574
87 RBM6 3 + 50068764 50070455
88 HLA-DRB5 6 - 32519651 32521905
89 RPS10 6 - 34417547 34418369
90 CAPN2 1 + 223745439 223746997
91 DEFA1 8 - 6978646 6980013
92 CDK2AP1 12 - 123267282 123271564
93 MPHOSPH8 13 + 19633961 19642115
94 RPL34 4 + 108620600 108621951
95 RBM6 3 + 50070552 50075201
96 ITGA2B 17 - 44383946 44384085
97 IL2RG X - 71108695 71109228
98 GAS5 1 - 173865547 173865857
99 IFI27 14 + 94111773 94114851
100 CD3D 11 - 118339906 118340375
101 MTURN 7 + 30135298 30146177
102 ZYX 7 + 143381779 143382248
103 FLNA X - 154359406 154359484
104 RPL7A 9 + 133349042 133349551
105 PNN 14 + 39177916 39179091
106 IL2RG X - 71109390 71110156
107 PTPRC 1 + 198708261 198709687
108 TAF10 11 - 6611818 6611958
109 PCSK6 15 - 101384425 101389464
110 HSP90B1 12 + 103932418 103932826
111 PCSK6 15 - 101398576 101427892
112 IGHM 14 - 105851974 105852148
113 CCDC92 12 - 123943493 123944272
114 SSR2 1 - 156015069 156018270
115 GAS5 1 - 173864304 173864484
116 HSP90B1 12 + 103934287 103937695
117 GAS5 1 - 173864704 173865229
118 ITGA2B 17 - 44386131 44389286
119 LCK 1 + 32279994 32280079
120 RPL32 3 - 12840242 12841494
121 RPL12 9 - 127449708 127450731
122 CD53 1 + 110894401 110894960
123 CD53 1 + 110897892 110899124
124 PRKCB 16 + 24035547 24092791
125 PTPRC 1 + 198749549 198750492
126 HBD 11 - 5233092 5233991
127 UBE2H 7 - 129879642 129880895
128 CRIP1 14 + 105488516 105488663
129 CD3E 11 + 118314494 118315486
130 PCSK6 15 - 101432100 101443556
131 PRKCB 16 + 23837406 23988508
132 ITGA2B 17 - 44380153 44380246
133 LCK 1 + 32280210 32285514
134 MS4A1 11 + 60464344 60465921
135 TLN1 9 - 35714876 35715059
136 GNAI2 3 + 50236453 50252100
137 IL32 16 + 3068239 3068990
138 RPL7A 9 + 133349700 133349912
139 PTPRC 1 + 198752772 198754269
140 DAP 5 - 10748271 10761014
141 RPS16 19 - 39433761 39435607
142 RPL6 12 - 112408338 112408420
143 RPS23 5 - 82277852 82278320
144 CD53 1 + 110892533 110894327
145 CD48 1 - 160679131 160681202
146 ITGA2B 17 - 44384138 44384311
147 RPS10-NUDT3 6 - 34418424 34421730
148 MPHOSPH8 13 + 19642270 19646443
149 IL7R 5 + 35871213 35873480
150 KLRB1 12 - 9598653 9599767
151 LUC7L3 17 + 50743810 50744652
152 PTPRC 1 + 198744203 198748109
153 RBM6 3 + 50066502 50068690
154 RPL10A 6 + 35469529 35470179
155 COTL1 16 - 84590262 84617501
156 DEFA3 8 - 7016099 7016676
157 IL7R 5 + 35857059 35860852
158 NPM1 5 + 171392816 171392914
159 RPS7 2 + 3575888 3576487
160 MS4A1 11 + 60466157 60466959
161 IGHM 14 - 105854737 105854917
162 RPL18 19 - 48615447 48615877
163 ITGA2B 17 - 44383704 44383894
164 RPS14 5 - 150447735 150449703
165 ITGB2 21 - 44886430 44886736
166 ATP6V1G2-DDX39B 6 - 31530450 31530779
167 RBM6 3 + 50075330 50077008
168 PTPRC 1 + 198702530 198703298
169 CD3E 11 + 118312866 118313707
170 RPL6 12 - 112405376 112405853
171 TLN1 9 - 35712124 35712835
172 GNAI2 3 + 50252142 50252397
173 IL7R 5 + 35875587 35875983
174 RPS16 19 - 39433569 39433665
175 IL2RG X - 71108346 71108599
176 PTPRC 1 + 198752371 198752594
177 NPM1 5 + 171391799 171392710
178 CD27 12 + 6451014 6451268
179 ITGA2B 17 - 44380645 44380879
180 RPLP2 11 + 810039 810234
181 MS4A6A 11 - 60173129 60175402
182 IL2RG X - 71110295 71110504
183 GAS5 1 - 173864506 173864675
184 HNRNPDL 4 - 82427564 82428018
185 ITGA2B 17 - 44380301 44380386
186 RPS8 1 + 44778129 44778576
187 RPL22 1 - 6193054 6197652
188 ITGA2B 17 - 44380490 44380600
189 RPL24 3 - 101682492 101682771
190 ITGA2B 17 - 44385716 44385824
191 PTPRC 1 + 198734425 198735127
192 IL32 16 + 3067613 3067984
193 SELL 1 - 169707449 169708417
194 GAS2L1 22 + 29310734 29310827
195 PTPRC 1 + 198703372 198704472
196 CD27 12 + 6450352 6450541
197 RBM6 3 + 50062108 50065031
198 RPS8 1 + 44776774 44777614
199 RPL23 17 - 38853105 38853698
200 RPS10-NUDT3 6 - 34421807 34424669
201 FLNA X - 154364957 154365136
202 RPL34 4 + 108622024 108622105
203 PTPRC 1 + 198742367 198744054
204 RPL24 3 - 101681215 101682429
205 CD3E 11 + 118313874 118314448
206 PCSK6 15 - 101382209 101384322
207 NENF 1 + 212433120 212442565
208 RPL9 4 - 39454649 39454864
209 TRAF3IP3 1 + 209777487 209778111
210 CCR7 17 - 40555818 40558893
211 ITGA2B 17 - 44385921 44386010
212 FLNA X - 154364372 154364526
213 NPM1 5 + 171392978 171400153
214 RPL6 12 - 112406890 112408240
215 HNRNPDL 4 - 82428446 82429248
216 PCSK6 15 - 101366332 101370335
217 GZMB 14 - 24631214 24631858
218 NCK2 2 + 105816613 105855048
219 ZRANB2 1 - 71078565 71078656
220 PTPRC 1 + 198639341 198692347
221 COTL1 16 - 84566955 84590105
222 FLNA X - 154360587 154361308
223 RPS24 10 + 78040225 78040615
224 ITGB5 3 - 124819834 124821313
225 RPS16 19 - 39433418 39433522
226 RPLP2 11 + 812633 812760
227 RPS8 1 + 44777789 44778000
228 FLNA X - 154366470 154366562
229 PTPRC 1 + 198735252 198741869
230 TRBC2 7 + 142801961 142802105
231 FLNA X - 154358568 154358984
232 HLA-DRA 6 + 32443921 32444652
233 PTPRC 1 + 198722476 198728340
234 FLNA X - 154364165 154364259
235 PTPRC 1 + 198718302 198722416
236 NENF 1 + 212444442 212445830
237 RPS5 19 + 58394595 58394682
238 HNRNPDL 4 - 82424883 82426037
239 PCSK6 15 - 101427980 101429987
240 RPL6 12 - 112406037 112406294
241 HLA-DRB1 6 - 32580270 32580746
242 IL2RG X - 71107921 71108277
243 ITGA2B 17 - 44385335 44385551
244 RPL3 22 - 39318592 39319595
245 PNISR 6 - 99401630 99402540
246 RPS3 11 + 75399577 75400694
247 PTPRC 1 + 198706952 198708133
248 IGHM 14 - 105855234 105855480
249 NKG7 19 - 51372307 51372379
250 SON 21 + 33546379 33549476
251 RPL17 18 - 49488566 49489359
252 GNLY 2 + 85695423 85695958
253 FLNA X - 154352447 154352553
254 MTURN 7 + 30135298 30157438
255 FLNA X - 154365259 154365349
256 RPSA 3 + 39412061 39412274
257 TRAF3IP3 1 + 209778173 209779315
258 FLNA X - 154362578 154362661
259 RPL9 4 - 39457681 39458194
260 MS4A1 11 + 60463121 60464288
261 RPL11 1 + 23693913 23694660
262 PTPRC 1 + 198742026 198742232
263 MAF1 8 + 144105766 144105869
264 ITGB5 3 - 124873531 124886931
265 RPL18 19 - 48615946 48616079
266 PTPRC 1 + 198704498 198706734
267 HSP90B1 12 + 103932942 103933956
268 MTURN 7 + 30157595 30158986
269 RPL13 16 + 89560712 89560940
270 TRIM58 1 + 247868063 247875900
271 GAS2L1 22 + 29310998 29311462
272 CD79B 17 - 63929475 63929770
273 SELL 1 - 169696553 169701560
274 TRAF3IP3 1 + 209775736 209777352
275 ZRANB2 1 - 71076877 71078457
276 RPL35 9 - 124860264 124861419
277 PRKAR2B 7 + 107045214 107070281
278 HNRNPDL 4 - 82427304 82427433
279 FLNA X - 154357623 154358199
280 CD52 1 + 26318071 26320171
281 RPL11 1 + 23692759 23693807
282 RPS23 5 - 82276518 82277693
283 GAS2L1 22 + 29310546 29310638
284 SELL 1 - 169703440 169704568
285 CD79B 17 - 63929324 63929434
286 RPL24 3 - 101682907 101685818
287 CD79A 19 + 41880738 41880867
288 ZYX 7 + 143382685 143382801
289 RPS21 20 + 62387388 62387611
290 RPL14 3 + 40457991 40458642
291 HLA-DRA 6 + 32440032 32442448
292 RPL12 9 - 127450804 127451281
293 RPL18 19 - 48617423 48617791
294 ZRANB2 1 - 71072548 71076795
295 IL32 16 + 3068010 3068180
296 COTL1 16 - 84617583 84617838
297 RPSA 3 + 39408724 39410754
298 FLNA X - 154359905 154359990
299 IL7R 5 + 35873648 35874449
300 RPL9 4 - 39454225 39454533
301 PRKCB 16 + 24113069 24123835
302 TRAF3IP3 1 + 209773019 209775349
303 RNF213 17 + 80263778 80273241
304 RPL5 1 + 92837633 92840551
305 RPL7A 9 + 133351071 133351262
306 RPL7A 9 + 133350319 133350597
307 FLNA X - 154354043 154354151
308 TRBC2 7 + 142801427 142801944
309 FLNA X - 154353204 154353296
310 TRIM58 1 + 247867867 247867963
311 RPL37 5 - 40832573 40834181
312 RPS21 20 + 62387674 62387843
313 RPL14 3 + 40458736 40461407
314 RPS13 11 - 17074466 17075097
315 RPS8 1 + 44776140 44776675
316 MS4A1 11 + 60467060 60468250
317 FLNA X - 154362332 154362418
318 TSPAN33 7 + 129167560 129167773
319 RPL10A 6 + 35470351 35470580
320 RPL5 1 + 92840639 92841766
321 GZMA 5 + 55105618 55107794
322 PRKAR2B 7 + 107122004 107128212
323 ITGB5 3 - 124821474 124841383
324 RPL19 17 + 39201319 39202317
325 RPL5 1 + 92833660 92834779
326 RPL14 3 + 40461661 40461939
327 RPS4X X - 72272772 72273232
328 CCDC92 12 - 123942785 123943347
329 FLNA X - 154359154 154359246
330 FLNA X - 154355072 154357434
331 MTURN 7 + 30146299 30157438
332 RPL28 19 + 55386693 55387930
333 FLNA X - 154359646 154359732
334 RPS6 9 - 19379618 19380190
335 PRKCB 16 + 24092947 24094163
336 GMPR 6 + 16254735 16274415
337 RPS13 11 - 17075623 17077168
338 RPL11 1 + 23695908 23696344
339 RPL5 1 + 92836392 92837456
340 ITGB3 17 + 47291088 47292139
341 PTPRC 1 + 198750626 198752249
342 PTPRC 1 + 198728448 198729137
343 PTPRC 1 + 198732556 198734196
344 LUC7L3 17 + 50741731 50743706
345 PTPRC 1 + 198754404 198755906
346 CD53 1 + 110896733 110897809
347 RPL23 17 - 38850214 38850362
348 SELL 1 - 169701688 169703255
349 TRAF3IP3 1 + 209775489 209775599
350 PRKCB 16 + 24094297 24112973
351 RPS3A 4 + 151099714 151100485
352 RPS12 6 + 132817061 132817480
353 YWHAH 22 + 31944820 31956139
354 RPS21 20 + 62388364 62388457
355 RPL7A 9 + 133350727 133351002
356 PTP4A2 1 - 31919658 31937987
357 FLNA X - 154358355 154358445
358 IL32 16 + 3067415 3067554
359 RPL11 1 + 23694791 23695798
360 NENF 1 + 212442625 212444339
361 RPS24 10 + 78037304 78040204
362 PTPRC 1 + 198729171 198731617
363 PTPRC 1 + 198731726 198732300
364 DAP 5 - 10683571 10748175
365 FLNA X - 154354483 154354616
366 GMPR 6 + 16238780 16246842
367 GNLY 2 + 85696056 85697506
368 SRSF5 14 + 69770540 69770995
369 PRKCB 16 + 23988590 24032136
370 RPL36 19 + 5691453 5691532
371 RPL37 5 - 40834265 40834471
372 PTPRC 1 + 198734232 198734328
373 RPLP2 11 + 811645 812535
374 ITGB3 17 + 47307637 47310139
375 HNRNPDL 4 - 82426129 82426463
376 RPL12 9 - 127447726 127447877
377 PNISR 6 - 99408271 99409173
378 RPL5 1 + 92833458 92833545
379 RPL7A 9 + 133350052 133350240
380 AP1S2 X - 15846011 15852346
381 FLNA X - 154352924 154353001
382 PRKCB 16 + 24032247 24035419
383 NCK2 2 + 105745138 105816430
384 RPL13 16 + 89561063 89561227
385 RPL6 12 - 112406342 112406747
386 RPS16 19 - 39435708 39435848
387 NPM1 5 + 171400210 171400839
388 RPS7 2 + 3576630 3577710
389 FLNA X - 154353457 154353554
390 FLNA X - 154352675 154352772
391 PTPRC 1 + 198699704 198702387
392 RPS10-NUDT3 6 - 34424840 34425072
393 RPL23 17 - 38850475 38852604
394 RPLP2 11 + 810357 811597
395 FLNA X - 154362784 154364022
396 RPS24 10 + 78035720 78037194
397 RPL18 19 - 48616824 48617316
398 FLNA X - 154364719 154364821
399 TRIM58 1 + 247864935 247867845
400 NCK2 2 + 105855289 105881328
401 NPM1 5 + 171407774 171410527
402 ITGB5 3 - 124848558 124859242
403 FLNA X - 154361570 154361670
404 FLNA X - 154353727 154353915
405 NCK2 2 + 105882049 105892982
406 RPS21 20 + 62387914 62388309
407 RPSA 3 + 39411777 39411896
408 NPM1 5 + 171400925 171405302
409 PTPRC 1 + 198748199 198749416
410 ABHD17A 19 - 1880115 1881235
411 CD53 1 + 110895055 110896653
412 GAS2L1 22 + 29308738 29310439
413 RPL9 4 - 39458309 39458394
414 RPS17 15 - 82536881 82538306
415 RPL28 19 + 55388048 55388243
416 RPL35 9 - 124858067 124860183
417 PRKAR2B 7 + 107070316 107121952
418 RPL18 19 - 48616202 48616726
419 FLNA X - 154354291 154354381
420 RPS17 15 - 82538371 82538880
421 ITGB5 3 - 124841551 124848309
422 FLNA X - 154365486 154366024
423 RPL36 19 + 5690600 5691319
424 GNLY 2 + 85697677 85698564
425 RPL23 17 - 38852732 38853022
426 RBM6 3 + 50065126 50066242
427 C12orf75 12 + 105330937 105348602
428 FLNA X - 154366639 154366732
429 RAC1 7 + 6374770 6387212
430 RPL14 3 + 40461506 40461608
431 GMPR 6 + 16246961 16250284
432 RPL5 1 + 92834913 92836190
433 DAP 5 - 10681169 10683529
434 GMPR 6 + 16250367 16254562
435 CD3D 11 - 118339494 118339775
436 HNRNPDL 4 - 82428179 82428278
437 PRKCB 16 + 23836348 23837375
438 LYL1 19 - 13099734 13100657
439 FLNA X - 154366850 154367397
440 ITGB5 3 - 124817710 124819739
441 RPS7 2 + 3580260 3580805
본 발명의 일양태에서, 상기 엑손-접합 라이브러리는 상기 표 1에 기재된 단수 또는 복수의 엑손-접합을 포함하며, 상기 단수 또는 복수의 엑손-접합은 엑손-접합 번호 1, … , 엑손-접합 번호 n-1 및 엑손-접합 번호 n이되, 상기 n은 자연수로서 1 내지 441 중 어느 하나인 것을 특징으로 할 수 있다.
(e) 단계는 상기 각 엑손-접합에서의 염기서열 발현정보를 바탕으로 암 보유 여부를 결정하는 단계이다. 본 단계에서는 상기 각 엑손-접합에서의 염기서열 발현정보를 바탕으로 하여 개체에서 암 보유 여부를 결정한다.
본 발명의 일 구현예에서, 상기 (a) 내지 (d) 단계를 통해 수득한 피험자의 엑손-접합에서의 염기서열 발현정보를 미리 확보된 각 엑손-접합에서의 염기서열 발현량 데이터베이스와 비교함으로써 암 보유 여부를 결정할 수 있다. 예를 들어, 미리 확보된 데이터베이스에 암 환자에서 상향 조절되는 것으로 판별되어 있는 특정 엑손-접합에서의 염기서열 발현량이 정상인 대조군 대비 피험자의 염기서열 발현정보에서 증가되어 있는 경우 상기 피험자는 암을 보유하고 있는 것으로 결정할 수 있다. 이와 같은 결정은 단수 또는 복수의 엑손-접합에서의 염기서열 발현정보를 이용하여 수행될 수 있다.
바람직하게는, 상기 암 보유 여부 결정은 사전 학습된 암 여부 판별 모형에 피험자 상기 (a) 내지 (d) 단계를 통해 수득한 각 엑손-접합에서의 염기서열 발현정보를 적용함으로써 피험자의 암 보유 여부를 결정할 수 있다.
또한 암 여부 판별 모형으로부터 피험자의 암 여부 판별 스코어를 추출하며, 피험자의 엑손-접합에서의 염기서열 발현정보의 히트맵 시각화 결과 및 개인별 엑손-접합(exon-junction) 중요도 정보 등을 제공할 수 있다.
본 발명에서 상기 암 보유 여부의 결정은 하나 또는 2종류 이상의 암의 보유 여부를 결정하는 것일 수 있다. 바람직하게는 2종류 이상의 암의 보유 여부를 결정하는 것으로 상기 2종류 이상의 암의 보유 여부의 결정은 개체에서 분리한 1개의 시료에서 얻은 정보를 이용하여 동시에 또는 순차적으로 결정될 수 있다.
본 발명의 일 구현예에서, 상기 판별 모형은 공개 데이터 (예를 들어, GSE68086)을 이용하여 학습되고, 이를 검증한 모형을 이용할 수 있다. 일반적으로, 학습세트와 검증세트는 전체 세트를 6:4의 비율로 나누어 사용되며, 상기 획득된 엑손-접합 라이브러리 특성에 대해 학습세트를 이용하여 암 여부 판별 모형을 학습하고 검증세트를 이용하여 성능을 확인한 후 사용할 수 있다.
본 발명의 일 실시예에서는 판별 모형은 SVM (support vector machine) 알고리즘을 기반으로 하며, 개체의 혈소판 유래 전사체 데이터로부터 엑손-접합 바이오마커 특성들을 획득하고 이를 판별 모형에 입력함으로써 피험자의 샘플에 대한 암 정상 여부를 판별할 수 있었다. 또한 판별 모형에서는 암 또는 정상 여부에 대한 판별 스코어를 출력 값으로 출력할 수도 있다.
한편, SVM 알고리즘을 기반으로 학습한 판별 모형이라는 점은 일 예시에 불과하며 암 판별 모델을 학습할 때 사용할 수 있는 모든 머신러닝 방법 또는 유형은 모두 포함하는 것으로 해석되어야 한다. 예를 들어, 머신러닝 방법은 (1) 지도 학습법(supervised learning) (2) 비지도학습(unsupervised learing) (3) 강화학습(reinforcement learning) (4) 준지도학습(semi-supervised learning) (5) 뉴럴 네트워크 등을 포함할 수 있으며, 더욱 구체적으로는 나이브 베이즈 분류(Naive Bayes Classification), 로지스틱 회귀(Logistic Regression), 의사결정나무(Decision tree), 랜덤포레스트(Random forest), 부스팅(XGBoost/ensemble boosting/AdaBoost/Gradient Boost/LightGBM/CatBoost 등), 퍼셉트론(Perceptron), 서포트 벡터 머신(Support Vector Machine), 쿼드라틱 분류(Quadratic classifiers), 클러스터링(K-means clustering, Bayesian network clustering 등), 딥 뉴럴 네트워크(Deep Neural Network) 등을 모두 포함할 수 있으나 이에 한정되지 않는다.
본 발명에서 뉴럴 네트워크(neural network)란, 생물학적 신경망을 모방한 학습 알고리즘을 의미하며, 해당 알고리즘은 입력층, 최소 한 개의 은닉층 및 출력층으로 구성될 수 있으며, 각 층은 적어도 하나의 노드로 구성될 수 있다. 각 층의 노드들은 이전 층에 존재하는 노드들로부터 결과값을 입력 받아 수학적 모델에 기반한 연산을 수행하여 새로운 결과값을 출력하며, 새로운 결과값을 다음 층의 노드들로 전달한다. 본 발명에서의 뉴럴 네트워크는 컨볼루션 뉴럴 네트워크 (Convolutional Neural Network), 딥 뉴럴 네트워크 (Deep Neural Network) 뿐만 아니라, 본 발명의 바이오마커를 특성으로 하여 모형을 생성할 수 있는 모든 종류의 뉴럴 네트워크를 포함한다.
한편, 상기 암 보유 여부의 결정 결과는 추가적으로 개체의 암에 대한 판별 스코어와 개체의 엑손-접합 데이터의 시각화 및 개체의 엑손-접합 중요도 정보를 통합하여 제공할 수 있다. 예를 들어, 사전 학습된 암 여부 판별 모형에 개체의 엑손-접합 바이오마커 특성을 입력하면 암 또는 정상에 대한 예측 확률을 얻고, 이에 기반한 암 여부 판별 결과를 통보해주는 수단이다. 또한 해당 바이오마커들의 발현 패턴을 시각적으로 보여주며 개인의 엑손-접합 중요도를 분석함에 따라 개인에 대한 다양한 예후를 제공할 수도 있다.
본 발명에서 상기 암은 그 종류가 특별히 제한되지 않으나, 방광암, 뼈암, 혈액암, 유방암, 흑색종양, 갑상선암, 부갑상선암, 골수암, 직장암, 인후암, 후두암, 폐암, 식도암, 췌장암, 대장암, 위암, 설암, 피부암, 뇌종양, 자궁암, 두부 또는 경부암, 담낭 암, 구강암, 결장암, 항문 부근암, 중추신경계 종양, 간암 및 대장암으로 이루어진 군에서 선택되는 하나 이상일 수 있다.
본 발명은 또한 상기 표 1의 엑손-접합(exon-junction)으로 이루어진 군에서 선택된 단수 또는 복수의 엑손-접합; 또는 상기 표 1의 엑손-접합으로 이루어진 군에서 선택된 단수 또는 복수의 엑손-접합을 검출할 수 있는 제제를 유효성분으로 포함하는 암 진단용 조성물로서, 상기 엑손-접합은 (i) 개체의 혈액의 무핵세포에서 분리한 RNA 또는 이의 일부, (ii) 개체의 혈액의 엑소좀에서 분리한 전체 RNA 또는 이의 일부, 및 (iii) 개체의 혈액에서 분리한 전체 cfRNA 또는 이의 일부에서 검출하는 것을 특징으로 하는 암 진단용 조성물 및 상기 암 진단용 조성물을 포함하는 암 진단 키트를 제공한다.
본 발명에서 상기 단수 또는 복수의 엑손-접합을 검출할 수 있는 제제란 상기 단수 또는 복수의 엑손-접합 부위를 증폭할 수 있는 프라이머쌍, 바람직하게는, 상기 표 1에서 각 엑손-접합에서 position 1 및 position 2의 각 염기를 포함하면서 5'방향 및/또는 3'방향으로 연속되는 2 이상의 염기를 포함하는 서열을 특이적으로 증폭할 수 있는 프라이머쌍일 수 있다.
본 발명에서 사용하는 용어인 프라이머란 짧은 자유 3'말단 수산화기(free 3' hydroxyl group)를 가지는 핵산 서열로 상보적인 주형(template)과 염기쌍(base pair)을 형성할 수 있고 주형 가닥 복사를 위한 시작 지점으로 기능을 하는 짧은 핵산 서열을 의미한다. 프라이머는 적절한 완충용액 및 온도에서 중합반응을 위한 시약(DNA 중합효소 또는 역전사 효소) 및 상이한 4가지 dNTP (deoxynucleoside triphospate)의 존재하에서 DNA합성을 개시할 수 있다.
프라이머는 DNA 합성의 개시점으로 작용하는 프라이머의 기본 성질을 변화시키지 않는 추가의 특징을 혼입할 수 있다. 본 발명에서 상기 서열번호 1 내지 7의 염기서열을 포함하는 프라이머는 각각 서열 상동성이 95% 이상인 염 기서열을 포함하는 개념이다.
본 발명에서 상기 프라이머는 포스포르아미다이트 고체 지지체 방법, 또는 기타 널리 공지된 방법을 사용하여 화학적으로 합성할 수 있다. 이러한 핵산 서열은 또한 당해 분야에 공지된 많은 수단을 이용하여 변형시킬 수 있다. 이러한 변형의 비제한적인 예로는 메틸화, "캡화", 천연 뉴클레오타이드 하나 이상의 동족체로의 치환, 및 뉴클레오타이드 간의 변형, 예를 들면, 하전되지 않은 연결체(예: 메틸 포스포네이트, 포스포트리에스테르, 포스포로아미데이트, 카바메이트 등) 또는 하전된 연결체(예: 포스포로티오에이트, 포스포로디티오에이트 등)로의 변형이 있다. 핵산은 하나 이상의 부가적인 공유 결합된 잔기, 예를 들면, 단백질(예: 뉴클레아제, 독소, 항체, 시그날 펩타이드, 폴리-L-리신 등), 삽입제(예: 아크리딘, 프소랄렌 등), 킬레이트화제(예: 금속, 방사성 금속, 철, 산화성 금속 등), 및 알킬화제를 함유할 수 있다.
또한, 본 발명에서 상기 프라이머 핵산 서열은 필요한 경우, 분광학적, 광화학적, 생화학적, 면역화학적 또는 화학적 수단에 의해 직접적으로 또는 간접적으로 검출 가능한 표지를 포함할 수 있다. 표지의 예로는, 효소 (예를 들어, 호스래디쉬 퍼옥시다제, 알칼린 포스파타아제), 방사성 동위원소(예를 들어, 32P), 형광성 분자, 화학그룹(예를 들어, 바이오틴) 등이 있다.
본 발명에서 상기 진단용 키트는 본 발명에 따른 상기 바이오마커인 단수 또는 복수의 엑손-접합 부위를 검출하기 위해 사용될 수 있다. 본 발명의 상기 키트에는 상기 단수 또는 복수의 엑손-접합 부위를 검출하기 위한 프라이머, 프로브, 안티센스 핵산뿐만 아니라 분석 방법에 적합한 한 종류 또는 그 이상의 다른 구성성분 조성물, 용액 또는 장치가 포함될 수 있다.
구체적인 일례로서, 본 발명의 키트는 PCR을 수행하기 위해, 분석하고자 하는 시료로부터 유래된 mRNA 및/또는 이와 상보적인 cDNA에 대해 특이적인 프라이머 세트, 적당량의 DNA 중합효소, dNTP 혼합물, PCR 완충용액 및 물을 포함하는 키트일 수 있다. 상기 PCR 완충용액은 KCl, Tris-HCl 및 MgCl2를 함유할 수 있다. 이외에 PCR 산물의 증폭 여부를 확인할 수 있는 전기영동 수행에 필요한 구성 성분들이 본 발명의 키트에 추가로 포함될 수 있다.
다른 구체적인 일례로서, 본 발명의 키트는 DNA 칩(chip)을 수행하기 위해 필요한 필수 요소를 포함하는 키트일 수 있다. DNA 칩 키트는, 유전자 또는 그의 단편에 해당하는 cDNA가 프로브로 부착되어 있는 기판, 형광표식 프로브를 제작하기 위한 시약, 제제, 효소 등을 포함할 수 있다. 또한, 기판은 정량 대조군 유전자 또는 그의 단편에 해당하는 cDNA를 추가로 포함할 수 있다.
한편, 상기 키트에는 실험상의 편의, 안정화 및 반응성 향상을 위해 안정화제 및/또는 비반응성 염료 등을 포함할 수 있다.
상기 비반응성 염료 물질이란 중합효소연쇄반응에 영향을 미치지 않는 물질로부터 선택되어져야 하며, 중합효소연쇄반응 산물을 이용한 분석이나 식별을 위해 사용되는 것을 목적으로 한다. 이러한 조건을 만족시키는 물질로는 로다민, 탐라, 락스, 브로모페놀 블루, 크실렌 시아놀, 브로모크레졸 레드, 크레졸 레드 등의 수용성 염료로 사용될 수 있다. 상기 비반응성 염료 물질은 조성물 전체 중량 대비 0.0001∼0.01중량%의 함량으로 포함될 수 있으며, 0.001∼0.005중량%의 함량으로 포함되는 것이 바람직하다. 조성물 전체 중량 대비 0.01중량% 초과의 함량으로 첨가되는 경우 중합효소연쇄반응 시 고농도의 수용성 염료가 반응 저해제로 작용될 수 있는 문제점이 있다.
또한, 상기 다가알코올류는 본 발명의 키트 구성성분을 보다 안정화시키기 위한 안정화 물질로 사용될 수 있으며, 글루코스, 글리세롤, 만니톨, 갈락시톨, 글루시톨, 솔비톨 중 하나 이상의 물질을 사용할 수 있다.
상기 키트 구성성분은 액상 형태로 제공될 수 있으며, 안정성, 보관의 간편성 및 장기 보관성을 증가시키기 위하여 건조된 상태인 것이 바람직하다. 상기 건조는 일반적인 상온건조, 가온건조, 동결건조, 감압건조와 같은 공지의 건조 방법에 의해 수행될 수 있으며, 조성물의 성분이 손실되지 않는 한, 임의의 건조 방법은 모두 사용 가능하다.
본 발명에서는 또한 다양한 DNA 중합효소가 본 발명의 증폭 단계에 이용될 수 있으며, E. coli DNA 중합효소 I의 "클레나우" 단편, 열안정성 DNA 중합효소 및 박테리오파아지 T7 DNA 중합효소가 이에 포함될 수 있으나, 이에 제한되는 것은 아니다. 바람직하게는, 중합효소는 다양한 박테리아 종으로부터 얻을 수 있는 열안정성 DNA 중합효소이고, 이는 Thermus aquaticus (Taq), Thermus thermophilus (Tth), Thermus filiformis, Thermis flavus, Thermococcus literalis, 및 Pyrococcus furiosus(Pfu)를 포함한다. 상기 중합효소 대부분은 박테리아 그 자체로부터 분리될 수 있고 또는 상업적으로 구입할 수 있다. 또한, 본 발명의 키트에서 이용되는 중합효소는 중합효소를 암호화하는 클로닝 유전자의 높은 레벨을 발현하는 세포로부터 수득할 수 있다.
암 진단을 위한 분석
본 진단 방법은 특정 대상체에서 병태, 특히 질환의 존재를 진단하거나, 병태의 특징을 규명하거나 (예를 들어, 암의 병기를 결정하거나 또는 암의 이질성을 결정한다), 병태의 치료제에 대한 효능을 확인하거나, 병태의 치료에 대한 반응을 모니터링하거나, 병태 또는 병태의 후속 과정의 발생 위험을 예후 예측/진단하기 위해 사용될 수 있다. 본 기재 내용은 또한, 특별한 치료 요법의 효능을 결정하는 데 유용할 수 있다. 또 다른 예에서, 특정의 치료 요법은 시간 경과에 따른 암의 프로파일 변화와 상관이 있을 수 있다. 이러한 상관 관계는 요법을 선택하는 데 유용할 수 있다. 부가적으로, 치료 후에 암에 차도가 있는 것으로 관찰되는 경우, 본 진단 방법은 잔여 질환 또는 질환의 재발을 모니터링하기 위해 사용될 수 있다.
본 발명에 따른 엑손-접합에서의 염기서열정보는 또한, 특이적 형태의 암의 특징을 규명하기 위해 사용될 수 있다. 암은 종종, 조성과 병기 둘 다에 있어서 이질적이다. 유전적 프로파일 데이터는 특이적 하위 유형의 암을 진단 또는 치료하는 데 중요할 수 있는, 그러한 특이적 하위 유형의 암의 특징 규명을 허용할 수 있다. 이러한 정보는 또한, 특이적 유형의 암의 예후에 관한 대상체 또는 실무자에게 단서를 제공할 수 있으며, 대상체 또는 실무자가 질환의 진행에 따라 치료 옵션을 채택하도록 허용할 수 있다. 일부 암은 보다 공격적이고 유전적으로 불안정하도록 진행될 수 있다. 다른 암은 양성, 비활성 또는 휴면 상태로 남아있을 수 있다. 본 기재 내용의 방법은 질환 진행을 결정하는데 유용할 수 있다.
마커 및 패널
본 발명에서 마커는 정상 샘플군과 암 샘플군에서, 각 엑손-접합 종류에 대해 계수되고 정규화된 값들을 비교하여 암 샘플군에서 유의하게 높게 나오거나 낮게 나오는 정해진 길이의 서열을 마커로 선정할 수 있다. 가장 간단하게는 각 엑손-접합 부위에서, 정상샘플군과 암샘플군에서의 평균값의 차이를 이용하며, 또는 T-test, Mann-Whitney test, Wilcoxon Test, 또는 Cohen's D test 등의 다양한 통계기법을 사용하여 두 샘플군에서 유의한 차이가 나는 서열들을 선택한다.
본 발명은 진단 마커로서 각 마커를 개별적으로 사용하거나, 전체적으로 사용하거나, 몇몇 마커를 조합하여 패널 디스플레이 형태로 하여 사용할 수 있고, 몇몇의 마커는 전체적인 패턴의 목록을 통하여 신뢰성 및 효율성을 향상시키는 것을 확인할 수 있다. 본 발명에서 확인된 마커는 개별적으로, 또는 조합된 마커 세트로 사용될 수 있다. 마커들은 마커의 수 및 그 중요도에 따라 순위를 매길 수 있고, 가중치를 둘 수 있으며, 질환으로 발전할 가능성의 수준을 선정할 수 있다. 이러한 알고리즘은 본 발명에 속한다.
한편, 본 발명은 상기 표 1의 엑손-접합(exon-junction)으로 이루어진 군에서 선택된 단수 또는 복수의 엑손-접합을 유효성분으로 포함하는 암 진단용 조성물이며, 상기 엑손-접합은 (i) 개체의 혈액의 무핵세포에서 분리한 RNA 또는 이의 일부, (ii) 개체의 혈액의 엑소좀에서 분리한 전체 RNA 또는 이의 일부, 및 (iii) 개체의 혈액에서 분리한 전체 cfRNA 또는 이의 일부에서 검출하는 것을 특징으로 하는 암 진단용 조성물을 제공한다.
아울러, 본 발명은 상기 조성물을 포함하는 암 진단 키트를 제공한다.
아울러, 본 발명은 상기 표 1의 엑손-접합으로 이루어진 군에서 선택된 단수 또는 복수의 엑손-접합을 검출할 수 있는 제제를 포함하는, 암 진단용 조성물이며, 상기 엑손-접합은 (i) 개체의 혈액의 무핵세포에서 분리한 전체 RNA 또는 이의 일부, (ii) 개체의 혈액의 엑소좀에서 분리한 전체 RNA 또는 이의 일부, 및 (iii) 개체의 혈액에서 분리한 전체 cfRNA 또는 이의 일부에서 검출하는 것을 특징으로 하는 암 진단용 조성물을 제공한다.
따라서, 본 발명의 방법은 암의 진단, 치료 요법에 대한 모니터링, 암 환자의 예후에 필요한 정보를 제공할 수 있어 항암 치료에 유용하게 이용될 수 있다.
도 1는 441개의 엑손-접합 라이브러리를 선별하는 과정에 대한 흐름도이다.
도 2은 선별된 441개 엑손-접합 라이브러리의 특성에 대한 일 예시도를 나타낸 것이다.
도 3는 엑손-접합의 정의를 나타낸 것이다.
도 4는 엑손-접합에서의 리드수를 계수하는 단계의 과정을 나타낸 것이다.
도 5a는 암 여부 판별 모형 학습 시 사용된 학습 데이터셋 샘플들의 441개 엑손-접합 라이브러리에 대한 발현 패턴의 일 예시도를 나타낸 것이다.
도 5b는 암 여부 판별 모형 학습 시 사용된 검증 데이터셋 샘플들의 441개 엑손-접합 라이브러리에 대한 발현 패턴의 일 예시도를 나타낸 것이다.
도 6a는 본원의 일 실시예에 따라 441개 엑손-접합 라이브러리에 의한 암과 정상 판별 모형 성능을 설명하기 위해 선행연구에서 유전자 1,072개를 특성으로 하여 학습한 Support Vector Machine (SVM) 모형의 AUC 스코어를 나타낸 것이다.
도 6b는 본원의 일 실시예에 따라 441개 엑손-접합 라이브러리에 의한 암과 정상 판별 모형 성능을 설명하기 위해 본원에 따른 441개 엑손-접합 라이브러리를 특성으로 하여 학습한 DNN 모형의 AUC 스코어를 나타낸 것이다.
도 7은 441개 엑손-접합 라이브러리에 의한 모형과 선행 연구의 1,072개 유전자를 이용한 모형 성능을 비교하기 위한 일 예시도를 나타낸 것이다.
도 8은 정상 샘플에 비해 암 샘플에서 발현이 낮아지는 엑손-접합(exon-junction) 중 암과 정상 샘플에서의 차이가 가장 큰 엑손-접합(exon-junction)의 정량 정보에 대한 일 예시도를 나타낸 것이다.
도 9a는 학습 데이터셋 샘플들에 대하여 정상 샘플에 비해 암 샘플에서 발현이 낮아지는 엑손-접합(exon-junction) 중 암과 정상 샘플에서의 차이가 가장 큰 엑손-접합(exon-junction)의 정규화된 발현값에 대한 일 예시도를 나타낸 것이다.
도 9b는 검증 데이터셋 샘플들에 대하여 학습 데이터셋으로 선별한 정상 샘플에 비해 암 샘플에서 발현이 높아지는 엑손-접합(exon-junction) 중 암과 정상 샘플에서의 차이가 가장 큰 엑손-접합(exon-junction)의 정규화된 발현값에 대한 일 예시도를 나타낸 것이다.
도 10은 본원에 따른 441개 엑손-접합 라이브러리의 전체 또는 일부를 사용한 암 여부 판별 모형의 성능을 확인한 일 예시도이다.
아래에서는 첨부한 도면을 참조하여 본원이 속하는 기술 분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있도록 본원의 실시예를 상세히 설명한다. 그러나 본원은 여러 가지 상이한 형태로 구현될 수 있으며 여기에서 설명하는 실시예에 한정되지 않는다.
본원 명세서 전체에서, 어떤 부분이 어떤 구성 요소를 “포함” 한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성 요소를 제외하는 것이 아니라 다른 구성 요소를 더 포함할 수 있는 것을 의미한다.
본원 명세서 전체에서 사용하는 정도의 용어 “약”, “실질적으로” 등은 언급된 의미에 고유한 제조 및 물질 허용오차가 제시될 때 그 수치에서 또는 그 수치에 근접한 의미로 사용되고, 본원의 이해를 돕기 위해 정확하거나 절대적인 수치가 언급된 개시 내용을 비양심적인 침해자가 부당하게 이용하는 것을 방지하기 위해 사용된다. 본원 명세서 전체에서 사용하는 정도의 용어 “~(하는) 단계” 또는 “~의 단계”는 “~ 를 위한 단계”를 의미하지 않는다.
본원 명세서 전체에서, “바이오마커”란 단백질이나 DNA, RNA, 대사 물질 등을 이용해 몸 안의 변화를 알아낼 수 있는 지표로서, 더 구체적으로는 '서열번호 1 내지 882'로 표현되는 유전자 서열의 전부 또는 그 일부 또는 '엑손-접합 라이브러리 1 내지 441'로 표현되는 “엑손-접합 라이브러리”을 포함하는 용어이다.
본원 명세서 전체에서, “엑손-접합 라이브러리”이란, 본원에서 청구하는 유전자 서열의 일부 조합을 의미한다. 본원이 청구하는 유전자 서열은 두 개씩 동시에 사용되는 것이 바람직하며, 이에 따른 조합을 표 2에 정리하였다. 예를 들어, 본원 명세서 전체에서 '엑손-접합 라이브러리 1'이란 '서열번호 1 및 서열번호 2'를 의미하는 것이며, '엑손-접합 라이브러리 441'이란 '서열번호 881 및 서열번호 882'를 의미하는 것이다.
이하, 본 발명의 이해를 돕기 위하여 바람직한 실시예를 제시한다. 그러나 하기의 실시예는 본 발명을 보다 쉽게 이해하기 위하여 제공되는 것일 뿐, 이에 의해 본 발명의 내용이 한정되는 것은 아니다.
실험방법
1. 혈액에서 혈소판 분리
EDTA가 들어있는 검체 용기에 6mL의 혈액을 채취하여 이를 15mL 코니칼 (conical) 튜브로 옮기어 120g에서 20분간 원심 분리를 하였다. 상층의 혈소판 풍부 혈장의 1.3mL를 e-tube로 옮기고 360g로 20분간 원심분리를 후 상층액을 제거하고 침전된 혈소판을 확보하였다. RNAlater (ThermoFishcer) 30uL를 혈소판에 넣은 후 조심스럽게 혈소판 침전을 풀어주고, 4℃에서 하루 보관한 후에 영하 80℃에서 이후의 분석이 진행되기 전까지 보관하였다.
2. total RNA 분리 및 cDNA 합성
RNAlater처리된 혈소판 샘플에서 total RNA를 mirVana miRNA Isolation Kit (ThermoFisher) 등을 사용하여 분리하였다. 이때 얻어진 RNA의 양이 500pg 이상이며 RIN 값이 6이상이고 5S/28S/18S의 피크가 잘 나오는지를 확인 후 RNA 시퀀싱 라이브러리 제작을 위한 cDNA를 합성하였다.
3. NGS 서열분석
일루미나사의 장비를 이용하여 Paired-end로 FASTAQ 포맷으로 제조사의 지침에 따라서 시퀀싱 데이터를 생산하였다. 생산된 데이터의 어댑터 서열 및 퀄리티가 낮은 베이스들을 제거하고 시퀀싱된 리드 (read)를 참조 유전체에 매핑하여 sam 파일을 생성하였다. 생성된 sam 파일은 각 리드별로 참조 유전체에서의 염색체 번호 및 위치 정보를 담고 있다. sam 파일은 용량이 매우 크므로 sam 파일을 bam 파일로 변환하여 사용하였다. 또한 참조 유전체에 정확하게 매핑된 리드만을 사용하기 위하여 bam 파일로부터 primary alignment가 아닌 리드들은 제거하였다.
4. 엑손-접합(exon-junction) 수 계산
엑손-접합 수는 선별된 리드 (read) 중 한 유전자 내 서로 다른 두 개의 엑손의 최말단, 즉 상위 위치의 엑손의 끝 부분과 하위 위치의 엑손의 시작 부분으로부터 시작하여 최소 1개 이상의 연속된 엑손 영역 염기쌍을 포함하는 리드를 각각 계수하여 얻었으며, 해독되지 아니하는 인트론 부분을 포함하는 리드의 경우 계수하지 아니하였다.
실시예 1. 바이오마커 선별
본 발명에서는 공개 혈소판 전사체 데이터(GSE68086)를 사용하였으며, 전체 세트 (283개 샘플)를 6:4의 비율로 나누어 각각 학습 데이터셋 (175개 샘플)과 검증 데이터셋 (108개 샘플)으로 사용하였다. 바이오마커 선별 및 암 여부 판별 모형에는 학습 데이터셋만 사용되며, 학습된 암 여부 판별 모형의 성능은 검증 데이터셋을 통해 확인하였다.
진단능이 있는 바이오마커 발굴을 위해 학습 데이터셋을 엑손-접합에 대한 CPM (counts per million mapped reads) 값으로 정규화 후 모든 샘플에서 log2CPM 값이 0인 엑손-접합을 제외하였으며, 성별에 대한 차이가 발생하지 않도록 Y 염색체에 존재하는 엑손-접합을 제외하였다. Batch-invariant 정규화 후 학습 데이터셋의 모든 샘플에 대한 분산이 0인 엑손-접합을 제외하고, 남은 엑손-접합에 대하여 Mann-Whitney test를 수행하여 임계값인 False Discovery Rate (FDR) 0.05 이하 및 log2FoldChange의 절댓값 1.4 이상을 만족하는 441개의 엑손-접합을 엑손-접합 바이오마커로 결정하였다. 도 1은 441개의 엑손-접합 바이오마커를 선별하는 과정에 대한 흐름도이다.
위에 따라 본 연구에서는 441개의 엑손-접합에 해당하는 엑손-접합 라이브러리를 도출하였으며, 해당 엑손-접합 라이브러리는 441개의 상위 위치의 엑손에서의 3' 접합지점 (position 1) 및 441개의 하위 위치의 엑손에서의 5' 접합지점 (position 2)를 포함하는 882개의 엑손-접합 지점으로 구성된다.
도 2는 위에 따라 도출된 441개 엑손-접합 라이브러리의 특성에 대한 일 예시도를 나타낸 것으로, log2FoldChange와 Mann-Whitney test FDR을 각각 x축, y축으로 하여 도출된 441개 엑손-접합 라이브러리가 암과 정상에서 유의하게 차이나는 정도를 나타낸 것이다. 바이오마커 선별에 사용된 임계값인 False Discovery Rate (FDR) 0.05 및 log2FoldChange 1.4, -1.4를 점선으로 표시하였다.
그 결과, 표시된 441개 엑손-접합 라이브러리가 암 샘플과 정상 샘플에서 유의한 차이가 나타났다. 각각의 점은 엑손-접합 라이브러리 발굴 분석에 사용된 모든 엑손-접합을 나타내며, 이 중 FDR 0.05 이하, log2FoldChange 1.4 이상으로 정상 샘플에 비해 암 샘플에서 발현이 높아지는 (상향조절) 엑손-접합 라이브러리는 빨간색, FDR 0.05 이하, log2FoldChange -1.4 이하로 발현이 낮아지는 (하향조절) 엑손-접합 라이브러리는 파란색으로 나타내었다. Log2FoldChange의 절댓값이 커질수록 암 샘플과 정상 샘플에서 발현값의 변화가 크다는 것을 의미하므로 x축의 양의 방향으로 갈수록 해당 엑손-접합에서 정상 샘플에 비해 암 샘플에서 발현이 높아지고 음의 방향으로 갈수록 정상 샘플에 비해 암 샘플에서 발현이 낮아짐을 의미한다. 또한 FDR이 작을수록 그래프의 y값은 커지므로 암 샘플과 정상 샘플에서 발현값 차이가 유의하고, 그 차이가 클수록 도면의 우상향 또는 좌상향에 위치한다. 441개 엑손-접합 라이브러리의 유전자 정보는 상기 표 1에 명시되어 있으며, 이 중 상향 조절되는 것은 156개이고, 하향 조절되는 것은 285개이다.
본 발명에서 서열번호 1 내지 882은 다음과 같이 정의된다. 서열번호 1 내지 882에서 홀수 서열번호는 상기 표 1에 명시된 각각의 엑손-접합 부위에서 position 1을 포함하면서 5'방향으로 150개의 염기서열을 나타낸 것이다. 예를 들어, 서열번호 1은 상기 표 1에서 엑손-접합 번호 1번의 position 1의 염기를 포함하면서 5'방향으로 150개의 염기서열을 나타내며, 서열번호 881은 상기 표 1에서 엑손-접합 번호 441번의 position 1의 염기를 포함하면서 5'방향으로 150개의 염기서열을 나타낸다. 그 다음으로, 서열번호 1 내지 882에서 짝수 서열번호는 상기 표 1에 명시된 각각의 엑손-접합 부위에서 position 2를 포함하면서 3'방향으로 150개의 염기서열을 나타낸 것이다. 예를 들어, 서열번호 2는 상기 표 1에서 엑손-접합 번호 1번의 position 2의 염기를 포함하면서 3'방향으로 150개의 염기서열을 나타내며, 서열번호 882는 상기 표 1에서 엑손-접합 번호 441번의 position 2의 염기를 포함하면서 3'방향으로 150개의 염기서열을 나타낸다. 즉, 각각의 홀수 서열번호에 포함된 150개의 염기 중 3'말단 염기는 상기 표 1에서 position 1에 해당하는 염기이며, 각각의 짝수 서열번호에 포함된 150개의 염기 중 5'말단 염기는 상기 표 1에서 position 2에 해당하는 염기이다.
본 발명에서 암 진단을 위한 엑손-접합 바이오마커는 홀수 서열번호에서 3'말단 염기(즉, 상기 표 1에서 position 1에 해당하는 염기) 및 짝수 서열번호에서 5'말단 염기(즉, 상기 표 1에서 position 2에 해당하는 염기)를 필수적으로 포함하면서, position 1을 기준으로 홀수 서열번호의 5'방향 및/또는 position 2를 기준으로 짝수 서열번호의 3'방향으로 연속되는 염기를 하나 이상 추가로 포함하는 염기서열일 수 있다.
본 발명의 일 구체예에서, 상기 암 진단을 위한 엑손-접합 바이오마커는 홀수 서열번호에서 3'말단 염기(즉, 상기 표 1에서 position 1에 해당하는 염기) 및 짝수 서열번호에서 5'말단 염기(즉, 상기 표 1에서 position 2에 해당하는 염기)를 필수적으로 포함하면서, position 1을 기준으로 홀수 서열번호의 5'방향 및/또는 position 2를 기준으로 짝수 서열번호의 3'방향으로 연속되는 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, 100, 110, 120, 130, 140, 150, 160, 170, 180, 190, 200, 210, 220, 230, 240, 250, 260, 270, 280, 290 또는 298개의 염기를 추가로 포함하는 염기서열일 수 있다.
이하 표 2에는 서열번호 1 내지 882의 염기서열을 나타내었다. 하기 표 2에서 엑손-접합 번호는 상기 표 1의 엑손-접합 번호와 대응된다.
엑손
접합
번호
서열
번호
염기서열 서열
번호
염기서열
1 1 GCCGGAGAGCTGGTGCTTGGGGCTCCTGGCGGCTATTATTTCTTAGGTACGTGCCCATCCGTACACCTCCCTCCCTTCTCGCGGCCCAAGGAGACCGCTTTGGGCTTCACACCCGCTGTCCCTCCCGCCCTAGGTCTCCTGGCCCAGGCT 2 CCGCCGACTCAAGGCCCCGCCCCTGTCCCCCAGCCCTCCTCCGGGCTCGCGCGCGCCTCCCTTCACCCCTGCGCTGACCCCTCCTCCTTGTCTCCTGCAGGCTGGGACAAGCGTTACTGTGAAGCGGGCTTCAGCTCCGTGGTCACTCAG
2 3 TTGATCCTGCTATTGTCATCTCTCCCAGTGGGAAGTACAATGCTGTCAAGCTTGGTAAATATGAAGATTCAAATTCAGTGACATGTTCAGTTCAACACGACAATAAAACTGTGCACTCCACTGACTTTGAAGTGAAGACAGATTCTACAG 4 ATCACGTAAAACCAAAGGAAACTGAAAACACAAAGCAACCTTCAAAGAGCTGCCATAAACCCAAAGGTTAGTTCAAATCAAAGGGCCAACTTCAGAATCAAGGGTTAAAGCAAACTCTGTAATTGTCCACTGGGGCCAAAATGTATCAGA
3 5 TAATAACCAAGGTTCTAAGCAAAGTTCTGAAAAGAAAACTTTTTGTAGTAAATATGCTAGCATAGACAAGTTCCTTGTGTTTTCCAACAGGTTTGCTTCAAAATCAATCCTTACAGCTTCAAGAACAGGAGAAACTCTTAACAAAGAAAG 6 ATCAGGCTTTGCCCGTGTGGAGTCCAAAGTCCTTCCCTAACGAAGTGGAGCCTGAGGGTACAGGGAAGGAGAAAGACTGGGATCTCAGAGACCAGCTGCAAAAGAAGACTTTGCAGCTCCAGGCCAAGGAAAAGGAGGTGAGAGGGTGAC
4 7 CCATTCAGTGGTTCCACAATGGGAATCTCATTCCCACCCACACGCAGCCCAGCTACAGGTTCAAGGCCAACAACAATGACAGCGGGGAGTACACGTGCCAGACTGGCCAGACCAGCCTCAGCGACCCTGTGCATCTGACTGTGCTTTCCG 8 AATGGCTGGTGCTCCAGACCCCTCACCTGGAGTTCCAGGAGGGAGAAACCATCATGCTGAGGTGCCACAGCTGGAAGGACAAGCCTCTGGTCAAGGTCACATTCTTCCAGAATGGAAAATCCCAGAAATTCTCCCATTTGGATCCCACCT
5 9 GTCACCACGGATCTGCGTCAGCGCTGTACCGATGGCCACACTGGGACCTCAGTCTCTGCCCCCATGGTGGCGGGCATCATCGCCTTGGCTCTAGAAGCAAAGTAAGTTCCCACTTACCTTTTTCTAAAAAAAAAAAATGTTTAGATTGTG 10 TACTGCTCGTGCGATGGCTACACCAACAGCATCTACACCATCTCCGTCAGCAGCGCCACCGAGAATGGCTACAAGCCCTGGTACCTGGAAGAGTGTGCCTCCACCCTGGCCACCACCTACAGCAGTGGGGCCTTTTATGAGCGAAAAATC
6 11 GGCATGGAAAGGCTGTAGTTGTTCACCTGCCCAAGAACTAGGAGGTCTGGGGTGGGAGAGTCAGCCTGCTCTGGATGCTGAAAGAATGTCTGTTTTTCCTTTTAGAAAGTTCCTGTGATGTCAAGCTGGTCGAGAAAAGCTTTGAAACAG 12 ATACGAACCTAAACTTTCAAAACCTGTCAGTGATTGGGTTCCGAATCCTCCTCCTGAAAGTGGCCGGGTTTAATCTGCTCATGACGCTGCGGCTGTGGTCCAGCTGAGGTGAGGGGCCTTGAAGCTGGGAGTGGGGTTTAGGGACGCGGG
7 13 TATTACATAACATTCTTATTCTTTTAACAGGTCCAGGAGAGCCTCAGATTATTTTTTGTAGAAGTGAAGCTGCACATCAAGGAGTAATTACCTGGAATCCCCCTCAAAGATCATTTCATAATTTTACCCTCTGTTATATAAAAGAGACAG 14 AAAAAGATTGCCTCAATCTGGATAAAAACCTGATCAAATATGATTTGCAAAATTTAAAACCTTATACGAAATATGTTTTATCATTACATGCCTACATCATTGCAAAAGTGCAACGTAATGGAAGTGCTGCAATGTGTCATTTCACAACTA
8 15 CCCTTCTTGTGGCTCCCAACCTGGGGCAGCCCCCTGCCTCCCTTTAGATGGGCAATCGGCTTAGAAAGTGGAGGGGAAGCCAGTGTGGATCTACTCACAGAATGTTCTTTTGGTTTCCAGCCAGGATTGCTACAGTTGTGATTGGAGGAG 16 TTGTGGCCATGGCGGCTGTGCCCATGGTGCTCAGTGCCATGGGCTTCACTGCGGCGGGAATCGCCTCGTCCTCCATAGCAGCCAAGATGATGTCCGCGGCGGCCATTGCCAATGGGGGTGGAGTTGCCTCGGGCAGCCTTGTGGCTACTC
9 17 AGGAGGTGCTGGGCTGTCAGAGGAAGCTGGTCTGGGCCTGGGAGTCTGTGCCAACTGCAAATCTGACTTTACTTTTAATTGCCTATGAAAATAAGGTCTCTCATTTATTTTCCTCTCCCTGCTTTCTTTCAGACTGTGGCTTTACCTCGG 18 TGTCCTACCAGCAAGGGGTCCTGTCTGCCACCATCCTCTATGAGATCCTGCTAGGGAAGGCCACCCTGTATGCTGTGCTGGTCAGCGCCCTTGTGTTGATGGCCATGGTAAGCAGGAGGGCAGGATGGGGCCAGCAGGCTGGAGGTGACA
10 19 CGCCCTCTCTCTTTCACACGTCACTGGCGTGACCGTCCGCGCTACATACTGCGCCTGCGCAAGGGCTGTGGCCCTTTTCCCACCCCCTAGCGCCGCTGGGCCTGCAGGTCTCTGTCGAGCAGCGGACGCCGGTCTCTGTTCCGCAGGATG 20 GGGTTTGTTAAAGTTGTTAAGAATAAGGCCTACTTTAAGAGATACCAAGTGAAATTTAGAAGACGACGAGGTACTGTCACCTTTTTGTGTTTACAATATTAATCTGCTTTGCAGATGCAGTGGAGTATCCTTTCTACAATTATTTTTTTC
11 21 GTATTGCAGCTCGGGATGTGGCAGGTGGGCTGCGGTCACTGGCCCAGGCCGCTAGGGGAGTCGCTGCACTGACGTCAGATCCTGCAGTGCAGGCCATTGTACTTGATACGGCCAGTGATGTGCTGGACAAGGCCAGCAGCCTCATTGAGG 22 CTCACCTTCTCCTTTCTCAAGCCCAATTCTTCCCCCTTCATCCTTAGATGGAGAAGTGTACCCAGGACCTGGGCAACAGCACCAAAGCCGTGAGCTCAGCCATCGCCCAGCTACTGGGAGAGGTTGCCCAGGGCAATGAGAATTATGCAG
12 23 GTATCTGTGGGAGCTAATCCTGTCCAGGTGGAAGTAGGAGAATTTGATGATGGTGCAGAGGAAACCGAAGAGGAGGTGGTGGCGGAAAGTATGTCCCTTCCCTGTAACTTGGCACATCCAAGCTGCCCTTGGCTGCCTGGGCCTGGGGCA 24 GGAGGGACCACGGGGTGGAGGGGAGATAGACCCAGCCCAGAGCTCTGAGTGGTTTCCTGTTGCCTGTCTCTAAACCCCTCCACATTCCCGCGGTCCTTCAGACTGCCCGGAGAGCGCGCTCTGCCTGCCGCCTGCCTGCCTGCCACTGAG
13 25 GATTCCTGAGCTGAAATGCAGATGACCACATTCAAGGAAGAACTTTCTGCCCCGGCTTTGCAGGATGAAAAGCTTTCCTGCTTGGCAGTTATTCTTCCACAAGAGAGGGCTTTCTCAGGACCTGGTTGCTACTGGTTCGGCAACTGCAGA 26 CCCTGGTTGGTGTGGGTTGTGGTGTTAGAGAAATCTCAGGTGGGAGATCTGGGGCTGGGACATTGTGTTGGAGGACAGATTTGCTTCAATAACTTTTAAGTGTATATCTTTTCCTCTTTTTCCCAGGACACTCTGGACTTCAGCCAACAG
14 27 TTTGCTGCACAAGAAAAACAAATGGAAGTTTGTGAAGTATGTGGAGCCTTTTTAATAGTAGGAGATGCCCAGTCCCGGGTAGATGACCATTTGATGGGAAAACAACACATGGGCTATGCCAAAATTAAAGCTACTGTAGAAGAATTAAAA 28 GAAAAGTTAAGGAAAAGAACCGAAGAACCTGATCGTGATGAGCGTCTAAAAAAGGAGAAGCAAGAAAGAGAAGAAAGAGAAAAAGAACGGGAGAGAGAAAGGGAAGAAAGAGAAAGGAAAAGACGAAGGGAAGAGGAAGAAAGAGAAAAA
15 29 GCTCTCAGCCCACCCACCTGGAAGCGCCCATGTGTCACCTTACCCAGGAGAGGGCGGCAGAGGCTGCGAGCAGGACGGCAGCCCCCTCTCCCCACCCCCAGGACCCTGAGATCCTGCTTCACGGGCTGCAAGAAGTTGGGGGGCCAGGAT 30 CTGGCAGCGAGCAGACCCCTGCCGGACACTCAGCAAACGGCAGCCTCACCCCGCAGGGCCGCGCCACTCCCCTTCCCCACCCCACCGCCGCGTCCCGGCTCAGCGCTCCCCGGGGAACGCAGGGGGACCGGGCTCGCTGCGTGACCTTGG
16 31 TGAGGGTCTCGGCCACCTTCTGGCAGAACCCCCGCAACCACTTCCGCTGTCAAGTCCAGTTCTACGGGCTCTCGGAGAATGACGAGTGGACCCAGGATAGGGCCAAACCCGTCACCCAGATCGTCAGCGCCGAGGCCTGGGGTAGAGCAG 32 ACTGTGGCTTTACCTCGGGTAAGTAAGCCCTTCCTTTTCCTCTCCCTCTCTCATGGTTCTTGACCTAGAACCAAGGCATGAAGAACTCACAGACACTGGAGGGTGGAGGGTGGGAGAGACCAGAGCTACCTGTGCACAGGTACCCACCTG
17 33 GTGGAGTCCAACTTGCCTGGACCAGCTTAATGGTTCTGGTAAGTATTAATGAAAACAGTAGATAGACTTAATGAAAATGCTGATGGTGATATGCTTACTGCTGAGCTAATGGCTTAAGGCTTGGCTGATGAATACTGACTGTATTTTCCT 34 AGATGTACTATCTGTCTGATGTATCTGGGGTAGTTGTGGTTTGCTGTTAATGGTTAAGCAGTGTACCACCAATCTACCATTAAAATATTTTTTGCTGACAATTTTGTATTAAAATTACAGGCATTAGACAGAAAGCTGGAAGTTGAAATG
18 35 CCTGAAGCCACCCTCTTCACTCTTTTTCAGCCATAGTTCATACCGAGAAGGTGAACATGATGTCCCTCACAGTGCTTGGGCTACGAATGCTGTTTGCAAAGACTGTTGCCGTCAATTTTCTCTTGACTGCCAAGTTATTTTTCTTGTAAG 36 GCTGACTGGCATGAGGAAGCTACACTCCTGAAGAAACCAAAGGCTTACAAAAATGCATCTCCTTGGCTTCTGACTTCTTTGTGATTCAAGTTGACCTGTCATAGCCTTGTTAAAATGGCTGCTAGCCAAACCACTTTTTCTTCAAAGACA
19 37 TTCGTTGGCGGGTGCCTGGGCTGGTGGGAACAGCCGCCCGAAGGAAGCACCATGATTTCGGCCGCGCAGTTGTTGGATGAGTTAATGGGCCGGGACCGAAACCTAGCCCCGGACGAGAAGCGCAGCAACGTGCGGTGGGACCACGAGAGC 38 GTTTGTAAATATTATCTCTGTGGTTTTTGTCCTGCGGAATTGTTCACAAATACACGTTCTGATCTTGGTAAGTGAATTTTCTGTGTAACTTTTATCAAATTTATGATATTTAAAATGTTGAATAGGAGTGGTGAAAGGAAAAAAACTGAT
20 39 ATTACTGGTGGTCTACCCTTGGACCCAGAGGTTCTTTGAGTCCTTTGGGGATCTGTCCTCTCCTGATGCTGTTATGGGCAACCCTAAGGTGAAGGCTCATGGCAAGAAGGTGCTAGGTGCCTTTAGTGATGGCCTGGCTCACCTGGACAA 40 TGTTGCTTACACTTTCTTCTGACATAACAGTGTTCACTAGCAACCTCAAACAGACACCATGGTGCATCTGACTCCTGAGGAGAAGACTGCTGTCAATGCCCTGTGGGGCAAAGTGAACGTGGATGCAGTTGGTGGTGAGGCCCTGGGCAG
21 41 GCTCAGGAAGCATGTGGACCTTTGGAGATGGATTCTGCACTGAGTGTGGTACAGAATCTAGAGAAAGATCTACAGGAAGTGAAGGCAGCAGCTCGAGATGGCAAGCTTAAACCCTTACCTGGGGAGACAGTAAGTATGTTTAAGACCTCA 42 CCTATTCCCCAACAGCCAGGTGGGAAGATGGTGGCAGCTGCAAAGGCCTCAGTGCCAACGATTCAGGACCAGGCTTCAGCCATGCAGCTGAGTCAGTGTGCCAAGAACCTGGGCACCGCGCTGGCTGAACTCCGGACGGCTGCCCAGAAG
22 43 ACCTGTGCACAGGTACCCACCTGTCCTTCCTCCGTGCCAACAGTGTCCTACCAGCAAGGGGTCCTGTCTGCCACCATCCTCTATGAGATCCTGCTAGGGAAGGCCACCCTGTATGCTGTGCTGGTCAGCGCCCTTGTGTTGATGGCCATG 44 GTCAAGAGAAAGGATTTCTGAAGGCAGCCCTGGAAGTGGAGTTAGGAGCTTCTAACCCGTCATGGTTTCAATACACATTCTTCTTTTGCCAGCGCTTCTGAAGAGCTGCTCTCACCTCTCTGCATCCCAATAGATATCCCCCTATGTGCA
23 45 GCTCAAGGAAAAACATGGCCTGCTATTGCAGAATACCAGCGTGCATTGCAGGAGAACGTCGCTATGGAACCTGCATCTACCAGGGAAGACTCTGGGCATTCTGCTGCTGAGCTTGCAGAAAAAGAAAAATGAGCTCAAAATTTGCTTTGA 46 CCATTCTCCTGGTGGCCCTGCAGGCCCAGGCTGAGCCACTCCAGGCAAGAGCTGATGAGGTTGCTGCAGCCCCGGAGCAGATTGCAGCGGACATCCCAGAAGTGGTTGTTTCCCTTGCATGGGACGAAAGCTTGGCTCCAAAGCATCCAG
24 47 GCATTAGACAGAAAGCTGGAAGTTGAAATGGTAAGTGAAACTGTATCCAAGTAAGCAGGTAACTGGGCAAACTTCCTACGGCACAAATGGCTTTTTAGTTACCTCCTAGTGCTGAATGCATTAAATAAATGGCGGATTCTTGTCTTGTTA 48 CTAGAATGATGAGGATCTTAACCACCATTATCTTAACTGAGGCACCCAAAATGGTGAGTTGGGGAACATAGAGAGTACACCTAAGTTCACATGAAGTTGTTTCTTCCCAGGTCCTAAAGAGCAAGCCTAACTCAAGCCATTGGCACACAG
25 49 GCCCTGCATGGGGGGGCATGACCTCTGACCTGTCCCCTGCCTCCAGGTGCCATCCACTTAGAATTCCAGGCCAGTGGGAATCACTACGTGTGGAGGAAGAGCACCTCAACTGTTCACAACATCATCGTGGGCAAGCTCTGGATCGACCAG 50 TCAGGGGACATCGAGATTGTGAACCATAAGACCAATGACCGGTGCCAGCTGAAGTTCCTGCCCTACAGCTACTTCTCCAAAGAGGCAGCCCGGAAGGTAAGCAGGACCAGCCACCTCTAAGCACCCCAGGGGGCCCAGGGCAGAGTCTGC
26 51 GACCTCTGGGGGCCACGCTGAGGTAGGTGGGACCCACCCTGGTGGCAGGGGCCAGGGGTGATGGCACCCCCTCACGGCCCTTCTCTTTGCAGCACGAAGGCAAACCCTACTGCAACCACCCCTGCTACGCAGCCATGTTTGGGCCTAAAG 52 GCTTTGGGCGGGGCGGAGCCGAGAGCCACACTTTCAAGTAAACCAGGTAGGTAGGACCCCACCCCCTATCCTGCCTCCTGGTTCCACCCTCGGGATGGGGATGCCCCCTCCCAGGGAGGCCTGACCACTCGTGGGCCCCAAAGGAGGCCG
27 53 GAGCACGGTCTGAATCTGCACAGAGCAAGATGCTGAGTGGAGTCGGGGGCTTTGTGCTGGGCCTGCTCTTCCTTGGGGCCGGGCTGTTCATCTACTTCAGGAATCAGAAAGGTGAGGAGCCTTTGGGAGCTGGCTCTCTCCATAGGCTTT 54 AGGCTGGGATGGTGTCCACAGGCCTGATCCAGAATGGAGACTGGACCTTCCAGACCCTGGTGATGCTGGAAACAGTTCCTCGAAGTGGAGAGGTTTACACCTGCCAAGTGGAGCACCCAAGCGTGACAAGCCCTCTCACAGTGGAATGGA
28 55 AAGTGACAGTGATGACTTTGGTGATGTTCTCCCCAGTGCAGAGAACTGCATTCAGAATTAGACAACCTCAGTGACGAGTATCTCTCCTGCCTGCGTAAGCTGCAGCACTGTCGAGAAGAGCTGAACCAGAGCCAGCAGCTGCCTCCCAGA 56 AGGCAATGTGGGCGATGGCTCCCAGTGCTGATGGTGGTGATTGCTGCAGCACTGGCAGTGTTCCTGGCCAATAAAGACAACCTGATGATCTGAATAATTTGTGACAACTGCCTTGGGTGAAAATCAGAAGCAAGCAACTCAGCGAAAAAC
29 57 AGATGACATACAAAAAGGGCAGGACCTGAGAAAGATTAAGCTGCAGGCTCCCTGCCCATAAAACAGGGTGTGAAAGGCATCTCAGCGGCTGCCCCACCATGGCTACCTGGGCCCTCCTGCTCCTTGCAGCCATGCTCCTGGGCAACCCAG 58 GTCTGGTCTTCTCTCGTCTGAGCCCTGAGTACTACGACCTGGCAAGAGCCCACCTGCGTGATGAGGAGAAATCCTGCCCGTGCCTGGCCCAGGAGGGCCCCCAGGTACGTGTTGGCTCTCTGCTCACCTGCCACAGTCCCTCTCCTTTCC
30 59 GCATCTTGGTCCGATACTCTGAGAGAAGTCAATATCACCATCATAGACAGAAAAGTCTGCAATGATCGAAATCACTATAATTTTAACCCTGTGATTGGAATGAATATGGTTTGTGCTGGAAGCCTCCGAGGTGGAAGAGACTCGTGCAAT 60 GGAGATTCTGGAAGCCCTTTGTTGTGCGAGGGTGTTTTCCGAGGGGTCACTTCCTTTGGCCTTGAAAATAAATGCGGAGACCCTCGTGGGCCTGGTGTCTATATTCTTCTCTCAAAGAAACACCTCAACTGGATAATTATGACTATCAAG
31 61 CATTAATGGGCCCATAAATGTTGTGTTTAGGTGGAAGAAGAGCCCGAAGAAGAACCTGAAGAGACAGCAGAAGACACAACAGAAGACACAGAGCAAGACGAAGATGAAGAAATGGATGTGGGAACAGATGAAGAAGAAGAAACAGCAAAG 62 GAATCTACAGCTGAAAAAGATGAATTGTAAATTATACTCTCACCATTTGGATCCTGTGTGGAGAGGGAATGTGAAATTTACATCATTTCTTTTTGGGAGAGACTTGTTTTGGATGCCCCCTAATCCCCTTCTCCCCTGCACTGTAAAATG
32 63 TTATGTCACGCATCTGATGAAGCGAATTCAGAGAGGCCCAGTAAGAGGTATCTCCATCAAGCTGCAGGAGGAGGAGAGAGAAAGGAGAGACAATTATGTTCCTGAGGTAAACTTTCTGGATATTTGGGCTTCTGGCTAATCCTCAAATGA 64 CCGCGTTCGCACCAAAACCGTGAAGAAGGCGGCCCGGGTCATCATAGAAAAGTACTACACGCGCCTGGGCAACGACTTCCACACGAACAAGCGCGTGTGCGAGGAGATCGCCATTATCCCCAGCAAAAAGCTCCGCAACAAGATAGCAGG
33 65 GACATGCAAGCCCATAACCGCTGTGGCCTCTTGGTTTTACAGATACGAACCTAAACTTTCAAAACCTGTCAGTGATTGGGTTCCGAATCCTCCTCCTGAAAGTGGCCGGGTTTAATCTGCTCATGACGCTGCGGCTGTGGTCCAGCTGAG 66 ATCTGCAAGATTGTAAGACAGCCTGTGCTCCCTCGCTCCTTCCTCTGCATTGCCCCTCTTCTCCCTCTCCAAACAGAGGGAACTCTCCTACCCCCAAGGAGGTGAAAGCTGCTACCACCTCTGTGCCCCCCCGGCAATGCCACCAACTGG
34 67 CCCCTCCGAGATCGAGATGATGCTCAGTACAGCCACCTTGGAGGAAACTGGGCTCGGAACAAGTGAACCTGAGACTGGTGGCTTCTAGAAGCAGCCATTACCAACTGTACCTTCCCTTCTTGCTCAGCCAATAAATATATCCTCTTTCAC 68 AGAACTTGTGTGTTCATATCACTCATGCAGACTTCTGAGGGTGTGGGAGGGTGGATCTCACAGTCCCATCTGCTAGGCCATTGATGTCTCTCTCTGGTTCTTCTAGCTGCCGACACACAAGCTCTGTTGAGGAATGACCAGGTCTATCAG
35 69 TCCAGAATGGAAAATCCCAGAAATTCTCCCATTTGGATCCCACCTTCTCCATCCCACAAGCAAACCACAGTCACAGTGGTGATTACCACTGCACAGGAAACATAGGCTACACGCTGTTCTCATCCAAGCCTGTGACCATCACTGTCCAAG 70 TGCCCAGCATGGGCAGCTCTTCACCAATGGGGATCATTGTGGCTGTGGTCATTGCGACTGCTGTAGCAGCCATTGTTGCTGCTGTAGTGGCCTTGATCTACTGCAGGAAAAAGCGGATTTCAGGTTTGTAGCTCCTCCCAGTCCCTTTTG
36 71 GGCAAGATTCTTGCCAAGAGAATTAATGTGCGTATTGAGCACATTAAGCACTCTAAGAGCCGAGATAGCTTCCTGAAACGTGTGAAGGAAAATGATCAGAAAAAGAAAGAAGCCAAAGAGAAAGGTACCTGGGTTCAACTAAAGCGCCAG 72 CCTGCTCCACCCAGAGAAGCACACTTTGTGAGAACCAATGGGAAGGAGCCTGAGCTGCTGGAACCTATTCCCTATGAATTCATGGCATAATAGGTGTTAAAAAAAAAAATAAAGGACCTCTGGGCTACAAAAATGTTTCTCTTCATTGAG
37 73 TTTAGATAGCATTAAGAATCTATATGTAAAAGTATGCTTTTTATTTCTTAGCCTCTTCTGGAAAACAAACTTAAAGCATTCAGTATTGGAAAAATGAGTACAGCTAAGCGAACTTTAAGTAAAAAGGAACAGGAAGAATTAAAGAAAAAG 74 GAGGATGAAAAGGCAGCTGCTGAGATTTATGAGGAGTTTCTTGCTGCTTTTGAAGGAAGTGATGGTAATAAAGTGAAAACATTTGTGCGAGGGGGTGTTGTTAATGCAGCTAAAGGTAAGTTTATAAAGTATAACTGCTAATAAAGCATA
38 75 TTTTGTGTGTGTGGCTCCACCCAGCCTGAGCTTCCTGACTGAGAGGTTTTGGTGGCGGTACAGACACTTTTAACTCACAGTAAAAGCAAAAGCAACAGCTCAAGCAGCCTCCTTGGAGAAAACCTGAAAATTCAACTTGTTCAAGAGAAG 76 GTCTTGTACGTGCCTAAGTTCTAGAGCCTCCTGACGTGAGCATGGCTGAGAGTGAGGACCGCTCCCTGAGGATCGTTCTGGTAGGGAAAACTGGAAGTGGGAAAAGTGCAACAGCGAACACCATCCTTGGAGAGGAAATCTTTGATTCTA
39 77 GTGCCCTGAGCCTGGGTGCTCACTGTGGCGGTCCCCGTCCTGGCTATGAAACCTTGTGAGCAGAAGGCAAGAGCGGCAAGATGAGTTTTGAGCGTTGTATTCCAAAGGCCTCATCTGGAGCCTCGGGAAAGTCTGGTCCCACATCTGCCC 78 TGTCCTTGTCCCCAGCCATCTCCATGGTGGTGGCCATGGCGGTGTACACCAGCGAGCGGTGGGACCAGCCTCCACACCCCCAGATCCAGACCTTCTTCTCCTGGTCCTTCTACCTGGGCTGGGTCTCAGCTATCCTCTTGCTCTGTACAG
40 79 ACTAACAATAATTGAAATGCAGAAGGGAGACTGTGCACTCTATGCCTCGAGCTTTAAAGGCTATATAGAAAACTGTTCAACTCCAAATACGTACATCTGCATGCAAAGGACTGTGTAAAGATGATCAACCATCTCAATAAAAGCCAGGAA 80 TTATCAACACTGATTTTACTTATAGTTTATTTGTGGTTTCAAACAGGATTTACTTAAACTGGTGAAGTCATATCATTGGATGGGACTAGTACACATTCCAACAAATGGATCTTGGCAGTGGGAAGATGGCTCCATTCTCTCACCCAACCT
41 81 GTACAAGAACTCGGATAATGATAAAGTCCAGAAGTGCAGCCACTATCTATTCTCTGAAGAAATCACTTCTGGCTGTCAGTTGCAAAAAAAGGAGATCCACCTCTACCAAACATTTGTTGTTCAGCTCCAGGACCCACGGGAACCCAGGAG 82 CTTCCTGACCACTATGCCCACTGACTCCCTCAGTGTTTCCACTCTGCCCCTCCCAGAGGTTCAGTGTTTTGTGTTCAATGTCGAGTACATGAATTGCACTTGGAACAGCAGCTCTGAGCCCCAGCCTACCAACCTCACTCTGCATTATTG
42 83 CTTAGAAATTAGAGGTGATGCTAAAGAAAACAGCTGTATTTCCATCTCACAGACATCTGTGTATTCTGAGTACTGTAGTACAGAAATCAGATGGATCTGCCAAAAAGAACTAACACCTGTGAGAAATAAAGTGTATCCTGACTCTTGACT 84 AAGCAGATTCAATATTTTTCTGTTCCATTTATAGATACACACACAGAACCTGATACGTGACAAAGCAATTCTGTTTTGGATTGGATTAAATTTTTCATTATCAGAAAAGAACTGGAAGTGGATAAACGGCTCTTTTTTAAATTCTAATGA
43 85 TGACGTTAGGTACAGATTGAGGGCATCTGTAACAGCTGAAATGTTCCCAAACAGGTAAAGCTCCAGATGGCTCTGGAACTTATGAGGAAAGAGTTGGAGGACGCCTTGACTCAGGAGGCCAACGTGGGGAAAAAGACTGTCATTTGGAAG 86 GAGAAAGTGGAAATGCAGAGGCAGCGCTTCAGATTGGAGTTTGAGAAGCATCGTGGCTTTCTGGCCCAGGAGGAGCAACGGCAGCTGAGGCGGCTGGAGGCGGAGGAGCGAGCGACGCTGCAGAGACTGCGGGAGAGCAAGAGCCGGCTG
44 87 ATGGAGAAGTGTACCCAGGACCTGGGCAACAGCACCAAAGCCGTGAGCTCAGCCATCGCCCAGCTACTGGGAGAGGTTGCCCAGGGCAATGAGAATTATGCAGGTATGTGGGCAGAGAGCCAGGCATGGGGCATATTGTGAGGGAGGTAG 88 AAAACCCCTTTCTTATCATAGGCTCAGGAAGCATGTGGACCTTTGGAGATGGATTCTGCACTGAGTGTGGTACAGAATCTAGAGAAAGATCTACAGGAAGTGAAGGCAGCAGCTCGAGATGGCAAGCTTAAACCCTTACCTGGGGAGACA
45 89 GTCTCCTGGCCCAGGCTCCAGTTGCGGATATTTTCTCGAGTTACCGCCCAGGCATCCTTTTGTGGCACGTGTCCTCCCAGAGCCTCTCCTTTGACTCCAGCAACCCAGAGTACTTCGACGGCTACTGGGGTAACACCGCCATTCCAGACT 90 AGCGGGCTTCAGCTCCGTGGTCACTCAGGCGAGTAGGGAGCAAAAGCGCAGTGGGGGCGGCTCCCAAACAGGGCCCCCTCTCACCCTCAGGACTTCCCTTCCAGGCCGGAGAGCTGGTGCTTGGGGCTCCTGGCGGCTATTATTTCTTAG
46 91 CCATCTCCATGGTGGTGGCCATGGCGGTGTACACCAGCGAGCGGTGGGACCAGCCTCCACACCCCCAGATCCAGACCTTCTTCTCCTGGTCCTTCTACCTGGGCTGGGTCTCAGCTATCCTCTTGCTCTGTACAGGTGACTATCCTGCCC 92 CAGGCTACATCCACGTGACGCAGACCTTCAGCATTATGGCTGTTCTGTGGGCCCTGGTGTCCGTGAGCTTCCTGGTCCTGTCCTGCTTCCCCTCACTGTTCCCCCCAGGCCACGGCCCGCTTGTCTCAACCACCGCAGCCTTTGCTGCAG
47 93 GTTTTACTTTTCCTGAAGATGGATGCATCTGGACCCTCAGATAGTGATATGCCAAGTCGGACACGACCTAAGAGCCCAAGAAAACATAATTATAGGAATGAAAGTGCCCGTGAAAGCCTTTGTGATTCTCCTCATCAGAATCTCTCAAGA 94 CCTCTTCTGGAAAACAAACTTAAAGCATTCAGTATTGGAAAAATGAGTACAGCTAAGCGAACTTTAAGTAAAAAGGAACAGGAAGAATTAAAGAAAAAGGTAATGTTGAAAATGTATTTTGAATTATCCTTGGAAATGAATGTGTCTAAG
48 95 TCCAACCTAAGGTGACTGTATATCCTTCAAAGACCCAGCCCCTGCAGCACCACAACCTCCTGGTCTGCTCTGTGAGTGGTTTCTATCCAGGCAGCATTGAAGTCAGGTGGTTCCTGAACGGCCAGGAAGAGAAGGCTGGGATGGTGTCCA 96 GGGAGTTCCGGGCGGTGACGGAGCTGGGGCGGCCTGACGCTGAGTACTGGAACAGCCAGAAGGACATCCTGGAGCAGGCGCGGGCCGCGGTGGACACCTACTGCAGACACAACTACGGGGTTGTGGAGAGCTTCACAGTGCAGCGGCGAG
49 97 GCAGTGGCAGAGCAGATTCCACTGCTGGTGCAGGGCGTCCGAGGAAGCCAAGCCCAGCCTGACAGCCCCAGCGCTCAGCTTGCCCTCATTGCTGCCAGCCAGAGCTTCCTGCAGGCAAGGCACCCCCTCTGCACTTCTCTGACCTGACCT 98 ATGGGCTTGGTCTGACTACTCTTGTCTTCACAGCATGCAGCCAAGCAGGCTGCAGCCTCAGCCACACAGACCATCGCTGCAGCTCAGCACGCAGCCTCTACCCCCAAGGCCTCTGCCGGCCCCCAGCCCCTGCTGGTGCAGAGCTGCAAG
50 99 AAAGTCTCCTCCAGTTTTAAAAGCCTACAATCCTGTGAGCCTCTTCATTCCCAATGTAACCCTGACCACTGCTGTTTGTTCCAGATCACGTAAAACCAAAGGAAACTGAAAACACAAAGCAACCTTCAAAGAGCTGCCATAAACCCAAAG 100 CCATAGTTCATACCGAGAAGGTGAACATGATGTCCCTCACAGTGCTTGGGCTACGAATGCTGTTTGCAAAGACTGTTGCCGTCAATTTTCTCTTGACTGCCAAGTTATTTTTCTTGTAAGGTAAGAATTAGCCGCTTCTTATTCCTATCT
51 101 AGGGGGAGGTGAGCGCCGACGAGGAGGGCTTTGAGAACCTGTGGGCCACCGCCTCCACCTTCATCGTCCTCTTCCTCCTGAGCCTCTTCTACAGTACCACCGTCACCTTGTTCAAGGTAGCACGGCTGTGGCACAGGGAGGAGGGTGCAG 102 CTGAGCCCCAGGCCCCAGGCCGGTACTTCGCCCACAGCATCCTGACCGTGTCCGAAGAGGAATGGAACACGGGGGAGACCTACACCTGCGTGGTGGCCCATGAGGCCCTGCCCAACAGGGTCACCGAGAGGACCGTGGACAAGTCCACCG
52 103 GTATTTGAAATATCTCACCAAAAAATATTTGAAGAAGAATAATCTACGTGACTGGTTGCGCGTAGTTGCTAACAGCAAAGAGAGTTACGAATTACGTTACTTCCAGATTAACCAGGACGAAGAAGAGGAGGAAGACGAGGATTAAATTTC 104 TTGGTCAATTTAATGATTTCTACAGGAGCAGTTTTTGCAAGAAAGGATCAAAGTGAACGGAAAAGCTGGGAACCTTGGTGGAGGGGTGGTGACCATCGAAAGGAGCAAGAGCAAGATCACCGTGACATCCGAGGTGCCTTTCTCCAAAAG
53 105 AATATGTCGTCGGTGCCCCCACTTGGAGCTGGACCCTGGGAGCGGTAAGTGCCCCCACCACTGGGCCTCCCGAAGCCCCTTATCCCAGTTCTCAGGCTGACAACTCCTGAGCGCCCCCCACCCCCGCCCCGCCTCCACCAAACCACCCTT 106 TGCAGGGCTGGGGCTGAGTGGCCTTAATCTCCTCCTTCTTTGCCCTCCGTCCCCTCTGTGCTTCCTCCCCTGGAAAAGACTAATTTGCGCCCTTGTCCTCAGGGTACTCGGTGGCCGTGGGCGAGTTCGACGGGGATCTCAACACTACAG
54 107 GTGACCCCAGCCATGAGGACCCTCGCCATCCTTGCTGCCATTCTCCTGGTGGCCCTGCAGGCCCAGGCTGAGCCACTCCAGGCAAGAGCTGATGAGGTTGCTGCAGCCCCGGAGCAGATTGCAGCGGACATCCCAGAAGTGGTTGTTTCC 108 GAAAGTAACCCCGGAAATTAGGACACCTCATCCCAAAAGACCTTTAAATAGGGGAAGTCCACTTGTGCACGGCTGCTCCTTGCTATAGAAGACCTGGGACAGAGGACTGCTGTCTGCCCTCTCTGGTCACCCTGCCTAGCTAGAGGATCT
55 109 CGGCTGTGCCCATGGTGCTCAGTGCCATGGGCTTCACTGCGGCGGGAATCGCCTCGTCCTCCATAGCAGCCAAGATGATGTCCGCGGCGGCCATTGCCAATGGGGGTGGAGTTGCCTCGGGCAGCCTTGTGGCTACTCTGCAGTCACTGG 110 GAGCAACTGGACTCTCCGGATTGACCAAGTTCATCCTGGGCTCCATTGGGTCTGCCATTGCGGCTGTCATTGCGAGGTTCTACTAGCTCCCTGCCCCTCGCCCTGCAGAGAAGAGAACCATGCCAGGGGAGAAGGCACCCAGCCATCCTG
56 111 ATACACACACAGAACCTGATACGTGACAAAGCAATTCTGTTTTGGATTGGATTAAATTTTTCATTATCAGAAAAGAACTGGAAGTGGATAAACGGCTCTTTTTTAAATTCTAATGAGTGAGTATTAGATGAGCTAACTTTAATATTCAAT 112 CCGGGTCTCTTAAACTGCCCAATATATTGGCAGCAACTCCGAGAGAAATGCTTGTTATTTTCTCACACTGTCAACCCTTGGAATAACAGTCTAGCTGATTGTTCCACCAAAGAATCCAGCCTGCTGCTTATTCGAGATAAGGATGAATTG
57 113 CCCGGGGCGCGGCGATGCGCGCGGCACGGCGAGGACCTGAGCCGCTTCTGCGAGGAGGACGAGGCGGCGCTGTGCTGGGTGTGCGACGCCGGCCCCGAGCACAGGACGCACCGCACGGCGCCGCTGCAGGAGGCCGCCGGCAGCTACCAG 114 GTAAAGCTCCAGATGGCTCTGGAACTTATGAGGAAAGAGTTGGAGGACGCCTTGACTCAGGAGGCCAACGTGGGGAAAAAGACTGTCATTTGGAAGGTAAGACCATGTTGGGGCTTTAGGAGGCTTGCCTGTTTGAAGGATCCAGATTCG
58 115 GCTCAAGGAAAAACATGGCCTGCTATTGCAGAATACCAGCGTGCATTGCAGGAGAACGTCGCTATGGAACCTGCATCTACCAGGGAAGACTCTGGGCATTCTGCTGCTGAGCTTGCAGAAAAAGAAAAATGAGCTCAAAATTTGCTTTGA 116 CCATTCTCCTGGTGGCCCTGCAGGCCCAGGCTGAGCCACTCCAGGCAAGAGCTGATGAGGTTGCTGCAGCCCCGGAGCAGATTGCAGCGGACATCCCAGAAGTGGTTGTTTCCCTTGCATGGGACGAAAGCTTGGCTCCAAAGCATCCAG
59 117 TTCCTCCCCAGGAGACTTGGAAGATGCAGAACTGGATGACTACTCATTCTCATGCTATAGCCAGTTGGAAGTGAATGGATCGCAGCACTCACTGACCTGTGCTTTTGAGGACCCAGATGTCAACATCACCAATCTGGAATTTGAAATATG 118 TGGGGCCCTCGTGGAGGTAAAGTGCCTGAATTTCAGGAAACTACAAGAGATATATTTCATCGAGACAAAGAAATTCTTACTGATTGGAAAGAGCAATATATGTGTGAAGGTTGGAGAAAAGAGTCTAACCTGCAAAAAAATAGACCTAAC
60 119 TCGTGGAGGTAAAGTGCCTGAATTTCAGGAAACTACAAGAGATATATTTCATCGAGACAAAGAAATTCTTACTGATTGGAAAGAGCAATATATGTGTGAAGGTTGGAGAAAAGAGTCTAACCTGCAAAAAAATAGACCTAACCACTATAG 120 TTAAACCTGAGGCTCCTTTTGACCTGAGTGTCGTCTATCGGGAAGGAGCCAATGACTTTGTGGTGACATTTAATACATCACACTTGCAAAAGAAGTATGTAAAAGTTTTAATGCACGATGTAGCTTACCGCCAGGAAAAGGATGAAAACA
61 121 ATTTCTTCCTGACCACTATGCCCACTGACTCCCTCAGTGTTTCCACTCTGCCCCTCCCAGAGGTTCAGTGTTTTGTGTTCAATGTCGAGTACATGAATTGCACTTGGAACAGCAGCTCTGAGCCCCAGCCTACCAACCTCACTCTGCATT 122 GACAGACTACACCCAGGGAATGAAGAGCAAGCGCCATGTTGAAGCCATCATTACCATTCACATCCCTCTTATTCCTGCAGCTGCCCCTGCTGGGAGTGGGGCTGAACACGACAATTCTGACGCCCAATGGGAATGAAGACACCACAGCTG
62 123 GGTGCTCTGGGAGGTGCCTTCCCGCCGCCCCCTCCCCCGATCGAGGAATCATTTCCCCCTGCGCCTCTGGAGGAGGAGATCTTCCCTTCCCCGCCGCCTCCTCCGGAGGAGGAGGGAGGGCCTGAGGCCCCCATACCGCCCCCACCACAG 124 CCCAGGGAGAAGGTGAGCAGTATTGATTTGGAGATCGACTCTCTGTCCTCACTGCTGGATGACATGACCAAGAATGATCCTTTCAAAGCCCGGGTAAGGGACCGGAGAGTAGGAAAAGCAGGGCTCAGGGCCAGAGAGACTGGGCATAGA
63 125 AAGGGGGAAATTATTTTTCCTGAATCTGCTGTGATCCAAGAAATCGTTGTTTCTTTCAGAGCATCCCGCGGGTGTTCAGCAAGTTTCCTATAAAGGAAGCTCGAAAGCCCTTTAACCAGAATAAAAACCGTTATGTTGACATTCTTCCTT 126 ATGATTATAACCGTGTTGAACTCTCTGAGATAAACGGAGATGCAGGGTCAAACTACATAAATGCCAGCTATATTGATGTGAGTAAAAATTTGCATTTTTCTTATACCTACATATTTCATTCAGCTCCTTGTTTGTCTTGGTAAAATTTTA
64 127 CGCCGGGCTCTGGCGGCCTGACCGGGCCTGGGGTCCGAGCGTGCCCCCGGGCCTGGGGGGGTCGCCGCGATGGACTCGCTGGCAGCGCCCCAGGACCGCCTGGTGGAGCAGCTGCTGTCGCCGCGGACCCAGGCCCAGAGGCGGCTCAAG 128 GACATTGACAAGCAGTACGTGGGCTTCGCCACACTGCCCAACCAGGTGCACCGCAAGTCGGTGAAGAAAGGCTTTGACTTCACACTCATGGTGGCTGGTGAGTGGGCCAGGCTCCTCGGGGGAGTGGCTGGGGTCACTGGCCAGCCAAGC
65 129 GGAGCAGCTGCCCACCCTGACAGTGAGGAGCAGCAGCAGCGGCTGCGGGAGGCAGCTGAGGGGCTGCGCATGGCCACCAATGCAGCTGCGCAGAATGCCATCAAGAAAAAGCTGGTGCAGCGCCTGGAGGTGAGGCTGGGAGTTTCACCA 130 GCCCGCATCCTGGCCCAAGCCACATCTGACCTGGTCAATGCCATCAAGGCTGATGCTGAGGGGGAAAGTGATCTGGAGAACTCCCGCAAGCTCTTAAGTGCTGCCAAGATCCTAGCTGATGCCACAGCCAAGATGGTAGAGGCTGCCAAG
66 131 TATGCCACCACGGGCTGTTCCCTGACCCTGCACCATACGGAGAAACCAGAACATGAAGACATATGTGAATACCGTCCCTACTCCTGCCCATGTCCTGGTGCTTCCTGCAAGTGGCAGGGGTCCCTGGAAGCTGTGATGTCCCATCTCATG 132 CCTATTCTGCAGTGCCAGGCCGGGCACCTGGTGTGTAACCAATGCCGCCAGAAGTTGAGCTGCTGCCCGACGTGCAGGGGCGCCCTGACGCCCAGCATCAGGAACCTGGCTATGGAGAAGGTGGCCTCGGCAGTCCTGTTTCCCTGTAAG
67 133 AATTCTGTAGCAAAGCCAATACAAAAATCAGCTAAAGCTGCCACAGAAGAGGCATCTTCAAGATCACCAAAAATAGATCAGAAAAAAAGTCCATATGGACTGTGGATACCTATCTAAAAGAAGAAAACTGATGGCTAAGTTTGCATGAAA 134 TTTAATATAGGATTTAGAAACCAAGGGTATGTGTTTTAAAATTACACTTTTTCTTAACCTGTCTAGCTGTCGGAAAAGGTAACAGAAGATGGAACTCGAAATCCCAATGAAAAACCTACCCAGCAAAGAAGCATAGCTTTTAGCTCTAAT
68 135 CCGTTCCCAGAGGGCGCCGCTCTGCAAATTACCCAATCAGCTCTAAGTACAAAGCATCGCGAGTCTTTAGTGCTCTTTGGCGCTATAAGCCCGTGGGAACGAGCATTGGAGACCCTTTTCACAAGATGGCGCCGAAAGCGAAGAAGGAAG 136 CTCCTGCCCCTCCTAAAGCTGAAGCCAAAGCGAAGGCTTTAAAGGCCAAGAAGGCAGTGTTGAAAGGTGTCCACAGCCACAAAAAGAAGAAGATCCGCACGTCACCCACCTTCCGGCGGCCGAAGACACTGCGACTCCGGAGACAGCCCA
69 137 GGTACTCGGTGGCCGTGGGCGAGTTCGACGGGGATCTCAACACTACAGGCAAGAAATCCACTTAGGGCGGGAGTTGGGTAGCCCAGCCCGGGGAGGAGCGCCTTCCTGAAATCTCCCCTATGTAGGGAAATCTTCCTGCACACACATTTT 138 CCGCTGTCCCTCCCGCCCTAGGTCTCCTGGCCCAGGCTCCAGTTGCGGATATTTTCTCGAGTTACCGCCCAGGCATCCTTTTGTGGCACGTGTCCTCCCAGAGCCTCTCCTTTGACTCCAGCAACCCAGAGTACTTCGACGGCTACTGGG
70 139 GATAAAGTGAATCCTTTTTCTTTTTAAAAAGAAAAATAACTCTTTTTTTTTGGCAAGAAAAGGTTGCTAATAATCACAGATAATTTATACAATTATATTTTTTCCCCCAGGTCCGTGTGAAAAAATTCATGATGAAAATCTACGAAAACA 140 GTATGAGAAGAGCTCTCGTTTCATGAAAGTTGGCTATGAGAGAGATTTTTTGCGATACTTACAGAGCTTACTTGCAGAAGTAGAACGTAGGATCAGACGAGGCCATGCTCGTTTGGCATTATCTCAAAACCAGCAGTCTTCTGGGGTAAG
71 141 GCTGCTTTTTTAGATCAGGCTTTGCCCGTGTGGAGTCCAAAGTCCTTCCCTAACGAAGTGGAGCCTGAGGGTACAGGGAAGGAGAAAGACTGGGATCTCAGAGACCAGCTGCAAAAGAAGACTTTGCAGCTCCAGGCCAAGGAAAAGGAG 142 TGCAGAGAACTGCATTCAGAATTAGACAACCTCAGTGACGAGTATCTCTCCTGCCTGCGTAAGCTGCAGCACTGTCGAGAAGAGCTGAACCAGAGCCAGCAGCTGCCTCCCAGAGTAAGAGGGTCTCTCCTTCCCATAAAGCCCTGGATG
72 143 GCTCTGGCTGGGGACCAGCCCTCGGTGCAGCCCCCTCTACGGTCTCAGCAGCTGGCCCCACAGTACACCTACGCCCAGGGCGGCCAGCAGACTTGGGTACGGCCTGGCCAGCTAGGGACACTGGGGCTAGCCAGCTGGGTGTTCTGTGAG 144 ACGCCTGATGGCTCAGAGGTGGATGTGGACGTGGTGGAGAATGAGGACGGCACTTTCGACATCTTCTACACGGCCCCCCAGCCGGGCAAATACGTCATCTGTGTGCGCTTTGGTGGCGAGCACGTGCCCAACAGCCCCTTCCAAGTGACG
73 145 GGTCCAGTAGGCGTCAATGTCACTTATGGAGGGGATCCCATCCCTAAGAGCCCTTTCTCAGTGGCAGTATCTCCAAGCCTGGACCTCAGCAAGATCAAGGTGTCTGGCCTGGGAGAGAGTAAGTAGTTGGGGCCCTTGTCGCAAAGGCCT 146 ACCCACTTCACAGTAAATGCCAAAGCTGCTGGCAAAGGCAAGCTGGACGTCCAGTTCTCAGGACTCACCAAGGGGGATGCAGTGCGAGATGTGGACATCATCGACCACCATGACAACACCTACACAGTCAAGTACACGCCTGTCCAGCAG
74 147 GCTGCGTCAGGTGGCTGGCCGGCGCGGCGCTCCCCTGCTCTCTGGCTCCGGGCTGCGGCGCGGCGGCTGGAGCGAGCCCCTGTCCCGGCGCGGGGCGGCGGCGGGCGGCCGGCAGGCGCTGCCTTGCGTGTGAGTGCACCTCACTCACAT 148 GTGCTGGAGAATCTGGTAAAAGCACCATTGTGAAGCAGATGAGGATCCTGCATGTTAATGGGTTTAATGGAGAGTAAGTGTCAAATCTGTGCAGGGGGGCACCAAGTAAGAGGAACAGACTTTATACTAACCTTTAGGAAGTATAGGTGG
75 149 TCTTTATTTCAGGTAATATGATATTTGATAATAAAGAAATTAAATTAGAAAACCTTGAACCCGAACATGAGTATAAGTGTGACTCAGAAATACTCTATAATAACCACAAGTTTACTAACGCAAGTAAAATTATTAAAACAGATTTTGGGA 150 GTCCAGGAGAGCCTCAGATTATTTTTTGTAGAAGTGAAGCTGCACATCAAGGAGTAATTACCTGGAATCCCCCTCAAAGATCATTTCATAATTTTACCCTCTGTTATATAAAAGAGACAGGTAATTTGTGTAGAATTTAATTTCATCAGA
76 151 GTGACCCCAGCCATGAGGACCCTCGCCATCCTTGCTGCCATTCTCCTGGTGGCCCTGCAGGCCCAGGCTGAGCCACTCCAGGCAAGAGCTGATGAGGTTGCTGCAGCCCCGGAGCAGATTGCAGCGGACATCCCAGAAGTGGTTGTTTCC 152 GAAAGTAACCCCGGAAATTAGGACACCTCATCCCAAAAGACCTTTAAATAGGGGAAGTCCACTTGTGCACGGCTGCTCCTTGCTATAGAAGACCTGGGACAGAGGACTGCTGTCTGCCCTCTCTGGTCACCCTGCCTAGCTAGAGGATCT
77 153 CCTACCCCCACTGCATGGCTACTGAATGCTCACCACAATCTATTCTTGCTTTCCAGGGGAGATGGATCCTATCTTACTAACCATCAGCATTTTGAGTTTTTTCTCTGTCGCTCTGTTGGTCATCTTGGCCTGTGTGTTATGGAAAAAAAG 154 GATTAAGCCTATCGTATGGCCCAGTCTCCCCGATCATAAGAAGACTCTGGAACATCTTTGTAAGAAACCAAGAAAAGTGAGTGTTTTTGGTGCTTAAAAAGTGTTGTGTTGGCAACATCCCAGTGGCCAAGAATGATATTCCAGGACAAG
78 155 TTTGAATATGTTTGCAAAATATACGATGTACTCGCAACTAATCTATTGTTTTCTTCTTCGTAGATCCATTACAAGATTTTGGCTTTTCTGTTGAAAAGTGTTCCAAGCAATTAAAATCAAATATCAACATTAGATTTGGAATTATTCTGA 156 GAGAGGACATCAAAGAGCTTTTTCTTGACCTAGCTCTCATGTCTCAAGGCTCATCTGTTTTGAATTTCTCCTATCCCATCTGTGAGGCGGCTCTGCCCAAGTTTTCTTTCTGTGGAAGAAGGAAAGGAGGTAAGCCATCTGTCTTGCTCA
79 157 CTTCCTCCTAGCACTGGGACATTTCAAGAAGCTCAGAGCCGGTTGAATGAAGCTGCTGCTGGGCTGAATCAGGCAGCCACAGAACTGGTGCAGGCCTCTCGGGGAACCCCTCAGGACCTGGCTCGAGCCTCAGGCCGATTTGGACAGGAC 158 TGGGCAACCCTGTCTCCTTTCTCACCCCAGGTGGCTAAAGCAGTGACCCAGGCTCTGAACCGCTGTGTCAGCTGCCTACCTGGCCAGCGCGATGTGGATAATGCCCTGAGGGCAGTTGGAGATGCCAGCAAGCGACTCCTGAGTGACTCG
80 159 GAGCTGGCACGGGCGAGGTCGAGGTTGTGATCCAGGACCCCATGGGACAGAAGGGCACGGTAGAGCCTCAGCTGGAGGCCCGGGGCGACAGCACATACCGCTGCAGCTACCAGCCCACCATGGAGGGCGTCCACACCGTGCACGTCACGT 160 TTGCTGGCCAGCACATCGCCAAGAGCCCCTTCGAGGTGTACGTGGATAAGTCACAGGGTGACGCCAGCAAAGTGACAGCCCAAGGTCCCGGCCTGGAGCCCAGTGGCAACATCGCCAACAAGACCACCTACTTTGAGATCTTTACGGCAG
81 161 GTGTCGAGCTTGGCAAGCCCACCCACTTCACAGTAAATGCCAAAGCTGCTGGCAAAGGCAAGCTGGACGTCCAGTTCTCAGGACTCACCAAGGGGGATGCAGTGCGAGATGTGGACATCATCGACCACCATGACAACACCTACACAGTCA 162 GATGTCATTGCGGATGACGTCTGCCCTCCTCTAAGGCCTTCTCCTCCCACTGCCTGCAGGCCACGCCCACCAGCCCCATCCGAGTCAAGGTGGAGCCCTCTCATGACGCCAGTAAGGTGAAGGCCGAGGGCCCTGGCCTCAGTCGCACTG
82 163 CAGTTGGAGGAGAAAGGTCTGGGGGCCTCCCCCTGGGGCAACTTGGGCCAGCAACTCTTGCTTCTGCCCACAGGGAGTCTAGTGGATTTTCTCAAGACCCCTTCAGGCATCAAGTTGACCATCAACAAACTCCTGGACATGGCAGCCCAA 164 ATTGCAGAAGGCATGGCATTCATTGAAGAGCGGAATTATATTCATCGTGACCTTCGGGCTGCCAACATTCTGGTGTCTGACACCCTGAGCTGCAAGATTGCAGACTTTGGCCTAGCACGCCTCATTGAGGACAACGAGTACACAGCCAGG
83 165 ACATTGCAGTGGCTGCCCCCTACGGGGGTCCCAGTGGCCGGGGCCAAGTGCTGGTGTTCCTGGGTCAGAGTGAGGGGCTGAGGTCACGTCCCTCCCAGGTCCTGGACAGCCCCTTCCCCACAGGCTCTGCCTTTGGCTTCTCCCTTCGAG 166 CCGAAGTGGGGCGTGTGTATTTGTTCCTGCAGCCGCGAGGCCCCCACGCGCTGGGTGCCCCCAGCCTCCTGCTGACTGGCACACAGCTCTATGGGCGATTCGGCTCTGCCATCGCACCCCTGGGCGACCTCGACCGGGATGGCTACAATG
84 167 TGGGTAGGCGCCGCGTCCTGCAGCGTCTCACCGGGGCCTGTCTGTGCCTCTGCAGCCGAGAGGGTGACCTCTCTGGGCAAGGACTGGCATCGGCCCTGCCTGAAGTGCGAGAAATGTGGGAAGACGCTGACCTCTGGGGGCCACGCTGAG 168 CACGAAGGCAAACCCTACTGCAACCACCCCTGCTACGCAGCCATGTTTGGGCCTAAAGGTATGCTCCCGTCATCCCCACCCCACCCCACCCCACAGCCTCCTCCACCCCAGCCTGTTGACTTTTTCCACCTTCTCTGCAGGCTTTGGGCG
85 169 AGCGGCGGCGCCGGGGCAGCTCCGACGCCCTCCCGCGGGGAAGGAGCCCCCGCGGTGCCGCCGAGGCCCCGACGCGGGGCCGCCCCTCGGCTCGCCGCCCCGCGCCCGCGCCCGCTGGGAATGATGAAGAAGAACAATTCCGCCAAGCGG 170 GGACCTCAGGATGGAAACCAGCAGCCTGCACCGCCCGAGAAGGTCGGCTGGGTCCGGAAATTCTGCGGGAAAGGGATTTTCAGGGAGATTTGGAAAAACCGCTATGTGGTGCTGAAAGGGGACCAGCTCTACATCTCTGAGAAGGAGGTG
86 171 CCAGGTGGGAAGATGGTGGCAGCTGCAAAGGCCTCAGTGCCAACGATTCAGGACCAGGCTTCAGCCATGCAGCTGAGTCAGTGTGCCAAGAACCTGGGCACCGCGCTGGCTGAACTCCGGACGGCTGCCCAGAAGGTATGGAAGCTGGTT 172 AGACTTGTGGGTCTCTTATGACATTTTCACCTACAGGCAGTGGCAGAGCAGATTCCACTGCTGGTGCAGGGCGTCCGAGGAAGCCAAGCCCAGCCTGACAGCCCCAGCGCTCAGCTTGCCCTCATTGCTGCCAGCCAGAGCTTCCTGCAG
87 173 TTGGGAAAGGCCTAGAAGCATCTCTAGGACCATTGTTTCTTAGACCTATACTCATAGAATTGCCTCTCTTCTCAGCAAAACCTGGAAATCCACCGGAAGATAAAACAGTCTGAGCAGGAGCTAGCCTATCTGGAAAGGAGAGAACGAGAG 174 GGAAAGTTTAAAGGAAGAGGAAATGATCGCAGGGAAAAGCTCCAGTCTTTTGACTCTCCAGAAAGGAAACGGATTAAGTACTCCAGGGAAACTGACAGGTAAGCCAGGAACTCTTCATTCAGCCTAGGCCTCAAGCCTAATGATAAAACC
88 175 TTGAGCCTAAGGTGACTGTGTATCCTGCAAGGACCCAGACCCTGCAGCACCACAACCTCCTGGTCTGCTCTGTGAATGGTTTCTATCCAGGCAGCATTGAAGTCAGGTGGTTCCGGAACAGCCAGGAAGAGAAGGCTGGGGTGGTGTCCA 176 GGGAGTACCGGGCGGTGACGGAGCTGGGGCGGCCTGACGCTGAGTACTGGAACAGCCAGAAGGACTTCCTGGAAGACAGGCGCGCCGCGGTGGACACCTACTGCAGACACAACTACGGGGTTGGTGAGAGCTTCACAGTGCAGCGGCGAG
89 177 AGAGGCGGATTTGGTCGTGGACGTGGTCAGCCACCTCAGTAAAATTGGAGAGGATTCTTTTGCATTGAATAAACTTACAGCCAAAAAACCTTAATCTTTTGTCCATTTTGTTTGCATTGTGCAGCCTGAACAGGAACAGTTTAAGTGTCA 178 TTTTCCTGCAAGATTGGAGTCAGTGAGTTGTCTTCCCTTGTTCTATAGTAGATTAGATCATATGATGATTCTAAATCGATGTTTCACTTTCTAGCTGGTGCCGACAAGAAAGCCGAGGCTGGGGCTGGGTCAGCAACCGAATTCCAGTTT
90 179 CTCTCTTGTTCTGCAGTTCTGGCAATACGGCGAGTGGGTGGAGGTGGTGGTGGATGACAGGCTGCCCACCAAGGACGGGGAGCTGCTCTTTGTGCATTCAGCCGAAGGGAGCGAGTTCTGGAGCGCCCTGCTGGAGAAGGCATACGCCAA 180 GATCAACGGATGCTATGAAGCGCTATCAGGGGGTGCCACCACTGAGGGCTTCGAAGACTTCACCGGAGGCATTGCTGAGTGGTATGAGTTGAAGAAGCCCCCTCCCAACCTGTTCAAGATCATCCAGAAAGCTCTGCAAAAAGGCTCTCT
91 181 GTGACCCCAGCCATGAGGACCCTCGCCATCCTTGCTGCCATTCTCCTGGTGGCCCTGCAGGCCCAGGCTGAGCCACTCCAGGCAAGAGCTGATGAGGTTGCTGCAGCCCCGGAGCAGATTGCAGCGGACATCCCAGAAGTGGTTGTTTCC 182 GAAAGTAACCCCGGAAATTAGGACACCTCATCCCAAAAGACCTTTAAATAGGGGAAGTCCACTTGTGCACGGCTGCTCCTTGCTATAGAAGACCTGGGACAGAGGACTGCTGTCTGCCCTCTCTGGTCACCCTGCCTAGCTAGAGGATCT
92 183 CTGGGAGTGTCCACTCGCCTTCCACCAGCATGGCAACGTCTTCACAGTACCGCCAGCTGCTCAGTGACTACGGGCCACCGTCCCTAGGCTACACCCAGGTATGTCAATGGGGGTGATGGCATGGTGGGAGGGCCAGGGGGAGACATGCTT 184 CGCGGGGCTGCAGCGCTACCGCCCGGCCTCGCCGCCGCCGCCGCCGCCCTCGCGGCCTGGCCCCGCCGCGCCCGGCGCGCCCGCCGCCCGGGGGGATGTCTTACAAACCGAACTTGGCCGCGCACATGCCCGCCGCCGCCCTCAACGCCG
93 185 GAGGAGTTGGCCGAAGTCGAAGAAGGAGTTGGAGTAGTGGGCGAAGATAATGACGCAGCCGCGAGAGGAGCGGAGGCCTTTGGCGACAGTGAGGAGGACGGAGAGGATGTGTTCGAGGTGGAGAAGATCCTGGACATGAAGACCGAGGGG 186 GGTAAAGTTCTTTACAAAGTTCGCTGGAAAGGCTATACATCGGATGATGATACCTGGGAGCCCGAGATTCACCTGGAGGACTGTAAAGAAGTGCTTCTTGAATTTAGGAAGAAAATTGCAGAGAACAAAGCCAAAGCAGTCAGGAAGGAT
94 187 CTGCATCTCTGCCCACGTCGGAGAGGTGCGTCGGCTTCCGTACAACACGGATACTCTCTCTCTGACGCAACTTCCTGTCCTGCGCAATTCTATTTGACCTTTGAACTGGCAAAGGCTTTTTTCTTCCTCTTCCGGGGACGTTGTCTGCAG 188 GCACTCAGAATGGTCCAGCGTTTGACATACCGACGTAGGCTTTCCTACAATACAGCCTCTAACAAAACTAGGCTGTAAGTATTTCTGAAAATTTTAAGTATATATTGTCATTTACTCTACAAAATGCTGACCTACTGACTGTTTCACTTT
95 189 CCCCAATTCCCTCAGGTGGCAATCTCAGGTCTGCTCTTCTGCTTACCAACAGGGAAAGTTTAAAGGAAGAGGAAATGATCGCAGGGAAAAGCTCCAGTCTTTTGACTCTCCAGAAAGGAAACGGATTAAGTACTCCAGGGAAACTGACAG 190 TGATCGTAAACTTGTTGATAAAGAAGATATCGACACTAGCAGCAAAGGAGGCTGTGTCCAACAGGCTACTGGCTGGAGGAAAGGGACAGGCCTGGGATATGGCCATCCTGGATTGGCTTCATCAGAGGAGGTAAAATGGTTTCCATCTTT
96 191 ATGGCGTCGTATTTTGGGCATTCAGTGGCTGTCACTGACGTCAACGGGGATGGGTGAGGAGGGACATGCCCCACCCCTACCCAGTTGGGTCCCAAATTACCAGAGCTGCCCTCTGTCTCCCTTTCCTAGCCCTAGTCTCACGTATCCACT 192 CCCCCGCCCCGCCTCCACCAAACCACCCTTTCTCACCTGGAGTGGGAGGTTGCTTTGGGTACAAGAATGATGCTCTCGCCTGCGCTGTCCGTGCAGGTGGAAATTTTGGATTCCTACTACCAGAGGCTGCATCGGCTGCGCGGAGAGCAG
97 193 AGAATCCTTTCCTGTTTGCATTGGAAGCCGTGGTTATCTCTGTTGGCTCCATGGGATTGATTATCAGCCTTCTCTGTGTGTATTTCTGGCTGGAACGGTGAGATTTGGAGAAGCCCAGAAAAATGAGGGGAACGGTAGCTGACAATAGCA 194 ATTATAGACATAAGTTCTCCTTGCCTAGTGTGGATGGGCAGAAACGCTACACGTTTCGTGTTCGGAGCCGCTTTAACCCACTCTGTGGAAGTGCTCAGCATTGGAGTGAATGGAGCCACCCAATCCACTGGGGGAGCAATACTTCAAAAG
98 195 CTCCTGGTAACGTTTTTATCCATGGATGACTTGCTTGGGTAAGGACATGAAGACAGTTCCTGTCATACCTTTTAAAGGTACATGTTTTATTGATGTTAACGTTAATTGATTGAGCTACTGTTAGTGATGATTTTAAAATTAAAGCAGATG 196 CTGACTGAACATGAAGGTCTTAATTAGCTCTAACTGACTAAAGGCATTTGTTAGTTTTGGCAGGGGGTGAACACTCATCTGTGGCTATTCTAAGACCACTCTTATTTCTTAGGTGGAGTCCAACTTGCCTGGACCAGCTTAATGGTTCTG
99 197 GGTCTGGCTGAAGTTGAGGATCTCTTACTCTCTAGGCCACGGAATTAACCCGAGCAGGCATGGAGGCCTCTGCTCTCACCTCATCAGCAGTGACCAGTGTGGCCAAAGTGGTCAGGGTGGCCTCTGGCTCTGCCGTAGTTTTGCCCCTGG 198 CCAGGATTGCTACAGTTGTGATTGGAGGAGGTGAGTCTGTGGGGAAGGGGCTCAAGTAACCACCTGCCCCTAGGGAGGTGGACTTGGGGAGCAGCTGGCCTTGTCCATGCCAATGTTTCCCTCACATGGGTGGTCAGGGGAGGAGGTGGG
100 199 TGTGCCAGAGCTGTGTGGAGCTGGATCCAGCCACCGTGGCTGGCATCATTGTCACTGATGTCATTGCCACTCTGCTCCTTGCTTTGGGAGTCTTCTGCTTTGCTGGACATGAGACTGGAAGGCTGTCTGGGGGTTAGTGGAAGAGCAGAG 200 CATGGGTAGAGGGAACGGTGGGAACACTGCTCTCAGACATTACAAGACTGGACCTGGGAAAACGCATCCTGGACCCACGAGGAATATATAGGTGTAATGGGACAGATATATACAAGGACAAAGAATCTACCGTGCAAGTTCATTATCGAA
101 201 CAGCTGGCCGACGTTGCGGAGAAATGGTGCTCCAACACGCCCTTCGAGCTCATCGCCACCGAGGAGACCGAACGCAGGATGGATTTCTACGCCGACCCCGGCGTCTCCTTCTATGTGCTGTGTCCGGACAACGGCTGCGGCGACAATTTT 202 CACGTGTGGAGTGAGAGCGAGGACTGCCTGCCTTTCTTGCAGCTAGCACAGGATTACATCTCCTCCTGCGGCAAGAAGACGCTCCACGAAGTCCTGGAAAAAGTCTTCAAGTCTTTCAGACCTGTAGGTGCCTGCTTGGCTTCTCACCAC
102 203 ACGCCCCGCAGAAGAAGTTCGGCCCTGTGGTGGCCCCAAAGCCCAAAGTGAATCCCTTCCGGCCCGGGGACAGCGAGCCTCCCCCGGCACCCGGGGCCCAGCGCGCACAGATGGGCCGGGTGGGCGAGATTCCCCCGCCGCCCCCGGAAG 204 ACTTTCCCCTGCCTCCACCTCCCCTTGCTGGGGATGGCGACGATGCAGAGGGTGCTCTGGGAGGTGCCTTCCCGCCGCCCCCTCCCCCGATCGAGGAATCATTTCCCCCTGCGCCTCTGGAGGAGGAGATCTTCCCTTCCCCGCCGCCTC
103 205 GGGAGCTGGCACGGGCGGCCTGGGCCTGGCTGTAGAGGGCCCCTCCGAGGCCAAGATGTCCTGCATGGATAACAAGGACGGCAGCTGCTCGGTCGAGTACATCCCTTATGAGGCTGGCACCTACAGCCTCAACGTCACCTATGGTGGCCA 206 GGACGTGACCTATGACGGCAGTCCCGTGCCCAGCAGCCCCTTCCAGGTGCCCGTGACCGAGGGCTGCGACCCCTCCCGGGTGCGTGTCCACGGGCCAGGCATCCAAAGTGGCACCACCAACAAGCCCAACAAGTTCACTGTGGAGACCAG
104 207 GGTTTAACTGACGTTTTCTTTCTGCCCAGCCGAAAGGAAAGAAGGCCAAGGGAAAGAAGGTGGCTCCGGCCCCAGCTGTCGTGAAGAAGCAGGAGGCTAAGAAAGTGGTGAATCCCCTGTTTGAGAAAAGGCCTAAGAATTTTGGCATTG 208 GACAGGACATCCAGCCCAAAAGAGACCTCACCCGCTTTGTGAAATGGCCCCGCTATATCAGGTTGCAGCGGCAGAGAGCCATCCTCTATAAGCGGCTGAAAGTGCCTCCTGCGATTAACCAGTTCACCCAGGCCCTGGACCGCCAAACAG
105 209 GTATTTCTTAGAAAATGATGGGTTTAAATGAAATGGATCCTGTTGACAGTAAATTTTCTTATTCTGTTCTTTAGGAACCGGCGAATATTTGGCTTGTTGATGGGTACCCTTCAAAAATTTAAACAAGAATCCACTGTTGCTACTGAAAGG 210 CAAAAGCGGCGCCAGGAAATTGAACAAAAACTTGAAGTTCAGGCAGAAGAAGAGAGAAAGCAGGTTGAAAATGAAAGGAGAGAACTGTTTGAAGAGAGGCGTGCTAAACAGACAGAACTGCGGCTTTTGGAACAGAAAGTTGAGCTTGCG
106 211 GAACAATCAGTGGATTATAGACATAAGTTCTCCTTGCCTAGTGTGGATGGGCAGAAACGCTACACGTTTCGTGTTCGGAGCCGCTTTAACCCACTCTGTGGAAGTGCTCAGCATTGGAGTGAATGGAGCCACCCAATCCACTGGGGGAGC 212 ATATCTCCAGTGATCCCCTGGGCTCCAGAGAACCTAACACTTCACAAACTGAGTGAATCCCAGCTAGAACTGAACTGGAACAACAGATTCTTGAACCACTGTTTGGAGCACTTGGTGCAGTACCGGACTGACTGGGACCACAGCTGGACT
107 213 ATTTCTGTATCTTCTTGTCAGGGGTTGAAAAGTTTCAGTTACATGATTGTACACAAGTTGAAAAAGCAGATACTACTATTTGTTTAAAATGGAAAAATATTGAAACCTTTACTTGTGATACACAGAATATTACCTACAGATTTCAGTGTG 214 GTAATATGATATTTGATAATAAAGAAATTAAATTAGAAAACCTTGAACCCGAACATGAGTATAAGTGTGACTCAGAAATACTCTATAATAACCACAAGTTTACTAACGCAAGTAAAATTATTAAAACAGATTTTGGGAGTGAGTATGTTA
108 215 CTCCGGTGTCGGCGGGTGGCGCGGCGCCCCCGGAGGGGGCCATATCTAACGGGGTTTACGTACTGCCGAGCGCGGCCAACGGAGACGTGAAGCCCGTGGTGTCCAGCACGCCTTTGGTGGACTTCTTGATGCAGCTGGAAGATTACACGC 216 CGGCTCCCGCCGCGCTGCCCTCCAGCACCGCCGCGGAGAACAAGGCCAGCCCCGCGGGGACAGCGGGGGGACCTGGGGCTGGAGCAGCTGCTGGGGGCACGGGACCCTTGGCGGCGCGGGCCGGGGAGCCAGCTGAGCGGCGTGGGGCGG
109 217 CAGCCAGTTAACCTGGAGGGACGTCCAGCACCTGCTAGTGAAGACATCCCGGCCGGCCCACCTGAAAGCGAGCGACTGGAAAGTGAACGGCGCGGGTCATAAAGGTGCGGCAGTGGCGTTCTGGTGGACCATTGGGTGGCCCTGGAATGT 218 AGTTAGCCTGTCTGCCATCACTGCCTCACTGTGCTTCTCTCTCCCCCAGGTCACCACGGATCTGCGTCAGCGCTGTACCGATGGCCACACTGGGACCTCAGTCTCTGCCCCCATGGTGGCGGGCATCATCGCCTTGGCTCTAGAAGCAAA
110 219 TTCCTTAGAGAGGAAGAAGCTATTCAGTTGGATGGATTAAATGCATCACAAATAAGAGAACTTAGAGAGAAGTCGGAAAAGTTTGCCTTCCAAGCCGAAGTTAACAGAATGATGAAACTTATCATCAATTCATTGTATAAAAATAAAGAG 220 ATTTTCCTGAGAGAACTGATTTCAAATGCTTCTGATGCTTTAGATAAGATAAGGCTAATATCACTGACTGATGAAAATGCTCTTTCTGGAAATGAGGAACTAACAGTCAAAATTAAGGTAAGTGTAAGGCAGTTTTTCTTTCTTTTAAAG
111 221 GCATCCGCATGCTGGACGGCGATGTCACAGATGTGGTCGAGGCAAAGTCGCTGGGCATCAGACCCAACTACATCGACATTTACAGTGCCAGCTGGGGGCCGGACGACGACGGCAAGACGGTGGACGGGCCCGGCCGACTGGCTAAGCAGG 222 GCACTGAATTCACTGAAACTTGCTGGGCTGCGTCCTCACTTGGTTTTTTCCTTTGTTTCAGACACGGCACTCGTTGTGCGGGAGAAGTTGCTGCTTCAGCAAACAATTCCTACTGCATCGTGGGCATAGCGTACAATGCCAAAATAGGAG
112 223 GTGAAATGATCCCAACAGAAGAACATCGGAGACCAGAGAGAGGAACTCAAAGGGGCGCTGCCTCCGGGTCTGGGGTCCTGGCCTGCGTGGCCTGTTGGCACGTGTTTCTCTTCCCCGCCCGGCCTCCAGTTGTGTGCTCTCACACAGGCT 224 CTGACCCTATTCCCCCGTGCTGTGTCTCCTGCAGAGGGGGAGGTGAGCGCCGACGAGGAGGGCTTTGAGAACCTGTGGGCCACCGCCTCCACCTTCATCGTCCTCTTCCTCCTGAGCCTCTTCTACAGTACCACCGTCACCTTGTTCAAG
113 225 GTCCTCTGGATGTCAGCATGGCAGCCACAAACCTGGAGAACCAGCTGCACAGCGCACAGAAGAACCTCCTGTTCCTTCAGCGGGAGCATGCCAGCACGCTCAAGGGGCTGCACTCCGAGATCAGGCGGCTGCAGCAGCACTGCACAGGTA 226 GAGGTTCTGTATTTACAATAATAATTTATAAGCAAATAACTCACATTTCATCCTCAGTATTTTTCAGTGCTGTACAAGCGTCTTGAATTACTCTGGTAGCTTTTCCAGAAAGACCCATGACTTCACCACATTTCTCGAGTTACGATGAAG
114 227 TGCTAGCAATGTCTCCCACACTGTGGTCCTGCGCCCTCTCAAGGCTGGTTATTTCAACTTCACCTCGGCAACAATTACTTACCTGGCCCAGGAGGATGGGCCCGTTGTGGTGAGTTGCCCAAACCCTTAGCTGGATGGAATTTGGATCTG 228 TAATTTTATATCCATTACTTACTAACCCTTTTTGTTTCATCCATTTTCTAGTGCTGCATTAGACGTGGAACTATCTGATGATTCCTTCCCTCCAGAAGACTTTGGCATTGTGTCTGGAATGCTCAATGTCAAATGGGACCGGATTGCCCC
115 229 GGTTTTTAATGACCACAACAAGCAAGCATGCAGCTTACTGCTTGAAAGGTGAGGATTGGAAATGTTGGGACTATTATAATTGCAGAATACATGATGATCTCAATCCAACTTGAACTCTCTCACTGATTACTTGATGACAATAAAATATCT 230 GTTTTGGTGGCATATACACCTTAATCTGTAGATGGGAGTGATTAGCTGTTTAAAAGTTAAAATGTGACTGAGAAGGAAATTGAGTAGGGCAAATTTTAAATGGGTATTATTTTTCATCTTCAAACAGGCAGACCTGTTATCCTAAACTAG
116 231 TTTCTATTCCGCCTTCCTTGTAGCAGATAAGGTTATTGTCACTTCAAAACACAACAACGATACCCAGCACATCTGGGAGTCTGACTCCAATGAATTTTCTGTAATTGCTGACCCAAGAGGAAACACTCTAGGACGGGGAACGACAATTAC 232 CCTTGTCTTAAAAGAAGAAGCATCTGATTACCTTGAATTGGATACAATTAAAAATCTCGTCAAAAAATATTCACAGTTCATAAACTTTCCTATTTATGTATGGAGCAGCAAGGTAAATCTATATTGATTAAAAACTTATATGTATTACCT
117 233 GACTCAGAATTCATGATTGAAGAAATGCAGGTTAGTTTAAACTTTGAAGGAAATTTTTAAGGTGGCAAAAGGTTTTGGTGGCATATACACCTTAATCTGTAGATGGGAGTGATTAGCTGTTTAAAAGTTAAAATGTGACTGAGAAGGAAA 234 AAATGGAGATTAATCTTAAACTGAAACAGTAGTTGGGAAATCTTTTAGAAATCCACCTATTACTACCTATTGGTAAAGGAGATTAAATTTCTACAGGTATGGAGAGTCGGCTTGACTACACTGTGTGGAGCAAGTTTTAAAGAAGCAAAG
118 235 AGTGGCCATCGTGGTGGGCGCCCCGCGGACCCTGGGCCCCAGCCAGGAGGAGACGGGCGGCGTGTTCCTGTGCCCCTGGAGGGCCGAGGGCGGCCAGTGCCCCTCGCTGCTCTTTGACCTCCGTGAGTCCCAGGCAAGGAGAGCAAGGTT 236 TCTGGAGTGGGTGCTGCTGCTCTTGGGACCTTGTGCTGCCCCTCCAGCCTGGGCCTTGAACCTGGACCCAGTGCAGCTCACCTTCTATGCAGGCCCCAATGGCAGCCAGTTTGGATTTTCACTGGACTTCCACAAGGACAGCCATGGGAG
119 237 CAGAAGGCATGGCATTCATTGAAGAGCGGAATTATATTCATCGTGACCTTCGGGCTGCCAACATTCTGGTGTCTGACACCCTGAGCTGCAAGATTGCAGACTTTGGCCTAGCACGCCTCATTGAGGACAACGAGTACACAGCCAGGGAGG 238 GGGCCAAGTTTCCCATTAAGTGGACAGCGCCAGAAGCCATTAACTACGGGACATTCACCATCAAGTCAGATGTGTGGTCTTTTGGGATCCTGCTGACGGAAATTGTCACCCACGGCCGCATCCCTTACCCAGGTTAGAGCCAAGGGCAGG
120 239 GCATCATGGCCGCCCTCAGACCCCTTGTGAAGCCCAAGATCGTCAAAAAGAGAACCAAGAAGTTCATCCGGCACCAGTCAGACCGATATGTCAAAATTAAGGTATGTGGTCCTGGGATGGAAATGGGTGTGGGGTGAAGAAAAGAGTTTC 240 TCTTTATTTTATTTAAAAGAGCCGGAGCCGGAAGTGCTTGCCTTTTTCCCTGCTAGGACCCAGGGGTTACGACCCATCAGCCCTTGCGCGCCACCGTCCCTTCTCTCTTCCTCGGCGCTGCCTACGGAGGTGGCAGCCATCTCCTTCTCG
121 241 TCTCCAAAAAAAGTTGGTGATGACATTGCCAAGGCAACGGGTGACTGGAAGGGCCTGAGGATTACAGTGAAACTGACCATTCAGAACAGACAGGCCCAGGTATTTGCTTGTGCTTGGTTTCGGGAGAGGAGGGTGGGGGGACAGGTAGCA 242 CAACCCCGGAAAGACGCTGAGAGGGCTGTGGCTCGGGGCTCCCTCTGCACAGACACTAACTCTTCTTTTCCCCCAGTATACCTGAGGTGCACCGGAGGTGAAGTCGGTGCCACTTCTGCCCTGGCCCCCAAGATCGGCCCCCTGGGTCTG
122 243 GATGCTCCCAGAGCTGAGTGGGAGTGGGACGAGAATGGGGATCAGTGCTGTGAGAATGTATCTGCTTTGTCCCAGTTCTTCATCCTGCTGCTGATTATCCTCCTTGCTGAGGTGACCTTGGCCATCCTGCTCTTTGTATATGAACAGAAG 244 CTGAATGAGTATGTGGCTAAGGGTCTGACCGACAGCATCCACCGTTACCACTCAGACAATAGCACCAAGGCAGCGTGGGACTCCATCCAGTCATTTGTGAGTACAGGTGGAATCCTCTTCAGATCAGCCCAGACTTCATTTTCAAGCCTA
123 245 CAAATACTTCCTCTTGATATGGTGGAATTATAGAGTAGTATCATTTGTAACTGAAATGTCTTCTAGGGTTGCTATGCGAAAGCAAGACTGTGGTTTCATTCCAATTTCCTGTATATCGGAATCATCACCATCTGTGTATGTGTGATTGAG 246 GTGTTGGGGATGTCCTTTGCACTGACCCTGAACTGCCAGATTGACAAAACCAGCCAGACCATAGGGCTATGATCTGCAGTAGTCCTGTGGTGAAGAGACTTGTTTCATCTCCGGAAATGCAAAACCATTTATAGCATGAAGCCCTACATG
124 247 CCCCTCTCTCTGCCCTCACAGCCTGCATGATGAATGTGCACAAGCGCTGCGTGATGAATGTTCCCAGCCTGTGTGGCACGGACCACACGGAGCGCCGCGGCCGCATCTACATCCAGGCCCACATCGACAGGGACGTCCTCATTGTCCTCG 248 TAAGAGATGCTAAAAACCTTGTACCTATGGACCCCAATGGCCTGTCAGATCCCTACGTAAAACTGAAACTGATTCCCGATCCCAAAAGTGAGAGCAAACAGAAGACCAAAACCATCAAATGCTCCCTCAACCCTGAGTGGAATGAGACAT
125 249 GATTTATTTCACATAGATGACTATAACAGAGTGCCACTTAAACATGAGCTGGAAATGAGTAAAGAGAGTGAGCATGATTCAGATGAATCCTCTGATGATGACAGTGATTCAGAGGAACCAAGCAAATACATCAATGCATCTTTTATAATG 250 AGCTACTGGAAACCTGAAGTGATGATTGCTGCTCAGGGACCACTGAAGGAGACCATTGGTGACTTTTGGCAGATGATCTTCCAAAGAAAAGTCAAAGTTATTGTTATGCTGACAGAACTGAAACATGGAGACCAGGTTTGTACTTTTGAG
126 251 CTCTTGGGCAATGTGCTGGTGTGTGTGCTGGCCCGCAACTTTGGCAAGGAATTCACCCCACAAATGCAGGCTGCCTATCAGAAGGTGGTGGCTGGTGTGGCTAATGCCCTGGCTCACAAGTACCATTGAGATCCTGGACTGTTTCCTGAT 252 ATGGGCAACCCTAAGGTGAAGGCTCATGGCAAGAAGGTGCTAGGTGCCTTTAGTGATGGCCTGGCTCACCTGGACAACCTCAAGGGCACTTTTTCTCAGCTGAGTGAGCTGCACTGTGACAAGCTGCACGTGGATCCTGAGAACTTCAGG
127 253 CACCATATGAAGGCGGAGTATGGAAAGTTAGAGTGGACCTACCTGATAAATACCCTTTCAAATCTCCATCTATAGGTATGTTACTACTTGGTTTTTCTCCTTAGAGAGTTTTGAAATCTAAGGGGGAAAAATCTTACATTTCAGGGGAGG 254 ATGCCTGGGGTGTTATTGGTAATTCTGCCAGATACTGTAAAGCCTGTGTAATTTCCTTTACCGTCCACCTTAGCATCGAGAGTAAACATGAGGTTACGATCCTGGGAGGACTTAATGAATTTGTAGTGAAGTTTTATGGACCACAAGGAA
128 255 GCAGCCATGTTTGGGCCTAAAGGTATGCTCCCGTCATCCCCACCCCACCCCACCCCACAGCCTCCTCCACCCCAGCCTGTTGACTTTTTCCACCTTCTCTGCAGGCTTTGGGCGGGGCGGAGCCGAGAGCCACACTTTCAAGTAAACCAG 256 GTGGTGGAGACCCCATCCTTGGCTGCTTGCAGGGCCACTGTCCAGGCAAATGCCAGGCCTTGTCCCCAGATGCCCAGGGCTCCCTTGTTGCCCCTAATGCTCTCAGTAAACCTGAACACTTGGAAAACCTGTGTGTGTACATGCGCGTGT
129 257 ACAATGGGGTTTGCCATTCTCTATCTGGGTCTCACTGGCACAGACAGTGCTGCAAGATTGGTTCCCTCATGGGAATGAAATGTTTCCCCTCCTTCCTCCGCAGGACAAAACAAGGAGAGGCCACCACCTGTTCCCAACCCAGACTATGAG 258 CCCATCCGGAAAGGCCAGCGGGACCTGTATTCTGGCCTGAATCAGAGACGCATCTGACCCTCTGGAGAACACTGCCTCCCGCTGGCCCAGGTCTCCTCTCCAGTCCCCCTGCGACTCCCTGTTTCCTGGGCTAGTCTTGGACCCCACGAG
130 259 GTGAAATGGCTCCAGCAACAGGAAGTGAAACGAAGGGTGAAGAGACAGGTGCGAAGTGACCCGCAGGCCCTTTACTTCAACGACCCCATTTGGTCCAACATGTGGTACCTGGTGAGTAGGACAGGACCTCTGTCTGCCCCAGGACACTTG 260 TTCGTGAGACTATTAATTGATGGCATTCTGCTTCTTGTCTTGCAGATTGGAAACCTGGAAGATTACTACCATTTTTATCACAGCAAAACCTTTAAAAGATCAACCTTGAGTAGCAGAGGCCCTCACACCTTCCTCAGAATGGACCCCCAG
131 261 GCTGGGAGTTTGCACCTGGGGTACAGAGGCAGGGAGGAAGGCGGGTGACTCTGTGGGTAACTAGCTGGAGGCTGGGCCCCCCGGGCTGCCTGACATACACCTCCTTCTGCTTTTGCAGGGGCTTCGGGAAGCAGGGATTCCAGTGCCAAG 262 TTTGCTGCTTTGTGGTGCACAAGCGGTGCCATGAATTTGTCACATTCTCCTGCCCTGGCGCTGACAAGGGTCCAGCCTCCGATGTAAGTAATGGGCATCGATTGCTTTTCTCTGTCCACAGTCAATGCTGCCTTGTGATTAAATGTGAGT
132 263 CCCTAAATGCCGAGCTGCAGCTGGACCGGCAGAAGCCCCGCCAGGGCCGGCGGGTGCTGCTGCTGGGCTCTCAACAGGCAGGCACCACCCTGAACCTGGATCTGGGCGGAAAGCACAGCCCCATCTGCCACACCACCATGGCCTTCCTTC 264 CCGTGAGCTGGTGAGGAGGCAGAGGGCATGGGCCTTAAAGGATCTGGGACCTCAGAAAGGCTCCAACCCCTGAGCCCCACTTACGTCTTTGCAGCTTCAACATCCAGATGTGTGTTGGAGCCACTGGGCACAACATTCCTCAGAAGCTAT
133 265 ACTCTGCCTCCTCCTTAGGGGCCAAGTTTCCCATTAAGTGGACAGCGCCAGAAGCCATTAACTACGGGACATTCACCATCAAGTCAGATGTGTGGTCTTTTGGGATCCTGCTGACGGAAATTGTCACCCACGGCCGCATCCCTTACCCAG 266 GGATGACCAACCCGGAGGTGATTCAGAACCTGGAGCGAGGCTACCGCATGGTGCGCCCTGACAACTGTCCAGAGGAGCTGTACCAACTCATGAGGCTGTGCTGGAAGGAGCGCCCAGAGGACCGGCCCACCTTTGACTACCTGCGCAGTG
134 267 CCAGTTATCAATGTTAAAAAGTGATCTCCCTCTCTCCTCTATCTCCTGTCTTGCCCACCCCCTCTCCATCTCCCCCACCTCTCTTTTTTACAGTATATTATTTCCGGATCACTCCTGGCAGCAACGGAGAAAAACTCCAGGAAGTGTTTG 268 GTCAAAGGAAAAATGATAATGAATTCATTGAGCCTCTTTGCTGCCATTTCTGGAATGATTCTTTCAATCATGGACATACTTAATATTAAAATTTCCCATTTTTTAAAAATGGAGAGTCTGAATTTTATTAGAGCTCACACACCATATATT
135 269 CATGCAGCCAAGCAGGCTGCAGCCTCAGCCACACAGACCATCGCTGCAGCTCAGCACGCAGCCTCTACCCCCAAGGCCTCTGCCGGCCCCCAGCCCCTGCTGGTGCAGAGCTGCAAGGTAAGACTCTAGGAAGGATGTGGGAGTGGAAGA 270 GTCTTTCCACCTCTCCCTCAGGGAGCAGCTGCCCACCCTGACAGTGAGGAGCAGCAGCAGCGGCTGCGGGAGGCAGCTGAGGGGCTGCGCATGGCCACCAATGCAGCTGCGCAGAATGCCATCAAGAAAAAGCTGGTGCAGCGCCTGGAG
136 271 GCCGGGCGGCGGCCGGGCCGGCGGACGGCGGGATGGGCTGCACCGTGAGCGCCGAGGACAAGGCGGCGGCCGAGCGCTCTAAGATGATCGACAAGAACCTGCGGGAGGACGGAGAGAAGGCGGCGCGGGAGGTGAAGTTGCTGCTGTTGG 272 GTGCTGGGGAGTCAGGGAAGAGCACCATCGTCAAGCAGATGAAGTAAGTGCTGTATTCCAGAGGCAGTGCTCAAACTCCAGCTTCCCCTCTTCACCCTCTGGGCCTGCACTGCCCCCGACTACAGGCCCAGCCAGTCTTAGCCAGGCCCA
137 273 CCCCTTGGGAATCACCTGGACCAGTGGGGGCCACAGTGGGAAGGGGGCAGGCAGGAGCAGCATGAACCCCCTGTGCCCTCCTCTCCCCAGGACGACTTCAAAGAGGGCTACCTGGAGACAGTGGCGGCTTATTATGAGGAGCAGCACCCA 274 GAGCTCACTCCTCTACTTGAAAAAGAAAGAGATGGATTACGGTGCCGAGGCAACAGATCCCCTGTCCCGGATGTTGAGGATCCCGCAACCGAGGAGCCTGGGGAGAGCTTTTGTGACAAGGTCATGAGATGGTTCCAGGCCATGCTGCAG
138 275 GACAGGACATCCAGCCCAAAAGAGACCTCACCCGCTTTGTGAAATGGCCCCGCTATATCAGGTTGCAGCGGCAGAGAGCCATCCTCTATAAGCGGCTGAAAGTGCCTCCTGCGATTAACCAGTTCACCCAGGCCCTGGACCGCCAAACAG 276 CTACTCAGCTGCTTAAGCTGGCCCACAAGTACAGACCAGAGACAAAGCAAGAGAAGAAGCAGAGACTGTTGGCCCGGGCCGAGAAGAAGGCTGCTGGCAAAGGGGACGTCCCAACGAAGAGACCACCTGTCCTTCGAGCAGGTGAGTAGG
139 277 CCAATATACAAACTGGAGTGTGGAGCAGCTTCCTGCAGAACCCAAGGAATTAATCTCTATGATTCAGGTCGTCAAACAAAAACTTCCCCAGAAGAATTCCTCTGAAGGGAACAAGCATCACAAGAGTACACCTCTACTCATTCACTGCAG 278 GGATGGATCTCAGCAAACGGGAATATTTTGTGCTTTGTTAAATCTCTTAGAAAGTGCGGAAACAGAAGAGGTAGTGGATATTTTTCAAGTGGTAAAAGCTCTACGCAAAGCTAGGCCAGGCATGGTTTCCACATTCGTAAGTATCCTTCA
140 279 TGAAAGCTGGTGGAATGCGAATTGTGCAGAAACACCCACATACAGGAGACACCAAAGAAGAGAAAGACAAGGATGACCAGGAATGGGAAAGCCCCAGGTGGGATGATGCTAGCGACTCTTGAGCATGTTTTCCAAAAACCCTATTCGGTT 280 CGCTCCCCGGCGCTCACACCTGAGCTCACTCGCGCACGCCCGCCCGGCCCGAGAACCGCGCCGCCGCCTCGGCCCCGCGGAAGCCCCGCCGCGTCATGTCTTCGCCTCCCGAAGGGAAACTAGAGACTAAAGCTGGACACCCGCCCGCCG
141 281 CTGCTGGAGCCAGTTCTGCTTCTCGGCAAGGAGCGATTTGCTGGTGTAGACATCCGTGTCCGTGTAAAGGGTGGTGGTCACGTGGCCCAGATTTATGGTGAGTCCCAGGAACTGGGCGCATGGAGGAGGTGGCTCTGGGAGGGAGGCCTT 282 AGCTGGAGCCGGAGCTCACGGGGCCCCTGTTTCTCTTGTATCTTACAGAAGACAGCGACAGCTGTGGCGCACTGCAAACGCGGCAATGGTCTCATCAAGGTGAACGGGCGGCCCCTGGAGATGATTGAGCCGCGCACGCTACAGTACAAG
142 283 GTTGAAAAGAAAAAGAAGGAGAAGGTTCTCGCAACTGTTACAAAACCAGTTGGTGGTGACAAGAACGGCGGTACCCGGGTGGTTAAACTTCGCAAAATGGTAAGATGTGGGGACTGTAAATTGGATTTTCTGTTTATGCTTGAATACTGT 284 GGTAACCTCAAAGCTAAAAAGCCCAAGAAGGGGAAGCCCCATTGCAGCCGCAACCCTGTCCTTGTCAGAGGAATTGGCAGGTATTCCCGATCTGCCATGTATTCCAGAAAGGCCATGTACAAGAGGAAGTACTCAGCCGCTAAATCCAAG
143 285 GCAAGTGTCGTGGACTTCGTACTGCTAGGAAGCTCCGTAGTCACCGACGAGACCAGAAGTGGCATGATAAACAGTATAAGAAAGCTCATTTGGGCACAGCCCTAAAGGCCAACCCTTTTGGAGGTGCTTCTCATGCAAAAGGAATCGTGC 286 TTTTCAAAGGAGAGACCCCAGCCTCGGGTCAGGCGCGGCGCAGACAGCGGCGCGGGGTCCTTGGCTGGGCGGGGCTTGCTCGCGGTGGCTTGTGGCTCCTTCCTGCGGTGCTTCTCTCTTTCGCTCAGGCCCGTGGCGCCGACAGGATGG
144 287 CTGATCCACAACAACTTCGGAGTGCTCTTCCATAACCTCCCCTCCCTCACGCTGGGCAATGTGTTTGTCATCGTGGGCTCTATTATCATGGTAGTTGCCTTCCTGGGCTGCATGGGCTCTATCAAGGAAAACAAGTGTCTGCTTATGTCG 288 TTCTTCATCCTGCTGCTGATTATCCTCCTTGCTGAGGTGACCTTGGCCATCCTGCTCTTTGTATATGAACAGAAGGTAAGTTATAAAGACAACAACTTATTGTCTTAATACTGAAAGTGGGGAGTATGCAGTGGAGAAGTTGGTACAAAG
145 289 CCCGGTCCTTTGGAGTAGAATGGATTGCAAGTTGGCTAGTGGTCACGGTGCCCACCATTCTTGGCCTGTTACTTACCTGAGATGAGCTCTTTTAACTCAAGCGAAACTTCAAGGCCAGAAGATCTTGCCTGTTGGTGATCATGCTCCTCA 290 ACAAAAGGCCCTTCCCAAAGGAGCTCCAGAACAGTGTGCTTGAAACCACCCTTATGCCACATAATTACTCCAGGTGTTATACTTGCCAAGTCAGCAATTCTGTGAGCAGCAAGAATGGCACGGTCTGCCTCAGTCCACCCTGTACCCTGG
146 291 GTGGAAATTTTGGATTCCTACTACCAGAGGCTGCATCGGCTGCGCGGAGAGCAGGTGGGGGCCAGGTCCCAGTGGGCGTGGCTGGGTGGAGGGGGAACTGAGACTTCAGAATATTTCATGGGAGGTGAGGGCCCATTTCTTAAAGAGGAT 292 GGAAATCTTCCTGCACACACATTTTTCCCTGGGTGCAGAACGGGGAGCGGGAAGTGGGTAGGTTCTAAGGCTCTCATTCCCTGAGCCTGGCTCTCCCTATCGCCAGAATATGTCGTCGGTGCCCCCACTTGGAGCTGGACCCTGGGAGCG
147 293 CTGGTGCCGACAAGAAAGCCGAGGCTGGGGCTGGGTCAGCAACCGAATTCCAGTTTGTGAGTATCTTCCTATTTGTTTTCCATGAGCCATCACTTGTTCTGGCCTCAGTCTGGTTGCTCTGCAAGTTGTGGGGATGTCATATAGTATGGG 294 CCAGTTTTCTTGGCTTTAAGGGACAGAGTTCTCACATTGCCCTGTGTTCACAGTGTGGTTTGATTTACATAGGTCTGGAGGGTGAGCGACCTGCGAGACTCACAAGAGGGGAAGCTGACAGAGATACCTACAGACGGAGTGCTGTGCCAC
148 295 GTTCTTTACAAAGTTCGCTGGAAAGGCTATACATCGGATGATGATACCTGGGAGCCCGAGATTCACCTGGAGGACTGTAAAGAAGTGCTTCTTGAATTTAGGAAGAAAATTGCAGAGAACAAAGCCAAAGCAGTCAGGAAGGATATTCAG 296 AGACTATCCTTAAATAACGACATATTTGAGGCGAACTCTGATAGCGATCAGCAAAGTGAGACAAAAGAAGATACTTCCCCAAAGAAGAAAAAGAAAAAATTGAGGCAGAGAGAAGAGAAAAGCCCAGATGATCTGAAAAAGAAAAAAGCA
149 297 GAGGCTCCTTTTGACCTGAGTGTCGTCTATCGGGAAGGAGCCAATGACTTTGTGGTGACATTTAATACATCACACTTGCAAAAGAAGTATGTAAAAGTTTTAATGCACGATGTAGCTTACCGCCAGGAAAAGGATGAAAACAAATGGACG 298 CATGTGAATTTATCCAGCACAAAGCTGACACTCCTGCAGAGAAAGCTCCAACCGGCAGCAATGTATGAGATTAAAGTTCGATCCATCCCTGATCACTATTTTAAAGGCTTCTGGAGTGAATGGAGTCCAAGTTATTACTTCAGAACTCCA
150 299 AGAGACCGGGTCTCTTAAACTGCCCAATATATTGGCAGCAACTCCGAGAGAAATGCTTGTTATTTTCTCACACTGTCAACCCTTGGAATAACAGTCTAGCTGATTGTTCCACCAAAGAATCCAGCCTGCTGCTTATTCGAGATAAGGATG 300 AAAGTAACAAATATAATATATCCACTCCACCACACATTTCAGCATTTAATACTCTTGTTTTTCCTTATGTACTAGTGACATCCTTAATACAGAAATCATCAATAGAAAAATGCAGTGTGGACATTCAACAGAGCAGGAATAAAACAACAG
151 301 GGTTTGAAAGAAATCTTAACTGTTTTTTTCCCCTACTCTTCTAAGATTGAAGAATTAGGGTCTGAAGGAAAAGTAGAAGAAGCCCAGGGGATGATGAAATTAGTTGAGCAATTAAAAGAAGAGAGAGAACTGCTAAGGTCCACAACGTCG 302 ACAATTGAAAGCTTTGCTGCACAAGAAAAACAAATGGAAGTTTGTGAAGTATGTGGAGCCTTTTTAATAGTAGGAGATGCCCAGTCCCGGGTAGATGACCATTTGATGGGAAAACAACACATGGGCTATGCCAAAATTAAAGCTACTGTA
152 303 GCCCAGTACATCTTGATCCATCAGGCTTTGGTGGAATACAATCAGTTTGGAGAAACAGAAGTGAATTTGTCTGAATTACATCCATATCTACATAACATGAAGAAAAGGGATCCACCCAGTGAGCCGTCTCCACTAGAGGCTGAATTCCAG 304 AGACTTCCTTCATATAGGAGCTGGAGGACACAGCACATTGGAAATCAAGAAGAAAATAAAAGTAAAAACAGGAATTCTAATGTCATCCCATGTATGTAGTTTATTTTTTTATTTTTTGTATCAGATAAAGTTAAGCTCTTTTGGATTTGT
153 305 CAGCCCCAGAAGCGAGAGGAGCAAACCAAGAAGGAGAATGAAGAAGACAAACTCACTGACTGGAATAAACTGGCTTGTCTGCTTTGCAGAAGGCAGTTTCCCAATAAAGAAGTTCTGATCAAACACCAGCAGCTGTCAGACCTGCACAAG 306 CAAAACCTGGAAATCCACCGGAAGATAAAACAGTCTGAGCAGGAGCTAGCCTATCTGGAAAGGAGAGAACGAGAGGTAAACTTTGGTGACCTATTACTCCCTTGACCTCAGCTCTTTTTGCTTTCTGATATAGACTTCATAGGCTGTGCT
154 307 GGCTTAAGTCCACTCCCCGCCCTAAGTTCTCTGTGTGTGTCCTGGGGGACCAGCAGCACTGTGACGAGGCTAAGGCCGTGGATATCCCCCACATGGACATCGAGGCGCTGAAAAAACTCAACAAGAATAAAAAACTGGTCAAGAAGCTGG 308 CCAAGAAGTATGATGCGTTTTTGGCCTCAGAGTCTCTGATCAAGCAGATTCCACGAATCCTCGGCCCAGGTTTAAATAAGGCAGGAAAGTTCCCTTCCCTGCTCACACACAACGAAAACATGGTGGCCAAAGTGGATGAGGTGAAGTCCA
155 309 ATGACGTCCGGTTGTTTGCCTTCGTGCGCTTCACCACCGGGGATGCCATGAGCAAGAGGTCCAAGTTTGCCCTCATCACGTGGATCGGTGAGAACGTCAGCGGGCTGCAGCGCGCCAAAACCGGGACGGACAAGACCCTGGTGAAGGAGG 310 AAGCGCCGCGTCGCGCGGCCACCAGCGCTGATGTGTGTGTGTGTTTTTTTCTTCTCCCAACCCAAAGGGTGACTTTTAAATATGACGGCTCCACCATCGTCCCCGGCGAGCAGGGAGCGGAGTACCAGCACTTCATCCAGCAGTGCACAG
156 311 GCTCAAGGAAAAACATGGACTGCTATTGCAGAATACCAGCGTGCATTGCAGGAGAACGTCGCTATGGAACCTGCATCTACCAGGGAAGACTCTGGGCATTCTGCTGCTGAGCTTGCAGAAAAAGAAAAATGAGCTCAAAATTTGCTTTGA 312 CCATTCTCCTGGTGGCCCTGCAGGCCCAGGCTGAGCCACTCCAGGCAAGAGCTGATGAGGTTGCTGCAGCCCCGGAGCAGATTGCAGCGGACATCCCAGAAGTGGTTGTTTCCCTTGCATGGGACGAAAGCTTGGCTCCAAAGCATCCAG
157 313 CCTCTTACTCTCATTCATTTCATACACACTGGCTCACACATCTACTCTCTCTCTCTATCTCTCTCAGAATGACAATTCTAGGTACAACTTTTGGCATGGTTTTTTCTTTACTTCAAGTCGTTTCTGGAGAAAGTGGCTATGCTCAAAATG 314 GAGACTTGGAAGATGCAGAACTGGATGACTACTCATTCTCATGCTATAGCCAGTTGGAAGTGAATGGATCGCAGCACTCACTGACCTGTGCTTTTGAGGACCCAGATGTCAACATCACCAATCTGGAATTTGAAATATGGTGAGGGATGG
158 315 CTTGCTGCTTGAGTTTTATAATGTCTAATAAATTGTATTTTAGCTGTGGAGGAAGATGCAGAGTCAGAAGATGAAGAGGAGGAGGATGTGAAACTCTTAAGTATATCTGGAAAGCGGTCTGCCCCTGGAGGTGGTAGCAAGGTTCCACAG 316 AAAAAAGTAAAACTTGCTGCTGATGAAGATGATGACGATGATGATGAAGAGGATGATGATGAAGAGTAAGTATGATTTTAGAAACTTGATATACTTCCGGAATCTTGACAAAAAAAGGAATTTGACATAGTTATATGCATGAGGGTTTTA
159 317 GAGGCGGCCGCGCGTGTGTTGGGCCCGGGGTGCTCGGACGCGCGCTCAGGGTCGGTCCTGCTGTTCGTTGCTTCTTAGGCTCTTCTGGAGCTGGAGATGAACTCGGACCTCAAGGCTCAGCTCAGGGAGCTGAATATTACGGCAGCTAAG 318 GAAATTGAAGTTGGTGGTGGTCGGAAAGCTATCATAATCTTTGTTCCCGTTCCTCAACTGAAATCTTTCCAGAAAATCCAAGTCCGGCTAGTACGCGAATTGGAGAAAAAGTTCAGTGGGAAGCATGTCGTCTTTATCGCTCAGGTATCT
160 319 AAAATTTCCCATTTTTTAAAAATGGAGAGTCTGAATTTTATTAGAGCTCACACACCATATATTAACATATACAACTGTGAACCAGCTAATCCCTCTGAGAAAAACTCCCCATCTACCCAATACTGTTACAGCATACAATCTCTGTTCTTG 320 GGCATTTTGTCAGTGATGCTGATCTTTGCCTTCTTCCAGGAACTTGTAATAGCTGGCATCGTTGAGAATGAATGGAAAAGAACGTGCTCCAGACCCAAATCTGTAAGTAGTAGCCCCTCTGGCCAAAACCTCCCTCTAGAAAATCCACAT
161 321 GGGTGGCCCTGCACAGGCCCGATGTCTACTTGCTGCCACCAGCCCGGGAGCAGCTGAACCTGCGGGAGTCGGCCACCATCACGTGCCTGGTGACGGGCTTCTCTCCCGCGGACGTCTTCGTGCAGTGGATGCAGAGGGGGCAGCCCTTGT 322 TCTCCGAGAGCCACCCCAATGCCACTTTCAGCGCCGTGGGTGAGGCCAGCATCTGCGAGGATGACTGGAATTCCGGGGAGAGGTTCACGTGCACCGTGACCCACACAGACCTGCCCTCGCCACTGAAGCAGACCATCTCCCGGCCCAAGG
162 323 ACCCTACGTCCGCTCCAAGGGCCGGAAGTTCGAGCGTGCCAGAGGCCGACGGGCCAGCCGAGGCTACAAAAACTAACCCTGGATCCTACTCTCTTATTAAAAAGATTTTTGCTGACAGTGCTCTGTGTGTGTTATTGGGGGATGGGTTGG 324 CCTTCACCCTCCTGGATCTGGGAGGCCAGAAGCTGGGCGCCAGATCCCTGTCTCACCCGGTTCTCCTTCCCCTTCCCTAGGTCCTCGCAAGGGCCGAGAGGTGTACCGGCATTTCGGCAAGGCCCCAGGAACCCCGCACAGCCACACCAA
163 325 GAGGCATGATCTGCTGGTGGGCGCTCCACTGTATATGGAGAGCCGGGCAGACCGAAAACTGGCCGAAGTGGGGCGTGTGTATTTGTTCCTGCAGCCGCGAGGCCCCCACGCGCTGGGTGCCCCCAGCCTCCTGCTGACTGGCACACAGCT 326 AACTGAGACTTCAGAATATTTCATGGGAGGTGAGGGCCCATTTCTTAAAGAGGATGCTTGTCCAGCGGCGTGAATGATGGTGCTCCTCATCTTGCAGATGGCGTCGTATTTTGGGCATTCAGTGGCTGTCACTGACGTCAACGGGGATGG
164 327 AAATGGCACCTCGAAAGGGGAAGGAAAAGAAGGAAGAACAGGTCATCAGCCTCGGACCTCAGGTGGCTGAAGGAGAGAATGTATTTGGTGTCTGCCATATCTTTGCATCCTTCAATGACACTTTTGTCCATGTCACTGATCTTTCTGGCA 328 ACTCTTTGGGAGGAATAATGCCGGCGTCTTCCGGAACCCGACCTCGCCCCGTGACCTCAGAGGTATACTTCCGGGACACGGAAGTGACCCCCGTCGCTCCGCCCCCTCCCACTCTCTCTTTCCGGTGTGGAGTCTGGAGACGACGTGCAG
165 329 GATAATCCCCTTTTCAAGAGCGCCACCACGACGGTCATGAACCCCAAGTTTGCTGAGAGTTAGGAGCACTTGGTGAAGACAAGGCCGTCAGGACCCACCATGTCTGCCCCATCACGCGGCCGAGACATGGCTTGCCACAGCTCTTGAGGA 330 AACATCGCCGCCATCGTCGGGGGCACCGTGGCAGGCATCGTGCTGATCGGCATTCTCCTGCTGGTCATCTGGAAGGCTCTGATCCACCTGAGCGACCTCCGGGAGTACAGGCGCTTTGAGAAGGAGAAGCTCAAGTCCCAGTGGAACAAT
166 331 TTGAACAGACACGGTAGAAGACTCGCCCATTTTGGAATGTGACCGTCTGTCCTTCAGGAGAGGACACCAGGGTGGGGGTGAAGGAGACACTACTGCCCCCACCCCTGACAGCCCCCACCCCATGGCTTCCATCTTTTGCATCACCACCAC 332 AGGTGGCCAGAGCAGGCCGGTTTGGCACCAAGGGCTTGGCTATCACATTTGTGTCCGATGAGAATGATGCCAAGATCCTCAATGATGTGCAGGATCGCTTTGAGGTCAATATTAGTGAGCTGCCTGATGAGATAGACATCTCCTCCTACA
167 333 GGTGTCTGCTTCTTTTGCAGTGATCGTAAACTTGTTGATAAAGAAGATATCGACACTAGCAGCAAAGGAGGCTGTGTCCAACAGGCTACTGGCTGGAGGAAAGGGACAGGCCTGGGATATGGCCATCCTGGATTGGCTTCATCAGAGGAG 334 GCTGAAGGCCGGATGAGGGGCCCCAGTGTTGGAGCCTCAGGAAGAACCAGCAAAAGACAGTCCAACGAGACTTACCGAGATGCTGTTCGAAGAGTCATGTTTGCTCGATATAAAGAACTCGATTAAGAAAGGAGACAAGTTCCATGGGAT
168 335 TTGCAGATGTCCCAGGAGAGAGGAGTACAGCCAGCACCTTTCCTACAGACCCAGTTTCCCCATTGACAACCACCCTCAGCCTTGCACACCACAGCTCTGCTGCCTTACCTGCACGCACCTCCAACACCACCATCACAGCGAACACCTCAG 336 ATGCCTACCTTAATGCCTCTGAAACAACCACTCTGAGCCCTTCTGGAAGCGCTGTCATTTCAACCACAACAATAGGTGATATTACCCTCAGTCAGGCAGCCACACCATCCCCATGTGCCTGGTGATGTGCTCTCACAAGGGCCTTCCACC
169 337 GTGATGAGGATGATAAAAACATAGGCAGTGATGAGGATCACCTGTCACTGAAGGAATTTTCAGAATTGGAGCAAAGTGGTTATTATGTCTGCTACCCCAGAGGAAGCAAACCAGAAGATGCGAACTTTTATCTCTACCTGAGGGCAAGAG 338 TGTGTGAGAACTGCATGGAGATGGATGTGATGTCGGTGGCCACAATTGTCATAGTGGACATCTGCATCACTGGGGGCTTGCTGCTGCTGGTTTACTACTGGAGCAAGAATAGAAAGGCCAAGGCCAAGCCTGTGACACGAGGAGCGGGTG
170 339 AAATATGAGATTACGGAGCAGCGCAAGATTGATCAGAAAGCTGTGGACTCACAAATTTTACCAAAAATCAAAGCTATTCCTCAGCTCCAGGGCTACCTGCGATCTGTGTTTGCTCTGACGAATGGAATTTATCCTCACAAATTGGTGTTC 340 ACACACCAGAAATTTGTCATTGCCACTTCAACCAAAATCGATATCAGCAATGTAAAAATCCCAAAACATCTTACTGATGCTTACTTCAAGAAGAAGAAGCTGCGGAAGCCCAGACACCAGGAAGGTGAGATCTTCGACACAGAAAAAGAG
171 341 GTGGCTAAAGCAGTGACCCAGGCTCTGAACCGCTGTGTCAGCTGCCTACCTGGCCAGCGCGATGTGGATAATGCCCTGAGGGCAGTTGGAGATGCCAGCAAGCGACTCCTGAGTGACTCGGTAGGAGGACGGTAGGGGGTGGGGGAACGT 342 GTCGCTGCACTGACGTCAGATCCTGCAGTGCAGGCCATTGTACTTGATACGGCCAGTGATGTGCTGGACAAGGCCAGCAGCCTCATTGAGGAGGCGAAAAAGGCAGCTGGCCATCCAGGGGACCCTGAGAGCCAGCAGCGGCTTGCCCAG
172 343 TGGGAAGGTTAGTTCTGCCTCCTGGGCTACAGGTGTCTGGGCATTTGTTCTGTGCCTGTGGAGCCCCTCTGGGCCTGCCCCCTGACCACCTGTGCCCTCTGTTCCAGGTGCTGGGGAGTCAGGGAAGAGCACCATCGTCAAGCAGATGAA 344 GATCATCCACGAGGATGGCTACTCCGAGGAGGAATGCCGGCAGTACCGGGCGGTTGTCTACAGCAACACCATCCAGTCCATCATGGCCATTGTCAAAGCCATGGGCAACCTGCAGATCGACTTTGCCGACCCCTCCAGAGCGGTATGTGC
173 345 AGAATAAGTGGGAAGACTCAGTGTGCCTGTGCCCTCTGCCATTCACTTCATCTATCAATGTTCTCTGATTTCAGGATTAAGCCTATCGTATGGCCCAGTCTCCCCGATCATAAGAAGACTCTGGAACATCTTTGTAAGAAACCAAGAAAA 346 AATTTAAATGTGAGTTTCAATCCTGAAAGTTTCCTGGACTGCCAGATTCATAGGGTGGATGACATTCAAGCTAGAGATGAAGTGGAAGGTTTTCTGCAAGATACGTTTCCTCAGCAACTAGAAGAATCTGAGAAGCAGAGGCTTGGAGGG
174 347 CTATCCGTCAGTCCATCTCCAAAGCCCTGGTGGCCTATTACCAGAAATGTGAGTGAGCATGGGTCCTTCCCATGAGGTAGATGGGTGTGTGGGGATCAAGTCAAGGACTCTGTGTGATTATCTAAATCCTCGTCCCTGCTCTTCTTGCCA 348 GCTAAGCTGCCCAGCATGTAACTTAAATCCCTGTTCATTCCCCATTCCTTTAGCTGCTGGAGCCAGTTCTGCTTCTCGGCAAGGAGCGATTTGCTGGTGTAGACATCCGTGTCCGTGTAAAGGGTGGTGGTCACGTGGCCCAGATTTATG
175 349 GACGATGCCCCGAATTCCCACCCTGAAGAACCTAGAGGATCTTGTTACTGAATACCACGGGAACTTTTCGGTGAGAACGCTGTCATAAGCATGCTGCAGTCTATCAACTGCCAACTGCCTGCCAGCAAGACAGACAGAGTGTGGGGGTGG 350 GTAGTAGGGGCACAACAAATATAAGGTCCACTTTGCTTTTCTTTTTTCTATAGAGAATCCTTTCCTGTTTGCATTGGAAGCCGTGGTTATCTCTGTTGGCTCCATGGGATTGATTATCAGCCTTCTCTGTGTGTATTTCTGGCTGGAACG
176 351 ATTGTTGAATTGTCTTCTTTTATCTAGGAAATCTGTGCTCAGTACTGGGGAGAAGGAAAGCAAACATATGGAGATATTGAAGTTGACCTGAAAGACACAGACAAATCTTCAACTTATACCCTTCGTGTCTTTGAACTGAGACATTCCAAG 352 AGGAAAGACTCTCGAACTGTGTACCAGTACCAATATACAAACTGGAGTGTGGAGCAGCTTCCTGCAGAACCCAAGGAATTAATCTCTATGATTCAGGTCGTCAAACAAAAACTTCCCCAGAAGAATTCCTCTGAAGGGAACAAGCATCAC
177 353 ATGTTTATTGTTCATTTTCTTCACATGTTTAGTGATGAAAAATTTCTCCCTTCTAGGTTTCCCTTGGGGGCTTTGAAATAACACCACCAGTGGTCTTAAGGTTGAAGTGTGGTTCAGGGCCAGTGCATATTAGTGGACAGCACTTAGTAG 354 CTGTGGAGGAAGATGCAGAGTCAGAAGATGAAGAGGAGGAGGATGTGAAACTCTTAAGTATATCTGGAAAGCGGTCTGCCCCTGGAGGTGGTAGCAAGGTTCCACAGGTAGAGATGGCAATTTTATTATAGGTTTTGTATTATAGCTTTT
178 355 CTAACCCCTGTGTGTCCCCTCCTATTACAGCCCAAAGATCCCTGTGCAGCTCCGATTTTATTCGCATCCTTGTGATCTTCTCTGGAATGTTCCTTGTTTTCACCCTGGCCGGGGCCCTGTTCCTCCATCAACGAAGGAAATATAGATCAA 356 ACAAAGGAGAAAGTCCTGTGGAGCCTGCAGAGCCTTGTCATTACAGCTGCCCCAGGGAGGAGGAGGGCAGCACCATCCCCATCCAGGAGGATTACCGAAAACCGGAGCCTGCCTGCTCCCCCTGAGCCAGCACCTGCGGGAGCTGCACTA
179 357 ACCTGATCGTGGGAGCTTACGGGGCCAACCAGGTGGCTGTGTACAGGTGAGCACTGGCTCCAGGGGCGGGATGGGGAAGGTCCTGTGCCATCAAGAGGAGGCCAGGCCAGGAGGAGCCACAATGGCAAGCCTACCCCATCACCCTATCCC 358 GTGGCCGGGGCCAAGTGCTGGTGTTCCTGGGTCAGAGTGAGGGGCTGAGGTCACGTCCCTCCCAGGTCCTGGACAGCCCCTTCCCCACAGGCTCTGCCTTTGGCTTCTCCCTTCGAGGTGCCGTAGACATCGATGACAACGGATACCCAG
180 359 CGCCTCATGCGGCGCCGCGCACGGGTCCCAGAGCCTTCTGGGTAGCGGTTTAACCCCGCCTCTTGCGTCGGCGCCTTCCTTTTCCTCCCTGTCGCCACCGAGGTCGCACGCGTGAGACTTCTCCGCCGCCTCCGCCGCAGACGCCGCCGC 360 GATGCGCTACGTCGCCTCCTACCTGCTGGCTGCCCTAGGGGGCAACTCCTCCCCCAGCGCCAAGGACATCAAGAAGATCTTGGACAGCGTGGGTATCGAGGCGGACGACGACCGGCTCAACAAGGTAGCGGCCGCCCTTGCCCCGCAGCC
181 361 GGAACTCTCTCTCTGATGCTGATTTGCACTCTGCTGGAATTCTGCCTAGCTGTGCTCACTGCTGTGCTGCGGTGGAAACAGGCTTACTCTGACTTCCCTGGGGTGAGTGTGCTGGCCGGCTTCACTTAACCTTGCCTAGTGTATCTTATC 362 ATCCTGTCTGTCAAACAGGCCACCTTAAATCCTGCCTCACTGCAGTGTGAGTTGGACAAAAATAATATACCAACAAGAAGTTATGTTTCTTACTTTTATCATGATTCACTTTATACCACGGACTGCTATACAGCCAAAGCCAGTCTGGCT
182 363 TGATCCCCTGGGCTCCAGAGAACCTAACACTTCACAAACTGAGTGAATCCCAGCTAGAACTGAACTGGAACAACAGATTCTTGAACCACTGTTTGGAGCACTTGGTGCAGTACCGGACTGACTGGGACCACAGCTGGACTGTGAGTGACT 364 GCAGCCACTATCTATTCTCTGAAGAAATCACTTCTGGCTGTCAGTTGCAAAAAAAGGAGATCCACCTCTACCAAACATTTGTTGTTCAGCTCCAGGACCCACGGGAACCCAGGAGACAGGCCACACAGATGCTAAAACTGCAGAATCTGG
183 365 GCAGACCTGTTATCCTAAACTAGGTGAGTCAGCTTTTGGTACATGTGATGATTTTCAGTGTAACCAATGATGTAATGATTCTGCCAAATGAAATATAATGATATCACTGTAAAACCGTTCCATTTTGATTCTGAGGTTACTCTACTAACA 366 GGTAACATTCTAGTTTATGCCCCGAAAAGGGGAATATAGCCATTCTATAATGTTTGGAGATTTTGGATTACTCCTAATTGTATGCAAGTTGTCTTACTGTGTATTGTCCCTTAATTTCAGGACTCAGAATTCATGATTGAAGAAATGCAG
184 367 ATTGAAAATATTGAACTTCCCATGGATACAAAAACAAATGAAAGAAGAGGATTTTGTTTTATCACATATACTGATGAAGAGCCAGTAAAAAAATTGTTAGAAAGCAGATACCATCAAATTGGTTCTGGGAAGGTAAAGCCATTTAAGCAC 368 AAAGAACACAAACTGGATGGCAAATTGATAGATCCCAAAAGGGCCAAAGCTTTAAAAGGGAAAGAACCTCCCAAAAAGGTTTTTGTGGGTGGATTGAGCCCGGATACTTCTGAAGAACAAATTAAAGAATATTTTGGAGCCTTTGGAGAG
185 369 CTTCAACATCCAGATGTGTGTTGGAGCCACTGGGCACAACATTCCTCAGAAGCTATGTGAGTGGCATGAAGGGGGCAGGAGGGAGGTGGGCTTGGACTCCCCCGGAGGCTGGCCAGGGAGGTCCTGACTCTTCTGCTTGCCCTGCCAGCC 370 GAGGAGCCACAATGGCAAGCCTACCCCATCACCCTATCCCATCAGAGCTCAGCCAGTGGTGAAGGCCTCTGTCCAGCTACTGGTGCAAGATTCACTGAATCCTGCTGTGAAGAGCTGTGTCCTACCTCAGACCAAGACACCCGTGAGCTG
186 371 TATTTGTATCCCCTTTTCAGACTCCTGAGGAAGAAGAGATTTTAAACAAAAAACGATCTAAAAAAATTCAGAAGAAATATGATGAAAGGAAAAAGAATGCCAAAATCAGCAGTCTCCTGGAGGAGCAGTTCCAGCAGGGCAAGCTTCTTG 372 CGTGCATCGCTTCAAGGCCGGGACAGTGTGGCCGAGCAGATGGCTATGTGCTAGAGGGCAAAGAGTTGGAGTTCTATCTTAGGAAAATCAAGGCCCGCAAAGGCAAATAAATCCTTGTTTTGTCTTCACCCATGTAATAAAGGTGTTTAT
187 373 GAGCAGTTTTTGCAAGAAAGGATCAAAGTGAACGGAAAAGCTGGGAACCTTGGTGGAGGGGTGGTGACCATCGAAAGGAGCAAGAGCAAGATCACCGTGACATCCGAGGTGCCTTTCTCCAAAAGGTACAGGAGGGAAGTGTGTGTGTGG 374 ACTGACTGAAACTTCATCTCTGTTATCATTTGTGTATTTTCTTAGAAAAAGCTTGTGGTGAAGGGGGGCAAAAAAAAGAAGCAAGTTCTGAAGTTCACTCTTGATTGCACCCACCCTGTAGAAGATGGAATCATGGATGCTGCCAATTTT
188 375 AGCTCAGCCAGTGGTGAAGGCCTCTGTCCAGCTACTGGTGCAAGATTCACTGAATCCTGCTGTGAAGAGCTGTGTCCTACCTCAGACCAAGACACCCGTGAGCTGGTGAGGAGGCAGAGGGCATGGGCCTTAAAGGATCTGGGACCTCAG 376 GTGAAACCTCCAGTGGGGGAGGTGGTGTGGGGAACCCCTGGGAAGATGAGATGAGGATCCCATGCCCTAATCGCCAATTCTGACCCATTCCTCGATGTCTATAGACCTGATCGTGGGAGCTTACGGGGCCAACCAGGTGGCTGTGTACAG
189 377 GGCTGCTAAGGAAGCAAAAAAGGCTAAGCAAGCATCTAAAAAGACTGCAATGGCTGCTGCTAAGGTAATTATGGGGTTTCTTTACTTTCTTGAACAATACAACAGGAAAATTTTCTTTTTTTGAGACGGAGTCTTGCTCTGTTGCCCAGG 378 CTTTGTTTTGCAGGAAGAAATTCAAAAGAAAAGAACCCGCCGAGCAGTCAAATTCCAGAGGGCCATTACTGGTGCATCTCTTGCTGATATAATGGCCAAGAGGAATCAGAAACCTGAAGTTAGAAAGGCTCAACGAGAACAAGCTATCAG
190 379 GCCTGCGCCCCCTGGCAGCACTGGAACGTCCTAGAAAAGACTGAGGAGGCTGAGAAGACGCCCGTAGGTAGCTGCTTTTTGGCTCAGCCAGAGAGCGGCCGCCGCGCCGAGTACTCCCCCTGTCGCGGGAACACCCTGAGCCGCATTTAC 380 AGGGACGTGGACTGCCGGGCTTCAGCGCCCCACCCCTTCTTGTGCCTTCCAGGTGATGAGACCCGAAATGTAGGCTCCCAAACTTTACAAACCTTCAAGGCCCGCCAAGGACTGGGGGCGTCGGTCGTCAGCTGGAGCGACGTCATTGTG
191 381 TAGCACTTTTAAGAAAATTTTTCTTATCAGCTTTTATTTGTTTACCTCCTAGGTCCCAGGGATGAAACTGTTGATGATTTCTGGAGGATGATTTGGGAACAGAAAGCCACAGTTATTGTCATGGTCACTCGATGTGAAGAAGGAAACAGG 382 AACAAGTGTGCAGAATACTGGCCGTCAATGGAAGAGGGCACTCGGGCTTTTGGAGATGTTGTTGTAAAGATCAACCAGCACAAAAGATGTCCAGATTACATCATTCAGAAATTGAACATTGTAAATGTGAGTTTGCTTTTTACATAATTT
192 383 GCGTGTGACACTGAGGACACTGTGGGACACCTGGGACCCTGGAGGGACAAGGATCCGGCCCTTTGGTGCCAACTCTGCCTCTCTTCACAGCACCAGGCCATAGAAAGATTTTATGATAAAATGCAAAATGCAGAATCAGGACGTGGACAG 384 GTGATGTCGAGCCTGGCAGAGCTGGAGGTGAGCCGTGGCCTCCCCCTCCACCAAGCTTAGTCCCTGGGTCTTAGGCTCCACAGGACACTGGGTCTGGGCCCCGGGTCCCCTTGGGAATCACCTGGACCAGTGGGGGCCACAGTGGGAAGG
193 385 CTTCTTGCCAGCCCTGGTCATGCAGTGGCCATGGAGAATGTGTAGAAATCATCAATAATTACACCTGCAACTGTGATGTGGGGTACTATGGGCCCCAGTGTCAGTTTGGTAAGTCTCTTTCCTTTCTTTGCTTCTTCTTAGGTAAAGTCA 386 CTGAAGAAGCAGAGAACTGGGGAGATGGTGAGCCCAACAACAAGAAGAACAAGGAGGACTGCGTGGAGATCTATATCAAGAGAAACAAAGATGCAGGCAAATGGAACGATGACGCCTGCCACAAACTAAAGGCAGCCCTCTGTTACACAG
194 387 GTGGTGGGCTGCGGGGCGCCCGGGGCACAGCCGTGACCTGCCCACACCTGCAGGTGCTGAGGAGCCACGTGATGGTGCGAGTGGGTGGTGGCTGGGACACGCTGGAGCATTACCTGGACAAGCACGACCCGTGCCGCTGCTCCTCCACTG 388 CTCATCGCCCACCCCAGCCGAGGGTCTGCACCTTTTCTCCACAGAGGGTGTCGCCCACCACCAGTCCCCGCCCTGCTAGCCCAGTCCCTGGGAGTGAGCGCCGGGGCTCCCGGCCTGAGATGACTCCCGTTAGCTTACGAAGCACAAAGG
195 389 TGCTAAAGAGTTTTTCTTTCACCTTTTAATATAACGAATTAATTAGCTTTTATTCTTCTATTCATTTTCTTGCAGATGCCTACCTTAATGCCTCTGAAACAACCACTCTGAGCCCTTCTGGAAGCGCTGTCATTTCAACCACAACAATAG 390 CTACTACTCCATCTAAGCCAACATGTGGTAAGTTTATTTACTTAGAATCAGCATACCTCACTTTGGAATAGCACTTTAATTACATCTTTCTTTATTCCAAGCTTTCAGGACCCACTAGTAAGCTAAACTCACTGGCTCTAATTTCTCACC
196 391 CCAATGCTGAGTGTGCCTGTCGCAATGGCTGGCAGTGCAGGGACAAGGAGTGCACCGAGTGTGATCCTCTTCCAAACCCTTCGCTGACCGCTCGGTCGTCTCAGGCCCTGAGCCCACACCCTCAGCCCACCCACTTACCTTATGTCAGTG 392 AGATGCTGGAGGCCAGGACAGCTGGGCACATGCAGACTCTGGCTGACTTCAGGCAGCTGCCTGCCCGGACTCTCTCTACCCACTGGCCACGTGAGTTTTCTCCTTAATCCCCACCGCTAGAGAGAATGCATACACGAGGGGCCAGGAGGG
197 393 CAGCAAGAAGTCTATGTGCCCCAGGATCCTGGATTACCTGAGGAAGAAGAGATCAAGGAAAAAAAACCCACCAGTCAAGGAAAGTCAAGTAGCAAGAAGGAAATGTCTAAAAGAGATGGCAAGGAGAAAAAAGACAGAGGAGTGACGAGG 394 TTTCAGGAAAATGCCAGTGAAGGGAAGGCCCCTGCAGAAGACGTCTTTAAGAAGCCCCTGCCTCCTACTGTGAAGAAGGAAGAGAGTCCCCCTCCAGTAAGACCAACATTGATCCCCTGGACCTAGGGCTGGGGCTGGGGATGGTTCCGA
198 395 TTGCCTTGCTCTCCTTGGTAACCTAGTTCCTGTAACCTTGTGTTTTCCAGATTGGCCCCCGCCGCATCCACACAGTCCGTGTGCGGGGAGGTAACAAGAAATACCGTGCCCTGAGGTTGGACGTGGGGAATTTCTCCTGGGGCTCAGAGT 396 GTTGTACTCGTAAAACAAGGATCATCGATGTTGTCTACAATGCATCTAATAACGAGCTGGTTCGTACCAAGACCCTGGTGAAGAATTGCATCGTGCTCATCGACAGCACACCGTACCGACAGTGGTACGAGTCCCACTATGCGCTGCCCC
199 397 GACGTGGTGGGTCCTCTGGTGCGAAATTCCGGATTTCCTTGGGTCTTCCGGTAGGAGCTGTAATCAATTGTGCTGACAACACAGGTGAGGTCTTTGCACGTTGCTATACTCCCCCTTTTAAAAGCACTCAATGGGCCTGTGGCTAATGAC 398 ACGTAATAAGGCAGCGCCCAGAGGCGGAAGAGGCCGGTTTTTGCTCCGGCCACGTGAGGAGGGTGGGCGGGGCGTTAAAGTTCATATCCCAGTGTCCTTTGAATCGACTTCCTTTTTTCTTTTTTCCGGCGTTCAAGATGTCGAAGCGAG
200 399 GTCTGGAGGGTGAGCGACCTGCGAGACTCACAAGAGGGGAAGCTGACAGAGATACCTACAGACGGAGTGCTGTGCCACGTGAGTAAATGCATCACCTATATTAGGGGTGTTGGGGTGAAATGTCTGGATTCTCACAGCTGGCTCTGGCTG 400 TGAAGGAACAGTTTGCCTGGAGACATTTCTACTGGTACCTTACCAATGAGGGTATCCAGTATCTCCGTGATTACCTTCATCTGCCCCCGGAGATTGTGCCTGCCACCCTACGCCGTAGCCGTCCAGAGACTGGCAGGCCTCGGCCTAAAG
201 401 TCCCTTCGAAGTGAAGGTGGGCACCGAGTGTGGCAATCAGAAGGTACGGGCCTGGGGCCCTGGGCTGGAGGGCGGCGTCGTTGGCAAGTCAGCAGACTTTGTGGTGGAGGCTATCGGGGACGACGTGGGCACGCTGGGTAAGTTGGAGGC 402 GCCTGAGGCCCTCCTTGTCTTGGCAGAGGGAGAGGAGCGCGTGAAGCAGAAGGACCTGGGGGATGGCGTGTATGGCTTCGAGTATTACCCCATGGTCCCTGGAACCTATATCGTCACCATCACGTGGGGTGGTCAGAACATCGGGCGCAG
202 403 GACCACATGATACTGTTTTGAGATTTTATTTACTTTTACAATGGAAAGATTTGATGTTACTCTATTCTTAATTTAGGCACTCAGAATGGTCCAGCGTTTGACATACCGACGTAGGCTTTCCTACAATACAGCCTCTAACAAAACTAGGCT 404 GTCCCGAACCCCTGGTAATAGAATTGTTTACCTTTATACCAAGAAGGTTGGGAAAGCACCAAAATCTGCATGTGGTGTGTGCCCAGGCAGACTTCGAGGGGTAAGTGTACCTTTTACTGTGTGCAGCCTAACAAGTCTTGAACTTACTGA
203 405 GCTTGGTTTGCCAGTGCTGGTGTTGGGCGCACAGGAACCTATATCGGAATTGATGCCATGCTAGAAGGCCTGGAAGCCGAGAACAAAGTGGATGTTTATGGTTATGTTGTCAAGCTAAGGCGACAGAGATGCCTGATGGTTCAAGTAGAG 406 GCCCAGTACATCTTGATCCATCAGGCTTTGGTGGAATACAATCAGTTTGGAGAAACAGAAGTGAATTTGTCTGAATTACATCCATATCTACATAACATGAAGAAAAGGGATCCACCCAGTGAGCCGTCTCCACTAGAGGCTGAATTCCAG
204 407 GCACCTACAAAGGCAGCACCTAAGCAAAAGATTGTGAAGCCTGTGAAAGTTTCAGCTCCCCGAGTTGGTGGAAAACGCTAAACTGGCAGATTAGATTTTTAAATAAAGATTGGATTATAACTCTAGGTTGTGCTGGATTTTTTTTTTTTC 408 ACTTGTCCAGTACAGTCTAACTCTAATAATAAGTTGTACCACTAAGGAGTAAAGTGCTTTTGCCTTAAGTTACTTTTACCCCACAGGGCTGCTAAGGAAGCAAAAAAGGCTAAGCAAGCATCTAAAAAGACTGCAATGGCTGCTGCTAAG
205 409 AGATGGATGTGATGTCGGTGGCCACAATTGTCATAGTGGACATCTGCATCACTGGGGGCTTGCTGCTGCTGGTTTACTACTGGAGCAAGAATAGAAAGGCCAAGGCCAAGCCTGTGACACGAGGAGCGGGTGCTGGCGGCAGGCAAAGGG 410 GACAAAACAAGGAGAGGCCACCACCTGTTCCCAACCCAGACTATGAGGTAACGTGGGATAGAAATGGGCCAGGACGCTGGAGGGGATGTCCCTCCAGGGGGGAAGGAAACAGATGGGATGGCCCATCTTGTCTGCCAGATGCCTCAAAGC
206 411 TTAGCCATTTCTATGGATTTGGTTTGGTGGACGCAGAAGCTCTCGTTGTGGAGGCAAAGAAGTGGACAGCAGTGCCATCGCAGCACATGTGTGTGGCCGCCTCGGACAAGAGACCCAGGTAAGGCTCTGCTGTGGCATCGGTGACTTCTC 412 CCGTTGTTGAGCTGTGTGGACTCTAGGGTGTGTTGTGTCATTGCAGCAGCCAGTTAACCTGGAGGGACGTCCAGCACCTGCTAGTGAAGACATCCCGGCCGGCCCACCTGAAAGCGAGCGACTGGAAAGTGAACGGCGCGGGTCATAAAG
207 413 CTGCGGCCGCTGGCAGCGCTGGCCCTGGTCCTGGCGCTGGCCCCGGGGCTGCCCACAGCCCGGGCCGGGCAGACACCGCGCCCTGCCGAGCGGGGGCCCCCAGTGCGGCTTTTCACCGAGGAGGAGCTGGCCCGCTATGGCGGGGAGGAG 414 GAAGATCAGCCCATCTACTTGGCAGTGAAGGGAGTGGTGTTTGATGTCACCTCCGGAAAGGGTAAGTGGTGTGGCATTTTGAATCTTCATTTCCAGGGAGCACAGAAGCCAGAGTGAGCAGCACTTGGAGGTGTGAGGAAAGGGAGGGAA
208 415 CGGCTTTGATTCAGCAAGCCACAACAGTTAAAAACAAGGATATCAGGAAATTTTTGGATGGTATCTATGTCTCTGAAAAAGGAACTGTTCAGCAGGCTGATGAATAAGATCTAAGAGGTAAGTTCTTACAGTGTCTTAAGTTTTATTACT 416 TAGTGCCTCTGCAATTTAAATATTTTTTACACAGATTTGATGCTGTGCAAATGCCCTCTCCCCTTTTAGGTGTTGCTTGTTCAGTATCTCAAGCCCAGAAAGATGAATTAATCCTTGAAGGAAATGACATTGAGCTTGTTTCAAATTCAG
209 417 CCTCCTCCTTACAGGGAGCAGATAGCAGGGACTTACAGATGAACCAGGCCCTGCGATTTTTGGAAAATGAGCACCAGCAACTGCAGGCCAAGATTGAATGCCTGCAAGGGGACAGAGACCTGTGCAGCTTGGATACCCAGGACCTACAAG 418 ATCAACTAAAAAGGTCAGAGGCAGAGAAACTCACCCTGGTGACCAGAGTACAGCAGTTGCAGGGTAAGTTCGCTTTCCAGATTCTGAAAGTCCACAGGGTTTTCCTGGGGTCCTGGCCCACAAAAGGCACCCAGAGTAGGGACTAAGGGC
210 419 GTATGCCTGTGTCAAGATGAGGTCACGGACGATTACATCGGAGACAACACCACAGTGGACTACACTTTGTTCGAGTCTTTGTGCTCCAAGAAGGACGTGCGGAACTTTAAAGCCTGGTTCCTCCCTATCATGTACTCCATCATTTGTTTC 420 GGGAGGAAAGTTCCCAACAGCGTCTCCCCCTCCACTGCTTTCTTTAATAACAAAGACTTGTCCCTGCCAAGCAATAACTTTCTCGCCTTGTCTCCTACAGGGAAACCAATGAAAAGCGTGCTGGTGGTGGCTCTCCTTGTCATTTTCCAG
211 421 GTGATGAGACCCGAAATGTAGGCTCCCAAACTTTACAAACCTTCAAGGCCCGCCAAGGACTGGGGGCGTCGGTCGTCAGCTGGAGCGACGTCATTGTGGTGGGCCCCGCGGTACAGGGCACAGGGAACAATCGGGGGCAGGGACACCTGG 422 GCGGCGCTCACCCAGCTTTCCTATGCAGAGTGGCCATCGTGGTGGGCGCCCCGCGGACCCTGGGCCCCAGCCAGGAGGAGACGGGCGGCGTGTTCCTGTGCCCCTGGAGGGCCGAGGGCGGCCAGTGCCCCTCGCTGCTCTTTGACCTCC
212 423 GTGAAGGCACGTGGGCCTGGATTGGAGAAGACAGGTGTGGCCGTCAACAAGCCAGCAGAGTTCACAGTGGATGCCAAGCACGGTGGCAAGGCCCCACTTCGGGTCCAAGTCCAGGTAGAGCACCCACGGGTGTTGGGGGCAGGGCAGGTG 424 GACAAGGGCGACGGCTCCTGTGATGTGCGCTACTGGCCGCAGGAGGCTGGCGAGTATGCCGTTCACGTGCTGTGCAACAGCGAAGACATCCGCCTCAGCCCCTTCATGGCTGACATCCGTGACGCGCCCCAGGACTTCCACCCAGACAGG
213 425 ATTTTATTATAGGTTTTGTATTATAGCTTTTAGTTTGGTGATAGAACAGCTCTTGTTCATGAGTACGTATCTTTTCTTTTAAAAGAAAAAAGTAAAACTTGCTGCTGATGAAGATGATGACGATGATGATGAAGAGGATGATGATGAAGA 426 TGATGATGATGATGATTTTGATGATGAGGAAGCTGAAGAAAAAGCGCCAGTGAAGAAAGTGAGTAGATACAATGCTACAAGGTTGTTAAACTAACAATAGAAATGGTGATTTTTTAGTGCTATTTGCTTGTTTTGTAGTTAAGGGAAGCT
214 427 CCTAGATATTATCCTACTGAAGATGTGCCTCGAAAGCTGTTGAGCCACGGCAAAAAACCCTTCAGTCAGCACGTGAGAAAACTGCGAGCCAGCATTACCCCCGGGACCATTCTGATCATCCTCACTGGACGCCACAGGGGCAAGGTGAGA 428 CTTAACCTTAATTGGCATTCTCTTACTGTTGATGCATTTGTGTCCTTGTAGGTTGAAAAGAAAAAGAAGGAGAAGGTTCTCGCAACTGTTACAAAACCAGTTGGTGGTGACAAGAACGGCGGTACCCGGGTGGTTAAACTTCGCAAAATG
215 429 TAAAATGTTTATTGGAGGCTTGAGCTGGGATACAAGCAAAAAAGATCTGACAGAGTACTTGTCTCGATTTGGGGAAGTTGTAGACTGCACAATTAAAACAGATCCAGTCACTGGGAGATCAAGAGGATTTGGATTTGTGCTTTTCAAAGA 430 CGCCGCCGCTGCTGCCGCGACCCGGACTGCGCGCCAGCACCCCCCTGCCGACAGCTCCGTCACTATGGAGGATATGAACGAGTACAGCAATATAGAGGAATTCGCAGAGGGATCCAAGATCAACGCGAGCAAGAATCAGCAGGATGACGG
216 431 GTTGCTGGATCTTTCCAATGAAGGGTTTACAAACTGGGAATTCATGACTGTCCACTGCTGGGGAGAAAAGGCTGAAGGGCAGTGGACCTTGGAAATCCAAGATCTGCCATCCCAGGTCCGCAACCCGGAGAAGCAAGGTCAGTGGCTCTT 432 GACCAGCGCCTGCGCGGAGCACTCGGACCAGCGGGTGGTCTACTTGGAGCACGTGGTGGTTCGCACCTCCATCTCACACCCACGCCGAGGAGACCTCCAGATCTACCTGGTTTCTCCCTCGGGAACCAAGTCTCAACTTCTGGCAAAGAG
217 433 GGGGACTCTGGAGGCCCTCTTGTGTGTAACAAGGTGGCCCAGGGCATTGTCTCCTATGGACGAAACAATGGCATGCCTCCACGAGCCTGCACCAAAGTCTCAAGCTTTGTACACTGGATAAAGAAAACCATGAAACGCTACTAACTACAG 434 GCCCCCCTGGGAAAACACTCACACACACTACAAGAGGTGAAGATGACAGTGCAGGAAGATCGAAAGTGCGAATCTGACTTACGCCATTATTACGACAGTACCATTGAGTTGTGCGTGGGGGACCCAGAGATTAAAAAGACTTCCTTTAAG
218 435 AGATTATAATTCTCTGCTGAGATTTGAGTTGGATTTGAGGATTTGGAGAATCCCTGCAGCTTTGTAACTTCAGAGGTGTAATTAGCTGAAAACATCATCGTTTTGAAGAGTTCTGCGTTTTGCCAGTCACCTCTCAACTGTGTGCCAAAG 436 AAGGACTCCATGAAAGATGACAGAAGAAGTTATTGTGATAGCCAAGTGGGACTACACCGCCCAGCAGGACCAGGAGCTGGACATCAAGAAGAACGAGCGGCTGTGGTTGCTGGACGACTCCAAGACGTGGTGGCGGGTGAGGAACGCGGC
219 437 AGAAAACAACTGAGGCCAAGATGATGAAAGCTGGGGGCACTGAAATAGGAAAGACACTTGCAGAAAAGAGCCGAGGCCTATTTAGTGCTAATGACTGGCAATGTAAAACGTATGTTTTTTAAATTATTGTCTGCTCTTTCTTCCAAAATA 438 TTAGAAGTTATGAATTCCAGATATGTAGTGAGGACAAGTTAAAATGTAAAATTTTACAAATTTAAATTTTTATAAATGCTTTTTAATCTGTTTTTAGATGTGGAAATGTAAACTTTGCTAGAAGAACCAGCTGTAATCGATGTGGTCGGG
220 439 CTTCTACAGAGATAACAATTATTTTGCTTTTCAGAAGGACGCATGCTGTTTCTTAGGGACACGGCTGACTTCCAGATATGACCATGTATTTGTGGCTTAAACTCTTGGCATTTGGCTTTGCCTTTCTGGACACAGAAGTATTTGTGACAG 440 GGCAAAGCCCAACACCTTCCCCCACTGGTAAGAATTAATATTTATATTTTTACTAATTTTATTTTCTTGTTGCAAAGTTTATATATTTAACTACAATTTTCTATTATTAACACTGAAATTATTTTTAAGGATAAATTTTATAATCATGAG
221 441 AATTTCGCTAAGGAGTTTGTGATCAGTGATCGGAAGGAGCTGGAGGAAGATTTCATCAAGAGCGAGCTGAAGAAGGCGGGGGGAGCCAATTACGACGCCCAGACGGAGTAACCCCAGCCCCCGCCACACCACCCCTTGCCAAAGTCATCT 442 CGGTTGTTTGCCTTCGTGCGCTTCACCACCGGGGATGCCATGAGCAAGAGGTCCAAGTTTGCCCTCATCACGTGGATCGGTGAGAACGTCAGCGGGCTGCAGCGCGCCAAAACCGGGACGGACAAGACCCTGGTGAAGGAGGTCGTACAG
222 443 GTGAAGGCGTTTGGGCCGGGGCTGCAGGGAGGCAGTGCGGGCTCCCCCGCCCGCTTCACCATCGACACCAAGGGCGCCGGCACAGGTGGCCTGGGCCTGACGGTGGAGGGCCCCTGTGAGGCGCAGCTCGAGTGCTTGGACAATGGGGAT 444 GTGGAGCCAGGCCTGGGGGCTGACAACAGTGTGGTGCGCTTCCTGCCCCGTGAGGAAGGGCCCTATGAGGTGGAGGTGACCTATGACGGCGTGCCCGTGCCTGGCAGCCCCTTTCCTCTGGAAGCTGTGGCCCCCACCAAGCCTAGCAAG
223 445 ATGGTCATCTTTAAGGTACCTGATTGCATGCACTTAAATGCAGATTATTTTGGAGTTTGAAAAGGGACTATTAATGAAATCTTTCTTTTCCCTCCTTTCTCTTTTTCCCTTCCCCGCCACTGATTCAGTGAGCTGGAGATTGGATCACAG 446 CCGAAGGAGTAAAGGTGCTGCAATGATGTTAGCTGTGGCCACTGTGGATTTTTCGCAAGAACATTAATAAACTAAAAACTTCATGTGTCTGGTTGTTTGAAATGTATTTGCAGTTTCCTGGGACTGCTAGGAGGTTAGTCTGCTGATTTC
224 447 GACTATCCATCCCTTGCCTTGCTTGGAGAGAAATTGGCAGAGAACAACATCAACCTCATCTTTGCAGTGACAAAAAACCATTATATGCTGTACAAGGTATGCTGGGAGGGAGGGAGGCTAGTGATTTGTGGGGTGAAGTGGGTGGTGAGG 448 TGGCGAAAGGATGCACTGCATTTGCTGGTGTTCACAACAGATGATGTGCCCCACATCGCATTGGATGGAAAATTGGGAGGCCTGGTGCAGCCACACGATGGCCAGTGCCACCTGAACGAGGCCAACGAGTACACTGCATCCAACCAGATG
225 449 ATGTGGATGAGGCTTCCAAGAAGGAGATCAAAGACATCCTCATCCAGTATGACCGGACCCTGCTGGTAGCTGACCCTCGTCGCTGCGAGTCCAAAAAGTTTGGAGGCCCTGGTGCCCGCGCTCGCTACCAGAAATCCTACCGATAAGCCC 450 ATTTATGGTGAGTCCCAGGAACTGGGCGCATGGAGGAGGTGGCTCTGGGAGGGAGGCCTTCACAGCGCTCCTGTACCCTTTAATTGTGTGTCTTTCTCACAGCTATCCGTCAGTCCATCTCCAAAGCCCTGGTGGCCTATTACCAGAAAT
226 451 AGCCTCCCAGGCTGGGCAGCTGCTCTGGTCTCACCTCTCTGCTTTCTGTAGGTATTGGCAAGCTTGCCAGTGTACCTGCTGGTGGGGCTGTAGCCGTCTCTGCTGCCCCAGGCTCTGCAGCCCCTGCTGCTGGTTCTGCCCCTGCTGCAG 452 CAGAGGAGAAGAAAGATGAGAAGAAGGAGGAGTCTGAAGAGTCAGATGATGACATGGGATTTGGCCTTTTTGATTAAATTCCTGCTCCCCTGCAAATAAAGCCTTTTTACACATCTCTCAAGTATTCCATGAGCACTTTGTCAAGGGTGG
227 453 GATGTTGTCTACAATGCATCTAATAACGAGCTGGTTCGTACCAAGACCCTGGTGAAGAATTGCATCGTGCTCATCGACAGCACACCGTACCGACAGTGGTACGAGTCCCACTATGCGCTGCCCCTGGGCCGCAAGAAGGGAGCCAAGCTG 454 ACTCCTGAGGAAGAAGAGATTTTAAACAAAAAACGATCTAAAAAAATTCAGAAGAAATATGATGAAAGGAAAAAGAATGCCAAAATCAGCAGTCTCCTGGAGGAGCAGTTCCAGCAGGGCAAGCTTCTTGGTGAGAAGGCTGTTGTGTTG
228 455 GTTACTGTGCTCTTTGCTGGCCAGCACATCGCCAAGAGCCCCTTCGAGGTGTACGTGGATAAGTCACAGGGTGACGCCAGCAAAGTGACAGCCCAAGGTCCCGGCCTGGAGCCCAGTGGCAACATCGCCAACAAGACCACCTACTTTGAG 456 CAGAGGCCCCGCAGCGCTCCCTTTCAGTGGGGCTGCTCTTAGCAAAGGCTCACAGGCTCCTTCCCACTGCAGGCAAAAGTGACCGCCAATAACGACAAGAACCGCACCTTCTCCGTCTGGTACGTCCCCGAGGTGACGGGGACTCATAAG
229 457 ACTTAATAATTTTTTAAAATGTAGAACAAGTGTGCAGAATACTGGCCGTCAATGGAAGAGGGCACTCGGGCTTTTGGAGATGTTGTTGTAAAGATCAACCAGCACAAAAGATGTCCAGATTACATCATTCAGAAATTGAACATTGTAAAT 458 AAAAAAGAAAAAGCAACTGGAAGAGAGGTGACTCACATTCAGTTCACCAGCTGGCCAGACCACGGGGTGCCTGAGGATCCTCACTTGCTCCTCAAACTGAGAAGGAGAGTGAATGCCTTCAGCAATTTCTTCAGTGGTCCCATTGTGGTG
230 459 GCTATCAAAGGAGGCTGACTTTGTACTATCTGATATGCATGTGTTTGTGGCCTGTGAGTCTGTGATGTAAGGCTCAATGTCCTTACAAAGCAGCATTCTCTCATCCATTTTTCTTCCCCTGTTTTCTTTCAGACTGTGGCTTCACCTCCG 460 AGTCTTACCAGCAAGGGGTCCTGTCTGCCACCATCCTCTATGAGATCTTGCTAGGGAAGGCCACCTTGTATGCCGTGCTGGTCAGTGCCCTCGTGCTGATGGCCATGGTAAGGAGGAGGGTGGGATAGGGCAGATGATGGGGGCAGGGGA
231 461 GCCTGGTGGAGCCAGTGGACGTGGTAGACAACGCTGATGGCACCCAGACCGTCAATTATGTGCCCAGCCGAGAAGGGCCCTACAGCATCTCAGTACTGTATGGAGATGAAGAGGTACCCCGGAGGTAAGAGGCAGGGCCTGCTGCCTGTG 462 TGCATGATGTGACAGATGCGTCCAAGGTCAAGTGCTCTGGGCCCGGCCTGAGCCCAGGCATGGTTCGTGCCAACCTCCCTCAGTCCTTCCAGGTGGACACAAGCAAGGCTGGTGTGGCCCCATTGCAGGTCAAAGTGCAAGGGCCCAAAG
232 463 CCCTCTCCCAGAGACTACAGAGAACGTGGTGTGTGCCCTGGGCCTGACTGTGGGTCTGGTGGGCATCATTATTGGGACCATCTTCATCATCAAGGGATTGCGCAAAAGCAATGCAGCAGAACGCAGGGGGCCTCTGTAAGGCACATGGAG 464 GTGATGGTGTTTCTTAGAGAGAAGATCACTGAAGAAACTTCTGCTTTAATGGCTTTACAAAGCTGGCAATATTACAATCCTTGACCTCAGTGAAAGCAGTCATCTTCAGCATTTTCCAGCCCTATAGCCACCCCAAGTGTGGATATGCCT
233 465 AATGTTTTACATTGTGATATATAATATATATATATATATAAATTCACATTAGCAAACTAATTATTTTATTTTTTGTTACTGAAATTCAGGCCTATTTTCACAATGGAGACTATCCTGGAGAACCCTTTATTTTACATCATTCAACATCTT 466 ATAATTCTAAGGCACTGATAGCATTTCTGGCATTTCTGATTATTGTGACATCAATAGCCCTGCTTGTTGTTCTCTACAAAATCTATGATCTACATAAGAAAAGATCCTGGTAAGAGTTGATTTTAAATTTTTAAATAATAATGGTATTAG
234 467 GACAATGAAGGCTGCCCTGTGGAGGCGTTGGTCAAGGACAACGGCAATGGCACTTACAGCTGCTCCTACGTGCCCAGGAAGCCGGTGAAGCACACAGCCATGGTGTCCTGGGGAGGCGTCAGCATCCCCAACAGCCCCTTCAGGGTGAGC 468 ACCTGGCCCCCTGACAGCTGGGTGGTCTCCCGCTAGGTGAAGGCACGTGGGCCTGGATTGGAGAAGACAGGTGTGGCCGTCAACAAGCCAGCAGAGTTCACAGTGGATGCCAAGCACGGTGGCAAGGCCCCACTTCGGGTCCAAGTCCAG
235 469 AAGTGTAGGCCTCCCAGGGACCGTAATGGCCCCCATGAACGTTACCATTTGGAAGTTGAAGCTGGAAATACTCTGGTTAGAAATGAGTCGCATAAGAATTGCGATTTCCGTGTAAAAGATCTTCAATATTCAACAGACTACACTTTTAAG 470 GCCTATTTTCACAATGGAGACTATCCTGGAGAACCCTTTATTTTACATCATTCAACATCTTGTAAGTTATCACTGGGCTATTTATTATATATATTAAGATATATATTAATGCTTATAAAGCTATATTATTTTACACTTATAATCACATTT
236 471 TGCATGTAAACCCACGCTTACGTCTCTTCCTTCCTTCCCACTACAGAGTTTTATGGACGAGGAGCCCCCTACAATGCCTTGACGGGGAAGGACTCCACTAGAGGGGTAGCCAAGATGTCCTTGGATCCTGCAGACCTCACCCATGACACT 472 ACGGGTCTCACGGCCAAGGAACTGGAGGCCCTGGATGAGGTCTTCACCAAAGTGTACAAAGCCAAATACCCCATCGTCGGCTACACTGCCCGGAGAATTCTCAATGAGGATGGCAGCCCTAACCTGGACTTCAAGCCTGAAGACCAGCCC
237 473 GCTGGAGGACCGCAGTCTGTCCTTCTAGCCTGACCCCTGCTGTCTTCCTAGGCCATCTGGCTGCTGTGCACAGGCGCTCGTGAGGCTGCCTTCCGGAACATTAAGACCATTGCTGAGTGCCTGGCAGATGAGCTCATCAATGCTGCCAAG 474 GGCTCCTCGAACTCCTATGCCATTAAGAAGAAGGACGAGCTGGAGCGTGTGGCCAAGTCCAACCGCTGATTTTCCCAGCTGCTGCCCAATAAACCTGTCTGCCCTTTGGGGCAGTCCCAGCCACCTGTGCTGTTGTCTGTCTTCGGTGGG
238 475 GAGGAGATGTTAAAGTAACCCATCTTGCAGGACGACATTGAAGATTGGTCTTCTGTTGATCTAAGATGATTATTTTGTAAAAGACTTTCTAGTGTACAAGACACCATTGTGTCCAACTGTATATAGCTGCCAATTAGTTTTCTTTGTTTT 476 TGTAAAGAAAGTTTTGTAGAAAACTATCTTAATGAGAATTCTGTGTTTTCAAAATAGGCCAACAGAGCACTTATGGCAAGGCATCTCGAGGGGGTGGCAATCACCAAAACAATTACCAGCCATACTAAAGGAGAACATTGGAGAAAACAG
239 477 ACACGGCACTCGTTGTGCGGGAGAAGTTGCTGCTTCAGCAAACAATTCCTACTGCATCGTGGGCATAGCGTACAATGCCAAAATAGGAGGTAAGGCCGGGCGTGGCAGCCTGCGAGCCGAGGGGCCTGGGGCAGGGGCAGCTGGGAGCTC 478 GGAACATAAAATCCATTTCAAACAGAGCTGTCACATGCCATTTCTCCTCACTCACCACGATTCCATTTCTTAGGATTCCTACGCCAGCTACGACGTGAACGGCAATGATTATGACCCATCTCCACGATATGATGCCAGCAATGAAAATAA
240 479 GACCTCTGGTCCTCAATCGAGTTCCTCTACGAAGAACACACCAGAAATTTGTCATTGCCACTTCAACCAAAATCGATATCAGCAATGTAAAAATCCCAAAACATCTTACTGATGCTTACTTCAAGAAGAAGAAGCTGCGGAAGCCCAGAC 480 GTAGAAATTTCCTTTACCCAAATTTAGATGCCTGTGATTTTATGAATTCAGAAGTCAGTTTTTAATTGCAGAAAACTAATTATTTTCTTTTTAACTTACAGAGGGTGGTTTTCCTGAAGCAGCTGGCTAGTGGCTTATTACTTGTGACTG
241 481 GACACTCTGGACTTCAGCCAACAGGTAATACCTTTTAATCCTCTTTTAGAAACAGACACAGTTTCCCTAGTGAGAGGTGAAGCCAGCTGGACTTCTGGGTGGGGTGGGGACTTGGAGAACTTTTCTTACAAGAGGTTTTTTTTTGTTTTT 482 TTTGGAATAAACATCACTAAACCTGGCTTCCTCTCTCAGGAGCACGGTCTGAATCTGCACAGAGCAAGATGCTGAGTGGAGTCGGGGGCTTTGTGCTGGGCCTGCTCTTCCTTGGGGCCGGGCTGTTCATCTACTTCAGGAATCAGAAAG
242 483 GCCTGGAGTGGTGTGTCTAAGGGACTGGCTGAGAGTCTGCAGCCAGACTACAGTGAACGACTCTGCCTCGTCAGTGAGATTCCCCCAAAAGGAGGGGCCCTTGGGGAGGGGCCTGGGGCCTCCCCATGCAACCAGCATAGCCCCTACTGG 484 TTTCATATGGGACAACTGGGAGAAGGGTGATAAAAAAGCTTTAACCTATGTGCTCCTGCTCCCTCTTTCTCCCCTGTCAGGACGATGCCCCGAATTCCCACCCTGAAGAACCTAGAGGATCTTGTTACTGAATACCACGGGAACTTTTCG
243 485 GCTGGGACAAGCGTTACTGTGAAGCGGGCTTCAGCTCCGTGGTCACTCAGGCGAGTAGGGAGCAAAAGCGCAGTGGGGGCGGCTCCCAAACAGGGCCCCCTCTCACCCTCAGGACTTCCCTTCCAGGCCGGAGAGCTGGTGCTTGGGGCT 486 AGCACTGGAACGTCCTAGAAAAGACTGAGGAGGCTGAGAAGACGCCCGTAGGTAGCTGCTTTTTGGCTCAGCCAGAGAGCGGCCGCCGCGCCGAGTACTCCCCCTGTCGCGGGAACACCCTGAGCCGCATTTACGTGGAAAATGATTTTA
244 487 TCTCACAGAAAGTTCTCCGCTCCCAGACATGGGTCCCTCGGCTTCCTGCCTCGGAAGCGCAGCAGCAGGCATCGTGGGAAGGTGAAGAGCTTCCCTAAGGATGACCCGTCCAAGCCGGTCCACCTCACAGCCTTCCTGGGATACAAGGCT 488 GCGTGGAAATGGCGCTCGGTACGTGCCCCCGACCTGTCGTCTGCCGCGGGGGCGCGCTCGCACGCCGGAAGGGGCGGGGCCAGATTTGGCTTTATATAGCGGACCCGTAAGGCCGACCGGCCTCTACCGGCGGGATTTGATGGCGTGATG
245 489 AAGAAAAGCAGCAAACAGAAAGGGTTACAAAAGAGATGAATGAATTTATCCATAAAGAGCAAAATAGTTTATCACTACTAGAAGCAAGAGAAGCAGACGGTGATGTGGTTAATGAAAAGAAGAGAACTCCAAATGAAACCACATCAGTTT 490 CAGGAGACAGTGAAGATGAGAGGAGTGACAGAGGATCTGAGTCATCTGACACTGATGATGAAGAATTACGGCATCGAATCCGGCAAAAACAGGAAGCTTTTTGGAGAAAAGAAAAAGAACAGCAGCTATTACATGATAAACAGATGGAAG
246 491 ATTTCCCATGAGCACCCACAGGCGTGCACGCAGCGCAGCCCTCCGTCGTCGCTCGCGCCCTTTATACTCACTTCCGCCCGCGAGCCACTTCCTTTCCTTTCAGCGGAGCGCGGCGGCAAGATGGCAGTGCAAATATCCAAGAAGAGGAAG 492 TTTGTCGCTGATGGCATCTTCAAAGCTGAACTGAATGAGTTTCTTACTCGGGAGCTGGCTGAAGATGGCTACTCTGGAGTTGAGGTGCGAGTTACACCAACCAGGACAGAAATCATTATCTTAGCCACCAGGTAAAACTCATTTGACTGG
247 493 TAAATGTTAATGAGAATGTGGAATGTGGAAACAATACTTGCACAAACAATGAGGTGCATAACCTTACAGAATGTAAAAATGCGTCTGTTTCCATATCTCATAATTCATGTACTGCTCCTGATAAGACATTAATATTAGATGTGCCACCAG 494 GGGTTGAAAAGTTTCAGTTACATGATTGTACACAAGTTGAAAAAGCAGATACTACTATTTGTTTAAAATGGAAAAATATTGAAACCTTTACTTGTGATACACAGAATATTACCTACAGATTTCAGTGTGGTAAGAATATAACATTGACCA
248 495 ATCAAGACACAGCCATCCGGGTCTTCGCCATCCCCCCATCCTTTGCCAGCATCTTCCTCACCAAGTCCACCAAGTTGACCTGCCTGGTCACAGACCTGACCACCTATGACAGCGTGACCATCTCCTGGACCCGCCAGAATGGCGAAGCTG 496 AGGCCAAAGAGTCTGGGCCCACGACCTACAAGGTGACCAGCACACTGACCATCAAAGAGAGCGACTGGCTCGGCCAGAGCATGTTCACCTGCCGCGTGGATCACAGGGGCCTGACCTTCCAGCAGAATGCGTCCTCCATGTGTGTCCCCG
249 497 GCTACATCCACGTGACGCAGACCTTCAGCATTATGGCTGTTCTGTGGGCCCTGGTGTCCGTGAGCTTCCTGGTCCTGTCCTGCTTCCCCTCACTGTTCCCCCCAGGCCACGGCCCGCTTGTCTCAACCACCGCAGCCTTTGCTGCAGGTA 498 TCTGCCGGTCCCTGGCCCTGCTGGGGGGCTCCCTGGGCCTGATGTTCTGCCTGATTGCTTTGAGCACCGATTTCTGGTTTGAGGCTGTGGGTCCCACCCACTCAGCTCACTCGGGCCTCTGGCCAACAGGGCATGGGGACATCATATCAG
250 499 AGCTGAATGGTGAAACAAATACACCCATTGAAGGAAACCAGGCGGGTGATGCAGCTGCCTCTGCCAGGAGTCTACCAAATGAAGAAATAGTGCAGAAGATAGAGGAAGTACTTTCTGGGGTCTTAGATACAGAACTACGATATAAGCCAG 500 ACTTGAAAGAGGGCTCCAGAAAAAGTAGATGCGTATCTGTACAAACAGATCCTACTGATGAAATTCCCACTAAAAAGTCAAAGAAGCATAAAAAGCACAAAAACAAAAAGAAGAAAAAGAAGAAAGAAAAGGAAAAAAAATATAAAAGAC
251 501 ATATCCCAGAAGAAACTGAAGAAACAAAAACTTATGGCACGGGAGTAAATTCAGCATTAAAATAAATGTAATTAAAAGGAAAAGAATGTTGGTTGTCTTTATTAGTGAACATATTTCAAGTGTCCTTACAAGATGGATCAAATGAGGATT 502 AACAAAGCACCTAAGATGCGCCGCCGGACCTACAGAGCTCATGGTCGGATTAACCCATACATGAGCTCTCCCTGCCACATTGAGATGATCCTTACGGAAAAGGAACAGATTGTTCCTAAACCAGAAGAGGAGGTTGCCCAGAAGAAAAAG
252 503 TCTCCTTCCGCCTGCGGAGGGGAAGCTGAAGTCTGGTCTTCCTCAGGTCTGGTCTTCTCTCGTCTGAGCCCTGAGTACTACGACCTGGCAAGAGCCCACCTGCGTGATGAGGAGAAATCCTGCCCGTGCCTGGCCCAGGAGGGCCCCCAG 504 GGTGACCTGTTGACCAAAACACAGGAGCTGGGCCGTGACTACAGGACCTGTCTGACGATAGTCCAAAAACTGAAGAAGATGGTGGATAAGCCCACCCAGGTGAGGCCAAGGGGCTACAGAGCCTCCTGTCTGCTGCTCAATGGAGGGGCC
253 505 AAATTAGCATCCAGGATATGACAGCCCAGGTGACCAGCCCATCGGGCAAGACCCATGAGGCCGAGATCGTGGAAGGGGAGAACCACACCTACTGCATCCGCTTTGTTCCCGCTGAGATGGGCACACACACAGTCAGCGTGAAGTACAAGG 506 GGCGTGGGCCGTGCTTTCTTCCTGCAGGCAGCCCCTTCTCTGTGAAGGTGACAGGCGAGGGCCGGGTGAAAGAGAGCATCACCCGCAGGCGTCGGGCTCCTTCAGTGGCCAACGTTGGTAGTCATTGTGACCTCAGCCTGAAAATCCCTG
254 507 CAGCTGGCCGACGTTGCGGAGAAATGGTGCTCCAACACGCCCTTCGAGCTCATCGCCACCGAGGAGACCGAACGCAGGATGGATTTCTACGCCGACCCCGGCGTCTCCTTCTATGTGCTGTGTCCGGACAACGGCTGCGGCGACAATTTT 508 TTACTGGGGCTTCCGGATGCAGATGACGATGCGTTTGAAGAGTACAGTGCTGACGTGGAAGAAGAGGAGCCAGAGGCGGACCACCCCCAGATGGGGGTCAGCCAGCAGTAAATCTGGGGGCTCCCCTGAGAAGGAGAGTGAGCCCCACAG
255 509 AGGGAGAGGAGCGCGTGAAGCAGAAGGACCTGGGGGATGGCGTGTATGGCTTCGAGTATTACCCCATGGTCCCTGGAACCTATATCGTCACCATCACGTGGGGTGGTCAGAACATCGGGCGCAGGTGAGGCCCCCAGGCATCCCTCTCCC 510 CTCTGCCTGCAGCCTGTAACCCGAGTGCCTGCCGGGCGGTTGGCCGGGGCCTCCAGCCCAAGGGTGTGCGGGTGAAGGAGACAGCTGACTTCAAGGTGTACACAAAGGGCGCTGGCAGTGGGGAGCTGAAGGTCACCGTGAAGGGCCCCA
256 511 AGGCTGCTGCTGAGAAGGCAGTGACCAAGGAGGAATTTCAGGGTGAATGGACTGCTCCCGCTCCTGAGTTCACTGCTACTCAGCCTGAGGTTGCAGACTGGTCTGAAGGTGTACAGGTGCCCTCTGTGCCTATTCAGCAATTCCCTACTG 512 AAGACTGGAGCGCTCAGCCTGCCACGGAAGACTGGTCTGCAGCTCCCACTGCTCAGGCCACTGAATGGGTAGGAGCAACCACTGACTGGTCTTAAGCTGTTCTTGCATAGGCTCTTAAGCAGCATGGAAAAATGGTTGATGGAAAATAAA
257 513 CAGCATCTATTACTAATTTCCATCCTAAGTACTGAGTTCATTAAGTCTTGGGTTCCTTTATTTTGGCTTGCATTATTGCATTTTCAGATCAACTAAAAAGGTCAGAGGCAGAGAAACTCACCCTGGTGACCAGAGTACAGCAGTTGCAGG 514 GTTTGCTTCAAAATCAATCCTTACAGCTTCAAGAACAGGAGAAACTCTTAACAAAGAAAGGTCAGCAAATTTATTACCACAAATTCTAAGATATTGCTCTTCTCTTACCTGCCTAGAGGCAGCGGGATGGACTACATGACCTCCTGGAGT
258 515 GGGACGTCAGCATCGGCATCAAGTGTGCCCCTGGAGTGGTAGGCCCCGCCGAAGCTGACATCGACTTCGACATCATCCGCAATGACAATGACACCTTCACGGTCAAGTACACGCCCCGGGGGGCTGGCAGCTACACCATTATGGTCCTCT 516 CTTGCCCTTGCCCCTGTGCCCTGCAGGTGAATGTGGGAGCTGGCAGCCACCCCAACAAGGTCAAAGTATACGGCCCCGGAGTAGCCAAGACAGGGCTCAAGGCCCACGAGCCCACCTACTTCACTGTGGACTGCGCCGAGGCTGGCCAGG
259 517 CTCCGGGTTGACAAATGGTGGGGTAACAGAAAGGAACTGGCTACCGTTCGGACTATTTGTAGTCATGTACAGAACATGATCAAGGGTGTTACACTGGTAAGCAGATGTATCAGACTTCCTTGTTTTGGAAAGGGAGGTTTCTCAAACCTG 518 TTGTGTGGCCTGACGAGTGTGTTCTCTCTTCTAGTCGACATTACTCTGAAGGGACGCACAGTTATCGTGAAGGGCCCCAGAGGAACCCTGCGGAGGGACTTCAATCACATCAATGTAGAACTCAGCCTTCTTGGAAAGAAAAAAAAGAGG
260 519 CATCCACTGCTGCCTCTGTTCTCTCCCCAGGCTGTCCAGATTATGAATGGGCTCTTCCACATTGCCCTGGGGGGTCTTCTGATGATCCCAGCAGGGATCTATGCACCCATCTGTGTGACTGTGTGGTACCCTCTCTGGGGAGGCATTATG 520 TATATTATTTCCGGATCACTCCTGGCAGCAACGGAGAAAAACTCCAGGAAGTGTTTGGCAAGTAACCATATGTCCTTCTTTCCCACATGTCAGAGAAGTACCTATTTTTTTCGGTTAAAAACTGAGACCCTTAAAAAGCCAAGGTATCAC
261 521 GGGGTATGATGGCATCTGACTCCTTGTTACCCACTTCCTGCAGCTAGATACACTGTCAGATCCTTTGGCATCCGGAGAAATGAAAAGATTGCTGTCCACTGCACAGTTCGAGGGGCCAAGGCAGAAGAAATCTTGGAGAAGGGTCTAAAG 522 GTGCGGGAGTATGAGTTAAGAAAAAACAACTTCTCAGATACTGGAAACTTTGGTTTTGGGATCCAGGAACACATCGATCTGGGTATCAAATATGACCCAAGCATTGGTATCTACGGCCTGGACTTCTATGTGGTATGAATATTTAATCTT
262 523 AAAAGCAACTGGAAGAGAGGTGACTCACATTCAGTTCACCAGCTGGCCAGACCACGGGGTGCCTGAGGATCCTCACTTGCTCCTCAAACTGAGAAGGAGAGTGAATGCCTTCAGCAATTTCTTCAGTGGTCCCATTGTGGTGCACTGCAG 524 TGCTGGTGTTGGGCGCACAGGAACCTATATCGGAATTGATGCCATGCTAGAAGGCCTGGAAGCCGAGAACAAAGTGGATGTTTATGGTTATGTTGTCAAGCTAAGGCGACAGAGATGCCTGATGGTTCAAGTAGAGGTATGTTCTAACCT
263 525 TGGTCTGGTCTCTCACTCCCCAGGCAATACTAGCCCCTCTGGAGCACGGAGCTCCTTCCCCAAAGACATGAAGCTATTGGAGAACTCGAGCTTTGAAGCCATCAACTCACAGCTGACTGTGGAGACTGGAGATGCCCACATCATTGGCAG 526 GATTGAGAGCTACTCATGTAAGATGGCAGGAGACGACAAACACATGTTCAAGCAGTTCTGCCAGGAGGGCCAGCCCCACGTGCTGGAGGCACTTTCTCCACCCCAGACTTCAGGACTGAGCCCCAGCAGGTGAGCCATGGTGGGGCCTAC
264 527 GTCTCAACATATGCACTAGTGGAAGTGCCACCTCATGTGAAGAATGTCTGCTAATCCACCCAAAATGTGCCTGGTGCTCCAAAGAGGTATGTAGGTGGGGGAGGGGAGGAAGAAGGGAAGGAATGCTGCGAGGGTGAGGGTGAGAAGGAG 528 CCCGCGCTCCGGCCCCAGCCCCGGCCGCCGGCCCCCGCGGAGTGCAGCGACCGCGCCGCCGCTGAGGGAGGCGCCCCACCATGCCGCGGGCCCCGGCGCCGCTGTACGCCTGCCTCCTGGGGCTCTGCGCGCTCCTGCCCCGGCTCGCAG
265 529 GTCCTCGCAAGGGCCGAGAGGTGTACCGGCATTTCGGCAAGGCCCCAGGAACCCCGCACAGCCACACCAAGTGAGTATCAGGCCCCCAGCCCTGCCCTCTCCCCAGACTCAGCCTGCAGGGCCAGGCCTGGCCACACTTGGGCTGCTTCT 530 CCCGCCAGCCTTGTCCTCTCCACCAGGTATGTGCACTGCGCGTGACCAGCCGGGCCCGCAGCCGCATCCTCAGGGCAGGGGGCAAGATCCTCACTTTCGACCAGCTGGCCCTGGACTCCCCTAAGGGCTGTGGCACTGTCCTGCTCTCCG
266 531 TGTTAAATCTAACTAGATAGACTTTATGAAGTAGAAGTATTGTAAATCAGCTTTCCCAAAAATGACATGGCAGATATTCTAAAGCAAAATTTTAATAATTTACATTTTTTTTCTCCATTACAGCTACTACTCCATCTAAGCCAACATGTG 532 ATGAAAAATATGCAAACATCACTGTGGATTACTTATATAACAAGGAAACTAAATTATTTACAGCAAAGCTAAATGTTAATGAGAATGTGGAATGTGGAAACAATACTTGCACAAACAATGAGGTGCATAACCTTACAGAATGTAAAAATG
267 533 AGTCTAAGTGTATTCCCTCTGGCTTCCATTTAGATTTTCCTGAGAGAACTGATTTCAAATGCTTCTGATGCTTTAGATAAGATAAGGCTAATATCACTGACTGATGAAAATGCTCTTTCTGGAAATGAGGAACTAACAGTCAAAATTAAG 534 TGTGATAAGGAGAAGAACCTGCTGCATGTCACAGACACCGGTGTAGGAATGACCAGAGAAGAGTTGGTTAAAAACCTTGGTACCATAGCCAAATCTGGGACAAGCGAGTTTTTAAACAAAATGACTGAAGCACAGGAAGATGGCCAGTCA
268 535 GCTTCCGGATGCAGATGACGATGCGTTTGAAGAGTACAGTGCTGACGTGGAAGAAGAGGAGCCAGAGGCGGACCACCCCCAGATGGGGGTCAGCCAGCAGTAAATCTGGGGGCTCCCCTGAGAAGGAGAGTGAGCCCCACAGTAACCTAG 536 GCATGTCGGTGTAAACCTGATTGTCTCGACATTTTCTGTTTAATTGATTGGTGCTGTGAGGAGTTCGGCTGCTCGTGGTAAAACAGCGTACTCCAGTTTTAAGTCATCGGGTAAAATAATAGGACAGTGATTTCCATCTGTGCTTCAGTA
269 537 TGCCGGGAGAGCCGCGGCGACGTCAGTTCCTCCTTTCGGGGCTCTGATTGGTCAGAGCGCCCGGCGCTTCTGGTTGGCCGGCCCTGCTATCATCCCAGAGTGCATTGCGGGGCCGCTTCCTTTCCGCTCGGCTGTTTTCCTGCGCAGGAG 538 CCGCAGGGCCGTAGGCAGCCATGGCGCCCAGCCGGAATGGCATGGTCTTGAAGCCCCACTTCCACAAGGACTGGCAGCGGCGCGTGGCCACGTGGTTCAACCAGCCGGCCCGTAAGATCCGCAGGTGAGCCCTGCGCTCGGGGCTGCCCC
270 539 AGCTGGTGGAGAACCCTGCTGACTTCTGTGGTTTCTGTGCTCTTCCCAGAAGTAAGGCTGTCACAAGGCTGGAAGCAGAGAACATCCCCATGGAACTGAAGACAGCATGCTGCATCCCTGGGAGGAGGGAGCTCTTAAGGAAGTTCCAAG 540 TGGATGTAAAGCTGGATCCCGCCACGGCGCACCCGAGTCTGCTCTTGACCGCCGACCTGCGCAGTGTGCAGGATGGAGAACCATGGAGGGATGTCCCCAACAACCCTGAGCGATTTGACACATGGCCCTGCATCCTGGGTTTGCAGAGCT
271 541 GGTCTGCACCTTTTCTCCACAGAGGGTGTCGCCCACCACCAGTCCCCGCCCTGCTAGCCCAGTCCCTGGGAGTGAGCGCCGGGGCTCCCGGCCTGAGATGACTCCCGTTAGCTTACGAAGCACAAAGGAGGGGCCCGAGACCCCACCCAG 542 GCCCCGGGATCAGCTGCCCCCCCATCCCCGCTCCCGCCGCTACTCCGGGGACAGTGACTCCTCAGCCTCCTCCGCCCAGAGCGGCCCCCTTGGTACCCGCAGTGATGACACAGGCACTGGCCCCCGGAGGGAGCGACCCAGCCGGCGGCT
272 543 GATGACAGCAAGGCTGGCATGGAGGAAGATCACACCTACGAGGTAAGGAGAGGGGCAGGCCCAGCAGCTCTGAGTCCTCGGGGTCAGTGGCCACTATCTGCTGGTGTGGTTGGGGTGTGGTCCCGGCCTGAGTTCCACTTAATGTCTCCA 544 CAGGCTCACAACCCCACCCCTGTCCCCGCAGGATTCAGCACCTTGGCACAGCTGAAGCAGAGGAACACGCTGAAGGATGGTATCATCATGATCCAGACGCTGCTGATCATCCTCTTCATCATCGTGCCTATCTTCCTGCTGCTGGACAAG
273 545 GCAAGAAATCCAAGAGAAGGTAAGTTTTATTAGTGGCGAGGAGTTTCCACATCTGCTGATTCATTCTCTACTTCCTTAAGTTACTTCCTGCTCTAGCTAGACACATTAACCCCATAGTAGTTTATTTACCTGGGGTCCTCATCCAAATGA 546 CCTTACTGATTTCTCTTTCAGAATTGGACAAAAGTTTCTCAATGATTAAGGAGGGTGATTATAACCCCCTCTTCATTCCAGTGGCAGTCATGGTTACTGCATTCTCTGGGTTGGCATTTATCATTTGGCTGGCAAGGAGATTAAAAAAAG
274 547 GATCTCCCTCAGCGATCCCTGGCCCTGGCAGAGCAGAAGTGTGAAGAGTGGAGGAGCCAGTATGAGGCTCTGAAGGAGGACTGGAGGACCCTTGGGACCCAGCACAGGGAGCTGGAGAGCCAACTCCACGTGCTTCAGTCCAAACTGCAG 548 GGAGCAGATAGCAGGGACTTACAGATGAACCAGGCCCTGCGATTTTTGGAAAATGAGCACCAGCAACTGCAGGCCAAGATTGAATGCCTGCAAGGGGACAGAGACCTGTGCAGCTTGGATACCCAGGACCTACAAGGTACTCTTCTCCTT
275 549 TTGCAGCAATGTGAATTGGGCCAGAAGATCAGAGTGTAATATGTGTAATACTCCAAAGTATGCTAAATTAGAAGAAAGAACAGGTATGATAAAACCACATTGTAACTAAATGATTTTTTTTAAAGCACTAAATATTGAAACGATAATTGT 550 TATTTCTCCAGGTTCATATTGCATGATTTTTCTGTTTTCAGAGAAAACAACTGAGGCCAAGATGATGAAAGCTGGGGGCACTGAAATAGGAAAGACACTTGCAGAAAAGAGCCGAGGCCTATTTAGTGCTAATGACTGGCAATGTAAAAC
276 551 CCGAGTCGTCCGGAAATCCATTGCCCGTGTTCTCACAGTTATTAACCAGACTCAGAAAGAAAACCTCAGGAAATTCTACAAGGTGAGTCTGCCTGGACATAGGGAGGGTTGGCTGCAGGAAGCCAAGTGCTAGCCGTCCCTGGCCGGGGA 552 CTCTTGCGCGCAGGCCAAGATCAAGGCTCGAGATCTTCGCGGGAAGAAGAAGGAGGAGCTGCTGAAACAGCTGGACGACCTGAAGGTGGAGCTGTCCCAGCTGCGCGTCGCCAAAGTGACAGGCGGTGCGGCCTCCAAGCTCTCTAAGAT
277 553 ATGAGGGCAGGACCTGGGGGGACCTGGGCGCCGCTGCCGGGGGCGGCACCCCCAGCAAGGGGGTCAACTTCGCCGAGGAGCCCATGCAGTCCGACTCCGAGGACGGGGAGGAGGAGGAGGCGGCGCCCGCGGACGCAGGGGCGTTCAATG 554 CTCCAGTAATAAACCGATTCACAAGGCGTGCCTCAGGTAAGTCTGATTATATTATGGATTTTGTTTATTAATGGTGACATTTAAAAAATGATAATATTGGACAAGAAGGTACAAAGAATAATTGCTGTATAGTAAACCTTTATTTGTCAG
278 555 TGTGAAATCAAAGTTGCACAACCCAAAGAGGTATATAGGCAGCAACAGCAACAACAAAAAGGTGGAAGAGGTGCTGCAGCTGGTGGACGAGGTGGTACGAGGGGTCGTGGCCGAGGTGAGACTTAATTCTTGAAATATGACTCCGTGGTT 556 TGTGCATCTCGATTTCAGATTGAAAATATTGAACTTCCCATGGATACAAAAACAAATGAAAGAAGAGGATTTTGTTTTATCACATATACTGATGAAGAGCCAGTAAAAAAATTGTTAGAAAGCAGATACCATCAAATTGGTTCTGGGAAG
279 557 GATCCCGAAGGCAAGCCGAAGAAGACACACATCCAAGACAACCATGACGGCACGTATACAGTGGCCTACGTGCCAGACGTGACAGGTCGCTACACCATCCTCATCAAGTACGGTGGTGACGAGATCCCCTTCTCCCCGTACCGCGTGCGT 558 AAGGTCAAGGTGCTGCCTACTCATGATGCCAGCAAGGTGAAGGCCAGTGGCCCCGGGCTCAACACCACTGGCGTGCCTGCCAGCCTGCCCGTGGAGTTCACCATCGATGCAAAGGACGCCGGGGAGGGCCTGCTGGCTGTCCAGATCACG
280 559 CCTGGTTCAAAAGCAGCTAAACCAAAAGAAGCCTCCAGACAGCCCTGAGATCACCTAAAAAGCTGCTACCAAGACAGCCACGAAGATCCTACCAAAATGAAGCGCTTCCTCTTCCTCCTACTCACCATCAGCCTCCTGGTTATGGTACAG 560 ATACAAACTGGACTCTCAGGACAAAACGACACCAGCCAAACCAGCAGCCCCTCAGCATCCAGCAACATAAGCGGAGGCATTTTCCTTTTCTTCGTGGCCAATGCCATAATCCACCTCTTCTGCTTCAGTTGAGGTGACACGTCTCAGCCT
281 561 AGGATCAAGGTGAAAAGGAGAACCCCATGCGGGAACTTCGCATCCGCAAACTCTGTCTCAACATCTGTGTTGGGGAGAGTGGAGACAGACTGACGCGAGCAGCCAAGGTGTTGGAGCAGCTCACAGGGCAGACCCCTGTGTTTTCCAAAG 562 CTAGATACACTGTCAGATCCTTTGGCATCCGGAGAAATGAAAAGATTGCTGTCCACTGCACAGTTCGAGGGGCCAAGGCAGAAGAAATCTTGGAGAAGGGTCTAAAGGTGAGCCTAATCCCCTAATGGAGTGATATTGATCAGCACTCCT
282 563 AGGAGTTGAAGCCAAACAGCCAAATTCTGCCATTAGGAAGTGTGTAAGGGTCCAGCTGATCAAGAATGGCAAGAAAATCACAGCCTTTGTACCCAATGACGGTTGCTTGAACTTTATTGAGGTGAGTATTTCAACTCTATCGTACCTTCT 564 TGGACTTCGTACTGCTAGGAAGCTCCGTAGTCACCGACGAGACCAGAAGTGGCATGATAAACAGTATAAGAAAGCTCATTTGGGCACAGCCCTAAAGGCCAACCCTTTTGGAGGTGCTTCTCATGCAAAAGGAATCGTGCTGGAAAAAGT
283 565 AGGACTTGACCTCTGACCCCTACCCTCTCTCTCTGGCCTCAGGTGAGGGAGATTCTGGGCCGCTGCACCTGCCCTGACCAGTTTCCCATGATCAAGGTCTCAGAGGGGAAGTACCGTGTGGGGGACTCGAGCCTGCTCATCTTTGTGCGG 566 GTGCTGAGGAGCCACGTGATGGTGCGAGTGGGTGGTGGCTGGGACACGCTGGAGCATTACCTGGACAAGCACGACCCGTGCCGCTGCTCCTCCACTGGTCAGTGCCAGGGTGGGGCTGGGGCTGGACGGGCAGGGGACTTGCTTCTGTGG
284 567 TGATTCAGTGTGAGCCTCTATCAGCACCAGATTTGGGGATCATGAACTGTAGCCATCCCCTGGCCAGCTTCAGCTTTACCTCTGCATGTACCTTCATCTGCTCAGAAGGAACTGAGTTAATTGGGAAGAAGAAAACCATTTGTGAATCAT 568 GTACCATGGACTGTACTCACCCTTTGGGAAACTTCAGCTTCAGCTCACAGTGTGCCTTCAGCTGCTCTGAAGGAACAAACTTAACTGGGATTGAAGAAACCACCTGTGGACCATTTGGAAACTGGTCATCTCCAGAACCAACCTGTCAAG
285 569 GGCCTGGACATTGACCAGACAGCCACCTATGAGGACATAGTGACGCTGCGGACAGGGGAAGTGAAGTGGTCTGTAGGTGAGCACCCAGGCCAGGAGTGAGAGCCAGGTCGCCCCATGACCTGGGTGCAGGCTCCCTGGCCTCAGTGACTG 570 CTCACTCCTGACCCCTCACCCCTCTCCCTGGCCCTCCCCAGCCTGGCCCAGCAGGGGATGGGGCTGGGGGACACTAACACTCTGATCTCCATCCCTCTCCGCCCCCAGGATGACAGCAAGGCTGGCATGGAGGAAGATCACACCTACGAG
286 571 GAAGAAATTCAAAAGAAAAGAACCCGCCGAGCAGTCAAATTCCAGAGGGCCATTACTGGTGCATCTCTTGCTGATATAATGGCCAAGAGGAATCAGAAACCTGAAGTTAGAAAGGCTCAACGAGAACAAGCTATCAGGTGAGGAATGCTT 572 TATAGTTAAATAGTAATTCCTTTGCATTTGTCACTCTAGGTTTTCCAGTTTCTTAATGCGAAATGCGAGTCGGCTTTCCTTTCCAAGAGGAATCCTCGGCAGATAAACTGGACTGTCCTCTACAGAAGGAAGCACAAAAAGGGACAGTCG
287 573 TACTTCCTGGCATCCAGGAGGGTCTGAAAGATATTCACCTCCCCCTGCTCACTGAGGCACCCACCCCACCCACCCCTACAGAAACGATGGCAGAACGAGAAGCTCGGGTTGGATGCCGGGGATGAATATGAAGATGAAAACCTTTATGAA 574 GGCCTGAACCTGGACGACTGCTCCATGTATGAGGACATCTCCCGGGGCCTCCAGGGCACCTACCAGGATGTGGGCAGCCTCAACATAGGAGATGTCCAGCTGGAGAAGCCGTGACACCCCTACTCCTGCCAGGCTGCCCCCGCCTGCTGT
288 575 CCTTGGGGGTGGGGGGATAGAGGCATGGAATAGGTGCTCTGACCTCTGACCCTCTAGCCCAGGGAGAAGGTGAGCAGTATTGATTTGGAGATCGACTCTCTGTCCTCACTGCTGGATGACATGACCAAGAATGATCCTTTCAAAGCCCGG 576 GTGTCATCTGGATATGTGCCCCCACCAGTGGCCACTCCATTCAGTTCCAAGTCCAGTACCAAGCCTGCAGCCGGGGGCACAGCACCCCTGCCTCCTTGGAAGTCCCCTTCCAGCTCCCAGCCTCTGCCCCAGGTTCCGGCTCCGGCTCAG
289 577 CCGTGACCCTAGGGGCCGGTTTGCGCCGGGAGCCGGGGCACGGTTCCGGCCGTACTCACGGCGCCGCGCGGTGACTCCCCAGGCGCAGCCCAGCCTCGAAATGCAGAACGACGCCGGCGAGTTCGTGGACCTGTACGTGCCGCGGAAATG 578 CTCCGCTAGCAATCGCATCATCGGTGCCAAGGACCACGCATCCATCCAGATGAACGTGGCCGAGGTGAGCTGGGAGCCCGGGAGGCGGGAAGGTTGTGATATATGTGCGGGAAAGGCAGGCTGTCCCATTGTGGAGGAGCCCCTGGGGTG
290 579 GCGAGTATTTCTAAGTAAGTTTCACTGTCCTTTCTCCTCCAATTTTAGGTGTTCAGGCGCTTCGTGGAGGTTGGCCGGGTGGCCTATGTCTCCTTTGGACCTCATGCCGGAAAATTGGTCGCGATTGTAGATGTTATTGATCAGAACAGG 580 GCTTTGGTCGATGGACCTTGCACTCAAGTGAGGAGACAGGCCATGCCTTTCAAGTGCATGCAGCTCACTGATTTCATCCTCAAGTTTCCGCACAGGTAACTGTCCACTAATCACTCCTCCCTCCCATCCCCAGATTTGTTTATGCTAGTA
291 581 TTTTATTCTTGTCTGTTCTGCCTCACTCCCGAGCTCTACTGACTCCCAACAGAGCGCCCAAGAAGAAAATGGCCATAAGTGGAGTCCCTGTGCTAGGATTTTTCATCATAGCTGTGCTGATGAGCGCTCAGGAATCATGGGCTATCAAAG 582 AAGAACATGTGATCATCCAGGCCGAGTTCTATCTGAATCCTGACCAATCAGGCGAGTTTATGTTTGACTTTGATGGTGATGAGATTTTCCATGTGGATATGGCAAAGAAGGAGACGGTCTGGCGGCTTGAAGAATTTGGACGATTTGCCA
292 583 TATACCTGAGGTGCACCGGAGGTGAAGTCGGTGCCACTTCTGCCCTGGCCCCCAAGATCGGCCCCCTGGGTCTGGTACGTTATCCCCTCCAAGGGGCATTTTTTTCACATTTGTTTCACTTTAAGCGCCGGCTCGTGGAGTCACGCCTGT 584 CTGGCTTGTCCGCGCGATTTCCGGCCTCTCGGCTTTCGGCTCGGAGGAGGCCAAGGTGCAACTTCCTTCGGTCGTCCCGAATCCGGGTTCATCCGACACCAGCCGCCTCCACCATGCCGCCGAAGTTCGACCCCAACGAGATCAAAGTCG
293 585 TTATACAGGTTTCTGGCCAGAAGAACCAACTCCACATTCAACCAGGTTGTGTTGAAGAGGTTGTTTATGAGTCGCACCAACCGGCCGCCTCTGTCCCTTTCCCGGATGGTGAGTGGCTGGTCCAGAGAGCACGGTAGACCTGGGAGCCGC 586 ATAAGTAATAATTGGCTATGGTTGGGGGTAATTGGGTCCATGGTTGCCTCTTCACCCCCACAGGGAGTGGACATCCGCCATAACAAGGACCGAAAGGTTCGGCGCAAGGAGCCCAAGAGCCAGGATATCTACCTGAGGCTGTTGGTCAAG
294 587 GATATGGTGGTGGTTTTAATGAAAGAGAAAATGTTGAATATATAGAAAGAGAAGAATCTGATGGTGAATATGATGAGGTAAGCTATATTTTGGTGTTCAGGTTGAATATAAATTAGAAAAACAGAAAAAATTCTTAAATGCAAAGGAAAA 588 AAATATCTAAAAATTTGATATTCATCTATATTATAGCCTACTAATTTAGTATTTTTCACTTCTAAAGTTGCAGCAATGTGAATTGGGCCAGAAGATCAGAGTGTAATATGTGTAATACTCCAAAGTATGCTAAATTAGAAGAAAGAACAG
295 589 CGGGCCCCTGGCTGGGCCCAGTTCGGGGTGTGTGGGAGCTGAGGACTCACTGGGCTTGAGGACTGACTGATGTGGGGTGCAGAGGAGGCTTGGGCCTGGAACCGAGTGCTTTGTTCCTAACAGGTGATGTCGAGCCTGGCAGAGCTGGAG 590 GACGACTTCAAAGAGGGCTACCTGGAGACAGTGGCGGCTTATTATGAGGAGCAGCACCCAGTGAGTATGACACACCCATCTGGGCACCTTGCCTTCCTTCACCTCTGCCCTGTCTTTTCTTTCTTTCTTTCTTTTTGTTTATTTGAGACA
296 591 GGTGACTTTTAAATATGACGGCTCCACCATCGTCCCCGGCGAGCAGGGAGCGGAGTACCAGCACTTCATCCAGCAGTGCACAGGTAGGGAGGCGCGCCTGCCGGGCGGATGCGCGGTCGTTGGGAGGTTGTCTGCACCCGGGGAGCCCCG 592 CGCTCCCATCCCCGCCGCCGGCCAGGGGCGCGCTCGGCCGCCCCGGACAGTGTCCCGCTGCGGCTCCGCGGCGATGGCCACCAAGATCGACAAAGAGGCTTGCCGGGCGGCGTACAACCTGGTGCGCGACGACGGCTCGGCCGTCATCTG
297 593 AAGTGTTACAAATCCTTCTGCCCTCACTTAGGCATCTATATCATAAATCTCAAGAGGACCTGGGAGAAGCTTCTGCTGGCAGCTCGTGCAATTGTTGCCATTGAAAACCCTGCTGATGTCAGTGTTATATCCTCCAGGAATACTGGCCAG 594 AGGGCTGTGCTGAAGTTTGCTGCTGCCACTGGAGCCACTCCAATTGCTGGCCGCTTCACTCCTGGAACCTTCACTAACCAGATCCAGGCAGCCTTCCGGGAGCCACGGCTTCTTGTGGTTACTGACCCCAGGGCTGACCACCAGCCTCTC
298 595 GTGTCTTCCGTGAGGCCACCACTGAGTTCAGTGTGGACGCCCGGGCTCTGACACAGACCGGAGGGCCGCACGTCAAGGCCCGTGTGGCCAACCCCTCAGGCAACCTGACGGAGACCTACGTTCAGGACCGTGGCGATGGCATGTACAAAG 596 TTACCTACATTCCCCTCTGCCCCGGGGCCTACACCGTCACCATCAAGTACGGCGGCCAGCCCGTGCCCAACTTCCCCAGCAAGCTGCAGGTGGAACCTGCGGTGGACACTTCCGGTGTCCAGTGCTATGGGCCTGGTATTGAGGGCCAGG
299 597 CAAAGCTGACACTCCTGCAGAGAAAGCTCCAACCGGCAGCAATGTATGAGATTAAAGTTCGATCCATCCCTGATCACTATTTTAAAGGCTTCTGGAGTGAATGGAGTCCAAGTTATTACTTCAGAACTCCAGAGATCAATAATAGCTCAG 598 GGGAGATGGATCCTATCTTACTAACCATCAGCATTTTGAGTTTTTTCTCTGTCGCTCTGTTGGTCATCTTGGCCTGTGTGTTATGGAAAAAAAGGTGACCTTCTTCAACTAATAAAGAGGGTGATTGTGTGGGATCACGGACAGTCAGAG
300 599 TTACCTGGCTACAGAAAGAAGATGCCAGATGACACTTAAGACCTACTTGTGATATTTAAATGATGCAATAAAAGACCTATTGATTTGGACCTTCTTCTTAAACCGGTTATCCTTTTTAGCTAGTTTTTTTCCCTCGTGGAACAAGGAGCT 600 GATGTATTAATTGCTTTATCTTCACTCCTATAGCGGCTTTGATTCAGCAAGCCACAACAGTTAAAAACAAGGATATCAGGAAATTTTTGGATGGTATCTATGTCTCTGAAAAAGGAACTGTTCAGCAGGCTGATGAATAAGATCTAAGAG
301 601 AATAATACCGAGTCGAGTCATGAAATGTGTCCCACCCCCTTGTCTCCCTTCAGGTTTAAGTTACTGAGCCAGGAGGAAGGCGAGTACTTCAATGTGCCTGTGCCACCAGAAGGAAGTGAGGCCAATGAAGAACTGCGGCAGAAATTTGAG 602 AGGGCCAAGATCAGTCAGGGAACCAAGGTCCCGGAAGAAAAGACGACCAACACTGTCTCCAAATTTGACAACAATGGCAACAGAGACCGGATGAAACTGACCGATTTTAACTTCCTAATGGTGCTGGGGAAAGGCAGCTTTGGCAAGGTA
302 603 TAGAATAGGAATATAGAGTCAAACTCTTTGCAGACTAGATTTTGCCCCAAGCTCATTAACTCATCCCATTTGCTCCAGGGACAGCTTAATGAAGACAAACTGAAGGGGAAACTGAGATCCTTAGAAAACCAGCTATACACCTGTACCCAG 604 AAATACTCCCCTTGGGGAATGAAAAAAGTACTACTGGAGATGGAAGACCAGAAAAACAGCTATGAGCAGAAGGCCAAGGAGTCACTGCAGAAAGTGCTGGAGGAGAAAATGAATGCAGAGCAGCAACTACAGAGCACACAGGTATGGGGA
303 605 CCAGCGACTCCTGCTCTTGCTTCTGGATCTGCAGGGCAGTCCCAGCAGGACCCATGGAGTGTCCTTCGTGCCAGCATGTCTCCAAGGAGGAAACCCCCAAGTTCTGCAGCCAGTGCGGAGAGAGGCTGCCTCCTGCAGCCCCCATAGCAG 606 ATTCTGAGAACAATAACTCCACAATGGCGTCGGCCTCGGAGGGTGAAATGGAGTGTGGGCAGGAGCTGAAGGAGGAAGGGGGCCCGTGCTTGTTCCCGGGCTCAGACAGTTGGCAAGAAAACCCCGAGGAGCCCTGTTCCAAAGCCTCCT
304 607 GAAAGCAAGGAATTTAATGCAGAAGTACATCGGAAGCACATCATGGGCCAGAATGTTGCAGATTACATGCGCTACTTAATGGAAGAAGATGAAGATGCTTACAAGAAACAGTTCTCTCAATACATAAAGAACAGCGTAACTCCAGACATG 608 ATGGAGGAGATGTATAAGAAAGCTCATGCTGCTATACGAGAGAATCCAGTCTATGAAAAGAAGCCCAAGAAAGAAGTTAAAAAGAAGAGGTATGTCGTCTTTTTTTTTGTCTTTTCAAGAAAACAGGTTGGGAATGGTTCCCACGTGGGG
305 609 TTGAGCTAAAAGGTATTTTTGCATTCTAAAAGGGAAACTAAGGCAAAAAACCCACTTTTGTTTCCCCTCCTGCCTTTTAGGGAAGACAAAGGCGCTTTGGCTAAGCTGGTGGAAGCTATCAGGACCAATTACAATGACAGATACGATGAG 610 ATCCGCCGTCACTGGGGTGGCAATGTCCTGGGTCCTAAGTCTGTGGCTCGTATCGCCAAGCTCGAAAAGGCAAAGGCTAAAGAACTTGCCACTAAACTGGGTTAAATGTACACTGTTGAGTTTTCTGTACATAAAAATAATTGAAATAAT
306 611 GCTGAGCCCAGCAGCTTCTTGTGACTAGAGCAGGCCCTGTGAGTGCTCACAAAGTGGTTGTGTGTTCTAGGAGTTAACACCGTCACCACCTTGGTGGAGAACAAGAAAGCTCAGCTGGTGGTGATTGCACACGACGTGGATCCCATCGAG 612 CTGGTTGTCTTCTTGCCTGCCCTGTGTCGTAAAATGGGGGTCCCTTACTGCATTATCAAGGGAAAGGCAAGACTGGGACGTCTAGTCCACAGGAAGACCTGCACCACTGTCGCCTTCACACAGGTGAACTCGTAAGTACACAGCCTGGCC
307 613 GAAGCCCCTTGCAGTTCTATGTGGATTACGTCAACTGTGGCCATGTCACTGCCTATGGGCCTGGCCTCACCCATGGAGTAGTGAACAAGCCTGCCACCTTCACCGTCAACACCAAGGATGCAGGAGAGGGTGAGCAATAGCTCTGGTCTT 614 GCCCCACAGGGGAGGTTCGGATGCCCTCAGGCAAGGTGGCGCAGCCCACCATCACTGACAACAAAGACGGCACCGTGACCGTGCGGTATGCACCCAGCGAGGCTGGCCTGCACGAGATGGACATCCGCTATGACAACATGCACATCCCAG
308 615 TGAGGGTCTCGGCCACCTTCTGGCAGAACCCCCGCAACCACTTCCGCTGTCAAGTCCAGTTCTACGGGCTCTCGGAGAATGACGAGTGGACCCAGGATAGGGCCAAACCTGTCACCCAGATCGTCAGCGCCGAGGCCTGGGGTAGAGCAG 616 ACTGTGGCTTCACCTCCGGTAAGTGAGTCTCTCCTTTTTCTCTCTATCTTTCGCCGTCTCTGCTCTCGAACCAGGGCATGGAGAATCCACGGACACAGGGGTGTGAGGGAGGCCAGAGCCACCTGTGCACAGGTACCTACATGCTCTGTT
309 617 GGATTTCATTCGTGCCCAAGGAGACGGGGGAGCACCTGGTGCATGTGAAGAAAAATGGCCAGCACGTGGCCAGCAGCCCCATCCCGGTGGTGATCAGCCAGTCGGAAATTGGGGATGCCAGTCGTGTTCGGGTCTCTGGTCAGGGCCTTC 618 TGCGTATGTCCCACCTAAAGGTCGGCTCTGCTGCCGACATCCCCATCAACATCTCAGAGACGGATCTCAGCCTGCTGACGGCCACTGTGGTCCCGCCCTCGGGCCGGGAGGAGCCCTGTTTGCTGAAGCGGCTGCGTAATGGCCACGTGG
310 619 GTCCCCTATAATTTTATCTCAATAATGTTTTGCAGTAGTTTCTAAGGAAATTTTTATGGGGTCTTCAGTCTGACTGTGAAAAGCAGTTCAGAGTCCAACTCACACTGTGTTTTTCTTTCCTTTTCAGGGTGTGAGAGGAGTCCTGAGCAG 620 AAGTAAGGCTGTCACAAGGCTGGAAGCAGAGAACATCCCCATGGAACTGAAGACAGCATGCTGCATCCCTGGGAGGAGGGAGCTCTTAAGGAAGTTCCAAGGTAGTTGCATCTTAGAGACTGGGAATTAGGCTGCCTGGGGTTTGAAGAA
311 621 GCATGGATTCCGTGAAGGAACAACACCTAAACCCAAGAGGGCAGCTGTTGCAGCATCCAGTTCATCTTAAGAATGTCAACGATTAGTCATGCAATAAATGTTCTGGTTTTAAAAAATACATATCTGGTTTTGGTAAGGTATTTTTAATCA 622 TTAACAACACCTACAAGGTGTGTGGGAGAACACCGTTTGAAATCTTTTCTGAACTTATGTTTTAGATAACTGGAGTGCCAAGGCTAAAAGACGAAATACCACCGGAACTGGTCGAATGAGGCACCTAAAAATTGTATACCGCAGATTCAG
312 623 CCATTCATATACCCCCAACCTCCCTCGTCCCCTCTTTCATTCTTACCGCCCAAGTCCCCTCTGCTCACTGCGCCCTTTCTCCACAGCTCCGCTAGCAATCGCATCATCGGTGCCAAGGACCACGCATCCATCCAGATGAACGTGGCCGAG 624 GTTGACAAGGTCACAGGCAGGTTTAATGGCCAGTTTAAAACTTATGCTATCTGCGGGGCCATTCGTAGGATGGTGAGTGTTTCCCTGGGCTTTGCTCATCACTTCGGGACATCGTGGACTTTACCGTGCGCATTGGAGTGTGTGATGGTG
313 625 ACCATTTTAATTGCTGTTAGATTTTGCACTGAAGTTCTTGATGTTTGTGTTCTAGGCTTTGGTCGATGGACCTTGCACTCAAGTGAGGAGACAGGCCATGCCTTTCAAGTGCATGCAGCTCACTGATTTCATCCTCAAGTTTCCGCACAG 626 TGCCCACCAGAAGTATGTCCGACAAGCCTGGCAGAAGGCAGACATCAATACAAAATGGGCAGCCACACGATGGGCCAAGAAGATTGAAGCCAGAGAAAGGGTAATAACTTAGGGTCATTTGAATTCTGGTCCTTTCTTTTTTTGGAGGGT
314 627 TGAATCATCTACAGCCTCTGCCCTGGTCGCATAAATTTGTCTGTGTACTCAAGCAATAAAATGATTGTTTAACTAAAAGCATGTTTCATATTTATTTTCCTAGAAGAAAAATTATATATATCAGTGGTTCATATGTGTTGATCTTGTTTG 628 TAGGTCATTTTGGGTGGTTTTCTTGAATTGCACCAAATTTTATTTTTAGGATAAGGATGCTAAATTCCGTCTGATTCTAATAGAGAGCCGGATTCACCGTTTGGCTCGATATTATAAGACCAAGCGAGTCCTCCCTCCCAATTGGAAATA
315 629 GAGTCACAGTGGCTCAAGCTTCCTTCCCCGCTTCCACATGCAGGCATCTCTCGGGACAACTGGCACAAGCGCCGCAAAACCGGGGGCAAGAGAAAGCCCTACCACAAGAAGCGGAAGTATGAGTTGGGGCGCCCAGCTGCCAACACCAAG 630 ATTGGCCCCCGCCGCATCCACACAGTCCGTGTGCGGGGAGGTAACAAGAAATACCGTGCCCTGAGGTTGGACGTGGGGAATTTCTCCTGGGGCTCAGAGTGTGAGTGAGGCCCTTTGGGAGTGGGTGGGAAAACGCACCTAAACGGTCTT
316 631 TTTGTGCCATTATTACATTTTCACCTTCATTCTTCTGTTGTTTTTCAGGGCATTTTGTCAGTGATGCTGATCTTTGCCTTCTTCCAGGAACTTGTAATAGCTGGCATCGTTGAGAATGAATGGAAAAGAACGTGCTCCAGACCCAAATCT 632 AACATAGTTCTCCTGTCAGCAGAAGAAAAAAAAGAACAGACTATTGAAATAAAAGAAGAAGTGGTTGGGCTAACTGAAACATCTTCCCAACCAAAGAATGAAGAAGACATTGAAATTATTCCAATCCAAGAAGAGGAAGAAGAAGAAACA
317 633 GCCACGCCCACCAGCCCCATCCGAGTCAAGGTGGAGCCCTCTCATGACGCCAGTAAGGTGAAGGCCGAGGGCCCTGGCCTCAGTCGCACTGGTGAGGACAGGTACCCCATGGCAGGTTGCGGGGCATCAAGGGTAGGAGGGCTTGGGGCA 634 ATCGGCATCAAGTGTGCCCCTGGAGTGGTAGGCCCCGCCGAAGCTGACATCGACTTCGACATCATCCGCAATGACAATGACACCTTCACGGTCAAGTACACGCCCCGGGGGGCTGGCAGCTACACCATTATGGTCCTCTTTGCTGACCAG
318 635 ACTATGTGTGGCCAAGGTATGCAGGCCTTTGACTACTTGGAAGCTAGCAAAGTCATCTACACCAATGGCTGTATTGACAAGTTGGTCAACTGGATACACAGCAACCTATTCTTACTTGGTGGTGTGGCTCTAGGCCTGGCCATCCCCCAG 636 CTGGTGGGAATTCTGCTGTCCCAGATCCTAGTGAATCAGATCAAAGATCAGATCAAGCTACAGCTCTACAACCAGCAGCACCGGGCTGACCCATGGTACTGAGAATCCATCCTGCACCTCCTCACCATGGAAACTGGCAAGCCTCATAAA
319 637 GCCTCAGAGTCTCTGATCAAGCAGATTCCACGAATCCTCGGCCCAGGTTTAAATAAGGCAGGAAAGTTCCCTTCCCTGCTCACACACAACGAAAACATGGTGGCCAAAGTGGATGAGGTGAAGTCCACAATCAAGTTCCAAATGAAGAAG 638 GTGTTATGTCTGGCTGTAGCTGTTGGTCACGTGAAGATGACAGACGATGAGCTTGTGTATAACATTCACCTGGCTGTCAACTTCTTGGTGTCATTGCTCAAGAAAAACTGGCAGAATGTCCGGGCCTTATATATCAAGAGCACCATGGGC
320 639 GCATTAATATAGTAGGGCACATGAAATGAAACCAAGTACTGTTTGCTTTCCTTTGTTTCAGATGGAGGAGATGTATAAGAAAGCTCATGCTGCTATACGAGAGAATCCAGTCTATGAAAAGAAGCCCAAGAAAGAAGTTAAAAAGAAGAG 640 GTGGAACCGTCCCAAAATGTCCCTTGCTCAGAAGAAGGATCGGGTAGCTCAAAAGAAGGCAAGCTTCCTCAGAGCTCAGGAGCGGGCTGCTGAGAGCTAAACCCAGCAATTTTCTATGATTTTTTCAGATATAGATAATAAACTTATGAA
321 641 AACAGATGTCTGTGAAAAAATTATTGGAGGAAATGAAGTAACTCCTCATTCAAGACCCTACATGGTCCTACTTAGTCTTGACAGAAAAACCATCTGTGCTGGGGCTTTGATTGCAAAAGACTGGGTGTTGACTGCAGCTCACTGTAACTT 642 GAACAAAAGGTCCCAGGTCATTCTTGGGGCTCACTCAATAACCAGGGAAGAGCCAACAAAACAGATAATGCTTGTTAAGAAAGAGTTTCCCTATCCATGCTATGACCCAGCCACACGCGAAGGTGACCTTAAACTTTTACAGGTACGTAT
322 643 GTGGTACTCTTTTTGTTCATTAAGTGTTAACGATGTACTCATTGTAGTATGGTTTTTGATGAAACAATCTTTAAGATGTTCATTTTTGTTTTTATAGTATGTGCAGAAGCTTATAATCCTGATGAAGAAGAAGATGATGCAGAGTCCAGG 644 ATTATACATCCAAAAACTGATGATCAAAGAAATAGGTTGCAAGAGGCTTGCAAAGACATCCTGCTGTTTAAGAATCTGGATCCGGTAAGATAAATCTTAATAATAGAAATGGCTTTGTTTTTTCCCCCAGTGACAGTGTCAAGAACTGTA
323 645 GAGAAGATTGGCTGGCGAAAGGATGCACTGCATTTGCTGGTGTTCACAACAGATGATGTGCCCCACATCGCATTGGATGGAAAATTGGGAGGCCTGGTGCAGCCACACGATGGCCAGTGCCACCTGAACGAGGCCAACGAGTACACTGCA 646 TGCGTCCCCTCCTTTGGGTTCCGCCATCTGCTGCCTCTCACAGACAGAGTGGACAGCTTCAATGAGGAAGTTCGGAAACAGAGGGTGTCCCGGAACCGAGATGCCCCTGAGGGGGGCTTTGATGCAGTACTCCAGGCAGCCGTCTGCAAG
324 647 AGGATTGGCTTTCAGAGTCTAATCATGTTTTCTGTGTGTCTAGTATGCTCAGGCTTCAGAAGAGGCTCGCCTCTAGTGTCCTCCGCTGTGGCAAGAAGAAGGTCTGGTTAGACCCCAATGAGACCAATGAAATCGCCAATGCCAACTCCC 648 GTCAGCAGATCCGGAAGCTCATCAAAGATGGGCTGATCATCCGCAAGCCTGTGACGGTCCATTCCCGGGCTCGATGCCGGAAAAACACCTTGGCCCGCCGGAAGGGCAGGCACATGGGCATAGGTAAGTGTGGTCATCTTCTCCTTAAGA
325 649 GAGTATCCTTTCTACAATTATTTTTTTCTTTCAGAGGGTAAAACTGATTATTATGCTCGGAAACGCTTGGTGATACAAGATAAAAATAAATACAACACACCCAAATACAGGATGATAGTTCGTGTGACAAACAGAGATATCATTTGTCAG 650 ATTGCTTATGCCCGTATAGAGGGGGATATGATAGTCTGCGCAGCGTATGCACACGAACTGCCAAAATATGGTGTGAAGGTTGGCCTGACAAATTATGCTGCAGCATATTGTACTGGCCTGCTGCTGGCCCGCAGGGTATGTACAAGATGA
326 651 AACTTAGGGTCATTTGAATTCTGGTCCTTTCTTTTTTTGGAGGGTTCAAGATAGTGTGAGAGGGATAATTTTTATTTGTTGTTTTTTTTTTAACAGAAAGCCAAGATGACAGATTTTGATCGTTTTAAAGTTATGAAGGCAAAGAAAATG 652 AGGAACAGAATAATCAAGAATGAAGTTAAGAAGCTTCAAAAGGCAGCTCTCCTGAAAGCTTCTCCCAAAAAAGCACCTGGTACTAAGGGTACTGCTGCTGCTGCTGCTGCTGCTGCTGCTGCTAAAGTTCCAGCAAAAAAGATCACCGCC
327 653 GGCAACAAACCATGGATTTCTCTTCCCCGAGGAAAGGGTATCCGCCTCACCATTGCTGAAGAGAGAGACAAAAGACTGGCGGCCAAACAGAGCAGTGGGTGAAATGGGTCCCTGGGTGACATGTCAGATCTTTGTACGTAATTAAAAATA 654 TGTATGGTGACTGGAGGTGCTAACCTAGGAAGAATTGGTGTGATCACCAACAGAGAGAGGCACCCTGGATCTTTTGACGTGGTTCACGTGAAAGATGCCAATGGCAACAGCTTTGCCACTCGACTTTCCAACATTTTTGTTATTGGCAAG
328 655 ATTTAACATATGAGCTGACAGTCAAAAGTTCGGAACAGACAGGTAAGAACTCCTCCCCAGAAGTAAATGACAGTAGGTTTCCCTTTGTGGTACGTGTTGGTGCCGTTTTCACTAGTCACACACTTAGGAGAAAATGCTCTTGCTGGGAAG 656 CAGGTCCTCTGGATGTCAGCATGGCAGCCACAAACCTGGAGAACCAGCTGCACAGCGCACAGAAGAACCTCCTGTTCCTTCAGCGGGAGCATGCCAGCACGCTCAAGGGGCTGCACTCCGAGATCAGGCGGCTGCAGCAGCACTGCACAG
329 657 GCAGTCCTTTCAAGGTCCCTGTGCATGATGTGACAGATGCGTCCAAGGTCAAGTGCTCTGGGCCCGGCCTGAGCCCAGGCATGGTTCGTGCCAACCTCCCTCAGTCCTTCCAGGTGGACACAAGCAAGGCTGGTGTGGCCCCATTGCAGG 658 CGGGCGGCCTGGGCCTGGCTGTAGAGGGCCCCTCCGAGGCCAAGATGTCCTGCATGGATAACAAGGACGGCAGCTGCTCGGTCGAGTACATCCCTTATGAGGCTGGCACCTACAGCCTCAACGTCACCTATGGTGGCCATCAAGTGCCAG
330 659 GTGCTGGCATCGGCCCCACCATTCAGATTGGGGAGGAGACGGTGATCACTGTGGACACTAAGGCGGCAGGCAAAGGCAAAGTGACGTGCACCGTGTGCACGCCTGATGGCTCAGAGGTGGATGTGGACGTGGTGGAGAATGAGGACGGCA 660 ACCATGACGGCACGTATACAGTGGCCTACGTGCCAGACGTGACAGGTCGCTACACCATCCTCATCAAGTACGGTGGTGACGAGATCCCCTTCTCCCCGTACCGCGTGCGTGCCGTGCCCACCGGGGACGCCAGCAAGTGCACTGTCACAG
331 661 CTCCTTCCGTCGCCCGTGGGCACGCAGCACGTGTGGAGTGAGAGCGAGGACTGCCTGCCTTTCTTGCAGCTAGCACAGGATTACATCTCCTCCTGCGGCAAGAAGACGCTCCACGAAGTCCTGGAAAAAGTCTTCAAGTCTTTCAGACCT 662 TTACTGGGGCTTCCGGATGCAGATGACGATGCGTTTGAAGAGTACAGTGCTGACGTGGAAGAAGAGGAGCCAGAGGCGGACCACCCCCAGATGGGGGTCAGCCAGCAGTAAATCTGGGGGCTCCCCTGAGAAGGAGAGTGAGCCCCACAG
332 663 GATGCCTTGTGCCGCCTCCTTCCCAGGAGCCCAATAACTTGAAGGCCCGCAATTCCTTCCGCTACAACGGACTGATTCACCGCAAGACTGTGGGCGTGGAGCCGGCAGCCGACGGCAAAGGTGTCGTGGTGGTCATTAAGCGGAGATCCG 664 GCCAGCGGAAGCCTGCCACCTCCTATGTGCGGACCACCATCAACAAGAATGCTCGCGCCACGCTCAGCAGCATCAGACACATGATCCGCAAGAACAAGTACCGCCCCGACCTGCGCATGGTGAGCTGGGGTTTGGGGATCAGGCTTGGGG
333 665 GACTGCACTCCGTGGACGTGACCTATGACGGCAGTCCCGTGCCCAGCAGCCCCTTCCAGGTGCCCGTGACCGAGGGCTGCGACCCCTCCCGGGTGCGTGTCCACGGGCCAGGCATCCAAAGTGGCACCACCAACAAGCCCAACAAGTTCA 666 AGTTCAGTGTGGACGCCCGGGCTCTGACACAGACCGGAGGGCCGCACGTCAAGGCCCGTGTGGCCAACCCCTCAGGCAACCTGACGGAGACCTACGTTCAGGACCGTGGCGATGGCATGTACAAAGTGGAGTACACGCCTTACGAGGAGG
334 667 CTGAACATCTCCTTCCCAGCCACTGGCTGCCAGAAACTCATTGAAGTGGACGATGAACGCAAACTTCGTACTTTCTATGAGAAGCGTATGGCCACAGAAGTTGCTGCTGACGCTCTGGGTGAAGAATGGAAGGTAAAAGTTGACAAATTG 668 CGGAAGTACCGCCCACCCATGCTCACTTCCGCTATCCCGTACTTCTGCTCATCTCGCGAGAACTGAAAGCGCCTATGTGACCTGCGCTAAGCGGAAGTTGGCCCTCTTTTCCGTGGCGCCTCGGAGGCGTTCAGCTGCTTCAAGATGAAG
335 669 TGCTAAAAACCTTGTACCTATGGACCCCAATGGCCTGTCAGATCCCTACGTAAAACTGAAACTGATTCCCGATCCCAAAAGTGAGAGCAAACAGAAGACCAAAACCATCAAATGCTCCCTCAACCCTGAGTGGAATGAGACATTTAGATT 670 TCAGCTGAAAGAATCGGACAAAGACAGAAGACTGTCAGTAGAGATTTGGGATTGGGATTTGACCAGCAGGAATGACTTCATGGGATCTTTGTCCTTTGGGATTTCTGAACTTCAGAAAGCCAGTGTTGATGGCTGGTAAGTAAGATTTTG
336 671 GGGCAGAATGATCTGGAAAAGATGACCAGCATCCTGGAAGCTGTGCCACAGGTTAAGTTTATTTGCCTGGATGTGGCCAATGGGTATTCAGAACATTTTGTGGAATTCGTGAAACTTGTCCGTGCCAAATTTCCTGAACACACCATTATG 672 GCAGGGAACGTGGTGACAGGAGAAATGGTAGAAGAGCTTATTCTTTCCGGAGCAGATATCATCAAAGTGGGAGTTGGACCAGGTAAGACTTGTTAGGAGCACAGCAGAGGACGTGTGTGGGGAAGAATGGGATCTGGGGCTTGCGGGGAC
337 673 GTGTAATCCTGAGAGATTCACATGGTGTTGCACAAGTACGTTTTGTGACAGGCAATAAAATTTTAAGAATTCTTAAGTCTAAGGGACTTGCTCCTGATCTTCCTGAAGATCTCTACCATTTAATTAAGAAAGCAGTTGCTGTTCGAAAGC 674 AAGGAGAGACCGCTGTTCTGCGGCGCCATTCCTGGGTTCTCATCCTAAGGCTGCTTTCTATTCCATAACAGTGGTTGAAGTTGACATCTGACGACGTGAAGGAGCAGATTTACAAACTGGCCAAGAAGGGCCTTACTCCTTCACAGATCG
338 675 CTGAGCTGGCTAGGTGACTGTTGGTTATTCCTGGGACAGGTGCTGGGTAGGCCAGGTTTCAGCATCGCAGACAAGAAGCGCAGGACAGGCTGCATTGGGGCCAAACACAGAATCAGCAAAGAGGAGGCCATGCGCTGGTTCCAGCAGAAG 676 TATGATGGGATCATCCTTCCTGGCAAATAAATTCCCGTTTCTATCCAAAAGAGCAATAAAAAGTTTTCAGTGAAATGTGCAATTCTGTTGTGTGTTCTGTGAAAGGATCCTGGCCATATTCAAGTCCTTGGACCTCAAGCCACTTAAAGC
339 677 TGGTGATGAATACAATGTGGAAAGCATTGATGGTCAGCCAGGTGCCTTCACCTGCTATTTGGATGCAGGCCTTGCCAGAACTACCACTGGCAATAAAGTTTTTGGTGCCCTGAAGGGAGCTGTGGATGGAGGCTTGTCTATCCCTCACAG 678 TACCAAACGATTCCCTGGTTATGATTCTGAAAGCAAGGAATTTAATGCAGAAGTACATCGGAAGCACATCATGGGCCAGAATGTTGCAGATTACATGCGCTACTTAATGGAAGAAGATGAAGATGCTTACAAGAAACAGTTCTCTCAATA
340 679 CCCCTTTCTGCTCAGAAAATCCGTTCTAAAGTAGAGCTGGAAGTGCGTGACCTCCCTGAAGAGTTGTCTCTATCCTTCAATGCCACCTGCCTCAACAATGAGGTCATCCCTGGCCTCAAGTCTTGTATGGGACTCAAGATTGGAGACACG 680 GTGAGCTTCAGCATTGAGGCCAAGGTGCGAGGCTGTCCCCAGGAGAAGGAGAAGTCCTTTACCATAAAGCCCGTGGGCTTCAAGGACAGCCTGATCGTCCAGGTCACCTTTGATTGTGACTGTGCCTGCCAGGCCCAAGCTGAACCTAAT
341 681 TTTTTGTCTAAAAAGAGCTACTGGAAACCTGAAGTGATGATTGCTGCTCAGGGACCACTGAAGGAGACCATTGGTGACTTTTGGCAGATGATCTTCCAAAGAAAAGTCAAAGTTATTGTTATGCTGACAGAACTGAAACATGGAGACCAG 682 GAAATCTGTGCTCAGTACTGGGGAGAAGGAAAGCAAACATATGGAGATATTGAAGTTGACCTGAAAGACACAGACAAATCTTCAACTTATACCCTTCGTGTCTTTGAACTGAGACATTCCAAGGTATGGAAACAATTTGGGGAGTATATT
342 683 TTTGACAATCGTTCTCTGAATGTATTATTTTTCATTTCTAGATAATTCTAAGGCACTGATAGCATTTCTGGCATTTCTGATTATTGTGACATCAATAGCCCTGCTTGTTGTTCTCTACAAAATCTATGATCTACATAAGAAAAGATCCTG 684 CAATTTAGATGAACAGCAGGAGCTTGTTGAAAGGGGTAAGTATGTATATTTTTGCTGATGACTATTCCTTCCCCTGCATTTGAATCCATTCATTTTATTTATTTATTTATTTATATTTATTTTAAGACAGAGTCTCATTCTGTCTCCCAG
343 685 TGCTGAATTCCCATATATTAGGCTACTTGATTATTCACTATTTCACTTGTTTATTTTTCTTTTCCTTAAACAGATGATTATAACCGTGTTGAACTCTCTGAGATAAACGGAGATGCAGGGTCAAACTACATAAATGCCAGCTATATTGAT 686 GGTTTCAAAGAACCCAGGAAATACATTGCTGCACAAGGTAATTTCTTTGATAATCCAATATTCTTTTTGAAAAATTTTTATAGCACTTTTAAGAAAATTTTTCTTATCAGCTTTTATTTGTTTACCTCCTAGGTCCCAGGGATGAAACTG
344 687 TGTATGGTATGTGCAAGTTTGCATGTTTATCTTTGTTTTCAACTTGTTGGTAATACGTTTTATTGTCTTCAATAGGCCGCTGGCCCAACAGGCAAAAATGAAGAAAAAATTCAGGTTCTAACAGACAAAATTGATGTACTTCTGCAACAG 688 ATTGAAGAATTAGGGTCTGAAGGAAAAGTAGAAGAAGCCCAGGGGATGATGAAATTAGTTGAGCAATTAAAAGAAGAGAGAGAACTGCTAAGGTCCACAACGTCGGTGAGTAAACCTTATTTCACATTATCTCATCTGTCTGTTAACAGT
345 689 TCTTTCTTTTATAGGGATGGATCTCAGCAAACGGGAATATTTTGTGCTTTGTTAAATCTCTTAGAAAGTGCGGAAACAGAAGAGGTAGTGGATATTTTTCAAGTGGTAAAAGCTCTACGCAAAGCTAGGCCAGGCATGGTTTCCACATTC 690 GAGCAATATCAATTCCTATATGACGTCATTGCCAGCACCTACCCTGCTCAGAATGGACAAGTAAAGAAAAACAACCATCAAGAAGATAAAATTGAATTTGATAATGAAGTGGACAAAGTAAAGCAGGATGCTAATTGTGTTAATCCACTT
346 691 TCTAAGGTCCACAGCTTTTTTTCACTGTTGACTTTCTAACCATCATCATTTTGGGGGTTTGGCTTTTAGCTGCAGTGTTGTGGTATAAATGGCACGAGTGATTGGACCAGTGGCCCACCAGCATCTTGCCCCTCAGATCGAAAAGTGGAG 692 GGTTGCTATGCGAAAGCAAGACTGTGGTTTCATTCCAATTTCCTGTATATCGGAATCATCACCATCTGTGTATGTGTGATTGAGGTAAGAGCTTAACCACAGGGTTATTGTGAGGATTACATGAGTTAAGTCAGGTAAGATTTCAGAATA
347 693 GTTCTGCCATTACAGGACCAGTAGCAAAGGAGTGTGCAGACTTGTGGCCCCGGATTGCATCCAATGCTGGCAGCATTGCATGATTCTCCAGTATATTTGTAAAAAATAAAAAAAAAAACTAAACCCATTAAAAAGTATTTGTTTGCAGTG 694 CAGGTTAATGACTGCTGTCCTTTTTTCTTCTCTCAGTACATCCAGCAGTGGTCATTCGACAACGAAAGTCATACCGTAGAAAAGATGGCGTGTTTCTTTATTTTGAAGATAATGCAGGAGTCATAGTGAACAATAAAGGCGAGATGAAAG
348 695 AATTGGACAAAAGTTTCTCAATGATTAAGGAGGGTGATTATAACCCCCTCTTCATTCCAGTGGCAGTCATGGTTACTGCATTCTCTGGGTTGGCATTTATCATTTGGCTGGCAAGGAGATTAAAAAAAGGTATGTGAGTTTAACTTCACA 696 GGATCATGAACTGTAGCCATCCCCTGGCCAGCTTCAGCTTTACCTCTGCATGTACCTTCATCTGCTCAGAAGGAACTGAGTTAATTGGGAAGAAGAAAACCATTTGTGAATCATCTGGAATCTGGTCAAATCCTAGTCCAATATGTCAAA
349 697 AATTTACAGAAATACTCCCCTTGGGGAATGAAAAAAGTACTACTGGAGATGGAAGACCAGAAAAACAGCTATGAGCAGAAGGCCAAGGAGTCACTGCAGAAAGTGCTGGAGGAGAAAATGAATGCAGAGCAGCAACTACAGAGCACACAG 698 CGATCCCTGGCCCTGGCAGAGCAGAAGTGTGAAGAGTGGAGGAGCCAGTATGAGGCTCTGAAGGAGGACTGGAGGACCCTTGGGACCCAGCACAGGGAGCTGGAGAGCCAACTCCACGTGCTTCAGTCCAAACTGCAGGTACCAGGCACT
350 699 TTTTTCTCTATGCAGTCAGCTGAAAGAATCGGACAAAGACAGAAGACTGTCAGTAGAGATTTGGGATTGGGATTTGACCAGCAGGAATGACTTCATGGGATCTTTGTCCTTTGGGATTTCTGAACTTCAGAAAGCCAGTGTTGATGGCTG 700 GTTTAAGTTACTGAGCCAGGAGGAAGGCGAGTACTTCAATGTGCCTGTGCCACCAGAAGGAAGTGAGGCCAATGAAGAACTGCGGCAGAAATTTGAGGTGAGGTTTCTTTTCTTTTTCTCTTCTTTCTTTTTTCTCTTTCTTTTTTCCTT
351 701 AGGTCACGTAGACGGCGCGCCCCGCCCCCGTACGCCTAAGTTCTCGCGCGACTCCCACTTCCGCCCTTTTGGCTCTCTGACCAGCACCATGGCGGTTGGCAAGAACAAGCGCCTTACGAAAGGCGGCAAAAAGGGAGCCAAGAAGAAAGT 702 GGTTGATCCATTTTCTAAGAAAGATTGGTATGATGTGAAAGCACCTGCTATGTTCAATATAAGAAATATTGGAAAGACGCTCGTCACCAGGACCCAAGGAACCAGTAAGTAGCTTATTCTTGGTTTGTATTTTCCTTAAGTTGGCGCTTG
352 703 AATGTCTATTAATGTGATTTTTTTTTTTTTTAACCTTTCTCCCAATAGGTTGATGACAACAAGAAACTAGGAGAATGGGTAGGCCTTTGTAAAATTGACAGAGAGGGGAAACCCCGTAAAGTGGTTGGTTGCAGTTGTGTAGTAGTTAAG 704 GACTATGGCAAGGAGTCTCAGGCCAAGGATGTCATTGAAGAGTATTTCAAATGCAAGAAATGAAGAAATAAATCTTTGGCTCACATTCCTCATGTCTGGCTTTTTATTTGGGGCAGTAAAATAAGGTCCCTGTTAGCAAAGTAAAATGTA
353 705 ACCGGCGGGAGGGCTAGCGAGCCAGCGGTGTGAGGCGCGAGGCGAGGCCGAGCCGCGAGCGACATGGGGGACCGGGAGCAGCTGCTGCAGCGGGCGCGGCTGGCCGAGCAGGCGGAGCGCTACGACGACATGGCCTCCGCTATGAAGGCG 706 GTGACAGAGCTGAATGAACCTCTCTCCAATGAAGATCGAAATCTCCTCTCTGTGGCCTACAAGAATGTGGTTGGTGCCAGGCGATCTTCCTGGAGGGTCATTAGCAGCATTGAGCAGAAAACCATGGCTGATGGAAACGAAAAGAAATTG
354 707 GGGAGAGACGTGGGCTGGTGGCACAGCTGACCTTCTGCCATCTCAGGCAGCCGGAGTGGAAATATTCTTAGTGTGCTTTTTTTTTTTTCTTAAGGGTGAGTCAGATGATTCCATTCTCCGATTGGCCAAGGCCGATGGCATCGTCTCAAA 708 GAACTTTTGACTGGAGAGAATCACAGATGTGGAATATTTGTCATAAATAAATAATGAAAACCTACCTGTGCAGGTTCATTCTGTGTCTGTAGGCCCAGGGTTGAGGTTTTGCTGTCAGTGGGTGACGGGTGGGGTAGGGTACCCAGTTAG
355 709 AGCTAATGCTTTCTTCCAGCTGGTTGTCTTCTTGCCTGCCCTGTGTCGTAAAATGGGGGTCCCTTACTGCATTATCAAGGGAAAGGCAAGACTGGGACGTCTAGTCCACAGGAAGACCTGCACCACTGTCGCCTTCACACAGGTGAACTC 710 GGAAGACAAAGGCGCTTTGGCTAAGCTGGTGGAAGCTATCAGGACCAATTACAATGACAGATACGATGAGGTAAGAGGCAGCTTTACACCAAAATACTGTCATTCACAAATCTTTCTCCCAAATAACTGGCTGGCTTAACCTATGAGAAG
356 711 GTTTTTCGTTGGAATATACGTTGCACATTTATGGCGATTCTGAGTGTGAGGGCAGACTTCTGCCAGGCTCAGCACAGCATTTTCGCTGACAAGTGAGCTTGGAGGTTCTATGTGCCATAATTAACATTGCCTTGAAGACTCCTGGACACC 712 CGGGTGTCGCGCGCCGAGGCTGGGGGGGAGTCGTCGCCGCCGCCGCCACCGCTACCGCCGCCGCCGCCGCCGCCGAGGTGACTGAGGAGAGAGGCGCCTCCTCGCTCCCGCCACCGCCGGACTTCAATGCCCAGTCCCCAGCTCGCCAGC
357 713 CCCCTTCAAGGTCAAGGTGCTGCCTACTCATGATGCCAGCAAGGTGAAGGCCAGTGGCCCCGGGCTCAACACCACTGGCGTGCCTGCCAGCCTGCCCGTGGAGTTCACCATCGATGCAAAGGACGCCGGGGAGGGCCTGCTGGCTGTCCA 714 TGCTCTGTCCCTGGGGCTGGGGCCAGGCCTGGTGGAGCCAGTGGACGTGGTAGACAACGCTGATGGCACCCAGACCGTCAATTATGTGCCCAGCCGAGAAGGGCCCTACAGCATCTCAGTACTGTATGGAGATGAAGAGGTACCCCGGAG
358 715 TGTCTCTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTATAAATTATCCTGGAGGAAAGGTTAAGGTGACACATGGAGACTGAGTGTCACCGTTATTTCCGCAGGTCCTCTCTGATGACATGAAGAAGCTGAAGGCCCGAATG 716 CACCAGGCCATAGAAAGATTTTATGATAAAATGCAAAATGCAGAATCAGGACGTGGACAGGTGGGTGGATTTCCCCTCAGGCACCAGGTCACATGTCCCCGCCCCCAGGCACTCCACCCTGTGTGGGGCTCAGGGTGAGAAGGATGAAGA
359 717 CTGCATTTTTCTCCACAGGTGCGGGAGTATGAGTTAAGAAAAAACAACTTCTCAGATACTGGAAACTTTGGTTTTGGGATCCAGGAACACATCGATCTGGGTATCAAATATGACCCAAGCATTGGTATCTACGGCCTGGACTTCTATGTG 718 GTGCTGGGTAGGCCAGGTTTCAGCATCGCAGACAAGAAGCGCAGGACAGGCTGCATTGGGGCCAAACACAGAATCAGCAAAGAGGAGGCCATGCGCTGGTTCCAGCAGAAGGTAAAGCTGATTTATCTCAAGTGAAGTGGTGGAATGTGA
360 719 TCAGCTTGTGATGGGAGAAGATTTTACTAAGTTGCACTGGAAGAGCTGGCTCTTCCCTTCCTCTTCACAGCTTCTCCCCTGCTTTCTAGGAAGATCAGCCCATCTACTTGGCAGTGAAGGGAGTGGTGTTTGATGTCACCTCCGGAAAGG 720 AGTTTTATGGACGAGGAGCCCCCTACAATGCCTTGACGGGGAAGGACTCCACTAGAGGGGTAGCCAAGATGTCCTTGGATCCTGCAGACCTCACCCATGACACTGTGAGCCAGATTATAAGCCTTTGTAAAATCCTCTACCTCCTTGTCC
361 721 TGTTTACAAGTCACCTGGATGTACTCTTTTCTCATTCAGCATGGCCTGTATGAGAAGAAAAAGACCTCAAGAAAGCAACGAAAGGAACGCAAGAACAGAATGAAGAAAGTCAGGGGGACTGCAAAGGCCAATGTTGGTGCTGGCAAAAAG 722 TGAGCTGGAGATTGGATCACAGGTATAATTCAAGCTTTTCATGTAGTCATGTAGATCACTAGACTCCTTGGTGTACTGACGTAGCAATTTAAAAGCAGATCATGTGTAGTACATCTAGAAGTAGATTTACAAATATTCTGAAGAGTTGTA
362 723 TTATCCCTGACTTCCTTCCTTTGTTCCTTCAATATATTCATTAAATATAAGTAAAATACCAATTGAATTTTGTGCTTCTTGAGAATATAGAAACTTATTTTTCCTATTTTCACAGCAATTTAGATGAACAGCAGGAGCTTGTTGAAAGGG 724 ATGATGAAAAACAACTGATGAATGTGGAGCCAATCCATGCAGATATTTTGTTGGAAACTTATAAGAGGAAGATTGCTGATGAAGGAAGACTTTTTCTGGCTGAATTTCAGGTGTGTGTTGCTTTTGTTATATGATGATAAATTCGACATC
363 725 GACACATGTAACTAGTATTGAATCTTTAATATGTTTCCAGATGATGAAAAACAACTGATGAATGTGGAGCCAATCCATGCAGATATTTTGTTGGAAACTTATAAGAGGAAGATTGCTGATGAAGGAAGACTTTTTCTGGCTGAATTTCAG 726 AGCATCCCGCGGGTGTTCAGCAAGTTTCCTATAAAGGAAGCTCGAAAGCCCTTTAACCAGAATAAAAACCGTTATGTTGACATTCTTCCTTGTGAGTATTTATTGAGTGCTGAATTCCCATATATTAGGCTACTTGATTATTCACTATTT
364 727 TCCACCTAAACCCACTGTGTTCATCTCTGGGGTCATCGCCCGGGTAAGTCTGGGAGTGTCTGCGGTGGGTTTGAGGCTTTTGCATGGCAGCATGGAGTCTCCTGGTTGCTTCTGGTTTTGTTAAACTCTACCTGGAATAACCCAGCACCA 728 CCACAGGCAGCCCCATTTCCACATTAATCCCACACTCTCTGTTTTCATTTCAGTGAAAGCTGGTGGAATGCGAATTGTGCAGAAACACCCACATACAGGAGACACCAAAGAAGAGAAAGACAAGGATGACCAGGAATGGGAAAGCCCCAG
365 729 GCCCCGGAGAGGCCCCTGGTGGGTGTCAATGGGCTGGATGTGACCAGCCTGAGGCCCTTTGACCTTGTCATCCCCTTCACCATCAAGAAGGGCGAGATCACAGGTGAGTGGGGACTTGGGAAGGAGCTCGGGAGCCAAGGAGGCCAGACT 730 TGGGGCCCCTCTGTGACAACAGACTCTCCAGCAGCTCTCTGCTTTGCCCTGCAGGCTCTGGCTGGGGACCAGCCCTCGGTGCAGCCCCCTCTACGGTCTCAGCAGCTGGCCCCACAGTACACCTACGCCCAGGGCGGCCAGCAGACTTGG
366 731 GCCGCCCCGCGCAGGCGCCCCCGCCCCGCCGTCGCCGCCGCCGCAGCCAGGAGCCGCTGCACCATGCCCCGCATAGATGCGGACCTCAAGCTCGACTTCAAGGATGTCCTGCTCCGACCTAAGCGGAGCAGCCTCAAGAGCCGAGCCGAG 732 GTGGATCTTGAACGCACCTTCACGTTTCGAAATTCAAAGCAGACCTACTCAGGGATTCCCATCATCGTGGCCAACATGGACACTGTGGGCACGTTTGAGATGGCAGCCGTGATGTCACAGGTGAGGCGGTAGGCTTTTGTTTTTTCCCTT
367 733 GCGCTCCCAGAGTGTCTGAGAGACCATCATAAGGGCTTTCTTTCCTGACAGGGTGACCTGTTGACCAAAACACAGGAGCTGGGCCGTGACTACAGGACCTGTCTGACGATAGTCCAAAAACTGAAGAAGATGGTGGATAAGCCCACCCAG 734 AGAAGTGTTTCCAATGCTGCGACCCGGGTGTGTAGGACGGGGAGGTCACGATGGCGCGACGTCTGCAGAAATTTCATGAGGAGGTATCAGTCTAGAGTTACCCAGGGCCTCGTGGCCGGAGAAACTGCCCAGCAGATCTGTGAGGACCTC
368 735 TGTTTTTTTTATATCATGTGATTGTTTGTGTGTCCCCTTTCCTCTTCTTTGCTTAACACAATTATCTTGTGTTAAGGATCTCAAAGATTTCATGAGACAAGCTGGGGAAGTAACGTTTGCGGATGCACACCGACCTAAATTAAATGAAGG 736 GGTGGTTGAGTTTGCCTCTTATGGTGACTTAAAGAATGCTATTGAAAAACTTTCTGGAAAGGAAATAAATGGGAGAAAAATAAAATTAATTGAAGGCAGCAAAAGGCACAGGTATCTCTAATTTTTTAAAGTCAAAAGTTGTATTTAATG
369 737 TTTCTCTCTCTTCCTCCTCTCCGCTTTCCTTCTTCCCTTCCTCCCACCCTGATTTTCTCTTTTGCAGTTTGCTGCTTTGTGGTGCACAAGCGGTGCCATGAATTTGTCACATTCTCCTGCCCTGGCGCTGACAAGGGTCCAGCCTCCGAT 738 GACCCCCGCAGCAAACACAAGTTTAAGATCCACACGTACTCCAGCCCCACGTTTTGTGACCACTGTGGGTCACTGCTGTATGGACTCATCCACCAGGGGATGAAATGTGACAGTAAGTACTTTTTCTCTCTGGGGGCATCTGCTGATGGC
370 739 CCCTTTCCCCCCTAGCGTCTGACCAAACACACCAAGTTCGTGCGGGACATGATTCGGGAGGTGTGTGGCTTTGCCCCGTACGAGCGGCGCGCCATGGAGTTACTGAAGGTCTCCAAGGACAAACGGGCCCTCAAATTTATCAAGAAAAGG 740 GTGGGGACGCACATCCGCGCCAAGAGGAAGCGGGAGGAGCTGAGCAACGTACTGGCCGCCATGAGGAAAGCTGCTGCCAAGAAAGACTGAGCCCCTCCCCTGCCCTCTCCCTGAAATAAAGAACAGCTTGACAGAAGCCCTGGCTCTCCT
371 741 ATAACTGGAGTGCCAAGGCTAAAAGACGAAATACCACCGGAACTGGTCGAATGAGGCACCTAAAAATTGTATACCGCAGATTCAGGTACAGTTTGTATGTTCGATCATAATTGGTCCAGTGGGCTTGAATGAAACCCTCGTGTTTACTTG 742 CCTTTAATGTGCAGACGAAGGGAACGTCATCGTTTGGAAAGCGTCGCAATAAGACGCACACGTTGTGCCGCCGCTGTGGCTCTAAGGCCTACCACCTTCAGAAGTCGACCTGTGGCAAATGTGGCTACCCTGCCAAGCGCAAGAGAAAGT
372 743 TTCACAATCACAAAATGATGGATCTGAAGCAATTCCTCTAACTCACAATTTTTCCTGTTAATGAGTAATTGAATGTTCAGCAAATGACATATCTCTGCATGTGTTTTCAATAGGGTTTCAAAGAACCCAGGAAATACATTGCTGCACAAG 744 GTCCCAGGGATGAAACTGTTGATGATTTCTGGAGGATGATTTGGGAACAGAAAGCCACAGTTATTGTCATGGTCACTCGATGTGAAGAAGGAAACAGGGTAAGAACCAAGAAGATTCATAGTGTGGGTCTTGGGGTTAGGAAAACAAGGT
373 745 TTCCCATGTGGGGAACCCAGTCCTGCTGTGACTCTGGGAGGGAGAGGGCCGGGGATACAATCGTACATTCCTGGTAACAGCCCTGTGATTGTCTGCTTCAGGTTATCAGTGAGCTGAATGGAAAAAACATTGAAGACGTCATTGCCCAGG 746 GTATTGGCAAGCTTGCCAGTGTACCTGCTGGTGGGGCTGTAGCCGTCTCTGCTGCCCCAGGCTCTGCAGCCCCTGCTGCTGGTTCTGCCCCTGCTGCAGGTAAGTGGTGGCCTGGTGAGTGGGCAAGGGGCTGGGGCTCAGACGGTGTTG
374 747 GACATCCTGGTGGTCCTGCTCTCAGTGATGGGGGCCATTCTGCTCATTGGCCTTGCCGCCCTGCTCATCTGGAAACTCCTCATCACCATCCACGACCGAAAAGAATTCGCTAAATTTGAGGAAGAACGCGCCAGAGCAAAATGGGACACA 748 GCCAACAACCCACTGTATAAAGAGGCCACGTCTACCTTCACCAATATCACGTACCGGGGCACTTAATGATAAGCAGTCATCCTCAGATCATTATCAGCCTGTGCCACGATTGCAGGAGTCCCTGCCATCATGTTTACAGAGGACAGTATT
375 749 GCCAACAGAGCACTTATGGCAAGGCATCTCGAGGGGGTGGCAATCACCAAAACAATTACCAGCCATACTAAAGGAGAACATTGGAGAAAACAGGTGTGTATAAGAGTACAGGAAAACAGTAGAAATGTCTAATTTAATTTAAAGATCAAT 750 AAGGATTTAATAACTATTATGATCAAGGATATGGAAATTACAATAGTGCCTATGGTGGTGATCAAAACTATAGTGGCTATGGCGGATATGATTATACTGGGTATAACTATGGGAACTATGGATATGGACAGGGATATGCAGACTACAGTG
376 751 AGTTAAGCACAAAGGAAAACATTTCAATAAAGGATCATTTGACAACTGGTGGATTTTCTGGTGTGGCGTCTTCCTTGAGGGAGCTAGCTCCTTTGTGGGGTGGTCAGTGGGGTCAGGGTGGCAGAACCTGTGGAGAAGTAACAAGCACCT 752 GCCAGCACCTCCAATGCCACCATTTCTTTACTTAAAGGAACCATTAAAGAGATCCTGGGGACTGCCCAGTCAGTGGGCTGTAATGTTGATGGCCGCCATCCTCATGACATCATCGATGACATCAACAGTGGTGCTGTGGAATGCCCAGCC
377 753 ACGCAGTAAAACGCAGGACTCTTCCCGCTTGGATTCGCGAAGGTCTTGAAAAAATGGAACGTGAAAAGCAGAAGAAATTGGAGAAAGAAAGAATGGAACAACAACGTTCACAATTGTCCAAAAAAGAAAAAAAGGCCACAGAAGATGCTG 754 CGCAAGGTGGATTTCATCCTCCTTATTGGCAACCAGGACCTCCAGGACCTCCAGCACCTCCCCAGAATCGAAGAGAAAGGCCATCATCATTCAGGGATCGTCAGCGTTCACCTATTGCACTTCCTGTGAAGCAGGAGCCTCCACAAATTG
378 755 CTTTGTTACATGGTTAATTTATGTCAAAAGTATCATAGGCTAAGACATCAAAGTTTTAATAACATTCTTTTTTCTTTAAGGGGTTTGTTAAAGTTGTTAAGAATAAGGCCTACTTTAAGAGATACCAAGTGAAATTTAGAAGACGACGAG 756 AGGGTAAAACTGATTATTATGCTCGGAAACGCTTGGTGATACAAGATAAAAATAAATACAACACACCCAAATACAGGATGATAGTTCGTGTGACAAACAGAGATATCATTTGTCAGGTAAGTTGTATTCTAGACAGTCCCCTTTTTTTAT
379 757 TTTTTCCAGCTACTCAGCTGCTTAAGCTGGCCCACAAGTACAGACCAGAGACAAAGCAAGAGAAGAAGCAGAGACTGTTGGCCCGGGCCGAGAAGAAGGCTGCTGGCAAAGGGGACGTCCCAACGAAGAGACCACCTGTCCTTCGAGCAG 758 GAGTTAACACCGTCACCACCTTGGTGGAGAACAAGAAAGCTCAGCTGGTGGTGATTGCACACGACGTGGATCCCATCGAGGTGCGTTTGCCTGTTGACTGCTAACCCAAGGGCTTCTGGCAGTACCAGGAAGAGAGAGTAGACCTAATGC
380 759 ATATGCTAGTCTGTATTTTTGCTGTGCTATTGAGGATCAGGACAATGAACTAATTACCCTGGAAATAATTCATCGTTATGTGGAATTACTTGACAAGTATTTCGGCAGTGTGAGTAGTATTTTATTTTAGGAAATTGAATGCCATAGTAT 760 GGGAAAGCTTCGACTGCAAAAATGGTATGTCCCACTATCAGACAAAGAGAAGAAAAAGATCACAAGAGAACTTGTTCAGACCGTTTTAGCACGGAAACCTAAAATGTGCAGCTTCCTTGAGTGGCGAGATCTGAAGATTGTTTACAAAAG
381 761 GCTATGGTGGGCTCAGCCTGTCCATTGAGGGCCCCAGCAAGGTGGACATCAACACAGAGGACCTGGAGGACGGGACGTGCAGGGTCACCTACTGCCCCACAGAGCCAGGCAACTACATCATCAACATCAAGTTTGCCGACCAGCACGTGC 762 ATGGCCAGCACGTGGCCAGCAGCCCCATCCCGGTGGTGATCAGCCAGTCGGAAATTGGGGATGCCAGTCGTGTTCGGGTCTCTGGTCAGGGCCTTCACGAAGGCCACACCTTTGAGCCTGCAGAGTTTATCATTGATACCCGCGATGCAG
382 763 CTGACGCTGGCTCCTTCTGTTGTTTCTCTTGGCTCCAGGACCCCCGCAGCAAACACAAGTTTAAGATCCACACGTACTCCAGCCCCACGTTTTGTGACCACTGTGGGTCACTGCTGTATGGACTCATCCACCAGGGGATGAAATGTGACA 764 CCTGCATGATGAATGTGCACAAGCGCTGCGTGATGAATGTTCCCAGCCTGTGTGGCACGGACCACACGGAGCGCCGCGGCCGCATCTACATCCAGGCCCACATCGACAGGGACGTCCTCATTGTCCTCGGTAGGTGGCCCTGGGGCTCCA
383 765 CGGCAGGGTCCGCCCGGGCCGGCAGCGTCCGCCCGGCGGCGGGAGGAGGGAGCGGCGCAGACAAAGAGCGGCGCCTGGGCGGGCGCAGCGCGGCCACCGCCCCGGGACCCGCGCCGCTGCCCTCCGGCTCCGCGGGCGGCCCACGGCGAG 766 ATTTCATGTGTTCTTTGTATACAAGCGACGTCCCAGATTATAATTCTCTGCTGAGATTTGAGTTGGATTTGAGGATTTGGAGAATCCCTGCAGCTTTGTAACTTCAGAGGTGTAATTAGCTGAAAACATCATCGTTTTGAAGAGTTCTGC
384 767 CTCACTCGCTCCCCTCTCGTCCGCAGCCGCAGGGCCGTAGGCAGCCATGGCGCCCAGCCGGAATGGCATGGTCTTGAAGCCCCACTTCCACAAGGACTGGCAGCGGCGCGTGGCCACGTGGTTCAACCAGCCGGCCCGTAAGATCCGCAG 768 ACGTAAGGCCCGGCAAGCCAAGGCGCGCCGCATCGCCCCGCGCCCCGCGTCGGGTCCCATCCGGCCCATCGTGCGCTGCCCCACGGTTCGGTACCACACGAAGGTGCGCGCCGGCCGCGGCTTCAGCCTGGAGGAGCTCAGGGTGAGTAC
385 769 AGGGTGGTTTTCCTGAAGCAGCTGGCTAGTGGCTTATTACTTGTGACTGGTAAGAAAATCCTTGGATTGTGATGTTCTGTGAAACTTCCATTTTTAAATGCTTGCAGTATACACGTTTGTTTGCTACTGCCTACATGGTAGACACTTATT 770 CCACAGCCTAGATATTATCCTACTGAAGATGTGCCTCGAAAGCTGTTGAGCCACGGCAAAAAACCCTTCAGTCAGCACGTGAGAAAACTGCGAGCCAGCATTACCCCCGGGACCATTCTGATCATCCTCACTGGACGCCACAGGGGCAAG
386 771 AAGACAGCGACAGCTGTGGCGCACTGCAAACGCGGCAATGGTCTCATCAAGGTGAACGGGCGGCCCCTGGAGATGATTGAGCCGCGCACGCTACAGTACAAGGTGCTGGGATCCGGCACCGGCGTTGAGTGGATGGAGGACTCTTGGAGA 772 AGGCGCCTGCGCAGACCCTGAAAAGCGGCCAGGGTGGCCCCTAGCTTTCCTTTTCCGGTTGCGGCGCCGCGCGGTGAGGTTGTCTAGTCCACGCTCGGAGCCATGCCGTCCAAGGGCCCGCTGCAGTCTGTGCAGGTCTTCGGACGCAAG
387 773 TGCACAAATAATCACTTCAAGGTCCTGCTTTCAATTCTTGTGTCTACTCCCAAATTTTGAAAGTGCTTAATGTCTTGACATTTCATTTGTAGTGATGATGATGATGATTTTGATGATGAGGAAGCTGAAGAAAAAGCGCCAGTGAAGAAA 774 TCTATACGAGATACTCCAGCCAAAAATGCACAAAAGTCAAATCAGAATGGAAAAGACTCAAAACCATCATCAACACCAAGATCAAAAGTAAGTGGCTACATTTACACGTGGGTCTCATTGATCTAGTTGGGGAAAAAGATTCTACTGTGG
388 775 CTTTAGGAAATTGAAGTTGGTGGTGGTCGGAAAGCTATCATAATCTTTGTTCCCGTTCCTCAACTGAAATCTTTCCAGAAAATCCAAGTCCGGCTAGTACGCGAATTGGAGAAAAAGTTCAGTGGGAAGCATGTCGTCTTTATCGCTCAG 776 AGGAGAATTCTGCCTAAGCCAACTCGAAAAAGCCGTACAAAAAATAAGCAAAAGCGTCCCAGGAGGTGAGTATTTTAGTAGTTTCAGAAATGTGTGTACCCCTCTTATTAACAACTCTTAATTTGTTTAAGTTGTAGTTTATGAAAACAG
389 777 GTGACGACTCCATGCGTATGTCCCACCTAAAGGTCGGCTCTGCTGCCGACATCCCCATCAACATCTCAGAGACGGATCTCAGCCTGCTGACGGCCACTGTGGTCCCGCCCTCGGGCCGGGAGGAGCCCTGTTTGCTGAAGCGGCTGCGTA 778 GCCCGTCCAAAGCAGAAATCAGCTGCACTGACAACCAGGATGGGACATGCAGCGTGTCCTACCTGCCTGTGCTGCCGGGGGACTACAGCATTCTAGTCAAGTACAATGAACAGCACGTCCCAGGCAGCCCCTTCACTGCTCGGGTCACAG
390 779 GCAGCCCCTTCTCTGTGAAGGTGACAGGCGAGGGCCGGGTGAAAGAGAGCATCACCCGCAGGCGTCGGGCTCCTTCAGTGGCCAACGTTGGTAGTCATTGTGACCTCAGCCTGAAAATCCCTGGTAGGGGCTGTGGGAAGCCTGGGGAGG 780 ATGGTGGGCTCAGCCTGTCCATTGAGGGCCCCAGCAAGGTGGACATCAACACAGAGGACCTGGAGGACGGGACGTGCAGGGTCACCTACTGCCCCACAGAGCCAGGCAACTACATCATCAACATCAAGTTTGCCGACCAGCACGTGCCTG
391 781 CTACCTTAGGTGTTTCATCAGTACAGACGCCTCACCTTCCCACGCACGCAGACTCGCAGACGCCCTCTGCTGGAACTGACACGCAGACATTCAGCGGCTCCGCCGCCAATGCAAAACTCAACCCTACCCCAGGCAGCAATGCTATCTCAG 782 ATGTCCCAGGAGAGAGGAGTACAGCCAGCACCTTTCCTACAGACCCAGTTTCCCCATTGACAACCACCCTCAGCCTTGCACACCACAGCTCTGCTGCCTTACCTGCACGCACCTCCAACACCACCATCACAGCGAACACCTCAGGTCTGA
392 783 TCTCTCAAGTCCCGAGGCTACGTGAAGGAACAGTTTGCCTGGAGACATTTCTACTGGTACCTTACCAATGAGGGTATCCAGTATCTCCGTGATTACCTTCATCTGCCCCCGGAGATTGTGCCTGCCACCCTACGCCGTAGCCGTCCAGAG 784 ATGTTGATGCCTAAGAAGAACCGGATTGCCATTTATGAACTCCTTTTTAAGGAGGGAGTCATGGTGGCCAAGAAGGATGTCCACATGCCTAAGCACCCGGAGCTGGCAGACAAGAATGTGCCCAACCTTCATGTCATGAAGGCCATGCAG
393 785 TACATCCAGCAGTGGTCATTCGACAACGAAAGTCATACCGTAGAAAAGATGGCGTGTTTCTTTATTTTGAAGATAATGCAGGAGTCATAGTGAACAATAAAGGCGAGATGAAAGGTAGGAAATCAGTCCAGCTTGTTCCTTAGGTCTCTG 786 TTTATTTACATTCTTTTGTAGGAGCCAAAAACCTGTATATCATCTCCGTGAAGGGGATCAAGGGACGGCTGAACAGACTTCCCGCTGCTGGTGTGGGTGACATGGTGATGGCCACAGTCAAGAAAGGCAAACCAGAGCTCAGAAAAAAGG
394 787 CGTCGCGTCCTCTCCGCCCGCCTCAGGATGCGCTACGTCGCCTCCTACCTGCTGGCTGCCCTAGGGGGCAACTCCTCCCCCAGCGCCAAGGACATCAAGAAGATCTTGGACAGCGTGGGTATCGAGGCGGACGACGACCGGCTCAACAAG 788 GTTATCAGTGAGCTGAATGGAAAAAACATTGAAGACGTCATTGCCCAGGGTGAGTTGATGTGGACGGGCTTTCGTTTGTTTTCATGGTCCATCCTAATCCCTGCCGGTCCATCTGTGGCCTGCCAGGTTTCGCTTGTGGACCAGAGCACC
395 789 GTGAATGTGGGAGCTGGCAGCCACCCCAACAAGGTCAAAGTATACGGCCCCGGAGTAGCCAAGACAGGGCTCAAGGCCCACGAGCCCACCTACTTCACTGTGGACTGCGCCGAGGCTGGCCAGGGTAAGGCCTGGCTGTGGGTGGGAGGG 790 TGACAGGACAATGAAGGCTGCCCTGTGGAGGCGTTGGTCAAGGACAACGGCAATGGCACTTACAGCTGCTCCTACGTGCCCAGGAAGCCGGTGAAGCACACAGCCATGGTGTCCTGGGGAGGCGTCAGCATCCCCAACAGCCCCTTCAGG
396 791 CTAGCCAAAATGTACAAGACCACACCGGATGTCATCTTTGTATTTGGATTCAGAACTCATTTTGGTGGTGGCAAGACAACTGGCTTTGGCATGATTTATGATTCCCTGGATTATGCAAAGAAAAATGAACCCAAACATAGACTTGCAAGA 792 CATGGCCTGTATGAGAAGAAAAAGACCTCAAGAAAGCAACGAAAGGAACGCAAGAACAGAATGAAGAAAGTCAGGGGGACTGCAAAGGCCAATGTTGGTGCTGGCAAAAAGGTATAGTTCATTAAGGAAAATATAGAAACGTCATTAATT
397 793 ATCCGGAAGATGAAGCTTCCTGGCCGGGAAAACAAGACGGCCGTGGTTGTGGGGACCATAACTGATGATGTGCGGGTTCAGGAGGTACCCAAACTGAAGGTGAGCTGGCGGGGGCTGGGCAGACCCATCAGACCCTTGCTGTACTGTGCT 794 AGCAGGCTGTCCCAGCTTCTCACTGTCTTCCCGTCCCTCCAGTTATACAGGTTTCTGGCCAGAAGAACCAACTCCACATTCAACCAGGTTGTGTTGAAGAGGTTGTTTATGAGTCGCACCAACCGGCCGCCTCTGTCCCTTTCCCGGATG
398 795 GCTTCTCGGTGGAAGGGCCATCGCAGGCTAAGATCGAATGTGACGACAAGGGCGACGGCTCCTGTGATGTGCGCTACTGGCCGCAGGAGGCTGGCGAGTATGCCGTTCACGTGCTGTGCAACAGCGAAGACATCCGCCTCAGCCCCTTCA 796 CTCGCATTTGCAGTCCCTTCGAAGTGAAGGTGGGCACCGAGTGTGGCAATCAGAAGGTACGGGCCTGGGGCCCTGGGCTGGAGGGCGGCGTCGTTGGCAAGTCAGCAGACTTTGTGGTGGAGGCTATCGGGGACGACGTGGGCACGCTGG
399 797 CAGCTGAGGCGGCTGGAGGCGGAGGAGCGAGCGACGCTGCAGAGACTGCGGGAGAGCAAGAGCCGGCTGGTCCAGCAGAGCAAGGCCCTGAAGGAGCTGGCGGATGAGCTGCAGGAGAGGTGCCAGCGCCCGGCCCTGGGTCTGCTGGAG 798 GGTGTGAGAGGAGTCCTGAGCAGGTATGTGTGCTTTCTGAATTGGTGAAGGGATTGGGAGAGGCAGAGGAGCTGGTGGAGAACCCTGCTGACTTCTGTGGTTTCTGTGCTCTTCCCAGAAGTAAGGCTGTCACAAGGCTGGAAGCAGAGA
400 799 ACGAGCGGCTGTGGTTGCTGGACGACTCCAAGACGTGGTGGCGGGTGAGGAACGCGGCCAACAGGACGGGCTATGTACCGTCCAACTACGTGGAGCGGAAGAACAGCCTGAAGAAGGGCTCCCTCGTGAAGAACCTGAAGGACACACTAG 800 GCCTCGGCAAGACGCGCAGGAAGACCAGCGCGCGGGATGCGTCCCCCACGCCCAGCACGGACGCCGAGTACCCCGCCAATGGCAGCGGCGCCGACCGCATCTACGACCTCAACATCCCGGCCTTCGTCAAGTTCGCCTATGTGGCCGAGC
401 801 ATTGAGGAATTTTCTAAAGGTATCTCTCTCGGTGTATTTCTCTACTTACCTGTAATAATGCTTTTGTCTTAATAGGGTGGTTCTCTTCCCAAAGTGGAAGCCAAATTCATCAATTATGTGAAGAATTGCTTCCGGATGACTGACCAAGAG 802 GCTATTCAAGATCTCTGGCAGTGGAGGAAGTCTCTTTAAGAAAATAGTTTAAACAATTTGTTAAAAAATTTTCCGTCTTATTTCATTTCTGTAACAGTTGATATCTGGCTGTCCTTTTTATAATGCAGAGTGAGAACTTTCCCTACCGTG
402 803 GTGACAAGACCACCTTCCAGCTACAGGTTCGCCAGGTGGAGGACTATCCTGTGGACCTGTACTACCTGATGGACCTCTCCCTGTCCATGAAGGATGACTTGGACAATATCCGGAGCCTGGGCACCAAACTCGCGGAGGAGATGAGGAAGC 804 TCAAAAATGGCTGTGGAGGTGAGATAGAGAGCCCAGCCAGCAGCTTCCATGTCCTGAGGAGCCTGCCCCTCAGCAGCAAGGGTTCGGGCTCTGCAGGCTGGGACGTCATTCAGATGACACCACAGGAGATTGCCGTGAACCTCCGGCCCG
403 805 AGGTGGACGTTGGCAAAGACCAGGAGTTCACAGTCAAATCAAAGGGTGCTGGTGGTCAAGGCAAAGTGGCATCCAAGATTGTGGGCCCCTCGGGTGCAGCGGTGCCCTGCAAGGTGGAGCCAGGCCTGGGGGCTGACAACAGTGTGGTGC 806 AAATACCCCCTTCCCTTCTGCACCCTTCCCAGGGTCCAGTAGGCGTCAATGTCACTTATGGAGGGGATCCCATCCCTAAGAGCCCTTTCTCAGTGGCAGTATCTCCAAGCCTGGACCTCAGCAAGATCAAGGTGTCTGGCCTGGGAGAGA
404 807 GGGGCCTGTCTCTGGCCATTGAGGGCCCGTCCAAAGCAGAAATCAGCTGCACTGACAACCAGGATGGGACATGCAGCGTGTCCTACCTGCCTGTGCTGCCGGGGGACTACAGCATTCTAGTCAAGTACAATGAACAGCACGTCCCAGGCA 808 AGGCCCTTCTTCCTGCCTCAGGAAGCCCCTTGCAGTTCTATGTGGATTACGTCAACTGTGGCCATGTCACTGCCTATGGGCCTGGCCTCACCCATGGAGTAGTGAACAAGCCTGCCACCTTCACCGTCAACACCAAGGATGCAGGAGAGG
405 809 CCACAGATAAGCTACACCGGGCCCTCGTCCAGCGGGCGCTTCGCGGGCAGAGAGTGGTACTACGGGAACGTGACGCGGCACCAGGCCGAGTGCGCCCTCAACGAGCGGGGCGTGGAGGGCGACTTCCTCATTAGGGACAGCGAGTCCTCG 810 CCCAGCGACTTCTCCGTGTCCCTTAAAGCGTCAGGGAAGAACAAACACTTCAAGGTGCAGCTCGTGGACAATGTCTACTGCATTGGGCAGCGGCGCTTCCACACCATGGACGAGCTGGTGGAACACTACAAAAAGGCGCCCATCTTCACC
406 811 TACAGGCAGAGGCTGGCTTTGAGGATTGGTGTTTCCCAAACCTGGGGGAGTGGTTTGTGACCCTTCTTCTCTTTCTAGGTTGACAAGGTCACAGGCAGGTTTAATGGCCAGTTTAAAACTTATGCTATCTGCGGGGCCATTCGTAGGATG 812 GGTGAGTCAGATGATTCCATTCTCCGATTGGCCAAGGCCGATGGCATCGTCTCAAAGTAAGGTTGGGGGCTCACATTTGGGCAGAGTGAGTGGACTAGGACTGCTCCAGAGGCGTGGTCTTAACGTTGTCCTTTTCCCCTGGTTCTAGGA
407 813 ATAATCTGCCACTCTTGGCAGGGAGCTCACTCAGTGGGTTTGATGTGGTGGATGCTGGCTCGGGAAGTTCTGCGCATGCGTGGCACCATTTCCCGTGAACACCCATGGGAGGTCATGCCTGATCTGTACTTCTACAGAGATCCTGAAGAG 814 ATTGAAAAAGAAGAGCAGGCTGCTGCTGAGAAGGCAGTGACCAAGGAGGAATTTCAGGGTGAATGGACTGCTCCCGCTCCTGAGTTCACTGCTACTCAGCCTGAGGTTGCAGACTGGTCTGAAGGTGTACAGGTGCCCTCTGTGCCTATT
408 815 ACAGCTTTGTTTGCACTGTTGTTGGGGTCAGGGACAGTGATTAAGATAAATTTCTAATTGCAGTCTATACGAGATACTCCAGCCAAAAATGCACAAAAGTCAAATCAGAATGGAAAAGACTCAAAACCATCATCAACACCAAGATCAAAA 816 GGACAAGAATCCTTCAAGAAACAGGAAAAAACTCCTAAAACACCAAAAGGACCTAGTTCTGTAGAAGACATTAAAGCAAAAATGCAAGCAAGTATAGAAAAAGTGAGTAAAGTTATCTTAAAAAAACTTTGTCTCCCCCCTCAAATTGCA
409 817 TGCAATAAGCCAATATTTACATTTTAAAGGAGTTTTTCTGTTTTTTTTTTTTTTTTCAGAGACTTCCTTCATATAGGAGCTGGAGGACACAGCACATTGGAAATCAAGAAGAAAATAAAAGTAAAAACAGGAATTCTAATGTCATCCCAT 818 ATGACTATAACAGAGTGCCACTTAAACATGAGCTGGAAATGAGTAAAGAGAGTGAGCATGATTCAGATGAATCCTCTGATGATGACAGTGATTCAGAGGAACCAAGCAAATACATCAATGCATCTTTTATAATGGTAGGTACTTAAATTG
410 819 GTACACGGTCCTCTTCTCGCACGGCAATGCCGTGGACCTGGGCCAGATGAGCAGCTTCTACATTGGCCTGGGCTCCCGCCTCCACTGCAACATCTTCTCCTACGACTACTCCGGCTACGGTGCCAGCTCGGGCAGGCCTTCCGAGAGGAA 820 CGCACCCGGGCGCTGGAAGCTGCACCTGACGGAGCGTGCCGACTTCCAGTACAGCCAGCGCGAGCTGGACACCATCGAGGTCTTCCCCACCAAGAGCGCCCGCGGCAACCGCGTCTCCTGCATGTATGTTCGCTGCGTGCCTGGTGCCAG
411 821 CTTGAACTCACCTGCTTTTTACCATGTCTCCTCTGCTGGAATGTGCCTGCCCAGCTGAATGAGTATGTGGCTAAGGGTCTGACCGACAGCATCCACCGTTACCACTCAGACAATAGCACCAAGGCAGCGTGGGACTCCATCCAGTCATTT 822 CTGCAGTGTTGTGGTATAAATGGCACGAGTGATTGGACCAGTGGCCCACCAGCATCTTGCCCCTCAGATCGAAAAGTGGAGGTAATTTTGTCGGCAATGTTTCTGTTATTGACCTCTTTGTTTAAATGTTTAATTACCTCGGAAACTGCA
412 823 CAGGAGATTGAGCGGGAGCTGCGTGCTGCACCCCCAGCCCCCAACGCCCCTGCCGCTGGGGAGGACACCACTGAAACCGCCCCCGCACCAGGGACTCCTGCCCGCGGCCCCCGCATGACACCCAGCGACCTGCGCAACCTCGACGAGCTG 824 GTGAGGGAGATTCTGGGCCGCTGCACCTGCCCTGACCAGTTTCCCATGATCAAGGTCTCAGAGGGGAAGTACCGTGTGGGGGACTCGAGCCTGCTCATCTTTGTGCGGGTAAGGGCCTGGGGCCGCCCCAGCGGGCAGCAGCCAAGGTGG
413 825 TCGACATTACTCTGAAGGGACGCACAGTTATCGTGAAGGGCCCCAGAGGAACCCTGCGGAGGGACTTCAATCACATCAATGTAGAACTCAGCCTTCTTGGAAAGAAAAAAAAGAGGGTGAGGGTTTTTCTTCTGATAATTCAGTTGCTCG 826 AACTTCCGCCTGGCAGTCTCCAGTAGGAGTGGAGCTCTGTGCGGCGTAGTTTGGTGGAAAAACGGGCCTTGCGTCGGCCTCACCCCCAGTGTTTGTGTTTCAGAATGAAGACTATTCTCAGCAATCAGACTGTCGACATTCCAGAAAATG
414 827 GACTTCGGCAGTCTGTCCAACCTTCAGGTCACTCAGCCTACAGTTGGGATGAATTTCAAAACGCCTCGGGGACCTGTTTGAATTTTTTCTGTAGTGCTGTATTATTTTCAATAAATCTGGGACAACAGCCTTGCCTGTGTCATCTTTGCA 828 ATTTAAGAACCTGGGGAGAGGAGGAGGAGAGGTGAGTGATAATCTCATTGATTGGTATTTTGACCCTACCTCGTTTCCTTGTAGGTCTCAGCCTTGGATCAGGAGATTATTGAAGTAGATCCTGACACTAAGGAAATGCTGAAGCTTTTG
415 829 TGACCCCAGGACCTCCCTGACCCCCAACCAGGCCAGCGGAAGCCTGCCACCTCCTATGTGCGGACCACCATCAACAAGAATGCTCGCGCCACGCTCAGCAGCATCAGACACATGATCCGCAAGAACAAGTACCGCCCCGACCTGCGCATG 830 GCAGCCATCCGCAGGGCCAGCGCCATCCTGCGCAGCCAGAAGCCTGTGATGGTGAAGAGGAAGCGGACCCGCCCCACCAAGAGCTCCTGAGCCCCCTGCCCCCAGAGCAATAAAGTCAGCTGGCTTTCTCACCTGCCTCGACTGGGCCTC
416 831 GGCAAGAAGTACAAGCCCCTGGACCTGCGGCCTAAGAAGACACGTGCCATGCGCCGCCGGCTCAACAAGCACGAGGAGAACCTGAAGACCAAGAAGCAGCAGCGGAAGGAGCGGCTGTACCCGCTGCGGAAGTACGCGGTCAAGGCCTGA 832 GTGTGAGTCCTGAGTCTTGGGTAGTGCTATGTGTCTTCCCTATCTTCACTGACATCTCTGTTTTGTAGCCGAGTCGTCCGGAAATCCATTGCCCGTGTTCTCACAGTTATTAACCAGACTCAGAAAGAAAACCTCAGGAAATTCTACAAG
417 833 TATTCATCTTTTTCTTTAGTTAAATTATAAGATGGTTTACCAATTTGAGCCTTTTCAGGGTTTTGGGAAAATTAGACTTTTAATCTAATCATATTATTCTGCTTTTTCTTTTAGCTCCAGTAATAAACCGATTCACAAGGCGTGCCTCAG 834 TATGTGCAGAAGCTTATAATCCTGATGAAGAAGAAGATGATGCAGAGTCCAGGGTATGTAATTTACTGAATGAATGAATTTTAAATTGATGCCCTTGTCATATATAAGGAAAATAATCATAGAAAAGATTTAACAGGCATGTAGGTTAAC
418 835 GTATGTGCACTGCGCGTGACCAGCCGGGCCCGCAGCCGCATCCTCAGGGCAGGGGGCAAGATCCTCACTTTCGACCAGCTGGCCCTGGACTCCCCTAAGGGCTGTGGCACTGTCCTGCTCTCCGGTGAGTGATACGTGGTCGACGGGTTT 836 CTGAATGTAAACACCAGAACAACTTACGACGTACATCCTCCCCACCCTAAGATCCGGAAGATGAAGCTTCCTGGCCGGGAAAACAAGACGGCCGTGGTTGTGGGGACCATAACTGATGATGTGCGGGTTCAGGAGGTACCCAAACTGAAG
419 837 GGGAGGTTCGGATGCCCTCAGGCAAGGTGGCGCAGCCCACCATCACTGACAACAAAGACGGCACCGTGACCGTGCGGTATGCACCCAGCGAGGCTGGCCTGCACGAGATGGACATCCGCTATGACAACATGCACATCCCAGGTGGGCCTG 838 CAGATCCTCCCACTGTCCCTCACCCATGCCCTGTGTCTCCACTGCAGGCCCCGGAGAGGCCCCTGGTGGGTGTCAATGGGCTGGATGTGACCAGCCTGAGGCCCTTTGACCTTGTCATCCCCTTCACCATCAAGAAGGGCGAGATCACAG
420 839 GTCTCAGCCTTGGATCAGGAGATTATTGAAGTAGATCCTGACACTAAGGAAATGCTGAAGCTTTTGGTAAGTGTTTGCTGGATTCCTAAAGTGGTATTTTCCTGGTCAAAAACCATCAGTAGGTCTTATTATCCAAGGTCACCCAGCTAG 840 GATTTGTCTTCTCACTGTTCTCTTTGGCTGTGTGTGCTTTGTAGTTATGTCACGCATCTGATGAAGCGAATTCAGAGAGGCCCAGTAAGAGGTATCTCCATCAAGCTGCAGGAGGAGGAGAGAGAAAGGAGAGACAATTATGTTCCTGAG
421 841 TTACAAGTTGTTTCCAAATTGCGTCCCCTCCTTTGGGTTCCGCCATCTGCTGCCTCTCACAGACAGAGTGGACAGCTTCAATGAGGAAGTTCGGAAACAGAGGGTGTCCCGGAACCGAGATGCCCCTGAGGGGGGCTTTGATGCAGTACT 842 GGACAATATCCGGAGCCTGGGCACCAAACTCGCGGAGGAGATGAGGAAGCTCACCAGCAACTTCCGGTTGGGATTTGGGTCTTTTGTTGATAAGGACATCTCTCCTTTCTCCTACACGGCACCGAGGTACCAGACCAATCCGTGCATTGG
422 843 CCTGTAACCCGAGTGCCTGCCGGGCGGTTGGCCGGGGCCTCCAGCCCAAGGGTGTGCGGGTGAAGGAGACAGCTGACTTCAAGGTGTACACAAAGGGCGCTGGCAGTGGGGAGCTGAAGGTCACCGTGAAGGGCCCCAGTAAGTTGGCCT 844 AGGGCACGGTAGAGCCTCAGCTGGAGGCCCGGGGCGACAGCACATACCGCTGCAGCTACCAGCCCACCATGGAGGGCGTCCACACCGTGCACGTCACGTTTGCCGGCGTGCCCATCCCTCGCAGCCCCTACACTGTCACTGTTGGCCAAG
423 845 CTCGGGAACTGAGCCGGTACTCACCTCCGCCCCTTCTCCCCGTCGCTGTCCGCAGCCATGGCCCTACGCTACCCTATGGCCGTGGGCCTCAACAAGGGCCACAAAGTGACCAAGAACGTGAGCAAGCCCAGGCACAGCCGACGCCGCGGG 846 CGTCTGACCAAACACACCAAGTTCGTGCGGGACATGATTCGGGAGGTGTGTGGCTTTGCCCCGTACGAGCGGCGCGCCATGGAGTTACTGAAGGTCTCCAAGGACAAACGGGCCCTCAAATTTATCAAGAAAAGGGTAGGTGGGCGCTGC
424 847 CCCGGGTGTGTAGGACGGGGAGGTCACGATGGCGCGACGTCTGCAGAAATTTCATGAGGAGGTATCAGTCTAGAGTTACCCAGGGCCTCGTGGCCGGAGAAACTGCCCAGCAGATCTGTGAGGACCTCAGGTTGTGTATACCTTCTACAG 848 GTCCCCTCTGAGCCCTCTCACCTTGTCCTGTGGAAGAAGCACAGGCTCCTGTCCTCAGATCCCGGGAACCTCAGCAACCTCTGCCGGCTCCTCGCTTCCTCGATCCAGAATCCACTCTCCAGTCTCCCTCCCCTGACTCCCTCTGCTGTC
425 849 GAGCCAAAAACCTGTATATCATCTCCGTGAAGGGGATCAAGGGACGGCTGAACAGACTTCCCGCTGCTGGTGTGGGTGACATGGTGATGGCCACAGTCAAGAAAGGCAAACCAGAGCTCAGAAAAAAGGGTGAGTAAACACTGAGCCCAC 850 GGGAACTCCGAACCATGTCTAGATTGTGATCTCTTTATCCTGTTTCCCTTCCCTTTATATCCACAGGACGTGGTGGGTCCTCTGGTGCGAAATTCCGGATTTCCTTGGGTCTTCCGGTAGGAGCTGTAATCAATTGTGCTGACAACACAG
426 851 TTTATCAGTTATTATGAGTGAATATCATGTGAGAGTTACCTCTGGTTTGATCAGTTTCAGGAAAATGCCAGTGAAGGGAAGGCCCCTGCAGAAGACGTCTTTAAGAAGCCCCTGCCTCCTACTGTGAAGAAGGAAGAGAGTCCCCCTCCA 852 CCTAAAGTGGTAAACCCACTGATCGGCCTCTTGGGTGAATATGGAGGAGACAGTGACTATGAGGAGGAAGAAGAGGAGGAACAGACCCCTCCCCCACAGCCCCGCACAGCACAGCCCCAGAAGCGAGAGGAGCAAACCAAGAAGGAGAAT
427 853 CCCGTCAGCCTCCCGCTCGGGGTGCGCCGCCCTTCGTCTGGGTCTCCGCCCCCAGGACCCGCGGCCGAGAGCTCCGGAGCGCGGCTTCCCCGGCCGGCTGCGCGATGGGCTGCGGGAACTCCACCGCCACCAGCGCGGGCGCGGGCCAAG 854 GCCCTGCAGGAGCAGCCAAAGATGTGTAAGTATTGAATATTAATGATTTTATAAGCTGTCTTTCTGAGGAAGTTGCTGTTTTTCATGATTATGACCTTTAGATCTCTGTGGGTATGGCTGAAAAGACATGGAAATACTTTGTGTATAATG
428 855 GCAAAAGTGACCGCCAATAACGACAAGAACCGCACCTTCTCCGTCTGGTACGTCCCCGAGGTGACGGGGACTCATAAGGTGAGCCCTTGGCCAGGGGGGAGGCTTGTGACCTCAGGCAGTGGCTGGAGGCCCCCAGCCCTACCCTCACGG 856 GGCCCGTGGTTGGCTCGCCTTCCCCTGCCAGGCATCGAGCCCACAGGCAACATGGTGAAGAAGCGGGCAGAGTTCACTGTGGAGACCAGAAGTGCTGGCCAGGGAGAGGTGCTGGTGTACGTGGAGGACCCGGCCGGACACCAGGAGGAG
429 857 CCGGCACCCAGCGCCCCGCCGCCCGCAAGCCGCGCGCCCGTCCGCCGCGCCCCGAGCCCGCCGCTTCCTATCTCAGCGCCCTGCCGCCGCCGCCGCGGCCCAGCGAGCGGCCCTGATGCAGGCCATCAAGTGTGTGGTGGTGGGAGACGG 858 AGCTGTAGGTAAAACTTGCCTACTGATCAGTTACACAACCAATGCATTTCCTGGAGAATATATCCCTACTGTGTAAGTATCTTAAATTGGGAATTAACCTGTTTGTGTTACGGGTTTCACATTTCTTTGACCATTTGTTTTGCTGTAAAG
430 859 TGAGTGACTTCAAAGCTGATTTCTTAATCTGTGGTCTTGGCTCGTTCTAGTGCCCACCAGAAGTATGTCCGACAAGCCTGGCAGAAGGCAGACATCAATACAAAATGGGCAGCCACACGATGGGCCAAGAAGATTGAAGCCAGAGAAAGG 860 AAAGCCAAGATGACAGATTTTGATCGTTTTAAAGTTATGAAGGCAAAGAAAATGGTAAGATTTAAGATCTGTATTTTTGTGTAACTTAGCTTTAAATAATAAGGGAGCAGTAGCCAAATCCCATTTCAGGCTGCCAGCTTCTTGGAAGCT
431 861 CCTTTTTCTTTCTTTTTTTTTGGCCAACAGGTGGATCTTGAACGCACCTTCACGTTTCGAAATTCAAAGCAGACCTACTCAGGGATTCCCATCATCGTGGCCAACATGGACACTGTGGGCACGTTTGAGATGGCAGCCGTGATGTCACAG 862 CACTCCATGTTTACAGCAATTCATAAGCATTACTCCCTGGATGACTGGAAGCTCTTTGCCACAAATCACCCAGAATGCCTGCAGGTACGACTACAGCCTGGTTATCAATTACCAGTGCTGCAGGGGGGAACAAAATCTTCAGAGCTGTCA
432 863 TCTCTCTTACTATAGATTGCTTATGCCCGTATAGAGGGGGATATGATAGTCTGCGCAGCGTATGCACACGAACTGCCAAAATATGGTGTGAAGGTTGGCCTGACAAATTATGCTGCAGCATATTGTACTGGCCTGCTGCTGGCCCGCAGG 864 CTTCTCAATAGGTTTGGCATGGACAAGATCTATGAAGGCCAAGTGGAGGTGACTGGTGATGAATACAATGTGGAAAGCATTGATGGTCAGCCAGGTGCCTTCACCTGCTATTTGGATGCAGGCCTTGCCAGAACTACCACTGGCAATAAA
433 865 GGTGACAAAGATTTCCCCCCGGCGGCTGCGCAGGTGGCTCACCAGAAGCCGCATGCCTCCATGGACAAGCATCCTTCCCCAAGAACCCAGCACATCCAGCAGCCACGCAAGTGAGCCTGGAGTCCACCAGCCTGCCCCATGGCCCCGGCT 866 GCCTCCACGCCCTCCAGCCTGGCTCATCCACATACACATCGTCTGCCACCGTGTTCCCTGTTGTGGACTGTTTTGTTAAATCTGCCTTTTCCCTTCTTTTTTTCCAGTCCACCTAAACCCACTGTGTTCATCTCTGGGGTCATCGCCCGG
434 867 CAGATGGAGGAGGGAGGGGGGCTCTCACTTGGCTTCCCATCCTAATGGTGCTGTTTTGTTTTCTAGCACTCCATGTTTACAGCAATTCATAAGCATTACTCCCTGGATGACTGGAAGCTCTTTGCCACAAATCACCCAGAATGCCTGCAG 868 AATGTAGCCGTGAGTTCAGGCAGTGGGCAGAATGATCTGGAAAAGATGACCAGCATCCTGGAAGCTGTGCCACAGGTTAAGTTTATTTGCCTGGATGTGGCCAATGGGTATTCAGAACATTTTGTGGAATTCGTGAAACTTGTCCGTGCC
435 869 CTGCCGACACACAAGCTCTGTTGAGGAATGACCAGGTCTATCAGGTGAGCGTTGAGGGGAAGGAGGCAGGAATGAAGGGAGGGTAAGTGGGGATAGAGAGGCTCACACTGAATGCTGTTTGCACGTGGGAAGGGTCCTACTGGGGAGTTC 870 TCCTCCCTTCCCCCACAGTGTGCCAGAGCTGTGTGGAGCTGGATCCAGCCACCGTGGCTGGCATCATTGTCACTGATGTCATTGCCACTCTGCTCCTTGCTTTGGGAGTCTTCTGCTTTGCTGGACATGAGACTGGAAGGCTGTCTGGGG
436 871 GTTTTGGAACTGAAAGAACACAAACTGGATGGCAAATTGATAGATCCCAAAAGGGCCAAAGCTTTAAAAGGGAAAGAACCTCCCAAAAAGGTTTTTGTGGGTGGATTGAGCCCGGATACTTCTGAAGAACAAATTAAAGAATATTTTGGA 872 TTGAGCTGGGATACAAGCAAAAAAGATCTGACAGAGTACTTGTCTCGATTTGGGGAAGTTGTAGACTGCACAATTAAAACAGATCCAGTCACTGGGAGATCAAGAGGATTTGGATTTGTGCTTTTCAAAGATGCTGCTAGTGTTGATAAG
437 873 GCCGCCGAGCGAGGGCGAGGAGAGCACCGTGCGCTTCGCCCGCAAAGGCGCCCTCCGGCAGAAGAACGTGCATGAGGTCAAGAACCACAAATTCACCGCCCGCTTCTTCAAGCAGCCCACCTTCTGCAGCCACTGCACCGACTTCATCTG 874 GGGCTTCGGGAAGCAGGGATTCCAGTGCCAAGGTAGGCTCTGGGGCTTTGGGGATGCTATTTGTGGGAAGAGAGGGTGAAAAATACTTTATAGAAGAAGTTACTGAGTTAGGCAGAGAGTGAAAGAATCACGTTGGTCGGAGTGACCTCC
438 875 GGCACCAGCCCCAGAAGGTGGCCCGGCGCGTGTTCACCAACAGCCGGGAGCGCTGGCGGCAGCAGAACGTTAACGGCGCCTTCGCCGAGCTGAGGAAGCTGCTGCCGACGCACCCGCCCGACCGGAAGCTGAGCAAGAACGAGGTGCTCC 876 GGGATTGGGGGCCAGGGTCCTTGCCCACAAGGCATTAGTGACCCACGACCCCTTACAGTGTCTACATTGGGCCAGCAGGACCTTTTAGCATCTTCCCTAGCAGCCGGTTGAAGCGGAGACCAAGCCACTGTGAGCTGGACCTGGCTGAGG
439 877 GCATCGAGCCCACAGGCAACATGGTGAAGAAGCGGGCAGAGTTCACTGTGGAGACCAGAAGTGCTGGCCAGGGAGAGGTGCTGGTGTACGTGGAGGACCCGGCCGGACACCAGGAGGAGGTAGGGCCAGCTGCTGGCAGCAGAGGCCCCG 878 AGGTGATCACCCCCGAGGAGATTGTGGACCCCAACGTGGACGAGCACTCTGTCATGACCTACCTGTCCCAGTTCCCCAAGGCCAAGCTGAAGCCAGGGGCTCCCTTGCGGCCCAAACTGAACCCGAAGAAAGCCCGTGCCTACGGGCCAG
440 879 AATTTTACAGCCCTGATACCTGGAACAACGGTGGAGATTTTAGATGGAGACTCCAAAAATATTATTCAACTGATTATTAATGCATACAATGTAAGTCATCAGTTTCTTCCCCCACTGCCACCTCCCTTCCACCCTCTCCCACTGAGGCCC 880 TGGTATCTACACCTGTTAGGAATGTCATAGCCTTGACTTTTGCCTTGGCCCTAGGACTATCCATCCCTTGCCTTGCTTGGAGAGAAATTGGCAGAGAACAACATCAACCTCATCTTTGCAGTGACAAAAAACCATTATATGCTGTACAAG
441 881 CGTACTCTGACAGCTGTGCACGATGCCATCCTTGAGGACTTGGTCTTCCCAAGCGAAATTGTGGGCAAGAGAATCCGCGTCAAACTAGATGGCAGCCGGCTCATAAAGGTTCATTTGGACAAAGCACAGCAGAACAATGTGGAACACAAG 882 GTTGAAACTTTTTCTGGTGTCTATAAGAAGCTCACGGGCAAGGATGTTAATTTTGAATTCCCAGAGTTTCAATTGTAAACAAAAATGACTAAATAAAAAGTATATATTCACAGTACTCTGTTTCAGTTATGTTTTTCAAAATTCCAAATT
실시예 2. 혈소판 유래 전사체 데이터를 이용한 암 진단 방법
본 발명에서는 암 여부를 판별하기 위하여 혈소판 유래 전사체 데이터를 사용하며, 특히 엑손-접합 수 (exon-junction count) 데이터를 사용하였다. 엑손-접합은 한 유전자 내의 서로 다른 두 개의 엑손에 대하여 상위 위치의 엑손의 끝 부분 (3' 부분)과 하위 위치의 엑손의 시작 부분 (5' 부분)의 접합을 나타낸다 (도 3). 엑손-접합 수 데이터는 선별된 리드 (read) 중 서로 다른 두 개의 엑손의 가장 끝쪽 말단, 즉 상위 위치의 엑손의 끝 부분과 하위 위치의 엑손의 시작 부분으로부터 시작하여 연속되는 최소 1개 이상의 엑손 영역 염기쌍을 포함하는 리드를 계수한 것이며, 이 때 서로 다른 두 개의 엑손들의 경우 참조 유전체 상에서 바로 인접한 엑손이 아니어도 된다. 중간에 위치한 한 개 이상의 엑손들이 skip되었을 때 skip되는 엑손 영역은 해당하는 개별 엑손 각각에 대해서 부분이 아닌 전체가 한꺼번에 skip이 되어야만 한다. 예를 들어 1번, 2번, 3번의 엑손이 있고 1번과 3번을 연결하는 엑손-접합이 질병관련 마커로 계수될 때에 2번 엑손의 모든 영역이 리드가 매핑되는 영역에 포함되지 않아야 한다. 또한 해독되지 아니하는 인트론 부분이 섞여서 있는 리드의 경우는 엑손-접합 수로 계수하지 아니한다 (도 4).
엑손-접합 수 데이터로부터 상기 실시예 1의 바이오마커들을 추출하여 사전 학습된 암 여부 판별 모형에 적용한다. 판별 모형은 해당 바이오마커 특성을 입력하면 암과 정상 판별 스코어를 출력하며, 피험자의 엑손-접합 정보를 시각화 및 중요도를 분석하여 피험자에게 통보할 수 있다.
실시예 3. 본원 발명의 성능 확인
암 여부 판별 모형 학습 시 사용된 샘플들의 441개 엑손-접합 라이브러리에 대한 발현 패턴을 학습 데이터셋 (도 5a) 및 검증 데이터셋 (도 5b)에서 도시화하였다. 행과 열은 각각 441개 엑손-접합 라이브러리와 샘플을 나타내며, 샘플에 대한 각 엑손-접합 라이브러리의 발현값을 색으로 나타내었고, 비슷한 패턴을 가지는 샘플 및 엑손-접합 라이브러리가 군집을 이루도록 하였다.
그 결과, 도 5에서 보듯이, 암 여부 판별 모형 학습 시 사용된 샘플들의 441개 엑손-접합 라이브러리에 대한 발현 패턴에서 학습 데이터셋 (도 5a) 및 검증 데이터셋 (도 5b) 모두 암과 정상 샘플이 구별된 군집을 이루는 것을 알 수 있다.
실시예 4. 유전자 마커를 활용한 모형과의 비교
본 발명의 441개 엑손-접합 라이브러리를 사용한 암 여부 판별 모형의 성능을 기존 마커 (유전자 1072개에 대한 SVM 모형)와 비교하였다. 기존 마커에 대한 모형은 동일한 데이터셋을 이용한 선행연구 [6]에서의 유전자 1,072개를 특성으로 하여 학습한 Support Vector Machine (SVM) 모형으로, 해당 모형의 AUC 스코어를 도 6a에 나타내었고, 본원에 따른 441개 엑손-접합 라이브러리를 특성으로 하여 학습한 SVM 모형의 AUC 스코어는 도 6b에 나타내었다.
도 6a 및 도 6b에서 보듯이, 선행 연구에 사용된 것보다 모형에 입력되는 특성의 개수가 크게 줄었음에도 불구하고 향상된 AUC 스코어를 보이며 우수한 성능을 보이는 것을 알 수 있었다.
또한, 동일한 비교 모형에 대해서 검증 데이터셋에 대한 정확도(Accuracy), 민감도(Sensitivity), 특이도(Specificity) 및 AUC 스코어를 비교하였다.
그 결과, 도 7에서 보듯이, 본원에 따른 441개 엑손-접합 라이브러리에 의한 모형과 선행 연구의 1,072개 유전자를 이용한 모형을 비교한 결과, 441개 엑손-접합 라이브러리를 사용한 모형으로도 암 여부 정확하게 구별해낼 수 있어, 더 많은 특성 사용하는 선행 연구와 비교해도 동등하거나 우월한 성능을 확보할 수 있는 점을 알 수 있었다.
실시예 5. 엑손-접합 마커의 일 예시에 대한 분석
도 8은 정상 샘플에 비해 암 샘플에서 발현이 낮아지는 엑손-접합(exon-junction) 중 암과 정상 샘플에서의 차이가 가장 큰 엑손-접합(exon-junction)의 정량 정보에 대한 일 예시도를 나타낸 것으로, Integrative Genomics Viewer (IGV) 프로그램을 이용한 암 샘플 3개 (빨간색, 상위 3개)와 정상 샘플 3개 (파란색, 하위 3개)의 참조 유전체 매핑 결과를 각각 나타낸 것이다. IGV는 통합적인 유전체 데이터셋을 시각화할 수 있는 프로그램으로, 시퀀싱 데이터 등 다양한 포맷의 데이터를 로드하여 참조 유전체에 매핑한 결과를 보여준다. 암 샘플에서 발현이 낮아지며 정상 샘플과의 차이가 가장 큰 엑손-접합(exon-junction)은 유전자 TRAC의 22,549,683~22,550,556 영역이며, 해당 영역이 도 8의 상단 Refseq Genes 트랙에 표시되어 있다. Refseq Genes 트랙 하단의 6개 트랙은 각 트랙에 로드된 샘플에 대하여 해당 영역에 실제 매핑 된 리드의 깊이를 보여준다. 이를 통해 해당 영역에 매핑 된 리드의 개수가 암과 정상 샘플에서 차이남을 알 수 있었다.
도 9는 정상 샘플에 비해 암 샘플에서 발현이 낮아지는 엑손-접합(exon-junction) 중 암과 정상 샘플에서의 차이가 가장 큰 엑손-접합(exon-junction)의 정규화 된 발현값에 대한 일 예시도를 나타낸 것으로, 도 9a는 학습 데이터셋, 도 9b는 검증 데이터셋에 대한 그래프를 나타낸 것이다. 이 그래프는 모든 샘플을 해당 엑손-접합의 log2CPM 값이 큰 순서대로 정렬하여 막대그래프로 표현한 것이며, 암 샘플은 빨간색, 정상 샘플은 파란색으로 나타내어 암과 정상 샘플에서의 발현 값을 비교하였다. 이를 통하여 학습 데이터셋과 검증 데이터셋 모두 해당 엑손-접합의 발현 값이 정상 샘플에 비해 암 샘플에서 낮게 나타남을 알 수 있다.
실시예 6. 엑손-접합 마커에 대한 feature reduction 분석
도 10은 본원에 따른 441개 엑손-접합 라이브러리의 전체 또는 일부를 사용한 암 여부 판별 모형의 성능에 대한 일 예시도를 나타낸 것이다.
441개 엑손-접합 라이브러리의 일부를 사용한 암 여부 판별 모형의 성능을 측정하기 위하여 어떤 특성이 결과값에 영향을 미친 정도를 나타내는 샤프레이 값 (Shapley value)이 사용되었다. 441개 엑손-접합 라이브러리를 특성으로 한 암 여부 판별 모형에서 샤프레이 값이 가장 작은, 즉 해당 모형에 가장 적게 영향을 미치는 엑손-접합 라이브러리를 1개 제거한 후 나머지 440개의 엑손-접합 라이브러리만을 특성으로 한 암 여부 판별 모형을 학습하였다. 이와 같이 판별 모형에서 가장 적게 영향을 주는 엑손-접합 라이브러리를 1개씩 제거하며 암 여부 판별 모형을 학습하고, 그 성능을 그래프로 나타내었다.
암 여부 판별 모형에서 가장 적게 영향을 주는 엑손-접합 라이브러리를 1개씩 제거하며 학습한 모형에 대해 x축은 모형 학습에 사용된 엑손-접합 라이브러리의 수, y축은 검증 데이터셋의 성능을 나타낸 것으로, 정확도 (Accuracy; acc), 민감도 (Sensitivity; sen), 특이도 (Specificity; spe), AUC 스코어를 각각 표시한 것이다. 여기서 암 여부 판별 모형에 영향을 주는 정도를 기준으로 엑손-접합 라이브러리 번호를 선정하였다(1번이 가장 높은 영향을 주는 엑손-접합 라이브러리). 즉, 위에서 '암 여부 판별에 가장 적게 영향을 주는 엑손-접합 라이브러리를 1개씩 제거'했다는 것은 엑손-접합 라이브러리 441부터 1개씩 제거했다는 것이며, 더 구체적으로 엑손-접합 라이브러리 1 내지 엑손-접합 라이브러리 441를 사용한 모형, 엑손-접합 라이브러리 1 내지 엑손-접합 라이브러리 440을 사용한 모형, … 엑손-접합 라이브러리 1 내지 엑손-접합 라이브러리 2를 사용한 모형 및 엑손-접합 라이브러리 1을 사용했다는 의미이다. 또한 이는 청구범위에서 정의되는 '단수 또는 복수의 엑손-접합 라이브러리'을 의미한다.
실험 결과, 도 10에서 보듯이, 엑손-접합 라이브러리의 수를 줄여가며 일부만 사용했음에도 불구하고 성능이 크게 떨어지지 않으므로 암과 정상을 판별할 때 표 1의 모든 엑손-접합 라이브러리(441개)가 사용되거나 그 일부 (단수 또는 복수의 엑손-접합 라이브러리)만 사용될 수 있다.
[참고문헌]
1. Chen, Ming, and Hongyu Zhao. “Next-generation sequencing in liquid biopsy: cancer screening and early detection.” Human genomics 13.1 (2019): 1-10.
2. Pisapia, Pasquale, et al. “Next generation sequencing for liquid biopsy based testing in non-small cell lung cancer in 2021.” Critical Reviews in Oncology/Hematology 161 (2021): 103311.
3. Liu, Minetta C. “Transforming the landscape of early cancer detection using blood tests―Commentary on current methodologies and future prospects.” British journal of cancer 124.9 (2021): 1475-1477.
4. Ried, Karin, Peter Eng, and Avni Sali. “Screening for circulating tumour cells allows early detection of cancer and monitoring of treatment effectiveness: an observational study.” Asian Pacific journal of cancer prevention: APJCP 18.8 (2017): 2275.
5. Wan, Jonathan CM, et al. “Liquid biopsies come of age: towards implementation of circulating tumour DNA.” Nature Reviews Cancer 17.4 (2017): 223-238.
6. Best, Myron G., et al. "RNA-Seq of tumor-educated platelets enables blood-based pan-cancer, multiclass, and molecular pathway cancer diagnostics." Cancer cell 28.5 (2015): 666-676.
따라서, 본 발명의 방법은 암의 진단, 치료 요법에 대한 모니터링, 암 환자의 예후에 필요한 정보를 제공할 수 있어 항암 치료에 유용하게 이용될 수 있어 산업상 이용가능성이 높다.

Claims (22)

  1. (a) (i) 개체의 혈액의 무핵세포(anucleated cells)에서 분리한 전체 RNA 또는 이의 일부, (ii) 개체의 혈액의 엑소좀(exosome)에서 분리한 전체 RNA 또는 이의 일부, 및 (iii) 개체의 혈액에서 분리한 전체 cfRNA(cell-free RNA) 또는 이의 일부로 이루어진 군에서 선택된 하나 이상의 RNA를 분리하는 단계
    (b) 상기 (a) 단계에서 분리한 RNA에 대한 상보적 DNA (cDNA)을 합성하는 단계;
    (c) 상기 cDNA의 염기서열정보를 수득하는 단계;
    (d) 상기 cDNA 염기서열정보를 미리 정해진 엑손-접합(exon-junction) 라이브러리와 대비하여 각 엑손-접합에서의 염기서열 발현정보를 수득하는 단계; 및
    (e) 상기 각 엑손-접합에서의 염기서열 발현정보를 바탕으로 암 보유 여부를 결정하는 단계를 포함하는, 개체에서 암 진단에 필요한 정보를 제공하기 위해 전사체를 분석하는 방법.
  2. 제1항에 있어서, 상기 암 보유 여부의 결정은 하나 또는 2종류 이상의 암의 보유 여부를 결정하는 것을 특징으로 하는 방법.
  3. 제2항에 있어서, 상기 2종류 이상의 암의 보유 여부의 결정은 개체에서 분리한 1개의 생물학적 시료에서 동시에 또는 순차적으로 결정되는 것을 특징으로 하는 방법.
  4. 제1항에 있어서, 상기 전사체 분석은 차세대 염기서열 분석법 (Next-Generation Sequencing, NGS)에 의해서 수행되는 것을 특징으로 하는 방법.
  5. 제1항에 있어서, 상기 미리 정해진 엑손-접합 라이브러리는 하기 표 1에 기재된 각 염색체에서 position 1 및 position 2의 접합인 것을 특징으로 하는 방법:


  6. 제5항에 있어서, 상기 각 엑손-접합에서의 염기서열 발현정보는 상기 position 1 및 position 2의 각 염기를 포함하면서, 각 염색체의 5'방향 및/또는 3'방향으로 연속되는 2 이상의 염기를 포함하는 서열에 정렬(alignment)되는 염기서열 발현정보인 것을 특징으로 하는 방법.
  7. 제5항에 있어서, 상기 엑손-접합 라이브러리는 상기 표 1에 기재된 단수 또는 복수의 엑손-접합을 포함하며, 상기 단수 또는 복수의 엑손-접합은 엑손-접합 번호 1 , … , 엑손-접합 라이브러리 n-1 및 엑손-접합 라이브러리 n이되, 상기 n은 자연수로서 1 내지 441 중 어느 하나인 것을 특징으로 하는 방법.
  8. 제1항에 있어서, 각 엑손-접합에서의 염기서열 발현정보를 바탕으로 암 보유 여부를 결정하는 것은 사전 학습된 암 여부 판별 모형에 의해서 수행되는 것을 특징으로 하는 방법.
  9. 제8항에 있어서, 상기 사전 학습은 나이브 베이즈 분류(Naive Bayes Classification), 로지스틱 회귀(Logistic Regression), 의사결정나무(Decision tree), 랜덤포레스트(Random forest), 부스팅(XGBoost/ensemble boosting/AdaBoost/Gradient Boost/LightGBM/CatBoost 등), 퍼셉트론(Perceptron), 서포트 벡터 머신(Support Vector Machine), 쿼드라틱 분류(Quadratic classifiers), 클러스터링(K-means clustering, Bayesian network clustering 등), 딥 뉴럴 네트워크(Deep Neural Network)로 이루어진 군에서 선택된 어느 하나의 기계 학습 알고리즘에 의해서 수행되는 것을 특징으로 하는 방법.
  10. 제1항에 있어서, 상기 암은 방광암, 뼈암, 혈액암, 유방암, 흑색종양, 갑상선암, 부갑상선암, 골수암, 직장암, 인후암, 후두암, 폐암, 식도암, 췌장암, 대장암, 위암, 설암, 피부암, 뇌종양, 자궁암, 두부 또는 경부암, 담낭암, 구강암, 결장암, 항문 부근암, 중추신경계 종양, 간암 및 대장암으로 이루어진 군에서 선택되는 것을 특징으로 하는 방법.
  11. 상기 표 1의 엑손-접합(exon-junction)으로 이루어진 군에서 선택된 단수 또는 복수의 엑손-접합을 유효성분으로 포함하는 암 진단용 조성물이며, 상기 엑손-접합은 (i) 개체의 혈액의 무핵세포(anucleated cells)에서 분리한 RNA 또는 이의 일부, (ii) 개체의 혈액의 엑소좀(exosome)에서 분리한 전체 RNA 또는 이의 일부, 및 (iii) 개체의 혈액에서 분리한 전체 cfRNA(cell-free RNA) 또는 이의 일부에서 검출하는 것을 특징으로 하는 암 진단용 조성물.
  12. 제11항에 있어서, 상기 암 진단은 하나 또는 2종류 이상의 암의 진단인 것을 특징으로 하는 암 진단용 조성물.
  13. 제12항에 있어서, 상기 2종류 이상의 암의 진단은 개체에서 분리한 1개의 생물학적 시료에서 동시에 또는 순차적으로 진단되는 것을 특징으로 하는 암 진단용 조성물.
  14. 제11항에 있어서, 상기 암은 방광암, 뼈암, 혈액암, 유방암, 흑색종양, 갑상선암, 부갑상선암, 골수암, 직장암, 인후암, 후두암, 폐암, 식도암, 췌장암, 대장암, 위암, 설암, 피부암, 뇌종양, 자궁암, 두부 또는 경부암, 담낭 암, 구강암, 결장암, 항문 부근암, 중추신경계 종양, 간암 및 대장암으로 이루어진 군에서 선택되는 것을 특징으로 하는 진단용 조성물.
  15. 제11항의 조성물을 포함하는 암 진단 키트.
  16. 제15항에 있어서, 상기 암 진단은 하나 또는 2종류 이상의 암의 진단인 것을 특징으로 하는 암 진단 키트.
  17. 제16항에 있어서, 상기 2종류 이상의 암의 진단은 개체에서 분리한 1개의 생물학적 시료에서 동시에 또는 순차적으로 결정되는 것을 특징으로 하는 암 진단 키트.
  18. 제15항에 있어서, 상기 암은 방광암, 뼈암, 혈액암, 유방암, 흑색종양, 갑상선암, 부갑상선암, 골수암, 직장암, 인후암, 후두암, 폐암, 식도암, 췌장암, 대장암, 위암, 설암, 피부암, 뇌종양, 자궁암, 두부 또는 경부암, 담낭 암, 구강암, 결장암, 항문 부근암, 중추신경계 종양, 간암 및 대장암으로 이루어진 군에서 선택되는 것을 특징으로 암 진단 키트.
  19. 상기 표 1의 엑손-접합(exon-junction)으로 이루어진 군에서 선택된 단수 또는 복수의 엑손-접합을 검출할 수 있는 제제를 포함하는, 암 진단용 조성물이며, 상기 엑손-접합은 (i) 개체의 혈액의 무핵세포(anucleated cells)에서 분리한 전체 RNA 또는 이의 일부, (ii) 개체의 혈액의 엑소좀(exosome)에서 분리한 전체 RNA 또는 이의 일부, 및 (iii) 개체의 혈액에서 분리한 전체 cfRNA(cell-free RNA) 또는 이의 일부에서 검출하는 것을 특징으로 하는 암 진단용 조성물.
  20. 제19항에 있어서, 상기 암 진단은 하나 또는 2종류 이상의 암의 진단인 것을 특징으로 하는 암 진단용 조성물.
  21. 제20항에 있어서, 상기 2종류 이상의 암의 진단은 개체에서 분리한 1개의 생물학적 시료에서 동시에 또는 순차적으로 결정되는 것을 특징으로 하는 암 진단용 조성물.
  22. 제19항에 있어서, 상기 암은 방광암, 뼈암, 혈액암, 유방암, 흑색종양, 갑상선암, 부갑상선암, 골수암, 직장암, 인후암, 후두암, 폐암, 식도암, 췌장암, 대장암, 위암, 설암, 피부암, 뇌종양, 자궁암, 두부 또는 경부암, 담낭 암, 구강암, 결장암, 항문 부근암, 중추신경계 종양, 간암 및 대장암으로 이루어진 군에서 선택되는 것을 특징으로 하는 암 진단용 조성물.

KR1020230138881A 2022-10-17 2023-10-17 혈액 내 rna의 엑손-접합 정보를 이용한 암 진단 방법 KR20240054194A (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR20220133331 2022-10-17
KR1020220133331 2022-10-17

Publications (1)

Publication Number Publication Date
KR20240054194A true KR20240054194A (ko) 2024-04-25

Family

ID=90738201

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020230138881A KR20240054194A (ko) 2022-10-17 2023-10-17 혈액 내 rna의 엑손-접합 정보를 이용한 암 진단 방법

Country Status (2)

Country Link
KR (1) KR20240054194A (ko)
WO (1) WO2024085608A1 (ko)

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20200165687A1 (en) * 2017-06-27 2020-05-28 The University Of Tokyo Probe and method for detecting transcript resulting from fusion gene and/or exon skipping
AU2019403269A1 (en) * 2018-12-18 2021-06-17 Grail, Llc Methods for detecting disease using analysis of RNA

Also Published As

Publication number Publication date
WO2024085608A1 (ko) 2024-04-25

Similar Documents

Publication Publication Date Title
EP3440205B1 (en) Noninvasive diagnostics by sequencing 5-hydroxymethylated cell-free dna
CN110177886B (zh) 基于胃癌生物学特征的集群分类及预后预测系统
US10138520B2 (en) Diagnostic miRNA markers for Alzheimer
Salido‑Guadarrama et al. Urinary microRNA-based signature improves accuracy of detection of clinically relevant prostate cancer within the prostate-specific antigen grey zone
CN107075730A (zh) 循环核酸的鉴定及用途
JP2014509189A (ja) 結腸ガン遺伝子発現シグネチャーおよび使用方法
EP3494235A1 (en) Swarm intelligence-enhanced diagnosis and therapy selection for cancer using tumor- educated platelets
CN104903468A (zh) 用于帕金森氏病的新诊断MiRNA标志物
AU2011282233A1 (en) Methods and systems for analysis of single cells
US20110294684A1 (en) Gene expression signatures for lung cancers
KR101501826B1 (ko) 위암에 대한 예후 예측 모형의 제조방법
US10196696B2 (en) RNA-biomarkers for diagnosis of prostate cancer
CN104968802A (zh) 作为诊断标志物的新miRNA
CA2696947A1 (en) Methods and tools for prognosis of cancer in er- patients
EP4214335A1 (en) Prognostic method for aggressive lung adenocarcinomas
KR102096498B1 (ko) 대장암 진단 또는 재발 예측을 위한 마이크로RNA-4732-5p 및 이의 용도
EP3227460B1 (en) Novel rna-biomarker signature for diagnosis of prostate cancer
US10787711B2 (en) Method for differentiating between lung squamous cell carcinoma and lung adenocarcinoma
KR20240054194A (ko) 혈액 내 rna의 엑손-접합 정보를 이용한 암 진단 방법
CN110592219B (zh) 一种用于乳腺癌的lncRNA诊治标志物
CN109609649B (zh) 一种用于直肠腺癌诊疗的lncRNA
CN108728439A (zh) 小rna组成的指纹图谱及其在膀胱癌诊断中的应用
CN109777876A (zh) miRNA-6761-5p及其新用途
KR101504818B1 (ko) 위암에 대한 예후 예측 시스템
CN109680066B (zh) 一种区分左右半结肠癌的miRNA及应用