WO2024085608A1

WO2024085608A1 - 혈액 내 rna의 엑손-접합 정보를 이용한 암 진단 방법

Info

Publication number: WO2024085608A1
Application number: PCT/KR2023/016067
Authority: WO
Inventors: 안태진; 안은용; 박성민; 김사라
Original assignee: 주식회사 포어텔마이헬스
Priority date: 2022-10-17
Filing date: 2023-10-17
Publication date: 2024-04-25
Also published as: KR20240054194A

Abstract

본 발명은 혈액 내 RNA의 엑손-접합 정보를 이용한 암 진단 방법에 관한 것으로서, 보다 구체적으로는 개체의 혈액의 무핵세포 또는 엑소좀에서 분리한 RNA; 또는 cfRNA를 분리하고, 이의 전사체 데이터를 얻은 다음 엑손-접합에서의 염기서열 발현정보를 이용하여 암 보유 여부를 결정하는, 개체에서 암 진단에 필요한 정보를 제공하기 위해 전사체를 분석하는 방법에 관한 것이다. 본 발명의 방법은 암의 진단에 필요한 정보를 제공할 수 있어 항암 치료 요법에 유용하게 이용될 수 있다.

Description

혈액 내 RNA의 엑손-접합 정보를 이용한 암 진단 방법

본 출원은 2022년 10월 17일에 출원된 대한민국 특허출원 제 10-2022-0133331호를 우선권으로 주장하고, 상기 명세서 전체는 본 출원의 참고문헌이다.

본 발명은 혈액 내 RNA의 엑손-접합 정보를 이용한 암 진단 방법에 관한 것으로서, 보다 구체적으로는 (a) (i) 개체의 혈액의 무핵세포(anucleated cells)에서 분리한 전체 RNA 또는 이의 일부, (ii) 개체의 혈액의 엑소좀(exosome)에서 분리한 전체 RNA 또는 이의 일부, 및 (iii) 개체의 혈액에서 분리한 전체 cfRNA(cell-free RNA) 또는 이의 일부로 이루어진 군에서 선택된 하나 이상의 RNA를 분리하는 단계; (b) 상기 (a) 단계에서 분리한 RNA에 대한 상보적 DNA (cDNA)을 합성하는 단계; (c) 상기 cDNA의 염기서열정보를 수득하는 단계; (d) 상기 cDNA 염기서열정보를 미리 정해진 엑손-접합(exon-junction) 라이브러리와 대비하여 각 엑손-접합에서의 염기서열 발현정보를 수득하는 단계; 및 (e) 상기 각 엑손-접합에서의 염기서열 발현정보를 바탕으로 암 보유 여부를 결정하는 단계를 포함하는, 개체에서 암 진단에 필요한 정보를 제공하기 위해 전사체를 분석하는 방법에 관한 것이다.

차세대 염기서열 분석(Next-Generation Sequencing, NGS) 기술을 사용하여 환자의 혈액 내의 엑소좀, 순환성 종양세포 (Circulating Tumor Cell, CTCs), 순환 종양성 DNA (ctDNA) 등의 핵산 정보를 분석하는 액체생검 (Liquid Biopsy) 기술이 암 질환 진단 및 치료에 도입되고 있다 [1].

액체 생검은 비침습성 기술로, 조직 생검 (Tissue Biopsy)에 비해 채취에 편리하고 소량의 혈액으로 빠른 분석이 가능하여 조직생검 없이 액체 생검으로 암 판별과 모니터링이 가능해졌다 [2].

그러나 액체생검은 혈액 내 존재하는 분자 수가 적은 한계로 인해 기존 기술로는 암 검출 민감도가 낮다 [3, 4, 5]. 따라서 효과적인 암 조기 판별 스크리닝을 위해서는 암에서도 혈액 내 존재하는 분자 수가 많은 바이오 마커를 활용하여 민감도를 높일 필요성이 있다.

이에 본 발명자들은 효과적인 암 조기 판별 스크리닝을 위해서는 암에서도 혈액 내 존재하는 분자 수가 많은 바이오 마커를 활용하기 위해 연구하던 중, 혈소판과 같은 무핵세포, 엑소좀과 같은 세포 유래 막 구조물, 또는 무세포 RNA에서 전사체 (transcriptome) 데이터를 확보하고 이를 분석하여 엑손 접합 정보를 바이오마커로 이용하면 피험자의 암과 정상 여부를 판별할 수 있다는 점, 특히 사전 학습된 암 여부 판별 모형 기반의 머신러닝 알고리즘을 이용하여 분석하여 엑손 접합 정보를 바이오마커로 이용하면 피험자의 암과 정상 여부를 판별할 수 있다는 점을 확인하여 본 발명을 완성하였다.

따라서, 본 발명의 목적은

(a) (i) 개체의 혈액의 무핵세포(anucleated cells)에서 분리한 전체 RNA 또는 이의 일부, (ii) 개체의 혈액의 엑소좀(exosome)에서 분리한 전체 RNA 또는 이의 일부, 및 (iii) 개체의 혈액에서 분리한 전체 cfRNA(cell-free RNA) 또는 이의 일부로 이루어진 군에서 선택된 하나 이상의 RNA를 분리하는 단계

(b) 상기 (a) 단계에서 분리한 RNA에 대한 상보적 DNA (cDNA)을 합성하는 단계;

(c) 상기 cDNA의 염기서열정보를 수득하는 단계;

(d) 상기 cDNA 염기서열정보를 미리 정해진 엑손-접합(exon-junction) 라이브러리와 대비하여 각 엑손-접합에서의 염기서열 발현정보를 수득하는 단계; 및

(e) 상기 각 엑손-접합에서의 염기서열 발현정보를 바탕으로 암 보유 여부를 결정하는 단계를 포함하는, 개체에서 암 진단에 필요한 정보를 제공하기 위해 전사체를 분석하는 방법을 제공하는 것이다.

본 발명의 다른 목적은 단수 또는 복수의 엑손-접합을 유효성분으로 포함하는 암 진단용 조성물이며, 상기 엑손-접합은 (i) 개체의 혈액의 무핵세포에서 분리한 RNA 또는 이의 일부, (ii) 개체의 혈액의 엑소좀에서 분리한 전체 RNA 또는 이의 일부, 및 (iii) 개체의 혈액에서 분리한 전체 cfRNA 또는 이의 일부에서 검출하는 것을 특징으로 하는 암 진단용 조성물을 제공하는 것이다.

본 발명의 또다른 목적은, 단수 또는 복수의 엑손-접합으로 이루어진 암 진단용 조성물이며, 상기 엑손-접합은 (i) 개체의 혈액의 무핵세포에서 분리한 RNA 또는 이의 일부, (ii) 개체의 혈액의 엑소좀에서 분리한 전체 RNA 또는 이의 일부, 및 (iii) 개체의 혈액에서 분리한 전체 cfRNA 또는 이의 일부에서 검출하는 것을 특징으로 하는 암 진단용 조성물을 제공하는 것이다.

본 발명의 또다른 목적은, 단수 또는 복수의 엑손-접합으로 필수적으로 이루어지는 암 진단용 조성물이며, 상기 엑손-접합은 (i) 개체의 혈액의 무핵세포에서 분리한 RNA 또는 이의 일부, (ii) 개체의 혈액의 엑소좀에서 분리한 전체 RNA 또는 이의 일부, 및 (iii) 개체의 혈액에서 분리한 전체 cfRNA 또는 이의 일부에서 검출하는 것을 특징으로 하는 암 진단용 조성물을 제공하는 것이다.

본 발명의 또다른 목적은 상기 조성물을 포함하는 암 진단 키트를 제공하는 것이다.

본 발명의 또다른 목적은 상기 조성물로 이루어진 암 진단 키트를 제공하는 것이다.

본 발명의 또다른 목적은 상기 조성물로 필수적으로 이루어진 암 진단 키트를 제공하는 것이다.

본 발명의 또다른 목적은 단수 또는 복수의 엑손-접합을 검출할 수 있는 제제를 포함하는, 암 진단용 조성물이며, 상기 엑손-접합은 (i) 개체의 혈액의 무핵세포에서 분리한 전체 RNA 또는 이의 일부, (ii) 개체의 혈액의 엑소좀에서 분리한 전체 RNA 또는 이의 일부, 및 (iii) 개체의 혈액에서 분리한 전체 cfRNA 또는 이의 일부에서 검출하는 것을 특징으로 하는 암 진단용 조성물을 제공하는 것이다.

본 발명의 또다른 목적은 단수 또는 복수의 엑손-접합을 검출할 수 있는 제제로 이루어진, 암 진단용 조성물이며, 상기 엑손-접합은 (i) 개체의 혈액의 무핵세포에서 분리한 전체 RNA 또는 이의 일부, (ii) 개체의 혈액의 엑소좀에서 분리한 전체 RNA 또는 이의 일부, 및 (iii) 개체의 혈액에서 분리한 전체 cfRNA 또는 이의 일부에서 검출하는 것을 특징으로 하는 암 진단용 조성물을 제공하는 것이다.

본 발명의 또다른 목적은 단수 또는 복수의 엑손-접합을 검출할 수 있는 제제로 필수적으로 이루어진 암 진단용 조성물이며, 상기 엑손-접합은 (i) 개체의 혈액의 무핵세포에서 분리한 전체 RNA 또는 이의 일부, (ii) 개체의 혈액의 엑소좀에서 분리한 전체 RNA 또는 이의 일부, 및 (iii) 개체의 혈액에서 분리한 전체 cfRNA 또는 이의 일부에서 검출하는 것을 특징으로 하는 암 진단용 조성물을 제공하는 것이다.

본 발명의 또다른 목적은 암 진단용 조성물을 제조하기 위한, 상기 표 1의 엑손-접합(exon-junction)으로 이루어진 군에서 선택된 단수 또는 복수의 엑손-접합을 검출할 수 있는 제제의 용도를 제공하는 것이다.

본 발명의 또다른 목적은 (a) (i) 개체의 혈액의 무핵세포(anucleated cells)에서 분리한 전체 RNA 또는 이의 일부, (ii) 개체의 혈액의 엑소좀(exosome)에서 분리한 전체 RNA 또는 이의 일부, 및 (iii) 개체의 혈액에서 분리한 전체 cfRNA(cell-free RNA) 또는 이의 일부로 이루어진 군에서 선택된 하나 이상의 RNA를 분리하는 단계

(c) 상기 cDNA의 염기서열정보를 수득하는 단계;

(e) 상기 각 엑손-접합에서의 염기서열 발현정보를 바탕으로 암 보유 여부를 결정하는 단계를 포함하는, 암 진단 방법을 제공하는 것이다.

상기와 같은 목적을 달성하기 위하여, 본 발명은 (a) (i) 개체의 혈액의 무핵세포(anucleated cells)에서 분리한 전체 RNA 또는 이의 일부, (ii) 개체의 혈액의 엑소좀(exosome)에서 분리한 전체 RNA 또는 이의 일부, 및 (iii) 개체의 혈액에서 분리한 전체 cfRNA(cell-free RNA) 또는 이의 일부로 이루어진 군에서 선택된 하나 이상의 RNA를 분리하는 단계;

(c) 상기 cDNA의 염기서열정보를 수득하는 단계;

(e) 상기 각 엑손-접합에서의 염기서열 발현정보를 바탕으로 암 보유 여부를 결정하는 단계를 포함하는, 개체에서 암 진단에 필요한 정보를 제공하기 위해 전사체를 분석하는 방법을 제공한다.

본 발명의 다른 목적을 달성하기 위하여, 본 발명은 단수 또는 복수의 엑손-접합을 유효성분으로 포함하는 암 진단용 조성물이며, 상기 엑손-접합은 (i) 개체의 혈액의 무핵세포에서 분리한 RNA 또는 이의 일부, (ii) 개체의 혈액의 엑소좀에서 분리한 전체 RNA 또는 이의 일부, 및 (iii) 개체의 혈액에서 분리한 전체 cfRNA 또는 이의 일부에서 검출하는 것을 특징으로 하는 암 진단용 조성물을 제공한다.

또한, 본 발명의 다른 목적을 달성하기 위하여, 본 발명은 단수 또는 복수의 엑손-접합으로 이루어진 암 진단용 조성물이며, 상기 엑손-접합은 (i) 개체의 혈액의 무핵세포에서 분리한 RNA 또는 이의 일부, (ii) 개체의 혈액의 엑소좀에서 분리한 전체 RNA 또는 이의 일부, 및 (iii) 개체의 혈액에서 분리한 전체 cfRNA 또는 이의 일부에서 검출하는 것을 특징으로 하는 암 진단용 조성물을 제공한다.

또한, 본 발명의 다른 목적을 달성하기 위하여, 본 발명은 단수 또는 복수의 엑손-접합으로 필수적으로 이루어지는 암 진단용 조성물이며, 상기 엑손-접합은 (i) 개체의 혈액의 무핵세포에서 분리한 RNA 또는 이의 일부, (ii) 개체의 혈액의 엑소좀에서 분리한 전체 RNA 또는 이의 일부, 및 (iii) 개체의 혈액에서 분리한 전체 cfRNA 또는 이의 일부에서 검출하는 것을 특징으로 하는 암 진단용 조성물을 제공한다.

본 발명의 또다른 목적을 달성하기 위하여, 본 발명은 상기 조성물을 포함하는 암 진단 키트를 제공한다.

또한, 본 발명은 상기 조성물로 이루어진 암 진단 키트를 제공한다.

또한, 본 발명은 상기 조성물로 필수적으로 이루어진 암 진단 키트를 제공한다.

본 발명의 또다른 목적을 달성하기 위하여, 본 발명은 단수 또는 복수의 엑손-접합을 검출할 수 있는 제제를 포함하는, 암 진단용 조성물이며, 상기 엑손-접합은 (i) 개체의 혈액의 무핵세포에서 분리한 전체 RNA 또는 이의 일부, (ii) 개체의 혈액의 엑소좀에서 분리한 전체 RNA 또는 이의 일부, 및 (iii) 개체의 혈액에서 분리한 전체 cfRNA 또는 이의 일부에서 검출하는 것을 특징으로 하는 암 진단용 조성물을 제공한다.

또한, 본 발명은 단수 또는 복수의 엑손-접합을 검출할 수 있는 제제로 이루어진, 암 진단용 조성물이며, 상기 엑손-접합은 (i) 개체의 혈액의 무핵세포에서 분리한 전체 RNA 또는 이의 일부, (ii) 개체의 혈액의 엑소좀에서 분리한 전체 RNA 또는 이의 일부, 및 (iii) 개체의 혈액에서 분리한 전체 cfRNA 또는 이의 일부에서 검출하는 것을 특징으로 하는 암 진단용 조성물을 제공한다.

또한, 본 발명은 단수 또는 복수의 엑손-접합을 검출할 수 있는 제제로 필수적으로 이루어진 암 진단용 조성물이며, 상기 엑손-접합은 (i) 개체의 혈액의 무핵세포에서 분리한 전체 RNA 또는 이의 일부, (ii) 개체의 혈액의 엑소좀에서 분리한 전체 RNA 또는 이의 일부, 및 (iii) 개체의 혈액에서 분리한 전체 cfRNA 또는 이의 일부에서 검출하는 것을 특징으로 하는 암 진단용 조성물을 제공한다.

본 발명의 또다른 목적을 달성하기 위하여, 본 발명은 암 진단용 조성물을 제조하기 위한, 상기 표 1의 엑손-접합(exon-junction)으로 이루어진 군에서 선택된 단수 또는 복수의 엑손-접합을 검출할 수 있는 제제의 용도를 제공한다.

본 발명의 또다른 목적을 달성하기 위하여, 본 발명은 (a) (i) 개체의 혈액의 무핵세포(anucleated cells)에서 분리한 전체 RNA 또는 이의 일부, (ii) 개체의 혈액의 엑소좀(exosome)에서 분리한 전체 RNA 또는 이의 일부, 및 (iii) 개체의 혈액에서 분리한 전체 cfRNA(cell-free RNA) 또는 이의 일부로 이루어진 군에서 선택된 하나 이상의 RNA를 분리하는 단계

(c) 상기 cDNA의 염기서열정보를 수득하는 단계;

(e) 상기 각 엑손-접합에서의 염기서열 발현정보를 바탕으로 암 보유 여부를 결정하는 단계를 포함하는, 암 진단 방법을 제공한다.

다른 정의가 없는 한, 본 명세서에 사용된 모든 기술적 및 과학적 용어는 당업자들에 의해 통상적으로 이해되는 동일한 의미를 가진다. 다음의 참고문헌은 본 발명의 명세서에 사용된 여러 용어들의 일반적인 정의를 갖는 기술(skill)의 하나를 제공한다: Singleton et al., DICTIONARY OF MICROBIOLOGY AND MOLECULAR BIOLOTY(2th ed. 1994); THE CAMBRIDGE DICTIONARY OF SCIENCE AND TECHNOLOGY(Walkered., 1988); 및 Hale & Marham, THE HARPER COLLINS DICTIONARY OF BIOLOGY

이하, 본 발명을 상세히 설명한다.

지혈과 응고에 주된 역할을 하는 것으로 알려진 혈소판은 암의 성장, 전이, 면역 회피에 도움을 주며, 암 세포는 혈소판의 RNA 발현 과정에 직접 또는 간접적으로 영향을 미쳐 혈소판의 발현을 변화시키는 것으로 보고되었다. 하나의 암 세포가 수만 개의 혈소판을 변화시킬 수 있으므로 혈소판의 전사체 정보는 암 판별을 돕는 바이오마커로서 본 발명에 활용될 수 있다. 특히 암 세포들에 의하여 변화된 혈소판 세포의 RNA는 선택적 스플라이싱(alternative splicing)패턴이 암 특이적으로 변화할 수 있기에 이를 암을 진단하는 바이오마커로 본 발명에서 활용하고자 한다. 또한, 혈소판은 혈액 내의 대표적인 무핵세포 (anucleated cell로서 엑소좀과 cfRNA의 주요한 소스 (source)로 알려져 있다 (Mol Oncol. 2021 Jun; 15(6): 1727-1743).

따라서, 본 발명은

(a) (i) 개체의 혈액의 무핵세포에서 분리한 전체 RNA 또는 이의 일부, (ii) 개체의 혈액의 엑소좀에서 분리한 전체 RNA 또는 이의 일부, 및 (iii) 개체의 혈액에서 분리한 전체 cfRNA 또는 이의 일부로 이루어진 군에서 선택된 하나 이상의 RNA를 분리하는 단계;

(c) 상기 cDNA의 염기서열정보를 수득하는 단계;

(d) 상기 cDNA 염기서열정보를 미리 정해진 엑손-접합 라이브러리와 대비하여 각 엑손-접합에서의 염기서열 발현정보를 수득하는 단계; 및

(a) 단계는 (i) 개체의 혈액의 무핵세포에서 분리한 전체 RNA 또는 이의 일부, (ii) 개체의 혈액의 엑소좀에서 분리한 전체 RNA 또는 이의 일부, 및 (iii) 개체의 혈액에서 분리한 전체 cfRNA 또는 이의 일부로 이루어진 군에서 선택된 하나 이상의 RNA를 분리하는 단계이다.

샘플은 예컨대 공지되거나 또는 의심되는 개체에서 분리된 것일 수 있다. 샘플은 개체로부터 원래 분리된 형태일 수 있거나 또는 세포와 같은 성분을 제거 또는 부가하기 위해 또는 또 다른 성분과 비교하여 한 성분을 풍부화시키기 위해 추가로 프로세싱시킬 수 있다. 샘플은 개체로부터 분리 또는 수득될 수 있고, 샘플 분석 장치로 수송될 수 있다. 샘플은 원하는 온도, 예를 들어, 실온, 4℃, -20℃, 및/또는 -80℃ 하에 보존 및 선적될 수 있다.

예를 들어, 샘플은 액체 생검(liquid biopsy)을 위해 개체로부터 혈액 샘플을 채취하고, 이 때, 채취한 혈액은 품질 관리(Quality Check, QC) 지표를 확인하여 사용 여부를 결정할 수 있고, 이로써 판별의 정확도를 높일 수 있다. 이 후, 채취한 혈액 샘플로부터 혈소판과 같은 무핵세포, 엑소좀 및 cfRNA로 이루어진 군에서 선택된 하나 이상을 분리한다. 분리하는 방법으로 당업계에 공지된 방법에 의할 수 있으며, 바람직하게는 원심분리 등을 통하여 이들을 분리할 수 있다. cfRNA의 경우 혈액, 혈장, 혈청 또는 이들의 분획에서 직접 cDNA 합성에 이용될 수 있다.

개체는 인간, 포유동물, 동물, 애완용 동물, 서비스 동물, 또는 애완동물일 수 있다. 개체는 질환이 있을 수 있다. 개체는 질환 또는 검출 가능한 질환 증상이 없을 수 없다. 개체는 하나 이상의 요법, 예를 들어, 수술, 처치, 투약, 화학요법, 항체, 백신 또는 생물 제제 중 어느 하나 이상으로 치료받은 적이 있을 수 있다. 개체는 차도가 있을 수 있거나 또는 그렇지 않을 수 있다.

본 발명에서 상기 '무핵세포'는 핵이 존재하지 않는 세포로서 세포분열을 통해 딸세포를 생성하지 못하는 세포를 의미한다. 상기 무핵세포는 혈소판, 적혈구 그리고 불완전한 세포분열로 인해 핵을 보유하지 못한 일체의 세포를 포함하며, 바람직하게는 혈소판 또는 적혈구일 수 있고, 가장 바람직하게는 혈소판일 수 있다.

본 발명에서 상기 '엑소좀'은 나노 단위 크기(예컨대, 50-90 nm)를 갖는 소낭 구조를 갖는 세포밖 소포체를 의미하며, 유래되는 세포의 세포막 성분으로 이루어진 지질이중막에 의해 엑소좀 내부와 외부가 분리된 구조를 가지며, 세포의 세포막 지질, 세포막 단백질, 핵산 및 세포 성분 등을 가지고 있다. 본 발명에서 엑소좀의 유래는 특별히 제한되지는 않으나, 바람직하게는 혈액으로부터 분리된 것일 수 있다. 엑소좀은 세포 간의 mRNA, miRNA, DNA, 및 단백질의 운송을 매개하고 세포 내외의 신호전달 및 상호작용에 중요한 역할을 한다. 엑소좀은 당업계에 알려진 방법을 제한 없이 사용하여 분리될 수 있으며, 예를 들어, 초원심분리(ultra-centrifugation isolation), 크기별 제외법(size exclusion), 면역친화성 분리(immunoaffinity isolation), 미세유체 기술(microfluidics chip) 및 폴리머를 이용한 방법(polymeric method) 등을 사용하여 엑소좀을 분리할 수 있다. 또한, 시판중인 엑소좀 분리용 키트(예컨대, Exo2DTM EV isolation kit)를 사용하여 엑소좀을 분리할 수 있다.

무핵세포 및/또는 엑소좀으로부터 RNA의 분리는 당업계에 공지된 다양한 방법을 통해 이루어질 수 있다. 예를 들어 RNA의 분리 방법으로는, 티오시안산구아니딘·염화세슘 초원심법, 티오시안산구아니딘·핫 페놀법, 구아니딘 염산법, 산성 티오시안산구아니딘·페놀·클로로포름법 (Chomczynski, P. and Sacchi, N., Anal. Biochem. (1987), 162, 156-159) 등을 포함하며 이에 제한되지 않는다. 또한, 시판되는 RNA 추출용 시약 (예를 들어, RNA queous kit (Ambion Inc., Austin, TX), Micro-to-midi total RNA purification system (Invitrogen), NucleoSpin RNA II (BD Biosciences Clontech, Palo Alto, CA), RNeasy mini kit (Qiagen), GenElute mammalian total RNA kit (Sigma-Aldrich, and Trizol LS reagent (Invitrogen)) 등을 시약으로 첨부된 프로토콜에 따라 사용할 수도 있다. 상기 당업계에 공지된 RNA의 분리에 관하여, 이에 대한 구체적인 방법은 Joseph Sambrook, et al.,MolecularCloning, A LaboratoryManual, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y.(2001)에 개시되어 있으며, 이 문헌은 본 명세서에 참조로써 삽입된다.

분리된 RNA 분획은, 필요에 따라 추가로 mRNA만으로 정제하여 사용될 수 있다. 정제방법은 공지의 RNA 정제법이라면 특별히 제한되지 않지만, 예를 들어 비오틴화한 올리고 (dT) 프로브에 mRNA를 흡착시켜, 또한 스트렙토아비딘을 고정화한 상자성 입자에, 비오틴/스트렙토아비딘의 결합을 사용하여 mRNA를 포착하여 세정 조작한 후, mRNA를 용출함으로써, mRNA를 정제할 수 있다. 또한, 올리고 (dT) 셀룰로오스 칼럼에 mRNA를 흡착시키고, 다음으로 이것을 용출하여 정제하는 방법도 채용할 수 있다. 다만, 본 발명의 방법을 위해서는, 상기 mRNA의 정제공정은 필수가 아니라 선택적으로 수행될 수 있다.

(b) 단계는 상기 (a) 단계에서 분리한 RNA에 대한 상보적 DNA (cDNA)을 합성하는 단계이다.

RNA로부터 cDNA를 합성하는 방법은 당업계에 공지된 방법에 따라 제한없이 수행될 수 있다. 예를 들어, RNA에 역전사 효소와 디옥시리보뉴클레오티드를 첨가하여 mRNA 사슬을 주형으로 1차 DNA 가닥을 복사한다. 이후, RNA 분해효소 (RNase H)를 처리하여 DNA-RNA 혼성 double strands로부터 mRNA를 제거한다. 이후, DNA중합효소를 처리하여 역전사에 의해 만들어진 DNA 가닥을 주형으로 하여 DNA의 두 번째 가닥을 형성하여 템플릿을 완성하는 방법에 따라 cDNA가 합성될 수 있다.

(c) 단계는 상기 cDNA의 염기서열정보를 수득하는 단계이다.

본 발명의 하나의 양태에서 염기서열정보를 분석하는 것은 당업계에 공지된 염기서열정보 분석 방법에 의해서 수행될 수 있다. 염기서열정보 분석은 상보적 cDNA의 한 쪽 사슬(strand) 또는 이들 각각의 서열을 해독한다. 서열 해독은 대량의 단편, 바람직하게는 적어도 10000개이상, 적어도 20000개이상, 적어도 30000개이상, 적어도 40000개이상, 적어도 50000개이상, 적어도 100000개이상, 적어도 1000000개 이상의 단편을 해독하므로 이에 적합한 해독 방법이 바람직하다.

염기서열정보 분석은 당업계에 공지된 염기서열정보 분석법이 사용될 수 있으나, 각 단편의 서열을 충분한 수량으로 해독하기 위하여 대량의 서열해독이 가능한 방법이라면 제한없이 사용될 수 있다. 본 발명의 상기 염기서열의 분석은 이에 제한되지는 않으나, 차세대 염기서열 분석법 (Next-Generation Sequencing, NGS)에 의해서 수행될 수 있다. 차세대 염기서열 분석법이 사용되는 경우 대량의 서열을 수 시간 내에 적은 비용으로 해독할 수 있다는 장점이 있으며, 충분한 양의 서열을 읽는 경우 정확도가 아주 높으며 해독된 데이터를 정성, 정량적으로 분석이 가능하다.

본 발명에서 상기 분석된 염기서열정보는 리드(reads)로도 불릴 수 있다.

한편, 엑손 접합 부위의 염기서열 분석을 위하여 적절한 어댑터(adapter)를 부착할 수도 있다.

(d) 단계는 상기 cDNA 염기서열정보를 미리 정해진 엑손-접합(exon-junction) 라이브러리와 대비하여 각 엑손-접합에서의 염기서열 발현정보를 수득하는 단계이다.

상기 (d) 단계에서는 상기 (c) 단계에서 수득된 염기서열정보에서 엑손-접합에 의해서 생긴 서열의 발현정보를 수득한다. 예를 들어, 상기 (c) 단계에서의 염기서열정보 분석이 NGS에 의해서 수행된 경우, 미리 정해진 엑손-접합 라이브러리에 정렬(alignment)되는 염기서열의 빈도, 즉 리드수(read-count)를 계수한다. 즉, 한 개 샘플 해독으로 얻은 모든 서열에서 미리 정해진 엑손-접합 라이브러리와 대비하여 각각 다른 엑손-접합 종류에 대해서 해당 서열의 리드의 수를 계수한다.

상기 염기서열정보에서 엑손-접합에 의해 생긴 서열의 발현정보, 즉, 리드수는 한 유전자 내에 존재하는 서로 다른 두 개의 엑손들의 최말단에 맵핑된 염기서열(리드), 즉 상위 엑손의 끝 부분과 하위 엑손의 시작 부분으로부터 최소 1개 이상의 연속된 엑손 영역의 염기쌍을 포함하는 염기서열(리드)의 수이며, 이 때 서로 다른 두 개의 엑손들의 경우 참조 유전체 상에서 바로 인접한 엑손이 아니어도 된다. 또한 해독되지 아니하는 인트론 부분을 포함하는 서열의 경우는 상기 엑손-접합에서의 염기서열 발현정보, 즉 리드수로 계수하지 아니한다(도 4 참고).

계수된 각 값은 다른 샘플들의 값과 비교하기 위해 정규화될 수 있다. 이 정규화는 각 샘플마다 해독된 양이 다를 경우 샘플간의 직접적인 정량적인 비교를 위해 해독된 양에 비례하는 값으로 집계된 각 값을 나누는 것이다. 이 때, 해독된 양에 비례하는 값은 각 샘플의 해독된 전체 서열수, house keeping 유전자 영역에 맵핑된 서열수 등 다양한 값이 가능하다.

본 발명에서 상기 미리 정해진 엑손-접합 라이브러리는 표 1에 기재된 유전자 및 해당 염색체에서의 위치 정보로 표시되는 엑손-접합 부위에 대한 정보를 나타낸다. 하기 표 1에서 각각의 유전자 및 해당 염색체가 표시되어 있고, 엑손 접합이 되는 상위 위치의 엑손의 끝 부분 (position 1) 및 하위 위치 엑손의 시작 부분 (position 2)이 해당 염색체에서의 위치 번호로 표시되어 있다. 즉, 본 발명에서 상기 미리 정해진 엑손-접합 라이브러리는 하기 표 1에 기재된 각 염색체에서 position 1 및 position 2의 접합부일 수 있다(도 3 참고).

본 발명의 일양태에서, 상기 엑손-접합에서의 염기서열의 발현정보, 즉, 리드수는 하기 표 1에서 position 1 및 position 2의 각 염기를 포함하면서 5'방향 및/또는 3'방향으로 연속되는 2 이상의 염기를 포함하는 서열에 정렬(alignment)되는 서열정보(리드)인 것을 특징으로 할 수 있다.

본 발명의 다른 일양태에서, 상기 엑손-접합에서의 염기서열의 발현정보, 즉, 리드수는 하기 표 1에서 position 1 및 position 2의 각 염기를 포함하면서 5'방향 및/또는 3'방향으로 연속되는 2 이상 내지 300 이하의 염기를 포함하는 서열에 정렬(alignment)되는 서열정보(리드)인 것을 특징으로 할 수 있다.

본 발명의 다른 일양태에서, 상기 엑손-접합에서의 염기서열의 발현정보, 즉, 리드수는 하기 표 1에서 position 1 및 position 2의 각 염기를 포함하면서 5'방향 및/또는 3'방향으로 연속되는 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, 100, 110, 120, 130, 140, 150, 160, 170, 180, 190, 200, 210, 220, 230, 240, 250, 260, 270, 280, 290 또는 300 염기를 포함하는 서열에 정렬(alignment)되는 서열정보(리드)인 것을 특징으로 할 수 있다.

엑손-접합 번호	유전자	염색체	Strand	Position1	Position2
1	ITGA2B	17	-	44385209	44385286
2	TRDC	14	+	22463210	22463774
3	TRAF3IP3	1	+	209779374	209780470
4	FCGR2A	1	+	161506591	161509820
5	PCSK6	15	-	101389564	101393212
6	TRAC	14	+	22549682	22550557
7	PTPRC	1	+	198713072	198716682
8	IFI27	14	+	94114880	94115781
9	TRBC1	7	+	142792539	142792692
10	RPL5	1	+	92832117	92833389
11	TLN1	9	-	35713043	35713196
12	SPARC	5	-	151673216	151686865
13	HLA-DRB1	6	-	32579104	32580247
14	LUC7L3	17	+	50744813	50745720
15	LOC728975	11	-	65181072	65181225
16	TRBC1	7	+	142792080	142792522
17	GAS5	1	-	173865894	173866177
18	TRDC	14	+	22464323	22465533
19	LUC7L3	17	+	50719831	50736960
20	HBD	11	-	5234213	5234342
21	TLN1	9	-	35714081	35714239
22	TRBC1	7	+	142792798	142793121
23	DEFA1	8	-	6977879	6978460
24	GAS5	1	-	173866206	173866528
25	OSBP2	22	+	30893566	30893638
26	CRIP1	14	+	105488388	105488471
27	HLA-DRB1	6	-	32580856	32581557
28	TRAF3IP3	1	+	209781458	209782056
29	GNLY	2	+	85694470	85695320
30	GZMA	5	+	55108394	55110021
31	HSP90B1	12	+	103947430	103947633
32	RPS17	15	-	82538985	82539981
33	TRAC	14	+	22550664	22551605
34	CD3D	11	-	118339227	118339451
35	FCGR2A	1	+	161510074	161510834
36	RPL21	13	+	27256334	27256436
37	U2SURP	3	+	143014409	143016257
38	GIMAP7	7	+	150514945	150519934
39	NKG7	19	-	51371835	51371940
40	KLRK1	12	-	10373231	10378132
41	IL2RG	X	-	71110688	71110897
42	KLRB1	12	-	9595421	9598046
43	TRIM58	1	+	247860712	247864705
44	TLN1	9	-	35713298	35713953
45	ITGA2B	17	-	44385076	44385164
46	NKG7	19	-	51372074	51372161
47	U2SURP	3	+	143012353	143014311
48	HLA-DRB1	6	-	32581838	32584109
49	TLN1	9	-	35714687	35714760
50	TRDC	14	+	22463839	22464204
51	IGHM	14	-	105852263	105854405
52	RPL22	1	-	6186816	6192930
53	ITGA2B	17	-	44384354	44384538
54	DEFA3	8	-	7016862	7018222
55	IFI27	14	+	94115942	94116442
56	KLRB1	12	-	9598161	9598499
57	TRIM58	1	+	247857666	247860617
58	DEFA1B	8	-	6996996	6997577
59	IL7R	5	+	35860990	35867306
60	IL7R	5	+	35867463	35871056
61	IL2RG	X	-	71111050	71111425
62	ZYX	7	+	143382447	143382593
63	PTPRC	1	+	198732390	198732480
64	SEPTIN5	22	+	19718818	19719602
65	TLN1	9	-	35715187	35716390
66	SIAH2	3	-	150742698	150762433
67	RSRP1	1	-	25242705	25243550
68	RPL23A	17	+	28720030	28720707
69	ITGA2B	17	-	44384585	44384948
70	LUC7L3	17	+	50740345	50741102
71	TRAF3IP3	1	+	209780606	209781345
72	FLNA	X	-	154354711	154354825
73	FLNA	X	-	154361787	154361979
74	GNAS	20	+	58889353	58895612
75	PTPRC	1	+	198709824	198712953
76	DEFA1B	8	-	6997763	6999123
77	IL7R	5	+	35874542	35875512
78	LY86	6	+	6625012	6626293
79	TLN1	9	-	35711792	35712005
80	FLNA	X	-	154366224	154366308
81	FLNA	X	-	154362148	154362242
82	LCK	1	+	32279747	32279841
83	ITGA2B	17	-	44381061	44383493
84	CRIP1	14	+	105488260	105488331
85	PLEKHO1	1	+	150150287	150150912
86	TLN1	9	-	35714373	35714574
87	RBM6	3	+	50068764	50070455
88	HLA-DRB5	6	-	32519651	32521905
89	RPS10	6	-	34417547	34418369
90	CAPN2	1	+	223745439	223746997
91	DEFA1	8	-	6978646	6980013
92	CDK2AP1	12	-	123267282	123271564
93	MPHOSPH8	13	+	19633961	19642115
94	RPL34	4	+	108620600	108621951
95	RBM6	3	+	50070552	50075201
96	ITGA2B	17	-	44383946	44384085
97	IL2RG	X	-	71108695	71109228
98	GAS5	1	-	173865547	173865857
99	IFI27	14	+	94111773	94114851
100	CD3D	11	-	118339906	118340375
101	MTURN	7	+	30135298	30146177
102	ZYX	7	+	143381779	143382248
103	FLNA	X	-	154359406	154359484
104	RPL7A	9	+	133349042	133349551
105	PNN	14	+	39177916	39179091
106	IL2RG	X	-	71109390	71110156
107	PTPRC	1	+	198708261	198709687
108	TAF10	11	-	6611818	6611958
109	PCSK6	15	-	101384425	101389464
110	HSP90B1	12	+	103932418	103932826
111	PCSK6	15	-	101398576	101427892
112	IGHM	14	-	105851974	105852148
113	CCDC92	12	-	123943493	123944272
114	SSR2	1	-	156015069	156018270
115	GAS5	1	-	173864304	173864484
116	HSP90B1	12	+	103934287	103937695
117	GAS5	1	-	173864704	173865229
118	ITGA2B	17	-	44386131	44389286
119	LCK	1	+	32279994	32280079
120	RPL32	3	-	12840242	12841494
121	RPL12	9	-	127449708	127450731
122	CD53	1	+	110894401	110894960
123	CD53	1	+	110897892	110899124
124	PRKCB	16	+	24035547	24092791
125	PTPRC	1	+	198749549	198750492
126	HBD	11	-	5233092	5233991
127	UBE2H	7	-	129879642	129880895
128	CRIP1	14	+	105488516	105488663
129	CD3E	11	+	118314494	118315486
130	PCSK6	15	-	101432100	101443556
131	PRKCB	16	+	23837406	23988508
132	ITGA2B	17	-	44380153	44380246
133	LCK	1	+	32280210	32285514
134	MS4A1	11	+	60464344	60465921
135	TLN1	9	-	35714876	35715059
136	GNAI2	3	+	50236453	50252100
137	IL32	16	+	3068239	3068990
138	RPL7A	9	+	133349700	133349912
139	PTPRC	1	+	198752772	198754269
140	DAP	5	-	10748271	10761014
141	RPS16	19	-	39433761	39435607
142	RPL6	12	-	112408338	112408420
143	RPS23	5	-	82277852	82278320
144	CD53	1	+	110892533	110894327
145	CD48	1	-	160679131	160681202
146	ITGA2B	17	-	44384138	44384311
147	RPS10-NUDT3	6	-	34418424	34421730
148	MPHOSPH8	13	+	19642270	19646443
149	IL7R	5	+	35871213	35873480
150	KLRB1	12	-	9598653	9599767
151	LUC7L3	17	+	50743810	50744652
152	PTPRC	1	+	198744203	198748109
153	RBM6	3	+	50066502	50068690
154	RPL10A	6	+	35469529	35470179
155	COTL1	16	-	84590262	84617501
156	DEFA3	8	-	7016099	7016676
157	IL7R	5	+	35857059	35860852
158	NPM1	5	+	171392816	171392914
159	RPS7	2	+	3575888	3576487
160	MS4A1	11	+	60466157	60466959
161	IGHM	14	-	105854737	105854917
162	RPL18	19	-	48615447	48615877
163	ITGA2B	17	-	44383704	44383894
164	RPS14	5	-	150447735	150449703
165	ITGB2	21	-	44886430	44886736
166	ATP6V1G2-DDX39B	6	-	31530450	31530779
167	RBM6	3	+	50075330	50077008
168	PTPRC	1	+	198702530	198703298
169	CD3E	11	+	118312866	118313707
170	RPL6	12	-	112405376	112405853
171	TLN1	9	-	35712124	35712835
172	GNAI2	3	+	50252142	50252397
173	IL7R	5	+	35875587	35875983
174	RPS16	19	-	39433569	39433665
175	IL2RG	X	-	71108346	71108599
176	PTPRC	1	+	198752371	198752594
177	NPM1	5	+	171391799	171392710
178	CD27	12	+	6451014	6451268
179	ITGA2B	17	-	44380645	44380879
180	RPLP2	11	+	810039	810234
181	MS4A6A	11	-	60173129	60175402
182	IL2RG	X	-	71110295	71110504
183	GAS5	1	-	173864506	173864675
184	HNRNPDL	4	-	82427564	82428018
185	ITGA2B	17	-	44380301	44380386
186	RPS8	1	+	44778129	44778576
187	RPL22	1	-	6193054	6197652
188	ITGA2B	17	-	44380490	44380600
189	RPL24	3	-	101682492	101682771
190	ITGA2B	17	-	44385716	44385824
191	PTPRC	1	+	198734425	198735127
192	IL32	16	+	3067613	3067984
193	SELL	1	-	169707449	169708417
194	GAS2L1	22	+	29310734	29310827
195	PTPRC	1	+	198703372	198704472
196	CD27	12	+	6450352	6450541
197	RBM6	3	+	50062108	50065031
198	RPS8	1	+	44776774	44777614
199	RPL23	17	-	38853105	38853698
200	RPS10-NUDT3	6	-	34421807	34424669
201	FLNA	X	-	154364957	154365136
202	RPL34	4	+	108622024	108622105
203	PTPRC	1	+	198742367	198744054
204	RPL24	3	-	101681215	101682429
205	CD3E	11	+	118313874	118314448
206	PCSK6	15	-	101382209	101384322
207	NENF	1	+	212433120	212442565
208	RPL9	4	-	39454649	39454864
209	TRAF3IP3	1	+	209777487	209778111
210	CCR7	17	-	40555818	40558893
211	ITGA2B	17	-	44385921	44386010
212	FLNA	X	-	154364372	154364526
213	NPM1	5	+	171392978	171400153
214	RPL6	12	-	112406890	112408240
215	HNRNPDL	4	-	82428446	82429248
216	PCSK6	15	-	101366332	101370335
217	GZMB	14	-	24631214	24631858
218	NCK2	2	+	105816613	105855048
219	ZRANB2	1	-	71078565	71078656
220	PTPRC	1	+	198639341	198692347
221	COTL1	16	-	84566955	84590105
222	FLNA	X	-	154360587	154361308
223	RPS24	10	+	78040225	78040615
224	ITGB5	3	-	124819834	124821313
225	RPS16	19	-	39433418	39433522
226	RPLP2	11	+	812633	812760
227	RPS8	1	+	44777789	44778000
228	FLNA	X	-	154366470	154366562
229	PTPRC	1	+	198735252	198741869
230	TRBC2	7	+	142801961	142802105
231	FLNA	X	-	154358568	154358984
232	HLA-DRA	6	+	32443921	32444652
233	PTPRC	1	+	198722476	198728340
234	FLNA	X	-	154364165	154364259
235	PTPRC	1	+	198718302	198722416
236	NENF	1	+	212444442	212445830
237	RPS5	19	+	58394595	58394682
238	HNRNPDL	4	-	82424883	82426037
239	PCSK6	15	-	101427980	101429987
240	RPL6	12	-	112406037	112406294
241	HLA-DRB1	6	-	32580270	32580746
242	IL2RG	X	-	71107921	71108277
243	ITGA2B	17	-	44385335	44385551
244	RPL3	22	-	39318592	39319595
245	PNISR	6	-	99401630	99402540
246	RPS3	11	+	75399577	75400694
247	PTPRC	1	+	198706952	198708133
248	IGHM	14	-	105855234	105855480
249	NKG7	19	-	51372307	51372379
250	SON	21	+	33546379	33549476
251	RPL17	18	-	49488566	49489359
252	GNLY	2	+	85695423	85695958
253	FLNA	X	-	154352447	154352553
254	MTURN	7	+	30135298	30157438
255	FLNA	X	-	154365259	154365349
256	RPSA	3	+	39412061	39412274
257	TRAF3IP3	1	+	209778173	209779315
258	FLNA	X	-	154362578	154362661
259	RPL9	4	-	39457681	39458194
260	MS4A1	11	+	60463121	60464288
261	RPL11	1	+	23693913	23694660
262	PTPRC	1	+	198742026	198742232
263	MAF1	8	+	144105766	144105869
264	ITGB5	3	-	124873531	124886931
265	RPL18	19	-	48615946	48616079
266	PTPRC	1	+	198704498	198706734
267	HSP90B1	12	+	103932942	103933956
268	MTURN	7	+	30157595	30158986
269	RPL13	16	+	89560712	89560940
270	TRIM58	1	+	247868063	247875900
271	GAS2L1	22	+	29310998	29311462
272	CD79B	17	-	63929475	63929770
273	SELL	1	-	169696553	169701560
274	TRAF3IP3	1	+	209775736	209777352
275	ZRANB2	1	-	71076877	71078457
276	RPL35	9	-	124860264	124861419
277	PRKAR2B	7	+	107045214	107070281
278	HNRNPDL	4	-	82427304	82427433
279	FLNA	X	-	154357623	154358199
280	CD52	1	+	26318071	26320171
281	RPL11	1	+	23692759	23693807
282	RPS23	5	-	82276518	82277693
283	GAS2L1	22	+	29310546	29310638
284	SELL	1	-	169703440	169704568
285	CD79B	17	-	63929324	63929434
286	RPL24	3	-	101682907	101685818
287	CD79A	19	+	41880738	41880867
288	ZYX	7	+	143382685	143382801
289	RPS21	20	+	62387388	62387611
290	RPL14	3	+	40457991	40458642
291	HLA-DRA	6	+	32440032	32442448
292	RPL12	9	-	127450804	127451281
293	RPL18	19	-	48617423	48617791
294	ZRANB2	1	-	71072548	71076795
295	IL32	16	+	3068010	3068180
296	COTL1	16	-	84617583	84617838
297	RPSA	3	+	39408724	39410754
298	FLNA	X	-	154359905	154359990
299	IL7R	5	+	35873648	35874449
300	RPL9	4	-	39454225	39454533
301	PRKCB	16	+	24113069	24123835
302	TRAF3IP3	1	+	209773019	209775349
303	RNF213	17	+	80263778	80273241
304	RPL5	1	+	92837633	92840551
305	RPL7A	9	+	133351071	133351262
306	RPL7A	9	+	133350319	133350597
307	FLNA	X	-	154354043	154354151
308	TRBC2	7	+	142801427	142801944
309	FLNA	X	-	154353204	154353296
310	TRIM58	1	+	247867867	247867963
311	RPL37	5	-	40832573	40834181
312	RPS21	20	+	62387674	62387843
313	RPL14	3	+	40458736	40461407
314	RPS13	11	-	17074466	17075097
315	RPS8	1	+	44776140	44776675
316	MS4A1	11	+	60467060	60468250
317	FLNA	X	-	154362332	154362418
318	TSPAN33	7	+	129167560	129167773
319	RPL10A	6	+	35470351	35470580
320	RPL5	1	+	92840639	92841766
321	GZMA	5	+	55105618	55107794
322	PRKAR2B	7	+	107122004	107128212
323	ITGB5	3	-	124821474	124841383
324	RPL19	17	+	39201319	39202317
325	RPL5	1	+	92833660	92834779
326	RPL14	3	+	40461661	40461939
327	RPS4X	X	-	72272772	72273232
328	CCDC92	12	-	123942785	123943347
329	FLNA	X	-	154359154	154359246
330	FLNA	X	-	154355072	154357434
331	MTURN	7	+	30146299	30157438
332	RPL28	19	+	55386693	55387930
333	FLNA	X	-	154359646	154359732
334	RPS6	9	-	19379618	19380190
335	PRKCB	16	+	24092947	24094163
336	GMPR	6	+	16254735	16274415
337	RPS13	11	-	17075623	17077168
338	RPL11	1	+	23695908	23696344
339	RPL5	1	+	92836392	92837456
340	ITGB3	17	+	47291088	47292139
341	PTPRC	1	+	198750626	198752249
342	PTPRC	1	+	198728448	198729137
343	PTPRC	1	+	198732556	198734196
344	LUC7L3	17	+	50741731	50743706
345	PTPRC	1	+	198754404	198755906
346	CD53	1	+	110896733	110897809
347	RPL23	17	-	38850214	38850362
348	SELL	1	-	169701688	169703255
349	TRAF3IP3	1	+	209775489	209775599
350	PRKCB	16	+	24094297	24112973
351	RPS3A	4	+	151099714	151100485
352	RPS12	6	+	132817061	132817480
353	YWHAH	22	+	31944820	31956139
354	RPS21	20	+	62388364	62388457
355	RPL7A	9	+	133350727	133351002
356	PTP4A2	1	-	31919658	31937987
357	FLNA	X	-	154358355	154358445
358	IL32	16	+	3067415	3067554
359	RPL11	1	+	23694791	23695798
360	NENF	1	+	212442625	212444339
361	RPS24	10	+	78037304	78040204
362	PTPRC	1	+	198729171	198731617
363	PTPRC	1	+	198731726	198732300
364	DAP	5	-	10683571	10748175
365	FLNA	X	-	154354483	154354616
366	GMPR	6	+	16238780	16246842
367	GNLY	2	+	85696056	85697506
368	SRSF5	14	+	69770540	69770995
369	PRKCB	16	+	23988590	24032136
370	RPL36	19	+	5691453	5691532
371	RPL37	5	-	40834265	40834471
372	PTPRC	1	+	198734232	198734328
373	RPLP2	11	+	811645	812535
374	ITGB3	17	+	47307637	47310139
375	HNRNPDL	4	-	82426129	82426463
376	RPL12	9	-	127447726	127447877
377	PNISR	6	-	99408271	99409173
378	RPL5	1	+	92833458	92833545
379	RPL7A	9	+	133350052	133350240
380	AP1S2	X	-	15846011	15852346
381	FLNA	X	-	154352924	154353001
382	PRKCB	16	+	24032247	24035419
383	NCK2	2	+	105745138	105816430
384	RPL13	16	+	89561063	89561227
385	RPL6	12	-	112406342	112406747
386	RPS16	19	-	39435708	39435848
387	NPM1	5	+	171400210	171400839
388	RPS7	2	+	3576630	3577710
389	FLNA	X	-	154353457	154353554
390	FLNA	X	-	154352675	154352772
391	PTPRC	1	+	198699704	198702387
392	RPS10-NUDT3	6	-	34424840	34425072
393	RPL23	17	-	38850475	38852604
394	RPLP2	11	+	810357	811597
395	FLNA	X	-	154362784	154364022
396	RPS24	10	+	78035720	78037194
397	RPL18	19	-	48616824	48617316
398	FLNA	X	-	154364719	154364821
399	TRIM58	1	+	247864935	247867845
400	NCK2	2	+	105855289	105881328
401	NPM1	5	+	171407774	171410527
402	ITGB5	3	-	124848558	124859242
403	FLNA	X	-	154361570	154361670
404	FLNA	X	-	154353727	154353915
405	NCK2	2	+	105882049	105892982
406	RPS21	20	+	62387914	62388309
407	RPSA	3	+	39411777	39411896
408	NPM1	5	+	171400925	171405302
409	PTPRC	1	+	198748199	198749416
410	ABHD17A	19	-	1880115	1881235
411	CD53	1	+	110895055	110896653
412	GAS2L1	22	+	29308738	29310439
413	RPL9	4	-	39458309	39458394
414	RPS17	15	-	82536881	82538306
415	RPL28	19	+	55388048	55388243
416	RPL35	9	-	124858067	124860183
417	PRKAR2B	7	+	107070316	107121952
418	RPL18	19	-	48616202	48616726
419	FLNA	X	-	154354291	154354381
420	RPS17	15	-	82538371	82538880
421	ITGB5	3	-	124841551	124848309
422	FLNA	X	-	154365486	154366024
423	RPL36	19	+	5690600	5691319
424	GNLY	2	+	85697677	85698564
425	RPL23	17	-	38852732	38853022
426	RBM6	3	+	50065126	50066242
427	C12orf75	12	+	105330937	105348602
428	FLNA	X	-	154366639	154366732
429	RAC1	7	+	6374770	6387212
430	RPL14	3	+	40461506	40461608
431	GMPR	6	+	16246961	16250284
432	RPL5	1	+	92834913	92836190
433	DAP	5	-	10681169	10683529
434	GMPR	6	+	16250367	16254562
435	CD3D	11	-	118339494	118339775
436	HNRNPDL	4	-	82428179	82428278
437	PRKCB	16	+	23836348	23837375
438	LYL1	19	-	13099734	13100657
439	FLNA	X	-	154366850	154367397
440	ITGB5	3	-	124817710	124819739
441	RPS7	2	+	3580260	3580805

본 발명의 일양태에서, 상기 엑손-접합 라이브러리는 상기 표 1에 기재된 단수 또는 복수의 엑손-접합을 포함하며, 상기 단수 또는 복수의 엑손-접합은 엑손-접합 번호 1, … , 엑손-접합 번호 n-1 및 엑손-접합 번호 n이되, 상기 n은 자연수로서 1 내지 441 중 어느 하나인 것을 특징으로 할 수 있다.

(e) 단계는 상기 각 엑손-접합에서의 염기서열 발현정보를 바탕으로 암 보유 여부를 결정하는 단계이다. 본 단계에서는 상기 각 엑손-접합에서의 염기서열 발현정보를 바탕으로 하여 개체에서 암 보유 여부를 결정한다.

본 발명의 일 구현예에서, 상기 (a) 내지 (d) 단계를 통해 수득한 피험자의 엑손-접합에서의 염기서열 발현정보를 미리 확보된 각 엑손-접합에서의 염기서열 발현량 데이터베이스와 비교함으로써 암 보유 여부를 결정할 수 있다. 예를 들어, 미리 확보된 데이터베이스에 암 환자에서 상향 조절되는 것으로 판별되어 있는 특정 엑손-접합에서의 염기서열 발현량이 정상인 대조군 대비 피험자의 염기서열 발현정보에서 증가되어 있는 경우 상기 피험자는 암을 보유하고 있는 것으로 결정할 수 있다. 이와 같은 결정은 단수 또는 복수의 엑손-접합에서의 염기서열 발현정보를 이용하여 수행될 수 있다.

바람직하게는, 상기 암 보유 여부 결정은 사전 학습된 암 여부 판별 모형에 피험자 상기 (a) 내지 (d) 단계를 통해 수득한 각 엑손-접합에서의 염기서열 발현정보를 적용함으로써 피험자의 암 보유 여부를 결정할 수 있다.

또한 암 여부 판별 모형으로부터 피험자의 암 여부 판별 스코어를 추출하며, 피험자의 엑손-접합에서의 염기서열 발현정보의 히트맵 시각화 결과 및 개인별 엑손-접합(exon-junction) 중요도 정보 등을 제공할 수 있다.

본 발명에서 상기 암 보유 여부의 결정은 하나 또는 2종류 이상의 암의 보유 여부를 결정하는 것일 수 있다. 바람직하게는 2종류 이상의 암의 보유 여부를 결정하는 것으로 상기 2종류 이상의 암의 보유 여부의 결정은 개체에서 분리한 1개의 시료에서 얻은 정보를 이용하여 동시에 또는 순차적으로 결정될 수 있다.

본 발명의 일 구현예에서, 상기 판별 모형은 공개 데이터 (예를 들어, GSE68086)을 이용하여 학습되고, 이를 검증한 모형을 이용할 수 있다. 일반적으로, 학습세트와 검증세트는 전체 세트를 6:4의 비율로 나누어 사용되며, 상기 획득된 엑손-접합 라이브러리 특성에 대해 학습세트를 이용하여 암 여부 판별 모형을 학습하고 검증세트를 이용하여 성능을 확인한 후 사용할 수 있다.

본 발명의 일 실시예에서는 판별 모형은 SVM (support vector machine) 알고리즘을 기반으로 하며, 개체의 혈소판 유래 전사체 데이터로부터 엑손-접합 바이오마커 특성들을 획득하고 이를 판별 모형에 입력함으로써 피험자의 샘플에 대한 암 정상 여부를 판별할 수 있었다. 또한 판별 모형에서는 암 또는 정상 여부에 대한 판별 스코어를 출력 값으로 출력할 수도 있다.

한편, SVM 알고리즘을 기반으로 학습한 판별 모형이라는 점은 일 예시에 불과하며 암 판별 모델을 학습할 때 사용할 수 있는 모든 머신러닝 방법 또는 유형은 모두 포함하는 것으로 해석되어야 한다. 예를 들어, 머신러닝 방법은 (1) 지도 학습법(supervised learning) (2) 비지도학습(unsupervised learing) (3) 강화학습(reinforcement learning) (4) 준지도학습(semi-supervised learning) (5) 뉴럴 네트워크 등을 포함할 수 있으며, 더욱 구체적으로는 나이브 베이즈 분류(Naive Bayes Classification), 로지스틱 회귀(Logistic Regression), 의사결정나무(Decision tree), 랜덤포레스트(Random forest), 부스팅(XGBoost/ensemble boosting/AdaBoost/Gradient Boost/LightGBM/CatBoost 등), 퍼셉트론(Perceptron), 서포트 벡터 머신(Support Vector Machine), 쿼드라틱 분류(Quadratic classifiers), 클러스터링(K-means clustering, Bayesian network clustering 등), 딥 뉴럴 네트워크(Deep Neural Network) 등을 모두 포함할 수 있으나 이에 한정되지 않는다.

본 발명에서 뉴럴 네트워크(neural network)란, 생물학적 신경망을 모방한 학습 알고리즘을 의미하며, 해당 알고리즘은 입력층, 최소 한 개의 은닉층 및 출력층으로 구성될 수 있으며, 각 층은 적어도 하나의 노드로 구성될 수 있다. 각 층의 노드들은 이전 층에 존재하는 노드들로부터 결과값을 입력 받아 수학적 모델에 기반한 연산을 수행하여 새로운 결과값을 출력하며, 새로운 결과값을 다음 층의 노드들로 전달한다. 본 발명에서의 뉴럴 네트워크는 컨볼루션 뉴럴 네트워크 (Convolutional Neural Network), 딥 뉴럴 네트워크 (Deep Neural Network) 뿐만 아니라, 본 발명의 바이오마커를 특성으로 하여 모형을 생성할 수 있는 모든 종류의 뉴럴 네트워크를 포함한다.

한편, 상기 암 보유 여부의 결정 결과는 추가적으로 개체의 암에 대한 판별 스코어와 개체의 엑손-접합 데이터의 시각화 및 개체의 엑손-접합 중요도 정보를 통합하여 제공할 수 있다. 예를 들어, 사전 학습된 암 여부 판별 모형에 개체의 엑손-접합 바이오마커 특성을 입력하면 암 또는 정상에 대한 예측 확률을 얻고, 이에 기반한 암 여부 판별 결과를 통보해주는 수단이다. 또한 해당 바이오마커들의 발현 패턴을 시각적으로 보여주며 개인의 엑손-접합 중요도를 분석함에 따라 개인에 대한 다양한 예후를 제공할 수도 있다.

본 발명에서 상기 암은 그 종류가 특별히 제한되지 않으나, 방광암, 뼈암, 혈액암, 유방암, 흑색종양, 갑상선암, 부갑상선암, 골수암, 직장암, 인후암, 후두암, 폐암, 식도암, 췌장암, 대장암, 위암, 설암, 피부암, 뇌종양, 자궁암, 두부 또는 경부암, 담낭 암, 구강암, 결장암, 항문 부근암, 중추신경계 종양, 간암 및 대장암으로 이루어진 군에서 선택되는 하나 이상일 수 있다.

본 발명은 또한 상기 표 1의 엑손-접합(exon-junction)으로 이루어진 군에서 선택된 단수 또는 복수의 엑손-접합; 또는 상기 표 1의 엑손-접합으로 이루어진 군에서 선택된 단수 또는 복수의 엑손-접합을 검출할 수 있는 제제를 유효성분으로 포함하는 암 진단용 조성물로서, 상기 엑손-접합은 (i) 개체의 혈액의 무핵세포에서 분리한 RNA 또는 이의 일부, (ii) 개체의 혈액의 엑소좀에서 분리한 전체 RNA 또는 이의 일부, 및 (iii) 개체의 혈액에서 분리한 전체 cfRNA 또는 이의 일부에서 검출하는 것을 특징으로 하는 암 진단용 조성물 및 상기 암 진단용 조성물을 포함하는 암 진단 키트를 제공한다.

본 발명에서 상기 단수 또는 복수의 엑손-접합을 검출할 수 있는 제제란 상기 단수 또는 복수의 엑손-접합 부위를 증폭할 수 있는 프라이머쌍, 바람직하게는, 상기 표 1에서 각 엑손-접합에서 position 1 및 position 2의 각 염기를 포함하면서 5'방향 및/또는 3'방향으로 연속되는 2 이상의 염기를 포함하는 서열을 특이적으로 증폭할 수 있는 프라이머쌍일 수 있다.

본 발명에서 사용하는 용어인 프라이머란 짧은 자유 3'말단 수산화기(free 3' hydroxyl group)를 가지는 핵산 서열로 상보적인 주형(template)과 염기쌍(base pair)을 형성할 수 있고 주형 가닥 복사를 위한 시작 지점으로 기능을 하는 짧은 핵산 서열을 의미한다. 프라이머는 적절한 완충용액 및 온도에서 중합반응을 위한 시약(DNA 중합효소 또는 역전사 효소) 및 상이한 4가지 dNTP (deoxynucleoside triphospate)의 존재하에서 DNA합성을 개시할 수 있다.

프라이머는 DNA 합성의 개시점으로 작용하는 프라이머의 기본 성질을 변화시키지 않는 추가의 특징을 혼입할 수 있다. 본 발명에서 상기 서열번호 1 내지 7의 염기서열을 포함하는 프라이머는 각각 서열 상동성이 95% 이상인 염 기서열을 포함하는 개념이다.

본 발명에서 상기 프라이머는 포스포르아미다이트 고체 지지체 방법, 또는 기타 널리 공지된 방법을 사용하여 화학적으로 합성할 수 있다. 이러한 핵산 서열은 또한 당해 분야에 공지된 많은 수단을 이용하여 변형시킬 수 있다. 이러한 변형의 비제한적인 예로는 메틸화, "캡화", 천연 뉴클레오타이드 하나 이상의 동족체로의 치환, 및 뉴클레오타이드 간의 변형, 예를 들면, 하전되지 않은 연결체(예: 메틸 포스포네이트, 포스포트리에스테르, 포스포로아미데이트, 카바메이트 등) 또는 하전된 연결체(예: 포스포로티오에이트, 포스포로디티오에이트 등)로의 변형이 있다. 핵산은 하나 이상의 부가적인 공유 결합된 잔기, 예를 들면, 단백질(예: 뉴클레아제, 독소, 항체, 시그날 펩타이드, 폴리-L-리신 등), 삽입제(예: 아크리딘, 프소랄렌 등), 킬레이트화제(예: 금속, 방사성 금속, 철, 산화성 금속 등), 및 알킬화제를 함유할 수 있다.

또한, 본 발명에서 상기 프라이머 핵산 서열은 필요한 경우, 분광학적, 광화학적, 생화학적, 면역화학적 또는 화학적 수단에 의해 직접적으로 또는 간접적으로 검출 가능한 표지를 포함할 수 있다. 표지의 예로는, 효소 (예를 들어, 호스래디쉬 퍼옥시다제, 알칼린 포스파타아제), 방사성 동위원소(예를 들어, 32P), 형광성 분자, 화학그룹(예를 들어, 바이오틴) 등이 있다.

본 발명에서 상기 진단용 키트는 본 발명에 따른 상기 바이오마커인 단수 또는 복수의 엑손-접합 부위를 검출하기 위해 사용될 수 있다. 본 발명의 상기 키트에는 상기 단수 또는 복수의 엑손-접합 부위를 검출하기 위한 프라이머, 프로브, 안티센스 핵산뿐만 아니라 분석 방법에 적합한 한 종류 또는 그 이상의 다른 구성성분 조성물, 용액 또는 장치가 포함될 수 있다.

구체적인 일례로서, 본 발명의 키트는 PCR을 수행하기 위해, 분석하고자 하는 시료로부터 유래된 mRNA 및/또는 이와 상보적인 cDNA에 대해 특이적인 프라이머 세트, 적당량의 DNA 중합효소, dNTP 혼합물, PCR 완충용액 및 물을 포함하는 키트일 수 있다. 상기 PCR 완충용액은 KCl, Tris-HCl 및 MgCl2를 함유할 수 있다. 이외에 PCR 산물의 증폭 여부를 확인할 수 있는 전기영동 수행에 필요한 구성 성분들이 본 발명의 키트에 추가로 포함될 수 있다.

다른 구체적인 일례로서, 본 발명의 키트는 DNA 칩(chip)을 수행하기 위해 필요한 필수 요소를 포함하는 키트일 수 있다. DNA 칩 키트는, 유전자 또는 그의 단편에 해당하는 cDNA가 프로브로 부착되어 있는 기판, 형광표식 프로브를 제작하기 위한 시약, 제제, 효소 등을 포함할 수 있다. 또한, 기판은 정량 대조군 유전자 또는 그의 단편에 해당하는 cDNA를 추가로 포함할 수 있다.

한편, 상기 키트에는 실험상의 편의, 안정화 및 반응성 향상을 위해 안정화제 및/또는 비반응성 염료 등을 포함할 수 있다.

상기 비반응성 염료 물질이란 중합효소연쇄반응에 영향을 미치지 않는 물질로부터 선택되어져야 하며, 중합효소연쇄반응 산물을 이용한 분석이나 식별을 위해 사용되는 것을 목적으로 한다. 이러한 조건을 만족시키는 물질로는 로다민, 탐라, 락스, 브로모페놀 블루, 크실렌 시아놀, 브로모크레졸 레드, 크레졸 레드 등의 수용성 염료로 사용될 수 있다. 상기 비반응성 염료 물질은 조성물 전체 중량 대비 0.0001∼0.01중량%의 함량으로 포함될 수 있으며, 0.001∼0.005중량%의 함량으로 포함되는 것이 바람직하다. 조성물 전체 중량 대비 0.01중량% 초과의 함량으로 첨가되는 경우 중합효소연쇄반응 시 고농도의 수용성 염료가 반응 저해제로 작용될 수 있는 문제점이 있다.

또한, 상기 다가알코올류는 본 발명의 키트 구성성분을 보다 안정화시키기 위한 안정화 물질로 사용될 수 있으며, 글루코스, 글리세롤, 만니톨, 갈락시톨, 글루시톨, 솔비톨 중 하나 이상의 물질을 사용할 수 있다.

상기 키트 구성성분은 액상 형태로 제공될 수 있으며, 안정성, 보관의 간편성 및 장기 보관성을 증가시키기 위하여 건조된 상태인 것이 바람직하다. 상기 건조는 일반적인 상온건조, 가온건조, 동결건조, 감압건조와 같은 공지의 건조 방법에 의해 수행될 수 있으며, 조성물의 성분이 손실되지 않는 한, 임의의 건조 방법은 모두 사용 가능하다.

본 발명에서는 또한 다양한 DNA 중합효소가 본 발명의 증폭 단계에 이용될 수 있으며, E. coli DNA 중합효소 I의 "클레나우" 단편, 열안정성 DNA 중합효소 및 박테리오파아지 T7 DNA 중합효소가 이에 포함될 수 있으나, 이에 제한되는 것은 아니다. 바람직하게는, 중합효소는 다양한 박테리아 종으로부터 얻을 수 있는 열안정성 DNA 중합효소이고, 이는 Thermus aquaticus (Taq), Thermus thermophilus (Tth), Thermus filiformis, Thermis flavus, Thermococcus literalis, 및 Pyrococcus furiosus(Pfu)를 포함한다. 상기 중합효소 대부분은 박테리아 그 자체로부터 분리될 수 있고 또는 상업적으로 구입할 수 있다. 또한, 본 발명의 키트에서 이용되는 중합효소는 중합효소를 암호화하는 클로닝 유전자의 높은 레벨을 발현하는 세포로부터 수득할 수 있다.

암 진단을 위한 분석

본 진단 방법은 특정 대상체에서 병태, 특히 질환의 존재를 진단하거나, 병태의 특징을 규명하거나 (예를 들어, 암의 병기를 결정하거나 또는 암의 이질성을 결정한다), 병태의 치료제에 대한 효능을 확인하거나, 병태의 치료에 대한 반응을 모니터링하거나, 병태 또는 병태의 후속 과정의 발생 위험을 예후 예측/진단하기 위해 사용될 수 있다. 본 기재 내용은 또한, 특별한 치료 요법의 효능을 결정하는 데 유용할 수 있다. 또 다른 예에서, 특정의 치료 요법은 시간 경과에 따른 암의 프로파일 변화와 상관이 있을 수 있다. 이러한 상관 관계는 요법을 선택하는 데 유용할 수 있다. 부가적으로, 치료 후에 암에 차도가 있는 것으로 관찰되는 경우, 본 진단 방법은 잔여 질환 또는 질환의 재발을 모니터링하기 위해 사용될 수 있다.

본 발명에 따른 엑손-접합에서의 염기서열정보는 또한, 특이적 형태의 암의 특징을 규명하기 위해 사용될 수 있다. 암은 종종, 조성과 병기 둘 다에 있어서 이질적이다. 유전적 프로파일 데이터는 특이적 하위 유형의 암을 진단 또는 치료하는 데 중요할 수 있는, 그러한 특이적 하위 유형의 암의 특징 규명을 허용할 수 있다. 이러한 정보는 또한, 특이적 유형의 암의 예후에 관한 대상체 또는 실무자에게 단서를 제공할 수 있으며, 대상체 또는 실무자가 질환의 진행에 따라 치료 옵션을 채택하도록 허용할 수 있다. 일부 암은 보다 공격적이고 유전적으로 불안정하도록 진행될 수 있다. 다른 암은 양성, 비활성 또는 휴면 상태로 남아있을 수 있다. 본 기재 내용의 방법은 질환 진행을 결정하는데 유용할 수 있다.

마커 및 패널

본 발명에서 마커는 정상 샘플군과 암 샘플군에서, 각 엑손-접합 종류에 대해 계수되고 정규화된 값들을 비교하여 암 샘플군에서 유의하게 높게 나오거나 낮게 나오는 정해진 길이의 서열을 마커로 선정할 수 있다. 가장 간단하게는 각 엑손-접합 부위에서, 정상샘플군과 암샘플군에서의 평균값의 차이를 이용하며, 또는 T-test, Mann-Whitney test, Wilcoxon Test, 또는 Cohen's D test 등의 다양한 통계기법을 사용하여 두 샘플군에서 유의한 차이가 나는 서열들을 선택한다.

본 발명은 진단 마커로서 각 마커를 개별적으로 사용하거나, 전체적으로 사용하거나, 몇몇 마커를 조합하여 패널 디스플레이 형태로 하여 사용할 수 있고, 몇몇의 마커는 전체적인 패턴의 목록을 통하여 신뢰성 및 효율성을 향상시키는 것을 확인할 수 있다. 본 발명에서 확인된 마커는 개별적으로, 또는 조합된 마커 세트로 사용될 수 있다. 마커들은 마커의 수 및 그 중요도에 따라 순위를 매길 수 있고, 가중치를 둘 수 있으며, 질환으로 발전할 가능성의 수준을 선정할 수 있다. 이러한 알고리즘은 본 발명에 속한다.

한편, 본 발명은 상기 표 1의 엑손-접합(exon-junction)으로 이루어진 군에서 선택된 단수 또는 복수의 엑손-접합을 유효성분으로 포함하는 암 진단용 조성물이며, 상기 엑손-접합은 (i) 개체의 혈액의 무핵세포에서 분리한 RNA 또는 이의 일부, (ii) 개체의 혈액의 엑소좀에서 분리한 전체 RNA 또는 이의 일부, 및 (iii) 개체의 혈액에서 분리한 전체 cfRNA 또는 이의 일부에서 검출하는 것을 특징으로 하는 암 진단용 조성물을 제공한다.

아울러, 본 발명은 상기 조성물을 포함하는 암 진단 키트를 제공한다.

아울러, 본 발명은 상기 표 1의 엑손-접합으로 이루어진 군에서 선택된 단수 또는 복수의 엑손-접합을 검출할 수 있는 제제를 포함하는, 암 진단용 조성물이며, 상기 엑손-접합은 (i) 개체의 혈액의 무핵세포에서 분리한 전체 RNA 또는 이의 일부, (ii) 개체의 혈액의 엑소좀에서 분리한 전체 RNA 또는 이의 일부, 및 (iii) 개체의 혈액에서 분리한 전체 cfRNA 또는 이의 일부에서 검출하는 것을 특징으로 하는 암 진단용 조성물을 제공한다.

아울러, 본 발명은 암 진단용 조성물을 제조하기 위한, 상기 표 1의 엑손-접합(exon-junction)으로 이루어진 군에서 선택된 단수 또는 복수의 엑손-접합을 검출할 수 있는 제제의 용도를 제공한다.

아울러, 본 발명은 (a) (i) 개체의 혈액의 무핵세포(anucleated cells)에서 분리한 전체 RNA 또는 이의 일부, (ii) 개체의 혈액의 엑소좀(exosome)에서 분리한 전체 RNA 또는 이의 일부, 및 (iii) 개체의 혈액에서 분리한 전체 cfRNA(cell-free RNA) 또는 이의 일부로 이루어진 군에서 선택된 하나 이상의 RNA를 분리하는 단계; (b) 상기 (a) 단계에서 분리한 RNA에 대한 상보적 DNA (cDNA)을 합성하는 단계; (c) 상기 cDNA의 염기서열정보를 수득하는 단계; (d) 상기 cDNA 염기서열정보를 미리 정해진 엑손-접합(exon-junction) 라이브러리와 대비하여 각 엑손-접합에서의 염기서열 발현정보를 수득하는 단계; 및 (e) 상기 각 엑손-접합에서의 염기서열 발현정보를 바탕으로 암 보유 여부를 결정하는 단계를 포함하는, 암 진단 방법을 제공한다.

본 명세서에서 용어 “을 포함하는(comprising)”이란 “함유하는(including)” 또는 “특징으로 하는(characterized by)”과 동일한 의미로 사용되며, 본 발명에 따른 조성물 또는 방법에 있어서, 구체적으로 언급되지 않은 추가적인 구성 성분 또는 방법의 단계 등을 배제하지 않는다. 또한 용어 “로 이루어지는(consisting of)”이란 별도로 기재되지 않은 추가적인 요소, 단계 또는 성분 등을 제외하는 것을 의미한다. 용어 “필수적으로 이루어지는(essentially consisting of)”이란 조성물 또는 방법의 범위에 있어서, 기재된 물질 또는 단계와 더불어 이의 기본적인 특성에 실질적으로 영향을 미치지 않는 물질 또는 단계 등을 포함할 수 있는 것을 의미한다.

위 과제의 해결 수단은 일 예시에 불과한 것으로서 통상의 기술자가 이해할 수 있는 범위에 속하며, 위 수단에 포함된 기술적 사상과 동일한 범위의 수단은 모두 포함하는 것으로 해석되어야 할 것이다.

따라서, 본 발명의 방법은 암의 진단, 치료 요법에 대한 모니터링, 암 환자의 예후에 필요한 정보를 제공할 수 있어 항암 치료에 유용하게 이용될 수 있다.

도 1는 441개의 엑손-접합 라이브러리를 선별하는 과정에 대한 흐름도이다.

도 2은 선별된 441개 엑손-접합 라이브러리의 특성에 대한 일 예시도를 나타낸 것이다.

도 3는 엑손-접합의 정의를 나타낸 것이다.

도 4는 엑손-접합에서의 리드수를 계수하는 단계의 과정을 나타낸 것이다.

도 5a는 암 여부 판별 모형 학습 시 사용된 학습 데이터셋 샘플들의 441개 엑손-접합 라이브러리에 대한 발현 패턴의 일 예시도를 나타낸 것이다.

도 5b는 암 여부 판별 모형 학습 시 사용된 검증 데이터셋 샘플들의 441개 엑손-접합 라이브러리에 대한 발현 패턴의 일 예시도를 나타낸 것이다.

도 6a는 본원의 일 실시예에 따라 441개 엑손-접합 라이브러리에 의한 암과 정상 판별 모형 성능을 설명하기 위해 선행연구에서 유전자 1,072개를 특성으로 하여 학습한 Support Vector Machine (SVM) 모형의 AUC 스코어를 나타낸 것이다.

도 6b는 본원의 일 실시예에 따라 441개 엑손-접합 라이브러리에 의한 암과 정상 판별 모형 성능을 설명하기 위해 본원에 따른 441개 엑손-접합 라이브러리를 특성으로 하여 학습한 DNN 모형의 AUC 스코어를 나타낸 것이다.

도 7은 441개 엑손-접합 라이브러리에 의한 모형과 선행 연구의 1,072개 유전자를 이용한 모형 성능을 비교하기 위한 일 예시도를 나타낸 것이다.

도 8은 정상 샘플에 비해 암 샘플에서 발현이 낮아지는 엑손-접합(exon-junction) 중 암과 정상 샘플에서의 차이가 가장 큰 엑손-접합(exon-junction)의 정량 정보에 대한 일 예시도를 나타낸 것이다.

도 9a는 학습 데이터셋 샘플들에 대하여 정상 샘플에 비해 암 샘플에서 발현이 낮아지는 엑손-접합(exon-junction) 중 암과 정상 샘플에서의 차이가 가장 큰 엑손-접합(exon-junction)의 정규화된 발현값에 대한 일 예시도를 나타낸 것이다.

도 9b는 검증 데이터셋 샘플들에 대하여 학습 데이터셋으로 선별한 정상 샘플에 비해 암 샘플에서 발현이 높아지는 엑손-접합(exon-junction) 중 암과 정상 샘플에서의 차이가 가장 큰 엑손-접합(exon-junction)의 정규화된 발현값에 대한 일 예시도를 나타낸 것이다.

도 10은 본원에 따른 441개 엑손-접합 라이브러리의 전체 또는 일부를 사용한 암 여부 판별 모형의 성능을 확인한 일 예시도이다.

아래에서는 첨부한 도면을 참조하여 본원이 속하는 기술 분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있도록 본원의 실시예를 상세히 설명한다. 그러나 본원은 여러 가지 상이한 형태로 구현될 수 있으며 여기에서 설명하는 실시예에 한정되지 않는다.

본원 명세서 전체에서, 어떤 부분이 어떤 구성 요소를 “포함” 한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성 요소를 제외하는 것이 아니라 다른 구성 요소를 더 포함할 수 있는 것을 의미한다.

본원 명세서 전체에서 사용하는 정도의 용어 “약”, “실질적으로” 등은 언급된 의미에 고유한 제조 및 물질 허용오차가 제시될 때 그 수치에서 또는 그 수치에 근접한 의미로 사용되고, 본원의 이해를 돕기 위해 정확하거나 절대적인 수치가 언급된 개시 내용을 비양심적인 침해자가 부당하게 이용하는 것을 방지하기 위해 사용된다. 본원 명세서 전체에서 사용하는 정도의 용어 “~(하는) 단계” 또는 “~의 단계”는 “~ 를 위한 단계”를 의미하지 않는다.

본원 명세서 전체에서, “바이오마커”란 단백질이나 DNA, RNA, 대사 물질 등을 이용해 몸 안의 변화를 알아낼 수 있는 지표로서, 더 구체적으로는 '서열번호 1 내지 882'로 표현되는 유전자 서열의 전부 또는 그 일부 또는 '엑손-접합 라이브러리 1 내지 441'로 표현되는 “엑손-접합 라이브러리”을 포함하는 용어이다.

본원 명세서 전체에서, “엑손-접합 라이브러리”이란, 본원에서 청구하는 유전자 서열의 일부 조합을 의미한다. 본원이 청구하는 유전자 서열은 두 개씩 동시에 사용되는 것이 바람직하며, 이에 따른 조합을 표 2에 정리하였다. 예를 들어, 본원 명세서 전체에서 '엑손-접합 라이브러리 1'이란 '서열번호 1 및 서열번호 2'를 의미하는 것이며, '엑손-접합 라이브러리 441'이란 '서열번호 881 및 서열번호 882'를 의미하는 것이다.

이하, 본 발명의 이해를 돕기 위하여 바람직한 실시예를 제시한다. 그러나 하기의 실시예는 본 발명을 보다 쉽게 이해하기 위하여 제공되는 것일 뿐, 이에 의해 본 발명의 내용이 한정되는 것은 아니다.

실험방법

1. 혈액에서 혈소판 분리

EDTA가 들어있는 검체 용기에 6mL의 혈액을 채취하여 이를 15mL 코니칼 (conical) 튜브로 옮기어 120g에서 20분간 원심 분리를 하였다. 상층의 혈소판 풍부 혈장의 1.3mL를 e-tube로 옮기고 360g로 20분간 원심분리를 후 상층액을 제거하고 침전된 혈소판을 확보하였다. RNAlater (ThermoFishcer) 30uL를 혈소판에 넣은 후 조심스럽게 혈소판 침전을 풀어주고, 4℃에서 하루 보관한 후에 영하 80℃에서 이후의 분석이 진행되기 전까지 보관하였다.

2. total RNA 분리 및 cDNA 합성

RNAlater처리된 혈소판 샘플에서 total RNA를 mirVana miRNA Isolation Kit (ThermoFisher) 등을 사용하여 분리하였다. 이때 얻어진 RNA의 양이 500pg 이상이며 RIN 값이 6이상이고 5S/28S/18S의 피크가 잘 나오는지를 확인 후 RNA 시퀀싱 라이브러리 제작을 위한 cDNA를 합성하였다.

3. NGS 서열분석

일루미나사의 장비를 이용하여 Paired-end로 FASTAQ 포맷으로 제조사의 지침에 따라서 시퀀싱 데이터를 생산하였다. 생산된 데이터의 어댑터 서열 및 퀄리티가 낮은 베이스들을 제거하고 시퀀싱된 리드 (read)를 참조 유전체에 매핑하여 sam 파일을 생성하였다. 생성된 sam 파일은 각 리드별로 참조 유전체에서의 염색체 번호 및 위치 정보를 담고 있다. sam 파일은 용량이 매우 크므로 sam 파일을 bam 파일로 변환하여 사용하였다. 또한 참조 유전체에 정확하게 매핑된 리드만을 사용하기 위하여 bam 파일로부터 primary alignment가 아닌 리드들은 제거하였다.

4. 엑손-접합(exon-junction) 수 계산

엑손-접합 수는 선별된 리드 (read) 중 한 유전자 내 서로 다른 두 개의 엑손의 최말단, 즉 상위 위치의 엑손의 끝 부분과 하위 위치의 엑손의 시작 부분으로부터 시작하여 최소 1개 이상의 연속된 엑손 영역 염기쌍을 포함하는 리드를 각각 계수하여 얻었으며, 해독되지 아니하는 인트론 부분을 포함하는 리드의 경우 계수하지 아니하였다.

실시예 1. 바이오마커 선별

본 발명에서는 공개 혈소판 전사체 데이터(GSE68086)를 사용하였으며, 전체 세트 (283개 샘플)를 6:4의 비율로 나누어 각각 학습 데이터셋 (175개 샘플)과 검증 데이터셋 (108개 샘플)으로 사용하였다. 바이오마커 선별 및 암 여부 판별 모형에는 학습 데이터셋만 사용되며, 학습된 암 여부 판별 모형의 성능은 검증 데이터셋을 통해 확인하였다.

진단능이 있는 바이오마커 발굴을 위해 학습 데이터셋을 엑손-접합에 대한 CPM (counts per million mapped reads) 값으로 정규화 후 모든 샘플에서 log2CPM 값이 0인 엑손-접합을 제외하였으며, 성별에 대한 차이가 발생하지 않도록 Y 염색체에 존재하는 엑손-접합을 제외하였다. Batch-invariant 정규화 후 학습 데이터셋의 모든 샘플에 대한 분산이 0인 엑손-접합을 제외하고, 남은 엑손-접합에 대하여 Mann-Whitney test를 수행하여 임계값인 False Discovery Rate (FDR) 0.05 이하 및 log2FoldChange의 절댓값 1.4 이상을 만족하는 441개의 엑손-접합을 엑손-접합 바이오마커로 결정하였다. 도 1은 441개의 엑손-접합 바이오마커를 선별하는 과정에 대한 흐름도이다.

위에 따라 본 연구에서는 441개의 엑손-접합에 해당하는 엑손-접합 라이브러리를 도출하였으며, 해당 엑손-접합 라이브러리는 441개의 상위 위치의 엑손에서의 3' 접합지점 (position 1) 및 441개의 하위 위치의 엑손에서의 5' 접합지점 (position 2)를 포함하는 882개의 엑손-접합 지점으로 구성된다.

도 2는 위에 따라 도출된 441개 엑손-접합 라이브러리의 특성에 대한 일 예시도를 나타낸 것으로, log2FoldChange와 Mann-Whitney test FDR을 각각 x축, y축으로 하여 도출된 441개 엑손-접합 라이브러리가 암과 정상에서 유의하게 차이나는 정도를 나타낸 것이다. 바이오마커 선별에 사용된 임계값인 False Discovery Rate (FDR) 0.05 및 log2FoldChange 1.4, -1.4를 점선으로 표시하였다.

그 결과, 표시된 441개 엑손-접합 라이브러리가 암 샘플과 정상 샘플에서 유의한 차이가 나타났다. 각각의 점은 엑손-접합 라이브러리 발굴 분석에 사용된 모든 엑손-접합을 나타내며, 이 중 FDR 0.05 이하, log2FoldChange 1.4 이상으로 정상 샘플에 비해 암 샘플에서 발현이 높아지는 (상향조절) 엑손-접합 라이브러리는 빨간색, FDR 0.05 이하, log2FoldChange -1.4 이하로 발현이 낮아지는 (하향조절) 엑손-접합 라이브러리는 파란색으로 나타내었다. Log2FoldChange의 절댓값이 커질수록 암 샘플과 정상 샘플에서 발현값의 변화가 크다는 것을 의미하므로 x축의 양의 방향으로 갈수록 해당 엑손-접합에서 정상 샘플에 비해 암 샘플에서 발현이 높아지고 음의 방향으로 갈수록 정상 샘플에 비해 암 샘플에서 발현이 낮아짐을 의미한다. 또한 FDR이 작을수록 그래프의 y값은 커지므로 암 샘플과 정상 샘플에서 발현값 차이가 유의하고, 그 차이가 클수록 도면의 우상향 또는 좌상향에 위치한다. 441개 엑손-접합 라이브러리의 유전자 정보는 상기 표 1에 명시되어 있으며, 이 중 상향 조절되는 것은 156개이고, 하향 조절되는 것은 285개이다.

본 발명에서 서열번호 1 내지 882은 다음과 같이 정의된다. 서열번호 1 내지 882에서 홀수 서열번호는 상기 표 1에 명시된 각각의 엑손-접합 부위에서 position 1을 포함하면서 5'방향으로 150개의 염기서열을 나타낸 것이다. 예를 들어, 서열번호 1은 상기 표 1에서 엑손-접합 번호 1번의 position 1의 염기를 포함하면서 5'방향으로 150개의 염기서열을 나타내며, 서열번호 881은 상기 표 1에서 엑손-접합 번호 441번의 position 1의 염기를 포함하면서 5'방향으로 150개의 염기서열을 나타낸다. 그 다음으로, 서열번호 1 내지 882에서 짝수 서열번호는 상기 표 1에 명시된 각각의 엑손-접합 부위에서 position 2를 포함하면서 3'방향으로 150개의 염기서열을 나타낸 것이다. 예를 들어, 서열번호 2는 상기 표 1에서 엑손-접합 번호 1번의 position 2의 염기를 포함하면서 3'방향으로 150개의 염기서열을 나타내며, 서열번호 882는 상기 표 1에서 엑손-접합 번호 441번의 position 2의 염기를 포함하면서 3'방향으로 150개의 염기서열을 나타낸다. 즉, 각각의 홀수 서열번호에 포함된 150개의 염기 중 3'말단 염기는 상기 표 1에서 position 1에 해당하는 염기이며, 각각의 짝수 서열번호에 포함된 150개의 염기 중 5'말단 염기는 상기 표 1에서 position 2에 해당하는 염기이다.

본 발명에서 암 진단을 위한 엑손-접합 바이오마커는 홀수 서열번호에서 3'말단 염기(즉, 상기 표 1에서 position 1에 해당하는 염기) 및 짝수 서열번호에서 5'말단 염기(즉, 상기 표 1에서 position 2에 해당하는 염기)를 필수적으로 포함하면서, position 1을 기준으로 홀수 서열번호의 5'방향 및/또는 position 2를 기준으로 짝수 서열번호의 3'방향으로 연속되는 염기를 하나 이상 추가로 포함하는 염기서열일 수 있다.

본 발명의 일 구체예에서, 상기 암 진단을 위한 엑손-접합 바이오마커는 홀수 서열번호에서 3'말단 염기(즉, 상기 표 1에서 position 1에 해당하는 염기) 및 짝수 서열번호에서 5'말단 염기(즉, 상기 표 1에서 position 2에 해당하는 염기)를 필수적으로 포함하면서, position 1을 기준으로 홀수 서열번호의 5'방향 및/또는 position 2를 기준으로 짝수 서열번호의 3'방향으로 연속되는 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, 100, 110, 120, 130, 140, 150, 160, 170, 180, 190, 200, 210, 220, 230, 240, 250, 260, 270, 280, 290 또는 298개의 염기를 추가로 포함하는 염기서열일 수 있다.

이하 표 2에는 서열번호 1 내지 882의 염기서열을 나타내었다. 하기 표 2에서 엑손-접합 번호는 상기 표 1의 엑손-접합 번호와 대응된다.

엑손-접합 번호	서열 번호	염기서열	서열 번호	염기서열
1	1	GCCGGAGAGCTGGTGCTTGGGGCTCCTGGCGGCTATTATTTCTTAGGTACGTGCCCATCCGTACACCTCCCTCCCTTCTCGCGGCCCAAGGAGACCGCTTTGGGCTTCACACCCGCTGTCCCTCCCGCCCTAGGTCTCCTGGCCCAGGCT	2	CCGCCGACTCAAGGCCCCGCCCCTGTCCCCCAGCCCTCCTCCGGGCTCGCGCGCGCCTCCCTTCACCCCTGCGCTGACCCCTCCTCCTTGTCTCCTGCAGGCTGGGACAAGCGTTACTGTGAAGCGGGCTTCAGCTCCGTGGTCACTCAG
2	3	TTGATCCTGCTATTGTCATCTCTCCCAGTGGGAAGTACAATGCTGTCAAGCTTGGTAAATATGAAGATTCAAATTCAGTGACATGTTCAGTTCAACACGACAATAAAACTGTGCACTCCACTGACTTTGAAGTGAAGACAGATTCTACAG	4	ATCACGTAAAACCAAAGGAAACTGAAAACACAAAGCAACCTTCAAAGAGCTGCCATAAACCCAAAGGTTAGTTCAAATCAAAGGGCCAACTTCAGAATCAAGGGTTAAAGCAAACTCTGTAATTGTCCACTGGGGCCAAAATGTATCAGA
3	5	TAATAACCAAGGTTCTAAGCAAAGTTCTGAAAAGAAAACTTTTTGTAGTAAATATGCTAGCATAGACAAGTTCCTTGTGTTTTCCAACAGGTTTGCTTCAAAATCAATCCTTACAGCTTCAAGAACAGGAGAAACTCTTAACAAAGAAAG	6	ATCAGGCTTTGCCCGTGTGGAGTCCAAAGTCCTTCCCTAACGAAGTGGAGCCTGAGGGTACAGGGAAGGAGAAAGACTGGGATCTCAGAGACCAGCTGCAAAAGAAGACTTTGCAGCTCCAGGCCAAGGAAAAGGAGGTGAGAGGGTGAC
4	7	CCATTCAGTGGTTCCACAATGGGAATCTCATTCCCACCCACACGCAGCCCAGCTACAGGTTCAAGGCCAACAACAATGACAGCGGGGAGTACACGTGCCAGACTGGCCAGACCAGCCTCAGCGACCCTGTGCATCTGACTGTGCTTTCCG	8	AATGGCTGGTGCTCCAGACCCCTCACCTGGAGTTCCAGGAGGGAGAAACCATCATGCTGAGGTGCCACAGCTGGAAGGACAAGCCTCTGGTCAAGGTCACATTCTTCCAGAATGGAAAATCCCAGAAATTCTCCCATTTGGATCCCACCT
5	9	GTCACCACGGATCTGCGTCAGCGCTGTACCGATGGCCACACTGGGACCTCAGTCTCTGCCCCCATGGTGGCGGGCATCATCGCCTTGGCTCTAGAAGCAAAGTAAGTTCCCACTTACCTTTTTCTAAAAAAAAAAAATGTTTAGATTGTG	10	TACTGCTCGTGCGATGGCTACACCAACAGCATCTACACCATCTCCGTCAGCAGCGCCACCGAGAATGGCTACAAGCCCTGGTACCTGGAAGAGTGTGCCTCCACCCTGGCCACCACCTACAGCAGTGGGGCCTTTTATGAGCGAAAAATC
6	11	GGCATGGAAAGGCTGTAGTTGTTCACCTGCCCAAGAACTAGGAGGTCTGGGGTGGGAGAGTCAGCCTGCTCTGGATGCTGAAAGAATGTCTGTTTTTCCTTTTAGAAAGTTCCTGTGATGTCAAGCTGGTCGAGAAAAGCTTTGAAACAG	12	ATACGAACCTAAACTTTCAAAACCTGTCAGTGATTGGGTTCCGAATCCTCCTCCTGAAAGTGGCCGGGTTTAATCTGCTCATGACGCTGCGGCTGTGGTCCAGCTGAGGTGAGGGGCCTTGAAGCTGGGAGTGGGGTTTAGGGACGCGGG
7	13	TATTACATAACATTCTTATTCTTTTAACAGGTCCAGGAGAGCCTCAGATTATTTTTTGTAGAAGTGAAGCTGCACATCAAGGAGTAATTACCTGGAATCCCCCTCAAAGATCATTTCATAATTTTACCCTCTGTTATATAAAAGAGACAG	14	AAAAAGATTGCCTCAATCTGGATAAAAACCTGATCAAATATGATTTGCAAAATTTAAAACCTTATACGAAATATGTTTTATCATTACATGCCTACATCATTGCAAAAGTGCAACGTAATGGAAGTGCTGCAATGTGTCATTTCACAACTA
8	15	CCCTTCTTGTGGCTCCCAACCTGGGGCAGCCCCCTGCCTCCCTTTAGATGGGCAATCGGCTTAGAAAGTGGAGGGGAAGCCAGTGTGGATCTACTCACAGAATGTTCTTTTGGTTTCCAGCCAGGATTGCTACAGTTGTGATTGGAGGAG	16	TTGTGGCCATGGCGGCTGTGCCCATGGTGCTCAGTGCCATGGGCTTCACTGCGGCGGGAATCGCCTCGTCCTCCATAGCAGCCAAGATGATGTCCGCGGCGGCCATTGCCAATGGGGGTGGAGTTGCCTCGGGCAGCCTTGTGGCTACTC
9	17	AGGAGGTGCTGGGCTGTCAGAGGAAGCTGGTCTGGGCCTGGGAGTCTGTGCCAACTGCAAATCTGACTTTACTTTTAATTGCCTATGAAAATAAGGTCTCTCATTTATTTTCCTCTCCCTGCTTTCTTTCAGACTGTGGCTTTACCTCGG	18	TGTCCTACCAGCAAGGGGTCCTGTCTGCCACCATCCTCTATGAGATCCTGCTAGGGAAGGCCACCCTGTATGCTGTGCTGGTCAGCGCCCTTGTGTTGATGGCCATGGTAAGCAGGAGGGCAGGATGGGGCCAGCAGGCTGGAGGTGACA
10	19	CGCCCTCTCTCTTTCACACGTCACTGGCGTGACCGTCCGCGCTACATACTGCGCCTGCGCAAGGGCTGTGGCCCTTTTCCCACCCCCTAGCGCCGCTGGGCCTGCAGGTCTCTGTCGAGCAGCGGACGCCGGTCTCTGTTCCGCAGGATG	20	GGGTTTGTTAAAGTTGTTAAGAATAAGGCCTACTTTAAGAGATACCAAGTGAAATTTAGAAGACGACGAGGTACTGTCACCTTTTTGTGTTTACAATATTAATCTGCTTTGCAGATGCAGTGGAGTATCCTTTCTACAATTATTTTTTTC
11	21	GTATTGCAGCTCGGGATGTGGCAGGTGGGCTGCGGTCACTGGCCCAGGCCGCTAGGGGAGTCGCTGCACTGACGTCAGATCCTGCAGTGCAGGCCATTGTACTTGATACGGCCAGTGATGTGCTGGACAAGGCCAGCAGCCTCATTGAGG	22	CTCACCTTCTCCTTTCTCAAGCCCAATTCTTCCCCCTTCATCCTTAGATGGAGAAGTGTACCCAGGACCTGGGCAACAGCACCAAAGCCGTGAGCTCAGCCATCGCCCAGCTACTGGGAGAGGTTGCCCAGGGCAATGAGAATTATGCAG
12	23	GTATCTGTGGGAGCTAATCCTGTCCAGGTGGAAGTAGGAGAATTTGATGATGGTGCAGAGGAAACCGAAGAGGAGGTGGTGGCGGAAAGTATGTCCCTTCCCTGTAACTTGGCACATCCAAGCTGCCCTTGGCTGCCTGGGCCTGGGGCA	24	GGAGGGACCACGGGGTGGAGGGGAGATAGACCCAGCCCAGAGCTCTGAGTGGTTTCCTGTTGCCTGTCTCTAAACCCCTCCACATTCCCGCGGTCCTTCAGACTGCCCGGAGAGCGCGCTCTGCCTGCCGCCTGCCTGCCTGCCACTGAG
13	25	GATTCCTGAGCTGAAATGCAGATGACCACATTCAAGGAAGAACTTTCTGCCCCGGCTTTGCAGGATGAAAAGCTTTCCTGCTTGGCAGTTATTCTTCCACAAGAGAGGGCTTTCTCAGGACCTGGTTGCTACTGGTTCGGCAACTGCAGA	26	CCCTGGTTGGTGTGGGTTGTGGTGTTAGAGAAATCTCAGGTGGGAGATCTGGGGCTGGGACATTGTGTTGGAGGACAGATTTGCTTCAATAACTTTTAAGTGTATATCTTTTCCTCTTTTTCCCAGGACACTCTGGACTTCAGCCAACAG
14	27	TTTGCTGCACAAGAAAAACAAATGGAAGTTTGTGAAGTATGTGGAGCCTTTTTAATAGTAGGAGATGCCCAGTCCCGGGTAGATGACCATTTGATGGGAAAACAACACATGGGCTATGCCAAAATTAAAGCTACTGTAGAAGAATTAAAA	28	GAAAAGTTAAGGAAAAGAACCGAAGAACCTGATCGTGATGAGCGTCTAAAAAAGGAGAAGCAAGAAAGAGAAGAAAGAGAAAAAGAACGGGAGAGAGAAAGGGAAGAAAGAGAAAGGAAAAGACGAAGGGAAGAGGAAGAAAGAGAAAAA
15	29	GCTCTCAGCCCACCCACCTGGAAGCGCCCATGTGTCACCTTACCCAGGAGAGGGCGGCAGAGGCTGCGAGCAGGACGGCAGCCCCCTCTCCCCACCCCCAGGACCCTGAGATCCTGCTTCACGGGCTGCAAGAAGTTGGGGGGCCAGGAT	30	CTGGCAGCGAGCAGACCCCTGCCGGACACTCAGCAAACGGCAGCCTCACCCCGCAGGGCCGCGCCACTCCCCTTCCCCACCCCACCGCCGCGTCCCGGCTCAGCGCTCCCCGGGGAACGCAGGGGGACCGGGCTCGCTGCGTGACCTTGG
16	31	TGAGGGTCTCGGCCACCTTCTGGCAGAACCCCCGCAACCACTTCCGCTGTCAAGTCCAGTTCTACGGGCTCTCGGAGAATGACGAGTGGACCCAGGATAGGGCCAAACCCGTCACCCAGATCGTCAGCGCCGAGGCCTGGGGTAGAGCAG	32	ACTGTGGCTTTACCTCGGGTAAGTAAGCCCTTCCTTTTCCTCTCCCTCTCTCATGGTTCTTGACCTAGAACCAAGGCATGAAGAACTCACAGACACTGGAGGGTGGAGGGTGGGAGAGACCAGAGCTACCTGTGCACAGGTACCCACCTG
17	33	GTGGAGTCCAACTTGCCTGGACCAGCTTAATGGTTCTGGTAAGTATTAATGAAAACAGTAGATAGACTTAATGAAAATGCTGATGGTGATATGCTTACTGCTGAGCTAATGGCTTAAGGCTTGGCTGATGAATACTGACTGTATTTTCCT	34	AGATGTACTATCTGTCTGATGTATCTGGGGTAGTTGTGGTTTGCTGTTAATGGTTAAGCAGTGTACCACCAATCTACCATTAAAATATTTTTTGCTGACAATTTTGTATTAAAATTACAGGCATTAGACAGAAAGCTGGAAGTTGAAATG
18	35	CCTGAAGCCACCCTCTTCACTCTTTTTCAGCCATAGTTCATACCGAGAAGGTGAACATGATGTCCCTCACAGTGCTTGGGCTACGAATGCTGTTTGCAAAGACTGTTGCCGTCAATTTTCTCTTGACTGCCAAGTTATTTTTCTTGTAAG	36	GCTGACTGGCATGAGGAAGCTACACTCCTGAAGAAACCAAAGGCTTACAAAAATGCATCTCCTTGGCTTCTGACTTCTTTGTGATTCAAGTTGACCTGTCATAGCCTTGTTAAAATGGCTGCTAGCCAAACCACTTTTTCTTCAAAGACA
19	37	TTCGTTGGCGGGTGCCTGGGCTGGTGGGAACAGCCGCCCGAAGGAAGCACCATGATTTCGGCCGCGCAGTTGTTGGATGAGTTAATGGGCCGGGACCGAAACCTAGCCCCGGACGAGAAGCGCAGCAACGTGCGGTGGGACCACGAGAGC	38	GTTTGTAAATATTATCTCTGTGGTTTTTGTCCTGCGGAATTGTTCACAAATACACGTTCTGATCTTGGTAAGTGAATTTTCTGTGTAACTTTTATCAAATTTATGATATTTAAAATGTTGAATAGGAGTGGTGAAAGGAAAAAAACTGAT
20	39	ATTACTGGTGGTCTACCCTTGGACCCAGAGGTTCTTTGAGTCCTTTGGGGATCTGTCCTCTCCTGATGCTGTTATGGGCAACCCTAAGGTGAAGGCTCATGGCAAGAAGGTGCTAGGTGCCTTTAGTGATGGCCTGGCTCACCTGGACAA	40	TGTTGCTTACACTTTCTTCTGACATAACAGTGTTCACTAGCAACCTCAAACAGACACCATGGTGCATCTGACTCCTGAGGAGAAGACTGCTGTCAATGCCCTGTGGGGCAAAGTGAACGTGGATGCAGTTGGTGGTGAGGCCCTGGGCAG
21	41	GCTCAGGAAGCATGTGGACCTTTGGAGATGGATTCTGCACTGAGTGTGGTACAGAATCTAGAGAAAGATCTACAGGAAGTGAAGGCAGCAGCTCGAGATGGCAAGCTTAAACCCTTACCTGGGGAGACAGTAAGTATGTTTAAGACCTCA	42	CCTATTCCCCAACAGCCAGGTGGGAAGATGGTGGCAGCTGCAAAGGCCTCAGTGCCAACGATTCAGGACCAGGCTTCAGCCATGCAGCTGAGTCAGTGTGCCAAGAACCTGGGCACCGCGCTGGCTGAACTCCGGACGGCTGCCCAGAAG
22	43	ACCTGTGCACAGGTACCCACCTGTCCTTCCTCCGTGCCAACAGTGTCCTACCAGCAAGGGGTCCTGTCTGCCACCATCCTCTATGAGATCCTGCTAGGGAAGGCCACCCTGTATGCTGTGCTGGTCAGCGCCCTTGTGTTGATGGCCATG	44	GTCAAGAGAAAGGATTTCTGAAGGCAGCCCTGGAAGTGGAGTTAGGAGCTTCTAACCCGTCATGGTTTCAATACACATTCTTCTTTTGCCAGCGCTTCTGAAGAGCTGCTCTCACCTCTCTGCATCCCAATAGATATCCCCCTATGTGCA
23	45	GCTCAAGGAAAAACATGGCCTGCTATTGCAGAATACCAGCGTGCATTGCAGGAGAACGTCGCTATGGAACCTGCATCTACCAGGGAAGACTCTGGGCATTCTGCTGCTGAGCTTGCAGAAAAAGAAAAATGAGCTCAAAATTTGCTTTGA	46	CCATTCTCCTGGTGGCCCTGCAGGCCCAGGCTGAGCCACTCCAGGCAAGAGCTGATGAGGTTGCTGCAGCCCCGGAGCAGATTGCAGCGGACATCCCAGAAGTGGTTGTTTCCCTTGCATGGGACGAAAGCTTGGCTCCAAAGCATCCAG
24	47	GCATTAGACAGAAAGCTGGAAGTTGAAATGGTAAGTGAAACTGTATCCAAGTAAGCAGGTAACTGGGCAAACTTCCTACGGCACAAATGGCTTTTTAGTTACCTCCTAGTGCTGAATGCATTAAATAAATGGCGGATTCTTGTCTTGTTA	48	CTAGAATGATGAGGATCTTAACCACCATTATCTTAACTGAGGCACCCAAAATGGTGAGTTGGGGAACATAGAGAGTACACCTAAGTTCACATGAAGTTGTTTCTTCCCAGGTCCTAAAGAGCAAGCCTAACTCAAGCCATTGGCACACAG
25	49	GCCCTGCATGGGGGGGCATGACCTCTGACCTGTCCCCTGCCTCCAGGTGCCATCCACTTAGAATTCCAGGCCAGTGGGAATCACTACGTGTGGAGGAAGAGCACCTCAACTGTTCACAACATCATCGTGGGCAAGCTCTGGATCGACCAG	50	TCAGGGGACATCGAGATTGTGAACCATAAGACCAATGACCGGTGCCAGCTGAAGTTCCTGCCCTACAGCTACTTCTCCAAAGAGGCAGCCCGGAAGGTAAGCAGGACCAGCCACCTCTAAGCACCCCAGGGGGCCCAGGGCAGAGTCTGC
26	51	GACCTCTGGGGGCCACGCTGAGGTAGGTGGGACCCACCCTGGTGGCAGGGGCCAGGGGTGATGGCACCCCCTCACGGCCCTTCTCTTTGCAGCACGAAGGCAAACCCTACTGCAACCACCCCTGCTACGCAGCCATGTTTGGGCCTAAAG	52	GCTTTGGGCGGGGCGGAGCCGAGAGCCACACTTTCAAGTAAACCAGGTAGGTAGGACCCCACCCCCTATCCTGCCTCCTGGTTCCACCCTCGGGATGGGGATGCCCCCTCCCAGGGAGGCCTGACCACTCGTGGGCCCCAAAGGAGGCCG
27	53	GAGCACGGTCTGAATCTGCACAGAGCAAGATGCTGAGTGGAGTCGGGGGCTTTGTGCTGGGCCTGCTCTTCCTTGGGGCCGGGCTGTTCATCTACTTCAGGAATCAGAAAGGTGAGGAGCCTTTGGGAGCTGGCTCTCTCCATAGGCTTT	54	AGGCTGGGATGGTGTCCACAGGCCTGATCCAGAATGGAGACTGGACCTTCCAGACCCTGGTGATGCTGGAAACAGTTCCTCGAAGTGGAGAGGTTTACACCTGCCAAGTGGAGCACCCAAGCGTGACAAGCCCTCTCACAGTGGAATGGA
28	55	AAGTGACAGTGATGACTTTGGTGATGTTCTCCCCAGTGCAGAGAACTGCATTCAGAATTAGACAACCTCAGTGACGAGTATCTCTCCTGCCTGCGTAAGCTGCAGCACTGTCGAGAAGAGCTGAACCAGAGCCAGCAGCTGCCTCCCAGA	56	AGGCAATGTGGGCGATGGCTCCCAGTGCTGATGGTGGTGATTGCTGCAGCACTGGCAGTGTTCCTGGCCAATAAAGACAACCTGATGATCTGAATAATTTGTGACAACTGCCTTGGGTGAAAATCAGAAGCAAGCAACTCAGCGAAAAAC
29	57	AGATGACATACAAAAAGGGCAGGACCTGAGAAAGATTAAGCTGCAGGCTCCCTGCCCATAAAACAGGGTGTGAAAGGCATCTCAGCGGCTGCCCCACCATGGCTACCTGGGCCCTCCTGCTCCTTGCAGCCATGCTCCTGGGCAACCCAG	58	GTCTGGTCTTCTCTCGTCTGAGCCCTGAGTACTACGACCTGGCAAGAGCCCACCTGCGTGATGAGGAGAAATCCTGCCCGTGCCTGGCCCAGGAGGGCCCCCAGGTACGTGTTGGCTCTCTGCTCACCTGCCACAGTCCCTCTCCTTTCC
30	59	GCATCTTGGTCCGATACTCTGAGAGAAGTCAATATCACCATCATAGACAGAAAAGTCTGCAATGATCGAAATCACTATAATTTTAACCCTGTGATTGGAATGAATATGGTTTGTGCTGGAAGCCTCCGAGGTGGAAGAGACTCGTGCAAT	60	GGAGATTCTGGAAGCCCTTTGTTGTGCGAGGGTGTTTTCCGAGGGGTCACTTCCTTTGGCCTTGAAAATAAATGCGGAGACCCTCGTGGGCCTGGTGTCTATATTCTTCTCTCAAAGAAACACCTCAACTGGATAATTATGACTATCAAG
31	61	CATTAATGGGCCCATAAATGTTGTGTTTAGGTGGAAGAAGAGCCCGAAGAAGAACCTGAAGAGACAGCAGAAGACACAACAGAAGACACAGAGCAAGACGAAGATGAAGAAATGGATGTGGGAACAGATGAAGAAGAAGAAACAGCAAAG	62	GAATCTACAGCTGAAAAAGATGAATTGTAAATTATACTCTCACCATTTGGATCCTGTGTGGAGAGGGAATGTGAAATTTACATCATTTCTTTTTGGGAGAGACTTGTTTTGGATGCCCCCTAATCCCCTTCTCCCCTGCACTGTAAAATG
32	63	TTATGTCACGCATCTGATGAAGCGAATTCAGAGAGGCCCAGTAAGAGGTATCTCCATCAAGCTGCAGGAGGAGGAGAGAGAAAGGAGAGACAATTATGTTCCTGAGGTAAACTTTCTGGATATTTGGGCTTCTGGCTAATCCTCAAATGA	64	CCGCGTTCGCACCAAAACCGTGAAGAAGGCGGCCCGGGTCATCATAGAAAAGTACTACACGCGCCTGGGCAACGACTTCCACACGAACAAGCGCGTGTGCGAGGAGATCGCCATTATCCCCAGCAAAAAGCTCCGCAACAAGATAGCAGG
33	65	GACATGCAAGCCCATAACCGCTGTGGCCTCTTGGTTTTACAGATACGAACCTAAACTTTCAAAACCTGTCAGTGATTGGGTTCCGAATCCTCCTCCTGAAAGTGGCCGGGTTTAATCTGCTCATGACGCTGCGGCTGTGGTCCAGCTGAG	66	ATCTGCAAGATTGTAAGACAGCCTGTGCTCCCTCGCTCCTTCCTCTGCATTGCCCCTCTTCTCCCTCTCCAAACAGAGGGAACTCTCCTACCCCCAAGGAGGTGAAAGCTGCTACCACCTCTGTGCCCCCCCGGCAATGCCACCAACTGG
34	67	CCCCTCCGAGATCGAGATGATGCTCAGTACAGCCACCTTGGAGGAAACTGGGCTCGGAACAAGTGAACCTGAGACTGGTGGCTTCTAGAAGCAGCCATTACCAACTGTACCTTCCCTTCTTGCTCAGCCAATAAATATATCCTCTTTCAC	68	AGAACTTGTGTGTTCATATCACTCATGCAGACTTCTGAGGGTGTGGGAGGGTGGATCTCACAGTCCCATCTGCTAGGCCATTGATGTCTCTCTCTGGTTCTTCTAGCTGCCGACACACAAGCTCTGTTGAGGAATGACCAGGTCTATCAG
35	69	TCCAGAATGGAAAATCCCAGAAATTCTCCCATTTGGATCCCACCTTCTCCATCCCACAAGCAAACCACAGTCACAGTGGTGATTACCACTGCACAGGAAACATAGGCTACACGCTGTTCTCATCCAAGCCTGTGACCATCACTGTCCAAG	70	TGCCCAGCATGGGCAGCTCTTCACCAATGGGGATCATTGTGGCTGTGGTCATTGCGACTGCTGTAGCAGCCATTGTTGCTGCTGTAGTGGCCTTGATCTACTGCAGGAAAAAGCGGATTTCAGGTTTGTAGCTCCTCCCAGTCCCTTTTG
36	71	GGCAAGATTCTTGCCAAGAGAATTAATGTGCGTATTGAGCACATTAAGCACTCTAAGAGCCGAGATAGCTTCCTGAAACGTGTGAAGGAAAATGATCAGAAAAAGAAAGAAGCCAAAGAGAAAGGTACCTGGGTTCAACTAAAGCGCCAG	72	CCTGCTCCACCCAGAGAAGCACACTTTGTGAGAACCAATGGGAAGGAGCCTGAGCTGCTGGAACCTATTCCCTATGAATTCATGGCATAATAGGTGTTAAAAAAAAAAATAAAGGACCTCTGGGCTACAAAAATGTTTCTCTTCATTGAG
37	73	TTTAGATAGCATTAAGAATCTATATGTAAAAGTATGCTTTTTATTTCTTAGCCTCTTCTGGAAAACAAACTTAAAGCATTCAGTATTGGAAAAATGAGTACAGCTAAGCGAACTTTAAGTAAAAAGGAACAGGAAGAATTAAAGAAAAAG	74	GAGGATGAAAAGGCAGCTGCTGAGATTTATGAGGAGTTTCTTGCTGCTTTTGAAGGAAGTGATGGTAATAAAGTGAAAACATTTGTGCGAGGGGGTGTTGTTAATGCAGCTAAAGGTAAGTTTATAAAGTATAACTGCTAATAAAGCATA
38	75	TTTTGTGTGTGTGGCTCCACCCAGCCTGAGCTTCCTGACTGAGAGGTTTTGGTGGCGGTACAGACACTTTTAACTCACAGTAAAAGCAAAAGCAACAGCTCAAGCAGCCTCCTTGGAGAAAACCTGAAAATTCAACTTGTTCAAGAGAAG	76	GTCTTGTACGTGCCTAAGTTCTAGAGCCTCCTGACGTGAGCATGGCTGAGAGTGAGGACCGCTCCCTGAGGATCGTTCTGGTAGGGAAAACTGGAAGTGGGAAAAGTGCAACAGCGAACACCATCCTTGGAGAGGAAATCTTTGATTCTA
39	77	GTGCCCTGAGCCTGGGTGCTCACTGTGGCGGTCCCCGTCCTGGCTATGAAACCTTGTGAGCAGAAGGCAAGAGCGGCAAGATGAGTTTTGAGCGTTGTATTCCAAAGGCCTCATCTGGAGCCTCGGGAAAGTCTGGTCCCACATCTGCCC	78	TGTCCTTGTCCCCAGCCATCTCCATGGTGGTGGCCATGGCGGTGTACACCAGCGAGCGGTGGGACCAGCCTCCACACCCCCAGATCCAGACCTTCTTCTCCTGGTCCTTCTACCTGGGCTGGGTCTCAGCTATCCTCTTGCTCTGTACAG
40	79	ACTAACAATAATTGAAATGCAGAAGGGAGACTGTGCACTCTATGCCTCGAGCTTTAAAGGCTATATAGAAAACTGTTCAACTCCAAATACGTACATCTGCATGCAAAGGACTGTGTAAAGATGATCAACCATCTCAATAAAAGCCAGGAA	80	TTATCAACACTGATTTTACTTATAGTTTATTTGTGGTTTCAAACAGGATTTACTTAAACTGGTGAAGTCATATCATTGGATGGGACTAGTACACATTCCAACAAATGGATCTTGGCAGTGGGAAGATGGCTCCATTCTCTCACCCAACCT
41	81	GTACAAGAACTCGGATAATGATAAAGTCCAGAAGTGCAGCCACTATCTATTCTCTGAAGAAATCACTTCTGGCTGTCAGTTGCAAAAAAAGGAGATCCACCTCTACCAAACATTTGTTGTTCAGCTCCAGGACCCACGGGAACCCAGGAG	82	CTTCCTGACCACTATGCCCACTGACTCCCTCAGTGTTTCCACTCTGCCCCTCCCAGAGGTTCAGTGTTTTGTGTTCAATGTCGAGTACATGAATTGCACTTGGAACAGCAGCTCTGAGCCCCAGCCTACCAACCTCACTCTGCATTATTG
42	83	CTTAGAAATTAGAGGTGATGCTAAAGAAAACAGCTGTATTTCCATCTCACAGACATCTGTGTATTCTGAGTACTGTAGTACAGAAATCAGATGGATCTGCCAAAAAGAACTAACACCTGTGAGAAATAAAGTGTATCCTGACTCTTGACT	84	AAGCAGATTCAATATTTTTCTGTTCCATTTATAGATACACACACAGAACCTGATACGTGACAAAGCAATTCTGTTTTGGATTGGATTAAATTTTTCATTATCAGAAAAGAACTGGAAGTGGATAAACGGCTCTTTTTTAAATTCTAATGA
43	85	TGACGTTAGGTACAGATTGAGGGCATCTGTAACAGCTGAAATGTTCCCAAACAGGTAAAGCTCCAGATGGCTCTGGAACTTATGAGGAAAGAGTTGGAGGACGCCTTGACTCAGGAGGCCAACGTGGGGAAAAAGACTGTCATTTGGAAG	86	GAGAAAGTGGAAATGCAGAGGCAGCGCTTCAGATTGGAGTTTGAGAAGCATCGTGGCTTTCTGGCCCAGGAGGAGCAACGGCAGCTGAGGCGGCTGGAGGCGGAGGAGCGAGCGACGCTGCAGAGACTGCGGGAGAGCAAGAGCCGGCTG
44	87	ATGGAGAAGTGTACCCAGGACCTGGGCAACAGCACCAAAGCCGTGAGCTCAGCCATCGCCCAGCTACTGGGAGAGGTTGCCCAGGGCAATGAGAATTATGCAGGTATGTGGGCAGAGAGCCAGGCATGGGGCATATTGTGAGGGAGGTAG	88	AAAACCCCTTTCTTATCATAGGCTCAGGAAGCATGTGGACCTTTGGAGATGGATTCTGCACTGAGTGTGGTACAGAATCTAGAGAAAGATCTACAGGAAGTGAAGGCAGCAGCTCGAGATGGCAAGCTTAAACCCTTACCTGGGGAGACA
45	89	GTCTCCTGGCCCAGGCTCCAGTTGCGGATATTTTCTCGAGTTACCGCCCAGGCATCCTTTTGTGGCACGTGTCCTCCCAGAGCCTCTCCTTTGACTCCAGCAACCCAGAGTACTTCGACGGCTACTGGGGTAACACCGCCATTCCAGACT	90	AGCGGGCTTCAGCTCCGTGGTCACTCAGGCGAGTAGGGAGCAAAAGCGCAGTGGGGGCGGCTCCCAAACAGGGCCCCCTCTCACCCTCAGGACTTCCCTTCCAGGCCGGAGAGCTGGTGCTTGGGGCTCCTGGCGGCTATTATTTCTTAG
46	91	CCATCTCCATGGTGGTGGCCATGGCGGTGTACACCAGCGAGCGGTGGGACCAGCCTCCACACCCCCAGATCCAGACCTTCTTCTCCTGGTCCTTCTACCTGGGCTGGGTCTCAGCTATCCTCTTGCTCTGTACAGGTGACTATCCTGCCC	92	CAGGCTACATCCACGTGACGCAGACCTTCAGCATTATGGCTGTTCTGTGGGCCCTGGTGTCCGTGAGCTTCCTGGTCCTGTCCTGCTTCCCCTCACTGTTCCCCCCAGGCCACGGCCCGCTTGTCTCAACCACCGCAGCCTTTGCTGCAG
47	93	GTTTTACTTTTCCTGAAGATGGATGCATCTGGACCCTCAGATAGTGATATGCCAAGTCGGACACGACCTAAGAGCCCAAGAAAACATAATTATAGGAATGAAAGTGCCCGTGAAAGCCTTTGTGATTCTCCTCATCAGAATCTCTCAAGA	94	CCTCTTCTGGAAAACAAACTTAAAGCATTCAGTATTGGAAAAATGAGTACAGCTAAGCGAACTTTAAGTAAAAAGGAACAGGAAGAATTAAAGAAAAAGGTAATGTTGAAAATGTATTTTGAATTATCCTTGGAAATGAATGTGTCTAAG
48	95	TCCAACCTAAGGTGACTGTATATCCTTCAAAGACCCAGCCCCTGCAGCACCACAACCTCCTGGTCTGCTCTGTGAGTGGTTTCTATCCAGGCAGCATTGAAGTCAGGTGGTTCCTGAACGGCCAGGAAGAGAAGGCTGGGATGGTGTCCA	96	GGGAGTTCCGGGCGGTGACGGAGCTGGGGCGGCCTGACGCTGAGTACTGGAACAGCCAGAAGGACATCCTGGAGCAGGCGCGGGCCGCGGTGGACACCTACTGCAGACACAACTACGGGGTTGTGGAGAGCTTCACAGTGCAGCGGCGAG
49	97	GCAGTGGCAGAGCAGATTCCACTGCTGGTGCAGGGCGTCCGAGGAAGCCAAGCCCAGCCTGACAGCCCCAGCGCTCAGCTTGCCCTCATTGCTGCCAGCCAGAGCTTCCTGCAGGCAAGGCACCCCCTCTGCACTTCTCTGACCTGACCT	98	ATGGGCTTGGTCTGACTACTCTTGTCTTCACAGCATGCAGCCAAGCAGGCTGCAGCCTCAGCCACACAGACCATCGCTGCAGCTCAGCACGCAGCCTCTACCCCCAAGGCCTCTGCCGGCCCCCAGCCCCTGCTGGTGCAGAGCTGCAAG
50	99	AAAGTCTCCTCCAGTTTTAAAAGCCTACAATCCTGTGAGCCTCTTCATTCCCAATGTAACCCTGACCACTGCTGTTTGTTCCAGATCACGTAAAACCAAAGGAAACTGAAAACACAAAGCAACCTTCAAAGAGCTGCCATAAACCCAAAG	100	CCATAGTTCATACCGAGAAGGTGAACATGATGTCCCTCACAGTGCTTGGGCTACGAATGCTGTTTGCAAAGACTGTTGCCGTCAATTTTCTCTTGACTGCCAAGTTATTTTTCTTGTAAGGTAAGAATTAGCCGCTTCTTATTCCTATCT
51	101	AGGGGGAGGTGAGCGCCGACGAGGAGGGCTTTGAGAACCTGTGGGCCACCGCCTCCACCTTCATCGTCCTCTTCCTCCTGAGCCTCTTCTACAGTACCACCGTCACCTTGTTCAAGGTAGCACGGCTGTGGCACAGGGAGGAGGGTGCAG	102	CTGAGCCCCAGGCCCCAGGCCGGTACTTCGCCCACAGCATCCTGACCGTGTCCGAAGAGGAATGGAACACGGGGGAGACCTACACCTGCGTGGTGGCCCATGAGGCCCTGCCCAACAGGGTCACCGAGAGGACCGTGGACAAGTCCACCG
52	103	GTATTTGAAATATCTCACCAAAAAATATTTGAAGAAGAATAATCTACGTGACTGGTTGCGCGTAGTTGCTAACAGCAAAGAGAGTTACGAATTACGTTACTTCCAGATTAACCAGGACGAAGAAGAGGAGGAAGACGAGGATTAAATTTC	104	TTGGTCAATTTAATGATTTCTACAGGAGCAGTTTTTGCAAGAAAGGATCAAAGTGAACGGAAAAGCTGGGAACCTTGGTGGAGGGGTGGTGACCATCGAAAGGAGCAAGAGCAAGATCACCGTGACATCCGAGGTGCCTTTCTCCAAAAG
53	105	AATATGTCGTCGGTGCCCCCACTTGGAGCTGGACCCTGGGAGCGGTAAGTGCCCCCACCACTGGGCCTCCCGAAGCCCCTTATCCCAGTTCTCAGGCTGACAACTCCTGAGCGCCCCCCACCCCCGCCCCGCCTCCACCAAACCACCCTT	106	TGCAGGGCTGGGGCTGAGTGGCCTTAATCTCCTCCTTCTTTGCCCTCCGTCCCCTCTGTGCTTCCTCCCCTGGAAAAGACTAATTTGCGCCCTTGTCCTCAGGGTACTCGGTGGCCGTGGGCGAGTTCGACGGGGATCTCAACACTACAG
54	107	GTGACCCCAGCCATGAGGACCCTCGCCATCCTTGCTGCCATTCTCCTGGTGGCCCTGCAGGCCCAGGCTGAGCCACTCCAGGCAAGAGCTGATGAGGTTGCTGCAGCCCCGGAGCAGATTGCAGCGGACATCCCAGAAGTGGTTGTTTCC	108	GAAAGTAACCCCGGAAATTAGGACACCTCATCCCAAAAGACCTTTAAATAGGGGAAGTCCACTTGTGCACGGCTGCTCCTTGCTATAGAAGACCTGGGACAGAGGACTGCTGTCTGCCCTCTCTGGTCACCCTGCCTAGCTAGAGGATCT
55	109	CGGCTGTGCCCATGGTGCTCAGTGCCATGGGCTTCACTGCGGCGGGAATCGCCTCGTCCTCCATAGCAGCCAAGATGATGTCCGCGGCGGCCATTGCCAATGGGGGTGGAGTTGCCTCGGGCAGCCTTGTGGCTACTCTGCAGTCACTGG	110	GAGCAACTGGACTCTCCGGATTGACCAAGTTCATCCTGGGCTCCATTGGGTCTGCCATTGCGGCTGTCATTGCGAGGTTCTACTAGCTCCCTGCCCCTCGCCCTGCAGAGAAGAGAACCATGCCAGGGGAGAAGGCACCCAGCCATCCTG
56	111	ATACACACACAGAACCTGATACGTGACAAAGCAATTCTGTTTTGGATTGGATTAAATTTTTCATTATCAGAAAAGAACTGGAAGTGGATAAACGGCTCTTTTTTAAATTCTAATGAGTGAGTATTAGATGAGCTAACTTTAATATTCAAT	112	CCGGGTCTCTTAAACTGCCCAATATATTGGCAGCAACTCCGAGAGAAATGCTTGTTATTTTCTCACACTGTCAACCCTTGGAATAACAGTCTAGCTGATTGTTCCACCAAAGAATCCAGCCTGCTGCTTATTCGAGATAAGGATGAATTG
57	113	CCCGGGGCGCGGCGATGCGCGCGGCACGGCGAGGACCTGAGCCGCTTCTGCGAGGAGGACGAGGCGGCGCTGTGCTGGGTGTGCGACGCCGGCCCCGAGCACAGGACGCACCGCACGGCGCCGCTGCAGGAGGCCGCCGGCAGCTACCAG	114	GTAAAGCTCCAGATGGCTCTGGAACTTATGAGGAAAGAGTTGGAGGACGCCTTGACTCAGGAGGCCAACGTGGGGAAAAAGACTGTCATTTGGAAGGTAAGACCATGTTGGGGCTTTAGGAGGCTTGCCTGTTTGAAGGATCCAGATTCG
58	115	GCTCAAGGAAAAACATGGCCTGCTATTGCAGAATACCAGCGTGCATTGCAGGAGAACGTCGCTATGGAACCTGCATCTACCAGGGAAGACTCTGGGCATTCTGCTGCTGAGCTTGCAGAAAAAGAAAAATGAGCTCAAAATTTGCTTTGA	116	CCATTCTCCTGGTGGCCCTGCAGGCCCAGGCTGAGCCACTCCAGGCAAGAGCTGATGAGGTTGCTGCAGCCCCGGAGCAGATTGCAGCGGACATCCCAGAAGTGGTTGTTTCCCTTGCATGGGACGAAAGCTTGGCTCCAAAGCATCCAG
59	117	TTCCTCCCCAGGAGACTTGGAAGATGCAGAACTGGATGACTACTCATTCTCATGCTATAGCCAGTTGGAAGTGAATGGATCGCAGCACTCACTGACCTGTGCTTTTGAGGACCCAGATGTCAACATCACCAATCTGGAATTTGAAATATG	118	TGGGGCCCTCGTGGAGGTAAAGTGCCTGAATTTCAGGAAACTACAAGAGATATATTTCATCGAGACAAAGAAATTCTTACTGATTGGAAAGAGCAATATATGTGTGAAGGTTGGAGAAAAGAGTCTAACCTGCAAAAAAATAGACCTAAC
60	119	TCGTGGAGGTAAAGTGCCTGAATTTCAGGAAACTACAAGAGATATATTTCATCGAGACAAAGAAATTCTTACTGATTGGAAAGAGCAATATATGTGTGAAGGTTGGAGAAAAGAGTCTAACCTGCAAAAAAATAGACCTAACCACTATAG	120	TTAAACCTGAGGCTCCTTTTGACCTGAGTGTCGTCTATCGGGAAGGAGCCAATGACTTTGTGGTGACATTTAATACATCACACTTGCAAAAGAAGTATGTAAAAGTTTTAATGCACGATGTAGCTTACCGCCAGGAAAAGGATGAAAACA
61	121	ATTTCTTCCTGACCACTATGCCCACTGACTCCCTCAGTGTTTCCACTCTGCCCCTCCCAGAGGTTCAGTGTTTTGTGTTCAATGTCGAGTACATGAATTGCACTTGGAACAGCAGCTCTGAGCCCCAGCCTACCAACCTCACTCTGCATT	122	GACAGACTACACCCAGGGAATGAAGAGCAAGCGCCATGTTGAAGCCATCATTACCATTCACATCCCTCTTATTCCTGCAGCTGCCCCTGCTGGGAGTGGGGCTGAACACGACAATTCTGACGCCCAATGGGAATGAAGACACCACAGCTG
62	123	GGTGCTCTGGGAGGTGCCTTCCCGCCGCCCCCTCCCCCGATCGAGGAATCATTTCCCCCTGCGCCTCTGGAGGAGGAGATCTTCCCTTCCCCGCCGCCTCCTCCGGAGGAGGAGGGAGGGCCTGAGGCCCCCATACCGCCCCCACCACAG	124	CCCAGGGAGAAGGTGAGCAGTATTGATTTGGAGATCGACTCTCTGTCCTCACTGCTGGATGACATGACCAAGAATGATCCTTTCAAAGCCCGGGTAAGGGACCGGAGAGTAGGAAAAGCAGGGCTCAGGGCCAGAGAGACTGGGCATAGA
63	125	AAGGGGGAAATTATTTTTCCTGAATCTGCTGTGATCCAAGAAATCGTTGTTTCTTTCAGAGCATCCCGCGGGTGTTCAGCAAGTTTCCTATAAAGGAAGCTCGAAAGCCCTTTAACCAGAATAAAAACCGTTATGTTGACATTCTTCCTT	126	ATGATTATAACCGTGTTGAACTCTCTGAGATAAACGGAGATGCAGGGTCAAACTACATAAATGCCAGCTATATTGATGTGAGTAAAAATTTGCATTTTTCTTATACCTACATATTTCATTCAGCTCCTTGTTTGTCTTGGTAAAATTTTA
64	127	CGCCGGGCTCTGGCGGCCTGACCGGGCCTGGGGTCCGAGCGTGCCCCCGGGCCTGGGGGGGTCGCCGCGATGGACTCGCTGGCAGCGCCCCAGGACCGCCTGGTGGAGCAGCTGCTGTCGCCGCGGACCCAGGCCCAGAGGCGGCTCAAG	128	GACATTGACAAGCAGTACGTGGGCTTCGCCACACTGCCCAACCAGGTGCACCGCAAGTCGGTGAAGAAAGGCTTTGACTTCACACTCATGGTGGCTGGTGAGTGGGCCAGGCTCCTCGGGGGAGTGGCTGGGGTCACTGGCCAGCCAAGC
65	129	GGAGCAGCTGCCCACCCTGACAGTGAGGAGCAGCAGCAGCGGCTGCGGGAGGCAGCTGAGGGGCTGCGCATGGCCACCAATGCAGCTGCGCAGAATGCCATCAAGAAAAAGCTGGTGCAGCGCCTGGAGGTGAGGCTGGGAGTTTCACCA	130	GCCCGCATCCTGGCCCAAGCCACATCTGACCTGGTCAATGCCATCAAGGCTGATGCTGAGGGGGAAAGTGATCTGGAGAACTCCCGCAAGCTCTTAAGTGCTGCCAAGATCCTAGCTGATGCCACAGCCAAGATGGTAGAGGCTGCCAAG
66	131	TATGCCACCACGGGCTGTTCCCTGACCCTGCACCATACGGAGAAACCAGAACATGAAGACATATGTGAATACCGTCCCTACTCCTGCCCATGTCCTGGTGCTTCCTGCAAGTGGCAGGGGTCCCTGGAAGCTGTGATGTCCCATCTCATG	132	CCTATTCTGCAGTGCCAGGCCGGGCACCTGGTGTGTAACCAATGCCGCCAGAAGTTGAGCTGCTGCCCGACGTGCAGGGGCGCCCTGACGCCCAGCATCAGGAACCTGGCTATGGAGAAGGTGGCCTCGGCAGTCCTGTTTCCCTGTAAG
67	133	AATTCTGTAGCAAAGCCAATACAAAAATCAGCTAAAGCTGCCACAGAAGAGGCATCTTCAAGATCACCAAAAATAGATCAGAAAAAAAGTCCATATGGACTGTGGATACCTATCTAAAAGAAGAAAACTGATGGCTAAGTTTGCATGAAA	134	TTTAATATAGGATTTAGAAACCAAGGGTATGTGTTTTAAAATTACACTTTTTCTTAACCTGTCTAGCTGTCGGAAAAGGTAACAGAAGATGGAACTCGAAATCCCAATGAAAAACCTACCCAGCAAAGAAGCATAGCTTTTAGCTCTAAT
68	135	CCGTTCCCAGAGGGCGCCGCTCTGCAAATTACCCAATCAGCTCTAAGTACAAAGCATCGCGAGTCTTTAGTGCTCTTTGGCGCTATAAGCCCGTGGGAACGAGCATTGGAGACCCTTTTCACAAGATGGCGCCGAAAGCGAAGAAGGAAG	136	CTCCTGCCCCTCCTAAAGCTGAAGCCAAAGCGAAGGCTTTAAAGGCCAAGAAGGCAGTGTTGAAAGGTGTCCACAGCCACAAAAAGAAGAAGATCCGCACGTCACCCACCTTCCGGCGGCCGAAGACACTGCGACTCCGGAGACAGCCCA
69	137	GGTACTCGGTGGCCGTGGGCGAGTTCGACGGGGATCTCAACACTACAGGCAAGAAATCCACTTAGGGCGGGAGTTGGGTAGCCCAGCCCGGGGAGGAGCGCCTTCCTGAAATCTCCCCTATGTAGGGAAATCTTCCTGCACACACATTTT	138	CCGCTGTCCCTCCCGCCCTAGGTCTCCTGGCCCAGGCTCCAGTTGCGGATATTTTCTCGAGTTACCGCCCAGGCATCCTTTTGTGGCACGTGTCCTCCCAGAGCCTCTCCTTTGACTCCAGCAACCCAGAGTACTTCGACGGCTACTGGG
70	139	GATAAAGTGAATCCTTTTTCTTTTTAAAAAGAAAAATAACTCTTTTTTTTTGGCAAGAAAAGGTTGCTAATAATCACAGATAATTTATACAATTATATTTTTTCCCCCAGGTCCGTGTGAAAAAATTCATGATGAAAATCTACGAAAACA	140	GTATGAGAAGAGCTCTCGTTTCATGAAAGTTGGCTATGAGAGAGATTTTTTGCGATACTTACAGAGCTTACTTGCAGAAGTAGAACGTAGGATCAGACGAGGCCATGCTCGTTTGGCATTATCTCAAAACCAGCAGTCTTCTGGGGTAAG
71	141	GCTGCTTTTTTAGATCAGGCTTTGCCCGTGTGGAGTCCAAAGTCCTTCCCTAACGAAGTGGAGCCTGAGGGTACAGGGAAGGAGAAAGACTGGGATCTCAGAGACCAGCTGCAAAAGAAGACTTTGCAGCTCCAGGCCAAGGAAAAGGAG	142	TGCAGAGAACTGCATTCAGAATTAGACAACCTCAGTGACGAGTATCTCTCCTGCCTGCGTAAGCTGCAGCACTGTCGAGAAGAGCTGAACCAGAGCCAGCAGCTGCCTCCCAGAGTAAGAGGGTCTCTCCTTCCCATAAAGCCCTGGATG
72	143	GCTCTGGCTGGGGACCAGCCCTCGGTGCAGCCCCCTCTACGGTCTCAGCAGCTGGCCCCACAGTACACCTACGCCCAGGGCGGCCAGCAGACTTGGGTACGGCCTGGCCAGCTAGGGACACTGGGGCTAGCCAGCTGGGTGTTCTGTGAG	144	ACGCCTGATGGCTCAGAGGTGGATGTGGACGTGGTGGAGAATGAGGACGGCACTTTCGACATCTTCTACACGGCCCCCCAGCCGGGCAAATACGTCATCTGTGTGCGCTTTGGTGGCGAGCACGTGCCCAACAGCCCCTTCCAAGTGACG
73	145	GGTCCAGTAGGCGTCAATGTCACTTATGGAGGGGATCCCATCCCTAAGAGCCCTTTCTCAGTGGCAGTATCTCCAAGCCTGGACCTCAGCAAGATCAAGGTGTCTGGCCTGGGAGAGAGTAAGTAGTTGGGGCCCTTGTCGCAAAGGCCT	146	ACCCACTTCACAGTAAATGCCAAAGCTGCTGGCAAAGGCAAGCTGGACGTCCAGTTCTCAGGACTCACCAAGGGGGATGCAGTGCGAGATGTGGACATCATCGACCACCATGACAACACCTACACAGTCAAGTACACGCCTGTCCAGCAG
74	147	GCTGCGTCAGGTGGCTGGCCGGCGCGGCGCTCCCCTGCTCTCTGGCTCCGGGCTGCGGCGCGGCGGCTGGAGCGAGCCCCTGTCCCGGCGCGGGGCGGCGGCGGGCGGCCGGCAGGCGCTGCCTTGCGTGTGAGTGCACCTCACTCACAT	148	GTGCTGGAGAATCTGGTAAAAGCACCATTGTGAAGCAGATGAGGATCCTGCATGTTAATGGGTTTAATGGAGAGTAAGTGTCAAATCTGTGCAGGGGGGCACCAAGTAAGAGGAACAGACTTTATACTAACCTTTAGGAAGTATAGGTGG
75	149	TCTTTATTTCAGGTAATATGATATTTGATAATAAAGAAATTAAATTAGAAAACCTTGAACCCGAACATGAGTATAAGTGTGACTCAGAAATACTCTATAATAACCACAAGTTTACTAACGCAAGTAAAATTATTAAAACAGATTTTGGGA	150	GTCCAGGAGAGCCTCAGATTATTTTTTGTAGAAGTGAAGCTGCACATCAAGGAGTAATTACCTGGAATCCCCCTCAAAGATCATTTCATAATTTTACCCTCTGTTATATAAAAGAGACAGGTAATTTGTGTAGAATTTAATTTCATCAGA
76	151	GTGACCCCAGCCATGAGGACCCTCGCCATCCTTGCTGCCATTCTCCTGGTGGCCCTGCAGGCCCAGGCTGAGCCACTCCAGGCAAGAGCTGATGAGGTTGCTGCAGCCCCGGAGCAGATTGCAGCGGACATCCCAGAAGTGGTTGTTTCC	152	GAAAGTAACCCCGGAAATTAGGACACCTCATCCCAAAAGACCTTTAAATAGGGGAAGTCCACTTGTGCACGGCTGCTCCTTGCTATAGAAGACCTGGGACAGAGGACTGCTGTCTGCCCTCTCTGGTCACCCTGCCTAGCTAGAGGATCT
77	153	CCTACCCCCACTGCATGGCTACTGAATGCTCACCACAATCTATTCTTGCTTTCCAGGGGAGATGGATCCTATCTTACTAACCATCAGCATTTTGAGTTTTTTCTCTGTCGCTCTGTTGGTCATCTTGGCCTGTGTGTTATGGAAAAAAAG	154	GATTAAGCCTATCGTATGGCCCAGTCTCCCCGATCATAAGAAGACTCTGGAACATCTTTGTAAGAAACCAAGAAAAGTGAGTGTTTTTGGTGCTTAAAAAGTGTTGTGTTGGCAACATCCCAGTGGCCAAGAATGATATTCCAGGACAAG
78	155	TTTGAATATGTTTGCAAAATATACGATGTACTCGCAACTAATCTATTGTTTTCTTCTTCGTAGATCCATTACAAGATTTTGGCTTTTCTGTTGAAAAGTGTTCCAAGCAATTAAAATCAAATATCAACATTAGATTTGGAATTATTCTGA	156	GAGAGGACATCAAAGAGCTTTTTCTTGACCTAGCTCTCATGTCTCAAGGCTCATCTGTTTTGAATTTCTCCTATCCCATCTGTGAGGCGGCTCTGCCCAAGTTTTCTTTCTGTGGAAGAAGGAAAGGAGGTAAGCCATCTGTCTTGCTCA
79	157	CTTCCTCCTAGCACTGGGACATTTCAAGAAGCTCAGAGCCGGTTGAATGAAGCTGCTGCTGGGCTGAATCAGGCAGCCACAGAACTGGTGCAGGCCTCTCGGGGAACCCCTCAGGACCTGGCTCGAGCCTCAGGCCGATTTGGACAGGAC	158	TGGGCAACCCTGTCTCCTTTCTCACCCCAGGTGGCTAAAGCAGTGACCCAGGCTCTGAACCGCTGTGTCAGCTGCCTACCTGGCCAGCGCGATGTGGATAATGCCCTGAGGGCAGTTGGAGATGCCAGCAAGCGACTCCTGAGTGACTCG
80	159	GAGCTGGCACGGGCGAGGTCGAGGTTGTGATCCAGGACCCCATGGGACAGAAGGGCACGGTAGAGCCTCAGCTGGAGGCCCGGGGCGACAGCACATACCGCTGCAGCTACCAGCCCACCATGGAGGGCGTCCACACCGTGCACGTCACGT	160	TTGCTGGCCAGCACATCGCCAAGAGCCCCTTCGAGGTGTACGTGGATAAGTCACAGGGTGACGCCAGCAAAGTGACAGCCCAAGGTCCCGGCCTGGAGCCCAGTGGCAACATCGCCAACAAGACCACCTACTTTGAGATCTTTACGGCAG
81	161	GTGTCGAGCTTGGCAAGCCCACCCACTTCACAGTAAATGCCAAAGCTGCTGGCAAAGGCAAGCTGGACGTCCAGTTCTCAGGACTCACCAAGGGGGATGCAGTGCGAGATGTGGACATCATCGACCACCATGACAACACCTACACAGTCA	162	GATGTCATTGCGGATGACGTCTGCCCTCCTCTAAGGCCTTCTCCTCCCACTGCCTGCAGGCCACGCCCACCAGCCCCATCCGAGTCAAGGTGGAGCCCTCTCATGACGCCAGTAAGGTGAAGGCCGAGGGCCCTGGCCTCAGTCGCACTG
82	163	CAGTTGGAGGAGAAAGGTCTGGGGGCCTCCCCCTGGGGCAACTTGGGCCAGCAACTCTTGCTTCTGCCCACAGGGAGTCTAGTGGATTTTCTCAAGACCCCTTCAGGCATCAAGTTGACCATCAACAAACTCCTGGACATGGCAGCCCAA	164	ATTGCAGAAGGCATGGCATTCATTGAAGAGCGGAATTATATTCATCGTGACCTTCGGGCTGCCAACATTCTGGTGTCTGACACCCTGAGCTGCAAGATTGCAGACTTTGGCCTAGCACGCCTCATTGAGGACAACGAGTACACAGCCAGG
83	165	ACATTGCAGTGGCTGCCCCCTACGGGGGTCCCAGTGGCCGGGGCCAAGTGCTGGTGTTCCTGGGTCAGAGTGAGGGGCTGAGGTCACGTCCCTCCCAGGTCCTGGACAGCCCCTTCCCCACAGGCTCTGCCTTTGGCTTCTCCCTTCGAG	166	CCGAAGTGGGGCGTGTGTATTTGTTCCTGCAGCCGCGAGGCCCCCACGCGCTGGGTGCCCCCAGCCTCCTGCTGACTGGCACACAGCTCTATGGGCGATTCGGCTCTGCCATCGCACCCCTGGGCGACCTCGACCGGGATGGCTACAATG
84	167	TGGGTAGGCGCCGCGTCCTGCAGCGTCTCACCGGGGCCTGTCTGTGCCTCTGCAGCCGAGAGGGTGACCTCTCTGGGCAAGGACTGGCATCGGCCCTGCCTGAAGTGCGAGAAATGTGGGAAGACGCTGACCTCTGGGGGCCACGCTGAG	168	CACGAAGGCAAACCCTACTGCAACCACCCCTGCTACGCAGCCATGTTTGGGCCTAAAGGTATGCTCCCGTCATCCCCACCCCACCCCACCCCACAGCCTCCTCCACCCCAGCCTGTTGACTTTTTCCACCTTCTCTGCAGGCTTTGGGCG
85	169	AGCGGCGGCGCCGGGGCAGCTCCGACGCCCTCCCGCGGGGAAGGAGCCCCCGCGGTGCCGCCGAGGCCCCGACGCGGGGCCGCCCCTCGGCTCGCCGCCCCGCGCCCGCGCCCGCTGGGAATGATGAAGAAGAACAATTCCGCCAAGCGG	170	GGACCTCAGGATGGAAACCAGCAGCCTGCACCGCCCGAGAAGGTCGGCTGGGTCCGGAAATTCTGCGGGAAAGGGATTTTCAGGGAGATTTGGAAAAACCGCTATGTGGTGCTGAAAGGGGACCAGCTCTACATCTCTGAGAAGGAGGTG
86	171	CCAGGTGGGAAGATGGTGGCAGCTGCAAAGGCCTCAGTGCCAACGATTCAGGACCAGGCTTCAGCCATGCAGCTGAGTCAGTGTGCCAAGAACCTGGGCACCGCGCTGGCTGAACTCCGGACGGCTGCCCAGAAGGTATGGAAGCTGGTT	172	AGACTTGTGGGTCTCTTATGACATTTTCACCTACAGGCAGTGGCAGAGCAGATTCCACTGCTGGTGCAGGGCGTCCGAGGAAGCCAAGCCCAGCCTGACAGCCCCAGCGCTCAGCTTGCCCTCATTGCTGCCAGCCAGAGCTTCCTGCAG
87	173	TTGGGAAAGGCCTAGAAGCATCTCTAGGACCATTGTTTCTTAGACCTATACTCATAGAATTGCCTCTCTTCTCAGCAAAACCTGGAAATCCACCGGAAGATAAAACAGTCTGAGCAGGAGCTAGCCTATCTGGAAAGGAGAGAACGAGAG	174	GGAAAGTTTAAAGGAAGAGGAAATGATCGCAGGGAAAAGCTCCAGTCTTTTGACTCTCCAGAAAGGAAACGGATTAAGTACTCCAGGGAAACTGACAGGTAAGCCAGGAACTCTTCATTCAGCCTAGGCCTCAAGCCTAATGATAAAACC
88	175	TTGAGCCTAAGGTGACTGTGTATCCTGCAAGGACCCAGACCCTGCAGCACCACAACCTCCTGGTCTGCTCTGTGAATGGTTTCTATCCAGGCAGCATTGAAGTCAGGTGGTTCCGGAACAGCCAGGAAGAGAAGGCTGGGGTGGTGTCCA	176	GGGAGTACCGGGCGGTGACGGAGCTGGGGCGGCCTGACGCTGAGTACTGGAACAGCCAGAAGGACTTCCTGGAAGACAGGCGCGCCGCGGTGGACACCTACTGCAGACACAACTACGGGGTTGGTGAGAGCTTCACAGTGCAGCGGCGAG
89	177	AGAGGCGGATTTGGTCGTGGACGTGGTCAGCCACCTCAGTAAAATTGGAGAGGATTCTTTTGCATTGAATAAACTTACAGCCAAAAAACCTTAATCTTTTGTCCATTTTGTTTGCATTGTGCAGCCTGAACAGGAACAGTTTAAGTGTCA	178	TTTTCCTGCAAGATTGGAGTCAGTGAGTTGTCTTCCCTTGTTCTATAGTAGATTAGATCATATGATGATTCTAAATCGATGTTTCACTTTCTAGCTGGTGCCGACAAGAAAGCCGAGGCTGGGGCTGGGTCAGCAACCGAATTCCAGTTT
90	179	CTCTCTTGTTCTGCAGTTCTGGCAATACGGCGAGTGGGTGGAGGTGGTGGTGGATGACAGGCTGCCCACCAAGGACGGGGAGCTGCTCTTTGTGCATTCAGCCGAAGGGAGCGAGTTCTGGAGCGCCCTGCTGGAGAAGGCATACGCCAA	180	GATCAACGGATGCTATGAAGCGCTATCAGGGGGTGCCACCACTGAGGGCTTCGAAGACTTCACCGGAGGCATTGCTGAGTGGTATGAGTTGAAGAAGCCCCCTCCCAACCTGTTCAAGATCATCCAGAAAGCTCTGCAAAAAGGCTCTCT
91	181	GTGACCCCAGCCATGAGGACCCTCGCCATCCTTGCTGCCATTCTCCTGGTGGCCCTGCAGGCCCAGGCTGAGCCACTCCAGGCAAGAGCTGATGAGGTTGCTGCAGCCCCGGAGCAGATTGCAGCGGACATCCCAGAAGTGGTTGTTTCC	182	GAAAGTAACCCCGGAAATTAGGACACCTCATCCCAAAAGACCTTTAAATAGGGGAAGTCCACTTGTGCACGGCTGCTCCTTGCTATAGAAGACCTGGGACAGAGGACTGCTGTCTGCCCTCTCTGGTCACCCTGCCTAGCTAGAGGATCT
92	183	CTGGGAGTGTCCACTCGCCTTCCACCAGCATGGCAACGTCTTCACAGTACCGCCAGCTGCTCAGTGACTACGGGCCACCGTCCCTAGGCTACACCCAGGTATGTCAATGGGGGTGATGGCATGGTGGGAGGGCCAGGGGGAGACATGCTT	184	CGCGGGGCTGCAGCGCTACCGCCCGGCCTCGCCGCCGCCGCCGCCGCCCTCGCGGCCTGGCCCCGCCGCGCCCGGCGCGCCCGCCGCCCGGGGGGATGTCTTACAAACCGAACTTGGCCGCGCACATGCCCGCCGCCGCCCTCAACGCCG
93	185	GAGGAGTTGGCCGAAGTCGAAGAAGGAGTTGGAGTAGTGGGCGAAGATAATGACGCAGCCGCGAGAGGAGCGGAGGCCTTTGGCGACAGTGAGGAGGACGGAGAGGATGTGTTCGAGGTGGAGAAGATCCTGGACATGAAGACCGAGGGG	186	GGTAAAGTTCTTTACAAAGTTCGCTGGAAAGGCTATACATCGGATGATGATACCTGGGAGCCCGAGATTCACCTGGAGGACTGTAAAGAAGTGCTTCTTGAATTTAGGAAGAAAATTGCAGAGAACAAAGCCAAAGCAGTCAGGAAGGAT
94	187	CTGCATCTCTGCCCACGTCGGAGAGGTGCGTCGGCTTCCGTACAACACGGATACTCTCTCTCTGACGCAACTTCCTGTCCTGCGCAATTCTATTTGACCTTTGAACTGGCAAAGGCTTTTTTCTTCCTCTTCCGGGGACGTTGTCTGCAG	188	GCACTCAGAATGGTCCAGCGTTTGACATACCGACGTAGGCTTTCCTACAATACAGCCTCTAACAAAACTAGGCTGTAAGTATTTCTGAAAATTTTAAGTATATATTGTCATTTACTCTACAAAATGCTGACCTACTGACTGTTTCACTTT
95	189	CCCCAATTCCCTCAGGTGGCAATCTCAGGTCTGCTCTTCTGCTTACCAACAGGGAAAGTTTAAAGGAAGAGGAAATGATCGCAGGGAAAAGCTCCAGTCTTTTGACTCTCCAGAAAGGAAACGGATTAAGTACTCCAGGGAAACTGACAG	190	TGATCGTAAACTTGTTGATAAAGAAGATATCGACACTAGCAGCAAAGGAGGCTGTGTCCAACAGGCTACTGGCTGGAGGAAAGGGACAGGCCTGGGATATGGCCATCCTGGATTGGCTTCATCAGAGGAGGTAAAATGGTTTCCATCTTT
96	191	ATGGCGTCGTATTTTGGGCATTCAGTGGCTGTCACTGACGTCAACGGGGATGGGTGAGGAGGGACATGCCCCACCCCTACCCAGTTGGGTCCCAAATTACCAGAGCTGCCCTCTGTCTCCCTTTCCTAGCCCTAGTCTCACGTATCCACT	192	CCCCCGCCCCGCCTCCACCAAACCACCCTTTCTCACCTGGAGTGGGAGGTTGCTTTGGGTACAAGAATGATGCTCTCGCCTGCGCTGTCCGTGCAGGTGGAAATTTTGGATTCCTACTACCAGAGGCTGCATCGGCTGCGCGGAGAGCAG
97	193	AGAATCCTTTCCTGTTTGCATTGGAAGCCGTGGTTATCTCTGTTGGCTCCATGGGATTGATTATCAGCCTTCTCTGTGTGTATTTCTGGCTGGAACGGTGAGATTTGGAGAAGCCCAGAAAAATGAGGGGAACGGTAGCTGACAATAGCA	194	ATTATAGACATAAGTTCTCCTTGCCTAGTGTGGATGGGCAGAAACGCTACACGTTTCGTGTTCGGAGCCGCTTTAACCCACTCTGTGGAAGTGCTCAGCATTGGAGTGAATGGAGCCACCCAATCCACTGGGGGAGCAATACTTCAAAAG
98	195	CTCCTGGTAACGTTTTTATCCATGGATGACTTGCTTGGGTAAGGACATGAAGACAGTTCCTGTCATACCTTTTAAAGGTACATGTTTTATTGATGTTAACGTTAATTGATTGAGCTACTGTTAGTGATGATTTTAAAATTAAAGCAGATG	196	CTGACTGAACATGAAGGTCTTAATTAGCTCTAACTGACTAAAGGCATTTGTTAGTTTTGGCAGGGGGTGAACACTCATCTGTGGCTATTCTAAGACCACTCTTATTTCTTAGGTGGAGTCCAACTTGCCTGGACCAGCTTAATGGTTCTG
99	197	GGTCTGGCTGAAGTTGAGGATCTCTTACTCTCTAGGCCACGGAATTAACCCGAGCAGGCATGGAGGCCTCTGCTCTCACCTCATCAGCAGTGACCAGTGTGGCCAAAGTGGTCAGGGTGGCCTCTGGCTCTGCCGTAGTTTTGCCCCTGG	198	CCAGGATTGCTACAGTTGTGATTGGAGGAGGTGAGTCTGTGGGGAAGGGGCTCAAGTAACCACCTGCCCCTAGGGAGGTGGACTTGGGGAGCAGCTGGCCTTGTCCATGCCAATGTTTCCCTCACATGGGTGGTCAGGGGAGGAGGTGGG
100	199	TGTGCCAGAGCTGTGTGGAGCTGGATCCAGCCACCGTGGCTGGCATCATTGTCACTGATGTCATTGCCACTCTGCTCCTTGCTTTGGGAGTCTTCTGCTTTGCTGGACATGAGACTGGAAGGCTGTCTGGGGGTTAGTGGAAGAGCAGAG	200	CATGGGTAGAGGGAACGGTGGGAACACTGCTCTCAGACATTACAAGACTGGACCTGGGAAAACGCATCCTGGACCCACGAGGAATATATAGGTGTAATGGGACAGATATATACAAGGACAAAGAATCTACCGTGCAAGTTCATTATCGAA
101	201	CAGCTGGCCGACGTTGCGGAGAAATGGTGCTCCAACACGCCCTTCGAGCTCATCGCCACCGAGGAGACCGAACGCAGGATGGATTTCTACGCCGACCCCGGCGTCTCCTTCTATGTGCTGTGTCCGGACAACGGCTGCGGCGACAATTTT	202	CACGTGTGGAGTGAGAGCGAGGACTGCCTGCCTTTCTTGCAGCTAGCACAGGATTACATCTCCTCCTGCGGCAAGAAGACGCTCCACGAAGTCCTGGAAAAAGTCTTCAAGTCTTTCAGACCTGTAGGTGCCTGCTTGGCTTCTCACCAC
102	203	ACGCCCCGCAGAAGAAGTTCGGCCCTGTGGTGGCCCCAAAGCCCAAAGTGAATCCCTTCCGGCCCGGGGACAGCGAGCCTCCCCCGGCACCCGGGGCCCAGCGCGCACAGATGGGCCGGGTGGGCGAGATTCCCCCGCCGCCCCCGGAAG	204	ACTTTCCCCTGCCTCCACCTCCCCTTGCTGGGGATGGCGACGATGCAGAGGGTGCTCTGGGAGGTGCCTTCCCGCCGCCCCCTCCCCCGATCGAGGAATCATTTCCCCCTGCGCCTCTGGAGGAGGAGATCTTCCCTTCCCCGCCGCCTC
103	205	GGGAGCTGGCACGGGCGGCCTGGGCCTGGCTGTAGAGGGCCCCTCCGAGGCCAAGATGTCCTGCATGGATAACAAGGACGGCAGCTGCTCGGTCGAGTACATCCCTTATGAGGCTGGCACCTACAGCCTCAACGTCACCTATGGTGGCCA	206	GGACGTGACCTATGACGGCAGTCCCGTGCCCAGCAGCCCCTTCCAGGTGCCCGTGACCGAGGGCTGCGACCCCTCCCGGGTGCGTGTCCACGGGCCAGGCATCCAAAGTGGCACCACCAACAAGCCCAACAAGTTCACTGTGGAGACCAG
104	207	GGTTTAACTGACGTTTTCTTTCTGCCCAGCCGAAAGGAAAGAAGGCCAAGGGAAAGAAGGTGGCTCCGGCCCCAGCTGTCGTGAAGAAGCAGGAGGCTAAGAAAGTGGTGAATCCCCTGTTTGAGAAAAGGCCTAAGAATTTTGGCATTG	208	GACAGGACATCCAGCCCAAAAGAGACCTCACCCGCTTTGTGAAATGGCCCCGCTATATCAGGTTGCAGCGGCAGAGAGCCATCCTCTATAAGCGGCTGAAAGTGCCTCCTGCGATTAACCAGTTCACCCAGGCCCTGGACCGCCAAACAG
105	209	GTATTTCTTAGAAAATGATGGGTTTAAATGAAATGGATCCTGTTGACAGTAAATTTTCTTATTCTGTTCTTTAGGAACCGGCGAATATTTGGCTTGTTGATGGGTACCCTTCAAAAATTTAAACAAGAATCCACTGTTGCTACTGAAAGG	210	CAAAAGCGGCGCCAGGAAATTGAACAAAAACTTGAAGTTCAGGCAGAAGAAGAGAGAAAGCAGGTTGAAAATGAAAGGAGAGAACTGTTTGAAGAGAGGCGTGCTAAACAGACAGAACTGCGGCTTTTGGAACAGAAAGTTGAGCTTGCG
106	211	GAACAATCAGTGGATTATAGACATAAGTTCTCCTTGCCTAGTGTGGATGGGCAGAAACGCTACACGTTTCGTGTTCGGAGCCGCTTTAACCCACTCTGTGGAAGTGCTCAGCATTGGAGTGAATGGAGCCACCCAATCCACTGGGGGAGC	212	ATATCTCCAGTGATCCCCTGGGCTCCAGAGAACCTAACACTTCACAAACTGAGTGAATCCCAGCTAGAACTGAACTGGAACAACAGATTCTTGAACCACTGTTTGGAGCACTTGGTGCAGTACCGGACTGACTGGGACCACAGCTGGACT
107	213	ATTTCTGTATCTTCTTGTCAGGGGTTGAAAAGTTTCAGTTACATGATTGTACACAAGTTGAAAAAGCAGATACTACTATTTGTTTAAAATGGAAAAATATTGAAACCTTTACTTGTGATACACAGAATATTACCTACAGATTTCAGTGTG	214	GTAATATGATATTTGATAATAAAGAAATTAAATTAGAAAACCTTGAACCCGAACATGAGTATAAGTGTGACTCAGAAATACTCTATAATAACCACAAGTTTACTAACGCAAGTAAAATTATTAAAACAGATTTTGGGAGTGAGTATGTTA
108	215	CTCCGGTGTCGGCGGGTGGCGCGGCGCCCCCGGAGGGGGCCATATCTAACGGGGTTTACGTACTGCCGAGCGCGGCCAACGGAGACGTGAAGCCCGTGGTGTCCAGCACGCCTTTGGTGGACTTCTTGATGCAGCTGGAAGATTACACGC	216	CGGCTCCCGCCGCGCTGCCCTCCAGCACCGCCGCGGAGAACAAGGCCAGCCCCGCGGGGACAGCGGGGGGACCTGGGGCTGGAGCAGCTGCTGGGGGCACGGGACCCTTGGCGGCGCGGGCCGGGGAGCCAGCTGAGCGGCGTGGGGCGG
109	217	CAGCCAGTTAACCTGGAGGGACGTCCAGCACCTGCTAGTGAAGACATCCCGGCCGGCCCACCTGAAAGCGAGCGACTGGAAAGTGAACGGCGCGGGTCATAAAGGTGCGGCAGTGGCGTTCTGGTGGACCATTGGGTGGCCCTGGAATGT	218	AGTTAGCCTGTCTGCCATCACTGCCTCACTGTGCTTCTCTCTCCCCCAGGTCACCACGGATCTGCGTCAGCGCTGTACCGATGGCCACACTGGGACCTCAGTCTCTGCCCCCATGGTGGCGGGCATCATCGCCTTGGCTCTAGAAGCAAA
110	219	TTCCTTAGAGAGGAAGAAGCTATTCAGTTGGATGGATTAAATGCATCACAAATAAGAGAACTTAGAGAGAAGTCGGAAAAGTTTGCCTTCCAAGCCGAAGTTAACAGAATGATGAAACTTATCATCAATTCATTGTATAAAAATAAAGAG	220	ATTTTCCTGAGAGAACTGATTTCAAATGCTTCTGATGCTTTAGATAAGATAAGGCTAATATCACTGACTGATGAAAATGCTCTTTCTGGAAATGAGGAACTAACAGTCAAAATTAAGGTAAGTGTAAGGCAGTTTTTCTTTCTTTTAAAG
111	221	GCATCCGCATGCTGGACGGCGATGTCACAGATGTGGTCGAGGCAAAGTCGCTGGGCATCAGACCCAACTACATCGACATTTACAGTGCCAGCTGGGGGCCGGACGACGACGGCAAGACGGTGGACGGGCCCGGCCGACTGGCTAAGCAGG	222	GCACTGAATTCACTGAAACTTGCTGGGCTGCGTCCTCACTTGGTTTTTTCCTTTGTTTCAGACACGGCACTCGTTGTGCGGGAGAAGTTGCTGCTTCAGCAAACAATTCCTACTGCATCGTGGGCATAGCGTACAATGCCAAAATAGGAG
112	223	GTGAAATGATCCCAACAGAAGAACATCGGAGACCAGAGAGAGGAACTCAAAGGGGCGCTGCCTCCGGGTCTGGGGTCCTGGCCTGCGTGGCCTGTTGGCACGTGTTTCTCTTCCCCGCCCGGCCTCCAGTTGTGTGCTCTCACACAGGCT	224	CTGACCCTATTCCCCCGTGCTGTGTCTCCTGCAGAGGGGGAGGTGAGCGCCGACGAGGAGGGCTTTGAGAACCTGTGGGCCACCGCCTCCACCTTCATCGTCCTCTTCCTCCTGAGCCTCTTCTACAGTACCACCGTCACCTTGTTCAAG
113	225	GTCCTCTGGATGTCAGCATGGCAGCCACAAACCTGGAGAACCAGCTGCACAGCGCACAGAAGAACCTCCTGTTCCTTCAGCGGGAGCATGCCAGCACGCTCAAGGGGCTGCACTCCGAGATCAGGCGGCTGCAGCAGCACTGCACAGGTA	226	GAGGTTCTGTATTTACAATAATAATTTATAAGCAAATAACTCACATTTCATCCTCAGTATTTTTCAGTGCTGTACAAGCGTCTTGAATTACTCTGGTAGCTTTTCCAGAAAGACCCATGACTTCACCACATTTCTCGAGTTACGATGAAG
114	227	TGCTAGCAATGTCTCCCACACTGTGGTCCTGCGCCCTCTCAAGGCTGGTTATTTCAACTTCACCTCGGCAACAATTACTTACCTGGCCCAGGAGGATGGGCCCGTTGTGGTGAGTTGCCCAAACCCTTAGCTGGATGGAATTTGGATCTG	228	TAATTTTATATCCATTACTTACTAACCCTTTTTGTTTCATCCATTTTCTAGTGCTGCATTAGACGTGGAACTATCTGATGATTCCTTCCCTCCAGAAGACTTTGGCATTGTGTCTGGAATGCTCAATGTCAAATGGGACCGGATTGCCCC
115	229	GGTTTTTAATGACCACAACAAGCAAGCATGCAGCTTACTGCTTGAAAGGTGAGGATTGGAAATGTTGGGACTATTATAATTGCAGAATACATGATGATCTCAATCCAACTTGAACTCTCTCACTGATTACTTGATGACAATAAAATATCT	230	GTTTTGGTGGCATATACACCTTAATCTGTAGATGGGAGTGATTAGCTGTTTAAAAGTTAAAATGTGACTGAGAAGGAAATTGAGTAGGGCAAATTTTAAATGGGTATTATTTTTCATCTTCAAACAGGCAGACCTGTTATCCTAAACTAG
116	231	TTTCTATTCCGCCTTCCTTGTAGCAGATAAGGTTATTGTCACTTCAAAACACAACAACGATACCCAGCACATCTGGGAGTCTGACTCCAATGAATTTTCTGTAATTGCTGACCCAAGAGGAAACACTCTAGGACGGGGAACGACAATTAC	232	CCTTGTCTTAAAAGAAGAAGCATCTGATTACCTTGAATTGGATACAATTAAAAATCTCGTCAAAAAATATTCACAGTTCATAAACTTTCCTATTTATGTATGGAGCAGCAAGGTAAATCTATATTGATTAAAAACTTATATGTATTACCT
117	233	GACTCAGAATTCATGATTGAAGAAATGCAGGTTAGTTTAAACTTTGAAGGAAATTTTTAAGGTGGCAAAAGGTTTTGGTGGCATATACACCTTAATCTGTAGATGGGAGTGATTAGCTGTTTAAAAGTTAAAATGTGACTGAGAAGGAAA	234	AAATGGAGATTAATCTTAAACTGAAACAGTAGTTGGGAAATCTTTTAGAAATCCACCTATTACTACCTATTGGTAAAGGAGATTAAATTTCTACAGGTATGGAGAGTCGGCTTGACTACACTGTGTGGAGCAAGTTTTAAAGAAGCAAAG
118	235	AGTGGCCATCGTGGTGGGCGCCCCGCGGACCCTGGGCCCCAGCCAGGAGGAGACGGGCGGCGTGTTCCTGTGCCCCTGGAGGGCCGAGGGCGGCCAGTGCCCCTCGCTGCTCTTTGACCTCCGTGAGTCCCAGGCAAGGAGAGCAAGGTT	236	TCTGGAGTGGGTGCTGCTGCTCTTGGGACCTTGTGCTGCCCCTCCAGCCTGGGCCTTGAACCTGGACCCAGTGCAGCTCACCTTCTATGCAGGCCCCAATGGCAGCCAGTTTGGATTTTCACTGGACTTCCACAAGGACAGCCATGGGAG
119	237	CAGAAGGCATGGCATTCATTGAAGAGCGGAATTATATTCATCGTGACCTTCGGGCTGCCAACATTCTGGTGTCTGACACCCTGAGCTGCAAGATTGCAGACTTTGGCCTAGCACGCCTCATTGAGGACAACGAGTACACAGCCAGGGAGG	238	GGGCCAAGTTTCCCATTAAGTGGACAGCGCCAGAAGCCATTAACTACGGGACATTCACCATCAAGTCAGATGTGTGGTCTTTTGGGATCCTGCTGACGGAAATTGTCACCCACGGCCGCATCCCTTACCCAGGTTAGAGCCAAGGGCAGG
120	239	GCATCATGGCCGCCCTCAGACCCCTTGTGAAGCCCAAGATCGTCAAAAAGAGAACCAAGAAGTTCATCCGGCACCAGTCAGACCGATATGTCAAAATTAAGGTATGTGGTCCTGGGATGGAAATGGGTGTGGGGTGAAGAAAAGAGTTTC	240	TCTTTATTTTATTTAAAAGAGCCGGAGCCGGAAGTGCTTGCCTTTTTCCCTGCTAGGACCCAGGGGTTACGACCCATCAGCCCTTGCGCGCCACCGTCCCTTCTCTCTTCCTCGGCGCTGCCTACGGAGGTGGCAGCCATCTCCTTCTCG
121	241	TCTCCAAAAAAAGTTGGTGATGACATTGCCAAGGCAACGGGTGACTGGAAGGGCCTGAGGATTACAGTGAAACTGACCATTCAGAACAGACAGGCCCAGGTATTTGCTTGTGCTTGGTTTCGGGAGAGGAGGGTGGGGGGACAGGTAGCA	242	CAACCCCGGAAAGACGCTGAGAGGGCTGTGGCTCGGGGCTCCCTCTGCACAGACACTAACTCTTCTTTTCCCCCAGTATACCTGAGGTGCACCGGAGGTGAAGTCGGTGCCACTTCTGCCCTGGCCCCCAAGATCGGCCCCCTGGGTCTG
122	243	GATGCTCCCAGAGCTGAGTGGGAGTGGGACGAGAATGGGGATCAGTGCTGTGAGAATGTATCTGCTTTGTCCCAGTTCTTCATCCTGCTGCTGATTATCCTCCTTGCTGAGGTGACCTTGGCCATCCTGCTCTTTGTATATGAACAGAAG	244	CTGAATGAGTATGTGGCTAAGGGTCTGACCGACAGCATCCACCGTTACCACTCAGACAATAGCACCAAGGCAGCGTGGGACTCCATCCAGTCATTTGTGAGTACAGGTGGAATCCTCTTCAGATCAGCCCAGACTTCATTTTCAAGCCTA
123	245	CAAATACTTCCTCTTGATATGGTGGAATTATAGAGTAGTATCATTTGTAACTGAAATGTCTTCTAGGGTTGCTATGCGAAAGCAAGACTGTGGTTTCATTCCAATTTCCTGTATATCGGAATCATCACCATCTGTGTATGTGTGATTGAG	246	GTGTTGGGGATGTCCTTTGCACTGACCCTGAACTGCCAGATTGACAAAACCAGCCAGACCATAGGGCTATGATCTGCAGTAGTCCTGTGGTGAAGAGACTTGTTTCATCTCCGGAAATGCAAAACCATTTATAGCATGAAGCCCTACATG
124	247	CCCCTCTCTCTGCCCTCACAGCCTGCATGATGAATGTGCACAAGCGCTGCGTGATGAATGTTCCCAGCCTGTGTGGCACGGACCACACGGAGCGCCGCGGCCGCATCTACATCCAGGCCCACATCGACAGGGACGTCCTCATTGTCCTCG	248	TAAGAGATGCTAAAAACCTTGTACCTATGGACCCCAATGGCCTGTCAGATCCCTACGTAAAACTGAAACTGATTCCCGATCCCAAAAGTGAGAGCAAACAGAAGACCAAAACCATCAAATGCTCCCTCAACCCTGAGTGGAATGAGACAT
125	249	GATTTATTTCACATAGATGACTATAACAGAGTGCCACTTAAACATGAGCTGGAAATGAGTAAAGAGAGTGAGCATGATTCAGATGAATCCTCTGATGATGACAGTGATTCAGAGGAACCAAGCAAATACATCAATGCATCTTTTATAATG	250	AGCTACTGGAAACCTGAAGTGATGATTGCTGCTCAGGGACCACTGAAGGAGACCATTGGTGACTTTTGGCAGATGATCTTCCAAAGAAAAGTCAAAGTTATTGTTATGCTGACAGAACTGAAACATGGAGACCAGGTTTGTACTTTTGAG
126	251	CTCTTGGGCAATGTGCTGGTGTGTGTGCTGGCCCGCAACTTTGGCAAGGAATTCACCCCACAAATGCAGGCTGCCTATCAGAAGGTGGTGGCTGGTGTGGCTAATGCCCTGGCTCACAAGTACCATTGAGATCCTGGACTGTTTCCTGAT	252	ATGGGCAACCCTAAGGTGAAGGCTCATGGCAAGAAGGTGCTAGGTGCCTTTAGTGATGGCCTGGCTCACCTGGACAACCTCAAGGGCACTTTTTCTCAGCTGAGTGAGCTGCACTGTGACAAGCTGCACGTGGATCCTGAGAACTTCAGG
127	253	CACCATATGAAGGCGGAGTATGGAAAGTTAGAGTGGACCTACCTGATAAATACCCTTTCAAATCTCCATCTATAGGTATGTTACTACTTGGTTTTTCTCCTTAGAGAGTTTTGAAATCTAAGGGGGAAAAATCTTACATTTCAGGGGAGG	254	ATGCCTGGGGTGTTATTGGTAATTCTGCCAGATACTGTAAAGCCTGTGTAATTTCCTTTACCGTCCACCTTAGCATCGAGAGTAAACATGAGGTTACGATCCTGGGAGGACTTAATGAATTTGTAGTGAAGTTTTATGGACCACAAGGAA
128	255	GCAGCCATGTTTGGGCCTAAAGGTATGCTCCCGTCATCCCCACCCCACCCCACCCCACAGCCTCCTCCACCCCAGCCTGTTGACTTTTTCCACCTTCTCTGCAGGCTTTGGGCGGGGCGGAGCCGAGAGCCACACTTTCAAGTAAACCAG	256	GTGGTGGAGACCCCATCCTTGGCTGCTTGCAGGGCCACTGTCCAGGCAAATGCCAGGCCTTGTCCCCAGATGCCCAGGGCTCCCTTGTTGCCCCTAATGCTCTCAGTAAACCTGAACACTTGGAAAACCTGTGTGTGTACATGCGCGTGT
129	257	ACAATGGGGTTTGCCATTCTCTATCTGGGTCTCACTGGCACAGACAGTGCTGCAAGATTGGTTCCCTCATGGGAATGAAATGTTTCCCCTCCTTCCTCCGCAGGACAAAACAAGGAGAGGCCACCACCTGTTCCCAACCCAGACTATGAG	258	CCCATCCGGAAAGGCCAGCGGGACCTGTATTCTGGCCTGAATCAGAGACGCATCTGACCCTCTGGAGAACACTGCCTCCCGCTGGCCCAGGTCTCCTCTCCAGTCCCCCTGCGACTCCCTGTTTCCTGGGCTAGTCTTGGACCCCACGAG
130	259	GTGAAATGGCTCCAGCAACAGGAAGTGAAACGAAGGGTGAAGAGACAGGTGCGAAGTGACCCGCAGGCCCTTTACTTCAACGACCCCATTTGGTCCAACATGTGGTACCTGGTGAGTAGGACAGGACCTCTGTCTGCCCCAGGACACTTG	260	TTCGTGAGACTATTAATTGATGGCATTCTGCTTCTTGTCTTGCAGATTGGAAACCTGGAAGATTACTACCATTTTTATCACAGCAAAACCTTTAAAAGATCAACCTTGAGTAGCAGAGGCCCTCACACCTTCCTCAGAATGGACCCCCAG
131	261	GCTGGGAGTTTGCACCTGGGGTACAGAGGCAGGGAGGAAGGCGGGTGACTCTGTGGGTAACTAGCTGGAGGCTGGGCCCCCCGGGCTGCCTGACATACACCTCCTTCTGCTTTTGCAGGGGCTTCGGGAAGCAGGGATTCCAGTGCCAAG	262	TTTGCTGCTTTGTGGTGCACAAGCGGTGCCATGAATTTGTCACATTCTCCTGCCCTGGCGCTGACAAGGGTCCAGCCTCCGATGTAAGTAATGGGCATCGATTGCTTTTCTCTGTCCACAGTCAATGCTGCCTTGTGATTAAATGTGAGT
132	263	CCCTAAATGCCGAGCTGCAGCTGGACCGGCAGAAGCCCCGCCAGGGCCGGCGGGTGCTGCTGCTGGGCTCTCAACAGGCAGGCACCACCCTGAACCTGGATCTGGGCGGAAAGCACAGCCCCATCTGCCACACCACCATGGCCTTCCTTC	264	CCGTGAGCTGGTGAGGAGGCAGAGGGCATGGGCCTTAAAGGATCTGGGACCTCAGAAAGGCTCCAACCCCTGAGCCCCACTTACGTCTTTGCAGCTTCAACATCCAGATGTGTGTTGGAGCCACTGGGCACAACATTCCTCAGAAGCTAT
133	265	ACTCTGCCTCCTCCTTAGGGGCCAAGTTTCCCATTAAGTGGACAGCGCCAGAAGCCATTAACTACGGGACATTCACCATCAAGTCAGATGTGTGGTCTTTTGGGATCCTGCTGACGGAAATTGTCACCCACGGCCGCATCCCTTACCCAG	266	GGATGACCAACCCGGAGGTGATTCAGAACCTGGAGCGAGGCTACCGCATGGTGCGCCCTGACAACTGTCCAGAGGAGCTGTACCAACTCATGAGGCTGTGCTGGAAGGAGCGCCCAGAGGACCGGCCCACCTTTGACTACCTGCGCAGTG
134	267	CCAGTTATCAATGTTAAAAAGTGATCTCCCTCTCTCCTCTATCTCCTGTCTTGCCCACCCCCTCTCCATCTCCCCCACCTCTCTTTTTTACAGTATATTATTTCCGGATCACTCCTGGCAGCAACGGAGAAAAACTCCAGGAAGTGTTTG	268	GTCAAAGGAAAAATGATAATGAATTCATTGAGCCTCTTTGCTGCCATTTCTGGAATGATTCTTTCAATCATGGACATACTTAATATTAAAATTTCCCATTTTTTAAAAATGGAGAGTCTGAATTTTATTAGAGCTCACACACCATATATT
135	269	CATGCAGCCAAGCAGGCTGCAGCCTCAGCCACACAGACCATCGCTGCAGCTCAGCACGCAGCCTCTACCCCCAAGGCCTCTGCCGGCCCCCAGCCCCTGCTGGTGCAGAGCTGCAAGGTAAGACTCTAGGAAGGATGTGGGAGTGGAAGA	270	GTCTTTCCACCTCTCCCTCAGGGAGCAGCTGCCCACCCTGACAGTGAGGAGCAGCAGCAGCGGCTGCGGGAGGCAGCTGAGGGGCTGCGCATGGCCACCAATGCAGCTGCGCAGAATGCCATCAAGAAAAAGCTGGTGCAGCGCCTGGAG
136	271	GCCGGGCGGCGGCCGGGCCGGCGGACGGCGGGATGGGCTGCACCGTGAGCGCCGAGGACAAGGCGGCGGCCGAGCGCTCTAAGATGATCGACAAGAACCTGCGGGAGGACGGAGAGAAGGCGGCGCGGGAGGTGAAGTTGCTGCTGTTGG	272	GTGCTGGGGAGTCAGGGAAGAGCACCATCGTCAAGCAGATGAAGTAAGTGCTGTATTCCAGAGGCAGTGCTCAAACTCCAGCTTCCCCTCTTCACCCTCTGGGCCTGCACTGCCCCCGACTACAGGCCCAGCCAGTCTTAGCCAGGCCCA
137	273	CCCCTTGGGAATCACCTGGACCAGTGGGGGCCACAGTGGGAAGGGGGCAGGCAGGAGCAGCATGAACCCCCTGTGCCCTCCTCTCCCCAGGACGACTTCAAAGAGGGCTACCTGGAGACAGTGGCGGCTTATTATGAGGAGCAGCACCCA	274	GAGCTCACTCCTCTACTTGAAAAAGAAAGAGATGGATTACGGTGCCGAGGCAACAGATCCCCTGTCCCGGATGTTGAGGATCCCGCAACCGAGGAGCCTGGGGAGAGCTTTTGTGACAAGGTCATGAGATGGTTCCAGGCCATGCTGCAG
138	275	GACAGGACATCCAGCCCAAAAGAGACCTCACCCGCTTTGTGAAATGGCCCCGCTATATCAGGTTGCAGCGGCAGAGAGCCATCCTCTATAAGCGGCTGAAAGTGCCTCCTGCGATTAACCAGTTCACCCAGGCCCTGGACCGCCAAACAG	276	CTACTCAGCTGCTTAAGCTGGCCCACAAGTACAGACCAGAGACAAAGCAAGAGAAGAAGCAGAGACTGTTGGCCCGGGCCGAGAAGAAGGCTGCTGGCAAAGGGGACGTCCCAACGAAGAGACCACCTGTCCTTCGAGCAGGTGAGTAGG
139	277	CCAATATACAAACTGGAGTGTGGAGCAGCTTCCTGCAGAACCCAAGGAATTAATCTCTATGATTCAGGTCGTCAAACAAAAACTTCCCCAGAAGAATTCCTCTGAAGGGAACAAGCATCACAAGAGTACACCTCTACTCATTCACTGCAG	278	GGATGGATCTCAGCAAACGGGAATATTTTGTGCTTTGTTAAATCTCTTAGAAAGTGCGGAAACAGAAGAGGTAGTGGATATTTTTCAAGTGGTAAAAGCTCTACGCAAAGCTAGGCCAGGCATGGTTTCCACATTCGTAAGTATCCTTCA
140	279	TGAAAGCTGGTGGAATGCGAATTGTGCAGAAACACCCACATACAGGAGACACCAAAGAAGAGAAAGACAAGGATGACCAGGAATGGGAAAGCCCCAGGTGGGATGATGCTAGCGACTCTTGAGCATGTTTTCCAAAAACCCTATTCGGTT	280	CGCTCCCCGGCGCTCACACCTGAGCTCACTCGCGCACGCCCGCCCGGCCCGAGAACCGCGCCGCCGCCTCGGCCCCGCGGAAGCCCCGCCGCGTCATGTCTTCGCCTCCCGAAGGGAAACTAGAGACTAAAGCTGGACACCCGCCCGCCG
141	281	CTGCTGGAGCCAGTTCTGCTTCTCGGCAAGGAGCGATTTGCTGGTGTAGACATCCGTGTCCGTGTAAAGGGTGGTGGTCACGTGGCCCAGATTTATGGTGAGTCCCAGGAACTGGGCGCATGGAGGAGGTGGCTCTGGGAGGGAGGCCTT	282	AGCTGGAGCCGGAGCTCACGGGGCCCCTGTTTCTCTTGTATCTTACAGAAGACAGCGACAGCTGTGGCGCACTGCAAACGCGGCAATGGTCTCATCAAGGTGAACGGGCGGCCCCTGGAGATGATTGAGCCGCGCACGCTACAGTACAAG
142	283	GTTGAAAAGAAAAAGAAGGAGAAGGTTCTCGCAACTGTTACAAAACCAGTTGGTGGTGACAAGAACGGCGGTACCCGGGTGGTTAAACTTCGCAAAATGGTAAGATGTGGGGACTGTAAATTGGATTTTCTGTTTATGCTTGAATACTGT	284	GGTAACCTCAAAGCTAAAAAGCCCAAGAAGGGGAAGCCCCATTGCAGCCGCAACCCTGTCCTTGTCAGAGGAATTGGCAGGTATTCCCGATCTGCCATGTATTCCAGAAAGGCCATGTACAAGAGGAAGTACTCAGCCGCTAAATCCAAG
143	285	GCAAGTGTCGTGGACTTCGTACTGCTAGGAAGCTCCGTAGTCACCGACGAGACCAGAAGTGGCATGATAAACAGTATAAGAAAGCTCATTTGGGCACAGCCCTAAAGGCCAACCCTTTTGGAGGTGCTTCTCATGCAAAAGGAATCGTGC	286	TTTTCAAAGGAGAGACCCCAGCCTCGGGTCAGGCGCGGCGCAGACAGCGGCGCGGGGTCCTTGGCTGGGCGGGGCTTGCTCGCGGTGGCTTGTGGCTCCTTCCTGCGGTGCTTCTCTCTTTCGCTCAGGCCCGTGGCGCCGACAGGATGG
144	287	CTGATCCACAACAACTTCGGAGTGCTCTTCCATAACCTCCCCTCCCTCACGCTGGGCAATGTGTTTGTCATCGTGGGCTCTATTATCATGGTAGTTGCCTTCCTGGGCTGCATGGGCTCTATCAAGGAAAACAAGTGTCTGCTTATGTCG	288	TTCTTCATCCTGCTGCTGATTATCCTCCTTGCTGAGGTGACCTTGGCCATCCTGCTCTTTGTATATGAACAGAAGGTAAGTTATAAAGACAACAACTTATTGTCTTAATACTGAAAGTGGGGAGTATGCAGTGGAGAAGTTGGTACAAAG
145	289	CCCGGTCCTTTGGAGTAGAATGGATTGCAAGTTGGCTAGTGGTCACGGTGCCCACCATTCTTGGCCTGTTACTTACCTGAGATGAGCTCTTTTAACTCAAGCGAAACTTCAAGGCCAGAAGATCTTGCCTGTTGGTGATCATGCTCCTCA	290	ACAAAAGGCCCTTCCCAAAGGAGCTCCAGAACAGTGTGCTTGAAACCACCCTTATGCCACATAATTACTCCAGGTGTTATACTTGCCAAGTCAGCAATTCTGTGAGCAGCAAGAATGGCACGGTCTGCCTCAGTCCACCCTGTACCCTGG
146	291	GTGGAAATTTTGGATTCCTACTACCAGAGGCTGCATCGGCTGCGCGGAGAGCAGGTGGGGGCCAGGTCCCAGTGGGCGTGGCTGGGTGGAGGGGGAACTGAGACTTCAGAATATTTCATGGGAGGTGAGGGCCCATTTCTTAAAGAGGAT	292	GGAAATCTTCCTGCACACACATTTTTCCCTGGGTGCAGAACGGGGAGCGGGAAGTGGGTAGGTTCTAAGGCTCTCATTCCCTGAGCCTGGCTCTCCCTATCGCCAGAATATGTCGTCGGTGCCCCCACTTGGAGCTGGACCCTGGGAGCG
147	293	CTGGTGCCGACAAGAAAGCCGAGGCTGGGGCTGGGTCAGCAACCGAATTCCAGTTTGTGAGTATCTTCCTATTTGTTTTCCATGAGCCATCACTTGTTCTGGCCTCAGTCTGGTTGCTCTGCAAGTTGTGGGGATGTCATATAGTATGGG	294	CCAGTTTTCTTGGCTTTAAGGGACAGAGTTCTCACATTGCCCTGTGTTCACAGTGTGGTTTGATTTACATAGGTCTGGAGGGTGAGCGACCTGCGAGACTCACAAGAGGGGAAGCTGACAGAGATACCTACAGACGGAGTGCTGTGCCAC
148	295	GTTCTTTACAAAGTTCGCTGGAAAGGCTATACATCGGATGATGATACCTGGGAGCCCGAGATTCACCTGGAGGACTGTAAAGAAGTGCTTCTTGAATTTAGGAAGAAAATTGCAGAGAACAAAGCCAAAGCAGTCAGGAAGGATATTCAG	296	AGACTATCCTTAAATAACGACATATTTGAGGCGAACTCTGATAGCGATCAGCAAAGTGAGACAAAAGAAGATACTTCCCCAAAGAAGAAAAAGAAAAAATTGAGGCAGAGAGAAGAGAAAAGCCCAGATGATCTGAAAAAGAAAAAAGCA
149	297	GAGGCTCCTTTTGACCTGAGTGTCGTCTATCGGGAAGGAGCCAATGACTTTGTGGTGACATTTAATACATCACACTTGCAAAAGAAGTATGTAAAAGTTTTAATGCACGATGTAGCTTACCGCCAGGAAAAGGATGAAAACAAATGGACG	298	CATGTGAATTTATCCAGCACAAAGCTGACACTCCTGCAGAGAAAGCTCCAACCGGCAGCAATGTATGAGATTAAAGTTCGATCCATCCCTGATCACTATTTTAAAGGCTTCTGGAGTGAATGGAGTCCAAGTTATTACTTCAGAACTCCA
150	299	AGAGACCGGGTCTCTTAAACTGCCCAATATATTGGCAGCAACTCCGAGAGAAATGCTTGTTATTTTCTCACACTGTCAACCCTTGGAATAACAGTCTAGCTGATTGTTCCACCAAAGAATCCAGCCTGCTGCTTATTCGAGATAAGGATG	300	AAAGTAACAAATATAATATATCCACTCCACCACACATTTCAGCATTTAATACTCTTGTTTTTCCTTATGTACTAGTGACATCCTTAATACAGAAATCATCAATAGAAAAATGCAGTGTGGACATTCAACAGAGCAGGAATAAAACAACAG
151	301	GGTTTGAAAGAAATCTTAACTGTTTTTTTCCCCTACTCTTCTAAGATTGAAGAATTAGGGTCTGAAGGAAAAGTAGAAGAAGCCCAGGGGATGATGAAATTAGTTGAGCAATTAAAAGAAGAGAGAGAACTGCTAAGGTCCACAACGTCG	302	ACAATTGAAAGCTTTGCTGCACAAGAAAAACAAATGGAAGTTTGTGAAGTATGTGGAGCCTTTTTAATAGTAGGAGATGCCCAGTCCCGGGTAGATGACCATTTGATGGGAAAACAACACATGGGCTATGCCAAAATTAAAGCTACTGTA
152	303	GCCCAGTACATCTTGATCCATCAGGCTTTGGTGGAATACAATCAGTTTGGAGAAACAGAAGTGAATTTGTCTGAATTACATCCATATCTACATAACATGAAGAAAAGGGATCCACCCAGTGAGCCGTCTCCACTAGAGGCTGAATTCCAG	304	AGACTTCCTTCATATAGGAGCTGGAGGACACAGCACATTGGAAATCAAGAAGAAAATAAAAGTAAAAACAGGAATTCTAATGTCATCCCATGTATGTAGTTTATTTTTTTATTTTTTGTATCAGATAAAGTTAAGCTCTTTTGGATTTGT
153	305	CAGCCCCAGAAGCGAGAGGAGCAAACCAAGAAGGAGAATGAAGAAGACAAACTCACTGACTGGAATAAACTGGCTTGTCTGCTTTGCAGAAGGCAGTTTCCCAATAAAGAAGTTCTGATCAAACACCAGCAGCTGTCAGACCTGCACAAG	306	CAAAACCTGGAAATCCACCGGAAGATAAAACAGTCTGAGCAGGAGCTAGCCTATCTGGAAAGGAGAGAACGAGAGGTAAACTTTGGTGACCTATTACTCCCTTGACCTCAGCTCTTTTTGCTTTCTGATATAGACTTCATAGGCTGTGCT
154	307	GGCTTAAGTCCACTCCCCGCCCTAAGTTCTCTGTGTGTGTCCTGGGGGACCAGCAGCACTGTGACGAGGCTAAGGCCGTGGATATCCCCCACATGGACATCGAGGCGCTGAAAAAACTCAACAAGAATAAAAAACTGGTCAAGAAGCTGG	308	CCAAGAAGTATGATGCGTTTTTGGCCTCAGAGTCTCTGATCAAGCAGATTCCACGAATCCTCGGCCCAGGTTTAAATAAGGCAGGAAAGTTCCCTTCCCTGCTCACACACAACGAAAACATGGTGGCCAAAGTGGATGAGGTGAAGTCCA
155	309	ATGACGTCCGGTTGTTTGCCTTCGTGCGCTTCACCACCGGGGATGCCATGAGCAAGAGGTCCAAGTTTGCCCTCATCACGTGGATCGGTGAGAACGTCAGCGGGCTGCAGCGCGCCAAAACCGGGACGGACAAGACCCTGGTGAAGGAGG	310	AAGCGCCGCGTCGCGCGGCCACCAGCGCTGATGTGTGTGTGTGTTTTTTTCTTCTCCCAACCCAAAGGGTGACTTTTAAATATGACGGCTCCACCATCGTCCCCGGCGAGCAGGGAGCGGAGTACCAGCACTTCATCCAGCAGTGCACAG
156	311	GCTCAAGGAAAAACATGGACTGCTATTGCAGAATACCAGCGTGCATTGCAGGAGAACGTCGCTATGGAACCTGCATCTACCAGGGAAGACTCTGGGCATTCTGCTGCTGAGCTTGCAGAAAAAGAAAAATGAGCTCAAAATTTGCTTTGA	312	CCATTCTCCTGGTGGCCCTGCAGGCCCAGGCTGAGCCACTCCAGGCAAGAGCTGATGAGGTTGCTGCAGCCCCGGAGCAGATTGCAGCGGACATCCCAGAAGTGGTTGTTTCCCTTGCATGGGACGAAAGCTTGGCTCCAAAGCATCCAG
157	313	CCTCTTACTCTCATTCATTTCATACACACTGGCTCACACATCTACTCTCTCTCTCTATCTCTCTCAGAATGACAATTCTAGGTACAACTTTTGGCATGGTTTTTTCTTTACTTCAAGTCGTTTCTGGAGAAAGTGGCTATGCTCAAAATG	314	GAGACTTGGAAGATGCAGAACTGGATGACTACTCATTCTCATGCTATAGCCAGTTGGAAGTGAATGGATCGCAGCACTCACTGACCTGTGCTTTTGAGGACCCAGATGTCAACATCACCAATCTGGAATTTGAAATATGGTGAGGGATGG
158	315	CTTGCTGCTTGAGTTTTATAATGTCTAATAAATTGTATTTTAGCTGTGGAGGAAGATGCAGAGTCAGAAGATGAAGAGGAGGAGGATGTGAAACTCTTAAGTATATCTGGAAAGCGGTCTGCCCCTGGAGGTGGTAGCAAGGTTCCACAG	316	AAAAAAGTAAAACTTGCTGCTGATGAAGATGATGACGATGATGATGAAGAGGATGATGATGAAGAGTAAGTATGATTTTAGAAACTTGATATACTTCCGGAATCTTGACAAAAAAAGGAATTTGACATAGTTATATGCATGAGGGTTTTA
159	317	GAGGCGGCCGCGCGTGTGTTGGGCCCGGGGTGCTCGGACGCGCGCTCAGGGTCGGTCCTGCTGTTCGTTGCTTCTTAGGCTCTTCTGGAGCTGGAGATGAACTCGGACCTCAAGGCTCAGCTCAGGGAGCTGAATATTACGGCAGCTAAG	318	GAAATTGAAGTTGGTGGTGGTCGGAAAGCTATCATAATCTTTGTTCCCGTTCCTCAACTGAAATCTTTCCAGAAAATCCAAGTCCGGCTAGTACGCGAATTGGAGAAAAAGTTCAGTGGGAAGCATGTCGTCTTTATCGCTCAGGTATCT
160	319	AAAATTTCCCATTTTTTAAAAATGGAGAGTCTGAATTTTATTAGAGCTCACACACCATATATTAACATATACAACTGTGAACCAGCTAATCCCTCTGAGAAAAACTCCCCATCTACCCAATACTGTTACAGCATACAATCTCTGTTCTTG	320	GGCATTTTGTCAGTGATGCTGATCTTTGCCTTCTTCCAGGAACTTGTAATAGCTGGCATCGTTGAGAATGAATGGAAAAGAACGTGCTCCAGACCCAAATCTGTAAGTAGTAGCCCCTCTGGCCAAAACCTCCCTCTAGAAAATCCACAT
161	321	GGGTGGCCCTGCACAGGCCCGATGTCTACTTGCTGCCACCAGCCCGGGAGCAGCTGAACCTGCGGGAGTCGGCCACCATCACGTGCCTGGTGACGGGCTTCTCTCCCGCGGACGTCTTCGTGCAGTGGATGCAGAGGGGGCAGCCCTTGT	322	TCTCCGAGAGCCACCCCAATGCCACTTTCAGCGCCGTGGGTGAGGCCAGCATCTGCGAGGATGACTGGAATTCCGGGGAGAGGTTCACGTGCACCGTGACCCACACAGACCTGCCCTCGCCACTGAAGCAGACCATCTCCCGGCCCAAGG
162	323	ACCCTACGTCCGCTCCAAGGGCCGGAAGTTCGAGCGTGCCAGAGGCCGACGGGCCAGCCGAGGCTACAAAAACTAACCCTGGATCCTACTCTCTTATTAAAAAGATTTTTGCTGACAGTGCTCTGTGTGTGTTATTGGGGGATGGGTTGG	324	CCTTCACCCTCCTGGATCTGGGAGGCCAGAAGCTGGGCGCCAGATCCCTGTCTCACCCGGTTCTCCTTCCCCTTCCCTAGGTCCTCGCAAGGGCCGAGAGGTGTACCGGCATTTCGGCAAGGCCCCAGGAACCCCGCACAGCCACACCAA
163	325	GAGGCATGATCTGCTGGTGGGCGCTCCACTGTATATGGAGAGCCGGGCAGACCGAAAACTGGCCGAAGTGGGGCGTGTGTATTTGTTCCTGCAGCCGCGAGGCCCCCACGCGCTGGGTGCCCCCAGCCTCCTGCTGACTGGCACACAGCT	326	AACTGAGACTTCAGAATATTTCATGGGAGGTGAGGGCCCATTTCTTAAAGAGGATGCTTGTCCAGCGGCGTGAATGATGGTGCTCCTCATCTTGCAGATGGCGTCGTATTTTGGGCATTCAGTGGCTGTCACTGACGTCAACGGGGATGG
164	327	AAATGGCACCTCGAAAGGGGAAGGAAAAGAAGGAAGAACAGGTCATCAGCCTCGGACCTCAGGTGGCTGAAGGAGAGAATGTATTTGGTGTCTGCCATATCTTTGCATCCTTCAATGACACTTTTGTCCATGTCACTGATCTTTCTGGCA	328	ACTCTTTGGGAGGAATAATGCCGGCGTCTTCCGGAACCCGACCTCGCCCCGTGACCTCAGAGGTATACTTCCGGGACACGGAAGTGACCCCCGTCGCTCCGCCCCCTCCCACTCTCTCTTTCCGGTGTGGAGTCTGGAGACGACGTGCAG
165	329	GATAATCCCCTTTTCAAGAGCGCCACCACGACGGTCATGAACCCCAAGTTTGCTGAGAGTTAGGAGCACTTGGTGAAGACAAGGCCGTCAGGACCCACCATGTCTGCCCCATCACGCGGCCGAGACATGGCTTGCCACAGCTCTTGAGGA	330	AACATCGCCGCCATCGTCGGGGGCACCGTGGCAGGCATCGTGCTGATCGGCATTCTCCTGCTGGTCATCTGGAAGGCTCTGATCCACCTGAGCGACCTCCGGGAGTACAGGCGCTTTGAGAAGGAGAAGCTCAAGTCCCAGTGGAACAAT
166	331	TTGAACAGACACGGTAGAAGACTCGCCCATTTTGGAATGTGACCGTCTGTCCTTCAGGAGAGGACACCAGGGTGGGGGTGAAGGAGACACTACTGCCCCCACCCCTGACAGCCCCCACCCCATGGCTTCCATCTTTTGCATCACCACCAC	332	AGGTGGCCAGAGCAGGCCGGTTTGGCACCAAGGGCTTGGCTATCACATTTGTGTCCGATGAGAATGATGCCAAGATCCTCAATGATGTGCAGGATCGCTTTGAGGTCAATATTAGTGAGCTGCCTGATGAGATAGACATCTCCTCCTACA
167	333	GGTGTCTGCTTCTTTTGCAGTGATCGTAAACTTGTTGATAAAGAAGATATCGACACTAGCAGCAAAGGAGGCTGTGTCCAACAGGCTACTGGCTGGAGGAAAGGGACAGGCCTGGGATATGGCCATCCTGGATTGGCTTCATCAGAGGAG	334	GCTGAAGGCCGGATGAGGGGCCCCAGTGTTGGAGCCTCAGGAAGAACCAGCAAAAGACAGTCCAACGAGACTTACCGAGATGCTGTTCGAAGAGTCATGTTTGCTCGATATAAAGAACTCGATTAAGAAAGGAGACAAGTTCCATGGGAT
168	335	TTGCAGATGTCCCAGGAGAGAGGAGTACAGCCAGCACCTTTCCTACAGACCCAGTTTCCCCATTGACAACCACCCTCAGCCTTGCACACCACAGCTCTGCTGCCTTACCTGCACGCACCTCCAACACCACCATCACAGCGAACACCTCAG	336	ATGCCTACCTTAATGCCTCTGAAACAACCACTCTGAGCCCTTCTGGAAGCGCTGTCATTTCAACCACAACAATAGGTGATATTACCCTCAGTCAGGCAGCCACACCATCCCCATGTGCCTGGTGATGTGCTCTCACAAGGGCCTTCCACC
169	337	GTGATGAGGATGATAAAAACATAGGCAGTGATGAGGATCACCTGTCACTGAAGGAATTTTCAGAATTGGAGCAAAGTGGTTATTATGTCTGCTACCCCAGAGGAAGCAAACCAGAAGATGCGAACTTTTATCTCTACCTGAGGGCAAGAG	338	TGTGTGAGAACTGCATGGAGATGGATGTGATGTCGGTGGCCACAATTGTCATAGTGGACATCTGCATCACTGGGGGCTTGCTGCTGCTGGTTTACTACTGGAGCAAGAATAGAAAGGCCAAGGCCAAGCCTGTGACACGAGGAGCGGGTG
170	339	AAATATGAGATTACGGAGCAGCGCAAGATTGATCAGAAAGCTGTGGACTCACAAATTTTACCAAAAATCAAAGCTATTCCTCAGCTCCAGGGCTACCTGCGATCTGTGTTTGCTCTGACGAATGGAATTTATCCTCACAAATTGGTGTTC	340	ACACACCAGAAATTTGTCATTGCCACTTCAACCAAAATCGATATCAGCAATGTAAAAATCCCAAAACATCTTACTGATGCTTACTTCAAGAAGAAGAAGCTGCGGAAGCCCAGACACCAGGAAGGTGAGATCTTCGACACAGAAAAAGAG
171	341	GTGGCTAAAGCAGTGACCCAGGCTCTGAACCGCTGTGTCAGCTGCCTACCTGGCCAGCGCGATGTGGATAATGCCCTGAGGGCAGTTGGAGATGCCAGCAAGCGACTCCTGAGTGACTCGGTAGGAGGACGGTAGGGGGTGGGGGAACGT	342	GTCGCTGCACTGACGTCAGATCCTGCAGTGCAGGCCATTGTACTTGATACGGCCAGTGATGTGCTGGACAAGGCCAGCAGCCTCATTGAGGAGGCGAAAAAGGCAGCTGGCCATCCAGGGGACCCTGAGAGCCAGCAGCGGCTTGCCCAG
172	343	TGGGAAGGTTAGTTCTGCCTCCTGGGCTACAGGTGTCTGGGCATTTGTTCTGTGCCTGTGGAGCCCCTCTGGGCCTGCCCCCTGACCACCTGTGCCCTCTGTTCCAGGTGCTGGGGAGTCAGGGAAGAGCACCATCGTCAAGCAGATGAA	344	GATCATCCACGAGGATGGCTACTCCGAGGAGGAATGCCGGCAGTACCGGGCGGTTGTCTACAGCAACACCATCCAGTCCATCATGGCCATTGTCAAAGCCATGGGCAACCTGCAGATCGACTTTGCCGACCCCTCCAGAGCGGTATGTGC
173	345	AGAATAAGTGGGAAGACTCAGTGTGCCTGTGCCCTCTGCCATTCACTTCATCTATCAATGTTCTCTGATTTCAGGATTAAGCCTATCGTATGGCCCAGTCTCCCCGATCATAAGAAGACTCTGGAACATCTTTGTAAGAAACCAAGAAAA	346	AATTTAAATGTGAGTTTCAATCCTGAAAGTTTCCTGGACTGCCAGATTCATAGGGTGGATGACATTCAAGCTAGAGATGAAGTGGAAGGTTTTCTGCAAGATACGTTTCCTCAGCAACTAGAAGAATCTGAGAAGCAGAGGCTTGGAGGG
174	347	CTATCCGTCAGTCCATCTCCAAAGCCCTGGTGGCCTATTACCAGAAATGTGAGTGAGCATGGGTCCTTCCCATGAGGTAGATGGGTGTGTGGGGATCAAGTCAAGGACTCTGTGTGATTATCTAAATCCTCGTCCCTGCTCTTCTTGCCA	348	GCTAAGCTGCCCAGCATGTAACTTAAATCCCTGTTCATTCCCCATTCCTTTAGCTGCTGGAGCCAGTTCTGCTTCTCGGCAAGGAGCGATTTGCTGGTGTAGACATCCGTGTCCGTGTAAAGGGTGGTGGTCACGTGGCCCAGATTTATG
175	349	GACGATGCCCCGAATTCCCACCCTGAAGAACCTAGAGGATCTTGTTACTGAATACCACGGGAACTTTTCGGTGAGAACGCTGTCATAAGCATGCTGCAGTCTATCAACTGCCAACTGCCTGCCAGCAAGACAGACAGAGTGTGGGGGTGG	350	GTAGTAGGGGCACAACAAATATAAGGTCCACTTTGCTTTTCTTTTTTCTATAGAGAATCCTTTCCTGTTTGCATTGGAAGCCGTGGTTATCTCTGTTGGCTCCATGGGATTGATTATCAGCCTTCTCTGTGTGTATTTCTGGCTGGAACG
176	351	ATTGTTGAATTGTCTTCTTTTATCTAGGAAATCTGTGCTCAGTACTGGGGAGAAGGAAAGCAAACATATGGAGATATTGAAGTTGACCTGAAAGACACAGACAAATCTTCAACTTATACCCTTCGTGTCTTTGAACTGAGACATTCCAAG	352	AGGAAAGACTCTCGAACTGTGTACCAGTACCAATATACAAACTGGAGTGTGGAGCAGCTTCCTGCAGAACCCAAGGAATTAATCTCTATGATTCAGGTCGTCAAACAAAAACTTCCCCAGAAGAATTCCTCTGAAGGGAACAAGCATCAC
177	353	ATGTTTATTGTTCATTTTCTTCACATGTTTAGTGATGAAAAATTTCTCCCTTCTAGGTTTCCCTTGGGGGCTTTGAAATAACACCACCAGTGGTCTTAAGGTTGAAGTGTGGTTCAGGGCCAGTGCATATTAGTGGACAGCACTTAGTAG	354	CTGTGGAGGAAGATGCAGAGTCAGAAGATGAAGAGGAGGAGGATGTGAAACTCTTAAGTATATCTGGAAAGCGGTCTGCCCCTGGAGGTGGTAGCAAGGTTCCACAGGTAGAGATGGCAATTTTATTATAGGTTTTGTATTATAGCTTTT
178	355	CTAACCCCTGTGTGTCCCCTCCTATTACAGCCCAAAGATCCCTGTGCAGCTCCGATTTTATTCGCATCCTTGTGATCTTCTCTGGAATGTTCCTTGTTTTCACCCTGGCCGGGGCCCTGTTCCTCCATCAACGAAGGAAATATAGATCAA	356	ACAAAGGAGAAAGTCCTGTGGAGCCTGCAGAGCCTTGTCATTACAGCTGCCCCAGGGAGGAGGAGGGCAGCACCATCCCCATCCAGGAGGATTACCGAAAACCGGAGCCTGCCTGCTCCCCCTGAGCCAGCACCTGCGGGAGCTGCACTA
179	357	ACCTGATCGTGGGAGCTTACGGGGCCAACCAGGTGGCTGTGTACAGGTGAGCACTGGCTCCAGGGGCGGGATGGGGAAGGTCCTGTGCCATCAAGAGGAGGCCAGGCCAGGAGGAGCCACAATGGCAAGCCTACCCCATCACCCTATCCC	358	GTGGCCGGGGCCAAGTGCTGGTGTTCCTGGGTCAGAGTGAGGGGCTGAGGTCACGTCCCTCCCAGGTCCTGGACAGCCCCTTCCCCACAGGCTCTGCCTTTGGCTTCTCCCTTCGAGGTGCCGTAGACATCGATGACAACGGATACCCAG
180	359	CGCCTCATGCGGCGCCGCGCACGGGTCCCAGAGCCTTCTGGGTAGCGGTTTAACCCCGCCTCTTGCGTCGGCGCCTTCCTTTTCCTCCCTGTCGCCACCGAGGTCGCACGCGTGAGACTTCTCCGCCGCCTCCGCCGCAGACGCCGCCGC	360	GATGCGCTACGTCGCCTCCTACCTGCTGGCTGCCCTAGGGGGCAACTCCTCCCCCAGCGCCAAGGACATCAAGAAGATCTTGGACAGCGTGGGTATCGAGGCGGACGACGACCGGCTCAACAAGGTAGCGGCCGCCCTTGCCCCGCAGCC
181	361	GGAACTCTCTCTCTGATGCTGATTTGCACTCTGCTGGAATTCTGCCTAGCTGTGCTCACTGCTGTGCTGCGGTGGAAACAGGCTTACTCTGACTTCCCTGGGGTGAGTGTGCTGGCCGGCTTCACTTAACCTTGCCTAGTGTATCTTATC	362	ATCCTGTCTGTCAAACAGGCCACCTTAAATCCTGCCTCACTGCAGTGTGAGTTGGACAAAAATAATATACCAACAAGAAGTTATGTTTCTTACTTTTATCATGATTCACTTTATACCACGGACTGCTATACAGCCAAAGCCAGTCTGGCT
182	363	TGATCCCCTGGGCTCCAGAGAACCTAACACTTCACAAACTGAGTGAATCCCAGCTAGAACTGAACTGGAACAACAGATTCTTGAACCACTGTTTGGAGCACTTGGTGCAGTACCGGACTGACTGGGACCACAGCTGGACTGTGAGTGACT	364	GCAGCCACTATCTATTCTCTGAAGAAATCACTTCTGGCTGTCAGTTGCAAAAAAAGGAGATCCACCTCTACCAAACATTTGTTGTTCAGCTCCAGGACCCACGGGAACCCAGGAGACAGGCCACACAGATGCTAAAACTGCAGAATCTGG
183	365	GCAGACCTGTTATCCTAAACTAGGTGAGTCAGCTTTTGGTACATGTGATGATTTTCAGTGTAACCAATGATGTAATGATTCTGCCAAATGAAATATAATGATATCACTGTAAAACCGTTCCATTTTGATTCTGAGGTTACTCTACTAACA	366	GGTAACATTCTAGTTTATGCCCCGAAAAGGGGAATATAGCCATTCTATAATGTTTGGAGATTTTGGATTACTCCTAATTGTATGCAAGTTGTCTTACTGTGTATTGTCCCTTAATTTCAGGACTCAGAATTCATGATTGAAGAAATGCAG
184	367	ATTGAAAATATTGAACTTCCCATGGATACAAAAACAAATGAAAGAAGAGGATTTTGTTTTATCACATATACTGATGAAGAGCCAGTAAAAAAATTGTTAGAAAGCAGATACCATCAAATTGGTTCTGGGAAGGTAAAGCCATTTAAGCAC	368	AAAGAACACAAACTGGATGGCAAATTGATAGATCCCAAAAGGGCCAAAGCTTTAAAAGGGAAAGAACCTCCCAAAAAGGTTTTTGTGGGTGGATTGAGCCCGGATACTTCTGAAGAACAAATTAAAGAATATTTTGGAGCCTTTGGAGAG
185	369	CTTCAACATCCAGATGTGTGTTGGAGCCACTGGGCACAACATTCCTCAGAAGCTATGTGAGTGGCATGAAGGGGGCAGGAGGGAGGTGGGCTTGGACTCCCCCGGAGGCTGGCCAGGGAGGTCCTGACTCTTCTGCTTGCCCTGCCAGCC	370	GAGGAGCCACAATGGCAAGCCTACCCCATCACCCTATCCCATCAGAGCTCAGCCAGTGGTGAAGGCCTCTGTCCAGCTACTGGTGCAAGATTCACTGAATCCTGCTGTGAAGAGCTGTGTCCTACCTCAGACCAAGACACCCGTGAGCTG
186	371	TATTTGTATCCCCTTTTCAGACTCCTGAGGAAGAAGAGATTTTAAACAAAAAACGATCTAAAAAAATTCAGAAGAAATATGATGAAAGGAAAAAGAATGCCAAAATCAGCAGTCTCCTGGAGGAGCAGTTCCAGCAGGGCAAGCTTCTTG	372	CGTGCATCGCTTCAAGGCCGGGACAGTGTGGCCGAGCAGATGGCTATGTGCTAGAGGGCAAAGAGTTGGAGTTCTATCTTAGGAAAATCAAGGCCCGCAAAGGCAAATAAATCCTTGTTTTGTCTTCACCCATGTAATAAAGGTGTTTAT
187	373	GAGCAGTTTTTGCAAGAAAGGATCAAAGTGAACGGAAAAGCTGGGAACCTTGGTGGAGGGGTGGTGACCATCGAAAGGAGCAAGAGCAAGATCACCGTGACATCCGAGGTGCCTTTCTCCAAAAGGTACAGGAGGGAAGTGTGTGTGTGG	374	ACTGACTGAAACTTCATCTCTGTTATCATTTGTGTATTTTCTTAGAAAAAGCTTGTGGTGAAGGGGGGCAAAAAAAAGAAGCAAGTTCTGAAGTTCACTCTTGATTGCACCCACCCTGTAGAAGATGGAATCATGGATGCTGCCAATTTT
188	375	AGCTCAGCCAGTGGTGAAGGCCTCTGTCCAGCTACTGGTGCAAGATTCACTGAATCCTGCTGTGAAGAGCTGTGTCCTACCTCAGACCAAGACACCCGTGAGCTGGTGAGGAGGCAGAGGGCATGGGCCTTAAAGGATCTGGGACCTCAG	376	GTGAAACCTCCAGTGGGGGAGGTGGTGTGGGGAACCCCTGGGAAGATGAGATGAGGATCCCATGCCCTAATCGCCAATTCTGACCCATTCCTCGATGTCTATAGACCTGATCGTGGGAGCTTACGGGGCCAACCAGGTGGCTGTGTACAG
189	377	GGCTGCTAAGGAAGCAAAAAAGGCTAAGCAAGCATCTAAAAAGACTGCAATGGCTGCTGCTAAGGTAATTATGGGGTTTCTTTACTTTCTTGAACAATACAACAGGAAAATTTTCTTTTTTTGAGACGGAGTCTTGCTCTGTTGCCCAGG	378	CTTTGTTTTGCAGGAAGAAATTCAAAAGAAAAGAACCCGCCGAGCAGTCAAATTCCAGAGGGCCATTACTGGTGCATCTCTTGCTGATATAATGGCCAAGAGGAATCAGAAACCTGAAGTTAGAAAGGCTCAACGAGAACAAGCTATCAG
190	379	GCCTGCGCCCCCTGGCAGCACTGGAACGTCCTAGAAAAGACTGAGGAGGCTGAGAAGACGCCCGTAGGTAGCTGCTTTTTGGCTCAGCCAGAGAGCGGCCGCCGCGCCGAGTACTCCCCCTGTCGCGGGAACACCCTGAGCCGCATTTAC	380	AGGGACGTGGACTGCCGGGCTTCAGCGCCCCACCCCTTCTTGTGCCTTCCAGGTGATGAGACCCGAAATGTAGGCTCCCAAACTTTACAAACCTTCAAGGCCCGCCAAGGACTGGGGGCGTCGGTCGTCAGCTGGAGCGACGTCATTGTG
191	381	TAGCACTTTTAAGAAAATTTTTCTTATCAGCTTTTATTTGTTTACCTCCTAGGTCCCAGGGATGAAACTGTTGATGATTTCTGGAGGATGATTTGGGAACAGAAAGCCACAGTTATTGTCATGGTCACTCGATGTGAAGAAGGAAACAGG	382	AACAAGTGTGCAGAATACTGGCCGTCAATGGAAGAGGGCACTCGGGCTTTTGGAGATGTTGTTGTAAAGATCAACCAGCACAAAAGATGTCCAGATTACATCATTCAGAAATTGAACATTGTAAATGTGAGTTTGCTTTTTACATAATTT
192	383	GCGTGTGACACTGAGGACACTGTGGGACACCTGGGACCCTGGAGGGACAAGGATCCGGCCCTTTGGTGCCAACTCTGCCTCTCTTCACAGCACCAGGCCATAGAAAGATTTTATGATAAAATGCAAAATGCAGAATCAGGACGTGGACAG	384	GTGATGTCGAGCCTGGCAGAGCTGGAGGTGAGCCGTGGCCTCCCCCTCCACCAAGCTTAGTCCCTGGGTCTTAGGCTCCACAGGACACTGGGTCTGGGCCCCGGGTCCCCTTGGGAATCACCTGGACCAGTGGGGGCCACAGTGGGAAGG
193	385	CTTCTTGCCAGCCCTGGTCATGCAGTGGCCATGGAGAATGTGTAGAAATCATCAATAATTACACCTGCAACTGTGATGTGGGGTACTATGGGCCCCAGTGTCAGTTTGGTAAGTCTCTTTCCTTTCTTTGCTTCTTCTTAGGTAAAGTCA	386	CTGAAGAAGCAGAGAACTGGGGAGATGGTGAGCCCAACAACAAGAAGAACAAGGAGGACTGCGTGGAGATCTATATCAAGAGAAACAAAGATGCAGGCAAATGGAACGATGACGCCTGCCACAAACTAAAGGCAGCCCTCTGTTACACAG
194	387	GTGGTGGGCTGCGGGGCGCCCGGGGCACAGCCGTGACCTGCCCACACCTGCAGGTGCTGAGGAGCCACGTGATGGTGCGAGTGGGTGGTGGCTGGGACACGCTGGAGCATTACCTGGACAAGCACGACCCGTGCCGCTGCTCCTCCACTG	388	CTCATCGCCCACCCCAGCCGAGGGTCTGCACCTTTTCTCCACAGAGGGTGTCGCCCACCACCAGTCCCCGCCCTGCTAGCCCAGTCCCTGGGAGTGAGCGCCGGGGCTCCCGGCCTGAGATGACTCCCGTTAGCTTACGAAGCACAAAGG
195	389	TGCTAAAGAGTTTTTCTTTCACCTTTTAATATAACGAATTAATTAGCTTTTATTCTTCTATTCATTTTCTTGCAGATGCCTACCTTAATGCCTCTGAAACAACCACTCTGAGCCCTTCTGGAAGCGCTGTCATTTCAACCACAACAATAG	390	CTACTACTCCATCTAAGCCAACATGTGGTAAGTTTATTTACTTAGAATCAGCATACCTCACTTTGGAATAGCACTTTAATTACATCTTTCTTTATTCCAAGCTTTCAGGACCCACTAGTAAGCTAAACTCACTGGCTCTAATTTCTCACC
196	391	CCAATGCTGAGTGTGCCTGTCGCAATGGCTGGCAGTGCAGGGACAAGGAGTGCACCGAGTGTGATCCTCTTCCAAACCCTTCGCTGACCGCTCGGTCGTCTCAGGCCCTGAGCCCACACCCTCAGCCCACCCACTTACCTTATGTCAGTG	392	AGATGCTGGAGGCCAGGACAGCTGGGCACATGCAGACTCTGGCTGACTTCAGGCAGCTGCCTGCCCGGACTCTCTCTACCCACTGGCCACGTGAGTTTTCTCCTTAATCCCCACCGCTAGAGAGAATGCATACACGAGGGGCCAGGAGGG
197	393	CAGCAAGAAGTCTATGTGCCCCAGGATCCTGGATTACCTGAGGAAGAAGAGATCAAGGAAAAAAAACCCACCAGTCAAGGAAAGTCAAGTAGCAAGAAGGAAATGTCTAAAAGAGATGGCAAGGAGAAAAAAGACAGAGGAGTGACGAGG	394	TTTCAGGAAAATGCCAGTGAAGGGAAGGCCCCTGCAGAAGACGTCTTTAAGAAGCCCCTGCCTCCTACTGTGAAGAAGGAAGAGAGTCCCCCTCCAGTAAGACCAACATTGATCCCCTGGACCTAGGGCTGGGGCTGGGGATGGTTCCGA
198	395	TTGCCTTGCTCTCCTTGGTAACCTAGTTCCTGTAACCTTGTGTTTTCCAGATTGGCCCCCGCCGCATCCACACAGTCCGTGTGCGGGGAGGTAACAAGAAATACCGTGCCCTGAGGTTGGACGTGGGGAATTTCTCCTGGGGCTCAGAGT	396	GTTGTACTCGTAAAACAAGGATCATCGATGTTGTCTACAATGCATCTAATAACGAGCTGGTTCGTACCAAGACCCTGGTGAAGAATTGCATCGTGCTCATCGACAGCACACCGTACCGACAGTGGTACGAGTCCCACTATGCGCTGCCCC
199	397	GACGTGGTGGGTCCTCTGGTGCGAAATTCCGGATTTCCTTGGGTCTTCCGGTAGGAGCTGTAATCAATTGTGCTGACAACACAGGTGAGGTCTTTGCACGTTGCTATACTCCCCCTTTTAAAAGCACTCAATGGGCCTGTGGCTAATGAC	398	ACGTAATAAGGCAGCGCCCAGAGGCGGAAGAGGCCGGTTTTTGCTCCGGCCACGTGAGGAGGGTGGGCGGGGCGTTAAAGTTCATATCCCAGTGTCCTTTGAATCGACTTCCTTTTTTCTTTTTTCCGGCGTTCAAGATGTCGAAGCGAG
200	399	GTCTGGAGGGTGAGCGACCTGCGAGACTCACAAGAGGGGAAGCTGACAGAGATACCTACAGACGGAGTGCTGTGCCACGTGAGTAAATGCATCACCTATATTAGGGGTGTTGGGGTGAAATGTCTGGATTCTCACAGCTGGCTCTGGCTG	400	TGAAGGAACAGTTTGCCTGGAGACATTTCTACTGGTACCTTACCAATGAGGGTATCCAGTATCTCCGTGATTACCTTCATCTGCCCCCGGAGATTGTGCCTGCCACCCTACGCCGTAGCCGTCCAGAGACTGGCAGGCCTCGGCCTAAAG
201	401	TCCCTTCGAAGTGAAGGTGGGCACCGAGTGTGGCAATCAGAAGGTACGGGCCTGGGGCCCTGGGCTGGAGGGCGGCGTCGTTGGCAAGTCAGCAGACTTTGTGGTGGAGGCTATCGGGGACGACGTGGGCACGCTGGGTAAGTTGGAGGC	402	GCCTGAGGCCCTCCTTGTCTTGGCAGAGGGAGAGGAGCGCGTGAAGCAGAAGGACCTGGGGGATGGCGTGTATGGCTTCGAGTATTACCCCATGGTCCCTGGAACCTATATCGTCACCATCACGTGGGGTGGTCAGAACATCGGGCGCAG
202	403	GACCACATGATACTGTTTTGAGATTTTATTTACTTTTACAATGGAAAGATTTGATGTTACTCTATTCTTAATTTAGGCACTCAGAATGGTCCAGCGTTTGACATACCGACGTAGGCTTTCCTACAATACAGCCTCTAACAAAACTAGGCT	404	GTCCCGAACCCCTGGTAATAGAATTGTTTACCTTTATACCAAGAAGGTTGGGAAAGCACCAAAATCTGCATGTGGTGTGTGCCCAGGCAGACTTCGAGGGGTAAGTGTACCTTTTACTGTGTGCAGCCTAACAAGTCTTGAACTTACTGA
203	405	GCTTGGTTTGCCAGTGCTGGTGTTGGGCGCACAGGAACCTATATCGGAATTGATGCCATGCTAGAAGGCCTGGAAGCCGAGAACAAAGTGGATGTTTATGGTTATGTTGTCAAGCTAAGGCGACAGAGATGCCTGATGGTTCAAGTAGAG	406	GCCCAGTACATCTTGATCCATCAGGCTTTGGTGGAATACAATCAGTTTGGAGAAACAGAAGTGAATTTGTCTGAATTACATCCATATCTACATAACATGAAGAAAAGGGATCCACCCAGTGAGCCGTCTCCACTAGAGGCTGAATTCCAG
204	407	GCACCTACAAAGGCAGCACCTAAGCAAAAGATTGTGAAGCCTGTGAAAGTTTCAGCTCCCCGAGTTGGTGGAAAACGCTAAACTGGCAGATTAGATTTTTAAATAAAGATTGGATTATAACTCTAGGTTGTGCTGGATTTTTTTTTTTTC	408	ACTTGTCCAGTACAGTCTAACTCTAATAATAAGTTGTACCACTAAGGAGTAAAGTGCTTTTGCCTTAAGTTACTTTTACCCCACAGGGCTGCTAAGGAAGCAAAAAAGGCTAAGCAAGCATCTAAAAAGACTGCAATGGCTGCTGCTAAG
205	409	AGATGGATGTGATGTCGGTGGCCACAATTGTCATAGTGGACATCTGCATCACTGGGGGCTTGCTGCTGCTGGTTTACTACTGGAGCAAGAATAGAAAGGCCAAGGCCAAGCCTGTGACACGAGGAGCGGGTGCTGGCGGCAGGCAAAGGG	410	GACAAAACAAGGAGAGGCCACCACCTGTTCCCAACCCAGACTATGAGGTAACGTGGGATAGAAATGGGCCAGGACGCTGGAGGGGATGTCCCTCCAGGGGGGAAGGAAACAGATGGGATGGCCCATCTTGTCTGCCAGATGCCTCAAAGC
206	411	TTAGCCATTTCTATGGATTTGGTTTGGTGGACGCAGAAGCTCTCGTTGTGGAGGCAAAGAAGTGGACAGCAGTGCCATCGCAGCACATGTGTGTGGCCGCCTCGGACAAGAGACCCAGGTAAGGCTCTGCTGTGGCATCGGTGACTTCTC	412	CCGTTGTTGAGCTGTGTGGACTCTAGGGTGTGTTGTGTCATTGCAGCAGCCAGTTAACCTGGAGGGACGTCCAGCACCTGCTAGTGAAGACATCCCGGCCGGCCCACCTGAAAGCGAGCGACTGGAAAGTGAACGGCGCGGGTCATAAAG
207	413	CTGCGGCCGCTGGCAGCGCTGGCCCTGGTCCTGGCGCTGGCCCCGGGGCTGCCCACAGCCCGGGCCGGGCAGACACCGCGCCCTGCCGAGCGGGGGCCCCCAGTGCGGCTTTTCACCGAGGAGGAGCTGGCCCGCTATGGCGGGGAGGAG	414	GAAGATCAGCCCATCTACTTGGCAGTGAAGGGAGTGGTGTTTGATGTCACCTCCGGAAAGGGTAAGTGGTGTGGCATTTTGAATCTTCATTTCCAGGGAGCACAGAAGCCAGAGTGAGCAGCACTTGGAGGTGTGAGGAAAGGGAGGGAA
208	415	CGGCTTTGATTCAGCAAGCCACAACAGTTAAAAACAAGGATATCAGGAAATTTTTGGATGGTATCTATGTCTCTGAAAAAGGAACTGTTCAGCAGGCTGATGAATAAGATCTAAGAGGTAAGTTCTTACAGTGTCTTAAGTTTTATTACT	416	TAGTGCCTCTGCAATTTAAATATTTTTTACACAGATTTGATGCTGTGCAAATGCCCTCTCCCCTTTTAGGTGTTGCTTGTTCAGTATCTCAAGCCCAGAAAGATGAATTAATCCTTGAAGGAAATGACATTGAGCTTGTTTCAAATTCAG
209	417	CCTCCTCCTTACAGGGAGCAGATAGCAGGGACTTACAGATGAACCAGGCCCTGCGATTTTTGGAAAATGAGCACCAGCAACTGCAGGCCAAGATTGAATGCCTGCAAGGGGACAGAGACCTGTGCAGCTTGGATACCCAGGACCTACAAG	418	ATCAACTAAAAAGGTCAGAGGCAGAGAAACTCACCCTGGTGACCAGAGTACAGCAGTTGCAGGGTAAGTTCGCTTTCCAGATTCTGAAAGTCCACAGGGTTTTCCTGGGGTCCTGGCCCACAAAAGGCACCCAGAGTAGGGACTAAGGGC
210	419	GTATGCCTGTGTCAAGATGAGGTCACGGACGATTACATCGGAGACAACACCACAGTGGACTACACTTTGTTCGAGTCTTTGTGCTCCAAGAAGGACGTGCGGAACTTTAAAGCCTGGTTCCTCCCTATCATGTACTCCATCATTTGTTTC	420	GGGAGGAAAGTTCCCAACAGCGTCTCCCCCTCCACTGCTTTCTTTAATAACAAAGACTTGTCCCTGCCAAGCAATAACTTTCTCGCCTTGTCTCCTACAGGGAAACCAATGAAAAGCGTGCTGGTGGTGGCTCTCCTTGTCATTTTCCAG
211	421	GTGATGAGACCCGAAATGTAGGCTCCCAAACTTTACAAACCTTCAAGGCCCGCCAAGGACTGGGGGCGTCGGTCGTCAGCTGGAGCGACGTCATTGTGGTGGGCCCCGCGGTACAGGGCACAGGGAACAATCGGGGGCAGGGACACCTGG	422	GCGGCGCTCACCCAGCTTTCCTATGCAGAGTGGCCATCGTGGTGGGCGCCCCGCGGACCCTGGGCCCCAGCCAGGAGGAGACGGGCGGCGTGTTCCTGTGCCCCTGGAGGGCCGAGGGCGGCCAGTGCCCCTCGCTGCTCTTTGACCTCC
212	423	GTGAAGGCACGTGGGCCTGGATTGGAGAAGACAGGTGTGGCCGTCAACAAGCCAGCAGAGTTCACAGTGGATGCCAAGCACGGTGGCAAGGCCCCACTTCGGGTCCAAGTCCAGGTAGAGCACCCACGGGTGTTGGGGGCAGGGCAGGTG	424	GACAAGGGCGACGGCTCCTGTGATGTGCGCTACTGGCCGCAGGAGGCTGGCGAGTATGCCGTTCACGTGCTGTGCAACAGCGAAGACATCCGCCTCAGCCCCTTCATGGCTGACATCCGTGACGCGCCCCAGGACTTCCACCCAGACAGG
213	425	ATTTTATTATAGGTTTTGTATTATAGCTTTTAGTTTGGTGATAGAACAGCTCTTGTTCATGAGTACGTATCTTTTCTTTTAAAAGAAAAAAGTAAAACTTGCTGCTGATGAAGATGATGACGATGATGATGAAGAGGATGATGATGAAGA	426	TGATGATGATGATGATTTTGATGATGAGGAAGCTGAAGAAAAAGCGCCAGTGAAGAAAGTGAGTAGATACAATGCTACAAGGTTGTTAAACTAACAATAGAAATGGTGATTTTTTAGTGCTATTTGCTTGTTTTGTAGTTAAGGGAAGCT
214	427	CCTAGATATTATCCTACTGAAGATGTGCCTCGAAAGCTGTTGAGCCACGGCAAAAAACCCTTCAGTCAGCACGTGAGAAAACTGCGAGCCAGCATTACCCCCGGGACCATTCTGATCATCCTCACTGGACGCCACAGGGGCAAGGTGAGA	428	CTTAACCTTAATTGGCATTCTCTTACTGTTGATGCATTTGTGTCCTTGTAGGTTGAAAAGAAAAAGAAGGAGAAGGTTCTCGCAACTGTTACAAAACCAGTTGGTGGTGACAAGAACGGCGGTACCCGGGTGGTTAAACTTCGCAAAATG
215	429	TAAAATGTTTATTGGAGGCTTGAGCTGGGATACAAGCAAAAAAGATCTGACAGAGTACTTGTCTCGATTTGGGGAAGTTGTAGACTGCACAATTAAAACAGATCCAGTCACTGGGAGATCAAGAGGATTTGGATTTGTGCTTTTCAAAGA	430	CGCCGCCGCTGCTGCCGCGACCCGGACTGCGCGCCAGCACCCCCCTGCCGACAGCTCCGTCACTATGGAGGATATGAACGAGTACAGCAATATAGAGGAATTCGCAGAGGGATCCAAGATCAACGCGAGCAAGAATCAGCAGGATGACGG
216	431	GTTGCTGGATCTTTCCAATGAAGGGTTTACAAACTGGGAATTCATGACTGTCCACTGCTGGGGAGAAAAGGCTGAAGGGCAGTGGACCTTGGAAATCCAAGATCTGCCATCCCAGGTCCGCAACCCGGAGAAGCAAGGTCAGTGGCTCTT	432	GACCAGCGCCTGCGCGGAGCACTCGGACCAGCGGGTGGTCTACTTGGAGCACGTGGTGGTTCGCACCTCCATCTCACACCCACGCCGAGGAGACCTCCAGATCTACCTGGTTTCTCCCTCGGGAACCAAGTCTCAACTTCTGGCAAAGAG
217	433	GGGGACTCTGGAGGCCCTCTTGTGTGTAACAAGGTGGCCCAGGGCATTGTCTCCTATGGACGAAACAATGGCATGCCTCCACGAGCCTGCACCAAAGTCTCAAGCTTTGTACACTGGATAAAGAAAACCATGAAACGCTACTAACTACAG	434	GCCCCCCTGGGAAAACACTCACACACACTACAAGAGGTGAAGATGACAGTGCAGGAAGATCGAAAGTGCGAATCTGACTTACGCCATTATTACGACAGTACCATTGAGTTGTGCGTGGGGGACCCAGAGATTAAAAAGACTTCCTTTAAG
218	435	AGATTATAATTCTCTGCTGAGATTTGAGTTGGATTTGAGGATTTGGAGAATCCCTGCAGCTTTGTAACTTCAGAGGTGTAATTAGCTGAAAACATCATCGTTTTGAAGAGTTCTGCGTTTTGCCAGTCACCTCTCAACTGTGTGCCAAAG	436	AAGGACTCCATGAAAGATGACAGAAGAAGTTATTGTGATAGCCAAGTGGGACTACACCGCCCAGCAGGACCAGGAGCTGGACATCAAGAAGAACGAGCGGCTGTGGTTGCTGGACGACTCCAAGACGTGGTGGCGGGTGAGGAACGCGGC
219	437	AGAAAACAACTGAGGCCAAGATGATGAAAGCTGGGGGCACTGAAATAGGAAAGACACTTGCAGAAAAGAGCCGAGGCCTATTTAGTGCTAATGACTGGCAATGTAAAACGTATGTTTTTTAAATTATTGTCTGCTCTTTCTTCCAAAATA	438	TTAGAAGTTATGAATTCCAGATATGTAGTGAGGACAAGTTAAAATGTAAAATTTTACAAATTTAAATTTTTATAAATGCTTTTTAATCTGTTTTTAGATGTGGAAATGTAAACTTTGCTAGAAGAACCAGCTGTAATCGATGTGGTCGGG
220	439	CTTCTACAGAGATAACAATTATTTTGCTTTTCAGAAGGACGCATGCTGTTTCTTAGGGACACGGCTGACTTCCAGATATGACCATGTATTTGTGGCTTAAACTCTTGGCATTTGGCTTTGCCTTTCTGGACACAGAAGTATTTGTGACAG	440	GGCAAAGCCCAACACCTTCCCCCACTGGTAAGAATTAATATTTATATTTTTACTAATTTTATTTTCTTGTTGCAAAGTTTATATATTTAACTACAATTTTCTATTATTAACACTGAAATTATTTTTAAGGATAAATTTTATAATCATGAG
221	441	AATTTCGCTAAGGAGTTTGTGATCAGTGATCGGAAGGAGCTGGAGGAAGATTTCATCAAGAGCGAGCTGAAGAAGGCGGGGGGAGCCAATTACGACGCCCAGACGGAGTAACCCCAGCCCCCGCCACACCACCCCTTGCCAAAGTCATCT	442	CGGTTGTTTGCCTTCGTGCGCTTCACCACCGGGGATGCCATGAGCAAGAGGTCCAAGTTTGCCCTCATCACGTGGATCGGTGAGAACGTCAGCGGGCTGCAGCGCGCCAAAACCGGGACGGACAAGACCCTGGTGAAGGAGGTCGTACAG
222	443	GTGAAGGCGTTTGGGCCGGGGCTGCAGGGAGGCAGTGCGGGCTCCCCCGCCCGCTTCACCATCGACACCAAGGGCGCCGGCACAGGTGGCCTGGGCCTGACGGTGGAGGGCCCCTGTGAGGCGCAGCTCGAGTGCTTGGACAATGGGGAT	444	GTGGAGCCAGGCCTGGGGGCTGACAACAGTGTGGTGCGCTTCCTGCCCCGTGAGGAAGGGCCCTATGAGGTGGAGGTGACCTATGACGGCGTGCCCGTGCCTGGCAGCCCCTTTCCTCTGGAAGCTGTGGCCCCCACCAAGCCTAGCAAG
223	445	ATGGTCATCTTTAAGGTACCTGATTGCATGCACTTAAATGCAGATTATTTTGGAGTTTGAAAAGGGACTATTAATGAAATCTTTCTTTTCCCTCCTTTCTCTTTTTCCCTTCCCCGCCACTGATTCAGTGAGCTGGAGATTGGATCACAG	446	CCGAAGGAGTAAAGGTGCTGCAATGATGTTAGCTGTGGCCACTGTGGATTTTTCGCAAGAACATTAATAAACTAAAAACTTCATGTGTCTGGTTGTTTGAAATGTATTTGCAGTTTCCTGGGACTGCTAGGAGGTTAGTCTGCTGATTTC
224	447	GACTATCCATCCCTTGCCTTGCTTGGAGAGAAATTGGCAGAGAACAACATCAACCTCATCTTTGCAGTGACAAAAAACCATTATATGCTGTACAAGGTATGCTGGGAGGGAGGGAGGCTAGTGATTTGTGGGGTGAAGTGGGTGGTGAGG	448	TGGCGAAAGGATGCACTGCATTTGCTGGTGTTCACAACAGATGATGTGCCCCACATCGCATTGGATGGAAAATTGGGAGGCCTGGTGCAGCCACACGATGGCCAGTGCCACCTGAACGAGGCCAACGAGTACACTGCATCCAACCAGATG
225	449	ATGTGGATGAGGCTTCCAAGAAGGAGATCAAAGACATCCTCATCCAGTATGACCGGACCCTGCTGGTAGCTGACCCTCGTCGCTGCGAGTCCAAAAAGTTTGGAGGCCCTGGTGCCCGCGCTCGCTACCAGAAATCCTACCGATAAGCCC	450	ATTTATGGTGAGTCCCAGGAACTGGGCGCATGGAGGAGGTGGCTCTGGGAGGGAGGCCTTCACAGCGCTCCTGTACCCTTTAATTGTGTGTCTTTCTCACAGCTATCCGTCAGTCCATCTCCAAAGCCCTGGTGGCCTATTACCAGAAAT
226	451	AGCCTCCCAGGCTGGGCAGCTGCTCTGGTCTCACCTCTCTGCTTTCTGTAGGTATTGGCAAGCTTGCCAGTGTACCTGCTGGTGGGGCTGTAGCCGTCTCTGCTGCCCCAGGCTCTGCAGCCCCTGCTGCTGGTTCTGCCCCTGCTGCAG	452	CAGAGGAGAAGAAAGATGAGAAGAAGGAGGAGTCTGAAGAGTCAGATGATGACATGGGATTTGGCCTTTTTGATTAAATTCCTGCTCCCCTGCAAATAAAGCCTTTTTACACATCTCTCAAGTATTCCATGAGCACTTTGTCAAGGGTGG
227	453	GATGTTGTCTACAATGCATCTAATAACGAGCTGGTTCGTACCAAGACCCTGGTGAAGAATTGCATCGTGCTCATCGACAGCACACCGTACCGACAGTGGTACGAGTCCCACTATGCGCTGCCCCTGGGCCGCAAGAAGGGAGCCAAGCTG	454	ACTCCTGAGGAAGAAGAGATTTTAAACAAAAAACGATCTAAAAAAATTCAGAAGAAATATGATGAAAGGAAAAAGAATGCCAAAATCAGCAGTCTCCTGGAGGAGCAGTTCCAGCAGGGCAAGCTTCTTGGTGAGAAGGCTGTTGTGTTG
228	455	GTTACTGTGCTCTTTGCTGGCCAGCACATCGCCAAGAGCCCCTTCGAGGTGTACGTGGATAAGTCACAGGGTGACGCCAGCAAAGTGACAGCCCAAGGTCCCGGCCTGGAGCCCAGTGGCAACATCGCCAACAAGACCACCTACTTTGAG	456	CAGAGGCCCCGCAGCGCTCCCTTTCAGTGGGGCTGCTCTTAGCAAAGGCTCACAGGCTCCTTCCCACTGCAGGCAAAAGTGACCGCCAATAACGACAAGAACCGCACCTTCTCCGTCTGGTACGTCCCCGAGGTGACGGGGACTCATAAG
229	457	ACTTAATAATTTTTTAAAATGTAGAACAAGTGTGCAGAATACTGGCCGTCAATGGAAGAGGGCACTCGGGCTTTTGGAGATGTTGTTGTAAAGATCAACCAGCACAAAAGATGTCCAGATTACATCATTCAGAAATTGAACATTGTAAAT	458	AAAAAAGAAAAAGCAACTGGAAGAGAGGTGACTCACATTCAGTTCACCAGCTGGCCAGACCACGGGGTGCCTGAGGATCCTCACTTGCTCCTCAAACTGAGAAGGAGAGTGAATGCCTTCAGCAATTTCTTCAGTGGTCCCATTGTGGTG
230	459	GCTATCAAAGGAGGCTGACTTTGTACTATCTGATATGCATGTGTTTGTGGCCTGTGAGTCTGTGATGTAAGGCTCAATGTCCTTACAAAGCAGCATTCTCTCATCCATTTTTCTTCCCCTGTTTTCTTTCAGACTGTGGCTTCACCTCCG	460	AGTCTTACCAGCAAGGGGTCCTGTCTGCCACCATCCTCTATGAGATCTTGCTAGGGAAGGCCACCTTGTATGCCGTGCTGGTCAGTGCCCTCGTGCTGATGGCCATGGTAAGGAGGAGGGTGGGATAGGGCAGATGATGGGGGCAGGGGA
231	461	GCCTGGTGGAGCCAGTGGACGTGGTAGACAACGCTGATGGCACCCAGACCGTCAATTATGTGCCCAGCCGAGAAGGGCCCTACAGCATCTCAGTACTGTATGGAGATGAAGAGGTACCCCGGAGGTAAGAGGCAGGGCCTGCTGCCTGTG	462	TGCATGATGTGACAGATGCGTCCAAGGTCAAGTGCTCTGGGCCCGGCCTGAGCCCAGGCATGGTTCGTGCCAACCTCCCTCAGTCCTTCCAGGTGGACACAAGCAAGGCTGGTGTGGCCCCATTGCAGGTCAAAGTGCAAGGGCCCAAAG
232	463	CCCTCTCCCAGAGACTACAGAGAACGTGGTGTGTGCCCTGGGCCTGACTGTGGGTCTGGTGGGCATCATTATTGGGACCATCTTCATCATCAAGGGATTGCGCAAAAGCAATGCAGCAGAACGCAGGGGGCCTCTGTAAGGCACATGGAG	464	GTGATGGTGTTTCTTAGAGAGAAGATCACTGAAGAAACTTCTGCTTTAATGGCTTTACAAAGCTGGCAATATTACAATCCTTGACCTCAGTGAAAGCAGTCATCTTCAGCATTTTCCAGCCCTATAGCCACCCCAAGTGTGGATATGCCT
233	465	AATGTTTTACATTGTGATATATAATATATATATATATATAAATTCACATTAGCAAACTAATTATTTTATTTTTTGTTACTGAAATTCAGGCCTATTTTCACAATGGAGACTATCCTGGAGAACCCTTTATTTTACATCATTCAACATCTT	466	ATAATTCTAAGGCACTGATAGCATTTCTGGCATTTCTGATTATTGTGACATCAATAGCCCTGCTTGTTGTTCTCTACAAAATCTATGATCTACATAAGAAAAGATCCTGGTAAGAGTTGATTTTAAATTTTTAAATAATAATGGTATTAG
234	467	GACAATGAAGGCTGCCCTGTGGAGGCGTTGGTCAAGGACAACGGCAATGGCACTTACAGCTGCTCCTACGTGCCCAGGAAGCCGGTGAAGCACACAGCCATGGTGTCCTGGGGAGGCGTCAGCATCCCCAACAGCCCCTTCAGGGTGAGC	468	ACCTGGCCCCCTGACAGCTGGGTGGTCTCCCGCTAGGTGAAGGCACGTGGGCCTGGATTGGAGAAGACAGGTGTGGCCGTCAACAAGCCAGCAGAGTTCACAGTGGATGCCAAGCACGGTGGCAAGGCCCCACTTCGGGTCCAAGTCCAG
235	469	AAGTGTAGGCCTCCCAGGGACCGTAATGGCCCCCATGAACGTTACCATTTGGAAGTTGAAGCTGGAAATACTCTGGTTAGAAATGAGTCGCATAAGAATTGCGATTTCCGTGTAAAAGATCTTCAATATTCAACAGACTACACTTTTAAG	470	GCCTATTTTCACAATGGAGACTATCCTGGAGAACCCTTTATTTTACATCATTCAACATCTTGTAAGTTATCACTGGGCTATTTATTATATATATTAAGATATATATTAATGCTTATAAAGCTATATTATTTTACACTTATAATCACATTT
236	471	TGCATGTAAACCCACGCTTACGTCTCTTCCTTCCTTCCCACTACAGAGTTTTATGGACGAGGAGCCCCCTACAATGCCTTGACGGGGAAGGACTCCACTAGAGGGGTAGCCAAGATGTCCTTGGATCCTGCAGACCTCACCCATGACACT	472	ACGGGTCTCACGGCCAAGGAACTGGAGGCCCTGGATGAGGTCTTCACCAAAGTGTACAAAGCCAAATACCCCATCGTCGGCTACACTGCCCGGAGAATTCTCAATGAGGATGGCAGCCCTAACCTGGACTTCAAGCCTGAAGACCAGCCC
237	473	GCTGGAGGACCGCAGTCTGTCCTTCTAGCCTGACCCCTGCTGTCTTCCTAGGCCATCTGGCTGCTGTGCACAGGCGCTCGTGAGGCTGCCTTCCGGAACATTAAGACCATTGCTGAGTGCCTGGCAGATGAGCTCATCAATGCTGCCAAG	474	GGCTCCTCGAACTCCTATGCCATTAAGAAGAAGGACGAGCTGGAGCGTGTGGCCAAGTCCAACCGCTGATTTTCCCAGCTGCTGCCCAATAAACCTGTCTGCCCTTTGGGGCAGTCCCAGCCACCTGTGCTGTTGTCTGTCTTCGGTGGG
238	475	GAGGAGATGTTAAAGTAACCCATCTTGCAGGACGACATTGAAGATTGGTCTTCTGTTGATCTAAGATGATTATTTTGTAAAAGACTTTCTAGTGTACAAGACACCATTGTGTCCAACTGTATATAGCTGCCAATTAGTTTTCTTTGTTTT	476	TGTAAAGAAAGTTTTGTAGAAAACTATCTTAATGAGAATTCTGTGTTTTCAAAATAGGCCAACAGAGCACTTATGGCAAGGCATCTCGAGGGGGTGGCAATCACCAAAACAATTACCAGCCATACTAAAGGAGAACATTGGAGAAAACAG
239	477	ACACGGCACTCGTTGTGCGGGAGAAGTTGCTGCTTCAGCAAACAATTCCTACTGCATCGTGGGCATAGCGTACAATGCCAAAATAGGAGGTAAGGCCGGGCGTGGCAGCCTGCGAGCCGAGGGGCCTGGGGCAGGGGCAGCTGGGAGCTC	478	GGAACATAAAATCCATTTCAAACAGAGCTGTCACATGCCATTTCTCCTCACTCACCACGATTCCATTTCTTAGGATTCCTACGCCAGCTACGACGTGAACGGCAATGATTATGACCCATCTCCACGATATGATGCCAGCAATGAAAATAA
240	479	GACCTCTGGTCCTCAATCGAGTTCCTCTACGAAGAACACACCAGAAATTTGTCATTGCCACTTCAACCAAAATCGATATCAGCAATGTAAAAATCCCAAAACATCTTACTGATGCTTACTTCAAGAAGAAGAAGCTGCGGAAGCCCAGAC	480	GTAGAAATTTCCTTTACCCAAATTTAGATGCCTGTGATTTTATGAATTCAGAAGTCAGTTTTTAATTGCAGAAAACTAATTATTTTCTTTTTAACTTACAGAGGGTGGTTTTCCTGAAGCAGCTGGCTAGTGGCTTATTACTTGTGACTG
241	481	GACACTCTGGACTTCAGCCAACAGGTAATACCTTTTAATCCTCTTTTAGAAACAGACACAGTTTCCCTAGTGAGAGGTGAAGCCAGCTGGACTTCTGGGTGGGGTGGGGACTTGGAGAACTTTTCTTACAAGAGGTTTTTTTTTGTTTTT	482	TTTGGAATAAACATCACTAAACCTGGCTTCCTCTCTCAGGAGCACGGTCTGAATCTGCACAGAGCAAGATGCTGAGTGGAGTCGGGGGCTTTGTGCTGGGCCTGCTCTTCCTTGGGGCCGGGCTGTTCATCTACTTCAGGAATCAGAAAG
242	483	GCCTGGAGTGGTGTGTCTAAGGGACTGGCTGAGAGTCTGCAGCCAGACTACAGTGAACGACTCTGCCTCGTCAGTGAGATTCCCCCAAAAGGAGGGGCCCTTGGGGAGGGGCCTGGGGCCTCCCCATGCAACCAGCATAGCCCCTACTGG	484	TTTCATATGGGACAACTGGGAGAAGGGTGATAAAAAAGCTTTAACCTATGTGCTCCTGCTCCCTCTTTCTCCCCTGTCAGGACGATGCCCCGAATTCCCACCCTGAAGAACCTAGAGGATCTTGTTACTGAATACCACGGGAACTTTTCG
243	485	GCTGGGACAAGCGTTACTGTGAAGCGGGCTTCAGCTCCGTGGTCACTCAGGCGAGTAGGGAGCAAAAGCGCAGTGGGGGCGGCTCCCAAACAGGGCCCCCTCTCACCCTCAGGACTTCCCTTCCAGGCCGGAGAGCTGGTGCTTGGGGCT	486	AGCACTGGAACGTCCTAGAAAAGACTGAGGAGGCTGAGAAGACGCCCGTAGGTAGCTGCTTTTTGGCTCAGCCAGAGAGCGGCCGCCGCGCCGAGTACTCCCCCTGTCGCGGGAACACCCTGAGCCGCATTTACGTGGAAAATGATTTTA
244	487	TCTCACAGAAAGTTCTCCGCTCCCAGACATGGGTCCCTCGGCTTCCTGCCTCGGAAGCGCAGCAGCAGGCATCGTGGGAAGGTGAAGAGCTTCCCTAAGGATGACCCGTCCAAGCCGGTCCACCTCACAGCCTTCCTGGGATACAAGGCT	488	GCGTGGAAATGGCGCTCGGTACGTGCCCCCGACCTGTCGTCTGCCGCGGGGGCGCGCTCGCACGCCGGAAGGGGCGGGGCCAGATTTGGCTTTATATAGCGGACCCGTAAGGCCGACCGGCCTCTACCGGCGGGATTTGATGGCGTGATG
245	489	AAGAAAAGCAGCAAACAGAAAGGGTTACAAAAGAGATGAATGAATTTATCCATAAAGAGCAAAATAGTTTATCACTACTAGAAGCAAGAGAAGCAGACGGTGATGTGGTTAATGAAAAGAAGAGAACTCCAAATGAAACCACATCAGTTT	490	CAGGAGACAGTGAAGATGAGAGGAGTGACAGAGGATCTGAGTCATCTGACACTGATGATGAAGAATTACGGCATCGAATCCGGCAAAAACAGGAAGCTTTTTGGAGAAAAGAAAAAGAACAGCAGCTATTACATGATAAACAGATGGAAG
246	491	ATTTCCCATGAGCACCCACAGGCGTGCACGCAGCGCAGCCCTCCGTCGTCGCTCGCGCCCTTTATACTCACTTCCGCCCGCGAGCCACTTCCTTTCCTTTCAGCGGAGCGCGGCGGCAAGATGGCAGTGCAAATATCCAAGAAGAGGAAG	492	TTTGTCGCTGATGGCATCTTCAAAGCTGAACTGAATGAGTTTCTTACTCGGGAGCTGGCTGAAGATGGCTACTCTGGAGTTGAGGTGCGAGTTACACCAACCAGGACAGAAATCATTATCTTAGCCACCAGGTAAAACTCATTTGACTGG
247	493	TAAATGTTAATGAGAATGTGGAATGTGGAAACAATACTTGCACAAACAATGAGGTGCATAACCTTACAGAATGTAAAAATGCGTCTGTTTCCATATCTCATAATTCATGTACTGCTCCTGATAAGACATTAATATTAGATGTGCCACCAG	494	GGGTTGAAAAGTTTCAGTTACATGATTGTACACAAGTTGAAAAAGCAGATACTACTATTTGTTTAAAATGGAAAAATATTGAAACCTTTACTTGTGATACACAGAATATTACCTACAGATTTCAGTGTGGTAAGAATATAACATTGACCA
248	495	ATCAAGACACAGCCATCCGGGTCTTCGCCATCCCCCCATCCTTTGCCAGCATCTTCCTCACCAAGTCCACCAAGTTGACCTGCCTGGTCACAGACCTGACCACCTATGACAGCGTGACCATCTCCTGGACCCGCCAGAATGGCGAAGCTG	496	AGGCCAAAGAGTCTGGGCCCACGACCTACAAGGTGACCAGCACACTGACCATCAAAGAGAGCGACTGGCTCGGCCAGAGCATGTTCACCTGCCGCGTGGATCACAGGGGCCTGACCTTCCAGCAGAATGCGTCCTCCATGTGTGTCCCCG
249	497	GCTACATCCACGTGACGCAGACCTTCAGCATTATGGCTGTTCTGTGGGCCCTGGTGTCCGTGAGCTTCCTGGTCCTGTCCTGCTTCCCCTCACTGTTCCCCCCAGGCCACGGCCCGCTTGTCTCAACCACCGCAGCCTTTGCTGCAGGTA	498	TCTGCCGGTCCCTGGCCCTGCTGGGGGGCTCCCTGGGCCTGATGTTCTGCCTGATTGCTTTGAGCACCGATTTCTGGTTTGAGGCTGTGGGTCCCACCCACTCAGCTCACTCGGGCCTCTGGCCAACAGGGCATGGGGACATCATATCAG
250	499	AGCTGAATGGTGAAACAAATACACCCATTGAAGGAAACCAGGCGGGTGATGCAGCTGCCTCTGCCAGGAGTCTACCAAATGAAGAAATAGTGCAGAAGATAGAGGAAGTACTTTCTGGGGTCTTAGATACAGAACTACGATATAAGCCAG	500	ACTTGAAAGAGGGCTCCAGAAAAAGTAGATGCGTATCTGTACAAACAGATCCTACTGATGAAATTCCCACTAAAAAGTCAAAGAAGCATAAAAAGCACAAAAACAAAAAGAAGAAAAAGAAGAAAGAAAAGGAAAAAAAATATAAAAGAC
251	501	ATATCCCAGAAGAAACTGAAGAAACAAAAACTTATGGCACGGGAGTAAATTCAGCATTAAAATAAATGTAATTAAAAGGAAAAGAATGTTGGTTGTCTTTATTAGTGAACATATTTCAAGTGTCCTTACAAGATGGATCAAATGAGGATT	502	AACAAAGCACCTAAGATGCGCCGCCGGACCTACAGAGCTCATGGTCGGATTAACCCATACATGAGCTCTCCCTGCCACATTGAGATGATCCTTACGGAAAAGGAACAGATTGTTCCTAAACCAGAAGAGGAGGTTGCCCAGAAGAAAAAG
252	503	TCTCCTTCCGCCTGCGGAGGGGAAGCTGAAGTCTGGTCTTCCTCAGGTCTGGTCTTCTCTCGTCTGAGCCCTGAGTACTACGACCTGGCAAGAGCCCACCTGCGTGATGAGGAGAAATCCTGCCCGTGCCTGGCCCAGGAGGGCCCCCAG	504	GGTGACCTGTTGACCAAAACACAGGAGCTGGGCCGTGACTACAGGACCTGTCTGACGATAGTCCAAAAACTGAAGAAGATGGTGGATAAGCCCACCCAGGTGAGGCCAAGGGGCTACAGAGCCTCCTGTCTGCTGCTCAATGGAGGGGCC
253	505	AAATTAGCATCCAGGATATGACAGCCCAGGTGACCAGCCCATCGGGCAAGACCCATGAGGCCGAGATCGTGGAAGGGGAGAACCACACCTACTGCATCCGCTTTGTTCCCGCTGAGATGGGCACACACACAGTCAGCGTGAAGTACAAGG	506	GGCGTGGGCCGTGCTTTCTTCCTGCAGGCAGCCCCTTCTCTGTGAAGGTGACAGGCGAGGGCCGGGTGAAAGAGAGCATCACCCGCAGGCGTCGGGCTCCTTCAGTGGCCAACGTTGGTAGTCATTGTGACCTCAGCCTGAAAATCCCTG
254	507	CAGCTGGCCGACGTTGCGGAGAAATGGTGCTCCAACACGCCCTTCGAGCTCATCGCCACCGAGGAGACCGAACGCAGGATGGATTTCTACGCCGACCCCGGCGTCTCCTTCTATGTGCTGTGTCCGGACAACGGCTGCGGCGACAATTTT	508	TTACTGGGGCTTCCGGATGCAGATGACGATGCGTTTGAAGAGTACAGTGCTGACGTGGAAGAAGAGGAGCCAGAGGCGGACCACCCCCAGATGGGGGTCAGCCAGCAGTAAATCTGGGGGCTCCCCTGAGAAGGAGAGTGAGCCCCACAG
255	509	AGGGAGAGGAGCGCGTGAAGCAGAAGGACCTGGGGGATGGCGTGTATGGCTTCGAGTATTACCCCATGGTCCCTGGAACCTATATCGTCACCATCACGTGGGGTGGTCAGAACATCGGGCGCAGGTGAGGCCCCCAGGCATCCCTCTCCC	510	CTCTGCCTGCAGCCTGTAACCCGAGTGCCTGCCGGGCGGTTGGCCGGGGCCTCCAGCCCAAGGGTGTGCGGGTGAAGGAGACAGCTGACTTCAAGGTGTACACAAAGGGCGCTGGCAGTGGGGAGCTGAAGGTCACCGTGAAGGGCCCCA
256	511	AGGCTGCTGCTGAGAAGGCAGTGACCAAGGAGGAATTTCAGGGTGAATGGACTGCTCCCGCTCCTGAGTTCACTGCTACTCAGCCTGAGGTTGCAGACTGGTCTGAAGGTGTACAGGTGCCCTCTGTGCCTATTCAGCAATTCCCTACTG	512	AAGACTGGAGCGCTCAGCCTGCCACGGAAGACTGGTCTGCAGCTCCCACTGCTCAGGCCACTGAATGGGTAGGAGCAACCACTGACTGGTCTTAAGCTGTTCTTGCATAGGCTCTTAAGCAGCATGGAAAAATGGTTGATGGAAAATAAA
257	513	CAGCATCTATTACTAATTTCCATCCTAAGTACTGAGTTCATTAAGTCTTGGGTTCCTTTATTTTGGCTTGCATTATTGCATTTTCAGATCAACTAAAAAGGTCAGAGGCAGAGAAACTCACCCTGGTGACCAGAGTACAGCAGTTGCAGG	514	GTTTGCTTCAAAATCAATCCTTACAGCTTCAAGAACAGGAGAAACTCTTAACAAAGAAAGGTCAGCAAATTTATTACCACAAATTCTAAGATATTGCTCTTCTCTTACCTGCCTAGAGGCAGCGGGATGGACTACATGACCTCCTGGAGT
258	515	GGGACGTCAGCATCGGCATCAAGTGTGCCCCTGGAGTGGTAGGCCCCGCCGAAGCTGACATCGACTTCGACATCATCCGCAATGACAATGACACCTTCACGGTCAAGTACACGCCCCGGGGGGCTGGCAGCTACACCATTATGGTCCTCT	516	CTTGCCCTTGCCCCTGTGCCCTGCAGGTGAATGTGGGAGCTGGCAGCCACCCCAACAAGGTCAAAGTATACGGCCCCGGAGTAGCCAAGACAGGGCTCAAGGCCCACGAGCCCACCTACTTCACTGTGGACTGCGCCGAGGCTGGCCAGG
259	517	CTCCGGGTTGACAAATGGTGGGGTAACAGAAAGGAACTGGCTACCGTTCGGACTATTTGTAGTCATGTACAGAACATGATCAAGGGTGTTACACTGGTAAGCAGATGTATCAGACTTCCTTGTTTTGGAAAGGGAGGTTTCTCAAACCTG	518	TTGTGTGGCCTGACGAGTGTGTTCTCTCTTCTAGTCGACATTACTCTGAAGGGACGCACAGTTATCGTGAAGGGCCCCAGAGGAACCCTGCGGAGGGACTTCAATCACATCAATGTAGAACTCAGCCTTCTTGGAAAGAAAAAAAAGAGG
260	519	CATCCACTGCTGCCTCTGTTCTCTCCCCAGGCTGTCCAGATTATGAATGGGCTCTTCCACATTGCCCTGGGGGGTCTTCTGATGATCCCAGCAGGGATCTATGCACCCATCTGTGTGACTGTGTGGTACCCTCTCTGGGGAGGCATTATG	520	TATATTATTTCCGGATCACTCCTGGCAGCAACGGAGAAAAACTCCAGGAAGTGTTTGGCAAGTAACCATATGTCCTTCTTTCCCACATGTCAGAGAAGTACCTATTTTTTTCGGTTAAAAACTGAGACCCTTAAAAAGCCAAGGTATCAC
261	521	GGGGTATGATGGCATCTGACTCCTTGTTACCCACTTCCTGCAGCTAGATACACTGTCAGATCCTTTGGCATCCGGAGAAATGAAAAGATTGCTGTCCACTGCACAGTTCGAGGGGCCAAGGCAGAAGAAATCTTGGAGAAGGGTCTAAAG	522	GTGCGGGAGTATGAGTTAAGAAAAAACAACTTCTCAGATACTGGAAACTTTGGTTTTGGGATCCAGGAACACATCGATCTGGGTATCAAATATGACCCAAGCATTGGTATCTACGGCCTGGACTTCTATGTGGTATGAATATTTAATCTT
262	523	AAAAGCAACTGGAAGAGAGGTGACTCACATTCAGTTCACCAGCTGGCCAGACCACGGGGTGCCTGAGGATCCTCACTTGCTCCTCAAACTGAGAAGGAGAGTGAATGCCTTCAGCAATTTCTTCAGTGGTCCCATTGTGGTGCACTGCAG	524	TGCTGGTGTTGGGCGCACAGGAACCTATATCGGAATTGATGCCATGCTAGAAGGCCTGGAAGCCGAGAACAAAGTGGATGTTTATGGTTATGTTGTCAAGCTAAGGCGACAGAGATGCCTGATGGTTCAAGTAGAGGTATGTTCTAACCT
263	525	TGGTCTGGTCTCTCACTCCCCAGGCAATACTAGCCCCTCTGGAGCACGGAGCTCCTTCCCCAAAGACATGAAGCTATTGGAGAACTCGAGCTTTGAAGCCATCAACTCACAGCTGACTGTGGAGACTGGAGATGCCCACATCATTGGCAG	526	GATTGAGAGCTACTCATGTAAGATGGCAGGAGACGACAAACACATGTTCAAGCAGTTCTGCCAGGAGGGCCAGCCCCACGTGCTGGAGGCACTTTCTCCACCCCAGACTTCAGGACTGAGCCCCAGCAGGTGAGCCATGGTGGGGCCTAC
264	527	GTCTCAACATATGCACTAGTGGAAGTGCCACCTCATGTGAAGAATGTCTGCTAATCCACCCAAAATGTGCCTGGTGCTCCAAAGAGGTATGTAGGTGGGGGAGGGGAGGAAGAAGGGAAGGAATGCTGCGAGGGTGAGGGTGAGAAGGAG	528	CCCGCGCTCCGGCCCCAGCCCCGGCCGCCGGCCCCCGCGGAGTGCAGCGACCGCGCCGCCGCTGAGGGAGGCGCCCCACCATGCCGCGGGCCCCGGCGCCGCTGTACGCCTGCCTCCTGGGGCTCTGCGCGCTCCTGCCCCGGCTCGCAG
265	529	GTCCTCGCAAGGGCCGAGAGGTGTACCGGCATTTCGGCAAGGCCCCAGGAACCCCGCACAGCCACACCAAGTGAGTATCAGGCCCCCAGCCCTGCCCTCTCCCCAGACTCAGCCTGCAGGGCCAGGCCTGGCCACACTTGGGCTGCTTCT	530	CCCGCCAGCCTTGTCCTCTCCACCAGGTATGTGCACTGCGCGTGACCAGCCGGGCCCGCAGCCGCATCCTCAGGGCAGGGGGCAAGATCCTCACTTTCGACCAGCTGGCCCTGGACTCCCCTAAGGGCTGTGGCACTGTCCTGCTCTCCG
266	531	TGTTAAATCTAACTAGATAGACTTTATGAAGTAGAAGTATTGTAAATCAGCTTTCCCAAAAATGACATGGCAGATATTCTAAAGCAAAATTTTAATAATTTACATTTTTTTTCTCCATTACAGCTACTACTCCATCTAAGCCAACATGTG	532	ATGAAAAATATGCAAACATCACTGTGGATTACTTATATAACAAGGAAACTAAATTATTTACAGCAAAGCTAAATGTTAATGAGAATGTGGAATGTGGAAACAATACTTGCACAAACAATGAGGTGCATAACCTTACAGAATGTAAAAATG
267	533	AGTCTAAGTGTATTCCCTCTGGCTTCCATTTAGATTTTCCTGAGAGAACTGATTTCAAATGCTTCTGATGCTTTAGATAAGATAAGGCTAATATCACTGACTGATGAAAATGCTCTTTCTGGAAATGAGGAACTAACAGTCAAAATTAAG	534	TGTGATAAGGAGAAGAACCTGCTGCATGTCACAGACACCGGTGTAGGAATGACCAGAGAAGAGTTGGTTAAAAACCTTGGTACCATAGCCAAATCTGGGACAAGCGAGTTTTTAAACAAAATGACTGAAGCACAGGAAGATGGCCAGTCA
268	535	GCTTCCGGATGCAGATGACGATGCGTTTGAAGAGTACAGTGCTGACGTGGAAGAAGAGGAGCCAGAGGCGGACCACCCCCAGATGGGGGTCAGCCAGCAGTAAATCTGGGGGCTCCCCTGAGAAGGAGAGTGAGCCCCACAGTAACCTAG	536	GCATGTCGGTGTAAACCTGATTGTCTCGACATTTTCTGTTTAATTGATTGGTGCTGTGAGGAGTTCGGCTGCTCGTGGTAAAACAGCGTACTCCAGTTTTAAGTCATCGGGTAAAATAATAGGACAGTGATTTCCATCTGTGCTTCAGTA
269	537	TGCCGGGAGAGCCGCGGCGACGTCAGTTCCTCCTTTCGGGGCTCTGATTGGTCAGAGCGCCCGGCGCTTCTGGTTGGCCGGCCCTGCTATCATCCCAGAGTGCATTGCGGGGCCGCTTCCTTTCCGCTCGGCTGTTTTCCTGCGCAGGAG	538	CCGCAGGGCCGTAGGCAGCCATGGCGCCCAGCCGGAATGGCATGGTCTTGAAGCCCCACTTCCACAAGGACTGGCAGCGGCGCGTGGCCACGTGGTTCAACCAGCCGGCCCGTAAGATCCGCAGGTGAGCCCTGCGCTCGGGGCTGCCCC
270	539	AGCTGGTGGAGAACCCTGCTGACTTCTGTGGTTTCTGTGCTCTTCCCAGAAGTAAGGCTGTCACAAGGCTGGAAGCAGAGAACATCCCCATGGAACTGAAGACAGCATGCTGCATCCCTGGGAGGAGGGAGCTCTTAAGGAAGTTCCAAG	540	TGGATGTAAAGCTGGATCCCGCCACGGCGCACCCGAGTCTGCTCTTGACCGCCGACCTGCGCAGTGTGCAGGATGGAGAACCATGGAGGGATGTCCCCAACAACCCTGAGCGATTTGACACATGGCCCTGCATCCTGGGTTTGCAGAGCT
271	541	GGTCTGCACCTTTTCTCCACAGAGGGTGTCGCCCACCACCAGTCCCCGCCCTGCTAGCCCAGTCCCTGGGAGTGAGCGCCGGGGCTCCCGGCCTGAGATGACTCCCGTTAGCTTACGAAGCACAAAGGAGGGGCCCGAGACCCCACCCAG	542	GCCCCGGGATCAGCTGCCCCCCCATCCCCGCTCCCGCCGCTACTCCGGGGACAGTGACTCCTCAGCCTCCTCCGCCCAGAGCGGCCCCCTTGGTACCCGCAGTGATGACACAGGCACTGGCCCCCGGAGGGAGCGACCCAGCCGGCGGCT
272	543	GATGACAGCAAGGCTGGCATGGAGGAAGATCACACCTACGAGGTAAGGAGAGGGGCAGGCCCAGCAGCTCTGAGTCCTCGGGGTCAGTGGCCACTATCTGCTGGTGTGGTTGGGGTGTGGTCCCGGCCTGAGTTCCACTTAATGTCTCCA	544	CAGGCTCACAACCCCACCCCTGTCCCCGCAGGATTCAGCACCTTGGCACAGCTGAAGCAGAGGAACACGCTGAAGGATGGTATCATCATGATCCAGACGCTGCTGATCATCCTCTTCATCATCGTGCCTATCTTCCTGCTGCTGGACAAG
273	545	GCAAGAAATCCAAGAGAAGGTAAGTTTTATTAGTGGCGAGGAGTTTCCACATCTGCTGATTCATTCTCTACTTCCTTAAGTTACTTCCTGCTCTAGCTAGACACATTAACCCCATAGTAGTTTATTTACCTGGGGTCCTCATCCAAATGA	546	CCTTACTGATTTCTCTTTCAGAATTGGACAAAAGTTTCTCAATGATTAAGGAGGGTGATTATAACCCCCTCTTCATTCCAGTGGCAGTCATGGTTACTGCATTCTCTGGGTTGGCATTTATCATTTGGCTGGCAAGGAGATTAAAAAAAG
274	547	GATCTCCCTCAGCGATCCCTGGCCCTGGCAGAGCAGAAGTGTGAAGAGTGGAGGAGCCAGTATGAGGCTCTGAAGGAGGACTGGAGGACCCTTGGGACCCAGCACAGGGAGCTGGAGAGCCAACTCCACGTGCTTCAGTCCAAACTGCAG	548	GGAGCAGATAGCAGGGACTTACAGATGAACCAGGCCCTGCGATTTTTGGAAAATGAGCACCAGCAACTGCAGGCCAAGATTGAATGCCTGCAAGGGGACAGAGACCTGTGCAGCTTGGATACCCAGGACCTACAAGGTACTCTTCTCCTT
275	549	TTGCAGCAATGTGAATTGGGCCAGAAGATCAGAGTGTAATATGTGTAATACTCCAAAGTATGCTAAATTAGAAGAAAGAACAGGTATGATAAAACCACATTGTAACTAAATGATTTTTTTTAAAGCACTAAATATTGAAACGATAATTGT	550	TATTTCTCCAGGTTCATATTGCATGATTTTTCTGTTTTCAGAGAAAACAACTGAGGCCAAGATGATGAAAGCTGGGGGCACTGAAATAGGAAAGACACTTGCAGAAAAGAGCCGAGGCCTATTTAGTGCTAATGACTGGCAATGTAAAAC
276	551	CCGAGTCGTCCGGAAATCCATTGCCCGTGTTCTCACAGTTATTAACCAGACTCAGAAAGAAAACCTCAGGAAATTCTACAAGGTGAGTCTGCCTGGACATAGGGAGGGTTGGCTGCAGGAAGCCAAGTGCTAGCCGTCCCTGGCCGGGGA	552	CTCTTGCGCGCAGGCCAAGATCAAGGCTCGAGATCTTCGCGGGAAGAAGAAGGAGGAGCTGCTGAAACAGCTGGACGACCTGAAGGTGGAGCTGTCCCAGCTGCGCGTCGCCAAAGTGACAGGCGGTGCGGCCTCCAAGCTCTCTAAGAT
277	553	ATGAGGGCAGGACCTGGGGGGACCTGGGCGCCGCTGCCGGGGGCGGCACCCCCAGCAAGGGGGTCAACTTCGCCGAGGAGCCCATGCAGTCCGACTCCGAGGACGGGGAGGAGGAGGAGGCGGCGCCCGCGGACGCAGGGGCGTTCAATG	554	CTCCAGTAATAAACCGATTCACAAGGCGTGCCTCAGGTAAGTCTGATTATATTATGGATTTTGTTTATTAATGGTGACATTTAAAAAATGATAATATTGGACAAGAAGGTACAAAGAATAATTGCTGTATAGTAAACCTTTATTTGTCAG
278	555	TGTGAAATCAAAGTTGCACAACCCAAAGAGGTATATAGGCAGCAACAGCAACAACAAAAAGGTGGAAGAGGTGCTGCAGCTGGTGGACGAGGTGGTACGAGGGGTCGTGGCCGAGGTGAGACTTAATTCTTGAAATATGACTCCGTGGTT	556	TGTGCATCTCGATTTCAGATTGAAAATATTGAACTTCCCATGGATACAAAAACAAATGAAAGAAGAGGATTTTGTTTTATCACATATACTGATGAAGAGCCAGTAAAAAAATTGTTAGAAAGCAGATACCATCAAATTGGTTCTGGGAAG
279	557	GATCCCGAAGGCAAGCCGAAGAAGACACACATCCAAGACAACCATGACGGCACGTATACAGTGGCCTACGTGCCAGACGTGACAGGTCGCTACACCATCCTCATCAAGTACGGTGGTGACGAGATCCCCTTCTCCCCGTACCGCGTGCGT	558	AAGGTCAAGGTGCTGCCTACTCATGATGCCAGCAAGGTGAAGGCCAGTGGCCCCGGGCTCAACACCACTGGCGTGCCTGCCAGCCTGCCCGTGGAGTTCACCATCGATGCAAAGGACGCCGGGGAGGGCCTGCTGGCTGTCCAGATCACG
280	559	CCTGGTTCAAAAGCAGCTAAACCAAAAGAAGCCTCCAGACAGCCCTGAGATCACCTAAAAAGCTGCTACCAAGACAGCCACGAAGATCCTACCAAAATGAAGCGCTTCCTCTTCCTCCTACTCACCATCAGCCTCCTGGTTATGGTACAG	560	ATACAAACTGGACTCTCAGGACAAAACGACACCAGCCAAACCAGCAGCCCCTCAGCATCCAGCAACATAAGCGGAGGCATTTTCCTTTTCTTCGTGGCCAATGCCATAATCCACCTCTTCTGCTTCAGTTGAGGTGACACGTCTCAGCCT
281	561	AGGATCAAGGTGAAAAGGAGAACCCCATGCGGGAACTTCGCATCCGCAAACTCTGTCTCAACATCTGTGTTGGGGAGAGTGGAGACAGACTGACGCGAGCAGCCAAGGTGTTGGAGCAGCTCACAGGGCAGACCCCTGTGTTTTCCAAAG	562	CTAGATACACTGTCAGATCCTTTGGCATCCGGAGAAATGAAAAGATTGCTGTCCACTGCACAGTTCGAGGGGCCAAGGCAGAAGAAATCTTGGAGAAGGGTCTAAAGGTGAGCCTAATCCCCTAATGGAGTGATATTGATCAGCACTCCT
282	563	AGGAGTTGAAGCCAAACAGCCAAATTCTGCCATTAGGAAGTGTGTAAGGGTCCAGCTGATCAAGAATGGCAAGAAAATCACAGCCTTTGTACCCAATGACGGTTGCTTGAACTTTATTGAGGTGAGTATTTCAACTCTATCGTACCTTCT	564	TGGACTTCGTACTGCTAGGAAGCTCCGTAGTCACCGACGAGACCAGAAGTGGCATGATAAACAGTATAAGAAAGCTCATTTGGGCACAGCCCTAAAGGCCAACCCTTTTGGAGGTGCTTCTCATGCAAAAGGAATCGTGCTGGAAAAAGT
283	565	AGGACTTGACCTCTGACCCCTACCCTCTCTCTCTGGCCTCAGGTGAGGGAGATTCTGGGCCGCTGCACCTGCCCTGACCAGTTTCCCATGATCAAGGTCTCAGAGGGGAAGTACCGTGTGGGGGACTCGAGCCTGCTCATCTTTGTGCGG	566	GTGCTGAGGAGCCACGTGATGGTGCGAGTGGGTGGTGGCTGGGACACGCTGGAGCATTACCTGGACAAGCACGACCCGTGCCGCTGCTCCTCCACTGGTCAGTGCCAGGGTGGGGCTGGGGCTGGACGGGCAGGGGACTTGCTTCTGTGG
284	567	TGATTCAGTGTGAGCCTCTATCAGCACCAGATTTGGGGATCATGAACTGTAGCCATCCCCTGGCCAGCTTCAGCTTTACCTCTGCATGTACCTTCATCTGCTCAGAAGGAACTGAGTTAATTGGGAAGAAGAAAACCATTTGTGAATCAT	568	GTACCATGGACTGTACTCACCCTTTGGGAAACTTCAGCTTCAGCTCACAGTGTGCCTTCAGCTGCTCTGAAGGAACAAACTTAACTGGGATTGAAGAAACCACCTGTGGACCATTTGGAAACTGGTCATCTCCAGAACCAACCTGTCAAG
285	569	GGCCTGGACATTGACCAGACAGCCACCTATGAGGACATAGTGACGCTGCGGACAGGGGAAGTGAAGTGGTCTGTAGGTGAGCACCCAGGCCAGGAGTGAGAGCCAGGTCGCCCCATGACCTGGGTGCAGGCTCCCTGGCCTCAGTGACTG	570	CTCACTCCTGACCCCTCACCCCTCTCCCTGGCCCTCCCCAGCCTGGCCCAGCAGGGGATGGGGCTGGGGGACACTAACACTCTGATCTCCATCCCTCTCCGCCCCCAGGATGACAGCAAGGCTGGCATGGAGGAAGATCACACCTACGAG
286	571	GAAGAAATTCAAAAGAAAAGAACCCGCCGAGCAGTCAAATTCCAGAGGGCCATTACTGGTGCATCTCTTGCTGATATAATGGCCAAGAGGAATCAGAAACCTGAAGTTAGAAAGGCTCAACGAGAACAAGCTATCAGGTGAGGAATGCTT	572	TATAGTTAAATAGTAATTCCTTTGCATTTGTCACTCTAGGTTTTCCAGTTTCTTAATGCGAAATGCGAGTCGGCTTTCCTTTCCAAGAGGAATCCTCGGCAGATAAACTGGACTGTCCTCTACAGAAGGAAGCACAAAAAGGGACAGTCG
287	573	TACTTCCTGGCATCCAGGAGGGTCTGAAAGATATTCACCTCCCCCTGCTCACTGAGGCACCCACCCCACCCACCCCTACAGAAACGATGGCAGAACGAGAAGCTCGGGTTGGATGCCGGGGATGAATATGAAGATGAAAACCTTTATGAA	574	GGCCTGAACCTGGACGACTGCTCCATGTATGAGGACATCTCCCGGGGCCTCCAGGGCACCTACCAGGATGTGGGCAGCCTCAACATAGGAGATGTCCAGCTGGAGAAGCCGTGACACCCCTACTCCTGCCAGGCTGCCCCCGCCTGCTGT
288	575	CCTTGGGGGTGGGGGGATAGAGGCATGGAATAGGTGCTCTGACCTCTGACCCTCTAGCCCAGGGAGAAGGTGAGCAGTATTGATTTGGAGATCGACTCTCTGTCCTCACTGCTGGATGACATGACCAAGAATGATCCTTTCAAAGCCCGG	576	GTGTCATCTGGATATGTGCCCCCACCAGTGGCCACTCCATTCAGTTCCAAGTCCAGTACCAAGCCTGCAGCCGGGGGCACAGCACCCCTGCCTCCTTGGAAGTCCCCTTCCAGCTCCCAGCCTCTGCCCCAGGTTCCGGCTCCGGCTCAG
289	577	CCGTGACCCTAGGGGCCGGTTTGCGCCGGGAGCCGGGGCACGGTTCCGGCCGTACTCACGGCGCCGCGCGGTGACTCCCCAGGCGCAGCCCAGCCTCGAAATGCAGAACGACGCCGGCGAGTTCGTGGACCTGTACGTGCCGCGGAAATG	578	CTCCGCTAGCAATCGCATCATCGGTGCCAAGGACCACGCATCCATCCAGATGAACGTGGCCGAGGTGAGCTGGGAGCCCGGGAGGCGGGAAGGTTGTGATATATGTGCGGGAAAGGCAGGCTGTCCCATTGTGGAGGAGCCCCTGGGGTG
290	579	GCGAGTATTTCTAAGTAAGTTTCACTGTCCTTTCTCCTCCAATTTTAGGTGTTCAGGCGCTTCGTGGAGGTTGGCCGGGTGGCCTATGTCTCCTTTGGACCTCATGCCGGAAAATTGGTCGCGATTGTAGATGTTATTGATCAGAACAGG	580	GCTTTGGTCGATGGACCTTGCACTCAAGTGAGGAGACAGGCCATGCCTTTCAAGTGCATGCAGCTCACTGATTTCATCCTCAAGTTTCCGCACAGGTAACTGTCCACTAATCACTCCTCCCTCCCATCCCCAGATTTGTTTATGCTAGTA
291	581	TTTTATTCTTGTCTGTTCTGCCTCACTCCCGAGCTCTACTGACTCCCAACAGAGCGCCCAAGAAGAAAATGGCCATAAGTGGAGTCCCTGTGCTAGGATTTTTCATCATAGCTGTGCTGATGAGCGCTCAGGAATCATGGGCTATCAAAG	582	AAGAACATGTGATCATCCAGGCCGAGTTCTATCTGAATCCTGACCAATCAGGCGAGTTTATGTTTGACTTTGATGGTGATGAGATTTTCCATGTGGATATGGCAAAGAAGGAGACGGTCTGGCGGCTTGAAGAATTTGGACGATTTGCCA
292	583	TATACCTGAGGTGCACCGGAGGTGAAGTCGGTGCCACTTCTGCCCTGGCCCCCAAGATCGGCCCCCTGGGTCTGGTACGTTATCCCCTCCAAGGGGCATTTTTTTCACATTTGTTTCACTTTAAGCGCCGGCTCGTGGAGTCACGCCTGT	584	CTGGCTTGTCCGCGCGATTTCCGGCCTCTCGGCTTTCGGCTCGGAGGAGGCCAAGGTGCAACTTCCTTCGGTCGTCCCGAATCCGGGTTCATCCGACACCAGCCGCCTCCACCATGCCGCCGAAGTTCGACCCCAACGAGATCAAAGTCG
293	585	TTATACAGGTTTCTGGCCAGAAGAACCAACTCCACATTCAACCAGGTTGTGTTGAAGAGGTTGTTTATGAGTCGCACCAACCGGCCGCCTCTGTCCCTTTCCCGGATGGTGAGTGGCTGGTCCAGAGAGCACGGTAGACCTGGGAGCCGC	586	ATAAGTAATAATTGGCTATGGTTGGGGGTAATTGGGTCCATGGTTGCCTCTTCACCCCCACAGGGAGTGGACATCCGCCATAACAAGGACCGAAAGGTTCGGCGCAAGGAGCCCAAGAGCCAGGATATCTACCTGAGGCTGTTGGTCAAG
294	587	GATATGGTGGTGGTTTTAATGAAAGAGAAAATGTTGAATATATAGAAAGAGAAGAATCTGATGGTGAATATGATGAGGTAAGCTATATTTTGGTGTTCAGGTTGAATATAAATTAGAAAAACAGAAAAAATTCTTAAATGCAAAGGAAAA	588	AAATATCTAAAAATTTGATATTCATCTATATTATAGCCTACTAATTTAGTATTTTTCACTTCTAAAGTTGCAGCAATGTGAATTGGGCCAGAAGATCAGAGTGTAATATGTGTAATACTCCAAAGTATGCTAAATTAGAAGAAAGAACAG
295	589	CGGGCCCCTGGCTGGGCCCAGTTCGGGGTGTGTGGGAGCTGAGGACTCACTGGGCTTGAGGACTGACTGATGTGGGGTGCAGAGGAGGCTTGGGCCTGGAACCGAGTGCTTTGTTCCTAACAGGTGATGTCGAGCCTGGCAGAGCTGGAG	590	GACGACTTCAAAGAGGGCTACCTGGAGACAGTGGCGGCTTATTATGAGGAGCAGCACCCAGTGAGTATGACACACCCATCTGGGCACCTTGCCTTCCTTCACCTCTGCCCTGTCTTTTCTTTCTTTCTTTCTTTTTGTTTATTTGAGACA
296	591	GGTGACTTTTAAATATGACGGCTCCACCATCGTCCCCGGCGAGCAGGGAGCGGAGTACCAGCACTTCATCCAGCAGTGCACAGGTAGGGAGGCGCGCCTGCCGGGCGGATGCGCGGTCGTTGGGAGGTTGTCTGCACCCGGGGAGCCCCG	592	CGCTCCCATCCCCGCCGCCGGCCAGGGGCGCGCTCGGCCGCCCCGGACAGTGTCCCGCTGCGGCTCCGCGGCGATGGCCACCAAGATCGACAAAGAGGCTTGCCGGGCGGCGTACAACCTGGTGCGCGACGACGGCTCGGCCGTCATCTG
297	593	AAGTGTTACAAATCCTTCTGCCCTCACTTAGGCATCTATATCATAAATCTCAAGAGGACCTGGGAGAAGCTTCTGCTGGCAGCTCGTGCAATTGTTGCCATTGAAAACCCTGCTGATGTCAGTGTTATATCCTCCAGGAATACTGGCCAG	594	AGGGCTGTGCTGAAGTTTGCTGCTGCCACTGGAGCCACTCCAATTGCTGGCCGCTTCACTCCTGGAACCTTCACTAACCAGATCCAGGCAGCCTTCCGGGAGCCACGGCTTCTTGTGGTTACTGACCCCAGGGCTGACCACCAGCCTCTC
298	595	GTGTCTTCCGTGAGGCCACCACTGAGTTCAGTGTGGACGCCCGGGCTCTGACACAGACCGGAGGGCCGCACGTCAAGGCCCGTGTGGCCAACCCCTCAGGCAACCTGACGGAGACCTACGTTCAGGACCGTGGCGATGGCATGTACAAAG	596	TTACCTACATTCCCCTCTGCCCCGGGGCCTACACCGTCACCATCAAGTACGGCGGCCAGCCCGTGCCCAACTTCCCCAGCAAGCTGCAGGTGGAACCTGCGGTGGACACTTCCGGTGTCCAGTGCTATGGGCCTGGTATTGAGGGCCAGG
299	597	CAAAGCTGACACTCCTGCAGAGAAAGCTCCAACCGGCAGCAATGTATGAGATTAAAGTTCGATCCATCCCTGATCACTATTTTAAAGGCTTCTGGAGTGAATGGAGTCCAAGTTATTACTTCAGAACTCCAGAGATCAATAATAGCTCAG	598	GGGAGATGGATCCTATCTTACTAACCATCAGCATTTTGAGTTTTTTCTCTGTCGCTCTGTTGGTCATCTTGGCCTGTGTGTTATGGAAAAAAAGGTGACCTTCTTCAACTAATAAAGAGGGTGATTGTGTGGGATCACGGACAGTCAGAG
300	599	TTACCTGGCTACAGAAAGAAGATGCCAGATGACACTTAAGACCTACTTGTGATATTTAAATGATGCAATAAAAGACCTATTGATTTGGACCTTCTTCTTAAACCGGTTATCCTTTTTAGCTAGTTTTTTTCCCTCGTGGAACAAGGAGCT	600	GATGTATTAATTGCTTTATCTTCACTCCTATAGCGGCTTTGATTCAGCAAGCCACAACAGTTAAAAACAAGGATATCAGGAAATTTTTGGATGGTATCTATGTCTCTGAAAAAGGAACTGTTCAGCAGGCTGATGAATAAGATCTAAGAG
301	601	AATAATACCGAGTCGAGTCATGAAATGTGTCCCACCCCCTTGTCTCCCTTCAGGTTTAAGTTACTGAGCCAGGAGGAAGGCGAGTACTTCAATGTGCCTGTGCCACCAGAAGGAAGTGAGGCCAATGAAGAACTGCGGCAGAAATTTGAG	602	AGGGCCAAGATCAGTCAGGGAACCAAGGTCCCGGAAGAAAAGACGACCAACACTGTCTCCAAATTTGACAACAATGGCAACAGAGACCGGATGAAACTGACCGATTTTAACTTCCTAATGGTGCTGGGGAAAGGCAGCTTTGGCAAGGTA
302	603	TAGAATAGGAATATAGAGTCAAACTCTTTGCAGACTAGATTTTGCCCCAAGCTCATTAACTCATCCCATTTGCTCCAGGGACAGCTTAATGAAGACAAACTGAAGGGGAAACTGAGATCCTTAGAAAACCAGCTATACACCTGTACCCAG	604	AAATACTCCCCTTGGGGAATGAAAAAAGTACTACTGGAGATGGAAGACCAGAAAAACAGCTATGAGCAGAAGGCCAAGGAGTCACTGCAGAAAGTGCTGGAGGAGAAAATGAATGCAGAGCAGCAACTACAGAGCACACAGGTATGGGGA
303	605	CCAGCGACTCCTGCTCTTGCTTCTGGATCTGCAGGGCAGTCCCAGCAGGACCCATGGAGTGTCCTTCGTGCCAGCATGTCTCCAAGGAGGAAACCCCCAAGTTCTGCAGCCAGTGCGGAGAGAGGCTGCCTCCTGCAGCCCCCATAGCAG	606	ATTCTGAGAACAATAACTCCACAATGGCGTCGGCCTCGGAGGGTGAAATGGAGTGTGGGCAGGAGCTGAAGGAGGAAGGGGGCCCGTGCTTGTTCCCGGGCTCAGACAGTTGGCAAGAAAACCCCGAGGAGCCCTGTTCCAAAGCCTCCT
304	607	GAAAGCAAGGAATTTAATGCAGAAGTACATCGGAAGCACATCATGGGCCAGAATGTTGCAGATTACATGCGCTACTTAATGGAAGAAGATGAAGATGCTTACAAGAAACAGTTCTCTCAATACATAAAGAACAGCGTAACTCCAGACATG	608	ATGGAGGAGATGTATAAGAAAGCTCATGCTGCTATACGAGAGAATCCAGTCTATGAAAAGAAGCCCAAGAAAGAAGTTAAAAAGAAGAGGTATGTCGTCTTTTTTTTTGTCTTTTCAAGAAAACAGGTTGGGAATGGTTCCCACGTGGGG
305	609	TTGAGCTAAAAGGTATTTTTGCATTCTAAAAGGGAAACTAAGGCAAAAAACCCACTTTTGTTTCCCCTCCTGCCTTTTAGGGAAGACAAAGGCGCTTTGGCTAAGCTGGTGGAAGCTATCAGGACCAATTACAATGACAGATACGATGAG	610	ATCCGCCGTCACTGGGGTGGCAATGTCCTGGGTCCTAAGTCTGTGGCTCGTATCGCCAAGCTCGAAAAGGCAAAGGCTAAAGAACTTGCCACTAAACTGGGTTAAATGTACACTGTTGAGTTTTCTGTACATAAAAATAATTGAAATAAT
306	611	GCTGAGCCCAGCAGCTTCTTGTGACTAGAGCAGGCCCTGTGAGTGCTCACAAAGTGGTTGTGTGTTCTAGGAGTTAACACCGTCACCACCTTGGTGGAGAACAAGAAAGCTCAGCTGGTGGTGATTGCACACGACGTGGATCCCATCGAG	612	CTGGTTGTCTTCTTGCCTGCCCTGTGTCGTAAAATGGGGGTCCCTTACTGCATTATCAAGGGAAAGGCAAGACTGGGACGTCTAGTCCACAGGAAGACCTGCACCACTGTCGCCTTCACACAGGTGAACTCGTAAGTACACAGCCTGGCC
307	613	GAAGCCCCTTGCAGTTCTATGTGGATTACGTCAACTGTGGCCATGTCACTGCCTATGGGCCTGGCCTCACCCATGGAGTAGTGAACAAGCCTGCCACCTTCACCGTCAACACCAAGGATGCAGGAGAGGGTGAGCAATAGCTCTGGTCTT	614	GCCCCACAGGGGAGGTTCGGATGCCCTCAGGCAAGGTGGCGCAGCCCACCATCACTGACAACAAAGACGGCACCGTGACCGTGCGGTATGCACCCAGCGAGGCTGGCCTGCACGAGATGGACATCCGCTATGACAACATGCACATCCCAG
308	615	TGAGGGTCTCGGCCACCTTCTGGCAGAACCCCCGCAACCACTTCCGCTGTCAAGTCCAGTTCTACGGGCTCTCGGAGAATGACGAGTGGACCCAGGATAGGGCCAAACCTGTCACCCAGATCGTCAGCGCCGAGGCCTGGGGTAGAGCAG	616	ACTGTGGCTTCACCTCCGGTAAGTGAGTCTCTCCTTTTTCTCTCTATCTTTCGCCGTCTCTGCTCTCGAACCAGGGCATGGAGAATCCACGGACACAGGGGTGTGAGGGAGGCCAGAGCCACCTGTGCACAGGTACCTACATGCTCTGTT
309	617	GGATTTCATTCGTGCCCAAGGAGACGGGGGAGCACCTGGTGCATGTGAAGAAAAATGGCCAGCACGTGGCCAGCAGCCCCATCCCGGTGGTGATCAGCCAGTCGGAAATTGGGGATGCCAGTCGTGTTCGGGTCTCTGGTCAGGGCCTTC	618	TGCGTATGTCCCACCTAAAGGTCGGCTCTGCTGCCGACATCCCCATCAACATCTCAGAGACGGATCTCAGCCTGCTGACGGCCACTGTGGTCCCGCCCTCGGGCCGGGAGGAGCCCTGTTTGCTGAAGCGGCTGCGTAATGGCCACGTGG
310	619	GTCCCCTATAATTTTATCTCAATAATGTTTTGCAGTAGTTTCTAAGGAAATTTTTATGGGGTCTTCAGTCTGACTGTGAAAAGCAGTTCAGAGTCCAACTCACACTGTGTTTTTCTTTCCTTTTCAGGGTGTGAGAGGAGTCCTGAGCAG	620	AAGTAAGGCTGTCACAAGGCTGGAAGCAGAGAACATCCCCATGGAACTGAAGACAGCATGCTGCATCCCTGGGAGGAGGGAGCTCTTAAGGAAGTTCCAAGGTAGTTGCATCTTAGAGACTGGGAATTAGGCTGCCTGGGGTTTGAAGAA
311	621	GCATGGATTCCGTGAAGGAACAACACCTAAACCCAAGAGGGCAGCTGTTGCAGCATCCAGTTCATCTTAAGAATGTCAACGATTAGTCATGCAATAAATGTTCTGGTTTTAAAAAATACATATCTGGTTTTGGTAAGGTATTTTTAATCA	622	TTAACAACACCTACAAGGTGTGTGGGAGAACACCGTTTGAAATCTTTTCTGAACTTATGTTTTAGATAACTGGAGTGCCAAGGCTAAAAGACGAAATACCACCGGAACTGGTCGAATGAGGCACCTAAAAATTGTATACCGCAGATTCAG
312	623	CCATTCATATACCCCCAACCTCCCTCGTCCCCTCTTTCATTCTTACCGCCCAAGTCCCCTCTGCTCACTGCGCCCTTTCTCCACAGCTCCGCTAGCAATCGCATCATCGGTGCCAAGGACCACGCATCCATCCAGATGAACGTGGCCGAG	624	GTTGACAAGGTCACAGGCAGGTTTAATGGCCAGTTTAAAACTTATGCTATCTGCGGGGCCATTCGTAGGATGGTGAGTGTTTCCCTGGGCTTTGCTCATCACTTCGGGACATCGTGGACTTTACCGTGCGCATTGGAGTGTGTGATGGTG
313	625	ACCATTTTAATTGCTGTTAGATTTTGCACTGAAGTTCTTGATGTTTGTGTTCTAGGCTTTGGTCGATGGACCTTGCACTCAAGTGAGGAGACAGGCCATGCCTTTCAAGTGCATGCAGCTCACTGATTTCATCCTCAAGTTTCCGCACAG	626	TGCCCACCAGAAGTATGTCCGACAAGCCTGGCAGAAGGCAGACATCAATACAAAATGGGCAGCCACACGATGGGCCAAGAAGATTGAAGCCAGAGAAAGGGTAATAACTTAGGGTCATTTGAATTCTGGTCCTTTCTTTTTTTGGAGGGT
314	627	TGAATCATCTACAGCCTCTGCCCTGGTCGCATAAATTTGTCTGTGTACTCAAGCAATAAAATGATTGTTTAACTAAAAGCATGTTTCATATTTATTTTCCTAGAAGAAAAATTATATATATCAGTGGTTCATATGTGTTGATCTTGTTTG	628	TAGGTCATTTTGGGTGGTTTTCTTGAATTGCACCAAATTTTATTTTTAGGATAAGGATGCTAAATTCCGTCTGATTCTAATAGAGAGCCGGATTCACCGTTTGGCTCGATATTATAAGACCAAGCGAGTCCTCCCTCCCAATTGGAAATA
315	629	GAGTCACAGTGGCTCAAGCTTCCTTCCCCGCTTCCACATGCAGGCATCTCTCGGGACAACTGGCACAAGCGCCGCAAAACCGGGGGCAAGAGAAAGCCCTACCACAAGAAGCGGAAGTATGAGTTGGGGCGCCCAGCTGCCAACACCAAG	630	ATTGGCCCCCGCCGCATCCACACAGTCCGTGTGCGGGGAGGTAACAAGAAATACCGTGCCCTGAGGTTGGACGTGGGGAATTTCTCCTGGGGCTCAGAGTGTGAGTGAGGCCCTTTGGGAGTGGGTGGGAAAACGCACCTAAACGGTCTT
316	631	TTTGTGCCATTATTACATTTTCACCTTCATTCTTCTGTTGTTTTTCAGGGCATTTTGTCAGTGATGCTGATCTTTGCCTTCTTCCAGGAACTTGTAATAGCTGGCATCGTTGAGAATGAATGGAAAAGAACGTGCTCCAGACCCAAATCT	632	AACATAGTTCTCCTGTCAGCAGAAGAAAAAAAAGAACAGACTATTGAAATAAAAGAAGAAGTGGTTGGGCTAACTGAAACATCTTCCCAACCAAAGAATGAAGAAGACATTGAAATTATTCCAATCCAAGAAGAGGAAGAAGAAGAAACA
317	633	GCCACGCCCACCAGCCCCATCCGAGTCAAGGTGGAGCCCTCTCATGACGCCAGTAAGGTGAAGGCCGAGGGCCCTGGCCTCAGTCGCACTGGTGAGGACAGGTACCCCATGGCAGGTTGCGGGGCATCAAGGGTAGGAGGGCTTGGGGCA	634	ATCGGCATCAAGTGTGCCCCTGGAGTGGTAGGCCCCGCCGAAGCTGACATCGACTTCGACATCATCCGCAATGACAATGACACCTTCACGGTCAAGTACACGCCCCGGGGGGCTGGCAGCTACACCATTATGGTCCTCTTTGCTGACCAG
318	635	ACTATGTGTGGCCAAGGTATGCAGGCCTTTGACTACTTGGAAGCTAGCAAAGTCATCTACACCAATGGCTGTATTGACAAGTTGGTCAACTGGATACACAGCAACCTATTCTTACTTGGTGGTGTGGCTCTAGGCCTGGCCATCCCCCAG	636	CTGGTGGGAATTCTGCTGTCCCAGATCCTAGTGAATCAGATCAAAGATCAGATCAAGCTACAGCTCTACAACCAGCAGCACCGGGCTGACCCATGGTACTGAGAATCCATCCTGCACCTCCTCACCATGGAAACTGGCAAGCCTCATAAA
319	637	GCCTCAGAGTCTCTGATCAAGCAGATTCCACGAATCCTCGGCCCAGGTTTAAATAAGGCAGGAAAGTTCCCTTCCCTGCTCACACACAACGAAAACATGGTGGCCAAAGTGGATGAGGTGAAGTCCACAATCAAGTTCCAAATGAAGAAG	638	GTGTTATGTCTGGCTGTAGCTGTTGGTCACGTGAAGATGACAGACGATGAGCTTGTGTATAACATTCACCTGGCTGTCAACTTCTTGGTGTCATTGCTCAAGAAAAACTGGCAGAATGTCCGGGCCTTATATATCAAGAGCACCATGGGC
320	639	GCATTAATATAGTAGGGCACATGAAATGAAACCAAGTACTGTTTGCTTTCCTTTGTTTCAGATGGAGGAGATGTATAAGAAAGCTCATGCTGCTATACGAGAGAATCCAGTCTATGAAAAGAAGCCCAAGAAAGAAGTTAAAAAGAAGAG	640	GTGGAACCGTCCCAAAATGTCCCTTGCTCAGAAGAAGGATCGGGTAGCTCAAAAGAAGGCAAGCTTCCTCAGAGCTCAGGAGCGGGCTGCTGAGAGCTAAACCCAGCAATTTTCTATGATTTTTTCAGATATAGATAATAAACTTATGAA
321	641	AACAGATGTCTGTGAAAAAATTATTGGAGGAAATGAAGTAACTCCTCATTCAAGACCCTACATGGTCCTACTTAGTCTTGACAGAAAAACCATCTGTGCTGGGGCTTTGATTGCAAAAGACTGGGTGTTGACTGCAGCTCACTGTAACTT	642	GAACAAAAGGTCCCAGGTCATTCTTGGGGCTCACTCAATAACCAGGGAAGAGCCAACAAAACAGATAATGCTTGTTAAGAAAGAGTTTCCCTATCCATGCTATGACCCAGCCACACGCGAAGGTGACCTTAAACTTTTACAGGTACGTAT
322	643	GTGGTACTCTTTTTGTTCATTAAGTGTTAACGATGTACTCATTGTAGTATGGTTTTTGATGAAACAATCTTTAAGATGTTCATTTTTGTTTTTATAGTATGTGCAGAAGCTTATAATCCTGATGAAGAAGAAGATGATGCAGAGTCCAGG	644	ATTATACATCCAAAAACTGATGATCAAAGAAATAGGTTGCAAGAGGCTTGCAAAGACATCCTGCTGTTTAAGAATCTGGATCCGGTAAGATAAATCTTAATAATAGAAATGGCTTTGTTTTTTCCCCCAGTGACAGTGTCAAGAACTGTA
323	645	GAGAAGATTGGCTGGCGAAAGGATGCACTGCATTTGCTGGTGTTCACAACAGATGATGTGCCCCACATCGCATTGGATGGAAAATTGGGAGGCCTGGTGCAGCCACACGATGGCCAGTGCCACCTGAACGAGGCCAACGAGTACACTGCA	646	TGCGTCCCCTCCTTTGGGTTCCGCCATCTGCTGCCTCTCACAGACAGAGTGGACAGCTTCAATGAGGAAGTTCGGAAACAGAGGGTGTCCCGGAACCGAGATGCCCCTGAGGGGGGCTTTGATGCAGTACTCCAGGCAGCCGTCTGCAAG
324	647	AGGATTGGCTTTCAGAGTCTAATCATGTTTTCTGTGTGTCTAGTATGCTCAGGCTTCAGAAGAGGCTCGCCTCTAGTGTCCTCCGCTGTGGCAAGAAGAAGGTCTGGTTAGACCCCAATGAGACCAATGAAATCGCCAATGCCAACTCCC	648	GTCAGCAGATCCGGAAGCTCATCAAAGATGGGCTGATCATCCGCAAGCCTGTGACGGTCCATTCCCGGGCTCGATGCCGGAAAAACACCTTGGCCCGCCGGAAGGGCAGGCACATGGGCATAGGTAAGTGTGGTCATCTTCTCCTTAAGA
325	649	GAGTATCCTTTCTACAATTATTTTTTTCTTTCAGAGGGTAAAACTGATTATTATGCTCGGAAACGCTTGGTGATACAAGATAAAAATAAATACAACACACCCAAATACAGGATGATAGTTCGTGTGACAAACAGAGATATCATTTGTCAG	650	ATTGCTTATGCCCGTATAGAGGGGGATATGATAGTCTGCGCAGCGTATGCACACGAACTGCCAAAATATGGTGTGAAGGTTGGCCTGACAAATTATGCTGCAGCATATTGTACTGGCCTGCTGCTGGCCCGCAGGGTATGTACAAGATGA
326	651	AACTTAGGGTCATTTGAATTCTGGTCCTTTCTTTTTTTGGAGGGTTCAAGATAGTGTGAGAGGGATAATTTTTATTTGTTGTTTTTTTTTTAACAGAAAGCCAAGATGACAGATTTTGATCGTTTTAAAGTTATGAAGGCAAAGAAAATG	652	AGGAACAGAATAATCAAGAATGAAGTTAAGAAGCTTCAAAAGGCAGCTCTCCTGAAAGCTTCTCCCAAAAAAGCACCTGGTACTAAGGGTACTGCTGCTGCTGCTGCTGCTGCTGCTGCTGCTAAAGTTCCAGCAAAAAAGATCACCGCC
327	653	GGCAACAAACCATGGATTTCTCTTCCCCGAGGAAAGGGTATCCGCCTCACCATTGCTGAAGAGAGAGACAAAAGACTGGCGGCCAAACAGAGCAGTGGGTGAAATGGGTCCCTGGGTGACATGTCAGATCTTTGTACGTAATTAAAAATA	654	TGTATGGTGACTGGAGGTGCTAACCTAGGAAGAATTGGTGTGATCACCAACAGAGAGAGGCACCCTGGATCTTTTGACGTGGTTCACGTGAAAGATGCCAATGGCAACAGCTTTGCCACTCGACTTTCCAACATTTTTGTTATTGGCAAG
328	655	ATTTAACATATGAGCTGACAGTCAAAAGTTCGGAACAGACAGGTAAGAACTCCTCCCCAGAAGTAAATGACAGTAGGTTTCCCTTTGTGGTACGTGTTGGTGCCGTTTTCACTAGTCACACACTTAGGAGAAAATGCTCTTGCTGGGAAG	656	CAGGTCCTCTGGATGTCAGCATGGCAGCCACAAACCTGGAGAACCAGCTGCACAGCGCACAGAAGAACCTCCTGTTCCTTCAGCGGGAGCATGCCAGCACGCTCAAGGGGCTGCACTCCGAGATCAGGCGGCTGCAGCAGCACTGCACAG
329	657	GCAGTCCTTTCAAGGTCCCTGTGCATGATGTGACAGATGCGTCCAAGGTCAAGTGCTCTGGGCCCGGCCTGAGCCCAGGCATGGTTCGTGCCAACCTCCCTCAGTCCTTCCAGGTGGACACAAGCAAGGCTGGTGTGGCCCCATTGCAGG	658	CGGGCGGCCTGGGCCTGGCTGTAGAGGGCCCCTCCGAGGCCAAGATGTCCTGCATGGATAACAAGGACGGCAGCTGCTCGGTCGAGTACATCCCTTATGAGGCTGGCACCTACAGCCTCAACGTCACCTATGGTGGCCATCAAGTGCCAG
330	659	GTGCTGGCATCGGCCCCACCATTCAGATTGGGGAGGAGACGGTGATCACTGTGGACACTAAGGCGGCAGGCAAAGGCAAAGTGACGTGCACCGTGTGCACGCCTGATGGCTCAGAGGTGGATGTGGACGTGGTGGAGAATGAGGACGGCA	660	ACCATGACGGCACGTATACAGTGGCCTACGTGCCAGACGTGACAGGTCGCTACACCATCCTCATCAAGTACGGTGGTGACGAGATCCCCTTCTCCCCGTACCGCGTGCGTGCCGTGCCCACCGGGGACGCCAGCAAGTGCACTGTCACAG
331	661	CTCCTTCCGTCGCCCGTGGGCACGCAGCACGTGTGGAGTGAGAGCGAGGACTGCCTGCCTTTCTTGCAGCTAGCACAGGATTACATCTCCTCCTGCGGCAAGAAGACGCTCCACGAAGTCCTGGAAAAAGTCTTCAAGTCTTTCAGACCT	662	TTACTGGGGCTTCCGGATGCAGATGACGATGCGTTTGAAGAGTACAGTGCTGACGTGGAAGAAGAGGAGCCAGAGGCGGACCACCCCCAGATGGGGGTCAGCCAGCAGTAAATCTGGGGGCTCCCCTGAGAAGGAGAGTGAGCCCCACAG
332	663	GATGCCTTGTGCCGCCTCCTTCCCAGGAGCCCAATAACTTGAAGGCCCGCAATTCCTTCCGCTACAACGGACTGATTCACCGCAAGACTGTGGGCGTGGAGCCGGCAGCCGACGGCAAAGGTGTCGTGGTGGTCATTAAGCGGAGATCCG	664	GCCAGCGGAAGCCTGCCACCTCCTATGTGCGGACCACCATCAACAAGAATGCTCGCGCCACGCTCAGCAGCATCAGACACATGATCCGCAAGAACAAGTACCGCCCCGACCTGCGCATGGTGAGCTGGGGTTTGGGGATCAGGCTTGGGG
333	665	GACTGCACTCCGTGGACGTGACCTATGACGGCAGTCCCGTGCCCAGCAGCCCCTTCCAGGTGCCCGTGACCGAGGGCTGCGACCCCTCCCGGGTGCGTGTCCACGGGCCAGGCATCCAAAGTGGCACCACCAACAAGCCCAACAAGTTCA	666	AGTTCAGTGTGGACGCCCGGGCTCTGACACAGACCGGAGGGCCGCACGTCAAGGCCCGTGTGGCCAACCCCTCAGGCAACCTGACGGAGACCTACGTTCAGGACCGTGGCGATGGCATGTACAAAGTGGAGTACACGCCTTACGAGGAGG
334	667	CTGAACATCTCCTTCCCAGCCACTGGCTGCCAGAAACTCATTGAAGTGGACGATGAACGCAAACTTCGTACTTTCTATGAGAAGCGTATGGCCACAGAAGTTGCTGCTGACGCTCTGGGTGAAGAATGGAAGGTAAAAGTTGACAAATTG	668	CGGAAGTACCGCCCACCCATGCTCACTTCCGCTATCCCGTACTTCTGCTCATCTCGCGAGAACTGAAAGCGCCTATGTGACCTGCGCTAAGCGGAAGTTGGCCCTCTTTTCCGTGGCGCCTCGGAGGCGTTCAGCTGCTTCAAGATGAAG
335	669	TGCTAAAAACCTTGTACCTATGGACCCCAATGGCCTGTCAGATCCCTACGTAAAACTGAAACTGATTCCCGATCCCAAAAGTGAGAGCAAACAGAAGACCAAAACCATCAAATGCTCCCTCAACCCTGAGTGGAATGAGACATTTAGATT	670	TCAGCTGAAAGAATCGGACAAAGACAGAAGACTGTCAGTAGAGATTTGGGATTGGGATTTGACCAGCAGGAATGACTTCATGGGATCTTTGTCCTTTGGGATTTCTGAACTTCAGAAAGCCAGTGTTGATGGCTGGTAAGTAAGATTTTG
336	671	GGGCAGAATGATCTGGAAAAGATGACCAGCATCCTGGAAGCTGTGCCACAGGTTAAGTTTATTTGCCTGGATGTGGCCAATGGGTATTCAGAACATTTTGTGGAATTCGTGAAACTTGTCCGTGCCAAATTTCCTGAACACACCATTATG	672	GCAGGGAACGTGGTGACAGGAGAAATGGTAGAAGAGCTTATTCTTTCCGGAGCAGATATCATCAAAGTGGGAGTTGGACCAGGTAAGACTTGTTAGGAGCACAGCAGAGGACGTGTGTGGGGAAGAATGGGATCTGGGGCTTGCGGGGAC
337	673	GTGTAATCCTGAGAGATTCACATGGTGTTGCACAAGTACGTTTTGTGACAGGCAATAAAATTTTAAGAATTCTTAAGTCTAAGGGACTTGCTCCTGATCTTCCTGAAGATCTCTACCATTTAATTAAGAAAGCAGTTGCTGTTCGAAAGC	674	AAGGAGAGACCGCTGTTCTGCGGCGCCATTCCTGGGTTCTCATCCTAAGGCTGCTTTCTATTCCATAACAGTGGTTGAAGTTGACATCTGACGACGTGAAGGAGCAGATTTACAAACTGGCCAAGAAGGGCCTTACTCCTTCACAGATCG
338	675	CTGAGCTGGCTAGGTGACTGTTGGTTATTCCTGGGACAGGTGCTGGGTAGGCCAGGTTTCAGCATCGCAGACAAGAAGCGCAGGACAGGCTGCATTGGGGCCAAACACAGAATCAGCAAAGAGGAGGCCATGCGCTGGTTCCAGCAGAAG	676	TATGATGGGATCATCCTTCCTGGCAAATAAATTCCCGTTTCTATCCAAAAGAGCAATAAAAAGTTTTCAGTGAAATGTGCAATTCTGTTGTGTGTTCTGTGAAAGGATCCTGGCCATATTCAAGTCCTTGGACCTCAAGCCACTTAAAGC
339	677	TGGTGATGAATACAATGTGGAAAGCATTGATGGTCAGCCAGGTGCCTTCACCTGCTATTTGGATGCAGGCCTTGCCAGAACTACCACTGGCAATAAAGTTTTTGGTGCCCTGAAGGGAGCTGTGGATGGAGGCTTGTCTATCCCTCACAG	678	TACCAAACGATTCCCTGGTTATGATTCTGAAAGCAAGGAATTTAATGCAGAAGTACATCGGAAGCACATCATGGGCCAGAATGTTGCAGATTACATGCGCTACTTAATGGAAGAAGATGAAGATGCTTACAAGAAACAGTTCTCTCAATA
340	679	CCCCTTTCTGCTCAGAAAATCCGTTCTAAAGTAGAGCTGGAAGTGCGTGACCTCCCTGAAGAGTTGTCTCTATCCTTCAATGCCACCTGCCTCAACAATGAGGTCATCCCTGGCCTCAAGTCTTGTATGGGACTCAAGATTGGAGACACG	680	GTGAGCTTCAGCATTGAGGCCAAGGTGCGAGGCTGTCCCCAGGAGAAGGAGAAGTCCTTTACCATAAAGCCCGTGGGCTTCAAGGACAGCCTGATCGTCCAGGTCACCTTTGATTGTGACTGTGCCTGCCAGGCCCAAGCTGAACCTAAT
341	681	TTTTTGTCTAAAAAGAGCTACTGGAAACCTGAAGTGATGATTGCTGCTCAGGGACCACTGAAGGAGACCATTGGTGACTTTTGGCAGATGATCTTCCAAAGAAAAGTCAAAGTTATTGTTATGCTGACAGAACTGAAACATGGAGACCAG	682	GAAATCTGTGCTCAGTACTGGGGAGAAGGAAAGCAAACATATGGAGATATTGAAGTTGACCTGAAAGACACAGACAAATCTTCAACTTATACCCTTCGTGTCTTTGAACTGAGACATTCCAAGGTATGGAAACAATTTGGGGAGTATATT
342	683	TTTGACAATCGTTCTCTGAATGTATTATTTTTCATTTCTAGATAATTCTAAGGCACTGATAGCATTTCTGGCATTTCTGATTATTGTGACATCAATAGCCCTGCTTGTTGTTCTCTACAAAATCTATGATCTACATAAGAAAAGATCCTG	684	CAATTTAGATGAACAGCAGGAGCTTGTTGAAAGGGGTAAGTATGTATATTTTTGCTGATGACTATTCCTTCCCCTGCATTTGAATCCATTCATTTTATTTATTTATTTATTTATATTTATTTTAAGACAGAGTCTCATTCTGTCTCCCAG
343	685	TGCTGAATTCCCATATATTAGGCTACTTGATTATTCACTATTTCACTTGTTTATTTTTCTTTTCCTTAAACAGATGATTATAACCGTGTTGAACTCTCTGAGATAAACGGAGATGCAGGGTCAAACTACATAAATGCCAGCTATATTGAT	686	GGTTTCAAAGAACCCAGGAAATACATTGCTGCACAAGGTAATTTCTTTGATAATCCAATATTCTTTTTGAAAAATTTTTATAGCACTTTTAAGAAAATTTTTCTTATCAGCTTTTATTTGTTTACCTCCTAGGTCCCAGGGATGAAACTG
344	687	TGTATGGTATGTGCAAGTTTGCATGTTTATCTTTGTTTTCAACTTGTTGGTAATACGTTTTATTGTCTTCAATAGGCCGCTGGCCCAACAGGCAAAAATGAAGAAAAAATTCAGGTTCTAACAGACAAAATTGATGTACTTCTGCAACAG	688	ATTGAAGAATTAGGGTCTGAAGGAAAAGTAGAAGAAGCCCAGGGGATGATGAAATTAGTTGAGCAATTAAAAGAAGAGAGAGAACTGCTAAGGTCCACAACGTCGGTGAGTAAACCTTATTTCACATTATCTCATCTGTCTGTTAACAGT
345	689	TCTTTCTTTTATAGGGATGGATCTCAGCAAACGGGAATATTTTGTGCTTTGTTAAATCTCTTAGAAAGTGCGGAAACAGAAGAGGTAGTGGATATTTTTCAAGTGGTAAAAGCTCTACGCAAAGCTAGGCCAGGCATGGTTTCCACATTC	690	GAGCAATATCAATTCCTATATGACGTCATTGCCAGCACCTACCCTGCTCAGAATGGACAAGTAAAGAAAAACAACCATCAAGAAGATAAAATTGAATTTGATAATGAAGTGGACAAAGTAAAGCAGGATGCTAATTGTGTTAATCCACTT
346	691	TCTAAGGTCCACAGCTTTTTTTCACTGTTGACTTTCTAACCATCATCATTTTGGGGGTTTGGCTTTTAGCTGCAGTGTTGTGGTATAAATGGCACGAGTGATTGGACCAGTGGCCCACCAGCATCTTGCCCCTCAGATCGAAAAGTGGAG	692	GGTTGCTATGCGAAAGCAAGACTGTGGTTTCATTCCAATTTCCTGTATATCGGAATCATCACCATCTGTGTATGTGTGATTGAGGTAAGAGCTTAACCACAGGGTTATTGTGAGGATTACATGAGTTAAGTCAGGTAAGATTTCAGAATA
347	693	GTTCTGCCATTACAGGACCAGTAGCAAAGGAGTGTGCAGACTTGTGGCCCCGGATTGCATCCAATGCTGGCAGCATTGCATGATTCTCCAGTATATTTGTAAAAAATAAAAAAAAAAACTAAACCCATTAAAAAGTATTTGTTTGCAGTG	694	CAGGTTAATGACTGCTGTCCTTTTTTCTTCTCTCAGTACATCCAGCAGTGGTCATTCGACAACGAAAGTCATACCGTAGAAAAGATGGCGTGTTTCTTTATTTTGAAGATAATGCAGGAGTCATAGTGAACAATAAAGGCGAGATGAAAG
348	695	AATTGGACAAAAGTTTCTCAATGATTAAGGAGGGTGATTATAACCCCCTCTTCATTCCAGTGGCAGTCATGGTTACTGCATTCTCTGGGTTGGCATTTATCATTTGGCTGGCAAGGAGATTAAAAAAAGGTATGTGAGTTTAACTTCACA	696	GGATCATGAACTGTAGCCATCCCCTGGCCAGCTTCAGCTTTACCTCTGCATGTACCTTCATCTGCTCAGAAGGAACTGAGTTAATTGGGAAGAAGAAAACCATTTGTGAATCATCTGGAATCTGGTCAAATCCTAGTCCAATATGTCAAA
349	697	AATTTACAGAAATACTCCCCTTGGGGAATGAAAAAAGTACTACTGGAGATGGAAGACCAGAAAAACAGCTATGAGCAGAAGGCCAAGGAGTCACTGCAGAAAGTGCTGGAGGAGAAAATGAATGCAGAGCAGCAACTACAGAGCACACAG	698	CGATCCCTGGCCCTGGCAGAGCAGAAGTGTGAAGAGTGGAGGAGCCAGTATGAGGCTCTGAAGGAGGACTGGAGGACCCTTGGGACCCAGCACAGGGAGCTGGAGAGCCAACTCCACGTGCTTCAGTCCAAACTGCAGGTACCAGGCACT
350	699	TTTTTCTCTATGCAGTCAGCTGAAAGAATCGGACAAAGACAGAAGACTGTCAGTAGAGATTTGGGATTGGGATTTGACCAGCAGGAATGACTTCATGGGATCTTTGTCCTTTGGGATTTCTGAACTTCAGAAAGCCAGTGTTGATGGCTG	700	GTTTAAGTTACTGAGCCAGGAGGAAGGCGAGTACTTCAATGTGCCTGTGCCACCAGAAGGAAGTGAGGCCAATGAAGAACTGCGGCAGAAATTTGAGGTGAGGTTTCTTTTCTTTTTCTCTTCTTTCTTTTTTCTCTTTCTTTTTTCCTT
351	701	AGGTCACGTAGACGGCGCGCCCCGCCCCCGTACGCCTAAGTTCTCGCGCGACTCCCACTTCCGCCCTTTTGGCTCTCTGACCAGCACCATGGCGGTTGGCAAGAACAAGCGCCTTACGAAAGGCGGCAAAAAGGGAGCCAAGAAGAAAGT	702	GGTTGATCCATTTTCTAAGAAAGATTGGTATGATGTGAAAGCACCTGCTATGTTCAATATAAGAAATATTGGAAAGACGCTCGTCACCAGGACCCAAGGAACCAGTAAGTAGCTTATTCTTGGTTTGTATTTTCCTTAAGTTGGCGCTTG
352	703	AATGTCTATTAATGTGATTTTTTTTTTTTTTAACCTTTCTCCCAATAGGTTGATGACAACAAGAAACTAGGAGAATGGGTAGGCCTTTGTAAAATTGACAGAGAGGGGAAACCCCGTAAAGTGGTTGGTTGCAGTTGTGTAGTAGTTAAG	704	GACTATGGCAAGGAGTCTCAGGCCAAGGATGTCATTGAAGAGTATTTCAAATGCAAGAAATGAAGAAATAAATCTTTGGCTCACATTCCTCATGTCTGGCTTTTTATTTGGGGCAGTAAAATAAGGTCCCTGTTAGCAAAGTAAAATGTA
353	705	ACCGGCGGGAGGGCTAGCGAGCCAGCGGTGTGAGGCGCGAGGCGAGGCCGAGCCGCGAGCGACATGGGGGACCGGGAGCAGCTGCTGCAGCGGGCGCGGCTGGCCGAGCAGGCGGAGCGCTACGACGACATGGCCTCCGCTATGAAGGCG	706	GTGACAGAGCTGAATGAACCTCTCTCCAATGAAGATCGAAATCTCCTCTCTGTGGCCTACAAGAATGTGGTTGGTGCCAGGCGATCTTCCTGGAGGGTCATTAGCAGCATTGAGCAGAAAACCATGGCTGATGGAAACGAAAAGAAATTG
354	707	GGGAGAGACGTGGGCTGGTGGCACAGCTGACCTTCTGCCATCTCAGGCAGCCGGAGTGGAAATATTCTTAGTGTGCTTTTTTTTTTTTCTTAAGGGTGAGTCAGATGATTCCATTCTCCGATTGGCCAAGGCCGATGGCATCGTCTCAAA	708	GAACTTTTGACTGGAGAGAATCACAGATGTGGAATATTTGTCATAAATAAATAATGAAAACCTACCTGTGCAGGTTCATTCTGTGTCTGTAGGCCCAGGGTTGAGGTTTTGCTGTCAGTGGGTGACGGGTGGGGTAGGGTACCCAGTTAG
355	709	AGCTAATGCTTTCTTCCAGCTGGTTGTCTTCTTGCCTGCCCTGTGTCGTAAAATGGGGGTCCCTTACTGCATTATCAAGGGAAAGGCAAGACTGGGACGTCTAGTCCACAGGAAGACCTGCACCACTGTCGCCTTCACACAGGTGAACTC	710	GGAAGACAAAGGCGCTTTGGCTAAGCTGGTGGAAGCTATCAGGACCAATTACAATGACAGATACGATGAGGTAAGAGGCAGCTTTACACCAAAATACTGTCATTCACAAATCTTTCTCCCAAATAACTGGCTGGCTTAACCTATGAGAAG
356	711	GTTTTTCGTTGGAATATACGTTGCACATTTATGGCGATTCTGAGTGTGAGGGCAGACTTCTGCCAGGCTCAGCACAGCATTTTCGCTGACAAGTGAGCTTGGAGGTTCTATGTGCCATAATTAACATTGCCTTGAAGACTCCTGGACACC	712	CGGGTGTCGCGCGCCGAGGCTGGGGGGGAGTCGTCGCCGCCGCCGCCACCGCTACCGCCGCCGCCGCCGCCGCCGAGGTGACTGAGGAGAGAGGCGCCTCCTCGCTCCCGCCACCGCCGGACTTCAATGCCCAGTCCCCAGCTCGCCAGC
357	713	CCCCTTCAAGGTCAAGGTGCTGCCTACTCATGATGCCAGCAAGGTGAAGGCCAGTGGCCCCGGGCTCAACACCACTGGCGTGCCTGCCAGCCTGCCCGTGGAGTTCACCATCGATGCAAAGGACGCCGGGGAGGGCCTGCTGGCTGTCCA	714	TGCTCTGTCCCTGGGGCTGGGGCCAGGCCTGGTGGAGCCAGTGGACGTGGTAGACAACGCTGATGGCACCCAGACCGTCAATTATGTGCCCAGCCGAGAAGGGCCCTACAGCATCTCAGTACTGTATGGAGATGAAGAGGTACCCCGGAG
358	715	TGTCTCTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTATAAATTATCCTGGAGGAAAGGTTAAGGTGACACATGGAGACTGAGTGTCACCGTTATTTCCGCAGGTCCTCTCTGATGACATGAAGAAGCTGAAGGCCCGAATG	716	CACCAGGCCATAGAAAGATTTTATGATAAAATGCAAAATGCAGAATCAGGACGTGGACAGGTGGGTGGATTTCCCCTCAGGCACCAGGTCACATGTCCCCGCCCCCAGGCACTCCACCCTGTGTGGGGCTCAGGGTGAGAAGGATGAAGA
359	717	CTGCATTTTTCTCCACAGGTGCGGGAGTATGAGTTAAGAAAAAACAACTTCTCAGATACTGGAAACTTTGGTTTTGGGATCCAGGAACACATCGATCTGGGTATCAAATATGACCCAAGCATTGGTATCTACGGCCTGGACTTCTATGTG	718	GTGCTGGGTAGGCCAGGTTTCAGCATCGCAGACAAGAAGCGCAGGACAGGCTGCATTGGGGCCAAACACAGAATCAGCAAAGAGGAGGCCATGCGCTGGTTCCAGCAGAAGGTAAAGCTGATTTATCTCAAGTGAAGTGGTGGAATGTGA
360	719	TCAGCTTGTGATGGGAGAAGATTTTACTAAGTTGCACTGGAAGAGCTGGCTCTTCCCTTCCTCTTCACAGCTTCTCCCCTGCTTTCTAGGAAGATCAGCCCATCTACTTGGCAGTGAAGGGAGTGGTGTTTGATGTCACCTCCGGAAAGG	720	AGTTTTATGGACGAGGAGCCCCCTACAATGCCTTGACGGGGAAGGACTCCACTAGAGGGGTAGCCAAGATGTCCTTGGATCCTGCAGACCTCACCCATGACACTGTGAGCCAGATTATAAGCCTTTGTAAAATCCTCTACCTCCTTGTCC
361	721	TGTTTACAAGTCACCTGGATGTACTCTTTTCTCATTCAGCATGGCCTGTATGAGAAGAAAAAGACCTCAAGAAAGCAACGAAAGGAACGCAAGAACAGAATGAAGAAAGTCAGGGGGACTGCAAAGGCCAATGTTGGTGCTGGCAAAAAG	722	TGAGCTGGAGATTGGATCACAGGTATAATTCAAGCTTTTCATGTAGTCATGTAGATCACTAGACTCCTTGGTGTACTGACGTAGCAATTTAAAAGCAGATCATGTGTAGTACATCTAGAAGTAGATTTACAAATATTCTGAAGAGTTGTA
362	723	TTATCCCTGACTTCCTTCCTTTGTTCCTTCAATATATTCATTAAATATAAGTAAAATACCAATTGAATTTTGTGCTTCTTGAGAATATAGAAACTTATTTTTCCTATTTTCACAGCAATTTAGATGAACAGCAGGAGCTTGTTGAAAGGG	724	ATGATGAAAAACAACTGATGAATGTGGAGCCAATCCATGCAGATATTTTGTTGGAAACTTATAAGAGGAAGATTGCTGATGAAGGAAGACTTTTTCTGGCTGAATTTCAGGTGTGTGTTGCTTTTGTTATATGATGATAAATTCGACATC
363	725	GACACATGTAACTAGTATTGAATCTTTAATATGTTTCCAGATGATGAAAAACAACTGATGAATGTGGAGCCAATCCATGCAGATATTTTGTTGGAAACTTATAAGAGGAAGATTGCTGATGAAGGAAGACTTTTTCTGGCTGAATTTCAG	726	AGCATCCCGCGGGTGTTCAGCAAGTTTCCTATAAAGGAAGCTCGAAAGCCCTTTAACCAGAATAAAAACCGTTATGTTGACATTCTTCCTTGTGAGTATTTATTGAGTGCTGAATTCCCATATATTAGGCTACTTGATTATTCACTATTT
364	727	TCCACCTAAACCCACTGTGTTCATCTCTGGGGTCATCGCCCGGGTAAGTCTGGGAGTGTCTGCGGTGGGTTTGAGGCTTTTGCATGGCAGCATGGAGTCTCCTGGTTGCTTCTGGTTTTGTTAAACTCTACCTGGAATAACCCAGCACCA	728	CCACAGGCAGCCCCATTTCCACATTAATCCCACACTCTCTGTTTTCATTTCAGTGAAAGCTGGTGGAATGCGAATTGTGCAGAAACACCCACATACAGGAGACACCAAAGAAGAGAAAGACAAGGATGACCAGGAATGGGAAAGCCCCAG
365	729	GCCCCGGAGAGGCCCCTGGTGGGTGTCAATGGGCTGGATGTGACCAGCCTGAGGCCCTTTGACCTTGTCATCCCCTTCACCATCAAGAAGGGCGAGATCACAGGTGAGTGGGGACTTGGGAAGGAGCTCGGGAGCCAAGGAGGCCAGACT	730	TGGGGCCCCTCTGTGACAACAGACTCTCCAGCAGCTCTCTGCTTTGCCCTGCAGGCTCTGGCTGGGGACCAGCCCTCGGTGCAGCCCCCTCTACGGTCTCAGCAGCTGGCCCCACAGTACACCTACGCCCAGGGCGGCCAGCAGACTTGG
366	731	GCCGCCCCGCGCAGGCGCCCCCGCCCCGCCGTCGCCGCCGCCGCAGCCAGGAGCCGCTGCACCATGCCCCGCATAGATGCGGACCTCAAGCTCGACTTCAAGGATGTCCTGCTCCGACCTAAGCGGAGCAGCCTCAAGAGCCGAGCCGAG	732	GTGGATCTTGAACGCACCTTCACGTTTCGAAATTCAAAGCAGACCTACTCAGGGATTCCCATCATCGTGGCCAACATGGACACTGTGGGCACGTTTGAGATGGCAGCCGTGATGTCACAGGTGAGGCGGTAGGCTTTTGTTTTTTCCCTT
367	733	GCGCTCCCAGAGTGTCTGAGAGACCATCATAAGGGCTTTCTTTCCTGACAGGGTGACCTGTTGACCAAAACACAGGAGCTGGGCCGTGACTACAGGACCTGTCTGACGATAGTCCAAAAACTGAAGAAGATGGTGGATAAGCCCACCCAG	734	AGAAGTGTTTCCAATGCTGCGACCCGGGTGTGTAGGACGGGGAGGTCACGATGGCGCGACGTCTGCAGAAATTTCATGAGGAGGTATCAGTCTAGAGTTACCCAGGGCCTCGTGGCCGGAGAAACTGCCCAGCAGATCTGTGAGGACCTC
368	735	TGTTTTTTTTATATCATGTGATTGTTTGTGTGTCCCCTTTCCTCTTCTTTGCTTAACACAATTATCTTGTGTTAAGGATCTCAAAGATTTCATGAGACAAGCTGGGGAAGTAACGTTTGCGGATGCACACCGACCTAAATTAAATGAAGG	736	GGTGGTTGAGTTTGCCTCTTATGGTGACTTAAAGAATGCTATTGAAAAACTTTCTGGAAAGGAAATAAATGGGAGAAAAATAAAATTAATTGAAGGCAGCAAAAGGCACAGGTATCTCTAATTTTTTAAAGTCAAAAGTTGTATTTAATG
369	737	TTTCTCTCTCTTCCTCCTCTCCGCTTTCCTTCTTCCCTTCCTCCCACCCTGATTTTCTCTTTTGCAGTTTGCTGCTTTGTGGTGCACAAGCGGTGCCATGAATTTGTCACATTCTCCTGCCCTGGCGCTGACAAGGGTCCAGCCTCCGAT	738	GACCCCCGCAGCAAACACAAGTTTAAGATCCACACGTACTCCAGCCCCACGTTTTGTGACCACTGTGGGTCACTGCTGTATGGACTCATCCACCAGGGGATGAAATGTGACAGTAAGTACTTTTTCTCTCTGGGGGCATCTGCTGATGGC
370	739	CCCTTTCCCCCCTAGCGTCTGACCAAACACACCAAGTTCGTGCGGGACATGATTCGGGAGGTGTGTGGCTTTGCCCCGTACGAGCGGCGCGCCATGGAGTTACTGAAGGTCTCCAAGGACAAACGGGCCCTCAAATTTATCAAGAAAAGG	740	GTGGGGACGCACATCCGCGCCAAGAGGAAGCGGGAGGAGCTGAGCAACGTACTGGCCGCCATGAGGAAAGCTGCTGCCAAGAAAGACTGAGCCCCTCCCCTGCCCTCTCCCTGAAATAAAGAACAGCTTGACAGAAGCCCTGGCTCTCCT
371	741	ATAACTGGAGTGCCAAGGCTAAAAGACGAAATACCACCGGAACTGGTCGAATGAGGCACCTAAAAATTGTATACCGCAGATTCAGGTACAGTTTGTATGTTCGATCATAATTGGTCCAGTGGGCTTGAATGAAACCCTCGTGTTTACTTG	742	CCTTTAATGTGCAGACGAAGGGAACGTCATCGTTTGGAAAGCGTCGCAATAAGACGCACACGTTGTGCCGCCGCTGTGGCTCTAAGGCCTACCACCTTCAGAAGTCGACCTGTGGCAAATGTGGCTACCCTGCCAAGCGCAAGAGAAAGT
372	743	TTCACAATCACAAAATGATGGATCTGAAGCAATTCCTCTAACTCACAATTTTTCCTGTTAATGAGTAATTGAATGTTCAGCAAATGACATATCTCTGCATGTGTTTTCAATAGGGTTTCAAAGAACCCAGGAAATACATTGCTGCACAAG	744	GTCCCAGGGATGAAACTGTTGATGATTTCTGGAGGATGATTTGGGAACAGAAAGCCACAGTTATTGTCATGGTCACTCGATGTGAAGAAGGAAACAGGGTAAGAACCAAGAAGATTCATAGTGTGGGTCTTGGGGTTAGGAAAACAAGGT
373	745	TTCCCATGTGGGGAACCCAGTCCTGCTGTGACTCTGGGAGGGAGAGGGCCGGGGATACAATCGTACATTCCTGGTAACAGCCCTGTGATTGTCTGCTTCAGGTTATCAGTGAGCTGAATGGAAAAAACATTGAAGACGTCATTGCCCAGG	746	GTATTGGCAAGCTTGCCAGTGTACCTGCTGGTGGGGCTGTAGCCGTCTCTGCTGCCCCAGGCTCTGCAGCCCCTGCTGCTGGTTCTGCCCCTGCTGCAGGTAAGTGGTGGCCTGGTGAGTGGGCAAGGGGCTGGGGCTCAGACGGTGTTG
374	747	GACATCCTGGTGGTCCTGCTCTCAGTGATGGGGGCCATTCTGCTCATTGGCCTTGCCGCCCTGCTCATCTGGAAACTCCTCATCACCATCCACGACCGAAAAGAATTCGCTAAATTTGAGGAAGAACGCGCCAGAGCAAAATGGGACACA	748	GCCAACAACCCACTGTATAAAGAGGCCACGTCTACCTTCACCAATATCACGTACCGGGGCACTTAATGATAAGCAGTCATCCTCAGATCATTATCAGCCTGTGCCACGATTGCAGGAGTCCCTGCCATCATGTTTACAGAGGACAGTATT
375	749	GCCAACAGAGCACTTATGGCAAGGCATCTCGAGGGGGTGGCAATCACCAAAACAATTACCAGCCATACTAAAGGAGAACATTGGAGAAAACAGGTGTGTATAAGAGTACAGGAAAACAGTAGAAATGTCTAATTTAATTTAAAGATCAAT	750	AAGGATTTAATAACTATTATGATCAAGGATATGGAAATTACAATAGTGCCTATGGTGGTGATCAAAACTATAGTGGCTATGGCGGATATGATTATACTGGGTATAACTATGGGAACTATGGATATGGACAGGGATATGCAGACTACAGTG
376	751	AGTTAAGCACAAAGGAAAACATTTCAATAAAGGATCATTTGACAACTGGTGGATTTTCTGGTGTGGCGTCTTCCTTGAGGGAGCTAGCTCCTTTGTGGGGTGGTCAGTGGGGTCAGGGTGGCAGAACCTGTGGAGAAGTAACAAGCACCT	752	GCCAGCACCTCCAATGCCACCATTTCTTTACTTAAAGGAACCATTAAAGAGATCCTGGGGACTGCCCAGTCAGTGGGCTGTAATGTTGATGGCCGCCATCCTCATGACATCATCGATGACATCAACAGTGGTGCTGTGGAATGCCCAGCC
377	753	ACGCAGTAAAACGCAGGACTCTTCCCGCTTGGATTCGCGAAGGTCTTGAAAAAATGGAACGTGAAAAGCAGAAGAAATTGGAGAAAGAAAGAATGGAACAACAACGTTCACAATTGTCCAAAAAAGAAAAAAAGGCCACAGAAGATGCTG	754	CGCAAGGTGGATTTCATCCTCCTTATTGGCAACCAGGACCTCCAGGACCTCCAGCACCTCCCCAGAATCGAAGAGAAAGGCCATCATCATTCAGGGATCGTCAGCGTTCACCTATTGCACTTCCTGTGAAGCAGGAGCCTCCACAAATTG
378	755	CTTTGTTACATGGTTAATTTATGTCAAAAGTATCATAGGCTAAGACATCAAAGTTTTAATAACATTCTTTTTTCTTTAAGGGGTTTGTTAAAGTTGTTAAGAATAAGGCCTACTTTAAGAGATACCAAGTGAAATTTAGAAGACGACGAG	756	AGGGTAAAACTGATTATTATGCTCGGAAACGCTTGGTGATACAAGATAAAAATAAATACAACACACCCAAATACAGGATGATAGTTCGTGTGACAAACAGAGATATCATTTGTCAGGTAAGTTGTATTCTAGACAGTCCCCTTTTTTTAT
379	757	TTTTTCCAGCTACTCAGCTGCTTAAGCTGGCCCACAAGTACAGACCAGAGACAAAGCAAGAGAAGAAGCAGAGACTGTTGGCCCGGGCCGAGAAGAAGGCTGCTGGCAAAGGGGACGTCCCAACGAAGAGACCACCTGTCCTTCGAGCAG	758	GAGTTAACACCGTCACCACCTTGGTGGAGAACAAGAAAGCTCAGCTGGTGGTGATTGCACACGACGTGGATCCCATCGAGGTGCGTTTGCCTGTTGACTGCTAACCCAAGGGCTTCTGGCAGTACCAGGAAGAGAGAGTAGACCTAATGC
380	759	ATATGCTAGTCTGTATTTTTGCTGTGCTATTGAGGATCAGGACAATGAACTAATTACCCTGGAAATAATTCATCGTTATGTGGAATTACTTGACAAGTATTTCGGCAGTGTGAGTAGTATTTTATTTTAGGAAATTGAATGCCATAGTAT	760	GGGAAAGCTTCGACTGCAAAAATGGTATGTCCCACTATCAGACAAAGAGAAGAAAAAGATCACAAGAGAACTTGTTCAGACCGTTTTAGCACGGAAACCTAAAATGTGCAGCTTCCTTGAGTGGCGAGATCTGAAGATTGTTTACAAAAG
381	761	GCTATGGTGGGCTCAGCCTGTCCATTGAGGGCCCCAGCAAGGTGGACATCAACACAGAGGACCTGGAGGACGGGACGTGCAGGGTCACCTACTGCCCCACAGAGCCAGGCAACTACATCATCAACATCAAGTTTGCCGACCAGCACGTGC	762	ATGGCCAGCACGTGGCCAGCAGCCCCATCCCGGTGGTGATCAGCCAGTCGGAAATTGGGGATGCCAGTCGTGTTCGGGTCTCTGGTCAGGGCCTTCACGAAGGCCACACCTTTGAGCCTGCAGAGTTTATCATTGATACCCGCGATGCAG
382	763	CTGACGCTGGCTCCTTCTGTTGTTTCTCTTGGCTCCAGGACCCCCGCAGCAAACACAAGTTTAAGATCCACACGTACTCCAGCCCCACGTTTTGTGACCACTGTGGGTCACTGCTGTATGGACTCATCCACCAGGGGATGAAATGTGACA	764	CCTGCATGATGAATGTGCACAAGCGCTGCGTGATGAATGTTCCCAGCCTGTGTGGCACGGACCACACGGAGCGCCGCGGCCGCATCTACATCCAGGCCCACATCGACAGGGACGTCCTCATTGTCCTCGGTAGGTGGCCCTGGGGCTCCA
383	765	CGGCAGGGTCCGCCCGGGCCGGCAGCGTCCGCCCGGCGGCGGGAGGAGGGAGCGGCGCAGACAAAGAGCGGCGCCTGGGCGGGCGCAGCGCGGCCACCGCCCCGGGACCCGCGCCGCTGCCCTCCGGCTCCGCGGGCGGCCCACGGCGAG	766	ATTTCATGTGTTCTTTGTATACAAGCGACGTCCCAGATTATAATTCTCTGCTGAGATTTGAGTTGGATTTGAGGATTTGGAGAATCCCTGCAGCTTTGTAACTTCAGAGGTGTAATTAGCTGAAAACATCATCGTTTTGAAGAGTTCTGC
384	767	CTCACTCGCTCCCCTCTCGTCCGCAGCCGCAGGGCCGTAGGCAGCCATGGCGCCCAGCCGGAATGGCATGGTCTTGAAGCCCCACTTCCACAAGGACTGGCAGCGGCGCGTGGCCACGTGGTTCAACCAGCCGGCCCGTAAGATCCGCAG	768	ACGTAAGGCCCGGCAAGCCAAGGCGCGCCGCATCGCCCCGCGCCCCGCGTCGGGTCCCATCCGGCCCATCGTGCGCTGCCCCACGGTTCGGTACCACACGAAGGTGCGCGCCGGCCGCGGCTTCAGCCTGGAGGAGCTCAGGGTGAGTAC
385	769	AGGGTGGTTTTCCTGAAGCAGCTGGCTAGTGGCTTATTACTTGTGACTGGTAAGAAAATCCTTGGATTGTGATGTTCTGTGAAACTTCCATTTTTAAATGCTTGCAGTATACACGTTTGTTTGCTACTGCCTACATGGTAGACACTTATT	770	CCACAGCCTAGATATTATCCTACTGAAGATGTGCCTCGAAAGCTGTTGAGCCACGGCAAAAAACCCTTCAGTCAGCACGTGAGAAAACTGCGAGCCAGCATTACCCCCGGGACCATTCTGATCATCCTCACTGGACGCCACAGGGGCAAG
386	771	AAGACAGCGACAGCTGTGGCGCACTGCAAACGCGGCAATGGTCTCATCAAGGTGAACGGGCGGCCCCTGGAGATGATTGAGCCGCGCACGCTACAGTACAAGGTGCTGGGATCCGGCACCGGCGTTGAGTGGATGGAGGACTCTTGGAGA	772	AGGCGCCTGCGCAGACCCTGAAAAGCGGCCAGGGTGGCCCCTAGCTTTCCTTTTCCGGTTGCGGCGCCGCGCGGTGAGGTTGTCTAGTCCACGCTCGGAGCCATGCCGTCCAAGGGCCCGCTGCAGTCTGTGCAGGTCTTCGGACGCAAG
387	773	TGCACAAATAATCACTTCAAGGTCCTGCTTTCAATTCTTGTGTCTACTCCCAAATTTTGAAAGTGCTTAATGTCTTGACATTTCATTTGTAGTGATGATGATGATGATTTTGATGATGAGGAAGCTGAAGAAAAAGCGCCAGTGAAGAAA	774	TCTATACGAGATACTCCAGCCAAAAATGCACAAAAGTCAAATCAGAATGGAAAAGACTCAAAACCATCATCAACACCAAGATCAAAAGTAAGTGGCTACATTTACACGTGGGTCTCATTGATCTAGTTGGGGAAAAAGATTCTACTGTGG
388	775	CTTTAGGAAATTGAAGTTGGTGGTGGTCGGAAAGCTATCATAATCTTTGTTCCCGTTCCTCAACTGAAATCTTTCCAGAAAATCCAAGTCCGGCTAGTACGCGAATTGGAGAAAAAGTTCAGTGGGAAGCATGTCGTCTTTATCGCTCAG	776	AGGAGAATTCTGCCTAAGCCAACTCGAAAAAGCCGTACAAAAAATAAGCAAAAGCGTCCCAGGAGGTGAGTATTTTAGTAGTTTCAGAAATGTGTGTACCCCTCTTATTAACAACTCTTAATTTGTTTAAGTTGTAGTTTATGAAAACAG
389	777	GTGACGACTCCATGCGTATGTCCCACCTAAAGGTCGGCTCTGCTGCCGACATCCCCATCAACATCTCAGAGACGGATCTCAGCCTGCTGACGGCCACTGTGGTCCCGCCCTCGGGCCGGGAGGAGCCCTGTTTGCTGAAGCGGCTGCGTA	778	GCCCGTCCAAAGCAGAAATCAGCTGCACTGACAACCAGGATGGGACATGCAGCGTGTCCTACCTGCCTGTGCTGCCGGGGGACTACAGCATTCTAGTCAAGTACAATGAACAGCACGTCCCAGGCAGCCCCTTCACTGCTCGGGTCACAG
390	779	GCAGCCCCTTCTCTGTGAAGGTGACAGGCGAGGGCCGGGTGAAAGAGAGCATCACCCGCAGGCGTCGGGCTCCTTCAGTGGCCAACGTTGGTAGTCATTGTGACCTCAGCCTGAAAATCCCTGGTAGGGGCTGTGGGAAGCCTGGGGAGG	780	ATGGTGGGCTCAGCCTGTCCATTGAGGGCCCCAGCAAGGTGGACATCAACACAGAGGACCTGGAGGACGGGACGTGCAGGGTCACCTACTGCCCCACAGAGCCAGGCAACTACATCATCAACATCAAGTTTGCCGACCAGCACGTGCCTG
391	781	CTACCTTAGGTGTTTCATCAGTACAGACGCCTCACCTTCCCACGCACGCAGACTCGCAGACGCCCTCTGCTGGAACTGACACGCAGACATTCAGCGGCTCCGCCGCCAATGCAAAACTCAACCCTACCCCAGGCAGCAATGCTATCTCAG	782	ATGTCCCAGGAGAGAGGAGTACAGCCAGCACCTTTCCTACAGACCCAGTTTCCCCATTGACAACCACCCTCAGCCTTGCACACCACAGCTCTGCTGCCTTACCTGCACGCACCTCCAACACCACCATCACAGCGAACACCTCAGGTCTGA
392	783	TCTCTCAAGTCCCGAGGCTACGTGAAGGAACAGTTTGCCTGGAGACATTTCTACTGGTACCTTACCAATGAGGGTATCCAGTATCTCCGTGATTACCTTCATCTGCCCCCGGAGATTGTGCCTGCCACCCTACGCCGTAGCCGTCCAGAG	784	ATGTTGATGCCTAAGAAGAACCGGATTGCCATTTATGAACTCCTTTTTAAGGAGGGAGTCATGGTGGCCAAGAAGGATGTCCACATGCCTAAGCACCCGGAGCTGGCAGACAAGAATGTGCCCAACCTTCATGTCATGAAGGCCATGCAG
393	785	TACATCCAGCAGTGGTCATTCGACAACGAAAGTCATACCGTAGAAAAGATGGCGTGTTTCTTTATTTTGAAGATAATGCAGGAGTCATAGTGAACAATAAAGGCGAGATGAAAGGTAGGAAATCAGTCCAGCTTGTTCCTTAGGTCTCTG	786	TTTATTTACATTCTTTTGTAGGAGCCAAAAACCTGTATATCATCTCCGTGAAGGGGATCAAGGGACGGCTGAACAGACTTCCCGCTGCTGGTGTGGGTGACATGGTGATGGCCACAGTCAAGAAAGGCAAACCAGAGCTCAGAAAAAAGG
394	787	CGTCGCGTCCTCTCCGCCCGCCTCAGGATGCGCTACGTCGCCTCCTACCTGCTGGCTGCCCTAGGGGGCAACTCCTCCCCCAGCGCCAAGGACATCAAGAAGATCTTGGACAGCGTGGGTATCGAGGCGGACGACGACCGGCTCAACAAG	788	GTTATCAGTGAGCTGAATGGAAAAAACATTGAAGACGTCATTGCCCAGGGTGAGTTGATGTGGACGGGCTTTCGTTTGTTTTCATGGTCCATCCTAATCCCTGCCGGTCCATCTGTGGCCTGCCAGGTTTCGCTTGTGGACCAGAGCACC
395	789	GTGAATGTGGGAGCTGGCAGCCACCCCAACAAGGTCAAAGTATACGGCCCCGGAGTAGCCAAGACAGGGCTCAAGGCCCACGAGCCCACCTACTTCACTGTGGACTGCGCCGAGGCTGGCCAGGGTAAGGCCTGGCTGTGGGTGGGAGGG	790	TGACAGGACAATGAAGGCTGCCCTGTGGAGGCGTTGGTCAAGGACAACGGCAATGGCACTTACAGCTGCTCCTACGTGCCCAGGAAGCCGGTGAAGCACACAGCCATGGTGTCCTGGGGAGGCGTCAGCATCCCCAACAGCCCCTTCAGG
396	791	CTAGCCAAAATGTACAAGACCACACCGGATGTCATCTTTGTATTTGGATTCAGAACTCATTTTGGTGGTGGCAAGACAACTGGCTTTGGCATGATTTATGATTCCCTGGATTATGCAAAGAAAAATGAACCCAAACATAGACTTGCAAGA	792	CATGGCCTGTATGAGAAGAAAAAGACCTCAAGAAAGCAACGAAAGGAACGCAAGAACAGAATGAAGAAAGTCAGGGGGACTGCAAAGGCCAATGTTGGTGCTGGCAAAAAGGTATAGTTCATTAAGGAAAATATAGAAACGTCATTAATT
397	793	ATCCGGAAGATGAAGCTTCCTGGCCGGGAAAACAAGACGGCCGTGGTTGTGGGGACCATAACTGATGATGTGCGGGTTCAGGAGGTACCCAAACTGAAGGTGAGCTGGCGGGGGCTGGGCAGACCCATCAGACCCTTGCTGTACTGTGCT	794	AGCAGGCTGTCCCAGCTTCTCACTGTCTTCCCGTCCCTCCAGTTATACAGGTTTCTGGCCAGAAGAACCAACTCCACATTCAACCAGGTTGTGTTGAAGAGGTTGTTTATGAGTCGCACCAACCGGCCGCCTCTGTCCCTTTCCCGGATG
398	795	GCTTCTCGGTGGAAGGGCCATCGCAGGCTAAGATCGAATGTGACGACAAGGGCGACGGCTCCTGTGATGTGCGCTACTGGCCGCAGGAGGCTGGCGAGTATGCCGTTCACGTGCTGTGCAACAGCGAAGACATCCGCCTCAGCCCCTTCA	796	CTCGCATTTGCAGTCCCTTCGAAGTGAAGGTGGGCACCGAGTGTGGCAATCAGAAGGTACGGGCCTGGGGCCCTGGGCTGGAGGGCGGCGTCGTTGGCAAGTCAGCAGACTTTGTGGTGGAGGCTATCGGGGACGACGTGGGCACGCTGG
399	797	CAGCTGAGGCGGCTGGAGGCGGAGGAGCGAGCGACGCTGCAGAGACTGCGGGAGAGCAAGAGCCGGCTGGTCCAGCAGAGCAAGGCCCTGAAGGAGCTGGCGGATGAGCTGCAGGAGAGGTGCCAGCGCCCGGCCCTGGGTCTGCTGGAG	798	GGTGTGAGAGGAGTCCTGAGCAGGTATGTGTGCTTTCTGAATTGGTGAAGGGATTGGGAGAGGCAGAGGAGCTGGTGGAGAACCCTGCTGACTTCTGTGGTTTCTGTGCTCTTCCCAGAAGTAAGGCTGTCACAAGGCTGGAAGCAGAGA
400	799	ACGAGCGGCTGTGGTTGCTGGACGACTCCAAGACGTGGTGGCGGGTGAGGAACGCGGCCAACAGGACGGGCTATGTACCGTCCAACTACGTGGAGCGGAAGAACAGCCTGAAGAAGGGCTCCCTCGTGAAGAACCTGAAGGACACACTAG	800	GCCTCGGCAAGACGCGCAGGAAGACCAGCGCGCGGGATGCGTCCCCCACGCCCAGCACGGACGCCGAGTACCCCGCCAATGGCAGCGGCGCCGACCGCATCTACGACCTCAACATCCCGGCCTTCGTCAAGTTCGCCTATGTGGCCGAGC
401	801	ATTGAGGAATTTTCTAAAGGTATCTCTCTCGGTGTATTTCTCTACTTACCTGTAATAATGCTTTTGTCTTAATAGGGTGGTTCTCTTCCCAAAGTGGAAGCCAAATTCATCAATTATGTGAAGAATTGCTTCCGGATGACTGACCAAGAG	802	GCTATTCAAGATCTCTGGCAGTGGAGGAAGTCTCTTTAAGAAAATAGTTTAAACAATTTGTTAAAAAATTTTCCGTCTTATTTCATTTCTGTAACAGTTGATATCTGGCTGTCCTTTTTATAATGCAGAGTGAGAACTTTCCCTACCGTG
402	803	GTGACAAGACCACCTTCCAGCTACAGGTTCGCCAGGTGGAGGACTATCCTGTGGACCTGTACTACCTGATGGACCTCTCCCTGTCCATGAAGGATGACTTGGACAATATCCGGAGCCTGGGCACCAAACTCGCGGAGGAGATGAGGAAGC	804	TCAAAAATGGCTGTGGAGGTGAGATAGAGAGCCCAGCCAGCAGCTTCCATGTCCTGAGGAGCCTGCCCCTCAGCAGCAAGGGTTCGGGCTCTGCAGGCTGGGACGTCATTCAGATGACACCACAGGAGATTGCCGTGAACCTCCGGCCCG
403	805	AGGTGGACGTTGGCAAAGACCAGGAGTTCACAGTCAAATCAAAGGGTGCTGGTGGTCAAGGCAAAGTGGCATCCAAGATTGTGGGCCCCTCGGGTGCAGCGGTGCCCTGCAAGGTGGAGCCAGGCCTGGGGGCTGACAACAGTGTGGTGC	806	AAATACCCCCTTCCCTTCTGCACCCTTCCCAGGGTCCAGTAGGCGTCAATGTCACTTATGGAGGGGATCCCATCCCTAAGAGCCCTTTCTCAGTGGCAGTATCTCCAAGCCTGGACCTCAGCAAGATCAAGGTGTCTGGCCTGGGAGAGA
404	807	GGGGCCTGTCTCTGGCCATTGAGGGCCCGTCCAAAGCAGAAATCAGCTGCACTGACAACCAGGATGGGACATGCAGCGTGTCCTACCTGCCTGTGCTGCCGGGGGACTACAGCATTCTAGTCAAGTACAATGAACAGCACGTCCCAGGCA	808	AGGCCCTTCTTCCTGCCTCAGGAAGCCCCTTGCAGTTCTATGTGGATTACGTCAACTGTGGCCATGTCACTGCCTATGGGCCTGGCCTCACCCATGGAGTAGTGAACAAGCCTGCCACCTTCACCGTCAACACCAAGGATGCAGGAGAGG
405	809	CCACAGATAAGCTACACCGGGCCCTCGTCCAGCGGGCGCTTCGCGGGCAGAGAGTGGTACTACGGGAACGTGACGCGGCACCAGGCCGAGTGCGCCCTCAACGAGCGGGGCGTGGAGGGCGACTTCCTCATTAGGGACAGCGAGTCCTCG	810	CCCAGCGACTTCTCCGTGTCCCTTAAAGCGTCAGGGAAGAACAAACACTTCAAGGTGCAGCTCGTGGACAATGTCTACTGCATTGGGCAGCGGCGCTTCCACACCATGGACGAGCTGGTGGAACACTACAAAAAGGCGCCCATCTTCACC
406	811	TACAGGCAGAGGCTGGCTTTGAGGATTGGTGTTTCCCAAACCTGGGGGAGTGGTTTGTGACCCTTCTTCTCTTTCTAGGTTGACAAGGTCACAGGCAGGTTTAATGGCCAGTTTAAAACTTATGCTATCTGCGGGGCCATTCGTAGGATG	812	GGTGAGTCAGATGATTCCATTCTCCGATTGGCCAAGGCCGATGGCATCGTCTCAAAGTAAGGTTGGGGGCTCACATTTGGGCAGAGTGAGTGGACTAGGACTGCTCCAGAGGCGTGGTCTTAACGTTGTCCTTTTCCCCTGGTTCTAGGA
407	813	ATAATCTGCCACTCTTGGCAGGGAGCTCACTCAGTGGGTTTGATGTGGTGGATGCTGGCTCGGGAAGTTCTGCGCATGCGTGGCACCATTTCCCGTGAACACCCATGGGAGGTCATGCCTGATCTGTACTTCTACAGAGATCCTGAAGAG	814	ATTGAAAAAGAAGAGCAGGCTGCTGCTGAGAAGGCAGTGACCAAGGAGGAATTTCAGGGTGAATGGACTGCTCCCGCTCCTGAGTTCACTGCTACTCAGCCTGAGGTTGCAGACTGGTCTGAAGGTGTACAGGTGCCCTCTGTGCCTATT
408	815	ACAGCTTTGTTTGCACTGTTGTTGGGGTCAGGGACAGTGATTAAGATAAATTTCTAATTGCAGTCTATACGAGATACTCCAGCCAAAAATGCACAAAAGTCAAATCAGAATGGAAAAGACTCAAAACCATCATCAACACCAAGATCAAAA	816	GGACAAGAATCCTTCAAGAAACAGGAAAAAACTCCTAAAACACCAAAAGGACCTAGTTCTGTAGAAGACATTAAAGCAAAAATGCAAGCAAGTATAGAAAAAGTGAGTAAAGTTATCTTAAAAAAACTTTGTCTCCCCCCTCAAATTGCA
409	817	TGCAATAAGCCAATATTTACATTTTAAAGGAGTTTTTCTGTTTTTTTTTTTTTTTTCAGAGACTTCCTTCATATAGGAGCTGGAGGACACAGCACATTGGAAATCAAGAAGAAAATAAAAGTAAAAACAGGAATTCTAATGTCATCCCAT	818	ATGACTATAACAGAGTGCCACTTAAACATGAGCTGGAAATGAGTAAAGAGAGTGAGCATGATTCAGATGAATCCTCTGATGATGACAGTGATTCAGAGGAACCAAGCAAATACATCAATGCATCTTTTATAATGGTAGGTACTTAAATTG
410	819	GTACACGGTCCTCTTCTCGCACGGCAATGCCGTGGACCTGGGCCAGATGAGCAGCTTCTACATTGGCCTGGGCTCCCGCCTCCACTGCAACATCTTCTCCTACGACTACTCCGGCTACGGTGCCAGCTCGGGCAGGCCTTCCGAGAGGAA	820	CGCACCCGGGCGCTGGAAGCTGCACCTGACGGAGCGTGCCGACTTCCAGTACAGCCAGCGCGAGCTGGACACCATCGAGGTCTTCCCCACCAAGAGCGCCCGCGGCAACCGCGTCTCCTGCATGTATGTTCGCTGCGTGCCTGGTGCCAG
411	821	CTTGAACTCACCTGCTTTTTACCATGTCTCCTCTGCTGGAATGTGCCTGCCCAGCTGAATGAGTATGTGGCTAAGGGTCTGACCGACAGCATCCACCGTTACCACTCAGACAATAGCACCAAGGCAGCGTGGGACTCCATCCAGTCATTT	822	CTGCAGTGTTGTGGTATAAATGGCACGAGTGATTGGACCAGTGGCCCACCAGCATCTTGCCCCTCAGATCGAAAAGTGGAGGTAATTTTGTCGGCAATGTTTCTGTTATTGACCTCTTTGTTTAAATGTTTAATTACCTCGGAAACTGCA
412	823	CAGGAGATTGAGCGGGAGCTGCGTGCTGCACCCCCAGCCCCCAACGCCCCTGCCGCTGGGGAGGACACCACTGAAACCGCCCCCGCACCAGGGACTCCTGCCCGCGGCCCCCGCATGACACCCAGCGACCTGCGCAACCTCGACGAGCTG	824	GTGAGGGAGATTCTGGGCCGCTGCACCTGCCCTGACCAGTTTCCCATGATCAAGGTCTCAGAGGGGAAGTACCGTGTGGGGGACTCGAGCCTGCTCATCTTTGTGCGGGTAAGGGCCTGGGGCCGCCCCAGCGGGCAGCAGCCAAGGTGG
413	825	TCGACATTACTCTGAAGGGACGCACAGTTATCGTGAAGGGCCCCAGAGGAACCCTGCGGAGGGACTTCAATCACATCAATGTAGAACTCAGCCTTCTTGGAAAGAAAAAAAAGAGGGTGAGGGTTTTTCTTCTGATAATTCAGTTGCTCG	826	AACTTCCGCCTGGCAGTCTCCAGTAGGAGTGGAGCTCTGTGCGGCGTAGTTTGGTGGAAAAACGGGCCTTGCGTCGGCCTCACCCCCAGTGTTTGTGTTTCAGAATGAAGACTATTCTCAGCAATCAGACTGTCGACATTCCAGAAAATG
414	827	GACTTCGGCAGTCTGTCCAACCTTCAGGTCACTCAGCCTACAGTTGGGATGAATTTCAAAACGCCTCGGGGACCTGTTTGAATTTTTTCTGTAGTGCTGTATTATTTTCAATAAATCTGGGACAACAGCCTTGCCTGTGTCATCTTTGCA	828	ATTTAAGAACCTGGGGAGAGGAGGAGGAGAGGTGAGTGATAATCTCATTGATTGGTATTTTGACCCTACCTCGTTTCCTTGTAGGTCTCAGCCTTGGATCAGGAGATTATTGAAGTAGATCCTGACACTAAGGAAATGCTGAAGCTTTTG
415	829	TGACCCCAGGACCTCCCTGACCCCCAACCAGGCCAGCGGAAGCCTGCCACCTCCTATGTGCGGACCACCATCAACAAGAATGCTCGCGCCACGCTCAGCAGCATCAGACACATGATCCGCAAGAACAAGTACCGCCCCGACCTGCGCATG	830	GCAGCCATCCGCAGGGCCAGCGCCATCCTGCGCAGCCAGAAGCCTGTGATGGTGAAGAGGAAGCGGACCCGCCCCACCAAGAGCTCCTGAGCCCCCTGCCCCCAGAGCAATAAAGTCAGCTGGCTTTCTCACCTGCCTCGACTGGGCCTC
416	831	GGCAAGAAGTACAAGCCCCTGGACCTGCGGCCTAAGAAGACACGTGCCATGCGCCGCCGGCTCAACAAGCACGAGGAGAACCTGAAGACCAAGAAGCAGCAGCGGAAGGAGCGGCTGTACCCGCTGCGGAAGTACGCGGTCAAGGCCTGA	832	GTGTGAGTCCTGAGTCTTGGGTAGTGCTATGTGTCTTCCCTATCTTCACTGACATCTCTGTTTTGTAGCCGAGTCGTCCGGAAATCCATTGCCCGTGTTCTCACAGTTATTAACCAGACTCAGAAAGAAAACCTCAGGAAATTCTACAAG
417	833	TATTCATCTTTTTCTTTAGTTAAATTATAAGATGGTTTACCAATTTGAGCCTTTTCAGGGTTTTGGGAAAATTAGACTTTTAATCTAATCATATTATTCTGCTTTTTCTTTTAGCTCCAGTAATAAACCGATTCACAAGGCGTGCCTCAG	834	TATGTGCAGAAGCTTATAATCCTGATGAAGAAGAAGATGATGCAGAGTCCAGGGTATGTAATTTACTGAATGAATGAATTTTAAATTGATGCCCTTGTCATATATAAGGAAAATAATCATAGAAAAGATTTAACAGGCATGTAGGTTAAC
418	835	GTATGTGCACTGCGCGTGACCAGCCGGGCCCGCAGCCGCATCCTCAGGGCAGGGGGCAAGATCCTCACTTTCGACCAGCTGGCCCTGGACTCCCCTAAGGGCTGTGGCACTGTCCTGCTCTCCGGTGAGTGATACGTGGTCGACGGGTTT	836	CTGAATGTAAACACCAGAACAACTTACGACGTACATCCTCCCCACCCTAAGATCCGGAAGATGAAGCTTCCTGGCCGGGAAAACAAGACGGCCGTGGTTGTGGGGACCATAACTGATGATGTGCGGGTTCAGGAGGTACCCAAACTGAAG
419	837	GGGAGGTTCGGATGCCCTCAGGCAAGGTGGCGCAGCCCACCATCACTGACAACAAAGACGGCACCGTGACCGTGCGGTATGCACCCAGCGAGGCTGGCCTGCACGAGATGGACATCCGCTATGACAACATGCACATCCCAGGTGGGCCTG	838	CAGATCCTCCCACTGTCCCTCACCCATGCCCTGTGTCTCCACTGCAGGCCCCGGAGAGGCCCCTGGTGGGTGTCAATGGGCTGGATGTGACCAGCCTGAGGCCCTTTGACCTTGTCATCCCCTTCACCATCAAGAAGGGCGAGATCACAG
420	839	GTCTCAGCCTTGGATCAGGAGATTATTGAAGTAGATCCTGACACTAAGGAAATGCTGAAGCTTTTGGTAAGTGTTTGCTGGATTCCTAAAGTGGTATTTTCCTGGTCAAAAACCATCAGTAGGTCTTATTATCCAAGGTCACCCAGCTAG	840	GATTTGTCTTCTCACTGTTCTCTTTGGCTGTGTGTGCTTTGTAGTTATGTCACGCATCTGATGAAGCGAATTCAGAGAGGCCCAGTAAGAGGTATCTCCATCAAGCTGCAGGAGGAGGAGAGAGAAAGGAGAGACAATTATGTTCCTGAG
421	841	TTACAAGTTGTTTCCAAATTGCGTCCCCTCCTTTGGGTTCCGCCATCTGCTGCCTCTCACAGACAGAGTGGACAGCTTCAATGAGGAAGTTCGGAAACAGAGGGTGTCCCGGAACCGAGATGCCCCTGAGGGGGGCTTTGATGCAGTACT	842	GGACAATATCCGGAGCCTGGGCACCAAACTCGCGGAGGAGATGAGGAAGCTCACCAGCAACTTCCGGTTGGGATTTGGGTCTTTTGTTGATAAGGACATCTCTCCTTTCTCCTACACGGCACCGAGGTACCAGACCAATCCGTGCATTGG
422	843	CCTGTAACCCGAGTGCCTGCCGGGCGGTTGGCCGGGGCCTCCAGCCCAAGGGTGTGCGGGTGAAGGAGACAGCTGACTTCAAGGTGTACACAAAGGGCGCTGGCAGTGGGGAGCTGAAGGTCACCGTGAAGGGCCCCAGTAAGTTGGCCT	844	AGGGCACGGTAGAGCCTCAGCTGGAGGCCCGGGGCGACAGCACATACCGCTGCAGCTACCAGCCCACCATGGAGGGCGTCCACACCGTGCACGTCACGTTTGCCGGCGTGCCCATCCCTCGCAGCCCCTACACTGTCACTGTTGGCCAAG
423	845	CTCGGGAACTGAGCCGGTACTCACCTCCGCCCCTTCTCCCCGTCGCTGTCCGCAGCCATGGCCCTACGCTACCCTATGGCCGTGGGCCTCAACAAGGGCCACAAAGTGACCAAGAACGTGAGCAAGCCCAGGCACAGCCGACGCCGCGGG	846	CGTCTGACCAAACACACCAAGTTCGTGCGGGACATGATTCGGGAGGTGTGTGGCTTTGCCCCGTACGAGCGGCGCGCCATGGAGTTACTGAAGGTCTCCAAGGACAAACGGGCCCTCAAATTTATCAAGAAAAGGGTAGGTGGGCGCTGC
424	847	CCCGGGTGTGTAGGACGGGGAGGTCACGATGGCGCGACGTCTGCAGAAATTTCATGAGGAGGTATCAGTCTAGAGTTACCCAGGGCCTCGTGGCCGGAGAAACTGCCCAGCAGATCTGTGAGGACCTCAGGTTGTGTATACCTTCTACAG	848	GTCCCCTCTGAGCCCTCTCACCTTGTCCTGTGGAAGAAGCACAGGCTCCTGTCCTCAGATCCCGGGAACCTCAGCAACCTCTGCCGGCTCCTCGCTTCCTCGATCCAGAATCCACTCTCCAGTCTCCCTCCCCTGACTCCCTCTGCTGTC
425	849	GAGCCAAAAACCTGTATATCATCTCCGTGAAGGGGATCAAGGGACGGCTGAACAGACTTCCCGCTGCTGGTGTGGGTGACATGGTGATGGCCACAGTCAAGAAAGGCAAACCAGAGCTCAGAAAAAAGGGTGAGTAAACACTGAGCCCAC	850	GGGAACTCCGAACCATGTCTAGATTGTGATCTCTTTATCCTGTTTCCCTTCCCTTTATATCCACAGGACGTGGTGGGTCCTCTGGTGCGAAATTCCGGATTTCCTTGGGTCTTCCGGTAGGAGCTGTAATCAATTGTGCTGACAACACAG
426	851	TTTATCAGTTATTATGAGTGAATATCATGTGAGAGTTACCTCTGGTTTGATCAGTTTCAGGAAAATGCCAGTGAAGGGAAGGCCCCTGCAGAAGACGTCTTTAAGAAGCCCCTGCCTCCTACTGTGAAGAAGGAAGAGAGTCCCCCTCCA	852	CCTAAAGTGGTAAACCCACTGATCGGCCTCTTGGGTGAATATGGAGGAGACAGTGACTATGAGGAGGAAGAAGAGGAGGAACAGACCCCTCCCCCACAGCCCCGCACAGCACAGCCCCAGAAGCGAGAGGAGCAAACCAAGAAGGAGAAT
427	853	CCCGTCAGCCTCCCGCTCGGGGTGCGCCGCCCTTCGTCTGGGTCTCCGCCCCCAGGACCCGCGGCCGAGAGCTCCGGAGCGCGGCTTCCCCGGCCGGCTGCGCGATGGGCTGCGGGAACTCCACCGCCACCAGCGCGGGCGCGGGCCAAG	854	GCCCTGCAGGAGCAGCCAAAGATGTGTAAGTATTGAATATTAATGATTTTATAAGCTGTCTTTCTGAGGAAGTTGCTGTTTTTCATGATTATGACCTTTAGATCTCTGTGGGTATGGCTGAAAAGACATGGAAATACTTTGTGTATAATG
428	855	GCAAAAGTGACCGCCAATAACGACAAGAACCGCACCTTCTCCGTCTGGTACGTCCCCGAGGTGACGGGGACTCATAAGGTGAGCCCTTGGCCAGGGGGGAGGCTTGTGACCTCAGGCAGTGGCTGGAGGCCCCCAGCCCTACCCTCACGG	856	GGCCCGTGGTTGGCTCGCCTTCCCCTGCCAGGCATCGAGCCCACAGGCAACATGGTGAAGAAGCGGGCAGAGTTCACTGTGGAGACCAGAAGTGCTGGCCAGGGAGAGGTGCTGGTGTACGTGGAGGACCCGGCCGGACACCAGGAGGAG
429	857	CCGGCACCCAGCGCCCCGCCGCCCGCAAGCCGCGCGCCCGTCCGCCGCGCCCCGAGCCCGCCGCTTCCTATCTCAGCGCCCTGCCGCCGCCGCCGCGGCCCAGCGAGCGGCCCTGATGCAGGCCATCAAGTGTGTGGTGGTGGGAGACGG	858	AGCTGTAGGTAAAACTTGCCTACTGATCAGTTACACAACCAATGCATTTCCTGGAGAATATATCCCTACTGTGTAAGTATCTTAAATTGGGAATTAACCTGTTTGTGTTACGGGTTTCACATTTCTTTGACCATTTGTTTTGCTGTAAAG
430	859	TGAGTGACTTCAAAGCTGATTTCTTAATCTGTGGTCTTGGCTCGTTCTAGTGCCCACCAGAAGTATGTCCGACAAGCCTGGCAGAAGGCAGACATCAATACAAAATGGGCAGCCACACGATGGGCCAAGAAGATTGAAGCCAGAGAAAGG	860	AAAGCCAAGATGACAGATTTTGATCGTTTTAAAGTTATGAAGGCAAAGAAAATGGTAAGATTTAAGATCTGTATTTTTGTGTAACTTAGCTTTAAATAATAAGGGAGCAGTAGCCAAATCCCATTTCAGGCTGCCAGCTTCTTGGAAGCT
431	861	CCTTTTTCTTTCTTTTTTTTTGGCCAACAGGTGGATCTTGAACGCACCTTCACGTTTCGAAATTCAAAGCAGACCTACTCAGGGATTCCCATCATCGTGGCCAACATGGACACTGTGGGCACGTTTGAGATGGCAGCCGTGATGTCACAG	862	CACTCCATGTTTACAGCAATTCATAAGCATTACTCCCTGGATGACTGGAAGCTCTTTGCCACAAATCACCCAGAATGCCTGCAGGTACGACTACAGCCTGGTTATCAATTACCAGTGCTGCAGGGGGGAACAAAATCTTCAGAGCTGTCA
432	863	TCTCTCTTACTATAGATTGCTTATGCCCGTATAGAGGGGGATATGATAGTCTGCGCAGCGTATGCACACGAACTGCCAAAATATGGTGTGAAGGTTGGCCTGACAAATTATGCTGCAGCATATTGTACTGGCCTGCTGCTGGCCCGCAGG	864	CTTCTCAATAGGTTTGGCATGGACAAGATCTATGAAGGCCAAGTGGAGGTGACTGGTGATGAATACAATGTGGAAAGCATTGATGGTCAGCCAGGTGCCTTCACCTGCTATTTGGATGCAGGCCTTGCCAGAACTACCACTGGCAATAAA
433	865	GGTGACAAAGATTTCCCCCCGGCGGCTGCGCAGGTGGCTCACCAGAAGCCGCATGCCTCCATGGACAAGCATCCTTCCCCAAGAACCCAGCACATCCAGCAGCCACGCAAGTGAGCCTGGAGTCCACCAGCCTGCCCCATGGCCCCGGCT	866	GCCTCCACGCCCTCCAGCCTGGCTCATCCACATACACATCGTCTGCCACCGTGTTCCCTGTTGTGGACTGTTTTGTTAAATCTGCCTTTTCCCTTCTTTTTTTCCAGTCCACCTAAACCCACTGTGTTCATCTCTGGGGTCATCGCCCGG
434	867	CAGATGGAGGAGGGAGGGGGGCTCTCACTTGGCTTCCCATCCTAATGGTGCTGTTTTGTTTTCTAGCACTCCATGTTTACAGCAATTCATAAGCATTACTCCCTGGATGACTGGAAGCTCTTTGCCACAAATCACCCAGAATGCCTGCAG	868	AATGTAGCCGTGAGTTCAGGCAGTGGGCAGAATGATCTGGAAAAGATGACCAGCATCCTGGAAGCTGTGCCACAGGTTAAGTTTATTTGCCTGGATGTGGCCAATGGGTATTCAGAACATTTTGTGGAATTCGTGAAACTTGTCCGTGCC
435	869	CTGCCGACACACAAGCTCTGTTGAGGAATGACCAGGTCTATCAGGTGAGCGTTGAGGGGAAGGAGGCAGGAATGAAGGGAGGGTAAGTGGGGATAGAGAGGCTCACACTGAATGCTGTTTGCACGTGGGAAGGGTCCTACTGGGGAGTTC	870	TCCTCCCTTCCCCCACAGTGTGCCAGAGCTGTGTGGAGCTGGATCCAGCCACCGTGGCTGGCATCATTGTCACTGATGTCATTGCCACTCTGCTCCTTGCTTTGGGAGTCTTCTGCTTTGCTGGACATGAGACTGGAAGGCTGTCTGGGG
436	871	GTTTTGGAACTGAAAGAACACAAACTGGATGGCAAATTGATAGATCCCAAAAGGGCCAAAGCTTTAAAAGGGAAAGAACCTCCCAAAAAGGTTTTTGTGGGTGGATTGAGCCCGGATACTTCTGAAGAACAAATTAAAGAATATTTTGGA	872	TTGAGCTGGGATACAAGCAAAAAAGATCTGACAGAGTACTTGTCTCGATTTGGGGAAGTTGTAGACTGCACAATTAAAACAGATCCAGTCACTGGGAGATCAAGAGGATTTGGATTTGTGCTTTTCAAAGATGCTGCTAGTGTTGATAAG
437	873	GCCGCCGAGCGAGGGCGAGGAGAGCACCGTGCGCTTCGCCCGCAAAGGCGCCCTCCGGCAGAAGAACGTGCATGAGGTCAAGAACCACAAATTCACCGCCCGCTTCTTCAAGCAGCCCACCTTCTGCAGCCACTGCACCGACTTCATCTG	874	GGGCTTCGGGAAGCAGGGATTCCAGTGCCAAGGTAGGCTCTGGGGCTTTGGGGATGCTATTTGTGGGAAGAGAGGGTGAAAAATACTTTATAGAAGAAGTTACTGAGTTAGGCAGAGAGTGAAAGAATCACGTTGGTCGGAGTGACCTCC
438	875	GGCACCAGCCCCAGAAGGTGGCCCGGCGCGTGTTCACCAACAGCCGGGAGCGCTGGCGGCAGCAGAACGTTAACGGCGCCTTCGCCGAGCTGAGGAAGCTGCTGCCGACGCACCCGCCCGACCGGAAGCTGAGCAAGAACGAGGTGCTCC	876	GGGATTGGGGGCCAGGGTCCTTGCCCACAAGGCATTAGTGACCCACGACCCCTTACAGTGTCTACATTGGGCCAGCAGGACCTTTTAGCATCTTCCCTAGCAGCCGGTTGAAGCGGAGACCAAGCCACTGTGAGCTGGACCTGGCTGAGG
439	877	GCATCGAGCCCACAGGCAACATGGTGAAGAAGCGGGCAGAGTTCACTGTGGAGACCAGAAGTGCTGGCCAGGGAGAGGTGCTGGTGTACGTGGAGGACCCGGCCGGACACCAGGAGGAGGTAGGGCCAGCTGCTGGCAGCAGAGGCCCCG	878	AGGTGATCACCCCCGAGGAGATTGTGGACCCCAACGTGGACGAGCACTCTGTCATGACCTACCTGTCCCAGTTCCCCAAGGCCAAGCTGAAGCCAGGGGCTCCCTTGCGGCCCAAACTGAACCCGAAGAAAGCCCGTGCCTACGGGCCAG
440	879	AATTTTACAGCCCTGATACCTGGAACAACGGTGGAGATTTTAGATGGAGACTCCAAAAATATTATTCAACTGATTATTAATGCATACAATGTAAGTCATCAGTTTCTTCCCCCACTGCCACCTCCCTTCCACCCTCTCCCACTGAGGCCC	880	TGGTATCTACACCTGTTAGGAATGTCATAGCCTTGACTTTTGCCTTGGCCCTAGGACTATCCATCCCTTGCCTTGCTTGGAGAGAAATTGGCAGAGAACAACATCAACCTCATCTTTGCAGTGACAAAAAACCATTATATGCTGTACAAG
441	881	CGTACTCTGACAGCTGTGCACGATGCCATCCTTGAGGACTTGGTCTTCCCAAGCGAAATTGTGGGCAAGAGAATCCGCGTCAAACTAGATGGCAGCCGGCTCATAAAGGTTCATTTGGACAAAGCACAGCAGAACAATGTGGAACACAAG	882	GTTGAAACTTTTTCTGGTGTCTATAAGAAGCTCACGGGCAAGGATGTTAATTTTGAATTCCCAGAGTTTCAATTGTAAACAAAAATGACTAAATAAAAAGTATATATTCACAGTACTCTGTTTCAGTTATGTTTTTCAAAATTCCAAATT

실시예 2. 혈소판 유래 전사체 데이터를 이용한 암 진단 방법

본 발명에서는 암 여부를 판별하기 위하여 혈소판 유래 전사체 데이터를 사용하며, 특히 엑손-접합 수 (exon-junction count) 데이터를 사용하였다. 엑손-접합은 한 유전자 내의 서로 다른 두 개의 엑손에 대하여 상위 위치의 엑손의 끝 부분 (3' 부분)과 하위 위치의 엑손의 시작 부분 (5' 부분)의 접합을 나타낸다 (도 3). 엑손-접합 수 데이터는 선별된 리드 (read) 중 서로 다른 두 개의 엑손의 가장 끝쪽 말단, 즉 상위 위치의 엑손의 끝 부분과 하위 위치의 엑손의 시작 부분으로부터 시작하여 연속되는 최소 1개 이상의 엑손 영역 염기쌍을 포함하는 리드를 계수한 것이며, 이 때 서로 다른 두 개의 엑손들의 경우 참조 유전체 상에서 바로 인접한 엑손이 아니어도 된다. 중간에 위치한 한 개 이상의 엑손들이 skip되었을 때 skip되는 엑손 영역은 해당하는 개별 엑손 각각에 대해서 부분이 아닌 전체가 한꺼번에 skip이 되어야만 한다. 예를 들어 1번, 2번, 3번의 엑손이 있고 1번과 3번을 연결하는 엑손-접합이 질병관련 마커로 계수될 때에 2번 엑손의 모든 영역이 리드가 매핑되는 영역에 포함되지 않아야 한다. 또한 해독되지 아니하는 인트론 부분이 섞여서 있는 리드의 경우는 엑손-접합 수로 계수하지 아니한다 (도 4).

엑손-접합 수 데이터로부터 상기 실시예 1의 바이오마커들을 추출하여 사전 학습된 암 여부 판별 모형에 적용한다. 판별 모형은 해당 바이오마커 특성을 입력하면 암과 정상 판별 스코어를 출력하며, 피험자의 엑손-접합 정보를 시각화 및 중요도를 분석하여 피험자에게 통보할 수 있다.

실시예 3. 본원 발명의 성능 확인

암 여부 판별 모형 학습 시 사용된 샘플들의 441개 엑손-접합 라이브러리에 대한 발현 패턴을 학습 데이터셋 (도 5a) 및 검증 데이터셋 (도 5b)에서 도시화하였다. 행과 열은 각각 441개 엑손-접합 라이브러리와 샘플을 나타내며, 샘플에 대한 각 엑손-접합 라이브러리의 발현값을 색으로 나타내었고, 비슷한 패턴을 가지는 샘플 및 엑손-접합 라이브러리가 군집을 이루도록 하였다.

그 결과, 도 5에서 보듯이, 암 여부 판별 모형 학습 시 사용된 샘플들의 441개 엑손-접합 라이브러리에 대한 발현 패턴에서 학습 데이터셋 (도 5a) 및 검증 데이터셋 (도 5b) 모두 암과 정상 샘플이 구별된 군집을 이루는 것을 알 수 있다.

실시예 4. 유전자 마커를 활용한 모형과의 비교

본 발명의 441개 엑손-접합 라이브러리를 사용한 암 여부 판별 모형의 성능을 기존 마커 (유전자 1072개에 대한 SVM 모형)와 비교하였다. 기존 마커에 대한 모형은 동일한 데이터셋을 이용한 선행연구 [6]에서의 유전자 1,072개를 특성으로 하여 학습한 Support Vector Machine (SVM) 모형으로, 해당 모형의 AUC 스코어를 도 6a에 나타내었고, 본원에 따른 441개 엑손-접합 라이브러리를 특성으로 하여 학습한 SVM 모형의 AUC 스코어는 도 6b에 나타내었다.

도 6a 및 도 6b에서 보듯이, 선행 연구에 사용된 것보다 모형에 입력되는 특성의 개수가 크게 줄었음에도 불구하고 향상된 AUC 스코어를 보이며 우수한 성능을 보이는 것을 알 수 있었다.

또한, 동일한 비교 모형에 대해서 검증 데이터셋에 대한 정확도(Accuracy), 민감도(Sensitivity), 특이도(Specificity) 및 AUC 스코어를 비교하였다.

그 결과, 도 7에서 보듯이, 본원에 따른 441개 엑손-접합 라이브러리에 의한 모형과 선행 연구의 1,072개 유전자를 이용한 모형을 비교한 결과, 441개 엑손-접합 라이브러리를 사용한 모형으로도 암 여부 정확하게 구별해낼 수 있어, 더 많은 특성 사용하는 선행 연구와 비교해도 동등하거나 우월한 성능을 확보할 수 있는 점을 알 수 있었다.

실시예 5. 엑손-접합 마커의 일 예시에 대한 분석

도 8은 정상 샘플에 비해 암 샘플에서 발현이 낮아지는 엑손-접합(exon-junction) 중 암과 정상 샘플에서의 차이가 가장 큰 엑손-접합(exon-junction)의 정량 정보에 대한 일 예시도를 나타낸 것으로, Integrative Genomics Viewer (IGV) 프로그램을 이용한 암 샘플 3개 (빨간색, 상위 3개)와 정상 샘플 3개 (파란색, 하위 3개)의 참조 유전체 매핑 결과를 각각 나타낸 것이다. IGV는 통합적인 유전체 데이터셋을 시각화할 수 있는 프로그램으로, 시퀀싱 데이터 등 다양한 포맷의 데이터를 로드하여 참조 유전체에 매핑한 결과를 보여준다. 암 샘플에서 발현이 낮아지며 정상 샘플과의 차이가 가장 큰 엑손-접합(exon-junction)은 유전자 TRAC의 22,549,683~22,550,556 영역이며, 해당 영역이 도 8의 상단 Refseq Genes 트랙에 표시되어 있다. Refseq Genes 트랙 하단의 6개 트랙은 각 트랙에 로드된 샘플에 대하여 해당 영역에 실제 매핑 된 리드의 깊이를 보여준다. 이를 통해 해당 영역에 매핑 된 리드의 개수가 암과 정상 샘플에서 차이남을 알 수 있었다.

도 9는 정상 샘플에 비해 암 샘플에서 발현이 낮아지는 엑손-접합(exon-junction) 중 암과 정상 샘플에서의 차이가 가장 큰 엑손-접합(exon-junction)의 정규화 된 발현값에 대한 일 예시도를 나타낸 것으로, 도 9a는 학습 데이터셋, 도 9b는 검증 데이터셋에 대한 그래프를 나타낸 것이다. 이 그래프는 모든 샘플을 해당 엑손-접합의 log2CPM 값이 큰 순서대로 정렬하여 막대그래프로 표현한 것이며, 암 샘플은 빨간색, 정상 샘플은 파란색으로 나타내어 암과 정상 샘플에서의 발현 값을 비교하였다. 이를 통하여 학습 데이터셋과 검증 데이터셋 모두 해당 엑손-접합의 발현 값이 정상 샘플에 비해 암 샘플에서 낮게 나타남을 알 수 있다.

실시예 6. 엑손-접합 마커에 대한 feature reduction 분석

도 10은 본원에 따른 441개 엑손-접합 라이브러리의 전체 또는 일부를 사용한 암 여부 판별 모형의 성능에 대한 일 예시도를 나타낸 것이다.

441개 엑손-접합 라이브러리의 일부를 사용한 암 여부 판별 모형의 성능을 측정하기 위하여 어떤 특성이 결과값에 영향을 미친 정도를 나타내는 샤프레이 값 (Shapley value)이 사용되었다. 441개 엑손-접합 라이브러리를 특성으로 한 암 여부 판별 모형에서 샤프레이 값이 가장 작은, 즉 해당 모형에 가장 적게 영향을 미치는 엑손-접합 라이브러리를 1개 제거한 후 나머지 440개의 엑손-접합 라이브러리만을 특성으로 한 암 여부 판별 모형을 학습하였다. 이와 같이 판별 모형에서 가장 적게 영향을 주는 엑손-접합 라이브러리를 1개씩 제거하며 암 여부 판별 모형을 학습하고, 그 성능을 그래프로 나타내었다.

암 여부 판별 모형에서 가장 적게 영향을 주는 엑손-접합 라이브러리를 1개씩 제거하며 학습한 모형에 대해 x축은 모형 학습에 사용된 엑손-접합 라이브러리의 수, y축은 검증 데이터셋의 성능을 나타낸 것으로, 정확도 (Accuracy; acc), 민감도 (Sensitivity; sen), 특이도 (Specificity; spe), AUC 스코어를 각각 표시한 것이다. 여기서 암 여부 판별 모형에 영향을 주는 정도를 기준으로 엑손-접합 라이브러리 번호를 선정하였다(1번이 가장 높은 영향을 주는 엑손-접합 라이브러리). 즉, 위에서 '암 여부 판별에 가장 적게 영향을 주는 엑손-접합 라이브러리를 1개씩 제거'했다는 것은 엑손-접합 라이브러리 441부터 1개씩 제거했다는 것이며, 더 구체적으로 엑손-접합 라이브러리 1 내지 엑손-접합 라이브러리 441를 사용한 모형, 엑손-접합 라이브러리 1 내지 엑손-접합 라이브러리 440을 사용한 모형, … 엑손-접합 라이브러리 1 내지 엑손-접합 라이브러리 2를 사용한 모형 및 엑손-접합 라이브러리 1을 사용했다는 의미이다. 또한 이는 청구범위에서 정의되는 '단수 또는 복수의 엑손-접합 라이브러리'을 의미한다.

실험 결과, 도 10에서 보듯이, 엑손-접합 라이브러리의 수를 줄여가며 일부만 사용했음에도 불구하고 성능이 크게 떨어지지 않으므로 암과 정상을 판별할 때 표 1의 모든 엑손-접합 라이브러리(441개)가 사용되거나 그 일부 (단수 또는 복수의 엑손-접합 라이브러리)만 사용될 수 있다.

[참고문헌]

1. Chen, Ming, and Hongyu Zhao. “Next-generation sequencing in liquid biopsy: cancer screening and early detection.” Human genomics 13.1 (2019): 1-10.

2. Pisapia, Pasquale, et al. “Next generation sequencing for liquid biopsy based testing in non-small cell lung cancer in 2021.” Critical Reviews in Oncology/Hematology 161 (2021): 103311.

3. Liu, Minetta C. “Transforming the landscape of early cancer detection using blood tests―Commentary on current methodologies and future prospects.” British journal of cancer 124.9 (2021): 1475-1477.

4. Ried, Karin, Peter Eng, and Avni Sali. “Screening for circulating tumour cells allows early detection of cancer and monitoring of treatment effectiveness: an observational study.” Asian Pacific journal of cancer prevention: APJCP 18.8 (2017): 2275.

5. Wan, Jonathan CM, et al. “Liquid biopsies come of age: towards implementation of circulating tumour DNA.” Nature Reviews Cancer 17.4 (2017): 223-238.

6. Best, Myron G., et al. "RNA-Seq of tumor-educated platelets enables blood-based pan-cancer, multiclass, and molecular pathway cancer diagnostics." Cancer cell 28.5 (2015): 666-676.

Claims

(a) (i) 개체의 혈액의 무핵세포(anucleated cells)에서 분리한 전체 RNA 또는 이의 일부, (ii) 개체의 혈액의 엑소좀(exosome)에서 분리한 전체 RNA 또는 이의 일부, 및 (iii) 개체의 혈액에서 분리한 전체 cfRNA(cell-free RNA) 또는 이의 일부로 이루어진 군에서 선택된 하나 이상의 RNA를 분리하는 단계

(b) 상기 (a) 단계에서 분리한 RNA에 대한 상보적 DNA (cDNA)을 합성하는 단계;

(c) 상기 cDNA의 염기서열정보를 수득하는 단계;

(d) 상기 cDNA 염기서열정보를 미리 정해진 엑손-접합(exon-junction) 라이브러리와 대비하여 각 엑손-접합에서의 염기서열 발현정보를 수득하는 단계; 및

(e) 상기 각 엑손-접합에서의 염기서열 발현정보를 바탕으로 암 보유 여부를 결정하는 단계를 포함하는, 개체에서 암 진단에 필요한 정보를 제공하기 위해 전사체를 분석하는 방법.
제1항에 있어서, 상기 암 보유 여부의 결정은 하나 또는 2종류 이상의 암의 보유 여부를 결정하는 것을 특징으로 하는 방법.
제2항에 있어서, 상기 2종류 이상의 암의 보유 여부의 결정은 개체에서 분리한 1개의 생물학적 시료에서 동시에 또는 순차적으로 결정되는 것을 특징으로 하는 방법.
제1항에 있어서, 상기 전사체 분석은 차세대 염기서열 분석법 (Next-Generation Sequencing, NGS)에 의해서 수행되는 것을 특징으로 하는 방법.
제1항에 있어서, 상기 미리 정해진 엑손-접합 라이브러리는 하기 표 1에 기재된 각 염색체에서 position 1 및 position 2의 접합인 것을 특징으로 하는 방법:
제5항에 있어서, 상기 각 엑손-접합에서의 염기서열 발현정보는 상기 position 1 및 position 2의 각 염기를 포함하면서, 각 염색체의 5'방향 및/또는 3'방향으로 연속되는 2 이상의 염기를 포함하는 서열에 정렬(alignment)되는 염기서열 발현정보인 것을 특징으로 하는 방법.
제5항에 있어서, 상기 엑손-접합 라이브러리는 상기 표 1에 기재된 단수 또는 복수의 엑손-접합을 포함하며, 상기 단수 또는 복수의 엑손-접합은 엑손-접합 번호 1 , … , 엑손-접합 라이브러리 n-1 및 엑손-접합 라이브러리 n이되, 상기 n은 자연수로서 1 내지 441 중 어느 하나인 것을 특징으로 하는 방법.
제1항에 있어서, 각 엑손-접합에서의 염기서열 발현정보를 바탕으로 암 보유 여부를 결정하는 것은 사전 학습된 암 여부 판별 모형에 의해서 수행되는 것을 특징으로 하는 방법.
제8항에 있어서, 상기 사전 학습은 나이브 베이즈 분류(Naive Bayes Classification), 로지스틱 회귀(Logistic Regression), 의사결정나무(Decision tree), 랜덤포레스트(Random forest), 부스팅(XGBoost/ensemble boosting/AdaBoost/Gradient Boost/LightGBM/CatBoost 등), 퍼셉트론(Perceptron), 서포트 벡터 머신(Support Vector Machine), 쿼드라틱 분류(Quadratic classifiers), 클러스터링(K-means clustering, Bayesian network clustering 등), 딥 뉴럴 네트워크(Deep Neural Network)로 이루어진 군에서 선택된 어느 하나의 기계 학습 알고리즘에 의해서 수행되는 것을 특징으로 하는 방법.
제1항에 있어서, 상기 암은 방광암, 뼈암, 혈액암, 유방암, 흑색종양, 갑상선암, 부갑상선암, 골수암, 직장암, 인후암, 후두암, 폐암, 식도암, 췌장암, 대장암, 위암, 설암, 피부암, 뇌종양, 자궁암, 두부 또는 경부암, 담낭암, 구강암, 결장암, 항문 부근암, 중추신경계 종양, 간암 및 대장암으로 이루어진 군에서 선택되는 것을 특징으로 하는 방법.
상기 표 1의 엑손-접합(exon-junction)으로 이루어진 군에서 선택된 단수 또는 복수의 엑손-접합을 유효성분으로 포함하는 암 진단용 조성물이며, 상기 엑손-접합은 (i) 개체의 혈액의 무핵세포(anucleated cells)에서 분리한 RNA 또는 이의 일부, (ii) 개체의 혈액의 엑소좀(exosome)에서 분리한 전체 RNA 또는 이의 일부, 및 (iii) 개체의 혈액에서 분리한 전체 cfRNA(cell-free RNA) 또는 이의 일부에서 검출하는 것을 특징으로 하는 암 진단용 조성물.
제11항에 있어서, 상기 암 진단은 하나 또는 2종류 이상의 암의 진단인 것을 특징으로 하는 암 진단용 조성물.
제12항에 있어서, 상기 2종류 이상의 암의 진단은 개체에서 분리한 1개의 생물학적 시료에서 동시에 또는 순차적으로 진단되는 것을 특징으로 하는 암 진단용 조성물.
제11항에 있어서, 상기 암은 방광암, 뼈암, 혈액암, 유방암, 흑색종양, 갑상선암, 부갑상선암, 골수암, 직장암, 인후암, 후두암, 폐암, 식도암, 췌장암, 대장암, 위암, 설암, 피부암, 뇌종양, 자궁암, 두부 또는 경부암, 담낭 암, 구강암, 결장암, 항문 부근암, 중추신경계 종양, 간암 및 대장암으로 이루어진 군에서 선택되는 것을 특징으로 하는 진단용 조성물.
제11항의 조성물을 포함하는 암 진단 키트.
제15항에 있어서, 상기 암 진단은 하나 또는 2종류 이상의 암의 진단인 것을 특징으로 하는 암 진단 키트.
제16항에 있어서, 상기 2종류 이상의 암의 진단은 개체에서 분리한 1개의 생물학적 시료에서 동시에 또는 순차적으로 결정되는 것을 특징으로 하는 암 진단 키트.
제15항에 있어서, 상기 암은 방광암, 뼈암, 혈액암, 유방암, 흑색종양, 갑상선암, 부갑상선암, 골수암, 직장암, 인후암, 후두암, 폐암, 식도암, 췌장암, 대장암, 위암, 설암, 피부암, 뇌종양, 자궁암, 두부 또는 경부암, 담낭 암, 구강암, 결장암, 항문 부근암, 중추신경계 종양, 간암 및 대장암으로 이루어진 군에서 선택되는 것을 특징으로 암 진단 키트.
상기 표 1의 엑손-접합(exon-junction)으로 이루어진 군에서 선택된 단수 또는 복수의 엑손-접합을 검출할 수 있는 제제를 포함하는, 암 진단용 조성물이며, 상기 엑손-접합은 (i) 개체의 혈액의 무핵세포(anucleated cells)에서 분리한 전체 RNA 또는 이의 일부, (ii) 개체의 혈액의 엑소좀(exosome)에서 분리한 전체 RNA 또는 이의 일부, 및 (iii) 개체의 혈액에서 분리한 전체 cfRNA(cell-free RNA) 또는 이의 일부에서 검출하는 것을 특징으로 하는 암 진단용 조성물.
제19항에 있어서, 상기 암 진단은 하나 또는 2종류 이상의 암의 진단인 것을 특징으로 하는 암 진단용 조성물.
제20항에 있어서, 상기 2종류 이상의 암의 진단은 개체에서 분리한 1개의 생물학적 시료에서 동시에 또는 순차적으로 결정되는 것을 특징으로 하는 암 진단용 조성물.
제19항에 있어서, 상기 암은 방광암, 뼈암, 혈액암, 유방암, 흑색종양, 갑상선암, 부갑상선암, 골수암, 직장암, 인후암, 후두암, 폐암, 식도암, 췌장암, 대장암, 위암, 설암, 피부암, 뇌종양, 자궁암, 두부 또는 경부암, 담낭 암, 구강암, 결장암, 항문 부근암, 중추신경계 종양, 간암 및 대장암으로 이루어진 군에서 선택되는 것을 특징으로 하는 암 진단용 조성물.
암 진단용 조성물을 제조하기 위한, 상기 표 1의 엑손-접합(exon-junction)으로 이루어진 군에서 선택된 단수 또는 복수의 엑손-접합을 검출할 수 있는 제제의 용도.
(a) (i) 개체의 혈액의 무핵세포(anucleated cells)에서 분리한 전체 RNA 또는 이의 일부, (ii) 개체의 혈액의 엑소좀(exosome)에서 분리한 전체 RNA 또는 이의 일부, 및 (iii) 개체의 혈액에서 분리한 전체 cfRNA(cell-free RNA) 또는 이의 일부로 이루어진 군에서 선택된 하나 이상의 RNA를 분리하는 단계

(b) 상기 (a) 단계에서 분리한 RNA에 대한 상보적 DNA (cDNA)을 합성하는 단계;

(c) 상기 cDNA의 염기서열정보를 수득하는 단계;

(d) 상기 cDNA 염기서열정보를 미리 정해진 엑손-접합(exon-junction) 라이브러리와 대비하여 각 엑손-접합에서의 염기서열 발현정보를 수득하는 단계; 및

(e) 상기 각 엑손-접합에서의 염기서열 발현정보를 바탕으로 암 보유 여부를 결정하는 단계를 포함하는, 암 진단 방법.