KR102147007B1 - Fad3 성능 유전자좌 및 표적화 파단을 유도할 수 있는 상응하는 표적 부위 특이적 결합 단백질 - Google Patents

Fad3 성능 유전자좌 및 표적화 파단을 유도할 수 있는 상응하는 표적 부위 특이적 결합 단백질 Download PDF

Info

Publication number
KR102147007B1
KR102147007B1 KR1020157008552A KR20157008552A KR102147007B1 KR 102147007 B1 KR102147007 B1 KR 102147007B1 KR 1020157008552 A KR1020157008552 A KR 1020157008552A KR 20157008552 A KR20157008552 A KR 20157008552A KR 102147007 B1 KR102147007 B1 KR 102147007B1
Authority
KR
South Korea
Prior art keywords
dna
gene
sequence
fad3
plant
Prior art date
Application number
KR1020157008552A
Other languages
English (en)
Other versions
KR20150043540A (ko
Inventor
노엘 코간
존 포스터
매튜 헤이든
팀 소브리지
저먼 스판젠버그
스티븐 알 웨브
만주 굽타
윌리엄 마이클 에인리
매튜 제이 헨리
제프리 씨 밀러
드미트리 와이 거신
Original Assignee
다우 아그로사이언시즈 엘엘씨
상가모 테라퓨틱스, 인코포레이티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 다우 아그로사이언시즈 엘엘씨, 상가모 테라퓨틱스, 인코포레이티드 filed Critical 다우 아그로사이언시즈 엘엘씨
Publication of KR20150043540A publication Critical patent/KR20150043540A/ko
Application granted granted Critical
Publication of KR102147007B1 publication Critical patent/KR102147007B1/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8216Methods for controlling, regulating or enhancing expression of transgenes in plant cells
    • C12N15/822Reducing position variability, e.g. by the use of scaffold attachment region/matrix attachment region (SAR/MAR); Use of SAR/MAR to regulate gene expression
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01HNEW PLANTS OR NON-TRANSGENIC PROCESSES FOR OBTAINING THEM; PLANT REPRODUCTION BY TISSUE CULTURE TECHNIQUES
    • A01H5/00Angiosperms, i.e. flowering plants, characterised by their plant parts; Angiosperms characterised otherwise than by their botanic taxonomy
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01HNEW PLANTS OR NON-TRANSGENIC PROCESSES FOR OBTAINING THEM; PLANT REPRODUCTION BY TISSUE CULTURE TECHNIQUES
    • A01H5/00Angiosperms, i.e. flowering plants, characterised by their plant parts; Angiosperms characterised otherwise than by their botanic taxonomy
    • A01H5/10Seeds
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/66General methods for inserting a gene into a vector to form a recombinant vector using cleavage and ligation; Use of non-functional linkers or adaptors, e.g. linkers containing the sequence for a restriction endonuclease
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8201Methods for introducing genetic material into plant cells, e.g. DNA, RNA, stable or transient incorporation, tissue culture methods adapted for transformation
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8242Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits
    • C12N15/8243Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits involving biosynthetic or metabolic pathways, i.e. metabolic engineering, e.g. nicotine, caffeine
    • C12N15/8247Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits involving biosynthetic or metabolic pathways, i.e. metabolic engineering, e.g. nicotine, caffeine involving modified lipid metabolism, e.g. seed oil composition
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A40/00Adaptation technologies in agriculture, forestry, livestock or agroalimentary production
    • Y02A40/10Adaptation technologies in agriculture, forestry, livestock or agroalimentary production in agriculture
    • Y02A40/146Genetically Modified [GMO] plants, e.g. transgenic plants

Abstract

세포의 FAD3 유전자에서의 위치를 부위 지정 방식으로 절단하여 FAD3 유전자에서 파단을 생성한 다음, 하나 이상의 관심 형질에 연관된 핵산 분자를 파단 내에 라이게이션함으로써 FAD3 유전자좌 내에서 유전자를 편집하거나 또는 유전자를 스택킹하는 방법이 개시된다.

Description

FAD3 성능 유전자좌 및 표적화 파단을 유도할 수 있는 상응하는 표적 부위 특이적 결합 단백질{FAD3 PERFORMANCE LOCI AND CORRESPONDING TARGET SITE SPECIFIC BINDING PROTEINS CAPABLE OF INDUCING TARGETED BREAKS}
관련 출원에 대한 교차 참조
본원은 그의 개시내용 전문이 본원에 참조로 포함되는 2012년 9월 7일에 출원된 미국 가특허 출원 번호 61/697,854 및 그의 개시내용 전문이 본원에 참조로 포함되는 2013년 5월 7일에 출원된 미국 가특허 출원 번호 61/820,260의 이익에 대해 우선권을 청구한다.
개시내용의 분야
본 개시내용은 일반적으로 재조합 식물 기술 (예를 들어, 트랜스제닉 식물을 생성하기 위한 것)에 사용하기 위한 조성물 및 방법에 관한 것이다. 보다 구체적으로, 본 개시내용은 임의의 관심 핵산의 부위-특이적 도입에 사용될 수 있는 그의 게놈 내의 유전자좌를 포함하는 식물 세포 및 식물에 관한 것이다.
다수의 식물은 일반적으로 목적한 형질을 도입하기 위해, 예를 들어 농업상 가치를 개선하기 위해 외인성 핵산 (예를 들어, 트랜스진)으로 유전자 형질전환된다. 유전자 형질전환을 통해 달성할 수 있는 농업상 가치의 개선의 예는 개선된 영양 품질, 증가된 수율, 해충 또는 병해 저항성, 가뭄 및 스트레스 저항성, 개선된 원예학 품질 (예를 들어, 개선된 색소침착 및/또는 성장), 제초제 저항성, 식물로부터의 산업적으로 유용한 화합물 및/또는 물질의 생산, 및/또는 약제의 제조를 포함한다. 식물 세포 내로 클로닝된 유전자의 도입 및 안정한 생식력 있는 트랜스제닉 식물의 회수는 여러 세대를 통해 식물의 유전자 변형을 안정하게 하는데 사용될 수 있고, 이에 따라 작물 식물의 유전자 조작을 가능하게 한다.
유전자 형질전환 및 트랜스제닉 식물 생산 방법에서는, 외인성 DNA를 전형적으로 진핵 식물 세포의 핵 또는 색소체 DNA로 무작위로 도입한 후, 통합된 외인성 DNA를 함유하는 세포를 단리시키고, 안정하게 형질전환된 식물의 후속적인 재생이 이어진다. 트랜스제닉 식물은 전형적으로 아그로박테리움-매개 형질전환 기술에 의해 생성되었다. 이들 기술을 사용한 성공은 관심 핵산 분자를 식물의 게놈 내로 도입하기 위한 다른 방법, 예컨대 원형질체 내의 PEG-매개 DNA 흡수, 미세입자 투사법 (microprojectile bombardment), 및 규소 휘스커 (silicon whisker)-매개 형질전환의 개발을 자극하였다.
그러나, 이들 모든 식물 형질전환 방법에서, 식물 게놈에 혼입된 외인성 핵산은 식물 세포의 게놈에서 무작위로 예측불가능한 카피수로 통합된다 (Terada et al. (2002) Nat Biotechnol 20(10):1030; Terada et al. (2007) Plant Physiol 144(2):846; D'Halluin et al. (2008) Plant Biotechnology J. 6(1):93). 예를 들어, 트랜스진은 빈번하게 전체 트랜스진 또는 그의 일부의 서열 반복의 형태로 통합된다. 이러한 복합 통합 패턴은 통상적으로 통합된 핵산의 발현 수준에 유해한 영향을 미친다 (예를 들어, 전사후 유전자 침묵 메카니즘을 통한 전사 RNA의 파단에 의해, 또는 통합된 DNA의 메틸화를 유도하는 것에 의해). 또한, 통합 부위의 위치는 통합된 핵산의 발현 수준에 통상적으로 영향을 미친다. 또한, 외인성 DNA의 통합은 통합이 발생한 게놈 영역에 대한 분열 효과를 가질 수 있고, 이에 따라 표적 영역의 정상 기능에 영향을 미치거나 또는 이를 방해하여 바람직하지 않은 부작용을 생산할 수 있다. 상기를 비롯한 인자의 조합은 그것이 동일한 방법에 의해 생성된 것임에도 다양한 트랜스제닉 식물 세포 및 식물 라인들 사이에 트랜스진 또는 외인성 DNA의 발현 수준 (및 전체 농경학상 품질)에서의 광범위한 변화를 초래한다. 통합이 무작위이기 때문에, 실시자가 목적한 특징을 갖는 새로운 식물을 생산하려고 시도하지만 이들 효과는 제어할 수 없다.
상기 고려사항은, 식물 내로의 특정한 외인성 핵산의 도입의 효과가 조사될 때마다, 유의한 결과를 얻기 위해서는 다수의 트랜스제닉 식물 라인이 생성되고 분석되어야 하는 것이 필요하다. 마찬가지로, 목적한 표현형을 갖는 트랜스제닉 식물을 제공하기 위한 특정한 통합 핵산을 함유하는 트랜스제닉 식물의 생성에서는, 핵산을 최적으로 발현하고 트랜스제닉 식물의 전체 표현형 및 성능에 부작용이 최소인 또는 갖지 않는 식물 라인의 선택을 가능하게 하기 위해 독립적으로 생성된 트랜스제닉 식물 라인의 다수의 집단을 생성해야 한다. 이들 실질적인 고려사항은 다중 외인성 핵산 삽입 (즉, 유전자 스택킹)에 의해 생성된 트랜스제닉 식물에서 중요성을 더한다. 이러한 식물에서, 전사후 유전자 침묵과 같은 현상이 증폭될 수 있다.
식물에서 트랜스진 삽입을 제어하기 위한 노력으로 여러 방법이 개발되었다. 예를 들어, 문헌 [Kumar and Fladung (2001) Trends Plant Sci. 6:155-9]을 참조한다. 이들 방법은 원핵생물 및 하등 진핵생물 둘 다에 성공적으로 적용된 상동 재조합-기반 트랜스진 통합에 의존한다 (Paszkowski et al. (1988) EMBO J. 7:4021-6). 그러나, 식물에서, 최근까지 트랜스진 통합을 위한 우세한 메카니즘은 재조합 DNA 가닥들 사이에 거의 상동성을 수반하지 않는 비정규 재조합을 기초로 한다. 따라서, 이 분야의 주요 과제는 비정규 재조합을 통해 보다 훨씬 더 효율적인 통합 사례에 의해 차폐되는 드문 상동성 재조합 사례의 검출 및 선택적 생성이다. 또한, 표적화 상동 재조합 사례의 선택적 생성 및 검출이 달성될지라도, 상기 전략의 최대 이익을 실현하기 위해 사례는 숙주 게놈에서 바람직한 위치를 표적화해야 한다.
예를 들어, 표적화 유전자 형질전환의 추정되는 이익은 무작위 통합으로부터 획득된 형질전환 사례와 비교하여 트랜스진 발현의 사례-대-사례 가변성의 감소이다. 추가로 추정되는 이익은 도입된 핵산을 스크리닝하고, 형질전환 구축물을 분류하고, 생성된 트랜스제닉 식물에서 목적하는 전체 특징에 기여하는 사례를 생산하기 위해 요구되는 사례의 수의 유의한 감소이다. 이들 이익을 실현하기 위해 요구되는 중요한 인자는 트랜스진 성능이 일정하고, 가능하다면, 숙주 식물에 대한 부작용이 제거되거나 또는 최소화되는 게놈 내 특정 위치의 확인이다.
최근에, 게놈 DNA의 표적화된 절단을 위한 방법 및 조성물이 기재되었다. 이러한 표적화 절단 사례를 사용하여, 예를 들어 표적화 돌연변이유발을 유도하고, 세포성 DNA 서열의 표적화 결실을 유도하며, 미리 결정된 염색체 유전자좌에서의 표적화 재조합 및 통합을 촉진시킬 수 있다. 예를 들어, 모든 목적을 위해 그의 개시내용 전문이 본원에 참조로 포함된 문헌 [Urnov et al. (2010) Nature 435(7042):646-51] 및 미국 특허 공개 20030232410; 20050208489; 20050026157; 20050064474; 20060188987; 20090263900; 20090117617; 20100047805; 20110207221; 20110301073; 2011089775; 20110239315; 20110145940; 및 국제 공보 WO 2007/014275를 참조한다. 절단은 특이적 뉴클레아제 예컨대, 조작된 아연 핑거 뉴클레아제 (ZFN), 전사-활성화인자 유사 이펙터 뉴클레아제 (TALEN)의 사용, 또는 특이적 절단을 유도하도록 조작된 crRNA/tracr RNA ('단일 가이드 RNA')를 갖는 CRISPR/Cas 시스템의 사용을 통해 일어날 수 있다. 미국 특허 공개공보 번호 20080182332는 식물 게놈의 표적화 변형을 위한 비정규 아연 핑거 뉴클레아제 (ZFN)의 용도가 기재되어 있으며, 미국 특허 공개공보 번호 20090205083은 식물 EPSPS 유전자좌의 ZFN-매개 표적화 변형이 기재되어 있으며, 미국 특허 공개공보 번호 20100199389는 식물 Zp15 유전자좌의 표적화 변형이 기재되어 있으며, 미국 특허 공개공보 번호 20110167521은 지방산 생합성에 관여하는 식물 유전자의 표적화 변형이 기재되어 있다. 또한, 문헌 [Moehle et al. (2007) Proc. Natl. Acad, Sci. USA 104(9):3055-3060]은 명시된 유전자좌에서의 표적화된 유전자 부가를 위해 설계된 ZFN의 사용을 기재하고 있다. 미국 특허 공개 20110041195는 동형접합 이배체 유기체를 생성하는 방법을 기재하고 있다.
그러나, FAD3 유전자좌에서의 목적하는 트랜스진의 표적화 삽입을 사용한 식물의 생성을 포함하는 식물에서의 FAD3 유전자의 발현을 변형 및/또는 조절하기 위한 조성물 및 방법에 대한 필요성이 남아있다.
본 개시내용의 간단한 개요
본 개시내용은 FAD3 유전자의 발현 (예를 들어, 식물, 조류 및 진균에서)을 조절하기 위한 조성물 및 방법 및 숙주 세포 내로 관심 핵산 서열 (예를 들어, 외인성 핵산 서열)의 표적화 통합을 위한 부위로서 이들 유전자좌의 이용을 기재한다. 일부 실시양태에서, 숙주 세포는 그 중 임의의 것 또는 모두가 선택적으로 변형 및/또는 분열될 수 있는 것인 하나 이상의 FAD3 서열을 갖는 하나 이상의 게놈 (예를 들어, 동조체 및/또는 파라로그)을 함유할 수 있다. 구체적 예에서, 본 개시내용은 FAD3A, FAD3A', FAD3C' 및/또는 FAD3C 유전자, 뿐만 아니라 브라시카 나푸스(Brassica napus) (즉 비. 나푸스(B. napus ) 라인, DH12075)에서 상응하는 동조체 또는 파라로그 및 관심 핵산 서열의 표적화 통합을 위한 유전자좌로서의 그의 이용을 기재한다. 본원에 기재된 바와 같이, FAD3 유전자가 숙주에서 지방산 생합성에 관여하지만, 그의 변형 또는 분열 (예를 들어, FAD3 코딩 서열 내에 외인성 핵산의 통합에 의해)은 생성된 숙주 유기체에 대해 예상외로 부작용이 없거나 또는 최소화될 수 있다.
FAD3 유전자좌 내에 특이적 핵산 서열의 절단 및/또는 통합을 생성할 수 있는 폴리펩티드와 연계된 하나 이상의 특정한 FAD3 유전자좌의 사용이 또한 본원에 기재된다. FAD3 유전자좌의 절단 및/또는 통합을 수행할 수 있는 폴리펩티드와 연계된 FAD3 유전자좌의 사용의 예는 아연 핑거 단백질, 메가뉴클레아제, TAL 도메인, TALEN, RNA-유도 CRISPR-Cas9, 레콤비나제, 류신 지퍼, CRISPr/Cas 및 관련 기술분야에 공지되어 있는 다른 것으로 이루어진 군으로부터 선택된 폴리펩티드를 포함한다. 특정한 예는 부위-특이적 DNA 결합 도메인 폴리펩티드 및 절단 도메인 폴리펩티드 (예를 들어, 뉴클레아제)를 포함하는 키메라 ("융합") 단백질, 예컨대 아연-핑거 폴리펩티드 및 FokI 뉴클레아제 폴리펩티드를 포함하는 ZFN 단백질을 포함한다. 예를 들어, 상응하는 동조체 또는 파라로그의 절단 없이 FAD3A, FAD3A', FAD3A", FAD3C, FAD3C', FAD3C" 및 그의 조합에서 결합하여 이중 가닥 파단을 유도하도록 설계된 특정한 ZFN의 시험관내 및 생체내 효능 및 특이성의 입증이 본원에 기재된다. 일부 실시양태에서, 특정한 FAD3 유전자좌는 상기 폴리펩티드 중 임의의 것과 함께 사용되어 숙주의 농업상 성능에 대해 최소한의 유해한 영향을 가지면서 숙주에서 후속적으로 발현되는 관심 핵산의 부위-특이적 통합에 영향을 미칠 수 있다.
특정 측면에서, FAD3 유전자에 특이적으로 결합하는 DNA-결합 도메인을 포함하는 폴리펩티드가 본원에 기재된다. 일부 실시양태에서, 이러한 폴리펩티드는, 또한 폴리펩티드가 표적화 이중-가닥 파단을 유도하고/거나 파단 부위에서의 관심 핵산의 재조합을 용이하게 할 수 있도록 뉴클레아제 (절단) 도메인 또는 절반-도메인 (예를 들어, ZFN, 레콤비나제, 트랜스포사제 또는 귀소 엔도뉴클레아제, 예컨대 변형된 DNA-결합 도메인, TAL 도메인, TALEN, RNA-유도 CRISPR-Cas9를 갖는 귀소 엔도뉴클레아제), 및/또는 리가제 도메인을 포함할 수 있다. 특정한 실시양태에서, FAD3 유전자좌를 표적으로 하는 DNA-결합 도메인은 DNA-절단 기능적 도메인일 수 있다. 일부 실시양태에서, 상기 폴리펩티드는 외인성 핵산을 숙주 유기체 (예를 들어, 식물 또는 동물 종)의 게놈에 하나 이상의 FAD3 유전자좌에서 도입하여 상동 재조합을 나타내기 위해 사용될 수 있다. 특정 실시양태에서, DNA-결합 도메인은 하나 이상의 아연 핑거 (예를 들어, 2, 3, 4, 5, 6, 7, 8, 9개 또는 그 초과의 아연 핑거)를 갖는 아연 핑거 단백질을 포함하고, FAD3 유전자 내의 임의의 서열에 결합하도록 조작 (비-자연 발생)될 수 있다. 본원에 기재된 임의의 아연 핑거 단백질은 표적 유전자의 코딩 서열 내의 또는 인접한 서열 (예를 들어, 프로모터 또는 다른 발현 요소) 내의 표적 부위에 결합할 수 있다. 특정 실시양태에서, 아연 핑거 단백질은, 예를 들어 표 4에 나타낸 바와 같이, FAD3 유전자 내의 표적 부위에 결합한다. 예시적인 FAD3-결합 아연 핑거의 인식 나선 영역은 표 3에 나타낸다. 아연 핑거 단백질의 하나 이상의 성분 아연 핑거 결합 도메인은 정규 (C2H2) 아연 핑거 또는 비정규 (예컨대, C3H) 아연 핑거일 수 있다 (예를 들어, N-말단 및/또는 C-말단 아연 핑거가 비정규 핑거일 수 있음).
FAD3 유전자를 분열시키거나 또는 편집하는 방법이 또한 본원에 기재된다. 본 발명의 실시양태에 따른 방법에 의해 생성된 유전자 변형된 숙주 유기체 (예를 들어, 트랜스제닉 식물)이 본원에 추가로 기재된다. 특정한 예에서, 본 발명의 한 실시양태에 따른 방법에 의해 생성된 트랜스제닉 유기체는 제한 없이 조류, 진균, 단자엽 식물, 쌍자엽 식물 등일 수 있다.
상기 및 다른 특징은 첨부 도면을 참조로 하여 진행되는, 여러 실시양태의 하기의 상세한 설명으로부터 더욱 명백해질 것이다.
도 1, 패널 a 내지 t는 얼라인엑스(AlignX)®를 사용하여 생성된 FAD3 유전자 서열 (서열 7-12)의 서열 정렬을 나타낸 것이다.
도 2는 이웃 연결 거리에 기반한 잘뷰(Jalview) v 2.3을 사용하여 생성된 FAD3 유전자 서열의 계통발생학적 트리를 나타낸 것이다. 표지된 서열은 다음에 해당한다: FAD3A'/A"는 FAD3A'로서 본원 전반에 걸쳐 기재되고; 반수체형 2는 FAD3C'로서 본원 전반에 걸쳐 기재되고; 반수체형 1은 FAD3C"로서 본원 전반에 걸쳐 기재되고; 반수체형 3은 FAD3A"로서 본원 전반에 걸쳐 기재됨.
도 3은 pDAB107828의 플라스미드 지도를 나타낸 것이다.
도 4는 pDAB107829의 플라스미드 지도를 나타낸 것이다.
도 5는 pDAS000271의 플라스미드 지도를 나타낸 것이다.
도 6은 pDAS000272의 플라스미드 지도를 나타낸 것이다.
도 7은 pDAS000273의 플라스미드 지도를 나타낸 것이다.
도 8은 pDAS000274의 플라스미드 지도를 나타낸 것이다.
도 9는 pDAS000275의 플라스미드 지도를 나타낸 것이다.
도 10은 pDAS000031의 플라스미드 지도를 나타낸 것이다.
도 11은 pDAS000036의 플라스미드 지도를 나타낸 것이다.
도 12는 pDAS000037의 플라스미드 지도를 나타낸 것이다.
도 13은 pDAB107827의 플라스미드 지도를 나타낸 것이다.
도 14는 pDAB107828의 플라스미드 지도를 나타낸 것이다.
도 15는 pDAS000340의 플라스미드 지도를 나타낸 것이다.
도 16은 pDAS000341의 플라스미드 지도를 나타낸 것이다.
도 17은 pDAS000342의 플라스미드 지도를 나타낸 것이다.
도 18은 pDAS000343의 플라스미드 지도를 나타낸 것이다.
도 19는 Fad3C의 개시 및 정지 코돈과 관련하여 프라이머 및 그의 위치의 위치를 나타낸 개략도이다. 패널 a는 야생형 Fad3C 유전자좌에 대한 프라이머 부위의 위치를 나타낸 것이다. 패널 b는 공여자 통합을 확인하기 위한 프라이머 부위의 위치, 및 공여자가 Fad3C 유전자좌 내에 통합될 수 있는 가능한 배향을 나타낸 것이다.
도 20, 패널 A 및 B는 지시된 ZFN 및 공여자 플라스미드를 갖는 변형 후의 서열 정렬을 나타낸 것이다. 도 20a는 ZFN 28051-2A-28052에 의해 인식되는 이중 가닥 파단에서 Fad3C와 pDAS000341의 tGFP 카세트의 접합부로부터 증폭된 서열 정렬을 나타낸 것이다. ":"는 절단 부위에 위치하는 결실을 나타낸 것이다. 서열 300 내지 서열 313이 이 정렬에 제시된다. 도 20b는 ZFN 28051-2A-28052 및 ZFN 28053-2A-28054에 의해 인식되는 이중 가닥 파단에서 Fad3C와 pDAS000343의 tGFP 카세트의 접합부로부터 증폭된 서열 정렬을 나타낸 것이다. ":"는 절단 부위에 위치하는 결실을 나타낸 것이다. 서열 314 내지 서열 327이 이 정렬에 제시된다.
도 21, 패널 A 및 B는 ZFN 28051-2A-28052에 의해 인식되는 이중 가닥 파단에서 FAD3C와 pDAS000340의 hph 카세트의 접합부로부터 증폭된 서열의 서열 정렬을 나타낸 것이다. "샘플"은 분석된 각각의 식물에 대한 고유 식별자이다. ":"는 절단 부위에 위치하는 결실을 나타낸 것이다. 도 21a에 나타낸 서열은 5' 접합부에 대한 것이고, 도 21b에 나타낸 서열은 3' 접합부에 대한 것이다. 서열 368 내지 서열 375가 도 21a의 정렬에 제시된다. 서열 376 내지 서열 377이 도 21b의 정렬에 제시된다.
도 22는 ZFN 28053-2A-28054에 의해 인식되는 이중 가닥 파단에서 FAD3C과 pDAS000342의 hph 카세트의 접합부로부터 증폭된 서열의 서열 정렬을 나타낸 것이다. "샘플"은 분석된 각각의 식물에 대한 고유 식별자이다. ":"는 절단 부위에 위치하는 결실을 나타낸 것이다. 도 22에 나타낸 서열은 3' 접합부에 대한 것이다. 서열 378 내지 서열 379가 이 정렬에 제시된다.
도 23, 패널 a 및 b는 ZFN 28051-2A-28052에 의해 인식되는 이중 가닥 파단에서 FAD3C와 pDAS000340의 hph 카세트의 접합부로부터 증폭된 서열의 서열 정렬을 나타낸 것이다. ":"는 절단 부위에 위치하는 결실을 나타낸다. 도 23a에 나타낸 서열은 5' 접합부에 대한 것이고, 박스 (B)에 나타낸 서열은 3' 접합부에 대한 것이다. 서열 328 내지 서열 334이 도 23a의 정렬에 제시된다. 서열 335 내지 서열 342가 도 23b의 정렬에 제시된다.
도 24, 패널 a 및 b는 ZFN 28053-2A-28054에 의해 인식되는 이중 가닥 파단에서 FAD3C와 pDAS000342의 hph 카세트의 접합부로부터 증폭된 서열의 서열 정렬을 나타낸다. ":"는 절단 부위에 위치하는 결실을 나타낸다. 도 24a에 나타낸 서열은 5' 접합부에 대한 것이고, 도 24b에 나타낸 서열은 3' 접합부에 대한 것이다. 서열 343 내지 서열 346이 도 24a의 정렬에 제시된다. 서열 347 내지 서열 351이 도 24b의 정렬에 제시된다.
서열 목록
핵산 서열은 37 C.F.R. § 1.822에 정의된 바와 같은 뉴클레오티드 염기에 대한 표준 문자 약어를 사용하여 나타낸다. 각 핵산 서열의 단지 하나의 가닥을 나타내었지만, 상보적 가닥은 표시된 가닥을 임의로 참조하여 포함된다는 것이 이해된다.
상세한 설명
I. 여러 실시양태의 개관
본 발명의 실시양태는 통합된 핵산에 의해 영향을 받은 것 이외에 숙주의 다른 표현형에 크게 유해한 영향을 미치지 않는 숙주 게놈에서 외인성 핵산 (예를 들어, 트랜스진)의 표적화 통합에 대한 접근법을 확립한다. 일부 실시양태는 단일 숙주 게놈에서의 다중 핵산 "스택킹"에 사용될 수 있다. 이러한 접근법은 4가지의 상호연결 기술: 특이적 게놈 DNA 위치에서의 이중 가닥 파단의 도입을 허용하는 표적화 기술 (예를 들어, 문헌 [Puchta et al. (1993) Nucleic Acids Res. 21:5034-40; Siebert and Puchta (2002) Plant Cell 14:1121-31; D'Halluin et al. (2008) Plant Biotechnol. J. 6(1):93-102; Cai et al. (2009) Plant Mol. Biol. 69(6):699-709; Shukla et al. (2009) Nature 459(7245):437-41); Shan et al. (2103) Nature Biotechnol. 31:686-680; Le et al. (2013) Nature Biotechnol 31: 688-691; Nekrasov et al. (2013) Nature Biotechnol. 31:691-693, Ainely et al. (2013) Plant Biotechnol. J. (On Line 19 Aug)] 참조); 최적화된 외인성 (공여자) 핵산의 전달을 허용하는 전달 기술 (Bibikova et al. (2003) Science 300(5620):764); 표적화 공여자 DNA 통합을 위한 HDR 또는 NHEJ 빈도를 증가시키기 위한 숙주 유전자의 변형 (상동 재조합 또는 NHEJ 경로에 위치함)을 포함하는 통합 기술; 표적화 통합 사건을 풍부화 및 특성화하는 분석 툴; 및 형질전환된 숙주 유기체에 대해 크게 유해한 영향을 미치지 않고 세대에 걸쳐 유전학적으로 잘 정해지고 안정한 유전자 발현을 지지하는 목적한 특이적 숙주 게놈 위치 ("성능 유전자좌")의 개발 및 전개를 사용한다. 또한, 미국 특허 공개 20030232410; 20050208489; 20050026157; 20050064474; 20060188987; 20090263900; 20090117617; 20100047805; 20110207221; 20110301073; 2011089775; 20110239315; 20110145940; 20080182332; 20090205083; 20100199389; 20110167521을 참조한다. 예를 들어, 식물에서, 성능 유전자좌는 트랜스진이 유전자좌에 삽입된 트랜스제닉 식물의 농경학상 또는 품질 특성에 대한 부정적인 영향이 무시할 정도인 또는 존재하지 않는 유전자좌이다.
본원에 기재된 실시양태는 식물 FAD3 유전자가 외인성 핵산 (예를 들어, 유전자(들); 비-코딩 DNA 서열, 예컨대 조작된 랜딩 Pad (ELP) (미국 출원 12/011,735) 및 조작된 트랜스진 삽입 플랫폼 (ETIP) (출원중인 미국 출원 번호 61/697882); 및 식물 형질전환 유닛(들))의 표적화 삽입을 위한 성능 유전자좌라는 예상치 못한 발견의 이점을 이용한다. 식물의 FAD3 유전자좌의 보편적인 특성, 및 카놀라, 옥수수, 해바라기, 밀, 목화 및 대두에서의 FAD3의 변경 또는 녹-아웃이 농경학상 또는 품질 페널티를 수반하지 않는다는 증거는 FAD3 유전자좌가 상업적으로-관련된 식물 종에 걸친 광범위한 부류의 성능 유전자좌임을 확인시킨다.
일부 실시양태는, 예를 들어 표적-부위 특이적 DNA 인식 및 절단 단백질의 전달 및 발현에 기인한 FAD3 유전자좌에서의 부위-특이적 이중-가닥 DNA 절단을 이용한다. 구체적 예에서, 이러한 FAD3-특이적 DNA 인식 및 절단 단백질은, 예를 들어 제한 없이 ZFN; TALEN; RNA-유도 CRISPR-Cas9 시스템, 레콤비나제 (예를 들어, Cre, Hin, RecA, Tre 및 FLP 레콤비나제); 메가뉴클레아제 및 상기 중 임의의 것 또는 그의 등가물로부터 유래하는 조작된 단백질일 수 있다. 절단은 특이적 절단을 유도하기 위해 조작된 crRNA/tracr RNA ('단일 가이드 RNA')를 갖는 CRISPR/Cas 시스템을 사용하여 또한 수행할 수 있다. 일부 실시양태에서, 이러한 이중-가닥 파단은 FAD3 성능 유전자좌 내에, 예를 들어 상동성 지정 복구 (HDR) 또는 비-상동성 말단 연결 (NHEJ)에 의해 절단 부위로의 공여자 핵산의 통합을 통해 복구될 수 있다.
본 개시내용은, 예를 들어 카놀라 (브라시카 나푸스)의 FAD3A 또는 3C 유전자좌 및 FAD3A 또는 3C 유전자좌에 외인성 핵산을 통합하기 위해 이용될 수 있는 상응하는 FAD3-특이적 ZFN을 기재함으로써 성능 유전자좌로서의 FAD3 유전자좌의 유용성을 예시한다.
본 발명의 실시양태는 관련 기술분야에서 다수의 해결되지 않은 문제를 다룬다. 예를 들어, 본원에 기재된 표적화 통합 접근법의 선택성은 원치 않는 트랜스제닉 사례의 제거에 요구되는, 이 분야에 관련된 자원 및 힘든 규제 요건으로 인한 값비싼 반복되는 실지 시험의 필요성을 감소시키거나 또는 제거할 수 있다. 또한, 본원에 기재된 표적화된 DNA 삽입 접근법은 트랜스진 스택킹의 과정에서 특히 유익할 수 있다.
내인성 FAD3 유전자좌에서의 천연 뉴클레오티드 서열이 관심 핵산을 직접적으로 표적으로 하는데 사용될 수 있지만, 일부 실시양태에서 숙주로의 추가의 관심 핵산 분자의 통합이 용이해지도록, 핵산은 먼저 숙주의 적어도 하나의 FAD3 유전자좌를 표적으로 할 수 있다. 다른 예에서, 숙주 유기체의 천연 서열 (예를 들어, 본질적으로 무작위로 발생된 핵산 서열)과 상동이 아니고 DNA 인식 부위 (예를 들어, 아연 핑거 인식 부위)에 플랭킹된 뉴클레오티드 서열이 이용될 수 있다.
II. 용어
특허청구범위를 포함하여 본원에 사용된 바와 같은 단수 및 단수 형태의 용어 (예를 들어, "a," "an," 및 "the")는 그 내용이 달리 명백하게 나타내지 않는 한 복수 지시대상을 포함한다. 따라서, 예를 들어 "식물" ("plant," "the plant," 또는 "a plant")은 또한 다수의 식물을 지칭한다. 또한, 문맥에 따라, 용어 "식물"의 사용은 또한 그 식물의 유전적으로 유사하거나 또는 동일한 자손을 지칭할 수 있다. 유사하게, 용어 "핵산"은 핵산 분자의 다수의 카피를 지칭할 수 있다. 마찬가지로, 용어 "프로브"은 다수의 유사하거나 또는 동일한 프로브 분자를 지칭할 수 있다.
수치 범위는 범위를 한정하는 수를 포함하고, 한정 범위 내의 각각의 정수 및 비-정수 부분을 명백하게 포함한다. 달리 정의되지 않는 한, 본원에서 사용된 모든 전문 과학 용어는 통상의 기술자에 의해 통상적으로 이해되는 것과 동일한 의미를 갖는다.
본 개시내용에 기재된 다양한 실시양태에 관한 검토를 용이하게 하기 위해, 구체적인 용어의 다음 설명을 제공한다.
단리된: "단리된" 생물학적 성분 (예컨대 핵산 또는 단백질)은 성분의 화학적 또는 기능적 변화를 초래하면서 (예를 들어, 핵산은 핵산을 염색체의 나머지 DNA에 연결시키는 화학 결합을 파단하는 것에 의해 염색체로부터 단리될 수 있음), 그 성분이 자연 발생하는 유기체 세포의 다른 생물학적 성분 (즉, 다른 염색체 및 염색체-외 DNA 및 RNA 및 단백질)로부터 실질적으로 분리되거나, 분리되어 생성되거나, 또는 정제 분리된다. "단리된" 핵산 분자 및 단백질은 표준 정제 방법에 의해 정제된 핵산 분자 및 단백질을 포함한다. 또한, 이 용어는 숙주 세포에서 재조합 발현에 의해 제조된 핵산 및 단백질, 뿐만 아니라 화학적으로 합성된 핵산 분자, 단백질 및 펩티드를 포함한다.
교배시킨다: 식물에 관하여 본원에 사용된 바와 같은 용어 "교배시킨다" 또는 "교배시킨"은 자손 (예를 들어, 세포, 종자 및 식물)을 생산하기 위한 수분을 통한 배우자의 융합를 지칭한다. 이 용어는 유성 교배 (즉, 또 다른 것에 의한 하나의 식물의 수분) 및 자가 수분 (즉, 예를 들어 동일한 식물로부터의 화분 및 배주를 사용한 자가-수분) 둘 다를 포함한다.
역교배: 역교배 방법을 사용하여 핵산 서열을 식물에 도입할 수 있다. 이 기술은 신규 형질을 식물에 도입하기 위해 수십년 동안 널리 사용되어 왔다 (Jensen, N., Ed. Plant Breeding Methodology, John Wiley & Sons, Inc., 1988). 전형적인 역교배 프로토콜에서, 원래의 관심 품종 (반복친)을 이동시킬 관심 핵산 서열을 보유하는 제2 품종 (비-반복친)에 교배시킨다. 상기 교배로부터 생성되는 자손체는 이어서 다시 반복친과 교배되고, 이 과정을, 전환된 식물에서 반복친의 필수적으로 모든 목적하는 형태학적 및 생리학적 특징 뿐만 아니라 비-반복친으로부터의 핵산 서열이 복구되는 전환된 식물이 얻어질 때까지 반복된다.
유전자이입: 본원에 사용된 바와 같은 용어 "유전자이입"은 특정한 유전자좌에서 유전적 배경으로 대립유전자 (또는 외인성 핵산을 포함하는 변형된 대립유전자)의 전달을 지칭한다. 일부 실시양태에서, 유전자좌에서의 특정한 대립유전자의 유전자이입은 동일한 종의 2가지 모 사이의 유성 교배를 통해 대립유전자를 적어도 하나의 자손으로 전달함으로써 발생할 수 있고, 여기서 모 중 적어도 하나는 그의 게놈에서 특정한 대립유전자 형태를 갖는다. 특정한 대립유전자를 포함하는 자손은 바람직한 유전적 배경을 갖는 라인에 대해서 반복해서 역교배될 수 있다. 역교배 자손은 특정한 대립유전자 형태가 유전적 배경에서 고정되어 있는 새로운 품종을 생성하기 위해, 특정한 대립유전자 형태에 대해 선택될 수 있다. 일부 실시양태에서, 특정한 대립유전자의 유전자이입은 2가지 공여자 게놈 (예를 들어, 융합된 원형질체에서) 사이의 재조합에 의해 발생할 수 있고, 여기서 공여자 게놈 중 적어도 하나는 그의 게놈에서 특정한 대립유전자 형태를 갖는다. 유전자이입은, 예를 들어 제한 없이 분열 또는 변형된 대립유전자; 트랜스진; PTU; 및 ELP일 수 있는 특정한 대립유전자 형태의 전달을 포함할 수 있다.
생식질: 본원에 사용된 바와 같은 용어 "생식질"은 개별 식물, 식물의 군 (예를 들어, 식물 라인, 품종 및 패밀리) 및 식물 또는 식물의 군으로부터 유래한 클론의 또는 그로부터의 유전 물질을 지칭한다. 생식질은 유기체 또는 세포의 일부일 수 있거나, 유기체 또는 세포로부터 분리될 수 있다 (예를 들어, 단리됨). 일반적으로, 생식질은 식물의 유전성 품질을 위한 기준인 특정한 분자 구성을 갖는 유전 물질을 제공한다. 본원에 사용된 바와 같은 "생식질"은 특정한 식물의 세포; 종자; 특정한 식물의 조직 (예를 들어, 그로부터 새로운 식물이 성장할 수 있는 조직); 특정한 식물의 비-종자 부분 (예를 들어, 잎, 줄기, 수분 및 세포)을 지칭한다. 본원에 사용된 바와 같은 용어 "생식질"은 "유전 물질"과 동의어이고, 식물이 그로부터 전파될 수 있는 종자 (또는 다른 식물 물질)를 지칭하는데 사용될 수 있다. 그로부터 공지된 재배품종이 배양될 수 있고, 그로부터 새로운 재배품종이 생성될 수 있는 "생식질 은행"은 다양한 종자 또는 다른 유전 물질 (여기서 각각의 유전자형이 고유하게 확인됨)의 조직화된 콜렉션을 지칭할 수 있다.
유전자: 본원에 사용된 바와 같은 용어 "유전자" (또는 "유전 요소")는 기능적 중요성을 갖는 유전가능한 게놈 DNA 서열을 지칭할 수 있다. 유전자는 본래 핵산 또는 게놈에 통합된 핵산일 수 있다. 용어 "유전자"는 또한, 예를 들어 제한 없이 유전가능한 게놈 DNA 서열에 의해 코딩된 cDNA 및/또는 mRNA를 지칭하는데 사용될 수 있다.
핵산 분자: 본원에 사용된 바와 같은 용어 "핵산 분자"는 뉴클레오티드 (즉 리보뉴클레오티드, 데옥시리보뉴클레오티드, 및/또는 상기 중 어느 하나의 변형된 형태)의 중합체 형태를 지칭할 수 있다. 본원에 사용된 바와 같은 "핵산 분자"는 "핵산" 및 "폴리뉴클레오티드"와 동의어이다. 용어는 RNA, cDNA, 게놈 DNA의 센스 및 안티센스 가닥 둘 다, 및 그의 합성 형태 및 혼합된 중합체를 포함한다. 용어는 단일-가닥, 이중-가닥, 부분적으로 이중체화된, 삼중체화된, 헤어핀, 환상 및 잠긴 입체형태를 비롯한 임의의 구조적 입체형태를 포함한다. 핵산 분자는 자연 발생 및 변형된 뉴클레오티드 중 하나 또는 둘 다를 포함할 수 있다. 이러한 뉴클레오티드는 자연 발생 및/또는 비-자연 발생 뉴클레오티드 연결에 의해 함께 연결될 수 있다.
통상의 기술자에 의해 용이하게 이해되는 바와 같이, 핵산 분자는 화학적으로 또는 생화학적으로 변형될 수 있거나, 또는 유도체화된 뉴클레오티드 염기를 함유할 수 있다. 상기 변형은, 예를 들어 제한 없이 표지, 메틸화, 자연 발생 뉴클레오티드 중 하나 이상을 유사체로 치환, 뉴클레오티드간 변형 (예를 들어, 비하전된 연결, 예를 들어 메틸 포스포네이트, 포스포트리에스테르, 포스포르아미데이트 및 카르바메이트; 하전된 연결, 예를 들어 포스포로티오에이트 및 포스포로디티오에이트; 펜던트 모이어티, 예를 들어 펩티드; 삽입제, 예를 들어 아크리딘 및 프소랄렌; 킬레이트화제; 알킬화제; 및 변형된 연결, 예를 들어 알파 아노머 핵산)을 포함한다.
외인성: "외인성" 분자는 폴리뉴클레오티드의 뉴클레오티드 서열 및/또는 게놈 위치 (즉, 유전자좌)와 관련하여 (및 폴리펩티드의 아미노산 서열 및/또는 세포 위치와 관련하여) 특정한 시스템 (예를 들어, 생식질, 변종, 선발 변종 및/또는 식물)에 천연이 아닌 분자이다. 실시양태에서, 외인성 또는 이종성 폴리뉴클레오티드 또는 폴리펩티드는 생물계 (예를 들어, 식물 세포, 식물 유전자, 특정한 식물 종 또는 품종, 및/또는 식물 염색체)에 인공적으로 공급되었고 이러한 특정한 생물계에 대해 천연이 아닌 분자일 수 있다. 따라서, 핵산을 "외인성"으로 지정하는 것은 핵산이 자연 발생 공급원 이외의 공급원으로부터 유래되었음을 가리킬 수 있거나, 또는 핵산이 비-천연의 배향, 유전자 위치, 또는 요소 배열을 갖는 것을 가리킬 수 있다.
반면, 예를 들어 "천연" 또는 "내인성" 핵산은 자연에서 정상적으로 핵산이 발견되는 염색체 또는 다른 유전 물질에 정상적으로 존재하는 것들이 아닌 다른 핵산 요소는 함유하지 않는 핵산 (예컨대 유전자)이다. 내인성 유전자 전사체는 그의 천연 염색체 유전자좌의 뉴클레오티드 서열에 의해 코딩되고, 인공적으로 세포에 공급되지 않는다.
작동가능하게 연결된: 제1 핵산 서열이 제2 핵산 서열과 기능적 관계에 있을 때, 제1 뉴클레오티드 서열은 제2 핵산 서열과 작동가능하게 연결되어 있는 것이다. 예를 들어, 프로모터는 프로모터가 코딩 서열의 전사 또는 발현에 영향을 줄 때 코딩 서열과 작동가능하게 연결된 것이다. 재조합 방식으로 생산될 때, 작동가능하게 연결된 핵산 서열은 일반적으로 인접하고, 2개의 단백질-코딩 영역을 연결하기 위해 필요한 경우에 동일한 리딩 프레임에 존재한다. 그러나, 요소들이 작동가능하게 연결되기 위해 인접할 필요는 없다.
프로모터: 프로모터는 일반적으로 핵산의 전사를 증진시키는 핵산의 상류 (5' 영역 방향으로) 위치한 DNA의 영역이다. 프로모터는 작동가능하게 연결된 핵산(들)의 적절한 활성화 또는 억제를 허용한다. 프로모터는 전사 인자에 의해 인식되는 특정 서열을 함유한다. 이들 인자는 프로모터 DNA 서열에 결합하여 핵산의 코딩 영역으로부터 RNA를 합성하는 효소인 RNA 폴리머라제의 동원을 유도한다. 형질전환된: 벡터가 핵산 분자를 세포로 전달할 때 벡터는 세포를 "형질전환시킨다" 또는 "형질도입시킨다". 세포는 핵산 분자가 핵산 분자의 세포 게놈 내로의 도입에 의해 또는 에피솜 복제에 의해 세포에 의해 안정하게 복제될 때 핵산 분자에 의해 "형질전환"된 것이다. 본원에 사용된 바와 같은 용어 "형질전환"은 핵산 분자를 상기 세포 내로 도입할 수 있는 모든 기술을 포함한다. 예는 바이러스 벡터를 사용한 형질감염; 플라스미드 벡터를 사용한 형질전환; 전기천공 (Fromm et al. (1986) Nature 319:791-3); 리포펙션 (Felgner et al. (1987) Proc. Natl. Acad. Sci. USA 84:7413-7); 미세주사 (Mueller et al. (1978) Cell 15:579-85); 아그로박테리움-매개 전달 (Fraley et al. (1983) Proc. Natl. Acad. Sci. USA 80:4803-7); 직접 DNA 흡수; 및 미세입자 투사법 (Klein et al. (1987) Nature 327:70)을 포함하지만, 이에 제한되지는 않는다.
도입된: 본원에 사용된 바와 같은 용어 "도입된"은 세포 내로의 외인성 핵산의 전위에 관해 언급할 때, 관련 기술분야에서 이용가능한 임의의 방법론을 사용하는 핵산의 세포 내로의 혼입을 지칭한다. 이 용어는, 예를 들어 제한 없이 형질감염; 형질전환; 및 형질도입을 포함하는 핵산 도입 방법을 포함한다.
트랜스진: 본원에 사용된 바와 같은 용어 "트랜스진"은 관심 외인성 핵산 코딩 서열을 지칭한다. 예를 들어, 트랜스진은 산업적으로 또는 제약상 유용한 화합물 또는 바람직한 농업상 형질 (예를 들어, 제초제 저항성 또는 해충 저항성)에 기여하는 발현 산물을 코딩할 수 있다. 추가의 예에서, 트랜스진은 안티센스 핵산의 발현을 통해 표적 핵산 서열의 발현이 억제되는 것인, 안티센스 핵산일 수 있다. 트랜스진은 트랜스진에 작동가능하게 연결된 조절 서열 (예를 들어, 프로모터)을 포함할 수 있다. 일부 실시양태에서, FAD3 유전자좌에서의 부위-특이적 표적화에 의해 도입되는 관심 핵산 분자는 트랜스진이다. 그러나, 다른 실시양태에서, 관심 핵산 분자는 PTU, ELP, ETIP 또는 내인성 핵산 서열 (예를 들어, 여기서 내인성 핵산 서열의 추가의 외인성 게놈 카피가 바람직함)일 수 있다.
요소는 또한 구조적 RNA, 예컨대 shRNA를 코딩하는 DNA를 포함할 수 있다. 이러한 RNA는 제초제 저항성을 개시하거나 또는 부여하는데 영향을 미치는 것을 포함하지만 이에 제한되지 않는 외인성 또는 내인성 유전자를 변형시킬 수 있다.
재조합: 본원에 사용된 바와 같은 용어 "재조합"은 인간 개입에 의해 변경된 물질 (예를 들어, 핵산, 유전자, 폴리뉴클레오티드 및/또는 폴리펩티드)를 지칭한다. 예를 들어, 그의 발현 및/또는 활성을 최적화하기 위해, 예를 들어 재조합 분자의 부분 또는 요소의 배열이 그의 천연 배열이 아닐 수 있고/거나 재조합 분자의 일차 서열이 그의 천연 서열로부터 변화될 수 있다. 물질은 그의 천연 환경 또는 상태 내에서 재조합 물질을 생성하도록 변경될 수 있거나 또는 그로부터 제거될 수 있다. 한 예로서, 핵산의 오픈 리딩 프레임은, 오픈 리딩 프레임의 뉴클레오티드 서열이 그 천연 상황으로부터 제거되어, 인공 핵산 분자 (예를 들어, 벡터) 내로 클로닝되는 경우에 재조합된 것이다. 재조합 분자 (예를 들어, 재조합 핵산)을 생산하기 위한 프로토콜 및 시약은 관련 기술분야에서 일반적이고, 그의 용도는 일상적이다. 용어 "재조합"은 또한 본원에서 재조합 물질을 포함하는 세포 또는 유기체 (예를 들어, 재조합 핵산을 포함하는 식물 및/또는 식물 세포)를 지칭할 수 있다. 일부 예에서, 재조합 유기체는 트랜스제닉 유기체이다.
벡터: 본원에 사용된 바와 같은 용어 "벡터"는 적어도 하나의 핵산 절편(들)을 세포 내로 전달할 수 있는 폴리뉴클레오티드 또는 다른 분자를 지칭한다. 벡터는 벡터 유지를 매개하고/거나 그의 의도된 용도를 가능하게 하는 성분/요소 (예를 들어, 복제를 위해 필요한 서열, 약물 또는 항생제 저항성을 부여하는 유전자, 다중 클로닝 부위, 및/또는 클로닝된 유전자의 발현을 가능하게 하는 작동가능하게 연결된 프로모터/인핸서 요소)를 임의로 포함할 수 있다. 벡터는, 예를 들어 플라스미드, 박테리오파지 또는 식물 또는 동물 바이러스로부터 유래할 수 있다. "클로닝 벡터", "셔틀 벡터" 또는 "서브클로닝 벡터"는 클로닝 또는 서브클로닝 단계를 용이하게 하기 위해 작동가능하게 연결된 요소 (예를 들어, 다중 제한 엔도뉴클레아제 부위를 함유하는 다중 클로닝 부위)를 일반적으로 포함한다.
발현 벡터: 본원에 사용된 바와 같은 용어 "발현 벡터"는 특정한 숙주 유기체에서 코딩 서열의 발현을 용이하게 할 수 있는 작동가능하게 연결된 폴리뉴클레오티드 서열을 포함하는 벡터를 지칭한다. 예를 들어, 박테리아 발현 벡터는 박테리아에서 코딩 서열의 발현을 용이하게 할 수 있다. 마찬가지로, 식물 발현 벡터는 식물 세포에서 코딩 서열의 발현을 용이하게 할 수 있다. 원핵생물에서 발현을 용이하게 하는 폴리뉴클레오티드 서열은, 예를 들어 제한 없이 프로모터; 오퍼레이터; 및 리보솜 결합 부위를 포함할 수 있다. 진핵 발현 벡터 (예를 들어, 식물 발현 벡터)는, 예를 들어 프로모터; 인핸서; 종결 신호; 및 일반적으로 원핵 발현 벡터에서 사용된 것과 상이한 폴리아데닐화 신호 (및 다른 서열)을 포함할 수 있다.
서열 동일성: 2개의 핵산 또는 폴리펩티드 서열과 관련하여 본원에 사용된 바와 같은 용어 "서열 동일성" 또는 "동일성"은 명시된 비교창에 대해 최대로 상응하도록 정렬하였을 때, 2개의 서열 중의 동일한 잔기를 지칭한다. 서열 동일성의 값은 비교창에 대해 2개의 최적화로 정렬된 서열 (예를 들어, 핵산 서열 및 아미노산 서열)을 비교함으로써 결정할 수 있고, 여기서 비교창 내의 서열의 일부는 2개의 서열의 최적 정렬을 위해 참조 서열 (첨가 또는 결실을 포함하지 않는 것)에 비해 첨가 또는 결실 (즉, 갭)을 포함할 수 있다. 서열 동일성은 동일한 뉴클레오티드 또는 아미노산 잔기가 서열 둘 다에 존재하는 위치의 개수를 결정함으로써 매칭되는 위치의 개수를 구하고, 매칭되는 위치의 개수를 비교창 내의 위치의 총 개수로 나누고, 그 결과치에 100을 곱하여 서열 동일성 백분율을 구함으로써 백분율로서 계산된다.
비교를 위해 서열을 정렬하는 방법은 관련 기술분야에 익히 공지되어 있다. 다양한 프로그램 및 정렬 알고리즘은, 예를 들어 문헌 [Smith and Waterman (1981) Adv. Appl. Math. 2:482; Needleman and Wunsch (1970) J. Mol. Biol. 48:443; Pearson and Lipman (1988) Proc. Natl. Acad. Sci. U.S.A. 85:2444; Higgins and Sharp (1988) Gene 73:237-44; Higgins and Sharp (1989) CABIOS 5:151-3; Corpet et al. (1988) Nucleic Acids Res. 16:10881-90; Huang et al. (1992) Comp. Appl. Biosci. 8:155-65; Pearson et al. (1994) Methods Mol. Biol. 24:307-31; Tatiana et al. (1999) FEMS Microbiol. Lett. 174:247-50]에 기재되어 있다. 서열 정렬 방법 및 상동성 계산에 관한 상세한 고려 사항은 문헌 [Altschul et al. (1990) J. Mol. Biol. 215:403-10]에서 찾아볼 수 있다.
여러 서열 분석 프로그램과 함께 사용하기 위한 것으로 미국 국립 생물 정보 센터 (NCBI)의 베이직 로컬 얼라인먼트 서치 툴(Basic Local Alignment Search Tool: BLAST™; Altschul et al. (1990))은 서열을 정렬하기 위해 사용할 수 있고, 미국 국립 생물 정보 센터 (메릴랜드주 베데스다)를 비롯한 여러 공급원으로부터, 및 인터넷 상에서 이용가능하다. 상기 프로그램을 사용하여 서열 동일성을 결정하는 방법에 관한 설명은 인터넷 상에서 BLAST™에 대한 "도움말" 섹션에서 이용가능하다. 핵산 서열의 비교를 위해, 디폴트 파라미터를 사용하여 BLAST™ (Blastn) 프로그램의 "Blast 2 서열" 기능을 사용할 수 있다. 참조 서열에 대해 보다 큰 유사성을 갖는 핵산 서열은 상기 방법에 의해 평가되었을 때 증가된 동일성 백분율을 나타낼 것이다.
본원에서 사용되는 바와 같은 용어 "실질적으로 동일한"은 80% 초과로 동일한 뉴클레오티드 서열을 지칭할 수 있다. 예를 들어, 실질적으로 동일한 뉴클레오티드 서열은 참조 서열에 대해 적어도 85%; 적어도 86%; 적어도 87%; 적어도 88%; 적어도 89%; 적어도 90%; 적어도 91%; 적어도 92%; 적어도 93%; 적어도 94%; 적어도 95%; 적어도 96%; 적어도 97%; 적어도 98%; 적어도 99%; 또는 적어도 99.5% 동일할 수 있다.
유전자좌: 본원에서 사용되는 바와 같은 용어 "유전자좌"는 측정가능한 특징 (예를 들어, 형질)에 해당하는 게놈 상의 위치를 지칭한다. 일부 실시양태에서, 특정한 관심 유전자좌는 FAD3 유전자의 게놈 위치이며, 여기서 이 유전자의 분열이 야생형 유전자로부터 전사된 mRNA의 발현을 감소시키거나 또는 제거한다. 유전자좌는 서던 혼성화 또는 PCR 동안 유전자좌 내에 함유된 특유한 뉴클레오티드 서열과 혼성화되는 프로브에 의해 정의될 수 있다.
마커: 본원에 사용된 바와 같은 "마커"는 특정한 대립유전자를 가질 가능성이 있고/거나 특정한 형질 또는 표현형을 나타낼 가능성이 있는 식물을 확인하는데 사용될 수 있는 유전자 또는 뉴클레오티드 서열을 지칭한다. 마커는 주어진 게놈 유전자좌에서의 변이로서 기재될 수 있다. 유전자 마커는 짧은 DNA 서열, 예컨대 단일 염기-쌍 변화 (단일 뉴클레오티드 다형성, 또는 "SNP")를 둘러싸는 서열, 또는 긴 서열, 예를 들어 미소부수체/단순 서열 반복체 ("SSR")일 수 있다. "마커 대립유전자"는 특정한 식물에 존재하는 마커의 버전을 지칭한다. 본원에 사용된 바와 같은 용어 마커는 식물 염색체 DNA의 클로닝된 절편 (예를 들어, FAD3 유전자좌, 또는 변형 및/또는 분열된 FAD3 유전자좌를 포함하는 절편)을 지칭할 수 있고, 또한 또는 대안적으로 식물 염색체 DNA의 클로닝된 절편에 상보적인 DNA 분자를 지칭할 수 있다. 통상의 기술자에 의해 인식되는 바와 같이, 마커에 포함시키기 위한 부가적인 인접 뉴클레오티드 서열을 수득하는 과정은 거의 무한정 반복될 수 있으며 (염색체의 길이에 의해서만 제한됨), 이에 따라 염색체에 따른 부가적인 마커가 확인된다. 상기 기재된 임의의 모든 마커의 변이가 본 발명의 일부 실시양태에서 사용될 수 있다.
일부 실시양태에서, 생식질 중의 트랜스진 또는 마커의 존재 (이것은 "표적" 서열을 특징으로 함)는 핵산 프로브; 예를 들어, 올리고뉴클레오티드를 사용함을 통해 검출될 수 있다. 프로브는 DNA 분자, 또는 RNA 분자일 수 있다. 올리고뉴클레오티드 프로브는 합성하여 또는 클로닝에 의해 제조될 수 있다. 적합한 클로닝 벡터는 통상의 기술자에게 익히 공지되어 있다. RNA 프로브는 관련 기술분야에 공지된 수단에 의해, 예를 들어 DNA 분자 주형을 사용하여 합성될 수 있다.
올리고뉴클레오티드 프로브는 표지될 수 있거나 또는 표지되지 않을 수 있다. 예를 들어, 제한 없이 닉 번역에 의한 방사성 표지; 무작위 프라이밍; 및 말단 데옥시트랜스퍼라제를 사용한 꼬리달기를 포함하는 광범위한 기술이 핵산 분자를 표지하기 위해 존재하고, 이때 사용된 뉴클레오티드는, 예를 들어 방사성 32P로 표지된다. 사용될 수 있는 다른 표지는, 예를 들어 제한 없이 형광단; 효소; 효소 기질; 효소 보조인자; 및 효소 억제제를 포함한다. 대안적으로, 그 자체로 또는 다른 반응성 작용제와 함께 검출가능한 신호를 제공하는 표지를 사용하는 것이 수용체가 결합하는 리간드에 의해 대체될 수 있고, 이때 수용체는 그 자체로 또는 다른 시약과 함께 검출가능한 신호를 제공하도록 표지된다 (예를 들어, 상기 나타낸 표지에 의해). 예를 들어, 문헌 [Leary et al. (1983) Proc. Natl. Acad. Sci. USA 80:4045-9]을 참조한다.
프로브는 검출하고자 하는 트랜스진 또는 마커의 정확한 카피일 수 있다. 프로브는 또한 검출할 트랜스진 또는 마커를 포함하는 염색체 DNA의 클로닝된 절편과 실질적으로 동일한 뉴클레오티드 서열을 포함하거나, 또는 이로 이루어지는 핵산 분자일 수 있다. 프로브는 추가의 핵산 서열, 예를 들어 프로모터; 전사 신호; 및/또는 벡터 서열을 추가로 포함할 수 있다.
프로브는 표적 뉴클레오티드 서열의 전부 또는 일부 및 게놈으로부터의 추가의 인접 뉴클레오티드 서열을 함유할 수 있다. 이는 본원에서 "인접 프로브"로서 지칭된다. 통상적으로 이해되는 바와 같이, 염색체로부터의 인접 뉴클레오티드 서열이 최초 마커의 5'측에 있느냐 또는 3'측에 있느냐에 따라, 인접 뉴클레오티드 서열은 최초 표적의 "상류" 또는 "하류"로서 지칭된다. 프로브는 또한 최초 표적의 뉴클레오티드 서열에 인접하지 않는 뉴클레오티드 서열을 함유할 수 있고; 상기 프로브는 본원에서 "비-인접 프로브"로서 지칭된다. 비-인접 프로브의 서열은 비-인접 프로브가 최초 마커 또는 트랜스진에 연결되도록 염색체의 최초 표적의 서열에 충분히 근접하게 위치할 수 있다.
일부 실시양태에서, 프로브는 검출할 표적의 정확한 카피에 "특이적으로 혼성화가능한" 또는 "특이적으로 상보적인" 핵산 분자이다. "특이적으로 혼성화가능한" 및 "특이적으로 상보적인"은 핵산 분자와 표적간에 안정하고 특이적인 결합이 일어나도록 하는 충분한 정도의 상보성을 가리키는 용어이다. 핵산 분자는 특이적으로 혼성화가능할 수 있는 것이 되기 위해 그의 표적 서열에 대하여 100% 상보적일 필요는 없다. 특이적 결합이 바람직한 조건 하에, 예를 들어 엄격한 혼성화 조건 하에 핵산이 비-표적 서열에 비-특이적으로 결합하는 것을 방지하는 충분한 정도의 상보성이 존재하는 경우에 핵산 분자가 특이적으로 혼성화할 수 있다.
특정한 정도의 엄격성에 이르게 하는 혼성화 조건은 선택되는 혼성화 방법의 특성, 및 혼성화 핵산 서열의 조성 및 길이에 따라 달라질 것이다. 일반적으로, 혼성화 온도 및 혼성화 완충제의 이온 강도 (특히, Na+ 및/또는 Mg++ 농도)가 혼성화의 엄격성을 결정할 것이지만, 세척 시간 또한 엄격성에 영향을 미친다. 특정한 정도의 엄격성을 달성하는데 필요한 혼성화 조건에 관한 계산은 관련 기술분야의 통상의 기술자에게 공지되어 있고, 이는, 예를 들면 문헌 [Sambrook et al. (ed.) Molecular Cloning: A Laboratory Manual, 2nd ed., vol. 1-3, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY, 1989, chapters 9 and 11; 및 Hames and Higgins (eds.) Nucleic Acid Hybridization, IRL Press, Oxford, 1985]에 논의되어 있다. 핵산 혼성화에 관한 추가의 상세한 지침서 및 안내를, 예를 들어 문헌 [Tijssen, "Overview of principles of hybridization and the strategy of nucleic acid probe assays," in Laboratory Techniques in Biochemistry and Molecular Biology- Hybridization with Nucleic Acid Probes, Part I, Chapter 2, Elsevier, NY, 1993; 및 Ausubel et al., Eds., Current Protocols in Molecular Biology, Chapter 2, Greene Publishing and Wiley-Interscience, NY, 1995]에서 찾아볼 수 있다.
본원에 사용된 바와 같은 "엄격한 조건"은 혼성화 분자와 DNA 표적 사이에 25% 미만의 미스매치가 존재하는 경우에만 혼성화가 발생할 조건을 포함한다. "엄격한 조건"은 특정한 수준의 염격성을 추가로 포함한다. 따라서, 본원에 사용된 바와 같은 "온건한 엄격성" 조건은 25% 초과의 서열 미스매치가 있는 분자가 혼성화하지 않을 조건이고, "중간 엄격성"의 조건은 15% 초과의 미스매치가 있는 분자가 혼성화하지 않을 조건이며, "높은 엄격성"의 조건은 10% 초과의 미스매치가 있는 서열이 혼성화하지 않을 조건이다. "매우 높은 엄격성"의 조건은 6% 초과의 미스매치가 있는 서열이 혼성화하지 않을 조건이다.
특정한 실시양태에서, 엄격한 조건은 65℃에서 6x 염수-시트르산나트륨 (SSC) 완충제, 5x 덴하르트 용액, 0.5% SDS 및 100 μg 전단 연어 고환 DNA 중에서 혼성화한 후, 65℃에서 2x SSC 완충제 및 0.5% SDS에 이어서 1x SSC 완충제 및 0.5% SDS, 및 최종적으로 0.2x SSC 완충제 및 0.5% SDS를 사용하여 순차적으로 15-30분 세척하는 것이다.
연관 (불)평형: 본원에 사용된 바와 같은 용어 "연관 평형"은 마커 및 제2 핵산 (예를 들어, 트랜스진, PTU 및 제2 마커)이 독립적으로 분리된 상황을 지칭하며; 즉, 마커 및 제2 핵산이 자손 중에 무작위로 정렬되는 것이다. 연관 평형을 나타내는 핵산은 (이것이 동일한 염색체 상에 있든지 아니든지) 연관되지 않은 것으로 간주된다. 본원에 사용된 바와 같은 용어 "연관 불평형"은 마커 및 제2 핵산이 비-무작위 방식으로 분리되는 상황을 지칭하며; 즉, 핵산은 50% 미만 (및 정의에 의해 따라서 동일한 연결 기에 대해 50 cM 미만으로 분리됨)의 재조합 빈도를 갖는다. 일부 예에서, 연관 불평형을 나타내는 핵산은 연관된 것으로 간주된다.
연관된, 긴밀하게 연관된, 및 극도로 긴밀하게 연관된: 본원에 사용된 바와 같은 마커와 제2 핵산 (예를 들어, 트랜스진, PTU 및 제2 마커) 사이의 연관은 염색체 상의 핵산이 차세대에서 개체에게 함께 전달되는 측정가능한 확률을 나타내는 현상를 지칭할 수 있다. 따라서, 제2 핵산에 대한 하나의 마커의 연관은 재조합 빈도로서 측정 및/또는 표현할 수 있다. 2개의 핵산이 서로 근접할수록, 이 확률은 "1"에 근접하게 된다. 따라서, 용어 "연관된"은 제2 핵산과 함께 0.5보다 큰 확률 (마커/유전자가 상이한 염색체 상에 위치하는 독립적인 분류로부터 예상되는 것)로 전달되는 하나 이상의 유전자 또는 마커를 지칭할 수 있다. 유전자 (예를 들어, 트랜스진)의 존재가 개체에서의 표현형에 기여할 때, 그 유전자와 연관된 마커는 그 표현형과 연관되어 있는 것으로 볼 수 있다. 따라서, 용어 "연관된"은 마커와 유전자, 또는 마커와 표현형 사이의 관계를 지칭할 수 있다.
상대 유전자 거리 (교차 빈도에 의해 결정되고, 센티모르간 (cM)으로 측정됨)는 일반적으로 2개의 연관된 마커 또는 유전자가 염색체 상에서 서로 분리되는 물리적 거리 (염기 쌍으로 측정됨)에 비례한다. 1 센티모르간은 1% 재조합 빈도 (즉, 교차 사례가 2개의 마커 사이에서 100개의 세포 분열마다 1회 발생)를 나타내는 2개의 유전자 마커 사이의 거리로서 정의된다. 일반적으로, 하나의 마커가 또 다른 마커 또는 유전자에 보다 근접할수록 (이들 사이의 거리가 유전자 거리 또는 물리적 거리의 관점에서 측정되든지 아니든지), 이것은 보다 긴밀하게 연관된다. 염색체 거리가 형질 사이의 재조합 사례의 빈도에 대략 비례하기 때문에, 재조합 빈도와 관련된 대략적인 물리적 거리가 존재한다. 이 상관관계는 일반적으로 공지되어 있거나 또는 주요 작물 식물 (Helentjaris and Burr (eds.) (1989) Development 및 Application of Molecular Markers to Problems in Plant Genetics. Cold Spring Harbor Laboratory, Cold Spring Harbor, NY; Gresshoff (ed.) (1994) Plant Genome Analysis. CRC Press, Boca Raton, FL; Lander et al. (1987) Genomics 1:174-81; Tanksley et al. (1988) "Molecular mapping of plant chromosomes," In Chromosome Structure and Function. Gustafson and Appels (eds.) Plenum Press, NY, pp. 157-73) 및 다른 다수의 유기체에 걸쳐 용이하게 결정가능하다. 예를 들어, 1 cM은 효모에서 약 2.5-3.0 kb, 아라비돕시스(Arabidopsis)에서 약 140 kb, 해바라기의 약 400 kb 및 유칼립투스(Eucalyptus)에서 약 350 kb에 상응한다.
용어 "연관된"은 본원에서 50% 미만의 재조합 빈도 (즉, 50 cM 미만)를 나타내는 하나 이상의 핵산을 지칭할 수 있다. 예를 들어, "연관된" 핵산은 약 45% 이하, 약 40% 이하, 약 35% 이하, 약 30% 이하, 약 25% 이하, 약 20% 이하, 약 15% 이하, 및 약 10% 이하의 빈도로 재조합될 수 있다. 상기 재조합 빈도에 상응하는 동일한 염색체 (상이한 염색체 상의 핵산이 연관 평형에 있을 것으로 예상됨) 상의 이러한 핵산 사이의 물리적 거리는 숙주 게놈에 좌우되고, 상기 문헌에 제시된 바와 같이 용이하게 계산될 수 있다.
본원에 사용된 바와 같은 용어 "긴밀하게-연관된"은 약 20% 이하 (즉, 약 20 cM 이하)의 재조합 빈도를 나타내는 하나 이상의 핵산를 지칭할 수 있다. 예를 들어, "긴밀하게 연관된" 핵산은 22% 이하, 약 18% 이하, 약 16% 이하, 약 14% 이하, 약 12% 이하, 약 10% 이하, 약 8% 이하, 약 6% 이하, 약 4% 이하, 및 약 2% 이하의 빈도로 재조합될 수 있다.
본원에 사용된 바와 같은 용어 "극도로 긴밀하게 연관된"은 약 10% 이하의 재조합 빈도 (즉, 약 10 cM 이하)를 나타내는 하나 이상의 핵산를 지칭할 수 있다. 예를 들어, "극도로 긴밀하게 연관된" 핵산은 11% 이하, 약 9% 이하, 약 8% 이하, 약 7% 이하, 약 6% 이하, 약 5% 이하, 약 4% 이하, 약 3% 이하, 약 2% 이하, 및 약 1% 이하의 빈도로 재조합될 수 있다.
특정한 핵산이 특정한 표현형에 기여하는 폴리펩티드를 코딩하는 유전자에 근접할수록 (유전적 또는 물리적 거리의 관점에서 측정되든지 아니든지), 특정한 핵산은 표현형에 더 긴밀하게-연관된 것이다. 상기를 고려하여, 특정한 유전자 또는 표현형에 연관된 핵산이 유전자 또는 표현형에 긴밀하게 연관된 핵산, 및 극도로 긴밀하게 연관된 핵산을 포함한다는 것이 인식될 것이다. 일부 실시양태에서, 유전적 또는 물리적 거리의 관점에서 측정되든지 아니든지, 특정한 핵산이 FAD3 유전자좌 (예를 들어, 변형 또는 분열된 FAD3 유전자좌)에 더 근접할수록, 특정한 핵산은 FAD3 유전자좌에서 통합된 외인성 핵산에 의해 부여된 임의의 형질/표현형 (또는 비변형된 유전자좌의 경우에 야생형 FAD3 표현형)에 더 긴밀하게-연관된 것이다. 따라서, 통합된 외인성 핵산을 포함하는 FAD3 유전자좌에 연관된, 긴밀하게 연관된 및/또는 극도로 긴밀하게 연관된 유전자 마커는 통합된 핵산을 포함하는 유기체 (예를 들어, 식물 및 식물 품종)를 확인하고, 통합된 핵산에 의해 부여된 표현형을 포함하는 유기체를 확인하고, 이러한 통합된 핵산 및/또는 통합된 핵산에 의해 부여된 표현형을 다른 적합한 유기체 내에서 육종하기 위한 MAS 프로그램에서 유용할 수 있다.
마커-지원 육종: 본원에 사용된 바와 같은 용어 "마커-지원 육종"은 직접적으로 1종 이상의 형질(들) (예를 들어, 다유전자 형질)에 대한 육종 식물에 대한 접근법을 지칭할 수 있다. 현행 실무에서, 식물 육종가는 용이하게 검출가능한 형질, 예컨대 농경학적으로 목적하는 형질과 연관되어 있는 화색, 종피 외관, 또는 동종효소 변이체를 확인하고자 시도한다. 이어서 식물 육종가들은 용이하게 검출가능한 형질의 분리를 추적함으로써 분리 육종 집단에서의 농경학상 형질을 추적한다. 그러나, 식물 육종에 사용하기 위해 이용가능한 용이하게 검출가능한 형질과 관심 형질 사이의 이들 연관 관계는 거의 없다. 본 발명의 일부 실시양태에서, 마커-지원 육종은, 관심 형질에 기여하는 외인성 핵산이 통합된 FAD3 유전자좌에 연관된 하나 이상의 유전자 마커 (예를 들어, SNP, 동종효소 및/또는 SSR 마커)를 확인하고, 하나 이상의 유전자 마커의 분리를 추적함으로써 분리 육종 집단을 추적하는 것을 포함한다. 일부 예에서, 하나 이상의 유전자 마커의 분리는 하나 이상의 유전자 마커의 존재에 대해 자손 식물로부터 유전자 샘플을 분석함으로써 하나 이상의 유전자 마커에 대한 프로브를 이용하여 결정될 수 있다. 마커-지원 육종은 식물 품종의 개량을 위한 시간- 및 비용-효과적인 과정을 제공한다.
형질 또는 표현형: 용어 "형질" 및 "표현형"은 상호교환가능하게 본원에서 사용된다. 본 개시내용의 목적을 위해, 특정한 관심 형질은, 예를 들어 작물 식물에서 발현될 수 있는 바와 같이 농경학적으로 중요한 형질, 및 표적화 통합 사례로부터의 트랜스진 발현 생성물의 제조를 포함한다. 용어 "분자 표현형"은 분자 (하나 이상)의 집단의 수준이 검출가능한 것인 표현형을 지칭할 수 있다. 일부 예에서, 분자 표현형은 분자 수준에서만 검출가능한 것일 수 있다. 표현형의 검출가능한 분자는 핵산 (예를 들어, 게놈 DNA 또는 RNA); 단백질; 및/또는 대사물일 수 있다. 예를 들어, 분자 표현형은 하나 이상의 유전자 산물에 대한 발현 프로파일 (예를 들어, 식물 발생의 특정한 단계에서, 또는 환경 조건 또는 스트레스에 대한 반응으로)일 수 있다.
정량적 형질 유전자좌: 유전적 영향 (상가적, 우성 및 상위성) 및 환경적 영향으로 인해 계속 달라지는 형질은 통상적으로 "정량적 형질"로서 지칭된다. 정량적 형질은 2개 인자; 표현형의 연속 분포를 생성하는 유전자 발현에 대한 환경적 영향 및 다유전자성 유전에 의해 생성되는 복합 분리 패턴에 기반한 "정성적" 또는 "이산" 형질로 구별될 수 있다. 정량적 형질의 발현에 연관된 게놈의 하나 이상 영역의 확인은 정량적 형질 유전자좌 ("QTL")와 같은 영역으로 정의한다.
식물: 본원에 사용된 바와 같은 용어 "식물"은 전체 식물, 식물로부터 유래한 세포 또는 조직 배양물 및/또는 상기 중 임의의 것의 임의의 부분를 지칭할 수 있다. 따라서, 용어 "식물"은, 예를 들어 제한 없이 전체 식물; 식물 성분 및/또는 기관 (예를 들어, 잎, 줄기 및 뿌리); 식물 조직; 종자; 및 식물 세포를 포함한다. 식물 세포는, 예를 들어 제한 없이 식물 내의 세포 및/또는 식물 세포, 식물로부터 단리된 세포 및 식물로부터 단리된 세포의 배양을 통해 획득한 세포일 수 있다.
"트랜스제닉 식물"은 그의 세포 중 적어도 하나에 외인성 폴리뉴클레오티드를 포함하는 식물이다. 용어 "트랜스제닉"은 본원에서 임의의 세포, 세포주, 캘러스, 조직, 식물 부분 또는 그의 유전자형이 외인성 핵산의 존재에 의해 변경된 식물을 지칭하는데 사용된다. 따라서, 이 용어는 외인성 폴리뉴클레오티드를 포함하도록 초기에 변경되고 초기 트랜스제닉 유기체 또는 세포의 교배 또는 무성 번식에 의해 생성된 것인 트랜스제닉 유기체 및 세포를 포함한다. 본원에 사용된 바와 같은 용어 "트랜스제닉"은 종래 식물 육종 방법 (예를 들어, 단지 비-트랜스제닉 유기체의 교배) 또는 자연 발생 사례 (예를 들어, 무작위 교배-수정, 비-재조합 바이러스 감염, 비-재조합 박테리아 형질전환, 비-재조합 전위 및 자발적 돌연변이)에 의해 도입된 게놈 (염색체 또는 염색체외) 교대를 포함하지 않는다.
식물 "라인", "품종" 또는 "균주"는 동일한 혈통을 갖는 개별 식물의 군이다. 식물 라인은 일반적으로 어느 정도로 근교배되고, 일반적으로 대부분의 유전자좌 (예를 들어, FAD3 유전자좌)에서 동형접합 및 동종이다. "서브라인"은 동일한 선조로부터 유래한 다른 유사한 근교배 하위세트와 유전적으로 구분되는 공통 선조로부터의 후손의 근교배 하위세트를 지칭할 수 있다. 일부 실시양태에서, "서브라인"은 나머지 분리 유전자좌가 유전자좌의 대부분 또는 전부에 걸쳐 동형접합일 때까지 F3 내지 F5 세대에서 선택된 개별 트랜스제닉 식물로부터 종자를 근교배시킴으로써 생성될 수 있다.
"결합 단백질"은 또 다른 분자와 결합할 수 있는 단백질이다. 결합 단백질은, 예를 들어 DNA 분자 (DNA-결합 단백질), RNA 분자 (RNA-결합 단백질) 및/또는 단백질 분자 (단백질-결합 단백질)에 결합할 수 있다. 단백질-결합 단백질의 경우, 이는 자신에게 결합할 수 있고/있거나 (동종이량체, 동종삼량체 등을 형성), 상이한 단백질 또는 단백질들의 하나 이상의 분자에 결합할 수 있다. 결합 단백질은 결합 활성의 유형이 한가지를 초과할 수 있다. 예를 들어, 아연 핑거 단백질은 DNA-결합 활성, RNA-결합 활성 및 단백질-결합 활성을 갖는다.
"아연 핑거 DNA 결합 단백질" (또는 결합 도메인)은 하나 이상의 아연 핑거를 통해 서열-특이적 방식으로 DNA에 결합하는, 단백질 또는 더 큰 단백질 내의 도메인이고, 이때 상기 아연 핑거는 아연 이온의 배위를 통해 구조가 안정화되는 결합 도메인 내의 아미노산 서열의 영역이다. 용어 아연 핑거 DNA 결합 단백질은 종종 아연 핑거 단백질 또는 ZFP로 약칭된다.
"TALE DNA 결합 도메인" 또는 "TALE"은 하나 이상의 TALE 반복 도메인/단위를 포함하는 폴리펩티드이다. 반복 도메인은 TALE의 그의 동족 표적 DNA 서열에 대한 결합에 관여한다. 단일 "반복 단위" ("반복체"로도 언급됨)는 일반적으로 33-35개 아미노산 길이이고, 자연 발생 TALE 단백질 내의 다른 TALE 반복 서열과 적어도 몇몇의 서열 상동성을 나타낸다.
아연 핑거 및 TALE 결합 도메인은, 예를 들어 자연 발생 아연 핑거 또는 TALE 단백질의 인식 나선 영역의 조작 (하나 이상의 아미노산의 변경)을 통해 소정의 뉴클레오티드 서열에 결합하도록 "조작"될 수 있다. 따라서, 조작된 DNA 결합 단백질 (아연 핑거 또는 TALE)은 비-자연 발생 단백질이다. DNA-결합 단백질의 조작 방법의 비-제한적 예는 설계 및 선택이다. 설계된 DNA 결합 단백질은 그의 설계/조성이 주로 합리적인 기준에 의해 이루어지는 자연에서 발생하지 않는 단백질이다. 설계의 합리적인 기준은 존재하는 ZFP 및/또는 TALE 설계 및 결합 데이터의 데이터베이스 저장 정보에서의 정보 처리를 위한 치환 규칙 및 컴퓨터 알고리즘의 적용을 포함한다. 예를 들어, 미국 특허 6,140,081; 6,453,242; 및 6,534,261; 또한 WO 98/53058; WO 98/53059; WO 98/53060; WO 02/016536 및 WO 03/016496 및 미국 공개공보 번호 20110301073을 참조한다.
"선택된" 아연 핑거 단백질 또는 TALE는 그의 생산이 주로 실험 처리, 예컨대 파지 디스플레이, 상호작용 트랩 또는 하이브리드 선택에 의해 이루어지는 자연에서 발견되지 않는 단백질이다. 예를 들어, US 5,789,538; US 5,925,523; US 6,007,988; US 6,013,453; US 6,200,759; WO 95/19431; WO 96/06166; WO 98/53057; WO 98/54311; WO 00/27878; WO 01/60970, WO 01/88197, WO 02/099084 및 미국 공개공보 번호 20110301073을 참조한다.
"절단"은 DNA 분자의 공유결합 백본의 파단을 지칭한다. 포스포디에스테르 결합의 효소적 또는 화학적 가수분해를 포함하지만 이에 제한되지 않는 다양한 방법에 의해 절단이 개시될 수 있다. 단일-가닥 절단 및 이중-가닥 절단 둘 다 가능하고, 이중-가닥 절단은 2개의 별도의 단일-가닥 절단 사례의 결과로서 발생할 수 있다. DNA 절단으로 평활 말단 또는 엇갈린 말단이 생산될 수 있다. 특정 실시양태에서, 융합 폴리펩티드가 표적화된 이중-가닥 DNA 절단에 사용된다.
"절단 절반-도메인"은, 제2의 폴리펩티드 (동일하거나 상이함)와 함께, 절단 활성 (바람직하게는 이중-가닥 절단 활성)을 갖는 복합체를 형성하는 폴리펩티드 서열이다. 용어 "제1 및 제2 절단 절반-도메인", "+ 및 - 절단 절반-도메인" 및 "우측 및 좌측 절단 절반-도메인"은 이량체화하는 절단 절반-도메인의 쌍을 지칭하는데 상호교환가능하게 사용된다.
"조작된 절단 절반-도메인"은 또 다른 절단 절반-도메인 (예를 들어, 또 다른 조작된 절단 절반-도메인)과 절대적 이종이량체를 형성하도록 변형된 절단 절반-도메인이다. 또한, 그 전문이 본원에 참조로 포함된 미국 특허 공개공보 번호 2005/0064474, 20070218528, 2008/0131962 및 2011/0201055를 참조한다.
이중 가닥 DNA 파단을 생성하는 수단: 본원에 사용된 바와 같은 용어 "이중 가닥 DNA 파단을 생성하는 수단"은 35 U.S.C. § 112, 제6 단락에서의 의회에 의해 공인된 특별한 청구 조항을 원용하도록 의도된다. 특히, "이중 가닥 DNA 파단을 생성하는 수단"은 이중-가닥 DNA 분자의 양쪽 가닥을 절단할 수 있는 분자 구조를 지칭한다. 이러한 구조는 다수의 공지된 뉴클레아제 단백질, 예를 들어 FokI 뉴클레아제 도메인 내에 포함되는 폴리펩티드 도메인을 포함하며, 촉매 도메인은 단백질 Mmel, 콜리신-E7 (CEA7_ECOLX), 콜리신-E9, APFL, EndA, 엔도 I (END1 EC0LI), 인간 엔도 G (NUCG_HUMAN), 소 엔도 G (NUCG_BOVIN), R.HinPll, l-Basl, l-Bmol, l-Hmul, l-Tevl, l-Tevll, l-Tevlll, l-Twol, R.Mspl, R.Mval, NucA, NucM, Vvn, Vvn_CLS, 스타필로코쿠스(Staphylococcal) 뉴클레아제 (NUC_STAAU), 스타필로코쿠스 뉴클레아제 (NUC_STAHY), 미크로코쿠스(Micrococcal) 뉴클레아제 (NUC_SHIFL), 엔도뉴클레아제 yncB, 엔도데옥시리보뉴클레아제 I (ENRN-BPT7), 메트나제(Metnase), Nb.BsrDI, BsrDI A, Nt. BspD6l (R. BspD6l 큰 서브유닛), ss.BspD6l (R. BspD6l 작은 서브유닛), R.PIel, Mlyl, Alwl, Mval269l, Bsrl, Bsml, Nb.BtsCI, Nt.BtsCI, Rl.Btsl, R2.Btsl, BbvCI 서브유닛 1, BbvCI 서브유닛 2, BpulOI 알파 서브유닛, BpulOI 베타 서브유닛, Bmrl, Bfil, l-Crel, 헥솔(hExol) (EX01JHUMAN), 효모 엑솔(Exol) (EX01_YEAST), 이.콜라이(E.coli) 엑솔, 인간 TREX2, 마우스 TREX1, 인간 TREX1, 소 TREX1, 래트 TREX1, 인간 DNA2, 효모 DNA2 (DNA2_YEAST)로 이루어진 군으로부터 선택된다.
이중 가닥 DNA 파단을 복구하는 수단: 본원에 사용된 바와 같은 용어 "이중 가닥 DNA 파단을 복구하는 수단"은 또한 35 U.S.C. § 112, 제6 단락에서의 의회에 의해 공인된 특별한 청구 조항을 원용하도록 의도된다. 특히, "이중 가닥 DNA 파단을 복구하는 수단"은, 예를 들어 단일 이중-가닥 DNA 분자를 절단함으로써 생성되는 말단을 연결하거나, 또는 외인성 이중-가닥 DNA 분자의 말단으로 단일 이중-가닥 DNA 분자를 절단함으로써 생성되는 하나의 말단을 연결함으로써 이중-가닥 DNA 분자의 말단을 연결하는 것을 용이하게 하거나/촉매작용할 수 있는 분자 구조를 지칭한다. 이러한 구조는 다수의 공지된 리가제 단백질, 예를 들어 Cre 레콤비나제 내에 포함된 폴리펩티드 도메인을 포함한다. 일부 예에서, 동일한 분자 구조는 이중 가닥 DNA 파단을 생성하는 수단 및 이중 가닥 DNA 파단을 복구하는 수단 둘 다로서 역할을 할 수 있으며, 여기서 동일한 구조는 이중-가닥 DNA 분자 (예를 들어, Hin 레콤비나제)의 절단 및 복구 둘 다를 용이하게 한다.
게놈에서의 부위 특이적 이중 가닥 파단의 유도는 상동성-지정 복구 (HDR) 또는 비-상동성 말단-연결 (NHEJ) 복구를 통해 이중 가닥 파단을 해결하는 숙주 식물 세포 DNA 복구 경로를 유도한다. 식물에서, 과학 문헌은, 본래 게놈 내로 또는 미리 조작된 위치에서의 정확한 유전자 또는 공여자 DNA 통합이 표적화 이중 가닥 파단에 플랭킹된 서열에 상동인 다양한 양의 서열을 포함하는 유입 공여자 DNA 구축물(들)을 수반한다는 것을 보고하고 있다. 특이적 표적 유전자좌로의 이러한 공여자의 통합은 아마도 HDR 경로에 의지했을 것이다. 식물에서 유전자 표적화를 위해 HDR 접근법에 전적으로 의지하는 것은 NHEJ와 비교할 때 HDR 복구 경로가 우세한 DNA 복구 경로가 아니라는 보고로 인해 제한을 가질 수 있다. NHEJ 경로를 파단시키는 표적 특이적 DNA (ZFN, TALeN 또는 조작된 메가뉴클레아제 등)를 이용하는 공개된 식물 과학 문헌은 특정한 점 돌연변이 (삽입 또는 결실)를 게놈에 도입하는 방법으로서 보고되었다. 여기서 본 발명자들은 0 내지 <10 bp의 상동성 영역을 갖는 다양한 공여자 DNA 설계의 존재 하의 부위 특이적 이중 가닥 파단 (ZFN, TALeN 등에 의해 유래함) 식물에서 NHEJ 복구 경로를 통해 표적화된 파단에서 특이적으로 삽입될 수 있음을 보고하였다. 선형 내지 원형의 단일 가닥 내지 이중 가닥의 0 상동성 내지 작은 1-10 bp의 범위를 갖는 상이한 다양한 DNA 공여자 설계는 NHEJ 경로를 사용하는 특정한 위치를 표적화할 수 있다. NHEJ 기반 공여자 DNA 식물 게놈 표적화는 "점착성 말단 포획"에 기반할 수 있고, 여기서 Fok1 (또는 다른 유형 II 엔도뉴클레아제 도메인) 및 상응하는 점착성 말단에 의해 생성된 게놈에서의 표적화된 이중 가닥 파단은 NHEJ 공여자 DNA 설계 상에 있다. 점착성 말단 공여자 DNA는 미리 정의된 오버행을 갖는 선형 공여자 DNA로서 직접적으로 세포에 전달될 수 있다. 대안적 접근법은 숙주 표적 ZFN 및 표적 인식 부위와 동일한 적어도 하나의 ZFN 인식 부위를 함유하는 원형 DNA 공여자 분자를 공-전달함으로써 생체내 공여자 DNA 점착성 말단을 생성하는 것이다. 적어도 하나의 ZFN의 발현은 숙주 게놈 DNA (천연 또는 미리 조작된 것) 및 원형 공여자 DNA를 절단하여 숙주 NHEJ 복구 경로를 사용하여 분해되는 점착성 말단을 생산한다.
공여자 분자 상에 하나 이상의 ZFN 절단 부위를 갖는 것이 가능하다 (전체 공여자 분자를 선형화하기 위한 단일 ZFN 절단 부위, 보다 작은 공여자 DNA 단편을 방출하는 동일한 ZFN 부위 중 2개 또는 숙주 게놈 DNA로부터의 공여자로부터의 단편 및 상응하는 단편을 방출하기 위한 2개의 상이한 ZFN 부위 (DNA 대체)).
따라서, 공여자 폴리뉴클레오티드는 DNA 또는 RNA, 단일-가닥 및/또는 이중-가닥일 수 있고, 선형 또는 원형 형태로 세포 내로 도입될 수 있다. 예를 들어, 미국 특허 공개공보 번호 20100047805 및 20110207221을 참조한다. 특정 경우, 본 발명의 실시양태는 또한 선형 외인성 (공여자) 핵산(들), 이들 핵산을 포함하는 조성물 및 이들 선형 공여자 분자를 제조 및 사용하는 방법을 포함할 수 있다. 특정 실시양태에서, 선형 공여자 분자는 그것이 도입된 세포를 안정하게 지속한다. 다른 실시양태에서, 선형 공여자 분자는, 예를 들어 공여자 분자의 말단 상에 하나 이상의 염기 쌍 사이의 하나 이상의 포스포로티오에이트 포스포디에스테르 결합을 두는 것으로써 엑소뉴클레아제 절단에 저항하기 위해 변형된다. 선형 외인성 핵산은 또한 단일 가닥 특이적 DNA를 포함할 수 있다.
IV. FAD3 성능 유전자좌
FAD3 (지방산 데새투라제 3)으로 지정된 유전자좌는 식물 중 지방산 함량의 복합적 다유전자성 형질의 유전에 관련된 QTL에 포함된다. FAD3은 리놀레산 (18:2)의 리놀렌산 (C18:3)으로의 탈포화를 일으키는 효소를 코딩한다 (Tanhuanpaa et al. (1998) Mol. Breed. 4:543-50; Schierholt et al. (2001) Crop Sci. 41:1444-9).
식물 오일 생합성 경로 내에서 지방산 데새투라제 (FAD)는 지방산 조성물에 유의하게 영향을 미치는 식물 지질 생합성 및 그의 활성에서 주요 역할을 한다. FAD는 식물에서 풍부하고, 발현 분석은 FAD mRNA가 과잉 생산됨을 시사한다. 또한, FAD 유전자는 다양한 조직 및 세포 유형, 뿐만 아니라 색소체 및 세포질 세망을 비롯한 세포하 구획에서 발현된다.
식물의 지방산 조성, 및 다수의 적용으로 그로부터 생산된 오일의 성능은 주요 지방산 구성성분; 올레산, 리놀레산 및 리놀렌산 (C18:3)의 상대 농도에 의해 결정된다. 이들 지방산의 농도는 효소 FAD2 및 FAD3의 기능에 의해 주로 조절된다. 올레산은 하기 반응식에 따라 식물에서 리놀레산 및 리놀렌산으로 전환된다.
Figure 112015032530092-pct00001
FAD3 유전자는 옥수수, 대두, 목화, 아라비돕시스, 밀, 화본과 사료작물, 벼, 해바라기 및 브라시카(Brassica)을 포함하지만 이에 제한되지 않는 주요 식물 및 조류 종에서 확인되었고, 이러한 유기체에서 FAD3 발현의 변형은 변경된 지방산 프로파일을 유도한다. 또한, 변형된 FAD3 유전자를 포함하는 식물은 상업화되었고, FAD3 유전자의 분열은 숙주 식물에 농경학적 페널티 없이 숙주 식물에 의해 생산된 오일의 영양적 및 기능적 특성을 개선할 수 있음을 보여주었다. 예를 들어, 넥세라(Nexera)® 상표 (다우 아그로사이언시스, 엘엘씨(Dow AgroSciences, LLC)) 하에 시판된 카놀라 및 해바라기 품종은 야생형 카놀라 및 해바라기 프로파일과 비교할 때 더 고급 올레산, 더 저급 리놀레산 및 더 저급 리놀렌산 (및 더 저급 포화 지방산) 조성물을 특징으로 한다. 유럽, 북미 및 오스트레일리아에서 성장시킨 우세한 카놀라 종은 비. 올레라세아(B. oleracea) (이배체 C 게놈을 가짐)와 비. 라파(B. rapa) (이배체 A 게놈을 가짐)의 혼성화로부터 발생된 것으로 간주되는 이배체 브라시카 종인 브라시카 나푸스이다. 세포유전 이상 조사는 AA 및 CC 게놈이 부분적으로 서로에 상동인 것으로서의 관련성의 정도를 나타냄을 밝혔다. A 및 C 게놈 둘 다는 높은 백분율의 동조체 및/또는 유사 유전자를 함유한다. 따라서, AA 및 CC 게놈은 공통 조상 게놈으로부터 유래한 것으로 여겨진다 (Prakash and Hinata (1980) Opera Botanica 55:1-57). 선조 종 둘 다의 게놈이 기술적으로 이배체로서 분류될지라도, 이들 게놈은 높은 백분율의 서로 중복되는 영역을 함유한다 (Song et al. (1991) Theor. Appl. Genet. 82:296-304). 상세한 소기관 및 핵 RFLP 분석은, 비. 라파의 AA 게놈이 비. 나푸스에 대해 10개의 염색체를 기여하는 반면, 비. 올레라세아는 모체 공여자로서 그의 CC 게놈으로부터 9개의 염색체를 기여받는 것을 밝혀내었다 (Song et al. (1992) Genome 35:992-1001). 조상 게놈 둘 다에서의 게놈 중복의 수, 뿐만 아니라 A, B 및 C 게놈 사이의 높은 백분율의 유사성을 통해, FAD2 및 FAD3 유전자의 여러 카피가 발생하였다. 실질적으로, 이 사실은 특정한 지방산 프로파일을 생산하기 위해 시험되는 이들 유전자의 변형 및/또는 분열된 카피를 갖는 육종 카놀라를 생성한다.
카놀라에서 FAD3의 모든 공지된 기능적 유전자 카피는 A 게놈의 연결 기 N4 상에 위치한다 (Scheffler et al. (1997) TAG 94(5):583-91; Schierholt et al. (2000) TAG 101(5-6):897-901). 보다 최근에, 카놀라에서의 높은 올레산 형질은 A 게놈 상에 위치한 변형 및 분열된 FAD3 유전자와 연관되었다 (미국 특허 공개공보 번호 US 2006/0248611 A1; 문헌 [Hu et al. (2006) "Identification and Mapping of FAD2 and FAD3 Mutations and Development of Allele-specific Markers for High Oleic and Low Linolenic Acid Contents in Canola (Brassica napus L.)," Plant & Animal Genomes XIV Conference, January 14-18, 2006, San Diego, CA]). FAD3 대립유전자의 불활성화는 리놀레산의 리놀렌산으로의 탈포화를 감소시킴으로써 올레산 함량의 제어에 기여한다. 이 높은 올레산 및 FAD3 형질은 약 77%의 특징적인 올레산 함량을 갖는 비. 나푸스 품종 (DMS100)에서 확인되었다. 미국 공개공보 번호 20060248611을 참조한다. 또한, 유전자 마커는 카놀라로의 Fad3 및 높은 올레산 형질의 유전자이입을 지원하기 위해 개발되었다.
FAD3 유전자좌는 식물의 가치에 유해한 영향을 미치지 않고, 다수의 목적을 위해 그의 가치를 실제로 증가시키면서 FAD3 발현의 변경, 오일 함량/비의 변경 및/또는 목적한 트랜스진의 통합 및 발현을 비롯하여, 식물에서 변형 및/또는 분열될 수 있다. 또한, 식물의 FAD 유전자좌의 보편적인 특성에 따라, FAD3 유전자좌는 다수의 종에서, 예를 들어 제한 없이 카놀라; 대두; 옥수수; 밀; 화본과 사료작물; 브라시카 종; 벼, 토마토, 보리; 귀리; 소르굼; 목화 및 해바라기, 뿐만 아니라 진균 및 조류에서 적어도 일부 목적을 위해 유해함 없이 변형 및/또는 분열될 수 있다. 본 발명의 실시양태는 외인성 핵산의 통합을 위한 FAD3 유전자좌, 및 성능 유전자좌로서의 그의 용도를 포함한다. 예에서, FAD3 유전자좌는 성능 유전자좌로서의 그의 용도의 문맥 내에서 바람직한 것으로 발견된 여러 특성, 예컨대 예를 들어 제한 없이 숙주 유기체의 생활 주기 동안 대략 일정한 발현 수준이 존재하고, 놀랍게도, FAD3 유전자좌에서의 공여자 DNA의 삽입은 숙주 상에 품질 또는 적합성 페널티를 유도하지 않는 것 중 적어도 하나를 나타낸다.
본 발명의 일부 실시양태에서, 적어도 하나의 FAD3 유전자좌 (예를 들어, FAD3A 및/또는 FAD3C 유전자좌)는 외인성 핵산 (예를 들어, 관심 폴리펩티드를 코딩하는 뉴클레오티드 서열을 포함하는 핵산)의 부위-특이적 통합에 대한 표적 부위로서 사용된다. 특정한 실시양태에서, 외인성 핵산의 통합은 변형된 유전자좌를 생성한다. 예를 들어, 외인성 핵산의 통합은 분열된 (즉, 불활성화된) FAD3 유전자를 생성하도록 유전자좌를 변형시킬 수 있다.
일부 실시양태에서, FAD3 유전자좌는 서열 20-23, 서열 25-38, 서열 40-45, 서열 47 및 서열 49로 이루어진 군으로부터 선택된 뉴클레오티드 서열의 보체에 특이적으로 혼성화가능한 뉴클레오티드 서열을 포함할 수 있다. 예를 들어, FAD3 유전자좌는 서열 20-23, 서열 25-38, 서열 40-45, 서열 47 및 서열 49로 이루어진 군으로부터 선택된 뉴클레오티드 서열을 포함할 수 있다. 일부 실시양태에서, FAD3 유전자좌는 서열 20-23, 서열 25-38, 서열 40-45, 서열 47 및 서열 49로 이루어진 군으로부터 선택된 뉴클레오티드 서열과 실질적으로 동일한 뉴클레오티드 서열을 포함할 수 있다. 예를 들어, 일부 실시양태에서, FAD3 유전자좌는 서열 20-23, 서열 25-38, 서열 40-45, 서열 47 및 서열 49로 이루어진 군으로부터 선택된 뉴클레오티드 서열과 적어도 약 85% 동일한 뉴클레오티드 서열을 포함하는 FAD3 상동체 (예를 들어, 오르토로그 또는 파라로그)이다. FAD3 상동체는 서열 20-23, 서열 25-38, 서열 40-45, 서열 47 및 서열 49로 이루어진 군으로부터 선택된 뉴클레오티드 서열과, 예를 들어 제한 없이 적어도 80%; 적어도 85%; 적어도 약 90%; 적어도 약 91%; 적어도 약 92%; 적어도 약 93%; 적어도 약 94%; 적어도 약 95%; 적어도 약 96%; 적어도 약 97%; 적어도 약 98%; 적어도 약 99%; 적어도 약 99.5%; 99.6%, 99.7%, 99.8% 및/또는 적어도 약 99.9% 동일한 뉴클레오티드 서열을 포함할 수 있다. 이러한 FAD3 상동체는 다양한 유기체에 대해 관련 기술분야에서 통상의 기술자에게 용이하게 이용가능한 임의의 완전한 또는 부분 게놈으로부터 용이하게 확인되고 단리될 수 있다.
IV. FAD3 유전자좌에서의 핵산의 표적화 통합
FAD3 유전자좌에서의 외인성 핵산의 부위-특이적 통합은 통상의 기술자에게 공지된 임의의 기술에 의해 달성될 수 있다. 일부 실시양태에서, FAD3 유전자좌에서의 외인성 핵산의 통합은 세포 (예를 들어, 조직 또는 유기체의 단리된 세포 또는 세포)를 외인성 핵산을 포함하는 핵산 분자에 접촉시키는 것을 포함한다. 예에서, 이러한 핵산 분자는 핵산 분자와 적어도 하나의 FAD3 유전자좌 사이의 상동 재조합을 용이하게 하는 외인성 핵산에 플랭킹된 뉴클레오티드 서열을 포함할 수 있다. 특정한 예에서, 상동 재조합을 용이하게 하는 외인성 핵산에 플랭킹된 뉴클레오티드 서열은 FAD3 유전자좌의 내인성 뉴클레오티드에 상보적일 수 있다. 특정한 예에서, 상동 재조합을 용이하게 하는 외인성 핵산에 플랭킹된 뉴클레오티드 서열은 이전에 통합된 외인성 뉴클레오티드에 상보적일 수 있다. 일부 실시양태에서, 다수의 외인성 핵산은 하나의 FAD3 유전자좌에서, 예컨대 유전자 스택킹으로 통합될 수 있다.
일부 실시양태에서 FAD3 유전자좌에서의 핵산의 통합은 숙주 세포의 내인성 세포 기구, 예컨대 예를 들어 제한 없이 내인성 DNA 및 내인성 레콤비나제 효소에 의해 용이할 수 있다 (예를 들어, 촉매작용함). 일부 실시양태에서, FAD3 유전자좌에서의 핵산의 통합은 숙주 세포에 제공된 하나 이상의 인자 (예를 들어, 폴리펩티드)에 의해 용이해질 수 있다. 예를 들어, 뉴클레아제(들), 레콤비나제(들) 및/또는 리가제 폴리펩티드는 폴리펩티드를 숙주 세포와 접촉시킴으로써, 또는 숙주 세포 내에서 폴리펩티드를 발현시킴으로써 (독립적으로 또는 키메라 폴리펩티드의 일부로서) 제공될 수 있다. 따라서, 일부 예에서, 적어도 하나의 뉴클레아제, 레콤비나제 및/또는 리가제 폴리펩티드를 코딩하는 뉴클레오티드 서열을 포함하는 핵산은 FAD3 유전자좌에 부위-특이적 통합되는 핵산을 공동으로 또는 순차적으로 숙주 세포 내로 도입할 수 있으며, 여기서 적어도 하나의 뉴클레아제, 레콤비나제 및/또는 리가제 폴리펩티드는 숙주 세포에서 뉴클레오티드 서열로부터 발현된다.
A. DNA-결합 폴리펩티드
일부 실시양태에서, 부위-특이적 통합은, 예를 들어 숙주 유기체의 게놈에서 특정한 뉴클레오티드 서열을 인식하고 이에 결합될 수 있는 인자를 이용함으로써 달성될 수 있다. 예를 들어, 다수의 단백질은 부위-특이적 방식으로 DNA를 인식하고 이에 결합될 수 있는 폴리펩티드 도메인을 포함한다. DNA 결합 폴리펩티드에 의해 인식된 DNA 서열은 "표적" 서열로서 언급될 수 있다. 도메인이 원래 그로부터 단리되어진 단백질이 아닌 폴리펩티드에서 발현될 때도, 부위-특이적 방식으로 DNA를 인식하고 이에 결합될 수 있는 폴리펩티드 도메인은 일반적으로 정확하게 접히고, 독립적으로 기능하여 부위-특이적 방식으로 DNA에 결합된다. 유사하게, 심지어 큰 DNA 구조 (예를 들어, 염색체)로 존재하는 경우에도, 특히 표적 서열이 위치한 부위가 가용성 세포성 단백질 (예를 들어, 유전자)에 접근가능한 것으로 공지된 것일 때, DNA-결합 폴리펩티드에 의한 인식 및 결합에 대한 표적 서열은 일반적으로 이러한 폴리펩티드에 의해 인식되고 이에 결합될 수 있다.
자연에 존재하는 단백질로부터 확인된 DNA-결합 폴리펩티드가 전형적으로 별개의 뉴클레오티드 서열 또는 모티프 (예를 들어, 컨센서스 인식 서열)에 결합하는 반면, 이러한 다수의 DNA-결합 폴리펩티드를 변형하여 다양한 뉴클레오티드 서열 또는 모티프를 인식하도록 하는 방법이 존재하고, 이는 관련 기술분야에 공지되어 있다. DNA-결합 폴리펩티드는, 예를 들어 제한 없이 아연 핑거 DNA-결합 도메인; 류신 지퍼; UPA DNA-결합 도메인; GAL4; TAL; LexA; Tet 리프레서; LacR; 및 스테로이드 호르몬 수용체를 포함한다.
일부 예에서, DNA-결합 폴리펩티드는 아연 핑거이다. 개별적인 아연 핑거 모티프는 광범위한 DNA 부위 중 임의의 부위를 특이적으로 표적화하고 이에 결합하도록 설계될 수 있다. 정규 Cys2His2 (뿐만 아니라 비-정규 Cys3His) 아연 핑거 폴리펩티드도 표적 DNA 이중 나선의 주요 홈에 α-나선을 삽입하는 것에 의해 DNA에 결합한다. 아연 핑거에 의한 DNA의 인식은 모듈식이어서; 각 핑거가 일차적으로 표적의 3개 연속 염기 쌍에 접촉하고, 폴리펩티드의 소수의 핵심 잔기들이 인식을 매개한다. 표적화 엔도뉴클레아제에 다수의 아연 핑거 DNA-결합 도메인을 포함시키는 것에 의해, 표적화 엔도뉴클레아제의 DNA-결합 특이성은 추가로 증가될 수 있다 (및 이에 따라 그에 의해 부여되는 임의의 유전자 조절 효과의 특이성 또한 증가될 수 있음). 예를 들어, 문헌 [Urnov et al. (2005) Nature 435:646-51]을 참조한다. 따라서, 숙주 세포 내로 도입된 표적화 엔도뉴클레아제가 숙주 세포의 게놈 내의 특유한 DNA 서열과 상호작용하도록, 하나 이상의 아연 핑거 DNA-결합 폴리펩티드가 조작되고 이용될 수 있다.
바람직하게는, 아연 핑거 단백질은 선택된 표적 부위에 결합하도록 조작된다는 점에서 비-자연 발생된 것이다. 예를 들어, 그 전문이 모두 본원에 참조로 포함되는 문헌 [Beerli et al. (2002) Nature Biotechnol. 20:135-141; Pabo et al. (2001) Ann. Rev. Biochem. 70:313-340; Isalan et al. (2001) Nature Biotechnol. 19:656-660; Segal et al. (2001) Curr. Opin. Biotechnol. 12:632-637; Choo et al. (2000) Curr. Opin. Struct. Biol. 10:411-416]; 미국 특허 번호 6,453,242; 6,534,261; 6,599,692; 6,503,717; 6,689,558; 7,030,215; 6,794,136; 7,067,317; 7,262,054; 7,070,934; 7,361,635; 7,253,273; 및 미국 특허 공개공보 번호 2005/0064474; 2007/0218528; 2005/0267061을 참조한다.
조작된 아연 핑거 결합 도메인에는 자연 발생 아연 핑거 단백질과 비교하여 신규한 결합 특이성이 있을 수 있다. 조작 방법은 합리적 설계 및 다양한 유형의 선택을 포함하지만, 이에 제한되지는 않는다. 합리적 설계는, 예를 들어 삼중 (또는 사중) 뉴클레오티드 서열 및 개별 아연 핑거 아미노산 서열을 포함하는 데이터베이스의 사용을 포함하며, 여기서 각각의 삼중 또는 사중 뉴클레오티드 서열은 특정한 삼중 또는 사중 서열에 결합하는 아연 핑거의 하나 이상의 아미노산 서열과 연관된다. 예를 들어, 그 전문이 본원에 참조로 포함되는 공동 소유의 미국 특허 6,453,242 및 6,534,261을 참조한다.
파지 디스플레이 및 2-하이브리드 시스템을 포함하는 예시적인 선택 방법이 미국 특허 5,789,538; 5,925,523; 6,007,988; 6,013,453; 6,410,248; 6,140,466; 6,200,759; 및 6,242,568; 뿐만 아니라 WO 98/37186; WO 98/53057; WO 00/27878; WO 01/88197 및 GB 2,338,237에 개시되어 있다. 또한, 아연 핑거 결합 도메인에 대한 결합 특이성의 증진은, 예를 들어 공동 소유의 WO 02/077227에 기재되어 있다.
또한, 이들 및 다른 참고문헌에 개시된 바와 같이, 아연 핑거 도메인 및/또는 다중-핑거의 아연 핑거 단백질은, 예를 들어 5개 이상의 아미노산 길이의 링커를 포함하는 임의의 적합한 링커 서열을 사용하여 함께 연결될 수 있다. 또한, 6개 이상의 아미노산 길이의 예시적인 링커 서열에 대해서는 미국 특허 번호 6,479,626; 6,903,185; 및 7,153,949를 참조한다. 본원에 기재된 단백질은 단백질의 개별 아연 핑거 사이의 적합한 링커의 임의의 조합을 포함할 수 있다.
표적 부위의 선택; ZFP 및 융합 단백질 (및 이를 코딩하는 폴리뉴클레오티드)의 설계 및 구축을 위한 방법은 통상의 기술자에 공지되어 있고, 미국 특허 번호 6,140,0815; 789,538; 6,453,242; 6,534,261; 5,925,523; 6,007,988; 6,013,453; 6,200,759; WO 95/19431; WO 96/06166; WO 98/53057; WO 98/54311; WO 00/27878; WO 01/60970; WO 01/88197; WO 02/099084; WO 98/53058; WO 98/53059; WO 98/53060; WO 02/016536 및 WO 03/016496에 상세하게 설명되어 있다.
또한, 이들 및 다른 참고문헌에 개시된 바와 같이, 아연 핑거 도메인 및/또는 다중 핑거의 아연 핑거 단백질은, 예를 들어 5개 이상의 아미노산 길이의 링커를 포함하는 임의의 적합한 링커 서열을 사용하여 함께 연결될 수 있다. 또한, 6개 이상의 아미노산 길이의 예시적인 링커 서열에 대해서는 미국 특허 번호 6,479,626; 6,903,185; 및 7,153,949를 참조한다. 본원에 기재된 단백질은 단백질의 개별 아연 핑거 사이의 적합한 링커의 임의의 조합을 포함할 수 있다.
일부 예에서, DNA-결합 폴리펩티드는 GAL4로부터의 DNA-결합 도메인이다. GAL4는 사카로미세스 세레비지아에(Saccharomyces cerevisiae)에서 모듈화된 전사활성인자이지만, 이것은 또한 다수의 다른 유기체에서 전사활성인자로서 작동한다. 예를 들어, 문헌 [Sadowski et al. (1988) Nature 335:563-4]을 참조한다. 이와 같은 조절 시스템에서, 에스. 세레비시아에(S. cerevisiae)에서의 갈락토스 대사 경로의 효소를 코딩하는 유전자의 발현은 이용가능한 탄소원에 의해 엄격하게 조절된다 (Johnston (1987) Microbiol. Rev. 51:458-76). 이들 대사 효소의 전사 조절은 양성 조절 단백질 GAL4, 및 GAL4가 특이적으로 결합하는 17 bp 대칭형 DNA 서열 (UAS) 사이의 상호작용에 의해 매개된다.
천연 GAL4는 99 kDa의 분자량을 갖는 881개의 아미노산 잔기를 포함한다. GAL4는 기능적으로 자율성인 도메인을 포함하며, 이의 조합된 활성이 생체 내에서의 GAL4의 활성을 담당한다 (Ma and Ptashne (1987) Cell 48:847-53); Brent and Ptashne (1985) Cell 43(3 Pt 2):729-36). GAL4의 N-말단 65개 아미노산은 GAL4 DNA-결합 도메인을 포함한다 (Keegan et al. (1986) Science 231:699-704; Johnston (1987) Nature 328:353-5). 서열-특이적 결합은 DNA 결합 도메인에 존재하는 6개의 Cys 잔기에 의해 배위되는 2가 양이온의 존재를 필요로 한다. 배위된 양이온-함유 도메인은 DNA 나선의 주요 홈과의 직접적인 접촉을 통하여 17 bp UAS 각 말단의 보존되어 있는 CCG 삼중체와 상호작용하여 그것을 인식한다 (Marmorstein et al. (1992) Nature 356:408-14). 단백질의 DNA-결합 기능은 활성화 도메인이 전사를 유도할 수 있도록 프로모터의 근처에 C-말단 전사 활성화 도메인을 위치시킨다.
특정 실시양태에서, 이용할 수 있는 추가의 DNA-결합 폴리펩티드는, 예를 들어 제한 없이 AVRBS3-유도성 유전자로부터의 결합 서열; AVRBS3-유도성 유전자로부터의 컨센서스 결합 서열 또는 그로부터 조작된 합성 결합 서열 (예를 들어, UPA DNA-결합 도메인); TAL; LexA (예를 들어, 상기 문헌 [Brent & Ptashne (1985)] 참조); LacR (예를 들어, 문헌 [Labow et al. (1990) Mol. Cell. Biol. 10:3343-56; Baim et al. (1991) Proc. Natl. Acad. Sci. USA 88(12):5072-6)] 참조); 스테로이드 호르몬 수용체 (Ellliston et al. (1990) J. Biol. Chem. 265:11517-121); 테트라시클린 (Tc)의 존재 하에는 tet 오퍼레이터 서열에 결합하나 부재시에는 그렇지 않은 Tet 리프레서 (미국 특허 6,271,341) 및 돌연변이된 Tet 리프레서; NF-κB의 DNA-결합 도메인; 및 GAL4, 호르몬 수용체 및 VP16의 융합을 이용하는, 문헌 [Wang et al. (1994) Proc. Natl. Acad. Sci. USA 91(17):8180-4]에 기재된 조절 시스템의 성분을 포함한다.
특정 실시양태에서, 본원에 기재된 방법 및 조성물에 사용되는 하나 이상의 뉴클레아제의 DNA-결합 도메인은 자연 발생 또는 조작된 (비-자연 발생) TAL 이펙터 DNA 결합 도메인을 포함한다. 예를 들어, 그 전문이 본원에 참조로 포함되는 미국 특허 공개공보 번호 20110301073을 참조한다. 속 크산토모나스(Xanthomonas)의 식물 병원성 박테리아는 중요한 작물 식물에서 많은 병해를 야기하는 것으로 알려져 있다. 크산토모나스의 병원성은 25개 초과의 상이한 이펙터 단백질을 식물 세포 내로 주입하는 보존된 유형 III 분비 (T3S) 시스템에 좌우된다. 상기 주입된 단백질 중에는 식물 전사 활성제를 모방하고 식물 트랜스크립톰을 조작하는 전사 활성제-유사 (TAL) 이펙터가 존재한다 (문헌 [Kay et al. (2007) Science 318:648-651] 참조). 이들 단백질은 DNA 결합 도메인 및 전사 활성화 도메인을 함유한다. 대부분의 잘 특성화된 TAL-이펙터 중의 하나는 크산토모나스 캄페스트그리스 피브이. 베시카토리아(Xanthomonas campestgris pv. Vesicatoria)로부터의 AvrBs3이다 (문헌 [Bonas et al. (1989) Mol Gen Genet 218: 127-136] 및 WO2010079430 참조). TAL-이펙터는 탠덤 반복체의 중앙 집중된 도메인을 함유하고, 각각의 반복체는 이들 단백질의 DNA 결합 특이성에 핵심적인 대략 34개의 아미노산을 함유한다. 또한, 이들은 핵 국재화 서열 및 산성 전사 활성화 도메인을 함유한다 (검토에 대해서는, 문헌 [Schornack S, et al. (2006) J Plant Physiol 163(3): 256-272] 참조). 또한, 식물병원성 박테리아 랄스토니아 솔라나세아룸(Ralstonia solanacearum)에서, 알. 솔라나세아룸(R. solanacearum) 생태형 1 균주 GMI1000 및 생태형 4 균주 RS1000에서 크산토모나스의 AvrBs3 패밀리에 상동성인 brg11 및 hpx17로 지정된 2개의 유전자가 발견되었다 (문헌 [Heuer et al. (2007) Appl and Envir Micro 73(13): 4379-4384] 참조). 이들 유전자는 서로 뉴클레오티드 서열이 98.9% 동일하지만, hpx17의 반복 도메인 내의 1,575 bp의 결실에서 상이하다. 그러나, 유전자 산물 둘 다는 크산토모나스의 AvrBs3 패밀리 단백질과 40% 미만의 서열 동일성을 갖는다. 예를 들어, 미국 특허 번호 8,420,782 및 8,440,431 및 미국 특허 공개공보 번호 20110301073을 참조한다.
다른 실시양태에서, 뉴클레아제는 CRISPR/Cas 시스템을 포함한다. 시스템의 RNA 성분을 코딩하는 CRISPR (군집성의 규칙적인 간격을 갖는 짧은 회문구조 반복체) 유전자좌, 및 단백질을 코딩하는 cas (CRISPR-연관) 유전자좌 (Jansen et al., 2002. Mol. Microbiol. 43: 1565-1575; Makarova et al., 2002. Nucleic Acids Res. 30: 482-496; Makarova et al., 2006. Biol. Direct 1: 7; Haft et al., 2005. PLoS Comput. Biol. 1: e60)는 CRISPR/Cas 뉴클레아제 시스템의 유전자 서열을 구성한다. 미생물 숙주 내의 CRISPR 유전자좌는 CRISPR-연관 (Cas) 유전자의 조합 뿐만 아니라 CRISPR-매개 핵산 절단의 특이성을 프로그래밍할 수 있는 비-코딩 RNA 요소를 함유한다.
유형 II CRISPR은 가장 잘 특성화된 시스템 중의 하나이고, 4개의 순차적 단계에서 표적화된 DNA 이중-가닥 파단을 수행한다. 먼저, 2개의 비-코딩 RNA인 프리-crRNA 어레이 및 tracrRNA가 CRISPR 유전자좌로부터 전사된다. 이어서, tracrRNA는 프리-crRNA의 반복 영역에 혼성화하고, 프리-crRNA의 개별적인 스페이서 서열을 함유하는 성숙 crRNA로의 프로세싱을 매개한다. 세번째로, 성숙 crRNA:tracrRNA 복합체는 crRNA 상의 스페이서와, 표적 인식을 위한 추가의 요건인 프로토스페이서 인접 모티프 (PAM)의 옆에 존재하는 표적 DNA 상의 프로토스페이서 사이의 왓슨-크릭(Wastson-Crick) 염기-쌍형성을 통해 Cas9를 표적 DNA로 유도한다. 마지막으로, Cas9는 프로토스페이서 내의 이중 가닥 파단을 생성하기 위해 표적 DNA의 절단을 매개한다. CRISPR/Cas 시스템의 활성은 3 단계: (i) 이후의 공격을 방지하기 위해 '순응'으로 불리는 방법으로 CRISPR 어레이 내로의 외래 DNA 서열의 삽입, (ii) 관련 단백질의 발현, 뿐만 아니라 어레이의 발현 및 프로세싱 후, (iii) 외래 핵산을 사용한 RNA-매개 간섭을 포함한다. 따라서, 박테리아 세포에서, 소위 'Cas' 단백질 중 몇몇은 CRISPR/Cas 시스템의 천연 기능과 연관되고, 외래 DNA 등의 삽입과 같은 기능에서 역할을 한다.
특정 실시양태에서, Cas 단백질은 자연 발생 Cas 단백질의 "기능적 유도체"일 수 있다. 천연 서열 폴리펩티드의 "기능적 유도체"는 천연 서열 폴리펩티드와 공통적인 정성적 생물학적 특성을 갖는 화합물이다. "기능적 유도체"는 상응하는 천연 서열 폴리펩티드와 공통적인 생물학적 특성을 갖는다면, 천연 서열의 단편 및 천연 서열 폴리펩티드의 유도체 및 그의 단편을 포함하지만, 이에 제한되지는 않는다. 본원에서 고려되는 생물학적 활성은 DNA 기질을 단편으로 가수분해하는 기능적 유도체의 능력이다. 용어 "유도체"는 폴리펩티드의 아미노산 서열 변이체 둘 다, 공유 변형, 및 그의 융합체를 포함한다. Cas 폴리펩티드의 적합한 유도체 또는 그의 단편은 Cas 단백질의 돌연변이체, 융합체, 공유 변형 또는 그의 단편을 포함하지만, 이에 제한되지는 않는다. Cas 단백질 또는 그의 단편, 뿐만 아니라 Cas 단백질의 유도체 또는 그의 단편을 포함하는 Cas 단백질은 세포로부터 얻거나 또는 화학적으로 합성되거나 또는 이들 2가지 절차의 조합에 의해 얻을 수 있다. 세포는 Cas 단백질을 천연적으로 생산하는 세포, 또는 Cas 단백질을 천연적으로 생산하고 내인성 Cas 단백질을 보다 높은 발현 수준으로 생산하거나 또는 내인성 Cas와 동일하거나 상이한 Cas를 코딩하는 외인성으로 도입된 핵산으로부터 Cas 단백질을 생산하도록 유전자 조작된 세포일 수 있다. 일부 경우에, 세포는 Cas 단백질을 천연적으로 생산하지 않고, Cas 단백질을 생산하도록 유전자 조작된다.
특정한 실시양태에서, DNA-결합 폴리펩티드는 숙주 유기체의 게놈 핵산 내에 포함되는 표적 뉴클레오티드 서열을 특이적으로 인식하고 이에 결합한다. 별개의 경우의 표적 뉴클레오티드 서열 중 임의의 수가 일부 예에서 숙주 게놈에서 발견될 수 있다. 표적 뉴클레오티드 서열은 유기체의 게놈 내에서 드물게 있을 수 있다 (예를 들어, 표적 서열의 약 10, 약 9, 약 8, 약 7, 약 6, 약 5, 약 4, 약 3, 약 2 또는 약 1 카피(들) 미만이 게놈 중에 존재할 수 있다). 예를 들어, 표적 뉴클레오티드 서열은 유기체의 게놈 내에 특유한 부위에 위치할 수 있다. 표적 뉴클레오티드 서열은, 예를 들어 제한 없이 서로에 대한 게놈 전반에 무작위로 분산될 수 있고; 게놈의 다양한 연결 기에 위치할 수 있고; 동일한 연결 기에 위치할 수 있고; 다양한 염색체 상에 위치할 수 있고; 동일한 염색체 상에 위치할 수 있고; 유기체에서 유사한 조건 하에 (예를 들어, 동일한 또는 기능적으로 실질적으로 동일한 조절 인자의 제어 하에) 발현된 부위에서 게놈에 위치할 수 있고; 게놈에서 서로에 근접하게 위치할 수 있다 (예를 들어, 표적 서열은 게놈 유전자좌에 콘카테머로서 통합된 핵산 내에 포함될 수 있음).
B. 표적화 엔도뉴클레아제
특정한 실시양태에서, 특히 표적 뉴클레오티드 서열을 특이적으로 인식하고 이에 결합하는 DNA-결합 폴리펩티드는 키메라 폴리펩티드 내에 포함되어 키메라 폴리펩티드 상의 표적 서열에 특이적 결합을 부여할 수 있다. 예에서, 이러한 키메라 폴리펩티드는 이들 폴리펩티드가 상기에 기재된 바와 같이, 예를 들어 제한 없이 뉴클레아제, 레콤비나제 및/또는 리가제 폴리펩티드를 포함할 수 있다. DNA-결합 폴리펩티드 및 뉴클레아제, 레콤비나제 및/또는 리가제 폴리펩티드를 포함하는 키메라 폴리펩티드는 다른 기능적 폴리펩티드 모티프 및/또는 도메인, 예컨대 예를 들어 제한 없이 키메라 단백질에서 기능적 폴리펩티드 사이에 위치한 스페이서 서열; 리더 펩티드; 융합 단백질을 소기관 (예를 들어, 핵)에 표적화하는 펩티드; 세포 효소에 의해 절단되는 폴리펩티드; 펩티드 태그 (예를 들어, Myc, His 등); 및 키메라 폴리펩티드의 기능을 간섭하지 않는 다른 아미노산 서열을 또한 포함할 수 있다.
키메라 폴리펩티드에서의 기능적 폴리펩티드 (예를 들어, DNA-결합 폴리펩티드 및 뉴클레아제 폴리펩티드)는 작동적으로 연결될 수 있다. 일부 실시양태에서, 키메라 폴리펩티드의 기능적 폴리펩티드는 인-프레임 내에서 서로 라이게이션된 기능적 폴리펩티드를 적어도 코딩하는 단일 폴리뉴클레오티드로부터 그의 발현에 의해 작동적으로 연결되어 키메라 단백질을 코딩하는 키메라 유전자를 생성할 수 있다. 대안적 실시양태에서, 키메라 폴리펩티드의 기능적 폴리펩티드는 다른 수단, 예컨대 독립적으로 발현된 폴리펩티드의 교차-연결에 의해 작동적으로 연결될 수 있다.
일부 실시양태에서, 표적 뉴클레오티드 서열을 특이적으로 인식하고 이에 결합하는 DNA-결합 폴리펩티드는 단리된 천연 단백질 (또는 그의 돌연변이체) 내에 포함될 수 있고, 여기서 단리된 천연 단백질 또는 그의 돌연변이체는 또한 뉴클레아제 폴리펩티드 (및 레콤비나제 및/또는 리가제 폴리펩티드를 또한 포함할 수 있음)를 포함한다. 이러한 단리된 단백질의 예는 TALEN, 레콤비나제 (예를 들어, Cre, Hin, Tre 및 FLP 레콤비나제), RNA-유도 CRISPR-Cas9 및 메가뉴클레아제를 포함한다.
본원에 사용된 바와 같은 용어 "표적화 엔도뉴클레아제"는 DNA-결합 폴리펩티드 및 뉴클레아제 폴리펩티드를 포함하는 단리된 천연 또는 조작된 단백질 및 그의 돌연변이체, 뿐만 아니라 DNA-결합 폴리펩티드 및 뉴클레아제를 포함하는 키메라 폴리펩티드를 지칭한다. FAD3 유전자좌 내에 포함된 (예를 들어, 표적 서열이 유전자좌에서 천연 서열 내에 포함되기 때문에, 또는 표적 서열이 유전자좌 내로, 예를 들어 재조합에 의해 도입되었기 때문에) 표적 뉴클레오티드 서열을 특이적으로 인식하고 이에 결합하는 DNA-결합 폴리펩티드를 포함하는 임의의 표적화 엔도뉴클레아제는 특정 실시양태에서 이용될 수 있다.
본 발명의 특정한 실시양태에서 유용할 수 있는 키메라 폴리펩티드의 일부 예는 제한 없이 하기 폴리펩티드의 조합을 포함한다: 아연 핑거 DNA-결합 폴리펩티드; FokI 뉴클레아제 폴리펩티드; TALE 도메인; 류신 지퍼; 전사 인자 DNA-결합 모티프; 및 예를 들어 제한 없이 TALEN, 레콤비나제 (예를 들어, Cre, Hin, RecA, Tre 및 FLP 레콤비나제), RNA-유도 CRISPR-Cas9, 메가뉴클레아제로부터 단리된 DNA 인식 및/또는 절단 도메인; 및 관련 기술분야에 공지된 다른 것. 특정한 예는 부위-특이적 DNA 결합 폴리펩티드 및 뉴클레아제 폴리펩티드를 포함하는 키메라 단백질을 포함한다. 키메라 폴리펩티드는 키메라 폴리펩티드 내에 포함된 DNA-결합 폴리펩티드의 인식 서열을 변경하여 특정한 관심 뉴클레오티드 서열을 키메라 폴리펩티드에 표적화하기 위해 통상의 기술자에게 공지된 방법에 의해 조작될 수 있다.
특정 실시양태에서, 키메라 폴리펩티드는 DNA-결합 도메인 (예를 들어, 아연 핑거, TAL-이펙터 도메인 등) 및 뉴클레아제 (절단) 도메인을 포함한다. 절단 도메인은 DNA-결합 도메인에 이종일 수 있으며, 예를 들어 아연 핑거 DNA-결합 도메인 및 뉴클레아제로부터의 절단 도메인 또는 TALEN DNA-결합 도메인 및 절단 도메인, 또는 메가뉴클레아제 DNA-결합 도메인 및 상이한 뉴클레아제로부터의 절단 도메인임. 이종 절단 도메인은 임의의 엔도뉴클레아제 또는 엑소뉴클레아제로부터 얻을 수 있다. 절단 도메인이 유래될 수 있는 예시적인 엔도뉴클레아제는 제한 엔도뉴클레아제 및 귀소성 엔도뉴클레아제를 포함하지만, 이에 제한되지는 않는다. 예를 들어, 문헌 [2002-2003 Catalogue, New England Biolabs, Beverly, MA; 및 Belfort et al. (1997) Nucleic Acids Res. 25:3379-3388]을 참조한다. DNA를 절단하는 추가의 효소가 공지되어 있다 (예를 들어, S1 뉴클레아제; 녹두 뉴클레아제; 췌장 DNase I; 미크로코쿠스(micrococcal) 뉴클레아제; 효모 HO 엔도뉴클레아제; 또한, 문헌 [Linn et al. (eds.) Nucleases, Cold Spring Harbor Laboratory Press,1993)]을 참조한다). 이들 효소 (또는 그의 기능성 단편) 중 하나 이상이 절단 도메인 및 절단 절반-도메인의 공급원으로서 사용될 수 있다.
유사하게, 절단 절반-도메인은 절단 활성을 위해 이량체화를 필요로 하는, 상기 제시된 바와 같이 임의의 뉴클레아제 또는 그의 일부로부터 유래될 수 있다. 일반적으로, 융합 단백질이 절단 절반-도메인을 포함하는 경우에 2개의 융합 단백질이 절단에 필요하다. 대안적으로, 2개의 절단 절반-도메인을 포함하는 단일 단백질이 사용될 수 있다. 2개의 절단 절반-도메인이 동일한 엔도뉴클레아제 (또는 그의 기능성 단편)로부터 유래될 수 있거나, 또는 각각의 절단 절반-도메인이 상이한 엔도뉴클레아제 (또는 그의 기능성 단편)로부터 유래될 수 있다. 또한, 2개의 융합 단백질이 각각의 표적 부위에 결합하는 것이 절단 절반-도메인이 기능성 절단 도메인을 형성 (예를 들어, 이량체화에 의해 형성)하는 것이 가능하도록 절단 절반-도메인을 서로에 대해 공간적으로 배향시키도록, 2개의 융합 단백질에 대한 표적 부위들이 서로 관련되어 배치되는 것이 바람직하다. 따라서, 특정 실시양태에서, 표적 부위의 가까운 경계는 뉴클레오티드 5-8개 또는 뉴클레오티드 15-18개에 의해 분리된다. 그러나, 임의의 정수 개의 뉴클레오티드 또는 뉴클레오티드 쌍이 2개의 표적 부위 사이에 개입할 수 있다 (예를 들어, 2 내지 50개 또는 그 초과의 뉴클레오티드 쌍). 일반적으로, 절단 부위는 표적 부위 사이에 존재한다.
예를 들어, 제한 엔도뉴클레아제 (제한 효소)는 다수의 종에 존재하고, 예를 들어 하나 이상의 외인성 서열 (공여자/트랜스진)이 결합 (표적) 부위에 또는 그 근처에서 통합되도록, DNA에 (인식 부위에서) 서열-특이적으로 결합하여, 결합의 부위에 또는 그 근처에서 DNA를 절단하는 것이 가능하다. 특정 제한 효소 (예를 들어, 유형 IIS)는 인식 부위에서 제거된 부위에서 DNA를 절단하고, 분리가능한 결합 도메인 및 절단 도메인을 갖는다. 예를 들어, 유형 IIS 효소 Fok I은 한쪽 가닥 상의 그의 인식 부위로부터 9개의 뉴클레오티드, 및 다른쪽 가닥 상의 인식 부위로부터 13개의 뉴클레오티드에서 DNA의 이중-가닥 절단을 촉매작용한다. 예를 들어, 미국 특허 5,356,802; 5,436,150 및 5,487,994; 뿐만 아니라 문헌 [Li et al. (1992) Proc. Natl. Acad. Sci. USA 89:4275-4279; Li et al. (1993) Proc. Natl. Acad. Sci. USA 90:2764-2768; Kim et al. (1994a) Proc. Natl. Acad. Sci. USA 91:883-887; Kim et al. (1994b) J. Biol. Chem. 269:31,978-31,982]을 참조한다. 따라서, 한 실시양태에서, 융합 단백질은 적어도 하나의 유형 IIS 제한 효소로부터의 절단 도메인 (또는 절단 절반-도메인), 및 조작되거나 또는 조작되지 않을 수 있는 하나 이상의 아연 핑거 결합 도메인을 포함한다.
절단 도메인이 결합 도메인으로부터 분리가능한 예시적인 유형 IIS 제한 효소는 Fok I이다. 상기 특정한 효소는 이량체로서 활성이다 (Bitinaite et al. (1998) Proc. Natl. Acad. Sci. USA 95: 10,570-10,575). 따라서, 본 개시내용의 목적을 위해, 개시된 융합 단백질에서 사용된 Fok I 효소의 일부는 절단 절반-도메인으로 간주된다. 따라서, 아연 핑거-FokI 융합체를 사용한 표적화된 이중 가닥 절단 및/또는 세포 서열의 표적화된 교체를 위해, 각각 FokI 절단 절반-도메인을 포함하는 2개의 융합 단백질이 촉매적 활성 절단 도메인을 재구성하기 위해 사용될 수 있다. 대안적으로, DNA 결합 도메인 및 2개의 Fok I 절단 절반-도메인을 함유하는 단일 폴리펩티드 분자가 또한 사용될 수 있다.
절단 도메인 또는 절단 절반-도메인은 절단 활성을 보유하거나 또는 기능적 절단 도메인을 형성하기 위해 다량체화 (예를 들어, 이량체화)하는 능력을 보유하는 단백질의 임의의 부분일 수 있다.
예시적인 유형 IIS 제한 효소는 그 전문이 본원에 참조로 포함되는 미국 특허 공개공보 번호 20070134796에 기재되어 있다. 추가의 제한 효소가 분리가능한 결합 및 절단 도메인을 또한 함유하고, 이것은 본 개시내용에서 고려된다. 예를 들어, 문헌 [Roberts et al. (2003) Nucleic Acids Res. 31:418-420]을 참조한다.
특정 실시양태에서, 절단 도메인은, 예를 들어 그 개시내용 전문이 본원에 참조로 포함되는 미국 특허 공개공보 번호 20050064474; 20060188987 및 20080131962에 기재된 바와 같이 동종이량체화를 최소화하거나 또는 방지하는 하나 이상의 조작된 절단 절반-도메인 (이량체화 도메인 돌연변이체로도 언급됨)을 포함한다. FokI의 위치 446, 447, 479, 483, 484, 486, 487, 490, 491, 496, 498, 499, 500, 531, 534, 537 및 538의 아미노산 잔기는 모두 FokI 절단 절반-도메인의 이량체화에 영향을 주기 위한 표적이다.
절대적 이종이량체를 형성하는 FokI의 예시적인 조작된 절단 절반-도메인은 제1 절단 절반-도메인이 FokI의 위치 490 및 538의 아미노산 잔기에서의 돌연변이를 포함하고 제2 절단 절반-도메인이 아미노산 잔기 486 및 499에서의 돌연변이를 포함하는 쌍을 포함한다.
따라서, 한 실시양태에서, 490에서의 돌연변이는 Glu (E)를 Lys (K)로 대체하고; 538에서의 돌연변이는 Iso (I)를 Lys (K)로 대체하고; 486에서의 돌연변이는 Gln (Q)를 Glu (E)로 대체하고; 위치 499에서의 돌연변이는 Iso (I)를 Lys (K)로 대체한다. 구체적으로, 본원에 기재된 조작된 절단 절반-도메인은 "E490K:I538K"로 지정된 조작된 절단 절반-도메인을 생산하기 위해 하나의 절단 절반-도메인에서 위치 490 (E->K) 및 538 (I->K)을 돌연변이시키고, "Q486E:I499L"로 지정된 조작된 절단 절반-도메인을 생산하기 위해 또 다른 절단 절반-도메인에서 위치 486 (Q->E) 및 499 (I->L)를 돌연변이시킴으로써 제조하였다. 본원에 기재된 조작된 절단 절반-도메인은 비정상적 절단이 최소화되거나 또는 제거된 절대적 이종이량체 돌연변이체이다. 예를 들어, 모든 목적을 위해 그 개시내용 전문이 본원에 참조로 포함되는 미국 특허 공개공보 번호 2008/0131962를 참조한다.
특정 실시양태에서, 조작된 절단 절반-도메인은 위치 486, 499 및 496 (야생형 FokI에 대해 넘버링됨)에 돌연변이, 예를 들어 위치 486의 야생형 Gln (Q) 잔기를 Glu (E) 잔기로, 위치 499의 야생형 Iso (I) 잔기를 Leu (L) 잔기로, 위치 496의 야생형 Asn (N) 잔기를 Asp (D) 또는 Glu (E) 잔기로 대체한 돌연변이 (각각 "ELD" 및 "ELE" 도메인으로도 언급됨)를 포함한다. 다른 실시양태에서, 조작된 절단 절반-도메인은 위치 490, 538 및 537 (야생형 FokI에 대해 넘버링됨)에 돌연변이, 예를 들어 위치 490의 야생형 Glu (E) 잔기를 Lys (K) 잔기로, 위치 538의 야생형 Iso (I) 잔기를 Lys (K) 잔기로, 위치 537의 야생형 His (H) 잔기를 Lys (K) 잔기 또는 Arg (R) 잔기로 대체한 돌연변이 (각각 "KKK" 및 "KKR" 도메인으로도 언급됨)를 포함한다. 다른 실시양태에서, 유전자 조작된 절단 절반-도메인은 위치 490 및 537 (야생형 FokI에 대해 번호 매김)의 돌연변이, 예를 들어 위치 490의 야생형 Glu(E) 잔기를 Lys(K) 잔기로, 위치 537의 야생형 His(H) 잔기를 Lys(K) 잔기 또는 Arg(R) 잔기 (각각 "KIK" 및 "KIR" 도메인으로도 언급됨)로 대체한 돌연변이를 포함한다 (미국 특허 공개공보 번호 20110201055 참조). 본원에 기재된 조작된 절단 절반-도메인은 임의의 적합한 방법을 사용하여, 예를 들어 미국 특허 공개공보 번호 20050064474; 20080131962; 및 20110201055에 기재된 바와 같은 야생형 절단 절반-도메인 (FokI)의 부위-지정 돌연변이유발에 의해 제조할 수 있다.
대안적으로, 뉴클레아제는 소위 "분할-효소" 기술을 사용하여 핵산 표적 부위에서 생체 내에서 조립될 수 있다 (예를 들어, 미국 특허 공개공보 번호 20090068164 참조). 이러한 분할 효소의 성분은 별개의 발현 구축물에서 발현될 수 있거나, 또는 개별 성분이, 예를 들어 자가-절단성 2A 펩티드 또는 IRES 서열에 의해 분리되는 하나의 오픈 리딩 프레임에 연결될 수 있다. 성분은 개별적인 아연 핑거 결합 도메인 또는 메가뉴클레아제 핵산 결합 도메인의 도메인일 수 있다.
C. 아연 핑거 뉴클레아제
구체적 실시양태에서, 키메라 폴리펩티드는, 표적 부위-특이적 이중-가닥 DNA 파단을 전달하여 외인성 핵산, 또는 공여자 DNA가 통합될 수 있도록 설계될 수 있는 주문-설계된 아연 핑거 뉴클레아제 (ZFN)이다 (본원에 참조로 포함되는 공동 소유의 미국 특허 공개 20100257638 참조). ZFN은 제한 엔도뉴클레아제 (예를 들어, FokI)로부터의 비-특이적 절단 도메인 및 아연 핑거 DNA-결합 도메인 폴리펩티드를 함유하는 키메라 폴리펩티드이다. 예를 들어, 문헌 [Huang et al. (1996) J. Protein Chem. 15:481-9; Kim et al. (1997a) Proc. Natl. Acad. Sci. USA 94:3616-20; Kim et al. (1996) Proc. Natl. Acad. Sci. USA 93:1156-60; Kim et al. (1994) Proc Natl. Acad. Sci. USA 91:883-7; Kim et al. (1997b) Proc. Natl. Acad. Sci. USA 94:12875-9; Kim et al. (1997c) Gene 203:43-9; Kim et al. (1998) Biol. Chem. 379:489-95; Nahon and Raveh (1998) Nucleic Acids Res. 26:1233-9; Smith et al. (1999) Nucleic Acids Res. 27:674-81]을 참조한다. 일부 실시양태에서, ZFN는 비-정규 아연 핑거 DNA 결합 도메인을 포함한다 (본원에 참조로 포함되는 공동 소유의 미국 특허 공개 20080182332 참조). FokI 제한 엔도뉴클레아제는 DNA를 절단하고 이중-가닥 파단을 도입하기 위해 뉴클레아제 도메인을 통해 2량체화되어야 한다. 결과적으로, 이러한 엔도뉴클레아제로부터의 뉴클레아제 도메인을 함유하는 ZFN는 또한 표적 DNA를 절단하기 위해 뉴클레아제 도메인의 이량체화가 요구된다 (Mani et al. (2005) Biochem. Biophys. Res. Commun. 334:1191-7; Smith et al. (2000) Nucleic Acids Res. 28:3361-9). ZFN의 이량체화는 반대로 배향된 2개의 인접한 DNA-결합 부위에 의해 용이해질 수 있다. 상기 동일 문헌을 참조한다.
ZFN 시스템의 유연성 및 특이성은 공지된 레콤비나제-매개 유전자 편집 전략에 의해 이전에는 달성될 수 없었던 제어 수준을 제공한다. 한 예로서, ZFN는, 예를 들어 특이적 핵산 서열을 인식하기 위해 용이하게 조작될 수 있다 (Wu et al. (2007) Cell. Mol. Life Sci. 64:2933-44 (그 전문이 본원에 참조로 포함되는 미국 특허 공개 20090205083, 20110189775, 20110167521 및 20100199389 참조)). 아연 핑거 인식 잔기에 대한 코돈의 무작위화는 임의로 선택된 DNA 서열에 대해 높은 친화도를 갖는 새로운 핑거의 선택을 허용한다. 또한, 아연 핑거는 천연 DNA-결합 분자이고, 조작된 아연 핑거는 살아있는 세포 내에서 그의 설계된 표적에 대해 작용하는 것으로 밝혀졌다. 따라서, 아연 핑거를 기초로 한 뉴클레아제는 특이적인 그러나 임의의 인식 부위에 대한 표적화가 가능하다.
특정한 예에서, 숙주의 적어도 하나의 FAD3 성능 유전자좌로의 외인성 핵산의 부위-특이적 통합 방법은 ZFN을 숙주의 세포 내로 도입하는 것을 포함하고, 여기서 ZFN은 표적 뉴클레오티드 서열을 인식하고 이에 결합하며, 여기서 표적 뉴클레오티드 서열은 숙주의 적어도 하나의 FAD3 유전자좌 내에 포함된다. 특정 예에서, 표적 뉴클레오티드 서열은 적어도 하나의 FAD3 유전자좌 이외의 임의의 위치에서는 숙주의 게놈 내에 포함되지 않는다. 예를 들어, ZFN의 DNA-결합 폴리펩티드는 적어도 하나의 FAD3 유전자좌 내에 확인된 표적 뉴클레오티드 서열을 인식하고 이에 결합하도록 조작될 수 있다 (예를 들어, FAD3 유전자좌를 서열분석함으로써). ZFN을 숙주의 세포 내로 도입하는 것을 포함하는, 숙주의 적어도 하나의 FAD3 성능 유전자좌로의 외인성 핵산의 부위-특이적 통합 방법은 또한 외인성 핵산을 세포 내로 도입하는 것을 포함하고, 여기서 적어도 하나의 FAD3 유전자좌를 포함하는 숙주의 핵산 내로의 외인성 핵산의 재조합은 표적 서열에 대한 부위-특이적 인식 및 ZFN의 결합 (및 FAD3 유전자좌를 포함하는 핵산의 후속적인 절단)에 의해 용이해진다.
VI. FAD3 유전자좌에서의 통합을 위한 외인성 핵산
본 발명의 실시양태는 적어도 하나의 FAD3 유전자좌에서 부위-특이적 통합을 위한 외인성 핵산, 예를 들어 제한 없이 PTU, ELP, ETIP 또는 ORF; 표적화 엔도뉴클레아제를 코딩하는 뉴클레오티드 서열을 포함하는 핵산; 및 상기 중 어느 하나 또는 둘 다 중 적어도 하나를 포함하는 벡터로 이루어진 군으로부터 선택된 하나 이상의 핵산을 포함할 수 있다. 따라서, 일부 실시양태에 사용하기 위한 특정한 핵산은 폴리펩티드를 코딩하는 뉴클레오티드 서열, 구조적 뉴클레오티드 서열 및/또는 DNA-결합 폴리펩티드 인식 및 결합 부위를 포함한다.
A. 부위-특이적 통합을 위한 외인성 핵산 분자
상기에 기재된 바와 같이, 외인성 서열 (또한 "공여자 서열" 또는 "공여자" 또는 "트랜스진"으로도 불림)의 삽입은, 예를 들어 폴리펩티드의 발현, 돌연변이체 유전자의 수정 또는 야생형 유전자의 증가된 발현을 위해 제공된다. 공여자 서열은 전형적으로 이것이 위치한 게놈 서열과 동일하지 않음이 용이하게 명백할 것이다. 공여자 서열은 상동성인 2개의 영역에 의해 플랭킹된 비-상동 서열을 함유하여 관심 위치에서 효율적 HDR을 가능하게 할 수 있다. 추가로, 공여자 서열은 세포 염색질에서의 관심 영역에 상동성이 아닌 서열을 함유하는 벡터 분자 포함할 수 있다. 공여자 분자는 세포 염색질에 대한 여러 개의 비연속적인 상동성 영역을 함유할 수 있다. 예를 들어, 보통 관심 영역에 존재하지 않는 서열의 표적화된 삽입을 위해, 상기 서열이 공여자 핵산 분자에 존재할 수 있고, 관심 영역 내의 서열에 대한 상동성 영역에 의해 상기 서열이 플랭킹될 수 있다.
공여자 폴리뉴클레오티드는 DNA 또는 RNA, 단일-가닥 또는 이중-가닥일 수 있고, 선형 또는 원형 형태로 세포 내로 도입될 수 있다. 예를 들어, 미국 특허 공개공보 번호 20100047805, 20110281361, 20110207221 및 미국 출원 번호 13/889,162를 참조한다. 선형 형태로 도입되면, 통상의 기술자에게 공지된 방법에 의해 공여자 서열의 말단이 보호될 수 있다 (예를 들어, 엑소뉴클레아제 분해로부터). 예를 들어, 하나 이상의 디데옥시뉴클레오티드 잔기가 선형 분자의 3' 말단에 부가되고/되거나, 자가-상보적 올리고뉴클레오티드가 한쪽 또는 양쪽 말단에 라이게이션된다. 예를 들어, 문헌 [Chang et al. (1987) Proc. Natl. Acad. Sci. USA 84:4959-4963; Nehls et al. (1996) Science 272:886-889]을 참조한다. 분해로부터 외인성 폴리뉴클레오티드를 보호하기 위한 추가의 방법은 말단 아미노 기(들)의 부가, 및 변형된 뉴클레오티드간 연결기, 예컨대 예를 들어 포스포로티오에이트, 포스포르아미데이트 및 O-메틸 리보스 또는 데옥시리보스 잔기의 사용을 포함하지만, 이에 제한되지는 않는다.
폴리뉴클레오티드는, 예를 들어 복제 기점, 프로모터 및 항생제 저항성을 코딩하는 유전자와 같은 추가의 서열을 갖는 벡터 분자의 일부로서 세포 내로 도입될 수 있다. 또한, 공여자 폴리뉴클레오티드는 네이키드 핵산으로서, 리포솜 또는 폴록사머와 같은 작용제와 복합체화된 핵산으로서 도입될 수 있거나, 또는 바이러스 (예를 들어, 아데노바이러스, AAV, 헤르페스바이러스, 레트로바이러스, 렌티바이러스 및 인테그라제 결핍 렌티바이러스 (IDLV))에 의해 전달될 수 있다.
공여자는 통합 부위에서의 내인성 프로모터, 즉 공여자가 통합된 내인성 유전자 (예를 들어, FAD3)의 발현을 유도하는 프로모터에 의해 그의 발현을 유도하도록 일반적으로 통합된다. 그러나, 공여자가 프로모터 및/또는 인핸서, 예를 들어 구성적 프로모터 또는 유도성 또는 조직 특이적 프로모터를 포함할 수 있음이 명백할 것이다.
또한, 발현을 위해 요구되지 않지만, 외인성 서열은 또한, 전사 또는 번역 조절 서열, 예를 들어 프로모터, 인핸서, 인슐레이터, 내부 리보솜 진입 부위, 2A 펩티드를 코딩하는 서열 및/또는 폴리아데닐화화 신호를 포함할 수 있다.
실시양태에서 적어도 하나의 FAD3 유전자좌 내로 부위-특이적 방식으로 통합되어 FAD3 유전자좌를 변형시킬 수 있는 외인성 핵산은, 예를 들어 제한 없이 관심 폴리펩티드를 코딩하는 핵산 서열을 포함하는 핵산; 농경학적 유전자를 포함하는 핵산; RNAi 분자를 코딩하는 뉴클레오티드 서열을 포함하는 핵산; 또는 FAD3 유전자를 분열시키는 핵산을 포함한다.
일부 실시양태에서, 외인성 핵산은 FAD3 유전자좌에서 통합되어 FAD3 유전자좌를 변형시키고, 여기서 핵산은 농경학적 유전자 또는 뉴클레오티드 서열이 숙주에서 FAD3 유전자좌로부터의 발현되도록, 농경학적 유전자 또는 관심 폴리펩티드를 코딩하는 뉴클레오티드 서열을 포함한다. 일부 예에서, 관심 폴리펩티드 (예를 들어, 외래 단백질)은 산업량으로 관심 폴리펩티드를 코딩하는 뉴클레오티드 서열로부터 발현된다. 이러한 예에서, 관심 폴리펩티드는 숙주 세포, 조직 또는 바이오매스로부터 추출될 수 있다. 일부 실시양태에서, 숙주는 식물이고, 관심 폴리펩티드의 상업적 생산을 위해 제공된 식물 물질은 식물, 식물 일부, 식물 조직 또는 식물 세포일 수 있다. 일부 예에서, 식물 일부는 식물 종자일 수 있다. 식물 바이오매스로부터의 단백질 추출은, 예를 들어 문헌 [Heney and Orr (1981) Anal. Biochem. 114:92-6]에 논의된 공지된 방법에 의해 달성될 수 있다.
마찬가지로, 농경학적 유전자는 형질전환된 식물 세포, 식물 및/또는 그의 자손에서 발현될 수 있다. 예를 들어, 식물은 적어도 하나의 FAD3 유전자좌로부터의 다양한 농경학적 관심 표현형을 발현하는 특정한 실시양태의 방법을 통해 유전자 조작될 수 있다.
일부 실시양태에서, 농경학적 유전자 또는 관심 폴리펩티드를 코딩하는 뉴클레오티드 서열을 포함하는 핵산은, 예를 들어 제한 없이 해충 또는 병해에 대한 저항성을 부여하는 유전자 (예를 들어, 문헌 [Jones et al. (1994) Science 266:789] (클라도스포리움 풀붐(Cladosporium fulvum)에 대한 저항성에 대한 토마토 Cf-9 유전자의 클로닝); 문헌 [Martin et al. (1993) Science 262:1432]; 문헌 [Mindrinos et al. (1994) Cell 78:1089] (슈도모나스 시린가에(Pseudomonas syringae)에 대한 저항성을 위한 RSP2 유전자); PCT 국제 특허 공개 번호 WO 96/30517 (대두 낭 선충병에 대한 저항성); PCT 국제 특허 공개 번호 WO 93/19181; 바실루스 투린기엔시스(Bacillus thuringiensis) 단백질, 그의 유도체, 또는 그에 대해 모델링된 합성 폴리펩티드를 코딩하는 유전자 (예를 들어, 문헌 [Geiser et al. (1986) Gene 48:109] (Bt δ-내독소 유전자의 클로닝 및 뉴클레오티드 서열; 또한, δ-내독소 유전자를 코딩하는 DNA 분자는 아메리칸 타입 컬쳐 콜렉션(American Type Culture Collection; 버지니아주 마나사스)으로부터 예를 들어, ATCC 등록 번호 40098; 67136; 31995 및 31998 하에 구입할 수 있음) 참조); 렉틴을 코딩하는 유전자 (예를 들어, 문헌 [Van Damme et al. (1994) Plant Molec. Biol. 24:25] (몇몇 클리비아 미니아타(Clivia miniata) 만노스-결합 렉틴 유전자의 뉴클레오티드 서열) 참조); 비타민-결합 단백질, 예를 들어 아비딘을 코딩하는 유전자 (PCT 국제 특허 공개 번호 US93/06487 (곤충 해충에 대한 유충구충제로서 아비딘 및 아비딘 상동체의 사용) 참조); 효소 억제제, 예를 들어 프로테아제, 프로테이나제 억제제 또는 아밀라제 억제제를 코딩하는 유전자 (예를 들어, 문헌 [Abe et al. (1987) J. Biol. Chem. 262:16793] (벼 시스테인 프로테이나제 억제제의 뉴클레오티드 서열); 문헌 [Huub et al. (1993) Plant Molec. Biol. 21:985] (담배 프로테이나제 억제제 I을 코딩하는 cDNA의 뉴클레오티드 서열); 문헌 [Sumitani et al. (1993) Biosci. Biotech. Biochem. 57:1243] (스트렙토미세스 니트로스포레우스(Streptomyces nitrosporeus) 알파-아밀라제 억제제의 뉴클레오티드 서열) 및 미국 특허 5,494,813 참조); 곤충-특이적 호르몬 또는 페로몬, 예를 들어 엑디스테로이드 또는 유충 호르몬, 그의 변이체, 그에 대한 모방체, 또는 그의 길항제 또는 효능제를 코딩하는 유전자 (예를 들어, 문헌 [Hammock et al. (1990) Nature 344:458] (클로닝된 유충 호르몬 에스테라제 (유충 호르몬의 불활성화제)의 바큘로바이러스 발현) 참조); 발현시 이환된 해충을 생리학상 분열시키는, 곤충-특이적 펩티드 또는 신경펩티드를 코딩하는 유전자 (예를 들어, 문헌 [Regan (1994) J. Biol. Chem. 269:9] (발현 클로닝은 곤충 이뇨 호르몬 수용체를 코딩하는 DNA를 생성함); 문헌 [Pratt et al. (1989) Biochem. Biophys. Res. Comm. 163:1243] (디플로프테라 푼타타(Diploptera puntata) 내의 알로스타틴); 및 미국 특허 5,266,317 (곤충-특이적, 마비성 신경독소를 코딩하는 유전자) 참조); 자연에서 뱀, 말벌 또는 다른 유기체에 의해 생산되는 곤충-특이적 독을 코딩하는 유전자 (예를 들어, 문헌 [Pang et al. (1992) Gene 116:165] (전갈 곤충독성 펩티드를 코딩하는 유전자의 식물 내 이종성 발현) 참조); 모노테르펜, 세스퀴테르펜, 스테로이드, 히드록삼산, 페닐프로파노이드 유도체 또는 살곤충 활성을 갖는 다른 분자의 과축적을 담당하는 효소를 코딩하는 유전자; 생물학적 활성 분자의 번역후 변형을 비롯한 변형에 관여하는 효소, 예를 들어 당분해 효소, 단백질분해 효소, 지질분해 효소, 뉴클레아제, 시클라제, 트랜스아미나제, 에스테라제, 히드롤라제, 포스파타제, 키나제, 포스포릴라제, 폴리머라제, 엘라스타제, 키티나제 또는 글루카나제 (천연이든 합성이든)를 코딩하는 유전자 (예를 들어, PCT 국제 특허 공개 번호 WO 93/02197 (칼라제 유전자의 뉴클레오티드 서열); 또한, 키티나제-코딩 서열을 함유하는 DNA 분자는, 예를 들어 ATCC로부터 등록 번호 39637 및 67152 하에 얻을 수 있음); 문헌 [Kramer et al. (1993) Insect Biochem. Molec. Biol. 23:691] (담배 박각시나방 키티나제를 코딩하는 cDNA의 뉴클레오티드 서열); 및 문헌 [Kawalleck et al. (1993) Plant Molec. Biol. 21:673] (파슬리 ubi4-2 폴리유비퀴틴 유전자의 뉴클레오티드 서열) 참조); 신호 전달을 자극하는 분자를 코딩하는 유전자 (예를 들어, 문헌 [Botella et al. (1994) Plant Molec. Biol. 24:757] (녹두 칼모둘린 cDNA 클론에 대한 뉴클레오티드 서열); 및 문헌 [Griess et al. (1994) Plant Physiol. 104:1467] (옥수수 칼모둘린 cDNA 클론의 뉴클레오티드 서열) 참조); 소수성 모멘트 펩티드를 코딩하는 유전자 (예를 들어, PCT 국제 특허 공개 번호 WO 95/16776 (진균 식물 병원체를 억제하는 태키플레신 (Tachyplesin)의 펩티드 유도체); 및 PCT 국제 특허 공개 번호 WO 95/18855 (병해 저항성을 부여하는 합성 항미생물 펩티드) 참조); 막 퍼미아제(permease), 채널 형성제, 또는 채널 차단제를 코딩하는 유전자 (예를 들어, 문헌 [Jaynes et al. (1993) Plant Sci 89:43] (트랜스제닉 담배 식물을 슈도모나스 솔라나세아룸(Pseudomonas solanacearum)에 대해 저항성으로 만드는 세크로핀-β 라이틱 펩티드 유사체의 이종성 발현) 참조); 바이러스-침습 단백질 또는 그로부터 유래하는 복합 독소를 코딩하는 유전자 (예를 들어, 문헌 [Beachy et al. (1990) Ann. rev. Phytopathol. 28:451] 참조); 곤충-특이적 항체 또는 그로부터 유래하는 면역독소를 코딩하는 유전자 (예를 들어, 문헌 [Taylor et al., Abstract #497, Seventh Int'l Symposium on Molecular Plant-Microbe Interations (Edinburgh, Scotland) (1994)] (단일쇄 항체 단편의 생산을 통해 트랜스제닉 담배 내에서 효소에 의한 불활성화) 참조); 바이러스-특이적 항체를 코딩하는 유전자 (예를 들어, 문헌 [Tavladoraki et al. (1993) Nature 366:469] (재조합 항체 유전자를 발현하는 트랜스제닉 식물은 바이러스 공격으로부터 보호됨) 참조); 병원체 또는 기생충에 의해 자연에서 생산되는 발달 억제성 단백질을 코딩하는 유전자 (예를 들어, 문헌 [Lamb et al. (1992) Bio/Technology 10:1436] (진균 엔도 α-1,4-D-폴리갈락토우로나제는 식물 세포벽 호모-α-1,4-D-갈락토우로나제를 가용화함으로써 진균 콜리니화 및 식물 영양분 방출을 촉진함); 문헌 [Toubart et al. (1992) Plant J. 2:367] (콩 엔도폴리갈락토우로나제-억제 단백질을 코딩하는 유전자의 클로닝 및 특성화) 참조); 식물에 의해 자연에서 생산되는 발달-억제성 단백질을 코딩하는 유전자 (예를 들어, 문헌 [Logemann et al. (1992) Bio/Technology 10:305] (보리 리보솜-불활성화 유전자를 발현하는 트랜스제닉 식물은 진균 질환에 대한 증가된 저항성을 가짐) 참조)를 포함할 수 있다.
일부 실시양태에서, 농경학적 유전자 또는 관심 폴리펩티드를 코딩하는 뉴클레오티드 서열을 포함하는 핵산은 또한 및/또는 대안적으로, 예를 들어 제한 없이 성장점 또는 분열조직을 억제하는 제초제와 같은 제초제, 예를 들어 이미다졸리논 또는 술포닐우레아에 대한 저항성을 부여하는 유전자 (본 카테고리에서 예시적인 유전자는, 예를 들어 문헌 [Lee et al. (1988) EMBO J. 7:1241, 및 Miki et al. (1990) Theor. Appl. Genet. 80:449]에 각각 설명된 바와 같은 돌연변이체 ALS 및 AHAS 효소를 코딩함); 예를 들어, 돌연변이체 5-엔올피루빌쉬키메이트-3-포스페이트 신타제 (EPSP) 유전자에 의해 부여된 바와 같은 글리포세이트 저항성 (재조합 핵산 및/또는 다양한 형태의 천연 EPSP 유전자 (비제한적으로 CP4, DMMG 및 DGT-28 포함)의 생체내 돌연변이 유발의 도입을 통해; 각각 aroA 유전자 및 글리포세이트 아세틸 트랜스퍼라제 (GAT) 유전자); 스트렙토미세스 히그로스코피쿠스(Streptomyces hygroscopicus) 및 스트렙토미세스 비리디크로모게네스(Streptomyces viridichromogenes)를 포함하는 스트렙토미세스 종으로부터 다른 포스포노 화합물, 예컨대 글루포시네이트 포스피노트리신 아세틸 트랜스퍼라제 (PAT) 유전자); 및 피리디녹시 또는 페녹시 프로프리온산 및 시클로헥손 (ACCase 억제제-코딩 유전자)을 포함할 수 있다. 예를 들어, 미국 특허 4,940,835 및 6,248,876 (식물에 글리포세이트 저항성을 부여할 수 있는 EPSP의 형태의 뉴클레오티드 서열)을 참조한다. 돌연변이체 aroA 유전자를 코딩하는 DNA 분자는 ATCC 등록 번호 39256 하에 얻을 수 있다. 또한, 미국 특허 4,769,061 (돌연변이체 aroA 유전자의 뉴클레오티드 서열)을 참조한다. 유럽 특허 출원 번호 0 333 033 및 미국 특허 번호 4,975,374에서는 L-포스피노트리신과 같은 제초제에 대한 저항성을 부여할 수 있는 글루타민 신테타제 유전자의 뉴클레오티드 서열을 개시하고 있다. 예시적인 PAT 유전자의 뉴클레오티드 서열은 유럽 특허 출원 번호 0 242 246, 및 문헌 [DeGreef et al. (1989) Bio/Technology 7:61] (PAT 활성을 코딩하는 키메라 바(bar) 유전자를 발현하는 트랜스제닉 식물의 생산)에 제공되어 있다. 페녹시 프로프리온산 및 시클로헥손, 예컨대 세톡시딤 및 할록시포프에 대한 저항성을 부여하는 유전자의 예는 문헌 [Marshall et al. (1992) Theor. Appl. Genet. 83:435]에 기재된 바와 같은 Acc1-S1, Acc1-S2 및 Acc1-S3 유전자를 포함한다. 글리포세이트 저항성을 부여할 수 있는 GAT 유전자는, 예를 들어 WO 2005012515에 기재되어 있다. 2,4-D, 페녹시프로프리온산 및 피리딜옥시 옥신 제초제에 대한 저항성을 부여하는 유전자는, 예를 들어 WO 2005107437 및 WO 2007053482에 기재되어 있다.
관심 폴리펩티드를 코딩하는 농경학적 유전자 또는 뉴클레오티드 서열을 포함하는 핵산은 또한, 예를 들어 제한 없이 광합성을 억제하는 제초제, 예컨대 트리아진 (psbA 및 gs+ 유전자) 또는 벤조니트릴 (니트릴라제 유전자)에 대한 저항성을 부여하는 유전자를 포함할 수 있다. 예를 들어, 문헌 [Przibila et al. (1991) Plant Cell 3:169] (돌연변이체 psbA 유전자를 코딩하는 플라스미드를 사용한 클라미도모나스(Chlamydomonas)의 형질전환)을 참조한다. 니트릴라제 유전자에 대한 뉴클레오티드 서열은 미국 특허 4,810,648에 개시되어 있고, 이들 유전자를 함유하는 DNA 분자는 ATCC 등록 번호 53435; 67441; 및 67442 하에 이용가능하다. 또한, 문헌 [Hayes et al. (1992) Biochem. J. 285:173] (글루타티온 S-트랜스퍼라제를 코딩하는 DNA의 클로닝 및 발현)을 참조한다.
일부 실시양태에서, 농경학적 유전자 또는 관심 폴리펩티드를 코딩하는 뉴클레오티드 서열을 포함하는 핵산은 또한 및/또는 대안적으로 가치-부가 형질, 예를 들어 제한 없이, 예를 들어 식물의 스테아르산 함량을 증가시키기 위한 스테아릴-ACP 데새투라제의 안티센스 유전자를 갖는 식물의 형질전환에 의해 변형된 지방산 대사를 부여하거나 또는 이에 기여하는 유전자 (예를 들어, 문헌 [Knultzon et al. (1992) Proc. Natl. Acad. Sci. U.S.A. 89:2624] 참조); 감소된 파이테이트(phytate) 함량 (예를 들어, 피타제-코딩 유전자의 도입은 파이테이트의 분해를 증진하여, 더 많은 유리 포스페이트를 형질전환된 식물에 첨가함) (예를 들어, 문헌 [Van Hartingsveldt et al. (1993) Gene 127:87] (아스페르길루스 니거(Aspergillus niger) 피타제 유전자의 뉴클레오티드 서열); 낮은 수준의 피트산을 특징으로 하는 옥수수 돌연변이체에 기인할 수 있는 단일 대립유전자에 연관된 DNA의 클로닝에 이어서 이를 재도입시킴으로써 달성될 수 있는, 옥수수에서 파이테이트 함량을 감소시키기 위해 도입될 수 있는 유전자 (예를 들어, 문헌 [Raboy et al. (1990) Maydica 35:383] 참조); 및 예를 들어 식물을 전분의 분지화 패턴을 변경시키는 효소를 코딩하는 유전자로 형질전환시킴으로써 달성되는 변형된 탄수화물 조성 (예를 들어, 문헌 [Shiroza et al. (1988) J. Bacteol. 170:810] (스트렙토코쿠스 돌연변이체 프룩토실트랜스페라제 유전자의 뉴클레오티드 서열); 문헌 [Steinmetz et al. (1985) Mol. Gen. Genet. 20:220] (레반수크라제 유전자); 문헌 [Pen et al. (1992) Bio/Technology 10:292] (α-아밀라제); 문헌 [Elliot et al. (1993) Plant Molec. Biol. 21:515] (토마토 인버타제 유전자의 뉴클레오티드 서열); 문헌 [Sogaard et al. (1993) J. Biol. Chem. 268:22480] (보리 α-아밀라제 유전자); 및 문헌 [Fisher et al. (1993) Plant Physiol. 102:1045] (옥수수 내배유 전분 분지화 효소 II) 참조)을 포함할 수 있다.
일부 실시양태에서, 외인성 핵산은 FAD3 유전자좌를 변형시키기 위해 FAD3 유전자좌에 통합되고, 여기서 핵산은, 예를 들어 PTU 또는 ELP의 부위에서의 제2 외인성 핵산의 후속적인 부위-특이적 통합이 용이해지도록 PTU 또는 ELP를 포함한다. 또한, 미국 출원 번호 13/889,162를 참조한다.
표적화 통합을 통해 식물 게놈 내로의 관심 핵산 분자의 표적화 엔도뉴클레아제-매개 통합은 표적화 엔도뉴클레아제 또는 표적화 엔도뉴클레아제-코딩 핵산 분자의 전달 후, 숙주에서의 기능적 표적화 엔도뉴클레아제 단백질의 발현을 필요로 한다. 외인성 핵산은, 기능적 표적화 엔도뉴클레아제 단백질이 적어도 하나의 FAD3 유전자좌에서의 표적 부위(들)에서 이중-가닥 파단을 유도한 다음, 예를 들어 유전자좌 내로의 외인성 핵산의 상동성-유도 통합을 통해 복구되도록, 표적화 엔도뉴클레아제가 숙주 세포 내로 전달되거나 또는 발현되는 것와 동시에 숙주 세포에 내에 존재하는 것이 바람직하다. 통상의 기술자는 기능적 표적화 엔도뉴클레아제 단백질의 발현이 표적화 엔도뉴클레아제-코딩 구축물의 유전자도입, 및 표적화 엔도뉴클레아제-코딩 구축물의 일시 발현을 포함하지만 이에 제한되지 않는 여러 방법에 의해 달성될 수 있음을 알 수 있다. 이들 둘 다의 경우에서, 기능적 표적화 엔도뉴클레아제 단백질의 발현 및 숙주 세포 내로 외인성 핵산의 전달은 FAD3 유전자좌에서 표적화 통합을 유도하기 위해 동시에 달성될 수 있다.
표적화 엔도뉴클레아제로서 ZFN을 이용하는 실시양태에서 획득된 특정한 이점은 키메라 아연 핑거 뉴클레아제의 절단 도메인의 이량체화에 대한 요건이 서열의 높은 수준을 제공하고, 따라서 절단, 특이성의 높은 수준을 제공한다는 것이다. 3개 핑거의 각각의 세트는 9개의 연속적인 염기 쌍에 결합하기 때문에, 2개의 키메라 뉴클레아제는 각각의 아연 핑거 도메인이 완전한 특이성을 갖는다면 18개 bp 표적을 효과적으로 처리한다. 상기 길이의 임의의 주어진 서열은 단일 게놈 (대략 109 bp 가정) 내에서 특유할 것으로 예측된다 (상기 문헌 [Bibikova et al. (2001) Mol. Cell. Biol. 21(1):289-97; Wu et al. (2007)]). 또한, 추가의 핑거는 증진된 특이성을 제공할 수 있으며 (Beerli et al. (1998) Proc. Natl. Acad. Sci. USA 95:14628-33; Kim and Pabo (1998) Proc. Natl. Acad. Sci. USA 95:2812-7; Liu et al. (1997) Proc. Natl. Acad. Sci. USA 94:5525-30), 따라서 각각의 DNA-결합 도메인 내의 아연 핑거의 수는 추가의 특이성을 제공하기 위해 증가될 수 있다. 예를 들어, 특이성은 24개 bp 서열을 인식하는 한 쌍의 4-, 5-, 6- 또는 그 초과의 핑거 ZFN을 사용함으로써 추가로 증가될 수 있다 (Urnov et al. (2005) Nature 435:646-51). 따라서, ZFN은 숙주 식물 게놈 내로 도입된 인식 서열이 게놈 내에서 특유하도록 사용될 수 있다.
B. 표적화 엔도뉴클레아제를 코딩하는 뉴클레오티드 서열을 포함하는 핵산 분자
일부 실시양태에서, 표적화 엔도뉴클레아제를 코딩하는 뉴클레오티드 서열은 표적화 엔도뉴클레아제 내에 포함된 폴리펩티드를 코딩하는 본래 뉴클레오티드 서열의 조작 (예를 들어, 라이게이션)에 의해 조작될 수 있다. 예를 들어, DNA-결합 폴리펩티드를 포함하는 단백질을 코딩하는 유전자의 뉴클레오티드 서열을 검사하여, DNA-결합 폴리펩티드에 상응하는 유전자의 뉴클레오티드 서열을 확인하고 그 뉴클레오티드 서열을, DNA-결합 폴리펩티드를 포함하는 표적화 엔도뉴클레아제를 코딩하는 뉴클레오티드 서열의 요소로서 사용할 수 있다. 대안적으로, 표적화 엔도뉴클레아제의 아미노산 서열을 사용하여, 예를 들어 유전자 코드의 축중성에 따라 표적화 엔도뉴클레아제를 코딩하는 뉴클레오티드 서열을 추론할 수 있다.
표적화 엔도뉴클레아제를 코딩하는 뉴클레오티드 서열을 포함하는 예시적인 핵산 분자에서, 뉴클레아제 폴리펩티드를 코딩하는 제1 폴리뉴클레오티드 서열의 마지막 코돈 및 DNA-결합 폴리펩티드를 코딩하는 제2 폴리뉴클레오티드 서열의 첫번째 코돈은 임의 수의 뉴클레오티드 트리플릿에 의해, 예를 들어 인트론 또는 "정지"를 위한 코딩 없이 분리될 수 있다. 마찬가지로, DNA-결합 폴리펩티드를 코딩하는 제1 폴리뉴클레오티드 서열을 코딩하는 뉴클레오티드 서열의 마지막 코돈 및 뉴클레아제 폴리펩티드를 코딩하는 제2 폴리뉴클레오티드 서열의 첫번째 코돈이 임의 수의 뉴클레오티드 트리플릿에 의해 분리될 수 있다. 이들 및 추가 실시양태에서, 뉴클레아제 폴리펩티드를 코딩하는 제1 폴리뉴클레오티드 서열 및 DNA-결합 폴리펩티드를 코딩하는 제2 폴리뉴클레오티드 서열의 마지막 (즉, 핵산 서열의 가장끝 3')의 마지막 코돈은 거기에 바로 연속되거나, 또는 합성 뉴클레오티드 링커 (예를 들어, 융합을 달성하는데 사용되었을 수 있는 뉴클레오티드 링커)에 의해 코딩되는 것과 같이 짧은 펩티드 서열로만 그로부터 분리된 서열을 코딩하는 추가의 폴리뉴클레오티드의 첫번째 코돈과 위상-일치 (phase-register)로 융합될 수 있다. 이러한 추가의 폴리뉴클레오티드 서열의 예는, 예를 들어 제한 없이 태그, 표적화 펩티드 및 효소적 절단 부위를 포함한다. 마찬가지로, 제1 및 제2 폴리뉴클레오티드 서열의 가장끝 5' (핵산 서열에서)의 첫번째 코돈은 거기에 바로 연속되거나, 또는 짧은 펩티드 서열로만 그로부터 분리된 서열을 코딩하는 추가의 폴리뉴클레오티드의 마지막 코돈과 위상-일치로 융합될 수 있다.
표적화 엔도뉴클레아제 (예를 들어, DNA 결합-폴리펩티드 및 뉴클레아제 폴리펩티드)에서 기능적 폴리펩티드를 코딩하는 서열 분리 폴리뉴클레오티드 서열은, 예를 들어 코딩된 아미노산 서열이 표적화 엔도뉴클레아제의 번역을 유의하게 변경할 가능성이 없도록 하는 임의의 서열로 이루어질 수 있다. 공지된 뉴클레아제 폴리펩티드 및 공지된 DNA-결합 폴리펩티드의 자율 특성으로 인해, 개재 서열은 예에서 이들 구조의 각각 기능을 간섭하지 않을 것이다.
C. 벡터 및 발현 구축물
일부 실시양태에서, 관심 폴리펩티드 및/또는 표적화 엔도뉴클레아제를 코딩하는 적어도 하나의 외인성 폴리뉴클레오티드 서열을 포함하는 적어도 하나의 핵산 분자(들)는 세포, 조직 또는 유기체 내로 그 내부에서의 발현을 위해 도입될 수 있다. 예를 들어, 적어도 하나의 FAD3 유전자좌 내에 포함된 뉴클레오티드 서열을 특이적으로 인식하는 표적화 엔도뉴클레아제를 코딩하는 폴리뉴클레오티드 서열을 포함하는 핵산 분자는 표적화 엔도뉴클레아제의 발현을 위해 세포 내로 도입될 수 있고, 관심 폴리펩티드를 코딩하는 폴리뉴클레오티드 서열을 포함하는 핵산 분자는 관심 폴리펩티드를 코딩하는 폴리뉴클레오티드 서열이, 예를 들어 발현된 표적화 엔도뉴클레아제에 의한 유전자좌에서의 이중 가닥 파단의 도입 후 상동 재조합에 의해, 적어도 하나의 FAD3 유전자좌 내로 통합되도록 세포 내로 도입될 수 있고, 관심 폴리펩티드는 통합된 폴리뉴클레오티드 서열로부터 발현된다.
일부 실시양태에서, 상기 중 하나와 같은 핵산 분자는, 예를 들어 벡터 시스템, 예컨대 예를 들어 제한 없이 선형 플라스미드 또는 폐쇄된 원형 플라스미드일 수 있다. 특정한 예에서, 벡터는 발현 벡터일 수 있다. 특정한 실시양태에 따른 핵산 서열은, 예를 들어 핵산 서열이 1종 이상의 조절 서열에 작동가능하게 연결되도록 벡터에 삽입될 수 있다. 다수의 벡터들이 이와 같은 목적으로 이용가능한데, 구체적인 벡터의 선택은, 예를 들어 벡터에 삽입될 핵산의 크기, 벡터를 사용하여 형질전환될 특정한 숙주 세포, 및/또는 발현되기를 원하는 코딩된 폴리펩티드의 양에 따라 달라질 수 있다. 벡터는 전형적으로 다양한 성분을 함유하며, 그의 동일성은 벡터의 기능 (예를 들어, DNA 증폭 및 DNA 발현), 및 적합한 벡터를 갖는 특정한 숙주 세포(들)에 따라 달라진다.
일부 실시양태에서, 하나 이상의 코딩 서열(들)에 작동가능하게 연결된 조절 서열은 숙주 세포, 예컨대 박테리아 세포, 조류 세포, 진균 세포 또는 식물 세포에서 기능하는 프로모터 서열일 수 있고, 여기서 핵산 분자는 증폭되거나 또는 발현되는 것이다. 일부 실시양태는 관심 폴리펩티드 또는 표적화 엔도뉴클레아제를 코딩하는 하나 이상의 뉴클레오티드(들)에 작동가능하게 연결된 적어도 하나의 조절 서열을 포함하는 뉴클레오티드 서열을 포함하는 식물 형질전환 벡터를 포함할 수 있고, 여기서 하나 이상의 뉴클레오티드 서열(들)은 관심 폴리펩티드 또는 표적화 엔도뉴클레아제를 생성하기 위해 식물 세포, 조직 또는 유기체에서, 조절 서열(들)의 제어 하에 발현될 수 있다.
일부 실시양태에 따른 핵산 분자에서 사용하기에 적합한 프로모터는 유도성인 것, 조직-특이성인 것, 바이러스인 것, 합성인 것 또는 구성적인 것을 포함하며, 모두 관련 기술분야에 익히 공지되어 있다. 본 발명의 실시양태에서 유용할 수 있는 프로모터의 비제한적인 예는 미국 특허 번호 6,437,217 (옥수수 RS81 프로모터); 5,641,876 (벼 액틴 프로모터); 6,426,446 (옥수수 RS324 프로모터); 6,429,362 (옥수수 PR-1 프로모터); 6,232,526 (옥수수 A3 프로모터); 6,177,611 (구성적 옥수수 프로모터); 5,322,938, 5,352,605, 5,359,142 및 5,530,196 (35S 프로모터); 6,433,252 (옥수수 L3 올레오신 프로모터); 6,429,357 (벼 액틴 2 프로모터 및 벼 액틴 2 인트론); 6,294,714 (빛-유도성 프로모터); 6,140,078 (염-유도성 프로모터); 6,252,138 (병원체-유도성 프로모터); 6,175,060 (인 결핍-유도성 프로모터); 6,388,170 (양방향성 프로모터); 6,635,806 (감마-코익신 프로모터); 5,447,858 (대두 열 쇼크 프로모터); 및 미국 특허 출원 일련 번호 09/757,089 (옥수수 엽록체 알돌라제 프로모터)에 의해 제공되어 있다.
추가의 예시적 프로모터는 노팔린 신타제 (NOS) 프로모터 (Ebert et al. (1987) Proc. Natl. Acad. Sci. USA 84(16):5745-9); 옥토핀 신타제 (OCS) 프로모터 (아그로박테리움 투메파시엔스(Agrobacterium tumefaciens))의 종양-유도 플라스미드 상에서 운반되는 것); 카울리모바이러스 프로모터, 예컨대 콜리플라워 모자이크 바이러스 (CaMV) 19S 프로모터 (Lawton et al. (1987) Plant Mol. Biol. 9:315-24); CaMV 35S 프로모터 (Odell et al. (1985) Nature 313:810-2); 현삼 (figwort) 모자이크 바이러스 35S-프로모터 (Walker et al. (1987) Proc. Natl. Acad. Sci. USA 84(19):6624-8); 수크로스 신타제 프로모터 (Yang and Russell (1990) Proc. Natl. Acad. Sci. USA 87:4144-8); R 유전자 복합 프로모터 (Chandler et al. (1989) Plant Cell 1:1175-83); 클로로필 a/b 결합 단백질 유전자 프로모터; CaMV35S (미국 특허 번호 5,322,938, 5,352,605, 5,359,142 및 5,530,196); FMV35S (미국 특허 번호 6,051,753 및 5,378,619); PC1SV 프로모터 (미국 특허 번호 5,850,019); SCP1 프로모터 (미국 특허 번호 6,677,503); 및 AGRtu.nos 프로모터 (진뱅크(GenBank) 등록 번호 V00087; 문헌 [Depicker et al. (1982) J. Mol. Appl. Genet. 1:561-73; Bevan et al. (1983) Nature 304:184-7])를 포함한다.
특정한 실시양태에서, 핵산 분자는 조직-특이적 프로모터를 포함할 수 있다. 조직-특이적 프로모터는 유기체의 다른 조직과 비교하여, 프로모터가 특이적인 조직에서 작동가능하게 연결된 뉴클레오티드 서열의 전사를 더 높은 수준으로 지시하는 뉴클레오티드 서열이다. 조직-특이적 프로모터의 예는 제한 없이 융단조직-특이적 프로모터; 수술-특이적 프로모터; 화분-특이적 프로모터 (예를 들어, 미국 특허 번호 7,141,424 및 국제 PCT 공개 번호 WO 99/042587 참조); 배주-특이적 프로모터; (예를 들어, 미국 특허 출원 번호 2001/047525 A1 참조); 과실-특이 프로모터 (예를 들어, 미국 특허 번호 4,943,674 및 5,753,475 참조); 및 종자-특이적 프로모터 (예를 들어, 미국 특허 번호 5,420,034 및 5,608,152 참조)를 포함한다. 일부 실시양태에서, 발달 단계-특이적 프로모터 (예를 들어, 후기 발달 단계에 활성을 보이는 프로모터)가 사용될 수 있다.
일부 실시양태에서, 핵산 분자에 작동가능하게 연결될 수 있는 추가의 조절 서열로는 번역 리더 서열로서의 기능을 하는, 프로모터 서열과 코딩 서열 사이에 위치하는 5' UTR을 포함한다. 번역 리더 서열은 완전하게 프로세싱된 mRNA에 존재하고, 이는 1차 전사체의 프로세싱, 및/또는 RNA의 안정성에 영향을 줄 수 있다. 번역 리더 서열의 예는 옥수수 및 페튜니아 열 쇼크 단백질 리더 (미국 특허 번호 5,362,865), 식물 바이러스 코트 단백질 리더, 식물 루비스코 리더 등을 포함한다. 예를 들어, 문헌 [Turner and Foster (1995) Molecular Biotech. 3(3):225-36]을 참조한다. 5' UTR의 비-제한적인 예는 GmHsp (미국 특허 번호 5,659,122); PhDnaK (미국 특허 번호 5,362,865); AtAnt1; TEV (Carrington and Freed (1990) J Virol. 64:1590-7); 및 AGRtunos (진뱅크 등록 번호 V00087; 및 상기 문헌 [Bevan et al. (1983)])에 의해 제공된다.
일부 실시양태에서, 핵산 분자에 작동가능하게 연결될 수 있는 추가의 조절 서열은 또한 3' 비번역 서열, 3' 전사 종결 영역, 또는 폴리아데닐화 영역을 포함한다. 이들은 뉴클레오티드 서열의 하류에 위치하는 유전 요소이며, 이는 폴리아데닐화 신호, 및/또는 전사 또는 mRNA 프로세싱에 영향을 줄 수 있는 다른 조절 신호를 제공하는 폴리뉴클레오티드를 포함한다. 폴리아데닐화 신호는 식물에서 폴리아데닐레이트 뉴클레오티드를 mRNA 전구체의 3' 말단에 부가하는 기능을 한다. 폴리아데닐화 서열은 다양한 식물 유전자로부터, 또는 T-DNA 유전자로부터 유래된 것일 수 있다. 3' 전사 종료 영역의 비제한적인 예는 노팔린 신타제 3' 영역 (nos 3'; 문헌 [Fraley et al. (1983) Proc. Natl. Acad. Sci. USA 80:4803-7])이다. 다양한 3' 비번역 영역의 사용의 예가 문헌 [Ingelbrecht et al. (1989) Plant Cell 1:671-80]에 제공되어 있다. 폴리아데닐화 신호의 비제한적 예는 피숨 사티붐(Pisum sativum) RbcS2 유전자 (Ps.RbcS2-E9; Coruzzi et al. (1984) EMBO J. 3:1671-9) 및 AGRtu.nos (진뱅크 등록 번호 E01312)로부터의 것을 포함한다.
구체적인 실시양태들에서 유용할 수 있는 조절 서열에 관한 추가의 정보는, 예를 들어 문헌 [Goeddel (1990) "Gene Expression Technology," Methods Enzymol. 185, Academic Press, San Diego, CA]에 기재되어 있다.
재조합 핵산 분자 또는 벡터는 형질전환된 세포, 예컨대 식물 세포에 선택가능한 표현형을 부여하는 선택 마커를 포함할 수 있다. 선택 마커는 또한 선택 마터를 포함하는 핵산 분자를 포함하는 세포 또는 유기체를 선택하는데 사용될 수 있다. 마커는 살생물제 저항성, 항생제 저항성 (예를 들어, 카나마이신, 게네티신 (G418), 블레오마이신 및 히그로마이신), 또는 제초제 저항성 (예를 들어, 글리포세이트)을 코딩할 수 있다. 선택 마커의 예는 카나마이신 저항성을 부여하며, 예를 들어 카나마이신 및 G418을 사용하여 선택될 수 있는 neo 유전자; 비알라포스 저항성을 부여하는 bar 유전자; 글리포세이트 저항성을 부여하는 돌연변이 EPSP 신타제 유전자; 브로목시닐에 대한 저항성을 부여하는 니트릴라제 유전자; 이미다졸리논 또는 술포닐우레아 저항성을 부여하는 돌연변이 아세토락테이트 신타제 유전자 (ALS); 및 메토트렉세이트-내성 DHFR 유전자를 포함하지만, 이에 제한되지는 않는다. 예를 들어 제한 없이 암피실린; 블레오마이신; 클로람페니콜; 겐타마이신; 히그로마이신; 카나마이신; 린코마이신; 메토트렉세이트; 포스피노트리신; 퓨로마이신; 스펙티노마이신; 리팜피신; 스트렙토마이신 및 테트라시클린을 포함하여, 화학적 작용제에 대한 저항성을 부여하는 다수의 선택 마커들이 이용가능하다. 상기 선택 마커의 예는, 예를 들어 미국 특허 5,550,318; 5,633,435; 5,780,708 및 6,118,047에 예시되어 있다.
핵산 분자 또는 벡터는 또한 또는 대안적으로 스크리닝가능 마커를 포함할 수 있다. 스크린가능한 마커는 발현을 모니터링하는데 사용될 수 있다. 예시적인 스크리닝가능 마커는, 그에 대한 각종 발색 기질이 공지되어 있는 효소를 코딩하는 β-글루쿠로니다제 또는 uidA 유전자 (GUS) (Jefferson et al. (1987) Plant Mol. Biol. Rep. 5:387-405); 식물 조직에서 안토시아닌 색소 (적색) 생산을 조절하는 생성물을 코딩하는 R-유전자좌 유전자 (Dellaporta et al. (1988) "Molecular cloning of the maize R-nj allele by transposon tagging with Ac." In 18th Stadler Genetics Symposium, P. Gustafson and R. Appels, eds., Plenum, NY (pp. 263-82); β-락타마제 유전자 (Sutcliffe et al. (1978) Proc. Natl. Acad. Sci. USA 75:3737-41); 그에 대한 각종 발색 기질이 공지되어 있는 효소를 코딩하는 유전자 (예를 들어, PADAC, 발색성 세팔로스포린); 루시퍼라제 유전자 (Ow et al. (1986) Science 234:856-9); 발색성 카테콜을 전환시킬 수 있는 카테콜 디옥시게나제를 코딩하는 xylE 유전자 (Zukowski et al. (1983) Gene 46(2-3):247-55); 아밀라제 유전자 (Ikatu et al. (1990) Bio/Technol. 8:241-2); 티로신을 도파 및 도파퀴논으로 산화시킴에 따라 멜라닌을 축합시킬 수 있는 효소를 코딩하는 티로시나제 유전자 (Katz et al. (1983) J. Gen. Microbiol. 129:2703-14); 및 α-갈락토시다제를 포함한다.
예를 들어, 특정한 관심 폴리펩티드 또는 특정한 표적화 엔도뉴클레아제를 코딩하는 모든 뉴클레오티드 서열은 통상의 기술자에 의해 즉시 인식가능할 것이다. 유전자 코드의 축중성은 특정한 아미노산 서열에 대한 한정된 개수의 코딩 서열을 제공한다. 본 발명의 실시양태에 따른 폴리펩티드를 코딩하는 특정한 서열의 선택은 실시자의 판단에 속한다. 상이한 적용에 있어서는 상이한 코딩 서열이 바람직할 수 있다.
일부 실시양태에서, 예를 들어 특정한 숙주의 핵산 내에 포함되는 폴리뉴클레오티드 서열의 발현을 증진시키기 위해, 핵산의 뉴클레오티드를 변형하는 것이 바람직할 수 있다. 유전자 코드는 64개의 가능한 코돈으로 중복되지만, 대부분의 유기체는 우선적으로 이들 코돈의 하위세트를 사용한다. 종에서 가장 빈번하게 이용되는 코돈은 최적 코돈이라 불리며, 가장 빈번하게 사용되지 않는 것들은 희귀 또는 저-사용 코돈으로 분류된다 (Zhang et al. (1991) Gene 105:61-72). 코돈은 때때로 "코돈 최적화"로서 지칭되는 과정에서 특정한 숙주의 바람직한 코돈 사용을 반영하기 위해 대체될 수 있다. 특정한 원핵 또는 진핵 숙주가 선호하는 코돈을 함유하는 최적화된 코딩 서열은, 예를 들어 번역률을 증가시키거나, 목적하는 특성 (예를 들어, 비-최적화된 서열로부터 제조된 전사체와 비교하여 보다 장기간의 반감기)을 갖는 재조합 RNA 전사체를 생산함으로써 제조할 수 있다.
핵산은 통상의 기술자로 공지된 임의의 방법, 예컨대 예를 들어 제한 없이 원형질체의 형질전환에 의한 것 (예를 들어, 미국 특허 5,508,184); 건조/억제-매개 DNA 흡수에 의한 것 (예를 들어, 문헌 [Potrykus et al. (1985) Mol. Gen. Genet. 199:183-8]); 전기천공에 의한 것 (예를 들어, 미국 특허 5,384,253); 탄화규소 섬유를 사용한 교반에 의한 것 (예를 들어, 미국 특허 5,302,523 및 5,464,765); 아그로박테리움-매개 형질전환에 의한 것 (예를 들어, 미국 특허 5,563,055, 5,591,616, 5,693,512, 5,824,877, 5,981,840, 및 6,384,301); 및 DNA-코팅 입자의 가속에 의한 것 (예를 들어, 미국 특허 5,015,580, 5,550,318, 5,538,880, 6,160,208, 6,399,861, 및 6,403,865)에 의해 본 발명의 실시양태에서 숙주 세포 내로 도입될 수 있다. 이들과 같은 기술의 적용을 통해, 실질적으로 임의의 종의 세포는 안정하게 형질전환될 수 있다. 일부 실시양태에서, 형질전환 DNA는 숙주 세포의 게놈 내로 통합된다. 다세포 종의 경우에, 트랜스제닉 세포는 트랜스제닉 유기체 내로 재생될 수 있다. 임의의 이들 기술은, 예를 들어 트랜스제닉 식물의 게놈에 본 발명의 하나 이상의 핵산 서열을 포함하는 트랜스제닉 식물을 생산하기 위해 사용될 수 있다.
발현 벡터를 식물에 도입하는데 가장 광범위하게 이용되는 방법은 아그로박테리움의 자연 형질전환 시스템을 기반으로 한다. 에이. 투메파시엔스(A. tumefaciens) 및 에이. 리조게네스(A. rhizogenes)는 식물 세포를 유전자 형질전환시키는 식물 병원성 토양 박테리아이다. 에이. 투메파시엔스 및 에이. 리조게네스의 Ti 및 Ri 플라스미드는 각각 식물의 유전 형질전환을 담당하는 유전자를 운반한다. Ti (종양-유도)-플라스미드는 형질전환된 식물로 전달되는 T-DNA로 공지된 큰 절편을 함유한다. Ti 플라스미드의 또 다른 절편인 vir 영역은 T-DNA 전달을 담당한다. T-DNA 영역에는 각각 말단 반복 뉴클레오티드 서열로 이루어진 좌측 및 우측 경계가 접한다. 몇몇의 변형된 이원성 벡터에서, 종양-유도 유전자가 결실되었고, vir 영역의 기능은 T-DNA 경계 서열이 접하는 외래 DNA를 전달하기 위해 이용된다. T-영역은 또한, 예를 들어 트랜스제닉 식물 및 세포의 효율적인 회수를 위한 선택 마커, 및 전달을 위한 삽입 서열, 예컨대 본 발명의 융합 단백질을 코딩하는 핵산의 다중 클로닝 부위를 함유할 수 있다.
따라서, 일부 실시양태에서, 식물 형질전환 벡터는 에이. 투메파시엔스의 Ti 플라스미드 (예를 들어, 미국 특허 4,536,475, 4,693,977, 4,886,937, 및 5,501,967; 및 유럽 특허 EP 0 122 791 참조) 또는 에이. 리조게네스의 Ri 플라스미드로부터 유래된다. 추가의 식물 형질전환 벡터는, 예를 들어 제한 없이 문헌 [Herrera-Estrella et al. (1983) Nature 303:209-13]; 상기 문헌 [Bevan et al. (1983)]; 문헌 [Klee et al. (1985) Bio/Technol. 3:637-42]; 및 유럽 특허 EP 0 120 516에 기재된 것, 및 상기 중 임의의 것으로부터 유래되는 것을 포함한다. 자연상에서 식물과 상호작용하는 다른 박테리아, 예컨대 시노리조비움(Sinorhizobium), 리조비움(Rhizobium) 및 메소리조비움(Mesorhizobium)이 수많은 다양한 식물로의 유전자 전달을 매개하도록 변형될 수 있다. 이들 식물-연관 공생 박테리아는 무력화된 Ti 플라스미드 및 적합한 이원성 벡터 둘 다의 획득에 의해 유전자 전달에 대해 적격으로 만들 수 있다.
외인성 DNA를 수용자 세포에 제공한 후, 일반적으로는 추가의 배양 및 식물 재생을 위해 형질전환된 세포를 확인한다. 형질전환된 세포를 확인할 수 있는 능력을 개선시키기 위해서는 형질전환체를 생성하는데 사용되는 벡터와 함께, 이전에 제시된 바와 같은 선택 또는 스크리닝가능 마커 유전자를 사용하는 것이 바람직할 수 있다. 선택 마커가 사용되는 경우, 형질전환된 세포는 세포를 선택제 또는 선택제들에 노출시킴으로써 잠재적으로 형질전환된 세포 집단 내에서 확인된다. 스크리닝가능 마커가 사용되는 경우, 세포는 목적하는 마커 유전자 형질에 대해 스크리닝될 수 있다.
선택제에의 노출에서 살아남은 세포, 또는 스크리닝 검정에서 양성인 것으로 평가된 세포를 식물의 재생을 지지하는 배지 중에서 배양할 수 있다. 일부 실시양태에서, 임의의 적합한 식물 조직 배양 배지 (예를 들어, MS 및 N6 배지)는 추가 물질, 예컨대 성장 조절제를 포함함으로써 변형될 수 있다. 조직은 식물 재생의 노력을 개시하는데 충분한 조직이 이용가능할 때까지, 또는 수동식 선택 라운드를 반복한 후, 조직의 형태가 재생에 적합한 형태가 될 때까지 (예를 들어, 적어도 2주) 성장 조절제를 포함하는 기초 배지 상에서 유지시킨 다음, 신초 형성에 도움이 되는 배지로 옮겨 놓는다. 충분한 신초 형성이 일어날 때까지 주기적으로 배양물을 옮겨 놓는다. 일단 신초가 형성되고 나면, 이를 뿌리 형성에 도움이 되는 배지로 옮겨 놓는다. 일단 뿌리가 형성되고 나면, 추가 성장 및 성숙화를 위해 식물을 토양으로 옮겨 놓을 수 있다.
재생 식물에서의 관심 핵산 분자 (예를 들어, 적어도 하나의 본 발명 융합 단백질을 포함하는 폴리펩티드를 코딩하는 뉴클레오티드 서열)의 존재를 확인하기 위하여, 다양한 검정이 수행될 수 있다. 이러한 검정은, 예를 들어 분자 생물학적 검정, 예컨대 서던 및 노던 블롯팅, PCR 및 핵산 서열분석; 생화학적 검정, 예컨대 예를 들어 면역학적 수단 (ELISA 및/또는 웨스턴 블롯)에 의해, 또는 효소 작용에 의해 단백질 생성물의 존재를 검출하는 것; 식물 부분 검정, 예컨대 잎 또는 뿌리 검정; 및 재생된 전체 식물의 표현형의 분석을 포함한다.
통합 사례는, 예를 들어 관심 뉴클레오티드 서열에 특이적인 올리고뉴클레오티드 프라이머를 사용한, 예를 들어 PCR 증폭에 의해 분석될 수 있다. PCR 유전자형 결정은 게놈 내로 통합된 관심 핵산 분자를 함유할 것으로 예측되는 단리된 숙주 식물 조직으로부터 유래된 게놈 DNA의 폴리머라제-연쇄 반응 (PCR) 증폭에 이어서, PCR 증폭 생성물의 표준 클로닝 및 서열 분석을 수행하는 것을 포함하지만 이에 제한되지 않는 것으로 이해된다. PCR 유전자형 결정 방법에 대해서는 잘 기재되어 있고 (예를 들어, 문헌 [Rios, G. et al. (2002) Plant J. 32:243-53] 참조), 세포 배양물을 포함한 임의의 식물 종 또는 조직 유형으로부터 유래하는 게놈 DNA에 적용될 수 있다.
아그로박테리움-의존성 형질전환 방법을 사용하여 형성된 트랜스제닉 식물은 전형적으로 단일 내지 다중 카피의 재조합 DNA를 함유한다. 단일 재조합 DNA 서열은 "트랜스제닉 사례" 또는 "통합 사례"로 지칭된다. 이러한 트랜스제닉 식물은 삽입된 DNA 서열에 대해 이형접합성이다. 일부 실시양태에서, 트랜스진과 관련하여 동형접합성인 트랜스제닉 식물은 단일 외인성 유전자 서열을 함유하는 독립 분리개체 트랜스제닉 식물을 그 자신, 예를 들어 F0 식물과 유성적으로 교배시켜 (자가 수정시켜) F1 종자를 생성함으로써 획득할 수 있다. 생성된 F1 종자 중 1/4은 트랜스진과 관련하여 동형접합성일 것이다. F1 종자를 발아시킴으로써, 전형적으로 SNP 검정, 또는 이형접합체와 동형접합체가 구별될 수 있게 하는 열 증폭 검정 (즉, 접합성 검정)을 사용하여 이형접합성에 대해 시험될 수 있는 식물을 생성한다.
일부 실시양태에서 핵산 분자를 사용한 식물 또는 식물 세포의 직접적인 형질전환 이외에도, 적어도 하나의 트랜스제닉 사례를 갖는 제1 식물을 이러한 사례가 결핍되어 있는 제2 식물과 교배시키는 것에 의해 트랜스제닉 식물이 특정한 실시양태에서 제조될 수 있다. 예를 들어, 외인성 핵산이 부위-특이적 방식으로 통합된 것인 적어도 하나의 변형된 FAD3 유전자좌를 포함하는 핵산은 트랜스제닉 식물을 생성하기 위한 형질전환에 순응하는 제1 식물 라인 내로 도입될 수 있으며, 여기서 트랜스제닉 식물은 적어도 하나의 변형된 FAD3 유전자좌를 제2 식물 라인 내로 유전자이입시키기 위해 (따라서, 외인성 핵산이 제2 식물 라인 내로 들어감) 제2 식물 라인과 교배될 수 있다.
재생 식물에서 관심 핵산 분자의 존재를 확인하기 위해, 다양한 검정이 수행될 수 있다. 이러한 검정은, 예를 들어 분자 생물학적 검정, 예컨대 서던 및 노던 블롯팅 및 PCR; 생화학적 검정, 예컨대 예를 들어 면역학적 수단 (ELISA 및/또는 웨스턴 블롯)에 의해 또는 효소적 기능에 의한 단백질 생성물의 존재를 검출하는 것; 식물 부분 검정, 예컨대 잎 또는 뿌리 검정; 및 재생된 전체 식물의 표현형의 분석을 포함한다.
표적화된 통합 사례는, 예를 들어 관심 핵산 분자에 특이적인 올리고뉴클레오티드 프라이머를 사용한, 예를 들어 PCR 증폭에 의해 스크리닝될 수 있다. PCR 유전자형 결정은 게놈 내로 통합된 관심 핵산 분자를 함유할 것으로 예측되는 단리된 숙주 식물 캘러스 조직으로부터 유래된 게놈 DNA의 폴리머라제-연쇄 반응 (PCR) 증폭에 이어서 PCR 증폭 생성물의 표준 클로닝 및 서열 분석을 포함하지만 이에 제한되지 않는 것으로 이해된다. PCR 유전자형 결정 방법은 잘 기재되어 있고 (예를 들어, 문헌 [Rios, G. et al. (2002) Plant J. 32:243-53]), 세포 배양물을 비롯한 임의의 식물 종 또는 조직 종류로부터 유래된 게놈 DNA에 적용될 수 있다. 표적 서열 및 도입된 서열 둘 다에 결합하는 올리고뉴클레오티드 프라이머의 조합은 PCR 증폭 반응에서 순차적으로 사용되거나 또는 멀티플렉스화될 수 있다. 표적 부위, 도입된 핵산 서열, 및/또는 둘의 조합에 어닐링하도록 설계된 올리고뉴클레오티드 프라이머가 사용될 수 있다. 따라서, PCR 유전자형 결정 전략은 식물 게놈 내의 특이적 서열의 증폭, 식물 게놈 내의 다중 특이적 서열의 증폭, 식물 게놈 내의 비-특이적 서열의 증폭, 또는 이들의 조합을 포함할 수 있다 (이에 제한되지는 않음). 통상의 기술자는 게놈에 대해 정보를 얻기 위한 프라이머 및 증폭 반응의 추가의 조합을 고안할 수 있다. 예를 들어, 도입된 핵산 서열의 경계 외부의 표적에 특이적인 핵산 서열(들)에 어닐링하도록 정방향 및 역방향 올리고뉴클레오티드 프라이머의 세트가 설계될 수 있다.
정방향 및 역방향 올리고뉴클레오티드 프라이머는, 예를 들어 관심 핵산 분자 내의 코딩 영역, 또는 관심 핵산 분자의 다른 부분에 상응하는 서열에서, 도입된 관심 핵산 분자에 특이적으로 어닐링하도록 설계될 수 있다. 이들 프라이머는 상기 기재된 프라이머와 함께 사용될 수 있다. 올리고뉴클레오티드 프라이머는 목적하는 서열에 따라 합성될 수 있고, 상업적으로 입수가능하다 (예를 들어, 인테그레이티드 디엔에이 테크놀로지스, 인크.(Integrated DNA Technologies, Inc.) 아이오와주 코랄빌)로부터). 증폭 후에, 증폭 생성물의 클로닝 및 서열 결정, 또는 직접적인 서열 분석이 수행될 수 있다. 통상의 기술자는 PCR 유전자형 결정 동안 생성된 증폭 생성물의 분석을 위한 대안적인 방법을 구상할 수 있다. 한 실시양태에서, 유전자 표적에 특이적인 올리고뉴클레오티드 프라이머가 PCR 증폭에 사용된다.
VI. FAD3 성능 유전자좌에 통합된 핵산을 포함하는 트랜스제닉 식물 및 식물 물질
일부 실시양태에서, 식물이 적어도 하나의 변형된 FAD3 유전자좌 (예를 들어, 분열되고/거나 외인성 서열의 표적화 통합된 FAD3 유전자좌)를 포함하는 식물 세포를 포함하는, 트랜스제닉 식물이 제공된다. 특정한 실시양태에서, 이러한 식물은 식물 조직 또는 식물 세포의 형질전환, 및 전체 식물의 재생에 의해 생성될 수 있다. 추가 실시양태에서, 이러한 식물은 부위-특이적 방식으로 적어도 하나의 FAD3 유전자좌에서의 외인성 핵산의 도입을 통해 또는 변형된 FAD3 유전자좌의 생식질로의 유전자이입을 통해 획득될 수 있다. 이러한 식물 세포를 포함하는 식물 물질이 또한 제공된다. 이러한 식물 물질은 식물 세포를 포함하는 식물로부터 획득될 수 있다.
적어도 하나의 변형된 FAD3 유전자좌를 포함하는 식물 세포를 포함하는 트랜스제닉 식물 또는 식물 물질은 일부 실시양태에서 하기 특징: 식물 세포에서의 표적화 엔도뉴클레아제의 발현; 식물 세포에서의 (또는 그 내부의 색소체에서의) 관심 폴리펩티드의 발현; 식물 세포의 핵에서의 표적화 엔도뉴클레아제의 발현; 식물 세포에서의 표적화 엔도뉴클레아제의 국재화; 식물 세포의 게놈에서 FAD3 유전자좌에서의 통합; 관심 폴리펩티드를 코딩하는 뉴클레오티드 서열 또는 농경학상 유전자의 식물 세포의 게놈에서 FAD3 유전자좌에서의 통합; 및/또는 식물 세포의 게놈에서 FAD3 유전자좌에서 통합된 코딩 서열에 상응하는 RNA 전사체의 존재 중 하나 이상을 나타낼 수 있다. 이러한 식물은 추가로, 예를 들어 제한 없이 내인성 또는 트랜스제닉 뉴클레오티드 서열의 발현, 식물 세포의 게놈에서 FAD3 유전자좌에서 통합된 관심 폴리펩티드 또는 농경학상 유전자에 의해 조절되는 발현; 곤충, 다른 해충, 및 병해 유발제에 대한 저항성; 제초제에 대한 내성; 안정성, 수율 또는 보관-수명 증진; 환경상의 내성; 약제 생산; 산업 제품 생산; 및 영양상 증진으로 인한 것을 비롯한 하나 이상의 바람직한 형질을 가질 수 있다.
본 발명에 따른 트랜스제닉 식물은 본원에 기재된 방법에 따라 적어도 하나의 FAD3 유전자좌에 후속적으로 통합되는 핵산으로 형질전환될 수 있는 임의의 식물일 수 있다. 따라서, 식물은 쌍자엽 또는 단자엽일 수 있다. 본 발명의 방법에 사용가능한 쌍자엽 식물의 비제한적인 예는 아라비돕시스, 알팔파, 콩, 브로콜리, 양배추, 카놀라, 당근, 콜리플라워, 셀러리, 배추, 목화, 오이, 가지, 상추, 멜론, 완두콩, 후추, 땅콩, 감자, 호박, 무, 평지씨, 시금치, 대두, 스쿼시, 사탕무, 해바라기, 담배, 토마토 및 수박을 포함한다. 본 방법에 사용가능한 단자엽 식물은 비제한적인 예는 옥수수, 보리, 양파, 벼, 소르굼, 밀, 호밀, 기장, 사탕수수, 귀리, 트리티케일, 스위치그래스 및 잔디를 포함한다. 본 발명에 따른 트랜스제닉 식물이 사용될 수 있거나, 또는 이는 임의의 방식으로 재배될 수 있다.
일부 실시양태는 또한 본 발명의 트랜스제닉 식물로부터 생산되는 일상용품을 제공한다. 일상용품은, 예를 들어 제한 없이 적어도 하나의 FAD3 유전자좌에 통합되는 하나 이상의 뉴클레오티드 서열을 포함하는 식품 제품, 음식, 오일 또는 식물의 분쇄 곡물 또는 통곡물 또는 종자를 포함한다. 하나 이상의 상품 또는 일상용품에서의 하나 이상의 이러한 뉴클레오티드 서열의 검출은 상품 또는 일상용품이 적어도 일부가 본 발명의 실시양태에 따라 생산된 트랜스제닉 식물로부터 생산되었다는 사실상의 증거이다. 일부 실시양태에서, 적어도 하나의 변형된 FAD3 유전자좌를 포함하는 식물 세포를 포함하는 트랜스제닉 식물 또는 종자는 그의 게놈에서의 적어도 하나의 다른 트랜스제닉 사례, 예컨대 제한 없이 RNAi 분자가 전사되는 트랜스제닉 사례; 살곤충 단백질 (예를 들어, 바실루스 투린기엔시스(Bacillus thuringiensis) 살곤충 단백질)을 코딩하는 유전자; 제초제 내성 유전자 (예를 들어, 글리포세이트에 대한 내성을 제공하는 유전자); 및 트랜스제닉 식물에서 목적하는 표현형 (예를 들어, 증가된 수율, 변경된 지방산 대사물질, 또는 세포질 남성 불임의 회복)에 기여하는 유전자를 포함할 수 있다.
적어도 하나의 변형된 FAD3 유전자좌를 포함하는 식물 세포를 포함하는 트랜스제닉 식물은 하나 이상의 목적하는 형질을 가질 수 있다. 이러한 형질은, 예를 들어 곤충, 다른 해충, 및 병해 유발제에 대한 저항성; 제초제에 대한 내성; 안정성, 수율 또는 보관-수명 증진; 환경상의 내성; 제약 생산; 산업 제품 생산; 및 영양상 증진을 포함할 수 있다. 바람직한 형질은 바람직한 형질을 나타내는 식물에서 발현되는 FAD3 유전자좌에서의 표적화된 재조합에 의해 통합된 하나 이상의 핵산 분자에 의해 부여될 수 있다. 따라서, 일부 실시양태에서, 목적하는 형질은 적어도 하나의 변형된 FAD3 유전자좌의 부위에서의 식물의 게놈 내로 도입된 트랜스진(들)의 식물 내 존재에 의한 것일 수 있다. 추가 실시양태에서, 목적하는 형질은 형질이 적어도 하나의 변형된 FAD3 유전자좌에서 표적화된 재조합에 의해 통합된 하나 이상의 핵산 분자에 의해 부여될 수 있는 통상적인 육종을 통해 얻을 수 있다.
본 발명에 따른 트랜스제닉 식물은 임의의 방식으로 사용되거나 또는 배양될 수 있고, 여기서 적어도 하나의 변형된 FAD3 유전자좌의 존재는 바람직한 것이다. 따라서, 식물은, 특히 본 발명에 따른 적어도 하나의 FAD3 유전자좌에서 부위-특이적 방식으로 후속적으로 통합되는 핵산 분자로 형질전환되고, 관련 기술분야에서 통상의 기술자에게 공지된 임의의 방법에 의해 경작 및 배양됨으로써 하나 이상의 목적하는 형질을 갖도록 조작될 수 있다.
VII. FAD3 성능 유전자좌에 통합된 핵산을 포함하는 트랜스제닉 식물의 마커-지원 육종
브라시카(Brasicca) 종에서 Fad2 및 Fad3에 연관된 (예를 들어, 긴밀하게-연관된) 분자 마커가 제공된다. 예를 들어, HO 형질에 관련된 서열 (FAD3)을 함유하는 DNA 절편이 확인된다. 이들 절편은 게놈 연결 기의 돌연변이체 대립유전자에 연관된 (예를 들어, 긴밀하게-연관된) 마커 주위에 및 이들 사이에 위치한다. 따라서, 불활성화 돌연변이를 갖는 돌연변이체 FAD3 유전자를 포함하는 핵산 분자가 또한 제공된다. 부분적으로, 확인된 절편 및 그의 마커는 비. 나푸스 게놈에서의 연결 기에서 그의 위치에 의해 본 발명의 대상에 포함된다.
본원에 인용된 공개공보, 특허 및 특허 출원을 비롯한 모든 참고문헌은 이들이 본 개시내용의 명백한 상세한 설명과 불일치하지 않는 정도로 본원에 참조로 포함되고, 각 참고문헌이 참고문헌으로써 개별적으로 및 구체적으로 나타나고 그 전문이 본원에 기재된 것과 동일한 정도로 포함된다. 본원에서 논의된 참고 문헌은 단지 본 출원의 출원일 이전의 그의 개시내용에 대해서만 제공하는 것이다. 본 발명자들이 선행 발명으로 인해 이러한 개시내용에 대해 선행하는 권리가 없음을 용인하는 것으로 해석되는 것은 아니다. 하기 실시예는 특정 특별한 특징 및/또는 실시양태를 예시하기 위해 제공된다. 실시예는 예시되어 있는 구체적인 특징 또는 실시양태로 본 개시내용을 제한하는 것으로 간주되지는 않는다.
실시예
실시예 1: 박테리아 인공 염색체 라이브러리로부터 FAD3 표적 서열의 확인
BAC 라이브러리 구축
박테리아 인공 염색체 (BAC) 라이브러리는 상업적 공급원 (앰플리콘 익스프레스(Amplicon Express), 워싱턴주 풀만)으로부터 입수하였다. BAC 라이브러리는 브라시카 나푸스(Brassica napus) L. var. DH10275로부터 단리된 고분자량 게놈 DNA (gDNA) 단편을 함유하는 110,592개의 BAC 클론을 포함하였다. gDNA를 BamHI 또는 HindIII 제한 효소로 소화시켰다. 약 135 Kbp의 단리된 gDNA 단편을 pCC1BAC 벡터 (에피센트레(Epicentre), 위스콘신주 매디슨)에 라이게이션시키고, 에스케리키아 콜라이(Escherichia coli) str. DH10B (인비트로젠(Invitrogen))로 형질전환시켰다. BAC 라이브러리는 2개의 상이한 제한 효소를 사용하여 구축된 짝수 개의 BAC 클론으로 구성되었다. 이와 같이, Hind III 구축된 BAC 라이브러리는 144개의 개별 384-웰 플레이트로 함유되었다. 마찬가지로, BamHI 구축된 BAC 라이브러리는 144개의 개별 384-웰 플레이트로 함유되었다. 총 110,592개의 BAC 클론을 단리하고, 288개의 개별 384-웰 플레이트에 배열하였다. 288개의 개별 384-웰 플레이트는 각각 고속 PCR 기반 스크리닝을 위한 단일 DNA 추출용으로 공급원에 의해 제공되었다. 생성된 BAC 라이브러리는 대략 15 Gbp의 gDNA를 포괄하며, 이는 브라시카 나푸스 L. var. DH10275 게놈의 12-배 게놈 커버리지에 해당한다 (브라시카 나푸스 L. 게놈의 추정치는 문헌 [Johnston et al. (2005) Annals of Botany 95:229-235]에 기재된 바와 같이 약 1.132 Gbp임).
BAC 라이브러리로부터 단리된 FAD3 코딩 서열의 서열 분석
구축된 BAC 라이브러리를 사용하여 FAD3 유전자 코딩 서열을 단리하였다. 서열분석 실험을 수행하여 브라시카 나푸스 L. var. DH10275로부터의 6개의 FAD3 유전자 동조체 및 파라로그의 특정 유전자 서열을 확인하였다.
FAD3 유전자 서열이 처음에 모델 종 아라비돕시스 탈리아나에서 확인되었다. 유전자 서열은 진뱅크에 유전자좌 태그: At2g29980으로 열거된다. 모델 식물 종 아라비돕시스 탈리아나 및 이배체 브라시카 라파 (사배체 브라시카 나푸스의 조상 중 하나) 사이의 비교 게놈 상관관계는 이전에 기재되어 있다. (Schranz et al. (2006) Trends in Plant Science 11(11):535-542). FAD 유전자에 대한 특정의 관련성으로 미루어 보아 비교 분석시에 유전자의 3-4개 카피가 이배체 브라시카 게놈 내에서 발생할 수 있을 것으로 예상되었다. 추가의 유전자 맵핑 연구는 문헌 [Scheffler et al. (1997) Theoretical and Applied Genetics 94; 583-591]에 따라 완료되었다. 이러한 유전자 맵핑 연구의 결과는 FAD3 유전자의 6개의 카피가 브라시카 나푸스에 존재한다는 것을 보여주었다.
브라시카 나푸스로부터의 FAD3 유전자에 집중된 이전의 서열분석 시도에서 양쪽 A 및 C 게놈 특이적 카피를 확인하고, 유전자 맵핑하였다 (Hu et al., (2006) Theoretical and Applied Genetics, 113(3): 497-507). 종자 특이적 cDNA 라이브러리로부터의 EST 서열의 수집물이 이전에 구축되었으며, 캐나다 농업농산식품부(Agriculture and Agri-food Canada, 서스캐처원주 새스커툰 107 사이언스 플레이스)의 앤드루 샤프(Andrew Sharpe)에 의해 식물 세포주 DH12075로부터 서열분석되었다. 더욱이, 2배가 된 반수체 카놀라 식물 DH12075 전장 유전자 서열로부터의 EST의 수집물이 이용가능하지 않았기 때문에, 정확하게 호출된 뉴클레오티드의 서열 품질 및 신뢰도의 지침 또한 이용가능하지 않았다. 결과적으로, 상이한 FAD 유전자 서열 판독물 사이의 서열 변이는 명백하게 FAD3 유전자 패밀리의 다양한 동조체 및 파라로그의 상이한 유전자 카피에 기인할 수 없었으며, 게놈 서열도 이용가능하지 않았다. 그러나, EST 뿐만 아니라 2개의 FAD3A 및 FAD3C 전장 유전자 서열 (문헌 [Hu et al., (2006)]에 기재됨)을 사용하여 조합된 서열 분석을 수행하였을 때, 유전자 둘 다와 매치되는 EST를 추가의 4개의 반수체형과 함께 확인하였다. 그 결과, 총 6개의 특유한 FAD3 반수체형이 확인되었다. 다양한 FAD3 반수체형에 대한 모든 이용가능한 데이터의 어셈블리 후에, 엑손 1에서 높은 수준의 엑손 서열 분기가 확인되었다. 엑손 1에서 FAD3 서열의 분기는 유전자/대립유전자 특이적 PCR 프라이머의 설계에 이용될 수 있는 기회로 확인되었다. 또한, 반수체형 사이에서 최소로 분화된 엑손 (예를 들어, 엑손 5, 6, 7 및 8이 1-3 bp를 가지며, 이는 FAD3A 및 FAD3C 사이에서 달라짐) 또는 서열 변이가 없는 엑손 (예를 들어, 엑손 2 및 3)이 확인되었다.
비. 나푸스 L. var. DH12075로부터 구축된 BAC 라이브러리의 서열결정 분석에서 6개의 BAC 서열 (서열 1, 서열 2, 서열 3, 서열 4, 서열 5, 및 서열 6)을 단리하였으며, 이로부터 FAD3A (서열 7), FAD3A' (서열 8), FAD3A" (서열 9), FAD3C (서열 10), FAD3C" (서열 11), 및 FAD3C' (서열 12) 유전자에 대한 코딩 서열을 결정하였다. FAD3A, FAD3A', FAD3A", FAD3C, FAD3C", 및 FAD3C' 유전자 서열을 확인하고, 유전자 맵핑하였다.
6개의 FAD3 유전자의 서열 분석을 서열 정렬 프로그램 및 이웃-접합수 (동일성 백분율 사용)를 이용하여 수행하였다. 서열 정렬을 벡터 NTI 어드밴스 11.0 컴퓨터 프로그램 (라이프 테크놀로지스(Life Technologies), 캘리포니아주 칼스배드)으로부터의 얼라인X® 프로그램을 통해 만들고, 도 1에 제시하였다. 얼라인X®는 변형된 클러스탈 W 알고리즘을 이용하여 유사성 비교 및 주석달기를 위한 단백질 또는 핵산 서열의 다중 서열 정렬을 생성한다. 이웃-접합수를 잘뷰 v2.3® 소프트웨어로 생성하고, 도 2에 제시하였다. (Waterhouse et al. (2009) Bioinformatics 25 (9) 1189-1191). FAD3 유전자를 함유하는 것으로 확인된 콘티그를 아라비돕시스 탈리아나 유전자의 데이터베이스에 대한 BLASTn 쿼리(query)로 사용하였다. FAD3 유전자를 함유하는 6개의 콘티그 각각의 영역을 아라비돕시스 탈리아나 FAD3 유전자 (진뱅크 등록 번호 At2g29980)에 대한 비교를 통해 확인하였다. 이어서, FAD3 콘티그를 모든 FAD3 유전자가 5' → 3' 배향을 갖도록 배향하였다. FAD3 콘티그를 가능한 경우에 2개의 상류 (5') 및 1개의 하류 (3') 아라비돕시스 탈리아나 유전자를 함유하도록 트리밍하였다. 일단 배향되면 FAD3 유전자의 완전한 코딩 영역을 각 콘티그로부터 추출하고, 이를 이용하여 상이한 FAD3 유전자 패밀리 구성원 사이의 상관관계를 보여주는 이웃 접합수를 생성한다. 6개의 FAD3 패밀리 구성원을 FAD3 유전자의 3개의 쌍에 정렬시켰다 (도 2).
PCR 기반 스크리닝
상기 언급된 BAC 라이브러리를 스크리닝하기 위해 PCR 프라이머의 코호트를 설계하였다. 프라이머를 유전자 패밀리의 모든 구성원을 증폭시키는 범용 프라이머, 또는 표적화된 대립유전자 증폭을 위한 유전자 특이적 프라이머로 설계하였다. PCR 프라이머는 20 bp 길이 (+/- 1bp)가 되고 50% (+/- 8%)의 G/C 함량을 함유하도록 설계하였다. 표 1은 설계 및 합성된 프라이머를 열거한다. BAC 라이브러리의 클론을 모으고, 폴리머라제 연쇄 반응 (PCR)을 통해 스크리닝하였다.
표 1: FAD3 서열의 PCR 증폭에 사용된 프라이머 서열
Figure 112015032530092-pct00002
폴리머라제 연쇄 반응 (PCR)에 2가지 상이한 세트의 조건을 이용하였다. 첫번째 시리즈의 PCR 반응은 다음을 함유하였다: 1X PCR 완충제 (dNTP 함유); 1.5 mM MgCl2; 200 μM의 0.25 U 이몰라제(Immolase)® DNA 폴리머라제 (바이오라인(Bioline), 영국 런던); 250 nM의 각 프라이머; 및 약 5-10 ng 주형 DNA. 두번째 시리즈의 PCR 반응은 게놈 DNA의 증폭을 위해 개발하였으며, 다음을 함유하였다: 5-10 ng의 게놈 DNA, 1X PCR 완충제, 2 mM dNTP, 0.4 μM 정방향 및 역방향 프라이머, 및 0.25 U 이몰라제® DNA 폴리머라제 (바이오라인, 영국 런던). 시약을 13 μL의 최종 부피로 모으고, MJ PTC200® 써모사이클러 (바이오라드(BioRad), 캘리포니아주 허큘레스) 또는 ABI 9700 진 앰프 시스템(Gene Amp System)® (라이프 테크놀로지스, 캘리포니아주 칼스배드)을 이용하여 증폭시켰다. 특정 플레이트의 PCR 기반 스크리닝을 상기 기재된 PCR 조건에서 문헌 [Bryan et al. (Scottish Crops Research Institute annual report: 2001-2002)]에 기재된 스크리닝 시스템에 기초한 4차원 스크리닝 접근법을 이용하여 수행하였다. 모은 BAC 라이브러리의 PCR 기반 스크리닝 후에; 증폭된 PCR 생성물을 직접적 생어(Sanger) 서열분석 방법을 이용하여 서열분석하였다. 증폭된 생성물을 빅다이(BigDye)® v3.1 프로토콜 (어플라이드 바이오시스템즈(Applied Biosystems))에 따라 에탄올, 아세트산나트륨 및 EDTA로 정제하고, ABI3730xl® 자동화 모세관 전기영동 플랫폼 상에서 전기영동을 수행하였다.
PCR 기반 스크리닝 및 입체형태적 생어 서열분석에 따라, 다양한 상이한 FAD3 유전자 패밀리 구성원을 함유하는 플레이트의 집단을 확인하였다. 총 6개의 특유한 FAD3 동조체 및 파라로그 유전자 서열이 확인되었다 (표 2). FAD3 유전자를 함유하는 플레이트 내에서의 특이적 웰 및 클론을 확인하기 위한 플레이트 스크리닝을 수행하기 위해 각각의 FAD3 유전자 서열당 총 2개의 플레이트를 선택하였다 (표 2). 양쪽 플레이트에서 특이적 웰을 확인하고, 각각의 FAD3 유전자 패밀리 구성원에서 개별 클론을 선택하였다 (표 2).
표 2: 양성 반응을 제공하는 BAC 클론 플레이트의 확인 (사용된 상세한 PCR 프라이머 조합 및 플레이트 내에서의 클론 확인을 위해 선택된 2개의 플레이트 Id).
Figure 112015032530092-pct00003
각각의 확인된 FAD 유전자 패밀리 구성원에서 단일 BAC 클론을 서열분석을 통해 추가로 분석하였다. BAC 클론의 DNA를 단리하고, 라지 컨스트럭트 키트(Large Construct kit)® (퀴아젠(Qiagen), 캘리포니아주 발렌시아)를 제조업체의 지침에 따라 사용하는 서열분석을 위해 제조하였다. 추출된 BAC DNA는 GS-FLX 티타늄 기술® (로슈(Roche), 인디애나주 인디애나폴리스)을 제조업체의 지침에 따라 이용하는 서열분석을 위해 제조하였다. 최적의 데이터 산출을 위해 쌍별로 모은 BAC의 서열분석 반응을 물리적으로 분할된 GS-FLX TI 피코-타이터(Pico-titer) 플레이트®를 이용하여 수행하였다. BAC는 FAD2 유전자가 FAD3 유전자와 쌍을 형성하여 만든 쌍별로 조합하였다. 모든 생성된 서열 데이터를 뉴블러(Newbler) v2.0.01.14® (454 라이프 사이언시스, 코네티컷주 브랜포드)에 의해 어셈블리하였다. 어셈블리된 콘티그를 대응하는 FAD 유전자의 존재에 대해 시퀀셔(Sequencher) v3.7® (진코드스(GeneCodes), 미시간주 앤 아버)를 이용하여 수동적으로 평가하였다.
모든 6개의 FAD3 유전자의 전체 게놈 서열을 확인하고 완전히 특성화한 후에, 아연 핑거 뉴클레아제를 각각의 특정 유전자 패밀리 구성원에 대한 서열에 결합하도록 설계하였다.
실시예 2: FAD2 유전자에 특이적인 아연 핑거 결합 도메인의 설계
FAD3 유전자 유전자좌의 다양한 기능적 서열을 코딩하는 DNA 서열에 대해 지시된 아연 핑거 단백질을 이전에 기재된 바와 같이 설계하였다. 예를 들어, 문헌 [Urnov et al. (2005) Nature 435:646-651]을 참조한다. 예시적인 표적 서열 및 인식 나선은 표 3 (인식 나선 영역 설계) 및 표 4 (표적 부위)에 제시된다. 표 4에서, ZFP 인식 나선에 의해 접촉되는 표적 부위에서의 뉴클레오티드는 대문자로 나타내고; 접촉되지 않은 뉴클레오티드는 소문자로 나타낸다. 아연 핑거 뉴클레아제 (ZFN) 표적 부위는 FAD3의 7개의 표적 부위에 결합하도록 설계하였다. FAD3 아연 핑거 설계를, CCHC 구조의 핑거를 적어도 하나 갖는 단백질을 코딩하는 아연 핑거 발현 벡터에 도입하였다. 미국 특허 공보 번호 2008/0182332를 참조한다. 특히, 각 단백질에서 마지막 핑거는 인식 나선에 대해 CCHC 백본을 갖는다. 비-정규 아연 핑거-코딩 서열을 4개의 아미노산 ZC 링커 및 제아 메이스(Zea mays)로부터 유래된 opaque-2 핵 국재화 신호를 통해 유형 IIS 제한 효소 FokI의 뉴클레아제 도메인 (문헌 [Wah et al., (1998) Proc. Natl. Acad. Sci. USA 95:10564-10569]의 서열의 아미노산 384-579)에 융합시켜 FAD3 아연-핑거 뉴클레아제 (ZFN)를 형성하였다. 융합 단백질의 발현은 상대적으로 강한 구성적 프로모터, 예컨대 카사바 베인 모자이크(Cassava Vein Mosaic) 바이러스 (CsVMV) 프로모터로부터 유래되고 아그로박테리움 투메파시엔스(Agrobacterium tumefaciens) ORF23 3' 비번역 영역 (AtuORF23 3'UTR v1)에 의해 플랭킹된 프로모터에 의해 구동된다. 토세아 아시그나(Thosea asigna) (Szymczak et al., 2004)로부터의 바이러스 자기-가수분해 2A 코딩 뉴클레오티드 서열을 구축물에 클로닝된 2개의 ZFN 사이에 부가하였다. 예시적인 벡터는 하기 기재되어 있다.
최적의 아연 핑거는 이전에 활성 뉴클레아제를 확인하는 것으로 밝혀진 출아 효모 기반 시스템을 이용하여 절단 활성에 대해 검증하였다. 예를 들어, 미국 특허 공보 번호 20090111119; 문헌 [Doyon et al. (2008) Nat Biotechnol. 26:702-708; Geurts et al. (2009) Science 325:433]을 참조한다. 다양한 기능적 도메인에 대한 아연 핑거를 생체내 사용을 위해 선택하였다. 추정 FAD 게놈 폴리뉴클레오티드 표적 부위에 결합하도록 설계, 생산 및 시험된 다수의 ZFN 중에서, 높은 수준의 생체내 활성을 갖는 15개의 ZFN을 확인하고, 추가의 실험을 위해 선택하였다. 이러한 ZFN은 식물체내에서 특유한 FAD3 게놈 폴리뉴클레오티드 표적에 효율적으로 결합하여 이를 절단할 수 있는 것으로 특성화되었다.
표 3: FAD3 아연 핑거 설계
Figure 112015032530092-pct00004
Figure 112015032530092-pct00005
Figure 112015032530092-pct00006
표 4: FAD3 아연 핑거의 표적 부위
Figure 112015032530092-pct00007
Figure 112015032530092-pct00008
실시예 3: FAD3 유전자의 아연 핑거 뉴클레아제 절단의 평가
구축물 어셈블리
실시예 2에 기재된 바와 같이, 효모 검정을 이용하여 확인된, 예시적인 아연 핑거 뉴클레아제의 ZFN 발현 구축물을 함유하는 플라스미드 벡터를 관련 기술분야에 통상적으로 공지된 기술을 이용하여 설계하고 완성하였다. 각각의 아연 핑거-코딩 서열을 아연 핑거 뉴클레아제의 상류에 위치한, opaque-2 핵 국재화 신호를 코딩하는 서열에 융합시켰다 (Maddaloni et al. (1989) Nuc. Acids Res. 17(18):7532).
이어서, opaque-2 핵 국재화 신호::아연 핑거 뉴클레아제 융합 서열과 상보적 opaque-2 핵 국재화 신호::아연 핑거 뉴클레아제 융합 서열의 쌍을 형성하였다. 이에 따라, 각 구축물은 토세아 아시그나 바이러스로부터의 2A 서열에 의해 분리된 2개의 opaque-2 핵 국재화 신호::아연 핑거 뉴클레아제 융합 서열을 포함하는 단일 오픈 리딩 프레임을 포함하였다 (Mattion et al. (1996) J. Virol. 70:8124-8127). 융합 단백질의 발현은 상대적으로 강한 구성적 프로모터, 예컨대 카사바 베인 모자이크 바이러스 (CsVMV) 프로모터로부터 유래되고 아그로박테리움 투메파시엔스 ORF23 3' 비번역 영역 (AtuORF23 3'UTR)에 의해 플랭킹된 프로모터에 의해 구동된다.
벡터를 인-퓨전(In-FUSION)™ 어드밴티지 테크놀로지(Advantage Technology) (클론테크(Clontech), 캘리포니아주 마운틴 뷰)를 이용하여 어셈블리하였다. 제한 엔도뉴클레아제는 뉴 잉글랜드 바이오랩스(New England BioLabs) (NEB; 매사추세츠주 입스위치)로부터 입수하고, T4 DNA 리가제 (인비트로젠)를 DNA 라이게이션에 사용하였다. 플라스미드 제조는 뉴클레오스핀(NUCLEOSPIN)® 플라스미드 키트 (마슈레-나겔 인크.(Macherey-Nagel Inc.), 펜실베니아주 베들레헴) 또는 플라스미드 미디 키트 (퀴아젠)를 공급업체의 지침에 따라 사용하여 수행하였다. DNA 단편을 아가로스 트리스-아세테이트 겔 전기영동 후에 퀴아퀵(QIAquick) 겔 추출 키트™ (퀴아젠)를 사용하여 단리하였다. 모두 어셈블리된 플라스미드의 콜로니를 처음에 미니프렙 DNA의 제한 소화에 의해 스크리닝하였다. 선택된 클론의 플라스미드 DNA를 상업적인 서열분석 공급원 (유로핀스 MWG 오페론(Eurofins MWG Operon), 알라배마주 헌츠빌)에서 서열분석하였다. 서열 데이터를 어셈블리하고, 시퀀셔™ 소프트웨어 (진 코드스 코포레이션(Gene Codes Corp.), 미시간주 앤 아버)를 이용하여 분석하였다. 비. 나푸스 원형질체로 전달하기 전에, 플라스미드 DNA를 이. 콜라이의 배양물로부터 퓨어 일드(Pure Yield) 플라스미드 맥시프렙 시스템® (프로메가 코포레이션(Promega Corporation), 위스콘신주 매디슨) 또는 플라스미드 맥시 키트® (퀴아젠, 캘리포니아주 발렌시아)를 공급업체의 지침에 따라 사용하여 제조하였다.
생성된 11개의 플라스미드 구축물; pDAB107824 (ZFNs 28025-2A-28026), pDAB107815 (ZFNs 27961-2A-27962), pDAB107816 (ZFNs 27969-2A-27970), pDAB107817 (ZFNs 27973-2A-27974), pDAB107825 (ZFNs 28035-2A-28036), pDAB107826 (ZFNs 28039-2A-28040), pDAB107818 (ZFNs 27987-2A-27988), pDAB107827 (ZFNs 28051-2A-28052), pDAB107821 (ZFNs 28004-2A-28005), pDAB107819 (ZFNs 27989-2A-27990), pDAB107828 (ZFNs 28053-2A-28054) (도 3), pDAB107829 (ZFNs 28055-2A-28056) (도 4), pDAB107820 (ZFNs 27991-2A-27992), pDAB107822 (ZFNs 28021-2A-28022) 및 pDAB107823 (ZFNs 28023-2A-28024)을 제한 효소 소화 및 DNA 서열분석을 통해 확인하였다.
형질감염을 위한 DNA의 제조
상기 기재된 벡터의 플라스미드 DNA를 침전, 100% (v/v) 에탄올 중의 세척에 의해 멸균시키고, 층류 후드에서 건조시켰다. DNA 펠릿을 하기 기재되는 바와 같은 원형질체 세포로의 형질감염을 위해 0.7 μg/μl의 최종 농도로 30 μL의 멸균 이중-증류수에 현탁시켰다. 플라스미드 DNA의 제조는 일시적 형질감염에서는 슈퍼코일드(supercoiled) 플라스미드 DNA 및 안정한 형질감염의 경우에는 선형화된 플라스미드 DNA가 생성되도록 수행하였다. 운반 DNA (예를 들어, 어류-정자 DNA)를 형질전환 플라스미드에 부가하는 것은 원형질체 세포의 일시적 형질감염에서는 요구되지 않는다. 일시적 연구에서, 106개 원형질체당 약 30 μg의 플라스미드 DNA가 1회 형질전환에 사용되었다.
형질감염
브라시카 나푸스 L. var. DH10275의 형질감염은 문헌 [Spangenberg et al., (1986) Plant Physiology 66: 1-8]에 기재된 바와 같이 완료되었으며, 배지 제제는 문헌 [Spangenberg G. and Protrykus I. (1995) Polyethylene Glycol-Mediated Direct Gene Transfer in Tobacco Protoplasts. In: Gene Transfer to Plants. (Protrykus I. and Spangenberg G. Eds.) Springer-Verlag, Berlin]에 기재되어 있다. 브라시카 나푸스 종자를 70% 에탄올 중에서 표면 멸균시켰다. 종자를 12 mL의 70% 에탄올 용액에 침지시키고, 10분 동안 칵테일을 부드럽게 흔들어 혼합하였다. 용액을 경사분리하여 70% 에탄올 용액을 제거하고, 1% w/v 칼슘 하이포클로라이트 및 0.1% v/v 트윈-20의 종자 멸균 용액으로 교환하였다. 종자를 종자 멸균 용액에 침지시키고, 25분 동안 칵테일을 부드럽게 흔들어 혼합하였다. 종자 멸균 용액을 경사분리하고, 멸균된 종자를 50 mL의 멸균수로 3회 세정하였다. 최종적으로, 페트리 디쉬 안에 넣은 멸균 80 mm 와트만(Whatman) 여과지 디스크® (피셔-사이언티픽(Fisher-Scientific), 미주리주 세인트 루이스)에 종자를 옮기고, 종자를 멸균수로 약간 포화시켰다. 페트리 디쉬를 파라필름(Parafilm)® (피셔-사이언티픽, 미주리주 세인트 루이스)으로 밀봉하고, 플레이트를 25℃에서 완전히 어두운 상태로 1 내지 2일 동안 인큐베이션하였다. 묘목 발생 신호가 종자로부터 관찰된 후에, 묘목을 고형화된 GEM 배지를 함유하는 페트리 디쉬로 옮겨 추가의 종자 발아를 장려하였다. 묘목을 GEM 배지 상에서 4 내지 5일 동안 25℃에서 인큐베이션하였다.
소정 부피의 액체 PS 배지 (약 10 mL)를 멸균 페트리 디쉬로 경사분리하였다. 멸균 겸자 및 해부용 칼을 사용하여, 성장 및 발육의 4-잎 단계에서 4 내지 5일령의 묘목의 공기 부분을 제거하여 처리하였다. 소형 세포질-풍부 원형질체의 최고 집단을 생산하기 위해 20-40 mm 길이의 배축 절편을 결정하였다. 배축 절편을 무균 절제하고, 액체 PS 배지로 옮겼다. 절제된 배축 절편을 함께 분류하고, 가로로 5-10 mm의 절편으로 절단하였다. 이어서, 배축 절편을 새로운 PS 배지로 옮기고, 실온에서 1시간 동안 인큐베이션하였다. 원형질분리된 배축을 효소 용액을 함유하는 페트리 디쉬로 옮겼다. 모든 배축 절편을 주의깊게 용액에 침지시켰다. 페트리 디쉬를 파라필름®으로 밀봉하고, 부드럽게 흔들면서 20 - 22℃에서 16 내지 18시간 동안 밤새 인큐베이션하였다.
원형질체 세포를 배축 절편으로부터 방출시켰다. 밤샘 배축 소화물을 부드럽게 교반하여 원형질체를 효소 용액으로 방출시켰다. 페트리 디쉬를 약간 기울여서 효소 용액 및 식물 잔해물의 소화 용액의 전달을 보조하였다. 10 mL 피펫을 사용하여 소화 현탁액을 멸균된 원형질체 여과 (100 마이크로미터 메쉬의 필터) 장치로 옮겨 식물 잔해물로부터 원형질체를 추가로 분리하였다. 여과 장치를 가볍게 두드려 체에 남아있는 잉여 액체를 방출시켰다. 원형질체 현탁액, 약 8 내지 9 mL를 부드럽게 혼합하고, 14 mL 멸균 플라스틱 원형-바닥 원심분리 튜브에 분배하였다. 각각의 현탁액을 1.5 mL의 W5 용액 위에 올렸다. W5 용액을 기울여서 원형질체 현탁액 상에 주의깊게 분배하고, 최소의 교반으로 한 방울씩 분배하였다. W5 용액을 원형질체 현탁액에 첨가하여 원형질체 풍부 인터페이스를 생성하였다. 이러한 인터페이스를 피펫을 사용하여 수집하였다. 이어서, 수집된 원형질체를 새로운 14 mL 원심분리 튜브로 옮기고, 부드럽게 혼합하였다. 밀리리터당 원형질체의 수를 결정하기 위해 혈구계를 이용하여 수율 또는 수득된 원형질체를 측정하였다. 이 방법을 반복하였으며, 여기서 잎 조직을 소화시켜 엽육 원형질체를 생산하였다.
이어서, W5 용액을 10 mL의 부피로 첨가하고, 원형질체를 70 g에서 펠릿화한 후에, W5 용액을 제거하였다. 나머지 원형질체 현탁액을 부드럽게 진탕시켜 재현탁시켰다. 원형질체 현탁액을 함유하는 각각의 튜브를 5 mL의 W5 용액으로 채우고, 실온에서 1 내지 4시간 동안 인큐베이션하였다. 원형질체 현탁액을 70 g에서 펠릿화하고, 모든 W5 용액을 제거하였다. 이어서, 300 μL의 형질전환 완충제를 단리된 원형질체를 함유하는 각각의 펠릿화된 원형질체 현탁액에 첨가하였다. 각각의 튜브에, 10 μg의 플라스미드 DNA를 원형질체 현탁액에 첨가하였다. 플라스미드 DNA는 상기 기재된 아연 핑거 뉴클레아제 구축물을 포함하였다. 이어서, 300 μL의 예열된 PEG 4000 용액을 원형질체 현탁액에 첨가하고, 튜브를 가볍게 두드렸다. 원형질체 현탁액 및 형질전환 혼합물을 어떠한 교반도 없이 15분 동안 실온에서 인큐베이션하였다. 추가의 10 mL의 W5 용액을 각각의 튜브에 1 mL, 1 mL, 1 mL, 2 mL, 2 mL, 및 3 mL의 순차적 분취액으로 첨가하였으며, W5 용액의 각 첨가 사이에 튜브를 부드럽게 전도시켰다. 원형질체를 원심분리기에서 70 g로 회전시켜 펠릿화하였다. 모든 W5 용액을 제거하여 순수한 원형질체 현탁액을 남겼다.
이어서, 0.5 mL의 K3 배지를 펠릿화된 원형질체 세포에 첨가하고, 세포를 재현탁시켰다. 재현탁된 원형질체 세포를 페트리 디쉬의 중앙에 놓고, 5 mL의 K3 및 0.6 mL 씨 플라크(Sea Plaque)™ 아가로스 (캠브렉스(Cambrex), 뉴저지주 이스트 러더포드)를 1:1 농도로 첨가하였다. 페트리 디쉬를 단일의 부드러운 소용돌이 운동으로 진탕시키고, 20-30분 동안 실온에서 인큐베이션하였다. 페트리 디쉬를 파라필름®으로 밀봉하고, 원형질체를 완전히 어두운 상태에서 24시간 동안 배양하였다. 어두운 상태에서 인큐베이션한 후에, 페트리 디쉬를 희미한 광 (5 μMol m-2 s-1의 오스람(Osram) L36 W/21 루미룩스(Lumilux) 백색 튜브) 상태에서 6일 동안 배양하였다. 배양 단계 후에, 멸균 스패튤라를 사용하여 원형질체를 함유하는 아가로스를 사등분하였다. 분리된 사분원을 20 mL의 A 배지를 함유하는 250 mL 플라스틱 배양 용기에 넣고, 80 rpm 및 1.25 cm 스로에서의 회전 진탕기 상에서 14일 동안 24℃에서 연속적인 희미한 광 상태로 인큐베이션한 후에, 각각의 ZFN 구축물의 활성의 수준을 결정하기 위한 분석을 수행하였다.
카놀라 원형질체로부터의 게놈 DNA 단리
형질감염된 원형질체를 개별 1.5 또는 2.0 mL 미세원심분리기 튜브에 공급하였다. 세포를 완충제 용액 중에 튜브 바닥에서 펠릿화하였다. 액체 질소 중에서 세포를 급속 냉동시킨 후에 에이 랩콘코 프리존 4.5(a Labconco Freezone 4.5)® (랩콘코(Labconco), 미주리주 캔자스 시티)에서 약 48시간 동안 -40℃ 및 약 133 x 10-3 mBar 압력에서 세포를 동결 건조시킴으로써 DNA 추출을 수행하였다. 조직 파괴가 요구되지 않으며 원형질체 세포를 용해 완충제에 직접 첨가하는 것을 예외로 하고, 제조업체의 지침에 따라 DNeasy® (퀴아젠, 캘리포니아주 칼스배드) 식물 키트를 사용하여 동결건조된 세포에서 DNA를 추출하였다.
카놀라 원형질체에서의 게놈 DNA 서열 절단에 대한 FAD3A FAD3C ZFN의 시험
FAD3A 및 FAD3C 유전자 유전자좌 내의 ZFN 표적 부위의 설계를 클러스터링하여, ZFN의 다중 쌍이 표적 부위에서 중첩되도록 설계하였다. ZFN 표적 부위의 클러스터링은 모든 중첩 ZFN 표적 부위를 포함하도록 100 bp 윈도우 내의 모든 FAD3A 및 FAD3C 유전자 패밀리 구성원으로부터의 플랭킹 게놈 서열을 증폭시키는 PCR 프라이머를 설계할 수 있다. 이에 따라, 일루미나 짧은 판독 서열 기술을 이용하여 형질감염된 원형질체의 표적 ZFN 부위의 완전성을 평가할 수 있다. 또한, 설계된 PCR 프라이머는 서열 판독물이 FAD3A 및 FAD3C 유전자 패밀리의 특정 유전자 구성원에 기인하는 특정 뉴클레오티드 염기를 포함할 필요가 있다. 따라서, 모든 PCR 프라이머는 비-상동 말단 접합부 (NHEJ) 활성이 프라이밍 부위를 제거하고, 증폭을 억제하여 NHEJ 활성의 평가를 왜곡시킬 수 있는 작은 결실을 유발하는 것으로 알려져 있으므로 임의의 ZFN 표적 절단 부위로부터 5-10개 뉴클레오티드만큼 떨어져 결합하는 것이 요구될 것이다.
프라이머는 FAD3A 및 FAD3C 유전자 패밀리 (표 5)에 대한 모든 ZFN 표적 유전자좌에 결합하도록 설계하였고, 경험적으로 PCR 증폭 생성물의 생어 기반 서열분석을 통해 모든 유전자 패밀리 구성원의 증폭물을 시험하였다. 몇몇 경우에는, 모든 유전자 패밀리 구성원 (표 6)을 구별하는 프라이머가 개발될 수 없었으나, 모든 경우에서 FAD3A 및 FAD3C의 표적 유전자 서열은 구별될 수 있었다. PCR 프라이머 설계에 따라, 주문 DNA 바코드 서열을, 상이한 ZFN 표적 유전자좌를 구별하고 형질감염 및 ZFN에 특이적인 서열 판독물을 확인하는데 사용되는 PCR 프라이머에 혼입시켰다 (표 5 및 6).
표 5: FAD3 유전자 패밀리 상의 설계된 PCR 프라이머의 증폭 성능. "X"는 유전자 카피 검출 특이성을 나타내고, 회색 음영 및 "+"는 해당하는 특정 유전자좌에서 2개의 프라이머에 의해 설계된 서열 판독물이 구별될 수 없음을 나타내고, "N/A"는 유전자좌가 이들 특정 유전자 카피로부터 증폭될 수 없음을 나타낸다.
Figure 112015032530092-pct00009
표 6: 활성의 FAD3 ZFN 평가를 위해 설계된 프라이머 서열. 프라이머는 서열분석-합성 분석에 대한 일루미나 라이브러리의 구축을 위해 필요한 일루미나 어댑터 서열 둘 다와 함께, 통상의 바코드를 포함한다. 구입한 프라이머는 나타낸 3개의 칼럼 모두의 합계였다.
Figure 112015032530092-pct00010
Figure 112015032530092-pct00011
Figure 112015032530092-pct00012
ZFN으로 형질감염된 카놀라 원형질체의 DNA 추출 후에, 표적 ZFN 유전자좌의 PCR 증폭을 수행하여 합성 기술에 의한 일루미나 기반 서열분석에 올바른 포맷으로 필수 유전자좌 특이적 DNA 분자를 생성하였다. 각 검정을 25 ng 개시 DNA (브라시카 나푸스 게놈의 약 12,500개 세포 등가물) 상에서 작업하는데 최적화시켰다. 적절한 수준에서 NHEJ 효율 및 특이성을 평가하는데 요구되는 커버리지를 제공하기 위해 샘플당 다중 반응을 수행하였다 (개별 원형질체로부터 수득한 브라시카 나푸스 게놈의 200,000개 카피에 대해 약 16회 PCR 반응이 상응함). 동일한 검정으로 시험할 모든 샘플에 대해 PCR 증폭 마스터-믹스를 만들고, 하나의 반응 (삼중으로 수행함)을 표적 조직 상에서 수행되는 사이클의 최적의 수 (PCR 증폭이 시약에 제한받지 않고 여전히 지수적 증폭 단계에 있도록 보장함)를 결정하는데 사용되는 정량적 PCR 방법을 이용하여 검정하였다. 필수 음성 대조 반응을 이용한 실험을 96 웰 포맷으로 MX3000P 써모사이클러® (스트라타진(Stratagene), 캘리포니아주 라졸라)를 이용하여 수행하였다.
정량적 PCR 플랫폼으로부터 모은 결과로부터, 형광의 상대적 증가를 사이클-대-사이클로부터 플롯팅하고, 통상의 전사체 또는 분자의 오버 사이클링 및 증폭을 감소시키기 위한 시도로, 반응이 시약에 제한받게 되는 것을 허용하지 않으면서, 충분한 증폭을 전달할 사이클 수를 검정마다 결정하였다. 미사용 마스터 믹스는 정량적 PCR 분석을 마치고 사이클 수가 결정될 때까지 얼음 상에 두고, 이후에 원하는 개수의 반응 튜브 (ZFN 검정당 약 16개)에 분취하고, PCR 반응을 수행하였다.
증폭 후에, 단일 ZFN 유전자좌에 대한 샘플을 함께 모으고, ZFN당 모은 생성물 200 μL를 민일루트(MinElute) PCR 정제 키트® (퀴아젠)를 제조업체의 지침에 따라 사용하여 세정하였다. 일루미나 짧은 판독 기술을 이용한 샘플의 서열분석을 가능하게 하기 위해 추가의 쌍형성된 말단 프라이머는 생성된 단편 상에 증폭에 의해 부착시킬 필요가 있었다. 이는 증폭의 제1 라운드에서 첨가되는 서열에 부분적으로 상보적이며, 또한 요구되는 쌍형성된 말단 서열을 함유하는 프라이머를 사용하는 PCR 증폭에 의해 달성되었다. 주형에 대한 통상의 단편을 과다 증폭시키지 않고 쌍형성된 말단 서열을 첨가하는, 수행하기에 최적인 PCR 사이클 수를 다시 이전에 기재된 바와 같이 정량적 PCR 사이클 분석을 통한 서열 통과를 이용하여 결정하였다.
PCR 증폭 후에, 생성된 생성물을 민일루트 칼럼® (퀴아젠)을 제조업체의 지침에 따라 사용하여 세정하고, 2.5% 아가로스 겔 상에서 분할시켰다. 사이버® 세이프(Syber® Safe) (라이프 테크놀로지스, 캘리포니아주 칼스배드)를 이용하여 정확한 크기의 밴드로 시각화된 DNA 단편을 겔 추출하여 임의의 잔류 PCR 생성된 프라이머-이량체 또는 다른 허위 단편을 제거하고, DNA를 겔 슬라이스로부터 민일루트 겔 추출 키트® (퀴아젠)를 제조업체의 지침에 따라 이용하여 추출하였다. 겔 추출 완료 후에, 앰퓨어(AMPure) 자기 비드® (베크만-쿨터(Beckman-Coulter), 캘리포니아주 브리)를 1:1.7의 DNA 대 비드 비로 사용하여 추가의 DNA 세정을 수행하였다. 이어서, DNA를 일루미나 서열분석 (KAPA)을 위해 정량적 PCR 기반 라이브러리 정량화 키트를 사용하여 농도에 대해 평가하였으며, 이 때 1/40,000 및 1/80,000 희석을 이용하고 반응은 삼중으로 수행하였다. 정량적 PCR 결과에 기초하여 DNA를 2 nM의 표준 농도로 희석하고, DNA 서열분석을 위해 모든 라이브러리를 합하였다. 씨보트 클러스터(cBot cluster) 생성 키트® (일루미나, 캘리포니아주 샌디에고)를 사용하는 서열분석을 위한 샘플을 제조하고, 100 bp 쌍형성된-말단 서열분석 판독물로 제조업체 지침에 따라 일루미나 GA2x® 상에서 서열분석하였다.
표적 아연 핑거 부위에서의 비-상동 말단 접합부의 검출을 위한 데이터 분석 방법
서열분석 반응의 완료 및 염기 호출을 위해 일루미나 생물정보 파이프라인을 이용하여 수행된 일차 데이터 호출 후에, 각각의 경우에 표적 ZFN 부위에서 결실된 염기를 확인하기 위해 완전한 분석을 수행하였다. 입력 서열의 목록에 따라 컴퓨터 계산에 의해 DNA 서열로부터 바코드를 추출 및 분류하기 위해 주문 PERL 스크립트를 설계하였다. 바코드는 오귀인 서열 판독물을 감소시키기 위해 허용되는 30 초과의 Phred 스코어로 참조 서열과 매치되어야 한다. 서열 판독물이 사용된 상이한 바코드 군에 비닝된 후에, 품질 필터를 모든 서열을 가로질러 통과시켰다. 품질 필터는 제2의 주문 개발된 PERL 스크립트였다. "N"으로 호출된 염기가 3개 초과하여 존재하거나 또는 중간 Phred 스코어가 20 미만이거나 또는 20 미만의 Phred 스코어를 갖는 3개 연속적 염기가 존재하거나 또는 서열 판독물의 길이가 40 bp 미만인 경우에 서열 판독물을 제외시켰다. 쌍형성된 서열 판독물이 둘 다 넥스트진(NextGENe)® (소프트제네틱스(SoftGenetics), 펜실베니아주 스테이트 컬리지) 패키지를 이용하여 사용가능한 경우에 나머지 서열을 합하였다. 이어서, 나머지 합쳐진 서열 판독물을 나머지 서열 식별자의 말단 상에 기록되는 확인된 여분의 서열의 수의 카운트와 제3의 주문 PERL 스크립트를 이용하여 특유한 서열 판독물의 집합으로 축소시켰다. 이어서, 특유한 서열 판독물을 갭이 있는 FASTA 정렬된 파일을 생성하는 넥스트진® 소프트웨어를 이용하여 FAD3 참조 서열에 정렬시켰다.
갭이 있는 FASTA 파일을 이용하여 갭이 있는 염기 위치 번호의 입력 참조물로의 전환를 제4의 주문 PERL 스크립트로 수행하였다. 이는 상이한 유전자 패밀리 구성원을 식별하는 염기 (상이한 유전자 패밀리 구성원 사이의 동조 또는 파라로그 서열 변이)가 어셈블리된 데이터에서 확인될 수 있도록 한다. 염기 넘버링의 전환이 수행되면, 각각의 특유한 서열 판독물에 대한 반수체형 보고의 생성 및 특정 유전자 패밀리 구성원에 대한 판독물의 할당이 가능하였다. 판독물이 유전자에 의해 분류되면, ZFN 표적 부위를 둘러싼 10 bp 윈도우가 확인 및 평가되었다. 유전자당 결실이 있는 서열의 수를 결실된 염기의 수와 함께 기록하였다.
이어서, 데이터를 10,000개 서열 판독물당 표적 ZFN 부위에서 결실된 1 내지 10개 염기를 갖는 서열의 수와 함께 다중선 그래프로서 그래프로 나타내었다. 이러한 분석을 모든 ZFN 형질감염과 대조 형질감염에 대해 수행하였다. 몇몇 경우에, 천연 DNA 서열에서의 반복부는 표적 ZFN 부위에서의 서열분석 오류를 증가시키며, 이러한 오류는 통상적으로 둘 다 ZFN 또는 대조군으로 형질감염된 모든 샘플에서 보고된 단일 염기 결실의 출현율의 증가로 나타날 수 있다.
이러한 결과로부터 FAD3A 및 FAD3C 표적 부위에서 최고 수준의 ZFN 활성을 NHEJ의 보다 큰 활성에 의해 결정된 바와 같이 관찰하였다. 유의한 게놈 DNA 절단 활성 및 최소 비-표적 활성의 특성이 주어지는 조작된 트랜스진 통합 플랫폼 (Engineered Transgene Integration Platform; ETIP)의 식물체내 표적화를 위해 플라스미드 pDAB107828 상에서 코딩된 ZFN (즉, ZFN28053 및 28054) 및 pDAB107829 상에서 코딩된 ZFN (즉, ZFN28055 및 28056)을 선택하였다.
실시예 4: 조작된 트랜스진 통합 플랫폼 ( ETIP ) 카놀라 식물 세포주를 위한 DNA 구축물
하기 기재된 플라스미드 벡터 구축물을 관련 기술분야의 통상의 기술자에게 통상적으로 공지된 방법 및 기술을 이용하여 구축하였다. 본 단락 내에 기재된 특정 시약 및 기술의 적용은 용이하게 관련 기술분야의 통상의 기술자에게 공지되어 있으며, 플라스미드 벡터 구축물을 구축하고자 하는 목적을 달성하기 위해 다른 시약 및 기술과 용이하게 교환될 수 있다. 제한 엔도뉴클레아제는 뉴 잉글랜드 바이오랩스 (NEB; 매사추세츠주 입스위치)로부터 입수하였다. 라이게이션을 T4 DNA 리가제 (인비트로젠, 캘리포니아주 칼스배드)로 완수하였다. 하나의 진입 벡터를 단일 목적지 벡터에 어셈블리하기 위해 게이트웨이(GATEWAY)® LR 클로나제(CLONASE)® 효소 믹스 (인비트로젠)를 사용하여 게이트웨이 반응을 수행하였다. 하나의 진입 벡터를 단일 목적지 벡터에 어셈블리하기 위해 인-퓨전™ 어드밴티지 테크놀로지 (클론테크, 캘리포니아주 마운틴 뷰)를 이용하여 인-퓨전™ 반응을 수행하였다. 뉴클레오스핀® 플라스미드 키트 (마슈레-나겔 인크., 펜실베니아주 베들레헴) 또는 플라스미드 미디 키트® (퀴아젠)를 공급업체의 지침에 따라 사용하여 플라스미드 제조를 수행하였다. 아가로스 트리스-아세테이트 겔 전기영동 후에 퀴아퀵 겔 추출 키트™ (퀴아젠)를 사용하여 DNA 단편을 단리하였다. 모든 어셈블리된 플라스미드의 콜로니를 처음에 미니프렙 DNA의 제한 소화에 의해 스크리닝하였다. 선택된 클론의 플라스미드 DNA를 상업적 서열분석 공급원 (유로핀스 MWG 오페론, 알라배마주 헌츠빌)에서 서열분석하였다. 시퀀셔™ 소프트웨어 (진 코드스 코포레이션, 미시간주 앤 아버)를 이용하여 서열 데이터를 어셈블리하고 분석하였다.
대조 벡터
대조 벡터를 사용하여 형광 활성화 세포 분류 (FACS) 세포 기반 분류 방법을 개발하였다. 2개의 유전자 발현 카세트를 포함하는 대조 벡터, pDAS000031 (도 10: 서열 85로서의 T-가닥 삽입물)을 구축하는데 표준 클로닝 방법을 이용하였다. 제1 유전자 발현 카세트는 콜리플라워 모자이크 바이러스 19s 프로모터 (CaMV 19S 프로모터; Shillito, et al., (1985) Bio/Technology 3; 1099-1103) :: 히그로마이신 내성 유전자 (hph(HygR);미국 특허 번호 4,727,028) :: 아그로박테리움 투메파시엔스 오픈 리딩 프레임 1 3' 비번역 영역 (AtORF1 종결인자; Huang et al., (1990) J. Bacteriol. 1990 172:1814-1822)을 함유하였다. 제2 유전자 발현 카세트는 아라비돕시스 탈리아나 유비퀴틴 10 프로모터 (AtUbi10 프로모터; Callis, et al., (1990) J. Biol. Chem., 265: 12486-12493) :: dsRED (dsRED(D); 미국 특허 번호 6,852,849) 및 아라비돕시스로부터의 인트론 (인트론 #1; 진뱅크: AB025639.1) :: 아그로박테리움 투메파시엔스 오픈 리딩 프레임 23 3' 비번역 영역 (AtORF23 종결인자; 미국 특허 번호 5,428,147)을 트랜스 배향 (예를 들어, 헤드 대 헤드 배향)을 갖는 인-프레임 융합체로서 함유하였다. 플라스미드 벡터를 인-퓨전™ 어드밴티지 테크놀로지 (클론테크, 캘리포니아주 마운틴 뷰)를 이용하여 어셈블리하였다.
실시예 5: ETIP 카놀라 식물 세포주의 생성
브라시카 나푸스의 형질전환
FAD3A 및 FAD3C 부위 특이적 구축물 (pDAS000271-pDAS000275)에 대한 ETIP 구축물 및 수반되는 ZFN (pDAB107828 및 107829) 및 대조군 DS-Red 대조 구축물 (pDAS000031)은 이전에 실시예 4에 기재되어 있다. 이들 이원 벡터를 아그로박테리움 투메파시엔스 균주 GV3101: PM90으로 형질전환시켰다. 브라시카 나푸스 원형질체 세포의 형질전환은 일부 변형된 실시예 3에 기재된 형질감염 프로토콜을 이용하여 완수하였다.
프로토콜에 대한 변형은 씨 플라크™ 아가로스를 대신한 알긴산나트륨의 사용을 포함하였다. ZFN 구축물 및 ETIP 구축물이 둘 다 브라시카 나푸스 원형질체 세포로 공동-전달되는 형질감염 실험은 5:1 몰비의 플라스미드 DNA를 포함하는 DNA 농도에서 완수하였다. 다른 ETIP 및 대조 플라스미드 구축물을 30 μg의 플라스미드 DNA 농도에서 형질감염시켰다.
프로토콜에 대한 부가의 변형은 1.5 mg/mL의 히그로마이신을 함유하는 배지 중에서 형질전환된 원형질체 세포로부터 온전한 식물을 증폭시키는 것을 포함하였다. 온전한 식물의 증폭은 A 배지를 2주마다 교체하고 원형질체-유래된 콜로니의 성장을 모니터링하는 것을 필요로 한다. 원형질체-유래된 콜로니가 대략 2-3 mm의 직경으로 성장한 후에, 이러한 콜로니를 고형화된 MS 모르포 배지를 함유하는 12-웰 코스타(Costar)® 플레이트 (피셔 사이언티픽(Fisher Scientific), 미주리주 세인트 루이스)의 개별 웰로 옮겼다. 캘러스가 8-10 mm 직경의 크기로 증식할 때까지 플레이트를 1 내지 2주 동안 24℃에서 지속적인 희미한 광 상태에서 인큐베이션하였다. 원형질체 세포가 1-2 cm 직경의 크기에 도달한 후에, 이러한 원형질체 세포를 MS 모르포 배지를 함유하는 개별 250 mL 배양 용기로 옮겼다. 용기를 16시간 광 (20 μMol m-2 s-1의 오스람 L36 W/21 루미룩스 백색 튜브) 및 8시간 어둠 조건 하에 24℃에서 인큐베이션하였다. 1 내지 2주 내에, 여러 개의 신초를 볼 수 있었다. 신초가 3-4 cm 의 길이에 도달한 후에, 이를 MS 배지를 함유하는 250 mL 배양 용기로 옮겼다. 250 mL 배양 용기를 16시간 광 (20 μMol m-2 s-1의 오스람 L36 W/21 루미룩스 백색 튜브) 및 8시간 어둠 조건 하에 24℃에서 인큐베이션하였다. 신초는 묘목으로 클 때까지 배양 용기에서 유지하고, 묘목이 되었을 때 온실로 옮겨 성장시킴으로써 성숙시켰다.
실시예 6: 카놀라에서 ETIP를 함유하는 T-DNA의 통합의 분자 확인
게놈 DNA를 모든 추정 트랜스제닉 식물의 잎 조직으로부터 DNeasy 96 식물 DNA 추출 키트™ 또는 DNeasy 식물 미니 키트™ (퀴아젠)를 사용하여 추출하였다. 각 식물로부터의 게놈 DNA는 에이. 투메파시엔스의 영속성에 대해 시험하기 위해 virC를 증폭시키도록 설계된 프라이머; pTiC58 정방향 (서열 88 CGAGAACTTGGCAATTCC) 및 pTiC58 역방향 (서열 89 TGGCGATTCTGAGATTCC), 게놈 DNA의 품질을 확인하기 위해 비. 나푸스로부터 액틴을 증폭시키도록 설계된 프라이머; 액틴 정방향 (서열 90 GACTCATCGTACTCTCCCTTCG) 및 액틴 역방향 (서열 91 GACTCATCGTACTCTCCCTTCG)을 사용하여 PCR에 의해 분석하였다. 프라이머는 ETIP에 의해 코딩되는 hph 유전자를 증폭시키도록 설계하였다; HPH 정방향 (서열 92 TGTTGGTGGAAGAGGATACG) 및 HPH 역방향 (서열 93 ATCAGCAGCAGCGATAGC). 액틴 및 hph에 대한 프라이머로 증폭될 때 virC 프라이머로부터의 생성물은 제공하지 않았으나 그로부터 정확한 크기의 앰플리콘을 생성하는 식물을 트랜스제닉으로 확인하였다.
제2 스크린을 완수하였으며, 여기서 각각의 트랜스제닉 식물로부터의 gDNA를 T-DNA 영역 외의 이원 벡터를 증폭시키도록 설계된 5개 세트의 프라이머 [(1F 서열 94 ATGTCCACTGGGTTCGTGCC; 1R 서열 95 GAAGGGAACTTATCCGGTCC) (2F 서열 96 TGCGCTGCCATTCTCCAAAT; 2R 서열 97 ACCGAGCTCGAATTCAATTC) (3F 서열 98 CCTGCATTCGGTTAAACACC; 3R 서열 99 CCATCTGGCTTCTGCCTTGC) (4F 서열 100 ATTCCGATCCCCAGGGCAGT; 4R 서열 101 GCCAACGTTGCAGCCTTGCT) (5F 서열 102 GCCCTGGGATGTTGTTAAGT; 5R 서열 103 GTAACTTAGGACTTGTGCGA)]를 사용하여 PCR에 의해 분석하였다. 정확하고 예상되는 크기의 PCR 생성물이 프라이머 세트 3 및 4로 증폭된 식물을 백본 통합을 갖는 것으로 간주하였다.
백본 통합을 갖지 않는 식물로부터의 DNA를 20 g의 잎 조직으로부터 변형된 CTAB 방법 (Maguire et al., (1994) Plant Molecular Biology Reporter, 12( 2): 106-109)을 이용하여 정제하였다. 단리된 gDNA를 여러 제한 효소로 소화시키고, 10 μg의 gDNA를 아가로스 겔 상에서 전기영동에 의해 분리하고, 표준 서던 블롯팅 프로토콜을 이용하여 막으로 옮겼다. DIG 이지 Hyb 시스템(DIG Easy Hyb System)™ (로슈, 캘리포니아주 사우스 샌프란시스코)을 제조업체의 지침에 따라 이용하여 막을 프로빙하였다. ELP에 대한 각각의 발현 카세트 및 내인성 대조 유전자, 액틴에 대한 프로브를 ETIP 구축물로부터 하기 프라이머: (IPT-F 서열 104 TCTCTACCTTGATGATCGG; IPT-R 서열 105 AACATCTGCTTAACTCTGGC; dsRED-F 서열 106 ATGGCTTCATCTGAGAACG; dsRED-R 서열 107 TTCCGTATTGGAATTGAGG; PAT-F 서열 108 TTGCTTAAGTCTATGGAGGCG; PAT-R 서열 109 TGGGTAACTGGCCTAACTGG; ELP-F 서열 110 ATGATATGTAGACATAGTGGG; ELP-R 서열 111 AGGGTGTAAGGTACTAGCC; Hph-F 서열 112 TGTTGGTGGAAGAGGATACG; Hph-R 서열 113 ATCAGCAGCAGCGATAGC; 액틴-F 서열 114 GTGGAGAAGAACTACGAGCTACCC; 액틴-R 서열 115 GACTCATCGTACTCTCCCTTCG)를 사용하여 증폭시켰다.
ETIP 서열을 오직 ETIP의 단일 카피를 함유하는 모든 식물로부터 증폭시키고 서열분석하였다. 각각의 T-DNA 삽입물의 서열을 ABI3730xI™ (어플라이드 바이오시스템즈, 라이프 테크놀로지스)를 이용하는 PCR 생성물의 직접적 서열분석에 의해 분석하였다. T-DNA 삽입물을 게놈 DNA로부터, 퓨전 핫 스타트 II 폴리머라제(Phusion Hot Start II Polymerase)™ (핀자임스(Finnzymes), 써모 피셔 사이언티픽)를 사용하여 증폭시켰다. T-DNA의 증폭 반응은 대략 2 Kbp 길이의 중첩 서열을 증폭시키기 위한 다중 프라이머 쌍으로 완수하였다. 각각의 PCR 생성물을 완전한 커버리지를 보장하기 위해 다중 프라이머로 서열분석하였다. PCR 반응물을 새우 알칼리성 포스파타제 및 엑소뉴클레아제 I (어플라이드 바이오시스템즈, 라이프 테크놀로지스)로 처리하여 PCR 반응물의 서열분석 이전에 잉여 프라이머를 불활성화시켰다. 각각의 단일 카피 ETIP 세포주의 T-DNA 삽입물에 플랭킹된 서열은, 정제된 게놈 DNA를 8개의 제한 엔도뉴클레아제로 별도로 소화시킨 후에 이러한 제한 엔도뉴클레아제에 의해 생성된 오버행에 특이적인 이중-가닥 어댑터를 라이게이션하여 확인하였다. 이러한 라이게이션 단계 후에, PCR을 ETIP의 3' 또는 5' 말단에 대한 비오티닐화 프라이머 및 각각의 어댑터에 대한 프라이머로 수행하였다. PCR 생성물을 포획하고, 앰퓨어 고상 가역적 고정화 (SPRI) 비즈(Ampure Solid Phase Reversible Immobilization (SPRI) beads)™ (아젠커트 바이오사이언스 코포레이션(Agencourt Bioscience Corporation), 베크만 쿨터 컴퍼니) 상에서 세정하였다. 네스티드(nested) PCR을 수행하고, 모든 생성물은 ABI 생어 서열분석 및 빅 다이 터미네이터 v3.1 사이클™ 서열분석 프로토콜 (어플라이드 바이오시스템즈, 라이프 테크놀로지스)을 이용하여 서열분석하였다. 서열 데이터는 시퀀셔™ 소프트웨어 (진 코드스 코포레이션, 미시간주 앤 아버)를 이용하여 어셈블리하고 분석하였다.
아연 핑거 뉴클레아제 및 pDAS000271-PDAS000275 ETIP 구축물로 형질전환된 ETIP 트랜스제닉 카놀라의 결과
ETIP 및 ZFN 구축물의 형질전환을 통해 생성된 트랜스제닉 브라시카 나푸스 사례는 FAD3A 유전자좌 내의 pDAS000273 또는 pDAS275로부터, 및 pDAS000271, pDAS000272 또는 pDAS000274로부터 FAD3C 유전자좌로의 ETIP 폴리뉴클레오티드 서열의 단일 카피, 전장 T-가닥 삽입물의 통합을 발생시킨다. 3 내지 4개의 사례가 완전하게 특성화되었으며, 통합된 ETIP를 함유하는 것으로 확인되었다. 인-아웃 PCR 증폭 방법을 이용하여 확인을 완료하고, 서던 블롯을 통해 추가로 검증하였다. 선택된 T0 사례를 발육의 T1 단계로 성장시켰다. 통합된 T-가닥의 접합성을 결정하기 위해 T1 식물을 다시 스크리닝하였다. 스크리닝된 사례를 동형접합, 반접합, 또는 널로 분류하였다.
이전에 기재된 방법을 통해 원형질체를 생성하는데 동형접합 사례를 이용하였다. 이후에, 원형질체를 ETIP 서열 내에 혼입된 아연 핑거 결합 부위를 표적화하도록 설계된 ZFN 및 ETIP의 특정 영역과 상동성을 공유하는 공여자 플라스미드로 공동-형질전환시켰다. ZFN은 ETIP 유전자좌를 절단하고, 공여자 플라스미드는 상동성 지시된 복구를 통해 브라시카 나푸스 세포의 게놈 내에 통합된다. 공여자 플라스미드의 통합의 결과로서, 부분 DS-red 트랜스진을 전장 DS-red 트랜스진으로 복구하였다. 새로운 완전 작동 DS-red 트랜스진의 발현을 이용하여 원형질체 세포를 FACS 방법으로 분류하였다. 추정 트랜스제닉 식물을 실시예 7에 기재된 FACS 방법을 이용하여 분류하고, 단리된 원형질체를 성숙한 식물로 재생시켰다. 공여자 플라스미드의 통합은 분자 확인 방법을 이용하여 ETIP-표적화된 식물 내에서 확인되었다. 이에 따라, ETIP 유전자좌는 공여자 폴리뉴클레오티드 서열의 유전자 표적화된 통합을 위한 부위-특이적 유전자좌로서 역할을 한다.
실시예 7: 원형질체 세포의 FACS 기반 분류
DS-Red 대조 구축물, pDAS000031로 형질감염된 브라시카 나푸스 원형질체를, BD 바이오사이언시스(BD Biosciences) 인플럭스-셀 분류기(Influx-Cell sorter)™ (캘리포니아주 산호세)를 이용하는 FACS-매개된 세포 분류를 통해 분류하였다. 원형질체 세포를 실시예 3에 기재된 바와 같이 단리하고 형질감염시켰다. 세포를 pDAS000031로 형질감염시킨 후에, 세포를 표 7에 기재된 조건에서 FACS 분류기를 이용하여 분류하였다.
표 7: pDAS000031로 형질감염된 원형질체 세포의 분류에 사용된 조건
Figure 112015032530092-pct00013
DS-red 트랜스진을 발현하는 원형질체를 분류하고 단리하였다. FACS 단리된 원형질체를 분류기를 이용하여 카운팅하였다. 약 1x105 내지 1.8x105개의 세포를 FACS 단리 후 제1일에 24-웰 마이크로 타이터 플레이트의 웰에 넣었다. 세포를 5 내지 20일 동안 비드 배양물로 옮겼다. 약 1x104개의 세포를 FACS 단리 후 제2일에 2 또는 4-웰 마이크로 타이터 플레이트의 웰에 넣는 유사한 조건에서 시험하였다. 시험된 다양한 조건은 총 단리된 원형질체 세포 중 95 - 98%의 생존률로 세포를 회수하였다. FACS 분류된 원형질체 세포를 3 - 20일 동안 비드 배양물로 옮겼다. FACS 분류된 원형질체 세포를 상기 기재된 프로토콜을 이용하여 1.5 mg/mL의 히그로마이신을 함유하는 배지 상에서 식물로 재생시켰다. 추정 트랜스제닉 식물은 분자 입체형태 프로토콜을 통해 pDAS000031로부터의 무손상 T-가닥 삽입물을 함유하는 것으로 확인되었다.
FACS 분류 방법은 임의의 형광 트랜스진 서열의 스크리닝에 직접 적용가능하며, 소정 비율의 게놈 유전자좌 내의 ETIP 영역의 특정 부위 내에서의 상동성 매개된 복구를 통해 형광 트랜스진으로 표적화되는 브라시카 나푸스 원형질체 세포를 단리하는데 이용된다.
실시예 8: NHEJ를 통한 브라시카 나푸스 오메가-3 지방산 데새투라제 ( FAD3 ) 내로의 표적화 통합 및 그의 분열
FAD3C 및 FAD3A에 특이적인 아연 핑거 결합 도메인의 선택
동조 Fad3 유전자의 전사되는 영역을 확인하고, 특성화하고, 본원에 기재된 공여자 서열의 NHEJ-매개 표적화를 위해 이들 부위에 결합하고 절단하도록 설계된 아연 핑거 뉴클레아제를 확인하고 특성화하였다. Fad3 서열의 동조체로부터의 DNA 서열에 대해 지정된 아연 핑거 단백질 (ZFP)을 상기에 기재된 바와 같이 설계하고 시험하였다. 정확한 활성을 나타내는 ZFN으로부터, Fad3 표적을 높은 효율로 절단하는 2개의 아연 핑거 단백질을 선택하였고: ZFP 28051-2A-28052는 서열 255 5'-gcccaaggaacCCTTTTCTGGGCCATcttcgTACTCGGCCACGactggtaatttaat -3'을 인식하고, Fad3C 게놈 유전자좌에 특이적으로 결합하고 이를 절단하는 것으로 나타났다. 마찬가지로, 아연 핑거 단백질 28053-2A-28054는 서열 256 5'-agcgagagaaAGCTTAtTGCAACTTCaactacTTGCTGGTCGATCGTGTTggccactc -3'를 인식하고, Fad3A 및 Fad3C 게놈 유전자좌에 특이적으로 결합하고 이를 절단하는 것으로 나타났다. 예시적인 표적 부위는 표 8에 나타내었고; ZFP 인식 나선에 의해 접촉시킨 표적 부위에서의 뉴클레오티드는 대문자로 나타내고; 비-접촉 뉴클레오티드는 소문자로 나타내었다. Fad3C와 상이한 Fad3의 카피에서의 뉴클레오티드는 밑줄로 나타내었다. ZFP 인식 나선에 의해 접촉시킨 표적 부위에서의 뉴클레오티드는 표 8에 나타내었다.
표 8: Fad3C (28051-2A-28052) 또는 Fad3A 및 Fad3C (28053-2A-28054)에 특이적인 아연 핑거 단백질 결합 부위
Figure 112015032530092-pct00014
FAD3C 및 FAD3A에 특이적인 아연 핑거 뉴클레아제를 코딩하는 발현 벡터의 설계 및 구축
Fad3 아연 핑거 설계를 CCHC 구조의 적어도 하나의 핑거를 갖는 단백질을 코딩하는 아연 핑거 발현 벡터 내로 도입하였다 (미국 특허 공개공보 번호 2008/0182332). 특히, 각각의 단백질 내의 마지막 핑거는 인식 나선에 대한 CCHC 백본을 가졌다. 비-정규 아연 핑거-코딩 서열을 4개의 아미노산 ZC 링커를 통해 유형 IIS 제한 효소 FokI의 뉴클레아제 도메인 (문헌 [Wah et al., (1998) Proc. Natl. Acad. Sci. USA 95:10564-10569]의 서열의 아미노산 384-579) 및 sop2 핵 국재화 신호에 융합하였다. 토세아 아시그나 바이러스 (Szymczak et al., 2004)로부터의 뉴클레오티드 서열을 코딩하는 자가가수분해성 2A를 2개의 ZFN 융합 단백질 사이에 부가하였다. ZFN의 발현은 카사바 베인 모자이크 바이러스로부터 강력한 구성적 프로모터 및 5' 비번역 영역 (UTR) (Verdaguer et al., Plant Molecular Biology 1996, 31(6); 1129-1139)에 의해 유도되고, 아그로박테리움 투메파시엔스 pTi15955의 오픈 리딩 프레임 23 (ORF23)으로부터의 3' UTR (전사 종결인자 및 폴리아데닐화 부위 포함) (Barker et al., Plant Molecular Biology 1983, 2(6); 335-50)에 의해 플랭킹되었다.
벡터를 인-퓨전™ 어드밴티지 테크놀로지 (클론테크, 미국 캘리포니아주 마운틴 뷰)을 이용하여 어셈블리하였다. 제한 엔도뉴클레아제는 뉴 잉글랜드 바이오랩스 (NEB; 미국 매사추세츠주 입스위치)로부터 얻었고, T4 DNA 리가제 (인비트로젠)를 DNA 라이게이션을 위해 사용하였다. 플라스미드 제조는 공급업체의 지시에 따라 뉴클레오스핀(NUCLEOSPIN)® 플라스미드 키트 (마슈레-나겔 인크.(Macherey-Nagel Inc., 펜실베니아주 베들레헴)) 또는 플라스미드 미디 (Midi) 키트 (퀴아젠)를 사용하여 수행하였다. 아가로스 트리스-아세테이트 겔 전기영동 후, 퀴아퀵™ 겔 익스트렉션 키트(QIAquick™ Gel Extraction Kit) (퀴아젠)을 사용하여 DNA 단편을 단리시켰다. 어셈블리된 플라스미드의 콜로니를 초기에 미니프렙 DNA의 제한 소화에 의해 스크리닝하였다. 선택된 클론의 플라스미드 DNA는 상업적인 서열분석 회사 (유로핀스 엠더블유지 오페론, 앨라배마주 헌츠빌)에 의해 서열분석되었다. 서열 데이터를 모으고, 시퀀셔™ 소프트웨어 (진 코즈, 미시건주 앤 아버)를 사용하여 분석하였다. 생성되는 플라스미드 구축물인 pDAB107827 (ZFN 28051-2A-28052, 도 13, 서열 273) 및 pDAB107828 (ZFN 28053-2A-28054, 도 14, 서열 274)을 제한 효소 소화를 통해 및 DNA 서열분석을 통해 확인하였다.
NHEJ-지정 DNA 복구를 위한 "공여자" 벡터의 설계 및 구축
DNA를 Fad3 내로 통합하는 2개의 전략을 착수하였다; 발현 카세트가 단일 ZFN-유도 이중가닥 파단 내로 통합되는 유전자 스플라이싱 및 유전자의 일부가 2개의 ZFN-유도 이중 가닥 파단에 의해 제거되고 발현 카세트가 갭을 복구하기 위해 삽입되는 유전자-편집.
각각의 통합 방법, 즉 유전자 스플라이싱 또는 유전자-편집을 위해, 2개의 벡터를 구축하였다. 제1 벡터는 turboGFP (tGFP) 유전자 발현 카세트를 코딩하고, 제2 벡터는 항생제 히그로마이신에 대한 저항성을 부여하는 유전자 발현 카세트를 코딩하였다. tGFP 발현 카세트는 아라비돕시스 탈리아나(Arabidopsis thaliana) 폴리유비퀴틴 10 (UBQ10) 유전자로부터의 프로모터, 5' 비번역 영역 및 인트론 (Norris et al, Plant Molecular Biology 1993, 21(5), 895-906), 이어서 tGFP 코딩 서열 (Evrogen, Moscow, Russia)을 포함하였다. tGFP 코딩 서열은 쌍자엽 식물에서의 발현을 위해 코돈-최적화되었고, 에이. 투메파시엔스 pTi15955의 오픈 리딩 프레임 23 (ORF23)의 전사 종결인자 및 폴리아데닐화 부위를 포함하는 3' 비번역 영역 (UTR) (Barker et al, Plant Molecular Biology 1983, 2(6), 335-50)에 의해 플랭킹되었다. 히그로마이신 내성 유전자 발현 카세트는 콜리플라워 모자이크 바이러스 (CaMV)로부터의 5' UTR을 포함하는 19S 프로모터 (Cook and Penon Plant Molecular Biology 1990 14(3), 391-405), 이어서 히그로마이신 포스포트랜스퍼라제 (hph) 유전자 (Kaster et al Nucleic Acids Research 1983 11 (19), 6895-6911)를 포함하였다. hph 유전자는 쌍자엽 식물에서의 발현을 위해 코돈-최적화되었고, 에이. 투메파시엔스 pTi15955의 오픈 리딩 프레임 1 (ORF1)의 전사 종결인자 및 폴리아데닐화 부위를 포함하는 3' UTR (Barker et al, Plant Molecular Biology 1983, 2(6), 335-50)에 의해 플랭킹되었다. 두 카세트는 상업적인 유전자 합성 회사 (진아트(GeneArt), 라이프 테크놀로지스, 독일 레겐스베르크)에 의해 합성되었다.
유전자 스플라이싱 실험을 위한 벡터는 벡터 pDAB10782에서 코딩되는 ZFN에 의해 표적화되는 ZFN 인식 서열의 2개의 텐덤 카피를 클로닝함으로써 구축하였다. 유전자 편집 실험을 위한 벡터는 벡터 pDAB107827 및 pDAB107828에서 코딩되는 ZFN에 의해 표적화되는 각각의 ZFN 인식 서열의 하나의 카피를 클로닝함으로써 구축하였다. 둘 다의 경우에서, 2개의 ZFN 인식 서열은 BamHI 및 NotI 제한 엔도뉴클레아제에 대한 인식 서열에 의해 분리되었다. tGFP 및 HPH 카세트는 각각 벡터의 BamHI와 NotI 부위로 클로닝되어 4개의 "공여자" 벡터: pDAS000340 (히그로마이신-내성 유전자-접합 공여자: 서열 275, 도 15), pDAS000341 (tGFP 리포터 유전자 스플라이싱 공여자: 서열 276, 도 16), pDAS00342 (히그로마이신-내성 유전자-편집 공여자: 서열 277, 도 17) 및 pDAS000343 (tGFP 리포터 유전자 편집 공여자: 서열 278, 도 18)을 생성하였다.
어셈블리된 플라스미드의 콜로니를 이. 콜라이의 밤새 배양액으로부터 정제된 DNA의 제한 엔도뉴클레아제 소화에 의해 초기에 스크리닝하였다. 제한 엔도뉴클레아제는 뉴 잉글랜드 바이오랩스 (NEB, 미국 매사추세츠주 입스위치) 및 프로메가 (프로메가 코포레이션, 위스콘신주)로부터 얻었다. 플라스미드 제조는 공급업체의 지시에 따라 퀴아프렙 스핀 미니프렙 키트(QIAprep Spin Miniprep Kit)™ (퀴아젠, 독일 힐덴) 또는 퓨어 일드 플라스미드 맥시프렙 시스템™ (프로메가 코포레이션, 미국 위스콘신주)을 사용하여 수행하였다. 생성되는 단편의 아가로스 겔 전기영동에 의해 제한 단편이 확인된 후, 선택된 클론의 플라스미드 DNA를 ABI 생어 서열분석 및 빅 다이 터미네이터 V3.1™ 사이클 서열분석 프로토콜 (어플라이드 바이오시스템즈, 라이프 테크놀로지스)을 사용하여 서열분석하였다. 서열 데이터를 모으고, 시퀀셔™ 소프트웨어 (진 코즈, 미국 미시건주 앤 아버)를 사용하여 분석하였다.
원형질체 단리를 위한 식물 물질의 유지
엽육세포 유래 원형질체를 브라시카 나푸스 (DH10275)의 3주령 멸균 신초 (shoot) 배양액으로부터 단리하였다. 대응하는 종자를 본원에 기재된 방법에 따라 발아시켰다. 종자를 70% 에탄올을 사용하여 1분 동안 표면-멸균하고, 부드럽게 진탕한 후, 멸균 이중-증류수로 3-4회 세정하였다. 종자를 20% 표백제 및 10μl의 트윈 20을 사용하여 후속적으로 멸균시켰다. 종자를 약 100 RPM에서 15분 동안 테이블용 진탕기에서 표백제로 추가로 처리한 후, 멸균 이중-증류수로 3-4회 세정하고, 과량의 습기를 제거하기 위해 종자를 멸균 여과지에 조심스럽게 옮기고, 종자 발아 배지 (1/2 강도 MS/B5 비타민 + 1% 수크로스 + 0.8% 한천; pH 5.8)에서 배양하였다.
대략 50-60 mL의 배지를 각각의 페트리™ 디쉬 (15 X 100 mm) 내에 붓고, 지지대를 사용하여 플레이트를 약간 경사지게 두었다. 약 50개의 종자를 각 플레이트 상에 두었다. 플레이트를 22℃에서 16h/d의 광 (20μmol m-2 s-1) 하에 6일 동안 수직으로 인큐베이팅하였다. 0.5cm 크기의 배축 절편을 6일령 묘목으로부터 절제하고, 신초 유도 배지 (MS/B5 비타민 + 3% 수크로스 + 500 mg/L MES + BAP (13μm) + 제아틴 (5μm) + 질산은 (5 mg/L) + 0.8% 한천 (pH 5.8)에서 배양하였다. 배지를 100 x 20 mm 멸균 페트리™ 디쉬 내에 붓고; 약 20개의 체외이식편을 플레이트마다 배지 중에 두었다. 3-4주 후에 나타난 신초 분열조직을 신초 연장 배지 (250 mL 배양 용기에 부은 MS/B5 비타민 + 2% 수크로스 + 500 mg/L MES + BAP (2μm) + GA-3 (0.1μm) + 0.8% 한천 (pH 5.8))에 옮기고, 배양액을 상기 배지에서 4주 동안 유지하고, 그 사이에 1 라운드의 계대배양을 수행하였다. 이어서, 2-3cm 높이의 신초를 뿌리 발생을 위해 발근 개시 배지 (700 mL 배양 용기에 부은 1/2 강도의 MS/B5 비타민 + 1% 수크로스 + 500 mg/L MES + IBA (2.5μm) + 0.6% 한천 (pH 5.8))에 옮겼다. 발근 신초를 사용 전에 2-3 라운드 동안 경삽 (stem cutting)으로서 3-4주 간격으로 신선한 발근 개시 배지에서 계대배양하였다. 배양액을 22℃에서 16h/d의 광 (30μmol m-2 s-1) 하에 유지하였다.
엽육세포 원형질체의 단리 및 정제
시험관내에서 성장한 DH12075 브라시카 나푸스 식물을 엽육세포 원형질체를 단리하기 위한 체외이식편 공급원으로서 사용하였다. 원형질체를 단리하기 위해, 3 - 4주령의 묘목으로부터 3 내지 4번째의 완전히 전개된 잎을 원형질체 단리를 위해 날카로운 메스로 작은 스트립 (0.5 내지 1mm)로 절단하였다. 효소에 의한 소화는 25 mL의 소화 완충제 (K4 배지 (Spangenberg et al., 1998)에 용해된 1.2% (w/v) 셀룰라제 "오노주카(ONOZUKA)™" R10 및 0.2% (w/v) 마세로자임® R10으로 250-500 mg의 잎 물질을 처리함으로써 수행하였다. 잎 물질 및 소화 완충제를 함유하는 페트리™ 디쉬를 파라필름™으로 밀봉하고, 암소에서 12 내지 15시간 동안 실온에서 인큐베이션하였다. 밤새 인큐베이션 후에, 소화액을 BD® 세포 스트레이너(strainer) (메쉬 크기 70μm)를 통해 여과하였다. 14 mL 환저 튜브 내에 수집한 원형질체 현탁액 (5-6 mL)을 1 mL의 W5 세척 완충제 (154 mM NaCl, 125 mM CaCl2, 5 mM KCl 및 5 mM 글루코스; pH 5.8 [Menzel et al. (1981)])로 덮었다.
원형질체 현탁액을 추가로 400 RPM에서 10분 동안 원심분리하였다. 원심분리 후에, 간기 (interphase)에 부유하는 원형질체를 빼내고, 10 mL의 W5 완충제를 사용하여 400 RPM에서 10분 동안 원심분리에 의해 세척하였다. 최종 세척 후에, 단리된 원형질체를 W5 완충제 1mL당 1 X 106개의 원형질체의 밀도로 재현탁하고, 형질감염 전에 1시간 동안 인큐베이팅하였다.
원형질체 수득량 및 생존율의 평가
원형질체 수득량을 문헌 [Sambrook and Russell, (2006)]의 방법에 따라 혈구계를 사용하여 평가하였다. 세포 생존율은 프로토콜을 일부 변형하여 문헌 [Huang et al. (1996)]에 설명된 바와 같이 0.5 M의 만니톨에 용해된 400 mg/L의 에반스 블루 염색을 사용하여 시험하였다.
PEG 4000 매개 DNA 전달
비. 나푸스 원형질체로의 전달 전에, 각각의 공여자 및 ZFN 구축물의 플라스미드 DNA를 공급업체의 지시에 따라 퓨어 일드 플라스미드 맥시프렙 시스템® (프로메가 코포레이션, 미국 위스콘신주 매디슨)을 사용하여 이. 콜라이의 배양액으로부터 제조하였다. 공여자 및 ZFN 플라스미드 DNA의 분취액을 1:1 (30 μg의 각각의 플라스미드), 5:1 (공여자 플라스미드 대 ZFN 플라스미드 (총 30 μg의 플라스미드 DNA에 대해)) 및 10:1 (공여자 플라스미드 대 ZFN 플라스미드 (총 30 μg의 플라스미드 DNA에 대해))의 3개의 몰비로 제조하였다. 추가로, 공여자-단독 및 ZFN-단독 분취액 (30 μg)을 대조군으로서 제조하였다. PEG4000 매개 형질전환을 통해 비. 나푸스 원형질체로 전달된 DNA의 양을 표 9에 요약한다.
표 9: 원형질체에 전달된 ZFN 및 공여자 DNA의 양
Figure 112015032530092-pct00015
플라스미드 DNA의 각각의 분취액을 100 μl의 형질전환 완충제 (15 mM MgCl2, 0.1% (w/v) 모르폴리노에탄술폰산 (MES) 및 0.5M 만니톨; pH 5.8)에 현탁된 1백만 개의 원형질체 (생존율 ≥95)에 적용한 후, 150μl의 PEG 용액 (0.4M 만니톨 및 0.1M Ca(N03)2 (pH 6-7) 내의 40% (w/v) PEG 4000; 문헌 [Spangenberg and Potrykus (1995))에 적용하였다. 실온에서 10-15분의 인큐베이션 후에, 5 mL의 W5 완충제를 적가하고, 원형질체를 부드럽게 혼합하였다. 추가의 5 mL의 W5 완충제를 원형질체 현탁액에 느린 유동액으로 첨가하였다. 원형질체를 부드럽게 혼합하고, 400 RPM에서 10분 동안 원심분리하고, W5 상청액을 조심스럽게 제거하여 원형질체를 펠릿 형태로 얻었다. 이어서, 형질감염된 원형질체를 비드형 배양액에 포매될 때까지 실온에서 1 mL의 W5 완충제에서 인큐베이팅하였다. 형질감염된 원형질체를 아래에서 설명되는 알긴산나트륨 방법에 따라 포매하였다.
생존가능 마이크로캘러스를 회복시키기 위한 엽육세포 유래 원형질체의 배양
배지 내에서 포매 전에 형질감염된 원형질체를 400 RPM에서 10분 동안 원심분리하고, W5 완충제를 조심스럽게 제거하였다. 이어서, 원형질체를 1.0 mL의 0.5 M 만니톨 내에 재현탁하고, 얼음 상에서 인큐베이팅하였다. 원형질체 용액에, 동일한 부피의 1.0% 알긴산나트륨을 첨가하고, 부드럽게 혼합하였다. 원형질체 현탁액을 포매될 때까지 얼음 내에서 인큐베이팅하였다. 비드 형성 용액 (0.4 M 만니톨 + 50 mM CaCl2 (pH 5.8))을 혈청 피펫을 사용하여 멸균 6웰 플레이트 (3-4 mL/웰)에 옮겼다. 정확히 1.0 mL의 원형질체 현탁액을 1 mL 피펫을 사용하여 비드 형성 용액에 적가하고, 각각의 형질감염된 샘플 (약 5 x 105개 원형질체)을 웰마다 포매하였다. 원형질체 현탁액을 알긴산나트륨 비드 형성을 위해 1-2시간 동안 실온에서 인큐베이팅하였다. 인큐베이션 기간 후에, 비드 형성 용액을 조심스럽게 제거하고, 1.5 mg/L의 히그로마이신으로 보충된 K3+H:A 배지 (Spangenberg et al. 1998)의 1:2 혼합물 4-5 mL로 교체하였다. 원형질체를 진탕기 (50 RPM) 내에서 3-4주 동안 암소에서 22℃에서 배양하였다. 3-4주 후에, 저항성 마이크로캘러스 (0.5-1.0 mm)를 탈중합 완충제 (0.3 M 만니톨 + 20 mM 시트르산나트륨 (pH 5.8))로 처리함으로써 방출시켰다. 액체 배지를 제거한 후에, 3-4 mL의 탈중합 완충제를 비드형 배양액을 함유하는 각각의 웰에 첨가하고, 실온에서 2시간 동안 인큐베이팅하였다. 멸균 겸자를 사용하여, 비드를 부드럽게 혼합하여 마이크로캘러스의 효율적인 방출을 향상시켰다. 이어서, 멸균 1.0 mL 피펫을 사용하여 탈중합 완충제에 방출된 겔화제를 부드럽게 혼합한 후, 제거하였다. 마이크로캘러스를 5 mL의 액체 A 배지로 2회 세척하고, 마이크로캘러스를 충분한 양의 액체 A에 재현탁하였다 (50 mL의 액체 A는 1 mL의 침강된 세포 부피 (SCV: 이것은 모든 방출된 마이크로캘러스를 멸균 50 또는 15 mL 팔콘(falcon) 튜브로 옮기고 5분 동안 침강시킨 후 측정하였다)에 대해 사용되었다). 마이크로캘러스 균일하게 혼합한 후, 액체 A 배지에 현탁한 0.5 mL의 마이크로캘러스를 B1 배지 (100 x 20 mm 멸균 페트리™ 디쉬에 부은 MS/MS 비타민 + 3.5 % 수크로스 + 500 mg/L MES + BAP (5 μm) + NAA (5 μm) + 2,4-D (5 μm) + 1.5 mg/L 히그로마이신 + 0.7 % 아가로스 타입 I (pH 6.0))로 옮기고, 1-2 mL의 추가의 액체 A 배지를 사용하여 마이크로캘러스를 B1 배지에 균일하게 분포시키고, 과량의 액체 A 배지를 각각의 플레이트로부터 조심스럽게 제거하였다. 플레이트를 배아 성숙을 향상시키는 세공 테이프로 밀봉하였다. 배양액을 22℃에서 16h/d의 광 (30 μmol m-2 s-1) 하에 유지하였다.
엽육세포 유래 원형질체로부터 신초의 증식 및 재생
히그로마이신 저항성 콜로니를 2-3주의 인큐베이션 후에 B1 배지 (SA 및 SP 방법으로 유도된 마이크로캘러스)로부터 선택하고, B2 배지 (100 x 20 mm 멸균 페트리™ 디쉬에 부은 MS/MS 비타민 + 3.0 % 수크로스 + 500 mg/L MES + 500 mg/L PVP + 5 mg/L 질산은 + 5 mg/L 2i P + NAA (0.5 μm) + GA-3 (0.3 μm) + 1.5 mg/L 히그로마이신 + 0.7 % 아가로스 타입 I (pH 5.8))로 옮겼다. 약 25-30개의 캘러스를 플레이트마다 넣고, 플레이트를 파라필름™으로 밀봉하고, 22℃에서 16h/d의 광 (30 μmol m-2 s- 1)에서 인큐베이팅하였다. 히그로마이신 저항성 콜로니를 후속적으로 B2 배지에서 2주 간격으로 5-6 라운드의 계대배양 후에 회복시켰다. 플레이트 당 캘러스의 수를 제3 라운드의 계대배양 후에 12-15로 감소시켰다. 10-12주 후에 출현한 신초 원기 (primordia)를 잔여 캘러스와 함께 조심스럽게 회복시키고, 신초 신장 배지 (250 mL 배양 용기에 부은 MS/B5 비타민 + 2% 수크로스 + 500 mg/L MES + BAP (2 μm) + GA-3 (0.1 μm) + 300 mg/L 티멘틴 + 1.5 mg/L 히그로마이신 + 0.8% 아가 (pH 5.8))로 옮겼다. 2-3 라운드의 히그로마이신 선택 후에 생존한 신초를 발근 배지 (700 mL 배양 용기에 부은 1/2 강도 MS/B5 비타민 + 1% 수크로스 + 500 mg/L MES + IBA (2.5 μm) + 1.5 mg/L 히그로마이신 + 0.6% 아가 (pH 5.8))로 옮겼다.
엽육세포 원형질체로부터 게놈 DNA의 단리
형질감염된 원형질체를 3 cm 페트리™ 디쉬로부터 2 mL 원심분리 튜브로 옮겼다. 세포를 70 g에서 원심분리에 의해 펠렛화하고, 상청액을 제거하였다. 형질감염된 원형질체의 회수를 최대화하기 위해, 페트리™ 디쉬를 1 mL의 세척 완충제로 3회 세정하였다. 각각의 세정은 세척 완충제를 페트리™ 디쉬에서 1분 동안 회전시킨 후, 액체를 동일한 2 mL 원심분리 튜브에 전달함으로써 수행하였다. 각각의 세정 종료시에, 세포를 70 g에서 원심분리하여 펠렛화하고, 상청액을 제거하였다. 펠렛화된 원형질체를 액체 질소로 급속 냉동한 후, -40℃ 및 133 x 10-3 mBar 압력에서 랍콘코 프리존 4.5® (랍콘코, 미국 미주리주 캔자스 시티))에서 24 h 동안 동결 건조하였다. 동결건조된 세포는 제조자의 지시에 따라 DNEASY® 식물 DNA 추출 미니 키트 (퀴아젠)를 사용하여 DNA 추출에 적용하되, 조직 붕괴는 필요하지 않았고, 원형질체 세포는 용해 완충제에 직접 첨가하였다.
캘러스 조직으로부터 게놈 DNA의 단리
개별적인 캘러스를 액체 질소 내에서 급속 냉동한 후, 24 h 동안 -40℃ 및 133 x 10-3 mBar 압력에서 랍콘코 프리존 4.5® (랍콘코, 미국 미주리주 캔자스 시티) 내에서 동결 건조하였다. 동결건조된 캘러스는 제조자의 지시에 따라 DNEASY® 식물 DNA 추출 미니 키트 (퀴아젠, 독일 힐덴)를 사용하여 DNA 추출에 적용하였다.
잎 조직으로부터 게놈 DNA의 단리
재생된 식물로부터의 30 mg의 어린 잎 조직을 액체 질소 내에서 급속 냉동한 후, 24 h 동안 -40℃ 및 133 x 10-3 mBar 압력에서 랍콘코 프리존 4.5® (랍콘코, 미국 미주리주 캔자스 시티) 내에서 동결 건조하였다. 동결건조된 캘러스는 제조자의 지시에 따라 DNEASY® 식물 DNA 추출 맥시 키트™ (퀴아젠, 독일 힐덴)를 사용하여 DNA 추출에 적용하였다.
FAD3C의 NHEJ-매개 스플라이싱 및 편집에 대한 게놈 DNA의 PCR 검정
공여자 DNA의 비. 나푸스의 Fad3C 유전자에 대한 통합의 검출은 적어도 하나의 프라이머가 Fad3C 유전자좌 (표 10)에 특이적이고 제2 프라이머가 gfp 카세트의 프로모터 또는 종결인자 (표 10 및 도 19a)에 특이적인 일련의 PCR에 의해 수행하였다. 특이성은 마지막 염기쌍이 Fad3C 게놈 서열을 Fad3 유전자의 다른 카피와 구별케하는 SNP에 정렬되고 별표 [*]로 표시된, 상기 염기쌍 앞의 포스포로티오에이트 뉴클레오티드간 연결을 포함하는 올리고뉴클레오티드를 설계함으로써 얻었다. 교정 (proofreading) 활성을 갖는 폴리머라제와 조합하여 사용되는 상기 설계는 각각의 Fad3C 또는 Fad3A 대립유전자의 특이적인 증폭을 유도하고, 나타낸 다른 Fad3 카피를 배제하였다. 각각의 프라이머 세트는 야생형 비. 나푸스로부터 얻은 PCR 증폭 생성물의 생어-기반 서열결정을 통해 정확한 유전자 카피의 증폭에 대해 실험에 의해 시험하였다.
표 10: ZFN-유도 이중-가닥 파단 내로 DNA의 통합을 검출하기 위해 사용된 올리고뉴클레오티드 서열
Figure 112015032530092-pct00016
*는 나타낸 다른 Fad3 카피를 배제하면서 Fad3C 또는 Fad3A의 특이적인 증폭 (교정 폴리머라제 사용)을 유도하는 포스포로티오에이트 뉴클레오티드간 연결을 나타낸다. 각각의 프라이머 세트는 야생형 비.나푸스로부터 얻은 PCR 증폭 생성물의 생어-기반 서열결정에 의해 정확한 유전자 카피의 증폭에 대해 실험에 의해 시험하였다.
원형질체에서 비-상동성 말단부 연결에 의한 FAD3C에 대한 유전자 부가의 검출
게놈 DNA를 기능성 tGFP 리포터 카세트 (pDAS000341 또는 pDAS000343)를 코딩하는 공여자 DNA, ZFN DNA (pDAB107827 또는 pDAB107828) 또는 공여자 및 ZFN DNA의 혼합물이 24시간 더 일찍 전달된 원형질체 풀 (1백만 개의 원형질체/풀)로부터 추출하였다. 형질전환을 위해 전달된 DNA의 양은 상기 설명되어 있다. PCR 산물을 플라스미드 벡터 내로 클로닝하였다. 게놈 편집은 각각의 세포에서 독립적으로 발생하여 플라스미드 벡터 내로의 클로닝에 의해 다양한 상이한 삽입 이벤트를 생성하고, 각각의 게놈 편집은 불명료함이 없이 서열결정될 수 있다. 몇몇 클론은 ABI3730XL® 자동 모세관 전기영동 플랫폼에서 서열결정되었다. 유전자 서열의 분석은 시퀀셔 소프트웨어 V5.0™ (진코즈, 미국 미시건주 앤 아버)을 사용하여 수행하였다.
편집 또는 스플라이싱에 의한 Fad3C 유전자좌에 대한 부가의 증거는 표 10에 설명된 프라이머를 사용하여 원형질체로부터 추출된 게놈 DNA로부터의 5' 및 3' Fad3C-카세트 접합부의 증폭에 의해 제공되었다. 프라이머 "FAD3CNHEJ-L4-F2" 및 "AtUbiNHEJ-R1"을 사용한 PCR 증폭은 tGFP 카세트 및 Fad3C의 5' 접합부를 증폭시키기 위해 수행하였다. "FAD3CNHEJ-L4-R2" 및 "AtORF23tNHEJ-F1"을 사용한 PCR 증폭은 tGFP 카세트 및 Fad3C의 3' 접합부를 증폭시키기 위해 수행하였다. 프라이머 "FAD3CNHEJ-L4-F2" 및 "FAD3CNHEJ-L4-R2"를 사용한 PCR 증폭은 ZFN 28051-2A-28052에 의해 유도된 이중 가닥 파단에 걸쳐 증폭하기 위해 수행하였다. 증폭은 ZFN 플라스미드 또는 공여자 플라스미드가 단독으로 전달된 원형질체로부터 관찰되지 않았다. 모든 접합부 서열은 NHEJ-매개 복구 경로를 통해 Fad3C 유전자좌에서 tGFP 카세트의 삽입을 나타내었다. 게놈 및 카세트 중의 어느 하나 또는 둘 모두로부터의 상이한 길이의 결실이 관찰되었고, 벡터 백본 (공여자 또는 ZFN으로부터의)으로부터 유래된 서열의 부가가 게놈과 카세트 사이에 삽입되었다 (도 20a 및 도 20b).
원형질체로부터 재생된 캘러스 조직에서 비-상동성 말단부 연결에 의한 FAD3C에 대한 유전자 부가의 검출
또한, Fad3C 유전자좌의 스플라이싱 및 편집에 대한 증거는 hph 카세트를 코딩하는 공여자 DNA (pDAS000340 또는 pDAS000342), ZFN DNA 단독 (pDAB107827 또는 pDAB107828) 또는 공여자 및 ZFN DNA가 전달된, 선택 (상기 설명된 바와 같은 1.5 mg/L 히그로마이신)시에 원형질체로부터 재생된 캘러스 조직으로부터 얻었다 (전달된 DNA의 양을 표 9에 제공함). 원형질체 형질감염 4주 후에 캘러스가 생존하지 않은 편집 1:1:1을 제외한 각각의 비율에 대해 DNA를 약 80개의 캘러스로부터 추출하였다.
비. 나푸스 게놈 내로의 hph 카세트의 통합 (fwat Fad3C 또는 무작위로) hph 유전자에 특이적인 프라이머 (서열 294; F - 5' CTTACATGCTTAGGATCGGACTTG 3', 서열 295; R - 5' AGTTCCAGCACCAGATCTAACG 3') 및 프로브 (서열 296; 5' CCCTGAGCCCAAGCAGCATCATCG 3')를 사용하는 타크만™ qPCR에 의해 확인하였다. 이들 프라이머-프로브 쌍을 A 게놈 상에 단일 카피로서 존재하는 비. 나푸스 높은 이동도 그룹 단백질 I/I (HMG I/Y) (Weng et al., 2004, Plant Molecular Biology Reporter)에 특이적인 프라이머 (서열 297; F - 5' CGGAGAGGGCGTGGAAGG 3', 서열 298; R - 5' TTCGATTTGCTACAGCGTCAAC 3') 및 프로브 (서열 299; 5' AGGCACCATCGCAGGCTTCGCT 3')와의 이중체 반응에 사용하였다. 증폭은 CFX96 또는 CF384 실시간 PCR 검출 시스템™ (바이오라드, 미국 캘리포니아주 허큘레스)을 사용하여 C1000 열 순환기 상에서 수행하였다. 결과를 CFX 매니저(MANAGER)™ (바이오라드) 소프트웨어 패키지를 이용하여 분석하였다. 상대적인 정량은 게놈 내로 삽입된 hph 카세트의 카피수의 추정을 제공하는 2-ΔΔCt 방법 (Livak and Schmittgen, 2001)에 따라 계산하였다.
Fad3C의 NHEJ-매개 스플라이싱 및 편집에 대한 증거는 Fad3C에 특이적인 제1 프라이머 및 hph 카세트의 프로모터 또는 종결인자에 특이적인 제2 프라이머를 사용하여 PCR 검정을 수행함으로써 얻었다 (표 9 및 도 19b). 캘러스 조직으로부터 얻은 DNA의 제한된 양 때문에, 센스 배향으로의 통합만이 검정되었다. PCR 산물은 퀴아퀵 미니일루트(QiaQuick MiniElute) PCR 정제 키트™ (퀴아젠)를 사용하여 겔-정제되었고, 직접 생어 서열결정 방법을 사용하여 서열결정하였다. 서열결정 생성물은 빅다이® v3.1 프로토콜 (어플라이드 바이오시스템즈)에 따라 에탄올, 아세트산나트륨 및 EDTA로 정제하고, 상기한 바와 같이 서열결정하고 분석하였다.
각각의 실험에서 공여자 카세트를 함유하는 캘러스의 수를 표 11에 제공한다. 편집 및/또는 스플라이싱에 의한 Fad3C 유전자좌에 대한 공여자 유전자의 증거는 ZFN 절단 부위 및 5' 및 3' Fad3C-hph 카세트 접합부 둘 모두에 걸친 PCR 증폭 (표 10에 제시된 프라이머를 사용하는)에 의해 제공되었다. 단지 hph 플라스미드 (pDAS000340 및 pDAS000342) 또는 단지 ZFN 플라스미드 (pDAB107827 및 pDAB107828)를 사용하여 형질전환된 대조 원형질체로부터 회복된 캘러스 조직으로부터 단리된 게놈 DNA의 PCR 증폭은 PCR 증폭 생성물을 생산하지 않았다.
5' 및 3' Fad3C-hph 카세트 접합부의 증폭으로부터 생산된 PCR 앰플리콘을 아가로스 겔로부터 정제하고, Fad3C 게놈 유전자좌 내에서 통합의 특이성을 확인하기 위해 서열결정하였다. PCR 산물의 서열결정 분석의 결과는 개별적으로 형질전환된 원형질체로부터 생성된 각각의 단리된 캘러스가 단지 단일 PCR 증폭 생성물을 생성하고 혼합 유전자형의 세포를 함유하지 않음을 나타내었다.
Fad3C 게놈 유전자좌 실험 내의 공여자 서열의 NHEJ-매개 통합에서, 표적 유전자좌에 대한 부가의 빈도 (표적 유전자좌로부터 증폭된 공여자 DNA 벡터의 임의의 부분에 의해 규정됨)는 각각 1:1, 5:1, 및 10:1 (공여자 DNA:ZFN DNA)의 DNA 농도에 대해 42%, 46% 및 32%이었다. 표 12를 참조한다. 정확한 스플라이싱의 빈도는 두 카세트 접합부가 증폭가능한지 검정하고 PCR 산물의 서열결정으로부터 결정되었다. 이들 결과를 통해, 카세트가 정확한 배향으로 표적 유전자좌에서 삽입되었음을 확인하였다. 통합 빈도는 각각 1:1, 5:1 및 10:1의 공여자 플라스미드 DNA:ZFN 플라스미드 DNA 농도에 대해 4%, 3% 및 3%로서 계산하였다. 유전자 편집 실험에서, 표적 유전자좌로부터 증폭된 공여자 DNA 벡터의 임의의 부분에 의해 규정되는, 표적 유전자좌에 대한 부가의 빈도는 각각 5:1:1 및 10:1:1의 공여자 플라스미드 DNA:ZFN 플라스미드 DNA 농도에 대해 66% 및 65%이었다. 표 13을 참조한다. 정확한 편집의 빈도는 두 카세트 접합부가 증폭가능하고 PCR 산물의 서열을 생산함으로써 결정되었다. 이들 결과를 통해, 카세트가 각각 5:1:1 및 10:1:1의 공여자 플라스미드 DNA:ZFN 플라스미드 DNA 농도에 대해 3% 및 6%의 빈도로 정확한 배향으로 표적 유전자좌에 삽입되었음을 확인되었다. 원형질체 검정에서 관찰되는 바와 같이, ZFN에 의한 게놈 유전자좌의 절단의 결과로서 염기쌍이 결실되거나 또는 추가의 염기가 게놈과 카세트 사이에 삽입되었다 (도 21-22).
특정 경우에, PCR 산물은 표적 유전자좌 내의 뉴클레오티드 서열의 첨가를 유도하거나, 이를 어느 PCR 산물도 유도하지 않거나, 또는 야생형 샘플에서 관찰된 것보다 더 큰 PCR 산물이 유도하였다. 절단 부위에 플랭킹된 프라이머를 사용한 PCR 증폭으로부터 생성된 이들 결과는 유전자좌가 염색체의 두 쌍 모두에서 붕괴됨을 나타내었다 (도 21-22). 몇몇의 예에서, 하나 초과의 밴드가 스플라이스 접합부에서 증폭되었고 (도 21-22), 이것은 상이한 삽입이 각각의 게놈 카피에서 독립적으로 발생함을 나타내었다.
표 11: 선택 4주 후에 hph의 존재에 대해 양성인 캘러스의 수
Figure 112015032530092-pct00017
표 12: ZFN28051-2A-28052에 의해 유도된 DSB에서 Fad3C 유전자좌에서의 스플라이싱에 의해 hph가 삽입된 캘러스의 수
Figure 112015032530092-pct00018
* 절단 부위에 결실된 염기 쌍 또는 삽입된 추가의 염기 쌍의 수
표 13: ZFN28051-2A-28052 및 ZFN28053-2A-28054에 의해 유도된 절단 부위에서 FadC 유전자좌에서의 편집에 의해 hph가 삽입된 캘러스의 수
Figure 112015032530092-pct00019
* 절단 부위에 결실된 염기 쌍 또는 삽입된 추가의 염기 쌍의 수
식물에서 비-상동성 말단부 연결에 의한 FAD3C에 대한 유전자 부가의 검출
DNA를 원형질체로부터 재생된 식물로부터 추출하고, 포팅(potting) 배지 (상기 설명된 바와 같이)에 옮겼다. 회수된 대부분의 식물은 공여자 DNA에서 코딩되는 hph 카세트의 1-2개의 카피만을 함유하는 것으로 추정되었다. 식물을 캘러스 조직에 대해 설명한 바와 동일한 세트의 검정을 사용하고 카세트가 안티센스 배향으로 삽입되었는지 또는 Fad3A 유전자좌에서 공여자 통합이 이루어졌는지 결정하기 위한 검정을 사용하여 분석하였다.
표 14: 원형질체로부터 재생된 식물의 추정된 카피수. 각각의 비율에 대해, 백만개의 원형질체의 형질감염을 3회 수행하였다.
Figure 112015032530092-pct00020
hph 카세트가 어느 한쪽으로 Fad3C 내로 삽입된 선형 공여자 설계 구축물에 대한 정확한 스플라이싱의 빈도는 각각 1:1, 5:1 및 10:1의 농도의 공여자 DNA:ZFN DNA에 대해 51%, 32% 및 56%이었다 (표 15). 이들 결과 중에서, 35%, 32% 및 50% (1:1, 5:1 및 10:1)가 정방향 배향으로 삽입되었다 (표 15).
hph 카세트가 양쪽으로 Fad3C 내로 삽입되어 영역을 유전자좌 4로부터 유전자좌 6으로 교체한 정확한 편집의 빈도는 각각 5:1:1 및 10:1:1의 농도의 공여자 DNA:ZFN DNA:ZFN DNA에 대해 2% 및 0%이었다 (표 16). 또한, 두 ZFN이 5:1:1로 전달될 때, 2%가 유전자좌 4 내로 스플라이싱되고 10%가 유전자좌 6 내로 스플라이싱되고, 두 ZFN이 10:1:1로 전달될 때, 10%가 유전자좌 4 내로 스플라이싱되고 15%가 유전자좌 6 내로 스플라이싱되었다. PCR 앰플리콘을 수득하였고, 서열분석하여 삽입 접합부 서열을 결정하였다. 특이적으로 표지된 식물에 대해 생성된 서열은 표 17에 기재하였다.
표 15: ZFN28051-2A-28052에 의해 유도된 DSB에서 FadC 유전자좌에서의 스플라이싱에 의해 hph가 삽입된 식물의 수
Figure 112015032530092-pct00021
표 16: ZFN28051-2A-28052 및 ZFN28053-2A-28054에 의해 유도된 절단 부위에서 FadC 유전자좌에서의 편집에 의해 hph가 삽입된 식물의 수
Figure 112015032530092-pct00022
표 17: ZFN28051-2A-28052 및 ZFN28053-2A-28054에 의해 유도된 절단 부위에서 Fad3C 유전자좌에 삽입된 표적인 단일 카피 hph의 식물의 설명
Figure 112015032530092-pct00023
hph 카세트가 원형 공여자에 대해 어느 한쪽 방향으로 Fad3C 내로 삽입된 정확한 스플라이싱의 빈도는 1:1, 5:1 및 10:1에 대해 각각 51%, 32% 및 56%였다 (표 18, 도 23). 이들 중에서, 35%, 32% 및 50% (1:1, 5:1 및 10:1)가 정방향 배향으로 삽입되었다 (표 18).
Hph 카세트가 어느 한쪽 방향으로 Fad3C 내로 삽입되어 유전자좌 4에서 유전자좌 6으로 영역을 대체하는 정확한 편집의 빈도는 5:1: 및 10:1:1에 대해 각각 2% 및 0%였다 (표 19; 도 24). 또한, ZFN 둘 다 5:1:1로 전달될 때, 2%가 유전자좌 4 내로 스플라이싱되고 10%가 유전자좌 6 내로 스플라이싱되고, ZFN 둘 다 10:1:1로 전달될 때, 10%가 유전자좌 4 내로 스플라이싱되고 15%가 유전자좌 6 내로 스플라이싱되었다.
표 18: ZFN28051-2A-28052에 의해 유도된 DSB에서 FadC 유전자좌에서의 스플라이싱에 의해 hph가 삽입된 식물의 수
Figure 112015032530092-pct00024
* 절단 부위에 염기 쌍이 결실되거나 추가의 염기쌍이 삽입되지 않음.
표 19: ZFN28051-2A-28052 및 ZFN28053-2A-28054에 의해 유도된 절단 부위에서 FadC 유전자좌에서의 편집에 의해 hph가 삽입된 식물의 수
Figure 112015032530092-pct00025
* 절단 부위에 염기 쌍이 결실되거나 추가의 염기쌍이 삽입되지 않음.
HDR을 통한 브라시카 나푸스 오메가-3 지방산 데새투라제의 표적화 통합
tGFP 및 HPH 카세트를 함유하는 공여자 벡터를 FAD3 상류 및 하류 공여자 서열의 1kb를 포함시키기 위해 변형시켰다. FAD3 상류 및 하류 공여자 서열은 본래 FAD3 서열과 100% 동일하였고, 이를 FAD3 아연 핑거 결합 부위로부터 획득하였다; GCCCAAGGAACCCTTTTCTGGGCCATCTTCGTACTCGGCCACGACTGGTAATTTAAT (서열 255) 또는 AGCGAGAGAAAGCTTATTGCAACTTCAACTACTTGCTGGTCGATCGTGTTGGCCACTC (서열 256). 생성된 4개의 "공여자" 벡터는 pDAS000340 (히그로마이신-저항성 유전자-스플라이싱 공여자), pDAS000341 (tGFP 리포터 유전자 스플라이싱 공여자), pDAS00342 (히그로마이신-저항성 유전자-편집 공여자) 및 pDAS000343 (tGFP 리포터 유전자 편집 공여자)과 유사하며, 여기서 유일한 변형은 FAD3 게놈 상류 및 하류 서열의 1Kb의 포함이었다. 이전에 NHEJ 매개된 통합에 대해 기재된 아연 핑거 뉴클레아제 플라스미드 (pDAB107827 및 pDAB107828)는 HDR 매개된 통합에 사용하였다.
브라시카 나푸스의 형질전환
엽육 유래 원형질체를 단리시키고, 상기 기재된 바와 같이 브라시카 나푸스 (DH10275) 식물로부터 제조하였다. 원형질체를 정제된 플라즈미드 DNA에 의해 형질전환시켰다. 공여자 및 ZFN 플라스미드 DNA의 분취액을 3가지의 몰비: 1:1 (30 μg의 각각의 플라스미드), 5:1 (전체 30 μg의 플라스미드 DNA에 대해 공여자 플라스미드 대 ZFN 플라스미드) 및 10:1 (전체 30 μg의 플라스미드 DNA에 대해 공여자 플라스미드 대 ZFN 플라스미드)로 제조하였다. 추가로, 공여자-단독 및 ZFN-단독 분취액 (30 μg)을 대조군으로서 제조하였다. PEG4000 매개 형질전환을 통해 비. 나푸스 원형질체로 전달된 DNA의 양을 표 20에 요약하였다. 형질전환된 원형질체 세포는 이전에 기재된 것으로서 배양하였으며, 여기서 선택 배지는 글루포시네이트 선택 배지였고, 추정 형질전환체를 트랜스진 삽입에 대한 qPCR 분석을 통해 분석하였다.
표 20: 원형질체에 전달된 ZFN 및 공여자 DNA의 양
Figure 112015032530092-pct00026
원형질체에서 HDR에 의한 FAD3에 대한 유전자 부가의 검출
기능적 리포터 카세트 또는 선택 마커 카세트를 코딩하는 공여자 DNA, ZFN DNA 또는 공여자 및 ZFN DNA의 혼합물이 24시간 더 일찍 전달된 원형질체 풀 (백만개의 원형질체/풀)로부터 게놈 DNA를 추출하였다. 형질전환을 위해 전달된 DNA의 양은 상기에 기재되어 있다. PCR 생성물을 플라스미드 벡터 내로 클로닝하였다. 게놈 편집은 각각의 세포에서 독립적으로 발생하여 플라스미드 벡터 내로의 클로닝에 의해 상이한 다양한 삽입 사례를 생성하고, 각각의 게놈 편집은 불명료함 없이 서열분석될 수 있다. 몇몇 클론을 ABI3730XL® 자동 모세관 전기영동 플랫폼에서 서열분석하였다. 유전자 서열의 분석을 시퀀셔™ 소프트웨어 V5.0™ (진코즈, 미시건주 앤 아버)을 사용하여 수행하였다.
편집 또는 스플라이싱에 의한 FAD3 유전자좌에 대한 유전자 부가의 증거를 원형질체로부터 추출된 게놈 DNA로부터의 양쪽 5' 및 3' FAD3-카세트 접합부의 증폭에 의해 제공하였다. 증폭은 ZFN 플라스미드 또는 공여자 플라스미드가 단독으로 전달된 원형질체로부터는 관찰되지 않았다. 모든 접합부 서열은 HDR-매개 복구 경로를 통해 FAD3 유전자좌에서 카세트의 삽입을 나타내었다. 게놈 및 카세트 중 어느 하나 또는 둘 다로부터의 상이한 길이의 결실, 뿐만 아니라 게놈과 카세트 사이에 삽입되는 벡터 백본 (공여자 또는 ZFN으로부터의)으로부터 유래된 서열의 부가가 관찰되었다.
원형질체로부터 재생된 캘러스 조직에서 HDR에 의한 FAD3에 대한 유전자 부가의 검출
FAD3 유전자좌의 스플라이싱 및 편집의 추가의 증거를 카세트를 코딩하는 공여자 DNA, ZFN DNA 단독, 또는 공여자 및 ZFN DNA가 전달된 선택한 원형질체로부터 재생된 캘러스 조직으로부터 획득하였다. DNA를 각각 비에 대해 대략 80개의 캘러스로부터 추출하였다.
비. 나푸스 게놈으로의 카세트의 통합을 공여자 삽입 및 게놈 플랭킹 서열에 특이적인 프라이머 및 프로브를 사용하는 택맨™ qPCR에 의해 확인하였다. 상대적인 정량화는 게놈 내로 삽입된 카세트의 카피수의 추정을 제공하는 2- ΔΔCt 방법 (Livak and Schmittgen, 2001)에 따라 계산하였다. FAD3의 NHEJ-매개 스플라이싱 및 편집에 대한 증거를 FAD3에 특이적인 제1 프라이머 및 카세트의 프로모터 또는 종결인자에 특이적인 제2 프라이머를 사용하여 PCR 검정을 수행함으로써 얻었다. PCR 생성물은 퀴아퀵 미니일루트 PCR 정제 키트™ (퀴아젠)를 사용하여 겔-정제되었고, 직접 생어 서열분석 방법을 사용하여 서열분석하였다. 서열분석 생성물을 빅다이(BIGDYE)® v3.1 프로토콜 (어플라이드 바이오시스템즈)에 따라 에탄올, 아세트산나트륨 및 EDTA로 정제하고, 상기한 바와 같이 서열분석하고 분석하였다.
각각의 실험에서 공여자 카세트를 함유하는 캘러스의 수를 결정하였다. 편집 및/또는 스플라이싱에 의한 FAD3 유전자좌에 대한 공여자 유전자 부가의 증거를 ZFN 절단 부위 및 양쪽 5' 및 3' FAD3-카세트 접합부에 걸친 PCR 증폭에 의해 제공하였다. 플라스미드 단독 또는 ZFN 플라스미드 단독으로 형질전환된 대조 원형질체로부터 회수된 캘러스 조직으로부터 단리된 게놈 DNA의 PCR 증폭은 PCR 증폭 생성물을 생산하지 않았다.
5' 및 3' FAD3-카세트 접합부의 증폭으로부터 생산된 PCR 앰플리콘을 아가로스 겔로부터 정제하고, FAD3C 게놈 유전자좌 내에서 통합의 특이성을 확인하기 위해 서열분석하였다. PCR 생산물의 서열분석 분석의 결과는 개별적으로 형질전환된 원형질체로부터 생성된 각각의 단리된 캘러스가 단지 단일 PCR 증폭 생성물을 생성하고 혼합 유전자형의 세포를 함유하지 않음을 나타내었다.
식물에서 HDR에 의한 FAD3에 대한 유전자 부가의 검출
DNA를 원형질체로부터 재생된 식물로부터 추출하고, 포팅 배지에 옮겼다. 회수된 대부분의 식물은 공여자 DNA에서 코딩되는 카세트의 1-2개의 카피만을 함유하는 것으로 추정되었다. 식물을 캘러스 조직에 대해 기재한 바와 동일한 세트의 검정 뿐만 아니라 카세트가 FAD3 유전자좌에 삽입되었는지 결정하는 검정으로 분석하였다.
카세트가 FAD3 유전자좌 내에 삽입된 정확한 스플라이싱의 빈도를 상기에 기재된 PCR 검정을 사용하여 결정하였다. 획득한 앰플리콘 밴드를 플랭킹 서열을 결정하기 위해 서열분석하였다. 추가로, 식물을 FAD3 이외의 부위에서의 카세트의 통합의 빈도를 결정하기 위해 표적-이탈 삽입에 대해 스크리닝하였다.
실시예 9: 농경학상 중요한 유전자로의 브라시카 나푸스 오메가-3 지방산 데새투라제 ( FAD3 )의 표적화 통합
제초제 글리포세이트에 저항성을 부여하는 DGT-28 트랜스진 (본원에 참조로 포함되는 국제 특허 공개 번호 WO/2013/116700)을 함유하는 구축물을 브라시카 나푸스의 FAD3 게놈 유전자좌 내로의 통합을 위해 설계하고 구축하였다. 구축물 및 연관된 아연 핑거 뉴클레아제 구축물 (예를 들어, pDAB107827 및 pDAB107828)을 이전에 상기에 기재된 바와 같은 브라시카 나푸스 세포로 형질전환시켰다. 형질전환체는 이전에 기재된 것으로서 분자 확인 검정을 통해 동정하고 확인하였다. 통합된 dgt-28 트랜스진을 포함하는 FAD3 염색체 구성요소를 단리시켰다. FAD3 유전자좌 내로의 dgt-28 트랜스진의 통합은 NHEJ 매개된 통합 및 HDR 매개된 통합을 통해 예시된다. FAD3 유전자좌 내로의 통합은 FAD3 내인성 서열 또는 FAD3 유전자좌 내에 안정하게 통합된 이전에 기재된 ETIP (pDAS000271 - pDAS000275) 내로 지정될 수 있다. NHEJ 매개된 메카니즘을 통한 FAD3 유전자좌 내로의 통합은 선형 공여자 또는 원형 공여자 DNA 설계를 사용하여 수행할 수 있다. 형질전환된 DGT-28 브라시카 나푸스 사례를 획득하였고, DGT-28의 강한 발현 및 후속적인 제초제 글리포세이트에 대한 저항성에 대해 시험하였다.
특정의 예시적인 실시양태가 본원에 기재되어 있으며, 통상의 기술자는 예시적 실시양태에 대한 다수의 추가, 제거 및 변형이 하기 청구범위의 범주에서 벗어나지 않고 이루어질 수 있음을 인식하고 이해할 것이다. 또한, 한 실시양태로부터의 특징은 또 다른 실시양태의 특징과 조합될 수 있다.
SEQUENCE LISTING <110> DOW AGROSCIENCES LLC <120> FAD3 PERFORMANCE LOCI AND CORRESPONDING TARGET SITE SPECIFIC BINDING PROTEINS CAPABLE OF INDUCING TARGETED BREAKS <130> 8326-4009.40 <140> PCT/US2013/058267 <141> 2013-09-05 <150> 61/820,260 <151> 2013-05-07 <150> 61/697,854 <151> 2012-09-07 <160> 383 <170> PatentIn version 3.5 <210> 1 <211> 20890 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 1 aattgttgta ttttttaaat ataattctca aaaattctat tttaagaaag ttttcatttt 60 tacttaaaaa tattgtagat ttgaagttgt ggtttagtaa tttggataac aataattttt 120 gttgatagat gaaaaacaga agaagatcac gattcgttca cacattccca actcacatta 180 cactaacacc tttgagtaaa gtgagccatt ttattatatt catgcctacc aggctaccaa 240 tatctgtaaa gctctcctca aataaatagc aagcataaga ttttgattat atcccagtag 300 aaaaactaga ctttatcttc taaataatca ttaagcatgc taatgactta gttacaaaga 360 gggtagatca aaagaaatgg atttgatgaa gctctgggaa gcttagtaag agcattggtg 420 attctctggt agttcttgtt aacatttttg tcttctcggt gactctcaac ttcaacatca 480 accttgacag tttcaagaca tttcaaattt cccaagaaat gcttctctga ttcagctctc 540 tacgagttcc tctataccct gaaaccttta gcaccttcac ttgacatgtc gataaacaac 600 atacttcctc ctccttattc ttcctagcga cgcacacaca ggcgtccccg catctatctg 660 taactcggtg cacaagaccc tgaaaagcaa aattcatgta acaacaacaa tcaaacgaat 720 tgtgtgtgtg tctatgtatc aaaacgaaac tggtacctcc tactttgatg acaagagttt 780 ctaggtttgg agagttgttg agaagaagtg gcaccacttg ccatcctttt tctttgtcac 840 tctcaaaaga cagagtaagg agcttgtgaa agaccggcat tgatttacag tataggtgaa 900 acacctggag atttattact attatttatc acaaaccaaa aaaaaaatgc aataactaat 960 aacactaaga ctttgcactt cagattgaca caactagcag aaggaaagat aacaaaacta 1020 acctcaagag acgtaggaga caagtcaagg actttgtttc tataacgtgg atgtactcgc 1080 tttctaagtg aagctccgag aagcttcttc gttccaggac agtgcggatc cagttgtcca 1140 ctcgagaagc gtcgtgagtg tgctcacagc gcaaagagaa tcttttgatg attgaagagt 1200 tggttaggag agctagtgtt ttgtcgacga agtcagggaa gccacgtgga tcaccagttg 1260 cagttgcgtc gtcgctcaga tcgaggctgt ctacgaggga aagcagattc ctccaccttt 1320 tggacagaac caatgtggaa gctgcttgat ttgtcggaag caaggacagg actttgccaa 1380 gaacctcatc tgggagactg cttattgaat ctcgttgggg agacatatat taaggtttaa 1440 gatcgaacca gaaacttgtc gattaaaggt cacaagttca gaacaatcga agaaaggagc 1500 aaacgaacga aggtaggtga acttacaatt agaaaggaac cgacgacgag ggagcgaaac 1560 gcagcgtttg acgtggtatt tctaattgtg taatatttat ttttaaaaaa tgtgatttct 1620 tttaaaaaaa gttttacaaa agttgatagg tttcggggca taataattgg gttaattgca 1680 gtgaggatgg gagtaaaatt gagtttgcaa aagtgaggcg gtaaatttgt atggttctgc 1740 atagttgaaa ataaataagt ttatcatgtg tttataattg tttagttata aagtagcgac 1800 taaataaaat aaaaatgatc attttataat atatagctat aaaatagtaa aattagaata 1860 ttatacttag aatataagat atattaattt gatataacta gtaataaatt atttgtataa 1920 tgtttgttta ttttgaaaat tttggtttat cccactatat aaaagaagct aaatttgagc 1980 ttcataaggc tatccacatg tgcacaaata ttcaggacca accaaagtgc catgtcatct 2040 ttgtgagctt gcaattttaa aaaaatttgt cacctacgtg gcccgtatga cccatctctc 2100 ccgagcctct cttcatacca tattggtcgc agcccattac ccatctcttg atacggttcg 2160 ggttatatcg ctgtcctctc tgaaatatca aaatcactaa ccctaatcac cgttctcgat 2220 ctctttgtcg attctcttcc tcccccaaac tcatcccgat ctctttgtcg attctctttc 2280 tctccccaac tcatcccgca taacgtcccc gatgagagtg ctggtacttc aatgtgctct 2340 cataaagcct tcaatgtttt cttcaaccat gctgttgcct gttggtgatg ttttcaattt 2400 aatatgcgga gaggatgaga tcgacttggg gagaggaggt tattgttcgg aattgaaacc 2460 cgaaaatgga tttcacaatc gtaagctctc acttctttgg gctcgcttcg tcttcttaaa 2520 gaggctttat cggctgcgtt gaggctgtat cgtccggtgc cggagttctt caaccccggc 2580 ttgaagggcg acaagataca acatgggact tttgtttcgc agtgatgttt ttgatttact 2640 tggctgggag gatgagatcg actctgggag attttgtttc gagttcaaac cggagggatt 2700 gactttgaaa tcgtacgctc ttagtataca taattatggg ccaatacaca cagattacga 2760 tacaaacaca aacacgaagc tcagcattag agtttcagcc ccggagattc aacagcaact 2820 aaagtaagat tccaaattcg tcctctgttc agcctccagt caatttcttt tactttttta 2880 atctttgcct aatgttcatt actgtgatca aaaataactc gcttgcatat gtcttctttt 2940 tcaggttgtt acttggcttt ctatttcatg aagcacagaa cgtagtatat aaaaggaaac 3000 aggaatacac tttgcaaata ttctctgtgt ctttggatta atctataatc ttgtgatgta 3060 gatagataca aaagcttctt acggatctcc atggagaatt catgaaggta acctgaaaca 3120 actctctatc tcttgcaagt ggatgccaga ctaatgtcat agtttggtaa aattccagat 3180 taagttttgg tgaatgactt tgtgttttgt acagaagata agaactcatg ttcgttatgg 3240 gaagcagtta tcacaataca accttactta tcgaattttc atcaagtaat attacatgat 3300 ttataattag ttgtgtattt tatgacattt tataagtgtg gttgacgata aaaatgacaa 3360 ggctatcaca aaagatacct caagttcagg tattttagat atgggactct ctggaccttt 3420 aatatgtgat aatgtatcga agttttaagt cttcttccaa caatactcta attcgatttt 3480 gtggtgtatc gatacatttc ctgaagggct tactcggaag cttccagtta ccaacaagta 3540 tgtgaagcca atatgtatag gatttggagg ggcggaggac cacgaccttg aaaatctgaa 3600 gaaacagctt gaagatgatg atctcatcag aggtacaata actgcggaac atcaaggcag 3660 tgaaggtaca attttacctg tgcatgtcaa aaccgaactc tgtagccatc tccctacacc 3720 ggtttagtca taactgtcat ttgattaaca aacagagtct ggtgttaatt agctgataca 3780 aaagacaatc gcgcatacag ctgagagggt cacgtggtct aagtcttgaa ttaacgtttg 3840 agttgttctg ttcagtgaca aaggcttctg tccattccaa atcaagcagg tacacatatg 3900 aatccggtcc tgtgtttaga atcaagaaac aaagttcctt cgcgtcaaag gcttgtgtgc 3960 gagtctcttc agtgctctct ttggctttct tatgttcgat tcacacaagt attggtcttc 4020 cacaacaaag actcatccac attattacat cttctgctat aaaccttttc ttttacctct 4080 aggctcattg tcaataccaa aatacagctg cgttttgacc ttgattaggt gtgattgtga 4140 ctctctttca cttcctcgat gcacatggct acacttttct ttgcggtggt tgagatgtcg 4200 atagacataa tcactcttgg gaaaatcaag ggactgctca gcatgggtcg cctcttttgc 4260 ttgaaatatt ggagaccaat gagttagagt ttagagacat caattggtag attcatacaa 4320 tataagctta gagttttgtt tcttctttgt ttttccggtt gattggtttt aagaaatgga 4380 atcctttctc tcaaaagact ataagcatat ttagtgtcag atggcttgat gattcttcga 4440 ttttgaaacc agaaatctat tttcctgcca aatgcttctt tgttattgtt acatagtgga 4500 gtgtttaaaa cattactaaa ccaattccgt caaattttaa tagaacgaag caaaacgatt 4560 agaaccagtt gtatttttat atctttgtaa aactcagctt ctcaggatca atcttatcac 4620 tacgaatcat cattctataa aagaagatga agtcggattt ggaaagcgtt tggtaatttt 4680 tagaagtttg agagaaggta atagaagttg tattaaatag tggatatagt ggacgtttga 4740 attaagtttg tacacttctc ggattgatac atttattcac gttttgaaat tgaacacgtc 4800 tattcattaa acacgttccc aaagtcttag aaacaaatac attatcaatt caaatcccat 4860 tagaataagt tattgttcat acgttctaaa tatttaataa taaattaaac aacaaatttt 4920 ttatatctac aaaattttca tcataacata agtattttta tcacgtaaat taaattgaaa 4980 tgcatttgaa atatttagta agaattaaat atccagtttt ttaatatcac aaaaaaatat 5040 cttttatcac gtaaaaactt gaaaacatcc atgtataaaa ttatatacaa tctgtataga 5100 gatttatctc ttttgaaaaa atattaaaaa ttatatgatg taaaatatat tttaatgata 5160 acacaataca aactatatat aatgataatt atcaaatcaa taaaattcat ttctaattta 5220 tggttaagta tatattaaca aatttaatta tttattaaag ttaataaaga ctttgtaaca 5280 cagtataatt tagttttgga caatgataat tatcaaatta atattttaaa aattttatgg 5340 ttacttatat attaacaaat ctaattattc attaagaata ataaatattt tagccgctct 5400 acattttaaa gtgaaagttt agaagatgaa aaaactcact ccataaataa tattataaat 5460 tatttaaaat aaacataaat aaatgattaa atataagttt gattataaca aacaatccgc 5520 gcagggcgcg gataaaagat ctagtaatta gtaataagtt atttgtataa catgaaattg 5580 agtatttgaa acaaatattt atgttttaga tatttatatt tattaactac ataaatatgt 5640 attccaaata ctcaatttca tacttaaata tgtatgttaa atgcccagtt agatgtaaat 5700 acacattttc ccttatgtgt tgcttttttt tttaacttat gctatatccg caatggccgt 5760 atatattttt caaagttttg ctaattagta aaacttttga aatataaata aattttaaga 5820 taataattta aattaaagta atatatatat cgaattttaa tttattatat taaagttttt 5880 ggtttaaatt tccagcgttt aatttttttt tggtaaagta acagttaaaa cccattaatg 5940 gaaagtattt tcaccgcctt tgagatcttt tcctcagtat taatttccct agacgaagca 6000 attccaaaac caaaaacata ataacacata ttcattgctt ttaccaaaaa aaaaaacaca 6060 tattcattgc atgctttaat taccagaaaa cgaataaaaa tctcatttac gttccaaaaa 6120 caaagtacac acaaaaagaa cttctagaag aaaaaacgta taaacacgtg tctctataca 6180 gagtgagaac aggacaaaca aagctggaca gggttttaag taccgtataa accctcgact 6240 acgaacacaa aacagtttca aaagtaaggg taatattgtc atttagttag ccttcaaata 6300 atgttgcccc ggggatcatg gacgctttat attcagctta cacatattta tctaactgaa 6360 tcactcaaga aaataaatca cacagacgtt ttttaaggag agaaacaaac ctctctctct 6420 ctctcagatc ggagaaaaga gccatggcgg ctgcgtggaa cgggagtgag tatttcgaca 6480 tcgacgttga gaccggtaga caatcgttcg cgcggccgtc gaacgccgag actgtcgagc 6540 aagacgaaga agatctgaga tgggcagccg taggaaggtt accgtcgcag agacaaggga 6600 gccatctatc ggttctgcgt cggtcgcaaa cgtcgcaggc gcagacttct ggctacgcag 6660 acgggaacgt cgtgcagacc attgacgtta ggaagcttga tcggtctgat cgtgagatgg 6720 ttgttcgtca ggcactcgcc actagcgatc aggataatta caagctcctc tccgccatta 6780 aagaacgtct cgataggttt gtttctattt ttataggttt gttttgatta ttgatattcg 6840 atggatcttt gatataatct tggtgttgtt ttatttgtag agttggaatg gaagttccca 6900 agattgaagt ccggtttgag catttgaatg ttgaagctga tgttcaagct ggtacaagag 6960 ctttacctac tttggttaac gtatctcgtg atttcattga ggtttgtctc ctcttttttt 7020 gactatcttg ttccacacgt aaccttttgt ttctaatatt gtatctcttt gtttgtgttg 7080 ttgcagcgtc tcttaagcag cttgaggata atgaagacta gaaaacacaa gctaacaatc 7140 ttgaaagata tcagtgggat tatcaaacca ggaaggtgaa tgaaatacaa tgttttgatt 7200 attataacta tgtaacacaa acactaacag tttatatatt ttgctgttct tgaaggatga 7260 ctttgctact aggaccaccc ggttcgggga agtcgacttt acttcttgct ctcgcaggga 7320 agcttgataa aagtttgaag gttagttaat taacccgtga aattatctaa tatgctcata 7380 tatatatcac atgtttgata tctcttttgt tagtattcac atgtatcttg agattcatct 7440 ttttatttgt tataaattta tttttatttt tacagaaaac gggtaacatc acttacaatg 7500 gagagaatct tgatgagttc catgttaaaa ggacttcagc atatattagt caaacagata 7560 atcacattgc tgaactcact gttcgtgaga cacttgattt tgctgcgaga tgtcagggtg 7620 caagcgaagg atttgcaggt tagtatttac actttactat attaacttct gaaattgacg 7680 tgtcctcaag tgtttcttgt ttacattata ggttacatga aagatctaac ccgattagag 7740 aaagagaggg gtatacatcc ttcttctgaa attgatgctt tcatgaaggt cagcatcata 7800 tacctcctaa cttcctttta ctagtttata atttataagc cacaatcacc aacactttct 7860 tcaaatttgt tataggctgc ttctgtcagt ggtagtaagc atagcgtttc cacggattat 7920 gtgcttagag tgcttggtct tgatgtatgt tcagatacaa tggttggtaa tgatatgatg 7980 agaggtgttt caggaggtca aaggaaaaga gtgacaacag gtctctttca ctctctttaa 8040 acctctctat tttcacttat ccattagtct aacttataaa tcttgatgca ggggagatga 8100 ctgttggtcc aagaaagact ttgtttatgg atgaaatatc tactggtctt gatagctcaa 8160 caactttcca gattgtgaaa tgtgttagaa actttgtcca tctaatggat ggaactgttc 8220 ttatggcact tcttcagcct gcaccagaaa catttgatct ttttgacgat ttgattcttc 8280 tatcagaagg ttacatggtt tatcaaggtc ctcgagaaga tgtggtggga tttttcgagt 8340 ctctaggatt ccgtctccca ccacgtaaag gtgttgcaga ttttctccaa gaggtatcat 8400 acatcctaat ccttttcttt ggttatattc atgacaagat ctgagttttt ggaaattata 8460 aacattttta aataaattta ataaaaaaga aatatatatt ttttaatttg agaacctata 8520 ctatgtaaaa aacttcctaa aactttggag gccaaggcct ggttatattg ttacatggta 8580 gtccaaaaat atattcttat gttttataat gttgttatgc atgcaggtga cgtccaaaaa 8640 ggatcaagct cagtactggg cagatccttc taagccttac cagttcattc ctgtctcgga 8700 catagcagct gctttccgca actcgaatta cgggcatgct gcagattcaa aactggcaac 8760 accatttaat aagtcatctg cggatccttc agctttgtgc cgaacacagt ttgccatatc 8820 aggatgggag aaccttaaag tttgcttcga acgagagata ctattgatca accgtcacag 8880 gtttctttac acgtttagga catgtcaggt attataataa ctctacgtat tttgattttc 8940 attacatcta tttgttgcat aacttctatg tttctgacat ggaacatctt gtatgaaggt 9000 tgcatttgtg ggatttgtta cagccacggt gtttttgaga actagattac acccaacaaa 9060 cgaagcatat ggaaacgagt atctgtcttg tcttttcttt ggcctagtac acatgatgtt 9120 caatggtttc tctgaactgc ctctcatgat atcgcgtctc ccagttttct acaagcaaag 9180 ggataactcg tttcatccag cttggtcctg gtctattgct agctggatct tgcgtgtgcc 9240 ttactctatc cttgaagctg ttgtctggac ttgtgtcgta tactatagtg tgggacttgc 9300 tccctcagca ggcaggttgg tcatttttct agacatcctt ctttttattt tatggtttca 9360 atgtcagaaa ataaaaaaaa tctttttgtt cttttaggtt tttccgatac atgttactcc 9420 tcttctcggt gcatcaaatg gctctaggtt tgtttcgtat gctggcttct gtagcaaggg 9480 acatggtcat tgctaataca ttcggatctg catcaatctt ggcagtgttc ttgcttggag 9540 gattcgttat tccaaaaggt tggttattac tactttactt catacataat aagaattgct 9600 atactaaaac cctcgcattt tttgacagat gatattaaac cctggtggac ttggggcttt 9660 tggatatcac ctttatcata tgggcaacgt gccattgcgg tcaatgaatt cacagccacg 9720 aggtggatgc aggtgtgctc aataatctca tatctaagtt aatataatac ttaagagtat 9780 atacaaatgc ttaacaatag actttttctt gcacatcaag cagccatcag ctatatcgaa 9840 tactacaatt ggattcaact ttctcaagct acgaagtttc ccaacaaatg acaactggta 9900 ttggattgga gttggtgtac tcatttgtta tgcacttctc ttcaacaaca ttgtcactct 9960 cgccttggct taccttaacc gtgagattct ttctattatt atctaatgat catttcttgt 10020 atatatatca ctgtagcaat atattgtgaa gctttttgtc tttttttctt actcttgcag 10080 ctctaaaaaa ggctcgagca gttgttttag aagatctcaa tgaagaaacc caaactgctt 10140 cagtatcaaa tgcaagacaa ggtagaagtg agaagaaagg aatgattctt ccgttcaaac 10200 cattaacaat gactttccac aacgttaact attatgttga catgccaaag gttacattca 10260 cttcctttgt atataacagt cctaatatat ggttacataa ttatattttt tttggaatgt 10320 caggaaatgc gttctcaagg tgtaccagag actagactac aactgttatc aaacgtgagt 10380 ggagtcttct cccctggcgt tcttacagct ttggttggat caagtggtgc tggaaaaact 10440 acattgatgg atgttcttgc gggtcgaaag acgggtggat ataccgaggg agatatcaga 10500 atctctggtt accaaaaaga acaacaaaca tttgctagaa tctctggata cgttgagcaa 10560 aacgatatac attctcctca agtcacagtt gaagagtccc tttggttctc tgctaggctt 10620 cgtcttccta aagatatcag caaagaaaag aaaaaggtaa gtatgaaaaa agattaactc 10680 attttgttcc tatttaaaca gttttactag taatatgttt ttgtgtgttt gttaggaatt 10740 tgtggaggaa gttatgagac tagtggagct tgatagtcta agatatgcat tagtaggttt 10800 acctggtaca acaggactgt ctacagaaca aaggaaacgt ctaacaatag cggttgagtt 10860 agttgcaaat ccatcgataa ttttcatgga tgaaccaaca tctggacttg atgcaagagc 10920 agctgcaatt gttatgagaa ctgttaggaa cactgttgac actggtagaa cagtggtttg 10980 caccattcat caacctagta ttgacatttt cgaggctttt gacgaggttt gccctaagat 11040 ttcttgggtt acaagaaata ttatcaaccg gtgatcttaa cgtgtgttct tttttgccta 11100 cagctgcttc taatgaaacg aggaggacag gttatatatg gcgggaaatt aggtgaacac 11160 tcgcaggtta tggtagacta ctttcaggta ctttgtcttg gccttctcta catagttgct 11220 tgtcacccaa gaaaactatt atttcaaacc ctaaactttc tacagggtat taatggagtc 11280 cctggaatct caagtggcta caacccagca acatggatgc ttgaagtaac cacacctgct 11340 ttggaggaga aatatagcat ggactttgca gatttataca aaaaatctga acagtttagg 11400 taactatcac attacctaca ttttccaatc tcttttaaaa attattataa taaactgatc 11460 tttaaccatt tacagagaag tggaggcaaa catcaagcaa ctcagtgttc caccagaagg 11520 ctcagagcca ataaagttcg actcaatata ttcacaaaac caactctctc agtttctact 11580 ctgcctctgg aaacagaacc ttgtctactg gagaagtcca gaatacaatc ttgtgagact 11640 gatcttcaca acggtcgctg ctattatact cggcacggtc ttctgggaca ttggtaccaa 11700 gagaacttcc acacaagatt tggtcactat aatgggagct ctttactcgg cttgcttgtt 11760 tcttggagtt agtaatgctt catcagtaca accgatcgtt tcgatcgaaa gaacggtttt 11820 ctatagagag aaagcggcgg gaatgtatgg tccaatccca tatgcagcag ctcaagggct 11880 tgtggagata ccttacattc tcacccaaac cattctctat ggtgtcatca catacttcac 11940 cattggtttt gaaagaacgt tgagtaagtt tgttctctac ttggtgttca tgttcctcac 12000 tttcacctac ttcaccttct acggcatgat ggcggttggt ctcaccccga atcagcactt 12060 agctgctgtg atctcctctg cgttttactc tctatggaat ctcctatctg gtttcctcgt 12120 ccaaaaacct gtaagtatat tccactctat caagtgaaaa tgtagttaag atggagaaat 12180 gagtgatcag ttgtgtataa tgttgttgtt gtttcagttg attccagtgt ggtggatatg 12240 gttctattac atatgtccag tggcgtggac acttcaagga gtgatcctct cacagcttgg 12300 tgacgtggag agcatcatca aggagccaat gttccatggc acggtcaagc agtttattga 12360 acagtacttt gggtttaagc cagatatgat aggtgtatcg gctgcagttc ttgtcggatt 12420 ttgcgctctc ttcttctctg gattcgcact ttcagtcaaa ttcctcaatt tccagagaag 12480 atagaagaca agaacaaagg atattttgac tctttcttat gttagcatca ctcacgtgac 12540 aaacttttca tgtttttggc tctttctcac attttagtta gctttctttt ctattttacc 12600 actgatttag agttagtttt gttgacattg acgtaaaata aacctaaata tatatataaa 12660 gaaactgttt ttctctgttt agaaatttct ttgcttttgt aattttttgt ttagttgtta 12720 aaagccttgt ctcaaatact atatgagaaa cggctaaaaa gaatctctgt catcttactt 12780 actccacacg aaattgttta tatacaagtt taaccgatat gctaaaccta gatacacaat 12840 tttataataa aggaatgtag atatgttact ctatgattct tacatgagtc tccctaataa 12900 tactatgttt attatgcctt gctttctttg tttatctctg ctcttagaac aaacaacctt 12960 gatttgttgg gtctccttta gagggacgtc gttgtttttt ttggccaagg agactttttt 13020 ttttgaacta ccggctcaag gagacttaac acagctaaca gagtgtctat gaatagcaat 13080 gagtgtaaag tgatgtcttt gcaaatggta gcctcaagag ccctagcatc tccaatggga 13140 cacaaaaatt tactctatat ttcactctaa aatagagtaa ctctattata gagttgaatt 13200 tgcttcaata gttcactcta taatagagta actctattat agagtgaaat atagagtatt 13260 tttgtttttt tactctatat ttggagtaaa aaagcaacaa tactctatat ttcactctat 13320 tatagagtaa ctctattata gaataaacca ttggagcaaa ttcaactcta taatagagtt 13380 actctatttt aaagtgaaat atagagtaaa tttttgtgtc ccattggaga tgctctaagt 13440 ggtagcctca tttgagaata gaatatgctg tcttggtgtt tccactttgt taatatctct 13500 tgtggaggtt ttgaatatac aaatgtcaga gctgttactc ttattttatt tttaatttat 13560 tttatcattt tgttgtattg agcgaccaac ctataagagt acgattatga tttggagtct 13620 gacactcgtt ttctctcttg catcaaataa aactaggaat acaaatttga aaatactgta 13680 ttgaaagaac caaaatctct attaaaatcc aacataggac gaatgaaaat tttctaaaat 13740 tatgtaggaa cagttttacg agcaacacta atagtaatat ctttattatt atttggtcaa 13800 atgatacata ctaaagggtc aatttgtaat taaaaaaaaa gaaactaaaa agaacttcaa 13860 aatcttttta gatatatttt tagattgtgc aaaaaaaata tatttttttt agatatatca 13920 cagtcatgcg catcagaaag gcttatatat atttgggccg taaagtattg tccatcactt 13980 aaaaaagcga caactccgtg acattattgt tgtgctggga cccaaaaacg gcgtgcattt 14040 tgtcgactct ctcagtcgaa ctttttcttt tgtccccacc aacaaaaagt ttttaagacc 14100 tttatttatt gtaactaaaa acataaagaa aacgaacaaa aacttgattt gtaatgtaaa 14160 tacatttaat taaaaaaagt ttcacgagta catttaactt aaaaacaacc agaaataagt 14220 aaaaaccaaa ggactgtttt attcctaaat agagctagga agaaaggtta gttgattttg 14280 gatttgtcag aagcataaac gtagagatct ggatctgtct cgtagaagac aatatcacca 14340 gtgtcactga cgtaatgatc tttcttaata cttgccacca aactttccac caagtggatc 14400 ggtattgctc ctgacgtctt tggttctctg tagtatcttc ccaacacatg tttagctgat 14460 ttcgtctgtc gcatatcatt aattaagatc actaatttag taattaatca ccctttaatt 14520 ttaatcaaat gaaactagag agagagcgag atcactcacg gcatcaacca agtgatagtg 14580 agggatttgt gggaaaagat gatggatcac gtgagttcca atatcgtgat gaatgttgtt 14640 gaagatcccg taatctctat caatagttgt taatcctcca cgtaaataac tccattccta 14700 ttattgtaca caaaacatca ataatttaga ttaatcaaat actaatcatt gttgcttctt 14760 ataaattaat gttgatctac ttaccttgcc tctgtaccaa ggcaacttat catcgtgacc 14820 atgatgatgc aagtacgtga cagcgtccaa ccacattaca aagatctgaa atttttccaa 14880 aactttatgt caaaaacaaa ttatattagc aatgatataa taatgaaata tatgaaactt 14940 acaatgtaag gaacaccata gacttttaga actgtgactg gaccaacgag gaatgataga 15000 taaacaagag tggccaacat gatcgaccag caagtagttg aagttgcaat aagctttctc 15060 tcgcttgggg caaataaact actgtatggg ttataatgtg acccttcttt accaggactt 15120 ctgtaccact gtagtcatcc ccaaacaaat ttaatttata tttagttaat actcaaaatc 15180 taaaaattca aaattgtaat tataatcagg aagaaaaatg aggaattagg atttaccaga 15240 tagagagggt aagcgagcat ggggagaggg acagtgtatc tgagcatccg tgtactgtgg 15300 gacaaattct tgtataattt ttctggcaac tggaatgcaa aattaagatt aaaatgttaa 15360 ttaatattta acagtatggt tatatattcg aatttattca ttgcatgtgg tgtgtttata 15420 agtttttttc tttttattag ttctacgtaa actacaaaac tgaaaaatac taagaaaagt 15480 aaacgaattt cgagaagaat cattttatgc caatggctcg aatataagtg gcccgttgtt 15540 aaagttaact acagtaccat aaacaattta aatcagttgt ttactacagc taaacgacaa 15600 atctgacaag tggtcgtcca agcctcacac tggaaaaagg attgattaaa ataaatacat 15660 agaattctaa gaaaattaaa atgaaagagt ttcaaaaaaa gaaaaaaaaa taatgagagg 15720 gggattaccg gaacccaaga ctcgtcgttt tcaacatggc catggttctg gtggtgtgtc 15780 cgatggctta ttctcctgca accaccccca attataaaat aaactattat tttattttca 15840 taaaaatgaa attggaattg tcaataacat atcgttttcg aggcagatgc taagaatctc 15900 actcgtttaa ctacgttatt cattttttga gcaacaaaca aatgtatcta ggaaaatgat 15960 gcatgttcgt agatatttca agctgatgta tccatttaac aataaaataa gccattaaaa 16020 caaatatata taaatattat attaaactta tacattaatt tattcaagga catgtcatat 16080 gataatagct aattggacca taaataggcc catagcatta aataaaagtt tggttctttt 16140 ttcttcgatg ctaaagattt tgatgctttt agtcacatgc attattttac tatgaaaaat 16200 taatatattt tcagttatca gattactgtt tgctaacatg caccaagaat gacaaggaaa 16260 atgtaagaaa tacgaaaaca agaataaatt tgcatgaaaa aagaagttaa aataaatgac 16320 ttaccaacca tggtatggaa cgagaatgaa ggaatgaaga atatgaccaa ccgcagtatt 16380 cagaagagga atgtctgaga agctcccatg tccactgtat tattcaaatg aaattttaca 16440 tcataaacac atttatcatt tattgcacaa tgttaactga actttcctca attcaaacgt 16500 ttcaacaagg taacaaaaat agaatatgac gtgtcacatg actatatttc gaaaatagat 16560 tggaacaaca cacaataatt aaaagaacca ataaacagta attaaattgt tacagaaaac 16620 aataaaatgt gttttattga aaatttcaaa cgtagatcca taaaacgcgg aaacaacaat 16680 aattatagga aagaaaaaga tgtttagtta ggagtgttac gactgatgaa aaagaaccaa 16740 aaaaaaacaa aagaattaaa aatcttagat ccccttttgc ttttaaaata ggccaaattg 16800 gatgaacata ataattaaaa ttgaaaaaag taaacctgaa gagaatcaaa tcttgaagtc 16860 agtgaaaatc tcatatcgaa cgtacggtca agaaatcaaa gacaatgcaa aaaacgaaaa 16920 aaacatataa acatatcaaa attaagaagt tgaaagaaaa attaaattac cagtcgtggc 16980 cgagtacgaa gatagcccag aacagggttc cttgggcggc ccaataaaga ggccaaaaga 17040 accagctatc aaaatacacg gcggcgacgg caagagccac gacggcgaaa atgtctctgg 17100 cgacatagct catggatctc aaaggactct ttacccaaca atgcttagga atggccgccc 17160 ttatatctcc gatcttgaac ggtggttgtg cgctcggatc aaacctttcg tctccgttcg 17220 cattgctacg ctggtccata gcgacaacca tcgccggaga aagagagaga gctttgaggg 17280 atgtttctct ctctctctaa aactgtgtgg gctctgagtg aaatgtggtg aagaaagggt 17340 ctgatggact ttggggtatg tgtggtttgt ttatatagag ggagaagatg tgtagagaca 17400 ccaaactgtt ttctattttt cttaatttaa gaaacttatt tatttctttg aagaataaaa 17460 agtgtatttt tgcggtaacc tgtgcgcaat gtatctttgt tacgtcgttc atttcgatga 17520 aaactaagtt agagaaatgt gttacaaaaa aaaaggcaat gctataaaat ttccagaaga 17580 ttagaaattg cgttattaag tataaggatt ataccaaatt gcattatttt ccttagaaat 17640 aaggattata ccaaatgaat tgttaatgtt tcgtactttt actggatatt tatgcactga 17700 aatggtagtc ctttttggga cttaaacaac ttgtatgatt tttacaattt agcaaaagaa 17760 aaatacatgt agtcgaaaat atttttttta gtcttcaata tatagttttt tgctaaaatt 17820 tcctcgatta tgtattaatc ataaaaaacg atctatatcg atatcatata gacagtagat 17880 atgacaacat ttatatggat ttaaaaaaac gtattaatgt gagggaaaat agttgccaca 17940 tcactgtgat gtatttgact taagaaacag acttccatca gtttatttat ttgagacgac 18000 ttgattaaat tggcagtcta tacaatagta caatgtatag gtaactttaa ttttatcaaa 18060 aaatttgtgt aaccaatcaa atttaatatt agttatattt tatagttggt tgaataattt 18120 ttaatttata attttaataa tatattttag ataaaaaata ttttttaata aacgtgtttt 18180 atctatagaa tatcttatat ttagaaacgg agagagtata acatatgtat atgagaatca 18240 gttggattta acaaattcac tagatccgga aataacacca ccaaaataga acaagatcaa 18300 aacatgatgt agggtctgaa tgaattgctt aaaaatggta taatattcca attatgttta 18360 ttagtactta taaaattagt gatcggttta actttttaac atataactaa ctttgactgc 18420 tgaatatggt gtcttgatca aaaaagacat ttgtggttag tcaatgagac atcatatttt 18480 agaaatgcag gcaagatggc gtttcctcta cctctttttc tctcttaaat caatttccca 18540 acacgtcttt acgagttaag catcaactaa ttgctacaat tgtatacaga tttgacctac 18600 ttgcctccat taactacatt tcaggctata tgttagtgta tatgtaggca ttaattataa 18660 atacgcattt caactgagct tcaatgcata tattcaaatt ttttgttgga atgatttccc 18720 catctttaag aatcgggtag tgaagactga ggacgtgaac cgtgggttta ctgttttatt 18780 aactctacct atatcagttt ttaatattca attttatatg agaaatcgat taatattact 18840 ataatacaaa cattgttttc ctccgttata ttatggtttt tgtcactgaa tttgaacatg 18900 atttgagaca gagaccaaac aatatatgac gtctgtatac ttaatcaaaa tatgagaaga 18960 ttatatgcac tctatcttta aacgtgagat ctccaaaact gtcataaaaa cgtgaactcg 19020 tttcttcttc caataacaaa tatcaatatt gttcatccaa ttccttcctc cataaaaacg 19080 tgaacacctt tcttcttcca atcgtaatat catgtgttgt tcatccagtt ccttcctcca 19140 caagctttct atcgaacgga acagtctgaa accgtgttaa acaaatcacc ctggaagatg 19200 taatccagct tctgtgagag ttttgaagaa ggaagatctc tttttgtaac gcaaacattt 19260 aattttcctc atatgtgatt cgatgatgtt tgataattaa aaatgtgatg gccttaatga 19320 ataatcttgg tcatgttttt agtaaccact atttcttcta gcagtcatca aaacaatttt 19380 tttttataat gttgatttat tatgatatta attatgaaaa atattacata gacgattcga 19440 caaccgacaa tactacatgt cttatgagga tctacttcta actgtattat ctgagccgtc 19500 ctacgaatat ccactcctga ctagatttac ttgcaccatg ttgaagattc cttgtaagtt 19560 tttcttctgt agtctgcatt aataaatcgt tatattcgga acttgaaaca tggatttcct 19620 gtaatctgca aataattgca tagtctggga ctcgaactcc aaacctgact gtataagtct 19680 ttaaacctta actaataggc tatggtgctt ccacgatcat caaaacagtt taccacatga 19740 gattatatat gacgttggat aacatgtatg attaatttat taaagactca ttaataaaaa 19800 tttaactgta gttttttttt tgaataaaca tagtttcctc gatctcaaag aatctacaat 19860 ttaaaattca aatgtttctc taaaaaatga agtaattcca caatataatt gagtttactc 19920 aaatcgtaat tcattgttag agtgaaaata aagtaataaa taaaaaatac ttttttattt 19980 gaaatgccat tttaaagtaa attacgaagt tggatggaaa atattttaat tactcaaaat 20040 tttataacta tatatctagg tgagccatgg aaaaggaaag gtacaaaatg atgagtgtgg 20100 gcgtagacat gaagcctgca cgtgagagtt gtagctattc gacaaacata tactaatttg 20160 ttgcgtacca tttccacttt atatatattt atatatttgt gtgtgttgag ctgagatatg 20220 agaataaaaa ttgagaatat acctcaaaaa tgcaaagaga agtatgtgtt tgttatttag 20280 cagacgcaca tggtggagga catcctcgtg agttccgaag ggctaagtta tacagcttta 20340 accgagctaa ttaattcatc gtccttacat aatttgagca ctatttgaag aagacagagt 20400 atatatacat attagttaat acagttatat atgatccaat tttctttgtt tgacaacaat 20460 gtgttttcaa acaaagaccc tgtaactttt tttgacccgg ttctgatata tgtatgtgaa 20520 tatgtgattc atatatttct ctaactacga gtacgactaa atgtgcttat caattatcat 20580 acacgtctct acgtgcttct ctatcttata ttcttggtat taaccattcg tattttatga 20640 acattcgtgt acgttgaaag gaatcattac gtagatgccc acgatgttac ccaagttgga 20700 gaattatgtt atttagaaaa cccattttta attacgctaa ttaccaaaaa taatatgaag 20760 aatggggccg tgggaatatg ctttcggtag gttttgcgtt ctaaatttac atagcatagg 20820 cagtcaacag ataagaggtt aaatgtatat tagaccgaaa tatttttaac gtgttggggg 20880 gtgggggggg 20890 <210> 2 <211> 105998 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 2 acaactaata ctatatctat tcaacaaaaa aaaaaaaact acccaataaa aaacatttca 60 attgcaataa tgaagataat gatatgactt cagaacaaca tcgtcccatc ttaaacccaa 120 tatgatgtca tctttagatg ataaaatatt ttgattttta tttttagcct tttattagaa 180 agaaaattaa ctgtaataaa ttatacaaat tgaaaaatat ccttacaatt ttattaagct 240 tcaatcagac attaaatttt ttgtggttac aaatttttgc agattatttc aaggaacatg 300 caaaatattc atcaactaat aaattattta aacaaacata ttaactcatc tattatatta 360 aattaggaac atgatctatt aatatatgtt ttgtgctact attttgatat aattattaaa 420 acattttact aatcacttaa aaaaatattt tacaaaaata taattataaa aaaacaccaa 480 tacgattaaa cacacaaata gaaaaattag tttaaaaaat gtaaaacaga aaatataccc 540 gctctttgaa gagcgggtca gaatctagtt cagtgataaa ttagaatatg ttacttttga 600 cgttaaaaca aacagaatat tttttgaaca ctagaatatt tgaatatgtt aattggtatt 660 gatgtttttt tgaaaaaata aaaaaaataa aaattaactc tgtgcttttc tacagtaata 720 gaatcgatgc ctcgagtcga gatacaacca tctggtgcac taaaacttgg gaccattaag 780 ataagaacca agcaaattgc atattacatt atatatatat ataaatatat atatatatat 840 gtatataaaa attacacaga agttgtcact attaattaaa gatatctttg tcaatatttt 900 aatggtgaca tcaataattc tttttttggg ttcttcatcc agctgccagt attcaaaaaa 960 aaaaatctct gaaaatattt cattgattag aaagaaatat acatcagcaa aattagcata 1020 tcaacaaaag aataatcaag gctaatggaa cataacatca aaacaaagaa ctagctaaaa 1080 cagaggagga tctctcattg tcaaaaagat aagagtgccc agaaggatgg ctgagagcaa 1140 cataagatcg cattcggttt tgaaaaatca catgttgaac gatgagatga gcttctctgt 1200 tagcagtatg atgttcgcat acaaccttcc attgatccaa attttccaaa aggagattaa 1260 gctccaccac tttgaagcta aaggatgacc acgctcttgg tctattaatt gcacccacta 1320 aggttcttcc catctaagtc aaaccaaacc ttcaaaagct tatgactaaa tactttcaat 1380 atatagtcca cacaggagag atgaaatgag cttcattttc cgaacccacg gacctgaaag 1440 cccctcggct atgcatagac aagtcaagat attatcggca tcatgccatc ttttgcatac 1500 cacacgtcgg caacaaaata tttccaaata aacatattta agcacaataa ttacatcttt 1560 ttggttaata acgagaatct gttgatagta tggttgaatt agaataaatc ttgcttttct 1620 tcttacattt tctcaccaaa attcaacatg cacgcataaa gtgtgtaaac tgtttagtat 1680 aaaatttcac gcgaagttcg tgtgaaattg gaaaacagac ctaactctgt cttaattctt 1740 gcaaatgcag cttgattttg aagctaaatc ctttaacttg tggttaacgt tgattaccaa 1800 aaaaaacatg tggttaacgt gtaaattaac aacccattta gtggtgaacc taactcagcc 1860 atgtcgcttt ataattaggt caatattaat tacagaactt caattcactt ggttcactta 1920 cctttgattt tccttgttcc acgactcttt ttttttgttt tttttttcat acaagaaact 1980 cagatggcac atttttaaag aagagttgaa aggaaaatga acaagcataa atttggtttt 2040 tttcaaccga agaacattat aagtcaagtt ttgaattatc attaacatgt ttcttattat 2100 ggaatagcca tacacattcg gagttcggtc atatgtatca tacatgcgtg ggaacaagaa 2160 tattcgtaga caactaattt taaaaatgtg acgtaaatgt caaactatta gggtatgaat 2220 ggtgaccaag gaatgacgag gaacaaatgc attccctaac attccttaca aaaatcacca 2280 ttcataagga ataatttttc cttctcattc cctaccattc ctttttatgt agagaaataa 2340 agaacaaatt aattccttgt taaatatgag atggaacaac cattcccttt cattcctgca 2400 attttattcc tctacattcc tttcctattc gttcctcttg tttccagaat ggttaccagt 2460 cggaccctta gaaaaaatct tacgatattt tttattgaaa gatgacgttt cttttttctg 2520 gagcatgaat attcatatat ctataggact cctgttgaca attaaaaact atcttaggcc 2580 ggggtatttt gatcggattt aagtctatgt atttttattt ataccaatgg gccgggttac 2640 cgtttaagtt taggacaatt tattaaaaat aatccaaaat ttgaaaaatg aaaatctata 2700 catgaaattc aatcaaaagt aaaattaatc taaaataata gtgcaattac aactattttt 2760 atgactaaaa atatataaag acttttaaaa ttatagtctt gaaaattttg cacgggacaa 2820 tgaaatcttc tgagaagtct agttataaat ctaattataa ttactttata aatttttgag 2880 aaaaaaatac tttgattgga aataaattga aatcatgtga atataaaaaa ttctaaataa 2940 tgtaaattga aagttaataa gaataaataa ttatgataca tataagtgaa tatatattgt 3000 aagtcattat tgtccattgg ttagaatttt tgttacatat tcaagtaata tttatatagt 3060 tatattttgg attcttaaat attttttgaa attaaaattt tgcatataag tgttaaattt 3120 tgtgtatatt aaacatttta caaattgatt ttattttaat aaagaggtat ttctagttat 3180 ttcaattatt tgattttagg ctctaaggat aagagacttc gtaaagaatt cggctaagtt 3240 attttgtttc ctatccgttt tgatttttta aatctctttg ttgtgaaatc tgttattaaa 3300 tatagcataa tttaaaaata attgtaaata taaaacaagt aacaagtatg aaaaaattgc 3360 tacctggcta tatattactc gaagacatta ttattgctat gaaaagtaaa taatattcat 3420 atatagaaac atccatgttt ttgctcatta ttatcttctg taatgtgcac aaatattact 3480 tttagagtga ttcctgtact cttatagtag agtaaacaaa aaaaatcata tttttttaat 3540 agtattattt aacaaataat tttcaaaaac tctatatact tctaaataac tgacaagtat 3600 ttacaaagca agtaacagaa catgacataa tgtacaagta aatcattatt aagcaagtgc 3660 ttgaaataac aaatgattgt ttttaacaaa caaaatacaa atcaaaattt tgatgactcg 3720 tgtaaaacaa gtcaaatatc aaatcaacac aataattagg tttggttttc tccagagcat 3780 gacacctcag attttaaaat agatgtggga ttgacatgtc atcaaatgaa aaaagttgag 3840 taaccaatct aattattttg tacgtccaca tcagtttcgc tcagccgtaa tgagaaaaaa 3900 aaattacgaa gattacttta cctatctctt ctcctctgtc tctcctcttg ctctgtttcc 3960 tcctctcctt actcaatttt tttcagacgt gggctggtca aaccccaacc cttgcaaatg 4020 ggacaccgtc caatgagacg ggaacagctg cgtcacgagg aaccagctca gacagaaggg 4080 gatccgcagc actctccctc cggatctcca taaactctcc gagcttgtcg tcctcgagac 4140 tcacgtcaga cggtcagaga agacagagca gcggcgtcgg agaagacaga gcagcggggt 4200 cggagccgag ctcgtcgtcc tcgagactca cgagtcagac gtcggagaaa acagagcagc 4260 ggggtcggag ccgagctcgt cgtcctcgag actcatcaga cagacgtcgg agaagacagt 4320 gcagcggcgt cggcgaagaa aaagagcagt ggcgtggtcg gcgaagaaga gcagcagcgt 4380 cggagatggt actgaagcgg ggctgattga cggcgtaggt tgaagaagag ctttgtttga 4440 cagctgaatt aggtttaatc aattggttta gttaataaac caatttgtaa ttgtaaccaa 4500 tttttaattg taaaccatgt atccaaattt cgtatcgtaa agaaatacca atttataatc 4560 cgatttagtt acaaataaac ttttatttta tgtttttttt aaaataatta aaagaagtaa 4620 atactataaa attaataatt ttaaaataaa taataacaaa aaaaatgata ttaaataata 4680 tttaatggca gacaaaaaag agaattacac tatgatatca ctaaaaaaag tttctgtcac 4740 aaataaaaaa tatagactct aaagattgaa atgatcaaaa tgtttcatta aagagttaaa 4800 tatacattta tatctctagg gttaactaat tcaaatttta gagtttaaag ttaaaagtgg 4860 agatttgaga ttgagattta aaattttata aaacaaaaaa taaatattaa aaataaaaaa 4920 tttaaaaata gtttcaaaaa ttattttcga attacaaaaa gaaaatttca aaaaaaaatt 4980 aataaaaaaa ttcgaatttg aaaacatata atctaaaact ataacaaaat ttttttttaa 5040 atttttttaa tttattttaa ttttattttt tatatatcta tggtgttagg gtccttttac 5100 ctattaaata aaatattttg gtcattttct tccttgtggt ctatttttgt gaccaaaaat 5160 tgaaaatgat ctttttagaa gaattgctct acaaaaaatg ctatattaat cataaaaaat 5220 taatcataaa aagtaatgct tatcattata ggataaattt ttataatatc tattagtgtg 5280 tatgcttttt gaaattgttt aagcaaattt gatacactat caagagctgc agaaattaca 5340 ttatcaaatt agattaatac taattctgta aaaatacaaa atttatataa tatctttgtc 5400 cgcggcgtag cgcgggtatt aacctagtat aagtaaaata gcaaatatca ggtctgtgtg 5460 tgttcccata ttagatggtt ggtccatctg actttgaaag gtactggatt tgattttgat 5520 acccagatgg cgatgtttta aaataattga attattaatc tagttcctaa taattaatat 5580 acgaaatttt gttattcagc taataattaa tcaagtttct ggaagatttt ctttcgggaa 5640 gattgcacat aatgactttc actattaaaa actcgtttca tagctagaac attttttata 5700 tattttgtac ttttattcat ggctgattta caacatgttt tctatatatt ttgaaaacta 5760 acttttatag caaattacta actagtttat tatttctttt tccaaatata ttgagaaaat 5820 ttgatcaaaa tgtaaactag ttttccagaa tcatatataa catcggaaat atatcagaat 5880 atatatagtg ttacaaattt aattataaat tttcaaaaac taattagtct ttctatggga 5940 atagaaaaac agacaagtcc caaaggtttt tttttttgac aaagggttaa gtcccaaagt 6000 tacgatgata aataatgtta caaatgtgtc accaaatttg tgagaaacat tgctaaggca 6060 tcagcagtct accaattatc aaacgcatga aaactattct catgatctta aaaatggcga 6120 acaaaatgaa ctcaacaaga ttttgattgt ggcctgaaac gatcagcttt tatgatactc 6180 ttataatatc acaagatttt gattgtgggt gatcgtactg atctaatatt agttttatca 6240 agtttgcaga acttttctta tcgatttcgc tattgagttt acacttacct gctgtatagt 6300 attcacatcg ccgagaaggt aaataaacag tactcttatg tttttttgtt tttttggtaa 6360 aatcagtact ctatgttgca aaaatgtgcg actgattcat gtttggcttt acatttttgc 6420 ttcggtagaa atcagaaagc aagtgaatag taaaaaatgg ttcgtatcaa gttggtgtaa 6480 aattttgtga ttgattgaac aatttaattc tgtcgagttc acattgctgc tagcctggta 6540 caaactctcc aataatttaa agaaacgtaa atggactgga catatgcatg cacacggttg 6600 ggaattattt aagaaaatgt aactcaacaa ccaaatcttg taagtgtcct gtcatttggt 6660 ggggtccatc cgtaccatct cttaaaataa aactcaaagt acatgcatgt aaaagtggat 6720 cggaataatt gcactcccaa aacaaacaaa ggctactaga aaatatatgc aaaaataaaa 6780 gaacagaaag aagaaaaagt gagattgcgt gtgtaaaaag taaagtagcc agaaaaaaaa 6840 gaagaaaaaa gtacaaaagc gtccctttga tagatgtatt gtgttcaaag ttctgtatga 6900 tgtttctatg aaatttctag atttgatacc ataatcaata tactcggatc cgatagacct 6960 cataggaagg ttctctgaac actttaacaa ctagtataag aaatagagtt caatacaaaa 7020 tattaaatta caaataaggt ttattgttta gtttcgtttt agacattcgt atctaattat 7080 aatttatagt ctttggtaga ttgatcaggt taaaaggcct acatgtgaca aatcagcatc 7140 atgcattaat gggttcccaa tttttgcgat ccagtttagt aaaagtcaga ttaaagccaa 7200 tgccactatc accccaagaa taccatcatg ggtcctgtca actaatgtga cacatgaccg 7260 aacctgaatc gttatttgtc ccattgtaat aattcacaat ctagagggct tatccatacc 7320 atatctaagc cggtcttgtc gcttcattcc atttttacca ttttactgac taattataag 7380 agttctatct accccctaat ttttttttta aattgatcat ttattaggcc gattgtaacg 7440 ttatgaacat tccaacccgg tccatcctga tctgatcaga tagctaggtg tcggtcatat 7500 cacaactagt gcttggttgt ggatcaaacc cgacaaccca cagattgagt gatttttttt 7560 attcaagaaa tttgacttgt ttaacccgca acaagaaaat ataaaatcta catccgtccg 7620 cttaaacttg cggatgaccc acaagtaatt ttaataataa taaaattgtt attttaaata 7680 ttttttaaaa taataacaaa aatcaattta taattaaaat taaatatttt ttattaataa 7740 tattttcttc ctaatttttt gtggttcaat ttcggctgac ccgcataaaa aactcttgac 7800 ccttacccgc atccgccaat caactttttt tcaaatcact cgaccgcaac aaccacgcgg 7860 cggatccaac agggcagaac ccgccaataa tgactcaaat atctctagcc caatattgat 7920 cggatgatcc ggttttgaag ttcttataga actgcaatac actaatctaa tgtaacacgc 7980 cttgtttaat aaaaaagaca caatccaatg catacatttt gaaaaatcaa aacaaaggga 8040 tattctttcc acataacgaa tcccaaaaca accccagaac ctctcatatg tgtcacatgt 8100 gatactcttg tgacactaac atataaactc gacacgactc agaaagtgaa catgatgaca 8160 ctgacagaac atgtatcaat ttcaagaaaa agaaaagaaa gccaagttat gcgatggatt 8220 taaaacatat caggctgtaa attaactagc ctcgtgtgtt tgttgtatca atgcatgcat 8280 cttacgcaga gggcacagac tcgtcggttt tcttttcttc aacagctttc tctgcctctg 8340 ctgatgctac cttctcgact ggtttctctt ccttcttctc ctcggtgtcc ttctcttcca 8400 ctgtcaactt ctcaagaaga ccagcagtat cagaagcctc tttactctct tctttctctt 8460 cttcagaatc ggtaacttcc ttgaactttt gcataaatgc tttgcagtct gataacggta 8520 ttgtaaacaa gacttgatta tttatacaag gtagaaagat ttttaaaaac acaaacaata 8580 aatcacatga aacagtttcc aatactacac gtctactaca ccagctcatt cccaagctac 8640 actgagacag ccaatataaa cactagagct ttcgactgct tttagtctat ccagatcata 8700 cacttgaacc tacacaaatg tccagatacc tctagttgga ttgccacctt taaaaggcta 8760 ccattaagta aacaaccatg atacccttca acaattactg attagtgcaa agggaaaata 8820 actcaaaaac aagtaaaaac tctaaaatgg gtgatactat aagcttgtag aactgaacat 8880 ccaaaacttg tgaccatatg caaatatcac caagttcaag atcctccagt gacctaagcc 8940 ataaatttac attatctaca ctctagaccc cggaaaaaaa ggattagtca tgctcttaag 9000 gtttaagcta ctataagtat gccacacata cacaagggaa aaatccagac tcactctcaa 9060 ctgacgcaaa gtggattaaa aaaaggttta agctttgggg aacatcctaa agatttaagc 9120 tactataaac tatgctacaa tgagaacagt gctaccacaa gcaacaatga gatccaaaca 9180 cacacaatga gactgattcg aactcactct caaccgaagc aaaccggata cagaaaagct 9240 catccttcaa ctccccatcg gagaaatcac gagcgtgcca cacacaagac ttatcattcc 9300 cagcgtgttc ctgaacactc atccccgacg taactgcaca taaggagaag aatcaaacaa 9360 tgagaataac acaaacacag atccatcatt aaaaaatagt cacgatcggt accgagatga 9420 ttagcacaga tcttgagagt tttggactgc ctcataacga gacggatctt cccagactcc 9480 ttatgcttca agaacttgac cgtaccagcg cctctctcct tccactgact cccatcttta 9540 tcgaacctat acagcttcga tttcctaaca gattcgcaaa aaaaaacaat aatcaacaac 9600 cacgatcaga tctagaaccg atctagtagg aggagtagag tttacagatc gaggattgcg 9660 tcttcgtttt cttcgccggt agtgacggcg acttcttcga gtttgatgat gggagcgacc 9720 tgagcgccgg tgtcttcgtc ctcgttggct ccggactctt cttcgtctct gtgctcgcgc 9780 tccggctcgt tgctgatgct cgccatctta tcagatcaga tcgaagcttt gctggttgtt 9840 gttgttggat tacagagtgg gcgtaggagc tagctagatt ggaggagaga atgttgggag 9900 agtttctgtt gacggaaaat gatttgtttt tttataagag agagagacgg cgctttgttg 9960 gaaatggatc tttgatttaa atgggcctac gtcacgttta ttccggagag ctgaatatgg 10020 tggactgtac tggatccatt ctggaaagct gagtatgcag agctcaaatt gaattaattt 10080 gattaggggg catatgcatt tgtcttttca aatcggaatt tgagttagtt cttatcaaag 10140 aaagttcaag aaatctgtaa gagatagttc tgcgtttctt aagaaattat tgattatgta 10200 aattagaccg atttttttaa tatttaaacc atttttttag gaaaaaatgt ttcgtttaaa 10260 tactgcttag gcggacgtcc aactgttgcg aacataattt tttagaaaac tggttcttat 10320 catatatgat tttcagatag aaacgttttg aatacattcc atggaatttc cgattggttg 10380 tactcaggtt tcaaatcagt tccaattttt tttatacatg taaatatttg aaaaacatat 10440 tagtcctttt tcttggatac tttgggaaat tctttaaatt tatcttgtta caattatttt 10500 gttacaacta gatcataaat aaaaataatc atgagtatac ggattttggg actgaatgtt 10560 tcaaacaaaa aaaatttaga ttaatatttg ttcacaaaat ttcaaacaca agactaaact 10620 tgacattttt tttcctaacc gaatccagtt aaaccagtat gctaaagtca aatatgacac 10680 aacaagaaca tcatgtgtcg aaagattcag gtagtccagt ttaaaactaa gataatatat 10740 ttcatgaaga tagtgtttca aaaggggaaa acaaaagaaa aagtcgctag gaaagttgaa 10800 aatgtccaaa atgttccaaa cccaaattga gaaaaaacca catccacatt ccctcagata 10860 gaccaccaaa ccagcctgag aaaaacgatt cttttgaaag aagactttaa ttcagtaaag 10920 gaaacagcga aacatatcat tccagaacgg tgacttgttc ccactctcca tcaacagcct 10980 ctttccacac cgtcacgttg ttgttcccat cggacacggc caacatgtta cctgtcaacg 11040 accacgacac ccgccacact ggagtcataa agtccttcag aatcttacct tcccattgct 11100 caccttcttt ccccacagtc catatgatca ctttcccatc ctgtgagcca ctggctatgg 11160 tggacttagg gagacccaag ttcggtgccc aagccacatc acgaacccaa tcagtatgct 11220 tctgaagagc cggaaagcaa tccatcttcc acgacccgtt tgagagcttc cacactttca 11280 cagtattatc acacccaccg gaagccagct tgtaaaccgg atcaagcaag ccagagctga 11340 caagagcacc aggggaagtg gcaggtgccc atgagacaga agtgactcca acaggatgcg 11400 cttggtcaat cttcgtcgtg tcccagccac catcagcacg gcctgtgaat accgaaatgt 11460 ttccgtcgga tgacccacaa gccaaggata gtccgaggtc atgaggagcc caagcgatgg 11520 agttgacaga agatttatgg tccgtgaaga catgagcttg ggtccactgg ttttggctgc 11580 cttctttcca gagtatgacc tgaccgtcat aggagcatga agcaaggaat gatccaaact 11640 tagggtgggc ccacgcgacc tgccagacag gaccacggtg gccggttaat gtagctaggt 11700 gctgggatcc accgttgttg ctgactccgg ttatcttgat ggtgcagtca gatgaggcag 11760 ttgcaactct ctttccgtag tagtccattt gcacatcatg gaccatgtct tcatgacctg 11820 tttcgatctt ctgacccggc atgtttccgg attgactttc tctgcttctt aaaagaaaac 11880 acagcgaaac agctcgtaaa cacacagttc aatttcaatg aagtataata acattttaca 11940 cgttgaggat gttcgcttaa ccacgtgttc tcataggctc acacatgtaa tcaagaaaga 12000 ttatataata tgattatgaa cagaatgaag tttcagtcag agaccactaa caatgtacca 12060 ttcaatcctc agagatcaat ttcaacctca actaagaaaa ttacgattga tcaaacgtca 12120 caggggccaa ttgcacaata ctgtataaga gattaacaat agatccgagt agtaaatcct 12180 cagaacgaaa ctctagccgc agatcgactc gattcaaaca caaagatcta agctaagatc 12240 tcgaatccaa agcagaatca aatcgattca aatgttgaga gatagctgta gaaatgagat 12300 tcaattagac ggatcacgag gtcagagtca cgatacaaac cagatcaaac gaagattaat 12360 cacgctgaca aaatcaatca cagattcgaa cagaaaccta gcttagattt accgagacag 12420 cgcagaaaat cgagaaaacg aaattcgcag aagtagctca gggaagagat agcgtacctg 12480 aaggagcggt cggtcgacta agagacgccg gagtgtgagt tggagaagaa gatcgacaga 12540 gaagaaaacg ctagggggaa gcgatggata gtttttttct gtttctaaag aaaaagaaaa 12600 atagatctaa cagagtgatc taaaccgtag tccagactct aaaccgggtg ggtagactag 12660 agatatttta ttataaagcg gttatcagcg cagcttaatt atctaactat tttcttctcg 12720 accttggttt gacccttttt tggttctaga gtttgtataa accgatctca aaactaatta 12780 cagagtaatc taaaccgtgg ccatccagat taaaccggac gttcaaatag atgagagtca 12840 actcccatgt tttttttctg aacctttttg gctatttttt tcttttcttt tttttaatca 12900 tctgattata gatgaaatac agagctaacg gaacatacga agcccccgaa tcaaaagcct 12960 aaaacaaggc agcatagagt ttcatttcta cggaatttct atagcataat gcgtttagtc 13020 aattgttttt ttcttttttt gctaaaagta gtcaattgtt agtctcattt aacaaaaatc 13080 atatcttata ttctcacgga tctatattgt aactcttaag tatcatcaat gaatttgatc 13140 tcttctacgt tactttggtt gatgtgcact tgcaatatag tagtattata taggttaata 13200 cgttgtcgtc aacttccact gtttaccatg ttcttgttca tggaaacgca caaaccattc 13260 gattcgcctt tcggaaagtc cccatataag tgattcctcg ctgaatgatc tcgttggggc 13320 caacctaaaa gtgcattttg tttactccct agcagtcaaa catttcattc ctgagttcaa 13380 caaaatccag taaattcaat gttttaattg tttggcattc ccgaagaatt ttcccaaatt 13440 gtattatcat tggacattgg ctctcttatt aaatactact atgggtcaaa ccttcattca 13500 actacgaagc tttctcacgt ttacatgctt ctttttttat atatggataa cctacaaaag 13560 agtcgtaaaa tgaaaagggt tgctggactg cactacccta cccacctagg tattggctaa 13620 gttggccaag tatacataat atgtaaatgt attaaacata aactacaata caaatatgat 13680 caactcgtaa agaaatcaaa tatttaatat cgatgcaaaa atatataata ttggaatttt 13740 aagtacaatt atccactaaa aagcaaagaa agtgttgcac aaaaataaaa tagaaaatga 13800 aaaaaggata tgcgatgaag agagtggaat actctaaaag gtagcgtata atctatgttg 13860 atacctttct ccaaattgaa aacttgtgga gttgtggcaa tccaacattg cccaccactt 13920 catagtcata ttccatttgc tcctccttat ttctttgttt attgtctggt ttttaaacat 13980 tgatcaacgt ttatagttca cagactatgc gacctaacaa gtttatctac accaacacca 14040 aaattaaaga gaggctggca atttcaggtt ggcccctaat cacttacttt agtaggccta 14100 actacactac ttgcatggtc ttagttcgtc tctaacgacc ttcaatatat aataaaaata 14160 ataatacttg gtcaagaagc taccactacc aaatcaagat gggattgtgt aaacgagagt 14220 tatcaacaaa aagaggcaac agttgagagt taggacgctc atcacaccac gtaaaagagc 14280 tttcaagaaa tagatagacc gatccgaatc acatgcatta ccgaataaaa agttaaggct 14340 gagaatgaaa gagatttttt ctcgcaactt cttcttatta ttatattcat gatgataaca 14400 aaaatatata acacgaataa taatgctgta aaacttgaca tatatctgaa tattctctac 14460 cacaagtaac agcaatagtt cacacgtcat cgccgacgtg gattcttcat ttcccggcgg 14520 tctaacggac gtgttcaatt ccgattctac ccttgctgaa actagatatt ccccttgtgc 14580 ccctgactct tcgaaagcat tggctctcac ctcaatccaa ccgtttgatt cccattttgc 14640 ccctccggtc gtcgctaatt tactcatcct tgccatcgcc gaaaccgtag actcaactct 14700 agctacatcg ctcacttcat cttcttcgaa atccgagttg acccagtcca atacgcaacg 14760 cggagacgac tcggtgacaa acgagtgatg atcttgacac agaaacggat gctccagaag 14820 ctggccgcag ctccatctct gactccgatc tcgtctcaag catttgtcca agaaatcgcg 14880 accgagctcc gaaactcccg ccggaataaa cggcagctcg tttgaatacc cgatccgact 14940 cagcgagtcg aatccgttat cttcccacgc tggctttctg gtgagcatct cgatgacggt 15000 gcaaccgaga gaccacacgt cactctccgg cccttgatac tctctcctta tcacttccgg 15060 agccatccaa agcggacttc cacgcggcgc aatcccagcc gtcggttttt taaattccat 15120 cgccgatccg aagtccgcca gcttaacgga gcttccgccg ttaacgacca gaacgttctt 15180 cgatttaacg tcgcagtgaa cgattccgtt agagtgaacg tgaccgagag cggagacgag 15240 acaccatacg taacggcgta tgagagtttc gtcaactacg gttccaccgt ttgacaggtc 15300 accttccggt aaatattcca aatggagatt cctgaacgac gtcgttcctt ctttggacac 15360 gtcatcgccg aggaacctca cgatgtgtgg gtgggacttg agagagcgga ggattgtgat 15420 ttcgttctcg agggactcgg attgagaagg aagacacgtg gcgagatcta ctgacttaac 15480 ggcgaaaact ccaccgtcga tcttactcac ggctttggtt accgttccaa agcatcctct 15540 cccgatacaa gaacctcgaa tccaaggaga tgaagaagtg tttgtgatgc tctgtttctc 15600 catgtgtttt tgtttgctaa ctaactttgg tgtgtaaaat tatgaagtac acacgacggt 15660 atataactat atatacgtgt gcgaaagtgt caaatgtgaa gcacaaataa agttgggagt 15720 tttattaatt tccgacgtgg acgtttcttt tctacttgtc tttctgacat ttgaaatcgt 15780 gaagccattt taagccattt taaaatacaa taaaaagttt cccacttggg aattcagaac 15840 taactctcga attattgatt ataatatttt aaaattagac aaatggataa ttgggagaac 15900 ggtttgatga agtcagttcg acacttggtg atgttcttgg gatgttctgt aagaaaaccg 15960 agtactttcc atattatcct tatccataat aagattcaag ttgcggtttg atcaggtccg 16020 ttgatctgtt acctcttaga cactgttatt ttatttgagt gtcatataga aaaggtaaca 16080 tatatctttg taaaacgcaa cttcatttta aatcatttat ttactaagaa cagaggaaat 16140 attattttga tttactatta ttttataaat gcaccatttt tatgaatttt tataaaattt 16200 tatatgctga atatgtaaga tgttttcata ttttatatgt aacttttaat tttataaaaa 16260 aatgtaagat tagtgatatt ttataatcta tttataatta gttaaataat ttaaatttaa 16320 attttaataa ttatttttat ataaaaatat atatttttaa tagttgttca ttgacgtaaa 16380 atttcatata ttttagaaca aatggaatgt acaattaagt gtttaaattg ttatttttta 16440 tgttttaata gtttttagta ttaatttgta cctttaaatt tgatatacga gtttaatggg 16500 tattgggtac cctttgataa ttatcatgtt cttttttgtg acaagataat tatcatgttt 16560 aagtatcact aggttttgac ccgtgcgccc gcacgggtgt atattttgca taattatata 16620 tttttgttag ttgtagactt gtaagttaat gttttgttat tgagttctta tatatagtgt 16680 atcttgttca ttttgcttgg tgatgaattt taaactatta gttgtattta ttttcaattg 16740 tacttttttt tacctttact tggtaaatta aacaattaag tgtaaaatat tggaatattt 16800 tgtttagatt aggtgtgttt tattaaatta tactataaaa tttttgtgat ttttagagat 16860 aagcattact tggttgacaa gttttttgaa agataattat gtgattgcgt tagttatttg 16920 atcctttttt aaatgctgac tgcgtacaat taagaaacaa tattctttgt tgatttgtct 16980 tttaataatc ataaatttat gagtcgtttt tggaatattt tctcatatgg aagaaaataa 17040 gtttaattag gtacgatttt atatgtaaaa tcttaactaa tatgatattt aaggagcata 17100 ctatacgcat atacaaagta taccaaattg ataaacaata aaaaatattt gactttagga 17160 accaaaatct aaaccataaa acaaccaaac cgtaccttta ttatagaatt aatatactaa 17220 atgttggtat gcatagtcat aaagaatatt attctctgtt tatatcatgc atatgtaata 17280 gaaaacgtga atataatggt atatatacgt tttgatatga aagatatttt gtaaatatat 17340 gttcaatcga ttggtttgca acgggttaac agattttgaa acatttggtt attgattttt 17400 tgtgttcggt tgataaaatt ctaaatttag cattgatctg ggcaattaac aatttctaag 17460 cccaaagcaa tgttatgggt gggtaagaaa gacgaaaagg caaaaatatt tcaaaaaaaa 17520 agaagtaaaa tgacagaatt tgatggcagt ggcatagaga tgtaattttt gtgcaactct 17580 aaggggtaat tactgtttgt acttctgctt taatagttta gatgtttact ttacaaatgt 17640 catacttaca aaaatattaa aatggataag tcaacggctc ttgtttttat gctatctcat 17700 ttcctttttc aaccataact tggaaaaaaa atacagtata tgtgtatata tatatattta 17760 tttatttttt tgatcaaata tatatatata tatatatata tatatatttt atttttttga 17820 aaaatatatt tctcaacaaa taaaaagttt gttgacattt actgttgagg ccattaggtt 17880 aggggcgaca agtgatgaga tctctccgac gaatcctggg aacggcaagg caaactaaaa 17940 cgtgtcgatt gattttcggt catttgtttc cgttgacttc tgttgatatg cattacagtt 18000 ttctttttct tttgttaaca cgatcagaca tggaatattc ggtggtaatc accaatcaag 18060 tactcactat tcttagaatc gtgatactaa agtatatcac gtaataagcc aatcatatac 18120 gtagaacttt tagcctataa ttacaaaatg acatcaacta taatttataa gcgattgttt 18180 tgtgtcactg tcaagtgtca acaacttaca tgtaaatact tcgattatag ttcagtattt 18240 ttgatagttt tggctcaatt tggaagtcca gtttagtccc agcagaaaag aaaagaaaaa 18300 tctcaaagaa ctttaaaatt ttcaataaac caatcagttc cctttaccaa accggactaa 18360 attgattacc aattttatat aaaaatttgc ccagtggatt ccagcttaaa accgaaccca 18420 aactgaatta actaaacata gactttgctt gatatggtta cgtagtctgt caagccctat 18480 tgcctaatac caatacacat ctcgtcatca taattttaag ttaagactta agacacaata 18540 cgctttgtat acgattaact agagtcgtaa aatatgttta aaatacgcaa ctttttgaat 18600 tgttagcgct taaatcattg tcaacaatca atgtagacga gagtgtatcg gtacactgca 18660 agtacgtgta gcgacagagt tagttgtcca acgaagtttg atccaagaca tgagaaagag 18720 aggttcatca cttaaaactt ttaagcacct aaaaaactac tttggtgggt ctactttgtg 18780 aatctaacgt gtcaagaagc tgttggtcca cgttctccaa cagagcacca gagactccag 18840 ttgtccgaac tcacttatgt ttctgctcga agattgcact attgacgtgc cttcaccacc 18900 tccaccacca catctacttt aaataacatt tttttgttct ttcgttagga aacaaaacat 18960 agaaatgtac tcaacgtgat ccttgaggaa atgagaatga aaaatgctag tttaataatg 19020 ttgaccaaga aaaaagataa tcaaggattt attcaatata cttatcagtt actagcaaac 19080 tcatgagttg acaaaaaaag caagtgaata aataagaact tcaaatactt ctgctgctta 19140 tatagactag ccatctatta tgctatttac atattaagaa aacgtcattt tctgaaagaa 19200 aatccgccgc aactatcata tataaaaggg tggatatatg gagtatgttg ttaaataagt 19260 ttattttgtt tgttagcttc tgggagagat ctgcccctcc atgaacatga agtactatat 19320 caacggtcca ccacttgtag gttatccttt cgcttagagt tcaaaaataa gatatcattt 19380 tgagatttaa tggacccata ccatattacc aagttacaga tcgagcaatc ccacttggaa 19440 aacatattag acaatgcaag tgaaagtgca acatgccatt cgctggtact aactttaatg 19500 tcactttaat gttcttttct aatggaaatc gactcagaca tatgtatagt aatatactcg 19560 gagaagagaa aagtaacaag gtcatgtatt tactcggaaa agagaaaagt atgaaaataa 19620 agttaagata atcaggaact atttgaaatt aagtcgcgtg gttttagaga caatatgttg 19680 atttgcttta ataatttctt taaataaaat aaatagtata tttgggtact ataagatgca 19740 tggcaaagag caaaacacaa tatagacaaa agttgctgtt tatgttgata agtgtcgtgg 19800 gagaagaaga caaaaacgaa gcagaaataa ctctaaacta aggtggccga caatacaaca 19860 tgcttatgtt attgtaactc gggagaaacc tctaaaaaca taatcttcga ctttttttat 19920 ataggatcgg ttcaagatca tgcacactga tcctcgtatc acaaggataa cgatcctatc 19980 gatcggtagt aagaggtgca gtatcatggg tattttactc ataacaaaat tgtggaatct 20040 gaacggtgga agcattataa gcgtagttga ggaggtatgg accgtcacaa tgttatgtga 20100 actgctattg cagtttaata aagttgaatg taaaagtttt atgtatttat gcaaagttta 20160 atatgatgat tttttaaaaa tatgtaagca aaattgtaag gttttgactg taacttcaaa 20220 tgtcaaaagt ccaattaatg atcagtgaag actgcacatt acttcaaatt aataatggaa 20280 gcagcctagt gattctaaaa gtgaataaat cttttttgat acaaagtttt aggcaaatgc 20340 attttagatt aagacattaa actaatgctt agaatcagat aattcgaatt tcagaaacag 20400 gctactataa aaaatgtatt tcttcatgat ttgattgtaa acaatgagat gagaacaaca 20460 aaatgatcaa caaacattta ttagtttagt tacattgaat tggtggaaca catgatgtgt 20520 gtgtgggact gaactgctaa attggcggag actttgtttg gtaaagtaaa ataaccaaca 20580 ataaaaagag aaaagcttaa caacgtgtcg ttttggaatc cattgagaaa acaaagaaac 20640 agcaacgtat tctccgccta caacacaaaa acatgagttt atatttcacg tgttgctttt 20700 tcgttttcac tttgaccatt gtcttcttcc tcttcgtgtc ggtaatcatt atcagcgcac 20760 aaattttaaa tttactttga ataaagttga gttttcaatc tatgaaaatg tttatgacaa 20820 tctcatagtg ttgattcaaa gtaacgtaag tgtccatcat cgatatggtt gaaagtctaa 20880 tgtgaatacg taaaatgtgg acgatgtgat aaatactact actagactaa aaggaccaac 20940 aaaagacaca accaaaagta gtaacggttc tcagttcaag ggttttaatt caaccggtgg 21000 acgaattaat ttagaggctt aacaaagcaa acaaagacta caagaaacag agacttgttt 21060 tggcgcggtg gaggatcttg cttttggttg ttataagtca tacaaggttt ttgtcttctt 21120 aagtaataaa aacaaacgtt tgtggatgat ctcatgtcga agcgtgagaa actaaacatt 21180 ctctaatagt gatatattgg aaatgagttc ttggtcaaaa tataattaag gtatatatac 21240 cagagcccat cccaagttca aacaaagaaa gcttgagctt gtctgcttgt gctttcaatt 21300 caaataaata tttagaggcc gttgaatact gcattatttt tatagtctag ttgtgatggt 21360 ttgtaaatgt gtttaaattg ctgaggagtc gcagctcttt tttacctccc atatccatta 21420 attttgtttg cttccgcggc tttcaaatac ttaggccggc tctagacctt tcatattgat 21480 aaatttgaca taaacctttt ttatgtttgt tccacataat ttctaatcta ttttaactct 21540 tgttgatatg aaatgcatcg aaagttaagg ggttaaatcc atgtcaacat tcaacaacat 21600 tgcttgcata tgtgttctat gtgatgtcag cgtcctaaac ctttgctcag atacatatct 21660 taggtcaaaa agactcccat gacatgttcc agagtccata gggtgaggga aggttccaat 21720 ttatcaatgc aaactgctat tcgcatagta ggctaggaac tcgcatcaag catctggtcg 21780 agagacgaac caacgaccat tatgccaaaa gacgggccac atgaagactt ggtcggccca 21840 aatggaaagt taaccaaaaa atttacccaa ctaaacctcc ataagcctca aactagaaca 21900 tgcaccaaag cttcaggatg accacatggt cgaccatgaa gccaatagga agtaaatgga 21960 ccaagaagat gttttgatca tcaagaacgt ggaagagctt aaagactcga gccaagaaaa 22020 ctctgaggat gatactacta caccaaggac tactcaccaa ataaaccaga acgcatcaaa 22080 acagccaagc accaacctgg atcaagatac atctaaacta ggtattttca atttaaacga 22140 tttatgcaga taagatggac catcctagta gttcctaacg atcattcatc ccatctgaca 22200 caccatagtt ttaggccgca agatagttta tataaatttt cttccttttt tcttgttttt 22260 ttcccgtttt ggtcttaaac cacaaatgtt agttttttgt tttcttttct ttgcaaaagt 22320 ctttttgtct tgaatatacc tctgtgagcg taataataag ggcatctcca accctactcc 22380 attttttact ccaaactcaa ttatggagta aaatcttctc caaccccact ccatatttaa 22440 ctccaaaatg gagtaatagc tagggttact ccatttatgg agtaatctta ctcattactc 22500 cattttggag ttgaattttt tatatttatg aaatggttct tttaattttt aatgttttta 22560 tttcatactt aaaataatat aataacttta aaaaatataa tactccgaaa aagattactt 22620 tatagtttac agaaaatatg cataaactca taaaagtcaa aactaagaat aaataatata 22680 aaataaatat aatataatat gaataagtaa tttaataatt aattcggtaa attgttttcg 22740 aaactaccaa aatcggtgaa tattattcaa acggaataga tgagtttttt aatcttgtgg 22800 gtcaaaattt tgattgataa catttgtact tgttgagctt gatatatgca caaacaaaca 22860 ataagaccca atacataatt caaattacaa aacaaaactt tgtttttttc tttatgttcg 22920 tttaatgcat aaaaatattt ttgaattaga aaaattgcat atgataaaat ctgcacgaat 22980 tgaaattgga agataatctc tagttgtatt tttaatgata aatatttagt ttaaataaaa 23040 tatattatta tggaaatttt gtaaacataa aatagttggg ttaaatgtta attttttata 23100 agttgaaggt actaataaca attattaact aaataaaaaa aagaatcttt ttgtttggag 23160 taaaaaatgg agtaatacat tggagtaaaa tccaactcta ttttggagtt acaccatttt 23220 aaagtaaaat ttggagtaat acattggaga tgctctaagg ctctgcgtag ctttgtacaa 23280 cacactttta cactagatca ataaaataac agagttcaac ctaaggtcgt cttgttcttg 23340 agttttggga ctttgttctt cgggtgagat tcacctagag ttaagtcttg tgcagtatca 23400 aatatccttt catcattttt gtggtgtcat tcgatccact agcaatctcg tcaaccgttc 23460 cagcaaaaaa atgagagtca acttgttaga tctcattcca caagttttgt ccaaaaaatc 23520 ttgtgtccgt ctttcatcca tccaactgcc acgagaaaga gcatagtagc cagcttatgt 23580 gttccatttc actattttca aaggctcacc accgagtctt atttcacaat gaattttatt 23640 tcttaggtgg tttcattagt ttcaatgtct aaaggattga aagtagagag cacgaatgaa 23700 taaacagatt caacgacatt ccaacaacta gacaaaatca aaacacatat tacctttaca 23760 tggaaactag tttgagatac aaatacaact gataatcaaa attaaactac ttgtgtggaa 23820 ataattgatt tccagtttgg cccaatgctg gtgaaatttt ttagaaattg tttaccggaa 23880 tagcttgggt cctttcattc tttataaatt ctaaggtaaa gagcaaatta agcttaaaca 23940 catccccaat acacacgtct acaccacaaa tcatgttcta attttcagat acgatccaca 24000 acaaactcac ccacaaatca gaatacacat actcattgtt tttcgttcaa actttcatat 24060 acgttgccat cattcttctc taactattct ttctatccac cccgtgtttg gatttaacat 24120 agacaaattc ggaggataat aataataagg aactgataat tagattaaat tcgaccaaat 24180 gctcgtttca tacaagtacc tcttcaagtt agaaagaatg aataaatgaa ttatatcaaa 24240 agtcaaatta ataaaggtaa atggacgcaa gcccttcaga tttctatcta aaatatctaa 24300 ggatctctct tatatgaact ggtccaaagg gatcagcatc acactaatat catccaatga 24360 gcctcgtgaa gccgaaagat cgacaagctt cttacagccc aacaacaatg gcttctcctc 24420 ggttcctagg cagaagggac gagcaatgtc tactgcttct tggttactca ctttgtccca 24480 tagaccgtca gatgccaaga tcaagaactc atggtcctgc tcgattctca acgtctttgt 24540 ctctggttcg gctataaccc atttcttgag atgagcatca ccgatccctc ttgacacagc 24600 caaagatcct tcaactctcc atacacctcg aaacgtatca acgtatccac cctgcacaaa 24660 aaaaaaattg aatctacttt tagaaactat actttccatt tgtataaaac attaaaaacc 24720 gagattctca ccgtggtttc aattcttgtc cgttcatcgt ccctagacgg gcggtggtcg 24780 gaagaaagag cctccgcgac tcctccaaca ctcatgacgg cgcgacaatc gccggcattg 24840 gcaaccacga ggttcccgtc gctgaacata gccgtgacgc agcaggaacc gcctttaacg 24900 tcattctcgt tgagaaacgc agcgtctgtg gtcaagtaac cgcgtttcac cgcgtctgcg 24960 atcgctgact cgtcgttttt accagcaacc gcttccaaaa cgttcttgtc taagttcttg 25020 gccgcaaact cagccgcttt agctcctccg tgaccatcgt aaacaccgaa gatggcatgt 25080 ttgcgatctc cttggagatt ggttacggca gagaagcgat cctccatagc ttctctcctt 25140 cctctcttgc aataaacaga atagccatcg ccttccctct ccacctctct accttcctcc 25200 ctcggcgtcg ccggagcaac gaacccggtg gtaccgatcg gtatatcaag cctcgtgggg 25260 cgtttgcgtt tcagaacccc tccgggaggt gattggccgg tacacgacgc cggagagaaa 25320 ccggtcggag gtttctgtaa acggagacgg aacggcgagt tgagggacgc cgcggcggcg 25380 gaaggagagg aaggtttgag atgagaaaga gtgagagaga tggtttcttg cggcgaagag 25440 aggatgatag aaggtttgct gcagaaaaga gacgacgacg gagaaaaaac cggagagtta 25500 cagacggaac aagacatcgt gtaagagaat tctgagttcg aagattgatg tgtttctttc 25560 tctctacctt tgagatattt gttttaggag aggaaaagag gtttctatta atataaagag 25620 agagagagag agagaggtaa tgaatgttga agactttcaa agtggtaata atggagtccg 25680 tgagggtaat acggacattt aaaagtaagt caaaaacacg tctaaaagga aagaggaaga 25740 gagtgttaag gaaataaaca aagaatttgg gcatgtggtg gtttaacgta tcagtgttaa 25800 agaagtgttt ggttgatgac tcttcacgtt ttttcaattt attcttttgt ttttaataat 25860 aaaaacagat tctatgaacg ttgtcggtcc gttagagctt atgagttgta ttttgatggg 25920 attactttct tttgtttctt ggtggtccca gtcgcagctt cttagcaagt gaccgttgtg 25980 tggactgaga ggagccttct ttctttcttt ggtttttcat ttgatgacct ttgtaaaatt 26040 atctatctca attcactcga ggtcttctaa ttaaaactaa caagtcttct aatgacatca 26100 ataataacgg ctacttcttt ttccttataa aacggtattt gtttatggat ttatgtgctg 26160 actgctgaag atcaaacatt ggcatccata aggatcaaat tatcttattc tctactagca 26220 acttttaaaa caatgcttta acaagctact gattttgagt acccaataca tattttctgt 26280 ggtttttttc taacactgaa actaatccat tatttagttt gaatcatgta ttatcaagga 26340 tctcaataag caaaagtatg aataaaattt atgattctat tcaaaatata ttttttagat 26400 attctctttt cgttcaggaa ttccaactac tattacagac ttgtgatggg gattcagtgg 26460 gtttttttat aaatagcaat catatgtata acatcattat ttgctgcgaa ttgtaccgtc 26520 attagtttga gtatttacat taataagtaa tggtatgatt ttctgttgtg ttcaaatact 26580 gtttatgaag aatgagtcat atattttacc ctacttttac gattagactt ggtcattaag 26640 atagttgacc agataaaatg attaatcaag caaagaagct tcccactcca taattattgt 26700 ggtcacttgg ttcactttga agttgtcttc gaacgtcttt ttaatagtac taggggttat 26760 ctgtgtttta cgcatgaatt tttttattga catttatttt tagtttaagg ggttaattat 26820 ataattgtga accattattt ttgtgtgagc tttttttata ctccatatgt tttaaaatgt 26880 tgtatatttt agatttttca cacattttaa taaaacacat taaatttcta ttttttttgt 26940 gattatcttt tttttcataa aagattagtt aataaaatat acattgaaaa tgtaaaaaaa 27000 tagatcttct tgatacaaaa tttttctcta taagtaactt tataaaacgg aagaaatata 27060 agaagacata agaatgtgtt taaaaaaaag acataagact atcgagagcc gaactcgttg 27120 tagttgagta aattgcataa tgttatagtt gttaatttta atggtataaa ttttatttag 27180 aggacttata atttgtttga tattttaaga tcatccacta ttatgtgatt tttgtcagtt 27240 tattacaatc atattctgct atttaaaaaa aaaattgaat tcactttttt ttagttttcc 27300 acaattattt ggacaaaata atcttacatc ccattgttaa attgtgagaa caaaactttc 27360 atctatctac aatagtagca agcgtcgcat ttgtttctga tgttcttaca ggtggatgtt 27420 atcgttacgt catcgtgtga ttgttgtttt tgtatttcta taaattctta aataccgtgg 27480 tatgattact ctagtttcat gaaatgattt cctgaaacgt ttccagcatc agtccccttt 27540 atacattacc catgcatgtc taaatataca ttaccaatct ctaaatatac attacccttt 27600 gttattatgt gaagatgttg tagttcaatg cctactccgt aatgttgata catccatgga 27660 cttgagaacg ggcagaaagc accagcacct tttgttataa cagtatattt tccagaggaa 27720 tttggtggta aacataaata catcattaat cctaatcaaa acgactaatt attattgtca 27780 aaagatcatg cgactagtcg tatgtcaact tacgaagcct gcaacaaaag aatatctttt 27840 tgtaaatgtg gattatttca aggggtgggt cggacacatg aacagtaatg ttaagaagta 27900 aacctattgg gccaaatgag accgacgtag gcccatagaa aacccatgac gacccgtaca 27960 ctagataaat gcatattaac ttcgaagaca ataaatacag aggggtccac gtttccgttg 28020 caaattgggc agtagacatc ctccccgtga agcaaattca aagtcttacc agtagcgaag 28080 aacacaaaaa ctaactcgct acaatcttct cttttttctt tttttttcaa tgttctctct 28140 cgacgaaggt acaaagatct tgtcttaaat agatatatat ttttatttaa tctaagcata 28200 gttattacac agcccctcag ccagagagag aactaagatg tacaacgtgc atctttatca 28260 gggggttaaa ctgacatagg ttatttgtta attatatgtt tttaatttcg attaaccgcc 28320 gagtaaaggt ggttaattaa gctgcgaaaa gtaaaaccta cataggttat ctttagatta 28380 tatgtttctt attttgatta accgccgagt aaaggtggtt aattaagcag cgggagagtt 28440 acaggaagat tgatgtcgga gatttgtcca gatgacatct ctatattatc agcttcggct 28500 ccctcaagat ttttcttctc aatctgtaaa gataattata ggtcaaaaac atattcactt 28560 ctctttttgc cttctatgac ttattaatac aagagaatat ttttttccta ccaaccatca 28620 tatatatagc aatctggatt tcaaaattta gtttttcttt tcctaccaac catcaaatat 28680 atagcaatct ggatttcaaa atttagtttg tcttgtttct gactttcaag cttctaggtc 28740 tttcaagttt aaagaacatg catctttctc caaagcaggt atctagcttt tccagtttat 28800 aatcaacctg gctgaactag ctaggaaagc tatggctaga tacttgaacc taccaatctt 28860 acccaagcca acctaaacca tataacaaca aaaaccccaa tcggttccat aaatctcaaa 28920 ccaaattacc aaaacccaat tatgtccaac aacagggaag agattttact atatcaaaat 28980 tatatatcta tcaaaaccca ggcttcattg gatatataat tggggaaaac ctcaaaaccc 29040 caaagtataa aaagactgaa tcatttatat ttaaagaact ataccacttc ttaatttttg 29100 gggtaacagt atcaaggttt atgaaatagt tttgaattta cttttagggt tcagggttag 29160 gttttaaact gttgtgctca tctaaaataa ttttattatt actttacttt aaaatttaga 29220 ctattttcat aaacgttctt atatatatat acacaatatt agaaccgaat cgagattttc 29280 ctcaaccaat accagaccaa agaaaaagag aataaacatt ggcacacgaa aacagaataa 29340 acaaaatcta atcaaaaacc aaaatgctct tattaatctc gagatgtttt tttatattaa 29400 aagtgcttat atatgtatat atctgcaagt aagtgtgtgt atatgtgcaa gaagtgctta 29460 ttagcttttg catatttata aagaatgtag cttttcgtta cctgactagc caaaacctgg 29520 ttctcttctt tcagcagatt ctcctgtttt taaaaggaca acatgtacat caattaattt 29580 cagattttgg tatccaaaac atttgcaaca tccctaatag acaagatgca ttgtgaaatg 29640 tgaagaagtt tgatgtagac ctgcgagctc ataaagcaca cttagagaaa ctaatacaac 29700 aattgtgcca aaaaaaaaaa aactaataca acacacaagt gttttgaggc tctcaacacg 29760 agaatatatc tataagtgct ataaaatcac aaatctaacc ttttctttga gactttcaac 29820 aagctttaac attagttctg cctgcaacaa attaaatata agtgcacaat cgttttcgac 29880 aaacaaagta aacaaagaga acacattatg gagtcgatgt accttccgag ctctagttac 29940 agagagggca gtctcaaggt gatcttctag ctcaacgagg gaatccacgc ttacatcatc 30000 aattgattcc acaagcttgc tgcatatatg cacagattga caggaaaccc taatatattt 30060 gtaatgaaag gaggagagca aaaatagtct cagttagtac taacctttcc acaagttcta 30120 gtagctcatg gtgtgaacta tagttcagag attttgactg aagatcctgt tcacggagaa 30180 ggataaaaga ggcggtaaaa gaccagtgta tttaagaaat ttgatatgca cgtggaccaa 30240 taacctcaca caggatcatt tggcgaataa tagttcataa caaactcaag ttttaagaaa 30300 tttgttctca acatgtgttt acattatagt tcaaaaaaaa aaaacatgtg tttacatatg 30360 tttatcgaaa aactactcta aaggaagcat cgatagataa cctcttccat gttgaaaaca 30420 atatttgaca actacagctc tcaaatagga atgatacacg cagtttaaat gcccgtgagc 30480 catgcccaca aaaagtaagt tgaaacatga cgctgcgagt tggttctgac cagtatatat 30540 ggagctctct aagccttact tatatcctta aatactgcat gaggaaatat tcaaaatgtt 30600 tgtattacca gggcattgag atcatcagca tgttttttcc catatcgatc aaggatcttc 30660 tccagtctgg agaaaagata aataaaaatg ttaactgaga tcaaaagtca aaactacttg 30720 ttaacccttg aagacaccac tggaatctat caaaacatta aaagagaaat gaaacaaaag 30780 gttaattttc gcaccctaga atttgctaac aattcagaaa aaaccgtagt aatcaggttt 30840 aagcagcagc acatttggat ttccatttct tatttttaac atgctctgat cctttctaag 30900 caatctcaat aataataaaa aagtcctcta aaattaccaa gtatttcaag tttaattttc 30960 caatagttgt gttaggttac atgtatttat ttatatactt gatagactga aaatggcatt 31020 cttttgacaa agaaaagtca taatctatac tatattaaaa gggttatatg agctccatac 31080 agcatgtcca cgtaggacaa ttaaatcgac caatcacgtt gaagcgttta gccatgtcac 31140 taatatgttg ggctcacggt ttttcttttg tgtatttgtt acgattgggc tcaagcccat 31200 gaaaccatta taacaaacaa tcgcactctt tcacgttttt tcgaaaccaa aatcagaacg 31260 attctcatcc cctttcctct tcctcttctt tgatccgttt cacgatctga ttcatgagca 31320 attgattcat cctccacttc gttctccctt tactctcatt tatggattcg tttttctctt 31380 cttttgttta taaaactctt gaacggagtt tcgtttcgat taagcttcgt cgtaaatttt 31440 cattcgtaca ttgcaatgag tttcaccgga aaatccaact cggagaaacc acaacgcgtt 31500 gagggtgact cctttcccgg accgatcaat cccatcggcg atccccactc gaagcaagcc 31560 aaagtcgaag cgtcgttctc ctccggtctg acgaaattaa aggctgacac ctttcccgga 31620 ccgattaagc ccatcggcga tccccactcg aagcaagcca aagccgtagc ctcgatctcc 31680 tccggtctta cgaaattaaa ggatgactcc tttcccggac cgatcaagcc catcggcaca 31740 cctgattcga agaactgcaa aggtaagaaa ccttatcgtt tcttatcaaa ttatatagtc 31800 cgtttgattt ccaaaaaaaa atctgaagct ttgagattta aaaccatgag acgaacaaat 31860 ttttttttta atagataatt tttatacaac cgcaaaggta agaaccctta tcgtttctta 31920 tcaaattata tagtccattt gcttacgaaa aaaaaagtct gaagctttga aatttaaaac 31980 catgagatga acaaaatact tttttttata atagattatt tttatactat agaaaataga 32040 aaatcatata aattgtggta cggagtttag tatccttttt tgatgatgag aacgttcgta 32100 ttcctatgca ggtacgatca atcacaacac gaagactggt ttctcttcag gcgttagagg 32160 caaagccgct gtctcctctg ccgtcaaggg aaaagccatt gtctccgcca aagtaatggc 32220 tttcaaagat gtgaaatacg gacttcatga cggcgagctg aggtttcggt tgatccattt 32280 ttgggaagct cgaaatgttg tgacgaaggt gcttctcggt ctcaagatgc ttctcatcga 32340 ctaagaggta taaaccgaat tcttgattgc gatttagttt agaaattgtt cagacaagat 32400 gctgataaac attttagatt caaacttatc gctctattat ttatagcaag tgtttgcttt 32460 tgtttgacag gagggagctc agatatttta ggaaagatgg gcacaaccgg aggaagaaga 32520 aagatggtaa aacgatgaaa gaggatcacg aaagctcaag gttaataata tatttacatt 32580 catgttacct cagtttttaa taaatatttt agagtaatat tgtttaagta tatatctagg 32640 ttggaagcat tgatgtgtta cattgttact aggcacatgg ggaagacaat gagaatttcg 32700 agaggctttg ctactggatg cttgaacagt gagtcctatg ttttccatat ttcacatttt 32760 taccggttta gtgtaccgta aatgttactt tgagaacaga aggaaaatga aatgtgaatt 32820 gttactttta gtgcttatgt cctctgtttt tttatgggta cagggaactg atgcatattg 32880 tttttgttca atacttggag gttaaggtgt agcttttctc ttggtgctgt actaatatat 32940 tctttagaat ataaacatcc attcactcaa cattatattg tttcttttta aagtgggttc 33000 tctttttttt aatggtggct ttgataagtt cacgctattt atacagggta ataggataag 33060 ctccagtgga ataaaagaaa acaattcaaa ttctgtgagt ggctccactt ctgtgaatat 33120 tgattcaatg gcaaacacat ccagaacatt gtcaccacta tgtgaagatg ctgattagta 33180 tttgccggag ctttaccgtg gagtccgttg tggccgtgtt attgacgttt tagatttgaa 33240 tcagcctaca cggacctaac agcaacaggg attccagcgg actaacagaa gcagccgtgg 33300 agaggcaagg cagggacgag attagcggcc agaaatttga aaggaaatct tcagaagaat 33360 cagatagtaa gatagttggt gaagaagaga aggaagatat gtcgcttggt aatgatagtg 33420 gtggctctat caaggcggct acacatgaca aagacagaga tacttctcct tcccatgaag 33480 ggataaagct ttctctgtga ttgtgctgtt taaaatgatc atttatgcat agccttggtt 33540 tagtattttt ggtttataaa ggtcatgact acaattcaac agggtattgg aacgagctac 33600 tatgggcagc ttcgtgttct ctctggaggt caagcacctg gtgggcacac tgctatatat 33660 ggaccattcg gtaagtgttt aaaatacatt tttgtgtgtt ttaaaatgat gctttacatc 33720 ttagtcatat acttaattaa gaaagcagag tagcaggatc actcttattt caaaatatgt 33780 gcgcttttta gaagtttaca tttgatgtca taattttgtg aatcagtgtc tcgagtaatc 33840 aaatttgatg tcaccctaac ttcaaacttt gctattcaca tccctcaaaa cttattctct 33900 cagtgtttgc atgcagggtg atccgaagat tatcacctgc aagttttcat gctgctgtag 33960 caaagacatg ttttgaggta cggtaatatt ctcaaaacac cagactttga ctccctttgc 34020 ataacaaatt cttctgcagt tttctgattc taagtatctc cactttgtta ttcactcagc 34080 tgaagaatca actcatcact gctagctatg ttgatgatga aacatccatg tagatggcta 34140 agaaatactt ggattatgat tcttggtgaa gtgacatcca caacttggat aattgagaat 34200 gaggctcata tcagcaaggg gaaagtgaag tctttcacgc tcttcctgtg gtagcattcc 34260 cttttcttct gcagcagata atttattagc acagattgaa ttacttcaat ctgatgtatt 34320 caaatcatgc aataatgtga tcaagagctc acattcacct tccactttgt aatatttatt 34380 atgtatcttt ttttttggga atcataataa gcaataatat tttacagtac atatgcatta 34440 caattacaac caaaagaaaa ttaaagaaaa acagtgaaca tataaagtta gcttaaaaag 34500 ggaccccata gagaaaatac atttaaaata tatagtaaat tattaaataa acaaaataaa 34560 attggaacaa atttaaatag taaatatatt taatgtataa ttttaaatag taatgaccac 34620 tattaaattt ttatgtagtt tacctgattt aattatattt tcagttaaaa tggattaaac 34680 ttcacaactt attacttata acttcattaa actcatcagc aatttttaaa aactaattct 34740 aactattaat atagttaaac taaaacaaac attaaaatga atagtcaaat aaacagaatt 34800 tttttatagt aaaaaacatg tcggacgttc gacaactgtc tcgcaacgag cttctaccaa 34860 gagatataaa tgttacttgc acagctcgtg aagtcctctg aaaccgactt acgttacgca 34920 atggcgtcga ccccggttct ggggttggca gcaggagact cacgtatata caaggacctg 34980 gatctccaga cgcatacatt ttcctgattg gcttctatca accgtttctg tgatcttatg 35040 gatcgatgtc ttgctagcgg taacatccag gcacactacg tgcaaggaat tcatgaatat 35100 ttttgcaaca acacaatcaa tggcatgcac catttacgcg tctcagcagg tggttcttac 35160 gcagatggtg taatcatgtt gtgcagaggt gagcgagctg tcggtcatgc ctacatatac 35220 atgcttggtt ggagggagtc cccaactaaa ttagacgaat actggagaag aattaaaact 35280 tcgcttcatg gtattgttgt tgcgagactc ccggtttaca tgacgacgta ccaagaaaca 35340 agagctgcta ttactagcct ttgccaaagg aacctgcgga agctcgagcc accggaaaga 35400 tgccatgtca atgacatgga caattactgc gagctttgct tatgctacaa gtaaatcaag 35460 cagttcattg ctatcctttg agatcacatt agtgttttgc agttcgttgt tatatcgaat 35520 cgtattccgt accaaatcca tggtaatcgc aggaaaattt gatttccggt tttggctgga 35580 agtttgcttt ttgtggtgga aaaattgatt tcgtggtttt gactgcaaat tttgattttc 35640 tcggctttgg caaaaatatt cgattttgtg gttctggcgg agaaaaagaa tttgctgttt 35700 tagcgggctg gaaattttgt gtttacgatt ttggcgggaa gattcaagtt cacggctttg 35760 gcgaaaattt taattttgtg attttggcgg aaaattttgc tcttgcggtt gtgacgggaa 35820 aaaaacaatt ttttattttg gcagtaaatt tcaattttat tttattttat cgagaaaata 35880 caatttgtgg ttttagagga aaaatctaat ttgctgtttt agatggaaat ccgatttgcg 35940 gtttagagga aaattttaat tttacgggtt tgccgaaaaa atcgactttg cgttttttga 36000 aaaaaaacaa ctaaaacctc attttccata atcaatcttt aaatattttt ataatatttt 36060 taaaaagtgt ttttttcttc caaatagtct tacattaaaa ataaatatta aaaacagaag 36120 atcatatatc attttaaatt ggtcaaaaca agtttaaatg agtcaatgta atatttgagg 36180 gtctaaatga aaaattctaa tagatctatt ttaaaattaa tctaacggca tagctattga 36240 atggggtgag tcttaatttt ttttttgaca acatgggatg tgtcttaaat ggggtgggtt 36300 ttcccatttt aacatccata tactccaatg taaagaatat aaccattaga ttattttggt 36360 ttgacattag aagttcggta gctcatataa atctaacacc atgttatgtt gtcaaaggtt 36420 tcggacatta gtaaattaat aaaaatgtag caatcaataa tgtgaattta ttatagtata 36480 tattgttatc agtctaagta taaaaatata tttatattca gatacaaatt ataaagtaat 36540 ttaaatttaa ttaaaatata tggaaaataa cccgggcgta gcccgggaaa atctctagta 36600 acattaatac ctgtacatgt tatccattaa tctatcaatt aattcatatt caacgctggc 36660 ttttgagtca cttaaataaa aattaactaa ggtacataag aaccctatac tcaagtcaaa 36720 tacactttgt tttgcctctg cacccacaac tgtttctttg cattcaggtt tgtgttccat 36780 tttataataa tttgatacta taacaggaac gacgactgag gcttaaatga gagtgtatat 36840 atattacata gaggtaaaat aaagtgtccc aagtgaaaga aactttgttt tgattctcac 36900 ttggtgcata tagaaaagta ttccataaaa cgaagacata caaaataagg ggaaacaaat 36960 actacatttt ctatttatga ggttacagag acgtctaacg catttcgaaa aaaattacca 37020 acgcagttaa cagtttgtat taataggttc agagttccat tgtgaagtta atcttttgca 37080 cattttcatg tgcaaaacta ggagtttgac tactccaagg ctgaacctag cattcagtct 37140 aaggcgaaca aatcctagca aagtatgcat cgagtgagaa tcaacgatct tcaccaaacc 37200 actagtacga cttggttata ctagagggtg ttagtacaaa cttcatcgat taatttgaca 37260 atgtaggatc atactgaatc tagagagata ctaaaggggt tggtattttt tatgaagacg 37320 aatgtttttt gtggggttgt cgatttccag gaggagccaa agaaacaggg cgtgtgttgc 37380 tgcacttccc aagacaaaag acccaagatt tcatatacca aagcgacaac gttaatttaa 37440 tatagttcag agagaatagg aacaaagtgt tgatatataa tgcagacaat gacaatgaaa 37500 ataagaaaga tgaacgaata tccagtcaca ttaatatgta gcatataaat gtatatcaca 37560 ctgcgaggat gggaaactaa aaagtagaaa ctagtagaaa cttgtaggat agaaattcct 37620 tgaaaccata tatccacatt aatcttagtc catagataca caatctatca tacatttgaa 37680 aaaagttaat gatctatttt accatcaact ccatactatt tttataacaa atctcccgga 37740 agtgcattgc aatgtatagg aatccaagag aacaatgaat taaaattagt ctaaagttag 37800 accaactgat gcacattacg tgctgcacaa agtatcaaat atatgcacac acacaacgat 37860 tgccgattaa agaatcgaag tcgatactgc atcacataaa taatatagca tatgtgagtt 37920 aattaagaac taattgtgag gttaaatttt cttaaataaa aaaatactat atatatatat 37980 atatatatgt atgtgtgtgt ctgtgtgtga aaatcaagaa tcagttagaa accttaaaat 38040 tcggataatc ttaagtaata attcatggta aaaaggataa aaattttgaa gatctaaaat 38100 tatcttttag tcaatagctg cacaatgtcg catacattca aatcaaaact cttgatctag 38160 tatccagcat taaccccaca tcagttttaa ggatctcttc gcagtgcatt gcatacagat 38220 ctgagcgaac caatgattgt agttacgata aaggcagaca gattaattaa ttttctgatg 38280 caaaatccct aaagccaatg aactaaaaga tggcttgaaa cattactaaa gaacatcaag 38340 tattcatcac aacgtatcga gaagatcttg acggacatgc aaatttttaa caaataaaat 38400 aaaatccatg cagaaaaata gaaaaaaaac gaagaaaata agagagaggg agattgagta 38460 agaagcttta gctcatcaca acattgttct tcctcaattt tggttatatc atgtatagag 38520 gaaacaataa caaacaaaac cgaaaaatcc ataagagatt cgccgggtaa atctaagtgt 38580 cttttaatta ttttatttta attattttat tagtaaagta aagagaagaa agcttaaagg 38640 gcaaaaaaat aagagagaga ggagaagtcc tacctatccc cggaggagaa gctgtagagt 38700 ttgtcggagg cggagacaac gagaagccca acagatgcct cgcagagaac agaaagctga 38760 cgagctttct cgatgagacc gttgcgtcgt ttgcagaagg tgacttgtct gctactgttt 38820 ttctcgattc gcttgatttc tagttttttt cttcccatag cttctgtctc cgagaggtct 38880 ctgtgcccta atttgattct gaggtacggt taaagtcgcc ggagagacta agcgttttat 38940 tctttcttct ttttcttcct ttttttttct ttaatttcta cctatttttc ctcgggtagg 39000 gtttttttgg gcgggggtaa acgagagaaa taaaaataaa aatatgaaag ttaaaacgat 39060 gcgttttaac gacaagacag ccacgtgcac cgcaggacga actccctgtg gacgcgttgc 39120 gtttgactac tcgactctac catacataca cacaggtagt gctgggaata tgaatcatta 39180 tccgcgggcc ccgccccatt tgatccgctg cggggcaggt gcggatcgag tgatttgaaa 39240 aatttggttc gcgggtgcgg gtgcggattg agtgattttt atgcggagcg ggtgcggatc 39300 agccaaaatt cagtgcgggt acccgccaac ccgcaaaaac taaaaaagaa aagatttttt 39360 taaaaaaata ttatttttaa atagaaaatt tttaaaaaat aatttaattt taattataaa 39420 tagattaata tttattattt taataaaaat atttaaaata ttaaatttta ttgttatttt 39480 taataaaaaa atatttaaaa tattaaattt tattgttatt ttaataaaaa atatttaaat 39540 taataatttt taatattatt aatattatcc gcgggtctag cggatcaccc gcgggtttta 39600 gcggggcggg tgcggatttc atattttttt cttgcgggtc aagcgggtca aattttttga 39660 gtaaaaaaaa tcagtttatc cgcgggttgg cgggtcagcg gggcgggttt gacccgcaat 39720 ccagctctac acacagggtg tgagtgaaag gtattaatag agtaaaagtt tattctatat 39780 caatatttac tctaggttga gctaaaatgt taccaatcaa gtggaacata aatttttgtt 39840 atttactcta tgtactgtac acaaagagaa aaagagacac taaatattac tcttgattat 39900 gctagaggta tatgatttta ctctatatag atttttcttc tcatattttc atcttttaca 39960 tttttcactg agtttcactt tttcatttcc tcctttattt accaatcaca ctcatatagt 40020 aatttgcagc acttaaatat ataaaaatca aaatcaattt tcatgttttt tttgtatagg 40080 tgatatatta gtttttaagt aaaactcata taattctaaa atatgtggcg caattttaga 40140 gcatatattg ataatttctc gaaaagcctt ccataaataa aaaattaaga aaaatataag 40200 aattgtagac attactactc ttgctcattt cacatttatc aaatatgtta taactgaatt 40260 tattttaata ttattaattt ttttgtcttg agaaactaag agtatcatta ctggtcagtt 40320 agctaagaat cgtttctagt ataacaacaa tagaatttga tatttgtaat taatttttaa 40380 acacaaaaaa gtttaatcag tgatattgtg acaagtaagc aaattagttt ctcaattttt 40440 ttacgtctct ttccattgat aatttggtat tctatccatt ggaattgaca tttactatcc 40500 aagaaaatta ttctaaacac attaaacaac caaaccctag cttatatgta cgttatgctt 40560 ttgaacagat acactcaggt gatatatggt tagatctaga taactagaga ataaccctct 40620 tgaatttctg caaaaaataa taatttatgt attttttaga gttaatttac tttaaagtag 40680 gaatttagtc aactatccta aacagtaaaa ctagacaatt ggatgtaggt actggacact 40740 taaaatgaca attatatcct tgacaagcaa tttcaattct agttcaaaaa acttcgtcca 40800 aaaaacatta aaaaaaaaca caacttgtga gtaaagagag aagacggtta aacggaagga 40860 ggaaagaaaa atatccacgt cggagagaga agaaagctgg gagaggagct tggggtggcg 40920 agagacaacg tcgtggcgga gctgggcatc gaggaggcgg atcgcttggt ggagacgctc 40980 gacggtggag gcagaggatc cggaagcgag tgccatccgg aggcgagtgc ggaggaaaaa 41040 gaagtggaga ggaatggaga gacggtgggt tcgaaggagt ctagaggtga tgaaaaagat 41100 gatggttgtg ggatgataca tgtaggggat aggagtatta gcgtcattag attttaaaca 41160 tagttcgtaa tagtgtcgaa tggtagatca ctaattagga aatattgttt gtgtatacaa 41220 tgcaaatgct ctatctatta tattaaaatc gaagtataaa ataatacttg attattttaa 41280 atggtttttt acggttttca ttttaaaaaa ctaactttaa cacttctttt gttatctttt 41340 ctaattaatt tgaaaaattt atcatacatt atgaatcaaa acttacttat ttaaagtgtt 41400 tattacatat tttacattta tttccacttt tcttaactat ttcattaatt gtctttatca 41460 taatattttg ataacattta gtttacatgt caaccataat aatttgacat gtttgaataa 41520 aattatttca tttgtgacaa aaattcaaaa aggttaacaa ataatttttt tattttctta 41580 aagaaatagt taatcatggg tgttcggatg ccagtttggg tatatatcgt ttctttcgcg 41640 tatcaagttt tttgggttca aaattaggct ctgatcacgt attataaatt tttgggtgta 41700 tttcaagtcg tgttctccta tgtccagatg gattcggttc tgatgtataa aaactttaag 41760 atatccaaac aaccaaaagt gatttcatat tacggttcaa gtattttgta ctaaaaataa 41820 tcatattacg atttgagtat ttttttattc aaactaaaaa taatttaaaa ataaccaaat 41880 aactaaaagt aaccatatta tctgattgga tttgagttta attctaattt gtaaaaacta 41940 gttatccaaa taatcattat acaattattt atacggtgac acatgtaaaa tatataacgc 42000 tatacatgaa aataaatatc aatttataaa agaggataaa aaccaacact agtcaacaat 42060 taaatagatg ataagtaaca gatttttttt caaaaacgaa atcgggtctc ttgtttgagg 42120 gacaattatt tattcctctt tattcctctt tctccacttt ttttaatttt tgtattttag 42180 tatgagaaac ttgtaaaaag actgtatgtg attgttgtac ccctaaaact ttttctcagt 42240 atactttttt ggctggctgt ggagagaacc atttttctcc atacgtttaa tcaaataaat 42300 gttattgaaa atgtttatat taacaaatgc aaatgaaatt agctcattgt acactactct 42360 tacttctaca taatcgacac atataaacct cgatttaaaa ttcaatcatt tgttcttcca 42420 tctcctctcg aaactcaaac tcttgttata atttacgtat taagttttta ataatccttc 42480 catatacgaa tgagtcttaa actttcagct agacaagata atatgagtct gataagataa 42540 tacctgtagt ttatgatata acaattcgat tcacggattc tgccatctcc acttgttttt 42600 tttaaagcta ctgataaagt ggaaacaaat aaatgcccaa taagaaaaca gcagcatcta 42660 gtccattact cattacaatt cattgtcatt tactgcttcg ccacctgcag cattaagtac 42720 tattacagga ataatcattc gtcacttcat cttgagatat ttttatttct tggcttgttt 42780 agacagagta taattccact ccgtttttta ttaaatggag taaaagttaa aatagagtaa 42840 aaattaattt aactcaactt taaatctcat tctataataa aatttatttc ataaatagaa 42900 taatttattt tttgtttgtt catttagagt agggttgaaa tatttttact ttatttttac 42960 ttttattcta ttttaaaaga aagaatagag tattgtattg tttttctccc tcttcatctc 43020 cttagccata tgaacaatct catattttaa agttagtcac tttaaaaaga tactcggtta 43080 caatcattat cgccaagatt attcgagaat atatgtttac aaaccactga accagcatct 43140 cctcgatcaa cgagttgaat cgccgttacg cgagtacgtc cgtatttgta tcccgtgggt 43200 attacgtggg ctaagtgtcc ttgtataaac gcccattcta gactcaacaa aaaaaggccc 43260 atatagttat ccaatttcac accattattt cggttgctaa gccctttcaa agccccttcc 43320 ttcaacagct tttggttgct ataagggacg ccacgcgcgc attttgcttt cataatcctg 43380 taaataaggc atgcaaaagt ctttggagaa gagccaaggc ttatgatatg ttaggtttgc 43440 taaacaaatt ttgttattag cgattatgat caacacattg tctaatttca gtttagttaa 43500 tagtttttgg tgccaatatc tatggatttt gttcaggtat gaggcataga cacggcataa 43560 acctacctga agggcaaatg tgaagaatcc ctagaacaat ggatacaaca aggtccttga 43620 aagaagttga gaagacaaga aagaaatgtt tttttttttt ttgcttttaa cacagacagg 43680 aaatgtcttc gtatggggtt ttaatcaact tgaaggagta aagatgaaag gaagatattt 43740 ttttttgtat gggtgtgtat gttactaaag gacttttcgt agtggaaagc gggtataatt 43800 tgcctcggta cggcttgaaa tattttttga ttaaacaaat gacatttcac ctgcagagaa 43860 aataatatta catgcacccg cactatttaa ttctgtggat gactcgtggg attatcatgt 43920 tttttttttg ctaaactaaa ggaaataatc gtgggattat catgttatat caatatttat 43980 aaaaataatt tagtaatatt tataattcat ttttacaaaa aaaaaaaaaa tatttataat 44040 tcaatatata tttttgaaag tttttagttt actgatgggc aagtatcata acttaaatcc 44100 ggccgtccta cacttgcctc gcataaaata aatcaacatg cacgcgcatt tcaaatattt 44160 aaaattgttt gattcaaaca tgctcagtgg caggtttaac ctgcgggttt tgagtcaatt 44220 ttccaactct tgtcgttagg tttgtctatc tattatcttt atttagatga ctcttaaagt 44280 gttgttcatg agtgttcgtt tctttatcta gttggttcat ttgttgtgat gaattgtttt 44340 ggttgaaaat atttttacat gaggttttaa gcagcaacca aaaattgatg tttggtggcc 44400 catcgtggcg acaaggtgat aatcggcgtg gttagatggc gaggaaattt attccttaat 44460 aaactgcgta ttgagaaaat tggggcctaa cggtaacatt aaacattgaa tgcaacacta 44520 actacagaat aagtttgcta agcaaatttg tttaaaagct tcgcaaactt tctattgatt 44580 cgctgactca tctgggcgta tgctttacgt gatgcataca tatgtccttt tttaatcgtc 44640 catgtagaac gcttacgcac agtttgctca acttcctcac ttcctctatg catttcagct 44700 tttgctttct gttatgtagg aaccaatgtt tcaagttaga gttgagtgtg gaaattttta 44760 agatctaaag aaatctaacc cacaagatta ctatttattt tcactaccaa aaccaaaaat 44820 aatatcttcc taacatatat atgctgacaa caaaaaaacg tctctctcgt tgctagtcat 44880 tctcatctct ctcacgtttt tttcttcgga gaaaaaacaa ggcggcacaa atagaggtgg 44940 gaaagtttgg tgatgcaaat aaaattacac aaataatatg cgtttcttaa gaagaaagta 45000 aaacttgaaa atgacgtgac gtgacgtgac acatgtcata tattgtacgg aactgacagt 45060 ggaaccacgt cggggaccag tgctagggat ggcgttttat tacgctgtta agccacggtg 45120 ttacgatatt ttgatggggc cacgagctct gctcaattat ataagagacc catctttttt 45180 ttttgaaact aagaccaacc atctttcttg ttttggaata accgtttggg tttctattaa 45240 gtttgcggtt tgctaaaaac ggttgtttcg gttttatact caacttttgg aaacttctta 45300 tgacagtttt ttttataatg ccaatgccag tgttgacact cgtccgaaga gttacataaa 45360 gctttatcag actaatagaa ttctctcact aatctgattt acttttgttt tcttgattag 45420 aacatccgca aaaaaacttt ataacttcaa atttgctcta aaaaaagttt caaaattagt 45480 ttaacaaact tcaaaaagaa acttcaaatt tgctcttcaa aaagaaacaa ccgtttagca 45540 aaaactacta tatagagttt ttcctttcta aaaataaact tcaaattttg aaatttgaag 45600 tttttagaaa tgaaacttta tatttgaagt ttcactactc aaaatttcaa atttgaggtt 45660 tcatattttt atttacattt taaaataaag agaaacattt cttactttga aattgatcat 45720 atacgagagc cttatgaaaa taattttatg aaataatatg atattttgct cgtattttaa 45780 tatttaataa tgtaatttta tttataattt tatatattag tgtaatatct tttaattaaa 45840 attgatgtaa tatttttata tatgtgttag ttatttataa aatatttcta tatttaatta 45900 actttgacaa atataagaac catattataa aatacaaata atttaaagtt aaatttaaag 45960 ttttaatttt ggaaaaaaac acatttaaac tttcgatata aaatcttgca aacttcaaaa 46020 tagatagtct ttttggagat actgttagca gttgatatgt attaagtttt actctcctgc 46080 taacttgtta ttgtaaaatt actccaagga aaaggtttgg ttattgattc gatccgatat 46140 gtgaacccac gttttgttta cctggtttgt attaaaggaa acagtaccaa aactttaggt 46200 tctcaatggt gataataaaa cagttttagt aatataaaca ataaggaata tgagtatact 46260 gtaatccaac caagatttag gcgttacacc caataagtaa aattttcata aaataagcgg 46320 tacggaataa tggtgattag atatattttt tggtacaaaa taaatatttg attaaaagaa 46380 tatcaaaatt gttcgaacat tcacgaaact cacataaatt ttatttttgt ttgtttgatt 46440 tggtttaggt aataataata gaaatatata ttttgtttga attaaaaata tgaaatagta 46500 aatatctttc ttagtgaact attctttcaa aagtatatta tttttgtaaa gatatttata 46560 tgtttttcaa atcaaagtta tctaaattta tatataaatt ctaaattatt tttaaataaa 46620 aatataatat aatacatgta agataatata tctttagttg tatttaattt aataatctgt 46680 tttctctagt aatatagtaa ttagtttttt ttgttaatta ctctatatgc taaaatagag 46740 tataattgaa atatagtcca attctattat aaaattatct taaagaaaaa aaaatgaatg 46800 tgtcattgga gatagaatta aggtatcatt ggtagagtat atatctagaa aagtttccta 46860 ccattattat tatattgata tttaacagta accttttata tgttttaatc ttaatcaaaa 46920 actagattat gacctggtat taaaaaatat tttttttaaa aaattcattt tactaattaa 46980 tatgttttaa catttatttt attgtatttg aaaatattat tttgtattta ttttatatat 47040 atgaaattat atatatatat atatatatat tacttaattt tgtttttcag ttatctcaac 47100 cttattcgtt atgatttttt taataaaacc tctccaaatt atttagataa ttatatgata 47160 tatattttga catattttaa gttatacaac ttttttaatg tcaagttatt gactttaata 47220 ttttatttat atacaaattt taatttaata tgaaatattt ttaaatttaa atgaatgtat 47280 ttttatttat taaaatataa ataaattaat tcattgattt aatttatttc atgtataaaa 47340 gaattattat ttttaaaaaa tatagttgta cttattttca aaattttctt gaattatttg 47400 agtgttttaa tcaattattt gatttactaa ataattaaaa aacaatatta ataaaaagtt 47460 attaaaaagg taagatataa tttttttggt cacaaaatca attagtatct tatttgaaaa 47520 caaatttatt agtatgatgt tattttccat agctatcttt aacgaagttc taatgttttt 47580 ttttttaagt tttaatgttt ttattaatta ctaataacat taaaaataat atattgtatg 47640 acgaaaaatt agattcaaat gaatgtgtct attttaataa gatagattat ctaagaaacg 47700 acacatgaca tgttggtgac tttttaataa gaagagattc ttttatgtca tctctcatac 47760 tttaaaaaat aaaattattg tggttaagag attcaaagtt ttttacacca ctgctgggtg 47820 tgctctttaa gttgttgatt aatgacgatg tctagagttt taattttacc tcaaagaaaa 47880 ggtttgggct gtggatttga tgtgatgtga ccccacgttt tgtttatctg gttcacgttt 47940 ttgaaatcca tcgatataac ttataagcag cagcatgcat cgactgtagt ctttagctgt 48000 catcaagacg tttaccactc acggaagtgc tcagagatct tttgctactc ttttttcttt 48060 gttcaacgga tcttttgcta ccaaaagaga aaaaatatca aagcatagca acttttgcaa 48120 tttgaaaatg cacccaaatt ttctattatt taccaaagag cttcagagaa ttttttggct 48180 atttatggct ccgaatggta acagcggatt gagcggtgcg agacaagcgg tttgactgca 48240 gtgcagttct gacaattata aaaacgtata gatatatggt atatgtagag atttttgtta 48300 ctgtggactg cagtgcggtg cgggacgaat gttaccattc gaagcctatg aagcatccaa 48360 aaaaatttct gtacctaaat ttgttgtctt tcaaaataat tttgggaaac tcgtatatta 48420 accatacaat agtcaccttt gaactataca tgaaaatttc atacatatca ggacaaatca 48480 tggccttgta agaacgagaa ttatacataa tgaaacataa acaaattaaa attaacaact 48540 aacaactcta caaacataaa aaacattatt caaagtttaa tataaaataa cattgtttaa 48600 acttcaaaaa atattcataa ttgagcgtca agtgcagttg tgaagacata aaaacatcaa 48660 tattgaccaa ataccaaaaa tagttattaa agtaagtatt ttaattaatt atttaagtaa 48720 aacataatta ttttaggcat atgataatat catagtatac tttggataca tattaaggat 48780 tgagattgag tttggtataa attttttttt cggattttga aattttcaag ttttttttcg 48840 gatatccatt cgggttcata gtcgaatctg gtaaaattca taacttgaaa taccagagaa 48900 catgatccat tcagtattta tattgggttt ggatcggttc aaatttattt ctatcgagtc 48960 gggtttgatt tggattttcg gattcagttt agttgtccac cactaatttt ctatctaaat 49020 ttgaaatatt ttcaattatt gaactgccta ataccttcac tatttacaaa aggttttgaa 49080 acttatcgcc tatacttgtt gttctattca cacacacaca aaaaagcccg gaatttttat 49140 tttgttttct aactgtactt aacttttgat atttactatt ttaccaagag gtttccctat 49200 aatttgtgct attcataatg atgcacataa atttttctat ttattagata ccccgtaatt 49260 tttgctaaaa gaagtaacaa ctgaagtgtt ccattccata tagtttctat atacaataat 49320 acccctgctc taaaattcat ttaactcggc tgcctagggg gcgagtacac atgaatcggc 49380 caaccactgt ggtgaatcaa cataattggc catattactg gagtattttc atttttgttt 49440 ggattttttg ttaaaactca atgtacttta gttacatttt tactgtgaaa aattacgaaa 49500 agctgtacga aattttttca gagtttgagc ctaagttcaa ttggacgtaa gtcactcagt 49560 taccacttag accaaagagt ttttttgtat tagctacgca aataccctta tataaatata 49620 aaaagttgaa aaactaatcc cgactaattt ctgatttttt gataactcac cgaaactaat 49680 ctcatgactt ggtattcaca aaagatttat aaacttttca catttaccga gtcgcaacat 49740 tgttacagat acactcgctg tcacaacacc aacaaaatat acaaaaaata aaggatgtcc 49800 tataaaaagg aagaatccaa aaatccaaaa aaagtactgt attatacaaa aaccggaaat 49860 aaaaaatctc tgtattaata actccaaagg gacacgtcgg tatctccgtc aaagtcatag 49920 ttatattcga attgtacgga cggtggcggc aaaagcatcc cttcggccat gctagccaac 49980 aaggtcggca tcccgaacat ggactcctcc tcgtccatat aaaacccatc gctgttttcc 50040 tccgtaaaaa tagcctccac gatcgtctcc tccacgtcca agccatgatc cttcgtcgta 50100 tcatttatct cagcctgaaa agccaccgcg gcttcagcag ccgccttctg gatatccttg 50160 gggcatgttg tctccgggat acggagccgc caagccgagt cggcgaaatt gaggcaggcg 50220 gatttgccac ggagggctat ggcggcgacg tcgtgagcac gagctgcgat ctcggcggtt 50280 aggaaagtac cgagccaaat cctagacttt ttgtttggct ccctcacctc acacacccac 50340 ttacctgagt ttctcagacg tactcctctg taaattgggt gacgcgtctc ccgaaacttc 50400 ttccgacccg caggtttctt cggacagctc gcggccagcg tcggacaata ctccccgctt 50460 aatgtaggag actcgtactc ggagcccaac atttcagaga aggcagaaaa tgaggtcatt 50520 gttaactgga taaggttgag tatagtaagg aactagaaag atctcggttc tgatgggttg 50580 ataaatgttt attttatctc tcaggtggat tctaaagttt gtagttcgat aaaaagttgg 50640 gagtgagagt tggtgtttat attggcctct ggaactagag gcgaacaaac atggagtttc 50700 tggttcctgg agtgacaagt gcgagtgtgt gacttgacac ggctaagcca tcccacggtt 50760 agtgtatgcg ctgtttttat tcactaagaa tctcacacgt gttctactga cccacaagaa 50820 atgacttttg agttttgact cttcattcgt tattaagtat ataaatttat taattttgaa 50880 aataatggac ataaacaatc tgcaaagaag atatttttag tgttctcttt ttgttttctt 50940 ccttgatatt tttaatgctc tccctatgcc ttttttttgt caataatctc catgatttta 51000 tttttcattg atattgaata tcctgtctat gtgttttttc ttgatacatt acaaatatat 51060 aaatttatca atcgtggatc tagaaattat tttaactaga agcatatata tattaagata 51120 ataaactatt taaataaact atttttataa aaataatata actatgtaat gttttttgga 51180 cgaaatttat taaaataatt ataaaaaatt agtttatagt attaaactat atttaaactt 51240 agtatctaca acatacacat acagtaatat aatatcaaat cattcacaca tcacagagta 51300 gaaaacgaat gattttatag tatattgaaa acaagagagt tttctttcaa aacatttcta 51360 tctttctctt tctttttatg tcgtttcaat ggaaaaaaaa actagatgaa atatttcgtt 51420 tgaacttgcc ctagatcttt tcatttattt ttcaatatac aatacaaaat cacttatttt 51480 cttttctcat gatactggtc caatagtaat ttggagtagg taaagaacaa tttgtaaaat 51540 atacagttat gattagttct gttcaaataa aaacatagta ttcgattgcg tttctcttat 51600 ccagtcagat ggttcttaaa gtactaggta gtataatata ataatataag ttaatctaag 51660 atgaattgag cgaataattg agcgaaaata attgaccaca ggattagacc gatagaaaag 51720 caaaaaaaaa catcactctc atttgctaaa aaaaaacatc actctcaatc tcaaaatata 51780 tcgataaaat atctgaaatc aaaataatat ctttttcttt tttttgaaca catcaaaata 51840 atatctatga aaaaaatcgt ggtctaaacc taaatcacgt ggtgtgagta tttaaagccg 51900 gacgatcgat caaacttaca agattttata ttcttactat aaatccagaa agtagtttat 51960 attcctaagt ataatggaaa caagaactta accaaaccaa aaaaaaactg aataatcttt 52020 tttctgtaaa ctaaatacaa aactgtgtca aattttatac atatctattt ttttaaaaaa 52080 tatccaaaat ttagaagaat tgaatcaaaa accaagtgga atatcaaaga ttttattagt 52140 atagatatct ttatcaacat gtatctaaaa tttcttctaa ttaaattaat aacaagggat 52200 gataaaaaca tgggaaatgg tgggaatgca accattatca tgagagtaac tgagatctta 52260 ttatggtaag tttaagaata ggtataatta taagattaat ggtttattaa gtagtgatat 52320 aattatataa gatttgaatg gtacatgtga gaattatata acatgaagca acattgttat 52380 aatttacggt gtcgggtcca gactcttccg gcgtttaaag cagataaaaa aactgatgcc 52440 ccttaactat agtaaaattt tactatattt taaatttata atcaaaataa tgctaaatat 52500 tattacaatt tatgatattt ttaaagaaat aaaatgcaaa acatcaaaac attttgcagc 52560 tcctctagac tgtttttcct tctcattgtg ttcataaaat ttcacaaaaa ttgtttatat 52620 atgggtttat tcagttgaac tcatcagagt attattatca tagtccaacc accaagcatg 52680 aatcttgtgc attcttttca aacttataat ggtttataca ccatctttta tattatatta 52740 tttcgaagct ttttttaccg taagtttttt tctgactcta catctagctt attcagtttc 52800 ggaatcaaaa agataaaaac gttttctttt ctaaaatagt agtgtttttt aaaccagacc 52860 ggtctgatgg ttgaaccggg tttgaccatg aaccggttgc atagcagggt tggaactaat 52920 aattggtttg accatgaatc ggttacgtag ccggattcga tctcaaagtt attaaactga 52980 taaaaatcat taaaactatc aaaaatcaat ataccattca tttaaacata aaacaagttt 53040 atatttttaa tattttatca tatttcattt atatttttaa ttatgtatca tatttactaa 53100 cattaatttt aaacttatac actaaaacat agaaagatta tagaaaacaa actattaaat 53160 ttttttgaca cacacaaaag aaaaggatta taccaacatg ttttattatt tctggtatca 53220 ttcataaggt gaaaacaaaa atcaaatata accataatag ttgtaaaata tactagttaa 53280 atacgtttta attataccaa ttataccgat tgtaatagct atattcgttt tagttgtact 53340 agttatatta tttttttgtc ataacaacca atgaaaaatt attgattgaa gaagattatg 53400 agttaatata ttttcgttga attgtatttt tttggtgaat catgtttttg aaagtattat 53460 aagatgaaga agatgaaaat agattttttt ttgatttaat gtaaaaaata tccagaaatg 53520 aactggtttg gtgatagata gcaaaaataa atttaacaat gtatcacctt tcgttgacaa 53580 aaaaaaaaaa aacaatgaat cacctttctc atttaaaaat aataaaaata ataagaaata 53640 taagtattgt agaattttaa taagccacta cgggcacata agaatttgat cccacacctt 53700 tgtgacaacg cctcggcgct ctggaacttt ctcgtcgcaa cattctcttg actggctcaa 53760 gtttgacctc ctgttaatcg taagatcttt ttcatgaata cgattcctct agatttgttt 53820 tcgtttcctt tttgtttctt gattttgttg ctacgaactc ttagggtctg cgatgcttgt 53880 gctttgcgat agctctctat atctcttaga ttcttttcaa gaaagttgat agcttcatag 53940 attaagtatt agatctctga aaaatttgca actttggaat aacagtgttt cggcttaaat 54000 tgctgcacat aagatgttcg acgatattcc tctgagaaga taactactag acatgctttt 54060 gttttccaag tttcggtttg attttactga acagtaatca catacgcatc tctttatgga 54120 tgagacccac cacatgtata aggaagtgac cattttattt tggcaggttc actgtttcag 54180 tagccatggc aaagcatcac cctgatctga tcatgtgccg gaaacaaccc ggcattgcca 54240 tcggacgact gtgtgagaaa tgcgacggga aatgcgtggt gtgtgattct tacgtgcgtc 54300 cctgcactct ggtgcgtatt tgcgacgaat gcaactacgg gtcgttccaa ggacggtgta 54360 ctatttgcgg aggggttggg atctcggatg cttactactg caaagagtgt acgcagcagg 54420 agaaagacag agatggttgt cccaagattg tcaaccttgg gagtgccaag acggatctct 54480 tctatgaacg taagaagtat ggattcaaga aacgatgaag atgtattggt ttgcccgatt 54540 gctggatctc ttatgctatg tctgttgcat gataaaacta atatgtattg ggtataaaaa 54600 acccatacat tatgctttct ttttcttgat aatctagact ttattggact tatcttagtg 54660 tctaaatagt ctcttgcgtt gtgtatcgtg tttgatttca tcacaccaca gtagaagtag 54720 gcatgttctt ggactcttaa tcatgttttg attgaataca aaattactaa actacatgta 54780 ccgctcaaat gcaatcatgt taaaacataa taaattttag tttatccaaa ctgtgcgagt 54840 ttaaataaat aaaaatgtta ctaaatactc aatccgttcc acaaagatcg atttttttag 54900 tatttttacg tatattaaaa aaatacatta aaccgtcata attagtgtat cattttcaaa 54960 aaaattaatt gattttattg aattatcatt ggttaaaagt tattaaaaca taaaacaaat 55020 tttttttcta aaaagtctat catgacggat ggagtaatcg aaaggactgg tgtaacaaac 55080 aagagtgttt gaggaattgt tgtgatcact tgattagcgg atgcagtagt ggttgactga 55140 tcattttctt atataaactt gggtctgttt caaatgtaaa tcgtgggtct atttatttgc 55200 agtggtttaa aaatgaaaga tcatcgcatg aactaatttg atgattatgg gctatctctt 55260 ttttctaaac ccagaaaagt ttataagata gatgggccca aagcctgtta agaatcgtat 55320 tatattattt taaaaataga agcaagaaaa gaagaaagat gaaacttctc cttcagctga 55380 tacagatctt ctagacagag acatattcaa atgcttccaa agctcaggga aaattcctaa 55440 atcagattcc atcactttga ccaaatacta agaagaagaa agatgttctt gatcaagaac 55500 ctcagacgaa tctcgccgac aacctcctcg gccctgatcg gcttccgaaa caccggatca 55560 ccccctctct cctcccgttt ctgcaccact ctgaatcaac cccaacaggt ccagactccg 55620 gctcccaatg gattggatcg gagccgttac gaaggtttgg caccgacgag agaaggagag 55680 aaaccgagag tggtggttct cgggtcgggc tgggcgggtt gtcgtttgat gaaagggatc 55740 gatacgagca tctacgacgt cgtttgcgtt tcccctagga accacatggt cttcactcct 55800 ctcctcgctt ctacctgcgt aggcactctc gagttcaggt ccgtcgctga gcctatctct 55860 cgtatccagc ctgccatctc gagagagccc ggctcgttct tcttcctcgc taattgctct 55920 cgccttgatg ctgattctca tgaggtatta ttactgtggg aatcatctga atctcagcat 55980 ttgtaactga accggaaaat tcgaattgaa ccgatccata ccgaaattga ttttgtaggg 56040 ttgtatttgg gatgtcccaa aaaaaaccaa acaggaaaac ccaaaaaaac tgaacctata 56100 taaatactct ttttttagga acacctatat aaatgcttta aatattcaat cttataagtt 56160 attttgatgg attttgtaat aatatccgaa tccgaagtat tattaatcaa acttgaaaag 56220 gttcagatct tagacaatgt tataaaattt actagaatcc gaagtattat taaccgaatt 56280 atgatccaaa cgtatatttt ttccgtttct aaaaaattca tattttagga ttttcacatt 56340 tattaagaaa atatatcaaa ttttagttac ttatacatta ttttccgtaa ccaactattt 56400 cccacaagtt ttcaccaata gaattttaat aaatacaatt atgttttttg aagtttacaa 56460 tttacattta atttatgcat tgaaaatatg aaaatctatc tttttgaaac aatttttttt 56520 tctaaaacat ggatatttta ggaacggaga gagtataaaa attcttctgg aaccgaaccc 56580 gaaagctcat gcacttttga tgaaaaatat ctttgcacgc tttcttaaat gtttgtcatt 56640 ggggataggt tcactgtgag actttaactg atggcttgaa cacattaaag ccgtggaagt 56700 tcaagatagc ttatgacaag cttgtggtag cttgcggtgc agaggcctcc acttttggaa 56760 tccaaggagt tctagaaaac gccatctttc tccgtgaggt tcaccatgct caggagattc 56820 gcaggaagct tcttctaaac ctcatgctct ctgatactcc tggtaagtga taaacaaata 56880 atgttatatt tctcatgaag aatcaaaatt attagcacag aacactttgt tttaaattag 56940 gaatatcgaa agaggagaaa cagaggctgc tccattgcgt tgtggttgga ggtggaccaa 57000 ctggggtgga gttcagcggt gaactcagtg acttcatcat gaaagatgtt cgtcaacggt 57060 atgctcatgt gaaggacgat gttcatgtta ctttgataga ggtttgtttt caagaagctg 57120 cttcttcagg ttcctcctta tgtgtgtttc atcacttcac aattgtctct gttttatgtg 57180 attatttaca ggccaaggat atactttctt cattcgatga tcgtctcaga cgctatgcta 57240 tcaagcagtt gaacaaagtg agttcattaa tggttttaaa aatcaatcta ggcggcaaat 57300 cgtagtcgaa acattttttt tttaaatccg attatacgat tcaaaccagt ataaaccatt 57360 cttaatcggt ttaaattgat ttaaaatagt ttaaatctgt taaattaaat aatcatgtta 57420 gtacagattc acaacttgtc ttaatttttt tgttttgtat tatctaattt tgataataca 57480 tcgaaataat tatataatta aatccaaaaa ctaagtatct tatataaata taaaataaat 57540 caataattca cttaatcatt agttttctac attataccgc ctagcgattt cttgtggtta 57600 atttataaga cgtgaaatgt ttctgtgctc attattatgc tgcattcata tacattatta 57660 gtctggagtg cggtttgtgc gtgggattgt gaaagatgtg aagccgcaga agctaatcct 57720 tgacgatggc acagaagttc cctacggact cttagtatgg tccactggtg taggtccttc 57780 tccttttgtt agttctcttg atcttccaaa agctcctggt ggaaggttag ctcatcaaca 57840 tcactacatt agaccctttt ttttttgcga aaaatattcc acatcggcta agactttttc 57900 tatctttttg tccctgtata gaattggtat tgaccaatgg atgcgtgtac cttctgtaca 57960 agacgtgttt gccattggtg actgcagtgg atatcttgag accactggaa aaccaaccct 58020 tcctgctctt gctcaggtaa actttttaga tagataagct tcataatcgt ctataccttc 58080 tcatgccttg ttatactacg ttactgctca attaaggtag ctgagagaga aggcaaatac 58140 ttggcgaatc tactaaatga gattgggaaa gccaatggag gacgagccaa cagtgcaaag 58200 gagatagcac ttggagttcc ttttgtgtat aagcaccttg gaagcatggc aacaatcggt 58260 agatacaaag ccctagtgga cctccgcgag agcaaggtaa caaatatttg actatgattc 58320 acctcgtaaa acaatgtggg gttgagagag attacttggg caggacgcaa aagggatatc 58380 aatgactggt ttcgtgagct ggttcatatg gagatccgct tatctgactc gagtcatcag 58440 ctggagaaac cgcttctatg ttgctattaa ctggttcact actttcgtct ttggccgtga 58500 cattagccgt atctgatgtg tccgaatcca ccagtgtgtt ttgacctcgg tttactttac 58560 acgtcgtcgt tttttgtaca aaattacaat aacacaatct tctgaagact gagaaggttt 58620 taaattatcc tctttttttt ttgttgttac taataatatc tttggttgtt gcgatttcgt 58680 ttgaagaaaa aagaataatt cagggttaaa tatttttttc agggttaaac aataagtatc 58740 tggaaaataa ttatcagtta tggattagac agatgcccta aagagtttat atttaaagtt 58800 tctattttga ttgaattaga aaatattatt tatagtttta atatgatatc ttaaacaatt 58860 ttttgcatca aagtaggata gttgctgttt taatttttaa tgtaaaatca agttggtctg 58920 caagggaaga catccaagcg accgcttagg acatataatt ttaaaagaca tatttttata 58980 tatttatttt tattcagaac ttcgatagtg tttatatgta aaaatattta taatattttt 59040 gataataata atatttgtaa gaatttttac cctcgttaat agaactctca ctaacaaata 59100 aattggaaaa atgtattgat aaataatgat tattttaaaa tgtaaaattt tgcgtgaaat 59160 atttatggta atgttaacta atattgatgt gcagttaatt tattaaaaat atgtttacca 59220 attagtagtt gaccaaattg gtttatcaag ttttaatgtg atttatatca tatagatatg 59280 atattagata aaacataaac atatatatta tttgcagaaa ggctaaccta aaaagaaaat 59340 ggataaggat catgatgact atcccaccat gcttgttgag atagtacctc ttaagatatt 59400 ttgaatttca atttatcaaa tagatacttt attgattgaa aatagcaatg ttagtagctt 59460 aaggtatagt attaaagatc aaatgggctt tgaatcattc ggactacgta tgtccaatag 59520 aggtttatcg gctctatacg ctgaaatgaa aggactatta tgacagtatc atgcatgaga 59580 gacgagaggg ttcctttggt ctggtttcaa atggattgct cagatttagt ggatatgact 59640 acgagatcga tagactggct gttttttgct ttggatattg gtgtgtttcg gagtttacat 59700 gatgattttg agagcatgag catgtacttt ttagaaaaac gtctcatcta atccatatat 59760 ggtctagtga tatgaatagc tgataaaaaa aaagataaat tgatttttaa ttttaatctt 59820 tctggttctg aaccggattg tagatttatt tatttattta ttttagttgc tttttctttt 59880 tttccacaaa tttttttatt ttaataccaa aaaatttaac atatctaatt tgaaaacttt 59940 tgtcaaaaaa atcttagggt atccaaagat gttagatcaa cactatgtaa atttacacga 60000 tttatattag gtttgttttg tagatagatt ccctaaggct aaaacatcag aaaataaagg 60060 taatatttag ttgcccaaaa aaaaaggtaa tgttaaatat tggatcttat atattcacat 60120 gttcatgtca gttgccacgc atgctcatgt actactatgt gtgtgcttgc aattcaataa 60180 acaatgtcgt cgtatttaat atttctgaaa agtctttgta gtttgttatt cttaaaacta 60240 tataaaaaga tgtttttttt ccaaatcgtt ttacacggaa acataatgca aagtaatatt 60300 attttaagaa aaggtctcat gtacagttaa cgaaaggaca agatagggaa taaagtgaga 60360 aaatacaata ataaacaaag aaatgaatat tgaaatattg gtctataaaa tctcaggacg 60420 gctacggtga caatgtctaa aactcatttg gtctctctta tgtccaaatc agattttttt 60480 tctctgaaag aaggtctacc aaatcaaact tcttctctac cgattgctaa acgactcaca 60540 ttcatcacgt acataactaa tattttctct gtttcaaaaa aaagatgcat gttttataat 60600 tcttatacat attaaaaaaa atatgaaatt ttgattacta atatagatta atttttgtaa 60660 ctaactattt ctcctaattt ttaatcaata gaattttaat aaacacaatt atatttttca 60720 aagtttataa tttatcatta attaatacat tgaaaatata aaaaatacat ttttagacaa 60780 tttttttcta aaacatgaac ttttttggaa cagaagaaat aattgtcttc gtaaatatct 60840 ttttgcctaa tcgttataaa actttaaata tataaatggg agaatatatc gtttagatcc 60900 gataccaaag gggtttgtca attatttacg aacgaaaatg gcatgaaaat gcctatgtat 60960 ttcaatcaag gcccttaaat caactgtttt ctctcagcaa aagtaagaaa aaacgatttc 61020 aagactccag actcatgatg ctatttgaga aaataattac ctcttattca tctagttcat 61080 gtttttaatg catatatgta aaaagatgaa agtgaccaaa tgtgccagca aaaacaggac 61140 tatgacttta cctttcagct ctattattta aactttgctt atctttcccc caaccaacta 61200 agaaaccttt gtctactttt ttgtagacat ttgcgcaaga gtcagtgtga acttattgat 61260 tcggggaagc aaactcatta ctaaaggcat cattatcagt ggatttctac agctgagtat 61320 ttagacattc gtttattaat attttaaaat aaaagaattt ttataatcat tctacagctg 61380 agtttatgaa cattaacagt agatttctac agagaagttt gaaatagtct tgtatcagtg 61440 acaaaatgcc taatgaattt atggtttctc aatatctcta aagagtttct cagcaaaaag 61500 acaattctca ttttttactt ttatgatatt tttaatacaa aaaactcatg aaagaaatgc 61560 caataaaaca aggggcaatt tgttggataa ccatagtagg aaaacaatta acaggtaata 61620 aaagaatata aactctgaaa cgtttggttg attgaagcaa tgtagtaaat ctgaaactta 61680 tttggttgat ccaaaccgaa acctgttctc tctaatggga gtatgcgtcg ttgtaagata 61740 ttcaccgtga tcatttacaa gttgacagaa acaaaaactt tttcctaggg aaaatattga 61800 tgaatcgaaa aaaggagaaa gcctcgaacg agatgtcatt gtttagggcc aaataattaa 61860 ctggataatt agagatttgt tagaaagtaa agccattgct tctttaggaa tagaagacaa 61920 cgtgtttcgt cgtttacacg tgcacgtaca acatcccatc tttctttttc ttgtccaaag 61980 ccatcactct ttttttctga acaactcttt gaattgttta atttacatct aattatcttc 62040 aaaaattggc ttgattaatc acatgagatt ggtctaatgg tatgtagact acagagagat 62100 ccgggttcac taaacctgta taatcataag gatatggacc attgtttaca acccatttaa 62160 aatatgaaag aaaatcaatc catgacttcc ccttagaaaa ttaatatgga ctcttccata 62220 atagtatctt tgaaaaatat atactctgtt agatataaac catacatata aatggtttgt 62280 gatgctgaag agacatgtat tcatgaagtg atcgtgatct ttaactgttc tttttcttaa 62340 tggttgtatc tttaactgtg ctttgtattg atagattagc cacgttttta ttcaacgcac 62400 acatattatg acgaatatta agggctttaa tgtacgcctt tcacctttgg tggaccacta 62460 atccatgtta atgattttgt tatgagaagt atagaagcaa ttcacttatg acaaattgac 62520 aatatagggt ttcggaactt cggttccgcg cgaatctcct ccaaaacaat gaaaaaaact 62580 cagtttgtat gggcctagct agaaacaatg gtctctggtg ctatgaattc gaacattctg 62640 gtgctatgaa ttcgaacatt cttttgaatt catatgatcc tctacaaggt ctgaaccaag 62700 ctactctacg gtccatgact ggcttgcgca actttagtgt agtccagggt tttttttgtc 62760 gtggtgatga gtctatatgt ggttggaagg ttcatgcagt acaataaatc tttgttttag 62820 cgagctgttg tatatgtggt acacgaaaag acatcattct tacgacgtgt tctataccaa 62880 ctacattccc tcaacacttg tattggtttg ttcgtctgaa tcaacaattg tgtcttttaa 62940 atgattttta tgattagttc aaaacccaaa atagttaact aacggggcaa aaatggtaac 63000 gaatagctta actgattata ttttccttta taaccctaca cattagagat atttcagtgt 63060 aatatataag ttactagata ataacccgcg cattgtgcgg gatgtgatta ttagttttct 63120 tatttttaat aaaaagacat taaatctatt taatctagat attagttcgg ttttaagttt 63180 ttttttggat tttaatcttc taaaataaac tattatttta aattaatatt cattttagtt 63240 tattcggtta aaatgtttga ttttttttta tccggtaaaa accaaaaatt aatattattt 63300 atttattttc atgttatgaa ttttagatag tcgtcatgtc aaaccaatag attcatatta 63360 ttgtttctaa acagataata gttaagaaaa ttattaagac aaattatttc actacaattt 63420 ggttggtagt gaaagaagca ttaagaaaaa atattttaac tttcaaaaaa aaattagata 63480 cttcagttgt ggtgaatact tagttataag gtgctcacat caaaatgcac atgtatgtgt 63540 atgtaaaagt atatataaat agttgacaaa tatataaaga tattgttagt taataataaa 63600 tgacattttt ttttcaaaac aatacatgaa agataaaatt aaaattaatt taaaataaaa 63660 aggcattgac gttagtcatt tttttatata aataaattaa aattggatcc gtaaatagag 63720 gtggacacat atcgaatatc tgggtatttg gaaacattcg tgtcgattcg atctttagcc 63780 acctagatat tcggtgactc ggatatccaa aatattttag aattttaaag aatatccgat 63840 ttgatccgta aataaaataa aattttaaaa ataattttaa taataaaatt ttattacaaa 63900 aataaaacat tatttaactt tttaaattat agtacctaat ataataaatt taattcatta 63960 aaatattgta aaactaatat aaagtataat atataacgta tatatataat tctgtacata 64020 tatgtatata tatgcatata acatagcaaa ttagatattt gttcctaaaa atattggtat 64080 ttgtgatttg cttctttttg gatattgtat tttagtattt gatttatttc ctagagttaa 64140 gtatatccag attttttggt tcaaatcaaa acggataaca aatcgaatcg aaatttatga 64200 atattttgct caattttatc tgtaaacaat aaaaataaca tatatatatg gtttggcttt 64260 tgatttgtta tctattttta ttcgaaccga aaaatctaga gttttattga aaccatgtat 64320 gtgagattta tgttaaaaaa aatgcaaaat acatagtgtg cacacattta tgaatatagt 64380 atgaacgcgt tagtatattt attatcaaat cattgtgagg ctgccacgtg tctattatag 64440 tgtgaatgta tttattacaa tgcttctctt ttaatataca agggattttc attgtaattt 64500 gcaaatttat aacaggcagc atattccccg ggcctactct tcatattatt tttggtgagt 64560 agcgtaatca tagatagttt tcttaattct tgaacttggg taacatcgtg ggtatctacg 64620 aaatgattcc tttcgacgta cacgatttat agataaacac gtagagacgt gtataataag 64680 cgagaaactt atttagcagt gttagagaaa tatttgagtt aacagactat agaaccttta 64740 taaattagta ttcaataaat taatattttt aatattcaat aattaatatt ttaatcttca 64800 gtaaaaaaat ataatattcg ataacttagt attcaataaa ttaatatttt caataaatta 64860 atattcaaaa aattaacatt tataaaaaat cattaaatta tattgtctca ttacaattgt 64920 aaattaataa ctgatgtata aaaattatat aaacataaca aaatattgtt atgtatggtt 64980 tttatttaaa atgaaactaa ttctaatttt ttcaacactt caaagtattt tataattata 65040 tatttaaaaa tattaacatt atgtgattca tattatatat atgtcaaata atttaataaa 65100 cactatgaaa gctaagttta caaaacttaa ttaatatata attcacgaaa aaatctattc 65160 cttttatttt acatataaac atattttaaa atatataaat ctaagtatga tattttgata 65220 aattactaat tttataaatt aaatattata gttcattaag tattttgaat aattattgga 65280 tctttaagta ttttgaataa ttattcaaaa ttgactcatt ttgtttttta agatttttaa 65340 aaaattgagt ttttttttcg atttccgtta gaatttgatt tgggtaaaaa ctaaaatctg 65400 aaataccata gaataataac catttggata cttatgtcga attcaaaaca gtttaattct 65460 caggttcaaa ttttcatatt gttttttcat accatagaat aatagccatt tggatactta 65520 tgtctaaaag taatataatc tgagacaaaa tataaaaata taaggattta tatatttcaa 65580 ccatatggat atggttgtgt gatacgaaag tgttagacat tatcgatttg aaatctatca 65640 ttcagatttg tcttttacat ggttaaaggg tgtgtgaata taaaactttc acgtagaaca 65700 acggatttat ctgttgcctg aaaaacaggc taaacactct attatgatta gtcttagatt 65760 taggacaccc ctggtccata aaaaaggtct tacatattta ctttcgcata catatttttc 65820 taatttaatt tcactgaata gaacgatgta acaaagtaac aaacccattg catttaaaat 65880 tacagcaaat tatccttttt ttaaatatat aattatttct ttaaatatat atatattttt 65940 ttattttttt ttcaacaaat atataattat taaaaaaaac agttttgagt atctcaatca 66000 attctacaga cttacacatc ctccttcccc tttatataaa gaaacttcag acctcaaaat 66060 acatcgaacc ctttcttcac cacattccac ttcccacact ctcttttttt ttgaattata 66120 gagagagaat cctcctccaa atctctctct ctcccaggat ggttgttgct atggaccaac 66180 gcaccaatgt gaacggagat gccggtgccc ggaaggaaga agggtttgat ccgagcgcac 66240 aaccgccgtt taagatcggg gacataaggg ctgcgattcc taagcattgt tgggtgaaaa 66300 gtcctttgag atctatgagc tacgtagcca gagacatttg tgccgtcgcg gctttggcca 66360 ttgccgccgt gtattttgat agctggttcc tctgtcctct ctattgggtc gcccaaggaa 66420 cccttttctg ggccatcttc gtcctcggcc acgactggta aagtttcttc cattttgcat 66480 tgcatcgatt tattgaatgc acgttctacg agtattgttt gtcagttact tcgtaaaatg 66540 attcttttga tgttcatttt ttgaagatct aagatttttt ttttagattt tctttttaaa 66600 tcattgttcc accaccacct ttcatcggtc gtacgactcg ttacaacacc acatctttat 66660 tttctataat tactactgct tccgcatttt atggatctct caacttataa ttaaagtata 66720 atatcaagaa tatctattat ttttcttaaa caagaaagat aatattgttt ctttgttatt 66780 ttggtgtatt tccaatctat ttcgagattt agaaatgtga cacgtcatta ccttgttgaa 66840 gtgtttaaaa caaacatgga aagtttaaat aaatagtgca ataaatgata tatatgtata 66900 tgatgaataa tgatgtgaaa tataattgaa taatggcagt ggacatggga gtttctcaga 66960 cattcctctg ctgaatagtg tggttggcca tattcttcat tccttcatcc tcgttcctta 67020 ccatggttgg taagtcagct tatcaaccct ttttactata ttattaatta ttaaacttgc 67080 atttgtatac ttggtgcaag ttggtaaatg taatctgata actgaaaatc tattcattgc 67140 tcgttctatt ttttttttgg ctagagacaa ttttataatt aaataatgca tgtgagaata 67200 tgactattta tgtgaggtag cttttcttat tcctgtcgaa aagcatcaaa tctttagcaa 67260 cgaaggaaaa aggaatcaaa ttttttatta aatgcaatgg gtctatgtct tggtcattag 67320 ttttttgcat ataatttatt tatatttttt tcttaacagc agctaattta attataatta 67380 aatattcatt ttataaataa tattagacca attattaaag gttagatatt ttaagaatta 67440 ttcatgactt tgtttattgg aactcctttt atcttttaat cttttctatt tctccatttt 67500 taataatgag aaactgactt caaatctcca ataaagatgg tcttatgtag taacagtata 67560 attttttgtt tggtaaatgt aacatcatct tcaaatatct ttgaaaatag acttacatgc 67620 attattttgc tgcgacatta ttgtcactta ttcctggcaa taaattagtt tattactgaa 67680 cttttttttg gtcaatttat tactagtaac tttaaactta aaagagtgag attgtttgat 67740 caaaaaaaat aaaaatagag tgagatagtt agaatctgcc atgaaagcaa cactatatag 67800 acaatttaat ttttatgaaa acacatttaa taatttgagg ctgcaggaga ataagccatc 67860 ggacacacca ccagaaccat ggccatgttg aaaacgacga gtcttgggtt ccggtaacat 67920 ttccctcttt aataatttct atttttctgt caaaataatt agtttttcga aatttgaggc 67980 cagaacgacc acttgtcaaa tttgattttt agctgtagta aaaacagttt gctagtgtca 68040 cagttaaccg gtaattgatt ctttttaacg atttatagaa gtaacatttt tgtaaaataa 68100 aatatacatt atggtatgtg acaacggacc acgcttattt gtattggtga atcttttaat 68160 tactccctcc aatttatttt agttgcagat ttagatttat gcacatagat taataaaaat 68220 attttgcaca ttttcaaaat aaaaacacca ttacttatac aactaaccat atttcaacca 68280 ataaaaataa attagaaaat attatttata aattttgtat tgaaattata aaataatact 68340 tattttaaaa cgaaattaat ttacaacgac aattaaactg aaacggaaag aaattattaa 68400 tacttaatta aagagttttt agaaaaattg aaagacatgt ttatgcgaaa ctcatgtgaa 68460 agtctttgaa ataatagatt ttggtataaa tatttcaaat tttcttaaaa taataattat 68520 atattaatat aatttgtgat aaaatctcgt caaaaactca ctaatgcaaa tgcttttatt 68580 ttgaatttct tactcctcta aatgcattta cttttatact aatattattt tctttctcta 68640 atttggcgtt tcgtaatagt ttgtctgtat tttgaaaact aacaaaaaat aataaaaaca 68700 aaagcttata aacacatagc atgcaatgaa tatgtacgaa tatatatacc aatacatatc 68760 taagtactat ttttccaagt acttaatctt gattactaaa attcatttta attgttcctt 68820 tcagttacca gaaaggttat acaagaattt accccacagt actcggatgc tcagatacac 68880 tgtccctctg cccatgctcg cttacccgat ctatctggta ttttttaatt cctaaaattt 68940 actacaagtc attttagact gtgttttaaa acaatataat tatttttgtt tggttttact 69000 gcagtggtac agaagtcctg gaaaagaagg gtcacatttt aacccataca gtggtttatt 69060 tgctccaagc gagagaaagc ttattgcaac ttcgactact tgctggtcca taatgttggc 69120 aattcttatc tgtctttcct tcctcgttgg tccagtcaca gttctcaaag tatacggtgt 69180 tccttacatt gtaagtttct tagtatatca taaagggtat atatttatta ttcaatatat 69240 atactatatg atttgttttt gtcatatatt tttgaaatat tcagatcttt gtgatgtggt 69300 tggacgctgt cacttacttg catcaccatg gtcatgatga gaagttgcct tggtacagag 69360 gcaaggtaat taaattaact attacaagta ttttacaaaa aactaatgat tagtatattt 69420 gattaatctt aattcttgat gttttgtgat taataatagg aatggagtta cttacgtgga 69480 ggattaacaa ctattgatag agattacgga attttcaaca acattcatca cgacattgga 69540 actcacgtga tccatcatct tttcccacaa atccctcact atcacttggt cgatgctgtg 69600 agtcatctca ctctctggct actttcatca aaaccatttg attaaagggt gattaattac 69660 taatgtagtg attttaacaa atggaatgtg acagacaaaa gcagctaaac atgtgttggg 69720 aagatactac agagaaccaa agacgtcagg agcaataccg atccacttgg tggagagttt 69780 ggtagcaagt attaagaaag atcattacgt cagtgacact ggtgacattg tcttctacga 69840 gactgatcca gatctctacg tttatgcttc tgtcaaatcg aaaatcaatt aaactttctt 69900 cccccttttt gtttagcact attatgaata aaccagtttt ttttacttat atattgttgt 69960 ttttaagtta aaaatgtact cgtgaaactc ttcttaattt agatattatt ccatttacac 70020 tgaaaaacat acaatttcaa aggttgaaaa gaaagacaaa attttctaga atgaccctaa 70080 aatccctttt atcacaaata tagtcttcaa ggatcaaaat taccaacata tttcattaaa 70140 aagtaaatag acacttatac tcttagagtt aaaaaatagc ttcaaaaaat ttttgaattt 70200 caaaataaaa ttttgaaaca aaattcgaaa aatgtttcat gcacctatgt atatgtgtct 70260 gtgtctgtgc catcgttgtc caaatgtaag tttgcacgat cagtagtatt cgtgacttga 70320 gcatctatgt catgctctcc attcccacat gattttagag agttatgttt catgtcacag 70380 cgggggatct agagtttgca tgggttgatt gcgggttcag aaccttcgtc cagttcccct 70440 agctgcggtc aaagtagagt tttctctttg gaggaccatg tactctgctt cgagctgagt 70500 tagtctctaa gcactttatt ctagcggttt ggaatttctt tccatctgct attttaagtt 70560 ttgaacctct gaggtgactc ttggattgca tgtagtggta ttattgtttg ccgtagctga 70620 gttcatctct tcaacttact tctccaaggc ttcaagataa gcttggaaaa ttgctcatgt 70680 attaatctat gtgactatgt ctagcaatgt acgcacaatc ggtataaaat tttaatagtt 70740 tattttttgg tcaacaaatt tttaatagtt tttttgacca aaatattttt aatggttttt 70800 aatatgtatt tctaatggaa aaactgatta aaatggtttt ccaaaaacgt caatgaaatt 70860 attaattttg taaataaaat ataggattat ataaattagc gttatgtgag tattgactta 70920 gtaataacaa taatcaatta taagtctaag ctcaatgtga tgattttttt tttttgcttg 70980 aaatgtaatg acgatgatga aaaaaattcg caatataaat aaaaagttaa tactttgtaa 71040 tcataaattt atctttagaa aatttattgc attgtattaa agctttacat tgttttgtct 71100 cttcataaaa aaattaccaa atttttttaa gtaatcttat aagaaaagaa aagtctgtaa 71160 caaatataca aagctggatt atttcaatat attatttgag aaatattaca atatttgagc 71220 tatgtcatgt gtcattatta gaatgctttt taaattatct agaaacataa gttgatctat 71280 ctaaacatat attatacttc tcattagact aattatacaa tcaaattaat aatctacaat 71340 taatattttc attctttcct tagaaaaaac tacggaatta cctaatgtga ttcaaatata 71400 tatttgacaa ataatgactt ataataataa gtatttgata acaatttgtc tatcctcaat 71460 cattttgttt aattttatat tattaaaata aagtaaacaa tcacattaac catataataa 71520 aatttagatt tttagtatat aaccacatta aaatgtgacc agtgatttaa atttcttgtt 71580 ataagaatat ataaatgatt ataaaaccat atgagtgaaa atttcattta ataatcattc 71640 agatatatat ctacatatta aactatatac catataaaat aaataaatat tttaatttca 71700 attgcattga agaagtattg aaaacttaaa attttaattg caaaattttc attgaatttt 71760 tataaattat taaaactatt aaaaatcaca cattgaaaat ttgttagtat tggttttgaa 71820 attttgctat aagcatatat aaataattat aaaaatatat aagtagaaag tctgatttaa 71880 tagatagtca tattaaaata tatattatat atctatgttg ttattatata aatttaatta 71940 tatatcacat aaaatagata aaagtgattg cttgaattta tttagcataa aattattcta 72000 aacaaataag agtaattgtt ttggtttatg tgtttgcgct ggtttaaata tatatacaat 72060 agttaatggt ttctcaatta ttcaatatat atatatatta tttcataata tataaaaaat 72120 aaaataaata ataatatata aaaataattt gtatatacaa taatcattct gtgaaggaat 72180 tttaaactag taaattatat tacttcagtt tgactttcct tttcgaggta ttaatagttg 72240 ttgcttggta aggaatgtca aaagtcaaaa ctaatagtca gagtcaaaaa catatcatct 72300 ccagtatagt atataatcaa aaaggatcca tatatttaaa gaatatttca aatatatata 72360 tgaaaggttt tagactcttc atattcataa gaaaaaacta aaacaataaa gacaaaaaaa 72420 tcaaaatgat atcaataaga aaatgttatt ttttggcgtt cttgtgtttg gcgattctct 72480 tgactctaag tatgcaatat atgttgatta ttttgtttct atttgttatt atattatata 72540 tcccttcatg tatgtagtgt aacatattat ataggtttcg gttaaagtat atacatttgt 72600 ttgttatagg ataagtcttt gagatattga attgtacact aacaaaaaaa tcatgttctt 72660 aaataactcc ctaatttctt tttaaaaata tatgctcaga tcttgcggaa gctcaagata 72720 ggagtaagct aattcctata ggtccttgcg cacagattcc gaactgcagt cagacatgca 72780 aaaattcagg ctttgctaaa ggcggacaat gcatcaaatg gtatcctaat tctattaagt 72840 atacatgtgc gtgctttgta aacgctgcta caccggctgt ttaagataat aactcttcaa 72900 atttgaacta aaaagatctc aaatgactat ttaaatagaa tattgaagaa atatgtttta 72960 tgcaaataaa agtgcatttc aattttaatt atgttctcaa tgtggactgt tatatgatca 73020 tatatatata tatatatata tattctgtat gaaataaacc gaattaataa agtttagaat 73080 tgttgtcaag tttgcaatca taaattttca attaataaca acgaattcaa gatatgagtt 73140 atctagttca cataactaac atgagccccc caaaaaaaca tgagccacac atcttattgt 73200 tttggttgtt cgattctaca aaaatgaatt ttatttatta acaatataaa caatttaaat 73260 gaaatttttt gtgaagtact gttttattaa taagatacag aatttcagaa aaagataaca 73320 aataaaaata aataaaggta ctgctaatca atttataaac cataattatc taaacatgtt 73380 gatctccttt attgttctgc tcttaaccat tccagaattt gtttgttatc ctattttgta 73440 tagaaaaaca ttatttatct taatacttgt ataattaaaa aacaaacatt tgattcctta 73500 tataataagg tcaattatat aatttggggt catcgtcaat gtctacttca taaaatgata 73560 tgcgcctgat tccaaaattt gaggaaaagt cttttatgta aaattctttt tattttttct 73620 aatgtgttaa gtttatgttg gatttgaacc aatcaattct agtgataaaa ttatacttga 73680 cagctaatct ttcactctga atatttttat taaaattttg gaaagaaata gaactatgta 73740 tattatttta actctatcaa aaataaaaga agtctttcgt gcctccagaa aaattaatgt 73800 gttttatcac ctacctaaca ccttgtaaca tagaactatg tatattattt taactctatc 73860 aaaaataaaa gaagtctttc gtgcctccag acaaattaat gtgttttaac accttgtaac 73920 acatactcca tttgcgatat cgtaaaacta aagtacaaaa aaatttatgt agtgattgta 73980 aggtcaatac actagtcttc ctaaactcaa agataaatta atgtactgac catcgccatg 74040 aaattgaccc atatgccaag tgaacaggcg tgaaaaatcc attagcttaa ctgccgatgg 74100 tcggatatta aaaatttctt tatcatatcc cttatatatt aattaagtaa cattacaaca 74160 ttgttttgta gcaacgtgtc accgtgaaaa tgaaattcag aattcttata gaaatatgta 74220 ggttcatctt aacttatact atacttttta ctaaactagc tattaaatta ataaatagtg 74280 tacaaaagaa tattttagta ctttctttat ataaaaacta cagaattgtc taatatgatt 74340 aacgtatata tgacaattaa tgattatgaa taatatattt ttgataataa tttttgtatc 74400 ttagcttttt tttctgttta attttagatt attaaaatat attaaacaat cacattaacc 74460 atatattaaa aaatattttt ttatatgtta tatttttaaa tttttaaaac gactacaaat 74520 tattaaaaac gttaaatgtc tcacactaaa attttgtgat caatggttta acttttttgg 74580 taataacaag aaacaaatga tcataaatcg tatgaatatg aagtctcact cactagacat 74640 taatattata tattaaatat agcttaaaat tatagtttaa aattaaacta taaaacatag 74700 aaaaatactt aaatatgata atttctaaat ttgtattgaa aaagtattga aaccttcata 74760 ttttaatatt gaaatttgca ttcaaaaatt cgcacattaa aaattttgtg tttatcatat 74820 gattataaat tctcaataat aaatatttat attaaaatat actatatatt tatatccatg 74880 tcattgaaat ttagttatat accatataaa ataaataaaa ttattgtttt ttaatttact 74940 aaaaaagtat cgtaaataaa caagatgtat tgttttgatt tatgtgctta atctaattta 75000 attatatata taatatgtaa atgaatataa ataaataata atatatataa tatttttata 75060 tataacattc attctgcgca attgcgcggg tcttaagcta gtatatatat taagtcagat 75120 gatagacaat tgagaatctc tcgacagttt tgttctcaaa aggtgatcaa agtgatccaa 75180 gaaattcggg gaagatagtt gatggtaaaa atggcagtga aacctttaat tggctctctc 75240 aatcaatggg tgtgagtgac tctctcaatc aatggtgaac cagaatttct agaatcgcac 75300 aacaatccta atccagtgat caagagcaac aaatgaataa ctcaaataat aaagacaaga 75360 tacactcttt gaagaaggaa gcaatttctt ttataaaact ttttggttga ttgaaagtgc 75420 tttgtacaag gacgaccatg agcttaaata gactctgaag acaaagattg ctaagccaaa 75480 atcaaataga gatcaaagaa aataaaggga aagagctgtt ggccttaaat ggctttcttg 75540 gccaaaaata agaaaggtga tgattatttt gcgtcttgag agttttgtgg agaaagccta 75600 gtgtcttggg acgaccatgt gaattgcaag tgtcttcata aggctgtggt tgaagtgata 75660 tagccattgg tcatcaaatg gattccagcc caaccattag ccgggggaca atatgataag 75720 aagccggcca tacaattttc aaaggttgca gcattataag ctgtaaccat ggaggcaaca 75780 agagatggat atgttctgta tccaaaggtt taaaaatctg agcatgtgct ggacgaagat 75840 ggtgagtcta tgattggtca taacttaaac cgacatagac caaacttagt atatttattc 75900 aaccacatta tggttcaata tgtttttcca aaaatttagt aaagttctgc tttaaacgta 75960 attgttgaaa cttgcatcat gctacaacag tgtactgctt ataaattaca aaactttgaa 76020 aaactagaga gaaagagaag agaatagaga acgagacgac gcagacaaac atctttctga 76080 ttctatctac cagtgaaacg gagggaaggt ttgtggaaga ggtacagcct cattaccgga 76140 tccatcagag actgcactcg cattctcaaa caaaccggac ccataaaaaa cagtctcttg 76200 ggacaaagaa agtggtggct gtggctgaag caaatgagag gaagatgatg acagaagaga 76260 gagagcgcaa tcagagtcat ggatgcaact cgtcattctc gagctgtcct cttcttcttg 76320 caagaaaggg aactgtttcc ctctgctgtt tggagaagaa gatatcggga acgtaatgcc 76380 tgtctttgca ggaaaagaac caacatagct ctggttctgc ccgtaacttg aaccattggc 76440 catagctacg cttacaggac cgcttcccca gctcggactc acaacagatg tagttggaaa 76500 cacgtgtgga gagcttgaaa aatccagcaa tttgctacct gttaacaaga tggtgcttag 76560 ggactcttaa gtctattgga tccaaaaaaa aaaagaattt attttttatt ttttaaaaga 76620 agaaaagcaa aaaccttgga agaaagttgc agtacgatcg gtatggtcgg gctgaggctt 76680 ccgtcttctt cgattgtgtc catcaagacg tttcctacaa cttttcttac cttcatcaaa 76740 ctcttccaaa ccatgaaacc tatctcaaaa acaaagtgga ccatgagcta aatttttttg 76800 ttttttggaa ttcatttctt taaataaaat atatattttt aaaaaattag gctttaatct 76860 aggctaaaat aacacaaaaa aactgtagta tgtgcaaatg caccctcagc aatatataca 76920 cagatgttaa cattatccaa catatgaata caatcagttt ttacctgctg cattgttgac 76980 aaaacctctg attattgcca ttgattgtaa ccacaggagt tttagaatgg acatcacaga 77040 ctttatgtct tttatgatac tctctacagt tactaaaatc agaatcacat ccatcaacca 77100 gacaaatcgg gatctggttg ttccctcttg tcctcttgga gcttcttgaa gcctcagagg 77160 cgctctcttt caacttacta agacttatca ctttctctgt cttgccaaaa gcagaggagg 77220 aggaggaaga agaggagttt acaatgtttc ttccaagttt cagatcaaat ggtaaatttc 77280 cttttggctg caatcttctt ggtggtgagg atgacccacc gaacgagatc gatgcatcga 77340 ctggggttaa atccggtaca gattcttggt cgaattcaga gaaataaccg gagctgagtt 77400 tgaagttcca atccatttaa agcttttttc cttctccttc ttcactcact aaaagaagac 77460 atacatagaa acaaaaatat caagatttat ccttttggtt ttgttaatct aaattgacag 77520 gtttaagaaa aggatacaat aaattcaact ttcaaacatg aaatttttta actcgattaa 77580 tcttgaattt tgaagaattt ttttttaaaa aaattaaaaa atcccaaaaa tgggcaaact 77640 tactgtactg aaaaaacaaa tgggaagtgc agatatatag aactagaaca gatcccatgt 77700 aatgggaaga aagcaaaaca aaataaaaat aaagcaaata tataaacttg cagttttgag 77760 tttcacttca tcataaaacc cctctctctt ttttatttat gtcactcact tgaaagcaag 77820 aatttaatgc aataaagaga cagagattaa agaaagatga aacatgttat tcataaatta 77880 taaaataaga aaagcttggt atttgaaggt tgagaaatct gaccaaatcc atgcacctac 77940 caatggtcag tagaagaaac tcaaaaaaga gaagagcgaa atctacaaaa tattgacaag 78000 tgagaaagag agttgatggg tttagcgaga gaaagtggag acaacgagag tggctgctgc 78060 tgcaataatg cacaagagaa agtgaagaaa aaagtaatat attactaagt ttaaaaatga 78120 agcttaattt aattgtttat ttgctttcct aatataggaa ttgttgatat ccttctttag 78180 agagagagag agagtggagc aaagggacag ctgttattgt tgtttgttca tttgctaact 78240 tttgcgtttt tttaattaaa aaattcttta ttagtttgct tacgaaattt ttaattttgt 78300 aacaagtttg ttattatttt aaaaatttat ccttaattga taattatttt attaaatact 78360 tcaaattttt gacaaaaaat aaattaactc ttttaaatta tttataatgt ttaaggatag 78420 tttataaaac atttataaaa atttataaac ctaaatctta aacaataatt actaaaccat 78480 aaattcaaat gttaaaatat ttttattgaa tataaaattt aaaaatgata gacaacttaa 78540 tgtatataac caatttttct ttatcaattt gtttgccatc caacaagtct gaatttatga 78600 taattaaatg aaatgatatg aaaaatacac agcatcatta gttaattttt tatatatttt 78660 atatgaaaaa acattaaaca tgtaactcat cagtttatgt tagtagtttg gtatctaatt 78720 tagacctgat atgttgttga gaaaagcaaa ttatactaaa attttaatat cgttgaaaat 78780 agtatagaat ttaatgtgta tgattaaaca atatttgttc ttcatggaac tagaatttga 78840 aaattttaag ctgacattta catttttcaa aactgaaaat cttccaaaca taagttagag 78900 atgatagagc acaacctttt taaaaagtca taagattgtc gttagcctga atttcacttg 78960 gtgtgaacaa taatttaatt ataccaacta attctgttaa cgtcattata tccaattaaa 79020 attacaatca atcaaactgt gacaaaaaaa aatcacaatc aatctaaata taaattgtat 79080 aaagcatctg attatccaaa attttactct gtttttttac tttagtatat ttcaagttca 79140 tgtagatgtc caaactaatc tctaaacgag tggtatggct tttttttttt tttgacagca 79200 agaaattcac agactcatga tgactctgta aaccatgttg gtaactccgc atccatgtga 79260 acgaacgagt ggtatgatct acaaatagac tttcattcta gctattcaaa tggaccataa 79320 aataaattta tatttgtata gtcacaaagt aaagtgtagt ggaatgccat caactctatg 79380 ttgattggca attccaaagt tcgcctacaa gatttttatt actaaactat cactttatgg 79440 ttaaaatttt attttgttcc caataactat caagatcttt attttaattt gttatagtac 79500 atagcaatcg tttgcaatat atatagcatc tatccaattt taatagcttt caaacatggt 79560 caccttgttt ctttgaaaat aagaataaga cagacagggt tttctaatat gctcttgtaa 79620 ataacaaaaa aaaaattgga aagtaataaa taagaggtat atgatgctta tttgcttacg 79680 gcaaaacata gcatgtgaac gtcgtggttc gcattacaca aacatcttct tctgttttta 79740 actttttatc atctctttct ttctttcccc gatacgcgct atttcttcga ccaacattta 79800 ctccttcacg ggtcacaact cacaagtcga caaataatat gtttttttgc caacaactaa 79860 taaacatatt ttgtttcctt ttcttaaata acatgtcttg tcttcaaaga atcaaactag 79920 ccttctactt cttctaaaga gtatcatcac tttaacactt ttcatataga ttaaaatatt 79980 aaaatatatt actattttta ttaattaaat ctatttaacc actagtattt gagataaata 80040 aaactatttg tagaatcaat atattttata attaatatta aacttcaaat aagtataaat 80100 tgctttaaaa tataaatgtc aatctttgtg taacaaaaaa gtatcaaatg atactatttg 80160 taaaacagag aaataattag aaatggctga ttaacaccct cgttaaaaat ttctccaaaa 80220 tcaatttatt tttgaagaat aagttagttg tagaaataaa aataaaaaat ttagttgcat 80280 gtttgactat ttaaatatat tgatttatct tgaattcgga tgttgcaact aagcgatgga 80340 tgttgaatca agtacataca tactggatta catcaaatgt gttatatcaa attgttgtgg 80400 atgttacacc tgatagtgag tttagttcca tgaggttgta tgtactaaag tattaagatg 80460 catgatactg gtgtatatat attttgtatt caaaataact tttattttgt actcgataag 80520 cttaatatcg cctataataa taaaatctca ctttctctgt ggacgtatcc aaattggacc 80580 acgttaaacc tttttgtctt tgttacatcg ctttatccat ctgtttttgc atatgttcat 80640 tttcatgtat gtaacaacaa aagtggcatc acagcttcgg gtctatgatt tggtgagaag 80700 atggctggta taaatgcgaa gatagaaaag tttgatggga gaaataattt caatctctag 80760 tattgcaaac gtttccgaaa caccatggca tatgcgggcc gctgtcagga aagaagtcta 80820 atgttgctgt tttagatact taggaagaaa aggcattctc taaattttgg ttgtgtttaa 80880 cagatgagtt catcatcgaa gtatcggatg agaaaactgt tgctagtttg tgacagaagt 80940 tagagagttt gtaaacaagt tacttctaaa gcaacgcctc tttgccttgc atatgcaaaa 81000 atatatatat tgagatttgc gaccatcctg gcaagttaaa tttgatacta ctagagatgt 81060 gtaacatcga tgttaaggtg gaggatgaag acactacagt aatcatgttg gtatctatgt 81120 cgaacttatt tgaaaatttc gtgcaatcgt tcattattgg caaagataca atgaaactgg 81180 aaaaagttag atcatcgctt catagtcaaa aattttatta gaacaatcca gttaaaaacc 81240 caaaataaaa ataatttagg tattttcttt atatatccca aaagaagagg agtaaagaaa 81300 aatatttacc tttgaaaatc tttataagat attacttaaa gagatttgaa atgtataaaa 81360 gaaataatgg ctatgagagt tgaaaagaat ccgcaatatc tgctagttaa gccctctagt 81420 acaccaagat ttagttttaa acaattcaag gaatataatg ttaaagttta tggtattatt 81480 tttagaagtg acttgaattt aaagccttgt aaattaagat ctttgtagaa ctaacttgaa 81540 tataaattct tgtaaagaaa gttttctgga gatcgtcagg cctcaaaact cagatctaac 81600 cactaaatga gtaaatgtac agccataagt gaattttggc ccttttaggg acgactttgt 81660 ttgtgttcag aaaaaataga ctggatggct ttttttttag atcaccagtg tgatgatttg 81720 tttggcattt ttattttaga tcaccagtgt gatgatttga gaataagtga tgcatatggt 81780 gagaaagtat ggcatactta taaaaagaaa caaaccgagc ataacaattt aaactggtaa 81840 tatattaaaa ataatatttt tgacgtcaga ctgaactttt cacataggtt caagcagacg 81900 gctcataaga aatgaaatta caatcatatc atcaacttgt aaacgcattt ttccgtaaat 81960 taaataggag agaaagacag aagtaaagca tcaaatatta gagactgaag gaaccaacac 82020 taaagcctct ttgtgtcccg tgcattctct ttttagtcac tcagtctggt gtcgttcctg 82080 tattccaaac accaaattaa aaaaaaagac cgtcaatata tatacaatag tgtttctttt 82140 tgtttcacat gtagtattac aaacctagac aaccattcta gtactttttg caaagaaaaa 82200 aaatctcatt atgaaggaaa gttaatagtt ttcattggta taattattta ttttcccttt 82260 atgcaaatgc aacctatggt gcttttgttt ccctgaattt gacatcattt tttgaatcaa 82320 gattatagtg atagattgtt gctccgctgc acttgaacca aatccgtttt gatcacactt 82380 tagatccagt tcgtttgaac cttaagtatt aaaaaccggt tatcattttg gcacgttaca 82440 tgcctagtag actctttttt ttttaatgaa aggcccttgc acttacatag tgaagctcaa 82500 acaaatccgg aaaaatgacc aaaccatatt cgaaggatga taactcagct atcatgtgga 82560 ccaacctatt taggactagg tttgccctca caaagatttt catcaccacc ataaattttc 82620 aaatcaagtg gatatgctat atgagttcaa gatatatatt tacgttatag taacctatag 82680 gaagatagga aaatggttaa agatgaaata gttgacctta ggtttgagga tgccatactt 82740 cctaaactgt tccctcacga ctctgttgta tatgaaagct gctcctctga attgcggcaa 82800 aaccaaccat gctaccaaca ctagcttcgc cgtgtaccat atcggtatcc tatatacatt 82860 ttcacacaaa aattcaattt ttgtttctca cattatttcc aggacaaata aaaatacata 82920 gttagtatta ttgttaccac tctaggagcg attgaaggat gagttctgag agagttaaga 82980 aagagtagat aatccaataa gcaagccatt gctcatcatc tgcttttgat gggctctcta 83040 ttgctagcac cgacgcatat cttaccaata ttataaatat aaaaaaaaca atttgaattt 83100 aatcattgaa ataaaacgaa acaaaatgtg aatttatcaa agaaacaata gtaagttact 83160 tacaacggat aaagcagcat caccacagga ctgcatatgg tcgtaaaaag taaacaaaac 83220 acgaaatcac gttgttattt taataataaa aatgctatta taaaagaaaa acaattcagc 83280 cataaattga tggagataag tattaaatcg agaaaataat atgaaaagtc aagtaagtac 83340 ccagcgatgg aatgaagagc agagaggaaa gtccaaagct tagtcattgt aagaggaaca 83400 caaaaaaaat ccaaaccaat caaaggaaga ataaaagaga agtttcgaaa cccttttgtt 83460 ttctaaccaa cacgcccaaa gatggaagga gatcttctta tttataatat caaacttaga 83520 cattaaaaca gtttggcacg tggttcagcc cctggtttaa gccgggacaa ctatatttca 83580 atattttgga taccaaaccg atgaaaaaag ttttgtgaga gcatctacaa taatgaaata 83640 acaccaaatt tgttattttg atgttaaaat agttaccatc tctaacaatg acaccaaatt 83700 ttacaccaaa aataatatta tatattatta atattttaaa ttttaaattt ttttttatta 83760 tttataatta ataaatatct agaatattat ttatattttt gttattttta agtgataaat 83820 gataatagtc atttaattat ttattttgaa aaaaattaat tttttaatta tgcgaaaata 83880 aatttaaaat acaaataata caatatattt atgtctaatt acaaatttta tagtaattaa 83940 attatattat ttattggtgt gctttacatc aaatttggtg agtgttaatt ttagtatttt 84000 attgaagatc aaattacacc aaatttgatg gtttagtgag acggccttat tcatataact 84060 aggcgatcaa aatcgagttt attagtccgg tttacatatt ttggtggctt aagtttcaat 84120 gagttaccgg acacgtgggc tgaagagaca agaggtatca gattctaact tgagcgtgtc 84180 cgacatgtca ccggccaata gagtcccgat gtcggtggga ttctctttat tgttattttc 84240 catgctttcc ctactatatt gatttatcat taattacaca tacaaatatt tttgttgtag 84300 caacactcgt aaaaatagtt taatatgcta taatatttag aaaaatatct gatatatgct 84360 aaacactttt gttagaaatt atatacaaaa ttttttcata tacttctttc attttctttt 84420 gaaagtatta aatattttta tcaactagat acatggaaga aagacacatg aaaccatata 84480 tctgtaaaca catttgagat atacaatacc gtaaaaaaga caaaaattat tgaagataca 84540 aatatgcttt tcaaatgaat gaatgttaat aaatatattt tgaaaaacat gttgaaactg 84600 tatctaaacg ataagccttt tctcaaaaaa aaaaaactgt aactaaacga atgaaaatta 84660 tattttggaa aaggtgatcg atctttgaga gcatcccatg atgatgtgat agaaaaaatt 84720 tcttgggaat tcgtaaactc aatgatgtat gactaacctc caggttttct ctatgtttac 84780 tagttgatat caacgatcag aaaccatcac cgcaagatgt attcgcaacc gtaaaaccaa 84840 acaatttttt aatagaatgt aacactcaaa tatctcttta atagacaaag cactgcgatg 84900 agttgcataa gttgtttgga aaatgtgttg agggttttgc agtggaaagc tcaaaatttg 84960 tgtatattag ttacgaactt ccacacatta aactacatgc aaaacagcaa aagtattttt 85020 tttttggaac aaaaaagcaa aatccataca tctcaaatgg aggaagcagc gagataagtt 85080 gcaaaaaaaa aaactgtttg agagtgtttt gaaagttttg caagaaagca caaagatagt 85140 atataatgta ttaggacatt ttaaacatga cgtagtattt acttttacta tttagagatg 85200 aagactttta gaaacatgta agtgcattta tattgagttt gtatcaagag tgcttcaaca 85260 atgagttcct aagaaagttc aaatgaataa gtcgtaaaaa ttgggtattc ttgttttcaa 85320 gtcagttgtg cgagtgaaac gaattcgtga gattaagcca tcaatataat ttcgtattat 85380 tggagatcga tttcgaggct caaatctctg catggagaat tttttatgtt acaatactaa 85440 caataacatg atcatctaat aagcttgaaa taagaaagaa tccatttaac gacataaata 85500 gagtaaaaat tctaacttct taagcaaacg atttactaca tcatggtaca agcgttgggg 85560 ttctcgtcac tgaatatctg tggtggataa gcaaacatct ccacaggata cctcggtggc 85620 tggtattgat attcattctt ctttaaatcc accactttgt catctccctc cgctgcagca 85680 cctccatctc cggccgccga tttggccact ccaccaccgt cttccttagc ctctttgctt 85740 tctttgggtt gttcttcttc ctttttcttc tcgtctttgt cttttgtttc tttttctttc 85800 tccggtggtt ttggcgatgg atcttgcttg acaatcgcag catgcttccc gattttcttg 85860 ttaacgtact caactagctt ttccggtata aaaactcctt tcacgctcac ttgtgatgct 85920 ttaaagtctg gttccacaga ctccactcct gtatagtaaa aggtagttgc tttatttttt 85980 tttaataata caatattcaa ggaattaata atcgaagaaa gtcgaacttt caaattgcat 86040 tacaaatatc gaatgcgcaa aactaatttc aattcttaag caaccaatgc tattctttgg 86100 cccttagaac tcgattagtt gatagcattt atgtgtatat atctatcaag cataaaaata 86160 tccacacttt ctagaaacaa caatttgtac aacttatagt tagcatatac acatacgtac 86220 tggaatttta gataactccg catacgagga atgtattcac taactaacta aaaaagtgtt 86280 tagaactttg agatccttgg gaaatataat aggtgaagta aatacaaagc acttgacttt 86340 agttgactct attcaaaccc actacagttt catgtaacct tgaaatacta aaagaaacaa 86400 aaaaaaaata ttcgggacaa ttttgttaaa atatatgatt atagtaacaa ataatctggt 86460 gaatgagttt ctttttaaag gaggaaatgc tctaacggtc taaacgcatg gtcttgtata 86520 ttgctctttt taaagggcct acatagtaca cacaatttta aagatggaat caacttatga 86580 catacataag agtccaaaac gtaatgtccc aattaagtga agtcagagaa aacttcgatt 86640 taataggagt catacccagt tgaggatatt ataattaaaa ttttgaataa gaagatgaaa 86700 aagaaaacaa acctttcatt ctcatgattc tcttttggat ctccatggca catgcttcac 86760 aatgcatgtg aactctcaac accactgtca ctacctgttt ttctcagtgc ccacaaaatt 86820 ttaatgttaa ttacacaaaa ccaacttact ttcttcaaat tacaaatcta tcctcaaaag 86880 tcttaacctc ttcttttttt tcttgaggtt ttggtttctc ctcttttttc tccggttcat 86940 ctgaaaccgg tttaggctct gggataggag aaaggagctc cactggacgg tggctctttc 87000 tttgcagtct ctgcaacact tttagtggat ctgccttctc tcctttcacc acaactttac 87060 tatttttaca atcagttgtt acatcctcca cccctaatca cattttcaat tatcccaaaa 87120 ttaactaaac cattacacaa atggatatga aagaaatgtg tttagttgta ccttcaaagc 87180 ctttaagaca tctatggatt tttttagcac aaccttcaca atgcataaag atcttaagaa 87240 caatctcttg tggctctttc ttcttctctt cttctttctt atcatctggt tttttcactt 87300 gtggctcttc agcttttttc tccattttct cttctgattt cttcttatct tcctgaaaat 87360 ggtaaaaaag gagaaaaaaa gtttaggaat agtgtttgga tttgtgaatc tgaaagtttg 87420 aaatacaaac ctctcccatt gattttagtg ccagtgttga ctgttgagac ttgagagagt 87480 tttttagtgg ctcacttatt taagtttttt cctcttcttt ctacggactt gagagagatc 87540 tggttatata aaagacacat actatttctt ttatttcttt tttttcaccc cacaaccaca 87600 agtacagaga cttattagta tttttcccat ccaattattc atagattttg aagatctttt 87660 ataaaatgtt tcttctcagt gttttgtttt aactgatttt tttctcagtg tttttagcta 87720 ttttgtatat ttgaccaata ttgggtactc tctaatcgta tattcgtatt gtttccaaaa 87780 tttgaataca gttttaaacc ttatctacca taactcaaac cttatcggtt gaagtaatta 87840 atcggcttga ttgtcaacat attaagtctt ctacaaaaaa taattgcatt actattcggc 87900 agaacctaca tatctaactg aaatatactc tttatgtttt acaaagatat cactctgaca 87960 ttttttttaa ttaaacttct aatactccac atgttttaag acgatccatg ttttagaaaa 88020 atgtgtttca aaaataaatt tttacatttt taatccatat tttatcacat aataattgtt 88080 aattataaaa ttcaaaaaaa taattgtgat tatttaattt atgctgactt aaaattgtgt 88140 caaatagata atcacaatta atacattttc ataaaaaatt atgttttctt aatatatata 88200 aaaaaattaa acataaataa ttgtgaaacg gatagaatat tattttagtg aaatgacatt 88260 atgaaatcag tcaatatgtc tctttcttgg aaaaccccaa taaatctagt atttattatc 88320 atttaatatt gctgatattt aatactccct ctgtttttta aagatggatg ttttaggaaa 88380 atattttgtt tctaaaagat gtatttttca tgttttcaaa gcatattttg tcaattaata 88440 atgaaaaatt gtgtgtttca aaaatattaa ttacatttct tttaatccta ttggtttaaa 88500 aatataggaa atataaagtt acaaaaaact atgcattaat aactaagttt taatatggtt 88560 tcttaataag tgtgaaaatc ctagaacatt catctttaaa aaacagaggg agtatttaaa 88620 attattttga ttgttttatt acattatttt cttttttaac tagttattat catttatttt 88680 cagctaactt tttattatct atacaaataa atattcctct tagttataaa ttcagattaa 88740 ataattttat acaatctttt caaaaataaa attttctttt ggaaatctat tctatcaggt 88800 tgcatatgca cattttattg taaaaacaaa agcacttatt tcacccaaaa tatttttaga 88860 attttctttg tatagtttta tatatatttc ataataaaac tttaagaatg ttttgttagt 88920 gtattttcat tcattcattc attgtcttgt ttacttgaca aaccacaaag agttatgact 88980 aattaatttt cagaaaatat tcaaagtttt tcagactgaa ataattgttt ccaacaaaat 89040 atgataataa taataataat gtagttttat taataattat aacaaagttt aacactaaat 89100 gtttttacgt taaaatataa cgaaggtcac actattttct tgctttaagc cacaaaaaat 89160 actgtctggc atgctttttt tttccttatt gctagacttt tgttgatgat gtagacttca 89220 ttaatgtttg attcaagtca cgactactaa ggctatgtac aataggtggc tttattcaac 89280 accataattt acgcttacac atcatctttt atttcatcca cctattagtt taatattttc 89340 ttatttttat atttacgata atttatttaa taaaatacaa cactataatc caccatttta 89400 tctcatattt tcctttttat aattatattt tgtaagcaaa aaattgaaaa atattttttt 89460 taaactataa taactaaaac ttaataaatt gtaaattttt aataaaaaat atttatgttc 89520 cacttaatat aaaagattaa aaatagactt ttatatatca aaataaaaaa acctaatctt 89580 tatttaagga acacaaaaat aataaatttt aatataattt atttctacaa aaatattatt 89640 tgatataaaa taattaatct caagttatta ggatgtaaca accaataaaa tagttataca 89700 tatatcaata tataatcttt tattttttaa aagaaatttg cttatattca tattcgatta 89760 tgttttttcc cgaacgtagt ttaaagtgaa gcaaaaccaa catagtggat cttacataaa 89820 atactttcaa catgtagaaa atattcaaca acaaataatc cacctcattt ttttaggttt 89880 tcaacagatc cattgcaggt attcaatagt tgaaagtaaa attcaacaaa cccattgcat 89940 atggtataat agtgacattt gtatacaatg gtgcgtgtat attgtatata tatgaaattt 90000 gttggcccag tgcgtttgta aagtattcta cataatttaa tatatatagg aaatttgaag 90060 cacatacaaa atgtgatttg aagaaagagt tcataatgct agacgttaac ggctttataa 90120 ttgagcatga aagtcttgtg agtacactat ttgaaaccta gtcagcgtac atgattatgg 90180 gtgtgattgt aagtcatgtc tagagtaaat attgaagaaa aaatatcagt tattcttatt 90240 tattctgaaa tcttatcaat caggtaaaaa cacttttctt cctcctacct ctaattgcta 90300 tttacaagag aataaaacac gttaatagtt ttactccaat tcaaacaaga gtaaatgtgt 90360 ttacctagtt tattctctct ctcatttttt tcttttcatt ttcatctttt ttcttttcct 90420 cttatttact ttatattttg atattttcca tccatgctct atatgtgaca acggtttaaa 90480 cgttatattc cttacgaata ttttttttgg taaaaatgaa tgatttattt catatagtac 90540 tatacattag atcaaattta ccccgtcaaa aaaataattt ttctaagaat aattgcagtt 90600 aatatttggc agacctttca tatttaactg acatataccc tttatgtttt ataaatttta 90660 tcattttgat attcttttta atatacaaat aacgccactt taaattttta atacaattta 90720 tactcatttt aaaatattaa ttattaaaaa ttttgattta taaaaaaatt tattcatctg 90780 aaagattatt aattaaacaa atgtaattac taaaaatata tgcattttaa tcatttcatt 90840 atttatgtaa aatgttaaaa taatattttc atgaaatgaa aggaacataa ttgtcttttt 90900 ctttggattt tccaaaatgt ccggcggacc gagactcaac cgactaatcc atgagatata 90960 tttaccggcg ttaaatagat ctgattgttc acagtggaca gtagatactt ctgttgcatg 91020 accacacaaa cgacatatct aaaatggtga gtttaaatat gaaatgctta ctattttcca 91080 agtccccgta ccattcaact acggttgtgt taatataatt gttttgcaaa tggcagaaca 91140 gaaaactaga tgtaaattca caatgcaagg ggcaatgcga tgatagatgg tattctttcg 91200 atgtccgaat aagccataat gtaactactg tctccttaag aagattagaa aaatcttaaa 91260 tgagtaaaat ccatgaattc tactttaaca cttttaactg gagaaaactc tattaaaaac 91320 aacgaagcta catgagattt actttatttt aacatgcata gccgacatct cgaatatttc 91380 tggagcggta aataaggcat tcttgcctac gccaatctcc tgtatattat ttgagaagaa 91440 ttgtaacatt tttttgtagc cagatgtcat cactataatg atttttagaa ttcttagaaa 91500 aatacgttgg ttcatctaaa tatataataa gccttttatt aaaccacaat aaatacatta 91560 ttaatgtcat tcattatttc cttaaataag attacagaat tatctaatgt gactagagta 91620 tataagacaa ttaataattt tgaataataa agatttgata aaaataagtg tgtattctaa 91680 ttatatttgt ttaattttaa gttattaaaa taaattaaac aatcatagta accatataat 91740 aaaaatttaa aaaattattt atatattata ttttgaattt ttaaaaacga gtataaatta 91800 ctaaaactgt taaaagtttc acattcaaat tttgtgatct atgatttaaa atttttgtta 91860 tgacatgata caaataatta aaaaataata taggttgaaa gtctcattta ataagtatca 91920 aaaataaaag atatagaaat atatgtaaca ttttaaattt aactatatgt catataaaaa 91980 tacataaata tcttaatttt aaaatttact ttcaacattt ttttgataaa aaatttgaaa 92040 aaatattgac aatttaattt tttaaaatat tataaattat ttaaaacatt aatcccacag 92100 tgaaaatttt ggtatcacta atttagactt tttgctataa cagatacaaa tgataaaaaa 92160 aatgagcaaa aatcatcatc taataaatat taatattaaa atatatcata tatatgttac 92220 tatcatttaa atttaattat atatcatatc aaatagaaaa aatatttttt cgatttataa 92280 gatttattta tatgttcaca ccaatttaat tatataagta gtacataatg acattttaat 92340 tattcaatat atatttatta tttcataata tgttataaac atataatata taaattaatt 92400 tatatatata atgttcatcc cgcgcaaggc gcgggtctta acctagttaa caagataaaa 92460 ggcatatatt tacttctttt ttacagataa cagaaacaga ctaatagtaa aacaaaaaat 92520 cataaataaa ataaaataca aaattacaca aatttaaaaa aaaattggaa aagtacttcc 92580 gtttattttt tactttaaaa atatcattgt ttttcatttg tagtactctc agataaatgt 92640 aatgtacata aatccagtgt acattctgca tattagatta aacaattttt gtttaacttc 92700 gtttaagact agcgccattg cgcggattaa tgttagcaag accgctttgg acgcaaggga 92760 gtacaaggaa gaccggttaa agcaaagcga ttaacacgtt cgtgaaccta aagaaagagc 92820 acaagtgagt tcattggcaa gaagatatgg ttcctttctt ccggaacgtt tgtctctcca 92880 aaaaacccta caccggtgct agtcctaaga tattttaggt ctaataggaa attaaaaata 92940 taaactctaa aaaattaaaa tttgataaaa attaatttta cgattaaaaa ttaaaaattc 93000 ttcaaaagta tacatagcta ccagatttaa aagttatttt cgttttcttt ttatgtaaat 93060 aagaaactaa acttcaaaaa ttattttgtt aaatgtttga aatatatttt agatccaact 93120 tttatatttt tctactaaca acaataacaa aattaagcct taaaagcttt aaaaattatg 93180 ggccgcatac ccatgttttt tagttatagg ctcaggaccg gcctgccacc actagatgct 93240 atatggagtt gtccaagatg acaaaacagc ttgctaaagt tgatcctttg agaaattggc 93300 tgatgcaatg atcgcttgga ctgaggcgtg ggaggagctt aacccttcag ttggtggaaa 93360 agatgtcacg gccaagtgat gaaaaattga cgattataag tgatgcctgt tattgctgca 93420 tgaataaggt ttgttattgt tgtgatcttc tatttatata tctcattctg gaagtgtgct 93480 tcgtacaata acgtaatact gtgtgttatt gttgacgtta acgttgctcg acatgtattt 93540 aagccttatt ggtgaaatga tgtgtgctac tttaaattac atggatgaaa tgattgtttt 93600 aacaggaaag taccagagga cttgatacca tcctatatcc aagtaatcgc ttgtccggga 93660 cgtcgaaata ctcgtttatg ttggcctccg acaagcttct aagccttgat tatttcattg 93720 ataatgatat aaatgttgta atttacaaaa ttatgcttag agatttttta aaatattact 93780 tgtgatcagt tttaaaacta aattaggttt gattacgaaa attaagagaa aacattaatt 93840 ttgtgactga gagcatctct aaccccactc tatttttcac tctaaaatag agtttagagt 93900 aaataatgct ccaatggtac tctatttctc actctataat agagtaataa ataggtttac 93960 tccaaatata gagtaatttg tttttttatt gttcatcact ttattttcta ctctaaaata 94020 gagtaccatt ggatcaaact caaactctat tatagagtta ctctatttta tagtaaaaaa 94080 tagagtaaac cattggagat gatctgagat ggaagacttc atgtgatcca atggtcaaga 94140 atcaaccact taaggaggca tgtgtcttta actaaagagt tttgtttgtt tgtcaggttt 94200 aggtggcact aaattggtgg atatttgcct catcatgcat gacatcctta gagcatgatt 94260 agtgaaggag atccatttgg gattcttaaa ctatgatttg acatttttct gctaaaaata 94320 tttttattat ttttattaat ttttttttta atatttctta gttaaaaact aaaagatata 94380 tatttttgct tgtagcctca aaataatctc ggagaaaaca tagctatttt cgaattaatg 94440 acatatcgtg aaatacaaaa cgtgcctaac catttcaaat tcattattaa gaaaaccacg 94500 aaatatttac taaaaatgtg acaaaagcag acatgatttt ggtcacgaaa tattcctata 94560 gcaattaggt tagtcatatt catatagctt ctaagaaata tggcacaatt gtgattaaaa 94620 tgaattcatg gcaactatga gtgttactgg ccatagaaaa tgctttgaca tttttttttt 94680 ggctaactaa aatgctttga gttctaaata ctgaatatgg caactcacaa agatcatttt 94740 tcacttctat ttatgaacaa atgcttgaga cattatctaa ccacccttac tattattttt 94800 caagtggtta ttcaagtttc tttcaaattc tcatccttct agatgacaac aataagaaga 94860 tgatattcat ttgtccttat agcacttata cttaccgtag aatatgattt ggcttgtgaa 94920 atgcaccaac atacgatgtt tatttttact tatccgattg aagatataat ggaagttttc 94980 aaggaagata ttttcgtcta taagaacaac ttttatgtct atttatcaaa tttatgcagg 95040 atgttccaac gctgtgaaaa aaaaacattt tctgctaaat cggaggaaat gcactttcac 95100 ggtgagagat agaatcgtgc tgagacatca gacttcaaaa aatgactgag gtgaacaaga 95160 caaaaatcaa ggttatgaga actctatgac caacgaattc tattatagcc gacgaatttt 95220 attaaagaga tttagaggtt ttttgggaca tggtttcttt catcaaggat ttctttaaga 95280 tcgcaagacc tttcacccag ctgttgtgca agaattgttt ttctgaattt aagagtactt 95340 ttttttataa atgcaagtta tatgtattta ttttttaaaa taaattttac aacattaatg 95400 gttgttttcc taaatttgat aaatatatta tacatattta gaaatatata tcttcataaa 95460 ttttagaaaa tgttatatat tcaatattat ttttctaaaa aatattggtc aaattcaaga 95520 agattttata cacattcatg aagatttttc ctagaaaatg ttatacatat tcaaaaatat 95580 tttactaaat atacatctaa ttcaaattta ttaaattatt cttatatatt catgaaaatt 95640 ttcttacaca catttgagaa ttatttataa atacatattt gagtttacct aaattttatg 95700 aagatattat atatatgtat taatatattt ttcagtaata cttttataaa tatgcatata 95760 actcaaattc aggatatcat atatatttag gaatgtcttc ctaagctttt taataaaaaa 95820 gatttttcaa aaaataaaaa aaaataaaaa tcattttttt aaatatcatc tttgagaaaa 95880 ttcatttaaa tatttattta ttttatatat ctaaaaaata ttgtcattta cctcattaat 95940 gaatgctaac ttggtcattt taccgttata ggatcttttt ttttggtagg accgttatag 96000 gatcatttga gatttgtatt taagaccatt tgaaaccatt tttcaaacta aaatatatta 96060 tacatatttt atattatgca acataaatat tttaataaac tttctatttt tttttgcgta 96120 tgacacgagt cattacttaa ttatatatta taaattaggt attagaatac cacataaatt 96180 tggttgcggg gcgcacattt agtaccggat attccttttt ctcaaaagta tttaataata 96240 ccaaacatag caagttgctt taaacatagc aagtcgcaag tagaaaattt cctttttaca 96300 aacatcagcg gtagttagcc agtgacggac gggtgtgtcg aacaatatac aaaaaaaacc 96360 cggaacatta gaatacaaat ttgataaaaa caaacttcca aacaaagttt atcaatgatc 96420 tatcgaatat cacaattcac agcaaaatga tatcctaacc tctttgaaat gtatttgttt 96480 gtaacttgtc attctattat ccattaagac aatgattttt ggtttttgga ataattccgc 96540 ttttcatgtt ttaagtatat tttatatcag tgatttgtga tatataaaaa tgtctatctg 96600 tgatagaaat atttaataat ttataatagt tacatttgtt aacaattgtt aagagtttcc 96660 attaagtaaa tttattgtct tatagtgatc atttttggct caacaaacta attaatttta 96720 aaacagaact acaaaattat caaaataaaa attattgcat agatattaat tacatgcgcc 96780 gaatagtaag gtggatacaa ctttaaaaga attagaccca aaaaaaaact ttaaaagaaa 96840 aaaatggtgg atacaacttt tgtggataca acaaacaaag ttcgcatatg ctttttacaa 96900 atgttcgtca attcatatga atttaaacaa gtcaacacgc tcacgttatc accttctcct 96960 tcggtagtgt ctttctaggg tagctgtaat atgaggaagg tttttcacag cagtaatttt 97020 ttctgtcaac ggataaagta acaaatagaa aaaaaattaa ttatttgaca gatgttgact 97080 ttttggtatt tatagatgaa cttgtggaaa atgtggaaag cataaacctt tttagtgcct 97140 ctcccttatt acaaaataat aactataggt atatatatat atatatatat tatttttttt 97200 taactatagg tatatgattc catattaaat tggactagaa ccaacctcga acattgacgg 97260 caaaaaattt aaattttttt aacactgata atcgattata tcattatata atatcttttt 97320 atgtttcata tgataattac aacatatgta attatgatga gaatttcaaa gacaaagatt 97380 tcacaatata gtttaccctg taacattcga attgattggc ggttctacgt gtactacata 97440 tgaccataac aaatgattct gtattcagca ctgaaatttc cgataatctt gtgttctata 97500 actgtaagaa attatttttc tgaaatcgaa ccccaaacat ggtatagaaa cctttaaact 97560 ttgacaaatg aattacaatg ctttcacaat ttttttttat catctaccaa aaagaaaaag 97620 agaatataag aagtgttgga ccatagttac acagattcta aggaaaataa agtatataat 97680 ctttttaata aagtctatac ttatctatca aaaattgtct ttggatactt ttagaatcat 97740 caaaaaccat ttaaataccc attgaaatgc ttaaatattt taaaaagccc aggagaacag 97800 atgacgtgtg ttatgtagtt gttagatatt gaaaataata ggtatgcacg aaaggaaaat 97860 caggtggtat ccatcttgga aaggcgacta aaccctttcc gttgacaaaa ctgaataaaa 97920 caaacatacc agatcaccaa taaccttgaa tatatatctt tttttttatc aaggactata 97980 ttataaaaaa aaactcaatt attagaccat gagttcgtat atggtgaagt aagggttata 98040 ttgaaaagtt aagcccgccc tcttctgatt gtcattgact tcaaagtaaa cctatatctc 98100 ttcttttcca atcaagattc tctatatata aaagagattc aagaaacata taactacaga 98160 aagaaaaaaa acaaagaaac aaatggagac atggagaaaa atgaaatctt ttgggcataa 98220 gagctcttca agcacggctt cgatcaccaa gagcaagtct tggaatggct ctgctcatct 98280 cgagaatgct aataacaagg aatcaacagg aaagatcaag aaaaaatcgc cgccgccgcc 98340 accacacgga tgtttcacag tttacgtggg tcccacgaaa gagagagtcg tggtgaaaac 98400 gaaactgttg aaccatcctt tgctcaagaa cttgttagaa gaagcagagg ctgaatatgg 98460 atatagacgt gatgggccta ttgttcttcc ttgcgaggtt gacttcttct acaaggtttt 98520 ggctaatatg aagtttaatg gtgatgagta cgatgaagaa gatgatgatg atgatggtat 98580 gattaaccct ccgatttgcg gtttgggtag tccctataga tgtgctggtc tcgagtccat 98640 gggcgtgaga cgtagcggct cgtacaagct tcttcgatct ccatctttgt tcaaattaag 98700 taggttttga tttttttgtt tggttttttg aaaatgatat ataggttttg attttctttt 98760 ttcccttctc cataatacta ggtatctaag atcttgttca taccattacc ttatgcataa 98820 aagaaaaatg cgaggaaaaa aaagaaccct cacatttccc taaattatat tccatttgtt 98880 tttctgagat tttgatgtct gattttgtat cttaatttac atgtgagtgt ttttggatga 98940 cgcaaacttt gaattaaaga aattactaaa aacactaacg aaacaaacgc ttgtaaaccg 99000 aattgtttgt tgttgaactt aaagccacta catcaaagat acaagaacat caaaaataaa 99060 aagactcctc actaagattt tgattggtag aacctttaca agaacattat attctttatc 99120 taatcactat ttttattaac ttgatatatt attcaagttt gaggtggtat gaaaaaccag 99180 aaacagaatc tttacatatt taaaatagca tctattagat gtaaatgctc tttatgtaac 99240 gatctcttat gcttttgatg agagcattta actttaaaat ataaaatact aaatataaaa 99300 taaagattat ttaaattaaa ttaaaaatat acttatataa aaattaaatg gtatttaaaa 99360 taaaatttat aattaatata tttaaatcat ttaaaataat agtattttag attaagaata 99420 tgatgatttt atttatgaat cacttacccg tactctgcac tcacttataa taaaaaaaat 99480 ttgtcatcca ctttaataat tttattaatg aaattatata atatttgcaa catagtacac 99540 ttttatagca tagtgctaga attttatcag caactccata tctatacgga tggtaactgg 99600 gtcattcgaa cacatcatta tattttgcta gttatataat tgttctttga ataaatttag 99660 tgcattttta atttagctga cttcaagttt atatttaatc gtatcatatc taattaattt 99720 taatatgcaa tccttttagc caattaattt tatatttaga ttttctgtaa ataaattatg 99780 taatttcatt atcctaaaga taaaaataat taaatttcgt atgattcatg aattcaatcc 99840 tgatttactg agaaaacaac tatgaagatt aatccaattt gggaattcat agattgaatt 99900 caccttttgc aatcaaactt ttataaagag aaaaaggaat taaatttcgg tatggttcat 99960 agatttaatt taattttatt ggaaaaaaca actaagatgc tggtccagtt aattctctgt 100020 taattaggat gttatgaggc aagtattata gaatgaattc accattgcaa tcaaaccttg 100080 tgacaattca tcttatgttg gaaaagagag caaagccact aatagatttg gggataaagc 100140 aaaaagtgca ttcaggttat gagattatgt tttgagaaga tccatggatc tcaacaagtc 100200 ttgttgagtt attacacatg ttgttcatcc aataatgata gtgagtgact taatggagag 100260 ccaaaaacat ggaagatgga aaaataagga actttaccgc ggaagatgac aatccttgcc 100320 tataagtcaa ttgaggcatc aagatagttt tgttcgagtt atacgaataa tagtctatgt 100380 atagtcaaat tgggatattg agtagctaat aatacactta atcatgaagt tgatgtcatg 100440 aagttaatac agcttcaaac atttgtttag aaaattaatg atatgtcatc ttatgtgact 100500 tgacaagcac atgaaacctt atgtaactat gaatttaaca aatcactcat gagatgtgat 100560 aatcattgtc ctcaatgcgg gactaaatat gaatccataa acaataatat ttttgagtgt 100620 ccatcaactc ttcaaacttg ggttttaaca acatcatttt cttaattttt ggttttctct 100680 attttaagtt tatataccaa tatgaattat ttattttatc ataagaacaa tattgaagac 100740 tcaaaaatgg atagatatcc ttacccataa ataatatgat atatttaaaa agtgcaaaag 100800 gctaaagatc tgatatcaac agtaaaagac ttagtaacgt ggtatagctt tcctacaaag 100860 ttaaaggagt tatatatcct gaagagtaga tttgtgtaga aataaaagtt gtagattcat 100920 tagttagaag acataaacat ctcagagatt tatatttcgt ttgttgtttt atttcgatat 100980 agtttttcaa acgacttcaa gttcaaactt aagtaataaa tgagtcatat gatttgatat 101040 tttttttaaa aaaaattatg gtaaatgatc tagccatata aaagagaatg gtttagtaca 101100 attatatgtt aactctttat taaaattgac taacgatcgg ctcggcctct gcctaatgtt 101160 tgaagtagct ctgcggtttt gtccgaaccg aaccgaacca aaatttttgg ctttcggttt 101220 agttacggtt ttgggttcgg taagcttttg aaaaataatt tgatttttgg ttcggttcgg 101280 ttcgttttcg attttcaaaa aaaactaaaa aaaaaacaaa atcactgaaa aaccaaacca 101340 aaaaacccaa atttaaccga aaatatccaa aaaaaattag aaaactttac cgaaattaac 101400 cggaaacaaa aaaaaatcgt tatttcagaa ataaaagtga aaaccaaaaa taatcgagaa 101460 ccaaaccaaa cgaaaccgaa tcaaaatttt gttcagttaa tttcgaaatt ggtttccaaa 101520 aattcggtta accgaaaacc gacgattcgg ttgggtctct ggcagggcta atttgaagtg 101580 ctggagagaa agaaaagtaa agaaacggca ccgtttcgta tcattttttt ttcctcggca 101640 ccgtttcgta tctatcatta agctttttta accttttaat gcagtctcca ttctcgggag 101700 agatcaatta atactttttc caataaagtt cttttgaaga aaaaacagac tcgccttcct 101760 cgtcatcagc ctttcttctt taacctaaaa atggatgatg atgatgctat tcgcgtaaag 101820 ctagagaatc tcccgactcc tacttccgtc aacggaatca aaccctccgt aatcgatctc 101880 tgcagcagcg acgaagaaga caacgacggc atcgatgctt ccagaaccgt cggcgagaag 101940 agagcgcgaa gggactgtga tatcaatact ccggcgaaga gggtggcggt agaggaaggg 102000 cttgggcaat cgtcgtcgat agtggctctc caggctacgc cttgtaacgt cgtgaggcct 102060 tcttcgtcgg cggcgtcttg caagcagttc tggaaagcag gggattacga aggaacctct 102120 ggtggtcact gggaagtctc tgcaggtagc gaatctcgaa ccgtgggttg tatacttctc 102180 tatttatttg gggtaaagtt tgttgagatg ttaattggtt caggtgggtt tgatcatgtg 102240 agagtacatc ccaagttctt gcattctaat gctacaagtc acaagtgggc tcttggaggt 102300 atctttttta tattttttaa tcaaagtttt catttttatt atttttagca gtgttttatg 102360 aagttggttg gaataagaat gtttgtttga ttttttgcag catttgctga gcttttggac 102420 aatgctctgg atgaggtgtg gaatgttttg tttctatttt taatattttt tctgtttggt 102480 ggtaatgttt tttttttttt ttctgttttg ggttatcagg tacacagtgg agctacttat 102540 gttaatgtca acatgctaac caataagaaa gatggaagca ggatgctctt gatcgaaggt 102600 atataatagt ttatttagta tttttttctt tctgtttgta ttcacgtttt gatgatgttg 102660 tgtttgggaa attttcagat aatggaggcg gtatgaatcc tgagaagatg cgacactgca 102720 tgtctttagg atactctgcc aagagcaaac ttgcaaacac tattggacag tgtaaggcaa 102780 ctcttttacc tgcaagatta tatttttaaa tgcttcttcc atcaagaata cacttaaagt 102840 tcatatgctt tttttttgaa gatggcaatg gattcaagac tagtactatg agacttggag 102900 ctgatgttat tgtattctca cgttgccctg gcaaagatgg agataggtta gttggtttta 102960 atgattttac tgggatatgt gttgtgtatt gaaagagatc aacaaaagct ttacaatgtt 103020 ctgtttgctt gatgttggtt ttagctttac acagacaatt gggctgttgt catacacgtt 103080 tctgaagagc acagggaaag aggacattgt tgtacccatg gtaagctaac tgtatgaaat 103140 aaccattcat ataacccttg ataatctgga atatttgata gcatgtgact gatttgtaag 103200 cataagaaag ttaggtaggc cagacactgt ttcagagtag cttttgtctg aaatactgtt 103260 agaaaatagg cgtcaaactc cttgaaacct ttgtctgctt cagagttaac tgtttgtcca 103320 aatttaatta gaattagcca attttaatct ctcttctaat cttcttctga tggtgattta 103380 aatgaaagct cgactacgaa agggaaggtt cagaatggag tccaatagta cggtcttcag 103440 ctagtgactg gaataagaac gtggatacga ttgttcaatg gtccccattc tctactgaag 103500 acgagcttct ttgccaggta aaaaacaaag gagttgtttc ataatattta tagctacttg 103560 tttattttga gaatatttcc acttatctgt gctctatggc tgttgtagtt caatctaatg 103620 aaggagcatg ggacaaggat aatcatatat aacctctggg aagatgacca aggactgcta 103680 gaacttgatt ttgacacgga tccacatgta tgtgtttttt tttactgtga ttttgatctg 103740 caacgatgta aaagctttct gtattcgtat actttgacac acgtttggtt gcaggatatc 103800 caacttagag gggtcaatag ggatgagaaa agtatcagta tggctgctca gtaccctaac 103860 tctagacact tcctcacata caggcattca ctcagagtat gaatcttcta tccgtctttc 103920 cttaacagtg gcagttgaaa ttgttttttt ttgttttacg aaattcattt gttaccttgt 103980 gaattgttgt ctccagagtt atgtatcgat tctatacctg agagttccac ctgagttccg 104040 tatcattctc cgaggaagag atgttgagca tcacaacatt gtgaatgaca tgatgcacac 104100 aaaccaaatc acttatcgtc caaaagaagg acccggtgga caatctaatt tctcaaatgt 104160 aatgtttttc acaacttagt tatactcaaa agacttcttc ctgcaaattt tatttgaaga 104220 acttgcgcag tttctaaata tggttgtgtg gcaatattta taacagatgt ctgctgttgt 104280 gacgattgga tttgttaagg atgcaaaaca tcacgttgat gtacaaggct tcaatgtcta 104340 ccacaagaat cgccttatta aggtttctct cgctcttttc ggcttatatt acctttgttt 104400 ctgtcagttt tttaactgtc ccactttgtt tttgtcagcc attttggagg atatggaatg 104460 cagcaggaag tcaaggtcgt gggattatag gtaatcgtta ttttgcagga aggtctataa 104520 tacatgattg gctcttttaa tgtgaagtct aatgcgttag tttgctaaaa ggtgttttgg 104580 aagctgattt cgttgagccg gctcatgata agcaaggttt tgagcgtaca acagttttgt 104640 ctagactcga gacacgtctt cttgtaatgc agaagaatta ttggtttgtt gctctcttct 104700 cttgcttttt agaaaattgc cgatgcttca ctgaactctt tgcgcttctg atttattcag 104760 gaggttgaac tgtcacagaa ttggatatgt ttcagcacat ggcaaaaagt ccgctaaaga 104820 ctctgaagac agaggtacta acatcttctt cttttttttt taaacaatcg gggttttaaa 104880 acgtgtgcta ataaacaaat ctcttggaca tttgtgtaga atcatcacca gagtatgcag 104940 tcccaaccag gaaaagagct gctgctgctg catcgttgag ctttaaaact ccaactggtg 105000 caaggacagt tgtgaatcga ggaggaaaag gaaaaggatc tgttagagat tctaatgggg 105060 tcggttcatc agagaaaagt ggtaaacatg gaaacacctc ttccaaattt aatggacgag 105120 caaaggctcg aggagctcct ccagctttag aagatatcaa cagtgatgag gactctgatt 105180 acgatcctcc gggtgaagaa aatgtcactg agcttcctga gaaggtcctc caatgctctt 105240 tcttttattt ttctccggta aatagaatta tgaacgtaac cttttgtgta cttgttctcg 105300 cagagcttcg aaccaccaac caagccacgt tctactgatt cacgtaccct cagtcaacta 105360 gagcaagaga atgaaacgtt aaaagagagg ttttgttacc ttacgttacc atgttatgat 105420 tcatgtttct cacttgtttg aacaacactg taagctttgt gttttcctta attctcaggc 105480 taaataaaaa ggaagctgtt tacttgctgt tgcaagaaga gctgcgacgt gagaaagagc 105540 ttcgcaaaaa acttgaagct gaggtataaa ttctactctt taacattttt actgtgtctg 105600 cttgcaaacc tataagcaac aatcagttag tcaccaatgg atgattcctc tttggtattg 105660 ttaggttcaa agaacaaaag acgagttaga agacgtgaag aaagagcaag agagtttaat 105720 cgacatattc tcagaggata gagacagacg cgacaaggag gaagaagatc tcagaaataa 105780 gctagaggtt ccttctttct tcttatcacc tttctctact aaatcttctc tcagattcag 105840 gaaatgtaaa ctttttcttg tggttgcagg aggcgtcaaa gaggatccaa gcgttgttag 105900 atgaaaaatc ccgagggaga cgctagaggt ctggagctag ctcggaagga tagtcactgc 105960 atggaggagg ataccattga ctcgtttagt tttttttt 105998 <210> 3 <211> 59642 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 3 gtagataaca aaataaaact agtggttaat agacaaaata atatatatat atatatatat 60 atatatatat atctatggtt tgttattttc tgtaaatttt tagtttttct aaaacaaatg 120 atataaaaat aataaagatt tattttaaat tttggttttt tattttagtg tagttttagt 180 ctaaatatat tttataactt tggtaaaaat gtataatttt ttgtaattta aatattatat 240 aataaaatta aaagctgatt taaaaaaaaa ttccagtgta ataaatgtat aatacttata 300 actaaagaaa ttatttaact tttctttaag atttatggta tacatattga ctaaaaatta 360 taaattaact tacataaaaa ttaaaattac ttaattcata gagaagatta ttatttgtaa 420 gtttttttgt ttgttttcta gaagggcaga tataattata tatatgaaaa attaatttct 480 tgaaagaaaa tgaagtcagt cgtttggaaa ccacaaaagc acataaaaag tggattttgg 540 tttctatgta taaaatagtg taggagttga aaaactgggt tcccaaaaat acagggaatc 600 tgttttagtt aaatcttgat tgggtaaaaa gtagctttta gtgtctccgc tggtatcggt 660 ctttctcgtt ttttgggtgt aaaatgttaa gaaaaatgtt tggaaaaact gcggtgagcg 720 tgtcattctc attttgttat agaacaaaac ttaggttcac tctctagact ggatttttaa 780 attcaccaca tctcctatca ctaatcaaat tgttacctag ataaataata aaaatattat 840 ttttaaaaga acaaatctaa aataatagaa aaataataat gacgtcaatt ttaatgacgt 900 taacgccgtt atctaaaccc taaaccctaa atcttaaact tcaaacctta aatttaaatc 960 ttaaaatgta aatctaaacc ctaaacctta aactctaaaa ccaaacccta taccctaaac 1020 cttggatcct aaactcaaat cgtaaatcct aaacctaaac cctataccat aaaggtttga 1080 gttaatgttg atgtttttct tttagggttt aaggtttggg tttaaggcct aggatttggg 1140 tttatggtct aggatttaag tttagagttt acgatttgga tttagggtct aggatttagg 1200 tttagggtat atgatttggg tttcaagtct agagtttggg tttagaattt aggttgaggg 1260 tatatgattt cggtttcaag tctagagttt gggtttagaa tttagggtat agtatttggg 1320 tttaggggtt aggatttaga tttaaggttt agaatttagg gtttaaaatt taggatgagt 1380 tttgttagtg gtgttaacgt tattaaaatt ggcaatcatt attttttatt attattttaa 1440 tttttataaa aaaatattaa taatattttt attaatttag gtggtacttt gattagtgat 1500 aagagttgtg gtgaattagg atgaaccaaa attttgttct ttgttatata ctagtggcaa 1560 acccccgcgg agctttgatt taagttgttc tatttatcct gaagtgtata atagtatgac 1620 aaatgtgtat cgtattcatg gtagcatatg ccactctcga gctctgaatg agaatgaaaa 1680 ttttctcgaa aacattgatg aattgatata tgtgagagct tgttagcttg acaatttagc 1740 aatataagaa tgttattatc agccttcatt tcatttttat agtgaaagaa agaatatgaa 1800 cggtaattag caataaagaa cggttgcgta gtttccaaat aagttttttt ttgtgattct 1860 tgaaaaatac agcgaaacat atctacaatg ctagattaac tttagctcat ggttcaattt 1920 tctggcaaca gttacagcac gagcagaaat ccttaacaaa caaaaataag caaaaccgcc 1980 accaccggtt ctaaccacta aaatgagtat ctcatttttt aaattagacc gtttgataga 2040 attgcataac tgtctaacta agcatttgaa accacatggg tgttctcggt ttcttgatct 2100 ctttctgagc attttgaaat tcaatcttaa aacattgtga ctgagagata ttacttggac 2160 aggagcaaaa gggatatttc cagagctggt tcatatggaa attggcgtat cttactcgag 2220 cccaggggcg gatctactaa gggagtagtg ggatctgacc ccattaaaat gaacaaatag 2280 tttgttttgt ataagaaata ctaaagaatc ttcagctcaa ttgttgttag ttctagttct 2340 gacctctata aattagggtt cagttcccta attgacactt tttcagtata tttttgcaga 2400 tttcttttct tatttagtga catctacagt ccacgtaaca tattattaag aagaatcaaa 2460 gcccatgtaa catttttaaa gcttattaca tttttatata gtgaaaacac tacttattct 2520 ttaaaaatac ggccactata atacactata accccggtaa aaacatttct agatccgcca 2580 ctcctcgagc cattagctag acaaacgagt tatatgtcgc tatcaactgg tttactactt 2640 tcgtctttgg ccgtgacatt ttccgtatct gattgtgttt gattccaagt gttttcttct 2700 tagtttactt tacacggcgt ggtttataca gaagcacaat aacataactc ctgagggtat 2760 ttaaagtttc tatttttatt gaattataaa atattagggg tgtgtgaggt ggtgtatttg 2820 ttgtatttta tgtattttat gtttgttatt attttttgtt atgaaaatgt ttgaaagtac 2880 agttttatat attttttgct atagttaatt gatgttatag gatgatatta tcttatacca 2940 atattttgaa tcccggtccg gatccgcggt tgaaccgata aatccagtaa tccgaatata 3000 attcggtttg agttttatga agaaaccatt atttaaaaac ccaataaaac tcggaactcg 3060 acaaccagtt gaatactggt caaaccaata agtaactttt atttattttt taaattcttt 3120 aattatgtta ttaaattttt ttatttaaat taaaaaatga gattttctga ttttacttat 3180 tttttttctg ctgccggata tcgactatgt atctttttct cttttttttt tcgtacatct 3240 catttacact atttaatttg tgatttattt gttatttttt aagattttga tgaagatcca 3300 tgccatttga aaaaaataaa gtgaacgatg ataaggaaaa cctgaattag ttgttgtgat 3360 ttggtcggta ttagtttttt tggttatcga tattctatta ttatagttta atttttaact 3420 tttgtttttt tatttaaagt ttaactttac ctttcacatt taaatactat ggatttcaag 3480 tattaatatt tttttattag atgtcataac gtctaacttg ttaattgtaa aatagtctga 3540 attaaatttt gatgttttgt atgttaaatg aaataaaaat aagaaaattt aagtgttttc 3600 taaatattct taaaacataa atatgtatta tttttaatac ctaataagtt attatttaat 3660 aaatttaatt aatatattga actgcggttc gtccgcggtc catcgagtaa tccgatgatc 3720 cggtaaggtt cagtgtccgg tttcgggttt caaaacattg cttatacttt atacattatt 3780 tgtttgtatg aaaatgtgca gtatattttg tattgtattt aattaagatt ttactgctta 3840 tgatagatat tgttggagct taattggtgc ttacgtagtt atctaatata acgtaagaca 3900 agagattgac ccgcacgcca gtgcggatgc taatttttac ggttttataa atttttattc 3960 gttattttat aattagtgta agatgtgtcg tcgtataact aattgtattc aaaagatttg 4020 gactgaatct ggtaaaaaga ttatttatcg tacaattata gtaacccatt tcagatacat 4080 tggttattta gatattttta tgtttctaca catcagaatc aaaatcattt agacccggga 4140 tgatccaact caaacctcat acataaattt ataatatcca agtggcgcct aatttcaaaa 4200 tccaaaaaaa ttaatcccga aagaaacaac ttgtacctca atgagtattc gaatgtccat 4260 acttaactga ttctgcaaat aaattaaaaa gaaaactctt tttatatatt aggcaaaaat 4320 aagaaaaata gaaagaattt tttatttagg aaaatagtta tatgaagtga aacattaagt 4380 gacaataaat gtaatacttt ttaattattt tgatttaaaa ttattatttt gtttacataa 4440 actatgtctc gaaactgaga attttgactc ctgatacatg taatatttgt ctatttcttt 4500 ttttttggtc atattggcta acaactttgc tgcaacaaaa ggcaagcaaa aacacaaaga 4560 tagaatcaat cattatacat aaacaactaa cattgcagag acgtcctcgt atatcgacaa 4620 cactaggctt aagcagtgga atgacgccat ggaaaacaaa gaacacaatc aatgatctaa 4680 tgcttgtgat tggttccaca actagtgcag aaataacaat cttaacactg gctacaatag 4740 cagaggcgat gtaacaccaa aatgccgagc ttttaaacag tacagagagt aaatcatctg 4800 tagagcaatc ttccaaccca aaggctgagc ttgcaataca tgagcagcaa cgatacaaaa 4860 gccatgataa taggaaagtt gaagttggtt caaaagaatg ttaataatca agtctgaaac 4920 cacaaccaag ctaaaaatct acaatttaac attgagtact ccattctaga ggaagttaaa 4980 aagatctgaa accaagaagt gatagacaac agacactcta taacagagta gaatgtagta 5040 attaataagc aaagaacact ctttagcaga gtagaggaag gactctaaaa catgtttgtt 5100 aatagacata aaatttatat tttgctttag attaatacac atattgatca ggcctgagta 5160 tgcatgtgag caaatgcata ttaatttatt atcctctgtt atagagtagt tgtaaatgtt 5220 aaaaagaaat tatgatggta attatttatt aaaaaaagat ctagtttttt ttataattct 5280 gattaaataa ttcatttagg ctccaaatgt ttccaaccgc tccgtcccac accgcactta 5340 acagtaacaa aaatctctac atatattata tatctatacg tttttataac tgatataacc 5400 gcacctcagt tgtaccgctt gtcccgcacc gcttaatccg ctgttaccat tcggagcctt 5460 agttagacca tatagttttg tattttcttg tgaatgtaca catatatagt acatactaca 5520 taatgtctag aattagattt attggggttt ttaggtaata aaccataaaa tcttttttag 5580 tacgtttaat acagaatcat aatgcaaaag aatgatattt taagaaaagg caatgtcatg 5640 tacagttagc gaaaggataa gagagggaac aaagtgaact gagaagatta agatataata 5700 atggacaagt gacattgtcg tggctatgtc tttaaaactc atatatggtc tctctttgtt 5760 tggctttatg tccgattccg atttcttatc tacgttcaca tgcataacta ataatagtct 5820 tcataaatat cttctccttt cctcattata atttttttta aatacaaaat cgaatttatt 5880 gggagaatat ttcgtttaga tccgatatct tttctaatta tttatggaac aaacgttatt 5940 ttatattaac tcaaatccac tatatgaatt atgtatgtaa gaacaaatat gaaaggtgag 6000 gatgaatata attaaagact tgatgctaag tttggttaaa caaaactaag tgatggtggt 6060 ttagggggcg actggttttc tcgttaccac ccgcaaacgc agcttttgcg attggtcgcg 6120 gttgtcggcg atttgtaaca attactcaaa tcgctctaaa ccgcttcaaa ccgttccgaa 6180 tctcataaat tcaaaagctg gctccagcta gcatttgcgg ttgcgaacgg ttgcgggagg 6240 gtgaattttt ttttcttttt ttaaaacaat atatatacaa aagtaaaaat gtttaataaa 6300 aaatttaaaa tttaaaattg acattatgaa aatattaaaa tatatctatt atattttaat 6360 taaaataata aaattttata ataaaaacaa tttcaataaa ttttcgaaaa ttaaaattat 6420 aactttctaa atataaattt tatatttatt ataattttat gatttttgat atttttataa 6480 ttatattaaa tgtaaatatt gttaatttat tatttgattg ttaccgcatt tggtagttaa 6540 ccagtcataa gtcacccgca aacgcaccaa tttttaaccg cagtacgagt cgtacaaatc 6600 tcttaaaacc gctagaaacc gcaaccgccc gcatccacaa actcctgcaa ccgcaaccgc 6660 tacgtttgaa ccagtcaggc ccttagtgat aaaaatgaag atgcagaatg ctgagatgat 6720 atgtatcagt tcgcgaagta ctagaggagg tactacaggc gtgtgtcatg aagatggagc 6780 ttaatgtgag tttgggtttt gtgatgtgcg tgggcttgct gagcttggaa aaggaaagat 6840 gatatgtgtt taaagacata tggacgtttt ccataatgca aaagggagtt tgcttgaaga 6900 tgaagttttc cattaatgaa aatggaaagt taccttaagt gtatttggaa gacttgagga 6960 gcaagttaag gacgtggaag gcaagttctg gtctactata taaggaggga cgtgccttct 7020 gagaaagcta gacctgagag aataaagaga gagaggtttc cttggtgtgt gttactgctt 7080 ggtgtcgaag gacattctga agcattgtct gatggagtcc gatgtggact tagtttggtg 7140 gcgttggagt tggcgccttg tgtggtggag ttagccattg tgtatagctc gtgtgagctt 7200 tgtgtgtgct tgggtgatca agcgttttgg tgtcactggt gtgcgttggg tgctgacgta 7260 cttggtgaag tacttccgag aagtgaaaga tcgaagcata gactcagggg gagtttagta 7320 gaggcggttt cattgaagag atcagtggag attgcagctg tagaagacag tgtgctccga 7380 tgcatcggat ggtgatctat gcatgcgtgc ttgattccta atctttgtag attgcctact 7440 tagaaaagag tggtagacac tagtgtgtgt gtgtgtgtgt gttgtatcat atagcaattg 7500 taggttgctc cttgttctaa gtcaatgaaa tctggacgag gtcccgagga tgtaggaaac 7560 gaaccccgtt aacaaacttt gtgtgtttta ctttctgcac ttgtttattg tcgcctcatc 7620 tgcactaaca attggtatca gagcgggtca cctaagttac tggtgagatc atggatgatg 7680 aggacgaaac ttgttcagaa agtaggacaa agtttgattg aagatcgttg aagatggcgt 7740 gatgggattt cttcctaggt ttggaaggtg atgatcttcg agttggtttt tgaccatgat 7800 gtgattcata gggggagatg gaagacgtgg ttttcaagtc ggttatgatg agtgcacatg 7860 catagtcaaa aagagggaga ttgaagatgc agtatgctga gatgatctgt atcagttcgc 7920 gaagtactac aggcgtgtgt catgaagatg gagcttaatg tgagtttggg ttttgtgatg 7980 tgtgtgggct tcctgagctt ggaaaatgaa agatgatatg tgcttgaaga catagggacg 8040 ttttccataa agcaaaagag agtttgcttg aagatgaagt tttccattga tgaaaattga 8100 aagttacctt aagtgtattt ggaagacttg aaaagcaagt taaagacgtg gagagcaagt 8160 tctggtctgc tatataaaga gggaaatgtc ttctgagaaa gctaaacctc agagaataaa 8220 gagagagagg tttccttggt gtgtgttact gcttggtgtc gaaggacatt ctgaagcatt 8280 gtctgataga gtccgatgtg gacttagttt ggtggcgttg gagttggcgc tttgtgtcgt 8340 ggagttagcc attgtgtata gctcgtgtga gctttgtgtg tgcttgggtg atcaagcgtt 8400 ttggtgtcac tgatgtgcgt tgggtgctga cgtacttggt gaagtatttc cgagaagtgg 8460 aagattaaag tctagactca gggggagttt agcagaggcg atttcattga agagatctgt 8520 ggagattgca gctgtagaag acagtgtgct ccgatgcgtc ggatagtgat ctatgcatgc 8580 gtgcttgatt cctaatcttt gtagattgct acttacacta atgtgtgtgt gttgtatcat 8640 atatcaattg tagattgctc cttattctaa gtcaataaaa tctggacgag gtcccgggaa 8700 tatagaaaat gaaccccgtt aacaaatttt gtgtatttta ctttctgcac ttgtttattg 8760 tcgcctcatc tctactaaca aaatatacct tacaacatga tgctactgac tcagttttcc 8820 tccaggtttg atttttataa aactctttca cacctcttat gggcaagttg aaatggggtt 8880 atatttcaaa ttcataaaaa aatttattac tcatggttac tctcaccttg aaaaaaataa 8940 taattgaatt gtgttaaaat ccaaatcaca gaatatatat atatatatat atgtatatat 9000 atgtaagaac ttatttttca gcaaaacaaa atttgatttc aagattccac ctcatgatat 9060 taacagagaa aacattacct cttatttaac tggttgatat tttatacgag tatggaagtt 9120 cctaaaagtg atcaaatgtg tgaaataaat atgccggcaa aaggcagaac tatgacttta 9180 gctttcagct ctgtttacct ttgcttatgt ttttccccaa ccaactaaga aacatttgtt 9240 tacttttgtg tgacattact cattaagtga ctgagaattt tctaactccg gcaaacaaaa 9300 tcatttctaa agaatgctgt attaaactaa agtgattgga cccactagtc aagttacttt 9360 taccgtgaac tactgtttca ctctattttg gcttcatgct tagtgttcta aaattatgtt 9420 tgagtgtcct aattaagaac aagagaacta attccacagc cggaaattcc aaactgaaac 9480 ctgttttctc aaatctccaa atctatgaag ccatatatgt aaatttcgta gtggcgaatc 9540 ggaatatgtg ttgctctatg gttgtagttg attttcgact tgatcacttt atttaatgac 9600 aagaacagca atgttttgtc ctaagaaaag gttgatgagc ctgacacaaa aagggaggaa 9660 gccaagaatt tgttggggtc gaacgaagtg tcatgctaca gaaaagaaat gtcatggttt 9720 aagggtccgc taattcatta gatagttcga tgtttttata tagtagagag acagtgcctc 9780 acacgtgcat gtacgtccca tctttttctt gtcctgtaag ccatcctttt aaacactatt 9840 gttaatccac aaacctaact tttaactatt taaatggttt tagttttcat ctagttatca 9900 agaagtaact taaaaacatc tccaaaaagt attctataac tttaaatatg aagttttttg 9960 cattccaaaa aataaatttc aaaactttaa atttgaagtt tcatatattt gtttgcattt 10020 tactccctac aattacacat cacatttaaa aattcttgtt tattgtttta atcttttaaa 10080 aaaatatctc ataaatattt tgactttttt ataaatttaa tttttacata taaaattaaa 10140 taaaacttta aaataagatt taaaatgttt taaaactaga tttaaacaac aacaatatac 10200 aaaagaaact taaaagaaaa ctttaaaatt acatgaagac ataactacta cacaaattta 10260 aatattacaa tagttatgta aatttgattc ggaacctcca aaatctttaa aatattgtcc 10320 aaacaaattt tgtttaacca aaaatggttg ttgttgtttt tgatgttttt cgtacgattt 10380 tttcttgttc agattgaatt tatgcacgag tattaacatc atcaatagaa gttaagtctt 10440 ttagcaatat tttatttttc tcttttacat ttttttagat ctaatgtatt tataatatta 10500 gtttcactag atttaaataa tttttagctc gtattctaca aattacaaat aaagatagtc 10560 atttttactt caaaatacac tagattatca tatatgcatt acaaaaataa ttttatagaa 10620 tattatggta ttttccttaa atattaatat taattatgtt atttctattt aaaattttac 10680 taattaatat tttgtaatac gtttatatat gtgttagtaa aagtttgatg aatttaaatt 10740 aataataaca aatatagtac tccaaagctc tattcatgca taacatggcg ggtggcaatc 10800 caaaaaatat tcacatcacg tatgttttca gtgttgacta tacgaggatt cactacaaaa 10860 aaaatagcca tattgttacg aatttttttg tcacaataaa gaataattcg taacaataaa 10920 aatattgtga ccagtttgtg acgttcttta aacggtgaca atatgatcgt cacaaatttt 10980 gttggtaaca aaaaacgtca ctctgtttat gacgatatat attgtaacta tttcgtcaca 11040 gatagcaact atttactaaa gtaagaaaaa cgttagaatt accaaccaca attaacatca 11100 caaaattgtc atattatgtg actgtctaca agtcttaatt tcgtctctag ttaccactaa 11160 aataaagttt caaaccgtcg caagaaaata cgaaaaaata attactaatc catcttcatc 11220 gtgacttttc gtggccttaa actttgtaac attttattac taaataattg tcactaattc 11280 atattacttt tttatatttc atcgctaatt tatcatcaaa cttctggctt aactaattat 11340 taatttgtca tctcaaaagt ttcaacattg atcactatat tattgatgat ttgtagttta 11400 aatacatagt aatgaaaaca ataccaaaat aaactgataa cataaataat aaaccacaat 11460 aaaagaatat tctaatatgc gatcagattc agtttagcga tctccagttg tgactcatga 11520 taaaaggctt cttgattttt agcatcggtt gattcttgca cacgaagcga aaggtacgac 11580 tgctaacttg tattctttaa agtgaccacc ttgtaactgg cttcttcttc catgatttta 11640 ttaccaatgg ctcagatctg cttcacctct gctgtcttta agcttaagat ctactctcta 11700 ttgaactctc cttaatgtcc cagatacgca taccaccaca gcgccagaaa cgactgttgg 11760 tgacaacacc gtcaacacaa atctctcacg cttttccatt tttacgctct cgctcttcct 11820 aaggtgcctc tgcggctttt cttttggagg aaatatatac actttttatt tagggtttct 11880 aggctaatgg gctctaagcc tctacttatt agtctaaggg ttccggctta aaatagagat 11940 acggtggatt cagattaaag tatttttacc tatattacga tccatcttca atagaaatag 12000 ttgatatttt ctattgttta tcatttttac atataaatat aatcttctat ctaatacaaa 12060 ctatatatgt attgtttttt ctttaaactg atttacataa ataataaaat tttagtttat 12120 acataattta aaacttatca taaaatgata tataaaacat ccatattttc aattagtatg 12180 agaaaaagta ctttttgaaa tccttcacgt ttatacatag gggcatataa atcgactata 12240 taaacattgc taaatcaatt tctaaatatt tcatggattt cttacatctt tgagtagaag 12300 tttattacaa aaaaaatttc atctacgata tgtaccagtt agaaactatt attttgttat 12360 tataccgtca caaagtaaaa ctaacttttc catcacaagt tcgtaattag tgtgacgaga 12420 catacagtca taatatggta acagatgtta accaattgtt aatttgtcac aattttgtca 12480 ttgattgcga caaaacttag ataccatttg aatcatcaca atattgtgtc aaaaaagcta 12540 ctcatctgtg acacaaaaat ttggtcacca taacgtatct aaaatgtcat aaatttgtga 12600 caaatatttt tttgtatcaa aatttagtca caatataatc attttctcgt agtgattgga 12660 ctgaaatgca taagacacta aacctttcgg agatgcgtgg attggggctt atttgccaaa 12720 taaccaaaac agaggtaatt agatctgtag tgagaagtta gagagatata gaaagagaat 12780 tgaagagaaa gaggatgttt ttggttagat agtgtatttg tgtttttgta tctttagagg 12840 ggcaaatttc ctttggttaa ttccggatat gtatcactat cagtccactt ctttaacatg 12900 ttttttttta acatgttaat tttcagctgt ggtggatcat gtactaatct tctcacatac 12960 aataaacaaa ttggtaaact agacatagag gatcattagt attaagatgt cttatagtaa 13020 aataaagaca attttataag agttagatat tagtagttat gagaagtata taattaattt 13080 atgacggttc ggattggcac gagttcatca caaataaata aaaagctatc agtttattat 13140 gggattagat aacatagtct tgaaggctat gaactcgaac attctttaac tatggtccac 13200 tacaaggcct gagtaaagta ttctctacgg ttcatgcaag actagcttgc gcaacttgat 13260 tgtggtccag gatccttttt tgcttgtagt ggacctattg gtgactcaaa atgtgtttgt 13320 caggttcatg cagtacaata aatcttttta tttttcaagc aagggtcatg gactatatta 13380 ttgtgctttg ttactatgca tgagccacgt gaatgcatca atattgatag ggccgtttct 13440 ttttttttct tttttttttc gagcaacaag ggctgttctt atatatacaa aataagcatt 13500 agtgttgaaa atcccactca tgagtgattt aatggtagat ggattttggg aaactaaaca 13560 atccagattc gaatcaaccc cacgatatta aacagtgtag tcacgcagat atgaaactat 13620 tatttgagtc ccatttgaat attcagaaaa aaaattcata tttagaccat gtatctccac 13680 ttgagagact agtttgagtt tttctatagg tttgggatac tctcaagtta atcaacaaaa 13740 ctccaaatat tttagttata taaagtatat aatctcaaat cattaaaaca aaattttata 13800 tttagcctct aatattaaat gtgaaaatgt atatttgggt taggttgtga atggttaatg 13860 gccctttcat ttttttccca gctggacgat ccatttctta cgggttttgt ggtctaaata 13920 aaaatgataa tgtatgtctg catgcacgcc gatggaacat gtaattctta tccgtgtaat 13980 ggtggcctct atagcactta tatgataaag aaaaattaaa ggtgaattcg aatacttcca 14040 tgttgcaaat ttatgctaat attttcgaat acattttcca tccgactgag agaaaaagtg 14100 ttgtggggtt gggttacaaa caaatgcgag gtaggtgcat gttcgataca cgaaaagaca 14160 tcattattta cgacgtgttc tataccccgt ccattccctc aacacttgta ttgtttaaat 14220 caagttaaga attgtatttt tatgattttt actatgatta gttggaaatc caaaataatt 14280 cattaaagat gagaaattag taacgattag ctttcactaa tccatttttt ctttataacc 14340 ccacacgttg agttatttcg gtctaatacg taagcttcat atgttgtcct ttgaaaattt 14400 agaaaaccta cggatgcata ttctctcggc cccactcttt gtttttttgg taattagctt 14460 aatgataaat ggtttttaag aaaactaggt gactgatctg caccctgtgc ggacataaga 14520 acatgatcgg cccgcaccat gtgttctctt tcggtctgca cctcacgaga gggaacacag 14580 taacgtcagt atgaagaggt agatattgtg tgtatgtata attgcaacgc cacaaaatat 14640 tttgtgtgtt tacgaagata ttttcattca aaaaatgaaa taaatagtgt atagttttag 14700 aaataacata ttttatatta ttattaatta gaattgtatt gtatatgtgt cgtaactctt 14760 tattttaggt gaataatatt atttttccat aaataataaa caaacattta tgtagacata 14820 ttaaaagaaa atataataaa aatcaaaata ttatccataa ataatataaa ttatgaagta 14880 tatttctcga taaagaaagc aaattcaatt agaaacctgc aaaaattaaa taaattttgt 14940 aagcaattgg acgggttaac attatttgat agatttataa atttttaaat tttattgaac 15000 atgaaataat attaaattga cataccgtca tcggtctcct aactcatcac aacccatcta 15060 acaaatacaa aaaataaata attgtaacag tttatatatt ttaaaatttg tatttgaaaa 15120 aaaagtagat taaatttacg taccgtaact acgaaatatt ctgaaaaact tgtttgtaga 15180 caacattcaa tgtttttgtc tgtggcttcc cttctttacc agttattagg atttttaatc 15240 cagatctcga cttaactctt gaaagtgcaa ctttgccttg cattttgtaa gcattttata 15300 aattatgata aattatgata aatttattct ttaaacaacg ataaataatt taaaaataat 15360 attaataaac atttttggat tttgtaatat tgaaaatagt tattatataa ttatattcga 15420 acacaattca tcaagtagag tataaaacta ttataattat cttatataaa atttcgttca 15480 ttgtatttta tagtttataa atattaaaac aaataaatgg tagagtatgt aacacctgtt 15540 ttctaccagc gtgagttaga acaccgccgt atttaagaat cataagggcc tctacaggtc 15600 tttcttcttc gccttcacca tcccacttta gcggcttcag ttaaaccttc ttgtatatcc 15660 ctgagaaatt tcctccctgc gccattccaa aaggttctct gctgtgagaa aatgacctca 15720 tgaattaaat aaaaaatgca taatgctagc ttacttataa gatagtatat tcaacaaaaa 15780 aatgatataa gatagtatta cttgtcccct ggtcacattt atgtattata tacatagatc 15840 ctttgatcct tcctgtatat tcaacacaaa ctcttcacca actcaagcat gaattcttgt 15900 cctctggtca caaaaattat aagagtttta taaacgcaga ataagtatat aaacaatgct 15960 tctaaaaaat gtattttgtg tgatgtatac ttacttcttt atcaacaacc accatttcaa 16020 tggtgtttcc tgattctttg ttatagttta tccacaagcg aacaatccta atttcttttt 16080 ttttgacgct gatttattaa gatattacaa ttacgatatg agaaagatta catagacgat 16140 tcggcaaccg gcaatactac ctgccttatg aagacctacg cctaactgca tcacctgagc 16200 cgtcctatga aaatccacgc ctggccagat ttatttgcac catgttgaag atcccttgta 16260 tgtctttctt ctgtagtctg cataattctt taataaactg ctctctccgg gacttgaaac 16320 ctggatttct tgtaatctgc aataaattgc atagtctgag attcgaaccc cagacctggg 16380 tgtagaagcc tttaaacctt aaccagtagg ctagggtgct tccacaacaa tcctaacttc 16440 aatacgcgac gtatctttac ggggttttaa ttctctcaca taagaaacaa tatttttttt 16500 tgctcgcacc attgccattg ttcttgtaag agctgaatgt ttgtaattta agcattcggg 16560 tttctcatat atatattaag ccgatttatt tatcatatta atgaccccta ataaatatta 16620 aaatcgttta aagaaagata ttaattgtgt attgtcataa attgatttgc atatgatatg 16680 attttaactt gcgcaagtaa tgtaataaat atgataacaa ccggcgcaag caattgattc 16740 gaataataag gaaagttatt aatatgcaaa ttagttaaca atcttgcgca agttatctaa 16800 ttattatccc caaatcgaat aaatatatgg gcttaacatc taccgacaat atatttgggt 16860 ttttctaaac aggctattca catttttctc ataaataaga agaccaaact tgaaaatccg 16920 aaaaccaaca gaccggaaac cgcaaggaat gaaactgact gactaaatta gtaatgtgaa 16980 gctctaaatc atgctgcaat tagtgatgca acagactatc gcaattagta atgtgaagct 17040 caaaatcgtg ctaatgaaac aaaaaccaaa cttgaaaatg tcaagagagg actgtctaaa 17100 tgcttgttga gttattaagg agaagataat cttacagtcc ttcttcagag actgaagtcg 17160 aattgccgat tgttgtaaat gtcagttgtc tcttcttgtt ccatcagtag acagtccgca 17220 aaatacatct ctggtcgtgg caatggtctt gtttaagaga atcaagaact caacaacaag 17280 aagattaatc agtcaattag atacaaagat tcaaagtgtt aataagcaaa tcgtagttta 17340 tagcttaaca tatgtcgaat ctaatcagtg aaatccaaaa atctttgtat catagcttaa 17400 aagtcgaatc caatcagaga aaccgaaaaa tcttcgcatt atagcttaaa agtcgaatcc 17460 aatcagagaa accaaaaaaa ctataaattc cgagagtatc gacaaacttc acctcgtctg 17520 gttgtcgctt caattgtttt catcggtttg aaaccatatc tcccttcaat tgatacgcga 17580 ttgaaaaaaa aaaaaaaaaa aaacttcatg acatacgacg gtgttttcaa atccgtggag 17640 gggagtgaaa aaaataaatg aaaaagaaaa attccaaaaa atcagccaat agaattataa 17700 ggattttccc gagaagctct atatgagtgc cacgtcagca gaaatcacta aagtgacttc 17760 tcttttaatt tttaggagga taattctcta gcttgggtaa aatcgtggat atctacgaaa 17820 tgattccttt ctacgtacac gacttttcat caaatacgaa tggttagtac aattaatagt 17880 ccatccgttc ctaaaagatc tatgttttag aattttcaca ctttttaata aaacactagg 17940 ataagacctg cgccttgcgc agggtgaatt tatttatata tattatcgat aattttttta 18000 tatattggat cattttattt atacttatat aatgtttttt tgttgttatt atataatttt 18060 tttccgatga ccggatcaat ttttattaaa aattatggaa ctaaactata aataataaat 18120 catgggttga tcggattgga cattaagcaa attatgacac aaaaatttta ttttttccac 18180 cgaacacatt cttgaaaaaa ttcaacagta ttattttcac agttgaatta ttttgacatt 18240 tatcttccat atggttttga aaggtctcag atcaaccatc gaattgatac atgtcatttt 18300 aatgttttta atcgtattct taagggaaaa ctaacatttt tgtaatttaa agtggtttta 18360 aaaaattcaa aatataacat ataagaaaaa aatctaatat ataagaaaag tataacatat 18420 aaggtttact catttttgta atataaagtc gttttacgaa tttaaaatat aacatataat 18480 gtctcctcat ttttgtaatt taaagtcatt ttagaaaatt caaaatataa catatgagaa 18540 aaaaaatcta actttttatt atatggttaa tgtcactgtt tattgttttt taataatata 18600 aatttaaaca aaaattcaga aggatgtaaa aattgttatc aaatctttat tattcataat 18660 cattaattat catatttatg ttaatcacat taggtaattt cgtagttttt atttaaggaa 18720 ataatacact cttcttatat tttagattaa tataatgttt tctagtaatt aaattttgaa 18780 ccaacatttt ttcaatattg atttttaagc tgtcacgtaa gttaaattat tatcctaatt 18840 aaatgacacc gaatcagagt cttttttaat tagtacaaac ttagagttat aatttttaaa 18900 tgattttcaa ttaatatacg tacatgagaa actaaaacag cttgttatat aactaccgag 18960 atatttgatc ggattagcat aagcaatatt taatagcctt ggccgcaaat tctcaattga 19020 tacgccctca catataagct ctatatatta tttagtttcc attagttcct taggcttaat 19080 taatagtctt ggctataaag tctcccacta cgatgaattt ccataggtta atgtgttagt 19140 ttataaaata tattaataat atattgcctt ggccacaaag acttaacaaa catattttat 19200 ggatctcaca cgattattaa tatttccatg ggcagctttt ccttgaagaa aaatgagaaa 19260 taaaaaaaat tgattaaatt cgtttaacat aaataccaaa actggtaatg attgatttaa 19320 cataacccta aattagtttg tgatatgaac cggttaaatt gtagagcagt actttttgaa 19380 tcacatgaaa ctcaaaagta atctgccgtt tttatatacc tcacttacag taataattac 19440 atgattttag aacaaaaatt ctctagaacc aactgaagaa ggactcccca accattgttt 19500 tacaaaaaaa aggacccccc aaccattcat gcaaacagac atagttatga ccctttaaac 19560 aatatcatag tacagattat aaagtttttt atcaagtgac tgaatttttc tggtaaacca 19620 cgtttgctac atatacaata taattaataa agtggatatg agaaaatcag gaagattaac 19680 tgaaacttgt gtagcatagt tctattacag tggtgaatgt tcttattaat caaggtagat 19740 aatattaact gacgataatg ttctaacgat aatgttcctg tcaataattt ttgtaagtga 19800 tgtaggtctg tttattttcg tacataatgc atagaaaatt acatgttcta ttttctacaa 19860 acttgaagta aaatgagaac atttaatatt tattccctat aaaatgtatt cgtagacgtt 19920 attacatagt tatgcttaca tgataagaaa aacatacaca ataaataata ctgatggatt 19980 acactatggt tttacatagc ataggcgcac ctgccgtctt atttttagac tatgtatatg 20040 tgactgtcaa aaattgtatt tcgctaggga gttaatttat aaactatgct atttcttaat 20100 gtgttataat tctgacacgt cagattttag aaggcttaaa caactgccac ataggatggg 20160 gtcttttttt aatttttaca aaattcaggt tataactttt taaaagatcc tcaattaata 20220 tataggggat attaagactt agttataaat acatagtttt ttttgtaatt ttatatttta 20280 tatattttta aactaataag attctaaaaa ataaaattaa tgttcttgaa ctttacaatt 20340 tctcactatt gttgacaaaa ttacattgaa aatataaaat atgtatattt ttaaagcaaa 20400 agttttctat agaatatgaa tcttttagaa acggaaagag tataagatat gtcaacacgt 20460 caagacgtgt atgataattg ataagtacat ttactcgtag ttaattaggg aaaatatgaa 20520 actacatatc atatatacat aacattatta aaatagaata aaactgtaat catatggagg 20580 tggttcagtg gtaaacggac ttcagaaaac ataaatttga ataaattcgt gtggtcaaac 20640 agatatgaaa ctatatctta aacttcattc taatatctag aaagacagtc catctatagg 20700 ttttaccttc atgtttatag caaaaaaaaa gagaatgaaa aatgtcaaaa aaacatcata 20760 aaaatgtcat tataacctaa gaaatcgtaa tatcattttc atctcgctat caattcaatt 20820 caacctaagt cataactgta tcaactaatg tgtatatata tattgtctcc ttcaaataaa 20880 gctcgaaata tgtaacgatt tattcgttaa ttgtttaaag ttcatactta aaacaaagtg 20940 gcccttcgga aatcacgagg aaatcgaagg atgttctcca ccatgtgcgt atgctaaata 21000 acaaacacat acttcttttt acattttagg atttattctt aaactattat tctgatatct 21060 aaacacacat atataaatag tagaaatggt acatagcaag tcgcctacat tagtttctta 21120 ttcttgaaga gcttcattcg tgaggaaaat taactatagt tctctaagtt tggcaatctt 21180 tgatgtgaaa aaaactatgg aaaaattccc tctaattagc accagtccca cgtttcacac 21240 cttcattaag agaaaattgt aatgtgcact caattaattc catagtttat aggaaaatat 21300 gatagtcttt taagccgggc tacaactaga cgcttgtgga tgtgagcaat ctaagttaga 21360 tattacccgg cagatactat gacttacaaa gtacatccta tgtttctaat tacttgtaaa 21420 cggtgcgctt taggttgcca actctggtca tagagtgtca caaccatgtg aaaatgtttt 21480 atccaaataa agaaaagttg ttacaagtaa ttttaatgag taactagatc tcgatccgcg 21540 cacatgtgct gatttttatt ttcatttctt tttatataaa tattttgttt taaattctaa 21600 attagtatat attataatat atatgtgtct atcaattttt aaaacataat aagtttacgg 21660 tatatttttt cattgaataa tttgtttcaa actttcacat atatttgtat ctttttctat 21720 atatattttc gaataattat tttattatta aactcgtaac tatatatata aagattacta 21780 aaatattatt ttattgtcat attcaaagat attgtaacat ttcacaaatt tagaaagttt 21840 ttaaaaaatt aaactttttc gtttcataga tttatattat cgagtaaata attaaacatt 21900 tagtttttgt tttaattttt aaaataaact atatagtttg aaatttgttt tcattggttt 21960 aaggtagtaa atattaatca ttgttagata atatgatttt tgttatttaa attttttttt 22020 ataattttaa aaattaacat cgacaaatat ttaattattt aacatatgga ggtatagtat 22080 tataatatta aattatatct attttattta tactatatat aaatccaatg gatcatctat 22140 tgtttaaatt caattattga tagttcaata aaattttctg gtaggcctaa aattttaata 22200 ataagattat agattaaatg taatatgact tttttagaat aaattcatta ggtccatttt 22260 ttaaaaaatt acacatgaat cgaagttgtg acttatgttt taatatatat ataagattgc 22320 atatagtccg aacgtactta atgcaactaa gtccaatata tatacaatta tattaagtcg 22380 ttgatgattg aatcgcaaag gcgtgttgga aaacaatcga agagagaaga agaggtatgt 22440 tcaaaaaaaa gaaaagaaga agaggtagat gaaaccctca attttaaaat tcaatggggt 22500 gattaggtta gaagtaaaat aaaaaaaaat tgtgtagaat ttagtttgta tgattttttt 22560 atttaactgt aaggaaagta ttttaaaatt ttattgctgt agcattattt tttctacagc 22620 taaaaattgt tgttttagaa aatatagttt ttttacatct atttttaatc ttcctgttgt 22680 agttttcaga actattctaa agcataattg ataattttaa aggttataga taaaaattaa 22740 aactaaaaac agctactata acacaatcca ccaccccaag tctccaccac tagccacatt 22800 aaatgaattg attttagttc attcaccatt tataatctta ttatatattc ttaataaaat 22860 acaaaatata tatattagaa atgatgctat tttttttttg taactggaga aatgatgcta 22920 tttttaatca accatttaac ccacttgacc cacacaatga atttgttctg tttttgtgtt 22980 gttatttccg gataaagtga attagttcca tccaactgat tcttctacgt atgataggtt 23040 tctaagcatc taactagtat gcagtattat attacgtgat gaatgaaaaa caaaaaacca 23100 ccaactacgt tatgccaaaa atagaacttt tttttccgcg gggggggggg gagaggggta 23160 acaaatacaa aaaaaaaaag ttattcttgg gttcaccccc tagagtgaac ttctaggttc 23220 accaaccaat atgattttat tatttcaaat tcgatatttg ttaaaaaagg aaataaaata 23280 ttgtcaagtt atattatgct tttaaaataa aaaggtaaaa aaaaatagtt acaaaaaaaa 23340 gaagttttta aaaaaaatac tgttaacgtc gccagcaaaa cactaaactc taaatcctaa 23400 tccctaaacc ctaaatctga aaccctaaac ctttgggtaa accctaaacc cttgggtaaa 23460 ccctaaatcc ttggataaat cataaattct aaatcaaaaa cactaaacac taaaatccta 23520 aacccttgag tgttttagtg tttagtgttt ttgatttaga gtttatgatt tatccaaggg 23580 tttagggttt cagatttagg gtttaggaat taggatttag ggtttacttt tttcctgacg 23640 acgttaaaaa tatttttttg taattactac tatttttatt ttttattttt tatcttttta 23700 ttttaaaaac ataatataac ttgacaatat tttgtttctt tttttaaaag atattgaatc 23760 tgaaataatg aaattctatt ggttggtgaa cctagaaatt caccctaggg agtgaaccca 23820 agaataagtc aaaataaaat cgctattaaa gcaagacatc ttccaaaaat ataaaaaaaa 23880 taaaaaaaac caaagtcatc tcaaataaat aaaaccgctg gatacatgtt tagtaagtca 23940 aacaaatcat agtgatgtgg caactgtttt ttcctcaact ttcctcaatt taatttgcta 24000 gcaatttcta ctcaattcaa ttctaagcta ctacccatta actacttcat ttttttttta 24060 gattttctta tttattggga agttttatta atcactttta tgatgaacta attccttata 24120 tattatttga gaaaattaca atatttaaaa cgtgtagtgt atggttctca gattacctaa 24180 agaaataaat tggtcaatct aaatatacac ggtagttctc attaaattaa ctaaaaaact 24240 aattactaat gtaccaaaag aaattattat ttagtttctt aaataaaagc tacaaaatta 24300 ttaaatgtga tcaatatata tacatgacaa ctagtgattt tgaataataa aaaattgata 24360 acaatttgtg tttcttctat attttgtttt atatttttaa aataaattaa ataatcatat 24420 taatcataga ataaaatttt aaattttttc ttatatgcga tactttgatt ttttttaaac 24480 aactataaat tattaaaact gtaaaaaata ttacattaaa aattttgtga gtaatggctt 24540 aaattttttg ttatacaata tataaatata caaatgatca taaaatcata tgaataaaat 24600 atcttattta atagattttc atattaaaaa tatgttttta ctatcgttta aattaaacta 24660 tataccatat aagaacataa tagtttaatt tgaaatttgc attgaagaaa tattgagaac 24720 ttaatattct aattttatat tttgtattaa atttttaaaa acaattataa attactaaaa 24780 ctattaaaag tatcccattg agaattttat tttcaatatt ttaaaaaata cgaattgtca 24840 taaaactata taactataaa gcattattta acagatattt taaaatatac ttctatatat 24900 taatattatt taaatttaat tatataccat agatataatt gaatttttag attttttata 24960 tcaaaattat tttaagtaaa aagagtgttt gttttgattt atgtgttcgc gtcaacttaa 25020 ttatatacat aatagttata gacttttcag tttattattt tattatttca tgtaaaaacg 25080 taaaataaat aataatttat atacacaatg tccatcccgc acatataaaa ataattcatg 25140 ttgatcttag cctagtcaat aaataatcga caaaatttta gggaacaaaa tatatatgct 25200 agaggatcgt tatgtttgtc ttccattcca ctgcatctac atatggcatt tgattctaga 25260 gtaagaaaca caaataaatt tatttggtac aatccttccg tccaaggaaa atctaaaaat 25320 ataaaagaca tcttagtgaa gttatagatt atggtagcat tctatttata cccaagttta 25380 aatatgattg tcgtataacg tattgaatag caaatatctt cgaatctcat atatatgaaa 25440 ttagtgtaaa ttttaaacgt aaacaattta tacgaccaca gttcgaaaat aaaaacaatt 25500 tatacgacca gaaatggcaa aatgttgttc ttagcatttt tttttttaac tttacttttg 25560 cgtaaaacac atttctccaa tttggtttca ttgcgttgaa cgacgtaaca aagtaataca 25620 cctaaccctt ttttttggaa cattatacac ccaacccatt gtacaaaagt tacagctaaa 25680 ttaccctttt tattcttttg ataaataaaa aataaattat taatcattaa aaaataattt 25740 ggagtatttt ctcaatgtcc atatatacat cttctccctt tatataagcc aacctcacac 25800 acccaaaaaa tccatcaaac ctttcttcac cacatttcac tgaaaggcca cacatctaga 25860 gagagaaact tcgtccaaat ctctctctcc agcaatggtt gttgctatgg accagcgcag 25920 caatgttaac ggagattccg gtgcccggaa ggaagaaggg tttgatccaa gcgaacaacc 25980 accgtttaag atcggagata tcagggcggc gattcctaag cattgttggg tgaagagtcc 26040 tttgagatct atgagctacg tcgccagaga cattttcgcc gtcgcggctc tggccatggc 26100 cgccgtgtat tttgatagct ggttcctctg gccactctac tgggttgccc aaggaaccct 26160 tttctgggcc atcttcgttc ttggccacga ctggtaaatt aaattttctg ttttaattat 26220 tttgactctt tttgttcaat ttattaattt cttgaatgca cgttcgatga gtatcgtcgt 26280 cactgacttc aagatttaat tcttttgagg ttaccttttc atgttcaatt attaaaaaat 26340 aaaataaaat ataggatcta agattttttt cttcatcagt tcaagcatca tcactcatca 26400 gtcgtaagac tcgtaacaaa atatcttctt ttctataatt aatattattt ccgcatttaa 26460 tggatctacg ttttgatgtt ctcaaatttt gtttctcttt ctctagatcc ccggaacttt 26520 taattataat tatagtatag tataatatca agaaaatata ctgtttattt tttttggcaa 26580 caaatatatt actcttgttt ctttgacaag aaaaaaatat attgtttttt tcttcttttt 26640 gtgttccaat ctattttcga gatttagaca agtgacacgt catataccgg atttgttacc 26700 ttgttaaaga gtttgggtta aaacaaatgt agaaaagtta aaataaattg tgcaataaat 26760 gataaatacg tttttatgtt aaacaatgat gtgaaaataa aattgaataa tggcagtgga 26820 catgggagtt tttcagacat tcctctgctg aacagtgtgg ttggtcacat tcttcattca 26880 ttcatcctcg ttccttacca tggttggtaa gtcatttatt aactatttcc atgtaaacta 26940 ttagtacttg ttttcgtatt tcttacattt tcgtttgtca ttcttcttgg gtgcatgcta 27000 gcaaactgta atcagtatta actgggaact accaactgtt ttttttttgc tagagtagca 27060 attttataat taaataagaa tcctattaaa caatgcatgt gacaatatga ggttgctttt 27120 ctgttcaaaa caaatcttta gaagccaatg aaaaagaatc caaaactttt ttttaaatga 27180 tatgcgccta tctattggtc ctgactcctg agttttctta ctttcttaag tataattaga 27240 ttttgatttt tttttatagg ttttcactat tgttatttgt ttacatcagc ttcagatatc 27300 ttcgaaaaag atttacatgc atcaatttca tgaggattta tagtttttct tttacttatt 27360 tccgacacaa tgtttagtag taaaaagcat taaatgtttt tttgctcaaa aaaaaaagaa 27420 tgggattgtt agagcactct attgttagtt gttcaataaa tataccaact aaaaaaacaa 27480 aataaatata aaatgagtga gattgttaaa tcattataga gacaatttca ttttcacaaa 27540 aataaataaa tacataactt tttataattg gggtttgcag gagaataagc catcggacac 27600 accaccagaa ccatggccat gttgaaaacg acgagtcttg ggttccggta atctttccta 27660 ctctcgtagt ttctcttgtc ttttatttat ttgtttgttt ttcggaattt attcttatgt 27720 ctatgttctt aggattctat atgtttattt tattagttta tgttttcagt ctgaggtcag 27780 accgaccact tgtcagatct gttttctagc tgtagtaaaa aacaatttgc aagtgtaata 27840 gttcagcata attgatcttg ttagagcatt tccaaaacaa actttataat tttaaatata 27900 cagttttttg ttctctaaaa aagaatttaa aaattttaaa gtttgaggga cgaaacttca 27960 aatttgaact ttcactactc aacttcaaat ttgaaatttc atctttttta tttacatttt 28020 gatcattata attaattata cattacattt atgattctta agtattttct catttattgt 28080 tttaattctt aaatttttta tacatcataa atatttccaa tttgttttta taaattcaaa 28140 ttttacacaa aaaagtaata aaaattttaa ataagattta taatatttta aaactataat 28200 taggcaaaaa aaatattaca aaaaaatgta ataaaaactt taaaataaga tatatcaaga 28260 cataattatt agaaatttta aatattataa caatattaat aatctggtaa atttgctcca 28320 aaacctcaaa aatttctaaa ttattgtcca aacaaatttg tttaaccgaa tatggagcat 28380 tacaaaaata attttatgga atagtgtggt attttgcttg tagttaatat ttaattatgt 28440 atttctattt ataattttat atatttaatg taagattttt ttaattaata ttactgtaat 28500 atttttatat atgtactagt tatttataaa agttttatag atttgtatta gttataacaa 28560 aaataaggat cattgtgtaa aatacaaata attttgaaat tacgtttaaa gttttggtta 28620 tgaaaaaaat actttgaaac tttaaattta gagttttgca aactttaaaa tgttagatag 28680 atagtttttt tggagatgca tttagtggtt atggtagtaa ctcagaaaat gaaaaatcta 28740 tacttttata ctccctccgt tttttaatat aagtcgtttt acagttatac acgtagatta 28800 agaaaaccat taatttctta tattttctag acaaaaacat cattaattat ttacctaacc 28860 acaattcaac caatataaaa atagaagata tattaccatt ggtcatacaa cattaattat 28920 taataaattt tacatagaaa accgaaaacg acatataatt tggaacaaaa aaatttctct 28980 aaaacgactt atattaaaaa acggagggag tagtacctaa ctttaacgat ggaccactta 29040 tattcgagtc cttagcataa aatgattctc ctcgaaatcc gtttactttc ttcattattt 29100 tttccttttc agttttggcg ttttcgtaat acttttgtct tcaatcttga aagctattag 29160 tataaaaact tataaacaca tcacatgcaa tgaattaata cgaatacata accagaatga 29220 caaattttca atgaatattt aataccagta agtactactc cgtaatagta atagtaatag 29280 tcatattaat ttttttttgt catcaaacaa acagtaatag taatattaat tataattatg 29340 tatttcagtt gccagaaaag ttgtacaaga acttgcccca tagtactcgg atgctcagat 29400 acactgttcc tctgcccatg ctcgcttacc cgatctatct ggtaaaaaaa aatacaattt 29460 caattttttt cttaaaatta caaatggttt tatattttga gttttaagcc aatatataaa 29520 ttaattttga ttggatttta actacagtgg tacagaagtc ctggaaaaga agggtcacat 29580 tttaacccat acagtagttt atttgctcca agcgagagga agcttattgc aacttcaaca 29640 acttgctggt ccataatgtt ggccactctt gtttatctat cgttcctcgt tggtccagtc 29700 acagttctca aagtctatgg tgttccttac attgtaagtt tcacatatta ttacaagaga 29760 tttatatatt attaataata aatttgtttt ttgacataaa gttttggaaa attttcagat 29820 ctttgtaatg tggttggacg ctgtcacgta cttgcatcat catggtcacg atgagaagtt 29880 gccttggtac agaggcaagg taaataaatc aatttttaaa aagaaatgta cagaaagcaa 29940 taatggttag tattgattaa tcttaatttt tgatgttttg catacaataa taggaatgga 30000 gttatttacg tggaggatta acaactattg atagagatta cggaatcttc aacaacatcc 30060 atcacgacat tggaactcac gtgatccatc atcttttccc acaaatccct cactatcact 30120 tggtcgatgc ggtgagtgat ctagctttct ctctctctag tttcatttga ttaaatggtg 30180 attaattact aatttaatta atgaattgtg gacagacgag agcagctaaa catgtgttag 30240 gaagatacta cagagagccg aagacgtcag gagcaatacc gattcacttg gtggagagtt 30300 tggtcgcaag tattaaaaaa gatcattacg tcagtgacac tggtgatatt gtcttctacg 30360 agacagatcc agatctctac gtttatgctt cggacaaatc taaaatcaat taacttttct 30420 tcctagctct attaggaata aacactcctt ctcttttact tatttgtttc tgctttaagt 30480 ttaaaatgta ctcgtgaaac cttttttatt aatgtattta cgttacaaaa agtggaagtt 30540 ttgttatctt tttctctagt tgcaatcaaa aggatcttta aaactttttt gatttggaca 30600 gaaagaaaaa gacagttcca ctgaaagtcg acaaaatgca cgccgttttt gggtcccagc 30660 acaacaacaa tatgtcacgg agttgtcgct tttttaagta atgggcaata cttttcggcc 30720 caaatatata aaagccttct taaattgcgt caggtatctc acgcaggacc taaataatta 30780 tacaaacatc tcattcgtcc ccatatatta aagagttgat tacctagtag gccacttttt 30840 gagttttctt tgcacccaaa gctactttcc gcttgtagca taaacattca cggaaactga 30900 aagagttttt ggattatttt gcccttactg aaacgaaacg gaaaattgga atattgtttg 30960 tgttgttttt gttcggttag cttttagaca tttattagat taggtttctc gatagttaga 31020 tttttataag gaccacaaga tcgtaaaaaa aatgttaatc caacaatcac gttaaaatga 31080 ccagtttagc aagttacagt catccatatt tcatggatgt ggatgctatc atgtccacaa 31140 atacatgttc ggtggttatg gatgctttcg tgtccatgta aggatgttat ggttactcag 31200 atttgtggat ggagaaagtt ggataaacat tacttggata gataaacatt atgtggacgg 31260 acgaacatta tggatacaaa aatagtggac atgtaagttg tgggcagaca aatgttacaa 31320 gaatgagtta tagacgagaa cacaacatgt aagggaacaa aagttattta acttaacttt 31380 gtggacaaga ttttatattc tacaattagg cggtaaatta acaaattttg tcggaactgt 31440 ttatcggaaa gtgatctgat gattccgaag cacttctgag aaatattggc gatgatcata 31500 taaaaatcaa tattttaaaa taaaaaataa attttggata agaagtataa aacatattgt 31560 agacaagttt ctgcaagaaa atgtgtgaaa atggcctgcg aaaactaaaa tcaatataaa 31620 aaaaagactt attcttaggt ccactcccta gggtgaacct ctaccaatag gattgtttta 31680 ttttatattc aatatctttt aaaaaaagaa acaaaatatt atcaaattat attatgtttt 31740 taaaattaaa aggtaaaaaa atagtaataa ttacaaaaaa aatattttac gtcgtgagca 31800 taacattaaa ccctaaaacc taaattctaa tccctaaacc cttaatccta aaccctaaac 31860 cattggataa accctaaact ctaggataaa tcctaaactc taaatcaaaa tcactataca 31920 ctaaaacatt caagcgttta ggatttaggg ttttagtatt tttttattta gagtttagga 31980 tttatccaag ggtttagagt ttacccaagg gtttagggtt tacccaaggg tttagggttt 32040 acccaaaggt ttagggttta tccaagggtt tagggtttag ggattaggat ttaggattta 32100 gagttttgtt gagaacatta aaaatatatt atttttttta attctttttt ctgtaactat 32160 tatctttttt tactttttta ttttaaaaac ataatataat ttgagaatat tttgtttcta 32220 tttttaaaag atatcaaatt tgaaataata aaatcctatt ggttggtgaa tcaccctagg 32280 ggtgaaccca agaatgactc aaaaaaaaac tataaagttt cttctgaatg agcttgcatg 32340 tttttttctc tacgatcagt gatgttaaag ttcttccttg taaagagata atctctccag 32400 caatttgctt tggctccttc ttgacgcctt atccttcgct gacaacaaag gtcttcctca 32460 ctatctgaaa aaaaaatcta aacattggtt gagagagttt gatggtgaag ttagagaaag 32520 aggccaaagt taaaaccttt gatttaatgg ggcgttggat aagagaccac agatctggaa 32580 ctgaaaaatg aacaaaaccc aatgatgtta gtagctagcc aacgagtaac caccacaagt 32640 tgctggctct tcaccattat cagcaatgaa ctagggtttt gttcccacca ttggtgaatc 32700 tgaatcgcag cattgagggg ctccacaacc atggcggtga catggaagaa tttgttacgt 32760 ttcgtcacac agtctcgtct ccaccctttg attactacat ctcttgaaat catccattgg 32820 acaagacaac gacagagaaa acagcttcgt tgccacaact gtcatcaagg ttgtgtggac 32880 aaataaaaat ggagataaca acctttgagc tcatctactc tctgaaactc cagccaacaa 32940 atcccgaact caaccacatc cgatctcgag ctcacccacg gcgagttcca agctcatcca 33000 ttctctgaag taaagcgaat ttgggattaa gagagaagaa gagaataaaa gaagcgttga 33060 ttaggtttta tcaatttggg aatttggtaa ttagagttcc aaaagagatt gtcggtatct 33120 tccactcctc taaggcaggc cgcaaacgag aaattaggag acttttcgag agagatgggt 33180 ttcgtggctg agagaaaaga tgaaataagg gattagggtt tgaaagttga ttttgaaaaa 33240 gtgaagtgaa cagatagaaa aaagatgggc tccattaatt ttgaaaacct aaagtgaaaa 33300 tagagaagaa agacaggccc cgtgtaactc tagtttggtt gctggaagtt ggttctttct 33360 ttagttagag ggcactaaga ccatgtttat ccctaaaaca cttagtgggt tttctaattt 33420 ttattttatt ttattttgtc tgatttaaaa aaaaaaatta aaaagtatac taatcgcggg 33480 ccgtcacgtg ttggtggggt ccgcgcacag tgctaaaaac ccacaacaat ctctattatt 33540 aaaagagaag tacccataaa aaataaccct aaaagttaca caatatttac agtcaaatgc 33600 cattgagaat taaattaatc ttacactaaa aatgattgtc ttttccacat attaattgtt 33660 tttctaaaat aactcaaaca aactacaaaa gaaagaaaca tattattaat aactcaaaca 33720 attacatatt attaaataaa ggaataagca taaataattc tcctgcaata tcaacactgt 33780 aacattcctt attatatgag tcccatcctt tttttttgtc atcatatgag tcccatcctt 33840 agcttacgta acctgtacga acatcaaatt atataagctt tataagaaat taaactaaga 33900 aaaactaaca atgattttca tatgagtttg aacaatttca attcacttta tttcacggtg 33960 gtgtatgtag cttattttta accaccttat tatattgaaa tattccactg acttctatat 34020 gtccaaataa ttaataatca ttattattaa ttaaaatcta ataattagga aaataactgt 34080 agttttgaga acactggcga cggcgaatgc gaatttttag ggttttgaga tgtttcatgg 34140 atgggatccg gggtctagtg gatttttctg gaattgcaag gagctctatc ttaatgagca 34200 aatcgggaga ttatggaagc aaaatggtct tcttgtcata aggagaaagg gagatctggg 34260 aattttattt ggctttgatc ttgtactgtc aaagatcgga atcgcggaga ttcgattgag 34320 aagggagaaa agtaaggcat tcgttaacat caaagcgaga tcttttctac taatattggg 34380 gatttctttt tgctttttgg tgcttagata tctggtaact ggttatagga aattcgggat 34440 ttggggtttg atgcgatttg atattcagga aagtcggaat ctaaggatta atggggttag 34500 agggagtatc aatagagagg atctcctgat tgattttctt tacgatttgt gttattatat 34560 aaaggagggt gttcagagct tcagtagcac aaacttacaa atctccttct ttctcttacg 34620 gatttcgttt ctggttgttt tttctttggt atctatgagt cagggacaat tggtgggaaa 34680 ggggggagcc tcgaaggagg gagaaggagt tcgcaaaaga ttgaagatct ccgttcctca 34740 tttcgataac tcggacctta tcaagagcta tgcaatgact ctgattggga ggtgtatgaa 34800 cccggttgcg caaaaagtca actcgttgct ggtgatgttg ccgaagatat ggaaggtgga 34860 agagagggtg actggtgcag atttgggaaa ggggatgttc cagtttcatt ttgagaagga 34920 agaagacatt gaagcggttt tggagtcaca gccgtaccat tttgattatt ggatgatctc 34980 gatagctcgg tggcaaccaa ggatgacaag gagctttcct tcggagatcc ctttttggat 35040 caaagtggaa ggtcttccaa cagagttttg gtcaactcca gcgcttcaaa gcataggcga 35100 tgccattgga gagactacgg atgtggatct ggactatgga aagatgcgag tggtgcttga 35160 tggcttcaaa gagttaacac tggaaacatc cgtggagttc aaaggaggtg aattctatga 35220 tgaggaagag gtcccggtat ctcttaaata cgataaattg tttggcattt gcaagctctg 35280 ttctagtcta tgccatgacg aggatcattg tcctcttaat cctaaaagtg tggacaagaa 35340 aacagatagc agagaggagc tggctaataa gaaagaggac agggcaagga gctacaaagg 35400 agtggtgatt catggagagg agagtcaaca ggagaggggc acagatcaac ggaattatta 35460 tggtaagggg aaagggaaaa tgcatgagga ccaggactca aagtgggtac gagttcctga 35520 aagaggaaac aagaggtact cgtcttacca cgataacaac agaaacgatg agggaaataa 35580 cagacacaag aacactcgtt gggaacagcc taggagttac gtgcaggaat cgcgggagaa 35640 ggggcatcgt ggcacaagac gggagaggag tcctccgcat tatgcacgag aggagccaaa 35700 ggaggaaggg gagctgcaag acacaggcag tgctaacaaa ggatctcaaa tggaaggaaa 35760 gacttctgca tctaacaacc tgcagattga atcgaatggg gccagggcaa atttgattaa 35820 gcttcctcct aaatccgtgg aaatggagaa tggtgcaata gctgcgatag tttcaggaac 35880 ggttggggcg gggaaaggaa cggagccacc attgggtgac aatggaaagg atatggaaga 35940 gaatgaagta atggacctag ctgagaatgt gattccatct gcaggggaca aaggttgcat 36000 gggtgaggat gaagctttcg aaaatcttac tgatggagag atggaggaac tgaatggatc 36060 acaagaagtg gtgctggaga ccgttgagga agaatcacga ccaacggatg tcgaggagaa 36120 ggaactacaa gttggagagg aggaaaaaaa gaagggcgct cgcaagatac taaagcacac 36180 aatggcggca ggagcttcaa agaagaagtt cgttcaggca ctcctttcac agaacaaaaa 36240 tactcaagct agacagggaa agcgtcaggg agacggaagc aaattgcagg aggataaggg 36300 ttcttcatac cccaaacaaa cttcctcaaa gaactcaact gcatcccatg gttaatacaa 36360 ttcatataga attgaggagt ggacttctgg ttgcgtcggt ttctgcttac tgttggttta 36420 tttcaataag ctctaggagc tttcttctac ggttcaattt gatttttgca ttgctggttt 36480 tatgtttcag tggcaattgc ctatctttta ttgtatttgg ttatggtttt ggtattaaga 36540 ataataattg tctttctggt ttctatgatc ttgatatggt taaatattgg tatggtgtta 36600 agacccttta ttcaggtcag atggcgttag tggcttggct gtgtgtaggg atgcatttgg 36660 ctcacttcat acaatggatg ttggacctga tctctgtaaa acaagttcag tggaagaatg 36720 atacaaggag ggttttggac aaggtacttg ggtctggttt cattatttgg tataaggtgg 36780 cacttaatta ctcatttctg gatagtacta agtgcacggt agtttggaga tgtttgttgc 36840 ttggtctttc taaggaacct agatgctctc gagtggctat gtatttgaac acattatatt 36900 gttatggtta tgggtttaat ttcagggata gagatctgag atggtcctta attatgggtg 36960 gagggggaag aggtagagtc atggacacgt cttggatcat tgcaggggag cacactcttg 37020 gcttggtctc attaaaccaa gtgcagagaa cctttggatc catgatcggt atcaagctgg 37080 ctttctcagt gccgctgcaa gatggaagtg gatacgacaa atatacggtg tctaactctt 37140 ggcgtttatt taggacatgt tcaaaatatg caaggttatt gtcctttgga gtcataatat 37200 gggatataat atggtgggtg aagttttggt ttcctttggt tactggttta tatgtacagg 37260 tcgaaatgat aatgtgtttt ggtatcctga gtgtacaata tggaactgat gagtattgga 37320 taattgatct agttcgtaaa aaaattatat cttctcctac aatcttatat atcgttacat 37380 acattgttaa ttgggcctta tggtttatta ttagaagtgg tgaatgtgat cgtatagtta 37440 ctggtgggct ggagagttgg ataaattata agatcacatg gccttttttg gtctttcgtt 37500 tttgtcacca aaatttgagt ttcttaatca agtggataat tttatgggtc ttgggatgcg 37560 aattgtgttt attggttaca gttggtatgg gaatggttat aggatcatgg gtatgtgatg 37620 gtgatcaaga gtctttatat ataattgtcc ttacaagcga ttgtgaagta tctgaagttt 37680 tttcagatag gatgattagg cttattgagg ttaaatcttt tgtcggtatc atcaaaccta 37740 tcttttctgg ttcgaacgat aaatatatat atatatatga agatattaag ctggaattgt 37800 agaggtcttg gaagtcactg gacaataagt tatcttcggg agatatggca ccaacacaaa 37860 ccggagtttt tatttttgtc tgaaacgaaa caggatttcg atttcgtaca aagatttcag 37920 tctcattttg gctatgatag cctggttact gtggatccaa atgggcggag tggtggttta 37980 gctctttttt ataataatga gtatcaagtt agagtcatat attctagcaa tagaatgata 38040 gacgtggagg cggtggttaa aggaaaacaa gtttttctta cttttgtata cggggatccg 38100 gtaccaaagc taagagaaca ggtatgggag agattaactc gatatggatt agcaagatcc 38160 gaaccttggt ttattattgg tgatttaaac gagattactg ggaatcatga aaaggatggg 38220 ggatccctaa gatgtgcaac atcttttatt ccgtttaaca atatgatacg gaacagtggg 38280 ttactggaat tcccggctcg tggaaataaa ttttcatggc aaggaaggcg tggcaaagga 38340 aaggatgctg tgacggtcag atgtcgattg gatcgagcct tggcaaatga agaatggcat 38400 acgttgttcc cgtgctccta cacagaatat ttgaggttag tgggatctga ccaccgtcct 38460 gtaatcgctt ttttggagga caagttattg aggaaaagga gaggacaatt cagatttgat 38520 aagagatgga taggtcagga ggggcttatg gaatcaatag tgacaggatg gacggagaat 38580 cagggtgggc aaattgagga ttttgttaca aaaattagta attgtcggca tgagatttct 38640 tcatggcgaa aggataatca gccatatggg aaggataaaa ttagggagct tcaacatgca 38700 ctcgaggaag ttcagacaga taatagcaga tcccaggaag agattctgga agtttccagg 38760 aagctacaag aggcttataa ggatgaagag gaatattggc atcagaaaag ccggaatatg 38820 tggtattcat ctggagatct taataccaag ttttaccatg ctctaacaaa gcagcgaagg 38880 gtccgcaata aaatagtggg tctccacgat gaaaggggta attggattac tgaggacaat 38940 ggaatcgaga aggtggccgt tgattatttt gaagacctgt ttagtacgac cactccaaca 39000 gaatttgatg gttttttgga tgagatcgtt ccgtctattt ctccccaaat gaatcaagtt 39060 ttgttgagaa tagcaacaga ggaagaggtc cgacaagctt tatttatgat gcatccggag 39120 aaagcgccag gtccggatgg aatgacagcc ctctttttcc agcattcctg gcatgttatt 39180 aagaaggatg tggtagaaat ggtgaacaat tttttggtta caggtgctat ggattcaagg 39240 ctaaatacta ctaatatttg tatgattcct aagacagaga gacctacaag aatgacggaa 39300 ctgaggccga taagtctttg taatgtgggt tacaagatta tctcgaaagt tttgtgtcaa 39360 cgcctgaaaa tttgtctccc tctcttaata tcagagacac agtcagcttt tgtggaaggc 39420 aggttaatat cggataatat tctcatagcg caggaaatgt ttcatggatt gagaaccaat 39480 aagtcatgtc aaaataagtt tatggcgatt aaaacggaca tgagcaaggc ttatgatagg 39540 atagaatgga gttttattga ggctcttcta tataaaatgg ggtttgatgc acattggatt 39600 aagctaatgg tggaatgtat atcctcggtt caatatagag tacttcttaa tggtcagccg 39660 cgaggcctta taattcccca gcgagggtta cgtcaggggg atcctttgtc tccttatcta 39720 tttattatgt gtactgaggc tttaattagg aacatcaaga aggcggagag agacaaacgg 39780 ttaaccggta tgaaggtagc aagagcttgt ccagcagtct ctcacttact attcgctgat 39840 gatagccttt tcttttgtaa ggcaaataag gaagagtgtc aaactattct caggatttta 39900 aaggaatacg aagcggtttc agggcaacaa attaattttc agaaatcctc aattcaattt 39960 ggccacaaga ttatagaatc cagtcggcaa gaaatgagag atattttggg tattcaaaac 40020 ttaggaggaa tgggatctta tttagggttg cccgaaagtt tgggaggatc taaggtacaa 40080 gtgtttggtt ttgttcaaga acgcttgaat aatagggtta atggatggac ttttcgattt 40140 tttactaaag gaggaaaaga ggtgattatt aaatcagtgg tcacggcttt accaaatcat 40200 gtgatgtctg tttatcggct accaaaagca acagtaaaga agttaacaag tgcagtagct 40260 cagttttggt ggagcccagg aggaagcaca aaaggcatgc attggaaatc atgggataaa 40320 gtgtgtgtcc ctaaagacaa tggtggccta ggattcaagg atctcatgga ttttaacaca 40380 gcgatgcttg gtaagcaaat gtggaggcta atagacaagc cacattctct cttctctaga 40440 gtttttaaag gacggtatta caggaatgct tcacctcttg aaccgatccg ttcttactca 40500 ccgtcatatg gctggcggag tatcatatct gctagatctc tggtttgtaa aggactaatt 40560 aaaagggtgg gaacaggttc atctatttcg gtatggaatg atccttggat cccagccact 40620 cgcccgagac cagcaaacaa aaaccttcaa aatagttacc cggaccttac agtggattct 40680 ctcattaata tggaatttcg aacttggaac cttcaggcaa ttagggctgt ggtggatcct 40740 catgatgtaa aaatcattga gagtatgcca ttaagcagaa atctgatgga agatagaaat 40800 ggatggcatt ttactaacaa tggaaaatat tcggtaaaat caggatatca ggtggaacgg 40860 gtttatcctg atagagaaaa accaccagag gtttatgggc ctacagtgga tgtccttaaa 40920 gccttctgtt ggaaaatacg gtgtccgccc aagatacaac attttctatg gcaacttctt 40980 tcaggttgta tagcggtgtt gaaaaatcta aaggcgagag gaatccatgg ggatatatgt 41040 tgtgctcgat gtggggatcc ggaagaatca ataaaccatg tatttttcga atgtccccca 41100 gtacgtcaag tatgggcttt atctaaaatc ccttcgagcc tcagtttatt ccctacagga 41160 tctttttttg gtaatatgga tcatcttttt tggcgagtta atccaaaaat ggatgatcat 41220 caatttgctt ggattttatg gtatatatgg aaaggtagga ataataaagt tttcagtaac 41280 ctggatgtcg atccaaggga aacccttaga ctagcagaat tggaatctac actttgggct 41340 gcggcacagg tgaacaacga ccaaaaacgg gaattacagg tacataccag acccatattg 41400 gtaacttcag gacgctggtg ttttatagat ggatcatgga aagataagga tctattttca 41460 ggacagggct ggtatagtat cctaccgggt ttcgatggct tattaggggc acggaatgta 41520 agggcatgtc tttcaccact acattcagag gtggaggcgc tgatctgggc aatggaatgt 41580 atgaggaatt taagacagct tcatgttacg tttgcaacgg attgttctca actggtgaag 41640 atggtttcgg aaccagaaga atggccagca tttgaaagtt acctgaaaga tatcaaagtc 41700 ctacaaggaa gcttcaacaa ctcagagatt gttcatgtac ctcggacgga gaataaaagg 41760 gcggatagct tagcacgtag tgttaggaaa caatcgtctt tcgtcgttca catggatgca 41820 gagttaccga tttggtttac agagtcaagt tgagtctgtg aatgtcttgt tgtcaaaaaa 41880 aaaaataatt aaaatctaat atttttgaat tgaaaatctt ttccctcccc caacaatctt 41940 ctacttagat ttcggaaaaa aaaatagaaa catttgcgga atctactaat ttgtttctaa 42000 acaagatttc cccttcaatt tcggaacaaa gaagatatat ataaaatttg atccataact 42060 actaaacaat aaacacaata ttcgaatttc accaatataa tcttactctc tcctattttg 42120 ttagtttcac aataacacac aataaacaaa gtattctaaa tattaatgca aacaagagat 42180 gccttgcgag ggtggttaag atatttcctc aactttaggg ttttgtattg cgttaaaaaa 42240 attgacccac acacttgcgg aacaagcaca agatcttatc atttcctatt tcaaatcata 42300 accattaaga ttttaccata atttcaaaaa caataaacag aatcaacaaa atattctttt 42360 catttatttc gcctaatatg tcttgcaaaa taagcaaaga tatttattct caactagggt 42420 attgtccctc tactatatat tctacccgag tacaaaccca ttctacacat tcttttacca 42480 cttacgctga tgaaacatta caaatggttt tagctgatga aactgttagt tctataatat 42540 ttgtattttt tttttgaatt ttataaagta gactttgaac aaaatcatct cttcctattt 42600 ttgaatgttt ttttgtaact tagtttcatt attatttttg gtttgtctaa ataatgtatt 42660 tgttttcaaa aatttcaata aaatatttga actttatatt caactttaaa ataaaatatt 42720 tataatttaa tttaataaaa ccccaaatat acttaaacct ccgatacttt actatttaat 42780 ttaccaaata aactaaataa aaatacaata aaagaaaaac acaatctcat agtttaaaaa 42840 tgatggctaa tcatattgaa caagacacac cgaaatcaaa cctgaaaaac atatgaatct 42900 ataacataat aagtacaaac aattaaattt atcaaatttt caaaagttaa aaatatatga 42960 ttatgaaaaa caaaatcatc cttttttgaa caagaagaaa gcccccacgt tctgtcttgg 43020 atggtattac caatatttca cattctttat ctaatggaaa cgaagaaaca acaacaaaca 43080 tacatcgtga tatcaatcaa gaggataatg attttgttag aggatgatga ttttattcat 43140 agcctttgaa aaaattaatt tccgtaaaag ttatacctta tttatctatt tcatatatca 43200 tactaactca taatttttta tttcatcata ttttaatggt tttcaataga aatgtggtcc 43260 aaattatatt accttatcac agtatgatca attttgttgc caccgtgtga tcaaattatg 43320 ttacagcaat atttgtatta tgtgatgtat ttttgtcatt atttgtatta aaattttgat 43380 atattatata atggtgtaaa aaaatttaat tacattaagt aaacagaaaa aaaacacccg 43440 cccggtcggg cgggaccaga tctagttggt tattatttca tcaactttgt taccggtttt 43500 tgcataaaac atgggaccca acactgtaag aaaccctata attacctccg ataaacatgc 43560 cctaagagca tctgcaatag tgagtctcac catgaaattc ttagcattat tataatatac 43620 tagagatttt ttccgcgctt cgcgcggatt gtatcttata aatttatttt atttataata 43680 ttatttgttg gtttttttat attaactttt tgtttttccg atgttagttt tttttaattt 43740 aaatttatat gtttatattt ttatattttt cttgttgtag atggagaatt atatttttta 43800 ttgatggttt tttgtatgtg acataaactt tttgaaattt taaaataatg ttatatatag 43860 tacgattaac acattaaaga agagaaacat attcagacac attttacaca ggttttatat 43920 gcataatttt aaacattata tatgtatata ttataagttt gaaacatgta aatgctttct 43980 aaagctaaat acttgttctg agtttacata acttatcgag agttttatct ctttttaaat 44040 ttaaatcaca gaaaaaaaaa tatcaaaaag tcagtataaa tggatttttt gggcttttaa 44100 atcaacactg aaaaattaca tgaattagat aacaacactt ttataaacaa ctcgataaaa 44160 tttgaccgag ctaaagattt tcacacaata tgttctttct tcttcaaatt gcgaagagcc 44220 tataggcaca aggaaaaaaa ttataatttt tgctttcact tatataacat tttttctcct 44280 ttacacacga agtttattac actgctataa gcaatggaaa actctattca tataagattc 44340 acatctatgc attttgacaa agaagaattt aagccatctt tagtttcgga atggacaaac 44400 ttcagtcata tacactatat tttctctatg attcaaatct tacaatttta atatatgtgc 44460 agatttccat gtaaaaaagc acgcacgcca tctatcattc aacctattac tttttccaaa 44520 gtaaacacta taatcctcgt ttgattagct ccacaaacta atctctttgg atcagtttac 44580 taaaaaatat ggatactaat gttagaaaag aatataaaca ctatcaacaa taaatattgg 44640 cacaagacta tttggttcaa ggaacatatt caacgtaatg cgtttatatc atggctggtt 44700 ttgcggagaa gactgccaac caaggatcgc ttgaggcgtt gggggttaaa tgtctccgga 44760 acgtgcgtcc tttgtaatct ggaaatagag actcaccatc atctcttctt tgagtgctct 44820 ttctctcgct tgatatggga gccttttgct actgaaattt ggatttttcc tccggctgat 44880 ctacactctg ttgcagcctg gatcaatcaa cctcgcgtca acgcagatgc gcatgctact 44940 tcagtcatca atctctactt tcagtccgcc atctacctgc tgtggaaaga gcgtaatgct 45000 cgtatgttca cagctgtctc ctcaccttca tcagtcatcc ttgcctcttt cgaccgtatg 45060 atgcgtgacc gtctcttctc ttacccggca aattcttctt tctcctattc tctacttctt 45120 tttatctttc ttgtataaga cctccttaag gctttttcta ccttgagttg ttgttggttg 45180 tttttgtttc cttgctgtaa caagttgttt aaaaacaaca gtgtaacttt tcagaaaatg 45240 ataatcttaa catcttacca aaaacaacaa caaatattga cttatttatg tgaatatata 45300 ttttatttta aatcattata gtggacgaag aaaacaccat aatttgtaca acaaattttc 45360 ttagattcac ctcatcatac tcaccatttt actattttat ttacataatt ttacatgagc 45420 ttcttcaccc tccccggtta ttttatcttt atttataact acgatataaa gttataaact 45480 atattataga ttaataattt atttatcctt gaagtctaac gattaaaaat agaacataat 45540 ttaatataga tatatgattc tattaataaa ttagtagtta caaatttgaa atttctagaa 45600 atatcaaaag tcgtatgtta gttaattatc ttcttagtga catttatttt taattttttt 45660 tggatgaaaa tattttggct gaggtagata ctctcaaaaa ccttgaattt agtccctttt 45720 atatagtagg atatattttt ttaaatagtt aaagatccta atccaaaagg tacgtacaat 45780 ggtgttatct aatttagagt cttcaggtct gaagctataa aacatatttc agaaaatggt 45840 tttgttctaa agaacttggc gatctattaa atttttaatc agagtttgat ctaaaaaact 45900 tgtattatat tctatcttgt attatattct atcttcttct gtttccatat agtcttagag 45960 tcagaatagg atgtacaagt tacaaacata tatgcttatt aactaacaaa ttaattttat 46020 gtgttttggt agtaaccact catcttcttg aagaaccaat gaaggagaat gatagtaagc 46080 agaaaaacca tgaagatgca gcaagattgt ccacttccac gtcttcttcc ttcacccgtt 46140 gtagtgtcct ttatttcact acactcctcc tccgtcaacc ttactggaac attcagtgct 46200 gaagaaccgc agatttcaca tacactacaa aaaagagaaa cagaggtttt acacaatcca 46260 tatggttact aagctaatga actgaataga gtacctgttt cctcttagct taaaccaagc 46320 ttcagcgcaa tgaaaatgag caaggccaag ctcatttttg catttgcaac caatctaaat 46380 caagtctaca cttacaaact tgccagaaac tctatctggc gtttgatcag aaccaaaatg 46440 acaaatcctg cagattcttt gtccattatc actttcttct cctccaccac tcagatcaat 46500 catgtgaaac tccttctcct ttgctttttc tgaagcatca ctctcgtgac accatctttc 46560 cccattcttg aatcattctc tttttgatct tccatcaata catggtttga gagagagagt 46620 cactggtctc acccttgagg ccagagacta caatcacagc ctcagggaca gatccactcg 46680 aactttcaca aacagtgatc gaatttgaac aaggtatctg gtccatttca ttcatataca 46740 caccaaaaac aaaaccagga gtggttgtat caagatcaag aatgattgta tcagacaaag 46800 agttaaacat aaacccaaaa ctgaaaacct gtaacagcta gaacatactc aaattattgg 46860 tacgcagagt cctaaagtac aataaagatc gaaactttac cagaatcaag atctagtaga 46920 gtgacaaggt ttcgttttta tttcagaaga atgataaatc agacaattga atctaaaccc 46980 tttgccggaa acggatgcgc gccgctacaa gtgctctcta atctgttgct cttcggtttc 47040 agtttgtgtt ttttctttca taagatgcct cagctagatt ttaggccaga ctcgagaatc 47100 aatttttttc tctgcatcgg tcgagactcg agtatgacga cttttttttc cccactagga 47160 aacacaaaaa ccttcccatc cattcacaag tagccacgta ccataaggat caagtcctaa 47220 aattccttag ttatatatgt tccagtcctt agttttatta agcaaaatat tattattata 47280 tgtgtattta cctaagatta agccctaagg attggtgatg ttactccgtt gcgggtggtc 47340 taagaatatg attattgaga gtttttatgg tggattttta gcggaatata agaactccac 47400 tctaaaaatt tctgctctaa gagcatgatt atccctaaat acacattaga ttagttaatg 47460 actatttaag tattaaattt tagtgaagga atttagttaa gataggattg gagaaagaaa 47520 aaacacatta aaagagagga aggattcaag aatgaagaga agtgttaatg gaaggttctt 47580 catcaatata cacttcagtt cttatcagta tacatatagt ttgtactata taaatcatac 47640 aaaagagaag tattctcaac catttggtga tgtagttttt attaccatac aaaaacaatt 47700 ctaatacaag cgtgtctcaa gaacacaaaa atcgtttcag tttttattat ctttcgagga 47760 gcttgtactg agtgtcgttc aagtaaaacg actgagccgt ctccatgatc catttcgcct 47820 cctcgtcagt gagtttgctt gtgaacaaaa catcacctcg gataaacacc aaggtgtgtt 47880 acaagctgtc aaacatactt agatcattaa gcatgatata cacaaaacaa aacaaaaaac 47940 attgaaaaga gaacaagaaa aacaaaaaac aaaaaacatt gaaaaaattg agaatgaaga 48000 atatgacgac aatgatacaa aagtttgtat actgataata cactagcata caaaacgtga 48060 gtgacgacaa tgacatttct tcactaggcc gatgatacaa aacgttactg ctcccacaga 48120 agcatacaaa acgtctaacg acaaactatc atgaaacagg gagcaaggca tcgactcaaa 48180 ttggccatca cctctttcaa atcgtctgtt tgtttagtaa ggagaaaata aagagtctag 48240 acccaaattg gctatgtacc tcctataaaa cgttatttat tttgcaaaac aggaaacatg 48300 gaacggtggt tatgcaaatg caaaacactt atatactgta taacagtaaa atttcaaagg 48360 aatgacattg tgaaccattc actatagaaa attcaaattc ataatctcgt aatgctgtca 48420 acatccatgt aaagctcagt gcgccatcta aacaaaattt cttcataatc cacatttcat 48480 tagaaatata aaaagggtca agactcaact tcgaactatt aaaaaggaaa aattcatttc 48540 gtgtagaaac gttgtaataa acaattttgg aatggactta gtgatatcat attagttgcg 48600 tttttaataa aatccttaat tacttgttaa ttaattgaaa gagagtaaca gaatgggtct 48660 tcatatacaa attaagcaca ccgaaaaatg cagaatccta atatgaaact gatactcata 48720 tgataactaa taacgttaca caaaatatac agaaaaccgt aaaatgatag aaagaacaat 48780 agcaactatg gtaaaaacca actaaaacca aaacatgtgg caatttggcc ctccattaaa 48840 agctatatac cacagtttag ctcagctata agcttataat aatatacact agggccgggc 48900 ccgcccttcg ggcgggaagt ttgaataaaa caatttcata tgatttatat ttatttatga 48960 ataatttata attatgatat agatgatatc atatacaaac aacacaaatg agaactttta 49020 agttataata tactggttat gagttcaatt ttagtatcat atattactat gagagtaatc 49080 ttcgctatta tttcaaaagt ttagttttag ctatcctcca ttagactaac ttataaattg 49140 atttaggtga gtacgaccca aacccccaaa gcatcctttt attattcgag gccttttgtt 49200 tttttttcat gatgcatata tacacatgtg aattttgtac ggaagaataa tgtataaatt 49260 ggagaaatct tattatttgt tattaagctt gatgcaaaag tttaatttaa ataatgtttc 49320 aataaatttg gcgggtttgt ttacggtttc tttgtgcgta tgtagtcaat aaattaaaat 49380 aataacaatc ttcgcatgcg ctgtccatat catgctggtg acattctgct tcgggctcca 49440 tcctggctgt atttgctaaa taccttgtct tcaaaataac tttgatcgat ttaagtgaag 49500 ttttaataat aagtatatta gcttgtggac gacagacgta cactcatgca cgtaaccaaa 49560 gttttgtaat acataatatg attatggacg tcagtttatg cacacaattt aaagaacatt 49620 aaatattttc acactcatat acataattat attagaccgt ggactgtata catacactca 49680 tactaacgta cccaaagttt ttgtagtcca taatatgatt atggacgtcc acttacgtac 49740 acaattaaaa taaacactaa ctcttttaat aaaataatca ctaacattta ttaactcatc 49800 ggaatcaaat aaagcatcaa cttgttcctt ttttaaactt atgtcaactc aatataaaaa 49860 gcattcataa caaccataaa gtagagagtt tgaaaaaaaa acaactggaa tgtagaaaat 49920 ccataacata gatagaaaaa agatgacaat aaagtagaat gcagaaacat tattaagctg 49980 cagaatatcg agagatgatt atcgaagatc catcttaagc aatacgcgcc ctcttacgca 50040 cattaccgac tggctccttt ccagctctct ttgatgtctc acaattgccc ttgccggaac 50100 cagactccac acggttgtta ggcccgtctg gcgcatcatc atcatcattg tcatcacctt 50160 cctgttacat tcaaattgtt atacgctgca tatgctaatg gcgaaatatc ataataagta 50220 ttgcacttac atcatcgaca aattctggag ctggtgcacg ctcaacctca ttgatgatac 50280 gcgacacggt gaacgtctgg tggttgacgg tgaagttgta gggcgtgaca cggacttgga 50340 aagtgtaggt cttgcgttcc attcctgcaa cgaacggagg catcacggaa tcctcagggt 50400 tcactccttc ttcagccttg tcattaaatg gaagcatcga gagtatcaac aacattatat 50460 aataaccaca taagtaatca aactatatat taccagtaac tggaccgcct cacttgcccg 50520 gagattatgc aacttcgtca taacaccatc aaagcaaaca aatgtccctt cagcagtatc 50580 atcagttaca accatctcaa cgcgataact aaaagagaac aaataaaccg aaatggaatc 50640 agtgtgacgc aagggataaa gaaggcgacc aactatcata ttataacaaa tcgatacata 50700 ccgtaaagat ccgaccgcat gagggttatt acagcgtgca cattcgaaag aagtgacagt 50760 gcgttgcaat ttcttgctgc acttagaaca cgcaacatag caccaccctt tgtccgattc 50820 aacccgagaa actctcgcag tgcataagaa atctatttcc tgctgcttaa acatcaacat 50880 tgcgtgcagt caaaaaacaa tctttatata taaacacacg aatgagctaa ttgcatatac 50940 ataactcatt acctgtggcg aatccgtagt gataaaatgg ttaagctctg caattgtcac 51000 agtctcaacc ttcgcataag acttcaagag aggtgcggca gacggaagac cagtgtctct 51060 agccaccaat ctgaacaaaa gttcacgaaa ttaacatcac aaactctcaa cgtctgatta 51120 catactcaga acagaccaaa cttaccggta aaataaagac tctcctgcat gtgtctcctt 51180 atcataataa acatgtgttc ctgacgttgc gttgaggaat aaacgaccta cacaaaatag 51240 taaaaatttc tgaaaaagga attacacata ttaatttatg ccacatcttt aaataagcaa 51300 cgaagtacct ccaaccatct tcgggtttat gcttgtggca acaatcactt taggatcatc 51360 acgcatgcct ccaagcttct ggtggaataa aacggcttga gcgtcaaaca gactaagagt 51420 gacagacaca tcactgcaca tatataacaa acgttagtgc agctaaaatg attaagcaaa 51480 tatgaaagtt gttaaagaaa caaataaatt acttttctaa tttgacggtg accatgacac 51540 ggttcttatc ctccggaggg tcagacacgg tgctcttcac cgccacgatt tcaccaataa 51600 tatctacagg ttcaatattg agatcagaga gctcagtgac ttaatacata aagcacaaaa 51660 cccatacaga taaatataca tatgtacgat acgatcacat ctgtacctgg aagctgagtg 51720 tttgtattgg ctaaaccaac caactcggtc tggttacgga accggaatcc ctctgccggt 51780 attggcgaga ccggatcaga taacacgtca aactcggtgg aatcgttaaa ccggatcatc 51840 aaagaagagt ccacaagctt gaagttctga gcacagcgag ccacgtcaaa gccagaaaca 51900 gagtacatcg tcccggcggc gagcctatct cggaaccttg gaagccgatt cgcgttgata 51960 gtagcttgga tcaaagtcga ctgaaacaga taaaatttag aagtcagaaa ataacgtaaa 52020 cagatctaag gagaccagga agaatcaaac ttacattcac gtccataagt agcatatcga 52080 cccacatcag ctcgccaccg cgtttgacgt tcctcgcctc ccagaaccgt agaagccggg 52140 cctcgacgac ggaggagcat ttgccggact tcaggtcaga gaagaagact ctcgaaatag 52200 acatagcaac aggaatcaga aagtctcaag agaaagaaag agatgatgcg ctggagatct 52260 atagatactt acatatttat acagatctgc tcgggttcaa atggcgcatc gaagagtctg 52320 agggagggat tgaatgagcg agggattgaa tgcaattgga ataaagacga cgacataact 52380 ccggccgttt catcgaagag gaaggaatcg aagacgtcac gcgtcgccgg cgcagaaaag 52440 ggttacgcga gagtaatgtg tcttagggtt ggagacgtcg tgacatcgtt cgggctgtga 52500 gtgtaaaggc ccatcacaga aagatcgagc gaggcccaga agataacatg ttcagtttaa 52560 tgaaacgcag cacctcgtcg tcagtgacac gtgtcgacgc gagaggaagt gaacgtggat 52620 ggcctaagaa gagattaaac tgtcttttat atatatacat ttagttgaca aagctcaaac 52680 tcaaaccaag ccgatgacaa aaactctcag gagatctaca tataactatc atcacacact 52740 atatatatat atatgataaa ataaaaaccg aaatgattag atcacttcaa ctctcgccgg 52800 taactgtatt cccgccgttt cctcttcagc ggtagaatct tgagaggcga caagtttcac 52860 agcgaaagaa aaattggaat tatacttttg tctcgcttca gcgaagcttg aagaaagaac 52920 ggtttgcatc cactgatcaa ccgttttctc ttcatctggt gaccatctca aggcagctag 52980 aatctgaagg atcgcatcgc tttcgatctc tagacgtgtt tcatgtccaa acgaccgacg 53040 aaaatgcgac aagatgctcc tttgtatgtt cttcgctaac ccatcaaagt cgatcgtttt 53100 gaacgtcact ttcccgtcaa cttgctcgaa aaaatcctca agccaagctt tactgttctc 53160 ggacattgca tgcgcttctt catctgcgtt tgcttctgtc tcatccactg gaagattcag 53220 atcgagaaac gaacgttgag actttacagc tcgaagctct gtaccctctg ttcctaactc 53280 ctgtcttcgc ttattcagac cgttcttgtt agcattgtcg gcgagtttta tctggagttt 53340 acatttttta ggggtgagaa ctcttccctc ggagtattcg acacgctcat caagaatatt 53400 cgaagtagta gctaaaacta taacattctt cataccgatc tctcttccgt gcgagtcacg 53460 gagcttacca gttctcacag catcagacag tcttacctga tcaggaaact cagctttgtc 53520 cacgttctcg atgaaaacaa cagactccac acgcttggac acttctccgg cgatgtagtc 53580 aacaactgtt ttccctctga atctatcgtc gagccggtcc tgtgccttga aatccacgca 53640 aacgcagttt tctcgcccgc cgaagaaggc ttcagcgaga gttgttgcta ctttcttctt 53700 cccgacttga tctggtccaa gaagagcgag ccagacatta cttgtggctg aagctagctg 53760 gcttctatca tctctgtatc cgcagatgat ctcgctaacg gcgttcacag cttcgttctg 53820 aaaccctact ttccgagaga gtaattctct gagagacttg aagtctttgc agtaccgtga 53880 caatggtttc tctttgctca gctcaaagcc tctccggtta agtgataccg gtgtgcttga 53940 ctcctggtag attgttccta gccctagatc tgttgtaaca cagctcaaag gcgagttcgt 54000 tgttgtgcga gttgtgtgat cttctatatg ttttggcttc gagattctta cagataaacc 54060 gggttggtgt ggcggattct cagcttgaag ggttgaaaca agctgaagtg ggaactgtgg 54120 tctaacaggc tggaagctga gtttaggaaa cgccggagtt tgatggattc gttgacaaat 54180 gtcgtcccat ttcttctgca cagaagctag tgtgtttgga tcatctttag cctgcactga 54240 atgagaacta aacactctca agatagtaac tgagagattc gaattcagag aagaagttgg 54300 ttcataaaag cagcacctgt ctgagaatcc ctttgtcttg ttcagattcc acattacgta 54360 accaacaagg caacttctct gaacactgat caccggactt acctaaggct gtgacttctt 54420 gctcacactt ctcgttacag agatgacacc gaggaagacg agactggttc attgagttac 54480 taaacggtac tctgaaatct gatgttgatg agaagaagcc tccaaatgga acaaatgatc 54540 ccatcaaact gtagatgaaa ccacaaaacg tcacgtttca atcaaaaata ttttagactt 54600 tcccaacact aaataccagt gttataaaag ttgggctcag aaagcgccta tgcggcaaat 54660 catgtataaa gctatttctc taaagcgatt tttttttaaa ttcagtccgt tcgttaaaaa 54720 attggtctac acgcccgtct aaacattagt ttcttgtaaa atgcataatt atagcttaac 54780 tattttaaac attgctaaaa acaaaaacat tcatcccgaa aattcggtta aaaaatcggt 54840 gtagacaccc atctaaacat cagtttcttg taaaatgcat tattatagct taactacata 54900 ttttaaacac tgctaaaagc aaaaacattt atccggaaaa ttcaaatcat ccgataaata 54960 aaaaaatctt aattatccaa actttttact gaattgacta taattatata gaaatatatg 55020 aatctaacca aacgaaatta aatcggagaa tttttcaaac acagtattag agatttctag 55080 tttcgaaaaa aaacaaaata aaacgaaaat aaagccacta taaaagacat taccttgact 55140 tgggataaac tccttgattc gaagatgtaa taggaagaag atgaatattc cagtctttgt 55200 caatcgtggg gaacctctcg atcagtttca aatacatctc gttgctcgac acactcccga 55260 cgaaccagag cttctcacaa tgaagcttca acagctccga gagcctcgac acgagagcat 55320 cactggttaa gaccttgagc tctcctagat tcaaaaccgt ccccgtttta gatttcgagc 55380 agctttgctc cacgattctc cccaactcat cgagtttcat ctcaccgatc tctttcgcta 55440 cactaacgac gcttaaccca ctaatctcca gaggcagaaa ccctaccttt cctctgttga 55500 tcgagtcact aaacgttttg agcgctttac cgccgcaagt tccgacaaga agaggattct 55560 tcttgtcttt ccgacccaac acttccccga ttctccgaca gttctcgtcg aagtcaccgc 55620 tatacccgaa tctcgcccga ccagagccag attcggttac gttacataga aacagtggag 55680 gacagcgaga acgcgggaac cgcgtcaccg gaggatgaag cacgtcgagc tttatgtccg 55740 tgctccgaaa cccggcttcg ccgaacaccc ggctcacgat cgggtcatcg agtatcgaca 55800 atatgaagta cttaagctca accttcaaaa ccgacgtcgt ttgagtaacc ccaccgtgga 55860 gctgatggag atggtaagtc tccgggtgcc ttctctgagt cgcctgagag cgtttgatcg 55920 ccgccatgag ggagttagac accggcggct cttcctccgc ctcgttctcc gtcgtcgtcg 55980 tcgtcgtcgg agaaggtttc gaggaaggga gtctgtcgag agatacgccg acgcagagct 56040 cgagcgcgcg gaactggagg cgggaagagt acggcgtgct gtgagcggcg cgtgaaatgc 56100 aaacttcgcg gagaatcgaa gaaggcatgg ttaagagacc ggagatggcg tggagagacg 56160 tcgtttgcgc gtggcttctc ctacgcgcga cggctaccgc gtcgtctagt gcgcgtgctg 56220 tttcttccgt taaacattgc ctcgccgtgg taaccggtgt cggcatcgtc gcccgctttg 56280 atcaatttca aactacacca accaacaaac aaagatcgta aaagaataag gagaatgctg 56340 agaaatgtat aaacaaatcg cgcgtgaaat ttctcgaaat ggattttacg acaaagatat 56400 caaactgagt agtcgctttt tttgaaaaag aagtattttt atttattttt atgttttgtt 56460 tacttctgtt gctttggttt cagacctcag gcttacgctt agatatgtaa gaaagaagag 56520 tcgctgttta actggtctat tgtgaatagg tcccactaat atgtaatatt tatgtttttt 56580 tcttttcaat ttataatcat atttttgtat ttttgttgtt gcccccaatc ctcgtgtata 56640 ttgaaggagc aaaggcacat gtatagtgag catagattct ctatggccca agtgaaagat 56700 ctccttttac ttctattggc ttatactctt tcaaatttca attaatttta gatttgacaa 56760 tcccaacagt ttttcacaat tattctcttt cataattttc tctctaattt ttttaatatc 56820 ctcttctttt attcttatct ttaagaatct gttcattcag ctgataaaaa tatctaaata 56880 taagtatcca tgcatatctt cttcttcttt tcgttatttt tccaactttg tatccgtatt 56940 atacacatta cacttccaca ccaactcaat ataagttttg gtccttcggt ttaagtatct 57000 tgaatctaga tgcaagtttt attccttttt tgcaagcttt cttttagttt tgttatacca 57060 ctattcttaa atatttgaga aaataattaa aatgacttaa ttcatgctaa ccaactaaaa 57120 tcaggtaata aactaagaaa aatatataaa gcatcaacac tcatctaaaa atgaatcgac 57180 aaagcattaa ccataagatc atattgagtt atacagggaa gcacaaaagc cattataata 57240 tttcagaatc attacaattc tcacgtcaaa taaagggatc agtcaagatc aatagatgtt 57300 gtactaatcg attagttttt tttttaaaga gaaaacaaaa catgatgatc atggttaaaa 57360 aatgtttgct tcaaaaaagt tctgaacttg attgatttga atagaaaatt gatactttat 57420 gtaaaggatt ttgaattatt atgcatttta aaaagataat aagaatgatt aattagacag 57480 gtcaacttaa attataatta agaatatatt cagtggtaga cagtgatata attttacttt 57540 taagagatta gatggatgtg atatggtaaa gaataaaaac aggagtaagt gattaggccc 57600 caaccccctt tataaattcc accaccacca tttatatgct acttttgtgt cgttgtcatt 57660 gcaaaagtct tttattaata ataatgaaga agaaaataaa acttcctttg tgttctactt 57720 tttatattct ccattgcaaa ggcctccttt tgtctttccc cttttggaaa aggagattta 57780 ctcaacgagc aataattatt accagtgaaa tagtttttga tattatcaca ccagttaagg 57840 acaaacaaac atcgatcacc ggaacatcgg cttaataaaa ttttttagat ttatttttgt 57900 ttcaaaataa taaatttttt aaaattaaag tacttttatt agttaatgct taaaaactgt 57960 atatttttaa gaaacatatt aattgaaaat atttgaattg gttaaatact atcagttgat 58020 atttattaga aaatatataa taacataaat aataaattta attgtaaata tttattatat 58080 ttttaatatg cgtgaatact ctagaaaatc tgtttttcag aaacagaggg agtagtaagt 58140 actacaagtt agtaaattca gttttaaaac taaattgacg gcctatacta tagccagata 58200 taatttccag acgcatgatc caaaatttcc agaatcgcga acgaacaaca tctgattgtt 58260 gcatccagtt actgtgcgcg gatgccgcgt ctggaattct catccagttt acgaaacgaa 58320 cagggccata ttgtgagtca acctcttcat agctccatat tgcttcttgc aagagttgaa 58380 cttgttccta aactttatcc atggatgcct caccccatat gtatcataaa acttgtctgc 58440 aattgtcttt ctcgcagtct catggagaac cttatttttc acattgcctt tcagttcttc 58500 ttcaattctt agttgaagca caaaccgtgt ttgttcatca ctccacaata cagtctatga 58560 acaacacaag aggaccatct aagtcaagac taaactaaat tcaatgcatt aagaccatat 58620 ctaagtcaag actaaactaa attcagtgcg taaagaccat ctaagtcaag actaaatgca 58680 acacagaaac accaaaatag agtgttgaga atgacttaca tcacttccag ggacagatgc 58740 cattcaaact tgaacagata gtcactgaaa caaaaataaa aacgagttaa tacaagactt 58800 taagactctt aagcgcaaac aatgaaacaa gaagaccata ctctacaaag acacagcaac 58860 aaaaacaaga agaccatact aataaaacaa gagcttcctt gtattaagag ctacggttaa 58920 atgaaggtgg gaaagtaatc attttcttcc ctcagaacac aatgaaacaa gaagaccata 58980 ctaaaagatt gttaccttac taaaagatct gttctgtctt attttgtttt cttgtctgaa 59040 tgtaataatg aatatacaaa cgacacaaca cattcattag ctctaagcaa ccttactaaa 59100 gattgttacc ttactaaaga gagtctgagc ttgagagggt ttgaacttga gagagcctga 59160 gcatggagag ggtttgaact tgagagagcc tgcgacctgc aagaaaaaaa ataacagacc 59220 ttttgaagct ggcaaatgac agtacatgtt ttgtgactta aaaccacttg gtaagagagc 59280 tcaaatgctc aaatatacaa gaaaggacgt attggtgatg taattcagct aattaatcac 59340 aaactcactg atgagaataa aacaaatgca tcacaaatat acacataacg tcataccgtg 59400 agagagtgag cttgagaggg tctcgagaga gtgacttgag aggagcaaca gctttacaca 59460 aacctaagca tcaaaaaccc aatgctatca tcacttcatc aacccaaaaa cccataagac 59520 tcaaatcaat gtggtatcag agatagttac ctcggagaag agagagctcg agagagatag 59580 ctcgagagag agaactcggg agagagagcg agagagagag agagagagag agagagagag 59640 ag 59642 <210> 4 <211> 28086 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <220> <221> modified_base <222> (27461)..(27461) <223> a, c, t, g, unknown or other <220> <221> modified_base <222> (27463)..(27463) <223> a, c, t, g, unknown or other <220> <221> modified_base <222> (27465)..(27465) <223> a, c, t, g, unknown or other <220> <221> modified_base <222> (27467)..(27467) <223> a, c, t, g, unknown or other <220> <221> modified_base <222> (27470)..(27470) <223> a, c, t, g, unknown or other <400> 4 tttttttttt tgcttaaatt ttaaaaaaaa aattaaaaac taaccaactg cgaaccgcca 60 cgtgtcagta tggtccgcga acagtacaag aactacacca aattcgcctc ttgagaaaag 120 aagaaaatag tgggttttag ttttttgtgg gcccacactt cttaagaacc ccttaaaaat 180 cagggataaa gatagctcta agtggtagcc tcatttgaga atagaatatg ctttattggt 240 gtttccactt tgttaatttc tcttgttctc ttgcatcaaa taaaactagg aatacaaatt 300 tgaaaatact gttttgaaag aaccaaaatc tctattaaaa tccaacatag gacgaatgaa 360 aattttctaa aattatgtag gaacagtttt acgagctaca ctaatagcaa tatctttatt 420 attaactggt caaatgatat acatactaaa agtttgattt gtaaatcaac acgccttggg 480 ctagtggtat ttgagagata atttcaatac agtgaacccg cagttcgatc tctgttggcc 540 ataaaataat ttaacattgt acttttgaga tctacagaat aatcggttga tcatattgtg 600 gttaattcaa aaaaaagttc aatttgtatt taaaaaaaaa acttaaaagg aaaatcaaaa 660 tcttttaaga tatatcgcag acatgcgcat cagaaaggct tttatctatt tgggccgtaa 720 agtattgtcc attacttaaa aagtgacaac tccgtgacat tattgttgtg ctgggaccca 780 aaaacggcgt gcattttgtc gactctcagt cgaacttttt cttttgtccg tcccaccatc 840 aaaaagtttt taagaccttt ttgattgtaa gtttgtaact aaaaacatag agaaaacgaa 900 caaaaacttt tacgatttgt aatgtaaata catttaataa aaaaaagttt cacgagtaca 960 tttttaactt aaaaacaacc agaaataagt aaaaccaaag gagtgtttta ttcctaaata 1020 gagctaggaa gaaagattaa ttgattttgg atttgtcaga agcataaacg tagagatctg 1080 gatctgtctc gtagaagaca atatcaccag tgtcactgac gtaatgatct ttcttaatac 1140 ttgccaccaa actttccact aagtggatcg gtattgctcc tgacgtcttt ggttctctgt 1200 agtatcttcc caacacatgt ttagctgctt tcgtctgtcg catgtcatta attaagatca 1260 ctaatttagt aattaatcac cctttaatat aatcaaatga aactagagag agagcgagat 1320 cactcacggc atcgaccaag tgatagtgag ggatttgtgg gaaaagatga tggatcacgt 1380 gagttccaat atcgtgatga atgttgttga agatcccgta atctctatca acagttgtta 1440 atcctccacg taaataactc cattcctatt attgtacaaa aacatcaaaa attcagatta 1500 ttcaactact aatcattatt gcttcttata aataatgttg atctacttac cttgcctctg 1560 taccaaggca gcttatcatc gtgaccatga tgatgcaagt acgtgacagc gtccaaccac 1620 attacaaaga tctgaaattt ttccaaaact tttatgtcaa aaacaaatta tattagcaat 1680 gatataataa agaaatatat gaaacttaca atgtaaggaa caccatagac ttttagaact 1740 gtgactggac caacgaggaa tgatagataa acaagagtgg ccaacacgat cgaccagcaa 1800 gtagttgaag ttgcaataag ctttctctcg cttggggcaa ataaactact gtatgggtta 1860 taatgtgacc cttctttacc aggacttctg taccactgta gtcatcccca aacaaattta 1920 atttatattt agttaatact caaaatctaa aaattcaaaa ttgtaattat aatcaggaag 1980 aaaaattagg aattaggatt taccagatag agagggtaag cgagcatggg gagagggaca 2040 gtgtatctga gcatccgtgt actgtgggac aaattcttgt ataatttttc tggcaactgg 2100 aatgcaaaat taagattaaa atgtaaatta atatttaaca gtatggttat atattcgaat 2160 ttattcattg catgtggtgt gtttataagt ttttcttttt attagttcta cgtaaactcc 2220 aaaattgaaa aatactaaga aaagtaaacg aatttcgaga agaatcattt tatgccaatg 2280 gctcgaatat aagtggtccg ttgttaaagt taactacagt actataaaca atttaaatca 2340 gttgtttact acagctaaac gacaaatctg acaagtggtc gtcctagcct caaactggaa 2400 aaaggattga ttaaaataaa tacatagaat cctaagaaaa ttaaaatgaa agaatttcaa 2460 aaaaaagaaa aaaaatatga gagagggaaa gattaccgga acccaagact cgtcgttttc 2520 aacatggcca tggttctggt ggtgtgtccg atggcttatt ctcctgcaac caccctcagt 2580 tataaaataa actattattt tattttcata aaaatgaaat tggaattgtc aataacatat 2640 cattttcgaa gcagatggta agagcatgtt taacggggtt tttaagatgg gattcttatc 2700 agaatataaa actcaacccc aacatgaggc catgattaaa actgtttttt ggtttcttaa 2760 tttttttctc cgattaaaaa aataaattaa attaaaaaag aaaccaatcg cggaccacca 2820 ccagtgggat ccacaaacag tacaagtaaa agaccaaaat cgatccttct ttcgcgactt 2880 ttgtaaccgg ttttttgttt tttttgggcc cacactatat cttattatta atattttgtt 2940 aaggaccctt cttagagcac taagagcatg attattgaga agttctcagg gtggagttct 3000 tagcggaata taagaactcg tctcttgatt tttaactaaa aaaactaaaa aacggttctt 3060 aaatacgagt tttaaaagcc ggttcttaat ttttttagtt aaaagttaag agatagattc 3120 ttatattccg gtaagaacct cactctagga acttctcaat aatcatgctc taagaaaccc 3180 catagaacat gctcactcgt ttaactaagt tattcatttt tgagcaacaa acaagtgtat 3240 ctaggaaaat gatgcatgtt cgtagacatt tcaagctgat gtatccattt aacaataaaa 3300 taagccatta aaacaaaaat atataaatat tattaaactc acatatgaag ctacattaat 3360 ttattcaagg acatgtcata tgataatagc taattggacc ataaataggc ccatagcatt 3420 aaataaaagt ttggttcttt tttcttcgat gctaaagatt ttgatgcttt tagtcacatg 3480 cattatttta ctatggaaaa ttaatatatt ttcagttatc agattacagt ttgctaacat 3540 gcaccaagaa tgacaaggaa aatgtaagaa atacgaaaac aagaataaat ttgcatgaaa 3600 aagatgttta aataaatgac ttaccaacca tggtatggaa cgagaatgaa ggaatgaaga 3660 atatgaccaa ccgcagtatt cagaagagga atgtctgaga agctcccatg tccactgtat 3720 tattcaaatt gaattttaca tcataaacat gtttatcatt tattgcacaa tgttaattaa 3780 actttactca attcaaacgt tccaacaagg taacaaaaat agaatatgac gtgtcacatg 3840 actatatttc gaaagtagat tggaacaaca cacaataatt aaaagaatca atatacagta 3900 attatattgt tactttcaaa caataaaatg tgttttattg aaactttcaa acgtagatcc 3960 ataaaatgcg gaaccaacaa taattatagg aaagaaaaag atgtttagtt aggacttatg 4020 agtgttacga tttgatcaaa aaaaaaagtt agcagtgtta cgactgaaaa agagaagaat 4080 taaaaatctt agatcccctt ttgcttttaa aataggccaa tttgggtgaa cataataatt 4140 ttttttttta aaagtaaacc tgaagagaat caaatcttga agtcagtgaa aatctcatat 4200 cgaacgtgcg ttcaagaaat caaagacgat gcaaaaaacg aaaaaacata taaacatatc 4260 aaaattaaga agttgaagaa aaaataaatt gaaaattaaa ttaccagtcg tggccgagta 4320 cgaagatggc ccagaaaagg gttccttggg cggcccaata aagaggccag aagaaccagc 4380 tatcaaaata cacggcggcg acggccagag ccacgacgga gaaaatgtct ctcgcgacgt 4440 agctcatgga tctcaaagga ctcttgaccc aacaatgctt aggaatcgca gcccttatat 4500 ctccgatctt aaacggtggt tgtgcgctcg gatcaaacct ttcgtccttg gaatctccgt 4560 tcacattgct acgctggtcc atagcgacaa ccatcgccgg agaaagagag agctttgagg 4620 gatgtttctc tctctctaaa actgtgtggg ctctgagtga aatgtggtgg agagagtttg 4680 atggactttg gggtatgtgt ggtttgttta tataaaggga gaagatgtgt agagacacca 4740 aactgttttc tttttttctt aatttaggaa acttttttat tctttgaaga ataaaaattg 4800 tatttttgcg gtaacctgtg cgcaatgtat ctttgttacg tcgttcattt cgatgaaaac 4860 taagttagag aaatgtgtta caaaaaaaac aatgctataa aatttacaga agattttaaa 4920 attgcattat cgagtataag taaccatggt aatggtatca aaatttacca agattttctt 4980 cttttgtttc tctttagttt ttccttagaa gtaaggattg tgcaccgaaa tggtagtcaa 5040 cttgtatggt ttttcatttt cactgattga tatttacaat ttcgcaaaaa aaatacatgt 5100 agtcgaaaat attatgttag tcttcgtact ctattttgtt tctgctaaaa tttcctgact 5160 atgtataaat cataaaaaac gatccatatg gatatcatgt agattgtaga catgccaaca 5220 tttatataga ttttttttaa aacgtattaa tttgagggaa aatagttgcc acatcactgt 5280 gatgtatttg acttaagaaa cagacttcca tcagttttta tttattttag acgacttaaa 5340 ttggcggttt atacaatgta attgttattt tccccagttt gtcattaatt agttaatggg 5400 aaaatcagtt ggattgattg aaccgattca cttgatcccg aaataacaac accaaaatag 5460 aaccaatgtg tggggtaggg tttgaaagaa tttcttaaaa aaatggtaca attttttttg 5520 gactaaaaac atggtataat tccaactata ttttatcggt ttaacttttg acatataatt 5580 aactttgaat ggtgaataaa gtcataaact aagatcaaaa catttatggt gttttgataa 5640 taaaagacat ttatgggtta gtcaatgaga catcatattt tagaaatgca ggcaagatgg 5700 cgtttcctgg ccagcctcga gatttcgggg gcttatgcga tattggtaaa gatttcatta 5760 aaaaaattta aaaaaatttg gaggtctttt taaaaaattt gggggcctat atttatgtag 5820 tttttttcaa aaaaattagg ggtcctaaac gaatgtttca tccggctttg cccaggaaca 5880 gctctgctct acctcttctt ctctcttaaa ttaattttcc aacacgtctt tacgagataa 5940 gcatcaacta attgctacaa ttgtatacag aatttactta gctgctgcct ccattaacta 6000 catttcaggt tatatggtag tgtatgtgca ttgattataa atacgcagct tcattgcata 6060 tattcaaact ttttgttgga atgatttccc catctttaag aatcgggtaa tggacgtgaa 6120 ccgtgggttt actgtttaat ttattaacta tacttatatc agttttttaa tatttaattt 6180 tatatgagaa atcgattaat attactaaaa cacaaaaaat tgttttcttg cgttatttta 6240 tggtttttgt cactgaattt gaacatgata ttttctcttt cattaaaggc aaattaccct 6300 gttatggttt gagccagaga ccaaatacta tatattacgt ctatatatac ttaatcaaaa 6360 taagagaaga ttatatgcac tctaccttta aacgtgagat ctccaaaact gtcataaaaa 6420 cgtgatctca tttcttcttc caataacata tatcaatatt gtacatccaa ttccttcctc 6480 cataaaaacg tgaacacctt tcttcttcca atcgtaatat caatgttgtt catccagttc 6540 cttcctccac aagcttttta tcggaagaat ctgcaagcgt gttaaacaaa ccaccatgga 6600 agatgtaccc cagcttctgt gagagttttg gagaaaggag atctacatgc aatttcttct 6660 agcaatcttt tttaacgtaa aacatttaat tttctcatat gtgattctat gatgcttgat 6720 aattaaaata tgatggcctt aatgaataat cttgatgatg tttttagtaa gtcaacagtt 6780 tagcatatga gattaacttt ttaaatattc atttataaaa tttactgcag tttgtataat 6840 aactaattac ataacaccat attcttggat ctaaaagcat ctccaatata aaattctatt 6900 ttttcttcta aaatagaata attcgattgt atagttagtt tactccaatc ctactcattt 6960 ttggagtgaa agcaatgatg aacaaaaaaa taaaaaaaaa tctatttatt ctattataag 7020 tggaaaatat aatgtggttg aagcatttat ttactctaaa ctcctttttg aaataaatta 7080 tgaggtggga ttggaactat tctaattgct caaattctta tgactatata tctaggtaag 7140 ccatggaaaa ggaaaggtac aaatgatgag tgtgggcgta tacatgaagc ctgcacgtga 7200 gagttgtagc tactcgacaa acgtatacta atttgttgcg taccatctcc acttcatata 7260 tatatttata tatctatgtg tgttgagctg agatatgaga ataaaatttg agaatatacc 7320 tcaaaaatgc aaagagaagt atgtgtttgt tatttagcag atgcacatgg tggaggacat 7380 ccttcgattt cctcgtgaat tccgaagagc taagttattt tcttttaatt atacagcttt 7440 aaccgagcta attaattaat cgttacataa tttgagcact gtttgaagaa ggcagcgtat 7500 atatacacat tagtatagta atacagttat ataggatcca gttttctttg tttgaaaaca 7560 ctcatatgaa taatatatac ttttaaaaca cgacctgtaa cattttttga cccggtttat 7620 atgtatgtga ttcatatatt tctctaacca cgatcgagta cgactaaatg tgcttatcaa 7680 ttatcataca cgtctctacg tgttcatcta tcttttatta tttttatcaa ccattcgtat 7740 tcgtgtacgt tgaaaggaat cattacgtag atgcccacga tgttaccgaa gttggagaat 7800 tatgttattt agaaaaccca tttttaatta cgctaattac caaaactaat atggggtcgt 7860 aagaatatgc tttcggtagg cttcgcgttc taaatttaca aactatagca gtcaacatat 7920 aagaggttaa atgtattaga ctgaattttt tttaatgtgt ggtgtggggt tacaaagaaa 7980 taaaaacggg attagtgaag cttattggtt actaatttcg aaataatcat gcatggtaaa 8040 aaatcatgtt atacattgtt gtatcagacc aaaaaaatgc tatctcggat tttgaatatt 8100 ttacagtcaa aataagtaga tttaaaagaa tcttgtatta ctgaagttgg aatttagaga 8160 ttattttgaa aattagatag ttgaaaattg attagatcgt tgtagtgatg agttgacaaa 8220 aaataaggtg gtctaaatat atggaaattt cgtcctgaag ataacaaagg cctttgatct 8280 tgcatctagt gcattattaa tagaagaata ttcacaagaa tcttgtgctg tgtgaccatt 8340 tttgtagaac aatggccaca ggaaatgtta tgtttcttgt atctagaaca atagtatcgg 8400 gaggactaat tgtcaccaaa actgaaaaaa taacaagtta actaagtgta tcgatacata 8460 ttcacagtcg aaataattaa tagaggacaa cttgtccatc agttgttaat cttggtggaa 8520 aaggttgctt gttaattgtg ttaaatgcga gtagagtata agcggattta catgtaggaa 8580 aatataggaa gaacataaat attggttgaa aaattgcatc acatttttac caaaaaaaaa 8640 ttgcatcaca tgcatattat tcgcatgaga tgtttaaaga aaggcccacc gcacgcgagt 8700 ttaatctcca atggaaagac ttacagaaag gtcaaagttc tttatcaaca gacaacagga 8760 tatgtgtgcg tagattgtaa aacacgtagt tatctataca taaactaatt cttaaattcg 8820 ttatgtatag tttttttggc aggaaaaaag catagaacca taaagaagaa gaacggttga 8880 agatcacgat ctattcatga atacgtgtcc tcagctttaa accactcaca tggacggttt 8940 aatatctaac aaagcattgt ttttccaaag atactttatt actgtactag gcggcaatcc 9000 agctgataat tagatgaaaa ctaacaccat ttaaataatt taaagttagg tttgtaccaa 9060 taataatgtc taattggacg gcttagagaa gaaaaagatg ggacgtacgt gcacgtgcgg 9120 accgacgaaa cacgttgtcc tctgttcaca taagcaatgg ctctcggctt tctaaaaata 9180 tctctaacta tgcagtgaat tacttgacct aaaccatgtc atttcgtgca accccaacaa 9240 attcctggct tccttttttt gtggttcatc aatcttttct taggacaaaa cgtttttttt 9300 gtttatgtca gttaataaat gatcaagtcg agtctcgttg acaactagat atcaacgcat 9360 atctggtaga tcactataaa actcagatta tgggtgcatg ttttggatat taaagcaaat 9420 atgtttaggt ttggaatatc agggtatata aaaagatata gtttttgttc ttacggaaaa 9480 gaaactcaaa ttaatgaaca ttaggcttga agtcatataa tcaaacgtgt aaatgacatt 9540 ctttagtaat gattttgttt cccgcagttt aaaaagaaat ctcactcatg actaatgtct 9600 acaaaagtag acaaaggatt cttagttgat tctttagtaa tggttgaata gagctgaaag 9660 ctaaagtcat agcatacatt tggtcacttt catgaattta catatataga taaaaatatc 9720 aactagttca ataagatatg attgttttat caaacagaac atcatgagtt ggagtcttga 9780 aatcatttta acctgttttg ctgagagcaa aaatattgat ttaaataaca attgtgagat 9840 aggcaaataa tctcacgtct tacttttcac atatataata cacatatagt tcatatagtg 9900 ggtttgcgtt aaaatagaaa taccattttc atccacaact aattgataaa agaaacattt 9960 ggtatcggga tctaaacgaa atattcacca atcaaattta attttatata tagttttata 10020 atgaggagac gagaagatat ttatgaagac aattattaat tatgtatgtg aatatgattc 10080 gttttctttt ggatttatag agctatagta gcaatccgta gagaagaaat ctgaatcgga 10140 tataacgcca aaagagagat catatgagtt ctaaaaactt aaccacgaca atgttatctg 10200 tccatattat ccatcttcgc acttcatttt gttccatctc ttgtccattc tctatctcta 10260 catgacatta cgtttcctta acatacatgc ttccattatg tttctgtgta aaattaatta 10320 cggttacatt atttattgat ttgcattaca tgtatgattt ggagatgcat acacttggaa 10380 ggagtatacg agcatgcgtg acaactgaca tgaacatgtg aatatttaag atccaaactt 10440 ccaagtatct tataattcaa tcagaataga aactttaaat tataactctt tgttgccaaa 10500 aaaattataa ctccttcagg gatctatcca caaaatccaa atatagcaca aactaataat 10560 tagtttatca gaatgcttaa tgcttgacta ttaaatattt cttctgattc ttttcccttc 10620 aaacaaaacc acagcaacca aaattatcat taaaaaacga caattttaaa accttctctt 10680 tctccgggaa ggttatgtta ttatattatt gtaaatcaaa ccgagacttt ggtctctggc 10740 acaagtcagt tatacggcta atgtcacggc caaagaagaa agtggtaatt tagctgatga 10800 agatagtagg agttttctcc agcttatgac tcgatctcca tatgtaccag ctcacgaagc 10860 cggtcactgg tattcctttg gcgtcctgac caaataatct atctcaacca cattgcttac 10920 gagtgaagtt cattcaaaaa gaaatctcga gtcaaagtga tggatttcgt tttaagaatt 10980 ttccttgagc tcaatgagca tttaaaatgt cccaggccaa aagttctttt cttaataaaa 11040 tttgtgaacc gaaacaaaac attcttctct taacaggtct ttgggcctgc tgttgaaaga 11100 aacagatatt taggcccata tatagtaaaa tttttatggg gcttatagaa atcagatatg 11160 agatattcca taattatcaa attagttcac gagaacctca agtgataggt agaagttgaa 11220 taagattatc agtccagatg aatgccttaa tcttgggaaa gtcatcactt catatgtctg 11280 agaagacgtt tactaacttc aaagttttgt ttgtaaaaaa aaaatcaata tgtgaaatca 11340 aataaactgc atgaacacac acaaagtgaa gtatacaaaa agctgaaatc tagtaagatt 11400 aaataaagct gaaatcgatg tagaaacaga aaatacaaat aaaggtttta tttttgagtt 11460 atttttattg ctctctcagt atacatacat tatttgtaag cttgcaagta aaattaagaa 11520 gacaaaaaag attatcaccc tctcaacgtt tgcgtcctcg gccgccgcga ggtggatcgt 11580 gtctgccgtt agctgaaggt tcaccgtagt cgttggtgct caccatcaat gaccgttctc 11640 tcaccaccct catttcattt tctgtcatat atgcatatac gttacaagtt agaacatagt 11700 gagaatataa aatgttgtac ataagaacct cttattaaca aacgatttat taattaagta 11760 tctatacaaa cgtcaatacc ctcgttttca ttttgtttta actacatcga catgcattca 11820 taatctttta actttatttg cacataaatt tataaacgta tattgatata tatgtttcga 11880 tggttgtgtt ataaacttaa atttataaac atatattgat atctgctaaa aagaatagat 11940 ttaaacacac ccaaattcga cctttttgtg tgtgttggat gtcggtttca caaatcgaaa 12000 tctttgcttg gatttttcac agatagtcag atacgatgga ctaagatcca tttcaacttg 12060 ctattttatg caatttaata ttatctgtaa acttcaatta tatagtcgtg atcttatctg 12120 tcattgtctt tttcaaataa tgtcaacgct tttgaagtgt gaacacaaat taaatatcaa 12180 gcttttatat tacatggttg tactttacaa aaactcataa tacttcaaaa aaatatttaa 12240 aatactttgt tttcttcatt agatttatag tttataattt tatatgacgt tttcttactg 12300 gattcgtcgt tatcacagat atgttctttt aaaagaacaa gtcatcggcg aaaggaaaga 12360 caatctcgag catcgtgatt catgtttgct tgaatttgaa tacaaacaag ctggaaacag 12420 agcgcataaa actaaggata tatccaactt gttttaacaa tatatatttc aacacttatt 12480 caagtaataa ttgtaataat ttagttgtgg gtttctgtag tgatttaaaa tgaaaggtca 12540 atgaagttca catgaactaa ttagtgtgtt attcttttgt tatttgtatg ggttcatcat 12600 gtgttattct tttgttaatc agagtatgta tgcatatcta gggataattg gtatcatgta 12660 aatacgaagg ataaatatac atacaattat ttattttgct tgtgtaattg agattttctt 12720 gttttcttta ttaaaaaggt aaaaactgtt aaggctttct tcttctcctg gtgatatatt 12780 tgaacatact cttaagatat acacagattt acagatatag atcatgtgac taccaccaca 12840 tatcaccgat cagtgatcca ataattgtgg ttgtaaaata tttgattctg agatctcatc 12900 caataacaca taaaatagta aactagatta gttttaacgt taaacaaaga tgatatatgt 12960 agttattagt gaagaaatcc ttatgagttg ttaacaggat atggattatg aagaacttgt 13020 tagcttatat atagtgcttg gatattagat aaccaataca tattaccata caaaaagcta 13080 gtaaacactt gaaactaata gagaaacgaa gggagggaag aagagtatac ctggaaatga 13140 aagactgagg cgagcagaag aagagacgaa agcaaatgtg aagaagagta acaaacataa 13200 cacaaccgag gaagatgatg cataacccat tctctctata tatatatttc tctctctcct 13260 cccttcttct atatatatag accacaaaat gtctcatacc ggcccttcgt tttcagcctt 13320 tctcactatt taatcatttt gatttttatt aatatacccg cttccaaacg tttagttttt 13380 acataattgc gtttgaaagg aacatattct ctataatcta atggttttgt attcaatgcg 13440 tgtatatgca tgtgtttgtt gttgacaagc acaaaaacaa gggaacatga ttgcatttac 13500 atacggtagg tttgacaaga ctgaagtggg atccctttaa accatcaacg aattaaaatt 13560 cattttttca ttgtattggt tacaacagaa ctcaaatgcc agcttaaaat ccaacccatt 13620 gctatttttg attttataat agctttagag gcacaatgat tccaaatcca ttactatttc 13680 ttattctaaa atagaaatta ctattttttg ccaaaaaaaa atagaaatta ttattttgtc 13740 ctctatttat agaggaagaa ataacagtct ctatttttac tctatatttt gaagattgct 13800 attataaaga aatacattag agtaaacttc acctttttat aaagattttc tattttagag 13860 gcaaaaatag caaaatacat tggttttagt aatgggtttt agtagaataa tttaatactt 13920 tcattgtaca aattaaaaaa ctttgttagt tatcacatac attcaattag gataatcata 13980 acataaaaac aagtacagac cacccgagtc tagattatca agaacaagaa agcattatat 14040 gtctggtttt gtacccccat caacttaaga ttctcttgaa cataggcaac acacaagttt 14100 acacatacat agcataagag atccaagtac ttcaagaaag cataggatcg gataaatcgg 14160 aaaatacatc atcgtttttt gaaaccatat ttcttacgtt catagaagag atcggtcttg 14220 gcactcccaa ggttgacgat cttggggcaa ccatctctgt ctttctcctg ctgcgtacac 14280 tctttgcagt agtaagcatc cgagatccca acacctccgc agataacaca gcggccttgg 14340 aatgacccgt agttgcattc gtcacagata cgcaccagag tgcagggacg cacataagaa 14400 tcacaaacca cgcatttgcc gtcgcatttc tcgcacagcc ttccgatggc aatgcctggt 14460 tgtttccggc acatgatcag atcagggtga tgctttgcca tggctagtga aacacagacc 14520 tgcacacata agtcacttgt cttgagctca tatgatcgta aagagtacaa aactagaaac 14580 tgaagaacaa gaagcaactt aaagtcctgt tttcacttgt gtctgaacaa tcaattaaaa 14640 gaaaaagaga gtaaaaaaat tggaaaataa agtttgtgta gcagtgttaa cttctcagag 14700 gaatatcatc gaacacctta catgcacaag tctcagccga acattactct ttcaagattg 14760 cagattctag agacatgatc aatcactcta cgaaatataa ttaataatgg gctgagaaaa 14820 caaattgaac aaaagaagga aatcaagaag ctatcacaaa ccctaaaaat tcaaaatcaa 14880 gaaacaaacg aagacgataa ccaatctgga ggagtcctct ttagagataa aaaaaaaaaa 14940 ccaaagctta cagttaacgg gagatcaaac tcgagcaaat caagagactg ttgcgacgag 15000 aaatttccag agcgccaaag atcaaccaac caagaaaggt ctggaacgaa cgaggcaagg 15060 aggaaattta tcacgagtag agctttttaa atcggtccac ttgttatggg ctttttactt 15120 tgggcttaca aactcttcat caaaccaaac caagccggta agcaatgtaa aatccagggc 15180 ctaaaccaaa ccaggttaaa cagcaatctg agttgcgact aaaagtgtcg gtctcggtct 15240 ccgtctccgt ctcagaccca atttttattt catcagccgt tagctttgac ttctgactag 15300 cataacgtga ctttgttgct acaatggtac acaatatact tcttttttta attgggaaaa 15360 tcgcattttt aaccttcaaa gtgacatttt ctaacacttt aaacctccaa cctttttcac 15420 tagcacttca atacctcaac cctcaaaact tatcatatta aaccttgaag tcgtttcccg 15480 ctcttaagcc tccaggcgat ttgacggtaa tgttcacgcc gtcatcctca ctaaaaacgt 15540 gtgtcgtttt tttaattaaa aaacaccaga tacgtttttt atctttttta tctgttctaa 15600 atcgaattgg ggatctaggg tttactcaaa atcaaaatca gaaggagaaa gctcgatact 15660 tggcgacgag caagagattc gaacagagta cgtcgtctca attgatttgt taagcatctt 15720 agtatagcaa gttgtttctg ggctttgttt ttcacttcat aaatcatgta tatgtgtaga 15780 tagcgataat tgtctgagtt agaattggtt tcacttcgtg aatcatgtat atcaagttgt 15840 gtagaagctc ttttacatgt ttatatcaga taatggtgtt gtatatgtgt agatggcaca 15900 cagttcaagt tcatcaaacg ttgtgtacaa aaacgaaaaa ggtgtggttt gcaattgtaa 15960 ctgcttagca aacgttgttc aagcttggac tgatgacaat cccgggagga ggttctatag 16020 ctgcgaaaaa cgcaagactg gagatgaata tgattgttgt aacttttttc agtggtatga 16080 tgttgagaag cctcatggat ggcagcgtga tgcattgatt ggtgctagaa atgttaatcg 16140 ccaacaaaga gaggagatta agagtctgag gaacaagata agagcactta gggaaaacat 16200 gggaccaaat tcaatagatt tgaaggaaaa aactgaagca tgtgacgcat gtgaagggct 16260 caaaagggag gtgctgatac taaacgagag gagcagagtg tatcgcaatg ttctcataac 16320 gtcatcagtt ggattcactg ttgttcttgg tgtgttcatt ggtgtgttga agtggtagaa 16380 ggttattcaa agttgtttga tgattttatg actatgttat gactatgtaa gctatttgat 16440 gttatgacta tttatgcttg tttgaaggtg ttaagactaa gatgattatt atgtttcaat 16500 gttatatttt tgtcatataa agtaaaaaaa catcaagatc ataaaaccga accaaacaaa 16560 ctacattaag tcatgtcatg agaacaacaa aagacaaatt ttaagtcatg agaacaacaa 16620 aagacaaatt ccaagtcatg tgaacaacaa aagtcattga cacaaaaaaa gacagattcc 16680 gagaagacac ataaacaaca tcaagatcat acatagattt aatcactctt gtggaggagg 16740 ttgtgggttt aggtcggacc tatcataaac tcgatctcca agcacctcaa aaggtcgatt 16800 tgtgaatgga ctccataatg tcccaacacc atgaggaata ttagttatct tccttacctt 16860 caaaggaagt cctcttggag ctttcttggc atgaggcttt ggatcagtgg atgaaactga 16920 tggctgtgga gcagtagagt gagttggtat ctgagaggat gattcagcag cttgaacagg 16980 ttgagaagag cttgttcttt ttcttcttgt tgaaggaggc ttaggcggac cctgaatcaa 17040 aaataaatgt taacatagat gcattgtgta taaattaaag agtatacgag taacttacca 17100 ctggatgtat acgaggtcgt acacgtttgt tctttggacc ctcataaacc acttgttcat 17160 ttttgcagcc acttttaatg tgacccatct gaaggcaacg gctacatttg ggcacacgtc 17220 cgtgtcttgt cgattttcca gcgttttcaa ggtcttcaaa tggctctttt ctcctctctc 17280 ttgttcttgg tctacctctt ggcttcctta actctggtat tcctattgat ggttttccta 17340 gcctcttcca caagttttca ccattgacgg gcttgatgtt ctcgttgtat gttttcttca 17400 tcttatgggt gtagtaatac tcggatgtat acttcacagg gtcttcttga ttatcatcaa 17460 acacacagac atcatgtttg caaggtatac cagtaagatc ccatcgcctg caagcacact 17520 gatgtgttgc caaattcact gtgtaaccat tatcacactc attaacctca tacaaacttg 17580 agctgcttcg tagtgttgaa caatatttct tggcaatcct tgctttctcc aataaagcaa 17640 gtgtgattgg tgtaacaata gtatcccact tatctgccat aaaccaccgc cttgaattcc 17700 tcttcatagc ttgtcttcga atgtcctcca acatagttat cacgggtttc gcccttgcca 17760 tctttatggt tctgttgaag ctctcagata agttattatg cacgtcagga cagtgtgaat 17820 caacactgaa atatgctcta caccacctct tagggtctgt cttgagtaac tcttggtgtg 17880 ctacaacatt atatgcctct aatagactca acttctcttc atactctcct ttagtgtagc 17940 tgtaagcaac tccccaaaac aaagatttaa actctgatct cgcaaaccca agcttcttcc 18000 aattcgcata aatatgtcta gcacacatgc ggtgttctgc atcagggagt tccaactgta 18060 tggcatgaac aagacctttt tgtttatccg aaatgatggt cagatccttg ccatttccca 18120 agtcgagatc catctttagc ttcttcacaa accagcccca agtgtctttg ttttcccctc 18180 ttacaactgc ccaagcaatg ggaaacattc tgttatcagc gtctctacca actgctgcaa 18240 gcaaatctcc atttaaatcc cactttaaga agcatccatc aagacctatt acaggtctac 18300 aacaactctt ccatgattca cgtaattcct tgaagcaaat ataaaagcag tcaaacatct 18360 gaacaccgtt agcctctctt gtgcataatt cagtgcttat accaccattt gatctatgta 18420 actctgcttc ataatcccat atcttgaata gtcggatttt catcctctga ttcttcaggc 18480 tcatcgtctt cctttggtct gtcaacatct tcatcttcat cactacacga acgctcgtct 18540 tgttcggtgt ttggtatgtg ttccacgaac acttcaacaa catctactcc tagcttcccc 18600 gcagaacgaa gtatacgcat ctcctcatcc aagtaatcat atgcatatct caggtctttc 18660 atctcctctt tctcgaactt gaaccaaagc agtccaattg gtgctcgtat cagtgaatct 18720 tccttgcaaa acagactgaa cctctcccat gtgatctcgt caatcttcca ctccacattt 18780 ttggtgcccg tttcaccaac atacgcatat ccttcaccat ccttcttcat tgaacctcca 18840 aaatgaatct ttaacttcat ttatgttgct tccctgtaat caattgctta aactttagac 18900 aatttcgaga gataaaacga atgtaaaact cgaaattttt gaaagaatag atcaaatcga 18960 tgactcgcgg acccttaccc catatttgct ttgattcacg aaatttccta tcacttaatc 19020 gagctttctc cttctgattt tgattttgag taaccttaga tccccaattc gatttagaac 19080 agataaaaaa gataaaaaaa cgtatctggt gttttttaat taaaaaaacg acacacgttt 19140 ttagtgagga tgacggcgtg aacattaccg tcaaatcgcc tggaggctta agcgcggaaa 19200 acgacttcaa ggtttaatat gataagtttt gagggttgag gtattgaagt gctagtgaaa 19260 aaggttggag gtttaaagtg ctagaaagtg tcactttgaa ggttaaaaat gcgattttcc 19320 cttttttaat tagtatactt tctctatatt tcactccaat agcatctcca atgtacacct 19380 ctataatttt ttctaaaata tagatttcta ttataaaggt gaaaatgctc caatatatgc 19440 ctctataata tagttcatct atttatacgg gaaaatatat aaatatattt tttctatatt 19500 ttcttttaaa atagaagaac tctattatag aggcatacat tagagcattt tcacctctat 19560 aatagagttt ctctatttta gagaaaaaat atagagatag aattagaggc gggttggaga 19620 aggtctaata gtataactct ttggatttgt tccatggttc attctaacat aattactaga 19680 tctcgatccc cgcaaccgcg cagatttttg ttttcattta tttttatata aatattttgt 19740 tttcaattct aaattggtat atattataat agatgcgtct atcaattttt aaagcataat 19800 aaatttaccg tatatttttt tctttgaata gattgtttca aacattcaca tgtatttgta 19860 ttttcttcta tatatatatt tcagattatt atttcattat taaaatcgta actatatatt 19920 taaagattag taaaatattg ttttattgtc atattcaaag atattgtaac atttcacaaa 19980 tttagaaagt ttttaaaaaa ttaaaatttt cgcttcgtag atttatatta tcgagtaaat 20040 aattaaacat ttggtttttg tttaattttt aaaataaact atataattta aaatttgttt 20100 tcattggttt aaggtagtaa atattaataa ttgttagata atatgatttt tgttatttta 20160 aaaaaaatat ttataatttt aaaagttaac atcgacaaat atttaaatat ttaacatatg 20220 gaggtatagt atattacaat attaaattat atatatttaa gttatactat ctataaatcc 20280 aatggataat ctattgttta aatccaatta ttgatagtcc aataaaaatt tctggtaggc 20340 caaaaattta aatgatataa ttatacttta aatgtaacat gacttcatag gaataagttc 20400 attaggtcaa tttttttaaa aatcacatat gaatcaagtt atgacttcta ttttaatata 20460 taagatattt tcacaaaaga tagagatcat ctttttctgc gctgggaatg gagtgctgat 20520 ctttggaaca tttgtctgcg aagaatgggg tattccaatg tggagttcca taaatggtta 20580 gccttctacg aatggtaagg ctgcatgaca aagttgtgcc aaggcttctc agacccttgg 20640 tagtctcaac aacaatctat ttcatttgct ctcagagaaa cgagcgctat tatgttaata 20700 tctcatcgca gccaacaatc attttcaagc tgcttgaccg tttcattaca aatgcacttc 20760 tattcattag aaatcaaaaa cagagctgcg gactgatgca agtatgcaac attggctttc 20820 caagtatgca acattggctt tccagggaat taaaaccata gtctgaacta tacccatttt 20880 aatggaattt acatatgtgg caaaaaaaaa atacaagtca agaggcagac atatatactt 20940 ctttttttta attagaagca agagttttaa ataaactgaa atttttcata aaatttaaag 21000 taattattta caaaaattaa atttaagcta attattaaaa attaaaaatc aaaattaagc 21060 atgccactga atataaaact atgtaaatgc taatctaact agatgttgtg gctgatttgt 21120 tgaactttgt agaaatgatg ctgataaaaa tgttataaat gatctgatgt aactagggat 21180 tctttttgtt ttattttgta ataaatgaag aaaaatattt ttaccattat aattttttat 21240 atatcttaga aaataaggtg ttcgttatat cccaacagta gtttttaatt ggactagatc 21300 tttttgtgtt tgtatatttt tcgtcttttt tatgtattgg tttatttttt tgttatttta 21360 ttgatttcaa atattttttt gtctcaaatt tcttatttag attagttacc atttttaaat 21420 tttgtacttc tgaatattta gttatactct ttattttctt agttatttta atatagtatt 21480 gcatatttag atacaaagga aaatagtacg tgtaaaaatt aaataatgta gacatatttt 21540 tccttgtctg gttttcttca tcccatgtaa aaatccacct aactttgatg taggtttttg 21600 tcatgttcca atatacgtat aaagtttttt gttggtaaaa atttacgtat aaagttgttt 21660 cattattttt tcttggagct tcgaataact tttattgact taccaaaata aaatcttgag 21720 tgattttaag gtgaaaacta acatttctgt taaacagtta ttattttttt acatcgttaa 21780 ataattatat taaacattgc atatggttat ttgatatacc aaaatgtatt atttataact 21840 gagactatga gaaacagaat agatgttaaa tgcattactt gtaacctttg gcatcatctt 21900 tgctatatac tcgaattata ttatattaag tattttattg gtctttaaca tttattttaa 21960 tcctgttcta aattgtaatg tattaattat tatttttata tttgtttgtt ttttttttct 22020 cattgtgttc ttttcttaca tatgttttag attaaatatt tttagcatgt attttaaaaa 22080 acctgccttt ctaaaattaa agttatgttg aaccaaataa agttatatat gtagtaaatt 22140 aaaatatact taaagtataa attaaatata atatatatta tttaattgtt gtttaatcta 22200 ttgtgtttgt tatagttaat aatccacatc taacatattt ttaatgttgg tgggaaaaat 22260 aaccttacac atgataaaac caattaaata tgaagtacat gatatcaaat gtgccaaaaa 22320 ctatcctgaa aaactaacat taatcaaaaa ctaaagtaga ttatcttaag tctttactga 22380 tgaaaaaaaa aaaaaaaaaa aaaagtcttt actatatggt acacgaagct actcttctaa 22440 aatgattttt ttctaattaa tatcacttta tgaacaattt tagtttactt attattgtat 22500 tgttttctac tatatcctca aatctaagtt caactggaat ttaattttaa tgaatctttg 22560 tattttttat tttatttgcg ttggcaaatc ctcctgttaa ttttttttta atgtatattt 22620 catattctag taaataactt ttagttccac tcattggtca atagaaaaga aatatttatt 22680 taggaagcta agacgaaatc tgaaccatgc aacaaaaaca aacataaagt cattaaaatt 22740 cagagacaat ttataagtta atcaacatgc aatagaatca gcaatataac cttggcccaa 22800 caccaatggt gatgggagtg atctgcttca ctacatccgg agagcctgct tgcgtacacg 22860 gtgtgaaaat tttcccatat gttggttcct taattatata taacaaaaaa aacatgcagg 22920 ttcctcattc gttagcgtaa gctttgcagc cacatatgat agatatgtca accaaatgtc 22980 aaactctgac caaattcgtt tctaaagcac ataacaatta agactggaaa ctggaagata 23040 tatattcact atcttacaat gactttcata aggtgctcac ttatagaacc aagtgtaata 23100 taaattactc acatatatgt cttctactca catattctca cctgatccct gagcaggtgg 23160 tttgtattga tctagcagtg tgtgtgaaac tggatttggt tggttgagtt ggctgacttg 23220 agacgtctct cacggataaa ctttggcttt gttccaaatc ctattttgta attcatcaca 23280 caaacctatg aagattgatg gaaaaactat catgaaatat atcaattgat gaaaaagtta 23340 gattaatctt accgtaatac atttgaatca gattgaaata gatatatccc accatataaa 23400 ctaaacacta agctgcgtcc cctagcttct gactcctagt gacaataaca aagggaagac 23460 ataagatgga cattcatata gtgaaatctg taactatacc aatatcaata gcttcagaaa 23520 ccatttgtag ggtctgtgga tcatatgtat ttgcagctgt taaagatagc aagatgattc 23580 catggaccac aatcagcttc tggctcactt gtgctccgat tttctcacaa cttttagccc 23640 gtgaaccata tacgtttgtc ttaattacta tatagaacaa agaaaatcaa tatctgctaa 23700 aaatatattt tctttttctg ttgattatgt tctaatccat gtatttttag tttataaacg 23760 ttgaatacaa gatatcttca tatcctaggg atgcttatat aatgcatcct caatgttaat 23820 ttaaataaac aaattagaga gggaagtaag gcaaacgttt catgaaaaaa aattgtagtc 23880 atcgcatacc tcttgtcaat cttccagatg caaagtagat ctataccagc cattgatctc 23940 cactgttctg cgcaagaata attgactcac attccaacac tgagtcctct caacaatacg 24000 tagaacaaag aacagttcct atgggaaagc ataccactta gaacattatc acgttagttt 24060 ggcattaatc actttgttac cagcacgtgg tgctttactt acctcaactt atatctttta 24120 attcgagaag tcatctgtga aaggttgcaa aactgtatga ccagctggca tctttgtgtc 24180 gaaaagtgtt tgtgggaacc gtagaagttc ttgctgctca ttctcaaact tggccagttt 24240 atgcaaacca attcccctga atatccacca taactaaaga gttattttgc tattttagct 24300 cttccacgga cctagaagtg aaaccacaaa ccataacatt gttcagaact accaacctat 24360 atagtgcaaa ggtcctacac atccttggta ttatagtcga attcaaaaca cgcaccgttt 24420 cattctgact ctgaaaggga ttcccaggcc tccactgcga accagataca ctatttgagc 24480 ctgagatttg tgtctttgat atcaaagttt gcttaacaca tccaaacagt gctcacctcg 24540 gaaatctctt tctattatga tcatcgacat caagaaggaa agatcaatca gtaagggttc 24600 taagcaattt cagatataaa cagaaacgcc agtggtgttt agatttaatt tagaaactac 24660 tgaatcagaa aagcgattat taagttaccg gcaatggagg agcaacaacg taaccaatat 24720 tggaggccat ggcgggaatt tgtgttctga aaattgtcat cgtctgtgaa gaaacattgg 24780 attttgagtg tagccgtcgt ctatatagtg aggatggcga gaaggatgga aaatgaagag 24840 gcttcaatat aatgtcaaga aggcttaaaa ggatttgtac ggtgaaagaa aaagagatga 24900 agagctagat agttatggtc tggttcaaga gaaaacgaat ggaattgatg aaacaaagat 24960 aaagaaaata agaatgtgat gatgacgtgg caataaactc tgacctaatc ggttgatttt 25020 ttaatctgag ctggcatcct ctccattcag catatctgct ttttagtatt gttagattat 25080 aattaaattt aaaattaata aagcatattt agtaaattta aaagttgtaa aaaatattat 25140 aaagatatca cgtacaatat cattttacat aacattccaa atatcttatt tttggaaagg 25200 attctgattc aatctggatc ccgcataata agcctcagcc ctgttcctaa caagaaaggt 25260 ctggaacgaa cgagggaagg aggatattta gcacgagtag cgctttttaa gtcggtccac 25320 ttattacggg atttttactt ttggcttaca aactcttcat caaaccaaac caaaccaaac 25380 caaaccggta agcaatgtaa aatccagtgg ccaaaccaaa ccaggttaaa cagcaatttg 25440 agttacaacc aagtgtcggt ctcggtctca gtctcaggcc catattttat ttcatcagcc 25500 gttagctttg acatattatg actaatacga ctggacacag attggatatc cagatttttt 25560 aagatatttt tgatttgatt cgtatgttac agatatctaa tttattgatt tgctttgttc 25620 caaaaaaata cggatattcg gaaagacgga tatccgaaaa ataaatacat agttgcggat 25680 atttacgaat acctacggat atctcatcca ttttgattaa tacaaacaat cttaaaaatt 25740 cgatacaaat ttgtatttaa aaatattttt tgcatgatat ataaaacaaa aattaaaaga 25800 aatagtgaaa ctatatattt ttaaaatttt aaaacttaat taacaattat aataaaataa 25860 aacttaagaa aaaattataa ttgttataat tatttctcgt atattttatg taatactttt 25920 atataagtaa taatgtgaat aaaatttgtc aaatcatatg ttagaataat aattatataa 25980 atacatttaa aacttttaag tataatcaag atatacatgt atttatatat taccggattg 26040 gagcggatat ccgcttccca aaattttaat atttgtgatt tacttcgatt ttaacggata 26100 ttaattttag tatttgtttt ccttcaaaaa tttacggata tcactacaag aaaacataag 26160 tttaacgacg gtggttttcc tcgtgagttt gtcgtaaaag agagtttacg aggaattagc 26220 gaggaatcac gtttcgtcgt tatatgttcg tcgtaaatca tattttctcg ctaattcgtc 26280 gtaaactagc gagaaaacca tttcgtcgta aagacgaaga aaacaaatcg tcgtaaagac 26340 cacgtagata gtccatgtaa gaatgtcgct agcattcctc gtaaatacca cgaaagcatt 26400 tcctcgtaaa cgacacgtac atatctcgaa aatatttcct cgtaaaattc acgtaattac 26460 cttgaaattc tttcctcgta acattcacgt aaataccttg aaagtatttc ctcgtaaaat 26520 acttgtttac catttctcgt gatttcctcg taaactttca acgtaaataa atcgtagatt 26580 agctacgaat ctacttcgtt ttattgtttt acagaattta aaaatataat taaaaaattt 26640 aaaattatta aatttattaa taaaattaaa attttaaaaa aatacgcaaa tattttatat 26700 ataaataatt tttgaattta taatacaacc acgggaaaaa aaaagaacta agagtcgtgc 26760 atcgcccgga ggaattcatc actcctcctg tctacatcct cctcggcatg tgtgtcgtcg 26820 gatggttcct cgcctgaaat gagattttgt tgtcgcatgt tcctcaacat ggtctcccat 26880 tccggatttg tggccgctat aacgtccaag aagctctcga gtccacccac acgagctctg 26940 aacgcagatt gcttcgaagc caactcgtta tgcagctgag tgacttcatc atcccgtcgc 27000 tgaccataag acaatgtcgc tctcggaaca tcgttgacgg aaccaatccc caacgtccat 27060 cccttttttt aaagacaatc ttaaaacaaa aaataaatat tgttagtaaa aatttaaagt 27120 taaattaaat gaataataaa aaattaaaat tttagaaaat ttacctcctc gtaaatctta 27180 tccacttcaa gtgtggataa ggtgacgagt aatccgtcgg tggacagctg gatctggtgg 27240 tcttcaaccc gagcaaccaa gtcgttgtag atttgcttgg acttgccatc tagaaatacg 27300 cctgccttgt tcttgtgggt cctctcgtaa agttccataa gagacgggag atgtgccgtt 27360 tctttggcct taaaaacatt taagaaagtt agaataaaaa tatatatata tatatatata 27420 tatatatata taataaatat atatatatat atattattat ntntntnttn ttttattatt 27480 tttttttttt tttttttgaa gaaaacatat ataaaccgaa atcgaatata tacactgcga 27540 tgcaatcaca cacttacaac acccaatttt tccatttaca cctctagaca cacaggtccg 27600 tgtctaacca cctaaatgtt ccgatcctac ctaaacagtc ggatgaacca tgtctaccct 27660 aatctctcca ttgtttttgc acatgtatgc acatataatc agtgtgtaag aatgcatgga 27720 gatgaaataa aagtgtacgg tgtaggtgtg gtaccaaact attgatgagt ctggccattc 27780 aggattatta aagagtggta aaatgtggta aagaaaatcc tgaatgtgta tatggtgtac 27840 cgtttcctga tgttgattcc tggtcaaaag aaattaaatt cattaatggt caaaattatt 27900 tgagtcgatt acaattcacc gagacttgat aaaagattta aggagaggtt gcttggtcaa 27960 gtagttcctc ggtttgtctg cgctaacagt cctgaaaaat ggtcaatatg aaatgtaata 28020 cacaacacac aaggaaatag tctaataatc atcacagggt ctgagaaaaa cacgtagtag 28080 tttttt 28086 <210> 5 <211> 10653 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 5 aggtcgagta tctttgtagt ggtcgagttg cgggcgatca gattgttctt atttgaacca 60 agagtcaaga atgccactag gccatggttt gacaatgcct tagattgatc agatggatgt 120 tttggaacca agcacgacgg aatagaagca cgacgggaaa actcgaaatt ggacggaaac 180 cctaatttcg gtattatgga agtttctgat caagccgaag aatcaagaaa tatttaccgc 240 caaggtcaga gttcagattg gagtttatta aaaatattca gctcatcaga atgggagtag 300 aaaaatattt gggattgatc gcgggtcaga aatttaccgg aatgaccgaa atcagaccaa 360 tggaccgaaa agctcgaggt ggctcgttgc atgggttcag aacgtggtgt aaaccatcta 420 acaagctgag tgtctacaga agctcgaggt gtcatcgtac atggaagttg tacatgcagc 480 ctgacatgta gaagcacgag gtggatcgac caagcacgag gtggatcgac caagcacgag 540 gtgtctccgc gcatgcaacc gaagcatgct gatcgacatg tgtgtgctgc tgtggcgcct 600 tgcatgagtt ctagtcatgc agcctgacat ctgggaggag tggtggcgtc ctgcatatgt 660 cctggacatg aagccagcca tgtggagcac gaggtgccgc cgcgcatgtg tccggagcca 720 tgcgaagcga cacacaggct gccactaacc tgaagctgat tggttgctgt cttctataaa 780 tagcccacga ccccagctca tttcatcaca tccatacctg tacaaaccac cttagaaacg 840 tgagagaaaa gtagaaaaag aaagcaagag tttccgatct atttcgagaa ttttagagag 900 attgcgaggt cagttctcta ctgatttcga gtcagcgcct agggacggtt ctgtccaact 960 gaattcgtcc agaccactca gttcctttga tgatcaacta gatatgctgt ccggagttag 1020 ttcagttcta cgggttcaga tcagtcgaag ttttgctcga tactccgccg ggaagtccga 1080 agaactgtcc agaagctaga ggaggttctg tccgagtcca tatcagcctg tcgaggcctg 1140 tcagtttctt catggtgaag ccgaggttgt gtccaagaca agatcagtcc agtccactcc 1200 agtcatgtcg tcaattgggt tttggccaag tcttctccga tcaaccagct gcttatcagc 1260 aaagaacact gtgagttatg atcaattgat tgctgacttg ttttcatgca ggttcccgtt 1320 acttagaagt tggatcatgg caggaggtcg gctctaactg agtcacggtt tgactagtta 1380 ataattgagg ttatgttgat tgagttgata gcatgctggt tattgcttga gaaccgtagt 1440 agcatgctaa tggttaggtt gattggttag ttagcgaatg cggaatgctt agatgatatc 1500 gctaagttgt ggatagttag atattctgga attagttttt atgctagatt ctggaatatg 1560 attgattctg ttaatttgcg attaatacta ggaaccttgt gttattttac cgggtttagt 1620 attagtcatg tattggccat atagcatttg tgtaaaccac aatgctatgc atgtttgagg 1680 tggattagtg tttcctcgac ctcgtaccca gcgggtttaa ggttactctt ccaactccgt 1740 tgtccttttt gcaggtcgct ttaggtaagg atgatcggat agcttggtgc tcgacgttag 1800 gaccgccgga gtagatttca tgccttttgt aaacggtatt gcgttatgtg ttttgttggc 1860 tcgatttggc attaggccgg gcccagtctt gaattatttc aatgtatgga tatttcttga 1920 atcaataaag taaatgtttt atatgcgctt catgagtact ctgatatctg actagtccgg 1980 tctaacacaa cgttaggtcg tggtacgggt tgaaaagcct taggcctcga tctaacggaa 2040 aacgctaact ctaggtacgg gttgcaaagc cttgtgcctt gacgcagcag gacgagttag 2100 tggaggaact ggtcgaggtc gtggagtaaa ttttgtgact ctggccggat cgtccctagc 2160 ccgtcacgta gcgcttccgg accatggtgt tgggttggac ggtcagtcat gttcttgttt 2220 gattgttggc tggccgattg gcctttcatc tccaaccctt ggtgtgggtc atccgtcggt 2280 catgttcttg tttgattgtt ggccggtggg tcgacctata cctaggacgg ttcgggggtg 2340 ttacactaat catgtaagct cattcagaag aaagtttata gtttttttat atagatttta 2400 gttttagcag gcaatgttca tagattttct tgcaaaacct tgtccacaat acgttttata 2460 cttcttatcc acaatttatt ttattttatt ttaaaatatt gatttttatc caatatttct 2520 cagaagtgct tcggactcat cagatcactt tccgataaac agttccgaca aaatttgtta 2580 atggaacttt tcacctaatt gtagaataca aaatcttgtc cacaaagtta aattaagggg 2640 gtgtattcaa tttaacattt tatgtgattt gatttttaat gggattttag atgatttcaa 2700 taagttgcag agatttatgt gagttttgtt aaactactct agaatatcat ctaaaaccat 2760 gagatttgag ttttaatttt ttttaactaa gaaactctac ctaaacaccc taaaatcatc 2820 tgaaagcttt aaaactccac aacttaaaat attttcaata acaatggatt taagagtact 2880 ttacgaaata tcaaattcaa taacattgta ttttaaatga gtttttaaaa ttcatgtttg 2940 aataacagtg aatttgttat tttaatacaa atcacctaaa actagcagtg gaatacaccc 3000 cgcctaaata ttcttttgtt cccttaattg tgttctcgtc tataactcat tcttgtaaca 3060 tttgtctgta cacaacttac atgtccacta tttttgtatc cataatgttc gcctgtccac 3120 ataatgtttg tctatccacg taatatttat ccaactgagt aaccataaca tccttacatg 3180 gacacgaaag catcaacaac cagcgaacat gtatttgtgg acatgataga atccacatcc 3240 atgaaatatg gatgactgta acttgctaaa ctgttcattt taatgtaatt gttggattaa 3300 cagttttttt acgatcttgt ggtccttatg gaagtccaac tatcaaaaaa cttaatctaa 3360 taaatgtcta aaagctaact ggaaaaacaa cacaaacaat attccaactt tctgtttcgt 3420 ttcagtaaga gcaaaatagt ccaaaaactc tctcaatttc cgtgaatgta tgtagtgctg 3480 ggttcgcggg tcaacccgcc ccgacccgcc ccgccccgcc ccgggtcgaa tcattttttc 3540 gattcaaaaa ctcgacccgc ataacccgca aacaaaaact tttatatccg cacccgcccc 3600 gccaaaaccc gcgggtaacc cgccaaaccc gcgggtaata ttaattatat taaaaatagt 3660 tattttaatt aaaaatgatt attttctaat tatataataa ttattttaat taaaaataat 3720 tattttttat ttatataata gttattttta aaaaatacta ttaaaaaata tatttataat 3780 taaaattata caaatattta ttgtttttta tatattttac gaaaaaatgt tttttttcaa 3840 aatttttttt tttttaattt tgcgggttgg cgggtacccg cgattcaaat tcggctgacc 3900 cgcacccgcc ccgctcaaaa taatcttgac tcgcacccgc acccgcgatt taaaattttc 3960 aaatggttcg acccgcaccc gccccgcggc ggatcaaatg gggcgggacc cgcaggcaat 4020 gattaaaatt tccagctcta aatgtatgct acaagtggaa ggtagttttg ggtgcaaaga 4080 aaacagccta ttaagtaatc aactctttaa tatattggga cgaatgagat gtttgtaaaa 4140 ttatttaggt ccagatactt ggcgcaattt aagaaggctt ttatatattt gggccgaaaa 4200 ggttcgccca ttacttaaaa aagcgacaac tccgtgacat attgttgttg tgctgggacc 4260 caaaaacggc gtgcattttg tcgactttca gtggaactgg ctttttcttt ctgtccaaat 4320 caaaaaagtt ttaaagatcc ttttgattgc aaccagagaa aaagataaca aaacttccac 4380 tttttgtaac gtaaatacat taataaaaaa aaggtttcac gagtacattt taaacttaaa 4440 gcagaaacaa ataagtaaaa gagaaggagt gtttattcct aatagagcta ggaagaaaag 4500 ttaattgatt ttagatttgt cagaagcata aacgtagaga tctggatctg tctcgtagaa 4560 gacaatatca ccagtgtcac tgacgtaatg atctttttta atacttgcga ccaaactctc 4620 caccaagtga atcggtattg ctcctgacgt cttcggctct ctgtagtatc ttcctaacac 4680 atgtttagct gctctcgtct gtccacaatt cattaattaa attagtaatt aatcaccatt 4740 taatcaaatg aaactagaga gagagaaagc tagatcactc acggcatcga ccaagtgata 4800 gtgagggatt tgtgggaaaa gatgatggat cacgtgagtt ccaatgtcgt gatggatgtt 4860 gttgaagatt ccgtaatctc tatcaatagt tgttaatcct ccacgtaaat aactccattc 4920 ctattattgt atgcaaaaca tcaaaaatta agattaatca atactaacca ttattgcttt 4980 ctgtacattt ctttttaaaa attgatttaa ttaccttgcc tctgtaccaa ggcaacttct 5040 catcgtgacc atgatgatgc aagtacgtga cagcgtccaa ccacatcaca aagatctgaa 5100 aattttccaa acccttatgt caaaaaacaa atttattatt aataatatat aaatttcttg 5160 taataatatg tgaaacttac aatgtaagga acgccataga ctttgagaac tgtgactgga 5220 tcaacgagga acgatagata aacaagagtg gccaacatta tggaccagca agtagttgaa 5280 gttgcaataa gcttcctctc gcttggagca aataaactac tgtatgggtt aaaatgtgac 5340 ccttcttttc caggacttct gtaccactgt agttaaaatc caatcaaaat taatttatat 5400 attggcttaa aactcaaaat ataaaatcat ttgtaatttt aagaaaaaat agaaattgta 5460 ttttttttac cagatagatc gggtaagcga gcatgggcag agggacagtg tatctgagca 5520 tccgagtact atggggcaag ttcttgtaca acttttctgg caactgaaat acataattat 5580 aattaatatg actattacta ttactattac taattactat tacggagtag tacttactag 5640 tattaaatat tcattgaaaa tttgtcattc tggttatgta ttcgtattaa ttcatgtgtt 5700 tataagtttt atactaatag ctttcaagat tgcagacaaa agtattacga aaacgccaaa 5760 actgaaaagg aaaaaataac gaagaaagta aacggatttc gaggagaatc atgttatgct 5820 aaggactcga atataagtgg tccatcgata aagttaggta ctataaaagt atagattttt 5880 cattttctga gttactgcgt aacctctaaa aaaaactctc taaatagagt ttactctaaa 5940 tttaaagttt caaagtggtt ttcttcgaaa acaaacttca aacataactt caaaattatt 6000 tgtattttac acaatgatcc ttatttgtta taactaagag catgattaac ctgggattct 6060 taggatgggg ttcttaccgg aagttaagaa actgtttctt aacgtttaac taaaactcca 6120 ctctaagaac tccgggttaa tcatggtcta atataaatcc ataaaaaaaa ttataaataa 6180 ctagcacata tataaaaata ttacagtaat attaattaat aaaaatttac attaaatata 6240 taaaattata aatagaaata tataattaaa tattaaacta gaagcaaaat accatattat 6300 ttcataaaat tattttcgta atgctccatc ttcggttaca caaaatttgt ttagacaata 6360 attttagagg ttccagagca aatttaccag attattagta ttgttataat atttaaattt 6420 tctaatagtt atgtcttcat gtatcttatt ttaaattttt tattattaca tttcttttgt 6480 aatattttgt tgactaatta tagtcttaaa tattataaat cttatttaac atttttatta 6540 cttttatgta taaaatttga atttataaaa acaaattgga aatatttata atatataaaa 6600 aatttaagaa ttaaaacgat aaatgaaaaa atacttaaga attataaatg taacgtgtaa 6660 ttaattataa tgatcaaaat gcaaaaaaaa aacttcaaat ttgaagtttc gaagttcatt 6720 tttgaaaaac aaaaaaatct ttatatttga agttataaaa tttttttttg agatagatcc 6780 gagaacatta attaccgctg aactattaca cttgcaaatt gttttttact acagctagaa 6840 aacagatctg acaagtggcc ggtctgacct cagactgaaa acataaacta ataaaataaa 6900 catatagaat cctaggagta tgattattgg ggtttttagg aagaggttct tagcggaata 6960 taagaacccg tttcttaact tttaactaaa aaaattaaga acgtgttcat aaaactctta 7020 tttaaaagct ggttcttagc ttttttagtt aaaagttaag agacaggttc tcatattccg 7080 ttaagaaccc caccttaaga acttcaataa tcataagaac ttagacataa gaatgaattc 7140 ccaaaaaaga acaaataaat aaaagacaag agaaacaatg agagtaggaa agattaccgg 7200 aacccaagac tcgtcgtttt caacatggcc atggttctgg tggtgtgtcc gatggcttat 7260 tctcctgcaa accccaatta caaaagttat gtatttattt atttttgtga aaatgaaatt 7320 gtctctataa tgatttaaca atctcactca ttttatattt attttgtttt tttagttgat 7380 atatttattg aacaactaac aatagagtgc tctaacaatc ccattctttt ttttgagcaa 7440 aaaaacattt gatgcttttt actaataaac attgtgcaga aataagtaaa aaaaactata 7500 aatcctcagg aaattgatgc atgtaagtct ttttcgaaga tgtttgaagc tgatgtaaac 7560 aaataacaat aagtgaaaac ctaaaaaaaa atcaaaatct aattatactt aatgaactaa 7620 gaaaactcag gaccatagat aggcgcatat catttaagaa aaggtttgga ttctttttca 7680 ttggctgcta aagatttgat gcttttgaac agaaaaagca acctcatata gtcacatgca 7740 ttgtttaata ggattcttat ttaattataa aattgctact ctagcaacaa aaaaaagttg 7800 gtagcttcca gttaatactg attacagttt cctagcattg cacccaagaa taacaaacga 7860 aaatgtaaga aatacgaaaa caagtactaa taatttacat ggaaatagtt aataaatgac 7920 ttaccaacca tggtaaggaa cgaggatgaa tgaatgaaga atgtgaccaa ccacactgtt 7980 cagcagagga atgtctgaga aactcccatg tccactgcca ttattcaatt ttattttcac 8040 atcattattt aacataaaaa cgtatttatc atttagtgca caatttattt taacttttct 8100 acatttgttt taactcaaac tctttaacaa ggtaacaaat ccggtatatg acgtgtcact 8160 tgtctaaatc acaaaataga ttggaacaca aaaagaagaa aaaaacaata tatttttctt 8220 gtcaaaaaac aatatatttg ttgccaaaaa aataaacagt atattttctt gatattatac 8280 tatactataa ttataattaa aagttccggg gatctagaga aagagaaaca aaaattgaga 8340 acatcaaaac gtagatccat aaaatgcgga aataatatta attatagaaa agaagatatt 8400 ttgttacgag tctgacgact gatgagtgac gatgcttgaa cattgatgaa gaaaaaaatc 8460 ttagatccta tattttcttt tattttttaa taattaaaca tgaaaaagta acctcaaaag 8520 aattaaatct tgaagtcagt gacgatactc atcgaacgtg cattcaagaa attaataaat 8580 tgaacaaaaa gagacaaaat aattaaaact gaaaatttaa tttaccagtc gtggccaaga 8640 acgaagatgg cccagaaaag ggttccttgg gcaacccagt agagtggcca gaggaaccag 8700 ctatcaaaat acacggcggc catggccaga gccgcgacgg cgaaaatgtc tctggcgacg 8760 tagctcatag atctcaaagg actcttcacc cagcaatgct taggaatcgc cgcccttata 8820 tctccgatct taaacggtgg ttgtgcgctt ggatcaaacc cttcttcctt ccgggcaccg 8880 gaatctccgt taacattgct gcgctggtcc atagcaacaa ccatcgctgg agagagagat 8940 ttggacgaag tttctctctc tagatgtgtg gcctttcagt gaaatgtggt gaataaaggt 9000 ttgatggatt ttttgggtgt gtgaggttgg cttatataaa gggagaagat gtatttatgg 9060 acattgagaa aatattccaa attgtttttt aatgattaat aatttatttt ttatttatca 9120 aaagaataaa aatggtaatt tagctgtaac ttttgtacaa tgggttgggt gtataatgtt 9180 ccaaaaaaaa gggttgggtg tattactctg ttacgtcgtt caacgcaatg aaaccaaatt 9240 ggagtaaatg tgtttctttt ctatttttag attttccttg gacggaagga ttgtaccaaa 9300 taaatttatt tgtgtttctt actctagaat caaataccat atgtagatgc agtgaaatgg 9360 aagacaaaca taacgatcct ctagcatata tattttgttc cctaaaattt tgttgattat 9420 ttattgacta ggataagatc accttgggcg ggatagacat cgtttatata aagtggttaa 9480 gaaaatacat cgtgtatata aattattttt acatattacc atttatttta catgaaataa 9540 taaaataata aatatatatt aaataaattg aaaagtctat aactattatg tatataatta 9600 agttggtgta aacacataaa tcaaaacaaa cactcttttc tatttaaaat aatattgaga 9660 taaaaaaatc taaaaaatca attatatcta tggtatataa ttaaatttaa atgatattaa 9720 catatagaag tatattttaa aatatctatc cgttaaataa tgcttcatac tcatatagtt 9780 ttatgacaat ttgtattttt taaactattg aaaataaaat tttcaatttg atacttttaa 9840 tagttttagt aatttataac tgtttttaaa aattcaataa aaaatttgaa attaaaatat 9900 taagttctca atatttcttc aatggaaatt tcaaattaaa ctattatgtt cttatatggt 9960 atatagttta atttaaacga tagtaaaaac atatttttaa tatgaaaata tattaaataa 10020 gacattttat tcatatgatt tttatgatca tttatatatt gtataacaaa aaaatttaag 10080 ccactgatca caaaattttc aatgtaatat ttttaacagt tttagtaatt tatagttgtt 10140 taaaaaaatt caaattataa catataagaa aaaatctaaa tttttattct atgattaata 10200 tgattgttta atttattttt taaatataaa acaaaaaata atagaggaaa cacaaattgt 10260 tatcaatttt ttattattca aaatcactaa ttgtcatata tatattgatc acattaaata 10320 attttgtagc ttttattcaa ggaactaaat aaaaaaaatt ttggtacatt aataattagt 10380 tttgtagtta ctttaatgag aactactgtg tatatttaga ttgaccaact tatttctgta 10440 agtaatccga gaaccattct agtgattaga gatgacaatt atggatctgg accgcgggcc 10500 tggcccgtaa aggactgtcg cgggacggta ttgggacgag gttttctagg cccgaaaatt 10560 tgcgggcttc gcgggacagg tctttacggg actgggcctt ttgcgggatg ggccgaaacg 10620 ggtcttgcgg gattacatgg acccgcattt ttt 10653 <210> 6 <211> 23648 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 6 cccattcgaa aataaacatc aaacccaaga aaccctagaa acagaaagac accgtcgcca 60 tcgccttcaa agaaatataa aaaattatat tttatattcc attaaaaatt attgaccaaa 120 aaataaacta ttaaaatttt aaaccgctgg tacgtacatt gctaagacat agattaatag 180 atgagcaatt ttccaagctt atctcgaagc cttggagaag taagttgaag agatgaactc 240 agctacggca aacaacaata ccactacatg caatccaaga gtcacctcag aggttcaaat 300 cctaaaatag cagagtacat ggtactccga agagaaaatt ctgccttgac cgtagctagg 360 ggaactagac gaaggttctg aacccgcaat caacccatgc aaactctaga tcgcccgctg 420 tgacatgaag cataactctc taaaatcatg tgggaactgg agagcatgcc atagatgctc 480 aagccacgaa tactgatcgt gcaaacttac atttggacaa cgatggcaca gacacggaca 540 catgtgcata gatgcatgaa actttttgaa tttttttttg aatttttttt ttgaaactat 600 tttttagctc taggagacta tatttgaaat atttagatga aatatttagg taattttaat 660 ccttgaagac tatatttgtg acaaaaggtt ttttagggtc agtctagaaa atttattttt 720 ctttttaacc tttgaaattg tatgtttttc agtgtataaa tggattaata actaaagaag 780 agtttcacga gtacattttt aacttaaaaa caccaataaa taagtgaaaa aagactggtt 840 tattcataat agggctaaac aaaaaggggg aagaaagttt aattgatttt cgatttgaca 900 gaagcataaa cgtagagatc tggatcagtc tcgtagaaga caatgtcacc ggtgtcactg 960 acgtaatgat ctttcttaat acttgctacc aaactctcca ccaagtggat cggtattgct 1020 cctgacgtct tcggttctct gtagtatctt cccaacgcat gtttagctgc ttttgtctgt 1080 cacattccat ttgttaaaat cagtacatta gtaattaatc accctttaat gaaatggttt 1140 agatgaaagt agcgagagag tgagatgact cacagcatcg accaagtgat agtgagggat 1200 ttgtgggaaa agatgatgga tcacgtgagt tccaatgtcg tgatgaatgt tgttgaaaat 1260 tccgtaatct ctatcaatag ttgttaatcc tccacgtaag taactccatt cctattatta 1320 atcacaaaac atcaagaatt aagattaatc aaatactaat aatttttttt tgtgaaacat 1380 cgtaatctct ataaaatatt atttgagaag tcggttttct atgtatcgct ctcacgttaa 1440 ctctcacgat agttgattac actaatacac ttaatgaatt aaaaatatta catttaaaat 1500 actattattt atttttttat ttagtttcct ttttaaaatt ttccaaaaaa acatatacat 1560 ataataaaaa ggaatttttt tataaactta aaaaattata ttttacttgt ataatattaa 1620 tttcaaatac aatctcactt ttgttcactg cttattttta agagttatta aaaaactaaa 1680 attaaaatta aaaaataatc attgtttgat caaatagtta caaaataatc acagttttta 1740 aatgttatgt ttttatgttt gtagaactta atggaaccat aagcaaaata ccaaagcaaa 1800 tatgttttca tttttaagat tatttaaaat aaatttcagt ttccattcaa taaattaaat 1860 acataaagtt atttagaatt tataaaatat tttaattact gtaaaatatt aaccaaatgt 1920 tacaatttag ttcttttgta aaatttatat atatatatgc atgagacttc agaatattat 1980 cgttatatta atttatgtaa tttagaatca gacactttat tttatttttt atttcatttt 2040 aagcacaata tatatattaa gttatacata atctttataa aatatattta aagttctaag 2100 acaacaacca cctaaatgaa aataagaaat taatcaaaat tttaatatag ttaaaataaa 2160 aaatattaca gttgaattct gagatgcaat ccaatttacc caaatgataa ctaaatcgac 2220 tgtaaaaaca acaaaaccga ttagatataa catatataaa atcatattta taattaaagt 2280 aatataaatt ttattaatat aaatcatgca tacaaattat aaactaattt aaaattaaaa 2340 ataaataaca attaattatt atagtatatt tactttagaa atatttatat ccgtacatga 2400 gcacgggaaa atcacctagg agttaattta attaccttgc ctctgtacca aggcaacttc 2460 tcatcatgac catggtgatg caagtaagtg acagcgtcca accacatcac aaagatctga 2520 atttcaaaag tttatgacaa aaacaaatca tatagtatat atattgaata ataaatatat 2580 accctttatg atatactaag aaacttacga tgtaaggaac accgtatact ttgagaactg 2640 tgactggacc aacgaggaag gaaagacaga taagaatggc caacattatg gaccagcaag 2700 tagttgaagt tgcaataagc tttctctcgc ttggagcaaa taaaccactg tatgggttaa 2760 aatgtgaccc ttcttttcca ggacttctgt accactgcag taaaaccaaa gaaaaaataa 2820 tttatattgt tttaaaacac aatctaaaat gaattgtggt aagttttagg aattaaaaaa 2880 taccagatag atcgggtaag cgagcatggg cagagggaca gtgtatctga gcatccgagt 2940 actgtggggt aaaatcttgt ataacttttc tggtaactga aaggaacaat taaaatgaat 3000 tttagtaatc aagattaagt acttgcaaaa atagtactta gatatgtatt gatatatata 3060 ttcattgcat gctatgtgtt tataaacttt tgtttttatt attttttgtt agttttcaaa 3120 acacaggcaa actattacga aaacaccaaa ttagagaaag aaaataataa tagtataaaa 3180 gtaaatgcat ttagaggagt aagaaactca aatataaaag catttgcatt agtgagtttt 3240 tgacgagatt ttatcacaaa ttatattata ttaatttata attattattt ttgaaaattt 3300 gaaaaattta taccaaaata ttttatttga aagactttca catgagtttc gcataaacat 3360 gtctttcatt ttttttaaaa aaactcttta attaagtaat aataaacttc ttccgtttca 3420 atttaattgt cgttgtaaat taaaattttg ttttaaaata agtatcgttt tataatttca 3480 atgtaaaaat tatgaataat attttctagt ttatttttta ttggttaaaa tattgttagg 3540 tgtataatta gtgatgtttt tattttaaaa atggacaaaa tattttattt tttgtaatct 3600 atgtgtataa atctaaaact gtaactaaaa taaatcggag gaagtaatta gaagattcac 3660 cgatacaaat aggcgtggtc cgttgtcaca tactattatg tatattttat tttacaaaaa 3720 tgttacttct ataaatcgct aaaaagaatc aattaccggt taactgtgac actagcaaac 3780 tgtttttact acagctagaa atcaaatctg acaagtggtc gttctggcct caaatttcga 3840 aaaacaaatt attttgacaa agaaaaatag aaattattaa agagggaaat gttaccggaa 3900 cccaagactc gtcgttttca acatggccat ggttctggtg gtgtgtccga tggcttattc 3960 tcctgcagcc tcaaattatt aaatatgtgt ttacataaaa attaaattgt ccatggaggt 4020 gattggttgg gttttatcta cctactttag ctttattttt ttctaaatca ttaaacttta 4080 ccaatcatgc tttacgttta cttttcaaaa ttaaagtcta catcaaattt ctattaattt 4140 ttaccaatca tgctttaact ttaaaaataa agctacagca aaaaaaaaac caaacatttt 4200 tcttatgtat tttagttaaa caacttacat ctttcattta taagctgtag aaactgtaag 4260 aacaaaaaat atctataata ttaaataaat aagataatca taataaaaaa acatctataa 4320 atattttact ctaattttgg gtgcttttaa attattgaaa tattttaaat aatatagatt 4380 atttacatat cacattttaa ataacagtaa actttgataa ttttaaaaaa tattaatata 4440 aattatttta agtgataaaa ataataatta ttttatatat acatgcatca catattttac 4500 atattttatt ttaaaatatc tgcagcctat agcttacagc tacaacaaat ttaactacag 4560 caaaagtctc tgcaaaaata atcaacagta acaactttac aactacaacc aatttatcta 4620 cagctaaaat tctacggcca cagtcgaacc aatcatcacc tatatagtgt tgctttcatg 4680 gcagattcta acaatctcac tctatttttt ttctcttttt ttttgatcaa acaatctcac 4740 tcttttaagt tttaagttac tagtaataaa ttgaccaaaa atagtttcca gtaataaatt 4800 atttttattg ccaggaataa gttacaataa tgtcgcagca aaataatgca tgtaagtcta 4860 ttttcaaaga tatttgaaga tgatgttaca tttaccaaac aaaaaattat gatgttacta 4920 caggaaacca tttttattgg aggtttgaag tcagtttctc aatattaaaa atagagaaat 4980 agaaaagaat aaaagataaa aggagtaatt tcccaataaa caaagtcatg aataattctt 5040 caaatatcta acctttaata attggtttaa tattatttat aaaatgaata tttaattata 5100 aataaattag ctgttgttca aaaaaaatta taaataaatt atattcaaaa tactaatgac 5160 cagatatagg cccattgcat ttaataaaag ttttgattcc tttttccttc gttgctaaag 5220 attcgatgct tttcgtcaag aataagaaaa gctacctcac atatatagtc atactttcac 5280 atgcattatt taattataaa attggctcta gccaaaaaaa aaaagaacga gcaatgaata 5340 gattcttgca ccaagtaatt catttaacat ttaaaccaaa aaaagtataa caaatgaaag 5400 tttaataatt aataataata ataaaaaggg ttaataagtt gacttaccaa ccatggtaag 5460 gaacgaggat gaaggaatga agaatatggc caaccacgct attcagcaga ggaatgtctg 5520 agaaactccc atgtccactg ccattattca attatatttc acatcattat tcatcgtaaa 5580 tatagtatat catttattgc actatttatt taaactttcc atgtttgttt taaaagcttc 5640 aacaaggtaa tgacgtgaca catttctaaa tctcgaaata gattggaata caccaaaata 5700 acaaagaaac aatattatct ttcttgtttt agaaaaacaa tagatattct tgattttata 5760 ctttaattat aagttgagag atccataaaa tgcggaagca gtcgtaatta tagaaaataa 5820 agatgtggtt ttgtaacgag tcgtacgacc gatgaaaggt ggtggaacaa tgatttaaaa 5880 agaaaatcta aaaaaaaaaa tcttagatct tcaaaaaatg aacatcaaaa gaatcaattc 5940 ataaagtact gacaatactc atagaacgtg cattcaataa atcgatgcaa tgcaaaatgg 6000 aagaaacttt accagtcgtg gccgaggacg aagatggccc agaaaagggt tccttgggcg 6060 acccaataga gaggccagag gaaccagcta tcaaaataca cggcggcaat ggccaaagca 6120 gcgacggcac aaatgtctct ggctacgtag ctcatagatc tcaaaggact tttcacccaa 6180 caatgcttag gaatcgcagc ccttatgtcc ccgatcttaa acggcggttg tgcgctcgga 6240 tcaaaccctt cttccttccg ggcaccggca tcttcgttca cattggtgcg ttggtccata 6300 gcaacaacca tcctgggaga gagagagaga gatttggagg aagattctct ctctataatt 6360 caaaaaaaag aaagtgtggg aactggaatg tggtgaagaa agggttcgat gtattttgcg 6420 gtctgtgaag tttgtttata taaaggggaa ggaagatgtg tagtctgtag acattgagat 6480 gctcaaactg tttttattaa ataattatat atttaaagaa taaaaagggt aatttgctgt 6540 aattttaaat gcaatgggtt tgttattttg ttacatcgtt ctattcggtg aaattaaatg 6600 ggaaattgaa ggctataacc acaaaaaaaa cgtaattcac cgtctagcca tttaacctaa 6660 cgatcttata cacgctgtta caaatataaa ataatactgt aatattccta aaacacaacc 6720 ggctcaacct gctacaaaaa aataattaaa tattttaatt attcaccgtt gaaaagtaac 6780 tcgtgtctta cccttgttca catcttcccc ttttaacttc tctggtaatt ttgctgcagt 6840 cgaacggtct ccggcaccgc tttcttccat cgcctccact ctgcatgcaa tcgacatctt 6900 ttccatctct tccgtcctct gttttcaatc ttcttcggcg ttacagttct tggttaaggt 6960 ttcagcgacg gtagtaagaa accctttcta cccaacttca ccacttcgat tcttgtcaaa 7020 tctctgaacc ttccgtaagt tctcattcta tttcgtagat tctcttcact gtgtcgtcct 7080 ctgtgcttat tttctttcaa attggggctc gtctcataat cagagtgtta taatttctag 7140 gtctatatca ccggcagatg tgaatatcga tcgtccccga tacggaatta gtctctccca 7200 ctttccaatt tgatttaggt tttggtgttt cccgggttgt gtgaggttcc ttgaatttga 7260 attttcttcg tagaggatat gcaacgtatt tagtttagta ctttatgtat ttcgtgtgga 7320 atatcattgc ttacaaaggg tttgtcgata atacatagta tgttattttg attctccatt 7380 ccatttggaa tgtaatagta cacttaccca attaagctat tccattgtgt aacgcatcaa 7440 ttcattcctt tgtttgtaat gtacttatgg agttgctcat tctaatttat ggttcccctt 7500 tatgttcttc ttctttctta atcgtgaatt gatgtttctg tatcagtgct ttttaaaaat 7560 agtgtatgaa tatcgactac cgtgtggaat atcgtctctt gtacatagtc tagaaattat 7620 gctttcttgt atggaatatc atctttatgt catagttgtc ttgtgtttta tttgcaacat 7680 tacatttggt ttatctacat catgtcacgt tgaataaaca ctacaagaaa acacatgctt 7740 aacgacgaaa attaacgagg aaaaacaatc ctcgtaaatt tgcgtcgaat ttacgacgaa 7800 tttacgtgaa aaactaaagt catccttatt tcctcgtaac gtaacgacaa aactgtttcg 7860 tcgtaaagtg gatgtaattt tacgagtatt ttacgaggaa aaactatttc ctcgtaaata 7920 cgacgtaaat tttgcgtggt atttacgagg gaatagttta cgtgtattta gcgaggaaat 7980 ttttgaatcc accaacttca taggtgttac acgttttttt tgcccaccta attaattttc 8040 gtcgtaaatt catagcaaaa ttacaactac cagattcgaa ttttcctata aatatggatg 8100 tttgaacatc attttaaaca caccaacaac aaaaaacgtg aaagaaaaaa aatggctggc 8160 tccgggacta tttacgagtt gcggaagtgg atgtatatgc atagagatgc taacgggaga 8220 gtgacgaaag aataccttgc gggtctggag acatttatgc atcaagcaga ttcaacaccg 8280 ctcgcccaag aaagtggtaa gatgttctgt ccttgtcgga aatgcaacaa ttcgaaactg 8340 gcaaaccgtg aaaatgtttg gaagcattta ataaatagag gtttcacggc aaattactat 8400 atctggtttc aacatggaga aggttttaat tatgatcaga atgaagctag tagtagtaat 8460 agcaattctc aggaaaaaga accggttgat catcatttgc ataatgaaca tagttaccat 8520 caggaggaga tggtagatta tgatagggtt catgatatgg tagttgatgc attcgtagct 8580 catgatgaag atgaagaacc taatataggt gcaaaaaagt tttacgaaat gttaaacgcg 8640 gcgaatcaac cactttacag tggttgtaga gaaggtctct ctaaattgtc gttagctgct 8700 agaatgatga atattaaaac tgatcacaat ctacctgaaa gttgcatgaa cgaatgggcg 8760 gacttgttta aagagtattt gccggaagac aatgtgtctg ctgattctta ttatgagatt 8820 cagaaactgg tttatagttt tgggttgcct tcggagatga tagatgtttg catcgacaac 8880 tgcatgatct attggggaga tgatgagaag ctagaagaat gtcgattctg caagaagcca 8940 cgattcaagc cgcaaggacg gggacgtaat agggtaccgt accaaaggat gtggtaccta 9000 ccaattacag acagattgaa aagattgtat caatcagagc agactgctgg aaagatgaga 9060 tggcatgccg aacatactca gacggatggt gagatggctc atccatcaga tgcaagagcc 9120 tggaaacatt tcaacaaagt acatccagat ttcgctagca atatccggaa tgtgtatctc 9180 ggattatgca cagatggatt tagtccgttc ggaatgtcag ggagacaata ttcattgtgg 9240 ccagtctttc ttactccata caacctgcca ccggagatgt gcatgcaacg ggagttacta 9300 ttcttgacca tattaatacc tggtccgaac catccaaaaa ggtccctgga tgttttccta 9360 caaccactga taaaagagtt gaaggatttg tggtcaacag gggtgaggac gtatgactgt 9420 tcaacgaaga cgaattttac gatgcgagcg atgcttttgt ggaccataag tgatttccct 9480 gcctatggga tgttgtctgg atggactaca catgggagat tagcttgtcc atattgtaat 9540 ggaacgacag atgcgtttca actgaagaat ggtaggaaga caagttggtt tgactgtcac 9600 cgtcgatttc ttcccattgg ccatccttac cgaagaaaca agaatttgtt taggcacaaa 9660 agggttgtga gagacactcc tcctccatat ctaactggag aacaaattga agcgcaaatc 9720 gactactacg gagctaacga aacagttcgt tggggtggta attggcatgt ccctcgtaat 9780 atgccagatt cttacggtgt tcatcacaac tggcacaaga agagtatatt ttgggagttg 9840 ccatattgaa aggatcttct tctgcgccac aacctcgatg tgatacatat agagaagaat 9900 ttctttgaga acatcatgaa tacaatattg aatgtcccag ggaagacaaa agacaacata 9960 aaatcgaggt tggacttgcc agatatttgc tcaagaagcg agttacatat taaaagcaat 10020 ggacaagttc ccgttccgat attcagatta tcttcagaaa aaaagtcggt gttgttcaac 10080 tgggtggcat cagaagtgaa gttccccgat gggtatgttt cgaatctctc tagatgtgtt 10140 gaaaagggtc aaaagttctc cgggatgaag agtcatgatt gtcatgtatt tatgcaacga 10200 ctactgccct ttgcatttgc ggagctattt ccaacaaacg tacatgaagc acttgcaggt 10260 acgtagtgta ttatatcaca ataatttaca aaataatata tgactaacaa tgtgtttatt 10320 ttttttgaat ataaaaggca ttggagcatt tttcagggat ctgagcacac gcactcttaa 10380 agaagaagtt gaggaacagc ttcaggagaa cattcccatc ttattgtgca acttggagaa 10440 gatatttcct cccggatttt ttgacgtcat ggagcatcta gctgtccacc tcccatatga 10500 ggcattgctt cgtggacctg tacattacgg atggatgtat cagtatgagc gagccatgaa 10560 atatttgaag ggaaaagcaa agaacctcgc caaagttgaa ggttctataa ttgctggaag 10620 tttgacggaa gaagtttctc acttcacatc gtactacttt gcgtcaaaag tacgtacacg 10680 gagaagagct ccaagaagat atgatgatgg tggtgttgcg ccaacatatg cagttgctgg 10740 tgttccagac atctttagcc agattgggcg actcggtggg aagtctaaag aggtttggtg 10800 gtcgagtgaa caagacgctc atagtgcaca cacctatatt ctactcaatt gcgaagatcc 10860 attgatgcgt tattttgaaa ggtaacatat attgacactt cgaaacacat ataagtataa 10920 ttaattgtat aattgcgaga gattcattcc tataaaatgt gattttacag cctatttgtt 10980 tctcaagtcg aagaaacatt tcctggtata tccacaagtg acgtagacaa aaggaaagat 11040 caacatttca ttaagtggtt gcggaatcag gtattaacta aaactttttt ttcatacatt 11100 atctgtattt cattaacatt ctctttattt ttgcaggttg attatgacga cgacgatgca 11160 gattattcta agtggttaca cgaagtaatt caatctccac ttgtaaaggt caccacatca 11220 cagatgtatt tcacacgagg ctatactttt catacatatg actatggtag acagcgggcg 11280 accagtaact atggagtatg tgtgaaaggg aaaacagatt tctacgggat cttgacggag 11340 attattgaag tcgaatttcc agggatactg aagctgaaat gcgtcctctt caaatgtgaa 11400 tggttcgacc ccgttgtcaa cagaggtgtt cggtctaaca aattcggtgt agttgatgtc 11460 aacggtggac gaaggtacaa caaattcgag cctttcatct tagcttcaca agcagaccaa 11520 gttagcttcc ttccataccc tcggatgaga gattcaggta ttaattggtt agcagtaatc 11580 aaagttacac ctcgaggacg aatcatcagt ggagaagaac caccattgca agaagaacag 11640 ataaatgaag ttgaggaacc tgaacaagaa attgatgaca tccttctcat tgatccgcat 11700 aatcacgagt acgaagatct taccgatgat gccacagacg aagctgttga agacgagttt 11760 aatgaaaatg atgatgtttc tagtgatgac gagaatgtcg atgtatccga ttgatgtatt 11820 tgttttatga ataagatgag agagtttgtt ttatgaataa gataatgtgg ggtttgtttt 11880 atgaataagg taatgtggga gtttgtttta tgaataagca aatgtgggaa ttgtggtttg 11940 gaatggaaat aaagatgggg tttggaatat atgaagtaga aaataaggaa tataaggttt 12000 ggggtttcgg gttttggatt ctagggattt aaacataaca gtcgttaatt ccacgtaagc 12060 ttaaatcgtc gtaaagtcct cgtattccaa ctagtaaata acgacgaagg actcgttaat 12120 tccacgtaag actaaatcgt cgtaaatacc acgtaggatg aattcgtcgt aaaaaccacg 12180 taggatgaat cgtcgtaaat ataacgtaac ataacgagga aataacgacg aaacctaaaa 12240 ataaatatgg aatatgggat ttggggtttg gggtttcagg tttcgggttt cgggtttggg 12300 gtttggggtt tcgggttttg gatttcgggt ttcgggtttc gggtttttgg tttcgggttt 12360 ggggtttcgg ggtttggggt ttcgggtttt ggatttcgag tttcgggttt cgggtttcgg 12420 gtttcgggtt tggggttcta gggatttaac cataacactc gttaaaaata acgacgaaac 12480 ttaaaattaa atatggggtt tggaatatat gaagtagaaa attaaagatg ggggtttggg 12540 tttcgggttt cgggtttcgg gtttgggggt tggggtttgg ggtttcgggt ttgggtttcg 12600 ggtttcggat tctagggatt taaacataac actcgttaat tccacgtaag cacaaatcgt 12660 cgtaactacc tcgtaggatg aaatcgtcgt aactaccacg taaaatgatt taaacaaaac 12720 actcgttaat tccacgtaag cacaaatcgt cgtaaagtcc tcgtaggatg aaatcgtcgt 12780 aactaccacg taaaatgatt taaacaaaac actcgttaat tccacgtaag cacaaatcgt 12840 cgtaaagacc acgtaaacgg atttatacat aaacccgtta attccacgta agtacaaatc 12900 gtcgtaaata tctcgtagtg tacaaacttg gaaaaaaaag gaaaaggaga aaaataccag 12960 attaacatgt ggcaagactt ccaacaatta taatacgtaa gtctcgccca catgaattct 13020 aatatcttct ccttttccta tttttttcaa atatttataa tttgaatagg atttttttga 13080 ggattgtgat ttgagataag gtgtgatttg ggagtttgtg tgtggtttga gagtgagagt 13140 tgtgggtata tttataggaa agcaagcctc gttaattcct cgtaaagtaa atcgtcgtta 13200 atacctcgta taaaaaaaca cgggcctttg tgattactcg caatttcctc gtaaaaaaaa 13260 agacgggcct ttgtaactgc tcgctatttc gtcgtaaact tacgaggaat ttgcggcgat 13320 atgtaatctt atatatacac ccgagcgctc attctttctt tcctctctac ttcctctcta 13380 cttcctctcc atttcgtagc aatagtaagc ctctctgatt cctctctaat ttggttagtt 13440 taggatagat taggtggtta gtatagggaa tttagatagg tttgcggatt ttatgttatt 13500 tagtgttgat taggtggata atgttgggaa atatattgtt gatgttaatt ttaaaaattt 13560 catttttttc ccaggttcga aaaggaagac ttactgccca ttacagagag atcttcggtg 13620 agccgggtag tcgtttagac caggcctctt cttccgctcc cagttcttcg ggccaggaga 13680 ctgtccccga gactcagtac actcagagag tctctgggtc tacttcttct agtgcaccat 13740 cggctcctca tgtgcctcct ccgatgcctc ctcctgtgcc tcctccgatg gcacctccga 13800 tggtcgccga tattcatcct gatctgatgg tgcctccgag tgctccttac tcgcagtaca 13860 ctgtagagga cattctccgt ctgccaggca gagaaggttt accagtcatc gacccagacc 13920 gaccggacgg aacgttgtgg tatgttgcat taattttttt taattcgttt aaatttcttt 13980 tataacatta aaaataattt atattttaaa tttgtatttt ccaggtgggg ggttgacgga 14040 tgtcttgcat cggacgtaac cgacacaatc aagggttact tctccatggc acatccaaac 14100 tggagtaaga cgcctcacta cgtcagaaag acgtggttca aaatttacgc tgtaagtttc 14160 tattaattaa ttatatatat tttaattttt tcatgattta tatatatact ttctaaaaaa 14220 ctaattgtta atttattttt tccaacagca aaaatataat tgggccttgg gaatcactga 14280 gagggtgagg aagaagttta acgcgaaagc gaaagttcgc ttgttggaca cggtctccaa 14340 ctggaagggt gactggatcg tgaaggggta tgagtgtggc aaacccgctg agctcaccac 14400 ggatgtgtgg gatggcctca tccgttattg gcgccttcct gattccatta gaatcgccca 14460 ggcttactct aactcccgta acacggtcga tgagcacggg aacgggccga tgcttcacac 14520 tacgggccaa aaaccccacg ccggtgtccg tttggaaatg gtaattaaat attttattaa 14580 ataatttttt taatatatat attaatttat tctaactttc ttaaatgttt tttaggccaa 14640 agagacggga catctcccgt ctcttatgga actttacgag aggacctaca agaacaagac 14700 gggcgtattt gtagatggca agtccgagca aatctacaac gatgtagttg ctcgggttga 14760 agaccgccag actcagctga cccagcaatc taccgacgga ttacccgtca ccttatccac 14820 acttgaagtg gataagattt acgaggaggt aaattttcaa aaaaattaat tttttattat 14880 tcatttaatt taactttaaa tttttactta caatatttat ttttgttttt aaggttgtcc 14940 ccaaaaaaag ggacggacgt tgggtattgg ttccgtcaac gttgttccga gagcgacatc 15000 gtcttatggt cagcgacggg atgatgaagt cactgagctg cgtagagagt ccgctcagct 15060 gcgtaacgag ttgaccgcga caaaatctcg tatgggtgga gtcgagggct tcttggacgt 15120 tattgcggcc acaaatccgg aatgggagtc catgttgagg aacatgcgac aacaacatcc 15180 cattcaaggc gagtcatctg acgtacataa cgaggcggat gttatgagga ggagtgatga 15240 attctaccgg gcgatgaacg accctaagtt ttttttttgg ttgttgtatt atataaattc 15300 aaaacttatt tatatataaa atattttcat attgatttat ttttattttg aattttaatt 15360 tattattaaa ttaaataatt ttaattattt tttaattata tttttaaatt ctgtaaaata 15420 ataaaaacga agtaaattcg tagccaatgt acgacctctt tacgtggaaa cctcacgagg 15480 aaatgacgag aaacatttaa cgagtatttt acgaagaatc atttacgagt aaataagagg 15540 aaaagtttac gaccatttta cgaggaaatc atttcgtggt tgttacgtgt attttgcgag 15600 gaaactcttt caaggtattt gtgtgtaggt tacgaggaac tattttcgag gtatttacga 15660 ggtattatgg cgacgtcctt acgtggaata ttgacgtggt ctttacgacg aatcgtccta 15720 cttcgtcttt acgacgaaat atattcctcg ctaagttacg acgaattagc gaggaaatat 15780 gtgttacgac agacgtgtaa cgagcaaacg cgtttcctcg ctaattcgtc gtaaagcctc 15840 tcttacgacg aattagcgag gaaaaccgcc ctcgttaaga ttatgttttc ttttagtgaa 15900 aatgaaaata taaggttgtt gtattctact ttacatggaa ttgtagcttt atatctcatg 15960 aacatatcat tcctcttcgt tcttgttctg tcttaagtga taattcattg atatatttaa 16020 tattttagct tccaccttcc tcactatttc caactcttac tttgaatctt caggtttggt 16080 atgaacgagt taggccttcc aagcagattg cttgagaccg gctgtgaacc cattggcaag 16140 aaaagggtta acaattattc aatctccggt ggattgaagt gataaagagt gcattagagg 16200 atgaagacct agcgatgttg aatgcgtcac agtttgggtg agtcttgcag atggggaccc 16260 ataccttctc ggttacgttt cttcacttta ttctatcccg ccagctggtc actgtgaagg 16320 aattctagct gtggtggctc tttgtgggga aacctattcg ctatgttaca actgttctgc 16380 agtataaatg gtaggtgggt ttaagttccc gaatagttgg attgccaatg gagtagggtt 16440 tatatttctc tattttgggt ttagtttttt ctttcacatg ttatcttatc attcccatta 16500 catttgtatt tcatattgct ccatccttgc tgaactatgg cgacaatagc cttgcaatta 16560 tgaataagac aaatatgtac gtaacactat accacatatc tagtaatgga ttgtgtttta 16620 tgttttcttg cggggttcag tgtttaattt caagtgttct cttatcttcc ccattacatt 16680 aatattgtat gtaaaatact cctatatgga atatgaaaaa tagaaaataa catagtttat 16740 attatatgaa atagaaaatt gtacgtgata ttgtccctac gtttcctatt gccaacgaat 16800 ttggggttgc tttaccaatg gattgaagtt tatatttctc taacttgggt ttagtgttta 16860 cttccaaatg atgtctactc attcctctta gctttgtatt gtatgttgcc cagttgtgga 16920 tgtaatatac ctagcatagc actttttaaa aggattgtgt ctataggaaa ttaaatgtct 16980 tcagtactca tctttgtatg aattttccgg tttgaaaacc catcgtttat gagggtcgat 17040 atcccacgcc ccaacaacaa gtaatactct atcttcagta ctcatatgcg ataagaagta 17100 aatgaagatt catttatata tcagtctcta ttccatgtaa aacttgtttt tagtacatat 17160 tctcactgca aattagctgg ttgttacttc caggcagtaa ctccttaact ttcttcacct 17220 ccttgctttg agtttcttca gatggactta cagtgataag tagatggaat acaacattta 17280 ttgctacaac tactaattta caccacttgt ttaactccat acagtaaaaa tatctttact 17340 aactccacct gtttacgtag cttcctccca ctctttaata tggagtagct gtaagccatt 17400 actggacatt tactccatta attacgtcac cgtctgtccc caaccgtaga agtcattgtc 17460 tttgtaagtg attatgttgg taaattacat tcccaagttt atattctatt tgttcatgtg 17520 gcatggaacg tacactcata taaatttgat ggtttgtatc ataccgttgc attcaaatgg 17580 ttttggttga ccagacctaa gcctgacgtc gacgttgtta tattagaaat accccacgct 17640 atatgtaccc acctcctcat ccaactccat gtatcgtact ttctaactcc cacgcaactg 17700 tagctatgat attgttttat accatatgga atagtttggc tgtacaataa atagtaactg 17760 ttgattttgc cgatctgaag ctagcaacat gagtatttgg cttcatttgg gtaaagtttt 17820 acgtactttc cttgcgtcat gcacatttca actgtaccaa aagtatttac caaaatattt 17880 acatgctttt tcaattggaa ctacatttat agggatacta ttacttttat actatgtagt 17940 atggatcttg tgtaactgct atagaataca cttgtttcat cgtcgacaat tcgccatttg 18000 tttatggtac acttgcgatt cttatctact cctacatctg catctccttc cataatgtgt 18060 tgaatacatc tcagttacgc gctccgtaag tttttgtgat tgtaaaccca ccacgtcgtt 18120 tactttgtaa tatagaaccg gtaacctgtt gctttaaggg gcataaccgg gtgggaggaa 18180 tcacaaaagc ctgacaatga attatgtcaa aatcaacgct gcttttttaa tttattccca 18240 gaaaatggct atttcgccaa ttaaccctta attgaattag aaaaatatgt atgcgaaagt 18300 aaatatataa gacatatttt atggaccggg gatgtcctag gtcgaggact aatcataatg 18360 aactgtttag catgtttttc aggcgacaga taaatccgct gttctacgtg gaaattagat 18420 atccacgccc tttaacaacg taaatgagta aatctgaatg ataggtttca aaacgataat 18480 gcctaacact ttcccgccgt atcacacgac catatccata tggttgaaat atataaattc 18540 ttctatttat attttgtctc agattatatt acttctagag gcggatgaaa aaaatatgaa 18600 aatctgaacc tgagaattca aactattttg aatttgacat aagcatccaa atggttattg 18660 ttctatggta tttcagattt tagtttttac ccagatcaaa ataatggaaa tcgaaaaaaa 18720 aactcaaatt ttttaaaaac ctttcaaaat acaaaatgga tcaattttga ataattatcc 18780 aaaatactta aagatccaat aattattcaa aatacttaat gaactataat atttaattta 18840 taaaattagt aatttatcaa aatatcatat ttagatttat atatttttta aatatgttta 18900 tatgtaaaat aaaaagaata gattttttgt gaattatata tataattaag ttttataaac 18960 ttagcttcca tagtgtttat taaataattt gacatatata tatatatata atatgaatca 19020 cataatgtta atgtttttaa atataatctg ataaataatt ataaatactt tgaagtgttg 19080 aaaaagtttg aaatgaattt cattttaaat aaaaaccata cataacaata ttttgttatg 19140 tttatataat ttttatacat catttattaa tttataattg taatgagaca atataattta 19200 tgatttttta taaatgttaa tttactgaat attaatttgt tgaaaatatt aatttattga 19260 atactaattt attaaatatt aaaatatgat tttattgaat attaaaaata ttaatttatc 19320 gaatactaat ttataaagct tctggtagtc gtctgttaac tcatatattt ctctaactac 19380 tactgaataa gcttgtgact tattatacac gtctatacgt gtttatctat aaattgttta 19440 cgtcgaaaga atcatttcgt agatacccac gatgttaccc aagttcaaga attaagaaaa 19500 ttaactatct atcattacgc tacttaccaa aaataatatg aagagtaggc ccgcgggaat 19560 atgctgcctg ttataaattt gcaaatgaca ataaaaataa cttatatatt acactgaaat 19620 atctctaatg tgtagggtta taaagaaaaa tataattagt taagctattc gttaacattt 19680 ttgccccgtt aattaactat gtattttggg ttttgaacta atcataaaaa tcatttaaaa 19740 gacacaattg ttgattcaga cgaacaaacc aatacaagtg ttgagggaat gtagttggta 19800 tagaacacgt cgtaagaatg atgtattttc gtgtaccatg ggccggccct ggcataaagc 19860 ccataaaaca agtactttag gcaccaaata taataaaaaa ttcatgggca ccaaattttt 19920 ttaaagtcac cttagtctaa tgcattttac gttatcctct tgagcaacaa gacacgagtt 19980 tgacgcgtac tttcttttct tccttttttg ataataatgt catttttgat aatactaaca 20040 atttaatatg atttattcat ggatacatat agacacggtt agtttcttaa tctgccgaca 20100 aaaaaattac ttaatctaac aactattttc tttaattata catcttatat taaattgtgt 20160 gacactagat aaataaattt aattaaacaa aaaacttttt ttggcaaata acaaacctat 20220 gtattagtaa caactaacaa tcatttagat tcttgacgtc ttttgtgtat ttcttgcgtt 20280 gatctttgct ataatagctg aagaagttat aacaattaac tcaaatgatc aattcttcat 20340 attccaagtt tgttttaatt gatatccatc ggaatagctg gcatatgtca tgtaagtttt 20400 catttttttt ctacttgttg gtttctattg cttaaaaaaa taaaatttta ataaacaaaa 20460 aattattgtg agattttaac attcgatgct gacaaataat ttttgaaaaa aaaaaaactt 20520 cagaaaataa ggttttcatt ttttcttaaa gtaaataaat tttaatatga tttaatgcta 20580 ttttattaaa taacaaaaat aaagcaaaaa ttaatatatt gaaagggcat atttgttaag 20640 tacgctttag gcaccagtta agtccggagc gacactgcca catatacaac tcgctaaaac 20700 aaagatttat tgtactgcat gaaccttcca accacatata gactcatcac cacgacaaaa 20760 aaaaaaaaaa cctggactac actcaagttg cgcaagccag tcatggaccg tagagtagct 20820 tggttcagac cgtgtagagg atcatatgta aaggaagttc gaattcatag caccagagac 20880 catcgtttct agctaggtcc atacaaactg agttttttca ttgttttgga ggagattcgc 20940 gcggaaccga agttccgaaa cccgatattg tcaatttgtc ataagtgaat tggcttctat 21000 acttctcgta acaaaatcat taacatggat tagtggtcca ccaaaactga aagataacat 21060 gttaaagaag tggactacta catagtccca gactcccaat caacataagt tacataacca 21120 atagatgaca aatggtccat caattatcaa atttgcttgc ttttgttttg caggtgttat 21180 ttagtgtatc catcccgaaa cgcattttct aaactcgtag tcttgtgcag ttttctagtc 21240 caatcttcat attgttacca agaaaaatac ttgttatgtg aatatttttt ggattgcatg 21300 ccactagccg aaatttcatg gatcaatgga tctttggcgt acatatattt attagaacac 21360 tttcattaca gaggatcctc aggaaaatat ctcataataa aataaaaaca ataaaaagag 21420 aataagatag gatttttaaa tgattatttt tgaaaaaact catgaaaact ccatgaaata 21480 cttgtctttt ccatataggt tcaattttta ttttaaatta ttcttaatca attatttaaa 21540 tttcatttaa atactgatat tttgtttgag aatcaatgat gctctaagtg gcaataattg 21600 taaccagtac tagtttcttt attgaccaac tgatatgaaa cgagaatttt ctattttcta 21660 tttttgtttt agtatttatg tttctgttgc catgacaaag aaagagtgct aaaagatgag 21720 agatgttgct tgttaattgt tatatacgag tagagtataa ccatatcccg atttacatag 21780 ataggattag gaagcgatac gttatacata tcaggataga aatattagtt gaaaatgagc 21840 actacgcgag atgttaaaga aaaaaaggcg tacattaaag cccttaatat tcgacataag 21900 agcaccagca tcagcattag aggttcgtgg acagtggcgg agccagacga aagttttacc 21960 aggggcaatg taaaatttat cttcagttta tagggagcag tataagaaaa ttcaccatta 22020 taatcatata attctcaaat aaacaatgga aaaaaatatt ataatatgct acagtaatga 22080 tcctgtctcg ccacgctcct tccgtatgaa cccgagttgt cactgttcag cgggctccac 22140 gccacgtggc ggtctgctat tggtcaattt atttatttat tttttaaaaa aaaaacaaaa 22200 taaaaataat agtaataaaa taataaaaaa ttcaaattat gaaccccaac cgtgggttca 22260 ttaatgctgg tgctctaata tgtgtgcctt aaataaaaac gtggctaatc tatcaataca 22320 aagcacagtt aaaggtacaa ccattaagaa aaagaagagt taaagatcac gatcacttca 22380 tgaatacacg tctcttcaac atcacaaacc attcatatgt atggtttaat atctaacaga 22440 gtatatattt ttcaaagaga ctattatgga agagtccata ttaattttct aaggaggggt 22500 gcatccacag attgattttc tttcatattt taaatgggtt gtaaacaata attcatatcc 22560 ttatgattat ataggtttag tgccgtggag tttattcgaa cccggatctc tctgaagtct 22620 acataccatt agaccaatct catgtggtta atcaagccaa tttttgaaga taactagatg 22680 taaattaaac aattcaaaga gttgttcaga aaaaaagagt gatggctttg gacaagaaaa 22740 agaaagatgg gatgttgtac gtgcacgtgt aaacgacgaa acacgttggg ttctattcct 22800 aaagaagcat tggctctact ttctaacaaa tctctaatta tccaattaat tatttgatcc 22860 taaacaatga catctcgttt gaggttttct ccttttttcg attcatcaat atttccctag 22920 gaaaaagttt tgtttctgtc aacttgtaaa tgatcaccgt gaatatctta caacgacgca 22980 tattcccatt acagaagaac aggtttcagt ttggatcaac ctaataagtt tcagacttta 23040 ctaccttcac tacaagaaaa cacaaattta acgacggcca aaatcgtcgt tatttcctcg 23100 gaaaagaagg cttacgagga aatggcgatg aaaggcgttt cgtcgttata tgattgtcgt 23160 aagagaagat tcgtcgccat ttcctcgtta attagcgagg ttatattttc ctcgtaaaga 23220 agaattaagt tttcgtcgta aagaccacgt ggggtttcca cgtaacgcgg tcgttgtgct 23280 tcctcgtaag aaactcgtaa atgattcgtc gtaaaagacc cgcaaaaacc tctaaataaa 23340 ttcgtcgtaa taaaaacgta agaaacacgg aaacaattcg tcgtaataga atcgtaacta 23400 aatccacgta aaatcctcgt taattgttcc tcgatatttc gtcgttaatt ttcctcgtta 23460 atacatcggg aattagcgac gcaattactt tgttttctat ttactgaatt tataaataaa 23520 aattatattt atttaattta ttaataaaat tttaattgaa attaaatcga atagaaaata 23580 tttttttggc cgaattaaaa tgaaattata taatatataa ataagttttg aattttaaaa 23640 tacaataa 23648 <210> 7 <211> 3247 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 7 catcagaccc tttcttcacc acatttcact cagagcccac acagttttag agagagagag 60 aaacatccct caaagctctc tctctttctc cggcgatggt tgtcgctatg gaccagcgta 120 gcaatgcgaa cggagacgaa aggtttgatc cgagcgcaca accaccgttc aagatcggag 180 atataagggc ggccattcct aagcattgtt gggtaaagag tcctttgaga tccatgagct 240 atgtcgccag agacattttc gccgtcgtgg ctcttgccgt cgccgccgtg tattttgata 300 gctggttctt ttggcctctt tattgggccg cccaaggaac cctgttctgg gctatcttcg 360 tactcggcca cgactggtaa tttaattttt ctttcaactt cttaattttg atatgtttat 420 atgttttttt cgttttttgc attgtctttg atttcttgac cgtacgttcg atatgagatt 480 ttcactgact tcaagatttg attctcttca ggtttacttt tttcaatttt aattattatg 540 ttcatccaat ttggcctatt ttaaaagcaa aaggggatct aagattttta attcttttgt 600 ttttttttgg ttctttttca tcagtcgtaa cactcctaac taaacatctt tttctttcct 660 ataattattg ttgtttccgc gttttatgga tctacgtttg aaattttcaa taaaacacat 720 tttattgttt tctgtaacaa tttaattact gtttattggt tcttttaatt attgtgtgtt 780 gttccaatct attttcgaaa tatagtcatg tgacacgtca tattctattt ttgttacctt 840 gttgaaacgt ttgaattgag gaaagttcag ttaacattgt gcaataaatg ataaatgtgt 900 ttatgatgta aaatttcatt tgaataatac agtggacatg ggagcttctc agacattcct 960 cttctgaata ctgcggttgg tcatattctt cattccttca ttctcgttcc ataccatggt 1020 tggtaagtca tttattttaa cttctttttt catgcaaatt tattcttgtt ttcgtatttc 1080 ttacattttc cttgtcattc ttggtgcatg ttagcaaaca gtaatctgat aactgaaaat 1140 atattaattt ttcatagtaa aataatgcat gtgactaaaa gcatcaaaat ctttagcatc 1200 gaagaaaaaa gaaccaaact tttatttaat gctatgggcc tatttatggt ccaattagct 1260 attatcatat gacatgtcct tgaataaatt aatgtataag tttaatataa tatttatata 1320 tatttgtttt aatggcttat tttattgtta aatggataca tcagcttgaa atatctacga 1380 acatgcatca ttttcctaga tacatttgtt tgttgctcaa aaaatgaata acgtagttaa 1440 acgagtgaga ttcttagcat ctgcctcgaa aacgatatgt tattgacaat tccaatttca 1500 tttttatgaa aataaaataa tagtttattt tataattggg ggtggttgca ggagaataag 1560 ccatcggaca caccaccaga accatggcca tgttgaaaac gacgagtctt gggttccggt 1620 aatccccctc tcattatttt tttttctttt tttgaaactc tttcatttta attttcttag 1680 aattctatgt atttatttta atcaatcctt tttccagtgt gaggcttgga cgaccacttg 1740 tcagatttgt cgtttagctg tagtaaacaa ctgatttaaa ttgtttatgg tactgtagtt 1800 aactttaaca acgggccact tatattcgag ccattggcat aaaatgattc ttctcgaaat 1860 tcgtttactt ttcttagtat ttttcagttt tgtagtttac gtagaactaa taaaaagaaa 1920 aaaacttata aacacaccac atgcaatgaa taaattcgaa tatataacca tactgttaaa 1980 tattaattaa cattttaatc ttaattttgc attccagttg ccagaaaaat tatacaagaa 2040 tttgtcccac agtacacgga tgctcagata cactgtccct ctccccatgc tcgcttaccc 2100 tctctatctg gtaaatccta attcctcatt tttcttcctg attataatta caattttgaa 2160 tttttagatt ttgagtatta actaaatata aattaaattt gtttggggat gactacagtg 2220 gtacagaagt cctggtaaag aagggtcaca ttataaccca tacagtagtt tatttgcccc 2280 aagcgagaga aagcttattg caacttcaac tacttgctgg tcgatcatgt tggccactct 2340 tgtttatcta tcattcctcg ttggtccagt cacagttcta aaagtctatg gtgttcctta 2400 cattgtaagt ttcatatatt tcattattat atcattgcta atataatttg tttttgacat 2460 aaagttttgg aaaaatttca gatctttgta atgtggttgg acgctgtcac gtacttgcat 2520 catcatggtc acgatgataa gttgccttgg tacagaggca aggtaagtag atcaacatta 2580 atttataaga agcaacaatg attagtattt gattaatcta aattattgat gttttgtgta 2640 caataatagg aatggagtta tttacgtgga ggattaacaa ctattgatag agattacggg 2700 atcttcaaca acattcatca cgatattgga actcacgtga tccatcatct tttcccacaa 2760 atccctcact atcacttggt tgatgccgtg agtgatctcg ctctctctct agtttcattt 2820 gattaaaatt aaagggtgat taattactaa attagtgatc ttaattaatg atatgcgaca 2880 gacgaaatca gctaaacatg tgttgggaag atactacaga gaaccaaaga cgtcaggagc 2940 aataccgatc cacttggtgg aaagtttggt ggcaagtatt aagaaagatc attacgtcag 3000 tgacactggt gatattgtct tctacgagac agatccagat ctctacgttt atgcttctga 3060 caaatccaaa atcaactaac ctttcttcct agctctattt aggaataaaa cagtcctttg 3120 gtttttactt atttctggtt gtttttaagt taaatgtact cgtgaaactt tttttaatta 3180 aatgtattta cattacaaat caagtttttg ttcgttttct ttatgttttt agttacaata 3240 aataaag 3247 <210> 8 <211> 4014 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 8 catcgaaccc tttcttcacc acattccact tcccacactc tctttttttt tgaattatag 60 agagagaatc ctcctccaaa tctctctctc tcccaggatg gttgttgcta tggaccaacg 120 caccaatgtg aacggagatg ccggtgcccg gaaggaagaa gggtttgatc cgagcgcaca 180 accgccgttt aagatcgggg acataagggc tgcgattcct aagcattgtt gggtgaaaag 240 tcctttgaga tctatgagct acgtagccag agacatttgt gccgtcgcgg ctttggccat 300 tgccgccgtg tattttgata gctggttcct ctgtcctctc tattgggtcg cccaaggaac 360 ccttttctgg gccatcttcg tcctcggcca cgactggtaa agtttcttcc attttgcatt 420 gcatcgattt attgaatgca cgttctacga gtattgtttg tcagttactt cgtaaaatga 480 ttcttttgat gttcattttt tgaagatcta agattttttt tttagatttt ctttttaaat 540 cattgttcca ccaccacctt tcatcggtcg tacgactcgt tacaacacca catctttatt 600 ttctataatt actactgctt ccgcatttta tggatctctc aacttataat taaagtataa 660 tatcaagaat atctattatt tttcttaaac aagaaagata atattgtttc tttgttattt 720 tggtgtattt ccaatctatt tcgagattta gaaatgtgac acgtcattac cttgttgaag 780 tgtttaaaac aaacatggaa agtttaaata aatagtgcaa taaatgatat atatgtatat 840 gatgaataat gatgtgaaat ataattgaat aatggcagtg gacatgggag tttctcagac 900 attcctctgc tgaatagtgt ggttggccat attcttcatt ccttcatcct cgttccttac 960 catggttggt aagtcagctt atcaaccctt tttactatat tattaattat taaacttgca 1020 tttgtatact tggtgcaagt tggtaaatgt aatctgataa ctgaaaatct attcattgct 1080 cgttctattt tttttttggc tagagacaat tttataatta aataatgcat gtgagaatat 1140 gactatttat gtgaggtagc ttttcttatt cctgtcgaaa agcatcaaat ctttagcaac 1200 gaaggaaaaa ggaatcaaat tttttattaa atgcaatggg tctatgtctt ggtcattagt 1260 tttttgcata taatttattt atattttttt cttaacagca gctaatttaa ttataattaa 1320 atattcattt tataaataat attagaccaa ttattaaagg ttagatattt taagaattat 1380 tcatgacttt gtttattgga actcctttta tcttttaatc ttttctattt ctccattttt 1440 aataatgaga aactgacttc aaatctccaa taaagatggt cttatgtagt aacagtataa 1500 ttttttgttt ggtaaatgta acatcatctt caaatatctt tgaaaataga cttacatgca 1560 ttattttgct gcgacattat tgtcacttat tcctggcaat aaattagttt attactgaac 1620 ttttttttgg tcaatttatt actagtaact ttaaacttaa aagagtgaga ttgtttgatc 1680 aaaaaaaata aaaatagagt gagatagtta gaatctgcca tgaaagcaac actatataga 1740 caatttaatt tttatgaaaa cacatttaat aatttgaggc tgcaggagaa taagccatcg 1800 gacacaccac cagaaccatg gccatgttga aaacgacgag tcttgggttc cggtaacatt 1860 tccctcttta ataatttcta tttttctgtc aaaataatta gtttttcgaa atttgaggcc 1920 agaacgacca cttgtcaaat ttgattttta gctgtagtaa aaacagtttg ctagtgtcac 1980 agttaaccgg taattgattc tttttaacga tttatagaag taacattttt gtaaaataaa 2040 atatacatta tggtatgtga caacggacca cgcttatttg tattggtgaa tcttttaatt 2100 actccctcca atttatttta gttgcagatt tagatttatg cacatagatt aataaaaata 2160 ttttgcacat tttcaaaata aaaacaccat tacttataca actaaccata tttcaaccaa 2220 taaaaataaa ttagaaaata ttatttataa attttgtatt gaaattataa aataatactt 2280 attttaaaac gaaattaatt tacaacgaca attaaactga aacggaaaga aattattaat 2340 acttaattaa agagttttta gaaaaattga aagacatgtt tatgcgaaac tcatgtgaaa 2400 gtctttgaaa taatagattt tggtataaat atttcaaatt ttcttaaaat aataattata 2460 tattaatata atttgtgata aaatctcgtc aaaaactcac taatgcaaat gcttttattt 2520 tgaatttctt actcctctaa atgcatttac ttttatacta atattatttt ctttctctaa 2580 tttggcgttt cgtaatagtt tgtctgtatt ttgaaaacta acaaaaaata ataaaaacaa 2640 aagcttataa acacatagca tgcaatgaat atgtacgaat atatatacca atacatatct 2700 aagtactatt tttccaagta cttaatcttg attactaaaa ttcattttaa ttgttccttt 2760 cagttaccag aaaggttata caagaattta ccccacagta ctcggatgct cagatacact 2820 gtccctctgc ccatgctcgc ttacccgatc tatctggtat tttttaattc ctaaaattta 2880 ctacaagtca ttttagactg tgttttaaaa caatataatt atttttgttt ggttttactg 2940 cagtggtaca gaagtcctgg aaaagaaggg tcacatttta acccatacag tggtttattt 3000 gctccaagcg agagaaagct tattgcaact tcgactactt gctggtccat aatgttggca 3060 attcttatct gtctttcctt cctcgttggt ccagtcacag ttctcaaagt atacggtgtt 3120 ccttacattg taagtttctt agtatatcat aaagggtata tatttattat tcaatatata 3180 tactatatga tttgtttttg tcatatattt ttgaaatatt cagatctttg tgatgtggtt 3240 ggacgctgtc acttacttgc atcaccatgg tcatgatgag aagttgcctt ggtacagagg 3300 caaggtaatt aaattaacta ttacaagtat tttacaaaaa actaatgatt agtatatttg 3360 attaatctta attcttgatg ttttgtgatt aataatagga atggagttac ttacgtggag 3420 gattaacaac tattgataga gattacggaa ttttcaacaa cattcatcac gacattggaa 3480 ctcacgtgat ccatcatctt ttcccacaaa tccctcacta tcacttggtc gatgctgtga 3540 gtcatctcac tctctggcta ctttcatcaa aaccatttga ttaaagggtg attaattact 3600 aatgtagtga ttttaacaaa tggaatgtga cagacaaaag cagctaaaca tgtgttggga 3660 agatactaca gagaaccaaa gacgtcagga gcaataccga tccacttggt ggagagtttg 3720 gtagcaagta ttaagaaaga tcattacgtc agtgacactg gtgacattgt cttctacgag 3780 actgatccag atctctacgt ttatgcttct gtcaaatcga aaatcaatta aactttcttc 3840 cccctttttg tttagcacta ttatgaataa accagttttt tttacttata tattgttgtt 3900 tttaagttaa aaatgtactc gtgaaactct tcttaattta gatattattc catttacact 3960 gaaaaacata caatttcaaa ggttgaaaag aaagacaaaa ttttctagaa tgac 4014 <210> 9 <211> 4761 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 9 catcaaacct ttcttcacca catttcactg aaaggccaca catctagaga gagaaacttc 60 gtccaaatct ctctctccag caatggttgt tgctatggac cagcgcagca atgttaacgg 120 agattccggt gcccggaagg aagaagggtt tgatccaagc gaacaaccac cgtttaagat 180 cggagatatc agggcggcga ttcctaagca ttgttgggtg aagagtcctt tgagatctat 240 gagctacgtc gccagagaca ttttcgccgt cgcggctctg gccatggccg ccgtgtattt 300 tgatagctgg ttcctctggc cactctactg ggttgcccaa ggaacccttt tctgggccat 360 cttcgttctt ggccacgact ggtaaattaa attttctgtt ttaattattt tgactctttt 420 tgttcaattt attaatttct tgaatgcacg ttcgatgagt atcgtcgtca ctgacttcaa 480 gatttaattc ttttgaggtt accttttcat gttcaattat taaaaaataa aataaaatat 540 aggatctaag atttttttct tcatcagttc aagcatcatc actcatcagt cgtaagactc 600 gtaacaaaat atcttctttt ctataattaa tattatttcc gcatttaatg gatctacgtt 660 ttgatgttct caaattttgt ttctctttct ctagatcccc ggaactttta attataatta 720 tagtatagta taatatcaag aaaatatact gtttattttt tttggcaaca aatatattac 780 tcttgtttct ttgacaagaa aaaaatatat tgtttttttc ttctttttgt gttccaatct 840 attttcgaga tttagacaag tgacacgtca tataccggat ttgttacctt gttaaagagt 900 ttgggttaaa acaaatgtag aaaagttaaa ataaattgtg caataaatga taaatacgtt 960 tttatgttaa acaatgatgt gaaaataaaa ttgaataatg gcagtggaca tgggagtttt 1020 tcagacattc ctctgctgaa cagtgtggtt ggtcacattc ttcattcatt catcctcgtt 1080 ccttaccatg gttggtaagt catttattaa ctatttccat gtaaactatt agtacttgtt 1140 ttcgtatttc ttacattttc gtttgtcatt cttcttgggt gcatgctagc aaactgtaat 1200 cagtattaac tgggaactac caactgtttt ttttttgcta gagtagcaat tttataatta 1260 aataagaatc ctattaaaca atgcatgtga caatatgagg ttgcttttct gttcaaaaca 1320 aatctttaga agccaatgaa aaagaatcca aaactttttt ttaaatgata tgcgcctatc 1380 tattggtcct gactcctgag ttttcttact ttcttaagta taattagatt ttgatttttt 1440 tttataggtt ttcactattg ttatttgttt acatcagctt cagatatctt cgaaaaagat 1500 ttacatgcat caatttcatg aggatttata gtttttcttt tacttatttc cgacacaatg 1560 tttagtagta aaaagcatta aatgtttttt tgctcaaaaa aaaaagaatg ggattgttag 1620 agcactctat tgttagttgt tcaataaata taccaactaa aaaaacaaaa taaatataaa 1680 atgagtgaga ttgttaaatc attatagaga caatttcatt ttcacaaaaa taaataaata 1740 cataactttt tataattggg gtttgcagga gaataagcca tcggacacac caccagaacc 1800 atggccatgt tgaaaacgac gagtcttggg ttccggtaat ctttcctact ctcgtagttt 1860 ctcttgtctt ttatttattt gtttgttttt cggaatttat tcttatgtct atgttcttag 1920 gattctatat gtttatttta ttagtttatg ttttcagtct gaggtcagac cgaccacttg 1980 tcagatctgt tttctagctg tagtaaaaaa caatttgcaa gtgtaatagt tcagcataat 2040 tgatcttgtt agagcatttc caaaacaaac tttataattt taaatataca gttttttgtt 2100 ctctaaaaaa gaatttaaaa attttaaagt ttgagggacg aaacttcaaa tttgaacttt 2160 cactactcaa cttcaaattt gaaatttcat cttttttatt tacattttga tcattataat 2220 taattataca ttacatttat gattcttaag tattttctca tttattgttt taattcttaa 2280 attttttata catcataaat atttccaatt tgtttttata aattcaaatt ttacacaaaa 2340 aagtaataaa aattttaaat aagatttata atattttaaa actataatta ggcaaaaaaa 2400 atattacaaa aaaatgtaat aaaaacttta aaataagata tatcaagaca taattattag 2460 aaattttaaa tattataaca atattaataa tctggtaaat ttgctccaaa acctcaaaaa 2520 tttctaaatt attgtccaaa caaatttgtt taaccgaata tggagcatta caaaaataat 2580 tttatggaat agtgtggtat tttgcttgta gttaatattt aattatgtat ttctatttat 2640 aattttatat atttaatgta agattttttt aattaatatt actgtaatat ttttatatat 2700 gtactagtta tttataaaag ttttatagat ttgtattagt tataacaaaa ataaggatca 2760 ttgtgtaaaa tacaaataat tttgaaatta cgtttaaagt tttggttatg aaaaaaatac 2820 tttgaaactt taaatttaga gttttgcaaa ctttaaaatg ttagatagat agtttttttg 2880 gagatgcatt tagtggttat ggtagtaact cagaaaatga aaaatctata cttttatact 2940 ccctccgttt tttaatataa gtcgttttac agttatacac gtagattaag aaaaccatta 3000 atttcttata ttttctagac aaaaacatca ttaattattt acctaaccac aattcaacca 3060 atataaaaat agaagatata ttaccattgg tcatacaaca ttaattatta ataaatttta 3120 catagaaaac cgaaaacgac atataatttg gaacaaaaaa atttctctaa aacgacttat 3180 attaaaaaac ggagggagta gtacctaact ttaacgatgg accacttata ttcgagtcct 3240 tagcataaaa tgattctcct cgaaatccgt ttactttctt cattattttt tccttttcag 3300 ttttggcgtt ttcgtaatac ttttgtcttc aatcttgaaa gctattagta taaaaactta 3360 taaacacatc acatgcaatg aattaatacg aatacataac cagaatgaca aattttcaat 3420 gaatatttaa taccagtaag tactactccg taatagtaat agtaatagtc atattaattt 3480 ttttttgtca tcaaacaaac agtaatagta atattaatta taattatgta tttcagttgc 3540 cagaaaagtt gtacaagaac ttgccccata gtactcggat gctcagatac actgttcctc 3600 tgcccatgct cgcttacccg atctatctgg taaaaaaaaa tacaatttca atttttttct 3660 taaaattaca aatggtttta tattttgagt tttaagccaa tatataaatt aattttgatt 3720 ggattttaac tacagtggta cagaagtcct ggaaaagaag ggtcacattt taacccatac 3780 agtagtttat ttgctccaag cgagaggaag cttattgcaa cttcaacaac ttgctggtcc 3840 ataatgttgg ccactcttgt ttatctatcg ttcctcgttg gtccagtcac agttctcaaa 3900 gtctatggtg ttccttacat tgtaagtttc acatattatt acaagagatt tatatattat 3960 taataataaa tttgtttttt gacataaagt tttggaaaat tttcagatct ttgtaatgtg 4020 gttggacgct gtcacgtact tgcatcatca tggtcacgat gagaagttgc cttggtacag 4080 aggcaaggta aataaatcaa tttttaaaaa gaaatgtaca gaaagcaata atggttagta 4140 ttgattaatc ttaatttttg atgttttgca tacaataata ggaatggagt tatttacgtg 4200 gaggattaac aactattgat agagattacg gaatcttcaa caacatccat cacgacattg 4260 gaactcacgt gatccatcat cttttcccac aaatccctca ctatcacttg gtcgatgcgg 4320 tgagtgatct agctttctct ctctctagtt tcatttgatt aaatggtgat taattactaa 4380 tttaattaat gaattgtgga cagacgagag cagctaaaca tgtgttagga agatactaca 4440 gagagccgaa gacgtcagga gcaataccga ttcacttggt ggagagtttg gtcgcaagta 4500 ttaaaaaaga tcattacgtc agtgacactg gtgatattgt cttctacgag acagatccag 4560 atctctacgt ttatgcttcg gacaaatcta aaatcaatta acttttcttc ctagctctat 4620 taggaataaa cactccttct cttttactta tttgtttctg ctttaagttt aaaatgtact 4680 cgtgaaacct tttttattaa tgtatttacg ttacaaaaag tggaagtttt gttatctttt 4740 tctctagttg caatcaaaag g 4761 <210> 10 <211> 3827 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 10 catcaaactc tctccaccac atttcactca gagcccacac agttttagag agagagaaac 60 atccctcaaa gctctctctt tctccggcga tggttgtcgc tatggaccag cgtagcaatg 120 tgaacggaga ttccaaggac gaaaggtttg atccgagcgc acaaccaccg tttaagatcg 180 gagatataag ggctgcgatt cctaagcatt gttgggtcaa gagtcctttg agatccatga 240 gctacgtcgc gagagacatt ttctccgtcg tggctctggc cgtcgccgcc gtgtattttg 300 atagctggtt cttctggcct ctttattggg ccgcccaagg aacccttttc tgggccatct 360 tcgtactcgg ccacgactgg taatttaatt ttcaatttat tttttcttca acttcttaat 420 tttgatatgt ttatatgttt tttcgttttt tgcatcgtct ttgatttctt gaacgcacgt 480 tcgatatgag attttcactg acttcaagat ttgattctct tcaggtttac ttttaaaaaa 540 aaaaattatt atgttcaccc aaattggcct attttaaaag caaaagggga tctaagattt 600 ttaattcttc tctttttcag tcgtaacact gctaactttt ttttttgatc aaatcgtaac 660 actcataagt cctaactaaa catctttttc tttcctataa ttattgttgg ttccgcattt 720 tatggatcta cgtttgaaag tttcaataaa acacatttta ttgtttgaaa gtaacaatat 780 aattactgta tattgattct tttaattatt gtgtgttgtt ccaatctact ttcgaaatat 840 agtcatgtga cacgtcatat tctatttttg ttaccttgtt ggaacgtttg aattgagtaa 900 agtttaatta acattgtgca ataaatgata aacatgttta tgatgtaaaa ttcaatttga 960 ataatacagt ggacatggga gcttctcaga cattcctctt ctgaatactg cggttggtca 1020 tattcttcat tccttcattc tcgttccata ccatggttgg taagtcattt atttaaacat 1080 ctttttcatg caaatttatt cttgttttcg tatttcttac attttccttg tcattcttgg 1140 tgcatgttag caaactgtaa tctgataact gaaaatatat taattttcca tagtaaaata 1200 atgcatgtga ctaaaagcat caaaatcttt agcatcgaag aaaaaagaac caaactttta 1260 tttaatgcta tgggcctatt tatggtccaa ttagctatta tcatatgaca tgtccttgaa 1320 taaattaatg tagcttcata tgtgagttta ataatattta tatatttttg ttttaatggc 1380 ttattttatt gttaaatgga tacatcagct tgaaatgtct acgaacatgc atcattttcc 1440 tagatacact tgtttgttgc tcaaaaatga ataacttagt taaacgagtg agcatgttct 1500 atggggtttc ttagagcatg attattgaga agttcctaga gtgaggttct taccggaata 1560 taagaatcta tctcttaact tttaactaaa aaaattaaga accggctttt aaaactcgta 1620 tttaagaacc gttttttagt ttttttagtt aaaaatcaag agacgagttc ttatattccg 1680 ctaagaactc caccctgaga acttctcaat aatcatgctc ttagtgctct aagaagggtc 1740 cttaacaaaa tattaataat aagatatagt gtgggcccaa aaaaaacaaa aaaccggtta 1800 caaaagtcgc gaaagaagga tcgattttgg tcttttactt gtactgtttg tggatcccac 1860 tggtggtggt ccgcgattgg tttctttttt aatttaattt atttttttaa tcggagaaaa 1920 aaattaagaa accaaaaaac agttttaatc atggcctcat gttggggttg agttttatat 1980 tctgataaga atcccatctt aaaaaccccg ttaaacatgc tcttaccatc tgcttcgaaa 2040 atgatatgtt attgacaatt ccaatttcat ttttatgaaa ataaaataat agtttatttt 2100 ataactgagg gtggttgcag gagaataagc catcggacac accaccagaa ccatggccat 2160 gttgaaaacg acgagtcttg ggttccggta atctttccct ctctcatatt ttttttcttt 2220 tttttgaaat tctttcattt taattttctt aggattctat gtatttattt taatcaatcc 2280 tttttccagt ttgaggctag gacgaccact tgtcagattt gtcgtttagc tgtagtaaac 2340 aactgattta aattgtttat agtactgtag ttaactttaa caacggacca cttatattcg 2400 agccattggc ataaaatgat tcttctcgaa attcgtttac ttttcttagt atttttcaat 2460 tttggagttt acgtagaact aataaaaaga aaaacttata aacacaccac atgcaatgaa 2520 taaattcgaa tatataacca tactgttaaa tattaattta cattttaatc ttaattttgc 2580 attccagttg ccagaaaaat tatacaagaa tttgtcccac agtacacgga tgctcagata 2640 cactgtccct ctccccatgc tcgcttaccc tctctatctg gtaaatccta attcctaatt 2700 tttcttcctg attataatta caattttgaa tttttagatt ttgagtatta actaaatata 2760 aattaaattt gtttggggat gactacagtg gtacagaagt cctggtaaag aagggtcaca 2820 ttataaccca tacagtagtt tatttgcccc aagcgagaga aagcttattg caacttcaac 2880 tacttgctgg tcgatcgtgt tggccactct tgtttatcta tcattcctcg ttggtccagt 2940 cacagttcta aaagtctatg gtgttcctta cattgtaagt ttcatatatt tctttattat 3000 atcattgcta atataatttg tttttgacat aaaagttttg gaaaaatttc agatctttgt 3060 aatgtggttg gacgctgtca cgtacttgca tcatcatggt cacgatgata agctgccttg 3120 gtacagaggc aaggtaagta gatcaacatt atttataaga agcaataatg attagtagtt 3180 gaataatctg aatttttgat gtttttgtac aataatagga atggagttat ttacgtggag 3240 gattaacaac tgttgataga gattacggga tcttcaacaa cattcatcac gatattggaa 3300 ctcacgtgat ccatcatctt ttcccacaaa tccctcacta tcacttggtc gatgccgtga 3360 gtgatctcgc tctctctcta gtttcatttg attatattaa agggtgatta attactaaat 3420 tagtgatctt aattaatgac atgcgacaga cgaaagcagc taaacatgtg ttgggaagat 3480 actacagaga accaaagacg tcaggagcaa taccgatcca cttagtggaa agtttggtgg 3540 caagtattaa gaaagatcat tacgtcagtg acactggtga tattgtcttc tacgagacag 3600 atccagatct ctacgtttat gcttctgaca aatccaaaat caattaatct ttcttcctag 3660 ctctatttag gaataaaaca ctcctttggt tttacttatt tctggttgtt tttaagttaa 3720 aaatgtactc gtgaaacttt tttttattaa atgtatttac attacaaatc gtaaaagttt 3780 ttgttcgttt tctctatgtt tttagttaca aacttacaat caaaaag 3827 <210> 11 <211> 4668 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 11 catcaaacct ttattcacca catttcactg aaaggccaca catctagaga gagaaacttc 60 gtccaaatct ctctctccag cgatggttgt tgctatggac cagcgcagca atgttaacgg 120 agattccggt gcccggaagg aagaagggtt tgatccaagc gcacaaccac cgtttaagat 180 cggagatata agggcggcga ttcctaagca ttgctgggtg aagagtcctt tgagatctat 240 gagctacgtc gccagagaca ttttcgccgt cgcggctctg gccatggccg ccgtgtattt 300 tgatagctgg ttcctctggc cactctactg ggttgcccaa ggaacccttt tctgggccat 360 cttcgttctt ggccacgact ggtaaattaa attttcagtt ttaattattt tgtctctttt 420 tgttcaattt attaatttct tgaatgcacg ttcgatgagt atcgtcactg acttcaagat 480 ttaattcttt tgaggttact ttttcatgtt taattattaa aaaataaaag aaaatatagg 540 atctaagatt tttttcttca tcaatgttca agcatcgtca ctcatcagtc gtcagactcg 600 taacaaaata tcttcttttc tataattaat attatttccg cattttatgg atctacgttt 660 tgatgttctc aatttttgtt tctctttctc tagatccccg gaacttttaa ttataattat 720 agtatagtat aatatcaaga aaatatactg tttatttttt tggcaacaaa tatattgttt 780 tttgacaaga aaaatatatt gtttttttct tctttttgtg ttccaatcta ttttgtgatt 840 tagacaagtg acacgtcata taccggattt gttaccttgt taaagagttt gagttaaaac 900 aaatgtagaa aagttaaaat aaattgtgca ctaaatgata aatacgtttt tatgttaaat 960 aatgatgtga aaataaaatt gaataatggc agtggacatg ggagtttctc agacattcct 1020 ctgctgaaca gtgtggttgg tcacattctt cattcattca tcctcgttcc ttaccatggt 1080 tggtaagtca tttattaact atttccatgt aaattattag tacttgtttt cgtatttctt 1140 acattttcgt ttgttattct tgggtgcaat gctaggaaac tgtaatcagt attaactgga 1200 agctaccaac ttttttttgt tgctagagta gcaattttat aattaaataa gaatcctatt 1260 aaacaatgca tgtgactata tgaggttgct ttttctgttc aaaagcatca aatctttagc 1320 agccaatgaa aaagaatcca aaccttttct taaatgatat gcgcctatct atggtcctga 1380 gttttcttag ttcattaagt ataattagat tttgattttt ttttaggttt tcacttattg 1440 ttatttgttt acatcagctt caaacatctt cgaaaaagac ttacatgcat caatttcctg 1500 aggatttata gtttttttta cttatttctg cacaatgttt attagtaaaa agcatcaaat 1560 gtttttttgc tcaaaaaaaa gaatgggatt gttagagcac tctattgtta gttgttcaat 1620 aaatatatca actaaaaaaa caaaataaat ataaaatgag tgagattgtt aaatcattat 1680 agagacaatt tcattttcac aaaaataaat aaatacataa cttttgtaat tggggtttgc 1740 aggagaataa gccatcggac acaccaccag aaccatggcc atgttgaaaa cgacgagtct 1800 tgggttccgg taatctttcc tactctcatt gtttctcttg tcttttattt atttgttctt 1860 ttttgggaat tcattcttat gtctaagttc ttatgattat tgaagttctt aaggtggggt 1920 tcttaacgga atatgagaac ctgtctctta acttttaact aaaaaagcta agaaccagct 1980 tttaaataag agttttatga acacgttctt aattttttta gttaaaagtt aagaaacggg 2040 ttcttatatt ccgctaagaa cctcttccta aaaaccccaa taatcatact cctaggattc 2100 tatatgttta ttttattagt ttatgttttc agtctgaggt cagaccggcc acttgtcaga 2160 tctgttttct agctgtagta aaaaacaatt tgcaagtgta atagttcagc ggtaattaat 2220 gttctcggat ctatctcaaa aaaaaatttt ataacttcaa atataaagat ttttttgttt 2280 ttcaaaaatg aacttcgaaa cttcaaattt gaagtttttt ttttgcattt tgatcattat 2340 aattaattac acgttacatt tataattctt aagtattttt tcatttatcg ttttaattct 2400 taaatttttt atatattata aatatttcca atttgttttt ataaattcaa attttataca 2460 taaaagtaat aaaaatgtta aataagattt ataatattta agactataat tagtcaacaa 2520 aatattacaa aagaaatgta ataataaaaa atttaaaata agatacatga agacataact 2580 attagaaaat ttaaatatta taacaatact aataatctgg taaatttgct ctggaacctc 2640 taaaattatt gtctaaacaa attttgtgta accgaagatg gagcattacg aaaataattt 2700 tatgaaataa tatggtattt tgcttctagt ttaatattta attatatatt tctatttata 2760 attttatata tttaatgtaa atttttatta attaatatta ctgtaatatt tttatatatg 2820 tgctagttat ttataatttt ttttatggat ttatattaga ccatgattaa cccggagttc 2880 ttagagtgga gttttagtta aacgttaaga aacagtttct taacttccgg taagaacccc 2940 atcctaagaa tcccaggtta atcatgctct tagttataac aaataaggat cattgtgtaa 3000 aatacaaata attttgaagt tatgtttgaa gtttgttttc gaagaaaacc actttgaaac 3060 tttaaattta gagtaaactc tatttagaga gtttttttta gaggttacgc agtaactcag 3120 aaaatgaaaa atctatactt ttatagtacc taactttatc gatggaccac ttatattcga 3180 gtccttagca taacatgatt ctcctcgaaa tccgtttact ttcttcgtta ttttttcctt 3240 ttcagttttg gcgttttcgt aatacttttg tctgcaatct tgaaagctat tagtataaaa 3300 cttataaaca catgaattaa tacgaataca taaccagaat gacaaatttt caatgaatat 3360 ttaatactag taagtactac tccgtaatag taattagtaa tagtaatagt aatagtcata 3420 ttaattataa ttatgtattt cagttgccag aaaagttgta caagaacttg ccccatagta 3480 ctcggatgct cagatacact gtccctctgc ccatgctcgc ttacccgatc tatctggtaa 3540 aaaaaataca atttctattt tttcttaaaa ttacaaatga ttttatattt tgagttttaa 3600 gccaatatat aaattaattt tgattggatt ttaactacag tggtacagaa gtcctggaaa 3660 agaagggtca cattttaacc catacagtag tttatttgct ccaagcgaga ggaagcttat 3720 tgcaacttca actacttgct ggtccataat gttggccact cttgtttatc tatcgttcct 3780 cgttgatcca gtcacagttc tcaaagtcta tggcgttcct tacattgtaa gtttcacata 3840 ttattacaag aaatttatat attattaata ataaatttgt tttttgacat aagggtttgg 3900 aaaattttca gatctttgtg atgtggttgg acgctgtcac gtacttgcat catcatggtc 3960 acgatgagaa gttgccttgg tacagaggca aggtaattaa atcaattttt aaaaagaaat 4020 gtacagaaag caataatggt tagtattgat taatcttaat ttttgatgtt ttgcatacaa 4080 taataggaat ggagttattt acgtggagga ttaacaacta ttgatagaga ttacggaatc 4140 ttcaacaaca tccatcacga cattggaact cacgtgatcc atcatctttt cccacaaatc 4200 cctcactatc acttggtcga tgccgtgagt gatctagctt tctctctctc tagtttcatt 4260 tgattaaatg gtgattaatt actaatttaa ttaatgaatt gtggacagac gagagcagct 4320 aaacatgtgt taggaagata ctacagagag ccgaagacgt caggagcaat accgattcac 4380 ttggtggaga gtttggtcgc aagtattaaa aaagatcatt acgtcagtga cactggtgat 4440 attgtcttct acgagacaga tccagatctc tacgtttatg cttctgacaa atctaaaatc 4500 aattaacttt tcttcctagc tctattagga ataaacactc cttctctttt acttatttgt 4560 ttctgcttta agtttaaaat gtactcgtga aacctttttt ttattaatgt atttacgtta 4620 caaaaagtgg aagttttgtt atctttttct ctggttgcaa tcaaaagg 4668 <210> 12 <211> 5714 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 12 catcgaaccc tttcttcacc acattccagt tcccacactt tctttttttt gaattataga 60 gagagaatct tcctccaaat ctctctctct ctctcccagg atggttgttg ctatggacca 120 acgcaccaat gtgaacgaag atgccggtgc ccggaaggaa gaagggtttg atccgagcgc 180 acaaccgccg tttaagatcg gggacataag ggctgcgatt cctaagcatt gttgggtgaa 240 aagtcctttg agatctatga gctacgtagc cagagacatt tgtgccgtcg ctgctttggc 300 cattgccgcc gtgtattttg atagctggtt cctctggcct ctctattggg tcgcccaagg 360 aacccttttc tgggccatct tcgtcctcgg ccacgactgg taaagtttct tccattttgc 420 attgcatcga tttattgaat gcacgttcta tgagtattgt cagtacttta tgaattgatt 480 cttttgatgt tcattttttg aagatctaag attttttttt ttagattttc tttttaaatc 540 attgttccac cacctttcat cggtcgtacg actcgttaca aaaccacatc tttattttct 600 ataattacga ctgcttccgc attttatgga tctctcaact tataattaaa gtataaaatc 660 aagaatatct attgtttttc taaaacaaga aagataatat tgtttctttg ttattttggt 720 gtattccaat ctatttcgag atttagaaat gtgtcacgtc attaccttgt tgaagctttt 780 aaaacaaaca tggaaagttt aaataaatag tgcaataaat gatatactat atttacgatg 840 aataatgatg tgaaatataa ttgaataatg gcagtggaca tgtgagtttc tcagacattc 900 ctctgctgaa tagcgtggtt ggccatattc ttcattcctt catcctcgtt ccttaccatg 960 gttggtaagt caacttatta acccttttta ttattattat taattattaa actttcattt 1020 gttatacttt ttttggttta aatgttaaat gaattacttg gtgcaagaat ctattcattg 1080 ctcgttcttt ttttttttgg ctagagccaa ttttataatt aaataatgca tgtgaaagta 1140 tgactatata tgtgaggtag cttttcttat tcttgacgaa aagcatcgaa tctttagcaa 1200 cgaaggaaaa aggaatcaaa acttttatta aatgcaatgg gcctatatct ggtcattagt 1260 attttgaata taatttattt ataatttttt ttgaacaaca gctaatttat ttataattaa 1320 atattcattt tataaataat attaaaccaa ttattaaagg ttagatattt gaagaattat 1380 tcatgacttt gtttattggg aaattactcc ttttatcttt tattcttttc tatttctcta 1440 tttttaatat tgagaaactg acttcaaacc tccaataaaa atggtttcct gtagtaacat 1500 cataattttt tgtttggtaa atgtaacatc atcttcaaat atctttgaaa atagacttac 1560 atgcattatt ttgctgcgac attattgtaa cttattcctg gcaataaaaa taatttatta 1620 ctggaaacta tttttggtca atttattact agtaacttaa aacttaaaag agtgagattg 1680 tttgatcaaa aaaaaagaga aaaaaaatag agtgagattg ttagaatctg ccatgaaagc 1740 aacactatat aggtgatgat tggttcgact gtggccgtag aattttagct gtagataaat 1800 tggttgtagt tgtaaagttg ttactgttga ttatttttgc agagactttt gctgtagtta 1860 aatttgttgt agctgtaagc tataggctgc agatatttta aaataaaata tgtaaaatat 1920 gtgatgcatg tatatataaa ataattatta tttttatcac ttaaaataat ttatattaat 1980 attttttaaa attatcaaag tttactgtta tttaaaatgt gatatgtaaa taatctatat 2040 tatttaaaat atttcaataa tttaaaagca cccaaaatta gagtaaaata tttatagatg 2100 tttttttatt atgattatct tatttattta atattataga tattttttgt tcttacagtt 2160 tctacagctt ataaatgaaa gatgtaagtt gtttaactaa aatacataag aaaaatgttt 2220 ggtttttttt ttgctgtagc tttattttta aagttaaagc atgattggta aaaattaata 2280 gaaatttgat gtagacttta attttgaaaa gtaaacgtaa agcatgattg gtaaagttta 2340 atgatttaga aaaaaataaa gctaaagtag gtagataaaa cccaaccaat cacctccatg 2400 gacaatttaa tttttatgta aacacatatt taataatttg aggctgcagg agaataagcc 2460 atcggacaca ccaccagaac catggccatg ttgaaaacga cgagtcttgg gttccggtaa 2520 catttccctc tttaataatt tctatttttc tttgtcaaaa taatttgttt ttcgaaattt 2580 gaggccagaa cgaccacttg tcagatttga tttctagctg tagtaaaaac agtttgctag 2640 tgtcacagtt aaccggtaat tgattctttt tagcgattta tagaagtaac atttttgtaa 2700 aataaaatat acataatagt atgtgacaac ggaccacgcc tatttgtatc ggtgaatctt 2760 ctaattactt cctccgattt attttagtta cagttttaga tttatacaca tagattacaa 2820 aaaataaaat attttgtcca tttttaaaat aaaaacatca ctaattatac acctaacaat 2880 attttaacca ataaaaaata aactagaaaa tattattcat aatttttaca ttgaaattat 2940 aaaacgatac ttattttaaa acaaaatttt aatttacaac gacaattaaa ttgaaacgga 3000 agaagtttat tattacttaa ttaaagagtt tttttaaaaa aaatgaaaga catgtttatg 3060 cgaaactcat gtgaaagtct ttcaaataaa atattttggt ataaattttt caaattttca 3120 aaaataataa ttataaatta atataatata atttgtgata aaatctcgtc aaaaactcac 3180 taatgcaaat gcttttatat ttgagtttct tactcctcta aatgcattta cttttatact 3240 attattattt tctttctcta atttggtgtt ttcgtaatag tttgcctgtg ttttgaaaac 3300 taacaaaaaa taataaaaac aaaagtttat aaacacatag catgcaatga atatatatat 3360 caatacatat ctaagtacta tttttgcaag tacttaatct tgattactaa aattcatttt 3420 aattgttcct ttcagttacc agaaaagtta tacaagattt taccccacag tactcggatg 3480 ctcagataca ctgtccctct gcccatgctc gcttacccga tctatctggt attttttaat 3540 tcctaaaact taccacaatt cattttagat tgtgttttaa aacaatataa attatttttt 3600 ctttggtttt actgcagtgg tacagaagtc ctggaaaaga agggtcacat tttaacccat 3660 acagtggttt atttgctcca agcgagagaa agcttattgc aacttcaact acttgctggt 3720 ccataatgtt ggccattctt atctgtcttt ccttcctcgt tggtccagtc acagttctca 3780 aagtatacgg tgttccttac atcgtaagtt tcttagtata tcataaaggg tatatattta 3840 ttattcaata tatatactat atgatttgtt tttgtcataa acttttgaaa ttcagatctt 3900 tgtgatgtgg ttggacgctg tcacttactt gcatcaccat ggtcatgatg agaagttgcc 3960 ttggtacaga ggcaaggtaa ttaaattaac tcctaggtga ttttcccgtg ctcatgtacg 4020 gatataaata tttctaaagt aaatatacta taataattaa ttgttattta tttttaattt 4080 taaattagtt tataatttgt atgcatgatt tatattaata aaatttatat tactttaatt 4140 ataaatatga ttttatatat gttatatcta atcggttttg ttgtttttac agtcgattta 4200 gttatcattt gggtaaattg gattgcatct cagaattcaa ctgtaatatt ttttatttta 4260 actatattaa aattttgatt aatttcttat tttcatttag gtggttgttg tcttagaact 4320 ttaaatatat tttataaaga ttatgtataa cttaatatat atattgtgct taaaatgaaa 4380 taaaaaataa aataaagtgt ctgattctaa attacataaa ttaatataac gataatattc 4440 tgaagtctca tgcatatata tatataaatt ttacaaaaga actaaattgt aacatttggt 4500 taatatttta cagtaattaa aatattttat aaattctaaa taactttatg tatttaattt 4560 attgaatgga aactgaaatt tattttaaat aatcttaaaa atgaaaacat atttgctttg 4620 gtattttgct tatggttcca ttaagttcta caaacataaa aacataacat ttaaaaactg 4680 tgattatttt gtaactattt gatcaaacaa tgattatttt ttaattttaa ttttagtttt 4740 ttaataactc ttaaaaataa gcagtgaaca aaagtgagat tgtatttgaa attaatatta 4800 tacaagtaaa atataatttt ttaagtttat aaaaaaattc ctttttatta tatgtatatg 4860 tttttttgga aaattttaaa aaggaaacta aataaaaaaa taaataatag tattttaaat 4920 gtaatatttt taattcatta agtgtattag tgtaatcaac tatcgtgaga gttaacgtga 4980 gagcgataca tagaaaaccg acttctcaaa taatatttta tagagattac gatgtttcac 5040 aaaaaaaaat tattagtatt tgattaatct taattcttga tgttttgtga ttaataatag 5100 gaatggagtt acttacgtgg aggattaaca actattgata gagattacgg aattttcaac 5160 aacattcatc acgacattgg aactcacgtg atccatcatc ttttcccaca aatccctcac 5220 tatcacttgg tcgatgctgt gagtcatctc actctctcgc tactttcatc taaaccattt 5280 cattaaaggg tgattaatta ctaatgtact gattttaaca aatggaatgt gacagacaaa 5340 agcagctaaa catgcgttgg gaagatacta cagagaaccg aagacgtcag gagcaatacc 5400 gatccacttg gtggagagtt tggtagcaag tattaagaaa gatcattacg tcagtgacac 5460 cggtgacatt gtcttctacg agactgatcc agatctctac gtttatgctt ctgtcaaatc 5520 gaaaatcaat taaactttct tccccctttt tgtttagccc tattatgaat aaaccagtct 5580 tttttcactt atttattggt gtttttaagt taaaaatgta ctcgtgaaac tcttctttta 5640 ttattaatcc atttatacac tgaaaaacat acaatttcaa aggttaaaaa gaaaaataaa 5700 ttttctagac tgac 5714 <210> 13 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 13 gaataagcca tcggacacac 20 <210> 14 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 14 atgcgaacgg agacgaaagg 20 <210> 15 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 15 tgttaacgga gattccggtg 20 <210> 16 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 16 gtagcaatgt gaacggagat 20 <210> 17 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 17 cagtgtatct gagcatccg 19 <210> 18 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 18 gtggccgagt acgaagatag 20 <210> 19 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 19 cagtagagtg gccagagga 19 <210> 20 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 20 cgccggagaa agagagagag ctttgagg 28 <210> 21 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 21 tggttgtcgc tatggaccag cgtagcaa 28 <210> 22 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 22 tctccgttcg cattgctacg ctggtcca 28 <210> 23 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 23 gaaaggtttg atccgagcgc acaaccac 28 <210> 24 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 24 tctccgttcg cattgctacg ctggtcca 28 <210> 25 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 25 tcggagatat aagggcggcc attcctaa 28 <210> 26 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 26 tagcccagaa cagggttcct tgggcggc 28 <210> 27 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 27 cttcgtactc ggccacgact ggtaattt 28 <210> 28 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 28 ttgaagttgc aataagcttt ctctcgct 28 <210> 29 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 29 acttgctggt cgatcatgtt ggccactc 28 <210> 30 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 30 aagtagttga agttgcaata agctttct 28 <210> 31 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 31 tggtcgatca tgttggccac tcttgttt 28 <210> 32 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 32 aacgagaatg aaggaatgaa gaatatga 28 <210> 33 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 33 ataccatggt tggtaagtca tttatttt 28 <210> 34 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 34 ccaacgagga atgatagata aacaagag 28 <210> 35 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 35 cagtcacagt tctaaaagtc tatggtgt 28 <210> 36 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 36 tgtgactgga ccaacgagga atgataga 28 <210> 37 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 37 tctaaaagtc tatggtgttc cttacatt 28 <210> 38 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 38 cgccggagaa agagagagct ttgaggga 28 <210> 39 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 39 tggttgtcgc tatggaccag cgtagcaa 28 <210> 40 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 40 cttaaacggt ggttgtgcgc tcggatca 28 <210> 41 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 41 tcggagatat aagggctgcg attcctaa 28 <210> 42 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 42 tctccgatct taaacggtgg ttgtgcgc 28 <210> 43 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 43 ataagggctg cgattcctaa gcattgtt 28 <210> 44 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 44 agatggccca gaaaagggtt ccttgggc 28 <210> 45 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 45 cgtactcggc cacgactggt aatttaat 28 <210> 46 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 46 ttgaagttgc aataagcttt ctctcgct 28 <210> 47 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 47 acttgctggt cgatcgtgtt ggccactc 28 <210> 48 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 48 aagtagttga agttgcaata agctttct 28 <210> 49 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 49 tggtcgatcg tgttggccac tcttgttt 28 <210> 50 <211> 58 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 50 acactctttc cctacacgac gctcttccga tctacgtacc tttcttcacc acattyca 58 <210> 51 <211> 58 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 51 acactctttc cctacacgac gctcttccga tctcgtaccc tttcttcacc acattyca 58 <210> 52 <211> 58 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 52 acactctttc cctacacgac gctcttccga tctctgacga tggttgtcgc tatggacc 58 <210> 53 <211> 58 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 53 acactctttc cctacacgac gctcttccga tcttgactcg aaaggtttga tccragcg 58 <210> 54 <211> 58 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 54 acactctttc cctacacgac gctcttccga tctgactgcg aaaggtttga tccragcg 58 <210> 55 <211> 58 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 55 acactctttc cctacacgac gctcttccga tctactgacg aaaggtttga tccragcg 58 <210> 56 <211> 61 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 56 acactctttc cctacacgac gctcttccga tctgctagcc gtgtattttg atagctggtt 60 c 61 <210> 57 <211> 61 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 57 acactctttc cctacacgac gctcttccga tctctagccc gtgtattttg atagctggtt 60 c 61 <210> 58 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 58 acactctttc cctacacgac gctcttccga tcttagctgg agcttctcag acattcctct 60 <210> 59 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 59 acactctttc cctacacgac gctcttccga tcttcagtgt ttatttgccc caagcgagag 60 <210> 60 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 60 acactctttc cctacacgac gctcttccga tctcagtcgt ttatttgccc caagcgagag 60 <210> 61 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 61 acactctttc cctacacgac gctcttccga tctagtcagt ttatttgccc caagcgagag 60 <210> 62 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 62 acactctttc cctacacgac gctcttccga tctgtcaggt ttatttgccc caagcgagag 60 <210> 63 <211> 61 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 63 acactctttc cctacacgac gctcttccga tctgtacgac ttcaactact tgctggtcsa 60 t 61 <210> 64 <211> 61 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 64 acactctttc cctacacgac gctcttccga tcttacgtac ttcaactact tgctggtcsa 60 t 61 <210> 65 <211> 62 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 65 cggtctcggc attcctgctg aaccgctctt ccgatctacg tacgttcaca ttgstrcgyt 60 gg 62 <210> 66 <211> 62 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 66 cggtctcggc attcctgctg aaccgctctt ccgatctcgt accgttcaca ttgstrcgyt 60 gg 62 <210> 67 <211> 63 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 67 cggtctcggc attcctgctg aaccgctctt ccgatctctg acccgatctt aaacggyggt 60 tgt 63 <210> 68 <211> 65 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 68 cggtctcggc attcctgctg aaccgctctt ccgatcttga cttagctcat ggatctcaaa 60 ggact 65 <210> 69 <211> 65 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 69 cggtctcggc attcctgctg aaccgctctt ccgatctgac tgtagctcat ggatctcaaa 60 ggact 65 <210> 70 <211> 65 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 70 cggtctcggc attcctgctg aaccgctctt ccgatctact gatagctcat ggatctcaaa 60 ggact 65 <210> 71 <211> 62 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 71 cggtctcggc attcctgctg aaccgctctt ccgatctgct agttaaatta ccagtcgtgg 60 cc 62 <210> 72 <211> 62 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 72 cggtctcggc attcctgctg aaccgctctt ccgatctcta gcttaaatta ccagtcgtgg 60 cc 62 <210> 73 <211> 66 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 73 cggtctcggc attcctgctg aaccgctctt ccgatcttag ctcttttttc ttcgatkcta 60 aagatt 66 <210> 74 <211> 62 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 74 cggtctcggc attcctgctg aaccgctctt ccgatcttca gtctgtgact ggaccaacga 60 gg 62 <210> 75 <211> 62 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 75 cggtctcggc attcctgctg aaccgctctt ccgatctcag tcctgtgact ggaccaacga 60 gg 62 <210> 76 <211> 62 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 76 cggtctcggc attcctgctg aaccgctctt ccgatctagt cactgtgact ggaccaacga 60 gg 62 <210> 77 <211> 62 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 77 cggtctcggc attcctgctg aaccgctctt ccgatctgtc agctgtgact ggaccaacga 60 gg 62 <210> 78 <211> 66 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 78 cggtctcggc attcctgctg aaccgctctt ccgatctgta cgacttacaa tgtaaggaac 60 rccrta 66 <210> 79 <211> 66 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 79 cggtctcggc attcctgctg aaccgctctt ccgatcttac gtacttacaa tgtaaggaac 60 rccrta 66 <210> 80 <211> 13462 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 80 taaataaaaa ctgatggaag tctgtttctt aagtcaaata catcacagtg atgtggcaac 60 tattttccct caaattaata cgttttaaaa aaaatctata taaatgttgg catgtctaca 120 atctacatga tatccatatg gatcgttttt tatgatttat acatagtcag gaaattttag 180 cagaaacaaa atagagtacg aagactaaca taatattttc gactacatgt attttttttg 240 cgaaattgta aatatcaatc agtgaaaatg aaaaaccata caagttgact accatttcgg 300 tgcacaatcc ttacttctaa ggaaaaacta aagagaaaca aaagaagaaa atcttggtaa 360 attttgatac cattaccatg gttacttata ctcgataatg caattttaaa atcttctgta 420 aattttatag cattgttttt tttgtaacac atttctctaa cttagttttc atcgaaatga 480 acgacgtaac aaagatacat tgcgcacagg ttaccgcaaa aatacaattt ttattcttca 540 aagaataaaa aagtttccta aattaagaaa aaaagaaaac agtttggtgt ctctacacat 600 cttctccctt tatataaaca aaccacacat accccaaagt ccatcaaact ctctccacca 660 catttcactc agagcccaca cagttttaga gagagagaaa catccctcaa agctctctct 720 ttctccggcg atggttgtcg ctatggacca gcgtagcaat gtgaacggag attccaagga 780 cgaaaggttt gatccgagcg cacaaccacc gtttaagatc ggagatataa gggctgcgat 840 tcctaagcat tgttgggtca agagtccttt gagatccatg agctacgtcg cgagagacat 900 tttctccgtc gtggctctgg ccgtcgccgc cgtgtatttt gatagctggt tcttctggcc 960 tctttattgg gccgcccaag gaaccctttt ctgggccatc ggtaccgcct tttgcagttt 1020 atctctatgc ccgggacaag tggagtccat gctcaacacc gtgcaggatg aggatgacca 1080 ccgcggtagc gacttcgtgg gcgaggaaag cctttcgtcc aaggtggtcc ctcctcgcaa 1140 tcttgttgga tggtgaatat tataaaagcc tgcccttctc gcgggtgttt aaacgtcgac 1200 ctgcaggtca acggatcagg atattcttgt ttaagatgtt gaactctatg gaggtttgta 1260 tgaactgatg atctaggacc ggataagttc ccttcttcat agcgaactta ttcaaagaat 1320 gttttgtgta tcattcttgt tacattgtta ttaatgaaaa aatattattg gtcattggac 1380 tgaacacgag tgttaaatat ggaccaggcc ccaaataaga tccattgata tatgaattaa 1440 ataacaagaa taaatcgagt caccaaacca cttgcctttt ttaacgagac ttgttcacca 1500 acttgataca aaagtcatta tcctatgcaa atcaataatc atacaaaaat atccaataac 1560 actaaaaaat taaaagaaat ggataatttc acaatatgtt atacgataaa gaagttactt 1620 ttccaagaaa ttcactgatt ttataagccc acttgcatta gataaatggc aaaaaaaaac 1680 aaaaaggaaa agaaataaag cacgaagaat tctagaaaat acgaaatacg cttcaatgca 1740 gtgggaccca cggttcaatt attgccaatt ttcagctcca ccgtatattt aaaaaataaa 1800 acgataatgc taaaaaaata taaatcgtaa cgatcgttaa atctcaacgg ctggatctta 1860 tgacgaccgt tagaaattgt ggttgtcgac gagtcagtaa taaacggcgt caaagtggtt 1920 gcagccggca cacacgagtc gtgtttatca actcaaagca caaatacttt tcctcaacct 1980 aaaaataagg caattagcca aaaacaactt tgcgtgtaaa caacgctcaa tacacgtgtc 2040 attttattat tagctattgc ttcaccgcct tagctttctc gtgacctagt cgtcctcgtc 2100 ttttcttctt cttcttctat aaaacaatac ccaaagagct cttcttcttc acaattcaga 2160 tttcaatttc tcaaaatctt aaaaactttc tctcaattct ctctaccgtg atcaaggtaa 2220 atttctgtgt tccttattct ctcaaaatct tcgattttgt tttcgttcga tcccaatttc 2280 gtatatgttc tttggtttag attctgttaa tcttagatcg aagacgattt tctgggtttg 2340 atcgttagat atcatcttaa ttctcgatta gggtttcata gatatcatcc gatttgttca 2400 aataatttga gttttgtcga ataattactc ttcgatttgt gatttctatc tagatctggt 2460 gttagtttct agtttgtgcg atcgaatttg tcgattaatc tgagtttttc tgattaacag 2520 atggcttcat ctgagaacgt tatcactgag ttcatgaggt tcaaggtgag gatggaaggt 2580 actgttaacg gacatgagtt cgagatcgag ggtgagggtg aaggtagacc ttacgaggga 2640 cataacaccg ttaagcttaa ggttacaaag ggtggacctc ttcctttcgc ttgggatatc 2700 ctttctcctc aattccaata cggaagcaag gtaagtttgt ggattcttcg tccatgtgat 2760 ctttgagttt ctttagagct tgtgagggat tagtaagtaa caatgcttga gttttttgct 2820 gctgggcttc gaaaagtttg tcacttgttg gtttgatcca caaggtcttc ttctccatag 2880 ctactagaca tgttttagct taagattcaa gtttatatat gccttgtgga ttaatcattg 2940 cctgattctt ccgtgtcatc tctgagttta tttagagctt ggaagtggtg tagtaataac 3000 taacaatact cttgataagt tgtagcaatg ctcttgatta gtggatgtaa tatgatgttg 3060 ataagatata tgaggcacag aaccaaaagt ggtgcttcca ctagacccgt ttttagccta 3120 aggttcaagt ttataccttg tagatgtttc tgtattgtct gattcttccc tgtgatattt 3180 gaatttctta gagctttgga agtgatatag gaacaatgct cttgtgtgtt tgtctctatg 3240 aagattatcg ctgtcgtgtt tcatccgagt gtgcgggatt ttttgctgct gggtttagcc 3300 tttcttcaaa aagttattac ttgttagttt tattgttttg gtcttgataa gagatgttag 3360 gacagacatg gtgcttcttg tctatagcca ctagacctat tttagcataa ggttaacgaa 3420 attctctcta cataccttgt ggatttgttt acattgcctg atctttcctg tgatcgctgt 3480 catgtttctt tggaatgatt gatgtttata aatggaaaaa tctttgtgca gaagactccc 3540 gcccatctct ctatgcccgg gacaagtgcc accccacagt ggggcaggat gaggatgacc 3600 accatggggt cgcagcgtgt gcgtgtccgt cgtacgttct ggccggccgg gccttgggcg 3660 cgcgatcaga agcgttgcgt tggcgtgtgt gtgcttctgg tttgctttaa ttttaccaag 3720 tttgtttcaa ggtggatcgc gtggtcaagg cccgtgtgct ttaaagaccc accggcactg 3780 gcagtgagtg ttgctgcttg tgtaggcttt ggtacgtatg ggctttattt gcttctggat 3840 gttgtgtact acttgggttt gttgaattat tatgagcagt tgcgtattgt aattcagctg 3900 ggctacctgg acattgttat gtattaataa atgctttgct ttcttctaaa gatctttaag 3960 tgctgtttaa acaaccgaca accactttgc ggacttcctt tcaagagaat tcaataaggt 4020 taattcctaa ttgaaatccg aagataagat tcccacacac ttgtggctga tatcaaaagg 4080 ctactgccta tttaaacaca tctctggaga ctgagaaaat cagacctcca agcatgaaga 4140 agcctgagct tactgctact tctgttgaga agttcctcat cgagaagttc gattctgtgt 4200 ctgatcttat gcagctctct gagggtgagg aatcaagagc tttctctttc gatgttggtg 4260 gaagaggata cgttctcaga gttaactctt gcgctgacgg attctacaag gatagatacg 4320 tgtacagaca cttcgcttca gctgctctcc ctatccctga agttcttgat atcggagagt 4380 tctctgagtc tcttacctac tgtatctcaa gaagggctca gggtgttact cttcaagatc 4440 ttcctgagac tgagcttcct gctgttcttc aacctgttgc tgaggctatg gatgctatcg 4500 ctgctgctga tctttctcaa acttctggat tcggaccttt cggtcctcag ggaatcggac 4560 agtacactac ttggagagat ttcatctgcg ctatcgctga tcctcatgtt taccattggc 4620 agaccgttat ggatgatacc gtttctgctt ctgttgctca agctcttgat gagcttatgc 4680 tttgggctga ggattgtcct gaggttagac atcttgttca cgctgatttc ggatctaaca 4740 acgttctcac cgataacgga agaatcaccg ctgttatcga ttggtctgag gctatgttcg 4800 gagattctca atacgaggtg gccaacatat tcttttggag gccttggctt gcttgtatgg 4860 aacaacagac tagatacttc gagagaaggc atcctgagct tgctggatct cctagactta 4920 gagcttacat gcttaggatc ggacttgatc agctttacca gtctctcgtt gatggaaact 4980 tcgatgatgc tgcttgggct cagggaagat gtgatgctat cgttagatct ggtgctggaa 5040 ctgttggaag aactcaaatc gctagaagat ctgctgctgt ttggactgat ggatgtgttg 5100 aagttctcgc tgattctgga aacagaaggc cttctactag acctagagcc aagaagtgaa 5160 gatcggcggc aatagcttct tagcgccatc ccgggttgat cctatctgtg ttgaaatagt 5220 tgcggtgggc aaggctctct ttcagaaaga caggcggcca aaggaaccca aggtgaggtg 5280 ggctatggct ctcagttcct tgtggaagcg cttggtctaa ggtgcagagg tgttagcggg 5340 atgaagcaaa agtgtccgat tgtaacaaga tatgttgatc ctacgtaagg atattaaagt 5400 atgtattcat cactaatata atcagtgtat tccaatatgt actacgattt ccaatgtctt 5460 tattgtcgcc gtatgtaatc ggcgtcacaa aataatcccc ggtgactttc ttttaatcca 5520 ggatgaaata atatgttatt ataatttttg cgatttggtc cgttatagga attgaagtgt 5580 gcttgcggtc gccaccactc ccatttcata attttacatg tatttgaaaa ataaaaattt 5640 atggtattca atttaaacac gtatacttgt aaagaatgat atcttgaaag aaatatagtt 5700 taaatattta ttgataaaat aacaagtcag gtattatagt ccaagcaaaa acataaattt 5760 attgatgcaa gtttaaattc agaaatattt caataactga ttatatcagc tggtacattg 5820 ccgtagatga aagactgagt gcgatattat ggtgtaatac atagtttaaa cgggcccaag 5880 actcccgccc atctctctat gcccgggaca agtgccaccc cacagtgggg caggatgagg 5940 atgaccagtc agttttactt cccttaattt tctatgtact ttcataatta cttatgttat 6000 tttcttcatg agttttaatg caaattacta tatggactct agtgaaaacg ttcagaatcc 6060 tataaacatg actactgaga cgaacttgag agtagttttg atcatacaca cgtttcatgt 6120 ggtacttgag agttactaat ttttgtcatc ttcgtataag tagtaaaaga tactacaaga 6180 atagtttagt agaaaatact agcggtaggt gaagatttgt cgctatgtac tattattgtc 6240 tagtaacttg agtaacaatt tcgtggtcta aatatcaaat aaaaatggat gagtggttca 6300 ccaaatctag gcatcaaaac tattaatgtc attgtctaga tcttaggtga caccacattt 6360 cgaatattta ttggtaattg agatgttaaa gtaccaatat ttgacttaat aaactaaaag 6420 attttggctt tatcaaatgt agacattgat gacatatcgt tgtcattatc ttgagtatat 6480 acaagtcgat caattaggtg aaagtttagt gtctcgtggt tggtaaacga ttaatacagt 6540 agtatatttt atccaaagac aaaatccaaa tcatttcacc agtatgaata gtattatttt 6600 atcttaaaag ctaaaatctt aaaaaccaag gtagcaccca cgttgagcta gacgatcaaa 6660 tcgatttctg ctttgtccaa tttaccaagc tatttaaagc caaataattg aaatataggt 6720 aggtcgttat attaggctaa gatttatctc aaatgcttaa ctaaaggaat aacaagggat 6780 tctagttgtg tggttttata agattggtcc aatttcactt aagtttgttt attgtagaat 6840 tttatatgtg aataatttga attccaattg aaaagatatt atagtaaaag aaaaaatagt 6900 gcgaacaaaa aactttaatc ccataaaaag aaaaagaaaa atgaaaagtt cttctaacat 6960 ccatattttg catcatatca taaagataag aaagatacat atcatagacg tacagataaa 7020 caaacatatc atcatttgtg aaatacatag tacaataatt tgcttttaaa tagagtttaa 7080 gtcacacaca ctgacacaca cgataaaacg ataatgtctg caaaaacact ttaatcccat 7140 tgcctagagg acagcttctc cactttgtct ttaaggttgg ttttgccgtg ttgtttttat 7200 ctttatataa tgatctattt tttggattat gaaatgaatt cacacatttt aattatttaa 7260 gaagatccat atacaggttt ataacagtac taagtgatga ttattttttg tttttgcata 7320 gtttagttta ttgggtaaac attcattacg tgtctcttta tacgaatcac ccatccaaaa 7380 tttcaagtag tcttttagtt catttattat ttcataacta tttgacttat tgatttgaca 7440 agaaacaaca aaagtgttga cttattgata gattgtggga tcataaaagt aattaagcgt 7500 caaccacgac ccacaacaac aaagcacatg ttatacatta atatctcgtt tacttaatta 7560 cagttttcag aatgccgttt catgtcttgt cactggcgat gttattatca tgttggacaa 7620 tattcgactg ttgtcgtttt tacattttcg tattgactaa aactaaaaaa acaaaactct 7680 gtttcaggtt gggcctagga tccacattgt acacacattt gcttaagtct atggaggcgc 7740 aaggttttaa gtctgtggtt gctgttatag gccttccaaa cgatccatct gttaggttgc 7800 atgaggcttt gggatacaca gcccggggta cattgcgcgc agctggatac aagcatggtg 7860 gatggcatga tgttggtttt tggcaaaggg attttgagtt gccagctcct ccaaggccag 7920 ttaggccagt tacccagatc taatatcaaa atctatttag aaatacacaa tattttgttg 7980 caggcttgct ggagaatcga tctgctatca taaaaattac aaaaaaattt tatttgcctc 8040 aattatttta ggattggtat taaggacgct taaattattt gtcgggtcac tacgcatcat 8100 tgtgattgag aagatcagcg atacgaaata ttcgtagtac tatcgataat ttatttgaaa 8160 attcataaga aaagcaaacg ttacatgaat tgatgaaaca atacaaagac agataaagcc 8220 acgcacattt aggatattgg ccgagattac tgaatattga gtaagatcac ggaatttctg 8280 acaggagcat gtcttcaatt cagcccaaat ggcagttgaa atactcaaac cgccccatat 8340 gcaggagcgg atcattcatt gtttgtttgg ttgcctttgc caacatggga gtccaaggtt 8400 gtttaaacat ttaaataccc tgccaagctt gaggtagcct ccaatttgac ggtgccgcca 8460 gcgacgccgt ctggaactgt cctttttgag gaccactccg tttgtggaga tcatgagagt 8520 ccatgctcaa caccgtgcac tagggacagg attgaagact cccgcccatc tcactaggga 8580 caggattgcc accccacagt ggggcctaga aagactggag ttgcagagtt tgtgtcttct 8640 agattaatcc tccaaacttt tgattaacca aaaaaattat caaactaaca tgttctcctt 8700 ttttctttag aaattctaac gaatttatct ttatactgat ttgaatatac ttaatttggt 8760 catttggatg ccctttacaa cctccttacc aaactattga tcacagtttc tattgctaaa 8820 atcaccaaca aaacgcatgt cgccattcat aattatggtt tcacacctac aactaggcta 8880 ataagtaaat aagtagacaa ctagactcag gtttgaaaaa accataaaag ccatatagcg 8940 ttttctcatt gaaactgcga acacgatcgt gtgaatgttg cagtttctag ttttgataca 9000 aacaaacaaa aacacaattt aatcttagat taaaaagaaa aaagagaacg gagcccacta 9060 gccactcctt caaacgtgtc ttaccaactc tcttctagaa acaaattagg cttcaccttc 9120 ctcttccaac ctctctctct ctctctctct ctttttctca aaccatctct ccataaagcc 9180 ctaatttctt catcacaaga atcagaagaa gaaagatgga cctgcatcta attttcggtc 9240 caacttgcac aggaaagacg acgaccgcga tagctcttgc ccagcagaca gggcttccag 9300 tcctttcgct tgatcgggtc caatgctgtc ctcaactatc aaccggaagc ggacgaccaa 9360 cagtggaaga actgaaagga acgacgcgtc tctaccttga tgatcggcct ctggtggagg 9420 gtatcatcgc agccaagcaa gctcatcata ggctgatcga ggaggtgtat aatcatgagg 9480 ccaacggcgg gcttattctt gagggaggat ccacctcgtt gctcaactgc atggcgcgaa 9540 acagctattg gagtgcagat tttcgttggc atattattcg ccacaagtta cccgaccaag 9600 agaccttcat gaaagcggcc aaggccagag ttaagcagat gttgcacccc gctgcaggcc 9660 attctattat tcaagagttg gtttatcttt ggaatgaacc tcggctgagg cccattctga 9720 aagagatcga tggatatcga tatgccatgt tgtttgctag ccagaaccag atcacggcag 9780 atatgctatt gcagcttgac gcaaatatgg aaggtaagtt gattaatggg atcgctcagg 9840 agtatttcat ccatgcgcgc caacaggaac agaaattccc ccaagttaac gcagccgctt 9900 tcgacggatt cgaaggtcat ccgttcggaa tgtattagaa atcaccagtc tctctctaca 9960 aatctatctc tctctatttt tctccagaat aatgtgtgag tagttcccag ataagggaat 10020 tagggttctt atagggtttc gctcatgtgt tgagcatata agaaaccctt agtatgtatt 10080 tgtatttgta aaatacttct atcaataaaa tttctaattc ctaaaaccaa aatccagtgt 10140 ttaaacgagt ccatgctcaa caccgtgcac tagggacagg attgaagact cccgcccatc 10200 tcactaggga caggattgcc accccacagt ggggcctaga aagactggag ttgcagacat 10260 taaggatgac cagttcgtaa aggtcctgcg gtgtctattg cttttcatag gttaataagt 10320 gtttgctaga ctgtggtgaa aggcctatcc gaagtaaggc cggccggatc cttcatcttt 10380 ggacaaggga ataaagactc cccacttgct actaagaaca atacctaagt tgcccagaca 10440 tgactgtacc cattcagaga cctaccaccc attagggcta tgacactaac actagcccct 10500 ggaggttgac catgctaggc agtgggggtc tcacctatga cccactcaga taggggttta 10560 aaccagtggg tgggatctca gcctcatata ggtgtttgtg gtgagctttc tcctagacaa 10620 gagaaccctg aagaacagca agaaccagct aatatgatat gtagacatag tgggttgctc 10680 aaattttgtg tttagtcata ttagaattga cctcagtgac cactcagaaa gtgcccaagc 10740 ccatctatag gggccaaagt gctattgact ggtgtgtctg tgaattgttc ctccctacag 10800 agttggtgct gatatatcct agcattcttt ggaaaaccta gctagggact gtcaagtgta 10860 agatacctcc tgaattggag ggaacactag ctgccctgta ccttctggct agtaccttac 10920 accctgaatg ggttaggggg tctattattt gctggaaata taccagtttc agtagggctg 10980 ctgccttagg tcccacaagg tgtaacatgt gctcaatagt tgcactacca catgcacgtg 11040 aacttaatga tgttatagcc acaacaccaa ccttggtttg cagtttgaca tccctctgga 11100 atgggtgtag tcatcttgct ctggatctgc ctgaatcatt ggggctgtat gcagcctggg 11160 cttaaagtga agaatgggat gtcccagaaa tattttgggt gagaagaatc ctggagtaga 11220 tggtgacctg actatccctg tcctatgggc acaatctatc atcagatatt gcattcaaag 11280 ggctatcatg ggatcaagtc ctaagtcaac tgttgtttac ctggcagaca ttcatctagg 11340 agttctcttt tatgccaccc cacagtgatc cgccttttgc agtttatcca ctagggacag 11400 gattgccacc ccacagtggg gcctctatgc ccgggacaag tgtaaaatat agagtatagg 11460 ggttatcatc acagagaagc tattgctgga gggcctctgt tatttcctct ccatgccact 11520 cccattttta acctaccaac tgaaatccca agggagactc caccctgtaa ctagagtcct 11580 cagaggtgag ccatcccata ttaacaaatg ggcattaggg ctaggatgcc aagggatacc 11640 tgaaatggga agttgtgggg ctgagtcctc ctgggaatca gagataatat gtaaacagtt 11700 tgttgagaga ttgatgagag ctgactttga gaggtggcca tgctccctgg tcctcaatag 11760 ggaaggcact acacaagaaa cctgggtttg atcaactgca ctgtgtccta ctcacacatt 11820 gtgtgcctgg aaaaatgtta cttagtattt ggagggcctc cagaaccccc ctgggtgcaa 11880 gactgggtgc tagtgactgg gtgaatgagt cttggacaca gtggccttgt ctaggttgtg 11940 tgaggtggct aggcatcatg gcaatacctc ataattgatg agtgaggaaa caagactaag 12000 tccttgactc ctcttattac atgacctggt ggatattatg tttaaactct gcaagctgga 12060 atgagtactg ggtgcagatc ccctgggatt ctggctacaa aggtgaatga tagctagtct 12120 gtttattagt agccaaaaaa gtcagtgagg ggtgagtgcc ctgggatgtt gttaagttca 12180 cattgcacac ttggagaccc tctccatcca gtaacatacc agagaaaact gaccaagccc 12240 tcatgggtgt atgggaacaa caaacctcct ggctacttca agggcacata acaccagcaa 12300 ggagcctgtc ataaccacca tctcaaacaa tagaacttcc taagtgaagc aatgacttca 12360 aatctacttg aaggcatgga gtataagcca tgttcctttc agaggggact gtacttctgt 12420 agattacttt ccctcattaa ccagatctgg ccggccgcat gcgtactcgg ccacgactgg 12480 taatttaatt ttcaatttat tttttcttca acttcttaat tttgatatgt ttatatgttt 12540 tttcgttttt tgcatcgtct ttgatttctt gaacgcacgt tcgatatgag attttcactg 12600 acttcaagat ttgattctct tcaggtttac ttttaaaaaa aaaaattatt atgttcaccc 12660 aaattggcct attttaaaag caaaagggga tctaagattt ttaattcttc tctttttcag 12720 tcgtaacact gctaactttt ttttttgatc aaatcgtaac actcataagt cctaactaaa 12780 catctttttc tttcctataa ttattgttgg ttccgcattt tatggatcta cgtttgaaag 12840 tttcaataaa acacatttta ttgtttgaaa gtaacaatat aattactgta tattgattct 12900 tttaattatt gtgtgttgtt ccaatctact ttcgaaatat agtcatgtga cacgtcatat 12960 tctatttttg ttaccttgtt ggaacgtttg aattgagtaa agtttaatta acattgtgca 13020 ataaatgata aacatgttta tgatgtaaaa ttcaatttga ataatacagt ggacatggga 13080 gcttctcaga cattcctctt ctgaatactg cggttggtca tattcttcat tccttcattc 13140 tcgttccata ccatggttgg taagtcattt atttaaacat ctttttcatg caaatttatt 13200 cttgttttcg tatttcttac attttccttg tcattcttgg tgcatgttag caaactgtaa 13260 tctgataact gaaaatatat taattttcca tagtaaaata atgcatgtga ctaaaagcat 13320 caaaatcttt agcatcgaag aaaaaagaac caaactttta tttaatgcta tgggcctatt 13380 tatggtccaa ttagctatta tcatatgaca tgtccttgaa taaattaatg tagcttcata 13440 tgtgagttta ataatattta ta 13462 <210> 81 <211> 13462 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 81 ggtttctttt ttaatttaat ttattttttt aatcggagaa aaaaattaag aaaccaaaaa 60 acagttttaa tcatggcctc atgttggggt tgagttttat attctgataa gaatcccatc 120 ttaaaaaccc cgttaaacat gctcttacca tctgcttcga aaatgatatg ttattgacaa 180 ttccaatttc atttttatga aaataaaata atagtttatt ttataactga gggtggttgc 240 aggagaataa gccatcggac acaccaccag aaccatggcc atgttgaaaa cgacgagtct 300 tgggttccgg taatctttcc ctctctcata ttttttttct tttttttgaa attctttcat 360 tttaattttc ttaggattct atgtatttat tttaatcaat cctttttcca gtttgaggct 420 aggacgacca cttgtcagat ttgtcgttta gctgtagtaa acaactgatt taaattgttt 480 atagtactgt agttaacttt aacaacggac cacttatatt cgagccattg gcataaaatg 540 attcttctcg aaattcgttt acttttctta gtatttttca attttggagt ttacgtagaa 600 ctaataaaaa gaaaaactta taaacacacc acatgcaatg aataaattcg aatatataac 660 catactgtta aatattaatt tacattttaa tcttaatttt gcattccagt tgccagaaaa 720 attatacaag aatttgtccc acagtacacg gatgctcaga tacactgtcc ctctccccat 780 gctcgcttac cctctctatc tggtaaatcc taattcctaa tttttcttcc tgattataat 840 tacaattttg aatttttaga ttttgagtat taactaaata taaattaaat ttgtttgggg 900 atgactacag tggtacagaa gtcctggtaa agaagggtca cattataacc catacagtag 960 tttatttgcc ccaagcgaga gaaagcttat tgcaacttca ggtaccgcct tttgcagttt 1020 atctctatgc ccgggacaag tggagtccat gctcaacacc gtgcaggatg aggatgacca 1080 ccgcggtagc gacttcgtgg gcgaggaaag cctttcgtcc aaggtggtcc ctcctcgcaa 1140 tcttgttgga tggtgaatat tataaaagcc tgcccttctc gcgggtgttt aaacgtcgac 1200 ctgcaggtca acggatcagg atattcttgt ttaagatgtt gaactctatg gaggtttgta 1260 tgaactgatg atctaggacc ggataagttc ccttcttcat agcgaactta ttcaaagaat 1320 gttttgtgta tcattcttgt tacattgtta ttaatgaaaa aatattattg gtcattggac 1380 tgaacacgag tgttaaatat ggaccaggcc ccaaataaga tccattgata tatgaattaa 1440 ataacaagaa taaatcgagt caccaaacca cttgcctttt ttaacgagac ttgttcacca 1500 acttgataca aaagtcatta tcctatgcaa atcaataatc atacaaaaat atccaataac 1560 actaaaaaat taaaagaaat ggataatttc acaatatgtt atacgataaa gaagttactt 1620 ttccaagaaa ttcactgatt ttataagccc acttgcatta gataaatggc aaaaaaaaac 1680 aaaaaggaaa agaaataaag cacgaagaat tctagaaaat acgaaatacg cttcaatgca 1740 gtgggaccca cggttcaatt attgccaatt ttcagctcca ccgtatattt aaaaaataaa 1800 acgataatgc taaaaaaata taaatcgtaa cgatcgttaa atctcaacgg ctggatctta 1860 tgacgaccgt tagaaattgt ggttgtcgac gagtcagtaa taaacggcgt caaagtggtt 1920 gcagccggca cacacgagtc gtgtttatca actcaaagca caaatacttt tcctcaacct 1980 aaaaataagg caattagcca aaaacaactt tgcgtgtaaa caacgctcaa tacacgtgtc 2040 attttattat tagctattgc ttcaccgcct tagctttctc gtgacctagt cgtcctcgtc 2100 ttttcttctt cttcttctat aaaacaatac ccaaagagct cttcttcttc acaattcaga 2160 tttcaatttc tcaaaatctt aaaaactttc tctcaattct ctctaccgtg atcaaggtaa 2220 atttctgtgt tccttattct ctcaaaatct tcgattttgt tttcgttcga tcccaatttc 2280 gtatatgttc tttggtttag attctgttaa tcttagatcg aagacgattt tctgggtttg 2340 atcgttagat atcatcttaa ttctcgatta gggtttcata gatatcatcc gatttgttca 2400 aataatttga gttttgtcga ataattactc ttcgatttgt gatttctatc tagatctggt 2460 gttagtttct agtttgtgcg atcgaatttg tcgattaatc tgagtttttc tgattaacag 2520 atggcttcat ctgagaacgt tatcactgag ttcatgaggt tcaaggtgag gatggaaggt 2580 actgttaacg gacatgagtt cgagatcgag ggtgagggtg aaggtagacc ttacgaggga 2640 cataacaccg ttaagcttaa ggttacaaag ggtggacctc ttcctttcgc ttgggatatc 2700 ctttctcctc aattccaata cggaagcaag gtaagtttgt ggattcttcg tccatgtgat 2760 ctttgagttt ctttagagct tgtgagggat tagtaagtaa caatgcttga gttttttgct 2820 gctgggcttc gaaaagtttg tcacttgttg gtttgatcca caaggtcttc ttctccatag 2880 ctactagaca tgttttagct taagattcaa gtttatatat gccttgtgga ttaatcattg 2940 cctgattctt ccgtgtcatc tctgagttta tttagagctt ggaagtggtg tagtaataac 3000 taacaatact cttgataagt tgtagcaatg ctcttgatta gtggatgtaa tatgatgttg 3060 ataagatata tgaggcacag aaccaaaagt ggtgcttcca ctagacccgt ttttagccta 3120 aggttcaagt ttataccttg tagatgtttc tgtattgtct gattcttccc tgtgatattt 3180 gaatttctta gagctttgga agtgatatag gaacaatgct cttgtgtgtt tgtctctatg 3240 aagattatcg ctgtcgtgtt tcatccgagt gtgcgggatt ttttgctgct gggtttagcc 3300 tttcttcaaa aagttattac ttgttagttt tattgttttg gtcttgataa gagatgttag 3360 gacagacatg gtgcttcttg tctatagcca ctagacctat tttagcataa ggttaacgaa 3420 attctctcta cataccttgt ggatttgttt acattgcctg atctttcctg tgatcgctgt 3480 catgtttctt tggaatgatt gatgtttata aatggaaaaa tctttgtgca gaagactccc 3540 gcccatctct ctatgcccgg gacaagtgcc accccacagt ggggcaggat gaggatgacc 3600 accatggggt cgcagcgtgt gcgtgtccgt cgtacgttct ggccggccgg gccttgggcg 3660 cgcgatcaga agcgttgcgt tggcgtgtgt gtgcttctgg tttgctttaa ttttaccaag 3720 tttgtttcaa ggtggatcgc gtggtcaagg cccgtgtgct ttaaagaccc accggcactg 3780 gcagtgagtg ttgctgcttg tgtaggcttt ggtacgtatg ggctttattt gcttctggat 3840 gttgtgtact acttgggttt gttgaattat tatgagcagt tgcgtattgt aattcagctg 3900 ggctacctgg acattgttat gtattaataa atgctttgct ttcttctaaa gatctttaag 3960 tgctgtttaa acaaccgaca accactttgc ggacttcctt tcaagagaat tcaataaggt 4020 taattcctaa ttgaaatccg aagataagat tcccacacac ttgtggctga tatcaaaagg 4080 ctactgccta tttaaacaca tctctggaga ctgagaaaat cagacctcca agcatgaaga 4140 agcctgagct tactgctact tctgttgaga agttcctcat cgagaagttc gattctgtgt 4200 ctgatcttat gcagctctct gagggtgagg aatcaagagc tttctctttc gatgttggtg 4260 gaagaggata cgttctcaga gttaactctt gcgctgacgg attctacaag gatagatacg 4320 tgtacagaca cttcgcttca gctgctctcc ctatccctga agttcttgat atcggagagt 4380 tctctgagtc tcttacctac tgtatctcaa gaagggctca gggtgttact cttcaagatc 4440 ttcctgagac tgagcttcct gctgttcttc aacctgttgc tgaggctatg gatgctatcg 4500 ctgctgctga tctttctcaa acttctggat tcggaccttt cggtcctcag ggaatcggac 4560 agtacactac ttggagagat ttcatctgcg ctatcgctga tcctcatgtt taccattggc 4620 agaccgttat ggatgatacc gtttctgctt ctgttgctca agctcttgat gagcttatgc 4680 tttgggctga ggattgtcct gaggttagac atcttgttca cgctgatttc ggatctaaca 4740 acgttctcac cgataacgga agaatcaccg ctgttatcga ttggtctgag gctatgttcg 4800 gagattctca atacgaggtg gccaacatat tcttttggag gccttggctt gcttgtatgg 4860 aacaacagac tagatacttc gagagaaggc atcctgagct tgctggatct cctagactta 4920 gagcttacat gcttaggatc ggacttgatc agctttacca gtctctcgtt gatggaaact 4980 tcgatgatgc tgcttgggct cagggaagat gtgatgctat cgttagatct ggtgctggaa 5040 ctgttggaag aactcaaatc gctagaagat ctgctgctgt ttggactgat ggatgtgttg 5100 aagttctcgc tgattctgga aacagaaggc cttctactag acctagagcc aagaagtgaa 5160 gatcggcggc aatagcttct tagcgccatc ccgggttgat cctatctgtg ttgaaatagt 5220 tgcggtgggc aaggctctct ttcagaaaga caggcggcca aaggaaccca aggtgaggtg 5280 ggctatggct ctcagttcct tgtggaagcg cttggtctaa ggtgcagagg tgttagcggg 5340 atgaagcaaa agtgtccgat tgtaacaaga tatgttgatc ctacgtaagg atattaaagt 5400 atgtattcat cactaatata atcagtgtat tccaatatgt actacgattt ccaatgtctt 5460 tattgtcgcc gtatgtaatc ggcgtcacaa aataatcccc ggtgactttc ttttaatcca 5520 ggatgaaata atatgttatt ataatttttg cgatttggtc cgttatagga attgaagtgt 5580 gcttgcggtc gccaccactc ccatttcata attttacatg tatttgaaaa ataaaaattt 5640 atggtattca atttaaacac gtatacttgt aaagaatgat atcttgaaag aaatatagtt 5700 taaatattta ttgataaaat aacaagtcag gtattatagt ccaagcaaaa acataaattt 5760 attgatgcaa gtttaaattc agaaatattt caataactga ttatatcagc tggtacattg 5820 ccgtagatga aagactgagt gcgatattat ggtgtaatac atagtttaaa cgggcccaag 5880 actcccgccc atctctctat gcccgggaca agtgccaccc cacagtgggg caggatgagg 5940 atgaccagtc agttttactt cccttaattt tctatgtact ttcataatta cttatgttat 6000 tttcttcatg agttttaatg caaattacta tatggactct agtgaaaacg ttcagaatcc 6060 tataaacatg actactgaga cgaacttgag agtagttttg atcatacaca cgtttcatgt 6120 ggtacttgag agttactaat ttttgtcatc ttcgtataag tagtaaaaga tactacaaga 6180 atagtttagt agaaaatact agcggtaggt gaagatttgt cgctatgtac tattattgtc 6240 tagtaacttg agtaacaatt tcgtggtcta aatatcaaat aaaaatggat gagtggttca 6300 ccaaatctag gcatcaaaac tattaatgtc attgtctaga tcttaggtga caccacattt 6360 cgaatattta ttggtaattg agatgttaaa gtaccaatat ttgacttaat aaactaaaag 6420 attttggctt tatcaaatgt agacattgat gacatatcgt tgtcattatc ttgagtatat 6480 acaagtcgat caattaggtg aaagtttagt gtctcgtggt tggtaaacga ttaatacagt 6540 agtatatttt atccaaagac aaaatccaaa tcatttcacc agtatgaata gtattatttt 6600 atcttaaaag ctaaaatctt aaaaaccaag gtagcaccca cgttgagcta gacgatcaaa 6660 tcgatttctg ctttgtccaa tttaccaagc tatttaaagc caaataattg aaatataggt 6720 aggtcgttat attaggctaa gatttatctc aaatgcttaa ctaaaggaat aacaagggat 6780 tctagttgtg tggttttata agattggtcc aatttcactt aagtttgttt attgtagaat 6840 tttatatgtg aataatttga attccaattg aaaagatatt atagtaaaag aaaaaatagt 6900 gcgaacaaaa aactttaatc ccataaaaag aaaaagaaaa atgaaaagtt cttctaacat 6960 ccatattttg catcatatca taaagataag aaagatacat atcatagacg tacagataaa 7020 caaacatatc atcatttgtg aaatacatag tacaataatt tgcttttaaa tagagtttaa 7080 gtcacacaca ctgacacaca cgataaaacg ataatgtctg caaaaacact ttaatcccat 7140 tgcctagagg acagcttctc cactttgtct ttaaggttgg ttttgccgtg ttgtttttat 7200 ctttatataa tgatctattt tttggattat gaaatgaatt cacacatttt aattatttaa 7260 gaagatccat atacaggttt ataacagtac taagtgatga ttattttttg tttttgcata 7320 gtttagttta ttgggtaaac attcattacg tgtctcttta tacgaatcac ccatccaaaa 7380 tttcaagtag tcttttagtt catttattat ttcataacta tttgacttat tgatttgaca 7440 agaaacaaca aaagtgttga cttattgata gattgtggga tcataaaagt aattaagcgt 7500 caaccacgac ccacaacaac aaagcacatg ttatacatta atatctcgtt tacttaatta 7560 cagttttcag aatgccgttt catgtcttgt cactggcgat gttattatca tgttggacaa 7620 tattcgactg ttgtcgtttt tacattttcg tattgactaa aactaaaaaa acaaaactct 7680 gtttcaggtt gggcctagga tccacattgt acacacattt gcttaagtct atggaggcgc 7740 aaggttttaa gtctgtggtt gctgttatag gccttccaaa cgatccatct gttaggttgc 7800 atgaggcttt gggatacaca gcccggggta cattgcgcgc agctggatac aagcatggtg 7860 gatggcatga tgttggtttt tggcaaaggg attttgagtt gccagctcct ccaaggccag 7920 ttaggccagt tacccagatc taatatcaaa atctatttag aaatacacaa tattttgttg 7980 caggcttgct ggagaatcga tctgctatca taaaaattac aaaaaaattt tatttgcctc 8040 aattatttta ggattggtat taaggacgct taaattattt gtcgggtcac tacgcatcat 8100 tgtgattgag aagatcagcg atacgaaata ttcgtagtac tatcgataat ttatttgaaa 8160 attcataaga aaagcaaacg ttacatgaat tgatgaaaca atacaaagac agataaagcc 8220 acgcacattt aggatattgg ccgagattac tgaatattga gtaagatcac ggaatttctg 8280 acaggagcat gtcttcaatt cagcccaaat ggcagttgaa atactcaaac cgccccatat 8340 gcaggagcgg atcattcatt gtttgtttgg ttgcctttgc caacatggga gtccaaggtt 8400 gtttaaacat ttaaataccc tgccaagctt gaggtagcct ccaatttgac ggtgccgcca 8460 gcgacgccgt ctggaactgt cctttttgag gaccactccg tttgtggaga tcatgagagt 8520 ccatgctcaa caccgtgcac tagggacagg attgaagact cccgcccatc tcactaggga 8580 caggattgcc accccacagt ggggcctaga aagactggag ttgcagagtt tgtgtcttct 8640 agattaatcc tccaaacttt tgattaacca aaaaaattat caaactaaca tgttctcctt 8700 ttttctttag aaattctaac gaatttatct ttatactgat ttgaatatac ttaatttggt 8760 catttggatg ccctttacaa cctccttacc aaactattga tcacagtttc tattgctaaa 8820 atcaccaaca aaacgcatgt cgccattcat aattatggtt tcacacctac aactaggcta 8880 ataagtaaat aagtagacaa ctagactcag gtttgaaaaa accataaaag ccatatagcg 8940 ttttctcatt gaaactgcga acacgatcgt gtgaatgttg cagtttctag ttttgataca 9000 aacaaacaaa aacacaattt aatcttagat taaaaagaaa aaagagaacg gagcccacta 9060 gccactcctt caaacgtgtc ttaccaactc tcttctagaa acaaattagg cttcaccttc 9120 ctcttccaac ctctctctct ctctctctct ctttttctca aaccatctct ccataaagcc 9180 ctaatttctt catcacaaga atcagaagaa gaaagatgga cctgcatcta attttcggtc 9240 caacttgcac aggaaagacg acgaccgcga tagctcttgc ccagcagaca gggcttccag 9300 tcctttcgct tgatcgggtc caatgctgtc ctcaactatc aaccggaagc ggacgaccaa 9360 cagtggaaga actgaaagga acgacgcgtc tctaccttga tgatcggcct ctggtggagg 9420 gtatcatcgc agccaagcaa gctcatcata ggctgatcga ggaggtgtat aatcatgagg 9480 ccaacggcgg gcttattctt gagggaggat ccacctcgtt gctcaactgc atggcgcgaa 9540 acagctattg gagtgcagat tttcgttggc atattattcg ccacaagtta cccgaccaag 9600 agaccttcat gaaagcggcc aaggccagag ttaagcagat gttgcacccc gctgcaggcc 9660 attctattat tcaagagttg gtttatcttt ggaatgaacc tcggctgagg cccattctga 9720 aagagatcga tggatatcga tatgccatgt tgtttgctag ccagaaccag atcacggcag 9780 atatgctatt gcagcttgac gcaaatatgg aaggtaagtt gattaatggg atcgctcagg 9840 agtatttcat ccatgcgcgc caacaggaac agaaattccc ccaagttaac gcagccgctt 9900 tcgacggatt cgaaggtcat ccgttcggaa tgtattagaa atcaccagtc tctctctaca 9960 aatctatctc tctctatttt tctccagaat aatgtgtgag tagttcccag ataagggaat 10020 tagggttctt atagggtttc gctcatgtgt tgagcatata agaaaccctt agtatgtatt 10080 tgtatttgta aaatacttct atcaataaaa tttctaattc ctaaaaccaa aatccagtgt 10140 ttaaacgagt ccatgctcaa caccgtgcac tagggacagg attgaagact cccgcccatc 10200 tcactaggga caggattgcc accccacagt ggggcctaga aagactggag ttgcagacat 10260 taaggatgac cagttcgtaa aggtcctgcg gtgtctattg cttttcatag gttaataagt 10320 gtttgctaga ctgtggtgaa aggcctatcc gaagtaaggc cggccggatc cttcatcttt 10380 ggacaaggga ataaagactc cccacttgct actaagaaca atacctaagt tgcccagaca 10440 tgactgtacc cattcagaga cctaccaccc attagggcta tgacactaac actagcccct 10500 ggaggttgac catgctaggc agtgggggtc tcacctatga cccactcaga taggggttta 10560 aaccagtggg tgggatctca gcctcatata ggtgtttgtg gtgagctttc tcctagacaa 10620 gagaaccctg aagaacagca agaaccagct aatatgatat gtagacatag tgggttgctc 10680 aaattttgtg tttagtcata ttagaattga cctcagtgac cactcagaaa gtgcccaagc 10740 ccatctatag gggccaaagt gctattgact ggtgtgtctg tgaattgttc ctccctacag 10800 agttggtgct gatatatcct agcattcttt ggaaaaccta gctagggact gtcaagtgta 10860 agatacctcc tgaattggag ggaacactag ctgccctgta ccttctggct agtaccttac 10920 accctgaatg ggttaggggg tctattattt gctggaaata taccagtttc agtagggctg 10980 ctgccttagg tcccacaagg tgtaacatgt gctcaatagt tgcactacca catgcacgtg 11040 aacttaatga tgttatagcc acaacaccaa ccttggtttg cagtttgaca tccctctgga 11100 atgggtgtag tcatcttgct ctggatctgc ctgaatcatt ggggctgtat gcagcctggg 11160 cttaaagtga agaatgggat gtcccagaaa tattttgggt gagaagaatc ctggagtaga 11220 tggtgacctg actatccctg tcctatgggc acaatctatc atcagatatt gcattcaaag 11280 ggctatcatg ggatcaagtc ctaagtcaac tgttgtttac ctggcagaca ttcatctagg 11340 agttctcttt tatgccaccc cacagtgatc cgccttttgc agtttatcca ctagggacag 11400 gattgccacc ccacagtggg gcctctatgc ccgggacaag tgtaaaatat agagtatagg 11460 ggttatcatc acagagaagc tattgctgga gggcctctgt tatttcctct ccatgccact 11520 cccattttta acctaccaac tgaaatccca agggagactc caccctgtaa ctagagtcct 11580 cagaggtgag ccatcccata ttaacaaatg ggcattaggg ctaggatgcc aagggatacc 11640 tgaaatggga agttgtgggg ctgagtcctc ctgggaatca gagataatat gtaaacagtt 11700 tgttgagaga ttgatgagag ctgactttga gaggtggcca tgctccctgg tcctcaatag 11760 ggaaggcact acacaagaaa cctgggtttg atcaactgca ctgtgtccta ctcacacatt 11820 gtgtgcctgg aaaaatgtta cttagtattt ggagggcctc cagaaccccc ctgggtgcaa 11880 gactgggtgc tagtgactgg gtgaatgagt cttggacaca gtggccttgt ctaggttgtg 11940 tgaggtggct aggcatcatg gcaatacctc ataattgatg agtgaggaaa caagactaag 12000 tccttgactc ctcttattac atgacctggt ggatattatg tttaaactct gcaagctgga 12060 atgagtactg ggtgcagatc ccctgggatt ctggctacaa aggtgaatga tagctagtct 12120 gtttattagt agccaaaaaa gtcagtgagg ggtgagtgcc ctgggatgtt gttaagttca 12180 cattgcacac ttggagaccc tctccatcca gtaacatacc agagaaaact gaccaagccc 12240 tcatgggtgt atgggaacaa caaacctcct ggctacttca agggcacata acaccagcaa 12300 ggagcctgtc ataaccacca tctcaaacaa tagaacttcc taagtgaagc aatgacttca 12360 aatctacttg aaggcatgga gtataagcca tgttcctttc agaggggact gtacttctgt 12420 agattacttt ccctcattaa ccagatctgg ccggccgcat gccttgctgg tcgatcgtgt 12480 tggccactct tgtttatcta tcattcctcg ttggtccagt cacagttcta aaagtctatg 12540 gtgttcctta cattgtaagt ttcatatatt tctttattat atcattgcta atataatttg 12600 tttttgacat aaaagttttg gaaaaatttc agatctttgt aatgtggttg gacgctgtca 12660 cgtacttgca tcatcatggt cacgatgata agctgccttg gtacagaggc aaggtaagta 12720 gatcaacatt atttataaga agcaataatg attagtagtt gaataatctg aatttttgat 12780 gtttttgtac aataatagga atggagttat ttacgtggag gattaacaac tgttgataga 12840 gattacggga tcttcaacaa cattcatcac gatattggaa ctcacgtgat ccatcatctt 12900 ttcccacaaa tccctcacta tcacttggtc gatgccgtga gtgatctcgc tctctctcta 12960 gtttcatttg attatattaa agggtgatta attactaaat tagtgatctt aattaatgac 13020 atgcgacaga cgaaagcagc taaacatgtg ttgggaagat actacagaga accaaagacg 13080 tcaggagcaa taccgatcca cttagtggaa agtttggtgg caagtattaa gaaagatcat 13140 tacgtcagtg acactggtga tattgtcttc tacgagacag atccagatct ctacgtttat 13200 gcttctgaca aatccaaaat caattaatct ttcttcctag ctctatttag gaataaaaca 13260 ctcctttggt tttacttatt tctggttgtt tttaagttaa aaatgtactc gtgaaacttt 13320 tttttattaa atgtatttac attacaaatc gtaaaagttt ttgttcgttt tctctatgtt 13380 tttagttaca aacttacaat caaaaaggtc ttaaaaactt tttgatggtg ggacggacaa 13440 aagaaaaagt tcgactgaga gt 13462 <210> 82 <211> 13462 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 82 aatatttata tatatttgtt ttaatggctt attttattgt taaatggata catcagcttg 60 aaatatctac gaacatgcat cattttccta gatacatttg tttgttgctc aaaaaatgaa 120 taacgtagtt aaacgagtga gattcttagc atctgcctcg aaaacgatat gttattgaca 180 attccaattt catttttatg aaaataaaat aatagtttat tttataattg ggggtggttg 240 caggagaata agccatcgga cacaccacca gaaccatggc catgttgaaa acgacgagtc 300 ttgggttccg gtaatccccc tctcattatt tttttttctt tttttgaaac tctttcattt 360 taattttctt agaattctat gtatttattt taatcaatcc tttttccagt gtgaggcttg 420 gacgaccact tgtcagattt gtcgtttagc tgtagtaaac aactgattta aattgtttat 480 ggtactgtag ttaactttaa caacgggcca cttatattcg agccattggc ataaaatgat 540 tcttctcgaa attcgtttac ttttcttagt atttttcagt tttgtagttt acgtagaact 600 aataaaaaga aaaaaactta taaacacacc acatgcaatg aataaattcg aatatataac 660 catactgtta aatattaatt aacattttaa tcttaatttt gcattccagt tgccagaaaa 720 attatacaag aatttgtccc acagtacacg gatgctcaga tacactgtcc ctctccccat 780 gctcgcttac cctctctatc tggtaaatcc taattcctca tttttcttcc tgattataat 840 tacaattttg aatttttaga ttttgagtat taactaaata taaattaaat ttgtttgggg 900 atgactacag tggtacagaa gtcctggtaa agaagggtca cattataacc catacagtag 960 tttatttgcc ccaagcgaga gaaagcttat tgcaacttca ggtaccgcct tttgcagttt 1020 atctctatgc ccgggacaag tggagtccat gctcaacacc gtgcaggatg aggatgacca 1080 ccgcggtagc gacttcgtgg gcgaggaaag cctttcgtcc aaggtggtcc ctcctcgcaa 1140 tcttgttgga tggtgaatat tataaaagcc tgcccttctc gcgggtgttt aaacgtcgac 1200 ctgcaggtca acggatcagg atattcttgt ttaagatgtt gaactctatg gaggtttgta 1260 tgaactgatg atctaggacc ggataagttc ccttcttcat agcgaactta ttcaaagaat 1320 gttttgtgta tcattcttgt tacattgtta ttaatgaaaa aatattattg gtcattggac 1380 tgaacacgag tgttaaatat ggaccaggcc ccaaataaga tccattgata tatgaattaa 1440 ataacaagaa taaatcgagt caccaaacca cttgcctttt ttaacgagac ttgttcacca 1500 acttgataca aaagtcatta tcctatgcaa atcaataatc atacaaaaat atccaataac 1560 actaaaaaat taaaagaaat ggataatttc acaatatgtt atacgataaa gaagttactt 1620 ttccaagaaa ttcactgatt ttataagccc acttgcatta gataaatggc aaaaaaaaac 1680 aaaaaggaaa agaaataaag cacgaagaat tctagaaaat acgaaatacg cttcaatgca 1740 gtgggaccca cggttcaatt attgccaatt ttcagctcca ccgtatattt aaaaaataaa 1800 acgataatgc taaaaaaata taaatcgtaa cgatcgttaa atctcaacgg ctggatctta 1860 tgacgaccgt tagaaattgt ggttgtcgac gagtcagtaa taaacggcgt caaagtggtt 1920 gcagccggca cacacgagtc gtgtttatca actcaaagca caaatacttt tcctcaacct 1980 aaaaataagg caattagcca aaaacaactt tgcgtgtaaa caacgctcaa tacacgtgtc 2040 attttattat tagctattgc ttcaccgcct tagctttctc gtgacctagt cgtcctcgtc 2100 ttttcttctt cttcttctat aaaacaatac ccaaagagct cttcttcttc acaattcaga 2160 tttcaatttc tcaaaatctt aaaaactttc tctcaattct ctctaccgtg atcaaggtaa 2220 atttctgtgt tccttattct ctcaaaatct tcgattttgt tttcgttcga tcccaatttc 2280 gtatatgttc tttggtttag attctgttaa tcttagatcg aagacgattt tctgggtttg 2340 atcgttagat atcatcttaa ttctcgatta gggtttcata gatatcatcc gatttgttca 2400 aataatttga gttttgtcga ataattactc ttcgatttgt gatttctatc tagatctggt 2460 gttagtttct agtttgtgcg atcgaatttg tcgattaatc tgagtttttc tgattaacag 2520 atggcttcat ctgagaacgt tatcactgag ttcatgaggt tcaaggtgag gatggaaggt 2580 actgttaacg gacatgagtt cgagatcgag ggtgagggtg aaggtagacc ttacgaggga 2640 cataacaccg ttaagcttaa ggttacaaag ggtggacctc ttcctttcgc ttgggatatc 2700 ctttctcctc aattccaata cggaagcaag gtaagtttgt ggattcttcg tccatgtgat 2760 ctttgagttt ctttagagct tgtgagggat tagtaagtaa caatgcttga gttttttgct 2820 gctgggcttc gaaaagtttg tcacttgttg gtttgatcca caaggtcttc ttctccatag 2880 ctactagaca tgttttagct taagattcaa gtttatatat gccttgtgga ttaatcattg 2940 cctgattctt ccgtgtcatc tctgagttta tttagagctt ggaagtggtg tagtaataac 3000 taacaatact cttgataagt tgtagcaatg ctcttgatta gtggatgtaa tatgatgttg 3060 ataagatata tgaggcacag aaccaaaagt ggtgcttcca ctagacccgt ttttagccta 3120 aggttcaagt ttataccttg tagatgtttc tgtattgtct gattcttccc tgtgatattt 3180 gaatttctta gagctttgga agtgatatag gaacaatgct cttgtgtgtt tgtctctatg 3240 aagattatcg ctgtcgtgtt tcatccgagt gtgcgggatt ttttgctgct gggtttagcc 3300 tttcttcaaa aagttattac ttgttagttt tattgttttg gtcttgataa gagatgttag 3360 gacagacatg gtgcttcttg tctatagcca ctagacctat tttagcataa ggttaacgaa 3420 attctctcta cataccttgt ggatttgttt acattgcctg atctttcctg tgatcgctgt 3480 catgtttctt tggaatgatt gatgtttata aatggaaaaa tctttgtgca gaagactccc 3540 gcccatctct ctatgcccgg gacaagtgcc accccacagt ggggcaggat gaggatgacc 3600 accatggggt cgcagcgtgt gcgtgtccgt cgtacgttct ggccggccgg gccttgggcg 3660 cgcgatcaga agcgttgcgt tggcgtgtgt gtgcttctgg tttgctttaa ttttaccaag 3720 tttgtttcaa ggtggatcgc gtggtcaagg cccgtgtgct ttaaagaccc accggcactg 3780 gcagtgagtg ttgctgcttg tgtaggcttt ggtacgtatg ggctttattt gcttctggat 3840 gttgtgtact acttgggttt gttgaattat tatgagcagt tgcgtattgt aattcagctg 3900 ggctacctgg acattgttat gtattaataa atgctttgct ttcttctaaa gatctttaag 3960 tgctgtttaa acaaccgaca accactttgc ggacttcctt tcaagagaat tcaataaggt 4020 taattcctaa ttgaaatccg aagataagat tcccacacac ttgtggctga tatcaaaagg 4080 ctactgccta tttaaacaca tctctggaga ctgagaaaat cagacctcca agcatgaaga 4140 agcctgagct tactgctact tctgttgaga agttcctcat cgagaagttc gattctgtgt 4200 ctgatcttat gcagctctct gagggtgagg aatcaagagc tttctctttc gatgttggtg 4260 gaagaggata cgttctcaga gttaactctt gcgctgacgg attctacaag gatagatacg 4320 tgtacagaca cttcgcttca gctgctctcc ctatccctga agttcttgat atcggagagt 4380 tctctgagtc tcttacctac tgtatctcaa gaagggctca gggtgttact cttcaagatc 4440 ttcctgagac tgagcttcct gctgttcttc aacctgttgc tgaggctatg gatgctatcg 4500 ctgctgctga tctttctcaa acttctggat tcggaccttt cggtcctcag ggaatcggac 4560 agtacactac ttggagagat ttcatctgcg ctatcgctga tcctcatgtt taccattggc 4620 agaccgttat ggatgatacc gtttctgctt ctgttgctca agctcttgat gagcttatgc 4680 tttgggctga ggattgtcct gaggttagac atcttgttca cgctgatttc ggatctaaca 4740 acgttctcac cgataacgga agaatcaccg ctgttatcga ttggtctgag gctatgttcg 4800 gagattctca atacgaggtg gccaacatat tcttttggag gccttggctt gcttgtatgg 4860 aacaacagac tagatacttc gagagaaggc atcctgagct tgctggatct cctagactta 4920 gagcttacat gcttaggatc ggacttgatc agctttacca gtctctcgtt gatggaaact 4980 tcgatgatgc tgcttgggct cagggaagat gtgatgctat cgttagatct ggtgctggaa 5040 ctgttggaag aactcaaatc gctagaagat ctgctgctgt ttggactgat ggatgtgttg 5100 aagttctcgc tgattctgga aacagaaggc cttctactag acctagagcc aagaagtgaa 5160 gatcggcggc aatagcttct tagcgccatc ccgggttgat cctatctgtg ttgaaatagt 5220 tgcggtgggc aaggctctct ttcagaaaga caggcggcca aaggaaccca aggtgaggtg 5280 ggctatggct ctcagttcct tgtggaagcg cttggtctaa ggtgcagagg tgttagcggg 5340 atgaagcaaa agtgtccgat tgtaacaaga tatgttgatc ctacgtaagg atattaaagt 5400 atgtattcat cactaatata atcagtgtat tccaatatgt actacgattt ccaatgtctt 5460 tattgtcgcc gtatgtaatc ggcgtcacaa aataatcccc ggtgactttc ttttaatcca 5520 ggatgaaata atatgttatt ataatttttg cgatttggtc cgttatagga attgaagtgt 5580 gcttgcggtc gccaccactc ccatttcata attttacatg tatttgaaaa ataaaaattt 5640 atggtattca atttaaacac gtatacttgt aaagaatgat atcttgaaag aaatatagtt 5700 taaatattta ttgataaaat aacaagtcag gtattatagt ccaagcaaaa acataaattt 5760 attgatgcaa gtttaaattc agaaatattt caataactga ttatatcagc tggtacattg 5820 ccgtagatga aagactgagt gcgatattat ggtgtaatac atagtttaaa cgggcccaag 5880 actcccgccc atctctctat gcccgggaca agtgccaccc cacagtgggg caggatgagg 5940 atgaccagtc agttttactt cccttaattt tctatgtact ttcataatta cttatgttat 6000 tttcttcatg agttttaatg caaattacta tatggactct agtgaaaacg ttcagaatcc 6060 tataaacatg actactgaga cgaacttgag agtagttttg atcatacaca cgtttcatgt 6120 ggtacttgag agttactaat ttttgtcatc ttcgtataag tagtaaaaga tactacaaga 6180 atagtttagt agaaaatact agcggtaggt gaagatttgt cgctatgtac tattattgtc 6240 tagtaacttg agtaacaatt tcgtggtcta aatatcaaat aaaaatggat gagtggttca 6300 ccaaatctag gcatcaaaac tattaatgtc attgtctaga tcttaggtga caccacattt 6360 cgaatattta ttggtaattg agatgttaaa gtaccaatat ttgacttaat aaactaaaag 6420 attttggctt tatcaaatgt agacattgat gacatatcgt tgtcattatc ttgagtatat 6480 acaagtcgat caattaggtg aaagtttagt gtctcgtggt tggtaaacga ttaatacagt 6540 agtatatttt atccaaagac aaaatccaaa tcatttcacc agtatgaata gtattatttt 6600 atcttaaaag ctaaaatctt aaaaaccaag gtagcaccca cgttgagcta gacgatcaaa 6660 tcgatttctg ctttgtccaa tttaccaagc tatttaaagc caaataattg aaatataggt 6720 aggtcgttat attaggctaa gatttatctc aaatgcttaa ctaaaggaat aacaagggat 6780 tctagttgtg tggttttata agattggtcc aatttcactt aagtttgttt attgtagaat 6840 tttatatgtg aataatttga attccaattg aaaagatatt atagtaaaag aaaaaatagt 6900 gcgaacaaaa aactttaatc ccataaaaag aaaaagaaaa atgaaaagtt cttctaacat 6960 ccatattttg catcatatca taaagataag aaagatacat atcatagacg tacagataaa 7020 caaacatatc atcatttgtg aaatacatag tacaataatt tgcttttaaa tagagtttaa 7080 gtcacacaca ctgacacaca cgataaaacg ataatgtctg caaaaacact ttaatcccat 7140 tgcctagagg acagcttctc cactttgtct ttaaggttgg ttttgccgtg ttgtttttat 7200 ctttatataa tgatctattt tttggattat gaaatgaatt cacacatttt aattatttaa 7260 gaagatccat atacaggttt ataacagtac taagtgatga ttattttttg tttttgcata 7320 gtttagttta ttgggtaaac attcattacg tgtctcttta tacgaatcac ccatccaaaa 7380 tttcaagtag tcttttagtt catttattat ttcataacta tttgacttat tgatttgaca 7440 agaaacaaca aaagtgttga cttattgata gattgtggga tcataaaagt aattaagcgt 7500 caaccacgac ccacaacaac aaagcacatg ttatacatta atatctcgtt tacttaatta 7560 cagttttcag aatgccgttt catgtcttgt cactggcgat gttattatca tgttggacaa 7620 tattcgactg ttgtcgtttt tacattttcg tattgactaa aactaaaaaa acaaaactct 7680 gtttcaggtt gggcctagga tccacattgt acacacattt gcttaagtct atggaggcgc 7740 aaggttttaa gtctgtggtt gctgttatag gccttccaaa cgatccatct gttaggttgc 7800 atgaggcttt gggatacaca gcccggggta cattgcgcgc agctggatac aagcatggtg 7860 gatggcatga tgttggtttt tggcaaaggg attttgagtt gccagctcct ccaaggccag 7920 ttaggccagt tacccagatc taatatcaaa atctatttag aaatacacaa tattttgttg 7980 caggcttgct ggagaatcga tctgctatca taaaaattac aaaaaaattt tatttgcctc 8040 aattatttta ggattggtat taaggacgct taaattattt gtcgggtcac tacgcatcat 8100 tgtgattgag aagatcagcg atacgaaata ttcgtagtac tatcgataat ttatttgaaa 8160 attcataaga aaagcaaacg ttacatgaat tgatgaaaca atacaaagac agataaagcc 8220 acgcacattt aggatattgg ccgagattac tgaatattga gtaagatcac ggaatttctg 8280 acaggagcat gtcttcaatt cagcccaaat ggcagttgaa atactcaaac cgccccatat 8340 gcaggagcgg atcattcatt gtttgtttgg ttgcctttgc caacatggga gtccaaggtt 8400 gtttaaacat ttaaataccc tgccaagctt gaggtagcct ccaatttgac ggtgccgcca 8460 gcgacgccgt ctggaactgt cctttttgag gaccactccg tttgtggaga tcatgagagt 8520 ccatgctcaa caccgtgcac tagggacagg attgaagact cccgcccatc tcactaggga 8580 caggattgcc accccacagt ggggcctaga aagactggag ttgcagagtt tgtgtcttct 8640 agattaatcc tccaaacttt tgattaacca aaaaaattat caaactaaca tgttctcctt 8700 ttttctttag aaattctaac gaatttatct ttatactgat ttgaatatac ttaatttggt 8760 catttggatg ccctttacaa cctccttacc aaactattga tcacagtttc tattgctaaa 8820 atcaccaaca aaacgcatgt cgccattcat aattatggtt tcacacctac aactaggcta 8880 ataagtaaat aagtagacaa ctagactcag gtttgaaaaa accataaaag ccatatagcg 8940 ttttctcatt gaaactgcga acacgatcgt gtgaatgttg cagtttctag ttttgataca 9000 aacaaacaaa aacacaattt aatcttagat taaaaagaaa aaagagaacg gagcccacta 9060 gccactcctt caaacgtgtc ttaccaactc tcttctagaa acaaattagg cttcaccttc 9120 ctcttccaac ctctctctct ctctctctct ctttttctca aaccatctct ccataaagcc 9180 ctaatttctt catcacaaga atcagaagaa gaaagatgga cctgcatcta attttcggtc 9240 caacttgcac aggaaagacg acgaccgcga tagctcttgc ccagcagaca gggcttccag 9300 tcctttcgct tgatcgggtc caatgctgtc ctcaactatc aaccggaagc ggacgaccaa 9360 cagtggaaga actgaaagga acgacgcgtc tctaccttga tgatcggcct ctggtggagg 9420 gtatcatcgc agccaagcaa gctcatcata ggctgatcga ggaggtgtat aatcatgagg 9480 ccaacggcgg gcttattctt gagggaggat ccacctcgtt gctcaactgc atggcgcgaa 9540 acagctattg gagtgcagat tttcgttggc atattattcg ccacaagtta cccgaccaag 9600 agaccttcat gaaagcggcc aaggccagag ttaagcagat gttgcacccc gctgcaggcc 9660 attctattat tcaagagttg gtttatcttt ggaatgaacc tcggctgagg cccattctga 9720 aagagatcga tggatatcga tatgccatgt tgtttgctag ccagaaccag atcacggcag 9780 atatgctatt gcagcttgac gcaaatatgg aaggtaagtt gattaatggg atcgctcagg 9840 agtatttcat ccatgcgcgc caacaggaac agaaattccc ccaagttaac gcagccgctt 9900 tcgacggatt cgaaggtcat ccgttcggaa tgtattagaa atcaccagtc tctctctaca 9960 aatctatctc tctctatttt tctccagaat aatgtgtgag tagttcccag ataagggaat 10020 tagggttctt atagggtttc gctcatgtgt tgagcatata agaaaccctt agtatgtatt 10080 tgtatttgta aaatacttct atcaataaaa tttctaattc ctaaaaccaa aatccagtgt 10140 ttaaacgagt ccatgctcaa caccgtgcac tagggacagg attgaagact cccgcccatc 10200 tcactaggga caggattgcc accccacagt ggggcctaga aagactggag ttgcagacat 10260 taaggatgac cagttcgtaa aggtcctgcg gtgtctattg cttttcatag gttaataagt 10320 gtttgctaga ctgtggtgaa aggcctatcc gaagtaaggc cggccggatc cttcatcttt 10380 ggacaaggga ataaagactc cccacttgct actaagaaca atacctaagt tgcccagaca 10440 tgactgtacc cattcagaga cctaccaccc attagggcta tgacactaac actagcccct 10500 ggaggttgac catgctaggc agtgggggtc tcacctatga cccactcaga taggggttta 10560 aaccagtggg tgggatctca gcctcatata ggtgtttgtg gtgagctttc tcctagacaa 10620 gagaaccctg aagaacagca agaaccagct aatatgatat gtagacatag tgggttgctc 10680 aaattttgtg tttagtcata ttagaattga cctcagtgac cactcagaaa gtgcccaagc 10740 ccatctatag gggccaaagt gctattgact ggtgtgtctg tgaattgttc ctccctacag 10800 agttggtgct gatatatcct agcattcttt ggaaaaccta gctagggact gtcaagtgta 10860 agatacctcc tgaattggag ggaacactag ctgccctgta ccttctggct agtaccttac 10920 accctgaatg ggttaggggg tctattattt gctggaaata taccagtttc agtagggctg 10980 ctgccttagg tcccacaagg tgtaacatgt gctcaatagt tgcactacca catgcacgtg 11040 aacttaatga tgttatagcc acaacaccaa ccttggtttg cagtttgaca tccctctgga 11100 atgggtgtag tcatcttgct ctggatctgc ctgaatcatt ggggctgtat gcagcctggg 11160 cttaaagtga agaatgggat gtcccagaaa tattttgggt gagaagaatc ctggagtaga 11220 tggtgacctg actatccctg tcctatgggc acaatctatc atcagatatt gcattcaaag 11280 ggctatcatg ggatcaagtc ctaagtcaac tgttgtttac ctggcagaca ttcatctagg 11340 agttctcttt tatgccaccc cacagtgatc cgccttttgc agtttatcca ctagggacag 11400 gattgccacc ccacagtggg gcctctatgc ccgggacaag tgtaaaatat agagtatagg 11460 ggttatcatc acagagaagc tattgctgga gggcctctgt tatttcctct ccatgccact 11520 cccattttta acctaccaac tgaaatccca agggagactc caccctgtaa ctagagtcct 11580 cagaggtgag ccatcccata ttaacaaatg ggcattaggg ctaggatgcc aagggatacc 11640 tgaaatggga agttgtgggg ctgagtcctc ctgggaatca gagataatat gtaaacagtt 11700 tgttgagaga ttgatgagag ctgactttga gaggtggcca tgctccctgg tcctcaatag 11760 ggaaggcact acacaagaaa cctgggtttg atcaactgca ctgtgtccta ctcacacatt 11820 gtgtgcctgg aaaaatgtta cttagtattt ggagggcctc cagaaccccc ctgggtgcaa 11880 gactgggtgc tagtgactgg gtgaatgagt cttggacaca gtggccttgt ctaggttgtg 11940 tgaggtggct aggcatcatg gcaatacctc ataattgatg agtgaggaaa caagactaag 12000 tccttgactc ctcttattac atgacctggt ggatattatg tttaaactct gcaagctgga 12060 atgagtactg ggtgcagatc ccctgggatt ctggctacaa aggtgaatga tagctagtct 12120 gtttattagt agccaaaaaa gtcagtgagg ggtgagtgcc ctgggatgtt gttaagttca 12180 cattgcacac ttggagaccc tctccatcca gtaacatacc agagaaaact gaccaagccc 12240 tcatgggtgt atgggaacaa caaacctcct ggctacttca agggcacata acaccagcaa 12300 ggagcctgtc ataaccacca tctcaaacaa tagaacttcc taagtgaagc aatgacttca 12360 aatctacttg aaggcatgga gtataagcca tgttcctttc agaggggact gtacttctgt 12420 agattacttt ccctcattaa ccagatctgg ccggccgcat gccttgctgg tcgatcatgt 12480 tggccactct tgtttatcta tcattcctcg ttggtccagt cacagttcta aaagtctatg 12540 gtgttcctta cattgtaagt ttcatatatt tcattattat atcattgcta atataatttg 12600 tttttgacat aaagttttgg aaaaatttca gatctttgta atgtggttgg acgctgtcac 12660 gtacttgcat catcatggtc acgatgataa gttgccttgg tacagaggca aggtaagtag 12720 atcaacatta atttataaga agcaacaatg attagtattt gattaatcta aattattgat 12780 gttttgtgta caataatagg aatggagtta tttacgtgga ggattaacaa ctattgatag 12840 agattacggg atcttcaaca acattcatca cgatattgga actcacgtga tccatcatct 12900 tttcccacaa atccctcact atcacttggt tgatgccgtg agtgatctcg ctctctctct 12960 agtttcattt gattaaaatt aaagggtgat taattactaa attagtgatc ttaattaatg 13020 atatgcgaca gacgaaatca gctaaacatg tgttgggaag atactacaga gaaccaaaga 13080 cgtcaggagc aataccgatc cacttggtgg aaagtttggt ggcaagtatt aagaaagatc 13140 attacgtcag tgacactggt gatattgtct tctacgagac agatccagat ctctacgttt 13200 atgcttctga caaatccaaa atcaactaac ctttcttcct agctctattt aggaataaaa 13260 cagtcctttg gtttttactt atttctggtt gtttttaagt taaatgtact cgtgaaactt 13320 tttttaatta aatgtattta cattacaaat caagtttttg ttcgttttct ttatgttttt 13380 agttacaata aataaaggtc ttaaaaactt tttgttggtg gggacaaaag aaaaagttcg 13440 actgagagag tcgacaaaat gc 13462 <210> 83 <211> 13462 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 83 ttttttaatt taatttattt ttttaatcgg agaaaaaaat taagaaacca aaaaacagtt 60 ttaatcatgg cctcatgttg gggttgagtt ttatattctg ataagaatcc catcttaaaa 120 accccgttaa acatgctctt accatctgct tcgaaaatga tatgttattg acaattccaa 180 tttcattttt atgaaaataa aataatagtt tattttataa ctgagggtgg ttgcaggaga 240 ataagccatc ggacacacca ccagaaccat ggccatgttg aaaacgacga gtcttgggtt 300 ccggtaatct ttccctctct catatttttt ttcttttttt tgaaattctt tcattttaat 360 tttcttagga ttctatgtat ttattttaat caatcctttt tccagtttga ggctaggacg 420 accacttgtc agatttgtcg tttagctgta gtaaacaact gatttaaatt gtttatagta 480 ctgtagttaa ctttaacaac ggaccactta tattcgagcc attggcataa aatgattctt 540 ctcgaaattc gtttactttt cttagtattt ttcaattttg gagtttacgt agaactaata 600 aaaagaaaaa cttataaaca caccacatgc aatgaataaa ttcgaatata taaccatact 660 gttaaatatt aatttacatt ttaatcttaa ttttgcattc cagttgccag aaaaattata 720 caagaatttg tcccacagta cacggatgct cagatacact gtccctctcc ccatgctcgc 780 ttaccctctc tatctggtaa atcctaattc ctaatttttc ttcctgatta taattacaat 840 tttgaatttt tagattttga gtattaacta aatataaatt aaatttgttt ggggatgact 900 acagtggtac agaagtcctg gtaaagaagg gtcacattat aacccataca gtagtttatt 960 tgccccaagc gagagaaagc ttattgcaac ttcaactact ggtaccgcct tttgcagttt 1020 atctctatgc ccgggacaag tggagtccat gctcaacacc gtgcaggatg aggatgacca 1080 ccgcggtagc gacttcgtgg gcgaggaaag cctttcgtcc aaggtggtcc ctcctcgcaa 1140 tcttgttgga tggtgaatat tataaaagcc tgcccttctc gcgggtgttt aaacgtcgac 1200 ctgcaggtca acggatcagg atattcttgt ttaagatgtt gaactctatg gaggtttgta 1260 tgaactgatg atctaggacc ggataagttc ccttcttcat agcgaactta ttcaaagaat 1320 gttttgtgta tcattcttgt tacattgtta ttaatgaaaa aatattattg gtcattggac 1380 tgaacacgag tgttaaatat ggaccaggcc ccaaataaga tccattgata tatgaattaa 1440 ataacaagaa taaatcgagt caccaaacca cttgcctttt ttaacgagac ttgttcacca 1500 acttgataca aaagtcatta tcctatgcaa atcaataatc atacaaaaat atccaataac 1560 actaaaaaat taaaagaaat ggataatttc acaatatgtt atacgataaa gaagttactt 1620 ttccaagaaa ttcactgatt ttataagccc acttgcatta gataaatggc aaaaaaaaac 1680 aaaaaggaaa agaaataaag cacgaagaat tctagaaaat acgaaatacg cttcaatgca 1740 gtgggaccca cggttcaatt attgccaatt ttcagctcca ccgtatattt aaaaaataaa 1800 acgataatgc taaaaaaata taaatcgtaa cgatcgttaa atctcaacgg ctggatctta 1860 tgacgaccgt tagaaattgt ggttgtcgac gagtcagtaa taaacggcgt caaagtggtt 1920 gcagccggca cacacgagtc gtgtttatca actcaaagca caaatacttt tcctcaacct 1980 aaaaataagg caattagcca aaaacaactt tgcgtgtaaa caacgctcaa tacacgtgtc 2040 attttattat tagctattgc ttcaccgcct tagctttctc gtgacctagt cgtcctcgtc 2100 ttttcttctt cttcttctat aaaacaatac ccaaagagct cttcttcttc acaattcaga 2160 tttcaatttc tcaaaatctt aaaaactttc tctcaattct ctctaccgtg atcaaggtaa 2220 atttctgtgt tccttattct ctcaaaatct tcgattttgt tttcgttcga tcccaatttc 2280 gtatatgttc tttggtttag attctgttaa tcttagatcg aagacgattt tctgggtttg 2340 atcgttagat atcatcttaa ttctcgatta gggtttcata gatatcatcc gatttgttca 2400 aataatttga gttttgtcga ataattactc ttcgatttgt gatttctatc tagatctggt 2460 gttagtttct agtttgtgcg atcgaatttg tcgattaatc tgagtttttc tgattaacag 2520 atggcttcat ctgagaacgt tatcactgag ttcatgaggt tcaaggtgag gatggaaggt 2580 actgttaacg gacatgagtt cgagatcgag ggtgagggtg aaggtagacc ttacgaggga 2640 cataacaccg ttaagcttaa ggttacaaag ggtggacctc ttcctttcgc ttgggatatc 2700 ctttctcctc aattccaata cggaagcaag gtaagtttgt ggattcttcg tccatgtgat 2760 ctttgagttt ctttagagct tgtgagggat tagtaagtaa caatgcttga gttttttgct 2820 gctgggcttc gaaaagtttg tcacttgttg gtttgatcca caaggtcttc ttctccatag 2880 ctactagaca tgttttagct taagattcaa gtttatatat gccttgtgga ttaatcattg 2940 cctgattctt ccgtgtcatc tctgagttta tttagagctt ggaagtggtg tagtaataac 3000 taacaatact cttgataagt tgtagcaatg ctcttgatta gtggatgtaa tatgatgttg 3060 ataagatata tgaggcacag aaccaaaagt ggtgcttcca ctagacccgt ttttagccta 3120 aggttcaagt ttataccttg tagatgtttc tgtattgtct gattcttccc tgtgatattt 3180 gaatttctta gagctttgga agtgatatag gaacaatgct cttgtgtgtt tgtctctatg 3240 aagattatcg ctgtcgtgtt tcatccgagt gtgcgggatt ttttgctgct gggtttagcc 3300 tttcttcaaa aagttattac ttgttagttt tattgttttg gtcttgataa gagatgttag 3360 gacagacatg gtgcttcttg tctatagcca ctagacctat tttagcataa ggttaacgaa 3420 attctctcta cataccttgt ggatttgttt acattgcctg atctttcctg tgatcgctgt 3480 catgtttctt tggaatgatt gatgtttata aatggaaaaa tctttgtgca gaagactccc 3540 gcccatctct ctatgcccgg gacaagtgcc accccacagt ggggcaggat gaggatgacc 3600 accatggggt cgcagcgtgt gcgtgtccgt cgtacgttct ggccggccgg gccttgggcg 3660 cgcgatcaga agcgttgcgt tggcgtgtgt gtgcttctgg tttgctttaa ttttaccaag 3720 tttgtttcaa ggtggatcgc gtggtcaagg cccgtgtgct ttaaagaccc accggcactg 3780 gcagtgagtg ttgctgcttg tgtaggcttt ggtacgtatg ggctttattt gcttctggat 3840 gttgtgtact acttgggttt gttgaattat tatgagcagt tgcgtattgt aattcagctg 3900 ggctacctgg acattgttat gtattaataa atgctttgct ttcttctaaa gatctttaag 3960 tgctgtttaa acaaccgaca accactttgc ggacttcctt tcaagagaat tcaataaggt 4020 taattcctaa ttgaaatccg aagataagat tcccacacac ttgtggctga tatcaaaagg 4080 ctactgccta tttaaacaca tctctggaga ctgagaaaat cagacctcca agcatgaaga 4140 agcctgagct tactgctact tctgttgaga agttcctcat cgagaagttc gattctgtgt 4200 ctgatcttat gcagctctct gagggtgagg aatcaagagc tttctctttc gatgttggtg 4260 gaagaggata cgttctcaga gttaactctt gcgctgacgg attctacaag gatagatacg 4320 tgtacagaca cttcgcttca gctgctctcc ctatccctga agttcttgat atcggagagt 4380 tctctgagtc tcttacctac tgtatctcaa gaagggctca gggtgttact cttcaagatc 4440 ttcctgagac tgagcttcct gctgttcttc aacctgttgc tgaggctatg gatgctatcg 4500 ctgctgctga tctttctcaa acttctggat tcggaccttt cggtcctcag ggaatcggac 4560 agtacactac ttggagagat ttcatctgcg ctatcgctga tcctcatgtt taccattggc 4620 agaccgttat ggatgatacc gtttctgctt ctgttgctca agctcttgat gagcttatgc 4680 tttgggctga ggattgtcct gaggttagac atcttgttca cgctgatttc ggatctaaca 4740 acgttctcac cgataacgga agaatcaccg ctgttatcga ttggtctgag gctatgttcg 4800 gagattctca atacgaggtg gccaacatat tcttttggag gccttggctt gcttgtatgg 4860 aacaacagac tagatacttc gagagaaggc atcctgagct tgctggatct cctagactta 4920 gagcttacat gcttaggatc ggacttgatc agctttacca gtctctcgtt gatggaaact 4980 tcgatgatgc tgcttgggct cagggaagat gtgatgctat cgttagatct ggtgctggaa 5040 ctgttggaag aactcaaatc gctagaagat ctgctgctgt ttggactgat ggatgtgttg 5100 aagttctcgc tgattctgga aacagaaggc cttctactag acctagagcc aagaagtgaa 5160 gatcggcggc aatagcttct tagcgccatc ccgggttgat cctatctgtg ttgaaatagt 5220 tgcggtgggc aaggctctct ttcagaaaga caggcggcca aaggaaccca aggtgaggtg 5280 ggctatggct ctcagttcct tgtggaagcg cttggtctaa ggtgcagagg tgttagcggg 5340 atgaagcaaa agtgtccgat tgtaacaaga tatgttgatc ctacgtaagg atattaaagt 5400 atgtattcat cactaatata atcagtgtat tccaatatgt actacgattt ccaatgtctt 5460 tattgtcgcc gtatgtaatc ggcgtcacaa aataatcccc ggtgactttc ttttaatcca 5520 ggatgaaata atatgttatt ataatttttg cgatttggtc cgttatagga attgaagtgt 5580 gcttgcggtc gccaccactc ccatttcata attttacatg tatttgaaaa ataaaaattt 5640 atggtattca atttaaacac gtatacttgt aaagaatgat atcttgaaag aaatatagtt 5700 taaatattta ttgataaaat aacaagtcag gtattatagt ccaagcaaaa acataaattt 5760 attgatgcaa gtttaaattc agaaatattt caataactga ttatatcagc tggtacattg 5820 ccgtagatga aagactgagt gcgatattat ggtgtaatac atagtttaaa cgggcccaag 5880 actcccgccc atctctctat gcccgggaca agtgccaccc cacagtgggg caggatgagg 5940 atgaccagtc agttttactt cccttaattt tctatgtact ttcataatta cttatgttat 6000 tttcttcatg agttttaatg caaattacta tatggactct agtgaaaacg ttcagaatcc 6060 tataaacatg actactgaga cgaacttgag agtagttttg atcatacaca cgtttcatgt 6120 ggtacttgag agttactaat ttttgtcatc ttcgtataag tagtaaaaga tactacaaga 6180 atagtttagt agaaaatact agcggtaggt gaagatttgt cgctatgtac tattattgtc 6240 tagtaacttg agtaacaatt tcgtggtcta aatatcaaat aaaaatggat gagtggttca 6300 ccaaatctag gcatcaaaac tattaatgtc attgtctaga tcttaggtga caccacattt 6360 cgaatattta ttggtaattg agatgttaaa gtaccaatat ttgacttaat aaactaaaag 6420 attttggctt tatcaaatgt agacattgat gacatatcgt tgtcattatc ttgagtatat 6480 acaagtcgat caattaggtg aaagtttagt gtctcgtggt tggtaaacga ttaatacagt 6540 agtatatttt atccaaagac aaaatccaaa tcatttcacc agtatgaata gtattatttt 6600 atcttaaaag ctaaaatctt aaaaaccaag gtagcaccca cgttgagcta gacgatcaaa 6660 tcgatttctg ctttgtccaa tttaccaagc tatttaaagc caaataattg aaatataggt 6720 aggtcgttat attaggctaa gatttatctc aaatgcttaa ctaaaggaat aacaagggat 6780 tctagttgtg tggttttata agattggtcc aatttcactt aagtttgttt attgtagaat 6840 tttatatgtg aataatttga attccaattg aaaagatatt atagtaaaag aaaaaatagt 6900 gcgaacaaaa aactttaatc ccataaaaag aaaaagaaaa atgaaaagtt cttctaacat 6960 ccatattttg catcatatca taaagataag aaagatacat atcatagacg tacagataaa 7020 caaacatatc atcatttgtg aaatacatag tacaataatt tgcttttaaa tagagtttaa 7080 gtcacacaca ctgacacaca cgataaaacg ataatgtctg caaaaacact ttaatcccat 7140 tgcctagagg acagcttctc cactttgtct ttaaggttgg ttttgccgtg ttgtttttat 7200 ctttatataa tgatctattt tttggattat gaaatgaatt cacacatttt aattatttaa 7260 gaagatccat atacaggttt ataacagtac taagtgatga ttattttttg tttttgcata 7320 gtttagttta ttgggtaaac attcattacg tgtctcttta tacgaatcac ccatccaaaa 7380 tttcaagtag tcttttagtt catttattat ttcataacta tttgacttat tgatttgaca 7440 agaaacaaca aaagtgttga cttattgata gattgtggga tcataaaagt aattaagcgt 7500 caaccacgac ccacaacaac aaagcacatg ttatacatta atatctcgtt tacttaatta 7560 cagttttcag aatgccgttt catgtcttgt cactggcgat gttattatca tgttggacaa 7620 tattcgactg ttgtcgtttt tacattttcg tattgactaa aactaaaaaa acaaaactct 7680 gtttcaggtt gggcctagga tccacattgt acacacattt gcttaagtct atggaggcgc 7740 aaggttttaa gtctgtggtt gctgttatag gccttccaaa cgatccatct gttaggttgc 7800 atgaggcttt gggatacaca gcccggggta cattgcgcgc agctggatac aagcatggtg 7860 gatggcatga tgttggtttt tggcaaaggg attttgagtt gccagctcct ccaaggccag 7920 ttaggccagt tacccagatc taatatcaaa atctatttag aaatacacaa tattttgttg 7980 caggcttgct ggagaatcga tctgctatca taaaaattac aaaaaaattt tatttgcctc 8040 aattatttta ggattggtat taaggacgct taaattattt gtcgggtcac tacgcatcat 8100 tgtgattgag aagatcagcg atacgaaata ttcgtagtac tatcgataat ttatttgaaa 8160 attcataaga aaagcaaacg ttacatgaat tgatgaaaca atacaaagac agataaagcc 8220 acgcacattt aggatattgg ccgagattac tgaatattga gtaagatcac ggaatttctg 8280 acaggagcat gtcttcaatt cagcccaaat ggcagttgaa atactcaaac cgccccatat 8340 gcaggagcgg atcattcatt gtttgtttgg ttgcctttgc caacatggga gtccaaggtt 8400 gtttaaacat ttaaataccc tgccaagctt gaggtagcct ccaatttgac ggtgccgcca 8460 gcgacgccgt ctggaactgt cctttttgag gaccactccg tttgtggaga tcatgagagt 8520 ccatgctcaa caccgtgcac tagggacagg attgaagact cccgcccatc tcactaggga 8580 caggattgcc accccacagt ggggcctaga aagactggag ttgcagagtt tgtgtcttct 8640 agattaatcc tccaaacttt tgattaacca aaaaaattat caaactaaca tgttctcctt 8700 ttttctttag aaattctaac gaatttatct ttatactgat ttgaatatac ttaatttggt 8760 catttggatg ccctttacaa cctccttacc aaactattga tcacagtttc tattgctaaa 8820 atcaccaaca aaacgcatgt cgccattcat aattatggtt tcacacctac aactaggcta 8880 ataagtaaat aagtagacaa ctagactcag gtttgaaaaa accataaaag ccatatagcg 8940 ttttctcatt gaaactgcga acacgatcgt gtgaatgttg cagtttctag ttttgataca 9000 aacaaacaaa aacacaattt aatcttagat taaaaagaaa aaagagaacg gagcccacta 9060 gccactcctt caaacgtgtc ttaccaactc tcttctagaa acaaattagg cttcaccttc 9120 ctcttccaac ctctctctct ctctctctct ctttttctca aaccatctct ccataaagcc 9180 ctaatttctt catcacaaga atcagaagaa gaaagatgga cctgcatcta attttcggtc 9240 caacttgcac aggaaagacg acgaccgcga tagctcttgc ccagcagaca gggcttccag 9300 tcctttcgct tgatcgggtc caatgctgtc ctcaactatc aaccggaagc ggacgaccaa 9360 cagtggaaga actgaaagga acgacgcgtc tctaccttga tgatcggcct ctggtggagg 9420 gtatcatcgc agccaagcaa gctcatcata ggctgatcga ggaggtgtat aatcatgagg 9480 ccaacggcgg gcttattctt gagggaggat ccacctcgtt gctcaactgc atggcgcgaa 9540 acagctattg gagtgcagat tttcgttggc atattattcg ccacaagtta cccgaccaag 9600 agaccttcat gaaagcggcc aaggccagag ttaagcagat gttgcacccc gctgcaggcc 9660 attctattat tcaagagttg gtttatcttt ggaatgaacc tcggctgagg cccattctga 9720 aagagatcga tggatatcga tatgccatgt tgtttgctag ccagaaccag atcacggcag 9780 atatgctatt gcagcttgac gcaaatatgg aaggtaagtt gattaatggg atcgctcagg 9840 agtatttcat ccatgcgcgc caacaggaac agaaattccc ccaagttaac gcagccgctt 9900 tcgacggatt cgaaggtcat ccgttcggaa tgtattagaa atcaccagtc tctctctaca 9960 aatctatctc tctctatttt tctccagaat aatgtgtgag tagttcccag ataagggaat 10020 tagggttctt atagggtttc gctcatgtgt tgagcatata agaaaccctt agtatgtatt 10080 tgtatttgta aaatacttct atcaataaaa tttctaattc ctaaaaccaa aatccagtgt 10140 ttaaacgagt ccatgctcaa caccgtgcac tagggacagg attgaagact cccgcccatc 10200 tcactaggga caggattgcc accccacagt ggggcctaga aagactggag ttgcagacat 10260 taaggatgac cagttcgtaa aggtcctgcg gtgtctattg cttttcatag gttaataagt 10320 gtttgctaga ctgtggtgaa aggcctatcc gaagtaaggc cggccggatc cttcatcttt 10380 ggacaaggga ataaagactc cccacttgct actaagaaca atacctaagt tgcccagaca 10440 tgactgtacc cattcagaga cctaccaccc attagggcta tgacactaac actagcccct 10500 ggaggttgac catgctaggc agtgggggtc tcacctatga cccactcaga taggggttta 10560 aaccagtggg tgggatctca gcctcatata ggtgtttgtg gtgagctttc tcctagacaa 10620 gagaaccctg aagaacagca agaaccagct aatatgatat gtagacatag tgggttgctc 10680 aaattttgtg tttagtcata ttagaattga cctcagtgac cactcagaaa gtgcccaagc 10740 ccatctatag gggccaaagt gctattgact ggtgtgtctg tgaattgttc ctccctacag 10800 agttggtgct gatatatcct agcattcttt ggaaaaccta gctagggact gtcaagtgta 10860 agatacctcc tgaattggag ggaacactag ctgccctgta ccttctggct agtaccttac 10920 accctgaatg ggttaggggg tctattattt gctggaaata taccagtttc agtagggctg 10980 ctgccttagg tcccacaagg tgtaacatgt gctcaatagt tgcactacca catgcacgtg 11040 aacttaatga tgttatagcc acaacaccaa ccttggtttg cagtttgaca tccctctgga 11100 atgggtgtag tcatcttgct ctggatctgc ctgaatcatt ggggctgtat gcagcctggg 11160 cttaaagtga agaatgggat gtcccagaaa tattttgggt gagaagaatc ctggagtaga 11220 tggtgacctg actatccctg tcctatgggc acaatctatc atcagatatt gcattcaaag 11280 ggctatcatg ggatcaagtc ctaagtcaac tgttgtttac ctggcagaca ttcatctagg 11340 agttctcttt tatgccaccc cacagtgatc cgccttttgc agtttatcca ctagggacag 11400 gattgccacc ccacagtggg gcctctatgc ccgggacaag tgtaaaatat agagtatagg 11460 ggttatcatc acagagaagc tattgctgga gggcctctgt tatttcctct ccatgccact 11520 cccattttta acctaccaac tgaaatccca agggagactc caccctgtaa ctagagtcct 11580 cagaggtgag ccatcccata ttaacaaatg ggcattaggg ctaggatgcc aagggatacc 11640 tgaaatggga agttgtgggg ctgagtcctc ctgggaatca gagataatat gtaaacagtt 11700 tgttgagaga ttgatgagag ctgactttga gaggtggcca tgctccctgg tcctcaatag 11760 ggaaggcact acacaagaaa cctgggtttg atcaactgca ctgtgtccta ctcacacatt 11820 gtgtgcctgg aaaaatgtta cttagtattt ggagggcctc cagaaccccc ctgggtgcaa 11880 gactgggtgc tagtgactgg gtgaatgagt cttggacaca gtggccttgt ctaggttgtg 11940 tgaggtggct aggcatcatg gcaatacctc ataattgatg agtgaggaaa caagactaag 12000 tccttgactc ctcttattac atgacctggt ggatattatg tttaaactct gcaagctgga 12060 atgagtactg ggtgcagatc ccctgggatt ctggctacaa aggtgaatga tagctagtct 12120 gtttattagt agccaaaaaa gtcagtgagg ggtgagtgcc ctgggatgtt gttaagttca 12180 cattgcacac ttggagaccc tctccatcca gtaacatacc agagaaaact gaccaagccc 12240 tcatgggtgt atgggaacaa caaacctcct ggctacttca agggcacata acaccagcaa 12300 ggagcctgtc ataaccacca tctcaaacaa tagaacttcc taagtgaagc aatgacttca 12360 aatctacttg aaggcatgga gtataagcca tgttcctttc agaggggact gtacttctgt 12420 agattacttt ccctcattaa ccagatctgg ccggccgcat gcggtcgatc gtgttggcca 12480 ctcttgttta tctatcattc ctcgttggtc cagtcacagt tctaaaagtc tatggtgttc 12540 cttacattgt aagtttcata tatttcttta ttatatcatt gctaatataa tttgtttttg 12600 acataaaagt tttggaaaaa tttcagatct ttgtaatgtg gttggacgct gtcacgtact 12660 tgcatcatca tggtcacgat gataagctgc cttggtacag aggcaaggta agtagatcaa 12720 cattatttat aagaagcaat aatgattagt agttgaataa tctgaatttt tgatgttttt 12780 gtacaataat aggaatggag ttatttacgt ggaggattaa caactgttga tagagattac 12840 gggatcttca acaacattca tcacgatatt ggaactcacg tgatccatca tcttttccca 12900 caaatccctc actatcactt ggtcgatgcc gtgagtgatc tcgctctctc tctagtttca 12960 tttgattata ttaaagggtg attaattact aaattagtga tcttaattaa tgacatgcga 13020 cagacgaaag cagctaaaca tgtgttggga agatactaca gagaaccaaa gacgtcagga 13080 gcaataccga tccacttagt ggaaagtttg gtggcaagta ttaagaaaga tcattacgtc 13140 agtgacactg gtgatattgt cttctacgag acagatccag atctctacgt ttatgcttct 13200 gacaaatcca aaatcaatta atctttcttc ctagctctat ttaggaataa aacactcctt 13260 tggttttact tatttctggt tgtttttaag ttaaaaatgt actcgtgaaa ctttttttta 13320 ttaaatgtat ttacattaca aatcgtaaaa gtttttgttc gttttctcta tgtttttagt 13380 tacaaactta caatcaaaaa ggtcttaaaa actttttgat ggtgggacgg acaaaagaaa 13440 aagttcgact gagagtcgac aa 13462 <210> 84 <211> 13462 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 84 tatatatatt tgttttaatg gcttatttta ttgttaaatg gatacatcag cttgaaatat 60 ctacgaacat gcatcatttt cctagataca tttgtttgtt gctcaaaaaa tgaataacgt 120 agttaaacga gtgagattct tagcatctgc ctcgaaaacg atatgttatt gacaattcca 180 atttcatttt tatgaaaata aaataatagt ttattttata attgggggtg gttgcaggag 240 aataagccat cggacacacc accagaacca tggccatgtt gaaaacgacg agtcttgggt 300 tccggtaatc cccctctcat tatttttttt tctttttttg aaactctttc attttaattt 360 tcttagaatt ctatgtattt attttaatca atcctttttc cagtgtgagg cttggacgac 420 cacttgtcag atttgtcgtt tagctgtagt aaacaactga tttaaattgt ttatggtact 480 gtagttaact ttaacaacgg gccacttata ttcgagccat tggcataaaa tgattcttct 540 cgaaattcgt ttacttttct tagtattttt cagttttgta gtttacgtag aactaataaa 600 aagaaaaaaa cttataaaca caccacatgc aatgaataaa ttcgaatata taaccatact 660 gttaaatatt aattaacatt ttaatcttaa ttttgcattc cagttgccag aaaaattata 720 caagaatttg tcccacagta cacggatgct cagatacact gtccctctcc ccatgctcgc 780 ttaccctctc tatctggtaa atcctaattc ctcatttttc ttcctgatta taattacaat 840 tttgaatttt tagattttga gtattaacta aatataaatt aaatttgttt ggggatgact 900 acagtggtac agaagtcctg gtaaagaagg gtcacattat aacccataca gtagtttatt 960 tgccccaagc gagagaaagc ttattgcaac ttcaactact ggtaccgcct tttgcagttt 1020 atctctatgc ccgggacaag tggagtccat gctcaacacc gtgcaggatg aggatgacca 1080 ccgcggtagc gacttcgtgg gcgaggaaag cctttcgtcc aaggtggtcc ctcctcgcaa 1140 tcttgttgga tggtgaatat tataaaagcc tgcccttctc gcgggtgttt aaacgtcgac 1200 ctgcaggtca acggatcagg atattcttgt ttaagatgtt gaactctatg gaggtttgta 1260 tgaactgatg atctaggacc ggataagttc ccttcttcat agcgaactta ttcaaagaat 1320 gttttgtgta tcattcttgt tacattgtta ttaatgaaaa aatattattg gtcattggac 1380 tgaacacgag tgttaaatat ggaccaggcc ccaaataaga tccattgata tatgaattaa 1440 ataacaagaa taaatcgagt caccaaacca cttgcctttt ttaacgagac ttgttcacca 1500 acttgataca aaagtcatta tcctatgcaa atcaataatc atacaaaaat atccaataac 1560 actaaaaaat taaaagaaat ggataatttc acaatatgtt atacgataaa gaagttactt 1620 ttccaagaaa ttcactgatt ttataagccc acttgcatta gataaatggc aaaaaaaaac 1680 aaaaaggaaa agaaataaag cacgaagaat tctagaaaat acgaaatacg cttcaatgca 1740 gtgggaccca cggttcaatt attgccaatt ttcagctcca ccgtatattt aaaaaataaa 1800 acgataatgc taaaaaaata taaatcgtaa cgatcgttaa atctcaacgg ctggatctta 1860 tgacgaccgt tagaaattgt ggttgtcgac gagtcagtaa taaacggcgt caaagtggtt 1920 gcagccggca cacacgagtc gtgtttatca actcaaagca caaatacttt tcctcaacct 1980 aaaaataagg caattagcca aaaacaactt tgcgtgtaaa caacgctcaa tacacgtgtc 2040 attttattat tagctattgc ttcaccgcct tagctttctc gtgacctagt cgtcctcgtc 2100 ttttcttctt cttcttctat aaaacaatac ccaaagagct cttcttcttc acaattcaga 2160 tttcaatttc tcaaaatctt aaaaactttc tctcaattct ctctaccgtg atcaaggtaa 2220 atttctgtgt tccttattct ctcaaaatct tcgattttgt tttcgttcga tcccaatttc 2280 gtatatgttc tttggtttag attctgttaa tcttagatcg aagacgattt tctgggtttg 2340 atcgttagat atcatcttaa ttctcgatta gggtttcata gatatcatcc gatttgttca 2400 aataatttga gttttgtcga ataattactc ttcgatttgt gatttctatc tagatctggt 2460 gttagtttct agtttgtgcg atcgaatttg tcgattaatc tgagtttttc tgattaacag 2520 atggcttcat ctgagaacgt tatcactgag ttcatgaggt tcaaggtgag gatggaaggt 2580 actgttaacg gacatgagtt cgagatcgag ggtgagggtg aaggtagacc ttacgaggga 2640 cataacaccg ttaagcttaa ggttacaaag ggtggacctc ttcctttcgc ttgggatatc 2700 ctttctcctc aattccaata cggaagcaag gtaagtttgt ggattcttcg tccatgtgat 2760 ctttgagttt ctttagagct tgtgagggat tagtaagtaa caatgcttga gttttttgct 2820 gctgggcttc gaaaagtttg tcacttgttg gtttgatcca caaggtcttc ttctccatag 2880 ctactagaca tgttttagct taagattcaa gtttatatat gccttgtgga ttaatcattg 2940 cctgattctt ccgtgtcatc tctgagttta tttagagctt ggaagtggtg tagtaataac 3000 taacaatact cttgataagt tgtagcaatg ctcttgatta gtggatgtaa tatgatgttg 3060 ataagatata tgaggcacag aaccaaaagt ggtgcttcca ctagacccgt ttttagccta 3120 aggttcaagt ttataccttg tagatgtttc tgtattgtct gattcttccc tgtgatattt 3180 gaatttctta gagctttgga agtgatatag gaacaatgct cttgtgtgtt tgtctctatg 3240 aagattatcg ctgtcgtgtt tcatccgagt gtgcgggatt ttttgctgct gggtttagcc 3300 tttcttcaaa aagttattac ttgttagttt tattgttttg gtcttgataa gagatgttag 3360 gacagacatg gtgcttcttg tctatagcca ctagacctat tttagcataa ggttaacgaa 3420 attctctcta cataccttgt ggatttgttt acattgcctg atctttcctg tgatcgctgt 3480 catgtttctt tggaatgatt gatgtttata aatggaaaaa tctttgtgca gaagactccc 3540 gcccatctct ctatgcccgg gacaagtgcc accccacagt ggggcaggat gaggatgacc 3600 accatggggt cgcagcgtgt gcgtgtccgt cgtacgttct ggccggccgg gccttgggcg 3660 cgcgatcaga agcgttgcgt tggcgtgtgt gtgcttctgg tttgctttaa ttttaccaag 3720 tttgtttcaa ggtggatcgc gtggtcaagg cccgtgtgct ttaaagaccc accggcactg 3780 gcagtgagtg ttgctgcttg tgtaggcttt ggtacgtatg ggctttattt gcttctggat 3840 gttgtgtact acttgggttt gttgaattat tatgagcagt tgcgtattgt aattcagctg 3900 ggctacctgg acattgttat gtattaataa atgctttgct ttcttctaaa gatctttaag 3960 tgctgtttaa acaaccgaca accactttgc ggacttcctt tcaagagaat tcaataaggt 4020 taattcctaa ttgaaatccg aagataagat tcccacacac ttgtggctga tatcaaaagg 4080 ctactgccta tttaaacaca tctctggaga ctgagaaaat cagacctcca agcatgaaga 4140 agcctgagct tactgctact tctgttgaga agttcctcat cgagaagttc gattctgtgt 4200 ctgatcttat gcagctctct gagggtgagg aatcaagagc tttctctttc gatgttggtg 4260 gaagaggata cgttctcaga gttaactctt gcgctgacgg attctacaag gatagatacg 4320 tgtacagaca cttcgcttca gctgctctcc ctatccctga agttcttgat atcggagagt 4380 tctctgagtc tcttacctac tgtatctcaa gaagggctca gggtgttact cttcaagatc 4440 ttcctgagac tgagcttcct gctgttcttc aacctgttgc tgaggctatg gatgctatcg 4500 ctgctgctga tctttctcaa acttctggat tcggaccttt cggtcctcag ggaatcggac 4560 agtacactac ttggagagat ttcatctgcg ctatcgctga tcctcatgtt taccattggc 4620 agaccgttat ggatgatacc gtttctgctt ctgttgctca agctcttgat gagcttatgc 4680 tttgggctga ggattgtcct gaggttagac atcttgttca cgctgatttc ggatctaaca 4740 acgttctcac cgataacgga agaatcaccg ctgttatcga ttggtctgag gctatgttcg 4800 gagattctca atacgaggtg gccaacatat tcttttggag gccttggctt gcttgtatgg 4860 aacaacagac tagatacttc gagagaaggc atcctgagct tgctggatct cctagactta 4920 gagcttacat gcttaggatc ggacttgatc agctttacca gtctctcgtt gatggaaact 4980 tcgatgatgc tgcttgggct cagggaagat gtgatgctat cgttagatct ggtgctggaa 5040 ctgttggaag aactcaaatc gctagaagat ctgctgctgt ttggactgat ggatgtgttg 5100 aagttctcgc tgattctgga aacagaaggc cttctactag acctagagcc aagaagtgaa 5160 gatcggcggc aatagcttct tagcgccatc ccgggttgat cctatctgtg ttgaaatagt 5220 tgcggtgggc aaggctctct ttcagaaaga caggcggcca aaggaaccca aggtgaggtg 5280 ggctatggct ctcagttcct tgtggaagcg cttggtctaa ggtgcagagg tgttagcggg 5340 atgaagcaaa agtgtccgat tgtaacaaga tatgttgatc ctacgtaagg atattaaagt 5400 atgtattcat cactaatata atcagtgtat tccaatatgt actacgattt ccaatgtctt 5460 tattgtcgcc gtatgtaatc ggcgtcacaa aataatcccc ggtgactttc ttttaatcca 5520 ggatgaaata atatgttatt ataatttttg cgatttggtc cgttatagga attgaagtgt 5580 gcttgcggtc gccaccactc ccatttcata attttacatg tatttgaaaa ataaaaattt 5640 atggtattca atttaaacac gtatacttgt aaagaatgat atcttgaaag aaatatagtt 5700 taaatattta ttgataaaat aacaagtcag gtattatagt ccaagcaaaa acataaattt 5760 attgatgcaa gtttaaattc agaaatattt caataactga ttatatcagc tggtacattg 5820 ccgtagatga aagactgagt gcgatattat ggtgtaatac atagtttaaa cgggcccaag 5880 actcccgccc atctctctat gcccgggaca agtgccaccc cacagtgggg caggatgagg 5940 atgaccagtc agttttactt cccttaattt tctatgtact ttcataatta cttatgttat 6000 tttcttcatg agttttaatg caaattacta tatggactct agtgaaaacg ttcagaatcc 6060 tataaacatg actactgaga cgaacttgag agtagttttg atcatacaca cgtttcatgt 6120 ggtacttgag agttactaat ttttgtcatc ttcgtataag tagtaaaaga tactacaaga 6180 atagtttagt agaaaatact agcggtaggt gaagatttgt cgctatgtac tattattgtc 6240 tagtaacttg agtaacaatt tcgtggtcta aatatcaaat aaaaatggat gagtggttca 6300 ccaaatctag gcatcaaaac tattaatgtc attgtctaga tcttaggtga caccacattt 6360 cgaatattta ttggtaattg agatgttaaa gtaccaatat ttgacttaat aaactaaaag 6420 attttggctt tatcaaatgt agacattgat gacatatcgt tgtcattatc ttgagtatat 6480 acaagtcgat caattaggtg aaagtttagt gtctcgtggt tggtaaacga ttaatacagt 6540 agtatatttt atccaaagac aaaatccaaa tcatttcacc agtatgaata gtattatttt 6600 atcttaaaag ctaaaatctt aaaaaccaag gtagcaccca cgttgagcta gacgatcaaa 6660 tcgatttctg ctttgtccaa tttaccaagc tatttaaagc caaataattg aaatataggt 6720 aggtcgttat attaggctaa gatttatctc aaatgcttaa ctaaaggaat aacaagggat 6780 tctagttgtg tggttttata agattggtcc aatttcactt aagtttgttt attgtagaat 6840 tttatatgtg aataatttga attccaattg aaaagatatt atagtaaaag aaaaaatagt 6900 gcgaacaaaa aactttaatc ccataaaaag aaaaagaaaa atgaaaagtt cttctaacat 6960 ccatattttg catcatatca taaagataag aaagatacat atcatagacg tacagataaa 7020 caaacatatc atcatttgtg aaatacatag tacaataatt tgcttttaaa tagagtttaa 7080 gtcacacaca ctgacacaca cgataaaacg ataatgtctg caaaaacact ttaatcccat 7140 tgcctagagg acagcttctc cactttgtct ttaaggttgg ttttgccgtg ttgtttttat 7200 ctttatataa tgatctattt tttggattat gaaatgaatt cacacatttt aattatttaa 7260 gaagatccat atacaggttt ataacagtac taagtgatga ttattttttg tttttgcata 7320 gtttagttta ttgggtaaac attcattacg tgtctcttta tacgaatcac ccatccaaaa 7380 tttcaagtag tcttttagtt catttattat ttcataacta tttgacttat tgatttgaca 7440 agaaacaaca aaagtgttga cttattgata gattgtggga tcataaaagt aattaagcgt 7500 caaccacgac ccacaacaac aaagcacatg ttatacatta atatctcgtt tacttaatta 7560 cagttttcag aatgccgttt catgtcttgt cactggcgat gttattatca tgttggacaa 7620 tattcgactg ttgtcgtttt tacattttcg tattgactaa aactaaaaaa acaaaactct 7680 gtttcaggtt gggcctagga tccacattgt acacacattt gcttaagtct atggaggcgc 7740 aaggttttaa gtctgtggtt gctgttatag gccttccaaa cgatccatct gttaggttgc 7800 atgaggcttt gggatacaca gcccggggta cattgcgcgc agctggatac aagcatggtg 7860 gatggcatga tgttggtttt tggcaaaggg attttgagtt gccagctcct ccaaggccag 7920 ttaggccagt tacccagatc taatatcaaa atctatttag aaatacacaa tattttgttg 7980 caggcttgct ggagaatcga tctgctatca taaaaattac aaaaaaattt tatttgcctc 8040 aattatttta ggattggtat taaggacgct taaattattt gtcgggtcac tacgcatcat 8100 tgtgattgag aagatcagcg atacgaaata ttcgtagtac tatcgataat ttatttgaaa 8160 attcataaga aaagcaaacg ttacatgaat tgatgaaaca atacaaagac agataaagcc 8220 acgcacattt aggatattgg ccgagattac tgaatattga gtaagatcac ggaatttctg 8280 acaggagcat gtcttcaatt cagcccaaat ggcagttgaa atactcaaac cgccccatat 8340 gcaggagcgg atcattcatt gtttgtttgg ttgcctttgc caacatggga gtccaaggtt 8400 gtttaaacat ttaaataccc tgccaagctt gaggtagcct ccaatttgac ggtgccgcca 8460 gcgacgccgt ctggaactgt cctttttgag gaccactccg tttgtggaga tcatgagagt 8520 ccatgctcaa caccgtgcac tagggacagg attgaagact cccgcccatc tcactaggga 8580 caggattgcc accccacagt ggggcctaga aagactggag ttgcagagtt tgtgtcttct 8640 agattaatcc tccaaacttt tgattaacca aaaaaattat caaactaaca tgttctcctt 8700 ttttctttag aaattctaac gaatttatct ttatactgat ttgaatatac ttaatttggt 8760 catttggatg ccctttacaa cctccttacc aaactattga tcacagtttc tattgctaaa 8820 atcaccaaca aaacgcatgt cgccattcat aattatggtt tcacacctac aactaggcta 8880 ataagtaaat aagtagacaa ctagactcag gtttgaaaaa accataaaag ccatatagcg 8940 ttttctcatt gaaactgcga acacgatcgt gtgaatgttg cagtttctag ttttgataca 9000 aacaaacaaa aacacaattt aatcttagat taaaaagaaa aaagagaacg gagcccacta 9060 gccactcctt caaacgtgtc ttaccaactc tcttctagaa acaaattagg cttcaccttc 9120 ctcttccaac ctctctctct ctctctctct ctttttctca aaccatctct ccataaagcc 9180 ctaatttctt catcacaaga atcagaagaa gaaagatgga cctgcatcta attttcggtc 9240 caacttgcac aggaaagacg acgaccgcga tagctcttgc ccagcagaca gggcttccag 9300 tcctttcgct tgatcgggtc caatgctgtc ctcaactatc aaccggaagc ggacgaccaa 9360 cagtggaaga actgaaagga acgacgcgtc tctaccttga tgatcggcct ctggtggagg 9420 gtatcatcgc agccaagcaa gctcatcata ggctgatcga ggaggtgtat aatcatgagg 9480 ccaacggcgg gcttattctt gagggaggat ccacctcgtt gctcaactgc atggcgcgaa 9540 acagctattg gagtgcagat tttcgttggc atattattcg ccacaagtta cccgaccaag 9600 agaccttcat gaaagcggcc aaggccagag ttaagcagat gttgcacccc gctgcaggcc 9660 attctattat tcaagagttg gtttatcttt ggaatgaacc tcggctgagg cccattctga 9720 aagagatcga tggatatcga tatgccatgt tgtttgctag ccagaaccag atcacggcag 9780 atatgctatt gcagcttgac gcaaatatgg aaggtaagtt gattaatggg atcgctcagg 9840 agtatttcat ccatgcgcgc caacaggaac agaaattccc ccaagttaac gcagccgctt 9900 tcgacggatt cgaaggtcat ccgttcggaa tgtattagaa atcaccagtc tctctctaca 9960 aatctatctc tctctatttt tctccagaat aatgtgtgag tagttcccag ataagggaat 10020 tagggttctt atagggtttc gctcatgtgt tgagcatata agaaaccctt agtatgtatt 10080 tgtatttgta aaatacttct atcaataaaa tttctaattc ctaaaaccaa aatccagtgt 10140 ttaaacgagt ccatgctcaa caccgtgcac tagggacagg attgaagact cccgcccatc 10200 tcactaggga caggattgcc accccacagt ggggcctaga aagactggag ttgcagacat 10260 taaggatgac cagttcgtaa aggtcctgcg gtgtctattg cttttcatag gttaataagt 10320 gtttgctaga ctgtggtgaa aggcctatcc gaagtaaggc cggccggatc cttcatcttt 10380 ggacaaggga ataaagactc cccacttgct actaagaaca atacctaagt tgcccagaca 10440 tgactgtacc cattcagaga cctaccaccc attagggcta tgacactaac actagcccct 10500 ggaggttgac catgctaggc agtgggggtc tcacctatga cccactcaga taggggttta 10560 aaccagtggg tgggatctca gcctcatata ggtgtttgtg gtgagctttc tcctagacaa 10620 gagaaccctg aagaacagca agaaccagct aatatgatat gtagacatag tgggttgctc 10680 aaattttgtg tttagtcata ttagaattga cctcagtgac cactcagaaa gtgcccaagc 10740 ccatctatag gggccaaagt gctattgact ggtgtgtctg tgaattgttc ctccctacag 10800 agttggtgct gatatatcct agcattcttt ggaaaaccta gctagggact gtcaagtgta 10860 agatacctcc tgaattggag ggaacactag ctgccctgta ccttctggct agtaccttac 10920 accctgaatg ggttaggggg tctattattt gctggaaata taccagtttc agtagggctg 10980 ctgccttagg tcccacaagg tgtaacatgt gctcaatagt tgcactacca catgcacgtg 11040 aacttaatga tgttatagcc acaacaccaa ccttggtttg cagtttgaca tccctctgga 11100 atgggtgtag tcatcttgct ctggatctgc ctgaatcatt ggggctgtat gcagcctggg 11160 cttaaagtga agaatgggat gtcccagaaa tattttgggt gagaagaatc ctggagtaga 11220 tggtgacctg actatccctg tcctatgggc acaatctatc atcagatatt gcattcaaag 11280 ggctatcatg ggatcaagtc ctaagtcaac tgttgtttac ctggcagaca ttcatctagg 11340 agttctcttt tatgccaccc cacagtgatc cgccttttgc agtttatcca ctagggacag 11400 gattgccacc ccacagtggg gcctctatgc ccgggacaag tgtaaaatat agagtatagg 11460 ggttatcatc acagagaagc tattgctgga gggcctctgt tatttcctct ccatgccact 11520 cccattttta acctaccaac tgaaatccca agggagactc caccctgtaa ctagagtcct 11580 cagaggtgag ccatcccata ttaacaaatg ggcattaggg ctaggatgcc aagggatacc 11640 tgaaatggga agttgtgggg ctgagtcctc ctgggaatca gagataatat gtaaacagtt 11700 tgttgagaga ttgatgagag ctgactttga gaggtggcca tgctccctgg tcctcaatag 11760 ggaaggcact acacaagaaa cctgggtttg atcaactgca ctgtgtccta ctcacacatt 11820 gtgtgcctgg aaaaatgtta cttagtattt ggagggcctc cagaaccccc ctgggtgcaa 11880 gactgggtgc tagtgactgg gtgaatgagt cttggacaca gtggccttgt ctaggttgtg 11940 tgaggtggct aggcatcatg gcaatacctc ataattgatg agtgaggaaa caagactaag 12000 tccttgactc ctcttattac atgacctggt ggatattatg tttaaactct gcaagctgga 12060 atgagtactg ggtgcagatc ccctgggatt ctggctacaa aggtgaatga tagctagtct 12120 gtttattagt agccaaaaaa gtcagtgagg ggtgagtgcc ctgggatgtt gttaagttca 12180 cattgcacac ttggagaccc tctccatcca gtaacatacc agagaaaact gaccaagccc 12240 tcatgggtgt atgggaacaa caaacctcct ggctacttca agggcacata acaccagcaa 12300 ggagcctgtc ataaccacca tctcaaacaa tagaacttcc taagtgaagc aatgacttca 12360 aatctacttg aaggcatgga gtataagcca tgttcctttc agaggggact gtacttctgt 12420 agattacttt ccctcattaa ccagatctgg ccggccgcat gcggtcgatc atgttggcca 12480 ctcttgttta tctatcattc ctcgttggtc cagtcacagt tctaaaagtc tatggtgttc 12540 cttacattgt aagtttcata tatttcatta ttatatcatt gctaatataa tttgtttttg 12600 acataaagtt ttggaaaaat ttcagatctt tgtaatgtgg ttggacgctg tcacgtactt 12660 gcatcatcat ggtcacgatg ataagttgcc ttggtacaga ggcaaggtaa gtagatcaac 12720 attaatttat aagaagcaac aatgattagt atttgattaa tctaaattat tgatgttttg 12780 tgtacaataa taggaatgga gttatttacg tggaggatta acaactattg atagagatta 12840 cgggatcttc aacaacattc atcacgatat tggaactcac gtgatccatc atcttttccc 12900 acaaatccct cactatcact tggttgatgc cgtgagtgat ctcgctctct ctctagtttc 12960 atttgattaa aattaaaggg tgattaatta ctaaattagt gatcttaatt aatgatatgc 13020 gacagacgaa atcagctaaa catgtgttgg gaagatacta cagagaacca aagacgtcag 13080 gagcaatacc gatccacttg gtggaaagtt tggtggcaag tattaagaaa gatcattacg 13140 tcagtgacac tggtgatatt gtcttctacg agacagatcc agatctctac gtttatgctt 13200 ctgacaaatc caaaatcaac taacctttct tcctagctct atttaggaat aaaacagtcc 13260 tttggttttt acttatttct ggttgttttt aagttaaatg tactcgtgaa acttttttta 13320 attaaatgta tttacattac aaatcaagtt tttgttcgtt ttctttatgt ttttagttac 13380 aataaataaa ggtcttaaaa actttttgtt ggtggggaca aaagaaaaag ttcgactgag 13440 agagtcgaca aaatgcacgc cg 13462 <210> 85 <211> 5521 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 85 tggcaggata tattgtggtg taaacaaatt gacgcttaga caacttaata acacattgcg 60 gacgttttta atgtactgaa ttaacgccga attgaattcg agctcggtac cggggacaac 120 tttgtataga aaagttgggt ggtttaaact atgtattaca ccataatatc gcactcagtc 180 tttcatctac ggcaatgtac cagctgatat aatcagttat tgaaatattt ctgaatttaa 240 acttgcatca ataaatttat gtttttgctt ggactataat acctgacttg ttattttatc 300 aataaatatt taaactatat ttctttcaag atatcattct ttacaagtat acgtgtttaa 360 attgaatacc ataaattttt atttttcaaa tacatgtaaa attatgaaat gggagtggtg 420 gcgaccgcaa gcacacttca attcctataa cggaccaaat cgcaaaaatt ataataacat 480 attatttcat cctggattaa aagaaagtca ccggggatta ttttgtgacg ccgattacat 540 acggcgacaa taaagacatt ggaaatcgta gtacatattg gaatacactg attatattag 600 tgatgaatac atactttaat atccttacgt aggatcaaca tatcttgtta caatcggaca 660 cttttgcttc atcccgctaa cacctctgca ccttagacca agcgcttcca caaggaactg 720 agagccatag cccacctcac cttgggttcc tttggccgcc tgtctttctg aaagagagcc 780 ttgcccaccg caactatttc aacacagata ggatcaaccc gggatggcgc taagaagcta 840 ttgccgccga tcttcacttc ttggctctag gtctagtaga aggccttctg tttccagaat 900 cagcgagaac ttcaacacat ccatcagtcc aaacagcagc agatcttcta gcgatttgag 960 ttcttccaac agttccagca ccagatctaa cgatagcatc acatcttccc tgagcccaag 1020 cagcatcatc gaagtttcca tcaacgagag actggtaaag ctgatcaagt ccgatcctaa 1080 gcatgtaagc tctaagtcta ggagatccag caagctcagg atgccttctc tcgaagtatc 1140 tagtctgttg ttccatacaa gcaagccaag gcctccaaaa gaatatgttg gccacctcgt 1200 attgagaatc tccgaacata gcctcagacc aatcgataac agcggtgatt cttccgttat 1260 cggtgagaac gttgttagat ccgaaatcag cgtgaacaag atgtctaacc tcaggacaat 1320 cctcagccca aagcataagc tcatcaagag cttgagcaac agaagcagaa acggtatcat 1380 ccataacggt ctgccaatgg taaacatgag gatcagcgat agcgcagatg aaatctctcc 1440 aagtagtgta ctgtccgatt ccctgaggac cgaaaggtcc gaatccagaa gtttgagaaa 1500 gatcagcagc agcgatagca tccatagcct cagcaacagg ttgaagaaca gcaggaagct 1560 cagtctcagg aagatcttga agagtaacac cctgagccct tcttgagata cagtaggtaa 1620 gagactcaga gaactctccg atatcaagaa cttcagggat agggagagca gctgaagcga 1680 agtgtctgta cacgtatcta tccttgtaga atccgtcagc gcaagagtta actctgagaa 1740 cgtatcctct tccaccaaca tcgaaagaga aagctcttga ttcctcaccc tcagagagct 1800 gcataagatc agacacagaa tcgaacttct cgatgaggaa cttctcaaca gaagtagcag 1860 taagctcagg cttcttcatg cttggaggtc tgattttctc agtctccaga gatgtgttta 1920 aataggcagt agccttttga tatcagccac aagtgtgtgg gaatcttatc ttcggatttc 1980 aattaggaat taaccttatt gaattctctt gaaaggaagt ccgcaaagtg gttgtcggtt 2040 gtttaaacca acttttgtat acaaagttgt cccctctaga gtcgacctgc aggcatgcaa 2100 gcttagcttg agcttggatc agattgtcgt ttcccgcctt cagtttatca caagtttgta 2160 caaaaaagca ggctgtcgac ctgcaggtca acggatcagg atattcttgt ttaagatgtt 2220 gaactctatg gaggtttgta tgaactgatg atctaggacc ggataagttc ccttcttcat 2280 agcgaactta ttcaaagaat gttttgtgta tcattcttgt tacattgtta ttaatgaaaa 2340 aatattattg gtcattggac tgaacacgag tgttaaatat ggaccaggcc ccaaataaga 2400 tccattgata tatgaattaa ataacaagaa taaatcgagt caccaaacca cttgcctttt 2460 ttaacgagac ttgttcacca acttgataca aaagtcatta tcctatgcaa atcaataatc 2520 atacaaaaat atccaataac actaaaaaat taaaagaaat ggataatttc acaatatgtt 2580 atacgataaa gaagttactt ttccaagaaa ttcactgatt ttataagccc acttgcatta 2640 gataaatggc aaaaaaaaac aaaaaggaaa agaaataaag cacgaagaat tctagaaaat 2700 acgaaatacg cttcaatgca gtgggaccca cggttcaatt attgccaatt ttcagctcca 2760 ccgtatattt aaaaaataaa acgataatgc taaaaaaata taaatcgtaa cgatcgttaa 2820 atctcaacgg ctggatctta tgacgaccgt tagaaattgt ggttgtcgac gagtcagtaa 2880 taaacggcgt caaagtggtt gcagccggca cacacgagtc gtgtttatca actcaaagca 2940 caaatacttt tcctcaacct aaaaataagg caattagcca aaaacaactt tgcgtgtaaa 3000 caacgctcaa tacacgtgtc attttattat tagctattgc ttcaccgcct tagctttctc 3060 gtgacctagt cgtcctcgtc ttttcttctt cttcttctat aaaacaatac ccaaagagct 3120 cttcttcttc acaattcaga tttcaatttc tcaaaatctt aaaaactttc tctcaattct 3180 ctctaccgtg atcaaggtaa atttctgtgt tccttattct ctcaaaatct tcgattttgt 3240 tttcgttcga tcccaatttc gtatatgttc tttggtttag attctgttaa tcttagatcg 3300 aagacgattt tctgggtttg atcgttagat atcatcttaa ttctcgatta gggtttcata 3360 gatatcatcc gatttgttca aataatttga gttttgtcga ataattactc ttcgatttgt 3420 gatttctatc tagatctggt gttagtttct agtttgtgcg atcgaatttg tcgattaatc 3480 tgagtttttc tgattaacag atggcttcat ctgagaacgt tatcactgag ttcatgaggt 3540 tcaaggtgag gatggaaggt actgttaacg gacatgagtt cgagatcgag ggtgagggtg 3600 aaggtagacc ttacgaggga cataacaccg ttaagcttaa ggttacaaag ggtggacctc 3660 ttcctttcgc ttgggatatc ctttctcctc aattccaata cggaagcaag gtaagtttgt 3720 ggattcttcg tccatgtgat ctttgagttt ctttagagct tgtgagggat tagtaagtaa 3780 caatgcttga gttttttgct gctgggcttc gaaaagtttg tcacttgttg gtttgatcca 3840 caaggtcttc ttctccatag ctactagaca tgttttagct taagattcaa gtttatatat 3900 gccttgtgga ttaatcattg cctgattctt ccgtgtcatc tctgagttta tttagagctt 3960 ggaagtggtg tagtaataac taacaatact cttgataagt tgtagcaatg ctcttgatta 4020 gtggatgtaa tatgatgttg ataagatata tgaggcacag aaccaaaagt ggtgcttcca 4080 ctagacccgt ttttagccta aggttcaagt ttataccttg tagatgtttc tgtattgtct 4140 gattcttccc tgtgatattt gaatttctta gagctttgga agtgatatag gaacaatgct 4200 cttgtgtgtt tgtctctatg aagattatcg ctgtcgtgtt tcatccgagt gtgcgggatt 4260 ttttgctgct gggtttagcc tttcttcaaa aagttattac ttgttagttt tattgttttg 4320 gtcttgataa gagatgttag gacagacatg gtgcttcttg tctatagcca ctagacctat 4380 tttagcataa ggttaacgaa attctctcta cataccttgt ggatttgttt acattgcctg 4440 atctttcctg tgatcgctgt catgtttctt tggaatgatt gatgtttata aatggaaaaa 4500 tctttgtgca ggtttacgtt aagcaccctg ctgatatccc tgattacaag aagctttcat 4560 tccctgaggg attcaagtgg gagagagtta tgaacttcga ggatggtggt gttgctactg 4620 ttactcagga ttcttcactt caggacggat gcttcatcta caaggttaag ttcatcggag 4680 tgaacttccc ttctgatgga cctgttatgc agaaaaagac tatgggatgg gaggcttcta 4740 ccgagagact ttaccctaga gatggtgttc ttaagggtga gactcacaag gctcttaagc 4800 ttaaagatgg tggacactac ctcgtcgagt tcaagtctat ctacatggct aagaagcctg 4860 ttcagcttcc tggttactac tacgttgacg ctaagcttga tatcacctct cacaacgagg 4920 actacactat cgttgagcaa tacgagagaa ctgagggtag acatcacttg ttcctctgat 4980 atcaaaatct atttagaaat acacaatatt ttgttgcagg cttgctggag aatcgatctg 5040 ctatcataaa aattacaaaa aaattttatt tgcctcaatt attttaggat tggtattaag 5100 gacgcttaaa ttatttgtcg ggtcactacg catcattgtg attgagaaga tcagcgatac 5160 gaaatattcg tagtactatc gataatttat ttgaaaattc ataagaaaag caaacgttac 5220 atgaattgat gaaacaatac aaagacagat aaagccacgc acatttagga tattggccga 5280 gattactgaa tattgagtaa gatcacggaa tttctgacag gagcatgtct tcaattcagc 5340 ccaaatggca gttgaaatac tcaaaccgcc ccatatgcag gagcggatca ttcattgttt 5400 gtttggttgc ctttgccaac atgggagtcc aaggtttacc cagctttctt gtacaaagtg 5460 gtgataaact atcagtgttt gacaggatat attggcgggt aaacctaaga gaaaagagcg 5520 t 5521 <210> 86 <211> 11708 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 86 tggcaggata tattgtggtg taaacaaatt gacgcttaga caacttaata acacattgcg 60 gacgttttta atgtactgaa ttaacgccga attgaattcg agctcggtac ccggggatcc 120 tctagagtcg acctgcaggc atgcaagctt agcttgagct tggatcagat tgtcgtttcc 180 cgccttcagt ttatcacaag tttgtacaaa aaagcaggcg ccttttgcag tttatctcta 240 tgcccgggac aagtggagtc catgctcaac accgtgcagg atgaggatga ccatagcgac 300 ttcgtgggcg aggaaagcct ttcgtccaag gtggtccctc ctcgcaatct tgttggatgg 360 tgaatattat aaaagcctgc ccttctcgcg ggtgtttaaa cgtcgacctg caggtcaacg 420 gatcaggata ttcttgttta agatgttgaa ctctatggag gtttgtatga actgatgatc 480 taggaccgga taagttccct tcttcatagc gaacttattc aaagaatgtt ttgtgtatca 540 ttcttgttac attgttatta atgaaaaaat attattggtc attggactga acacgagtgt 600 taaatatgga ccaggcccca aataagatcc attgatatat gaattaaata acaagaataa 660 atcgagtcac caaaccactt gcctttttta acgagacttg ttcaccaact tgatacaaaa 720 gtcattatcc tatgcaaatc aataatcata caaaaatatc caataacact aaaaaattaa 780 aagaaatgga taatttcaca atatgttata cgataaagaa gttacttttc caagaaattc 840 actgatttta taagcccact tgcattagat aaatggcaaa aaaaaacaaa aaggaaaaga 900 aataaagcac gaagaattct agaaaatacg aaatacgctt caatgcagtg ggacccacgg 960 ttcaattatt gccaattttc agctccaccg tatatttaaa aaataaaacg ataatgctaa 1020 aaaaatataa atcgtaacga tcgttaaatc tcaacggctg gatcttatga cgaccgttag 1080 aaattgtggt tgtcgacgag tcagtaataa acggcgtcaa agtggttgca gccggcacac 1140 acgagtcgtg tttatcaact caaagcacaa atacttttcc tcaacctaaa aataaggcaa 1200 ttagccaaaa acaactttgc gtgtaaacaa cgctcaatac acgtgtcatt ttattattag 1260 ctattgcttc accgccttag ctttctcgtg acctagtcgt cctcgtcttt tcttcttctt 1320 cttctataaa acaataccca aagagctctt cttcttcaca attcagattt caatttctca 1380 aaatcttaaa aactttctct caattctctc taccgtgatc aaggtaaatt tctgtgttcc 1440 ttattctctc aaaatcttcg attttgtttt cgttcgatcc caatttcgta tatgttcttt 1500 ggtttagatt ctgttaatct tagatcgaag acgattttct gggtttgatc gttagatatc 1560 atcttaattc tcgattaggg tttcatagat atcatccgat ttgttcaaat aatttgagtt 1620 ttgtcgaata attactcttc gatttgtgat ttctatctag atctggtgtt agtttctagt 1680 ttgtgcgatc gaatttgtcg attaatctga gtttttctga ttaacagatg gcttcatctg 1740 agaacgttat cactgagttc atgaggttca aggtgaggat ggaaggtact gttaacggac 1800 atgagttcga gatcgagggt gagggtgaag gtagacctta cgagggacat aacaccgtta 1860 agcttaaggt tacaaagggt ggacctcttc ctttcgcttg ggatatcctt tctcctcaat 1920 tccaatacgg aagcaaggta agtttgtgga ttcttcgtcc atgtgatctt tgagtttctt 1980 tagagcttgt gagggattag taagtaacaa tgcttgagtt ttttgctgct gggcttcgaa 2040 aagtttgtca cttgttggtt tgatccacaa ggtcttcttc tccatagcta ctagacatgt 2100 tttagcttaa gattcaagtt tatatatgcc ttgtggatta atcattgcct gattcttccg 2160 tgtcatctct gagtttattt agagcttgga agtggtgtag taataactaa caatactctt 2220 gataagttgt agcaatgctc ttgattagtg gatgtaatat gatgttgata agatatatga 2280 ggcacagaac caaaagtggt gcttccacta gacccgtttt tagcctaagg ttcaagttta 2340 taccttgtag atgtttctgt attgtctgat tcttccctgt gatatttgaa tttcttagag 2400 ctttggaagt gatataggaa caatgctctt gtgtgtttgt ctctatgaag attatcgctg 2460 tcgtgtttca tccgagtgtg cgggattttt tgctgctggg tttagccttt cttcaaaaag 2520 ttattacttg ttagttttat tgttttggtc ttgataagag atgttaggac agacatggtg 2580 cttcttgtct atagccacta gacctatttt agcataaggt taacgaaatt ctctctacat 2640 accttgtgga tttgtttaca ttgcctgatc tttcctgtga tcgctgtcat gtttctttgg 2700 aatgattgat gtttataaat ggaaaaatct ttgtgcagaa gactcccgcc catccaggat 2760 gaggatgacc accaccccac agtggggcag gatgaggatg accaggtcgc agcgtgtgcg 2820 tgtccgtcgt acgttctggc cggccgggcc ttgggcgcgc gatcagaagc gttgcgttgg 2880 cgtgtgtgtg cttctggttt gctttaattt taccaagttt gtttcaaggt ggatcgcgtg 2940 gtcaaggccc gtgtgcttta aagacccacc ggcactggca gtgagtgttg ctgcttgtgt 3000 aggctttggt acgtatgggc tttatttgct tctggatgtt gtgtactact tgggtttgtt 3060 gaattattat gagcagttgc gtattgtaat tcagctgggc tacctggaca ttgttatgta 3120 ttaataaatg ctttgctttc ttctaaagat ctttaagtgc tacaactttg tatacaaaag 3180 ttggtttaaa caaccgacaa ccactttgcg gacttccttt caagagaatt caataaggtt 3240 aattcctaat tgaaatccga agataagatt cccacacact tgtggctgat atcaaaaggc 3300 tactgcctat ttaaacacat ctctggagac tgagaaaatc agacctccaa gcatgaagaa 3360 gcctgagctt actgctactt ctgttgagaa gttcctcatc gagaagttcg attctgtgtc 3420 tgatcttatg cagctctctg agggtgagga atcaagagct ttctctttcg atgttggtgg 3480 aagaggatac gttctcagag ttaactcttg cgctgacgga ttctacaagg atagatacgt 3540 gtacagacac ttcgcttcag ctgctctccc tatccctgaa gttcttgata tcggagagtt 3600 ctctgagtct cttacctact gtatctcaag aagggctcag ggtgttactc ttcaagatct 3660 tcctgagact gagcttcctg ctgttcttca acctgttgct gaggctatgg atgctatcgc 3720 tgctgctgat ctttctcaaa cttctggatt cggacctttc ggtcctcagg gaatcggaca 3780 gtacactact tggagagatt tcatctgcgc tatcgctgat cctcatgttt accattggca 3840 gaccgttatg gatgataccg tttctgcttc tgttgctcaa gctcttgatg agcttatgct 3900 ttgggctgag gattgtcctg aggttagaca tcttgttcac gctgatttcg gatctaacaa 3960 cgttctcacc gataacggaa gaatcaccgc tgttatcgat tggtctgagg ctatgttcgg 4020 agattctcaa tacgaggtgg ccaacatatt cttttggagg ccttggcttg cttgtatgga 4080 acaacagact agatacttcg agagaaggca tcctgagctt gctggatctc ctagacttag 4140 agcttacatg cttaggatcg gacttgatca gctttaccag tctctcgttg atggaaactt 4200 cgatgatgct gcttgggctc agggaagatg tgatgctatc gttagatctg gtgctggaac 4260 tgttggaaga actcaaatcg ctagaagatc tgctgctgtt tggactgatg gatgtgttga 4320 agttctcgct gattctggaa acagaaggcc ttctactaga cctagagcca agaagtgaag 4380 atcggcggca atagcttctt agcgccatcc cgggttgatc ctatctgtgt tgaaatagtt 4440 gcggtgggca aggctctctt tcagaaagac aggcggccaa aggaacccaa ggtgaggtgg 4500 gctatggctc tcagttcctt gtggaagcgc ttggtctaag gtgcagaggt gttagcggga 4560 tgaagcaaaa gtgtccgatt gtaacaagat atgttgatcc tacgtaagga tattaaagta 4620 tgtattcatc actaatataa tcagtgtatt ccaatatgta ctacgatttc caatgtcttt 4680 attgtcgccg tatgtaatcg gcgtcacaaa ataatccccg gtgactttct tttaatccag 4740 gatgaaataa tatgttatta taatttttgc gatttggtcc gttataggaa ttgaagtgtg 4800 cttgcggtcg ccaccactcc catttcataa ttttacatgt atttgaaaaa taaaaattta 4860 tggtattcaa tttaaacacg tatacttgta aagaatgata tcttgaaaga aatatagttt 4920 aaatatttat tgataaaata acaagtcagg tattatagtc caagcaaaaa cataaattta 4980 ttgatgcaag tttaaattca gaaatatttc aataactgat tatatcagct ggtacattgc 5040 cgtagatgaa agactgagtg cgatattatg gtgtaataca tagtttaaac cacccaactt 5100 ttctatacaa agttgaagac tcccgcccat ccaggatgag gatgaccacc accccacagt 5160 ggggcaggat gaggatgacc agtcagtttt acttccctta attttctatg tactttcata 5220 attacttatg ttattttctt catgagtttt aatgcaaatt actatatgga ctctagtgaa 5280 aacgttcaga atcctataaa catgactact gagacgaact tgagagtagt tttgatcata 5340 cacacgtttc atgtggtact tgagagttac taatttttgt catcttcgta taagtagtaa 5400 aagatactac aagaatagtt tagtagaaaa tactagcggt aggtgaagat ttgtcgctat 5460 gtactattat tgtctagtaa cttgagtaac aatttcgtgg tctaaatatc aaataaaaat 5520 ggatgagtgg ttcaccaaat ctaggcatca aaactattaa tgtcattgtc tagatcttag 5580 gtgacaccac atttcgaata tttattggta attgagatgt taaagtacca atatttgact 5640 taataaacta aaagattttg gctttatcaa atgtagacat tgatgacata tcgttgtcat 5700 tatcttgagt atatacaagt cgatcaatta ggtgaaagtt tagtgtctcg tggttggtaa 5760 acgattaata cagtagtata ttttatccaa agacaaaatc caaatcattt caccagtatg 5820 aatagtatta ttttatctta aaagctaaaa tcttaaaaac caaggtagca cccacgttga 5880 gctagacgat caaatcgatt tctgctttgt ccaatttacc aagctattta aagccaaata 5940 attgaaatat aggtaggtcg ttatattagg ctaagattta tctcaaatgc ttaactaaag 6000 gaataacaag ggattctagt tgtgtggttt tataagattg gtccaatttc acttaagttt 6060 gtttattgta gaattttata tgtgaataat ttgaattcca attgaaaaga tattatagta 6120 aaagaaaaaa tagtgcgaac aaaaaacttt aatcccataa aaagaaaaag aaaaatgaaa 6180 agttcttcta acatccatat tttgcatcat atcataaaga taagaaagat acatatcata 6240 gacgtacaga taaacaaaca tatcatcatt tgtgaaatac atagtacaat aatttgcttt 6300 taaatagagt ttaagtcaca cacactgaca cacacgataa aacgataatg tctgcaaaaa 6360 cactttaatc ccattgccta gaggacagct tctccacttt gtctttaagg ttggttttgc 6420 cgtgttgttt ttatctttat ataatgatct attttttgga ttatgaaatg aattcacaca 6480 ttttaattat ttaagaagat ccatatacag gtttataaca gtactaagtg atgattattt 6540 tttgtttttg catagtttag tttattgggt aaacattcat tacgtgtctc tttatacgaa 6600 tcacccatcc aaaatttcaa gtagtctttt agttcattta ttatttcata actatttgac 6660 ttattgattt gacaagaaac aacaaaagtg ttgacttatt gatagattgt gggatcataa 6720 aagtaattaa gcgtcaacca cgacccacaa caacaaagca catgttatac attaatatct 6780 cgtttactta attacagttt tcagaatgcc gtttcatgtc ttgtcactgg cgatgttatt 6840 atcatgttgg acaatattcg actgttgtcg tttttacatt ttcgtattga ctaaaactaa 6900 aaaaacaaaa ctctgtttca ggttgggcct aggatccaca ttgtacacac atttgcttaa 6960 gtctatggag gcgcaaggtt ttaagtctgt ggttgctgtt ataggccttc caaacgatcc 7020 atctgttagg ttgcatgagg ctttgggata cacagcccgg ggtacattgc gcgcagctgg 7080 atacaagcat ggtggatggc atgatgttgg tttttggcaa agggattttg agttgccagc 7140 tcctccaagg ccagttaggc cagttaccca gatctaatat caaaatctat ttagaaatac 7200 acaatatttt gttgcaggct tgctggagaa tcgatctgct atcataaaaa ttacaaaaaa 7260 attttatttg cctcaattat tttaggattg gtattaagga cgcttaaatt atttgtcggg 7320 tcactacgca tcattgtgat tgagaagatc agcgatacga aatattcgta gtactatcga 7380 taatttattt gaaaattcat aagaaaagca aacgttacat gaattgatga aacaatacaa 7440 agacagataa agccacgcac atttaggata ttggccgaga ttactgaata ttgagtaaga 7500 tcacggaatt tctgacagga gcatgtcttc aattcagccc aaatggcagt tgaaatactc 7560 aaaccgcccc atatgcagga gcggatcatt cattgtttgt ttggttgcct ttgccaacat 7620 gggagtccaa ggttatttaa ataccctgcc aagcttgagg tagcctccaa tttgacggtg 7680 ccgccagcga cgccgtctgg aactgtcctt tttgaggacc actccgtttg tggagatcat 7740 gaacaacttt gtataataaa gttgaagact cccgcccatc tctctatgcc cgggacaagt 7800 ggagtccatg ctcaacaccg tgcactaggg acaggattgg tttaaacgtt tgtgtcttct 7860 agattaatcc tccaaacttt tgattaacca aaaaaattat caaactaaca tgttctcctt 7920 ttttctttag aaattctaac gaatttatct ttatactgat ttgaatatac ttaatttggt 7980 catttggatg ccctttacaa cctccttacc aaactattga tcacagtttc tattgctaaa 8040 atcaccaaca aaacgcatgt cgccattcat aattatggtt tcacacctac aactaggcta 8100 ataagtaaat aagtagacaa ctagactcag gtttgaaaaa accataaaag ccatatagcg 8160 ttttctcatt gaaactgcga acacgatcgt gtgaatgttg cagtttctag ttttgataca 8220 aacaaacaaa aacacaattt aatcttagat taaaaagaaa aaagagaacg gagcccacta 8280 gccactcctt caaacgtgtc ttaccaactc tcttctagaa acaaattagg cttcaccttc 8340 ctcttccaac ctctctctct ctctctctct ctttttctca aaccatctct ccataaagcc 8400 ctaatttctt catcacaaga atcagaagaa gaaagatgga cctgcatcta attttcggtc 8460 caacttgcac aggaaagacg acgaccgcga tagctcttgc ccagcagaca gggcttccag 8520 tcctttcgct tgatcgggtc caatgctgtc ctcaactatc aaccggaagc ggacgaccaa 8580 cagtggaaga actgaaagga acgacgcgtc tctaccttga tgatcggcct ctggtggagg 8640 gtatcatcgc agccaagcaa gctcatcata ggctgatcga ggaggtgtat aatcatgagg 8700 ccaacggcgg gcttattctt gagggaggat ccacctcgtt gctcaactgc atggcgcgaa 8760 acagctattg gagtgcagat tttcgttggc atattattcg ccacaagtta cccgaccaag 8820 agaccttcat gaaagcggcc aaggccagag ttaagcagat gttgcacccc gctgcaggcc 8880 attctattat tcaagagttg gtttatcttt ggaatgaacc tcggctgagg cccattctga 8940 aagagatcga tggatatcga tatgccatgt tgtttgctag ccagaaccag atcacggcag 9000 atatgctatt gcagcttgac gcaaatatgg aaggtaagtt gattaatggg atcgctcagg 9060 agtatttcat ccatgcgcgc caacaggaac agaaattccc ccaagttaac gcagccgctt 9120 tcgacggatt cgaaggtcat ccgttcggaa tgtattagaa atcaccagtc tctctctaca 9180 aatctatctc tctctatttt tctccagaat aatgtgtgag tagttcccag ataagggaat 9240 tagggttctt atagggtttc gctcatgtgt tgagcatata agaaaccctt agtatgtatt 9300 tgtatttgta aaatacttct atcaataaaa tttctaattc ctaaaaccaa aatccagtgt 9360 ttaaacaaga ctcccgccca tctctctatg cccgggacaa gtggagtcca tgctcaacac 9420 cgtgcactag ggacaggatt gcattaagga tgaccagttc gtaaaggtcc tgcggtgtct 9480 attgcttttc ataggttaat aagtgtttgc tagactgtgg tgaaaggcct atccgaagta 9540 aggccggccg gatccttcat ctttggacaa gggaataaag actccccact tgctactaag 9600 aacaatacct aagttgccca gacatgactg tacccattca gagacctacc acccattagg 9660 gctatgacac taacactagc ccctggaggt tgaccatgct aggcagtggg ggtctcacct 9720 atgacccact cagatagggg tttaaaccag tgggtgggat ctcagcctca tataggtgtt 9780 tgtggtgagc tttctcctag acaagagaac cctgaagaac agcaagaacc agctaatatg 9840 atatgtagac atagtgggtt gctcaaattt tgtgtttagt catattagaa ttgacctcag 9900 tgaccactca gaaagtgccc aagcccatct ataggggcca aagtgctatt gactggtgtg 9960 tctgtgaatt gttcctccct acagagttgg tgctgatata tcctagcatt ctttggaaaa 10020 cctagctagg gactgtcaag tgtaagatac ctcctgaatt ggagggaaca ctagctgccc 10080 tgtaccttct ggctagtacc ttacaccctg aatgggttag ggggtctatt atttgctgga 10140 aatataccag tttcagtagg gctgctgcct taggtcccac aaggtgtaac atgtgctcaa 10200 tagttgcact accacatgca cgtgaactta atgatgttat agccacaaca ccaaccttgg 10260 tttgcagttt gacatccctc tggaatgggt gtagtcatct tgctctggat ctgcctgaat 10320 cattggggct gtatgcagcc tgggcttaaa gtgaagaatg ggatgtccca gaaatatttt 10380 gggtgagaag aatcctggag tagatggtga cctgactatc cctgtcctat gggcacaatc 10440 tatcatcaga tattgcattc aaagggctat catgggatca agtcctaagt caactgttgt 10500 ttacctggca gacattcatc taggagttct cttttatgcc accccacagt gatccgcctt 10560 ttgcagttta tccactaggg acaggattgc caccccacag tggggcctct atgcccggga 10620 caagtgtaaa atatagagta taggggttat catcacagag aagctattgc tggagggcct 10680 ctgttatttc ctctccatgc cactcccatt tttaacctac caactgaaat cccaagggag 10740 actccaccct gtaactagag tcctcagagg tgagccatcc catattaaca aatgggcatt 10800 agggctagga tgccaaggga tacctgaaat gggaagttgt ggggctgagt cctcctggga 10860 atcagagata atatgtaaac agtttgttga gagattgatg agagctgact ttgagaggtg 10920 gccatgctcc ctggtcctca atagggaagg cactacacaa gaaacctggg tttgatcaac 10980 tgcactgtgt cctactcaca cattgtgtgc ctggaaaaat gttacttagt atttggaggg 11040 cctccagaac ccccctgggt gcaagactgg gtgctagtga ctgggtgaat gagtcttgga 11100 cacagtggcc ttgtctaggt tgtgtgaggt ggctaggcat catggcaata cctcataatt 11160 gatgagtgag gaaacaagac taagtccttg actcctctta ttacatgacc tggtggatat 11220 tatgtttaaa ctctgcaagc tggaatgagt actgggtgca gatcccctgg gattctggct 11280 acaaaggtga atgatagcta gtctgtttat tagtagccaa aaaagtcagt gaggggtgag 11340 tgccctggga tgttgttaag ttcacattgc acacttggag accctctcca tccagtaaca 11400 taccagagaa aactgaccaa gccctcatgg gtgtatggga acaacaaacc tcctggctac 11460 ttcaagggca cataacacca gcaaggagcc tgtcataacc accatctcaa acaatagaac 11520 ttcctaagtg aagcaatgac ttcaaatcta cttgaaggca tggagtataa gccatgttcc 11580 tttcagaggg gactgtactt ctgtagatta ctttccctca ttaaccagat ctggccggcc 11640 tacccagctt tcttgtacaa agtggtgata aactatcagt gtttgacagg atatattggc 11700 gggtaaac 11708 <210> 87 <211> 11707 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 87 tggcaggata tattgtggtg taaacaaatt gacgcttaga caacttaata acacattgcg 60 gacgttttta atgtactgaa ttaacgccga attgaattcg agctcggtac ccggggatcc 120 tctagagtcg acctgcaggc atgcaagctt agcttgagct tggatcagat tgtcgtttcc 180 cgccttcagt ttatcacaag tttgtacaaa aaagcaggct aagactcccg cccatctcac 240 tagggacagg attggagtcc atgctcaaca ccgtgcagga tgaggatgac catagcgact 300 tcgtgggcga ggaaagcctt tcgtccaagg tggtccctcc tcgcaatctt gttggatggt 360 gaatattata aaagcctgcc cttctcgcgg gtgtttaaac gtcgacctgc aggtcaacgg 420 atcaggatat tcttgtttaa gatgttgaac tctatggagg tttgtatgaa ctgatgatct 480 aggaccggat aagttccctt cttcatagcg aacttattca aagaatgttt tgtgtatcat 540 tcttgttaca ttgttattaa tgaaaaaata ttattggtca ttggactgaa cacgagtgtt 600 aaatatggac caggccccaa ataagatcca ttgatatatg aattaaataa caagaataaa 660 tcgagtcacc aaaccacttg ccttttttaa cgagacttgt tcaccaactt gatacaaaag 720 tcattatcct atgcaaatca ataatcatac aaaaatatcc aataacacta aaaaattaaa 780 agaaatggat aatttcacaa tatgttatac gataaagaag ttacttttcc aagaaattca 840 ctgattttat aagcccactt gcattagata aatggcaaaa aaaaacaaaa aggaaaagaa 900 ataaagcacg aagaattcta gaaaatacga aatacgcttc aatgcagtgg gacccacggt 960 tcaattattg ccaattttca gctccaccgt atatttaaaa aataaaacga taatgctaaa 1020 aaaatataaa tcgtaacgat cgttaaatct caacggctgg atcttatgac gaccgttaga 1080 aattgtggtt gtcgacgagt cagtaataaa cggcgtcaaa gtggttgcag ccggcacaca 1140 cgagtcgtgt ttatcaactc aaagcacaaa tacttttcct caacctaaaa ataaggcaat 1200 tagccaaaaa caactttgcg tgtaaacaac gctcaataca cgtgtcattt tattattagc 1260 tattgcttca ccgccttagc tttctcgtga cctagtcgtc ctcgtctttt cttcttcttc 1320 ttctataaaa caatacccaa agagctcttc ttcttcacaa ttcagatttc aatttctcaa 1380 aatcttaaaa actttctctc aattctctct accgtgatca aggtaaattt ctgtgttcct 1440 tattctctca aaatcttcga ttttgttttc gttcgatccc aatttcgtat atgttctttg 1500 gtttagattc tgttaatctt agatcgaaga cgattttctg ggtttgatcg ttagatatca 1560 tcttaattct cgattagggt ttcatagata tcatccgatt tgttcaaata atttgagttt 1620 tgtcgaataa ttactcttcg atttgtgatt tctatctaga tctggtgtta gtttctagtt 1680 tgtgcgatcg aatttgtcga ttaatctgag tttttctgat taacagatgg cttcatctga 1740 gaacgttatc actgagttca tgaggttcaa ggtgaggatg gaaggtactg ttaacggaca 1800 tgagttcgag atcgagggtg agggtgaagg tagaccttac gagggacata acaccgttaa 1860 gcttaaggtt acaaagggtg gacctcttcc tttcgcttgg gatatccttt ctcctcaatt 1920 ccaatacgga agcaaggtaa gtttgtggat tcttcgtcca tgtgatcttt gagtttcttt 1980 agagcttgtg agggattagt aagtaacaat gcttgagttt tttgctgctg ggcttcgaaa 2040 agtttgtcac ttgttggttt gatccacaag gtcttcttct ccatagctac tagacatgtt 2100 ttagcttaag attcaagttt atatatgcct tgtggattaa tcattgcctg attcttccgt 2160 gtcatctctg agtttattta gagcttggaa gtggtgtagt aataactaac aatactcttg 2220 ataagttgta gcaatgctct tgattagtgg atgtaatatg atgttgataa gatatatgag 2280 gcacagaacc aaaagtggtg cttccactag acccgttttt agcctaaggt tcaagtttat 2340 accttgtaga tgtttctgta ttgtctgatt cttccctgtg atatttgaat ttcttagagc 2400 tttggaagtg atataggaac aatgctcttg tgtgtttgtc tctatgaaga ttatcgctgt 2460 cgtgtttcat ccgagtgtgc gggatttttt gctgctgggt ttagcctttc ttcaaaaagt 2520 tattacttgt tagttttatt gttttggtct tgataagaga tgttaggaca gacatggtgc 2580 ttcttgtcta tagccactag acctatttta gcataaggtt aacgaaattc tctctacata 2640 ccttgtggat ttgtttacat tgcctgatct ttcctgtgat cgctgtcatg tttctttgga 2700 atgattgatg tttataaatg gaaaaatctt tgtgcagaag actcccgccc atccaggatg 2760 aggatgacca ccaccccaca gtggggcagg atgaggatga ccaggtcgca gcgtgtgcgt 2820 gtccgtcgta cgttctggcc ggccgggcct tgggcgcgcg atcagaagcg ttgcgttggc 2880 gtgtgtgtgc ttctggtttg ctttaatttt accaagtttg tttcaaggtg gatcgcgtgg 2940 tcaaggcccg tgtgctttaa agacccaccg gcactggcag tgagtgttgc tgcttgtgta 3000 ggctttggta cgtatgggct ttatttgctt ctggatgttg tgtactactt gggtttgttg 3060 aattattatg agcagttgcg tattgtaatt cagctgggct acctggacat tgttatgtat 3120 taataaatgc tttgctttct tctaaagatc tttaagtgct acaactttgt atacaaaagt 3180 tggtttaaac aaccgacaac cactttgcgg acttcctttc aagagaattc aataaggtta 3240 attcctaatt gaaatccgaa gataagattc ccacacactt gtggctgata tcaaaaggct 3300 actgcctatt taaacacatc tctggagact gagaaaatca gacctccaag catgaagaag 3360 cctgagctta ctgctacttc tgttgagaag ttcctcatcg agaagttcga ttctgtgtct 3420 gatcttatgc agctctctga gggtgaggaa tcaagagctt tctctttcga tgttggtgga 3480 agaggatacg ttctcagagt taactcttgc gctgacggat tctacaagga tagatacgtg 3540 tacagacact tcgcttcagc tgctctccct atccctgaag ttcttgatat cggagagttc 3600 tctgagtctc ttacctactg tatctcaaga agggctcagg gtgttactct tcaagatctt 3660 cctgagactg agcttcctgc tgttcttcaa cctgttgctg aggctatgga tgctatcgct 3720 gctgctgatc tttctcaaac ttctggattc ggacctttcg gtcctcaggg aatcggacag 3780 tacactactt ggagagattt catctgcgct atcgctgatc ctcatgttta ccattggcag 3840 accgttatgg atgataccgt ttctgcttct gttgctcaag ctcttgatga gcttatgctt 3900 tgggctgagg attgtcctga ggttagacat cttgttcacg ctgatttcgg atctaacaac 3960 gttctcaccg ataacggaag aatcaccgct gttatcgatt ggtctgaggc tatgttcgga 4020 gattctcaat acgaggtggc caacatattc ttttggaggc cttggcttgc ttgtatggaa 4080 caacagacta gatacttcga gagaaggcat cctgagcttg ctggatctcc tagacttaga 4140 gcttacatgc ttaggatcgg acttgatcag ctttaccagt ctctcgttga tggaaacttc 4200 gatgatgctg cttgggctca gggaagatgt gatgctatcg ttagatctgg tgctggaact 4260 gttggaagaa ctcaaatcgc tagaagatct gctgctgttt ggactgatgg atgtgttgaa 4320 gttctcgctg attctggaaa cagaaggcct tctactagac ctagagccaa gaagtgaaga 4380 tcggcggcaa tagcttctta gcgccatccc gggttgatcc tatctgtgtt gaaatagttg 4440 cggtgggcaa ggctctcttt cagaaagaca ggcggccaaa ggaacccaag gtgaggtggg 4500 ctatggctct cagttccttg tggaagcgct tggtctaagg tgcagaggtg ttagcgggat 4560 gaagcaaaag tgtccgattg taacaagata tgttgatcct acgtaaggat attaaagtat 4620 gtattcatca ctaatataat cagtgtattc caatatgtac tacgatttcc aatgtcttta 4680 ttgtcgccgt atgtaatcgg cgtcacaaaa taatccccgg tgactttctt ttaatccagg 4740 atgaaataat atgttattat aatttttgcg atttggtccg ttataggaat tgaagtgtgc 4800 ttgcggtcgc caccactccc atttcataat tttacatgta tttgaaaaat aaaaatttat 4860 ggtattcaat ttaaacacgt atacttgtaa agaatgatat cttgaaagaa atatagttta 4920 aatatttatt gataaaataa caagtcaggt attatagtcc aagcaaaaac ataaatttat 4980 tgatgcaagt ttaaattcag aaatatttca ataactgatt atatcagctg gtacattgcc 5040 gtagatgaaa gactgagtgc gatattatgg tgtaatacat agtttaaacc acccaacttt 5100 tctatacaaa gttgaagact cccgcccatc caggatgagg atgaccacca ccccacagtg 5160 gggcaggatg aggatgacca gtcagtttta cttcccttaa ttttctatgt actttcataa 5220 ttacttatgt tattttcttc atgagtttta atgcaaatta ctatatggac tctagtgaaa 5280 acgttcagaa tcctataaac atgactactg agacgaactt gagagtagtt ttgatcatac 5340 acacgtttca tgtggtactt gagagttact aatttttgtc atcttcgtat aagtagtaaa 5400 agatactaca agaatagttt agtagaaaat actagcggta ggtgaagatt tgtcgctatg 5460 tactattatt gtctagtaac ttgagtaaca atttcgtggt ctaaatatca aataaaaatg 5520 gatgagtggt tcaccaaatc taggcatcaa aactattaat gtcattgtct agatcttagg 5580 tgacaccaca tttcgaatat ttattggtaa ttgagatgtt aaagtaccaa tatttgactt 5640 aataaactaa aagattttgg ctttatcaaa tgtagacatt gatgacatat cgttgtcatt 5700 atcttgagta tatacaagtc gatcaattag gtgaaagttt agtgtctcgt ggttggtaaa 5760 cgattaatac agtagtatat tttatccaaa gacaaaatcc aaatcatttc accagtatga 5820 atagtattat tttatcttaa aagctaaaat cttaaaaacc aaggtagcac ccacgttgag 5880 ctagacgatc aaatcgattt ctgctttgtc caatttacca agctatttaa agccaaataa 5940 ttgaaatata ggtaggtcgt tatattaggc taagatttat ctcaaatgct taactaaagg 6000 aataacaagg gattctagtt gtgtggtttt ataagattgg tccaatttca cttaagtttg 6060 tttattgtag aattttatat gtgaataatt tgaattccaa ttgaaaagat attatagtaa 6120 aagaaaaaat agtgcgaaca aaaaacttta atcccataaa aagaaaaaga aaaatgaaaa 6180 gttcttctaa catccatatt ttgcatcata tcataaagat aagaaagata catatcatag 6240 acgtacagat aaacaaacat atcatcattt gtgaaataca tagtacaata atttgctttt 6300 aaatagagtt taagtcacac acactgacac acacgataaa acgataatgt ctgcaaaaac 6360 actttaatcc cattgcctag aggacagctt ctccactttg tctttaaggt tggttttgcc 6420 gtgttgtttt tatctttata taatgatcta ttttttggat tatgaaatga attcacacat 6480 tttaattatt taagaagatc catatacagg tttataacag tactaagtga tgattatttt 6540 ttgtttttgc atagtttagt ttattgggta aacattcatt acgtgtctct ttatacgaat 6600 cacccatcca aaatttcaag tagtctttta gttcatttat tatttcataa ctatttgact 6660 tattgatttg acaagaaaca acaaaagtgt tgacttattg atagattgtg ggatcataaa 6720 agtaattaag cgtcaaccac gacccacaac aacaaagcac atgttataca ttaatatctc 6780 gtttacttaa ttacagtttt cagaatgccg tttcatgtct tgtcactggc gatgttatta 6840 tcatgttgga caatattcga ctgttgtcgt ttttacattt tcgtattgac taaaactaaa 6900 aaaacaaaac tctgtttcag gttgggccta ggatccacat tgtacacaca tttgcttaag 6960 tctatggagg cgcaaggttt taagtctgtg gttgctgtta taggccttcc aaacgatcca 7020 tctgttaggt tgcatgaggc tttgggatac acagcccggg gtacattgcg cgcagctgga 7080 tacaagcatg gtggatggca tgatgttggt ttttggcaaa gggattttga gttgccagct 7140 cctccaaggc cagttaggcc agttacccag atctaatatc aaaatctatt tagaaataca 7200 caatattttg ttgcaggctt gctggagaat cgatctgcta tcataaaaat tacaaaaaaa 7260 ttttatttgc ctcaattatt ttaggattgg tattaaggac gcttaaatta tttgtcgggt 7320 cactacgcat cattgtgatt gagaagatca gcgatacgaa atattcgtag tactatcgat 7380 aatttatttg aaaattcata agaaaagcaa acgttacatg aattgatgaa acaatacaaa 7440 gacagataaa gccacgcaca tttaggatat tggccgagat tactgaatat tgagtaagat 7500 cacggaattt ctgacaggag catgtcttca attcagccca aatggcagtt gaaatactca 7560 aaccgcccca tatgcaggag cggatcattc attgtttgtt tggttgcctt tgccaacatg 7620 ggagtccaag gttatttaaa taccctgcca agcttgaggt agcctccaat ttgacggtgc 7680 cgccagcgac gccgtctgga actgtccttt ttgaggacca ctccgtttgt ggagatcatg 7740 aacaactttg tataataaag ttgaagactc ccgcccatct ctctatgccc gggacaagtg 7800 gagtccatgc tcaacaccgt gcactaggga caggattggt ttaaacgttt gtgtcttcta 7860 gattaatcct ccaaactttt gattaaccaa aaaaattatc aaactaacat gttctccttt 7920 tttctttaga aattctaacg aatttatctt tatactgatt tgaatatact taatttggtc 7980 atttggatgc cctttacaac ctccttacca aactattgat cacagtttct attgctaaaa 8040 tcaccaacaa aacgcatgtc gccattcata attatggttt cacacctaca actaggctaa 8100 taagtaaata agtagacaac tagactcagg tttgaaaaaa ccataaaagc catatagcgt 8160 tttctcattg aaactgcgaa cacgatcgtg tgaatgttgc agtttctagt tttgatacaa 8220 acaaacaaaa acacaattta atcttagatt aaaaagaaaa aagagaacgg agcccactag 8280 ccactccttc aaacgtgtct taccaactct cttctagaaa caaattaggc ttcaccttcc 8340 tcttccaacc tctctctctc tctctctctc tttttctcaa accatctctc cataaagccc 8400 taatttcttc atcacaagaa tcagaagaag aaagatggac ctgcatctaa ttttcggtcc 8460 aacttgcaca ggaaagacga cgaccgcgat agctcttgcc cagcagacag ggcttccagt 8520 cctttcgctt gatcgggtcc aatgctgtcc tcaactatca accggaagcg gacgaccaac 8580 agtggaagaa ctgaaaggaa cgacgcgtct ctaccttgat gatcggcctc tggtggaggg 8640 tatcatcgca gccaagcaag ctcatcatag gctgatcgag gaggtgtata atcatgaggc 8700 caacggcggg cttattcttg agggaggatc cacctcgttg ctcaactgca tggcgcgaaa 8760 cagctattgg agtgcagatt ttcgttggca tattattcgc cacaagttac ccgaccaaga 8820 gaccttcatg aaagcggcca aggccagagt taagcagatg ttgcaccccg ctgcaggcca 8880 ttctattatt caagagttgg tttatctttg gaatgaacct cggctgaggc ccattctgaa 8940 agagatcgat ggatatcgat atgccatgtt gtttgctagc cagaaccaga tcacggcaga 9000 tatgctattg cagcttgacg caaatatgga aggtaagttg attaatggga tcgctcagga 9060 gtatttcatc catgcgcgcc aacaggaaca gaaattcccc caagttaacg cagccgcttt 9120 cgacggattc gaaggtcatc cgttcggaat gtattagaaa tcaccagtct ctctctacaa 9180 atctatctct ctctattttt ctccagaata atgtgtgagt agttcccaga taagggaatt 9240 agggttctta tagggtttcg ctcatgtgtt gagcatataa gaaaccctta gtatgtattt 9300 gtatttgtaa aatacttcta tcaataaaat ttctaattcc taaaaccaaa atccagtgtt 9360 taaacaagac tcccgcccat ctctctatgc ccgggacaag tggagtccat gctcaacacc 9420 gtgcactagg gacaggattg cattaaggat gaccagttcg taaaggtcct gcggtgtcta 9480 ttgcttttca taggttaata agtgtttgct agactgtggt gaaaggccta tccgaagtaa 9540 ggccggccgg atccttcatc tttggacaag ggaataaaga ctccccactt gctactaaga 9600 acaataccta agttgcccag acatgactgt acccattcag agacctacca cccattaggg 9660 ctatgacact aacactagcc cctggaggtt gaccatgcta ggcagtgggg gtctcaccta 9720 tgacccactc agataggggt ttaaaccagt gggtgggatc tcagcctcat ataggtgttt 9780 gtggtgagct ttctcctaga caagagaacc ctgaagaaca gcaagaacca gctaatatga 9840 tatgtagaca tagtgggttg ctcaaatttt gtgtttagtc atattagaat tgacctcagt 9900 gaccactcag aaagtgccca agcccatcta taggggccaa agtgctattg actggtgtgt 9960 ctgtgaattg ttcctcccta cagagttggt gctgatatat cctagcattc tttggaaaac 10020 ctagctaggg actgtcaagt gtaagatacc tcctgaattg gagggaacac tagctgccct 10080 gtaccttctg gctagtacct tacaccctga atgggttagg gggtctatta tttgctggaa 10140 atataccagt ttcagtaggg ctgctgcctt aggtcccaca aggtgtaaca tgtgctcaat 10200 agttgcacta ccacatgcac gtgaacttaa tgatgttata gccacaacac caaccttggt 10260 ttgcagtttg acatccctct ggaatgggtg tagtcatctt gctctggatc tgcctgaatc 10320 attggggctg tatgcagcct gggcttaaag tgaagaatgg gatgtcccag aaatattttg 10380 ggtgagaaga atcctggagt agatggtgac ctgactatcc ctgtcctatg ggcacaatct 10440 atcatcagat attgcattca aagggctatc atgggatcaa gtcctaagtc aactgttgtt 10500 tacctggcag acattcatct aggagttctc ttttatgcca ccccacagtg atccgccttt 10560 tgcagtttat ccactaggga caggattgcc accccacagt ggggcctcta tgcccgggac 10620 aagtgtaaaa tatagagtat aggggttatc atcacagaga agctattgct ggagggcctc 10680 tgttatttcc tctccatgcc actcccattt ttaacctacc aactgaaatc ccaagggaga 10740 ctccaccctg taactagagt cctcagaggt gagccatccc atattaacaa atgggcatta 10800 gggctaggat gccaagggat acctgaaatg ggaagttgtg gggctgagtc ctcctgggaa 10860 tcagagataa tatgtaaaca gtttgttgag agattgatga gagctgactt tgagaggtgg 10920 ccatgctccc tggtcctcaa tagggaaggc actacacaag aaacctgggt ttgatcaact 10980 gcactgtgtc ctactcacac attgtgtgcc tggaaaaatg ttacttagta tttggagggc 11040 ctccagaacc cccctgggtg caagactggg tgctagtgac tgggtgaatg agtcttggac 11100 acagtggcct tgtctaggtt gtgtgaggtg gctaggcatc atggcaatac ctcataattg 11160 atgagtgagg aaacaagact aagtccttga ctcctcttat tacatgacct ggtggatatt 11220 atgtttaaac tctgcaagct ggaatgagta ctgggtgcag atcccctggg attctggcta 11280 caaaggtgaa tgatagctag tctgtttatt agtagccaaa aaagtcagtg aggggtgagt 11340 gccctgggat gttgttaagt tcacattgca cacttggaga ccctctccat ccagtaacat 11400 accagagaaa actgaccaag ccctcatggg tgtatgggaa caacaaacct cctggctact 11460 tcaagggcac ataacaccag caaggagcct gtcataacca ccatctcaaa caatagaact 11520 tcctaagtga agcaatgact tcaaatctac ttgaaggcat ggagtataag ccatgttcct 11580 ttcagagggg actgtacttc tgtagattac tttccctcat taaccagatc tggccggcct 11640 acccagcttt cttgtacaaa gtggtgataa actatcagtg tttgacagga tatattggcg 11700 ggtaaac 11707 <210> 88 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 88 cgagaacttg gcaattcc 18 <210> 89 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 89 tggcgattct gagattcc 18 <210> 90 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 90 gactcatcgt actctccctt cg 22 <210> 91 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 91 gactcatcgt actctccctt cg 22 <210> 92 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 92 tgttggtgga agaggatacg 20 <210> 93 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 93 atcagcagca gcgatagc 18 <210> 94 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 94 atgtccactg ggttcgtgcc 20 <210> 95 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 95 gaagggaact tatccggtcc 20 <210> 96 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 96 tgcgctgcca ttctccaaat 20 <210> 97 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 97 accgagctcg aattcaattc 20 <210> 98 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 98 cctgcattcg gttaaacacc 20 <210> 99 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 99 ccatctggct tctgccttgc 20 <210> 100 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 100 attccgatcc ccagggcagt 20 <210> 101 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 101 gccaacgttg cagccttgct 20 <210> 102 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 102 gccctgggat gttgttaagt 20 <210> 103 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 103 gtaacttagg acttgtgcga 20 <210> 104 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 104 tctctacctt gatgatcgg 19 <210> 105 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 105 aacatctgct taactctggc 20 <210> 106 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 106 atggcttcat ctgagaacg 19 <210> 107 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 107 ttccgtattg gaattgagg 19 <210> 108 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 108 ttgcttaagt ctatggaggc g 21 <210> 109 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 109 tgggtaactg gcctaactgg 20 <210> 110 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 110 atgatatgta gacatagtgg g 21 <210> 111 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 111 agggtgtaag gtactagcc 19 <210> 112 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 112 tgttggtgga agaggatacg 20 <210> 113 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 113 atcagcagca gcgatagc 18 <210> 114 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 114 gtggagaaga actacgagct accc 24 <210> 115 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 115 gactcatcgt actctccctt cg 22 <210> 116 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 116 Arg Ser Asp Asn Leu Ala Arg 1 5 <210> 117 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 117 Gln Lys Lys Asp Arg Ser Tyr 1 5 <210> 118 <400> 118 000 <210> 119 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 119 Gln Arg Gly Asn Arg Asn Thr 1 5 <210> 120 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 120 Arg Ser Asp His Leu Ser Arg 1 5 <210> 121 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 121 Arg Asn Gln Asp Arg Thr Asn 1 5 <210> 122 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 122 Asp Arg Ser Asn Leu Ser Arg 1 5 <210> 123 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 123 Arg Gln Asp Ser Arg Ser Gln 1 5 <210> 124 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 124 Gln Ser Ser Asp Leu Ser Arg 1 5 <210> 125 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 125 Asp Arg Ser Ala Leu Ala Arg 1 5 <210> 126 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 126 Thr Ser Gly Ser Leu Thr Arg 1 5 <210> 127 <400> 127 000 <210> 128 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 128 Ala Ala Ser Asn Arg Ser Lys 1 5 <210> 129 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 129 Thr Ser Gly Ser Leu Ser Arg 1 5 <210> 130 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 130 Arg Ser Asp Ala Leu Ala Arg 1 5 <210> 131 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 131 Arg Ser Asp Val Leu Ser Thr 1 5 <210> 132 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 132 Trp Gly Arg Leu Arg Lys Leu 1 5 <210> 133 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 133 Glu Arg Gly Thr Leu Ala Arg 1 5 <210> 134 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 134 Arg Ser Asp Asp Leu Thr Arg 1 5 <210> 135 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 135 Arg Ser Asp His Leu Ser Ala 1 5 <210> 136 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 136 Gln His Gly Ala Leu Gln Thr 1 5 <210> 137 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 137 Thr Ser Gly Asn Leu Thr Arg 1 5 <210> 138 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 138 Gln Ser Gly His Leu Ser Arg 1 5 <210> 139 <400> 139 000 <210> 140 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 140 Arg Ser Asp His Leu Ser Gln 1 5 <210> 141 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 141 Cys Thr Arg Asn Arg Trp Arg 1 5 <210> 142 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 142 Arg Ser Asp Asn Leu Ser Glu 1 5 <210> 143 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 143 Ala Ser Lys Thr Arg Lys Asn 1 5 <210> 144 <400> 144 000 <210> 145 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 145 Thr Ser Ser Asn Arg Ala Val 1 5 <210> 146 <400> 146 000 <210> 147 <400> 147 000 <210> 148 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 148 Arg Ser Asp Val Leu Ser Glu 1 5 <210> 149 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 149 Arg Asn Phe Ser Leu Thr Met 1 5 <210> 150 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 150 Gln Ser Gly Asp Leu Thr Arg 1 5 <210> 151 <400> 151 000 <210> 152 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 152 Gln Ser Gly Asn Leu Ala Arg 1 5 <210> 153 <400> 153 000 <210> 154 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 154 Gln Ser Gly Ser Leu Thr Arg 1 5 <210> 155 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 155 Asp Arg Ser His Leu Ala Arg 1 5 <210> 156 <400> 156 000 <210> 157 <400> 157 000 <210> 158 <400> 158 000 <210> 159 <400> 159 000 <210> 160 <400> 160 000 <210> 161 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 161 His Leu Gly Asn Leu Lys Thr 1 5 <210> 162 <400> 162 000 <210> 163 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 163 Thr Ala Arg Leu Leu Lys Leu 1 5 <210> 164 <400> 164 000 <210> 165 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 165 Gln Thr Ser His Leu Pro Gln 1 5 <210> 166 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 166 Arg Ser Asp Asn Leu Ser Val 1 5 <210> 167 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 167 Thr Ser Gly His Leu Ser Arg 1 5 <210> 168 <400> 168 000 <210> 169 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 169 Arg Ser Asp Ala Leu Ser Thr 1 5 <210> 170 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 170 Asp Arg Ser Thr Arg Thr Lys 1 5 <210> 171 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 171 Gln Asn Ala His Arg Lys Thr 1 5 <210> 172 <400> 172 000 <210> 173 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 173 Leu Lys Gln Met Leu Ala Val 1 5 <210> 174 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 174 Arg Ser Asp Asn Leu Ser Arg 1 5 <210> 175 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 175 Asp Asn Ser Asn Arg Lys Thr 1 5 <210> 176 <400> 176 000 <210> 177 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 177 Gln Asn Ala Asn Arg Ile Thr 1 5 <210> 178 <400> 178 000 <210> 179 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 179 Gln Ser Ser Val Arg Asn Ser 1 5 <210> 180 <400> 180 000 <210> 181 <400> 181 000 <210> 182 <400> 182 000 <210> 183 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 183 Asp Arg Ser Asn Leu Thr Arg 1 5 <210> 184 <400> 184 000 <210> 185 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 185 Thr Arg Asn Gly Leu Lys Tyr 1 5 <210> 186 <400> 186 000 <210> 187 <400> 187 000 <210> 188 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 188 Arg Ser Ser Asp Arg Thr Lys 1 5 <210> 189 <400> 189 000 <210> 190 <400> 190 000 <210> 191 <400> 191 000 <210> 192 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 192 Gln Ser Thr His Arg Asn Ala 1 5 <210> 193 <400> 193 000 <210> 194 <400> 194 000 <210> 195 <400> 195 000 <210> 196 <400> 196 000 <210> 197 <400> 197 000 <210> 198 <400> 198 000 <210> 199 <400> 199 000 <210> 200 <400> 200 000 <210> 201 <400> 201 000 <210> 202 <400> 202 000 <210> 203 <400> 203 000 <210> 204 <400> 204 000 <210> 205 <400> 205 000 <210> 206 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 206 Arg Ser Asp Thr Leu Ser Gln 1 5 <210> 207 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 207 Gln Arg Asp His Arg Ile Lys 1 5 <210> 208 <400> 208 000 <210> 209 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 209 Gln Ser Ser Asp Leu Arg Arg 1 5 <210> 210 <400> 210 000 <210> 211 <400> 211 000 <210> 212 <400> 212 000 <210> 213 <400> 213 000 <210> 214 <400> 214 000 <210> 215 <400> 215 000 <210> 216 <400> 216 000 <210> 217 <400> 217 000 <210> 218 <400> 218 000 <210> 219 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 219 Asp Arg Gly Asp Leu Arg Lys 1 5 <210> 220 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 220 Asp Ser Ser Asp Arg Lys Lys 1 5 <210> 221 <400> 221 000 <210> 222 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 222 Asp Asn Tyr Asn Arg Ala Lys 1 5 <210> 223 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 223 Asp Arg Ser His Leu Thr Arg 1 5 <210> 224 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 224 Arg Ser Asp Asn Leu Thr Thr 1 5 <210> 225 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 225 Arg Ser Asp Asn Leu Ser Asn 1 5 <210> 226 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 226 Thr Ser Ser Ser Arg Ile Asn 1 5 <210> 227 <400> 227 000 <210> 228 <400> 228 000 <210> 229 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 229 Arg Ser Asp Ala Leu Thr Gln 1 5 <210> 230 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 230 Arg Ser Asp Thr Leu Ser Thr 1 5 <210> 231 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 231 Asp Arg Ser Ser Arg Ile Lys 1 5 <210> 232 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 232 Arg Ser Asp Asp Leu Ser Lys 1 5 <210> 233 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 233 Asp Asn Ser Asn Arg Ile Lys 1 5 <210> 234 <400> 234 000 <210> 235 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 235 Gln Ala Gly Asn Leu Ser Lys 1 5 <210> 236 <400> 236 000 <210> 237 <400> 237 000 <210> 238 <400> 238 000 <210> 239 <400> 239 000 <210> 240 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 240 Leu Arg Gln Thr Leu Arg Asp 1 5 <210> 241 <400> 241 000 <210> 242 <400> 242 000 <210> 243 <400> 243 000 <210> 244 <400> 244 000 <210> 245 <400> 245 000 <210> 246 <400> 246 000 <210> 247 <400> 247 000 <210> 248 <400> 248 000 <210> 249 <400> 249 000 <210> 250 <400> 250 000 <210> 251 <400> 251 000 <210> 252 <400> 252 000 <210> 253 <400> 253 000 <210> 254 <400> 254 000 <210> 255 <211> 57 <212> DNA <213> Brassica napus <400> 255 gcccaaggaa cccttttctg ggccatcttc gtactcggcc acgactggta atttaat 57 <210> 256 <211> 58 <212> DNA <213> Brassica napus <400> 256 agcgagagaa agcttattgc aacttcaact acttgctggt cgatcgtgtt ggccactc 58 <210> 257 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 257 gcccaaggaa cccttttctg ggccatct 28 <210> 258 <211> 28 <212> DNA <213> Brassica napus <400> 258 cgtactcggc cacgactggt aatttaat 28 <210> 259 <211> 57 <212> DNA <213> Brassica napus <400> 259 gcccaaggaa cccttttctg ggccatcttc gtactcggcc acgactggta atttaat 57 <210> 260 <211> 57 <212> DNA <213> Brassica napus <400> 260 gcccaaggaa ccctgttctg ggctatcttc gtactcggcc acgactggta atttaat 57 <210> 261 <211> 57 <212> DNA <213> Brassica napus <400> 261 gcccaaggaa cccttttctg ggccatcttc gtcctcggcc acgactggta aagtttc 57 <210> 262 <211> 57 <212> DNA <213> Brassica napus <400> 262 gcccaaggaa cccttttctg ggccatcttc gtcctcggcc acgactggta aagtttc 57 <210> 263 <211> 57 <212> DNA <213> Brassica napus <400> 263 gcccaaggaa cccttttctg ggccatcttc gttcttggcc acgactggta aattaaa 57 <210> 264 <211> 57 <212> DNA <213> Brassica napus <400> 264 gcccaaggaa cccttttctg ggccatcttc gttcttggcc acgactggta aattaaa 57 <210> 265 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 265 agcgagagaa agcttattgc aacttcaa 28 <210> 266 <211> 28 <212> DNA <213> Brassica napus <400> 266 acttgctggt cgatcgtgtt ggccactc 28 <210> 267 <211> 58 <212> DNA <213> Brassica napus <400> 267 agcgagagaa agcttattgc aacttcaact acttgctggt cgatcgtgtt ggccactc 58 <210> 268 <211> 58 <212> DNA <213> Brassica napus <400> 268 agcgagagaa agcttattgc aacttcaact acttgctggt cgatcatgtt ggccactc 58 <210> 269 <211> 58 <212> DNA <213> Brassica napus <400> 269 agcgagagaa agcttattgc aacttcaact acttgctggt ccataatgtt ggccattc 58 <210> 270 <211> 58 <212> DNA <213> Brassica napus <400> 270 agcgagagaa agcttattgc aacttcgact acttgctggt ccataatgtt ggcaattc 58 <210> 271 <211> 58 <212> DNA <213> Brassica napus <400> 271 agcgagagga agcttattgc aacttcaaca acttgctggt ccataatgtt ggccactc 58 <210> 272 <211> 58 <212> DNA <213> Brassica napus <400> 272 agcgagagga agcttattgc aacttcaact acttgctggt ccataatgtt ggccactc 58 <210> 273 <211> 3292 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 273 ccagaaggta attatccaag atgtagcatc aagaatccaa tgtttacggg aaaaactatg 60 gaagtattat gtaagctcag caagaagcag atcaatatgc ggcacatatg caacctatgt 120 tcaaaaatga agaatgtaca gatacaagat cctatactgc cagaatacga agaagaatac 180 gtagaaattg aaaaagaaga accaggcgaa gaaaagaatc ttgaagacgt aagcactgac 240 gacaacaatg aaaagaagaa gataaggtcg gtgattgtga aagagacata gaggacacat 300 gtaaggtgga aaatgtaagg gcggaaagta accttatcac aaaggaatct tatcccccac 360 tacttatcct tttatatttt tccgtgtcat ttttgccctt gagttttcct atataaggaa 420 ccaagttcgg catttgtgaa aacaagaaaa aatttggtgt aagctatttt ctttgaagta 480 ctgaggatac aacttcagag aaatttgtaa gtttgtagat ctccatggct ccaaggaaga 540 ggaaggagtc taacagggag tcagctagga ggtcaaggta caggaaggtg ggtatccacg 600 gggtacccgc cgctatggct gagaggccct tccagtgtcg aatctgcatg cgtaacttca 660 gtcgtagtga caacctgagc aaccacatcc gcacccacac aggcgagaag ccttttgcct 720 gtgacatttg tgggaggaaa tttgccacca gcagcagccg cataaaccat accaagatac 780 acacgggcag ccaaaagccc ttccagtgtc gaatctgcat gcgtaacttc agtcgtagtg 840 acaacctgag cgaacacatc cgcacccaca caggcgagaa gccttttgcc tgtgacattt 900 gtgggaggaa atttgccgcc agcaagaccc gcaaaaacca taccaagata cacacgggcg 960 agaagccctt ccagtgtcga atctgcatgc gtaagtttgc ccgctccgac gccctgaccc 1020 agcatgccca gagatgcgga ctgcggggat cccaacttgt gaaatcagaa ttggaagaga 1080 aaaagtctga gcttagacac aaattgaagt acgttccaca tgaatatatc gaacttatcg 1140 agattgctag gaactcaaca caggacagaa ttttggagat gaaggttatg gagttcttta 1200 tgaaagtgta cggatatagg ggaaagcacc ttggtggttc taggaaacct gatggtgcaa 1260 tctacactgt gggatcacct attgactatg gtgttatcgt ggatacaaag gcatactctg 1320 gtggatacaa tttgccaatc ggacaagctg acgaaatgca gagatatgtt gaagagaacc 1380 aaactagaaa caaacatatt aatccaaatg aatggtggaa ggtgtatcct tcatctgtta 1440 cagagttcaa attccttttt gtgtctggac actttaaggg taactacaaa gcacagctta 1500 ctaggttgaa ccatattaca aattgcaatg gtgctgtgtt gtcagttgaa gagcttttga 1560 tcggaggtga aatgattaag gcaggaacac ttactttgga ggaagttaga agaaaattca 1620 acaacggtga aatcaatttt agatctggcg gcggagaggg cagaggaagt cttctaacat 1680 gcggtgacgt ggaggagaat cccggcccta ggatggctcc aaggaagagg aaggagtcta 1740 acagggagtc agctaggagg tcaaggtaca ggaaggtggg tatccacggg gtacccgccg 1800 ctatggctga gaggcccttc cagtgtcgaa tctgcatgcg taacttcagt cgtagtgaca 1860 ccctgagcac gcacatccgc acccacacag gcgagaagcc ttttgcctgt gacatttgtg 1920 ggaggaaatt tgccgacagg agcagccgca taaagcatac caagatacac acgggatctc 1980 agaagccctt ccagtgtcga atctgcatgc gtaacttcag tcgctccgac gacctgtcca 2040 agcacatccg cacccacaca ggcgagaagc cttttgcctg tgacatttgt gggaggaagt 2100 ttgccgacaa ctccaaccgc atcaagcatg cccagagatg cggactgcgg ggatcccaac 2160 ttgtgaaatc agaattggaa gagaaaaagt ctgagcttag acacaaattg aagtacgttc 2220 cacatgaata tatcgaactt atcgagattg ctaggaactc aacacaggac agaattttgg 2280 agatgaaggt tatggagttc tttatgaaag tgtacggata taggggaaag caccttggtg 2340 gttctaggaa acctgatggt gcaatctaca ctgtgggatc acctattgac tatggtgtta 2400 tcgtggatac aaaggcatac tctggtggat acaatttgcc aatcggacaa gctgacgaaa 2460 tgcagagata tgttgaagag aaccaaacta gaaacaaaca tattaatcca aatgaatggt 2520 ggaaggtgta tccttcatct gttacagagt tcaaattcct ttttgtgtct ggacacttta 2580 agggtaacta caaagcacag cttactaggt tgaaccatat tacaaattgc aatggtgctg 2640 tgttgtcagt tgaagagctt ttgatcggag gtgaaatgat taaggcagga acacttactt 2700 tggaggaagt tagaagaaaa ttcaacaacg gtgaaatcaa tttttgataa ctcgagctcg 2760 gtcaccagca taatttttat taatgtacta aattactgtt ttgttaaatg caattttgct 2820 ttctcgggat tttaatatca aaatctattt agaaatacac aatattttgt tgcaggcttg 2880 ctggagaatc gatctgctat cataaaaatt acaaaaaaat tttatttgcc tcaattattt 2940 taggattggt attaaggacg cttaaattat ttgtcgggtc actacgcatc attgtgattg 3000 agaagatcag cgatacgaaa tattcgtagt actatcgata atttatttga aaattcataa 3060 gaaaagcaaa cgttacatga attgatgaaa caatacaaag acagataaag ccacgcacat 3120 ttaggatatt ggccgagatt actgaatatt gagtaagatc acggaatttc tgacaggagc 3180 atgtcttcaa ttcagcccaa atggcagttg aaatactcaa accgccccat atgcaggagc 3240 ggatcattca ttgtttgttt ggttgccttt gccaacatgg gagtccaagg tt 3292 <210> 274 <211> 3475 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 274 ccagaaggta attatccaag atgtagcatc aagaatccaa tgtttacggg aaaaactatg 60 gaagtattat gtaagctcag caagaagcag atcaatatgc ggcacatatg caacctatgt 120 tcaaaaatga agaatgtaca gatacaagat cctatactgc cagaatacga agaagaatac 180 gtagaaattg aaaaagaaga accaggcgaa gaaaagaatc ttgaagacgt aagcactgac 240 gacaacaatg aaaagaagaa gataaggtcg gtgattgtga aagagacata gaggacacat 300 gtaaggtgga aaatgtaagg gcggaaagta accttatcac aaaggaatct tatcccccac 360 tacttatcct tttatatttt tccgtgtcat ttttgccctt gagttttcct atataaggaa 420 ccaagttcgg catttgtgaa aacaagaaaa aatttggtgt aagctatttt ctttgaagta 480 ctgaggatac aacttcagag aaatttgtaa gtttgtagat ctccatggct ccaaggaaga 540 ggaaggagtc taacagggag tcagctagga ggtcaaggta caggaaggtg ggtatccacg 600 gggtacccgc cgctatggct gagaggccct tccagtgtcg aatctgcatg cgtaacttca 660 gtcagtcctc cgacctgtcc cgccacatcc gcacccacac cggcgagaag ccttttgcct 720 gtgacatttg tgggaggaaa tttgcccagg ccggcaacct gtccaagcat accaagatac 780 acacgcatcc cagggcacct attcccaagc ccttccagtg tcgaatctgc atgcgtaagt 840 ttgcccagtc cggcgacctg acccgccata ccaagataca cacgggcgag aagcccttcc 900 agtgtcgaat ctgcatgcgt aacttcagta cctccggctc cctgtcccgc cacatccgca 960 cccacaccgg cgagaagcct tttgcctgtg acatttgtgg gaggaaattt gcccagtccg 1020 gcaacctggc ccgccatgcc cagagatgcg gactgcgggg atcccaactt gtgaaatcag 1080 aattggaaga gaaaaagtct gagcttagac acaaattgaa gtacgttcca catgaatata 1140 tcgaacttat cgagattgct aggaactcaa cacaggacag aattttggag atgaaggtta 1200 tggagttctt tatgaaagtg tacggatata ggggaaagca ccttggtggt tctaggaaac 1260 ctgatggtgc aatctacact gtgggatcac ctattgacta tggtgttatc gtggatacaa 1320 aggcatactc tggtggatac aatttgccaa tcggacaagc tgacgaaatg cagagatatg 1380 ttgaagagaa ccaaactaga aacaaacata ttaatccaaa tgaatggtgg aaggtgtatc 1440 cttcatctgt tacagagttc aaattccttt ttgtgtctgg acactttaag ggtaactaca 1500 aagcacagct tactaggttg aaccatatta caaattgcaa tggtgctgtg ttgtcagttg 1560 aagagctttt gatcggaggt gaaatgatta aggcaggaac acttactttg gaggaagtta 1620 gaagaaaatt caacaacggt gaaatcaatt ttagatctgg cggcggagag ggcagaggaa 1680 gtcttctaac atgcggtgac gtggaggaga atcccggccc taggatggct ccaaggaaga 1740 ggaaggagtc taacagggag tcagctagga ggtcaaggta caggaaggtg ggtatccacg 1800 gggtacccgc cgctatggct gagaggccct tccagtgtcg aatctgcatg cgtaacttca 1860 gtacctccgg ctccctgtcc cgccacatcc gcacccacac cggcgagaag ccttttgcct 1920 gtgacatttg tgggaggaaa tttgccctgc gccagaccct gcgcgaccat accaagatac 1980 acacgggcag ccaaaagccc ttccagtgtc gaatctgcat gcgtaacttc agtacctccg 2040 gcaacctgac ccgccacatc cgcacccaca ccggcgagaa gccttttgcc tgtgacattt 2100 gtgggaggaa atttgccgac cgctccgccc tggcccgcca taccaagata cacacgggat 2160 ctcagaagcc cttccagtgt cgaatctgca tgcgtaactt cagtcgctcc gacgtgctgt 2220 ccgagcacat ccgcacccac accggcgaga agccttttgc ctgtgacatt tgtgggagga 2280 aatttgcccg caacttctcc ctgaccatgc atgcccagag atgcggactg cggggatccc 2340 aacttgtgaa atcagaattg gaagagaaaa agtctgagct tagacacaaa ttgaagtacg 2400 ttccacatga atatatcgaa cttatcgaga ttgctaggaa ctcaacacag gacagaattt 2460 tggagatgaa ggttatggag ttctttatga aagtgtacgg atatagggga aagcaccttg 2520 gtggttctag gaaacctgat ggtgcaatct acactgtggg atcacctatt gactatggtg 2580 ttatcgtgga tacaaaggca tactctggtg gatacaattt gccaatcgga caagctgacg 2640 aaatgcagag atatgttgaa gagaaccaaa ctagaaacaa acatattaat ccaaatgaat 2700 ggtggaaggt gtatccttca tctgttacag agttcaaatt cctttttgtg tctggacact 2760 ttaagggtaa ctacaaagca cagcttacta ggttgaacca tattacaaat tgcaatggtg 2820 ctgtgttgtc agttgaagag cttttgatcg gaggtgaaat gattaaggca ggaacactta 2880 ctttggagga agttagaaga aaattcaaca acggtgaaat caatttttga taactcgagc 2940 tcggtcacca gcataatttt tattaatgta ctaaattact gttttgttaa atgcaatttt 3000 gctttctcgg gattttaata tcaaaatcta tttagaaata cacaatattt tgttgcaggc 3060 ttgctggaga atcgatctgc tatcataaaa attacaaaaa aattttattt gcctcaatta 3120 ttttaggatt ggtattaagg acgcttaaat tatttgtcgg gtcactacgc atcattgtga 3180 ttgagaagat cagcgatacg aaatattcgt agtactatcg ataatttatt tgaaaattca 3240 taagaaaagc aaacgttaca tgaattgatg aaacaataca aagacagata aagccacgca 3300 catttaggat attggccgag attactgaat attgagtaag atcacggaat ttctgacagg 3360 agcatgtctt caattcagcc caaatggcag ttgaaatact caaaccgccc catatgcagg 3420 agcggatcat tcattgtttg tttggttgcc tttgccaaca tgggagtcca aggtt 3475 <210> 275 <211> 2019 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 275 gcccaaggaa cccttttctg ggccatcttc gtactcggcc acgactggta atttaatgga 60 tccaaccgac aaccactttg cggacttcct ttcaagagaa ttcaataagg ttaattccta 120 attgaaatcc gaagataaga ttcccacaca cttgtggctg atatcaaaag gctactgcct 180 atttaaacac atctctggag actgagaaaa tcagacctcc aagcatgaag aagcctgagc 240 ttactgctac ttctgttgag aagttcctca tcgagaagtt cgattctgtg tctgatctta 300 tgcagctctc tgagggtgag gaatcaagag ctttctcttt cgatgttggt ggaagaggat 360 acgttctcag agttaactct tgcgctgacg gattctacaa ggatagatac gtgtacagac 420 acttcgcttc agctgctctc cctatccctg aagttcttga tatcggagag ttctctgagt 480 ctcttaccta ctgtatctca agaagggctc agggtgttac tcttcaagat cttcctgaga 540 ctgagcttcc tgctgttctt caacctgttg ctgaggctat ggatgctatc gctgctgctg 600 atctttctca aacttctgga ttcggacctt tcggtcctca gggaatcgga cagtacacta 660 cttggagaga tttcatctgc gctatcgctg atcctcatgt ttaccattgg cagaccgtta 720 tggatgatac cgtttctgct tctgttgctc aagctcttga tgagcttatg ctttgggctg 780 aggattgtcc tgaggttaga catcttgttc acgctgattt cggatctaac aacgttctca 840 ccgataacgg aagaatcacc gctgttatcg attggtctga ggctatgttc ggagattctc 900 aatacgaggt ggccaacata ttcttttgga ggccttggct tgcttgtatg gaacaacaga 960 ctagatactt cgagagaagg catcctgagc ttgctggatc tcctagactt agagcttaca 1020 tgcttaggat cggacttgat cagctttacc agtctctcgt tgatggaaac ttcgatgatg 1080 ctgcttgggc tcagggaaga tgtgatgcta tcgttagatc tggtgctgga actgttggaa 1140 gaactcaaat cgctagaaga tctgctgctg tttggactga tggatgtgtt gaagttctcg 1200 ctgattctgg aaacagaagg ccttctacta gacctagagc caagaagtga agatcggcgg 1260 caatagcttc ttagcgccat cccgggttga tcctatctgt gttgaaatag ttgcggtggg 1320 caaggctctc tttcagaaag acaggcggcc aaaggaaccc aaggtgaggt gggctatggc 1380 tctcagttcc ttgtggaagc gcttggtcta aggtgcagag gtgttagcgg gatgaagcaa 1440 aagtgtccga ttgtaacaag atatgttgat cctacgtaag gatattaaag tatgtattca 1500 tcactaatat aatcagtgta ttccaatatg tactacgatt tccaatgtct ttattgtcgc 1560 cgtatgtaat cggcgtcaca aaataatccc cggtgacttt cttttaatcc aggatgaaat 1620 aatatgttat tataattttt gcgatttggt ccgttatagg aattgaagtg tgcttgcggt 1680 cgccaccact cccatttcat aattttacat gtatttgaaa aataaaaatt tatggtattc 1740 aatttaaaca cgtatacttg taaagaatga tatcttgaaa gaaatatagt ttaaatattt 1800 attgataaaa taacaagtca ggtattatag tccaagcaaa aacataaatt tattgatgca 1860 agtttaaatt cagaaatatt tcaataactg attatatcag ctggtacatt gccgtagatg 1920 aaagactgag tgcgatatta tggtgtaata catagcggcc gcgcccaagg aacccttttc 1980 tgggccatct tcgtactcgg ccacgactgg taatttaat 2019 <210> 276 <211> 2666 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 276 gcccaaggaa cccttttctg ggccatcttc gtactcggcc acgactggta atttaatgga 60 tccactagta acggccgcca gtgtgctgga attcgccctt cgtcgacctg caggtcaacg 120 gatcaggata ttcttgttta agatgttgaa ctctatggag gtttgtatga actgatgatc 180 taggaccgga taagttccct tcttcatagc gaacttattc aaagaatgtt ttgtgtatca 240 ttcttgttac attgttatta atgaaaaaat attattggtc attggactga acacgagtgt 300 taaatatgga ccaggcccca aataagatcc attgatatat gaattaaata acaagaataa 360 atcgagtcac caaaccactt gcctttttta acgagacttg ttcaccaact tgatacaaaa 420 gtcattatcc tatgcaaatc aataatcata caaaaatatc caataacact aaaaaattaa 480 aagaaatgga taatttcaca atatgttata cgataaagaa gttacttttc caagaaattc 540 actgatttta taagcccact tgcattagat aaatggcaaa aaaaaacaaa aaggaaaaga 600 aataaagcac gaagaattct agaaaatacg aaatacgctt caatgcagtg ggacccacgg 660 ttcaattatt gccaattttc agctccaccg tatatttaaa aaataaaacg ataatgctaa 720 aaaaatataa atcgtaacga tcgttaaatc tcaacggctg gatcttatga cgaccgttag 780 aaattgtggt tgtcgacgag tcagtaataa acggcgtcaa agtggttgca gccggcacac 840 acgagtcgtg tttatcaact caaagcacaa atacttttcc tcaacctaaa aataaggcaa 900 ttagccaaaa acaactttgc gtgtaaacaa cgctcaatac acgtgtcatt ttattattag 960 ctattgcttc accgccttag ctttctcgtg acctagtcgt cctcgtcttt tcttcttctt 1020 cttctataaa acaataccca aagagctctt cttcttcaca attcagattt caatttctca 1080 aaatcttaaa aactttctct caattctctc taccgtgatc aaggtaaatt tctgtgttcc 1140 ttattctctc aaaatcttcg attttgtttt cgttcgatcc caatttcgta tatgttcttt 1200 ggtttagatt ctgttaatct tagatcgaag acgattttct gggtttgatc gttagatatc 1260 atcttaattc tcgattaggg tttcatagat atcatccgat ttgttcaaat aatttgagtt 1320 ttgtcgaata attactcttc gatttgtgat ttctatctag atctggtgtt agtttctagt 1380 ttgtgcgatc gaatttgtcg attaatctga gtttttctga ttaacagatg agaggatctg 1440 gatctgagtc tgatgagtct ggacttcctg ctatggaaat cgagtgtaga atcactggaa 1500 cccttaacgg tgttgagttc gagcttgttg gaggtggtga gggaactcct gagcagggaa 1560 gaatgactaa caagatgaag tctaccaagg gtgctcttac cttctctcca taccttcttt 1620 ctcacgttat gggatacgga ttctaccact tcggaactta cccatctgga tacgagaacc 1680 ctttccttca tgctatcaac aacggtggat acaccaacac taggatcgag aagtacgagg 1740 atggtggtgt tcttcacgtt agcttctctt acagatacga ggctggaaga gtgatcggag 1800 atttcaaggt tatgggaact ggattccctg aggattctgt tatcttcacc gacaagatca 1860 tcaggtctaa cgctactgtt gagcatcttc atcctatggg agataacgat ctcgatggat 1920 ctttcaccag aaccttctca cttagagatg gtggttacta ctcttctgtg gtggattctc 1980 acatgcactt caagtctgct atccaccctt ctatccttca aaacggtgga cctatgttcg 2040 ctttcagaag agttgaggaa gatcactcta acaccgagct tggaatcgtt gagtaccaac 2100 atgctttcaa gacccctgat gctgatgctg gtgaggaatg ataatatcaa aatctattta 2160 gaaatacaca atattttgtt gcaggcttgc tggagaatcg atctgctatc ataaaaatta 2220 caaaaaaatt ttatttgcct caattatttt aggattggta ttaaggacgc ttaaattatt 2280 tgtcgggtca ctacgcatca ttgtgattga gaagatcagc gatacgaaat attcgtagta 2340 ctatcgataa tttatttgaa aattcataag aaaagcaaac gttacatgaa ttgatgaaac 2400 aatacaaaga cagataaagc cacgcacatt taggatattg gccgagatta ctgaatattg 2460 agtaagatca cggaatttct gacaggagca tgtcttcaat tcagcccaaa tggcagttga 2520 aatactcaaa ccgccccata tgcaggagcg gatcattcat tgtttgtttg gttgcctttg 2580 ccaacatggg agtccaaggt tgcggccgcg cccaaggaac ccttttctgg gccatcttcg 2640 tactcggcca cgactggtaa tttaat 2666 <210> 277 <211> 2020 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 277 gcccaaggaa cccttttctg ggccatcttc gtactcggcc acgactggta atttaatgga 60 tccaaccgac aaccactttg cggacttcct ttcaagagaa ttcaataagg ttaattccta 120 attgaaatcc gaagataaga ttcccacaca cttgtggctg atatcaaaag gctactgcct 180 atttaaacac atctctggag actgagaaaa tcagacctcc aagcatgaag aagcctgagc 240 ttactgctac ttctgttgag aagttcctca tcgagaagtt cgattctgtg tctgatctta 300 tgcagctctc tgagggtgag gaatcaagag ctttctcttt cgatgttggt ggaagaggat 360 acgttctcag agttaactct tgcgctgacg gattctacaa ggatagatac gtgtacagac 420 acttcgcttc agctgctctc cctatccctg aagttcttga tatcggagag ttctctgagt 480 ctcttaccta ctgtatctca agaagggctc agggtgttac tcttcaagat cttcctgaga 540 ctgagcttcc tgctgttctt caacctgttg ctgaggctat ggatgctatc gctgctgctg 600 atctttctca aacttctgga ttcggacctt tcggtcctca gggaatcgga cagtacacta 660 cttggagaga tttcatctgc gctatcgctg atcctcatgt ttaccattgg cagaccgtta 720 tggatgatac cgtttctgct tctgttgctc aagctcttga tgagcttatg ctttgggctg 780 aggattgtcc tgaggttaga catcttgttc acgctgattt cggatctaac aacgttctca 840 ccgataacgg aagaatcacc gctgttatcg attggtctga ggctatgttc ggagattctc 900 aatacgaggt ggccaacata ttcttttgga ggccttggct tgcttgtatg gaacaacaga 960 ctagatactt cgagagaagg catcctgagc ttgctggatc tcctagactt agagcttaca 1020 tgcttaggat cggacttgat cagctttacc agtctctcgt tgatggaaac ttcgatgatg 1080 ctgcttgggc tcagggaaga tgtgatgcta tcgttagatc tggtgctgga actgttggaa 1140 gaactcaaat cgctagaaga tctgctgctg tttggactga tggatgtgtt gaagttctcg 1200 ctgattctgg aaacagaagg ccttctacta gacctagagc caagaagtga agatcggcgg 1260 caatagcttc ttagcgccat cccgggttga tcctatctgt gttgaaatag ttgcggtggg 1320 caaggctctc tttcagaaag acaggcggcc aaaggaaccc aaggtgaggt gggctatggc 1380 tctcagttcc ttgtggaagc gcttggtcta aggtgcagag gtgttagcgg gatgaagcaa 1440 aagtgtccga ttgtaacaag atatgttgat cctacgtaag gatattaaag tatgtattca 1500 tcactaatat aatcagtgta ttccaatatg tactacgatt tccaatgtct ttattgtcgc 1560 cgtatgtaat cggcgtcaca aaataatccc cggtgacttt cttttaatcc aggatgaaat 1620 aatatgttat tataattttt gcgatttggt ccgttatagg aattgaagtg tgcttgcggt 1680 cgccaccact cccatttcat aattttacat gtatttgaaa aataaaaatt tatggtattc 1740 aatttaaaca cgtatacttg taaagaatga tatcttgaaa gaaatatagt ttaaatattt 1800 attgataaaa taacaagtca ggtattatag tccaagcaaa aacataaatt tattgatgca 1860 agtttaaatt cagaaatatt tcaataactg attatatcag ctggtacatt gccgtagatg 1920 aaagactgag tgcgatatta tggtgtaata catagcggcc gcagcgagag aaagcttatt 1980 gcaacttcaa ctacttgctg gtcgatcgtg ttggccactc 2020 <210> 278 <211> 2667 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 278 gcccaaggaa cccttttctg ggccatcttc gtactcggcc acgactggta atttaatgga 60 tccactagta acggccgcca gtgtgctgga attcgccctt cgtcgacctg caggtcaacg 120 gatcaggata ttcttgttta agatgttgaa ctctatggag gtttgtatga actgatgatc 180 taggaccgga taagttccct tcttcatagc gaacttattc aaagaatgtt ttgtgtatca 240 ttcttgttac attgttatta atgaaaaaat attattggtc attggactga acacgagtgt 300 taaatatgga ccaggcccca aataagatcc attgatatat gaattaaata acaagaataa 360 atcgagtcac caaaccactt gcctttttta acgagacttg ttcaccaact tgatacaaaa 420 gtcattatcc tatgcaaatc aataatcata caaaaatatc caataacact aaaaaattaa 480 aagaaatgga taatttcaca atatgttata cgataaagaa gttacttttc caagaaattc 540 actgatttta taagcccact tgcattagat aaatggcaaa aaaaaacaaa aaggaaaaga 600 aataaagcac gaagaattct agaaaatacg aaatacgctt caatgcagtg ggacccacgg 660 ttcaattatt gccaattttc agctccaccg tatatttaaa aaataaaacg ataatgctaa 720 aaaaatataa atcgtaacga tcgttaaatc tcaacggctg gatcttatga cgaccgttag 780 aaattgtggt tgtcgacgag tcagtaataa acggcgtcaa agtggttgca gccggcacac 840 acgagtcgtg tttatcaact caaagcacaa atacttttcc tcaacctaaa aataaggcaa 900 ttagccaaaa acaactttgc gtgtaaacaa cgctcaatac acgtgtcatt ttattattag 960 ctattgcttc accgccttag ctttctcgtg acctagtcgt cctcgtcttt tcttcttctt 1020 cttctataaa acaataccca aagagctctt cttcttcaca attcagattt caatttctca 1080 aaatcttaaa aactttctct caattctctc taccgtgatc aaggtaaatt tctgtgttcc 1140 ttattctctc aaaatcttcg attttgtttt cgttcgatcc caatttcgta tatgttcttt 1200 ggtttagatt ctgttaatct tagatcgaag acgattttct gggtttgatc gttagatatc 1260 atcttaattc tcgattaggg tttcatagat atcatccgat ttgttcaaat aatttgagtt 1320 ttgtcgaata attactcttc gatttgtgat ttctatctag atctggtgtt agtttctagt 1380 ttgtgcgatc gaatttgtcg attaatctga gtttttctga ttaacagatg agaggatctg 1440 gatctgagtc tgatgagtct ggacttcctg ctatggaaat cgagtgtaga atcactggaa 1500 cccttaacgg tgttgagttc gagcttgttg gaggtggtga gggaactcct gagcagggaa 1560 gaatgactaa caagatgaag tctaccaagg gtgctcttac cttctctcca taccttcttt 1620 ctcacgttat gggatacgga ttctaccact tcggaactta cccatctgga tacgagaacc 1680 ctttccttca tgctatcaac aacggtggat acaccaacac taggatcgag aagtacgagg 1740 atggtggtgt tcttcacgtt agcttctctt acagatacga ggctggaaga gtgatcggag 1800 atttcaaggt tatgggaact ggattccctg aggattctgt tatcttcacc gacaagatca 1860 tcaggtctaa cgctactgtt gagcatcttc atcctatggg agataacgat ctcgatggat 1920 ctttcaccag aaccttctca cttagagatg gtggttacta ctcttctgtg gtggattctc 1980 acatgcactt caagtctgct atccaccctt ctatccttca aaacggtgga cctatgttcg 2040 ctttcagaag agttgaggaa gatcactcta acaccgagct tggaatcgtt gagtaccaac 2100 atgctttcaa gacccctgat gctgatgctg gtgaggaatg ataatatcaa aatctattta 2160 gaaatacaca atattttgtt gcaggcttgc tggagaatcg atctgctatc ataaaaatta 2220 caaaaaaatt ttatttgcct caattatttt aggattggta ttaaggacgc ttaaattatt 2280 tgtcgggtca ctacgcatca ttgtgattga gaagatcagc gatacgaaat attcgtagta 2340 ctatcgataa tttatttgaa aattcataag aaaagcaaac gttacatgaa ttgatgaaac 2400 aatacaaaga cagataaagc cacgcacatt taggatattg gccgagatta ctgaatattg 2460 agtaagatca cggaatttct gacaggagca tgtcttcaat tcagcccaaa tggcagttga 2520 aatactcaaa ccgccccata tgcaggagcg gatcattcat tgtttgtttg gttgcctttg 2580 ccaacatggg agtccaaggt tgcggccgca gcgagagaaa gcttattgca acttcaacta 2640 cttgctggtc gatcgtgttg gccactc 2667 <210> 279 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 279 gattcctaag cattgttggg tc 22 <210> 280 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 280 gaaaatctca tatcgaacgt gcgt 24 <210> 281 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 281 cgcttaccct ctctatctgg taa 23 <210> 282 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 282 ccttgcctct gtaccaaggc ag 22 <210> 283 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 283 gtgtgtggga atcttatctt cgg 23 <210> 284 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 284 caagtcaggt attatagtcc aagca 25 <210> 285 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 285 caagaatatc ctgatccgtt gac 23 <210> 286 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 286 tggcagttga aatactcaaa cc 22 <210> 287 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 287 gtcctttgag atccatgagc tat 23 <210> 288 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 288 gattcctaag cattgttggg ta 22 <210> 289 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 289 tgcgttcaag aaatcaaaga ca 22 <210> 290 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 290 gaaaatctca tatcgaacgt gcgg 24 <210> 291 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 291 tctggtaaat cctaattcct c 21 <210> 292 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 292 ccttgcctct gtaccaaggc aa 22 <210> 293 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 293 cttgcctctg taccaaggca acttc 25 <210> 294 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 294 cttacatgct taggatcgga cttg 24 <210> 295 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 295 agttccagca ccagatctaa cg 22 <210> 296 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic probe <400> 296 ccctgagccc aagcagcatc atcg 24 <210> 297 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 297 cggagagggc gtggaagg 18 <210> 298 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 298 ttcgatttgc tacagcgtca ac 22 <210> 299 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic probe <400> 299 aggcaccatc gcaggcttcg ct 22 <210> 300 <211> 92 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 300 ttctggcctc tttattgggc cgcccaagga acccttttct gggccatctt cgtactcggc 60 cacgactggt aatttaatgg atccactagt aa 92 <210> 301 <211> 92 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 301 ttctggcctc tttattgggc cgcccaagga acccttttct gggccatctt cgtactcggc 60 cacgactggt aatttaatgg atccactagt aa 92 <210> 302 <211> 119 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 302 ttctggcctc tttattgggc cgcccaagga acccttttct gggccatcca gtcgtggccg 60 agtacgaaga tggcccagat actcggccac gactggtaat ttaatggatc cactagtaa 119 <210> 303 <211> 89 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 303 ttctggcctc tttattgggc cgcccaagga acccttttct gggccatcgt actcggccac 60 gactggtaat ttaatggatc cactagtaa 89 <210> 304 <211> 137 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 304 ttctggcctc tttattgggc cgcccaagga acccttttct aggtatctca gttcggtgta 60 ggtcgttcgc tccaagctgg gctgcgtgca cgaaccgtac tcggccacga ctggtaattt 120 aatggatcca ctagtaa 137 <210> 305 <211> 75 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 305 ttctggcctc tttattgggc cgcccaagga acccttttct gggccagact ggtaatttaa 60 tggatccact agtaa 75 <210> 306 <211> 87 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 306 tccaaggttg cggccgcgcc caaggaaccc ttttctgggc catcttcgta ctcggccacg 60 actggtaatt taattttcaa tttattt 87 <210> 307 <211> 82 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 307 tccaaggttg cggccgcgcc caaggaaccc ttttctgggc cattactcgg ccacgactgg 60 taatttaatt ttcaatttat tt 82 <210> 308 <211> 83 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 308 tccaaggttg cggccgcgcc caaggaaccc ttttctgggc catttactcg gccacgactg 60 gtaatttaat tttcaattta ttt 83 <210> 309 <211> 41 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 309 cgtactcggc cacgactggt aatttaattt tcaatttatt t 41 <210> 310 <211> 87 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 310 tccaaggttg cggccgcgcc caaggaaccc ttttctgggc catcttcgta ctcggccacg 60 actggtaatt taattttcaa tttattt 87 <210> 311 <211> 74 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 311 tccaaggttg cggccgcgcc caaggaaccc ttttctgggc catcttctgg taatttaatt 60 ttcaatttat tttt 74 <210> 312 <211> 132 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 312 tccaaggttg cggccgcgcc caaggaaccc ttttctggta gcggtggttt ttttgtttgc 60 aagcagcaga ttacgcgcag aaaaaaagga tcgtactcgg ccacgactgg taatttaatt 120 ttcaatttat tt 132 <210> 313 <211> 138 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 313 tccaaggttg cggccgcgcc caaggaaccc ttttctgggc catcttacga gcgtaatggc 60 tggcctgttg aacaagtctg gaaagaaatg cataaacata tcccagccac gactggtaat 120 ttaattttca atttattt 138 <210> 314 <211> 88 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 314 tagtttattt gccccaagcg agagaaagct tattgcaact tcaactcgta ctcggccacg 60 actggtaatt taatggatcc actagtaa 88 <210> 315 <211> 46 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 315 tagtttattt gccccaagcg agagaaagct tattgcaact tcaact 46 <210> 316 <211> 46 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 316 tagtttattt gccccaagcg agagaaagct tattgcaact tcaacg 46 <210> 317 <211> 89 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 317 tagtttattt gccccaagcg agagaaagct tattgcaact tcaacttcgt actcggccac 60 gactggtaat ttaatggatc cactagtaa 89 <210> 318 <211> 89 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 318 tagtttattt gccccaagcg agagaaagct tattgcaact tcaactatgt actcggccac 60 gactggtaat ttaatggatc cactagtaa 89 <210> 319 <211> 83 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 319 tagtttattt gccccaagcg agagaaagct tattgcaact tcatactcgg ccacgactgg 60 taatttaatg gatccactag taa 83 <210> 320 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 320 aggtaattta atggatccac tagtaa 26 <210> 321 <211> 89 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 321 tccaaggttg cggccgcagc gagagaaagc ttattgcaac ttcaactact tgctggtcga 60 tcgtgttggc cactcttgtt tatctatca 89 <210> 322 <211> 86 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 322 tccaaggttg cggccgcagc gagagaaagc ttattgcaac ttcaacttgc tggtcgatcg 60 tgttggccac tcttgtttat ctatca 86 <210> 323 <211> 149 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 323 tccaaggttg cggccgcgcg ccgacccagc tttcttgtac aaagttggca ttataagaaa 60 gcattgctta tcaatttgtt gcaacgaaca ggtcactatc agtcaaaact tgctggtcga 120 tcgtgttggc cactcttgtt tatctatca 149 <210> 324 <211> 86 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 324 tccaaggttt gcggccgcag cgagagaaag cttattgcaa cttcacttgc tggtcgatcg 60 tgttggccac tcttgtttat ctatca 86 <210> 325 <211> 121 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 325 tccaaggttg cggccgcagc gagagaaagc ttattgcaac ttcagataaa agttgctcgc 60 ctgtgtgggt gtggatgcta cttgctggtc gatcgtgttg gccactcttg tttatctatc 120 a 121 <210> 326 <211> 94 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 326 tccaaggttg cggccgcagc gagagaaagc ttattgcaac ttcaactaca ctacttgctg 60 gtcgatcgtg ttggccactc ttgtttatct atca 94 <210> 327 <211> 89 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 327 tccaaggttg cggccgcagc gagagaaagc ttattgcaac ttcaactact tgctggtcga 60 tcgtgttggc cactcttgtt tatctatca 89 <210> 328 <211> 99 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 328 ttctggcctc tttattgggc cgcccaagga acccttttct gggccatctt cgtactcggc 60 cacgactggt aatttaatgg atccaaccga caaccactt 99 <210> 329 <211> 87 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <221> modified_base <222> (38)..(40) <223> a, c, t, g, unknown or other <400> 329 ttctggcctc tttattgggc cgcccaagga accctttnnn tactcggcca cgactggtaa 60 tttaatggat ccaaccgaca accactt 87 <210> 330 <211> 245 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <220> <221> modified_base <222> (43)..(195) <223> a, c, t, g, unknown or other <400> 330 ttctggcctc tttattgggc cgcccaagga acccttttct ggnnnnnnnn nnnnnnnnnn 60 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 120 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 180 nnnnnnnnnn nnnnntcgta ctcggccacg actggtaatt taatggatcc aaccgacaac 240 cactt 245 <210> 331 <211> 42 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 331 ttctggcctc tttattgggc cgcccaagga acccttttct gg 42 <210> 332 <211> 462 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <220> <221> modified_base <222> (50)..(419) <223> a, c, t, g, unknown or other <400> 332 ttctggcctc tttattgggc cgcccaagga acccttttct gggccatctn nnnnnnnnnn 60 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 120 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 180 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 240 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 300 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 360 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnc 420 ggccacgact ggtaatttaa tggatccaac cgacaaccac tt 462 <210> 333 <211> 133 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <220> <221> modified_base <222> (48)..(83) <223> a, c, t, g, unknown or other <400> 333 ttctggcctc tttattgggc cgcccaagga acccttttct gggccatnnn nnnnnnnnnn 60 nnnnnnnnnn nnnnnnnnnn nnntcgtact cggccacgac tggtaattta atggatccaa 120 ccgacaacca ctt 133 <210> 334 <211> 127 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <220> <221> modified_base <222> (50)..(127) <223> a, c, t, g, unknown or other <400> 334 ttctggcctc tttattgggc cgcccaagga acccttttct gggccatctn nnnnnnnnnn 60 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 120 nnnnnnn 127 <210> 335 <211> 104 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 335 gtaatacata gcggccgcgc ccaaggaacc cttttctggg ccatcttcgt actcggccac 60 gactggtaat ttaattttca atttattttt tcttcaactt ctta 104 <210> 336 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <221> modified_base <222> (45)..(48) <223> a, c, t, g, unknown or other <400> 336 gtaatacata gcggccgcgc ccaaggaacc cttttctggg ccatnnnngc cacgactggt 60 aatttaattt tcaatttatt ttttcttcaa cttctta 97 <210> 337 <211> 202 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <220> <221> modified_base <222> (47)..(158) <223> a, c, t, g, unknown or other <400> 337 gtaatacata gcggccgcgc ccaaggaacc cttttctggg ccatctnnnn nnnnnnnnnn 60 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 120 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnga ctggtaattt aattttcaat 180 ttattttttc ttcaacttct ta 202 <210> 338 <211> 202 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <220> <221> modified_base <222> (47)..(158) <223> a, c, t, g, unknown or other <400> 338 gtaatacata gcggccgcgc ccaaggaacc cttttctggg ccatctnnnn nnnnnnnnnn 60 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 120 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnga ctggtaattt aattttcaat 180 ttattttttc ttcaacttct ta 202 <210> 339 <211> 334 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <220> <221> modified_base <222> (45)..(278) <223> a, c, t, g, unknown or other <400> 339 gtaatacata gcggccgcgc ccaaggaacc cttttctggg ccatnnnnnn nnnnnnnnnn 60 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 120 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 180 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 240 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnngt actcggccac gactggtaat 300 ttaattttca atttattttt tcttcaactt ctta 334 <210> 340 <211> 45 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 340 gtactcggcc acgactggta atttaatttt tctttcaact tctta 45 <210> 341 <211> 88 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <221> modified_base <222> (25)..(33) <223> a, c, t, g, unknown or other <400> 341 gtaatacata gcggccgcgc ccaannnnnn nnntactcgg ccacgactgg taatttaatt 60 ttcaatttat tttttcttca acttctta 88 <210> 342 <211> 89 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <221> modified_base <222> (45)..(51) <223> a, c, t, g, unknown or other <400> 342 tgtaatacat agcggccgcg cccaaggaac cctttactcg gccannnnnn ntaatttaat 60 tttcaattta ttttttcttc aacttctta 89 <210> 343 <211> 99 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 343 ttctggcctc tttattgggc cgcccaagga acccttttct gggccatctt cgtactcggc 60 cacgactggt aatttaatgg atccaaccga caaccactt 99 <210> 344 <211> 305 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <220> <221> modified_base <222> (50)..(255) <223> a, c, t, g, unknown or other <400> 344 ttctggcctc tttattgggc cgcccaagga acccttttct gggccatctn nnnnnnnnnn 60 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 120 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 180 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 240 nnnnnnnnnn nnnnntcgta ctcggccacg actggtaatt taatggatcc aaccgacaac 300 cactt 305 <210> 345 <211> 465 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <220> <221> modified_base <222> (50)..(422) <223> a, c, t, g, unknown or other <400> 345 ttctggcctc tttattgggc cgcccaagga acccttttct gggccatctn nnnnnnnnnn 60 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 120 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 180 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 240 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 300 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 360 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 420 nncggccacg actggtaatt taatggatcc aaccgacaac cactt 465 <210> 346 <211> 93 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <221> modified_base <222> (45)..(49) <223> a, c, t, g, unknown or other <400> 346 ttctggcctc tttattgggc cgcccaagga acccttttct gggcnnnnnt cggccacgac 60 tggtaattta atggatccaa ccgacaacca ctt 93 <210> 347 <211> 103 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 347 gtaatacata gcggccgcag cgagagaaag cttattgcaa cttcaactac ttgctggtcg 60 atcgtgttgg ccactcttgt ttatctatca ttcctcgttg gtc 103 <210> 348 <211> 330 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <220> <221> modified_base <222> (48)..(276) <223> a, c, t, g, unknown or other <400> 348 gtaatacata gcggccgcag cgagagaaag cttattgcaa cttcaacnnn nnnnnnnnnn 60 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 120 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 180 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 240 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnncttg ctggtcgatc gtgttggcca 300 ctcttgttta tctatcattc ctcgttggtc 330 <210> 349 <211> 129 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <220> <221> modified_base <222> (48)..(73) <223> a, c, t, g, unknown or other <400> 349 gtaatacata gcggccgcag cgagagaaag cttattgcaa cttcaacnnn nnnnnnnnnn 60 nnnnnnnnnn nnntacttgc tggtcgatcg tgttggccac tcttgtttat ctatcattcc 120 tcgttggtc 129 <210> 350 <211> 135 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <220> <221> modified_base <222> (48)..(80) <223> a, c, t, g, unknown or other <400> 350 gtaatacata gcggccgcag cgagagaaag cttattgcaa cttcaacnnn nnnnnnnnnn 60 nnnnnnnnnn nnnnnnnnnn acttgctggt cgatcgtgtt ggccactctt gtttatctat 120 cattcctcgt tggtc 135 <210> 351 <211> 118 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <220> <221> modified_base <222> (48)..(64) <223> a, c, t, g, unknown or other <400> 351 gtaatacata gcggccgcag cgagagaaag cttattgcaa cttcaacnnn nnnnnnnnnn 60 nnnncttgct ggtcgatcgt gttggccact cttgtttatc tatcattcct cgttggtc 118 <210> 352 <211> 592 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 352 cgcccaagga acccttttct gggccatggg tttcgccacc tctgacttga gcgtcgattt 60 ttaaccaata ggccgaaatc ggcaaaatcc cttataaatc aaaagaatag accgagatag 120 ggttgagtgg ccgctacagg gcgctcccat tcgccattca ggctgcgcaa ctgttgggaa 180 gggcgtttcg gtgcgggcct cttcgctatt acgccagctg gcgaaagggg gatgtgctgc 240 aaggcgatta agttgggtaa cgccagggtt ttcccagtca cgacgttgta aaacgacggc 300 cagtgagcgc gacgtaatac gactcactat agggcgaatt ggcggaaggc cgtcaaggcc 360 gcatcaacga gctcgtgcac gcccaaggaa cccttttctg ggccatcccg cgcaattggc 420 gagtttggcg cggtgtcggt ggtttccggc tcgattcgcg gcgaaaccat actcggccac 480 gactggtaat ttaatggatc caaccgacaa ccactttgcg gacttccttt caagagaatt 540 caataaggtt aattcctaat tgaaatccga agataagatt cccacacact tg 592 <210> 353 <211> 307 <212> DNA <213> Brassica napus <400> 353 tccatgagct acgtcgcgag agacattttc tccgtcgtgg ctctggccgt cgccgccgtg 60 tattttgata gctggttctt ctggcctctt tattgggccg cccaaggaac ccttttctgg 120 gccattactc ggccacgact ggtaatttaa tggatccaac cgacaaccac tttgcggact 180 tcctttcaag agaattcaat aaggttaatt cctaattgaa atccgaagat aagattccca 240 cacacttgtg gctgatatca aaaggctact gcctatttaa acacatctct ggagaatgag 300 aaaatca 307 <210> 354 <211> 687 <212> DNA <213> Brassica napus <400> 354 ccatgagcta cgtcgcgaga gacattttct ccgtcgtggc tctggccgtc gccgccgtgt 60 attttgatag ctggttcttc tggcctcttt attgggccgc ccaaggaacc cttttctggg 120 ccatgggttt cgccacctct gacttgagcg tcgattttta accaataggc cgaaatcggc 180 aaaatccctt ataaatcaaa agaatagacc gagatagggt tgagtggccg ctacagggcg 240 ctcccattcg ccattcaggc tgcgcaactg ttgggaaggg cgtttcggtg cgggcctctt 300 cgctattacg ccagctggcg aaagggggat gtgctgcaag gcgattaagt tgggtaacgc 360 cagggttttc ccagtcacga cgttgtaaaa cgacggccag tgagcgcgac gtaatacgac 420 tcactatagg gcgaattggc ggaaggccgt caaggccgca tcaacgagct cgtgcacgcc 480 caaggaaccc ttttctgggc catcccgcgc aattggcgag tttggcgcgg tgtcggtggt 540 ttccggctcg attcgcggcg aaaccatact cggccacgac tggtaattta atggatccaa 600 ccgacaacca ctttgcggac ttcctttcaa gagaattcaa taaggttaat tcctaattga 660 aatccgaaga taagattccc acacact 687 <210> 355 <211> 618 <212> DNA <213> Brassica napus <400> 355 tgtcgcgaga gacattttct ccgtcgtggc tctggccgtc gccgccgtgt attttgatag 60 ctggttcttc tggcctcttt attgggccgc ccaaggaacc cttttctggg ccaaaaggcc 120 gcgttgctgg cgtttttcca taggctccgc ccccctgacg agcatcacaa aaatcgacgc 180 tcaagtcaga ggtggcgaaa cccgacagga ctataaagat accaggcgtt tccccctgga 240 agctccctcg tgcgctctcc tgttccgacc ctgccgctta ccggatacct gtccgccttt 300 ctcccttcgg gaagcgtggc gctttctcat agctcacgct gtaggtatct cagttcggtg 360 taggtcgttc gctccaagct gggctgtgtg cacgaacccc ccgttcagcc cgaccgctgc 420 gccttatccg gtaactatcg tcttgagtcc aacccggtaa gacacgactt atcgccactg 480 gcagcagcca ctggtagtac tcggccacga ctggtaattt aatggatcca accgacaacc 540 actttgcgga cttcctttca agagaattca ataaggttaa ttcctaattg aaatccgaag 600 ataagattcc cacacact 618 <210> 356 <211> 332 <212> DNA <213> Brassica napus <400> 356 tttgtccttt gagatccatg agctacgtcg cgagagacat tttctccgtc gtggctctgg 60 ccgtcgccgc cgtgtatttt gatagctggt tcttctggcc tctttattgg gccgcccaag 120 gaaccctttt ctgggccatc ttactcggcc acgactggta atttaatgga tccaaccgac 180 aaccactttg cggacttcct ttcaagagaa ttcaataagg ttaattccta attgaaatcc 240 gaagataaga ttcccacaca cttgtggctg atatcaaaag gctactgcct atttaaacac 300 atctctggag actgagaaaa tcagacctcc aa 332 <210> 357 <211> 370 <212> DNA <213> Brassica napus <400> 357 catgagctac gtcgcgagag acattttctc cgtcgtggct ctggccgtcg ccgccgtgta 60 ttttgatagc tggttcttct ggcctcttta ttgggccgcc caaggaaccc ttttctgggc 120 tacttacgcc agagaaataa ctggctggct gctacaccat gttgccgggc aacgagggag 180 accgtcagta ctcggccacg actggtaatt taatggatcc aaccgacaac cactttgcgg 240 acttcctttc aagagaattc aataaggtta attcctaatt gaaatccgaa gataagattc 300 ccacacactt gtggctgata tcaaaaggct actgcctatt taaacacatc tctggagact 360 gagaaaatca 370 <210> 358 <211> 625 <212> DNA <213> Brassica napus <400> 358 tgagctacgt cgcgagagac attttctccg tcgtggctct ggccgtcgcc gccgtgtatt 60 ttgatagctg gttcttctgg cctctttatt gggccgccca aggaaccctt ttctgggcca 120 aaaggccgcg ttgctggcgt ttttccatag gctccgcccc cctgacgagc atcacaaaaa 180 tcgacgctca agtcagaggt ggcgaaaccc gacaggacta taaagatacc aggcgtttcc 240 ccctggaagc tccctcgtgc gctctcctgt tccgaccctg ccgcttaccg gatacctgtc 300 cgcctttctc ccttcgggaa gcgtggcgct ttctcatagc tcacgctgta ggtatctcag 360 ttcggtgtag gtcgttcgct ccaagctggg ctgtgtgcac gaaccccccg ttcagcccga 420 ccgctgcgcc ttatccggta actatcgtct tgagtccaac ccggtaagac acgacttatc 480 gccactggca gcagccactg gtagtactcg gccacgactg gtaatttaat ggatccaacc 540 gacaaccact ttgcggactt cctttcaaga gaattcaata aggttaattc ctaattgaaa 600 tccgaagata agattcccac acact 625 <210> 359 <211> 597 <212> DNA <213> Brassica napus <400> 359 cgtcgccgcc gtgtattttg atagctggtt cttctggcct ctttattggg ccgcccaagg 60 aacccttttc tgggccatcg cgttaatatt ttgttaaaat tcgcgttaaa tttttgttaa 120 atcagctcat tttttaacca ataggccgaa atcggcaaaa tcccttataa atcaaaagaa 180 tagaccgaga tagggttgag tggccgctac agggcgctcc cattcgccat tcaggctgcg 240 caactgttgg gaagggcgtt tcggtgcggg cctcttcgct attacgccag ctggcgaaag 300 ggggatgtgc tgcaaggcga ttaagttggg taacgccagg gttttcccag tcacgacgtt 360 gtaaaacgac ggccagtgag cgcgacgtaa tacgactcac tatagggcga attggcggaa 420 ggccgtcaag gccacgtgtc ttgtccagag ctcgtgcacg cccaaggaac ccttttctgg 480 gccatcttcg tactcggcca cgactggtaa tttaatggat ccaaccgaca accactttgc 540 ggacttcctt tcaagagaat tcaataaggt taattcctaa ttgaaatccg aagataa 597 <210> 360 <211> 590 <212> DNA <213> Brassica napus <400> 360 ccgtcgccgc cgtgtatttt gatagctggt tcttctggcc tctttattgg gccgcccaag 60 gaaccctttt ctgggccatc gcgttaatat tttgttaaaa ttcgcgttaa atttttgtta 120 aatcagctca ttttttaacc aataggccga aatcggcaaa atcccttata aatcaaaaga 180 atagaccgag atagggttga gtggccgcta cagggcgctc ccattcgcca ttcaggctgc 240 gcaactgttg ggaagggcgt ttcggtgcgg gcctcttcgc tattacgcca gctggcgaaa 300 gggggatgtg ctgcaaggcg attaagttgg gtaacgccag ggttttccca gtcacgacgt 360 tgtaaaacga cggccagtga gcgcgacgta atacgactca ctatagggcg aattggcgga 420 aggccgtcaa ggccacgtgt cttgtccaga gctcgtgcac gcccaaggaa cccttttctg 480 ggccatcttc gtactcggcc acgactggta atttaatgga tccaaccgac aaccactttg 540 cggacttcct ttcaagagaa ttcaataagg ttaattccta attgaaatcc 590 <210> 361 <211> 726 <212> DNA <213> Brassica napus <400> 361 gtgcacccaa ctgatcttca gcatcttttt actttcacca gcgtttctgg gtgagcaaaa 60 acaggaaggc aaaatgccgc aaaaaaggga ataagggcga cacggaaatg ttgaatactc 120 atactcttcc tttttcaata ttattgaagc atttatcagg gttattgtct catgagcgga 180 tacatatttg aatgtattta gaaaaataaa caaatagggg ttccgcgcac atttccccga 240 aaagtgccac ctaaattgta agcgttaata ttttgttaaa attcgcgtta aatttttgtt 300 aaatcagctc attttttaac caataggccg aaatcggcaa aatcccttat aaatcaaaag 360 aatagaccca gatagggttg agtggccgct acagggcgct cccattcgcc attcaggctg 420 cgcaactgtt gggaagggcg tttcggtgcg ggcctcttcg ctattacgcc agctggcgaa 480 atgggtcaag tcaggtatta tagtccaagc aaaaacataa atttattgat gcaagtttaa 540 attcagaaat atttcaataa ctgattatat cagctggtac attgccgtag atgaaagact 600 gagtgcgata ttatggtgta atacatagcg gccgcgccca aggaaccctt ttctgggcca 660 tcttcgtact cggccacgac tggtaattta attttcaatt tattttttct tcaacttctt 720 aatttt 726 <210> 362 <211> 296 <212> DNA <213> Brassica napus <400> 362 tctcaagtca ggtattatag tccaagcaaa aacataaatt tattgatgca agtttaaatt 60 cagaaatatt tcaataactg attatatcag ctggtacatt gccgtagatg aaagactgag 120 tgcgatatta tggtgtaata catagcggcc gcgcccaagg aacccttttc tgggccatct 180 gccacgactg gtaatttaat tttcaattta ttttttcttc aacttcttaa ttttgatatg 240 tttatatgtt tttttcgttt tttgcatcgt ctttgatttc ttgaacgcac gttcga 296 <210> 363 <211> 558 <212> DNA <213> Brassica napus <400> 363 ctctccaagt caggattata gtccaagcaa aaacataaat ttattgatgc aagtttaaat 60 tcagaaatat ttcaataact gattatatca gctggtacat tgccgtagat gaaagactga 120 gtgcgatatt atggtgtaat acatagcggc cgcagcgaga gaaagcttat tgcaacttca 180 attgaagtgt gcttgcggtc gccaccactc ccatttcata attttacatg tatttgaaaa 240 ataaaaattt atggtattca atttaaacac gtatacttgt aaagaatgat atcttgaaag 300 aaatatagtt taaatattct tgctggtcga tcatgttggc cactattgtt tatctatcaa 360 tcctcgttgg tccagtcaca gttacacaag tctatggtgt tccttacctt gcacgcgcca 420 catatttcat tattatatca ttgctaatat aactcgttct tgacataacg ttttggaaaa 480 ctttcagatc tttgtaatgt ggttggacgc tgtcacgtac ttgcatcatc atggtcacga 540 tgataagttg ccttggta 558 <210> 364 <211> 615 <212> DNA <213> Brassica napus <400> 364 ggtattatag tccaagcaaa aacataaatt tattgatgca agtttaaatt cagaaatatt 60 tcaataactg attatatcag ctggtacatt gccgtagatg aaagactgag tgcgatatta 120 tggtgtaata catagcggcc gcagcgagag aaagcttatt gcaacttcaa ctacttgctg 180 gtcgatcgtg ttggccactc ggtacctgga gcacaagact ggcctcatgg gccttccgct 240 cactgcccgc tttccagtcg ggaaacctgt cgtgccagct gcattaacgc tcaccggctc 300 cagatttatc agcaataaac cagccagccg gaagggccga gcgcagaagt ggtcctgcaa 360 ctttatccgc ctccatccag tctatcatgt tggccactct tgtttatcta tcattcctcg 420 ttggtccagt cacagttcta aaagtctatg gtgttcctta cattgtaagt ttcatatatt 480 tcattattat atcattgcta atataatttg tttttgacat aaagttttgg aaaaatttca 540 gatctttgta atgtggttgg acgctgtcac gtacttgcat catcatggtc acgatgataa 600 gttgccttgg tacag 615 <210> 365 <211> 364 <212> DNA <213> Brassica napus <400> 365 tggcttggag gtctgatttt ctcagtctcc agagatgtgt ttaaataggc agtagccttt 60 tgatatcagc cacaagtgtg tgggaatctt atcttcggat ttcaattagg aattaacctt 120 attgaattct cttgaaagga agtccgcaaa gtggttgtcg gttggatcca ttaaattacc 180 agtcgtggcc gagtagtctg ttgttccata caagcaagcc aaggccgtac tcggccacga 240 ctggtaattt aattttcaat ttattttttc ttcaacttct taattttgat acgtttatat 300 gtttttttcg ttttttgcat cgtctttgat ttcttgaacg cacgttcgat tgtagatttt 360 cgca 364 <210> 366 <211> 500 <212> DNA <213> Brassica napus <400> 366 tatctggtaa atcctaattc ctcatttttc ttcctgatta taattacaat tttgaatttt 60 tagattttga gtattaacta aatataaatt aaatttgttt ggggatgact acagtggtac 120 agaagtcctg gtaaagaagg gtcacattat aacccataca gtagtttatt tgccccaagc 180 gagagaaagc ttattgcaac tgaccatgtt aatgcagctg gcacgacagg tttcccgact 240 ggaaagcggg cagtgagcgg aaggcccatg aggccagtct tgtgctccag gtaccgagtg 300 gccaacacga tcgaccagca agtagttgaa gttgcaataa gctttctctc gctgcggccg 360 ctatgtatta caccataata tcgcactcag tctttcatct acggcaatgt accagctgat 420 ataatcagtt attgaaatat ttctgaatta aacttgcatc aataaattta tgtttttgct 480 tggactataa tccctgactt 500 <210> 367 <211> 375 <212> DNA <213> Brassica napus <400> 367 gcagtagcct tttgatatca gccacaagtg tgtgggaatc ttatcttcgg atttcaatta 60 ggaattaacc ttattgaatt ctcttgaaag gaagtccgca aagtggttgt cggttggatc 120 cattaaatta ccactacttg ctggtcgatc atgttggcca ctcttgttta tctatcattc 180 ctcgttggtc cagtcacagt tctaaaagtc tatggtgttc cttacattgt aagtttcata 240 tatttcatta ttatatcatt gctaatataa tttgtttttg acataaagtt ttggaaaaat 300 ttcagatctt tgtaatgtgg ttggacgctg tcacgtactt gcatcatcat ggtcacgatg 360 ataagttgcc ttgga 375 <210> 368 <211> 99 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 368 ttctggcctc tttattgggc cgcccaagga acccttttct gggccatctt cgtactcggc 60 cacgactggt aatttaatgg atccaaccga caaccactt 99 <210> 369 <211> 536 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <220> <221> modified_base <222> (48)..(489) <223> a, c, t, g, unknown or other <400> 369 ttctggcctc tttattgggc cgcccaagga acccttttct gggccatnnn nnnnnnnnnn 60 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 120 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 180 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 240 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 300 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 360 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 420 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 480 nnnnnnnnnt actcggccac gactggtaat ttaatggatc caaccgacaa ccactt 536 <210> 370 <211> 504 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <220> <221> modified_base <222> (49)..(454) <223> a, c, t, g, unknown or other <400> 370 ttctggcctc tttattgggc cgcccaagga acccttttct gggccatcnn nnnnnnnnnn 60 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 120 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 180 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 240 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 300 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 360 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 420 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnntcgtac tcggccacga ctggtaattt 480 aatggatcca accgacaacc actt 504 <210> 371 <211> 504 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <220> <221> modified_base <222> (49)..(454) <223> a, c, t, g, unknown or other <400> 371 ttctggcctc tttattgggc cgcccaagga acccttttct gggccatcnn nnnnnnnnnn 60 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 120 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 180 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 240 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 300 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 360 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 420 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnntcgtac tcggccacga ctggtaattt 480 aatggatcca accgacaacc actt 504 <210> 372 <211> 94 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 372 ttctggcctc tttattgggc cgcccaagga acccttttct gggccattac tcggccacga 60 ctggtaattt aatggatcca accgacaacc actt 94 <210> 373 <211> 530 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <220> <221> modified_base <222> (49)..(483) <223> a, c, t, g, unknown or other <400> 373 ttctggcctc tttattgggc cgcccaagga acccttttct gggccatcnn nnnnnnnnnn 60 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 120 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 180 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 240 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 300 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 360 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 420 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 480 nnntactcgg ccacgactgg taatttaatg gatccaaccg acaaccactt 530 <210> 374 <211> 470 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <220> <221> modified_base <222> (46)..(423) <223> a, c, t, g, unknown or other <400> 374 ttctggcctc tttattgggc cgcccaagga acccttttct gggccnnnnn nnnnnnnnnn 60 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 120 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 180 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 240 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 300 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 360 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 420 nnntactcgg ccacgactgg taatttaatg gatccaaccg acaaccactt 470 <210> 375 <211> 96 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 375 ttctggcctc tttattgggc cgcccaagga acccttttct gggccatctt actcggccac 60 gactggtaat ttaatggatc caaccgacaa ccactt 96 <210> 376 <211> 104 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 376 gtaatacata gcggccgcgc ccaaggaacc cttttctggg ccatcttcgt actcggccac 60 gactggtaat ttaattttca atttattttt tcttcaactt ctta 104 <210> 377 <211> 95 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 377 gtaatacata gcggccgcgc ccaaggaacc cttttctggg ccatctgcca cgactggtaa 60 tttaattttc aatttatttt ttcttcaact tctta 95 <210> 378 <211> 103 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 378 gtaatacata gcggccgcag cgagagaaag cttattgcaa cttcaactac ttgctggtcg 60 atcgtgttgg ccactcttgt ttatctatca ttcctcgttg gtc 103 <210> 379 <211> 237 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <220> <221> modified_base <222> (47)..(183) <223> a, c, t, g, unknown or other <400> 379 gtaatacata gcggccgcag cgagagaaag cttattgcaa cttcaannnn nnnnnnnnnn 60 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 120 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 180 nnncttgctg gtcgatcatg ttggccactc ttgtttatct atcattcctc gttggtc 237 <210> 380 <211> 156 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <220> <221> modified_base <222> (48)..(109) <223> a, c, t, g, unknown or other <400> 380 ttctggcctc tttattgggc cgcccaagga acccttttct gggccatnnn nnnnnnnnnn 60 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnt actcggccac 120 gactggtaat ttaatggatc caaccgacaa ccactt 156 <210> 381 <211> 471 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <220> <221> modified_base <222> (47)..(424) <223> a, c, t, g, unknown or other <400> 381 ttctggcctc tttattgggc cgcccaagga acccttttct gggccannnn nnnnnnnnnn 60 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 120 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 180 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 240 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 300 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 360 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 420 nnnntactcg gccacgactg gtaatttaat ggatccaacc gacaaccact t 471 <210> 382 <211> 104 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 382 gtaatacata gcggccgcgc ccaaggaacc cttttctggg ccatcttcgt actcggccac 60 gactggtaat ttaattttca atttattttt tcttcaactt ctta 104 <210> 383 <211> 103 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 383 gtaatacata gcggccgcag cgagagaaag cttattgcaa cttcaactac ttgctggtcg 60 atcgtgttgg ccactcggta cctggagcac aagactggcc tca 103

Claims (21)

  1. DNA-결합 도메인이 세포 중의 지방산 데새투라제 3(FAD3) 유전자 내 표적 부위에 결합함으로써 FAD3 유전자에서 파단을 생성할 수 있도록, 세포 내로 절단 도메인 또는 절단 절반-도메인 및 DNA-결합 도메인을 포함하는 뉴클레아제 또는 이 뉴클레아제를 코딩하는 하나 이상의 폴리뉴클레오티드를 도입하는 것을 포함하는, 식물 세포의 게놈을 변형하는 방법으로서, 상기 표적 부위는 서열 20-23, 서열 25-38, 서열 40-45, 서열 47 및 서열 49 중 어느 하나를 포함하고;
    여기서 관심 핵산 서열은 뉴클레아제에 의해 절단 후 FAD3 유전자에 통합되며, 여기서 식물 세포는 전체 식물이 아닌 것인 방법.
  2. 제1항에 있어서, FAD3 유전자가 하기 FAD3 유전자 중 하나 이상인 것인 방법: FAD3A, FAD3A', FAD3A", FAD3C, FAD3C" 및 FAD3C'.
  3. 제2항에 있어서, 하나 이상의 뉴클레오티드가 식물 세포의 유전자로부터 결실되는 것인 방법.
  4. 제3항에 있어서, DNA-결합 도메인이 메가뉴클레아제 DNA-결합 도메인, 류신 지퍼 DNA-결합 도메인, 전사 활성화제-유사 이펙터(TALE) DNA-결합 도메인, CRISPR-Cas 뉴클레아제 시스템의 단일 가이드 RNA, 레콤비나제, 아연 핑거 단백질 DNA-결합 도메인 및 상기 DNA-결합 도메인의 키메라 조합으로 이루어진 군으로부터 선택되는 것인 방법.
  5. 제4항에 있어서, 절단 도메인 또는 절단 절반-도메인이 유형 IIS 제한 엔도뉴클레아제로부터의 절단 절반-도메인, FokI 엔도뉴클레아제로부터의 절단 절반-도메인, StsI 엔도뉴클레아제로부터의 절단 절반-도메인 및 귀소성 엔도뉴클레아제로 이루어진 군으로부터 선택되는 것인 방법.
  6. 제5항에 있어서, 뉴클레아제가 아연 핑거 뉴클레아제인 방법.
  7. 제6항에 있어서, 아연 핑거 뉴클레아제가 3 내지 6개의 아연 핑거 도메인을 포함하고, 각각의 아연 핑거 도메인은 인식 나선 영역을 포함하며, 여기서 아연 핑거 단백질은 하기 표의 단일 열로 정리하여 나타낸 인식 나선 영역을 포함하는 것인 방법.
    Figure 112020009968479-pct00097

    Figure 112020009968479-pct00098
  8. 제1항에 있어서, 하기 유전자 중 하나 이상이 절단되는 것인 방법: FAD3A, FAD3A', FAD3A", FAD3C, FAD3C" 및 FAD3C'.
  9. 제1항에 있어서, 식물 세포가 단자엽 식물 세포 또는 쌍자엽 식물 세포인 방법.
  10. 제9항에 있어서, 식물 세포가 브라시카(Brassica) 종; 브라시카 나푸스(Brassica napus); 브라시카 라파(Brassica rapa); 브라시카 주엔세아(Brassica juencea); 브라시카 올레라세아(Brassica oleracea); 브라시카 니그라(Brassica nigra); 제아(Zea) 종; 제아 메이스(Zea mays); 글리신(Glycine) 종; 글리신 맥스(Glycine max); 트리티쿰(Triticum) 종; 트리티쿰 아에스티붐(Triticum aestivum); 오리자(Oryza) 종; 오리자 사티바(Oryza sativa); 트리티케일(Triticale) 종; 트리티케일 트리티쿰(Triticale triticum); 헬리안테아에(Heliantheae) 종; 헬리안테아에 헬리안투스(Heliantheae helianthus); 고시피움(Gossypium) 종; 고시피움 히르수툼(Gossypium hirsutum); 및 호르데움 불가르(Hordeum vulgar)로 이루어진 군으로부터 선택되는 것인 방법.
  11. 제1항에 있어서, 관심 핵산 서열이 DNA-결합 도메인의 표적 부위, 하나 이상의 살곤충 저항성 유전자, 하나 이상의 제초제 내성 유전자, 하나 이상의 질소 이용 효율 유전자, 하나 이상의 물 이용 효율 유전자, 하나 이상의 영양 품질 유전자, 하나 이상의 DNA 결합 유전자, 하나 이상의 선택 마커 유전자 및 그의 조합을 포함하는 서열로 이루어진 군으로부터 선택되는 것인 방법.
  12. 제1항 내지 제11항 중 어느 하나의 방법에 따라 변형된 단리된 식물 세포.
  13. 서열 20-23, 서열 25-38, 서열 40-45, 서열 47 및 서열 49로 이루어진 군으로부터 선택된 FAD3 유전자 내 핵산 표적 부위에 결합하는 아연 핑거 단백질 DNA-결합 도메인 및 절단 도메인을 포함하는, FAD3 유전자를 절단하는 부위-특이적 아연 핑거 뉴클레아제로서, 아연 핑거 뉴클레아제가 3 내지 6개의 아연 핑거 도메인을 포함하고, 각각의 아연 핑거 도메인은 인식 나선 영역을 포함하며, 여기서 아연 핑거 단백질은 하기 표의 단일 열로 정리하여 나타낸 인식 나선 영역을 포함하는 것인 아연 핑거 뉴클레아제.
    Figure 112020009968479-pct00099

    Figure 112020009968479-pct00100
  14. 삭제
  15. 삭제
  16. 삭제
  17. 삭제
  18. 삭제
  19. 삭제
  20. 삭제
  21. 삭제
KR1020157008552A 2012-09-07 2013-09-05 Fad3 성능 유전자좌 및 표적화 파단을 유도할 수 있는 상응하는 표적 부위 특이적 결합 단백질 KR102147007B1 (ko)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201261697854P 2012-09-07 2012-09-07
US61/697,854 2012-09-07
US201361820260P 2013-05-07 2013-05-07
US61/820,260 2013-05-07
PCT/US2013/058267 WO2014039684A1 (en) 2012-09-07 2013-09-05 Fad3 performance loci and corresponding target site specific binding proteins capable of inducing targeted breaks

Publications (2)

Publication Number Publication Date
KR20150043540A KR20150043540A (ko) 2015-04-22
KR102147007B1 true KR102147007B1 (ko) 2020-08-21

Family

ID=50237601

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020157008552A KR102147007B1 (ko) 2012-09-07 2013-09-05 Fad3 성능 유전자좌 및 표적화 파단을 유도할 수 있는 상응하는 표적 부위 특이적 결합 단백질

Country Status (17)

Country Link
US (3) US9914930B2 (ko)
EP (2) EP2893006B1 (ko)
JP (3) JP6775953B2 (ko)
KR (1) KR102147007B1 (ko)
CN (1) CN105264067B (ko)
AR (1) AR092478A1 (ko)
AU (1) AU2013312538B2 (ko)
BR (1) BR112015004995B1 (ko)
CA (1) CA2884162C (ko)
CL (1) CL2015000564A1 (ko)
HK (1) HK1217732A1 (ko)
IL (1) IL237567B (ko)
NZ (1) NZ705745A (ko)
RU (1) RU2665811C2 (ko)
UY (1) UY35019A (ko)
WO (1) WO2014039684A1 (ko)
ZA (1) ZA201501395B (ko)

Families Citing this family (52)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6261500B2 (ja) 2011-07-22 2018-01-17 プレジデント アンド フェローズ オブ ハーバード カレッジ ヌクレアーゼ切断特異性の評価および改善
GB201122458D0 (en) 2011-12-30 2012-02-08 Univ Wageningen Modified cascade ribonucleoproteins and uses thereof
PE20190844A1 (es) 2012-05-25 2019-06-17 Emmanuelle Charpentier Modulacion de transcripcion con arn de direccion a adn generico
CN105264067B (zh) * 2012-09-07 2020-11-10 美国陶氏益农公司 Fad3性能基因座及相应的能够诱导靶向断裂的靶位点特异性结合蛋白
UA119135C2 (uk) 2012-09-07 2019-05-10 ДАУ АГРОСАЙЄНСІЗ ЕлЕлСі Спосіб отримання трансгенної рослини
KR101706085B1 (ko) 2012-10-23 2017-02-14 주식회사 툴젠 표적 DNA에 특이적인 가이드 RNA 및 Cas 단백질을 암호화하는 핵산 또는 Cas 단백질을 포함하는, 표적 DNA를 절단하기 위한 조성물 및 이의 용도
KR102145760B1 (ko) 2012-12-06 2020-08-19 시그마-알드리치 컴퍼니., 엘엘씨 Crispr-기초된 유전체 변형과 조절
DK3620534T3 (da) 2013-03-14 2021-12-06 Caribou Biosciences Inc Crispr-cas sammensætninger af nucleinsyre-targeting nucleinsyrer
RU2723130C2 (ru) 2013-04-05 2020-06-08 ДАУ АГРОСАЙЕНСИЗ ЭлЭлСи Способы и композиции для встраивания экзогенной последовательности в геном растений
US20150044192A1 (en) 2013-08-09 2015-02-12 President And Fellows Of Harvard College Methods for identifying a target site of a cas9 nuclease
US9526784B2 (en) 2013-09-06 2016-12-27 President And Fellows Of Harvard College Delivery system for functional nucleases
US9340799B2 (en) 2013-09-06 2016-05-17 President And Fellows Of Harvard College MRNA-sensing switchable gRNAs
US9388430B2 (en) 2013-09-06 2016-07-12 President And Fellows Of Harvard College Cas9-recombinase fusion proteins and uses thereof
LT3066201T (lt) 2013-11-07 2018-08-10 Editas Medicine, Inc. Su crispr susiję būdai ir kompozicijos su valdančiomis grnr
US9840699B2 (en) 2013-12-12 2017-12-12 President And Fellows Of Harvard College Methods for nucleic acid editing
WO2016022363A2 (en) 2014-07-30 2016-02-11 President And Fellows Of Harvard College Cas9 proteins including ligand-dependent inteins
WO2016089433A1 (en) 2014-12-03 2016-06-09 Agilent Technologies, Inc. Guide rna with chemical modifications
EP3280803B1 (en) 2015-04-06 2021-05-26 The Board of Trustees of the Leland Stanford Junior University Chemically modified guide rnas for crispr/cas-mediated gene regulation
EP3328399B1 (en) 2015-07-31 2023-12-27 Regents of the University of Minnesota Modified cells and methods of therapy
US10837024B2 (en) * 2015-09-17 2020-11-17 Cellectis Modifying messenger RNA stability in plant transformations
BR112018007061A2 (pt) * 2015-10-06 2019-01-15 Aict método e composição para aumentar a eficiência de produção de uma planta editada pelo genoma a partir de um protoplasto vegetal e planta regenerada a partir do mesmo
WO2017062825A1 (en) * 2015-10-08 2017-04-13 J.R. Simplot Company Potato cultivar y9
US20190225955A1 (en) 2015-10-23 2019-07-25 President And Fellows Of Harvard College Evolved cas9 proteins for gene editing
WO2017134601A1 (en) * 2016-02-02 2017-08-10 Cellectis Modifying soybean oil composition through targeted knockout of the fad3a/b/c genes
US10767175B2 (en) 2016-06-08 2020-09-08 Agilent Technologies, Inc. High specificity genome editing using chemically modified guide RNAs
KR102547316B1 (ko) 2016-08-03 2023-06-23 프레지던트 앤드 펠로우즈 오브 하바드 칼리지 아데노신 핵염기 편집제 및 그의 용도
AU2017308889B2 (en) 2016-08-09 2023-11-09 President And Fellows Of Harvard College Programmable Cas9-recombinase fusion proteins and uses thereof
US11542509B2 (en) 2016-08-24 2023-01-03 President And Fellows Of Harvard College Incorporation of unnatural amino acids into proteins using base editing
CN107784200B (zh) * 2016-08-26 2020-11-06 深圳华大生命科学研究院 一种筛选新型CRISPR-Cas系统的方法和装置
IL247752A0 (en) * 2016-09-11 2016-11-30 Yeda Res & Dev Compositions and methods for modulating gene expression for site-directed mutagenesis
KR20240007715A (ko) 2016-10-14 2024-01-16 프레지던트 앤드 펠로우즈 오브 하바드 칼리지 핵염기 에디터의 aav 전달
CN109689693B (zh) * 2016-11-03 2022-06-28 深圳华大生命科学研究院 提高基因编辑效率的方法和系统
US10745677B2 (en) 2016-12-23 2020-08-18 President And Fellows Of Harvard College Editing of CCR5 receptor gene to protect against HIV infection
CN106591293A (zh) * 2016-12-28 2017-04-26 贵州省草业研究所 基于酶切连接从未知基因组中分离已知序列侧翼序列的方法
US11898179B2 (en) 2017-03-09 2024-02-13 President And Fellows Of Harvard College Suppression of pain by gene editing
EP3592777A1 (en) 2017-03-10 2020-01-15 President and Fellows of Harvard College Cytosine to guanine base editor
US11268082B2 (en) 2017-03-23 2022-03-08 President And Fellows Of Harvard College Nucleobase editors comprising nucleic acid programmable DNA binding proteins
US11560566B2 (en) 2017-05-12 2023-01-24 President And Fellows Of Harvard College Aptazyme-embedded guide RNAs for use with CRISPR-Cas9 in genome editing and transcriptional activation
NL2019209B1 (en) * 2017-07-10 2019-01-16 Duemmen Group Bv Powdery mildew resistant rose
WO2019023680A1 (en) 2017-07-28 2019-01-31 President And Fellows Of Harvard College METHODS AND COMPOSITIONS FOR EVOLUTION OF BASIC EDITORS USING PHAGE-ASSISTED CONTINUOUS EVOLUTION (PACE)
WO2019139645A2 (en) 2017-08-30 2019-07-18 President And Fellows Of Harvard College High efficiency base editors comprising gam
US11795443B2 (en) 2017-10-16 2023-10-24 The Broad Institute, Inc. Uses of adenosine base editors
US11390876B2 (en) 2018-03-09 2022-07-19 Pioneer Hi-Bred International, Inc. Compositions and methods for modification of fatty acids in soybean
EP3578658A1 (en) * 2018-06-08 2019-12-11 Johann Wolfgang Goethe-Universität Frankfurt Method for generating a gene editing vector with fixed guide rna pairs
CN109868283B (zh) * 2019-02-21 2021-07-20 浙江农林大学 一种评估CRISPR/Cas9基因编辑效率或脱靶频率的方法
CA3130488A1 (en) 2019-03-19 2020-09-24 David R. Liu Methods and compositions for editing nucleotide sequences
CN111378721B (zh) * 2020-04-16 2023-06-23 广西壮族自治区水产科学研究院 凡纳滨对虾耐亚硝酸盐氮性状相关的分子标记及其筛选
GB2614813A (en) 2020-05-08 2023-07-19 Harvard College Methods and compositions for simultaneous editing of both strands of a target double-stranded nucleotide sequence
WO2021228700A1 (en) * 2020-05-13 2021-11-18 Nunhems B.V. Method for obtaining mutant plants by targeted mutagenesis
CN112813081B (zh) * 2021-02-23 2022-10-28 宁夏农林科学院农业生物技术研究中心(宁夏农业生物技术重点实验室) 一种获得高含量亚油酸水稻株系的方法
DE112022001376T5 (de) 2021-03-05 2024-03-14 Denso Corporation Spurbestimmungsvorrichtung, spurwechselbestimmungsprogramm und datenstruktur
AU2022343300A1 (en) 2021-09-10 2024-04-18 Agilent Technologies, Inc. Guide rnas with chemical modification for prime editing

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011049627A1 (en) * 2009-10-22 2011-04-28 Dow Agrosciences Llc Engineered zinc finger proteins targeting plant genes involved in fatty acid biosynthesis

Family Cites Families (152)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US789538A (en) 1904-11-11 1905-05-09 Colin E Ham Dumb-bell.
US1173508A (en) 1913-10-27 1916-02-29 Oscar F Heartwell Jr Ironing-board.
US4727028A (en) 1981-06-22 1988-02-23 Eli Lilly And Company Recombinant DNA cloning vectors and the eukaryotic and prokaryotic transformants thereof
US4693977A (en) 1982-08-23 1987-09-15 Queen's University At Kingston Enzyme immobilization for producing cephalosporin antibiotics
US4536475A (en) 1982-10-05 1985-08-20 Phytogen Plant vector
US4535060A (en) 1983-01-05 1985-08-13 Calgene, Inc. Inhibition resistant 5-enolpyruvyl-3-phosphoshikimate synthetase, production and use
US5352605A (en) 1983-01-17 1994-10-04 Monsanto Company Chimeric genes for transforming plant cells using viral promoters
NL8300698A (nl) 1983-02-24 1984-09-17 Univ Leiden Werkwijze voor het inbouwen van vreemd dna in het genoom van tweezaadlobbige planten; agrobacterium tumefaciens bacterien en werkwijze voor het produceren daarvan; planten en plantecellen met gewijzigde genetische eigenschappen; werkwijze voor het bereiden van chemische en/of farmaceutische produkten.
US5428147A (en) 1983-04-15 1995-06-27 Mycogen Plant Science, Inc. Octopine T-DNA promoters
NZ207765A (en) 1983-04-15 1987-03-06 Lubrizol Genetics Inc Plant expression of transferred dna(t-dna)from plasmids associated with agrobacterium sp
US4940840A (en) 1984-03-26 1990-07-10 Dna Plant Technology Corporation Novel chitinase-producing bacteria and plants
US5447858A (en) 1984-04-13 1995-09-05 Mycogen Plant Sciences, Inc. Heat shock promoter and gene
US4943674A (en) 1987-05-26 1990-07-24 Calgene, Inc. Fruit specific transcriptional factors
US5753475A (en) 1985-01-17 1998-05-19 Calgene, Inc. Methods and compositions for regulated transcription and expression of heterologous genes
US5420034A (en) 1986-07-31 1995-05-30 Calgene, Inc. Seed-specific transcriptional regulation
US4886937A (en) 1985-05-20 1989-12-12 North Carolina State University Method for transforming pine
US4940835A (en) 1985-10-29 1990-07-10 Monsanto Company Glyphosate-resistant plants
US4810648A (en) 1986-01-08 1989-03-07 Rhone Poulenc Agrochimie Haloarylnitrile degrading gene, its use, and cells containing the gene
ATE57390T1 (de) 1986-03-11 1990-10-15 Plant Genetic Systems Nv Durch gentechnologie erhaltene und gegen glutaminsynthetase-inhibitoren resistente pflanzenzellen.
US4975374A (en) 1986-03-18 1990-12-04 The General Hospital Corporation Expression of wild type and mutant glutamine synthetase in foreign hosts
ES2039474T3 (es) 1986-12-05 1993-10-01 Ciba-Geigy Ag Procedimineto mejorado para la transformacion de protoplastos vegetales.
US5015580A (en) 1987-07-29 1991-05-14 Agracetus Particle-mediated transformation of soybean plants and lines
US5322938A (en) 1987-01-13 1994-06-21 Monsanto Company DNA sequence for enhancing the efficiency of transcription
US5359142A (en) 1987-01-13 1994-10-25 Monsanto Company Method for enhanced expression of a protein
EP0333033A1 (en) 1988-03-09 1989-09-20 Meiji Seika Kaisha Ltd. Glutamine synthesis gene and glutamine synthetase
US5416011A (en) 1988-07-22 1995-05-16 Monsanto Company Method for soybean transformation and regeneration
US5302523A (en) 1989-06-21 1994-04-12 Zeneca Limited Transformation of plant cells
US5501967A (en) 1989-07-26 1996-03-26 Mogen International, N.V./Rijksuniversiteit Te Leiden Process for the site-directed integration of DNA into the genome of plants
US5550318A (en) 1990-04-17 1996-08-27 Dekalb Genetics Corporation Methods and compositions for the production of stably transformed, fertile monocot plants and cells thereof
US7705215B1 (en) 1990-04-17 2010-04-27 Dekalb Genetics Corporation Methods and compositions for the production of stably transformed, fertile monocot plants and cells thereof
US6051753A (en) 1989-09-07 2000-04-18 Calgene, Inc. Figwort mosaic virus promoter and uses
ES2150900T3 (es) 1989-10-31 2000-12-16 Monsanto Co Promotor para plantas transgenicas.
US5641876A (en) 1990-01-05 1997-06-24 Cornell Research Foundation, Inc. Rice actin gene and promoter
CA2074355C (en) 1990-01-22 2008-10-28 Ronald C. Lundquist Method of producing fertile transgenic corn plants
US5484956A (en) 1990-01-22 1996-01-16 Dekalb Genetics Corporation Fertile transgenic Zea mays plant comprising heterologous DNA encoding Bacillus thuringiensis endotoxin
US6403865B1 (en) 1990-08-24 2002-06-11 Syngenta Investment Corp. Method of producing transgenic maize using direct transformation of commercially important genotypes
US5633435A (en) 1990-08-31 1997-05-27 Monsanto Company Glyphosate-tolerant 5-enolpyruvylshikimate-3-phosphate synthases
US5266317A (en) 1990-10-04 1993-11-30 University Of Georgia Research Foundation, Inc. Insect-specific paralytic neurotoxin genes for use in biological insect control: methods and compositions
US5384253A (en) 1990-12-28 1995-01-24 Dekalb Genetics Corporation Genetic transformation of maize cells by electroporation of cells pretreated with pectin degrading enzymes
GB9104617D0 (en) 1991-03-05 1991-04-17 Nickerson Int Seed Pest control
GB9115909D0 (en) 1991-07-23 1991-09-04 Nickerson Int Seed Recombinant dna
DK39692D0 (da) 1992-03-25 1992-03-25 Danisco Biologisk materiale
US5356802A (en) 1992-04-03 1994-10-18 The Johns Hopkins University Functional domains in flavobacterium okeanokoites (FokI) restriction endonuclease
US5487994A (en) 1992-04-03 1996-01-30 The Johns Hopkins University Insertion and deletion mutants of FokI restriction endonuclease
US5436150A (en) 1992-04-03 1995-07-25 The Johns Hopkins University Functional domains in flavobacterium okeanokoities (foki) restriction endonuclease
US5591616A (en) 1992-07-07 1997-01-07 Japan Tobacco, Inc. Method for transforming monocotyledons
WO1994002620A2 (en) 1992-07-27 1994-02-03 Pioneer Hi-Bred International, Inc. An improved method of agrobacterium-mediated transformation of cultured soybean cells
US5607914A (en) 1993-01-13 1997-03-04 Pioneer Hi-Bred International, Inc. Synthetic antimicrobial peptides
US6118047A (en) 1993-08-25 2000-09-12 Dekalb Genetic Corporation Anthranilate synthase gene and method of use thereof for conferring tryptophan overproduction
US5362865A (en) 1993-09-02 1994-11-08 Monsanto Company Enhanced expression in plants using non-translated leader sequences
US5580852A (en) 1993-12-17 1996-12-03 Pioneer Hi-Bred International, Inc. Derivatives of tachyplesin having inhibitory activity towards plant pathogenic fungi
DE69534629D1 (de) 1994-01-18 2005-12-29 Scripps Research Inst Derivate von zinkfingerproteinen und methoden
US6140466A (en) 1994-01-18 2000-10-31 The Scripps Research Institute Zinc finger protein derivatives and methods therefor
US6242568B1 (en) 1994-01-18 2001-06-05 The Scripps Research Institute Zinc finger protein derivatives and methods therefor
GB9824544D0 (en) 1998-11-09 1999-01-06 Medical Res Council Screening system
CA2196419C (en) 1994-08-20 2007-08-21 Yen Choo Improvements in or relating to binding proteins for recognition of dna
US5789538A (en) 1995-02-03 1998-08-04 Massachusetts Institute Of Technology Zinc finger proteins with high affinity new DNA binding specificities
US5994627A (en) 1995-03-31 1999-11-30 Common Wealth Scientific And Industrial Research Organisation Genetic sequences conferring nematode resistance in plants and uses therefor
US5693512A (en) 1996-03-01 1997-12-02 The Ohio State Research Foundation Method for transforming plant tissue by sonication
US5850019A (en) 1996-08-06 1998-12-15 University Of Kentucky Research Foundation Promoter (FLt) for the full-length transcript of peanut chlorotic streak caulimovirus (PCLSV) and expression of chimeric genes in plants
US5925523A (en) 1996-08-23 1999-07-20 President & Fellows Of Harvard College Intraction trap assay, reagents and uses thereof
EP0865496A1 (en) 1996-09-05 1998-09-23 Unilever N.V. Salt-inducible promoter derivable from a lactic acid bacterium, and its use in a lactic acid bacterium for production of a desired protein
US6252138B1 (en) 1997-01-20 2001-06-26 Plant Genetic Systems, N.V. Pathogen-induced plant promoters
US5981840A (en) 1997-01-24 1999-11-09 Pioneer Hi-Bred International, Inc. Methods for agrobacterium-mediated transformation
GB9703369D0 (en) 1997-02-18 1997-04-09 Lindqvist Bjorn H Process
GB2338237B (en) 1997-02-18 2001-02-28 Actinova Ltd In vitro peptide or protein expression library
US5922564A (en) 1997-02-24 1999-07-13 Performance Plants, Inc. Phosphate-deficiency inducible promoter
GB9710807D0 (en) 1997-05-23 1997-07-23 Medical Res Council Nucleic acid binding proteins
GB9710809D0 (en) 1997-05-23 1997-07-23 Medical Res Council Nucleic acid binding proteins
US6087166A (en) 1997-07-03 2000-07-11 Basf Aktiengesellschaft Transcriptional activators with graded transactivation potential
US6410248B1 (en) 1998-01-30 2002-06-25 Massachusetts Institute Of Technology General strategy for selecting high-affinity zinc finger proteins for diverse DNA target sites
EP1054970A1 (en) 1998-02-20 2000-11-29 Zeneca Limited Pollen specific promoter
ES2229687T3 (es) 1998-02-26 2005-04-16 Pioneer Hi-Bred International, Inc. Promotores constitutivos de maiz.
CA2315549A1 (en) 1998-02-26 1999-09-02 Pioneer Hi-Bred International, Inc. Family of maize pr-1 genes and promoters
ES2341926T3 (es) 1998-03-02 2010-06-29 Massachusetts Institute Of Technology Poliproteinas con dedos de cinc que tienen enlazadores mejorados.
US6635806B1 (en) 1998-05-14 2003-10-21 Dekalb Genetics Corporation Methods and compositions for expression of transgenes in plants
US6307123B1 (en) 1998-05-18 2001-10-23 Dekalb Genetics Corporation Methods and compositions for transgene identification
US6140815A (en) 1998-06-17 2000-10-31 Dover Instrument Corporation High stability spin stand platform
JP2000083680A (ja) 1998-07-16 2000-03-28 Nippon Paper Industries Co Ltd 光誘導型プロモ―タ―の制御下に置かれた不定芽再分化遺伝子を選抜マ―カ―遺伝子とする植物への遺伝子導入方法及びこれに用いる植物への遺伝子導入用ベクタ―
US6140081A (en) 1998-10-16 2000-10-31 The Scripps Research Institute Zinc finger binding domains for GNN
US7070934B2 (en) 1999-01-12 2006-07-04 Sangamo Biosciences, Inc. Ligand-controlled regulation of endogenous gene expression
US6534261B1 (en) 1999-01-12 2003-03-18 Sangamo Biosciences, Inc. Regulation of endogenous gene expression in cells using zinc finger proteins
US6453242B1 (en) 1999-01-12 2002-09-17 Sangamo Biosciences, Inc. Selection of sites for targeting by zinc finger proteins and methods of designing zinc finger proteins to bind to preselected sites
US6599692B1 (en) 1999-09-14 2003-07-29 Sangamo Bioscience, Inc. Functional genomics using zinc finger proteins
JP2002534129A (ja) 1999-01-14 2002-10-15 モンサント テクノロジー エルエルシー ダイズ形質転換方法
US7030215B2 (en) 1999-03-24 2006-04-18 Sangamo Biosciences, Inc. Position dependent recognition of GNN nucleotide triplets by zinc fingers
US6794136B1 (en) 2000-11-20 2004-09-21 Sangamo Biosciences, Inc. Iterative optimization in the design of binding proteins
US6207879B1 (en) 1999-05-14 2001-03-27 Dekalb Genetics Corporation Maize RS81 promoter and methods for use thereof
US6232526B1 (en) 1999-05-14 2001-05-15 Dekalb Genetics Corp. Maize A3 promoter and methods for use thereof
US6194636B1 (en) 1999-05-14 2001-02-27 Dekalb Genetics Corp. Maize RS324 promoter and methods for use thereof
US6429357B1 (en) 1999-05-14 2002-08-06 Dekalb Genetics Corp. Rice actin 2 promoter and intron and methods for use thereof
US6677503B1 (en) 1999-06-23 2004-01-13 Pioneer Hi-Bred International, Inc. Sunflower anti-pathogene proteins and genes and their uses
CA2284246A1 (en) 1999-10-01 2001-04-01 Agriculture And Agrifood Canada Of Agriculture And Agri-Food Plant fatty acid desaturases and alleles therefor
EP1236045B1 (en) 1999-12-06 2005-11-09 Sangamo Biosciences Inc. Methods of using randomized libraries of zinc finger proteins for the identification of gene function
CA2390819A1 (en) 2000-01-21 2001-07-26 Pioneer Hi-Bred International, Inc. Novel root-preferred promoter elements and methods of use
ATE483970T1 (de) 2000-02-08 2010-10-15 Sangamo Biosciences Inc Zellen zur entdeckung von medikamenten
US20020061512A1 (en) 2000-02-18 2002-05-23 Kim Jin-Soo Zinc finger domains and methods of identifying same
US6388170B1 (en) 2000-04-07 2002-05-14 University Of Kentucky Research Foundation Bidirectional promoters and methods related thereto
WO2001088197A2 (en) 2000-05-16 2001-11-22 Massachusetts Institute Of Technology Methods and compositions for interaction trap assays
JP2002060786A (ja) 2000-08-23 2002-02-26 Kao Corp 硬質表面用殺菌防汚剤
US20050267061A1 (en) 2004-04-08 2005-12-01 Sangamo Biosciences, Inc. Methods and compositions for treating neuropathic and neurodegenerative conditions
US7067317B2 (en) 2000-12-07 2006-06-27 Sangamo Biosciences, Inc. Regulation of angiogenesis with zinc finger proteins
US7022826B2 (en) 2001-02-26 2006-04-04 The Regents Of The University Of California Non-oligomerizing fluorescent proteins
GB0108491D0 (en) 2001-04-04 2001-05-23 Gendaq Ltd Engineering zinc fingers
JP2005500061A (ja) 2001-08-20 2005-01-06 ザ スクリップス リサーチ インスティテュート Cnnについての亜鉛フィンガー結合ドメイン
US7262054B2 (en) 2002-01-22 2007-08-28 Sangamo Biosciences, Inc. Zinc finger proteins for DNA binding and gene regulation in plants
US8106255B2 (en) * 2002-01-23 2012-01-31 Dana Carroll Targeted chromosomal mutagenasis using zinc finger nucleases
EP2368982A3 (en) 2002-03-21 2011-10-12 Sangamo BioSciences, Inc. Methods and compositions for using zinc finger endonucleases to enhance homologous recombination
US7361635B2 (en) 2002-08-29 2008-04-22 Sangamo Biosciences, Inc. Simultaneous modulation of multiple genes
CA2497913C (en) 2002-09-05 2014-06-03 California Institute Of Technology Use of chimeric nucleases to stimulate gene targeting
AU2004210965C1 (en) 2003-02-11 2014-10-16 Corteva Agriscience Llc Altered FAD2 and FAD3 genes in brassica and the molecular marker-assisted detection thereof
EP2322629A3 (en) 2003-04-29 2011-11-02 Pioneer Hi-Bred International Inc. Novel glyphosate-n-acetyltransferase (GAT) genes
US8409861B2 (en) 2003-08-08 2013-04-02 Sangamo Biosciences, Inc. Targeted deletion of cellular DNA sequences
US7888121B2 (en) 2003-08-08 2011-02-15 Sangamo Biosciences, Inc. Methods and compositions for targeted cleavage and recombination
KR100537955B1 (ko) 2003-10-29 2005-12-20 학교법인고려중앙학원 꽃가루 특이적 유전자 발현 프로모터
US7972854B2 (en) 2004-02-05 2011-07-05 Sangamo Biosciences, Inc. Methods and compositions for targeted cleavage and recombination
US7534775B2 (en) * 2004-04-08 2009-05-19 Sangamo Biosciences, Inc. Methods and compositions for modulating cardiac contractility
JP2008506359A (ja) 2004-04-08 2008-03-06 サンガモ バイオサイエンシズ インコーポレイテッド ジンクフィンガータンパク質による神経因性疼痛の処置
PL2308977T5 (pl) 2004-04-30 2017-10-31 Dow Agrosciences Llc Nowy gen odporności na herbicydy
AU2006212647A1 (en) * 2005-02-09 2006-08-17 Bioriginal Food & Science Corp. Novel omega-3 fatty acid desaturase family members and uses thereof
WO2006121866A2 (en) 2005-05-05 2006-11-16 The Arizona Board Of Regents On Behalf Of The University Of Arizona Sequence enabled reassembly (seer) - a novel method for visualizing specific dna sequences
AP2693A (en) * 2005-05-27 2013-07-16 Monsanto Technology Llc Soybean event MON89788 and methods for detection thereof
KR20080033455A (ko) 2005-07-26 2008-04-16 상가모 바이오사이언스 인코포레이티드 외래 핵산 서열의 표적화된 통합 및 발현
EP3241430B1 (en) 2005-10-28 2020-08-26 Dow AgroSciences LLC Novel herbicide resistance genes
JP5266210B2 (ja) 2006-05-25 2013-08-21 サンガモ バイオサイエンシズ インコーポレイテッド 改変開裂ハーフドメイン
US9428756B2 (en) 2006-08-11 2016-08-30 Dow Agrosciences Llc Zinc finger nuclease-mediated homologous recombination
AU2007334468B2 (en) 2006-12-14 2013-02-07 Corteva Agriscience Llc Optimized non-canonical zinc finger proteins
WO2009042163A2 (en) 2007-09-27 2009-04-02 Sangamo Biosciences, Inc. Rapid in vivo identification of biologically active nucleases
US8399218B2 (en) 2007-09-27 2013-03-19 Dow Agrosciences, Llc Engineered zinc finger proteins targeting 5-enolpyruvyl shikimate-3-phosphate synthase genes
US8936936B2 (en) 2007-10-25 2015-01-20 Sangamo Biosciences, Inc. Methods and compositions for targeted integration
EP2281050B1 (en) 2008-04-14 2014-04-02 Sangamo BioSciences, Inc. Linear donor constructs for targeted integration
KR20160015400A (ko) 2008-08-22 2016-02-12 상가모 바이오사이언스 인코포레이티드 표적화된 단일가닥 분할 및 표적화된 통합을 위한 방법 및 조성물
RU2557316C2 (ru) * 2008-11-04 2015-07-20 ДАУ АГРОСАЙЕНСИЗ ЭлЭлСи Brassica juncea КАЧЕСТВА ОМЕГА-9
PT2370575T (pt) 2008-12-17 2017-12-11 Dow Agrosciences Llc Integração dirigida no locus zp15
EP2206723A1 (en) 2009-01-12 2010-07-14 Bonas, Ulla Modular DNA-binding domains
US20110239315A1 (en) 2009-01-12 2011-09-29 Ulla Bonas Modular dna-binding domains and methods of use
US20110041195A1 (en) 2009-08-11 2011-02-17 Sangamo Biosciences, Inc. Organisms homozygous for targeted modification
WO2011049980A1 (en) 2009-10-19 2011-04-28 Qm Power, Inc. Parallel magnetic circuit motor
DK2501804T3 (en) * 2009-11-20 2016-07-18 Bayer Cropscience Nv Brassica plants, WHICH INCLUDES mutated FAD3 alleles
BR112012014080A2 (pt) 2009-12-10 2015-10-27 Univ Iowa State Res Found método para modificação do material genético, método para geração de um ácido nucleico, monômero de endonuclease efetora tal, método para geração de um aninal, método para geração de uma planta, método para recombinação genética direcionada, ácido nucleico, cassete de expressão e célula hospedeira
CN102433331B (zh) * 2009-12-28 2013-05-08 华中农业大学 一种甘蓝型油菜低亚麻酸分子标记及其制备方法与应用
AU2011207769B2 (en) 2010-01-22 2015-05-28 Corteva Agriscience Llc Targeted genomic alteration
PT2534173T (pt) 2010-02-08 2019-10-31 Sangamo Therapeutics Inc Semidomínios de clivagem manipulados
US9255259B2 (en) 2010-02-09 2016-02-09 Sangamo Biosciences, Inc. Targeted genomic modification with partially single-stranded donor molecules
WO2011146121A1 (en) 2010-05-17 2011-11-24 Sangamo Biosciences, Inc. Novel dna-binding proteins and uses thereof
CA2863400C (en) 2012-02-01 2022-06-14 Dow Agrosciences Llc Synthetic chloroplast transit peptides
EP2847338B1 (en) * 2012-05-07 2018-09-19 Sangamo Therapeutics, Inc. Methods and compositions for nuclease-mediated targeted integration of transgenes
UA119135C2 (uk) 2012-09-07 2019-05-10 ДАУ АГРОСАЙЄНСІЗ ЕлЕлСі Спосіб отримання трансгенної рослини
AR092482A1 (es) 2012-09-07 2015-04-22 Dow Agrosciences Llc Enriquecimiento de la clasificacion de las celulas activadas por fluorescencia (facs) para generar plantas
CN105264067B (zh) * 2012-09-07 2020-11-10 美国陶氏益农公司 Fad3性能基因座及相应的能够诱导靶向断裂的靶位点特异性结合蛋白
UA118090C2 (uk) * 2012-09-07 2018-11-26 ДАУ АГРОСАЙЄНСІЗ ЕлЕлСі Спосіб інтегрування послідовності нуклеїнової кислоти, що представляє інтерес, у ген fad2 у клітині сої та специфічний для локусу fad2 білок, що зв'язується, здатний індукувати спрямований розрив
JP5937635B2 (ja) 2014-03-28 2016-06-22 ファナック株式会社 電磁接触器の溶着検出機能を有するモータ駆動装置

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011049627A1 (en) * 2009-10-22 2011-04-28 Dow Agrosciences Llc Engineered zinc finger proteins targeting plant genes involved in fatty acid biosynthesis

Also Published As

Publication number Publication date
BR112015004995B1 (pt) 2023-05-02
AU2013312538A1 (en) 2015-03-12
CA2884162C (en) 2020-12-29
IL237567A0 (en) 2015-04-30
KR20150043540A (ko) 2015-04-22
JP2015527081A (ja) 2015-09-17
AU2013312538B2 (en) 2019-01-24
EP3406715B1 (en) 2023-12-13
ZA201501395B (en) 2017-07-26
CN105264067A (zh) 2016-01-20
IL237567B (en) 2019-01-31
JP6775953B2 (ja) 2020-10-28
JP2021035379A (ja) 2021-03-04
US10961540B2 (en) 2021-03-30
US20200087671A1 (en) 2020-03-19
HK1217732A1 (zh) 2017-01-20
EP2893006B1 (en) 2018-08-22
US20150067921A1 (en) 2015-03-05
CN105264067B (zh) 2020-11-10
NZ705745A (en) 2018-11-30
EP2893006A1 (en) 2015-07-15
US9914930B2 (en) 2018-03-13
EP2893006A4 (en) 2016-04-13
EP3406715A1 (en) 2018-11-28
AR092478A1 (es) 2015-04-22
RU2665811C2 (ru) 2018-09-04
US20180163217A1 (en) 2018-06-14
UY35019A (es) 2014-03-31
WO2014039684A1 (en) 2014-03-13
JP2018171074A (ja) 2018-11-08
US10526610B2 (en) 2020-01-07
BR112015004995A2 (pt) 2017-11-21
CA2884162A1 (en) 2014-03-13
CL2015000564A1 (es) 2015-10-02
RU2015112578A (ru) 2016-10-27

Similar Documents

Publication Publication Date Title
KR102147007B1 (ko) Fad3 성능 유전자좌 및 표적화 파단을 유도할 수 있는 상응하는 표적 부위 특이적 결합 단백질
KR102243727B1 (ko) 유전자 표적화 및 형질 스태킹을 위한 조작된 트랜스진 통합 플랫폼 (etip)
AU2013312198B2 (en) Fluorescence activated cell sorting (FACS) enrichment to generate plants
KR102631985B1 (ko) 게놈을 변형시키기 위한 조성물 및 방법
AU2018267596B2 (en) Plant regulatory elements and uses thereof
KR20200124702A (ko) 신규한 cas9 오르소로그
CN106947765B (zh) 植物调控元件及其应用
WO2020148021A1 (en) Tomato plant resistant to tomato brown rugose fruit virus
KR20170099884A (ko) Pufa 생산을 위한 물질 및 방법, 및 pufa-함유 조성물
KR20170032317A (ko) 담배 프로테아제 유전자
CN116648513A (zh) 切酶样敲除植物细胞
KR20230136600A (ko) 안정적인 세포주에서 효율적인 성장을 가능하게 하는아프리카 돼지 열병 백신의 게놈 결실
KR20230113283A (ko) 다이서-유사 넉아웃 식물 세포

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right