KR102147007B1 - Fad3 성능 유전자좌 및 표적화 파단을 유도할 수 있는 상응하는 표적 부위 특이적 결합 단백질 - Google Patents
Fad3 성능 유전자좌 및 표적화 파단을 유도할 수 있는 상응하는 표적 부위 특이적 결합 단백질 Download PDFInfo
- Publication number
- KR102147007B1 KR102147007B1 KR1020157008552A KR20157008552A KR102147007B1 KR 102147007 B1 KR102147007 B1 KR 102147007B1 KR 1020157008552 A KR1020157008552 A KR 1020157008552A KR 20157008552 A KR20157008552 A KR 20157008552A KR 102147007 B1 KR102147007 B1 KR 102147007B1
- Authority
- KR
- South Korea
- Prior art keywords
- dna
- gene
- sequence
- fad3
- plant
- Prior art date
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/82—Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
- C12N15/8216—Methods for controlling, regulating or enhancing expression of transgenes in plant cells
- C12N15/822—Reducing position variability, e.g. by the use of scaffold attachment region/matrix attachment region (SAR/MAR); Use of SAR/MAR to regulate gene expression
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/16—Hydrolases (3) acting on ester bonds (3.1)
- C12N9/22—Ribonucleases RNAses, DNAses
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01H—NEW PLANTS OR NON-TRANSGENIC PROCESSES FOR OBTAINING THEM; PLANT REPRODUCTION BY TISSUE CULTURE TECHNIQUES
- A01H5/00—Angiosperms, i.e. flowering plants, characterised by their plant parts; Angiosperms characterised otherwise than by their botanic taxonomy
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01H—NEW PLANTS OR NON-TRANSGENIC PROCESSES FOR OBTAINING THEM; PLANT REPRODUCTION BY TISSUE CULTURE TECHNIQUES
- A01H5/00—Angiosperms, i.e. flowering plants, characterised by their plant parts; Angiosperms characterised otherwise than by their botanic taxonomy
- A01H5/10—Seeds
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/66—General methods for inserting a gene into a vector to form a recombinant vector using cleavage and ligation; Use of non-functional linkers or adaptors, e.g. linkers containing the sequence for a restriction endonuclease
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/82—Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
- C12N15/8201—Methods for introducing genetic material into plant cells, e.g. DNA, RNA, stable or transient incorporation, tissue culture methods adapted for transformation
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/82—Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
- C12N15/8241—Phenotypically and genetically modified plants via recombinant DNA technology
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/82—Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
- C12N15/8241—Phenotypically and genetically modified plants via recombinant DNA technology
- C12N15/8242—Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits
- C12N15/8243—Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits involving biosynthetic or metabolic pathways, i.e. metabolic engineering, e.g. nicotine, caffeine
- C12N15/8247—Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits involving biosynthetic or metabolic pathways, i.e. metabolic engineering, e.g. nicotine, caffeine involving modified lipid metabolism, e.g. seed oil composition
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A40/00—Adaptation technologies in agriculture, forestry, livestock or agroalimentary production
- Y02A40/10—Adaptation technologies in agriculture, forestry, livestock or agroalimentary production in agriculture
- Y02A40/146—Genetically Modified [GMO] plants, e.g. transgenic plants
Abstract
세포의 FAD3 유전자에서의 위치를 부위 지정 방식으로 절단하여 FAD3 유전자에서 파단을 생성한 다음, 하나 이상의 관심 형질에 연관된 핵산 분자를 파단 내에 라이게이션함으로써 FAD3 유전자좌 내에서 유전자를 편집하거나 또는 유전자를 스택킹하는 방법이 개시된다.
Description
관련 출원에 대한 교차 참조
본원은 그의 개시내용 전문이 본원에 참조로 포함되는 2012년 9월 7일에 출원된 미국 가특허 출원 번호 61/697,854 및 그의 개시내용 전문이 본원에 참조로 포함되는 2013년 5월 7일에 출원된 미국 가특허 출원 번호 61/820,260의 이익에 대해 우선권을 청구한다.
개시내용의 분야
본 개시내용은 일반적으로 재조합 식물 기술 (예를 들어, 트랜스제닉 식물을 생성하기 위한 것)에 사용하기 위한 조성물 및 방법에 관한 것이다. 보다 구체적으로, 본 개시내용은 임의의 관심 핵산의 부위-특이적 도입에 사용될 수 있는 그의 게놈 내의 유전자좌를 포함하는 식물 세포 및 식물에 관한 것이다.
다수의 식물은 일반적으로 목적한 형질을 도입하기 위해, 예를 들어 농업상 가치를 개선하기 위해 외인성 핵산 (예를 들어, 트랜스진)으로 유전자 형질전환된다. 유전자 형질전환을 통해 달성할 수 있는 농업상 가치의 개선의 예는 개선된 영양 품질, 증가된 수율, 해충 또는 병해 저항성, 가뭄 및 스트레스 저항성, 개선된 원예학 품질 (예를 들어, 개선된 색소침착 및/또는 성장), 제초제 저항성, 식물로부터의 산업적으로 유용한 화합물 및/또는 물질의 생산, 및/또는 약제의 제조를 포함한다. 식물 세포 내로 클로닝된 유전자의 도입 및 안정한 생식력 있는 트랜스제닉 식물의 회수는 여러 세대를 통해 식물의 유전자 변형을 안정하게 하는데 사용될 수 있고, 이에 따라 작물 식물의 유전자 조작을 가능하게 한다.
유전자 형질전환 및 트랜스제닉 식물 생산 방법에서는, 외인성 DNA를 전형적으로 진핵 식물 세포의 핵 또는 색소체 DNA로 무작위로 도입한 후, 통합된 외인성 DNA를 함유하는 세포를 단리시키고, 안정하게 형질전환된 식물의 후속적인 재생이 이어진다. 트랜스제닉 식물은 전형적으로 아그로박테리움-매개 형질전환 기술에 의해 생성되었다. 이들 기술을 사용한 성공은 관심 핵산 분자를 식물의 게놈 내로 도입하기 위한 다른 방법, 예컨대 원형질체 내의 PEG-매개 DNA 흡수, 미세입자 투사법 (microprojectile bombardment), 및 규소 휘스커 (silicon whisker)-매개 형질전환의 개발을 자극하였다.
그러나, 이들 모든 식물 형질전환 방법에서, 식물 게놈에 혼입된 외인성 핵산은 식물 세포의 게놈에서 무작위로 예측불가능한 카피수로 통합된다 (Terada et al. (2002) Nat Biotechnol 20(10):1030; Terada et al. (2007) Plant Physiol 144(2):846; D'Halluin et al. (2008) Plant Biotechnology J. 6(1):93). 예를 들어, 트랜스진은 빈번하게 전체 트랜스진 또는 그의 일부의 서열 반복의 형태로 통합된다. 이러한 복합 통합 패턴은 통상적으로 통합된 핵산의 발현 수준에 유해한 영향을 미친다 (예를 들어, 전사후 유전자 침묵 메카니즘을 통한 전사 RNA의 파단에 의해, 또는 통합된 DNA의 메틸화를 유도하는 것에 의해). 또한, 통합 부위의 위치는 통합된 핵산의 발현 수준에 통상적으로 영향을 미친다. 또한, 외인성 DNA의 통합은 통합이 발생한 게놈 영역에 대한 분열 효과를 가질 수 있고, 이에 따라 표적 영역의 정상 기능에 영향을 미치거나 또는 이를 방해하여 바람직하지 않은 부작용을 생산할 수 있다. 상기를 비롯한 인자의 조합은 그것이 동일한 방법에 의해 생성된 것임에도 다양한 트랜스제닉 식물 세포 및 식물 라인들 사이에 트랜스진 또는 외인성 DNA의 발현 수준 (및 전체 농경학상 품질)에서의 광범위한 변화를 초래한다. 통합이 무작위이기 때문에, 실시자가 목적한 특징을 갖는 새로운 식물을 생산하려고 시도하지만 이들 효과는 제어할 수 없다.
상기 고려사항은, 식물 내로의 특정한 외인성 핵산의 도입의 효과가 조사될 때마다, 유의한 결과를 얻기 위해서는 다수의 트랜스제닉 식물 라인이 생성되고 분석되어야 하는 것이 필요하다. 마찬가지로, 목적한 표현형을 갖는 트랜스제닉 식물을 제공하기 위한 특정한 통합 핵산을 함유하는 트랜스제닉 식물의 생성에서는, 핵산을 최적으로 발현하고 트랜스제닉 식물의 전체 표현형 및 성능에 부작용이 최소인 또는 갖지 않는 식물 라인의 선택을 가능하게 하기 위해 독립적으로 생성된 트랜스제닉 식물 라인의 다수의 집단을 생성해야 한다. 이들 실질적인 고려사항은 다중 외인성 핵산 삽입 (즉, 유전자 스택킹)에 의해 생성된 트랜스제닉 식물에서 중요성을 더한다. 이러한 식물에서, 전사후 유전자 침묵과 같은 현상이 증폭될 수 있다.
식물에서 트랜스진 삽입을 제어하기 위한 노력으로 여러 방법이 개발되었다. 예를 들어, 문헌 [Kumar and Fladung (2001) Trends Plant Sci. 6:155-9]을 참조한다. 이들 방법은 원핵생물 및 하등 진핵생물 둘 다에 성공적으로 적용된 상동 재조합-기반 트랜스진 통합에 의존한다 (Paszkowski et al. (1988) EMBO J. 7:4021-6). 그러나, 식물에서, 최근까지 트랜스진 통합을 위한 우세한 메카니즘은 재조합 DNA 가닥들 사이에 거의 상동성을 수반하지 않는 비정규 재조합을 기초로 한다. 따라서, 이 분야의 주요 과제는 비정규 재조합을 통해 보다 훨씬 더 효율적인 통합 사례에 의해 차폐되는 드문 상동성 재조합 사례의 검출 및 선택적 생성이다. 또한, 표적화 상동 재조합 사례의 선택적 생성 및 검출이 달성될지라도, 상기 전략의 최대 이익을 실현하기 위해 사례는 숙주 게놈에서 바람직한 위치를 표적화해야 한다.
예를 들어, 표적화 유전자 형질전환의 추정되는 이익은 무작위 통합으로부터 획득된 형질전환 사례와 비교하여 트랜스진 발현의 사례-대-사례 가변성의 감소이다. 추가로 추정되는 이익은 도입된 핵산을 스크리닝하고, 형질전환 구축물을 분류하고, 생성된 트랜스제닉 식물에서 목적하는 전체 특징에 기여하는 사례를 생산하기 위해 요구되는 사례의 수의 유의한 감소이다. 이들 이익을 실현하기 위해 요구되는 중요한 인자는 트랜스진 성능이 일정하고, 가능하다면, 숙주 식물에 대한 부작용이 제거되거나 또는 최소화되는 게놈 내 특정 위치의 확인이다.
최근에, 게놈 DNA의 표적화된 절단을 위한 방법 및 조성물이 기재되었다. 이러한 표적화 절단 사례를 사용하여, 예를 들어 표적화 돌연변이유발을 유도하고, 세포성 DNA 서열의 표적화 결실을 유도하며, 미리 결정된 염색체 유전자좌에서의 표적화 재조합 및 통합을 촉진시킬 수 있다. 예를 들어, 모든 목적을 위해 그의 개시내용 전문이 본원에 참조로 포함된 문헌 [Urnov et al. (2010) Nature 435(7042):646-51] 및 미국 특허 공개 20030232410; 20050208489; 20050026157; 20050064474; 20060188987; 20090263900; 20090117617; 20100047805; 20110207221; 20110301073; 2011089775; 20110239315; 20110145940; 및 국제 공보 WO 2007/014275를 참조한다. 절단은 특이적 뉴클레아제 예컨대, 조작된 아연 핑거 뉴클레아제 (ZFN), 전사-활성화인자 유사 이펙터 뉴클레아제 (TALEN)의 사용, 또는 특이적 절단을 유도하도록 조작된 crRNA/tracr RNA ('단일 가이드 RNA')를 갖는 CRISPR/Cas 시스템의 사용을 통해 일어날 수 있다. 미국 특허 공개공보 번호 20080182332는 식물 게놈의 표적화 변형을 위한 비정규 아연 핑거 뉴클레아제 (ZFN)의 용도가 기재되어 있으며, 미국 특허 공개공보 번호 20090205083은 식물 EPSPS 유전자좌의 ZFN-매개 표적화 변형이 기재되어 있으며, 미국 특허 공개공보 번호 20100199389는 식물 Zp15 유전자좌의 표적화 변형이 기재되어 있으며, 미국 특허 공개공보 번호 20110167521은 지방산 생합성에 관여하는 식물 유전자의 표적화 변형이 기재되어 있다. 또한, 문헌 [Moehle et al. (2007) Proc. Natl. Acad, Sci. USA 104(9):3055-3060]은 명시된 유전자좌에서의 표적화된 유전자 부가를 위해 설계된 ZFN의 사용을 기재하고 있다. 미국 특허 공개 20110041195는 동형접합 이배체 유기체를 생성하는 방법을 기재하고 있다.
그러나, FAD3 유전자좌에서의 목적하는 트랜스진의 표적화 삽입을 사용한 식물의 생성을 포함하는 식물에서의 FAD3 유전자의 발현을 변형 및/또는 조절하기 위한 조성물 및 방법에 대한 필요성이 남아있다.
본 개시내용의 간단한 개요
본 개시내용은 FAD3 유전자의 발현 (예를 들어, 식물, 조류 및 진균에서)을 조절하기 위한 조성물 및 방법 및 숙주 세포 내로 관심 핵산 서열 (예를 들어, 외인성 핵산 서열)의 표적화 통합을 위한 부위로서 이들 유전자좌의 이용을 기재한다. 일부 실시양태에서, 숙주 세포는 그 중 임의의 것 또는 모두가 선택적으로 변형 및/또는 분열될 수 있는 것인 하나 이상의 FAD3 서열을 갖는 하나 이상의 게놈 (예를 들어, 동조체 및/또는 파라로그)을 함유할 수 있다. 구체적 예에서, 본 개시내용은 FAD3A, FAD3A', FAD3C' 및/또는 FAD3C 유전자, 뿐만 아니라 브라시카 나푸스(Brassica napus) (즉 비. 나푸스(B. napus ) 라인, DH12075)에서 상응하는 동조체 또는 파라로그 및 관심 핵산 서열의 표적화 통합을 위한 유전자좌로서의 그의 이용을 기재한다. 본원에 기재된 바와 같이, FAD3 유전자가 숙주에서 지방산 생합성에 관여하지만, 그의 변형 또는 분열 (예를 들어, FAD3 코딩 서열 내에 외인성 핵산의 통합에 의해)은 생성된 숙주 유기체에 대해 예상외로 부작용이 없거나 또는 최소화될 수 있다.
FAD3 유전자좌 내에 특이적 핵산 서열의 절단 및/또는 통합을 생성할 수 있는 폴리펩티드와 연계된 하나 이상의 특정한 FAD3 유전자좌의 사용이 또한 본원에 기재된다. FAD3 유전자좌의 절단 및/또는 통합을 수행할 수 있는 폴리펩티드와 연계된 FAD3 유전자좌의 사용의 예는 아연 핑거 단백질, 메가뉴클레아제, TAL 도메인, TALEN, RNA-유도 CRISPR-Cas9, 레콤비나제, 류신 지퍼, CRISPr/Cas 및 관련 기술분야에 공지되어 있는 다른 것으로 이루어진 군으로부터 선택된 폴리펩티드를 포함한다. 특정한 예는 부위-특이적 DNA 결합 도메인 폴리펩티드 및 절단 도메인 폴리펩티드 (예를 들어, 뉴클레아제)를 포함하는 키메라 ("융합") 단백질, 예컨대 아연-핑거 폴리펩티드 및 FokI 뉴클레아제 폴리펩티드를 포함하는 ZFN 단백질을 포함한다. 예를 들어, 상응하는 동조체 또는 파라로그의 절단 없이 FAD3A, FAD3A', FAD3A", FAD3C, FAD3C', FAD3C" 및 그의 조합에서 결합하여 이중 가닥 파단을 유도하도록 설계된 특정한 ZFN의 시험관내 및 생체내 효능 및 특이성의 입증이 본원에 기재된다. 일부 실시양태에서, 특정한 FAD3 유전자좌는 상기 폴리펩티드 중 임의의 것과 함께 사용되어 숙주의 농업상 성능에 대해 최소한의 유해한 영향을 가지면서 숙주에서 후속적으로 발현되는 관심 핵산의 부위-특이적 통합에 영향을 미칠 수 있다.
특정 측면에서, FAD3 유전자에 특이적으로 결합하는 DNA-결합 도메인을 포함하는 폴리펩티드가 본원에 기재된다. 일부 실시양태에서, 이러한 폴리펩티드는, 또한 폴리펩티드가 표적화 이중-가닥 파단을 유도하고/거나 파단 부위에서의 관심 핵산의 재조합을 용이하게 할 수 있도록 뉴클레아제 (절단) 도메인 또는 절반-도메인 (예를 들어, ZFN, 레콤비나제, 트랜스포사제 또는 귀소 엔도뉴클레아제, 예컨대 변형된 DNA-결합 도메인, TAL 도메인, TALEN, RNA-유도 CRISPR-Cas9를 갖는 귀소 엔도뉴클레아제), 및/또는 리가제 도메인을 포함할 수 있다. 특정한 실시양태에서, FAD3 유전자좌를 표적으로 하는 DNA-결합 도메인은 DNA-절단 기능적 도메인일 수 있다. 일부 실시양태에서, 상기 폴리펩티드는 외인성 핵산을 숙주 유기체 (예를 들어, 식물 또는 동물 종)의 게놈에 하나 이상의 FAD3 유전자좌에서 도입하여 상동 재조합을 나타내기 위해 사용될 수 있다. 특정 실시양태에서, DNA-결합 도메인은 하나 이상의 아연 핑거 (예를 들어, 2, 3, 4, 5, 6, 7, 8, 9개 또는 그 초과의 아연 핑거)를 갖는 아연 핑거 단백질을 포함하고, FAD3 유전자 내의 임의의 서열에 결합하도록 조작 (비-자연 발생)될 수 있다. 본원에 기재된 임의의 아연 핑거 단백질은 표적 유전자의 코딩 서열 내의 또는 인접한 서열 (예를 들어, 프로모터 또는 다른 발현 요소) 내의 표적 부위에 결합할 수 있다. 특정 실시양태에서, 아연 핑거 단백질은, 예를 들어 표 4에 나타낸 바와 같이, FAD3 유전자 내의 표적 부위에 결합한다. 예시적인 FAD3-결합 아연 핑거의 인식 나선 영역은 표 3에 나타낸다. 아연 핑거 단백질의 하나 이상의 성분 아연 핑거 결합 도메인은 정규 (C2H2) 아연 핑거 또는 비정규 (예컨대, C3H) 아연 핑거일 수 있다 (예를 들어, N-말단 및/또는 C-말단 아연 핑거가 비정규 핑거일 수 있음).
FAD3 유전자를 분열시키거나 또는 편집하는 방법이 또한 본원에 기재된다. 본 발명의 실시양태에 따른 방법에 의해 생성된 유전자 변형된 숙주 유기체 (예를 들어, 트랜스제닉 식물)이 본원에 추가로 기재된다. 특정한 예에서, 본 발명의 한 실시양태에 따른 방법에 의해 생성된 트랜스제닉 유기체는 제한 없이 조류, 진균, 단자엽 식물, 쌍자엽 식물 등일 수 있다.
상기 및 다른 특징은 첨부 도면을 참조로 하여 진행되는, 여러 실시양태의 하기의 상세한 설명으로부터 더욱 명백해질 것이다.
도 1, 패널 a 내지 t는 얼라인엑스(AlignX)®를 사용하여 생성된 FAD3 유전자 서열 (서열 7-12)의 서열 정렬을 나타낸 것이다.
도 2는 이웃 연결 거리에 기반한 잘뷰(Jalview) v 2.3을 사용하여 생성된 FAD3 유전자 서열의 계통발생학적 트리를 나타낸 것이다. 표지된 서열은 다음에 해당한다: FAD3A'/A"는 FAD3A'로서 본원 전반에 걸쳐 기재되고; 반수체형 2는 FAD3C'로서 본원 전반에 걸쳐 기재되고; 반수체형 1은 FAD3C"로서 본원 전반에 걸쳐 기재되고; 반수체형 3은 FAD3A"로서 본원 전반에 걸쳐 기재됨.
도 3은 pDAB107828의 플라스미드 지도를 나타낸 것이다.
도 4는 pDAB107829의 플라스미드 지도를 나타낸 것이다.
도 5는 pDAS000271의 플라스미드 지도를 나타낸 것이다.
도 6은 pDAS000272의 플라스미드 지도를 나타낸 것이다.
도 7은 pDAS000273의 플라스미드 지도를 나타낸 것이다.
도 8은 pDAS000274의 플라스미드 지도를 나타낸 것이다.
도 9는 pDAS000275의 플라스미드 지도를 나타낸 것이다.
도 10은 pDAS000031의 플라스미드 지도를 나타낸 것이다.
도 11은 pDAS000036의 플라스미드 지도를 나타낸 것이다.
도 12는 pDAS000037의 플라스미드 지도를 나타낸 것이다.
도 13은 pDAB107827의 플라스미드 지도를 나타낸 것이다.
도 14는 pDAB107828의 플라스미드 지도를 나타낸 것이다.
도 15는 pDAS000340의 플라스미드 지도를 나타낸 것이다.
도 16은 pDAS000341의 플라스미드 지도를 나타낸 것이다.
도 17은 pDAS000342의 플라스미드 지도를 나타낸 것이다.
도 18은 pDAS000343의 플라스미드 지도를 나타낸 것이다.
도 19는 Fad3C의 개시 및 정지 코돈과 관련하여 프라이머 및 그의 위치의 위치를 나타낸 개략도이다. 패널 a는 야생형 Fad3C 유전자좌에 대한 프라이머 부위의 위치를 나타낸 것이다. 패널 b는 공여자 통합을 확인하기 위한 프라이머 부위의 위치, 및 공여자가 Fad3C 유전자좌 내에 통합될 수 있는 가능한 배향을 나타낸 것이다.
도 20, 패널 A 및 B는 지시된 ZFN 및 공여자 플라스미드를 갖는 변형 후의 서열 정렬을 나타낸 것이다. 도 20a는 ZFN 28051-2A-28052에 의해 인식되는 이중 가닥 파단에서 Fad3C와 pDAS000341의 tGFP 카세트의 접합부로부터 증폭된 서열 정렬을 나타낸 것이다. ":"는 절단 부위에 위치하는 결실을 나타낸 것이다. 서열 300 내지 서열 313이 이 정렬에 제시된다. 도 20b는 ZFN 28051-2A-28052 및 ZFN 28053-2A-28054에 의해 인식되는 이중 가닥 파단에서 Fad3C와 pDAS000343의 tGFP 카세트의 접합부로부터 증폭된 서열 정렬을 나타낸 것이다. ":"는 절단 부위에 위치하는 결실을 나타낸 것이다. 서열 314 내지 서열 327이 이 정렬에 제시된다.
도 21, 패널 A 및 B는 ZFN 28051-2A-28052에 의해 인식되는 이중 가닥 파단에서 FAD3C와 pDAS000340의 hph 카세트의 접합부로부터 증폭된 서열의 서열 정렬을 나타낸 것이다. "샘플"은 분석된 각각의 식물에 대한 고유 식별자이다. ":"는 절단 부위에 위치하는 결실을 나타낸 것이다. 도 21a에 나타낸 서열은 5' 접합부에 대한 것이고, 도 21b에 나타낸 서열은 3' 접합부에 대한 것이다. 서열 368 내지 서열 375가 도 21a의 정렬에 제시된다. 서열 376 내지 서열 377이 도 21b의 정렬에 제시된다.
도 22는 ZFN 28053-2A-28054에 의해 인식되는 이중 가닥 파단에서 FAD3C과 pDAS000342의 hph 카세트의 접합부로부터 증폭된 서열의 서열 정렬을 나타낸 것이다. "샘플"은 분석된 각각의 식물에 대한 고유 식별자이다. ":"는 절단 부위에 위치하는 결실을 나타낸 것이다. 도 22에 나타낸 서열은 3' 접합부에 대한 것이다. 서열 378 내지 서열 379가 이 정렬에 제시된다.
도 23, 패널 a 및 b는 ZFN 28051-2A-28052에 의해 인식되는 이중 가닥 파단에서 FAD3C와 pDAS000340의 hph 카세트의 접합부로부터 증폭된 서열의 서열 정렬을 나타낸 것이다. ":"는 절단 부위에 위치하는 결실을 나타낸다. 도 23a에 나타낸 서열은 5' 접합부에 대한 것이고, 박스 (B)에 나타낸 서열은 3' 접합부에 대한 것이다. 서열 328 내지 서열 334이 도 23a의 정렬에 제시된다. 서열 335 내지 서열 342가 도 23b의 정렬에 제시된다.
도 24, 패널 a 및 b는 ZFN 28053-2A-28054에 의해 인식되는 이중 가닥 파단에서 FAD3C와 pDAS000342의 hph 카세트의 접합부로부터 증폭된 서열의 서열 정렬을 나타낸다. ":"는 절단 부위에 위치하는 결실을 나타낸다. 도 24a에 나타낸 서열은 5' 접합부에 대한 것이고, 도 24b에 나타낸 서열은 3' 접합부에 대한 것이다. 서열 343 내지 서열 346이 도 24a의 정렬에 제시된다. 서열 347 내지 서열 351이 도 24b의 정렬에 제시된다.
도 2는 이웃 연결 거리에 기반한 잘뷰(Jalview) v 2.3을 사용하여 생성된 FAD3 유전자 서열의 계통발생학적 트리를 나타낸 것이다. 표지된 서열은 다음에 해당한다: FAD3A'/A"는 FAD3A'로서 본원 전반에 걸쳐 기재되고; 반수체형 2는 FAD3C'로서 본원 전반에 걸쳐 기재되고; 반수체형 1은 FAD3C"로서 본원 전반에 걸쳐 기재되고; 반수체형 3은 FAD3A"로서 본원 전반에 걸쳐 기재됨.
도 3은 pDAB107828의 플라스미드 지도를 나타낸 것이다.
도 4는 pDAB107829의 플라스미드 지도를 나타낸 것이다.
도 5는 pDAS000271의 플라스미드 지도를 나타낸 것이다.
도 6은 pDAS000272의 플라스미드 지도를 나타낸 것이다.
도 7은 pDAS000273의 플라스미드 지도를 나타낸 것이다.
도 8은 pDAS000274의 플라스미드 지도를 나타낸 것이다.
도 9는 pDAS000275의 플라스미드 지도를 나타낸 것이다.
도 10은 pDAS000031의 플라스미드 지도를 나타낸 것이다.
도 11은 pDAS000036의 플라스미드 지도를 나타낸 것이다.
도 12는 pDAS000037의 플라스미드 지도를 나타낸 것이다.
도 13은 pDAB107827의 플라스미드 지도를 나타낸 것이다.
도 14는 pDAB107828의 플라스미드 지도를 나타낸 것이다.
도 15는 pDAS000340의 플라스미드 지도를 나타낸 것이다.
도 16은 pDAS000341의 플라스미드 지도를 나타낸 것이다.
도 17은 pDAS000342의 플라스미드 지도를 나타낸 것이다.
도 18은 pDAS000343의 플라스미드 지도를 나타낸 것이다.
도 19는 Fad3C의 개시 및 정지 코돈과 관련하여 프라이머 및 그의 위치의 위치를 나타낸 개략도이다. 패널 a는 야생형 Fad3C 유전자좌에 대한 프라이머 부위의 위치를 나타낸 것이다. 패널 b는 공여자 통합을 확인하기 위한 프라이머 부위의 위치, 및 공여자가 Fad3C 유전자좌 내에 통합될 수 있는 가능한 배향을 나타낸 것이다.
도 20, 패널 A 및 B는 지시된 ZFN 및 공여자 플라스미드를 갖는 변형 후의 서열 정렬을 나타낸 것이다. 도 20a는 ZFN 28051-2A-28052에 의해 인식되는 이중 가닥 파단에서 Fad3C와 pDAS000341의 tGFP 카세트의 접합부로부터 증폭된 서열 정렬을 나타낸 것이다. ":"는 절단 부위에 위치하는 결실을 나타낸 것이다. 서열 300 내지 서열 313이 이 정렬에 제시된다. 도 20b는 ZFN 28051-2A-28052 및 ZFN 28053-2A-28054에 의해 인식되는 이중 가닥 파단에서 Fad3C와 pDAS000343의 tGFP 카세트의 접합부로부터 증폭된 서열 정렬을 나타낸 것이다. ":"는 절단 부위에 위치하는 결실을 나타낸 것이다. 서열 314 내지 서열 327이 이 정렬에 제시된다.
도 21, 패널 A 및 B는 ZFN 28051-2A-28052에 의해 인식되는 이중 가닥 파단에서 FAD3C와 pDAS000340의 hph 카세트의 접합부로부터 증폭된 서열의 서열 정렬을 나타낸 것이다. "샘플"은 분석된 각각의 식물에 대한 고유 식별자이다. ":"는 절단 부위에 위치하는 결실을 나타낸 것이다. 도 21a에 나타낸 서열은 5' 접합부에 대한 것이고, 도 21b에 나타낸 서열은 3' 접합부에 대한 것이다. 서열 368 내지 서열 375가 도 21a의 정렬에 제시된다. 서열 376 내지 서열 377이 도 21b의 정렬에 제시된다.
도 22는 ZFN 28053-2A-28054에 의해 인식되는 이중 가닥 파단에서 FAD3C과 pDAS000342의 hph 카세트의 접합부로부터 증폭된 서열의 서열 정렬을 나타낸 것이다. "샘플"은 분석된 각각의 식물에 대한 고유 식별자이다. ":"는 절단 부위에 위치하는 결실을 나타낸 것이다. 도 22에 나타낸 서열은 3' 접합부에 대한 것이다. 서열 378 내지 서열 379가 이 정렬에 제시된다.
도 23, 패널 a 및 b는 ZFN 28051-2A-28052에 의해 인식되는 이중 가닥 파단에서 FAD3C와 pDAS000340의 hph 카세트의 접합부로부터 증폭된 서열의 서열 정렬을 나타낸 것이다. ":"는 절단 부위에 위치하는 결실을 나타낸다. 도 23a에 나타낸 서열은 5' 접합부에 대한 것이고, 박스 (B)에 나타낸 서열은 3' 접합부에 대한 것이다. 서열 328 내지 서열 334이 도 23a의 정렬에 제시된다. 서열 335 내지 서열 342가 도 23b의 정렬에 제시된다.
도 24, 패널 a 및 b는 ZFN 28053-2A-28054에 의해 인식되는 이중 가닥 파단에서 FAD3C와 pDAS000342의 hph 카세트의 접합부로부터 증폭된 서열의 서열 정렬을 나타낸다. ":"는 절단 부위에 위치하는 결실을 나타낸다. 도 24a에 나타낸 서열은 5' 접합부에 대한 것이고, 도 24b에 나타낸 서열은 3' 접합부에 대한 것이다. 서열 343 내지 서열 346이 도 24a의 정렬에 제시된다. 서열 347 내지 서열 351이 도 24b의 정렬에 제시된다.
서열 목록
핵산 서열은 37 C.F.R. § 1.822에 정의된 바와 같은 뉴클레오티드 염기에 대한 표준 문자 약어를 사용하여 나타낸다. 각 핵산 서열의 단지 하나의 가닥을 나타내었지만, 상보적 가닥은 표시된 가닥을 임의로 참조하여 포함된다는 것이 이해된다.
상세한 설명
I. 여러 실시양태의 개관
본 발명의 실시양태는 통합된 핵산에 의해 영향을 받은 것 이외에 숙주의 다른 표현형에 크게 유해한 영향을 미치지 않는 숙주 게놈에서 외인성 핵산 (예를 들어, 트랜스진)의 표적화 통합에 대한 접근법을 확립한다. 일부 실시양태는 단일 숙주 게놈에서의 다중 핵산 "스택킹"에 사용될 수 있다. 이러한 접근법은 4가지의 상호연결 기술: 특이적 게놈 DNA 위치에서의 이중 가닥 파단의 도입을 허용하는 표적화 기술 (예를 들어, 문헌 [Puchta et al. (1993) Nucleic Acids Res. 21:5034-40; Siebert and Puchta (2002) Plant Cell 14:1121-31; D'Halluin et al. (2008) Plant Biotechnol. J. 6(1):93-102; Cai et al. (2009) Plant Mol. Biol. 69(6):699-709; Shukla et al. (2009) Nature 459(7245):437-41); Shan et al. (2103) Nature Biotechnol. 31:686-680; Le et al. (2013) Nature Biotechnol 31: 688-691; Nekrasov et al. (2013) Nature Biotechnol. 31:691-693, Ainely et al. (2013) Plant Biotechnol. J. (On Line 19 Aug)] 참조); 최적화된 외인성 (공여자) 핵산의 전달을 허용하는 전달 기술 (Bibikova et al. (2003) Science 300(5620):764); 표적화 공여자 DNA 통합을 위한 HDR 또는 NHEJ 빈도를 증가시키기 위한 숙주 유전자의 변형 (상동 재조합 또는 NHEJ 경로에 위치함)을 포함하는 통합 기술; 표적화 통합 사건을 풍부화 및 특성화하는 분석 툴; 및 형질전환된 숙주 유기체에 대해 크게 유해한 영향을 미치지 않고 세대에 걸쳐 유전학적으로 잘 정해지고 안정한 유전자 발현을 지지하는 목적한 특이적 숙주 게놈 위치 ("성능 유전자좌")의 개발 및 전개를 사용한다. 또한, 미국 특허 공개 20030232410; 20050208489; 20050026157; 20050064474; 20060188987; 20090263900; 20090117617; 20100047805; 20110207221; 20110301073; 2011089775; 20110239315; 20110145940; 20080182332; 20090205083; 20100199389; 20110167521을 참조한다. 예를 들어, 식물에서, 성능 유전자좌는 트랜스진이 유전자좌에 삽입된 트랜스제닉 식물의 농경학상 또는 품질 특성에 대한 부정적인 영향이 무시할 정도인 또는 존재하지 않는 유전자좌이다.
본원에 기재된 실시양태는 식물 FAD3 유전자가 외인성 핵산 (예를 들어, 유전자(들); 비-코딩 DNA 서열, 예컨대 조작된 랜딩 Pad (ELP) (미국 출원 12/011,735) 및 조작된 트랜스진 삽입 플랫폼 (ETIP) (출원중인 미국 출원 번호 61/697882); 및 식물 형질전환 유닛(들))의 표적화 삽입을 위한 성능 유전자좌라는 예상치 못한 발견의 이점을 이용한다. 식물의 FAD3 유전자좌의 보편적인 특성, 및 카놀라, 옥수수, 해바라기, 밀, 목화 및 대두에서의 FAD3의 변경 또는 녹-아웃이 농경학상 또는 품질 페널티를 수반하지 않는다는 증거는 FAD3 유전자좌가 상업적으로-관련된 식물 종에 걸친 광범위한 부류의 성능 유전자좌임을 확인시킨다.
일부 실시양태는, 예를 들어 표적-부위 특이적 DNA 인식 및 절단 단백질의 전달 및 발현에 기인한 FAD3 유전자좌에서의 부위-특이적 이중-가닥 DNA 절단을 이용한다. 구체적 예에서, 이러한 FAD3-특이적 DNA 인식 및 절단 단백질은, 예를 들어 제한 없이 ZFN; TALEN; RNA-유도 CRISPR-Cas9 시스템, 레콤비나제 (예를 들어, Cre, Hin, RecA, Tre 및 FLP 레콤비나제); 메가뉴클레아제 및 상기 중 임의의 것 또는 그의 등가물로부터 유래하는 조작된 단백질일 수 있다. 절단은 특이적 절단을 유도하기 위해 조작된 crRNA/tracr RNA ('단일 가이드 RNA')를 갖는 CRISPR/Cas 시스템을 사용하여 또한 수행할 수 있다. 일부 실시양태에서, 이러한 이중-가닥 파단은 FAD3 성능 유전자좌 내에, 예를 들어 상동성 지정 복구 (HDR) 또는 비-상동성 말단 연결 (NHEJ)에 의해 절단 부위로의 공여자 핵산의 통합을 통해 복구될 수 있다.
본 개시내용은, 예를 들어 카놀라 (브라시카 나푸스)의 FAD3A 또는 3C 유전자좌 및 FAD3A 또는 3C 유전자좌에 외인성 핵산을 통합하기 위해 이용될 수 있는 상응하는 FAD3-특이적 ZFN을 기재함으로써 성능 유전자좌로서의 FAD3 유전자좌의 유용성을 예시한다.
본 발명의 실시양태는 관련 기술분야에서 다수의 해결되지 않은 문제를 다룬다. 예를 들어, 본원에 기재된 표적화 통합 접근법의 선택성은 원치 않는 트랜스제닉 사례의 제거에 요구되는, 이 분야에 관련된 자원 및 힘든 규제 요건으로 인한 값비싼 반복되는 실지 시험의 필요성을 감소시키거나 또는 제거할 수 있다. 또한, 본원에 기재된 표적화된 DNA 삽입 접근법은 트랜스진 스택킹의 과정에서 특히 유익할 수 있다.
내인성 FAD3 유전자좌에서의 천연 뉴클레오티드 서열이 관심 핵산을 직접적으로 표적으로 하는데 사용될 수 있지만, 일부 실시양태에서 숙주로의 추가의 관심 핵산 분자의 통합이 용이해지도록, 핵산은 먼저 숙주의 적어도 하나의 FAD3 유전자좌를 표적으로 할 수 있다. 다른 예에서, 숙주 유기체의 천연 서열 (예를 들어, 본질적으로 무작위로 발생된 핵산 서열)과 상동이 아니고 DNA 인식 부위 (예를 들어, 아연 핑거 인식 부위)에 플랭킹된 뉴클레오티드 서열이 이용될 수 있다.
II. 용어
특허청구범위를 포함하여 본원에 사용된 바와 같은 단수 및 단수 형태의 용어 (예를 들어, "a," "an," 및 "the")는 그 내용이 달리 명백하게 나타내지 않는 한 복수 지시대상을 포함한다. 따라서, 예를 들어 "식물" ("plant," "the plant," 또는 "a plant")은 또한 다수의 식물을 지칭한다. 또한, 문맥에 따라, 용어 "식물"의 사용은 또한 그 식물의 유전적으로 유사하거나 또는 동일한 자손을 지칭할 수 있다. 유사하게, 용어 "핵산"은 핵산 분자의 다수의 카피를 지칭할 수 있다. 마찬가지로, 용어 "프로브"은 다수의 유사하거나 또는 동일한 프로브 분자를 지칭할 수 있다.
수치 범위는 범위를 한정하는 수를 포함하고, 한정 범위 내의 각각의 정수 및 비-정수 부분을 명백하게 포함한다. 달리 정의되지 않는 한, 본원에서 사용된 모든 전문 과학 용어는 통상의 기술자에 의해 통상적으로 이해되는 것과 동일한 의미를 갖는다.
본 개시내용에 기재된 다양한 실시양태에 관한 검토를 용이하게 하기 위해, 구체적인 용어의 다음 설명을 제공한다.
단리된: "단리된" 생물학적 성분 (예컨대 핵산 또는 단백질)은 성분의 화학적 또는 기능적 변화를 초래하면서 (예를 들어, 핵산은 핵산을 염색체의 나머지 DNA에 연결시키는 화학 결합을 파단하는 것에 의해 염색체로부터 단리될 수 있음), 그 성분이 자연 발생하는 유기체 세포의 다른 생물학적 성분 (즉, 다른 염색체 및 염색체-외 DNA 및 RNA 및 단백질)로부터 실질적으로 분리되거나, 분리되어 생성되거나, 또는 정제 분리된다. "단리된" 핵산 분자 및 단백질은 표준 정제 방법에 의해 정제된 핵산 분자 및 단백질을 포함한다. 또한, 이 용어는 숙주 세포에서 재조합 발현에 의해 제조된 핵산 및 단백질, 뿐만 아니라 화학적으로 합성된 핵산 분자, 단백질 및 펩티드를 포함한다.
교배시킨다: 식물에 관하여 본원에 사용된 바와 같은 용어 "교배시킨다" 또는 "교배시킨"은 자손 (예를 들어, 세포, 종자 및 식물)을 생산하기 위한 수분을 통한 배우자의 융합를 지칭한다. 이 용어는 유성 교배 (즉, 또 다른 것에 의한 하나의 식물의 수분) 및 자가 수분 (즉, 예를 들어 동일한 식물로부터의 화분 및 배주를 사용한 자가-수분) 둘 다를 포함한다.
역교배: 역교배 방법을 사용하여 핵산 서열을 식물에 도입할 수 있다. 이 기술은 신규 형질을 식물에 도입하기 위해 수십년 동안 널리 사용되어 왔다 (Jensen, N., Ed. Plant Breeding Methodology, John Wiley & Sons, Inc., 1988). 전형적인 역교배 프로토콜에서, 원래의 관심 품종 (반복친)을 이동시킬 관심 핵산 서열을 보유하는 제2 품종 (비-반복친)에 교배시킨다. 상기 교배로부터 생성되는 자손체는 이어서 다시 반복친과 교배되고, 이 과정을, 전환된 식물에서 반복친의 필수적으로 모든 목적하는 형태학적 및 생리학적 특징 뿐만 아니라 비-반복친으로부터의 핵산 서열이 복구되는 전환된 식물이 얻어질 때까지 반복된다.
유전자이입: 본원에 사용된 바와 같은 용어 "유전자이입"은 특정한 유전자좌에서 유전적 배경으로 대립유전자 (또는 외인성 핵산을 포함하는 변형된 대립유전자)의 전달을 지칭한다. 일부 실시양태에서, 유전자좌에서의 특정한 대립유전자의 유전자이입은 동일한 종의 2가지 모 사이의 유성 교배를 통해 대립유전자를 적어도 하나의 자손으로 전달함으로써 발생할 수 있고, 여기서 모 중 적어도 하나는 그의 게놈에서 특정한 대립유전자 형태를 갖는다. 특정한 대립유전자를 포함하는 자손은 바람직한 유전적 배경을 갖는 라인에 대해서 반복해서 역교배될 수 있다. 역교배 자손은 특정한 대립유전자 형태가 유전적 배경에서 고정되어 있는 새로운 품종을 생성하기 위해, 특정한 대립유전자 형태에 대해 선택될 수 있다. 일부 실시양태에서, 특정한 대립유전자의 유전자이입은 2가지 공여자 게놈 (예를 들어, 융합된 원형질체에서) 사이의 재조합에 의해 발생할 수 있고, 여기서 공여자 게놈 중 적어도 하나는 그의 게놈에서 특정한 대립유전자 형태를 갖는다. 유전자이입은, 예를 들어 제한 없이 분열 또는 변형된 대립유전자; 트랜스진; PTU; 및 ELP일 수 있는 특정한 대립유전자 형태의 전달을 포함할 수 있다.
생식질: 본원에 사용된 바와 같은 용어 "생식질"은 개별 식물, 식물의 군 (예를 들어, 식물 라인, 품종 및 패밀리) 및 식물 또는 식물의 군으로부터 유래한 클론의 또는 그로부터의 유전 물질을 지칭한다. 생식질은 유기체 또는 세포의 일부일 수 있거나, 유기체 또는 세포로부터 분리될 수 있다 (예를 들어, 단리됨). 일반적으로, 생식질은 식물의 유전성 품질을 위한 기준인 특정한 분자 구성을 갖는 유전 물질을 제공한다. 본원에 사용된 바와 같은 "생식질"은 특정한 식물의 세포; 종자; 특정한 식물의 조직 (예를 들어, 그로부터 새로운 식물이 성장할 수 있는 조직); 특정한 식물의 비-종자 부분 (예를 들어, 잎, 줄기, 수분 및 세포)을 지칭한다. 본원에 사용된 바와 같은 용어 "생식질"은 "유전 물질"과 동의어이고, 식물이 그로부터 전파될 수 있는 종자 (또는 다른 식물 물질)를 지칭하는데 사용될 수 있다. 그로부터 공지된 재배품종이 배양될 수 있고, 그로부터 새로운 재배품종이 생성될 수 있는 "생식질 은행"은 다양한 종자 또는 다른 유전 물질 (여기서 각각의 유전자형이 고유하게 확인됨)의 조직화된 콜렉션을 지칭할 수 있다.
유전자: 본원에 사용된 바와 같은 용어 "유전자" (또는 "유전 요소")는 기능적 중요성을 갖는 유전가능한 게놈 DNA 서열을 지칭할 수 있다. 유전자는 본래 핵산 또는 게놈에 통합된 핵산일 수 있다. 용어 "유전자"는 또한, 예를 들어 제한 없이 유전가능한 게놈 DNA 서열에 의해 코딩된 cDNA 및/또는 mRNA를 지칭하는데 사용될 수 있다.
핵산 분자: 본원에 사용된 바와 같은 용어 "핵산 분자"는 뉴클레오티드 (즉 리보뉴클레오티드, 데옥시리보뉴클레오티드, 및/또는 상기 중 어느 하나의 변형된 형태)의 중합체 형태를 지칭할 수 있다. 본원에 사용된 바와 같은 "핵산 분자"는 "핵산" 및 "폴리뉴클레오티드"와 동의어이다. 용어는 RNA, cDNA, 게놈 DNA의 센스 및 안티센스 가닥 둘 다, 및 그의 합성 형태 및 혼합된 중합체를 포함한다. 용어는 단일-가닥, 이중-가닥, 부분적으로 이중체화된, 삼중체화된, 헤어핀, 환상 및 잠긴 입체형태를 비롯한 임의의 구조적 입체형태를 포함한다. 핵산 분자는 자연 발생 및 변형된 뉴클레오티드 중 하나 또는 둘 다를 포함할 수 있다. 이러한 뉴클레오티드는 자연 발생 및/또는 비-자연 발생 뉴클레오티드 연결에 의해 함께 연결될 수 있다.
통상의 기술자에 의해 용이하게 이해되는 바와 같이, 핵산 분자는 화학적으로 또는 생화학적으로 변형될 수 있거나, 또는 유도체화된 뉴클레오티드 염기를 함유할 수 있다. 상기 변형은, 예를 들어 제한 없이 표지, 메틸화, 자연 발생 뉴클레오티드 중 하나 이상을 유사체로 치환, 뉴클레오티드간 변형 (예를 들어, 비하전된 연결, 예를 들어 메틸 포스포네이트, 포스포트리에스테르, 포스포르아미데이트 및 카르바메이트; 하전된 연결, 예를 들어 포스포로티오에이트 및 포스포로디티오에이트; 펜던트 모이어티, 예를 들어 펩티드; 삽입제, 예를 들어 아크리딘 및 프소랄렌; 킬레이트화제; 알킬화제; 및 변형된 연결, 예를 들어 알파 아노머 핵산)을 포함한다.
외인성: "외인성" 분자는 폴리뉴클레오티드의 뉴클레오티드 서열 및/또는 게놈 위치 (즉, 유전자좌)와 관련하여 (및 폴리펩티드의 아미노산 서열 및/또는 세포 위치와 관련하여) 특정한 시스템 (예를 들어, 생식질, 변종, 선발 변종 및/또는 식물)에 천연이 아닌 분자이다. 실시양태에서, 외인성 또는 이종성 폴리뉴클레오티드 또는 폴리펩티드는 생물계 (예를 들어, 식물 세포, 식물 유전자, 특정한 식물 종 또는 품종, 및/또는 식물 염색체)에 인공적으로 공급되었고 이러한 특정한 생물계에 대해 천연이 아닌 분자일 수 있다. 따라서, 핵산을 "외인성"으로 지정하는 것은 핵산이 자연 발생 공급원 이외의 공급원으로부터 유래되었음을 가리킬 수 있거나, 또는 핵산이 비-천연의 배향, 유전자 위치, 또는 요소 배열을 갖는 것을 가리킬 수 있다.
반면, 예를 들어 "천연" 또는 "내인성" 핵산은 자연에서 정상적으로 핵산이 발견되는 염색체 또는 다른 유전 물질에 정상적으로 존재하는 것들이 아닌 다른 핵산 요소는 함유하지 않는 핵산 (예컨대 유전자)이다. 내인성 유전자 전사체는 그의 천연 염색체 유전자좌의 뉴클레오티드 서열에 의해 코딩되고, 인공적으로 세포에 공급되지 않는다.
작동가능하게 연결된: 제1 핵산 서열이 제2 핵산 서열과 기능적 관계에 있을 때, 제1 뉴클레오티드 서열은 제2 핵산 서열과 작동가능하게 연결되어 있는 것이다. 예를 들어, 프로모터는 프로모터가 코딩 서열의 전사 또는 발현에 영향을 줄 때 코딩 서열과 작동가능하게 연결된 것이다. 재조합 방식으로 생산될 때, 작동가능하게 연결된 핵산 서열은 일반적으로 인접하고, 2개의 단백질-코딩 영역을 연결하기 위해 필요한 경우에 동일한 리딩 프레임에 존재한다. 그러나, 요소들이 작동가능하게 연결되기 위해 인접할 필요는 없다.
프로모터: 프로모터는 일반적으로 핵산의 전사를 증진시키는 핵산의 상류 (5' 영역 방향으로) 위치한 DNA의 영역이다. 프로모터는 작동가능하게 연결된 핵산(들)의 적절한 활성화 또는 억제를 허용한다. 프로모터는 전사 인자에 의해 인식되는 특정 서열을 함유한다. 이들 인자는 프로모터 DNA 서열에 결합하여 핵산의 코딩 영역으로부터 RNA를 합성하는 효소인 RNA 폴리머라제의 동원을 유도한다. 형질전환된: 벡터가 핵산 분자를 세포로 전달할 때 벡터는 세포를 "형질전환시킨다" 또는 "형질도입시킨다". 세포는 핵산 분자가 핵산 분자의 세포 게놈 내로의 도입에 의해 또는 에피솜 복제에 의해 세포에 의해 안정하게 복제될 때 핵산 분자에 의해 "형질전환"된 것이다. 본원에 사용된 바와 같은 용어 "형질전환"은 핵산 분자를 상기 세포 내로 도입할 수 있는 모든 기술을 포함한다. 예는 바이러스 벡터를 사용한 형질감염; 플라스미드 벡터를 사용한 형질전환; 전기천공 (Fromm et al. (1986) Nature 319:791-3); 리포펙션 (Felgner et al. (1987) Proc. Natl. Acad. Sci. USA 84:7413-7); 미세주사 (Mueller et al. (1978) Cell 15:579-85); 아그로박테리움-매개 전달 (Fraley et al. (1983) Proc. Natl. Acad. Sci. USA 80:4803-7); 직접 DNA 흡수; 및 미세입자 투사법 (Klein et al. (1987) Nature 327:70)을 포함하지만, 이에 제한되지는 않는다.
도입된: 본원에 사용된 바와 같은 용어 "도입된"은 세포 내로의 외인성 핵산의 전위에 관해 언급할 때, 관련 기술분야에서 이용가능한 임의의 방법론을 사용하는 핵산의 세포 내로의 혼입을 지칭한다. 이 용어는, 예를 들어 제한 없이 형질감염; 형질전환; 및 형질도입을 포함하는 핵산 도입 방법을 포함한다.
트랜스진: 본원에 사용된 바와 같은 용어 "트랜스진"은 관심 외인성 핵산 코딩 서열을 지칭한다. 예를 들어, 트랜스진은 산업적으로 또는 제약상 유용한 화합물 또는 바람직한 농업상 형질 (예를 들어, 제초제 저항성 또는 해충 저항성)에 기여하는 발현 산물을 코딩할 수 있다. 추가의 예에서, 트랜스진은 안티센스 핵산의 발현을 통해 표적 핵산 서열의 발현이 억제되는 것인, 안티센스 핵산일 수 있다. 트랜스진은 트랜스진에 작동가능하게 연결된 조절 서열 (예를 들어, 프로모터)을 포함할 수 있다. 일부 실시양태에서, FAD3 유전자좌에서의 부위-특이적 표적화에 의해 도입되는 관심 핵산 분자는 트랜스진이다. 그러나, 다른 실시양태에서, 관심 핵산 분자는 PTU, ELP, ETIP 또는 내인성 핵산 서열 (예를 들어, 여기서 내인성 핵산 서열의 추가의 외인성 게놈 카피가 바람직함)일 수 있다.
요소는 또한 구조적 RNA, 예컨대 shRNA를 코딩하는 DNA를 포함할 수 있다. 이러한 RNA는 제초제 저항성을 개시하거나 또는 부여하는데 영향을 미치는 것을 포함하지만 이에 제한되지 않는 외인성 또는 내인성 유전자를 변형시킬 수 있다.
재조합: 본원에 사용된 바와 같은 용어 "재조합"은 인간 개입에 의해 변경된 물질 (예를 들어, 핵산, 유전자, 폴리뉴클레오티드 및/또는 폴리펩티드)를 지칭한다. 예를 들어, 그의 발현 및/또는 활성을 최적화하기 위해, 예를 들어 재조합 분자의 부분 또는 요소의 배열이 그의 천연 배열이 아닐 수 있고/거나 재조합 분자의 일차 서열이 그의 천연 서열로부터 변화될 수 있다. 물질은 그의 천연 환경 또는 상태 내에서 재조합 물질을 생성하도록 변경될 수 있거나 또는 그로부터 제거될 수 있다. 한 예로서, 핵산의 오픈 리딩 프레임은, 오픈 리딩 프레임의 뉴클레오티드 서열이 그 천연 상황으로부터 제거되어, 인공 핵산 분자 (예를 들어, 벡터) 내로 클로닝되는 경우에 재조합된 것이다. 재조합 분자 (예를 들어, 재조합 핵산)을 생산하기 위한 프로토콜 및 시약은 관련 기술분야에서 일반적이고, 그의 용도는 일상적이다. 용어 "재조합"은 또한 본원에서 재조합 물질을 포함하는 세포 또는 유기체 (예를 들어, 재조합 핵산을 포함하는 식물 및/또는 식물 세포)를 지칭할 수 있다. 일부 예에서, 재조합 유기체는 트랜스제닉 유기체이다.
벡터: 본원에 사용된 바와 같은 용어 "벡터"는 적어도 하나의 핵산 절편(들)을 세포 내로 전달할 수 있는 폴리뉴클레오티드 또는 다른 분자를 지칭한다. 벡터는 벡터 유지를 매개하고/거나 그의 의도된 용도를 가능하게 하는 성분/요소 (예를 들어, 복제를 위해 필요한 서열, 약물 또는 항생제 저항성을 부여하는 유전자, 다중 클로닝 부위, 및/또는 클로닝된 유전자의 발현을 가능하게 하는 작동가능하게 연결된 프로모터/인핸서 요소)를 임의로 포함할 수 있다. 벡터는, 예를 들어 플라스미드, 박테리오파지 또는 식물 또는 동물 바이러스로부터 유래할 수 있다. "클로닝 벡터", "셔틀 벡터" 또는 "서브클로닝 벡터"는 클로닝 또는 서브클로닝 단계를 용이하게 하기 위해 작동가능하게 연결된 요소 (예를 들어, 다중 제한 엔도뉴클레아제 부위를 함유하는 다중 클로닝 부위)를 일반적으로 포함한다.
발현 벡터: 본원에 사용된 바와 같은 용어 "발현 벡터"는 특정한 숙주 유기체에서 코딩 서열의 발현을 용이하게 할 수 있는 작동가능하게 연결된 폴리뉴클레오티드 서열을 포함하는 벡터를 지칭한다. 예를 들어, 박테리아 발현 벡터는 박테리아에서 코딩 서열의 발현을 용이하게 할 수 있다. 마찬가지로, 식물 발현 벡터는 식물 세포에서 코딩 서열의 발현을 용이하게 할 수 있다. 원핵생물에서 발현을 용이하게 하는 폴리뉴클레오티드 서열은, 예를 들어 제한 없이 프로모터; 오퍼레이터; 및 리보솜 결합 부위를 포함할 수 있다. 진핵 발현 벡터 (예를 들어, 식물 발현 벡터)는, 예를 들어 프로모터; 인핸서; 종결 신호; 및 일반적으로 원핵 발현 벡터에서 사용된 것과 상이한 폴리아데닐화 신호 (및 다른 서열)을 포함할 수 있다.
서열 동일성: 2개의 핵산 또는 폴리펩티드 서열과 관련하여 본원에 사용된 바와 같은 용어 "서열 동일성" 또는 "동일성"은 명시된 비교창에 대해 최대로 상응하도록 정렬하였을 때, 2개의 서열 중의 동일한 잔기를 지칭한다. 서열 동일성의 값은 비교창에 대해 2개의 최적화로 정렬된 서열 (예를 들어, 핵산 서열 및 아미노산 서열)을 비교함으로써 결정할 수 있고, 여기서 비교창 내의 서열의 일부는 2개의 서열의 최적 정렬을 위해 참조 서열 (첨가 또는 결실을 포함하지 않는 것)에 비해 첨가 또는 결실 (즉, 갭)을 포함할 수 있다. 서열 동일성은 동일한 뉴클레오티드 또는 아미노산 잔기가 서열 둘 다에 존재하는 위치의 개수를 결정함으로써 매칭되는 위치의 개수를 구하고, 매칭되는 위치의 개수를 비교창 내의 위치의 총 개수로 나누고, 그 결과치에 100을 곱하여 서열 동일성 백분율을 구함으로써 백분율로서 계산된다.
비교를 위해 서열을 정렬하는 방법은 관련 기술분야에 익히 공지되어 있다. 다양한 프로그램 및 정렬 알고리즘은, 예를 들어 문헌 [Smith and Waterman (1981) Adv. Appl. Math. 2:482; Needleman and Wunsch (1970) J. Mol. Biol. 48:443; Pearson and Lipman (1988) Proc. Natl. Acad. Sci. U.S.A. 85:2444; Higgins and Sharp (1988) Gene 73:237-44; Higgins and Sharp (1989) CABIOS 5:151-3; Corpet et al. (1988) Nucleic Acids Res. 16:10881-90; Huang et al. (1992) Comp. Appl. Biosci. 8:155-65; Pearson et al. (1994) Methods Mol. Biol. 24:307-31; Tatiana et al. (1999) FEMS Microbiol. Lett. 174:247-50]에 기재되어 있다. 서열 정렬 방법 및 상동성 계산에 관한 상세한 고려 사항은 문헌 [Altschul et al. (1990) J. Mol. Biol. 215:403-10]에서 찾아볼 수 있다.
여러 서열 분석 프로그램과 함께 사용하기 위한 것으로 미국 국립 생물 정보 센터 (NCBI)의 베이직 로컬 얼라인먼트 서치 툴(Basic Local Alignment Search Tool: BLAST™; Altschul et al. (1990))은 서열을 정렬하기 위해 사용할 수 있고, 미국 국립 생물 정보 센터 (메릴랜드주 베데스다)를 비롯한 여러 공급원으로부터, 및 인터넷 상에서 이용가능하다. 상기 프로그램을 사용하여 서열 동일성을 결정하는 방법에 관한 설명은 인터넷 상에서 BLAST™에 대한 "도움말" 섹션에서 이용가능하다. 핵산 서열의 비교를 위해, 디폴트 파라미터를 사용하여 BLAST™ (Blastn) 프로그램의 "Blast 2 서열" 기능을 사용할 수 있다. 참조 서열에 대해 보다 큰 유사성을 갖는 핵산 서열은 상기 방법에 의해 평가되었을 때 증가된 동일성 백분율을 나타낼 것이다.
본원에서 사용되는 바와 같은 용어 "실질적으로 동일한"은 80% 초과로 동일한 뉴클레오티드 서열을 지칭할 수 있다. 예를 들어, 실질적으로 동일한 뉴클레오티드 서열은 참조 서열에 대해 적어도 85%; 적어도 86%; 적어도 87%; 적어도 88%; 적어도 89%; 적어도 90%; 적어도 91%; 적어도 92%; 적어도 93%; 적어도 94%; 적어도 95%; 적어도 96%; 적어도 97%; 적어도 98%; 적어도 99%; 또는 적어도 99.5% 동일할 수 있다.
유전자좌: 본원에서 사용되는 바와 같은 용어 "유전자좌"는 측정가능한 특징 (예를 들어, 형질)에 해당하는 게놈 상의 위치를 지칭한다. 일부 실시양태에서, 특정한 관심 유전자좌는 FAD3 유전자의 게놈 위치이며, 여기서 이 유전자의 분열이 야생형 유전자로부터 전사된 mRNA의 발현을 감소시키거나 또는 제거한다. 유전자좌는 서던 혼성화 또는 PCR 동안 유전자좌 내에 함유된 특유한 뉴클레오티드 서열과 혼성화되는 프로브에 의해 정의될 수 있다.
마커: 본원에 사용된 바와 같은 "마커"는 특정한 대립유전자를 가질 가능성이 있고/거나 특정한 형질 또는 표현형을 나타낼 가능성이 있는 식물을 확인하는데 사용될 수 있는 유전자 또는 뉴클레오티드 서열을 지칭한다. 마커는 주어진 게놈 유전자좌에서의 변이로서 기재될 수 있다. 유전자 마커는 짧은 DNA 서열, 예컨대 단일 염기-쌍 변화 (단일 뉴클레오티드 다형성, 또는 "SNP")를 둘러싸는 서열, 또는 긴 서열, 예를 들어 미소부수체/단순 서열 반복체 ("SSR")일 수 있다. "마커 대립유전자"는 특정한 식물에 존재하는 마커의 버전을 지칭한다. 본원에 사용된 바와 같은 용어 마커는 식물 염색체 DNA의 클로닝된 절편 (예를 들어, FAD3 유전자좌, 또는 변형 및/또는 분열된 FAD3 유전자좌를 포함하는 절편)을 지칭할 수 있고, 또한 또는 대안적으로 식물 염색체 DNA의 클로닝된 절편에 상보적인 DNA 분자를 지칭할 수 있다. 통상의 기술자에 의해 인식되는 바와 같이, 마커에 포함시키기 위한 부가적인 인접 뉴클레오티드 서열을 수득하는 과정은 거의 무한정 반복될 수 있으며 (염색체의 길이에 의해서만 제한됨), 이에 따라 염색체에 따른 부가적인 마커가 확인된다. 상기 기재된 임의의 모든 마커의 변이가 본 발명의 일부 실시양태에서 사용될 수 있다.
일부 실시양태에서, 생식질 중의 트랜스진 또는 마커의 존재 (이것은 "표적" 서열을 특징으로 함)는 핵산 프로브; 예를 들어, 올리고뉴클레오티드를 사용함을 통해 검출될 수 있다. 프로브는 DNA 분자, 또는 RNA 분자일 수 있다. 올리고뉴클레오티드 프로브는 합성하여 또는 클로닝에 의해 제조될 수 있다. 적합한 클로닝 벡터는 통상의 기술자에게 익히 공지되어 있다. RNA 프로브는 관련 기술분야에 공지된 수단에 의해, 예를 들어 DNA 분자 주형을 사용하여 합성될 수 있다.
올리고뉴클레오티드 프로브는 표지될 수 있거나 또는 표지되지 않을 수 있다. 예를 들어, 제한 없이 닉 번역에 의한 방사성 표지; 무작위 프라이밍; 및 말단 데옥시트랜스퍼라제를 사용한 꼬리달기를 포함하는 광범위한 기술이 핵산 분자를 표지하기 위해 존재하고, 이때 사용된 뉴클레오티드는, 예를 들어 방사성 32P로 표지된다. 사용될 수 있는 다른 표지는, 예를 들어 제한 없이 형광단; 효소; 효소 기질; 효소 보조인자; 및 효소 억제제를 포함한다. 대안적으로, 그 자체로 또는 다른 반응성 작용제와 함께 검출가능한 신호를 제공하는 표지를 사용하는 것이 수용체가 결합하는 리간드에 의해 대체될 수 있고, 이때 수용체는 그 자체로 또는 다른 시약과 함께 검출가능한 신호를 제공하도록 표지된다 (예를 들어, 상기 나타낸 표지에 의해). 예를 들어, 문헌 [Leary et al. (1983) Proc. Natl. Acad. Sci. USA 80:4045-9]을 참조한다.
프로브는 검출하고자 하는 트랜스진 또는 마커의 정확한 카피일 수 있다. 프로브는 또한 검출할 트랜스진 또는 마커를 포함하는 염색체 DNA의 클로닝된 절편과 실질적으로 동일한 뉴클레오티드 서열을 포함하거나, 또는 이로 이루어지는 핵산 분자일 수 있다. 프로브는 추가의 핵산 서열, 예를 들어 프로모터; 전사 신호; 및/또는 벡터 서열을 추가로 포함할 수 있다.
프로브는 표적 뉴클레오티드 서열의 전부 또는 일부 및 게놈으로부터의 추가의 인접 뉴클레오티드 서열을 함유할 수 있다. 이는 본원에서 "인접 프로브"로서 지칭된다. 통상적으로 이해되는 바와 같이, 염색체로부터의 인접 뉴클레오티드 서열이 최초 마커의 5'측에 있느냐 또는 3'측에 있느냐에 따라, 인접 뉴클레오티드 서열은 최초 표적의 "상류" 또는 "하류"로서 지칭된다. 프로브는 또한 최초 표적의 뉴클레오티드 서열에 인접하지 않는 뉴클레오티드 서열을 함유할 수 있고; 상기 프로브는 본원에서 "비-인접 프로브"로서 지칭된다. 비-인접 프로브의 서열은 비-인접 프로브가 최초 마커 또는 트랜스진에 연결되도록 염색체의 최초 표적의 서열에 충분히 근접하게 위치할 수 있다.
일부 실시양태에서, 프로브는 검출할 표적의 정확한 카피에 "특이적으로 혼성화가능한" 또는 "특이적으로 상보적인" 핵산 분자이다. "특이적으로 혼성화가능한" 및 "특이적으로 상보적인"은 핵산 분자와 표적간에 안정하고 특이적인 결합이 일어나도록 하는 충분한 정도의 상보성을 가리키는 용어이다. 핵산 분자는 특이적으로 혼성화가능할 수 있는 것이 되기 위해 그의 표적 서열에 대하여 100% 상보적일 필요는 없다. 특이적 결합이 바람직한 조건 하에, 예를 들어 엄격한 혼성화 조건 하에 핵산이 비-표적 서열에 비-특이적으로 결합하는 것을 방지하는 충분한 정도의 상보성이 존재하는 경우에 핵산 분자가 특이적으로 혼성화할 수 있다.
특정한 정도의 엄격성에 이르게 하는 혼성화 조건은 선택되는 혼성화 방법의 특성, 및 혼성화 핵산 서열의 조성 및 길이에 따라 달라질 것이다. 일반적으로, 혼성화 온도 및 혼성화 완충제의 이온 강도 (특히, Na+ 및/또는 Mg++ 농도)가 혼성화의 엄격성을 결정할 것이지만, 세척 시간 또한 엄격성에 영향을 미친다. 특정한 정도의 엄격성을 달성하는데 필요한 혼성화 조건에 관한 계산은 관련 기술분야의 통상의 기술자에게 공지되어 있고, 이는, 예를 들면 문헌 [Sambrook et al. (ed.) Molecular Cloning: A Laboratory Manual, 2nd ed., vol. 1-3, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY, 1989, chapters 9 and 11; 및 Hames and Higgins (eds.) Nucleic Acid Hybridization, IRL Press, Oxford, 1985]에 논의되어 있다. 핵산 혼성화에 관한 추가의 상세한 지침서 및 안내를, 예를 들어 문헌 [Tijssen, "Overview of principles of hybridization and the strategy of nucleic acid probe assays," in Laboratory Techniques in Biochemistry and Molecular Biology- Hybridization with Nucleic Acid Probes, Part I, Chapter 2, Elsevier, NY, 1993; 및 Ausubel et al., Eds., Current Protocols in Molecular Biology, Chapter 2, Greene Publishing and Wiley-Interscience, NY, 1995]에서 찾아볼 수 있다.
본원에 사용된 바와 같은 "엄격한 조건"은 혼성화 분자와 DNA 표적 사이에 25% 미만의 미스매치가 존재하는 경우에만 혼성화가 발생할 조건을 포함한다. "엄격한 조건"은 특정한 수준의 염격성을 추가로 포함한다. 따라서, 본원에 사용된 바와 같은 "온건한 엄격성" 조건은 25% 초과의 서열 미스매치가 있는 분자가 혼성화하지 않을 조건이고, "중간 엄격성"의 조건은 15% 초과의 미스매치가 있는 분자가 혼성화하지 않을 조건이며, "높은 엄격성"의 조건은 10% 초과의 미스매치가 있는 서열이 혼성화하지 않을 조건이다. "매우 높은 엄격성"의 조건은 6% 초과의 미스매치가 있는 서열이 혼성화하지 않을 조건이다.
특정한 실시양태에서, 엄격한 조건은 65℃에서 6x 염수-시트르산나트륨 (SSC) 완충제, 5x 덴하르트 용액, 0.5% SDS 및 100 μg 전단 연어 고환 DNA 중에서 혼성화한 후, 65℃에서 2x SSC 완충제 및 0.5% SDS에 이어서 1x SSC 완충제 및 0.5% SDS, 및 최종적으로 0.2x SSC 완충제 및 0.5% SDS를 사용하여 순차적으로 15-30분 세척하는 것이다.
연관 (불)평형: 본원에 사용된 바와 같은 용어 "연관 평형"은 마커 및 제2 핵산 (예를 들어, 트랜스진, PTU 및 제2 마커)이 독립적으로 분리된 상황을 지칭하며; 즉, 마커 및 제2 핵산이 자손 중에 무작위로 정렬되는 것이다. 연관 평형을 나타내는 핵산은 (이것이 동일한 염색체 상에 있든지 아니든지) 연관되지 않은 것으로 간주된다. 본원에 사용된 바와 같은 용어 "연관 불평형"은 마커 및 제2 핵산이 비-무작위 방식으로 분리되는 상황을 지칭하며; 즉, 핵산은 50% 미만 (및 정의에 의해 따라서 동일한 연결 기에 대해 50 cM 미만으로 분리됨)의 재조합 빈도를 갖는다. 일부 예에서, 연관 불평형을 나타내는 핵산은 연관된 것으로 간주된다.
연관된, 긴밀하게 연관된, 및 극도로 긴밀하게 연관된: 본원에 사용된 바와 같은 마커와 제2 핵산 (예를 들어, 트랜스진, PTU 및 제2 마커) 사이의 연관은 염색체 상의 핵산이 차세대에서 개체에게 함께 전달되는 측정가능한 확률을 나타내는 현상를 지칭할 수 있다. 따라서, 제2 핵산에 대한 하나의 마커의 연관은 재조합 빈도로서 측정 및/또는 표현할 수 있다. 2개의 핵산이 서로 근접할수록, 이 확률은 "1"에 근접하게 된다. 따라서, 용어 "연관된"은 제2 핵산과 함께 0.5보다 큰 확률 (마커/유전자가 상이한 염색체 상에 위치하는 독립적인 분류로부터 예상되는 것)로 전달되는 하나 이상의 유전자 또는 마커를 지칭할 수 있다. 유전자 (예를 들어, 트랜스진)의 존재가 개체에서의 표현형에 기여할 때, 그 유전자와 연관된 마커는 그 표현형과 연관되어 있는 것으로 볼 수 있다. 따라서, 용어 "연관된"은 마커와 유전자, 또는 마커와 표현형 사이의 관계를 지칭할 수 있다.
상대 유전자 거리 (교차 빈도에 의해 결정되고, 센티모르간 (cM)으로 측정됨)는 일반적으로 2개의 연관된 마커 또는 유전자가 염색체 상에서 서로 분리되는 물리적 거리 (염기 쌍으로 측정됨)에 비례한다. 1 센티모르간은 1% 재조합 빈도 (즉, 교차 사례가 2개의 마커 사이에서 100개의 세포 분열마다 1회 발생)를 나타내는 2개의 유전자 마커 사이의 거리로서 정의된다. 일반적으로, 하나의 마커가 또 다른 마커 또는 유전자에 보다 근접할수록 (이들 사이의 거리가 유전자 거리 또는 물리적 거리의 관점에서 측정되든지 아니든지), 이것은 보다 긴밀하게 연관된다. 염색체 거리가 형질 사이의 재조합 사례의 빈도에 대략 비례하기 때문에, 재조합 빈도와 관련된 대략적인 물리적 거리가 존재한다. 이 상관관계는 일반적으로 공지되어 있거나 또는 주요 작물 식물 (Helentjaris and Burr (eds.) (1989) Development 및 Application of Molecular Markers to Problems in Plant Genetics. Cold Spring Harbor Laboratory, Cold Spring Harbor, NY; Gresshoff (ed.) (1994) Plant Genome Analysis. CRC Press, Boca Raton, FL; Lander et al. (1987) Genomics 1:174-81; Tanksley et al. (1988) "Molecular mapping of plant chromosomes," In Chromosome Structure and Function. Gustafson and Appels (eds.) Plenum Press, NY, pp. 157-73) 및 다른 다수의 유기체에 걸쳐 용이하게 결정가능하다. 예를 들어, 1 cM은 효모에서 약 2.5-3.0 kb, 아라비돕시스(Arabidopsis)에서 약 140 kb, 해바라기의 약 400 kb 및 유칼립투스(Eucalyptus)에서 약 350 kb에 상응한다.
용어 "연관된"은 본원에서 50% 미만의 재조합 빈도 (즉, 50 cM 미만)를 나타내는 하나 이상의 핵산을 지칭할 수 있다. 예를 들어, "연관된" 핵산은 약 45% 이하, 약 40% 이하, 약 35% 이하, 약 30% 이하, 약 25% 이하, 약 20% 이하, 약 15% 이하, 및 약 10% 이하의 빈도로 재조합될 수 있다. 상기 재조합 빈도에 상응하는 동일한 염색체 (상이한 염색체 상의 핵산이 연관 평형에 있을 것으로 예상됨) 상의 이러한 핵산 사이의 물리적 거리는 숙주 게놈에 좌우되고, 상기 문헌에 제시된 바와 같이 용이하게 계산될 수 있다.
본원에 사용된 바와 같은 용어 "긴밀하게-연관된"은 약 20% 이하 (즉, 약 20 cM 이하)의 재조합 빈도를 나타내는 하나 이상의 핵산를 지칭할 수 있다. 예를 들어, "긴밀하게 연관된" 핵산은 22% 이하, 약 18% 이하, 약 16% 이하, 약 14% 이하, 약 12% 이하, 약 10% 이하, 약 8% 이하, 약 6% 이하, 약 4% 이하, 및 약 2% 이하의 빈도로 재조합될 수 있다.
본원에 사용된 바와 같은 용어 "극도로 긴밀하게 연관된"은 약 10% 이하의 재조합 빈도 (즉, 약 10 cM 이하)를 나타내는 하나 이상의 핵산를 지칭할 수 있다. 예를 들어, "극도로 긴밀하게 연관된" 핵산은 11% 이하, 약 9% 이하, 약 8% 이하, 약 7% 이하, 약 6% 이하, 약 5% 이하, 약 4% 이하, 약 3% 이하, 약 2% 이하, 및 약 1% 이하의 빈도로 재조합될 수 있다.
특정한 핵산이 특정한 표현형에 기여하는 폴리펩티드를 코딩하는 유전자에 근접할수록 (유전적 또는 물리적 거리의 관점에서 측정되든지 아니든지), 특정한 핵산은 표현형에 더 긴밀하게-연관된 것이다. 상기를 고려하여, 특정한 유전자 또는 표현형에 연관된 핵산이 유전자 또는 표현형에 긴밀하게 연관된 핵산, 및 극도로 긴밀하게 연관된 핵산을 포함한다는 것이 인식될 것이다. 일부 실시양태에서, 유전적 또는 물리적 거리의 관점에서 측정되든지 아니든지, 특정한 핵산이 FAD3 유전자좌 (예를 들어, 변형 또는 분열된 FAD3 유전자좌)에 더 근접할수록, 특정한 핵산은 FAD3 유전자좌에서 통합된 외인성 핵산에 의해 부여된 임의의 형질/표현형 (또는 비변형된 유전자좌의 경우에 야생형 FAD3 표현형)에 더 긴밀하게-연관된 것이다. 따라서, 통합된 외인성 핵산을 포함하는 FAD3 유전자좌에 연관된, 긴밀하게 연관된 및/또는 극도로 긴밀하게 연관된 유전자 마커는 통합된 핵산을 포함하는 유기체 (예를 들어, 식물 및 식물 품종)를 확인하고, 통합된 핵산에 의해 부여된 표현형을 포함하는 유기체를 확인하고, 이러한 통합된 핵산 및/또는 통합된 핵산에 의해 부여된 표현형을 다른 적합한 유기체 내에서 육종하기 위한 MAS 프로그램에서 유용할 수 있다.
마커-지원 육종: 본원에 사용된 바와 같은 용어 "마커-지원 육종"은 직접적으로 1종 이상의 형질(들) (예를 들어, 다유전자 형질)에 대한 육종 식물에 대한 접근법을 지칭할 수 있다. 현행 실무에서, 식물 육종가는 용이하게 검출가능한 형질, 예컨대 농경학적으로 목적하는 형질과 연관되어 있는 화색, 종피 외관, 또는 동종효소 변이체를 확인하고자 시도한다. 이어서 식물 육종가들은 용이하게 검출가능한 형질의 분리를 추적함으로써 분리 육종 집단에서의 농경학상 형질을 추적한다. 그러나, 식물 육종에 사용하기 위해 이용가능한 용이하게 검출가능한 형질과 관심 형질 사이의 이들 연관 관계는 거의 없다. 본 발명의 일부 실시양태에서, 마커-지원 육종은, 관심 형질에 기여하는 외인성 핵산이 통합된 FAD3 유전자좌에 연관된 하나 이상의 유전자 마커 (예를 들어, SNP, 동종효소 및/또는 SSR 마커)를 확인하고, 하나 이상의 유전자 마커의 분리를 추적함으로써 분리 육종 집단을 추적하는 것을 포함한다. 일부 예에서, 하나 이상의 유전자 마커의 분리는 하나 이상의 유전자 마커의 존재에 대해 자손 식물로부터 유전자 샘플을 분석함으로써 하나 이상의 유전자 마커에 대한 프로브를 이용하여 결정될 수 있다. 마커-지원 육종은 식물 품종의 개량을 위한 시간- 및 비용-효과적인 과정을 제공한다.
형질 또는 표현형: 용어 "형질" 및 "표현형"은 상호교환가능하게 본원에서 사용된다. 본 개시내용의 목적을 위해, 특정한 관심 형질은, 예를 들어 작물 식물에서 발현될 수 있는 바와 같이 농경학적으로 중요한 형질, 및 표적화 통합 사례로부터의 트랜스진 발현 생성물의 제조를 포함한다. 용어 "분자 표현형"은 분자 (하나 이상)의 집단의 수준이 검출가능한 것인 표현형을 지칭할 수 있다. 일부 예에서, 분자 표현형은 분자 수준에서만 검출가능한 것일 수 있다. 표현형의 검출가능한 분자는 핵산 (예를 들어, 게놈 DNA 또는 RNA); 단백질; 및/또는 대사물일 수 있다. 예를 들어, 분자 표현형은 하나 이상의 유전자 산물에 대한 발현 프로파일 (예를 들어, 식물 발생의 특정한 단계에서, 또는 환경 조건 또는 스트레스에 대한 반응으로)일 수 있다.
정량적 형질 유전자좌: 유전적 영향 (상가적, 우성 및 상위성) 및 환경적 영향으로 인해 계속 달라지는 형질은 통상적으로 "정량적 형질"로서 지칭된다. 정량적 형질은 2개 인자; 표현형의 연속 분포를 생성하는 유전자 발현에 대한 환경적 영향 및 다유전자성 유전에 의해 생성되는 복합 분리 패턴에 기반한 "정성적" 또는 "이산" 형질로 구별될 수 있다. 정량적 형질의 발현에 연관된 게놈의 하나 이상 영역의 확인은 정량적 형질 유전자좌 ("QTL")와 같은 영역으로 정의한다.
식물: 본원에 사용된 바와 같은 용어 "식물"은 전체 식물, 식물로부터 유래한 세포 또는 조직 배양물 및/또는 상기 중 임의의 것의 임의의 부분를 지칭할 수 있다. 따라서, 용어 "식물"은, 예를 들어 제한 없이 전체 식물; 식물 성분 및/또는 기관 (예를 들어, 잎, 줄기 및 뿌리); 식물 조직; 종자; 및 식물 세포를 포함한다. 식물 세포는, 예를 들어 제한 없이 식물 내의 세포 및/또는 식물 세포, 식물로부터 단리된 세포 및 식물로부터 단리된 세포의 배양을 통해 획득한 세포일 수 있다.
"트랜스제닉 식물"은 그의 세포 중 적어도 하나에 외인성 폴리뉴클레오티드를 포함하는 식물이다. 용어 "트랜스제닉"은 본원에서 임의의 세포, 세포주, 캘러스, 조직, 식물 부분 또는 그의 유전자형이 외인성 핵산의 존재에 의해 변경된 식물을 지칭하는데 사용된다. 따라서, 이 용어는 외인성 폴리뉴클레오티드를 포함하도록 초기에 변경되고 초기 트랜스제닉 유기체 또는 세포의 교배 또는 무성 번식에 의해 생성된 것인 트랜스제닉 유기체 및 세포를 포함한다. 본원에 사용된 바와 같은 용어 "트랜스제닉"은 종래 식물 육종 방법 (예를 들어, 단지 비-트랜스제닉 유기체의 교배) 또는 자연 발생 사례 (예를 들어, 무작위 교배-수정, 비-재조합 바이러스 감염, 비-재조합 박테리아 형질전환, 비-재조합 전위 및 자발적 돌연변이)에 의해 도입된 게놈 (염색체 또는 염색체외) 교대를 포함하지 않는다.
식물 "라인", "품종" 또는 "균주"는 동일한 혈통을 갖는 개별 식물의 군이다. 식물 라인은 일반적으로 어느 정도로 근교배되고, 일반적으로 대부분의 유전자좌 (예를 들어, FAD3 유전자좌)에서 동형접합 및 동종이다. "서브라인"은 동일한 선조로부터 유래한 다른 유사한 근교배 하위세트와 유전적으로 구분되는 공통 선조로부터의 후손의 근교배 하위세트를 지칭할 수 있다. 일부 실시양태에서, "서브라인"은 나머지 분리 유전자좌가 유전자좌의 대부분 또는 전부에 걸쳐 동형접합일 때까지 F3 내지 F5 세대에서 선택된 개별 트랜스제닉 식물로부터 종자를 근교배시킴으로써 생성될 수 있다.
"결합 단백질"은 또 다른 분자와 결합할 수 있는 단백질이다. 결합 단백질은, 예를 들어 DNA 분자 (DNA-결합 단백질), RNA 분자 (RNA-결합 단백질) 및/또는 단백질 분자 (단백질-결합 단백질)에 결합할 수 있다. 단백질-결합 단백질의 경우, 이는 자신에게 결합할 수 있고/있거나 (동종이량체, 동종삼량체 등을 형성), 상이한 단백질 또는 단백질들의 하나 이상의 분자에 결합할 수 있다. 결합 단백질은 결합 활성의 유형이 한가지를 초과할 수 있다. 예를 들어, 아연 핑거 단백질은 DNA-결합 활성, RNA-결합 활성 및 단백질-결합 활성을 갖는다.
"아연 핑거 DNA 결합 단백질" (또는 결합 도메인)은 하나 이상의 아연 핑거를 통해 서열-특이적 방식으로 DNA에 결합하는, 단백질 또는 더 큰 단백질 내의 도메인이고, 이때 상기 아연 핑거는 아연 이온의 배위를 통해 구조가 안정화되는 결합 도메인 내의 아미노산 서열의 영역이다. 용어 아연 핑거 DNA 결합 단백질은 종종 아연 핑거 단백질 또는 ZFP로 약칭된다.
"TALE DNA 결합 도메인" 또는 "TALE"은 하나 이상의 TALE 반복 도메인/단위를 포함하는 폴리펩티드이다. 반복 도메인은 TALE의 그의 동족 표적 DNA 서열에 대한 결합에 관여한다. 단일 "반복 단위" ("반복체"로도 언급됨)는 일반적으로 33-35개 아미노산 길이이고, 자연 발생 TALE 단백질 내의 다른 TALE 반복 서열과 적어도 몇몇의 서열 상동성을 나타낸다.
아연 핑거 및 TALE 결합 도메인은, 예를 들어 자연 발생 아연 핑거 또는 TALE 단백질의 인식 나선 영역의 조작 (하나 이상의 아미노산의 변경)을 통해 소정의 뉴클레오티드 서열에 결합하도록 "조작"될 수 있다. 따라서, 조작된 DNA 결합 단백질 (아연 핑거 또는 TALE)은 비-자연 발생 단백질이다. DNA-결합 단백질의 조작 방법의 비-제한적 예는 설계 및 선택이다. 설계된 DNA 결합 단백질은 그의 설계/조성이 주로 합리적인 기준에 의해 이루어지는 자연에서 발생하지 않는 단백질이다. 설계의 합리적인 기준은 존재하는 ZFP 및/또는 TALE 설계 및 결합 데이터의 데이터베이스 저장 정보에서의 정보 처리를 위한 치환 규칙 및 컴퓨터 알고리즘의 적용을 포함한다. 예를 들어, 미국 특허 6,140,081; 6,453,242; 및 6,534,261; 또한 WO 98/53058; WO 98/53059; WO 98/53060; WO 02/016536 및 WO 03/016496 및 미국 공개공보 번호 20110301073을 참조한다.
"선택된" 아연 핑거 단백질 또는 TALE는 그의 생산이 주로 실험 처리, 예컨대 파지 디스플레이, 상호작용 트랩 또는 하이브리드 선택에 의해 이루어지는 자연에서 발견되지 않는 단백질이다. 예를 들어, US 5,789,538; US 5,925,523; US 6,007,988; US 6,013,453; US 6,200,759; WO 95/19431; WO 96/06166; WO 98/53057; WO 98/54311; WO 00/27878; WO 01/60970, WO 01/88197, WO 02/099084 및 미국 공개공보 번호 20110301073을 참조한다.
"절단"은 DNA 분자의 공유결합 백본의 파단을 지칭한다. 포스포디에스테르 결합의 효소적 또는 화학적 가수분해를 포함하지만 이에 제한되지 않는 다양한 방법에 의해 절단이 개시될 수 있다. 단일-가닥 절단 및 이중-가닥 절단 둘 다 가능하고, 이중-가닥 절단은 2개의 별도의 단일-가닥 절단 사례의 결과로서 발생할 수 있다. DNA 절단으로 평활 말단 또는 엇갈린 말단이 생산될 수 있다. 특정 실시양태에서, 융합 폴리펩티드가 표적화된 이중-가닥 DNA 절단에 사용된다.
"절단 절반-도메인"은, 제2의 폴리펩티드 (동일하거나 상이함)와 함께, 절단 활성 (바람직하게는 이중-가닥 절단 활성)을 갖는 복합체를 형성하는 폴리펩티드 서열이다. 용어 "제1 및 제2 절단 절반-도메인", "+ 및 - 절단 절반-도메인" 및 "우측 및 좌측 절단 절반-도메인"은 이량체화하는 절단 절반-도메인의 쌍을 지칭하는데 상호교환가능하게 사용된다.
"조작된 절단 절반-도메인"은 또 다른 절단 절반-도메인 (예를 들어, 또 다른 조작된 절단 절반-도메인)과 절대적 이종이량체를 형성하도록 변형된 절단 절반-도메인이다. 또한, 그 전문이 본원에 참조로 포함된 미국 특허 공개공보 번호 2005/0064474, 20070218528, 2008/0131962 및 2011/0201055를 참조한다.
이중 가닥 DNA 파단을 생성하는 수단: 본원에 사용된 바와 같은 용어 "이중 가닥 DNA 파단을 생성하는 수단"은 35 U.S.C. § 112, 제6 단락에서의 의회에 의해 공인된 특별한 청구 조항을 원용하도록 의도된다. 특히, "이중 가닥 DNA 파단을 생성하는 수단"은 이중-가닥 DNA 분자의 양쪽 가닥을 절단할 수 있는 분자 구조를 지칭한다. 이러한 구조는 다수의 공지된 뉴클레아제 단백질, 예를 들어 FokI 뉴클레아제 도메인 내에 포함되는 폴리펩티드 도메인을 포함하며, 촉매 도메인은 단백질 Mmel, 콜리신-E7 (CEA7_ECOLX), 콜리신-E9, APFL, EndA, 엔도 I (END1 EC0LI), 인간 엔도 G (NUCG_HUMAN), 소 엔도 G (NUCG_BOVIN), R.HinPll, l-Basl, l-Bmol, l-Hmul, l-Tevl, l-Tevll, l-Tevlll, l-Twol, R.Mspl, R.Mval, NucA, NucM, Vvn, Vvn_CLS, 스타필로코쿠스(Staphylococcal) 뉴클레아제 (NUC_STAAU), 스타필로코쿠스 뉴클레아제 (NUC_STAHY), 미크로코쿠스(Micrococcal) 뉴클레아제 (NUC_SHIFL), 엔도뉴클레아제 yncB, 엔도데옥시리보뉴클레아제 I (ENRN-BPT7), 메트나제(Metnase), Nb.BsrDI, BsrDI A, Nt. BspD6l (R. BspD6l 큰 서브유닛), ss.BspD6l (R. BspD6l 작은 서브유닛), R.PIel, Mlyl, Alwl, Mval269l, Bsrl, Bsml, Nb.BtsCI, Nt.BtsCI, Rl.Btsl, R2.Btsl, BbvCI 서브유닛 1, BbvCI 서브유닛 2, BpulOI 알파 서브유닛, BpulOI 베타 서브유닛, Bmrl, Bfil, l-Crel, 헥솔(hExol) (EX01JHUMAN), 효모 엑솔(Exol) (EX01_YEAST), 이.콜라이(E.coli) 엑솔, 인간 TREX2, 마우스 TREX1, 인간 TREX1, 소 TREX1, 래트 TREX1, 인간 DNA2, 효모 DNA2 (DNA2_YEAST)로 이루어진 군으로부터 선택된다.
이중 가닥 DNA 파단을 복구하는 수단: 본원에 사용된 바와 같은 용어 "이중 가닥 DNA 파단을 복구하는 수단"은 또한 35 U.S.C. § 112, 제6 단락에서의 의회에 의해 공인된 특별한 청구 조항을 원용하도록 의도된다. 특히, "이중 가닥 DNA 파단을 복구하는 수단"은, 예를 들어 단일 이중-가닥 DNA 분자를 절단함으로써 생성되는 말단을 연결하거나, 또는 외인성 이중-가닥 DNA 분자의 말단으로 단일 이중-가닥 DNA 분자를 절단함으로써 생성되는 하나의 말단을 연결함으로써 이중-가닥 DNA 분자의 말단을 연결하는 것을 용이하게 하거나/촉매작용할 수 있는 분자 구조를 지칭한다. 이러한 구조는 다수의 공지된 리가제 단백질, 예를 들어 Cre 레콤비나제 내에 포함된 폴리펩티드 도메인을 포함한다. 일부 예에서, 동일한 분자 구조는 이중 가닥 DNA 파단을 생성하는 수단 및 이중 가닥 DNA 파단을 복구하는 수단 둘 다로서 역할을 할 수 있으며, 여기서 동일한 구조는 이중-가닥 DNA 분자 (예를 들어, Hin 레콤비나제)의 절단 및 복구 둘 다를 용이하게 한다.
게놈에서의 부위 특이적 이중 가닥 파단의 유도는 상동성-지정 복구 (HDR) 또는 비-상동성 말단-연결 (NHEJ) 복구를 통해 이중 가닥 파단을 해결하는 숙주 식물 세포 DNA 복구 경로를 유도한다. 식물에서, 과학 문헌은, 본래 게놈 내로 또는 미리 조작된 위치에서의 정확한 유전자 또는 공여자 DNA 통합이 표적화 이중 가닥 파단에 플랭킹된 서열에 상동인 다양한 양의 서열을 포함하는 유입 공여자 DNA 구축물(들)을 수반한다는 것을 보고하고 있다. 특이적 표적 유전자좌로의 이러한 공여자의 통합은 아마도 HDR 경로에 의지했을 것이다. 식물에서 유전자 표적화를 위해 HDR 접근법에 전적으로 의지하는 것은 NHEJ와 비교할 때 HDR 복구 경로가 우세한 DNA 복구 경로가 아니라는 보고로 인해 제한을 가질 수 있다. NHEJ 경로를 파단시키는 표적 특이적 DNA (ZFN, TALeN 또는 조작된 메가뉴클레아제 등)를 이용하는 공개된 식물 과학 문헌은 특정한 점 돌연변이 (삽입 또는 결실)를 게놈에 도입하는 방법으로서 보고되었다. 여기서 본 발명자들은 0 내지 <10 bp의 상동성 영역을 갖는 다양한 공여자 DNA 설계의 존재 하의 부위 특이적 이중 가닥 파단 (ZFN, TALeN 등에 의해 유래함) 식물에서 NHEJ 복구 경로를 통해 표적화된 파단에서 특이적으로 삽입될 수 있음을 보고하였다. 선형 내지 원형의 단일 가닥 내지 이중 가닥의 0 상동성 내지 작은 1-10 bp의 범위를 갖는 상이한 다양한 DNA 공여자 설계는 NHEJ 경로를 사용하는 특정한 위치를 표적화할 수 있다. NHEJ 기반 공여자 DNA 식물 게놈 표적화는 "점착성 말단 포획"에 기반할 수 있고, 여기서 Fok1 (또는 다른 유형 II 엔도뉴클레아제 도메인) 및 상응하는 점착성 말단에 의해 생성된 게놈에서의 표적화된 이중 가닥 파단은 NHEJ 공여자 DNA 설계 상에 있다. 점착성 말단 공여자 DNA는 미리 정의된 오버행을 갖는 선형 공여자 DNA로서 직접적으로 세포에 전달될 수 있다. 대안적 접근법은 숙주 표적 ZFN 및 표적 인식 부위와 동일한 적어도 하나의 ZFN 인식 부위를 함유하는 원형 DNA 공여자 분자를 공-전달함으로써 생체내 공여자 DNA 점착성 말단을 생성하는 것이다. 적어도 하나의 ZFN의 발현은 숙주 게놈 DNA (천연 또는 미리 조작된 것) 및 원형 공여자 DNA를 절단하여 숙주 NHEJ 복구 경로를 사용하여 분해되는 점착성 말단을 생산한다.
공여자 분자 상에 하나 이상의 ZFN 절단 부위를 갖는 것이 가능하다 (전체 공여자 분자를 선형화하기 위한 단일 ZFN 절단 부위, 보다 작은 공여자 DNA 단편을 방출하는 동일한 ZFN 부위 중 2개 또는 숙주 게놈 DNA로부터의 공여자로부터의 단편 및 상응하는 단편을 방출하기 위한 2개의 상이한 ZFN 부위 (DNA 대체)).
따라서, 공여자 폴리뉴클레오티드는 DNA 또는 RNA, 단일-가닥 및/또는 이중-가닥일 수 있고, 선형 또는 원형 형태로 세포 내로 도입될 수 있다. 예를 들어, 미국 특허 공개공보 번호 20100047805 및 20110207221을 참조한다. 특정 경우, 본 발명의 실시양태는 또한 선형 외인성 (공여자) 핵산(들), 이들 핵산을 포함하는 조성물 및 이들 선형 공여자 분자를 제조 및 사용하는 방법을 포함할 수 있다. 특정 실시양태에서, 선형 공여자 분자는 그것이 도입된 세포를 안정하게 지속한다. 다른 실시양태에서, 선형 공여자 분자는, 예를 들어 공여자 분자의 말단 상에 하나 이상의 염기 쌍 사이의 하나 이상의 포스포로티오에이트 포스포디에스테르 결합을 두는 것으로써 엑소뉴클레아제 절단에 저항하기 위해 변형된다. 선형 외인성 핵산은 또한 단일 가닥 특이적 DNA를 포함할 수 있다.
IV. FAD3 성능 유전자좌
FAD3 (지방산 데새투라제 3)으로 지정된 유전자좌는 식물 중 지방산 함량의 복합적 다유전자성 형질의 유전에 관련된 QTL에 포함된다. FAD3은 리놀레산 (18:2)의 리놀렌산 (C18:3)으로의 탈포화를 일으키는 효소를 코딩한다 (Tanhuanpaa et al. (1998) Mol. Breed. 4:543-50; Schierholt et al. (2001) Crop Sci. 41:1444-9).
식물 오일 생합성 경로 내에서 지방산 데새투라제 (FAD)는 지방산 조성물에 유의하게 영향을 미치는 식물 지질 생합성 및 그의 활성에서 주요 역할을 한다. FAD는 식물에서 풍부하고, 발현 분석은 FAD mRNA가 과잉 생산됨을 시사한다. 또한, FAD 유전자는 다양한 조직 및 세포 유형, 뿐만 아니라 색소체 및 세포질 세망을 비롯한 세포하 구획에서 발현된다.
식물의 지방산 조성, 및 다수의 적용으로 그로부터 생산된 오일의 성능은 주요 지방산 구성성분; 올레산, 리놀레산 및 리놀렌산 (C18:3)의 상대 농도에 의해 결정된다. 이들 지방산의 농도는 효소 FAD2 및 FAD3의 기능에 의해 주로 조절된다. 올레산은 하기 반응식에 따라 식물에서 리놀레산 및 리놀렌산으로 전환된다.
FAD3 유전자는 옥수수, 대두, 목화, 아라비돕시스, 밀, 화본과 사료작물, 벼, 해바라기 및 브라시카(Brassica)을 포함하지만 이에 제한되지 않는 주요 식물 및 조류 종에서 확인되었고, 이러한 유기체에서 FAD3 발현의 변형은 변경된 지방산 프로파일을 유도한다. 또한, 변형된 FAD3 유전자를 포함하는 식물은 상업화되었고, FAD3 유전자의 분열은 숙주 식물에 농경학적 페널티 없이 숙주 식물에 의해 생산된 오일의 영양적 및 기능적 특성을 개선할 수 있음을 보여주었다. 예를 들어, 넥세라(Nexera)® 상표 (다우 아그로사이언시스, 엘엘씨(Dow AgroSciences, LLC)) 하에 시판된 카놀라 및 해바라기 품종은 야생형 카놀라 및 해바라기 프로파일과 비교할 때 더 고급 올레산, 더 저급 리놀레산 및 더 저급 리놀렌산 (및 더 저급 포화 지방산) 조성물을 특징으로 한다. 유럽, 북미 및 오스트레일리아에서 성장시킨 우세한 카놀라 종은 비. 올레라세아(B. oleracea) (이배체 C 게놈을 가짐)와 비. 라파(B. rapa) (이배체 A 게놈을 가짐)의 혼성화로부터 발생된 것으로 간주되는 이배체 브라시카 종인 브라시카 나푸스이다. 세포유전 이상 조사는 AA 및 CC 게놈이 부분적으로 서로에 상동인 것으로서의 관련성의 정도를 나타냄을 밝혔다. A 및 C 게놈 둘 다는 높은 백분율의 동조체 및/또는 유사 유전자를 함유한다. 따라서, AA 및 CC 게놈은 공통 조상 게놈으로부터 유래한 것으로 여겨진다 (Prakash and Hinata (1980) Opera Botanica 55:1-57). 선조 종 둘 다의 게놈이 기술적으로 이배체로서 분류될지라도, 이들 게놈은 높은 백분율의 서로 중복되는 영역을 함유한다 (Song et al. (1991) Theor. Appl. Genet. 82:296-304). 상세한 소기관 및 핵 RFLP 분석은, 비. 라파의 AA 게놈이 비. 나푸스에 대해 10개의 염색체를 기여하는 반면, 비. 올레라세아는 모체 공여자로서 그의 CC 게놈으로부터 9개의 염색체를 기여받는 것을 밝혀내었다 (Song et al. (1992) Genome 35:992-1001). 조상 게놈 둘 다에서의 게놈 중복의 수, 뿐만 아니라 A, B 및 C 게놈 사이의 높은 백분율의 유사성을 통해, FAD2 및 FAD3 유전자의 여러 카피가 발생하였다. 실질적으로, 이 사실은 특정한 지방산 프로파일을 생산하기 위해 시험되는 이들 유전자의 변형 및/또는 분열된 카피를 갖는 육종 카놀라를 생성한다.
카놀라에서 FAD3의 모든 공지된 기능적 유전자 카피는 A 게놈의 연결 기 N4 상에 위치한다 (Scheffler et al. (1997) TAG 94(5):583-91; Schierholt et al. (2000) TAG 101(5-6):897-901). 보다 최근에, 카놀라에서의 높은 올레산 형질은 A 게놈 상에 위치한 변형 및 분열된 FAD3 유전자와 연관되었다 (미국 특허 공개공보 번호 US 2006/0248611 A1; 문헌 [Hu et al. (2006) "Identification and Mapping of FAD2 and FAD3 Mutations and Development of Allele-specific Markers for High Oleic and Low Linolenic Acid Contents in Canola (Brassica napus L.)," Plant & Animal Genomes XIV Conference, January 14-18, 2006, San Diego, CA]). FAD3 대립유전자의 불활성화는 리놀레산의 리놀렌산으로의 탈포화를 감소시킴으로써 올레산 함량의 제어에 기여한다. 이 높은 올레산 및 FAD3 형질은 약 77%의 특징적인 올레산 함량을 갖는 비. 나푸스 품종 (DMS100)에서 확인되었다. 미국 공개공보 번호 20060248611을 참조한다. 또한, 유전자 마커는 카놀라로의 Fad3 및 높은 올레산 형질의 유전자이입을 지원하기 위해 개발되었다.
FAD3 유전자좌는 식물의 가치에 유해한 영향을 미치지 않고, 다수의 목적을 위해 그의 가치를 실제로 증가시키면서 FAD3 발현의 변경, 오일 함량/비의 변경 및/또는 목적한 트랜스진의 통합 및 발현을 비롯하여, 식물에서 변형 및/또는 분열될 수 있다. 또한, 식물의 FAD 유전자좌의 보편적인 특성에 따라, FAD3 유전자좌는 다수의 종에서, 예를 들어 제한 없이 카놀라; 대두; 옥수수; 밀; 화본과 사료작물; 브라시카 종; 벼, 토마토, 보리; 귀리; 소르굼; 목화 및 해바라기, 뿐만 아니라 진균 및 조류에서 적어도 일부 목적을 위해 유해함 없이 변형 및/또는 분열될 수 있다. 본 발명의 실시양태는 외인성 핵산의 통합을 위한 FAD3 유전자좌, 및 성능 유전자좌로서의 그의 용도를 포함한다. 예에서, FAD3 유전자좌는 성능 유전자좌로서의 그의 용도의 문맥 내에서 바람직한 것으로 발견된 여러 특성, 예컨대 예를 들어 제한 없이 숙주 유기체의 생활 주기 동안 대략 일정한 발현 수준이 존재하고, 놀랍게도, FAD3 유전자좌에서의 공여자 DNA의 삽입은 숙주 상에 품질 또는 적합성 페널티를 유도하지 않는 것 중 적어도 하나를 나타낸다.
본 발명의 일부 실시양태에서, 적어도 하나의 FAD3 유전자좌 (예를 들어, FAD3A 및/또는 FAD3C 유전자좌)는 외인성 핵산 (예를 들어, 관심 폴리펩티드를 코딩하는 뉴클레오티드 서열을 포함하는 핵산)의 부위-특이적 통합에 대한 표적 부위로서 사용된다. 특정한 실시양태에서, 외인성 핵산의 통합은 변형된 유전자좌를 생성한다. 예를 들어, 외인성 핵산의 통합은 분열된 (즉, 불활성화된) FAD3 유전자를 생성하도록 유전자좌를 변형시킬 수 있다.
일부 실시양태에서, FAD3 유전자좌는 서열 20-23, 서열 25-38, 서열 40-45, 서열 47 및 서열 49로 이루어진 군으로부터 선택된 뉴클레오티드 서열의 보체에 특이적으로 혼성화가능한 뉴클레오티드 서열을 포함할 수 있다. 예를 들어, FAD3 유전자좌는 서열 20-23, 서열 25-38, 서열 40-45, 서열 47 및 서열 49로 이루어진 군으로부터 선택된 뉴클레오티드 서열을 포함할 수 있다. 일부 실시양태에서, FAD3 유전자좌는 서열 20-23, 서열 25-38, 서열 40-45, 서열 47 및 서열 49로 이루어진 군으로부터 선택된 뉴클레오티드 서열과 실질적으로 동일한 뉴클레오티드 서열을 포함할 수 있다. 예를 들어, 일부 실시양태에서, FAD3 유전자좌는 서열 20-23, 서열 25-38, 서열 40-45, 서열 47 및 서열 49로 이루어진 군으로부터 선택된 뉴클레오티드 서열과 적어도 약 85% 동일한 뉴클레오티드 서열을 포함하는 FAD3 상동체 (예를 들어, 오르토로그 또는 파라로그)이다. FAD3 상동체는 서열 20-23, 서열 25-38, 서열 40-45, 서열 47 및 서열 49로 이루어진 군으로부터 선택된 뉴클레오티드 서열과, 예를 들어 제한 없이 적어도 80%; 적어도 85%; 적어도 약 90%; 적어도 약 91%; 적어도 약 92%; 적어도 약 93%; 적어도 약 94%; 적어도 약 95%; 적어도 약 96%; 적어도 약 97%; 적어도 약 98%; 적어도 약 99%; 적어도 약 99.5%; 99.6%, 99.7%, 99.8% 및/또는 적어도 약 99.9% 동일한 뉴클레오티드 서열을 포함할 수 있다. 이러한 FAD3 상동체는 다양한 유기체에 대해 관련 기술분야에서 통상의 기술자에게 용이하게 이용가능한 임의의 완전한 또는 부분 게놈으로부터 용이하게 확인되고 단리될 수 있다.
IV. FAD3 유전자좌에서의 핵산의 표적화 통합
FAD3 유전자좌에서의 외인성 핵산의 부위-특이적 통합은 통상의 기술자에게 공지된 임의의 기술에 의해 달성될 수 있다. 일부 실시양태에서, FAD3 유전자좌에서의 외인성 핵산의 통합은 세포 (예를 들어, 조직 또는 유기체의 단리된 세포 또는 세포)를 외인성 핵산을 포함하는 핵산 분자에 접촉시키는 것을 포함한다. 예에서, 이러한 핵산 분자는 핵산 분자와 적어도 하나의 FAD3 유전자좌 사이의 상동 재조합을 용이하게 하는 외인성 핵산에 플랭킹된 뉴클레오티드 서열을 포함할 수 있다. 특정한 예에서, 상동 재조합을 용이하게 하는 외인성 핵산에 플랭킹된 뉴클레오티드 서열은 FAD3 유전자좌의 내인성 뉴클레오티드에 상보적일 수 있다. 특정한 예에서, 상동 재조합을 용이하게 하는 외인성 핵산에 플랭킹된 뉴클레오티드 서열은 이전에 통합된 외인성 뉴클레오티드에 상보적일 수 있다. 일부 실시양태에서, 다수의 외인성 핵산은 하나의 FAD3 유전자좌에서, 예컨대 유전자 스택킹으로 통합될 수 있다.
일부 실시양태에서 FAD3 유전자좌에서의 핵산의 통합은 숙주 세포의 내인성 세포 기구, 예컨대 예를 들어 제한 없이 내인성 DNA 및 내인성 레콤비나제 효소에 의해 용이할 수 있다 (예를 들어, 촉매작용함). 일부 실시양태에서, FAD3 유전자좌에서의 핵산의 통합은 숙주 세포에 제공된 하나 이상의 인자 (예를 들어, 폴리펩티드)에 의해 용이해질 수 있다. 예를 들어, 뉴클레아제(들), 레콤비나제(들) 및/또는 리가제 폴리펩티드는 폴리펩티드를 숙주 세포와 접촉시킴으로써, 또는 숙주 세포 내에서 폴리펩티드를 발현시킴으로써 (독립적으로 또는 키메라 폴리펩티드의 일부로서) 제공될 수 있다. 따라서, 일부 예에서, 적어도 하나의 뉴클레아제, 레콤비나제 및/또는 리가제 폴리펩티드를 코딩하는 뉴클레오티드 서열을 포함하는 핵산은 FAD3 유전자좌에 부위-특이적 통합되는 핵산을 공동으로 또는 순차적으로 숙주 세포 내로 도입할 수 있으며, 여기서 적어도 하나의 뉴클레아제, 레콤비나제 및/또는 리가제 폴리펩티드는 숙주 세포에서 뉴클레오티드 서열로부터 발현된다.
A. DNA-결합 폴리펩티드
일부 실시양태에서, 부위-특이적 통합은, 예를 들어 숙주 유기체의 게놈에서 특정한 뉴클레오티드 서열을 인식하고 이에 결합될 수 있는 인자를 이용함으로써 달성될 수 있다. 예를 들어, 다수의 단백질은 부위-특이적 방식으로 DNA를 인식하고 이에 결합될 수 있는 폴리펩티드 도메인을 포함한다. DNA 결합 폴리펩티드에 의해 인식된 DNA 서열은 "표적" 서열로서 언급될 수 있다. 도메인이 원래 그로부터 단리되어진 단백질이 아닌 폴리펩티드에서 발현될 때도, 부위-특이적 방식으로 DNA를 인식하고 이에 결합될 수 있는 폴리펩티드 도메인은 일반적으로 정확하게 접히고, 독립적으로 기능하여 부위-특이적 방식으로 DNA에 결합된다. 유사하게, 심지어 큰 DNA 구조 (예를 들어, 염색체)로 존재하는 경우에도, 특히 표적 서열이 위치한 부위가 가용성 세포성 단백질 (예를 들어, 유전자)에 접근가능한 것으로 공지된 것일 때, DNA-결합 폴리펩티드에 의한 인식 및 결합에 대한 표적 서열은 일반적으로 이러한 폴리펩티드에 의해 인식되고 이에 결합될 수 있다.
자연에 존재하는 단백질로부터 확인된 DNA-결합 폴리펩티드가 전형적으로 별개의 뉴클레오티드 서열 또는 모티프 (예를 들어, 컨센서스 인식 서열)에 결합하는 반면, 이러한 다수의 DNA-결합 폴리펩티드를 변형하여 다양한 뉴클레오티드 서열 또는 모티프를 인식하도록 하는 방법이 존재하고, 이는 관련 기술분야에 공지되어 있다. DNA-결합 폴리펩티드는, 예를 들어 제한 없이 아연 핑거 DNA-결합 도메인; 류신 지퍼; UPA DNA-결합 도메인; GAL4; TAL; LexA; Tet 리프레서; LacR; 및 스테로이드 호르몬 수용체를 포함한다.
일부 예에서, DNA-결합 폴리펩티드는 아연 핑거이다. 개별적인 아연 핑거 모티프는 광범위한 DNA 부위 중 임의의 부위를 특이적으로 표적화하고 이에 결합하도록 설계될 수 있다. 정규 Cys2His2 (뿐만 아니라 비-정규 Cys3His) 아연 핑거 폴리펩티드도 표적 DNA 이중 나선의 주요 홈에 α-나선을 삽입하는 것에 의해 DNA에 결합한다. 아연 핑거에 의한 DNA의 인식은 모듈식이어서; 각 핑거가 일차적으로 표적의 3개 연속 염기 쌍에 접촉하고, 폴리펩티드의 소수의 핵심 잔기들이 인식을 매개한다. 표적화 엔도뉴클레아제에 다수의 아연 핑거 DNA-결합 도메인을 포함시키는 것에 의해, 표적화 엔도뉴클레아제의 DNA-결합 특이성은 추가로 증가될 수 있다 (및 이에 따라 그에 의해 부여되는 임의의 유전자 조절 효과의 특이성 또한 증가될 수 있음). 예를 들어, 문헌 [Urnov et al. (2005) Nature 435:646-51]을 참조한다. 따라서, 숙주 세포 내로 도입된 표적화 엔도뉴클레아제가 숙주 세포의 게놈 내의 특유한 DNA 서열과 상호작용하도록, 하나 이상의 아연 핑거 DNA-결합 폴리펩티드가 조작되고 이용될 수 있다.
바람직하게는, 아연 핑거 단백질은 선택된 표적 부위에 결합하도록 조작된다는 점에서 비-자연 발생된 것이다. 예를 들어, 그 전문이 모두 본원에 참조로 포함되는 문헌 [Beerli et al. (2002) Nature Biotechnol. 20:135-141; Pabo et al. (2001) Ann. Rev. Biochem. 70:313-340; Isalan et al. (2001) Nature Biotechnol. 19:656-660; Segal et al. (2001) Curr. Opin. Biotechnol. 12:632-637; Choo et al. (2000) Curr. Opin. Struct. Biol. 10:411-416]; 미국 특허 번호 6,453,242; 6,534,261; 6,599,692; 6,503,717; 6,689,558; 7,030,215; 6,794,136; 7,067,317; 7,262,054; 7,070,934; 7,361,635; 7,253,273; 및 미국 특허 공개공보 번호 2005/0064474; 2007/0218528; 2005/0267061을 참조한다.
조작된 아연 핑거 결합 도메인에는 자연 발생 아연 핑거 단백질과 비교하여 신규한 결합 특이성이 있을 수 있다. 조작 방법은 합리적 설계 및 다양한 유형의 선택을 포함하지만, 이에 제한되지는 않는다. 합리적 설계는, 예를 들어 삼중 (또는 사중) 뉴클레오티드 서열 및 개별 아연 핑거 아미노산 서열을 포함하는 데이터베이스의 사용을 포함하며, 여기서 각각의 삼중 또는 사중 뉴클레오티드 서열은 특정한 삼중 또는 사중 서열에 결합하는 아연 핑거의 하나 이상의 아미노산 서열과 연관된다. 예를 들어, 그 전문이 본원에 참조로 포함되는 공동 소유의 미국 특허 6,453,242 및 6,534,261을 참조한다.
파지 디스플레이 및 2-하이브리드 시스템을 포함하는 예시적인 선택 방법이 미국 특허 5,789,538; 5,925,523; 6,007,988; 6,013,453; 6,410,248; 6,140,466; 6,200,759; 및 6,242,568; 뿐만 아니라 WO 98/37186; WO 98/53057; WO 00/27878; WO 01/88197 및 GB 2,338,237에 개시되어 있다. 또한, 아연 핑거 결합 도메인에 대한 결합 특이성의 증진은, 예를 들어 공동 소유의 WO 02/077227에 기재되어 있다.
또한, 이들 및 다른 참고문헌에 개시된 바와 같이, 아연 핑거 도메인 및/또는 다중-핑거의 아연 핑거 단백질은, 예를 들어 5개 이상의 아미노산 길이의 링커를 포함하는 임의의 적합한 링커 서열을 사용하여 함께 연결될 수 있다. 또한, 6개 이상의 아미노산 길이의 예시적인 링커 서열에 대해서는 미국 특허 번호 6,479,626; 6,903,185; 및 7,153,949를 참조한다. 본원에 기재된 단백질은 단백질의 개별 아연 핑거 사이의 적합한 링커의 임의의 조합을 포함할 수 있다.
표적 부위의 선택; ZFP 및 융합 단백질 (및 이를 코딩하는 폴리뉴클레오티드)의 설계 및 구축을 위한 방법은 통상의 기술자에 공지되어 있고, 미국 특허 번호 6,140,0815; 789,538; 6,453,242; 6,534,261; 5,925,523; 6,007,988; 6,013,453; 6,200,759; WO 95/19431; WO 96/06166; WO 98/53057; WO 98/54311; WO 00/27878; WO 01/60970; WO 01/88197; WO 02/099084; WO 98/53058; WO 98/53059; WO 98/53060; WO 02/016536 및 WO 03/016496에 상세하게 설명되어 있다.
또한, 이들 및 다른 참고문헌에 개시된 바와 같이, 아연 핑거 도메인 및/또는 다중 핑거의 아연 핑거 단백질은, 예를 들어 5개 이상의 아미노산 길이의 링커를 포함하는 임의의 적합한 링커 서열을 사용하여 함께 연결될 수 있다. 또한, 6개 이상의 아미노산 길이의 예시적인 링커 서열에 대해서는 미국 특허 번호 6,479,626; 6,903,185; 및 7,153,949를 참조한다. 본원에 기재된 단백질은 단백질의 개별 아연 핑거 사이의 적합한 링커의 임의의 조합을 포함할 수 있다.
일부 예에서, DNA-결합 폴리펩티드는 GAL4로부터의 DNA-결합 도메인이다. GAL4는 사카로미세스 세레비지아에(Saccharomyces cerevisiae)에서 모듈화된 전사활성인자이지만, 이것은 또한 다수의 다른 유기체에서 전사활성인자로서 작동한다. 예를 들어, 문헌 [Sadowski et al. (1988) Nature 335:563-4]을 참조한다. 이와 같은 조절 시스템에서, 에스. 세레비시아에(S. cerevisiae)에서의 갈락토스 대사 경로의 효소를 코딩하는 유전자의 발현은 이용가능한 탄소원에 의해 엄격하게 조절된다 (Johnston (1987) Microbiol. Rev. 51:458-76). 이들 대사 효소의 전사 조절은 양성 조절 단백질 GAL4, 및 GAL4가 특이적으로 결합하는 17 bp 대칭형 DNA 서열 (UAS) 사이의 상호작용에 의해 매개된다.
천연 GAL4는 99 kDa의 분자량을 갖는 881개의 아미노산 잔기를 포함한다. GAL4는 기능적으로 자율성인 도메인을 포함하며, 이의 조합된 활성이 생체 내에서의 GAL4의 활성을 담당한다 (Ma and Ptashne (1987) Cell 48:847-53); Brent and Ptashne (1985) Cell 43(3 Pt 2):729-36). GAL4의 N-말단 65개 아미노산은 GAL4 DNA-결합 도메인을 포함한다 (Keegan et al. (1986) Science 231:699-704; Johnston (1987) Nature 328:353-5). 서열-특이적 결합은 DNA 결합 도메인에 존재하는 6개의 Cys 잔기에 의해 배위되는 2가 양이온의 존재를 필요로 한다. 배위된 양이온-함유 도메인은 DNA 나선의 주요 홈과의 직접적인 접촉을 통하여 17 bp UAS 각 말단의 보존되어 있는 CCG 삼중체와 상호작용하여 그것을 인식한다 (Marmorstein et al. (1992) Nature 356:408-14). 단백질의 DNA-결합 기능은 활성화 도메인이 전사를 유도할 수 있도록 프로모터의 근처에 C-말단 전사 활성화 도메인을 위치시킨다.
특정 실시양태에서, 이용할 수 있는 추가의 DNA-결합 폴리펩티드는, 예를 들어 제한 없이 AVRBS3-유도성 유전자로부터의 결합 서열; AVRBS3-유도성 유전자로부터의 컨센서스 결합 서열 또는 그로부터 조작된 합성 결합 서열 (예를 들어, UPA DNA-결합 도메인); TAL; LexA (예를 들어, 상기 문헌 [Brent & Ptashne (1985)] 참조); LacR (예를 들어, 문헌 [Labow et al. (1990) Mol. Cell. Biol. 10:3343-56; Baim et al. (1991) Proc. Natl. Acad. Sci. USA 88(12):5072-6)] 참조); 스테로이드 호르몬 수용체 (Ellliston et al. (1990) J. Biol. Chem. 265:11517-121); 테트라시클린 (Tc)의 존재 하에는 tet 오퍼레이터 서열에 결합하나 부재시에는 그렇지 않은 Tet 리프레서 (미국 특허 6,271,341) 및 돌연변이된 Tet 리프레서; NF-κB의 DNA-결합 도메인; 및 GAL4, 호르몬 수용체 및 VP16의 융합을 이용하는, 문헌 [Wang et al. (1994) Proc. Natl. Acad. Sci. USA 91(17):8180-4]에 기재된 조절 시스템의 성분을 포함한다.
특정 실시양태에서, 본원에 기재된 방법 및 조성물에 사용되는 하나 이상의 뉴클레아제의 DNA-결합 도메인은 자연 발생 또는 조작된 (비-자연 발생) TAL 이펙터 DNA 결합 도메인을 포함한다. 예를 들어, 그 전문이 본원에 참조로 포함되는 미국 특허 공개공보 번호 20110301073을 참조한다. 속 크산토모나스(Xanthomonas)의 식물 병원성 박테리아는 중요한 작물 식물에서 많은 병해를 야기하는 것으로 알려져 있다. 크산토모나스의 병원성은 25개 초과의 상이한 이펙터 단백질을 식물 세포 내로 주입하는 보존된 유형 III 분비 (T3S) 시스템에 좌우된다. 상기 주입된 단백질 중에는 식물 전사 활성제를 모방하고 식물 트랜스크립톰을 조작하는 전사 활성제-유사 (TAL) 이펙터가 존재한다 (문헌 [Kay et al. (2007) Science 318:648-651] 참조). 이들 단백질은 DNA 결합 도메인 및 전사 활성화 도메인을 함유한다. 대부분의 잘 특성화된 TAL-이펙터 중의 하나는 크산토모나스 캄페스트그리스 피브이. 베시카토리아(Xanthomonas campestgris pv. Vesicatoria)로부터의 AvrBs3이다 (문헌 [Bonas et al. (1989) Mol Gen Genet 218: 127-136] 및 WO2010079430 참조). TAL-이펙터는 탠덤 반복체의 중앙 집중된 도메인을 함유하고, 각각의 반복체는 이들 단백질의 DNA 결합 특이성에 핵심적인 대략 34개의 아미노산을 함유한다. 또한, 이들은 핵 국재화 서열 및 산성 전사 활성화 도메인을 함유한다 (검토에 대해서는, 문헌 [Schornack S, et al. (2006) J Plant Physiol 163(3): 256-272] 참조). 또한, 식물병원성 박테리아 랄스토니아 솔라나세아룸(Ralstonia solanacearum)에서, 알. 솔라나세아룸(R. solanacearum) 생태형 1 균주 GMI1000 및 생태형 4 균주 RS1000에서 크산토모나스의 AvrBs3 패밀리에 상동성인 brg11 및 hpx17로 지정된 2개의 유전자가 발견되었다 (문헌 [Heuer et al. (2007) Appl and Envir Micro 73(13): 4379-4384] 참조). 이들 유전자는 서로 뉴클레오티드 서열이 98.9% 동일하지만, hpx17의 반복 도메인 내의 1,575 bp의 결실에서 상이하다. 그러나, 유전자 산물 둘 다는 크산토모나스의 AvrBs3 패밀리 단백질과 40% 미만의 서열 동일성을 갖는다. 예를 들어, 미국 특허 번호 8,420,782 및 8,440,431 및 미국 특허 공개공보 번호 20110301073을 참조한다.
다른 실시양태에서, 뉴클레아제는 CRISPR/Cas 시스템을 포함한다. 시스템의 RNA 성분을 코딩하는 CRISPR (군집성의 규칙적인 간격을 갖는 짧은 회문구조 반복체) 유전자좌, 및 단백질을 코딩하는 cas (CRISPR-연관) 유전자좌 (Jansen et al., 2002. Mol. Microbiol. 43: 1565-1575; Makarova et al., 2002. Nucleic Acids Res. 30: 482-496; Makarova et al., 2006. Biol. Direct 1: 7; Haft et al., 2005. PLoS Comput. Biol. 1: e60)는 CRISPR/Cas 뉴클레아제 시스템의 유전자 서열을 구성한다. 미생물 숙주 내의 CRISPR 유전자좌는 CRISPR-연관 (Cas) 유전자의 조합 뿐만 아니라 CRISPR-매개 핵산 절단의 특이성을 프로그래밍할 수 있는 비-코딩 RNA 요소를 함유한다.
유형 II CRISPR은 가장 잘 특성화된 시스템 중의 하나이고, 4개의 순차적 단계에서 표적화된 DNA 이중-가닥 파단을 수행한다. 먼저, 2개의 비-코딩 RNA인 프리-crRNA 어레이 및 tracrRNA가 CRISPR 유전자좌로부터 전사된다. 이어서, tracrRNA는 프리-crRNA의 반복 영역에 혼성화하고, 프리-crRNA의 개별적인 스페이서 서열을 함유하는 성숙 crRNA로의 프로세싱을 매개한다. 세번째로, 성숙 crRNA:tracrRNA 복합체는 crRNA 상의 스페이서와, 표적 인식을 위한 추가의 요건인 프로토스페이서 인접 모티프 (PAM)의 옆에 존재하는 표적 DNA 상의 프로토스페이서 사이의 왓슨-크릭(Wastson-Crick) 염기-쌍형성을 통해 Cas9를 표적 DNA로 유도한다. 마지막으로, Cas9는 프로토스페이서 내의 이중 가닥 파단을 생성하기 위해 표적 DNA의 절단을 매개한다. CRISPR/Cas 시스템의 활성은 3 단계: (i) 이후의 공격을 방지하기 위해 '순응'으로 불리는 방법으로 CRISPR 어레이 내로의 외래 DNA 서열의 삽입, (ii) 관련 단백질의 발현, 뿐만 아니라 어레이의 발현 및 프로세싱 후, (iii) 외래 핵산을 사용한 RNA-매개 간섭을 포함한다. 따라서, 박테리아 세포에서, 소위 'Cas' 단백질 중 몇몇은 CRISPR/Cas 시스템의 천연 기능과 연관되고, 외래 DNA 등의 삽입과 같은 기능에서 역할을 한다.
특정 실시양태에서, Cas 단백질은 자연 발생 Cas 단백질의 "기능적 유도체"일 수 있다. 천연 서열 폴리펩티드의 "기능적 유도체"는 천연 서열 폴리펩티드와 공통적인 정성적 생물학적 특성을 갖는 화합물이다. "기능적 유도체"는 상응하는 천연 서열 폴리펩티드와 공통적인 생물학적 특성을 갖는다면, 천연 서열의 단편 및 천연 서열 폴리펩티드의 유도체 및 그의 단편을 포함하지만, 이에 제한되지는 않는다. 본원에서 고려되는 생물학적 활성은 DNA 기질을 단편으로 가수분해하는 기능적 유도체의 능력이다. 용어 "유도체"는 폴리펩티드의 아미노산 서열 변이체 둘 다, 공유 변형, 및 그의 융합체를 포함한다. Cas 폴리펩티드의 적합한 유도체 또는 그의 단편은 Cas 단백질의 돌연변이체, 융합체, 공유 변형 또는 그의 단편을 포함하지만, 이에 제한되지는 않는다. Cas 단백질 또는 그의 단편, 뿐만 아니라 Cas 단백질의 유도체 또는 그의 단편을 포함하는 Cas 단백질은 세포로부터 얻거나 또는 화학적으로 합성되거나 또는 이들 2가지 절차의 조합에 의해 얻을 수 있다. 세포는 Cas 단백질을 천연적으로 생산하는 세포, 또는 Cas 단백질을 천연적으로 생산하고 내인성 Cas 단백질을 보다 높은 발현 수준으로 생산하거나 또는 내인성 Cas와 동일하거나 상이한 Cas를 코딩하는 외인성으로 도입된 핵산으로부터 Cas 단백질을 생산하도록 유전자 조작된 세포일 수 있다. 일부 경우에, 세포는 Cas 단백질을 천연적으로 생산하지 않고, Cas 단백질을 생산하도록 유전자 조작된다.
특정한 실시양태에서, DNA-결합 폴리펩티드는 숙주 유기체의 게놈 핵산 내에 포함되는 표적 뉴클레오티드 서열을 특이적으로 인식하고 이에 결합한다. 별개의 경우의 표적 뉴클레오티드 서열 중 임의의 수가 일부 예에서 숙주 게놈에서 발견될 수 있다. 표적 뉴클레오티드 서열은 유기체의 게놈 내에서 드물게 있을 수 있다 (예를 들어, 표적 서열의 약 10, 약 9, 약 8, 약 7, 약 6, 약 5, 약 4, 약 3, 약 2 또는 약 1 카피(들) 미만이 게놈 중에 존재할 수 있다). 예를 들어, 표적 뉴클레오티드 서열은 유기체의 게놈 내에 특유한 부위에 위치할 수 있다. 표적 뉴클레오티드 서열은, 예를 들어 제한 없이 서로에 대한 게놈 전반에 무작위로 분산될 수 있고; 게놈의 다양한 연결 기에 위치할 수 있고; 동일한 연결 기에 위치할 수 있고; 다양한 염색체 상에 위치할 수 있고; 동일한 염색체 상에 위치할 수 있고; 유기체에서 유사한 조건 하에 (예를 들어, 동일한 또는 기능적으로 실질적으로 동일한 조절 인자의 제어 하에) 발현된 부위에서 게놈에 위치할 수 있고; 게놈에서 서로에 근접하게 위치할 수 있다 (예를 들어, 표적 서열은 게놈 유전자좌에 콘카테머로서 통합된 핵산 내에 포함될 수 있음).
B. 표적화 엔도뉴클레아제
특정한 실시양태에서, 특히 표적 뉴클레오티드 서열을 특이적으로 인식하고 이에 결합하는 DNA-결합 폴리펩티드는 키메라 폴리펩티드 내에 포함되어 키메라 폴리펩티드 상의 표적 서열에 특이적 결합을 부여할 수 있다. 예에서, 이러한 키메라 폴리펩티드는 이들 폴리펩티드가 상기에 기재된 바와 같이, 예를 들어 제한 없이 뉴클레아제, 레콤비나제 및/또는 리가제 폴리펩티드를 포함할 수 있다. DNA-결합 폴리펩티드 및 뉴클레아제, 레콤비나제 및/또는 리가제 폴리펩티드를 포함하는 키메라 폴리펩티드는 다른 기능적 폴리펩티드 모티프 및/또는 도메인, 예컨대 예를 들어 제한 없이 키메라 단백질에서 기능적 폴리펩티드 사이에 위치한 스페이서 서열; 리더 펩티드; 융합 단백질을 소기관 (예를 들어, 핵)에 표적화하는 펩티드; 세포 효소에 의해 절단되는 폴리펩티드; 펩티드 태그 (예를 들어, Myc, His 등); 및 키메라 폴리펩티드의 기능을 간섭하지 않는 다른 아미노산 서열을 또한 포함할 수 있다.
키메라 폴리펩티드에서의 기능적 폴리펩티드 (예를 들어, DNA-결합 폴리펩티드 및 뉴클레아제 폴리펩티드)는 작동적으로 연결될 수 있다. 일부 실시양태에서, 키메라 폴리펩티드의 기능적 폴리펩티드는 인-프레임 내에서 서로 라이게이션된 기능적 폴리펩티드를 적어도 코딩하는 단일 폴리뉴클레오티드로부터 그의 발현에 의해 작동적으로 연결되어 키메라 단백질을 코딩하는 키메라 유전자를 생성할 수 있다. 대안적 실시양태에서, 키메라 폴리펩티드의 기능적 폴리펩티드는 다른 수단, 예컨대 독립적으로 발현된 폴리펩티드의 교차-연결에 의해 작동적으로 연결될 수 있다.
일부 실시양태에서, 표적 뉴클레오티드 서열을 특이적으로 인식하고 이에 결합하는 DNA-결합 폴리펩티드는 단리된 천연 단백질 (또는 그의 돌연변이체) 내에 포함될 수 있고, 여기서 단리된 천연 단백질 또는 그의 돌연변이체는 또한 뉴클레아제 폴리펩티드 (및 레콤비나제 및/또는 리가제 폴리펩티드를 또한 포함할 수 있음)를 포함한다. 이러한 단리된 단백질의 예는 TALEN, 레콤비나제 (예를 들어, Cre, Hin, Tre 및 FLP 레콤비나제), RNA-유도 CRISPR-Cas9 및 메가뉴클레아제를 포함한다.
본원에 사용된 바와 같은 용어 "표적화 엔도뉴클레아제"는 DNA-결합 폴리펩티드 및 뉴클레아제 폴리펩티드를 포함하는 단리된 천연 또는 조작된 단백질 및 그의 돌연변이체, 뿐만 아니라 DNA-결합 폴리펩티드 및 뉴클레아제를 포함하는 키메라 폴리펩티드를 지칭한다. FAD3 유전자좌 내에 포함된 (예를 들어, 표적 서열이 유전자좌에서 천연 서열 내에 포함되기 때문에, 또는 표적 서열이 유전자좌 내로, 예를 들어 재조합에 의해 도입되었기 때문에) 표적 뉴클레오티드 서열을 특이적으로 인식하고 이에 결합하는 DNA-결합 폴리펩티드를 포함하는 임의의 표적화 엔도뉴클레아제는 특정 실시양태에서 이용될 수 있다.
본 발명의 특정한 실시양태에서 유용할 수 있는 키메라 폴리펩티드의 일부 예는 제한 없이 하기 폴리펩티드의 조합을 포함한다: 아연 핑거 DNA-결합 폴리펩티드; FokI 뉴클레아제 폴리펩티드; TALE 도메인; 류신 지퍼; 전사 인자 DNA-결합 모티프; 및 예를 들어 제한 없이 TALEN, 레콤비나제 (예를 들어, Cre, Hin, RecA, Tre 및 FLP 레콤비나제), RNA-유도 CRISPR-Cas9, 메가뉴클레아제로부터 단리된 DNA 인식 및/또는 절단 도메인; 및 관련 기술분야에 공지된 다른 것. 특정한 예는 부위-특이적 DNA 결합 폴리펩티드 및 뉴클레아제 폴리펩티드를 포함하는 키메라 단백질을 포함한다. 키메라 폴리펩티드는 키메라 폴리펩티드 내에 포함된 DNA-결합 폴리펩티드의 인식 서열을 변경하여 특정한 관심 뉴클레오티드 서열을 키메라 폴리펩티드에 표적화하기 위해 통상의 기술자에게 공지된 방법에 의해 조작될 수 있다.
특정 실시양태에서, 키메라 폴리펩티드는 DNA-결합 도메인 (예를 들어, 아연 핑거, TAL-이펙터 도메인 등) 및 뉴클레아제 (절단) 도메인을 포함한다. 절단 도메인은 DNA-결합 도메인에 이종일 수 있으며, 예를 들어 아연 핑거 DNA-결합 도메인 및 뉴클레아제로부터의 절단 도메인 또는 TALEN DNA-결합 도메인 및 절단 도메인, 또는 메가뉴클레아제 DNA-결합 도메인 및 상이한 뉴클레아제로부터의 절단 도메인임. 이종 절단 도메인은 임의의 엔도뉴클레아제 또는 엑소뉴클레아제로부터 얻을 수 있다. 절단 도메인이 유래될 수 있는 예시적인 엔도뉴클레아제는 제한 엔도뉴클레아제 및 귀소성 엔도뉴클레아제를 포함하지만, 이에 제한되지는 않는다. 예를 들어, 문헌 [2002-2003 Catalogue, New England Biolabs, Beverly, MA; 및 Belfort et al. (1997) Nucleic Acids Res. 25:3379-3388]을 참조한다. DNA를 절단하는 추가의 효소가 공지되어 있다 (예를 들어, S1 뉴클레아제; 녹두 뉴클레아제; 췌장 DNase I; 미크로코쿠스(micrococcal) 뉴클레아제; 효모 HO 엔도뉴클레아제; 또한, 문헌 [Linn et al. (eds.) Nucleases, Cold Spring Harbor Laboratory Press,1993)]을 참조한다). 이들 효소 (또는 그의 기능성 단편) 중 하나 이상이 절단 도메인 및 절단 절반-도메인의 공급원으로서 사용될 수 있다.
유사하게, 절단 절반-도메인은 절단 활성을 위해 이량체화를 필요로 하는, 상기 제시된 바와 같이 임의의 뉴클레아제 또는 그의 일부로부터 유래될 수 있다. 일반적으로, 융합 단백질이 절단 절반-도메인을 포함하는 경우에 2개의 융합 단백질이 절단에 필요하다. 대안적으로, 2개의 절단 절반-도메인을 포함하는 단일 단백질이 사용될 수 있다. 2개의 절단 절반-도메인이 동일한 엔도뉴클레아제 (또는 그의 기능성 단편)로부터 유래될 수 있거나, 또는 각각의 절단 절반-도메인이 상이한 엔도뉴클레아제 (또는 그의 기능성 단편)로부터 유래될 수 있다. 또한, 2개의 융합 단백질이 각각의 표적 부위에 결합하는 것이 절단 절반-도메인이 기능성 절단 도메인을 형성 (예를 들어, 이량체화에 의해 형성)하는 것이 가능하도록 절단 절반-도메인을 서로에 대해 공간적으로 배향시키도록, 2개의 융합 단백질에 대한 표적 부위들이 서로 관련되어 배치되는 것이 바람직하다. 따라서, 특정 실시양태에서, 표적 부위의 가까운 경계는 뉴클레오티드 5-8개 또는 뉴클레오티드 15-18개에 의해 분리된다. 그러나, 임의의 정수 개의 뉴클레오티드 또는 뉴클레오티드 쌍이 2개의 표적 부위 사이에 개입할 수 있다 (예를 들어, 2 내지 50개 또는 그 초과의 뉴클레오티드 쌍). 일반적으로, 절단 부위는 표적 부위 사이에 존재한다.
예를 들어, 제한 엔도뉴클레아제 (제한 효소)는 다수의 종에 존재하고, 예를 들어 하나 이상의 외인성 서열 (공여자/트랜스진)이 결합 (표적) 부위에 또는 그 근처에서 통합되도록, DNA에 (인식 부위에서) 서열-특이적으로 결합하여, 결합의 부위에 또는 그 근처에서 DNA를 절단하는 것이 가능하다. 특정 제한 효소 (예를 들어, 유형 IIS)는 인식 부위에서 제거된 부위에서 DNA를 절단하고, 분리가능한 결합 도메인 및 절단 도메인을 갖는다. 예를 들어, 유형 IIS 효소 Fok I은 한쪽 가닥 상의 그의 인식 부위로부터 9개의 뉴클레오티드, 및 다른쪽 가닥 상의 인식 부위로부터 13개의 뉴클레오티드에서 DNA의 이중-가닥 절단을 촉매작용한다. 예를 들어, 미국 특허 5,356,802; 5,436,150 및 5,487,994; 뿐만 아니라 문헌 [Li et al. (1992) Proc. Natl. Acad. Sci. USA 89:4275-4279; Li et al. (1993) Proc. Natl. Acad. Sci. USA 90:2764-2768; Kim et al. (1994a) Proc. Natl. Acad. Sci. USA 91:883-887; Kim et al. (1994b) J. Biol. Chem. 269:31,978-31,982]을 참조한다. 따라서, 한 실시양태에서, 융합 단백질은 적어도 하나의 유형 IIS 제한 효소로부터의 절단 도메인 (또는 절단 절반-도메인), 및 조작되거나 또는 조작되지 않을 수 있는 하나 이상의 아연 핑거 결합 도메인을 포함한다.
절단 도메인이 결합 도메인으로부터 분리가능한 예시적인 유형 IIS 제한 효소는 Fok I이다. 상기 특정한 효소는 이량체로서 활성이다 (Bitinaite et al. (1998) Proc. Natl. Acad. Sci. USA 95: 10,570-10,575). 따라서, 본 개시내용의 목적을 위해, 개시된 융합 단백질에서 사용된 Fok I 효소의 일부는 절단 절반-도메인으로 간주된다. 따라서, 아연 핑거-FokI 융합체를 사용한 표적화된 이중 가닥 절단 및/또는 세포 서열의 표적화된 교체를 위해, 각각 FokI 절단 절반-도메인을 포함하는 2개의 융합 단백질이 촉매적 활성 절단 도메인을 재구성하기 위해 사용될 수 있다. 대안적으로, DNA 결합 도메인 및 2개의 Fok I 절단 절반-도메인을 함유하는 단일 폴리펩티드 분자가 또한 사용될 수 있다.
절단 도메인 또는 절단 절반-도메인은 절단 활성을 보유하거나 또는 기능적 절단 도메인을 형성하기 위해 다량체화 (예를 들어, 이량체화)하는 능력을 보유하는 단백질의 임의의 부분일 수 있다.
예시적인 유형 IIS 제한 효소는 그 전문이 본원에 참조로 포함되는 미국 특허 공개공보 번호 20070134796에 기재되어 있다. 추가의 제한 효소가 분리가능한 결합 및 절단 도메인을 또한 함유하고, 이것은 본 개시내용에서 고려된다. 예를 들어, 문헌 [Roberts et al. (2003) Nucleic Acids Res. 31:418-420]을 참조한다.
특정 실시양태에서, 절단 도메인은, 예를 들어 그 개시내용 전문이 본원에 참조로 포함되는 미국 특허 공개공보 번호 20050064474; 20060188987 및 20080131962에 기재된 바와 같이 동종이량체화를 최소화하거나 또는 방지하는 하나 이상의 조작된 절단 절반-도메인 (이량체화 도메인 돌연변이체로도 언급됨)을 포함한다. FokI의 위치 446, 447, 479, 483, 484, 486, 487, 490, 491, 496, 498, 499, 500, 531, 534, 537 및 538의 아미노산 잔기는 모두 FokI 절단 절반-도메인의 이량체화에 영향을 주기 위한 표적이다.
절대적 이종이량체를 형성하는 FokI의 예시적인 조작된 절단 절반-도메인은 제1 절단 절반-도메인이 FokI의 위치 490 및 538의 아미노산 잔기에서의 돌연변이를 포함하고 제2 절단 절반-도메인이 아미노산 잔기 486 및 499에서의 돌연변이를 포함하는 쌍을 포함한다.
따라서, 한 실시양태에서, 490에서의 돌연변이는 Glu (E)를 Lys (K)로 대체하고; 538에서의 돌연변이는 Iso (I)를 Lys (K)로 대체하고; 486에서의 돌연변이는 Gln (Q)를 Glu (E)로 대체하고; 위치 499에서의 돌연변이는 Iso (I)를 Lys (K)로 대체한다. 구체적으로, 본원에 기재된 조작된 절단 절반-도메인은 "E490K:I538K"로 지정된 조작된 절단 절반-도메인을 생산하기 위해 하나의 절단 절반-도메인에서 위치 490 (E->K) 및 538 (I->K)을 돌연변이시키고, "Q486E:I499L"로 지정된 조작된 절단 절반-도메인을 생산하기 위해 또 다른 절단 절반-도메인에서 위치 486 (Q->E) 및 499 (I->L)를 돌연변이시킴으로써 제조하였다. 본원에 기재된 조작된 절단 절반-도메인은 비정상적 절단이 최소화되거나 또는 제거된 절대적 이종이량체 돌연변이체이다. 예를 들어, 모든 목적을 위해 그 개시내용 전문이 본원에 참조로 포함되는 미국 특허 공개공보 번호 2008/0131962를 참조한다.
특정 실시양태에서, 조작된 절단 절반-도메인은 위치 486, 499 및 496 (야생형 FokI에 대해 넘버링됨)에 돌연변이, 예를 들어 위치 486의 야생형 Gln (Q) 잔기를 Glu (E) 잔기로, 위치 499의 야생형 Iso (I) 잔기를 Leu (L) 잔기로, 위치 496의 야생형 Asn (N) 잔기를 Asp (D) 또는 Glu (E) 잔기로 대체한 돌연변이 (각각 "ELD" 및 "ELE" 도메인으로도 언급됨)를 포함한다. 다른 실시양태에서, 조작된 절단 절반-도메인은 위치 490, 538 및 537 (야생형 FokI에 대해 넘버링됨)에 돌연변이, 예를 들어 위치 490의 야생형 Glu (E) 잔기를 Lys (K) 잔기로, 위치 538의 야생형 Iso (I) 잔기를 Lys (K) 잔기로, 위치 537의 야생형 His (H) 잔기를 Lys (K) 잔기 또는 Arg (R) 잔기로 대체한 돌연변이 (각각 "KKK" 및 "KKR" 도메인으로도 언급됨)를 포함한다. 다른 실시양태에서, 유전자 조작된 절단 절반-도메인은 위치 490 및 537 (야생형 FokI에 대해 번호 매김)의 돌연변이, 예를 들어 위치 490의 야생형 Glu(E) 잔기를 Lys(K) 잔기로, 위치 537의 야생형 His(H) 잔기를 Lys(K) 잔기 또는 Arg(R) 잔기 (각각 "KIK" 및 "KIR" 도메인으로도 언급됨)로 대체한 돌연변이를 포함한다 (미국 특허 공개공보 번호 20110201055 참조). 본원에 기재된 조작된 절단 절반-도메인은 임의의 적합한 방법을 사용하여, 예를 들어 미국 특허 공개공보 번호 20050064474; 20080131962; 및 20110201055에 기재된 바와 같은 야생형 절단 절반-도메인 (FokI)의 부위-지정 돌연변이유발에 의해 제조할 수 있다.
대안적으로, 뉴클레아제는 소위 "분할-효소" 기술을 사용하여 핵산 표적 부위에서 생체 내에서 조립될 수 있다 (예를 들어, 미국 특허 공개공보 번호 20090068164 참조). 이러한 분할 효소의 성분은 별개의 발현 구축물에서 발현될 수 있거나, 또는 개별 성분이, 예를 들어 자가-절단성 2A 펩티드 또는 IRES 서열에 의해 분리되는 하나의 오픈 리딩 프레임에 연결될 수 있다. 성분은 개별적인 아연 핑거 결합 도메인 또는 메가뉴클레아제 핵산 결합 도메인의 도메인일 수 있다.
C. 아연 핑거 뉴클레아제
구체적 실시양태에서, 키메라 폴리펩티드는, 표적 부위-특이적 이중-가닥 DNA 파단을 전달하여 외인성 핵산, 또는 공여자 DNA가 통합될 수 있도록 설계될 수 있는 주문-설계된 아연 핑거 뉴클레아제 (ZFN)이다 (본원에 참조로 포함되는 공동 소유의 미국 특허 공개 20100257638 참조). ZFN은 제한 엔도뉴클레아제 (예를 들어, FokI)로부터의 비-특이적 절단 도메인 및 아연 핑거 DNA-결합 도메인 폴리펩티드를 함유하는 키메라 폴리펩티드이다. 예를 들어, 문헌 [Huang et al. (1996) J. Protein Chem. 15:481-9; Kim et al. (1997a) Proc. Natl. Acad. Sci. USA 94:3616-20; Kim et al. (1996) Proc. Natl. Acad. Sci. USA 93:1156-60; Kim et al. (1994) Proc Natl. Acad. Sci. USA 91:883-7; Kim et al. (1997b) Proc. Natl. Acad. Sci. USA 94:12875-9; Kim et al. (1997c) Gene 203:43-9; Kim et al. (1998) Biol. Chem. 379:489-95; Nahon and Raveh (1998) Nucleic Acids Res. 26:1233-9; Smith et al. (1999) Nucleic Acids Res. 27:674-81]을 참조한다. 일부 실시양태에서, ZFN는 비-정규 아연 핑거 DNA 결합 도메인을 포함한다 (본원에 참조로 포함되는 공동 소유의 미국 특허 공개 20080182332 참조). FokI 제한 엔도뉴클레아제는 DNA를 절단하고 이중-가닥 파단을 도입하기 위해 뉴클레아제 도메인을 통해 2량체화되어야 한다. 결과적으로, 이러한 엔도뉴클레아제로부터의 뉴클레아제 도메인을 함유하는 ZFN는 또한 표적 DNA를 절단하기 위해 뉴클레아제 도메인의 이량체화가 요구된다 (Mani et al. (2005) Biochem. Biophys. Res. Commun. 334:1191-7; Smith et al. (2000) Nucleic Acids Res. 28:3361-9). ZFN의 이량체화는 반대로 배향된 2개의 인접한 DNA-결합 부위에 의해 용이해질 수 있다. 상기 동일 문헌을 참조한다.
ZFN 시스템의 유연성 및 특이성은 공지된 레콤비나제-매개 유전자 편집 전략에 의해 이전에는 달성될 수 없었던 제어 수준을 제공한다. 한 예로서, ZFN는, 예를 들어 특이적 핵산 서열을 인식하기 위해 용이하게 조작될 수 있다 (Wu et al. (2007) Cell. Mol. Life Sci. 64:2933-44 (그 전문이 본원에 참조로 포함되는 미국 특허 공개 20090205083, 20110189775, 20110167521 및 20100199389 참조)). 아연 핑거 인식 잔기에 대한 코돈의 무작위화는 임의로 선택된 DNA 서열에 대해 높은 친화도를 갖는 새로운 핑거의 선택을 허용한다. 또한, 아연 핑거는 천연 DNA-결합 분자이고, 조작된 아연 핑거는 살아있는 세포 내에서 그의 설계된 표적에 대해 작용하는 것으로 밝혀졌다. 따라서, 아연 핑거를 기초로 한 뉴클레아제는 특이적인 그러나 임의의 인식 부위에 대한 표적화가 가능하다.
특정한 예에서, 숙주의 적어도 하나의 FAD3 성능 유전자좌로의 외인성 핵산의 부위-특이적 통합 방법은 ZFN을 숙주의 세포 내로 도입하는 것을 포함하고, 여기서 ZFN은 표적 뉴클레오티드 서열을 인식하고 이에 결합하며, 여기서 표적 뉴클레오티드 서열은 숙주의 적어도 하나의 FAD3 유전자좌 내에 포함된다. 특정 예에서, 표적 뉴클레오티드 서열은 적어도 하나의 FAD3 유전자좌 이외의 임의의 위치에서는 숙주의 게놈 내에 포함되지 않는다. 예를 들어, ZFN의 DNA-결합 폴리펩티드는 적어도 하나의 FAD3 유전자좌 내에 확인된 표적 뉴클레오티드 서열을 인식하고 이에 결합하도록 조작될 수 있다 (예를 들어, FAD3 유전자좌를 서열분석함으로써). ZFN을 숙주의 세포 내로 도입하는 것을 포함하는, 숙주의 적어도 하나의 FAD3 성능 유전자좌로의 외인성 핵산의 부위-특이적 통합 방법은 또한 외인성 핵산을 세포 내로 도입하는 것을 포함하고, 여기서 적어도 하나의 FAD3 유전자좌를 포함하는 숙주의 핵산 내로의 외인성 핵산의 재조합은 표적 서열에 대한 부위-특이적 인식 및 ZFN의 결합 (및 FAD3 유전자좌를 포함하는 핵산의 후속적인 절단)에 의해 용이해진다.
VI. FAD3 유전자좌에서의 통합을 위한 외인성 핵산
본 발명의 실시양태는 적어도 하나의 FAD3 유전자좌에서 부위-특이적 통합을 위한 외인성 핵산, 예를 들어 제한 없이 PTU, ELP, ETIP 또는 ORF; 표적화 엔도뉴클레아제를 코딩하는 뉴클레오티드 서열을 포함하는 핵산; 및 상기 중 어느 하나 또는 둘 다 중 적어도 하나를 포함하는 벡터로 이루어진 군으로부터 선택된 하나 이상의 핵산을 포함할 수 있다. 따라서, 일부 실시양태에 사용하기 위한 특정한 핵산은 폴리펩티드를 코딩하는 뉴클레오티드 서열, 구조적 뉴클레오티드 서열 및/또는 DNA-결합 폴리펩티드 인식 및 결합 부위를 포함한다.
A. 부위-특이적 통합을 위한 외인성 핵산 분자
상기에 기재된 바와 같이, 외인성 서열 (또한 "공여자 서열" 또는 "공여자" 또는 "트랜스진"으로도 불림)의 삽입은, 예를 들어 폴리펩티드의 발현, 돌연변이체 유전자의 수정 또는 야생형 유전자의 증가된 발현을 위해 제공된다. 공여자 서열은 전형적으로 이것이 위치한 게놈 서열과 동일하지 않음이 용이하게 명백할 것이다. 공여자 서열은 상동성인 2개의 영역에 의해 플랭킹된 비-상동 서열을 함유하여 관심 위치에서 효율적 HDR을 가능하게 할 수 있다. 추가로, 공여자 서열은 세포 염색질에서의 관심 영역에 상동성이 아닌 서열을 함유하는 벡터 분자 포함할 수 있다. 공여자 분자는 세포 염색질에 대한 여러 개의 비연속적인 상동성 영역을 함유할 수 있다. 예를 들어, 보통 관심 영역에 존재하지 않는 서열의 표적화된 삽입을 위해, 상기 서열이 공여자 핵산 분자에 존재할 수 있고, 관심 영역 내의 서열에 대한 상동성 영역에 의해 상기 서열이 플랭킹될 수 있다.
공여자 폴리뉴클레오티드는 DNA 또는 RNA, 단일-가닥 또는 이중-가닥일 수 있고, 선형 또는 원형 형태로 세포 내로 도입될 수 있다. 예를 들어, 미국 특허 공개공보 번호 20100047805, 20110281361, 20110207221 및 미국 출원 번호 13/889,162를 참조한다. 선형 형태로 도입되면, 통상의 기술자에게 공지된 방법에 의해 공여자 서열의 말단이 보호될 수 있다 (예를 들어, 엑소뉴클레아제 분해로부터). 예를 들어, 하나 이상의 디데옥시뉴클레오티드 잔기가 선형 분자의 3' 말단에 부가되고/되거나, 자가-상보적 올리고뉴클레오티드가 한쪽 또는 양쪽 말단에 라이게이션된다. 예를 들어, 문헌 [Chang et al. (1987) Proc. Natl. Acad. Sci. USA 84:4959-4963; Nehls et al. (1996) Science 272:886-889]을 참조한다. 분해로부터 외인성 폴리뉴클레오티드를 보호하기 위한 추가의 방법은 말단 아미노 기(들)의 부가, 및 변형된 뉴클레오티드간 연결기, 예컨대 예를 들어 포스포로티오에이트, 포스포르아미데이트 및 O-메틸 리보스 또는 데옥시리보스 잔기의 사용을 포함하지만, 이에 제한되지는 않는다.
폴리뉴클레오티드는, 예를 들어 복제 기점, 프로모터 및 항생제 저항성을 코딩하는 유전자와 같은 추가의 서열을 갖는 벡터 분자의 일부로서 세포 내로 도입될 수 있다. 또한, 공여자 폴리뉴클레오티드는 네이키드 핵산으로서, 리포솜 또는 폴록사머와 같은 작용제와 복합체화된 핵산으로서 도입될 수 있거나, 또는 바이러스 (예를 들어, 아데노바이러스, AAV, 헤르페스바이러스, 레트로바이러스, 렌티바이러스 및 인테그라제 결핍 렌티바이러스 (IDLV))에 의해 전달될 수 있다.
공여자는 통합 부위에서의 내인성 프로모터, 즉 공여자가 통합된 내인성 유전자 (예를 들어, FAD3)의 발현을 유도하는 프로모터에 의해 그의 발현을 유도하도록 일반적으로 통합된다. 그러나, 공여자가 프로모터 및/또는 인핸서, 예를 들어 구성적 프로모터 또는 유도성 또는 조직 특이적 프로모터를 포함할 수 있음이 명백할 것이다.
또한, 발현을 위해 요구되지 않지만, 외인성 서열은 또한, 전사 또는 번역 조절 서열, 예를 들어 프로모터, 인핸서, 인슐레이터, 내부 리보솜 진입 부위, 2A 펩티드를 코딩하는 서열 및/또는 폴리아데닐화화 신호를 포함할 수 있다.
실시양태에서 적어도 하나의 FAD3 유전자좌 내로 부위-특이적 방식으로 통합되어 FAD3 유전자좌를 변형시킬 수 있는 외인성 핵산은, 예를 들어 제한 없이 관심 폴리펩티드를 코딩하는 핵산 서열을 포함하는 핵산; 농경학적 유전자를 포함하는 핵산; RNAi 분자를 코딩하는 뉴클레오티드 서열을 포함하는 핵산; 또는 FAD3 유전자를 분열시키는 핵산을 포함한다.
일부 실시양태에서, 외인성 핵산은 FAD3 유전자좌에서 통합되어 FAD3 유전자좌를 변형시키고, 여기서 핵산은 농경학적 유전자 또는 뉴클레오티드 서열이 숙주에서 FAD3 유전자좌로부터의 발현되도록, 농경학적 유전자 또는 관심 폴리펩티드를 코딩하는 뉴클레오티드 서열을 포함한다. 일부 예에서, 관심 폴리펩티드 (예를 들어, 외래 단백질)은 산업량으로 관심 폴리펩티드를 코딩하는 뉴클레오티드 서열로부터 발현된다. 이러한 예에서, 관심 폴리펩티드는 숙주 세포, 조직 또는 바이오매스로부터 추출될 수 있다. 일부 실시양태에서, 숙주는 식물이고, 관심 폴리펩티드의 상업적 생산을 위해 제공된 식물 물질은 식물, 식물 일부, 식물 조직 또는 식물 세포일 수 있다. 일부 예에서, 식물 일부는 식물 종자일 수 있다. 식물 바이오매스로부터의 단백질 추출은, 예를 들어 문헌 [Heney and Orr (1981) Anal. Biochem. 114:92-6]에 논의된 공지된 방법에 의해 달성될 수 있다.
마찬가지로, 농경학적 유전자는 형질전환된 식물 세포, 식물 및/또는 그의 자손에서 발현될 수 있다. 예를 들어, 식물은 적어도 하나의 FAD3 유전자좌로부터의 다양한 농경학적 관심 표현형을 발현하는 특정한 실시양태의 방법을 통해 유전자 조작될 수 있다.
일부 실시양태에서, 농경학적 유전자 또는 관심 폴리펩티드를 코딩하는 뉴클레오티드 서열을 포함하는 핵산은, 예를 들어 제한 없이 해충 또는 병해에 대한 저항성을 부여하는 유전자 (예를 들어, 문헌 [Jones et al. (1994) Science 266:789] (클라도스포리움 풀붐(Cladosporium fulvum)에 대한 저항성에 대한 토마토 Cf-9 유전자의 클로닝); 문헌 [Martin et al. (1993) Science 262:1432]; 문헌 [Mindrinos et al. (1994) Cell 78:1089] (슈도모나스 시린가에(Pseudomonas syringae)에 대한 저항성을 위한 RSP2 유전자); PCT 국제 특허 공개 번호 WO 96/30517 (대두 낭 선충병에 대한 저항성); PCT 국제 특허 공개 번호 WO 93/19181; 바실루스 투린기엔시스(Bacillus thuringiensis) 단백질, 그의 유도체, 또는 그에 대해 모델링된 합성 폴리펩티드를 코딩하는 유전자 (예를 들어, 문헌 [Geiser et al. (1986) Gene 48:109] (Bt δ-내독소 유전자의 클로닝 및 뉴클레오티드 서열; 또한, δ-내독소 유전자를 코딩하는 DNA 분자는 아메리칸 타입 컬쳐 콜렉션(American Type Culture Collection; 버지니아주 마나사스)으로부터 예를 들어, ATCC 등록 번호 40098; 67136; 31995 및 31998 하에 구입할 수 있음) 참조); 렉틴을 코딩하는 유전자 (예를 들어, 문헌 [Van Damme et al. (1994) Plant Molec. Biol. 24:25] (몇몇 클리비아 미니아타(Clivia miniata) 만노스-결합 렉틴 유전자의 뉴클레오티드 서열) 참조); 비타민-결합 단백질, 예를 들어 아비딘을 코딩하는 유전자 (PCT 국제 특허 공개 번호 US93/06487 (곤충 해충에 대한 유충구충제로서 아비딘 및 아비딘 상동체의 사용) 참조); 효소 억제제, 예를 들어 프로테아제, 프로테이나제 억제제 또는 아밀라제 억제제를 코딩하는 유전자 (예를 들어, 문헌 [Abe et al. (1987) J. Biol. Chem. 262:16793] (벼 시스테인 프로테이나제 억제제의 뉴클레오티드 서열); 문헌 [Huub et al. (1993) Plant Molec. Biol. 21:985] (담배 프로테이나제 억제제 I을 코딩하는 cDNA의 뉴클레오티드 서열); 문헌 [Sumitani et al. (1993) Biosci. Biotech. Biochem. 57:1243] (스트렙토미세스 니트로스포레우스(Streptomyces nitrosporeus) 알파-아밀라제 억제제의 뉴클레오티드 서열) 및 미국 특허 5,494,813 참조); 곤충-특이적 호르몬 또는 페로몬, 예를 들어 엑디스테로이드 또는 유충 호르몬, 그의 변이체, 그에 대한 모방체, 또는 그의 길항제 또는 효능제를 코딩하는 유전자 (예를 들어, 문헌 [Hammock et al. (1990) Nature 344:458] (클로닝된 유충 호르몬 에스테라제 (유충 호르몬의 불활성화제)의 바큘로바이러스 발현) 참조); 발현시 이환된 해충을 생리학상 분열시키는, 곤충-특이적 펩티드 또는 신경펩티드를 코딩하는 유전자 (예를 들어, 문헌 [Regan (1994) J. Biol. Chem. 269:9] (발현 클로닝은 곤충 이뇨 호르몬 수용체를 코딩하는 DNA를 생성함); 문헌 [Pratt et al. (1989) Biochem. Biophys. Res. Comm. 163:1243] (디플로프테라 푼타타(Diploptera puntata) 내의 알로스타틴); 및 미국 특허 5,266,317 (곤충-특이적, 마비성 신경독소를 코딩하는 유전자) 참조); 자연에서 뱀, 말벌 또는 다른 유기체에 의해 생산되는 곤충-특이적 독을 코딩하는 유전자 (예를 들어, 문헌 [Pang et al. (1992) Gene 116:165] (전갈 곤충독성 펩티드를 코딩하는 유전자의 식물 내 이종성 발현) 참조); 모노테르펜, 세스퀴테르펜, 스테로이드, 히드록삼산, 페닐프로파노이드 유도체 또는 살곤충 활성을 갖는 다른 분자의 과축적을 담당하는 효소를 코딩하는 유전자; 생물학적 활성 분자의 번역후 변형을 비롯한 변형에 관여하는 효소, 예를 들어 당분해 효소, 단백질분해 효소, 지질분해 효소, 뉴클레아제, 시클라제, 트랜스아미나제, 에스테라제, 히드롤라제, 포스파타제, 키나제, 포스포릴라제, 폴리머라제, 엘라스타제, 키티나제 또는 글루카나제 (천연이든 합성이든)를 코딩하는 유전자 (예를 들어, PCT 국제 특허 공개 번호 WO 93/02197 (칼라제 유전자의 뉴클레오티드 서열); 또한, 키티나제-코딩 서열을 함유하는 DNA 분자는, 예를 들어 ATCC로부터 등록 번호 39637 및 67152 하에 얻을 수 있음); 문헌 [Kramer et al. (1993) Insect Biochem. Molec. Biol. 23:691] (담배 박각시나방 키티나제를 코딩하는 cDNA의 뉴클레오티드 서열); 및 문헌 [Kawalleck et al. (1993) Plant Molec. Biol. 21:673] (파슬리 ubi4-2 폴리유비퀴틴 유전자의 뉴클레오티드 서열) 참조); 신호 전달을 자극하는 분자를 코딩하는 유전자 (예를 들어, 문헌 [Botella et al. (1994) Plant Molec. Biol. 24:757] (녹두 칼모둘린 cDNA 클론에 대한 뉴클레오티드 서열); 및 문헌 [Griess et al. (1994) Plant Physiol. 104:1467] (옥수수 칼모둘린 cDNA 클론의 뉴클레오티드 서열) 참조); 소수성 모멘트 펩티드를 코딩하는 유전자 (예를 들어, PCT 국제 특허 공개 번호 WO 95/16776 (진균 식물 병원체를 억제하는 태키플레신 (Tachyplesin)의 펩티드 유도체); 및 PCT 국제 특허 공개 번호 WO 95/18855 (병해 저항성을 부여하는 합성 항미생물 펩티드) 참조); 막 퍼미아제(permease), 채널 형성제, 또는 채널 차단제를 코딩하는 유전자 (예를 들어, 문헌 [Jaynes et al. (1993) Plant Sci 89:43] (트랜스제닉 담배 식물을 슈도모나스 솔라나세아룸(Pseudomonas solanacearum)에 대해 저항성으로 만드는 세크로핀-β 라이틱 펩티드 유사체의 이종성 발현) 참조); 바이러스-침습 단백질 또는 그로부터 유래하는 복합 독소를 코딩하는 유전자 (예를 들어, 문헌 [Beachy et al. (1990) Ann. rev. Phytopathol. 28:451] 참조); 곤충-특이적 항체 또는 그로부터 유래하는 면역독소를 코딩하는 유전자 (예를 들어, 문헌 [Taylor et al., Abstract #497, Seventh Int'l Symposium on Molecular Plant-Microbe Interations (Edinburgh, Scotland) (1994)] (단일쇄 항체 단편의 생산을 통해 트랜스제닉 담배 내에서 효소에 의한 불활성화) 참조); 바이러스-특이적 항체를 코딩하는 유전자 (예를 들어, 문헌 [Tavladoraki et al. (1993) Nature 366:469] (재조합 항체 유전자를 발현하는 트랜스제닉 식물은 바이러스 공격으로부터 보호됨) 참조); 병원체 또는 기생충에 의해 자연에서 생산되는 발달 억제성 단백질을 코딩하는 유전자 (예를 들어, 문헌 [Lamb et al. (1992) Bio/Technology 10:1436] (진균 엔도 α-1,4-D-폴리갈락토우로나제는 식물 세포벽 호모-α-1,4-D-갈락토우로나제를 가용화함으로써 진균 콜리니화 및 식물 영양분 방출을 촉진함); 문헌 [Toubart et al. (1992) Plant J. 2:367] (콩 엔도폴리갈락토우로나제-억제 단백질을 코딩하는 유전자의 클로닝 및 특성화) 참조); 식물에 의해 자연에서 생산되는 발달-억제성 단백질을 코딩하는 유전자 (예를 들어, 문헌 [Logemann et al. (1992) Bio/Technology 10:305] (보리 리보솜-불활성화 유전자를 발현하는 트랜스제닉 식물은 진균 질환에 대한 증가된 저항성을 가짐) 참조)를 포함할 수 있다.
일부 실시양태에서, 농경학적 유전자 또는 관심 폴리펩티드를 코딩하는 뉴클레오티드 서열을 포함하는 핵산은 또한 및/또는 대안적으로, 예를 들어 제한 없이 성장점 또는 분열조직을 억제하는 제초제와 같은 제초제, 예를 들어 이미다졸리논 또는 술포닐우레아에 대한 저항성을 부여하는 유전자 (본 카테고리에서 예시적인 유전자는, 예를 들어 문헌 [Lee et al. (1988) EMBO J. 7:1241, 및 Miki et al. (1990) Theor. Appl. Genet. 80:449]에 각각 설명된 바와 같은 돌연변이체 ALS 및 AHAS 효소를 코딩함); 예를 들어, 돌연변이체 5-엔올피루빌쉬키메이트-3-포스페이트 신타제 (EPSP) 유전자에 의해 부여된 바와 같은 글리포세이트 저항성 (재조합 핵산 및/또는 다양한 형태의 천연 EPSP 유전자 (비제한적으로 CP4, DMMG 및 DGT-28 포함)의 생체내 돌연변이 유발의 도입을 통해; 각각 aroA 유전자 및 글리포세이트 아세틸 트랜스퍼라제 (GAT) 유전자); 스트렙토미세스 히그로스코피쿠스(Streptomyces hygroscopicus) 및 스트렙토미세스 비리디크로모게네스(Streptomyces viridichromogenes)를 포함하는 스트렙토미세스 종으로부터 다른 포스포노 화합물, 예컨대 글루포시네이트 포스피노트리신 아세틸 트랜스퍼라제 (PAT) 유전자); 및 피리디녹시 또는 페녹시 프로프리온산 및 시클로헥손 (ACCase 억제제-코딩 유전자)을 포함할 수 있다. 예를 들어, 미국 특허 4,940,835 및 6,248,876 (식물에 글리포세이트 저항성을 부여할 수 있는 EPSP의 형태의 뉴클레오티드 서열)을 참조한다. 돌연변이체 aroA 유전자를 코딩하는 DNA 분자는 ATCC 등록 번호 39256 하에 얻을 수 있다. 또한, 미국 특허 4,769,061 (돌연변이체 aroA 유전자의 뉴클레오티드 서열)을 참조한다. 유럽 특허 출원 번호 0 333 033 및 미국 특허 번호 4,975,374에서는 L-포스피노트리신과 같은 제초제에 대한 저항성을 부여할 수 있는 글루타민 신테타제 유전자의 뉴클레오티드 서열을 개시하고 있다. 예시적인 PAT 유전자의 뉴클레오티드 서열은 유럽 특허 출원 번호 0 242 246, 및 문헌 [DeGreef et al. (1989) Bio/Technology 7:61] (PAT 활성을 코딩하는 키메라 바(bar) 유전자를 발현하는 트랜스제닉 식물의 생산)에 제공되어 있다. 페녹시 프로프리온산 및 시클로헥손, 예컨대 세톡시딤 및 할록시포프에 대한 저항성을 부여하는 유전자의 예는 문헌 [Marshall et al. (1992) Theor. Appl. Genet. 83:435]에 기재된 바와 같은 Acc1-S1, Acc1-S2 및 Acc1-S3 유전자를 포함한다. 글리포세이트 저항성을 부여할 수 있는 GAT 유전자는, 예를 들어 WO 2005012515에 기재되어 있다. 2,4-D, 페녹시프로프리온산 및 피리딜옥시 옥신 제초제에 대한 저항성을 부여하는 유전자는, 예를 들어 WO 2005107437 및 WO 2007053482에 기재되어 있다.
관심 폴리펩티드를 코딩하는 농경학적 유전자 또는 뉴클레오티드 서열을 포함하는 핵산은 또한, 예를 들어 제한 없이 광합성을 억제하는 제초제, 예컨대 트리아진 (psbA 및 gs+ 유전자) 또는 벤조니트릴 (니트릴라제 유전자)에 대한 저항성을 부여하는 유전자를 포함할 수 있다. 예를 들어, 문헌 [Przibila et al. (1991) Plant Cell 3:169] (돌연변이체 psbA 유전자를 코딩하는 플라스미드를 사용한 클라미도모나스(Chlamydomonas)의 형질전환)을 참조한다. 니트릴라제 유전자에 대한 뉴클레오티드 서열은 미국 특허 4,810,648에 개시되어 있고, 이들 유전자를 함유하는 DNA 분자는 ATCC 등록 번호 53435; 67441; 및 67442 하에 이용가능하다. 또한, 문헌 [Hayes et al. (1992) Biochem. J. 285:173] (글루타티온 S-트랜스퍼라제를 코딩하는 DNA의 클로닝 및 발현)을 참조한다.
일부 실시양태에서, 농경학적 유전자 또는 관심 폴리펩티드를 코딩하는 뉴클레오티드 서열을 포함하는 핵산은 또한 및/또는 대안적으로 가치-부가 형질, 예를 들어 제한 없이, 예를 들어 식물의 스테아르산 함량을 증가시키기 위한 스테아릴-ACP 데새투라제의 안티센스 유전자를 갖는 식물의 형질전환에 의해 변형된 지방산 대사를 부여하거나 또는 이에 기여하는 유전자 (예를 들어, 문헌 [Knultzon et al. (1992) Proc. Natl. Acad. Sci. U.S.A. 89:2624] 참조); 감소된 파이테이트(phytate) 함량 (예를 들어, 피타제-코딩 유전자의 도입은 파이테이트의 분해를 증진하여, 더 많은 유리 포스페이트를 형질전환된 식물에 첨가함) (예를 들어, 문헌 [Van Hartingsveldt et al. (1993) Gene 127:87] (아스페르길루스 니거(Aspergillus niger) 피타제 유전자의 뉴클레오티드 서열); 낮은 수준의 피트산을 특징으로 하는 옥수수 돌연변이체에 기인할 수 있는 단일 대립유전자에 연관된 DNA의 클로닝에 이어서 이를 재도입시킴으로써 달성될 수 있는, 옥수수에서 파이테이트 함량을 감소시키기 위해 도입될 수 있는 유전자 (예를 들어, 문헌 [Raboy et al. (1990) Maydica 35:383] 참조); 및 예를 들어 식물을 전분의 분지화 패턴을 변경시키는 효소를 코딩하는 유전자로 형질전환시킴으로써 달성되는 변형된 탄수화물 조성 (예를 들어, 문헌 [Shiroza et al. (1988) J. Bacteol. 170:810] (스트렙토코쿠스 돌연변이체 프룩토실트랜스페라제 유전자의 뉴클레오티드 서열); 문헌 [Steinmetz et al. (1985) Mol. Gen. Genet. 20:220] (레반수크라제 유전자); 문헌 [Pen et al. (1992) Bio/Technology 10:292] (α-아밀라제); 문헌 [Elliot et al. (1993) Plant Molec. Biol. 21:515] (토마토 인버타제 유전자의 뉴클레오티드 서열); 문헌 [Sogaard et al. (1993) J. Biol. Chem. 268:22480] (보리 α-아밀라제 유전자); 및 문헌 [Fisher et al. (1993) Plant Physiol. 102:1045] (옥수수 내배유 전분 분지화 효소 II) 참조)을 포함할 수 있다.
일부 실시양태에서, 외인성 핵산은 FAD3 유전자좌를 변형시키기 위해 FAD3 유전자좌에 통합되고, 여기서 핵산은, 예를 들어 PTU 또는 ELP의 부위에서의 제2 외인성 핵산의 후속적인 부위-특이적 통합이 용이해지도록 PTU 또는 ELP를 포함한다. 또한, 미국 출원 번호 13/889,162를 참조한다.
표적화 통합을 통해 식물 게놈 내로의 관심 핵산 분자의 표적화 엔도뉴클레아제-매개 통합은 표적화 엔도뉴클레아제 또는 표적화 엔도뉴클레아제-코딩 핵산 분자의 전달 후, 숙주에서의 기능적 표적화 엔도뉴클레아제 단백질의 발현을 필요로 한다. 외인성 핵산은, 기능적 표적화 엔도뉴클레아제 단백질이 적어도 하나의 FAD3 유전자좌에서의 표적 부위(들)에서 이중-가닥 파단을 유도한 다음, 예를 들어 유전자좌 내로의 외인성 핵산의 상동성-유도 통합을 통해 복구되도록, 표적화 엔도뉴클레아제가 숙주 세포 내로 전달되거나 또는 발현되는 것와 동시에 숙주 세포에 내에 존재하는 것이 바람직하다. 통상의 기술자는 기능적 표적화 엔도뉴클레아제 단백질의 발현이 표적화 엔도뉴클레아제-코딩 구축물의 유전자도입, 및 표적화 엔도뉴클레아제-코딩 구축물의 일시 발현을 포함하지만 이에 제한되지 않는 여러 방법에 의해 달성될 수 있음을 알 수 있다. 이들 둘 다의 경우에서, 기능적 표적화 엔도뉴클레아제 단백질의 발현 및 숙주 세포 내로 외인성 핵산의 전달은 FAD3 유전자좌에서 표적화 통합을 유도하기 위해 동시에 달성될 수 있다.
표적화 엔도뉴클레아제로서 ZFN을 이용하는 실시양태에서 획득된 특정한 이점은 키메라 아연 핑거 뉴클레아제의 절단 도메인의 이량체화에 대한 요건이 서열의 높은 수준을 제공하고, 따라서 절단, 특이성의 높은 수준을 제공한다는 것이다. 3개 핑거의 각각의 세트는 9개의 연속적인 염기 쌍에 결합하기 때문에, 2개의 키메라 뉴클레아제는 각각의 아연 핑거 도메인이 완전한 특이성을 갖는다면 18개 bp 표적을 효과적으로 처리한다. 상기 길이의 임의의 주어진 서열은 단일 게놈 (대략 109 bp 가정) 내에서 특유할 것으로 예측된다 (상기 문헌 [Bibikova et al. (2001) Mol. Cell. Biol. 21(1):289-97; Wu et al. (2007)]). 또한, 추가의 핑거는 증진된 특이성을 제공할 수 있으며 (Beerli et al. (1998) Proc. Natl. Acad. Sci. USA 95:14628-33; Kim and Pabo (1998) Proc. Natl. Acad. Sci. USA 95:2812-7; Liu et al. (1997) Proc. Natl. Acad. Sci. USA 94:5525-30), 따라서 각각의 DNA-결합 도메인 내의 아연 핑거의 수는 추가의 특이성을 제공하기 위해 증가될 수 있다. 예를 들어, 특이성은 24개 bp 서열을 인식하는 한 쌍의 4-, 5-, 6- 또는 그 초과의 핑거 ZFN을 사용함으로써 추가로 증가될 수 있다 (Urnov et al. (2005) Nature 435:646-51). 따라서, ZFN은 숙주 식물 게놈 내로 도입된 인식 서열이 게놈 내에서 특유하도록 사용될 수 있다.
B. 표적화 엔도뉴클레아제를 코딩하는 뉴클레오티드 서열을 포함하는 핵산 분자
일부 실시양태에서, 표적화 엔도뉴클레아제를 코딩하는 뉴클레오티드 서열은 표적화 엔도뉴클레아제 내에 포함된 폴리펩티드를 코딩하는 본래 뉴클레오티드 서열의 조작 (예를 들어, 라이게이션)에 의해 조작될 수 있다. 예를 들어, DNA-결합 폴리펩티드를 포함하는 단백질을 코딩하는 유전자의 뉴클레오티드 서열을 검사하여, DNA-결합 폴리펩티드에 상응하는 유전자의 뉴클레오티드 서열을 확인하고 그 뉴클레오티드 서열을, DNA-결합 폴리펩티드를 포함하는 표적화 엔도뉴클레아제를 코딩하는 뉴클레오티드 서열의 요소로서 사용할 수 있다. 대안적으로, 표적화 엔도뉴클레아제의 아미노산 서열을 사용하여, 예를 들어 유전자 코드의 축중성에 따라 표적화 엔도뉴클레아제를 코딩하는 뉴클레오티드 서열을 추론할 수 있다.
표적화 엔도뉴클레아제를 코딩하는 뉴클레오티드 서열을 포함하는 예시적인 핵산 분자에서, 뉴클레아제 폴리펩티드를 코딩하는 제1 폴리뉴클레오티드 서열의 마지막 코돈 및 DNA-결합 폴리펩티드를 코딩하는 제2 폴리뉴클레오티드 서열의 첫번째 코돈은 임의 수의 뉴클레오티드 트리플릿에 의해, 예를 들어 인트론 또는 "정지"를 위한 코딩 없이 분리될 수 있다. 마찬가지로, DNA-결합 폴리펩티드를 코딩하는 제1 폴리뉴클레오티드 서열을 코딩하는 뉴클레오티드 서열의 마지막 코돈 및 뉴클레아제 폴리펩티드를 코딩하는 제2 폴리뉴클레오티드 서열의 첫번째 코돈이 임의 수의 뉴클레오티드 트리플릿에 의해 분리될 수 있다. 이들 및 추가 실시양태에서, 뉴클레아제 폴리펩티드를 코딩하는 제1 폴리뉴클레오티드 서열 및 DNA-결합 폴리펩티드를 코딩하는 제2 폴리뉴클레오티드 서열의 마지막 (즉, 핵산 서열의 가장끝 3')의 마지막 코돈은 거기에 바로 연속되거나, 또는 합성 뉴클레오티드 링커 (예를 들어, 융합을 달성하는데 사용되었을 수 있는 뉴클레오티드 링커)에 의해 코딩되는 것과 같이 짧은 펩티드 서열로만 그로부터 분리된 서열을 코딩하는 추가의 폴리뉴클레오티드의 첫번째 코돈과 위상-일치 (phase-register)로 융합될 수 있다. 이러한 추가의 폴리뉴클레오티드 서열의 예는, 예를 들어 제한 없이 태그, 표적화 펩티드 및 효소적 절단 부위를 포함한다. 마찬가지로, 제1 및 제2 폴리뉴클레오티드 서열의 가장끝 5' (핵산 서열에서)의 첫번째 코돈은 거기에 바로 연속되거나, 또는 짧은 펩티드 서열로만 그로부터 분리된 서열을 코딩하는 추가의 폴리뉴클레오티드의 마지막 코돈과 위상-일치로 융합될 수 있다.
표적화 엔도뉴클레아제 (예를 들어, DNA 결합-폴리펩티드 및 뉴클레아제 폴리펩티드)에서 기능적 폴리펩티드를 코딩하는 서열 분리 폴리뉴클레오티드 서열은, 예를 들어 코딩된 아미노산 서열이 표적화 엔도뉴클레아제의 번역을 유의하게 변경할 가능성이 없도록 하는 임의의 서열로 이루어질 수 있다. 공지된 뉴클레아제 폴리펩티드 및 공지된 DNA-결합 폴리펩티드의 자율 특성으로 인해, 개재 서열은 예에서 이들 구조의 각각 기능을 간섭하지 않을 것이다.
C. 벡터 및 발현 구축물
일부 실시양태에서, 관심 폴리펩티드 및/또는 표적화 엔도뉴클레아제를 코딩하는 적어도 하나의 외인성 폴리뉴클레오티드 서열을 포함하는 적어도 하나의 핵산 분자(들)는 세포, 조직 또는 유기체 내로 그 내부에서의 발현을 위해 도입될 수 있다. 예를 들어, 적어도 하나의 FAD3 유전자좌 내에 포함된 뉴클레오티드 서열을 특이적으로 인식하는 표적화 엔도뉴클레아제를 코딩하는 폴리뉴클레오티드 서열을 포함하는 핵산 분자는 표적화 엔도뉴클레아제의 발현을 위해 세포 내로 도입될 수 있고, 관심 폴리펩티드를 코딩하는 폴리뉴클레오티드 서열을 포함하는 핵산 분자는 관심 폴리펩티드를 코딩하는 폴리뉴클레오티드 서열이, 예를 들어 발현된 표적화 엔도뉴클레아제에 의한 유전자좌에서의 이중 가닥 파단의 도입 후 상동 재조합에 의해, 적어도 하나의 FAD3 유전자좌 내로 통합되도록 세포 내로 도입될 수 있고, 관심 폴리펩티드는 통합된 폴리뉴클레오티드 서열로부터 발현된다.
일부 실시양태에서, 상기 중 하나와 같은 핵산 분자는, 예를 들어 벡터 시스템, 예컨대 예를 들어 제한 없이 선형 플라스미드 또는 폐쇄된 원형 플라스미드일 수 있다. 특정한 예에서, 벡터는 발현 벡터일 수 있다. 특정한 실시양태에 따른 핵산 서열은, 예를 들어 핵산 서열이 1종 이상의 조절 서열에 작동가능하게 연결되도록 벡터에 삽입될 수 있다. 다수의 벡터들이 이와 같은 목적으로 이용가능한데, 구체적인 벡터의 선택은, 예를 들어 벡터에 삽입될 핵산의 크기, 벡터를 사용하여 형질전환될 특정한 숙주 세포, 및/또는 발현되기를 원하는 코딩된 폴리펩티드의 양에 따라 달라질 수 있다. 벡터는 전형적으로 다양한 성분을 함유하며, 그의 동일성은 벡터의 기능 (예를 들어, DNA 증폭 및 DNA 발현), 및 적합한 벡터를 갖는 특정한 숙주 세포(들)에 따라 달라진다.
일부 실시양태에서, 하나 이상의 코딩 서열(들)에 작동가능하게 연결된 조절 서열은 숙주 세포, 예컨대 박테리아 세포, 조류 세포, 진균 세포 또는 식물 세포에서 기능하는 프로모터 서열일 수 있고, 여기서 핵산 분자는 증폭되거나 또는 발현되는 것이다. 일부 실시양태는 관심 폴리펩티드 또는 표적화 엔도뉴클레아제를 코딩하는 하나 이상의 뉴클레오티드(들)에 작동가능하게 연결된 적어도 하나의 조절 서열을 포함하는 뉴클레오티드 서열을 포함하는 식물 형질전환 벡터를 포함할 수 있고, 여기서 하나 이상의 뉴클레오티드 서열(들)은 관심 폴리펩티드 또는 표적화 엔도뉴클레아제를 생성하기 위해 식물 세포, 조직 또는 유기체에서, 조절 서열(들)의 제어 하에 발현될 수 있다.
일부 실시양태에 따른 핵산 분자에서 사용하기에 적합한 프로모터는 유도성인 것, 조직-특이성인 것, 바이러스인 것, 합성인 것 또는 구성적인 것을 포함하며, 모두 관련 기술분야에 익히 공지되어 있다. 본 발명의 실시양태에서 유용할 수 있는 프로모터의 비제한적인 예는 미국 특허 번호 6,437,217 (옥수수 RS81 프로모터); 5,641,876 (벼 액틴 프로모터); 6,426,446 (옥수수 RS324 프로모터); 6,429,362 (옥수수 PR-1 프로모터); 6,232,526 (옥수수 A3 프로모터); 6,177,611 (구성적 옥수수 프로모터); 5,322,938, 5,352,605, 5,359,142 및 5,530,196 (35S 프로모터); 6,433,252 (옥수수 L3 올레오신 프로모터); 6,429,357 (벼 액틴 2 프로모터 및 벼 액틴 2 인트론); 6,294,714 (빛-유도성 프로모터); 6,140,078 (염-유도성 프로모터); 6,252,138 (병원체-유도성 프로모터); 6,175,060 (인 결핍-유도성 프로모터); 6,388,170 (양방향성 프로모터); 6,635,806 (감마-코익신 프로모터); 5,447,858 (대두 열 쇼크 프로모터); 및 미국 특허 출원 일련 번호 09/757,089 (옥수수 엽록체 알돌라제 프로모터)에 의해 제공되어 있다.
추가의 예시적 프로모터는 노팔린 신타제 (NOS) 프로모터 (Ebert et al. (1987) Proc. Natl. Acad. Sci. USA 84(16):5745-9); 옥토핀 신타제 (OCS) 프로모터 (아그로박테리움 투메파시엔스(Agrobacterium tumefaciens))의 종양-유도 플라스미드 상에서 운반되는 것); 카울리모바이러스 프로모터, 예컨대 콜리플라워 모자이크 바이러스 (CaMV) 19S 프로모터 (Lawton et al. (1987) Plant Mol. Biol. 9:315-24); CaMV 35S 프로모터 (Odell et al. (1985) Nature 313:810-2); 현삼 (figwort) 모자이크 바이러스 35S-프로모터 (Walker et al. (1987) Proc. Natl. Acad. Sci. USA 84(19):6624-8); 수크로스 신타제 프로모터 (Yang and Russell (1990) Proc. Natl. Acad. Sci. USA 87:4144-8); R 유전자 복합 프로모터 (Chandler et al. (1989) Plant Cell 1:1175-83); 클로로필 a/b 결합 단백질 유전자 프로모터; CaMV35S (미국 특허 번호 5,322,938, 5,352,605, 5,359,142 및 5,530,196); FMV35S (미국 특허 번호 6,051,753 및 5,378,619); PC1SV 프로모터 (미국 특허 번호 5,850,019); SCP1 프로모터 (미국 특허 번호 6,677,503); 및 AGRtu.nos 프로모터 (진뱅크(GenBank) 등록 번호 V00087; 문헌 [Depicker et al. (1982) J. Mol. Appl. Genet. 1:561-73; Bevan et al. (1983) Nature 304:184-7])를 포함한다.
특정한 실시양태에서, 핵산 분자는 조직-특이적 프로모터를 포함할 수 있다. 조직-특이적 프로모터는 유기체의 다른 조직과 비교하여, 프로모터가 특이적인 조직에서 작동가능하게 연결된 뉴클레오티드 서열의 전사를 더 높은 수준으로 지시하는 뉴클레오티드 서열이다. 조직-특이적 프로모터의 예는 제한 없이 융단조직-특이적 프로모터; 수술-특이적 프로모터; 화분-특이적 프로모터 (예를 들어, 미국 특허 번호 7,141,424 및 국제 PCT 공개 번호 WO 99/042587 참조); 배주-특이적 프로모터; (예를 들어, 미국 특허 출원 번호 2001/047525 A1 참조); 과실-특이 프로모터 (예를 들어, 미국 특허 번호 4,943,674 및 5,753,475 참조); 및 종자-특이적 프로모터 (예를 들어, 미국 특허 번호 5,420,034 및 5,608,152 참조)를 포함한다. 일부 실시양태에서, 발달 단계-특이적 프로모터 (예를 들어, 후기 발달 단계에 활성을 보이는 프로모터)가 사용될 수 있다.
일부 실시양태에서, 핵산 분자에 작동가능하게 연결될 수 있는 추가의 조절 서열로는 번역 리더 서열로서의 기능을 하는, 프로모터 서열과 코딩 서열 사이에 위치하는 5' UTR을 포함한다. 번역 리더 서열은 완전하게 프로세싱된 mRNA에 존재하고, 이는 1차 전사체의 프로세싱, 및/또는 RNA의 안정성에 영향을 줄 수 있다. 번역 리더 서열의 예는 옥수수 및 페튜니아 열 쇼크 단백질 리더 (미국 특허 번호 5,362,865), 식물 바이러스 코트 단백질 리더, 식물 루비스코 리더 등을 포함한다. 예를 들어, 문헌 [Turner and Foster (1995) Molecular Biotech. 3(3):225-36]을 참조한다. 5' UTR의 비-제한적인 예는 GmHsp (미국 특허 번호 5,659,122); PhDnaK (미국 특허 번호 5,362,865); AtAnt1; TEV (Carrington and Freed (1990) J Virol. 64:1590-7); 및 AGRtunos (진뱅크 등록 번호 V00087; 및 상기 문헌 [Bevan et al. (1983)])에 의해 제공된다.
일부 실시양태에서, 핵산 분자에 작동가능하게 연결될 수 있는 추가의 조절 서열은 또한 3' 비번역 서열, 3' 전사 종결 영역, 또는 폴리아데닐화 영역을 포함한다. 이들은 뉴클레오티드 서열의 하류에 위치하는 유전 요소이며, 이는 폴리아데닐화 신호, 및/또는 전사 또는 mRNA 프로세싱에 영향을 줄 수 있는 다른 조절 신호를 제공하는 폴리뉴클레오티드를 포함한다. 폴리아데닐화 신호는 식물에서 폴리아데닐레이트 뉴클레오티드를 mRNA 전구체의 3' 말단에 부가하는 기능을 한다. 폴리아데닐화 서열은 다양한 식물 유전자로부터, 또는 T-DNA 유전자로부터 유래된 것일 수 있다. 3' 전사 종료 영역의 비제한적인 예는 노팔린 신타제 3' 영역 (nos 3'; 문헌 [Fraley et al. (1983) Proc. Natl. Acad. Sci. USA 80:4803-7])이다. 다양한 3' 비번역 영역의 사용의 예가 문헌 [Ingelbrecht et al. (1989) Plant Cell 1:671-80]에 제공되어 있다. 폴리아데닐화 신호의 비제한적 예는 피숨 사티붐(Pisum sativum) RbcS2 유전자 (Ps.RbcS2-E9; Coruzzi et al. (1984) EMBO J. 3:1671-9) 및 AGRtu.nos (진뱅크 등록 번호 E01312)로부터의 것을 포함한다.
구체적인 실시양태들에서 유용할 수 있는 조절 서열에 관한 추가의 정보는, 예를 들어 문헌 [Goeddel (1990) "Gene Expression Technology," Methods Enzymol. 185, Academic Press, San Diego, CA]에 기재되어 있다.
재조합 핵산 분자 또는 벡터는 형질전환된 세포, 예컨대 식물 세포에 선택가능한 표현형을 부여하는 선택 마커를 포함할 수 있다. 선택 마커는 또한 선택 마터를 포함하는 핵산 분자를 포함하는 세포 또는 유기체를 선택하는데 사용될 수 있다. 마커는 살생물제 저항성, 항생제 저항성 (예를 들어, 카나마이신, 게네티신 (G418), 블레오마이신 및 히그로마이신), 또는 제초제 저항성 (예를 들어, 글리포세이트)을 코딩할 수 있다. 선택 마커의 예는 카나마이신 저항성을 부여하며, 예를 들어 카나마이신 및 G418을 사용하여 선택될 수 있는 neo 유전자; 비알라포스 저항성을 부여하는 bar 유전자; 글리포세이트 저항성을 부여하는 돌연변이 EPSP 신타제 유전자; 브로목시닐에 대한 저항성을 부여하는 니트릴라제 유전자; 이미다졸리논 또는 술포닐우레아 저항성을 부여하는 돌연변이 아세토락테이트 신타제 유전자 (ALS); 및 메토트렉세이트-내성 DHFR 유전자를 포함하지만, 이에 제한되지는 않는다. 예를 들어 제한 없이 암피실린; 블레오마이신; 클로람페니콜; 겐타마이신; 히그로마이신; 카나마이신; 린코마이신; 메토트렉세이트; 포스피노트리신; 퓨로마이신; 스펙티노마이신; 리팜피신; 스트렙토마이신 및 테트라시클린을 포함하여, 화학적 작용제에 대한 저항성을 부여하는 다수의 선택 마커들이 이용가능하다. 상기 선택 마커의 예는, 예를 들어 미국 특허 5,550,318; 5,633,435; 5,780,708 및 6,118,047에 예시되어 있다.
핵산 분자 또는 벡터는 또한 또는 대안적으로 스크리닝가능 마커를 포함할 수 있다. 스크린가능한 마커는 발현을 모니터링하는데 사용될 수 있다. 예시적인 스크리닝가능 마커는, 그에 대한 각종 발색 기질이 공지되어 있는 효소를 코딩하는 β-글루쿠로니다제 또는 uidA 유전자 (GUS) (Jefferson et al. (1987) Plant Mol. Biol. Rep. 5:387-405); 식물 조직에서 안토시아닌 색소 (적색) 생산을 조절하는 생성물을 코딩하는 R-유전자좌 유전자 (Dellaporta et al. (1988) "Molecular cloning of the maize R-nj allele by transposon tagging with Ac." In 18th Stadler Genetics Symposium, P. Gustafson and R. Appels, eds., Plenum, NY (pp. 263-82); β-락타마제 유전자 (Sutcliffe et al. (1978) Proc. Natl. Acad. Sci. USA 75:3737-41); 그에 대한 각종 발색 기질이 공지되어 있는 효소를 코딩하는 유전자 (예를 들어, PADAC, 발색성 세팔로스포린); 루시퍼라제 유전자 (Ow et al. (1986) Science 234:856-9); 발색성 카테콜을 전환시킬 수 있는 카테콜 디옥시게나제를 코딩하는 xylE 유전자 (Zukowski et al. (1983) Gene 46(2-3):247-55); 아밀라제 유전자 (Ikatu et al. (1990) Bio/Technol. 8:241-2); 티로신을 도파 및 도파퀴논으로 산화시킴에 따라 멜라닌을 축합시킬 수 있는 효소를 코딩하는 티로시나제 유전자 (Katz et al. (1983) J. Gen. Microbiol. 129:2703-14); 및 α-갈락토시다제를 포함한다.
예를 들어, 특정한 관심 폴리펩티드 또는 특정한 표적화 엔도뉴클레아제를 코딩하는 모든 뉴클레오티드 서열은 통상의 기술자에 의해 즉시 인식가능할 것이다. 유전자 코드의 축중성은 특정한 아미노산 서열에 대한 한정된 개수의 코딩 서열을 제공한다. 본 발명의 실시양태에 따른 폴리펩티드를 코딩하는 특정한 서열의 선택은 실시자의 판단에 속한다. 상이한 적용에 있어서는 상이한 코딩 서열이 바람직할 수 있다.
일부 실시양태에서, 예를 들어 특정한 숙주의 핵산 내에 포함되는 폴리뉴클레오티드 서열의 발현을 증진시키기 위해, 핵산의 뉴클레오티드를 변형하는 것이 바람직할 수 있다. 유전자 코드는 64개의 가능한 코돈으로 중복되지만, 대부분의 유기체는 우선적으로 이들 코돈의 하위세트를 사용한다. 종에서 가장 빈번하게 이용되는 코돈은 최적 코돈이라 불리며, 가장 빈번하게 사용되지 않는 것들은 희귀 또는 저-사용 코돈으로 분류된다 (Zhang et al. (1991) Gene 105:61-72). 코돈은 때때로 "코돈 최적화"로서 지칭되는 과정에서 특정한 숙주의 바람직한 코돈 사용을 반영하기 위해 대체될 수 있다. 특정한 원핵 또는 진핵 숙주가 선호하는 코돈을 함유하는 최적화된 코딩 서열은, 예를 들어 번역률을 증가시키거나, 목적하는 특성 (예를 들어, 비-최적화된 서열로부터 제조된 전사체와 비교하여 보다 장기간의 반감기)을 갖는 재조합 RNA 전사체를 생산함으로써 제조할 수 있다.
핵산은 통상의 기술자로 공지된 임의의 방법, 예컨대 예를 들어 제한 없이 원형질체의 형질전환에 의한 것 (예를 들어, 미국 특허 5,508,184); 건조/억제-매개 DNA 흡수에 의한 것 (예를 들어, 문헌 [Potrykus et al. (1985) Mol. Gen. Genet. 199:183-8]); 전기천공에 의한 것 (예를 들어, 미국 특허 5,384,253); 탄화규소 섬유를 사용한 교반에 의한 것 (예를 들어, 미국 특허 5,302,523 및 5,464,765); 아그로박테리움-매개 형질전환에 의한 것 (예를 들어, 미국 특허 5,563,055, 5,591,616, 5,693,512, 5,824,877, 5,981,840, 및 6,384,301); 및 DNA-코팅 입자의 가속에 의한 것 (예를 들어, 미국 특허 5,015,580, 5,550,318, 5,538,880, 6,160,208, 6,399,861, 및 6,403,865)에 의해 본 발명의 실시양태에서 숙주 세포 내로 도입될 수 있다. 이들과 같은 기술의 적용을 통해, 실질적으로 임의의 종의 세포는 안정하게 형질전환될 수 있다. 일부 실시양태에서, 형질전환 DNA는 숙주 세포의 게놈 내로 통합된다. 다세포 종의 경우에, 트랜스제닉 세포는 트랜스제닉 유기체 내로 재생될 수 있다. 임의의 이들 기술은, 예를 들어 트랜스제닉 식물의 게놈에 본 발명의 하나 이상의 핵산 서열을 포함하는 트랜스제닉 식물을 생산하기 위해 사용될 수 있다.
발현 벡터를 식물에 도입하는데 가장 광범위하게 이용되는 방법은 아그로박테리움의 자연 형질전환 시스템을 기반으로 한다. 에이. 투메파시엔스(A. tumefaciens) 및 에이. 리조게네스(A. rhizogenes)는 식물 세포를 유전자 형질전환시키는 식물 병원성 토양 박테리아이다. 에이. 투메파시엔스 및 에이. 리조게네스의 Ti 및 Ri 플라스미드는 각각 식물의 유전 형질전환을 담당하는 유전자를 운반한다. Ti (종양-유도)-플라스미드는 형질전환된 식물로 전달되는 T-DNA로 공지된 큰 절편을 함유한다. Ti 플라스미드의 또 다른 절편인 vir 영역은 T-DNA 전달을 담당한다. T-DNA 영역에는 각각 말단 반복 뉴클레오티드 서열로 이루어진 좌측 및 우측 경계가 접한다. 몇몇의 변형된 이원성 벡터에서, 종양-유도 유전자가 결실되었고, vir 영역의 기능은 T-DNA 경계 서열이 접하는 외래 DNA를 전달하기 위해 이용된다. T-영역은 또한, 예를 들어 트랜스제닉 식물 및 세포의 효율적인 회수를 위한 선택 마커, 및 전달을 위한 삽입 서열, 예컨대 본 발명의 융합 단백질을 코딩하는 핵산의 다중 클로닝 부위를 함유할 수 있다.
따라서, 일부 실시양태에서, 식물 형질전환 벡터는 에이. 투메파시엔스의 Ti 플라스미드 (예를 들어, 미국 특허 4,536,475, 4,693,977, 4,886,937, 및 5,501,967; 및 유럽 특허 EP 0 122 791 참조) 또는 에이. 리조게네스의 Ri 플라스미드로부터 유래된다. 추가의 식물 형질전환 벡터는, 예를 들어 제한 없이 문헌 [Herrera-Estrella et al. (1983) Nature 303:209-13]; 상기 문헌 [Bevan et al. (1983)]; 문헌 [Klee et al. (1985) Bio/Technol. 3:637-42]; 및 유럽 특허 EP 0 120 516에 기재된 것, 및 상기 중 임의의 것으로부터 유래되는 것을 포함한다. 자연상에서 식물과 상호작용하는 다른 박테리아, 예컨대 시노리조비움(Sinorhizobium), 리조비움(Rhizobium) 및 메소리조비움(Mesorhizobium)이 수많은 다양한 식물로의 유전자 전달을 매개하도록 변형될 수 있다. 이들 식물-연관 공생 박테리아는 무력화된 Ti 플라스미드 및 적합한 이원성 벡터 둘 다의 획득에 의해 유전자 전달에 대해 적격으로 만들 수 있다.
외인성 DNA를 수용자 세포에 제공한 후, 일반적으로는 추가의 배양 및 식물 재생을 위해 형질전환된 세포를 확인한다. 형질전환된 세포를 확인할 수 있는 능력을 개선시키기 위해서는 형질전환체를 생성하는데 사용되는 벡터와 함께, 이전에 제시된 바와 같은 선택 또는 스크리닝가능 마커 유전자를 사용하는 것이 바람직할 수 있다. 선택 마커가 사용되는 경우, 형질전환된 세포는 세포를 선택제 또는 선택제들에 노출시킴으로써 잠재적으로 형질전환된 세포 집단 내에서 확인된다. 스크리닝가능 마커가 사용되는 경우, 세포는 목적하는 마커 유전자 형질에 대해 스크리닝될 수 있다.
선택제에의 노출에서 살아남은 세포, 또는 스크리닝 검정에서 양성인 것으로 평가된 세포를 식물의 재생을 지지하는 배지 중에서 배양할 수 있다. 일부 실시양태에서, 임의의 적합한 식물 조직 배양 배지 (예를 들어, MS 및 N6 배지)는 추가 물질, 예컨대 성장 조절제를 포함함으로써 변형될 수 있다. 조직은 식물 재생의 노력을 개시하는데 충분한 조직이 이용가능할 때까지, 또는 수동식 선택 라운드를 반복한 후, 조직의 형태가 재생에 적합한 형태가 될 때까지 (예를 들어, 적어도 2주) 성장 조절제를 포함하는 기초 배지 상에서 유지시킨 다음, 신초 형성에 도움이 되는 배지로 옮겨 놓는다. 충분한 신초 형성이 일어날 때까지 주기적으로 배양물을 옮겨 놓는다. 일단 신초가 형성되고 나면, 이를 뿌리 형성에 도움이 되는 배지로 옮겨 놓는다. 일단 뿌리가 형성되고 나면, 추가 성장 및 성숙화를 위해 식물을 토양으로 옮겨 놓을 수 있다.
재생 식물에서의 관심 핵산 분자 (예를 들어, 적어도 하나의 본 발명 융합 단백질을 포함하는 폴리펩티드를 코딩하는 뉴클레오티드 서열)의 존재를 확인하기 위하여, 다양한 검정이 수행될 수 있다. 이러한 검정은, 예를 들어 분자 생물학적 검정, 예컨대 서던 및 노던 블롯팅, PCR 및 핵산 서열분석; 생화학적 검정, 예컨대 예를 들어 면역학적 수단 (ELISA 및/또는 웨스턴 블롯)에 의해, 또는 효소 작용에 의해 단백질 생성물의 존재를 검출하는 것; 식물 부분 검정, 예컨대 잎 또는 뿌리 검정; 및 재생된 전체 식물의 표현형의 분석을 포함한다.
통합 사례는, 예를 들어 관심 뉴클레오티드 서열에 특이적인 올리고뉴클레오티드 프라이머를 사용한, 예를 들어 PCR 증폭에 의해 분석될 수 있다. PCR 유전자형 결정은 게놈 내로 통합된 관심 핵산 분자를 함유할 것으로 예측되는 단리된 숙주 식물 조직으로부터 유래된 게놈 DNA의 폴리머라제-연쇄 반응 (PCR) 증폭에 이어서, PCR 증폭 생성물의 표준 클로닝 및 서열 분석을 수행하는 것을 포함하지만 이에 제한되지 않는 것으로 이해된다. PCR 유전자형 결정 방법에 대해서는 잘 기재되어 있고 (예를 들어, 문헌 [Rios, G. et al. (2002) Plant J. 32:243-53] 참조), 세포 배양물을 포함한 임의의 식물 종 또는 조직 유형으로부터 유래하는 게놈 DNA에 적용될 수 있다.
아그로박테리움-의존성 형질전환 방법을 사용하여 형성된 트랜스제닉 식물은 전형적으로 단일 내지 다중 카피의 재조합 DNA를 함유한다. 단일 재조합 DNA 서열은 "트랜스제닉 사례" 또는 "통합 사례"로 지칭된다. 이러한 트랜스제닉 식물은 삽입된 DNA 서열에 대해 이형접합성이다. 일부 실시양태에서, 트랜스진과 관련하여 동형접합성인 트랜스제닉 식물은 단일 외인성 유전자 서열을 함유하는 독립 분리개체 트랜스제닉 식물을 그 자신, 예를 들어 F0 식물과 유성적으로 교배시켜 (자가 수정시켜) F1 종자를 생성함으로써 획득할 수 있다. 생성된 F1 종자 중 1/4은 트랜스진과 관련하여 동형접합성일 것이다. F1 종자를 발아시킴으로써, 전형적으로 SNP 검정, 또는 이형접합체와 동형접합체가 구별될 수 있게 하는 열 증폭 검정 (즉, 접합성 검정)을 사용하여 이형접합성에 대해 시험될 수 있는 식물을 생성한다.
일부 실시양태에서 핵산 분자를 사용한 식물 또는 식물 세포의 직접적인 형질전환 이외에도, 적어도 하나의 트랜스제닉 사례를 갖는 제1 식물을 이러한 사례가 결핍되어 있는 제2 식물과 교배시키는 것에 의해 트랜스제닉 식물이 특정한 실시양태에서 제조될 수 있다. 예를 들어, 외인성 핵산이 부위-특이적 방식으로 통합된 것인 적어도 하나의 변형된 FAD3 유전자좌를 포함하는 핵산은 트랜스제닉 식물을 생성하기 위한 형질전환에 순응하는 제1 식물 라인 내로 도입될 수 있으며, 여기서 트랜스제닉 식물은 적어도 하나의 변형된 FAD3 유전자좌를 제2 식물 라인 내로 유전자이입시키기 위해 (따라서, 외인성 핵산이 제2 식물 라인 내로 들어감) 제2 식물 라인과 교배될 수 있다.
재생 식물에서 관심 핵산 분자의 존재를 확인하기 위해, 다양한 검정이 수행될 수 있다. 이러한 검정은, 예를 들어 분자 생물학적 검정, 예컨대 서던 및 노던 블롯팅 및 PCR; 생화학적 검정, 예컨대 예를 들어 면역학적 수단 (ELISA 및/또는 웨스턴 블롯)에 의해 또는 효소적 기능에 의한 단백질 생성물의 존재를 검출하는 것; 식물 부분 검정, 예컨대 잎 또는 뿌리 검정; 및 재생된 전체 식물의 표현형의 분석을 포함한다.
표적화된 통합 사례는, 예를 들어 관심 핵산 분자에 특이적인 올리고뉴클레오티드 프라이머를 사용한, 예를 들어 PCR 증폭에 의해 스크리닝될 수 있다. PCR 유전자형 결정은 게놈 내로 통합된 관심 핵산 분자를 함유할 것으로 예측되는 단리된 숙주 식물 캘러스 조직으로부터 유래된 게놈 DNA의 폴리머라제-연쇄 반응 (PCR) 증폭에 이어서 PCR 증폭 생성물의 표준 클로닝 및 서열 분석을 포함하지만 이에 제한되지 않는 것으로 이해된다. PCR 유전자형 결정 방법은 잘 기재되어 있고 (예를 들어, 문헌 [Rios, G. et al. (2002) Plant J. 32:243-53]), 세포 배양물을 비롯한 임의의 식물 종 또는 조직 종류로부터 유래된 게놈 DNA에 적용될 수 있다. 표적 서열 및 도입된 서열 둘 다에 결합하는 올리고뉴클레오티드 프라이머의 조합은 PCR 증폭 반응에서 순차적으로 사용되거나 또는 멀티플렉스화될 수 있다. 표적 부위, 도입된 핵산 서열, 및/또는 둘의 조합에 어닐링하도록 설계된 올리고뉴클레오티드 프라이머가 사용될 수 있다. 따라서, PCR 유전자형 결정 전략은 식물 게놈 내의 특이적 서열의 증폭, 식물 게놈 내의 다중 특이적 서열의 증폭, 식물 게놈 내의 비-특이적 서열의 증폭, 또는 이들의 조합을 포함할 수 있다 (이에 제한되지는 않음). 통상의 기술자는 게놈에 대해 정보를 얻기 위한 프라이머 및 증폭 반응의 추가의 조합을 고안할 수 있다. 예를 들어, 도입된 핵산 서열의 경계 외부의 표적에 특이적인 핵산 서열(들)에 어닐링하도록 정방향 및 역방향 올리고뉴클레오티드 프라이머의 세트가 설계될 수 있다.
정방향 및 역방향 올리고뉴클레오티드 프라이머는, 예를 들어 관심 핵산 분자 내의 코딩 영역, 또는 관심 핵산 분자의 다른 부분에 상응하는 서열에서, 도입된 관심 핵산 분자에 특이적으로 어닐링하도록 설계될 수 있다. 이들 프라이머는 상기 기재된 프라이머와 함께 사용될 수 있다. 올리고뉴클레오티드 프라이머는 목적하는 서열에 따라 합성될 수 있고, 상업적으로 입수가능하다 (예를 들어, 인테그레이티드 디엔에이 테크놀로지스, 인크.(Integrated DNA Technologies, Inc.) 아이오와주 코랄빌)로부터). 증폭 후에, 증폭 생성물의 클로닝 및 서열 결정, 또는 직접적인 서열 분석이 수행될 수 있다. 통상의 기술자는 PCR 유전자형 결정 동안 생성된 증폭 생성물의 분석을 위한 대안적인 방법을 구상할 수 있다. 한 실시양태에서, 유전자 표적에 특이적인 올리고뉴클레오티드 프라이머가 PCR 증폭에 사용된다.
VI. FAD3 성능 유전자좌에 통합된 핵산을 포함하는 트랜스제닉 식물 및 식물 물질
일부 실시양태에서, 식물이 적어도 하나의 변형된 FAD3 유전자좌 (예를 들어, 분열되고/거나 외인성 서열의 표적화 통합된 FAD3 유전자좌)를 포함하는 식물 세포를 포함하는, 트랜스제닉 식물이 제공된다. 특정한 실시양태에서, 이러한 식물은 식물 조직 또는 식물 세포의 형질전환, 및 전체 식물의 재생에 의해 생성될 수 있다. 추가 실시양태에서, 이러한 식물은 부위-특이적 방식으로 적어도 하나의 FAD3 유전자좌에서의 외인성 핵산의 도입을 통해 또는 변형된 FAD3 유전자좌의 생식질로의 유전자이입을 통해 획득될 수 있다. 이러한 식물 세포를 포함하는 식물 물질이 또한 제공된다. 이러한 식물 물질은 식물 세포를 포함하는 식물로부터 획득될 수 있다.
적어도 하나의 변형된 FAD3 유전자좌를 포함하는 식물 세포를 포함하는 트랜스제닉 식물 또는 식물 물질은 일부 실시양태에서 하기 특징: 식물 세포에서의 표적화 엔도뉴클레아제의 발현; 식물 세포에서의 (또는 그 내부의 색소체에서의) 관심 폴리펩티드의 발현; 식물 세포의 핵에서의 표적화 엔도뉴클레아제의 발현; 식물 세포에서의 표적화 엔도뉴클레아제의 국재화; 식물 세포의 게놈에서 FAD3 유전자좌에서의 통합; 관심 폴리펩티드를 코딩하는 뉴클레오티드 서열 또는 농경학상 유전자의 식물 세포의 게놈에서 FAD3 유전자좌에서의 통합; 및/또는 식물 세포의 게놈에서 FAD3 유전자좌에서 통합된 코딩 서열에 상응하는 RNA 전사체의 존재 중 하나 이상을 나타낼 수 있다. 이러한 식물은 추가로, 예를 들어 제한 없이 내인성 또는 트랜스제닉 뉴클레오티드 서열의 발현, 식물 세포의 게놈에서 FAD3 유전자좌에서 통합된 관심 폴리펩티드 또는 농경학상 유전자에 의해 조절되는 발현; 곤충, 다른 해충, 및 병해 유발제에 대한 저항성; 제초제에 대한 내성; 안정성, 수율 또는 보관-수명 증진; 환경상의 내성; 약제 생산; 산업 제품 생산; 및 영양상 증진으로 인한 것을 비롯한 하나 이상의 바람직한 형질을 가질 수 있다.
본 발명에 따른 트랜스제닉 식물은 본원에 기재된 방법에 따라 적어도 하나의 FAD3 유전자좌에 후속적으로 통합되는 핵산으로 형질전환될 수 있는 임의의 식물일 수 있다. 따라서, 식물은 쌍자엽 또는 단자엽일 수 있다. 본 발명의 방법에 사용가능한 쌍자엽 식물의 비제한적인 예는 아라비돕시스, 알팔파, 콩, 브로콜리, 양배추, 카놀라, 당근, 콜리플라워, 셀러리, 배추, 목화, 오이, 가지, 상추, 멜론, 완두콩, 후추, 땅콩, 감자, 호박, 무, 평지씨, 시금치, 대두, 스쿼시, 사탕무, 해바라기, 담배, 토마토 및 수박을 포함한다. 본 방법에 사용가능한 단자엽 식물은 비제한적인 예는 옥수수, 보리, 양파, 벼, 소르굼, 밀, 호밀, 기장, 사탕수수, 귀리, 트리티케일, 스위치그래스 및 잔디를 포함한다. 본 발명에 따른 트랜스제닉 식물이 사용될 수 있거나, 또는 이는 임의의 방식으로 재배될 수 있다.
일부 실시양태는 또한 본 발명의 트랜스제닉 식물로부터 생산되는 일상용품을 제공한다. 일상용품은, 예를 들어 제한 없이 적어도 하나의 FAD3 유전자좌에 통합되는 하나 이상의 뉴클레오티드 서열을 포함하는 식품 제품, 음식, 오일 또는 식물의 분쇄 곡물 또는 통곡물 또는 종자를 포함한다. 하나 이상의 상품 또는 일상용품에서의 하나 이상의 이러한 뉴클레오티드 서열의 검출은 상품 또는 일상용품이 적어도 일부가 본 발명의 실시양태에 따라 생산된 트랜스제닉 식물로부터 생산되었다는 사실상의 증거이다. 일부 실시양태에서, 적어도 하나의 변형된 FAD3 유전자좌를 포함하는 식물 세포를 포함하는 트랜스제닉 식물 또는 종자는 그의 게놈에서의 적어도 하나의 다른 트랜스제닉 사례, 예컨대 제한 없이 RNAi 분자가 전사되는 트랜스제닉 사례; 살곤충 단백질 (예를 들어, 바실루스 투린기엔시스(Bacillus thuringiensis) 살곤충 단백질)을 코딩하는 유전자; 제초제 내성 유전자 (예를 들어, 글리포세이트에 대한 내성을 제공하는 유전자); 및 트랜스제닉 식물에서 목적하는 표현형 (예를 들어, 증가된 수율, 변경된 지방산 대사물질, 또는 세포질 남성 불임의 회복)에 기여하는 유전자를 포함할 수 있다.
적어도 하나의 변형된 FAD3 유전자좌를 포함하는 식물 세포를 포함하는 트랜스제닉 식물은 하나 이상의 목적하는 형질을 가질 수 있다. 이러한 형질은, 예를 들어 곤충, 다른 해충, 및 병해 유발제에 대한 저항성; 제초제에 대한 내성; 안정성, 수율 또는 보관-수명 증진; 환경상의 내성; 제약 생산; 산업 제품 생산; 및 영양상 증진을 포함할 수 있다. 바람직한 형질은 바람직한 형질을 나타내는 식물에서 발현되는 FAD3 유전자좌에서의 표적화된 재조합에 의해 통합된 하나 이상의 핵산 분자에 의해 부여될 수 있다. 따라서, 일부 실시양태에서, 목적하는 형질은 적어도 하나의 변형된 FAD3 유전자좌의 부위에서의 식물의 게놈 내로 도입된 트랜스진(들)의 식물 내 존재에 의한 것일 수 있다. 추가 실시양태에서, 목적하는 형질은 형질이 적어도 하나의 변형된 FAD3 유전자좌에서 표적화된 재조합에 의해 통합된 하나 이상의 핵산 분자에 의해 부여될 수 있는 통상적인 육종을 통해 얻을 수 있다.
본 발명에 따른 트랜스제닉 식물은 임의의 방식으로 사용되거나 또는 배양될 수 있고, 여기서 적어도 하나의 변형된 FAD3 유전자좌의 존재는 바람직한 것이다. 따라서, 식물은, 특히 본 발명에 따른 적어도 하나의 FAD3 유전자좌에서 부위-특이적 방식으로 후속적으로 통합되는 핵산 분자로 형질전환되고, 관련 기술분야에서 통상의 기술자에게 공지된 임의의 방법에 의해 경작 및 배양됨으로써 하나 이상의 목적하는 형질을 갖도록 조작될 수 있다.
VII. FAD3 성능 유전자좌에 통합된 핵산을 포함하는 트랜스제닉 식물의 마커-지원 육종
브라시카(Brasicca) 종에서 Fad2 및 Fad3에 연관된 (예를 들어, 긴밀하게-연관된) 분자 마커가 제공된다. 예를 들어, HO 형질에 관련된 서열 (FAD3)을 함유하는 DNA 절편이 확인된다. 이들 절편은 게놈 연결 기의 돌연변이체 대립유전자에 연관된 (예를 들어, 긴밀하게-연관된) 마커 주위에 및 이들 사이에 위치한다. 따라서, 불활성화 돌연변이를 갖는 돌연변이체 FAD3 유전자를 포함하는 핵산 분자가 또한 제공된다. 부분적으로, 확인된 절편 및 그의 마커는 비. 나푸스 게놈에서의 연결 기에서 그의 위치에 의해 본 발명의 대상에 포함된다.
본원에 인용된 공개공보, 특허 및 특허 출원을 비롯한 모든 참고문헌은 이들이 본 개시내용의 명백한 상세한 설명과 불일치하지 않는 정도로 본원에 참조로 포함되고, 각 참고문헌이 참고문헌으로써 개별적으로 및 구체적으로 나타나고 그 전문이 본원에 기재된 것과 동일한 정도로 포함된다. 본원에서 논의된 참고 문헌은 단지 본 출원의 출원일 이전의 그의 개시내용에 대해서만 제공하는 것이다. 본 발명자들이 선행 발명으로 인해 이러한 개시내용에 대해 선행하는 권리가 없음을 용인하는 것으로 해석되는 것은 아니다. 하기 실시예는 특정 특별한 특징 및/또는 실시양태를 예시하기 위해 제공된다. 실시예는 예시되어 있는 구체적인 특징 또는 실시양태로 본 개시내용을 제한하는 것으로 간주되지는 않는다.
실시예
실시예
1: 박테리아 인공 염색체 라이브러리로부터
FAD3
표적 서열의 확인
BAC
라이브러리 구축
박테리아 인공 염색체 (BAC) 라이브러리는 상업적 공급원 (앰플리콘 익스프레스(Amplicon Express), 워싱턴주 풀만)으로부터 입수하였다. BAC 라이브러리는 브라시카 나푸스(Brassica napus) L. var. DH10275로부터 단리된 고분자량 게놈 DNA (gDNA) 단편을 함유하는 110,592개의 BAC 클론을 포함하였다. gDNA를 BamHI 또는 HindIII 제한 효소로 소화시켰다. 약 135 Kbp의 단리된 gDNA 단편을 pCC1BAC 벡터 (에피센트레(Epicentre), 위스콘신주 매디슨)에 라이게이션시키고, 에스케리키아 콜라이(Escherichia coli) str. DH10B (인비트로젠(Invitrogen))로 형질전환시켰다. BAC 라이브러리는 2개의 상이한 제한 효소를 사용하여 구축된 짝수 개의 BAC 클론으로 구성되었다. 이와 같이, Hind III 구축된 BAC 라이브러리는 144개의 개별 384-웰 플레이트로 함유되었다. 마찬가지로, BamHI 구축된 BAC 라이브러리는 144개의 개별 384-웰 플레이트로 함유되었다. 총 110,592개의 BAC 클론을 단리하고, 288개의 개별 384-웰 플레이트에 배열하였다. 288개의 개별 384-웰 플레이트는 각각 고속 PCR 기반 스크리닝을 위한 단일 DNA 추출용으로 공급원에 의해 제공되었다. 생성된 BAC 라이브러리는 대략 15 Gbp의 gDNA를 포괄하며, 이는 브라시카 나푸스 L. var. DH10275 게놈의 12-배 게놈 커버리지에 해당한다 (브라시카 나푸스 L. 게놈의 추정치는 문헌 [Johnston et al. (2005) Annals of Botany 95:229-235]에 기재된 바와 같이 약 1.132 Gbp임).
BAC
라이브러리로부터
단리된
FAD3
코딩 서열의 서열 분석
구축된 BAC 라이브러리를 사용하여 FAD3 유전자 코딩 서열을 단리하였다. 서열분석 실험을 수행하여 브라시카 나푸스 L. var. DH10275로부터의 6개의 FAD3 유전자 동조체 및 파라로그의 특정 유전자 서열을 확인하였다.
FAD3 유전자 서열이 처음에 모델 종 아라비돕시스 탈리아나에서 확인되었다. 유전자 서열은 진뱅크에 유전자좌 태그: At2g29980으로 열거된다. 모델 식물 종 아라비돕시스 탈리아나 및 이배체 브라시카 라파 (사배체 브라시카 나푸스의 조상 중 하나) 사이의 비교 게놈 상관관계는 이전에 기재되어 있다. (Schranz et al. (2006) Trends in Plant Science 11(11):535-542). FAD 유전자에 대한 특정의 관련성으로 미루어 보아 비교 분석시에 유전자의 3-4개 카피가 이배체 브라시카 게놈 내에서 발생할 수 있을 것으로 예상되었다. 추가의 유전자 맵핑 연구는 문헌 [Scheffler et al. (1997) Theoretical and Applied Genetics 94; 583-591]에 따라 완료되었다. 이러한 유전자 맵핑 연구의 결과는 FAD3 유전자의 6개의 카피가 브라시카 나푸스에 존재한다는 것을 보여주었다.
브라시카 나푸스로부터의 FAD3 유전자에 집중된 이전의 서열분석 시도에서 양쪽 A 및 C 게놈 특이적 카피를 확인하고, 유전자 맵핑하였다 (Hu et al., (2006) Theoretical and Applied Genetics, 113(3): 497-507). 종자 특이적 cDNA 라이브러리로부터의 EST 서열의 수집물이 이전에 구축되었으며, 캐나다 농업농산식품부(Agriculture and Agri-food Canada, 서스캐처원주 새스커툰 107 사이언스 플레이스)의 앤드루 샤프(Andrew Sharpe)에 의해 식물 세포주 DH12075로부터 서열분석되었다. 더욱이, 2배가 된 반수체 카놀라 식물 DH12075 전장 유전자 서열로부터의 EST의 수집물이 이용가능하지 않았기 때문에, 정확하게 호출된 뉴클레오티드의 서열 품질 및 신뢰도의 지침 또한 이용가능하지 않았다. 결과적으로, 상이한 FAD 유전자 서열 판독물 사이의 서열 변이는 명백하게 FAD3 유전자 패밀리의 다양한 동조체 및 파라로그의 상이한 유전자 카피에 기인할 수 없었으며, 게놈 서열도 이용가능하지 않았다. 그러나, EST 뿐만 아니라 2개의 FAD3A 및 FAD3C 전장 유전자 서열 (문헌 [Hu et al., (2006)]에 기재됨)을 사용하여 조합된 서열 분석을 수행하였을 때, 유전자 둘 다와 매치되는 EST를 추가의 4개의 반수체형과 함께 확인하였다. 그 결과, 총 6개의 특유한 FAD3 반수체형이 확인되었다. 다양한 FAD3 반수체형에 대한 모든 이용가능한 데이터의 어셈블리 후에, 엑손 1에서 높은 수준의 엑손 서열 분기가 확인되었다. 엑손 1에서 FAD3 서열의 분기는 유전자/대립유전자 특이적 PCR 프라이머의 설계에 이용될 수 있는 기회로 확인되었다. 또한, 반수체형 사이에서 최소로 분화된 엑손 (예를 들어, 엑손 5, 6, 7 및 8이 1-3 bp를 가지며, 이는 FAD3A 및 FAD3C 사이에서 달라짐) 또는 서열 변이가 없는 엑손 (예를 들어, 엑손 2 및 3)이 확인되었다.
비. 나푸스 L. var. DH12075로부터 구축된 BAC 라이브러리의 서열결정 분석에서 6개의 BAC 서열 (서열 1, 서열 2, 서열 3, 서열 4, 서열 5, 및 서열 6)을 단리하였으며, 이로부터 FAD3A (서열 7), FAD3A' (서열 8), FAD3A" (서열 9), FAD3C (서열 10), FAD3C" (서열 11), 및 FAD3C' (서열 12) 유전자에 대한 코딩 서열을 결정하였다. FAD3A, FAD3A', FAD3A", FAD3C, FAD3C", 및 FAD3C' 유전자 서열을 확인하고, 유전자 맵핑하였다.
6개의 FAD3 유전자의 서열 분석을 서열 정렬 프로그램 및 이웃-접합수 (동일성 백분율 사용)를 이용하여 수행하였다. 서열 정렬을 벡터 NTI 어드밴스 11.0 컴퓨터 프로그램 (라이프 테크놀로지스(Life Technologies), 캘리포니아주 칼스배드)으로부터의 얼라인X® 프로그램을 통해 만들고, 도 1에 제시하였다. 얼라인X®는 변형된 클러스탈 W 알고리즘을 이용하여 유사성 비교 및 주석달기를 위한 단백질 또는 핵산 서열의 다중 서열 정렬을 생성한다. 이웃-접합수를 잘뷰 v2.3® 소프트웨어로 생성하고, 도 2에 제시하였다. (Waterhouse et al. (2009) Bioinformatics 25 (9) 1189-1191). FAD3 유전자를 함유하는 것으로 확인된 콘티그를 아라비돕시스 탈리아나 유전자의 데이터베이스에 대한 BLASTn 쿼리(query)로 사용하였다. FAD3 유전자를 함유하는 6개의 콘티그 각각의 영역을 아라비돕시스 탈리아나 FAD3 유전자 (진뱅크 등록 번호 At2g29980)에 대한 비교를 통해 확인하였다. 이어서, FAD3 콘티그를 모든 FAD3 유전자가 5' → 3' 배향을 갖도록 배향하였다. FAD3 콘티그를 가능한 경우에 2개의 상류 (5') 및 1개의 하류 (3') 아라비돕시스 탈리아나 유전자를 함유하도록 트리밍하였다. 일단 배향되면 FAD3 유전자의 완전한 코딩 영역을 각 콘티그로부터 추출하고, 이를 이용하여 상이한 FAD3 유전자 패밀리 구성원 사이의 상관관계를 보여주는 이웃 접합수를 생성한다. 6개의 FAD3 패밀리 구성원을 FAD3 유전자의 3개의 쌍에 정렬시켰다 (도 2).
PCR 기반 스크리닝
상기 언급된 BAC 라이브러리를 스크리닝하기 위해 PCR 프라이머의 코호트를 설계하였다. 프라이머를 유전자 패밀리의 모든 구성원을 증폭시키는 범용 프라이머, 또는 표적화된 대립유전자 증폭을 위한 유전자 특이적 프라이머로 설계하였다. PCR 프라이머는 20 bp 길이 (+/- 1bp)가 되고 50% (+/- 8%)의 G/C 함량을 함유하도록 설계하였다. 표 1은 설계 및 합성된 프라이머를 열거한다. BAC 라이브러리의 클론을 모으고, 폴리머라제 연쇄 반응 (PCR)을 통해 스크리닝하였다.
표 1: FAD3 서열의 PCR 증폭에 사용된 프라이머 서열
폴리머라제 연쇄 반응 (PCR)에 2가지 상이한 세트의 조건을 이용하였다. 첫번째 시리즈의 PCR 반응은 다음을 함유하였다: 1X PCR 완충제 (dNTP 함유); 1.5 mM MgCl2; 200 μM의 0.25 U 이몰라제(Immolase)® DNA 폴리머라제 (바이오라인(Bioline), 영국 런던); 250 nM의 각 프라이머; 및 약 5-10 ng 주형 DNA. 두번째 시리즈의 PCR 반응은 게놈 DNA의 증폭을 위해 개발하였으며, 다음을 함유하였다: 5-10 ng의 게놈 DNA, 1X PCR 완충제, 2 mM dNTP, 0.4 μM 정방향 및 역방향 프라이머, 및 0.25 U 이몰라제® DNA 폴리머라제 (바이오라인, 영국 런던). 시약을 13 μL의 최종 부피로 모으고, MJ PTC200® 써모사이클러 (바이오라드(BioRad), 캘리포니아주 허큘레스) 또는 ABI 9700 진 앰프 시스템(Gene Amp System)® (라이프 테크놀로지스, 캘리포니아주 칼스배드)을 이용하여 증폭시켰다. 특정 플레이트의 PCR 기반 스크리닝을 상기 기재된 PCR 조건에서 문헌 [Bryan et al. (Scottish Crops Research Institute annual report: 2001-2002)]에 기재된 스크리닝 시스템에 기초한 4차원 스크리닝 접근법을 이용하여 수행하였다. 모은 BAC 라이브러리의 PCR 기반 스크리닝 후에; 증폭된 PCR 생성물을 직접적 생어(Sanger) 서열분석 방법을 이용하여 서열분석하였다. 증폭된 생성물을 빅다이(BigDye)® v3.1 프로토콜 (어플라이드 바이오시스템즈(Applied Biosystems))에 따라 에탄올, 아세트산나트륨 및 EDTA로 정제하고, ABI3730xl® 자동화 모세관 전기영동 플랫폼 상에서 전기영동을 수행하였다.
PCR 기반 스크리닝 및 입체형태적 생어 서열분석에 따라, 다양한 상이한 FAD3 유전자 패밀리 구성원을 함유하는 플레이트의 집단을 확인하였다. 총 6개의 특유한 FAD3 동조체 및 파라로그 유전자 서열이 확인되었다 (표 2). FAD3 유전자를 함유하는 플레이트 내에서의 특이적 웰 및 클론을 확인하기 위한 플레이트 스크리닝을 수행하기 위해 각각의 FAD3 유전자 서열당 총 2개의 플레이트를 선택하였다 (표 2). 양쪽 플레이트에서 특이적 웰을 확인하고, 각각의 FAD3 유전자 패밀리 구성원에서 개별 클론을 선택하였다 (표 2).
표 2: 양성 반응을 제공하는 BAC 클론 플레이트의 확인 (사용된 상세한 PCR 프라이머 조합 및 플레이트 내에서의 클론 확인을 위해 선택된 2개의 플레이트 Id).
각각의 확인된 FAD 유전자 패밀리 구성원에서 단일 BAC 클론을 서열분석을 통해 추가로 분석하였다. BAC 클론의 DNA를 단리하고, 라지 컨스트럭트 키트(Large Construct kit)® (퀴아젠(Qiagen), 캘리포니아주 발렌시아)를 제조업체의 지침에 따라 사용하는 서열분석을 위해 제조하였다. 추출된 BAC DNA는 GS-FLX 티타늄 기술® (로슈(Roche), 인디애나주 인디애나폴리스)을 제조업체의 지침에 따라 이용하는 서열분석을 위해 제조하였다. 최적의 데이터 산출을 위해 쌍별로 모은 BAC의 서열분석 반응을 물리적으로 분할된 GS-FLX TI 피코-타이터(Pico-titer) 플레이트®를 이용하여 수행하였다. BAC는 FAD2 유전자가 FAD3 유전자와 쌍을 형성하여 만든 쌍별로 조합하였다. 모든 생성된 서열 데이터를 뉴블러(Newbler) v2.0.01.14® (454 라이프 사이언시스, 코네티컷주 브랜포드)에 의해 어셈블리하였다. 어셈블리된 콘티그를 대응하는 FAD 유전자의 존재에 대해 시퀀셔(Sequencher) v3.7® (진코드스(GeneCodes), 미시간주 앤 아버)를 이용하여 수동적으로 평가하였다.
모든 6개의 FAD3 유전자의 전체 게놈 서열을 확인하고 완전히 특성화한 후에, 아연 핑거 뉴클레아제를 각각의 특정 유전자 패밀리 구성원에 대한 서열에 결합하도록 설계하였다.
실시예 2: FAD2 유전자에 특이적인 아연 핑거 결합 도메인의 설계
FAD3 유전자 유전자좌의 다양한 기능적 서열을 코딩하는 DNA 서열에 대해 지시된 아연 핑거 단백질을 이전에 기재된 바와 같이 설계하였다. 예를 들어, 문헌 [Urnov et al. (2005) Nature 435:646-651]을 참조한다. 예시적인 표적 서열 및 인식 나선은 표 3 (인식 나선 영역 설계) 및 표 4 (표적 부위)에 제시된다. 표 4에서, ZFP 인식 나선에 의해 접촉되는 표적 부위에서의 뉴클레오티드는 대문자로 나타내고; 접촉되지 않은 뉴클레오티드는 소문자로 나타낸다. 아연 핑거 뉴클레아제 (ZFN) 표적 부위는 FAD3의 7개의 표적 부위에 결합하도록 설계하였다. FAD3 아연 핑거 설계를, CCHC 구조의 핑거를 적어도 하나 갖는 단백질을 코딩하는 아연 핑거 발현 벡터에 도입하였다. 미국 특허 공보 번호 2008/0182332를 참조한다. 특히, 각 단백질에서 마지막 핑거는 인식 나선에 대해 CCHC 백본을 갖는다. 비-정규 아연 핑거-코딩 서열을 4개의 아미노산 ZC 링커 및 제아 메이스(Zea mays)로부터 유래된 opaque-2 핵 국재화 신호를 통해 유형 IIS 제한 효소 FokI의 뉴클레아제 도메인 (문헌 [Wah et al., (1998) Proc. Natl. Acad. Sci. USA 95:10564-10569]의 서열의 아미노산 384-579)에 융합시켜 FAD3 아연-핑거 뉴클레아제 (ZFN)를 형성하였다. 융합 단백질의 발현은 상대적으로 강한 구성적 프로모터, 예컨대 카사바 베인 모자이크(Cassava Vein Mosaic) 바이러스 (CsVMV) 프로모터로부터 유래되고 아그로박테리움 투메파시엔스(Agrobacterium tumefaciens) ORF23 3' 비번역 영역 (AtuORF23 3'UTR v1)에 의해 플랭킹된 프로모터에 의해 구동된다. 토세아 아시그나(Thosea asigna) (Szymczak et al., 2004)로부터의 바이러스 자기-가수분해 2A 코딩 뉴클레오티드 서열을 구축물에 클로닝된 2개의 ZFN 사이에 부가하였다. 예시적인 벡터는 하기 기재되어 있다.
최적의 아연 핑거는 이전에 활성 뉴클레아제를 확인하는 것으로 밝혀진 출아 효모 기반 시스템을 이용하여 절단 활성에 대해 검증하였다. 예를 들어, 미국 특허 공보 번호 20090111119; 문헌 [Doyon et al. (2008) Nat Biotechnol. 26:702-708; Geurts et al. (2009) Science 325:433]을 참조한다. 다양한 기능적 도메인에 대한 아연 핑거를 생체내 사용을 위해 선택하였다. 추정 FAD 게놈 폴리뉴클레오티드 표적 부위에 결합하도록 설계, 생산 및 시험된 다수의 ZFN 중에서, 높은 수준의 생체내 활성을 갖는 15개의 ZFN을 확인하고, 추가의 실험을 위해 선택하였다. 이러한 ZFN은 식물체내에서 특유한 FAD3 게놈 폴리뉴클레오티드 표적에 효율적으로 결합하여 이를 절단할 수 있는 것으로 특성화되었다.
표 3: FAD3 아연 핑거 설계
표 4: FAD3 아연 핑거의 표적 부위
실시예
3:
FAD3
유전자의 아연
핑거
뉴클레아제 절단의 평가
구축물 어셈블리
실시예 2에 기재된 바와 같이, 효모 검정을 이용하여 확인된, 예시적인 아연 핑거 뉴클레아제의 ZFN 발현 구축물을 함유하는 플라스미드 벡터를 관련 기술분야에 통상적으로 공지된 기술을 이용하여 설계하고 완성하였다. 각각의 아연 핑거-코딩 서열을 아연 핑거 뉴클레아제의 상류에 위치한, opaque-2 핵 국재화 신호를 코딩하는 서열에 융합시켰다 (Maddaloni et al. (1989) Nuc. Acids Res. 17(18):7532).
이어서, opaque-2 핵 국재화 신호::아연 핑거 뉴클레아제 융합 서열과 상보적 opaque-2 핵 국재화 신호::아연 핑거 뉴클레아제 융합 서열의 쌍을 형성하였다. 이에 따라, 각 구축물은 토세아 아시그나 바이러스로부터의 2A 서열에 의해 분리된 2개의 opaque-2 핵 국재화 신호::아연 핑거 뉴클레아제 융합 서열을 포함하는 단일 오픈 리딩 프레임을 포함하였다 (Mattion et al. (1996) J. Virol. 70:8124-8127). 융합 단백질의 발현은 상대적으로 강한 구성적 프로모터, 예컨대 카사바 베인 모자이크 바이러스 (CsVMV) 프로모터로부터 유래되고 아그로박테리움 투메파시엔스 ORF23 3' 비번역 영역 (AtuORF23 3'UTR)에 의해 플랭킹된 프로모터에 의해 구동된다.
벡터를 인-퓨전(In-FUSION)™ 어드밴티지 테크놀로지(Advantage Technology) (클론테크(Clontech), 캘리포니아주 마운틴 뷰)를 이용하여 어셈블리하였다. 제한 엔도뉴클레아제는 뉴 잉글랜드 바이오랩스(New England BioLabs) (NEB; 매사추세츠주 입스위치)로부터 입수하고, T4 DNA 리가제 (인비트로젠)를 DNA 라이게이션에 사용하였다. 플라스미드 제조는 뉴클레오스핀(NUCLEOSPIN)® 플라스미드 키트 (마슈레-나겔 인크.(Macherey-Nagel Inc.), 펜실베니아주 베들레헴) 또는 플라스미드 미디 키트 (퀴아젠)를 공급업체의 지침에 따라 사용하여 수행하였다. DNA 단편을 아가로스 트리스-아세테이트 겔 전기영동 후에 퀴아퀵(QIAquick) 겔 추출 키트™ (퀴아젠)를 사용하여 단리하였다. 모두 어셈블리된 플라스미드의 콜로니를 처음에 미니프렙 DNA의 제한 소화에 의해 스크리닝하였다. 선택된 클론의 플라스미드 DNA를 상업적인 서열분석 공급원 (유로핀스 MWG 오페론(Eurofins MWG Operon), 알라배마주 헌츠빌)에서 서열분석하였다. 서열 데이터를 어셈블리하고, 시퀀셔™ 소프트웨어 (진 코드스 코포레이션(Gene Codes Corp.), 미시간주 앤 아버)를 이용하여 분석하였다. 비. 나푸스 원형질체로 전달하기 전에, 플라스미드 DNA를 이. 콜라이의 배양물로부터 퓨어 일드(Pure Yield) 플라스미드 맥시프렙 시스템® (프로메가 코포레이션(Promega Corporation), 위스콘신주 매디슨) 또는 플라스미드 맥시 키트® (퀴아젠, 캘리포니아주 발렌시아)를 공급업체의 지침에 따라 사용하여 제조하였다.
생성된 11개의 플라스미드 구축물; pDAB107824 (ZFNs 28025-2A-28026), pDAB107815 (ZFNs 27961-2A-27962), pDAB107816 (ZFNs 27969-2A-27970), pDAB107817 (ZFNs 27973-2A-27974), pDAB107825 (ZFNs 28035-2A-28036), pDAB107826 (ZFNs 28039-2A-28040), pDAB107818 (ZFNs 27987-2A-27988), pDAB107827 (ZFNs 28051-2A-28052), pDAB107821 (ZFNs 28004-2A-28005), pDAB107819 (ZFNs 27989-2A-27990), pDAB107828 (ZFNs 28053-2A-28054) (도 3), pDAB107829 (ZFNs 28055-2A-28056) (도 4), pDAB107820 (ZFNs 27991-2A-27992), pDAB107822 (ZFNs 28021-2A-28022) 및 pDAB107823 (ZFNs 28023-2A-28024)을 제한 효소 소화 및 DNA 서열분석을 통해 확인하였다.
형질감염을 위한 DNA의 제조
상기 기재된 벡터의 플라스미드 DNA를 침전, 100% (v/v) 에탄올 중의 세척에 의해 멸균시키고, 층류 후드에서 건조시켰다. DNA 펠릿을 하기 기재되는 바와 같은 원형질체 세포로의 형질감염을 위해 0.7 μg/μl의 최종 농도로 30 μL의 멸균 이중-증류수에 현탁시켰다. 플라스미드 DNA의 제조는 일시적 형질감염에서는 슈퍼코일드(supercoiled) 플라스미드 DNA 및 안정한 형질감염의 경우에는 선형화된 플라스미드 DNA가 생성되도록 수행하였다. 운반 DNA (예를 들어, 어류-정자 DNA)를 형질전환 플라스미드에 부가하는 것은 원형질체 세포의 일시적 형질감염에서는 요구되지 않는다. 일시적 연구에서, 106개 원형질체당 약 30 μg의 플라스미드 DNA가 1회 형질전환에 사용되었다.
형질감염
브라시카 나푸스 L. var. DH10275의 형질감염은 문헌 [Spangenberg et al., (1986) Plant Physiology 66: 1-8]에 기재된 바와 같이 완료되었으며, 배지 제제는 문헌 [Spangenberg G. and Protrykus I. (1995) Polyethylene Glycol-Mediated Direct Gene Transfer in Tobacco Protoplasts. In: Gene Transfer to Plants. (Protrykus I. and Spangenberg G. Eds.) Springer-Verlag, Berlin]에 기재되어 있다. 브라시카 나푸스 종자를 70% 에탄올 중에서 표면 멸균시켰다. 종자를 12 mL의 70% 에탄올 용액에 침지시키고, 10분 동안 칵테일을 부드럽게 흔들어 혼합하였다. 용액을 경사분리하여 70% 에탄올 용액을 제거하고, 1% w/v 칼슘 하이포클로라이트 및 0.1% v/v 트윈-20의 종자 멸균 용액으로 교환하였다. 종자를 종자 멸균 용액에 침지시키고, 25분 동안 칵테일을 부드럽게 흔들어 혼합하였다. 종자 멸균 용액을 경사분리하고, 멸균된 종자를 50 mL의 멸균수로 3회 세정하였다. 최종적으로, 페트리 디쉬 안에 넣은 멸균 80 mm 와트만(Whatman) 여과지 디스크® (피셔-사이언티픽(Fisher-Scientific), 미주리주 세인트 루이스)에 종자를 옮기고, 종자를 멸균수로 약간 포화시켰다. 페트리 디쉬를 파라필름(Parafilm)® (피셔-사이언티픽, 미주리주 세인트 루이스)으로 밀봉하고, 플레이트를 25℃에서 완전히 어두운 상태로 1 내지 2일 동안 인큐베이션하였다. 묘목 발생 신호가 종자로부터 관찰된 후에, 묘목을 고형화된 GEM 배지를 함유하는 페트리 디쉬로 옮겨 추가의 종자 발아를 장려하였다. 묘목을 GEM 배지 상에서 4 내지 5일 동안 25℃에서 인큐베이션하였다.
소정 부피의 액체 PS 배지 (약 10 mL)를 멸균 페트리 디쉬로 경사분리하였다. 멸균 겸자 및 해부용 칼을 사용하여, 성장 및 발육의 4-잎 단계에서 4 내지 5일령의 묘목의 공기 부분을 제거하여 처리하였다. 소형 세포질-풍부 원형질체의 최고 집단을 생산하기 위해 20-40 mm 길이의 배축 절편을 결정하였다. 배축 절편을 무균 절제하고, 액체 PS 배지로 옮겼다. 절제된 배축 절편을 함께 분류하고, 가로로 5-10 mm의 절편으로 절단하였다. 이어서, 배축 절편을 새로운 PS 배지로 옮기고, 실온에서 1시간 동안 인큐베이션하였다. 원형질분리된 배축을 효소 용액을 함유하는 페트리 디쉬로 옮겼다. 모든 배축 절편을 주의깊게 용액에 침지시켰다. 페트리 디쉬를 파라필름®으로 밀봉하고, 부드럽게 흔들면서 20 - 22℃에서 16 내지 18시간 동안 밤새 인큐베이션하였다.
원형질체 세포를 배축 절편으로부터 방출시켰다. 밤샘 배축 소화물을 부드럽게 교반하여 원형질체를 효소 용액으로 방출시켰다. 페트리 디쉬를 약간 기울여서 효소 용액 및 식물 잔해물의 소화 용액의 전달을 보조하였다. 10 mL 피펫을 사용하여 소화 현탁액을 멸균된 원형질체 여과 (100 마이크로미터 메쉬의 필터) 장치로 옮겨 식물 잔해물로부터 원형질체를 추가로 분리하였다. 여과 장치를 가볍게 두드려 체에 남아있는 잉여 액체를 방출시켰다. 원형질체 현탁액, 약 8 내지 9 mL를 부드럽게 혼합하고, 14 mL 멸균 플라스틱 원형-바닥 원심분리 튜브에 분배하였다. 각각의 현탁액을 1.5 mL의 W5 용액 위에 올렸다. W5 용액을 기울여서 원형질체 현탁액 상에 주의깊게 분배하고, 최소의 교반으로 한 방울씩 분배하였다. W5 용액을 원형질체 현탁액에 첨가하여 원형질체 풍부 인터페이스를 생성하였다. 이러한 인터페이스를 피펫을 사용하여 수집하였다. 이어서, 수집된 원형질체를 새로운 14 mL 원심분리 튜브로 옮기고, 부드럽게 혼합하였다. 밀리리터당 원형질체의 수를 결정하기 위해 혈구계를 이용하여 수율 또는 수득된 원형질체를 측정하였다. 이 방법을 반복하였으며, 여기서 잎 조직을 소화시켜 엽육 원형질체를 생산하였다.
이어서, W5 용액을 10 mL의 부피로 첨가하고, 원형질체를 70 g에서 펠릿화한 후에, W5 용액을 제거하였다. 나머지 원형질체 현탁액을 부드럽게 진탕시켜 재현탁시켰다. 원형질체 현탁액을 함유하는 각각의 튜브를 5 mL의 W5 용액으로 채우고, 실온에서 1 내지 4시간 동안 인큐베이션하였다. 원형질체 현탁액을 70 g에서 펠릿화하고, 모든 W5 용액을 제거하였다. 이어서, 300 μL의 형질전환 완충제를 단리된 원형질체를 함유하는 각각의 펠릿화된 원형질체 현탁액에 첨가하였다. 각각의 튜브에, 10 μg의 플라스미드 DNA를 원형질체 현탁액에 첨가하였다. 플라스미드 DNA는 상기 기재된 아연 핑거 뉴클레아제 구축물을 포함하였다. 이어서, 300 μL의 예열된 PEG 4000 용액을 원형질체 현탁액에 첨가하고, 튜브를 가볍게 두드렸다. 원형질체 현탁액 및 형질전환 혼합물을 어떠한 교반도 없이 15분 동안 실온에서 인큐베이션하였다. 추가의 10 mL의 W5 용액을 각각의 튜브에 1 mL, 1 mL, 1 mL, 2 mL, 2 mL, 및 3 mL의 순차적 분취액으로 첨가하였으며, W5 용액의 각 첨가 사이에 튜브를 부드럽게 전도시켰다. 원형질체를 원심분리기에서 70 g로 회전시켜 펠릿화하였다. 모든 W5 용액을 제거하여 순수한 원형질체 현탁액을 남겼다.
이어서, 0.5 mL의 K3 배지를 펠릿화된 원형질체 세포에 첨가하고, 세포를 재현탁시켰다. 재현탁된 원형질체 세포를 페트리 디쉬의 중앙에 놓고, 5 mL의 K3 및 0.6 mL 씨 플라크(Sea Plaque)™ 아가로스 (캠브렉스(Cambrex), 뉴저지주 이스트 러더포드)를 1:1 농도로 첨가하였다. 페트리 디쉬를 단일의 부드러운 소용돌이 운동으로 진탕시키고, 20-30분 동안 실온에서 인큐베이션하였다. 페트리 디쉬를 파라필름®으로 밀봉하고, 원형질체를 완전히 어두운 상태에서 24시간 동안 배양하였다. 어두운 상태에서 인큐베이션한 후에, 페트리 디쉬를 희미한 광 (5 μMol m-2 s-1의 오스람(Osram) L36 W/21 루미룩스(Lumilux) 백색 튜브) 상태에서 6일 동안 배양하였다. 배양 단계 후에, 멸균 스패튤라를 사용하여 원형질체를 함유하는 아가로스를 사등분하였다. 분리된 사분원을 20 mL의 A 배지를 함유하는 250 mL 플라스틱 배양 용기에 넣고, 80 rpm 및 1.25 cm 스로에서의 회전 진탕기 상에서 14일 동안 24℃에서 연속적인 희미한 광 상태로 인큐베이션한 후에, 각각의 ZFN 구축물의 활성의 수준을 결정하기 위한 분석을 수행하였다.
카놀라 원형질체로부터의 게놈 DNA 단리
형질감염된 원형질체를 개별 1.5 또는 2.0 mL 미세원심분리기 튜브에 공급하였다. 세포를 완충제 용액 중에 튜브 바닥에서 펠릿화하였다. 액체 질소 중에서 세포를 급속 냉동시킨 후에 에이 랩콘코 프리존 4.5(a Labconco Freezone 4.5)® (랩콘코(Labconco), 미주리주 캔자스 시티)에서 약 48시간 동안 -40℃ 및 약 133 x 10-3 mBar 압력에서 세포를 동결 건조시킴으로써 DNA 추출을 수행하였다. 조직 파괴가 요구되지 않으며 원형질체 세포를 용해 완충제에 직접 첨가하는 것을 예외로 하고, 제조업체의 지침에 따라 DNeasy® (퀴아젠, 캘리포니아주 칼스배드) 식물 키트를 사용하여 동결건조된 세포에서 DNA를 추출하였다.
카놀라
원형질체에서의 게놈 DNA 서열 절단에 대한
FAD3A
및
FAD3C
ZFN의
시험
FAD3A 및 FAD3C 유전자 유전자좌 내의 ZFN 표적 부위의 설계를 클러스터링하여, ZFN의 다중 쌍이 표적 부위에서 중첩되도록 설계하였다. ZFN 표적 부위의 클러스터링은 모든 중첩 ZFN 표적 부위를 포함하도록 100 bp 윈도우 내의 모든 FAD3A 및 FAD3C 유전자 패밀리 구성원으로부터의 플랭킹 게놈 서열을 증폭시키는 PCR 프라이머를 설계할 수 있다. 이에 따라, 일루미나 짧은 판독 서열 기술을 이용하여 형질감염된 원형질체의 표적 ZFN 부위의 완전성을 평가할 수 있다. 또한, 설계된 PCR 프라이머는 서열 판독물이 FAD3A 및 FAD3C 유전자 패밀리의 특정 유전자 구성원에 기인하는 특정 뉴클레오티드 염기를 포함할 필요가 있다. 따라서, 모든 PCR 프라이머는 비-상동 말단 접합부 (NHEJ) 활성이 프라이밍 부위를 제거하고, 증폭을 억제하여 NHEJ 활성의 평가를 왜곡시킬 수 있는 작은 결실을 유발하는 것으로 알려져 있으므로 임의의 ZFN 표적 절단 부위로부터 5-10개 뉴클레오티드만큼 떨어져 결합하는 것이 요구될 것이다.
프라이머는 FAD3A 및 FAD3C 유전자 패밀리 (표 5)에 대한 모든 ZFN 표적 유전자좌에 결합하도록 설계하였고, 경험적으로 PCR 증폭 생성물의 생어 기반 서열분석을 통해 모든 유전자 패밀리 구성원의 증폭물을 시험하였다. 몇몇 경우에는, 모든 유전자 패밀리 구성원 (표 6)을 구별하는 프라이머가 개발될 수 없었으나, 모든 경우에서 FAD3A 및 FAD3C의 표적 유전자 서열은 구별될 수 있었다. PCR 프라이머 설계에 따라, 주문 DNA 바코드 서열을, 상이한 ZFN 표적 유전자좌를 구별하고 형질감염 및 ZFN에 특이적인 서열 판독물을 확인하는데 사용되는 PCR 프라이머에 혼입시켰다 (표 5 및 6).
표 5: FAD3 유전자 패밀리 상의 설계된 PCR 프라이머의 증폭 성능. "X"는 유전자 카피 검출 특이성을 나타내고, 회색 음영 및 "+"는 해당하는 특정 유전자좌에서 2개의 프라이머에 의해 설계된 서열 판독물이 구별될 수 없음을 나타내고, "N/A"는 유전자좌가 이들 특정 유전자 카피로부터 증폭될 수 없음을 나타낸다.
표 6: 활성의 FAD3 ZFN 평가를 위해 설계된 프라이머 서열. 프라이머는 서열분석-합성 분석에 대한 일루미나 라이브러리의 구축을 위해 필요한 일루미나 어댑터 서열 둘 다와 함께, 통상의 바코드를 포함한다. 구입한 프라이머는 나타낸 3개의 칼럼 모두의 합계였다.
ZFN으로 형질감염된 카놀라 원형질체의 DNA 추출 후에, 표적 ZFN 유전자좌의 PCR 증폭을 수행하여 합성 기술에 의한 일루미나 기반 서열분석에 올바른 포맷으로 필수 유전자좌 특이적 DNA 분자를 생성하였다. 각 검정을 25 ng 개시 DNA (브라시카 나푸스 게놈의 약 12,500개 세포 등가물) 상에서 작업하는데 최적화시켰다. 적절한 수준에서 NHEJ 효율 및 특이성을 평가하는데 요구되는 커버리지를 제공하기 위해 샘플당 다중 반응을 수행하였다 (개별 원형질체로부터 수득한 브라시카 나푸스 게놈의 200,000개 카피에 대해 약 16회 PCR 반응이 상응함). 동일한 검정으로 시험할 모든 샘플에 대해 PCR 증폭 마스터-믹스를 만들고, 하나의 반응 (삼중으로 수행함)을 표적 조직 상에서 수행되는 사이클의 최적의 수 (PCR 증폭이 시약에 제한받지 않고 여전히 지수적 증폭 단계에 있도록 보장함)를 결정하는데 사용되는 정량적 PCR 방법을 이용하여 검정하였다. 필수 음성 대조 반응을 이용한 실험을 96 웰 포맷으로 MX3000P 써모사이클러® (스트라타진(Stratagene), 캘리포니아주 라졸라)를 이용하여 수행하였다.
정량적 PCR 플랫폼으로부터 모은 결과로부터, 형광의 상대적 증가를 사이클-대-사이클로부터 플롯팅하고, 통상의 전사체 또는 분자의 오버 사이클링 및 증폭을 감소시키기 위한 시도로, 반응이 시약에 제한받게 되는 것을 허용하지 않으면서, 충분한 증폭을 전달할 사이클 수를 검정마다 결정하였다. 미사용 마스터 믹스는 정량적 PCR 분석을 마치고 사이클 수가 결정될 때까지 얼음 상에 두고, 이후에 원하는 개수의 반응 튜브 (ZFN 검정당 약 16개)에 분취하고, PCR 반응을 수행하였다.
증폭 후에, 단일 ZFN 유전자좌에 대한 샘플을 함께 모으고, ZFN당 모은 생성물 200 μL를 민일루트(MinElute) PCR 정제 키트® (퀴아젠)를 제조업체의 지침에 따라 사용하여 세정하였다. 일루미나 짧은 판독 기술을 이용한 샘플의 서열분석을 가능하게 하기 위해 추가의 쌍형성된 말단 프라이머는 생성된 단편 상에 증폭에 의해 부착시킬 필요가 있었다. 이는 증폭의 제1 라운드에서 첨가되는 서열에 부분적으로 상보적이며, 또한 요구되는 쌍형성된 말단 서열을 함유하는 프라이머를 사용하는 PCR 증폭에 의해 달성되었다. 주형에 대한 통상의 단편을 과다 증폭시키지 않고 쌍형성된 말단 서열을 첨가하는, 수행하기에 최적인 PCR 사이클 수를 다시 이전에 기재된 바와 같이 정량적 PCR 사이클 분석을 통한 서열 통과를 이용하여 결정하였다.
PCR 증폭 후에, 생성된 생성물을 민일루트 칼럼® (퀴아젠)을 제조업체의 지침에 따라 사용하여 세정하고, 2.5% 아가로스 겔 상에서 분할시켰다. 사이버® 세이프(Syber® Safe) (라이프 테크놀로지스, 캘리포니아주 칼스배드)를 이용하여 정확한 크기의 밴드로 시각화된 DNA 단편을 겔 추출하여 임의의 잔류 PCR 생성된 프라이머-이량체 또는 다른 허위 단편을 제거하고, DNA를 겔 슬라이스로부터 민일루트 겔 추출 키트® (퀴아젠)를 제조업체의 지침에 따라 이용하여 추출하였다. 겔 추출 완료 후에, 앰퓨어(AMPure) 자기 비드® (베크만-쿨터(Beckman-Coulter), 캘리포니아주 브리)를 1:1.7의 DNA 대 비드 비로 사용하여 추가의 DNA 세정을 수행하였다. 이어서, DNA를 일루미나 서열분석 (KAPA)을 위해 정량적 PCR 기반 라이브러리 정량화 키트를 사용하여 농도에 대해 평가하였으며, 이 때 1/40,000 및 1/80,000 희석을 이용하고 반응은 삼중으로 수행하였다. 정량적 PCR 결과에 기초하여 DNA를 2 nM의 표준 농도로 희석하고, DNA 서열분석을 위해 모든 라이브러리를 합하였다. 씨보트 클러스터(cBot cluster) 생성 키트® (일루미나, 캘리포니아주 샌디에고)를 사용하는 서열분석을 위한 샘플을 제조하고, 100 bp 쌍형성된-말단 서열분석 판독물로 제조업체 지침에 따라 일루미나 GA2x® 상에서 서열분석하였다.
표적 아연
핑거
부위에서의 비-상동 말단 접합부의 검출을 위한 데이터 분석 방법
서열분석 반응의 완료 및 염기 호출을 위해 일루미나 생물정보 파이프라인을 이용하여 수행된 일차 데이터 호출 후에, 각각의 경우에 표적 ZFN 부위에서 결실된 염기를 확인하기 위해 완전한 분석을 수행하였다. 입력 서열의 목록에 따라 컴퓨터 계산에 의해 DNA 서열로부터 바코드를 추출 및 분류하기 위해 주문 PERL 스크립트를 설계하였다. 바코드는 오귀인 서열 판독물을 감소시키기 위해 허용되는 30 초과의 Phred 스코어로 참조 서열과 매치되어야 한다. 서열 판독물이 사용된 상이한 바코드 군에 비닝된 후에, 품질 필터를 모든 서열을 가로질러 통과시켰다. 품질 필터는 제2의 주문 개발된 PERL 스크립트였다. "N"으로 호출된 염기가 3개 초과하여 존재하거나 또는 중간 Phred 스코어가 20 미만이거나 또는 20 미만의 Phred 스코어를 갖는 3개 연속적 염기가 존재하거나 또는 서열 판독물의 길이가 40 bp 미만인 경우에 서열 판독물을 제외시켰다. 쌍형성된 서열 판독물이 둘 다 넥스트진(NextGENe)® (소프트제네틱스(SoftGenetics), 펜실베니아주 스테이트 컬리지) 패키지를 이용하여 사용가능한 경우에 나머지 서열을 합하였다. 이어서, 나머지 합쳐진 서열 판독물을 나머지 서열 식별자의 말단 상에 기록되는 확인된 여분의 서열의 수의 카운트와 제3의 주문 PERL 스크립트를 이용하여 특유한 서열 판독물의 집합으로 축소시켰다. 이어서, 특유한 서열 판독물을 갭이 있는 FASTA 정렬된 파일을 생성하는 넥스트진® 소프트웨어를 이용하여 FAD3 참조 서열에 정렬시켰다.
갭이 있는 FASTA 파일을 이용하여 갭이 있는 염기 위치 번호의 입력 참조물로의 전환를 제4의 주문 PERL 스크립트로 수행하였다. 이는 상이한 유전자 패밀리 구성원을 식별하는 염기 (상이한 유전자 패밀리 구성원 사이의 동조 또는 파라로그 서열 변이)가 어셈블리된 데이터에서 확인될 수 있도록 한다. 염기 넘버링의 전환이 수행되면, 각각의 특유한 서열 판독물에 대한 반수체형 보고의 생성 및 특정 유전자 패밀리 구성원에 대한 판독물의 할당이 가능하였다. 판독물이 유전자에 의해 분류되면, ZFN 표적 부위를 둘러싼 10 bp 윈도우가 확인 및 평가되었다. 유전자당 결실이 있는 서열의 수를 결실된 염기의 수와 함께 기록하였다.
이어서, 데이터를 10,000개 서열 판독물당 표적 ZFN 부위에서 결실된 1 내지 10개 염기를 갖는 서열의 수와 함께 다중선 그래프로서 그래프로 나타내었다. 이러한 분석을 모든 ZFN 형질감염과 대조 형질감염에 대해 수행하였다. 몇몇 경우에, 천연 DNA 서열에서의 반복부는 표적 ZFN 부위에서의 서열분석 오류를 증가시키며, 이러한 오류는 통상적으로 둘 다 ZFN 또는 대조군으로 형질감염된 모든 샘플에서 보고된 단일 염기 결실의 출현율의 증가로 나타날 수 있다.
이러한 결과로부터 FAD3A 및 FAD3C 표적 부위에서 최고 수준의 ZFN 활성을 NHEJ의 보다 큰 활성에 의해 결정된 바와 같이 관찰하였다. 유의한 게놈 DNA 절단 활성 및 최소 비-표적 활성의 특성이 주어지는 조작된 트랜스진 통합 플랫폼 (Engineered Transgene Integration Platform; ETIP)의 식물체내 표적화를 위해 플라스미드 pDAB107828 상에서 코딩된 ZFN (즉, ZFN28053 및 28054) 및 pDAB107829 상에서 코딩된 ZFN (즉, ZFN28055 및 28056)을 선택하였다.
실시예
4: 조작된
트랜스진
통합 플랫폼 (
ETIP
)
카놀라
식물 세포주를 위한 DNA 구축물
하기 기재된 플라스미드 벡터 구축물을 관련 기술분야의 통상의 기술자에게 통상적으로 공지된 방법 및 기술을 이용하여 구축하였다. 본 단락 내에 기재된 특정 시약 및 기술의 적용은 용이하게 관련 기술분야의 통상의 기술자에게 공지되어 있으며, 플라스미드 벡터 구축물을 구축하고자 하는 목적을 달성하기 위해 다른 시약 및 기술과 용이하게 교환될 수 있다. 제한 엔도뉴클레아제는 뉴 잉글랜드 바이오랩스 (NEB; 매사추세츠주 입스위치)로부터 입수하였다. 라이게이션을 T4 DNA 리가제 (인비트로젠, 캘리포니아주 칼스배드)로 완수하였다. 하나의 진입 벡터를 단일 목적지 벡터에 어셈블리하기 위해 게이트웨이(GATEWAY)® LR 클로나제(CLONASE)® 효소 믹스 (인비트로젠)를 사용하여 게이트웨이 반응을 수행하였다. 하나의 진입 벡터를 단일 목적지 벡터에 어셈블리하기 위해 인-퓨전™ 어드밴티지 테크놀로지 (클론테크, 캘리포니아주 마운틴 뷰)를 이용하여 인-퓨전™ 반응을 수행하였다. 뉴클레오스핀® 플라스미드 키트 (마슈레-나겔 인크., 펜실베니아주 베들레헴) 또는 플라스미드 미디 키트® (퀴아젠)를 공급업체의 지침에 따라 사용하여 플라스미드 제조를 수행하였다. 아가로스 트리스-아세테이트 겔 전기영동 후에 퀴아퀵 겔 추출 키트™ (퀴아젠)를 사용하여 DNA 단편을 단리하였다. 모든 어셈블리된 플라스미드의 콜로니를 처음에 미니프렙 DNA의 제한 소화에 의해 스크리닝하였다. 선택된 클론의 플라스미드 DNA를 상업적 서열분석 공급원 (유로핀스 MWG 오페론, 알라배마주 헌츠빌)에서 서열분석하였다. 시퀀셔™ 소프트웨어 (진 코드스 코포레이션, 미시간주 앤 아버)를 이용하여 서열 데이터를 어셈블리하고 분석하였다.
대조 벡터
대조 벡터를 사용하여 형광 활성화 세포 분류 (FACS) 세포 기반 분류 방법을 개발하였다. 2개의 유전자 발현 카세트를 포함하는 대조 벡터, pDAS000031 (도 10: 서열 85로서의 T-가닥 삽입물)을 구축하는데 표준 클로닝 방법을 이용하였다. 제1 유전자 발현 카세트는 콜리플라워 모자이크 바이러스 19s 프로모터 (CaMV 19S 프로모터; Shillito, et al., (1985) Bio/Technology 3; 1099-1103) :: 히그로마이신 내성 유전자 (hph(HygR);미국 특허 번호 4,727,028) :: 아그로박테리움 투메파시엔스 오픈 리딩 프레임 1 3' 비번역 영역 (AtORF1 종결인자; Huang et al., (1990) J. Bacteriol. 1990 172:1814-1822)을 함유하였다. 제2 유전자 발현 카세트는 아라비돕시스 탈리아나 유비퀴틴 10 프로모터 (AtUbi10 프로모터; Callis, et al., (1990) J. Biol. Chem., 265: 12486-12493) :: dsRED (dsRED(D); 미국 특허 번호 6,852,849) 및 아라비돕시스로부터의 인트론 (인트론 #1; 진뱅크: AB025639.1) :: 아그로박테리움 투메파시엔스 오픈 리딩 프레임 23 3' 비번역 영역 (AtORF23 종결인자; 미국 특허 번호 5,428,147)을 트랜스 배향 (예를 들어, 헤드 대 헤드 배향)을 갖는 인-프레임 융합체로서 함유하였다. 플라스미드 벡터를 인-퓨전™ 어드밴티지 테크놀로지 (클론테크, 캘리포니아주 마운틴 뷰)를 이용하여 어셈블리하였다.
실시예
5:
ETIP
카놀라
식물 세포주의 생성
브라시카 나푸스의 형질전환
FAD3A 및 FAD3C 부위 특이적 구축물 (pDAS000271-pDAS000275)에 대한 ETIP 구축물 및 수반되는 ZFN (pDAB107828 및 107829) 및 대조군 DS-Red 대조 구축물 (pDAS000031)은 이전에 실시예 4에 기재되어 있다. 이들 이원 벡터를 아그로박테리움 투메파시엔스 균주 GV3101: PM90으로 형질전환시켰다. 브라시카 나푸스 원형질체 세포의 형질전환은 일부 변형된 실시예 3에 기재된 형질감염 프로토콜을 이용하여 완수하였다.
프로토콜에 대한 변형은 씨 플라크™ 아가로스를 대신한 알긴산나트륨의 사용을 포함하였다. ZFN 구축물 및 ETIP 구축물이 둘 다 브라시카 나푸스 원형질체 세포로 공동-전달되는 형질감염 실험은 5:1 몰비의 플라스미드 DNA를 포함하는 DNA 농도에서 완수하였다. 다른 ETIP 및 대조 플라스미드 구축물을 30 μg의 플라스미드 DNA 농도에서 형질감염시켰다.
프로토콜에 대한 부가의 변형은 1.5 mg/mL의 히그로마이신을 함유하는 배지 중에서 형질전환된 원형질체 세포로부터 온전한 식물을 증폭시키는 것을 포함하였다. 온전한 식물의 증폭은 A 배지를 2주마다 교체하고 원형질체-유래된 콜로니의 성장을 모니터링하는 것을 필요로 한다. 원형질체-유래된 콜로니가 대략 2-3 mm의 직경으로 성장한 후에, 이러한 콜로니를 고형화된 MS 모르포 배지를 함유하는 12-웰 코스타(Costar)® 플레이트 (피셔 사이언티픽(Fisher Scientific), 미주리주 세인트 루이스)의 개별 웰로 옮겼다. 캘러스가 8-10 mm 직경의 크기로 증식할 때까지 플레이트를 1 내지 2주 동안 24℃에서 지속적인 희미한 광 상태에서 인큐베이션하였다. 원형질체 세포가 1-2 cm 직경의 크기에 도달한 후에, 이러한 원형질체 세포를 MS 모르포 배지를 함유하는 개별 250 mL 배양 용기로 옮겼다. 용기를 16시간 광 (20 μMol m-2 s-1의 오스람 L36 W/21 루미룩스 백색 튜브) 및 8시간 어둠 조건 하에 24℃에서 인큐베이션하였다. 1 내지 2주 내에, 여러 개의 신초를 볼 수 있었다. 신초가 3-4 cm 의 길이에 도달한 후에, 이를 MS 배지를 함유하는 250 mL 배양 용기로 옮겼다. 250 mL 배양 용기를 16시간 광 (20 μMol m-2 s-1의 오스람 L36 W/21 루미룩스 백색 튜브) 및 8시간 어둠 조건 하에 24℃에서 인큐베이션하였다. 신초는 묘목으로 클 때까지 배양 용기에서 유지하고, 묘목이 되었을 때 온실로 옮겨 성장시킴으로써 성숙시켰다.
실시예 6: 카놀라에서 ETIP를 함유하는 T-DNA의 통합의 분자 확인
게놈 DNA를 모든 추정 트랜스제닉 식물의 잎 조직으로부터 DNeasy 96 식물 DNA 추출 키트™ 또는 DNeasy 식물 미니 키트™ (퀴아젠)를 사용하여 추출하였다. 각 식물로부터의 게놈 DNA는 에이. 투메파시엔스의 영속성에 대해 시험하기 위해 virC를 증폭시키도록 설계된 프라이머; pTiC58 정방향 (서열 88 CGAGAACTTGGCAATTCC) 및 pTiC58 역방향 (서열 89 TGGCGATTCTGAGATTCC), 게놈 DNA의 품질을 확인하기 위해 비. 나푸스로부터 액틴을 증폭시키도록 설계된 프라이머; 액틴 정방향 (서열 90 GACTCATCGTACTCTCCCTTCG) 및 액틴 역방향 (서열 91 GACTCATCGTACTCTCCCTTCG)을 사용하여 PCR에 의해 분석하였다. 프라이머는 ETIP에 의해 코딩되는 hph 유전자를 증폭시키도록 설계하였다; HPH 정방향 (서열 92 TGTTGGTGGAAGAGGATACG) 및 HPH 역방향 (서열 93 ATCAGCAGCAGCGATAGC). 액틴 및 hph에 대한 프라이머로 증폭될 때 virC 프라이머로부터의 생성물은 제공하지 않았으나 그로부터 정확한 크기의 앰플리콘을 생성하는 식물을 트랜스제닉으로 확인하였다.
제2 스크린을 완수하였으며, 여기서 각각의 트랜스제닉 식물로부터의 gDNA를 T-DNA 영역 외의 이원 벡터를 증폭시키도록 설계된 5개 세트의 프라이머 [(1F 서열 94 ATGTCCACTGGGTTCGTGCC; 1R 서열 95 GAAGGGAACTTATCCGGTCC) (2F 서열 96 TGCGCTGCCATTCTCCAAAT; 2R 서열 97 ACCGAGCTCGAATTCAATTC) (3F 서열 98 CCTGCATTCGGTTAAACACC; 3R 서열 99 CCATCTGGCTTCTGCCTTGC) (4F 서열 100 ATTCCGATCCCCAGGGCAGT; 4R 서열 101 GCCAACGTTGCAGCCTTGCT) (5F 서열 102 GCCCTGGGATGTTGTTAAGT; 5R 서열 103 GTAACTTAGGACTTGTGCGA)]를 사용하여 PCR에 의해 분석하였다. 정확하고 예상되는 크기의 PCR 생성물이 프라이머 세트 3 및 4로 증폭된 식물을 백본 통합을 갖는 것으로 간주하였다.
백본 통합을 갖지 않는 식물로부터의 DNA를 20 g의 잎 조직으로부터 변형된 CTAB 방법 (Maguire et al., (1994) Plant Molecular Biology Reporter, 12( 2): 106-109)을 이용하여 정제하였다. 단리된 gDNA를 여러 제한 효소로 소화시키고, 10 μg의 gDNA를 아가로스 겔 상에서 전기영동에 의해 분리하고, 표준 서던 블롯팅 프로토콜을 이용하여 막으로 옮겼다. DIG 이지 Hyb 시스템(DIG Easy Hyb System)™ (로슈, 캘리포니아주 사우스 샌프란시스코)을 제조업체의 지침에 따라 이용하여 막을 프로빙하였다. ELP에 대한 각각의 발현 카세트 및 내인성 대조 유전자, 액틴에 대한 프로브를 ETIP 구축물로부터 하기 프라이머: (IPT-F 서열 104 TCTCTACCTTGATGATCGG; IPT-R 서열 105 AACATCTGCTTAACTCTGGC; dsRED-F 서열 106 ATGGCTTCATCTGAGAACG; dsRED-R 서열 107 TTCCGTATTGGAATTGAGG; PAT-F 서열 108 TTGCTTAAGTCTATGGAGGCG; PAT-R 서열 109 TGGGTAACTGGCCTAACTGG; ELP-F 서열 110 ATGATATGTAGACATAGTGGG; ELP-R 서열 111 AGGGTGTAAGGTACTAGCC; Hph-F 서열 112 TGTTGGTGGAAGAGGATACG; Hph-R 서열 113 ATCAGCAGCAGCGATAGC; 액틴-F 서열 114 GTGGAGAAGAACTACGAGCTACCC; 액틴-R 서열 115 GACTCATCGTACTCTCCCTTCG)를 사용하여 증폭시켰다.
ETIP 서열을 오직 ETIP의 단일 카피를 함유하는 모든 식물로부터 증폭시키고 서열분석하였다. 각각의 T-DNA 삽입물의 서열을 ABI3730xI™ (어플라이드 바이오시스템즈, 라이프 테크놀로지스)를 이용하는 PCR 생성물의 직접적 서열분석에 의해 분석하였다. T-DNA 삽입물을 게놈 DNA로부터, 퓨전 핫 스타트 II 폴리머라제(Phusion Hot Start II Polymerase)™ (핀자임스(Finnzymes), 써모 피셔 사이언티픽)를 사용하여 증폭시켰다. T-DNA의 증폭 반응은 대략 2 Kbp 길이의 중첩 서열을 증폭시키기 위한 다중 프라이머 쌍으로 완수하였다. 각각의 PCR 생성물을 완전한 커버리지를 보장하기 위해 다중 프라이머로 서열분석하였다. PCR 반응물을 새우 알칼리성 포스파타제 및 엑소뉴클레아제 I (어플라이드 바이오시스템즈, 라이프 테크놀로지스)로 처리하여 PCR 반응물의 서열분석 이전에 잉여 프라이머를 불활성화시켰다. 각각의 단일 카피 ETIP 세포주의 T-DNA 삽입물에 플랭킹된 서열은, 정제된 게놈 DNA를 8개의 제한 엔도뉴클레아제로 별도로 소화시킨 후에 이러한 제한 엔도뉴클레아제에 의해 생성된 오버행에 특이적인 이중-가닥 어댑터를 라이게이션하여 확인하였다. 이러한 라이게이션 단계 후에, PCR을 ETIP의 3' 또는 5' 말단에 대한 비오티닐화 프라이머 및 각각의 어댑터에 대한 프라이머로 수행하였다. PCR 생성물을 포획하고, 앰퓨어 고상 가역적 고정화 (SPRI) 비즈(Ampure Solid Phase Reversible Immobilization (SPRI) beads)™ (아젠커트 바이오사이언스 코포레이션(Agencourt Bioscience Corporation), 베크만 쿨터 컴퍼니) 상에서 세정하였다. 네스티드(nested) PCR을 수행하고, 모든 생성물은 ABI 생어 서열분석 및 빅 다이 터미네이터 v3.1 사이클™ 서열분석 프로토콜 (어플라이드 바이오시스템즈, 라이프 테크놀로지스)을 이용하여 서열분석하였다. 서열 데이터는 시퀀셔™ 소프트웨어 (진 코드스 코포레이션, 미시간주 앤 아버)를 이용하여 어셈블리하고 분석하였다.
아연 핑거 뉴클레아제 및 pDAS000271-PDAS000275 ETIP 구축물로 형질전환된 ETIP 트랜스제닉 카놀라의 결과
ETIP 및 ZFN 구축물의 형질전환을 통해 생성된 트랜스제닉 브라시카 나푸스 사례는 FAD3A 유전자좌 내의 pDAS000273 또는 pDAS275로부터, 및 pDAS000271, pDAS000272 또는 pDAS000274로부터 FAD3C 유전자좌로의 ETIP 폴리뉴클레오티드 서열의 단일 카피, 전장 T-가닥 삽입물의 통합을 발생시킨다. 3 내지 4개의 사례가 완전하게 특성화되었으며, 통합된 ETIP를 함유하는 것으로 확인되었다. 인-아웃 PCR 증폭 방법을 이용하여 확인을 완료하고, 서던 블롯을 통해 추가로 검증하였다. 선택된 T0 사례를 발육의 T1 단계로 성장시켰다. 통합된 T-가닥의 접합성을 결정하기 위해 T1 식물을 다시 스크리닝하였다. 스크리닝된 사례를 동형접합, 반접합, 또는 널로 분류하였다.
이전에 기재된 방법을 통해 원형질체를 생성하는데 동형접합 사례를 이용하였다. 이후에, 원형질체를 ETIP 서열 내에 혼입된 아연 핑거 결합 부위를 표적화하도록 설계된 ZFN 및 ETIP의 특정 영역과 상동성을 공유하는 공여자 플라스미드로 공동-형질전환시켰다. ZFN은 ETIP 유전자좌를 절단하고, 공여자 플라스미드는 상동성 지시된 복구를 통해 브라시카 나푸스 세포의 게놈 내에 통합된다. 공여자 플라스미드의 통합의 결과로서, 부분 DS-red 트랜스진을 전장 DS-red 트랜스진으로 복구하였다. 새로운 완전 작동 DS-red 트랜스진의 발현을 이용하여 원형질체 세포를 FACS 방법으로 분류하였다. 추정 트랜스제닉 식물을 실시예 7에 기재된 FACS 방법을 이용하여 분류하고, 단리된 원형질체를 성숙한 식물로 재생시켰다. 공여자 플라스미드의 통합은 분자 확인 방법을 이용하여 ETIP-표적화된 식물 내에서 확인되었다. 이에 따라, ETIP 유전자좌는 공여자 폴리뉴클레오티드 서열의 유전자 표적화된 통합을 위한 부위-특이적 유전자좌로서 역할을 한다.
실시예
7: 원형질체 세포의
FACS
기반 분류
DS-Red 대조 구축물, pDAS000031로 형질감염된 브라시카 나푸스 원형질체를, BD 바이오사이언시스(BD Biosciences) 인플럭스-셀 분류기(Influx-Cell sorter)™ (캘리포니아주 산호세)를 이용하는 FACS-매개된 세포 분류를 통해 분류하였다. 원형질체 세포를 실시예 3에 기재된 바와 같이 단리하고 형질감염시켰다. 세포를 pDAS000031로 형질감염시킨 후에, 세포를 표 7에 기재된 조건에서 FACS 분류기를 이용하여 분류하였다.
표 7: pDAS000031로 형질감염된 원형질체 세포의 분류에 사용된 조건
DS-red 트랜스진을 발현하는 원형질체를 분류하고 단리하였다. FACS 단리된 원형질체를 분류기를 이용하여 카운팅하였다. 약 1x105 내지 1.8x105개의 세포를 FACS 단리 후 제1일에 24-웰 마이크로 타이터 플레이트의 웰에 넣었다. 세포를 5 내지 20일 동안 비드 배양물로 옮겼다. 약 1x104개의 세포를 FACS 단리 후 제2일에 2 또는 4-웰 마이크로 타이터 플레이트의 웰에 넣는 유사한 조건에서 시험하였다. 시험된 다양한 조건은 총 단리된 원형질체 세포 중 95 - 98%의 생존률로 세포를 회수하였다. FACS 분류된 원형질체 세포를 3 - 20일 동안 비드 배양물로 옮겼다. FACS 분류된 원형질체 세포를 상기 기재된 프로토콜을 이용하여 1.5 mg/mL의 히그로마이신을 함유하는 배지 상에서 식물로 재생시켰다. 추정 트랜스제닉 식물은 분자 입체형태 프로토콜을 통해 pDAS000031로부터의 무손상 T-가닥 삽입물을 함유하는 것으로 확인되었다.
FACS 분류 방법은 임의의 형광 트랜스진 서열의 스크리닝에 직접 적용가능하며, 소정 비율의 게놈 유전자좌 내의 ETIP 영역의 특정 부위 내에서의 상동성 매개된 복구를 통해 형광 트랜스진으로 표적화되는 브라시카 나푸스 원형질체 세포를 단리하는데 이용된다.
실시예
8:
NHEJ를
통한
브라시카
나푸스
오메가-3 지방산
데새투라제
(
FAD3
) 내로의
표적화
통합 및 그의 분열
FAD3C 및 FAD3A에 특이적인 아연 핑거 결합 도메인의 선택
동조 Fad3 유전자의 전사되는 영역을 확인하고, 특성화하고, 본원에 기재된 공여자 서열의 NHEJ-매개 표적화를 위해 이들 부위에 결합하고 절단하도록 설계된 아연 핑거 뉴클레아제를 확인하고 특성화하였다. Fad3 서열의 동조체로부터의 DNA 서열에 대해 지정된 아연 핑거 단백질 (ZFP)을 상기에 기재된 바와 같이 설계하고 시험하였다. 정확한 활성을 나타내는 ZFN으로부터, Fad3 표적을 높은 효율로 절단하는 2개의 아연 핑거 단백질을 선택하였고: ZFP 28051-2A-28052는 서열 255 5'-gcccaaggaacCCTTTTCTGGGCCATcttcgTACTCGGCCACGactggtaatttaat -3'을 인식하고, Fad3C 게놈 유전자좌에 특이적으로 결합하고 이를 절단하는 것으로 나타났다. 마찬가지로, 아연 핑거 단백질 28053-2A-28054는 서열 256 5'-agcgagagaaAGCTTAtTGCAACTTCaactacTTGCTGGTCGATCGTGTTggccactc -3'를 인식하고, Fad3A 및 Fad3C 게놈 유전자좌에 특이적으로 결합하고 이를 절단하는 것으로 나타났다. 예시적인 표적 부위는 표 8에 나타내었고; ZFP 인식 나선에 의해 접촉시킨 표적 부위에서의 뉴클레오티드는 대문자로 나타내고; 비-접촉 뉴클레오티드는 소문자로 나타내었다. Fad3C와 상이한 Fad3의 카피에서의 뉴클레오티드는 밑줄로 나타내었다. ZFP 인식 나선에 의해 접촉시킨 표적 부위에서의 뉴클레오티드는 표 8에 나타내었다.
표 8: Fad3C (28051-2A-28052) 또는 Fad3A 및 Fad3C (28053-2A-28054)에 특이적인 아연 핑거 단백질 결합 부위
FAD3C 및 FAD3A에 특이적인 아연 핑거 뉴클레아제를 코딩하는 발현 벡터의 설계 및 구축
Fad3 아연 핑거 설계를 CCHC 구조의 적어도 하나의 핑거를 갖는 단백질을 코딩하는 아연 핑거 발현 벡터 내로 도입하였다 (미국 특허 공개공보 번호 2008/0182332). 특히, 각각의 단백질 내의 마지막 핑거는 인식 나선에 대한 CCHC 백본을 가졌다. 비-정규 아연 핑거-코딩 서열을 4개의 아미노산 ZC 링커를 통해 유형 IIS 제한 효소 FokI의 뉴클레아제 도메인 (문헌 [Wah et al., (1998) Proc. Natl. Acad. Sci. USA 95:10564-10569]의 서열의 아미노산 384-579) 및 sop2 핵 국재화 신호에 융합하였다. 토세아 아시그나 바이러스 (Szymczak et al., 2004)로부터의 뉴클레오티드 서열을 코딩하는 자가가수분해성 2A를 2개의 ZFN 융합 단백질 사이에 부가하였다. ZFN의 발현은 카사바 베인 모자이크 바이러스로부터 강력한 구성적 프로모터 및 5' 비번역 영역 (UTR) (Verdaguer et al., Plant Molecular Biology 1996, 31(6); 1129-1139)에 의해 유도되고, 아그로박테리움 투메파시엔스 pTi15955의 오픈 리딩 프레임 23 (ORF23)으로부터의 3' UTR (전사 종결인자 및 폴리아데닐화 부위 포함) (Barker et al., Plant Molecular Biology 1983, 2(6); 335-50)에 의해 플랭킹되었다.
벡터를 인-퓨전™ 어드밴티지 테크놀로지 (클론테크, 미국 캘리포니아주 마운틴 뷰)을 이용하여 어셈블리하였다. 제한 엔도뉴클레아제는 뉴 잉글랜드 바이오랩스 (NEB; 미국 매사추세츠주 입스위치)로부터 얻었고, T4 DNA 리가제 (인비트로젠)를 DNA 라이게이션을 위해 사용하였다. 플라스미드 제조는 공급업체의 지시에 따라 뉴클레오스핀(NUCLEOSPIN)® 플라스미드 키트 (마슈레-나겔 인크.(Macherey-Nagel Inc., 펜실베니아주 베들레헴)) 또는 플라스미드 미디 (Midi) 키트 (퀴아젠)를 사용하여 수행하였다. 아가로스 트리스-아세테이트 겔 전기영동 후, 퀴아퀵™ 겔 익스트렉션 키트(QIAquick™ Gel Extraction Kit) (퀴아젠)을 사용하여 DNA 단편을 단리시켰다. 어셈블리된 플라스미드의 콜로니를 초기에 미니프렙 DNA의 제한 소화에 의해 스크리닝하였다. 선택된 클론의 플라스미드 DNA는 상업적인 서열분석 회사 (유로핀스 엠더블유지 오페론, 앨라배마주 헌츠빌)에 의해 서열분석되었다. 서열 데이터를 모으고, 시퀀셔™ 소프트웨어 (진 코즈, 미시건주 앤 아버)를 사용하여 분석하였다. 생성되는 플라스미드 구축물인 pDAB107827 (ZFN 28051-2A-28052, 도 13, 서열 273) 및 pDAB107828 (ZFN 28053-2A-28054, 도 14, 서열 274)을 제한 효소 소화를 통해 및 DNA 서열분석을 통해 확인하였다.
NHEJ-지정 DNA 복구를 위한 "공여자" 벡터의 설계 및 구축
DNA를 Fad3 내로 통합하는 2개의 전략을 착수하였다; 발현 카세트가 단일 ZFN-유도 이중가닥 파단 내로 통합되는 유전자 스플라이싱 및 유전자의 일부가 2개의 ZFN-유도 이중 가닥 파단에 의해 제거되고 발현 카세트가 갭을 복구하기 위해 삽입되는 유전자-편집.
각각의 통합 방법, 즉 유전자 스플라이싱 또는 유전자-편집을 위해, 2개의 벡터를 구축하였다. 제1 벡터는 turboGFP (tGFP) 유전자 발현 카세트를 코딩하고, 제2 벡터는 항생제 히그로마이신에 대한 저항성을 부여하는 유전자 발현 카세트를 코딩하였다. tGFP 발현 카세트는 아라비돕시스 탈리아나(Arabidopsis thaliana) 폴리유비퀴틴 10 (UBQ10) 유전자로부터의 프로모터, 5' 비번역 영역 및 인트론 (Norris et al, Plant Molecular Biology 1993, 21(5), 895-906), 이어서 tGFP 코딩 서열 (Evrogen, Moscow, Russia)을 포함하였다. tGFP 코딩 서열은 쌍자엽 식물에서의 발현을 위해 코돈-최적화되었고, 에이. 투메파시엔스 pTi15955의 오픈 리딩 프레임 23 (ORF23)의 전사 종결인자 및 폴리아데닐화 부위를 포함하는 3' 비번역 영역 (UTR) (Barker et al, Plant Molecular Biology 1983, 2(6), 335-50)에 의해 플랭킹되었다. 히그로마이신 내성 유전자 발현 카세트는 콜리플라워 모자이크 바이러스 (CaMV)로부터의 5' UTR을 포함하는 19S 프로모터 (Cook and Penon Plant Molecular Biology 1990 14(3), 391-405), 이어서 히그로마이신 포스포트랜스퍼라제 (hph) 유전자 (Kaster et al Nucleic Acids Research 1983 11 (19), 6895-6911)를 포함하였다. hph 유전자는 쌍자엽 식물에서의 발현을 위해 코돈-최적화되었고, 에이. 투메파시엔스 pTi15955의 오픈 리딩 프레임 1 (ORF1)의 전사 종결인자 및 폴리아데닐화 부위를 포함하는 3' UTR (Barker et al, Plant Molecular Biology 1983, 2(6), 335-50)에 의해 플랭킹되었다. 두 카세트는 상업적인 유전자 합성 회사 (진아트(GeneArt), 라이프 테크놀로지스, 독일 레겐스베르크)에 의해 합성되었다.
유전자 스플라이싱 실험을 위한 벡터는 벡터 pDAB10782에서 코딩되는 ZFN에 의해 표적화되는 ZFN 인식 서열의 2개의 텐덤 카피를 클로닝함으로써 구축하였다. 유전자 편집 실험을 위한 벡터는 벡터 pDAB107827 및 pDAB107828에서 코딩되는 ZFN에 의해 표적화되는 각각의 ZFN 인식 서열의 하나의 카피를 클로닝함으로써 구축하였다. 둘 다의 경우에서, 2개의 ZFN 인식 서열은 BamHI 및 NotI 제한 엔도뉴클레아제에 대한 인식 서열에 의해 분리되었다. tGFP 및 HPH 카세트는 각각 벡터의 BamHI와 NotI 부위로 클로닝되어 4개의 "공여자" 벡터: pDAS000340 (히그로마이신-내성 유전자-접합 공여자: 서열 275, 도 15), pDAS000341 (tGFP 리포터 유전자 스플라이싱 공여자: 서열 276, 도 16), pDAS00342 (히그로마이신-내성 유전자-편집 공여자: 서열 277, 도 17) 및 pDAS000343 (tGFP 리포터 유전자 편집 공여자: 서열 278, 도 18)을 생성하였다.
어셈블리된 플라스미드의 콜로니를 이. 콜라이의 밤새 배양액으로부터 정제된 DNA의 제한 엔도뉴클레아제 소화에 의해 초기에 스크리닝하였다. 제한 엔도뉴클레아제는 뉴 잉글랜드 바이오랩스 (NEB, 미국 매사추세츠주 입스위치) 및 프로메가 (프로메가 코포레이션, 위스콘신주)로부터 얻었다. 플라스미드 제조는 공급업체의 지시에 따라 퀴아프렙 스핀 미니프렙 키트(QIAprep Spin Miniprep Kit)™ (퀴아젠, 독일 힐덴) 또는 퓨어 일드 플라스미드 맥시프렙 시스템™ (프로메가 코포레이션, 미국 위스콘신주)을 사용하여 수행하였다. 생성되는 단편의 아가로스 겔 전기영동에 의해 제한 단편이 확인된 후, 선택된 클론의 플라스미드 DNA를 ABI 생어 서열분석 및 빅 다이 터미네이터 V3.1™ 사이클 서열분석 프로토콜 (어플라이드 바이오시스템즈, 라이프 테크놀로지스)을 사용하여 서열분석하였다. 서열 데이터를 모으고, 시퀀셔™ 소프트웨어 (진 코즈, 미국 미시건주 앤 아버)를 사용하여 분석하였다.
원형질체 단리를 위한 식물 물질의 유지
엽육세포 유래 원형질체를 브라시카 나푸스 (DH10275)의 3주령 멸균 신초 (shoot) 배양액으로부터 단리하였다. 대응하는 종자를 본원에 기재된 방법에 따라 발아시켰다. 종자를 70% 에탄올을 사용하여 1분 동안 표면-멸균하고, 부드럽게 진탕한 후, 멸균 이중-증류수로 3-4회 세정하였다. 종자를 20% 표백제 및 10μl의 트윈 20을 사용하여 후속적으로 멸균시켰다. 종자를 약 100 RPM에서 15분 동안 테이블용 진탕기에서 표백제로 추가로 처리한 후, 멸균 이중-증류수로 3-4회 세정하고, 과량의 습기를 제거하기 위해 종자를 멸균 여과지에 조심스럽게 옮기고, 종자 발아 배지 (1/2 강도 MS/B5 비타민 + 1% 수크로스 + 0.8% 한천; pH 5.8)에서 배양하였다.
대략 50-60 mL의 배지를 각각의 페트리™ 디쉬 (15 X 100 mm) 내에 붓고, 지지대를 사용하여 플레이트를 약간 경사지게 두었다. 약 50개의 종자를 각 플레이트 상에 두었다. 플레이트를 22℃에서 16h/d의 광 (20μmol m-2 s-1) 하에 6일 동안 수직으로 인큐베이팅하였다. 0.5cm 크기의 배축 절편을 6일령 묘목으로부터 절제하고, 신초 유도 배지 (MS/B5 비타민 + 3% 수크로스 + 500 mg/L MES + BAP (13μm) + 제아틴 (5μm) + 질산은 (5 mg/L) + 0.8% 한천 (pH 5.8)에서 배양하였다. 배지를 100 x 20 mm 멸균 페트리™ 디쉬 내에 붓고; 약 20개의 체외이식편을 플레이트마다 배지 중에 두었다. 3-4주 후에 나타난 신초 분열조직을 신초 연장 배지 (250 mL 배양 용기에 부은 MS/B5 비타민 + 2% 수크로스 + 500 mg/L MES + BAP (2μm) + GA-3 (0.1μm) + 0.8% 한천 (pH 5.8))에 옮기고, 배양액을 상기 배지에서 4주 동안 유지하고, 그 사이에 1 라운드의 계대배양을 수행하였다. 이어서, 2-3cm 높이의 신초를 뿌리 발생을 위해 발근 개시 배지 (700 mL 배양 용기에 부은 1/2 강도의 MS/B5 비타민 + 1% 수크로스 + 500 mg/L MES + IBA (2.5μm) + 0.6% 한천 (pH 5.8))에 옮겼다. 발근 신초를 사용 전에 2-3 라운드 동안 경삽 (stem cutting)으로서 3-4주 간격으로 신선한 발근 개시 배지에서 계대배양하였다. 배양액을 22℃에서 16h/d의 광 (30μmol m-2 s-1) 하에 유지하였다.
엽육세포 원형질체의 단리 및 정제
시험관내에서 성장한 DH12075 브라시카 나푸스 식물을 엽육세포 원형질체를 단리하기 위한 체외이식편 공급원으로서 사용하였다. 원형질체를 단리하기 위해, 3 - 4주령의 묘목으로부터 3 내지 4번째의 완전히 전개된 잎을 원형질체 단리를 위해 날카로운 메스로 작은 스트립 (0.5 내지 1mm)로 절단하였다. 효소에 의한 소화는 25 mL의 소화 완충제 (K4 배지 (Spangenberg et al., 1998)에 용해된 1.2% (w/v) 셀룰라제 "오노주카(ONOZUKA)™" R10 및 0.2% (w/v) 마세로자임® R10으로 250-500 mg의 잎 물질을 처리함으로써 수행하였다. 잎 물질 및 소화 완충제를 함유하는 페트리™ 디쉬를 파라필름™으로 밀봉하고, 암소에서 12 내지 15시간 동안 실온에서 인큐베이션하였다. 밤새 인큐베이션 후에, 소화액을 BD® 세포 스트레이너(strainer) (메쉬 크기 70μm)를 통해 여과하였다. 14 mL 환저 튜브 내에 수집한 원형질체 현탁액 (5-6 mL)을 1 mL의 W5 세척 완충제 (154 mM NaCl, 125 mM CaCl2, 5 mM KCl 및 5 mM 글루코스; pH 5.8 [Menzel et al. (1981)])로 덮었다.
원형질체 현탁액을 추가로 400 RPM에서 10분 동안 원심분리하였다. 원심분리 후에, 간기 (interphase)에 부유하는 원형질체를 빼내고, 10 mL의 W5 완충제를 사용하여 400 RPM에서 10분 동안 원심분리에 의해 세척하였다. 최종 세척 후에, 단리된 원형질체를 W5 완충제 1mL당 1 X 106개의 원형질체의 밀도로 재현탁하고, 형질감염 전에 1시간 동안 인큐베이팅하였다.
원형질체 수득량 및 생존율의 평가
원형질체 수득량을 문헌 [Sambrook and Russell, (2006)]의 방법에 따라 혈구계를 사용하여 평가하였다. 세포 생존율은 프로토콜을 일부 변형하여 문헌 [Huang et al. (1996)]에 설명된 바와 같이 0.5 M의 만니톨에 용해된 400 mg/L의 에반스 블루 염색을 사용하여 시험하였다.
PEG 4000 매개 DNA 전달
비. 나푸스 원형질체로의 전달 전에, 각각의 공여자 및 ZFN 구축물의 플라스미드 DNA를 공급업체의 지시에 따라 퓨어 일드 플라스미드 맥시프렙 시스템® (프로메가 코포레이션, 미국 위스콘신주 매디슨)을 사용하여 이. 콜라이의 배양액으로부터 제조하였다. 공여자 및 ZFN 플라스미드 DNA의 분취액을 1:1 (30 μg의 각각의 플라스미드), 5:1 (공여자 플라스미드 대 ZFN 플라스미드 (총 30 μg의 플라스미드 DNA에 대해)) 및 10:1 (공여자 플라스미드 대 ZFN 플라스미드 (총 30 μg의 플라스미드 DNA에 대해))의 3개의 몰비로 제조하였다. 추가로, 공여자-단독 및 ZFN-단독 분취액 (30 μg)을 대조군으로서 제조하였다. PEG4000 매개 형질전환을 통해 비. 나푸스 원형질체로 전달된 DNA의 양을 표 9에 요약한다.
표 9: 원형질체에 전달된 ZFN 및 공여자 DNA의 양
플라스미드 DNA의 각각의 분취액을 100 μl의 형질전환 완충제 (15 mM MgCl2, 0.1% (w/v) 모르폴리노에탄술폰산 (MES) 및 0.5M 만니톨; pH 5.8)에 현탁된 1백만 개의 원형질체 (생존율 ≥95)에 적용한 후, 150μl의 PEG 용액 (0.4M 만니톨 및 0.1M Ca(N03)2 (pH 6-7) 내의 40% (w/v) PEG 4000; 문헌 [Spangenberg and Potrykus (1995))에 적용하였다. 실온에서 10-15분의 인큐베이션 후에, 5 mL의 W5 완충제를 적가하고, 원형질체를 부드럽게 혼합하였다. 추가의 5 mL의 W5 완충제를 원형질체 현탁액에 느린 유동액으로 첨가하였다. 원형질체를 부드럽게 혼합하고, 400 RPM에서 10분 동안 원심분리하고, W5 상청액을 조심스럽게 제거하여 원형질체를 펠릿 형태로 얻었다. 이어서, 형질감염된 원형질체를 비드형 배양액에 포매될 때까지 실온에서 1 mL의 W5 완충제에서 인큐베이팅하였다. 형질감염된 원형질체를 아래에서 설명되는 알긴산나트륨 방법에 따라 포매하였다.
생존가능 마이크로캘러스를 회복시키기 위한 엽육세포 유래 원형질체의 배양
배지 내에서 포매 전에 형질감염된 원형질체를 400 RPM에서 10분 동안 원심분리하고, W5 완충제를 조심스럽게 제거하였다. 이어서, 원형질체를 1.0 mL의 0.5 M 만니톨 내에 재현탁하고, 얼음 상에서 인큐베이팅하였다. 원형질체 용액에, 동일한 부피의 1.0% 알긴산나트륨을 첨가하고, 부드럽게 혼합하였다. 원형질체 현탁액을 포매될 때까지 얼음 내에서 인큐베이팅하였다. 비드 형성 용액 (0.4 M 만니톨 + 50 mM CaCl2 (pH 5.8))을 혈청 피펫을 사용하여 멸균 6웰 플레이트 (3-4 mL/웰)에 옮겼다. 정확히 1.0 mL의 원형질체 현탁액을 1 mL 피펫을 사용하여 비드 형성 용액에 적가하고, 각각의 형질감염된 샘플 (약 5 x 105개 원형질체)을 웰마다 포매하였다. 원형질체 현탁액을 알긴산나트륨 비드 형성을 위해 1-2시간 동안 실온에서 인큐베이팅하였다. 인큐베이션 기간 후에, 비드 형성 용액을 조심스럽게 제거하고, 1.5 mg/L의 히그로마이신으로 보충된 K3+H:A 배지 (Spangenberg et al. 1998)의 1:2 혼합물 4-5 mL로 교체하였다. 원형질체를 진탕기 (50 RPM) 내에서 3-4주 동안 암소에서 22℃에서 배양하였다. 3-4주 후에, 저항성 마이크로캘러스 (0.5-1.0 mm)를 탈중합 완충제 (0.3 M 만니톨 + 20 mM 시트르산나트륨 (pH 5.8))로 처리함으로써 방출시켰다. 액체 배지를 제거한 후에, 3-4 mL의 탈중합 완충제를 비드형 배양액을 함유하는 각각의 웰에 첨가하고, 실온에서 2시간 동안 인큐베이팅하였다. 멸균 겸자를 사용하여, 비드를 부드럽게 혼합하여 마이크로캘러스의 효율적인 방출을 향상시켰다. 이어서, 멸균 1.0 mL 피펫을 사용하여 탈중합 완충제에 방출된 겔화제를 부드럽게 혼합한 후, 제거하였다. 마이크로캘러스를 5 mL의 액체 A 배지로 2회 세척하고, 마이크로캘러스를 충분한 양의 액체 A에 재현탁하였다 (50 mL의 액체 A는 1 mL의 침강된 세포 부피 (SCV: 이것은 모든 방출된 마이크로캘러스를 멸균 50 또는 15 mL 팔콘(falcon) 튜브로 옮기고 5분 동안 침강시킨 후 측정하였다)에 대해 사용되었다). 마이크로캘러스 균일하게 혼합한 후, 액체 A 배지에 현탁한 0.5 mL의 마이크로캘러스를 B1 배지 (100 x 20 mm 멸균 페트리™ 디쉬에 부은 MS/MS 비타민 + 3.5 % 수크로스 + 500 mg/L MES + BAP (5 μm) + NAA (5 μm) + 2,4-D (5 μm) + 1.5 mg/L 히그로마이신 + 0.7 % 아가로스 타입 I (pH 6.0))로 옮기고, 1-2 mL의 추가의 액체 A 배지를 사용하여 마이크로캘러스를 B1 배지에 균일하게 분포시키고, 과량의 액체 A 배지를 각각의 플레이트로부터 조심스럽게 제거하였다. 플레이트를 배아 성숙을 향상시키는 세공 테이프로 밀봉하였다. 배양액을 22℃에서 16h/d의 광 (30 μmol m-2 s-1) 하에 유지하였다.
엽육세포 유래 원형질체로부터 신초의 증식 및 재생
히그로마이신 저항성 콜로니를 2-3주의 인큐베이션 후에 B1 배지 (SA 및 SP 방법으로 유도된 마이크로캘러스)로부터 선택하고, B2 배지 (100 x 20 mm 멸균 페트리™ 디쉬에 부은 MS/MS 비타민 + 3.0 % 수크로스 + 500 mg/L MES + 500 mg/L PVP + 5 mg/L 질산은 + 5 mg/L 2i P + NAA (0.5 μm) + GA-3 (0.3 μm) + 1.5 mg/L 히그로마이신 + 0.7 % 아가로스 타입 I (pH 5.8))로 옮겼다. 약 25-30개의 캘러스를 플레이트마다 넣고, 플레이트를 파라필름™으로 밀봉하고, 22℃에서 16h/d의 광 (30 μmol m-2 s- 1)에서 인큐베이팅하였다. 히그로마이신 저항성 콜로니를 후속적으로 B2 배지에서 2주 간격으로 5-6 라운드의 계대배양 후에 회복시켰다. 플레이트 당 캘러스의 수를 제3 라운드의 계대배양 후에 12-15로 감소시켰다. 10-12주 후에 출현한 신초 원기 (primordia)를 잔여 캘러스와 함께 조심스럽게 회복시키고, 신초 신장 배지 (250 mL 배양 용기에 부은 MS/B5 비타민 + 2% 수크로스 + 500 mg/L MES + BAP (2 μm) + GA-3 (0.1 μm) + 300 mg/L 티멘틴 + 1.5 mg/L 히그로마이신 + 0.8% 아가 (pH 5.8))로 옮겼다. 2-3 라운드의 히그로마이신 선택 후에 생존한 신초를 발근 배지 (700 mL 배양 용기에 부은 1/2 강도 MS/B5 비타민 + 1% 수크로스 + 500 mg/L MES + IBA (2.5 μm) + 1.5 mg/L 히그로마이신 + 0.6% 아가 (pH 5.8))로 옮겼다.
엽육세포 원형질체로부터 게놈 DNA의 단리
형질감염된 원형질체를 3 cm 페트리™ 디쉬로부터 2 mL 원심분리 튜브로 옮겼다. 세포를 70 g에서 원심분리에 의해 펠렛화하고, 상청액을 제거하였다. 형질감염된 원형질체의 회수를 최대화하기 위해, 페트리™ 디쉬를 1 mL의 세척 완충제로 3회 세정하였다. 각각의 세정은 세척 완충제를 페트리™ 디쉬에서 1분 동안 회전시킨 후, 액체를 동일한 2 mL 원심분리 튜브에 전달함으로써 수행하였다. 각각의 세정 종료시에, 세포를 70 g에서 원심분리하여 펠렛화하고, 상청액을 제거하였다. 펠렛화된 원형질체를 액체 질소로 급속 냉동한 후, -40℃ 및 133 x 10-3 mBar 압력에서 랍콘코 프리존 4.5® (랍콘코, 미국 미주리주 캔자스 시티))에서 24 h 동안 동결 건조하였다. 동결건조된 세포는 제조자의 지시에 따라 DNEASY® 식물 DNA 추출 미니 키트 (퀴아젠)를 사용하여 DNA 추출에 적용하되, 조직 붕괴는 필요하지 않았고, 원형질체 세포는 용해 완충제에 직접 첨가하였다.
캘러스 조직으로부터 게놈 DNA의 단리
개별적인 캘러스를 액체 질소 내에서 급속 냉동한 후, 24 h 동안 -40℃ 및 133 x 10-3 mBar 압력에서 랍콘코 프리존 4.5® (랍콘코, 미국 미주리주 캔자스 시티) 내에서 동결 건조하였다. 동결건조된 캘러스는 제조자의 지시에 따라 DNEASY® 식물 DNA 추출 미니 키트 (퀴아젠, 독일 힐덴)를 사용하여 DNA 추출에 적용하였다.
잎 조직으로부터 게놈 DNA의 단리
재생된 식물로부터의 30 mg의 어린 잎 조직을 액체 질소 내에서 급속 냉동한 후, 24 h 동안 -40℃ 및 133 x 10-3 mBar 압력에서 랍콘코 프리존 4.5® (랍콘코, 미국 미주리주 캔자스 시티) 내에서 동결 건조하였다. 동결건조된 캘러스는 제조자의 지시에 따라 DNEASY® 식물 DNA 추출 맥시 키트™ (퀴아젠, 독일 힐덴)를 사용하여 DNA 추출에 적용하였다.
FAD3C의 NHEJ-매개 스플라이싱 및 편집에 대한 게놈 DNA의 PCR 검정
공여자 DNA의 비. 나푸스의 Fad3C 유전자에 대한 통합의 검출은 적어도 하나의 프라이머가 Fad3C 유전자좌 (표 10)에 특이적이고 제2 프라이머가 gfp 카세트의 프로모터 또는 종결인자 (표 10 및 도 19a)에 특이적인 일련의 PCR에 의해 수행하였다. 특이성은 마지막 염기쌍이 Fad3C 게놈 서열을 Fad3 유전자의 다른 카피와 구별케하는 SNP에 정렬되고 별표 [*]로 표시된, 상기 염기쌍 앞의 포스포로티오에이트 뉴클레오티드간 연결을 포함하는 올리고뉴클레오티드를 설계함으로써 얻었다. 교정 (proofreading) 활성을 갖는 폴리머라제와 조합하여 사용되는 상기 설계는 각각의 Fad3C 또는 Fad3A 대립유전자의 특이적인 증폭을 유도하고, 나타낸 다른 Fad3 카피를 배제하였다. 각각의 프라이머 세트는 야생형 비. 나푸스로부터 얻은 PCR 증폭 생성물의 생어-기반 서열결정을 통해 정확한 유전자 카피의 증폭에 대해 실험에 의해 시험하였다.
표 10: ZFN-유도 이중-가닥 파단 내로 DNA의 통합을 검출하기 위해 사용된 올리고뉴클레오티드 서열
*는 나타낸 다른 Fad3 카피를 배제하면서 Fad3C 또는 Fad3A의 특이적인 증폭 (교정 폴리머라제 사용)을 유도하는 포스포로티오에이트 뉴클레오티드간 연결을 나타낸다. 각각의 프라이머 세트는 야생형 비.나푸스로부터 얻은 PCR 증폭 생성물의 생어-기반 서열결정에 의해 정확한 유전자 카피의 증폭에 대해 실험에 의해 시험하였다.
원형질체에서 비-상동성 말단부 연결에 의한 FAD3C에 대한 유전자 부가의 검출
게놈 DNA를 기능성 tGFP 리포터 카세트 (pDAS000341 또는 pDAS000343)를 코딩하는 공여자 DNA, ZFN DNA (pDAB107827 또는 pDAB107828) 또는 공여자 및 ZFN DNA의 혼합물이 24시간 더 일찍 전달된 원형질체 풀 (1백만 개의 원형질체/풀)로부터 추출하였다. 형질전환을 위해 전달된 DNA의 양은 상기 설명되어 있다. PCR 산물을 플라스미드 벡터 내로 클로닝하였다. 게놈 편집은 각각의 세포에서 독립적으로 발생하여 플라스미드 벡터 내로의 클로닝에 의해 다양한 상이한 삽입 이벤트를 생성하고, 각각의 게놈 편집은 불명료함이 없이 서열결정될 수 있다. 몇몇 클론은 ABI3730XL® 자동 모세관 전기영동 플랫폼에서 서열결정되었다. 유전자 서열의 분석은 시퀀셔 소프트웨어 V5.0™ (진코즈, 미국 미시건주 앤 아버)을 사용하여 수행하였다.
편집 또는 스플라이싱에 의한 Fad3C 유전자좌에 대한 부가의 증거는 표 10에 설명된 프라이머를 사용하여 원형질체로부터 추출된 게놈 DNA로부터의 5' 및 3' Fad3C-카세트 접합부의 증폭에 의해 제공되었다. 프라이머 "FAD3CNHEJ-L4-F2" 및 "AtUbiNHEJ-R1"을 사용한 PCR 증폭은 tGFP 카세트 및 Fad3C의 5' 접합부를 증폭시키기 위해 수행하였다. "FAD3CNHEJ-L4-R2" 및 "AtORF23tNHEJ-F1"을 사용한 PCR 증폭은 tGFP 카세트 및 Fad3C의 3' 접합부를 증폭시키기 위해 수행하였다. 프라이머 "FAD3CNHEJ-L4-F2" 및 "FAD3CNHEJ-L4-R2"를 사용한 PCR 증폭은 ZFN 28051-2A-28052에 의해 유도된 이중 가닥 파단에 걸쳐 증폭하기 위해 수행하였다. 증폭은 ZFN 플라스미드 또는 공여자 플라스미드가 단독으로 전달된 원형질체로부터 관찰되지 않았다. 모든 접합부 서열은 NHEJ-매개 복구 경로를 통해 Fad3C 유전자좌에서 tGFP 카세트의 삽입을 나타내었다. 게놈 및 카세트 중의 어느 하나 또는 둘 모두로부터의 상이한 길이의 결실이 관찰되었고, 벡터 백본 (공여자 또는 ZFN으로부터의)으로부터 유래된 서열의 부가가 게놈과 카세트 사이에 삽입되었다 (도 20a 및 도 20b).
원형질체로부터 재생된 캘러스 조직에서 비-상동성 말단부 연결에 의한 FAD3C에 대한 유전자 부가의 검출
또한, Fad3C 유전자좌의 스플라이싱 및 편집에 대한 증거는 hph 카세트를 코딩하는 공여자 DNA (pDAS000340 또는 pDAS000342), ZFN DNA 단독 (pDAB107827 또는 pDAB107828) 또는 공여자 및 ZFN DNA가 전달된, 선택 (상기 설명된 바와 같은 1.5 mg/L 히그로마이신)시에 원형질체로부터 재생된 캘러스 조직으로부터 얻었다 (전달된 DNA의 양을 표 9에 제공함). 원형질체 형질감염 4주 후에 캘러스가 생존하지 않은 편집 1:1:1을 제외한 각각의 비율에 대해 DNA를 약 80개의 캘러스로부터 추출하였다.
비. 나푸스 게놈 내로의 hph 카세트의 통합 (fwat Fad3C 또는 무작위로) hph 유전자에 특이적인 프라이머 (서열 294; F - 5' CTTACATGCTTAGGATCGGACTTG 3', 서열 295; R - 5' AGTTCCAGCACCAGATCTAACG 3') 및 프로브 (서열 296; 5' CCCTGAGCCCAAGCAGCATCATCG 3')를 사용하는 타크만™ qPCR에 의해 확인하였다. 이들 프라이머-프로브 쌍을 A 게놈 상에 단일 카피로서 존재하는 비. 나푸스 높은 이동도 그룹 단백질 I/I (HMG I/Y) (Weng et al., 2004, Plant Molecular Biology Reporter)에 특이적인 프라이머 (서열 297; F - 5' CGGAGAGGGCGTGGAAGG 3', 서열 298; R - 5' TTCGATTTGCTACAGCGTCAAC 3') 및 프로브 (서열 299; 5' AGGCACCATCGCAGGCTTCGCT 3')와의 이중체 반응에 사용하였다. 증폭은 CFX96 또는 CF384 실시간 PCR 검출 시스템™ (바이오라드, 미국 캘리포니아주 허큘레스)을 사용하여 C1000 열 순환기 상에서 수행하였다. 결과를 CFX 매니저(MANAGER)™ (바이오라드) 소프트웨어 패키지를 이용하여 분석하였다. 상대적인 정량은 게놈 내로 삽입된 hph 카세트의 카피수의 추정을 제공하는 2-ΔΔCt 방법 (Livak and Schmittgen, 2001)에 따라 계산하였다.
Fad3C의 NHEJ-매개 스플라이싱 및 편집에 대한 증거는 Fad3C에 특이적인 제1 프라이머 및 hph 카세트의 프로모터 또는 종결인자에 특이적인 제2 프라이머를 사용하여 PCR 검정을 수행함으로써 얻었다 (표 9 및 도 19b). 캘러스 조직으로부터 얻은 DNA의 제한된 양 때문에, 센스 배향으로의 통합만이 검정되었다. PCR 산물은 퀴아퀵 미니일루트(QiaQuick MiniElute) PCR 정제 키트™ (퀴아젠)를 사용하여 겔-정제되었고, 직접 생어 서열결정 방법을 사용하여 서열결정하였다. 서열결정 생성물은 빅다이® v3.1 프로토콜 (어플라이드 바이오시스템즈)에 따라 에탄올, 아세트산나트륨 및 EDTA로 정제하고, 상기한 바와 같이 서열결정하고 분석하였다.
각각의 실험에서 공여자 카세트를 함유하는 캘러스의 수를 표 11에 제공한다. 편집 및/또는 스플라이싱에 의한 Fad3C 유전자좌에 대한 공여자 유전자의 증거는 ZFN 절단 부위 및 5' 및 3' Fad3C-hph 카세트 접합부 둘 모두에 걸친 PCR 증폭 (표 10에 제시된 프라이머를 사용하는)에 의해 제공되었다. 단지 hph 플라스미드 (pDAS000340 및 pDAS000342) 또는 단지 ZFN 플라스미드 (pDAB107827 및 pDAB107828)를 사용하여 형질전환된 대조 원형질체로부터 회복된 캘러스 조직으로부터 단리된 게놈 DNA의 PCR 증폭은 PCR 증폭 생성물을 생산하지 않았다.
5' 및 3' Fad3C-hph 카세트 접합부의 증폭으로부터 생산된 PCR 앰플리콘을 아가로스 겔로부터 정제하고, Fad3C 게놈 유전자좌 내에서 통합의 특이성을 확인하기 위해 서열결정하였다. PCR 산물의 서열결정 분석의 결과는 개별적으로 형질전환된 원형질체로부터 생성된 각각의 단리된 캘러스가 단지 단일 PCR 증폭 생성물을 생성하고 혼합 유전자형의 세포를 함유하지 않음을 나타내었다.
Fad3C 게놈 유전자좌 실험 내의 공여자 서열의 NHEJ-매개 통합에서, 표적 유전자좌에 대한 부가의 빈도 (표적 유전자좌로부터 증폭된 공여자 DNA 벡터의 임의의 부분에 의해 규정됨)는 각각 1:1, 5:1, 및 10:1 (공여자 DNA:ZFN DNA)의 DNA 농도에 대해 42%, 46% 및 32%이었다. 표 12를 참조한다. 정확한 스플라이싱의 빈도는 두 카세트 접합부가 증폭가능한지 검정하고 PCR 산물의 서열결정으로부터 결정되었다. 이들 결과를 통해, 카세트가 정확한 배향으로 표적 유전자좌에서 삽입되었음을 확인하였다. 통합 빈도는 각각 1:1, 5:1 및 10:1의 공여자 플라스미드 DNA:ZFN 플라스미드 DNA 농도에 대해 4%, 3% 및 3%로서 계산하였다. 유전자 편집 실험에서, 표적 유전자좌로부터 증폭된 공여자 DNA 벡터의 임의의 부분에 의해 규정되는, 표적 유전자좌에 대한 부가의 빈도는 각각 5:1:1 및 10:1:1의 공여자 플라스미드 DNA:ZFN 플라스미드 DNA 농도에 대해 66% 및 65%이었다. 표 13을 참조한다. 정확한 편집의 빈도는 두 카세트 접합부가 증폭가능하고 PCR 산물의 서열을 생산함으로써 결정되었다. 이들 결과를 통해, 카세트가 각각 5:1:1 및 10:1:1의 공여자 플라스미드 DNA:ZFN 플라스미드 DNA 농도에 대해 3% 및 6%의 빈도로 정확한 배향으로 표적 유전자좌에 삽입되었음을 확인되었다. 원형질체 검정에서 관찰되는 바와 같이, ZFN에 의한 게놈 유전자좌의 절단의 결과로서 염기쌍이 결실되거나 또는 추가의 염기가 게놈과 카세트 사이에 삽입되었다 (도 21-22).
특정 경우에, PCR 산물은 표적 유전자좌 내의 뉴클레오티드 서열의 첨가를 유도하거나, 이를 어느 PCR 산물도 유도하지 않거나, 또는 야생형 샘플에서 관찰된 것보다 더 큰 PCR 산물이 유도하였다. 절단 부위에 플랭킹된 프라이머를 사용한 PCR 증폭으로부터 생성된 이들 결과는 유전자좌가 염색체의 두 쌍 모두에서 붕괴됨을 나타내었다 (도 21-22). 몇몇의 예에서, 하나 초과의 밴드가 스플라이스 접합부에서 증폭되었고 (도 21-22), 이것은 상이한 삽입이 각각의 게놈 카피에서 독립적으로 발생함을 나타내었다.
표 11: 선택 4주 후에 hph의 존재에 대해 양성인 캘러스의 수
표 12: ZFN28051-2A-28052에 의해 유도된 DSB에서 Fad3C 유전자좌에서의 스플라이싱에 의해 hph가 삽입된 캘러스의 수
* 절단 부위에 결실된 염기 쌍 또는 삽입된 추가의 염기 쌍의 수
표 13: ZFN28051-2A-28052 및 ZFN28053-2A-28054에 의해 유도된 절단 부위에서 FadC 유전자좌에서의 편집에 의해 hph가 삽입된 캘러스의 수
* 절단 부위에 결실된 염기 쌍 또는 삽입된 추가의 염기 쌍의 수
식물에서 비-상동성 말단부 연결에 의한 FAD3C에 대한 유전자 부가의 검출
DNA를 원형질체로부터 재생된 식물로부터 추출하고, 포팅(potting) 배지 (상기 설명된 바와 같이)에 옮겼다. 회수된 대부분의 식물은 공여자 DNA에서 코딩되는 hph 카세트의 1-2개의 카피만을 함유하는 것으로 추정되었다. 식물을 캘러스 조직에 대해 설명한 바와 동일한 세트의 검정을 사용하고 카세트가 안티센스 배향으로 삽입되었는지 또는 Fad3A 유전자좌에서 공여자 통합이 이루어졌는지 결정하기 위한 검정을 사용하여 분석하였다.
표 14: 원형질체로부터 재생된 식물의 추정된 카피수. 각각의 비율에 대해, 백만개의 원형질체의 형질감염을 3회 수행하였다.
hph 카세트가 어느 한쪽으로 Fad3C 내로 삽입된 선형 공여자 설계 구축물에 대한 정확한 스플라이싱의 빈도는 각각 1:1, 5:1 및 10:1의 농도의 공여자 DNA:ZFN DNA에 대해 51%, 32% 및 56%이었다 (표 15). 이들 결과 중에서, 35%, 32% 및 50% (1:1, 5:1 및 10:1)가 정방향 배향으로 삽입되었다 (표 15).
hph 카세트가 양쪽으로 Fad3C 내로 삽입되어 영역을 유전자좌 4로부터 유전자좌 6으로 교체한 정확한 편집의 빈도는 각각 5:1:1 및 10:1:1의 농도의 공여자 DNA:ZFN DNA:ZFN DNA에 대해 2% 및 0%이었다 (표 16). 또한, 두 ZFN이 5:1:1로 전달될 때, 2%가 유전자좌 4 내로 스플라이싱되고 10%가 유전자좌 6 내로 스플라이싱되고, 두 ZFN이 10:1:1로 전달될 때, 10%가 유전자좌 4 내로 스플라이싱되고 15%가 유전자좌 6 내로 스플라이싱되었다. PCR 앰플리콘을 수득하였고, 서열분석하여 삽입 접합부 서열을 결정하였다. 특이적으로 표지된 식물에 대해 생성된 서열은 표 17에 기재하였다.
표 15: ZFN28051-2A-28052에 의해 유도된 DSB에서 FadC 유전자좌에서의 스플라이싱에 의해 hph가 삽입된 식물의 수
표 16: ZFN28051-2A-28052 및 ZFN28053-2A-28054에 의해 유도된 절단 부위에서 FadC 유전자좌에서의 편집에 의해 hph가 삽입된 식물의 수
표 17: ZFN28051-2A-28052 및 ZFN28053-2A-28054에 의해 유도된 절단 부위에서 Fad3C 유전자좌에 삽입된 표적인 단일 카피 hph의 식물의 설명
hph 카세트가 원형 공여자에 대해 어느 한쪽 방향으로 Fad3C 내로 삽입된 정확한 스플라이싱의 빈도는 1:1, 5:1 및 10:1에 대해 각각 51%, 32% 및 56%였다 (표 18, 도 23). 이들 중에서, 35%, 32% 및 50% (1:1, 5:1 및 10:1)가 정방향 배향으로 삽입되었다 (표 18).
Hph 카세트가 어느 한쪽 방향으로 Fad3C 내로 삽입되어 유전자좌 4에서 유전자좌 6으로 영역을 대체하는 정확한 편집의 빈도는 5:1: 및 10:1:1에 대해 각각 2% 및 0%였다 (표 19; 도 24). 또한, ZFN 둘 다 5:1:1로 전달될 때, 2%가 유전자좌 4 내로 스플라이싱되고 10%가 유전자좌 6 내로 스플라이싱되고, ZFN 둘 다 10:1:1로 전달될 때, 10%가 유전자좌 4 내로 스플라이싱되고 15%가 유전자좌 6 내로 스플라이싱되었다.
표 18: ZFN28051-2A-28052에 의해 유도된 DSB에서 FadC 유전자좌에서의 스플라이싱에 의해 hph가 삽입된 식물의 수
* 절단 부위에 염기 쌍이 결실되거나 추가의 염기쌍이 삽입되지 않음.
표 19: ZFN28051-2A-28052 및 ZFN28053-2A-28054에 의해 유도된 절단 부위에서 FadC 유전자좌에서의 편집에 의해 hph가 삽입된 식물의 수
* 절단 부위에 염기 쌍이 결실되거나 추가의 염기쌍이 삽입되지 않음.
HDR을 통한 브라시카 나푸스 오메가-3 지방산 데새투라제의 표적화 통합
tGFP 및 HPH 카세트를 함유하는 공여자 벡터를 FAD3 상류 및 하류 공여자 서열의 1kb를 포함시키기 위해 변형시켰다. FAD3 상류 및 하류 공여자 서열은 본래 FAD3 서열과 100% 동일하였고, 이를 FAD3 아연 핑거 결합 부위로부터 획득하였다; GCCCAAGGAACCCTTTTCTGGGCCATCTTCGTACTCGGCCACGACTGGTAATTTAAT (서열 255) 또는 AGCGAGAGAAAGCTTATTGCAACTTCAACTACTTGCTGGTCGATCGTGTTGGCCACTC (서열 256). 생성된 4개의 "공여자" 벡터는 pDAS000340 (히그로마이신-저항성 유전자-스플라이싱 공여자), pDAS000341 (tGFP 리포터 유전자 스플라이싱 공여자), pDAS00342 (히그로마이신-저항성 유전자-편집 공여자) 및 pDAS000343 (tGFP 리포터 유전자 편집 공여자)과 유사하며, 여기서 유일한 변형은 FAD3 게놈 상류 및 하류 서열의 1Kb의 포함이었다. 이전에 NHEJ 매개된 통합에 대해 기재된 아연 핑거 뉴클레아제 플라스미드 (pDAB107827 및 pDAB107828)는 HDR 매개된 통합에 사용하였다.
브라시카 나푸스의 형질전환
엽육 유래 원형질체를 단리시키고, 상기 기재된 바와 같이 브라시카 나푸스 (DH10275) 식물로부터 제조하였다. 원형질체를 정제된 플라즈미드 DNA에 의해 형질전환시켰다. 공여자 및 ZFN 플라스미드 DNA의 분취액을 3가지의 몰비: 1:1 (30 μg의 각각의 플라스미드), 5:1 (전체 30 μg의 플라스미드 DNA에 대해 공여자 플라스미드 대 ZFN 플라스미드) 및 10:1 (전체 30 μg의 플라스미드 DNA에 대해 공여자 플라스미드 대 ZFN 플라스미드)로 제조하였다. 추가로, 공여자-단독 및 ZFN-단독 분취액 (30 μg)을 대조군으로서 제조하였다. PEG4000 매개 형질전환을 통해 비. 나푸스 원형질체로 전달된 DNA의 양을 표 20에 요약하였다. 형질전환된 원형질체 세포는 이전에 기재된 것으로서 배양하였으며, 여기서 선택 배지는 글루포시네이트 선택 배지였고, 추정 형질전환체를 트랜스진 삽입에 대한 qPCR 분석을 통해 분석하였다.
표 20: 원형질체에 전달된 ZFN 및 공여자 DNA의 양
원형질체에서 HDR에 의한 FAD3에 대한 유전자 부가의 검출
기능적 리포터 카세트 또는 선택 마커 카세트를 코딩하는 공여자 DNA, ZFN DNA 또는 공여자 및 ZFN DNA의 혼합물이 24시간 더 일찍 전달된 원형질체 풀 (백만개의 원형질체/풀)로부터 게놈 DNA를 추출하였다. 형질전환을 위해 전달된 DNA의 양은 상기에 기재되어 있다. PCR 생성물을 플라스미드 벡터 내로 클로닝하였다. 게놈 편집은 각각의 세포에서 독립적으로 발생하여 플라스미드 벡터 내로의 클로닝에 의해 상이한 다양한 삽입 사례를 생성하고, 각각의 게놈 편집은 불명료함 없이 서열분석될 수 있다. 몇몇 클론을 ABI3730XL® 자동 모세관 전기영동 플랫폼에서 서열분석하였다. 유전자 서열의 분석을 시퀀셔™ 소프트웨어 V5.0™ (진코즈, 미시건주 앤 아버)을 사용하여 수행하였다.
편집 또는 스플라이싱에 의한 FAD3 유전자좌에 대한 유전자 부가의 증거를 원형질체로부터 추출된 게놈 DNA로부터의 양쪽 5' 및 3' FAD3-카세트 접합부의 증폭에 의해 제공하였다. 증폭은 ZFN 플라스미드 또는 공여자 플라스미드가 단독으로 전달된 원형질체로부터는 관찰되지 않았다. 모든 접합부 서열은 HDR-매개 복구 경로를 통해 FAD3 유전자좌에서 카세트의 삽입을 나타내었다. 게놈 및 카세트 중 어느 하나 또는 둘 다로부터의 상이한 길이의 결실, 뿐만 아니라 게놈과 카세트 사이에 삽입되는 벡터 백본 (공여자 또는 ZFN으로부터의)으로부터 유래된 서열의 부가가 관찰되었다.
원형질체로부터 재생된 캘러스 조직에서 HDR에 의한 FAD3에 대한 유전자 부가의 검출
FAD3 유전자좌의 스플라이싱 및 편집의 추가의 증거를 카세트를 코딩하는 공여자 DNA, ZFN DNA 단독, 또는 공여자 및 ZFN DNA가 전달된 선택한 원형질체로부터 재생된 캘러스 조직으로부터 획득하였다. DNA를 각각 비에 대해 대략 80개의 캘러스로부터 추출하였다.
비. 나푸스 게놈으로의 카세트의 통합을 공여자 삽입 및 게놈 플랭킹 서열에 특이적인 프라이머 및 프로브를 사용하는 택맨™ qPCR에 의해 확인하였다. 상대적인 정량화는 게놈 내로 삽입된 카세트의 카피수의 추정을 제공하는 2- ΔΔCt 방법 (Livak and Schmittgen, 2001)에 따라 계산하였다. FAD3의 NHEJ-매개 스플라이싱 및 편집에 대한 증거를 FAD3에 특이적인 제1 프라이머 및 카세트의 프로모터 또는 종결인자에 특이적인 제2 프라이머를 사용하여 PCR 검정을 수행함으로써 얻었다. PCR 생성물은 퀴아퀵 미니일루트 PCR 정제 키트™ (퀴아젠)를 사용하여 겔-정제되었고, 직접 생어 서열분석 방법을 사용하여 서열분석하였다. 서열분석 생성물을 빅다이(BIGDYE)® v3.1 프로토콜 (어플라이드 바이오시스템즈)에 따라 에탄올, 아세트산나트륨 및 EDTA로 정제하고, 상기한 바와 같이 서열분석하고 분석하였다.
각각의 실험에서 공여자 카세트를 함유하는 캘러스의 수를 결정하였다. 편집 및/또는 스플라이싱에 의한 FAD3 유전자좌에 대한 공여자 유전자 부가의 증거를 ZFN 절단 부위 및 양쪽 5' 및 3' FAD3-카세트 접합부에 걸친 PCR 증폭에 의해 제공하였다. 플라스미드 단독 또는 ZFN 플라스미드 단독으로 형질전환된 대조 원형질체로부터 회수된 캘러스 조직으로부터 단리된 게놈 DNA의 PCR 증폭은 PCR 증폭 생성물을 생산하지 않았다.
5' 및 3' FAD3-카세트 접합부의 증폭으로부터 생산된 PCR 앰플리콘을 아가로스 겔로부터 정제하고, FAD3C 게놈 유전자좌 내에서 통합의 특이성을 확인하기 위해 서열분석하였다. PCR 생산물의 서열분석 분석의 결과는 개별적으로 형질전환된 원형질체로부터 생성된 각각의 단리된 캘러스가 단지 단일 PCR 증폭 생성물을 생성하고 혼합 유전자형의 세포를 함유하지 않음을 나타내었다.
식물에서 HDR에 의한 FAD3에 대한 유전자 부가의 검출
DNA를 원형질체로부터 재생된 식물로부터 추출하고, 포팅 배지에 옮겼다. 회수된 대부분의 식물은 공여자 DNA에서 코딩되는 카세트의 1-2개의 카피만을 함유하는 것으로 추정되었다. 식물을 캘러스 조직에 대해 기재한 바와 동일한 세트의 검정 뿐만 아니라 카세트가 FAD3 유전자좌에 삽입되었는지 결정하는 검정으로 분석하였다.
카세트가 FAD3 유전자좌 내에 삽입된 정확한 스플라이싱의 빈도를 상기에 기재된 PCR 검정을 사용하여 결정하였다. 획득한 앰플리콘 밴드를 플랭킹 서열을 결정하기 위해 서열분석하였다. 추가로, 식물을 FAD3 이외의 부위에서의 카세트의 통합의 빈도를 결정하기 위해 표적-이탈 삽입에 대해 스크리닝하였다.
실시예
9:
농경학상
중요한 유전자로의
브라시카
나푸스
오메가-3 지방산
데새투라제
(
FAD3
)의
표적화
통합
제초제 글리포세이트에 저항성을 부여하는 DGT-28 트랜스진 (본원에 참조로 포함되는 국제 특허 공개 번호 WO/2013/116700)을 함유하는 구축물을 브라시카 나푸스의 FAD3 게놈 유전자좌 내로의 통합을 위해 설계하고 구축하였다. 구축물 및 연관된 아연 핑거 뉴클레아제 구축물 (예를 들어, pDAB107827 및 pDAB107828)을 이전에 상기에 기재된 바와 같은 브라시카 나푸스 세포로 형질전환시켰다. 형질전환체는 이전에 기재된 것으로서 분자 확인 검정을 통해 동정하고 확인하였다. 통합된 dgt-28 트랜스진을 포함하는 FAD3 염색체 구성요소를 단리시켰다. FAD3 유전자좌 내로의 dgt-28 트랜스진의 통합은 NHEJ 매개된 통합 및 HDR 매개된 통합을 통해 예시된다. FAD3 유전자좌 내로의 통합은 FAD3 내인성 서열 또는 FAD3 유전자좌 내에 안정하게 통합된 이전에 기재된 ETIP (pDAS000271 - pDAS000275) 내로 지정될 수 있다. NHEJ 매개된 메카니즘을 통한 FAD3 유전자좌 내로의 통합은 선형 공여자 또는 원형 공여자 DNA 설계를 사용하여 수행할 수 있다. 형질전환된 DGT-28 브라시카 나푸스 사례를 획득하였고, DGT-28의 강한 발현 및 후속적인 제초제 글리포세이트에 대한 저항성에 대해 시험하였다.
특정의 예시적인 실시양태가 본원에 기재되어 있으며, 통상의 기술자는 예시적 실시양태에 대한 다수의 추가, 제거 및 변형이 하기 청구범위의 범주에서 벗어나지 않고 이루어질 수 있음을 인식하고 이해할 것이다. 또한, 한 실시양태로부터의 특징은 또 다른 실시양태의 특징과 조합될 수 있다.
SEQUENCE LISTING
<110> DOW AGROSCIENCES LLC
<120> FAD3 PERFORMANCE LOCI AND CORRESPONDING TARGET SITE SPECIFIC
BINDING PROTEINS CAPABLE OF INDUCING TARGETED BREAKS
<130> 8326-4009.40
<140> PCT/US2013/058267
<141> 2013-09-05
<150> 61/820,260
<151> 2013-05-07
<150> 61/697,854
<151> 2012-09-07
<160> 383
<170> PatentIn version 3.5
<210> 1
<211> 20890
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 1
aattgttgta ttttttaaat ataattctca aaaattctat tttaagaaag ttttcatttt 60
tacttaaaaa tattgtagat ttgaagttgt ggtttagtaa tttggataac aataattttt 120
gttgatagat gaaaaacaga agaagatcac gattcgttca cacattccca actcacatta 180
cactaacacc tttgagtaaa gtgagccatt ttattatatt catgcctacc aggctaccaa 240
tatctgtaaa gctctcctca aataaatagc aagcataaga ttttgattat atcccagtag 300
aaaaactaga ctttatcttc taaataatca ttaagcatgc taatgactta gttacaaaga 360
gggtagatca aaagaaatgg atttgatgaa gctctgggaa gcttagtaag agcattggtg 420
attctctggt agttcttgtt aacatttttg tcttctcggt gactctcaac ttcaacatca 480
accttgacag tttcaagaca tttcaaattt cccaagaaat gcttctctga ttcagctctc 540
tacgagttcc tctataccct gaaaccttta gcaccttcac ttgacatgtc gataaacaac 600
atacttcctc ctccttattc ttcctagcga cgcacacaca ggcgtccccg catctatctg 660
taactcggtg cacaagaccc tgaaaagcaa aattcatgta acaacaacaa tcaaacgaat 720
tgtgtgtgtg tctatgtatc aaaacgaaac tggtacctcc tactttgatg acaagagttt 780
ctaggtttgg agagttgttg agaagaagtg gcaccacttg ccatcctttt tctttgtcac 840
tctcaaaaga cagagtaagg agcttgtgaa agaccggcat tgatttacag tataggtgaa 900
acacctggag atttattact attatttatc acaaaccaaa aaaaaaatgc aataactaat 960
aacactaaga ctttgcactt cagattgaca caactagcag aaggaaagat aacaaaacta 1020
acctcaagag acgtaggaga caagtcaagg actttgtttc tataacgtgg atgtactcgc 1080
tttctaagtg aagctccgag aagcttcttc gttccaggac agtgcggatc cagttgtcca 1140
ctcgagaagc gtcgtgagtg tgctcacagc gcaaagagaa tcttttgatg attgaagagt 1200
tggttaggag agctagtgtt ttgtcgacga agtcagggaa gccacgtgga tcaccagttg 1260
cagttgcgtc gtcgctcaga tcgaggctgt ctacgaggga aagcagattc ctccaccttt 1320
tggacagaac caatgtggaa gctgcttgat ttgtcggaag caaggacagg actttgccaa 1380
gaacctcatc tgggagactg cttattgaat ctcgttgggg agacatatat taaggtttaa 1440
gatcgaacca gaaacttgtc gattaaaggt cacaagttca gaacaatcga agaaaggagc 1500
aaacgaacga aggtaggtga acttacaatt agaaaggaac cgacgacgag ggagcgaaac 1560
gcagcgtttg acgtggtatt tctaattgtg taatatttat ttttaaaaaa tgtgatttct 1620
tttaaaaaaa gttttacaaa agttgatagg tttcggggca taataattgg gttaattgca 1680
gtgaggatgg gagtaaaatt gagtttgcaa aagtgaggcg gtaaatttgt atggttctgc 1740
atagttgaaa ataaataagt ttatcatgtg tttataattg tttagttata aagtagcgac 1800
taaataaaat aaaaatgatc attttataat atatagctat aaaatagtaa aattagaata 1860
ttatacttag aatataagat atattaattt gatataacta gtaataaatt atttgtataa 1920
tgtttgttta ttttgaaaat tttggtttat cccactatat aaaagaagct aaatttgagc 1980
ttcataaggc tatccacatg tgcacaaata ttcaggacca accaaagtgc catgtcatct 2040
ttgtgagctt gcaattttaa aaaaatttgt cacctacgtg gcccgtatga cccatctctc 2100
ccgagcctct cttcatacca tattggtcgc agcccattac ccatctcttg atacggttcg 2160
ggttatatcg ctgtcctctc tgaaatatca aaatcactaa ccctaatcac cgttctcgat 2220
ctctttgtcg attctcttcc tcccccaaac tcatcccgat ctctttgtcg attctctttc 2280
tctccccaac tcatcccgca taacgtcccc gatgagagtg ctggtacttc aatgtgctct 2340
cataaagcct tcaatgtttt cttcaaccat gctgttgcct gttggtgatg ttttcaattt 2400
aatatgcgga gaggatgaga tcgacttggg gagaggaggt tattgttcgg aattgaaacc 2460
cgaaaatgga tttcacaatc gtaagctctc acttctttgg gctcgcttcg tcttcttaaa 2520
gaggctttat cggctgcgtt gaggctgtat cgtccggtgc cggagttctt caaccccggc 2580
ttgaagggcg acaagataca acatgggact tttgtttcgc agtgatgttt ttgatttact 2640
tggctgggag gatgagatcg actctgggag attttgtttc gagttcaaac cggagggatt 2700
gactttgaaa tcgtacgctc ttagtataca taattatggg ccaatacaca cagattacga 2760
tacaaacaca aacacgaagc tcagcattag agtttcagcc ccggagattc aacagcaact 2820
aaagtaagat tccaaattcg tcctctgttc agcctccagt caatttcttt tactttttta 2880
atctttgcct aatgttcatt actgtgatca aaaataactc gcttgcatat gtcttctttt 2940
tcaggttgtt acttggcttt ctatttcatg aagcacagaa cgtagtatat aaaaggaaac 3000
aggaatacac tttgcaaata ttctctgtgt ctttggatta atctataatc ttgtgatgta 3060
gatagataca aaagcttctt acggatctcc atggagaatt catgaaggta acctgaaaca 3120
actctctatc tcttgcaagt ggatgccaga ctaatgtcat agtttggtaa aattccagat 3180
taagttttgg tgaatgactt tgtgttttgt acagaagata agaactcatg ttcgttatgg 3240
gaagcagtta tcacaataca accttactta tcgaattttc atcaagtaat attacatgat 3300
ttataattag ttgtgtattt tatgacattt tataagtgtg gttgacgata aaaatgacaa 3360
ggctatcaca aaagatacct caagttcagg tattttagat atgggactct ctggaccttt 3420
aatatgtgat aatgtatcga agttttaagt cttcttccaa caatactcta attcgatttt 3480
gtggtgtatc gatacatttc ctgaagggct tactcggaag cttccagtta ccaacaagta 3540
tgtgaagcca atatgtatag gatttggagg ggcggaggac cacgaccttg aaaatctgaa 3600
gaaacagctt gaagatgatg atctcatcag aggtacaata actgcggaac atcaaggcag 3660
tgaaggtaca attttacctg tgcatgtcaa aaccgaactc tgtagccatc tccctacacc 3720
ggtttagtca taactgtcat ttgattaaca aacagagtct ggtgttaatt agctgataca 3780
aaagacaatc gcgcatacag ctgagagggt cacgtggtct aagtcttgaa ttaacgtttg 3840
agttgttctg ttcagtgaca aaggcttctg tccattccaa atcaagcagg tacacatatg 3900
aatccggtcc tgtgtttaga atcaagaaac aaagttcctt cgcgtcaaag gcttgtgtgc 3960
gagtctcttc agtgctctct ttggctttct tatgttcgat tcacacaagt attggtcttc 4020
cacaacaaag actcatccac attattacat cttctgctat aaaccttttc ttttacctct 4080
aggctcattg tcaataccaa aatacagctg cgttttgacc ttgattaggt gtgattgtga 4140
ctctctttca cttcctcgat gcacatggct acacttttct ttgcggtggt tgagatgtcg 4200
atagacataa tcactcttgg gaaaatcaag ggactgctca gcatgggtcg cctcttttgc 4260
ttgaaatatt ggagaccaat gagttagagt ttagagacat caattggtag attcatacaa 4320
tataagctta gagttttgtt tcttctttgt ttttccggtt gattggtttt aagaaatgga 4380
atcctttctc tcaaaagact ataagcatat ttagtgtcag atggcttgat gattcttcga 4440
ttttgaaacc agaaatctat tttcctgcca aatgcttctt tgttattgtt acatagtgga 4500
gtgtttaaaa cattactaaa ccaattccgt caaattttaa tagaacgaag caaaacgatt 4560
agaaccagtt gtatttttat atctttgtaa aactcagctt ctcaggatca atcttatcac 4620
tacgaatcat cattctataa aagaagatga agtcggattt ggaaagcgtt tggtaatttt 4680
tagaagtttg agagaaggta atagaagttg tattaaatag tggatatagt ggacgtttga 4740
attaagtttg tacacttctc ggattgatac atttattcac gttttgaaat tgaacacgtc 4800
tattcattaa acacgttccc aaagtcttag aaacaaatac attatcaatt caaatcccat 4860
tagaataagt tattgttcat acgttctaaa tatttaataa taaattaaac aacaaatttt 4920
ttatatctac aaaattttca tcataacata agtattttta tcacgtaaat taaattgaaa 4980
tgcatttgaa atatttagta agaattaaat atccagtttt ttaatatcac aaaaaaatat 5040
cttttatcac gtaaaaactt gaaaacatcc atgtataaaa ttatatacaa tctgtataga 5100
gatttatctc ttttgaaaaa atattaaaaa ttatatgatg taaaatatat tttaatgata 5160
acacaataca aactatatat aatgataatt atcaaatcaa taaaattcat ttctaattta 5220
tggttaagta tatattaaca aatttaatta tttattaaag ttaataaaga ctttgtaaca 5280
cagtataatt tagttttgga caatgataat tatcaaatta atattttaaa aattttatgg 5340
ttacttatat attaacaaat ctaattattc attaagaata ataaatattt tagccgctct 5400
acattttaaa gtgaaagttt agaagatgaa aaaactcact ccataaataa tattataaat 5460
tatttaaaat aaacataaat aaatgattaa atataagttt gattataaca aacaatccgc 5520
gcagggcgcg gataaaagat ctagtaatta gtaataagtt atttgtataa catgaaattg 5580
agtatttgaa acaaatattt atgttttaga tatttatatt tattaactac ataaatatgt 5640
attccaaata ctcaatttca tacttaaata tgtatgttaa atgcccagtt agatgtaaat 5700
acacattttc ccttatgtgt tgcttttttt tttaacttat gctatatccg caatggccgt 5760
atatattttt caaagttttg ctaattagta aaacttttga aatataaata aattttaaga 5820
taataattta aattaaagta atatatatat cgaattttaa tttattatat taaagttttt 5880
ggtttaaatt tccagcgttt aatttttttt tggtaaagta acagttaaaa cccattaatg 5940
gaaagtattt tcaccgcctt tgagatcttt tcctcagtat taatttccct agacgaagca 6000
attccaaaac caaaaacata ataacacata ttcattgctt ttaccaaaaa aaaaaacaca 6060
tattcattgc atgctttaat taccagaaaa cgaataaaaa tctcatttac gttccaaaaa 6120
caaagtacac acaaaaagaa cttctagaag aaaaaacgta taaacacgtg tctctataca 6180
gagtgagaac aggacaaaca aagctggaca gggttttaag taccgtataa accctcgact 6240
acgaacacaa aacagtttca aaagtaaggg taatattgtc atttagttag ccttcaaata 6300
atgttgcccc ggggatcatg gacgctttat attcagctta cacatattta tctaactgaa 6360
tcactcaaga aaataaatca cacagacgtt ttttaaggag agaaacaaac ctctctctct 6420
ctctcagatc ggagaaaaga gccatggcgg ctgcgtggaa cgggagtgag tatttcgaca 6480
tcgacgttga gaccggtaga caatcgttcg cgcggccgtc gaacgccgag actgtcgagc 6540
aagacgaaga agatctgaga tgggcagccg taggaaggtt accgtcgcag agacaaggga 6600
gccatctatc ggttctgcgt cggtcgcaaa cgtcgcaggc gcagacttct ggctacgcag 6660
acgggaacgt cgtgcagacc attgacgtta ggaagcttga tcggtctgat cgtgagatgg 6720
ttgttcgtca ggcactcgcc actagcgatc aggataatta caagctcctc tccgccatta 6780
aagaacgtct cgataggttt gtttctattt ttataggttt gttttgatta ttgatattcg 6840
atggatcttt gatataatct tggtgttgtt ttatttgtag agttggaatg gaagttccca 6900
agattgaagt ccggtttgag catttgaatg ttgaagctga tgttcaagct ggtacaagag 6960
ctttacctac tttggttaac gtatctcgtg atttcattga ggtttgtctc ctcttttttt 7020
gactatcttg ttccacacgt aaccttttgt ttctaatatt gtatctcttt gtttgtgttg 7080
ttgcagcgtc tcttaagcag cttgaggata atgaagacta gaaaacacaa gctaacaatc 7140
ttgaaagata tcagtgggat tatcaaacca ggaaggtgaa tgaaatacaa tgttttgatt 7200
attataacta tgtaacacaa acactaacag tttatatatt ttgctgttct tgaaggatga 7260
ctttgctact aggaccaccc ggttcgggga agtcgacttt acttcttgct ctcgcaggga 7320
agcttgataa aagtttgaag gttagttaat taacccgtga aattatctaa tatgctcata 7380
tatatatcac atgtttgata tctcttttgt tagtattcac atgtatcttg agattcatct 7440
ttttatttgt tataaattta tttttatttt tacagaaaac gggtaacatc acttacaatg 7500
gagagaatct tgatgagttc catgttaaaa ggacttcagc atatattagt caaacagata 7560
atcacattgc tgaactcact gttcgtgaga cacttgattt tgctgcgaga tgtcagggtg 7620
caagcgaagg atttgcaggt tagtatttac actttactat attaacttct gaaattgacg 7680
tgtcctcaag tgtttcttgt ttacattata ggttacatga aagatctaac ccgattagag 7740
aaagagaggg gtatacatcc ttcttctgaa attgatgctt tcatgaaggt cagcatcata 7800
tacctcctaa cttcctttta ctagtttata atttataagc cacaatcacc aacactttct 7860
tcaaatttgt tataggctgc ttctgtcagt ggtagtaagc atagcgtttc cacggattat 7920
gtgcttagag tgcttggtct tgatgtatgt tcagatacaa tggttggtaa tgatatgatg 7980
agaggtgttt caggaggtca aaggaaaaga gtgacaacag gtctctttca ctctctttaa 8040
acctctctat tttcacttat ccattagtct aacttataaa tcttgatgca ggggagatga 8100
ctgttggtcc aagaaagact ttgtttatgg atgaaatatc tactggtctt gatagctcaa 8160
caactttcca gattgtgaaa tgtgttagaa actttgtcca tctaatggat ggaactgttc 8220
ttatggcact tcttcagcct gcaccagaaa catttgatct ttttgacgat ttgattcttc 8280
tatcagaagg ttacatggtt tatcaaggtc ctcgagaaga tgtggtggga tttttcgagt 8340
ctctaggatt ccgtctccca ccacgtaaag gtgttgcaga ttttctccaa gaggtatcat 8400
acatcctaat ccttttcttt ggttatattc atgacaagat ctgagttttt ggaaattata 8460
aacattttta aataaattta ataaaaaaga aatatatatt ttttaatttg agaacctata 8520
ctatgtaaaa aacttcctaa aactttggag gccaaggcct ggttatattg ttacatggta 8580
gtccaaaaat atattcttat gttttataat gttgttatgc atgcaggtga cgtccaaaaa 8640
ggatcaagct cagtactggg cagatccttc taagccttac cagttcattc ctgtctcgga 8700
catagcagct gctttccgca actcgaatta cgggcatgct gcagattcaa aactggcaac 8760
accatttaat aagtcatctg cggatccttc agctttgtgc cgaacacagt ttgccatatc 8820
aggatgggag aaccttaaag tttgcttcga acgagagata ctattgatca accgtcacag 8880
gtttctttac acgtttagga catgtcaggt attataataa ctctacgtat tttgattttc 8940
attacatcta tttgttgcat aacttctatg tttctgacat ggaacatctt gtatgaaggt 9000
tgcatttgtg ggatttgtta cagccacggt gtttttgaga actagattac acccaacaaa 9060
cgaagcatat ggaaacgagt atctgtcttg tcttttcttt ggcctagtac acatgatgtt 9120
caatggtttc tctgaactgc ctctcatgat atcgcgtctc ccagttttct acaagcaaag 9180
ggataactcg tttcatccag cttggtcctg gtctattgct agctggatct tgcgtgtgcc 9240
ttactctatc cttgaagctg ttgtctggac ttgtgtcgta tactatagtg tgggacttgc 9300
tccctcagca ggcaggttgg tcatttttct agacatcctt ctttttattt tatggtttca 9360
atgtcagaaa ataaaaaaaa tctttttgtt cttttaggtt tttccgatac atgttactcc 9420
tcttctcggt gcatcaaatg gctctaggtt tgtttcgtat gctggcttct gtagcaaggg 9480
acatggtcat tgctaataca ttcggatctg catcaatctt ggcagtgttc ttgcttggag 9540
gattcgttat tccaaaaggt tggttattac tactttactt catacataat aagaattgct 9600
atactaaaac cctcgcattt tttgacagat gatattaaac cctggtggac ttggggcttt 9660
tggatatcac ctttatcata tgggcaacgt gccattgcgg tcaatgaatt cacagccacg 9720
aggtggatgc aggtgtgctc aataatctca tatctaagtt aatataatac ttaagagtat 9780
atacaaatgc ttaacaatag actttttctt gcacatcaag cagccatcag ctatatcgaa 9840
tactacaatt ggattcaact ttctcaagct acgaagtttc ccaacaaatg acaactggta 9900
ttggattgga gttggtgtac tcatttgtta tgcacttctc ttcaacaaca ttgtcactct 9960
cgccttggct taccttaacc gtgagattct ttctattatt atctaatgat catttcttgt 10020
atatatatca ctgtagcaat atattgtgaa gctttttgtc tttttttctt actcttgcag 10080
ctctaaaaaa ggctcgagca gttgttttag aagatctcaa tgaagaaacc caaactgctt 10140
cagtatcaaa tgcaagacaa ggtagaagtg agaagaaagg aatgattctt ccgttcaaac 10200
cattaacaat gactttccac aacgttaact attatgttga catgccaaag gttacattca 10260
cttcctttgt atataacagt cctaatatat ggttacataa ttatattttt tttggaatgt 10320
caggaaatgc gttctcaagg tgtaccagag actagactac aactgttatc aaacgtgagt 10380
ggagtcttct cccctggcgt tcttacagct ttggttggat caagtggtgc tggaaaaact 10440
acattgatgg atgttcttgc gggtcgaaag acgggtggat ataccgaggg agatatcaga 10500
atctctggtt accaaaaaga acaacaaaca tttgctagaa tctctggata cgttgagcaa 10560
aacgatatac attctcctca agtcacagtt gaagagtccc tttggttctc tgctaggctt 10620
cgtcttccta aagatatcag caaagaaaag aaaaaggtaa gtatgaaaaa agattaactc 10680
attttgttcc tatttaaaca gttttactag taatatgttt ttgtgtgttt gttaggaatt 10740
tgtggaggaa gttatgagac tagtggagct tgatagtcta agatatgcat tagtaggttt 10800
acctggtaca acaggactgt ctacagaaca aaggaaacgt ctaacaatag cggttgagtt 10860
agttgcaaat ccatcgataa ttttcatgga tgaaccaaca tctggacttg atgcaagagc 10920
agctgcaatt gttatgagaa ctgttaggaa cactgttgac actggtagaa cagtggtttg 10980
caccattcat caacctagta ttgacatttt cgaggctttt gacgaggttt gccctaagat 11040
ttcttgggtt acaagaaata ttatcaaccg gtgatcttaa cgtgtgttct tttttgccta 11100
cagctgcttc taatgaaacg aggaggacag gttatatatg gcgggaaatt aggtgaacac 11160
tcgcaggtta tggtagacta ctttcaggta ctttgtcttg gccttctcta catagttgct 11220
tgtcacccaa gaaaactatt atttcaaacc ctaaactttc tacagggtat taatggagtc 11280
cctggaatct caagtggcta caacccagca acatggatgc ttgaagtaac cacacctgct 11340
ttggaggaga aatatagcat ggactttgca gatttataca aaaaatctga acagtttagg 11400
taactatcac attacctaca ttttccaatc tcttttaaaa attattataa taaactgatc 11460
tttaaccatt tacagagaag tggaggcaaa catcaagcaa ctcagtgttc caccagaagg 11520
ctcagagcca ataaagttcg actcaatata ttcacaaaac caactctctc agtttctact 11580
ctgcctctgg aaacagaacc ttgtctactg gagaagtcca gaatacaatc ttgtgagact 11640
gatcttcaca acggtcgctg ctattatact cggcacggtc ttctgggaca ttggtaccaa 11700
gagaacttcc acacaagatt tggtcactat aatgggagct ctttactcgg cttgcttgtt 11760
tcttggagtt agtaatgctt catcagtaca accgatcgtt tcgatcgaaa gaacggtttt 11820
ctatagagag aaagcggcgg gaatgtatgg tccaatccca tatgcagcag ctcaagggct 11880
tgtggagata ccttacattc tcacccaaac cattctctat ggtgtcatca catacttcac 11940
cattggtttt gaaagaacgt tgagtaagtt tgttctctac ttggtgttca tgttcctcac 12000
tttcacctac ttcaccttct acggcatgat ggcggttggt ctcaccccga atcagcactt 12060
agctgctgtg atctcctctg cgttttactc tctatggaat ctcctatctg gtttcctcgt 12120
ccaaaaacct gtaagtatat tccactctat caagtgaaaa tgtagttaag atggagaaat 12180
gagtgatcag ttgtgtataa tgttgttgtt gtttcagttg attccagtgt ggtggatatg 12240
gttctattac atatgtccag tggcgtggac acttcaagga gtgatcctct cacagcttgg 12300
tgacgtggag agcatcatca aggagccaat gttccatggc acggtcaagc agtttattga 12360
acagtacttt gggtttaagc cagatatgat aggtgtatcg gctgcagttc ttgtcggatt 12420
ttgcgctctc ttcttctctg gattcgcact ttcagtcaaa ttcctcaatt tccagagaag 12480
atagaagaca agaacaaagg atattttgac tctttcttat gttagcatca ctcacgtgac 12540
aaacttttca tgtttttggc tctttctcac attttagtta gctttctttt ctattttacc 12600
actgatttag agttagtttt gttgacattg acgtaaaata aacctaaata tatatataaa 12660
gaaactgttt ttctctgttt agaaatttct ttgcttttgt aattttttgt ttagttgtta 12720
aaagccttgt ctcaaatact atatgagaaa cggctaaaaa gaatctctgt catcttactt 12780
actccacacg aaattgttta tatacaagtt taaccgatat gctaaaccta gatacacaat 12840
tttataataa aggaatgtag atatgttact ctatgattct tacatgagtc tccctaataa 12900
tactatgttt attatgcctt gctttctttg tttatctctg ctcttagaac aaacaacctt 12960
gatttgttgg gtctccttta gagggacgtc gttgtttttt ttggccaagg agactttttt 13020
ttttgaacta ccggctcaag gagacttaac acagctaaca gagtgtctat gaatagcaat 13080
gagtgtaaag tgatgtcttt gcaaatggta gcctcaagag ccctagcatc tccaatggga 13140
cacaaaaatt tactctatat ttcactctaa aatagagtaa ctctattata gagttgaatt 13200
tgcttcaata gttcactcta taatagagta actctattat agagtgaaat atagagtatt 13260
tttgtttttt tactctatat ttggagtaaa aaagcaacaa tactctatat ttcactctat 13320
tatagagtaa ctctattata gaataaacca ttggagcaaa ttcaactcta taatagagtt 13380
actctatttt aaagtgaaat atagagtaaa tttttgtgtc ccattggaga tgctctaagt 13440
ggtagcctca tttgagaata gaatatgctg tcttggtgtt tccactttgt taatatctct 13500
tgtggaggtt ttgaatatac aaatgtcaga gctgttactc ttattttatt tttaatttat 13560
tttatcattt tgttgtattg agcgaccaac ctataagagt acgattatga tttggagtct 13620
gacactcgtt ttctctcttg catcaaataa aactaggaat acaaatttga aaatactgta 13680
ttgaaagaac caaaatctct attaaaatcc aacataggac gaatgaaaat tttctaaaat 13740
tatgtaggaa cagttttacg agcaacacta atagtaatat ctttattatt atttggtcaa 13800
atgatacata ctaaagggtc aatttgtaat taaaaaaaaa gaaactaaaa agaacttcaa 13860
aatcttttta gatatatttt tagattgtgc aaaaaaaata tatttttttt agatatatca 13920
cagtcatgcg catcagaaag gcttatatat atttgggccg taaagtattg tccatcactt 13980
aaaaaagcga caactccgtg acattattgt tgtgctggga cccaaaaacg gcgtgcattt 14040
tgtcgactct ctcagtcgaa ctttttcttt tgtccccacc aacaaaaagt ttttaagacc 14100
tttatttatt gtaactaaaa acataaagaa aacgaacaaa aacttgattt gtaatgtaaa 14160
tacatttaat taaaaaaagt ttcacgagta catttaactt aaaaacaacc agaaataagt 14220
aaaaaccaaa ggactgtttt attcctaaat agagctagga agaaaggtta gttgattttg 14280
gatttgtcag aagcataaac gtagagatct ggatctgtct cgtagaagac aatatcacca 14340
gtgtcactga cgtaatgatc tttcttaata cttgccacca aactttccac caagtggatc 14400
ggtattgctc ctgacgtctt tggttctctg tagtatcttc ccaacacatg tttagctgat 14460
ttcgtctgtc gcatatcatt aattaagatc actaatttag taattaatca ccctttaatt 14520
ttaatcaaat gaaactagag agagagcgag atcactcacg gcatcaacca agtgatagtg 14580
agggatttgt gggaaaagat gatggatcac gtgagttcca atatcgtgat gaatgttgtt 14640
gaagatcccg taatctctat caatagttgt taatcctcca cgtaaataac tccattccta 14700
ttattgtaca caaaacatca ataatttaga ttaatcaaat actaatcatt gttgcttctt 14760
ataaattaat gttgatctac ttaccttgcc tctgtaccaa ggcaacttat catcgtgacc 14820
atgatgatgc aagtacgtga cagcgtccaa ccacattaca aagatctgaa atttttccaa 14880
aactttatgt caaaaacaaa ttatattagc aatgatataa taatgaaata tatgaaactt 14940
acaatgtaag gaacaccata gacttttaga actgtgactg gaccaacgag gaatgataga 15000
taaacaagag tggccaacat gatcgaccag caagtagttg aagttgcaat aagctttctc 15060
tcgcttgggg caaataaact actgtatggg ttataatgtg acccttcttt accaggactt 15120
ctgtaccact gtagtcatcc ccaaacaaat ttaatttata tttagttaat actcaaaatc 15180
taaaaattca aaattgtaat tataatcagg aagaaaaatg aggaattagg atttaccaga 15240
tagagagggt aagcgagcat ggggagaggg acagtgtatc tgagcatccg tgtactgtgg 15300
gacaaattct tgtataattt ttctggcaac tggaatgcaa aattaagatt aaaatgttaa 15360
ttaatattta acagtatggt tatatattcg aatttattca ttgcatgtgg tgtgtttata 15420
agtttttttc tttttattag ttctacgtaa actacaaaac tgaaaaatac taagaaaagt 15480
aaacgaattt cgagaagaat cattttatgc caatggctcg aatataagtg gcccgttgtt 15540
aaagttaact acagtaccat aaacaattta aatcagttgt ttactacagc taaacgacaa 15600
atctgacaag tggtcgtcca agcctcacac tggaaaaagg attgattaaa ataaatacat 15660
agaattctaa gaaaattaaa atgaaagagt ttcaaaaaaa gaaaaaaaaa taatgagagg 15720
gggattaccg gaacccaaga ctcgtcgttt tcaacatggc catggttctg gtggtgtgtc 15780
cgatggctta ttctcctgca accaccccca attataaaat aaactattat tttattttca 15840
taaaaatgaa attggaattg tcaataacat atcgttttcg aggcagatgc taagaatctc 15900
actcgtttaa ctacgttatt cattttttga gcaacaaaca aatgtatcta ggaaaatgat 15960
gcatgttcgt agatatttca agctgatgta tccatttaac aataaaataa gccattaaaa 16020
caaatatata taaatattat attaaactta tacattaatt tattcaagga catgtcatat 16080
gataatagct aattggacca taaataggcc catagcatta aataaaagtt tggttctttt 16140
ttcttcgatg ctaaagattt tgatgctttt agtcacatgc attattttac tatgaaaaat 16200
taatatattt tcagttatca gattactgtt tgctaacatg caccaagaat gacaaggaaa 16260
atgtaagaaa tacgaaaaca agaataaatt tgcatgaaaa aagaagttaa aataaatgac 16320
ttaccaacca tggtatggaa cgagaatgaa ggaatgaaga atatgaccaa ccgcagtatt 16380
cagaagagga atgtctgaga agctcccatg tccactgtat tattcaaatg aaattttaca 16440
tcataaacac atttatcatt tattgcacaa tgttaactga actttcctca attcaaacgt 16500
ttcaacaagg taacaaaaat agaatatgac gtgtcacatg actatatttc gaaaatagat 16560
tggaacaaca cacaataatt aaaagaacca ataaacagta attaaattgt tacagaaaac 16620
aataaaatgt gttttattga aaatttcaaa cgtagatcca taaaacgcgg aaacaacaat 16680
aattatagga aagaaaaaga tgtttagtta ggagtgttac gactgatgaa aaagaaccaa 16740
aaaaaaacaa aagaattaaa aatcttagat ccccttttgc ttttaaaata ggccaaattg 16800
gatgaacata ataattaaaa ttgaaaaaag taaacctgaa gagaatcaaa tcttgaagtc 16860
agtgaaaatc tcatatcgaa cgtacggtca agaaatcaaa gacaatgcaa aaaacgaaaa 16920
aaacatataa acatatcaaa attaagaagt tgaaagaaaa attaaattac cagtcgtggc 16980
cgagtacgaa gatagcccag aacagggttc cttgggcggc ccaataaaga ggccaaaaga 17040
accagctatc aaaatacacg gcggcgacgg caagagccac gacggcgaaa atgtctctgg 17100
cgacatagct catggatctc aaaggactct ttacccaaca atgcttagga atggccgccc 17160
ttatatctcc gatcttgaac ggtggttgtg cgctcggatc aaacctttcg tctccgttcg 17220
cattgctacg ctggtccata gcgacaacca tcgccggaga aagagagaga gctttgaggg 17280
atgtttctct ctctctctaa aactgtgtgg gctctgagtg aaatgtggtg aagaaagggt 17340
ctgatggact ttggggtatg tgtggtttgt ttatatagag ggagaagatg tgtagagaca 17400
ccaaactgtt ttctattttt cttaatttaa gaaacttatt tatttctttg aagaataaaa 17460
agtgtatttt tgcggtaacc tgtgcgcaat gtatctttgt tacgtcgttc atttcgatga 17520
aaactaagtt agagaaatgt gttacaaaaa aaaaggcaat gctataaaat ttccagaaga 17580
ttagaaattg cgttattaag tataaggatt ataccaaatt gcattatttt ccttagaaat 17640
aaggattata ccaaatgaat tgttaatgtt tcgtactttt actggatatt tatgcactga 17700
aatggtagtc ctttttggga cttaaacaac ttgtatgatt tttacaattt agcaaaagaa 17760
aaatacatgt agtcgaaaat atttttttta gtcttcaata tatagttttt tgctaaaatt 17820
tcctcgatta tgtattaatc ataaaaaacg atctatatcg atatcatata gacagtagat 17880
atgacaacat ttatatggat ttaaaaaaac gtattaatgt gagggaaaat agttgccaca 17940
tcactgtgat gtatttgact taagaaacag acttccatca gtttatttat ttgagacgac 18000
ttgattaaat tggcagtcta tacaatagta caatgtatag gtaactttaa ttttatcaaa 18060
aaatttgtgt aaccaatcaa atttaatatt agttatattt tatagttggt tgaataattt 18120
ttaatttata attttaataa tatattttag ataaaaaata ttttttaata aacgtgtttt 18180
atctatagaa tatcttatat ttagaaacgg agagagtata acatatgtat atgagaatca 18240
gttggattta acaaattcac tagatccgga aataacacca ccaaaataga acaagatcaa 18300
aacatgatgt agggtctgaa tgaattgctt aaaaatggta taatattcca attatgttta 18360
ttagtactta taaaattagt gatcggttta actttttaac atataactaa ctttgactgc 18420
tgaatatggt gtcttgatca aaaaagacat ttgtggttag tcaatgagac atcatatttt 18480
agaaatgcag gcaagatggc gtttcctcta cctctttttc tctcttaaat caatttccca 18540
acacgtcttt acgagttaag catcaactaa ttgctacaat tgtatacaga tttgacctac 18600
ttgcctccat taactacatt tcaggctata tgttagtgta tatgtaggca ttaattataa 18660
atacgcattt caactgagct tcaatgcata tattcaaatt ttttgttgga atgatttccc 18720
catctttaag aatcgggtag tgaagactga ggacgtgaac cgtgggttta ctgttttatt 18780
aactctacct atatcagttt ttaatattca attttatatg agaaatcgat taatattact 18840
ataatacaaa cattgttttc ctccgttata ttatggtttt tgtcactgaa tttgaacatg 18900
atttgagaca gagaccaaac aatatatgac gtctgtatac ttaatcaaaa tatgagaaga 18960
ttatatgcac tctatcttta aacgtgagat ctccaaaact gtcataaaaa cgtgaactcg 19020
tttcttcttc caataacaaa tatcaatatt gttcatccaa ttccttcctc cataaaaacg 19080
tgaacacctt tcttcttcca atcgtaatat catgtgttgt tcatccagtt ccttcctcca 19140
caagctttct atcgaacgga acagtctgaa accgtgttaa acaaatcacc ctggaagatg 19200
taatccagct tctgtgagag ttttgaagaa ggaagatctc tttttgtaac gcaaacattt 19260
aattttcctc atatgtgatt cgatgatgtt tgataattaa aaatgtgatg gccttaatga 19320
ataatcttgg tcatgttttt agtaaccact atttcttcta gcagtcatca aaacaatttt 19380
tttttataat gttgatttat tatgatatta attatgaaaa atattacata gacgattcga 19440
caaccgacaa tactacatgt cttatgagga tctacttcta actgtattat ctgagccgtc 19500
ctacgaatat ccactcctga ctagatttac ttgcaccatg ttgaagattc cttgtaagtt 19560
tttcttctgt agtctgcatt aataaatcgt tatattcgga acttgaaaca tggatttcct 19620
gtaatctgca aataattgca tagtctggga ctcgaactcc aaacctgact gtataagtct 19680
ttaaacctta actaataggc tatggtgctt ccacgatcat caaaacagtt taccacatga 19740
gattatatat gacgttggat aacatgtatg attaatttat taaagactca ttaataaaaa 19800
tttaactgta gttttttttt tgaataaaca tagtttcctc gatctcaaag aatctacaat 19860
ttaaaattca aatgtttctc taaaaaatga agtaattcca caatataatt gagtttactc 19920
aaatcgtaat tcattgttag agtgaaaata aagtaataaa taaaaaatac ttttttattt 19980
gaaatgccat tttaaagtaa attacgaagt tggatggaaa atattttaat tactcaaaat 20040
tttataacta tatatctagg tgagccatgg aaaaggaaag gtacaaaatg atgagtgtgg 20100
gcgtagacat gaagcctgca cgtgagagtt gtagctattc gacaaacata tactaatttg 20160
ttgcgtacca tttccacttt atatatattt atatatttgt gtgtgttgag ctgagatatg 20220
agaataaaaa ttgagaatat acctcaaaaa tgcaaagaga agtatgtgtt tgttatttag 20280
cagacgcaca tggtggagga catcctcgtg agttccgaag ggctaagtta tacagcttta 20340
accgagctaa ttaattcatc gtccttacat aatttgagca ctatttgaag aagacagagt 20400
atatatacat attagttaat acagttatat atgatccaat tttctttgtt tgacaacaat 20460
gtgttttcaa acaaagaccc tgtaactttt tttgacccgg ttctgatata tgtatgtgaa 20520
tatgtgattc atatatttct ctaactacga gtacgactaa atgtgcttat caattatcat 20580
acacgtctct acgtgcttct ctatcttata ttcttggtat taaccattcg tattttatga 20640
acattcgtgt acgttgaaag gaatcattac gtagatgccc acgatgttac ccaagttgga 20700
gaattatgtt atttagaaaa cccattttta attacgctaa ttaccaaaaa taatatgaag 20760
aatggggccg tgggaatatg ctttcggtag gttttgcgtt ctaaatttac atagcatagg 20820
cagtcaacag ataagaggtt aaatgtatat tagaccgaaa tatttttaac gtgttggggg 20880
gtgggggggg 20890
<210> 2
<211> 105998
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 2
acaactaata ctatatctat tcaacaaaaa aaaaaaaact acccaataaa aaacatttca 60
attgcaataa tgaagataat gatatgactt cagaacaaca tcgtcccatc ttaaacccaa 120
tatgatgtca tctttagatg ataaaatatt ttgattttta tttttagcct tttattagaa 180
agaaaattaa ctgtaataaa ttatacaaat tgaaaaatat ccttacaatt ttattaagct 240
tcaatcagac attaaatttt ttgtggttac aaatttttgc agattatttc aaggaacatg 300
caaaatattc atcaactaat aaattattta aacaaacata ttaactcatc tattatatta 360
aattaggaac atgatctatt aatatatgtt ttgtgctact attttgatat aattattaaa 420
acattttact aatcacttaa aaaaatattt tacaaaaata taattataaa aaaacaccaa 480
tacgattaaa cacacaaata gaaaaattag tttaaaaaat gtaaaacaga aaatataccc 540
gctctttgaa gagcgggtca gaatctagtt cagtgataaa ttagaatatg ttacttttga 600
cgttaaaaca aacagaatat tttttgaaca ctagaatatt tgaatatgtt aattggtatt 660
gatgtttttt tgaaaaaata aaaaaaataa aaattaactc tgtgcttttc tacagtaata 720
gaatcgatgc ctcgagtcga gatacaacca tctggtgcac taaaacttgg gaccattaag 780
ataagaacca agcaaattgc atattacatt atatatatat ataaatatat atatatatat 840
gtatataaaa attacacaga agttgtcact attaattaaa gatatctttg tcaatatttt 900
aatggtgaca tcaataattc tttttttggg ttcttcatcc agctgccagt attcaaaaaa 960
aaaaatctct gaaaatattt cattgattag aaagaaatat acatcagcaa aattagcata 1020
tcaacaaaag aataatcaag gctaatggaa cataacatca aaacaaagaa ctagctaaaa 1080
cagaggagga tctctcattg tcaaaaagat aagagtgccc agaaggatgg ctgagagcaa 1140
cataagatcg cattcggttt tgaaaaatca catgttgaac gatgagatga gcttctctgt 1200
tagcagtatg atgttcgcat acaaccttcc attgatccaa attttccaaa aggagattaa 1260
gctccaccac tttgaagcta aaggatgacc acgctcttgg tctattaatt gcacccacta 1320
aggttcttcc catctaagtc aaaccaaacc ttcaaaagct tatgactaaa tactttcaat 1380
atatagtcca cacaggagag atgaaatgag cttcattttc cgaacccacg gacctgaaag 1440
cccctcggct atgcatagac aagtcaagat attatcggca tcatgccatc ttttgcatac 1500
cacacgtcgg caacaaaata tttccaaata aacatattta agcacaataa ttacatcttt 1560
ttggttaata acgagaatct gttgatagta tggttgaatt agaataaatc ttgcttttct 1620
tcttacattt tctcaccaaa attcaacatg cacgcataaa gtgtgtaaac tgtttagtat 1680
aaaatttcac gcgaagttcg tgtgaaattg gaaaacagac ctaactctgt cttaattctt 1740
gcaaatgcag cttgattttg aagctaaatc ctttaacttg tggttaacgt tgattaccaa 1800
aaaaaacatg tggttaacgt gtaaattaac aacccattta gtggtgaacc taactcagcc 1860
atgtcgcttt ataattaggt caatattaat tacagaactt caattcactt ggttcactta 1920
cctttgattt tccttgttcc acgactcttt ttttttgttt tttttttcat acaagaaact 1980
cagatggcac atttttaaag aagagttgaa aggaaaatga acaagcataa atttggtttt 2040
tttcaaccga agaacattat aagtcaagtt ttgaattatc attaacatgt ttcttattat 2100
ggaatagcca tacacattcg gagttcggtc atatgtatca tacatgcgtg ggaacaagaa 2160
tattcgtaga caactaattt taaaaatgtg acgtaaatgt caaactatta gggtatgaat 2220
ggtgaccaag gaatgacgag gaacaaatgc attccctaac attccttaca aaaatcacca 2280
ttcataagga ataatttttc cttctcattc cctaccattc ctttttatgt agagaaataa 2340
agaacaaatt aattccttgt taaatatgag atggaacaac cattcccttt cattcctgca 2400
attttattcc tctacattcc tttcctattc gttcctcttg tttccagaat ggttaccagt 2460
cggaccctta gaaaaaatct tacgatattt tttattgaaa gatgacgttt cttttttctg 2520
gagcatgaat attcatatat ctataggact cctgttgaca attaaaaact atcttaggcc 2580
ggggtatttt gatcggattt aagtctatgt atttttattt ataccaatgg gccgggttac 2640
cgtttaagtt taggacaatt tattaaaaat aatccaaaat ttgaaaaatg aaaatctata 2700
catgaaattc aatcaaaagt aaaattaatc taaaataata gtgcaattac aactattttt 2760
atgactaaaa atatataaag acttttaaaa ttatagtctt gaaaattttg cacgggacaa 2820
tgaaatcttc tgagaagtct agttataaat ctaattataa ttactttata aatttttgag 2880
aaaaaaatac tttgattgga aataaattga aatcatgtga atataaaaaa ttctaaataa 2940
tgtaaattga aagttaataa gaataaataa ttatgataca tataagtgaa tatatattgt 3000
aagtcattat tgtccattgg ttagaatttt tgttacatat tcaagtaata tttatatagt 3060
tatattttgg attcttaaat attttttgaa attaaaattt tgcatataag tgttaaattt 3120
tgtgtatatt aaacatttta caaattgatt ttattttaat aaagaggtat ttctagttat 3180
ttcaattatt tgattttagg ctctaaggat aagagacttc gtaaagaatt cggctaagtt 3240
attttgtttc ctatccgttt tgatttttta aatctctttg ttgtgaaatc tgttattaaa 3300
tatagcataa tttaaaaata attgtaaata taaaacaagt aacaagtatg aaaaaattgc 3360
tacctggcta tatattactc gaagacatta ttattgctat gaaaagtaaa taatattcat 3420
atatagaaac atccatgttt ttgctcatta ttatcttctg taatgtgcac aaatattact 3480
tttagagtga ttcctgtact cttatagtag agtaaacaaa aaaaatcata tttttttaat 3540
agtattattt aacaaataat tttcaaaaac tctatatact tctaaataac tgacaagtat 3600
ttacaaagca agtaacagaa catgacataa tgtacaagta aatcattatt aagcaagtgc 3660
ttgaaataac aaatgattgt ttttaacaaa caaaatacaa atcaaaattt tgatgactcg 3720
tgtaaaacaa gtcaaatatc aaatcaacac aataattagg tttggttttc tccagagcat 3780
gacacctcag attttaaaat agatgtggga ttgacatgtc atcaaatgaa aaaagttgag 3840
taaccaatct aattattttg tacgtccaca tcagtttcgc tcagccgtaa tgagaaaaaa 3900
aaattacgaa gattacttta cctatctctt ctcctctgtc tctcctcttg ctctgtttcc 3960
tcctctcctt actcaatttt tttcagacgt gggctggtca aaccccaacc cttgcaaatg 4020
ggacaccgtc caatgagacg ggaacagctg cgtcacgagg aaccagctca gacagaaggg 4080
gatccgcagc actctccctc cggatctcca taaactctcc gagcttgtcg tcctcgagac 4140
tcacgtcaga cggtcagaga agacagagca gcggcgtcgg agaagacaga gcagcggggt 4200
cggagccgag ctcgtcgtcc tcgagactca cgagtcagac gtcggagaaa acagagcagc 4260
ggggtcggag ccgagctcgt cgtcctcgag actcatcaga cagacgtcgg agaagacagt 4320
gcagcggcgt cggcgaagaa aaagagcagt ggcgtggtcg gcgaagaaga gcagcagcgt 4380
cggagatggt actgaagcgg ggctgattga cggcgtaggt tgaagaagag ctttgtttga 4440
cagctgaatt aggtttaatc aattggttta gttaataaac caatttgtaa ttgtaaccaa 4500
tttttaattg taaaccatgt atccaaattt cgtatcgtaa agaaatacca atttataatc 4560
cgatttagtt acaaataaac ttttatttta tgtttttttt aaaataatta aaagaagtaa 4620
atactataaa attaataatt ttaaaataaa taataacaaa aaaaatgata ttaaataata 4680
tttaatggca gacaaaaaag agaattacac tatgatatca ctaaaaaaag tttctgtcac 4740
aaataaaaaa tatagactct aaagattgaa atgatcaaaa tgtttcatta aagagttaaa 4800
tatacattta tatctctagg gttaactaat tcaaatttta gagtttaaag ttaaaagtgg 4860
agatttgaga ttgagattta aaattttata aaacaaaaaa taaatattaa aaataaaaaa 4920
tttaaaaata gtttcaaaaa ttattttcga attacaaaaa gaaaatttca aaaaaaaatt 4980
aataaaaaaa ttcgaatttg aaaacatata atctaaaact ataacaaaat ttttttttaa 5040
atttttttaa tttattttaa ttttattttt tatatatcta tggtgttagg gtccttttac 5100
ctattaaata aaatattttg gtcattttct tccttgtggt ctatttttgt gaccaaaaat 5160
tgaaaatgat ctttttagaa gaattgctct acaaaaaatg ctatattaat cataaaaaat 5220
taatcataaa aagtaatgct tatcattata ggataaattt ttataatatc tattagtgtg 5280
tatgcttttt gaaattgttt aagcaaattt gatacactat caagagctgc agaaattaca 5340
ttatcaaatt agattaatac taattctgta aaaatacaaa atttatataa tatctttgtc 5400
cgcggcgtag cgcgggtatt aacctagtat aagtaaaata gcaaatatca ggtctgtgtg 5460
tgttcccata ttagatggtt ggtccatctg actttgaaag gtactggatt tgattttgat 5520
acccagatgg cgatgtttta aaataattga attattaatc tagttcctaa taattaatat 5580
acgaaatttt gttattcagc taataattaa tcaagtttct ggaagatttt ctttcgggaa 5640
gattgcacat aatgactttc actattaaaa actcgtttca tagctagaac attttttata 5700
tattttgtac ttttattcat ggctgattta caacatgttt tctatatatt ttgaaaacta 5760
acttttatag caaattacta actagtttat tatttctttt tccaaatata ttgagaaaat 5820
ttgatcaaaa tgtaaactag ttttccagaa tcatatataa catcggaaat atatcagaat 5880
atatatagtg ttacaaattt aattataaat tttcaaaaac taattagtct ttctatggga 5940
atagaaaaac agacaagtcc caaaggtttt tttttttgac aaagggttaa gtcccaaagt 6000
tacgatgata aataatgtta caaatgtgtc accaaatttg tgagaaacat tgctaaggca 6060
tcagcagtct accaattatc aaacgcatga aaactattct catgatctta aaaatggcga 6120
acaaaatgaa ctcaacaaga ttttgattgt ggcctgaaac gatcagcttt tatgatactc 6180
ttataatatc acaagatttt gattgtgggt gatcgtactg atctaatatt agttttatca 6240
agtttgcaga acttttctta tcgatttcgc tattgagttt acacttacct gctgtatagt 6300
attcacatcg ccgagaaggt aaataaacag tactcttatg tttttttgtt tttttggtaa 6360
aatcagtact ctatgttgca aaaatgtgcg actgattcat gtttggcttt acatttttgc 6420
ttcggtagaa atcagaaagc aagtgaatag taaaaaatgg ttcgtatcaa gttggtgtaa 6480
aattttgtga ttgattgaac aatttaattc tgtcgagttc acattgctgc tagcctggta 6540
caaactctcc aataatttaa agaaacgtaa atggactgga catatgcatg cacacggttg 6600
ggaattattt aagaaaatgt aactcaacaa ccaaatcttg taagtgtcct gtcatttggt 6660
ggggtccatc cgtaccatct cttaaaataa aactcaaagt acatgcatgt aaaagtggat 6720
cggaataatt gcactcccaa aacaaacaaa ggctactaga aaatatatgc aaaaataaaa 6780
gaacagaaag aagaaaaagt gagattgcgt gtgtaaaaag taaagtagcc agaaaaaaaa 6840
gaagaaaaaa gtacaaaagc gtccctttga tagatgtatt gtgttcaaag ttctgtatga 6900
tgtttctatg aaatttctag atttgatacc ataatcaata tactcggatc cgatagacct 6960
cataggaagg ttctctgaac actttaacaa ctagtataag aaatagagtt caatacaaaa 7020
tattaaatta caaataaggt ttattgttta gtttcgtttt agacattcgt atctaattat 7080
aatttatagt ctttggtaga ttgatcaggt taaaaggcct acatgtgaca aatcagcatc 7140
atgcattaat gggttcccaa tttttgcgat ccagtttagt aaaagtcaga ttaaagccaa 7200
tgccactatc accccaagaa taccatcatg ggtcctgtca actaatgtga cacatgaccg 7260
aacctgaatc gttatttgtc ccattgtaat aattcacaat ctagagggct tatccatacc 7320
atatctaagc cggtcttgtc gcttcattcc atttttacca ttttactgac taattataag 7380
agttctatct accccctaat ttttttttta aattgatcat ttattaggcc gattgtaacg 7440
ttatgaacat tccaacccgg tccatcctga tctgatcaga tagctaggtg tcggtcatat 7500
cacaactagt gcttggttgt ggatcaaacc cgacaaccca cagattgagt gatttttttt 7560
attcaagaaa tttgacttgt ttaacccgca acaagaaaat ataaaatcta catccgtccg 7620
cttaaacttg cggatgaccc acaagtaatt ttaataataa taaaattgtt attttaaata 7680
ttttttaaaa taataacaaa aatcaattta taattaaaat taaatatttt ttattaataa 7740
tattttcttc ctaatttttt gtggttcaat ttcggctgac ccgcataaaa aactcttgac 7800
ccttacccgc atccgccaat caactttttt tcaaatcact cgaccgcaac aaccacgcgg 7860
cggatccaac agggcagaac ccgccaataa tgactcaaat atctctagcc caatattgat 7920
cggatgatcc ggttttgaag ttcttataga actgcaatac actaatctaa tgtaacacgc 7980
cttgtttaat aaaaaagaca caatccaatg catacatttt gaaaaatcaa aacaaaggga 8040
tattctttcc acataacgaa tcccaaaaca accccagaac ctctcatatg tgtcacatgt 8100
gatactcttg tgacactaac atataaactc gacacgactc agaaagtgaa catgatgaca 8160
ctgacagaac atgtatcaat ttcaagaaaa agaaaagaaa gccaagttat gcgatggatt 8220
taaaacatat caggctgtaa attaactagc ctcgtgtgtt tgttgtatca atgcatgcat 8280
cttacgcaga gggcacagac tcgtcggttt tcttttcttc aacagctttc tctgcctctg 8340
ctgatgctac cttctcgact ggtttctctt ccttcttctc ctcggtgtcc ttctcttcca 8400
ctgtcaactt ctcaagaaga ccagcagtat cagaagcctc tttactctct tctttctctt 8460
cttcagaatc ggtaacttcc ttgaactttt gcataaatgc tttgcagtct gataacggta 8520
ttgtaaacaa gacttgatta tttatacaag gtagaaagat ttttaaaaac acaaacaata 8580
aatcacatga aacagtttcc aatactacac gtctactaca ccagctcatt cccaagctac 8640
actgagacag ccaatataaa cactagagct ttcgactgct tttagtctat ccagatcata 8700
cacttgaacc tacacaaatg tccagatacc tctagttgga ttgccacctt taaaaggcta 8760
ccattaagta aacaaccatg atacccttca acaattactg attagtgcaa agggaaaata 8820
actcaaaaac aagtaaaaac tctaaaatgg gtgatactat aagcttgtag aactgaacat 8880
ccaaaacttg tgaccatatg caaatatcac caagttcaag atcctccagt gacctaagcc 8940
ataaatttac attatctaca ctctagaccc cggaaaaaaa ggattagtca tgctcttaag 9000
gtttaagcta ctataagtat gccacacata cacaagggaa aaatccagac tcactctcaa 9060
ctgacgcaaa gtggattaaa aaaaggttta agctttgggg aacatcctaa agatttaagc 9120
tactataaac tatgctacaa tgagaacagt gctaccacaa gcaacaatga gatccaaaca 9180
cacacaatga gactgattcg aactcactct caaccgaagc aaaccggata cagaaaagct 9240
catccttcaa ctccccatcg gagaaatcac gagcgtgcca cacacaagac ttatcattcc 9300
cagcgtgttc ctgaacactc atccccgacg taactgcaca taaggagaag aatcaaacaa 9360
tgagaataac acaaacacag atccatcatt aaaaaatagt cacgatcggt accgagatga 9420
ttagcacaga tcttgagagt tttggactgc ctcataacga gacggatctt cccagactcc 9480
ttatgcttca agaacttgac cgtaccagcg cctctctcct tccactgact cccatcttta 9540
tcgaacctat acagcttcga tttcctaaca gattcgcaaa aaaaaacaat aatcaacaac 9600
cacgatcaga tctagaaccg atctagtagg aggagtagag tttacagatc gaggattgcg 9660
tcttcgtttt cttcgccggt agtgacggcg acttcttcga gtttgatgat gggagcgacc 9720
tgagcgccgg tgtcttcgtc ctcgttggct ccggactctt cttcgtctct gtgctcgcgc 9780
tccggctcgt tgctgatgct cgccatctta tcagatcaga tcgaagcttt gctggttgtt 9840
gttgttggat tacagagtgg gcgtaggagc tagctagatt ggaggagaga atgttgggag 9900
agtttctgtt gacggaaaat gatttgtttt tttataagag agagagacgg cgctttgttg 9960
gaaatggatc tttgatttaa atgggcctac gtcacgttta ttccggagag ctgaatatgg 10020
tggactgtac tggatccatt ctggaaagct gagtatgcag agctcaaatt gaattaattt 10080
gattaggggg catatgcatt tgtcttttca aatcggaatt tgagttagtt cttatcaaag 10140
aaagttcaag aaatctgtaa gagatagttc tgcgtttctt aagaaattat tgattatgta 10200
aattagaccg atttttttaa tatttaaacc atttttttag gaaaaaatgt ttcgtttaaa 10260
tactgcttag gcggacgtcc aactgttgcg aacataattt tttagaaaac tggttcttat 10320
catatatgat tttcagatag aaacgttttg aatacattcc atggaatttc cgattggttg 10380
tactcaggtt tcaaatcagt tccaattttt tttatacatg taaatatttg aaaaacatat 10440
tagtcctttt tcttggatac tttgggaaat tctttaaatt tatcttgtta caattatttt 10500
gttacaacta gatcataaat aaaaataatc atgagtatac ggattttggg actgaatgtt 10560
tcaaacaaaa aaaatttaga ttaatatttg ttcacaaaat ttcaaacaca agactaaact 10620
tgacattttt tttcctaacc gaatccagtt aaaccagtat gctaaagtca aatatgacac 10680
aacaagaaca tcatgtgtcg aaagattcag gtagtccagt ttaaaactaa gataatatat 10740
ttcatgaaga tagtgtttca aaaggggaaa acaaaagaaa aagtcgctag gaaagttgaa 10800
aatgtccaaa atgttccaaa cccaaattga gaaaaaacca catccacatt ccctcagata 10860
gaccaccaaa ccagcctgag aaaaacgatt cttttgaaag aagactttaa ttcagtaaag 10920
gaaacagcga aacatatcat tccagaacgg tgacttgttc ccactctcca tcaacagcct 10980
ctttccacac cgtcacgttg ttgttcccat cggacacggc caacatgtta cctgtcaacg 11040
accacgacac ccgccacact ggagtcataa agtccttcag aatcttacct tcccattgct 11100
caccttcttt ccccacagtc catatgatca ctttcccatc ctgtgagcca ctggctatgg 11160
tggacttagg gagacccaag ttcggtgccc aagccacatc acgaacccaa tcagtatgct 11220
tctgaagagc cggaaagcaa tccatcttcc acgacccgtt tgagagcttc cacactttca 11280
cagtattatc acacccaccg gaagccagct tgtaaaccgg atcaagcaag ccagagctga 11340
caagagcacc aggggaagtg gcaggtgccc atgagacaga agtgactcca acaggatgcg 11400
cttggtcaat cttcgtcgtg tcccagccac catcagcacg gcctgtgaat accgaaatgt 11460
ttccgtcgga tgacccacaa gccaaggata gtccgaggtc atgaggagcc caagcgatgg 11520
agttgacaga agatttatgg tccgtgaaga catgagcttg ggtccactgg ttttggctgc 11580
cttctttcca gagtatgacc tgaccgtcat aggagcatga agcaaggaat gatccaaact 11640
tagggtgggc ccacgcgacc tgccagacag gaccacggtg gccggttaat gtagctaggt 11700
gctgggatcc accgttgttg ctgactccgg ttatcttgat ggtgcagtca gatgaggcag 11760
ttgcaactct ctttccgtag tagtccattt gcacatcatg gaccatgtct tcatgacctg 11820
tttcgatctt ctgacccggc atgtttccgg attgactttc tctgcttctt aaaagaaaac 11880
acagcgaaac agctcgtaaa cacacagttc aatttcaatg aagtataata acattttaca 11940
cgttgaggat gttcgcttaa ccacgtgttc tcataggctc acacatgtaa tcaagaaaga 12000
ttatataata tgattatgaa cagaatgaag tttcagtcag agaccactaa caatgtacca 12060
ttcaatcctc agagatcaat ttcaacctca actaagaaaa ttacgattga tcaaacgtca 12120
caggggccaa ttgcacaata ctgtataaga gattaacaat agatccgagt agtaaatcct 12180
cagaacgaaa ctctagccgc agatcgactc gattcaaaca caaagatcta agctaagatc 12240
tcgaatccaa agcagaatca aatcgattca aatgttgaga gatagctgta gaaatgagat 12300
tcaattagac ggatcacgag gtcagagtca cgatacaaac cagatcaaac gaagattaat 12360
cacgctgaca aaatcaatca cagattcgaa cagaaaccta gcttagattt accgagacag 12420
cgcagaaaat cgagaaaacg aaattcgcag aagtagctca gggaagagat agcgtacctg 12480
aaggagcggt cggtcgacta agagacgccg gagtgtgagt tggagaagaa gatcgacaga 12540
gaagaaaacg ctagggggaa gcgatggata gtttttttct gtttctaaag aaaaagaaaa 12600
atagatctaa cagagtgatc taaaccgtag tccagactct aaaccgggtg ggtagactag 12660
agatatttta ttataaagcg gttatcagcg cagcttaatt atctaactat tttcttctcg 12720
accttggttt gacccttttt tggttctaga gtttgtataa accgatctca aaactaatta 12780
cagagtaatc taaaccgtgg ccatccagat taaaccggac gttcaaatag atgagagtca 12840
actcccatgt tttttttctg aacctttttg gctatttttt tcttttcttt tttttaatca 12900
tctgattata gatgaaatac agagctaacg gaacatacga agcccccgaa tcaaaagcct 12960
aaaacaaggc agcatagagt ttcatttcta cggaatttct atagcataat gcgtttagtc 13020
aattgttttt ttcttttttt gctaaaagta gtcaattgtt agtctcattt aacaaaaatc 13080
atatcttata ttctcacgga tctatattgt aactcttaag tatcatcaat gaatttgatc 13140
tcttctacgt tactttggtt gatgtgcact tgcaatatag tagtattata taggttaata 13200
cgttgtcgtc aacttccact gtttaccatg ttcttgttca tggaaacgca caaaccattc 13260
gattcgcctt tcggaaagtc cccatataag tgattcctcg ctgaatgatc tcgttggggc 13320
caacctaaaa gtgcattttg tttactccct agcagtcaaa catttcattc ctgagttcaa 13380
caaaatccag taaattcaat gttttaattg tttggcattc ccgaagaatt ttcccaaatt 13440
gtattatcat tggacattgg ctctcttatt aaatactact atgggtcaaa ccttcattca 13500
actacgaagc tttctcacgt ttacatgctt ctttttttat atatggataa cctacaaaag 13560
agtcgtaaaa tgaaaagggt tgctggactg cactacccta cccacctagg tattggctaa 13620
gttggccaag tatacataat atgtaaatgt attaaacata aactacaata caaatatgat 13680
caactcgtaa agaaatcaaa tatttaatat cgatgcaaaa atatataata ttggaatttt 13740
aagtacaatt atccactaaa aagcaaagaa agtgttgcac aaaaataaaa tagaaaatga 13800
aaaaaggata tgcgatgaag agagtggaat actctaaaag gtagcgtata atctatgttg 13860
atacctttct ccaaattgaa aacttgtgga gttgtggcaa tccaacattg cccaccactt 13920
catagtcata ttccatttgc tcctccttat ttctttgttt attgtctggt ttttaaacat 13980
tgatcaacgt ttatagttca cagactatgc gacctaacaa gtttatctac accaacacca 14040
aaattaaaga gaggctggca atttcaggtt ggcccctaat cacttacttt agtaggccta 14100
actacactac ttgcatggtc ttagttcgtc tctaacgacc ttcaatatat aataaaaata 14160
ataatacttg gtcaagaagc taccactacc aaatcaagat gggattgtgt aaacgagagt 14220
tatcaacaaa aagaggcaac agttgagagt taggacgctc atcacaccac gtaaaagagc 14280
tttcaagaaa tagatagacc gatccgaatc acatgcatta ccgaataaaa agttaaggct 14340
gagaatgaaa gagatttttt ctcgcaactt cttcttatta ttatattcat gatgataaca 14400
aaaatatata acacgaataa taatgctgta aaacttgaca tatatctgaa tattctctac 14460
cacaagtaac agcaatagtt cacacgtcat cgccgacgtg gattcttcat ttcccggcgg 14520
tctaacggac gtgttcaatt ccgattctac ccttgctgaa actagatatt ccccttgtgc 14580
ccctgactct tcgaaagcat tggctctcac ctcaatccaa ccgtttgatt cccattttgc 14640
ccctccggtc gtcgctaatt tactcatcct tgccatcgcc gaaaccgtag actcaactct 14700
agctacatcg ctcacttcat cttcttcgaa atccgagttg acccagtcca atacgcaacg 14760
cggagacgac tcggtgacaa acgagtgatg atcttgacac agaaacggat gctccagaag 14820
ctggccgcag ctccatctct gactccgatc tcgtctcaag catttgtcca agaaatcgcg 14880
accgagctcc gaaactcccg ccggaataaa cggcagctcg tttgaatacc cgatccgact 14940
cagcgagtcg aatccgttat cttcccacgc tggctttctg gtgagcatct cgatgacggt 15000
gcaaccgaga gaccacacgt cactctccgg cccttgatac tctctcctta tcacttccgg 15060
agccatccaa agcggacttc cacgcggcgc aatcccagcc gtcggttttt taaattccat 15120
cgccgatccg aagtccgcca gcttaacgga gcttccgccg ttaacgacca gaacgttctt 15180
cgatttaacg tcgcagtgaa cgattccgtt agagtgaacg tgaccgagag cggagacgag 15240
acaccatacg taacggcgta tgagagtttc gtcaactacg gttccaccgt ttgacaggtc 15300
accttccggt aaatattcca aatggagatt cctgaacgac gtcgttcctt ctttggacac 15360
gtcatcgccg aggaacctca cgatgtgtgg gtgggacttg agagagcgga ggattgtgat 15420
ttcgttctcg agggactcgg attgagaagg aagacacgtg gcgagatcta ctgacttaac 15480
ggcgaaaact ccaccgtcga tcttactcac ggctttggtt accgttccaa agcatcctct 15540
cccgatacaa gaacctcgaa tccaaggaga tgaagaagtg tttgtgatgc tctgtttctc 15600
catgtgtttt tgtttgctaa ctaactttgg tgtgtaaaat tatgaagtac acacgacggt 15660
atataactat atatacgtgt gcgaaagtgt caaatgtgaa gcacaaataa agttgggagt 15720
tttattaatt tccgacgtgg acgtttcttt tctacttgtc tttctgacat ttgaaatcgt 15780
gaagccattt taagccattt taaaatacaa taaaaagttt cccacttggg aattcagaac 15840
taactctcga attattgatt ataatatttt aaaattagac aaatggataa ttgggagaac 15900
ggtttgatga agtcagttcg acacttggtg atgttcttgg gatgttctgt aagaaaaccg 15960
agtactttcc atattatcct tatccataat aagattcaag ttgcggtttg atcaggtccg 16020
ttgatctgtt acctcttaga cactgttatt ttatttgagt gtcatataga aaaggtaaca 16080
tatatctttg taaaacgcaa cttcatttta aatcatttat ttactaagaa cagaggaaat 16140
attattttga tttactatta ttttataaat gcaccatttt tatgaatttt tataaaattt 16200
tatatgctga atatgtaaga tgttttcata ttttatatgt aacttttaat tttataaaaa 16260
aatgtaagat tagtgatatt ttataatcta tttataatta gttaaataat ttaaatttaa 16320
attttaataa ttatttttat ataaaaatat atatttttaa tagttgttca ttgacgtaaa 16380
atttcatata ttttagaaca aatggaatgt acaattaagt gtttaaattg ttatttttta 16440
tgttttaata gtttttagta ttaatttgta cctttaaatt tgatatacga gtttaatggg 16500
tattgggtac cctttgataa ttatcatgtt cttttttgtg acaagataat tatcatgttt 16560
aagtatcact aggttttgac ccgtgcgccc gcacgggtgt atattttgca taattatata 16620
tttttgttag ttgtagactt gtaagttaat gttttgttat tgagttctta tatatagtgt 16680
atcttgttca ttttgcttgg tgatgaattt taaactatta gttgtattta ttttcaattg 16740
tacttttttt tacctttact tggtaaatta aacaattaag tgtaaaatat tggaatattt 16800
tgtttagatt aggtgtgttt tattaaatta tactataaaa tttttgtgat ttttagagat 16860
aagcattact tggttgacaa gttttttgaa agataattat gtgattgcgt tagttatttg 16920
atcctttttt aaatgctgac tgcgtacaat taagaaacaa tattctttgt tgatttgtct 16980
tttaataatc ataaatttat gagtcgtttt tggaatattt tctcatatgg aagaaaataa 17040
gtttaattag gtacgatttt atatgtaaaa tcttaactaa tatgatattt aaggagcata 17100
ctatacgcat atacaaagta taccaaattg ataaacaata aaaaatattt gactttagga 17160
accaaaatct aaaccataaa acaaccaaac cgtaccttta ttatagaatt aatatactaa 17220
atgttggtat gcatagtcat aaagaatatt attctctgtt tatatcatgc atatgtaata 17280
gaaaacgtga atataatggt atatatacgt tttgatatga aagatatttt gtaaatatat 17340
gttcaatcga ttggtttgca acgggttaac agattttgaa acatttggtt attgattttt 17400
tgtgttcggt tgataaaatt ctaaatttag cattgatctg ggcaattaac aatttctaag 17460
cccaaagcaa tgttatgggt gggtaagaaa gacgaaaagg caaaaatatt tcaaaaaaaa 17520
agaagtaaaa tgacagaatt tgatggcagt ggcatagaga tgtaattttt gtgcaactct 17580
aaggggtaat tactgtttgt acttctgctt taatagttta gatgtttact ttacaaatgt 17640
catacttaca aaaatattaa aatggataag tcaacggctc ttgtttttat gctatctcat 17700
ttcctttttc aaccataact tggaaaaaaa atacagtata tgtgtatata tatatattta 17760
tttatttttt tgatcaaata tatatatata tatatatata tatatatttt atttttttga 17820
aaaatatatt tctcaacaaa taaaaagttt gttgacattt actgttgagg ccattaggtt 17880
aggggcgaca agtgatgaga tctctccgac gaatcctggg aacggcaagg caaactaaaa 17940
cgtgtcgatt gattttcggt catttgtttc cgttgacttc tgttgatatg cattacagtt 18000
ttctttttct tttgttaaca cgatcagaca tggaatattc ggtggtaatc accaatcaag 18060
tactcactat tcttagaatc gtgatactaa agtatatcac gtaataagcc aatcatatac 18120
gtagaacttt tagcctataa ttacaaaatg acatcaacta taatttataa gcgattgttt 18180
tgtgtcactg tcaagtgtca acaacttaca tgtaaatact tcgattatag ttcagtattt 18240
ttgatagttt tggctcaatt tggaagtcca gtttagtccc agcagaaaag aaaagaaaaa 18300
tctcaaagaa ctttaaaatt ttcaataaac caatcagttc cctttaccaa accggactaa 18360
attgattacc aattttatat aaaaatttgc ccagtggatt ccagcttaaa accgaaccca 18420
aactgaatta actaaacata gactttgctt gatatggtta cgtagtctgt caagccctat 18480
tgcctaatac caatacacat ctcgtcatca taattttaag ttaagactta agacacaata 18540
cgctttgtat acgattaact agagtcgtaa aatatgttta aaatacgcaa ctttttgaat 18600
tgttagcgct taaatcattg tcaacaatca atgtagacga gagtgtatcg gtacactgca 18660
agtacgtgta gcgacagagt tagttgtcca acgaagtttg atccaagaca tgagaaagag 18720
aggttcatca cttaaaactt ttaagcacct aaaaaactac tttggtgggt ctactttgtg 18780
aatctaacgt gtcaagaagc tgttggtcca cgttctccaa cagagcacca gagactccag 18840
ttgtccgaac tcacttatgt ttctgctcga agattgcact attgacgtgc cttcaccacc 18900
tccaccacca catctacttt aaataacatt tttttgttct ttcgttagga aacaaaacat 18960
agaaatgtac tcaacgtgat ccttgaggaa atgagaatga aaaatgctag tttaataatg 19020
ttgaccaaga aaaaagataa tcaaggattt attcaatata cttatcagtt actagcaaac 19080
tcatgagttg acaaaaaaag caagtgaata aataagaact tcaaatactt ctgctgctta 19140
tatagactag ccatctatta tgctatttac atattaagaa aacgtcattt tctgaaagaa 19200
aatccgccgc aactatcata tataaaaggg tggatatatg gagtatgttg ttaaataagt 19260
ttattttgtt tgttagcttc tgggagagat ctgcccctcc atgaacatga agtactatat 19320
caacggtcca ccacttgtag gttatccttt cgcttagagt tcaaaaataa gatatcattt 19380
tgagatttaa tggacccata ccatattacc aagttacaga tcgagcaatc ccacttggaa 19440
aacatattag acaatgcaag tgaaagtgca acatgccatt cgctggtact aactttaatg 19500
tcactttaat gttcttttct aatggaaatc gactcagaca tatgtatagt aatatactcg 19560
gagaagagaa aagtaacaag gtcatgtatt tactcggaaa agagaaaagt atgaaaataa 19620
agttaagata atcaggaact atttgaaatt aagtcgcgtg gttttagaga caatatgttg 19680
atttgcttta ataatttctt taaataaaat aaatagtata tttgggtact ataagatgca 19740
tggcaaagag caaaacacaa tatagacaaa agttgctgtt tatgttgata agtgtcgtgg 19800
gagaagaaga caaaaacgaa gcagaaataa ctctaaacta aggtggccga caatacaaca 19860
tgcttatgtt attgtaactc gggagaaacc tctaaaaaca taatcttcga ctttttttat 19920
ataggatcgg ttcaagatca tgcacactga tcctcgtatc acaaggataa cgatcctatc 19980
gatcggtagt aagaggtgca gtatcatggg tattttactc ataacaaaat tgtggaatct 20040
gaacggtgga agcattataa gcgtagttga ggaggtatgg accgtcacaa tgttatgtga 20100
actgctattg cagtttaata aagttgaatg taaaagtttt atgtatttat gcaaagttta 20160
atatgatgat tttttaaaaa tatgtaagca aaattgtaag gttttgactg taacttcaaa 20220
tgtcaaaagt ccaattaatg atcagtgaag actgcacatt acttcaaatt aataatggaa 20280
gcagcctagt gattctaaaa gtgaataaat cttttttgat acaaagtttt aggcaaatgc 20340
attttagatt aagacattaa actaatgctt agaatcagat aattcgaatt tcagaaacag 20400
gctactataa aaaatgtatt tcttcatgat ttgattgtaa acaatgagat gagaacaaca 20460
aaatgatcaa caaacattta ttagtttagt tacattgaat tggtggaaca catgatgtgt 20520
gtgtgggact gaactgctaa attggcggag actttgtttg gtaaagtaaa ataaccaaca 20580
ataaaaagag aaaagcttaa caacgtgtcg ttttggaatc cattgagaaa acaaagaaac 20640
agcaacgtat tctccgccta caacacaaaa acatgagttt atatttcacg tgttgctttt 20700
tcgttttcac tttgaccatt gtcttcttcc tcttcgtgtc ggtaatcatt atcagcgcac 20760
aaattttaaa tttactttga ataaagttga gttttcaatc tatgaaaatg tttatgacaa 20820
tctcatagtg ttgattcaaa gtaacgtaag tgtccatcat cgatatggtt gaaagtctaa 20880
tgtgaatacg taaaatgtgg acgatgtgat aaatactact actagactaa aaggaccaac 20940
aaaagacaca accaaaagta gtaacggttc tcagttcaag ggttttaatt caaccggtgg 21000
acgaattaat ttagaggctt aacaaagcaa acaaagacta caagaaacag agacttgttt 21060
tggcgcggtg gaggatcttg cttttggttg ttataagtca tacaaggttt ttgtcttctt 21120
aagtaataaa aacaaacgtt tgtggatgat ctcatgtcga agcgtgagaa actaaacatt 21180
ctctaatagt gatatattgg aaatgagttc ttggtcaaaa tataattaag gtatatatac 21240
cagagcccat cccaagttca aacaaagaaa gcttgagctt gtctgcttgt gctttcaatt 21300
caaataaata tttagaggcc gttgaatact gcattatttt tatagtctag ttgtgatggt 21360
ttgtaaatgt gtttaaattg ctgaggagtc gcagctcttt tttacctccc atatccatta 21420
attttgtttg cttccgcggc tttcaaatac ttaggccggc tctagacctt tcatattgat 21480
aaatttgaca taaacctttt ttatgtttgt tccacataat ttctaatcta ttttaactct 21540
tgttgatatg aaatgcatcg aaagttaagg ggttaaatcc atgtcaacat tcaacaacat 21600
tgcttgcata tgtgttctat gtgatgtcag cgtcctaaac ctttgctcag atacatatct 21660
taggtcaaaa agactcccat gacatgttcc agagtccata gggtgaggga aggttccaat 21720
ttatcaatgc aaactgctat tcgcatagta ggctaggaac tcgcatcaag catctggtcg 21780
agagacgaac caacgaccat tatgccaaaa gacgggccac atgaagactt ggtcggccca 21840
aatggaaagt taaccaaaaa atttacccaa ctaaacctcc ataagcctca aactagaaca 21900
tgcaccaaag cttcaggatg accacatggt cgaccatgaa gccaatagga agtaaatgga 21960
ccaagaagat gttttgatca tcaagaacgt ggaagagctt aaagactcga gccaagaaaa 22020
ctctgaggat gatactacta caccaaggac tactcaccaa ataaaccaga acgcatcaaa 22080
acagccaagc accaacctgg atcaagatac atctaaacta ggtattttca atttaaacga 22140
tttatgcaga taagatggac catcctagta gttcctaacg atcattcatc ccatctgaca 22200
caccatagtt ttaggccgca agatagttta tataaatttt cttccttttt tcttgttttt 22260
ttcccgtttt ggtcttaaac cacaaatgtt agttttttgt tttcttttct ttgcaaaagt 22320
ctttttgtct tgaatatacc tctgtgagcg taataataag ggcatctcca accctactcc 22380
attttttact ccaaactcaa ttatggagta aaatcttctc caaccccact ccatatttaa 22440
ctccaaaatg gagtaatagc tagggttact ccatttatgg agtaatctta ctcattactc 22500
cattttggag ttgaattttt tatatttatg aaatggttct tttaattttt aatgttttta 22560
tttcatactt aaaataatat aataacttta aaaaatataa tactccgaaa aagattactt 22620
tatagtttac agaaaatatg cataaactca taaaagtcaa aactaagaat aaataatata 22680
aaataaatat aatataatat gaataagtaa tttaataatt aattcggtaa attgttttcg 22740
aaactaccaa aatcggtgaa tattattcaa acggaataga tgagtttttt aatcttgtgg 22800
gtcaaaattt tgattgataa catttgtact tgttgagctt gatatatgca caaacaaaca 22860
ataagaccca atacataatt caaattacaa aacaaaactt tgtttttttc tttatgttcg 22920
tttaatgcat aaaaatattt ttgaattaga aaaattgcat atgataaaat ctgcacgaat 22980
tgaaattgga agataatctc tagttgtatt tttaatgata aatatttagt ttaaataaaa 23040
tatattatta tggaaatttt gtaaacataa aatagttggg ttaaatgtta attttttata 23100
agttgaaggt actaataaca attattaact aaataaaaaa aagaatcttt ttgtttggag 23160
taaaaaatgg agtaatacat tggagtaaaa tccaactcta ttttggagtt acaccatttt 23220
aaagtaaaat ttggagtaat acattggaga tgctctaagg ctctgcgtag ctttgtacaa 23280
cacactttta cactagatca ataaaataac agagttcaac ctaaggtcgt cttgttcttg 23340
agttttggga ctttgttctt cgggtgagat tcacctagag ttaagtcttg tgcagtatca 23400
aatatccttt catcattttt gtggtgtcat tcgatccact agcaatctcg tcaaccgttc 23460
cagcaaaaaa atgagagtca acttgttaga tctcattcca caagttttgt ccaaaaaatc 23520
ttgtgtccgt ctttcatcca tccaactgcc acgagaaaga gcatagtagc cagcttatgt 23580
gttccatttc actattttca aaggctcacc accgagtctt atttcacaat gaattttatt 23640
tcttaggtgg tttcattagt ttcaatgtct aaaggattga aagtagagag cacgaatgaa 23700
taaacagatt caacgacatt ccaacaacta gacaaaatca aaacacatat tacctttaca 23760
tggaaactag tttgagatac aaatacaact gataatcaaa attaaactac ttgtgtggaa 23820
ataattgatt tccagtttgg cccaatgctg gtgaaatttt ttagaaattg tttaccggaa 23880
tagcttgggt cctttcattc tttataaatt ctaaggtaaa gagcaaatta agcttaaaca 23940
catccccaat acacacgtct acaccacaaa tcatgttcta attttcagat acgatccaca 24000
acaaactcac ccacaaatca gaatacacat actcattgtt tttcgttcaa actttcatat 24060
acgttgccat cattcttctc taactattct ttctatccac cccgtgtttg gatttaacat 24120
agacaaattc ggaggataat aataataagg aactgataat tagattaaat tcgaccaaat 24180
gctcgtttca tacaagtacc tcttcaagtt agaaagaatg aataaatgaa ttatatcaaa 24240
agtcaaatta ataaaggtaa atggacgcaa gcccttcaga tttctatcta aaatatctaa 24300
ggatctctct tatatgaact ggtccaaagg gatcagcatc acactaatat catccaatga 24360
gcctcgtgaa gccgaaagat cgacaagctt cttacagccc aacaacaatg gcttctcctc 24420
ggttcctagg cagaagggac gagcaatgtc tactgcttct tggttactca ctttgtccca 24480
tagaccgtca gatgccaaga tcaagaactc atggtcctgc tcgattctca acgtctttgt 24540
ctctggttcg gctataaccc atttcttgag atgagcatca ccgatccctc ttgacacagc 24600
caaagatcct tcaactctcc atacacctcg aaacgtatca acgtatccac cctgcacaaa 24660
aaaaaaattg aatctacttt tagaaactat actttccatt tgtataaaac attaaaaacc 24720
gagattctca ccgtggtttc aattcttgtc cgttcatcgt ccctagacgg gcggtggtcg 24780
gaagaaagag cctccgcgac tcctccaaca ctcatgacgg cgcgacaatc gccggcattg 24840
gcaaccacga ggttcccgtc gctgaacata gccgtgacgc agcaggaacc gcctttaacg 24900
tcattctcgt tgagaaacgc agcgtctgtg gtcaagtaac cgcgtttcac cgcgtctgcg 24960
atcgctgact cgtcgttttt accagcaacc gcttccaaaa cgttcttgtc taagttcttg 25020
gccgcaaact cagccgcttt agctcctccg tgaccatcgt aaacaccgaa gatggcatgt 25080
ttgcgatctc cttggagatt ggttacggca gagaagcgat cctccatagc ttctctcctt 25140
cctctcttgc aataaacaga atagccatcg ccttccctct ccacctctct accttcctcc 25200
ctcggcgtcg ccggagcaac gaacccggtg gtaccgatcg gtatatcaag cctcgtgggg 25260
cgtttgcgtt tcagaacccc tccgggaggt gattggccgg tacacgacgc cggagagaaa 25320
ccggtcggag gtttctgtaa acggagacgg aacggcgagt tgagggacgc cgcggcggcg 25380
gaaggagagg aaggtttgag atgagaaaga gtgagagaga tggtttcttg cggcgaagag 25440
aggatgatag aaggtttgct gcagaaaaga gacgacgacg gagaaaaaac cggagagtta 25500
cagacggaac aagacatcgt gtaagagaat tctgagttcg aagattgatg tgtttctttc 25560
tctctacctt tgagatattt gttttaggag aggaaaagag gtttctatta atataaagag 25620
agagagagag agagaggtaa tgaatgttga agactttcaa agtggtaata atggagtccg 25680
tgagggtaat acggacattt aaaagtaagt caaaaacacg tctaaaagga aagaggaaga 25740
gagtgttaag gaaataaaca aagaatttgg gcatgtggtg gtttaacgta tcagtgttaa 25800
agaagtgttt ggttgatgac tcttcacgtt ttttcaattt attcttttgt ttttaataat 25860
aaaaacagat tctatgaacg ttgtcggtcc gttagagctt atgagttgta ttttgatggg 25920
attactttct tttgtttctt ggtggtccca gtcgcagctt cttagcaagt gaccgttgtg 25980
tggactgaga ggagccttct ttctttcttt ggtttttcat ttgatgacct ttgtaaaatt 26040
atctatctca attcactcga ggtcttctaa ttaaaactaa caagtcttct aatgacatca 26100
ataataacgg ctacttcttt ttccttataa aacggtattt gtttatggat ttatgtgctg 26160
actgctgaag atcaaacatt ggcatccata aggatcaaat tatcttattc tctactagca 26220
acttttaaaa caatgcttta acaagctact gattttgagt acccaataca tattttctgt 26280
ggtttttttc taacactgaa actaatccat tatttagttt gaatcatgta ttatcaagga 26340
tctcaataag caaaagtatg aataaaattt atgattctat tcaaaatata ttttttagat 26400
attctctttt cgttcaggaa ttccaactac tattacagac ttgtgatggg gattcagtgg 26460
gtttttttat aaatagcaat catatgtata acatcattat ttgctgcgaa ttgtaccgtc 26520
attagtttga gtatttacat taataagtaa tggtatgatt ttctgttgtg ttcaaatact 26580
gtttatgaag aatgagtcat atattttacc ctacttttac gattagactt ggtcattaag 26640
atagttgacc agataaaatg attaatcaag caaagaagct tcccactcca taattattgt 26700
ggtcacttgg ttcactttga agttgtcttc gaacgtcttt ttaatagtac taggggttat 26760
ctgtgtttta cgcatgaatt tttttattga catttatttt tagtttaagg ggttaattat 26820
ataattgtga accattattt ttgtgtgagc tttttttata ctccatatgt tttaaaatgt 26880
tgtatatttt agatttttca cacattttaa taaaacacat taaatttcta ttttttttgt 26940
gattatcttt tttttcataa aagattagtt aataaaatat acattgaaaa tgtaaaaaaa 27000
tagatcttct tgatacaaaa tttttctcta taagtaactt tataaaacgg aagaaatata 27060
agaagacata agaatgtgtt taaaaaaaag acataagact atcgagagcc gaactcgttg 27120
tagttgagta aattgcataa tgttatagtt gttaatttta atggtataaa ttttatttag 27180
aggacttata atttgtttga tattttaaga tcatccacta ttatgtgatt tttgtcagtt 27240
tattacaatc atattctgct atttaaaaaa aaaattgaat tcactttttt ttagttttcc 27300
acaattattt ggacaaaata atcttacatc ccattgttaa attgtgagaa caaaactttc 27360
atctatctac aatagtagca agcgtcgcat ttgtttctga tgttcttaca ggtggatgtt 27420
atcgttacgt catcgtgtga ttgttgtttt tgtatttcta taaattctta aataccgtgg 27480
tatgattact ctagtttcat gaaatgattt cctgaaacgt ttccagcatc agtccccttt 27540
atacattacc catgcatgtc taaatataca ttaccaatct ctaaatatac attacccttt 27600
gttattatgt gaagatgttg tagttcaatg cctactccgt aatgttgata catccatgga 27660
cttgagaacg ggcagaaagc accagcacct tttgttataa cagtatattt tccagaggaa 27720
tttggtggta aacataaata catcattaat cctaatcaaa acgactaatt attattgtca 27780
aaagatcatg cgactagtcg tatgtcaact tacgaagcct gcaacaaaag aatatctttt 27840
tgtaaatgtg gattatttca aggggtgggt cggacacatg aacagtaatg ttaagaagta 27900
aacctattgg gccaaatgag accgacgtag gcccatagaa aacccatgac gacccgtaca 27960
ctagataaat gcatattaac ttcgaagaca ataaatacag aggggtccac gtttccgttg 28020
caaattgggc agtagacatc ctccccgtga agcaaattca aagtcttacc agtagcgaag 28080
aacacaaaaa ctaactcgct acaatcttct cttttttctt tttttttcaa tgttctctct 28140
cgacgaaggt acaaagatct tgtcttaaat agatatatat ttttatttaa tctaagcata 28200
gttattacac agcccctcag ccagagagag aactaagatg tacaacgtgc atctttatca 28260
gggggttaaa ctgacatagg ttatttgtta attatatgtt tttaatttcg attaaccgcc 28320
gagtaaaggt ggttaattaa gctgcgaaaa gtaaaaccta cataggttat ctttagatta 28380
tatgtttctt attttgatta accgccgagt aaaggtggtt aattaagcag cgggagagtt 28440
acaggaagat tgatgtcgga gatttgtcca gatgacatct ctatattatc agcttcggct 28500
ccctcaagat ttttcttctc aatctgtaaa gataattata ggtcaaaaac atattcactt 28560
ctctttttgc cttctatgac ttattaatac aagagaatat ttttttccta ccaaccatca 28620
tatatatagc aatctggatt tcaaaattta gtttttcttt tcctaccaac catcaaatat 28680
atagcaatct ggatttcaaa atttagtttg tcttgtttct gactttcaag cttctaggtc 28740
tttcaagttt aaagaacatg catctttctc caaagcaggt atctagcttt tccagtttat 28800
aatcaacctg gctgaactag ctaggaaagc tatggctaga tacttgaacc taccaatctt 28860
acccaagcca acctaaacca tataacaaca aaaaccccaa tcggttccat aaatctcaaa 28920
ccaaattacc aaaacccaat tatgtccaac aacagggaag agattttact atatcaaaat 28980
tatatatcta tcaaaaccca ggcttcattg gatatataat tggggaaaac ctcaaaaccc 29040
caaagtataa aaagactgaa tcatttatat ttaaagaact ataccacttc ttaatttttg 29100
gggtaacagt atcaaggttt atgaaatagt tttgaattta cttttagggt tcagggttag 29160
gttttaaact gttgtgctca tctaaaataa ttttattatt actttacttt aaaatttaga 29220
ctattttcat aaacgttctt atatatatat acacaatatt agaaccgaat cgagattttc 29280
ctcaaccaat accagaccaa agaaaaagag aataaacatt ggcacacgaa aacagaataa 29340
acaaaatcta atcaaaaacc aaaatgctct tattaatctc gagatgtttt tttatattaa 29400
aagtgcttat atatgtatat atctgcaagt aagtgtgtgt atatgtgcaa gaagtgctta 29460
ttagcttttg catatttata aagaatgtag cttttcgtta cctgactagc caaaacctgg 29520
ttctcttctt tcagcagatt ctcctgtttt taaaaggaca acatgtacat caattaattt 29580
cagattttgg tatccaaaac atttgcaaca tccctaatag acaagatgca ttgtgaaatg 29640
tgaagaagtt tgatgtagac ctgcgagctc ataaagcaca cttagagaaa ctaatacaac 29700
aattgtgcca aaaaaaaaaa aactaataca acacacaagt gttttgaggc tctcaacacg 29760
agaatatatc tataagtgct ataaaatcac aaatctaacc ttttctttga gactttcaac 29820
aagctttaac attagttctg cctgcaacaa attaaatata agtgcacaat cgttttcgac 29880
aaacaaagta aacaaagaga acacattatg gagtcgatgt accttccgag ctctagttac 29940
agagagggca gtctcaaggt gatcttctag ctcaacgagg gaatccacgc ttacatcatc 30000
aattgattcc acaagcttgc tgcatatatg cacagattga caggaaaccc taatatattt 30060
gtaatgaaag gaggagagca aaaatagtct cagttagtac taacctttcc acaagttcta 30120
gtagctcatg gtgtgaacta tagttcagag attttgactg aagatcctgt tcacggagaa 30180
ggataaaaga ggcggtaaaa gaccagtgta tttaagaaat ttgatatgca cgtggaccaa 30240
taacctcaca caggatcatt tggcgaataa tagttcataa caaactcaag ttttaagaaa 30300
tttgttctca acatgtgttt acattatagt tcaaaaaaaa aaaacatgtg tttacatatg 30360
tttatcgaaa aactactcta aaggaagcat cgatagataa cctcttccat gttgaaaaca 30420
atatttgaca actacagctc tcaaatagga atgatacacg cagtttaaat gcccgtgagc 30480
catgcccaca aaaagtaagt tgaaacatga cgctgcgagt tggttctgac cagtatatat 30540
ggagctctct aagccttact tatatcctta aatactgcat gaggaaatat tcaaaatgtt 30600
tgtattacca gggcattgag atcatcagca tgttttttcc catatcgatc aaggatcttc 30660
tccagtctgg agaaaagata aataaaaatg ttaactgaga tcaaaagtca aaactacttg 30720
ttaacccttg aagacaccac tggaatctat caaaacatta aaagagaaat gaaacaaaag 30780
gttaattttc gcaccctaga atttgctaac aattcagaaa aaaccgtagt aatcaggttt 30840
aagcagcagc acatttggat ttccatttct tatttttaac atgctctgat cctttctaag 30900
caatctcaat aataataaaa aagtcctcta aaattaccaa gtatttcaag tttaattttc 30960
caatagttgt gttaggttac atgtatttat ttatatactt gatagactga aaatggcatt 31020
cttttgacaa agaaaagtca taatctatac tatattaaaa gggttatatg agctccatac 31080
agcatgtcca cgtaggacaa ttaaatcgac caatcacgtt gaagcgttta gccatgtcac 31140
taatatgttg ggctcacggt ttttcttttg tgtatttgtt acgattgggc tcaagcccat 31200
gaaaccatta taacaaacaa tcgcactctt tcacgttttt tcgaaaccaa aatcagaacg 31260
attctcatcc cctttcctct tcctcttctt tgatccgttt cacgatctga ttcatgagca 31320
attgattcat cctccacttc gttctccctt tactctcatt tatggattcg tttttctctt 31380
cttttgttta taaaactctt gaacggagtt tcgtttcgat taagcttcgt cgtaaatttt 31440
cattcgtaca ttgcaatgag tttcaccgga aaatccaact cggagaaacc acaacgcgtt 31500
gagggtgact cctttcccgg accgatcaat cccatcggcg atccccactc gaagcaagcc 31560
aaagtcgaag cgtcgttctc ctccggtctg acgaaattaa aggctgacac ctttcccgga 31620
ccgattaagc ccatcggcga tccccactcg aagcaagcca aagccgtagc ctcgatctcc 31680
tccggtctta cgaaattaaa ggatgactcc tttcccggac cgatcaagcc catcggcaca 31740
cctgattcga agaactgcaa aggtaagaaa ccttatcgtt tcttatcaaa ttatatagtc 31800
cgtttgattt ccaaaaaaaa atctgaagct ttgagattta aaaccatgag acgaacaaat 31860
ttttttttta atagataatt tttatacaac cgcaaaggta agaaccctta tcgtttctta 31920
tcaaattata tagtccattt gcttacgaaa aaaaaagtct gaagctttga aatttaaaac 31980
catgagatga acaaaatact tttttttata atagattatt tttatactat agaaaataga 32040
aaatcatata aattgtggta cggagtttag tatccttttt tgatgatgag aacgttcgta 32100
ttcctatgca ggtacgatca atcacaacac gaagactggt ttctcttcag gcgttagagg 32160
caaagccgct gtctcctctg ccgtcaaggg aaaagccatt gtctccgcca aagtaatggc 32220
tttcaaagat gtgaaatacg gacttcatga cggcgagctg aggtttcggt tgatccattt 32280
ttgggaagct cgaaatgttg tgacgaaggt gcttctcggt ctcaagatgc ttctcatcga 32340
ctaagaggta taaaccgaat tcttgattgc gatttagttt agaaattgtt cagacaagat 32400
gctgataaac attttagatt caaacttatc gctctattat ttatagcaag tgtttgcttt 32460
tgtttgacag gagggagctc agatatttta ggaaagatgg gcacaaccgg aggaagaaga 32520
aagatggtaa aacgatgaaa gaggatcacg aaagctcaag gttaataata tatttacatt 32580
catgttacct cagtttttaa taaatatttt agagtaatat tgtttaagta tatatctagg 32640
ttggaagcat tgatgtgtta cattgttact aggcacatgg ggaagacaat gagaatttcg 32700
agaggctttg ctactggatg cttgaacagt gagtcctatg ttttccatat ttcacatttt 32760
taccggttta gtgtaccgta aatgttactt tgagaacaga aggaaaatga aatgtgaatt 32820
gttactttta gtgcttatgt cctctgtttt tttatgggta cagggaactg atgcatattg 32880
tttttgttca atacttggag gttaaggtgt agcttttctc ttggtgctgt actaatatat 32940
tctttagaat ataaacatcc attcactcaa cattatattg tttcttttta aagtgggttc 33000
tctttttttt aatggtggct ttgataagtt cacgctattt atacagggta ataggataag 33060
ctccagtgga ataaaagaaa acaattcaaa ttctgtgagt ggctccactt ctgtgaatat 33120
tgattcaatg gcaaacacat ccagaacatt gtcaccacta tgtgaagatg ctgattagta 33180
tttgccggag ctttaccgtg gagtccgttg tggccgtgtt attgacgttt tagatttgaa 33240
tcagcctaca cggacctaac agcaacaggg attccagcgg actaacagaa gcagccgtgg 33300
agaggcaagg cagggacgag attagcggcc agaaatttga aaggaaatct tcagaagaat 33360
cagatagtaa gatagttggt gaagaagaga aggaagatat gtcgcttggt aatgatagtg 33420
gtggctctat caaggcggct acacatgaca aagacagaga tacttctcct tcccatgaag 33480
ggataaagct ttctctgtga ttgtgctgtt taaaatgatc atttatgcat agccttggtt 33540
tagtattttt ggtttataaa ggtcatgact acaattcaac agggtattgg aacgagctac 33600
tatgggcagc ttcgtgttct ctctggaggt caagcacctg gtgggcacac tgctatatat 33660
ggaccattcg gtaagtgttt aaaatacatt tttgtgtgtt ttaaaatgat gctttacatc 33720
ttagtcatat acttaattaa gaaagcagag tagcaggatc actcttattt caaaatatgt 33780
gcgcttttta gaagtttaca tttgatgtca taattttgtg aatcagtgtc tcgagtaatc 33840
aaatttgatg tcaccctaac ttcaaacttt gctattcaca tccctcaaaa cttattctct 33900
cagtgtttgc atgcagggtg atccgaagat tatcacctgc aagttttcat gctgctgtag 33960
caaagacatg ttttgaggta cggtaatatt ctcaaaacac cagactttga ctccctttgc 34020
ataacaaatt cttctgcagt tttctgattc taagtatctc cactttgtta ttcactcagc 34080
tgaagaatca actcatcact gctagctatg ttgatgatga aacatccatg tagatggcta 34140
agaaatactt ggattatgat tcttggtgaa gtgacatcca caacttggat aattgagaat 34200
gaggctcata tcagcaaggg gaaagtgaag tctttcacgc tcttcctgtg gtagcattcc 34260
cttttcttct gcagcagata atttattagc acagattgaa ttacttcaat ctgatgtatt 34320
caaatcatgc aataatgtga tcaagagctc acattcacct tccactttgt aatatttatt 34380
atgtatcttt ttttttggga atcataataa gcaataatat tttacagtac atatgcatta 34440
caattacaac caaaagaaaa ttaaagaaaa acagtgaaca tataaagtta gcttaaaaag 34500
ggaccccata gagaaaatac atttaaaata tatagtaaat tattaaataa acaaaataaa 34560
attggaacaa atttaaatag taaatatatt taatgtataa ttttaaatag taatgaccac 34620
tattaaattt ttatgtagtt tacctgattt aattatattt tcagttaaaa tggattaaac 34680
ttcacaactt attacttata acttcattaa actcatcagc aatttttaaa aactaattct 34740
aactattaat atagttaaac taaaacaaac attaaaatga atagtcaaat aaacagaatt 34800
tttttatagt aaaaaacatg tcggacgttc gacaactgtc tcgcaacgag cttctaccaa 34860
gagatataaa tgttacttgc acagctcgtg aagtcctctg aaaccgactt acgttacgca 34920
atggcgtcga ccccggttct ggggttggca gcaggagact cacgtatata caaggacctg 34980
gatctccaga cgcatacatt ttcctgattg gcttctatca accgtttctg tgatcttatg 35040
gatcgatgtc ttgctagcgg taacatccag gcacactacg tgcaaggaat tcatgaatat 35100
ttttgcaaca acacaatcaa tggcatgcac catttacgcg tctcagcagg tggttcttac 35160
gcagatggtg taatcatgtt gtgcagaggt gagcgagctg tcggtcatgc ctacatatac 35220
atgcttggtt ggagggagtc cccaactaaa ttagacgaat actggagaag aattaaaact 35280
tcgcttcatg gtattgttgt tgcgagactc ccggtttaca tgacgacgta ccaagaaaca 35340
agagctgcta ttactagcct ttgccaaagg aacctgcgga agctcgagcc accggaaaga 35400
tgccatgtca atgacatgga caattactgc gagctttgct tatgctacaa gtaaatcaag 35460
cagttcattg ctatcctttg agatcacatt agtgttttgc agttcgttgt tatatcgaat 35520
cgtattccgt accaaatcca tggtaatcgc aggaaaattt gatttccggt tttggctgga 35580
agtttgcttt ttgtggtgga aaaattgatt tcgtggtttt gactgcaaat tttgattttc 35640
tcggctttgg caaaaatatt cgattttgtg gttctggcgg agaaaaagaa tttgctgttt 35700
tagcgggctg gaaattttgt gtttacgatt ttggcgggaa gattcaagtt cacggctttg 35760
gcgaaaattt taattttgtg attttggcgg aaaattttgc tcttgcggtt gtgacgggaa 35820
aaaaacaatt ttttattttg gcagtaaatt tcaattttat tttattttat cgagaaaata 35880
caatttgtgg ttttagagga aaaatctaat ttgctgtttt agatggaaat ccgatttgcg 35940
gtttagagga aaattttaat tttacgggtt tgccgaaaaa atcgactttg cgttttttga 36000
aaaaaaacaa ctaaaacctc attttccata atcaatcttt aaatattttt ataatatttt 36060
taaaaagtgt ttttttcttc caaatagtct tacattaaaa ataaatatta aaaacagaag 36120
atcatatatc attttaaatt ggtcaaaaca agtttaaatg agtcaatgta atatttgagg 36180
gtctaaatga aaaattctaa tagatctatt ttaaaattaa tctaacggca tagctattga 36240
atggggtgag tcttaatttt ttttttgaca acatgggatg tgtcttaaat ggggtgggtt 36300
ttcccatttt aacatccata tactccaatg taaagaatat aaccattaga ttattttggt 36360
ttgacattag aagttcggta gctcatataa atctaacacc atgttatgtt gtcaaaggtt 36420
tcggacatta gtaaattaat aaaaatgtag caatcaataa tgtgaattta ttatagtata 36480
tattgttatc agtctaagta taaaaatata tttatattca gatacaaatt ataaagtaat 36540
ttaaatttaa ttaaaatata tggaaaataa cccgggcgta gcccgggaaa atctctagta 36600
acattaatac ctgtacatgt tatccattaa tctatcaatt aattcatatt caacgctggc 36660
ttttgagtca cttaaataaa aattaactaa ggtacataag aaccctatac tcaagtcaaa 36720
tacactttgt tttgcctctg cacccacaac tgtttctttg cattcaggtt tgtgttccat 36780
tttataataa tttgatacta taacaggaac gacgactgag gcttaaatga gagtgtatat 36840
atattacata gaggtaaaat aaagtgtccc aagtgaaaga aactttgttt tgattctcac 36900
ttggtgcata tagaaaagta ttccataaaa cgaagacata caaaataagg ggaaacaaat 36960
actacatttt ctatttatga ggttacagag acgtctaacg catttcgaaa aaaattacca 37020
acgcagttaa cagtttgtat taataggttc agagttccat tgtgaagtta atcttttgca 37080
cattttcatg tgcaaaacta ggagtttgac tactccaagg ctgaacctag cattcagtct 37140
aaggcgaaca aatcctagca aagtatgcat cgagtgagaa tcaacgatct tcaccaaacc 37200
actagtacga cttggttata ctagagggtg ttagtacaaa cttcatcgat taatttgaca 37260
atgtaggatc atactgaatc tagagagata ctaaaggggt tggtattttt tatgaagacg 37320
aatgtttttt gtggggttgt cgatttccag gaggagccaa agaaacaggg cgtgtgttgc 37380
tgcacttccc aagacaaaag acccaagatt tcatatacca aagcgacaac gttaatttaa 37440
tatagttcag agagaatagg aacaaagtgt tgatatataa tgcagacaat gacaatgaaa 37500
ataagaaaga tgaacgaata tccagtcaca ttaatatgta gcatataaat gtatatcaca 37560
ctgcgaggat gggaaactaa aaagtagaaa ctagtagaaa cttgtaggat agaaattcct 37620
tgaaaccata tatccacatt aatcttagtc catagataca caatctatca tacatttgaa 37680
aaaagttaat gatctatttt accatcaact ccatactatt tttataacaa atctcccgga 37740
agtgcattgc aatgtatagg aatccaagag aacaatgaat taaaattagt ctaaagttag 37800
accaactgat gcacattacg tgctgcacaa agtatcaaat atatgcacac acacaacgat 37860
tgccgattaa agaatcgaag tcgatactgc atcacataaa taatatagca tatgtgagtt 37920
aattaagaac taattgtgag gttaaatttt cttaaataaa aaaatactat atatatatat 37980
atatatatgt atgtgtgtgt ctgtgtgtga aaatcaagaa tcagttagaa accttaaaat 38040
tcggataatc ttaagtaata attcatggta aaaaggataa aaattttgaa gatctaaaat 38100
tatcttttag tcaatagctg cacaatgtcg catacattca aatcaaaact cttgatctag 38160
tatccagcat taaccccaca tcagttttaa ggatctcttc gcagtgcatt gcatacagat 38220
ctgagcgaac caatgattgt agttacgata aaggcagaca gattaattaa ttttctgatg 38280
caaaatccct aaagccaatg aactaaaaga tggcttgaaa cattactaaa gaacatcaag 38340
tattcatcac aacgtatcga gaagatcttg acggacatgc aaatttttaa caaataaaat 38400
aaaatccatg cagaaaaata gaaaaaaaac gaagaaaata agagagaggg agattgagta 38460
agaagcttta gctcatcaca acattgttct tcctcaattt tggttatatc atgtatagag 38520
gaaacaataa caaacaaaac cgaaaaatcc ataagagatt cgccgggtaa atctaagtgt 38580
cttttaatta ttttatttta attattttat tagtaaagta aagagaagaa agcttaaagg 38640
gcaaaaaaat aagagagaga ggagaagtcc tacctatccc cggaggagaa gctgtagagt 38700
ttgtcggagg cggagacaac gagaagccca acagatgcct cgcagagaac agaaagctga 38760
cgagctttct cgatgagacc gttgcgtcgt ttgcagaagg tgacttgtct gctactgttt 38820
ttctcgattc gcttgatttc tagttttttt cttcccatag cttctgtctc cgagaggtct 38880
ctgtgcccta atttgattct gaggtacggt taaagtcgcc ggagagacta agcgttttat 38940
tctttcttct ttttcttcct ttttttttct ttaatttcta cctatttttc ctcgggtagg 39000
gtttttttgg gcgggggtaa acgagagaaa taaaaataaa aatatgaaag ttaaaacgat 39060
gcgttttaac gacaagacag ccacgtgcac cgcaggacga actccctgtg gacgcgttgc 39120
gtttgactac tcgactctac catacataca cacaggtagt gctgggaata tgaatcatta 39180
tccgcgggcc ccgccccatt tgatccgctg cggggcaggt gcggatcgag tgatttgaaa 39240
aatttggttc gcgggtgcgg gtgcggattg agtgattttt atgcggagcg ggtgcggatc 39300
agccaaaatt cagtgcgggt acccgccaac ccgcaaaaac taaaaaagaa aagatttttt 39360
taaaaaaata ttatttttaa atagaaaatt tttaaaaaat aatttaattt taattataaa 39420
tagattaata tttattattt taataaaaat atttaaaata ttaaatttta ttgttatttt 39480
taataaaaaa atatttaaaa tattaaattt tattgttatt ttaataaaaa atatttaaat 39540
taataatttt taatattatt aatattatcc gcgggtctag cggatcaccc gcgggtttta 39600
gcggggcggg tgcggatttc atattttttt cttgcgggtc aagcgggtca aattttttga 39660
gtaaaaaaaa tcagtttatc cgcgggttgg cgggtcagcg gggcgggttt gacccgcaat 39720
ccagctctac acacagggtg tgagtgaaag gtattaatag agtaaaagtt tattctatat 39780
caatatttac tctaggttga gctaaaatgt taccaatcaa gtggaacata aatttttgtt 39840
atttactcta tgtactgtac acaaagagaa aaagagacac taaatattac tcttgattat 39900
gctagaggta tatgatttta ctctatatag atttttcttc tcatattttc atcttttaca 39960
tttttcactg agtttcactt tttcatttcc tcctttattt accaatcaca ctcatatagt 40020
aatttgcagc acttaaatat ataaaaatca aaatcaattt tcatgttttt tttgtatagg 40080
tgatatatta gtttttaagt aaaactcata taattctaaa atatgtggcg caattttaga 40140
gcatatattg ataatttctc gaaaagcctt ccataaataa aaaattaaga aaaatataag 40200
aattgtagac attactactc ttgctcattt cacatttatc aaatatgtta taactgaatt 40260
tattttaata ttattaattt ttttgtcttg agaaactaag agtatcatta ctggtcagtt 40320
agctaagaat cgtttctagt ataacaacaa tagaatttga tatttgtaat taatttttaa 40380
acacaaaaaa gtttaatcag tgatattgtg acaagtaagc aaattagttt ctcaattttt 40440
ttacgtctct ttccattgat aatttggtat tctatccatt ggaattgaca tttactatcc 40500
aagaaaatta ttctaaacac attaaacaac caaaccctag cttatatgta cgttatgctt 40560
ttgaacagat acactcaggt gatatatggt tagatctaga taactagaga ataaccctct 40620
tgaatttctg caaaaaataa taatttatgt attttttaga gttaatttac tttaaagtag 40680
gaatttagtc aactatccta aacagtaaaa ctagacaatt ggatgtaggt actggacact 40740
taaaatgaca attatatcct tgacaagcaa tttcaattct agttcaaaaa acttcgtcca 40800
aaaaacatta aaaaaaaaca caacttgtga gtaaagagag aagacggtta aacggaagga 40860
ggaaagaaaa atatccacgt cggagagaga agaaagctgg gagaggagct tggggtggcg 40920
agagacaacg tcgtggcgga gctgggcatc gaggaggcgg atcgcttggt ggagacgctc 40980
gacggtggag gcagaggatc cggaagcgag tgccatccgg aggcgagtgc ggaggaaaaa 41040
gaagtggaga ggaatggaga gacggtgggt tcgaaggagt ctagaggtga tgaaaaagat 41100
gatggttgtg ggatgataca tgtaggggat aggagtatta gcgtcattag attttaaaca 41160
tagttcgtaa tagtgtcgaa tggtagatca ctaattagga aatattgttt gtgtatacaa 41220
tgcaaatgct ctatctatta tattaaaatc gaagtataaa ataatacttg attattttaa 41280
atggtttttt acggttttca ttttaaaaaa ctaactttaa cacttctttt gttatctttt 41340
ctaattaatt tgaaaaattt atcatacatt atgaatcaaa acttacttat ttaaagtgtt 41400
tattacatat tttacattta tttccacttt tcttaactat ttcattaatt gtctttatca 41460
taatattttg ataacattta gtttacatgt caaccataat aatttgacat gtttgaataa 41520
aattatttca tttgtgacaa aaattcaaaa aggttaacaa ataatttttt tattttctta 41580
aagaaatagt taatcatggg tgttcggatg ccagtttggg tatatatcgt ttctttcgcg 41640
tatcaagttt tttgggttca aaattaggct ctgatcacgt attataaatt tttgggtgta 41700
tttcaagtcg tgttctccta tgtccagatg gattcggttc tgatgtataa aaactttaag 41760
atatccaaac aaccaaaagt gatttcatat tacggttcaa gtattttgta ctaaaaataa 41820
tcatattacg atttgagtat ttttttattc aaactaaaaa taatttaaaa ataaccaaat 41880
aactaaaagt aaccatatta tctgattgga tttgagttta attctaattt gtaaaaacta 41940
gttatccaaa taatcattat acaattattt atacggtgac acatgtaaaa tatataacgc 42000
tatacatgaa aataaatatc aatttataaa agaggataaa aaccaacact agtcaacaat 42060
taaatagatg ataagtaaca gatttttttt caaaaacgaa atcgggtctc ttgtttgagg 42120
gacaattatt tattcctctt tattcctctt tctccacttt ttttaatttt tgtattttag 42180
tatgagaaac ttgtaaaaag actgtatgtg attgttgtac ccctaaaact ttttctcagt 42240
atactttttt ggctggctgt ggagagaacc atttttctcc atacgtttaa tcaaataaat 42300
gttattgaaa atgtttatat taacaaatgc aaatgaaatt agctcattgt acactactct 42360
tacttctaca taatcgacac atataaacct cgatttaaaa ttcaatcatt tgttcttcca 42420
tctcctctcg aaactcaaac tcttgttata atttacgtat taagttttta ataatccttc 42480
catatacgaa tgagtcttaa actttcagct agacaagata atatgagtct gataagataa 42540
tacctgtagt ttatgatata acaattcgat tcacggattc tgccatctcc acttgttttt 42600
tttaaagcta ctgataaagt ggaaacaaat aaatgcccaa taagaaaaca gcagcatcta 42660
gtccattact cattacaatt cattgtcatt tactgcttcg ccacctgcag cattaagtac 42720
tattacagga ataatcattc gtcacttcat cttgagatat ttttatttct tggcttgttt 42780
agacagagta taattccact ccgtttttta ttaaatggag taaaagttaa aatagagtaa 42840
aaattaattt aactcaactt taaatctcat tctataataa aatttatttc ataaatagaa 42900
taatttattt tttgtttgtt catttagagt agggttgaaa tatttttact ttatttttac 42960
ttttattcta ttttaaaaga aagaatagag tattgtattg tttttctccc tcttcatctc 43020
cttagccata tgaacaatct catattttaa agttagtcac tttaaaaaga tactcggtta 43080
caatcattat cgccaagatt attcgagaat atatgtttac aaaccactga accagcatct 43140
cctcgatcaa cgagttgaat cgccgttacg cgagtacgtc cgtatttgta tcccgtgggt 43200
attacgtggg ctaagtgtcc ttgtataaac gcccattcta gactcaacaa aaaaaggccc 43260
atatagttat ccaatttcac accattattt cggttgctaa gccctttcaa agccccttcc 43320
ttcaacagct tttggttgct ataagggacg ccacgcgcgc attttgcttt cataatcctg 43380
taaataaggc atgcaaaagt ctttggagaa gagccaaggc ttatgatatg ttaggtttgc 43440
taaacaaatt ttgttattag cgattatgat caacacattg tctaatttca gtttagttaa 43500
tagtttttgg tgccaatatc tatggatttt gttcaggtat gaggcataga cacggcataa 43560
acctacctga agggcaaatg tgaagaatcc ctagaacaat ggatacaaca aggtccttga 43620
aagaagttga gaagacaaga aagaaatgtt tttttttttt ttgcttttaa cacagacagg 43680
aaatgtcttc gtatggggtt ttaatcaact tgaaggagta aagatgaaag gaagatattt 43740
ttttttgtat gggtgtgtat gttactaaag gacttttcgt agtggaaagc gggtataatt 43800
tgcctcggta cggcttgaaa tattttttga ttaaacaaat gacatttcac ctgcagagaa 43860
aataatatta catgcacccg cactatttaa ttctgtggat gactcgtggg attatcatgt 43920
tttttttttg ctaaactaaa ggaaataatc gtgggattat catgttatat caatatttat 43980
aaaaataatt tagtaatatt tataattcat ttttacaaaa aaaaaaaaaa tatttataat 44040
tcaatatata tttttgaaag tttttagttt actgatgggc aagtatcata acttaaatcc 44100
ggccgtccta cacttgcctc gcataaaata aatcaacatg cacgcgcatt tcaaatattt 44160
aaaattgttt gattcaaaca tgctcagtgg caggtttaac ctgcgggttt tgagtcaatt 44220
ttccaactct tgtcgttagg tttgtctatc tattatcttt atttagatga ctcttaaagt 44280
gttgttcatg agtgttcgtt tctttatcta gttggttcat ttgttgtgat gaattgtttt 44340
ggttgaaaat atttttacat gaggttttaa gcagcaacca aaaattgatg tttggtggcc 44400
catcgtggcg acaaggtgat aatcggcgtg gttagatggc gaggaaattt attccttaat 44460
aaactgcgta ttgagaaaat tggggcctaa cggtaacatt aaacattgaa tgcaacacta 44520
actacagaat aagtttgcta agcaaatttg tttaaaagct tcgcaaactt tctattgatt 44580
cgctgactca tctgggcgta tgctttacgt gatgcataca tatgtccttt tttaatcgtc 44640
catgtagaac gcttacgcac agtttgctca acttcctcac ttcctctatg catttcagct 44700
tttgctttct gttatgtagg aaccaatgtt tcaagttaga gttgagtgtg gaaattttta 44760
agatctaaag aaatctaacc cacaagatta ctatttattt tcactaccaa aaccaaaaat 44820
aatatcttcc taacatatat atgctgacaa caaaaaaacg tctctctcgt tgctagtcat 44880
tctcatctct ctcacgtttt tttcttcgga gaaaaaacaa ggcggcacaa atagaggtgg 44940
gaaagtttgg tgatgcaaat aaaattacac aaataatatg cgtttcttaa gaagaaagta 45000
aaacttgaaa atgacgtgac gtgacgtgac acatgtcata tattgtacgg aactgacagt 45060
ggaaccacgt cggggaccag tgctagggat ggcgttttat tacgctgtta agccacggtg 45120
ttacgatatt ttgatggggc cacgagctct gctcaattat ataagagacc catctttttt 45180
ttttgaaact aagaccaacc atctttcttg ttttggaata accgtttggg tttctattaa 45240
gtttgcggtt tgctaaaaac ggttgtttcg gttttatact caacttttgg aaacttctta 45300
tgacagtttt ttttataatg ccaatgccag tgttgacact cgtccgaaga gttacataaa 45360
gctttatcag actaatagaa ttctctcact aatctgattt acttttgttt tcttgattag 45420
aacatccgca aaaaaacttt ataacttcaa atttgctcta aaaaaagttt caaaattagt 45480
ttaacaaact tcaaaaagaa acttcaaatt tgctcttcaa aaagaaacaa ccgtttagca 45540
aaaactacta tatagagttt ttcctttcta aaaataaact tcaaattttg aaatttgaag 45600
tttttagaaa tgaaacttta tatttgaagt ttcactactc aaaatttcaa atttgaggtt 45660
tcatattttt atttacattt taaaataaag agaaacattt cttactttga aattgatcat 45720
atacgagagc cttatgaaaa taattttatg aaataatatg atattttgct cgtattttaa 45780
tatttaataa tgtaatttta tttataattt tatatattag tgtaatatct tttaattaaa 45840
attgatgtaa tatttttata tatgtgttag ttatttataa aatatttcta tatttaatta 45900
actttgacaa atataagaac catattataa aatacaaata atttaaagtt aaatttaaag 45960
ttttaatttt ggaaaaaaac acatttaaac tttcgatata aaatcttgca aacttcaaaa 46020
tagatagtct ttttggagat actgttagca gttgatatgt attaagtttt actctcctgc 46080
taacttgtta ttgtaaaatt actccaagga aaaggtttgg ttattgattc gatccgatat 46140
gtgaacccac gttttgttta cctggtttgt attaaaggaa acagtaccaa aactttaggt 46200
tctcaatggt gataataaaa cagttttagt aatataaaca ataaggaata tgagtatact 46260
gtaatccaac caagatttag gcgttacacc caataagtaa aattttcata aaataagcgg 46320
tacggaataa tggtgattag atatattttt tggtacaaaa taaatatttg attaaaagaa 46380
tatcaaaatt gttcgaacat tcacgaaact cacataaatt ttatttttgt ttgtttgatt 46440
tggtttaggt aataataata gaaatatata ttttgtttga attaaaaata tgaaatagta 46500
aatatctttc ttagtgaact attctttcaa aagtatatta tttttgtaaa gatatttata 46560
tgtttttcaa atcaaagtta tctaaattta tatataaatt ctaaattatt tttaaataaa 46620
aatataatat aatacatgta agataatata tctttagttg tatttaattt aataatctgt 46680
tttctctagt aatatagtaa ttagtttttt ttgttaatta ctctatatgc taaaatagag 46740
tataattgaa atatagtcca attctattat aaaattatct taaagaaaaa aaaatgaatg 46800
tgtcattgga gatagaatta aggtatcatt ggtagagtat atatctagaa aagtttccta 46860
ccattattat tatattgata tttaacagta accttttata tgttttaatc ttaatcaaaa 46920
actagattat gacctggtat taaaaaatat tttttttaaa aaattcattt tactaattaa 46980
tatgttttaa catttatttt attgtatttg aaaatattat tttgtattta ttttatatat 47040
atgaaattat atatatatat atatatatat tacttaattt tgtttttcag ttatctcaac 47100
cttattcgtt atgatttttt taataaaacc tctccaaatt atttagataa ttatatgata 47160
tatattttga catattttaa gttatacaac ttttttaatg tcaagttatt gactttaata 47220
ttttatttat atacaaattt taatttaata tgaaatattt ttaaatttaa atgaatgtat 47280
ttttatttat taaaatataa ataaattaat tcattgattt aatttatttc atgtataaaa 47340
gaattattat ttttaaaaaa tatagttgta cttattttca aaattttctt gaattatttg 47400
agtgttttaa tcaattattt gatttactaa ataattaaaa aacaatatta ataaaaagtt 47460
attaaaaagg taagatataa tttttttggt cacaaaatca attagtatct tatttgaaaa 47520
caaatttatt agtatgatgt tattttccat agctatcttt aacgaagttc taatgttttt 47580
ttttttaagt tttaatgttt ttattaatta ctaataacat taaaaataat atattgtatg 47640
acgaaaaatt agattcaaat gaatgtgtct attttaataa gatagattat ctaagaaacg 47700
acacatgaca tgttggtgac tttttaataa gaagagattc ttttatgtca tctctcatac 47760
tttaaaaaat aaaattattg tggttaagag attcaaagtt ttttacacca ctgctgggtg 47820
tgctctttaa gttgttgatt aatgacgatg tctagagttt taattttacc tcaaagaaaa 47880
ggtttgggct gtggatttga tgtgatgtga ccccacgttt tgtttatctg gttcacgttt 47940
ttgaaatcca tcgatataac ttataagcag cagcatgcat cgactgtagt ctttagctgt 48000
catcaagacg tttaccactc acggaagtgc tcagagatct tttgctactc ttttttcttt 48060
gttcaacgga tcttttgcta ccaaaagaga aaaaatatca aagcatagca acttttgcaa 48120
tttgaaaatg cacccaaatt ttctattatt taccaaagag cttcagagaa ttttttggct 48180
atttatggct ccgaatggta acagcggatt gagcggtgcg agacaagcgg tttgactgca 48240
gtgcagttct gacaattata aaaacgtata gatatatggt atatgtagag atttttgtta 48300
ctgtggactg cagtgcggtg cgggacgaat gttaccattc gaagcctatg aagcatccaa 48360
aaaaatttct gtacctaaat ttgttgtctt tcaaaataat tttgggaaac tcgtatatta 48420
accatacaat agtcaccttt gaactataca tgaaaatttc atacatatca ggacaaatca 48480
tggccttgta agaacgagaa ttatacataa tgaaacataa acaaattaaa attaacaact 48540
aacaactcta caaacataaa aaacattatt caaagtttaa tataaaataa cattgtttaa 48600
acttcaaaaa atattcataa ttgagcgtca agtgcagttg tgaagacata aaaacatcaa 48660
tattgaccaa ataccaaaaa tagttattaa agtaagtatt ttaattaatt atttaagtaa 48720
aacataatta ttttaggcat atgataatat catagtatac tttggataca tattaaggat 48780
tgagattgag tttggtataa attttttttt cggattttga aattttcaag ttttttttcg 48840
gatatccatt cgggttcata gtcgaatctg gtaaaattca taacttgaaa taccagagaa 48900
catgatccat tcagtattta tattgggttt ggatcggttc aaatttattt ctatcgagtc 48960
gggtttgatt tggattttcg gattcagttt agttgtccac cactaatttt ctatctaaat 49020
ttgaaatatt ttcaattatt gaactgccta ataccttcac tatttacaaa aggttttgaa 49080
acttatcgcc tatacttgtt gttctattca cacacacaca aaaaagcccg gaatttttat 49140
tttgttttct aactgtactt aacttttgat atttactatt ttaccaagag gtttccctat 49200
aatttgtgct attcataatg atgcacataa atttttctat ttattagata ccccgtaatt 49260
tttgctaaaa gaagtaacaa ctgaagtgtt ccattccata tagtttctat atacaataat 49320
acccctgctc taaaattcat ttaactcggc tgcctagggg gcgagtacac atgaatcggc 49380
caaccactgt ggtgaatcaa cataattggc catattactg gagtattttc atttttgttt 49440
ggattttttg ttaaaactca atgtacttta gttacatttt tactgtgaaa aattacgaaa 49500
agctgtacga aattttttca gagtttgagc ctaagttcaa ttggacgtaa gtcactcagt 49560
taccacttag accaaagagt ttttttgtat tagctacgca aataccctta tataaatata 49620
aaaagttgaa aaactaatcc cgactaattt ctgatttttt gataactcac cgaaactaat 49680
ctcatgactt ggtattcaca aaagatttat aaacttttca catttaccga gtcgcaacat 49740
tgttacagat acactcgctg tcacaacacc aacaaaatat acaaaaaata aaggatgtcc 49800
tataaaaagg aagaatccaa aaatccaaaa aaagtactgt attatacaaa aaccggaaat 49860
aaaaaatctc tgtattaata actccaaagg gacacgtcgg tatctccgtc aaagtcatag 49920
ttatattcga attgtacgga cggtggcggc aaaagcatcc cttcggccat gctagccaac 49980
aaggtcggca tcccgaacat ggactcctcc tcgtccatat aaaacccatc gctgttttcc 50040
tccgtaaaaa tagcctccac gatcgtctcc tccacgtcca agccatgatc cttcgtcgta 50100
tcatttatct cagcctgaaa agccaccgcg gcttcagcag ccgccttctg gatatccttg 50160
gggcatgttg tctccgggat acggagccgc caagccgagt cggcgaaatt gaggcaggcg 50220
gatttgccac ggagggctat ggcggcgacg tcgtgagcac gagctgcgat ctcggcggtt 50280
aggaaagtac cgagccaaat cctagacttt ttgtttggct ccctcacctc acacacccac 50340
ttacctgagt ttctcagacg tactcctctg taaattgggt gacgcgtctc ccgaaacttc 50400
ttccgacccg caggtttctt cggacagctc gcggccagcg tcggacaata ctccccgctt 50460
aatgtaggag actcgtactc ggagcccaac atttcagaga aggcagaaaa tgaggtcatt 50520
gttaactgga taaggttgag tatagtaagg aactagaaag atctcggttc tgatgggttg 50580
ataaatgttt attttatctc tcaggtggat tctaaagttt gtagttcgat aaaaagttgg 50640
gagtgagagt tggtgtttat attggcctct ggaactagag gcgaacaaac atggagtttc 50700
tggttcctgg agtgacaagt gcgagtgtgt gacttgacac ggctaagcca tcccacggtt 50760
agtgtatgcg ctgtttttat tcactaagaa tctcacacgt gttctactga cccacaagaa 50820
atgacttttg agttttgact cttcattcgt tattaagtat ataaatttat taattttgaa 50880
aataatggac ataaacaatc tgcaaagaag atatttttag tgttctcttt ttgttttctt 50940
ccttgatatt tttaatgctc tccctatgcc ttttttttgt caataatctc catgatttta 51000
tttttcattg atattgaata tcctgtctat gtgttttttc ttgatacatt acaaatatat 51060
aaatttatca atcgtggatc tagaaattat tttaactaga agcatatata tattaagata 51120
ataaactatt taaataaact atttttataa aaataatata actatgtaat gttttttgga 51180
cgaaatttat taaaataatt ataaaaaatt agtttatagt attaaactat atttaaactt 51240
agtatctaca acatacacat acagtaatat aatatcaaat cattcacaca tcacagagta 51300
gaaaacgaat gattttatag tatattgaaa acaagagagt tttctttcaa aacatttcta 51360
tctttctctt tctttttatg tcgtttcaat ggaaaaaaaa actagatgaa atatttcgtt 51420
tgaacttgcc ctagatcttt tcatttattt ttcaatatac aatacaaaat cacttatttt 51480
cttttctcat gatactggtc caatagtaat ttggagtagg taaagaacaa tttgtaaaat 51540
atacagttat gattagttct gttcaaataa aaacatagta ttcgattgcg tttctcttat 51600
ccagtcagat ggttcttaaa gtactaggta gtataatata ataatataag ttaatctaag 51660
atgaattgag cgaataattg agcgaaaata attgaccaca ggattagacc gatagaaaag 51720
caaaaaaaaa catcactctc atttgctaaa aaaaaacatc actctcaatc tcaaaatata 51780
tcgataaaat atctgaaatc aaaataatat ctttttcttt tttttgaaca catcaaaata 51840
atatctatga aaaaaatcgt ggtctaaacc taaatcacgt ggtgtgagta tttaaagccg 51900
gacgatcgat caaacttaca agattttata ttcttactat aaatccagaa agtagtttat 51960
attcctaagt ataatggaaa caagaactta accaaaccaa aaaaaaactg aataatcttt 52020
tttctgtaaa ctaaatacaa aactgtgtca aattttatac atatctattt ttttaaaaaa 52080
tatccaaaat ttagaagaat tgaatcaaaa accaagtgga atatcaaaga ttttattagt 52140
atagatatct ttatcaacat gtatctaaaa tttcttctaa ttaaattaat aacaagggat 52200
gataaaaaca tgggaaatgg tgggaatgca accattatca tgagagtaac tgagatctta 52260
ttatggtaag tttaagaata ggtataatta taagattaat ggtttattaa gtagtgatat 52320
aattatataa gatttgaatg gtacatgtga gaattatata acatgaagca acattgttat 52380
aatttacggt gtcgggtcca gactcttccg gcgtttaaag cagataaaaa aactgatgcc 52440
ccttaactat agtaaaattt tactatattt taaatttata atcaaaataa tgctaaatat 52500
tattacaatt tatgatattt ttaaagaaat aaaatgcaaa acatcaaaac attttgcagc 52560
tcctctagac tgtttttcct tctcattgtg ttcataaaat ttcacaaaaa ttgtttatat 52620
atgggtttat tcagttgaac tcatcagagt attattatca tagtccaacc accaagcatg 52680
aatcttgtgc attcttttca aacttataat ggtttataca ccatctttta tattatatta 52740
tttcgaagct ttttttaccg taagtttttt tctgactcta catctagctt attcagtttc 52800
ggaatcaaaa agataaaaac gttttctttt ctaaaatagt agtgtttttt aaaccagacc 52860
ggtctgatgg ttgaaccggg tttgaccatg aaccggttgc atagcagggt tggaactaat 52920
aattggtttg accatgaatc ggttacgtag ccggattcga tctcaaagtt attaaactga 52980
taaaaatcat taaaactatc aaaaatcaat ataccattca tttaaacata aaacaagttt 53040
atatttttaa tattttatca tatttcattt atatttttaa ttatgtatca tatttactaa 53100
cattaatttt aaacttatac actaaaacat agaaagatta tagaaaacaa actattaaat 53160
ttttttgaca cacacaaaag aaaaggatta taccaacatg ttttattatt tctggtatca 53220
ttcataaggt gaaaacaaaa atcaaatata accataatag ttgtaaaata tactagttaa 53280
atacgtttta attataccaa ttataccgat tgtaatagct atattcgttt tagttgtact 53340
agttatatta tttttttgtc ataacaacca atgaaaaatt attgattgaa gaagattatg 53400
agttaatata ttttcgttga attgtatttt tttggtgaat catgtttttg aaagtattat 53460
aagatgaaga agatgaaaat agattttttt ttgatttaat gtaaaaaata tccagaaatg 53520
aactggtttg gtgatagata gcaaaaataa atttaacaat gtatcacctt tcgttgacaa 53580
aaaaaaaaaa aacaatgaat cacctttctc atttaaaaat aataaaaata ataagaaata 53640
taagtattgt agaattttaa taagccacta cgggcacata agaatttgat cccacacctt 53700
tgtgacaacg cctcggcgct ctggaacttt ctcgtcgcaa cattctcttg actggctcaa 53760
gtttgacctc ctgttaatcg taagatcttt ttcatgaata cgattcctct agatttgttt 53820
tcgtttcctt tttgtttctt gattttgttg ctacgaactc ttagggtctg cgatgcttgt 53880
gctttgcgat agctctctat atctcttaga ttcttttcaa gaaagttgat agcttcatag 53940
attaagtatt agatctctga aaaatttgca actttggaat aacagtgttt cggcttaaat 54000
tgctgcacat aagatgttcg acgatattcc tctgagaaga taactactag acatgctttt 54060
gttttccaag tttcggtttg attttactga acagtaatca catacgcatc tctttatgga 54120
tgagacccac cacatgtata aggaagtgac cattttattt tggcaggttc actgtttcag 54180
tagccatggc aaagcatcac cctgatctga tcatgtgccg gaaacaaccc ggcattgcca 54240
tcggacgact gtgtgagaaa tgcgacggga aatgcgtggt gtgtgattct tacgtgcgtc 54300
cctgcactct ggtgcgtatt tgcgacgaat gcaactacgg gtcgttccaa ggacggtgta 54360
ctatttgcgg aggggttggg atctcggatg cttactactg caaagagtgt acgcagcagg 54420
agaaagacag agatggttgt cccaagattg tcaaccttgg gagtgccaag acggatctct 54480
tctatgaacg taagaagtat ggattcaaga aacgatgaag atgtattggt ttgcccgatt 54540
gctggatctc ttatgctatg tctgttgcat gataaaacta atatgtattg ggtataaaaa 54600
acccatacat tatgctttct ttttcttgat aatctagact ttattggact tatcttagtg 54660
tctaaatagt ctcttgcgtt gtgtatcgtg tttgatttca tcacaccaca gtagaagtag 54720
gcatgttctt ggactcttaa tcatgttttg attgaataca aaattactaa actacatgta 54780
ccgctcaaat gcaatcatgt taaaacataa taaattttag tttatccaaa ctgtgcgagt 54840
ttaaataaat aaaaatgtta ctaaatactc aatccgttcc acaaagatcg atttttttag 54900
tatttttacg tatattaaaa aaatacatta aaccgtcata attagtgtat cattttcaaa 54960
aaaattaatt gattttattg aattatcatt ggttaaaagt tattaaaaca taaaacaaat 55020
tttttttcta aaaagtctat catgacggat ggagtaatcg aaaggactgg tgtaacaaac 55080
aagagtgttt gaggaattgt tgtgatcact tgattagcgg atgcagtagt ggttgactga 55140
tcattttctt atataaactt gggtctgttt caaatgtaaa tcgtgggtct atttatttgc 55200
agtggtttaa aaatgaaaga tcatcgcatg aactaatttg atgattatgg gctatctctt 55260
ttttctaaac ccagaaaagt ttataagata gatgggccca aagcctgtta agaatcgtat 55320
tatattattt taaaaataga agcaagaaaa gaagaaagat gaaacttctc cttcagctga 55380
tacagatctt ctagacagag acatattcaa atgcttccaa agctcaggga aaattcctaa 55440
atcagattcc atcactttga ccaaatacta agaagaagaa agatgttctt gatcaagaac 55500
ctcagacgaa tctcgccgac aacctcctcg gccctgatcg gcttccgaaa caccggatca 55560
ccccctctct cctcccgttt ctgcaccact ctgaatcaac cccaacaggt ccagactccg 55620
gctcccaatg gattggatcg gagccgttac gaaggtttgg caccgacgag agaaggagag 55680
aaaccgagag tggtggttct cgggtcgggc tgggcgggtt gtcgtttgat gaaagggatc 55740
gatacgagca tctacgacgt cgtttgcgtt tcccctagga accacatggt cttcactcct 55800
ctcctcgctt ctacctgcgt aggcactctc gagttcaggt ccgtcgctga gcctatctct 55860
cgtatccagc ctgccatctc gagagagccc ggctcgttct tcttcctcgc taattgctct 55920
cgccttgatg ctgattctca tgaggtatta ttactgtggg aatcatctga atctcagcat 55980
ttgtaactga accggaaaat tcgaattgaa ccgatccata ccgaaattga ttttgtaggg 56040
ttgtatttgg gatgtcccaa aaaaaaccaa acaggaaaac ccaaaaaaac tgaacctata 56100
taaatactct ttttttagga acacctatat aaatgcttta aatattcaat cttataagtt 56160
attttgatgg attttgtaat aatatccgaa tccgaagtat tattaatcaa acttgaaaag 56220
gttcagatct tagacaatgt tataaaattt actagaatcc gaagtattat taaccgaatt 56280
atgatccaaa cgtatatttt ttccgtttct aaaaaattca tattttagga ttttcacatt 56340
tattaagaaa atatatcaaa ttttagttac ttatacatta ttttccgtaa ccaactattt 56400
cccacaagtt ttcaccaata gaattttaat aaatacaatt atgttttttg aagtttacaa 56460
tttacattta atttatgcat tgaaaatatg aaaatctatc tttttgaaac aatttttttt 56520
tctaaaacat ggatatttta ggaacggaga gagtataaaa attcttctgg aaccgaaccc 56580
gaaagctcat gcacttttga tgaaaaatat ctttgcacgc tttcttaaat gtttgtcatt 56640
ggggataggt tcactgtgag actttaactg atggcttgaa cacattaaag ccgtggaagt 56700
tcaagatagc ttatgacaag cttgtggtag cttgcggtgc agaggcctcc acttttggaa 56760
tccaaggagt tctagaaaac gccatctttc tccgtgaggt tcaccatgct caggagattc 56820
gcaggaagct tcttctaaac ctcatgctct ctgatactcc tggtaagtga taaacaaata 56880
atgttatatt tctcatgaag aatcaaaatt attagcacag aacactttgt tttaaattag 56940
gaatatcgaa agaggagaaa cagaggctgc tccattgcgt tgtggttgga ggtggaccaa 57000
ctggggtgga gttcagcggt gaactcagtg acttcatcat gaaagatgtt cgtcaacggt 57060
atgctcatgt gaaggacgat gttcatgtta ctttgataga ggtttgtttt caagaagctg 57120
cttcttcagg ttcctcctta tgtgtgtttc atcacttcac aattgtctct gttttatgtg 57180
attatttaca ggccaaggat atactttctt cattcgatga tcgtctcaga cgctatgcta 57240
tcaagcagtt gaacaaagtg agttcattaa tggttttaaa aatcaatcta ggcggcaaat 57300
cgtagtcgaa acattttttt tttaaatccg attatacgat tcaaaccagt ataaaccatt 57360
cttaatcggt ttaaattgat ttaaaatagt ttaaatctgt taaattaaat aatcatgtta 57420
gtacagattc acaacttgtc ttaatttttt tgttttgtat tatctaattt tgataataca 57480
tcgaaataat tatataatta aatccaaaaa ctaagtatct tatataaata taaaataaat 57540
caataattca cttaatcatt agttttctac attataccgc ctagcgattt cttgtggtta 57600
atttataaga cgtgaaatgt ttctgtgctc attattatgc tgcattcata tacattatta 57660
gtctggagtg cggtttgtgc gtgggattgt gaaagatgtg aagccgcaga agctaatcct 57720
tgacgatggc acagaagttc cctacggact cttagtatgg tccactggtg taggtccttc 57780
tccttttgtt agttctcttg atcttccaaa agctcctggt ggaaggttag ctcatcaaca 57840
tcactacatt agaccctttt ttttttgcga aaaatattcc acatcggcta agactttttc 57900
tatctttttg tccctgtata gaattggtat tgaccaatgg atgcgtgtac cttctgtaca 57960
agacgtgttt gccattggtg actgcagtgg atatcttgag accactggaa aaccaaccct 58020
tcctgctctt gctcaggtaa actttttaga tagataagct tcataatcgt ctataccttc 58080
tcatgccttg ttatactacg ttactgctca attaaggtag ctgagagaga aggcaaatac 58140
ttggcgaatc tactaaatga gattgggaaa gccaatggag gacgagccaa cagtgcaaag 58200
gagatagcac ttggagttcc ttttgtgtat aagcaccttg gaagcatggc aacaatcggt 58260
agatacaaag ccctagtgga cctccgcgag agcaaggtaa caaatatttg actatgattc 58320
acctcgtaaa acaatgtggg gttgagagag attacttggg caggacgcaa aagggatatc 58380
aatgactggt ttcgtgagct ggttcatatg gagatccgct tatctgactc gagtcatcag 58440
ctggagaaac cgcttctatg ttgctattaa ctggttcact actttcgtct ttggccgtga 58500
cattagccgt atctgatgtg tccgaatcca ccagtgtgtt ttgacctcgg tttactttac 58560
acgtcgtcgt tttttgtaca aaattacaat aacacaatct tctgaagact gagaaggttt 58620
taaattatcc tctttttttt ttgttgttac taataatatc tttggttgtt gcgatttcgt 58680
ttgaagaaaa aagaataatt cagggttaaa tatttttttc agggttaaac aataagtatc 58740
tggaaaataa ttatcagtta tggattagac agatgcccta aagagtttat atttaaagtt 58800
tctattttga ttgaattaga aaatattatt tatagtttta atatgatatc ttaaacaatt 58860
ttttgcatca aagtaggata gttgctgttt taatttttaa tgtaaaatca agttggtctg 58920
caagggaaga catccaagcg accgcttagg acatataatt ttaaaagaca tatttttata 58980
tatttatttt tattcagaac ttcgatagtg tttatatgta aaaatattta taatattttt 59040
gataataata atatttgtaa gaatttttac cctcgttaat agaactctca ctaacaaata 59100
aattggaaaa atgtattgat aaataatgat tattttaaaa tgtaaaattt tgcgtgaaat 59160
atttatggta atgttaacta atattgatgt gcagttaatt tattaaaaat atgtttacca 59220
attagtagtt gaccaaattg gtttatcaag ttttaatgtg atttatatca tatagatatg 59280
atattagata aaacataaac atatatatta tttgcagaaa ggctaaccta aaaagaaaat 59340
ggataaggat catgatgact atcccaccat gcttgttgag atagtacctc ttaagatatt 59400
ttgaatttca atttatcaaa tagatacttt attgattgaa aatagcaatg ttagtagctt 59460
aaggtatagt attaaagatc aaatgggctt tgaatcattc ggactacgta tgtccaatag 59520
aggtttatcg gctctatacg ctgaaatgaa aggactatta tgacagtatc atgcatgaga 59580
gacgagaggg ttcctttggt ctggtttcaa atggattgct cagatttagt ggatatgact 59640
acgagatcga tagactggct gttttttgct ttggatattg gtgtgtttcg gagtttacat 59700
gatgattttg agagcatgag catgtacttt ttagaaaaac gtctcatcta atccatatat 59760
ggtctagtga tatgaatagc tgataaaaaa aaagataaat tgatttttaa ttttaatctt 59820
tctggttctg aaccggattg tagatttatt tatttattta ttttagttgc tttttctttt 59880
tttccacaaa tttttttatt ttaataccaa aaaatttaac atatctaatt tgaaaacttt 59940
tgtcaaaaaa atcttagggt atccaaagat gttagatcaa cactatgtaa atttacacga 60000
tttatattag gtttgttttg tagatagatt ccctaaggct aaaacatcag aaaataaagg 60060
taatatttag ttgcccaaaa aaaaaggtaa tgttaaatat tggatcttat atattcacat 60120
gttcatgtca gttgccacgc atgctcatgt actactatgt gtgtgcttgc aattcaataa 60180
acaatgtcgt cgtatttaat atttctgaaa agtctttgta gtttgttatt cttaaaacta 60240
tataaaaaga tgtttttttt ccaaatcgtt ttacacggaa acataatgca aagtaatatt 60300
attttaagaa aaggtctcat gtacagttaa cgaaaggaca agatagggaa taaagtgaga 60360
aaatacaata ataaacaaag aaatgaatat tgaaatattg gtctataaaa tctcaggacg 60420
gctacggtga caatgtctaa aactcatttg gtctctctta tgtccaaatc agattttttt 60480
tctctgaaag aaggtctacc aaatcaaact tcttctctac cgattgctaa acgactcaca 60540
ttcatcacgt acataactaa tattttctct gtttcaaaaa aaagatgcat gttttataat 60600
tcttatacat attaaaaaaa atatgaaatt ttgattacta atatagatta atttttgtaa 60660
ctaactattt ctcctaattt ttaatcaata gaattttaat aaacacaatt atatttttca 60720
aagtttataa tttatcatta attaatacat tgaaaatata aaaaatacat ttttagacaa 60780
tttttttcta aaacatgaac ttttttggaa cagaagaaat aattgtcttc gtaaatatct 60840
ttttgcctaa tcgttataaa actttaaata tataaatggg agaatatatc gtttagatcc 60900
gataccaaag gggtttgtca attatttacg aacgaaaatg gcatgaaaat gcctatgtat 60960
ttcaatcaag gcccttaaat caactgtttt ctctcagcaa aagtaagaaa aaacgatttc 61020
aagactccag actcatgatg ctatttgaga aaataattac ctcttattca tctagttcat 61080
gtttttaatg catatatgta aaaagatgaa agtgaccaaa tgtgccagca aaaacaggac 61140
tatgacttta cctttcagct ctattattta aactttgctt atctttcccc caaccaacta 61200
agaaaccttt gtctactttt ttgtagacat ttgcgcaaga gtcagtgtga acttattgat 61260
tcggggaagc aaactcatta ctaaaggcat cattatcagt ggatttctac agctgagtat 61320
ttagacattc gtttattaat attttaaaat aaaagaattt ttataatcat tctacagctg 61380
agtttatgaa cattaacagt agatttctac agagaagttt gaaatagtct tgtatcagtg 61440
acaaaatgcc taatgaattt atggtttctc aatatctcta aagagtttct cagcaaaaag 61500
acaattctca ttttttactt ttatgatatt tttaatacaa aaaactcatg aaagaaatgc 61560
caataaaaca aggggcaatt tgttggataa ccatagtagg aaaacaatta acaggtaata 61620
aaagaatata aactctgaaa cgtttggttg attgaagcaa tgtagtaaat ctgaaactta 61680
tttggttgat ccaaaccgaa acctgttctc tctaatggga gtatgcgtcg ttgtaagata 61740
ttcaccgtga tcatttacaa gttgacagaa acaaaaactt tttcctaggg aaaatattga 61800
tgaatcgaaa aaaggagaaa gcctcgaacg agatgtcatt gtttagggcc aaataattaa 61860
ctggataatt agagatttgt tagaaagtaa agccattgct tctttaggaa tagaagacaa 61920
cgtgtttcgt cgtttacacg tgcacgtaca acatcccatc tttctttttc ttgtccaaag 61980
ccatcactct ttttttctga acaactcttt gaattgttta atttacatct aattatcttc 62040
aaaaattggc ttgattaatc acatgagatt ggtctaatgg tatgtagact acagagagat 62100
ccgggttcac taaacctgta taatcataag gatatggacc attgtttaca acccatttaa 62160
aatatgaaag aaaatcaatc catgacttcc ccttagaaaa ttaatatgga ctcttccata 62220
atagtatctt tgaaaaatat atactctgtt agatataaac catacatata aatggtttgt 62280
gatgctgaag agacatgtat tcatgaagtg atcgtgatct ttaactgttc tttttcttaa 62340
tggttgtatc tttaactgtg ctttgtattg atagattagc cacgttttta ttcaacgcac 62400
acatattatg acgaatatta agggctttaa tgtacgcctt tcacctttgg tggaccacta 62460
atccatgtta atgattttgt tatgagaagt atagaagcaa ttcacttatg acaaattgac 62520
aatatagggt ttcggaactt cggttccgcg cgaatctcct ccaaaacaat gaaaaaaact 62580
cagtttgtat gggcctagct agaaacaatg gtctctggtg ctatgaattc gaacattctg 62640
gtgctatgaa ttcgaacatt cttttgaatt catatgatcc tctacaaggt ctgaaccaag 62700
ctactctacg gtccatgact ggcttgcgca actttagtgt agtccagggt tttttttgtc 62760
gtggtgatga gtctatatgt ggttggaagg ttcatgcagt acaataaatc tttgttttag 62820
cgagctgttg tatatgtggt acacgaaaag acatcattct tacgacgtgt tctataccaa 62880
ctacattccc tcaacacttg tattggtttg ttcgtctgaa tcaacaattg tgtcttttaa 62940
atgattttta tgattagttc aaaacccaaa atagttaact aacggggcaa aaatggtaac 63000
gaatagctta actgattata ttttccttta taaccctaca cattagagat atttcagtgt 63060
aatatataag ttactagata ataacccgcg cattgtgcgg gatgtgatta ttagttttct 63120
tatttttaat aaaaagacat taaatctatt taatctagat attagttcgg ttttaagttt 63180
ttttttggat tttaatcttc taaaataaac tattatttta aattaatatt cattttagtt 63240
tattcggtta aaatgtttga ttttttttta tccggtaaaa accaaaaatt aatattattt 63300
atttattttc atgttatgaa ttttagatag tcgtcatgtc aaaccaatag attcatatta 63360
ttgtttctaa acagataata gttaagaaaa ttattaagac aaattatttc actacaattt 63420
ggttggtagt gaaagaagca ttaagaaaaa atattttaac tttcaaaaaa aaattagata 63480
cttcagttgt ggtgaatact tagttataag gtgctcacat caaaatgcac atgtatgtgt 63540
atgtaaaagt atatataaat agttgacaaa tatataaaga tattgttagt taataataaa 63600
tgacattttt ttttcaaaac aatacatgaa agataaaatt aaaattaatt taaaataaaa 63660
aggcattgac gttagtcatt tttttatata aataaattaa aattggatcc gtaaatagag 63720
gtggacacat atcgaatatc tgggtatttg gaaacattcg tgtcgattcg atctttagcc 63780
acctagatat tcggtgactc ggatatccaa aatattttag aattttaaag aatatccgat 63840
ttgatccgta aataaaataa aattttaaaa ataattttaa taataaaatt ttattacaaa 63900
aataaaacat tatttaactt tttaaattat agtacctaat ataataaatt taattcatta 63960
aaatattgta aaactaatat aaagtataat atataacgta tatatataat tctgtacata 64020
tatgtatata tatgcatata acatagcaaa ttagatattt gttcctaaaa atattggtat 64080
ttgtgatttg cttctttttg gatattgtat tttagtattt gatttatttc ctagagttaa 64140
gtatatccag attttttggt tcaaatcaaa acggataaca aatcgaatcg aaatttatga 64200
atattttgct caattttatc tgtaaacaat aaaaataaca tatatatatg gtttggcttt 64260
tgatttgtta tctattttta ttcgaaccga aaaatctaga gttttattga aaccatgtat 64320
gtgagattta tgttaaaaaa aatgcaaaat acatagtgtg cacacattta tgaatatagt 64380
atgaacgcgt tagtatattt attatcaaat cattgtgagg ctgccacgtg tctattatag 64440
tgtgaatgta tttattacaa tgcttctctt ttaatataca agggattttc attgtaattt 64500
gcaaatttat aacaggcagc atattccccg ggcctactct tcatattatt tttggtgagt 64560
agcgtaatca tagatagttt tcttaattct tgaacttggg taacatcgtg ggtatctacg 64620
aaatgattcc tttcgacgta cacgatttat agataaacac gtagagacgt gtataataag 64680
cgagaaactt atttagcagt gttagagaaa tatttgagtt aacagactat agaaccttta 64740
taaattagta ttcaataaat taatattttt aatattcaat aattaatatt ttaatcttca 64800
gtaaaaaaat ataatattcg ataacttagt attcaataaa ttaatatttt caataaatta 64860
atattcaaaa aattaacatt tataaaaaat cattaaatta tattgtctca ttacaattgt 64920
aaattaataa ctgatgtata aaaattatat aaacataaca aaatattgtt atgtatggtt 64980
tttatttaaa atgaaactaa ttctaatttt ttcaacactt caaagtattt tataattata 65040
tatttaaaaa tattaacatt atgtgattca tattatatat atgtcaaata atttaataaa 65100
cactatgaaa gctaagttta caaaacttaa ttaatatata attcacgaaa aaatctattc 65160
cttttatttt acatataaac atattttaaa atatataaat ctaagtatga tattttgata 65220
aattactaat tttataaatt aaatattata gttcattaag tattttgaat aattattgga 65280
tctttaagta ttttgaataa ttattcaaaa ttgactcatt ttgtttttta agatttttaa 65340
aaaattgagt ttttttttcg atttccgtta gaatttgatt tgggtaaaaa ctaaaatctg 65400
aaataccata gaataataac catttggata cttatgtcga attcaaaaca gtttaattct 65460
caggttcaaa ttttcatatt gttttttcat accatagaat aatagccatt tggatactta 65520
tgtctaaaag taatataatc tgagacaaaa tataaaaata taaggattta tatatttcaa 65580
ccatatggat atggttgtgt gatacgaaag tgttagacat tatcgatttg aaatctatca 65640
ttcagatttg tcttttacat ggttaaaggg tgtgtgaata taaaactttc acgtagaaca 65700
acggatttat ctgttgcctg aaaaacaggc taaacactct attatgatta gtcttagatt 65760
taggacaccc ctggtccata aaaaaggtct tacatattta ctttcgcata catatttttc 65820
taatttaatt tcactgaata gaacgatgta acaaagtaac aaacccattg catttaaaat 65880
tacagcaaat tatccttttt ttaaatatat aattatttct ttaaatatat atatattttt 65940
ttattttttt ttcaacaaat atataattat taaaaaaaac agttttgagt atctcaatca 66000
attctacaga cttacacatc ctccttcccc tttatataaa gaaacttcag acctcaaaat 66060
acatcgaacc ctttcttcac cacattccac ttcccacact ctcttttttt ttgaattata 66120
gagagagaat cctcctccaa atctctctct ctcccaggat ggttgttgct atggaccaac 66180
gcaccaatgt gaacggagat gccggtgccc ggaaggaaga agggtttgat ccgagcgcac 66240
aaccgccgtt taagatcggg gacataaggg ctgcgattcc taagcattgt tgggtgaaaa 66300
gtcctttgag atctatgagc tacgtagcca gagacatttg tgccgtcgcg gctttggcca 66360
ttgccgccgt gtattttgat agctggttcc tctgtcctct ctattgggtc gcccaaggaa 66420
cccttttctg ggccatcttc gtcctcggcc acgactggta aagtttcttc cattttgcat 66480
tgcatcgatt tattgaatgc acgttctacg agtattgttt gtcagttact tcgtaaaatg 66540
attcttttga tgttcatttt ttgaagatct aagatttttt ttttagattt tctttttaaa 66600
tcattgttcc accaccacct ttcatcggtc gtacgactcg ttacaacacc acatctttat 66660
tttctataat tactactgct tccgcatttt atggatctct caacttataa ttaaagtata 66720
atatcaagaa tatctattat ttttcttaaa caagaaagat aatattgttt ctttgttatt 66780
ttggtgtatt tccaatctat ttcgagattt agaaatgtga cacgtcatta ccttgttgaa 66840
gtgtttaaaa caaacatgga aagtttaaat aaatagtgca ataaatgata tatatgtata 66900
tgatgaataa tgatgtgaaa tataattgaa taatggcagt ggacatggga gtttctcaga 66960
cattcctctg ctgaatagtg tggttggcca tattcttcat tccttcatcc tcgttcctta 67020
ccatggttgg taagtcagct tatcaaccct ttttactata ttattaatta ttaaacttgc 67080
atttgtatac ttggtgcaag ttggtaaatg taatctgata actgaaaatc tattcattgc 67140
tcgttctatt ttttttttgg ctagagacaa ttttataatt aaataatgca tgtgagaata 67200
tgactattta tgtgaggtag cttttcttat tcctgtcgaa aagcatcaaa tctttagcaa 67260
cgaaggaaaa aggaatcaaa ttttttatta aatgcaatgg gtctatgtct tggtcattag 67320
ttttttgcat ataatttatt tatatttttt tcttaacagc agctaattta attataatta 67380
aatattcatt ttataaataa tattagacca attattaaag gttagatatt ttaagaatta 67440
ttcatgactt tgtttattgg aactcctttt atcttttaat cttttctatt tctccatttt 67500
taataatgag aaactgactt caaatctcca ataaagatgg tcttatgtag taacagtata 67560
attttttgtt tggtaaatgt aacatcatct tcaaatatct ttgaaaatag acttacatgc 67620
attattttgc tgcgacatta ttgtcactta ttcctggcaa taaattagtt tattactgaa 67680
cttttttttg gtcaatttat tactagtaac tttaaactta aaagagtgag attgtttgat 67740
caaaaaaaat aaaaatagag tgagatagtt agaatctgcc atgaaagcaa cactatatag 67800
acaatttaat ttttatgaaa acacatttaa taatttgagg ctgcaggaga ataagccatc 67860
ggacacacca ccagaaccat ggccatgttg aaaacgacga gtcttgggtt ccggtaacat 67920
ttccctcttt aataatttct atttttctgt caaaataatt agtttttcga aatttgaggc 67980
cagaacgacc acttgtcaaa tttgattttt agctgtagta aaaacagttt gctagtgtca 68040
cagttaaccg gtaattgatt ctttttaacg atttatagaa gtaacatttt tgtaaaataa 68100
aatatacatt atggtatgtg acaacggacc acgcttattt gtattggtga atcttttaat 68160
tactccctcc aatttatttt agttgcagat ttagatttat gcacatagat taataaaaat 68220
attttgcaca ttttcaaaat aaaaacacca ttacttatac aactaaccat atttcaacca 68280
ataaaaataa attagaaaat attatttata aattttgtat tgaaattata aaataatact 68340
tattttaaaa cgaaattaat ttacaacgac aattaaactg aaacggaaag aaattattaa 68400
tacttaatta aagagttttt agaaaaattg aaagacatgt ttatgcgaaa ctcatgtgaa 68460
agtctttgaa ataatagatt ttggtataaa tatttcaaat tttcttaaaa taataattat 68520
atattaatat aatttgtgat aaaatctcgt caaaaactca ctaatgcaaa tgcttttatt 68580
ttgaatttct tactcctcta aatgcattta cttttatact aatattattt tctttctcta 68640
atttggcgtt tcgtaatagt ttgtctgtat tttgaaaact aacaaaaaat aataaaaaca 68700
aaagcttata aacacatagc atgcaatgaa tatgtacgaa tatatatacc aatacatatc 68760
taagtactat ttttccaagt acttaatctt gattactaaa attcatttta attgttcctt 68820
tcagttacca gaaaggttat acaagaattt accccacagt actcggatgc tcagatacac 68880
tgtccctctg cccatgctcg cttacccgat ctatctggta ttttttaatt cctaaaattt 68940
actacaagtc attttagact gtgttttaaa acaatataat tatttttgtt tggttttact 69000
gcagtggtac agaagtcctg gaaaagaagg gtcacatttt aacccataca gtggtttatt 69060
tgctccaagc gagagaaagc ttattgcaac ttcgactact tgctggtcca taatgttggc 69120
aattcttatc tgtctttcct tcctcgttgg tccagtcaca gttctcaaag tatacggtgt 69180
tccttacatt gtaagtttct tagtatatca taaagggtat atatttatta ttcaatatat 69240
atactatatg atttgttttt gtcatatatt tttgaaatat tcagatcttt gtgatgtggt 69300
tggacgctgt cacttacttg catcaccatg gtcatgatga gaagttgcct tggtacagag 69360
gcaaggtaat taaattaact attacaagta ttttacaaaa aactaatgat tagtatattt 69420
gattaatctt aattcttgat gttttgtgat taataatagg aatggagtta cttacgtgga 69480
ggattaacaa ctattgatag agattacgga attttcaaca acattcatca cgacattgga 69540
actcacgtga tccatcatct tttcccacaa atccctcact atcacttggt cgatgctgtg 69600
agtcatctca ctctctggct actttcatca aaaccatttg attaaagggt gattaattac 69660
taatgtagtg attttaacaa atggaatgtg acagacaaaa gcagctaaac atgtgttggg 69720
aagatactac agagaaccaa agacgtcagg agcaataccg atccacttgg tggagagttt 69780
ggtagcaagt attaagaaag atcattacgt cagtgacact ggtgacattg tcttctacga 69840
gactgatcca gatctctacg tttatgcttc tgtcaaatcg aaaatcaatt aaactttctt 69900
cccccttttt gtttagcact attatgaata aaccagtttt ttttacttat atattgttgt 69960
ttttaagtta aaaatgtact cgtgaaactc ttcttaattt agatattatt ccatttacac 70020
tgaaaaacat acaatttcaa aggttgaaaa gaaagacaaa attttctaga atgaccctaa 70080
aatccctttt atcacaaata tagtcttcaa ggatcaaaat taccaacata tttcattaaa 70140
aagtaaatag acacttatac tcttagagtt aaaaaatagc ttcaaaaaat ttttgaattt 70200
caaaataaaa ttttgaaaca aaattcgaaa aatgtttcat gcacctatgt atatgtgtct 70260
gtgtctgtgc catcgttgtc caaatgtaag tttgcacgat cagtagtatt cgtgacttga 70320
gcatctatgt catgctctcc attcccacat gattttagag agttatgttt catgtcacag 70380
cgggggatct agagtttgca tgggttgatt gcgggttcag aaccttcgtc cagttcccct 70440
agctgcggtc aaagtagagt tttctctttg gaggaccatg tactctgctt cgagctgagt 70500
tagtctctaa gcactttatt ctagcggttt ggaatttctt tccatctgct attttaagtt 70560
ttgaacctct gaggtgactc ttggattgca tgtagtggta ttattgtttg ccgtagctga 70620
gttcatctct tcaacttact tctccaaggc ttcaagataa gcttggaaaa ttgctcatgt 70680
attaatctat gtgactatgt ctagcaatgt acgcacaatc ggtataaaat tttaatagtt 70740
tattttttgg tcaacaaatt tttaatagtt tttttgacca aaatattttt aatggttttt 70800
aatatgtatt tctaatggaa aaactgatta aaatggtttt ccaaaaacgt caatgaaatt 70860
attaattttg taaataaaat ataggattat ataaattagc gttatgtgag tattgactta 70920
gtaataacaa taatcaatta taagtctaag ctcaatgtga tgattttttt tttttgcttg 70980
aaatgtaatg acgatgatga aaaaaattcg caatataaat aaaaagttaa tactttgtaa 71040
tcataaattt atctttagaa aatttattgc attgtattaa agctttacat tgttttgtct 71100
cttcataaaa aaattaccaa atttttttaa gtaatcttat aagaaaagaa aagtctgtaa 71160
caaatataca aagctggatt atttcaatat attatttgag aaatattaca atatttgagc 71220
tatgtcatgt gtcattatta gaatgctttt taaattatct agaaacataa gttgatctat 71280
ctaaacatat attatacttc tcattagact aattatacaa tcaaattaat aatctacaat 71340
taatattttc attctttcct tagaaaaaac tacggaatta cctaatgtga ttcaaatata 71400
tatttgacaa ataatgactt ataataataa gtatttgata acaatttgtc tatcctcaat 71460
cattttgttt aattttatat tattaaaata aagtaaacaa tcacattaac catataataa 71520
aatttagatt tttagtatat aaccacatta aaatgtgacc agtgatttaa atttcttgtt 71580
ataagaatat ataaatgatt ataaaaccat atgagtgaaa atttcattta ataatcattc 71640
agatatatat ctacatatta aactatatac catataaaat aaataaatat tttaatttca 71700
attgcattga agaagtattg aaaacttaaa attttaattg caaaattttc attgaatttt 71760
tataaattat taaaactatt aaaaatcaca cattgaaaat ttgttagtat tggttttgaa 71820
attttgctat aagcatatat aaataattat aaaaatatat aagtagaaag tctgatttaa 71880
tagatagtca tattaaaata tatattatat atctatgttg ttattatata aatttaatta 71940
tatatcacat aaaatagata aaagtgattg cttgaattta tttagcataa aattattcta 72000
aacaaataag agtaattgtt ttggtttatg tgtttgcgct ggtttaaata tatatacaat 72060
agttaatggt ttctcaatta ttcaatatat atatatatta tttcataata tataaaaaat 72120
aaaataaata ataatatata aaaataattt gtatatacaa taatcattct gtgaaggaat 72180
tttaaactag taaattatat tacttcagtt tgactttcct tttcgaggta ttaatagttg 72240
ttgcttggta aggaatgtca aaagtcaaaa ctaatagtca gagtcaaaaa catatcatct 72300
ccagtatagt atataatcaa aaaggatcca tatatttaaa gaatatttca aatatatata 72360
tgaaaggttt tagactcttc atattcataa gaaaaaacta aaacaataaa gacaaaaaaa 72420
tcaaaatgat atcaataaga aaatgttatt ttttggcgtt cttgtgtttg gcgattctct 72480
tgactctaag tatgcaatat atgttgatta ttttgtttct atttgttatt atattatata 72540
tcccttcatg tatgtagtgt aacatattat ataggtttcg gttaaagtat atacatttgt 72600
ttgttatagg ataagtcttt gagatattga attgtacact aacaaaaaaa tcatgttctt 72660
aaataactcc ctaatttctt tttaaaaata tatgctcaga tcttgcggaa gctcaagata 72720
ggagtaagct aattcctata ggtccttgcg cacagattcc gaactgcagt cagacatgca 72780
aaaattcagg ctttgctaaa ggcggacaat gcatcaaatg gtatcctaat tctattaagt 72840
atacatgtgc gtgctttgta aacgctgcta caccggctgt ttaagataat aactcttcaa 72900
atttgaacta aaaagatctc aaatgactat ttaaatagaa tattgaagaa atatgtttta 72960
tgcaaataaa agtgcatttc aattttaatt atgttctcaa tgtggactgt tatatgatca 73020
tatatatata tatatatata tattctgtat gaaataaacc gaattaataa agtttagaat 73080
tgttgtcaag tttgcaatca taaattttca attaataaca acgaattcaa gatatgagtt 73140
atctagttca cataactaac atgagccccc caaaaaaaca tgagccacac atcttattgt 73200
tttggttgtt cgattctaca aaaatgaatt ttatttatta acaatataaa caatttaaat 73260
gaaatttttt gtgaagtact gttttattaa taagatacag aatttcagaa aaagataaca 73320
aataaaaata aataaaggta ctgctaatca atttataaac cataattatc taaacatgtt 73380
gatctccttt attgttctgc tcttaaccat tccagaattt gtttgttatc ctattttgta 73440
tagaaaaaca ttatttatct taatacttgt ataattaaaa aacaaacatt tgattcctta 73500
tataataagg tcaattatat aatttggggt catcgtcaat gtctacttca taaaatgata 73560
tgcgcctgat tccaaaattt gaggaaaagt cttttatgta aaattctttt tattttttct 73620
aatgtgttaa gtttatgttg gatttgaacc aatcaattct agtgataaaa ttatacttga 73680
cagctaatct ttcactctga atatttttat taaaattttg gaaagaaata gaactatgta 73740
tattatttta actctatcaa aaataaaaga agtctttcgt gcctccagaa aaattaatgt 73800
gttttatcac ctacctaaca ccttgtaaca tagaactatg tatattattt taactctatc 73860
aaaaataaaa gaagtctttc gtgcctccag acaaattaat gtgttttaac accttgtaac 73920
acatactcca tttgcgatat cgtaaaacta aagtacaaaa aaatttatgt agtgattgta 73980
aggtcaatac actagtcttc ctaaactcaa agataaatta atgtactgac catcgccatg 74040
aaattgaccc atatgccaag tgaacaggcg tgaaaaatcc attagcttaa ctgccgatgg 74100
tcggatatta aaaatttctt tatcatatcc cttatatatt aattaagtaa cattacaaca 74160
ttgttttgta gcaacgtgtc accgtgaaaa tgaaattcag aattcttata gaaatatgta 74220
ggttcatctt aacttatact atacttttta ctaaactagc tattaaatta ataaatagtg 74280
tacaaaagaa tattttagta ctttctttat ataaaaacta cagaattgtc taatatgatt 74340
aacgtatata tgacaattaa tgattatgaa taatatattt ttgataataa tttttgtatc 74400
ttagcttttt tttctgttta attttagatt attaaaatat attaaacaat cacattaacc 74460
atatattaaa aaatattttt ttatatgtta tatttttaaa tttttaaaac gactacaaat 74520
tattaaaaac gttaaatgtc tcacactaaa attttgtgat caatggttta acttttttgg 74580
taataacaag aaacaaatga tcataaatcg tatgaatatg aagtctcact cactagacat 74640
taatattata tattaaatat agcttaaaat tatagtttaa aattaaacta taaaacatag 74700
aaaaatactt aaatatgata atttctaaat ttgtattgaa aaagtattga aaccttcata 74760
ttttaatatt gaaatttgca ttcaaaaatt cgcacattaa aaattttgtg tttatcatat 74820
gattataaat tctcaataat aaatatttat attaaaatat actatatatt tatatccatg 74880
tcattgaaat ttagttatat accatataaa ataaataaaa ttattgtttt ttaatttact 74940
aaaaaagtat cgtaaataaa caagatgtat tgttttgatt tatgtgctta atctaattta 75000
attatatata taatatgtaa atgaatataa ataaataata atatatataa tatttttata 75060
tataacattc attctgcgca attgcgcggg tcttaagcta gtatatatat taagtcagat 75120
gatagacaat tgagaatctc tcgacagttt tgttctcaaa aggtgatcaa agtgatccaa 75180
gaaattcggg gaagatagtt gatggtaaaa atggcagtga aacctttaat tggctctctc 75240
aatcaatggg tgtgagtgac tctctcaatc aatggtgaac cagaatttct agaatcgcac 75300
aacaatccta atccagtgat caagagcaac aaatgaataa ctcaaataat aaagacaaga 75360
tacactcttt gaagaaggaa gcaatttctt ttataaaact ttttggttga ttgaaagtgc 75420
tttgtacaag gacgaccatg agcttaaata gactctgaag acaaagattg ctaagccaaa 75480
atcaaataga gatcaaagaa aataaaggga aagagctgtt ggccttaaat ggctttcttg 75540
gccaaaaata agaaaggtga tgattatttt gcgtcttgag agttttgtgg agaaagccta 75600
gtgtcttggg acgaccatgt gaattgcaag tgtcttcata aggctgtggt tgaagtgata 75660
tagccattgg tcatcaaatg gattccagcc caaccattag ccgggggaca atatgataag 75720
aagccggcca tacaattttc aaaggttgca gcattataag ctgtaaccat ggaggcaaca 75780
agagatggat atgttctgta tccaaaggtt taaaaatctg agcatgtgct ggacgaagat 75840
ggtgagtcta tgattggtca taacttaaac cgacatagac caaacttagt atatttattc 75900
aaccacatta tggttcaata tgtttttcca aaaatttagt aaagttctgc tttaaacgta 75960
attgttgaaa cttgcatcat gctacaacag tgtactgctt ataaattaca aaactttgaa 76020
aaactagaga gaaagagaag agaatagaga acgagacgac gcagacaaac atctttctga 76080
ttctatctac cagtgaaacg gagggaaggt ttgtggaaga ggtacagcct cattaccgga 76140
tccatcagag actgcactcg cattctcaaa caaaccggac ccataaaaaa cagtctcttg 76200
ggacaaagaa agtggtggct gtggctgaag caaatgagag gaagatgatg acagaagaga 76260
gagagcgcaa tcagagtcat ggatgcaact cgtcattctc gagctgtcct cttcttcttg 76320
caagaaaggg aactgtttcc ctctgctgtt tggagaagaa gatatcggga acgtaatgcc 76380
tgtctttgca ggaaaagaac caacatagct ctggttctgc ccgtaacttg aaccattggc 76440
catagctacg cttacaggac cgcttcccca gctcggactc acaacagatg tagttggaaa 76500
cacgtgtgga gagcttgaaa aatccagcaa tttgctacct gttaacaaga tggtgcttag 76560
ggactcttaa gtctattgga tccaaaaaaa aaaagaattt attttttatt ttttaaaaga 76620
agaaaagcaa aaaccttgga agaaagttgc agtacgatcg gtatggtcgg gctgaggctt 76680
ccgtcttctt cgattgtgtc catcaagacg tttcctacaa cttttcttac cttcatcaaa 76740
ctcttccaaa ccatgaaacc tatctcaaaa acaaagtgga ccatgagcta aatttttttg 76800
ttttttggaa ttcatttctt taaataaaat atatattttt aaaaaattag gctttaatct 76860
aggctaaaat aacacaaaaa aactgtagta tgtgcaaatg caccctcagc aatatataca 76920
cagatgttaa cattatccaa catatgaata caatcagttt ttacctgctg cattgttgac 76980
aaaacctctg attattgcca ttgattgtaa ccacaggagt tttagaatgg acatcacaga 77040
ctttatgtct tttatgatac tctctacagt tactaaaatc agaatcacat ccatcaacca 77100
gacaaatcgg gatctggttg ttccctcttg tcctcttgga gcttcttgaa gcctcagagg 77160
cgctctcttt caacttacta agacttatca ctttctctgt cttgccaaaa gcagaggagg 77220
aggaggaaga agaggagttt acaatgtttc ttccaagttt cagatcaaat ggtaaatttc 77280
cttttggctg caatcttctt ggtggtgagg atgacccacc gaacgagatc gatgcatcga 77340
ctggggttaa atccggtaca gattcttggt cgaattcaga gaaataaccg gagctgagtt 77400
tgaagttcca atccatttaa agcttttttc cttctccttc ttcactcact aaaagaagac 77460
atacatagaa acaaaaatat caagatttat ccttttggtt ttgttaatct aaattgacag 77520
gtttaagaaa aggatacaat aaattcaact ttcaaacatg aaatttttta actcgattaa 77580
tcttgaattt tgaagaattt ttttttaaaa aaattaaaaa atcccaaaaa tgggcaaact 77640
tactgtactg aaaaaacaaa tgggaagtgc agatatatag aactagaaca gatcccatgt 77700
aatgggaaga aagcaaaaca aaataaaaat aaagcaaata tataaacttg cagttttgag 77760
tttcacttca tcataaaacc cctctctctt ttttatttat gtcactcact tgaaagcaag 77820
aatttaatgc aataaagaga cagagattaa agaaagatga aacatgttat tcataaatta 77880
taaaataaga aaagcttggt atttgaaggt tgagaaatct gaccaaatcc atgcacctac 77940
caatggtcag tagaagaaac tcaaaaaaga gaagagcgaa atctacaaaa tattgacaag 78000
tgagaaagag agttgatggg tttagcgaga gaaagtggag acaacgagag tggctgctgc 78060
tgcaataatg cacaagagaa agtgaagaaa aaagtaatat attactaagt ttaaaaatga 78120
agcttaattt aattgtttat ttgctttcct aatataggaa ttgttgatat ccttctttag 78180
agagagagag agagtggagc aaagggacag ctgttattgt tgtttgttca tttgctaact 78240
tttgcgtttt tttaattaaa aaattcttta ttagtttgct tacgaaattt ttaattttgt 78300
aacaagtttg ttattatttt aaaaatttat ccttaattga taattatttt attaaatact 78360
tcaaattttt gacaaaaaat aaattaactc ttttaaatta tttataatgt ttaaggatag 78420
tttataaaac atttataaaa atttataaac ctaaatctta aacaataatt actaaaccat 78480
aaattcaaat gttaaaatat ttttattgaa tataaaattt aaaaatgata gacaacttaa 78540
tgtatataac caatttttct ttatcaattt gtttgccatc caacaagtct gaatttatga 78600
taattaaatg aaatgatatg aaaaatacac agcatcatta gttaattttt tatatatttt 78660
atatgaaaaa acattaaaca tgtaactcat cagtttatgt tagtagtttg gtatctaatt 78720
tagacctgat atgttgttga gaaaagcaaa ttatactaaa attttaatat cgttgaaaat 78780
agtatagaat ttaatgtgta tgattaaaca atatttgttc ttcatggaac tagaatttga 78840
aaattttaag ctgacattta catttttcaa aactgaaaat cttccaaaca taagttagag 78900
atgatagagc acaacctttt taaaaagtca taagattgtc gttagcctga atttcacttg 78960
gtgtgaacaa taatttaatt ataccaacta attctgttaa cgtcattata tccaattaaa 79020
attacaatca atcaaactgt gacaaaaaaa aatcacaatc aatctaaata taaattgtat 79080
aaagcatctg attatccaaa attttactct gtttttttac tttagtatat ttcaagttca 79140
tgtagatgtc caaactaatc tctaaacgag tggtatggct tttttttttt tttgacagca 79200
agaaattcac agactcatga tgactctgta aaccatgttg gtaactccgc atccatgtga 79260
acgaacgagt ggtatgatct acaaatagac tttcattcta gctattcaaa tggaccataa 79320
aataaattta tatttgtata gtcacaaagt aaagtgtagt ggaatgccat caactctatg 79380
ttgattggca attccaaagt tcgcctacaa gatttttatt actaaactat cactttatgg 79440
ttaaaatttt attttgttcc caataactat caagatcttt attttaattt gttatagtac 79500
atagcaatcg tttgcaatat atatagcatc tatccaattt taatagcttt caaacatggt 79560
caccttgttt ctttgaaaat aagaataaga cagacagggt tttctaatat gctcttgtaa 79620
ataacaaaaa aaaaattgga aagtaataaa taagaggtat atgatgctta tttgcttacg 79680
gcaaaacata gcatgtgaac gtcgtggttc gcattacaca aacatcttct tctgttttta 79740
actttttatc atctctttct ttctttcccc gatacgcgct atttcttcga ccaacattta 79800
ctccttcacg ggtcacaact cacaagtcga caaataatat gtttttttgc caacaactaa 79860
taaacatatt ttgtttcctt ttcttaaata acatgtcttg tcttcaaaga atcaaactag 79920
ccttctactt cttctaaaga gtatcatcac tttaacactt ttcatataga ttaaaatatt 79980
aaaatatatt actattttta ttaattaaat ctatttaacc actagtattt gagataaata 80040
aaactatttg tagaatcaat atattttata attaatatta aacttcaaat aagtataaat 80100
tgctttaaaa tataaatgtc aatctttgtg taacaaaaaa gtatcaaatg atactatttg 80160
taaaacagag aaataattag aaatggctga ttaacaccct cgttaaaaat ttctccaaaa 80220
tcaatttatt tttgaagaat aagttagttg tagaaataaa aataaaaaat ttagttgcat 80280
gtttgactat ttaaatatat tgatttatct tgaattcgga tgttgcaact aagcgatgga 80340
tgttgaatca agtacataca tactggatta catcaaatgt gttatatcaa attgttgtgg 80400
atgttacacc tgatagtgag tttagttcca tgaggttgta tgtactaaag tattaagatg 80460
catgatactg gtgtatatat attttgtatt caaaataact tttattttgt actcgataag 80520
cttaatatcg cctataataa taaaatctca ctttctctgt ggacgtatcc aaattggacc 80580
acgttaaacc tttttgtctt tgttacatcg ctttatccat ctgtttttgc atatgttcat 80640
tttcatgtat gtaacaacaa aagtggcatc acagcttcgg gtctatgatt tggtgagaag 80700
atggctggta taaatgcgaa gatagaaaag tttgatggga gaaataattt caatctctag 80760
tattgcaaac gtttccgaaa caccatggca tatgcgggcc gctgtcagga aagaagtcta 80820
atgttgctgt tttagatact taggaagaaa aggcattctc taaattttgg ttgtgtttaa 80880
cagatgagtt catcatcgaa gtatcggatg agaaaactgt tgctagtttg tgacagaagt 80940
tagagagttt gtaaacaagt tacttctaaa gcaacgcctc tttgccttgc atatgcaaaa 81000
atatatatat tgagatttgc gaccatcctg gcaagttaaa tttgatacta ctagagatgt 81060
gtaacatcga tgttaaggtg gaggatgaag acactacagt aatcatgttg gtatctatgt 81120
cgaacttatt tgaaaatttc gtgcaatcgt tcattattgg caaagataca atgaaactgg 81180
aaaaagttag atcatcgctt catagtcaaa aattttatta gaacaatcca gttaaaaacc 81240
caaaataaaa ataatttagg tattttcttt atatatccca aaagaagagg agtaaagaaa 81300
aatatttacc tttgaaaatc tttataagat attacttaaa gagatttgaa atgtataaaa 81360
gaaataatgg ctatgagagt tgaaaagaat ccgcaatatc tgctagttaa gccctctagt 81420
acaccaagat ttagttttaa acaattcaag gaatataatg ttaaagttta tggtattatt 81480
tttagaagtg acttgaattt aaagccttgt aaattaagat ctttgtagaa ctaacttgaa 81540
tataaattct tgtaaagaaa gttttctgga gatcgtcagg cctcaaaact cagatctaac 81600
cactaaatga gtaaatgtac agccataagt gaattttggc ccttttaggg acgactttgt 81660
ttgtgttcag aaaaaataga ctggatggct ttttttttag atcaccagtg tgatgatttg 81720
tttggcattt ttattttaga tcaccagtgt gatgatttga gaataagtga tgcatatggt 81780
gagaaagtat ggcatactta taaaaagaaa caaaccgagc ataacaattt aaactggtaa 81840
tatattaaaa ataatatttt tgacgtcaga ctgaactttt cacataggtt caagcagacg 81900
gctcataaga aatgaaatta caatcatatc atcaacttgt aaacgcattt ttccgtaaat 81960
taaataggag agaaagacag aagtaaagca tcaaatatta gagactgaag gaaccaacac 82020
taaagcctct ttgtgtcccg tgcattctct ttttagtcac tcagtctggt gtcgttcctg 82080
tattccaaac accaaattaa aaaaaaagac cgtcaatata tatacaatag tgtttctttt 82140
tgtttcacat gtagtattac aaacctagac aaccattcta gtactttttg caaagaaaaa 82200
aaatctcatt atgaaggaaa gttaatagtt ttcattggta taattattta ttttcccttt 82260
atgcaaatgc aacctatggt gcttttgttt ccctgaattt gacatcattt tttgaatcaa 82320
gattatagtg atagattgtt gctccgctgc acttgaacca aatccgtttt gatcacactt 82380
tagatccagt tcgtttgaac cttaagtatt aaaaaccggt tatcattttg gcacgttaca 82440
tgcctagtag actctttttt ttttaatgaa aggcccttgc acttacatag tgaagctcaa 82500
acaaatccgg aaaaatgacc aaaccatatt cgaaggatga taactcagct atcatgtgga 82560
ccaacctatt taggactagg tttgccctca caaagatttt catcaccacc ataaattttc 82620
aaatcaagtg gatatgctat atgagttcaa gatatatatt tacgttatag taacctatag 82680
gaagatagga aaatggttaa agatgaaata gttgacctta ggtttgagga tgccatactt 82740
cctaaactgt tccctcacga ctctgttgta tatgaaagct gctcctctga attgcggcaa 82800
aaccaaccat gctaccaaca ctagcttcgc cgtgtaccat atcggtatcc tatatacatt 82860
ttcacacaaa aattcaattt ttgtttctca cattatttcc aggacaaata aaaatacata 82920
gttagtatta ttgttaccac tctaggagcg attgaaggat gagttctgag agagttaaga 82980
aagagtagat aatccaataa gcaagccatt gctcatcatc tgcttttgat gggctctcta 83040
ttgctagcac cgacgcatat cttaccaata ttataaatat aaaaaaaaca atttgaattt 83100
aatcattgaa ataaaacgaa acaaaatgtg aatttatcaa agaaacaata gtaagttact 83160
tacaacggat aaagcagcat caccacagga ctgcatatgg tcgtaaaaag taaacaaaac 83220
acgaaatcac gttgttattt taataataaa aatgctatta taaaagaaaa acaattcagc 83280
cataaattga tggagataag tattaaatcg agaaaataat atgaaaagtc aagtaagtac 83340
ccagcgatgg aatgaagagc agagaggaaa gtccaaagct tagtcattgt aagaggaaca 83400
caaaaaaaat ccaaaccaat caaaggaaga ataaaagaga agtttcgaaa cccttttgtt 83460
ttctaaccaa cacgcccaaa gatggaagga gatcttctta tttataatat caaacttaga 83520
cattaaaaca gtttggcacg tggttcagcc cctggtttaa gccgggacaa ctatatttca 83580
atattttgga taccaaaccg atgaaaaaag ttttgtgaga gcatctacaa taatgaaata 83640
acaccaaatt tgttattttg atgttaaaat agttaccatc tctaacaatg acaccaaatt 83700
ttacaccaaa aataatatta tatattatta atattttaaa ttttaaattt ttttttatta 83760
tttataatta ataaatatct agaatattat ttatattttt gttattttta agtgataaat 83820
gataatagtc atttaattat ttattttgaa aaaaattaat tttttaatta tgcgaaaata 83880
aatttaaaat acaaataata caatatattt atgtctaatt acaaatttta tagtaattaa 83940
attatattat ttattggtgt gctttacatc aaatttggtg agtgttaatt ttagtatttt 84000
attgaagatc aaattacacc aaatttgatg gtttagtgag acggccttat tcatataact 84060
aggcgatcaa aatcgagttt attagtccgg tttacatatt ttggtggctt aagtttcaat 84120
gagttaccgg acacgtgggc tgaagagaca agaggtatca gattctaact tgagcgtgtc 84180
cgacatgtca ccggccaata gagtcccgat gtcggtggga ttctctttat tgttattttc 84240
catgctttcc ctactatatt gatttatcat taattacaca tacaaatatt tttgttgtag 84300
caacactcgt aaaaatagtt taatatgcta taatatttag aaaaatatct gatatatgct 84360
aaacactttt gttagaaatt atatacaaaa ttttttcata tacttctttc attttctttt 84420
gaaagtatta aatattttta tcaactagat acatggaaga aagacacatg aaaccatata 84480
tctgtaaaca catttgagat atacaatacc gtaaaaaaga caaaaattat tgaagataca 84540
aatatgcttt tcaaatgaat gaatgttaat aaatatattt tgaaaaacat gttgaaactg 84600
tatctaaacg ataagccttt tctcaaaaaa aaaaaactgt aactaaacga atgaaaatta 84660
tattttggaa aaggtgatcg atctttgaga gcatcccatg atgatgtgat agaaaaaatt 84720
tcttgggaat tcgtaaactc aatgatgtat gactaacctc caggttttct ctatgtttac 84780
tagttgatat caacgatcag aaaccatcac cgcaagatgt attcgcaacc gtaaaaccaa 84840
acaatttttt aatagaatgt aacactcaaa tatctcttta atagacaaag cactgcgatg 84900
agttgcataa gttgtttgga aaatgtgttg agggttttgc agtggaaagc tcaaaatttg 84960
tgtatattag ttacgaactt ccacacatta aactacatgc aaaacagcaa aagtattttt 85020
tttttggaac aaaaaagcaa aatccataca tctcaaatgg aggaagcagc gagataagtt 85080
gcaaaaaaaa aaactgtttg agagtgtttt gaaagttttg caagaaagca caaagatagt 85140
atataatgta ttaggacatt ttaaacatga cgtagtattt acttttacta tttagagatg 85200
aagactttta gaaacatgta agtgcattta tattgagttt gtatcaagag tgcttcaaca 85260
atgagttcct aagaaagttc aaatgaataa gtcgtaaaaa ttgggtattc ttgttttcaa 85320
gtcagttgtg cgagtgaaac gaattcgtga gattaagcca tcaatataat ttcgtattat 85380
tggagatcga tttcgaggct caaatctctg catggagaat tttttatgtt acaatactaa 85440
caataacatg atcatctaat aagcttgaaa taagaaagaa tccatttaac gacataaata 85500
gagtaaaaat tctaacttct taagcaaacg atttactaca tcatggtaca agcgttgggg 85560
ttctcgtcac tgaatatctg tggtggataa gcaaacatct ccacaggata cctcggtggc 85620
tggtattgat attcattctt ctttaaatcc accactttgt catctccctc cgctgcagca 85680
cctccatctc cggccgccga tttggccact ccaccaccgt cttccttagc ctctttgctt 85740
tctttgggtt gttcttcttc ctttttcttc tcgtctttgt cttttgtttc tttttctttc 85800
tccggtggtt ttggcgatgg atcttgcttg acaatcgcag catgcttccc gattttcttg 85860
ttaacgtact caactagctt ttccggtata aaaactcctt tcacgctcac ttgtgatgct 85920
ttaaagtctg gttccacaga ctccactcct gtatagtaaa aggtagttgc tttatttttt 85980
tttaataata caatattcaa ggaattaata atcgaagaaa gtcgaacttt caaattgcat 86040
tacaaatatc gaatgcgcaa aactaatttc aattcttaag caaccaatgc tattctttgg 86100
cccttagaac tcgattagtt gatagcattt atgtgtatat atctatcaag cataaaaata 86160
tccacacttt ctagaaacaa caatttgtac aacttatagt tagcatatac acatacgtac 86220
tggaatttta gataactccg catacgagga atgtattcac taactaacta aaaaagtgtt 86280
tagaactttg agatccttgg gaaatataat aggtgaagta aatacaaagc acttgacttt 86340
agttgactct attcaaaccc actacagttt catgtaacct tgaaatacta aaagaaacaa 86400
aaaaaaaata ttcgggacaa ttttgttaaa atatatgatt atagtaacaa ataatctggt 86460
gaatgagttt ctttttaaag gaggaaatgc tctaacggtc taaacgcatg gtcttgtata 86520
ttgctctttt taaagggcct acatagtaca cacaatttta aagatggaat caacttatga 86580
catacataag agtccaaaac gtaatgtccc aattaagtga agtcagagaa aacttcgatt 86640
taataggagt catacccagt tgaggatatt ataattaaaa ttttgaataa gaagatgaaa 86700
aagaaaacaa acctttcatt ctcatgattc tcttttggat ctccatggca catgcttcac 86760
aatgcatgtg aactctcaac accactgtca ctacctgttt ttctcagtgc ccacaaaatt 86820
ttaatgttaa ttacacaaaa ccaacttact ttcttcaaat tacaaatcta tcctcaaaag 86880
tcttaacctc ttcttttttt tcttgaggtt ttggtttctc ctcttttttc tccggttcat 86940
ctgaaaccgg tttaggctct gggataggag aaaggagctc cactggacgg tggctctttc 87000
tttgcagtct ctgcaacact tttagtggat ctgccttctc tcctttcacc acaactttac 87060
tatttttaca atcagttgtt acatcctcca cccctaatca cattttcaat tatcccaaaa 87120
ttaactaaac cattacacaa atggatatga aagaaatgtg tttagttgta ccttcaaagc 87180
ctttaagaca tctatggatt tttttagcac aaccttcaca atgcataaag atcttaagaa 87240
caatctcttg tggctctttc ttcttctctt cttctttctt atcatctggt tttttcactt 87300
gtggctcttc agcttttttc tccattttct cttctgattt cttcttatct tcctgaaaat 87360
ggtaaaaaag gagaaaaaaa gtttaggaat agtgtttgga tttgtgaatc tgaaagtttg 87420
aaatacaaac ctctcccatt gattttagtg ccagtgttga ctgttgagac ttgagagagt 87480
tttttagtgg ctcacttatt taagtttttt cctcttcttt ctacggactt gagagagatc 87540
tggttatata aaagacacat actatttctt ttatttcttt tttttcaccc cacaaccaca 87600
agtacagaga cttattagta tttttcccat ccaattattc atagattttg aagatctttt 87660
ataaaatgtt tcttctcagt gttttgtttt aactgatttt tttctcagtg tttttagcta 87720
ttttgtatat ttgaccaata ttgggtactc tctaatcgta tattcgtatt gtttccaaaa 87780
tttgaataca gttttaaacc ttatctacca taactcaaac cttatcggtt gaagtaatta 87840
atcggcttga ttgtcaacat attaagtctt ctacaaaaaa taattgcatt actattcggc 87900
agaacctaca tatctaactg aaatatactc tttatgtttt acaaagatat cactctgaca 87960
ttttttttaa ttaaacttct aatactccac atgttttaag acgatccatg ttttagaaaa 88020
atgtgtttca aaaataaatt tttacatttt taatccatat tttatcacat aataattgtt 88080
aattataaaa ttcaaaaaaa taattgtgat tatttaattt atgctgactt aaaattgtgt 88140
caaatagata atcacaatta atacattttc ataaaaaatt atgttttctt aatatatata 88200
aaaaaattaa acataaataa ttgtgaaacg gatagaatat tattttagtg aaatgacatt 88260
atgaaatcag tcaatatgtc tctttcttgg aaaaccccaa taaatctagt atttattatc 88320
atttaatatt gctgatattt aatactccct ctgtttttta aagatggatg ttttaggaaa 88380
atattttgtt tctaaaagat gtatttttca tgttttcaaa gcatattttg tcaattaata 88440
atgaaaaatt gtgtgtttca aaaatattaa ttacatttct tttaatccta ttggtttaaa 88500
aatataggaa atataaagtt acaaaaaact atgcattaat aactaagttt taatatggtt 88560
tcttaataag tgtgaaaatc ctagaacatt catctttaaa aaacagaggg agtatttaaa 88620
attattttga ttgttttatt acattatttt cttttttaac tagttattat catttatttt 88680
cagctaactt tttattatct atacaaataa atattcctct tagttataaa ttcagattaa 88740
ataattttat acaatctttt caaaaataaa attttctttt ggaaatctat tctatcaggt 88800
tgcatatgca cattttattg taaaaacaaa agcacttatt tcacccaaaa tatttttaga 88860
attttctttg tatagtttta tatatatttc ataataaaac tttaagaatg ttttgttagt 88920
gtattttcat tcattcattc attgtcttgt ttacttgaca aaccacaaag agttatgact 88980
aattaatttt cagaaaatat tcaaagtttt tcagactgaa ataattgttt ccaacaaaat 89040
atgataataa taataataat gtagttttat taataattat aacaaagttt aacactaaat 89100
gtttttacgt taaaatataa cgaaggtcac actattttct tgctttaagc cacaaaaaat 89160
actgtctggc atgctttttt tttccttatt gctagacttt tgttgatgat gtagacttca 89220
ttaatgtttg attcaagtca cgactactaa ggctatgtac aataggtggc tttattcaac 89280
accataattt acgcttacac atcatctttt atttcatcca cctattagtt taatattttc 89340
ttatttttat atttacgata atttatttaa taaaatacaa cactataatc caccatttta 89400
tctcatattt tcctttttat aattatattt tgtaagcaaa aaattgaaaa atattttttt 89460
taaactataa taactaaaac ttaataaatt gtaaattttt aataaaaaat atttatgttc 89520
cacttaatat aaaagattaa aaatagactt ttatatatca aaataaaaaa acctaatctt 89580
tatttaagga acacaaaaat aataaatttt aatataattt atttctacaa aaatattatt 89640
tgatataaaa taattaatct caagttatta ggatgtaaca accaataaaa tagttataca 89700
tatatcaata tataatcttt tattttttaa aagaaatttg cttatattca tattcgatta 89760
tgttttttcc cgaacgtagt ttaaagtgaa gcaaaaccaa catagtggat cttacataaa 89820
atactttcaa catgtagaaa atattcaaca acaaataatc cacctcattt ttttaggttt 89880
tcaacagatc cattgcaggt attcaatagt tgaaagtaaa attcaacaaa cccattgcat 89940
atggtataat agtgacattt gtatacaatg gtgcgtgtat attgtatata tatgaaattt 90000
gttggcccag tgcgtttgta aagtattcta cataatttaa tatatatagg aaatttgaag 90060
cacatacaaa atgtgatttg aagaaagagt tcataatgct agacgttaac ggctttataa 90120
ttgagcatga aagtcttgtg agtacactat ttgaaaccta gtcagcgtac atgattatgg 90180
gtgtgattgt aagtcatgtc tagagtaaat attgaagaaa aaatatcagt tattcttatt 90240
tattctgaaa tcttatcaat caggtaaaaa cacttttctt cctcctacct ctaattgcta 90300
tttacaagag aataaaacac gttaatagtt ttactccaat tcaaacaaga gtaaatgtgt 90360
ttacctagtt tattctctct ctcatttttt tcttttcatt ttcatctttt ttcttttcct 90420
cttatttact ttatattttg atattttcca tccatgctct atatgtgaca acggtttaaa 90480
cgttatattc cttacgaata ttttttttgg taaaaatgaa tgatttattt catatagtac 90540
tatacattag atcaaattta ccccgtcaaa aaaataattt ttctaagaat aattgcagtt 90600
aatatttggc agacctttca tatttaactg acatataccc tttatgtttt ataaatttta 90660
tcattttgat attcttttta atatacaaat aacgccactt taaattttta atacaattta 90720
tactcatttt aaaatattaa ttattaaaaa ttttgattta taaaaaaatt tattcatctg 90780
aaagattatt aattaaacaa atgtaattac taaaaatata tgcattttaa tcatttcatt 90840
atttatgtaa aatgttaaaa taatattttc atgaaatgaa aggaacataa ttgtcttttt 90900
ctttggattt tccaaaatgt ccggcggacc gagactcaac cgactaatcc atgagatata 90960
tttaccggcg ttaaatagat ctgattgttc acagtggaca gtagatactt ctgttgcatg 91020
accacacaaa cgacatatct aaaatggtga gtttaaatat gaaatgctta ctattttcca 91080
agtccccgta ccattcaact acggttgtgt taatataatt gttttgcaaa tggcagaaca 91140
gaaaactaga tgtaaattca caatgcaagg ggcaatgcga tgatagatgg tattctttcg 91200
atgtccgaat aagccataat gtaactactg tctccttaag aagattagaa aaatcttaaa 91260
tgagtaaaat ccatgaattc tactttaaca cttttaactg gagaaaactc tattaaaaac 91320
aacgaagcta catgagattt actttatttt aacatgcata gccgacatct cgaatatttc 91380
tggagcggta aataaggcat tcttgcctac gccaatctcc tgtatattat ttgagaagaa 91440
ttgtaacatt tttttgtagc cagatgtcat cactataatg atttttagaa ttcttagaaa 91500
aatacgttgg ttcatctaaa tatataataa gccttttatt aaaccacaat aaatacatta 91560
ttaatgtcat tcattatttc cttaaataag attacagaat tatctaatgt gactagagta 91620
tataagacaa ttaataattt tgaataataa agatttgata aaaataagtg tgtattctaa 91680
ttatatttgt ttaattttaa gttattaaaa taaattaaac aatcatagta accatataat 91740
aaaaatttaa aaaattattt atatattata ttttgaattt ttaaaaacga gtataaatta 91800
ctaaaactgt taaaagtttc acattcaaat tttgtgatct atgatttaaa atttttgtta 91860
tgacatgata caaataatta aaaaataata taggttgaaa gtctcattta ataagtatca 91920
aaaataaaag atatagaaat atatgtaaca ttttaaattt aactatatgt catataaaaa 91980
tacataaata tcttaatttt aaaatttact ttcaacattt ttttgataaa aaatttgaaa 92040
aaatattgac aatttaattt tttaaaatat tataaattat ttaaaacatt aatcccacag 92100
tgaaaatttt ggtatcacta atttagactt tttgctataa cagatacaaa tgataaaaaa 92160
aatgagcaaa aatcatcatc taataaatat taatattaaa atatatcata tatatgttac 92220
tatcatttaa atttaattat atatcatatc aaatagaaaa aatatttttt cgatttataa 92280
gatttattta tatgttcaca ccaatttaat tatataagta gtacataatg acattttaat 92340
tattcaatat atatttatta tttcataata tgttataaac atataatata taaattaatt 92400
tatatatata atgttcatcc cgcgcaaggc gcgggtctta acctagttaa caagataaaa 92460
ggcatatatt tacttctttt ttacagataa cagaaacaga ctaatagtaa aacaaaaaat 92520
cataaataaa ataaaataca aaattacaca aatttaaaaa aaaattggaa aagtacttcc 92580
gtttattttt tactttaaaa atatcattgt ttttcatttg tagtactctc agataaatgt 92640
aatgtacata aatccagtgt acattctgca tattagatta aacaattttt gtttaacttc 92700
gtttaagact agcgccattg cgcggattaa tgttagcaag accgctttgg acgcaaggga 92760
gtacaaggaa gaccggttaa agcaaagcga ttaacacgtt cgtgaaccta aagaaagagc 92820
acaagtgagt tcattggcaa gaagatatgg ttcctttctt ccggaacgtt tgtctctcca 92880
aaaaacccta caccggtgct agtcctaaga tattttaggt ctaataggaa attaaaaata 92940
taaactctaa aaaattaaaa tttgataaaa attaatttta cgattaaaaa ttaaaaattc 93000
ttcaaaagta tacatagcta ccagatttaa aagttatttt cgttttcttt ttatgtaaat 93060
aagaaactaa acttcaaaaa ttattttgtt aaatgtttga aatatatttt agatccaact 93120
tttatatttt tctactaaca acaataacaa aattaagcct taaaagcttt aaaaattatg 93180
ggccgcatac ccatgttttt tagttatagg ctcaggaccg gcctgccacc actagatgct 93240
atatggagtt gtccaagatg acaaaacagc ttgctaaagt tgatcctttg agaaattggc 93300
tgatgcaatg atcgcttgga ctgaggcgtg ggaggagctt aacccttcag ttggtggaaa 93360
agatgtcacg gccaagtgat gaaaaattga cgattataag tgatgcctgt tattgctgca 93420
tgaataaggt ttgttattgt tgtgatcttc tatttatata tctcattctg gaagtgtgct 93480
tcgtacaata acgtaatact gtgtgttatt gttgacgtta acgttgctcg acatgtattt 93540
aagccttatt ggtgaaatga tgtgtgctac tttaaattac atggatgaaa tgattgtttt 93600
aacaggaaag taccagagga cttgatacca tcctatatcc aagtaatcgc ttgtccggga 93660
cgtcgaaata ctcgtttatg ttggcctccg acaagcttct aagccttgat tatttcattg 93720
ataatgatat aaatgttgta atttacaaaa ttatgcttag agatttttta aaatattact 93780
tgtgatcagt tttaaaacta aattaggttt gattacgaaa attaagagaa aacattaatt 93840
ttgtgactga gagcatctct aaccccactc tatttttcac tctaaaatag agtttagagt 93900
aaataatgct ccaatggtac tctatttctc actctataat agagtaataa ataggtttac 93960
tccaaatata gagtaatttg tttttttatt gttcatcact ttattttcta ctctaaaata 94020
gagtaccatt ggatcaaact caaactctat tatagagtta ctctatttta tagtaaaaaa 94080
tagagtaaac cattggagat gatctgagat ggaagacttc atgtgatcca atggtcaaga 94140
atcaaccact taaggaggca tgtgtcttta actaaagagt tttgtttgtt tgtcaggttt 94200
aggtggcact aaattggtgg atatttgcct catcatgcat gacatcctta gagcatgatt 94260
agtgaaggag atccatttgg gattcttaaa ctatgatttg acatttttct gctaaaaata 94320
tttttattat ttttattaat ttttttttta atatttctta gttaaaaact aaaagatata 94380
tatttttgct tgtagcctca aaataatctc ggagaaaaca tagctatttt cgaattaatg 94440
acatatcgtg aaatacaaaa cgtgcctaac catttcaaat tcattattaa gaaaaccacg 94500
aaatatttac taaaaatgtg acaaaagcag acatgatttt ggtcacgaaa tattcctata 94560
gcaattaggt tagtcatatt catatagctt ctaagaaata tggcacaatt gtgattaaaa 94620
tgaattcatg gcaactatga gtgttactgg ccatagaaaa tgctttgaca tttttttttt 94680
ggctaactaa aatgctttga gttctaaata ctgaatatgg caactcacaa agatcatttt 94740
tcacttctat ttatgaacaa atgcttgaga cattatctaa ccacccttac tattattttt 94800
caagtggtta ttcaagtttc tttcaaattc tcatccttct agatgacaac aataagaaga 94860
tgatattcat ttgtccttat agcacttata cttaccgtag aatatgattt ggcttgtgaa 94920
atgcaccaac atacgatgtt tatttttact tatccgattg aagatataat ggaagttttc 94980
aaggaagata ttttcgtcta taagaacaac ttttatgtct atttatcaaa tttatgcagg 95040
atgttccaac gctgtgaaaa aaaaacattt tctgctaaat cggaggaaat gcactttcac 95100
ggtgagagat agaatcgtgc tgagacatca gacttcaaaa aatgactgag gtgaacaaga 95160
caaaaatcaa ggttatgaga actctatgac caacgaattc tattatagcc gacgaatttt 95220
attaaagaga tttagaggtt ttttgggaca tggtttcttt catcaaggat ttctttaaga 95280
tcgcaagacc tttcacccag ctgttgtgca agaattgttt ttctgaattt aagagtactt 95340
ttttttataa atgcaagtta tatgtattta ttttttaaaa taaattttac aacattaatg 95400
gttgttttcc taaatttgat aaatatatta tacatattta gaaatatata tcttcataaa 95460
ttttagaaaa tgttatatat tcaatattat ttttctaaaa aatattggtc aaattcaaga 95520
agattttata cacattcatg aagatttttc ctagaaaatg ttatacatat tcaaaaatat 95580
tttactaaat atacatctaa ttcaaattta ttaaattatt cttatatatt catgaaaatt 95640
ttcttacaca catttgagaa ttatttataa atacatattt gagtttacct aaattttatg 95700
aagatattat atatatgtat taatatattt ttcagtaata cttttataaa tatgcatata 95760
actcaaattc aggatatcat atatatttag gaatgtcttc ctaagctttt taataaaaaa 95820
gatttttcaa aaaataaaaa aaaataaaaa tcattttttt aaatatcatc tttgagaaaa 95880
ttcatttaaa tatttattta ttttatatat ctaaaaaata ttgtcattta cctcattaat 95940
gaatgctaac ttggtcattt taccgttata ggatcttttt ttttggtagg accgttatag 96000
gatcatttga gatttgtatt taagaccatt tgaaaccatt tttcaaacta aaatatatta 96060
tacatatttt atattatgca acataaatat tttaataaac tttctatttt tttttgcgta 96120
tgacacgagt cattacttaa ttatatatta taaattaggt attagaatac cacataaatt 96180
tggttgcggg gcgcacattt agtaccggat attccttttt ctcaaaagta tttaataata 96240
ccaaacatag caagttgctt taaacatagc aagtcgcaag tagaaaattt cctttttaca 96300
aacatcagcg gtagttagcc agtgacggac gggtgtgtcg aacaatatac aaaaaaaacc 96360
cggaacatta gaatacaaat ttgataaaaa caaacttcca aacaaagttt atcaatgatc 96420
tatcgaatat cacaattcac agcaaaatga tatcctaacc tctttgaaat gtatttgttt 96480
gtaacttgtc attctattat ccattaagac aatgattttt ggtttttgga ataattccgc 96540
ttttcatgtt ttaagtatat tttatatcag tgatttgtga tatataaaaa tgtctatctg 96600
tgatagaaat atttaataat ttataatagt tacatttgtt aacaattgtt aagagtttcc 96660
attaagtaaa tttattgtct tatagtgatc atttttggct caacaaacta attaatttta 96720
aaacagaact acaaaattat caaaataaaa attattgcat agatattaat tacatgcgcc 96780
gaatagtaag gtggatacaa ctttaaaaga attagaccca aaaaaaaact ttaaaagaaa 96840
aaaatggtgg atacaacttt tgtggataca acaaacaaag ttcgcatatg ctttttacaa 96900
atgttcgtca attcatatga atttaaacaa gtcaacacgc tcacgttatc accttctcct 96960
tcggtagtgt ctttctaggg tagctgtaat atgaggaagg tttttcacag cagtaatttt 97020
ttctgtcaac ggataaagta acaaatagaa aaaaaattaa ttatttgaca gatgttgact 97080
ttttggtatt tatagatgaa cttgtggaaa atgtggaaag cataaacctt tttagtgcct 97140
ctcccttatt acaaaataat aactataggt atatatatat atatatatat tatttttttt 97200
taactatagg tatatgattc catattaaat tggactagaa ccaacctcga acattgacgg 97260
caaaaaattt aaattttttt aacactgata atcgattata tcattatata atatcttttt 97320
atgtttcata tgataattac aacatatgta attatgatga gaatttcaaa gacaaagatt 97380
tcacaatata gtttaccctg taacattcga attgattggc ggttctacgt gtactacata 97440
tgaccataac aaatgattct gtattcagca ctgaaatttc cgataatctt gtgttctata 97500
actgtaagaa attatttttc tgaaatcgaa ccccaaacat ggtatagaaa cctttaaact 97560
ttgacaaatg aattacaatg ctttcacaat ttttttttat catctaccaa aaagaaaaag 97620
agaatataag aagtgttgga ccatagttac acagattcta aggaaaataa agtatataat 97680
ctttttaata aagtctatac ttatctatca aaaattgtct ttggatactt ttagaatcat 97740
caaaaaccat ttaaataccc attgaaatgc ttaaatattt taaaaagccc aggagaacag 97800
atgacgtgtg ttatgtagtt gttagatatt gaaaataata ggtatgcacg aaaggaaaat 97860
caggtggtat ccatcttgga aaggcgacta aaccctttcc gttgacaaaa ctgaataaaa 97920
caaacatacc agatcaccaa taaccttgaa tatatatctt tttttttatc aaggactata 97980
ttataaaaaa aaactcaatt attagaccat gagttcgtat atggtgaagt aagggttata 98040
ttgaaaagtt aagcccgccc tcttctgatt gtcattgact tcaaagtaaa cctatatctc 98100
ttcttttcca atcaagattc tctatatata aaagagattc aagaaacata taactacaga 98160
aagaaaaaaa acaaagaaac aaatggagac atggagaaaa atgaaatctt ttgggcataa 98220
gagctcttca agcacggctt cgatcaccaa gagcaagtct tggaatggct ctgctcatct 98280
cgagaatgct aataacaagg aatcaacagg aaagatcaag aaaaaatcgc cgccgccgcc 98340
accacacgga tgtttcacag tttacgtggg tcccacgaaa gagagagtcg tggtgaaaac 98400
gaaactgttg aaccatcctt tgctcaagaa cttgttagaa gaagcagagg ctgaatatgg 98460
atatagacgt gatgggccta ttgttcttcc ttgcgaggtt gacttcttct acaaggtttt 98520
ggctaatatg aagtttaatg gtgatgagta cgatgaagaa gatgatgatg atgatggtat 98580
gattaaccct ccgatttgcg gtttgggtag tccctataga tgtgctggtc tcgagtccat 98640
gggcgtgaga cgtagcggct cgtacaagct tcttcgatct ccatctttgt tcaaattaag 98700
taggttttga tttttttgtt tggttttttg aaaatgatat ataggttttg attttctttt 98760
ttcccttctc cataatacta ggtatctaag atcttgttca taccattacc ttatgcataa 98820
aagaaaaatg cgaggaaaaa aaagaaccct cacatttccc taaattatat tccatttgtt 98880
tttctgagat tttgatgtct gattttgtat cttaatttac atgtgagtgt ttttggatga 98940
cgcaaacttt gaattaaaga aattactaaa aacactaacg aaacaaacgc ttgtaaaccg 99000
aattgtttgt tgttgaactt aaagccacta catcaaagat acaagaacat caaaaataaa 99060
aagactcctc actaagattt tgattggtag aacctttaca agaacattat attctttatc 99120
taatcactat ttttattaac ttgatatatt attcaagttt gaggtggtat gaaaaaccag 99180
aaacagaatc tttacatatt taaaatagca tctattagat gtaaatgctc tttatgtaac 99240
gatctcttat gcttttgatg agagcattta actttaaaat ataaaatact aaatataaaa 99300
taaagattat ttaaattaaa ttaaaaatat acttatataa aaattaaatg gtatttaaaa 99360
taaaatttat aattaatata tttaaatcat ttaaaataat agtattttag attaagaata 99420
tgatgatttt atttatgaat cacttacccg tactctgcac tcacttataa taaaaaaaat 99480
ttgtcatcca ctttaataat tttattaatg aaattatata atatttgcaa catagtacac 99540
ttttatagca tagtgctaga attttatcag caactccata tctatacgga tggtaactgg 99600
gtcattcgaa cacatcatta tattttgcta gttatataat tgttctttga ataaatttag 99660
tgcattttta atttagctga cttcaagttt atatttaatc gtatcatatc taattaattt 99720
taatatgcaa tccttttagc caattaattt tatatttaga ttttctgtaa ataaattatg 99780
taatttcatt atcctaaaga taaaaataat taaatttcgt atgattcatg aattcaatcc 99840
tgatttactg agaaaacaac tatgaagatt aatccaattt gggaattcat agattgaatt 99900
caccttttgc aatcaaactt ttataaagag aaaaaggaat taaatttcgg tatggttcat 99960
agatttaatt taattttatt ggaaaaaaca actaagatgc tggtccagtt aattctctgt 100020
taattaggat gttatgaggc aagtattata gaatgaattc accattgcaa tcaaaccttg 100080
tgacaattca tcttatgttg gaaaagagag caaagccact aatagatttg gggataaagc 100140
aaaaagtgca ttcaggttat gagattatgt tttgagaaga tccatggatc tcaacaagtc 100200
ttgttgagtt attacacatg ttgttcatcc aataatgata gtgagtgact taatggagag 100260
ccaaaaacat ggaagatgga aaaataagga actttaccgc ggaagatgac aatccttgcc 100320
tataagtcaa ttgaggcatc aagatagttt tgttcgagtt atacgaataa tagtctatgt 100380
atagtcaaat tgggatattg agtagctaat aatacactta atcatgaagt tgatgtcatg 100440
aagttaatac agcttcaaac atttgtttag aaaattaatg atatgtcatc ttatgtgact 100500
tgacaagcac atgaaacctt atgtaactat gaatttaaca aatcactcat gagatgtgat 100560
aatcattgtc ctcaatgcgg gactaaatat gaatccataa acaataatat ttttgagtgt 100620
ccatcaactc ttcaaacttg ggttttaaca acatcatttt cttaattttt ggttttctct 100680
attttaagtt tatataccaa tatgaattat ttattttatc ataagaacaa tattgaagac 100740
tcaaaaatgg atagatatcc ttacccataa ataatatgat atatttaaaa agtgcaaaag 100800
gctaaagatc tgatatcaac agtaaaagac ttagtaacgt ggtatagctt tcctacaaag 100860
ttaaaggagt tatatatcct gaagagtaga tttgtgtaga aataaaagtt gtagattcat 100920
tagttagaag acataaacat ctcagagatt tatatttcgt ttgttgtttt atttcgatat 100980
agtttttcaa acgacttcaa gttcaaactt aagtaataaa tgagtcatat gatttgatat 101040
tttttttaaa aaaaattatg gtaaatgatc tagccatata aaagagaatg gtttagtaca 101100
attatatgtt aactctttat taaaattgac taacgatcgg ctcggcctct gcctaatgtt 101160
tgaagtagct ctgcggtttt gtccgaaccg aaccgaacca aaatttttgg ctttcggttt 101220
agttacggtt ttgggttcgg taagcttttg aaaaataatt tgatttttgg ttcggttcgg 101280
ttcgttttcg attttcaaaa aaaactaaaa aaaaaacaaa atcactgaaa aaccaaacca 101340
aaaaacccaa atttaaccga aaatatccaa aaaaaattag aaaactttac cgaaattaac 101400
cggaaacaaa aaaaaatcgt tatttcagaa ataaaagtga aaaccaaaaa taatcgagaa 101460
ccaaaccaaa cgaaaccgaa tcaaaatttt gttcagttaa tttcgaaatt ggtttccaaa 101520
aattcggtta accgaaaacc gacgattcgg ttgggtctct ggcagggcta atttgaagtg 101580
ctggagagaa agaaaagtaa agaaacggca ccgtttcgta tcattttttt ttcctcggca 101640
ccgtttcgta tctatcatta agctttttta accttttaat gcagtctcca ttctcgggag 101700
agatcaatta atactttttc caataaagtt cttttgaaga aaaaacagac tcgccttcct 101760
cgtcatcagc ctttcttctt taacctaaaa atggatgatg atgatgctat tcgcgtaaag 101820
ctagagaatc tcccgactcc tacttccgtc aacggaatca aaccctccgt aatcgatctc 101880
tgcagcagcg acgaagaaga caacgacggc atcgatgctt ccagaaccgt cggcgagaag 101940
agagcgcgaa gggactgtga tatcaatact ccggcgaaga gggtggcggt agaggaaggg 102000
cttgggcaat cgtcgtcgat agtggctctc caggctacgc cttgtaacgt cgtgaggcct 102060
tcttcgtcgg cggcgtcttg caagcagttc tggaaagcag gggattacga aggaacctct 102120
ggtggtcact gggaagtctc tgcaggtagc gaatctcgaa ccgtgggttg tatacttctc 102180
tatttatttg gggtaaagtt tgttgagatg ttaattggtt caggtgggtt tgatcatgtg 102240
agagtacatc ccaagttctt gcattctaat gctacaagtc acaagtgggc tcttggaggt 102300
atctttttta tattttttaa tcaaagtttt catttttatt atttttagca gtgttttatg 102360
aagttggttg gaataagaat gtttgtttga ttttttgcag catttgctga gcttttggac 102420
aatgctctgg atgaggtgtg gaatgttttg tttctatttt taatattttt tctgtttggt 102480
ggtaatgttt tttttttttt ttctgttttg ggttatcagg tacacagtgg agctacttat 102540
gttaatgtca acatgctaac caataagaaa gatggaagca ggatgctctt gatcgaaggt 102600
atataatagt ttatttagta tttttttctt tctgtttgta ttcacgtttt gatgatgttg 102660
tgtttgggaa attttcagat aatggaggcg gtatgaatcc tgagaagatg cgacactgca 102720
tgtctttagg atactctgcc aagagcaaac ttgcaaacac tattggacag tgtaaggcaa 102780
ctcttttacc tgcaagatta tatttttaaa tgcttcttcc atcaagaata cacttaaagt 102840
tcatatgctt tttttttgaa gatggcaatg gattcaagac tagtactatg agacttggag 102900
ctgatgttat tgtattctca cgttgccctg gcaaagatgg agataggtta gttggtttta 102960
atgattttac tgggatatgt gttgtgtatt gaaagagatc aacaaaagct ttacaatgtt 103020
ctgtttgctt gatgttggtt ttagctttac acagacaatt gggctgttgt catacacgtt 103080
tctgaagagc acagggaaag aggacattgt tgtacccatg gtaagctaac tgtatgaaat 103140
aaccattcat ataacccttg ataatctgga atatttgata gcatgtgact gatttgtaag 103200
cataagaaag ttaggtaggc cagacactgt ttcagagtag cttttgtctg aaatactgtt 103260
agaaaatagg cgtcaaactc cttgaaacct ttgtctgctt cagagttaac tgtttgtcca 103320
aatttaatta gaattagcca attttaatct ctcttctaat cttcttctga tggtgattta 103380
aatgaaagct cgactacgaa agggaaggtt cagaatggag tccaatagta cggtcttcag 103440
ctagtgactg gaataagaac gtggatacga ttgttcaatg gtccccattc tctactgaag 103500
acgagcttct ttgccaggta aaaaacaaag gagttgtttc ataatattta tagctacttg 103560
tttattttga gaatatttcc acttatctgt gctctatggc tgttgtagtt caatctaatg 103620
aaggagcatg ggacaaggat aatcatatat aacctctggg aagatgacca aggactgcta 103680
gaacttgatt ttgacacgga tccacatgta tgtgtttttt tttactgtga ttttgatctg 103740
caacgatgta aaagctttct gtattcgtat actttgacac acgtttggtt gcaggatatc 103800
caacttagag gggtcaatag ggatgagaaa agtatcagta tggctgctca gtaccctaac 103860
tctagacact tcctcacata caggcattca ctcagagtat gaatcttcta tccgtctttc 103920
cttaacagtg gcagttgaaa ttgttttttt ttgttttacg aaattcattt gttaccttgt 103980
gaattgttgt ctccagagtt atgtatcgat tctatacctg agagttccac ctgagttccg 104040
tatcattctc cgaggaagag atgttgagca tcacaacatt gtgaatgaca tgatgcacac 104100
aaaccaaatc acttatcgtc caaaagaagg acccggtgga caatctaatt tctcaaatgt 104160
aatgtttttc acaacttagt tatactcaaa agacttcttc ctgcaaattt tatttgaaga 104220
acttgcgcag tttctaaata tggttgtgtg gcaatattta taacagatgt ctgctgttgt 104280
gacgattgga tttgttaagg atgcaaaaca tcacgttgat gtacaaggct tcaatgtcta 104340
ccacaagaat cgccttatta aggtttctct cgctcttttc ggcttatatt acctttgttt 104400
ctgtcagttt tttaactgtc ccactttgtt tttgtcagcc attttggagg atatggaatg 104460
cagcaggaag tcaaggtcgt gggattatag gtaatcgtta ttttgcagga aggtctataa 104520
tacatgattg gctcttttaa tgtgaagtct aatgcgttag tttgctaaaa ggtgttttgg 104580
aagctgattt cgttgagccg gctcatgata agcaaggttt tgagcgtaca acagttttgt 104640
ctagactcga gacacgtctt cttgtaatgc agaagaatta ttggtttgtt gctctcttct 104700
cttgcttttt agaaaattgc cgatgcttca ctgaactctt tgcgcttctg atttattcag 104760
gaggttgaac tgtcacagaa ttggatatgt ttcagcacat ggcaaaaagt ccgctaaaga 104820
ctctgaagac agaggtacta acatcttctt cttttttttt taaacaatcg gggttttaaa 104880
acgtgtgcta ataaacaaat ctcttggaca tttgtgtaga atcatcacca gagtatgcag 104940
tcccaaccag gaaaagagct gctgctgctg catcgttgag ctttaaaact ccaactggtg 105000
caaggacagt tgtgaatcga ggaggaaaag gaaaaggatc tgttagagat tctaatgggg 105060
tcggttcatc agagaaaagt ggtaaacatg gaaacacctc ttccaaattt aatggacgag 105120
caaaggctcg aggagctcct ccagctttag aagatatcaa cagtgatgag gactctgatt 105180
acgatcctcc gggtgaagaa aatgtcactg agcttcctga gaaggtcctc caatgctctt 105240
tcttttattt ttctccggta aatagaatta tgaacgtaac cttttgtgta cttgttctcg 105300
cagagcttcg aaccaccaac caagccacgt tctactgatt cacgtaccct cagtcaacta 105360
gagcaagaga atgaaacgtt aaaagagagg ttttgttacc ttacgttacc atgttatgat 105420
tcatgtttct cacttgtttg aacaacactg taagctttgt gttttcctta attctcaggc 105480
taaataaaaa ggaagctgtt tacttgctgt tgcaagaaga gctgcgacgt gagaaagagc 105540
ttcgcaaaaa acttgaagct gaggtataaa ttctactctt taacattttt actgtgtctg 105600
cttgcaaacc tataagcaac aatcagttag tcaccaatgg atgattcctc tttggtattg 105660
ttaggttcaa agaacaaaag acgagttaga agacgtgaag aaagagcaag agagtttaat 105720
cgacatattc tcagaggata gagacagacg cgacaaggag gaagaagatc tcagaaataa 105780
gctagaggtt ccttctttct tcttatcacc tttctctact aaatcttctc tcagattcag 105840
gaaatgtaaa ctttttcttg tggttgcagg aggcgtcaaa gaggatccaa gcgttgttag 105900
atgaaaaatc ccgagggaga cgctagaggt ctggagctag ctcggaagga tagtcactgc 105960
atggaggagg ataccattga ctcgtttagt tttttttt 105998
<210> 3
<211> 59642
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 3
gtagataaca aaataaaact agtggttaat agacaaaata atatatatat atatatatat 60
atatatatat atctatggtt tgttattttc tgtaaatttt tagtttttct aaaacaaatg 120
atataaaaat aataaagatt tattttaaat tttggttttt tattttagtg tagttttagt 180
ctaaatatat tttataactt tggtaaaaat gtataatttt ttgtaattta aatattatat 240
aataaaatta aaagctgatt taaaaaaaaa ttccagtgta ataaatgtat aatacttata 300
actaaagaaa ttatttaact tttctttaag atttatggta tacatattga ctaaaaatta 360
taaattaact tacataaaaa ttaaaattac ttaattcata gagaagatta ttatttgtaa 420
gtttttttgt ttgttttcta gaagggcaga tataattata tatatgaaaa attaatttct 480
tgaaagaaaa tgaagtcagt cgtttggaaa ccacaaaagc acataaaaag tggattttgg 540
tttctatgta taaaatagtg taggagttga aaaactgggt tcccaaaaat acagggaatc 600
tgttttagtt aaatcttgat tgggtaaaaa gtagctttta gtgtctccgc tggtatcggt 660
ctttctcgtt ttttgggtgt aaaatgttaa gaaaaatgtt tggaaaaact gcggtgagcg 720
tgtcattctc attttgttat agaacaaaac ttaggttcac tctctagact ggatttttaa 780
attcaccaca tctcctatca ctaatcaaat tgttacctag ataaataata aaaatattat 840
ttttaaaaga acaaatctaa aataatagaa aaataataat gacgtcaatt ttaatgacgt 900
taacgccgtt atctaaaccc taaaccctaa atcttaaact tcaaacctta aatttaaatc 960
ttaaaatgta aatctaaacc ctaaacctta aactctaaaa ccaaacccta taccctaaac 1020
cttggatcct aaactcaaat cgtaaatcct aaacctaaac cctataccat aaaggtttga 1080
gttaatgttg atgtttttct tttagggttt aaggtttggg tttaaggcct aggatttggg 1140
tttatggtct aggatttaag tttagagttt acgatttgga tttagggtct aggatttagg 1200
tttagggtat atgatttggg tttcaagtct agagtttggg tttagaattt aggttgaggg 1260
tatatgattt cggtttcaag tctagagttt gggtttagaa tttagggtat agtatttggg 1320
tttaggggtt aggatttaga tttaaggttt agaatttagg gtttaaaatt taggatgagt 1380
tttgttagtg gtgttaacgt tattaaaatt ggcaatcatt attttttatt attattttaa 1440
tttttataaa aaaatattaa taatattttt attaatttag gtggtacttt gattagtgat 1500
aagagttgtg gtgaattagg atgaaccaaa attttgttct ttgttatata ctagtggcaa 1560
acccccgcgg agctttgatt taagttgttc tatttatcct gaagtgtata atagtatgac 1620
aaatgtgtat cgtattcatg gtagcatatg ccactctcga gctctgaatg agaatgaaaa 1680
ttttctcgaa aacattgatg aattgatata tgtgagagct tgttagcttg acaatttagc 1740
aatataagaa tgttattatc agccttcatt tcatttttat agtgaaagaa agaatatgaa 1800
cggtaattag caataaagaa cggttgcgta gtttccaaat aagttttttt ttgtgattct 1860
tgaaaaatac agcgaaacat atctacaatg ctagattaac tttagctcat ggttcaattt 1920
tctggcaaca gttacagcac gagcagaaat ccttaacaaa caaaaataag caaaaccgcc 1980
accaccggtt ctaaccacta aaatgagtat ctcatttttt aaattagacc gtttgataga 2040
attgcataac tgtctaacta agcatttgaa accacatggg tgttctcggt ttcttgatct 2100
ctttctgagc attttgaaat tcaatcttaa aacattgtga ctgagagata ttacttggac 2160
aggagcaaaa gggatatttc cagagctggt tcatatggaa attggcgtat cttactcgag 2220
cccaggggcg gatctactaa gggagtagtg ggatctgacc ccattaaaat gaacaaatag 2280
tttgttttgt ataagaaata ctaaagaatc ttcagctcaa ttgttgttag ttctagttct 2340
gacctctata aattagggtt cagttcccta attgacactt tttcagtata tttttgcaga 2400
tttcttttct tatttagtga catctacagt ccacgtaaca tattattaag aagaatcaaa 2460
gcccatgtaa catttttaaa gcttattaca tttttatata gtgaaaacac tacttattct 2520
ttaaaaatac ggccactata atacactata accccggtaa aaacatttct agatccgcca 2580
ctcctcgagc cattagctag acaaacgagt tatatgtcgc tatcaactgg tttactactt 2640
tcgtctttgg ccgtgacatt ttccgtatct gattgtgttt gattccaagt gttttcttct 2700
tagtttactt tacacggcgt ggtttataca gaagcacaat aacataactc ctgagggtat 2760
ttaaagtttc tatttttatt gaattataaa atattagggg tgtgtgaggt ggtgtatttg 2820
ttgtatttta tgtattttat gtttgttatt attttttgtt atgaaaatgt ttgaaagtac 2880
agttttatat attttttgct atagttaatt gatgttatag gatgatatta tcttatacca 2940
atattttgaa tcccggtccg gatccgcggt tgaaccgata aatccagtaa tccgaatata 3000
attcggtttg agttttatga agaaaccatt atttaaaaac ccaataaaac tcggaactcg 3060
acaaccagtt gaatactggt caaaccaata agtaactttt atttattttt taaattcttt 3120
aattatgtta ttaaattttt ttatttaaat taaaaaatga gattttctga ttttacttat 3180
tttttttctg ctgccggata tcgactatgt atctttttct cttttttttt tcgtacatct 3240
catttacact atttaatttg tgatttattt gttatttttt aagattttga tgaagatcca 3300
tgccatttga aaaaaataaa gtgaacgatg ataaggaaaa cctgaattag ttgttgtgat 3360
ttggtcggta ttagtttttt tggttatcga tattctatta ttatagttta atttttaact 3420
tttgtttttt tatttaaagt ttaactttac ctttcacatt taaatactat ggatttcaag 3480
tattaatatt tttttattag atgtcataac gtctaacttg ttaattgtaa aatagtctga 3540
attaaatttt gatgttttgt atgttaaatg aaataaaaat aagaaaattt aagtgttttc 3600
taaatattct taaaacataa atatgtatta tttttaatac ctaataagtt attatttaat 3660
aaatttaatt aatatattga actgcggttc gtccgcggtc catcgagtaa tccgatgatc 3720
cggtaaggtt cagtgtccgg tttcgggttt caaaacattg cttatacttt atacattatt 3780
tgtttgtatg aaaatgtgca gtatattttg tattgtattt aattaagatt ttactgctta 3840
tgatagatat tgttggagct taattggtgc ttacgtagtt atctaatata acgtaagaca 3900
agagattgac ccgcacgcca gtgcggatgc taatttttac ggttttataa atttttattc 3960
gttattttat aattagtgta agatgtgtcg tcgtataact aattgtattc aaaagatttg 4020
gactgaatct ggtaaaaaga ttatttatcg tacaattata gtaacccatt tcagatacat 4080
tggttattta gatattttta tgtttctaca catcagaatc aaaatcattt agacccggga 4140
tgatccaact caaacctcat acataaattt ataatatcca agtggcgcct aatttcaaaa 4200
tccaaaaaaa ttaatcccga aagaaacaac ttgtacctca atgagtattc gaatgtccat 4260
acttaactga ttctgcaaat aaattaaaaa gaaaactctt tttatatatt aggcaaaaat 4320
aagaaaaata gaaagaattt tttatttagg aaaatagtta tatgaagtga aacattaagt 4380
gacaataaat gtaatacttt ttaattattt tgatttaaaa ttattatttt gtttacataa 4440
actatgtctc gaaactgaga attttgactc ctgatacatg taatatttgt ctatttcttt 4500
ttttttggtc atattggcta acaactttgc tgcaacaaaa ggcaagcaaa aacacaaaga 4560
tagaatcaat cattatacat aaacaactaa cattgcagag acgtcctcgt atatcgacaa 4620
cactaggctt aagcagtgga atgacgccat ggaaaacaaa gaacacaatc aatgatctaa 4680
tgcttgtgat tggttccaca actagtgcag aaataacaat cttaacactg gctacaatag 4740
cagaggcgat gtaacaccaa aatgccgagc ttttaaacag tacagagagt aaatcatctg 4800
tagagcaatc ttccaaccca aaggctgagc ttgcaataca tgagcagcaa cgatacaaaa 4860
gccatgataa taggaaagtt gaagttggtt caaaagaatg ttaataatca agtctgaaac 4920
cacaaccaag ctaaaaatct acaatttaac attgagtact ccattctaga ggaagttaaa 4980
aagatctgaa accaagaagt gatagacaac agacactcta taacagagta gaatgtagta 5040
attaataagc aaagaacact ctttagcaga gtagaggaag gactctaaaa catgtttgtt 5100
aatagacata aaatttatat tttgctttag attaatacac atattgatca ggcctgagta 5160
tgcatgtgag caaatgcata ttaatttatt atcctctgtt atagagtagt tgtaaatgtt 5220
aaaaagaaat tatgatggta attatttatt aaaaaaagat ctagtttttt ttataattct 5280
gattaaataa ttcatttagg ctccaaatgt ttccaaccgc tccgtcccac accgcactta 5340
acagtaacaa aaatctctac atatattata tatctatacg tttttataac tgatataacc 5400
gcacctcagt tgtaccgctt gtcccgcacc gcttaatccg ctgttaccat tcggagcctt 5460
agttagacca tatagttttg tattttcttg tgaatgtaca catatatagt acatactaca 5520
taatgtctag aattagattt attggggttt ttaggtaata aaccataaaa tcttttttag 5580
tacgtttaat acagaatcat aatgcaaaag aatgatattt taagaaaagg caatgtcatg 5640
tacagttagc gaaaggataa gagagggaac aaagtgaact gagaagatta agatataata 5700
atggacaagt gacattgtcg tggctatgtc tttaaaactc atatatggtc tctctttgtt 5760
tggctttatg tccgattccg atttcttatc tacgttcaca tgcataacta ataatagtct 5820
tcataaatat cttctccttt cctcattata atttttttta aatacaaaat cgaatttatt 5880
gggagaatat ttcgtttaga tccgatatct tttctaatta tttatggaac aaacgttatt 5940
ttatattaac tcaaatccac tatatgaatt atgtatgtaa gaacaaatat gaaaggtgag 6000
gatgaatata attaaagact tgatgctaag tttggttaaa caaaactaag tgatggtggt 6060
ttagggggcg actggttttc tcgttaccac ccgcaaacgc agcttttgcg attggtcgcg 6120
gttgtcggcg atttgtaaca attactcaaa tcgctctaaa ccgcttcaaa ccgttccgaa 6180
tctcataaat tcaaaagctg gctccagcta gcatttgcgg ttgcgaacgg ttgcgggagg 6240
gtgaattttt ttttcttttt ttaaaacaat atatatacaa aagtaaaaat gtttaataaa 6300
aaatttaaaa tttaaaattg acattatgaa aatattaaaa tatatctatt atattttaat 6360
taaaataata aaattttata ataaaaacaa tttcaataaa ttttcgaaaa ttaaaattat 6420
aactttctaa atataaattt tatatttatt ataattttat gatttttgat atttttataa 6480
ttatattaaa tgtaaatatt gttaatttat tatttgattg ttaccgcatt tggtagttaa 6540
ccagtcataa gtcacccgca aacgcaccaa tttttaaccg cagtacgagt cgtacaaatc 6600
tcttaaaacc gctagaaacc gcaaccgccc gcatccacaa actcctgcaa ccgcaaccgc 6660
tacgtttgaa ccagtcaggc ccttagtgat aaaaatgaag atgcagaatg ctgagatgat 6720
atgtatcagt tcgcgaagta ctagaggagg tactacaggc gtgtgtcatg aagatggagc 6780
ttaatgtgag tttgggtttt gtgatgtgcg tgggcttgct gagcttggaa aaggaaagat 6840
gatatgtgtt taaagacata tggacgtttt ccataatgca aaagggagtt tgcttgaaga 6900
tgaagttttc cattaatgaa aatggaaagt taccttaagt gtatttggaa gacttgagga 6960
gcaagttaag gacgtggaag gcaagttctg gtctactata taaggaggga cgtgccttct 7020
gagaaagcta gacctgagag aataaagaga gagaggtttc cttggtgtgt gttactgctt 7080
ggtgtcgaag gacattctga agcattgtct gatggagtcc gatgtggact tagtttggtg 7140
gcgttggagt tggcgccttg tgtggtggag ttagccattg tgtatagctc gtgtgagctt 7200
tgtgtgtgct tgggtgatca agcgttttgg tgtcactggt gtgcgttggg tgctgacgta 7260
cttggtgaag tacttccgag aagtgaaaga tcgaagcata gactcagggg gagtttagta 7320
gaggcggttt cattgaagag atcagtggag attgcagctg tagaagacag tgtgctccga 7380
tgcatcggat ggtgatctat gcatgcgtgc ttgattccta atctttgtag attgcctact 7440
tagaaaagag tggtagacac tagtgtgtgt gtgtgtgtgt gttgtatcat atagcaattg 7500
taggttgctc cttgttctaa gtcaatgaaa tctggacgag gtcccgagga tgtaggaaac 7560
gaaccccgtt aacaaacttt gtgtgtttta ctttctgcac ttgtttattg tcgcctcatc 7620
tgcactaaca attggtatca gagcgggtca cctaagttac tggtgagatc atggatgatg 7680
aggacgaaac ttgttcagaa agtaggacaa agtttgattg aagatcgttg aagatggcgt 7740
gatgggattt cttcctaggt ttggaaggtg atgatcttcg agttggtttt tgaccatgat 7800
gtgattcata gggggagatg gaagacgtgg ttttcaagtc ggttatgatg agtgcacatg 7860
catagtcaaa aagagggaga ttgaagatgc agtatgctga gatgatctgt atcagttcgc 7920
gaagtactac aggcgtgtgt catgaagatg gagcttaatg tgagtttggg ttttgtgatg 7980
tgtgtgggct tcctgagctt ggaaaatgaa agatgatatg tgcttgaaga catagggacg 8040
ttttccataa agcaaaagag agtttgcttg aagatgaagt tttccattga tgaaaattga 8100
aagttacctt aagtgtattt ggaagacttg aaaagcaagt taaagacgtg gagagcaagt 8160
tctggtctgc tatataaaga gggaaatgtc ttctgagaaa gctaaacctc agagaataaa 8220
gagagagagg tttccttggt gtgtgttact gcttggtgtc gaaggacatt ctgaagcatt 8280
gtctgataga gtccgatgtg gacttagttt ggtggcgttg gagttggcgc tttgtgtcgt 8340
ggagttagcc attgtgtata gctcgtgtga gctttgtgtg tgcttgggtg atcaagcgtt 8400
ttggtgtcac tgatgtgcgt tgggtgctga cgtacttggt gaagtatttc cgagaagtgg 8460
aagattaaag tctagactca gggggagttt agcagaggcg atttcattga agagatctgt 8520
ggagattgca gctgtagaag acagtgtgct ccgatgcgtc ggatagtgat ctatgcatgc 8580
gtgcttgatt cctaatcttt gtagattgct acttacacta atgtgtgtgt gttgtatcat 8640
atatcaattg tagattgctc cttattctaa gtcaataaaa tctggacgag gtcccgggaa 8700
tatagaaaat gaaccccgtt aacaaatttt gtgtatttta ctttctgcac ttgtttattg 8760
tcgcctcatc tctactaaca aaatatacct tacaacatga tgctactgac tcagttttcc 8820
tccaggtttg atttttataa aactctttca cacctcttat gggcaagttg aaatggggtt 8880
atatttcaaa ttcataaaaa aatttattac tcatggttac tctcaccttg aaaaaaataa 8940
taattgaatt gtgttaaaat ccaaatcaca gaatatatat atatatatat atgtatatat 9000
atgtaagaac ttatttttca gcaaaacaaa atttgatttc aagattccac ctcatgatat 9060
taacagagaa aacattacct cttatttaac tggttgatat tttatacgag tatggaagtt 9120
cctaaaagtg atcaaatgtg tgaaataaat atgccggcaa aaggcagaac tatgacttta 9180
gctttcagct ctgtttacct ttgcttatgt ttttccccaa ccaactaaga aacatttgtt 9240
tacttttgtg tgacattact cattaagtga ctgagaattt tctaactccg gcaaacaaaa 9300
tcatttctaa agaatgctgt attaaactaa agtgattgga cccactagtc aagttacttt 9360
taccgtgaac tactgtttca ctctattttg gcttcatgct tagtgttcta aaattatgtt 9420
tgagtgtcct aattaagaac aagagaacta attccacagc cggaaattcc aaactgaaac 9480
ctgttttctc aaatctccaa atctatgaag ccatatatgt aaatttcgta gtggcgaatc 9540
ggaatatgtg ttgctctatg gttgtagttg attttcgact tgatcacttt atttaatgac 9600
aagaacagca atgttttgtc ctaagaaaag gttgatgagc ctgacacaaa aagggaggaa 9660
gccaagaatt tgttggggtc gaacgaagtg tcatgctaca gaaaagaaat gtcatggttt 9720
aagggtccgc taattcatta gatagttcga tgtttttata tagtagagag acagtgcctc 9780
acacgtgcat gtacgtccca tctttttctt gtcctgtaag ccatcctttt aaacactatt 9840
gttaatccac aaacctaact tttaactatt taaatggttt tagttttcat ctagttatca 9900
agaagtaact taaaaacatc tccaaaaagt attctataac tttaaatatg aagttttttg 9960
cattccaaaa aataaatttc aaaactttaa atttgaagtt tcatatattt gtttgcattt 10020
tactccctac aattacacat cacatttaaa aattcttgtt tattgtttta atcttttaaa 10080
aaaatatctc ataaatattt tgactttttt ataaatttaa tttttacata taaaattaaa 10140
taaaacttta aaataagatt taaaatgttt taaaactaga tttaaacaac aacaatatac 10200
aaaagaaact taaaagaaaa ctttaaaatt acatgaagac ataactacta cacaaattta 10260
aatattacaa tagttatgta aatttgattc ggaacctcca aaatctttaa aatattgtcc 10320
aaacaaattt tgtttaacca aaaatggttg ttgttgtttt tgatgttttt cgtacgattt 10380
tttcttgttc agattgaatt tatgcacgag tattaacatc atcaatagaa gttaagtctt 10440
ttagcaatat tttatttttc tcttttacat ttttttagat ctaatgtatt tataatatta 10500
gtttcactag atttaaataa tttttagctc gtattctaca aattacaaat aaagatagtc 10560
atttttactt caaaatacac tagattatca tatatgcatt acaaaaataa ttttatagaa 10620
tattatggta ttttccttaa atattaatat taattatgtt atttctattt aaaattttac 10680
taattaatat tttgtaatac gtttatatat gtgttagtaa aagtttgatg aatttaaatt 10740
aataataaca aatatagtac tccaaagctc tattcatgca taacatggcg ggtggcaatc 10800
caaaaaatat tcacatcacg tatgttttca gtgttgacta tacgaggatt cactacaaaa 10860
aaaatagcca tattgttacg aatttttttg tcacaataaa gaataattcg taacaataaa 10920
aatattgtga ccagtttgtg acgttcttta aacggtgaca atatgatcgt cacaaatttt 10980
gttggtaaca aaaaacgtca ctctgtttat gacgatatat attgtaacta tttcgtcaca 11040
gatagcaact atttactaaa gtaagaaaaa cgttagaatt accaaccaca attaacatca 11100
caaaattgtc atattatgtg actgtctaca agtcttaatt tcgtctctag ttaccactaa 11160
aataaagttt caaaccgtcg caagaaaata cgaaaaaata attactaatc catcttcatc 11220
gtgacttttc gtggccttaa actttgtaac attttattac taaataattg tcactaattc 11280
atattacttt tttatatttc atcgctaatt tatcatcaaa cttctggctt aactaattat 11340
taatttgtca tctcaaaagt ttcaacattg atcactatat tattgatgat ttgtagttta 11400
aatacatagt aatgaaaaca ataccaaaat aaactgataa cataaataat aaaccacaat 11460
aaaagaatat tctaatatgc gatcagattc agtttagcga tctccagttg tgactcatga 11520
taaaaggctt cttgattttt agcatcggtt gattcttgca cacgaagcga aaggtacgac 11580
tgctaacttg tattctttaa agtgaccacc ttgtaactgg cttcttcttc catgatttta 11640
ttaccaatgg ctcagatctg cttcacctct gctgtcttta agcttaagat ctactctcta 11700
ttgaactctc cttaatgtcc cagatacgca taccaccaca gcgccagaaa cgactgttgg 11760
tgacaacacc gtcaacacaa atctctcacg cttttccatt tttacgctct cgctcttcct 11820
aaggtgcctc tgcggctttt cttttggagg aaatatatac actttttatt tagggtttct 11880
aggctaatgg gctctaagcc tctacttatt agtctaaggg ttccggctta aaatagagat 11940
acggtggatt cagattaaag tatttttacc tatattacga tccatcttca atagaaatag 12000
ttgatatttt ctattgttta tcatttttac atataaatat aatcttctat ctaatacaaa 12060
ctatatatgt attgtttttt ctttaaactg atttacataa ataataaaat tttagtttat 12120
acataattta aaacttatca taaaatgata tataaaacat ccatattttc aattagtatg 12180
agaaaaagta ctttttgaaa tccttcacgt ttatacatag gggcatataa atcgactata 12240
taaacattgc taaatcaatt tctaaatatt tcatggattt cttacatctt tgagtagaag 12300
tttattacaa aaaaaatttc atctacgata tgtaccagtt agaaactatt attttgttat 12360
tataccgtca caaagtaaaa ctaacttttc catcacaagt tcgtaattag tgtgacgaga 12420
catacagtca taatatggta acagatgtta accaattgtt aatttgtcac aattttgtca 12480
ttgattgcga caaaacttag ataccatttg aatcatcaca atattgtgtc aaaaaagcta 12540
ctcatctgtg acacaaaaat ttggtcacca taacgtatct aaaatgtcat aaatttgtga 12600
caaatatttt tttgtatcaa aatttagtca caatataatc attttctcgt agtgattgga 12660
ctgaaatgca taagacacta aacctttcgg agatgcgtgg attggggctt atttgccaaa 12720
taaccaaaac agaggtaatt agatctgtag tgagaagtta gagagatata gaaagagaat 12780
tgaagagaaa gaggatgttt ttggttagat agtgtatttg tgtttttgta tctttagagg 12840
ggcaaatttc ctttggttaa ttccggatat gtatcactat cagtccactt ctttaacatg 12900
ttttttttta acatgttaat tttcagctgt ggtggatcat gtactaatct tctcacatac 12960
aataaacaaa ttggtaaact agacatagag gatcattagt attaagatgt cttatagtaa 13020
aataaagaca attttataag agttagatat tagtagttat gagaagtata taattaattt 13080
atgacggttc ggattggcac gagttcatca caaataaata aaaagctatc agtttattat 13140
gggattagat aacatagtct tgaaggctat gaactcgaac attctttaac tatggtccac 13200
tacaaggcct gagtaaagta ttctctacgg ttcatgcaag actagcttgc gcaacttgat 13260
tgtggtccag gatccttttt tgcttgtagt ggacctattg gtgactcaaa atgtgtttgt 13320
caggttcatg cagtacaata aatcttttta tttttcaagc aagggtcatg gactatatta 13380
ttgtgctttg ttactatgca tgagccacgt gaatgcatca atattgatag ggccgtttct 13440
ttttttttct tttttttttc gagcaacaag ggctgttctt atatatacaa aataagcatt 13500
agtgttgaaa atcccactca tgagtgattt aatggtagat ggattttggg aaactaaaca 13560
atccagattc gaatcaaccc cacgatatta aacagtgtag tcacgcagat atgaaactat 13620
tatttgagtc ccatttgaat attcagaaaa aaaattcata tttagaccat gtatctccac 13680
ttgagagact agtttgagtt tttctatagg tttgggatac tctcaagtta atcaacaaaa 13740
ctccaaatat tttagttata taaagtatat aatctcaaat cattaaaaca aaattttata 13800
tttagcctct aatattaaat gtgaaaatgt atatttgggt taggttgtga atggttaatg 13860
gccctttcat ttttttccca gctggacgat ccatttctta cgggttttgt ggtctaaata 13920
aaaatgataa tgtatgtctg catgcacgcc gatggaacat gtaattctta tccgtgtaat 13980
ggtggcctct atagcactta tatgataaag aaaaattaaa ggtgaattcg aatacttcca 14040
tgttgcaaat ttatgctaat attttcgaat acattttcca tccgactgag agaaaaagtg 14100
ttgtggggtt gggttacaaa caaatgcgag gtaggtgcat gttcgataca cgaaaagaca 14160
tcattattta cgacgtgttc tataccccgt ccattccctc aacacttgta ttgtttaaat 14220
caagttaaga attgtatttt tatgattttt actatgatta gttggaaatc caaaataatt 14280
cattaaagat gagaaattag taacgattag ctttcactaa tccatttttt ctttataacc 14340
ccacacgttg agttatttcg gtctaatacg taagcttcat atgttgtcct ttgaaaattt 14400
agaaaaccta cggatgcata ttctctcggc cccactcttt gtttttttgg taattagctt 14460
aatgataaat ggtttttaag aaaactaggt gactgatctg caccctgtgc ggacataaga 14520
acatgatcgg cccgcaccat gtgttctctt tcggtctgca cctcacgaga gggaacacag 14580
taacgtcagt atgaagaggt agatattgtg tgtatgtata attgcaacgc cacaaaatat 14640
tttgtgtgtt tacgaagata ttttcattca aaaaatgaaa taaatagtgt atagttttag 14700
aaataacata ttttatatta ttattaatta gaattgtatt gtatatgtgt cgtaactctt 14760
tattttaggt gaataatatt atttttccat aaataataaa caaacattta tgtagacata 14820
ttaaaagaaa atataataaa aatcaaaata ttatccataa ataatataaa ttatgaagta 14880
tatttctcga taaagaaagc aaattcaatt agaaacctgc aaaaattaaa taaattttgt 14940
aagcaattgg acgggttaac attatttgat agatttataa atttttaaat tttattgaac 15000
atgaaataat attaaattga cataccgtca tcggtctcct aactcatcac aacccatcta 15060
acaaatacaa aaaataaata attgtaacag tttatatatt ttaaaatttg tatttgaaaa 15120
aaaagtagat taaatttacg taccgtaact acgaaatatt ctgaaaaact tgtttgtaga 15180
caacattcaa tgtttttgtc tgtggcttcc cttctttacc agttattagg atttttaatc 15240
cagatctcga cttaactctt gaaagtgcaa ctttgccttg cattttgtaa gcattttata 15300
aattatgata aattatgata aatttattct ttaaacaacg ataaataatt taaaaataat 15360
attaataaac atttttggat tttgtaatat tgaaaatagt tattatataa ttatattcga 15420
acacaattca tcaagtagag tataaaacta ttataattat cttatataaa atttcgttca 15480
ttgtatttta tagtttataa atattaaaac aaataaatgg tagagtatgt aacacctgtt 15540
ttctaccagc gtgagttaga acaccgccgt atttaagaat cataagggcc tctacaggtc 15600
tttcttcttc gccttcacca tcccacttta gcggcttcag ttaaaccttc ttgtatatcc 15660
ctgagaaatt tcctccctgc gccattccaa aaggttctct gctgtgagaa aatgacctca 15720
tgaattaaat aaaaaatgca taatgctagc ttacttataa gatagtatat tcaacaaaaa 15780
aatgatataa gatagtatta cttgtcccct ggtcacattt atgtattata tacatagatc 15840
ctttgatcct tcctgtatat tcaacacaaa ctcttcacca actcaagcat gaattcttgt 15900
cctctggtca caaaaattat aagagtttta taaacgcaga ataagtatat aaacaatgct 15960
tctaaaaaat gtattttgtg tgatgtatac ttacttcttt atcaacaacc accatttcaa 16020
tggtgtttcc tgattctttg ttatagttta tccacaagcg aacaatccta atttcttttt 16080
ttttgacgct gatttattaa gatattacaa ttacgatatg agaaagatta catagacgat 16140
tcggcaaccg gcaatactac ctgccttatg aagacctacg cctaactgca tcacctgagc 16200
cgtcctatga aaatccacgc ctggccagat ttatttgcac catgttgaag atcccttgta 16260
tgtctttctt ctgtagtctg cataattctt taataaactg ctctctccgg gacttgaaac 16320
ctggatttct tgtaatctgc aataaattgc atagtctgag attcgaaccc cagacctggg 16380
tgtagaagcc tttaaacctt aaccagtagg ctagggtgct tccacaacaa tcctaacttc 16440
aatacgcgac gtatctttac ggggttttaa ttctctcaca taagaaacaa tatttttttt 16500
tgctcgcacc attgccattg ttcttgtaag agctgaatgt ttgtaattta agcattcggg 16560
tttctcatat atatattaag ccgatttatt tatcatatta atgaccccta ataaatatta 16620
aaatcgttta aagaaagata ttaattgtgt attgtcataa attgatttgc atatgatatg 16680
attttaactt gcgcaagtaa tgtaataaat atgataacaa ccggcgcaag caattgattc 16740
gaataataag gaaagttatt aatatgcaaa ttagttaaca atcttgcgca agttatctaa 16800
ttattatccc caaatcgaat aaatatatgg gcttaacatc taccgacaat atatttgggt 16860
ttttctaaac aggctattca catttttctc ataaataaga agaccaaact tgaaaatccg 16920
aaaaccaaca gaccggaaac cgcaaggaat gaaactgact gactaaatta gtaatgtgaa 16980
gctctaaatc atgctgcaat tagtgatgca acagactatc gcaattagta atgtgaagct 17040
caaaatcgtg ctaatgaaac aaaaaccaaa cttgaaaatg tcaagagagg actgtctaaa 17100
tgcttgttga gttattaagg agaagataat cttacagtcc ttcttcagag actgaagtcg 17160
aattgccgat tgttgtaaat gtcagttgtc tcttcttgtt ccatcagtag acagtccgca 17220
aaatacatct ctggtcgtgg caatggtctt gtttaagaga atcaagaact caacaacaag 17280
aagattaatc agtcaattag atacaaagat tcaaagtgtt aataagcaaa tcgtagttta 17340
tagcttaaca tatgtcgaat ctaatcagtg aaatccaaaa atctttgtat catagcttaa 17400
aagtcgaatc caatcagaga aaccgaaaaa tcttcgcatt atagcttaaa agtcgaatcc 17460
aatcagagaa accaaaaaaa ctataaattc cgagagtatc gacaaacttc acctcgtctg 17520
gttgtcgctt caattgtttt catcggtttg aaaccatatc tcccttcaat tgatacgcga 17580
ttgaaaaaaa aaaaaaaaaa aaacttcatg acatacgacg gtgttttcaa atccgtggag 17640
gggagtgaaa aaaataaatg aaaaagaaaa attccaaaaa atcagccaat agaattataa 17700
ggattttccc gagaagctct atatgagtgc cacgtcagca gaaatcacta aagtgacttc 17760
tcttttaatt tttaggagga taattctcta gcttgggtaa aatcgtggat atctacgaaa 17820
tgattccttt ctacgtacac gacttttcat caaatacgaa tggttagtac aattaatagt 17880
ccatccgttc ctaaaagatc tatgttttag aattttcaca ctttttaata aaacactagg 17940
ataagacctg cgccttgcgc agggtgaatt tatttatata tattatcgat aattttttta 18000
tatattggat cattttattt atacttatat aatgtttttt tgttgttatt atataatttt 18060
tttccgatga ccggatcaat ttttattaaa aattatggaa ctaaactata aataataaat 18120
catgggttga tcggattgga cattaagcaa attatgacac aaaaatttta ttttttccac 18180
cgaacacatt cttgaaaaaa ttcaacagta ttattttcac agttgaatta ttttgacatt 18240
tatcttccat atggttttga aaggtctcag atcaaccatc gaattgatac atgtcatttt 18300
aatgttttta atcgtattct taagggaaaa ctaacatttt tgtaatttaa agtggtttta 18360
aaaaattcaa aatataacat ataagaaaaa aatctaatat ataagaaaag tataacatat 18420
aaggtttact catttttgta atataaagtc gttttacgaa tttaaaatat aacatataat 18480
gtctcctcat ttttgtaatt taaagtcatt ttagaaaatt caaaatataa catatgagaa 18540
aaaaaatcta actttttatt atatggttaa tgtcactgtt tattgttttt taataatata 18600
aatttaaaca aaaattcaga aggatgtaaa aattgttatc aaatctttat tattcataat 18660
cattaattat catatttatg ttaatcacat taggtaattt cgtagttttt atttaaggaa 18720
ataatacact cttcttatat tttagattaa tataatgttt tctagtaatt aaattttgaa 18780
ccaacatttt ttcaatattg atttttaagc tgtcacgtaa gttaaattat tatcctaatt 18840
aaatgacacc gaatcagagt cttttttaat tagtacaaac ttagagttat aatttttaaa 18900
tgattttcaa ttaatatacg tacatgagaa actaaaacag cttgttatat aactaccgag 18960
atatttgatc ggattagcat aagcaatatt taatagcctt ggccgcaaat tctcaattga 19020
tacgccctca catataagct ctatatatta tttagtttcc attagttcct taggcttaat 19080
taatagtctt ggctataaag tctcccacta cgatgaattt ccataggtta atgtgttagt 19140
ttataaaata tattaataat atattgcctt ggccacaaag acttaacaaa catattttat 19200
ggatctcaca cgattattaa tatttccatg ggcagctttt ccttgaagaa aaatgagaaa 19260
taaaaaaaat tgattaaatt cgtttaacat aaataccaaa actggtaatg attgatttaa 19320
cataacccta aattagtttg tgatatgaac cggttaaatt gtagagcagt actttttgaa 19380
tcacatgaaa ctcaaaagta atctgccgtt tttatatacc tcacttacag taataattac 19440
atgattttag aacaaaaatt ctctagaacc aactgaagaa ggactcccca accattgttt 19500
tacaaaaaaa aggacccccc aaccattcat gcaaacagac atagttatga ccctttaaac 19560
aatatcatag tacagattat aaagtttttt atcaagtgac tgaatttttc tggtaaacca 19620
cgtttgctac atatacaata taattaataa agtggatatg agaaaatcag gaagattaac 19680
tgaaacttgt gtagcatagt tctattacag tggtgaatgt tcttattaat caaggtagat 19740
aatattaact gacgataatg ttctaacgat aatgttcctg tcaataattt ttgtaagtga 19800
tgtaggtctg tttattttcg tacataatgc atagaaaatt acatgttcta ttttctacaa 19860
acttgaagta aaatgagaac atttaatatt tattccctat aaaatgtatt cgtagacgtt 19920
attacatagt tatgcttaca tgataagaaa aacatacaca ataaataata ctgatggatt 19980
acactatggt tttacatagc ataggcgcac ctgccgtctt atttttagac tatgtatatg 20040
tgactgtcaa aaattgtatt tcgctaggga gttaatttat aaactatgct atttcttaat 20100
gtgttataat tctgacacgt cagattttag aaggcttaaa caactgccac ataggatggg 20160
gtcttttttt aatttttaca aaattcaggt tataactttt taaaagatcc tcaattaata 20220
tataggggat attaagactt agttataaat acatagtttt ttttgtaatt ttatatttta 20280
tatattttta aactaataag attctaaaaa ataaaattaa tgttcttgaa ctttacaatt 20340
tctcactatt gttgacaaaa ttacattgaa aatataaaat atgtatattt ttaaagcaaa 20400
agttttctat agaatatgaa tcttttagaa acggaaagag tataagatat gtcaacacgt 20460
caagacgtgt atgataattg ataagtacat ttactcgtag ttaattaggg aaaatatgaa 20520
actacatatc atatatacat aacattatta aaatagaata aaactgtaat catatggagg 20580
tggttcagtg gtaaacggac ttcagaaaac ataaatttga ataaattcgt gtggtcaaac 20640
agatatgaaa ctatatctta aacttcattc taatatctag aaagacagtc catctatagg 20700
ttttaccttc atgtttatag caaaaaaaaa gagaatgaaa aatgtcaaaa aaacatcata 20760
aaaatgtcat tataacctaa gaaatcgtaa tatcattttc atctcgctat caattcaatt 20820
caacctaagt cataactgta tcaactaatg tgtatatata tattgtctcc ttcaaataaa 20880
gctcgaaata tgtaacgatt tattcgttaa ttgtttaaag ttcatactta aaacaaagtg 20940
gcccttcgga aatcacgagg aaatcgaagg atgttctcca ccatgtgcgt atgctaaata 21000
acaaacacat acttcttttt acattttagg atttattctt aaactattat tctgatatct 21060
aaacacacat atataaatag tagaaatggt acatagcaag tcgcctacat tagtttctta 21120
ttcttgaaga gcttcattcg tgaggaaaat taactatagt tctctaagtt tggcaatctt 21180
tgatgtgaaa aaaactatgg aaaaattccc tctaattagc accagtccca cgtttcacac 21240
cttcattaag agaaaattgt aatgtgcact caattaattc catagtttat aggaaaatat 21300
gatagtcttt taagccgggc tacaactaga cgcttgtgga tgtgagcaat ctaagttaga 21360
tattacccgg cagatactat gacttacaaa gtacatccta tgtttctaat tacttgtaaa 21420
cggtgcgctt taggttgcca actctggtca tagagtgtca caaccatgtg aaaatgtttt 21480
atccaaataa agaaaagttg ttacaagtaa ttttaatgag taactagatc tcgatccgcg 21540
cacatgtgct gatttttatt ttcatttctt tttatataaa tattttgttt taaattctaa 21600
attagtatat attataatat atatgtgtct atcaattttt aaaacataat aagtttacgg 21660
tatatttttt cattgaataa tttgtttcaa actttcacat atatttgtat ctttttctat 21720
atatattttc gaataattat tttattatta aactcgtaac tatatatata aagattacta 21780
aaatattatt ttattgtcat attcaaagat attgtaacat ttcacaaatt tagaaagttt 21840
ttaaaaaatt aaactttttc gtttcataga tttatattat cgagtaaata attaaacatt 21900
tagtttttgt tttaattttt aaaataaact atatagtttg aaatttgttt tcattggttt 21960
aaggtagtaa atattaatca ttgttagata atatgatttt tgttatttaa attttttttt 22020
ataattttaa aaattaacat cgacaaatat ttaattattt aacatatgga ggtatagtat 22080
tataatatta aattatatct attttattta tactatatat aaatccaatg gatcatctat 22140
tgtttaaatt caattattga tagttcaata aaattttctg gtaggcctaa aattttaata 22200
ataagattat agattaaatg taatatgact tttttagaat aaattcatta ggtccatttt 22260
ttaaaaaatt acacatgaat cgaagttgtg acttatgttt taatatatat ataagattgc 22320
atatagtccg aacgtactta atgcaactaa gtccaatata tatacaatta tattaagtcg 22380
ttgatgattg aatcgcaaag gcgtgttgga aaacaatcga agagagaaga agaggtatgt 22440
tcaaaaaaaa gaaaagaaga agaggtagat gaaaccctca attttaaaat tcaatggggt 22500
gattaggtta gaagtaaaat aaaaaaaaat tgtgtagaat ttagtttgta tgattttttt 22560
atttaactgt aaggaaagta ttttaaaatt ttattgctgt agcattattt tttctacagc 22620
taaaaattgt tgttttagaa aatatagttt ttttacatct atttttaatc ttcctgttgt 22680
agttttcaga actattctaa agcataattg ataattttaa aggttataga taaaaattaa 22740
aactaaaaac agctactata acacaatcca ccaccccaag tctccaccac tagccacatt 22800
aaatgaattg attttagttc attcaccatt tataatctta ttatatattc ttaataaaat 22860
acaaaatata tatattagaa atgatgctat tttttttttg taactggaga aatgatgcta 22920
tttttaatca accatttaac ccacttgacc cacacaatga atttgttctg tttttgtgtt 22980
gttatttccg gataaagtga attagttcca tccaactgat tcttctacgt atgataggtt 23040
tctaagcatc taactagtat gcagtattat attacgtgat gaatgaaaaa caaaaaacca 23100
ccaactacgt tatgccaaaa atagaacttt tttttccgcg gggggggggg gagaggggta 23160
acaaatacaa aaaaaaaaag ttattcttgg gttcaccccc tagagtgaac ttctaggttc 23220
accaaccaat atgattttat tatttcaaat tcgatatttg ttaaaaaagg aaataaaata 23280
ttgtcaagtt atattatgct tttaaaataa aaaggtaaaa aaaaatagtt acaaaaaaaa 23340
gaagttttta aaaaaaatac tgttaacgtc gccagcaaaa cactaaactc taaatcctaa 23400
tccctaaacc ctaaatctga aaccctaaac ctttgggtaa accctaaacc cttgggtaaa 23460
ccctaaatcc ttggataaat cataaattct aaatcaaaaa cactaaacac taaaatccta 23520
aacccttgag tgttttagtg tttagtgttt ttgatttaga gtttatgatt tatccaaggg 23580
tttagggttt cagatttagg gtttaggaat taggatttag ggtttacttt tttcctgacg 23640
acgttaaaaa tatttttttg taattactac tatttttatt ttttattttt tatcttttta 23700
ttttaaaaac ataatataac ttgacaatat tttgtttctt tttttaaaag atattgaatc 23760
tgaaataatg aaattctatt ggttggtgaa cctagaaatt caccctaggg agtgaaccca 23820
agaataagtc aaaataaaat cgctattaaa gcaagacatc ttccaaaaat ataaaaaaaa 23880
taaaaaaaac caaagtcatc tcaaataaat aaaaccgctg gatacatgtt tagtaagtca 23940
aacaaatcat agtgatgtgg caactgtttt ttcctcaact ttcctcaatt taatttgcta 24000
gcaatttcta ctcaattcaa ttctaagcta ctacccatta actacttcat ttttttttta 24060
gattttctta tttattggga agttttatta atcactttta tgatgaacta attccttata 24120
tattatttga gaaaattaca atatttaaaa cgtgtagtgt atggttctca gattacctaa 24180
agaaataaat tggtcaatct aaatatacac ggtagttctc attaaattaa ctaaaaaact 24240
aattactaat gtaccaaaag aaattattat ttagtttctt aaataaaagc tacaaaatta 24300
ttaaatgtga tcaatatata tacatgacaa ctagtgattt tgaataataa aaaattgata 24360
acaatttgtg tttcttctat attttgtttt atatttttaa aataaattaa ataatcatat 24420
taatcataga ataaaatttt aaattttttc ttatatgcga tactttgatt ttttttaaac 24480
aactataaat tattaaaact gtaaaaaata ttacattaaa aattttgtga gtaatggctt 24540
aaattttttg ttatacaata tataaatata caaatgatca taaaatcata tgaataaaat 24600
atcttattta atagattttc atattaaaaa tatgttttta ctatcgttta aattaaacta 24660
tataccatat aagaacataa tagtttaatt tgaaatttgc attgaagaaa tattgagaac 24720
ttaatattct aattttatat tttgtattaa atttttaaaa acaattataa attactaaaa 24780
ctattaaaag tatcccattg agaattttat tttcaatatt ttaaaaaata cgaattgtca 24840
taaaactata taactataaa gcattattta acagatattt taaaatatac ttctatatat 24900
taatattatt taaatttaat tatataccat agatataatt gaatttttag attttttata 24960
tcaaaattat tttaagtaaa aagagtgttt gttttgattt atgtgttcgc gtcaacttaa 25020
ttatatacat aatagttata gacttttcag tttattattt tattatttca tgtaaaaacg 25080
taaaataaat aataatttat atacacaatg tccatcccgc acatataaaa ataattcatg 25140
ttgatcttag cctagtcaat aaataatcga caaaatttta gggaacaaaa tatatatgct 25200
agaggatcgt tatgtttgtc ttccattcca ctgcatctac atatggcatt tgattctaga 25260
gtaagaaaca caaataaatt tatttggtac aatccttccg tccaaggaaa atctaaaaat 25320
ataaaagaca tcttagtgaa gttatagatt atggtagcat tctatttata cccaagttta 25380
aatatgattg tcgtataacg tattgaatag caaatatctt cgaatctcat atatatgaaa 25440
ttagtgtaaa ttttaaacgt aaacaattta tacgaccaca gttcgaaaat aaaaacaatt 25500
tatacgacca gaaatggcaa aatgttgttc ttagcatttt tttttttaac tttacttttg 25560
cgtaaaacac atttctccaa tttggtttca ttgcgttgaa cgacgtaaca aagtaataca 25620
cctaaccctt ttttttggaa cattatacac ccaacccatt gtacaaaagt tacagctaaa 25680
ttaccctttt tattcttttg ataaataaaa aataaattat taatcattaa aaaataattt 25740
ggagtatttt ctcaatgtcc atatatacat cttctccctt tatataagcc aacctcacac 25800
acccaaaaaa tccatcaaac ctttcttcac cacatttcac tgaaaggcca cacatctaga 25860
gagagaaact tcgtccaaat ctctctctcc agcaatggtt gttgctatgg accagcgcag 25920
caatgttaac ggagattccg gtgcccggaa ggaagaaggg tttgatccaa gcgaacaacc 25980
accgtttaag atcggagata tcagggcggc gattcctaag cattgttggg tgaagagtcc 26040
tttgagatct atgagctacg tcgccagaga cattttcgcc gtcgcggctc tggccatggc 26100
cgccgtgtat tttgatagct ggttcctctg gccactctac tgggttgccc aaggaaccct 26160
tttctgggcc atcttcgttc ttggccacga ctggtaaatt aaattttctg ttttaattat 26220
tttgactctt tttgttcaat ttattaattt cttgaatgca cgttcgatga gtatcgtcgt 26280
cactgacttc aagatttaat tcttttgagg ttaccttttc atgttcaatt attaaaaaat 26340
aaaataaaat ataggatcta agattttttt cttcatcagt tcaagcatca tcactcatca 26400
gtcgtaagac tcgtaacaaa atatcttctt ttctataatt aatattattt ccgcatttaa 26460
tggatctacg ttttgatgtt ctcaaatttt gtttctcttt ctctagatcc ccggaacttt 26520
taattataat tatagtatag tataatatca agaaaatata ctgtttattt tttttggcaa 26580
caaatatatt actcttgttt ctttgacaag aaaaaaatat attgtttttt tcttcttttt 26640
gtgttccaat ctattttcga gatttagaca agtgacacgt catataccgg atttgttacc 26700
ttgttaaaga gtttgggtta aaacaaatgt agaaaagtta aaataaattg tgcaataaat 26760
gataaatacg tttttatgtt aaacaatgat gtgaaaataa aattgaataa tggcagtgga 26820
catgggagtt tttcagacat tcctctgctg aacagtgtgg ttggtcacat tcttcattca 26880
ttcatcctcg ttccttacca tggttggtaa gtcatttatt aactatttcc atgtaaacta 26940
ttagtacttg ttttcgtatt tcttacattt tcgtttgtca ttcttcttgg gtgcatgcta 27000
gcaaactgta atcagtatta actgggaact accaactgtt ttttttttgc tagagtagca 27060
attttataat taaataagaa tcctattaaa caatgcatgt gacaatatga ggttgctttt 27120
ctgttcaaaa caaatcttta gaagccaatg aaaaagaatc caaaactttt ttttaaatga 27180
tatgcgccta tctattggtc ctgactcctg agttttctta ctttcttaag tataattaga 27240
ttttgatttt tttttatagg ttttcactat tgttatttgt ttacatcagc ttcagatatc 27300
ttcgaaaaag atttacatgc atcaatttca tgaggattta tagtttttct tttacttatt 27360
tccgacacaa tgtttagtag taaaaagcat taaatgtttt tttgctcaaa aaaaaaagaa 27420
tgggattgtt agagcactct attgttagtt gttcaataaa tataccaact aaaaaaacaa 27480
aataaatata aaatgagtga gattgttaaa tcattataga gacaatttca ttttcacaaa 27540
aataaataaa tacataactt tttataattg gggtttgcag gagaataagc catcggacac 27600
accaccagaa ccatggccat gttgaaaacg acgagtcttg ggttccggta atctttccta 27660
ctctcgtagt ttctcttgtc ttttatttat ttgtttgttt ttcggaattt attcttatgt 27720
ctatgttctt aggattctat atgtttattt tattagttta tgttttcagt ctgaggtcag 27780
accgaccact tgtcagatct gttttctagc tgtagtaaaa aacaatttgc aagtgtaata 27840
gttcagcata attgatcttg ttagagcatt tccaaaacaa actttataat tttaaatata 27900
cagttttttg ttctctaaaa aagaatttaa aaattttaaa gtttgaggga cgaaacttca 27960
aatttgaact ttcactactc aacttcaaat ttgaaatttc atctttttta tttacatttt 28020
gatcattata attaattata cattacattt atgattctta agtattttct catttattgt 28080
tttaattctt aaatttttta tacatcataa atatttccaa tttgttttta taaattcaaa 28140
ttttacacaa aaaagtaata aaaattttaa ataagattta taatatttta aaactataat 28200
taggcaaaaa aaatattaca aaaaaatgta ataaaaactt taaaataaga tatatcaaga 28260
cataattatt agaaatttta aatattataa caatattaat aatctggtaa atttgctcca 28320
aaacctcaaa aatttctaaa ttattgtcca aacaaatttg tttaaccgaa tatggagcat 28380
tacaaaaata attttatgga atagtgtggt attttgcttg tagttaatat ttaattatgt 28440
atttctattt ataattttat atatttaatg taagattttt ttaattaata ttactgtaat 28500
atttttatat atgtactagt tatttataaa agttttatag atttgtatta gttataacaa 28560
aaataaggat cattgtgtaa aatacaaata attttgaaat tacgtttaaa gttttggtta 28620
tgaaaaaaat actttgaaac tttaaattta gagttttgca aactttaaaa tgttagatag 28680
atagtttttt tggagatgca tttagtggtt atggtagtaa ctcagaaaat gaaaaatcta 28740
tacttttata ctccctccgt tttttaatat aagtcgtttt acagttatac acgtagatta 28800
agaaaaccat taatttctta tattttctag acaaaaacat cattaattat ttacctaacc 28860
acaattcaac caatataaaa atagaagata tattaccatt ggtcatacaa cattaattat 28920
taataaattt tacatagaaa accgaaaacg acatataatt tggaacaaaa aaatttctct 28980
aaaacgactt atattaaaaa acggagggag tagtacctaa ctttaacgat ggaccactta 29040
tattcgagtc cttagcataa aatgattctc ctcgaaatcc gtttactttc ttcattattt 29100
tttccttttc agttttggcg ttttcgtaat acttttgtct tcaatcttga aagctattag 29160
tataaaaact tataaacaca tcacatgcaa tgaattaata cgaatacata accagaatga 29220
caaattttca atgaatattt aataccagta agtactactc cgtaatagta atagtaatag 29280
tcatattaat ttttttttgt catcaaacaa acagtaatag taatattaat tataattatg 29340
tatttcagtt gccagaaaag ttgtacaaga acttgcccca tagtactcgg atgctcagat 29400
acactgttcc tctgcccatg ctcgcttacc cgatctatct ggtaaaaaaa aatacaattt 29460
caattttttt cttaaaatta caaatggttt tatattttga gttttaagcc aatatataaa 29520
ttaattttga ttggatttta actacagtgg tacagaagtc ctggaaaaga agggtcacat 29580
tttaacccat acagtagttt atttgctcca agcgagagga agcttattgc aacttcaaca 29640
acttgctggt ccataatgtt ggccactctt gtttatctat cgttcctcgt tggtccagtc 29700
acagttctca aagtctatgg tgttccttac attgtaagtt tcacatatta ttacaagaga 29760
tttatatatt attaataata aatttgtttt ttgacataaa gttttggaaa attttcagat 29820
ctttgtaatg tggttggacg ctgtcacgta cttgcatcat catggtcacg atgagaagtt 29880
gccttggtac agaggcaagg taaataaatc aatttttaaa aagaaatgta cagaaagcaa 29940
taatggttag tattgattaa tcttaatttt tgatgttttg catacaataa taggaatgga 30000
gttatttacg tggaggatta acaactattg atagagatta cggaatcttc aacaacatcc 30060
atcacgacat tggaactcac gtgatccatc atcttttccc acaaatccct cactatcact 30120
tggtcgatgc ggtgagtgat ctagctttct ctctctctag tttcatttga ttaaatggtg 30180
attaattact aatttaatta atgaattgtg gacagacgag agcagctaaa catgtgttag 30240
gaagatacta cagagagccg aagacgtcag gagcaatacc gattcacttg gtggagagtt 30300
tggtcgcaag tattaaaaaa gatcattacg tcagtgacac tggtgatatt gtcttctacg 30360
agacagatcc agatctctac gtttatgctt cggacaaatc taaaatcaat taacttttct 30420
tcctagctct attaggaata aacactcctt ctcttttact tatttgtttc tgctttaagt 30480
ttaaaatgta ctcgtgaaac cttttttatt aatgtattta cgttacaaaa agtggaagtt 30540
ttgttatctt tttctctagt tgcaatcaaa aggatcttta aaactttttt gatttggaca 30600
gaaagaaaaa gacagttcca ctgaaagtcg acaaaatgca cgccgttttt gggtcccagc 30660
acaacaacaa tatgtcacgg agttgtcgct tttttaagta atgggcaata cttttcggcc 30720
caaatatata aaagccttct taaattgcgt caggtatctc acgcaggacc taaataatta 30780
tacaaacatc tcattcgtcc ccatatatta aagagttgat tacctagtag gccacttttt 30840
gagttttctt tgcacccaaa gctactttcc gcttgtagca taaacattca cggaaactga 30900
aagagttttt ggattatttt gcccttactg aaacgaaacg gaaaattgga atattgtttg 30960
tgttgttttt gttcggttag cttttagaca tttattagat taggtttctc gatagttaga 31020
tttttataag gaccacaaga tcgtaaaaaa aatgttaatc caacaatcac gttaaaatga 31080
ccagtttagc aagttacagt catccatatt tcatggatgt ggatgctatc atgtccacaa 31140
atacatgttc ggtggttatg gatgctttcg tgtccatgta aggatgttat ggttactcag 31200
atttgtggat ggagaaagtt ggataaacat tacttggata gataaacatt atgtggacgg 31260
acgaacatta tggatacaaa aatagtggac atgtaagttg tgggcagaca aatgttacaa 31320
gaatgagtta tagacgagaa cacaacatgt aagggaacaa aagttattta acttaacttt 31380
gtggacaaga ttttatattc tacaattagg cggtaaatta acaaattttg tcggaactgt 31440
ttatcggaaa gtgatctgat gattccgaag cacttctgag aaatattggc gatgatcata 31500
taaaaatcaa tattttaaaa taaaaaataa attttggata agaagtataa aacatattgt 31560
agacaagttt ctgcaagaaa atgtgtgaaa atggcctgcg aaaactaaaa tcaatataaa 31620
aaaaagactt attcttaggt ccactcccta gggtgaacct ctaccaatag gattgtttta 31680
ttttatattc aatatctttt aaaaaaagaa acaaaatatt atcaaattat attatgtttt 31740
taaaattaaa aggtaaaaaa atagtaataa ttacaaaaaa aatattttac gtcgtgagca 31800
taacattaaa ccctaaaacc taaattctaa tccctaaacc cttaatccta aaccctaaac 31860
cattggataa accctaaact ctaggataaa tcctaaactc taaatcaaaa tcactataca 31920
ctaaaacatt caagcgttta ggatttaggg ttttagtatt tttttattta gagtttagga 31980
tttatccaag ggtttagagt ttacccaagg gtttagggtt tacccaaggg tttagggttt 32040
acccaaaggt ttagggttta tccaagggtt tagggtttag ggattaggat ttaggattta 32100
gagttttgtt gagaacatta aaaatatatt atttttttta attctttttt ctgtaactat 32160
tatctttttt tactttttta ttttaaaaac ataatataat ttgagaatat tttgtttcta 32220
tttttaaaag atatcaaatt tgaaataata aaatcctatt ggttggtgaa tcaccctagg 32280
ggtgaaccca agaatgactc aaaaaaaaac tataaagttt cttctgaatg agcttgcatg 32340
tttttttctc tacgatcagt gatgttaaag ttcttccttg taaagagata atctctccag 32400
caatttgctt tggctccttc ttgacgcctt atccttcgct gacaacaaag gtcttcctca 32460
ctatctgaaa aaaaaatcta aacattggtt gagagagttt gatggtgaag ttagagaaag 32520
aggccaaagt taaaaccttt gatttaatgg ggcgttggat aagagaccac agatctggaa 32580
ctgaaaaatg aacaaaaccc aatgatgtta gtagctagcc aacgagtaac caccacaagt 32640
tgctggctct tcaccattat cagcaatgaa ctagggtttt gttcccacca ttggtgaatc 32700
tgaatcgcag cattgagggg ctccacaacc atggcggtga catggaagaa tttgttacgt 32760
ttcgtcacac agtctcgtct ccaccctttg attactacat ctcttgaaat catccattgg 32820
acaagacaac gacagagaaa acagcttcgt tgccacaact gtcatcaagg ttgtgtggac 32880
aaataaaaat ggagataaca acctttgagc tcatctactc tctgaaactc cagccaacaa 32940
atcccgaact caaccacatc cgatctcgag ctcacccacg gcgagttcca agctcatcca 33000
ttctctgaag taaagcgaat ttgggattaa gagagaagaa gagaataaaa gaagcgttga 33060
ttaggtttta tcaatttggg aatttggtaa ttagagttcc aaaagagatt gtcggtatct 33120
tccactcctc taaggcaggc cgcaaacgag aaattaggag acttttcgag agagatgggt 33180
ttcgtggctg agagaaaaga tgaaataagg gattagggtt tgaaagttga ttttgaaaaa 33240
gtgaagtgaa cagatagaaa aaagatgggc tccattaatt ttgaaaacct aaagtgaaaa 33300
tagagaagaa agacaggccc cgtgtaactc tagtttggtt gctggaagtt ggttctttct 33360
ttagttagag ggcactaaga ccatgtttat ccctaaaaca cttagtgggt tttctaattt 33420
ttattttatt ttattttgtc tgatttaaaa aaaaaaatta aaaagtatac taatcgcggg 33480
ccgtcacgtg ttggtggggt ccgcgcacag tgctaaaaac ccacaacaat ctctattatt 33540
aaaagagaag tacccataaa aaataaccct aaaagttaca caatatttac agtcaaatgc 33600
cattgagaat taaattaatc ttacactaaa aatgattgtc ttttccacat attaattgtt 33660
tttctaaaat aactcaaaca aactacaaaa gaaagaaaca tattattaat aactcaaaca 33720
attacatatt attaaataaa ggaataagca taaataattc tcctgcaata tcaacactgt 33780
aacattcctt attatatgag tcccatcctt tttttttgtc atcatatgag tcccatcctt 33840
agcttacgta acctgtacga acatcaaatt atataagctt tataagaaat taaactaaga 33900
aaaactaaca atgattttca tatgagtttg aacaatttca attcacttta tttcacggtg 33960
gtgtatgtag cttattttta accaccttat tatattgaaa tattccactg acttctatat 34020
gtccaaataa ttaataatca ttattattaa ttaaaatcta ataattagga aaataactgt 34080
agttttgaga acactggcga cggcgaatgc gaatttttag ggttttgaga tgtttcatgg 34140
atgggatccg gggtctagtg gatttttctg gaattgcaag gagctctatc ttaatgagca 34200
aatcgggaga ttatggaagc aaaatggtct tcttgtcata aggagaaagg gagatctggg 34260
aattttattt ggctttgatc ttgtactgtc aaagatcgga atcgcggaga ttcgattgag 34320
aagggagaaa agtaaggcat tcgttaacat caaagcgaga tcttttctac taatattggg 34380
gatttctttt tgctttttgg tgcttagata tctggtaact ggttatagga aattcgggat 34440
ttggggtttg atgcgatttg atattcagga aagtcggaat ctaaggatta atggggttag 34500
agggagtatc aatagagagg atctcctgat tgattttctt tacgatttgt gttattatat 34560
aaaggagggt gttcagagct tcagtagcac aaacttacaa atctccttct ttctcttacg 34620
gatttcgttt ctggttgttt tttctttggt atctatgagt cagggacaat tggtgggaaa 34680
ggggggagcc tcgaaggagg gagaaggagt tcgcaaaaga ttgaagatct ccgttcctca 34740
tttcgataac tcggacctta tcaagagcta tgcaatgact ctgattggga ggtgtatgaa 34800
cccggttgcg caaaaagtca actcgttgct ggtgatgttg ccgaagatat ggaaggtgga 34860
agagagggtg actggtgcag atttgggaaa ggggatgttc cagtttcatt ttgagaagga 34920
agaagacatt gaagcggttt tggagtcaca gccgtaccat tttgattatt ggatgatctc 34980
gatagctcgg tggcaaccaa ggatgacaag gagctttcct tcggagatcc ctttttggat 35040
caaagtggaa ggtcttccaa cagagttttg gtcaactcca gcgcttcaaa gcataggcga 35100
tgccattgga gagactacgg atgtggatct ggactatgga aagatgcgag tggtgcttga 35160
tggcttcaaa gagttaacac tggaaacatc cgtggagttc aaaggaggtg aattctatga 35220
tgaggaagag gtcccggtat ctcttaaata cgataaattg tttggcattt gcaagctctg 35280
ttctagtcta tgccatgacg aggatcattg tcctcttaat cctaaaagtg tggacaagaa 35340
aacagatagc agagaggagc tggctaataa gaaagaggac agggcaagga gctacaaagg 35400
agtggtgatt catggagagg agagtcaaca ggagaggggc acagatcaac ggaattatta 35460
tggtaagggg aaagggaaaa tgcatgagga ccaggactca aagtgggtac gagttcctga 35520
aagaggaaac aagaggtact cgtcttacca cgataacaac agaaacgatg agggaaataa 35580
cagacacaag aacactcgtt gggaacagcc taggagttac gtgcaggaat cgcgggagaa 35640
ggggcatcgt ggcacaagac gggagaggag tcctccgcat tatgcacgag aggagccaaa 35700
ggaggaaggg gagctgcaag acacaggcag tgctaacaaa ggatctcaaa tggaaggaaa 35760
gacttctgca tctaacaacc tgcagattga atcgaatggg gccagggcaa atttgattaa 35820
gcttcctcct aaatccgtgg aaatggagaa tggtgcaata gctgcgatag tttcaggaac 35880
ggttggggcg gggaaaggaa cggagccacc attgggtgac aatggaaagg atatggaaga 35940
gaatgaagta atggacctag ctgagaatgt gattccatct gcaggggaca aaggttgcat 36000
gggtgaggat gaagctttcg aaaatcttac tgatggagag atggaggaac tgaatggatc 36060
acaagaagtg gtgctggaga ccgttgagga agaatcacga ccaacggatg tcgaggagaa 36120
ggaactacaa gttggagagg aggaaaaaaa gaagggcgct cgcaagatac taaagcacac 36180
aatggcggca ggagcttcaa agaagaagtt cgttcaggca ctcctttcac agaacaaaaa 36240
tactcaagct agacagggaa agcgtcaggg agacggaagc aaattgcagg aggataaggg 36300
ttcttcatac cccaaacaaa cttcctcaaa gaactcaact gcatcccatg gttaatacaa 36360
ttcatataga attgaggagt ggacttctgg ttgcgtcggt ttctgcttac tgttggttta 36420
tttcaataag ctctaggagc tttcttctac ggttcaattt gatttttgca ttgctggttt 36480
tatgtttcag tggcaattgc ctatctttta ttgtatttgg ttatggtttt ggtattaaga 36540
ataataattg tctttctggt ttctatgatc ttgatatggt taaatattgg tatggtgtta 36600
agacccttta ttcaggtcag atggcgttag tggcttggct gtgtgtaggg atgcatttgg 36660
ctcacttcat acaatggatg ttggacctga tctctgtaaa acaagttcag tggaagaatg 36720
atacaaggag ggttttggac aaggtacttg ggtctggttt cattatttgg tataaggtgg 36780
cacttaatta ctcatttctg gatagtacta agtgcacggt agtttggaga tgtttgttgc 36840
ttggtctttc taaggaacct agatgctctc gagtggctat gtatttgaac acattatatt 36900
gttatggtta tgggtttaat ttcagggata gagatctgag atggtcctta attatgggtg 36960
gagggggaag aggtagagtc atggacacgt cttggatcat tgcaggggag cacactcttg 37020
gcttggtctc attaaaccaa gtgcagagaa cctttggatc catgatcggt atcaagctgg 37080
ctttctcagt gccgctgcaa gatggaagtg gatacgacaa atatacggtg tctaactctt 37140
ggcgtttatt taggacatgt tcaaaatatg caaggttatt gtcctttgga gtcataatat 37200
gggatataat atggtgggtg aagttttggt ttcctttggt tactggttta tatgtacagg 37260
tcgaaatgat aatgtgtttt ggtatcctga gtgtacaata tggaactgat gagtattgga 37320
taattgatct agttcgtaaa aaaattatat cttctcctac aatcttatat atcgttacat 37380
acattgttaa ttgggcctta tggtttatta ttagaagtgg tgaatgtgat cgtatagtta 37440
ctggtgggct ggagagttgg ataaattata agatcacatg gccttttttg gtctttcgtt 37500
tttgtcacca aaatttgagt ttcttaatca agtggataat tttatgggtc ttgggatgcg 37560
aattgtgttt attggttaca gttggtatgg gaatggttat aggatcatgg gtatgtgatg 37620
gtgatcaaga gtctttatat ataattgtcc ttacaagcga ttgtgaagta tctgaagttt 37680
tttcagatag gatgattagg cttattgagg ttaaatcttt tgtcggtatc atcaaaccta 37740
tcttttctgg ttcgaacgat aaatatatat atatatatga agatattaag ctggaattgt 37800
agaggtcttg gaagtcactg gacaataagt tatcttcggg agatatggca ccaacacaaa 37860
ccggagtttt tatttttgtc tgaaacgaaa caggatttcg atttcgtaca aagatttcag 37920
tctcattttg gctatgatag cctggttact gtggatccaa atgggcggag tggtggttta 37980
gctctttttt ataataatga gtatcaagtt agagtcatat attctagcaa tagaatgata 38040
gacgtggagg cggtggttaa aggaaaacaa gtttttctta cttttgtata cggggatccg 38100
gtaccaaagc taagagaaca ggtatgggag agattaactc gatatggatt agcaagatcc 38160
gaaccttggt ttattattgg tgatttaaac gagattactg ggaatcatga aaaggatggg 38220
ggatccctaa gatgtgcaac atcttttatt ccgtttaaca atatgatacg gaacagtggg 38280
ttactggaat tcccggctcg tggaaataaa ttttcatggc aaggaaggcg tggcaaagga 38340
aaggatgctg tgacggtcag atgtcgattg gatcgagcct tggcaaatga agaatggcat 38400
acgttgttcc cgtgctccta cacagaatat ttgaggttag tgggatctga ccaccgtcct 38460
gtaatcgctt ttttggagga caagttattg aggaaaagga gaggacaatt cagatttgat 38520
aagagatgga taggtcagga ggggcttatg gaatcaatag tgacaggatg gacggagaat 38580
cagggtgggc aaattgagga ttttgttaca aaaattagta attgtcggca tgagatttct 38640
tcatggcgaa aggataatca gccatatggg aaggataaaa ttagggagct tcaacatgca 38700
ctcgaggaag ttcagacaga taatagcaga tcccaggaag agattctgga agtttccagg 38760
aagctacaag aggcttataa ggatgaagag gaatattggc atcagaaaag ccggaatatg 38820
tggtattcat ctggagatct taataccaag ttttaccatg ctctaacaaa gcagcgaagg 38880
gtccgcaata aaatagtggg tctccacgat gaaaggggta attggattac tgaggacaat 38940
ggaatcgaga aggtggccgt tgattatttt gaagacctgt ttagtacgac cactccaaca 39000
gaatttgatg gttttttgga tgagatcgtt ccgtctattt ctccccaaat gaatcaagtt 39060
ttgttgagaa tagcaacaga ggaagaggtc cgacaagctt tatttatgat gcatccggag 39120
aaagcgccag gtccggatgg aatgacagcc ctctttttcc agcattcctg gcatgttatt 39180
aagaaggatg tggtagaaat ggtgaacaat tttttggtta caggtgctat ggattcaagg 39240
ctaaatacta ctaatatttg tatgattcct aagacagaga gacctacaag aatgacggaa 39300
ctgaggccga taagtctttg taatgtgggt tacaagatta tctcgaaagt tttgtgtcaa 39360
cgcctgaaaa tttgtctccc tctcttaata tcagagacac agtcagcttt tgtggaaggc 39420
aggttaatat cggataatat tctcatagcg caggaaatgt ttcatggatt gagaaccaat 39480
aagtcatgtc aaaataagtt tatggcgatt aaaacggaca tgagcaaggc ttatgatagg 39540
atagaatgga gttttattga ggctcttcta tataaaatgg ggtttgatgc acattggatt 39600
aagctaatgg tggaatgtat atcctcggtt caatatagag tacttcttaa tggtcagccg 39660
cgaggcctta taattcccca gcgagggtta cgtcaggggg atcctttgtc tccttatcta 39720
tttattatgt gtactgaggc tttaattagg aacatcaaga aggcggagag agacaaacgg 39780
ttaaccggta tgaaggtagc aagagcttgt ccagcagtct ctcacttact attcgctgat 39840
gatagccttt tcttttgtaa ggcaaataag gaagagtgtc aaactattct caggatttta 39900
aaggaatacg aagcggtttc agggcaacaa attaattttc agaaatcctc aattcaattt 39960
ggccacaaga ttatagaatc cagtcggcaa gaaatgagag atattttggg tattcaaaac 40020
ttaggaggaa tgggatctta tttagggttg cccgaaagtt tgggaggatc taaggtacaa 40080
gtgtttggtt ttgttcaaga acgcttgaat aatagggtta atggatggac ttttcgattt 40140
tttactaaag gaggaaaaga ggtgattatt aaatcagtgg tcacggcttt accaaatcat 40200
gtgatgtctg tttatcggct accaaaagca acagtaaaga agttaacaag tgcagtagct 40260
cagttttggt ggagcccagg aggaagcaca aaaggcatgc attggaaatc atgggataaa 40320
gtgtgtgtcc ctaaagacaa tggtggccta ggattcaagg atctcatgga ttttaacaca 40380
gcgatgcttg gtaagcaaat gtggaggcta atagacaagc cacattctct cttctctaga 40440
gtttttaaag gacggtatta caggaatgct tcacctcttg aaccgatccg ttcttactca 40500
ccgtcatatg gctggcggag tatcatatct gctagatctc tggtttgtaa aggactaatt 40560
aaaagggtgg gaacaggttc atctatttcg gtatggaatg atccttggat cccagccact 40620
cgcccgagac cagcaaacaa aaaccttcaa aatagttacc cggaccttac agtggattct 40680
ctcattaata tggaatttcg aacttggaac cttcaggcaa ttagggctgt ggtggatcct 40740
catgatgtaa aaatcattga gagtatgcca ttaagcagaa atctgatgga agatagaaat 40800
ggatggcatt ttactaacaa tggaaaatat tcggtaaaat caggatatca ggtggaacgg 40860
gtttatcctg atagagaaaa accaccagag gtttatgggc ctacagtgga tgtccttaaa 40920
gccttctgtt ggaaaatacg gtgtccgccc aagatacaac attttctatg gcaacttctt 40980
tcaggttgta tagcggtgtt gaaaaatcta aaggcgagag gaatccatgg ggatatatgt 41040
tgtgctcgat gtggggatcc ggaagaatca ataaaccatg tatttttcga atgtccccca 41100
gtacgtcaag tatgggcttt atctaaaatc ccttcgagcc tcagtttatt ccctacagga 41160
tctttttttg gtaatatgga tcatcttttt tggcgagtta atccaaaaat ggatgatcat 41220
caatttgctt ggattttatg gtatatatgg aaaggtagga ataataaagt tttcagtaac 41280
ctggatgtcg atccaaggga aacccttaga ctagcagaat tggaatctac actttgggct 41340
gcggcacagg tgaacaacga ccaaaaacgg gaattacagg tacataccag acccatattg 41400
gtaacttcag gacgctggtg ttttatagat ggatcatgga aagataagga tctattttca 41460
ggacagggct ggtatagtat cctaccgggt ttcgatggct tattaggggc acggaatgta 41520
agggcatgtc tttcaccact acattcagag gtggaggcgc tgatctgggc aatggaatgt 41580
atgaggaatt taagacagct tcatgttacg tttgcaacgg attgttctca actggtgaag 41640
atggtttcgg aaccagaaga atggccagca tttgaaagtt acctgaaaga tatcaaagtc 41700
ctacaaggaa gcttcaacaa ctcagagatt gttcatgtac ctcggacgga gaataaaagg 41760
gcggatagct tagcacgtag tgttaggaaa caatcgtctt tcgtcgttca catggatgca 41820
gagttaccga tttggtttac agagtcaagt tgagtctgtg aatgtcttgt tgtcaaaaaa 41880
aaaaataatt aaaatctaat atttttgaat tgaaaatctt ttccctcccc caacaatctt 41940
ctacttagat ttcggaaaaa aaaatagaaa catttgcgga atctactaat ttgtttctaa 42000
acaagatttc cccttcaatt tcggaacaaa gaagatatat ataaaatttg atccataact 42060
actaaacaat aaacacaata ttcgaatttc accaatataa tcttactctc tcctattttg 42120
ttagtttcac aataacacac aataaacaaa gtattctaaa tattaatgca aacaagagat 42180
gccttgcgag ggtggttaag atatttcctc aactttaggg ttttgtattg cgttaaaaaa 42240
attgacccac acacttgcgg aacaagcaca agatcttatc atttcctatt tcaaatcata 42300
accattaaga ttttaccata atttcaaaaa caataaacag aatcaacaaa atattctttt 42360
catttatttc gcctaatatg tcttgcaaaa taagcaaaga tatttattct caactagggt 42420
attgtccctc tactatatat tctacccgag tacaaaccca ttctacacat tcttttacca 42480
cttacgctga tgaaacatta caaatggttt tagctgatga aactgttagt tctataatat 42540
ttgtattttt tttttgaatt ttataaagta gactttgaac aaaatcatct cttcctattt 42600
ttgaatgttt ttttgtaact tagtttcatt attatttttg gtttgtctaa ataatgtatt 42660
tgttttcaaa aatttcaata aaatatttga actttatatt caactttaaa ataaaatatt 42720
tataatttaa tttaataaaa ccccaaatat acttaaacct ccgatacttt actatttaat 42780
ttaccaaata aactaaataa aaatacaata aaagaaaaac acaatctcat agtttaaaaa 42840
tgatggctaa tcatattgaa caagacacac cgaaatcaaa cctgaaaaac atatgaatct 42900
ataacataat aagtacaaac aattaaattt atcaaatttt caaaagttaa aaatatatga 42960
ttatgaaaaa caaaatcatc cttttttgaa caagaagaaa gcccccacgt tctgtcttgg 43020
atggtattac caatatttca cattctttat ctaatggaaa cgaagaaaca acaacaaaca 43080
tacatcgtga tatcaatcaa gaggataatg attttgttag aggatgatga ttttattcat 43140
agcctttgaa aaaattaatt tccgtaaaag ttatacctta tttatctatt tcatatatca 43200
tactaactca taatttttta tttcatcata ttttaatggt tttcaataga aatgtggtcc 43260
aaattatatt accttatcac agtatgatca attttgttgc caccgtgtga tcaaattatg 43320
ttacagcaat atttgtatta tgtgatgtat ttttgtcatt atttgtatta aaattttgat 43380
atattatata atggtgtaaa aaaatttaat tacattaagt aaacagaaaa aaaacacccg 43440
cccggtcggg cgggaccaga tctagttggt tattatttca tcaactttgt taccggtttt 43500
tgcataaaac atgggaccca acactgtaag aaaccctata attacctccg ataaacatgc 43560
cctaagagca tctgcaatag tgagtctcac catgaaattc ttagcattat tataatatac 43620
tagagatttt ttccgcgctt cgcgcggatt gtatcttata aatttatttt atttataata 43680
ttatttgttg gtttttttat attaactttt tgtttttccg atgttagttt tttttaattt 43740
aaatttatat gtttatattt ttatattttt cttgttgtag atggagaatt atatttttta 43800
ttgatggttt tttgtatgtg acataaactt tttgaaattt taaaataatg ttatatatag 43860
tacgattaac acattaaaga agagaaacat attcagacac attttacaca ggttttatat 43920
gcataatttt aaacattata tatgtatata ttataagttt gaaacatgta aatgctttct 43980
aaagctaaat acttgttctg agtttacata acttatcgag agttttatct ctttttaaat 44040
ttaaatcaca gaaaaaaaaa tatcaaaaag tcagtataaa tggatttttt gggcttttaa 44100
atcaacactg aaaaattaca tgaattagat aacaacactt ttataaacaa ctcgataaaa 44160
tttgaccgag ctaaagattt tcacacaata tgttctttct tcttcaaatt gcgaagagcc 44220
tataggcaca aggaaaaaaa ttataatttt tgctttcact tatataacat tttttctcct 44280
ttacacacga agtttattac actgctataa gcaatggaaa actctattca tataagattc 44340
acatctatgc attttgacaa agaagaattt aagccatctt tagtttcgga atggacaaac 44400
ttcagtcata tacactatat tttctctatg attcaaatct tacaatttta atatatgtgc 44460
agatttccat gtaaaaaagc acgcacgcca tctatcattc aacctattac tttttccaaa 44520
gtaaacacta taatcctcgt ttgattagct ccacaaacta atctctttgg atcagtttac 44580
taaaaaatat ggatactaat gttagaaaag aatataaaca ctatcaacaa taaatattgg 44640
cacaagacta tttggttcaa ggaacatatt caacgtaatg cgtttatatc atggctggtt 44700
ttgcggagaa gactgccaac caaggatcgc ttgaggcgtt gggggttaaa tgtctccgga 44760
acgtgcgtcc tttgtaatct ggaaatagag actcaccatc atctcttctt tgagtgctct 44820
ttctctcgct tgatatggga gccttttgct actgaaattt ggatttttcc tccggctgat 44880
ctacactctg ttgcagcctg gatcaatcaa cctcgcgtca acgcagatgc gcatgctact 44940
tcagtcatca atctctactt tcagtccgcc atctacctgc tgtggaaaga gcgtaatgct 45000
cgtatgttca cagctgtctc ctcaccttca tcagtcatcc ttgcctcttt cgaccgtatg 45060
atgcgtgacc gtctcttctc ttacccggca aattcttctt tctcctattc tctacttctt 45120
tttatctttc ttgtataaga cctccttaag gctttttcta ccttgagttg ttgttggttg 45180
tttttgtttc cttgctgtaa caagttgttt aaaaacaaca gtgtaacttt tcagaaaatg 45240
ataatcttaa catcttacca aaaacaacaa caaatattga cttatttatg tgaatatata 45300
ttttatttta aatcattata gtggacgaag aaaacaccat aatttgtaca acaaattttc 45360
ttagattcac ctcatcatac tcaccatttt actattttat ttacataatt ttacatgagc 45420
ttcttcaccc tccccggtta ttttatcttt atttataact acgatataaa gttataaact 45480
atattataga ttaataattt atttatcctt gaagtctaac gattaaaaat agaacataat 45540
ttaatataga tatatgattc tattaataaa ttagtagtta caaatttgaa atttctagaa 45600
atatcaaaag tcgtatgtta gttaattatc ttcttagtga catttatttt taattttttt 45660
tggatgaaaa tattttggct gaggtagata ctctcaaaaa ccttgaattt agtccctttt 45720
atatagtagg atatattttt ttaaatagtt aaagatccta atccaaaagg tacgtacaat 45780
ggtgttatct aatttagagt cttcaggtct gaagctataa aacatatttc agaaaatggt 45840
tttgttctaa agaacttggc gatctattaa atttttaatc agagtttgat ctaaaaaact 45900
tgtattatat tctatcttgt attatattct atcttcttct gtttccatat agtcttagag 45960
tcagaatagg atgtacaagt tacaaacata tatgcttatt aactaacaaa ttaattttat 46020
gtgttttggt agtaaccact catcttcttg aagaaccaat gaaggagaat gatagtaagc 46080
agaaaaacca tgaagatgca gcaagattgt ccacttccac gtcttcttcc ttcacccgtt 46140
gtagtgtcct ttatttcact acactcctcc tccgtcaacc ttactggaac attcagtgct 46200
gaagaaccgc agatttcaca tacactacaa aaaagagaaa cagaggtttt acacaatcca 46260
tatggttact aagctaatga actgaataga gtacctgttt cctcttagct taaaccaagc 46320
ttcagcgcaa tgaaaatgag caaggccaag ctcatttttg catttgcaac caatctaaat 46380
caagtctaca cttacaaact tgccagaaac tctatctggc gtttgatcag aaccaaaatg 46440
acaaatcctg cagattcttt gtccattatc actttcttct cctccaccac tcagatcaat 46500
catgtgaaac tccttctcct ttgctttttc tgaagcatca ctctcgtgac accatctttc 46560
cccattcttg aatcattctc tttttgatct tccatcaata catggtttga gagagagagt 46620
cactggtctc acccttgagg ccagagacta caatcacagc ctcagggaca gatccactcg 46680
aactttcaca aacagtgatc gaatttgaac aaggtatctg gtccatttca ttcatataca 46740
caccaaaaac aaaaccagga gtggttgtat caagatcaag aatgattgta tcagacaaag 46800
agttaaacat aaacccaaaa ctgaaaacct gtaacagcta gaacatactc aaattattgg 46860
tacgcagagt cctaaagtac aataaagatc gaaactttac cagaatcaag atctagtaga 46920
gtgacaaggt ttcgttttta tttcagaaga atgataaatc agacaattga atctaaaccc 46980
tttgccggaa acggatgcgc gccgctacaa gtgctctcta atctgttgct cttcggtttc 47040
agtttgtgtt ttttctttca taagatgcct cagctagatt ttaggccaga ctcgagaatc 47100
aatttttttc tctgcatcgg tcgagactcg agtatgacga cttttttttc cccactagga 47160
aacacaaaaa ccttcccatc cattcacaag tagccacgta ccataaggat caagtcctaa 47220
aattccttag ttatatatgt tccagtcctt agttttatta agcaaaatat tattattata 47280
tgtgtattta cctaagatta agccctaagg attggtgatg ttactccgtt gcgggtggtc 47340
taagaatatg attattgaga gtttttatgg tggattttta gcggaatata agaactccac 47400
tctaaaaatt tctgctctaa gagcatgatt atccctaaat acacattaga ttagttaatg 47460
actatttaag tattaaattt tagtgaagga atttagttaa gataggattg gagaaagaaa 47520
aaacacatta aaagagagga aggattcaag aatgaagaga agtgttaatg gaaggttctt 47580
catcaatata cacttcagtt cttatcagta tacatatagt ttgtactata taaatcatac 47640
aaaagagaag tattctcaac catttggtga tgtagttttt attaccatac aaaaacaatt 47700
ctaatacaag cgtgtctcaa gaacacaaaa atcgtttcag tttttattat ctttcgagga 47760
gcttgtactg agtgtcgttc aagtaaaacg actgagccgt ctccatgatc catttcgcct 47820
cctcgtcagt gagtttgctt gtgaacaaaa catcacctcg gataaacacc aaggtgtgtt 47880
acaagctgtc aaacatactt agatcattaa gcatgatata cacaaaacaa aacaaaaaac 47940
attgaaaaga gaacaagaaa aacaaaaaac aaaaaacatt gaaaaaattg agaatgaaga 48000
atatgacgac aatgatacaa aagtttgtat actgataata cactagcata caaaacgtga 48060
gtgacgacaa tgacatttct tcactaggcc gatgatacaa aacgttactg ctcccacaga 48120
agcatacaaa acgtctaacg acaaactatc atgaaacagg gagcaaggca tcgactcaaa 48180
ttggccatca cctctttcaa atcgtctgtt tgtttagtaa ggagaaaata aagagtctag 48240
acccaaattg gctatgtacc tcctataaaa cgttatttat tttgcaaaac aggaaacatg 48300
gaacggtggt tatgcaaatg caaaacactt atatactgta taacagtaaa atttcaaagg 48360
aatgacattg tgaaccattc actatagaaa attcaaattc ataatctcgt aatgctgtca 48420
acatccatgt aaagctcagt gcgccatcta aacaaaattt cttcataatc cacatttcat 48480
tagaaatata aaaagggtca agactcaact tcgaactatt aaaaaggaaa aattcatttc 48540
gtgtagaaac gttgtaataa acaattttgg aatggactta gtgatatcat attagttgcg 48600
tttttaataa aatccttaat tacttgttaa ttaattgaaa gagagtaaca gaatgggtct 48660
tcatatacaa attaagcaca ccgaaaaatg cagaatccta atatgaaact gatactcata 48720
tgataactaa taacgttaca caaaatatac agaaaaccgt aaaatgatag aaagaacaat 48780
agcaactatg gtaaaaacca actaaaacca aaacatgtgg caatttggcc ctccattaaa 48840
agctatatac cacagtttag ctcagctata agcttataat aatatacact agggccgggc 48900
ccgcccttcg ggcgggaagt ttgaataaaa caatttcata tgatttatat ttatttatga 48960
ataatttata attatgatat agatgatatc atatacaaac aacacaaatg agaactttta 49020
agttataata tactggttat gagttcaatt ttagtatcat atattactat gagagtaatc 49080
ttcgctatta tttcaaaagt ttagttttag ctatcctcca ttagactaac ttataaattg 49140
atttaggtga gtacgaccca aacccccaaa gcatcctttt attattcgag gccttttgtt 49200
tttttttcat gatgcatata tacacatgtg aattttgtac ggaagaataa tgtataaatt 49260
ggagaaatct tattatttgt tattaagctt gatgcaaaag tttaatttaa ataatgtttc 49320
aataaatttg gcgggtttgt ttacggtttc tttgtgcgta tgtagtcaat aaattaaaat 49380
aataacaatc ttcgcatgcg ctgtccatat catgctggtg acattctgct tcgggctcca 49440
tcctggctgt atttgctaaa taccttgtct tcaaaataac tttgatcgat ttaagtgaag 49500
ttttaataat aagtatatta gcttgtggac gacagacgta cactcatgca cgtaaccaaa 49560
gttttgtaat acataatatg attatggacg tcagtttatg cacacaattt aaagaacatt 49620
aaatattttc acactcatat acataattat attagaccgt ggactgtata catacactca 49680
tactaacgta cccaaagttt ttgtagtcca taatatgatt atggacgtcc acttacgtac 49740
acaattaaaa taaacactaa ctcttttaat aaaataatca ctaacattta ttaactcatc 49800
ggaatcaaat aaagcatcaa cttgttcctt ttttaaactt atgtcaactc aatataaaaa 49860
gcattcataa caaccataaa gtagagagtt tgaaaaaaaa acaactggaa tgtagaaaat 49920
ccataacata gatagaaaaa agatgacaat aaagtagaat gcagaaacat tattaagctg 49980
cagaatatcg agagatgatt atcgaagatc catcttaagc aatacgcgcc ctcttacgca 50040
cattaccgac tggctccttt ccagctctct ttgatgtctc acaattgccc ttgccggaac 50100
cagactccac acggttgtta ggcccgtctg gcgcatcatc atcatcattg tcatcacctt 50160
cctgttacat tcaaattgtt atacgctgca tatgctaatg gcgaaatatc ataataagta 50220
ttgcacttac atcatcgaca aattctggag ctggtgcacg ctcaacctca ttgatgatac 50280
gcgacacggt gaacgtctgg tggttgacgg tgaagttgta gggcgtgaca cggacttgga 50340
aagtgtaggt cttgcgttcc attcctgcaa cgaacggagg catcacggaa tcctcagggt 50400
tcactccttc ttcagccttg tcattaaatg gaagcatcga gagtatcaac aacattatat 50460
aataaccaca taagtaatca aactatatat taccagtaac tggaccgcct cacttgcccg 50520
gagattatgc aacttcgtca taacaccatc aaagcaaaca aatgtccctt cagcagtatc 50580
atcagttaca accatctcaa cgcgataact aaaagagaac aaataaaccg aaatggaatc 50640
agtgtgacgc aagggataaa gaaggcgacc aactatcata ttataacaaa tcgatacata 50700
ccgtaaagat ccgaccgcat gagggttatt acagcgtgca cattcgaaag aagtgacagt 50760
gcgttgcaat ttcttgctgc acttagaaca cgcaacatag caccaccctt tgtccgattc 50820
aacccgagaa actctcgcag tgcataagaa atctatttcc tgctgcttaa acatcaacat 50880
tgcgtgcagt caaaaaacaa tctttatata taaacacacg aatgagctaa ttgcatatac 50940
ataactcatt acctgtggcg aatccgtagt gataaaatgg ttaagctctg caattgtcac 51000
agtctcaacc ttcgcataag acttcaagag aggtgcggca gacggaagac cagtgtctct 51060
agccaccaat ctgaacaaaa gttcacgaaa ttaacatcac aaactctcaa cgtctgatta 51120
catactcaga acagaccaaa cttaccggta aaataaagac tctcctgcat gtgtctcctt 51180
atcataataa acatgtgttc ctgacgttgc gttgaggaat aaacgaccta cacaaaatag 51240
taaaaatttc tgaaaaagga attacacata ttaatttatg ccacatcttt aaataagcaa 51300
cgaagtacct ccaaccatct tcgggtttat gcttgtggca acaatcactt taggatcatc 51360
acgcatgcct ccaagcttct ggtggaataa aacggcttga gcgtcaaaca gactaagagt 51420
gacagacaca tcactgcaca tatataacaa acgttagtgc agctaaaatg attaagcaaa 51480
tatgaaagtt gttaaagaaa caaataaatt acttttctaa tttgacggtg accatgacac 51540
ggttcttatc ctccggaggg tcagacacgg tgctcttcac cgccacgatt tcaccaataa 51600
tatctacagg ttcaatattg agatcagaga gctcagtgac ttaatacata aagcacaaaa 51660
cccatacaga taaatataca tatgtacgat acgatcacat ctgtacctgg aagctgagtg 51720
tttgtattgg ctaaaccaac caactcggtc tggttacgga accggaatcc ctctgccggt 51780
attggcgaga ccggatcaga taacacgtca aactcggtgg aatcgttaaa ccggatcatc 51840
aaagaagagt ccacaagctt gaagttctga gcacagcgag ccacgtcaaa gccagaaaca 51900
gagtacatcg tcccggcggc gagcctatct cggaaccttg gaagccgatt cgcgttgata 51960
gtagcttgga tcaaagtcga ctgaaacaga taaaatttag aagtcagaaa ataacgtaaa 52020
cagatctaag gagaccagga agaatcaaac ttacattcac gtccataagt agcatatcga 52080
cccacatcag ctcgccaccg cgtttgacgt tcctcgcctc ccagaaccgt agaagccggg 52140
cctcgacgac ggaggagcat ttgccggact tcaggtcaga gaagaagact ctcgaaatag 52200
acatagcaac aggaatcaga aagtctcaag agaaagaaag agatgatgcg ctggagatct 52260
atagatactt acatatttat acagatctgc tcgggttcaa atggcgcatc gaagagtctg 52320
agggagggat tgaatgagcg agggattgaa tgcaattgga ataaagacga cgacataact 52380
ccggccgttt catcgaagag gaaggaatcg aagacgtcac gcgtcgccgg cgcagaaaag 52440
ggttacgcga gagtaatgtg tcttagggtt ggagacgtcg tgacatcgtt cgggctgtga 52500
gtgtaaaggc ccatcacaga aagatcgagc gaggcccaga agataacatg ttcagtttaa 52560
tgaaacgcag cacctcgtcg tcagtgacac gtgtcgacgc gagaggaagt gaacgtggat 52620
ggcctaagaa gagattaaac tgtcttttat atatatacat ttagttgaca aagctcaaac 52680
tcaaaccaag ccgatgacaa aaactctcag gagatctaca tataactatc atcacacact 52740
atatatatat atatgataaa ataaaaaccg aaatgattag atcacttcaa ctctcgccgg 52800
taactgtatt cccgccgttt cctcttcagc ggtagaatct tgagaggcga caagtttcac 52860
agcgaaagaa aaattggaat tatacttttg tctcgcttca gcgaagcttg aagaaagaac 52920
ggtttgcatc cactgatcaa ccgttttctc ttcatctggt gaccatctca aggcagctag 52980
aatctgaagg atcgcatcgc tttcgatctc tagacgtgtt tcatgtccaa acgaccgacg 53040
aaaatgcgac aagatgctcc tttgtatgtt cttcgctaac ccatcaaagt cgatcgtttt 53100
gaacgtcact ttcccgtcaa cttgctcgaa aaaatcctca agccaagctt tactgttctc 53160
ggacattgca tgcgcttctt catctgcgtt tgcttctgtc tcatccactg gaagattcag 53220
atcgagaaac gaacgttgag actttacagc tcgaagctct gtaccctctg ttcctaactc 53280
ctgtcttcgc ttattcagac cgttcttgtt agcattgtcg gcgagtttta tctggagttt 53340
acatttttta ggggtgagaa ctcttccctc ggagtattcg acacgctcat caagaatatt 53400
cgaagtagta gctaaaacta taacattctt cataccgatc tctcttccgt gcgagtcacg 53460
gagcttacca gttctcacag catcagacag tcttacctga tcaggaaact cagctttgtc 53520
cacgttctcg atgaaaacaa cagactccac acgcttggac acttctccgg cgatgtagtc 53580
aacaactgtt ttccctctga atctatcgtc gagccggtcc tgtgccttga aatccacgca 53640
aacgcagttt tctcgcccgc cgaagaaggc ttcagcgaga gttgttgcta ctttcttctt 53700
cccgacttga tctggtccaa gaagagcgag ccagacatta cttgtggctg aagctagctg 53760
gcttctatca tctctgtatc cgcagatgat ctcgctaacg gcgttcacag cttcgttctg 53820
aaaccctact ttccgagaga gtaattctct gagagacttg aagtctttgc agtaccgtga 53880
caatggtttc tctttgctca gctcaaagcc tctccggtta agtgataccg gtgtgcttga 53940
ctcctggtag attgttccta gccctagatc tgttgtaaca cagctcaaag gcgagttcgt 54000
tgttgtgcga gttgtgtgat cttctatatg ttttggcttc gagattctta cagataaacc 54060
gggttggtgt ggcggattct cagcttgaag ggttgaaaca agctgaagtg ggaactgtgg 54120
tctaacaggc tggaagctga gtttaggaaa cgccggagtt tgatggattc gttgacaaat 54180
gtcgtcccat ttcttctgca cagaagctag tgtgtttgga tcatctttag cctgcactga 54240
atgagaacta aacactctca agatagtaac tgagagattc gaattcagag aagaagttgg 54300
ttcataaaag cagcacctgt ctgagaatcc ctttgtcttg ttcagattcc acattacgta 54360
accaacaagg caacttctct gaacactgat caccggactt acctaaggct gtgacttctt 54420
gctcacactt ctcgttacag agatgacacc gaggaagacg agactggttc attgagttac 54480
taaacggtac tctgaaatct gatgttgatg agaagaagcc tccaaatgga acaaatgatc 54540
ccatcaaact gtagatgaaa ccacaaaacg tcacgtttca atcaaaaata ttttagactt 54600
tcccaacact aaataccagt gttataaaag ttgggctcag aaagcgccta tgcggcaaat 54660
catgtataaa gctatttctc taaagcgatt tttttttaaa ttcagtccgt tcgttaaaaa 54720
attggtctac acgcccgtct aaacattagt ttcttgtaaa atgcataatt atagcttaac 54780
tattttaaac attgctaaaa acaaaaacat tcatcccgaa aattcggtta aaaaatcggt 54840
gtagacaccc atctaaacat cagtttcttg taaaatgcat tattatagct taactacata 54900
ttttaaacac tgctaaaagc aaaaacattt atccggaaaa ttcaaatcat ccgataaata 54960
aaaaaatctt aattatccaa actttttact gaattgacta taattatata gaaatatatg 55020
aatctaacca aacgaaatta aatcggagaa tttttcaaac acagtattag agatttctag 55080
tttcgaaaaa aaacaaaata aaacgaaaat aaagccacta taaaagacat taccttgact 55140
tgggataaac tccttgattc gaagatgtaa taggaagaag atgaatattc cagtctttgt 55200
caatcgtggg gaacctctcg atcagtttca aatacatctc gttgctcgac acactcccga 55260
cgaaccagag cttctcacaa tgaagcttca acagctccga gagcctcgac acgagagcat 55320
cactggttaa gaccttgagc tctcctagat tcaaaaccgt ccccgtttta gatttcgagc 55380
agctttgctc cacgattctc cccaactcat cgagtttcat ctcaccgatc tctttcgcta 55440
cactaacgac gcttaaccca ctaatctcca gaggcagaaa ccctaccttt cctctgttga 55500
tcgagtcact aaacgttttg agcgctttac cgccgcaagt tccgacaaga agaggattct 55560
tcttgtcttt ccgacccaac acttccccga ttctccgaca gttctcgtcg aagtcaccgc 55620
tatacccgaa tctcgcccga ccagagccag attcggttac gttacataga aacagtggag 55680
gacagcgaga acgcgggaac cgcgtcaccg gaggatgaag cacgtcgagc tttatgtccg 55740
tgctccgaaa cccggcttcg ccgaacaccc ggctcacgat cgggtcatcg agtatcgaca 55800
atatgaagta cttaagctca accttcaaaa ccgacgtcgt ttgagtaacc ccaccgtgga 55860
gctgatggag atggtaagtc tccgggtgcc ttctctgagt cgcctgagag cgtttgatcg 55920
ccgccatgag ggagttagac accggcggct cttcctccgc ctcgttctcc gtcgtcgtcg 55980
tcgtcgtcgg agaaggtttc gaggaaggga gtctgtcgag agatacgccg acgcagagct 56040
cgagcgcgcg gaactggagg cgggaagagt acggcgtgct gtgagcggcg cgtgaaatgc 56100
aaacttcgcg gagaatcgaa gaaggcatgg ttaagagacc ggagatggcg tggagagacg 56160
tcgtttgcgc gtggcttctc ctacgcgcga cggctaccgc gtcgtctagt gcgcgtgctg 56220
tttcttccgt taaacattgc ctcgccgtgg taaccggtgt cggcatcgtc gcccgctttg 56280
atcaatttca aactacacca accaacaaac aaagatcgta aaagaataag gagaatgctg 56340
agaaatgtat aaacaaatcg cgcgtgaaat ttctcgaaat ggattttacg acaaagatat 56400
caaactgagt agtcgctttt tttgaaaaag aagtattttt atttattttt atgttttgtt 56460
tacttctgtt gctttggttt cagacctcag gcttacgctt agatatgtaa gaaagaagag 56520
tcgctgttta actggtctat tgtgaatagg tcccactaat atgtaatatt tatgtttttt 56580
tcttttcaat ttataatcat atttttgtat ttttgttgtt gcccccaatc ctcgtgtata 56640
ttgaaggagc aaaggcacat gtatagtgag catagattct ctatggccca agtgaaagat 56700
ctccttttac ttctattggc ttatactctt tcaaatttca attaatttta gatttgacaa 56760
tcccaacagt ttttcacaat tattctcttt cataattttc tctctaattt ttttaatatc 56820
ctcttctttt attcttatct ttaagaatct gttcattcag ctgataaaaa tatctaaata 56880
taagtatcca tgcatatctt cttcttcttt tcgttatttt tccaactttg tatccgtatt 56940
atacacatta cacttccaca ccaactcaat ataagttttg gtccttcggt ttaagtatct 57000
tgaatctaga tgcaagtttt attccttttt tgcaagcttt cttttagttt tgttatacca 57060
ctattcttaa atatttgaga aaataattaa aatgacttaa ttcatgctaa ccaactaaaa 57120
tcaggtaata aactaagaaa aatatataaa gcatcaacac tcatctaaaa atgaatcgac 57180
aaagcattaa ccataagatc atattgagtt atacagggaa gcacaaaagc cattataata 57240
tttcagaatc attacaattc tcacgtcaaa taaagggatc agtcaagatc aatagatgtt 57300
gtactaatcg attagttttt tttttaaaga gaaaacaaaa catgatgatc atggttaaaa 57360
aatgtttgct tcaaaaaagt tctgaacttg attgatttga atagaaaatt gatactttat 57420
gtaaaggatt ttgaattatt atgcatttta aaaagataat aagaatgatt aattagacag 57480
gtcaacttaa attataatta agaatatatt cagtggtaga cagtgatata attttacttt 57540
taagagatta gatggatgtg atatggtaaa gaataaaaac aggagtaagt gattaggccc 57600
caaccccctt tataaattcc accaccacca tttatatgct acttttgtgt cgttgtcatt 57660
gcaaaagtct tttattaata ataatgaaga agaaaataaa acttcctttg tgttctactt 57720
tttatattct ccattgcaaa ggcctccttt tgtctttccc cttttggaaa aggagattta 57780
ctcaacgagc aataattatt accagtgaaa tagtttttga tattatcaca ccagttaagg 57840
acaaacaaac atcgatcacc ggaacatcgg cttaataaaa ttttttagat ttatttttgt 57900
ttcaaaataa taaatttttt aaaattaaag tacttttatt agttaatgct taaaaactgt 57960
atatttttaa gaaacatatt aattgaaaat atttgaattg gttaaatact atcagttgat 58020
atttattaga aaatatataa taacataaat aataaattta attgtaaata tttattatat 58080
ttttaatatg cgtgaatact ctagaaaatc tgtttttcag aaacagaggg agtagtaagt 58140
actacaagtt agtaaattca gttttaaaac taaattgacg gcctatacta tagccagata 58200
taatttccag acgcatgatc caaaatttcc agaatcgcga acgaacaaca tctgattgtt 58260
gcatccagtt actgtgcgcg gatgccgcgt ctggaattct catccagttt acgaaacgaa 58320
cagggccata ttgtgagtca acctcttcat agctccatat tgcttcttgc aagagttgaa 58380
cttgttccta aactttatcc atggatgcct caccccatat gtatcataaa acttgtctgc 58440
aattgtcttt ctcgcagtct catggagaac cttatttttc acattgcctt tcagttcttc 58500
ttcaattctt agttgaagca caaaccgtgt ttgttcatca ctccacaata cagtctatga 58560
acaacacaag aggaccatct aagtcaagac taaactaaat tcaatgcatt aagaccatat 58620
ctaagtcaag actaaactaa attcagtgcg taaagaccat ctaagtcaag actaaatgca 58680
acacagaaac accaaaatag agtgttgaga atgacttaca tcacttccag ggacagatgc 58740
cattcaaact tgaacagata gtcactgaaa caaaaataaa aacgagttaa tacaagactt 58800
taagactctt aagcgcaaac aatgaaacaa gaagaccata ctctacaaag acacagcaac 58860
aaaaacaaga agaccatact aataaaacaa gagcttcctt gtattaagag ctacggttaa 58920
atgaaggtgg gaaagtaatc attttcttcc ctcagaacac aatgaaacaa gaagaccata 58980
ctaaaagatt gttaccttac taaaagatct gttctgtctt attttgtttt cttgtctgaa 59040
tgtaataatg aatatacaaa cgacacaaca cattcattag ctctaagcaa ccttactaaa 59100
gattgttacc ttactaaaga gagtctgagc ttgagagggt ttgaacttga gagagcctga 59160
gcatggagag ggtttgaact tgagagagcc tgcgacctgc aagaaaaaaa ataacagacc 59220
ttttgaagct ggcaaatgac agtacatgtt ttgtgactta aaaccacttg gtaagagagc 59280
tcaaatgctc aaatatacaa gaaaggacgt attggtgatg taattcagct aattaatcac 59340
aaactcactg atgagaataa aacaaatgca tcacaaatat acacataacg tcataccgtg 59400
agagagtgag cttgagaggg tctcgagaga gtgacttgag aggagcaaca gctttacaca 59460
aacctaagca tcaaaaaccc aatgctatca tcacttcatc aacccaaaaa cccataagac 59520
tcaaatcaat gtggtatcag agatagttac ctcggagaag agagagctcg agagagatag 59580
ctcgagagag agaactcggg agagagagcg agagagagag agagagagag agagagagag 59640
ag 59642
<210> 4
<211> 28086
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<220>
<221> modified_base
<222> (27461)..(27461)
<223> a, c, t, g, unknown or other
<220>
<221> modified_base
<222> (27463)..(27463)
<223> a, c, t, g, unknown or other
<220>
<221> modified_base
<222> (27465)..(27465)
<223> a, c, t, g, unknown or other
<220>
<221> modified_base
<222> (27467)..(27467)
<223> a, c, t, g, unknown or other
<220>
<221> modified_base
<222> (27470)..(27470)
<223> a, c, t, g, unknown or other
<400> 4
tttttttttt tgcttaaatt ttaaaaaaaa aattaaaaac taaccaactg cgaaccgcca 60
cgtgtcagta tggtccgcga acagtacaag aactacacca aattcgcctc ttgagaaaag 120
aagaaaatag tgggttttag ttttttgtgg gcccacactt cttaagaacc ccttaaaaat 180
cagggataaa gatagctcta agtggtagcc tcatttgaga atagaatatg ctttattggt 240
gtttccactt tgttaatttc tcttgttctc ttgcatcaaa taaaactagg aatacaaatt 300
tgaaaatact gttttgaaag aaccaaaatc tctattaaaa tccaacatag gacgaatgaa 360
aattttctaa aattatgtag gaacagtttt acgagctaca ctaatagcaa tatctttatt 420
attaactggt caaatgatat acatactaaa agtttgattt gtaaatcaac acgccttggg 480
ctagtggtat ttgagagata atttcaatac agtgaacccg cagttcgatc tctgttggcc 540
ataaaataat ttaacattgt acttttgaga tctacagaat aatcggttga tcatattgtg 600
gttaattcaa aaaaaagttc aatttgtatt taaaaaaaaa acttaaaagg aaaatcaaaa 660
tcttttaaga tatatcgcag acatgcgcat cagaaaggct tttatctatt tgggccgtaa 720
agtattgtcc attacttaaa aagtgacaac tccgtgacat tattgttgtg ctgggaccca 780
aaaacggcgt gcattttgtc gactctcagt cgaacttttt cttttgtccg tcccaccatc 840
aaaaagtttt taagaccttt ttgattgtaa gtttgtaact aaaaacatag agaaaacgaa 900
caaaaacttt tacgatttgt aatgtaaata catttaataa aaaaaagttt cacgagtaca 960
tttttaactt aaaaacaacc agaaataagt aaaaccaaag gagtgtttta ttcctaaata 1020
gagctaggaa gaaagattaa ttgattttgg atttgtcaga agcataaacg tagagatctg 1080
gatctgtctc gtagaagaca atatcaccag tgtcactgac gtaatgatct ttcttaatac 1140
ttgccaccaa actttccact aagtggatcg gtattgctcc tgacgtcttt ggttctctgt 1200
agtatcttcc caacacatgt ttagctgctt tcgtctgtcg catgtcatta attaagatca 1260
ctaatttagt aattaatcac cctttaatat aatcaaatga aactagagag agagcgagat 1320
cactcacggc atcgaccaag tgatagtgag ggatttgtgg gaaaagatga tggatcacgt 1380
gagttccaat atcgtgatga atgttgttga agatcccgta atctctatca acagttgtta 1440
atcctccacg taaataactc cattcctatt attgtacaaa aacatcaaaa attcagatta 1500
ttcaactact aatcattatt gcttcttata aataatgttg atctacttac cttgcctctg 1560
taccaaggca gcttatcatc gtgaccatga tgatgcaagt acgtgacagc gtccaaccac 1620
attacaaaga tctgaaattt ttccaaaact tttatgtcaa aaacaaatta tattagcaat 1680
gatataataa agaaatatat gaaacttaca atgtaaggaa caccatagac ttttagaact 1740
gtgactggac caacgaggaa tgatagataa acaagagtgg ccaacacgat cgaccagcaa 1800
gtagttgaag ttgcaataag ctttctctcg cttggggcaa ataaactact gtatgggtta 1860
taatgtgacc cttctttacc aggacttctg taccactgta gtcatcccca aacaaattta 1920
atttatattt agttaatact caaaatctaa aaattcaaaa ttgtaattat aatcaggaag 1980
aaaaattagg aattaggatt taccagatag agagggtaag cgagcatggg gagagggaca 2040
gtgtatctga gcatccgtgt actgtgggac aaattcttgt ataatttttc tggcaactgg 2100
aatgcaaaat taagattaaa atgtaaatta atatttaaca gtatggttat atattcgaat 2160
ttattcattg catgtggtgt gtttataagt ttttcttttt attagttcta cgtaaactcc 2220
aaaattgaaa aatactaaga aaagtaaacg aatttcgaga agaatcattt tatgccaatg 2280
gctcgaatat aagtggtccg ttgttaaagt taactacagt actataaaca atttaaatca 2340
gttgtttact acagctaaac gacaaatctg acaagtggtc gtcctagcct caaactggaa 2400
aaaggattga ttaaaataaa tacatagaat cctaagaaaa ttaaaatgaa agaatttcaa 2460
aaaaaagaaa aaaaatatga gagagggaaa gattaccgga acccaagact cgtcgttttc 2520
aacatggcca tggttctggt ggtgtgtccg atggcttatt ctcctgcaac caccctcagt 2580
tataaaataa actattattt tattttcata aaaatgaaat tggaattgtc aataacatat 2640
cattttcgaa gcagatggta agagcatgtt taacggggtt tttaagatgg gattcttatc 2700
agaatataaa actcaacccc aacatgaggc catgattaaa actgtttttt ggtttcttaa 2760
tttttttctc cgattaaaaa aataaattaa attaaaaaag aaaccaatcg cggaccacca 2820
ccagtgggat ccacaaacag tacaagtaaa agaccaaaat cgatccttct ttcgcgactt 2880
ttgtaaccgg ttttttgttt tttttgggcc cacactatat cttattatta atattttgtt 2940
aaggaccctt cttagagcac taagagcatg attattgaga agttctcagg gtggagttct 3000
tagcggaata taagaactcg tctcttgatt tttaactaaa aaaactaaaa aacggttctt 3060
aaatacgagt tttaaaagcc ggttcttaat ttttttagtt aaaagttaag agatagattc 3120
ttatattccg gtaagaacct cactctagga acttctcaat aatcatgctc taagaaaccc 3180
catagaacat gctcactcgt ttaactaagt tattcatttt tgagcaacaa acaagtgtat 3240
ctaggaaaat gatgcatgtt cgtagacatt tcaagctgat gtatccattt aacaataaaa 3300
taagccatta aaacaaaaat atataaatat tattaaactc acatatgaag ctacattaat 3360
ttattcaagg acatgtcata tgataatagc taattggacc ataaataggc ccatagcatt 3420
aaataaaagt ttggttcttt tttcttcgat gctaaagatt ttgatgcttt tagtcacatg 3480
cattatttta ctatggaaaa ttaatatatt ttcagttatc agattacagt ttgctaacat 3540
gcaccaagaa tgacaaggaa aatgtaagaa atacgaaaac aagaataaat ttgcatgaaa 3600
aagatgttta aataaatgac ttaccaacca tggtatggaa cgagaatgaa ggaatgaaga 3660
atatgaccaa ccgcagtatt cagaagagga atgtctgaga agctcccatg tccactgtat 3720
tattcaaatt gaattttaca tcataaacat gtttatcatt tattgcacaa tgttaattaa 3780
actttactca attcaaacgt tccaacaagg taacaaaaat agaatatgac gtgtcacatg 3840
actatatttc gaaagtagat tggaacaaca cacaataatt aaaagaatca atatacagta 3900
attatattgt tactttcaaa caataaaatg tgttttattg aaactttcaa acgtagatcc 3960
ataaaatgcg gaaccaacaa taattatagg aaagaaaaag atgtttagtt aggacttatg 4020
agtgttacga tttgatcaaa aaaaaaagtt agcagtgtta cgactgaaaa agagaagaat 4080
taaaaatctt agatcccctt ttgcttttaa aataggccaa tttgggtgaa cataataatt 4140
ttttttttta aaagtaaacc tgaagagaat caaatcttga agtcagtgaa aatctcatat 4200
cgaacgtgcg ttcaagaaat caaagacgat gcaaaaaacg aaaaaacata taaacatatc 4260
aaaattaaga agttgaagaa aaaataaatt gaaaattaaa ttaccagtcg tggccgagta 4320
cgaagatggc ccagaaaagg gttccttggg cggcccaata aagaggccag aagaaccagc 4380
tatcaaaata cacggcggcg acggccagag ccacgacgga gaaaatgtct ctcgcgacgt 4440
agctcatgga tctcaaagga ctcttgaccc aacaatgctt aggaatcgca gcccttatat 4500
ctccgatctt aaacggtggt tgtgcgctcg gatcaaacct ttcgtccttg gaatctccgt 4560
tcacattgct acgctggtcc atagcgacaa ccatcgccgg agaaagagag agctttgagg 4620
gatgtttctc tctctctaaa actgtgtggg ctctgagtga aatgtggtgg agagagtttg 4680
atggactttg gggtatgtgt ggtttgttta tataaaggga gaagatgtgt agagacacca 4740
aactgttttc tttttttctt aatttaggaa acttttttat tctttgaaga ataaaaattg 4800
tatttttgcg gtaacctgtg cgcaatgtat ctttgttacg tcgttcattt cgatgaaaac 4860
taagttagag aaatgtgtta caaaaaaaac aatgctataa aatttacaga agattttaaa 4920
attgcattat cgagtataag taaccatggt aatggtatca aaatttacca agattttctt 4980
cttttgtttc tctttagttt ttccttagaa gtaaggattg tgcaccgaaa tggtagtcaa 5040
cttgtatggt ttttcatttt cactgattga tatttacaat ttcgcaaaaa aaatacatgt 5100
agtcgaaaat attatgttag tcttcgtact ctattttgtt tctgctaaaa tttcctgact 5160
atgtataaat cataaaaaac gatccatatg gatatcatgt agattgtaga catgccaaca 5220
tttatataga ttttttttaa aacgtattaa tttgagggaa aatagttgcc acatcactgt 5280
gatgtatttg acttaagaaa cagacttcca tcagttttta tttattttag acgacttaaa 5340
ttggcggttt atacaatgta attgttattt tccccagttt gtcattaatt agttaatggg 5400
aaaatcagtt ggattgattg aaccgattca cttgatcccg aaataacaac accaaaatag 5460
aaccaatgtg tggggtaggg tttgaaagaa tttcttaaaa aaatggtaca attttttttg 5520
gactaaaaac atggtataat tccaactata ttttatcggt ttaacttttg acatataatt 5580
aactttgaat ggtgaataaa gtcataaact aagatcaaaa catttatggt gttttgataa 5640
taaaagacat ttatgggtta gtcaatgaga catcatattt tagaaatgca ggcaagatgg 5700
cgtttcctgg ccagcctcga gatttcgggg gcttatgcga tattggtaaa gatttcatta 5760
aaaaaattta aaaaaatttg gaggtctttt taaaaaattt gggggcctat atttatgtag 5820
tttttttcaa aaaaattagg ggtcctaaac gaatgtttca tccggctttg cccaggaaca 5880
gctctgctct acctcttctt ctctcttaaa ttaattttcc aacacgtctt tacgagataa 5940
gcatcaacta attgctacaa ttgtatacag aatttactta gctgctgcct ccattaacta 6000
catttcaggt tatatggtag tgtatgtgca ttgattataa atacgcagct tcattgcata 6060
tattcaaact ttttgttgga atgatttccc catctttaag aatcgggtaa tggacgtgaa 6120
ccgtgggttt actgtttaat ttattaacta tacttatatc agttttttaa tatttaattt 6180
tatatgagaa atcgattaat attactaaaa cacaaaaaat tgttttcttg cgttatttta 6240
tggtttttgt cactgaattt gaacatgata ttttctcttt cattaaaggc aaattaccct 6300
gttatggttt gagccagaga ccaaatacta tatattacgt ctatatatac ttaatcaaaa 6360
taagagaaga ttatatgcac tctaccttta aacgtgagat ctccaaaact gtcataaaaa 6420
cgtgatctca tttcttcttc caataacata tatcaatatt gtacatccaa ttccttcctc 6480
cataaaaacg tgaacacctt tcttcttcca atcgtaatat caatgttgtt catccagttc 6540
cttcctccac aagcttttta tcggaagaat ctgcaagcgt gttaaacaaa ccaccatgga 6600
agatgtaccc cagcttctgt gagagttttg gagaaaggag atctacatgc aatttcttct 6660
agcaatcttt tttaacgtaa aacatttaat tttctcatat gtgattctat gatgcttgat 6720
aattaaaata tgatggcctt aatgaataat cttgatgatg tttttagtaa gtcaacagtt 6780
tagcatatga gattaacttt ttaaatattc atttataaaa tttactgcag tttgtataat 6840
aactaattac ataacaccat attcttggat ctaaaagcat ctccaatata aaattctatt 6900
ttttcttcta aaatagaata attcgattgt atagttagtt tactccaatc ctactcattt 6960
ttggagtgaa agcaatgatg aacaaaaaaa taaaaaaaaa tctatttatt ctattataag 7020
tggaaaatat aatgtggttg aagcatttat ttactctaaa ctcctttttg aaataaatta 7080
tgaggtggga ttggaactat tctaattgct caaattctta tgactatata tctaggtaag 7140
ccatggaaaa ggaaaggtac aaatgatgag tgtgggcgta tacatgaagc ctgcacgtga 7200
gagttgtagc tactcgacaa acgtatacta atttgttgcg taccatctcc acttcatata 7260
tatatttata tatctatgtg tgttgagctg agatatgaga ataaaatttg agaatatacc 7320
tcaaaaatgc aaagagaagt atgtgtttgt tatttagcag atgcacatgg tggaggacat 7380
ccttcgattt cctcgtgaat tccgaagagc taagttattt tcttttaatt atacagcttt 7440
aaccgagcta attaattaat cgttacataa tttgagcact gtttgaagaa ggcagcgtat 7500
atatacacat tagtatagta atacagttat ataggatcca gttttctttg tttgaaaaca 7560
ctcatatgaa taatatatac ttttaaaaca cgacctgtaa cattttttga cccggtttat 7620
atgtatgtga ttcatatatt tctctaacca cgatcgagta cgactaaatg tgcttatcaa 7680
ttatcataca cgtctctacg tgttcatcta tcttttatta tttttatcaa ccattcgtat 7740
tcgtgtacgt tgaaaggaat cattacgtag atgcccacga tgttaccgaa gttggagaat 7800
tatgttattt agaaaaccca tttttaatta cgctaattac caaaactaat atggggtcgt 7860
aagaatatgc tttcggtagg cttcgcgttc taaatttaca aactatagca gtcaacatat 7920
aagaggttaa atgtattaga ctgaattttt tttaatgtgt ggtgtggggt tacaaagaaa 7980
taaaaacggg attagtgaag cttattggtt actaatttcg aaataatcat gcatggtaaa 8040
aaatcatgtt atacattgtt gtatcagacc aaaaaaatgc tatctcggat tttgaatatt 8100
ttacagtcaa aataagtaga tttaaaagaa tcttgtatta ctgaagttgg aatttagaga 8160
ttattttgaa aattagatag ttgaaaattg attagatcgt tgtagtgatg agttgacaaa 8220
aaataaggtg gtctaaatat atggaaattt cgtcctgaag ataacaaagg cctttgatct 8280
tgcatctagt gcattattaa tagaagaata ttcacaagaa tcttgtgctg tgtgaccatt 8340
tttgtagaac aatggccaca ggaaatgtta tgtttcttgt atctagaaca atagtatcgg 8400
gaggactaat tgtcaccaaa actgaaaaaa taacaagtta actaagtgta tcgatacata 8460
ttcacagtcg aaataattaa tagaggacaa cttgtccatc agttgttaat cttggtggaa 8520
aaggttgctt gttaattgtg ttaaatgcga gtagagtata agcggattta catgtaggaa 8580
aatataggaa gaacataaat attggttgaa aaattgcatc acatttttac caaaaaaaaa 8640
ttgcatcaca tgcatattat tcgcatgaga tgtttaaaga aaggcccacc gcacgcgagt 8700
ttaatctcca atggaaagac ttacagaaag gtcaaagttc tttatcaaca gacaacagga 8760
tatgtgtgcg tagattgtaa aacacgtagt tatctataca taaactaatt cttaaattcg 8820
ttatgtatag tttttttggc aggaaaaaag catagaacca taaagaagaa gaacggttga 8880
agatcacgat ctattcatga atacgtgtcc tcagctttaa accactcaca tggacggttt 8940
aatatctaac aaagcattgt ttttccaaag atactttatt actgtactag gcggcaatcc 9000
agctgataat tagatgaaaa ctaacaccat ttaaataatt taaagttagg tttgtaccaa 9060
taataatgtc taattggacg gcttagagaa gaaaaagatg ggacgtacgt gcacgtgcgg 9120
accgacgaaa cacgttgtcc tctgttcaca taagcaatgg ctctcggctt tctaaaaata 9180
tctctaacta tgcagtgaat tacttgacct aaaccatgtc atttcgtgca accccaacaa 9240
attcctggct tccttttttt gtggttcatc aatcttttct taggacaaaa cgtttttttt 9300
gtttatgtca gttaataaat gatcaagtcg agtctcgttg acaactagat atcaacgcat 9360
atctggtaga tcactataaa actcagatta tgggtgcatg ttttggatat taaagcaaat 9420
atgtttaggt ttggaatatc agggtatata aaaagatata gtttttgttc ttacggaaaa 9480
gaaactcaaa ttaatgaaca ttaggcttga agtcatataa tcaaacgtgt aaatgacatt 9540
ctttagtaat gattttgttt cccgcagttt aaaaagaaat ctcactcatg actaatgtct 9600
acaaaagtag acaaaggatt cttagttgat tctttagtaa tggttgaata gagctgaaag 9660
ctaaagtcat agcatacatt tggtcacttt catgaattta catatataga taaaaatatc 9720
aactagttca ataagatatg attgttttat caaacagaac atcatgagtt ggagtcttga 9780
aatcatttta acctgttttg ctgagagcaa aaatattgat ttaaataaca attgtgagat 9840
aggcaaataa tctcacgtct tacttttcac atatataata cacatatagt tcatatagtg 9900
ggtttgcgtt aaaatagaaa taccattttc atccacaact aattgataaa agaaacattt 9960
ggtatcggga tctaaacgaa atattcacca atcaaattta attttatata tagttttata 10020
atgaggagac gagaagatat ttatgaagac aattattaat tatgtatgtg aatatgattc 10080
gttttctttt ggatttatag agctatagta gcaatccgta gagaagaaat ctgaatcgga 10140
tataacgcca aaagagagat catatgagtt ctaaaaactt aaccacgaca atgttatctg 10200
tccatattat ccatcttcgc acttcatttt gttccatctc ttgtccattc tctatctcta 10260
catgacatta cgtttcctta acatacatgc ttccattatg tttctgtgta aaattaatta 10320
cggttacatt atttattgat ttgcattaca tgtatgattt ggagatgcat acacttggaa 10380
ggagtatacg agcatgcgtg acaactgaca tgaacatgtg aatatttaag atccaaactt 10440
ccaagtatct tataattcaa tcagaataga aactttaaat tataactctt tgttgccaaa 10500
aaaattataa ctccttcagg gatctatcca caaaatccaa atatagcaca aactaataat 10560
tagtttatca gaatgcttaa tgcttgacta ttaaatattt cttctgattc ttttcccttc 10620
aaacaaaacc acagcaacca aaattatcat taaaaaacga caattttaaa accttctctt 10680
tctccgggaa ggttatgtta ttatattatt gtaaatcaaa ccgagacttt ggtctctggc 10740
acaagtcagt tatacggcta atgtcacggc caaagaagaa agtggtaatt tagctgatga 10800
agatagtagg agttttctcc agcttatgac tcgatctcca tatgtaccag ctcacgaagc 10860
cggtcactgg tattcctttg gcgtcctgac caaataatct atctcaacca cattgcttac 10920
gagtgaagtt cattcaaaaa gaaatctcga gtcaaagtga tggatttcgt tttaagaatt 10980
ttccttgagc tcaatgagca tttaaaatgt cccaggccaa aagttctttt cttaataaaa 11040
tttgtgaacc gaaacaaaac attcttctct taacaggtct ttgggcctgc tgttgaaaga 11100
aacagatatt taggcccata tatagtaaaa tttttatggg gcttatagaa atcagatatg 11160
agatattcca taattatcaa attagttcac gagaacctca agtgataggt agaagttgaa 11220
taagattatc agtccagatg aatgccttaa tcttgggaaa gtcatcactt catatgtctg 11280
agaagacgtt tactaacttc aaagttttgt ttgtaaaaaa aaaatcaata tgtgaaatca 11340
aataaactgc atgaacacac acaaagtgaa gtatacaaaa agctgaaatc tagtaagatt 11400
aaataaagct gaaatcgatg tagaaacaga aaatacaaat aaaggtttta tttttgagtt 11460
atttttattg ctctctcagt atacatacat tatttgtaag cttgcaagta aaattaagaa 11520
gacaaaaaag attatcaccc tctcaacgtt tgcgtcctcg gccgccgcga ggtggatcgt 11580
gtctgccgtt agctgaaggt tcaccgtagt cgttggtgct caccatcaat gaccgttctc 11640
tcaccaccct catttcattt tctgtcatat atgcatatac gttacaagtt agaacatagt 11700
gagaatataa aatgttgtac ataagaacct cttattaaca aacgatttat taattaagta 11760
tctatacaaa cgtcaatacc ctcgttttca ttttgtttta actacatcga catgcattca 11820
taatctttta actttatttg cacataaatt tataaacgta tattgatata tatgtttcga 11880
tggttgtgtt ataaacttaa atttataaac atatattgat atctgctaaa aagaatagat 11940
ttaaacacac ccaaattcga cctttttgtg tgtgttggat gtcggtttca caaatcgaaa 12000
tctttgcttg gatttttcac agatagtcag atacgatgga ctaagatcca tttcaacttg 12060
ctattttatg caatttaata ttatctgtaa acttcaatta tatagtcgtg atcttatctg 12120
tcattgtctt tttcaaataa tgtcaacgct tttgaagtgt gaacacaaat taaatatcaa 12180
gcttttatat tacatggttg tactttacaa aaactcataa tacttcaaaa aaatatttaa 12240
aatactttgt tttcttcatt agatttatag tttataattt tatatgacgt tttcttactg 12300
gattcgtcgt tatcacagat atgttctttt aaaagaacaa gtcatcggcg aaaggaaaga 12360
caatctcgag catcgtgatt catgtttgct tgaatttgaa tacaaacaag ctggaaacag 12420
agcgcataaa actaaggata tatccaactt gttttaacaa tatatatttc aacacttatt 12480
caagtaataa ttgtaataat ttagttgtgg gtttctgtag tgatttaaaa tgaaaggtca 12540
atgaagttca catgaactaa ttagtgtgtt attcttttgt tatttgtatg ggttcatcat 12600
gtgttattct tttgttaatc agagtatgta tgcatatcta gggataattg gtatcatgta 12660
aatacgaagg ataaatatac atacaattat ttattttgct tgtgtaattg agattttctt 12720
gttttcttta ttaaaaaggt aaaaactgtt aaggctttct tcttctcctg gtgatatatt 12780
tgaacatact cttaagatat acacagattt acagatatag atcatgtgac taccaccaca 12840
tatcaccgat cagtgatcca ataattgtgg ttgtaaaata tttgattctg agatctcatc 12900
caataacaca taaaatagta aactagatta gttttaacgt taaacaaaga tgatatatgt 12960
agttattagt gaagaaatcc ttatgagttg ttaacaggat atggattatg aagaacttgt 13020
tagcttatat atagtgcttg gatattagat aaccaataca tattaccata caaaaagcta 13080
gtaaacactt gaaactaata gagaaacgaa gggagggaag aagagtatac ctggaaatga 13140
aagactgagg cgagcagaag aagagacgaa agcaaatgtg aagaagagta acaaacataa 13200
cacaaccgag gaagatgatg cataacccat tctctctata tatatatttc tctctctcct 13260
cccttcttct atatatatag accacaaaat gtctcatacc ggcccttcgt tttcagcctt 13320
tctcactatt taatcatttt gatttttatt aatatacccg cttccaaacg tttagttttt 13380
acataattgc gtttgaaagg aacatattct ctataatcta atggttttgt attcaatgcg 13440
tgtatatgca tgtgtttgtt gttgacaagc acaaaaacaa gggaacatga ttgcatttac 13500
atacggtagg tttgacaaga ctgaagtggg atccctttaa accatcaacg aattaaaatt 13560
cattttttca ttgtattggt tacaacagaa ctcaaatgcc agcttaaaat ccaacccatt 13620
gctatttttg attttataat agctttagag gcacaatgat tccaaatcca ttactatttc 13680
ttattctaaa atagaaatta ctattttttg ccaaaaaaaa atagaaatta ttattttgtc 13740
ctctatttat agaggaagaa ataacagtct ctatttttac tctatatttt gaagattgct 13800
attataaaga aatacattag agtaaacttc acctttttat aaagattttc tattttagag 13860
gcaaaaatag caaaatacat tggttttagt aatgggtttt agtagaataa tttaatactt 13920
tcattgtaca aattaaaaaa ctttgttagt tatcacatac attcaattag gataatcata 13980
acataaaaac aagtacagac cacccgagtc tagattatca agaacaagaa agcattatat 14040
gtctggtttt gtacccccat caacttaaga ttctcttgaa cataggcaac acacaagttt 14100
acacatacat agcataagag atccaagtac ttcaagaaag cataggatcg gataaatcgg 14160
aaaatacatc atcgtttttt gaaaccatat ttcttacgtt catagaagag atcggtcttg 14220
gcactcccaa ggttgacgat cttggggcaa ccatctctgt ctttctcctg ctgcgtacac 14280
tctttgcagt agtaagcatc cgagatccca acacctccgc agataacaca gcggccttgg 14340
aatgacccgt agttgcattc gtcacagata cgcaccagag tgcagggacg cacataagaa 14400
tcacaaacca cgcatttgcc gtcgcatttc tcgcacagcc ttccgatggc aatgcctggt 14460
tgtttccggc acatgatcag atcagggtga tgctttgcca tggctagtga aacacagacc 14520
tgcacacata agtcacttgt cttgagctca tatgatcgta aagagtacaa aactagaaac 14580
tgaagaacaa gaagcaactt aaagtcctgt tttcacttgt gtctgaacaa tcaattaaaa 14640
gaaaaagaga gtaaaaaaat tggaaaataa agtttgtgta gcagtgttaa cttctcagag 14700
gaatatcatc gaacacctta catgcacaag tctcagccga acattactct ttcaagattg 14760
cagattctag agacatgatc aatcactcta cgaaatataa ttaataatgg gctgagaaaa 14820
caaattgaac aaaagaagga aatcaagaag ctatcacaaa ccctaaaaat tcaaaatcaa 14880
gaaacaaacg aagacgataa ccaatctgga ggagtcctct ttagagataa aaaaaaaaaa 14940
ccaaagctta cagttaacgg gagatcaaac tcgagcaaat caagagactg ttgcgacgag 15000
aaatttccag agcgccaaag atcaaccaac caagaaaggt ctggaacgaa cgaggcaagg 15060
aggaaattta tcacgagtag agctttttaa atcggtccac ttgttatggg ctttttactt 15120
tgggcttaca aactcttcat caaaccaaac caagccggta agcaatgtaa aatccagggc 15180
ctaaaccaaa ccaggttaaa cagcaatctg agttgcgact aaaagtgtcg gtctcggtct 15240
ccgtctccgt ctcagaccca atttttattt catcagccgt tagctttgac ttctgactag 15300
cataacgtga ctttgttgct acaatggtac acaatatact tcttttttta attgggaaaa 15360
tcgcattttt aaccttcaaa gtgacatttt ctaacacttt aaacctccaa cctttttcac 15420
tagcacttca atacctcaac cctcaaaact tatcatatta aaccttgaag tcgtttcccg 15480
ctcttaagcc tccaggcgat ttgacggtaa tgttcacgcc gtcatcctca ctaaaaacgt 15540
gtgtcgtttt tttaattaaa aaacaccaga tacgtttttt atctttttta tctgttctaa 15600
atcgaattgg ggatctaggg tttactcaaa atcaaaatca gaaggagaaa gctcgatact 15660
tggcgacgag caagagattc gaacagagta cgtcgtctca attgatttgt taagcatctt 15720
agtatagcaa gttgtttctg ggctttgttt ttcacttcat aaatcatgta tatgtgtaga 15780
tagcgataat tgtctgagtt agaattggtt tcacttcgtg aatcatgtat atcaagttgt 15840
gtagaagctc ttttacatgt ttatatcaga taatggtgtt gtatatgtgt agatggcaca 15900
cagttcaagt tcatcaaacg ttgtgtacaa aaacgaaaaa ggtgtggttt gcaattgtaa 15960
ctgcttagca aacgttgttc aagcttggac tgatgacaat cccgggagga ggttctatag 16020
ctgcgaaaaa cgcaagactg gagatgaata tgattgttgt aacttttttc agtggtatga 16080
tgttgagaag cctcatggat ggcagcgtga tgcattgatt ggtgctagaa atgttaatcg 16140
ccaacaaaga gaggagatta agagtctgag gaacaagata agagcactta gggaaaacat 16200
gggaccaaat tcaatagatt tgaaggaaaa aactgaagca tgtgacgcat gtgaagggct 16260
caaaagggag gtgctgatac taaacgagag gagcagagtg tatcgcaatg ttctcataac 16320
gtcatcagtt ggattcactg ttgttcttgg tgtgttcatt ggtgtgttga agtggtagaa 16380
ggttattcaa agttgtttga tgattttatg actatgttat gactatgtaa gctatttgat 16440
gttatgacta tttatgcttg tttgaaggtg ttaagactaa gatgattatt atgtttcaat 16500
gttatatttt tgtcatataa agtaaaaaaa catcaagatc ataaaaccga accaaacaaa 16560
ctacattaag tcatgtcatg agaacaacaa aagacaaatt ttaagtcatg agaacaacaa 16620
aagacaaatt ccaagtcatg tgaacaacaa aagtcattga cacaaaaaaa gacagattcc 16680
gagaagacac ataaacaaca tcaagatcat acatagattt aatcactctt gtggaggagg 16740
ttgtgggttt aggtcggacc tatcataaac tcgatctcca agcacctcaa aaggtcgatt 16800
tgtgaatgga ctccataatg tcccaacacc atgaggaata ttagttatct tccttacctt 16860
caaaggaagt cctcttggag ctttcttggc atgaggcttt ggatcagtgg atgaaactga 16920
tggctgtgga gcagtagagt gagttggtat ctgagaggat gattcagcag cttgaacagg 16980
ttgagaagag cttgttcttt ttcttcttgt tgaaggaggc ttaggcggac cctgaatcaa 17040
aaataaatgt taacatagat gcattgtgta taaattaaag agtatacgag taacttacca 17100
ctggatgtat acgaggtcgt acacgtttgt tctttggacc ctcataaacc acttgttcat 17160
ttttgcagcc acttttaatg tgacccatct gaaggcaacg gctacatttg ggcacacgtc 17220
cgtgtcttgt cgattttcca gcgttttcaa ggtcttcaaa tggctctttt ctcctctctc 17280
ttgttcttgg tctacctctt ggcttcctta actctggtat tcctattgat ggttttccta 17340
gcctcttcca caagttttca ccattgacgg gcttgatgtt ctcgttgtat gttttcttca 17400
tcttatgggt gtagtaatac tcggatgtat acttcacagg gtcttcttga ttatcatcaa 17460
acacacagac atcatgtttg caaggtatac cagtaagatc ccatcgcctg caagcacact 17520
gatgtgttgc caaattcact gtgtaaccat tatcacactc attaacctca tacaaacttg 17580
agctgcttcg tagtgttgaa caatatttct tggcaatcct tgctttctcc aataaagcaa 17640
gtgtgattgg tgtaacaata gtatcccact tatctgccat aaaccaccgc cttgaattcc 17700
tcttcatagc ttgtcttcga atgtcctcca acatagttat cacgggtttc gcccttgcca 17760
tctttatggt tctgttgaag ctctcagata agttattatg cacgtcagga cagtgtgaat 17820
caacactgaa atatgctcta caccacctct tagggtctgt cttgagtaac tcttggtgtg 17880
ctacaacatt atatgcctct aatagactca acttctcttc atactctcct ttagtgtagc 17940
tgtaagcaac tccccaaaac aaagatttaa actctgatct cgcaaaccca agcttcttcc 18000
aattcgcata aatatgtcta gcacacatgc ggtgttctgc atcagggagt tccaactgta 18060
tggcatgaac aagacctttt tgtttatccg aaatgatggt cagatccttg ccatttccca 18120
agtcgagatc catctttagc ttcttcacaa accagcccca agtgtctttg ttttcccctc 18180
ttacaactgc ccaagcaatg ggaaacattc tgttatcagc gtctctacca actgctgcaa 18240
gcaaatctcc atttaaatcc cactttaaga agcatccatc aagacctatt acaggtctac 18300
aacaactctt ccatgattca cgtaattcct tgaagcaaat ataaaagcag tcaaacatct 18360
gaacaccgtt agcctctctt gtgcataatt cagtgcttat accaccattt gatctatgta 18420
actctgcttc ataatcccat atcttgaata gtcggatttt catcctctga ttcttcaggc 18480
tcatcgtctt cctttggtct gtcaacatct tcatcttcat cactacacga acgctcgtct 18540
tgttcggtgt ttggtatgtg ttccacgaac acttcaacaa catctactcc tagcttcccc 18600
gcagaacgaa gtatacgcat ctcctcatcc aagtaatcat atgcatatct caggtctttc 18660
atctcctctt tctcgaactt gaaccaaagc agtccaattg gtgctcgtat cagtgaatct 18720
tccttgcaaa acagactgaa cctctcccat gtgatctcgt caatcttcca ctccacattt 18780
ttggtgcccg tttcaccaac atacgcatat ccttcaccat ccttcttcat tgaacctcca 18840
aaatgaatct ttaacttcat ttatgttgct tccctgtaat caattgctta aactttagac 18900
aatttcgaga gataaaacga atgtaaaact cgaaattttt gaaagaatag atcaaatcga 18960
tgactcgcgg acccttaccc catatttgct ttgattcacg aaatttccta tcacttaatc 19020
gagctttctc cttctgattt tgattttgag taaccttaga tccccaattc gatttagaac 19080
agataaaaaa gataaaaaaa cgtatctggt gttttttaat taaaaaaacg acacacgttt 19140
ttagtgagga tgacggcgtg aacattaccg tcaaatcgcc tggaggctta agcgcggaaa 19200
acgacttcaa ggtttaatat gataagtttt gagggttgag gtattgaagt gctagtgaaa 19260
aaggttggag gtttaaagtg ctagaaagtg tcactttgaa ggttaaaaat gcgattttcc 19320
cttttttaat tagtatactt tctctatatt tcactccaat agcatctcca atgtacacct 19380
ctataatttt ttctaaaata tagatttcta ttataaaggt gaaaatgctc caatatatgc 19440
ctctataata tagttcatct atttatacgg gaaaatatat aaatatattt tttctatatt 19500
ttcttttaaa atagaagaac tctattatag aggcatacat tagagcattt tcacctctat 19560
aatagagttt ctctatttta gagaaaaaat atagagatag aattagaggc gggttggaga 19620
aggtctaata gtataactct ttggatttgt tccatggttc attctaacat aattactaga 19680
tctcgatccc cgcaaccgcg cagatttttg ttttcattta tttttatata aatattttgt 19740
tttcaattct aaattggtat atattataat agatgcgtct atcaattttt aaagcataat 19800
aaatttaccg tatatttttt tctttgaata gattgtttca aacattcaca tgtatttgta 19860
ttttcttcta tatatatatt tcagattatt atttcattat taaaatcgta actatatatt 19920
taaagattag taaaatattg ttttattgtc atattcaaag atattgtaac atttcacaaa 19980
tttagaaagt ttttaaaaaa ttaaaatttt cgcttcgtag atttatatta tcgagtaaat 20040
aattaaacat ttggtttttg tttaattttt aaaataaact atataattta aaatttgttt 20100
tcattggttt aaggtagtaa atattaataa ttgttagata atatgatttt tgttatttta 20160
aaaaaaatat ttataatttt aaaagttaac atcgacaaat atttaaatat ttaacatatg 20220
gaggtatagt atattacaat attaaattat atatatttaa gttatactat ctataaatcc 20280
aatggataat ctattgttta aatccaatta ttgatagtcc aataaaaatt tctggtaggc 20340
caaaaattta aatgatataa ttatacttta aatgtaacat gacttcatag gaataagttc 20400
attaggtcaa tttttttaaa aatcacatat gaatcaagtt atgacttcta ttttaatata 20460
taagatattt tcacaaaaga tagagatcat ctttttctgc gctgggaatg gagtgctgat 20520
ctttggaaca tttgtctgcg aagaatgggg tattccaatg tggagttcca taaatggtta 20580
gccttctacg aatggtaagg ctgcatgaca aagttgtgcc aaggcttctc agacccttgg 20640
tagtctcaac aacaatctat ttcatttgct ctcagagaaa cgagcgctat tatgttaata 20700
tctcatcgca gccaacaatc attttcaagc tgcttgaccg tttcattaca aatgcacttc 20760
tattcattag aaatcaaaaa cagagctgcg gactgatgca agtatgcaac attggctttc 20820
caagtatgca acattggctt tccagggaat taaaaccata gtctgaacta tacccatttt 20880
aatggaattt acatatgtgg caaaaaaaaa atacaagtca agaggcagac atatatactt 20940
ctttttttta attagaagca agagttttaa ataaactgaa atttttcata aaatttaaag 21000
taattattta caaaaattaa atttaagcta attattaaaa attaaaaatc aaaattaagc 21060
atgccactga atataaaact atgtaaatgc taatctaact agatgttgtg gctgatttgt 21120
tgaactttgt agaaatgatg ctgataaaaa tgttataaat gatctgatgt aactagggat 21180
tctttttgtt ttattttgta ataaatgaag aaaaatattt ttaccattat aattttttat 21240
atatcttaga aaataaggtg ttcgttatat cccaacagta gtttttaatt ggactagatc 21300
tttttgtgtt tgtatatttt tcgtcttttt tatgtattgg tttatttttt tgttatttta 21360
ttgatttcaa atattttttt gtctcaaatt tcttatttag attagttacc atttttaaat 21420
tttgtacttc tgaatattta gttatactct ttattttctt agttatttta atatagtatt 21480
gcatatttag atacaaagga aaatagtacg tgtaaaaatt aaataatgta gacatatttt 21540
tccttgtctg gttttcttca tcccatgtaa aaatccacct aactttgatg taggtttttg 21600
tcatgttcca atatacgtat aaagtttttt gttggtaaaa atttacgtat aaagttgttt 21660
cattattttt tcttggagct tcgaataact tttattgact taccaaaata aaatcttgag 21720
tgattttaag gtgaaaacta acatttctgt taaacagtta ttattttttt acatcgttaa 21780
ataattatat taaacattgc atatggttat ttgatatacc aaaatgtatt atttataact 21840
gagactatga gaaacagaat agatgttaaa tgcattactt gtaacctttg gcatcatctt 21900
tgctatatac tcgaattata ttatattaag tattttattg gtctttaaca tttattttaa 21960
tcctgttcta aattgtaatg tattaattat tatttttata tttgtttgtt ttttttttct 22020
cattgtgttc ttttcttaca tatgttttag attaaatatt tttagcatgt attttaaaaa 22080
acctgccttt ctaaaattaa agttatgttg aaccaaataa agttatatat gtagtaaatt 22140
aaaatatact taaagtataa attaaatata atatatatta tttaattgtt gtttaatcta 22200
ttgtgtttgt tatagttaat aatccacatc taacatattt ttaatgttgg tgggaaaaat 22260
aaccttacac atgataaaac caattaaata tgaagtacat gatatcaaat gtgccaaaaa 22320
ctatcctgaa aaactaacat taatcaaaaa ctaaagtaga ttatcttaag tctttactga 22380
tgaaaaaaaa aaaaaaaaaa aaaagtcttt actatatggt acacgaagct actcttctaa 22440
aatgattttt ttctaattaa tatcacttta tgaacaattt tagtttactt attattgtat 22500
tgttttctac tatatcctca aatctaagtt caactggaat ttaattttaa tgaatctttg 22560
tattttttat tttatttgcg ttggcaaatc ctcctgttaa ttttttttta atgtatattt 22620
catattctag taaataactt ttagttccac tcattggtca atagaaaaga aatatttatt 22680
taggaagcta agacgaaatc tgaaccatgc aacaaaaaca aacataaagt cattaaaatt 22740
cagagacaat ttataagtta atcaacatgc aatagaatca gcaatataac cttggcccaa 22800
caccaatggt gatgggagtg atctgcttca ctacatccgg agagcctgct tgcgtacacg 22860
gtgtgaaaat tttcccatat gttggttcct taattatata taacaaaaaa aacatgcagg 22920
ttcctcattc gttagcgtaa gctttgcagc cacatatgat agatatgtca accaaatgtc 22980
aaactctgac caaattcgtt tctaaagcac ataacaatta agactggaaa ctggaagata 23040
tatattcact atcttacaat gactttcata aggtgctcac ttatagaacc aagtgtaata 23100
taaattactc acatatatgt cttctactca catattctca cctgatccct gagcaggtgg 23160
tttgtattga tctagcagtg tgtgtgaaac tggatttggt tggttgagtt ggctgacttg 23220
agacgtctct cacggataaa ctttggcttt gttccaaatc ctattttgta attcatcaca 23280
caaacctatg aagattgatg gaaaaactat catgaaatat atcaattgat gaaaaagtta 23340
gattaatctt accgtaatac atttgaatca gattgaaata gatatatccc accatataaa 23400
ctaaacacta agctgcgtcc cctagcttct gactcctagt gacaataaca aagggaagac 23460
ataagatgga cattcatata gtgaaatctg taactatacc aatatcaata gcttcagaaa 23520
ccatttgtag ggtctgtgga tcatatgtat ttgcagctgt taaagatagc aagatgattc 23580
catggaccac aatcagcttc tggctcactt gtgctccgat tttctcacaa cttttagccc 23640
gtgaaccata tacgtttgtc ttaattacta tatagaacaa agaaaatcaa tatctgctaa 23700
aaatatattt tctttttctg ttgattatgt tctaatccat gtatttttag tttataaacg 23760
ttgaatacaa gatatcttca tatcctaggg atgcttatat aatgcatcct caatgttaat 23820
ttaaataaac aaattagaga gggaagtaag gcaaacgttt catgaaaaaa aattgtagtc 23880
atcgcatacc tcttgtcaat cttccagatg caaagtagat ctataccagc cattgatctc 23940
cactgttctg cgcaagaata attgactcac attccaacac tgagtcctct caacaatacg 24000
tagaacaaag aacagttcct atgggaaagc ataccactta gaacattatc acgttagttt 24060
ggcattaatc actttgttac cagcacgtgg tgctttactt acctcaactt atatctttta 24120
attcgagaag tcatctgtga aaggttgcaa aactgtatga ccagctggca tctttgtgtc 24180
gaaaagtgtt tgtgggaacc gtagaagttc ttgctgctca ttctcaaact tggccagttt 24240
atgcaaacca attcccctga atatccacca taactaaaga gttattttgc tattttagct 24300
cttccacgga cctagaagtg aaaccacaaa ccataacatt gttcagaact accaacctat 24360
atagtgcaaa ggtcctacac atccttggta ttatagtcga attcaaaaca cgcaccgttt 24420
cattctgact ctgaaaggga ttcccaggcc tccactgcga accagataca ctatttgagc 24480
ctgagatttg tgtctttgat atcaaagttt gcttaacaca tccaaacagt gctcacctcg 24540
gaaatctctt tctattatga tcatcgacat caagaaggaa agatcaatca gtaagggttc 24600
taagcaattt cagatataaa cagaaacgcc agtggtgttt agatttaatt tagaaactac 24660
tgaatcagaa aagcgattat taagttaccg gcaatggagg agcaacaacg taaccaatat 24720
tggaggccat ggcgggaatt tgtgttctga aaattgtcat cgtctgtgaa gaaacattgg 24780
attttgagtg tagccgtcgt ctatatagtg aggatggcga gaaggatgga aaatgaagag 24840
gcttcaatat aatgtcaaga aggcttaaaa ggatttgtac ggtgaaagaa aaagagatga 24900
agagctagat agttatggtc tggttcaaga gaaaacgaat ggaattgatg aaacaaagat 24960
aaagaaaata agaatgtgat gatgacgtgg caataaactc tgacctaatc ggttgatttt 25020
ttaatctgag ctggcatcct ctccattcag catatctgct ttttagtatt gttagattat 25080
aattaaattt aaaattaata aagcatattt agtaaattta aaagttgtaa aaaatattat 25140
aaagatatca cgtacaatat cattttacat aacattccaa atatcttatt tttggaaagg 25200
attctgattc aatctggatc ccgcataata agcctcagcc ctgttcctaa caagaaaggt 25260
ctggaacgaa cgagggaagg aggatattta gcacgagtag cgctttttaa gtcggtccac 25320
ttattacggg atttttactt ttggcttaca aactcttcat caaaccaaac caaaccaaac 25380
caaaccggta agcaatgtaa aatccagtgg ccaaaccaaa ccaggttaaa cagcaatttg 25440
agttacaacc aagtgtcggt ctcggtctca gtctcaggcc catattttat ttcatcagcc 25500
gttagctttg acatattatg actaatacga ctggacacag attggatatc cagatttttt 25560
aagatatttt tgatttgatt cgtatgttac agatatctaa tttattgatt tgctttgttc 25620
caaaaaaata cggatattcg gaaagacgga tatccgaaaa ataaatacat agttgcggat 25680
atttacgaat acctacggat atctcatcca ttttgattaa tacaaacaat cttaaaaatt 25740
cgatacaaat ttgtatttaa aaatattttt tgcatgatat ataaaacaaa aattaaaaga 25800
aatagtgaaa ctatatattt ttaaaatttt aaaacttaat taacaattat aataaaataa 25860
aacttaagaa aaaattataa ttgttataat tatttctcgt atattttatg taatactttt 25920
atataagtaa taatgtgaat aaaatttgtc aaatcatatg ttagaataat aattatataa 25980
atacatttaa aacttttaag tataatcaag atatacatgt atttatatat taccggattg 26040
gagcggatat ccgcttccca aaattttaat atttgtgatt tacttcgatt ttaacggata 26100
ttaattttag tatttgtttt ccttcaaaaa tttacggata tcactacaag aaaacataag 26160
tttaacgacg gtggttttcc tcgtgagttt gtcgtaaaag agagtttacg aggaattagc 26220
gaggaatcac gtttcgtcgt tatatgttcg tcgtaaatca tattttctcg ctaattcgtc 26280
gtaaactagc gagaaaacca tttcgtcgta aagacgaaga aaacaaatcg tcgtaaagac 26340
cacgtagata gtccatgtaa gaatgtcgct agcattcctc gtaaatacca cgaaagcatt 26400
tcctcgtaaa cgacacgtac atatctcgaa aatatttcct cgtaaaattc acgtaattac 26460
cttgaaattc tttcctcgta acattcacgt aaataccttg aaagtatttc ctcgtaaaat 26520
acttgtttac catttctcgt gatttcctcg taaactttca acgtaaataa atcgtagatt 26580
agctacgaat ctacttcgtt ttattgtttt acagaattta aaaatataat taaaaaattt 26640
aaaattatta aatttattaa taaaattaaa attttaaaaa aatacgcaaa tattttatat 26700
ataaataatt tttgaattta taatacaacc acgggaaaaa aaaagaacta agagtcgtgc 26760
atcgcccgga ggaattcatc actcctcctg tctacatcct cctcggcatg tgtgtcgtcg 26820
gatggttcct cgcctgaaat gagattttgt tgtcgcatgt tcctcaacat ggtctcccat 26880
tccggatttg tggccgctat aacgtccaag aagctctcga gtccacccac acgagctctg 26940
aacgcagatt gcttcgaagc caactcgtta tgcagctgag tgacttcatc atcccgtcgc 27000
tgaccataag acaatgtcgc tctcggaaca tcgttgacgg aaccaatccc caacgtccat 27060
cccttttttt aaagacaatc ttaaaacaaa aaataaatat tgttagtaaa aatttaaagt 27120
taaattaaat gaataataaa aaattaaaat tttagaaaat ttacctcctc gtaaatctta 27180
tccacttcaa gtgtggataa ggtgacgagt aatccgtcgg tggacagctg gatctggtgg 27240
tcttcaaccc gagcaaccaa gtcgttgtag atttgcttgg acttgccatc tagaaatacg 27300
cctgccttgt tcttgtgggt cctctcgtaa agttccataa gagacgggag atgtgccgtt 27360
tctttggcct taaaaacatt taagaaagtt agaataaaaa tatatatata tatatatata 27420
tatatatata taataaatat atatatatat atattattat ntntntnttn ttttattatt 27480
tttttttttt tttttttgaa gaaaacatat ataaaccgaa atcgaatata tacactgcga 27540
tgcaatcaca cacttacaac acccaatttt tccatttaca cctctagaca cacaggtccg 27600
tgtctaacca cctaaatgtt ccgatcctac ctaaacagtc ggatgaacca tgtctaccct 27660
aatctctcca ttgtttttgc acatgtatgc acatataatc agtgtgtaag aatgcatgga 27720
gatgaaataa aagtgtacgg tgtaggtgtg gtaccaaact attgatgagt ctggccattc 27780
aggattatta aagagtggta aaatgtggta aagaaaatcc tgaatgtgta tatggtgtac 27840
cgtttcctga tgttgattcc tggtcaaaag aaattaaatt cattaatggt caaaattatt 27900
tgagtcgatt acaattcacc gagacttgat aaaagattta aggagaggtt gcttggtcaa 27960
gtagttcctc ggtttgtctg cgctaacagt cctgaaaaat ggtcaatatg aaatgtaata 28020
cacaacacac aaggaaatag tctaataatc atcacagggt ctgagaaaaa cacgtagtag 28080
tttttt 28086
<210> 5
<211> 10653
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 5
aggtcgagta tctttgtagt ggtcgagttg cgggcgatca gattgttctt atttgaacca 60
agagtcaaga atgccactag gccatggttt gacaatgcct tagattgatc agatggatgt 120
tttggaacca agcacgacgg aatagaagca cgacgggaaa actcgaaatt ggacggaaac 180
cctaatttcg gtattatgga agtttctgat caagccgaag aatcaagaaa tatttaccgc 240
caaggtcaga gttcagattg gagtttatta aaaatattca gctcatcaga atgggagtag 300
aaaaatattt gggattgatc gcgggtcaga aatttaccgg aatgaccgaa atcagaccaa 360
tggaccgaaa agctcgaggt ggctcgttgc atgggttcag aacgtggtgt aaaccatcta 420
acaagctgag tgtctacaga agctcgaggt gtcatcgtac atggaagttg tacatgcagc 480
ctgacatgta gaagcacgag gtggatcgac caagcacgag gtggatcgac caagcacgag 540
gtgtctccgc gcatgcaacc gaagcatgct gatcgacatg tgtgtgctgc tgtggcgcct 600
tgcatgagtt ctagtcatgc agcctgacat ctgggaggag tggtggcgtc ctgcatatgt 660
cctggacatg aagccagcca tgtggagcac gaggtgccgc cgcgcatgtg tccggagcca 720
tgcgaagcga cacacaggct gccactaacc tgaagctgat tggttgctgt cttctataaa 780
tagcccacga ccccagctca tttcatcaca tccatacctg tacaaaccac cttagaaacg 840
tgagagaaaa gtagaaaaag aaagcaagag tttccgatct atttcgagaa ttttagagag 900
attgcgaggt cagttctcta ctgatttcga gtcagcgcct agggacggtt ctgtccaact 960
gaattcgtcc agaccactca gttcctttga tgatcaacta gatatgctgt ccggagttag 1020
ttcagttcta cgggttcaga tcagtcgaag ttttgctcga tactccgccg ggaagtccga 1080
agaactgtcc agaagctaga ggaggttctg tccgagtcca tatcagcctg tcgaggcctg 1140
tcagtttctt catggtgaag ccgaggttgt gtccaagaca agatcagtcc agtccactcc 1200
agtcatgtcg tcaattgggt tttggccaag tcttctccga tcaaccagct gcttatcagc 1260
aaagaacact gtgagttatg atcaattgat tgctgacttg ttttcatgca ggttcccgtt 1320
acttagaagt tggatcatgg caggaggtcg gctctaactg agtcacggtt tgactagtta 1380
ataattgagg ttatgttgat tgagttgata gcatgctggt tattgcttga gaaccgtagt 1440
agcatgctaa tggttaggtt gattggttag ttagcgaatg cggaatgctt agatgatatc 1500
gctaagttgt ggatagttag atattctgga attagttttt atgctagatt ctggaatatg 1560
attgattctg ttaatttgcg attaatacta ggaaccttgt gttattttac cgggtttagt 1620
attagtcatg tattggccat atagcatttg tgtaaaccac aatgctatgc atgtttgagg 1680
tggattagtg tttcctcgac ctcgtaccca gcgggtttaa ggttactctt ccaactccgt 1740
tgtccttttt gcaggtcgct ttaggtaagg atgatcggat agcttggtgc tcgacgttag 1800
gaccgccgga gtagatttca tgccttttgt aaacggtatt gcgttatgtg ttttgttggc 1860
tcgatttggc attaggccgg gcccagtctt gaattatttc aatgtatgga tatttcttga 1920
atcaataaag taaatgtttt atatgcgctt catgagtact ctgatatctg actagtccgg 1980
tctaacacaa cgttaggtcg tggtacgggt tgaaaagcct taggcctcga tctaacggaa 2040
aacgctaact ctaggtacgg gttgcaaagc cttgtgcctt gacgcagcag gacgagttag 2100
tggaggaact ggtcgaggtc gtggagtaaa ttttgtgact ctggccggat cgtccctagc 2160
ccgtcacgta gcgcttccgg accatggtgt tgggttggac ggtcagtcat gttcttgttt 2220
gattgttggc tggccgattg gcctttcatc tccaaccctt ggtgtgggtc atccgtcggt 2280
catgttcttg tttgattgtt ggccggtggg tcgacctata cctaggacgg ttcgggggtg 2340
ttacactaat catgtaagct cattcagaag aaagtttata gtttttttat atagatttta 2400
gttttagcag gcaatgttca tagattttct tgcaaaacct tgtccacaat acgttttata 2460
cttcttatcc acaatttatt ttattttatt ttaaaatatt gatttttatc caatatttct 2520
cagaagtgct tcggactcat cagatcactt tccgataaac agttccgaca aaatttgtta 2580
atggaacttt tcacctaatt gtagaataca aaatcttgtc cacaaagtta aattaagggg 2640
gtgtattcaa tttaacattt tatgtgattt gatttttaat gggattttag atgatttcaa 2700
taagttgcag agatttatgt gagttttgtt aaactactct agaatatcat ctaaaaccat 2760
gagatttgag ttttaatttt ttttaactaa gaaactctac ctaaacaccc taaaatcatc 2820
tgaaagcttt aaaactccac aacttaaaat attttcaata acaatggatt taagagtact 2880
ttacgaaata tcaaattcaa taacattgta ttttaaatga gtttttaaaa ttcatgtttg 2940
aataacagtg aatttgttat tttaatacaa atcacctaaa actagcagtg gaatacaccc 3000
cgcctaaata ttcttttgtt cccttaattg tgttctcgtc tataactcat tcttgtaaca 3060
tttgtctgta cacaacttac atgtccacta tttttgtatc cataatgttc gcctgtccac 3120
ataatgtttg tctatccacg taatatttat ccaactgagt aaccataaca tccttacatg 3180
gacacgaaag catcaacaac cagcgaacat gtatttgtgg acatgataga atccacatcc 3240
atgaaatatg gatgactgta acttgctaaa ctgttcattt taatgtaatt gttggattaa 3300
cagttttttt acgatcttgt ggtccttatg gaagtccaac tatcaaaaaa cttaatctaa 3360
taaatgtcta aaagctaact ggaaaaacaa cacaaacaat attccaactt tctgtttcgt 3420
ttcagtaaga gcaaaatagt ccaaaaactc tctcaatttc cgtgaatgta tgtagtgctg 3480
ggttcgcggg tcaacccgcc ccgacccgcc ccgccccgcc ccgggtcgaa tcattttttc 3540
gattcaaaaa ctcgacccgc ataacccgca aacaaaaact tttatatccg cacccgcccc 3600
gccaaaaccc gcgggtaacc cgccaaaccc gcgggtaata ttaattatat taaaaatagt 3660
tattttaatt aaaaatgatt attttctaat tatataataa ttattttaat taaaaataat 3720
tattttttat ttatataata gttattttta aaaaatacta ttaaaaaata tatttataat 3780
taaaattata caaatattta ttgtttttta tatattttac gaaaaaatgt tttttttcaa 3840
aatttttttt tttttaattt tgcgggttgg cgggtacccg cgattcaaat tcggctgacc 3900
cgcacccgcc ccgctcaaaa taatcttgac tcgcacccgc acccgcgatt taaaattttc 3960
aaatggttcg acccgcaccc gccccgcggc ggatcaaatg gggcgggacc cgcaggcaat 4020
gattaaaatt tccagctcta aatgtatgct acaagtggaa ggtagttttg ggtgcaaaga 4080
aaacagccta ttaagtaatc aactctttaa tatattggga cgaatgagat gtttgtaaaa 4140
ttatttaggt ccagatactt ggcgcaattt aagaaggctt ttatatattt gggccgaaaa 4200
ggttcgccca ttacttaaaa aagcgacaac tccgtgacat attgttgttg tgctgggacc 4260
caaaaacggc gtgcattttg tcgactttca gtggaactgg ctttttcttt ctgtccaaat 4320
caaaaaagtt ttaaagatcc ttttgattgc aaccagagaa aaagataaca aaacttccac 4380
tttttgtaac gtaaatacat taataaaaaa aaggtttcac gagtacattt taaacttaaa 4440
gcagaaacaa ataagtaaaa gagaaggagt gtttattcct aatagagcta ggaagaaaag 4500
ttaattgatt ttagatttgt cagaagcata aacgtagaga tctggatctg tctcgtagaa 4560
gacaatatca ccagtgtcac tgacgtaatg atctttttta atacttgcga ccaaactctc 4620
caccaagtga atcggtattg ctcctgacgt cttcggctct ctgtagtatc ttcctaacac 4680
atgtttagct gctctcgtct gtccacaatt cattaattaa attagtaatt aatcaccatt 4740
taatcaaatg aaactagaga gagagaaagc tagatcactc acggcatcga ccaagtgata 4800
gtgagggatt tgtgggaaaa gatgatggat cacgtgagtt ccaatgtcgt gatggatgtt 4860
gttgaagatt ccgtaatctc tatcaatagt tgttaatcct ccacgtaaat aactccattc 4920
ctattattgt atgcaaaaca tcaaaaatta agattaatca atactaacca ttattgcttt 4980
ctgtacattt ctttttaaaa attgatttaa ttaccttgcc tctgtaccaa ggcaacttct 5040
catcgtgacc atgatgatgc aagtacgtga cagcgtccaa ccacatcaca aagatctgaa 5100
aattttccaa acccttatgt caaaaaacaa atttattatt aataatatat aaatttcttg 5160
taataatatg tgaaacttac aatgtaagga acgccataga ctttgagaac tgtgactgga 5220
tcaacgagga acgatagata aacaagagtg gccaacatta tggaccagca agtagttgaa 5280
gttgcaataa gcttcctctc gcttggagca aataaactac tgtatgggtt aaaatgtgac 5340
ccttcttttc caggacttct gtaccactgt agttaaaatc caatcaaaat taatttatat 5400
attggcttaa aactcaaaat ataaaatcat ttgtaatttt aagaaaaaat agaaattgta 5460
ttttttttac cagatagatc gggtaagcga gcatgggcag agggacagtg tatctgagca 5520
tccgagtact atggggcaag ttcttgtaca acttttctgg caactgaaat acataattat 5580
aattaatatg actattacta ttactattac taattactat tacggagtag tacttactag 5640
tattaaatat tcattgaaaa tttgtcattc tggttatgta ttcgtattaa ttcatgtgtt 5700
tataagtttt atactaatag ctttcaagat tgcagacaaa agtattacga aaacgccaaa 5760
actgaaaagg aaaaaataac gaagaaagta aacggatttc gaggagaatc atgttatgct 5820
aaggactcga atataagtgg tccatcgata aagttaggta ctataaaagt atagattttt 5880
cattttctga gttactgcgt aacctctaaa aaaaactctc taaatagagt ttactctaaa 5940
tttaaagttt caaagtggtt ttcttcgaaa acaaacttca aacataactt caaaattatt 6000
tgtattttac acaatgatcc ttatttgtta taactaagag catgattaac ctgggattct 6060
taggatgggg ttcttaccgg aagttaagaa actgtttctt aacgtttaac taaaactcca 6120
ctctaagaac tccgggttaa tcatggtcta atataaatcc ataaaaaaaa ttataaataa 6180
ctagcacata tataaaaata ttacagtaat attaattaat aaaaatttac attaaatata 6240
taaaattata aatagaaata tataattaaa tattaaacta gaagcaaaat accatattat 6300
ttcataaaat tattttcgta atgctccatc ttcggttaca caaaatttgt ttagacaata 6360
attttagagg ttccagagca aatttaccag attattagta ttgttataat atttaaattt 6420
tctaatagtt atgtcttcat gtatcttatt ttaaattttt tattattaca tttcttttgt 6480
aatattttgt tgactaatta tagtcttaaa tattataaat cttatttaac atttttatta 6540
cttttatgta taaaatttga atttataaaa acaaattgga aatatttata atatataaaa 6600
aatttaagaa ttaaaacgat aaatgaaaaa atacttaaga attataaatg taacgtgtaa 6660
ttaattataa tgatcaaaat gcaaaaaaaa aacttcaaat ttgaagtttc gaagttcatt 6720
tttgaaaaac aaaaaaatct ttatatttga agttataaaa tttttttttg agatagatcc 6780
gagaacatta attaccgctg aactattaca cttgcaaatt gttttttact acagctagaa 6840
aacagatctg acaagtggcc ggtctgacct cagactgaaa acataaacta ataaaataaa 6900
catatagaat cctaggagta tgattattgg ggtttttagg aagaggttct tagcggaata 6960
taagaacccg tttcttaact tttaactaaa aaaattaaga acgtgttcat aaaactctta 7020
tttaaaagct ggttcttagc ttttttagtt aaaagttaag agacaggttc tcatattccg 7080
ttaagaaccc caccttaaga acttcaataa tcataagaac ttagacataa gaatgaattc 7140
ccaaaaaaga acaaataaat aaaagacaag agaaacaatg agagtaggaa agattaccgg 7200
aacccaagac tcgtcgtttt caacatggcc atggttctgg tggtgtgtcc gatggcttat 7260
tctcctgcaa accccaatta caaaagttat gtatttattt atttttgtga aaatgaaatt 7320
gtctctataa tgatttaaca atctcactca ttttatattt attttgtttt tttagttgat 7380
atatttattg aacaactaac aatagagtgc tctaacaatc ccattctttt ttttgagcaa 7440
aaaaacattt gatgcttttt actaataaac attgtgcaga aataagtaaa aaaaactata 7500
aatcctcagg aaattgatgc atgtaagtct ttttcgaaga tgtttgaagc tgatgtaaac 7560
aaataacaat aagtgaaaac ctaaaaaaaa atcaaaatct aattatactt aatgaactaa 7620
gaaaactcag gaccatagat aggcgcatat catttaagaa aaggtttgga ttctttttca 7680
ttggctgcta aagatttgat gcttttgaac agaaaaagca acctcatata gtcacatgca 7740
ttgtttaata ggattcttat ttaattataa aattgctact ctagcaacaa aaaaaagttg 7800
gtagcttcca gttaatactg attacagttt cctagcattg cacccaagaa taacaaacga 7860
aaatgtaaga aatacgaaaa caagtactaa taatttacat ggaaatagtt aataaatgac 7920
ttaccaacca tggtaaggaa cgaggatgaa tgaatgaaga atgtgaccaa ccacactgtt 7980
cagcagagga atgtctgaga aactcccatg tccactgcca ttattcaatt ttattttcac 8040
atcattattt aacataaaaa cgtatttatc atttagtgca caatttattt taacttttct 8100
acatttgttt taactcaaac tctttaacaa ggtaacaaat ccggtatatg acgtgtcact 8160
tgtctaaatc acaaaataga ttggaacaca aaaagaagaa aaaaacaata tatttttctt 8220
gtcaaaaaac aatatatttg ttgccaaaaa aataaacagt atattttctt gatattatac 8280
tatactataa ttataattaa aagttccggg gatctagaga aagagaaaca aaaattgaga 8340
acatcaaaac gtagatccat aaaatgcgga aataatatta attatagaaa agaagatatt 8400
ttgttacgag tctgacgact gatgagtgac gatgcttgaa cattgatgaa gaaaaaaatc 8460
ttagatccta tattttcttt tattttttaa taattaaaca tgaaaaagta acctcaaaag 8520
aattaaatct tgaagtcagt gacgatactc atcgaacgtg cattcaagaa attaataaat 8580
tgaacaaaaa gagacaaaat aattaaaact gaaaatttaa tttaccagtc gtggccaaga 8640
acgaagatgg cccagaaaag ggttccttgg gcaacccagt agagtggcca gaggaaccag 8700
ctatcaaaat acacggcggc catggccaga gccgcgacgg cgaaaatgtc tctggcgacg 8760
tagctcatag atctcaaagg actcttcacc cagcaatgct taggaatcgc cgcccttata 8820
tctccgatct taaacggtgg ttgtgcgctt ggatcaaacc cttcttcctt ccgggcaccg 8880
gaatctccgt taacattgct gcgctggtcc atagcaacaa ccatcgctgg agagagagat 8940
ttggacgaag tttctctctc tagatgtgtg gcctttcagt gaaatgtggt gaataaaggt 9000
ttgatggatt ttttgggtgt gtgaggttgg cttatataaa gggagaagat gtatttatgg 9060
acattgagaa aatattccaa attgtttttt aatgattaat aatttatttt ttatttatca 9120
aaagaataaa aatggtaatt tagctgtaac ttttgtacaa tgggttgggt gtataatgtt 9180
ccaaaaaaaa gggttgggtg tattactctg ttacgtcgtt caacgcaatg aaaccaaatt 9240
ggagtaaatg tgtttctttt ctatttttag attttccttg gacggaagga ttgtaccaaa 9300
taaatttatt tgtgtttctt actctagaat caaataccat atgtagatgc agtgaaatgg 9360
aagacaaaca taacgatcct ctagcatata tattttgttc cctaaaattt tgttgattat 9420
ttattgacta ggataagatc accttgggcg ggatagacat cgtttatata aagtggttaa 9480
gaaaatacat cgtgtatata aattattttt acatattacc atttatttta catgaaataa 9540
taaaataata aatatatatt aaataaattg aaaagtctat aactattatg tatataatta 9600
agttggtgta aacacataaa tcaaaacaaa cactcttttc tatttaaaat aatattgaga 9660
taaaaaaatc taaaaaatca attatatcta tggtatataa ttaaatttaa atgatattaa 9720
catatagaag tatattttaa aatatctatc cgttaaataa tgcttcatac tcatatagtt 9780
ttatgacaat ttgtattttt taaactattg aaaataaaat tttcaatttg atacttttaa 9840
tagttttagt aatttataac tgtttttaaa aattcaataa aaaatttgaa attaaaatat 9900
taagttctca atatttcttc aatggaaatt tcaaattaaa ctattatgtt cttatatggt 9960
atatagttta atttaaacga tagtaaaaac atatttttaa tatgaaaata tattaaataa 10020
gacattttat tcatatgatt tttatgatca tttatatatt gtataacaaa aaaatttaag 10080
ccactgatca caaaattttc aatgtaatat ttttaacagt tttagtaatt tatagttgtt 10140
taaaaaaatt caaattataa catataagaa aaaatctaaa tttttattct atgattaata 10200
tgattgttta atttattttt taaatataaa acaaaaaata atagaggaaa cacaaattgt 10260
tatcaatttt ttattattca aaatcactaa ttgtcatata tatattgatc acattaaata 10320
attttgtagc ttttattcaa ggaactaaat aaaaaaaatt ttggtacatt aataattagt 10380
tttgtagtta ctttaatgag aactactgtg tatatttaga ttgaccaact tatttctgta 10440
agtaatccga gaaccattct agtgattaga gatgacaatt atggatctgg accgcgggcc 10500
tggcccgtaa aggactgtcg cgggacggta ttgggacgag gttttctagg cccgaaaatt 10560
tgcgggcttc gcgggacagg tctttacggg actgggcctt ttgcgggatg ggccgaaacg 10620
ggtcttgcgg gattacatgg acccgcattt ttt 10653
<210> 6
<211> 23648
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 6
cccattcgaa aataaacatc aaacccaaga aaccctagaa acagaaagac accgtcgcca 60
tcgccttcaa agaaatataa aaaattatat tttatattcc attaaaaatt attgaccaaa 120
aaataaacta ttaaaatttt aaaccgctgg tacgtacatt gctaagacat agattaatag 180
atgagcaatt ttccaagctt atctcgaagc cttggagaag taagttgaag agatgaactc 240
agctacggca aacaacaata ccactacatg caatccaaga gtcacctcag aggttcaaat 300
cctaaaatag cagagtacat ggtactccga agagaaaatt ctgccttgac cgtagctagg 360
ggaactagac gaaggttctg aacccgcaat caacccatgc aaactctaga tcgcccgctg 420
tgacatgaag cataactctc taaaatcatg tgggaactgg agagcatgcc atagatgctc 480
aagccacgaa tactgatcgt gcaaacttac atttggacaa cgatggcaca gacacggaca 540
catgtgcata gatgcatgaa actttttgaa tttttttttg aatttttttt ttgaaactat 600
tttttagctc taggagacta tatttgaaat atttagatga aatatttagg taattttaat 660
ccttgaagac tatatttgtg acaaaaggtt ttttagggtc agtctagaaa atttattttt 720
ctttttaacc tttgaaattg tatgtttttc agtgtataaa tggattaata actaaagaag 780
agtttcacga gtacattttt aacttaaaaa caccaataaa taagtgaaaa aagactggtt 840
tattcataat agggctaaac aaaaaggggg aagaaagttt aattgatttt cgatttgaca 900
gaagcataaa cgtagagatc tggatcagtc tcgtagaaga caatgtcacc ggtgtcactg 960
acgtaatgat ctttcttaat acttgctacc aaactctcca ccaagtggat cggtattgct 1020
cctgacgtct tcggttctct gtagtatctt cccaacgcat gtttagctgc ttttgtctgt 1080
cacattccat ttgttaaaat cagtacatta gtaattaatc accctttaat gaaatggttt 1140
agatgaaagt agcgagagag tgagatgact cacagcatcg accaagtgat agtgagggat 1200
ttgtgggaaa agatgatgga tcacgtgagt tccaatgtcg tgatgaatgt tgttgaaaat 1260
tccgtaatct ctatcaatag ttgttaatcc tccacgtaag taactccatt cctattatta 1320
atcacaaaac atcaagaatt aagattaatc aaatactaat aatttttttt tgtgaaacat 1380
cgtaatctct ataaaatatt atttgagaag tcggttttct atgtatcgct ctcacgttaa 1440
ctctcacgat agttgattac actaatacac ttaatgaatt aaaaatatta catttaaaat 1500
actattattt atttttttat ttagtttcct ttttaaaatt ttccaaaaaa acatatacat 1560
ataataaaaa ggaatttttt tataaactta aaaaattata ttttacttgt ataatattaa 1620
tttcaaatac aatctcactt ttgttcactg cttattttta agagttatta aaaaactaaa 1680
attaaaatta aaaaataatc attgtttgat caaatagtta caaaataatc acagttttta 1740
aatgttatgt ttttatgttt gtagaactta atggaaccat aagcaaaata ccaaagcaaa 1800
tatgttttca tttttaagat tatttaaaat aaatttcagt ttccattcaa taaattaaat 1860
acataaagtt atttagaatt tataaaatat tttaattact gtaaaatatt aaccaaatgt 1920
tacaatttag ttcttttgta aaatttatat atatatatgc atgagacttc agaatattat 1980
cgttatatta atttatgtaa tttagaatca gacactttat tttatttttt atttcatttt 2040
aagcacaata tatatattaa gttatacata atctttataa aatatattta aagttctaag 2100
acaacaacca cctaaatgaa aataagaaat taatcaaaat tttaatatag ttaaaataaa 2160
aaatattaca gttgaattct gagatgcaat ccaatttacc caaatgataa ctaaatcgac 2220
tgtaaaaaca acaaaaccga ttagatataa catatataaa atcatattta taattaaagt 2280
aatataaatt ttattaatat aaatcatgca tacaaattat aaactaattt aaaattaaaa 2340
ataaataaca attaattatt atagtatatt tactttagaa atatttatat ccgtacatga 2400
gcacgggaaa atcacctagg agttaattta attaccttgc ctctgtacca aggcaacttc 2460
tcatcatgac catggtgatg caagtaagtg acagcgtcca accacatcac aaagatctga 2520
atttcaaaag tttatgacaa aaacaaatca tatagtatat atattgaata ataaatatat 2580
accctttatg atatactaag aaacttacga tgtaaggaac accgtatact ttgagaactg 2640
tgactggacc aacgaggaag gaaagacaga taagaatggc caacattatg gaccagcaag 2700
tagttgaagt tgcaataagc tttctctcgc ttggagcaaa taaaccactg tatgggttaa 2760
aatgtgaccc ttcttttcca ggacttctgt accactgcag taaaaccaaa gaaaaaataa 2820
tttatattgt tttaaaacac aatctaaaat gaattgtggt aagttttagg aattaaaaaa 2880
taccagatag atcgggtaag cgagcatggg cagagggaca gtgtatctga gcatccgagt 2940
actgtggggt aaaatcttgt ataacttttc tggtaactga aaggaacaat taaaatgaat 3000
tttagtaatc aagattaagt acttgcaaaa atagtactta gatatgtatt gatatatata 3060
ttcattgcat gctatgtgtt tataaacttt tgtttttatt attttttgtt agttttcaaa 3120
acacaggcaa actattacga aaacaccaaa ttagagaaag aaaataataa tagtataaaa 3180
gtaaatgcat ttagaggagt aagaaactca aatataaaag catttgcatt agtgagtttt 3240
tgacgagatt ttatcacaaa ttatattata ttaatttata attattattt ttgaaaattt 3300
gaaaaattta taccaaaata ttttatttga aagactttca catgagtttc gcataaacat 3360
gtctttcatt ttttttaaaa aaactcttta attaagtaat aataaacttc ttccgtttca 3420
atttaattgt cgttgtaaat taaaattttg ttttaaaata agtatcgttt tataatttca 3480
atgtaaaaat tatgaataat attttctagt ttatttttta ttggttaaaa tattgttagg 3540
tgtataatta gtgatgtttt tattttaaaa atggacaaaa tattttattt tttgtaatct 3600
atgtgtataa atctaaaact gtaactaaaa taaatcggag gaagtaatta gaagattcac 3660
cgatacaaat aggcgtggtc cgttgtcaca tactattatg tatattttat tttacaaaaa 3720
tgttacttct ataaatcgct aaaaagaatc aattaccggt taactgtgac actagcaaac 3780
tgtttttact acagctagaa atcaaatctg acaagtggtc gttctggcct caaatttcga 3840
aaaacaaatt attttgacaa agaaaaatag aaattattaa agagggaaat gttaccggaa 3900
cccaagactc gtcgttttca acatggccat ggttctggtg gtgtgtccga tggcttattc 3960
tcctgcagcc tcaaattatt aaatatgtgt ttacataaaa attaaattgt ccatggaggt 4020
gattggttgg gttttatcta cctactttag ctttattttt ttctaaatca ttaaacttta 4080
ccaatcatgc tttacgttta cttttcaaaa ttaaagtcta catcaaattt ctattaattt 4140
ttaccaatca tgctttaact ttaaaaataa agctacagca aaaaaaaaac caaacatttt 4200
tcttatgtat tttagttaaa caacttacat ctttcattta taagctgtag aaactgtaag 4260
aacaaaaaat atctataata ttaaataaat aagataatca taataaaaaa acatctataa 4320
atattttact ctaattttgg gtgcttttaa attattgaaa tattttaaat aatatagatt 4380
atttacatat cacattttaa ataacagtaa actttgataa ttttaaaaaa tattaatata 4440
aattatttta agtgataaaa ataataatta ttttatatat acatgcatca catattttac 4500
atattttatt ttaaaatatc tgcagcctat agcttacagc tacaacaaat ttaactacag 4560
caaaagtctc tgcaaaaata atcaacagta acaactttac aactacaacc aatttatcta 4620
cagctaaaat tctacggcca cagtcgaacc aatcatcacc tatatagtgt tgctttcatg 4680
gcagattcta acaatctcac tctatttttt ttctcttttt ttttgatcaa acaatctcac 4740
tcttttaagt tttaagttac tagtaataaa ttgaccaaaa atagtttcca gtaataaatt 4800
atttttattg ccaggaataa gttacaataa tgtcgcagca aaataatgca tgtaagtcta 4860
ttttcaaaga tatttgaaga tgatgttaca tttaccaaac aaaaaattat gatgttacta 4920
caggaaacca tttttattgg aggtttgaag tcagtttctc aatattaaaa atagagaaat 4980
agaaaagaat aaaagataaa aggagtaatt tcccaataaa caaagtcatg aataattctt 5040
caaatatcta acctttaata attggtttaa tattatttat aaaatgaata tttaattata 5100
aataaattag ctgttgttca aaaaaaatta taaataaatt atattcaaaa tactaatgac 5160
cagatatagg cccattgcat ttaataaaag ttttgattcc tttttccttc gttgctaaag 5220
attcgatgct tttcgtcaag aataagaaaa gctacctcac atatatagtc atactttcac 5280
atgcattatt taattataaa attggctcta gccaaaaaaa aaaagaacga gcaatgaata 5340
gattcttgca ccaagtaatt catttaacat ttaaaccaaa aaaagtataa caaatgaaag 5400
tttaataatt aataataata ataaaaaggg ttaataagtt gacttaccaa ccatggtaag 5460
gaacgaggat gaaggaatga agaatatggc caaccacgct attcagcaga ggaatgtctg 5520
agaaactccc atgtccactg ccattattca attatatttc acatcattat tcatcgtaaa 5580
tatagtatat catttattgc actatttatt taaactttcc atgtttgttt taaaagcttc 5640
aacaaggtaa tgacgtgaca catttctaaa tctcgaaata gattggaata caccaaaata 5700
acaaagaaac aatattatct ttcttgtttt agaaaaacaa tagatattct tgattttata 5760
ctttaattat aagttgagag atccataaaa tgcggaagca gtcgtaatta tagaaaataa 5820
agatgtggtt ttgtaacgag tcgtacgacc gatgaaaggt ggtggaacaa tgatttaaaa 5880
agaaaatcta aaaaaaaaaa tcttagatct tcaaaaaatg aacatcaaaa gaatcaattc 5940
ataaagtact gacaatactc atagaacgtg cattcaataa atcgatgcaa tgcaaaatgg 6000
aagaaacttt accagtcgtg gccgaggacg aagatggccc agaaaagggt tccttgggcg 6060
acccaataga gaggccagag gaaccagcta tcaaaataca cggcggcaat ggccaaagca 6120
gcgacggcac aaatgtctct ggctacgtag ctcatagatc tcaaaggact tttcacccaa 6180
caatgcttag gaatcgcagc ccttatgtcc ccgatcttaa acggcggttg tgcgctcgga 6240
tcaaaccctt cttccttccg ggcaccggca tcttcgttca cattggtgcg ttggtccata 6300
gcaacaacca tcctgggaga gagagagaga gatttggagg aagattctct ctctataatt 6360
caaaaaaaag aaagtgtggg aactggaatg tggtgaagaa agggttcgat gtattttgcg 6420
gtctgtgaag tttgtttata taaaggggaa ggaagatgtg tagtctgtag acattgagat 6480
gctcaaactg tttttattaa ataattatat atttaaagaa taaaaagggt aatttgctgt 6540
aattttaaat gcaatgggtt tgttattttg ttacatcgtt ctattcggtg aaattaaatg 6600
ggaaattgaa ggctataacc acaaaaaaaa cgtaattcac cgtctagcca tttaacctaa 6660
cgatcttata cacgctgtta caaatataaa ataatactgt aatattccta aaacacaacc 6720
ggctcaacct gctacaaaaa aataattaaa tattttaatt attcaccgtt gaaaagtaac 6780
tcgtgtctta cccttgttca catcttcccc ttttaacttc tctggtaatt ttgctgcagt 6840
cgaacggtct ccggcaccgc tttcttccat cgcctccact ctgcatgcaa tcgacatctt 6900
ttccatctct tccgtcctct gttttcaatc ttcttcggcg ttacagttct tggttaaggt 6960
ttcagcgacg gtagtaagaa accctttcta cccaacttca ccacttcgat tcttgtcaaa 7020
tctctgaacc ttccgtaagt tctcattcta tttcgtagat tctcttcact gtgtcgtcct 7080
ctgtgcttat tttctttcaa attggggctc gtctcataat cagagtgtta taatttctag 7140
gtctatatca ccggcagatg tgaatatcga tcgtccccga tacggaatta gtctctccca 7200
ctttccaatt tgatttaggt tttggtgttt cccgggttgt gtgaggttcc ttgaatttga 7260
attttcttcg tagaggatat gcaacgtatt tagtttagta ctttatgtat ttcgtgtgga 7320
atatcattgc ttacaaaggg tttgtcgata atacatagta tgttattttg attctccatt 7380
ccatttggaa tgtaatagta cacttaccca attaagctat tccattgtgt aacgcatcaa 7440
ttcattcctt tgtttgtaat gtacttatgg agttgctcat tctaatttat ggttcccctt 7500
tatgttcttc ttctttctta atcgtgaatt gatgtttctg tatcagtgct ttttaaaaat 7560
agtgtatgaa tatcgactac cgtgtggaat atcgtctctt gtacatagtc tagaaattat 7620
gctttcttgt atggaatatc atctttatgt catagttgtc ttgtgtttta tttgcaacat 7680
tacatttggt ttatctacat catgtcacgt tgaataaaca ctacaagaaa acacatgctt 7740
aacgacgaaa attaacgagg aaaaacaatc ctcgtaaatt tgcgtcgaat ttacgacgaa 7800
tttacgtgaa aaactaaagt catccttatt tcctcgtaac gtaacgacaa aactgtttcg 7860
tcgtaaagtg gatgtaattt tacgagtatt ttacgaggaa aaactatttc ctcgtaaata 7920
cgacgtaaat tttgcgtggt atttacgagg gaatagttta cgtgtattta gcgaggaaat 7980
ttttgaatcc accaacttca taggtgttac acgttttttt tgcccaccta attaattttc 8040
gtcgtaaatt catagcaaaa ttacaactac cagattcgaa ttttcctata aatatggatg 8100
tttgaacatc attttaaaca caccaacaac aaaaaacgtg aaagaaaaaa aatggctggc 8160
tccgggacta tttacgagtt gcggaagtgg atgtatatgc atagagatgc taacgggaga 8220
gtgacgaaag aataccttgc gggtctggag acatttatgc atcaagcaga ttcaacaccg 8280
ctcgcccaag aaagtggtaa gatgttctgt ccttgtcgga aatgcaacaa ttcgaaactg 8340
gcaaaccgtg aaaatgtttg gaagcattta ataaatagag gtttcacggc aaattactat 8400
atctggtttc aacatggaga aggttttaat tatgatcaga atgaagctag tagtagtaat 8460
agcaattctc aggaaaaaga accggttgat catcatttgc ataatgaaca tagttaccat 8520
caggaggaga tggtagatta tgatagggtt catgatatgg tagttgatgc attcgtagct 8580
catgatgaag atgaagaacc taatataggt gcaaaaaagt tttacgaaat gttaaacgcg 8640
gcgaatcaac cactttacag tggttgtaga gaaggtctct ctaaattgtc gttagctgct 8700
agaatgatga atattaaaac tgatcacaat ctacctgaaa gttgcatgaa cgaatgggcg 8760
gacttgttta aagagtattt gccggaagac aatgtgtctg ctgattctta ttatgagatt 8820
cagaaactgg tttatagttt tgggttgcct tcggagatga tagatgtttg catcgacaac 8880
tgcatgatct attggggaga tgatgagaag ctagaagaat gtcgattctg caagaagcca 8940
cgattcaagc cgcaaggacg gggacgtaat agggtaccgt accaaaggat gtggtaccta 9000
ccaattacag acagattgaa aagattgtat caatcagagc agactgctgg aaagatgaga 9060
tggcatgccg aacatactca gacggatggt gagatggctc atccatcaga tgcaagagcc 9120
tggaaacatt tcaacaaagt acatccagat ttcgctagca atatccggaa tgtgtatctc 9180
ggattatgca cagatggatt tagtccgttc ggaatgtcag ggagacaata ttcattgtgg 9240
ccagtctttc ttactccata caacctgcca ccggagatgt gcatgcaacg ggagttacta 9300
ttcttgacca tattaatacc tggtccgaac catccaaaaa ggtccctgga tgttttccta 9360
caaccactga taaaagagtt gaaggatttg tggtcaacag gggtgaggac gtatgactgt 9420
tcaacgaaga cgaattttac gatgcgagcg atgcttttgt ggaccataag tgatttccct 9480
gcctatggga tgttgtctgg atggactaca catgggagat tagcttgtcc atattgtaat 9540
ggaacgacag atgcgtttca actgaagaat ggtaggaaga caagttggtt tgactgtcac 9600
cgtcgatttc ttcccattgg ccatccttac cgaagaaaca agaatttgtt taggcacaaa 9660
agggttgtga gagacactcc tcctccatat ctaactggag aacaaattga agcgcaaatc 9720
gactactacg gagctaacga aacagttcgt tggggtggta attggcatgt ccctcgtaat 9780
atgccagatt cttacggtgt tcatcacaac tggcacaaga agagtatatt ttgggagttg 9840
ccatattgaa aggatcttct tctgcgccac aacctcgatg tgatacatat agagaagaat 9900
ttctttgaga acatcatgaa tacaatattg aatgtcccag ggaagacaaa agacaacata 9960
aaatcgaggt tggacttgcc agatatttgc tcaagaagcg agttacatat taaaagcaat 10020
ggacaagttc ccgttccgat attcagatta tcttcagaaa aaaagtcggt gttgttcaac 10080
tgggtggcat cagaagtgaa gttccccgat gggtatgttt cgaatctctc tagatgtgtt 10140
gaaaagggtc aaaagttctc cgggatgaag agtcatgatt gtcatgtatt tatgcaacga 10200
ctactgccct ttgcatttgc ggagctattt ccaacaaacg tacatgaagc acttgcaggt 10260
acgtagtgta ttatatcaca ataatttaca aaataatata tgactaacaa tgtgtttatt 10320
ttttttgaat ataaaaggca ttggagcatt tttcagggat ctgagcacac gcactcttaa 10380
agaagaagtt gaggaacagc ttcaggagaa cattcccatc ttattgtgca acttggagaa 10440
gatatttcct cccggatttt ttgacgtcat ggagcatcta gctgtccacc tcccatatga 10500
ggcattgctt cgtggacctg tacattacgg atggatgtat cagtatgagc gagccatgaa 10560
atatttgaag ggaaaagcaa agaacctcgc caaagttgaa ggttctataa ttgctggaag 10620
tttgacggaa gaagtttctc acttcacatc gtactacttt gcgtcaaaag tacgtacacg 10680
gagaagagct ccaagaagat atgatgatgg tggtgttgcg ccaacatatg cagttgctgg 10740
tgttccagac atctttagcc agattgggcg actcggtggg aagtctaaag aggtttggtg 10800
gtcgagtgaa caagacgctc atagtgcaca cacctatatt ctactcaatt gcgaagatcc 10860
attgatgcgt tattttgaaa ggtaacatat attgacactt cgaaacacat ataagtataa 10920
ttaattgtat aattgcgaga gattcattcc tataaaatgt gattttacag cctatttgtt 10980
tctcaagtcg aagaaacatt tcctggtata tccacaagtg acgtagacaa aaggaaagat 11040
caacatttca ttaagtggtt gcggaatcag gtattaacta aaactttttt ttcatacatt 11100
atctgtattt cattaacatt ctctttattt ttgcaggttg attatgacga cgacgatgca 11160
gattattcta agtggttaca cgaagtaatt caatctccac ttgtaaaggt caccacatca 11220
cagatgtatt tcacacgagg ctatactttt catacatatg actatggtag acagcgggcg 11280
accagtaact atggagtatg tgtgaaaggg aaaacagatt tctacgggat cttgacggag 11340
attattgaag tcgaatttcc agggatactg aagctgaaat gcgtcctctt caaatgtgaa 11400
tggttcgacc ccgttgtcaa cagaggtgtt cggtctaaca aattcggtgt agttgatgtc 11460
aacggtggac gaaggtacaa caaattcgag cctttcatct tagcttcaca agcagaccaa 11520
gttagcttcc ttccataccc tcggatgaga gattcaggta ttaattggtt agcagtaatc 11580
aaagttacac ctcgaggacg aatcatcagt ggagaagaac caccattgca agaagaacag 11640
ataaatgaag ttgaggaacc tgaacaagaa attgatgaca tccttctcat tgatccgcat 11700
aatcacgagt acgaagatct taccgatgat gccacagacg aagctgttga agacgagttt 11760
aatgaaaatg atgatgtttc tagtgatgac gagaatgtcg atgtatccga ttgatgtatt 11820
tgttttatga ataagatgag agagtttgtt ttatgaataa gataatgtgg ggtttgtttt 11880
atgaataagg taatgtggga gtttgtttta tgaataagca aatgtgggaa ttgtggtttg 11940
gaatggaaat aaagatgggg tttggaatat atgaagtaga aaataaggaa tataaggttt 12000
ggggtttcgg gttttggatt ctagggattt aaacataaca gtcgttaatt ccacgtaagc 12060
ttaaatcgtc gtaaagtcct cgtattccaa ctagtaaata acgacgaagg actcgttaat 12120
tccacgtaag actaaatcgt cgtaaatacc acgtaggatg aattcgtcgt aaaaaccacg 12180
taggatgaat cgtcgtaaat ataacgtaac ataacgagga aataacgacg aaacctaaaa 12240
ataaatatgg aatatgggat ttggggtttg gggtttcagg tttcgggttt cgggtttggg 12300
gtttggggtt tcgggttttg gatttcgggt ttcgggtttc gggtttttgg tttcgggttt 12360
ggggtttcgg ggtttggggt ttcgggtttt ggatttcgag tttcgggttt cgggtttcgg 12420
gtttcgggtt tggggttcta gggatttaac cataacactc gttaaaaata acgacgaaac 12480
ttaaaattaa atatggggtt tggaatatat gaagtagaaa attaaagatg ggggtttggg 12540
tttcgggttt cgggtttcgg gtttgggggt tggggtttgg ggtttcgggt ttgggtttcg 12600
ggtttcggat tctagggatt taaacataac actcgttaat tccacgtaag cacaaatcgt 12660
cgtaactacc tcgtaggatg aaatcgtcgt aactaccacg taaaatgatt taaacaaaac 12720
actcgttaat tccacgtaag cacaaatcgt cgtaaagtcc tcgtaggatg aaatcgtcgt 12780
aactaccacg taaaatgatt taaacaaaac actcgttaat tccacgtaag cacaaatcgt 12840
cgtaaagacc acgtaaacgg atttatacat aaacccgtta attccacgta agtacaaatc 12900
gtcgtaaata tctcgtagtg tacaaacttg gaaaaaaaag gaaaaggaga aaaataccag 12960
attaacatgt ggcaagactt ccaacaatta taatacgtaa gtctcgccca catgaattct 13020
aatatcttct ccttttccta tttttttcaa atatttataa tttgaatagg atttttttga 13080
ggattgtgat ttgagataag gtgtgatttg ggagtttgtg tgtggtttga gagtgagagt 13140
tgtgggtata tttataggaa agcaagcctc gttaattcct cgtaaagtaa atcgtcgtta 13200
atacctcgta taaaaaaaca cgggcctttg tgattactcg caatttcctc gtaaaaaaaa 13260
agacgggcct ttgtaactgc tcgctatttc gtcgtaaact tacgaggaat ttgcggcgat 13320
atgtaatctt atatatacac ccgagcgctc attctttctt tcctctctac ttcctctcta 13380
cttcctctcc atttcgtagc aatagtaagc ctctctgatt cctctctaat ttggttagtt 13440
taggatagat taggtggtta gtatagggaa tttagatagg tttgcggatt ttatgttatt 13500
tagtgttgat taggtggata atgttgggaa atatattgtt gatgttaatt ttaaaaattt 13560
catttttttc ccaggttcga aaaggaagac ttactgccca ttacagagag atcttcggtg 13620
agccgggtag tcgtttagac caggcctctt cttccgctcc cagttcttcg ggccaggaga 13680
ctgtccccga gactcagtac actcagagag tctctgggtc tacttcttct agtgcaccat 13740
cggctcctca tgtgcctcct ccgatgcctc ctcctgtgcc tcctccgatg gcacctccga 13800
tggtcgccga tattcatcct gatctgatgg tgcctccgag tgctccttac tcgcagtaca 13860
ctgtagagga cattctccgt ctgccaggca gagaaggttt accagtcatc gacccagacc 13920
gaccggacgg aacgttgtgg tatgttgcat taattttttt taattcgttt aaatttcttt 13980
tataacatta aaaataattt atattttaaa tttgtatttt ccaggtgggg ggttgacgga 14040
tgtcttgcat cggacgtaac cgacacaatc aagggttact tctccatggc acatccaaac 14100
tggagtaaga cgcctcacta cgtcagaaag acgtggttca aaatttacgc tgtaagtttc 14160
tattaattaa ttatatatat tttaattttt tcatgattta tatatatact ttctaaaaaa 14220
ctaattgtta atttattttt tccaacagca aaaatataat tgggccttgg gaatcactga 14280
gagggtgagg aagaagttta acgcgaaagc gaaagttcgc ttgttggaca cggtctccaa 14340
ctggaagggt gactggatcg tgaaggggta tgagtgtggc aaacccgctg agctcaccac 14400
ggatgtgtgg gatggcctca tccgttattg gcgccttcct gattccatta gaatcgccca 14460
ggcttactct aactcccgta acacggtcga tgagcacggg aacgggccga tgcttcacac 14520
tacgggccaa aaaccccacg ccggtgtccg tttggaaatg gtaattaaat attttattaa 14580
ataatttttt taatatatat attaatttat tctaactttc ttaaatgttt tttaggccaa 14640
agagacggga catctcccgt ctcttatgga actttacgag aggacctaca agaacaagac 14700
gggcgtattt gtagatggca agtccgagca aatctacaac gatgtagttg ctcgggttga 14760
agaccgccag actcagctga cccagcaatc taccgacgga ttacccgtca ccttatccac 14820
acttgaagtg gataagattt acgaggaggt aaattttcaa aaaaattaat tttttattat 14880
tcatttaatt taactttaaa tttttactta caatatttat ttttgttttt aaggttgtcc 14940
ccaaaaaaag ggacggacgt tgggtattgg ttccgtcaac gttgttccga gagcgacatc 15000
gtcttatggt cagcgacggg atgatgaagt cactgagctg cgtagagagt ccgctcagct 15060
gcgtaacgag ttgaccgcga caaaatctcg tatgggtgga gtcgagggct tcttggacgt 15120
tattgcggcc acaaatccgg aatgggagtc catgttgagg aacatgcgac aacaacatcc 15180
cattcaaggc gagtcatctg acgtacataa cgaggcggat gttatgagga ggagtgatga 15240
attctaccgg gcgatgaacg accctaagtt ttttttttgg ttgttgtatt atataaattc 15300
aaaacttatt tatatataaa atattttcat attgatttat ttttattttg aattttaatt 15360
tattattaaa ttaaataatt ttaattattt tttaattata tttttaaatt ctgtaaaata 15420
ataaaaacga agtaaattcg tagccaatgt acgacctctt tacgtggaaa cctcacgagg 15480
aaatgacgag aaacatttaa cgagtatttt acgaagaatc atttacgagt aaataagagg 15540
aaaagtttac gaccatttta cgaggaaatc atttcgtggt tgttacgtgt attttgcgag 15600
gaaactcttt caaggtattt gtgtgtaggt tacgaggaac tattttcgag gtatttacga 15660
ggtattatgg cgacgtcctt acgtggaata ttgacgtggt ctttacgacg aatcgtccta 15720
cttcgtcttt acgacgaaat atattcctcg ctaagttacg acgaattagc gaggaaatat 15780
gtgttacgac agacgtgtaa cgagcaaacg cgtttcctcg ctaattcgtc gtaaagcctc 15840
tcttacgacg aattagcgag gaaaaccgcc ctcgttaaga ttatgttttc ttttagtgaa 15900
aatgaaaata taaggttgtt gtattctact ttacatggaa ttgtagcttt atatctcatg 15960
aacatatcat tcctcttcgt tcttgttctg tcttaagtga taattcattg atatatttaa 16020
tattttagct tccaccttcc tcactatttc caactcttac tttgaatctt caggtttggt 16080
atgaacgagt taggccttcc aagcagattg cttgagaccg gctgtgaacc cattggcaag 16140
aaaagggtta acaattattc aatctccggt ggattgaagt gataaagagt gcattagagg 16200
atgaagacct agcgatgttg aatgcgtcac agtttgggtg agtcttgcag atggggaccc 16260
ataccttctc ggttacgttt cttcacttta ttctatcccg ccagctggtc actgtgaagg 16320
aattctagct gtggtggctc tttgtgggga aacctattcg ctatgttaca actgttctgc 16380
agtataaatg gtaggtgggt ttaagttccc gaatagttgg attgccaatg gagtagggtt 16440
tatatttctc tattttgggt ttagtttttt ctttcacatg ttatcttatc attcccatta 16500
catttgtatt tcatattgct ccatccttgc tgaactatgg cgacaatagc cttgcaatta 16560
tgaataagac aaatatgtac gtaacactat accacatatc tagtaatgga ttgtgtttta 16620
tgttttcttg cggggttcag tgtttaattt caagtgttct cttatcttcc ccattacatt 16680
aatattgtat gtaaaatact cctatatgga atatgaaaaa tagaaaataa catagtttat 16740
attatatgaa atagaaaatt gtacgtgata ttgtccctac gtttcctatt gccaacgaat 16800
ttggggttgc tttaccaatg gattgaagtt tatatttctc taacttgggt ttagtgttta 16860
cttccaaatg atgtctactc attcctctta gctttgtatt gtatgttgcc cagttgtgga 16920
tgtaatatac ctagcatagc actttttaaa aggattgtgt ctataggaaa ttaaatgtct 16980
tcagtactca tctttgtatg aattttccgg tttgaaaacc catcgtttat gagggtcgat 17040
atcccacgcc ccaacaacaa gtaatactct atcttcagta ctcatatgcg ataagaagta 17100
aatgaagatt catttatata tcagtctcta ttccatgtaa aacttgtttt tagtacatat 17160
tctcactgca aattagctgg ttgttacttc caggcagtaa ctccttaact ttcttcacct 17220
ccttgctttg agtttcttca gatggactta cagtgataag tagatggaat acaacattta 17280
ttgctacaac tactaattta caccacttgt ttaactccat acagtaaaaa tatctttact 17340
aactccacct gtttacgtag cttcctccca ctctttaata tggagtagct gtaagccatt 17400
actggacatt tactccatta attacgtcac cgtctgtccc caaccgtaga agtcattgtc 17460
tttgtaagtg attatgttgg taaattacat tcccaagttt atattctatt tgttcatgtg 17520
gcatggaacg tacactcata taaatttgat ggtttgtatc ataccgttgc attcaaatgg 17580
ttttggttga ccagacctaa gcctgacgtc gacgttgtta tattagaaat accccacgct 17640
atatgtaccc acctcctcat ccaactccat gtatcgtact ttctaactcc cacgcaactg 17700
tagctatgat attgttttat accatatgga atagtttggc tgtacaataa atagtaactg 17760
ttgattttgc cgatctgaag ctagcaacat gagtatttgg cttcatttgg gtaaagtttt 17820
acgtactttc cttgcgtcat gcacatttca actgtaccaa aagtatttac caaaatattt 17880
acatgctttt tcaattggaa ctacatttat agggatacta ttacttttat actatgtagt 17940
atggatcttg tgtaactgct atagaataca cttgtttcat cgtcgacaat tcgccatttg 18000
tttatggtac acttgcgatt cttatctact cctacatctg catctccttc cataatgtgt 18060
tgaatacatc tcagttacgc gctccgtaag tttttgtgat tgtaaaccca ccacgtcgtt 18120
tactttgtaa tatagaaccg gtaacctgtt gctttaaggg gcataaccgg gtgggaggaa 18180
tcacaaaagc ctgacaatga attatgtcaa aatcaacgct gcttttttaa tttattccca 18240
gaaaatggct atttcgccaa ttaaccctta attgaattag aaaaatatgt atgcgaaagt 18300
aaatatataa gacatatttt atggaccggg gatgtcctag gtcgaggact aatcataatg 18360
aactgtttag catgtttttc aggcgacaga taaatccgct gttctacgtg gaaattagat 18420
atccacgccc tttaacaacg taaatgagta aatctgaatg ataggtttca aaacgataat 18480
gcctaacact ttcccgccgt atcacacgac catatccata tggttgaaat atataaattc 18540
ttctatttat attttgtctc agattatatt acttctagag gcggatgaaa aaaatatgaa 18600
aatctgaacc tgagaattca aactattttg aatttgacat aagcatccaa atggttattg 18660
ttctatggta tttcagattt tagtttttac ccagatcaaa ataatggaaa tcgaaaaaaa 18720
aactcaaatt ttttaaaaac ctttcaaaat acaaaatgga tcaattttga ataattatcc 18780
aaaatactta aagatccaat aattattcaa aatacttaat gaactataat atttaattta 18840
taaaattagt aatttatcaa aatatcatat ttagatttat atatttttta aatatgttta 18900
tatgtaaaat aaaaagaata gattttttgt gaattatata tataattaag ttttataaac 18960
ttagcttcca tagtgtttat taaataattt gacatatata tatatatata atatgaatca 19020
cataatgtta atgtttttaa atataatctg ataaataatt ataaatactt tgaagtgttg 19080
aaaaagtttg aaatgaattt cattttaaat aaaaaccata cataacaata ttttgttatg 19140
tttatataat ttttatacat catttattaa tttataattg taatgagaca atataattta 19200
tgatttttta taaatgttaa tttactgaat attaatttgt tgaaaatatt aatttattga 19260
atactaattt attaaatatt aaaatatgat tttattgaat attaaaaata ttaatttatc 19320
gaatactaat ttataaagct tctggtagtc gtctgttaac tcatatattt ctctaactac 19380
tactgaataa gcttgtgact tattatacac gtctatacgt gtttatctat aaattgttta 19440
cgtcgaaaga atcatttcgt agatacccac gatgttaccc aagttcaaga attaagaaaa 19500
ttaactatct atcattacgc tacttaccaa aaataatatg aagagtaggc ccgcgggaat 19560
atgctgcctg ttataaattt gcaaatgaca ataaaaataa cttatatatt acactgaaat 19620
atctctaatg tgtagggtta taaagaaaaa tataattagt taagctattc gttaacattt 19680
ttgccccgtt aattaactat gtattttggg ttttgaacta atcataaaaa tcatttaaaa 19740
gacacaattg ttgattcaga cgaacaaacc aatacaagtg ttgagggaat gtagttggta 19800
tagaacacgt cgtaagaatg atgtattttc gtgtaccatg ggccggccct ggcataaagc 19860
ccataaaaca agtactttag gcaccaaata taataaaaaa ttcatgggca ccaaattttt 19920
ttaaagtcac cttagtctaa tgcattttac gttatcctct tgagcaacaa gacacgagtt 19980
tgacgcgtac tttcttttct tccttttttg ataataatgt catttttgat aatactaaca 20040
atttaatatg atttattcat ggatacatat agacacggtt agtttcttaa tctgccgaca 20100
aaaaaattac ttaatctaac aactattttc tttaattata catcttatat taaattgtgt 20160
gacactagat aaataaattt aattaaacaa aaaacttttt ttggcaaata acaaacctat 20220
gtattagtaa caactaacaa tcatttagat tcttgacgtc ttttgtgtat ttcttgcgtt 20280
gatctttgct ataatagctg aagaagttat aacaattaac tcaaatgatc aattcttcat 20340
attccaagtt tgttttaatt gatatccatc ggaatagctg gcatatgtca tgtaagtttt 20400
catttttttt ctacttgttg gtttctattg cttaaaaaaa taaaatttta ataaacaaaa 20460
aattattgtg agattttaac attcgatgct gacaaataat ttttgaaaaa aaaaaaactt 20520
cagaaaataa ggttttcatt ttttcttaaa gtaaataaat tttaatatga tttaatgcta 20580
ttttattaaa taacaaaaat aaagcaaaaa ttaatatatt gaaagggcat atttgttaag 20640
tacgctttag gcaccagtta agtccggagc gacactgcca catatacaac tcgctaaaac 20700
aaagatttat tgtactgcat gaaccttcca accacatata gactcatcac cacgacaaaa 20760
aaaaaaaaaa cctggactac actcaagttg cgcaagccag tcatggaccg tagagtagct 20820
tggttcagac cgtgtagagg atcatatgta aaggaagttc gaattcatag caccagagac 20880
catcgtttct agctaggtcc atacaaactg agttttttca ttgttttgga ggagattcgc 20940
gcggaaccga agttccgaaa cccgatattg tcaatttgtc ataagtgaat tggcttctat 21000
acttctcgta acaaaatcat taacatggat tagtggtcca ccaaaactga aagataacat 21060
gttaaagaag tggactacta catagtccca gactcccaat caacataagt tacataacca 21120
atagatgaca aatggtccat caattatcaa atttgcttgc ttttgttttg caggtgttat 21180
ttagtgtatc catcccgaaa cgcattttct aaactcgtag tcttgtgcag ttttctagtc 21240
caatcttcat attgttacca agaaaaatac ttgttatgtg aatatttttt ggattgcatg 21300
ccactagccg aaatttcatg gatcaatgga tctttggcgt acatatattt attagaacac 21360
tttcattaca gaggatcctc aggaaaatat ctcataataa aataaaaaca ataaaaagag 21420
aataagatag gatttttaaa tgattatttt tgaaaaaact catgaaaact ccatgaaata 21480
cttgtctttt ccatataggt tcaattttta ttttaaatta ttcttaatca attatttaaa 21540
tttcatttaa atactgatat tttgtttgag aatcaatgat gctctaagtg gcaataattg 21600
taaccagtac tagtttcttt attgaccaac tgatatgaaa cgagaatttt ctattttcta 21660
tttttgtttt agtatttatg tttctgttgc catgacaaag aaagagtgct aaaagatgag 21720
agatgttgct tgttaattgt tatatacgag tagagtataa ccatatcccg atttacatag 21780
ataggattag gaagcgatac gttatacata tcaggataga aatattagtt gaaaatgagc 21840
actacgcgag atgttaaaga aaaaaaggcg tacattaaag cccttaatat tcgacataag 21900
agcaccagca tcagcattag aggttcgtgg acagtggcgg agccagacga aagttttacc 21960
aggggcaatg taaaatttat cttcagttta tagggagcag tataagaaaa ttcaccatta 22020
taatcatata attctcaaat aaacaatgga aaaaaatatt ataatatgct acagtaatga 22080
tcctgtctcg ccacgctcct tccgtatgaa cccgagttgt cactgttcag cgggctccac 22140
gccacgtggc ggtctgctat tggtcaattt atttatttat tttttaaaaa aaaaacaaaa 22200
taaaaataat agtaataaaa taataaaaaa ttcaaattat gaaccccaac cgtgggttca 22260
ttaatgctgg tgctctaata tgtgtgcctt aaataaaaac gtggctaatc tatcaataca 22320
aagcacagtt aaaggtacaa ccattaagaa aaagaagagt taaagatcac gatcacttca 22380
tgaatacacg tctcttcaac atcacaaacc attcatatgt atggtttaat atctaacaga 22440
gtatatattt ttcaaagaga ctattatgga agagtccata ttaattttct aaggaggggt 22500
gcatccacag attgattttc tttcatattt taaatgggtt gtaaacaata attcatatcc 22560
ttatgattat ataggtttag tgccgtggag tttattcgaa cccggatctc tctgaagtct 22620
acataccatt agaccaatct catgtggtta atcaagccaa tttttgaaga taactagatg 22680
taaattaaac aattcaaaga gttgttcaga aaaaaagagt gatggctttg gacaagaaaa 22740
agaaagatgg gatgttgtac gtgcacgtgt aaacgacgaa acacgttggg ttctattcct 22800
aaagaagcat tggctctact ttctaacaaa tctctaatta tccaattaat tatttgatcc 22860
taaacaatga catctcgttt gaggttttct ccttttttcg attcatcaat atttccctag 22920
gaaaaagttt tgtttctgtc aacttgtaaa tgatcaccgt gaatatctta caacgacgca 22980
tattcccatt acagaagaac aggtttcagt ttggatcaac ctaataagtt tcagacttta 23040
ctaccttcac tacaagaaaa cacaaattta acgacggcca aaatcgtcgt tatttcctcg 23100
gaaaagaagg cttacgagga aatggcgatg aaaggcgttt cgtcgttata tgattgtcgt 23160
aagagaagat tcgtcgccat ttcctcgtta attagcgagg ttatattttc ctcgtaaaga 23220
agaattaagt tttcgtcgta aagaccacgt ggggtttcca cgtaacgcgg tcgttgtgct 23280
tcctcgtaag aaactcgtaa atgattcgtc gtaaaagacc cgcaaaaacc tctaaataaa 23340
ttcgtcgtaa taaaaacgta agaaacacgg aaacaattcg tcgtaataga atcgtaacta 23400
aatccacgta aaatcctcgt taattgttcc tcgatatttc gtcgttaatt ttcctcgtta 23460
atacatcggg aattagcgac gcaattactt tgttttctat ttactgaatt tataaataaa 23520
aattatattt atttaattta ttaataaaat tttaattgaa attaaatcga atagaaaata 23580
tttttttggc cgaattaaaa tgaaattata taatatataa ataagttttg aattttaaaa 23640
tacaataa 23648
<210> 7
<211> 3247
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 7
catcagaccc tttcttcacc acatttcact cagagcccac acagttttag agagagagag 60
aaacatccct caaagctctc tctctttctc cggcgatggt tgtcgctatg gaccagcgta 120
gcaatgcgaa cggagacgaa aggtttgatc cgagcgcaca accaccgttc aagatcggag 180
atataagggc ggccattcct aagcattgtt gggtaaagag tcctttgaga tccatgagct 240
atgtcgccag agacattttc gccgtcgtgg ctcttgccgt cgccgccgtg tattttgata 300
gctggttctt ttggcctctt tattgggccg cccaaggaac cctgttctgg gctatcttcg 360
tactcggcca cgactggtaa tttaattttt ctttcaactt cttaattttg atatgtttat 420
atgttttttt cgttttttgc attgtctttg atttcttgac cgtacgttcg atatgagatt 480
ttcactgact tcaagatttg attctcttca ggtttacttt tttcaatttt aattattatg 540
ttcatccaat ttggcctatt ttaaaagcaa aaggggatct aagattttta attcttttgt 600
ttttttttgg ttctttttca tcagtcgtaa cactcctaac taaacatctt tttctttcct 660
ataattattg ttgtttccgc gttttatgga tctacgtttg aaattttcaa taaaacacat 720
tttattgttt tctgtaacaa tttaattact gtttattggt tcttttaatt attgtgtgtt 780
gttccaatct attttcgaaa tatagtcatg tgacacgtca tattctattt ttgttacctt 840
gttgaaacgt ttgaattgag gaaagttcag ttaacattgt gcaataaatg ataaatgtgt 900
ttatgatgta aaatttcatt tgaataatac agtggacatg ggagcttctc agacattcct 960
cttctgaata ctgcggttgg tcatattctt cattccttca ttctcgttcc ataccatggt 1020
tggtaagtca tttattttaa cttctttttt catgcaaatt tattcttgtt ttcgtatttc 1080
ttacattttc cttgtcattc ttggtgcatg ttagcaaaca gtaatctgat aactgaaaat 1140
atattaattt ttcatagtaa aataatgcat gtgactaaaa gcatcaaaat ctttagcatc 1200
gaagaaaaaa gaaccaaact tttatttaat gctatgggcc tatttatggt ccaattagct 1260
attatcatat gacatgtcct tgaataaatt aatgtataag tttaatataa tatttatata 1320
tatttgtttt aatggcttat tttattgtta aatggataca tcagcttgaa atatctacga 1380
acatgcatca ttttcctaga tacatttgtt tgttgctcaa aaaatgaata acgtagttaa 1440
acgagtgaga ttcttagcat ctgcctcgaa aacgatatgt tattgacaat tccaatttca 1500
tttttatgaa aataaaataa tagtttattt tataattggg ggtggttgca ggagaataag 1560
ccatcggaca caccaccaga accatggcca tgttgaaaac gacgagtctt gggttccggt 1620
aatccccctc tcattatttt tttttctttt tttgaaactc tttcatttta attttcttag 1680
aattctatgt atttatttta atcaatcctt tttccagtgt gaggcttgga cgaccacttg 1740
tcagatttgt cgtttagctg tagtaaacaa ctgatttaaa ttgtttatgg tactgtagtt 1800
aactttaaca acgggccact tatattcgag ccattggcat aaaatgattc ttctcgaaat 1860
tcgtttactt ttcttagtat ttttcagttt tgtagtttac gtagaactaa taaaaagaaa 1920
aaaacttata aacacaccac atgcaatgaa taaattcgaa tatataacca tactgttaaa 1980
tattaattaa cattttaatc ttaattttgc attccagttg ccagaaaaat tatacaagaa 2040
tttgtcccac agtacacgga tgctcagata cactgtccct ctccccatgc tcgcttaccc 2100
tctctatctg gtaaatccta attcctcatt tttcttcctg attataatta caattttgaa 2160
tttttagatt ttgagtatta actaaatata aattaaattt gtttggggat gactacagtg 2220
gtacagaagt cctggtaaag aagggtcaca ttataaccca tacagtagtt tatttgcccc 2280
aagcgagaga aagcttattg caacttcaac tacttgctgg tcgatcatgt tggccactct 2340
tgtttatcta tcattcctcg ttggtccagt cacagttcta aaagtctatg gtgttcctta 2400
cattgtaagt ttcatatatt tcattattat atcattgcta atataatttg tttttgacat 2460
aaagttttgg aaaaatttca gatctttgta atgtggttgg acgctgtcac gtacttgcat 2520
catcatggtc acgatgataa gttgccttgg tacagaggca aggtaagtag atcaacatta 2580
atttataaga agcaacaatg attagtattt gattaatcta aattattgat gttttgtgta 2640
caataatagg aatggagtta tttacgtgga ggattaacaa ctattgatag agattacggg 2700
atcttcaaca acattcatca cgatattgga actcacgtga tccatcatct tttcccacaa 2760
atccctcact atcacttggt tgatgccgtg agtgatctcg ctctctctct agtttcattt 2820
gattaaaatt aaagggtgat taattactaa attagtgatc ttaattaatg atatgcgaca 2880
gacgaaatca gctaaacatg tgttgggaag atactacaga gaaccaaaga cgtcaggagc 2940
aataccgatc cacttggtgg aaagtttggt ggcaagtatt aagaaagatc attacgtcag 3000
tgacactggt gatattgtct tctacgagac agatccagat ctctacgttt atgcttctga 3060
caaatccaaa atcaactaac ctttcttcct agctctattt aggaataaaa cagtcctttg 3120
gtttttactt atttctggtt gtttttaagt taaatgtact cgtgaaactt tttttaatta 3180
aatgtattta cattacaaat caagtttttg ttcgttttct ttatgttttt agttacaata 3240
aataaag 3247
<210> 8
<211> 4014
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 8
catcgaaccc tttcttcacc acattccact tcccacactc tctttttttt tgaattatag 60
agagagaatc ctcctccaaa tctctctctc tcccaggatg gttgttgcta tggaccaacg 120
caccaatgtg aacggagatg ccggtgcccg gaaggaagaa gggtttgatc cgagcgcaca 180
accgccgttt aagatcgggg acataagggc tgcgattcct aagcattgtt gggtgaaaag 240
tcctttgaga tctatgagct acgtagccag agacatttgt gccgtcgcgg ctttggccat 300
tgccgccgtg tattttgata gctggttcct ctgtcctctc tattgggtcg cccaaggaac 360
ccttttctgg gccatcttcg tcctcggcca cgactggtaa agtttcttcc attttgcatt 420
gcatcgattt attgaatgca cgttctacga gtattgtttg tcagttactt cgtaaaatga 480
ttcttttgat gttcattttt tgaagatcta agattttttt tttagatttt ctttttaaat 540
cattgttcca ccaccacctt tcatcggtcg tacgactcgt tacaacacca catctttatt 600
ttctataatt actactgctt ccgcatttta tggatctctc aacttataat taaagtataa 660
tatcaagaat atctattatt tttcttaaac aagaaagata atattgtttc tttgttattt 720
tggtgtattt ccaatctatt tcgagattta gaaatgtgac acgtcattac cttgttgaag 780
tgtttaaaac aaacatggaa agtttaaata aatagtgcaa taaatgatat atatgtatat 840
gatgaataat gatgtgaaat ataattgaat aatggcagtg gacatgggag tttctcagac 900
attcctctgc tgaatagtgt ggttggccat attcttcatt ccttcatcct cgttccttac 960
catggttggt aagtcagctt atcaaccctt tttactatat tattaattat taaacttgca 1020
tttgtatact tggtgcaagt tggtaaatgt aatctgataa ctgaaaatct attcattgct 1080
cgttctattt tttttttggc tagagacaat tttataatta aataatgcat gtgagaatat 1140
gactatttat gtgaggtagc ttttcttatt cctgtcgaaa agcatcaaat ctttagcaac 1200
gaaggaaaaa ggaatcaaat tttttattaa atgcaatggg tctatgtctt ggtcattagt 1260
tttttgcata taatttattt atattttttt cttaacagca gctaatttaa ttataattaa 1320
atattcattt tataaataat attagaccaa ttattaaagg ttagatattt taagaattat 1380
tcatgacttt gtttattgga actcctttta tcttttaatc ttttctattt ctccattttt 1440
aataatgaga aactgacttc aaatctccaa taaagatggt cttatgtagt aacagtataa 1500
ttttttgttt ggtaaatgta acatcatctt caaatatctt tgaaaataga cttacatgca 1560
ttattttgct gcgacattat tgtcacttat tcctggcaat aaattagttt attactgaac 1620
ttttttttgg tcaatttatt actagtaact ttaaacttaa aagagtgaga ttgtttgatc 1680
aaaaaaaata aaaatagagt gagatagtta gaatctgcca tgaaagcaac actatataga 1740
caatttaatt tttatgaaaa cacatttaat aatttgaggc tgcaggagaa taagccatcg 1800
gacacaccac cagaaccatg gccatgttga aaacgacgag tcttgggttc cggtaacatt 1860
tccctcttta ataatttcta tttttctgtc aaaataatta gtttttcgaa atttgaggcc 1920
agaacgacca cttgtcaaat ttgattttta gctgtagtaa aaacagtttg ctagtgtcac 1980
agttaaccgg taattgattc tttttaacga tttatagaag taacattttt gtaaaataaa 2040
atatacatta tggtatgtga caacggacca cgcttatttg tattggtgaa tcttttaatt 2100
actccctcca atttatttta gttgcagatt tagatttatg cacatagatt aataaaaata 2160
ttttgcacat tttcaaaata aaaacaccat tacttataca actaaccata tttcaaccaa 2220
taaaaataaa ttagaaaata ttatttataa attttgtatt gaaattataa aataatactt 2280
attttaaaac gaaattaatt tacaacgaca attaaactga aacggaaaga aattattaat 2340
acttaattaa agagttttta gaaaaattga aagacatgtt tatgcgaaac tcatgtgaaa 2400
gtctttgaaa taatagattt tggtataaat atttcaaatt ttcttaaaat aataattata 2460
tattaatata atttgtgata aaatctcgtc aaaaactcac taatgcaaat gcttttattt 2520
tgaatttctt actcctctaa atgcatttac ttttatacta atattatttt ctttctctaa 2580
tttggcgttt cgtaatagtt tgtctgtatt ttgaaaacta acaaaaaata ataaaaacaa 2640
aagcttataa acacatagca tgcaatgaat atgtacgaat atatatacca atacatatct 2700
aagtactatt tttccaagta cttaatcttg attactaaaa ttcattttaa ttgttccttt 2760
cagttaccag aaaggttata caagaattta ccccacagta ctcggatgct cagatacact 2820
gtccctctgc ccatgctcgc ttacccgatc tatctggtat tttttaattc ctaaaattta 2880
ctacaagtca ttttagactg tgttttaaaa caatataatt atttttgttt ggttttactg 2940
cagtggtaca gaagtcctgg aaaagaaggg tcacatttta acccatacag tggtttattt 3000
gctccaagcg agagaaagct tattgcaact tcgactactt gctggtccat aatgttggca 3060
attcttatct gtctttcctt cctcgttggt ccagtcacag ttctcaaagt atacggtgtt 3120
ccttacattg taagtttctt agtatatcat aaagggtata tatttattat tcaatatata 3180
tactatatga tttgtttttg tcatatattt ttgaaatatt cagatctttg tgatgtggtt 3240
ggacgctgtc acttacttgc atcaccatgg tcatgatgag aagttgcctt ggtacagagg 3300
caaggtaatt aaattaacta ttacaagtat tttacaaaaa actaatgatt agtatatttg 3360
attaatctta attcttgatg ttttgtgatt aataatagga atggagttac ttacgtggag 3420
gattaacaac tattgataga gattacggaa ttttcaacaa cattcatcac gacattggaa 3480
ctcacgtgat ccatcatctt ttcccacaaa tccctcacta tcacttggtc gatgctgtga 3540
gtcatctcac tctctggcta ctttcatcaa aaccatttga ttaaagggtg attaattact 3600
aatgtagtga ttttaacaaa tggaatgtga cagacaaaag cagctaaaca tgtgttggga 3660
agatactaca gagaaccaaa gacgtcagga gcaataccga tccacttggt ggagagtttg 3720
gtagcaagta ttaagaaaga tcattacgtc agtgacactg gtgacattgt cttctacgag 3780
actgatccag atctctacgt ttatgcttct gtcaaatcga aaatcaatta aactttcttc 3840
cccctttttg tttagcacta ttatgaataa accagttttt tttacttata tattgttgtt 3900
tttaagttaa aaatgtactc gtgaaactct tcttaattta gatattattc catttacact 3960
gaaaaacata caatttcaaa ggttgaaaag aaagacaaaa ttttctagaa tgac 4014
<210> 9
<211> 4761
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 9
catcaaacct ttcttcacca catttcactg aaaggccaca catctagaga gagaaacttc 60
gtccaaatct ctctctccag caatggttgt tgctatggac cagcgcagca atgttaacgg 120
agattccggt gcccggaagg aagaagggtt tgatccaagc gaacaaccac cgtttaagat 180
cggagatatc agggcggcga ttcctaagca ttgttgggtg aagagtcctt tgagatctat 240
gagctacgtc gccagagaca ttttcgccgt cgcggctctg gccatggccg ccgtgtattt 300
tgatagctgg ttcctctggc cactctactg ggttgcccaa ggaacccttt tctgggccat 360
cttcgttctt ggccacgact ggtaaattaa attttctgtt ttaattattt tgactctttt 420
tgttcaattt attaatttct tgaatgcacg ttcgatgagt atcgtcgtca ctgacttcaa 480
gatttaattc ttttgaggtt accttttcat gttcaattat taaaaaataa aataaaatat 540
aggatctaag atttttttct tcatcagttc aagcatcatc actcatcagt cgtaagactc 600
gtaacaaaat atcttctttt ctataattaa tattatttcc gcatttaatg gatctacgtt 660
ttgatgttct caaattttgt ttctctttct ctagatcccc ggaactttta attataatta 720
tagtatagta taatatcaag aaaatatact gtttattttt tttggcaaca aatatattac 780
tcttgtttct ttgacaagaa aaaaatatat tgtttttttc ttctttttgt gttccaatct 840
attttcgaga tttagacaag tgacacgtca tataccggat ttgttacctt gttaaagagt 900
ttgggttaaa acaaatgtag aaaagttaaa ataaattgtg caataaatga taaatacgtt 960
tttatgttaa acaatgatgt gaaaataaaa ttgaataatg gcagtggaca tgggagtttt 1020
tcagacattc ctctgctgaa cagtgtggtt ggtcacattc ttcattcatt catcctcgtt 1080
ccttaccatg gttggtaagt catttattaa ctatttccat gtaaactatt agtacttgtt 1140
ttcgtatttc ttacattttc gtttgtcatt cttcttgggt gcatgctagc aaactgtaat 1200
cagtattaac tgggaactac caactgtttt ttttttgcta gagtagcaat tttataatta 1260
aataagaatc ctattaaaca atgcatgtga caatatgagg ttgcttttct gttcaaaaca 1320
aatctttaga agccaatgaa aaagaatcca aaactttttt ttaaatgata tgcgcctatc 1380
tattggtcct gactcctgag ttttcttact ttcttaagta taattagatt ttgatttttt 1440
tttataggtt ttcactattg ttatttgttt acatcagctt cagatatctt cgaaaaagat 1500
ttacatgcat caatttcatg aggatttata gtttttcttt tacttatttc cgacacaatg 1560
tttagtagta aaaagcatta aatgtttttt tgctcaaaaa aaaaagaatg ggattgttag 1620
agcactctat tgttagttgt tcaataaata taccaactaa aaaaacaaaa taaatataaa 1680
atgagtgaga ttgttaaatc attatagaga caatttcatt ttcacaaaaa taaataaata 1740
cataactttt tataattggg gtttgcagga gaataagcca tcggacacac caccagaacc 1800
atggccatgt tgaaaacgac gagtcttggg ttccggtaat ctttcctact ctcgtagttt 1860
ctcttgtctt ttatttattt gtttgttttt cggaatttat tcttatgtct atgttcttag 1920
gattctatat gtttatttta ttagtttatg ttttcagtct gaggtcagac cgaccacttg 1980
tcagatctgt tttctagctg tagtaaaaaa caatttgcaa gtgtaatagt tcagcataat 2040
tgatcttgtt agagcatttc caaaacaaac tttataattt taaatataca gttttttgtt 2100
ctctaaaaaa gaatttaaaa attttaaagt ttgagggacg aaacttcaaa tttgaacttt 2160
cactactcaa cttcaaattt gaaatttcat cttttttatt tacattttga tcattataat 2220
taattataca ttacatttat gattcttaag tattttctca tttattgttt taattcttaa 2280
attttttata catcataaat atttccaatt tgtttttata aattcaaatt ttacacaaaa 2340
aagtaataaa aattttaaat aagatttata atattttaaa actataatta ggcaaaaaaa 2400
atattacaaa aaaatgtaat aaaaacttta aaataagata tatcaagaca taattattag 2460
aaattttaaa tattataaca atattaataa tctggtaaat ttgctccaaa acctcaaaaa 2520
tttctaaatt attgtccaaa caaatttgtt taaccgaata tggagcatta caaaaataat 2580
tttatggaat agtgtggtat tttgcttgta gttaatattt aattatgtat ttctatttat 2640
aattttatat atttaatgta agattttttt aattaatatt actgtaatat ttttatatat 2700
gtactagtta tttataaaag ttttatagat ttgtattagt tataacaaaa ataaggatca 2760
ttgtgtaaaa tacaaataat tttgaaatta cgtttaaagt tttggttatg aaaaaaatac 2820
tttgaaactt taaatttaga gttttgcaaa ctttaaaatg ttagatagat agtttttttg 2880
gagatgcatt tagtggttat ggtagtaact cagaaaatga aaaatctata cttttatact 2940
ccctccgttt tttaatataa gtcgttttac agttatacac gtagattaag aaaaccatta 3000
atttcttata ttttctagac aaaaacatca ttaattattt acctaaccac aattcaacca 3060
atataaaaat agaagatata ttaccattgg tcatacaaca ttaattatta ataaatttta 3120
catagaaaac cgaaaacgac atataatttg gaacaaaaaa atttctctaa aacgacttat 3180
attaaaaaac ggagggagta gtacctaact ttaacgatgg accacttata ttcgagtcct 3240
tagcataaaa tgattctcct cgaaatccgt ttactttctt cattattttt tccttttcag 3300
ttttggcgtt ttcgtaatac ttttgtcttc aatcttgaaa gctattagta taaaaactta 3360
taaacacatc acatgcaatg aattaatacg aatacataac cagaatgaca aattttcaat 3420
gaatatttaa taccagtaag tactactccg taatagtaat agtaatagtc atattaattt 3480
ttttttgtca tcaaacaaac agtaatagta atattaatta taattatgta tttcagttgc 3540
cagaaaagtt gtacaagaac ttgccccata gtactcggat gctcagatac actgttcctc 3600
tgcccatgct cgcttacccg atctatctgg taaaaaaaaa tacaatttca atttttttct 3660
taaaattaca aatggtttta tattttgagt tttaagccaa tatataaatt aattttgatt 3720
ggattttaac tacagtggta cagaagtcct ggaaaagaag ggtcacattt taacccatac 3780
agtagtttat ttgctccaag cgagaggaag cttattgcaa cttcaacaac ttgctggtcc 3840
ataatgttgg ccactcttgt ttatctatcg ttcctcgttg gtccagtcac agttctcaaa 3900
gtctatggtg ttccttacat tgtaagtttc acatattatt acaagagatt tatatattat 3960
taataataaa tttgtttttt gacataaagt tttggaaaat tttcagatct ttgtaatgtg 4020
gttggacgct gtcacgtact tgcatcatca tggtcacgat gagaagttgc cttggtacag 4080
aggcaaggta aataaatcaa tttttaaaaa gaaatgtaca gaaagcaata atggttagta 4140
ttgattaatc ttaatttttg atgttttgca tacaataata ggaatggagt tatttacgtg 4200
gaggattaac aactattgat agagattacg gaatcttcaa caacatccat cacgacattg 4260
gaactcacgt gatccatcat cttttcccac aaatccctca ctatcacttg gtcgatgcgg 4320
tgagtgatct agctttctct ctctctagtt tcatttgatt aaatggtgat taattactaa 4380
tttaattaat gaattgtgga cagacgagag cagctaaaca tgtgttagga agatactaca 4440
gagagccgaa gacgtcagga gcaataccga ttcacttggt ggagagtttg gtcgcaagta 4500
ttaaaaaaga tcattacgtc agtgacactg gtgatattgt cttctacgag acagatccag 4560
atctctacgt ttatgcttcg gacaaatcta aaatcaatta acttttcttc ctagctctat 4620
taggaataaa cactccttct cttttactta tttgtttctg ctttaagttt aaaatgtact 4680
cgtgaaacct tttttattaa tgtatttacg ttacaaaaag tggaagtttt gttatctttt 4740
tctctagttg caatcaaaag g 4761
<210> 10
<211> 3827
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 10
catcaaactc tctccaccac atttcactca gagcccacac agttttagag agagagaaac 60
atccctcaaa gctctctctt tctccggcga tggttgtcgc tatggaccag cgtagcaatg 120
tgaacggaga ttccaaggac gaaaggtttg atccgagcgc acaaccaccg tttaagatcg 180
gagatataag ggctgcgatt cctaagcatt gttgggtcaa gagtcctttg agatccatga 240
gctacgtcgc gagagacatt ttctccgtcg tggctctggc cgtcgccgcc gtgtattttg 300
atagctggtt cttctggcct ctttattggg ccgcccaagg aacccttttc tgggccatct 360
tcgtactcgg ccacgactgg taatttaatt ttcaatttat tttttcttca acttcttaat 420
tttgatatgt ttatatgttt tttcgttttt tgcatcgtct ttgatttctt gaacgcacgt 480
tcgatatgag attttcactg acttcaagat ttgattctct tcaggtttac ttttaaaaaa 540
aaaaattatt atgttcaccc aaattggcct attttaaaag caaaagggga tctaagattt 600
ttaattcttc tctttttcag tcgtaacact gctaactttt ttttttgatc aaatcgtaac 660
actcataagt cctaactaaa catctttttc tttcctataa ttattgttgg ttccgcattt 720
tatggatcta cgtttgaaag tttcaataaa acacatttta ttgtttgaaa gtaacaatat 780
aattactgta tattgattct tttaattatt gtgtgttgtt ccaatctact ttcgaaatat 840
agtcatgtga cacgtcatat tctatttttg ttaccttgtt ggaacgtttg aattgagtaa 900
agtttaatta acattgtgca ataaatgata aacatgttta tgatgtaaaa ttcaatttga 960
ataatacagt ggacatggga gcttctcaga cattcctctt ctgaatactg cggttggtca 1020
tattcttcat tccttcattc tcgttccata ccatggttgg taagtcattt atttaaacat 1080
ctttttcatg caaatttatt cttgttttcg tatttcttac attttccttg tcattcttgg 1140
tgcatgttag caaactgtaa tctgataact gaaaatatat taattttcca tagtaaaata 1200
atgcatgtga ctaaaagcat caaaatcttt agcatcgaag aaaaaagaac caaactttta 1260
tttaatgcta tgggcctatt tatggtccaa ttagctatta tcatatgaca tgtccttgaa 1320
taaattaatg tagcttcata tgtgagttta ataatattta tatatttttg ttttaatggc 1380
ttattttatt gttaaatgga tacatcagct tgaaatgtct acgaacatgc atcattttcc 1440
tagatacact tgtttgttgc tcaaaaatga ataacttagt taaacgagtg agcatgttct 1500
atggggtttc ttagagcatg attattgaga agttcctaga gtgaggttct taccggaata 1560
taagaatcta tctcttaact tttaactaaa aaaattaaga accggctttt aaaactcgta 1620
tttaagaacc gttttttagt ttttttagtt aaaaatcaag agacgagttc ttatattccg 1680
ctaagaactc caccctgaga acttctcaat aatcatgctc ttagtgctct aagaagggtc 1740
cttaacaaaa tattaataat aagatatagt gtgggcccaa aaaaaacaaa aaaccggtta 1800
caaaagtcgc gaaagaagga tcgattttgg tcttttactt gtactgtttg tggatcccac 1860
tggtggtggt ccgcgattgg tttctttttt aatttaattt atttttttaa tcggagaaaa 1920
aaattaagaa accaaaaaac agttttaatc atggcctcat gttggggttg agttttatat 1980
tctgataaga atcccatctt aaaaaccccg ttaaacatgc tcttaccatc tgcttcgaaa 2040
atgatatgtt attgacaatt ccaatttcat ttttatgaaa ataaaataat agtttatttt 2100
ataactgagg gtggttgcag gagaataagc catcggacac accaccagaa ccatggccat 2160
gttgaaaacg acgagtcttg ggttccggta atctttccct ctctcatatt ttttttcttt 2220
tttttgaaat tctttcattt taattttctt aggattctat gtatttattt taatcaatcc 2280
tttttccagt ttgaggctag gacgaccact tgtcagattt gtcgtttagc tgtagtaaac 2340
aactgattta aattgtttat agtactgtag ttaactttaa caacggacca cttatattcg 2400
agccattggc ataaaatgat tcttctcgaa attcgtttac ttttcttagt atttttcaat 2460
tttggagttt acgtagaact aataaaaaga aaaacttata aacacaccac atgcaatgaa 2520
taaattcgaa tatataacca tactgttaaa tattaattta cattttaatc ttaattttgc 2580
attccagttg ccagaaaaat tatacaagaa tttgtcccac agtacacgga tgctcagata 2640
cactgtccct ctccccatgc tcgcttaccc tctctatctg gtaaatccta attcctaatt 2700
tttcttcctg attataatta caattttgaa tttttagatt ttgagtatta actaaatata 2760
aattaaattt gtttggggat gactacagtg gtacagaagt cctggtaaag aagggtcaca 2820
ttataaccca tacagtagtt tatttgcccc aagcgagaga aagcttattg caacttcaac 2880
tacttgctgg tcgatcgtgt tggccactct tgtttatcta tcattcctcg ttggtccagt 2940
cacagttcta aaagtctatg gtgttcctta cattgtaagt ttcatatatt tctttattat 3000
atcattgcta atataatttg tttttgacat aaaagttttg gaaaaatttc agatctttgt 3060
aatgtggttg gacgctgtca cgtacttgca tcatcatggt cacgatgata agctgccttg 3120
gtacagaggc aaggtaagta gatcaacatt atttataaga agcaataatg attagtagtt 3180
gaataatctg aatttttgat gtttttgtac aataatagga atggagttat ttacgtggag 3240
gattaacaac tgttgataga gattacggga tcttcaacaa cattcatcac gatattggaa 3300
ctcacgtgat ccatcatctt ttcccacaaa tccctcacta tcacttggtc gatgccgtga 3360
gtgatctcgc tctctctcta gtttcatttg attatattaa agggtgatta attactaaat 3420
tagtgatctt aattaatgac atgcgacaga cgaaagcagc taaacatgtg ttgggaagat 3480
actacagaga accaaagacg tcaggagcaa taccgatcca cttagtggaa agtttggtgg 3540
caagtattaa gaaagatcat tacgtcagtg acactggtga tattgtcttc tacgagacag 3600
atccagatct ctacgtttat gcttctgaca aatccaaaat caattaatct ttcttcctag 3660
ctctatttag gaataaaaca ctcctttggt tttacttatt tctggttgtt tttaagttaa 3720
aaatgtactc gtgaaacttt tttttattaa atgtatttac attacaaatc gtaaaagttt 3780
ttgttcgttt tctctatgtt tttagttaca aacttacaat caaaaag 3827
<210> 11
<211> 4668
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 11
catcaaacct ttattcacca catttcactg aaaggccaca catctagaga gagaaacttc 60
gtccaaatct ctctctccag cgatggttgt tgctatggac cagcgcagca atgttaacgg 120
agattccggt gcccggaagg aagaagggtt tgatccaagc gcacaaccac cgtttaagat 180
cggagatata agggcggcga ttcctaagca ttgctgggtg aagagtcctt tgagatctat 240
gagctacgtc gccagagaca ttttcgccgt cgcggctctg gccatggccg ccgtgtattt 300
tgatagctgg ttcctctggc cactctactg ggttgcccaa ggaacccttt tctgggccat 360
cttcgttctt ggccacgact ggtaaattaa attttcagtt ttaattattt tgtctctttt 420
tgttcaattt attaatttct tgaatgcacg ttcgatgagt atcgtcactg acttcaagat 480
ttaattcttt tgaggttact ttttcatgtt taattattaa aaaataaaag aaaatatagg 540
atctaagatt tttttcttca tcaatgttca agcatcgtca ctcatcagtc gtcagactcg 600
taacaaaata tcttcttttc tataattaat attatttccg cattttatgg atctacgttt 660
tgatgttctc aatttttgtt tctctttctc tagatccccg gaacttttaa ttataattat 720
agtatagtat aatatcaaga aaatatactg tttatttttt tggcaacaaa tatattgttt 780
tttgacaaga aaaatatatt gtttttttct tctttttgtg ttccaatcta ttttgtgatt 840
tagacaagtg acacgtcata taccggattt gttaccttgt taaagagttt gagttaaaac 900
aaatgtagaa aagttaaaat aaattgtgca ctaaatgata aatacgtttt tatgttaaat 960
aatgatgtga aaataaaatt gaataatggc agtggacatg ggagtttctc agacattcct 1020
ctgctgaaca gtgtggttgg tcacattctt cattcattca tcctcgttcc ttaccatggt 1080
tggtaagtca tttattaact atttccatgt aaattattag tacttgtttt cgtatttctt 1140
acattttcgt ttgttattct tgggtgcaat gctaggaaac tgtaatcagt attaactgga 1200
agctaccaac ttttttttgt tgctagagta gcaattttat aattaaataa gaatcctatt 1260
aaacaatgca tgtgactata tgaggttgct ttttctgttc aaaagcatca aatctttagc 1320
agccaatgaa aaagaatcca aaccttttct taaatgatat gcgcctatct atggtcctga 1380
gttttcttag ttcattaagt ataattagat tttgattttt ttttaggttt tcacttattg 1440
ttatttgttt acatcagctt caaacatctt cgaaaaagac ttacatgcat caatttcctg 1500
aggatttata gtttttttta cttatttctg cacaatgttt attagtaaaa agcatcaaat 1560
gtttttttgc tcaaaaaaaa gaatgggatt gttagagcac tctattgtta gttgttcaat 1620
aaatatatca actaaaaaaa caaaataaat ataaaatgag tgagattgtt aaatcattat 1680
agagacaatt tcattttcac aaaaataaat aaatacataa cttttgtaat tggggtttgc 1740
aggagaataa gccatcggac acaccaccag aaccatggcc atgttgaaaa cgacgagtct 1800
tgggttccgg taatctttcc tactctcatt gtttctcttg tcttttattt atttgttctt 1860
ttttgggaat tcattcttat gtctaagttc ttatgattat tgaagttctt aaggtggggt 1920
tcttaacgga atatgagaac ctgtctctta acttttaact aaaaaagcta agaaccagct 1980
tttaaataag agttttatga acacgttctt aattttttta gttaaaagtt aagaaacggg 2040
ttcttatatt ccgctaagaa cctcttccta aaaaccccaa taatcatact cctaggattc 2100
tatatgttta ttttattagt ttatgttttc agtctgaggt cagaccggcc acttgtcaga 2160
tctgttttct agctgtagta aaaaacaatt tgcaagtgta atagttcagc ggtaattaat 2220
gttctcggat ctatctcaaa aaaaaatttt ataacttcaa atataaagat ttttttgttt 2280
ttcaaaaatg aacttcgaaa cttcaaattt gaagtttttt ttttgcattt tgatcattat 2340
aattaattac acgttacatt tataattctt aagtattttt tcatttatcg ttttaattct 2400
taaatttttt atatattata aatatttcca atttgttttt ataaattcaa attttataca 2460
taaaagtaat aaaaatgtta aataagattt ataatattta agactataat tagtcaacaa 2520
aatattacaa aagaaatgta ataataaaaa atttaaaata agatacatga agacataact 2580
attagaaaat ttaaatatta taacaatact aataatctgg taaatttgct ctggaacctc 2640
taaaattatt gtctaaacaa attttgtgta accgaagatg gagcattacg aaaataattt 2700
tatgaaataa tatggtattt tgcttctagt ttaatattta attatatatt tctatttata 2760
attttatata tttaatgtaa atttttatta attaatatta ctgtaatatt tttatatatg 2820
tgctagttat ttataatttt ttttatggat ttatattaga ccatgattaa cccggagttc 2880
ttagagtgga gttttagtta aacgttaaga aacagtttct taacttccgg taagaacccc 2940
atcctaagaa tcccaggtta atcatgctct tagttataac aaataaggat cattgtgtaa 3000
aatacaaata attttgaagt tatgtttgaa gtttgttttc gaagaaaacc actttgaaac 3060
tttaaattta gagtaaactc tatttagaga gtttttttta gaggttacgc agtaactcag 3120
aaaatgaaaa atctatactt ttatagtacc taactttatc gatggaccac ttatattcga 3180
gtccttagca taacatgatt ctcctcgaaa tccgtttact ttcttcgtta ttttttcctt 3240
ttcagttttg gcgttttcgt aatacttttg tctgcaatct tgaaagctat tagtataaaa 3300
cttataaaca catgaattaa tacgaataca taaccagaat gacaaatttt caatgaatat 3360
ttaatactag taagtactac tccgtaatag taattagtaa tagtaatagt aatagtcata 3420
ttaattataa ttatgtattt cagttgccag aaaagttgta caagaacttg ccccatagta 3480
ctcggatgct cagatacact gtccctctgc ccatgctcgc ttacccgatc tatctggtaa 3540
aaaaaataca atttctattt tttcttaaaa ttacaaatga ttttatattt tgagttttaa 3600
gccaatatat aaattaattt tgattggatt ttaactacag tggtacagaa gtcctggaaa 3660
agaagggtca cattttaacc catacagtag tttatttgct ccaagcgaga ggaagcttat 3720
tgcaacttca actacttgct ggtccataat gttggccact cttgtttatc tatcgttcct 3780
cgttgatcca gtcacagttc tcaaagtcta tggcgttcct tacattgtaa gtttcacata 3840
ttattacaag aaatttatat attattaata ataaatttgt tttttgacat aagggtttgg 3900
aaaattttca gatctttgtg atgtggttgg acgctgtcac gtacttgcat catcatggtc 3960
acgatgagaa gttgccttgg tacagaggca aggtaattaa atcaattttt aaaaagaaat 4020
gtacagaaag caataatggt tagtattgat taatcttaat ttttgatgtt ttgcatacaa 4080
taataggaat ggagttattt acgtggagga ttaacaacta ttgatagaga ttacggaatc 4140
ttcaacaaca tccatcacga cattggaact cacgtgatcc atcatctttt cccacaaatc 4200
cctcactatc acttggtcga tgccgtgagt gatctagctt tctctctctc tagtttcatt 4260
tgattaaatg gtgattaatt actaatttaa ttaatgaatt gtggacagac gagagcagct 4320
aaacatgtgt taggaagata ctacagagag ccgaagacgt caggagcaat accgattcac 4380
ttggtggaga gtttggtcgc aagtattaaa aaagatcatt acgtcagtga cactggtgat 4440
attgtcttct acgagacaga tccagatctc tacgtttatg cttctgacaa atctaaaatc 4500
aattaacttt tcttcctagc tctattagga ataaacactc cttctctttt acttatttgt 4560
ttctgcttta agtttaaaat gtactcgtga aacctttttt ttattaatgt atttacgtta 4620
caaaaagtgg aagttttgtt atctttttct ctggttgcaa tcaaaagg 4668
<210> 12
<211> 5714
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 12
catcgaaccc tttcttcacc acattccagt tcccacactt tctttttttt gaattataga 60
gagagaatct tcctccaaat ctctctctct ctctcccagg atggttgttg ctatggacca 120
acgcaccaat gtgaacgaag atgccggtgc ccggaaggaa gaagggtttg atccgagcgc 180
acaaccgccg tttaagatcg gggacataag ggctgcgatt cctaagcatt gttgggtgaa 240
aagtcctttg agatctatga gctacgtagc cagagacatt tgtgccgtcg ctgctttggc 300
cattgccgcc gtgtattttg atagctggtt cctctggcct ctctattggg tcgcccaagg 360
aacccttttc tgggccatct tcgtcctcgg ccacgactgg taaagtttct tccattttgc 420
attgcatcga tttattgaat gcacgttcta tgagtattgt cagtacttta tgaattgatt 480
cttttgatgt tcattttttg aagatctaag attttttttt ttagattttc tttttaaatc 540
attgttccac cacctttcat cggtcgtacg actcgttaca aaaccacatc tttattttct 600
ataattacga ctgcttccgc attttatgga tctctcaact tataattaaa gtataaaatc 660
aagaatatct attgtttttc taaaacaaga aagataatat tgtttctttg ttattttggt 720
gtattccaat ctatttcgag atttagaaat gtgtcacgtc attaccttgt tgaagctttt 780
aaaacaaaca tggaaagttt aaataaatag tgcaataaat gatatactat atttacgatg 840
aataatgatg tgaaatataa ttgaataatg gcagtggaca tgtgagtttc tcagacattc 900
ctctgctgaa tagcgtggtt ggccatattc ttcattcctt catcctcgtt ccttaccatg 960
gttggtaagt caacttatta acccttttta ttattattat taattattaa actttcattt 1020
gttatacttt ttttggttta aatgttaaat gaattacttg gtgcaagaat ctattcattg 1080
ctcgttcttt ttttttttgg ctagagccaa ttttataatt aaataatgca tgtgaaagta 1140
tgactatata tgtgaggtag cttttcttat tcttgacgaa aagcatcgaa tctttagcaa 1200
cgaaggaaaa aggaatcaaa acttttatta aatgcaatgg gcctatatct ggtcattagt 1260
attttgaata taatttattt ataatttttt ttgaacaaca gctaatttat ttataattaa 1320
atattcattt tataaataat attaaaccaa ttattaaagg ttagatattt gaagaattat 1380
tcatgacttt gtttattggg aaattactcc ttttatcttt tattcttttc tatttctcta 1440
tttttaatat tgagaaactg acttcaaacc tccaataaaa atggtttcct gtagtaacat 1500
cataattttt tgtttggtaa atgtaacatc atcttcaaat atctttgaaa atagacttac 1560
atgcattatt ttgctgcgac attattgtaa cttattcctg gcaataaaaa taatttatta 1620
ctggaaacta tttttggtca atttattact agtaacttaa aacttaaaag agtgagattg 1680
tttgatcaaa aaaaaagaga aaaaaaatag agtgagattg ttagaatctg ccatgaaagc 1740
aacactatat aggtgatgat tggttcgact gtggccgtag aattttagct gtagataaat 1800
tggttgtagt tgtaaagttg ttactgttga ttatttttgc agagactttt gctgtagtta 1860
aatttgttgt agctgtaagc tataggctgc agatatttta aaataaaata tgtaaaatat 1920
gtgatgcatg tatatataaa ataattatta tttttatcac ttaaaataat ttatattaat 1980
attttttaaa attatcaaag tttactgtta tttaaaatgt gatatgtaaa taatctatat 2040
tatttaaaat atttcaataa tttaaaagca cccaaaatta gagtaaaata tttatagatg 2100
tttttttatt atgattatct tatttattta atattataga tattttttgt tcttacagtt 2160
tctacagctt ataaatgaaa gatgtaagtt gtttaactaa aatacataag aaaaatgttt 2220
ggtttttttt ttgctgtagc tttattttta aagttaaagc atgattggta aaaattaata 2280
gaaatttgat gtagacttta attttgaaaa gtaaacgtaa agcatgattg gtaaagttta 2340
atgatttaga aaaaaataaa gctaaagtag gtagataaaa cccaaccaat cacctccatg 2400
gacaatttaa tttttatgta aacacatatt taataatttg aggctgcagg agaataagcc 2460
atcggacaca ccaccagaac catggccatg ttgaaaacga cgagtcttgg gttccggtaa 2520
catttccctc tttaataatt tctatttttc tttgtcaaaa taatttgttt ttcgaaattt 2580
gaggccagaa cgaccacttg tcagatttga tttctagctg tagtaaaaac agtttgctag 2640
tgtcacagtt aaccggtaat tgattctttt tagcgattta tagaagtaac atttttgtaa 2700
aataaaatat acataatagt atgtgacaac ggaccacgcc tatttgtatc ggtgaatctt 2760
ctaattactt cctccgattt attttagtta cagttttaga tttatacaca tagattacaa 2820
aaaataaaat attttgtcca tttttaaaat aaaaacatca ctaattatac acctaacaat 2880
attttaacca ataaaaaata aactagaaaa tattattcat aatttttaca ttgaaattat 2940
aaaacgatac ttattttaaa acaaaatttt aatttacaac gacaattaaa ttgaaacgga 3000
agaagtttat tattacttaa ttaaagagtt tttttaaaaa aaatgaaaga catgtttatg 3060
cgaaactcat gtgaaagtct ttcaaataaa atattttggt ataaattttt caaattttca 3120
aaaataataa ttataaatta atataatata atttgtgata aaatctcgtc aaaaactcac 3180
taatgcaaat gcttttatat ttgagtttct tactcctcta aatgcattta cttttatact 3240
attattattt tctttctcta atttggtgtt ttcgtaatag tttgcctgtg ttttgaaaac 3300
taacaaaaaa taataaaaac aaaagtttat aaacacatag catgcaatga atatatatat 3360
caatacatat ctaagtacta tttttgcaag tacttaatct tgattactaa aattcatttt 3420
aattgttcct ttcagttacc agaaaagtta tacaagattt taccccacag tactcggatg 3480
ctcagataca ctgtccctct gcccatgctc gcttacccga tctatctggt attttttaat 3540
tcctaaaact taccacaatt cattttagat tgtgttttaa aacaatataa attatttttt 3600
ctttggtttt actgcagtgg tacagaagtc ctggaaaaga agggtcacat tttaacccat 3660
acagtggttt atttgctcca agcgagagaa agcttattgc aacttcaact acttgctggt 3720
ccataatgtt ggccattctt atctgtcttt ccttcctcgt tggtccagtc acagttctca 3780
aagtatacgg tgttccttac atcgtaagtt tcttagtata tcataaaggg tatatattta 3840
ttattcaata tatatactat atgatttgtt tttgtcataa acttttgaaa ttcagatctt 3900
tgtgatgtgg ttggacgctg tcacttactt gcatcaccat ggtcatgatg agaagttgcc 3960
ttggtacaga ggcaaggtaa ttaaattaac tcctaggtga ttttcccgtg ctcatgtacg 4020
gatataaata tttctaaagt aaatatacta taataattaa ttgttattta tttttaattt 4080
taaattagtt tataatttgt atgcatgatt tatattaata aaatttatat tactttaatt 4140
ataaatatga ttttatatat gttatatcta atcggttttg ttgtttttac agtcgattta 4200
gttatcattt gggtaaattg gattgcatct cagaattcaa ctgtaatatt ttttatttta 4260
actatattaa aattttgatt aatttcttat tttcatttag gtggttgttg tcttagaact 4320
ttaaatatat tttataaaga ttatgtataa cttaatatat atattgtgct taaaatgaaa 4380
taaaaaataa aataaagtgt ctgattctaa attacataaa ttaatataac gataatattc 4440
tgaagtctca tgcatatata tatataaatt ttacaaaaga actaaattgt aacatttggt 4500
taatatttta cagtaattaa aatattttat aaattctaaa taactttatg tatttaattt 4560
attgaatgga aactgaaatt tattttaaat aatcttaaaa atgaaaacat atttgctttg 4620
gtattttgct tatggttcca ttaagttcta caaacataaa aacataacat ttaaaaactg 4680
tgattatttt gtaactattt gatcaaacaa tgattatttt ttaattttaa ttttagtttt 4740
ttaataactc ttaaaaataa gcagtgaaca aaagtgagat tgtatttgaa attaatatta 4800
tacaagtaaa atataatttt ttaagtttat aaaaaaattc ctttttatta tatgtatatg 4860
tttttttgga aaattttaaa aaggaaacta aataaaaaaa taaataatag tattttaaat 4920
gtaatatttt taattcatta agtgtattag tgtaatcaac tatcgtgaga gttaacgtga 4980
gagcgataca tagaaaaccg acttctcaaa taatatttta tagagattac gatgtttcac 5040
aaaaaaaaat tattagtatt tgattaatct taattcttga tgttttgtga ttaataatag 5100
gaatggagtt acttacgtgg aggattaaca actattgata gagattacgg aattttcaac 5160
aacattcatc acgacattgg aactcacgtg atccatcatc ttttcccaca aatccctcac 5220
tatcacttgg tcgatgctgt gagtcatctc actctctcgc tactttcatc taaaccattt 5280
cattaaaggg tgattaatta ctaatgtact gattttaaca aatggaatgt gacagacaaa 5340
agcagctaaa catgcgttgg gaagatacta cagagaaccg aagacgtcag gagcaatacc 5400
gatccacttg gtggagagtt tggtagcaag tattaagaaa gatcattacg tcagtgacac 5460
cggtgacatt gtcttctacg agactgatcc agatctctac gtttatgctt ctgtcaaatc 5520
gaaaatcaat taaactttct tccccctttt tgtttagccc tattatgaat aaaccagtct 5580
tttttcactt atttattggt gtttttaagt taaaaatgta ctcgtgaaac tcttctttta 5640
ttattaatcc atttatacac tgaaaaacat acaatttcaa aggttaaaaa gaaaaataaa 5700
ttttctagac tgac 5714
<210> 13
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 13
gaataagcca tcggacacac 20
<210> 14
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 14
atgcgaacgg agacgaaagg 20
<210> 15
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 15
tgttaacgga gattccggtg 20
<210> 16
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 16
gtagcaatgt gaacggagat 20
<210> 17
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 17
cagtgtatct gagcatccg 19
<210> 18
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 18
gtggccgagt acgaagatag 20
<210> 19
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 19
cagtagagtg gccagagga 19
<210> 20
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 20
cgccggagaa agagagagag ctttgagg 28
<210> 21
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 21
tggttgtcgc tatggaccag cgtagcaa 28
<210> 22
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 22
tctccgttcg cattgctacg ctggtcca 28
<210> 23
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 23
gaaaggtttg atccgagcgc acaaccac 28
<210> 24
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 24
tctccgttcg cattgctacg ctggtcca 28
<210> 25
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 25
tcggagatat aagggcggcc attcctaa 28
<210> 26
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 26
tagcccagaa cagggttcct tgggcggc 28
<210> 27
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 27
cttcgtactc ggccacgact ggtaattt 28
<210> 28
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 28
ttgaagttgc aataagcttt ctctcgct 28
<210> 29
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 29
acttgctggt cgatcatgtt ggccactc 28
<210> 30
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 30
aagtagttga agttgcaata agctttct 28
<210> 31
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 31
tggtcgatca tgttggccac tcttgttt 28
<210> 32
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 32
aacgagaatg aaggaatgaa gaatatga 28
<210> 33
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 33
ataccatggt tggtaagtca tttatttt 28
<210> 34
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 34
ccaacgagga atgatagata aacaagag 28
<210> 35
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 35
cagtcacagt tctaaaagtc tatggtgt 28
<210> 36
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 36
tgtgactgga ccaacgagga atgataga 28
<210> 37
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 37
tctaaaagtc tatggtgttc cttacatt 28
<210> 38
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 38
cgccggagaa agagagagct ttgaggga 28
<210> 39
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 39
tggttgtcgc tatggaccag cgtagcaa 28
<210> 40
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 40
cttaaacggt ggttgtgcgc tcggatca 28
<210> 41
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 41
tcggagatat aagggctgcg attcctaa 28
<210> 42
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 42
tctccgatct taaacggtgg ttgtgcgc 28
<210> 43
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 43
ataagggctg cgattcctaa gcattgtt 28
<210> 44
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 44
agatggccca gaaaagggtt ccttgggc 28
<210> 45
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 45
cgtactcggc cacgactggt aatttaat 28
<210> 46
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 46
ttgaagttgc aataagcttt ctctcgct 28
<210> 47
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 47
acttgctggt cgatcgtgtt ggccactc 28
<210> 48
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 48
aagtagttga agttgcaata agctttct 28
<210> 49
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 49
tggtcgatcg tgttggccac tcttgttt 28
<210> 50
<211> 58
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 50
acactctttc cctacacgac gctcttccga tctacgtacc tttcttcacc acattyca 58
<210> 51
<211> 58
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 51
acactctttc cctacacgac gctcttccga tctcgtaccc tttcttcacc acattyca 58
<210> 52
<211> 58
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 52
acactctttc cctacacgac gctcttccga tctctgacga tggttgtcgc tatggacc 58
<210> 53
<211> 58
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 53
acactctttc cctacacgac gctcttccga tcttgactcg aaaggtttga tccragcg 58
<210> 54
<211> 58
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 54
acactctttc cctacacgac gctcttccga tctgactgcg aaaggtttga tccragcg 58
<210> 55
<211> 58
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 55
acactctttc cctacacgac gctcttccga tctactgacg aaaggtttga tccragcg 58
<210> 56
<211> 61
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 56
acactctttc cctacacgac gctcttccga tctgctagcc gtgtattttg atagctggtt 60
c 61
<210> 57
<211> 61
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 57
acactctttc cctacacgac gctcttccga tctctagccc gtgtattttg atagctggtt 60
c 61
<210> 58
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 58
acactctttc cctacacgac gctcttccga tcttagctgg agcttctcag acattcctct 60
<210> 59
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 59
acactctttc cctacacgac gctcttccga tcttcagtgt ttatttgccc caagcgagag 60
<210> 60
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 60
acactctttc cctacacgac gctcttccga tctcagtcgt ttatttgccc caagcgagag 60
<210> 61
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 61
acactctttc cctacacgac gctcttccga tctagtcagt ttatttgccc caagcgagag 60
<210> 62
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 62
acactctttc cctacacgac gctcttccga tctgtcaggt ttatttgccc caagcgagag 60
<210> 63
<211> 61
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 63
acactctttc cctacacgac gctcttccga tctgtacgac ttcaactact tgctggtcsa 60
t 61
<210> 64
<211> 61
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 64
acactctttc cctacacgac gctcttccga tcttacgtac ttcaactact tgctggtcsa 60
t 61
<210> 65
<211> 62
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 65
cggtctcggc attcctgctg aaccgctctt ccgatctacg tacgttcaca ttgstrcgyt 60
gg 62
<210> 66
<211> 62
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 66
cggtctcggc attcctgctg aaccgctctt ccgatctcgt accgttcaca ttgstrcgyt 60
gg 62
<210> 67
<211> 63
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 67
cggtctcggc attcctgctg aaccgctctt ccgatctctg acccgatctt aaacggyggt 60
tgt 63
<210> 68
<211> 65
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 68
cggtctcggc attcctgctg aaccgctctt ccgatcttga cttagctcat ggatctcaaa 60
ggact 65
<210> 69
<211> 65
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 69
cggtctcggc attcctgctg aaccgctctt ccgatctgac tgtagctcat ggatctcaaa 60
ggact 65
<210> 70
<211> 65
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 70
cggtctcggc attcctgctg aaccgctctt ccgatctact gatagctcat ggatctcaaa 60
ggact 65
<210> 71
<211> 62
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 71
cggtctcggc attcctgctg aaccgctctt ccgatctgct agttaaatta ccagtcgtgg 60
cc 62
<210> 72
<211> 62
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 72
cggtctcggc attcctgctg aaccgctctt ccgatctcta gcttaaatta ccagtcgtgg 60
cc 62
<210> 73
<211> 66
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 73
cggtctcggc attcctgctg aaccgctctt ccgatcttag ctcttttttc ttcgatkcta 60
aagatt 66
<210> 74
<211> 62
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 74
cggtctcggc attcctgctg aaccgctctt ccgatcttca gtctgtgact ggaccaacga 60
gg 62
<210> 75
<211> 62
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 75
cggtctcggc attcctgctg aaccgctctt ccgatctcag tcctgtgact ggaccaacga 60
gg 62
<210> 76
<211> 62
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 76
cggtctcggc attcctgctg aaccgctctt ccgatctagt cactgtgact ggaccaacga 60
gg 62
<210> 77
<211> 62
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 77
cggtctcggc attcctgctg aaccgctctt ccgatctgtc agctgtgact ggaccaacga 60
gg 62
<210> 78
<211> 66
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 78
cggtctcggc attcctgctg aaccgctctt ccgatctgta cgacttacaa tgtaaggaac 60
rccrta 66
<210> 79
<211> 66
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 79
cggtctcggc attcctgctg aaccgctctt ccgatcttac gtacttacaa tgtaaggaac 60
rccrta 66
<210> 80
<211> 13462
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 80
taaataaaaa ctgatggaag tctgtttctt aagtcaaata catcacagtg atgtggcaac 60
tattttccct caaattaata cgttttaaaa aaaatctata taaatgttgg catgtctaca 120
atctacatga tatccatatg gatcgttttt tatgatttat acatagtcag gaaattttag 180
cagaaacaaa atagagtacg aagactaaca taatattttc gactacatgt attttttttg 240
cgaaattgta aatatcaatc agtgaaaatg aaaaaccata caagttgact accatttcgg 300
tgcacaatcc ttacttctaa ggaaaaacta aagagaaaca aaagaagaaa atcttggtaa 360
attttgatac cattaccatg gttacttata ctcgataatg caattttaaa atcttctgta 420
aattttatag cattgttttt tttgtaacac atttctctaa cttagttttc atcgaaatga 480
acgacgtaac aaagatacat tgcgcacagg ttaccgcaaa aatacaattt ttattcttca 540
aagaataaaa aagtttccta aattaagaaa aaaagaaaac agtttggtgt ctctacacat 600
cttctccctt tatataaaca aaccacacat accccaaagt ccatcaaact ctctccacca 660
catttcactc agagcccaca cagttttaga gagagagaaa catccctcaa agctctctct 720
ttctccggcg atggttgtcg ctatggacca gcgtagcaat gtgaacggag attccaagga 780
cgaaaggttt gatccgagcg cacaaccacc gtttaagatc ggagatataa gggctgcgat 840
tcctaagcat tgttgggtca agagtccttt gagatccatg agctacgtcg cgagagacat 900
tttctccgtc gtggctctgg ccgtcgccgc cgtgtatttt gatagctggt tcttctggcc 960
tctttattgg gccgcccaag gaaccctttt ctgggccatc ggtaccgcct tttgcagttt 1020
atctctatgc ccgggacaag tggagtccat gctcaacacc gtgcaggatg aggatgacca 1080
ccgcggtagc gacttcgtgg gcgaggaaag cctttcgtcc aaggtggtcc ctcctcgcaa 1140
tcttgttgga tggtgaatat tataaaagcc tgcccttctc gcgggtgttt aaacgtcgac 1200
ctgcaggtca acggatcagg atattcttgt ttaagatgtt gaactctatg gaggtttgta 1260
tgaactgatg atctaggacc ggataagttc ccttcttcat agcgaactta ttcaaagaat 1320
gttttgtgta tcattcttgt tacattgtta ttaatgaaaa aatattattg gtcattggac 1380
tgaacacgag tgttaaatat ggaccaggcc ccaaataaga tccattgata tatgaattaa 1440
ataacaagaa taaatcgagt caccaaacca cttgcctttt ttaacgagac ttgttcacca 1500
acttgataca aaagtcatta tcctatgcaa atcaataatc atacaaaaat atccaataac 1560
actaaaaaat taaaagaaat ggataatttc acaatatgtt atacgataaa gaagttactt 1620
ttccaagaaa ttcactgatt ttataagccc acttgcatta gataaatggc aaaaaaaaac 1680
aaaaaggaaa agaaataaag cacgaagaat tctagaaaat acgaaatacg cttcaatgca 1740
gtgggaccca cggttcaatt attgccaatt ttcagctcca ccgtatattt aaaaaataaa 1800
acgataatgc taaaaaaata taaatcgtaa cgatcgttaa atctcaacgg ctggatctta 1860
tgacgaccgt tagaaattgt ggttgtcgac gagtcagtaa taaacggcgt caaagtggtt 1920
gcagccggca cacacgagtc gtgtttatca actcaaagca caaatacttt tcctcaacct 1980
aaaaataagg caattagcca aaaacaactt tgcgtgtaaa caacgctcaa tacacgtgtc 2040
attttattat tagctattgc ttcaccgcct tagctttctc gtgacctagt cgtcctcgtc 2100
ttttcttctt cttcttctat aaaacaatac ccaaagagct cttcttcttc acaattcaga 2160
tttcaatttc tcaaaatctt aaaaactttc tctcaattct ctctaccgtg atcaaggtaa 2220
atttctgtgt tccttattct ctcaaaatct tcgattttgt tttcgttcga tcccaatttc 2280
gtatatgttc tttggtttag attctgttaa tcttagatcg aagacgattt tctgggtttg 2340
atcgttagat atcatcttaa ttctcgatta gggtttcata gatatcatcc gatttgttca 2400
aataatttga gttttgtcga ataattactc ttcgatttgt gatttctatc tagatctggt 2460
gttagtttct agtttgtgcg atcgaatttg tcgattaatc tgagtttttc tgattaacag 2520
atggcttcat ctgagaacgt tatcactgag ttcatgaggt tcaaggtgag gatggaaggt 2580
actgttaacg gacatgagtt cgagatcgag ggtgagggtg aaggtagacc ttacgaggga 2640
cataacaccg ttaagcttaa ggttacaaag ggtggacctc ttcctttcgc ttgggatatc 2700
ctttctcctc aattccaata cggaagcaag gtaagtttgt ggattcttcg tccatgtgat 2760
ctttgagttt ctttagagct tgtgagggat tagtaagtaa caatgcttga gttttttgct 2820
gctgggcttc gaaaagtttg tcacttgttg gtttgatcca caaggtcttc ttctccatag 2880
ctactagaca tgttttagct taagattcaa gtttatatat gccttgtgga ttaatcattg 2940
cctgattctt ccgtgtcatc tctgagttta tttagagctt ggaagtggtg tagtaataac 3000
taacaatact cttgataagt tgtagcaatg ctcttgatta gtggatgtaa tatgatgttg 3060
ataagatata tgaggcacag aaccaaaagt ggtgcttcca ctagacccgt ttttagccta 3120
aggttcaagt ttataccttg tagatgtttc tgtattgtct gattcttccc tgtgatattt 3180
gaatttctta gagctttgga agtgatatag gaacaatgct cttgtgtgtt tgtctctatg 3240
aagattatcg ctgtcgtgtt tcatccgagt gtgcgggatt ttttgctgct gggtttagcc 3300
tttcttcaaa aagttattac ttgttagttt tattgttttg gtcttgataa gagatgttag 3360
gacagacatg gtgcttcttg tctatagcca ctagacctat tttagcataa ggttaacgaa 3420
attctctcta cataccttgt ggatttgttt acattgcctg atctttcctg tgatcgctgt 3480
catgtttctt tggaatgatt gatgtttata aatggaaaaa tctttgtgca gaagactccc 3540
gcccatctct ctatgcccgg gacaagtgcc accccacagt ggggcaggat gaggatgacc 3600
accatggggt cgcagcgtgt gcgtgtccgt cgtacgttct ggccggccgg gccttgggcg 3660
cgcgatcaga agcgttgcgt tggcgtgtgt gtgcttctgg tttgctttaa ttttaccaag 3720
tttgtttcaa ggtggatcgc gtggtcaagg cccgtgtgct ttaaagaccc accggcactg 3780
gcagtgagtg ttgctgcttg tgtaggcttt ggtacgtatg ggctttattt gcttctggat 3840
gttgtgtact acttgggttt gttgaattat tatgagcagt tgcgtattgt aattcagctg 3900
ggctacctgg acattgttat gtattaataa atgctttgct ttcttctaaa gatctttaag 3960
tgctgtttaa acaaccgaca accactttgc ggacttcctt tcaagagaat tcaataaggt 4020
taattcctaa ttgaaatccg aagataagat tcccacacac ttgtggctga tatcaaaagg 4080
ctactgccta tttaaacaca tctctggaga ctgagaaaat cagacctcca agcatgaaga 4140
agcctgagct tactgctact tctgttgaga agttcctcat cgagaagttc gattctgtgt 4200
ctgatcttat gcagctctct gagggtgagg aatcaagagc tttctctttc gatgttggtg 4260
gaagaggata cgttctcaga gttaactctt gcgctgacgg attctacaag gatagatacg 4320
tgtacagaca cttcgcttca gctgctctcc ctatccctga agttcttgat atcggagagt 4380
tctctgagtc tcttacctac tgtatctcaa gaagggctca gggtgttact cttcaagatc 4440
ttcctgagac tgagcttcct gctgttcttc aacctgttgc tgaggctatg gatgctatcg 4500
ctgctgctga tctttctcaa acttctggat tcggaccttt cggtcctcag ggaatcggac 4560
agtacactac ttggagagat ttcatctgcg ctatcgctga tcctcatgtt taccattggc 4620
agaccgttat ggatgatacc gtttctgctt ctgttgctca agctcttgat gagcttatgc 4680
tttgggctga ggattgtcct gaggttagac atcttgttca cgctgatttc ggatctaaca 4740
acgttctcac cgataacgga agaatcaccg ctgttatcga ttggtctgag gctatgttcg 4800
gagattctca atacgaggtg gccaacatat tcttttggag gccttggctt gcttgtatgg 4860
aacaacagac tagatacttc gagagaaggc atcctgagct tgctggatct cctagactta 4920
gagcttacat gcttaggatc ggacttgatc agctttacca gtctctcgtt gatggaaact 4980
tcgatgatgc tgcttgggct cagggaagat gtgatgctat cgttagatct ggtgctggaa 5040
ctgttggaag aactcaaatc gctagaagat ctgctgctgt ttggactgat ggatgtgttg 5100
aagttctcgc tgattctgga aacagaaggc cttctactag acctagagcc aagaagtgaa 5160
gatcggcggc aatagcttct tagcgccatc ccgggttgat cctatctgtg ttgaaatagt 5220
tgcggtgggc aaggctctct ttcagaaaga caggcggcca aaggaaccca aggtgaggtg 5280
ggctatggct ctcagttcct tgtggaagcg cttggtctaa ggtgcagagg tgttagcggg 5340
atgaagcaaa agtgtccgat tgtaacaaga tatgttgatc ctacgtaagg atattaaagt 5400
atgtattcat cactaatata atcagtgtat tccaatatgt actacgattt ccaatgtctt 5460
tattgtcgcc gtatgtaatc ggcgtcacaa aataatcccc ggtgactttc ttttaatcca 5520
ggatgaaata atatgttatt ataatttttg cgatttggtc cgttatagga attgaagtgt 5580
gcttgcggtc gccaccactc ccatttcata attttacatg tatttgaaaa ataaaaattt 5640
atggtattca atttaaacac gtatacttgt aaagaatgat atcttgaaag aaatatagtt 5700
taaatattta ttgataaaat aacaagtcag gtattatagt ccaagcaaaa acataaattt 5760
attgatgcaa gtttaaattc agaaatattt caataactga ttatatcagc tggtacattg 5820
ccgtagatga aagactgagt gcgatattat ggtgtaatac atagtttaaa cgggcccaag 5880
actcccgccc atctctctat gcccgggaca agtgccaccc cacagtgggg caggatgagg 5940
atgaccagtc agttttactt cccttaattt tctatgtact ttcataatta cttatgttat 6000
tttcttcatg agttttaatg caaattacta tatggactct agtgaaaacg ttcagaatcc 6060
tataaacatg actactgaga cgaacttgag agtagttttg atcatacaca cgtttcatgt 6120
ggtacttgag agttactaat ttttgtcatc ttcgtataag tagtaaaaga tactacaaga 6180
atagtttagt agaaaatact agcggtaggt gaagatttgt cgctatgtac tattattgtc 6240
tagtaacttg agtaacaatt tcgtggtcta aatatcaaat aaaaatggat gagtggttca 6300
ccaaatctag gcatcaaaac tattaatgtc attgtctaga tcttaggtga caccacattt 6360
cgaatattta ttggtaattg agatgttaaa gtaccaatat ttgacttaat aaactaaaag 6420
attttggctt tatcaaatgt agacattgat gacatatcgt tgtcattatc ttgagtatat 6480
acaagtcgat caattaggtg aaagtttagt gtctcgtggt tggtaaacga ttaatacagt 6540
agtatatttt atccaaagac aaaatccaaa tcatttcacc agtatgaata gtattatttt 6600
atcttaaaag ctaaaatctt aaaaaccaag gtagcaccca cgttgagcta gacgatcaaa 6660
tcgatttctg ctttgtccaa tttaccaagc tatttaaagc caaataattg aaatataggt 6720
aggtcgttat attaggctaa gatttatctc aaatgcttaa ctaaaggaat aacaagggat 6780
tctagttgtg tggttttata agattggtcc aatttcactt aagtttgttt attgtagaat 6840
tttatatgtg aataatttga attccaattg aaaagatatt atagtaaaag aaaaaatagt 6900
gcgaacaaaa aactttaatc ccataaaaag aaaaagaaaa atgaaaagtt cttctaacat 6960
ccatattttg catcatatca taaagataag aaagatacat atcatagacg tacagataaa 7020
caaacatatc atcatttgtg aaatacatag tacaataatt tgcttttaaa tagagtttaa 7080
gtcacacaca ctgacacaca cgataaaacg ataatgtctg caaaaacact ttaatcccat 7140
tgcctagagg acagcttctc cactttgtct ttaaggttgg ttttgccgtg ttgtttttat 7200
ctttatataa tgatctattt tttggattat gaaatgaatt cacacatttt aattatttaa 7260
gaagatccat atacaggttt ataacagtac taagtgatga ttattttttg tttttgcata 7320
gtttagttta ttgggtaaac attcattacg tgtctcttta tacgaatcac ccatccaaaa 7380
tttcaagtag tcttttagtt catttattat ttcataacta tttgacttat tgatttgaca 7440
agaaacaaca aaagtgttga cttattgata gattgtggga tcataaaagt aattaagcgt 7500
caaccacgac ccacaacaac aaagcacatg ttatacatta atatctcgtt tacttaatta 7560
cagttttcag aatgccgttt catgtcttgt cactggcgat gttattatca tgttggacaa 7620
tattcgactg ttgtcgtttt tacattttcg tattgactaa aactaaaaaa acaaaactct 7680
gtttcaggtt gggcctagga tccacattgt acacacattt gcttaagtct atggaggcgc 7740
aaggttttaa gtctgtggtt gctgttatag gccttccaaa cgatccatct gttaggttgc 7800
atgaggcttt gggatacaca gcccggggta cattgcgcgc agctggatac aagcatggtg 7860
gatggcatga tgttggtttt tggcaaaggg attttgagtt gccagctcct ccaaggccag 7920
ttaggccagt tacccagatc taatatcaaa atctatttag aaatacacaa tattttgttg 7980
caggcttgct ggagaatcga tctgctatca taaaaattac aaaaaaattt tatttgcctc 8040
aattatttta ggattggtat taaggacgct taaattattt gtcgggtcac tacgcatcat 8100
tgtgattgag aagatcagcg atacgaaata ttcgtagtac tatcgataat ttatttgaaa 8160
attcataaga aaagcaaacg ttacatgaat tgatgaaaca atacaaagac agataaagcc 8220
acgcacattt aggatattgg ccgagattac tgaatattga gtaagatcac ggaatttctg 8280
acaggagcat gtcttcaatt cagcccaaat ggcagttgaa atactcaaac cgccccatat 8340
gcaggagcgg atcattcatt gtttgtttgg ttgcctttgc caacatggga gtccaaggtt 8400
gtttaaacat ttaaataccc tgccaagctt gaggtagcct ccaatttgac ggtgccgcca 8460
gcgacgccgt ctggaactgt cctttttgag gaccactccg tttgtggaga tcatgagagt 8520
ccatgctcaa caccgtgcac tagggacagg attgaagact cccgcccatc tcactaggga 8580
caggattgcc accccacagt ggggcctaga aagactggag ttgcagagtt tgtgtcttct 8640
agattaatcc tccaaacttt tgattaacca aaaaaattat caaactaaca tgttctcctt 8700
ttttctttag aaattctaac gaatttatct ttatactgat ttgaatatac ttaatttggt 8760
catttggatg ccctttacaa cctccttacc aaactattga tcacagtttc tattgctaaa 8820
atcaccaaca aaacgcatgt cgccattcat aattatggtt tcacacctac aactaggcta 8880
ataagtaaat aagtagacaa ctagactcag gtttgaaaaa accataaaag ccatatagcg 8940
ttttctcatt gaaactgcga acacgatcgt gtgaatgttg cagtttctag ttttgataca 9000
aacaaacaaa aacacaattt aatcttagat taaaaagaaa aaagagaacg gagcccacta 9060
gccactcctt caaacgtgtc ttaccaactc tcttctagaa acaaattagg cttcaccttc 9120
ctcttccaac ctctctctct ctctctctct ctttttctca aaccatctct ccataaagcc 9180
ctaatttctt catcacaaga atcagaagaa gaaagatgga cctgcatcta attttcggtc 9240
caacttgcac aggaaagacg acgaccgcga tagctcttgc ccagcagaca gggcttccag 9300
tcctttcgct tgatcgggtc caatgctgtc ctcaactatc aaccggaagc ggacgaccaa 9360
cagtggaaga actgaaagga acgacgcgtc tctaccttga tgatcggcct ctggtggagg 9420
gtatcatcgc agccaagcaa gctcatcata ggctgatcga ggaggtgtat aatcatgagg 9480
ccaacggcgg gcttattctt gagggaggat ccacctcgtt gctcaactgc atggcgcgaa 9540
acagctattg gagtgcagat tttcgttggc atattattcg ccacaagtta cccgaccaag 9600
agaccttcat gaaagcggcc aaggccagag ttaagcagat gttgcacccc gctgcaggcc 9660
attctattat tcaagagttg gtttatcttt ggaatgaacc tcggctgagg cccattctga 9720
aagagatcga tggatatcga tatgccatgt tgtttgctag ccagaaccag atcacggcag 9780
atatgctatt gcagcttgac gcaaatatgg aaggtaagtt gattaatggg atcgctcagg 9840
agtatttcat ccatgcgcgc caacaggaac agaaattccc ccaagttaac gcagccgctt 9900
tcgacggatt cgaaggtcat ccgttcggaa tgtattagaa atcaccagtc tctctctaca 9960
aatctatctc tctctatttt tctccagaat aatgtgtgag tagttcccag ataagggaat 10020
tagggttctt atagggtttc gctcatgtgt tgagcatata agaaaccctt agtatgtatt 10080
tgtatttgta aaatacttct atcaataaaa tttctaattc ctaaaaccaa aatccagtgt 10140
ttaaacgagt ccatgctcaa caccgtgcac tagggacagg attgaagact cccgcccatc 10200
tcactaggga caggattgcc accccacagt ggggcctaga aagactggag ttgcagacat 10260
taaggatgac cagttcgtaa aggtcctgcg gtgtctattg cttttcatag gttaataagt 10320
gtttgctaga ctgtggtgaa aggcctatcc gaagtaaggc cggccggatc cttcatcttt 10380
ggacaaggga ataaagactc cccacttgct actaagaaca atacctaagt tgcccagaca 10440
tgactgtacc cattcagaga cctaccaccc attagggcta tgacactaac actagcccct 10500
ggaggttgac catgctaggc agtgggggtc tcacctatga cccactcaga taggggttta 10560
aaccagtggg tgggatctca gcctcatata ggtgtttgtg gtgagctttc tcctagacaa 10620
gagaaccctg aagaacagca agaaccagct aatatgatat gtagacatag tgggttgctc 10680
aaattttgtg tttagtcata ttagaattga cctcagtgac cactcagaaa gtgcccaagc 10740
ccatctatag gggccaaagt gctattgact ggtgtgtctg tgaattgttc ctccctacag 10800
agttggtgct gatatatcct agcattcttt ggaaaaccta gctagggact gtcaagtgta 10860
agatacctcc tgaattggag ggaacactag ctgccctgta ccttctggct agtaccttac 10920
accctgaatg ggttaggggg tctattattt gctggaaata taccagtttc agtagggctg 10980
ctgccttagg tcccacaagg tgtaacatgt gctcaatagt tgcactacca catgcacgtg 11040
aacttaatga tgttatagcc acaacaccaa ccttggtttg cagtttgaca tccctctgga 11100
atgggtgtag tcatcttgct ctggatctgc ctgaatcatt ggggctgtat gcagcctggg 11160
cttaaagtga agaatgggat gtcccagaaa tattttgggt gagaagaatc ctggagtaga 11220
tggtgacctg actatccctg tcctatgggc acaatctatc atcagatatt gcattcaaag 11280
ggctatcatg ggatcaagtc ctaagtcaac tgttgtttac ctggcagaca ttcatctagg 11340
agttctcttt tatgccaccc cacagtgatc cgccttttgc agtttatcca ctagggacag 11400
gattgccacc ccacagtggg gcctctatgc ccgggacaag tgtaaaatat agagtatagg 11460
ggttatcatc acagagaagc tattgctgga gggcctctgt tatttcctct ccatgccact 11520
cccattttta acctaccaac tgaaatccca agggagactc caccctgtaa ctagagtcct 11580
cagaggtgag ccatcccata ttaacaaatg ggcattaggg ctaggatgcc aagggatacc 11640
tgaaatggga agttgtgggg ctgagtcctc ctgggaatca gagataatat gtaaacagtt 11700
tgttgagaga ttgatgagag ctgactttga gaggtggcca tgctccctgg tcctcaatag 11760
ggaaggcact acacaagaaa cctgggtttg atcaactgca ctgtgtccta ctcacacatt 11820
gtgtgcctgg aaaaatgtta cttagtattt ggagggcctc cagaaccccc ctgggtgcaa 11880
gactgggtgc tagtgactgg gtgaatgagt cttggacaca gtggccttgt ctaggttgtg 11940
tgaggtggct aggcatcatg gcaatacctc ataattgatg agtgaggaaa caagactaag 12000
tccttgactc ctcttattac atgacctggt ggatattatg tttaaactct gcaagctgga 12060
atgagtactg ggtgcagatc ccctgggatt ctggctacaa aggtgaatga tagctagtct 12120
gtttattagt agccaaaaaa gtcagtgagg ggtgagtgcc ctgggatgtt gttaagttca 12180
cattgcacac ttggagaccc tctccatcca gtaacatacc agagaaaact gaccaagccc 12240
tcatgggtgt atgggaacaa caaacctcct ggctacttca agggcacata acaccagcaa 12300
ggagcctgtc ataaccacca tctcaaacaa tagaacttcc taagtgaagc aatgacttca 12360
aatctacttg aaggcatgga gtataagcca tgttcctttc agaggggact gtacttctgt 12420
agattacttt ccctcattaa ccagatctgg ccggccgcat gcgtactcgg ccacgactgg 12480
taatttaatt ttcaatttat tttttcttca acttcttaat tttgatatgt ttatatgttt 12540
tttcgttttt tgcatcgtct ttgatttctt gaacgcacgt tcgatatgag attttcactg 12600
acttcaagat ttgattctct tcaggtttac ttttaaaaaa aaaaattatt atgttcaccc 12660
aaattggcct attttaaaag caaaagggga tctaagattt ttaattcttc tctttttcag 12720
tcgtaacact gctaactttt ttttttgatc aaatcgtaac actcataagt cctaactaaa 12780
catctttttc tttcctataa ttattgttgg ttccgcattt tatggatcta cgtttgaaag 12840
tttcaataaa acacatttta ttgtttgaaa gtaacaatat aattactgta tattgattct 12900
tttaattatt gtgtgttgtt ccaatctact ttcgaaatat agtcatgtga cacgtcatat 12960
tctatttttg ttaccttgtt ggaacgtttg aattgagtaa agtttaatta acattgtgca 13020
ataaatgata aacatgttta tgatgtaaaa ttcaatttga ataatacagt ggacatggga 13080
gcttctcaga cattcctctt ctgaatactg cggttggtca tattcttcat tccttcattc 13140
tcgttccata ccatggttgg taagtcattt atttaaacat ctttttcatg caaatttatt 13200
cttgttttcg tatttcttac attttccttg tcattcttgg tgcatgttag caaactgtaa 13260
tctgataact gaaaatatat taattttcca tagtaaaata atgcatgtga ctaaaagcat 13320
caaaatcttt agcatcgaag aaaaaagaac caaactttta tttaatgcta tgggcctatt 13380
tatggtccaa ttagctatta tcatatgaca tgtccttgaa taaattaatg tagcttcata 13440
tgtgagttta ataatattta ta 13462
<210> 81
<211> 13462
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 81
ggtttctttt ttaatttaat ttattttttt aatcggagaa aaaaattaag aaaccaaaaa 60
acagttttaa tcatggcctc atgttggggt tgagttttat attctgataa gaatcccatc 120
ttaaaaaccc cgttaaacat gctcttacca tctgcttcga aaatgatatg ttattgacaa 180
ttccaatttc atttttatga aaataaaata atagtttatt ttataactga gggtggttgc 240
aggagaataa gccatcggac acaccaccag aaccatggcc atgttgaaaa cgacgagtct 300
tgggttccgg taatctttcc ctctctcata ttttttttct tttttttgaa attctttcat 360
tttaattttc ttaggattct atgtatttat tttaatcaat cctttttcca gtttgaggct 420
aggacgacca cttgtcagat ttgtcgttta gctgtagtaa acaactgatt taaattgttt 480
atagtactgt agttaacttt aacaacggac cacttatatt cgagccattg gcataaaatg 540
attcttctcg aaattcgttt acttttctta gtatttttca attttggagt ttacgtagaa 600
ctaataaaaa gaaaaactta taaacacacc acatgcaatg aataaattcg aatatataac 660
catactgtta aatattaatt tacattttaa tcttaatttt gcattccagt tgccagaaaa 720
attatacaag aatttgtccc acagtacacg gatgctcaga tacactgtcc ctctccccat 780
gctcgcttac cctctctatc tggtaaatcc taattcctaa tttttcttcc tgattataat 840
tacaattttg aatttttaga ttttgagtat taactaaata taaattaaat ttgtttgggg 900
atgactacag tggtacagaa gtcctggtaa agaagggtca cattataacc catacagtag 960
tttatttgcc ccaagcgaga gaaagcttat tgcaacttca ggtaccgcct tttgcagttt 1020
atctctatgc ccgggacaag tggagtccat gctcaacacc gtgcaggatg aggatgacca 1080
ccgcggtagc gacttcgtgg gcgaggaaag cctttcgtcc aaggtggtcc ctcctcgcaa 1140
tcttgttgga tggtgaatat tataaaagcc tgcccttctc gcgggtgttt aaacgtcgac 1200
ctgcaggtca acggatcagg atattcttgt ttaagatgtt gaactctatg gaggtttgta 1260
tgaactgatg atctaggacc ggataagttc ccttcttcat agcgaactta ttcaaagaat 1320
gttttgtgta tcattcttgt tacattgtta ttaatgaaaa aatattattg gtcattggac 1380
tgaacacgag tgttaaatat ggaccaggcc ccaaataaga tccattgata tatgaattaa 1440
ataacaagaa taaatcgagt caccaaacca cttgcctttt ttaacgagac ttgttcacca 1500
acttgataca aaagtcatta tcctatgcaa atcaataatc atacaaaaat atccaataac 1560
actaaaaaat taaaagaaat ggataatttc acaatatgtt atacgataaa gaagttactt 1620
ttccaagaaa ttcactgatt ttataagccc acttgcatta gataaatggc aaaaaaaaac 1680
aaaaaggaaa agaaataaag cacgaagaat tctagaaaat acgaaatacg cttcaatgca 1740
gtgggaccca cggttcaatt attgccaatt ttcagctcca ccgtatattt aaaaaataaa 1800
acgataatgc taaaaaaata taaatcgtaa cgatcgttaa atctcaacgg ctggatctta 1860
tgacgaccgt tagaaattgt ggttgtcgac gagtcagtaa taaacggcgt caaagtggtt 1920
gcagccggca cacacgagtc gtgtttatca actcaaagca caaatacttt tcctcaacct 1980
aaaaataagg caattagcca aaaacaactt tgcgtgtaaa caacgctcaa tacacgtgtc 2040
attttattat tagctattgc ttcaccgcct tagctttctc gtgacctagt cgtcctcgtc 2100
ttttcttctt cttcttctat aaaacaatac ccaaagagct cttcttcttc acaattcaga 2160
tttcaatttc tcaaaatctt aaaaactttc tctcaattct ctctaccgtg atcaaggtaa 2220
atttctgtgt tccttattct ctcaaaatct tcgattttgt tttcgttcga tcccaatttc 2280
gtatatgttc tttggtttag attctgttaa tcttagatcg aagacgattt tctgggtttg 2340
atcgttagat atcatcttaa ttctcgatta gggtttcata gatatcatcc gatttgttca 2400
aataatttga gttttgtcga ataattactc ttcgatttgt gatttctatc tagatctggt 2460
gttagtttct agtttgtgcg atcgaatttg tcgattaatc tgagtttttc tgattaacag 2520
atggcttcat ctgagaacgt tatcactgag ttcatgaggt tcaaggtgag gatggaaggt 2580
actgttaacg gacatgagtt cgagatcgag ggtgagggtg aaggtagacc ttacgaggga 2640
cataacaccg ttaagcttaa ggttacaaag ggtggacctc ttcctttcgc ttgggatatc 2700
ctttctcctc aattccaata cggaagcaag gtaagtttgt ggattcttcg tccatgtgat 2760
ctttgagttt ctttagagct tgtgagggat tagtaagtaa caatgcttga gttttttgct 2820
gctgggcttc gaaaagtttg tcacttgttg gtttgatcca caaggtcttc ttctccatag 2880
ctactagaca tgttttagct taagattcaa gtttatatat gccttgtgga ttaatcattg 2940
cctgattctt ccgtgtcatc tctgagttta tttagagctt ggaagtggtg tagtaataac 3000
taacaatact cttgataagt tgtagcaatg ctcttgatta gtggatgtaa tatgatgttg 3060
ataagatata tgaggcacag aaccaaaagt ggtgcttcca ctagacccgt ttttagccta 3120
aggttcaagt ttataccttg tagatgtttc tgtattgtct gattcttccc tgtgatattt 3180
gaatttctta gagctttgga agtgatatag gaacaatgct cttgtgtgtt tgtctctatg 3240
aagattatcg ctgtcgtgtt tcatccgagt gtgcgggatt ttttgctgct gggtttagcc 3300
tttcttcaaa aagttattac ttgttagttt tattgttttg gtcttgataa gagatgttag 3360
gacagacatg gtgcttcttg tctatagcca ctagacctat tttagcataa ggttaacgaa 3420
attctctcta cataccttgt ggatttgttt acattgcctg atctttcctg tgatcgctgt 3480
catgtttctt tggaatgatt gatgtttata aatggaaaaa tctttgtgca gaagactccc 3540
gcccatctct ctatgcccgg gacaagtgcc accccacagt ggggcaggat gaggatgacc 3600
accatggggt cgcagcgtgt gcgtgtccgt cgtacgttct ggccggccgg gccttgggcg 3660
cgcgatcaga agcgttgcgt tggcgtgtgt gtgcttctgg tttgctttaa ttttaccaag 3720
tttgtttcaa ggtggatcgc gtggtcaagg cccgtgtgct ttaaagaccc accggcactg 3780
gcagtgagtg ttgctgcttg tgtaggcttt ggtacgtatg ggctttattt gcttctggat 3840
gttgtgtact acttgggttt gttgaattat tatgagcagt tgcgtattgt aattcagctg 3900
ggctacctgg acattgttat gtattaataa atgctttgct ttcttctaaa gatctttaag 3960
tgctgtttaa acaaccgaca accactttgc ggacttcctt tcaagagaat tcaataaggt 4020
taattcctaa ttgaaatccg aagataagat tcccacacac ttgtggctga tatcaaaagg 4080
ctactgccta tttaaacaca tctctggaga ctgagaaaat cagacctcca agcatgaaga 4140
agcctgagct tactgctact tctgttgaga agttcctcat cgagaagttc gattctgtgt 4200
ctgatcttat gcagctctct gagggtgagg aatcaagagc tttctctttc gatgttggtg 4260
gaagaggata cgttctcaga gttaactctt gcgctgacgg attctacaag gatagatacg 4320
tgtacagaca cttcgcttca gctgctctcc ctatccctga agttcttgat atcggagagt 4380
tctctgagtc tcttacctac tgtatctcaa gaagggctca gggtgttact cttcaagatc 4440
ttcctgagac tgagcttcct gctgttcttc aacctgttgc tgaggctatg gatgctatcg 4500
ctgctgctga tctttctcaa acttctggat tcggaccttt cggtcctcag ggaatcggac 4560
agtacactac ttggagagat ttcatctgcg ctatcgctga tcctcatgtt taccattggc 4620
agaccgttat ggatgatacc gtttctgctt ctgttgctca agctcttgat gagcttatgc 4680
tttgggctga ggattgtcct gaggttagac atcttgttca cgctgatttc ggatctaaca 4740
acgttctcac cgataacgga agaatcaccg ctgttatcga ttggtctgag gctatgttcg 4800
gagattctca atacgaggtg gccaacatat tcttttggag gccttggctt gcttgtatgg 4860
aacaacagac tagatacttc gagagaaggc atcctgagct tgctggatct cctagactta 4920
gagcttacat gcttaggatc ggacttgatc agctttacca gtctctcgtt gatggaaact 4980
tcgatgatgc tgcttgggct cagggaagat gtgatgctat cgttagatct ggtgctggaa 5040
ctgttggaag aactcaaatc gctagaagat ctgctgctgt ttggactgat ggatgtgttg 5100
aagttctcgc tgattctgga aacagaaggc cttctactag acctagagcc aagaagtgaa 5160
gatcggcggc aatagcttct tagcgccatc ccgggttgat cctatctgtg ttgaaatagt 5220
tgcggtgggc aaggctctct ttcagaaaga caggcggcca aaggaaccca aggtgaggtg 5280
ggctatggct ctcagttcct tgtggaagcg cttggtctaa ggtgcagagg tgttagcggg 5340
atgaagcaaa agtgtccgat tgtaacaaga tatgttgatc ctacgtaagg atattaaagt 5400
atgtattcat cactaatata atcagtgtat tccaatatgt actacgattt ccaatgtctt 5460
tattgtcgcc gtatgtaatc ggcgtcacaa aataatcccc ggtgactttc ttttaatcca 5520
ggatgaaata atatgttatt ataatttttg cgatttggtc cgttatagga attgaagtgt 5580
gcttgcggtc gccaccactc ccatttcata attttacatg tatttgaaaa ataaaaattt 5640
atggtattca atttaaacac gtatacttgt aaagaatgat atcttgaaag aaatatagtt 5700
taaatattta ttgataaaat aacaagtcag gtattatagt ccaagcaaaa acataaattt 5760
attgatgcaa gtttaaattc agaaatattt caataactga ttatatcagc tggtacattg 5820
ccgtagatga aagactgagt gcgatattat ggtgtaatac atagtttaaa cgggcccaag 5880
actcccgccc atctctctat gcccgggaca agtgccaccc cacagtgggg caggatgagg 5940
atgaccagtc agttttactt cccttaattt tctatgtact ttcataatta cttatgttat 6000
tttcttcatg agttttaatg caaattacta tatggactct agtgaaaacg ttcagaatcc 6060
tataaacatg actactgaga cgaacttgag agtagttttg atcatacaca cgtttcatgt 6120
ggtacttgag agttactaat ttttgtcatc ttcgtataag tagtaaaaga tactacaaga 6180
atagtttagt agaaaatact agcggtaggt gaagatttgt cgctatgtac tattattgtc 6240
tagtaacttg agtaacaatt tcgtggtcta aatatcaaat aaaaatggat gagtggttca 6300
ccaaatctag gcatcaaaac tattaatgtc attgtctaga tcttaggtga caccacattt 6360
cgaatattta ttggtaattg agatgttaaa gtaccaatat ttgacttaat aaactaaaag 6420
attttggctt tatcaaatgt agacattgat gacatatcgt tgtcattatc ttgagtatat 6480
acaagtcgat caattaggtg aaagtttagt gtctcgtggt tggtaaacga ttaatacagt 6540
agtatatttt atccaaagac aaaatccaaa tcatttcacc agtatgaata gtattatttt 6600
atcttaaaag ctaaaatctt aaaaaccaag gtagcaccca cgttgagcta gacgatcaaa 6660
tcgatttctg ctttgtccaa tttaccaagc tatttaaagc caaataattg aaatataggt 6720
aggtcgttat attaggctaa gatttatctc aaatgcttaa ctaaaggaat aacaagggat 6780
tctagttgtg tggttttata agattggtcc aatttcactt aagtttgttt attgtagaat 6840
tttatatgtg aataatttga attccaattg aaaagatatt atagtaaaag aaaaaatagt 6900
gcgaacaaaa aactttaatc ccataaaaag aaaaagaaaa atgaaaagtt cttctaacat 6960
ccatattttg catcatatca taaagataag aaagatacat atcatagacg tacagataaa 7020
caaacatatc atcatttgtg aaatacatag tacaataatt tgcttttaaa tagagtttaa 7080
gtcacacaca ctgacacaca cgataaaacg ataatgtctg caaaaacact ttaatcccat 7140
tgcctagagg acagcttctc cactttgtct ttaaggttgg ttttgccgtg ttgtttttat 7200
ctttatataa tgatctattt tttggattat gaaatgaatt cacacatttt aattatttaa 7260
gaagatccat atacaggttt ataacagtac taagtgatga ttattttttg tttttgcata 7320
gtttagttta ttgggtaaac attcattacg tgtctcttta tacgaatcac ccatccaaaa 7380
tttcaagtag tcttttagtt catttattat ttcataacta tttgacttat tgatttgaca 7440
agaaacaaca aaagtgttga cttattgata gattgtggga tcataaaagt aattaagcgt 7500
caaccacgac ccacaacaac aaagcacatg ttatacatta atatctcgtt tacttaatta 7560
cagttttcag aatgccgttt catgtcttgt cactggcgat gttattatca tgttggacaa 7620
tattcgactg ttgtcgtttt tacattttcg tattgactaa aactaaaaaa acaaaactct 7680
gtttcaggtt gggcctagga tccacattgt acacacattt gcttaagtct atggaggcgc 7740
aaggttttaa gtctgtggtt gctgttatag gccttccaaa cgatccatct gttaggttgc 7800
atgaggcttt gggatacaca gcccggggta cattgcgcgc agctggatac aagcatggtg 7860
gatggcatga tgttggtttt tggcaaaggg attttgagtt gccagctcct ccaaggccag 7920
ttaggccagt tacccagatc taatatcaaa atctatttag aaatacacaa tattttgttg 7980
caggcttgct ggagaatcga tctgctatca taaaaattac aaaaaaattt tatttgcctc 8040
aattatttta ggattggtat taaggacgct taaattattt gtcgggtcac tacgcatcat 8100
tgtgattgag aagatcagcg atacgaaata ttcgtagtac tatcgataat ttatttgaaa 8160
attcataaga aaagcaaacg ttacatgaat tgatgaaaca atacaaagac agataaagcc 8220
acgcacattt aggatattgg ccgagattac tgaatattga gtaagatcac ggaatttctg 8280
acaggagcat gtcttcaatt cagcccaaat ggcagttgaa atactcaaac cgccccatat 8340
gcaggagcgg atcattcatt gtttgtttgg ttgcctttgc caacatggga gtccaaggtt 8400
gtttaaacat ttaaataccc tgccaagctt gaggtagcct ccaatttgac ggtgccgcca 8460
gcgacgccgt ctggaactgt cctttttgag gaccactccg tttgtggaga tcatgagagt 8520
ccatgctcaa caccgtgcac tagggacagg attgaagact cccgcccatc tcactaggga 8580
caggattgcc accccacagt ggggcctaga aagactggag ttgcagagtt tgtgtcttct 8640
agattaatcc tccaaacttt tgattaacca aaaaaattat caaactaaca tgttctcctt 8700
ttttctttag aaattctaac gaatttatct ttatactgat ttgaatatac ttaatttggt 8760
catttggatg ccctttacaa cctccttacc aaactattga tcacagtttc tattgctaaa 8820
atcaccaaca aaacgcatgt cgccattcat aattatggtt tcacacctac aactaggcta 8880
ataagtaaat aagtagacaa ctagactcag gtttgaaaaa accataaaag ccatatagcg 8940
ttttctcatt gaaactgcga acacgatcgt gtgaatgttg cagtttctag ttttgataca 9000
aacaaacaaa aacacaattt aatcttagat taaaaagaaa aaagagaacg gagcccacta 9060
gccactcctt caaacgtgtc ttaccaactc tcttctagaa acaaattagg cttcaccttc 9120
ctcttccaac ctctctctct ctctctctct ctttttctca aaccatctct ccataaagcc 9180
ctaatttctt catcacaaga atcagaagaa gaaagatgga cctgcatcta attttcggtc 9240
caacttgcac aggaaagacg acgaccgcga tagctcttgc ccagcagaca gggcttccag 9300
tcctttcgct tgatcgggtc caatgctgtc ctcaactatc aaccggaagc ggacgaccaa 9360
cagtggaaga actgaaagga acgacgcgtc tctaccttga tgatcggcct ctggtggagg 9420
gtatcatcgc agccaagcaa gctcatcata ggctgatcga ggaggtgtat aatcatgagg 9480
ccaacggcgg gcttattctt gagggaggat ccacctcgtt gctcaactgc atggcgcgaa 9540
acagctattg gagtgcagat tttcgttggc atattattcg ccacaagtta cccgaccaag 9600
agaccttcat gaaagcggcc aaggccagag ttaagcagat gttgcacccc gctgcaggcc 9660
attctattat tcaagagttg gtttatcttt ggaatgaacc tcggctgagg cccattctga 9720
aagagatcga tggatatcga tatgccatgt tgtttgctag ccagaaccag atcacggcag 9780
atatgctatt gcagcttgac gcaaatatgg aaggtaagtt gattaatggg atcgctcagg 9840
agtatttcat ccatgcgcgc caacaggaac agaaattccc ccaagttaac gcagccgctt 9900
tcgacggatt cgaaggtcat ccgttcggaa tgtattagaa atcaccagtc tctctctaca 9960
aatctatctc tctctatttt tctccagaat aatgtgtgag tagttcccag ataagggaat 10020
tagggttctt atagggtttc gctcatgtgt tgagcatata agaaaccctt agtatgtatt 10080
tgtatttgta aaatacttct atcaataaaa tttctaattc ctaaaaccaa aatccagtgt 10140
ttaaacgagt ccatgctcaa caccgtgcac tagggacagg attgaagact cccgcccatc 10200
tcactaggga caggattgcc accccacagt ggggcctaga aagactggag ttgcagacat 10260
taaggatgac cagttcgtaa aggtcctgcg gtgtctattg cttttcatag gttaataagt 10320
gtttgctaga ctgtggtgaa aggcctatcc gaagtaaggc cggccggatc cttcatcttt 10380
ggacaaggga ataaagactc cccacttgct actaagaaca atacctaagt tgcccagaca 10440
tgactgtacc cattcagaga cctaccaccc attagggcta tgacactaac actagcccct 10500
ggaggttgac catgctaggc agtgggggtc tcacctatga cccactcaga taggggttta 10560
aaccagtggg tgggatctca gcctcatata ggtgtttgtg gtgagctttc tcctagacaa 10620
gagaaccctg aagaacagca agaaccagct aatatgatat gtagacatag tgggttgctc 10680
aaattttgtg tttagtcata ttagaattga cctcagtgac cactcagaaa gtgcccaagc 10740
ccatctatag gggccaaagt gctattgact ggtgtgtctg tgaattgttc ctccctacag 10800
agttggtgct gatatatcct agcattcttt ggaaaaccta gctagggact gtcaagtgta 10860
agatacctcc tgaattggag ggaacactag ctgccctgta ccttctggct agtaccttac 10920
accctgaatg ggttaggggg tctattattt gctggaaata taccagtttc agtagggctg 10980
ctgccttagg tcccacaagg tgtaacatgt gctcaatagt tgcactacca catgcacgtg 11040
aacttaatga tgttatagcc acaacaccaa ccttggtttg cagtttgaca tccctctgga 11100
atgggtgtag tcatcttgct ctggatctgc ctgaatcatt ggggctgtat gcagcctggg 11160
cttaaagtga agaatgggat gtcccagaaa tattttgggt gagaagaatc ctggagtaga 11220
tggtgacctg actatccctg tcctatgggc acaatctatc atcagatatt gcattcaaag 11280
ggctatcatg ggatcaagtc ctaagtcaac tgttgtttac ctggcagaca ttcatctagg 11340
agttctcttt tatgccaccc cacagtgatc cgccttttgc agtttatcca ctagggacag 11400
gattgccacc ccacagtggg gcctctatgc ccgggacaag tgtaaaatat agagtatagg 11460
ggttatcatc acagagaagc tattgctgga gggcctctgt tatttcctct ccatgccact 11520
cccattttta acctaccaac tgaaatccca agggagactc caccctgtaa ctagagtcct 11580
cagaggtgag ccatcccata ttaacaaatg ggcattaggg ctaggatgcc aagggatacc 11640
tgaaatggga agttgtgggg ctgagtcctc ctgggaatca gagataatat gtaaacagtt 11700
tgttgagaga ttgatgagag ctgactttga gaggtggcca tgctccctgg tcctcaatag 11760
ggaaggcact acacaagaaa cctgggtttg atcaactgca ctgtgtccta ctcacacatt 11820
gtgtgcctgg aaaaatgtta cttagtattt ggagggcctc cagaaccccc ctgggtgcaa 11880
gactgggtgc tagtgactgg gtgaatgagt cttggacaca gtggccttgt ctaggttgtg 11940
tgaggtggct aggcatcatg gcaatacctc ataattgatg agtgaggaaa caagactaag 12000
tccttgactc ctcttattac atgacctggt ggatattatg tttaaactct gcaagctgga 12060
atgagtactg ggtgcagatc ccctgggatt ctggctacaa aggtgaatga tagctagtct 12120
gtttattagt agccaaaaaa gtcagtgagg ggtgagtgcc ctgggatgtt gttaagttca 12180
cattgcacac ttggagaccc tctccatcca gtaacatacc agagaaaact gaccaagccc 12240
tcatgggtgt atgggaacaa caaacctcct ggctacttca agggcacata acaccagcaa 12300
ggagcctgtc ataaccacca tctcaaacaa tagaacttcc taagtgaagc aatgacttca 12360
aatctacttg aaggcatgga gtataagcca tgttcctttc agaggggact gtacttctgt 12420
agattacttt ccctcattaa ccagatctgg ccggccgcat gccttgctgg tcgatcgtgt 12480
tggccactct tgtttatcta tcattcctcg ttggtccagt cacagttcta aaagtctatg 12540
gtgttcctta cattgtaagt ttcatatatt tctttattat atcattgcta atataatttg 12600
tttttgacat aaaagttttg gaaaaatttc agatctttgt aatgtggttg gacgctgtca 12660
cgtacttgca tcatcatggt cacgatgata agctgccttg gtacagaggc aaggtaagta 12720
gatcaacatt atttataaga agcaataatg attagtagtt gaataatctg aatttttgat 12780
gtttttgtac aataatagga atggagttat ttacgtggag gattaacaac tgttgataga 12840
gattacggga tcttcaacaa cattcatcac gatattggaa ctcacgtgat ccatcatctt 12900
ttcccacaaa tccctcacta tcacttggtc gatgccgtga gtgatctcgc tctctctcta 12960
gtttcatttg attatattaa agggtgatta attactaaat tagtgatctt aattaatgac 13020
atgcgacaga cgaaagcagc taaacatgtg ttgggaagat actacagaga accaaagacg 13080
tcaggagcaa taccgatcca cttagtggaa agtttggtgg caagtattaa gaaagatcat 13140
tacgtcagtg acactggtga tattgtcttc tacgagacag atccagatct ctacgtttat 13200
gcttctgaca aatccaaaat caattaatct ttcttcctag ctctatttag gaataaaaca 13260
ctcctttggt tttacttatt tctggttgtt tttaagttaa aaatgtactc gtgaaacttt 13320
tttttattaa atgtatttac attacaaatc gtaaaagttt ttgttcgttt tctctatgtt 13380
tttagttaca aacttacaat caaaaaggtc ttaaaaactt tttgatggtg ggacggacaa 13440
aagaaaaagt tcgactgaga gt 13462
<210> 82
<211> 13462
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 82
aatatttata tatatttgtt ttaatggctt attttattgt taaatggata catcagcttg 60
aaatatctac gaacatgcat cattttccta gatacatttg tttgttgctc aaaaaatgaa 120
taacgtagtt aaacgagtga gattcttagc atctgcctcg aaaacgatat gttattgaca 180
attccaattt catttttatg aaaataaaat aatagtttat tttataattg ggggtggttg 240
caggagaata agccatcgga cacaccacca gaaccatggc catgttgaaa acgacgagtc 300
ttgggttccg gtaatccccc tctcattatt tttttttctt tttttgaaac tctttcattt 360
taattttctt agaattctat gtatttattt taatcaatcc tttttccagt gtgaggcttg 420
gacgaccact tgtcagattt gtcgtttagc tgtagtaaac aactgattta aattgtttat 480
ggtactgtag ttaactttaa caacgggcca cttatattcg agccattggc ataaaatgat 540
tcttctcgaa attcgtttac ttttcttagt atttttcagt tttgtagttt acgtagaact 600
aataaaaaga aaaaaactta taaacacacc acatgcaatg aataaattcg aatatataac 660
catactgtta aatattaatt aacattttaa tcttaatttt gcattccagt tgccagaaaa 720
attatacaag aatttgtccc acagtacacg gatgctcaga tacactgtcc ctctccccat 780
gctcgcttac cctctctatc tggtaaatcc taattcctca tttttcttcc tgattataat 840
tacaattttg aatttttaga ttttgagtat taactaaata taaattaaat ttgtttgggg 900
atgactacag tggtacagaa gtcctggtaa agaagggtca cattataacc catacagtag 960
tttatttgcc ccaagcgaga gaaagcttat tgcaacttca ggtaccgcct tttgcagttt 1020
atctctatgc ccgggacaag tggagtccat gctcaacacc gtgcaggatg aggatgacca 1080
ccgcggtagc gacttcgtgg gcgaggaaag cctttcgtcc aaggtggtcc ctcctcgcaa 1140
tcttgttgga tggtgaatat tataaaagcc tgcccttctc gcgggtgttt aaacgtcgac 1200
ctgcaggtca acggatcagg atattcttgt ttaagatgtt gaactctatg gaggtttgta 1260
tgaactgatg atctaggacc ggataagttc ccttcttcat agcgaactta ttcaaagaat 1320
gttttgtgta tcattcttgt tacattgtta ttaatgaaaa aatattattg gtcattggac 1380
tgaacacgag tgttaaatat ggaccaggcc ccaaataaga tccattgata tatgaattaa 1440
ataacaagaa taaatcgagt caccaaacca cttgcctttt ttaacgagac ttgttcacca 1500
acttgataca aaagtcatta tcctatgcaa atcaataatc atacaaaaat atccaataac 1560
actaaaaaat taaaagaaat ggataatttc acaatatgtt atacgataaa gaagttactt 1620
ttccaagaaa ttcactgatt ttataagccc acttgcatta gataaatggc aaaaaaaaac 1680
aaaaaggaaa agaaataaag cacgaagaat tctagaaaat acgaaatacg cttcaatgca 1740
gtgggaccca cggttcaatt attgccaatt ttcagctcca ccgtatattt aaaaaataaa 1800
acgataatgc taaaaaaata taaatcgtaa cgatcgttaa atctcaacgg ctggatctta 1860
tgacgaccgt tagaaattgt ggttgtcgac gagtcagtaa taaacggcgt caaagtggtt 1920
gcagccggca cacacgagtc gtgtttatca actcaaagca caaatacttt tcctcaacct 1980
aaaaataagg caattagcca aaaacaactt tgcgtgtaaa caacgctcaa tacacgtgtc 2040
attttattat tagctattgc ttcaccgcct tagctttctc gtgacctagt cgtcctcgtc 2100
ttttcttctt cttcttctat aaaacaatac ccaaagagct cttcttcttc acaattcaga 2160
tttcaatttc tcaaaatctt aaaaactttc tctcaattct ctctaccgtg atcaaggtaa 2220
atttctgtgt tccttattct ctcaaaatct tcgattttgt tttcgttcga tcccaatttc 2280
gtatatgttc tttggtttag attctgttaa tcttagatcg aagacgattt tctgggtttg 2340
atcgttagat atcatcttaa ttctcgatta gggtttcata gatatcatcc gatttgttca 2400
aataatttga gttttgtcga ataattactc ttcgatttgt gatttctatc tagatctggt 2460
gttagtttct agtttgtgcg atcgaatttg tcgattaatc tgagtttttc tgattaacag 2520
atggcttcat ctgagaacgt tatcactgag ttcatgaggt tcaaggtgag gatggaaggt 2580
actgttaacg gacatgagtt cgagatcgag ggtgagggtg aaggtagacc ttacgaggga 2640
cataacaccg ttaagcttaa ggttacaaag ggtggacctc ttcctttcgc ttgggatatc 2700
ctttctcctc aattccaata cggaagcaag gtaagtttgt ggattcttcg tccatgtgat 2760
ctttgagttt ctttagagct tgtgagggat tagtaagtaa caatgcttga gttttttgct 2820
gctgggcttc gaaaagtttg tcacttgttg gtttgatcca caaggtcttc ttctccatag 2880
ctactagaca tgttttagct taagattcaa gtttatatat gccttgtgga ttaatcattg 2940
cctgattctt ccgtgtcatc tctgagttta tttagagctt ggaagtggtg tagtaataac 3000
taacaatact cttgataagt tgtagcaatg ctcttgatta gtggatgtaa tatgatgttg 3060
ataagatata tgaggcacag aaccaaaagt ggtgcttcca ctagacccgt ttttagccta 3120
aggttcaagt ttataccttg tagatgtttc tgtattgtct gattcttccc tgtgatattt 3180
gaatttctta gagctttgga agtgatatag gaacaatgct cttgtgtgtt tgtctctatg 3240
aagattatcg ctgtcgtgtt tcatccgagt gtgcgggatt ttttgctgct gggtttagcc 3300
tttcttcaaa aagttattac ttgttagttt tattgttttg gtcttgataa gagatgttag 3360
gacagacatg gtgcttcttg tctatagcca ctagacctat tttagcataa ggttaacgaa 3420
attctctcta cataccttgt ggatttgttt acattgcctg atctttcctg tgatcgctgt 3480
catgtttctt tggaatgatt gatgtttata aatggaaaaa tctttgtgca gaagactccc 3540
gcccatctct ctatgcccgg gacaagtgcc accccacagt ggggcaggat gaggatgacc 3600
accatggggt cgcagcgtgt gcgtgtccgt cgtacgttct ggccggccgg gccttgggcg 3660
cgcgatcaga agcgttgcgt tggcgtgtgt gtgcttctgg tttgctttaa ttttaccaag 3720
tttgtttcaa ggtggatcgc gtggtcaagg cccgtgtgct ttaaagaccc accggcactg 3780
gcagtgagtg ttgctgcttg tgtaggcttt ggtacgtatg ggctttattt gcttctggat 3840
gttgtgtact acttgggttt gttgaattat tatgagcagt tgcgtattgt aattcagctg 3900
ggctacctgg acattgttat gtattaataa atgctttgct ttcttctaaa gatctttaag 3960
tgctgtttaa acaaccgaca accactttgc ggacttcctt tcaagagaat tcaataaggt 4020
taattcctaa ttgaaatccg aagataagat tcccacacac ttgtggctga tatcaaaagg 4080
ctactgccta tttaaacaca tctctggaga ctgagaaaat cagacctcca agcatgaaga 4140
agcctgagct tactgctact tctgttgaga agttcctcat cgagaagttc gattctgtgt 4200
ctgatcttat gcagctctct gagggtgagg aatcaagagc tttctctttc gatgttggtg 4260
gaagaggata cgttctcaga gttaactctt gcgctgacgg attctacaag gatagatacg 4320
tgtacagaca cttcgcttca gctgctctcc ctatccctga agttcttgat atcggagagt 4380
tctctgagtc tcttacctac tgtatctcaa gaagggctca gggtgttact cttcaagatc 4440
ttcctgagac tgagcttcct gctgttcttc aacctgttgc tgaggctatg gatgctatcg 4500
ctgctgctga tctttctcaa acttctggat tcggaccttt cggtcctcag ggaatcggac 4560
agtacactac ttggagagat ttcatctgcg ctatcgctga tcctcatgtt taccattggc 4620
agaccgttat ggatgatacc gtttctgctt ctgttgctca agctcttgat gagcttatgc 4680
tttgggctga ggattgtcct gaggttagac atcttgttca cgctgatttc ggatctaaca 4740
acgttctcac cgataacgga agaatcaccg ctgttatcga ttggtctgag gctatgttcg 4800
gagattctca atacgaggtg gccaacatat tcttttggag gccttggctt gcttgtatgg 4860
aacaacagac tagatacttc gagagaaggc atcctgagct tgctggatct cctagactta 4920
gagcttacat gcttaggatc ggacttgatc agctttacca gtctctcgtt gatggaaact 4980
tcgatgatgc tgcttgggct cagggaagat gtgatgctat cgttagatct ggtgctggaa 5040
ctgttggaag aactcaaatc gctagaagat ctgctgctgt ttggactgat ggatgtgttg 5100
aagttctcgc tgattctgga aacagaaggc cttctactag acctagagcc aagaagtgaa 5160
gatcggcggc aatagcttct tagcgccatc ccgggttgat cctatctgtg ttgaaatagt 5220
tgcggtgggc aaggctctct ttcagaaaga caggcggcca aaggaaccca aggtgaggtg 5280
ggctatggct ctcagttcct tgtggaagcg cttggtctaa ggtgcagagg tgttagcggg 5340
atgaagcaaa agtgtccgat tgtaacaaga tatgttgatc ctacgtaagg atattaaagt 5400
atgtattcat cactaatata atcagtgtat tccaatatgt actacgattt ccaatgtctt 5460
tattgtcgcc gtatgtaatc ggcgtcacaa aataatcccc ggtgactttc ttttaatcca 5520
ggatgaaata atatgttatt ataatttttg cgatttggtc cgttatagga attgaagtgt 5580
gcttgcggtc gccaccactc ccatttcata attttacatg tatttgaaaa ataaaaattt 5640
atggtattca atttaaacac gtatacttgt aaagaatgat atcttgaaag aaatatagtt 5700
taaatattta ttgataaaat aacaagtcag gtattatagt ccaagcaaaa acataaattt 5760
attgatgcaa gtttaaattc agaaatattt caataactga ttatatcagc tggtacattg 5820
ccgtagatga aagactgagt gcgatattat ggtgtaatac atagtttaaa cgggcccaag 5880
actcccgccc atctctctat gcccgggaca agtgccaccc cacagtgggg caggatgagg 5940
atgaccagtc agttttactt cccttaattt tctatgtact ttcataatta cttatgttat 6000
tttcttcatg agttttaatg caaattacta tatggactct agtgaaaacg ttcagaatcc 6060
tataaacatg actactgaga cgaacttgag agtagttttg atcatacaca cgtttcatgt 6120
ggtacttgag agttactaat ttttgtcatc ttcgtataag tagtaaaaga tactacaaga 6180
atagtttagt agaaaatact agcggtaggt gaagatttgt cgctatgtac tattattgtc 6240
tagtaacttg agtaacaatt tcgtggtcta aatatcaaat aaaaatggat gagtggttca 6300
ccaaatctag gcatcaaaac tattaatgtc attgtctaga tcttaggtga caccacattt 6360
cgaatattta ttggtaattg agatgttaaa gtaccaatat ttgacttaat aaactaaaag 6420
attttggctt tatcaaatgt agacattgat gacatatcgt tgtcattatc ttgagtatat 6480
acaagtcgat caattaggtg aaagtttagt gtctcgtggt tggtaaacga ttaatacagt 6540
agtatatttt atccaaagac aaaatccaaa tcatttcacc agtatgaata gtattatttt 6600
atcttaaaag ctaaaatctt aaaaaccaag gtagcaccca cgttgagcta gacgatcaaa 6660
tcgatttctg ctttgtccaa tttaccaagc tatttaaagc caaataattg aaatataggt 6720
aggtcgttat attaggctaa gatttatctc aaatgcttaa ctaaaggaat aacaagggat 6780
tctagttgtg tggttttata agattggtcc aatttcactt aagtttgttt attgtagaat 6840
tttatatgtg aataatttga attccaattg aaaagatatt atagtaaaag aaaaaatagt 6900
gcgaacaaaa aactttaatc ccataaaaag aaaaagaaaa atgaaaagtt cttctaacat 6960
ccatattttg catcatatca taaagataag aaagatacat atcatagacg tacagataaa 7020
caaacatatc atcatttgtg aaatacatag tacaataatt tgcttttaaa tagagtttaa 7080
gtcacacaca ctgacacaca cgataaaacg ataatgtctg caaaaacact ttaatcccat 7140
tgcctagagg acagcttctc cactttgtct ttaaggttgg ttttgccgtg ttgtttttat 7200
ctttatataa tgatctattt tttggattat gaaatgaatt cacacatttt aattatttaa 7260
gaagatccat atacaggttt ataacagtac taagtgatga ttattttttg tttttgcata 7320
gtttagttta ttgggtaaac attcattacg tgtctcttta tacgaatcac ccatccaaaa 7380
tttcaagtag tcttttagtt catttattat ttcataacta tttgacttat tgatttgaca 7440
agaaacaaca aaagtgttga cttattgata gattgtggga tcataaaagt aattaagcgt 7500
caaccacgac ccacaacaac aaagcacatg ttatacatta atatctcgtt tacttaatta 7560
cagttttcag aatgccgttt catgtcttgt cactggcgat gttattatca tgttggacaa 7620
tattcgactg ttgtcgtttt tacattttcg tattgactaa aactaaaaaa acaaaactct 7680
gtttcaggtt gggcctagga tccacattgt acacacattt gcttaagtct atggaggcgc 7740
aaggttttaa gtctgtggtt gctgttatag gccttccaaa cgatccatct gttaggttgc 7800
atgaggcttt gggatacaca gcccggggta cattgcgcgc agctggatac aagcatggtg 7860
gatggcatga tgttggtttt tggcaaaggg attttgagtt gccagctcct ccaaggccag 7920
ttaggccagt tacccagatc taatatcaaa atctatttag aaatacacaa tattttgttg 7980
caggcttgct ggagaatcga tctgctatca taaaaattac aaaaaaattt tatttgcctc 8040
aattatttta ggattggtat taaggacgct taaattattt gtcgggtcac tacgcatcat 8100
tgtgattgag aagatcagcg atacgaaata ttcgtagtac tatcgataat ttatttgaaa 8160
attcataaga aaagcaaacg ttacatgaat tgatgaaaca atacaaagac agataaagcc 8220
acgcacattt aggatattgg ccgagattac tgaatattga gtaagatcac ggaatttctg 8280
acaggagcat gtcttcaatt cagcccaaat ggcagttgaa atactcaaac cgccccatat 8340
gcaggagcgg atcattcatt gtttgtttgg ttgcctttgc caacatggga gtccaaggtt 8400
gtttaaacat ttaaataccc tgccaagctt gaggtagcct ccaatttgac ggtgccgcca 8460
gcgacgccgt ctggaactgt cctttttgag gaccactccg tttgtggaga tcatgagagt 8520
ccatgctcaa caccgtgcac tagggacagg attgaagact cccgcccatc tcactaggga 8580
caggattgcc accccacagt ggggcctaga aagactggag ttgcagagtt tgtgtcttct 8640
agattaatcc tccaaacttt tgattaacca aaaaaattat caaactaaca tgttctcctt 8700
ttttctttag aaattctaac gaatttatct ttatactgat ttgaatatac ttaatttggt 8760
catttggatg ccctttacaa cctccttacc aaactattga tcacagtttc tattgctaaa 8820
atcaccaaca aaacgcatgt cgccattcat aattatggtt tcacacctac aactaggcta 8880
ataagtaaat aagtagacaa ctagactcag gtttgaaaaa accataaaag ccatatagcg 8940
ttttctcatt gaaactgcga acacgatcgt gtgaatgttg cagtttctag ttttgataca 9000
aacaaacaaa aacacaattt aatcttagat taaaaagaaa aaagagaacg gagcccacta 9060
gccactcctt caaacgtgtc ttaccaactc tcttctagaa acaaattagg cttcaccttc 9120
ctcttccaac ctctctctct ctctctctct ctttttctca aaccatctct ccataaagcc 9180
ctaatttctt catcacaaga atcagaagaa gaaagatgga cctgcatcta attttcggtc 9240
caacttgcac aggaaagacg acgaccgcga tagctcttgc ccagcagaca gggcttccag 9300
tcctttcgct tgatcgggtc caatgctgtc ctcaactatc aaccggaagc ggacgaccaa 9360
cagtggaaga actgaaagga acgacgcgtc tctaccttga tgatcggcct ctggtggagg 9420
gtatcatcgc agccaagcaa gctcatcata ggctgatcga ggaggtgtat aatcatgagg 9480
ccaacggcgg gcttattctt gagggaggat ccacctcgtt gctcaactgc atggcgcgaa 9540
acagctattg gagtgcagat tttcgttggc atattattcg ccacaagtta cccgaccaag 9600
agaccttcat gaaagcggcc aaggccagag ttaagcagat gttgcacccc gctgcaggcc 9660
attctattat tcaagagttg gtttatcttt ggaatgaacc tcggctgagg cccattctga 9720
aagagatcga tggatatcga tatgccatgt tgtttgctag ccagaaccag atcacggcag 9780
atatgctatt gcagcttgac gcaaatatgg aaggtaagtt gattaatggg atcgctcagg 9840
agtatttcat ccatgcgcgc caacaggaac agaaattccc ccaagttaac gcagccgctt 9900
tcgacggatt cgaaggtcat ccgttcggaa tgtattagaa atcaccagtc tctctctaca 9960
aatctatctc tctctatttt tctccagaat aatgtgtgag tagttcccag ataagggaat 10020
tagggttctt atagggtttc gctcatgtgt tgagcatata agaaaccctt agtatgtatt 10080
tgtatttgta aaatacttct atcaataaaa tttctaattc ctaaaaccaa aatccagtgt 10140
ttaaacgagt ccatgctcaa caccgtgcac tagggacagg attgaagact cccgcccatc 10200
tcactaggga caggattgcc accccacagt ggggcctaga aagactggag ttgcagacat 10260
taaggatgac cagttcgtaa aggtcctgcg gtgtctattg cttttcatag gttaataagt 10320
gtttgctaga ctgtggtgaa aggcctatcc gaagtaaggc cggccggatc cttcatcttt 10380
ggacaaggga ataaagactc cccacttgct actaagaaca atacctaagt tgcccagaca 10440
tgactgtacc cattcagaga cctaccaccc attagggcta tgacactaac actagcccct 10500
ggaggttgac catgctaggc agtgggggtc tcacctatga cccactcaga taggggttta 10560
aaccagtggg tgggatctca gcctcatata ggtgtttgtg gtgagctttc tcctagacaa 10620
gagaaccctg aagaacagca agaaccagct aatatgatat gtagacatag tgggttgctc 10680
aaattttgtg tttagtcata ttagaattga cctcagtgac cactcagaaa gtgcccaagc 10740
ccatctatag gggccaaagt gctattgact ggtgtgtctg tgaattgttc ctccctacag 10800
agttggtgct gatatatcct agcattcttt ggaaaaccta gctagggact gtcaagtgta 10860
agatacctcc tgaattggag ggaacactag ctgccctgta ccttctggct agtaccttac 10920
accctgaatg ggttaggggg tctattattt gctggaaata taccagtttc agtagggctg 10980
ctgccttagg tcccacaagg tgtaacatgt gctcaatagt tgcactacca catgcacgtg 11040
aacttaatga tgttatagcc acaacaccaa ccttggtttg cagtttgaca tccctctgga 11100
atgggtgtag tcatcttgct ctggatctgc ctgaatcatt ggggctgtat gcagcctggg 11160
cttaaagtga agaatgggat gtcccagaaa tattttgggt gagaagaatc ctggagtaga 11220
tggtgacctg actatccctg tcctatgggc acaatctatc atcagatatt gcattcaaag 11280
ggctatcatg ggatcaagtc ctaagtcaac tgttgtttac ctggcagaca ttcatctagg 11340
agttctcttt tatgccaccc cacagtgatc cgccttttgc agtttatcca ctagggacag 11400
gattgccacc ccacagtggg gcctctatgc ccgggacaag tgtaaaatat agagtatagg 11460
ggttatcatc acagagaagc tattgctgga gggcctctgt tatttcctct ccatgccact 11520
cccattttta acctaccaac tgaaatccca agggagactc caccctgtaa ctagagtcct 11580
cagaggtgag ccatcccata ttaacaaatg ggcattaggg ctaggatgcc aagggatacc 11640
tgaaatggga agttgtgggg ctgagtcctc ctgggaatca gagataatat gtaaacagtt 11700
tgttgagaga ttgatgagag ctgactttga gaggtggcca tgctccctgg tcctcaatag 11760
ggaaggcact acacaagaaa cctgggtttg atcaactgca ctgtgtccta ctcacacatt 11820
gtgtgcctgg aaaaatgtta cttagtattt ggagggcctc cagaaccccc ctgggtgcaa 11880
gactgggtgc tagtgactgg gtgaatgagt cttggacaca gtggccttgt ctaggttgtg 11940
tgaggtggct aggcatcatg gcaatacctc ataattgatg agtgaggaaa caagactaag 12000
tccttgactc ctcttattac atgacctggt ggatattatg tttaaactct gcaagctgga 12060
atgagtactg ggtgcagatc ccctgggatt ctggctacaa aggtgaatga tagctagtct 12120
gtttattagt agccaaaaaa gtcagtgagg ggtgagtgcc ctgggatgtt gttaagttca 12180
cattgcacac ttggagaccc tctccatcca gtaacatacc agagaaaact gaccaagccc 12240
tcatgggtgt atgggaacaa caaacctcct ggctacttca agggcacata acaccagcaa 12300
ggagcctgtc ataaccacca tctcaaacaa tagaacttcc taagtgaagc aatgacttca 12360
aatctacttg aaggcatgga gtataagcca tgttcctttc agaggggact gtacttctgt 12420
agattacttt ccctcattaa ccagatctgg ccggccgcat gccttgctgg tcgatcatgt 12480
tggccactct tgtttatcta tcattcctcg ttggtccagt cacagttcta aaagtctatg 12540
gtgttcctta cattgtaagt ttcatatatt tcattattat atcattgcta atataatttg 12600
tttttgacat aaagttttgg aaaaatttca gatctttgta atgtggttgg acgctgtcac 12660
gtacttgcat catcatggtc acgatgataa gttgccttgg tacagaggca aggtaagtag 12720
atcaacatta atttataaga agcaacaatg attagtattt gattaatcta aattattgat 12780
gttttgtgta caataatagg aatggagtta tttacgtgga ggattaacaa ctattgatag 12840
agattacggg atcttcaaca acattcatca cgatattgga actcacgtga tccatcatct 12900
tttcccacaa atccctcact atcacttggt tgatgccgtg agtgatctcg ctctctctct 12960
agtttcattt gattaaaatt aaagggtgat taattactaa attagtgatc ttaattaatg 13020
atatgcgaca gacgaaatca gctaaacatg tgttgggaag atactacaga gaaccaaaga 13080
cgtcaggagc aataccgatc cacttggtgg aaagtttggt ggcaagtatt aagaaagatc 13140
attacgtcag tgacactggt gatattgtct tctacgagac agatccagat ctctacgttt 13200
atgcttctga caaatccaaa atcaactaac ctttcttcct agctctattt aggaataaaa 13260
cagtcctttg gtttttactt atttctggtt gtttttaagt taaatgtact cgtgaaactt 13320
tttttaatta aatgtattta cattacaaat caagtttttg ttcgttttct ttatgttttt 13380
agttacaata aataaaggtc ttaaaaactt tttgttggtg gggacaaaag aaaaagttcg 13440
actgagagag tcgacaaaat gc 13462
<210> 83
<211> 13462
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 83
ttttttaatt taatttattt ttttaatcgg agaaaaaaat taagaaacca aaaaacagtt 60
ttaatcatgg cctcatgttg gggttgagtt ttatattctg ataagaatcc catcttaaaa 120
accccgttaa acatgctctt accatctgct tcgaaaatga tatgttattg acaattccaa 180
tttcattttt atgaaaataa aataatagtt tattttataa ctgagggtgg ttgcaggaga 240
ataagccatc ggacacacca ccagaaccat ggccatgttg aaaacgacga gtcttgggtt 300
ccggtaatct ttccctctct catatttttt ttcttttttt tgaaattctt tcattttaat 360
tttcttagga ttctatgtat ttattttaat caatcctttt tccagtttga ggctaggacg 420
accacttgtc agatttgtcg tttagctgta gtaaacaact gatttaaatt gtttatagta 480
ctgtagttaa ctttaacaac ggaccactta tattcgagcc attggcataa aatgattctt 540
ctcgaaattc gtttactttt cttagtattt ttcaattttg gagtttacgt agaactaata 600
aaaagaaaaa cttataaaca caccacatgc aatgaataaa ttcgaatata taaccatact 660
gttaaatatt aatttacatt ttaatcttaa ttttgcattc cagttgccag aaaaattata 720
caagaatttg tcccacagta cacggatgct cagatacact gtccctctcc ccatgctcgc 780
ttaccctctc tatctggtaa atcctaattc ctaatttttc ttcctgatta taattacaat 840
tttgaatttt tagattttga gtattaacta aatataaatt aaatttgttt ggggatgact 900
acagtggtac agaagtcctg gtaaagaagg gtcacattat aacccataca gtagtttatt 960
tgccccaagc gagagaaagc ttattgcaac ttcaactact ggtaccgcct tttgcagttt 1020
atctctatgc ccgggacaag tggagtccat gctcaacacc gtgcaggatg aggatgacca 1080
ccgcggtagc gacttcgtgg gcgaggaaag cctttcgtcc aaggtggtcc ctcctcgcaa 1140
tcttgttgga tggtgaatat tataaaagcc tgcccttctc gcgggtgttt aaacgtcgac 1200
ctgcaggtca acggatcagg atattcttgt ttaagatgtt gaactctatg gaggtttgta 1260
tgaactgatg atctaggacc ggataagttc ccttcttcat agcgaactta ttcaaagaat 1320
gttttgtgta tcattcttgt tacattgtta ttaatgaaaa aatattattg gtcattggac 1380
tgaacacgag tgttaaatat ggaccaggcc ccaaataaga tccattgata tatgaattaa 1440
ataacaagaa taaatcgagt caccaaacca cttgcctttt ttaacgagac ttgttcacca 1500
acttgataca aaagtcatta tcctatgcaa atcaataatc atacaaaaat atccaataac 1560
actaaaaaat taaaagaaat ggataatttc acaatatgtt atacgataaa gaagttactt 1620
ttccaagaaa ttcactgatt ttataagccc acttgcatta gataaatggc aaaaaaaaac 1680
aaaaaggaaa agaaataaag cacgaagaat tctagaaaat acgaaatacg cttcaatgca 1740
gtgggaccca cggttcaatt attgccaatt ttcagctcca ccgtatattt aaaaaataaa 1800
acgataatgc taaaaaaata taaatcgtaa cgatcgttaa atctcaacgg ctggatctta 1860
tgacgaccgt tagaaattgt ggttgtcgac gagtcagtaa taaacggcgt caaagtggtt 1920
gcagccggca cacacgagtc gtgtttatca actcaaagca caaatacttt tcctcaacct 1980
aaaaataagg caattagcca aaaacaactt tgcgtgtaaa caacgctcaa tacacgtgtc 2040
attttattat tagctattgc ttcaccgcct tagctttctc gtgacctagt cgtcctcgtc 2100
ttttcttctt cttcttctat aaaacaatac ccaaagagct cttcttcttc acaattcaga 2160
tttcaatttc tcaaaatctt aaaaactttc tctcaattct ctctaccgtg atcaaggtaa 2220
atttctgtgt tccttattct ctcaaaatct tcgattttgt tttcgttcga tcccaatttc 2280
gtatatgttc tttggtttag attctgttaa tcttagatcg aagacgattt tctgggtttg 2340
atcgttagat atcatcttaa ttctcgatta gggtttcata gatatcatcc gatttgttca 2400
aataatttga gttttgtcga ataattactc ttcgatttgt gatttctatc tagatctggt 2460
gttagtttct agtttgtgcg atcgaatttg tcgattaatc tgagtttttc tgattaacag 2520
atggcttcat ctgagaacgt tatcactgag ttcatgaggt tcaaggtgag gatggaaggt 2580
actgttaacg gacatgagtt cgagatcgag ggtgagggtg aaggtagacc ttacgaggga 2640
cataacaccg ttaagcttaa ggttacaaag ggtggacctc ttcctttcgc ttgggatatc 2700
ctttctcctc aattccaata cggaagcaag gtaagtttgt ggattcttcg tccatgtgat 2760
ctttgagttt ctttagagct tgtgagggat tagtaagtaa caatgcttga gttttttgct 2820
gctgggcttc gaaaagtttg tcacttgttg gtttgatcca caaggtcttc ttctccatag 2880
ctactagaca tgttttagct taagattcaa gtttatatat gccttgtgga ttaatcattg 2940
cctgattctt ccgtgtcatc tctgagttta tttagagctt ggaagtggtg tagtaataac 3000
taacaatact cttgataagt tgtagcaatg ctcttgatta gtggatgtaa tatgatgttg 3060
ataagatata tgaggcacag aaccaaaagt ggtgcttcca ctagacccgt ttttagccta 3120
aggttcaagt ttataccttg tagatgtttc tgtattgtct gattcttccc tgtgatattt 3180
gaatttctta gagctttgga agtgatatag gaacaatgct cttgtgtgtt tgtctctatg 3240
aagattatcg ctgtcgtgtt tcatccgagt gtgcgggatt ttttgctgct gggtttagcc 3300
tttcttcaaa aagttattac ttgttagttt tattgttttg gtcttgataa gagatgttag 3360
gacagacatg gtgcttcttg tctatagcca ctagacctat tttagcataa ggttaacgaa 3420
attctctcta cataccttgt ggatttgttt acattgcctg atctttcctg tgatcgctgt 3480
catgtttctt tggaatgatt gatgtttata aatggaaaaa tctttgtgca gaagactccc 3540
gcccatctct ctatgcccgg gacaagtgcc accccacagt ggggcaggat gaggatgacc 3600
accatggggt cgcagcgtgt gcgtgtccgt cgtacgttct ggccggccgg gccttgggcg 3660
cgcgatcaga agcgttgcgt tggcgtgtgt gtgcttctgg tttgctttaa ttttaccaag 3720
tttgtttcaa ggtggatcgc gtggtcaagg cccgtgtgct ttaaagaccc accggcactg 3780
gcagtgagtg ttgctgcttg tgtaggcttt ggtacgtatg ggctttattt gcttctggat 3840
gttgtgtact acttgggttt gttgaattat tatgagcagt tgcgtattgt aattcagctg 3900
ggctacctgg acattgttat gtattaataa atgctttgct ttcttctaaa gatctttaag 3960
tgctgtttaa acaaccgaca accactttgc ggacttcctt tcaagagaat tcaataaggt 4020
taattcctaa ttgaaatccg aagataagat tcccacacac ttgtggctga tatcaaaagg 4080
ctactgccta tttaaacaca tctctggaga ctgagaaaat cagacctcca agcatgaaga 4140
agcctgagct tactgctact tctgttgaga agttcctcat cgagaagttc gattctgtgt 4200
ctgatcttat gcagctctct gagggtgagg aatcaagagc tttctctttc gatgttggtg 4260
gaagaggata cgttctcaga gttaactctt gcgctgacgg attctacaag gatagatacg 4320
tgtacagaca cttcgcttca gctgctctcc ctatccctga agttcttgat atcggagagt 4380
tctctgagtc tcttacctac tgtatctcaa gaagggctca gggtgttact cttcaagatc 4440
ttcctgagac tgagcttcct gctgttcttc aacctgttgc tgaggctatg gatgctatcg 4500
ctgctgctga tctttctcaa acttctggat tcggaccttt cggtcctcag ggaatcggac 4560
agtacactac ttggagagat ttcatctgcg ctatcgctga tcctcatgtt taccattggc 4620
agaccgttat ggatgatacc gtttctgctt ctgttgctca agctcttgat gagcttatgc 4680
tttgggctga ggattgtcct gaggttagac atcttgttca cgctgatttc ggatctaaca 4740
acgttctcac cgataacgga agaatcaccg ctgttatcga ttggtctgag gctatgttcg 4800
gagattctca atacgaggtg gccaacatat tcttttggag gccttggctt gcttgtatgg 4860
aacaacagac tagatacttc gagagaaggc atcctgagct tgctggatct cctagactta 4920
gagcttacat gcttaggatc ggacttgatc agctttacca gtctctcgtt gatggaaact 4980
tcgatgatgc tgcttgggct cagggaagat gtgatgctat cgttagatct ggtgctggaa 5040
ctgttggaag aactcaaatc gctagaagat ctgctgctgt ttggactgat ggatgtgttg 5100
aagttctcgc tgattctgga aacagaaggc cttctactag acctagagcc aagaagtgaa 5160
gatcggcggc aatagcttct tagcgccatc ccgggttgat cctatctgtg ttgaaatagt 5220
tgcggtgggc aaggctctct ttcagaaaga caggcggcca aaggaaccca aggtgaggtg 5280
ggctatggct ctcagttcct tgtggaagcg cttggtctaa ggtgcagagg tgttagcggg 5340
atgaagcaaa agtgtccgat tgtaacaaga tatgttgatc ctacgtaagg atattaaagt 5400
atgtattcat cactaatata atcagtgtat tccaatatgt actacgattt ccaatgtctt 5460
tattgtcgcc gtatgtaatc ggcgtcacaa aataatcccc ggtgactttc ttttaatcca 5520
ggatgaaata atatgttatt ataatttttg cgatttggtc cgttatagga attgaagtgt 5580
gcttgcggtc gccaccactc ccatttcata attttacatg tatttgaaaa ataaaaattt 5640
atggtattca atttaaacac gtatacttgt aaagaatgat atcttgaaag aaatatagtt 5700
taaatattta ttgataaaat aacaagtcag gtattatagt ccaagcaaaa acataaattt 5760
attgatgcaa gtttaaattc agaaatattt caataactga ttatatcagc tggtacattg 5820
ccgtagatga aagactgagt gcgatattat ggtgtaatac atagtttaaa cgggcccaag 5880
actcccgccc atctctctat gcccgggaca agtgccaccc cacagtgggg caggatgagg 5940
atgaccagtc agttttactt cccttaattt tctatgtact ttcataatta cttatgttat 6000
tttcttcatg agttttaatg caaattacta tatggactct agtgaaaacg ttcagaatcc 6060
tataaacatg actactgaga cgaacttgag agtagttttg atcatacaca cgtttcatgt 6120
ggtacttgag agttactaat ttttgtcatc ttcgtataag tagtaaaaga tactacaaga 6180
atagtttagt agaaaatact agcggtaggt gaagatttgt cgctatgtac tattattgtc 6240
tagtaacttg agtaacaatt tcgtggtcta aatatcaaat aaaaatggat gagtggttca 6300
ccaaatctag gcatcaaaac tattaatgtc attgtctaga tcttaggtga caccacattt 6360
cgaatattta ttggtaattg agatgttaaa gtaccaatat ttgacttaat aaactaaaag 6420
attttggctt tatcaaatgt agacattgat gacatatcgt tgtcattatc ttgagtatat 6480
acaagtcgat caattaggtg aaagtttagt gtctcgtggt tggtaaacga ttaatacagt 6540
agtatatttt atccaaagac aaaatccaaa tcatttcacc agtatgaata gtattatttt 6600
atcttaaaag ctaaaatctt aaaaaccaag gtagcaccca cgttgagcta gacgatcaaa 6660
tcgatttctg ctttgtccaa tttaccaagc tatttaaagc caaataattg aaatataggt 6720
aggtcgttat attaggctaa gatttatctc aaatgcttaa ctaaaggaat aacaagggat 6780
tctagttgtg tggttttata agattggtcc aatttcactt aagtttgttt attgtagaat 6840
tttatatgtg aataatttga attccaattg aaaagatatt atagtaaaag aaaaaatagt 6900
gcgaacaaaa aactttaatc ccataaaaag aaaaagaaaa atgaaaagtt cttctaacat 6960
ccatattttg catcatatca taaagataag aaagatacat atcatagacg tacagataaa 7020
caaacatatc atcatttgtg aaatacatag tacaataatt tgcttttaaa tagagtttaa 7080
gtcacacaca ctgacacaca cgataaaacg ataatgtctg caaaaacact ttaatcccat 7140
tgcctagagg acagcttctc cactttgtct ttaaggttgg ttttgccgtg ttgtttttat 7200
ctttatataa tgatctattt tttggattat gaaatgaatt cacacatttt aattatttaa 7260
gaagatccat atacaggttt ataacagtac taagtgatga ttattttttg tttttgcata 7320
gtttagttta ttgggtaaac attcattacg tgtctcttta tacgaatcac ccatccaaaa 7380
tttcaagtag tcttttagtt catttattat ttcataacta tttgacttat tgatttgaca 7440
agaaacaaca aaagtgttga cttattgata gattgtggga tcataaaagt aattaagcgt 7500
caaccacgac ccacaacaac aaagcacatg ttatacatta atatctcgtt tacttaatta 7560
cagttttcag aatgccgttt catgtcttgt cactggcgat gttattatca tgttggacaa 7620
tattcgactg ttgtcgtttt tacattttcg tattgactaa aactaaaaaa acaaaactct 7680
gtttcaggtt gggcctagga tccacattgt acacacattt gcttaagtct atggaggcgc 7740
aaggttttaa gtctgtggtt gctgttatag gccttccaaa cgatccatct gttaggttgc 7800
atgaggcttt gggatacaca gcccggggta cattgcgcgc agctggatac aagcatggtg 7860
gatggcatga tgttggtttt tggcaaaggg attttgagtt gccagctcct ccaaggccag 7920
ttaggccagt tacccagatc taatatcaaa atctatttag aaatacacaa tattttgttg 7980
caggcttgct ggagaatcga tctgctatca taaaaattac aaaaaaattt tatttgcctc 8040
aattatttta ggattggtat taaggacgct taaattattt gtcgggtcac tacgcatcat 8100
tgtgattgag aagatcagcg atacgaaata ttcgtagtac tatcgataat ttatttgaaa 8160
attcataaga aaagcaaacg ttacatgaat tgatgaaaca atacaaagac agataaagcc 8220
acgcacattt aggatattgg ccgagattac tgaatattga gtaagatcac ggaatttctg 8280
acaggagcat gtcttcaatt cagcccaaat ggcagttgaa atactcaaac cgccccatat 8340
gcaggagcgg atcattcatt gtttgtttgg ttgcctttgc caacatggga gtccaaggtt 8400
gtttaaacat ttaaataccc tgccaagctt gaggtagcct ccaatttgac ggtgccgcca 8460
gcgacgccgt ctggaactgt cctttttgag gaccactccg tttgtggaga tcatgagagt 8520
ccatgctcaa caccgtgcac tagggacagg attgaagact cccgcccatc tcactaggga 8580
caggattgcc accccacagt ggggcctaga aagactggag ttgcagagtt tgtgtcttct 8640
agattaatcc tccaaacttt tgattaacca aaaaaattat caaactaaca tgttctcctt 8700
ttttctttag aaattctaac gaatttatct ttatactgat ttgaatatac ttaatttggt 8760
catttggatg ccctttacaa cctccttacc aaactattga tcacagtttc tattgctaaa 8820
atcaccaaca aaacgcatgt cgccattcat aattatggtt tcacacctac aactaggcta 8880
ataagtaaat aagtagacaa ctagactcag gtttgaaaaa accataaaag ccatatagcg 8940
ttttctcatt gaaactgcga acacgatcgt gtgaatgttg cagtttctag ttttgataca 9000
aacaaacaaa aacacaattt aatcttagat taaaaagaaa aaagagaacg gagcccacta 9060
gccactcctt caaacgtgtc ttaccaactc tcttctagaa acaaattagg cttcaccttc 9120
ctcttccaac ctctctctct ctctctctct ctttttctca aaccatctct ccataaagcc 9180
ctaatttctt catcacaaga atcagaagaa gaaagatgga cctgcatcta attttcggtc 9240
caacttgcac aggaaagacg acgaccgcga tagctcttgc ccagcagaca gggcttccag 9300
tcctttcgct tgatcgggtc caatgctgtc ctcaactatc aaccggaagc ggacgaccaa 9360
cagtggaaga actgaaagga acgacgcgtc tctaccttga tgatcggcct ctggtggagg 9420
gtatcatcgc agccaagcaa gctcatcata ggctgatcga ggaggtgtat aatcatgagg 9480
ccaacggcgg gcttattctt gagggaggat ccacctcgtt gctcaactgc atggcgcgaa 9540
acagctattg gagtgcagat tttcgttggc atattattcg ccacaagtta cccgaccaag 9600
agaccttcat gaaagcggcc aaggccagag ttaagcagat gttgcacccc gctgcaggcc 9660
attctattat tcaagagttg gtttatcttt ggaatgaacc tcggctgagg cccattctga 9720
aagagatcga tggatatcga tatgccatgt tgtttgctag ccagaaccag atcacggcag 9780
atatgctatt gcagcttgac gcaaatatgg aaggtaagtt gattaatggg atcgctcagg 9840
agtatttcat ccatgcgcgc caacaggaac agaaattccc ccaagttaac gcagccgctt 9900
tcgacggatt cgaaggtcat ccgttcggaa tgtattagaa atcaccagtc tctctctaca 9960
aatctatctc tctctatttt tctccagaat aatgtgtgag tagttcccag ataagggaat 10020
tagggttctt atagggtttc gctcatgtgt tgagcatata agaaaccctt agtatgtatt 10080
tgtatttgta aaatacttct atcaataaaa tttctaattc ctaaaaccaa aatccagtgt 10140
ttaaacgagt ccatgctcaa caccgtgcac tagggacagg attgaagact cccgcccatc 10200
tcactaggga caggattgcc accccacagt ggggcctaga aagactggag ttgcagacat 10260
taaggatgac cagttcgtaa aggtcctgcg gtgtctattg cttttcatag gttaataagt 10320
gtttgctaga ctgtggtgaa aggcctatcc gaagtaaggc cggccggatc cttcatcttt 10380
ggacaaggga ataaagactc cccacttgct actaagaaca atacctaagt tgcccagaca 10440
tgactgtacc cattcagaga cctaccaccc attagggcta tgacactaac actagcccct 10500
ggaggttgac catgctaggc agtgggggtc tcacctatga cccactcaga taggggttta 10560
aaccagtggg tgggatctca gcctcatata ggtgtttgtg gtgagctttc tcctagacaa 10620
gagaaccctg aagaacagca agaaccagct aatatgatat gtagacatag tgggttgctc 10680
aaattttgtg tttagtcata ttagaattga cctcagtgac cactcagaaa gtgcccaagc 10740
ccatctatag gggccaaagt gctattgact ggtgtgtctg tgaattgttc ctccctacag 10800
agttggtgct gatatatcct agcattcttt ggaaaaccta gctagggact gtcaagtgta 10860
agatacctcc tgaattggag ggaacactag ctgccctgta ccttctggct agtaccttac 10920
accctgaatg ggttaggggg tctattattt gctggaaata taccagtttc agtagggctg 10980
ctgccttagg tcccacaagg tgtaacatgt gctcaatagt tgcactacca catgcacgtg 11040
aacttaatga tgttatagcc acaacaccaa ccttggtttg cagtttgaca tccctctgga 11100
atgggtgtag tcatcttgct ctggatctgc ctgaatcatt ggggctgtat gcagcctggg 11160
cttaaagtga agaatgggat gtcccagaaa tattttgggt gagaagaatc ctggagtaga 11220
tggtgacctg actatccctg tcctatgggc acaatctatc atcagatatt gcattcaaag 11280
ggctatcatg ggatcaagtc ctaagtcaac tgttgtttac ctggcagaca ttcatctagg 11340
agttctcttt tatgccaccc cacagtgatc cgccttttgc agtttatcca ctagggacag 11400
gattgccacc ccacagtggg gcctctatgc ccgggacaag tgtaaaatat agagtatagg 11460
ggttatcatc acagagaagc tattgctgga gggcctctgt tatttcctct ccatgccact 11520
cccattttta acctaccaac tgaaatccca agggagactc caccctgtaa ctagagtcct 11580
cagaggtgag ccatcccata ttaacaaatg ggcattaggg ctaggatgcc aagggatacc 11640
tgaaatggga agttgtgggg ctgagtcctc ctgggaatca gagataatat gtaaacagtt 11700
tgttgagaga ttgatgagag ctgactttga gaggtggcca tgctccctgg tcctcaatag 11760
ggaaggcact acacaagaaa cctgggtttg atcaactgca ctgtgtccta ctcacacatt 11820
gtgtgcctgg aaaaatgtta cttagtattt ggagggcctc cagaaccccc ctgggtgcaa 11880
gactgggtgc tagtgactgg gtgaatgagt cttggacaca gtggccttgt ctaggttgtg 11940
tgaggtggct aggcatcatg gcaatacctc ataattgatg agtgaggaaa caagactaag 12000
tccttgactc ctcttattac atgacctggt ggatattatg tttaaactct gcaagctgga 12060
atgagtactg ggtgcagatc ccctgggatt ctggctacaa aggtgaatga tagctagtct 12120
gtttattagt agccaaaaaa gtcagtgagg ggtgagtgcc ctgggatgtt gttaagttca 12180
cattgcacac ttggagaccc tctccatcca gtaacatacc agagaaaact gaccaagccc 12240
tcatgggtgt atgggaacaa caaacctcct ggctacttca agggcacata acaccagcaa 12300
ggagcctgtc ataaccacca tctcaaacaa tagaacttcc taagtgaagc aatgacttca 12360
aatctacttg aaggcatgga gtataagcca tgttcctttc agaggggact gtacttctgt 12420
agattacttt ccctcattaa ccagatctgg ccggccgcat gcggtcgatc gtgttggcca 12480
ctcttgttta tctatcattc ctcgttggtc cagtcacagt tctaaaagtc tatggtgttc 12540
cttacattgt aagtttcata tatttcttta ttatatcatt gctaatataa tttgtttttg 12600
acataaaagt tttggaaaaa tttcagatct ttgtaatgtg gttggacgct gtcacgtact 12660
tgcatcatca tggtcacgat gataagctgc cttggtacag aggcaaggta agtagatcaa 12720
cattatttat aagaagcaat aatgattagt agttgaataa tctgaatttt tgatgttttt 12780
gtacaataat aggaatggag ttatttacgt ggaggattaa caactgttga tagagattac 12840
gggatcttca acaacattca tcacgatatt ggaactcacg tgatccatca tcttttccca 12900
caaatccctc actatcactt ggtcgatgcc gtgagtgatc tcgctctctc tctagtttca 12960
tttgattata ttaaagggtg attaattact aaattagtga tcttaattaa tgacatgcga 13020
cagacgaaag cagctaaaca tgtgttggga agatactaca gagaaccaaa gacgtcagga 13080
gcaataccga tccacttagt ggaaagtttg gtggcaagta ttaagaaaga tcattacgtc 13140
agtgacactg gtgatattgt cttctacgag acagatccag atctctacgt ttatgcttct 13200
gacaaatcca aaatcaatta atctttcttc ctagctctat ttaggaataa aacactcctt 13260
tggttttact tatttctggt tgtttttaag ttaaaaatgt actcgtgaaa ctttttttta 13320
ttaaatgtat ttacattaca aatcgtaaaa gtttttgttc gttttctcta tgtttttagt 13380
tacaaactta caatcaaaaa ggtcttaaaa actttttgat ggtgggacgg acaaaagaaa 13440
aagttcgact gagagtcgac aa 13462
<210> 84
<211> 13462
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 84
tatatatatt tgttttaatg gcttatttta ttgttaaatg gatacatcag cttgaaatat 60
ctacgaacat gcatcatttt cctagataca tttgtttgtt gctcaaaaaa tgaataacgt 120
agttaaacga gtgagattct tagcatctgc ctcgaaaacg atatgttatt gacaattcca 180
atttcatttt tatgaaaata aaataatagt ttattttata attgggggtg gttgcaggag 240
aataagccat cggacacacc accagaacca tggccatgtt gaaaacgacg agtcttgggt 300
tccggtaatc cccctctcat tatttttttt tctttttttg aaactctttc attttaattt 360
tcttagaatt ctatgtattt attttaatca atcctttttc cagtgtgagg cttggacgac 420
cacttgtcag atttgtcgtt tagctgtagt aaacaactga tttaaattgt ttatggtact 480
gtagttaact ttaacaacgg gccacttata ttcgagccat tggcataaaa tgattcttct 540
cgaaattcgt ttacttttct tagtattttt cagttttgta gtttacgtag aactaataaa 600
aagaaaaaaa cttataaaca caccacatgc aatgaataaa ttcgaatata taaccatact 660
gttaaatatt aattaacatt ttaatcttaa ttttgcattc cagttgccag aaaaattata 720
caagaatttg tcccacagta cacggatgct cagatacact gtccctctcc ccatgctcgc 780
ttaccctctc tatctggtaa atcctaattc ctcatttttc ttcctgatta taattacaat 840
tttgaatttt tagattttga gtattaacta aatataaatt aaatttgttt ggggatgact 900
acagtggtac agaagtcctg gtaaagaagg gtcacattat aacccataca gtagtttatt 960
tgccccaagc gagagaaagc ttattgcaac ttcaactact ggtaccgcct tttgcagttt 1020
atctctatgc ccgggacaag tggagtccat gctcaacacc gtgcaggatg aggatgacca 1080
ccgcggtagc gacttcgtgg gcgaggaaag cctttcgtcc aaggtggtcc ctcctcgcaa 1140
tcttgttgga tggtgaatat tataaaagcc tgcccttctc gcgggtgttt aaacgtcgac 1200
ctgcaggtca acggatcagg atattcttgt ttaagatgtt gaactctatg gaggtttgta 1260
tgaactgatg atctaggacc ggataagttc ccttcttcat agcgaactta ttcaaagaat 1320
gttttgtgta tcattcttgt tacattgtta ttaatgaaaa aatattattg gtcattggac 1380
tgaacacgag tgttaaatat ggaccaggcc ccaaataaga tccattgata tatgaattaa 1440
ataacaagaa taaatcgagt caccaaacca cttgcctttt ttaacgagac ttgttcacca 1500
acttgataca aaagtcatta tcctatgcaa atcaataatc atacaaaaat atccaataac 1560
actaaaaaat taaaagaaat ggataatttc acaatatgtt atacgataaa gaagttactt 1620
ttccaagaaa ttcactgatt ttataagccc acttgcatta gataaatggc aaaaaaaaac 1680
aaaaaggaaa agaaataaag cacgaagaat tctagaaaat acgaaatacg cttcaatgca 1740
gtgggaccca cggttcaatt attgccaatt ttcagctcca ccgtatattt aaaaaataaa 1800
acgataatgc taaaaaaata taaatcgtaa cgatcgttaa atctcaacgg ctggatctta 1860
tgacgaccgt tagaaattgt ggttgtcgac gagtcagtaa taaacggcgt caaagtggtt 1920
gcagccggca cacacgagtc gtgtttatca actcaaagca caaatacttt tcctcaacct 1980
aaaaataagg caattagcca aaaacaactt tgcgtgtaaa caacgctcaa tacacgtgtc 2040
attttattat tagctattgc ttcaccgcct tagctttctc gtgacctagt cgtcctcgtc 2100
ttttcttctt cttcttctat aaaacaatac ccaaagagct cttcttcttc acaattcaga 2160
tttcaatttc tcaaaatctt aaaaactttc tctcaattct ctctaccgtg atcaaggtaa 2220
atttctgtgt tccttattct ctcaaaatct tcgattttgt tttcgttcga tcccaatttc 2280
gtatatgttc tttggtttag attctgttaa tcttagatcg aagacgattt tctgggtttg 2340
atcgttagat atcatcttaa ttctcgatta gggtttcata gatatcatcc gatttgttca 2400
aataatttga gttttgtcga ataattactc ttcgatttgt gatttctatc tagatctggt 2460
gttagtttct agtttgtgcg atcgaatttg tcgattaatc tgagtttttc tgattaacag 2520
atggcttcat ctgagaacgt tatcactgag ttcatgaggt tcaaggtgag gatggaaggt 2580
actgttaacg gacatgagtt cgagatcgag ggtgagggtg aaggtagacc ttacgaggga 2640
cataacaccg ttaagcttaa ggttacaaag ggtggacctc ttcctttcgc ttgggatatc 2700
ctttctcctc aattccaata cggaagcaag gtaagtttgt ggattcttcg tccatgtgat 2760
ctttgagttt ctttagagct tgtgagggat tagtaagtaa caatgcttga gttttttgct 2820
gctgggcttc gaaaagtttg tcacttgttg gtttgatcca caaggtcttc ttctccatag 2880
ctactagaca tgttttagct taagattcaa gtttatatat gccttgtgga ttaatcattg 2940
cctgattctt ccgtgtcatc tctgagttta tttagagctt ggaagtggtg tagtaataac 3000
taacaatact cttgataagt tgtagcaatg ctcttgatta gtggatgtaa tatgatgttg 3060
ataagatata tgaggcacag aaccaaaagt ggtgcttcca ctagacccgt ttttagccta 3120
aggttcaagt ttataccttg tagatgtttc tgtattgtct gattcttccc tgtgatattt 3180
gaatttctta gagctttgga agtgatatag gaacaatgct cttgtgtgtt tgtctctatg 3240
aagattatcg ctgtcgtgtt tcatccgagt gtgcgggatt ttttgctgct gggtttagcc 3300
tttcttcaaa aagttattac ttgttagttt tattgttttg gtcttgataa gagatgttag 3360
gacagacatg gtgcttcttg tctatagcca ctagacctat tttagcataa ggttaacgaa 3420
attctctcta cataccttgt ggatttgttt acattgcctg atctttcctg tgatcgctgt 3480
catgtttctt tggaatgatt gatgtttata aatggaaaaa tctttgtgca gaagactccc 3540
gcccatctct ctatgcccgg gacaagtgcc accccacagt ggggcaggat gaggatgacc 3600
accatggggt cgcagcgtgt gcgtgtccgt cgtacgttct ggccggccgg gccttgggcg 3660
cgcgatcaga agcgttgcgt tggcgtgtgt gtgcttctgg tttgctttaa ttttaccaag 3720
tttgtttcaa ggtggatcgc gtggtcaagg cccgtgtgct ttaaagaccc accggcactg 3780
gcagtgagtg ttgctgcttg tgtaggcttt ggtacgtatg ggctttattt gcttctggat 3840
gttgtgtact acttgggttt gttgaattat tatgagcagt tgcgtattgt aattcagctg 3900
ggctacctgg acattgttat gtattaataa atgctttgct ttcttctaaa gatctttaag 3960
tgctgtttaa acaaccgaca accactttgc ggacttcctt tcaagagaat tcaataaggt 4020
taattcctaa ttgaaatccg aagataagat tcccacacac ttgtggctga tatcaaaagg 4080
ctactgccta tttaaacaca tctctggaga ctgagaaaat cagacctcca agcatgaaga 4140
agcctgagct tactgctact tctgttgaga agttcctcat cgagaagttc gattctgtgt 4200
ctgatcttat gcagctctct gagggtgagg aatcaagagc tttctctttc gatgttggtg 4260
gaagaggata cgttctcaga gttaactctt gcgctgacgg attctacaag gatagatacg 4320
tgtacagaca cttcgcttca gctgctctcc ctatccctga agttcttgat atcggagagt 4380
tctctgagtc tcttacctac tgtatctcaa gaagggctca gggtgttact cttcaagatc 4440
ttcctgagac tgagcttcct gctgttcttc aacctgttgc tgaggctatg gatgctatcg 4500
ctgctgctga tctttctcaa acttctggat tcggaccttt cggtcctcag ggaatcggac 4560
agtacactac ttggagagat ttcatctgcg ctatcgctga tcctcatgtt taccattggc 4620
agaccgttat ggatgatacc gtttctgctt ctgttgctca agctcttgat gagcttatgc 4680
tttgggctga ggattgtcct gaggttagac atcttgttca cgctgatttc ggatctaaca 4740
acgttctcac cgataacgga agaatcaccg ctgttatcga ttggtctgag gctatgttcg 4800
gagattctca atacgaggtg gccaacatat tcttttggag gccttggctt gcttgtatgg 4860
aacaacagac tagatacttc gagagaaggc atcctgagct tgctggatct cctagactta 4920
gagcttacat gcttaggatc ggacttgatc agctttacca gtctctcgtt gatggaaact 4980
tcgatgatgc tgcttgggct cagggaagat gtgatgctat cgttagatct ggtgctggaa 5040
ctgttggaag aactcaaatc gctagaagat ctgctgctgt ttggactgat ggatgtgttg 5100
aagttctcgc tgattctgga aacagaaggc cttctactag acctagagcc aagaagtgaa 5160
gatcggcggc aatagcttct tagcgccatc ccgggttgat cctatctgtg ttgaaatagt 5220
tgcggtgggc aaggctctct ttcagaaaga caggcggcca aaggaaccca aggtgaggtg 5280
ggctatggct ctcagttcct tgtggaagcg cttggtctaa ggtgcagagg tgttagcggg 5340
atgaagcaaa agtgtccgat tgtaacaaga tatgttgatc ctacgtaagg atattaaagt 5400
atgtattcat cactaatata atcagtgtat tccaatatgt actacgattt ccaatgtctt 5460
tattgtcgcc gtatgtaatc ggcgtcacaa aataatcccc ggtgactttc ttttaatcca 5520
ggatgaaata atatgttatt ataatttttg cgatttggtc cgttatagga attgaagtgt 5580
gcttgcggtc gccaccactc ccatttcata attttacatg tatttgaaaa ataaaaattt 5640
atggtattca atttaaacac gtatacttgt aaagaatgat atcttgaaag aaatatagtt 5700
taaatattta ttgataaaat aacaagtcag gtattatagt ccaagcaaaa acataaattt 5760
attgatgcaa gtttaaattc agaaatattt caataactga ttatatcagc tggtacattg 5820
ccgtagatga aagactgagt gcgatattat ggtgtaatac atagtttaaa cgggcccaag 5880
actcccgccc atctctctat gcccgggaca agtgccaccc cacagtgggg caggatgagg 5940
atgaccagtc agttttactt cccttaattt tctatgtact ttcataatta cttatgttat 6000
tttcttcatg agttttaatg caaattacta tatggactct agtgaaaacg ttcagaatcc 6060
tataaacatg actactgaga cgaacttgag agtagttttg atcatacaca cgtttcatgt 6120
ggtacttgag agttactaat ttttgtcatc ttcgtataag tagtaaaaga tactacaaga 6180
atagtttagt agaaaatact agcggtaggt gaagatttgt cgctatgtac tattattgtc 6240
tagtaacttg agtaacaatt tcgtggtcta aatatcaaat aaaaatggat gagtggttca 6300
ccaaatctag gcatcaaaac tattaatgtc attgtctaga tcttaggtga caccacattt 6360
cgaatattta ttggtaattg agatgttaaa gtaccaatat ttgacttaat aaactaaaag 6420
attttggctt tatcaaatgt agacattgat gacatatcgt tgtcattatc ttgagtatat 6480
acaagtcgat caattaggtg aaagtttagt gtctcgtggt tggtaaacga ttaatacagt 6540
agtatatttt atccaaagac aaaatccaaa tcatttcacc agtatgaata gtattatttt 6600
atcttaaaag ctaaaatctt aaaaaccaag gtagcaccca cgttgagcta gacgatcaaa 6660
tcgatttctg ctttgtccaa tttaccaagc tatttaaagc caaataattg aaatataggt 6720
aggtcgttat attaggctaa gatttatctc aaatgcttaa ctaaaggaat aacaagggat 6780
tctagttgtg tggttttata agattggtcc aatttcactt aagtttgttt attgtagaat 6840
tttatatgtg aataatttga attccaattg aaaagatatt atagtaaaag aaaaaatagt 6900
gcgaacaaaa aactttaatc ccataaaaag aaaaagaaaa atgaaaagtt cttctaacat 6960
ccatattttg catcatatca taaagataag aaagatacat atcatagacg tacagataaa 7020
caaacatatc atcatttgtg aaatacatag tacaataatt tgcttttaaa tagagtttaa 7080
gtcacacaca ctgacacaca cgataaaacg ataatgtctg caaaaacact ttaatcccat 7140
tgcctagagg acagcttctc cactttgtct ttaaggttgg ttttgccgtg ttgtttttat 7200
ctttatataa tgatctattt tttggattat gaaatgaatt cacacatttt aattatttaa 7260
gaagatccat atacaggttt ataacagtac taagtgatga ttattttttg tttttgcata 7320
gtttagttta ttgggtaaac attcattacg tgtctcttta tacgaatcac ccatccaaaa 7380
tttcaagtag tcttttagtt catttattat ttcataacta tttgacttat tgatttgaca 7440
agaaacaaca aaagtgttga cttattgata gattgtggga tcataaaagt aattaagcgt 7500
caaccacgac ccacaacaac aaagcacatg ttatacatta atatctcgtt tacttaatta 7560
cagttttcag aatgccgttt catgtcttgt cactggcgat gttattatca tgttggacaa 7620
tattcgactg ttgtcgtttt tacattttcg tattgactaa aactaaaaaa acaaaactct 7680
gtttcaggtt gggcctagga tccacattgt acacacattt gcttaagtct atggaggcgc 7740
aaggttttaa gtctgtggtt gctgttatag gccttccaaa cgatccatct gttaggttgc 7800
atgaggcttt gggatacaca gcccggggta cattgcgcgc agctggatac aagcatggtg 7860
gatggcatga tgttggtttt tggcaaaggg attttgagtt gccagctcct ccaaggccag 7920
ttaggccagt tacccagatc taatatcaaa atctatttag aaatacacaa tattttgttg 7980
caggcttgct ggagaatcga tctgctatca taaaaattac aaaaaaattt tatttgcctc 8040
aattatttta ggattggtat taaggacgct taaattattt gtcgggtcac tacgcatcat 8100
tgtgattgag aagatcagcg atacgaaata ttcgtagtac tatcgataat ttatttgaaa 8160
attcataaga aaagcaaacg ttacatgaat tgatgaaaca atacaaagac agataaagcc 8220
acgcacattt aggatattgg ccgagattac tgaatattga gtaagatcac ggaatttctg 8280
acaggagcat gtcttcaatt cagcccaaat ggcagttgaa atactcaaac cgccccatat 8340
gcaggagcgg atcattcatt gtttgtttgg ttgcctttgc caacatggga gtccaaggtt 8400
gtttaaacat ttaaataccc tgccaagctt gaggtagcct ccaatttgac ggtgccgcca 8460
gcgacgccgt ctggaactgt cctttttgag gaccactccg tttgtggaga tcatgagagt 8520
ccatgctcaa caccgtgcac tagggacagg attgaagact cccgcccatc tcactaggga 8580
caggattgcc accccacagt ggggcctaga aagactggag ttgcagagtt tgtgtcttct 8640
agattaatcc tccaaacttt tgattaacca aaaaaattat caaactaaca tgttctcctt 8700
ttttctttag aaattctaac gaatttatct ttatactgat ttgaatatac ttaatttggt 8760
catttggatg ccctttacaa cctccttacc aaactattga tcacagtttc tattgctaaa 8820
atcaccaaca aaacgcatgt cgccattcat aattatggtt tcacacctac aactaggcta 8880
ataagtaaat aagtagacaa ctagactcag gtttgaaaaa accataaaag ccatatagcg 8940
ttttctcatt gaaactgcga acacgatcgt gtgaatgttg cagtttctag ttttgataca 9000
aacaaacaaa aacacaattt aatcttagat taaaaagaaa aaagagaacg gagcccacta 9060
gccactcctt caaacgtgtc ttaccaactc tcttctagaa acaaattagg cttcaccttc 9120
ctcttccaac ctctctctct ctctctctct ctttttctca aaccatctct ccataaagcc 9180
ctaatttctt catcacaaga atcagaagaa gaaagatgga cctgcatcta attttcggtc 9240
caacttgcac aggaaagacg acgaccgcga tagctcttgc ccagcagaca gggcttccag 9300
tcctttcgct tgatcgggtc caatgctgtc ctcaactatc aaccggaagc ggacgaccaa 9360
cagtggaaga actgaaagga acgacgcgtc tctaccttga tgatcggcct ctggtggagg 9420
gtatcatcgc agccaagcaa gctcatcata ggctgatcga ggaggtgtat aatcatgagg 9480
ccaacggcgg gcttattctt gagggaggat ccacctcgtt gctcaactgc atggcgcgaa 9540
acagctattg gagtgcagat tttcgttggc atattattcg ccacaagtta cccgaccaag 9600
agaccttcat gaaagcggcc aaggccagag ttaagcagat gttgcacccc gctgcaggcc 9660
attctattat tcaagagttg gtttatcttt ggaatgaacc tcggctgagg cccattctga 9720
aagagatcga tggatatcga tatgccatgt tgtttgctag ccagaaccag atcacggcag 9780
atatgctatt gcagcttgac gcaaatatgg aaggtaagtt gattaatggg atcgctcagg 9840
agtatttcat ccatgcgcgc caacaggaac agaaattccc ccaagttaac gcagccgctt 9900
tcgacggatt cgaaggtcat ccgttcggaa tgtattagaa atcaccagtc tctctctaca 9960
aatctatctc tctctatttt tctccagaat aatgtgtgag tagttcccag ataagggaat 10020
tagggttctt atagggtttc gctcatgtgt tgagcatata agaaaccctt agtatgtatt 10080
tgtatttgta aaatacttct atcaataaaa tttctaattc ctaaaaccaa aatccagtgt 10140
ttaaacgagt ccatgctcaa caccgtgcac tagggacagg attgaagact cccgcccatc 10200
tcactaggga caggattgcc accccacagt ggggcctaga aagactggag ttgcagacat 10260
taaggatgac cagttcgtaa aggtcctgcg gtgtctattg cttttcatag gttaataagt 10320
gtttgctaga ctgtggtgaa aggcctatcc gaagtaaggc cggccggatc cttcatcttt 10380
ggacaaggga ataaagactc cccacttgct actaagaaca atacctaagt tgcccagaca 10440
tgactgtacc cattcagaga cctaccaccc attagggcta tgacactaac actagcccct 10500
ggaggttgac catgctaggc agtgggggtc tcacctatga cccactcaga taggggttta 10560
aaccagtggg tgggatctca gcctcatata ggtgtttgtg gtgagctttc tcctagacaa 10620
gagaaccctg aagaacagca agaaccagct aatatgatat gtagacatag tgggttgctc 10680
aaattttgtg tttagtcata ttagaattga cctcagtgac cactcagaaa gtgcccaagc 10740
ccatctatag gggccaaagt gctattgact ggtgtgtctg tgaattgttc ctccctacag 10800
agttggtgct gatatatcct agcattcttt ggaaaaccta gctagggact gtcaagtgta 10860
agatacctcc tgaattggag ggaacactag ctgccctgta ccttctggct agtaccttac 10920
accctgaatg ggttaggggg tctattattt gctggaaata taccagtttc agtagggctg 10980
ctgccttagg tcccacaagg tgtaacatgt gctcaatagt tgcactacca catgcacgtg 11040
aacttaatga tgttatagcc acaacaccaa ccttggtttg cagtttgaca tccctctgga 11100
atgggtgtag tcatcttgct ctggatctgc ctgaatcatt ggggctgtat gcagcctggg 11160
cttaaagtga agaatgggat gtcccagaaa tattttgggt gagaagaatc ctggagtaga 11220
tggtgacctg actatccctg tcctatgggc acaatctatc atcagatatt gcattcaaag 11280
ggctatcatg ggatcaagtc ctaagtcaac tgttgtttac ctggcagaca ttcatctagg 11340
agttctcttt tatgccaccc cacagtgatc cgccttttgc agtttatcca ctagggacag 11400
gattgccacc ccacagtggg gcctctatgc ccgggacaag tgtaaaatat agagtatagg 11460
ggttatcatc acagagaagc tattgctgga gggcctctgt tatttcctct ccatgccact 11520
cccattttta acctaccaac tgaaatccca agggagactc caccctgtaa ctagagtcct 11580
cagaggtgag ccatcccata ttaacaaatg ggcattaggg ctaggatgcc aagggatacc 11640
tgaaatggga agttgtgggg ctgagtcctc ctgggaatca gagataatat gtaaacagtt 11700
tgttgagaga ttgatgagag ctgactttga gaggtggcca tgctccctgg tcctcaatag 11760
ggaaggcact acacaagaaa cctgggtttg atcaactgca ctgtgtccta ctcacacatt 11820
gtgtgcctgg aaaaatgtta cttagtattt ggagggcctc cagaaccccc ctgggtgcaa 11880
gactgggtgc tagtgactgg gtgaatgagt cttggacaca gtggccttgt ctaggttgtg 11940
tgaggtggct aggcatcatg gcaatacctc ataattgatg agtgaggaaa caagactaag 12000
tccttgactc ctcttattac atgacctggt ggatattatg tttaaactct gcaagctgga 12060
atgagtactg ggtgcagatc ccctgggatt ctggctacaa aggtgaatga tagctagtct 12120
gtttattagt agccaaaaaa gtcagtgagg ggtgagtgcc ctgggatgtt gttaagttca 12180
cattgcacac ttggagaccc tctccatcca gtaacatacc agagaaaact gaccaagccc 12240
tcatgggtgt atgggaacaa caaacctcct ggctacttca agggcacata acaccagcaa 12300
ggagcctgtc ataaccacca tctcaaacaa tagaacttcc taagtgaagc aatgacttca 12360
aatctacttg aaggcatgga gtataagcca tgttcctttc agaggggact gtacttctgt 12420
agattacttt ccctcattaa ccagatctgg ccggccgcat gcggtcgatc atgttggcca 12480
ctcttgttta tctatcattc ctcgttggtc cagtcacagt tctaaaagtc tatggtgttc 12540
cttacattgt aagtttcata tatttcatta ttatatcatt gctaatataa tttgtttttg 12600
acataaagtt ttggaaaaat ttcagatctt tgtaatgtgg ttggacgctg tcacgtactt 12660
gcatcatcat ggtcacgatg ataagttgcc ttggtacaga ggcaaggtaa gtagatcaac 12720
attaatttat aagaagcaac aatgattagt atttgattaa tctaaattat tgatgttttg 12780
tgtacaataa taggaatgga gttatttacg tggaggatta acaactattg atagagatta 12840
cgggatcttc aacaacattc atcacgatat tggaactcac gtgatccatc atcttttccc 12900
acaaatccct cactatcact tggttgatgc cgtgagtgat ctcgctctct ctctagtttc 12960
atttgattaa aattaaaggg tgattaatta ctaaattagt gatcttaatt aatgatatgc 13020
gacagacgaa atcagctaaa catgtgttgg gaagatacta cagagaacca aagacgtcag 13080
gagcaatacc gatccacttg gtggaaagtt tggtggcaag tattaagaaa gatcattacg 13140
tcagtgacac tggtgatatt gtcttctacg agacagatcc agatctctac gtttatgctt 13200
ctgacaaatc caaaatcaac taacctttct tcctagctct atttaggaat aaaacagtcc 13260
tttggttttt acttatttct ggttgttttt aagttaaatg tactcgtgaa acttttttta 13320
attaaatgta tttacattac aaatcaagtt tttgttcgtt ttctttatgt ttttagttac 13380
aataaataaa ggtcttaaaa actttttgtt ggtggggaca aaagaaaaag ttcgactgag 13440
agagtcgaca aaatgcacgc cg 13462
<210> 85
<211> 5521
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 85
tggcaggata tattgtggtg taaacaaatt gacgcttaga caacttaata acacattgcg 60
gacgttttta atgtactgaa ttaacgccga attgaattcg agctcggtac cggggacaac 120
tttgtataga aaagttgggt ggtttaaact atgtattaca ccataatatc gcactcagtc 180
tttcatctac ggcaatgtac cagctgatat aatcagttat tgaaatattt ctgaatttaa 240
acttgcatca ataaatttat gtttttgctt ggactataat acctgacttg ttattttatc 300
aataaatatt taaactatat ttctttcaag atatcattct ttacaagtat acgtgtttaa 360
attgaatacc ataaattttt atttttcaaa tacatgtaaa attatgaaat gggagtggtg 420
gcgaccgcaa gcacacttca attcctataa cggaccaaat cgcaaaaatt ataataacat 480
attatttcat cctggattaa aagaaagtca ccggggatta ttttgtgacg ccgattacat 540
acggcgacaa taaagacatt ggaaatcgta gtacatattg gaatacactg attatattag 600
tgatgaatac atactttaat atccttacgt aggatcaaca tatcttgtta caatcggaca 660
cttttgcttc atcccgctaa cacctctgca ccttagacca agcgcttcca caaggaactg 720
agagccatag cccacctcac cttgggttcc tttggccgcc tgtctttctg aaagagagcc 780
ttgcccaccg caactatttc aacacagata ggatcaaccc gggatggcgc taagaagcta 840
ttgccgccga tcttcacttc ttggctctag gtctagtaga aggccttctg tttccagaat 900
cagcgagaac ttcaacacat ccatcagtcc aaacagcagc agatcttcta gcgatttgag 960
ttcttccaac agttccagca ccagatctaa cgatagcatc acatcttccc tgagcccaag 1020
cagcatcatc gaagtttcca tcaacgagag actggtaaag ctgatcaagt ccgatcctaa 1080
gcatgtaagc tctaagtcta ggagatccag caagctcagg atgccttctc tcgaagtatc 1140
tagtctgttg ttccatacaa gcaagccaag gcctccaaaa gaatatgttg gccacctcgt 1200
attgagaatc tccgaacata gcctcagacc aatcgataac agcggtgatt cttccgttat 1260
cggtgagaac gttgttagat ccgaaatcag cgtgaacaag atgtctaacc tcaggacaat 1320
cctcagccca aagcataagc tcatcaagag cttgagcaac agaagcagaa acggtatcat 1380
ccataacggt ctgccaatgg taaacatgag gatcagcgat agcgcagatg aaatctctcc 1440
aagtagtgta ctgtccgatt ccctgaggac cgaaaggtcc gaatccagaa gtttgagaaa 1500
gatcagcagc agcgatagca tccatagcct cagcaacagg ttgaagaaca gcaggaagct 1560
cagtctcagg aagatcttga agagtaacac cctgagccct tcttgagata cagtaggtaa 1620
gagactcaga gaactctccg atatcaagaa cttcagggat agggagagca gctgaagcga 1680
agtgtctgta cacgtatcta tccttgtaga atccgtcagc gcaagagtta actctgagaa 1740
cgtatcctct tccaccaaca tcgaaagaga aagctcttga ttcctcaccc tcagagagct 1800
gcataagatc agacacagaa tcgaacttct cgatgaggaa cttctcaaca gaagtagcag 1860
taagctcagg cttcttcatg cttggaggtc tgattttctc agtctccaga gatgtgttta 1920
aataggcagt agccttttga tatcagccac aagtgtgtgg gaatcttatc ttcggatttc 1980
aattaggaat taaccttatt gaattctctt gaaaggaagt ccgcaaagtg gttgtcggtt 2040
gtttaaacca acttttgtat acaaagttgt cccctctaga gtcgacctgc aggcatgcaa 2100
gcttagcttg agcttggatc agattgtcgt ttcccgcctt cagtttatca caagtttgta 2160
caaaaaagca ggctgtcgac ctgcaggtca acggatcagg atattcttgt ttaagatgtt 2220
gaactctatg gaggtttgta tgaactgatg atctaggacc ggataagttc ccttcttcat 2280
agcgaactta ttcaaagaat gttttgtgta tcattcttgt tacattgtta ttaatgaaaa 2340
aatattattg gtcattggac tgaacacgag tgttaaatat ggaccaggcc ccaaataaga 2400
tccattgata tatgaattaa ataacaagaa taaatcgagt caccaaacca cttgcctttt 2460
ttaacgagac ttgttcacca acttgataca aaagtcatta tcctatgcaa atcaataatc 2520
atacaaaaat atccaataac actaaaaaat taaaagaaat ggataatttc acaatatgtt 2580
atacgataaa gaagttactt ttccaagaaa ttcactgatt ttataagccc acttgcatta 2640
gataaatggc aaaaaaaaac aaaaaggaaa agaaataaag cacgaagaat tctagaaaat 2700
acgaaatacg cttcaatgca gtgggaccca cggttcaatt attgccaatt ttcagctcca 2760
ccgtatattt aaaaaataaa acgataatgc taaaaaaata taaatcgtaa cgatcgttaa 2820
atctcaacgg ctggatctta tgacgaccgt tagaaattgt ggttgtcgac gagtcagtaa 2880
taaacggcgt caaagtggtt gcagccggca cacacgagtc gtgtttatca actcaaagca 2940
caaatacttt tcctcaacct aaaaataagg caattagcca aaaacaactt tgcgtgtaaa 3000
caacgctcaa tacacgtgtc attttattat tagctattgc ttcaccgcct tagctttctc 3060
gtgacctagt cgtcctcgtc ttttcttctt cttcttctat aaaacaatac ccaaagagct 3120
cttcttcttc acaattcaga tttcaatttc tcaaaatctt aaaaactttc tctcaattct 3180
ctctaccgtg atcaaggtaa atttctgtgt tccttattct ctcaaaatct tcgattttgt 3240
tttcgttcga tcccaatttc gtatatgttc tttggtttag attctgttaa tcttagatcg 3300
aagacgattt tctgggtttg atcgttagat atcatcttaa ttctcgatta gggtttcata 3360
gatatcatcc gatttgttca aataatttga gttttgtcga ataattactc ttcgatttgt 3420
gatttctatc tagatctggt gttagtttct agtttgtgcg atcgaatttg tcgattaatc 3480
tgagtttttc tgattaacag atggcttcat ctgagaacgt tatcactgag ttcatgaggt 3540
tcaaggtgag gatggaaggt actgttaacg gacatgagtt cgagatcgag ggtgagggtg 3600
aaggtagacc ttacgaggga cataacaccg ttaagcttaa ggttacaaag ggtggacctc 3660
ttcctttcgc ttgggatatc ctttctcctc aattccaata cggaagcaag gtaagtttgt 3720
ggattcttcg tccatgtgat ctttgagttt ctttagagct tgtgagggat tagtaagtaa 3780
caatgcttga gttttttgct gctgggcttc gaaaagtttg tcacttgttg gtttgatcca 3840
caaggtcttc ttctccatag ctactagaca tgttttagct taagattcaa gtttatatat 3900
gccttgtgga ttaatcattg cctgattctt ccgtgtcatc tctgagttta tttagagctt 3960
ggaagtggtg tagtaataac taacaatact cttgataagt tgtagcaatg ctcttgatta 4020
gtggatgtaa tatgatgttg ataagatata tgaggcacag aaccaaaagt ggtgcttcca 4080
ctagacccgt ttttagccta aggttcaagt ttataccttg tagatgtttc tgtattgtct 4140
gattcttccc tgtgatattt gaatttctta gagctttgga agtgatatag gaacaatgct 4200
cttgtgtgtt tgtctctatg aagattatcg ctgtcgtgtt tcatccgagt gtgcgggatt 4260
ttttgctgct gggtttagcc tttcttcaaa aagttattac ttgttagttt tattgttttg 4320
gtcttgataa gagatgttag gacagacatg gtgcttcttg tctatagcca ctagacctat 4380
tttagcataa ggttaacgaa attctctcta cataccttgt ggatttgttt acattgcctg 4440
atctttcctg tgatcgctgt catgtttctt tggaatgatt gatgtttata aatggaaaaa 4500
tctttgtgca ggtttacgtt aagcaccctg ctgatatccc tgattacaag aagctttcat 4560
tccctgaggg attcaagtgg gagagagtta tgaacttcga ggatggtggt gttgctactg 4620
ttactcagga ttcttcactt caggacggat gcttcatcta caaggttaag ttcatcggag 4680
tgaacttccc ttctgatgga cctgttatgc agaaaaagac tatgggatgg gaggcttcta 4740
ccgagagact ttaccctaga gatggtgttc ttaagggtga gactcacaag gctcttaagc 4800
ttaaagatgg tggacactac ctcgtcgagt tcaagtctat ctacatggct aagaagcctg 4860
ttcagcttcc tggttactac tacgttgacg ctaagcttga tatcacctct cacaacgagg 4920
actacactat cgttgagcaa tacgagagaa ctgagggtag acatcacttg ttcctctgat 4980
atcaaaatct atttagaaat acacaatatt ttgttgcagg cttgctggag aatcgatctg 5040
ctatcataaa aattacaaaa aaattttatt tgcctcaatt attttaggat tggtattaag 5100
gacgcttaaa ttatttgtcg ggtcactacg catcattgtg attgagaaga tcagcgatac 5160
gaaatattcg tagtactatc gataatttat ttgaaaattc ataagaaaag caaacgttac 5220
atgaattgat gaaacaatac aaagacagat aaagccacgc acatttagga tattggccga 5280
gattactgaa tattgagtaa gatcacggaa tttctgacag gagcatgtct tcaattcagc 5340
ccaaatggca gttgaaatac tcaaaccgcc ccatatgcag gagcggatca ttcattgttt 5400
gtttggttgc ctttgccaac atgggagtcc aaggtttacc cagctttctt gtacaaagtg 5460
gtgataaact atcagtgttt gacaggatat attggcgggt aaacctaaga gaaaagagcg 5520
t 5521
<210> 86
<211> 11708
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 86
tggcaggata tattgtggtg taaacaaatt gacgcttaga caacttaata acacattgcg 60
gacgttttta atgtactgaa ttaacgccga attgaattcg agctcggtac ccggggatcc 120
tctagagtcg acctgcaggc atgcaagctt agcttgagct tggatcagat tgtcgtttcc 180
cgccttcagt ttatcacaag tttgtacaaa aaagcaggcg ccttttgcag tttatctcta 240
tgcccgggac aagtggagtc catgctcaac accgtgcagg atgaggatga ccatagcgac 300
ttcgtgggcg aggaaagcct ttcgtccaag gtggtccctc ctcgcaatct tgttggatgg 360
tgaatattat aaaagcctgc ccttctcgcg ggtgtttaaa cgtcgacctg caggtcaacg 420
gatcaggata ttcttgttta agatgttgaa ctctatggag gtttgtatga actgatgatc 480
taggaccgga taagttccct tcttcatagc gaacttattc aaagaatgtt ttgtgtatca 540
ttcttgttac attgttatta atgaaaaaat attattggtc attggactga acacgagtgt 600
taaatatgga ccaggcccca aataagatcc attgatatat gaattaaata acaagaataa 660
atcgagtcac caaaccactt gcctttttta acgagacttg ttcaccaact tgatacaaaa 720
gtcattatcc tatgcaaatc aataatcata caaaaatatc caataacact aaaaaattaa 780
aagaaatgga taatttcaca atatgttata cgataaagaa gttacttttc caagaaattc 840
actgatttta taagcccact tgcattagat aaatggcaaa aaaaaacaaa aaggaaaaga 900
aataaagcac gaagaattct agaaaatacg aaatacgctt caatgcagtg ggacccacgg 960
ttcaattatt gccaattttc agctccaccg tatatttaaa aaataaaacg ataatgctaa 1020
aaaaatataa atcgtaacga tcgttaaatc tcaacggctg gatcttatga cgaccgttag 1080
aaattgtggt tgtcgacgag tcagtaataa acggcgtcaa agtggttgca gccggcacac 1140
acgagtcgtg tttatcaact caaagcacaa atacttttcc tcaacctaaa aataaggcaa 1200
ttagccaaaa acaactttgc gtgtaaacaa cgctcaatac acgtgtcatt ttattattag 1260
ctattgcttc accgccttag ctttctcgtg acctagtcgt cctcgtcttt tcttcttctt 1320
cttctataaa acaataccca aagagctctt cttcttcaca attcagattt caatttctca 1380
aaatcttaaa aactttctct caattctctc taccgtgatc aaggtaaatt tctgtgttcc 1440
ttattctctc aaaatcttcg attttgtttt cgttcgatcc caatttcgta tatgttcttt 1500
ggtttagatt ctgttaatct tagatcgaag acgattttct gggtttgatc gttagatatc 1560
atcttaattc tcgattaggg tttcatagat atcatccgat ttgttcaaat aatttgagtt 1620
ttgtcgaata attactcttc gatttgtgat ttctatctag atctggtgtt agtttctagt 1680
ttgtgcgatc gaatttgtcg attaatctga gtttttctga ttaacagatg gcttcatctg 1740
agaacgttat cactgagttc atgaggttca aggtgaggat ggaaggtact gttaacggac 1800
atgagttcga gatcgagggt gagggtgaag gtagacctta cgagggacat aacaccgtta 1860
agcttaaggt tacaaagggt ggacctcttc ctttcgcttg ggatatcctt tctcctcaat 1920
tccaatacgg aagcaaggta agtttgtgga ttcttcgtcc atgtgatctt tgagtttctt 1980
tagagcttgt gagggattag taagtaacaa tgcttgagtt ttttgctgct gggcttcgaa 2040
aagtttgtca cttgttggtt tgatccacaa ggtcttcttc tccatagcta ctagacatgt 2100
tttagcttaa gattcaagtt tatatatgcc ttgtggatta atcattgcct gattcttccg 2160
tgtcatctct gagtttattt agagcttgga agtggtgtag taataactaa caatactctt 2220
gataagttgt agcaatgctc ttgattagtg gatgtaatat gatgttgata agatatatga 2280
ggcacagaac caaaagtggt gcttccacta gacccgtttt tagcctaagg ttcaagttta 2340
taccttgtag atgtttctgt attgtctgat tcttccctgt gatatttgaa tttcttagag 2400
ctttggaagt gatataggaa caatgctctt gtgtgtttgt ctctatgaag attatcgctg 2460
tcgtgtttca tccgagtgtg cgggattttt tgctgctggg tttagccttt cttcaaaaag 2520
ttattacttg ttagttttat tgttttggtc ttgataagag atgttaggac agacatggtg 2580
cttcttgtct atagccacta gacctatttt agcataaggt taacgaaatt ctctctacat 2640
accttgtgga tttgtttaca ttgcctgatc tttcctgtga tcgctgtcat gtttctttgg 2700
aatgattgat gtttataaat ggaaaaatct ttgtgcagaa gactcccgcc catccaggat 2760
gaggatgacc accaccccac agtggggcag gatgaggatg accaggtcgc agcgtgtgcg 2820
tgtccgtcgt acgttctggc cggccgggcc ttgggcgcgc gatcagaagc gttgcgttgg 2880
cgtgtgtgtg cttctggttt gctttaattt taccaagttt gtttcaaggt ggatcgcgtg 2940
gtcaaggccc gtgtgcttta aagacccacc ggcactggca gtgagtgttg ctgcttgtgt 3000
aggctttggt acgtatgggc tttatttgct tctggatgtt gtgtactact tgggtttgtt 3060
gaattattat gagcagttgc gtattgtaat tcagctgggc tacctggaca ttgttatgta 3120
ttaataaatg ctttgctttc ttctaaagat ctttaagtgc tacaactttg tatacaaaag 3180
ttggtttaaa caaccgacaa ccactttgcg gacttccttt caagagaatt caataaggtt 3240
aattcctaat tgaaatccga agataagatt cccacacact tgtggctgat atcaaaaggc 3300
tactgcctat ttaaacacat ctctggagac tgagaaaatc agacctccaa gcatgaagaa 3360
gcctgagctt actgctactt ctgttgagaa gttcctcatc gagaagttcg attctgtgtc 3420
tgatcttatg cagctctctg agggtgagga atcaagagct ttctctttcg atgttggtgg 3480
aagaggatac gttctcagag ttaactcttg cgctgacgga ttctacaagg atagatacgt 3540
gtacagacac ttcgcttcag ctgctctccc tatccctgaa gttcttgata tcggagagtt 3600
ctctgagtct cttacctact gtatctcaag aagggctcag ggtgttactc ttcaagatct 3660
tcctgagact gagcttcctg ctgttcttca acctgttgct gaggctatgg atgctatcgc 3720
tgctgctgat ctttctcaaa cttctggatt cggacctttc ggtcctcagg gaatcggaca 3780
gtacactact tggagagatt tcatctgcgc tatcgctgat cctcatgttt accattggca 3840
gaccgttatg gatgataccg tttctgcttc tgttgctcaa gctcttgatg agcttatgct 3900
ttgggctgag gattgtcctg aggttagaca tcttgttcac gctgatttcg gatctaacaa 3960
cgttctcacc gataacggaa gaatcaccgc tgttatcgat tggtctgagg ctatgttcgg 4020
agattctcaa tacgaggtgg ccaacatatt cttttggagg ccttggcttg cttgtatgga 4080
acaacagact agatacttcg agagaaggca tcctgagctt gctggatctc ctagacttag 4140
agcttacatg cttaggatcg gacttgatca gctttaccag tctctcgttg atggaaactt 4200
cgatgatgct gcttgggctc agggaagatg tgatgctatc gttagatctg gtgctggaac 4260
tgttggaaga actcaaatcg ctagaagatc tgctgctgtt tggactgatg gatgtgttga 4320
agttctcgct gattctggaa acagaaggcc ttctactaga cctagagcca agaagtgaag 4380
atcggcggca atagcttctt agcgccatcc cgggttgatc ctatctgtgt tgaaatagtt 4440
gcggtgggca aggctctctt tcagaaagac aggcggccaa aggaacccaa ggtgaggtgg 4500
gctatggctc tcagttcctt gtggaagcgc ttggtctaag gtgcagaggt gttagcggga 4560
tgaagcaaaa gtgtccgatt gtaacaagat atgttgatcc tacgtaagga tattaaagta 4620
tgtattcatc actaatataa tcagtgtatt ccaatatgta ctacgatttc caatgtcttt 4680
attgtcgccg tatgtaatcg gcgtcacaaa ataatccccg gtgactttct tttaatccag 4740
gatgaaataa tatgttatta taatttttgc gatttggtcc gttataggaa ttgaagtgtg 4800
cttgcggtcg ccaccactcc catttcataa ttttacatgt atttgaaaaa taaaaattta 4860
tggtattcaa tttaaacacg tatacttgta aagaatgata tcttgaaaga aatatagttt 4920
aaatatttat tgataaaata acaagtcagg tattatagtc caagcaaaaa cataaattta 4980
ttgatgcaag tttaaattca gaaatatttc aataactgat tatatcagct ggtacattgc 5040
cgtagatgaa agactgagtg cgatattatg gtgtaataca tagtttaaac cacccaactt 5100
ttctatacaa agttgaagac tcccgcccat ccaggatgag gatgaccacc accccacagt 5160
ggggcaggat gaggatgacc agtcagtttt acttccctta attttctatg tactttcata 5220
attacttatg ttattttctt catgagtttt aatgcaaatt actatatgga ctctagtgaa 5280
aacgttcaga atcctataaa catgactact gagacgaact tgagagtagt tttgatcata 5340
cacacgtttc atgtggtact tgagagttac taatttttgt catcttcgta taagtagtaa 5400
aagatactac aagaatagtt tagtagaaaa tactagcggt aggtgaagat ttgtcgctat 5460
gtactattat tgtctagtaa cttgagtaac aatttcgtgg tctaaatatc aaataaaaat 5520
ggatgagtgg ttcaccaaat ctaggcatca aaactattaa tgtcattgtc tagatcttag 5580
gtgacaccac atttcgaata tttattggta attgagatgt taaagtacca atatttgact 5640
taataaacta aaagattttg gctttatcaa atgtagacat tgatgacata tcgttgtcat 5700
tatcttgagt atatacaagt cgatcaatta ggtgaaagtt tagtgtctcg tggttggtaa 5760
acgattaata cagtagtata ttttatccaa agacaaaatc caaatcattt caccagtatg 5820
aatagtatta ttttatctta aaagctaaaa tcttaaaaac caaggtagca cccacgttga 5880
gctagacgat caaatcgatt tctgctttgt ccaatttacc aagctattta aagccaaata 5940
attgaaatat aggtaggtcg ttatattagg ctaagattta tctcaaatgc ttaactaaag 6000
gaataacaag ggattctagt tgtgtggttt tataagattg gtccaatttc acttaagttt 6060
gtttattgta gaattttata tgtgaataat ttgaattcca attgaaaaga tattatagta 6120
aaagaaaaaa tagtgcgaac aaaaaacttt aatcccataa aaagaaaaag aaaaatgaaa 6180
agttcttcta acatccatat tttgcatcat atcataaaga taagaaagat acatatcata 6240
gacgtacaga taaacaaaca tatcatcatt tgtgaaatac atagtacaat aatttgcttt 6300
taaatagagt ttaagtcaca cacactgaca cacacgataa aacgataatg tctgcaaaaa 6360
cactttaatc ccattgccta gaggacagct tctccacttt gtctttaagg ttggttttgc 6420
cgtgttgttt ttatctttat ataatgatct attttttgga ttatgaaatg aattcacaca 6480
ttttaattat ttaagaagat ccatatacag gtttataaca gtactaagtg atgattattt 6540
tttgtttttg catagtttag tttattgggt aaacattcat tacgtgtctc tttatacgaa 6600
tcacccatcc aaaatttcaa gtagtctttt agttcattta ttatttcata actatttgac 6660
ttattgattt gacaagaaac aacaaaagtg ttgacttatt gatagattgt gggatcataa 6720
aagtaattaa gcgtcaacca cgacccacaa caacaaagca catgttatac attaatatct 6780
cgtttactta attacagttt tcagaatgcc gtttcatgtc ttgtcactgg cgatgttatt 6840
atcatgttgg acaatattcg actgttgtcg tttttacatt ttcgtattga ctaaaactaa 6900
aaaaacaaaa ctctgtttca ggttgggcct aggatccaca ttgtacacac atttgcttaa 6960
gtctatggag gcgcaaggtt ttaagtctgt ggttgctgtt ataggccttc caaacgatcc 7020
atctgttagg ttgcatgagg ctttgggata cacagcccgg ggtacattgc gcgcagctgg 7080
atacaagcat ggtggatggc atgatgttgg tttttggcaa agggattttg agttgccagc 7140
tcctccaagg ccagttaggc cagttaccca gatctaatat caaaatctat ttagaaatac 7200
acaatatttt gttgcaggct tgctggagaa tcgatctgct atcataaaaa ttacaaaaaa 7260
attttatttg cctcaattat tttaggattg gtattaagga cgcttaaatt atttgtcggg 7320
tcactacgca tcattgtgat tgagaagatc agcgatacga aatattcgta gtactatcga 7380
taatttattt gaaaattcat aagaaaagca aacgttacat gaattgatga aacaatacaa 7440
agacagataa agccacgcac atttaggata ttggccgaga ttactgaata ttgagtaaga 7500
tcacggaatt tctgacagga gcatgtcttc aattcagccc aaatggcagt tgaaatactc 7560
aaaccgcccc atatgcagga gcggatcatt cattgtttgt ttggttgcct ttgccaacat 7620
gggagtccaa ggttatttaa ataccctgcc aagcttgagg tagcctccaa tttgacggtg 7680
ccgccagcga cgccgtctgg aactgtcctt tttgaggacc actccgtttg tggagatcat 7740
gaacaacttt gtataataaa gttgaagact cccgcccatc tctctatgcc cgggacaagt 7800
ggagtccatg ctcaacaccg tgcactaggg acaggattgg tttaaacgtt tgtgtcttct 7860
agattaatcc tccaaacttt tgattaacca aaaaaattat caaactaaca tgttctcctt 7920
ttttctttag aaattctaac gaatttatct ttatactgat ttgaatatac ttaatttggt 7980
catttggatg ccctttacaa cctccttacc aaactattga tcacagtttc tattgctaaa 8040
atcaccaaca aaacgcatgt cgccattcat aattatggtt tcacacctac aactaggcta 8100
ataagtaaat aagtagacaa ctagactcag gtttgaaaaa accataaaag ccatatagcg 8160
ttttctcatt gaaactgcga acacgatcgt gtgaatgttg cagtttctag ttttgataca 8220
aacaaacaaa aacacaattt aatcttagat taaaaagaaa aaagagaacg gagcccacta 8280
gccactcctt caaacgtgtc ttaccaactc tcttctagaa acaaattagg cttcaccttc 8340
ctcttccaac ctctctctct ctctctctct ctttttctca aaccatctct ccataaagcc 8400
ctaatttctt catcacaaga atcagaagaa gaaagatgga cctgcatcta attttcggtc 8460
caacttgcac aggaaagacg acgaccgcga tagctcttgc ccagcagaca gggcttccag 8520
tcctttcgct tgatcgggtc caatgctgtc ctcaactatc aaccggaagc ggacgaccaa 8580
cagtggaaga actgaaagga acgacgcgtc tctaccttga tgatcggcct ctggtggagg 8640
gtatcatcgc agccaagcaa gctcatcata ggctgatcga ggaggtgtat aatcatgagg 8700
ccaacggcgg gcttattctt gagggaggat ccacctcgtt gctcaactgc atggcgcgaa 8760
acagctattg gagtgcagat tttcgttggc atattattcg ccacaagtta cccgaccaag 8820
agaccttcat gaaagcggcc aaggccagag ttaagcagat gttgcacccc gctgcaggcc 8880
attctattat tcaagagttg gtttatcttt ggaatgaacc tcggctgagg cccattctga 8940
aagagatcga tggatatcga tatgccatgt tgtttgctag ccagaaccag atcacggcag 9000
atatgctatt gcagcttgac gcaaatatgg aaggtaagtt gattaatggg atcgctcagg 9060
agtatttcat ccatgcgcgc caacaggaac agaaattccc ccaagttaac gcagccgctt 9120
tcgacggatt cgaaggtcat ccgttcggaa tgtattagaa atcaccagtc tctctctaca 9180
aatctatctc tctctatttt tctccagaat aatgtgtgag tagttcccag ataagggaat 9240
tagggttctt atagggtttc gctcatgtgt tgagcatata agaaaccctt agtatgtatt 9300
tgtatttgta aaatacttct atcaataaaa tttctaattc ctaaaaccaa aatccagtgt 9360
ttaaacaaga ctcccgccca tctctctatg cccgggacaa gtggagtcca tgctcaacac 9420
cgtgcactag ggacaggatt gcattaagga tgaccagttc gtaaaggtcc tgcggtgtct 9480
attgcttttc ataggttaat aagtgtttgc tagactgtgg tgaaaggcct atccgaagta 9540
aggccggccg gatccttcat ctttggacaa gggaataaag actccccact tgctactaag 9600
aacaatacct aagttgccca gacatgactg tacccattca gagacctacc acccattagg 9660
gctatgacac taacactagc ccctggaggt tgaccatgct aggcagtggg ggtctcacct 9720
atgacccact cagatagggg tttaaaccag tgggtgggat ctcagcctca tataggtgtt 9780
tgtggtgagc tttctcctag acaagagaac cctgaagaac agcaagaacc agctaatatg 9840
atatgtagac atagtgggtt gctcaaattt tgtgtttagt catattagaa ttgacctcag 9900
tgaccactca gaaagtgccc aagcccatct ataggggcca aagtgctatt gactggtgtg 9960
tctgtgaatt gttcctccct acagagttgg tgctgatata tcctagcatt ctttggaaaa 10020
cctagctagg gactgtcaag tgtaagatac ctcctgaatt ggagggaaca ctagctgccc 10080
tgtaccttct ggctagtacc ttacaccctg aatgggttag ggggtctatt atttgctgga 10140
aatataccag tttcagtagg gctgctgcct taggtcccac aaggtgtaac atgtgctcaa 10200
tagttgcact accacatgca cgtgaactta atgatgttat agccacaaca ccaaccttgg 10260
tttgcagttt gacatccctc tggaatgggt gtagtcatct tgctctggat ctgcctgaat 10320
cattggggct gtatgcagcc tgggcttaaa gtgaagaatg ggatgtccca gaaatatttt 10380
gggtgagaag aatcctggag tagatggtga cctgactatc cctgtcctat gggcacaatc 10440
tatcatcaga tattgcattc aaagggctat catgggatca agtcctaagt caactgttgt 10500
ttacctggca gacattcatc taggagttct cttttatgcc accccacagt gatccgcctt 10560
ttgcagttta tccactaggg acaggattgc caccccacag tggggcctct atgcccggga 10620
caagtgtaaa atatagagta taggggttat catcacagag aagctattgc tggagggcct 10680
ctgttatttc ctctccatgc cactcccatt tttaacctac caactgaaat cccaagggag 10740
actccaccct gtaactagag tcctcagagg tgagccatcc catattaaca aatgggcatt 10800
agggctagga tgccaaggga tacctgaaat gggaagttgt ggggctgagt cctcctggga 10860
atcagagata atatgtaaac agtttgttga gagattgatg agagctgact ttgagaggtg 10920
gccatgctcc ctggtcctca atagggaagg cactacacaa gaaacctggg tttgatcaac 10980
tgcactgtgt cctactcaca cattgtgtgc ctggaaaaat gttacttagt atttggaggg 11040
cctccagaac ccccctgggt gcaagactgg gtgctagtga ctgggtgaat gagtcttgga 11100
cacagtggcc ttgtctaggt tgtgtgaggt ggctaggcat catggcaata cctcataatt 11160
gatgagtgag gaaacaagac taagtccttg actcctctta ttacatgacc tggtggatat 11220
tatgtttaaa ctctgcaagc tggaatgagt actgggtgca gatcccctgg gattctggct 11280
acaaaggtga atgatagcta gtctgtttat tagtagccaa aaaagtcagt gaggggtgag 11340
tgccctggga tgttgttaag ttcacattgc acacttggag accctctcca tccagtaaca 11400
taccagagaa aactgaccaa gccctcatgg gtgtatggga acaacaaacc tcctggctac 11460
ttcaagggca cataacacca gcaaggagcc tgtcataacc accatctcaa acaatagaac 11520
ttcctaagtg aagcaatgac ttcaaatcta cttgaaggca tggagtataa gccatgttcc 11580
tttcagaggg gactgtactt ctgtagatta ctttccctca ttaaccagat ctggccggcc 11640
tacccagctt tcttgtacaa agtggtgata aactatcagt gtttgacagg atatattggc 11700
gggtaaac 11708
<210> 87
<211> 11707
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 87
tggcaggata tattgtggtg taaacaaatt gacgcttaga caacttaata acacattgcg 60
gacgttttta atgtactgaa ttaacgccga attgaattcg agctcggtac ccggggatcc 120
tctagagtcg acctgcaggc atgcaagctt agcttgagct tggatcagat tgtcgtttcc 180
cgccttcagt ttatcacaag tttgtacaaa aaagcaggct aagactcccg cccatctcac 240
tagggacagg attggagtcc atgctcaaca ccgtgcagga tgaggatgac catagcgact 300
tcgtgggcga ggaaagcctt tcgtccaagg tggtccctcc tcgcaatctt gttggatggt 360
gaatattata aaagcctgcc cttctcgcgg gtgtttaaac gtcgacctgc aggtcaacgg 420
atcaggatat tcttgtttaa gatgttgaac tctatggagg tttgtatgaa ctgatgatct 480
aggaccggat aagttccctt cttcatagcg aacttattca aagaatgttt tgtgtatcat 540
tcttgttaca ttgttattaa tgaaaaaata ttattggtca ttggactgaa cacgagtgtt 600
aaatatggac caggccccaa ataagatcca ttgatatatg aattaaataa caagaataaa 660
tcgagtcacc aaaccacttg ccttttttaa cgagacttgt tcaccaactt gatacaaaag 720
tcattatcct atgcaaatca ataatcatac aaaaatatcc aataacacta aaaaattaaa 780
agaaatggat aatttcacaa tatgttatac gataaagaag ttacttttcc aagaaattca 840
ctgattttat aagcccactt gcattagata aatggcaaaa aaaaacaaaa aggaaaagaa 900
ataaagcacg aagaattcta gaaaatacga aatacgcttc aatgcagtgg gacccacggt 960
tcaattattg ccaattttca gctccaccgt atatttaaaa aataaaacga taatgctaaa 1020
aaaatataaa tcgtaacgat cgttaaatct caacggctgg atcttatgac gaccgttaga 1080
aattgtggtt gtcgacgagt cagtaataaa cggcgtcaaa gtggttgcag ccggcacaca 1140
cgagtcgtgt ttatcaactc aaagcacaaa tacttttcct caacctaaaa ataaggcaat 1200
tagccaaaaa caactttgcg tgtaaacaac gctcaataca cgtgtcattt tattattagc 1260
tattgcttca ccgccttagc tttctcgtga cctagtcgtc ctcgtctttt cttcttcttc 1320
ttctataaaa caatacccaa agagctcttc ttcttcacaa ttcagatttc aatttctcaa 1380
aatcttaaaa actttctctc aattctctct accgtgatca aggtaaattt ctgtgttcct 1440
tattctctca aaatcttcga ttttgttttc gttcgatccc aatttcgtat atgttctttg 1500
gtttagattc tgttaatctt agatcgaaga cgattttctg ggtttgatcg ttagatatca 1560
tcttaattct cgattagggt ttcatagata tcatccgatt tgttcaaata atttgagttt 1620
tgtcgaataa ttactcttcg atttgtgatt tctatctaga tctggtgtta gtttctagtt 1680
tgtgcgatcg aatttgtcga ttaatctgag tttttctgat taacagatgg cttcatctga 1740
gaacgttatc actgagttca tgaggttcaa ggtgaggatg gaaggtactg ttaacggaca 1800
tgagttcgag atcgagggtg agggtgaagg tagaccttac gagggacata acaccgttaa 1860
gcttaaggtt acaaagggtg gacctcttcc tttcgcttgg gatatccttt ctcctcaatt 1920
ccaatacgga agcaaggtaa gtttgtggat tcttcgtcca tgtgatcttt gagtttcttt 1980
agagcttgtg agggattagt aagtaacaat gcttgagttt tttgctgctg ggcttcgaaa 2040
agtttgtcac ttgttggttt gatccacaag gtcttcttct ccatagctac tagacatgtt 2100
ttagcttaag attcaagttt atatatgcct tgtggattaa tcattgcctg attcttccgt 2160
gtcatctctg agtttattta gagcttggaa gtggtgtagt aataactaac aatactcttg 2220
ataagttgta gcaatgctct tgattagtgg atgtaatatg atgttgataa gatatatgag 2280
gcacagaacc aaaagtggtg cttccactag acccgttttt agcctaaggt tcaagtttat 2340
accttgtaga tgtttctgta ttgtctgatt cttccctgtg atatttgaat ttcttagagc 2400
tttggaagtg atataggaac aatgctcttg tgtgtttgtc tctatgaaga ttatcgctgt 2460
cgtgtttcat ccgagtgtgc gggatttttt gctgctgggt ttagcctttc ttcaaaaagt 2520
tattacttgt tagttttatt gttttggtct tgataagaga tgttaggaca gacatggtgc 2580
ttcttgtcta tagccactag acctatttta gcataaggtt aacgaaattc tctctacata 2640
ccttgtggat ttgtttacat tgcctgatct ttcctgtgat cgctgtcatg tttctttgga 2700
atgattgatg tttataaatg gaaaaatctt tgtgcagaag actcccgccc atccaggatg 2760
aggatgacca ccaccccaca gtggggcagg atgaggatga ccaggtcgca gcgtgtgcgt 2820
gtccgtcgta cgttctggcc ggccgggcct tgggcgcgcg atcagaagcg ttgcgttggc 2880
gtgtgtgtgc ttctggtttg ctttaatttt accaagtttg tttcaaggtg gatcgcgtgg 2940
tcaaggcccg tgtgctttaa agacccaccg gcactggcag tgagtgttgc tgcttgtgta 3000
ggctttggta cgtatgggct ttatttgctt ctggatgttg tgtactactt gggtttgttg 3060
aattattatg agcagttgcg tattgtaatt cagctgggct acctggacat tgttatgtat 3120
taataaatgc tttgctttct tctaaagatc tttaagtgct acaactttgt atacaaaagt 3180
tggtttaaac aaccgacaac cactttgcgg acttcctttc aagagaattc aataaggtta 3240
attcctaatt gaaatccgaa gataagattc ccacacactt gtggctgata tcaaaaggct 3300
actgcctatt taaacacatc tctggagact gagaaaatca gacctccaag catgaagaag 3360
cctgagctta ctgctacttc tgttgagaag ttcctcatcg agaagttcga ttctgtgtct 3420
gatcttatgc agctctctga gggtgaggaa tcaagagctt tctctttcga tgttggtgga 3480
agaggatacg ttctcagagt taactcttgc gctgacggat tctacaagga tagatacgtg 3540
tacagacact tcgcttcagc tgctctccct atccctgaag ttcttgatat cggagagttc 3600
tctgagtctc ttacctactg tatctcaaga agggctcagg gtgttactct tcaagatctt 3660
cctgagactg agcttcctgc tgttcttcaa cctgttgctg aggctatgga tgctatcgct 3720
gctgctgatc tttctcaaac ttctggattc ggacctttcg gtcctcaggg aatcggacag 3780
tacactactt ggagagattt catctgcgct atcgctgatc ctcatgttta ccattggcag 3840
accgttatgg atgataccgt ttctgcttct gttgctcaag ctcttgatga gcttatgctt 3900
tgggctgagg attgtcctga ggttagacat cttgttcacg ctgatttcgg atctaacaac 3960
gttctcaccg ataacggaag aatcaccgct gttatcgatt ggtctgaggc tatgttcgga 4020
gattctcaat acgaggtggc caacatattc ttttggaggc cttggcttgc ttgtatggaa 4080
caacagacta gatacttcga gagaaggcat cctgagcttg ctggatctcc tagacttaga 4140
gcttacatgc ttaggatcgg acttgatcag ctttaccagt ctctcgttga tggaaacttc 4200
gatgatgctg cttgggctca gggaagatgt gatgctatcg ttagatctgg tgctggaact 4260
gttggaagaa ctcaaatcgc tagaagatct gctgctgttt ggactgatgg atgtgttgaa 4320
gttctcgctg attctggaaa cagaaggcct tctactagac ctagagccaa gaagtgaaga 4380
tcggcggcaa tagcttctta gcgccatccc gggttgatcc tatctgtgtt gaaatagttg 4440
cggtgggcaa ggctctcttt cagaaagaca ggcggccaaa ggaacccaag gtgaggtggg 4500
ctatggctct cagttccttg tggaagcgct tggtctaagg tgcagaggtg ttagcgggat 4560
gaagcaaaag tgtccgattg taacaagata tgttgatcct acgtaaggat attaaagtat 4620
gtattcatca ctaatataat cagtgtattc caatatgtac tacgatttcc aatgtcttta 4680
ttgtcgccgt atgtaatcgg cgtcacaaaa taatccccgg tgactttctt ttaatccagg 4740
atgaaataat atgttattat aatttttgcg atttggtccg ttataggaat tgaagtgtgc 4800
ttgcggtcgc caccactccc atttcataat tttacatgta tttgaaaaat aaaaatttat 4860
ggtattcaat ttaaacacgt atacttgtaa agaatgatat cttgaaagaa atatagttta 4920
aatatttatt gataaaataa caagtcaggt attatagtcc aagcaaaaac ataaatttat 4980
tgatgcaagt ttaaattcag aaatatttca ataactgatt atatcagctg gtacattgcc 5040
gtagatgaaa gactgagtgc gatattatgg tgtaatacat agtttaaacc acccaacttt 5100
tctatacaaa gttgaagact cccgcccatc caggatgagg atgaccacca ccccacagtg 5160
gggcaggatg aggatgacca gtcagtttta cttcccttaa ttttctatgt actttcataa 5220
ttacttatgt tattttcttc atgagtttta atgcaaatta ctatatggac tctagtgaaa 5280
acgttcagaa tcctataaac atgactactg agacgaactt gagagtagtt ttgatcatac 5340
acacgtttca tgtggtactt gagagttact aatttttgtc atcttcgtat aagtagtaaa 5400
agatactaca agaatagttt agtagaaaat actagcggta ggtgaagatt tgtcgctatg 5460
tactattatt gtctagtaac ttgagtaaca atttcgtggt ctaaatatca aataaaaatg 5520
gatgagtggt tcaccaaatc taggcatcaa aactattaat gtcattgtct agatcttagg 5580
tgacaccaca tttcgaatat ttattggtaa ttgagatgtt aaagtaccaa tatttgactt 5640
aataaactaa aagattttgg ctttatcaaa tgtagacatt gatgacatat cgttgtcatt 5700
atcttgagta tatacaagtc gatcaattag gtgaaagttt agtgtctcgt ggttggtaaa 5760
cgattaatac agtagtatat tttatccaaa gacaaaatcc aaatcatttc accagtatga 5820
atagtattat tttatcttaa aagctaaaat cttaaaaacc aaggtagcac ccacgttgag 5880
ctagacgatc aaatcgattt ctgctttgtc caatttacca agctatttaa agccaaataa 5940
ttgaaatata ggtaggtcgt tatattaggc taagatttat ctcaaatgct taactaaagg 6000
aataacaagg gattctagtt gtgtggtttt ataagattgg tccaatttca cttaagtttg 6060
tttattgtag aattttatat gtgaataatt tgaattccaa ttgaaaagat attatagtaa 6120
aagaaaaaat agtgcgaaca aaaaacttta atcccataaa aagaaaaaga aaaatgaaaa 6180
gttcttctaa catccatatt ttgcatcata tcataaagat aagaaagata catatcatag 6240
acgtacagat aaacaaacat atcatcattt gtgaaataca tagtacaata atttgctttt 6300
aaatagagtt taagtcacac acactgacac acacgataaa acgataatgt ctgcaaaaac 6360
actttaatcc cattgcctag aggacagctt ctccactttg tctttaaggt tggttttgcc 6420
gtgttgtttt tatctttata taatgatcta ttttttggat tatgaaatga attcacacat 6480
tttaattatt taagaagatc catatacagg tttataacag tactaagtga tgattatttt 6540
ttgtttttgc atagtttagt ttattgggta aacattcatt acgtgtctct ttatacgaat 6600
cacccatcca aaatttcaag tagtctttta gttcatttat tatttcataa ctatttgact 6660
tattgatttg acaagaaaca acaaaagtgt tgacttattg atagattgtg ggatcataaa 6720
agtaattaag cgtcaaccac gacccacaac aacaaagcac atgttataca ttaatatctc 6780
gtttacttaa ttacagtttt cagaatgccg tttcatgtct tgtcactggc gatgttatta 6840
tcatgttgga caatattcga ctgttgtcgt ttttacattt tcgtattgac taaaactaaa 6900
aaaacaaaac tctgtttcag gttgggccta ggatccacat tgtacacaca tttgcttaag 6960
tctatggagg cgcaaggttt taagtctgtg gttgctgtta taggccttcc aaacgatcca 7020
tctgttaggt tgcatgaggc tttgggatac acagcccggg gtacattgcg cgcagctgga 7080
tacaagcatg gtggatggca tgatgttggt ttttggcaaa gggattttga gttgccagct 7140
cctccaaggc cagttaggcc agttacccag atctaatatc aaaatctatt tagaaataca 7200
caatattttg ttgcaggctt gctggagaat cgatctgcta tcataaaaat tacaaaaaaa 7260
ttttatttgc ctcaattatt ttaggattgg tattaaggac gcttaaatta tttgtcgggt 7320
cactacgcat cattgtgatt gagaagatca gcgatacgaa atattcgtag tactatcgat 7380
aatttatttg aaaattcata agaaaagcaa acgttacatg aattgatgaa acaatacaaa 7440
gacagataaa gccacgcaca tttaggatat tggccgagat tactgaatat tgagtaagat 7500
cacggaattt ctgacaggag catgtcttca attcagccca aatggcagtt gaaatactca 7560
aaccgcccca tatgcaggag cggatcattc attgtttgtt tggttgcctt tgccaacatg 7620
ggagtccaag gttatttaaa taccctgcca agcttgaggt agcctccaat ttgacggtgc 7680
cgccagcgac gccgtctgga actgtccttt ttgaggacca ctccgtttgt ggagatcatg 7740
aacaactttg tataataaag ttgaagactc ccgcccatct ctctatgccc gggacaagtg 7800
gagtccatgc tcaacaccgt gcactaggga caggattggt ttaaacgttt gtgtcttcta 7860
gattaatcct ccaaactttt gattaaccaa aaaaattatc aaactaacat gttctccttt 7920
tttctttaga aattctaacg aatttatctt tatactgatt tgaatatact taatttggtc 7980
atttggatgc cctttacaac ctccttacca aactattgat cacagtttct attgctaaaa 8040
tcaccaacaa aacgcatgtc gccattcata attatggttt cacacctaca actaggctaa 8100
taagtaaata agtagacaac tagactcagg tttgaaaaaa ccataaaagc catatagcgt 8160
tttctcattg aaactgcgaa cacgatcgtg tgaatgttgc agtttctagt tttgatacaa 8220
acaaacaaaa acacaattta atcttagatt aaaaagaaaa aagagaacgg agcccactag 8280
ccactccttc aaacgtgtct taccaactct cttctagaaa caaattaggc ttcaccttcc 8340
tcttccaacc tctctctctc tctctctctc tttttctcaa accatctctc cataaagccc 8400
taatttcttc atcacaagaa tcagaagaag aaagatggac ctgcatctaa ttttcggtcc 8460
aacttgcaca ggaaagacga cgaccgcgat agctcttgcc cagcagacag ggcttccagt 8520
cctttcgctt gatcgggtcc aatgctgtcc tcaactatca accggaagcg gacgaccaac 8580
agtggaagaa ctgaaaggaa cgacgcgtct ctaccttgat gatcggcctc tggtggaggg 8640
tatcatcgca gccaagcaag ctcatcatag gctgatcgag gaggtgtata atcatgaggc 8700
caacggcggg cttattcttg agggaggatc cacctcgttg ctcaactgca tggcgcgaaa 8760
cagctattgg agtgcagatt ttcgttggca tattattcgc cacaagttac ccgaccaaga 8820
gaccttcatg aaagcggcca aggccagagt taagcagatg ttgcaccccg ctgcaggcca 8880
ttctattatt caagagttgg tttatctttg gaatgaacct cggctgaggc ccattctgaa 8940
agagatcgat ggatatcgat atgccatgtt gtttgctagc cagaaccaga tcacggcaga 9000
tatgctattg cagcttgacg caaatatgga aggtaagttg attaatggga tcgctcagga 9060
gtatttcatc catgcgcgcc aacaggaaca gaaattcccc caagttaacg cagccgcttt 9120
cgacggattc gaaggtcatc cgttcggaat gtattagaaa tcaccagtct ctctctacaa 9180
atctatctct ctctattttt ctccagaata atgtgtgagt agttcccaga taagggaatt 9240
agggttctta tagggtttcg ctcatgtgtt gagcatataa gaaaccctta gtatgtattt 9300
gtatttgtaa aatacttcta tcaataaaat ttctaattcc taaaaccaaa atccagtgtt 9360
taaacaagac tcccgcccat ctctctatgc ccgggacaag tggagtccat gctcaacacc 9420
gtgcactagg gacaggattg cattaaggat gaccagttcg taaaggtcct gcggtgtcta 9480
ttgcttttca taggttaata agtgtttgct agactgtggt gaaaggccta tccgaagtaa 9540
ggccggccgg atccttcatc tttggacaag ggaataaaga ctccccactt gctactaaga 9600
acaataccta agttgcccag acatgactgt acccattcag agacctacca cccattaggg 9660
ctatgacact aacactagcc cctggaggtt gaccatgcta ggcagtgggg gtctcaccta 9720
tgacccactc agataggggt ttaaaccagt gggtgggatc tcagcctcat ataggtgttt 9780
gtggtgagct ttctcctaga caagagaacc ctgaagaaca gcaagaacca gctaatatga 9840
tatgtagaca tagtgggttg ctcaaatttt gtgtttagtc atattagaat tgacctcagt 9900
gaccactcag aaagtgccca agcccatcta taggggccaa agtgctattg actggtgtgt 9960
ctgtgaattg ttcctcccta cagagttggt gctgatatat cctagcattc tttggaaaac 10020
ctagctaggg actgtcaagt gtaagatacc tcctgaattg gagggaacac tagctgccct 10080
gtaccttctg gctagtacct tacaccctga atgggttagg gggtctatta tttgctggaa 10140
atataccagt ttcagtaggg ctgctgcctt aggtcccaca aggtgtaaca tgtgctcaat 10200
agttgcacta ccacatgcac gtgaacttaa tgatgttata gccacaacac caaccttggt 10260
ttgcagtttg acatccctct ggaatgggtg tagtcatctt gctctggatc tgcctgaatc 10320
attggggctg tatgcagcct gggcttaaag tgaagaatgg gatgtcccag aaatattttg 10380
ggtgagaaga atcctggagt agatggtgac ctgactatcc ctgtcctatg ggcacaatct 10440
atcatcagat attgcattca aagggctatc atgggatcaa gtcctaagtc aactgttgtt 10500
tacctggcag acattcatct aggagttctc ttttatgcca ccccacagtg atccgccttt 10560
tgcagtttat ccactaggga caggattgcc accccacagt ggggcctcta tgcccgggac 10620
aagtgtaaaa tatagagtat aggggttatc atcacagaga agctattgct ggagggcctc 10680
tgttatttcc tctccatgcc actcccattt ttaacctacc aactgaaatc ccaagggaga 10740
ctccaccctg taactagagt cctcagaggt gagccatccc atattaacaa atgggcatta 10800
gggctaggat gccaagggat acctgaaatg ggaagttgtg gggctgagtc ctcctgggaa 10860
tcagagataa tatgtaaaca gtttgttgag agattgatga gagctgactt tgagaggtgg 10920
ccatgctccc tggtcctcaa tagggaaggc actacacaag aaacctgggt ttgatcaact 10980
gcactgtgtc ctactcacac attgtgtgcc tggaaaaatg ttacttagta tttggagggc 11040
ctccagaacc cccctgggtg caagactggg tgctagtgac tgggtgaatg agtcttggac 11100
acagtggcct tgtctaggtt gtgtgaggtg gctaggcatc atggcaatac ctcataattg 11160
atgagtgagg aaacaagact aagtccttga ctcctcttat tacatgacct ggtggatatt 11220
atgtttaaac tctgcaagct ggaatgagta ctgggtgcag atcccctggg attctggcta 11280
caaaggtgaa tgatagctag tctgtttatt agtagccaaa aaagtcagtg aggggtgagt 11340
gccctgggat gttgttaagt tcacattgca cacttggaga ccctctccat ccagtaacat 11400
accagagaaa actgaccaag ccctcatggg tgtatgggaa caacaaacct cctggctact 11460
tcaagggcac ataacaccag caaggagcct gtcataacca ccatctcaaa caatagaact 11520
tcctaagtga agcaatgact tcaaatctac ttgaaggcat ggagtataag ccatgttcct 11580
ttcagagggg actgtacttc tgtagattac tttccctcat taaccagatc tggccggcct 11640
acccagcttt cttgtacaaa gtggtgataa actatcagtg tttgacagga tatattggcg 11700
ggtaaac 11707
<210> 88
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 88
cgagaacttg gcaattcc 18
<210> 89
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 89
tggcgattct gagattcc 18
<210> 90
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 90
gactcatcgt actctccctt cg 22
<210> 91
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 91
gactcatcgt actctccctt cg 22
<210> 92
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 92
tgttggtgga agaggatacg 20
<210> 93
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 93
atcagcagca gcgatagc 18
<210> 94
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 94
atgtccactg ggttcgtgcc 20
<210> 95
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 95
gaagggaact tatccggtcc 20
<210> 96
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 96
tgcgctgcca ttctccaaat 20
<210> 97
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 97
accgagctcg aattcaattc 20
<210> 98
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 98
cctgcattcg gttaaacacc 20
<210> 99
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 99
ccatctggct tctgccttgc 20
<210> 100
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 100
attccgatcc ccagggcagt 20
<210> 101
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 101
gccaacgttg cagccttgct 20
<210> 102
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 102
gccctgggat gttgttaagt 20
<210> 103
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 103
gtaacttagg acttgtgcga 20
<210> 104
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 104
tctctacctt gatgatcgg 19
<210> 105
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 105
aacatctgct taactctggc 20
<210> 106
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 106
atggcttcat ctgagaacg 19
<210> 107
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 107
ttccgtattg gaattgagg 19
<210> 108
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 108
ttgcttaagt ctatggaggc g 21
<210> 109
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 109
tgggtaactg gcctaactgg 20
<210> 110
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 110
atgatatgta gacatagtgg g 21
<210> 111
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 111
agggtgtaag gtactagcc 19
<210> 112
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 112
tgttggtgga agaggatacg 20
<210> 113
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 113
atcagcagca gcgatagc 18
<210> 114
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 114
gtggagaaga actacgagct accc 24
<210> 115
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 115
gactcatcgt actctccctt cg 22
<210> 116
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 116
Arg Ser Asp Asn Leu Ala Arg
1 5
<210> 117
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 117
Gln Lys Lys Asp Arg Ser Tyr
1 5
<210> 118
<400> 118
000
<210> 119
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 119
Gln Arg Gly Asn Arg Asn Thr
1 5
<210> 120
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 120
Arg Ser Asp His Leu Ser Arg
1 5
<210> 121
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 121
Arg Asn Gln Asp Arg Thr Asn
1 5
<210> 122
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 122
Asp Arg Ser Asn Leu Ser Arg
1 5
<210> 123
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 123
Arg Gln Asp Ser Arg Ser Gln
1 5
<210> 124
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 124
Gln Ser Ser Asp Leu Ser Arg
1 5
<210> 125
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 125
Asp Arg Ser Ala Leu Ala Arg
1 5
<210> 126
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 126
Thr Ser Gly Ser Leu Thr Arg
1 5
<210> 127
<400> 127
000
<210> 128
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 128
Ala Ala Ser Asn Arg Ser Lys
1 5
<210> 129
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 129
Thr Ser Gly Ser Leu Ser Arg
1 5
<210> 130
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 130
Arg Ser Asp Ala Leu Ala Arg
1 5
<210> 131
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 131
Arg Ser Asp Val Leu Ser Thr
1 5
<210> 132
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 132
Trp Gly Arg Leu Arg Lys Leu
1 5
<210> 133
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 133
Glu Arg Gly Thr Leu Ala Arg
1 5
<210> 134
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 134
Arg Ser Asp Asp Leu Thr Arg
1 5
<210> 135
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 135
Arg Ser Asp His Leu Ser Ala
1 5
<210> 136
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 136
Gln His Gly Ala Leu Gln Thr
1 5
<210> 137
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 137
Thr Ser Gly Asn Leu Thr Arg
1 5
<210> 138
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 138
Gln Ser Gly His Leu Ser Arg
1 5
<210> 139
<400> 139
000
<210> 140
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 140
Arg Ser Asp His Leu Ser Gln
1 5
<210> 141
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 141
Cys Thr Arg Asn Arg Trp Arg
1 5
<210> 142
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 142
Arg Ser Asp Asn Leu Ser Glu
1 5
<210> 143
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 143
Ala Ser Lys Thr Arg Lys Asn
1 5
<210> 144
<400> 144
000
<210> 145
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 145
Thr Ser Ser Asn Arg Ala Val
1 5
<210> 146
<400> 146
000
<210> 147
<400> 147
000
<210> 148
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 148
Arg Ser Asp Val Leu Ser Glu
1 5
<210> 149
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 149
Arg Asn Phe Ser Leu Thr Met
1 5
<210> 150
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 150
Gln Ser Gly Asp Leu Thr Arg
1 5
<210> 151
<400> 151
000
<210> 152
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 152
Gln Ser Gly Asn Leu Ala Arg
1 5
<210> 153
<400> 153
000
<210> 154
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 154
Gln Ser Gly Ser Leu Thr Arg
1 5
<210> 155
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 155
Asp Arg Ser His Leu Ala Arg
1 5
<210> 156
<400> 156
000
<210> 157
<400> 157
000
<210> 158
<400> 158
000
<210> 159
<400> 159
000
<210> 160
<400> 160
000
<210> 161
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 161
His Leu Gly Asn Leu Lys Thr
1 5
<210> 162
<400> 162
000
<210> 163
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 163
Thr Ala Arg Leu Leu Lys Leu
1 5
<210> 164
<400> 164
000
<210> 165
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 165
Gln Thr Ser His Leu Pro Gln
1 5
<210> 166
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 166
Arg Ser Asp Asn Leu Ser Val
1 5
<210> 167
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 167
Thr Ser Gly His Leu Ser Arg
1 5
<210> 168
<400> 168
000
<210> 169
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 169
Arg Ser Asp Ala Leu Ser Thr
1 5
<210> 170
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 170
Asp Arg Ser Thr Arg Thr Lys
1 5
<210> 171
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 171
Gln Asn Ala His Arg Lys Thr
1 5
<210> 172
<400> 172
000
<210> 173
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 173
Leu Lys Gln Met Leu Ala Val
1 5
<210> 174
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 174
Arg Ser Asp Asn Leu Ser Arg
1 5
<210> 175
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 175
Asp Asn Ser Asn Arg Lys Thr
1 5
<210> 176
<400> 176
000
<210> 177
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 177
Gln Asn Ala Asn Arg Ile Thr
1 5
<210> 178
<400> 178
000
<210> 179
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 179
Gln Ser Ser Val Arg Asn Ser
1 5
<210> 180
<400> 180
000
<210> 181
<400> 181
000
<210> 182
<400> 182
000
<210> 183
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 183
Asp Arg Ser Asn Leu Thr Arg
1 5
<210> 184
<400> 184
000
<210> 185
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 185
Thr Arg Asn Gly Leu Lys Tyr
1 5
<210> 186
<400> 186
000
<210> 187
<400> 187
000
<210> 188
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 188
Arg Ser Ser Asp Arg Thr Lys
1 5
<210> 189
<400> 189
000
<210> 190
<400> 190
000
<210> 191
<400> 191
000
<210> 192
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 192
Gln Ser Thr His Arg Asn Ala
1 5
<210> 193
<400> 193
000
<210> 194
<400> 194
000
<210> 195
<400> 195
000
<210> 196
<400> 196
000
<210> 197
<400> 197
000
<210> 198
<400> 198
000
<210> 199
<400> 199
000
<210> 200
<400> 200
000
<210> 201
<400> 201
000
<210> 202
<400> 202
000
<210> 203
<400> 203
000
<210> 204
<400> 204
000
<210> 205
<400> 205
000
<210> 206
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 206
Arg Ser Asp Thr Leu Ser Gln
1 5
<210> 207
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 207
Gln Arg Asp His Arg Ile Lys
1 5
<210> 208
<400> 208
000
<210> 209
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 209
Gln Ser Ser Asp Leu Arg Arg
1 5
<210> 210
<400> 210
000
<210> 211
<400> 211
000
<210> 212
<400> 212
000
<210> 213
<400> 213
000
<210> 214
<400> 214
000
<210> 215
<400> 215
000
<210> 216
<400> 216
000
<210> 217
<400> 217
000
<210> 218
<400> 218
000
<210> 219
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 219
Asp Arg Gly Asp Leu Arg Lys
1 5
<210> 220
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 220
Asp Ser Ser Asp Arg Lys Lys
1 5
<210> 221
<400> 221
000
<210> 222
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 222
Asp Asn Tyr Asn Arg Ala Lys
1 5
<210> 223
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 223
Asp Arg Ser His Leu Thr Arg
1 5
<210> 224
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 224
Arg Ser Asp Asn Leu Thr Thr
1 5
<210> 225
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 225
Arg Ser Asp Asn Leu Ser Asn
1 5
<210> 226
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 226
Thr Ser Ser Ser Arg Ile Asn
1 5
<210> 227
<400> 227
000
<210> 228
<400> 228
000
<210> 229
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 229
Arg Ser Asp Ala Leu Thr Gln
1 5
<210> 230
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 230
Arg Ser Asp Thr Leu Ser Thr
1 5
<210> 231
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 231
Asp Arg Ser Ser Arg Ile Lys
1 5
<210> 232
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 232
Arg Ser Asp Asp Leu Ser Lys
1 5
<210> 233
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 233
Asp Asn Ser Asn Arg Ile Lys
1 5
<210> 234
<400> 234
000
<210> 235
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 235
Gln Ala Gly Asn Leu Ser Lys
1 5
<210> 236
<400> 236
000
<210> 237
<400> 237
000
<210> 238
<400> 238
000
<210> 239
<400> 239
000
<210> 240
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 240
Leu Arg Gln Thr Leu Arg Asp
1 5
<210> 241
<400> 241
000
<210> 242
<400> 242
000
<210> 243
<400> 243
000
<210> 244
<400> 244
000
<210> 245
<400> 245
000
<210> 246
<400> 246
000
<210> 247
<400> 247
000
<210> 248
<400> 248
000
<210> 249
<400> 249
000
<210> 250
<400> 250
000
<210> 251
<400> 251
000
<210> 252
<400> 252
000
<210> 253
<400> 253
000
<210> 254
<400> 254
000
<210> 255
<211> 57
<212> DNA
<213> Brassica napus
<400> 255
gcccaaggaa cccttttctg ggccatcttc gtactcggcc acgactggta atttaat 57
<210> 256
<211> 58
<212> DNA
<213> Brassica napus
<400> 256
agcgagagaa agcttattgc aacttcaact acttgctggt cgatcgtgtt ggccactc 58
<210> 257
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 257
gcccaaggaa cccttttctg ggccatct 28
<210> 258
<211> 28
<212> DNA
<213> Brassica napus
<400> 258
cgtactcggc cacgactggt aatttaat 28
<210> 259
<211> 57
<212> DNA
<213> Brassica napus
<400> 259
gcccaaggaa cccttttctg ggccatcttc gtactcggcc acgactggta atttaat 57
<210> 260
<211> 57
<212> DNA
<213> Brassica napus
<400> 260
gcccaaggaa ccctgttctg ggctatcttc gtactcggcc acgactggta atttaat 57
<210> 261
<211> 57
<212> DNA
<213> Brassica napus
<400> 261
gcccaaggaa cccttttctg ggccatcttc gtcctcggcc acgactggta aagtttc 57
<210> 262
<211> 57
<212> DNA
<213> Brassica napus
<400> 262
gcccaaggaa cccttttctg ggccatcttc gtcctcggcc acgactggta aagtttc 57
<210> 263
<211> 57
<212> DNA
<213> Brassica napus
<400> 263
gcccaaggaa cccttttctg ggccatcttc gttcttggcc acgactggta aattaaa 57
<210> 264
<211> 57
<212> DNA
<213> Brassica napus
<400> 264
gcccaaggaa cccttttctg ggccatcttc gttcttggcc acgactggta aattaaa 57
<210> 265
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 265
agcgagagaa agcttattgc aacttcaa 28
<210> 266
<211> 28
<212> DNA
<213> Brassica napus
<400> 266
acttgctggt cgatcgtgtt ggccactc 28
<210> 267
<211> 58
<212> DNA
<213> Brassica napus
<400> 267
agcgagagaa agcttattgc aacttcaact acttgctggt cgatcgtgtt ggccactc 58
<210> 268
<211> 58
<212> DNA
<213> Brassica napus
<400> 268
agcgagagaa agcttattgc aacttcaact acttgctggt cgatcatgtt ggccactc 58
<210> 269
<211> 58
<212> DNA
<213> Brassica napus
<400> 269
agcgagagaa agcttattgc aacttcaact acttgctggt ccataatgtt ggccattc 58
<210> 270
<211> 58
<212> DNA
<213> Brassica napus
<400> 270
agcgagagaa agcttattgc aacttcgact acttgctggt ccataatgtt ggcaattc 58
<210> 271
<211> 58
<212> DNA
<213> Brassica napus
<400> 271
agcgagagga agcttattgc aacttcaaca acttgctggt ccataatgtt ggccactc 58
<210> 272
<211> 58
<212> DNA
<213> Brassica napus
<400> 272
agcgagagga agcttattgc aacttcaact acttgctggt ccataatgtt ggccactc 58
<210> 273
<211> 3292
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 273
ccagaaggta attatccaag atgtagcatc aagaatccaa tgtttacggg aaaaactatg 60
gaagtattat gtaagctcag caagaagcag atcaatatgc ggcacatatg caacctatgt 120
tcaaaaatga agaatgtaca gatacaagat cctatactgc cagaatacga agaagaatac 180
gtagaaattg aaaaagaaga accaggcgaa gaaaagaatc ttgaagacgt aagcactgac 240
gacaacaatg aaaagaagaa gataaggtcg gtgattgtga aagagacata gaggacacat 300
gtaaggtgga aaatgtaagg gcggaaagta accttatcac aaaggaatct tatcccccac 360
tacttatcct tttatatttt tccgtgtcat ttttgccctt gagttttcct atataaggaa 420
ccaagttcgg catttgtgaa aacaagaaaa aatttggtgt aagctatttt ctttgaagta 480
ctgaggatac aacttcagag aaatttgtaa gtttgtagat ctccatggct ccaaggaaga 540
ggaaggagtc taacagggag tcagctagga ggtcaaggta caggaaggtg ggtatccacg 600
gggtacccgc cgctatggct gagaggccct tccagtgtcg aatctgcatg cgtaacttca 660
gtcgtagtga caacctgagc aaccacatcc gcacccacac aggcgagaag ccttttgcct 720
gtgacatttg tgggaggaaa tttgccacca gcagcagccg cataaaccat accaagatac 780
acacgggcag ccaaaagccc ttccagtgtc gaatctgcat gcgtaacttc agtcgtagtg 840
acaacctgag cgaacacatc cgcacccaca caggcgagaa gccttttgcc tgtgacattt 900
gtgggaggaa atttgccgcc agcaagaccc gcaaaaacca taccaagata cacacgggcg 960
agaagccctt ccagtgtcga atctgcatgc gtaagtttgc ccgctccgac gccctgaccc 1020
agcatgccca gagatgcgga ctgcggggat cccaacttgt gaaatcagaa ttggaagaga 1080
aaaagtctga gcttagacac aaattgaagt acgttccaca tgaatatatc gaacttatcg 1140
agattgctag gaactcaaca caggacagaa ttttggagat gaaggttatg gagttcttta 1200
tgaaagtgta cggatatagg ggaaagcacc ttggtggttc taggaaacct gatggtgcaa 1260
tctacactgt gggatcacct attgactatg gtgttatcgt ggatacaaag gcatactctg 1320
gtggatacaa tttgccaatc ggacaagctg acgaaatgca gagatatgtt gaagagaacc 1380
aaactagaaa caaacatatt aatccaaatg aatggtggaa ggtgtatcct tcatctgtta 1440
cagagttcaa attccttttt gtgtctggac actttaaggg taactacaaa gcacagctta 1500
ctaggttgaa ccatattaca aattgcaatg gtgctgtgtt gtcagttgaa gagcttttga 1560
tcggaggtga aatgattaag gcaggaacac ttactttgga ggaagttaga agaaaattca 1620
acaacggtga aatcaatttt agatctggcg gcggagaggg cagaggaagt cttctaacat 1680
gcggtgacgt ggaggagaat cccggcccta ggatggctcc aaggaagagg aaggagtcta 1740
acagggagtc agctaggagg tcaaggtaca ggaaggtggg tatccacggg gtacccgccg 1800
ctatggctga gaggcccttc cagtgtcgaa tctgcatgcg taacttcagt cgtagtgaca 1860
ccctgagcac gcacatccgc acccacacag gcgagaagcc ttttgcctgt gacatttgtg 1920
ggaggaaatt tgccgacagg agcagccgca taaagcatac caagatacac acgggatctc 1980
agaagccctt ccagtgtcga atctgcatgc gtaacttcag tcgctccgac gacctgtcca 2040
agcacatccg cacccacaca ggcgagaagc cttttgcctg tgacatttgt gggaggaagt 2100
ttgccgacaa ctccaaccgc atcaagcatg cccagagatg cggactgcgg ggatcccaac 2160
ttgtgaaatc agaattggaa gagaaaaagt ctgagcttag acacaaattg aagtacgttc 2220
cacatgaata tatcgaactt atcgagattg ctaggaactc aacacaggac agaattttgg 2280
agatgaaggt tatggagttc tttatgaaag tgtacggata taggggaaag caccttggtg 2340
gttctaggaa acctgatggt gcaatctaca ctgtgggatc acctattgac tatggtgtta 2400
tcgtggatac aaaggcatac tctggtggat acaatttgcc aatcggacaa gctgacgaaa 2460
tgcagagata tgttgaagag aaccaaacta gaaacaaaca tattaatcca aatgaatggt 2520
ggaaggtgta tccttcatct gttacagagt tcaaattcct ttttgtgtct ggacacttta 2580
agggtaacta caaagcacag cttactaggt tgaaccatat tacaaattgc aatggtgctg 2640
tgttgtcagt tgaagagctt ttgatcggag gtgaaatgat taaggcagga acacttactt 2700
tggaggaagt tagaagaaaa ttcaacaacg gtgaaatcaa tttttgataa ctcgagctcg 2760
gtcaccagca taatttttat taatgtacta aattactgtt ttgttaaatg caattttgct 2820
ttctcgggat tttaatatca aaatctattt agaaatacac aatattttgt tgcaggcttg 2880
ctggagaatc gatctgctat cataaaaatt acaaaaaaat tttatttgcc tcaattattt 2940
taggattggt attaaggacg cttaaattat ttgtcgggtc actacgcatc attgtgattg 3000
agaagatcag cgatacgaaa tattcgtagt actatcgata atttatttga aaattcataa 3060
gaaaagcaaa cgttacatga attgatgaaa caatacaaag acagataaag ccacgcacat 3120
ttaggatatt ggccgagatt actgaatatt gagtaagatc acggaatttc tgacaggagc 3180
atgtcttcaa ttcagcccaa atggcagttg aaatactcaa accgccccat atgcaggagc 3240
ggatcattca ttgtttgttt ggttgccttt gccaacatgg gagtccaagg tt 3292
<210> 274
<211> 3475
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 274
ccagaaggta attatccaag atgtagcatc aagaatccaa tgtttacggg aaaaactatg 60
gaagtattat gtaagctcag caagaagcag atcaatatgc ggcacatatg caacctatgt 120
tcaaaaatga agaatgtaca gatacaagat cctatactgc cagaatacga agaagaatac 180
gtagaaattg aaaaagaaga accaggcgaa gaaaagaatc ttgaagacgt aagcactgac 240
gacaacaatg aaaagaagaa gataaggtcg gtgattgtga aagagacata gaggacacat 300
gtaaggtgga aaatgtaagg gcggaaagta accttatcac aaaggaatct tatcccccac 360
tacttatcct tttatatttt tccgtgtcat ttttgccctt gagttttcct atataaggaa 420
ccaagttcgg catttgtgaa aacaagaaaa aatttggtgt aagctatttt ctttgaagta 480
ctgaggatac aacttcagag aaatttgtaa gtttgtagat ctccatggct ccaaggaaga 540
ggaaggagtc taacagggag tcagctagga ggtcaaggta caggaaggtg ggtatccacg 600
gggtacccgc cgctatggct gagaggccct tccagtgtcg aatctgcatg cgtaacttca 660
gtcagtcctc cgacctgtcc cgccacatcc gcacccacac cggcgagaag ccttttgcct 720
gtgacatttg tgggaggaaa tttgcccagg ccggcaacct gtccaagcat accaagatac 780
acacgcatcc cagggcacct attcccaagc ccttccagtg tcgaatctgc atgcgtaagt 840
ttgcccagtc cggcgacctg acccgccata ccaagataca cacgggcgag aagcccttcc 900
agtgtcgaat ctgcatgcgt aacttcagta cctccggctc cctgtcccgc cacatccgca 960
cccacaccgg cgagaagcct tttgcctgtg acatttgtgg gaggaaattt gcccagtccg 1020
gcaacctggc ccgccatgcc cagagatgcg gactgcgggg atcccaactt gtgaaatcag 1080
aattggaaga gaaaaagtct gagcttagac acaaattgaa gtacgttcca catgaatata 1140
tcgaacttat cgagattgct aggaactcaa cacaggacag aattttggag atgaaggtta 1200
tggagttctt tatgaaagtg tacggatata ggggaaagca ccttggtggt tctaggaaac 1260
ctgatggtgc aatctacact gtgggatcac ctattgacta tggtgttatc gtggatacaa 1320
aggcatactc tggtggatac aatttgccaa tcggacaagc tgacgaaatg cagagatatg 1380
ttgaagagaa ccaaactaga aacaaacata ttaatccaaa tgaatggtgg aaggtgtatc 1440
cttcatctgt tacagagttc aaattccttt ttgtgtctgg acactttaag ggtaactaca 1500
aagcacagct tactaggttg aaccatatta caaattgcaa tggtgctgtg ttgtcagttg 1560
aagagctttt gatcggaggt gaaatgatta aggcaggaac acttactttg gaggaagtta 1620
gaagaaaatt caacaacggt gaaatcaatt ttagatctgg cggcggagag ggcagaggaa 1680
gtcttctaac atgcggtgac gtggaggaga atcccggccc taggatggct ccaaggaaga 1740
ggaaggagtc taacagggag tcagctagga ggtcaaggta caggaaggtg ggtatccacg 1800
gggtacccgc cgctatggct gagaggccct tccagtgtcg aatctgcatg cgtaacttca 1860
gtacctccgg ctccctgtcc cgccacatcc gcacccacac cggcgagaag ccttttgcct 1920
gtgacatttg tgggaggaaa tttgccctgc gccagaccct gcgcgaccat accaagatac 1980
acacgggcag ccaaaagccc ttccagtgtc gaatctgcat gcgtaacttc agtacctccg 2040
gcaacctgac ccgccacatc cgcacccaca ccggcgagaa gccttttgcc tgtgacattt 2100
gtgggaggaa atttgccgac cgctccgccc tggcccgcca taccaagata cacacgggat 2160
ctcagaagcc cttccagtgt cgaatctgca tgcgtaactt cagtcgctcc gacgtgctgt 2220
ccgagcacat ccgcacccac accggcgaga agccttttgc ctgtgacatt tgtgggagga 2280
aatttgcccg caacttctcc ctgaccatgc atgcccagag atgcggactg cggggatccc 2340
aacttgtgaa atcagaattg gaagagaaaa agtctgagct tagacacaaa ttgaagtacg 2400
ttccacatga atatatcgaa cttatcgaga ttgctaggaa ctcaacacag gacagaattt 2460
tggagatgaa ggttatggag ttctttatga aagtgtacgg atatagggga aagcaccttg 2520
gtggttctag gaaacctgat ggtgcaatct acactgtggg atcacctatt gactatggtg 2580
ttatcgtgga tacaaaggca tactctggtg gatacaattt gccaatcgga caagctgacg 2640
aaatgcagag atatgttgaa gagaaccaaa ctagaaacaa acatattaat ccaaatgaat 2700
ggtggaaggt gtatccttca tctgttacag agttcaaatt cctttttgtg tctggacact 2760
ttaagggtaa ctacaaagca cagcttacta ggttgaacca tattacaaat tgcaatggtg 2820
ctgtgttgtc agttgaagag cttttgatcg gaggtgaaat gattaaggca ggaacactta 2880
ctttggagga agttagaaga aaattcaaca acggtgaaat caatttttga taactcgagc 2940
tcggtcacca gcataatttt tattaatgta ctaaattact gttttgttaa atgcaatttt 3000
gctttctcgg gattttaata tcaaaatcta tttagaaata cacaatattt tgttgcaggc 3060
ttgctggaga atcgatctgc tatcataaaa attacaaaaa aattttattt gcctcaatta 3120
ttttaggatt ggtattaagg acgcttaaat tatttgtcgg gtcactacgc atcattgtga 3180
ttgagaagat cagcgatacg aaatattcgt agtactatcg ataatttatt tgaaaattca 3240
taagaaaagc aaacgttaca tgaattgatg aaacaataca aagacagata aagccacgca 3300
catttaggat attggccgag attactgaat attgagtaag atcacggaat ttctgacagg 3360
agcatgtctt caattcagcc caaatggcag ttgaaatact caaaccgccc catatgcagg 3420
agcggatcat tcattgtttg tttggttgcc tttgccaaca tgggagtcca aggtt 3475
<210> 275
<211> 2019
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 275
gcccaaggaa cccttttctg ggccatcttc gtactcggcc acgactggta atttaatgga 60
tccaaccgac aaccactttg cggacttcct ttcaagagaa ttcaataagg ttaattccta 120
attgaaatcc gaagataaga ttcccacaca cttgtggctg atatcaaaag gctactgcct 180
atttaaacac atctctggag actgagaaaa tcagacctcc aagcatgaag aagcctgagc 240
ttactgctac ttctgttgag aagttcctca tcgagaagtt cgattctgtg tctgatctta 300
tgcagctctc tgagggtgag gaatcaagag ctttctcttt cgatgttggt ggaagaggat 360
acgttctcag agttaactct tgcgctgacg gattctacaa ggatagatac gtgtacagac 420
acttcgcttc agctgctctc cctatccctg aagttcttga tatcggagag ttctctgagt 480
ctcttaccta ctgtatctca agaagggctc agggtgttac tcttcaagat cttcctgaga 540
ctgagcttcc tgctgttctt caacctgttg ctgaggctat ggatgctatc gctgctgctg 600
atctttctca aacttctgga ttcggacctt tcggtcctca gggaatcgga cagtacacta 660
cttggagaga tttcatctgc gctatcgctg atcctcatgt ttaccattgg cagaccgtta 720
tggatgatac cgtttctgct tctgttgctc aagctcttga tgagcttatg ctttgggctg 780
aggattgtcc tgaggttaga catcttgttc acgctgattt cggatctaac aacgttctca 840
ccgataacgg aagaatcacc gctgttatcg attggtctga ggctatgttc ggagattctc 900
aatacgaggt ggccaacata ttcttttgga ggccttggct tgcttgtatg gaacaacaga 960
ctagatactt cgagagaagg catcctgagc ttgctggatc tcctagactt agagcttaca 1020
tgcttaggat cggacttgat cagctttacc agtctctcgt tgatggaaac ttcgatgatg 1080
ctgcttgggc tcagggaaga tgtgatgcta tcgttagatc tggtgctgga actgttggaa 1140
gaactcaaat cgctagaaga tctgctgctg tttggactga tggatgtgtt gaagttctcg 1200
ctgattctgg aaacagaagg ccttctacta gacctagagc caagaagtga agatcggcgg 1260
caatagcttc ttagcgccat cccgggttga tcctatctgt gttgaaatag ttgcggtggg 1320
caaggctctc tttcagaaag acaggcggcc aaaggaaccc aaggtgaggt gggctatggc 1380
tctcagttcc ttgtggaagc gcttggtcta aggtgcagag gtgttagcgg gatgaagcaa 1440
aagtgtccga ttgtaacaag atatgttgat cctacgtaag gatattaaag tatgtattca 1500
tcactaatat aatcagtgta ttccaatatg tactacgatt tccaatgtct ttattgtcgc 1560
cgtatgtaat cggcgtcaca aaataatccc cggtgacttt cttttaatcc aggatgaaat 1620
aatatgttat tataattttt gcgatttggt ccgttatagg aattgaagtg tgcttgcggt 1680
cgccaccact cccatttcat aattttacat gtatttgaaa aataaaaatt tatggtattc 1740
aatttaaaca cgtatacttg taaagaatga tatcttgaaa gaaatatagt ttaaatattt 1800
attgataaaa taacaagtca ggtattatag tccaagcaaa aacataaatt tattgatgca 1860
agtttaaatt cagaaatatt tcaataactg attatatcag ctggtacatt gccgtagatg 1920
aaagactgag tgcgatatta tggtgtaata catagcggcc gcgcccaagg aacccttttc 1980
tgggccatct tcgtactcgg ccacgactgg taatttaat 2019
<210> 276
<211> 2666
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 276
gcccaaggaa cccttttctg ggccatcttc gtactcggcc acgactggta atttaatgga 60
tccactagta acggccgcca gtgtgctgga attcgccctt cgtcgacctg caggtcaacg 120
gatcaggata ttcttgttta agatgttgaa ctctatggag gtttgtatga actgatgatc 180
taggaccgga taagttccct tcttcatagc gaacttattc aaagaatgtt ttgtgtatca 240
ttcttgttac attgttatta atgaaaaaat attattggtc attggactga acacgagtgt 300
taaatatgga ccaggcccca aataagatcc attgatatat gaattaaata acaagaataa 360
atcgagtcac caaaccactt gcctttttta acgagacttg ttcaccaact tgatacaaaa 420
gtcattatcc tatgcaaatc aataatcata caaaaatatc caataacact aaaaaattaa 480
aagaaatgga taatttcaca atatgttata cgataaagaa gttacttttc caagaaattc 540
actgatttta taagcccact tgcattagat aaatggcaaa aaaaaacaaa aaggaaaaga 600
aataaagcac gaagaattct agaaaatacg aaatacgctt caatgcagtg ggacccacgg 660
ttcaattatt gccaattttc agctccaccg tatatttaaa aaataaaacg ataatgctaa 720
aaaaatataa atcgtaacga tcgttaaatc tcaacggctg gatcttatga cgaccgttag 780
aaattgtggt tgtcgacgag tcagtaataa acggcgtcaa agtggttgca gccggcacac 840
acgagtcgtg tttatcaact caaagcacaa atacttttcc tcaacctaaa aataaggcaa 900
ttagccaaaa acaactttgc gtgtaaacaa cgctcaatac acgtgtcatt ttattattag 960
ctattgcttc accgccttag ctttctcgtg acctagtcgt cctcgtcttt tcttcttctt 1020
cttctataaa acaataccca aagagctctt cttcttcaca attcagattt caatttctca 1080
aaatcttaaa aactttctct caattctctc taccgtgatc aaggtaaatt tctgtgttcc 1140
ttattctctc aaaatcttcg attttgtttt cgttcgatcc caatttcgta tatgttcttt 1200
ggtttagatt ctgttaatct tagatcgaag acgattttct gggtttgatc gttagatatc 1260
atcttaattc tcgattaggg tttcatagat atcatccgat ttgttcaaat aatttgagtt 1320
ttgtcgaata attactcttc gatttgtgat ttctatctag atctggtgtt agtttctagt 1380
ttgtgcgatc gaatttgtcg attaatctga gtttttctga ttaacagatg agaggatctg 1440
gatctgagtc tgatgagtct ggacttcctg ctatggaaat cgagtgtaga atcactggaa 1500
cccttaacgg tgttgagttc gagcttgttg gaggtggtga gggaactcct gagcagggaa 1560
gaatgactaa caagatgaag tctaccaagg gtgctcttac cttctctcca taccttcttt 1620
ctcacgttat gggatacgga ttctaccact tcggaactta cccatctgga tacgagaacc 1680
ctttccttca tgctatcaac aacggtggat acaccaacac taggatcgag aagtacgagg 1740
atggtggtgt tcttcacgtt agcttctctt acagatacga ggctggaaga gtgatcggag 1800
atttcaaggt tatgggaact ggattccctg aggattctgt tatcttcacc gacaagatca 1860
tcaggtctaa cgctactgtt gagcatcttc atcctatggg agataacgat ctcgatggat 1920
ctttcaccag aaccttctca cttagagatg gtggttacta ctcttctgtg gtggattctc 1980
acatgcactt caagtctgct atccaccctt ctatccttca aaacggtgga cctatgttcg 2040
ctttcagaag agttgaggaa gatcactcta acaccgagct tggaatcgtt gagtaccaac 2100
atgctttcaa gacccctgat gctgatgctg gtgaggaatg ataatatcaa aatctattta 2160
gaaatacaca atattttgtt gcaggcttgc tggagaatcg atctgctatc ataaaaatta 2220
caaaaaaatt ttatttgcct caattatttt aggattggta ttaaggacgc ttaaattatt 2280
tgtcgggtca ctacgcatca ttgtgattga gaagatcagc gatacgaaat attcgtagta 2340
ctatcgataa tttatttgaa aattcataag aaaagcaaac gttacatgaa ttgatgaaac 2400
aatacaaaga cagataaagc cacgcacatt taggatattg gccgagatta ctgaatattg 2460
agtaagatca cggaatttct gacaggagca tgtcttcaat tcagcccaaa tggcagttga 2520
aatactcaaa ccgccccata tgcaggagcg gatcattcat tgtttgtttg gttgcctttg 2580
ccaacatggg agtccaaggt tgcggccgcg cccaaggaac ccttttctgg gccatcttcg 2640
tactcggcca cgactggtaa tttaat 2666
<210> 277
<211> 2020
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 277
gcccaaggaa cccttttctg ggccatcttc gtactcggcc acgactggta atttaatgga 60
tccaaccgac aaccactttg cggacttcct ttcaagagaa ttcaataagg ttaattccta 120
attgaaatcc gaagataaga ttcccacaca cttgtggctg atatcaaaag gctactgcct 180
atttaaacac atctctggag actgagaaaa tcagacctcc aagcatgaag aagcctgagc 240
ttactgctac ttctgttgag aagttcctca tcgagaagtt cgattctgtg tctgatctta 300
tgcagctctc tgagggtgag gaatcaagag ctttctcttt cgatgttggt ggaagaggat 360
acgttctcag agttaactct tgcgctgacg gattctacaa ggatagatac gtgtacagac 420
acttcgcttc agctgctctc cctatccctg aagttcttga tatcggagag ttctctgagt 480
ctcttaccta ctgtatctca agaagggctc agggtgttac tcttcaagat cttcctgaga 540
ctgagcttcc tgctgttctt caacctgttg ctgaggctat ggatgctatc gctgctgctg 600
atctttctca aacttctgga ttcggacctt tcggtcctca gggaatcgga cagtacacta 660
cttggagaga tttcatctgc gctatcgctg atcctcatgt ttaccattgg cagaccgtta 720
tggatgatac cgtttctgct tctgttgctc aagctcttga tgagcttatg ctttgggctg 780
aggattgtcc tgaggttaga catcttgttc acgctgattt cggatctaac aacgttctca 840
ccgataacgg aagaatcacc gctgttatcg attggtctga ggctatgttc ggagattctc 900
aatacgaggt ggccaacata ttcttttgga ggccttggct tgcttgtatg gaacaacaga 960
ctagatactt cgagagaagg catcctgagc ttgctggatc tcctagactt agagcttaca 1020
tgcttaggat cggacttgat cagctttacc agtctctcgt tgatggaaac ttcgatgatg 1080
ctgcttgggc tcagggaaga tgtgatgcta tcgttagatc tggtgctgga actgttggaa 1140
gaactcaaat cgctagaaga tctgctgctg tttggactga tggatgtgtt gaagttctcg 1200
ctgattctgg aaacagaagg ccttctacta gacctagagc caagaagtga agatcggcgg 1260
caatagcttc ttagcgccat cccgggttga tcctatctgt gttgaaatag ttgcggtggg 1320
caaggctctc tttcagaaag acaggcggcc aaaggaaccc aaggtgaggt gggctatggc 1380
tctcagttcc ttgtggaagc gcttggtcta aggtgcagag gtgttagcgg gatgaagcaa 1440
aagtgtccga ttgtaacaag atatgttgat cctacgtaag gatattaaag tatgtattca 1500
tcactaatat aatcagtgta ttccaatatg tactacgatt tccaatgtct ttattgtcgc 1560
cgtatgtaat cggcgtcaca aaataatccc cggtgacttt cttttaatcc aggatgaaat 1620
aatatgttat tataattttt gcgatttggt ccgttatagg aattgaagtg tgcttgcggt 1680
cgccaccact cccatttcat aattttacat gtatttgaaa aataaaaatt tatggtattc 1740
aatttaaaca cgtatacttg taaagaatga tatcttgaaa gaaatatagt ttaaatattt 1800
attgataaaa taacaagtca ggtattatag tccaagcaaa aacataaatt tattgatgca 1860
agtttaaatt cagaaatatt tcaataactg attatatcag ctggtacatt gccgtagatg 1920
aaagactgag tgcgatatta tggtgtaata catagcggcc gcagcgagag aaagcttatt 1980
gcaacttcaa ctacttgctg gtcgatcgtg ttggccactc 2020
<210> 278
<211> 2667
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 278
gcccaaggaa cccttttctg ggccatcttc gtactcggcc acgactggta atttaatgga 60
tccactagta acggccgcca gtgtgctgga attcgccctt cgtcgacctg caggtcaacg 120
gatcaggata ttcttgttta agatgttgaa ctctatggag gtttgtatga actgatgatc 180
taggaccgga taagttccct tcttcatagc gaacttattc aaagaatgtt ttgtgtatca 240
ttcttgttac attgttatta atgaaaaaat attattggtc attggactga acacgagtgt 300
taaatatgga ccaggcccca aataagatcc attgatatat gaattaaata acaagaataa 360
atcgagtcac caaaccactt gcctttttta acgagacttg ttcaccaact tgatacaaaa 420
gtcattatcc tatgcaaatc aataatcata caaaaatatc caataacact aaaaaattaa 480
aagaaatgga taatttcaca atatgttata cgataaagaa gttacttttc caagaaattc 540
actgatttta taagcccact tgcattagat aaatggcaaa aaaaaacaaa aaggaaaaga 600
aataaagcac gaagaattct agaaaatacg aaatacgctt caatgcagtg ggacccacgg 660
ttcaattatt gccaattttc agctccaccg tatatttaaa aaataaaacg ataatgctaa 720
aaaaatataa atcgtaacga tcgttaaatc tcaacggctg gatcttatga cgaccgttag 780
aaattgtggt tgtcgacgag tcagtaataa acggcgtcaa agtggttgca gccggcacac 840
acgagtcgtg tttatcaact caaagcacaa atacttttcc tcaacctaaa aataaggcaa 900
ttagccaaaa acaactttgc gtgtaaacaa cgctcaatac acgtgtcatt ttattattag 960
ctattgcttc accgccttag ctttctcgtg acctagtcgt cctcgtcttt tcttcttctt 1020
cttctataaa acaataccca aagagctctt cttcttcaca attcagattt caatttctca 1080
aaatcttaaa aactttctct caattctctc taccgtgatc aaggtaaatt tctgtgttcc 1140
ttattctctc aaaatcttcg attttgtttt cgttcgatcc caatttcgta tatgttcttt 1200
ggtttagatt ctgttaatct tagatcgaag acgattttct gggtttgatc gttagatatc 1260
atcttaattc tcgattaggg tttcatagat atcatccgat ttgttcaaat aatttgagtt 1320
ttgtcgaata attactcttc gatttgtgat ttctatctag atctggtgtt agtttctagt 1380
ttgtgcgatc gaatttgtcg attaatctga gtttttctga ttaacagatg agaggatctg 1440
gatctgagtc tgatgagtct ggacttcctg ctatggaaat cgagtgtaga atcactggaa 1500
cccttaacgg tgttgagttc gagcttgttg gaggtggtga gggaactcct gagcagggaa 1560
gaatgactaa caagatgaag tctaccaagg gtgctcttac cttctctcca taccttcttt 1620
ctcacgttat gggatacgga ttctaccact tcggaactta cccatctgga tacgagaacc 1680
ctttccttca tgctatcaac aacggtggat acaccaacac taggatcgag aagtacgagg 1740
atggtggtgt tcttcacgtt agcttctctt acagatacga ggctggaaga gtgatcggag 1800
atttcaaggt tatgggaact ggattccctg aggattctgt tatcttcacc gacaagatca 1860
tcaggtctaa cgctactgtt gagcatcttc atcctatggg agataacgat ctcgatggat 1920
ctttcaccag aaccttctca cttagagatg gtggttacta ctcttctgtg gtggattctc 1980
acatgcactt caagtctgct atccaccctt ctatccttca aaacggtgga cctatgttcg 2040
ctttcagaag agttgaggaa gatcactcta acaccgagct tggaatcgtt gagtaccaac 2100
atgctttcaa gacccctgat gctgatgctg gtgaggaatg ataatatcaa aatctattta 2160
gaaatacaca atattttgtt gcaggcttgc tggagaatcg atctgctatc ataaaaatta 2220
caaaaaaatt ttatttgcct caattatttt aggattggta ttaaggacgc ttaaattatt 2280
tgtcgggtca ctacgcatca ttgtgattga gaagatcagc gatacgaaat attcgtagta 2340
ctatcgataa tttatttgaa aattcataag aaaagcaaac gttacatgaa ttgatgaaac 2400
aatacaaaga cagataaagc cacgcacatt taggatattg gccgagatta ctgaatattg 2460
agtaagatca cggaatttct gacaggagca tgtcttcaat tcagcccaaa tggcagttga 2520
aatactcaaa ccgccccata tgcaggagcg gatcattcat tgtttgtttg gttgcctttg 2580
ccaacatggg agtccaaggt tgcggccgca gcgagagaaa gcttattgca acttcaacta 2640
cttgctggtc gatcgtgttg gccactc 2667
<210> 279
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 279
gattcctaag cattgttggg tc 22
<210> 280
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 280
gaaaatctca tatcgaacgt gcgt 24
<210> 281
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 281
cgcttaccct ctctatctgg taa 23
<210> 282
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 282
ccttgcctct gtaccaaggc ag 22
<210> 283
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 283
gtgtgtggga atcttatctt cgg 23
<210> 284
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 284
caagtcaggt attatagtcc aagca 25
<210> 285
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 285
caagaatatc ctgatccgtt gac 23
<210> 286
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 286
tggcagttga aatactcaaa cc 22
<210> 287
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 287
gtcctttgag atccatgagc tat 23
<210> 288
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 288
gattcctaag cattgttggg ta 22
<210> 289
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 289
tgcgttcaag aaatcaaaga ca 22
<210> 290
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 290
gaaaatctca tatcgaacgt gcgg 24
<210> 291
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 291
tctggtaaat cctaattcct c 21
<210> 292
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 292
ccttgcctct gtaccaaggc aa 22
<210> 293
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 293
cttgcctctg taccaaggca acttc 25
<210> 294
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 294
cttacatgct taggatcgga cttg 24
<210> 295
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 295
agttccagca ccagatctaa cg 22
<210> 296
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
probe
<400> 296
ccctgagccc aagcagcatc atcg 24
<210> 297
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 297
cggagagggc gtggaagg 18
<210> 298
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 298
ttcgatttgc tacagcgtca ac 22
<210> 299
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
probe
<400> 299
aggcaccatc gcaggcttcg ct 22
<210> 300
<211> 92
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 300
ttctggcctc tttattgggc cgcccaagga acccttttct gggccatctt cgtactcggc 60
cacgactggt aatttaatgg atccactagt aa 92
<210> 301
<211> 92
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 301
ttctggcctc tttattgggc cgcccaagga acccttttct gggccatctt cgtactcggc 60
cacgactggt aatttaatgg atccactagt aa 92
<210> 302
<211> 119
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 302
ttctggcctc tttattgggc cgcccaagga acccttttct gggccatcca gtcgtggccg 60
agtacgaaga tggcccagat actcggccac gactggtaat ttaatggatc cactagtaa 119
<210> 303
<211> 89
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 303
ttctggcctc tttattgggc cgcccaagga acccttttct gggccatcgt actcggccac 60
gactggtaat ttaatggatc cactagtaa 89
<210> 304
<211> 137
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 304
ttctggcctc tttattgggc cgcccaagga acccttttct aggtatctca gttcggtgta 60
ggtcgttcgc tccaagctgg gctgcgtgca cgaaccgtac tcggccacga ctggtaattt 120
aatggatcca ctagtaa 137
<210> 305
<211> 75
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 305
ttctggcctc tttattgggc cgcccaagga acccttttct gggccagact ggtaatttaa 60
tggatccact agtaa 75
<210> 306
<211> 87
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 306
tccaaggttg cggccgcgcc caaggaaccc ttttctgggc catcttcgta ctcggccacg 60
actggtaatt taattttcaa tttattt 87
<210> 307
<211> 82
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 307
tccaaggttg cggccgcgcc caaggaaccc ttttctgggc cattactcgg ccacgactgg 60
taatttaatt ttcaatttat tt 82
<210> 308
<211> 83
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 308
tccaaggttg cggccgcgcc caaggaaccc ttttctgggc catttactcg gccacgactg 60
gtaatttaat tttcaattta ttt 83
<210> 309
<211> 41
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 309
cgtactcggc cacgactggt aatttaattt tcaatttatt t 41
<210> 310
<211> 87
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 310
tccaaggttg cggccgcgcc caaggaaccc ttttctgggc catcttcgta ctcggccacg 60
actggtaatt taattttcaa tttattt 87
<210> 311
<211> 74
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 311
tccaaggttg cggccgcgcc caaggaaccc ttttctgggc catcttctgg taatttaatt 60
ttcaatttat tttt 74
<210> 312
<211> 132
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 312
tccaaggttg cggccgcgcc caaggaaccc ttttctggta gcggtggttt ttttgtttgc 60
aagcagcaga ttacgcgcag aaaaaaagga tcgtactcgg ccacgactgg taatttaatt 120
ttcaatttat tt 132
<210> 313
<211> 138
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 313
tccaaggttg cggccgcgcc caaggaaccc ttttctgggc catcttacga gcgtaatggc 60
tggcctgttg aacaagtctg gaaagaaatg cataaacata tcccagccac gactggtaat 120
ttaattttca atttattt 138
<210> 314
<211> 88
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 314
tagtttattt gccccaagcg agagaaagct tattgcaact tcaactcgta ctcggccacg 60
actggtaatt taatggatcc actagtaa 88
<210> 315
<211> 46
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 315
tagtttattt gccccaagcg agagaaagct tattgcaact tcaact 46
<210> 316
<211> 46
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 316
tagtttattt gccccaagcg agagaaagct tattgcaact tcaacg 46
<210> 317
<211> 89
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 317
tagtttattt gccccaagcg agagaaagct tattgcaact tcaacttcgt actcggccac 60
gactggtaat ttaatggatc cactagtaa 89
<210> 318
<211> 89
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 318
tagtttattt gccccaagcg agagaaagct tattgcaact tcaactatgt actcggccac 60
gactggtaat ttaatggatc cactagtaa 89
<210> 319
<211> 83
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 319
tagtttattt gccccaagcg agagaaagct tattgcaact tcatactcgg ccacgactgg 60
taatttaatg gatccactag taa 83
<210> 320
<211> 26
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 320
aggtaattta atggatccac tagtaa 26
<210> 321
<211> 89
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 321
tccaaggttg cggccgcagc gagagaaagc ttattgcaac ttcaactact tgctggtcga 60
tcgtgttggc cactcttgtt tatctatca 89
<210> 322
<211> 86
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 322
tccaaggttg cggccgcagc gagagaaagc ttattgcaac ttcaacttgc tggtcgatcg 60
tgttggccac tcttgtttat ctatca 86
<210> 323
<211> 149
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 323
tccaaggttg cggccgcgcg ccgacccagc tttcttgtac aaagttggca ttataagaaa 60
gcattgctta tcaatttgtt gcaacgaaca ggtcactatc agtcaaaact tgctggtcga 120
tcgtgttggc cactcttgtt tatctatca 149
<210> 324
<211> 86
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 324
tccaaggttt gcggccgcag cgagagaaag cttattgcaa cttcacttgc tggtcgatcg 60
tgttggccac tcttgtttat ctatca 86
<210> 325
<211> 121
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 325
tccaaggttg cggccgcagc gagagaaagc ttattgcaac ttcagataaa agttgctcgc 60
ctgtgtgggt gtggatgcta cttgctggtc gatcgtgttg gccactcttg tttatctatc 120
a 121
<210> 326
<211> 94
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 326
tccaaggttg cggccgcagc gagagaaagc ttattgcaac ttcaactaca ctacttgctg 60
gtcgatcgtg ttggccactc ttgtttatct atca 94
<210> 327
<211> 89
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 327
tccaaggttg cggccgcagc gagagaaagc ttattgcaac ttcaactact tgctggtcga 60
tcgtgttggc cactcttgtt tatctatca 89
<210> 328
<211> 99
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 328
ttctggcctc tttattgggc cgcccaagga acccttttct gggccatctt cgtactcggc 60
cacgactggt aatttaatgg atccaaccga caaccactt 99
<210> 329
<211> 87
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<221> modified_base
<222> (38)..(40)
<223> a, c, t, g, unknown or other
<400> 329
ttctggcctc tttattgggc cgcccaagga accctttnnn tactcggcca cgactggtaa 60
tttaatggat ccaaccgaca accactt 87
<210> 330
<211> 245
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<220>
<221> modified_base
<222> (43)..(195)
<223> a, c, t, g, unknown or other
<400> 330
ttctggcctc tttattgggc cgcccaagga acccttttct ggnnnnnnnn nnnnnnnnnn 60
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 120
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 180
nnnnnnnnnn nnnnntcgta ctcggccacg actggtaatt taatggatcc aaccgacaac 240
cactt 245
<210> 331
<211> 42
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 331
ttctggcctc tttattgggc cgcccaagga acccttttct gg 42
<210> 332
<211> 462
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<220>
<221> modified_base
<222> (50)..(419)
<223> a, c, t, g, unknown or other
<400> 332
ttctggcctc tttattgggc cgcccaagga acccttttct gggccatctn nnnnnnnnnn 60
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 120
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 180
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 240
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 300
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 360
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnc 420
ggccacgact ggtaatttaa tggatccaac cgacaaccac tt 462
<210> 333
<211> 133
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<220>
<221> modified_base
<222> (48)..(83)
<223> a, c, t, g, unknown or other
<400> 333
ttctggcctc tttattgggc cgcccaagga acccttttct gggccatnnn nnnnnnnnnn 60
nnnnnnnnnn nnnnnnnnnn nnntcgtact cggccacgac tggtaattta atggatccaa 120
ccgacaacca ctt 133
<210> 334
<211> 127
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<220>
<221> modified_base
<222> (50)..(127)
<223> a, c, t, g, unknown or other
<400> 334
ttctggcctc tttattgggc cgcccaagga acccttttct gggccatctn nnnnnnnnnn 60
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 120
nnnnnnn 127
<210> 335
<211> 104
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 335
gtaatacata gcggccgcgc ccaaggaacc cttttctggg ccatcttcgt actcggccac 60
gactggtaat ttaattttca atttattttt tcttcaactt ctta 104
<210> 336
<211> 97
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<221> modified_base
<222> (45)..(48)
<223> a, c, t, g, unknown or other
<400> 336
gtaatacata gcggccgcgc ccaaggaacc cttttctggg ccatnnnngc cacgactggt 60
aatttaattt tcaatttatt ttttcttcaa cttctta 97
<210> 337
<211> 202
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<220>
<221> modified_base
<222> (47)..(158)
<223> a, c, t, g, unknown or other
<400> 337
gtaatacata gcggccgcgc ccaaggaacc cttttctggg ccatctnnnn nnnnnnnnnn 60
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 120
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnga ctggtaattt aattttcaat 180
ttattttttc ttcaacttct ta 202
<210> 338
<211> 202
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<220>
<221> modified_base
<222> (47)..(158)
<223> a, c, t, g, unknown or other
<400> 338
gtaatacata gcggccgcgc ccaaggaacc cttttctggg ccatctnnnn nnnnnnnnnn 60
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 120
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnga ctggtaattt aattttcaat 180
ttattttttc ttcaacttct ta 202
<210> 339
<211> 334
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<220>
<221> modified_base
<222> (45)..(278)
<223> a, c, t, g, unknown or other
<400> 339
gtaatacata gcggccgcgc ccaaggaacc cttttctggg ccatnnnnnn nnnnnnnnnn 60
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 120
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 180
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 240
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnngt actcggccac gactggtaat 300
ttaattttca atttattttt tcttcaactt ctta 334
<210> 340
<211> 45
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 340
gtactcggcc acgactggta atttaatttt tctttcaact tctta 45
<210> 341
<211> 88
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<221> modified_base
<222> (25)..(33)
<223> a, c, t, g, unknown or other
<400> 341
gtaatacata gcggccgcgc ccaannnnnn nnntactcgg ccacgactgg taatttaatt 60
ttcaatttat tttttcttca acttctta 88
<210> 342
<211> 89
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<221> modified_base
<222> (45)..(51)
<223> a, c, t, g, unknown or other
<400> 342
tgtaatacat agcggccgcg cccaaggaac cctttactcg gccannnnnn ntaatttaat 60
tttcaattta ttttttcttc aacttctta 89
<210> 343
<211> 99
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 343
ttctggcctc tttattgggc cgcccaagga acccttttct gggccatctt cgtactcggc 60
cacgactggt aatttaatgg atccaaccga caaccactt 99
<210> 344
<211> 305
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<220>
<221> modified_base
<222> (50)..(255)
<223> a, c, t, g, unknown or other
<400> 344
ttctggcctc tttattgggc cgcccaagga acccttttct gggccatctn nnnnnnnnnn 60
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 120
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 180
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 240
nnnnnnnnnn nnnnntcgta ctcggccacg actggtaatt taatggatcc aaccgacaac 300
cactt 305
<210> 345
<211> 465
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<220>
<221> modified_base
<222> (50)..(422)
<223> a, c, t, g, unknown or other
<400> 345
ttctggcctc tttattgggc cgcccaagga acccttttct gggccatctn nnnnnnnnnn 60
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 120
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 180
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 240
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 300
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 360
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 420
nncggccacg actggtaatt taatggatcc aaccgacaac cactt 465
<210> 346
<211> 93
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<221> modified_base
<222> (45)..(49)
<223> a, c, t, g, unknown or other
<400> 346
ttctggcctc tttattgggc cgcccaagga acccttttct gggcnnnnnt cggccacgac 60
tggtaattta atggatccaa ccgacaacca ctt 93
<210> 347
<211> 103
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 347
gtaatacata gcggccgcag cgagagaaag cttattgcaa cttcaactac ttgctggtcg 60
atcgtgttgg ccactcttgt ttatctatca ttcctcgttg gtc 103
<210> 348
<211> 330
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<220>
<221> modified_base
<222> (48)..(276)
<223> a, c, t, g, unknown or other
<400> 348
gtaatacata gcggccgcag cgagagaaag cttattgcaa cttcaacnnn nnnnnnnnnn 60
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 120
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 180
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 240
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnncttg ctggtcgatc gtgttggcca 300
ctcttgttta tctatcattc ctcgttggtc 330
<210> 349
<211> 129
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<220>
<221> modified_base
<222> (48)..(73)
<223> a, c, t, g, unknown or other
<400> 349
gtaatacata gcggccgcag cgagagaaag cttattgcaa cttcaacnnn nnnnnnnnnn 60
nnnnnnnnnn nnntacttgc tggtcgatcg tgttggccac tcttgtttat ctatcattcc 120
tcgttggtc 129
<210> 350
<211> 135
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<220>
<221> modified_base
<222> (48)..(80)
<223> a, c, t, g, unknown or other
<400> 350
gtaatacata gcggccgcag cgagagaaag cttattgcaa cttcaacnnn nnnnnnnnnn 60
nnnnnnnnnn nnnnnnnnnn acttgctggt cgatcgtgtt ggccactctt gtttatctat 120
cattcctcgt tggtc 135
<210> 351
<211> 118
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<220>
<221> modified_base
<222> (48)..(64)
<223> a, c, t, g, unknown or other
<400> 351
gtaatacata gcggccgcag cgagagaaag cttattgcaa cttcaacnnn nnnnnnnnnn 60
nnnncttgct ggtcgatcgt gttggccact cttgtttatc tatcattcct cgttggtc 118
<210> 352
<211> 592
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 352
cgcccaagga acccttttct gggccatggg tttcgccacc tctgacttga gcgtcgattt 60
ttaaccaata ggccgaaatc ggcaaaatcc cttataaatc aaaagaatag accgagatag 120
ggttgagtgg ccgctacagg gcgctcccat tcgccattca ggctgcgcaa ctgttgggaa 180
gggcgtttcg gtgcgggcct cttcgctatt acgccagctg gcgaaagggg gatgtgctgc 240
aaggcgatta agttgggtaa cgccagggtt ttcccagtca cgacgttgta aaacgacggc 300
cagtgagcgc gacgtaatac gactcactat agggcgaatt ggcggaaggc cgtcaaggcc 360
gcatcaacga gctcgtgcac gcccaaggaa cccttttctg ggccatcccg cgcaattggc 420
gagtttggcg cggtgtcggt ggtttccggc tcgattcgcg gcgaaaccat actcggccac 480
gactggtaat ttaatggatc caaccgacaa ccactttgcg gacttccttt caagagaatt 540
caataaggtt aattcctaat tgaaatccga agataagatt cccacacact tg 592
<210> 353
<211> 307
<212> DNA
<213> Brassica napus
<400> 353
tccatgagct acgtcgcgag agacattttc tccgtcgtgg ctctggccgt cgccgccgtg 60
tattttgata gctggttctt ctggcctctt tattgggccg cccaaggaac ccttttctgg 120
gccattactc ggccacgact ggtaatttaa tggatccaac cgacaaccac tttgcggact 180
tcctttcaag agaattcaat aaggttaatt cctaattgaa atccgaagat aagattccca 240
cacacttgtg gctgatatca aaaggctact gcctatttaa acacatctct ggagaatgag 300
aaaatca 307
<210> 354
<211> 687
<212> DNA
<213> Brassica napus
<400> 354
ccatgagcta cgtcgcgaga gacattttct ccgtcgtggc tctggccgtc gccgccgtgt 60
attttgatag ctggttcttc tggcctcttt attgggccgc ccaaggaacc cttttctggg 120
ccatgggttt cgccacctct gacttgagcg tcgattttta accaataggc cgaaatcggc 180
aaaatccctt ataaatcaaa agaatagacc gagatagggt tgagtggccg ctacagggcg 240
ctcccattcg ccattcaggc tgcgcaactg ttgggaaggg cgtttcggtg cgggcctctt 300
cgctattacg ccagctggcg aaagggggat gtgctgcaag gcgattaagt tgggtaacgc 360
cagggttttc ccagtcacga cgttgtaaaa cgacggccag tgagcgcgac gtaatacgac 420
tcactatagg gcgaattggc ggaaggccgt caaggccgca tcaacgagct cgtgcacgcc 480
caaggaaccc ttttctgggc catcccgcgc aattggcgag tttggcgcgg tgtcggtggt 540
ttccggctcg attcgcggcg aaaccatact cggccacgac tggtaattta atggatccaa 600
ccgacaacca ctttgcggac ttcctttcaa gagaattcaa taaggttaat tcctaattga 660
aatccgaaga taagattccc acacact 687
<210> 355
<211> 618
<212> DNA
<213> Brassica napus
<400> 355
tgtcgcgaga gacattttct ccgtcgtggc tctggccgtc gccgccgtgt attttgatag 60
ctggttcttc tggcctcttt attgggccgc ccaaggaacc cttttctggg ccaaaaggcc 120
gcgttgctgg cgtttttcca taggctccgc ccccctgacg agcatcacaa aaatcgacgc 180
tcaagtcaga ggtggcgaaa cccgacagga ctataaagat accaggcgtt tccccctgga 240
agctccctcg tgcgctctcc tgttccgacc ctgccgctta ccggatacct gtccgccttt 300
ctcccttcgg gaagcgtggc gctttctcat agctcacgct gtaggtatct cagttcggtg 360
taggtcgttc gctccaagct gggctgtgtg cacgaacccc ccgttcagcc cgaccgctgc 420
gccttatccg gtaactatcg tcttgagtcc aacccggtaa gacacgactt atcgccactg 480
gcagcagcca ctggtagtac tcggccacga ctggtaattt aatggatcca accgacaacc 540
actttgcgga cttcctttca agagaattca ataaggttaa ttcctaattg aaatccgaag 600
ataagattcc cacacact 618
<210> 356
<211> 332
<212> DNA
<213> Brassica napus
<400> 356
tttgtccttt gagatccatg agctacgtcg cgagagacat tttctccgtc gtggctctgg 60
ccgtcgccgc cgtgtatttt gatagctggt tcttctggcc tctttattgg gccgcccaag 120
gaaccctttt ctgggccatc ttactcggcc acgactggta atttaatgga tccaaccgac 180
aaccactttg cggacttcct ttcaagagaa ttcaataagg ttaattccta attgaaatcc 240
gaagataaga ttcccacaca cttgtggctg atatcaaaag gctactgcct atttaaacac 300
atctctggag actgagaaaa tcagacctcc aa 332
<210> 357
<211> 370
<212> DNA
<213> Brassica napus
<400> 357
catgagctac gtcgcgagag acattttctc cgtcgtggct ctggccgtcg ccgccgtgta 60
ttttgatagc tggttcttct ggcctcttta ttgggccgcc caaggaaccc ttttctgggc 120
tacttacgcc agagaaataa ctggctggct gctacaccat gttgccgggc aacgagggag 180
accgtcagta ctcggccacg actggtaatt taatggatcc aaccgacaac cactttgcgg 240
acttcctttc aagagaattc aataaggtta attcctaatt gaaatccgaa gataagattc 300
ccacacactt gtggctgata tcaaaaggct actgcctatt taaacacatc tctggagact 360
gagaaaatca 370
<210> 358
<211> 625
<212> DNA
<213> Brassica napus
<400> 358
tgagctacgt cgcgagagac attttctccg tcgtggctct ggccgtcgcc gccgtgtatt 60
ttgatagctg gttcttctgg cctctttatt gggccgccca aggaaccctt ttctgggcca 120
aaaggccgcg ttgctggcgt ttttccatag gctccgcccc cctgacgagc atcacaaaaa 180
tcgacgctca agtcagaggt ggcgaaaccc gacaggacta taaagatacc aggcgtttcc 240
ccctggaagc tccctcgtgc gctctcctgt tccgaccctg ccgcttaccg gatacctgtc 300
cgcctttctc ccttcgggaa gcgtggcgct ttctcatagc tcacgctgta ggtatctcag 360
ttcggtgtag gtcgttcgct ccaagctggg ctgtgtgcac gaaccccccg ttcagcccga 420
ccgctgcgcc ttatccggta actatcgtct tgagtccaac ccggtaagac acgacttatc 480
gccactggca gcagccactg gtagtactcg gccacgactg gtaatttaat ggatccaacc 540
gacaaccact ttgcggactt cctttcaaga gaattcaata aggttaattc ctaattgaaa 600
tccgaagata agattcccac acact 625
<210> 359
<211> 597
<212> DNA
<213> Brassica napus
<400> 359
cgtcgccgcc gtgtattttg atagctggtt cttctggcct ctttattggg ccgcccaagg 60
aacccttttc tgggccatcg cgttaatatt ttgttaaaat tcgcgttaaa tttttgttaa 120
atcagctcat tttttaacca ataggccgaa atcggcaaaa tcccttataa atcaaaagaa 180
tagaccgaga tagggttgag tggccgctac agggcgctcc cattcgccat tcaggctgcg 240
caactgttgg gaagggcgtt tcggtgcggg cctcttcgct attacgccag ctggcgaaag 300
ggggatgtgc tgcaaggcga ttaagttggg taacgccagg gttttcccag tcacgacgtt 360
gtaaaacgac ggccagtgag cgcgacgtaa tacgactcac tatagggcga attggcggaa 420
ggccgtcaag gccacgtgtc ttgtccagag ctcgtgcacg cccaaggaac ccttttctgg 480
gccatcttcg tactcggcca cgactggtaa tttaatggat ccaaccgaca accactttgc 540
ggacttcctt tcaagagaat tcaataaggt taattcctaa ttgaaatccg aagataa 597
<210> 360
<211> 590
<212> DNA
<213> Brassica napus
<400> 360
ccgtcgccgc cgtgtatttt gatagctggt tcttctggcc tctttattgg gccgcccaag 60
gaaccctttt ctgggccatc gcgttaatat tttgttaaaa ttcgcgttaa atttttgtta 120
aatcagctca ttttttaacc aataggccga aatcggcaaa atcccttata aatcaaaaga 180
atagaccgag atagggttga gtggccgcta cagggcgctc ccattcgcca ttcaggctgc 240
gcaactgttg ggaagggcgt ttcggtgcgg gcctcttcgc tattacgcca gctggcgaaa 300
gggggatgtg ctgcaaggcg attaagttgg gtaacgccag ggttttccca gtcacgacgt 360
tgtaaaacga cggccagtga gcgcgacgta atacgactca ctatagggcg aattggcgga 420
aggccgtcaa ggccacgtgt cttgtccaga gctcgtgcac gcccaaggaa cccttttctg 480
ggccatcttc gtactcggcc acgactggta atttaatgga tccaaccgac aaccactttg 540
cggacttcct ttcaagagaa ttcaataagg ttaattccta attgaaatcc 590
<210> 361
<211> 726
<212> DNA
<213> Brassica napus
<400> 361
gtgcacccaa ctgatcttca gcatcttttt actttcacca gcgtttctgg gtgagcaaaa 60
acaggaaggc aaaatgccgc aaaaaaggga ataagggcga cacggaaatg ttgaatactc 120
atactcttcc tttttcaata ttattgaagc atttatcagg gttattgtct catgagcgga 180
tacatatttg aatgtattta gaaaaataaa caaatagggg ttccgcgcac atttccccga 240
aaagtgccac ctaaattgta agcgttaata ttttgttaaa attcgcgtta aatttttgtt 300
aaatcagctc attttttaac caataggccg aaatcggcaa aatcccttat aaatcaaaag 360
aatagaccca gatagggttg agtggccgct acagggcgct cccattcgcc attcaggctg 420
cgcaactgtt gggaagggcg tttcggtgcg ggcctcttcg ctattacgcc agctggcgaa 480
atgggtcaag tcaggtatta tagtccaagc aaaaacataa atttattgat gcaagtttaa 540
attcagaaat atttcaataa ctgattatat cagctggtac attgccgtag atgaaagact 600
gagtgcgata ttatggtgta atacatagcg gccgcgccca aggaaccctt ttctgggcca 660
tcttcgtact cggccacgac tggtaattta attttcaatt tattttttct tcaacttctt 720
aatttt 726
<210> 362
<211> 296
<212> DNA
<213> Brassica napus
<400> 362
tctcaagtca ggtattatag tccaagcaaa aacataaatt tattgatgca agtttaaatt 60
cagaaatatt tcaataactg attatatcag ctggtacatt gccgtagatg aaagactgag 120
tgcgatatta tggtgtaata catagcggcc gcgcccaagg aacccttttc tgggccatct 180
gccacgactg gtaatttaat tttcaattta ttttttcttc aacttcttaa ttttgatatg 240
tttatatgtt tttttcgttt tttgcatcgt ctttgatttc ttgaacgcac gttcga 296
<210> 363
<211> 558
<212> DNA
<213> Brassica napus
<400> 363
ctctccaagt caggattata gtccaagcaa aaacataaat ttattgatgc aagtttaaat 60
tcagaaatat ttcaataact gattatatca gctggtacat tgccgtagat gaaagactga 120
gtgcgatatt atggtgtaat acatagcggc cgcagcgaga gaaagcttat tgcaacttca 180
attgaagtgt gcttgcggtc gccaccactc ccatttcata attttacatg tatttgaaaa 240
ataaaaattt atggtattca atttaaacac gtatacttgt aaagaatgat atcttgaaag 300
aaatatagtt taaatattct tgctggtcga tcatgttggc cactattgtt tatctatcaa 360
tcctcgttgg tccagtcaca gttacacaag tctatggtgt tccttacctt gcacgcgcca 420
catatttcat tattatatca ttgctaatat aactcgttct tgacataacg ttttggaaaa 480
ctttcagatc tttgtaatgt ggttggacgc tgtcacgtac ttgcatcatc atggtcacga 540
tgataagttg ccttggta 558
<210> 364
<211> 615
<212> DNA
<213> Brassica napus
<400> 364
ggtattatag tccaagcaaa aacataaatt tattgatgca agtttaaatt cagaaatatt 60
tcaataactg attatatcag ctggtacatt gccgtagatg aaagactgag tgcgatatta 120
tggtgtaata catagcggcc gcagcgagag aaagcttatt gcaacttcaa ctacttgctg 180
gtcgatcgtg ttggccactc ggtacctgga gcacaagact ggcctcatgg gccttccgct 240
cactgcccgc tttccagtcg ggaaacctgt cgtgccagct gcattaacgc tcaccggctc 300
cagatttatc agcaataaac cagccagccg gaagggccga gcgcagaagt ggtcctgcaa 360
ctttatccgc ctccatccag tctatcatgt tggccactct tgtttatcta tcattcctcg 420
ttggtccagt cacagttcta aaagtctatg gtgttcctta cattgtaagt ttcatatatt 480
tcattattat atcattgcta atataatttg tttttgacat aaagttttgg aaaaatttca 540
gatctttgta atgtggttgg acgctgtcac gtacttgcat catcatggtc acgatgataa 600
gttgccttgg tacag 615
<210> 365
<211> 364
<212> DNA
<213> Brassica napus
<400> 365
tggcttggag gtctgatttt ctcagtctcc agagatgtgt ttaaataggc agtagccttt 60
tgatatcagc cacaagtgtg tgggaatctt atcttcggat ttcaattagg aattaacctt 120
attgaattct cttgaaagga agtccgcaaa gtggttgtcg gttggatcca ttaaattacc 180
agtcgtggcc gagtagtctg ttgttccata caagcaagcc aaggccgtac tcggccacga 240
ctggtaattt aattttcaat ttattttttc ttcaacttct taattttgat acgtttatat 300
gtttttttcg ttttttgcat cgtctttgat ttcttgaacg cacgttcgat tgtagatttt 360
cgca 364
<210> 366
<211> 500
<212> DNA
<213> Brassica napus
<400> 366
tatctggtaa atcctaattc ctcatttttc ttcctgatta taattacaat tttgaatttt 60
tagattttga gtattaacta aatataaatt aaatttgttt ggggatgact acagtggtac 120
agaagtcctg gtaaagaagg gtcacattat aacccataca gtagtttatt tgccccaagc 180
gagagaaagc ttattgcaac tgaccatgtt aatgcagctg gcacgacagg tttcccgact 240
ggaaagcggg cagtgagcgg aaggcccatg aggccagtct tgtgctccag gtaccgagtg 300
gccaacacga tcgaccagca agtagttgaa gttgcaataa gctttctctc gctgcggccg 360
ctatgtatta caccataata tcgcactcag tctttcatct acggcaatgt accagctgat 420
ataatcagtt attgaaatat ttctgaatta aacttgcatc aataaattta tgtttttgct 480
tggactataa tccctgactt 500
<210> 367
<211> 375
<212> DNA
<213> Brassica napus
<400> 367
gcagtagcct tttgatatca gccacaagtg tgtgggaatc ttatcttcgg atttcaatta 60
ggaattaacc ttattgaatt ctcttgaaag gaagtccgca aagtggttgt cggttggatc 120
cattaaatta ccactacttg ctggtcgatc atgttggcca ctcttgttta tctatcattc 180
ctcgttggtc cagtcacagt tctaaaagtc tatggtgttc cttacattgt aagtttcata 240
tatttcatta ttatatcatt gctaatataa tttgtttttg acataaagtt ttggaaaaat 300
ttcagatctt tgtaatgtgg ttggacgctg tcacgtactt gcatcatcat ggtcacgatg 360
ataagttgcc ttgga 375
<210> 368
<211> 99
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 368
ttctggcctc tttattgggc cgcccaagga acccttttct gggccatctt cgtactcggc 60
cacgactggt aatttaatgg atccaaccga caaccactt 99
<210> 369
<211> 536
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<220>
<221> modified_base
<222> (48)..(489)
<223> a, c, t, g, unknown or other
<400> 369
ttctggcctc tttattgggc cgcccaagga acccttttct gggccatnnn nnnnnnnnnn 60
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 120
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 180
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 240
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 300
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 360
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 420
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 480
nnnnnnnnnt actcggccac gactggtaat ttaatggatc caaccgacaa ccactt 536
<210> 370
<211> 504
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<220>
<221> modified_base
<222> (49)..(454)
<223> a, c, t, g, unknown or other
<400> 370
ttctggcctc tttattgggc cgcccaagga acccttttct gggccatcnn nnnnnnnnnn 60
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 120
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 180
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 240
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 300
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 360
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 420
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnntcgtac tcggccacga ctggtaattt 480
aatggatcca accgacaacc actt 504
<210> 371
<211> 504
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<220>
<221> modified_base
<222> (49)..(454)
<223> a, c, t, g, unknown or other
<400> 371
ttctggcctc tttattgggc cgcccaagga acccttttct gggccatcnn nnnnnnnnnn 60
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 120
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 180
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 240
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 300
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 360
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 420
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnntcgtac tcggccacga ctggtaattt 480
aatggatcca accgacaacc actt 504
<210> 372
<211> 94
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 372
ttctggcctc tttattgggc cgcccaagga acccttttct gggccattac tcggccacga 60
ctggtaattt aatggatcca accgacaacc actt 94
<210> 373
<211> 530
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<220>
<221> modified_base
<222> (49)..(483)
<223> a, c, t, g, unknown or other
<400> 373
ttctggcctc tttattgggc cgcccaagga acccttttct gggccatcnn nnnnnnnnnn 60
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 120
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 180
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 240
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 300
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 360
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 420
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 480
nnntactcgg ccacgactgg taatttaatg gatccaaccg acaaccactt 530
<210> 374
<211> 470
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<220>
<221> modified_base
<222> (46)..(423)
<223> a, c, t, g, unknown or other
<400> 374
ttctggcctc tttattgggc cgcccaagga acccttttct gggccnnnnn nnnnnnnnnn 60
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 120
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 180
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 240
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 300
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 360
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 420
nnntactcgg ccacgactgg taatttaatg gatccaaccg acaaccactt 470
<210> 375
<211> 96
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 375
ttctggcctc tttattgggc cgcccaagga acccttttct gggccatctt actcggccac 60
gactggtaat ttaatggatc caaccgacaa ccactt 96
<210> 376
<211> 104
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 376
gtaatacata gcggccgcgc ccaaggaacc cttttctggg ccatcttcgt actcggccac 60
gactggtaat ttaattttca atttattttt tcttcaactt ctta 104
<210> 377
<211> 95
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 377
gtaatacata gcggccgcgc ccaaggaacc cttttctggg ccatctgcca cgactggtaa 60
tttaattttc aatttatttt ttcttcaact tctta 95
<210> 378
<211> 103
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 378
gtaatacata gcggccgcag cgagagaaag cttattgcaa cttcaactac ttgctggtcg 60
atcgtgttgg ccactcttgt ttatctatca ttcctcgttg gtc 103
<210> 379
<211> 237
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<220>
<221> modified_base
<222> (47)..(183)
<223> a, c, t, g, unknown or other
<400> 379
gtaatacata gcggccgcag cgagagaaag cttattgcaa cttcaannnn nnnnnnnnnn 60
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 120
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 180
nnncttgctg gtcgatcatg ttggccactc ttgtttatct atcattcctc gttggtc 237
<210> 380
<211> 156
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<220>
<221> modified_base
<222> (48)..(109)
<223> a, c, t, g, unknown or other
<400> 380
ttctggcctc tttattgggc cgcccaagga acccttttct gggccatnnn nnnnnnnnnn 60
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnt actcggccac 120
gactggtaat ttaatggatc caaccgacaa ccactt 156
<210> 381
<211> 471
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<220>
<221> modified_base
<222> (47)..(424)
<223> a, c, t, g, unknown or other
<400> 381
ttctggcctc tttattgggc cgcccaagga acccttttct gggccannnn nnnnnnnnnn 60
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 120
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 180
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 240
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 300
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 360
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 420
nnnntactcg gccacgactg gtaatttaat ggatccaacc gacaaccact t 471
<210> 382
<211> 104
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 382
gtaatacata gcggccgcgc ccaaggaacc cttttctggg ccatcttcgt actcggccac 60
gactggtaat ttaattttca atttattttt tcttcaactt ctta 104
<210> 383
<211> 103
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 383
gtaatacata gcggccgcag cgagagaaag cttattgcaa cttcaactac ttgctggtcg 60
atcgtgttgg ccactcggta cctggagcac aagactggcc tca 103
Claims (21)
- DNA-결합 도메인이 세포 중의 지방산 데새투라제 3(FAD3) 유전자 내 표적 부위에 결합함으로써 FAD3 유전자에서 파단을 생성할 수 있도록, 세포 내로 절단 도메인 또는 절단 절반-도메인 및 DNA-결합 도메인을 포함하는 뉴클레아제 또는 이 뉴클레아제를 코딩하는 하나 이상의 폴리뉴클레오티드를 도입하는 것을 포함하는, 식물 세포의 게놈을 변형하는 방법으로서, 상기 표적 부위는 서열 20-23, 서열 25-38, 서열 40-45, 서열 47 및 서열 49 중 어느 하나를 포함하고;
여기서 관심 핵산 서열은 뉴클레아제에 의해 절단 후 FAD3 유전자에 통합되며, 여기서 식물 세포는 전체 식물이 아닌 것인 방법. - 제1항에 있어서, FAD3 유전자가 하기 FAD3 유전자 중 하나 이상인 것인 방법: FAD3A, FAD3A', FAD3A", FAD3C, FAD3C" 및 FAD3C'.
- 제2항에 있어서, 하나 이상의 뉴클레오티드가 식물 세포의 유전자로부터 결실되는 것인 방법.
- 제3항에 있어서, DNA-결합 도메인이 메가뉴클레아제 DNA-결합 도메인, 류신 지퍼 DNA-결합 도메인, 전사 활성화제-유사 이펙터(TALE) DNA-결합 도메인, CRISPR-Cas 뉴클레아제 시스템의 단일 가이드 RNA, 레콤비나제, 아연 핑거 단백질 DNA-결합 도메인 및 상기 DNA-결합 도메인의 키메라 조합으로 이루어진 군으로부터 선택되는 것인 방법.
- 제4항에 있어서, 절단 도메인 또는 절단 절반-도메인이 유형 IIS 제한 엔도뉴클레아제로부터의 절단 절반-도메인, FokI 엔도뉴클레아제로부터의 절단 절반-도메인, StsI 엔도뉴클레아제로부터의 절단 절반-도메인 및 귀소성 엔도뉴클레아제로 이루어진 군으로부터 선택되는 것인 방법.
- 제5항에 있어서, 뉴클레아제가 아연 핑거 뉴클레아제인 방법.
- 제1항에 있어서, 하기 유전자 중 하나 이상이 절단되는 것인 방법: FAD3A, FAD3A', FAD3A", FAD3C, FAD3C" 및 FAD3C'.
- 제1항에 있어서, 식물 세포가 단자엽 식물 세포 또는 쌍자엽 식물 세포인 방법.
- 제9항에 있어서, 식물 세포가 브라시카(Brassica) 종; 브라시카 나푸스(Brassica napus); 브라시카 라파(Brassica rapa); 브라시카 주엔세아(Brassica juencea); 브라시카 올레라세아(Brassica oleracea); 브라시카 니그라(Brassica nigra); 제아(Zea) 종; 제아 메이스(Zea mays); 글리신(Glycine) 종; 글리신 맥스(Glycine max); 트리티쿰(Triticum) 종; 트리티쿰 아에스티붐(Triticum aestivum); 오리자(Oryza) 종; 오리자 사티바(Oryza sativa); 트리티케일(Triticale) 종; 트리티케일 트리티쿰(Triticale triticum); 헬리안테아에(Heliantheae) 종; 헬리안테아에 헬리안투스(Heliantheae helianthus); 고시피움(Gossypium) 종; 고시피움 히르수툼(Gossypium hirsutum); 및 호르데움 불가르(Hordeum vulgar)로 이루어진 군으로부터 선택되는 것인 방법.
- 제1항에 있어서, 관심 핵산 서열이 DNA-결합 도메인의 표적 부위, 하나 이상의 살곤충 저항성 유전자, 하나 이상의 제초제 내성 유전자, 하나 이상의 질소 이용 효율 유전자, 하나 이상의 물 이용 효율 유전자, 하나 이상의 영양 품질 유전자, 하나 이상의 DNA 결합 유전자, 하나 이상의 선택 마커 유전자 및 그의 조합을 포함하는 서열로 이루어진 군으로부터 선택되는 것인 방법.
- 제1항 내지 제11항 중 어느 하나의 방법에 따라 변형된 단리된 식물 세포.
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201261697854P | 2012-09-07 | 2012-09-07 | |
US61/697,854 | 2012-09-07 | ||
US201361820260P | 2013-05-07 | 2013-05-07 | |
US61/820,260 | 2013-05-07 | ||
PCT/US2013/058267 WO2014039684A1 (en) | 2012-09-07 | 2013-09-05 | Fad3 performance loci and corresponding target site specific binding proteins capable of inducing targeted breaks |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20150043540A KR20150043540A (ko) | 2015-04-22 |
KR102147007B1 true KR102147007B1 (ko) | 2020-08-21 |
Family
ID=50237601
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020157008552A KR102147007B1 (ko) | 2012-09-07 | 2013-09-05 | Fad3 성능 유전자좌 및 표적화 파단을 유도할 수 있는 상응하는 표적 부위 특이적 결합 단백질 |
Country Status (17)
Country | Link |
---|---|
US (3) | US9914930B2 (ko) |
EP (2) | EP2893006B1 (ko) |
JP (3) | JP6775953B2 (ko) |
KR (1) | KR102147007B1 (ko) |
CN (1) | CN105264067B (ko) |
AR (1) | AR092478A1 (ko) |
AU (1) | AU2013312538B2 (ko) |
BR (1) | BR112015004995B1 (ko) |
CA (1) | CA2884162C (ko) |
CL (1) | CL2015000564A1 (ko) |
HK (1) | HK1217732A1 (ko) |
IL (1) | IL237567B (ko) |
NZ (1) | NZ705745A (ko) |
RU (1) | RU2665811C2 (ko) |
UY (1) | UY35019A (ko) |
WO (1) | WO2014039684A1 (ko) |
ZA (1) | ZA201501395B (ko) |
Families Citing this family (52)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6261500B2 (ja) | 2011-07-22 | 2018-01-17 | プレジデント アンド フェローズ オブ ハーバード カレッジ | ヌクレアーゼ切断特異性の評価および改善 |
GB201122458D0 (en) | 2011-12-30 | 2012-02-08 | Univ Wageningen | Modified cascade ribonucleoproteins and uses thereof |
PE20190844A1 (es) | 2012-05-25 | 2019-06-17 | Emmanuelle Charpentier | Modulacion de transcripcion con arn de direccion a adn generico |
CN105264067B (zh) * | 2012-09-07 | 2020-11-10 | 美国陶氏益农公司 | Fad3性能基因座及相应的能够诱导靶向断裂的靶位点特异性结合蛋白 |
UA119135C2 (uk) | 2012-09-07 | 2019-05-10 | ДАУ АГРОСАЙЄНСІЗ ЕлЕлСі | Спосіб отримання трансгенної рослини |
KR101706085B1 (ko) | 2012-10-23 | 2017-02-14 | 주식회사 툴젠 | 표적 DNA에 특이적인 가이드 RNA 및 Cas 단백질을 암호화하는 핵산 또는 Cas 단백질을 포함하는, 표적 DNA를 절단하기 위한 조성물 및 이의 용도 |
KR102145760B1 (ko) | 2012-12-06 | 2020-08-19 | 시그마-알드리치 컴퍼니., 엘엘씨 | Crispr-기초된 유전체 변형과 조절 |
DK3620534T3 (da) | 2013-03-14 | 2021-12-06 | Caribou Biosciences Inc | Crispr-cas sammensætninger af nucleinsyre-targeting nucleinsyrer |
RU2723130C2 (ru) | 2013-04-05 | 2020-06-08 | ДАУ АГРОСАЙЕНСИЗ ЭлЭлСи | Способы и композиции для встраивания экзогенной последовательности в геном растений |
US20150044192A1 (en) | 2013-08-09 | 2015-02-12 | President And Fellows Of Harvard College | Methods for identifying a target site of a cas9 nuclease |
US9526784B2 (en) | 2013-09-06 | 2016-12-27 | President And Fellows Of Harvard College | Delivery system for functional nucleases |
US9340799B2 (en) | 2013-09-06 | 2016-05-17 | President And Fellows Of Harvard College | MRNA-sensing switchable gRNAs |
US9388430B2 (en) | 2013-09-06 | 2016-07-12 | President And Fellows Of Harvard College | Cas9-recombinase fusion proteins and uses thereof |
LT3066201T (lt) | 2013-11-07 | 2018-08-10 | Editas Medicine, Inc. | Su crispr susiję būdai ir kompozicijos su valdančiomis grnr |
US9840699B2 (en) | 2013-12-12 | 2017-12-12 | President And Fellows Of Harvard College | Methods for nucleic acid editing |
WO2016022363A2 (en) | 2014-07-30 | 2016-02-11 | President And Fellows Of Harvard College | Cas9 proteins including ligand-dependent inteins |
WO2016089433A1 (en) | 2014-12-03 | 2016-06-09 | Agilent Technologies, Inc. | Guide rna with chemical modifications |
EP3280803B1 (en) | 2015-04-06 | 2021-05-26 | The Board of Trustees of the Leland Stanford Junior University | Chemically modified guide rnas for crispr/cas-mediated gene regulation |
EP3328399B1 (en) | 2015-07-31 | 2023-12-27 | Regents of the University of Minnesota | Modified cells and methods of therapy |
US10837024B2 (en) * | 2015-09-17 | 2020-11-17 | Cellectis | Modifying messenger RNA stability in plant transformations |
BR112018007061A2 (pt) * | 2015-10-06 | 2019-01-15 | Aict | método e composição para aumentar a eficiência de produção de uma planta editada pelo genoma a partir de um protoplasto vegetal e planta regenerada a partir do mesmo |
WO2017062825A1 (en) * | 2015-10-08 | 2017-04-13 | J.R. Simplot Company | Potato cultivar y9 |
US20190225955A1 (en) | 2015-10-23 | 2019-07-25 | President And Fellows Of Harvard College | Evolved cas9 proteins for gene editing |
WO2017134601A1 (en) * | 2016-02-02 | 2017-08-10 | Cellectis | Modifying soybean oil composition through targeted knockout of the fad3a/b/c genes |
US10767175B2 (en) | 2016-06-08 | 2020-09-08 | Agilent Technologies, Inc. | High specificity genome editing using chemically modified guide RNAs |
KR102547316B1 (ko) | 2016-08-03 | 2023-06-23 | 프레지던트 앤드 펠로우즈 오브 하바드 칼리지 | 아데노신 핵염기 편집제 및 그의 용도 |
AU2017308889B2 (en) | 2016-08-09 | 2023-11-09 | President And Fellows Of Harvard College | Programmable Cas9-recombinase fusion proteins and uses thereof |
US11542509B2 (en) | 2016-08-24 | 2023-01-03 | President And Fellows Of Harvard College | Incorporation of unnatural amino acids into proteins using base editing |
CN107784200B (zh) * | 2016-08-26 | 2020-11-06 | 深圳华大生命科学研究院 | 一种筛选新型CRISPR-Cas系统的方法和装置 |
IL247752A0 (en) * | 2016-09-11 | 2016-11-30 | Yeda Res & Dev | Compositions and methods for modulating gene expression for site-directed mutagenesis |
KR20240007715A (ko) | 2016-10-14 | 2024-01-16 | 프레지던트 앤드 펠로우즈 오브 하바드 칼리지 | 핵염기 에디터의 aav 전달 |
CN109689693B (zh) * | 2016-11-03 | 2022-06-28 | 深圳华大生命科学研究院 | 提高基因编辑效率的方法和系统 |
US10745677B2 (en) | 2016-12-23 | 2020-08-18 | President And Fellows Of Harvard College | Editing of CCR5 receptor gene to protect against HIV infection |
CN106591293A (zh) * | 2016-12-28 | 2017-04-26 | 贵州省草业研究所 | 基于酶切连接从未知基因组中分离已知序列侧翼序列的方法 |
US11898179B2 (en) | 2017-03-09 | 2024-02-13 | President And Fellows Of Harvard College | Suppression of pain by gene editing |
EP3592777A1 (en) | 2017-03-10 | 2020-01-15 | President and Fellows of Harvard College | Cytosine to guanine base editor |
US11268082B2 (en) | 2017-03-23 | 2022-03-08 | President And Fellows Of Harvard College | Nucleobase editors comprising nucleic acid programmable DNA binding proteins |
US11560566B2 (en) | 2017-05-12 | 2023-01-24 | President And Fellows Of Harvard College | Aptazyme-embedded guide RNAs for use with CRISPR-Cas9 in genome editing and transcriptional activation |
NL2019209B1 (en) * | 2017-07-10 | 2019-01-16 | Duemmen Group Bv | Powdery mildew resistant rose |
WO2019023680A1 (en) | 2017-07-28 | 2019-01-31 | President And Fellows Of Harvard College | METHODS AND COMPOSITIONS FOR EVOLUTION OF BASIC EDITORS USING PHAGE-ASSISTED CONTINUOUS EVOLUTION (PACE) |
WO2019139645A2 (en) | 2017-08-30 | 2019-07-18 | President And Fellows Of Harvard College | High efficiency base editors comprising gam |
US11795443B2 (en) | 2017-10-16 | 2023-10-24 | The Broad Institute, Inc. | Uses of adenosine base editors |
US11390876B2 (en) | 2018-03-09 | 2022-07-19 | Pioneer Hi-Bred International, Inc. | Compositions and methods for modification of fatty acids in soybean |
EP3578658A1 (en) * | 2018-06-08 | 2019-12-11 | Johann Wolfgang Goethe-Universität Frankfurt | Method for generating a gene editing vector with fixed guide rna pairs |
CN109868283B (zh) * | 2019-02-21 | 2021-07-20 | 浙江农林大学 | 一种评估CRISPR/Cas9基因编辑效率或脱靶频率的方法 |
CA3130488A1 (en) | 2019-03-19 | 2020-09-24 | David R. Liu | Methods and compositions for editing nucleotide sequences |
CN111378721B (zh) * | 2020-04-16 | 2023-06-23 | 广西壮族自治区水产科学研究院 | 凡纳滨对虾耐亚硝酸盐氮性状相关的分子标记及其筛选 |
GB2614813A (en) | 2020-05-08 | 2023-07-19 | Harvard College | Methods and compositions for simultaneous editing of both strands of a target double-stranded nucleotide sequence |
WO2021228700A1 (en) * | 2020-05-13 | 2021-11-18 | Nunhems B.V. | Method for obtaining mutant plants by targeted mutagenesis |
CN112813081B (zh) * | 2021-02-23 | 2022-10-28 | 宁夏农林科学院农业生物技术研究中心(宁夏农业生物技术重点实验室) | 一种获得高含量亚油酸水稻株系的方法 |
DE112022001376T5 (de) | 2021-03-05 | 2024-03-14 | Denso Corporation | Spurbestimmungsvorrichtung, spurwechselbestimmungsprogramm und datenstruktur |
AU2022343300A1 (en) | 2021-09-10 | 2024-04-18 | Agilent Technologies, Inc. | Guide rnas with chemical modification for prime editing |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2011049627A1 (en) * | 2009-10-22 | 2011-04-28 | Dow Agrosciences Llc | Engineered zinc finger proteins targeting plant genes involved in fatty acid biosynthesis |
Family Cites Families (152)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US789538A (en) | 1904-11-11 | 1905-05-09 | Colin E Ham | Dumb-bell. |
US1173508A (en) | 1913-10-27 | 1916-02-29 | Oscar F Heartwell Jr | Ironing-board. |
US4727028A (en) | 1981-06-22 | 1988-02-23 | Eli Lilly And Company | Recombinant DNA cloning vectors and the eukaryotic and prokaryotic transformants thereof |
US4693977A (en) | 1982-08-23 | 1987-09-15 | Queen's University At Kingston | Enzyme immobilization for producing cephalosporin antibiotics |
US4536475A (en) | 1982-10-05 | 1985-08-20 | Phytogen | Plant vector |
US4535060A (en) | 1983-01-05 | 1985-08-13 | Calgene, Inc. | Inhibition resistant 5-enolpyruvyl-3-phosphoshikimate synthetase, production and use |
US5352605A (en) | 1983-01-17 | 1994-10-04 | Monsanto Company | Chimeric genes for transforming plant cells using viral promoters |
NL8300698A (nl) | 1983-02-24 | 1984-09-17 | Univ Leiden | Werkwijze voor het inbouwen van vreemd dna in het genoom van tweezaadlobbige planten; agrobacterium tumefaciens bacterien en werkwijze voor het produceren daarvan; planten en plantecellen met gewijzigde genetische eigenschappen; werkwijze voor het bereiden van chemische en/of farmaceutische produkten. |
US5428147A (en) | 1983-04-15 | 1995-06-27 | Mycogen Plant Science, Inc. | Octopine T-DNA promoters |
NZ207765A (en) | 1983-04-15 | 1987-03-06 | Lubrizol Genetics Inc | Plant expression of transferred dna(t-dna)from plasmids associated with agrobacterium sp |
US4940840A (en) | 1984-03-26 | 1990-07-10 | Dna Plant Technology Corporation | Novel chitinase-producing bacteria and plants |
US5447858A (en) | 1984-04-13 | 1995-09-05 | Mycogen Plant Sciences, Inc. | Heat shock promoter and gene |
US4943674A (en) | 1987-05-26 | 1990-07-24 | Calgene, Inc. | Fruit specific transcriptional factors |
US5753475A (en) | 1985-01-17 | 1998-05-19 | Calgene, Inc. | Methods and compositions for regulated transcription and expression of heterologous genes |
US5420034A (en) | 1986-07-31 | 1995-05-30 | Calgene, Inc. | Seed-specific transcriptional regulation |
US4886937A (en) | 1985-05-20 | 1989-12-12 | North Carolina State University | Method for transforming pine |
US4940835A (en) | 1985-10-29 | 1990-07-10 | Monsanto Company | Glyphosate-resistant plants |
US4810648A (en) | 1986-01-08 | 1989-03-07 | Rhone Poulenc Agrochimie | Haloarylnitrile degrading gene, its use, and cells containing the gene |
ATE57390T1 (de) | 1986-03-11 | 1990-10-15 | Plant Genetic Systems Nv | Durch gentechnologie erhaltene und gegen glutaminsynthetase-inhibitoren resistente pflanzenzellen. |
US4975374A (en) | 1986-03-18 | 1990-12-04 | The General Hospital Corporation | Expression of wild type and mutant glutamine synthetase in foreign hosts |
ES2039474T3 (es) | 1986-12-05 | 1993-10-01 | Ciba-Geigy Ag | Procedimineto mejorado para la transformacion de protoplastos vegetales. |
US5015580A (en) | 1987-07-29 | 1991-05-14 | Agracetus | Particle-mediated transformation of soybean plants and lines |
US5322938A (en) | 1987-01-13 | 1994-06-21 | Monsanto Company | DNA sequence for enhancing the efficiency of transcription |
US5359142A (en) | 1987-01-13 | 1994-10-25 | Monsanto Company | Method for enhanced expression of a protein |
EP0333033A1 (en) | 1988-03-09 | 1989-09-20 | Meiji Seika Kaisha Ltd. | Glutamine synthesis gene and glutamine synthetase |
US5416011A (en) | 1988-07-22 | 1995-05-16 | Monsanto Company | Method for soybean transformation and regeneration |
US5302523A (en) | 1989-06-21 | 1994-04-12 | Zeneca Limited | Transformation of plant cells |
US5501967A (en) | 1989-07-26 | 1996-03-26 | Mogen International, N.V./Rijksuniversiteit Te Leiden | Process for the site-directed integration of DNA into the genome of plants |
US5550318A (en) | 1990-04-17 | 1996-08-27 | Dekalb Genetics Corporation | Methods and compositions for the production of stably transformed, fertile monocot plants and cells thereof |
US7705215B1 (en) | 1990-04-17 | 2010-04-27 | Dekalb Genetics Corporation | Methods and compositions for the production of stably transformed, fertile monocot plants and cells thereof |
US6051753A (en) | 1989-09-07 | 2000-04-18 | Calgene, Inc. | Figwort mosaic virus promoter and uses |
ES2150900T3 (es) | 1989-10-31 | 2000-12-16 | Monsanto Co | Promotor para plantas transgenicas. |
US5641876A (en) | 1990-01-05 | 1997-06-24 | Cornell Research Foundation, Inc. | Rice actin gene and promoter |
CA2074355C (en) | 1990-01-22 | 2008-10-28 | Ronald C. Lundquist | Method of producing fertile transgenic corn plants |
US5484956A (en) | 1990-01-22 | 1996-01-16 | Dekalb Genetics Corporation | Fertile transgenic Zea mays plant comprising heterologous DNA encoding Bacillus thuringiensis endotoxin |
US6403865B1 (en) | 1990-08-24 | 2002-06-11 | Syngenta Investment Corp. | Method of producing transgenic maize using direct transformation of commercially important genotypes |
US5633435A (en) | 1990-08-31 | 1997-05-27 | Monsanto Company | Glyphosate-tolerant 5-enolpyruvylshikimate-3-phosphate synthases |
US5266317A (en) | 1990-10-04 | 1993-11-30 | University Of Georgia Research Foundation, Inc. | Insect-specific paralytic neurotoxin genes for use in biological insect control: methods and compositions |
US5384253A (en) | 1990-12-28 | 1995-01-24 | Dekalb Genetics Corporation | Genetic transformation of maize cells by electroporation of cells pretreated with pectin degrading enzymes |
GB9104617D0 (en) | 1991-03-05 | 1991-04-17 | Nickerson Int Seed | Pest control |
GB9115909D0 (en) | 1991-07-23 | 1991-09-04 | Nickerson Int Seed | Recombinant dna |
DK39692D0 (da) | 1992-03-25 | 1992-03-25 | Danisco | Biologisk materiale |
US5356802A (en) | 1992-04-03 | 1994-10-18 | The Johns Hopkins University | Functional domains in flavobacterium okeanokoites (FokI) restriction endonuclease |
US5487994A (en) | 1992-04-03 | 1996-01-30 | The Johns Hopkins University | Insertion and deletion mutants of FokI restriction endonuclease |
US5436150A (en) | 1992-04-03 | 1995-07-25 | The Johns Hopkins University | Functional domains in flavobacterium okeanokoities (foki) restriction endonuclease |
US5591616A (en) | 1992-07-07 | 1997-01-07 | Japan Tobacco, Inc. | Method for transforming monocotyledons |
WO1994002620A2 (en) | 1992-07-27 | 1994-02-03 | Pioneer Hi-Bred International, Inc. | An improved method of agrobacterium-mediated transformation of cultured soybean cells |
US5607914A (en) | 1993-01-13 | 1997-03-04 | Pioneer Hi-Bred International, Inc. | Synthetic antimicrobial peptides |
US6118047A (en) | 1993-08-25 | 2000-09-12 | Dekalb Genetic Corporation | Anthranilate synthase gene and method of use thereof for conferring tryptophan overproduction |
US5362865A (en) | 1993-09-02 | 1994-11-08 | Monsanto Company | Enhanced expression in plants using non-translated leader sequences |
US5580852A (en) | 1993-12-17 | 1996-12-03 | Pioneer Hi-Bred International, Inc. | Derivatives of tachyplesin having inhibitory activity towards plant pathogenic fungi |
DE69534629D1 (de) | 1994-01-18 | 2005-12-29 | Scripps Research Inst | Derivate von zinkfingerproteinen und methoden |
US6140466A (en) | 1994-01-18 | 2000-10-31 | The Scripps Research Institute | Zinc finger protein derivatives and methods therefor |
US6242568B1 (en) | 1994-01-18 | 2001-06-05 | The Scripps Research Institute | Zinc finger protein derivatives and methods therefor |
GB9824544D0 (en) | 1998-11-09 | 1999-01-06 | Medical Res Council | Screening system |
CA2196419C (en) | 1994-08-20 | 2007-08-21 | Yen Choo | Improvements in or relating to binding proteins for recognition of dna |
US5789538A (en) | 1995-02-03 | 1998-08-04 | Massachusetts Institute Of Technology | Zinc finger proteins with high affinity new DNA binding specificities |
US5994627A (en) | 1995-03-31 | 1999-11-30 | Common Wealth Scientific And Industrial Research Organisation | Genetic sequences conferring nematode resistance in plants and uses therefor |
US5693512A (en) | 1996-03-01 | 1997-12-02 | The Ohio State Research Foundation | Method for transforming plant tissue by sonication |
US5850019A (en) | 1996-08-06 | 1998-12-15 | University Of Kentucky Research Foundation | Promoter (FLt) for the full-length transcript of peanut chlorotic streak caulimovirus (PCLSV) and expression of chimeric genes in plants |
US5925523A (en) | 1996-08-23 | 1999-07-20 | President & Fellows Of Harvard College | Intraction trap assay, reagents and uses thereof |
EP0865496A1 (en) | 1996-09-05 | 1998-09-23 | Unilever N.V. | Salt-inducible promoter derivable from a lactic acid bacterium, and its use in a lactic acid bacterium for production of a desired protein |
US6252138B1 (en) | 1997-01-20 | 2001-06-26 | Plant Genetic Systems, N.V. | Pathogen-induced plant promoters |
US5981840A (en) | 1997-01-24 | 1999-11-09 | Pioneer Hi-Bred International, Inc. | Methods for agrobacterium-mediated transformation |
GB9703369D0 (en) | 1997-02-18 | 1997-04-09 | Lindqvist Bjorn H | Process |
GB2338237B (en) | 1997-02-18 | 2001-02-28 | Actinova Ltd | In vitro peptide or protein expression library |
US5922564A (en) | 1997-02-24 | 1999-07-13 | Performance Plants, Inc. | Phosphate-deficiency inducible promoter |
GB9710807D0 (en) | 1997-05-23 | 1997-07-23 | Medical Res Council | Nucleic acid binding proteins |
GB9710809D0 (en) | 1997-05-23 | 1997-07-23 | Medical Res Council | Nucleic acid binding proteins |
US6087166A (en) | 1997-07-03 | 2000-07-11 | Basf Aktiengesellschaft | Transcriptional activators with graded transactivation potential |
US6410248B1 (en) | 1998-01-30 | 2002-06-25 | Massachusetts Institute Of Technology | General strategy for selecting high-affinity zinc finger proteins for diverse DNA target sites |
EP1054970A1 (en) | 1998-02-20 | 2000-11-29 | Zeneca Limited | Pollen specific promoter |
ES2229687T3 (es) | 1998-02-26 | 2005-04-16 | Pioneer Hi-Bred International, Inc. | Promotores constitutivos de maiz. |
CA2315549A1 (en) | 1998-02-26 | 1999-09-02 | Pioneer Hi-Bred International, Inc. | Family of maize pr-1 genes and promoters |
ES2341926T3 (es) | 1998-03-02 | 2010-06-29 | Massachusetts Institute Of Technology | Poliproteinas con dedos de cinc que tienen enlazadores mejorados. |
US6635806B1 (en) | 1998-05-14 | 2003-10-21 | Dekalb Genetics Corporation | Methods and compositions for expression of transgenes in plants |
US6307123B1 (en) | 1998-05-18 | 2001-10-23 | Dekalb Genetics Corporation | Methods and compositions for transgene identification |
US6140815A (en) | 1998-06-17 | 2000-10-31 | Dover Instrument Corporation | High stability spin stand platform |
JP2000083680A (ja) | 1998-07-16 | 2000-03-28 | Nippon Paper Industries Co Ltd | 光誘導型プロモ―タ―の制御下に置かれた不定芽再分化遺伝子を選抜マ―カ―遺伝子とする植物への遺伝子導入方法及びこれに用いる植物への遺伝子導入用ベクタ― |
US6140081A (en) | 1998-10-16 | 2000-10-31 | The Scripps Research Institute | Zinc finger binding domains for GNN |
US7070934B2 (en) | 1999-01-12 | 2006-07-04 | Sangamo Biosciences, Inc. | Ligand-controlled regulation of endogenous gene expression |
US6534261B1 (en) | 1999-01-12 | 2003-03-18 | Sangamo Biosciences, Inc. | Regulation of endogenous gene expression in cells using zinc finger proteins |
US6453242B1 (en) | 1999-01-12 | 2002-09-17 | Sangamo Biosciences, Inc. | Selection of sites for targeting by zinc finger proteins and methods of designing zinc finger proteins to bind to preselected sites |
US6599692B1 (en) | 1999-09-14 | 2003-07-29 | Sangamo Bioscience, Inc. | Functional genomics using zinc finger proteins |
JP2002534129A (ja) | 1999-01-14 | 2002-10-15 | モンサント テクノロジー エルエルシー | ダイズ形質転換方法 |
US7030215B2 (en) | 1999-03-24 | 2006-04-18 | Sangamo Biosciences, Inc. | Position dependent recognition of GNN nucleotide triplets by zinc fingers |
US6794136B1 (en) | 2000-11-20 | 2004-09-21 | Sangamo Biosciences, Inc. | Iterative optimization in the design of binding proteins |
US6207879B1 (en) | 1999-05-14 | 2001-03-27 | Dekalb Genetics Corporation | Maize RS81 promoter and methods for use thereof |
US6232526B1 (en) | 1999-05-14 | 2001-05-15 | Dekalb Genetics Corp. | Maize A3 promoter and methods for use thereof |
US6194636B1 (en) | 1999-05-14 | 2001-02-27 | Dekalb Genetics Corp. | Maize RS324 promoter and methods for use thereof |
US6429357B1 (en) | 1999-05-14 | 2002-08-06 | Dekalb Genetics Corp. | Rice actin 2 promoter and intron and methods for use thereof |
US6677503B1 (en) | 1999-06-23 | 2004-01-13 | Pioneer Hi-Bred International, Inc. | Sunflower anti-pathogene proteins and genes and their uses |
CA2284246A1 (en) | 1999-10-01 | 2001-04-01 | Agriculture And Agrifood Canada Of Agriculture And Agri-Food | Plant fatty acid desaturases and alleles therefor |
EP1236045B1 (en) | 1999-12-06 | 2005-11-09 | Sangamo Biosciences Inc. | Methods of using randomized libraries of zinc finger proteins for the identification of gene function |
CA2390819A1 (en) | 2000-01-21 | 2001-07-26 | Pioneer Hi-Bred International, Inc. | Novel root-preferred promoter elements and methods of use |
ATE483970T1 (de) | 2000-02-08 | 2010-10-15 | Sangamo Biosciences Inc | Zellen zur entdeckung von medikamenten |
US20020061512A1 (en) | 2000-02-18 | 2002-05-23 | Kim Jin-Soo | Zinc finger domains and methods of identifying same |
US6388170B1 (en) | 2000-04-07 | 2002-05-14 | University Of Kentucky Research Foundation | Bidirectional promoters and methods related thereto |
WO2001088197A2 (en) | 2000-05-16 | 2001-11-22 | Massachusetts Institute Of Technology | Methods and compositions for interaction trap assays |
JP2002060786A (ja) | 2000-08-23 | 2002-02-26 | Kao Corp | 硬質表面用殺菌防汚剤 |
US20050267061A1 (en) | 2004-04-08 | 2005-12-01 | Sangamo Biosciences, Inc. | Methods and compositions for treating neuropathic and neurodegenerative conditions |
US7067317B2 (en) | 2000-12-07 | 2006-06-27 | Sangamo Biosciences, Inc. | Regulation of angiogenesis with zinc finger proteins |
US7022826B2 (en) | 2001-02-26 | 2006-04-04 | The Regents Of The University Of California | Non-oligomerizing fluorescent proteins |
GB0108491D0 (en) | 2001-04-04 | 2001-05-23 | Gendaq Ltd | Engineering zinc fingers |
JP2005500061A (ja) | 2001-08-20 | 2005-01-06 | ザ スクリップス リサーチ インスティテュート | Cnnについての亜鉛フィンガー結合ドメイン |
US7262054B2 (en) | 2002-01-22 | 2007-08-28 | Sangamo Biosciences, Inc. | Zinc finger proteins for DNA binding and gene regulation in plants |
US8106255B2 (en) * | 2002-01-23 | 2012-01-31 | Dana Carroll | Targeted chromosomal mutagenasis using zinc finger nucleases |
EP2368982A3 (en) | 2002-03-21 | 2011-10-12 | Sangamo BioSciences, Inc. | Methods and compositions for using zinc finger endonucleases to enhance homologous recombination |
US7361635B2 (en) | 2002-08-29 | 2008-04-22 | Sangamo Biosciences, Inc. | Simultaneous modulation of multiple genes |
CA2497913C (en) | 2002-09-05 | 2014-06-03 | California Institute Of Technology | Use of chimeric nucleases to stimulate gene targeting |
AU2004210965C1 (en) | 2003-02-11 | 2014-10-16 | Corteva Agriscience Llc | Altered FAD2 and FAD3 genes in brassica and the molecular marker-assisted detection thereof |
EP2322629A3 (en) | 2003-04-29 | 2011-11-02 | Pioneer Hi-Bred International Inc. | Novel glyphosate-n-acetyltransferase (GAT) genes |
US8409861B2 (en) | 2003-08-08 | 2013-04-02 | Sangamo Biosciences, Inc. | Targeted deletion of cellular DNA sequences |
US7888121B2 (en) | 2003-08-08 | 2011-02-15 | Sangamo Biosciences, Inc. | Methods and compositions for targeted cleavage and recombination |
KR100537955B1 (ko) | 2003-10-29 | 2005-12-20 | 학교법인고려중앙학원 | 꽃가루 특이적 유전자 발현 프로모터 |
US7972854B2 (en) | 2004-02-05 | 2011-07-05 | Sangamo Biosciences, Inc. | Methods and compositions for targeted cleavage and recombination |
US7534775B2 (en) * | 2004-04-08 | 2009-05-19 | Sangamo Biosciences, Inc. | Methods and compositions for modulating cardiac contractility |
JP2008506359A (ja) | 2004-04-08 | 2008-03-06 | サンガモ バイオサイエンシズ インコーポレイテッド | ジンクフィンガータンパク質による神経因性疼痛の処置 |
PL2308977T5 (pl) | 2004-04-30 | 2017-10-31 | Dow Agrosciences Llc | Nowy gen odporności na herbicydy |
AU2006212647A1 (en) * | 2005-02-09 | 2006-08-17 | Bioriginal Food & Science Corp. | Novel omega-3 fatty acid desaturase family members and uses thereof |
WO2006121866A2 (en) | 2005-05-05 | 2006-11-16 | The Arizona Board Of Regents On Behalf Of The University Of Arizona | Sequence enabled reassembly (seer) - a novel method for visualizing specific dna sequences |
AP2693A (en) * | 2005-05-27 | 2013-07-16 | Monsanto Technology Llc | Soybean event MON89788 and methods for detection thereof |
KR20080033455A (ko) | 2005-07-26 | 2008-04-16 | 상가모 바이오사이언스 인코포레이티드 | 외래 핵산 서열의 표적화된 통합 및 발현 |
EP3241430B1 (en) | 2005-10-28 | 2020-08-26 | Dow AgroSciences LLC | Novel herbicide resistance genes |
JP5266210B2 (ja) | 2006-05-25 | 2013-08-21 | サンガモ バイオサイエンシズ インコーポレイテッド | 改変開裂ハーフドメイン |
US9428756B2 (en) | 2006-08-11 | 2016-08-30 | Dow Agrosciences Llc | Zinc finger nuclease-mediated homologous recombination |
AU2007334468B2 (en) | 2006-12-14 | 2013-02-07 | Corteva Agriscience Llc | Optimized non-canonical zinc finger proteins |
WO2009042163A2 (en) | 2007-09-27 | 2009-04-02 | Sangamo Biosciences, Inc. | Rapid in vivo identification of biologically active nucleases |
US8399218B2 (en) | 2007-09-27 | 2013-03-19 | Dow Agrosciences, Llc | Engineered zinc finger proteins targeting 5-enolpyruvyl shikimate-3-phosphate synthase genes |
US8936936B2 (en) | 2007-10-25 | 2015-01-20 | Sangamo Biosciences, Inc. | Methods and compositions for targeted integration |
EP2281050B1 (en) | 2008-04-14 | 2014-04-02 | Sangamo BioSciences, Inc. | Linear donor constructs for targeted integration |
KR20160015400A (ko) | 2008-08-22 | 2016-02-12 | 상가모 바이오사이언스 인코포레이티드 | 표적화된 단일가닥 분할 및 표적화된 통합을 위한 방법 및 조성물 |
RU2557316C2 (ru) * | 2008-11-04 | 2015-07-20 | ДАУ АГРОСАЙЕНСИЗ ЭлЭлСи | Brassica juncea КАЧЕСТВА ОМЕГА-9 |
PT2370575T (pt) | 2008-12-17 | 2017-12-11 | Dow Agrosciences Llc | Integração dirigida no locus zp15 |
EP2206723A1 (en) | 2009-01-12 | 2010-07-14 | Bonas, Ulla | Modular DNA-binding domains |
US20110239315A1 (en) | 2009-01-12 | 2011-09-29 | Ulla Bonas | Modular dna-binding domains and methods of use |
US20110041195A1 (en) | 2009-08-11 | 2011-02-17 | Sangamo Biosciences, Inc. | Organisms homozygous for targeted modification |
WO2011049980A1 (en) | 2009-10-19 | 2011-04-28 | Qm Power, Inc. | Parallel magnetic circuit motor |
DK2501804T3 (en) * | 2009-11-20 | 2016-07-18 | Bayer Cropscience Nv | Brassica plants, WHICH INCLUDES mutated FAD3 alleles |
BR112012014080A2 (pt) | 2009-12-10 | 2015-10-27 | Univ Iowa State Res Found | método para modificação do material genético, método para geração de um ácido nucleico, monômero de endonuclease efetora tal, método para geração de um aninal, método para geração de uma planta, método para recombinação genética direcionada, ácido nucleico, cassete de expressão e célula hospedeira |
CN102433331B (zh) * | 2009-12-28 | 2013-05-08 | 华中农业大学 | 一种甘蓝型油菜低亚麻酸分子标记及其制备方法与应用 |
AU2011207769B2 (en) | 2010-01-22 | 2015-05-28 | Corteva Agriscience Llc | Targeted genomic alteration |
PT2534173T (pt) | 2010-02-08 | 2019-10-31 | Sangamo Therapeutics Inc | Semidomínios de clivagem manipulados |
US9255259B2 (en) | 2010-02-09 | 2016-02-09 | Sangamo Biosciences, Inc. | Targeted genomic modification with partially single-stranded donor molecules |
WO2011146121A1 (en) | 2010-05-17 | 2011-11-24 | Sangamo Biosciences, Inc. | Novel dna-binding proteins and uses thereof |
CA2863400C (en) | 2012-02-01 | 2022-06-14 | Dow Agrosciences Llc | Synthetic chloroplast transit peptides |
EP2847338B1 (en) * | 2012-05-07 | 2018-09-19 | Sangamo Therapeutics, Inc. | Methods and compositions for nuclease-mediated targeted integration of transgenes |
UA119135C2 (uk) | 2012-09-07 | 2019-05-10 | ДАУ АГРОСАЙЄНСІЗ ЕлЕлСі | Спосіб отримання трансгенної рослини |
AR092482A1 (es) | 2012-09-07 | 2015-04-22 | Dow Agrosciences Llc | Enriquecimiento de la clasificacion de las celulas activadas por fluorescencia (facs) para generar plantas |
CN105264067B (zh) * | 2012-09-07 | 2020-11-10 | 美国陶氏益农公司 | Fad3性能基因座及相应的能够诱导靶向断裂的靶位点特异性结合蛋白 |
UA118090C2 (uk) * | 2012-09-07 | 2018-11-26 | ДАУ АГРОСАЙЄНСІЗ ЕлЕлСі | Спосіб інтегрування послідовності нуклеїнової кислоти, що представляє інтерес, у ген fad2 у клітині сої та специфічний для локусу fad2 білок, що зв'язується, здатний індукувати спрямований розрив |
JP5937635B2 (ja) | 2014-03-28 | 2016-06-22 | ファナック株式会社 | 電磁接触器の溶着検出機能を有するモータ駆動装置 |
-
2013
- 2013-09-05 CN CN201380058089.0A patent/CN105264067B/zh active Active
- 2013-09-05 WO PCT/US2013/058267 patent/WO2014039684A1/en active Application Filing
- 2013-09-05 RU RU2015112578A patent/RU2665811C2/ru active
- 2013-09-05 US US14/019,211 patent/US9914930B2/en active Active
- 2013-09-05 EP EP13834682.0A patent/EP2893006B1/en active Active
- 2013-09-05 AU AU2013312538A patent/AU2013312538B2/en active Active
- 2013-09-05 JP JP2015531197A patent/JP6775953B2/ja active Active
- 2013-09-05 EP EP18183646.1A patent/EP3406715B1/en active Active
- 2013-09-05 CA CA2884162A patent/CA2884162C/en active Active
- 2013-09-05 NZ NZ705745A patent/NZ705745A/en unknown
- 2013-09-05 BR BR112015004995-8A patent/BR112015004995B1/pt active IP Right Grant
- 2013-09-05 KR KR1020157008552A patent/KR102147007B1/ko active IP Right Grant
- 2013-09-06 UY UY0001035019A patent/UY35019A/es not_active Application Discontinuation
- 2013-09-06 AR ARP130103189A patent/AR092478A1/es unknown
-
2015
- 2015-03-02 ZA ZA2015/01395A patent/ZA201501395B/en unknown
- 2015-03-04 IL IL237567A patent/IL237567B/en active IP Right Grant
- 2015-03-06 CL CL2015000564A patent/CL2015000564A1/es unknown
-
2016
- 2016-05-23 HK HK16105832.3A patent/HK1217732A1/zh unknown
-
2018
- 2018-01-29 US US15/882,609 patent/US10526610B2/en active Active
- 2018-07-13 JP JP2018133418A patent/JP2018171074A/ja active Pending
-
2019
- 2019-11-27 US US16/698,077 patent/US10961540B2/en active Active
-
2020
- 2020-10-30 JP JP2020182191A patent/JP2021035379A/ja active Pending
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2011049627A1 (en) * | 2009-10-22 | 2011-04-28 | Dow Agrosciences Llc | Engineered zinc finger proteins targeting plant genes involved in fatty acid biosynthesis |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102147007B1 (ko) | Fad3 성능 유전자좌 및 표적화 파단을 유도할 수 있는 상응하는 표적 부위 특이적 결합 단백질 | |
KR102243727B1 (ko) | 유전자 표적화 및 형질 스태킹을 위한 조작된 트랜스진 통합 플랫폼 (etip) | |
AU2013312198B2 (en) | Fluorescence activated cell sorting (FACS) enrichment to generate plants | |
KR102631985B1 (ko) | 게놈을 변형시키기 위한 조성물 및 방법 | |
AU2018267596B2 (en) | Plant regulatory elements and uses thereof | |
KR20200124702A (ko) | 신규한 cas9 오르소로그 | |
CN106947765B (zh) | 植物调控元件及其应用 | |
WO2020148021A1 (en) | Tomato plant resistant to tomato brown rugose fruit virus | |
KR20170099884A (ko) | Pufa 생산을 위한 물질 및 방법, 및 pufa-함유 조성물 | |
KR20170032317A (ko) | 담배 프로테아제 유전자 | |
CN116648513A (zh) | 切酶样敲除植物细胞 | |
KR20230136600A (ko) | 안정적인 세포주에서 효율적인 성장을 가능하게 하는아프리카 돼지 열병 백신의 게놈 결실 | |
KR20230113283A (ko) | 다이서-유사 넉아웃 식물 세포 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right |