KR101848102B1 - 콘드로이틴의 박테리아 생산을 위한 조성물 및 방법 - Google Patents
콘드로이틴의 박테리아 생산을 위한 조성물 및 방법 Download PDFInfo
- Publication number
- KR101848102B1 KR101848102B1 KR1020127025916A KR20127025916A KR101848102B1 KR 101848102 B1 KR101848102 B1 KR 101848102B1 KR 1020127025916 A KR1020127025916 A KR 1020127025916A KR 20127025916 A KR20127025916 A KR 20127025916A KR 101848102 B1 KR101848102 B1 KR 101848102B1
- Authority
- KR
- South Korea
- Prior art keywords
- gene
- kfo
- chondroitin
- kps
- delete delete
- Prior art date
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/195—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
- C07K14/24—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria from Enterobacteriaceae (F), e.g. Citrobacter, Serratia, Proteus, Providencia, Morganella, Yersinia
- C07K14/245—Escherichia (G)
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K16/00—Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies
- C07K16/12—Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from bacteria
- C07K16/1203—Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from bacteria from Gram-negative bacteria
- C07K16/1228—Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from bacteria from Gram-negative bacteria from Enterobacteriaceae (F), e.g. Citrobacter, Serratia, Proteus, Providencia, Morganella, Yersinia
- C07K16/1232—Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from bacteria from Gram-negative bacteria from Enterobacteriaceae (F), e.g. Citrobacter, Serratia, Proteus, Providencia, Morganella, Yersinia from Escherichia (G)
-
- C—CHEMISTRY; METALLURGY
- C08—ORGANIC MACROMOLECULAR COMPOUNDS; THEIR PREPARATION OR CHEMICAL WORKING-UP; COMPOSITIONS BASED THEREON
- C08B—POLYSACCHARIDES; DERIVATIVES THEREOF
- C08B37/00—Preparation of polysaccharides not provided for in groups C08B1/00 - C08B35/00; Derivatives thereof
- C08B37/006—Heteroglycans, i.e. polysaccharides having more than one sugar residue in the main chain in either alternating or less regular sequence; Gellans; Succinoglycans; Arabinogalactans; Tragacanth or gum tragacanth or traganth from Astragalus; Gum Karaya from Sterculia urens; Gum Ghatti from Anogeissus latifolia; Derivatives thereof
- C08B37/0063—Glycosaminoglycans or mucopolysaccharides, e.g. keratan sulfate; Derivatives thereof, e.g. fucoidan
- C08B37/0069—Chondroitin-4-sulfate, i.e. chondroitin sulfate A; Dermatan sulfate, i.e. chondroitin sulfate B or beta-heparin; Chondroitin-6-sulfate, i.e. chondroitin sulfate C; Derivatives thereof
-
- C—CHEMISTRY; METALLURGY
- C08—ORGANIC MACROMOLECULAR COMPOUNDS; THEIR PREPARATION OR CHEMICAL WORKING-UP; COMPOSITIONS BASED THEREON
- C08L—COMPOSITIONS OF MACROMOLECULAR COMPOUNDS
- C08L5/00—Compositions of polysaccharides or of their derivatives not provided for in groups C08L1/00 or C08L3/00
- C08L5/08—Chitin; Chondroitin sulfate; Hyaluronic acid; Derivatives thereof
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/52—Genes encoding for enzymes or proenzymes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/70—Vectors or expression systems specially adapted for E. coli
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/74—Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P19/00—Preparation of compounds containing saccharide radicals
- C12P19/04—Polysaccharides, i.e. compounds containing more than five saccharide radicals attached to each other by glycosidic bonds
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P19/00—Preparation of compounds containing saccharide radicals
- C12P19/26—Preparation of nitrogen-containing carbohydrates
Landscapes
- Health & Medical Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Genetics & Genomics (AREA)
- Organic Chemistry (AREA)
- Engineering & Computer Science (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- Biotechnology (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Molecular Biology (AREA)
- Biomedical Technology (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Microbiology (AREA)
- Biophysics (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Physics & Mathematics (AREA)
- Plant Pathology (AREA)
- Medicinal Chemistry (AREA)
- General Chemical & Material Sciences (AREA)
- Polymers & Plastics (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Dermatology (AREA)
- Materials Engineering (AREA)
- Gastroenterology & Hepatology (AREA)
- Immunology (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Polysaccharides And Polysaccharide Derivatives (AREA)
- Peptides Or Proteins (AREA)
Abstract
본 발명은 재조합 박테리아 발효와 발효 후 황산화의 조합을 통한 콘드로이틴 설페이트의 생산을 비롯한, 콘드로이틴의 생산을 위한 재조합 DNA 기술 분야에 관한 것이다.
Description
본 발명은 재조합 박테리아 발효 및 발효-후 황산화의 조합을 통해 콘드로이틴 설페이트를 생산함을 포함하는, 콘드로이틴의 생산을 위한 재조합 DNA 기술의 분야에 관한 것이다.
콘드로이틴은 글리코스아미노글리칸이라고 불리는 헤테로다당류의 계열에 속한다. 글리코스아미노글리칸(GAG)은, 둘 중 하나는 산성 당이고 다른 것은 황산화될 수 있는 아미노 당(N-아세틸글루코스아민 또는 N-아세틸갈락토스아민)인, 반복되는 이당류 단위로 구성된 분지되지 않은, 음성으로 하전된 다당류 쇄이다. 이들의 유연하지 않은 특성 및 높은 음성 전하로 인하여, GAG는 다량의 공간을 점유하고, 양이온과 물을 끌어들여 세포외 매트릭스 속에서 다공성 겔을 형성하는 고도로 연장된 형태를 나타낸다. 따라서, 대부분의 동물에서 발견되는 GAG는, 조직이 수화되어 확장하는 것을 돕고 매트릭스가 압축력을 견디도록 할 수 있게 돕는다. 예를 들어, 무릎 관절을 라이닝(lining)하는 연골 매트릭스는 이러한 메카니즘에 의해 수백의 대기압을 지지할 수 있다.
콘드로이틴 설페이트는 연골 강도 및 탄성의 유지에 중요하며 관절 통증을 감소시키고 건강한 연골과 관절 기능을 촉진시키기 위한 영양 보조제로서 시판된다. 임상 연구는 골관절염(참조: 예를 들면, Kahan et al ., Arthritis and Rheumatism 2009;60:524-533; Michel et al ., Arthritis and Rheumatism 2005;52:779-786 및 Uebelhardt et al ., Osteoarthritis and Cartilage 2004;12:269-276), 사이질 방광염(참조: 예를 들면, Nickel et . al., BJU Int . 2009;103:56-60 and Cervigni et al ., Int. Urogynecol. J. Pelvic Floor Dysfunct. 2008;19:943-947), 및 윤활막염[참조: 예를 들면, Hochberg and Clegg, Osteoarthritis and Cartilage 2008;16(Suppl. 3):S22-S24 and Moller, Osteoarthritis and Cartilage 2009;17(Suppl. 1):S32-S33]의 치료를 위한 콘드로이틴 설페이트의 용도를 지지한다. 이들 문헌들은, 이들의 전문이 본원에 참조로 포함된다.
콘드로이틴 설페이트는 현재 단백질로부터 다당류를 분해하여 다양한 품질의 다당류 생성물을 생산하기 위한 화학적 및 효소적 처리를 사용하여, 소, 돼지, 상어 및 가금류를 포함하는 동물의 연골로부터 추출함으로써 생산된다(참조: Barnhill et al ., J. Am. Pharm. Assoc . 2006;46:14-24, Volpi, J. Pharm . Pharmacol . 2009;61:1271-1280).
콘드로이틴은 D-글루쿠론산(GlcUA) 및 N-아세틸-D-갈락토스아민(GalNAc)을 함유한다. 이는 이당류 반복 단위 β3GalNAc-β4GlcUA로 구성된다. 전형적으로, GalNAc 잔기는 4 및 6번 위치에서 다양하게 황산화된다. 콘드로이틴 설페이트는 천연적으로 사람 및 다른 동물에서 관절과 같은, 연골 조직의 구조 성분인 프로테오글리칸의 성분으로서 발생한다. 프로테오글리칸은 코어 단백질 및, 도 1에 나타낸 바와 같이 올리고사카라이드 링커를 통해 단백질에 공유결합으로 부착된, 콘드로이틴 설페이트와 같은 다당류 성분으로 구성된다. 코어 단백질은 다수의 다당류 쇄로 장식된다. 프로테오글리칸은 세포 막내에서 세포외 공간에 존재하는 단백질의 다당류-함유 부위를 사용하여 고정(anchor)될 수 있거나 세포외 매트릭스내에 분비되어 국재화할 수 있다(참조: Prydz and Dalen, J. Cell Sci. 2000;113:193-205).
콘드로이틴 골격을 합성하는데 관여하는 글리코실트랜스퍼라제 효소(콘드로이틴 신타제)는 수용하는 기질에 UDP-GalNAc 및 UDP-GlcUA 공여체로부터의 GalNAc 및 GlcUA의 교번되는 단당류 단위를 가함으로써 이를 수행한다. 이들 효소는 사람에서 확인되어 있으며(참조: Kitagawa et al., J. Biol. Chem. 2001;276:43894-43900; Yada et al., J. Biol. Chem. 2003;278:39711-39725), 사람 콘드로이틴 신타제의 상동체는 말, 소, 설치류, 개, 닭, 제브라 피쉬(zebra fish), 선충, 및 곤충을 포함하는 각종의 다른 동물에서 확인되어 왔다(참조: www.ncbi.nlm.nih.gov/homologene/8950).
일부 박테리아는 또한 이들의 캡슐 성분으로서 콘드로이틴 또는 콘드로이틴-유사 다당류 중합체를 생산한다. 척추동물에서 발견된 콘드로이틴 설페이트와는 달리, 미생물 콘드로이틴은 프로테오글리칸으로서 존재하지 않으며, 오히려 박테리아 세포 표면에 지질-결합된 다당류로서 및 배양 배지 속에서 유리된(즉, 세포-연합되지 않은) 다당류로서 존재한다(참조: Whitfield, Annu. Rev. Biochem. 2006;75:39-68; DeAngelis, Glycobiol. 2002;12:9R-16R).
2개의 박테리아, 에스케리키아 콜라이(Escherichia coli) K4(참조: Rodriguez et al., Eur. J. Biochem. 1988;177:117-124) 및 파스퇴렐라 물토시다(Pasteurella multocida) 혈청형 F(참조: Rimler, Vet. Rec. 1994;134:191-192)은 화학적으로 변형되어 콘드로이틴 설페이트를 잠재적으로 생산할 수 있는 황산화되지 않은, 콘드로이틴-유사, 캡슐 다당류(capsular polysaccharide)를 생산하는 것으로 보고되었다. 에스케리키아 콜라이 K4는 로드리게즈(Rodriguez) 등에 의해 캡슐 중합체 성분으로서 프럭토즈 측쇄(K4 항원)를 지닌 황산화되지 않은 콘드로이틴 골격을 생산하는 것으로 밝혀졌다. 니노미야(Ninomiya) 등(참조: J. Biol. Chem. 2002;277:21567-21575)은 에스케리키아 콜라이 K4내에서 콘드로이틴-유사 캡슐 다당류의 생합성에 필요한 주요 유전자를 확인하고 서열분석하였다. 이들 서열은 수탁 번호 AB079602로 GenBankTM에 기탁되었다. 니노미야 등에 의해 기재된 서열은 에스케리키아 콜라이 K4의 "2 군(group 2)" 캡슐 유전자 클러스터의 소위 "영역 2" 부위를 포함한다. 에스케리키아 콜라이내 캡슐 유전자 클러스터의 구성의 상세한 설명은 휘트필드(Whitfield)(참조: Annu. Rev. Biochem. 2006;75:39-68)에 의해 제공된다. 에스케리키아 콜라이 2 군 캡슐 유전자 클러스터의 영역 2 유전자는 캡슐 다당류의 구조를 결정하는 단백질을 코딩(encoding)한다. AB079602 서열은 에스케리키아 콜라이 K4 콘드로이틴 폴리머라제를 인코딩하는 kfoC로 명명된 서열을 포함한다. 에스케리키아 콜라이 K4 콘드로이틴 폴리머라제는 GlcUA 및 GalNAc를 교번적으로 콘드로이틴 당 쇄 및 관련된 올리고사카라이드의 비-환원 말단에 이전시켜, K4 항원 다당류의 콘드로이틴 골격을 생산하는 이기능성 글리코실트랜스퍼라제이다. 에스케리키아 콜라이 K4에 의해 생산된 콘드로이틴-유사 캡슐 다당류는 콘드로이틴의 GlcUA 잔기에 연결된(β1,3), 프럭토즈를 함유한다. 파스퇴렐라 물토시다 F형은 또한 황산화되지 않은 콘드로이틴 캡슐 성분을 생산하며 당해 유기체내에서 콘드로이틴 중합에 관여하는 글리코실트랜스퍼라제는 또한 문헌(참조: DeAngelis & Padgett-McCue, J. Biol. Chem. 2000;275:24124-29)에 보고된 바와 같이 클로닝되어 있다. K4 콘드로이틴 폴리머라제와 유사하게, 파스퇴렐라 콘드로이틴 신타제(pmCS, Genbank 수탁 번호 AAF97500)는 적절한 수용체 기질과 함께 제공되는 경우, UDP-GlcUA 및 UDP-GalNAc로부터 콘드로이틴 중합체를 합성할 수 있는 단일 폴리펩타이드 효소이다.
동물 조직으로부터의 정제를 포함하는 콘드로이틴 설페이트 생산의 전통적인 방법은 노동 및 비용 집약적일 수 있다. 또한, 동물 조직으로부터 콘드로이틴 설페이트의 생산은, 감염성 제제가 콘드로이틴 설페이트 생성물내에 존재할 가능성과 필수적으로 관련되어 있다. 이러한 잠재적인 감염성 제제의 경향성을 최소화하기 위해 동물 조직으로부터 생산 동안 주의를 기울여야만 한다. 이러한 단점들은 콘드로이틴의 생산을 위해 재조합 DNA 기술을 이용하는 대체 시도를 사용함으로써 해결될 수 있다. 최근에, 콘드로이틴의 미생물 생산은 데안젤리스(DeAngelis)(미국 특허출원 공개 제20030109693호) 및 시미니(Cimini) 등[참조: Appl. Microbiol. Biotechnol. 2010;85(6):1779-87 (Epub Oct. 1, 2009)]에 의해 제안되어 있다. 그러나, 콘드로이틴{파스퇴렐라 물토시다} 또는 콘드로이틴-유사(에스케리키아 콜라이 K4) 다당류를 생산하는 공지된 미생물은 각종 포유동물에 대한 공지된 병원균이므로 대규모 발효에 적합하지 않다. 이들은 또한 다당류의 비교적 낮은 생산자이다.
특히, 파스퇴렐라 물토시다는 이의 저 수율, 고가의 배지의 요구, 및 특수하고 고가의 시설을 요구하는 생물학적 위험 수준 2(Biohazard Level 2: BL2) 상태로 인하여 콘드로이틴의 상업적인 생산에 적합하지 않은 것으로 고려된다. 미생물로부터의 고 수율은 콘드로이틴의 상업적으로 수익성이 있는 생산에 필수적일 수 있다. 데안젤리스(DeAngelis)(미국 특허출원 공개 제20030109693호)는 식품 등급 락토코쿠스(Lactococcus) 또는 바실러스(Bacillus)와 같은 숙주 세포내에서 pmCS를 발현하여 재조합 콘드로이틴을 합성할 가능성을 언급하고 있다. 그러나, 바실러스는 그람 양성 박테리아이며, 따라서 에스케리키아 콜라이 및 파스퇴렐라 물토시다와 같은 그람 음성 유기체보다 매우 상이한 막/세포벽 구조를 갖는다. 따라서, 중합체의 효과적인 분비는 바실러스에서 문제가 될 것으로 예측될 수 있다.
에스케리키아 콜라이 K4는 또한 사람 병원체인 것으로 공지되어 있으므로 콘드로이틴의 생산에 적합하지 않다. 또한, 이는 콘드로이틴 그 자체를 생산하지 않으나, 위에 주목한 바와 같이 콘드로이틴의 프럭토실화된(fructosylated) 형태를 대신 생산한다. 이러한 다당류의 집중적인 화학적 또는 효소적 변형이 콘드로이틴을 생산하기 위해 필요하다. 이러한 변형은 공정의 전체 비용을 증가시킨다. 또한, 이는, 이러한 변형이 완료되어 일관된 생성물을 생성하는 것을 측정하기 위한 추가의 과정 및 품질 조절 측정의 도입을 필요로 한다.
따라서, 콘드로이틴을 생산하기 위한 효율적이고, 안전하며 비용 효과적인 공정이 요구되고 있다. 본 발명은 콘드로이틴 설페이트를 생산하기 위해 후속적으로 황산화될 수 있는 콘드로이틴의 재조합 미생물 생산을 위한, 작제물(construct) 및 숙주 세포 및 방법을 제공함으로써 이러한 요구를 해결한다.
발명의 간단한 요약
본 발명은 kpsF, kpsE, kpsD, kpsU, kpsC, kpsS, kfoA, kfoC, 및 kfoF를 포함하는 유전자 클러스터를 포함하는 작제물에 관한 것이며, 여기서 유전자 클러스터는 kfoD, orf3(kfoI), kfoE, 또는 orf1(kfoH) 중 하나 이상의 기능성 유전자를 함유하지 않으며, 여기서 작제물은 비-병원성 박테리아 숙주 세포에서 콘드로이틴을 생산하는데 적합하다. 일부 양태에서, 콘드로이틴은 프럭토실화되지 않는다. 일부 양태에서, 콘드로이틴은 숙주 세포로부터 분비된다. 일부 양태에서, 유전자 클러스터는 또한 kfoG, kfoB, 또는 kfoG 및 kfoB 둘다를 추가로 포함한다. 일부 양태에서, 유전자 클러스터는 kfoM 및 kfoT를 추가로 포함한다. 일부 양태에서, 작제물은 pDD66, pDD67, pCX040, pCX041, pCX042, pCX043, pCX096, 또는 pBR1052를 포함한다.
본 발명은 kfoA, kfoC, 및 kfoF를 포함하는 유전자 클러스터를 포함하는 작제물에 관한 것이며, 여기서 유전자 클러스터는 kpsM, kpsT, kpsE, kpsD, kpsC, 또는 kpsS 중 하나 이상의 기능성 유전자를 함유하지 않으며, 여기서 작제물은 비-병원성 박테리아 숙주 세포내에서 콘드로이틴을 생산하기에 적합하다. 일부 양태에서, 콘드로이틴은 숙주 세포로부터 분비되지 않는다. 일부 양태에서, 작제물은 또한 kfoD, orf3, kfoE, 또는 orf1 중 하나 이상의 기능성 유전자를 함유하지 않는다. 일부 양태에서, 콘드로이틴은 비-프럭토실화된다. 일부 양태에서, 유전자 클러스터는 또한 kfoG, kfoB, 또는 kfoG 및 kfoB 둘다를 추가로 포함한다. 일부 양태에서, 작제물은 kfoA, kfoB, kfoC, kfoF, 및 kfoG를 포함한다. 일부 양태에서, 작제물은 pCX039, pCX044, 또는 pCX092를 포함한다. 일부 양태에서, 작제물은 pCX045 또는 pCX048을 포함한다.
본 발명은 kfoA, kfoB, kfoC, kfoF, kfoG, 및 이의 조합으로 이루어진 군으로부터 선택된 유전자를 포함하는 작제물에 관한 것이며, 여기서 작제물은 kpsM, kpsT, kpsE, kpsD, kpsC, 또는 kpsS 중 하나 이상의 기능성 유전자를 함유하지 않으며, 작제물은 비-병원성 박테리아 숙주 세포내에서 콘드로이틴을 생산하거나 콘드로이틴의 양을 증가시키기에 적합하다. 일부 양태에서, 콘드로이틴은 숙주 세포로부터 분비되지 않는다. 일부 양태에서, 작제물은 또한 kfoD, orf3, kfoE, 또는 orf1 중 하나 이상의 기능성 유전자를 함유하지 않는다. 일부 양태에서, 콘드로이틴은 프럭토실화되어 있지 않다. 일부 양태에서, 작제물은 kfoA, kfoB, kfoC, kfoF, 및 kfoG를 포함한다. 일부 양태에서, 작제물은 pCX075, pCX081, pCX082, pCX092, pCX101, pBR1102, pBR1100 또는 pBR1101을 포함한다. 일부 양태에서, 작제물은 pCX045 또는 pCX048을 포함한다.
일부 양태에서, 본 발명의 작제물 중 어느 것에서 하나 이상의 유전자는 박테리아 숙주 세포내에서 최적의 코돈 사용빈도(codon usage)를 위해 변형된다.
일부 양태에서, 본 발명의 작제물 중 임의의 것은 프로모터를 추가로 포함한다. 일부 양태에서, 프로모터는 Pm, Plac, Ptrp, Ptac, λpL, PT7, PphoA, ParaC, PxapA, Pcad, 및 PrecA로 이루어진 군으로부터 선택된다. 일부 양태에서, 프로모터는 Pm이다.
일부 양태에서, 본 발명의 작제물 중 임의의 것은 제2 프로모터를 추가로 포함한다. 일부 양태에서, 제2 프로모터는 Pm, Plac, Ptrp, Ptac, λpL, PT7, PphoA, ParaC, PxapA, Pcad, 및 PrecA로 이루어진 군으로부터 선택된다. 일부 양태에서, 제2 프로모터는 Pm이다. 일부 양태에서, 제2 프로모터는 작제물내 하나 이상의 유전자에 작동적으로 연결된다. 일부 양태에서, 제2 프로모터는 kpsFEDUCS에 작동적으로 연결된다.
일부 양태에서, 작제물은 xylS 조절 유전자를 추가로 포함한다.
일부 양태에서, 본 발명의 작제물 중 임의의 것은 항생제 내성 유전자를 추가로 포함한다. 일부 양태에서, 항생제 내성 유전자는 클로람페니콜(CamR), 카나마이신(KanR), 암피실린(AmpR), 테트라사이클린(TetR), 블레오마이신(BleR), 스펙티노마이신(SpcR), 설폰아미드(SuR), 스트렙토마이신(StrR), 카르베니실린(CbR), 및 에리트로마이신(EryR)으로 이루어진 군으로부터 선택된다.
일부 양태에서, 본 발명의 작제물 중 임의의 것은 K4 유전자 클러스터를 포함한다.
일부 양태에서, 본 발명의 작제물 중 임의의 것은 비-병원성 박테리아 숙주 세포내에서 콘드로이틴을 생산하기에 적합하며, 여기서, 박테리아 숙주 세포는 에스케리키아(Escherichia), 슈도모나스(Pseudomonas), 잔토모나스(Xanthomonas), 메틸로모나스(Mehtylomonas), 악시네토박터(Acinetobacter) 및 스핑고모나스(Sphingomonas)로 이루어진 군으로부터 선택된 비-병원성 유기체이거나 이로부터 유래된다.
본 발명은 본 발명의 작제물 중 어느 것을 포함하는 비-병원성 박테리아 숙주 세포에 관한 것이다. 일부 양태에서, 박테리아 숙주 세포는 에스케리키아, 슈도모나스, 잔토모나스, 메틸로모나스, 악시네토박터, 및 스핑고모나스로 이루어진 군으로부터 선택된 비-병원성 유기체이거나 이로부터 유래한다. 일부 양태에서, 박테리아 숙주 세포는 MSC279, MSC280, MSC315, MSC316, MSC317, MSC319, MSC322, MSC323, MSC324, MSC325, MSC326, MSC328, MSC346, MSC347, MSC348, MSC350, MSC356, MSC359, MSC392, MSC402, MSC403, MSC404, MSC405, MSC410, MSC411, MSC436, MSC437, MSC438, MSC439, MSC458, MSC459, MSC460, MSC461, MSC466, MSC467, MSC469, MSC480, MSC494, MSC498, MSC499, MSC500, MSC510, MSC511, MSC522, MSC526, MSC537, MSC551, MSC561, MSC562, MSC563, MSC564, MSC566, MSC567, MSC619, MSC625, MSC627, MSC640, MSC641, MSC643, MSC646, MSC650, MSC656, MSC657, MSC658, MSC659, MSC660, MSC669, MSC670, MSC671, MSC672, MSC673, MSC674, MSC675, MSC676, MSC677, MSC678, MSC679, MSC680, MSC681, MSC682, MSC683, MSC684, MSC687, MSC688, MSC689, MSC690, MSC691, MSC692, MSC693, MSC694, MSC700, MSC701, MSC702, MSC722, MSC723 및 MSC724로 이루어진 군으로부터 선택된 박테리아 균주이다.
본 발명은 본 발명의 작제물 중 어느 것을 비-병원성 박테리아 숙주 세포로 이전시키고, 당해 박테리아 숙주 세포를 콘드로이틴이 박테리아 숙주 세포에 의해 생산되는 발효 조건하에서 배양함을 포함하는, 콘드로이틴을 생산하는 방법에 관한 것이다.
본 발명은 본 발명의 작제물 중 어느 것을 포함하는 비-병원성 박테리아 숙주 세포를 콘드로이틴의 생산에 충분한 발효 조건하에서 배양함을 포함하는, 콘드로이틴을 생산하는 방법에 관한 것이다.
본 발명은 본 발명의 작제물 중 어느 것을 비-병원성 박테리아 숙주 세포로 전달함을 포함하는, 비-병원성 박테리아 숙주 세포를 생산하는 방법에 관한 것이다.
일부 양태에서, 본 발명의 작제물 중 어느 것의 유전자 또는 유전자 클러스터는 본 발명의 방법 중 어느 것에서 박테리아 숙주 세포의 염색체 내로 통합된다.
일부 양태에서, 본 발명의 작제물 중 어느 것의 유전자 또는 유전자 클러스터의 2개 이상의 카피가 본 발명의 방법 중 어느 것에서 박테리아 숙주 세포의 염색체 내로 통합된다. 일부 양태에서, 유전자 클러스터 또는 유전자의 2개 이상의 카피는 동일한 유전자 또는 유전자 클러스터 중 2개 이상의 카피를 포함한다.
일부 양태에서, 본 발명의 방법 중 어느 것에 의해 생산된 콘드로이틴은 프럭토실화되지 않는다.
일부 양태에서, 본 발명의 방법은 콘드로이틴을 황산화시키는 것을 추가로 포함한다.
본 발명은 본 발명의 방법 중 어느 것에 의해 콘드로이틴을 생산하고; 콘드로이틴을 황산화시키는 것을 포함하는, 콘드로이틴 설페이트를 생산하는 방법에 관한 것이다.
일부 양태에서, 본 발명의 방법 중 어느 것에서 콘드로이틴을 황산화하는 공정은 설퍼트라이옥사이드-트라이에틸아민 복합체 또는 클로로설폰산을 포름아미드 내의 콘드로이틴과 혼합함을 포함한다.
일부 양태에서, 본 발명의 방법 중 어느 것에서 박테리아 숙주 세포는 에스케리키아, 슈도모나스, 잔토모나스, 메틸로모나스, 악시네토박터, 및 스핑고모나스로 이루어진 군으로부터 선택된 비-병원성 유기체이거나 이로부터 유래된다.
일부 양태에서, 본 발명의 방법 중 어느 것에서 박테리아 숙주 세포는 그람-음성 유기체이거나 이로부터 유래된다.
일부 양태에서, 본 발명의 방법 중 어느 것에서 박테리아 숙주 세포는 잔토모나스 캄페스트리스(Xanthomonas campestris)이다. 일부 양태에서, 잔토모나스 캄페스트리스는 MSC255, MSC256, MSC257, MSC225, 및 MSC226으로 이루어진 군으로부터 선택된 박테리아 균주이다.
일부 양태에서, 본 발명의 방법 중 어느 것에서 박테리아 숙주 세포는 비-병원성 에스케리키아 콜라이이다. 일부 양태에서, 비-병원성 에스케리키아 콜라이는 에스케리키아 콜라이 K-12 및 에스케리키아 콜라이 B로 이루어진 군으로부터 선택된다. 일부 양태에서, 에스케리키아 콜라이 K-12는 MSC188 및 MSC175로 이루어진 군으로부터 선택된 박테리아 균주이다. 일부 양태에서, 에스케리키아 콜라이 B는 박테리아 균주 MSC364이다.
일부 양태에서, 본 발명의 방법 중 어느 것에서 박테리아 숙주 세포의 내인성 유전자는 상동성 재조합에 의해 결실되거나 불활성화된다.
일부 양태에서, 본 발명의 방법 중 어느 것에서 박테리아 숙주 세포는 숙주 세포에 대해 내인성인 세포외 다당류를 발현하지 않는다.
일부 양태에서, 본 발명의 방법 중 어느 것에서 박테리아 숙주 세포는 실험실 클로닝 균주로부터 접합 전달(conjugal transfer)에 적합하다.
일부 양태에서, 본 발명의 방법은 박테리아 숙주 세포로부터 콘드로이틴을 회수하는 것을 추가로 포함한다.
일부 양태에서, 본 발명의 방법은 세포외 배양 배지로부터 콘드로이틴을 회수함을 추가로 포함한다.
일부 양태에서, 1 g/L 내지 50 g/L의 콘드로이틴이 24 내지 72시간내에 본 발명의 방법 중 어느 것에서 박테리아 숙주 세포로부터 분비된다. 일부 양태에서, 5 g/L 내지 50 g/L의 콘드로이틴이 24 내지 72시간내에 박테리아 숙주 세포로부터 분비된다. 일부 양태에서, 15 g/L 내지 50 g/L의 콘드로이틴이 24 내지 72시간내에 박테리아 숙주 세포로부터 분비된다.
일부 양태에서, 본 발명의 방법 중 임의의 것은 콘드로이틴을 정제함을 추가로 포함한다.
일부 양태에서, 본 발명의 방법 중 어느 것에서 박테리아 숙주 세포는 25℃ 내지 37℃에서 배양된다.
일부 양태에서, 본 발명의 방법 중 어느 것에서 박테리아 숙주 세포는 글리세린을 포함하는 배지 속에서 배양된다.
본 발명은 본 발명의 방법 중 어느 것에 의해 생산된 콘드로이틴에 관한 것이다.
본 발명은 본 발명의 방법 중 어느 것에 의해 생산된 콘드로이틴을 포함하는 조성물에 관한 것이다.
본 발명은 KpsF의 서열 번호 92, KpsE의 서열 번호 93, KpsD의 서열 번호 94, KpsU의 서열 번호 95, KpsC의 서열 번호 96, KpsS의 서열 번호 97, KpsT의 서열 번호 91, KfoA의 서열 번호 83, KfoB의 서열 번호 84, KfoC의 서열 번호 85, KfoI(Orf3)의 서열 번호 86, KfoE의 서열 번호 87, KfoH(Orf1)의 서열 번호 88, KfoF의 서열 번호 89, 및 KfoG의 서열 번호 90의 군으로부터 선택된 아미노산 서열에 결합하는 항체 또는 항체 단편에 관한 것이다.
본 발명은 콘드로이틴의 생산을 위한 작제물 및 재조합 세포, 콘드로이틴을 생산하는 방법, 이러한 방법으로 생산된 콘드로이틴, 및 콘드로이틴의 용도에 관한 것이다. 본원에 기술된 대로, 본 발명은 콘드로이틴 및 콘드로이틴 설페이트의 생산을 허용하는 신규 기술을 기초로 한다. 본 발명은 보다 저렴한 비용으로 콘드로이틴 및 콘드로이틴 설페이트의 안전하고, 일관되며 신뢰할만한 공급을 제공하면서, 우수한 생성물 품질을 제공함으로써 당해 분야의 중요한 요구를 충족한다. 당해 공정은 또한 채식주의자 및 유대교인 제품을 제공할 수 있다. 재조합적으로 생산된 콘드로이틴은 공지된 방법을 사용하여 황산화함으로써 콘드로이틴 설페이트를 형성시킬 수 있다. 따라서, 본 발명은 재조합적으로 생산된 콘드로이틴의 황산화 방법, 재조합적으로 생산된 콘드로이틴 설페이트 생성물, 및 재조합적으로 생산된 콘드로이틴 설페이트 생성물의 용도를 포함한다.
도 1a는 콘드로이틴 및 콘드로이틴 설페이트의 구조를 나타낸다. 도 1b는 콘드로이틴 설페이트와 프로테오글리칸의 코어 단백질 사이의 연결을 나타낸다.
도 2는 본 발명 이전에 제안된 바와 같은, 에스케리키아 콜라이 K4 캡슐의 합성에 관여하는 유전자 클러스터의 구성을 나타낸다. 당해 도에 나타낸 영역 2의 구성은 문헌(참조: Ninomiya et al., J. Biol. Chem. 2002;277:21567-21575)에 기술된 바와 같다. 에스케리키아 콜라이 K4 캡슐 유전자 클러스터의 영역 1 및 3은 본 발명 이전에 서열분석되지 않았으므로, 이들의 구조는 본 발명 이전에 공지되어 있지 않았다.
도 3은 문헌(참조: Ninomiya et al., J. Biol. Chem. 2002;277:21567-21575)에 기술된 바와 같이 에스케리키아 콜라이 K4 캡슐 영역 2 서열(AB079602)의 본 발명의 발명자들에 의한 분석을 나타낸다. 도 3a는 추가의 추정된 코딩 서열 orf1, orf2 및 orf3의 존재를 나타내며, 에스케리키아 콜라이 K4로부터의 영역 2와 파스퇴렐라 물토시다 혈청형 B 및 E의 서열 정렬을 기초로 하여, 에스케리키아 콜라이 K4로부터의 유전자(도 3b에 나타낸 정렬 데이타), kfoD, orf3, kfoE, orf1이 파스퇴렐라 물토시다 M1404 혈청형 B 유전자 bcbDEFG 및 파스퇴렐라 물토시다 P1234 혈청형 E 유전자 ecbDEFG 중에서 상동체를 가짐을 추가로 나타낸다. 상동체는 쌍두 화살표로 연결되어 있다.
도 4는 본 발명자들에 의해 측정된 것으로서 에스케리키아 콜라이 K4 균주 ATCC 23502의 영역 2 유전자의 서열에 관한 것이다. 도 4a는 니노미야(Ninomiya) 등에 의해 앞서 보고된 서열과 비교하여 본 발명자들에 의해 측정된 서열들 사이의 차이를 나열한다. 도 4b는 본 발명자들에 의해 측정된 것으로서, 영역 2 유전자의 서열(도 4b에서 서열 번호 30; 서열 번호 32; 서열 번호 26; 서열 번호 24; 및 서열 번호 20으로 나타냄)에 의해 인코딩된 예측된 아미노산 서열과 니노미야 등에 의해 보고된 서열(도 4b에서 K4 Kfo putORF2 및 K4 KfoG_BAC00518; K4 Kfo putORF_1; K4 KfoE_BAC00520; K4 KfoD_BAC00521; K4 KfoB_BAC00524로 나타냄)에 의해 인코딩된 것들의 비교를 나타낸다.
도 5는 에스케리키아 콜라이 K4 균주 U1-41로부터의 K4 캡슐 유전자 클러스터의 구성을 나타낸다. 유전자 클러스터는 단백질을 인코딩하는 것으로 예측된 17개의 개방 판독 프레임(open reading frame)(IS2 배제)을 함유한다.
도 6은 3개의 분절, kpsFEDUCS("FS 분절"), kpsMTkfoABCFG("MG 분절") 및 kfoDIEH("DH 분절")로 작제된 합성 유전자의 구조를 도표로 나타낸다. 묘사한 바와 같이, 제한 부위는 전략적 위치에서 혼입되어 합성 단편이 하나 이상의 오페론내로 조립되도록하고 개개 유전자의 조작을 촉진하였다.
도 7a는 특정 유전자 또는 유전자 클러스터의 결실에 의해 유도체 박테리아 균주를 작제하기 위한 팝 인(pop in), 팝-아웃(pop-out) 전략을 나타낸다. 도 7b는 당해 전략에서 잔토모나스 캄페스트리스내에서 당해 전략을 사용하기 위해 사용된 자살 벡터 pCX027(서열 번호 141)의 지도를 나타낸다.
도 8a 내지 8u는 본 발명의 플라스미드 및 DNA 단편 pBHR1, pDD39, pDD42, pDD47, pREZ6, pDD49, pJ201:11352, pDD50, pDD54, pJ241:10662, pJ241:10664, pJ241:10663, pDD37, pDD38, pDD51, pDD52, pDD57, pDD58, pDD61, pDD62, pDD63, pDD59, pDD67, pDD60, pDD66, pBR1052, pMAK-CL, pDD74, pDD76, pDD73, pDD77, pDD79, pDD80, pCX045, pCS048, pCX039, pCX044, pCX040, pCX042, pCX041, pCX043, MSC467, MSC561, 및 pBR1087에 대한 DNA 지도를 나타낸다.
도 9는 에스케리키아 콜라이 K4 2 군 캡슐 유전자 클러스터에 의해 인코딩된 단백질에 대해 지시된 항혈청을 사용하여 수행된 웨스턴 블롯으로부터의 결과의 예를 나타낸다.
도 10a 내지 10d는 잔토모나스 캄페스트리스내로 클로닝된 에스케리키아 콜라이 K4 콘드로이틴 생합성 유전자를 도입시키기 위해 사용된 플라스미드 작제물의 DNA 지도를 나타낸다.
도 11a는 억제성 ELISA에서 측정된 K4 프럭토실화된 콘드로이틴 캡슐 다당류("K4P")에 대한 대표적인 교정 곡선을 나타낸다. 도 11b는 콘드로이틴을 위한 콘드로이티나제/HPLC에서 측정된, 이당류, 2-아세트아미도-2-데옥시-3-O-(β-D-글루코-4-에네피라노실우론산)-D-갈락토즈("△di-0S")의 대표적인 표준 곡선을 나타낸다.
도 12는 재조합 콘드로이틴의 콘드로이티나제 분해능을 나타낸다.
도 13은 K4 프럭토실화된 콘드로이틴 캡슐 다당류(K4P) 및 탈푸럭토실화된(defructosylated) K4P(DFK4P) 둘다의 콘드로이티나제 분해능을 나타낸다.
도 14a 내지 14x는 본 발명의 플라스미드 작제물 pCX096, pCX097, pCX100, pCX101, pCS102, pCX075, pCX082, pCX081, pCX092, pBR1077, pBR1082, pCX050, pCX070, pCX093, pCX094, pCX095, pMAK705p1, pBR1103, pBR1093lacZ, pBR100-lac, pBR1094mt1, pBR1101-mt1, pBR1095fru, 및 pBR1102-fru에 대한 DNA 지도를 나타낸다.
도 15는 콘드로이틴-생산 에스케리키아 콜라이 균주의 가계수 및 균주 유도체화에 사용된 단계들을 나타낸다.
도 2는 본 발명 이전에 제안된 바와 같은, 에스케리키아 콜라이 K4 캡슐의 합성에 관여하는 유전자 클러스터의 구성을 나타낸다. 당해 도에 나타낸 영역 2의 구성은 문헌(참조: Ninomiya et al., J. Biol. Chem. 2002;277:21567-21575)에 기술된 바와 같다. 에스케리키아 콜라이 K4 캡슐 유전자 클러스터의 영역 1 및 3은 본 발명 이전에 서열분석되지 않았으므로, 이들의 구조는 본 발명 이전에 공지되어 있지 않았다.
도 3은 문헌(참조: Ninomiya et al., J. Biol. Chem. 2002;277:21567-21575)에 기술된 바와 같이 에스케리키아 콜라이 K4 캡슐 영역 2 서열(AB079602)의 본 발명의 발명자들에 의한 분석을 나타낸다. 도 3a는 추가의 추정된 코딩 서열 orf1, orf2 및 orf3의 존재를 나타내며, 에스케리키아 콜라이 K4로부터의 영역 2와 파스퇴렐라 물토시다 혈청형 B 및 E의 서열 정렬을 기초로 하여, 에스케리키아 콜라이 K4로부터의 유전자(도 3b에 나타낸 정렬 데이타), kfoD, orf3, kfoE, orf1이 파스퇴렐라 물토시다 M1404 혈청형 B 유전자 bcbDEFG 및 파스퇴렐라 물토시다 P1234 혈청형 E 유전자 ecbDEFG 중에서 상동체를 가짐을 추가로 나타낸다. 상동체는 쌍두 화살표로 연결되어 있다.
도 4는 본 발명자들에 의해 측정된 것으로서 에스케리키아 콜라이 K4 균주 ATCC 23502의 영역 2 유전자의 서열에 관한 것이다. 도 4a는 니노미야(Ninomiya) 등에 의해 앞서 보고된 서열과 비교하여 본 발명자들에 의해 측정된 서열들 사이의 차이를 나열한다. 도 4b는 본 발명자들에 의해 측정된 것으로서, 영역 2 유전자의 서열(도 4b에서 서열 번호 30; 서열 번호 32; 서열 번호 26; 서열 번호 24; 및 서열 번호 20으로 나타냄)에 의해 인코딩된 예측된 아미노산 서열과 니노미야 등에 의해 보고된 서열(도 4b에서 K4 Kfo putORF2 및 K4 KfoG_BAC00518; K4 Kfo putORF_1; K4 KfoE_BAC00520; K4 KfoD_BAC00521; K4 KfoB_BAC00524로 나타냄)에 의해 인코딩된 것들의 비교를 나타낸다.
도 5는 에스케리키아 콜라이 K4 균주 U1-41로부터의 K4 캡슐 유전자 클러스터의 구성을 나타낸다. 유전자 클러스터는 단백질을 인코딩하는 것으로 예측된 17개의 개방 판독 프레임(open reading frame)(IS2 배제)을 함유한다.
도 6은 3개의 분절, kpsFEDUCS("FS 분절"), kpsMTkfoABCFG("MG 분절") 및 kfoDIEH("DH 분절")로 작제된 합성 유전자의 구조를 도표로 나타낸다. 묘사한 바와 같이, 제한 부위는 전략적 위치에서 혼입되어 합성 단편이 하나 이상의 오페론내로 조립되도록하고 개개 유전자의 조작을 촉진하였다.
도 7a는 특정 유전자 또는 유전자 클러스터의 결실에 의해 유도체 박테리아 균주를 작제하기 위한 팝 인(pop in), 팝-아웃(pop-out) 전략을 나타낸다. 도 7b는 당해 전략에서 잔토모나스 캄페스트리스내에서 당해 전략을 사용하기 위해 사용된 자살 벡터 pCX027(서열 번호 141)의 지도를 나타낸다.
도 8a 내지 8u는 본 발명의 플라스미드 및 DNA 단편 pBHR1, pDD39, pDD42, pDD47, pREZ6, pDD49, pJ201:11352, pDD50, pDD54, pJ241:10662, pJ241:10664, pJ241:10663, pDD37, pDD38, pDD51, pDD52, pDD57, pDD58, pDD61, pDD62, pDD63, pDD59, pDD67, pDD60, pDD66, pBR1052, pMAK-CL, pDD74, pDD76, pDD73, pDD77, pDD79, pDD80, pCX045, pCS048, pCX039, pCX044, pCX040, pCX042, pCX041, pCX043, MSC467, MSC561, 및 pBR1087에 대한 DNA 지도를 나타낸다.
도 9는 에스케리키아 콜라이 K4 2 군 캡슐 유전자 클러스터에 의해 인코딩된 단백질에 대해 지시된 항혈청을 사용하여 수행된 웨스턴 블롯으로부터의 결과의 예를 나타낸다.
도 10a 내지 10d는 잔토모나스 캄페스트리스내로 클로닝된 에스케리키아 콜라이 K4 콘드로이틴 생합성 유전자를 도입시키기 위해 사용된 플라스미드 작제물의 DNA 지도를 나타낸다.
도 11a는 억제성 ELISA에서 측정된 K4 프럭토실화된 콘드로이틴 캡슐 다당류("K4P")에 대한 대표적인 교정 곡선을 나타낸다. 도 11b는 콘드로이틴을 위한 콘드로이티나제/HPLC에서 측정된, 이당류, 2-아세트아미도-2-데옥시-3-O-(β-D-글루코-4-에네피라노실우론산)-D-갈락토즈("△di-0S")의 대표적인 표준 곡선을 나타낸다.
도 12는 재조합 콘드로이틴의 콘드로이티나제 분해능을 나타낸다.
도 13은 K4 프럭토실화된 콘드로이틴 캡슐 다당류(K4P) 및 탈푸럭토실화된(defructosylated) K4P(DFK4P) 둘다의 콘드로이티나제 분해능을 나타낸다.
도 14a 내지 14x는 본 발명의 플라스미드 작제물 pCX096, pCX097, pCX100, pCX101, pCS102, pCX075, pCX082, pCX081, pCX092, pBR1077, pBR1082, pCX050, pCX070, pCX093, pCX094, pCX095, pMAK705p1, pBR1103, pBR1093lacZ, pBR100-lac, pBR1094mt1, pBR1101-mt1, pBR1095fru, 및 pBR1102-fru에 대한 DNA 지도를 나타낸다.
도 15는 콘드로이틴-생산 에스케리키아 콜라이 균주의 가계수 및 균주 유도체화에 사용된 단계들을 나타낸다.
하기 상세히 기술된 바와 같이, 본 발명자들은 에스케리키아 콜라이 K4 프럭토실화된 콘드로이틴 캡슐 다당류(K4P)의 생합성에 관여된 단백질을 인코딩하는 에스케리키아 콜라이 K4 유전자를 서열분석하고, 천연 서열을 기초로 하여, DNA 분절을 합성하고 조립하였으며, 이들 유전자를 대규모 발효에 적합한 대체 숙주 세포내로 이전시켜, 이들 숙주 세포내에서 재조합 프럭토실화된 콘드로이틴 캡슐 다당류의 생산을 입증하였다. 대안의 숙주 세포는 비-프럭토실화된 콘드로이틴을 생산하여야 하는 것이 바람직하므로, 에스케리키아 콜라이 K4에 의한 콘드로이틴의 프럭토실화에 관여하는 유전자를 확인하고 대체 숙주로 전달된 에스케리키아 콜라이 K4 콘드로이틴 생합성 유전자 세트로부터 결실시켰다. 그 결과, 당해 유전자 세트를 함유하는 대체 숙주는 비-프럭토실화된 콘드로이틴을 생산하였다. 대체 숙주에 의해 생산된 이러한 재조합 콘드로이틴(rCH)은 황산화되어 콘드로이틴 설페이트 생성물을 생산할 수 있다.
본원에 사용된 것으로서, 용어 "K4P"는 야생형 에스케리키아 콜라이 K4 균주에 의해 합성된 천연의 또는 천연적으로 존재하는 프럭토실화된 콘드로이틴 캡슐 다당류를 말한다. 용어 "콘드로이틴"은 콘드로이틴 골격을 말한다. 콘드로이틴은 프럭토실화되거나 프럭토실화되지 않을 수 있다(또는 비-프럭토실화 될 수 있다). 본원에 사용된 것으로서, 용어 "콘드로이틴"은 구체적으로 나타내지 않는 한 프럭토실화된 형태 및 프럭토실화되지 않은 형태 둘다를 포함한다. 또한, 본원에 사용된 것으로서, 용어 콘드로이틴은 황산화되지 않은 콘드로이틴을 말한다. 본 발명의 방법에 의해 생산된 콘드로이틴은 하기 상세히 설명한 바와 같이 효소적 수단 또는 화학적 수단에 의해 황산화될 수 있으며, 여기서 이는 콘드로이틴 설페이트로 언급된다.
하나의 국면에서, 본 발명은 에스케리키아 콜라이 K4 유전자 세트 또는 유전자 클러스터를 포함하는 DNA 작제물을 포함한다. 본원에 사용된 것으로서 용어 "K4 유전자 클러스터"는 콘드로이틴-유사 캡슐 다당류(K4P)의 생합성에 관여하는 에스케리키아 콜라이 K4로부터의 유전자 세트를 말한다. 용어 "K4 유전자 클러스터"는 콘드로이틴-유사 캡슐 다당류의 생합성에 관여한 에스케리키아 콜라이 K4로부터의 모든 유전자 또는 이들 유전자의 서브세트를 말할 수 있다.
실시예 1에 기술된 바와 같이, 에스케리키아 콜라이 K4는 K4P로서 언급된 콘드로이틴-유사 캡슐 다당류의 합성에 관여된 다수 유전자의 세트를 함유한다. 위에 나타낸 바와 같이, 당해 다당류는 프럭토즈 잔기의 첨가에 의해 변형된 콘드로이틴 골격으로 이루어진다. 도 2에 나타낸 바와 같이, 이들 유전자는 3개의 주요 영역[영역 1("R1"), 영역2("R2") 및 영역 3("R3")]으로 구성된다. 문헌[참조: Ninomiya et al. (2002)](GenBank 수탁 번호 AB079602)]에 기술된 영역 2의 서열을 기초로 하여, 영역 2는 캡슐 생합성과 관련된 7개의 유전자, kfoA, kfoB, kfoC, kfoD, kfoE, kfoF 및 kfoG를 포함하는 것으로 예측되었다. 니노미야 등은 에스케리키아 콜라이 K4 캡슐 유전자 클러스터의 예측된 영역 1 및 영역 3 부분의 서열을 기재하지 않았다. 그러나, 다른 에스케리키아 콜라이 캡슐 유전자 클러스터의 공지된 구성을 기초로 하여, 영역 1은 6개의 유전자, kpsF, kpsE, kpsD, kpsU, kpsC, kpsS를 포함하는 것으로 예측될 수 있으며 영역 3은 2개의 유전자, kpsM 및 kpsT를 포함하는 것으로 예측될 수 있다. kpsM, kpsT, kpsD, kpsE, kpsC 및 kpsS 유전자는 세포 세포질로부터 세포 표면으로 캡슐 다당류의 전좌에 요구된 단백질을 인코딩하며, 여기서 성숙한 캡슐 다당류는 이러한 막의 지질 성분에의 공유 결합을 통해 외부 세포 막에 고정되는 것으로 여겨진다(참조: Whitfield, 2006). kpsF 및 kpsU 유전자는 CMP-Kdo의 생합성에서 단계들을 촉매하는 것으로 예측된 단백질을 인코딩한다. 에스케리키아 콜라이내에서 콘드로이틴 캡슐의 생합성시 CMP-Kdo의 역활은 제안되어 있지만(참조: Roberts, Annu. Rev. Microbiol. 1996;50:285-315) 실험적으로 입증되어 있지는 않다(참조: Whitfield, 2006). 따라서, 본 발명의 기재내용 이전에, 전체 K4 유전자 클러스터는 15개 유전자를 포함하는 것으로 고려되었다.
니노미야 등에 의해 보고된 서열(GenBank 수탁 번호 AB079602)을 확인하기 위해, 본 발명자들은 에스케리키아 콜라이 K4 균주 ATCC 23502로부터의 K4 캡슐 유전자 클러스터의 영역 2를 서열분석하였다. 본 발명자들에 의해 측정된 서열 및 AB079602 서열을 비교했을 때, 26번 위치에서 치환, 결실 및 삽입을 포함하는, 단일 염기 쌍 차이가 발견되었다. 실시예 1에 상세히 설명된 바와 같이, 이들 차이들 중 일부는 유전자 클러스터에 의해 코딩된 영역 2 단백질의 예측된 아미노산 서열에서 상당한 차이를 생성한다. 또한, 본 발명자들은 유전자를 분리하는 유전자간 서열로서 니노미야 등에 의해 확인된 영역을 시험하고, 앞서 확인되지 않았던 영역 2내 3개의 추가의 개방 판독 프레임 orf1(또한 본원에서 kfoH로 언급됨), orf2 및 orf3(또한 본원에서 kfoI으로 언급됨)을 확인하였다.
모든 3개 영역으로부터의 유전자를 포함하는 전체 K4 유전자 클러스터의 정확한 서열을 측정하기 위하여, 에스케리키아 콜라이 혈청형 K4 균주 U1-41을 Statens Serum Institut(덴마크 코펜하겐 소재)로부터 입수하였다. U1-41은 ATCC 23502 균주의 조상이며 배양물 속에 K4 캡슐 다당류를 생산하는 것으로 보고되어 있다. 이는 또한 에스케리키아 콜라이 혈청형구분(serotyping)을 위한 K4 참조 균주이며 문헌[참조: Rodriguez et al. (1988)]에 의해 K4P 구조적 측정에 사용된 다당류 제제를 생산하는데 사용되었다. 에스케리키아 콜라이 U1-41내 K4 캡슐 유전자 클러스터에 걸친(spanning) 총 약 23kb의 DNA를 서열분석하였다. 당해 서열(서열 번호 117)은 영역 1내 kpsF, kpsE, kpsD, kpsU, kpsC 및 kpsS 유전자의 존재 및 영역 3내 kpsM 및 kpsT 유전자의 존재를 확인하였다. U1-41의 영역 2 서열 및 ATCC 23502의 영역 2에 대해 본 발명자들에 의해 측정된 서열은 동일한 것으로 밝혀졌다.
실시예 1에 상세히 기재되어 있는 바와 같이, U1-41로부터의 유전자 클러스터는 콘드로이틴의 생합성에 관련된 단백질을 인코딩하는 것으로 예측되는 (IS2 서열 배제) 17개의 개방 판독 프레임(Nonomiya 등에 의해 앞서 기술된 바와 같은 15개 대신)을 함유하는 것으로 밝혀졌다. 이들 유전자의 정렬은 에스케리키아 콜라이 2 군 캡슐 유전자 클러스터에 대해 전형적이다. 보존된 유전자 kpsF, kpsE, kpsD, kpsU, kpsC 및 kpsS을 포함하는 영역 1, 및 보존된 유전자 kpsM 및 kpsT를 포함하는 영역 3은 영역 2의 9개의 개방 판독 프레임을 플랭킹(flanking)한다. 영역 1 및 영역 3 유전자는 에스케리키아 콜라이내 모든 2 군 캡슐의 합성 및 전좌에 요구되는 단백질을 포함한다. 영역 1은 또한 상기 나타낸 바와 같이, CMP-Kdo의 생합성에서 단계들을 촉매하는 것으로 예측된, 효소를 인코딩하는 2개의 유전자(kpsF 및 kpsU)를 포함한다. 영역 2내에 확인된 9개 유전자 중에서, 3개는 캡슐 생합성과 관련된 명확하게 정의된 활성을 지닌 단백질: kfoA(UDP-GlcNAc를 UDP-GalNAc 전구체로 전환하는 UDP-GlcNAc 에피머라제), kfoF(UDP-Glc를 UDP-GlcUA 전구체로 전환하는 UDP-Glc 데하이드로게나제) 및 kfoC(콘드로이틴 신타제, 즉, 전구체 UDP-GalNAc 또는 UDP-GlcUA 중 하나를 수용체 콘드로이틴 분자에 가할 수 있는 폴리머라제)를 인코딩한다.
K4 캡슐 유전자 클러스터의 영역 2내에 존재하는 다른 유전자, kfoB, kfoG, kfoD, kfoE, kfoH(orf1) 및 kfoI(orf3)에 의해 인코딩된 단백질의 기능은 알려져 있지 않았다. kfoB 및 kfoG 유전자는 파스퇴렐라 물토시다 혈청형 A, F 및 D(참조: Townsend et al., J. Clin. Microbiol. 2001;39:924-929) 및 에스케리키아 콜라이 혈청형 K5(참조: Petit et al., Mol. Microbiol. 1995;4:611-620)와 같은 다른 글리코사미노글리칸(GAG) 캡슐을 생산하는 것으로 공지된 박테리아의 캡슐 클러스터내에 존재하는 유전자에 의해 인코딩된 것들과 상동성인 단백질을 인코딩한다. 이러한 상황 증거는, kfoB 및 kfoG가 GAG-함유 K4 캡슐의 생합성에서 역활을 할 수 있음을 제안하였다. 실시예 7에서 상세히 설명한 바와 같이, 본 발명자들은, kfoB 및 kfoG 유전자가 에스케리키아 콜라이내 콘드로이틴의 생산에 필수적이지 않지만, kfoG 유전자는 콘드로이틴의 최적 생산에 필요함을 발견하였다.
본 발명 이전에, kfoD, kfoE, kfoH(또는 orf1) 및 kfoI(또는 orf3)가 K4 캡슐의 생합성시 관여되는 것으로 시사한 증거는 없었다. 흥미롭게도, 4개의 연속된 K4 유전자, kfoD, kfoI(또는 orf3), kfoE, 및 kfoH(또는 orf1)는 인접한 파스퇴렐라 물토시다 혈청형 B 유전자 bcbDEFG 및 파스퇴렐라 물토시다 혈청형 E 유전자 ecbDEFG 중에서 상동체를 가짐이 밝혀졌다. 그러나, 이들 2개의 파스퇴렐라 균주는 콘드로이틴 생산자인 것으로 알려져 있지 않으며, 에스케리키아 콜라이 K4내 이들 유전자의 역활은 본 발명 이전에 알려져 있지 않았다. 따라서, kfoD, kfoI(orf3), kfoE 및 kfoH(orf1)는 콘드로이틴의 합성시 관여되지 않을 수 있는 것으로 여겨졌다. 실시예 6 및 7에 나타나 있는 바와 같이, 이들 유전자들 중 어느 것도 콘드로이틴의 생합성에 요구되지 않지만, 이들 유전자들 중 하나 이상은 K4 유전자 세트에 의해 생산된 콘드로이틴의 프럭토실화에 필수적이다.
기초로서 U1-41 K4 캡슐 유전자 클러스터의 서열을 사용하여, 본 발명자들은 에스케리키아 콜라이, 잔토모나스 캄페스트리스, 스핑고모나스 엘로데아(Sphingomonas elodea) 및 바실러스 서브틸리스(Bacillus subtilis)와 같은 숙주내에서 발현을 위해 코돈-최적화되는 합성 유전자를 추가로 설계하였다. 이들 코돈-최적화된 유전자의 설계 및 합성은 실시예 2에 상세히 설명되어 있다. 실시예 4는 이종 박테리아내에서 이들 유전자의 발현을 위한 플라스미드 벡터의 작제를 기술한다.
본 발명의 코돈-최적화된 유전자의 완전한 뉴클레오타이드 서열, 및 이들에 의해 인코딩된 아미노산 서열은 다음과 같다. 본 발명에서 사용된 kpsF에 대한 완전한 뉴클레오타이드 서열은 본원에서 서열 번호 1로 나타나 있다. kpsF는 서열 번호 2로서 본원에 나타낸, 327개 아미노산 서열을 인코딩하는 981개 뉴클레오타이드 서열(정지 코돈을 포함하지 않음)이다. kpsE에 대한 완전한 뉴클레오타이드 서열은 본원에서 서열 번호 3으로 나타낸다. kpsE는 본원에서 서열 번호 4로 나타낸, 382개 아미노산 서열을 인코딩하는 1146개 뉴클레오타이드 서열(정지 코돈을 포함하지 않음)이다. kpsD에 대한 완전한 뉴클레오타이드 서열은 본원에 서열 번호 5로서 나타나 있다. kpsD는 본원에서 서열 번호 6으로 나타낸, 558개 아미노산 서열을 코딩하는 1674개 뉴클레오타이드 서열(정지 코돈을 포함하지 않음)이다. kpsU에 대한 완전한 뉴클레오타이드 서열은 본원에서 서열 번호 7로 나타낸다. kpsU는 본원에서 서열 번호 8로 나타낸, 246개 아미노산 서열을 인코딩하는 738개 뉴클레오타이드 서열(정지 코돈을 포함하지 않음)이다. kpsC에 대한 완전한 뉴클레오타이드 서열은 본원에서 서열 번호 9로 나타나 있다. kpsC는 본원에서 서열 번호 10으로 나타낸, 675개 아미노산 서열을 인코딩하는 2025개 뉴클레오타이드 서열(정지 코돈은 포함하지 않음)이다. kpsS에 대한 완전한 뉴클레오타이드 서열은 본원에서 서열 번호 11로 나타나 있다. kpsS는 본원에서 서열 번호 12로 나타낸, 403개 아미노산 서열을 인코딩하는 1209개 뉴클레오타이드 서열(정지 코돈을 포함하지 않음)이다. kpsM에 대한 완전한 뉴클레오타이드 서열은 본원에서 서열 번호 13으로 나타나 있다. kpsM은 본원에서 서열 번호 14로 나타낸, 258개 아미노산 서열을 인코딩하는 774개 뉴클레오타이드 서열(정지 코돈을 포함하지 않음)이다. kpsT에 대한 완전한 뉴클레오타이드 서열은 본원에서 서열 번호 15로 나타나 있다. kpsT는 본원에서 서열 번호 16으로 나타낸, 222개 아미노산 서열을 코딩하는 666개 뉴클레오타이드 서열(정지 코돈을 포함하지 않음)이다. kfoA에 대한 완전한 뉴클레오타이드 서열은 본원에서 서열 번호 17로 나타나 있다. kfoA는 본원에서 서열 번호 18로 나타낸, 339개 아미노산 서열을 인코딩하는 1017개 뉴클레오타이드 서열(정지 코돈을 포함하지 않음)이다. kfoB에 대한 완전한 뉴클레오타이드 서열은 본원에서 서열 번호 19로 나타나 있다. kfoB는 본원에서 서열 번호 20으로 나타낸, 546개 아미노산 서열을 인코딩하는 1638개 뉴클레오타이드 서열(정지 코돈을 포함하지 않음)이다. kfoC에 대한 완전한 뉴클레오타이드 서열은 본원에서 서열 번호 21로 나타나 있다. kfoC는 본원에서 서열 번호 22로 나타낸, 686개 아미노산 서열을 인코딩하는 2058개 뉴클레오타이드 서열(정지 코돈을 포함하지 않음)이다. kfoD에 대한 완전한 뉴클레오타이드 서열은 본원에서 서열 번호 23으로 나타나 있다. kfoD는 본원에서 서열 번호 24로 나타낸, 477개 아미노산 서열을 코딩하는 1431개 뉴클레오타이드 서열(정지 코돈을 포함하지 않음)이다. kfoE에 대한 완전한 뉴클레오타이드 서열은 본원에서 서열 번호 25로 나타나 있다. kfoE는 본원에서 서열 번호 26으로 나타낸, 522개 아미노산 서열을 인코딩하는 1566개 뉴클레오타이드 서열(정지 코돈을 포함하지 않음)이다. kfoF에 대한 완전한 뉴클레오타이드 서열은 본원에서 서열 번호 27로 나타나 있다. kfoF는 본원에서 서열 번호 28로 나타낸, 389개 아미노산 서열을 인코딩하는 1167개 뉴클레오타이드 서열(정지 코돈을 포함하지 않음)이다. kfoG에 대한 완전한 뉴클레오타이드 서열은 본원에서 서열 번호 29로 나타나 있다. kfoG는 본원에서 서열 번호 30으로 나타낸, 488개 아미노산 서열을 인코딩하는 1464개 뉴클레오타이드 서열(정지 코돈을 포함하지 않음)이다.
orf1(본원에서 또한 kfoH로 언급됨)에 대한 완전한 뉴클레오타이드 서열은 본원에서 서열 번호 31로 나타나 있다. orf1은 본원에서 서열 번호 32로 나타낸, 241개 아미노산 서열을 인코딩하는 723개 뉴클레오타이드 서열(정지 코돈을 포함하지 않음)이다. orf3(또한 본원에서 kfoI로 언급됨)에 대한 완전한 뉴클레오타이드 서열은 본원에서 서열 번호 33으로 나타나 있다. orf3는 본원에서 서열 번호 34로 나타낸, 126개 아미노산 서열을 인코딩하는 378개 뉴클레오타이드 서열(정지 코돈을 포함하지 않음)이다.
각종 양태에서, 본 발명은 에스케리키아 콜라이 K4 유전자 클러스터, 에스케리키아 콜라이 K4 유전자 클러스터의 하나 이상의 영역, 에스케리키아 콜라이 K4 유전자 클러스터로부터의 유전자의 하나 이상의 서브세트, 에스케리키아 콜라이 K4 유전자 클러스터로부터의 하나 이상의 개개 유전자, 또는 이의 조합을 포함하는 작제물을 포함하며, 여기서 작제물은 박테리아 숙주 세포내에서 콘드로이틴을 생산하거나 이의 양을 증가시키는데 유용하다. 각종 양태에서, 작제물은 위에 기술된 전체 17개의 유전자 클러스터 또는 위에 기술된 17개 유전자 클러스터 중 하나 이상의 유전자, 즉, kpsF, kpsE, kpsD, kpsU, kpsC, kpsS, kpsM, kpsT, kfoA, kfoB, kfoC, kfoD, kfoE, kfoF, kfoG, kfoH 및 kfoI를 포함할 수 있다. 일부 양태에서, 작제물은 K4 클러스터의 하나 이상의 영역(즉, 본원에 기술된 바와 같은 영역 1, 2, 및/또는 3)을 포함한다. 일부 양태에서, 작제물은 K4 클러스터로부터의 유전자의 하나 이상의 서브세트(본원에 기술된 바와 같은 영역 1, 2 및/또는 3으로부터의 유전자의 서브세트를 포함함)를 포함한다. 작제물은, 클러스터내 유전자가 클러스터내 어떠한 다른 유전자에 대해 어떠한 순서로도 존재하는 유전자 클러스터를 포함할 수 있다. 따라서, 작제물내의 유전자 클러스터내 유전자의 순서는 K4 클러스터내의 천연적으로 존재하는 유전자의 순서와는 상이할 수 있다. 유사하게, 작제물은 K4 클러스터로부터의 어떠한 다른 영역, 유전자 서브세트, 또는 개개 유전자와 관련하여 작제물내에 어떠한 순서로도 존재할 수 있는 K4 클러스터로부터의 영역, 유전자의 서브세트, 또는 유전자를 포함할 수 있다. 일부 양태에서, 유전자는 작제물내에 규정된 순서로 존재한다. 작제물은 상기 언급된 에스케리키아 콜라이 혈청형 K4 균주 U1-41로부터 분리된 하나 이상의 천연 유전자(즉, 에스케리키아 콜라이 K4 U1-41 또는 다른 혈청형 K4 균주내에 존재하는 서열을 갖는 유전자) 및/또는 하나 이상의 합성 유전자, 즉, U1-41로부터 분리된 천연 유전자를 기초로 하지만, 여기서 DNA 서열이 이들 유전자에 의해 코딩된 아미노산 서열을 변경시키지 않고, 박테리아 숙주 세포내에서 최적의 코돈 사용빈도를 위해 변형된 유전자를 포함할 수 있다. 이러한 합성 유전자의 설계 및 제조는 실시예 2에 설명되어 있다.
위에서 주목하고 실시예 6 및 7에서 상세히 추가로 설명한 바와 같이, kfoD, kfoI, kfoE 및 kfoH 유전자 중 하나 이상은 에스케리키아 콜라이내 콘드로이틴의 프럭토실화에 필수적이지만, 이들 유전자중 어느 것도 콘드로이틴의 합성에 필요하지 않다. 이들 유전자들 중 4개 모두의 동시 누락 또는 불활성화는 프럭토실화되지 않은 콘드로이틴의 생산을 야기한다. 일부 양태에서, 본 발명의 작제물은 kfoD, kfoI, kfoE 및 kfoH 중 하나 이상의 기능성 유전자를 함유하지 않는다. 다시 말해서, kfoD, kfoI, kfoE 및 kfoH 중 하나 이상의 기능성 유전자는 이들 양태에서 작제물로부터 부재한다. 기능성 유전자를 함유하지 않는 작제물(즉, 기능성 유전자가 부재한 작제물)은, 전체 유전자가 부재한 작제물 및 또한 유전자 또는 이의 일부가 존재하지만 비-기능성(즉, 불활성)인 작제물을 포함한다. 일부 양태에서, 본 발명의 작제물은 변형되어 kfoD, kfoI, kfoE 및 kfoH 중 하나 이상을 불활성화시킨 유전자 클러스터를 포함한다.
일부 양태에서, 본 발명은 kpsF, kpsE, kpsD, kpsU, kpsC, kpsS, kfoA, kfoC, 및 kfoF를 포함하는 유전자 클러스터를 포함하는 작제물을 포함하며, 여기서 작제물은 kfoD, kfoI, kfoE 및 kfoH 중 하나 이상의 기능성 유전자를 함유하지 않는다. 일부 양태에서, 작제물은 본원에 기술된 바와 같이 비-병원성 박테리아 숙주 세포내에서 콘드로이틴을 생산하기에 적합하다. 일부 양태에서, 콘드로이틴은 비-프럭토실화된다. 일부 양태에서, 작제물은 kfoG 및/또는 kfoB를 추가로 포함할 수 있다. 위에 주목한 바와 같이, kfoB 및 kfoG 유전자는 콘드로이틴의 생산을 위해 필수적인 것으로 밝혀지지 않았으나, kfoG 유전자는 콘드로이틴의 최적 생산에 필요한 것으로 밝혀졌다(참조: 실시예 7). 일부 양태에서, 본 발명의 작제물은 kpsM 및/또는 kpsT를 추가로 포함할 수 있다.
일부 양태에서, 작제물은 세포로부터 분비된 재조합 콘드로이틴의 생산에 유용하다.
일부 양태에서, 이들 작제물은 발현 벡터 pDD66(kpsMT-kfoABCFG-kpsFEDUCS를 함유하는 발현 벡터), pDD67(kpsFEDUCS-kpsMT-kfoABCFG를 함유하는 발현 벡터), pCX040(kpsMT-kfoACFG-kpsFEDUCS를 함유하는 발현 벡터), pCX041(kpsMT-kfoABCF-kpsFEDUCS를 함유하는 발현 벡터), pCX042(kpsFEDUCS-kpsMT-kfoACFG를 함유하는 발현 벡터), pCX043(kpsFEDUCS-kpsMT-kfoABCF를 함유하는 발현 벡터), 및 pCX096(kpsFEDUCS-kfoABCFG를 함유하는 발현 벡터)를 포함한다. 다른 양태는 발현 플라스미드 pBR1052이다. 실시예 4에 기술된 바와 같이, pBR1052는 pDD66(kpsMT-kfoABCFG-kpsFEDUCS)과 동일한 K4 유전자 세트를 함유하고 추가로 kpsF 유전자의 바로 상부(upstream)에 삽입된 Pm 프로모터 서열의 제2 카피를 갖는다. pDD66의 뉴클레오타이드 서열은 서열 번호 35로 나타내며; pDD67의 뉴클레오타이드 서열은 서열 번호 36로 나타내고; pCX040의 뉴클레오타이드 서열은 서열 번호 37로 나타내고; pCX041의 뉴클레오타이드 서열은 서열 번호 38로 나타내며; pCX042의 뉴클레오타이드 서열은 서열 번호 39로 나타내고; pCX043의 뉴클레오타이드 서열은 서열 번호 40으로 나타내며; pCX096의 뉴클레오타이드 서열은 서열 번호 149로 나타내고; pBR1052의 뉴클레오타이드 서열은 서열 번호 41로 나타낸다. 이들 DNA 작제물의 설계 및 작제는 실시예 4에서 상세히 설명된다.
일부 양태에서, 본 발명은 세포내 콘드로이틴, 즉, 숙주 세포로부터 분비되지 않는 콘드로이틴을 생산하는 목적에 유용한 작제물을 포함한다. 콘드로이틴의 세포내 생산은, 배양 배지내 높은 수준의 다당류로부터 생성되는 발효의 점도를 제거하기 위해 요구될 수 있다. 또한, 세포내 생산이 분비보다 더 높은 수준의 콘드로이틴을 달성할 수 있는 것이 가능하다. 일부 양태에서, 작제물은 영역 3의 kpsM 및 kpsT 중 적어도 하나의 기능성 유전자를 함유하지 않는다. 일부 양태에서, 작제물은 영역 3의 kpsM 및 kpsT 중 적어도 하나를 함유하지 않거나 불활성화시키기 위해 변형시킨 유전자 클러스터를 포함한다. 일부 양태에서, 작제물은 영역 1의 kpsE, kpsD, kpsC 및 kpsS 중 적어도 하나의 기능성 유전자를 함유하지 않는다. 일부 양태에서, 작제물은 영역 1의 kpsE, kpsD, kpsC 및 kpsS 중 적어도 하나를 함유하지 않거나 이를 불활성화시키기 위해 변형된 유전자 클러스터를 포함한다. 일부 양태에서, 작제물은 영역 3의 kpsM 및 kpsT 중 적어도 하나 및 영역 1의 kpsE, kpsD, kpsC 및 kpsS 중 적어도 하나의 기능성 유전자를 함유하지 않는다. 일부 양태에서, 작제물은 영역 3의 kpsM 및 kpsT 중 적어도 하나 및 영역 1의 kpsE, kpsD, kpsC 및 kpsS 중 적어도 하나를 함유하지 않거나 이를 불활성화시키기 위해 변형된 유전자 클러스터를 포함한다. 이들 작제물은 실시예 4 및 9에 기술되어 있다.
일부 양태에서, 본 발명은 kfoA, kfoC, 및 kfoF를 포함하는 유전자 클러스터를 포함하는 작제물을 포함하며, 여기서 유전자 클러스터는 kpsM, kpsT, kpsE, kpsD, kpsC 및 kpsS 중 하나 이상의 기능성 유전자를 함유하지 않는다. 일부 양태에서, 작제물은 본원에 기술된 바와 같은 비-병원성 박테리아 숙주 세포내에서 콘드로이틴을 생산하기에 적합하다. 일부 양태에서, 콘드로이틴은 숙주 세포로부터 분비되지 않는다. 일부 양태에서, 콘드로이틴은 비-프럭토실화된다. 일부 양태에서, 작제물은 또한 kfoD, orf3, kfoE, 및 orf1 중 하나 이상의 기능성 유전자를 함유하지 않는다. 일부 양태에서, 작제물은 kfoG 및/또는 kfoB를 추가로 포함할 수 있다. 일부 양태에서, 작제물은 kfoA, kfoB, kfoC, kfoF 및 kfoG를 포함한다.
일부 양태에서, 본 발명의 작제물은 kfoA, kfoB, kfoC, kfoF, kfoG, 및 이의 조합으로 이루어진 군으로부터 선택된 유전자를 포함하며, 여기서 작제물은 kpsM, kpsT, kpsE, kpsD, kpsC 및 kpsS 중 하나 이상의 기능성 유전자를 함유하지 않는다. 일부 양태에서, 작제물은 본원에 기술된 바와 같이 비-병원성 박테리아 숙주 세포내에서 콘드로이틴을 생산하는데 적합하다. 일부 양태에서, 작제물은 본원에 기술된 바와 같은 비-병원성 박테리아 숙주 세포내에서 콘드로이틴의 양을 증가시키는데 적합하다. 일부 양태에서, 작제물은 에스케리키아 콜라이 K4 유전자 클러스터, 클러스터의 영역, 클러스터의 유전자의 서브세트, 또는 숙주 염색체 내로 통합된 클러스터의 유전자의 하나 이상의 존재하는 카피를 포함하는 박테리아 숙주 세포로 이전된다. 일부 양태에서, 콘드로이틴은 프럭토실화되어 있지 않다. 일부 양태에서, 작제물은 또한 kfoD, orf3, kfoE, 및 orf1 중 하나 이상의 기능성 유전자를 함유하지 않는다. 일부 양태에서, 작제물은 kfoA, kfoB, kfoC, kfoF 및 kfoG를 포함한다.
일부 양태에서, 본 발명의 작제물은 발현 벡터 pCX039(kfoABCFG를 함유하는 발현 벡터), pCX044(kfoACFG를 함유하는 발현 벡터), pCX092(kfoABCF를 함유하는 발현 벡터), pCX045(kpsMT-kfoABCFG-kpsFEDUS를 함유하는 발현 벡터), 및 pCX048(kpsM-kfoABCFG-kpsFEDUCS를 함유하는 발현 벡터)를 포함한다. pCX039의 뉴클레오타이드 서열은 서열 번호 42로 나타내며; pCX044의 뉴클레오타이드 서열은 서열 번호 43로 나타내고; pCX092의 뉴클레오타이드 서열은 서열 번호 154로 나타내고; pCX045의 뉴클레오타이드 서열은 서열 번호 44로 나타내고; pCX048의 뉴클레오타이드 서열은 서열 번호 45로 나타낸다. 이들 DNA 작제물의 설계 및 작제는 실시예 4에 상세히 설명되어 있다.
일부 양태에서, 본 발명의 작제물은 발현 벡터 pCX075(kfoABFG를 함유하는 발현 벡터), pCX081(kfoABCG를 함유하는 발현 벡터), pCX082(kfoBCFG를 함유하는 발현 벡터), pCX101(kfoABCFG-kpsMT를 함유하는 발현 벡터), pBR1102(kfoABCFG를 함유하는 발현 벡터), pBR1100(kfoABCFG를 함유하는 발현 벡터), 및 pBR1101(kfoABCFG를 함유하는 발현 벡터)를 포함한다. pCX075의 뉴클레오타이드 서열은 서열 번호 153으로 나타내고; pCX081의 뉴클레오타이드 서열은 서열 번호 151로 나타내고; pCX082의 뉴클레오타이드 서열은 서열 번호 152로 나타내고; pCX101의 뉴클레오타이드 서열은 서열 번호 150으로 나타내고; pBR1102의 뉴클레오타이드 서열은 서열 번호 170으로 나타내고; pBR1100의 뉴클레오타이드 서열은 서열 번호 171로 나타내고; pBR1101의 뉴클레오타이드 서열은 서열 번호 172로 나타낸다. 이들 DNA 작제물의 설계 및 작제는 실시예 18 및 20에 상세히 설명되어 있다.
본 발명의 작제물은 본원에 기술된 바와 같이 박테리아 숙주 세포내에서 최적의 코돈 사용빈도를 위해 변형된 하나 이상의 유전자를 포함할 수 있다.
본 발명의 작제물은 프로모터를 추가로 포함할 수 있다. 프로모터는 본원에 기술된 바와 같은 박테리아 숙주 세포내에서 유전자 클러스터의 발현을 구동할 수 있어야 한다. 바람직한 박테리아 숙주 세포내에서 발현을 구동하는데 유용한, 다수의 이러한 프로모터는 당해 분야의 숙련가에게 친숙하며 본 발명에서 사용될 수 있다. 이종 단백질을 발현하는데 일반적으로 사용된 프로모터의 예는 Pm, lac, trp, tac, λpL, T7, phoA, araC, xapA, cad 및 recA를 포함하나, 이에 한정되지 않는다(참조: 예를 들면, Weikert et al ., Curr . Opin . Biotechnol . 1996;7:494-499). 이러한 프로모터는 구성적이거나 유도성일 수 있다. 종결 제어 영역은 또한 바람직한 숙주에 대해 천연인 다양한 유전자로부터 유래될 수 있다. 임의로, 종결 부위는 불필요할 수 있다.
일부 양태에서, 본 발명의 작제물은 xylS 조절 유전자와 함께 Pm 프로모터를 포함한다(참조: Mermod et al ., J. Bacteriol . 1986;167:447-54). 슈도모나스 푸티다(Pseudomonas putida ) TOL 플라스미드로부터 분리된 Pm 프로모터 및 이의 조절 유전자 xylS는 각종 그람 음성 박테리아에서 기능하는 것으로 밝혀진 강력하고, 잘 조절된 프로모터를 제공한다(참조: Blatny et al., 플라스미드 1997;38:35-51). XylS 단백질은 단량체 또는 이량체로서 존재할 수 있다. 이량체 형태에서, XylS 단백질은 Pm 프로모터에 결합하여 전사를 자극할 수 있다. XylS 단백질의 이량체화, 및 이에 따른 Pm 프로모터에서 전사 개시는 XylS에 직접 결합하여 단백질의 이량체화를 촉진하는 메타-톨루산(3-메틸벤조에이트)와 같은 특정의 효과인자(effector) 분자에 의해 향상된다(참조: Dominguez-Cuevas et al ., J. Bact . 2008; 190:3118-3128). 프로모터는 유전자 클러스터의 하나 이상의 유전자에 작동적으로 연결될 수 있다.
본 발명의 작제물은 제2 프로모터를 추가로 포함할 수 있다. 예를 들면, 대체 숙주내에서 클로닝된 K4 유전자의 발현의 분석이, 특정 유전자, 또는 유전자 세트의 발현 수준이 최적 미만임을 나타내는 경우, 제2 프로모터가, 최적 수준에서 발현되지 않는 유전자 또는 유전자 세트의 전사를 향상시키기 위해 선택된 위치에서 발현 작제물에 추가될 수 있다. 전형적으로, 추가된 프로모터는 목적한 유전자 또는 유전자 세트 바로 상부(즉, 유전자 또는 유전자 세트에 대해 5')에 삽입될 수 있다. 제2 프로모터는 Pm, 또는 K4 유전자 세트를 발현시키는데 유용한 프로모터의 예로서 상기 나열된 프로모터 중 어느 것일 수 있다. 일부 양태에서, 제2 프로모터는 Pm일 수 있다. 제2 프로모터는 유전자 클러스터의 하나 이상의 유전자에 작동적으로 연결될 수 있다. 하나의 양태에서, 제2 프로모터는 kpsFEDUCS 유전자 세트에 작동적으로 연결될 수 있다. 예를 들면, 실시예 4에 기술된 바와 같은 발현 벡터 pBR1052를 참조한다. 제2 프로모터의 사용에 의해 유전자 또는 유전자들의 조합을 발현시키거나, 증강시키는데 유리할 수 있는 유전자, 또는 유전자들의 조합은 어떠한 제공된 플라스미드, 또는 웨스턴 블롯 분석에 의해 설정된 염색체의 유전자에 대해 실험적으로 측정될 수 있다.
본 발명의 작제물은 특수 항생제에 대해 내성을 부여하는 항생제 내성 유전자를 추가로 포함할 수 있다. 이러한 유전자는 당해 분야에 잘 공지되어 있다. 항생제 내성 유전자의 예는 클로람페니콜 내성 유전자(CamR), 카나마이신 내성 유전자(KanR), 암피실린 내성 유전자(AmpR), 테트라사이클린 내성 유전자(TetR), 스펙티노마이신 내성 유전자(SpcR), 설폰아미드 내성 유전자(SuR), 블레오마이신 내성 유전자(BleR), 스트렙토마이신 내성 유전자(StrR), 카르베니실린 내성 유전자(CbR) 및 에리트로마이신 내성 유전자(EryR)를 포함하나, 이에 한정되지 않는다.
본 발명의 작제물은 박테리아 숙주 세포내에서 콘드로이틴을 생산하는데 유용하다. 어떠한 박테리아 세포도 본 발명에서 숙주 세포로서 사용될 수 있으며, 일부 양태에서, 숙주는 그람-음성 박테리아이다. 그람 음성 박테리아의 예는 에스케리키아, 슈도모나스, 잔토모나스, 메틸로모나스, 악시네토박터 및 스핑고모나스를 포함하나, 이에 한정되지 않는다. 일부 양태에서 숙주는 비-병원성 그람-음성 박테리아이다. 비-병원성 그람-음성 박테리아의 예는 비-병원성 에스케리키아 콜라이, 예를 들면, 에스케리키아 콜라이 K-12 또는 에스케리키아 콜라이 B, 잔토모나스 캄페스트리스, 스핑고모나스 엘로데아 및 슈도모나스 푸티다(Pseudomonas putida)를 포함하나, 이에 한정되지 않는다.
일부 양태에서, 본원에 기술된 것으로서 박테리아 숙주 세포의 내인성 유전자는 상동성 재조합에 의해 결실되거나 불활성화된다.
자체의 천연의 세포외 다당류를 제조할 수 없는 숙주의 유도체가 바람직하다. 이러한 유도체 숙주를 사용하면 재조합 콘드로이틴(rCH)의 생합성의 가시적이고 화학적인 확인, 및 또한 K4 유전자 세트가 도입되는 경우 숙주에 의해 생산된 rCH의 정제를 촉진할 수 있다. 또한, 적절하게 설계된 유도체 숙주내에서 rCH의 생합성은 천연의 다당류 합성과의 경쟁에 의해 제한되지 않을 것이다. 예를 들면, 천연의 다당류 생합성 경로의 제1의 글리코실트랜스퍼라제 유전자의 불활성화 또는 결실은, 천연의 경로에 의한 임의의 잠재적인 지질 담체의 이용을 방지하고 천연의 경로의 효소와 K4 효소 사이의 지질 담체, 또는 초기 다당류 쇄에서 작용하여 이용가능성을 제한할 수 있는 어떠한 다른 세포 성분(들)에 대한 경쟁을 방지할 수 있다. 전체 천연의 생합성 유전자 클러스터의 불활성화(예를 들면, 결실에 의함)는 대부분의 경쟁적 성분을 제거할 수 있지만, 생리학 및/또는 막 구조에 대한 바람직하지 않은 효과를 잠재적으로 가질 수 있다.
실시예 3에 상세히 기술된 바와 같이, 본 발명자들은 본 발명의 작제물의 발현을 위한 숙주로서, 에스케리키아 콜라이 K-12("K-12"), 에스케리키아 콜라이 B("EcB"), 및 잔토모나스 캄페스트리스 피브이. 캄페스트리스(Xanthomonas campestris pv. campestris)("Xcc")를 예로서 사용하였으나, 이들 예에 한정하는 것으로 의도되지 않는다. 천연의 세포외 다당류의 합성을 위한 효소를 인코딩하는 유전자 클러스터의 하나 이상의 유전자내 결실을 포함하는 유도체 숙주의 생성은 실시예 3에 상세히 기술된 바와 같이 2-단계, "팝-인/팝-아웃" 상동성-유도된 방법을 사용하여 수행하였다. 예를 들면, 콜란산(M 항원)은 많은 장 박테리아에 의해 생산된 세포외 다당류이다. 콜란산 생합성에서 결핍성이거나 결함이 있는 에스케리키아 콜라이 K-12 및 에스케리키아 콜라이 B 균주가 생성되었다. 균주 MSC188 및 MSC175는 전체 콜란산 오페론, 및 콜란산 생합성 동안 지질 담체 위로의 제1 당의 로딩(loading)에 관여하는 글리코실트랜스퍼라제 효소를 인코딩하는 wcaJ 유전자 각각의 결실을 포함하는 에스케리키아 콜라이 K-12의 유도체이다. 균주 MSC364는 전체 콜란산 오페론의 결실을 포함하는 에스케리키아 콜라이 B의 유도체이다. 유사하게, 세포외 다당류 크산탄 검의 생합성에 있어 결핍성이거나 결함이 있는 잔토모나스 캄페스트리스 피브이. 캄페스트리스 균주가 생성되었다. 균주 MSC225 및 MSC226은 글리코실트랜스퍼라제 I 효소를 인코딩하는 gumD 유전자의 결실을 포함하는 Xcc 균주의 유도체이며 균주 MSC255, MSC256, 및 MSC257은 전체 크산탄 검 오페론의 결실을 포함한다.
본 발명은 본 발명의 임의의 하나 이상의 작제물을 비-병원성 박테리아 숙주 세포로 이전시킴을 포함하는, 본 발명의 작제물의 임의의 하나 이상을 포함하는 비-병원성 박테리아 숙주 세포를 생산하는 방법에 관한 것이다. 본 발명의 작제물은 작제물내에 존재하는 유전자의 발현을 위한 어떠한 공지된 방법에 의해 박테리아 숙주 세포내로 도입될 수 있다. 이러한 방법은, 제한하지 않고 형질전환, 전기천공(electroporation), 접합 또는 형질도입을 포함할 수 있다.
본 발명은 본 발명의 작제물 중 어느 하나 이상을 포함하는 비-병원성 박테리아 숙주 세포에 관한 것이다. 따라서, 본 발명은 또한 본 발명의 발현 벡터를 포함하는 작제물을, 결실을 포함하는 유도체 균주를 포함하는 숙주 균주내로 도입시킴으로써 생성된 각종 균주를 포함한다. 특정의 예들은 실시예 6 내지 9, 11, 13 및 14에 상세히 기술되어 있다.
일부 양태에서, 본 발명의 작제물내에 함유된 유전자는 수용체 숙주 균주의 염색체 내로 도입됨으로써 유전자가 숙주 염색체내에 통합되도록 한다. 염색체내에 클로닝된 유전자를 위치시키면 콘드로이틴 생합성 유전자를 수반하는 플라스미드(들) 또는 벡터(들)을 유지하기 위한 선택적인 압력을 유지하기 위한 요건을 제거하는 장점을 제공함으로써 임의의 선택적인 압력의 부재하에서 안정한 발현 균주 또는 보다 안정한 발현 균주를 잠재적으로 제공할 수 있다. 따라서, 본 발명은 이들의 염색체 내로 통합된 본 발명의 작제물내에 함유된 유전자들중 임의의 하나 이상의 하나 이상의 카피를 포함하는 박테리아 균주를 포함한다.
예로서, 본 발명자들은 이들의 염색체 내로 통합된 콘드로이틴의 생합성을 위한 합성 유전자들 중 하나 이상을 포함하는 에스케리키아 콜라이 K-12 및 Xcc 균주를 생성하였다. 본 발명은 또한 본 발명의 발현 벡터를 포함하는 작제물을, 그들의 염색체 내로 통합된 작제물의 하나 이상의 카피를 포함하는 본 발명의 균주내로 도입시킴으로써 생성된 균주를 포함한다.
일부 양태에서, K4 유전자 클러스터, 당해 클러스터의 하나 이상의 영역, 당해 클러스터의 유전자의 하나 이상의 서브세트, 또는 클러스터의 하나 이상의 유전자를 본원에 기술된 본 발명의 작제물 및 방법을 사용하여 본원에 기술된 바와 같은 비-병원성 박테리아 숙주 세포의 염색체 내로 통합시킨다. 일부 양태에서, 유전자 클러스터, 영역, 서브세트 또는 유전자의 2개 이상의 카피를 비-병원성 박테리아 숙주 세포의 염색체 내로 통합시킨다. 일부 양태에서, 유전자 클러스터, 영역, 서브세트 또는 유전자의 2 내지 20; 2 내지 19; 2 내지 18; 2 내지 17; 2 내지 16; 2 내지 15; 2 내지 14; 2 내지 13; 2 내지 12; 2 내지 11; 2 내지 10; 2 내지 9; 2 내지 8; 2 내지 7; 2 내지 6; 2 내지 5; 2 내지 4; 또는 2 내지 3개의 카피를 비-병원성 박테리아 숙주 세포의 염색체 내로 통합시킨다. 일부 양태에서, 유전자 클러스터, 영역, 서브세트, 또는 유전자의 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 또는 20개 카피를 비-병원성 박테리아 숙주 세포의 염색체 내로 통합시킨다. 일부 양태에서, 2개 이상의 카피를 동일한 작제물을 사용하여 숙주 염색체 내로 통합시킨다. 일부 양태에서, 2개 이상의 카피를 상이한 작제물을 사용하여 숙주 염색체 내로 통합시킨다. 일부 양태에서, 프로모터를 또한 숙주 염색체 내로 통합시켜 숙주 염색체 내로 통합된 유전자 클러스터, 영역, 서브세트 또는 유전자의 발현을 조절한다. 일부 양태에서, 숙주 염색체 내로 통합된 2개 이상의 카피는 동일한 프로모터 또는 상이한 프로모터로부터 발현된다. 일부 양태에서, kfoA, kfoB, kfoC, kfoF, kfoG, 및 이의 조합으로 이루어진 군으로부터 선택된 영역 2 유전자의 2개 이상의 카피가 숙주 염색체 내로 통합된다. 일부 양태에서, kfoA, kfoB, kfoC, kfoF, 및 kfoG의 2개 이상의 카피는 숙주 염색체 내로 통합된다. 일부 양태에서, 영역 1, 영역 3, 또는 영역 1 또는 영역 3으로부터 하나 이상의 유전자의 2개 이상의 카피는 숙주 염색체 내로 통합된다. 일부 양태에서, 본 발명의 작제물내에 함유된 유전자는 염색체 내로 통합되지 않은 유전자를 포함하는 본 발명의 하나 이상의 작제물을 또한 함유하는 박테리아 숙주 세포의 염색체 내로 통합된다.
이러한 균주의 예는 실시예 10 내지 13, 20 및 21에 상세히 기술되어 있다. 기술된 작제물 및 균주는 콘드로이틴의 생산에 사용될 수 있다.
본 발명의 균주의 예는, 제한되지 않고, 에스케리키아 콜라이 K-12 균주 MSC279, MSC280, MSC322, MSC323, MSC324, MSC325, MSC328, MSC346, MSC356, MSC359, MSC392, MSC402, MSC403, MSC404, MSC405, MSC410, MSC411, MSC436, MSC437, MSC438, MSC439, MSC458, MSC459, MSC460, MSC466, MSC467, MSC498, MSC499, MSC500, MSC510, MSC511, MSC522, MSC526, MSC537, MSC551, MSC561, MSC562, MSC563, MSC564, MSC566, MSC567, MSC619, MSC625, MSC627, MSC640, MSC641, MSC643, MSC646, MSC650, MSC656, MSC657, MSC658, MSC659, MSC660, MSC669, MSC670, MSC671, MSC672, MSC673, MSC674, MSC675, MSC676, MSC677, MSC678, MSC679, MSC680, MSC681, MSC682, MSC683, MSC684, MSC687, MSC688, MSC689, MSC690, MSC691, MSC692, MSC693, MSC694, MSC700, MSC701, MSC702, MSC722, MSC723, 및 MSC724; 에스케리키아 콜라이 B 균주 MSC315, MSC316, MSC317, MSC319, 및 MSC347; 잔토모나스 캄페스트리스 균주 MSC326, MSC348, MSC350, MSC480, MSC461, MSC469 및 MSC494를 포함한다.
본 발명은 본 발명의 작제물 중 어느 하나 이상을 비-병원성 박테리아 숙주 세포내로 이전시키고, 박테리아 숙주 세포를, 콘드로이틴이 박테리아 숙주 세포에 의해 생산되는 발효 조건하에서 배양함을 포함하는, 콘드로이틴의 생산 방법에 관한 것이다.
본 발명은 본 발명의 작제물 중 어느 하나 이상을 포함하는 비-병원성 숙주 세포를 콘드로이틴의 생산에 충분한 발효 조건하에서 배양함을 포함하는, 콘드로이틴을 생산하는 방법에 관한 것이다.
본 발명은 황산화되지 않은 콘드로이틴을 생산하는 방법을 포함한다. 당해 방법은 본 발명의 비-병원성 박테리아 숙주 세포를 황산화되지 않은 콘드로이틴의 생산에 충분한 발효 조건하에서 배양함을 포함한다. 일부 양태에서, 당해 방법은 본 발명의 작제물을 비-병원성 박테리아 숙주 세포로 이전시키고 박테리아 숙주 세포를 박테리아 숙주 세포에 의해 황산화되지 않은 콘드로이틴이 생산되는 발효 조건하에서 배양함을 포함한다.
각종 양태가 실시예 7 내지 15에 기술되어 있다. 구체적으로, 실시예 6 내지 9, 11, 13 및 14는, 본 발명의 작제물이 숙주 세포내로 형질전환되는 경우 콘드로이틴의 생산을 입증하는 데이타를 제공하며 실시예 10 내지 15는, 본 발명의 작제물이 숙주 세포의 염색체 내로 통합되는 경우 콘드로이틴의 생산을 입증하는 데이타를 제공한다.
구체적인 작제물 및 그안의 유전자들의 조합에 따라, 프럭토실화되거나 비-프럭토실화된 콘드로이틴을 생산하는 것이 가능하다(참조: 실시예 6 및 7). 또한, 구체적인 작제물 및 그안의 유전자들의 조합에 따라, 재조합 콘드로이틴을 배양 배지내로 분비시키거나 세포내 위치에 유지시킬 수 있다(참조: 실시예 9).
박테리아 세포를 배양하는 방법 및 배양 배지의 조성은 당해 분야에 잘 공지되어 있으며 본 발명에서 사용될 수 있다. 재조합 콘드로이틴의 최적의 생산을 위해, 온도, pH, 용존 산소 농도, 유도인자 농도 및 유도-후 배양 기간, 및 또한 그안의 영양물 및 염의 내용물을 포함하는 배지의 조성과 같은 각종 배양 매개변수는 최적화되어야 한다. 실시예 8은 각종 성장 배지, 온도 및 유도 조건에서 콘드로이틴의 재조합 생산을 기술한다. 당해 정보를 기초로 하여, 이러한 매개변수의 추가의 최적화는 당해 분야의 숙련가에게 매우 명백할 것이다. 일부 양태에서, 박테리아 숙주 세포는 20℃ 내지 37℃, 예를 들면, 20℃, 21℃, 22℃, 23℃, 24℃, 25℃, 26℃, 27℃, 28℃, 29℃, 30℃, 31℃, 32℃, 33℃, 34℃, 35℃, 36℃ 또는 37℃에서 배양된다. 일부 양태에서, 배양 배지는 효모 추출물, 단백질 분해물, 인산칼륨, 및 물을 포함한다. 일부 양태에서, 배양 배지는 글리세린(또한 글리세롤로 공지됨)을 포함한다. 일부 양태에서, 1 g/L 내지 50 g/L, 5 g/L 내지 50 g/L 또는 15 g/L 내지 50 g/L의 황산화되지 않은 콘드로이틴이 24 내지 72시간내에 박테리아 숙주 세포로부터 분비된다.
일부 양태에서, 본 발명의 콘드로이틴을 생산하는 방법은 박테리아 숙주 세포로부터 콘드로이틴을 회수함을 추가로 포함한다.
일부 양태에서, 본 발명의 콘드로이틴을 생산하는 방법은 세포외 배양 배지로부터 콘드로이틴을 회수함을 추가로 포함한다. 콘드로이틴은 배양 브로쓰로부터 알코올 침전 또는, 무수 분말을 수득하기 위한 동결건조를 포함하나, 이에 한정되지 않는 당해 분야에 공지된 임의의 기술에 의해 발효 브로쓰로부터 회수될 수 있다.
일부 양태에서, 콘드로이틴을 생산하는 방법은 회수된 콘드로이틴을 정제하는 단계를 포함할 수 있다. 콘드로이틴의 정제는 예를 들면, 알칼리 처리, 산 처리, 프로테이나제 처리, 크로마토그래피, 추출, 용매 추출, 막 분리, 전기분해, 역 삼투압, 증류, 침전, 화학적 유도체화, 결정화, 한외여과 및/또는 유기 용매를 사용한 다당류의 침전을 포함하는 당해 분야에 공지된 어떠한 기술에 의해서도 달성할 수 있다[참조: 예를 들면, Taniguchi, N., 1982. Isolation and analysis of glycosaminoglycans. Pages 20-40 in: Glycosaminoglycans and Proteoglycans in Physiological and Pathological Process of Body Systems. R. S. Varma and R. Varma, ed. Karger, Basel, Switzerland; Fraquharson et al., Oral. Microbiol. Immunol. 2000;15:151-157; Manzoni et al., J. Bioact. Comp. Polm. 1993;8:251-257; Manzoni et al., Biotechnol. Letters 2000;22:759-766; Johns et al., Aust. J. Biotechnol. 1991;5:73-77; 이들 문서들 각각은, 본원에 이의 전문이 참조로 혼입되어 있다]. 침전 용매의 예는, 제한되지 않고, 아세톤, 메탄올, 에탄올 또는 이소프로판올을 포함할 수 있다.
일부 양태에서, 콘드로이틴을 생산하는 방법은 콘드로이틴을 황산화함을 추가로 포함한다.
본 발명은 본 발명의 방법에 의해 콘드로이틴을 생산하여 콘드로이틴을 황산화함을 포함하는, 콘드로이틴 설페이트를 생산하는 방법에 관한 것이다.
황산화는 화학적으로 또는 효소적으로 수행될 수 있다. 다당류의 화학적 황산화를 위한 여러 과정이 당해 분야에 공지되어 있으며, 이중 어느 하나가 본원에서 사용될 수 있다. 예를 들면, 황산화는 다당류를 유기 용매내로 가용화시킨 후 황산화제와 조절된 온도하에서 반응시켜 달성할 수 있다. 가용화 용매의 예는 포름아미드, N,N-디메틸포름아미드(DMF), 피리딘, 또는 디메틸설폭사이드를 포함할 수 있으나, 이에 한정되지 않는다. 황산화제의 예는 클로로설폰산, 설퍼트라이옥사이드 및 각종 설퍼트라이옥사이드-아민 복합체를 포함할 수 있으나, 이에 한정되지 않는다. 설퍼트라이옥사이드-아민 복합체에 적합한 아민의 예는 피리딘, DMF, 트리메틸아민, 트라이에틸아민(TEA) 및 피페리딘을 포함하나, 이에 한정되지 않는다. 일부 양태에서, 재조합 콘드로이틴의 황산화시, 황산화된 생성물은 천연의 콘드로이틴 설페이트의 것에 상응하는 5.0 내지 7.5%의 황 함량을 함유한다. 추가의 양태에서, 황산화된 생성물은 유의적인 해중합(depolymerization)을 겪지 않는다. 실시예 15는 재조합 콘드로이틴의 화학적 황산화 방법을 기술한다. 일부 양태에서, 본 발명의 방법에 의해 생산된 콘드로이틴의 황산화는 설퍼트라이옥사이드-트라이에틸아민 복합체 또는 클로로설폰산을 포름아미드 속에서 콘드로이틴과 혼합시킴을 포함한다.
본 발명은 본원에 기술된 방법 중 어느 것에 의해 생산된 재조합 콘드로이틴 또는 재조합 콘드로이틴 설페이트에 관한 것이다.
본 발명은 본원에 기술된 방법 중 어느 것에 의해 생산된 재조합 콘드로이틴 또는 재조합 콘드로이틴 설페이트를 포함하는 조성물에 관한 것이다.
일부 양태에서, 조성물은 글루코스아민, 글루코스아민 설페이트 또는 글루코스아민 하이드로클로라이드와 같은 보충물을 포함할 수 있다. 글루코스아민(2-아세트아미도-2-데옥시글루코즈)는 연골에서 발견된 천연적으로 존재하는 화합물이다. 글루코스아민 설페이트는 연골 매트릭스 및 윤활액내 글리코스아미노글리칸의 일반적인 성분이다. 일부 임상 시험은 골관절염, 특히 무릎의 골관절염의 치료시 글루코스아민 설페이트의 용도를 지지한다(참조: Herrero-Beaumont et al ., Arthritis Rheum . 2007;56:555-67; Bruyere et al ., Osteoarthritis Cartilage 2008;16:254-60). 설페이트 잔기는 연골을 강화시키고 글루코스아미노글리칸 합성을 보조함으로써 윤활액에 있어 임상적 잇점을 제공함이 제안되었다(참조: Silbert Glycobiology 2009;19:564-567). 글루코스아민은 일반적으로 관절 건강을 촉진시키기 위해 의도된 영양 보충물내 콘드로이틴 설페이트와 함께 및 골관절염 치료로서 일반적으로 제공된다.
일부 양태에서, 본 발명은 대상체에서 건강한 관절 기능을 유지시키는 방법을 포함한다. 다른 양태에서, 본 발명은 골관절염, 사이질 방광염 및/또는 윤활막염을 치료하거나 예방하기 위한 방법을 포함한다. 이들 방법은 상기 기술한 재조합 콘드로이틴 설페이트를 포함하는 조성물을 대상체에게 투여함을 포함한다. 본 발명의 조성물은 일반적으로 치료학적으로 효과적인 양으로 투여될 수 있다.
본 발명은 K4 콘드로이틴 생합성 유전자 클러스터의 유전자에 의해 인코딩된 단백질에 선택적으로 결합하는 항체 또는 항체 단편에 관한 것이다. 이들 항체 및 항체 단편을 사용하여 박테리아 숙주내에서 K4 콘드로이틴 생합성 유전자 클러스터의 유전자의 발현을 확인할 수 있다. 일부 양태에서, 항체 또는 항체 단편은 KpsF의 서열 번호 92, KpsE의 서열 번호 93, KpsD의 서열 번호 94, KpsU의 서열 번호 95, KpsC의 서열 번호 96, KpsS의 서열 번호 97, KpsT의 서열 번호 91, KfoA의 서열 번호 83, KfoB의 서열 번호 84, KfoC의 서열 번호 85, KfoI(Orf3)의 서열 번호 86, KfoE의 서열 번호 87, KfoH(Orf1)의 서열 번호 88, KfoF의 서열 번호 89, 및 KfoG의 서열 번호 90로 이루어진 군으로부터 선택된 아미노산 서열에 결합한다. 항체의 생성은 실시예 5에 상세히 기술되어 있다.
발효 배지 및 조건
콘드로이틴의 생산 방법에서, 본원에 기술된 유전적 변형을 갖는 미생물을 발효 배지 속에서 배양하여 콘드로이틴을 생산한다. 적절한, 또는 효과적인 발효 배지는, 본 발명의 유전적으로 변형된 미생물이, 배양되는 경우 콘드로이틴을 생산할 수 있는 특정 배지를 말한다. 이러한 배지는 전형적으로 동화할 수 있는 탄소, 질소 및 인산염 공급원을 포함하는 수성 배지이다. 이러한 배지는 또한 적절한 염, 무기물, 금속 및 다른 영양소를 포함할 수 있다. 예시적인 배지는 하기 및 실시예 단락에 기술되어 있다. 그러나, 각종 발효 조건이 적합하며 당해 분야의 숙련가에 의해 선택될 수 있음이 인식되어야 한다.
적합한 발효 배지 속에 사용될 수 있는 동화가능한 탄소의 공급원은 당 및 이들의 중합체, 예를 들면, 덱스트린, 슈크로즈, 말토즈, 락토즈, 글루코즈, 프럭토즈, 만노즈, 소르보즈, 아라비노즈 및 크실로즈; 지방산; 유기산, 예를 들면, 아세테이트; 1급 알코올, 예를 들면, 에탄올 및 n-프로판올; 및 다가알코올, 예를 들면, 글리세린을 포함하나, 이에 한정되지 않는다. 본 발명에서 탄소원은 다가알코올, 단당류, 이당류, 및 삼당류를 포함한다. 일부 양태에서, 탄소원은 글리세린이다.
발효 배지속에서 글리세린과 같은 탄소원의 농도는 세포 성장을 촉진하여야 하지만, 사용된 미생물의 성장을 억제하는 정도로 높지 않아야 한다. 전형적으로, 발효는 목적하는 수준의 성장 및 생물량을 달성하기 위한 수준에서 첨가되지만 유기 산, 특히 아세테이트의 축적을 피하기 위한 낮은 농도 수준(1 g/L 미만)에서 유지되는 글리세린과 같은 탄소원을 사용하여 수행된다. 다른 양태에서, 발효 배지 속의 글리세린과 같은 탄소원의 농도는 1 g/L 초과, 2 g/L 초과, 또는 5 g/L 초과이다. 또한, 발효 배지 속에서 글리세린과 같은 탄소원의 농도는 전형적으로 100 g/L 미만, 50 g/L 미만, 또는 20 g/L 미만이다. 발효 성분 농도에 대한 참조는 초기 및/또는 진행하는 성분 농도 둘다를 언급할 수 있다. 일부 경우에, 발효 배지에서 발효 동안 탄소원이 고갈되도록 하는 것이 바람직할 수 있다.
적합한 발효 배지 속에서 사용될 수 있는 동화가능한 질소원은 단순 질소원, 유기 질소원 및 복합 질소원을 포함하나, 이에 한정되지 않는다. 이러한 질소원은 무수 암모니아, 암모늄 염 및, 동물, 야채 및/또는 미생물 유래된 물질을 포함한다. 적합한 질소원은 단백질 가수분해물, 미생물 생물량 가수분해물, 펩톤, 효모 추출물, 황산암모늄, 수산화암모늄, 우레아, 및 아미노산을 포함하나, 이에 한정되지 않는다. 전형적으로, 발효 배지속의 질소원의 농도는 0.1 g/L 초과, 0.25 g/L 초과, 또는 1.0 g/L 초과이다. 그러나, 특정 농도 초과시, 발효 배지에 질소원의 첨가는 미생물 성장에 유리하지 않다. 그 결과, 발효 배지속 질소원의 농도는 20 g/L 미만, 10 g/L 미만, 또는 5 g/L 미만이다. 또한, 일부 경우에 발효 배지에서 발효 동안 질소원이 고갈되도록 하는 것이 바람직할 수 있다.
효과적인 발효 배지는 소포제, 무기 염, 비타민, 미량 금속 및/또는 성장 촉진제와 같은 다른 화합물을 함유할 수 있다. 이러한 다른 화합물들은 효과적인 배지 속에 탄소, 질소 또는 광물원 속에 존재할 수 있거나 배지에 구체적으로 첨가될 수 있다.
발효 배지는 또한 적합한 인산염 공급원을 함유할 수 있다. 이러한 인산염 공급원은 무기 및 유기 인산염 공급원 둘다를 포함한다. 인산염 공급원은 일염기성 또는 이염기성 인산나트륨, 인산칼륨, 인산암모늄과 같은 인산염, 및 이의 혼합물을 포함하나, 이에 한정되지 않는다. 전형적으로, 발효 배지 속의 인산염의 농도는 1.0 g/L 초과, 2.0 g/L 초과, 또는 5.0 g/L 초과이다. 그러나, 특정 농도를 초과하여, 발효 배지에 대한 인산염의 첨가는 미생물의 성장에 유리하지 않다. 따라서, 발효 배지 중의 인산염의 농도는 전형적으로 20 g/L 미만, 15 g/L 미만, 또는 10 g/L 미만이다.
적합한 발효 배지는 또한 마그네슘 공급원을 포함할 수 있다. 일부 양태에서, 마그네슘 공급원은, 비록 유사한 양의 마그네슘에 기여하는 농도의 다른 마그네슘 공급원이 사용될 수 있다고 해도, 생리학적으로 허용되는 염의 형태, 예를 들면, 황산마그네슘 오수화물이다. 전형적으로, 발효 배지 중의 마그네슘의 농도는 0.5 g/L 초과, 1.0 g/L 초과, 또는 2.0 g/L 초과이다. 그러나, 특정 농도를 초과하여, 발효 배지에 대한 마그네슘의 첨가는 미생물의 성장에 유리하지 않다. 따라서, 발효 배지 중의 마그네슘의 농도는 전형적으로 10 g/L 미만, 5 g/L 미만, 또는 3 g/L 미만이다. 또한, 일부 경우에, 발효 배지에서 발효 동안 마그네슘 공급원이 고갈되도록 하는 것이 바람직할 수 있다.
발효 배지는 또한 생물학적으로 허용되는 킬레이트제, 예를 들면, 시트르산삼나트륨 또는 시트르산의 이수화물을 포함할 수 있다. 이러한 예에서, 발효 배지 속 킬레이트제의 농도는 0.1 g/L 초과, 0.2 g/L 초과, 0.5 g/L 초과, 또는 1 g/L 초과이다. 그러나, 특정 농도를 초과하는, 발효 배지에 대한 킬레이트제의 첨가는 미생물의 성장에 유리하지 않다. 따라서, 발효 배지중의 킬레이트제의 농도는 전형적으로 10 g/L 미만, 5 g/L 미만, 또는 2 g/L 미만이다.
발효 배지는 또한 초기에 발효 배지의 목적하는 pH를 유지하기 위한 생물학적으로 허용되는 산 또는 염기를 포함할 수 있다. 생물학적으로 허용되는 산은 염산, 황산, 질산, 인산 및 이의 혼합물을 포함하나, 이에 한정되지 않는다. 생물학적으로 허용되는 염기는 무수 암모니아, 수산화암모늄, 수산화나트륨, 수산화칼륨 및 이의 혼합물을 포함하나, 이에 한정되지 않는다. 본 발명의 일부 양태에서, 사용된 염기는 수산화암모늄이다.
발효 배지는 또한 염화칼슘을 포함하나, 이에 한정되지 않는 생물학적으로 허용되는 칼슘원을 포함할 수 있다. 전형적으로, 발효 배지 속의 염화칼슘 이수화물과 같은 칼슘원의 농도는 5 mg/L 내지 2000 mg/L, 20 mg/L 내지 1000 mg/L, 또는 50 mg/L 내지 500 mg/L의 범위내이다.
발효 배지는 또한 염화나트륨을 포함할 수 있다. 전형적으로, 발효 배지 중의 염화나트륨의 농도는 0.1 g/L 내지 5 g/L, 1 g/L 내지 4 g/L, 또는 2 g/L 내지 4 g/L의 범위내이다.
앞서 논의한 바와 같이, 발효 배지는 또한 미량의 금속을 포함할 수 있다. 이러한 미량의 금속은 편의상 발효 배지의 나머지로부터 별도로 제조될 수 있는 스톡 용액(stock solution)으로서 발효 배지에 가해질 수 있다. 발효 배지에서 사용하기 위한 적합한 미량 금속 스톡 용액은 하기 표 1a 및 1b에 나타낸다. 전형적으로, 발효 배지에 첨가된 미량의 이러한 금속 용액의 양은 1 mL/L 초과, 5 mL/L 초과, 또는 10 mL/L 초과이다. 그러나, 특정 농도를 초과하여, 발효 배지에 대한 미량 금속의 첨가는 미생물의 성장에 유리하지 않다. 따라서, 발효 배지에 첨가된 이러한 미량 금속 용액의 양은 전형적으로 100 mL/L 미만, 50 mL/L 미만, 또는 30 mL/L 미만이다. 스톡 용액 속에 미량의 금속을 첨가하는 것 외에, 개개 성분들은 미량의 금속 용액의 상기 범위로 나타낸 성분의 양에 독립적으로 상응하는 범위내에서 각각 별도로 첨가될 수 있다.
하기 표 1a에 나타낸 바와 같이, 본 발명에서 사용하기 위한 적합한 미량 금속 용액은 황산제1철, 칠수화물; 황산구리, 오수화물; 황산아연, 칠수화물; 몰리브덴산나트륨, 이수화물; 염화코발트, 육수화물; 및 황산마그네슘, 일수화물을 포함할 수 있으나, 이에 한정되지 않는다. 염산을 스톡 용액에 가하여 용액 속 미량 금속 염을 유지시킨다.
[표 1a]
미량 금속 스톡 용액 A
본 발명에서 사용하기 위한 다른 적합한 미량 금속 용액은 표 1b에 나타내며 킬레이트제로서 염화제1철, 육수화물; 염화아염; 염화코발트, 육수화물; 몰리브덴산나트륨; 염화망간; 붕산; 및 시트르산을 포함할 수 있으나, 이에 한정되지 않는다.
[표 1b]
미량 금속 스톡 용액 B
발효 배지는 또한 비타민을 포함할 수 있다. 이러한 비타민은 발효 배지에 편의상 발효 배지의 나머지로부터 별도로 제조될 수 있는 스톡 용액으로서 가할 수 있다. 발효 배지에 사용하기 위한 적합한 비타민 스톡 용액은 하기 표 2에 나타낸다. 전형적으로, 발효 배지에 첨가된 이러한 비타민 용액의 양은 1 ml/L 초과, 5 ml/L 초과, 또는 10 ml/L 초과이다. 그러나, 특정 농도를 초과하는, 발효 배지에 대한 비타민의 첨가는 미생물의 성장에 유리하지 않다. 따라서, 발효 배지에 첨가된 이러한 비타민 용액의 양은 전형적으로 50 ml/L 미만, 30 ml/L 미만, 또는 20 ml/L 미만이다. 스톡 용액 속에 비타민을 첨가하는 것 외에, 개개 성분들은 각각 비타민 스톡 용액의 상기 범위로 나타낸 성분들의 양에 독립적으로 상응하는 범위내에서 별도로 첨가될 수 있다.
표 2에 나타낸 바와 같이, 본 발명에 사용하기 위한 적합한 비타민 용액은 바이오틴, 판토텐산칼슘, 이노시톨, 피리독신-HCl 및 티아민-HCl을 포함할 수 있으나, 이에 한정되지 않는다.
[표 2]
비타민 스톡 용액
본 발명의 미생물은 뱃치(batch), 유가-뱃치(fed-batch), 세포 재순환(cell recycle), 및 연속을 포함하나, 이에 한정되지 않는 통상의 발효 양식으로 배양할 수 있다. 일부 양태에서, 발효는 유가-뱃치 방식으로 수행된다. 이러한 경우에, 발효 동안 배지 중 성분의 일부가 고갈된다. 발효를 비교적 높은 농도의 이러한 성분들을 사용하여 개시함으로써 성장이, 첨가가 요구되기 전 일정 시간의 기간 동안 지지되도록 할 수 있다. 이들 성분의 바람직한 범위는 발효에 의해 농도가 고갈될 때 첨가함으로써 발효 전체에서 유지된다. 발효 배지 속 성분들의 수준은 예를 들면, 발효 배지를 주기적으로 시료채취하여 농도를 검정함으로써 모니터링할 수 있다. 대안적으로, 일단 표준 발효 과정이 전개되면, 첨가를 발효 전체에서 특정 시간에 공지된 수준에 상응하는 시간 간격에서 이룰 수 있다. 당해 분야의 숙련가에 의해 인식될 바와 같이, 영양물 소비 속도는, 배지의 세포 밀도가 증가함에 따라, 발효 동안 증가한다. 또한, 발효 배지내로 외부 미생물의 도입을 피하기 위하여, 당해 분야에 공지된 바와 같이, 첨가를 혐기성 첨가 방법을 사용하여 수행한다. 또한, 소량의 소포제를 발효 동안 가할 수 있다.
발효 배지의 온도는 콘드로이틴의 성장 및 생산에 적합한 임의의 온도일 수 있다. 예를 들면, 발효 배지에 접종물로 접종하기 전에, 발효 배지를 20℃ 내지 45℃, 25℃ 내지 40℃, 또는 28℃ 내지 32℃의 범위내의 온도에서 유지시킬 수 있다.
발효 배지의 pH는 발효 배지에 산 또는 염기를 첨가함으로써 조절할 수 있다. 암모니아를 사용하여 pH를 조절하는 경우, 이는 발효 배지 속에서 질소원으로서 편리하게 작용한다. 일부 양태에서, pH는 3.0 내지 8.0, 5.5 내지 7.5, 또는 6.0 내지 7에서 유지된다.
발효 배지는 또한 발효 과정 동안 일정한 용존 산소 함량을 갖도록 유지함으로써 세포 성장을 유지하고 콘드로이틴의 생산을 위한 세포 대사를 유지할 수 있다. 발효 배지 중 산소 농도는 산소 전극의 사용을 통해서와 같은, 공지된 방법을 사용하여 모니터링할 수 있다. 산소는 발효 배지에 당해 분야에 공지된 방법을 사용하여, 예를 들면, 교반, 진탕 또는 살포(sparging)에 의한 배지의 교반 및 통기를 통해 가할 수 있다. 일부 양태에서, 발효 배지 중의 산소 농도는 대기압 및 20℃ 내지 40℃ 범위의 온도에서 발효 배지 중의 산소의 용해도를 기준으로 하여 배지 속 산소의 포화 값의 10% 내지 200%의 범위내에 있다. 그러나, 발효에 부정적으로 영향을 미치지 않으면서, 발효 동안 산소 농도가 주기적으로 당해 범위 미만으로 내려갈 수 있다.
배지의 통기가 공기의 사용과 관련하여 본원에 기술되어 있다고 해도, 다른 산소원을 사용할 수 있다. 주변 공기 중의 산소의 용적분률보다 높은 산소의 용적분률을 함유하는 통기 가스의 사용이 특히 유용하다. 또한, 이러한 통기 가스는 발효에 부정적으로 영향을 미치지 않는 다른 가스를 포함할 수 있다.
본 발명의 발효 공정의 양태에서, 발효 배지는 위에서 기술한 바와 같이 제조된다. 당해 발효 배지는 합리적인 성장 기간 후, 고 세포 밀도를 생산하기에 충분한 양의, 본 발명의 유전적으로 변형된 미생물의 활성적으로 성장하는 배양물로 접종된다. 대표적인 접종 세포 밀도는, 세포의 무수 중량을 기준으로 하여, 0.001 g/L 내지 10 g/L, 0.01 g/L 내지 5 g/L, 또는 0.05 g/L 내지 1.0 g/L의 범위이내이다. 그러나, 생산 규모 발효기에서, 보다 높은 접종 세포 밀도가 바람직하다. 이후에, 세포를 10 g/L 내지 150 g/L, 20 g/L 내지 80 g/L, 또는 50 g/L 내지 70 g/L 범위의 세포 밀도로 성장시킨다. 발효 동안 목적하는 세포 밀도에 이르기 위한 미생물에 대한 잔류 시간은 전형적으로 200 시간 미만, 120 시간 미만, 또는 96시간 미만이다.
본 발명의 작동 중 하나의 방식에서, 발효 배지 속 글리세린 농도와 같은 탄소원 농도는 발효 동안 모니터링된다. 발효 배지 속 글리세린 농도는 예를 들면, 발효 배지의 무세포(cell-free) 성분인, 상층액 중 글리세린 농도를 모니터하는데 사용될 수 있는, 예를 들면, 고압 액체 크로마토그래피의 사용과 같은 공지된 기술을 사용하여 모니터링할 수 있다. 앞서 기술한 바와 같이, 탄소원 농도는, 세포 성장 억제가 일어나는 수준 미만에서 유지되어야 한다. 비록 이러한 농도가 유기체간에 변할 수 있다고 해도, 탄소원으로서 글리세린의 경우, 세포 성장 억제는 약 60 g/L 보다 큰 글리세린 농도에서 발생하며, 시도에 의해 용이하게 측정될 수 있다. 따라서, 글리세린이 탄소원으로 사용되는 경우 글리세린은 바람직하게는 발효기에 공급되어 검출 한계 미만에서 유지된다. 대안적으로, 발효 배지 속 글리세린 농도는 1 g/L 내지 100 g/L, 2 g/L 내지 50 g/L, 또는 5 g/L 내지 20 g/L의 범위에서 유지된다. 비록 탄소원 농도가 예를 들면, 실질적으로 순수한 글리세린 용액의 첨가에 의해 목적한 수준내에서 유지될 수 있다고 해도, 원래의 발효 배지의 분취량의 첨가에 의해 발효 배지의 탄소원 농도를 유지하는 것이 허용될 수 있다. 원래의 발효 배지의 분취량의 사용은, 배지 속 다른 영양물(예를 들면, 질소 및 인산염 공급원)의 농도가 동시에 유지될 수 있으므로 바람직할 수 있다. 유사하게, 미량의 금속 농도는 미량의 금속 용액의 분취량을 가함에 의해 발효 배지 속에서 유지될 수 있다.
콘드로이틴 회수
일단 콘드로이틴이 발효 방법에 의해 생산되면, 이는 후속적인 사용을 위해 회수할 수 있다. 본 발명자들은, 콘드로이틴이 배양 배지 속에 무세포 형태("분비된 콘드로이틴")으로 존재할 수 있고/있거나 세포와 연합될 수 있음을 밝혀내었다. 세포와 연합되는 콘드로이틴은 세포 표면("세포-표면 콘드로이틴")과 연합될 수 있고/있거나 세포내에("세포내 콘드로이틴") 유지될 수 있다.
"분비된 콘드로이틴"과 관련하여, 콘드로이틴의 회수는 세포 제거 후 무세포 배양 배지의 알코올 침전에 의해, 또는 무수 분말을 수득하기 위한 무세포 배양 배지의 동결건조를 포함하나, 이에 한정되지 않는, 당해 분야에 공지된 어떠한 기술에 의해 달성될 수 있다.
"세포-표면 콘드로이틴'과 관련하여, 콘드로이틴의 회수는 세포 표면으로부터 콘드로이틴을 탈착시키는 단계 후 유리 콘드로이틴을 함유하는 배양 배지로부터 세포를 제거하는 세포 제거 단계를 추가로 포함할 수 있다. "세포내 콘드로이틴"과 관련하여, 회수는 또한 세포를 침투시키거나 분해하는 단계 후, 분해되거나 침투된 세포를 유리된 콘드로이틴을 이제 함유하는 배양 배지로부터 제거함을 달성하는 단계를 포함할 수 있다. 콘드로이틴은 배양 배지의 알코올 침전, 또는 무수 분말을 수득하기 위한 배양 배지의 동결건조를 포함하나, 이에 한정되지 않는 당해 분야에 공지된 어떠한 기술에 의해 배양 배지로부터 회수할 수 있다.
또한, 회수된 콘드로이틴 중합체를 해중합하여 중합체의 분자량을 감소시킬 수 있다. 콘드로이틴의 해중합은 산성 해중합을 포함하나, 이에 한정되지 않는, 당해 분야에 공지된 어떠한 기술에 의해서도 달성할 수 있다(참조: 예를 들면, Tommeraas and Melander, Biomacromolecules 2008;9:1535-1540). 회수된 콘드로이틴은 예를 들면, 해중합되어 동물-유래된 콘드로이틴과 유사하거나 동일한 분자량을 갖는 콘드로이틴을 생산하고/하거나 회수된 황산화되지 않은 콘드로이틴의 황산화를 보조할 수 있다. 예를 들면, 회수된 콘드로이틴은 해중합되어 분자량이 5 kDa 내지 100 kDa, 바람직하게는, 10 kDa 내지 70 kDa, 보다 바람직하게는, 20 kDa 내지 40 kDa인 중합체를 수득할 수 있다.
다음의 정의 및 약어는 특허청구범위 및 명세서의 해석에 사용되어야 한다.
본원에 사용된 것으로서 용어 "유전자"는, 선택적으로 코딩 서열의 선행(5' 비-코딩 서열) 및 후행(3' 비코딩 서열) 조절서열을 포함하는, 특정 단백질로 발현될 수 있는 핵산 단편(또는 폴리뉴클레오타이드)을 말한다. "천연 유전자"는 이의 자체의 조절 서열과 함께 천연에서 발견되는 유전자를 말한다. "내인성 유전자"는 유기체의 게놈내 이의 천연 위치내 천연 유전자를 말한다.
본원에 사용된 것으로서, 용어 "코딩 서열"은 특정 아미노산 서열을 코딩하는 DNA 서열을 말한다.
"적합한 조절 서열"은 코딩 서열의 상부(5' 비-코딩 서열), 당해 서열내, 또는 하부(downstream)(3' 비-코딩 서열)에 위치하며 전사, RNA 프로세싱 또는 안전성, 또는 연합된 코딩 서열의 해독에 영향을 미치는 뉴클레오타이드 서열을 말한다. 조절 서열은 프로모터, 해독 리더 서열, 인트론, 폴리아데닐화 인식 서열, RNA 프로세싱 부위, 효과기 결합 부위 및 스템-루프 구조(stem-loop structure)를 포함할 수 있다.
용어 "프로모터"는 코딩 서열 또는 기능성 RNA의 발현을 조절할 수 있는 DNA 서열을 말한다. 일반적으로, 코딩 서열은 프로모터 서열에 대해 3'에 위치한다. 프로모터는 천연 유전자로부터 그 전체가 유래될 수 있거나, 천연에서 발견된 상이한 프로모터로부터 유래된 상이한 성분으로 구성되거나, 심지어 합성 DNA 분절을 포함할 수 있다. 상이한 프로모터가 상이한 조직 또는 세포 유형, 또는 발달의 상이한 단계, 또는 상이한 환경적 또는 생리학적 상태에 대한 반응시 유전자의 발현을 지시할 수 있음은 당해 분야의 숙련가에 의해 이해된다. 유전자가 대부분의 시간에 대부분의 세포 유형에서 발현되도록 하는 프로모터는 "구성적 프로모터"로 일반적으로 언급된다. 대부분의 경우 조절 서열의 정확한 경계는 완전히 정의되지 않으므로, 상이한 길이의 DNA 단편이 동일한 프로모터 활성을 가질 수 있음이 또한 인식된다.
본원에 사용된 것으로서, 용어 "발현"은 본 발명의 핵산 단편으로부터 유래된 센스(mRNA) 또는 안티센스 RNA의 전사 및 안정한 축적을 말한다. 발현은 또한 mRNA의 폴리펩타이드로의 해독을 말할 수 있다.
본원에 사용된 것으로서, 용어 "형질전환"은 숙주 유기체 내로 핵산 단편이 전달되어 유전적으로 안정한 유전을 생성함을 말한다. 형질전환된 핵산 단편을 함유하는 숙주 유기체는 "트랜스제닉" 또는 "재조합" 또는 "형질전환된" 유기체로 언급된다.
용어 "작제물", "플라스미드", "벡터" 및 "카세트"는 세포의 중심 대사의 일부가 아니며, 일반적으로 환형, 또는 선형, 이본쇄 DNA 단편의 형태인 유전자를 흔히 수반하는 염색체외 성분을 말한다. 이러한 성분은 어떠한 공급원으로부터 유래된, 일본쇄 또는 이본쇄 DNA 또는 RNA의 자가 복제하는 게놈 서열, 통합 서열, 파아지 또는 뉴클레오타이드 서열일 수 있으며, 여기서 다수의 뉴클레오타이드 서열은 적절한 3' 해독되지 않은 서열과 함께 선택된 유전자 생성물에 대한 프로모터 단편 및 DNA 서열을 세포내로 도입할 수 있는 유일한 작제물로 결합되거나 재조합된다.
본원에 사용된 것으로서, 용어 "코돈 축퇴성(codon degeneracy)"은 인코딩된 폴리펩타이드의 아미노산 서열내 변화없이 뉴클레오타이드 서열의 변이를 허용하는 유전 코드의 특성을 말한다. 당해 분야의 숙련가는 주어진 아미노산을 특정하기 위하여 뉴클레오타이드 코돈의 사용시 특정 숙주 세포에 의해 나타난 "코돈-성향(condon-bias)"을 잘 인식한다. 따라서, 숙주 세포내에서 개선된 발현을 위해 유전자를 합성하는 경우, 코돈 사용빈도의 이의 빈도가 숙주 세포의 바람직한 코돈 사용빈도의 빈도에 근접하도록 유전자를 설계하는 것이 바람직할 수 있다.
용어 "코돈-최적화된"은, 이것이 각종 숙주의 형질전환을 위한 핵산 분자의 유전자 또는 코딩 영역을 언급할 경우, DNA에 의해 인코딩된 폴리펩타이드를 변경하지 않고 숙주 유기체의 대표적인 코돈 사용빈도를 반영하기 위한 핵산 분자의 유전자 또는 코딩 영역내 코돈의 변형을 말한다.
용어 "작동적으로 연결된"은 하나의 기능이 다른 것에 의해 영향받도록 하는 단일 핵산 단편위의 핵산 서열의 연합을 말한다. 예를 들면, 프로모터는, 이것이 이러한 코딩 서열의 발현에 영향을 미칠 수 있는 경우(즉, 코딩 서열이 프로모터의 전사 조절하에 있음) 코딩 서열과 작동적으로 연결되어 있다. 코딩 서열은 센스 또는 안티센스 배향으로 조절 서열에 작동적으로 연결될 수 있다.
본원에 사용된 표준 재조합 DNA 및 분자 클로닝 기술은 당해 분야에 잘 공지되어 있으며 문헌[참조: Sambrook, J., Fritsch, E. F. and Maniatis, T., Molecular Cloning: A Laboratory Manual, Second Edition, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY (1989) (hereinafter "Maniatis"); and by Silhavy, T. J., Bennan, M. L. and Enquist, L. W., Experiments with 유전자 Fusions, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY (1984); and by Ausubel, F. M. et al., Current Protocols in Molecular Biology, published by Greene Publishing Assoc. and Wiley-Interscience (1987)]에 기술되어 있다. 이들 문헌 각각은, 이의 전문이 본원에 참조로 통합된다.
본 발명의 추가의 목적, 이점 및 신규 특징은 본원의 다음 실시예들의 시험시 당해 분야의 숙련가에게 명백해질 것이며, 이들 실시예는 제한하는 것으로 의도되지 않는다.
실시예
실시예
1
K4
캡슐 생합성의 유전학
에스케리키아 콜라이 K4 캡슐은 "2 군" 캡슐로 분류된다. 휘트필드(Whitfield)에 의해 고찰된 바와 같이(참조: Annu Rev Biochem. 2006; 75:39-68), 에스케리키아 콜라이 2 군 캡슐의 합성은 3개 영역으로 이루어진 일반적인 유전적 구조를 지닌 유전자 클러스터에 의해 인코딩된 단백질의 세트에 의해 지시된다. 에스케리키아 콜라이 K4 캡슐 유전자 클러스터의 예측된 구조(본 발명 이전)은 도 2에 나타낸다. 영역 1은 6개의 유전자, kpsFEDUCS를 함유하는 것으로 예측되었으며, 영역 3은 2개의 유전자, kpsM 및 kpsT를 함유하는 것으로 예측되었다. 공지된 단백질과의 서열 상동성을 기초로 하여, kpsF 및 kpsU 유전자는 당 뉴클레오타이드 CMP-Kdo의 생합성시 단계들을 촉매하는 단백질을 인코딩하는 것으로 예측되었다. 에스케리키아 콜라이내 2 군 캡슐의 CMP-Kdo 생합성의 역활이 제안되어 왔으나(참조: Roberts, Annu. Rev. Microbiol. 1996; 50:285-315) 실험적으로 입증되어 있지 않다(참조: Whitfield, Annu Rev Biochem. 2006; 75:39-68). kpsM, kpsT, kpsD, kpsE, kpsC 및 kpsS 유전자는 당 전구체의 중합이 발생하는 세포 세포질로부터 성숙한 캡슐 다당류가 외부 세포 막의 지질 성분에 대한 공유 결합을 통해 외부 세포 막에 고정된 것으로 여겨지는 세포 표면으로의 캡슐 다당류의 전좌에 요구되는 단백질을 인코딩하는 것으로 예상되었다(참조: Roberts, Annu. Rev. Microbiol. 1996;50:285-315; Whitfield, Annu Rev Biochem. 2006;75:39-68). 에스케리키아 콜라이 K4 캡슐의 경우, 대부분 에스케리키아 콜라이 2 군 캡슐에 대해서와 같이, 다당류와 캡슐의 지질 성분 사이의 공유 결합의 구조는 실험적으로 측정되지 않았다. 더우기, 지질 성분의 실체는 알려져 있지 않다. 영역 1 및 영역 3 유전자, 및 이들이 인코딩하는 단백질은 매우 다양한 다당류 조성 및 구조를 갖는 캡슐을 생산하는 에스케리키아 콜라이 균주 중에서 고도로 보존된다(참조: Whitfield, Annu Rev Biochem. 2006;75:39-68). 에스케리키아 콜라이내 2 군 캡슐 클러스터의 영역 2에 함유된 유전자는 당 뉴클레오타이드 전구체 생합성 및 이들 전구체의 중합을 위한 효소를 코딩하는 유전자를 포함함으로써, 영역 2는 캡슐 다당류의 구조를 결정한다. 에스케리키아 콜라이내 2 군 캡슐 클러스터의 영역 2내 다른 유전자는, 기능이 공지되어 있지 않고 캡슐 생합성에 있어 역활을 갖는 것으로 입증되어 있지 않은 단백질을 인코딩한다. 니노미야(Ninomiya) 등이 기술한 바와 같이(참조: J. Biol. Chem. 2002;277:21567-21575, GenBank AB079602), 에스케리키아 콜라이 K4 캡슐 유전자 클러스터의 영역 2의 서열은 단백질을 인코딩하는 것으로 예측된 7개의 주석이 달린 개방 판독 프레임(kfoABCDEFG)을 함유한다. 삽입 성분, IS2는 유전자 kfoC와 kfoD 사이에 위치한다.
K4 캡슐 생합성 유전자에 대한 합성 코딩 서열의 설계시 예비 단계로서, 각각의 유전자 쌍을 분리하는 유전자간 서열을 검사하였다. 당해 서열 분석을 기초로 하여, 당해 영역내에, 발현되고 캡슐 생합성에 잠재적으로 관련될 가능성이 있는 단백질을 인코딩하는 적어도 2개의 추가의 개방-판독-프레임(open-reading-frames: ORF)이 존재한 것으로 여겨졌다. 니노미야 등의 서열을 기본으로 하여, 다음의 유전자간 거리를 수득하였다: kfoA-kfoB: 186 bp; kfoB-kfoC: 297 bp; kfoC-IS2: 29 bp; IS2-kfoD: 9 bp; kfoD-kfoE: 389 bp; kfoE-kfoF: 818 bp; kfoF-k foG: 431 bp. 하나의 개방 판독 프레임은 각각의 3개의 최대 유전자간 영역내에서 확인되었다.
대부분의 kfoD-kfoE 영역은 kfoD의 정지 코돈 후 10개 뉴클레오타이드에서 개시하여 kfoE의 코딩 영역내에서 종결하는, "ORF3"로 명명된 390 bp ORF에 의해 포함된다. 즉, 추정적인 orf3 유전자는 10개 뉴클레오타이드에 의해 kfoE 유전자와 중첩한다. 당해 ORF는 ATG에 의해 개시하며 제2의 가능한 ATG 출발점은 9bp 하부에 인프레임으로(in frame) 위치한다. 이들 가능한 출발 둘다는 인식가능한 샤인-달가노(Shine-Dalgarno: SD) 서열(참조: Shine and Dalgarno Proc. Natl. Acad. Sci. U S A. 1974;71:1342-6)을 결실하고 있다. orf3의 단백질 생성물이 BLAST 조사에서 사용된 경우, 8개의 "우수한" 히트(hit), 즉, > 138의 점수, < 3e-31의 E 값이 수득되었다. 이들 히트 중 2개는 캡슐 생합성을 위한 유전자 클러스터내에 위치한 파스퇴렐라 물토시다 유전자(bcbF & ecbF)에 의해 인코딩된 단백질에 대한 것이었다. 이들 파스퇴렐라 물토시다 캡슐 유전자 클러스터는 도 3a에 본 발명자에 의해 분석된 대로 니노미야 등의 서열에 따라 K4 영역 2 유전자와 함께, 도표화되어 있다. Orf3, BcbF 및 EcbF 단백질에 대한 단백질 서열의 정렬은 도 3b에 나타낸다. 이들 파스퇴렐라 물토시다 서열은 혈청형 B 균주(M1404) 및 혈청형 E 균주(P1234) 각각으로부터 온다. 혈청형 E 캡슐의 조성은 알려져 있지 않지만 혈청형 B 캡슐은 만노즈, 갈락토즈 및 아라비노즈로 구성된 것으로 보고되어 있으나 구조는 보고되어 있지 않다(참조: Townsend et al., J. Clin. Microbiol. 2001;39:924-929).
kfoE-kfoF 영역내에서, "ORF1"으로 명명된 630 bp ORF가 도 3a에 나타난 대로 존재한다. 당해 ORF에 대한 ATG 출발 코돈은 kfoE 유전자의 상부의 TGA 정지 코돈과 중첩된다. KfoE에 대한 코딩 서열내 당해 ATG의 상부의 7개 염기 쌍, 강력한 SD 서열(AGGAGG)이 존재한다. 따라서, 당해 ORF가 발현되어야 하는 환경적 증거는 강력하다. ORF1에 의해 코딩된 단백질에 대한 BLAST 결과는 ORF3를 사용하여 수득된 파스퇴렐라 물토시다 유전자 히트에 근접한 파스퇴렐라 물토시다 유전자(bcbE & ecbE)에 대한 강력한 히트를 포함한다. 즉, K4 클러스터의 추정적인 ORF 1 및 3 둘 다는 캡슐 다당류를 인코딩하는 2개의 파스퇴렐라 물토시다 유전자 클러스터내에 상동체를 갖는다. ORF1, BcbE 및 EcbE 단백질 서열의 정렬은 도 3b에 나타낸다.
kfoF-kfoG 영역에서, "ORF2"로 명명된 384 bp ORF가 존재한다. 당해 ORF의 ATG 개시 코돈은 약한 SD 서열을 제공할 수 있는 GG 서열 15 bp 상부 이후에 온다. 당해 단백질 서열을 사용한 BLAST 조사에서 유의적인 히트는 발견되지 않았다. 이는, 당해 ORF가 실제 생산되는 폴리펩타이드를 인코딩하지 않을 수 있음을 제안하였다.
영역 2로부터의 2개의 다른 K4 캡슐 클러스터 유전자(kfoD 및 kfoE)는 파스퇴렐라 물토시다 P1234 및 파스퇴렐라 물토시다 M1404 캡슐 유전자 클러스터내에 위치하는 피, 물토시다 유전자에 대해 상동성을 갖는 것에 주목하는 것이 흥미롭다. kfoD에 의해 인코딩된 단백질은 EcbD 및 BcbD와 상동성을 공유하며 유사하게 kfoE 유전자 생성물은 EcbG 및 BcbG와 상동성을 공유한다. 따라서, 도 3a에 나타낸 바와 같이, 4개의 인접한 K4 유전자(kfoD, orf3, kfoE, 및 orf1)는 인접한 파스퇴렐라 물토시다 혈청형 B 유전자 bcbDEFG 및 파스퇴렐라 물토시다 혈청형 E 유전자 ecbDEFG 중에서 상동체를 갖는다. 위에 나타낸 바와 같이, 이들 2개의 파스퇴렐라 균주는 콘드로이틴 생산자가 아니며 K4 유전자 kfoD, orf3, kfoE, 및 orf1이 콘드로이틴 생합성에 역활을 하는 경우 역활은 본 발명 이전에 알려져 있지 않았다.
K4내의 kfoD, orf3, kfoE, orf1 유전자 세트는 IS2가 바로 앞에(9bp) 선행한다는 사실은 이들의 기원 및 콘드로이틴 캡슐 합성시 역활과 관련된 다수의 가능성을 유발한다. 이론에 얽매이지 않고, 본 발명자들은, K4 영역 2 유전자 클러스터가 IS2-매개된 재조합/삽입을 통해 kfoABCFG로 구성된 모(parental) 콘드로이틴-생산 클러스터로 유발되는 것으로 고려한다. 또한, 본 발명자들은, kfoD, orf3, kfoE 및 orf1 유전자가 콘드로이틴 골격의 프럭토실화에 관여할 수 있다고 가설을 세웠다. 프럭토실화는 파스퇴렐라 물토시다 혈청형 F 캡슐과 에스케리키아 콜라이 K4 캡슐 사이의 하나의 명백한 구조적 차이이다. 2개 사이의 유전적 구조에 있어서 유의적인 차이, 즉, kfoD, orf3, kfoE, orf1 유전자 세트의 존재 또는 부재는 이러한 구조적 차이의 반영임이 가능하다. 파스퇴렐라 물토시다 콘드로이틴-생산 혈청형 F 균주 P4182의 캡슐 생합성 유전자 클러스터와 유사하게(참조: Townsend et al., J. Clin. Microbiol. 2001;39:924-929), 콘드로이틴 골격의 생산을 위한 유일한 관련된 K4 영역 2 유전자가 kfoA, kfoB, kfoC, kfoF 및 kfoG일 수 있음은 가능할 수 있다. 실시예 6 및 7에 기술된 바와 같이, 본 발명자들은, kfoD, orf3, kfoE 및 orf1 유전자가 콘드로이틴의 생산에 필요하지 않으며 이들 유전자들 중 하나 이상은 콘드로이틴의 프럭토실화에 필수적임을 확인하였다.
K4 캡슐 생합성 유전자에 대한 합성 코딩 서열을 설계하기 전에 니노미야 등의 서열을 확인하기 위하여, 본 발명자들은 ATCC로부터 입수한 에스케리키아 콜라이 K4 균주 ATCC 23502로부터의 K4 캡슐 유전자 클러스터의 영역 2를 서열분석하였다. 게놈 DNA를 퀴아젠 게놈 DNA 키트(Qiagen Genomic DNA Kit)(제조원: Qiagen Inc., 미국 캘리포니아주 발렌시아 소재)를 사용하여 ATCC 균주 23502의 새로운 밤새 배양물로부터 판매회사의 프로토콜에 따라 제조하였다. 20 게이지 바늘을 통한 통과(5회)에 의해 전단된 게놈 DNA의 분취량을 PCR 반응에서 주형으로 사용하여 크기가 2.2 kB 내지 2.7 kB의 범위인 6개의 중첩된 PCR 생성물의 시리즈를 생산하였다. PCR 반응의 생성물을 퀴아젠 퀴아퀵 PCR 정제 키트(Qiagen QIAquick PCR Purification Kit)를 사용하여 판매회사 프로토콜에 따라 정제하여 상업적 판매회사(Biotechnology Resource Center, DNA Sequencing Facility, Cornell University, 미국 뉴욕 이타카 소재)에 DNA 서열 측정을 위해 보냈다. 이들 6개의 중첩 PCR 생성물의 서열은 니노미야 등(2002)에 의해 측정된 대로 영역 2 서열에 걸쳐 있었다. 전체적으로 본 발명자들에 의해 측정된 서열과 니노미야 등에 의해 보고된 서열이 99.8% 유사성으로 일치하였다. 그러나, 26번 위치에서 치환, 결실 및 삽입을 포함하는 단일 염기쌍 차이가 존재하였다. 이들 차이들 중의 일부는 유전자 클러스터에 의해 코딩된 영역 2 단백질의 예측된 아미노산 서열내 실질적인 차이를 초래하였다. 관찰된 뉴클레오타이드 서열 차이 및 예측된 단백질 서열에서 수득되는 효과는 도 4a 및 4b에 나타낸다.
K4 캡슐 생합성 유전자의 정확한 서열을 결정하기 위하여, 에스케리키아 콜라이 혈청형 K4 균주 U1-41을 스타텐스 혈청 연구소(Statens Serum Institut)(덴마크 코펜하겐 소재)로부터 입수하였다. U1-41은 ATCC 23502 균주의 조상이며 K4 다당류의 구조적 측정을 위해 사용된 다당류 제제를 생산하기 위해 사용되었다(참조: Rodriguez et al., 1988). 에스케리키아 콜라이 U1-41내 K4 캡슐 유전자 클러스터의 영역 1, 2 및 3에 걸친 대략 23 kb의 DNA의 서열을 측정하였다. 당해 서열(서열 번호 117)은 영역 1의 kpsF 유전자의 ATG 해독 개시 코돈 상부의 125bp로부터 영역 3의 kpsM 유전자의 ATG 해독 개시 코돈 상부의 110bp 까지의 영역에 걸친 23,230개 염기 쌍으로 이루어진다.
서열 결정을 위해, 게놈 DNA를 에스케리키아 콜라이 U1-41의 새로운 밤샘 배양물로부터 퀴아젠 게놈 DNA 키트(Qiagen Genomic DNA Kit)(제조원: Qiagen Inc., 미국 캘리포니아주 발렌시아 소재)를 사용하여 판매회사의 프로코콜에 따라 제조하였다. 20 게이지 바늘을 통한 통과(5회)에 의해 전단된 게놈 DNA의 분취량을 PCR 반응에서 주형으로 사용하여 크기가 2.1 kB 내지 2.8 kB 범위의 11개의 중첩된 PCR 생성물의 시리즈를 생산하였다. 본원에서 반응물 1 내지 11로 명명된 이들 PCR 반응은 다음 올리고뉴클레오타이드 프라이머를 사용하였다: 반응 1; (DHD089 및 DHD090), 반응 2; (DHD091 및 DHD092), 반응 3; (DHD093 및 DHD175), 반응 4; (DHD120 및 DHD096), 반응 5; (DHD097 및 DHD098), 반응 6; (DHD099 및 DHD100), 반응 7; (DHD101 및 DHD102), 반응 8; (DHD103 및 DHD104), 반응 9; (DHD105 및 DHD106), 반응 10; (DHD162 및 DHD108), 반응 11; (DHD169 및 DHD110). 이들 프라이머의 서열은 하기 나타낸다.
DHD089 5> GCACCTCCATGAGACATTGC >3 (서열 번호 118)
DHD090 5> CCACTGCCATACGGTTTAGC >3 (서열 번호 119)
DHD091 5> GCTTGCCTTTGCAGAAACGG >3 (서열 번호 120)
DHD092 5> CCAACAATATCGAGCAGTGG >3 (서열 번호 121)
DHD093 5> GTCATTCGTCAGAACGGTGC >3 (서열 번호 122)
DHD175 5> CCAGTGCCTGATAATCAGC >3 (서열 번호 123)
DHD120 5> GGCTTAACGCTGTGGAAGTC >3 (서열 번호 124)
DHD096 5> ATATTGGGATTCCTGGTCGC >3 (서열 번호 125)
DHD097 5> ACGACATCAAAGGCTTGACG >3 (서열 번호 126)
DHD098 5> ATAGCCCTGAAGCTGAAGCC >3 (서열 번호 127)
DHD099 5> CGAGTGATTGCTTGGTATCC >3 (서열 번호 128)
DHD100 5> AAACGATTGAGCGGGTTAGC >3 (서열 번호 129)
DHD101 5> AGAGTGGTTCAATCCTCTGG >3 (서열 번호 130)
DHD102 5> TGTCTTGGCTAATGCTGACG >3 (서열 번호 131)
DHD103 5> CGAGTAGTTATCTGGCTCTG >3 (서열 번호 132)
DHD104 5> GTCAGTTAGACTCTGATGAC >3 (서열 번호 133)
DHD105 5> CTTGAACGGTCCAACTTCAC >3 (서열 번호 134)
DHD106 5> AGTTCAGGAGCTTGAATGCG >3 (서열 번호 135)
DHD162 5> TTCGCACGCATTTATAGCCG >3 (서열 번호 136)
DHD108 5> TCATCTTGCGAGAGCATTCG >3 (서열 번호 137)
DHD169 5> CTTCCGCTAAATCCATTACG >3 (서열 번호 138)
DHD110 5> AGATCTATTTATCCCTGCGG >3 (서열 번호 139)
PCR 반응 1, 2, 3, 7, 8, 9, 10 및 11은 PfuUltra II 폴리머라제(제조원: Stratagene, 미국 캘리포니아주 라 졸라 소재)를 사용하여 판매회사 프로토콜에 따라 수행하였다. 각각의 100μL 반응물에서, Pfu 반응 완충액(판매회사에 의해 공급됨)을 1X의 최종 농도로 가하고, 프라이머를 각각 0.4μM의 최종 농도로 가하고, dNTP를 각각 250μM의 최종 농도에서 가하고 100 ng의 U1-41 게놈 DNA를 주형으로서 가하였다. PCR 반응을 Perkin-Elmer GeneAmp 2400 열순환기 속에서 다음 주기 매개변수를 사용하여 수행하였다: 95℃에서 2분의 1 주기; 95℃에서 20초, 55℃에서 20초, 및 72℃에서 40초의 35 주기; 72℃에서 3분의 1주기; 및 4℃에서 유지. PCR 반응 4, 5 및 6을 하기의 예외들과 함께 상기와 같이 수행하였다. 반응 5 및 6의 경우에, 프라이머를 각각 0.5μM의 최종 농도로 가하고 어닐링 단계(annealing step)를 55℃ 대신 60℃에서 수행하였다. 반응 4의 경우에, 프라이머를 각각 0.5μM의 최종 농도로 가하고 PCR 반응을 RoboCycler® 구배 96 열순환기(제조원: Stratagene, 미국 캘리포니아주 라 졸라 소재) 속에서 다음의 주기 매개변수를 사용하여 수행하였다: 95℃에서 1분의 1 주기; 95℃에서 30초, 52℃에서 30초, 및 72℃에서 1분의 35 주기; 72℃에서 5분의 1 주기; 및 6℃에서 유지.
PCR 반응 1, 2, 3, 7, 8, 9, 10 및 11의 생성물을 퀴아젠 퀴아퀵 PCR 정제 키트(Qiagen QIAquick PCR Purification Kit)(제조원: QIAGEN, 미국 캘리포니아주 발렌시아 소재)를 사용하여 판매회사의 프로토콜에 따라 정제하고, 100μL의 EB 용출 완충액 속에 회수한 후, 서열분석 반응용 주형으로 사용하였다. PCR 반응 4, 5 및 6의 생성물을 퀴아젠 퀴아퀵 PCR 정제 키트(제조원: QIAGEN, 미국 캘리포니아주 발렌시아가 소재)를 사용하여 판매회사 프로토콜에 따라 정제한 후 예비(preparative) 아가로즈 겔 전기영동에 의해 추가로 정제하였다. 단편들을 퀴아퀵 겔 추출 키트(QIAquick Gel Extraction Kit)(제조원: QIAGEN Inc., 미국 캘리포니아주 발렌시아가 소재)를 사용하여 판매회사 프로토콜에 따라 겔 슬라이스(gel slice)로부터 용출하고 100μL의 EB 용출 완충액 속에 회수하였다. 겔-정제된 단편을 서열분석 반응을 위한 주형으로 제공하였다. 반응 1 내지 11의 정제된 PCR 생성물을 상업 판매회사(Cornell University Life Sciences Core Laboratories Center, Cornell University, 미국 뉴욕주 이타카 소재)로 DNA 서열분석 측정을 위해 보냈다. 이들 11개의 중첩 PCR 생성물로부터 수득된 서열은 니노미야 등(2002)에 의해 측정된 바와 같이 영역 2 서열에 걸쳐 있고 또한 영역 1 및 영역 3 유전자 모두를 포함하였다.
U1-41로부터의 K4 캡슐 유전자 클러스터의 서열은 에스케리키아 콜라이내 2 군 캡슐 유전자 클러스터에 대해 전형적인 것으로서 영역 1내 kpsF, kpsE, kpsD, kpsU, kpsC 및 kpsS 유전자의 존재를 입증한다. U1-41 KpsF, KpsE, KpsD, KpsU, KpsC 및 KpsS 단백질의 예측된 아미노산 서열은 다른 에스케리키아 콜라이 2 군 캡슐 생산인자에 의해 인코딩된 이들 단백질의 서열에 대해 상동성이다. 이들은 모두 이들 단백질에 대한 컨센수스(consensus) 서열에 대해 및 에스케리키아 콜라이 니슬(Escherichia coli Nissle) 1917(혈청형 K5) KpsF, KpsE, KpsD, KpsU, KpsC 및 KpsS 서열에 대해 >95% 동일성을 나타낸다(참조: Grozdanov et al., J. Bacteriol. 2004;186:5432-41). 당해 서열은 또한 에스케리키아 콜라이내 2 군 캡슐 유전자 클러스터에 대해 전형적인 것으로서 영역 3내 kpsM 및 kpsT 유전자의 존재를 나타낸다. U1-41 KpsM 및 KpsT 단백질의 예측된 아미노산 서열은 다른 에스케리키아 콜라이 2 군 캡슐 생산인자에 의해 인코딩된 이들 단백질의 서열에 대해 상동성이다. 이들은 모두 이들 단백질에 대한 컨센수스 서열에 대해 및 에스케리키아 콜라이 니슬 1917(혈청형 K5) KpsM 및 KpsT 서열에 대해 >90% 동일성을 나타낸다.
U1-41 DNA 서열은 니노미야 등의 영역 2 서열에 대해 및 ATCC 23502의 영역 2에 대해 본 발명자들에 의해 결정된 서열에 대해 정렬될 수 있는 대략 13.5 kb 영역 2 분절을 포함한다. U1-41 서열 및 ATCC 23502의 영역 2에 대해 본 발명자들에 의해 결정된 서열은 이들 스패닝 영역에 걸쳐 동일하다. 폴리펩타이드로서 발현될 것으로 예측된 9개의 개방 판독 프레임(ORF)은 IS2 서열을 배제하고, 확인된 영역 2내에 존재한다. 이들 9개는 상기 상세한, 앞서 확인되지 않은 2개의 ORF를 포함한다. 이들 ORF를 인코딩하는 유전자는 초기에 본원에서 orf1 및 orf3로 명명되었으며 이제 각각 kfoH 및 kfoI로 지정되는 것으로 제안된다. 도 5는 ATCC 23502 및 U1-41의 DNA 서열로부터 본 발명자들에 의해 결정된 바와 같은 K4 캡슐 유전자 클러스터의 정렬을 나타낸다. 상기 언급된 Orf2는 본 발명자들에 의해 결정된 영역 2의 서열내 별도의 개방 판독 프레임으로서 존재하는 것으로 밝혀지지 않았다. 본 발명자들에 의해 측정된 서열내에서, orf2를 포함하는 서열은 kfoG의 코딩 서열의 일부이다. 니노미야 등에 의해 발표된 서열내 프레임쉬프트(frameshift)는 kfoG 서열을 2개의 보다 작은 개방 판독 프레임인, 니노미야 등에 의해 주석이 달린 것으로서 kfoG 유전자 및 본 발명자들에 의해 주석이 달린 것으로서 orf2 서열로 분할한다. 따라서, orf2는 니노미야 등에 의해 발표된 잘못된 서열의 인공물이었다.
IS2 서열을 배제하고, 유전자 클러스터는 단백질을 인코딩하는 것으로 예측된 17개의 개방 판독 프레임을 함유한다. 이들 유전자의 정렬은 에스케리키아 콜라이 2 군 캡슐 유전자 클러스터(참조: Whitfield 2006)에 대해 전형적이다. 보존된 유전자 kpsFEDUCS를 포함하는 영역 1, 및 보존된 유전자 kpsMT를 포함하는 영역 3은 영역 2의 9개의 개방 판독 프레임(및 IS2)을 플랭킹한다. 영역 1 및 영역 3 유전자는 에스케리키아 콜라이내 모든 2 군 캡슐의 합성 및 전좌에 필요한 단백질을 포함한다. 영역 1은 또한 CMP-Kdo의 생합성시 단계들을 촉매하는 것으로 예측된 효소를 코딩하는 2개의 유전자(kpsF 및 kpsU)를 포함하다. 위에 주목한 바와 같이, 에스케리키아 콜라이내 2 군 캡슐의 생합성시 CMP-Kdo의 역활은 제안되어 있지만, 실험적으로 입증되어 있지 않았다. 2 군 캡슐 유전자 클러스터에서, 영역 2 유전자는 전형적으로 캡슐 다당류의 구조를 결정하는 혈청형-특이적인 단백질을 인코딩하는 것들을 포함한다. 영역 2내에서 확인된 9개의 유전자들 중에서, 3개는 캡슐 생합성과 관련된 명확하게 정의된 활성을 갖는 단백질: kfoC(콘드로이틴 신타제, 즉 폴리머라제), kfoA(UDPGlcNAc 에피머라제, UDPGlcNAc를 UDPGalNAc 전구체로 전환함) 및 kfoF(UDPGlc-데하이드로게나제, UDPGlc를 UDPGlcUA 전구체로 전환함)를 인코딩한다.
K4 캡슐 유전자 클러스터의 영역 2에 존재하는 다른 유전자에 대해 기능이 미지이다: kfoB, kfoG, kfoD, kfoE, kfoH 및 kfoI. kfoB는 다른 글리코스아미노글리칸(GAG) 캡슐, 파스퇴렐라 물토시다 혈청형 A, F 및 D 및 에스케리키아 콜라이 혈청형 K5를 생산하는 것으로 공지된 박테리아의 캡슐 클러스터내에 존재하는 유전자에 의해 인코딩된 단백질에 대해 상동성인 단백질을 인코딩한다. 유사하게, KfoG 단백질은 또한 파스퇴렐라 물토시다 혈청형 A, F 및 D의 캡슐 클러스터내에 존재하는 유전자에 의해 코딩된 단백질에 대해 상동성이다. 이러한 환경적 증거는, kfoB 및 kfoG가 GAG-함유 K4 캡슐의 생합성에 역활을 할 수 있음을 제안한다.
KfoB 및 KfoG와는 대조적으로, 본 발명 이전에, kfoD, kfoE, kfoH 및 kfoI가 GAG 생합성에 관련되는 것으로 나타낸 증거는 없었다. 위에 나타내고 실시예 6 및 7에 기술된 바와 같이, 본 발명자들은, 이들 유전자(즉, 유전자 kfoD, kfoE, kfoH 및 kfoI) 중 하나 이상이 K4 캡슐 다당류의 콘드로이틴 골격의 프럭토실화에 필수적이지만, 이들 유전자들 중 어느 것도 콘드로이틴 골격의 생산에 필요하지 않음을 본원에서 나타낸다.
삽입 성분 IS2는 U1-41 및 ATCC 23502내의 유전자 kfoC 및 kfoD 사이에 존재한다. 관찰된 배향에서 IS2의 삽입은 IS2내에서 기원하는 전사로 인하여 하부 유전자의 발현을 활성화시키는 것으로 보고되었다(참조: Glansdorf et al ., Cold Spring Harbor Symp . Quant . Biol ., 1981;45:153-156). 따라서, 이론에 얽메이지 않고, IS2의 존재는 하부 유전자 kfoD, kfoI, kfoE, kfoH, kfoF 및 kfoG의 발현을 조절할 수 있지만, 이들 유전자의 발현을 방지하는 것으로 예측되지 않음이 제안된다.
실시예
2
코돈-최적화된 에스케리키아 콜라이 4 캡슐 생합성 유전자의 합성
본 발명자에 의해 결정된 U1-41 K4 캡슐 유전자 클러스터의 서열을 대체 숙주에서 발현에 사용할 합성 유전자의 설계를 위한 기초로 사용하였다. 합성 작제물을 설계하여 K4 캡슐 생합성 유전자를 함유하는 하나 이상의 합성 오페론의 발현을 허용하고 에스케리키아 콜라이, 잔토모나스 캄페스트리스, 스핑고모나스 엘로데아 및 바실러스 서브틸리스에서 발현을 위해 허용가능한 코돈을 사용하는 컨센수스 바람직한 코돈 표에 기초하여 코돈 사용빈도에 대해 최적화하였다. 표 3a는 에스케리키아 콜라이, 잔토모나스 캄페스트리스 및 바실러스 서브틸리스 게놈에 대한 및 K4P 캡슐 생합성과 관련된 에스케리키아 콜라이 K4 영역 2 유전자, 및 또한 젤란 생합성과 관련된 것들을 포함하는 53개의 스핑고모나스 엘로데아 유전자에 대한 코돈 사용빈도 표를 제공한다. 당해 표는 K4 영역 2 생합성 유전자에서 선호하지 않는 코돈의 현저한 사용을 설명한다. 이들 코돈은 잔토모나스 캄페스트리스 또는 스핑고모나스 엘로데아 발현에 극도로 불리할 뿐 아니라 에스케리키아 콜라이내 발현도 불리하다. 에스케리키아 콜라이내에서 최적 발현을 위해, 유의적인 코돈 최적화가 필수적일 수 있음이 예측될 수 있다. 이들 코돈 사용빈도 표의 비교에 기초하여, 컨센수스 바람직한 코돈 사용빈도 표를 설계하여, 합성 콘드로이틴 생합성 유전자에 대해 표 3b에 나타낸다. 당해 코돈 사용빈도 패턴은 광범위한 잠재적인 대체 숙주에서 효과적인 해독을 제공하는 것으로 예측된다.
[표 3a]
나타낸 값들은, 코돈이 인코딩하는 주어진 아미노산을 규정하는 전체 코돈의, 각각의 코돈에 대한 퍼센트로서 발생을 반영한다. 코돈 사용빈도는 바실러스 서브틸리스 균주 168, 잔토모나스 캄페스트리스 피브이. 캄페스트리스 ATCC33913, 에스케리키아 콜라이 K-12 W3110의 게놈 및 20,972개의 코돈을 함유하는 스핑고모나스 엘로데아의 53개의 CDS로부터 계산하였다.
표 3b에서 하기 나타낸 코돈 사용빈도는 합성 유전자의 설계시 사용된 컨센수스 코돈 사용빈도 표 및 하기 작제된 바와 같은 합성 유전자 세트의 최종 코돈 사용빈도이다. 합성 유전자에서 실제 사용빈도는 DNA 및 mRNA 2차 구조, 제한 부위의 포함 및 배제, 및 전체 GC 함량과 같은 설계 고려사항을 반영한다.
[표 3b]
2 값은 합성된 것으로서 합성 유전자 세트내 코돈의 총 수이다.
합성 유전자 세트를 3개의 분절, kpsFEDUCS("FS 분절"), kpsMTkfoABCFG("MG 분절") 및 kfoDIEH("DH 분절")로서 작제하였다. 도 6은 이들 3개의 합성 분절의 구조를 도해로 나타낸다. 도 6에 나타낸 유일한 제한 부위를 전략적 위치에 혼입하여 합성 단편이 플라스미드 발현 벡터내로 삽입될 수 있는 하나 이상의 오페론으로 조립되도록 하였다. 초기 전략은 유전자를 발현 실험용 단일 오페론으로서 조립하기 위한 것이었다. 다른 제한 부위는 또한 어떠한 제공된 유전자(들)에 대해서도 비-극성 결실의 작제를 허용하는 위치에서 합성 서열 전체에 전략적으로 위치하였다. 이는 K4 캡슐 클러스터에 의해 인코딩된 단백질의 기능 뿐만 아니라 플라스미드 서열의 다른 변형의 유전적 분석도 용이하게 할 수 있다. 컨센수스 강력한 리보소옴 결합 부위(AGGAGGttaataaATG, 서열 번호 46)를 kpsC, kpsT, kfoE, 및 kfoH를 제외하고는 모두의 합성 유전자 대부분에 대해 사용하였다. 에스케리키아 콜라이 K4 U1-41 서열에서, 이들 유전자의 해독 개시 부위를 바로 상부의 유전자의 해독 정지에 커플링하며 그 결과 리보소옴 결합 부위는 이들 상부 유전자의 코딩 영역과 중첩된다.
위에 정의한 것으로서 FS, MG 및 DH 분절을 포함하는 합성 서열은 상업적 판매회사, DNA2.0(미국 캘리포니아주 멘로 파크 소재)에 의해 3개의 별도의 단편으로 합성하였다. 3개의 합성 분절의 뉴클레오타이드 서열을 FS 분절(서열 번호 47), MG 분절(서열 번호 48) 및 DH 분절(서열 번호 49)로서 나열한다.
실시예
3
대체 숙주 균주의
작제
K4 생합성 유전자의 발현을 위해 선택한 초기 대체 숙주는 에스케리키아 콜라이 K-12("K-12"), 에스케리키아 콜라이. 비("EcB"), 스핀고모나스 엘로데아("Sph"), 및 잔토모나스 캄페스트리스 피브이. 캄페스트리스("Xcc")를 포함하였다. K-12 균주 W3110 및 MG1655를 예일대의 콜리 유전 스톡 센터(Coli 유전자tic Stock Center)로부터 입수하였다. Sph 균주 ATCC 31461을 ATCC로부터 입수하였다. Xcc 균주 NRRL B-1459(ATCC 13951)를 미국 일리노이주 페오리아 소재의 ARS 컬쳐 컬렉션(NCUAR)으로부터 입수하였다. 에스케리키아 콜라이 B(ATCC 11303)를 ATCC로부터 입수하였다.
일반적으로, 대체 숙주는 K4 유전자의 도입을 위해 2가지 방식으로 제조하였다. 이동하는(mobilizing) 플라스미드 pRK2013을 함유하는 에스케리키아 콜라이와 3-부모 교차(tri-parental cross)하는 에스케리키아 콜라이의 실험실 클로닝 균주로부터의 접합 전달에 의해 특정의 대체 숙주로 유전자/플라스미드를 전달할 수 있는 것이 유리할 수 있다. 접합 환경 중에서 대체 숙주의 피전달접합균주(transconjugant)를 선택하기 위하여, 대체 숙주의 항생제-내성 유도체(전형적으로 스트렙토마이신 내성)가 요구된다. 대안적으로, 에스케리키아 콜라이 균주 S17-1(참조: Simon et al., BioTechnology 1983;1:784-791)을 사용할 수 있다. 당해 균주는 플라스미드 RP4의 염색체 통합된 형태를 가지며 적절한 플라스미드를 새로운 숙주로 직접 이동시킬 것이다. 그러나, 당해 균주는 스트렙토마이신 내성이므로, 스트렙토마이신은 접합완료체(exconjugant) 중에서 당해 균주에 대해 선택하는데 사용될 수 없다.
Sph, Xcc, 및 K-12에서 유전자 또는 유전자 클러스터 결실의 생성은 2-단계, "팝-인/팝-아웃" 상동성-구동된(driven) 방법을 사용하여 수행하였다(참조: 도 7a). 제 1 단계에서, 목적하는 결실 구조의 클로닝된 버젼(결실을 플랭킹하는 상동성 영역)을 함유하는 플라스미드를 플랭킹 영역 중 하나에서의 재조합(및 벡터 상의 마커에 대한 선택)에 의해 염색체(팝-인)내로 통합시켜 상동성 플랭킹 영역의 중복을 생성하였다. 제2 단계에서, 재조합이 반대쪽 플랭킹 영역내에서 발생하여 클로닝 벡터(및 마커)와 표적화된 염색체 영역을 제거하지만[팝핑-아웃(popping-out); "분해하는"], 설계된 결실은 남겼다. 이러한 균주는 마커 선택의 부재하에서의 다-세대 성장에 이은, 마커 및 목적하는 표현형(콜로니 형태학 및/또는 PCR에 의해 측정됨)의 손실에 대한 스크리닝에 의해 수득하였다. 에스케리키아 콜라이 외의 그람-음성 유기체의 경우, 목적하는 결실은 표적(비-에스케리키아 콜라이) 숙주 균주로 접합에 의해 이전할 수 있지만, 이것 내에서 복제할 수 없는 "자살(suicide)" 벡터내에서 전형적으로 창조된다. 본 발명의 목적을 위해, 본 발명자들은 pCM184(참조: 도 7b; Marx and Lidstrom, BioTechniques 2002;33(5):1062-1067)를 변형시킴으로써 "자살" 벡터를 생성하였다. 카나마이신-내성 유전자 및 플랭킹 loxP 부위들은 NotI 및 SacII로 분해하고, 말단을 T4 DNA 폴리머라제로 폴리싱(polishing)하여 연결시킴으로써 제거하였다. 도 7b에 나타낸 바와 같이, 수득되는 플라스미드, pCX027(서열 번호 141)은 통합체(integrant)(Sph 또는 Xcc내) 및 거대한 다중-클로닝 부위의 선택을 위한 테트라사이클린-내성을 함유하였다. 에스케리키아 콜라이내에서 결실을 생성시키기 위해, 플라스미드 pMAK705[참조: Hamilton et al., J. Bacteriol. 1989;171 (9):4617-4622]를 사용하였다. 당해 플라스미드는 온도-민감성 pSC101 레플리콘을 함유함으로써, 제1 단계 통합의 생성 및 제2 ("분해") 단계에서 플라스미드 서열의 손실이 고온에서 용이하게 되었다. "세포외 다당류(EPS) 마이너스" 돌연변이체의 유전자 구조는 PCR 및 서던 블롯 분석으로 확인하였다.
결실 작제물을 생성하기 위한 시도는 위에서 기술한 모든 표적에 대해 동일하였다. 상동성의 상부 및 하부 영역은 적절한 게놈 DNA를 주형으로 사용하는 PCR에 의해 유래되었다. 제한 부위를 PCR 프라이머내로 설계함으로써, 수득되는 DNA 단편이 목적하는 플라스미드내로 클로닝될 수 있도록 하거나, 하기 기술된 Xcc 검D 유전자(gumD gene)의 경우, 게놈내에 천연적으로 존재하는 제한 부위를 사용하였다. 결실(및 클로닝에 사용된 제한 부위)를 설계함으로써 인프레임 융합체를 표적 유전자(들)의 N-말단 및 C-말단 코딩 영역의 짧은 영역들 사이에 생성시켰다. 실제로, 표적화된 코딩 영역을 제한 효소 인식 서열로 대체하였다. 상부 단편과 하부 단편 사이의 가공된 제한 부위 서열은 2 내지 3개의 비-천연 코돈을 융합된 코딩 영역에 추가하였다. 당해 과정은 하부 유전자의 발현시 아주 적은 극성 효과/비 극성 효과의 예측과 함께 잘-정의된 돌연변이를 생성하였다.
에스케리키아 콜라이 K-12
콜란산(M 항원)은 많은 장 박테리아에 의해 생산된 세포외 다당류이며(참조: Grant, W.D., et al., J. Bacteriol.1969;100:1187-1193), 보다 많은 생산이 전형적으로 저 성장 온도에서 발견되었다(참조: Stout, V., J. Bacteriol. 1996;178:4273-4280). 콜란산 생합성에 있어 결함이 있는 에스케리키아 콜라이 K-12 균주의 생성은 당해 실시예에 기술되어 있다. 이러한 균주는, 이들이 30℃ 이하에서 수행할 수 있는 재조합 콘드로이틴의 생산을 위해 추가로 가공되는 경우, 방해하거나 오염되는 콜란산을 생산하지 않는다. 플라스미드 pMAK705(참조: Hamilton, C.M., et al., J. Bacteriol. 1989;171:4617-4622)를 사용하여 염색체 콜란산 생합성 유전자 클러스터내에 정밀한 결실을 생성하였다. 당해 플라스미드는 온도 민감성 레플리콘(replicon)을 함유하며 고온에서 염색체외 상태로 존재할 수 없다. 일반적으로, 표적 유전자자리에서 정밀한 돌연변이를 생성하기 위한 단계는 "팝-인/팝-아웃" 메카니즘으로부터 생성되며 문헌[Hamilton et al.(상기 참조)]에 기술되어 있다. 설계된 돌연변이를 함유하는 플라스미드 클론은 통상적으로 표적 유전자자리에서 상동성 재조합을 통해, 허용되지 않는 온도에서 형질전환체의 성장 및 플라스미드-코딩된 항생제(클로람페니콜; Cm) 내성에 대한 선택에 의해 염색체 내로 구동된다("팝-인"). 클로람페니콜의 부재하에서 이들 구성요소의 후속적인 다-세대 성장은, 플라스미드가 염색체로부터 재조합되어 세포 분열 동안 세포로부터 손실되어 원래의 야생형 구조 또는 돌연변이체 구조를 남긴 세포의 소-집단을 생성한다. 이들 "팝-아웃"은 Cm 민감성으로 확인된다. 목적하는 돌연변이체 구조를 갖는 균주를 이후에 표현형(가능하게는) 및 PCR 또는 서던 블롯팅으로 확인한다.
에스케리키아 콜라이 K-12에서 콜란산 생합성 오페론은 약 24kb를 포함하는 19 또는 20개의 연속된 유전자로 이루어진다(참조: Stevenson, G., et al., J. Bacteriol. 1996;178:4885-4893). 20번째 유전자, wcaM은 오페론/전사 단위의 일부인 것으로 여겨지지만 콜란산 생산을 위해 요구되지 않는다. 여기에 포함된 것은 제1 당을 콜란산 생합성 동안 지질 담체 위로 로딩하는데 관여하는 글리코실트랜스퍼라제 효소를 코딩하는 wcaJ 유전자이다. 당해 실시예는 전체 20-유전자 오페론 또는 wcaJ 유전자만의 결실을 함유하는 에스케리키아 콜라이 K-12 균주의 생성을 기술한다. 에스케리키아 콜라이 K-12 균주 W3110의 게놈의 서열은 GenBank AP009048로서 발표되어 있다(참조: Blattner, F.R., et al., Science 1997;277:1453-1462).
콜란산 오페론의 결실: PCR 프라이머를 W3110 콜란산 오페론의 제1 유전자(wza) 상부의 대략 950 bp 상부 및 마지막 유전자(wcaM) 하부의 대략 950 bp를 증폭시키기 위해 설계하였다. 이들 단편은 염색체내에서 목적하는 재조합 부위에 대해 상동성을 제공하였다. PCR 프라이머는 후속적인 클로닝에 사용될 증폭된 PCR 생성물의 말단에 비-천연 제한 부위를 생성하도록 설계하였다. 상부 영역을 프라이머 CAX129(밑줄친 HindIII 부위) 및 CAX128(밑줄친 AscI 부위)를 사용하여 증폭시켰다. 하부 영역을 프라이머 CAX130(밑줄친 AscI 부위) 및 CAX131(밑줄친 XbaI 부위)를 사용하여 증폭시켰다.
CAX128 GGCGCGCCAGCGTCCTGCTGTTTGATGACG (서열 번호 50)
CAX129 AAGCTTGCCAGGAGATTGACGCCAGC (서열 번호 51)
CAX130 GGCGCGCCGGAATCCTCAGTTGGACCCGC (서열 번호 52)
CAX131 TCTAGAACTTTACCCTCACGGTCCAGCG (서열 번호 53)
PCR은 Pfu 폴리머라제(제조원: Stratagene)를 사용하여 95℃에서 변성, 57℃에서 어닐링 및 72℃에서 연장(각 단계에서 20초)의 30 주기 동안 수행하였다. 주형은 100 ng의 에스케리키아 콜라이 K-12 W3110 게놈 DNA로 이루어져 있다. PCR 단편을 pCR-Blunt II-TOPO(제조원: Invitrogen)내로 클로닝하고 에스케리키아 콜라이 TOP10(제조원: Invitrogen)내로 형질전환하고, 선택된 클로닝된 삽입체의 서열을 발표된 데이타와 일치하는지 확인하였다. 상부 클론을 HindIII 및 AscI으로 분해하고, 하부 클론을 XbaI 및 AscI으로 분해하였다. 목적하는 단편을 겔-정제(유전자 Clean Turbo, 제조원: Q-BIO유전자)하고 HindIII 및 XbaI으로 분해한 후 안트악틱 포스파타제(Antarctic phosphatase)(제조원: New England Biolabs)로 처리한 pMAK705와 연결시켰다. 에스케리키아 콜라이 DH5α의 Cm-내성(LB Cm 34㎍/mL, 30℃) 형질전환체(제조원: Invitrogen)를 플라스미드 구조에 대해 분석하고, 목적하는 구조를 갖는 것을 pMAK-CL로 명명하였다. 당해 플라스미드(및 이로부터 궁극적으로 유래된 염색체 결실)에서, AscI 부위에서 상부 및 하부 단편의 통합은 wza 유전자의 5' 말단 및 wcaM 유전자의 3' 말단으로 이루어진 작은 345bp 개방 판독 프레임을 생성하였다. 이러한 특징은 wcaM 하부의 더 먼 임의의 유전자의 콜란산 오페론 프로모터로부터의 잠재적인 발현의 파괴를 최소화하기 위해 설계되었다.
플라스미드 pMAK-CL을 에스케리키아 콜라이 W3110내로 30℃(허용되는 온도)에서 17㎍/mL에서 Cm을 함유하는 LB(참조: Maniatis, 1989) 아가 플레이트(agar plate) 상에 플레이팅함으로써 Cm 내성에 대한 선택과 함께 전기영동으로 형질전환시켰다. 몇가지 형질전환 콜로니를 M9(참조: Maniatis, 1989) Cm 17㎍/mL 아가 플레이트에 스트리킹(streaking)하고 43℃(허용되지 않는 온도)에서 항온처리하였다. 2일 후, 다수 콜로니(추정상의 통합체)가 존재하였으며, 이들을 M9 Cm에 43℃에서 확인을 위해 재-스트리킹하였다. 2개의 추정상의 통합체를 약 25 세대 동안 LB 배지 속에서 37℃로 성장시키고, 희석물을 제조하여 실온(22 내지 24℃)에서 성장시키기 위해 LB 플레이트에 스프레딩하였다. 3일 후, 콜로니를, 하나는 30℃에서 성장을 위해 Cm 17㎍/mL를 함유하는 2개의 LB 아가 플레이트로 이전시켰다. Cm-민감성 분리체는 2개의 원래의 구성요소의 유도체 중에 62% 및 94%의 빈도로 존재하였다. 이들은 아마도 "팝-아웃" 및 pMAK-CL 플라스미드의 손실로부터 생성되었다. "콜로니 PCR"을 사용하여 이들 균주내 콜란산 오페론에서 구조를 평가하였다. 소량의 콜로니를 PCR과 양립할 수 있는 튜브 내의 10μL의 멸균 탈-이온수 속에 현탁시켰다. 여기에 20μL의 "태크 마스터(Taq Master)(에펜도르프) 성분의 1.5배 농축된 혼합물을 가함으로써 반응물 중 최종 농도/양이 1X 태크 폴리머라제 완충액, 1X "태크 마스터" 시약, 0.33 mM 각각의 dNTP, 0.4μM 각각의 프라이머, 및 0.5 단위의 태크 폴리머라제가 되도록 하였다. PCR을 95℃에서 8분으로 개시하여, 95℃에서 30초 동안 변성, 55℃에서 30초 동안의 어닐링, 및 68℃에서 3분의 연장의 35 주기로 지속하고, 68℃에서 7분 동안 연장시켜 종료하였다. 초기 특성화를 상부 상동성 영역내 전방 프라이머(CAX132) 및 하부 상동성 영역내 역방 프라이머(CAX135)를 사용하여 수행하였다.
CAX132 CCGAATTGTTATCTTGCCTGC (서열 번호 54)
CAX135 GGTAGCATCTCTTTGGGTATCG (서열 번호 55)
바람직한 오페론 결실을 함유하는 균주의 PCR은 1000 bp 단편을 생산하는 것으로 예측되었으며, 이는 분석된 23개 "팝-아웃" 균주 중 9개에서 발견되었다. 바람직하지 않은 재배열이 이들 균주에서 발생하지 않았는지를 보증하기 위해, 상동체의 영역 외부의 프라이머를 이용한 "콜로니 PCR"을 사용하였다: CAX162(전방) 및 CAX163(역방).
CAX162 GAACAGCGGTTGAGTCAGGG (서열 번호 56)
CAX163 GGCAGAAAGCACATAGCGACC (서열 번호 57)
이들 외부 프라이머는 바람직한 구조의 결실시 2065 bp의 PCR 생성물을 제공하였으며, 9개 균주 중 4개는 당해 PCR 생성물을 생성하였으며; 이들 중 하나는 MSC188로 지정되었다. 균주 MSC188내 결실의 구조의 추가 확인은 서던 블롯팅으로 달성하였다. "DIG"-표지된 프로브(제조원: Roche)를 프라이머 CAX128 및 CAX129(1000 bp)로 pMAK-CL을 주형으로서 사용하여 생성시켰다. 야생형 에스케리키아 콜라이 W3110 및 MSC188로부터의 염색체 DNA를 제한 효소 KpnI, PstI 및 BglII로 분해하고, 분해물을 겔 전기영동 및 블롯팅에 적용시켰다. 프로빙(probing)은 MSC188 및 W3110 각각에서 예측된 밴드 패턴을 나타내었다: KpnI, 5921 bp 대 9431 bp; PstI, 3902 bp 대 12893 bp, 및 BglII, 9361 bp 대 6201 bp.
wca J의 결실: 에스케리키아 콜라이 K-12 W3110내에서 wcaJ 유전자의 결실을 위한 전략은 전체 콜란산 생합성 오페론의 결실에 대해 위에 기술된 바에 따랐다. PCR 프라이머를 설계하여 W3110 콜란산 오페론의 wcaJ 유전자 상부 및 하부의 대략 500bp를 증폭시켰다. 상부 영역을 프라이머 CAX126(밑줄친 HindIII 부위) 및 CAX125(밑줄친 PacI 부위)로 증폭시켰다. 하부 영역은 프라이머 CAX124(밑줄친 PacI 부위) 및 CAX127(밑줄친 XbaI 부위)로 증폭시켰다.
CAX124 TTAATTAACAAAGGTTTCGTTAACAAAGCGG (서열 번호 58)
CAX125 TTAATTAAATTGGTTTTCGCTCGCTCGC (서열 번호 59)
CAX126 AAGCTTGGAAGACGCCATCTATGGTGG (서열 번호 60)
CAX127 TCTAGAGAAGCCCGCCAGCACCGC (서열 번호 61)
상부 및 하부 PCR 생성물의 제한 단편을 pMAK705내로 클로닝하여 pMAK-wca를 수득하였다. 당해 플라스미드 및 이로부터 궁극적으로 유래된 염색체 결실에 있어서, PacI 부위에서 상부 및 하부 단편의 통합은 wcaJ 유전자의 5' 및 3' 말단으로 이루어진 작은 75bp 개방 판독 프레임을 생성하였다. 당해 특징은 이들이 콘드로이틴의 생산에 유리한 상황에서 모든 다른 오페론 유전자의 방해되지 않은 발현을 허용하도록 설계하였다. 콜로니 PCR에 의한 에스케리키아 콜라이 W3110의 추정적 wcaJ 결실 유도체의 초기 특성화는 프라이머 CAX126 및 CAX127을 사용하여 수행하였으며, 23개의 유망한 "팝-아웃"중 11개는 바람직한 시그날을 제공하였다. 외부 프라이머 CAX160(전방) 및 CAX161(후방)을 사용하여 추정적 wcaJ 결실을 확인하였고, 시험한 4개 균주 중 3개는 예측된 생성물(1188 bp)을 함유하였다. 바람직한 DNA 구조를 갖는 하나의 균주를 MSC175로 지정하였다.
CAX160 CCGTTGATGTGGTGACTGCC (서열 번호 62)
CAX161 AAACAGCAGCGTTCTCACCG (서열 번호 63)
서던 블롯 확인을 위해, "DIG"-표지된 프로브를 프라이머 CAX124 및 CAX127(514 bp)로 pMAK-wca를 주형으로서 사용하여 생성시켰다. 야생형 에스케리키아 콜라이 W3110 및 MSC175로부터의 염색체 DNA를 제한 효소 PacI, DraIII 및 NdeI로 분해하고, 분해물을 겔 전기영동 및 블롯팅에 적용시켰다. 프로빙은 MSC175 및 W3110 각각에서 예측된 밴드 패턴을 나타내었다: PacI, 8456 bp 대 >28000 bp; DraIII, 4502 bp 대 5819 bp, 및 NdeI, 8512 bp 대 9829 bp.
잔토모나스 캄페스트리스
잔토모나스 캄페스트리스 피브이. 캄페스트리스(Xcc)는 상업적으로 사용되어 다양한 산업 및 식품 적용을 위한 세포외 탄수화물 중합체 크산탄 검을 생산한다(참조: Baird, J., et al., BioTechnology 1983;1:778-783). 당해 균주 및 콘드로이틴의 생산 방법을 사용하기 위해서는, 크산탄 검을 생합성할 수 없는 Xcc 균주가 요구된다. 에스케리키아 콜라이용으로 사용된(상기) 것과 유사한 전략을 사용하여 NRRL B-1459로서 또한 공지된(참조: Capage, M.R. et al., World Patent WO87/05938; Katzen, F., et al., J. Bacteriol. 1998;180(7):1607-1617), 잔토모나스 캄페스트리스 피브이. 캄페스트리스 균주 ATCC13951 내에서 전체 크산탄 검 생합성 오페론 또는 제1 글리코실트랜스퍼라제용 유전자, gumD 만을 결실시켰다. 우선, 30℃에서 영양 아가 속에서 100㎍/mL 스트렙토마이신 설페이트에 대해 내성인 자발적으로-생성된 유도체를 수득하고 MSC116으로 명명하였다. PCR 프라이머를 균주 NRRL B-1459(GenBank 수탁번호 #U22511)의 크산탄 검 생합성 클러스터의 서열 및, 필요에 따라 잔토모나스 캄페스트리스 피브이. 캄페스트리스 ATCC33913(GenBank 수탁번호 AE008922)에 대한 게놈 서열에 대해 설계하였다.
gum D 의 결실: gumD 유전자의 결실을 위한 전략은 코딩 영역의 대략 1650 bp 상부(5') 및 1000 bp 하부(3')를 이용한다. PCR 프라이머를 이들 제한 부위의 외부에 설계하고, 이들을 gumD 코딩 서열의 바로 내부의 PCR 프라이머 표적화 영역과 쌍을 지어 상동성의 상부 및 하부 영역을 생성하였다. 대략 1800 bp의 상부 상동성을 증폭시키기 위해, 프라이머 CAX114 및 CAX116을 사용하였다. 대략 1100 bp의 하부 상동성을 증폭시키기 위해, 프라이머 CAX115 및 CAX117을 사용하였다. gumD 코딩 영역의 말단내 2개의 중앙 프라이머를 SbfI 제한 부위(하기 밑줄침)를 사용하여 정정하였다.
CAX114 CCTGCAGGGTCGAACACTCGCAAGACCAGG (서열 번호 64)
CAX115 CCTGCAGGTATCCGCATCATCGTGCTGACG (서열 번호 65)
CAX116 CCTTGGTGATGGTGTGGCG (서열 번호 66)
CAX117 GCCCATCCACGACTCGAACG (서열 번호 67)
PCR을 Pfu Ultra II 폴리머라제(제조원: Stratagene)를 사용하여 95℃에서 변성(20초), 62℃에서 어닐링(20초) 및 72℃에서 연장(30초)의 30 주기 동안 수행하였다. 주형은 100 ng의 잔토모나스 캄페스트리스 피브이. 캄페스트리스(균주 ATCC13951; "Xcc") 게놈 DNA로 이루어졌다. PCR 단편을 pCR-Blunt II-TOPO(제조원: Invitrogen)내로 클로닝하고 에스케리키아 콜라이 TOP10(제조원: Invitrogen)내로 클로닝시켰다. 상부 상동성 클론의 관련 서열은 PCR 생성물의 서열과 일치하였으나, 이는 당해 영역에 대한 발표된 Xcc 서열(프라이머는 배제됨)로부터 2개의 염기 쌍에 의해 상이하다. 발표된 서열은 소수의 부정확한 지정(assignment)을 함유하는 것으로 여겨진다. 하부 상동성 클론의 관련 서열은 이의 PCR 생성물의 서열 및 당해 영역에 대한 발표된 Xcc 서열(프라이머는 배제됨)의 것과 일치하였다.
잔토모나스에서 "팝-인/팝-아웃" 메카니즘을 사용한 특이적인 유전자 결실을 생성하기 위한 전략은 플라스미드 pCM184의 유도체를 기초로 한다(참조: Marx, C.J., and Lidstrom, M.E., BioTechniques 33(5):1062-1067, 2002). 플라스미드 pCM184는, 에스케리키아 콜라이내에서 플라스미드의 복제를 허용하지만, 잔토모나스(또는 다른 비-장내 박테리아)에서는 허용하지 않는 ColE1 레플리콘(replicon), 그람 음성 박테리아 중에서 접합성 전달을 위한 oriT 영역, 암피실린 및 테트라사이클린에 대한 내성 유전자, 및 loxP 서열에 의해 플랭킹된 카나마이신(Kanr)에 대한 내성 유전자로 이루어졌다. 당해 플라스미드를 설계하여 비-에스케리키아 콜라이 균주에서 표지되지 않은(나머지 항생제 내성 유전자가 없는) 결실을 생성하였지만, 기술된 과정은 결실 부위에 작은 loxP 서열을 남겼다. 그러나, 본 발명에서 생성된 균주의 경우 loxP와 같은 불필요한 서열을 함유하지 않는 것이 바람직하였다. 따라서, pCM184를 변형시켜 loxP 부위 및 개재된 카나마이신 내성 유전자를 제거하였다. 이는 위에서 기술한 "팝-인/팝-아웃" 메카니즘에 있어서의 변이에 의해 잔토모나스내에서 바람직한 표지되지 않은 결실의 생성을 허용하였다.
약 1.8㎍의 플라스미드 pCM184를 NotI 및 SacII 제한 효소(loxP/Kanr/loxP 영역을 제거하기 위해 선택하지만 추가의 사용을 위해 제한 부위 대부분은 남긴다)로 분해하고, 완료된 반응물을 75℃에서 15분 동안 가열하여 효소를 불활성화시켰다. 이후에, 시료(20μL)를 T4 DNA 폴리머라제(1.8 U, 제조원: New England Biolabs) 및 100μM의 각각의 dNTP로 15분 동안 12℃에서 처리하여 NotI 분해로부터 일본쇄 오버행(overhang)을 채우고(fill-in) SacII 분해로부터의 오버행을 역으로 잘라내었다(즉, 평활 말단을 생성). 반응은 EDTA를 10 mM까지 첨가하고 75℃에서 20분 동안 가열하여 종결하였다. 약 170㎍의 처리된 플라스미드를 400 U T4 DNA 리가제(제조원: New England Biolabs)와 10μL 용적 속에서 16℃로 4시간 동안 반응시켰다. 연결 반응물을 2.5 U SbfI로 90분 동안 후속적으로 처리하여 원치않는 DNA 구조를 분해하였다(예를 들면, 재형성된 pCM184). 0.5μL 용적의 당해 반응물을 사용하여 에스케리키아 콜라이 TOP10(제조원: Invitrogen)을 형질전환시키고, LB Tc5에 플레이팅하여 37℃에서 밤새 항온처리한 후 다수의 콜로니를 생성하였다. 선택된 콜로니로부터의 세포내에 함유된 플라스미드는 제한 효소 분석 및 DNA 서열 분석에 의해 바람직한 구조인 것으로 나타났다: 당해 플라스미드는 pCX027(서열 번호 141)로 명명되었으며 도 7b에 도해되어 있다.
gumD 상부 및 하부 영역(상기)에 대한 클로닝된 PCR 생성물을 함유하는 플라스미드(각각 약 2㎍)를 10 U SbfI로 2시간 동안 37℃에서 분해한 후, 10 U EcoRI(효소-특이적인 완충액)으로 동일한 조건하에서 분해하였다. 열처리(70℃에서 20분 동안)한 후, 분해물을 아가로즈 겔 전기영동에 적용시키고, 바람직한 단편(약 1.6 kb의 상부 단편; 약 1.1 kb의 하부 단편)을 QIAGEN 미니-용출 키트(Mini-Elute kit)로 정제하였다. 플라스미드 pCX027(약 3.5㎍)을 20 U EcoRI을 사용하여 50μL 반응물 속에서 2.5 시간 동안 37℃에서 분해하고, 약 18U 안트악틱 포스파타제(제조원: New England Biolabs)으로 60μL 반응물 속에서 15분 동안 37℃에서 처리한 후, 70℃에서 20분 동안 가열하였다. 3-방식 연결(ligation)을 각각 약 100ng의 처리된 pCX027 및 정제된 gumD 상부 및 하부 단편으로 10pL 반응물 속에서 16℃에서 약 20시간 동안 수행하였다. 당해 반응물의 1/2을 에스케리키아 콜라이 DH5α(제조원: Stratagene)내로 형질전환한 후 LB Ap100 또는 LB Tc5에 37℃에서 플레이팅하였다. 콜로니 PCR을 수행하여(위에서 기술한 바와 같이) 각각 상부 및 하부 서열에서 영역에 대해 상동성인 프라이머 CAX122 및 CAX119를 사용하여 바람직한 구조를 가진 클론을 확인하였다.
CAX119 GACCAATGACACGATGATCG (서열 번호 68)
CAX122 GCATCCGCTACAACATGCTC (서열 번호 69)
예상한 크기(1169bp)의 PCR 생성물을 수개의 콜로니에서 검출하고, 목적하는 구조를 제한 분석으로 확인하였다. 쌍을 이룬 상동성 영역의 배향(gum 유전자 판독 프레임으로서 제공됨)이 벡터 Tetr 유전자에 대한 배향과 동일하거나 반대인 플라스미드를 각각 pCX030 및 pCX031로 명명하였다.
잔토모나스 캄페스트리스 피브이. 캄페스트리스["Xcc"; ARS 컬쳐 컬렉션(NCUAR), 미국 일리노이아주 페오리아 소재; 또한 ATCC13951로서 공지됨]를 영양 브로쓰(NB, 제조원: Difco) 속에서 밤새 30℃에서 성장시키고(달리 나타내지 않는 한 30℃에서 Xcc 균주 모두 성장), 새로운 NB 속에서 1:5로 희석시키고, 100μL의 분취량을 스트렙토마이신(str)을 100㎍/mL로 함유하는 영양 아가(NA, 제조원: Difco) 플레이트에 스프래딩(spreading)시킨 후 30℃에서 항온처리하였다. 수일 후, 콜로니가 약 1/107개의 원래-플레이팅된 세포의 빈도로 검출되었다. 수개의 자발적으로-발생된 스트렙토마이신-내성 Xcc 균주를 NA str50 플레이트에 스트리킹하여 정제하고, 이러한 분리체 하나를 MSC116로 명명하였다.
플라스미드 pCX030 또는 pCX031을 전기영동에 의해 Xcc 균주 MSC116으로 전달하였다(참조: Oshiro et al., J. Microbiol. Method 2006;65:171-179). 테트라사이클린-내성 콜로니(TcR)를 pCX030(4.1 x 104/㎍) 및 pCX031(3.1 x 104/㎍) 각각으로부터 수득하였다. 게놈 DNA를 pCX031 형질전환으로부터 유래된 분리된 TcR 균주로부터 제조하고 PCR에 의해 pCX031 통합 부위에 대해 평가하였다. 프라이머 쌍을 선택하여 하부 영역에 대한 pCX031내에서 사용된 상부 영역의 외부의 게놈 서열 및 상부 영역에 대한 pCX031에서 사용된 하부 영역의 외부의 서열의 연결을 측정하였다. 구체적으로, 프라이머 CAX116(상부 영역에 대한 "외부 프라이머") 및 CAX119(하부 상동성 영역; 상기 참조)를 사용하여 상부 연결을 시험하고 CAX117("하부 여역에 대한 '외부 프라이머"; 상기 참조) 및 CAX122(상부 상동성 영역내; 상기 참조)를 사용하여 하부 연결을 시험하였다. PCR을 Go Taq DNA 폴리머라제(제조원: Promega, 미국 위스콘신주 매디슨 소재)를 0.5μM의 각각의 프라이머, 250μM의 각각의 dNTP, 1000 ng의 DNA 주형, 및 0.5 U 효소를 사용하여 수행하였다. 반응 조건은 94℃에서 4분 동안의 초기 변성, 94℃에서, 30초 동안 15초 변성, 55℃에서 30초 동안 어닐링, 및 72℃에서 4분 동안 연장 및 2분 동안의 최종 연장의 30 주기를 포함한다. "팝-인" 분리체를 pCX031의 상부 및 하부 통합 둘다에 대해 확인하였다. 2개의 분리된 "팝-인" 균주를 MSC221 및 MSC222로 지정하였다. 이들 균주를 LBLS(10 g/L 박토 펩톤, 5 g/L NaCl, 5 g/L 효모 추출물, 항생제 포함하지 않음) 속에서 30℃에서 성장시키기 위해 접종한 후, 동일한 배지내로 48시간 간격에서 1:1000 희석을 사용하여 3회 서브-배양(sub-culturing)하였다. 수득되는 배양물을 희석시키고, 분취량을 NA Str50 플레이트에 스프레딩하였다. 수득되는 콜로니를 NA 및 NA Tc5 플레이트에 전달하였다. TcS 균주는 균주 둘다로부터 2%의 빈도로 발견되었다. 상기 기술된 바와 같이, 선택된 TcS 균주에 대해 프라이머 쌍(CAX116와 CAX119 및 CAX117와 CAX122)를 사용한 콜로니 PCR 분석은, 시험된 모든 균주가 gumD 결실과 일치하였음을 입증하였다. MSC221 및 MSC222로부터의 이들 분리된 "팝-아웃" 균주를 각각 MSC225 및 MSC226으로 지정하였다. 아가 플레이트 상의 MSC225 및 MSC226의 콜로니는 MSC116 모 균주의 콜로니와 비교하여 명확하게 비점액성이었다.
크산탄 검 생합성 유전자 클러스터의 결실: gumB 내지 gumM 생합성 클러스터의 결실은 주로 gumD 유전자의 결실에 대해 상세히 설명한 동일한 단계에 따른다. gumB의 상부 및 gumM의 하부의 상동성의 영역을 PCR에 의해 프라이머 CAX136 x CAX137(1434 bp) 및 CAX138 x CAX139(1420 bp) 각각을 사용하여 생성시킴으로써, pCX027 내로 클로닝하기 위한 BglII 제한 부위 및 상부 단편과 하부 단편 사이의 융합을 위한 NotI 부위를 혼입시켰다. NotI 부위의 융합은 gumB의 5' 말단 및 gumM 코딩 서열의 3' 말단으로 이루어진 53 아미노산 폴리펩타이드에 대한 개방 판독 프레임을 생성시킬 것이다. 제한 부위는 밑줄쳐져 있다: CAX136 및 CAX139내 BglII; CAX137 및 CAX138내 NotI.
CAX136 AGATCTGGCGGTAACAGGGGATTGGC (서열 번호 70)
CAX137 GCGGCCGCCAAGACGGTATTCGGGCTGC (서열 번호 71)
CAX138 GCGGCCGCGATCTGCTGGTGTTCTTCCGC (서열 번호 72)
CAX139 AGATCTCCTACCGACCAGGCATTGGC (서열 번호 73)
PCR을 상부 및 하부 단편의 증폭을 위해 Pfu Ultra II 폴리머라제(제조원: Stratagene)를 사용하여 수행하였다. 반응 조건은 94℃에서 4분 동안의 초기 변성, 95℃에서 20초 변성, 57℃에서 30초 어닐링, 72℃에서 30분 연장 및 72℃에서 5분 동안 최종 연장의 30 주기를 포함한다. 주형은 100 ng의 잔토모나스 캄페스트리스 피브이. 캄페스트리스(균주 ATCC13951; "Xcc") 게놈 DNA로 이루어졌다. PCR 단편을 pCR-Blunt II-TOPO(제조원: Invitrogen)내로 클로닝하고 에스케리키아 콜라이 TOP10(제조원: Invitrogen)내로 형질전환하였다. 상부 상동성 클론의 관련 서열은 PCR 생성물의 서열과 일치하나, 이러한 공유된 서열은 당해 영역(프라이머 배제됨)에 대한 Xcc 균주 ATCC33913의 발표된 서열과 14개 염기 쌍이 상이하다. 이들 서열 변이는 B-1459/ATCC13951과 ATCC33913 게놈 사이의 미묘한 차이를 반영하는 경향이 있다. 하부 상동성 클론의 관련 서열은 PCR 생성물의 서열과 일치하며 당해 서열은 당해 영역(프라이머는 배제됨)에 대해 발표된 Xcc ATCC33913 서열과 상이하지 않다. gumB의 상부 영역(상기) 및 gumM의 하부 영역(상기)에 대한 클로닝된 PCR 생성물을 함유하는 플라스미드(각각 약 1㎍)를 7.5 U NotI 및 7.5 U BglII을 사용하여 37℃에서 2시간 동안 분해하였다. 분해물을 아가로즈 겔 전기영동에 적용시키고 목적하는 단편(각각 약 1.4 kb)을 QIAGEN 미니-용출 키트로 정제하였다. 플라스미드 pCX027(약 1.0㎍)을 15U BglII를 사용하여 15μL의 반응물 속에서 37℃에서 2시간 동안 분해하고, 약 5U의 안트악틱 포스파타제(제조원: New England Biolabs)로 75μL의 반응물 속에서 15분 동안 37℃로 처리한 후 65℃에서 10분 동안 가열하였다. BglII 분해된 pCX027의 정제 후, 3-방식 연결을 20μL의 반응물 속에서 정제된 pCX027, gumB의 상부 단편, 및 gumM의 하부 단편을 이용하여 실온으로 3시간 동안 수행하였다. 반응 혼합물의 1/2을 에스케리키아 콜라이 TOP10(제조원: Invitrogen)내로 형질전환한 후 LB Ap100 또는 LB Tc5에 37℃에서 플레이팅하였다. 콜로니 PCR을 수행하여(위에서 기술한 바와 같음) CAX140(상부 상동성 영역내) 및 CAX145(하부 상동성 영역내)를 사용하여 바람직한 구조를 갖는 클론을 확인하였다.
CAX140 CCGAATTTCCGAGCCTGG (서열 번호 74)
CAX145 GCCCGCTCGCTTCGTCG (서열 번호 75)
플라스미드를 PCR 양성 클론으로부터 퀴아젠 퀴아프렙 스핀 미니프렙 키트(QIAGEN Qiaprep Spin Miniprep Kit)를 사용하여 제조하고 BglII, NdeI 또는 NcoI를 사용하여 분해함으로써 상부 및 하부 서열내 상동성 영역의 이의 배향을 포함하는 플라스미드의 구조를 확인하였다. 쌍을 이룬 상동성 영역의 배향이 벡터 Tetr 유전자에 대한 배향과 동일하거나 반대인 플라스미드를 각각 pKM001 및 pKM002로 지정하였다.
플라스미드 pKM001 또는 pKM002를 Xcc 균주 MSC116에 전기천공에 의해 전달하였다(참조: Oshiro et al., J. Microbiol. Method 2006;65:171-179). TcR 콜로니를 pKM001(5.3 x 103/㎍) 및 pKM00(5.0 x 103 /㎍)의 형질전환체 각각으로부터 수득하였다. 게놈 DNA를 pKM001 형질전환체로부터 유래된 분리된 TcR 균주로부터 제조하고 PCR에 의해 pKM001 통합의 부위에 대해 평가하였다. 프라이머 쌍을 선택하여 하부 영역에 대한 pKM001에 사용된 상부 영역 외부의 게놈 서열 및 상부 영역에 대해 pKM001에서 사용된 하부 영역 외부의 서열의 연결을 측정하였다. 구체적으로, 프라이머 prKM001(상부 영역에 대한 "외부 프라이머"; 하기 참조) 및 CAX145(하부 상동성 영역내; 상기 참조)를 사용하여 상부 연결 및 prKM002(하부 영역에 대한 "외부 프라이머"; 하기 참조)와 CAX142(상부 상동성 영역내; 하기 참조)를 사용하여 하부 연결을 시험하였다.
prKM001 ACGTGGATGCGGTCGTCGC (서열 번호 76)
prKM003 GGGGCTTGCGGGTCGGC (서열 번호 77)
CAX142 CGTATGCTGAGAATGACGACC (서열 번호 78)
PCR을 Go Taq DNA 폴리머라제(제조원: Promega)를 사용하여 0.5μM의 각각의 프라이머, 250μM의 각각의 dNTP, 600 내지 1000ng의 DNA 주형, 및 0.5 U 효소로 수행하였다. 반응 조건은 94℃에서 5분 동안의 초기 변성, 94℃에서 15초의 변성, 55℃에서 30초 어닐링, 및 72℃에서 4분 연장 및 2분 동안 최종 연장의 30 주기를 포함한다. "팝-인" 분리체를 pKM001의 상부 통합을 위해 확인하였다. 이들 분리된 균주를 MSC242, MSC247 및 MSC248로 지정하였다.
MSC242, MSC247 및 MSC248을 LBLS 배지 속에 30℃에서 성장을 위해 접종한 후, 동일한 배지내로 48시간 간격에서 1:1000 희석을 사용하여 3회 서브-배양하였다. 수득되는 배양물을 희석시키고, 분취량을 NA Str50 플레이트에 스프래딩시켰다. 수득되는 콜로니를 NA 및 NA Tc5 플레이트에 전달하였다. TcS 균주는 3개 균주로부터 1 내지 2%의 빈도로 관찰되었다. 선택된 TcS 균주에서 게놈 구조를 PCR에 의해 평가하여 상부 연결에 대해 prKM001과 CAX145 및 하부 연결에 대해 prKM003와 CAX142를 사용하여 gumB로부터 gumM까지의 크산탄 검 합성 유전자의 결실을 확인하였다(상기 참조). PCR을 헤르쿨라제 II 융합 DNA 폴리머라제(제조원: Stratagene)를 사용하여 0.25μM의 각각의 프라이머, 250μM의 각각의 dNTP, 500 내지 700 ng의 DNA 주형 및 0.5 U 효소로 수행하였다. 반응 조건은 98℃에서 4분 동안의 초기 변성, 98℃에서 20초의 변성, 60℃에서 20초 어닐링, 및 72℃에서 2분 연장 및 3분 동안의 최종 연장의 30주기를 포함하였다. 3개의 "팝-아웃" 균주(1개는 각각의 "팝-인" 균주로부터)는 크산탄 검 생합성 유전자 클러스터의 결실과 일치하는 PCR 생성물을 나타내었다. MSC242, MSC247 및 MSC248로부터의 이들 크산탄 검 생합성 유전자 결실 "팝-아웃" 균주를 각각 MSC255, MSC256 및 MSC257로 지정하였다. 아가 플레이트 상의 MSC255, MSC256, 및 MSC257의 콜로니는 MSC116 모 균주의 콜로니와 비교하여 명확하게 비-점액성이었다.
에스케리키아 콜라이 B
야생형 에스케리키아 콜라이 B의 유도체(ATCC11303)인 에스케리키아 콜라이 BL21(DE3)의 게놈이 불활성인 2 군 캡슐 유전자 클러스터를 함유하는 것으로 보고되었으며, 여기서 영역 1 및 3은 완전(및 기능성)하였지만, 영역 2는 파괴되어 비-기능성이었다(참조: Andreishcheva, E.N., and Vann, W.F., Gene 2006;384:113-119). 영역 2의 유전자가 중합체-특이적이지만 영역 1 및 3은 유전적이고 거의 특이적이 아님을 고려할 때, 에스케리키아 콜라이 B를 가공하여 플라스미드 상에 단지 K4 영역 2개 유전자를 제공함으로써 콘드로이틴을 합성하거나 염색체 내로 통합시킬 수 있다(하기 참조). 콘드로이틴 생산용 숙주로서 에스케리키아 콜라이 B의 유용성을 개선시키기 위해, 콜란 산의 생산을 상기 에스케리키아 콜라이 K-12에 대해 기술된 바와 같은 유전적 돌연변이로 제거하였다.
콜란산 오페론의 결실: 에스케리키아 콜라이 B 콜란산 오페론의 결실을 위한 공정은 위에서 기술한 K-12 균주에 대해 사용된 것을 따른다. 본 발명의 시점에, 에스케리키아 콜라이 B 게놈 서열은 공공 이용가능하지 않았다. 비록 K-12 및 B 균주가 밀접하게 관련되어 있지만, DNA 서열내 일부 차이가 예측된다. 따라서, 새로운 상부 및 하부 상동성 영역의 생성이 요구되었으며, 균주 K-12에 대해 사용된 기존의 프라이머를 사용하였다. 구체적으로, 프라이머 쌍 CAX128xCAX129 및 CAX130xCAX131 및 에스케리키아 콜라이 B 게놈 DNA 주형을 사용한 PCR을 사용하여 상부 및 하부 상동성 영역 각각을 생성하였다. 크기가 약 1kb인 생성물을 수득하고, 클로닝하며, 서열분석하였다. 비-프라이머 서열에서, 상부 상동성 영역(944 bp)은 K-12 상부 영역과 단지 2개 염기(전이) 만이 상이하며, 하부 상동성 영역(911 bp)은 30개 염기(24개의 전이, 6개의 변위)가 상이하다. 상부 및 하부 단편을 pMAK705내로 클로닝하여 pMAK-BCL을 생성하였다.
플라스미드 pMAK-BCL을 에스케리키아 콜라이 B내로 전기천공에 의해 도입하였다. LB 배지에 새로운 콜로니를 접종하고 밤새 37℃에서 격렬하게 진탕하면서 항온처리하였다. 새로운, 예비-가온된 LB의 용적을 밤샘 배양물에 접종하여 0.03의 초기 OD600 판독값(암순응측정기(BioPhotometer), 에펜도르프)를 수득하였다. 배양물을 OD600 ~0.8까지 성장시킨 후 빙상에서 30 내지 40분 동안 급냉시켰다. 세포를 원심분리(10분, 4000g)에 의해 수집하고, 세포를 원래의 용적의 빙-냉 탈이온수 속에서 재-현탁한 후 재-원심분리시켜 2회 세척하였다. 최종 원심분리로부터의 세포를 1/500th 용적의 빙-냉수 속에 현탁시켰다. pMAK-BCL(200 ng)을 50μL의 제조된 에스케리키아 콜라이 B 현탁액에 가하고 빙상에서 약 20분 동안 항온처리하였다. 전기천공을 Gene Pulser Xcell(제조원: BioRad)을 사용하여 0.1 mm 갭 큐베트(gap cuvette) 속에서 25μP, 200Ω, 및 1.8 kV의 셋팅으로 수행하여 4.5 내지 5.0 msec의 기간을 수득하였다. 펄스화된 세포를 350μL의 SOC 배지로 희석시키고(참조: Maniatis, 1989) 37℃에서 1시간 동안 항온처리한 후; 5 내지 10μL를 LB Cm34 아가 플레이트에 43℃에서 항온처리와 함께 스프래딩시켰다. 2일 후 나타나는 콜로니("팝-인" 후보물을 나타냄)를 LB Cm34 아가 플레이트에 43℃에서 스트리킹하고, 수득되는 콜로니를 LB 배지(Cm 없음)에 성장 및 일련 계대를 위해 30℃에서 접종하였다. 이들 배양물로부터 유래된 콜로니를 Cm-민감성에 대해 시험하고, "팝-아웃" 후보물을 확인하였다. 콜로니 PCR을 사용하여 후보물 균주를 특성화하였다. 하나의 분리체가 프라이머 쌍 CAX129 x CAX132, CAX131 x CAX132, CAX132 x CAX135, CAX129 x CAX135, 및 CAX162 x CAX163을 사용하여 예측된 PCR 생성물을 제공하는 것으로 밝혀졌다. 콜란산 유전자 클러스터를 결실한 당해 에스케리키아 콜라이 B 분리체는 MSC364로 명명하였다.
실시예
4
발현 벡터의 작제
에스케리키아 콜라이에 대해 특이적인 잘 특성화된 고-카피-수(hig-copy-number) 및 저-카피-수 플라스미드 벡터가 기술되어 있다(참조: Balbas and Bolivar, Methods Enzymol. 1990;185:14-37, Das, Methods Enzymol. 1990;182:93-112, Mardanov et al. 유전자 2007;15(395):15-21). 이러한 벡터는 에스케리키아 콜라이내에서 조절된 유전자 발현을 위한 다양한 잘 특성화된 프로모터 시스템을 사용한다. 또한, 에스케리키아 콜라이, 엑스 캄페스트리스 및 광범위한 다른 그람 음성 박테리아에서 기능하는 RK2(저 카피 수 IncP) 및 RSF1010(고 카피 수 IncQ)와 같은 광범위한 숙주 범위 플라스미드를 기초로 한 접합적으로(conjugally)-전파가능한 플라스미드 벡터가 또한 이용가능하다[참조: Franklin and Spooner, Promiscuous plasmids in Gram-negative bacteria Academic Press (London) 1989 pp247-267, Mather et al. Gene 1995;15:85-88, Haugen et al., Plasmid 1995;33:27-39. Mermod et al., J Bact. 1986;167:447-454]. 합성 콘드로이틴 생합성 유전자 세트를 이들 다용도의(versatile) 광범위한 숙주 범위 벡터내로 클로닝함으로써 동일한 플라스미드가 잔토모나스 캄페스트리스, 스핑고모나스 엘로데아, 슈도모나스 푸티다, 및 비-병원성 에스케리키아 콜라이를 포함하는 광범위한 배열의 그람-음성 박테리아내에서 유전자 전달 및 발현을 위해 사용될 수 있다[참조: Guiney and Lanka, Promiscuous plasmids in Gram-negative bacteria Academic Press (London) 1989 pp27-54].
많은 유용한 IncP-계 벡터가, 임상 슈도모나스 분리체로부터 원래 분리된 후 시험한 거의 모든 그람 음성 박테리아내로 자가 전달되어 당해 박테리아내에서 기능할 수 있음이 밝혀진 접합적으로 자가-전파가능한 플라스미드인 RK2로부터 유래된다. "헬퍼(helper)" 기능이 제2 플라스미드로부터 인 트랜스(in trans)로 공급되는 경우, 안정한 레플리콘(replicon)이며 접합적으로 전달될 수 있는, RK2의 보다 작은 유도체가 작제되었다. 하나의 이러한 플라스미드는 pFF1이다(참조: Durland et al., J. Bact. 1990;172:3859-3867). 당해 플라스미드의 일부 유용한 유도체가 기술되어 있으며; 이들 중 하나는 슈도모나스 TOL 플라스미드의 Pm 프로모터 및 조절 유전자 xylS를 가하여 다양한 그람 음성 박테리아내에서 기능하는 것으로 밝혀진 강력하고, 잘 조절된 프로모터를 제공하는 pJB653(참조: Blatny et al., Appl. Enviorn. Micro. 1997;63:370-379)이다. 이러한 벡터 및 관련된 작제물은 미국 특허 제6,258,565호의 대상이다. 다양한 IncQ-계 플라스미드 벡터가 슈도모나스 푸티다로부터 원래 분리된 8.7kb 플라스미드인 RSF1010로부터 유래된다. RSF1010은 에스케리키아 콜라이 및 광범위한 그람 음성 박테리아내에서 증식할 수 있다. Pm 프로모터 및 xylS 조절 단백질을 수반하는 RSF1010의 유도체가 작제되고 기술되어 있다. 플라스미드 pNM185(참조: Mermod et al., J. Bact. 1986;167:447-454)는 Pm 프로모터 및 xylS 조절 유전자를 수반하는 RSF1010 유도체이다.
슈만(Schumann) 등의 문헌(참조: Plasmid 2005;54:241-248)은 재조합 단백질의 안정한 세포내 발현을 허용하는 바실러스 서브틸리스를 위한 일련의 플라스미드-계 발현 벡터를 기술하였다. 이들 발현 벡터는 쎄타 환(theta circle)으로서 바실러스 서브틸리스내에서 복제하는 에스케리키아 콜라이-바실러스 서브틸리스 셔틀 벡터 pMTLBS72를 기초로 하며 결과적으로 롤링 환 메카니즘(rolling circle mechanism)을 통해 복제하는 pUB110과 같은 전형적인 바실러스 서브틸리스 플라스미드보다 더 안정하다. 구성적 프로모터 PlepA, 열 및 산 쇼크에 의해, 및 에탄올에 의해 유도될 수 있는 프로모터 PgsiB, 및 크실로즈 및 IPTG 각각의 첨가에 반응하는 PxylA 및 Pspac 프로모터를 함유하는 당해 플라스미드의 유도체가 기술되어 있다.
IhcP 및 IncQ 플라스미드와 양립성인 것으로 보고된 광범위한 숙주 범위 플라스미드 pBHR1(참조: Szpirer et al ., J. Bacteriol. 2001;183:2101-10)은 MoBiTec GmbH(독일 괴팅겐 소재)에서 구입하였다. 당해 플라스미드를 변형시켜 상기 참조된 Pm / xylS 발현 시스템을 사용하는 벡터(pDD54)를 생성하였다. pBHR1-계 발현 벡터를 작제하는데 있어서 제1 단계는 당해 플라스미드에 존재하는 카나마이신 내성(KanR) 유전자를 제거하는 것이었다. 이는, pBHRI 및 유도체의 접합적 전달을 지시하기 위해 사용될 수 있는 플라스미드인 pRK201301이, 또한 KanR 유전자를 보유하므로 바람직하였다. 또한, 이러한 유전자, 및 플랭킹 서열의 결실은 하기 설명한 특정의 후속적인 클로닝 단계를 촉진하였다. pBHR1은 또한 클로람페니콜-내성(CamR)을 부여하는 유전자를 보유하며 이 항생제가 당해 플라스미드를 선택하기 위해 카나마이신대신 사용될 수 있다. 플라스미드 DNA를 SbfI로 분해한 pBHR1(도 8a에 도해됨)으로부터 제조하고, 분해 생성물을 연결시키고 클로람페니콜-내성, 카나마이신-민감성 형질전환체에 대해 스크리닝함으로써 KanR 유전자를 함유하는 1.2 kb SbfI 단편을 결실시켰다. 하나의 이러한 형질전환체로부터의 플라스미드를 pDD39(참조: 도 8a)로 지정하고 추가의 작제 단계에서 사용하였다.
Pm 프로모터로부터의 발현을 양성적으로 조절하는, xylS 유전자를 PCR에 의해, 슈도모나스 푸티다(Pseudomonas putida) ATCC 33015로부터 제조된 pWW0(TOL 플라스미드) DNA로부터 증폭시켰다. 판매회사의 프로토콜에 따라 퀴아젠 플라스미드 미니 키트(제조원: QIAGEN Inc., 미국 캘리포니아주 발렌시아 소재)를 사용하여, 4㎍의 pWW0 DNA를 슈도모나스 푸티다 ATCC 33015의 20 mL의 새로운 밤샘 배양물로부터 분리하였다. 당해 DNA 제제를, xylS 유전자 및 플랭킹 DNA 서열을 후속적인 PCR 스플라이싱 반응에 의해 함께 후속적으로 연결되는 2개의 단편으로서 증폭시키는 PCR 반응을 위한 주형으로서 사용하였다. 당해 과정은 xylS의 해독 정지 코돈의 하부의 NsiI 부위 9개 염기 쌍의 첨가를 촉진하였다. PCR의 초기 라운드에서 1개의 반응(반응 A)은 프라이머 DHD197(서열 번호 103) 및 DHD201(서열 번호 104)을 사용하였고 제2 반응(반응 B)은 프라이머 DHD200(서열 번호 105) 및 DHD198(서열 번호 106)을 사용하였다. 이들 프라이머의 서열은 다음과 같다;
DHD197 5> GCACTGCAGATCCCCTTTATCCGCC >3 (서열 번호 103)
DHD198 5> GCACTGCAGATCCACATCCTTGAAGGC >3 (서열 번호 106)
DHD200 5> GATTACGAACGATGCATAGCCGAAGAAGGGATGGGTTG >3 (서열 번호 105)
DHD201 5> CTTCTTCGGCTATGCATCGTTCGTAATCAAGCCACTTCC >3 (서열 번호 104)
PCR 반응을 PfuUltra II 폴리머라제(제조원: Stratagene, 미국 캘리포니아 라 졸라 소재)를 사용하여 판매회사 프로토콜에 따라 수행하였다. 각각의 100μL의 반응물에서, 프라이머를 각각 0.4μM의 최종 농도로 가하고, dNTP를 각각 200μM의 최종 농도로 가하고 10 나노그람의 pWW0 DNA를 주형으로서 가하였다. PCR 반응을 퍼킨-엘머(Perkin-Elmer) GeneAmp 2400 열순환기 속에서 다음 주기 매개변수를 이용하여 수행하였다: 95℃에서 2분의 1 주기; 95℃에서 20초, 60℃에서 20초, 및 72℃에서 40초의 30 주기; 72℃에서 3분의 1주기를 사용하여 수행하고; 4℃에서 유지. 이들 반응의 생성물을 아가로즈 겔 전기영동으로 분석하였다. 관찰된 PCR 생성물의 크기는 반응 A(1259 bp) 및 반응 B(422 bp) 둘다의 생성물에 대해 예측된 크기와 일치하였다.
이들 반응의 생성물을 퀴아젠 퀴아퀵 PCR 정제 키트(Qiagen QIAquick PCR Purification Kit)(제조원; QIAGEN, 미국 캘리포니아주 발렌시아 소재)를 사용하여 판매회사의 프로토콜에 따라 정제하고, 각각 1μL를 1 mL의 멸균 증류된 탈이온수에 가하였다. 50μL의 당해 혼합물에 10μL의 10X PfuUltra II 반응 완충액, 10μL의 dNTPS의 스톡 용액(각각 10 mM), 10μL의 DHD197의 스톡 용액(4μM), 10μL의 DHD198의 스톡 용액(4μM), 16μL의 멸균 증류된 탈이온수 및 2μL의 PfuUltra II 폴리머라제를 가하였다. 당해 PCR 반응을 반응 A 및 B에 대해 위에서 기술한 과정을 사용하여 수행하였다. 당해 반응의 생성물을 퀴아젠 퀴아퀵 PCR 정제 키트(제조원: QIAGEN, 미국 캘리포니아주 발렌시아 소재)를 사용하여 판매회사 프로토콜에 따라 정제하고 아가로즈 겔 전기영동으로 분석하였다. 강력한 밴드가 PCR 스플라이싱 반응의 생성물의 예측된 크기, 1610 bp와 일치하는 위치에서 관찰되었다. 당해 밴드를 겔로부터 퀴아퀵 겔 추출 키트(QIAquick Gel Extraction Kit)(제조원: QIAGEN Inc., 미국 캘리포니아주 발렌시아가 소재)를 사용하여 판매회사 프로토콜에 따라 잘라냈다.
당해 PCR 단편을 pCR-Blunt II-TOPO 클로닝 벡터(제조원: Invitrogen, 미국 캘리포니아주 칼스바드 소재)내로 판매회사 프로토콜에 따라 클로닝하였다. 수득되는 플라스미드를 pDD42로 지정하였으며 도 8a에 도해한다. PCR 프라이머 DHD197 및 DHD198은 1610 bp PCR 단편의 각각의 말단으로부터 3개 염기쌍에 PstI 부위를 가하였다. pDD42내 PstI 단편의 서열을 측정하였다(서열 번호 107). 당해 서열은 보고된 pWWO 서열(GenBank, AJ344068)에 기초하여 xylS 유전자에 대해 예측된 서열과 일치하였으며, xylS의 해독 정지 코돈의 하부(3') 9개 염기 쌍에서 Nsil 부위를 생성하는, 프라이머 DHD200 및 DHD201로부터 유래된 5개 염기 쌍의 첨가를 나타내었다. xylS의 하부 비-코딩 영역에서, 2개의 서열 차이가 pDD42내 클로닝된 PstI 단편과 GenBank, AJ344068에서 보고된 서열 사이에서 관찰되었다. G 잔기의 삽입은 xylS 유전자의 TGA 정지 코돈에 대해 3' 방향으로 119 및 181 bp에서 관찰된다. 이들 서열 차이는 xylS 유전자와 xylH 유전자 사이의 유전자간 영역내에서 발생한다.
xylS 유전자를 함유하는 PstI 단편을 pDD42으로부터 절개하고, 젤-정제하고 pDD39의 SbfI 부위내로 클로닝하였다. PstI 및 SbfI 효소는 함께 연결될 수 있는 동일한 4bp의 오버행(overhang)을 갖는 분해 생성물을 생성하지만, SbfI 인식 부위는 생성되는 재조합체내에서 파괴된다. pDD42로부터의 PstI 단편 위에 함유된 xylS 유전자를 함유하는 pDD39 유도체는 pDD47로 명명하며 도 8a에 나타낸다.
RNA 폴리머라제의 결합에 요구되는 최소의 Pm 프로모터 서열 및 XylS 단백질(참조: Dominguez-Cuevas et al., 2008)과 합성 상부 및 하부 전사 종결인자 및 Pm 프로모터의 바로 하부의 유전자를 클로닝하기 위한 다수의 제한 부위에 걸친 대략 90bp의 TOL 플라스미드 DNA 서열을 포함하는 470bp DNA 단편(서열 번호 79)을 DNA 2.0(Carlsbad, CA)에 의해 새로이(de novo) 합성하였다. 도 8b는 DNA 2.0 pJ201 벡터내에 클로닝된 당해 470bp 단편을 함유하는 pJ201:11352를 나타낸다. 프로모터-함유 단편을 플랭킹 AccI 부위로 설계하여 pBHR1 및 유도체 pDD47 플라스미드내에 위치한 양립성의, 및 추정상, 유일한 BstB I 부위내로 클로닝되도록 하였다. 그러나, pDD47, 및 후속적으로 pBHR1의 분해는 2개의 BstBI 부위의 존재를 나타내었다. 분명히, 문헌(참조: GenBank: Y14439.1)에 보고된 pBHR1의 서열은 전체적으로 정확하지 않다. 이러한 차이로 인하여, 클로닝된 Pm 프로모터를 pDD47에 가하기 위해 추가의 클로닝 단계가 요구되었다.
도 8a에 나타낸 바와 같이, pDD47은 프로모터의 삽입을 위해 표적화된 주석이 달린 BstBI 부위를 플랭킹하는 유일한 EcoRI 및 AgeI 부위를 함유한다. 이는 또한 AgeI 부위의 하부의 NgoM IV 부위를 함유한다. pDD47의 763 bp EcoRI-NgoMIV 단편을 잘라내어 pREZ6를 절단한 EcoRI-NgoMIV내로 클로닝함으로써 pDD49를 생성하였다(도 8b). 또한 도 8b에 도해된 pREZ6은 pBluescript SK+(제조원: Stratagene, 미국 캘리포니아주 라 졸라 소재)의 유도체이며, 여기서 짧은 폴리링커 서열(ttaattaagggtttaaactac(서열 번호 142))은 pBluescript SK+의 유일한 DraIII 부위에서 삽입되었다. 당해 작제물에서, 목적한 BstBI는 유일하므로, Pm 프로모터를 함유하는 pJ201:11352의 AccI 단편을 잘라내어 pDD49의 BstBI 부위내로 클로닝함으로써 pDD50을 생성하였다. 후속적으로, pDD50의 EcoRI-AgeI 단편을 잘라내어 pDD47의 5055 bp EcoRI-AgeI 단편에 연결함으로써 도 8c에 나타낸 발현 벡터 pDD54를 생성하였다. pDD54를 하기 및 실시예 6, 7, 8 및 9에 기술된 바와 같이 대체 숙주로 전달하여 발현시키기 위한 K4 캡슐 유전자의 초기 클로닝에서 발현 벡터로서 사용하였다.
3개의 합성 유전자 단편 kpsFEDUCS(FS 분절), kpsMTkfoABCFG(MG 분절) 및 kfoDIEH(DH 분절)은 합성 판매회사, DNA2.0(미국 캘리포니아주 칼스바드 소재)로부터 입수하였다. 합성 DNA는 플라스미드 벡터, pJ241내에서 클로닝된 단편으로서 제공되었다. 도 8d는 이들 작제물의 플라스미드 도해를 나타낸다. 합성 유전자를 pDD54내에 후속적으로 클로닝되는 단일 오페론으로 조립하였다. 당해 공정에서 제1 단계는 FS 및 MG 분절을 단일 단편으로 조합시키는 것이었다. FS 분절과 MG 분절을 플라스미드 벡터, pJ241 상에 상이한 순열로 조합시킨 2개의 플라스미드를 작제하였다.
플라스미드 pJ241:10662 및 pJ241:10664의 분취량을 SbfI + BglII로 분해하고, 알칼린 포스파타제로 처리하고 QIAEX II 겔 추출 키트(제조원: Qiagen Inc., 미국 캘리포니아주 발렌시아 소재)를 사용하여 판매업자의 프로토콜에 따라 겔-정제하였다. 이와 동시에, pJ241:10662 및 pJ241:10664 DNA의 분취량을 SbfI 및 BamHI로 분해하고 수득되는 합성 MG 및 FS 유전자 분절을 각각 함유하는 대략 9.1 kb 및 대략 8.0 kb의 SbfI-BamHI 단편을 상기와 같이 겔-정제하였다. 겔-정제된 대략 9.1 kb의 SbfI-BamHI MG 분절을 FS 유전자 분절을 함유하는 SbfI 및 BglII 분해되고 포스파타제처리된 pJ241:10664 벡터내로 연결하였다. 비록 BamH I 및 BglII 효소는 상이한 서열, GGATCC 대 AGATCT 각각을 인식하지만, 이들은 동일한 4 bp 오버행(GATC) 을 생산하므로 분해 생성물을 함께 연결할 수 있으나 수득되는 연결 생성물은 후속적으로 효소에 의해 인식될 수 없다. pDD37로 지정된, 수득되는 재조합 플라스미드는 도 8e에 나타낸다. 당해 작제물은 합성 유전자에 대해 5'에 SbfI 및 합성 유전자에 대해 3'에 pJ241:10664내에 존재하는 BamHI 부위를 보유한다. 따라서, 합성 유전자 세트 kpsMTkfoABCFGkpsFEDUCS(MGFS 분절)을 대략 17.1kb의 SbfI-BamHI 단편으로 잘라낼 수 있다. 유사하게, 겔-정제된 SbfI-BamHI 대략 8.0 kb FS 분절을, MG 유전자 분절을 함유하는, SbfI 및 BglII 분해되고, 포스파타제 처리된 pJ241:10662 벡터내로 연결하였다. pDD38로 지정된 수득되는 재조합 플라스미드는 도 8e에 나타낸다. 다시, 당해 작제물은 합성 유전자에 대해 5' 에 SbfI 부위 및 합성 유전자에 대해 3'에 pJ241:10662내에 존재하는 BamHI를 보유한다. 따라서, 당해 합성 유전자 세트, kpsFEDUCSkpsMTkfoABCFG(FSMG 분절)은 대략 17.1kb의 SbfI-BamHI 분절로 잘라낼 수 있다.
pJ241:10663에 함유된 합성 유전자 kfoD, kfoI(또는 orf3), kfoE 및 kfoH(또는 orf1)(DH 분절)(참조: 도 8d)를 플라스미드 pDD37 및 pDD38내로 클로닝하였다. 플라스미드 pDD37 및 pDD38을 EcoRI으로 분해하고, 알칼린 포스파타제로 처리하고 QIAEX II 겔 추출 키트(제조원: Qiagen Inc., 미국 캘리포니아주 발렌시아 소재)를 사용하여 판매회사 프로토콜에 따라 겔-정제하였다. 이들 플라스미드 각각에서 유일한 EcoRI 부위는 kfoC 및 kfoF를 분리하는 유전자간 영역내에 위치한다. 합성 유전자 kfoD, kfoI, kfoE 및 kfoH를 함유하는 DH 분절은 pJ241:10663로부터 대략 4.2 kb EcoRI 단편으로서 잘라내고 겔-정제하였다. 당해 단편을 EcoRI-절단되고 포스파타제 처리된 pDD37 및 pDD38 플라스미드 둘다내로 연결시켰다. 수득되는 재조합체를 진단 제한 효소로 절단함으로써 대략 4.2 kb EcoRI 단편의 배향에 대해 시험하였다. 정확한 배향으로 첨가된 DH 분절을 함유한 재조합체가 용이하게 수득되었다. 수득되는 플라스미드, pDD37로부터 유래된 pDD51, 및 pDD38로부터 유래된 pDD52를 도 8f에 나타낸다. 이들 작제물 각각은 K4 캡슐 클러스터 유전자 모두를 함유하지만, 나타낸 바와 같이, 유전자 순서는 2개 플라스미드에 대해 상이하다: pDD51에서 유전자 순서는 kpsMTkfoABCDIEHFGkpsFEDUCS이고, pDD52에서 그 순서는 kpsFEDUCSkpsMTkfoABCDIEHFG이다. 둘다의 경우에서 전체 K4 유전자 세트는 대략 21kb의 SbfI-BamHI 단편으로서 잘라낼 수 있다. 이들 플라스미드로부터의 K4 캡슐 유전자를 위에서 기술한 발현 벡터 pDD54내로 서브클로닝하여 발현 플라스미드 pDD57 및 pDD58을 각각 생성하였다. 이들 플라스미드 둘다는 도 8g에 나타낸다. 전체 합성 K4 캡슐 유전자 세트를 pDD51 및 pDD52로부터 대략 21 kb SbfI-BamHI 단편으로서 잘라내고, QIAEX II 겔 추출 키트(제조원: Qiagen Inc., 미국 캘리포니아주 발렌시아 소재)를 사용하여 판매업자의 프로토콜에 따라 겔-정제하고 SbfI-BamHI 분해된 pDD54내로 클로닝하였다.
pDD57 및 pDD58에서 전체 K4 캡슐 유전자 세트(17개 유전자)는 Pm 프로모터 및 xylS 유전자에 의해 코딩된 XylS 조절 단백질의 조절하에 있다. pDD54 및 pDD58 플라스미드는, 유전자 클로닝을 위한 이의 용도를 향상시키는 다수의 돌연변이를 포함하는 시판되는 에스케리키아 콜라이 "TOP10" 균주"(제조원: Invitrogen, 미국 캘리포니아주 칼스바드 소재)내에서 원래 작제되었다. 당해 플라스미드를 또한 일반적으로 재조합 DNA 실험에 사용되는 다른 에스케리키아 콜라이 숙주("DH5a")내로 후속적으로 전달하였다. 이들 에스케리키아 콜라이 균주는 생산 플랫포옴(platform)으로서 개발을 위한 이상적인 후보물이 아니다. 따라서, 초기 실험에서, pDD54 및 pDD58을 보다 적합한 에스케리키아 콜라이-12 균주내로 형질전환시키고 수득되는 균주를 실시예 6에서 하기 기술된 바와 같이 콘드로이틴 생산에 대해 시험하였다.
추가의 발현 플라스미드를 또한 pDD57 및 pDD58의 변형으로 작제하였다. 테트라사이클린-내성 유전자를 하기 설명한 바와 같이 발현 플라스미드 pDD57 및 pDD58에 가하였다. 테트라사이클린-내성은 플라스미드 도입 및 유지를 위한 선택으로서 잠재적으로 2가지 장점을 갖는다. 첫째는, 테트라사이클린-내성(TcR)은, 내성 메카니즘이 세포 밖으로 항생제의 수송에 기초하며, 클로람페니콜 및 많은 다른 항생체의 경우에서와 같이, 항생제의 불활성화에 기초하지 않기 때문에 플라스미드 유지에 대한 전형적으로 더욱 엄격한 선택이다. 따라서, 배양 배지 속에서 선택제의 효과적인 농도는 세포 성장 및 대사에 의해 변경되지 않는다. 둘째로, 테트라사이클린에 대해 내성을 부여하는 자발적인 염색체 돌연변이는 일반적이지 않으며, 잔토모나스 캄페스트리스에서 관찰되지 않았다. 대조적으로, 클로람페니콜에 대해 내성을 부여하는 자발적인 염색제 돌연변이가 실시예 6에 기술된 것들과 같은 플라스미드 전달 실험에서 잔토모나스 캄페스트리스에서 관찰되었다. 이들 돌연변이는 pDD57 또는 pDD58와 같은, 목적한 플라스미드를 획득한 CmR 형질전환체/외부-접합체를 잠재적으로 모호하게 할 수 있다.
발현 플라스미드 pDD57 및 pDD58은 테트라사이클린-내성(TcR)의 특성을 부여하는 유전자의 첨가로 변형된 반면, 당해 플라스미드의 클로람페니콜-내성(CmR) 특성은 유지되었다. 플라스미드 pCX027(실시예 3 및 상기 도 7b에 기술됨)에 존재하고, 에스케리키아 콜라이 플라스미드 벡터 pBR322내에 존재하는 테트라사이클린-내성 유전자(tetR)를 PCR로 증폭시켜 pDD57 및 pDD58에 존재하는 유일한 BamHI 부위내로 클로닝하였다. tetR 유전자를 증폭시키고 클로닝하는 공정에서, 당해 유전자를 다음과 같이 변형시켰다. PCR 프라이머는 프로모터의 상부의 tetR 유전자의 5' 말단에서 BglII 부위를, 그리고 tetR 정지 코돈의 3'에 BamHI 부위를 추가하였다. 프라이머는 유전자를 추가로 변형시켜 내부 BamHI 부위(단백질의 아미노산 서열을 변화시키지 않음)를 제거하고 증폭되었던 단편에 일반적으로 존재하는 소위 "항-tet" 프로모터를 제거하였다. 당해 프로모터는 tetR 프로모터 근처에 위치하나 반대 방향으로 전사를 지시한다(참조: Balbas et al., Gene 1986;50:3-40). 이러한 변형된 tetR 유전자는 tetR 유전자의 2개의 중첩 분절을 증폭시켜 바람직한 서열 변화를 도입한 2회의 PCR 반응을 수행함으로써 생성하였다. 후속적으로, 이들 2개 단편을 후속적인 PCR 스플라이싱(splicing) 반응에 의해 함께 결합하여, tetR 유전자 및 프로모터의 상부의 tetR 유전자의 5' 말단에서 BglII 부위를 갖는 바람직한 서열의 프로모터 영역, 및 tetR 해독 정지 코돈에 대해 3'에 BamHI 부위를 생성하였다.
제1 PCR 반응(반응 A)은 프라이머 DHD218(서열 번호 113) 및 DHD219(서열 번호 114)를 사용하여 tetR 코딩 서열 및 상부 프로모터 서열의 아미노-말단 부위를 포함하는 대략 400 bp의 DNA를 증폭시켰다. 제2 반응(반응 B)은 프라이머 DHD220(서열 번호 115) 및 DHD221(서열 번호 116)을 사용하여 tetR 코딩 서열의 나머지 및 해독 정지 코돈을 포함하는 대략 900 bp의 DNA를 증폭시켰다. 이들 프라이머의 서열들은 다음과 같이 하기에 나타낸다. DHD218내에 나타낸 밑줄친 서열은 pCX027내에 존재하는 서열 ATCGATAAGCTT(서열 번호 141의 핵산 2843 내지 2854)을 대체하며, 이를 수행함으로써 tetR 프로모터 영역내에 위치한 ClaI 및 HindIII 부위를 제거하고 항-tet 프로모터의 -10 영역의 서열을 변화시킨다. DHD219 및 DHD220의 상보적인 밑줄친 서열은 pCX027의 tetR 유전자의 BamHI 부위를 제거하는 사일런트 돌연변이를 생성한다. 당해 돌연변이는 CTC 루이신 코돈을 TTG 루이신 코돈으로 변화시키므로 TetR 단백질의 아미노산 서열을 변경시키지 않는다.
DHD218 5> GCGAGATCTCATGTTTGACAGCTTATCATCGCTCGGCTTTAATGC
GGTAGTTTATCAC >3 (서열 번호 113)
DHD219 5> CCGGCGTACAAGATCCACAGGACGGGTGTG >3 (서열 번호 114)
DHD220 5> CTGTGGATCTTGTACGCCGGACGCATCGTG >3 (서열 번호 115)
DHD221 5> GCGGATCCTTCCATTCAGGTCGAGGTG >3 (서열 번호 116)
PCR 반응 A 및 B를 PfuUltra II 폴리머라제(제조원: Stratagnen, 미국 캘리포니아주 라 졸라 소재)를 사용하여 수행하였다. 각각 40μL의 반응물에, Pfu 반응 완충액(판매회사에 의해 제공됨)을 1X의 최종 농도로 가하고, 프라이머를 각각 0.4μM의 최종 농도로 가하고, dNTP를 각각 200μM의 최종 농도로 가하며, 1 ng의 pCX027 플라스미드 DNA를 주형으로 가하고 2.5 단위의 PfuUltra II 폴리머라제를 가하였다. PCR 반응 A 및 B를 RoboCycler® 구배 96 열순환기(제조원: Stratagene, 미국 캘리포니아주 라 졸라 소재) 속에서 다음의 주기 매개변수를 사용하여 수행하였다: 95℃에서 1분의 1주기; 95℃에서 30초, 55℃에서 30초, 및 72℃에서 30초의 30 주기; 및 72℃에서 5분의 1 주기; 및 6℃에서 유지. 이들 반응의 생성물을 퀴아젠 퀴아퀵 PCR 정제 키트(제조원: QIAGEN, 미국 캘리포니아주 발렌시아 소재)를 사용하여 판매회사 프로토콜에 따라 정제하고, 아가로즈 겔 전기영동으로 분석하였다. 관찰된 PCR 생성물의 크기는 반응 A(395 bp) 및 반응 B(920 bp) 둘다의 생성물에 대한 예측된 크기와 일치하였다. 이들 단편을 겔로부터 잘라내고 겔 슬라이스로부터 퀴아퀵 겔 추출 키트(제조원: QIAGEN Inc., 미국 캘리포니아주 발렌시아 소재)를 사용하여 판매회사 프로토콜에 따라 용출시키고 30μL의 EB 용출 완충액 속에 회수하였다. 겔-정제된 단편을 후속적인 PCR 스플라이싱 반응: 반응 SP에서 주형으로 제공하였다. 50 μL의 반응물에서, Pfu 반응 완충액을 1X의 최종 농도로 가하고, 프라이머를 각각 0.4μM의 최종 농도로 가하고, dNTP를 각각 200μM의 최종 농도에서 가하고, 반응물 A 및 B의 3μL의 겔-정제된 반응 생성물 각각을 주형으로서 가하고 2.5 단위의 PfuUltra II 폴리머라제를 가하였다. PCR 반응 SP를 RoboCycler® 구배 96 열순환기(제조원: Stratagene, 미국 캘리포니아주 라 졸라 소재) 속에서 다음의 주기 매개변수를 사용하여 수행하였다: 95℃에서 1분의 1 주기; 95℃에서 30초, 55℃에서 30초, 및 72℃에서 30초의 30 주기; 72℃에서 5분의 1 주기; 및 6℃에서 유지. 당해 반응의 생성물을 퀴아젠 퀴아퀵 PCR 정제 키트(제조원: QIAGEN, 미국 캘리포니아주 발렌시아 소재)를 사용하여 판매회사의 프로토콜에 따라 정제하고 아가로즈 겔 전기영동으로 분석하였다. 강력한 밴드가 PCR 스플라이싱 반응의 생성물의 예측된 크기, 1295bp와 일치하는 위치에서 관찰되었다.
당해 PCR 생성물을 BglII 및 BamHI로 분해하고 BamHI-분해된 pDD57 및 pDD58과 연결하였다. 연결 생성물을 사용하여 에스케리키아 콜라이 TOP10(제조원: Invitrogen, 미국 캘리포니아주 칼스바드 소재)를 형질전환시키고 테트라사이클린 내성을 획득한 형질전환체를 10㎍/mL 테트라사이클린을 함유하는 LB 플레이트 위에서 30℃에서 플레이팅하여 선택하였다. 수득되는 테트라사이클린-내성 형질전환체를 진단 PCR 반응으로 스크리닝하고 제한 분해하여 tetR 유전자의 존재를 확인하고 이의 배향을 측정하였다. 바람직한 구조를 갖는 플라스미드를 확인하고 pDD61(pDD57::tetR)(서열 번호 143) 및 pDD62(pDD58::tetR)(서열 번호 144)로 지정하였다. 당해 플라스미드의 도해는 도 8h에 나타낸다. tetR 유전자의 유사한 삽입을 벡터 pDD54의 BamHI 부위내로 수행하여 pDD63을 생성하였으며; 도 8i에 나타내었다. 당해 플라스미드는 클로닝된 K4 유전자를 발현하는 TcR 플라스미드 중 어느 것을 사용한 실험을 위한 TcR 벡터-유일 대조군으로서 제공할 수 있다.
합성 유전자 세트는 생성시킬 목적한 임의의 유전자(들)의 비-극성 결실을 허용하는 제한 부위를 함유한다. 4개 유전자 kfoDIEH의 세트는 단일의 4.2 kb EcoRI 단편의 결실에 의해 결실시켰다. 당해 4.2 kb EcoRI 단편을 발현 플라스미드 pDD57 및 pDD58로부터 및 상기 기술된 이들의 각각의 TcR 유도체, pDD61 및 pDD62로부터 결실시켰다. 도 8g 및 8h에 나타낸, 이들 4개의 플라스미드 모두는 3개의 EcoRI 부위를 함유한다. 2개 부위는 목적한 4.2 kb 단편을 정의하며 제3 부위는 클로람페니콜-내성(CmR)을 부여하는 플라스미드 유전자의 코딩 서열내에서 분해한다. 이들 플라스미드 각각을 EcoRI를 사용하여 완전히 분해하고 수득되는 분해 생성물을 재연결하였다. 연결 생성물을 사용한 형질전환 후, CmR 형질전환체를 선택하고 제한 엔도뉴클레아제 분해로 분석하였다. 4.2 kb EcoRI 단편을 결실한 플라스미드를 모든 예에서 용이하게 수득하였다. 플라스미드 pDD59, pDD60, pDD67 및 pDD66은 각각 pDD57, pDD58, pDD61 및 pDD62의 4.2 kb EcoRI 단편 결실 유도체이며, 모두는 kfoDIEH 유전자가 결실되어 있다. 이들 플라스미드는 도 8j에 묘사한다.
클로닝된 K4 유전자의 발현의 웨스턴 블롯 분석(하기 실시예 5 참조)은, pDD66을 함유하는 에스케리키아 콜라이 균주에서, kpsFEDUCS 유전자의 발현이 최적 미만이었음을 나타내었다. 따라서, pDD66을 변형시켜 kfoG와 kpsF 사이의 유전자내 영역내에 프로모터(Pm)를 혼입시켰다. pDD66에서, 당해 유전자간 영역은 도 8k에 나타낸 바와 같이 유일한 PacI 부위 및 2개의 ClaI 부위를 함유한다. PacI 및 ClaI를 사용한 분해는 2개 단편인 34 bp ClaI 단편 및 12 bp ClaI-PacI 단편을 절개하여 ClaI 및 PacI 말단을 갖는 보다 큰 벡터 단편을 남긴다. 다음 서열:
TTAATTAATGTTTCTGTTGCATAAAGCCTAAGGGGTAGGCCTTTCTAGAGATAGCCATTTTTTGCACTCCTGTATCCGCTTCTTGCAAGGCTGGACTTATCCCTATCAAACCGGACACTGCATCGAT(서열 번호 80)을 갖는 127 bp PacI-ClaI DNA 단편을 ClaI-PacI 분해된 pDD66 벡터 단편내로 삽입하여 pBR1052를 생성하였다. 추가된 127 bp PacI-ClaI 단편은 Pm 프로모터 서열의 카피를 포함한다. 도 8k에 나타낸 바와 같이, pBR1052에서 Pm 프로모터의 첨가된 카피는, 당해 프로모터에서 전사 개시가 kpsFEDUCS 유전자를 포함하는 RNA 전사체를 생성할 수 있도록 배향된다.
발현 플라스미드인 pDD66 및 pBR1052는 하기 기술되어 있다. K4 콘드로이틴 생합성 유전자를 염색체 내로 삽입시키기 위한 유전자 대체 벡터를 작제하기 위하여(하기 실시예 10에서 기술된 바와 같음), pDD66 및 pBR1052로부터의 K4 콘드로이틴 생합성 유전자를 실시예 3에서 상기 기술된 pMAK-CL 대체 벡터내로 클로닝하였다. 도 8l에 도해된 pMAK-CL 벡터는 콜란산(CA) 유전자 클러스터의 상부 및 하부의 클로닝된 DNA 영역 및 이들 영역의 연결부에서 유일한 AscI 클로닝 부위를 함유한다. 실시예 3에 설명되어 있는 바와 같이, 당해 벡터를 사용하여 에스케리키아 콜라이 K-12 W3110내에서 전체 CA 유전자 클러스터의 결실을 작제하여 균주 MSC188을 생성하였다. K4 유전자 발현 카세트를 잘라내고 QIAEX II 겔 추출 키트(제조원: Qiagen Inc., 미국 캘리포니아주 발렌시아 소재)를 사용하여 판매회사 프로토콜에 따라 pDD66 및 pBR1052로 부터 대략 19 kb AscI 단편으로서 겔-정제하고 이들 단편을 AscI-분해되고, 포스파타제-처리되며 겔-정제된 pMAK-CL DNA와 연결하였다. 형질전환체를 테트라사이클린에 대한 내성에 대해 선택하였다. 테트라사이클린에 대한 내성을 부여하는 유전자는 pDD66 및 pBR1052의 AscI 단편 상에, Pm 프로모터 및 상부와 하부 전사 종결인자 서열과 함께 존재한다. pBR1052 또는 pDD66의 AscI 단편을 함유한 pMAK-CL의 유도체를 확인하여 각각 pDD74 및 pDD76으로 지정하였다. 이들 플라스미드는 도 8l에 도해되어 있다.
에스케리키아 콜라이 fhuA 유전자의 상부(5') 및 하부(3')의 DNA 영역을 PCR로 클로닝하고, 조립하고 서열분석하였으며, 당해 결실 단편을 pMAK705 자살 플라스미드내로 이동시켜 pMAK705-△fluA, 또는 pDD73으로 명명된 fluA 유전자좌에 대한 대체 벡터를 생성하였다(도 8m). fhuA 유전자의 상부 및 하부의 DNA 분절을 에스케리키아 콜라이 K-12 균주 W3110로부터 제조한 게놈 DNA로부터 PCR에 의해 증폭시키고(참조: 실시예 3) 이들 2개 단편을 후속적인 PCR 스플라이싱 반응에 의해 후속적으로 함께 결합시켰다. 당해 과정은 DNA 분절의 상부 및 하부의 연결부에서 PstI 부위의 첨가를 촉진시켰다.
PCR의 초기 라운드에서 1개의 반응(반응 A)는 프라이머 DHD236(서열 번호 108) 및 DHD237-S(서열 번호 109)를 사용하여 fhuA 유전자의 상부 대략 800 bp DNA를 증폭시켰으며 제2 반응(반응 B)은 프라이머 DHD238-S(서열 번호 110) 및 DHD239(서열 번호 111)를 사용하여 fhuA 유전자의 하부 대략 950 bp의 DNA를 증폭시켰다. 이들 프라이머의 서열은 다음과 같다:
DHD236 5>CGCAAGCTTCGTACCGAAAGATCAGTTGC>3 (서열 번호 108)
DHD237-S 5>CCAAAAGAGAAATCTGCAGTAGATGGGATGTTATTTTACCG>3 (서열 번호109)
DHD238-S 5>ACATCCCATCTACTGCAGATTTCTCTTTTGGGGCACGG>3 (서열 번호110)
DHA239 5> GCTCTAGACATCTGCCATAACAACGGAG >3 (서열 번호 111)
PCR 반응 A를 PfuUltra II 폴리머라제(제조원: Stratagene, 미국 캘리포니아주 라 졸라 소재)를 사용하여 수행하였다. 50μL의 반응물에서, Pfu 반응 완충액(판매회사에 의해 공급됨)을 1X의 최종 농도로 가하고, 프라이머를 0.4μM 각각의 최종 농도로 가하며, dNTP를 200μM 각각의 최종 농도로 가하고, 50 ng의 W3110 게놈 DNA를 주형으로서 가하고 2.5 단위의 PfuUltra II 폴리머라제를 가하였다. PCR 반응 A를 RoboCycler® 구배 96 열순환기(제조원: Stratagene, 미국 캘리포니아주 라 졸라 소재) 속에서 다음의 주기 매개변수를 사용하여 수행하였다: 95℃에서 1분의 1주기; 95℃에서 1분, 55℃에서 1분, 및 72℃에서 1분의 30 주기; 72℃에서 4분의 1주기; 및 6℃에서 유지.
PCR 반응 B는 헤르큘라제 폴리머라제(제조원: Stratagene, 미국 캘리포니아주 라 졸라 소재)를 사용하여 수행하였다. 50μL의 반응물 속에, 헤르쿨라제 반응 완충액(판매회사에 의해 공급됨)을 1X의 최종 농도로 가하고, 프라이머를 각각 0.4μM의 최종 농도로 가하고, dNTP를 각각 200μM의 최종 농도로 가하며, 25 ng의 W3110 게놈 DNA를 주형으로서 가하고 2.5 단위의 헤르쿨라제 폴리머라제를 가하였다. PCR 반응 B를 RoboCycler® 구배 96 열순환기(제조원: Stratagene, 미국 캘리포니아주 라 졸라 소재) 속에서 다음의 주기 매개변수를 사용하여 수행하였다: 92℃에서 2분의 1주기; 95℃에서 30초, 50℃에서 30초, 및 72℃에서 1분의 33 주기; 68℃에서 10분의 1 주기; 및 6℃에서 유지.
이들 반응의 생성물을 퀴아젠 퀴아퀵 PCR 정제 키트(제조원: QIAGEN, 미국 캘리포니아주 발렌시아 소재)을 사용하여 판매회사의 프로토콜에 따라 정제하고, 아가로즈 겔 전기영동으로 분석하였다. 관찰된 PCR 생성물의 크기는 반응 A(832 bp) 및 반응 B(949 bp) 둘다의 생성물에 대한 예측된 크기와 일치하였다. 이들 단편을 겔로부터 잘라내고 퀴아퀵 겔 추출 키트(제조원: QIAGEN Inc., 미국 캘리포니아주 발렌시아 소재)를 사용하여 판매회사 프로토콜에 따라 용출시키고 30μL의 EB 용출 완충액 속에 회수하였다. 겔-정제된 단편을 후속적인 PCR 스플라이싱 반응; 반응 SP에서 주형으로 제공하였다. 50μL의 반응물에서, Pfu 반응 완충액을 1X의 최종 농도로 가하고, 프라이머를 각각 0.4 μM의 최종 농도로 가하며, dNTP를 각각 200μM의 최종 농도로 가하고, 반응 A 및 B의 3μL의 각각의 겔-정제된 반응 생성물을 주형으로 가하고 2.5 단위의 PfuUltra II 폴리머라제를 가하였다. PCR 반응 SP를 RoboCycler® 구배 96 열순환기(제조원: Stratagene, 미국 캘리포니아주 라 졸라 소재) 속에서 다음의 주기 매개변수를 사용하여 수행하였다. 95℃에서 1분의 1주기; 95℃에서 30초, 60℃에서 30초, 및 72℃에서 40초의 33 주기; 72℃에서 5분의 1주기; 및 6℃에서 유지. 당해 반응 생성물을 아가로즈 겔 전기영동으로 분석하였다. 강력한 밴드가 PCR 스플라이싱 반응의 생성물의 예측된 크기, 1750 bp와 일치하는 위치에서 관찰되었다. 당해 밴드를 겔로부터 퀴아퀵 겔 추출 키트(QIAGEN Inc., 미국 캘리포니아주 발렌시아 소재)를 사용하여 판매회사 프로토콜에 따라 잘라냈다. 이후에, 당해 단편을 pCR-Blunt II-TOPO 클로닝 벡터(제조원: Invitrogen, 미국 캘리포니아주 칼스바드 소재)내로 판매회사 프로토콜에 따라 클로닝하고 클로닝된 PstI 단편의 서열을 측정하였다(서열 번호 112).
당해 서열은 W3110(GenBank, AP009048)에 대한 보고된 게놈 서열을 기초로 fhuA 유전자의 상부 및 하부 DNA 분절에 대한 예측된 서열과 일치하였으며, 상부 및 하부 분절의 연결부에서 프라이머 DHD237-S 및 DHD238-S로부터 유래된 6 bp PstI 부위의 첨가를 나타내었다. 프라이머 DHD236 및 DHD239 각각으로부터 유래된, 상부 DNA 분절의 5' 말단에서 HindIII 부위 및 하부 DNA 분절의 3' 말단에서 XbaI 부위의 첨가가 또한 확인되었다. 서열-확인된 PCR 단편을 pCR-Blunt II-TOPO 벡터로부터 잘라내고 1739 bp의 HindIII-XbaI 단편으로서 겔-정제하고 온도-민감성 pMAK705 벡터(참조: 실시예 3)에 연결하고 이를 HindIII 및 XbaI로 분해하여 안트악틱 포스파타제(제조원: New England BioLabs, 미국 메사추세츠주 입스위치 소재)로 판매회사 프로토콜에 따라 처리하였다. 연결 생성물을 사용하여 에스케리키아 콜라이 NEB5α(제조원: New England BioLabs, 미국 메사추세츠주 입스위치 소재)를 형질전환시키고 pMAK705 복제를 위해 허용된 온도인, 30℃에서의 플레이팅으로부터 수득된 클로람페니콜-내성 형질전환체를 PstI, 및 XbaI와 HindIII로 분해하여 분석함으로써, 에스케리키아 콜라이 fhuA 유전자의 상부 및 하부의 클로닝된 DNA 영역을 함유하는 1739 XbaI-HindIII bp 단편을 보유하는 재조합체를 확인하였다. 하나의 이러한 재조합 플라스미드를 pDD73(도 8m)로 지정하고 후속적인 실험에 사용하였다.
xylS 조절 유전자를 다음과 같이 pDD73 대체 벡터내로 클로닝하였다. xylS 유전자를 pDD42로부터 PstI 단편으로서 잘라내고 pDD73의 PstI 부위내로 클로닝하여 pDD77를 생성시키고, 이를 도 8n에 도해한다. xylS 유전자를 함유하는 pDD77의 PstI 단편은 발현 플라스미드 pDD66 및 pBR1052, 모벡터 pDD54 및 pDD54의 테트라사이클린 내성 유도체인 pDD63내에 존재하는 xylS-함유 PstI 단편과 동일하다.
하기 실시예 10에 설명되어 있는 바와 같이, xylS 유전자 프로모터의 합성 최적화된 버젼, 리보소옴 결합 부위, 및 5' 해독되지 않은 영역(UTR)을 설계하여 합성하고, 이들 변형된 서열을 xylS 대체 벡터 pDD77내로 도입한 후 염색체 내로 도입하였다. 257 bp BlpI-BglII 단편(서열 번호 140)은 상업적인 판매회사(DNA2.0)에 의해 합성되었으며, 변형된 서열을 함유하는 합성 DNA를, 천연의 xylS 조절 서열을 함유하는 천연의 Blp I-Bgl II 단편 대신 Blp I-Bgl II 단편으로서, xylS 대체 벡터, pDD77내로 클로닝하였다. 변형된 xylS를 함유하는 플라스미드를 pDD79(도 8n)로 명명하였다.
대체 벡터는 kfoABCFG 유전자 분절의 카피를 에스케리키아 콜라이 K-12 염색체 내로 fhuA 유전자좌에서 삽입시키기 위해 작제하였다. kfoABCFG 유전자 분절(Pm 프로모터 부재)을 pCX039로부터 PstI 단편상에서 잘라내고 당해 단편을 당해 플라스미드내에 유일한 pDD79의 양립성 NsiI 부위내로 클로닝하였다. 수득되는 플라스미드, pDD80(도 8o)에서, kfoABCFG 유전자는 강력한 구성적 프로모터가 되도록 설계되었던, 합성 xylS 프로모터에 의해 전사된다.
pDD66 및 pDD67 발현 플라스미드의 결실 유도체를 작제하여 개개 유전자 또는 유전자 군의 역활을 평가하였다. 이들 유도체의 작제는 위에서 기술한 바와 같이 합성 K4 유전자 단편내로 설계된 플랭킹 제한 효소 부위를 이용하였다. kpsC 유전자(K4 영역 1)은 0.6㎍의 DNA를 10 U SacI로 2시간 동안 10μL의 반응물 속에서 분해한 후 12μL의 반응물 속에서 반응물의 열처리(효소를 불활성화시키기 위해) 및 연결(1 mM ATP 및 T4 DNA 리가제 사용)하여 pDD66으로부터 결실시켰다. 당해 반응물의 1/2를 에스케리키아 콜라이 DH5α(제조원: Invitrogen)내로 LB Tc5에 30℃에서 플레이팅하면서 형질전환시켰다. pDD66에서, kpsC 유전자는 SacI 부위에 의해 플랭킹되지만, 또한 벡터내에 제3의 SacI 부위가 존재하여, 분해는 tetR 유전자를 함유하지만 플라스미드의 복제 오리진을 함유하지 않는 제3의 단편을 생성한다. 따라서, TcR 형질전환체는 적어도 벡터/오리진 단편과 tetR 단편으로 구성된 플라스미드를 함유하는 것으로 예측되었다. 형질전환체를 이들 2개의 SacI 단편을 함유하지만 kpsC SacI 단편을 결여한 플라스미드에 대해 스크리닝하고, 후보 pDD66△kpsC 클론을 또한 SalI 분해에 의해 전자의 2개의 SacI 단편의 바람직한 배향을 갖는 것들에 대해 추가로 스크리닝하였다. 하나의 이러한 플라스미드는 pCX045로 명명되었다(도 8p).
pDD66 내 kpsT 유전자(K4 영역 3)는 MluI 제한 부위에 의해 플랭킹되며, 플라스미드내에 다른 MluI 부위는 존재하지 않는다. 상기 기술한 것과 유사한 단계를 사용하여, pDD66을 MluI로 분해한 후 재-연결하여 pCX048로 명명된 pDD66△kpsT 유도체를 생성하였다(도 8p).
플라스미드 pCX039는 K4 영역 1 및 3 유전자의 결실에 의해 pDD67(위에서 기술됨, 참조: 도 8j)로부터 생성시켰다. 플라스미드 pDD67(1.5㎍)을 효소 PmlI 및 MluI(각각 10U)로 동시에 분해한 후, T4 DNA 폴리머라제(1.5 U) 및 dNTP(각각 150μM)로 12℃에서 15분 동안 처리하여 MluI에 의해 생성된 오버행을 채웠다(평활 말단을 남김). PmlI 분해는 평활 말단을 남긴다. 처리된 pDD67을 후속적으로 T4 DNA 리가제와 함께 항온처리하고 에스케리키아 콜라이 TOP10(제조원: Invitrogen)내로 형질전환시킨 후 Tet-내성에 대해 선택하고 Cm-내성에 대해 스크리닝하였다. 48개의 이중 항생제 내성 콜로니 상에서 콜로니 PCR을 프라이머 DHD229 및 DHD231을 사용하여 수행하였다.
DHD229 AAGGCGACAAGGTGCTGATG (서열 번호 81)
DHD231 CAATGCGACGGATGCTTTCG (서열 번호 82)
48개의 분리체 중 14개는 아가로즈 겔 전기영동에 의해 측정할 때 바람직한 작제물에 대해 예측된 678 bp에 근접하는 PCR 생성물을 수득하였다. 8개의 선택된 후보물 중 6개에서의 플라스미드는 (아가로즈 겔 전기영동에 의해) 예측된 크기였고, 2개의 선택된 플라스미드 분리체는 PmlI/MluI 연결부에서 바람직한 DNA 서열을 함유하였다. 하나의 플라스미드를 pCX039(도 8q)로 명명하였다. 이는 Pm 프로모터에 의해 구동된 xylS 및 K4 영역 2 유전자 kfoABCFG를 함유한다.
pCX039내 kfoB 유전자(및 이의 리보소옴 결합 부위)는 BstBI 제한 부위에 의해 밀접하게 플랭킹되며, 벡터 골격내에 제3의 BstBI 부위가 존재한다. 따라서, BstBI를 사용한 pCX039의 분해는 kfoB 유전자 단편, 플라스미드 복제 오리진, Tet-내성 유전자, 및 kfoCFG 유전자를 포함하는 거대 단편, 및 Cm-내성 유전자 및 Pm/kfoA를 포함하는 단편의 3개 단편을 생성한다(참조: 도 8q). kfoB 유전자가 결여된 pCX039의 유도체를 생성하기 위하여, 플라스미드(600 ng)를 BstBI(10 U)로 90분 동안 65℃에서 완전히 분해하였다. 효소를 반응물로부터 MinElute 키트(제조원: QIAGEN)을 사용하여 12μL 용출 완충액 중 최종 용출로 제거하였다. 대략 250 ng(5μL)의 당해 분해물을 T4 DNA 리가제와 함께 항온처리하고 에스케리키아 콜라이 DH5α(제조원: Invitrogen)내로 Cm-내성에 대한 선택과 함께 형질전환시켰다. Cm-내성에 대해 선택함으로써, 적어도 거대 벡터 단편(즉, kfoCFG/오리진)과 Cm/Pm/kfoA 단편을 함유하는 플라스미드를 수득할 수 있다. 8개의 선택된 형질전환체 내의 플라스미드를 제한 분해에 의해 분석하였으며, 5개는 kfoB BstBI 단편이 결여되고 바람직한 상대적 배향으로 다른 2개의 단편을 갖는 것으로 밝혀졌다. 하나의 이러한 분리체내의 플라스미드는 pCX044(도 8q; xylS 및 kfoACFG)로 명명되었다. 당해 분야의 숙련가는, 동일한 플라스미드 구조가 BstBI 효소를 사용한 부분 플라스미드 분해에 의해 수득될 수 있었음을 인식할 것이다.
당해 실시예에서 위에 기술된 바와 같이, 플라스미드 pDD66 및 pDD67은 상이한 배열로 13개의 K4 유전자를 함유한다: pDD66-Pm/kpsMT/kfoABCFG/kpsFEDUCS; pDD67-Pm/kpsFEDUCS/kpsMT/kfoABCFG. 이들 플라스미드내 K4 유전자(이들의 각각의 리보소옴 결합 부위와 함께) 중 대부분은 플라스미드내에서 단지 2 또는 3회 절단하는 제한 효소 부위의 쌍에 의해 밀접하게 플랭킹된다. 이러한 특징(및 위에서 기술한 다른 서열 성분)은 개개의 K4 유전자의 선택적인, 비-극성 결실을 허용한다. pCX039로부터의 pCX044의 생성을 위해 위에서 기술한 단계들을 사용하여, pDD66 및 pDD67의 △kfoB 유도체를 생성시키고, 도 8r에 묘사한 이들 플라스미드를 각각 pCX040, 및 pCX042로 지정하였다. pDD66 및 pDD67내 kfoG 유전자는 NheI 제한 부위에 의해 밀접하게 플랭킹되어 있으나 각각의 플라스미드내에서 테트라사이클린 내성 유전자에 대한 코딩 영역내 제3의 NheI 부위가 존재한다. pDD66 및 pDD67의 △kfoG 유도체의 생성을 위해, △kfoB 유도체의 생성을 위한 것과 유사한 시도를 이용하였다: NheI을 사용한 완전한 분해, 연결 및, 에스케리키아 콜라이의 Tet-내성 형질전환체에 대한 선택. 당해 시도는 플라스미드 복제 오리진과 함께 테트라사이클린 내성 유전자의 재생에 대해 선택한다. 생성되는 형질전환체내 플라스미드를 kfoG NheI 단편의 부재에 대해 스크리닝하고, pCX041(pDD66 △kfoG) 및 pCX043(pDD67 △kfoG)를 확인하여 도 8s에 나타낸다. 당해 분야의 숙련가는, 동일한 플라스미드 구조가 BstBI 또는 NheI 효소를 사용한 부분 플라스미드 분해에 의해 수득될 수 있었음을 인식할 것이다.
실시예
5
K4
캡슐 생합성 단백질을 인식하는 항체
항체의 생산: K4 콘드로이틴 생합성 유전자 클러스터에 의해 인코딩된 단백질 중 15개에 대해 지시된 항체를 하기 기술된 바와 같이 생산하였다. 이들 항체를 사용하여 대체 숙주 및 천연 에스케리키아 콜라이 K4 균주내에서 클로닝된 K4 콘드로이틴 생합성 유전자의 발현을 평가하였다. 이들을 또한 사용하여 다른 2 군 캡슐을 생산하는 에스케리키아 콜라이내에서 영역 1 및 영역 3 유전자 발현을 평가하고, 다른 혈청군 K4 에스케리키아 콜라이와 함께 잠재적으로 사용하여 영역 2 유전자 발현을 평가하였다. 항체는 다음과 같이 생성하였다.
PCR 프라이머를 설계하여, K4 캡슐 유전자 클러스터내에서 확인된 17개 유전자에 상응하는, 크기가 각각 약 20 내지 30kDa인 일련의 폴리펩타이드 또는 완전한 단백질을 증폭시켰다. PCR 프라이머의 초기 세트는 실시예 1에서 결정된 U1-41 K4 캡슐 유전자 클러스터의 서열을 기초로 하였다. 일부 예에서, 클로닝된 PCR 단편을 서열을 확인한 후 에스케리키아 콜라이 플라스미드 벡터인, pQE30(제조원: Qiagen, Inc., 미국 캘리포니아주 발렌시아 소재) 내로, 에스케리키아 콜라이내 고 수준 발현을 위해 서브클로닝하였다. 다르게는, PCR 단편을 발현 벡터내로 직접 클로닝한 후 서열분석하였다. pQE30 벡터는 강력한 박테리오파아지 T5 프로모터를 LacI 억제인자 단백질의 조절하에 사용하여 에스케리키아 콜라이내에서 고 수준의 IPTG 유도성 발현을 달성하였다. 정제를 촉진시키기 위해 클로닝된 폴리펩타이드의 아미노-말단에서 폴리-His 태그를 융합시키도록 당해 벡터를 설계하였다. 초기에, KpsM, KpsF, KpsE, KpsS, KfoC, KfoH 및 KfoC로부터 유래된 항원을 pQE30 벡터내에서 His-태그된 폴리펩타이드로서 발현시키고, KpsD, KpsU, KpsC, KfoD, KfoI, KfoE 및 KfoF로부터 유래된 항원을 His-태그없이 발현시켰다. His 태그가 없는 작제물은, His 잔기를 코딩하는 서열이 결실된, pQE30-dH으로 명명된, pQE30의 유도체 내로 클로닝시켜 생성하였다. 후속되는 발현 실험은, His 태그가 KfoC, KfoH 및 KfoG로부터 유래된 폴리펩타이드 항원의 효율적인 발현을 위해 필요하지만, 다른 항원은 태그되지 않은 형태로서 pQE30-dH내에서 효율적으로 발현되었음을 나타내었다. 따라서, 대부분의 항원은 주사된 항원에 존재하지만 천연의 표적 단백질내에 존재하지 않는 에피토프를 인식하는 항혈청을 수득하는 가능성을 피하기 위하여 태그되지 않은 형태로 발현되었다.
항원의 발현을 위해, pQE30 또는 pQE30-dH내로 클로닝된 항원 서열을 함유하는 배양물을 37℃에서 루리아 브로쓰(Luria Broth) 속에서 중기-로그 상(mid-log phase)까지 성장시킨 후, 1 mM의 IPTG를 첨가하여 유도시켰다. 전형적으로, 유도 후 4시간에, 세포를 수거하고 BugBuster® 단백질 추출 시약(제조원: Novagen, 미국 위스콘신주 매디슨 소재), 세제-계 분해 시스템을 사용하여, 판매회사 프로토콜에 따라 가용성 및 불용성 분획으로 분획화하였다. 전형적으로, T5 프로모터 시스템에서의 과-발현은, 비록 일부 발현된 폴리펩타이드가 가용성 형태로 축적된다고 해도, 에스케리키아 콜라이 세포질내에 불용성 형태로 발현된 폴리펩타이드의 축적을 초래한다. KpsU-유래된 항원은 불용성 형태로 발현되었고; 모든 다른 항원은 불용성 분획으로 분할됨이 밝혀졌다. 종종, 재조합 단백질은 BugBuster® 분해 및 추출 과정에 의해 생성된 불용성 분획내에서 우세한 폴리펩타이드이다. 면역화 목적을 위해, 이들 폴리펩타이드 항원의 발현을 100 ㎖들이의 진탕-플라스크 배양물 속에서 수행하였다. 유도된 배양물의 분해에 이어서, 모든 배양물(KpsU 항원-발현 배양물 제외)의 불용성 분획을 예비 겔에서 이동시켰다. KpsU 항원의 경우에, 폴리펩타이드 항원은 세포 분해물의 가용성 분획으로 분할되므로 이러한 가용성 분획을 예비 겔 위에서 이동시켰다. 목적한 단백질을 함유하는 겔 영역을 잘라내고 추가 가공 및 토끼의 후속적인 면역화로 항혈청을 생산하기 위해 상업적 판매회사, Open Biosystems(미국 알라바마주 헌트스빌 소재)에 보냈다.
초기 실험에서, 12개 항원은 충분히 잘 발현되어 항원의 정제를 보장하는 것으로 여겨졌다. 이들 12개의 항원은 KpsE, KpsD, KpsU, KpsC, KpsS, KpsT, KfoA, KfoB, KfoI(Orf3), KfoE, KfoH(Orf1) 및 KfoF로부터 유래되었다. KpsF, KpsM, KfoC, KfoD, 및 KfoG의 단백질 서열로부터 유래된 항원은 발현되지 않거나 불량하게 발현되었다. 불량하게 발현된 항원의 폴리펩타이드 서열을 코돈 사용빈도, 및 소수성과 같은 물리적 특성과 관련하여 분석하고 pI를 계산하였다. 잘-발현된 폴리펩타이드 항원에 대해 결정된 것으로서 이들 동일한 특성에 대한 비교는 어떠한 명확한 상관관계도 나타내지 않았다. 코돈 사용빈도는 KfoG와 같은, 일부 불량하게 발현된 항원에서 불리하였지만, 다른 잘-발현된 항원에서도 불리하였다. KpsM 항원은 극도로 소수성이며 이는 발현된 항원의 안정성에 잠재적으로 영향을 미칠 수 있으나, KpsM이 필수적인 막 단백질이므로, 이의 전체 서열은 매우 소수성이며 KpsM로부터 유래된 유의적인 크기의 어떠한 폴리펩타이드도 고도로 소수성일 것이다.
추가의 항원 코딩 서열은 합성의, 코돈-최적화된, KpsM, KpsF, KfoC, 및 KfoG에 대한 유전자로부터 실시예 2에 기술된 합성 K4 유전자 세트를 사용하여 유래되었다. 합성 DNA 주형으로부터 유래된 PCR 생성물을 pQE-30, 6X-His 태그 벡터내로 클로닝하고, 발현에 대해 시험하였다. 합성 서열 KfoC, KfoG, 및 KpsF 항원은 6X-His 태그를 지닌 pQE-30 벡터내에서 발현되는 경우, 고도로, 또는 중간으로 높게 축적되는 것으로 밝혀졌다. 이들 항원은 유도된 배양물로부터 위에서 기술한 바와 같이 겔-정제하였고 토끼에서 항혈청 생산을 위해 Open Biosystems(미국 알라바마주 헌트스빌 소재)에 보냈다. 6X-His 태그를 지닌 합성 서열 KpsM 항원은 유도된 배양물의 쿠마시 염색(Coomassie staining)에 의해 측정된 것으로서 검출가능한 수준에서 발현되지 않았다.
면역 토끼로부터의 항혈청을 유도된 항원을 발현하는 에스케리키아 콜라이 균주로부터의 세포 추출물을 사용하여 역가 및 특이성에 대해 웨스턴 블롯으로 시험하였다. 모든 항혈청은 이러한 웨스턴 블롯에서 그들의 각각의 항원을 인식하였다. 사용하기 위한 역가는 허용가능한 비-특이적인 배경과 전형적으로 1:1500이었다. 이들 항혈청을 사용하여 수행된 웨스턴 블롯으로부터의 결과의 예는 도 9에 나타낸다.
도 9에 나타낸 바와 같이, 일부 항혈청(예를 들면, 항-KfoA, 항-KpsD 및 항-KpsS)은 다른 에스케리키아 콜라이 단백질에 대해 관측가능한 비특이적인 반응성을 거의 또는 전혀 갖지 않는 클로닝된 K4 유전자를 수반하는 균주내에서 표적 단백질 밴드를 확인하였다. 다른 항혈청(예를 들면, 항-KpsC 및 항-KpsF)에서, 보다 비-특이적인 결합이 관찰되었지만, 표적 단백질은 클로닝된 K4 유전자를 결여하고 있는 에스케리키아 콜라이 대조군 균주와 비교함에 의해 명확하게 확인될 수 있었다. 대부분의 항혈청은 웨스턴 블롯에서 이들의 특이적인 표적으로서 단일 단백질 밴드를 확인하였지만, 일부 예(예를 들면, KfoC)에서 다수의 밴드가 특이적으로 인식되었다. KfoC 폴리펩타이드는 웨스턴 블롯 전에 추출물의 가공 동안 또는 세포내적으로 일부 단백질분해적 파괴 또는 프로세싱을 겪는 것으로 여겨졌으며, 도 9에 나타낸 바와 같이, 이중 밴드가 지속적으로 관찰되었다.
따라서, 에스케리키아 콜라이 K4 균주 및 클로닝된 K4 캡슐 유전자 클러스터를 발현하는 재조합 균주, 및 이들 유전자 중 일부 또는 모두를 함유할 수 있는 천연의 에스케리키아 콜라이 균주에서 KpsF, KpsE, KpsD, KpsU, KpsC, KpsS, KpsT, KfoA, KfoB, KfoC, KfoI(Orf3), KfoE, KfoH(Orf1), KfoF 및 KfoG를 검출할 수 있는 항혈청이 성공적으로 생성되었다.
표시된 단백질을 인식하는 항혈청을 생성하기 위하여 토끼를 면역화하기 위하여 재조합적으로-발현된 폴리펩타이드의 아미노산 서열이 하기 제공된다. pQE30-dH 벡터내에서 발현된 항원은 플라스미드 발현 벡터로부터 유래되지만 표적 단백질의 서열내에는 존재하지 않는, 발현된 폴리펩타이드의 아미노-말단에서 첨가된 MGS 서열을 함유한다. BamHI 부위내로 클로닝함에 의해 pQE30 벡터내에서 발현된 항원은 플라스미드 발현 벡터로부터 유래되지만 표적 단백질에 존재하지 않는 아미노-말단에서 첨가된 MRGSHHHHHHGS(서열 번호 85의 아미노산 1 내지 12번) 서열을 함유한다. SacI 부위내로 클로닝함으로써 pQE30 벡터내에서 발현된 항원은 플라스미드 발현 벡터로부터 유래되지만 표적 단백질에 존재하지 않는 아미노-말단에서 첨가된 MRGSHHHHHHGSACEL(서열 번호 93의 아미노산 1 내지 16번) 서열을 함유한다. 발현 벡터 DNA 서열로부터 유래된 폴리펩타이드 항원의 아미노-말단 서열은 하기에 밑줄로 표시되어 있다.
KfoA-유래된 항원(서열 번호 83):
MGSLNKGYNVVIIDNLINSSCESIRRIELIAKKKVTFYELNINNEKEVNQILKKHKFDCIMHFAGAKSVAESLIKPIFYYDNNVSGTLQLINCAIKNDVANFIFSSSATVYGESKIMPVTEDCHIGGTLNPYGTSKYISELMIRDIAKKYSDTNFLCLRYFNPTGAHESG MIGESPADIPSNLVPYILQVAMGKLEKLMVFGGDYPTKDGT
KfoB-유래된 항원(서열 번호 84):
MGSWLAYNTALLHFFLNNRGRCLLVSSEQVKRNAEDCIQQLQHKLKLKFGLSFSNTINHSLEQSVNDFKTAEASITLEKEHQEIMSLSGIDIGTGDIIFKQSETEEYLIFNVLNDYPDCKELYFELQSNANTPLRVLEKENYKPSFIWETFIKQRQITLDIVNGLYQSSKKIILDNELHTSKQLNAYQAILKELSDSKEELIQYDLIIKNKTIQVQELEC
KfoC-유래된 항원(서열 번호 85):
MRGSHHHHHHGSAISLNEVEKNEIISKYREITAKKSERAELKEVEPIPLDWPSDLTLPPLPESTNDYVWAGKRKELDDYPRKQLIIDGLSIVIPTYNRAKILAITLACLCNQKTIYDYEVIVADDGSKENIEEIVREFESLLNIKYVRQKDYGYQLCAVRNLGLRAAKYNYVAILDCDMKLN
KfoI(Orf3)-유래된 항원(서열 번호 86):
MGSVDLDNTISFNLSGKYSHATPNKKLIEKLYEYKLNGFYIVIFTARNMRTYKENIGKINIHTLPVIIDWLNENRVPYDEVIVGKPWCGDEGFYVDDRAIRPSELCNMTLEE ISNMLEQEKKCF
KfoE-유래된 항원(서열 번호 87):
MGSPEDFVFDKHDYEWLLRNKVTMIPVDSNLTLGQAIVTAWNLIGDKDDKGLQLLFGDTLFKKIPAGDDLVAISHSDDNYQWSFFYETELRAVSREDNKNVICGYFSFSKPNFFIRELVTSKFDFTAALKKYHDSYSLASIYVSDWLDFGHINTYYKSKVQYTTQRAFNELCITTKSVIKSSSNESKIEAESKWFETIP
KfoH(Orf1)-유래된 항원(서열 번호 88):
MRGSHHHHHHGSASLGINSYTLITLDKETRGQAETVYLAISKLFNIEQPITIFNIDTIRPNFIFTKFE유전자CYIEVFRGDGDNWSFVMPSNDVKNEVIATSEKKQISNLCCTGLYHFSTIKNFISAYEHYKNLPQENWDAGELYIAPIYNYLISNGIKVYYTEINKSDVIFCGTPREYENLQG
KfoF-유래된 항원(서열 번호 89):
MGSVGFTERLKRDLNTNNIIFSPEFLREGKALYDNLYPSRIVVGESSERARKFAELLSEGAIKKDIPILLTDSPEAEAIKLFANTYLAMRIAYFNELDTYASVHGLDTKQIIEGVSLDPRIGQHYNNPSFGYGGYCLPKDTKQLLANYRDVPQNLIQAIVDANTTRKDFVAEDILSRKPKVVGIYRLIMKAGSDN
KfoG-유래된 항원(서열 번호 90):
MRGSHHHHHHGSDDTLFRLQRLALKDTRIKIISLPQNVGTYAAKRIGLIQAKGEFVTCHDSDDWSHPEKLFRQISPLLLNPKLICSISDWVRLQDNGIFYARAVYPLKRLNPSSLLFRRADVLQKAGVWDCVKTGADSEFIARLKLIFGDSTVHRIKLPLTLGSHRTDSLMNSPTTGYTSQGISPDRQKYWDSWSRWHIQALRNKESLYIGNSDFTNKNRPF SAPDSILVDTNAIKTALQSAHVNFT
KpsT-유래된 항원(서열 번호 91):
MGSMIKIENLTKSYRTPVGRHYVFKNLNIEIPSGKSVAFIGRNGAGKSTLLRMIGGIDRPDSGKIITNKTISWPVGLAGGFQGSLTGRENVKFVARLYAKQEELKEKIEFVEEFAELGKYFDMPIKTYSSGMRSRLGFGLSMAFKFDYYIVDEVTAVGDARFKEKCAQLFKERHKESSFLMVSHSLNSLKEFCDVAIVFKDDNAVSFHEDVQEGIEEYITEQ NNY
KpsF-유래된 항원(서열 번호 92):
MRGSHHHHHHGSLAIAMIHQRKFMPNDFARYHPGGSLGRRLLTRVADVMQHDVPAVQLDASFKTVIQRITSGCQGMVMVEDAEGGLAGIITDGDLRRFMEKEDSLTSATAAQMMTREPLTLPEDTMIIEAEEKMQKHRVSTLLVTNKANKVTGLVRIFD
KpsE-유래된 항원(서열 번호 93):
MRGSHHHHHHGSACELPEFALKFNQTVLKESERFINEMSHRIARDQLAFAETEMEKARQRLDASKAELLSYQDNNNVLDPQAQAQAASTLVNTLMGQKIQMEADLRNLLTYLREDAPQVVSARNAIQSLQAQIDEEKSKITAPQGDKLNRMAVDFEEIKSKVEFNTELYKLTLTSIEKTRVEAARKLK
KpsD-유래된 항원(서열 번호 94):
MGSLNYLIKAGGVDPERGSYVDIVVKRGNRVRSNVNLYDFLLNGKLGLSQFADGDTIIVGPRQHTFSVQGDVFNSYDFEFRESSIPVTEALSWARPKPGATHITIMRKQGLQKRSEYYPISSAPGRMLQNGDTLIVSTDRYAGTIQVRVEGAHSGEHAMVLPYGSTMRAVLEKVRPNSMSQMNAVQLYRPSVAQRQKEMLNLSLQKLEEASLSAQSSTKEEAS
KpsU-유래된 항원(서열 번호 95):
MGSMSKAVIVIPARYGSSRLPGKPLLDIVGKPMIQHVYERALQVAGVAEVWVATDDPRVEQAVQAFGGKAIMTRNDHESGTDRLVEVMHKVEADIYINLQGDEPMIRPRDVETLLQGMRDDPALPVATLCHAISAAEAAEPSTVKVVVNTRQDALYFSRSPIPYPRNAEKARYLKHVGIYAYRRDVLQNYSQLPESMPEQAESLEQLRLMSAGINIRTFEVAATGPGVDTPACLEKVRALMAQELAENA
KpsC-유래된 항원(서열 번호 96)
MGSQRVRLIAENVSPQSLLRHVSRVYVVTSQYGFEALLAGKPVTCFGQPWYAGWGLTDDRHPQSALLSARRGSATLEELFAAAYLRYCRYIDPQTGEVSALFTVLQWLQLQRRHLQQRNGYLWVPGLTLWKSAILKPFLQTATNRLSFSRRCTAASACVVWGVKGEQQWRAEAQRKSLPLWRMEDGFLRSSGLGSDLLPPLSLVLDKRGIYYDATRPSELEVLLNHSQLTLAHQMRAEKLRQRLVESKLSKYNLGA
KpsS-유래된 항원(서열 번호 97):
MRGSHHHHHHGSACELCFGDCRLLHKEAKRWAKSKGIRFLAFEEGYLRPQFITVEEGGVNAYSSLPRDPDFYRKLPDMPTPHVENLKPSTMKRIGHAMWYYLMGWHYRHEFPRYRHHKSFSPWYEARCWVRAYWRKQLYKVTQRKVLPRLMNELDQRYYLAVLQVYNDSQIRNHSNYNDVRDYINEVMYSFSRKAPKESYLVIKHHPMDRGH RLYRPLIKRLSKEYGLDERVIYVHDLPMPELLRHASLIS
실시예
6
합성 유전자 세트[kpsFEDUCS+kpsMT+kfoABCDIEHFG]는 에스케리키아 콜라이 K-12에서 발현되는 경우에 프럭토실화된 콘드로이틴을 생산한다.
상기 실시예 4에 기재된 플라스미드 pDD54 및 pDD58을 MSC188(실시예 3에 기재된 바와 같이 콜란산 생합성 유전자 클러스터에 대해 결실된 에스케리키아 콜라이 K-12 균주 W3110)로 형질전환시켰다. 생성된 균주 MSC204[MSC188(pDD54)] 및 MSC206 [MSC188(pDD58)]를 진탕 플라스크 배양물에서 성장시키고, 콘드로이틴 생산에 대해 시험했다. 균주를 30℃에서 CYG 배지(20 g/L 카스아미노산, 5 g/L 효모 추출물, 2 g/L 글루코즈, pH 7.2) + 클로람페니콜(20 ㎍/mL) 중의 신선한 콜로니로부터 밤새 성장시키고, 이들 배양물을 동일한 배지에서 OD A600=0.05로 희석시켰다. 약 0.1의 OD A600(대략 1시간 후)에서, 유도인자 m-톨루엔산을 최종 농도 2 mM까지 첨가했다. 유도후 4, 8 및 24시간에서, OD A600 값을 측정하고, 샘플을 분석을 위해 취했다. 배양물 OD는 하기 표 6-1에 제공되어 있다. 각 시점에서 각 균주에 대해, 다당류 분석을 위한 10 mL 샘플을 오토클레이빙(121℃, >15psi, 5분)한 다음, 동결 저장했다. 각 시점에서 각 균주의 5 ml 2개 분취량을 원심분리하고, 생성된 세포 펠렛을 후속 웨스턴 블롯 분석을 위해 동결 저장했다.
표 4a에 제시된 바와 같이, 에스케리키아 콜라이 K-12 균주, MSC204 및 MSC206은 유도후 잘 성장했다: 유도후 24시간에서 이들 배양물 둘 다의 OD는 대략 7이었다. 이들 실험으로부터의 배양물 샘플을, 실시예 14에 상세히 기재된 바와 같이, 콘드로이틴 및 프럭토실화된 콘드로이틴에 대한 HPLC 기반 콘드로이티나제-의존성 분석을 사용하여 분석했다. 배양물 샘플은 이들 분석에서 효소적 분해 전에 탈프럭토실화 단계(산 처리)로 처리했다. 배양물 샘플은 또한 프럭토실화된 콘드로이틴에 특이적인 ELISA 분석으로 분석했다(실시예 14). 분석 결과는 표 4a에 제시되어 있다.
[표 4a]
이들 결과는 pDD58 함유 재조합 에스케리키아 콜라이 K12(균주 MSC206)이 프럭토실화된 콘드로이틴을 생산함을 명백히 입증한다. ELISA에 의한 다당류의 검출은 이들 균주에서 생산된 재조합 다당류가 프럭토실화된 콘드로이틴임을 입증하는데, 이는 ELISA 분석에 사용된 항혈청이 콘드로이틴의 프럭토실화된 형태에 특이적이고 프럭토실화되지 않은 콘드로이틴을 인지하지 않기 때문이다. 이 실험에서 관찰된 최고 수준의 프럭토실화된 콘드로이틴 생산은 약 25 ㎍/mL이었다. 프럭토실화된 콘드로이틴 생산은 벡터-단독 플라스미드, pDD54를 함유하는 대조군 균주 MSC204에서 일관되게 검출불가능했다. 4시간 및 8시간 샘플에서 MSC206에 대한 ELISA 및 HPLC 분석 사이에서 측정된 프럭토실화된 콘드로이틴 값에 정량적 차이가 있다. 이들 차이는 아마도 ELISA 분석의 보다 낮은 감도를 반영한다. 전형적으로, 제공된 샘플에서 프럭토실화된 콘드로이틴 농도가 높을수록, ELISA 및 HPLC 분석 사이의 일치는 보다 근접하다.
후속 실험은, MSC206에 의한 프럭토실화된 콘드로이틴의 생산을 확인하고 생산된 콘드로이틴의 수준에 대한 유도인자 농도의 효과를 시험하기 위해 수행했다. MSC206의 신선한 밤새 배양물을 0.05 OD A600으로 희석시키고, 약 0.1의 OD A600까지 CYG 배지 + 클로람페니콜(10 ㎍/mL)에서 30℃로 성장시켰다. 이어서, 배양물의 분취량은 m-톨루엔산을 0, 0.5, 1.0 또는 2.0 mM의 최종 농도까지 첨가하여 유도했다. 배양물을 유도후 24시간 동안 성장시키고, 이 시점에서의 OD를 측정하고, 샘플을 다당류 분석을 위해 상기한 바와 같이 취했다. 또한, 유도후 24시간에서, 각 배양물의 분취량을 희석시키고, LB 상에 플레이팅하여 전체 생존 세포를 정량화하고, LB + 클로람페니콜(17 ㎍/mL) 상에 플레이팅하여 플라스미드 함유 생존 세포를 정량화했다. 이들 배양물의 성장 및 콘드로이틴 생산은 표 4b에 요약되어 있다.
[표 4b]
표 4b에 제시된 바와 같이, 최고 수준의 유도인자만이 24시간에서 성장 및 생존 세포수에 대한 네가티브 효과를 가졌다. 이 실험에서, 발현 플라스미드 pDD58은, 당해 균주가 선택적 항생제인 클로람페니콜의 존재하에 성장했지만, 안정하게 유지되지 않았다. LB 플레이트와 비교하여 샘플을 LB+Cm17 플레이트 상에 플레이팅한 경우에 수득한 콜로니-형성 단위의 보다 낮은 역가에 의해 입증된 바와 같이 24시간 시점에서 플라스미드가 현저히 소실되는 것 같다. 그러나, 플라스미드 함유 세포의 분획은 유도인자 농도에 의해 현저한 영향을 받지 않았다. ELISA 분석의 결과는 MSC206에서 프럭토실화된 콘드로이틴의 생산을 확인시켜 주고, 탈프럭토실화 단계가 포함될 경우 HPLC 분석을 사용하여 수득한 결과와 일치한다. 최고 콘드로이틴 역가를 갖는 샘플은 ELISA 및 HPLC 분석 사이에 최상의 일치를 나타냈다. 이들 결과는 또한 m-TA 첨가에 의한 유도의 부재하에도 프럭토실화된 콘드로이틴의 생산을 입증한다. 그러나, 유도된 모든 배양물은 비유도된 배양물보다 많은 프럭토실화된 콘트로이틴을 생산하였으며, 최고 수준의 프럭토실화된 콘드로이틴은 1.0 mM m-TA로 유도된 배양물에 의해 생산되었다.
실시예
7
유전자 세트[kpsFEDUCS+kpsMT+kfoABCFG]은 에스케리키아 콜라이 K-12 또는 에스케리키아 콜라이 B에서 발형되는 경우에 비프럭토실화된 콘드로이틴을 생산한다. kfoB 및 kfoG은 비프럭토실화된 콘트로이틴의 생산에 필수적이지는 않지만, kfoG은 최적 생산을 위해 요구된다.
이 연구 전에, K4 캡슐 다당류의 프럭토실화에 관여하는 단백질을 인코딩하는 유전자는 동정되지 않았다. K4 캡슐 유전자 클러스터의 영역 2에 존재하는 다수의 유전자에 의해 인코딩된 단백질에 대한 어떠한 기능도 동정되지 않았다:kfoB, kfoG, kfoD, kfoE, kfoH(orf1) 및 kfoI(orf3).
2군 에스케리키아 콜라이 캡슐의 영역 2내에 존재하는 유전자는 다당류 또는 다당류의 당 뉴클레오티드 전구체의 합성에 모두 통상적으로 관련된다(Whitfield 2006). 상기 언급된 바와 같이(실시예 1), kfoB 및 kfoG 유전자는, 다른 글리코스아미노글리칸 캡슐을 생산하는 것으로 공지된 박테리아의 캡슐 클러스터에 존재하는 유전자에 의해 인코딩된 것들과 상동성이다. 이러한 부수적 증거는 글리코스아미노글리칸 캡슐의 생합성에서 kfoB 및 kfoG에 대한 잠재적 역활을 시사한다. 대조적으로, 본 발명 이전에는 kfoD, kfoI, kfoE 및 kfoH 유전자가 K4 캡슐 다당류의 콘드로이틴 골격의 생합성에 관여하는 것과 관련된 어떠한 증거도 없었다. 다른 연구자들은 kfoD 및 kfoE 유전자가 아마도 프럭토실화에 관련되지 않음을 가정했지만[참조: Ninomiya et al., 2002 and Krahulec et al., Molec. Biotech., 2005;30:129-134.], 본 발명자들은 kfoD, kfoI, kfoE 및 kfoH 유전자가 콘드로이틴의 프럭토실화에 관련되는 단백질을 인코딩할 수 있음을 가정했다. 당해 가정을 시험하기 위해, kfoDIEH 유전자 세트를 함유하지 않지만 kpsFEDUCS, kpsMT 및 kfoABCFG 유전자를 함유하는 재조합 플라스미드를 작제했다. pDD66 및 pDD67로 명명된 이러한 2개 플라스미드는 상기 실시예 4에 기재된 바와 같이 작제했다. 이들 2개의 플라스미드는 또한 테트라사이클린 내성을 부여하는 유전자를 함유하여, 테트라사이클린을 세포 배양물에 사용하여 플라스미드 유지에 대해 선별할 수 있다. pDD62로 명명된 pDD58의 유도체는 대조군 플라스미드로서 또한 작제했다. 상기 실시예 4에 상세히 기재된 pDD62 플라스미드는 kpsFEDUCS, kpsMT 및 kfoABCDIEHFG 유전자를 함유하고, 또한 테트라사이클린 내성을 제공하는 유전자를 함유한다.
kfoDIEH 유전자의 결실이 프럭토실화된 콘드로이틴의 생합성에 영향을 주는지를 측정하기 위해, pDD62, pDD66 및 pDD67를 MSC188 또는 MSC175(상기 실시예 3에 기재된 W3110△wcaJ) 내로 형질전환시키고, 생성 균주를 배양하고, 프럭토실화된 콘드로이틴 및 비프럭토실화된 콘드로이틴의 생산에 대해 분석했다. 균주 MSC274(MSC175 + pDD62), MSC279(MSC188 + pDD66) 및 MSC280(MSC188 + pDD67)를 진탕 플라스크 중의 CYG 배지에서 30℃로 2 ㎛/mL 테트라사이클린(Tc)와 함께 성장시키고, 지시된 바와 같이 1 mM m-TA로 유도했다. 배양물은 상기한 바와 같이 유도후 24시간에서 샘플링하고, 오토클레이빙하고, 원심분리하고, 생성 상청액을 탈프럭토실화 단계의 존재 또는 부재하에 HPLC 분석에 의해 분석했다.
하기 표 5a에 제시된 바와 같이, 모든 균주는 콘드로이틴을 생산했지만, 플라스미드 pDD66 또는 pDD67를 함유하는 균주에 의해 생산된 콘드로이틴 다당류는 프럭토실화 증거를 나타내지 않는다. 즉, MSC279 및 MSC280 샘플에 대해 HPLC에 의해 측정된 콘드로이틴 역가는 탈프럭토실화 단계로 처리하지 않은 샘플과 비교하여 탈프럭토실화 단계로 처리한 샘플에 있어서 현저히 상이하지 않다. 대조적으로, MSC274 샘플을 탈프럭토실화 단계의 부재하에 분석하는 경우에는 매우 적은 콘드로이틴이 관찰된다. 상당한 콘드로이틴은 탈프럭토실화 단계로 처리한 MSC274 샘플에서만 검출된다. 실시예 14에서 상세한 바와 같이, 프럭토실화된 콘드로이틴은 HPLC 분석에 사용되는 콘드로이티나제에 의해 분해되지 않고, 따라서 당해 분석에 의해 검출할 수 없다. 이들 데이타는 kfoDIEH 유전자 중 하나 이상이 콘드로이틴의 프럭토실화에 요구되지만 이들 유전자중 어떤 유전자도 콘드로이틴 생합성에 요구되지 않음을 명백히 입증한다. 이들 결과는 또한, 콘드로이틴이 m-TA에 의한 유도의 부재하에 생산되지만 유도된 배양물은 비유도된 배양물보다 많은 콘드로이틴을 생산했음을 입증한다. 놀랍게도, MSC279 및 MSC280 둘 다에 의해 생산된 비프럭토실화된 콘드로이틴의 역가는 MSC274에 의해 생산된 프럭토실화된 콘드로이틴의 역가보다 (2.5 내지 4배) 크다. 이 결과는 프럭토실화 사건이 콘드로이틴 생산 효율을 감소시킴을 시사한다. 이는, 시험관내에서 프럭토실화된 콘드로이틴이 비프럭토실화된 콘드로이틴과 비교하여 KfoC 효소(콘드로이틴 폴리머라제)에 대한 불량한 기질이라는 관찰과 일치한다[참조: Lidholt and Fjelstad, J. Biol . Chem . 1997;272:2682-2687].
[표 5a]
이들 균주는 균주 MSC206과 비교하여 개선된 플라스미드 보유, 즉 항생제 내성의 보유를 나타낸다. MSC206 플라스미드 보유 데이타에 대한 상기 실시예 6의 표 4b를 참조한다. 이는 아마도 플라스미드의 선별을 위한 테트라사이클린 대 클로람페니콜의 사용을 반영한다. 추가의 실험은, 최대 콘드로이틴 생산을 달성하기 위해, 세포 성장의 손상 없이, 플라스미드 보유를 최대화하기 위해 사용된 테트라사이클린 또는 기타 바람직한 항생제의 농도를 최적화하기 위해 수행될 수 있다.
플라스미드 pDD66 및 pDD67을 MSC139, 에스케리키아 콜라이(ATCC11303) 내로 형질전환시키고, 생성 균주를 콘드로이틴 생산에 대해 시험했다. 대조군 플라스미드, pDD63을 또한 MSC139 내로 형질전환시켰다. 상기 실시예 4에 기재된 이 플라스미드는 테트라사이클린-내성 유전자가 부가된 pDD54 벡터의 유도체이다. 이는 어떠한 K4 콘드로이틴 생합성 유전자도 함유하지 않는다. pDD63(MSC314), pDD66(MSC315) 또는 pDD67(MSC316)를 함유하는 에스케리키아 콜라이 B에서의 콘드로이틴 생산을 진탕 플라스크에서 평가했다.
이 실험에서, 배양물은 5 ㎍/mL 테트라사이클린(Tc5)을 함유하는 TB 배지에서 30℃에서 성장시켰다. 하기 실시예 8에 기재된 바와 같이, TB 배지에서의 성장은 CYG 배지와 비교하여 에스케리키아 콜라이에서 콘드로이틴의 재조합 생산을 향상시키는 것으로 밝혀졌고, Tc5는 세포 성장의 손상 없이 플라스미드 유지를 위해 유효 농도인 것으로 밝혀졌다. 배양물은 0.05 OD A600으로 접종했고, 2 mM m-TA의 첨가에 의해 0.10 내지 0.13에서 유도했다. 유도 후, 배양물은 3일 이하 동안 30℃에서 성장시켰다. 균주 MSC315는 초기에 다른 균주보다 서서히 성장했고, MSC314 및 MSC316 배양물보다 수시간 후에 유도되었다. 유도후 48시간(MSC315의 경우에 유도후 42시간)에서, 테트라사이클린의 존재 또는 부재하에서의 생존 세포 계수 및 HPLC 방법에 의한 콘드로이틴 분석을 위해 샘플을 취했다.
하기 표 5b에 제시된 분석 결과는 pDD66 또는 pDD67 중의 하나가 존재하는 경우에 에스케리키아 콜라이에서 상당한 수준의 콘드로이틴 생산을 입증한다. pDD63을 함유하는 균주 MSC314, "공 벡터(empty vector)" 대조군에서는 어떠한 콘드로이틴도 검출되지 않았다. 이 실험에서 플라스미드 보유(% Tcr)는 pDD66 및 pDD67에 대해 대략 50%인 반면, 대조군 벡터 pDD63의 검출가능한 소실은 없었다.
[표 5b]
에스케리키아 콜라이는 캡슐을 생산하지 않지만, 영역 2 유전자가 삽입 요소에 의해 파괴되어 있고 영역 1 및 3 유전자가 작용성인 것처럼 보이는 미소(cryptic) 그룹 2 캡슐 유전자를 함유한다[참조: Andreishcheva and Vann, Gene 2004;484:113-119]. 에스케리키아 콜라이 K4 유전자가 에스케리키아 콜라이 B 영역 2 결함을 "보충"할 수 있는지를 측정하기 위해, kfoABCFG 유전자만을 함유하는 플라스미드를 작제했다. 이 플라스미드, pCX039는 실시예 4에 기재되어 있다. 플라스미드 pCX039를 MSC139, 에스케리키아 콜라이 B(ATCC11303)에 형질전환시키고, MSC317로서 명명된 생성 균주에서의 콘드로이틴 생산을 진탕 플라스크에서 평가했다. 당해 균주를 30℃에서 TB 배지 + 5 ㎍/mL Tc에서 성장시켰다. 배양물을 대략 0.05 OD A600으로 접종시키고, 대략 0.10의 OD에서 2 mM m-TA로 유도했다. 유도후 48시간에서, 테트라사이클린의 존재 또는 부재하의 생존 세포 계수 및 HPLC 방법에 의한 콘드로이틴 분석을 위해 샘플을 취했다.
LB 플레이트에서 분석하는 경우, 5.9 x 109 cfu/mL가 수득되었고, 5 ㎍/mL Tc를 함유하는 LB 플레이트 상에의 병행 플레이팅으로부터 수득된 cfu의 역가는 현저히 상이하지 않았다. 이는, pCX039 플라스미드가 당해 실험에서 정량적으로 유지됨을 나타낸다. HPLC 기반 콘드로이틴 분석은 탈프럭토실화 단계 없이 수행했다. 이 분석에서 측정된 콘드로이틴 역가는 205 ㎍/mL이었다. 이 결과는 영역 2 K4 유전자 kfoABCFG만이 에스케리키아 콜라이 B에서 콘드로이틴 생합성을 달성하는데 요구됨을 입증한다. 하기 실시예 9에서, 에스케리키아 콜라이 B 중의 영역 1 및 3 유전자는 K4 영역 2 유전자와 함께 작용하여 콘드로이틴 분비를 야기하는 것으로 밝혀졌고, 이러한 발견은 문헌[참조: Andreishcheva and Vann (2004)]의 것과 일치한다.
상기 주목한 바와 같이, KfoB 및 KfoG 상동체는 다른 글리코스아미노글리칸-생산 박테리아의 유전자 클러스터에 인코딩되어 있지만, 이들 단백질의 기능은 알려져 있지 않은 상태이다. 실시예 4에 기재된 바와 같이, kfoB 또는 kfoG 유전자는 pDD66 및 pDD67로부터 결실되어 플라스미드 pCX040, pCX041, pCX042 및 pCX043을 생성하며, 이들은 하기 표 5c에 요약되어 있다. 이들 플라스미드를 숙주 균주 MSC188 내로 형질전환시키고, 생성 균주의 배양물을 콘드로이틴 생합성에 대해 시험했다. 배양물을 30℃로 TB 배지에서 성장시키고, OD A600 약 0.2에서 2 mM m-TA로 유도하고, 유도후 48시간에서 생존 세포 계수 및 콘드로이틴 분석을 위해 샘플링했다. 하기 제시된 이들 분석의 결과는 어떠한 유전자도 재조합 에스케리키아 콜라이 K-12에서 콘드로이틴 생합성에 절대적으로 필수적인 것은 아님을 시사했다.
[표 5c]
이들 결과에 기반하여, KfoB 단백질 활성은 이들 성장 조건하에 이들 균주에서 콘드로이틴 생산에 필수적이지 않은 것 같다. 사실, 이들 실험에서, pDD66으로부터 kfoB의 결실을 함유하는 균주는 pDD66을 함유하는 균주보다 대략 20% 더 많은 콘드로이틴을 생산했다; MSC279 대 MSC322 참조. 이러한 차이는 유의적일 수 있지만, 재조합 에스케리키아 콜라이에서 콘드로이틴 생산에 대해 관찰된 일상의 편차 내이다. MSC279와 MSC322를 비교하는 반복 실험에서, kfoB 결실 균주에 의한 콘드로이틴의 생산 향상은 콘드로이틴 생산에 거의 효과가 없거나 전혀 효과가 없는 것으로 나타났다.
kfoG를 불활성화시키기 위해 돌연변이된 에스케리키아 콜라이 K4 균주의 이전 공개된 연구는 생산된 프럭토실화된 콘드로이틴의 수준에 대한 kfoG 돌연변이의 어떠한 효과도 보고하지 않았다[참조: Krahulec et al., 2005]. 대조적으로, 본 발명자들의 결과는 KfoG 단백질이, 콘드로이틴의 생산에 절대적으로 필수적이지는 않지만, 이러한 실험의 이들 성장 조건하에 에스케리키아 콜라이에서 재조합 콘드로이틴의 생산의 최적 수준을 위해 요구되는 것을 입증한다. kfoG 유전자의 결실은 pDD66 및 pDD67에 의한 콘드로이틴의 생산을 매우 감소시켰다. pDD66 배경에서, kfoG가 결실된 균주(MSC323)는 야생형 대조군 균주 MSC279가 생산한 콘드로이틴의 대략 20%만을 생산했다. 유사하게는, pDD67 배경에서, kfoG가 결실된 균주(MSC325)는 야생형 대조군 균주 MSC280이 생산한 콘드로이틴의 대략 5%만을 생산했다.
실시예
8
본
실시예는
다양한 성장 배지, 온도 및 유도 조건에서 콘드로이틴의 재조합 생산을 입증한다.
각종 상이한 성장 배지는 에스케리키아 콜라이 K4 콘드로이틴 생합성 유전자를 함유하는 재조합 에스케리키아 콜라이 균주에 의한 콘드로이틴의 생산을 뒷받침할 수 있다. 재조합 콘드로이틴의 최적 생산을 위해, 배지 조성, 온도, 유도인자 농도 및 유도후 배양 기간 등의 배양 조건을 최적화시킬 필요가 있다.
에스케리키아 콜라이에서 콘드로이틴의 재조합 생산에 대한 초기 연구는 CYG 성장 배지(20 g/L 카스아미노산, 5 g/L 효모 추출물, 2 g/L 글루코즈, pH 7.2)를 사용했다. 각종 대체 성장 배지 및 배양 조건을 사용하여, 콘드로이틴을 생산할 수 있는 재조합 에스케리키아 콜라이 균주를 배양하고 콘드로이틴 생산을 달성할 수 있다.
에스케리키아 콜라이의 성장을 뒷받침하는 것으로 공지된 한 가지 대체 배양 배지는 TB 배지이다[참조: Sambrook, J., Fritsch, E. F. and Maniatis, T., Molecular Cloning: A Laboratory Manual, Second Edition, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY (1989)]. 이 배지를 시험했고, 재조합 에스케리키아 콜라이에 의한 콘드로이틴의 생산을 뒷받침하는 것으로 밝혀졌다. 추가로, 콘드로이틴 생산에 대한 연장된 배양 시간(유도후 72시간 이내)의 효과를 또한 시험했다. 또한, 1 mM 대 2 mM m-TA를 사용한 유도에 대한 콘드로이틴 생산의 효과를 또한 시험했다.
균주 MSC279 및 MSC280는 테트라사이클린을 5 ㎍/mL로 함유하는 TB에서 30℃로 진탕 플라스크에서 성장시켰다. 배양물은 0.05 OD A600에서 접종하고, 대략 (0.1 내지 0.2) OD A600에서 1 mM 또는 2 mM m-TA의 첨가에 의해 유도했다. 유도후 24 및 48시간에서, 배양물을 콘드로이틴 분석 및 생존 세포 계수를 위해 샘플링했다. 이 실험의 결과는 하기 표 6a에 요약되어 있다.
[표 6a]
이 결과는 TB 배지가 현저한 수준의 콘드로이틴 생산을 뒷받침할 수 있음을 입증한다. 또한, 배양 시간의 연장은 콘드로이틴 역가를 현저히 증가시켰고; 콘드로이틴 수준은 유도후 24 내지 48시간에서 대략 2배가 되었다. 0.4 내지 0.5 g/L의 최종 콘드로이틴 역가는 유도후 48시간에서 달성되었다. 이들 데이타는 또한 보다 높은 유도인자 농도가, 효과의 정도가 크지는 않지만, 보다 큰 생산능을 제공할 수 있음을 시사한다.
CYG 및 TB 둘 다는 가수분해된 카세인 생성물 및 자가분해된 효소를 함유하는 "복합" 성장 배지이고, 여기서 배지의 성분들은 화학적으로 규정되지 않는다. 일부 상황에서, 세포 배양을 위해 최소 또는 규정 성장 배지를 사용하는 것이 바람직할 수도 있다. 가능한 규정 또는 최소 배지의 일부 예는 효모 추출물(YE)의 보충하에 또는 보충 없이 "2XM9" + 글루코즈 또는 글리세린을 포함한다. "2XM9"의 기본 무기 염은 22.6 g/L Na2HPO4·H2O, 6 g/L KH2PO4, 1 g/L NaCl, 2mM MgSO4, 0.2 mM CaCl2, 및 2.0 g/L NH4Cl(pH 7.4)이다. 이러한 제형에 탄소원을 첨가하고, 기타 보충제를 지시된 바와 같이 첨가할 수 있다. 균주 MSC279 및 MSC280은 탄소원으로서 10 g/L 글루코즈 또는 글리세린을 함유하는 2XM9에서 30℃로 진탕 플라스크에서 배양했다. YE와 함께 1 g/L로 글루코즈 함유 배지의 보충 효과를 또한 시험했다. 이 실험을 위해, 접종물로서 사용된 밤새 배양물을 LB 배지에서 성장시켰다. 배양물은 0.05 OD A600으로 접종시키고, 대략 0.1 내지 0.2 OD A600에서 1 mM m-TA의 첨가에 의해 유도했다. 탄소원으로서 글루코즈를 함유하는 배양물을 생존 세포 계수 및 콘드로이틴 분석을 위해 유도후 24 및 48시간에서 샘플링했다. 그러나, 글리세린 배양물은 초기 및 유도후 24시간에서 비교적 서서히 성장했고, 미약한 성장만이 있었기 때문에, 글리세린 배양물의 성장은 72시간까지 연장했고 샘플은 48 및 72시간에서 취했다. 하기 표 6b는 이 실험의 결과를 요약한 것이다.
[표 6b]
균주 둘 다는 모든 3개 배지 조성물에서 대략 5 내지 6의 최종 OD A600에 도달했고, 플라스미드 보유는 대략 75 내지 90%로 비교적 양호했다. 콘드로이틴은 시험된 모든 배지에서 상당량으로 생산되었다. 수거시의 역가는 대략 100 내지 350 ㎍/mL 범위였다. 2XM9 + 글루코즈 배지에 대한 효모 추출물의 첨가는 최종 콘드로이틴 역가에 대한 적절한 효과를 대부분 갖는다. 초기 성장 지연에도 불구하고, 글리세린 배양물은 글루코즈로 관찰된 것과 유사한 최종 세포 밀도까지 성장했다. 콘드로이틴의 최종 역가는 글루코즈 배양물과 비교하여 글리세린 배양물에서 (1.5 내지 3배) 더 높았다. 이들 결과는 현저한 수준의 콘드로이틴 생산을 뒷받침할 수 있는 최소/규정 배지의 예를 제공한다. 추가의 배지 개발 및 최적화는 미생물 발효 공정 개발 분야의 통상의 지식을 가진 자에게 공지된 표준 방법을 사용하여 수행할 수 있다.
또 다른 실험은 콘드로이틴 축적에 대한 성장 온도 및 유도후 연장된 성장 시간의 효과를 입증한다. MSC280의 배양물을 CYG 배지 + 2 ㎍/mL Tc에서 성장시켰다. 플라스크를 20℃, 25℃, 30℃ 및 37℃에서 배양했다. 배양물을 대략 0.05 OD A600으로 접종시키고, 지시된 온도에서 대략 0.1 내지 0.2 OD A600으로 성장시키고, 이 시점에서 배양물을 지시된 1 mM m-TA의 첨가에 의해 유도했다. 30℃에서 한 가지 대조군 배양물은 유도하지 않았다. 샘플은 콘드로이틴 분석 및 생존 세포 계수를 위해 유도후 24, 48 및 72시간에서 수집했다. 말기 수거 시점으로부터의 결과는 표 6c에 하기 제시되어 있다. 이들 조건하에, 콘드로이틴 생산은 시험된 모든 온도에서 달성되었지만, 최고의 콘드로이틴 역가는 25℃ 및 30℃에서 달성되었다. 콘드로이틴 축적은 시험된 모든 온도에서 성장 2일차 및 3일차 동안 현저히 증가했다(데이타는 도시하지 않음). 37℃에서, 콘드로이틴 생산은 30℃에서보다 실질적으로 낮았고(대략 10배), 37℃ 배양물의 생존률은 불량했다. 추가의 최적화는 20℃ 내지 30℃ 범위의 추가 온도를 시험함으로써 콘드로이틴 생산에 대한 바람직한 온도 범위의 정의를 밝힘으로써 달성할 수 있다. 유사하게는, 추가의 최적화는 콘드로이틴 역가에 대한 유도후 배양 시간의 효과를 밝힘으로써 달성할 수 있다.
[표 6c]
배양 시간을 연장함으로써 배양 시간을 최적화하기 위한 추가의 연구는 콘드로이틴 생산을 추가로 증가시킬 수도 있다. 유사하게는, 유도인자의 추가 농도를 시험하여 콘드로이틴 생산에 대한 최적 농도를 확인할 수 있다.
실시예
9
본 실시예는 재조합 콘드로이틴이 에스케리키아 콜라이 K-12 및 에스케리키아 콜라이 B에서 배양 배지로 분비될 수 있음을 입증한다. 본 실시예는 추가로 콘드로이틴이 또한 세포내에서 고도로 생산될 수 있음을 입증한다.
에스케리키아 콜라이 K4를 액체 배지에서 배양하는 경우, 캡슐 다당류(K4P), 프럭토실화된 콘드로이틴은 배양 배지에 무세포 형태로 및 세포 결합 형태로서 축적되는 것으로 보고되어 있다[참조: Manzoni et al., Biotech. Lett. 1996;18:383-386, Cimini at al. Appl. Mocrobiol. Biotechnol. E-Publication, E-Pub. October 2009]. 다른 2군 캡슐 다당류, 예를 들면, 에스케리키아 콜라이 혈청형 K1 및 에스케리키아 콜라이 혈청형 K5에 의해 생산된 것들과 유사하게, 세포 결합 형태는 주로 지질 앵커(anchor)에 의해 세포의 외막의 외엽과 결합하는 것으로 믿어진다[참조: Whitfield, 2006]. 다당류와 지질 앵커 사이의 연결의 성질은 구조 수준에서 정의되어 있지 않고, 지질 앵커가 무엇인지도 측정된 바 없다. 상기 실시예 6 내지 8에 기재된 바와 같이 생산 및 검출된 재조합 콘드로이틴은 배양 배지에 명백하게 존재한다. 저속 원심분리(3500g에서 10분)는 콘드로이틴에 대해 분석되는 샘플의 배양 배지로부터 세포를 제거하기에 충분하고, 상당량의 콘드로이틴 무세포 상청액에서 검출되었다. 그러나, 상기 실시예 6 내지 8에서 콘드로이틴에 대해 분석된 모든 샘플은 박테리아를 사멸시켜 샘플 취급을 용이하게 하기 위해 원심분리 전에 오토클레이빙시켰다. 오토클레이빙 단계는 임의의 세포 결합된 콘드로이틴의 연결을 잠재적으로 분쇄하고, 세포로부터 이러한 세포 결합 콘드로이틴을 방출시킬 것이다. 재조합 콘드로이틴이 무세포 및/또는 세포 결합 형태로 생산되는지를 측정하기 위해, 이어서 콘드로이틴 생산 배양물로부터의 샘플의 원심분리 후 상청액 및 펠렛 분획 내로의 재조합 콘드로이틴의 분배에 대한 오토클레이빙의 효과를 시험하는 실험을 수행했다.
균주 MSC279를 30℃에서 TB 배지 5 ㎍/mL Tc에서 진탕 플라스크에서 성장시켰다. 배양물은 대략 0.03 OD A600으로 접종하고, 대략 0.1 내지 0.2 A600으로 성장시켰으며, 이 시점에서 2 mM m-TA의 첨가에 의해 유도했다. 유도후 48시간에서 샘플을 취하고, 콘드로이틴에 대해 분석했다. 이 배양물의 하나의 분취량을 원심분리 전에 오토클레이빙시키고, 생성된 상청액 및 세포 펠렛 분획을 실시예 14의 HPLC 방법에 따라 콘드로이틴에 대해 분석했다. 또 다른 분취량을 오토클레이빙 없이 원심분리하고, 생성된 상청액 및 세포 펠렛 분획을 실시예 14의 HPLC 방법에 따라 콘드로이틴에 대해 분석했다. 비-오토클레이빙 샘플로부터의 세포 펠렛은 THB(50 mM 나트륨 아세테이트와 함께 50 mM 트리스-HCl, pH 8.0)에 재현탁시키고, 콘드로이티나제 ABC("CHase")로 직접 처리하고, 다시 원심분리하여 분석용 상청액 및 펠렛 분획을 생성했다. 잔류 배양 배지에 함유된 무세포 콘드로이틴을 시험하기 위해, 비-오토클레이빙 샘플로부터의 또 다른 세포 펠렛을 THB에서 천천히 세척한 다음, 재원심분리했다. 세척으로부터의 상청액(샘플 #7) 및 세척액으로부터 세포 펠렛(용해 없음)(샘플 #8)을 상기와 같이 콘드로이틴에 대해 분석했다. 이 실험의 결과는 하기 표 7a에 제시되어 있다.
[표 7a]
오토클레이빙 샘플에서, 전체 콘드로이틴 중의 11%만이 세포 펠렛(샘플 #2)에 존재하는 반면, 원심분리 전에 오토클레이빙하지 않은 샘플(샘플 #4) 에서는 전체 콘드로이틴 중의 45%가 세포 펠렛에 존재했다. 이 결과는 MSC279에 의해 생산된 콘드로이틴의 상당 분획이 세포 결합 상태로 존재하고 오토클레이빙 단계가 세포와 콘드로이틴의 결합을 파괴함을 나타낸다. 비오토클레이빙 균주의 펠렛 중의 세포 결합 콘드로이틴은 용해 처리 부재하에 재현탁된 세포의 직접 CHase 처리에 의해 분해되는 것으로 밝혀졌다. 방출된 이당류의 양에 기반한 표면 결합된 콘드로이틴의 계산된 양은 본래 배양물에서 130 내지 154 ㎍/ml(샘플 #5 및 샘플 #8)인 것으로 밝혀졌다. 이 값은 실시예 14의 "세포 용해" 기술에 의해 측정된 세포 결합 콘드로이틴 역가(178 ㎍/mL)(샘플 #4)보다 다소 낮은데, 이는 내부 콘드로이틴 폴리머를 반영할 수 있다(샘플 #2 및 샘플 #6에서 측정된 바와 같음). 그러나, 분석 방법 둘 다로부터의 데이타는 상당히 높은 콘드로이틴 분획이 오토클레이빙 샘플과 비교하여 비오토클레이빙 샘플에서 세포 결합되어 있음을 나타내는 것과 정량적으로 일치한다. 세포 결합된 콘드로이틴이 전체 세포 현탁액의 CHase 처리에 의해 이당류로 분해되었다는 사실은, 다당류가 세포 외부 및 배양 배지 내에 잔류하는 방식으로, 이러한 콘드로이틴 분획이 세포의 외막과 결합되는 것을 나타낸다. 이는 캡슐의 예상된 구조와 일치한다.
이들 결과는 균주 MSC279에 의해 생산된 재조합 콘드로이틴의 상당 분획(≥50%)이 세포 결합되지 않은 형태로 배양 배지 내에 존재함을 입증한다. MSC279에 의해 생산된 세포 결합된 콘드로이틴의 벌크는 세포에 부착하지만, 첨가된 CHase에 의한 분해에 의해 입증된 바와 같이 주위 배지에 접근가능하다. 천연 에스케리키아 콜라이 K4에 의한 무세포 및 세포 결합된 형태의 K4P의 생산은 이미 문헌[참조: Manzoni et al., Biotechnol. Lett. 1996;18(4):383-386 and Cimini et al., Appl. Microbiol. Biotechnol. E-Publication, October 2009]에 보고되어 있다. 재조합체 생산 동안 두 형태의 관찰은 MSC279에서 재조합 콘드로이틴의 합성 및 분비가 천연 균주에서 작용하는 동일한 경로에 의해 진행된다는 관찰과 일치한다. 이는 MSC279 내로 도입된 클로닝된 유전자 모두가 에스케리키아 콜라이 K4에서와 동일한 방식으로 작용하고 캡슐 다당류의 합성 및 이출에 대한 완전한 경로가 재조합 균주에서 작용하는 것을 시사한다.
박테리아 발효에 의해 콘드로이틴을 생산하기 위해, 대규모 발효기를 사용하는 것이 바람직하고, 이는 너무 커서, 세포 결합 콘드로이틴을 배양 배지로 방출하는 방법으로서 가능할 오토클레이빙을 실시할 수 없는 배양 배지의 용적을 생성한다. 산 또는 염기 처리와 조합하여 승온을 사용하는 또 다른 처리를 대규모 제조에 사용할 수 있다.
콘드로이틴을 배양 배지로 분비하는 유사한 결과는 콘드로이틴을 생산하는 재조합 에스케리키아 콜라이 B 균주로 수득되었다. 본 발명자들은 재조합 에스케리키아 콜라이 K-12에서 kfoB 유전자가 콘드로이틴 생산에 필수적이지 않음을 이미 관찰했다. 에스케리키아 콜라이 B에서 콘드로이틴의 분비를 시험하기 위해, MSC347(MSC139 pCX044, 즉 pCX039△kfoB)을 30℃로 TB/Tc5 배지에서 성장시키고, 2 mM m-TA로 대략 0.15의 OD A600에서 유도했다. 48시간에서, 브로쓰 샘플을 취하고, 오토클레이빙의 존재 및 부재하에 원심분리하여 상청액 및 세포 펠렛 분획을 생성했다. 이 실험의 콘드로이틴 분석 결과는 하기 표 7b에 제시되어 있다. 오토클레이빙은 상청액 분획에서 90% 초과의 전체 측정가능한 rCH를 생성했다. 그러나, 비오토클레이빙 샘플에서는, 대략 30%의 콘드로이틴만이 상청액에서 관찰되었다. 이들 결과는 상기 상세한 바와 같은 재조합 에스케리키아 콜라이 K-12를 사용한 발견과 일치하며, 이는 오토클레이빙 단계(5분, 121℃, 15 psi)가 실질적으로 모든 rCH를 배지로 방출함을 시사한다. 이들 결과는 에스케리키아 콜라이 B 중의 영역 1 및 3 유전자가, 영역 2 유전자가 존재하는 경우, 콘드로이틴을 분비하도록 작용함을 추가로 나타낸다.
[표 7b]
세포 배양 배지 내로 콘드로이틴의 분비 및 배양 배지 내로 세포 결합 콘드로이틴의 방출은, 무세포이고 원심분리 또는 여과에 의해 세포로부터 분리된 후에 정제될 수 있는 콘드로이틴을 수득하는 방법을 제공한다. 또한, 콘드로이틴 생합성 유전자의 유전자 조작에 의해 세포내 콘드로이틴을 생산할 수 있다. 콘드로이틴의 세포내 생산은 배양 배지에서 고도의 다당류로부터 발생하는 발현 점도를 제거하기 위해 요구될 수 있다. 또한, 에스케리키아 콜라이에서 콘드로이틴 생산 및 콘드로이틴 생합성의 생화학에 대한 본질적인 제한은 불완전하게 이해되고 있다. 세포내 생산은 분비보다는 콘드로이틴의 보다 높은 수준을 달성할 수 있다. 따라서, 배양 배지로의 분비의 부재하에 현저한 수준의 콘드로이틴을 축적하는 재조합 유전자 세트가 동정되었다.
특정한 조건하에 다른 에스케리키아 콜라이 캡슐 다당류를 합성하고 세포내에 축적할 수 있다는 것은 문헌에 입증되어 있다. 브로너 등[참조: J. Bact. 1993;175:5984-5992]의 전자 현미경(EM) 결과는 kpsC 및 kpsS 내의 돌연변이체 결함에 의해 에스케리키아 콜라이 혈청형 K5 캡슐 다당류(헤파로산)의 일부 세포내 축적이 존재함을 시사했다. 유사한 관찰은, kpsC, kpsS, kpsE 또는 kpsT 중의 돌연변이체 결함을 EM으로 검사하는 경우, 에스케리키아 콜라이 K1의 폴리시알산 캡슐 다당류에 대해 시에스레비츠 및 빔르(Cieslewicz and Vimr)에 의해 보고되었다[참조: J. Bact. 1996;178:3212-3220]. 세포내 K1 및 K5 다당류의 수준은 이들 연구에서 정량화되지 않았다.
영역 1 또는 영역 3 유전자의 돌연변이가 에스케리키아 콜라이 K-12에서 재조합에 의해 생산된 콘드로이틴의 분비를 차단할 수 있는지를 측정하기 위해, kpsC 또는 kpsT 유전자가 결실된 플라스미드 pDD66의 유도체(각각 pCX045 및 pCX048)를 실시예 4에 기재된 바와 같이 작제했다. 이들 플라스미드를 MSC188에 형질전환시키고, 생성된 균주는 콘드로이틴을 생산하여 배양 배지로 분비하는 능력에 대해 MSC279(MSC188은 비변형된 pDD66을 함유한다)과 함께 시험했다.
배양물을 30℃에서 TB + Tc5 배지에서 성장시키고, 대략 0.15의 OD A600에서 2 mM m-TA로 유도하고, 48시간 후에 샘플링했다. 48시간 시점에서 각 균주에 대해, 콘드로이틴을 오토클레이빙 및 비오토클레이빙 샘플 둘 다로부터의 상청액 및 세포 펠렛에서 분석했다. 하기 표 7c에 제시된 바와 같이, 48시간에서의 OD는 동등했다. 각각 kpsC 및 kpsT 유전자가 결실된 균주 MSC356 및 MSC359로부터의 비오토클레이빙 샘플에서, 콘드로이틴은 주로(대략 85 내지 90%) 세포 펠렛으로 국지화되었다. 이는, 콘드로이틴의 대략 50%가 세포 펠렛으로 국지화되고 대략 50%가 상청액에 존재하는 MSC279(야생형 대조군)의 결과와 대조적이다.
[표 7c]
균주 MSC279에서 상기(표 7c) 기재된 바와 같이, MSC270 배양물의 비오토클레이빙 샘플에서 세포 펠렛으로 국지화된 콘드로이틴의 대부분은 세포 외막의 외엽에서 지질 앵커에 공유 부착되는 것 같다. 오토클레이빙은, 오토클레이빙의 부재하에 세포 결합되는 콘드로이틴과 세포 막의 결합을 파괴하는 것 같지만, 세포의 오토클레이빙 처리 효과는 완전히 이해되지 않는다. kpsC 또는 kpsT 결함 균주의 세포 펠렛으로 국지화되는 콘드로이틴 및 세포 사이의 결합 성질은 이들 데이타에 의해 해결되지 않는다. 원칙적으로, 이러한 콘드로이틴은 세포 세포질, 주변세포질 공간에 존재할 수 있거나, 세포 외막에 여전히 부착될 수 있다. 그러나, 이들 돌연변이 균주에 대한 결과는 kpsC 및 kpsT 에서 돌연변이가 콘드로이틴의 분비를 차단하고 콘드로이틴의 세포내 축적을 생성한다는 관찰과 일치한다. 세포 표면 상에 이러한 콘드로이틴의 존재는 비오토클레이빙 세포 펠렛을 재현탁시키고 재현탁된 세포를 CHase 효소로 처리하고 콘드로이틴 특이적 이당류의 생산을 측정함으로써 시험할 수 있다. 또는, 전자 현미경을 사용하여, MSC356 및 MSC359에 의해 생산된 세포 결합된 콘드로이틴의 세포 위치를 측정할 수 있다.
하기 상세한 추가의 실험은, 야생형 균주 MSC279를 이용하여 세포로부터 콘드로이틴의 방출에서 오토클레이빙의 역할을 확인하고 K4 영역 2 유전자만을 함유하는 에스케리키아 콜라이 K-12(MSC346; MSC188 pCX039)가 세포내 콘드로이틴을 생산할 수 있는지를 측정하기 위해 설계되었다. 균주 MSC279 및 MSC346은 30℃에서 TB/Tc5에서 성장시키고, 2 mM m-TA로 대략 0.15의 OD A600에서 유도했다. 48시간 후, 이중 브로쓰 샘플을 취하여, 원심분리 전에 오토클레이빙의 존재 및 부재하에 상청액 및 세포 펠렛 분획을 생성했다. 이들 샘플로부터의 콘드로이틴 분석 결과는 하기 표 7d에 제시되어 있다. 완전 콘드로이틴 생합성 유전자 세트를 함유하는 균주 MSC279로부터의 비오토클레이빙 샘플에서, 콘드로이틴은 상청액(55%) 및 펠렛(45%) 사이에서 대략 균일하게 분포되어 있었다. 대조적으로, 영역 2 유전자만을 함유하는 균주 MSC346으로부터 비오토클레이빙 펠렛은 당해 배양물에 의해 생산된 콘드로이틴의 대략 90%를 함유했고, 상청액에서는 거의 발견되지 않았다. 두 균주의 경우, 오토클레이빙은 주로(>90%) 상청액 내로의 CH의 분배를 생성했다.
[표 7d]
이들 결과는 오토클레이빙(5분, 121℃, 15 psi)이 배지 내로 모든 세포 결합된 콘드로이틴을 거의 방출함을 입증한다. 결과적으로, MSC279의 비오토클레이빙 세포 펠렛에서 검출된 콘드로이틴은 원칙적으로 외막에 결합할 수 있거나 세포내 위치를 갖는다. 오토클레이빙의 부재하에, 콘드로이틴은 균주 MSC346 배양물의 상청액에서 거의 발견되지 않았다. 이 결과는, 모든 영역 1 및 영역 3 기능을 결여하여 세포내 콘드로이틴만을 생성하는 MSC346과 일치한다. 보다 낮은 양의 콘드로이틴이 MSC279와 비교하여 MSC346에 의해 생산되지만, 생산된 콘드로이틴의 양은 여전히 현저하고, 이는 콘드로이틴이 재조합 에스케리키아 콜라이 K-12 중의 클로닝된 유전자 kfoABCFG만을 사용하여 성공적으로 생산될 수 있음을 입증한다. 이들 결과는 또한 이러한 콘드로이틴이 오토클레이빙에 의해 세포로부터 유리되고, 원심분리하여 세포 파편을 제거한 후에 오토클레이빙 배양물의 상청액에서 수득될 수 있음을 입증한다. 또는, MSC346의 세포는 공지된 다양한 방법(예: 균질화, 세정 및/또는 효소 용해, 기계적 분쇄, 초음파 등)에 의해 용해될 수 있고, 이들 방법에 의해 방출된 콘드로이틴은 또한 원심분리 후에 상청액에서 회수될 수 있다. 이렇게 회수된 콘드로이틴은 당해 기술분야에 공지된 알콜 침전 등의 방법으로 추가로 정제할 수 있다.
실시예
10
본 실시예는, 염색체에 삽입된 콘드로이틴 생합성 유전자를 함유하는 에스케리키아 콜라이 K-12 균주의 작제를 기재하며, 이들 균주에서 콘드로이틴 생산을 입증한다.
상기 실시예 6 내지 9는, 콘드로이틴 생합성 단백질을 인코딩하는 클로닝된 유전자를 이종성 숙주 균주로 도입하기 위해 플라스미드 벡터를 사용하여 재조합 에스케리키아 콜라이 균주에서 콘드로이틴을 생산하는 것을 기재한다. 몇몇 상황에서, 수용체 숙주 균주의 염색체 내로 클로닝된 콘드로이틴 생합성 유전자를 도입하는 것이 요구될 수 있다. 염색체내에 클로닝된 유전자를 위치시키는 것은, 콘드로이틴 생합성 유전자를 함유하여, 선택된 압력의 부재하에 안정한 발현 균주 또는 보다 안정한 발현 균주를 잠재적으로 제공할 수 있는 플라스미드(들)를 유지하기 위해 선택 압력을 유지하는 요구를 제거한다. 따라서, 콘드로이틴 생합성을 위한 에스케리키아 콜라이 K4 유전자가 숙주 염색체 내로 안정하게 통합되어 있는 에스케리키아 콜라이 K-12 균주를 작제하였다. 이들 "염색체 발현 균주"는 콜란산 생합성 유전자좌에서 통합된 pDD66 및 pBR1052로부터의 Pm 프로모터 및 K4 유전자 세트를 사용한다. 또한, xylS 조절 유전자가 별도의 유전자좌인 fhuA 유전자좌에서 염색체 내로 통합되었다. 생성된 작제물은 진탕 플라스크 및 발효조에서 높은 수준의 콘드로이틴을 생산하는 것으로 밝혀졌다(실시예 14 및 15).
발현 플라스미드 pDD66 및 pBR1052는 실시예 4에 기재되어 있다. pDD66 및 pBR1052로부터의 K4 콘드로이틴 생합성 유전자를, 실시예 3에 또한 기재되어 있는 pMAK-CL 치환 벡터 내로 클로닝하였다. 도 8l에 도시된 이러한 벡터는 콜란산(CA) 유전자 클러스터의 상부 및 하부에 클로닝된 DNA 영역을 함유하고, 이들 영역의 연결부에 유일한 AscI 클로닝 부위를 함유한다. 실시예 3에 상세한 바와 같이, 이러한 벡터를 사용하여, 에스케리키아 콜라이 K-12 W3110 중의 전체 CA 유전자 클러스터의 결실을 작제함으로써 균주 MSC188을 생성했다. K4 유전자 발현 카세트를 잘라내고, pDD66 및 pBR1052로부터 판매자 프로토콜에 따라 QIAEX II 겔 추출 키트(QIAGEN Inc., Valencia, CA)를 사용하여 대략 19 kb AscI 단편으로서 겔 정제하고, 이들 단편을, AscI-분해되고 포스파타제 처리되고 겔 정제된 pMAK-CL DNA와 연결시켰다. 형질전환체는 Pm 프로모터 및 상부 및 하부 전사 터미네이터와 함께 pDD66 및 pDD1052의 AscI 단편 상에 함유되는 테트라사이클린의 내성에 대해 선별했다. pBR1052 또는 pDD66의 AscI 단편을 함유하는 pMAK-CL의 유도체를 동정하고, 각각 pDD77 및 pDD76으로 명명했다. 이들 플라스미드는 도 8l에 도시되어 있다.
플라스미드 pDD74 및 pDD76을 MSC188에 형질전환시켜 각각 균주 MSC373 및 MSC377을 생성하고, K4 유전자 세트가 염색체 내로 통합된 이들 균주의 유도체를 다음과 같이 수득했다. MSC373 및 MSC377을 LB + 5 ㎍/mL 테트라사이클린(Tc5)에서 30℃로 밤새 성장시키고, 대략 20 μL의 분취량을 스폿팅하고, LB + Tc5 플레이트 내로 스트리킹하여 밤새 41℃에서 배양했다. 이 플레이트 상에 발생한 콜로니를 골라내고, 43℃에서 LB + Tc5 플레이트 상에 재스트리킹했다. 고온에서 플라스미드 함유 항생제 내성의 유지에 대한 선택은 염색체 내로 플라스미드의 재조합에 대해 선택하는데, 이는 pDD74 및 pDD76 플라스미드가 pMAK705 벡터의 유도체로서 복제에 대한 온도 민감성이기 때문이다[참조: Hamilton et al ., J Bact . 1989;171:4617-4622]. 테트라사이클린 상에서 43℃로 성장할 수 있는 MSC373 및 MSC377의 유도체를 30℃에서 LB + Tc5 액체 배지에서 밤새 한번 2차 배양하고, 이어서 30℃에서 LB 액체 배지(테트라사이클린 부재)에서 밤새 한번 2차 배양했다. 이어서, 이들 밤새 배양물을 희석하고, 30℃에서 LB 플레이트 상에 플레이팅하고, 분리된 콜로니를 30℃에서 LB, LB + Tc5 및 LB + 34 ㎍/mL 클로람페니콜(Cm34) 상에 이쑤시개로 찍어 넣었다. 하나의 테트라사이클린 내성(TcR), 클로람페니콜 민감성(CmS) 유도체가 각각의 MSC377 및 MSC373으로부터 동정되었다. 각각 MSC391 및 MSC392로 명명된 이들 TcR, CmS 유도체는 추정의 치환 균주였고, 여기서 재조합은 K4 DNA 서열이 CA 유전자좌에서 염색체에 잔류하는 방식으로 발생하는 반면, 플라스미드 서열의 나머지는 상동성 재조합에 의해 잘려지고 플라스미드가 후속적으로 소실되었다. 이들 분리물의 PCR 분석은 대략 19 kb K4 DNA 단편의 5' 및 3' 말단이 콜란산 유전자좌에 플랭킹하는 염색체 DNA 서열과 관련하여 예상된 위치에 존재함을 보여주었다.
실시예 4에서 상세한 바와 같이, 에스케리키아 콜라이 fhuA 유전자의 상부 및 하부의 DNA 영역을 PCR에 의해 클로닝하고, 조립하고, 서열분석하고, 이러한 결실 단편을 pMAK705 자살 플라스미드로 옮겨 pMAK705-△fhuA 또는 pDD73(도 8m)으로 명명된 fhuA 유전자좌에 대한 치환 벡터를 생성했다. xylS 조절 유전자를 다음과 같이 이 치환 벡터 내로 클로닝시켰다. xylS 유전자를 PstI 단편으로서 pDD42로부터 잘라내고, pDD73의 PstI 부위에 클로닝시켜 pDD77을 생성했고, 이는 도 8n에 도시되어 있다. pDD77의 PstI 단편은 발현 플라스미드 pDD66 및 pBR1052 및 모 벡터 pDD54에 존재하는 xylS 함유 PstI 단편과 동일하다. 상기한 바와 같은 K4 유전자 클러스터 치환 균주, MSC391 및 MSC392를 pDD77에 형질전환시켰다. pDD77에 의한 MSC391 및 MSC392로부터의 각각 2개 분리물을 선별하고 다음과 같이 명명했다:
MSC402 = MSC391 pDD77 "분리물 A"
MSC403 = MSC391 pDD77 "분리물 B"
MSC404 = MSC392 pDD77 "분리물 A"
MSC405 = MSC392 pDD77 "분리물 B"
이들 균주를 모두 콘드로이틴 생합성에 대해 진탕 플라스크에서 시험하였다. 균주를 30℃의 TB 배지 + CM34에서 성장시켜 pDD77 플라스미드의 유지에 대해 선별했다. 대략 0.2의 OD A600에서, 배양물을 2 mM m-톨루엔산(m-TA)의 첨가에 의해 유도했다. 샘플은 유도후 24 및 48시간에서 취하고, 콘드로이틴에 대해 분석했다. 4개의 모든 균주는 콘드로이틴을 생산했다. 이들 분석 결과는 하기 표 8a에 제시되어 있다. 유도된 MSC404 및 MSC405에 대한 콘드로이틴 수준은 MSC402 및 MSC403보다 대략 2.5배 높았다. 이 실험에서, MSC404 및 MSC405는 이들 배양 조건하에 진탕 플라스크에서 MSC279(MSC188 pDD66)으로 통상 관찰된 양(대략 0.5 g/L)의 약 65 내지 70%를 생산했다. 이들 결과는 K4 콘드로이틴 생합성 유전자의 단일 염색체 카피를 함유하는 재조합 에스케리키아 콜라이가 현저한 양의 콘드로이틴을 생산할 수 있음을 나타낸다.
[표 8a]
pBR1052로부터 유도된 균주(MSC404 및 MSC405)는 pDD66으로부터 유도된 균주보다 더욱 생산적인 것처럼 보였지만, 염색체 유전자 세트 둘 다는 콘드로이틴을 생산하기에 충분히 양호하게 작용했다. pBR1052로부터 유래된 염색체 K4 유전자는 kpsF 유전자 바로 상부에 삽입된 Pm 프로모터의 제2 카피를 함유한다. 이러한 부가된 프로모터는 pDD66에서의 발현과 비교하여 플라스미드 pBR1052에서 하부 유전자(kpsFEDUCS)의 발현을 향상시키는 것으로 밝혀졌다. 추가의 Pm 프로모터는 또한 염색체 환경에서 하부 유전자 발현을 증가시키고 이들 유전자의 향상된 발현은 CH 생산을 현저히 증가시킬 수 있다.
다음과 같이 2단계 "팝-인(pop-in)/팝-아웃(pop-out)" 방법을 사용하여 pDD77의 플라스미드-함유(plasmid-borne) xylS 유전자가 fhuA 유전자좌에서 염색체 내로 통합된 MSC403 및 MSC405의 유도체를 수득했다. MSC403 및 MSC405를 LB + Cm34에서 30℃로 밤새 성장시켰다. 이들 배양물을 104배로 희석시키고, 0.1mL 분취량을 43℃에서 LB + Cm34 상에 플레이팅시켰다. 밤새 배양한 후, 상이한 크기의 대략 100개 콜로니를 수득했다. 분리된 콜로니를 골라내고, LB + Cm34 플레이트 상에 스트리킹하고, 43℃에서 밤새 성장시켰다. 이들 플레이팅으로부터 분리된 콜로니를 골라내고, 임의의 항생제 없이 LB의 5 mL 배양물을 접종하는데 사용했다. 이들 배양물을 30℃에서 밤새 성장시키고, 이어서 1000배 희석하여 2회 계대 배양하고, 30℃로 LB에서 밤새 성장시켰다. 이어서, 이러한 3차 계대를 106배로 희석하고, 0.1 mL 분취량을 30℃ 및 37℃에서 LB 상에 플레이팅시켰다. 이들 플레이팅으로부터의 개개 콜로니를 LB 및 LB + Cm34 상에 이쑤시개로 찍어 넣어 플라스미드의 소실을 시험했다. 클로람페닐콜-민감성(CmS) 분리물은 용이하게 수득되었고, 이들을 PCR에 의해 스크리닝하여, xylS 함유 DNA 서열이 fhuA 유전자좌에서 염색체에 유지되면서 플라스미드 서열의 나머지가 잘라져서 플라스미드가 후속적으로 소실되는 방식으로 재조합이 발생하는 목적하는 "팝-아웃" 치환 균주를 동정했다. 이 작업은 또한 에스케리키아 콜라이 염색체로부터 전체 fhuA 유전자를 결실시켰다. 이들 분리물의 PCR 분석은 xylS DNA 단편의 5' 및 3' 말단이 fhuA 유전자좌에 플랭킹하는 염색체 DNA 단편에 대하여 예상된 위치에 존재함을 나타냈다. MSC403로부터 유도된 MSC410 및 MSC405로부터 유도된 MSC411은 fhuA 유전자좌에 삽입된 xylS 유전자를 함유하고, 콜란산 유전자좌에 삽입된 K4 유전자를 보유한다.
MSC410 및 MSC411을 콘드로이틴 생합성에 대해 시험했다. 균주를 30℃로 TB 배지 및 대략 0.2의 OD A600으로 성장시키고, 배양물을 2 mM m-TA의 첨가에 의해 유도했다. 샘플을 유도후 24시간 및 48시간에서 취하고, 콘드로이틴에 대해 분석했다. 하기 표 8b에 제시된 바와 같이, 이들 균주 모두는 매우 낮은 수준의 콘드로이틴을 생산했다.
[표 8b]
이러한 낮은 생산능은 예상치 못한 것인데, 이는 직전 조상 균주가 동일한 배양 조건하에서 필적하는 세포 밀도로 상당량의 콘드로이틴을 생산했기 때문이다. 먼저, 이들 결과는 xylS 유전자의 염색체 삽입이 유도인자 m-TA의 존재하에서도 Pm 프로모터를 활성화시키기에 충분한 양의 SylS 단백질을 생산하지 못하는 것을 나타낼 수 있다. 또는, 이들 균주에서 삽입된 K4 및/또는 xylS 유전자의 추정된 DNA 구조가 정확하지 않을 수도 있다. 상동성 콜란산 유전자좌 및 fhuA 유전자좌 서열에 플랭킹하는 염색체 서열과 관련하여 두 절편의 5' 및 3' 말단의 연결 관계는 PCR에 의해 입증되었다. 그러나, 이들 데이타는 단독으로 이들 균주에서 삽입된 DNA의 정확한 구조 및 서열을 확증하지 못한다. K4 또는 xylS DNA 절편 내의 재배열, 결실 또는 돌연변이가 이들의 개개 CH 생산 모균주(MSC403 및 MSC405)로부터 MSC410 및 MSC411의 유도 과정에서 발생되었을 수 있고, CH 생합성의 손상을 발생시켰을 수 있다.
이들 가설을 시험하기 위해 실험을 수행하였다. 플라스미드 pDD77을 MSC410 및 MSC411에 형질전환시켜 이들 두 균주에서 염색체 K4 유전자의 작용을 시험했다. 생성되는 균주는 MSC436(MSC410 pDD77 "분리물 A"), MSC437(MSC410 pDD77 "분리물 B"), MSC438(MSC411 pDD77 "분리물 A") 및 MSC439(MSC411 pDD77 "분리물 B")로서 명명하였다. 이들 균주는 30℃의 TB 배지 및 대략 0.2의 OD A600으로 성장시키고, 배양물은 2 mM m-TA의 첨가에 의해 유도했다. 샘플은 유도후 24 및 48시간에서 취하고, 콘드로이틴에 대해 분석했다. 하기 표 8c에 제시된 바와 같이, 이들 4개 균주는 이들의 선조 균주 MSC403 및 MSC405에서 관찰된 역가와 매우 유사하고 이들의 직전 조상 균주 MSC410 및 MSC411보다 훨씬 높은 콘드로이틴의 현저한 역가를 생성했다. 이들 결과는 균주 MSC410 및 MSC411에서 콘드로이틴 생합성의 결함은 K4 콘드로이틴 생합성 유전자 자체로부터 발생하지 않음을 나타냈다.
[표 8c]
이들 발견은 균주 MSC410 및 MSC411에서 콘드로이틴 생합성이 낮을 수 있음을 시사하며, 이는 (각각 MSC403 및 MSC405로부터) MSC410 및 MSC411의 생성 동안 발생할 수 있는 유전자 코딩 서열의 일부 구조적 오차로부터 발생하는 XylS 단백질 기능의 결함에 기인하거나, xylS 유전자 서열은 정확할 수 있지만 이들 작제물에서 염색체 xylS 유전자의 발현 수준이 K4 유전자의 최적 발현을 달성하는데 불충분할 수 있기 때문임을 제안한다.
MSC410 및 MSC411의 염색체 중 xylS 유전자를 이들 가설을 시험하기 위해 서열분석했다. xylS 유전자 삽입을 함유하는 에스케리키아 콜라이 염색체의 영역은 통합 부위의 측면에 위치하는 프라이머를 사용하여 PCR에 의해 증폭시키고, 증폭된 DNA 절편을 서열분석했다. xylS 프로모터 및 코딩 영역의 서열은 예상된 서열과 정확히 일치했다. 이 결과는 MSC410 및 MSC411에서 xylS 기능의 결함이 염색체 유전자로부터의 XylS 단백질의 불충분한 발현에 기인함을 시사했다. 따라서, xylS 유전자의 발현을 향상시키기 위해 실험을 수행하였다. 이를 위해, xylS 유전자 프로모터, 리보솜 결합 부위 및 5' 비해독된 영역(UTR)의 합성 최적화 버젼을 설계 및 합성했고, 이들 변형된 서열을 xylS 치환 벡터 pDD77 및 이어서 염색체로 도입했다.
합성된 단편은 pDD77의 BlpI-PstI 서열과 일치하는 134bp의 서열, 이어서 xylS의 ATG 개시 코돈까지의 86bp의 합성 서열을 함유하고, 유일한 BglII 부위를 통해 xylS 코딩 서열 내로 추가로 37bp 연장한다. ATG로부터 BglII 부위까지의 서열은 pDD77에 존재하는 서열과 일치한다. BlpI-BglII 단편은 pDD77 내로 용이하게 도입될 수 있는데, 이는 이들 제한 부위가 이 플라스미드에서 유일하기 때문이다. 86bp 합성 서열(하기 제시됨)(서열 번호 98)은 컨센수스 에스케리키아 콜라이 프로모터[참조: Hawley and McClure, Gene 1983;11:2237-2255.] 및 컨센수스 샤인-달가노(Shine-Dalgarno)(S-D) 서열[참조: Shine and Dalgarno Proc. Natl. Acad. Sci. U S A. 1974;71:1342-6]을 포함한다. 당해 서열은 또한 예상된 mRNA의 5' 말단에 스템-루프(stem-loop) 구조(밑줄친 문자로 나타냄)를 도입한다. 이들 특징 모두는 XylS 단백질의 충분한 발현을 촉진시킬 것으로 예상된다.
BlpI-BglII 단편(서열 번호 140)은 상업적 판매자(DNA2.0)에 의해 합성되었고, 변형된 서열을 함유하는 합성 DNA는, 천연 xylS 조절 서열을 함유하는 천연 BlpI-BglII 단편 대신에 BlpI-BglII 단편으로서 xylS 치환 벡터, pDD77 내로 클로닝되었다. 변형된 xylS를 함유하는 플라스미드(pDD79(도 8n)로 명명됨)는, Pm 프로모터를 활성화시키고 콘드로이틴 생산을 유도하는 변형된 xylS 유전자의 능력을 시험하기 위해 MSC392 내로 형질전환시켰다. pDD79를 함유하는 3개 MSC392 형질전환체를 골라내고, MSC458, MSC459 및 MSC460으로 지정했다. 이들 균주는, MSC392 모체와 함께, 표준 진탕 플라스크 실험으로 콘드로이틴 생산에 대해 시험했다. 균주를 30℃에서 TB 배지(MSC392) 또는 TB + Cm34(MSC458-460)에서 성장시키고 대략 0.2의 OD A600에서 배양물을 2 mM m-TA의 첨가에 의해 유도했다. 샘플은 유도후 24, 48 및 72시간에서 취했다. 48시간 샘플을 콘드로이틴에 대해 분석했다. pDD79 함유 균주 모두는 유도된 및 비유도된 배양물 둘 다에서 대략 300 ㎍/mL를 생산했다. 대조적으로, xylS 유전자를 결여하는 MSC392는 유도된 및 비유도된 배양물 둘 다에서 4 ㎍/mL 콘드로이틴만을 생산했다. 이들 결과는 하기 표 8d에 제시되어 있다.
[표 8d]
대략 300 ㎍/mL 콘드로이틴의 관찰된 값은, 플라스미드 pDD77 상에 천연 xylS 유전자를 함유하는 MSC405 및 MSC438의 유도된 배양물에서 관찰된 역가와 유사하다. 그러나, MSC458, MSC459 및 MSC460의 비유도된 및 유도된 배양물 둘 다는 실질적으로 동등한 CH 역가를 생성했다. 이 결과는 pDD79의 변형된 xylS 유전자에 의한 XylS의 증가된 생산과 일치하며, 이는 XylS의 과생성이 임의의 첨가된 유도인자의 부재하에 Pm 프로모터를 활성화시키는 것으로 보고되었기 때문이다[참조: Dominguez-Cuevas et al ., J. Bact . 2008;190:3118-3128.].
염색체 내로 삽입되는 경우, 변형된 xylS 유전자의 기능성을 시험하기 위해, 상기 실시예 3에 상세한 바와 같이 2단계 "팝-인/팝-아웃" 방법을 사용하여 pDD79의 플라스미드-함유 xylS 유전자가 fhuA 유전자좌에서 염색체 내로 통합된 MSC459의 유도체를 수득했다. MSC459를 30℃로 LB + 34 ㎍/mL 클로람페니콜(Cm34)에서 밤새 성장시키고, 43℃에서 LB + Cm34 상에 플레이팅시켰다. 밤새 배양한 후, 분리된 콜로니를 골라내고, LB + Cm34 상에 스트리킹시키고, 43℃에서 다시 밤새 성장시켰다. 이들 플레이팅으로부터 분리된 콜로니를 골라내고, 콜로니 PCR에 의해 시험하여 염색체 내로 플라스미드의 통합을 확인했다.
PCR에 의해 양성으로 시험된 2개 콜로니를 사용하여, 임의의 항생제 없이 LB의 5 mL 배양물을 접종시켰다. 이들 배양물을 30℃에서 밤새 성장시키고, 이어서 1000배 희석하여 계대하고, 30℃로 LB에서 밤새 성장시켰다. 이어서, 이들 배양물을 106배 희석하고, 0.1 mL 분취량을 37℃에서 LB 상에 플레이팅했다. 이들 플레이팅으로부터의 개개 콜로니를 LB 및 LB + Cm34 상에 이쑤시개로 찍어 넣어 플라스미드의 소실에 대해 시험했다. 클로람페니콜 민감성(CmS) 분리물은 용이하게 수득되었고, 각 배양물로부터 이러한 6개 분리물을 PCR에 의해 스크리닝하여, xylS 함유 DNA 서열이 fhuA 유전자좌에서 염색체 중에 잔류하면서 플라스미드 서열의 나머지가 잘려나가 플라스미드가 소실되는 방식으로 재조합이 발생한 목적하는 "팝-아웃" 치환 균주를 동정했다. 이 결과는 에스케리키아 콜라이 염색체로부터 전체 fhuA 유전자를 결실시켰다. 이들 분리물의 PCR 분석은 xylS DNA 단편의 5' 및 3' 말단이 fhuA 유전자좌의 측면에 위치하는 염색체 DNA 서열과 관련하여 예상된 위치에 존재함을 나타냈다. MSC459로부터 유도된 이러한 2개 균주, MSC466 및 MSC467은 이제 fhuA 유전자좌에 삽입된 xylS 유전자(합성 프로모터를 가짐) 및 콜란산 유전자좌에 삽입된 K4 유전자를 보유한다.
MSC466 및 MSC467을 진탕 플라스크에서 콘드로이틴 생합성에 대해 시험했다. 균주는 30℃의 TB 배지에서 성장시키고 대략 0.2의 OD A600에서 배양물을 0, 1, 2 또는 4 mM m-TA의 첨가에 의해 유도했다. 샘플은 유도후 24, 48 및 72시간에서 취했다. 48시간 샘플로부터의 콘드로이틴 분석 데이타는 하기 표 8e에 제시되어 있다. 두 균주는, 1 또는 2 mM m-TA로 유도하는 경우, 콘드로이틴의 상당한 역가(> 400 ㎍/mL)를 생성했다. 4 mM m-TA로 유도된 배양물은 다소 낮은 콘드로이틴 역가를 생성했다. 비유도된 배양물은 보다 적은 양의 콘드로이틴, 대략 160 내지 170 ㎍/mL를 생성했다. 이들 결과는, 합성 프로모터 및 최적화된 리보솜 결합 부위 및 5' UTR 헤어핀 구조를 갖는 변형된 xylS 유전자가 천연 xylS 유전자보다 효율적으로 발현되어, Pm 프로모터에 의한 K4 콘드로이틴 생합성 유전자의 전사 자극시에 더욱 효과적이라는 가설과 일치한다. 염색체 균주 MSC467 및 MSC466은 K4 콘드로이틴 생합성 유전자 또는 조절 xylS 유전자를 함유하는 어떠한 플라스미드도 포함하지 않고, 둘 다 상당량의 콘드로이틴을 생성할 수 있다.
[표 8e]
MSC467은 염색체 K4 유전자 클러스터의 kpsS 유전자의 바로 하부(3')의 염색체에 삽입된, pDD74(도 8l 참조)로부터 유도된 테트라사이클린 내성 유전자를 함유한다(도 8t 참조). 특정 플라스미드의 도입 및 유지를 위한 선별로서 플라스미드-함유 유전자에 의해 인코딩된 테트라사이클린 내성을 사용하기 위해, 이러한 염색체 테트라사이클린 내성 유전자를, 하기 상세한 바와 같이, 실시예 3에 기재된 "팝-인/팝 아웃" 방법을 사용하여 MSC467의 염색체로부터 결실시켰다. MSC467의 생성된 테트라사이클린 민감성 유도체는 MSC561로서 지정했다. MSC561의 작제는 다음과 같이 수행했다.
MSC467 및 pDD74에서 tetR 유전자의 바로 하부의 염색체 서열의 대략 900 염기쌍을 주형으로서 pDD74 DNA 및 프라이머 BLR476 및 BLR478을 사용하여 증폭시켰다:
BLR476 5> CGTCAAGCTTGTGAACGCCTATAGCAGCTTG >3 (서열 번호 101)
BLR478 5> CAGTGGCGCGCCGAGCGATGATAAGCTGTC >3 (서열 번호 102)
생성된 PCR 생성물을 HindIII 및 AscI으로 분해시키고, HindIII 및 AscI로 분해시켜 판매자 프로토콜에 따라 안타르틱 포스파타제(New England BioLabs, 미국 메사추세츠주 입스위치 소재)로 처리한 pMAK-CL(실시예 3 및 도 8l에 기재됨)에 연결시켰다. 연결 생성물을 에스케리키아 콜라이 NEB5α(New England BioLabs, 미국 메사추세츠주 입스위치 소재)로 형질전환시키고, 생성 형질전환체로부터 플라스미드 DNA를 진단 제한 엔도뉴클레아제 분해에 의해, 클로닝된 PCR 단편의 존재에 대해 스크리닝했다. 이러한 하나의 형질전환체로부터의 재조합 플라스미드를 pBR1087로 지정하고, 유전자 치환 실험에 사용하여 MSC467 염색체로부터 tetR 유전자를 결실시켰다. pBR1087의 구조는 도 8u에 도시되어 있다. 이 플라스미드를 30℃(mPAK705 기반 레플리콘의 복제에 허용되는 온도)에서 클로람페니콜 내성에 대해 선택하면서 MSC467로 형질전환시켰다. 이어서, 30℃에서 성장시킨 배양물을 34 ㎍/mL(Cm34)의 클로람페니콜의 존재하에 43℃에서 플레이팅시키고, 생성된 콜로니를 골라내고, 43℃에서 LB + Cm34 플레이트 상에 스트리킹시켰다. 생성된 콜로니는 표적 유전자좌에서 pBR1087의 통합에 대해 PCR에 의해 스크리닝하고, 당해 유전자좌에서 통합된 플라스미드 서열을 함유하는 것으로 동정된 분리물은 클로람페니콜의 부재하에 30℃에서 LB 액체 배지에서 2차 배양했다. 이어서, 이렇게 2차 배양된 분리물은 클로람페니콜의 부재하에 30℃에서 LB 상에 플레이팅시키고, 생성된 콜로니는 클로람페니콜 및 테트라사이클린에 대한 민감성에 대해 시험했다. 통합된 플라스미드가 잘려진 결과로서 tetR 유전자가 결실되어 있는 클로람페니콜 민감성, 테트라사이클린 민감성 유도체인 추정의 유전자 치환 균주가 수득되었고, 이러한 추정의 염색체 구조를 확인하기 위해 PCR에 의해 스크리닝했다.
tetR 유전자가 결실된 것으로 동정된 하나의 균주는 MSC561로서 지정했고, MSC561의 염색체 K4 유전자 클러스터의 구조는 도 8t에 제시되어 있다. 당해 결실은 kpsS 코딩 서열 하부의 71 bp로부터 콜란산 유전자좌 하부 서열의 5' 말단의 AscI 부위까지이다. 당해 결실은 전체 tetR 유전자를 포함한다.
실시예
11
본 실시예는 영역 1 및 3 유전자에 대한 K4 영역 2 유전자(kfoABCFG)의 유전자 용량을 증가시키면 에스케리키아 콜라이 K-12 진탕 플라스크 배양물에서 상당히 더 많은 콘드로이틴 생산을 유도한다는 것을 입증한다.
에스케리키아 콜라이 K-12 균주 MSC467(실시예 10)은 Pm 프로모터의 조절하에 콜란산 유전자좌에서 영역 1, 2 및 3을 그리고 합성 컨센수스 프로모터의 조절하에 fhuA 유전자좌에서 xylS를 함유한다. 플라스미드 pCX039(실시예 4)는 Pm 프로모터의 조절하에 영역 2 kfoABCFG 유전자를 함유하고, 또한 천연 xylS 유전자를 함유한다. pCX039는 균주 MSC499를 생성하기 위해 MSC467로 형질전환시켰다. 대조군 균주 MSC498은 pDD63(실시예 4)을 MSC467로 형질전환시켜 생성했다. 가변성 유도인자 농도를 갖는 진탕 플라스크 배양물(TB/Cm34 배지, 30℃, 72hr) 중에서 콘드로이틴 생산을 이러한 두 균주에 대해 측정했다(표 9a).
[표 9a]
이들을 플라스미드 상에 제시함으로써 영역 2 유전자 용량을 증가시키면 명백하게 높은 콘드로이틴 생산을 유도했다. 비교적 높은 수준의 생산은 유도 없이 균주 MSC499에서 나타났다. 이는 아마 MSC499 염색체 중에 존재하는 변형된 xylS 유전자의 향상된 발현에 기인하는 K4 유전자의 비유도 발현에 기인하였다. 상기 주목된 바와 같이, 높은 수준의 XylS 단백질은 첨가된 유도인자의 부재하에서도 Pm 프로모터를 활성화시킬 수 있다고 공지되었다[참조: Dominguez-Cuevas et al., 2008]. 추가의 플라스미드-인코딩된 XylS가 이 플라스미드 시스템 중에서 최적의 콘드로이틴 생산에 필요한지의 여부를 측정하기 위해, xylS 유전자가 결실된 플라스미드 pDD63 및 pCX039의 유도체를 작제했다. 이들 플라스미드는 각각 1049 bp 단편 내의 전체 xylS 유전자 코딩 서열의 측면에 위치하는 2개의 Nsi I 제한 부위를 함유한다(참조: 실시예 4). 이러한 플라스미드의 샘플을 NsiI로 분해시키고, 효소를 불활성화시키기 위해 가열 처리한 다음, T4 DNA 리가아제로 처리하여 xylS 유전자 단편이 결여된 환상 플라스미드를 생성하였다. pDD63ΔNsi를 먼저 에스케리키아 콜라이 MSC188(실시예 3)로 형질전환시켰다. 특성화된 pDD63ΔxylS 플라스미드는 pCX069라 명명했다. 이 플라스미드를 후속적으로 에스케리키아 콜라이 MSC467(실시예 10)로 형질전환시켜 균주 MSC510을 생성시켰다. pCX039ΔNsi 샘플을 직접 MSC467로 형질전환시키고, 특성화된 ΔxylS 플라스미드를 pCX074라 명명했다. 이들 균주 + MSC498 및 MSC499 대조군 균주에 의한 콘드로이틴 생산은 본 실시예에서 이미 기술된 바와 같이 측정하였고, 결과는 표 9b에 제시된다.
[표 9b]
pCX039로부터 xylS의 결실은 생산된 콘드로이틴의 최대량을 감소시키지 않았지만, 높은 유도인자 수준이 최고 수준을 달성하는데 필요했고, 표 9b에서 MSC511 대 MSC499를 참조한다. 이 결과는 XylS 수준, 유도인자 수준, K4 유전자 보충 및 콘드로이틴 생산능의 상호관련성을 예시한다.
상기 실시예 4는 fhuA 유전자좌에서, 모두 합성 컨센수스 프로모터로부터 발현된, xylS 및 영역 2 kfoABCFG 유전자의 에스케리키아 콜라이 염색체로의 삽입용으로 설계된 pMAK705-기반 치환 플라스미드인 플라스미드 pDD80 유도를 기술한다. 하기 표 9c는 과잉 염색체 요소로서 pDD80을 함유하는 MSC467(염색체 xylS) 및 MSC392(xylS 없음) 균주(실시예 10)에서 콘드로이틴 생산을 기술한다.
[표 9c]
pCX039를 사용하는 경우와 유사하게, 플라스미드 pDD80은 K4 콘드로이틴 생합성 유전자(영역 1, 2 및 3)의 전체 보충의 염색체 카피를 함유하는 에스케리키아 콜라이 숙주 균주에서 콘드로이틴 생산을 향상시켰다. 유도는 염색체 중에 xylS 카피의 존재 또는 부재와 무관하게 pDD80을 함유하는 균주에서 콘드로이틴 생산에 대해 거의 효과가 없었다. 이는 아마도 강한 합성 프로모터에 의해 유도되고, mRNA 5-프라임 말단에 첨가된 최적화된 리보솜 결합 부위 및 헤어핀 구조를 함유하는 변형된 xylS 유전자의, 다중카피 플라스미드로부터의, 발현에 기인하는, 이들 균주에서의 비교적 높은 수준의 XylS의 결과이다.
실시예
12
본
실시예는
균주
MSC467
의 염색체에
kfo
ABCFG
유전자의 단일 추가 카피의 부가가 콘드로이틴 생산을 증가시킴을 입증한다.
상기 실시예 11은 진탕 플라스크 중에서 균주 MSC467에 의한 콘드로이틴 생산이 Pm 프로모터의 조절하에 K4 영역 2 유전자 kfoABCFG의 과잉 카피를 플라스미드 pCX039 상의 MSC467에 도입시킬 경우에 크게 향상되었다는 것을 입증한다. 유사한 결과가 플라스미드 pDD80을 MSC467에 도입할 경우에 수득되었다. 실시예 4에 기술된 플라스미드 pDD80은 상기 실시예 10에 기술된 합성 xylS 프로모터의 전사 조절하에 kfoABCFG 유전자를 함유한다. 이들 결과는 kfoABCFG 유전자로 인코딩된 하나 이상의 단백질의 수준을 증가시키면 콘드로이틴 생산을 상당히 증가시킨다는 것을 나타낸다. 다중-카피 플라스미드 상에서 이들 유전자의 클로닝은 이들 단백질의 생산을 증가시키는 하나의 방법을 제공한다. 플라스미드 발현 플랫폼을 사용하지 않고 이러한 단백질의 생산을 증가시키는 또 다른 방법은 이들 유전자의 다수의 카피를 숙주 유기체의 염색체에 삽입시키는 것이다.
kfoABCFG 유전자 세트의 제2 카피를 합성 xylS 프로모터의 전사 조절하에, 변형된 xylS 유전자의 바로 하부의, fhuA 유전자좌에서 MSC467의 염색체로 삽입했다. 이러한 목적을 위해 치환 벡터를, 실시예 4에 상세한 바와 같이 pDD79의 양립성 NsiI 내로 pCX039로부터 분해된 PstI 단편 상의 kfoABCFG 유전자를 클로닝함으로써 작제했다. 생성되는 플라스미드, pDD80에서, kfoABCFG 유전자는 강한 구성적 프로모터인 것으로 설계된 합성 xylS 프로모터에 의해 전사된다. pDD80을 MSC467로 형질전환시켜 상기 실시예 10에서 진탕 플라스크에서 약 1g/L 콘드로이틴을 생산하는 것으로 밝혀진 균주 MSC522를 제조했다. 치환 균주(MSC537)는 상기 실시예 3 및 실시예 10에 상세한 바와 같은 pMAK705-기본 플라스미드 치환 공정을 통해 MSC522로부터 유도했다. 이 균주는 MSC467 염색체 중에 xylS 유전자의 바로 하부의, fhuA 유전자좌에서 삽입된 kfoABCFG 유전자의 하나의 추가의 카피를 보유한다.
MSC537을 콘드로이틴 생산에 대해 MSC467과 병행하여 시험했다. 배양물을 30℃로 TB 배지에서 0.01 OD A600에서 접종시켰다. 약 0.10의 OD에서, 배양물을 1 mM m-TA를 첨가하여 유도하였고, 추가의 72시간 동안 배양시켰다. 샘플을 유도후 48시간 및 72시간에 콘드로이틴 분석용으로 취했다. 유도후 72시간에서 MSC537은 0.57 g/L의 콘드로이틴을 생성한 반면, MSC467은 0.45 g/L를 수득했고; MSC 467에 대해 MSC537의 경우 약 25% 증가했다. 추가의 양태에서, MSC537 및 MSC467을 진탕 플라스크에서 콘드로이틴 생산에 대해 동시에 시험했을 경우, MSC537이 일관적으로 MSC467보다 많은 콘드로이틴(20 내지 30%)을 생산했다. 이 결과는 K4 영역 2 유전자 kfoABCFG의 단일 추가 카피를 MSC467 염색체에 부가하면, kfoABCFG 유전자의 다중 카피의 부가가 균주 MSC499 및 MSC522 중의 콘드로이틴 생산을 증가시키는 정도와 동일하지는 않지만 콘드로이틴 생산을 증가시킬 수 있음을 나타낸다. 다중-카피 플라스미드 상에 클로닝된 kfoABCFG 유전자를 함유하는 이들 두 균주는 MSC467보다 약 2배 이상의 콘드로이틴을 생산한다(참조: 실시예 10). 플라스미드 pCX039를 MSC537로 형질전환시켜 균주 MSC551을 생성했다.
MSC467과 같이, MSC537 균주는 MSC537에 존재하는 염색체 K4 유전자 클러스터의 kpsS 유전자의 바로 하부(3')에서 염색체에 삽입된 pDD74(참조: 도 8l)로부터 유래된 테트라사이클린 내성 유전자를 함유한다. 상기 주목된 바와 같이, 일부 양태에서, 균주가 테트라사이클린 민감성인 것이 바람직하다. 따라서, tetR 유전자는 동일한 공정 및 MSC467의 염색체로부터 tetR 유전자를 결실시키기 위한 실시예 10에서 상기 기재한 바와 같은 치환 플라스미드(pBR1087)를 사용하여 MSC537의 염색체로부터 결실시켰다. 생성되는 MSC537의 테트라사이클린-민감성 유도체는 MSC562로 지정했다. 진탕 플라스크 실험에서, MSC562 및 MSC537를 30℃에서 TB 배지에서 성장시켰고, 1 mM의 m-TA를 첨가하여 유도했다. 유도 후 72시간에서 수거한 배양 샘플의 콘드로이틴 역가를 측정하고, MSC562의 경우 0.51 g/L 대 MSC537의 경우 0.57 g/L로 서로 견줄만한 것으로 밝혀졌다.
도 8q에 도시된 바와 같은 kfoABCFG 유전자를 함유하는 플라스미드 pCX039, 및 도 8i에 도시된 백터-단독 대조군 플라스미드 pDD63을 균주 MSC562 내에 형질전환시켜 각각 MSC564 및 MSC563을 생성했다. 진탕 플라스크 실험에서, MSC563 및 MSC564를 플라스미드 선별을 위해 테트라사이클린 함유 TB 배지(5㎍/mL)에서 30℃로 성장시키고, 1 mM m-TA로 유도했다. 유도후 72시간에서, MSC564 및 MSC563의 배양물은 각각 0.81g/L 및 0.29 g/L의 역가의 콘드로이틴을 생성했다.
배양물이 테트라사이클린의 존재하에 성장된 이 실험에서, MSC564에서 pCX039의 플라스미드 보유가 매우 효율적이었다. MSC564의 72시간 배양물로부터의 샘플을 희석시키고, LB 플레이트 및 5㎍/mL 테트라사이클린을 함유하는 LB 플레이트 상에 플레이팅시켰다. 콜로니 형성 단위(CFU)의 역가는 이들 두 플레이팅 조건하에 유의하게 상이하지 않았다: LB 상의 1.16 x 109 CFU/mL 대 LB + 테트라사이클린 상의 1.28 x 109 CFU/mL. 따라서, 이 실험 조건하에, 어떤 플라스미드의 소실도 검출되지 않았다.
kfoABCFG 유전자의 추가 카피의 MSC537의 염색체로의 후속적인 부가는 이 균주에서 콘드로이틴 생산을 추가로 증가시킬 것으로 기대된다. 이들 유전자의 추가의 카피는 실시예 3에 상세한 유전자 표적화 공정을 사용하여 기타 염색체 유전자좌에 삽입시킬 수 있다. 이들 유전자의 통합을 위한 추가의 부위로서 작용할 수 있는 광범위한 종류의 비필수 유전자좌가 에스케리키아 콜라이에서 공지되었다. 또한, kfoABCFG 유전자 세트의 둘 이상의 카피로 구성된 직렬 어레이를 유전자 치환 플라스미드 상에서 작제하여 단일 유전자 치환 사건으로 염색체에 도입할 수 있었다.
또한, kfoABCFG 유전자에 의해 인코딩된 단백질의 생산을 증가시키는 추가의 방법은 단백질 코딩 서열의 코돈 최적화, 및 프로모터, 리보솜 결합 부위 및 이들 유전자의 mRNA의 5-프라임 비해독 영역의 최적화를 포함한다. 이러한 서열 최적화는 플라스미드 벡터로부터 발현된 유전자 및 염색체에 삽입된 유전자에 적용할 수 있었다.
실시예
13
본 실시예는 플라스미드 벡터 및 염색체 통합을 사용하여 잔토모나스 캄페스트리스로의 콘드로이틴 생합성 유전자의 도입을 기재하고, 진탕 플라스크 중에서 잔토모나스 캄페스트리스에서 재조합 DNA 매개된 콘드로이틴 생합성을 입증한다.
구체적으로, K4 생합성 유전자의 조합물을 함유하는 플라스미드의 작제 및 잔토모나스 캄페스트리스 균주 MSC255로의 이들의 도입이 본원에서 기재된다. 콘드로이틴 생합성 유전자 및 이의 서브세트를 크산탄 검 오페론의 결실 부위에서 잔토모나스 캄페스트리스 균주 MSC255 염색체에 안정하게 삽입하기 위한 플라스미드 pKM001 및 pKM002(실시예 3에 기술됨)의 유도체의 용도가 추가로 기술된다.
과잉 염색체 요소로서 콘드로이틴 생합성 유전자의 잔토모나스 캄페스트리스로의 도입
본 발명자들은 거대한 플라스미드를 에스케리키아 콜라이 공여체로부터 직접(예: 삼조 크로스를 통해) 또는 에스케리키아 콜라이 균주로부터 정제된 플라스미드로서(예: 전기천공을 통해 - 이하 참조) 잔토모나스 캄페스트리스에 도입하면, 잔토모나스 캄페스트리스 중의 생성되는 플라스미드에서 구조적 변칙성을 유도할 수 있다는 것을 발견했다. 비교적 작은 플라스미드는 이 현상에 덜 민감한 것으로 나타나고, 이는 거대한 DNA 분자에 비교적 큰 효과를 갖는 잔토모나스 캄페스트리스에 고유한 제한 시스템에 기인할 수 있다[참조: Feyter and Gabriel, J. Bact. 1991;173:6421-6427, da Silva et al., Nature 2002;417:459, Roberts et al., Nuc. Acid Res. 2010;38:D234]. 본 발명자들은 이 효과를 성공적으로 극복한 두 접근법을 사용했다. 하나의 접근법에서, 영역 1, 2 및 3 유전자를 포함하는 거대한 플라스미드를 잔토모나스 캄페스트리스 형질전환체로부터 정제된 작은 플라스미드로부터 재작제하였다. 제2 접근법에서, 영역 1, 2 및 3 유전자를 두(소형) 적합성 플라스미드 사이에서 분할하였다.
전기천공을 사용하여 플라스미드를 잔토모나스 캄페스트리스 세포에 도입했다[참조: Oshiro et al, J. Microbiol. Method 65:171-179, 2006]. 플라스미드 pDD67(실시예 4에 기술됨)을 제한 효소 BamHI 및 RsrII(이는 영역 2 유전자에 결합됨)로 분해하고, 이어서 (블런트 말단을 생성하기 위해) T4 DNA 폴리머라제와 반응시키고 연결시켰다. 생성되는 혼합물을 에스케리키아 콜라이로 형질전환시키고, 테트라사이클릭-내성 분리물을 특성화했다. 이어서, Pm 구동된(driven) 영역 1 및 3 유전자를 함유하는, 도 10a에 도시된 생성되는 플라스미드, pKM005를 전기천공에 의해 잔토모나스 캄페스트리스로 형질전환시켜 균주 MSC338을 생성했다. 또한, pCX039(실시예 4)를 잔토모나스 캄페스트리스로 형질전환시켜 MSC326을 생성했다. MSC338로부터 정제된 플라스미드 pKM005, 및 MSC326으로부터 정제된 pCX039를 각각 HindIII + AvrII로 분해시키고, pKM005로부터 영역 1, 3 단편을 pCX039의 벡터/영역 2 단편과 연결시켰다. 생성되는 혼합물을 테트라사이클린-내성에 대한 선별과 함께 MSC255로 직접 형질전환시켰다. 하나의 잔토모나스 캄페스트리스 형질전환체, MSC348은 에스케리키아 콜라이로 역 이전되었던 플라스미드의 제한 분해에 의해 pDD67로부터 구별되지 않는 플라스미드 pKM007(도 10a)을 함유하는 것으로 밝혀졌다. 대조군 목적으로, 잔토모나스 캄페스트리스 균주 MSC255를 pDD63 벡터로 형질전환시켜 균주 MSC397을 생성했다.
플라스미드 pJAK15(ATCC77290, ATCC로부터 수득)는 IncQ 부적합성 그룹에 속하고, 카나마이신 내성을 인코딩한다. pKM005(Pm-구동 영역 1 및 3 함유; 상기 참조)로부터의 HindIII/AvrII 단편을 pJAK15로부터의 벡터/카나마이신 내성 HindIII/XbaI 단편과 연결시켰다. 도 10b에 도시된 바와 같은 생성되는 플라스미드 pKM006은 각종 pBHR1-유래 플라스미드와 양립성인 벡터 상에 유도성 영역 1 및 3 유전자를 함유한다. 균주 MSC326(MSC255 pCX039)을 카나마이신 및 테트라사이클린 내성에 대해 동시 선택성을 가진 pKM006으로 형질전환시켜 균주 MSC350을 생성했다.
AscI, SbfI, SwaI 및 XhoI 클로닝 부위를 함유하는 짧은 DNA 올리고뉴클레오티드 링커를 pKM001 및 pKM002에서 상동성의 상부 및 하부 영역의 접합부를 규정하는 NotI 제한 부위에 도입시켜 녹-아웃 벡터 pKM001 및 pKM002를 먼저 변형시켰다. 링커는, pKM001 및 pKM002의 NotI 분해에 의해 생성된 것들과 양립성인 일본쇄 오버행이 존재하도록, 어닐링된 올리고뉴클레오티드 prKM015 및 prKM016으로부터 제조하였다. 각각 pKM008 및 pKM009로 지정된 생성 플라스미드는, AscI 제한 부위가 상부 영역에 인접하도록 배향된 링커를 함유한다.
K4 영역 2 유전자(kfoA, kfoB, kfoC, kfoF 및 kfoG)만을 갖는 치환 벡터는 다음과 같이 작제했다: pKM008을 SbfI-XhoI 또는 AscI-XhoI로 분해시키고, pCX039를 SbfI-SalI 또는 AscI-SalI로 분해시켰다. SbfI-SalI 처리는 pCX039로부터 kfoABCFG-함유 단편을 생산하고, AscI-SalI 처리는 Pm 프로모터-kfoABCFG-함유 단편을 생산한다. 이들 단편은, 먼저 SbfI-XhoI 또는 AscI-XhoI로 분해시킨 pKM008로 클로닝하여 각각 플라스미드 pKM010(kfoABCFG: Pm-) 및 pKM011(kfoABCFG: Pm+)을 생성하였다. 플라스미드 pKM010(서열 번호 145) 및 pKM011(서열 번호 146)를 사용하여, K4 영역 3(kpsF, kpsE, kpsD, kpsU, kpsC 및 kpsC) 및 영역 1(kpsM 및 kpsT) 유전자를 또한 도입한 추가의 치환 벡터를 작제했다. pKM010 및 pKM011를 SbfI-AvrII로 분해시키고, 선형화된 이들 벡터를 pDD67의 SbfI-AvrII 분해에 의해 생산된 kpsFEDUCSMT-함유 단편과 연결시켰다. 생성된 플라스미드를 pKM012(Pm-) 및 pKM013(Pm+)로 지정했다. 플라스미드 pKM010(서열 번호 145) 및 pKM012(서열 번호 147)의 유도체화는 도 10c에 도시되어 있다. 플라스미드 pKM011(서열 번호 146) 및 pKM013(서열 번호 148)의 유도체화는 도 10d에 도시되어 있다.
pKM008 - pKM013 작제물 모두에 클로닝된 크산탄 검 유전자 클러스터의 상부 영역은 gum 유전자 클러스터 프로모터를 포함하는 것으로 보고되어 있다[참조: Federico et al; J. Bact. 1996;178:4313-4318]. 따라서, 염색체 내로 재조합된 pKM010 또는 pKM012로부터 유래된 서열을 함유하는 잔토모나스 캄페스트리스 균주는 내인성 gum 프로모터로부터 K4 유전자를 전사할 것으로 예상된다. 대조적으로, pKM011 및 pKM013은 gum 프로모터 및 Pm 프로모터 사이에 위치된 터미네이터 서열(pDD67로부터 유래됨)을 갖는다. 따라서, pKM011 또는 pKM013 서열을 함유하는 재조합 잔토모나스 캄페스트리스에서 K4 유전자의 발현은 Pm/XylS 시스템에 의해 조절될 것으로 예상된다.
각각의 이들 치환 플라스미드에 있어서, (결실된) gum 유전자좌에서 잔토모나스 캄페스트리스 균주 MSC255의 염색체 내로 각 K4 유전자를 재조합하기 위해 (상기 상세한) "팝-인/팝-아웃" 방법을 사용하였다. 당해 플라스미드를 테트라사이클린 내성의 선별과 함께 전기천공에 의해 MSC255 내로 도입시켰다. 중간 및 최종 균주는 하기 표 10a에 제시되어 있다. gum 유전자좌에서 "팝-인"이 발생한 재조합체를 PCR에 의해 동정하였다. 통합체의 분리(resolution)는 항생제 선택의 부재하에 배양함으로써 발생했고, 이어서 테트라사이클린 민감성("팝-인") 유도체를 동정하였다. 이어서, PCR을 사용하여, 각각의 K4 유전자 클러스터가 목적하는 배향으로 gum 유전자좌 내로 성공적으로 통합된 "팝-아웃" 유도체를 동정했다. 이어서, 플라스미드 pDD63(xylS 유도인자 유전자를 함유)를, Pm 프로모터가 K4 유전자 세트를 구동하는 재조합체 내로 형질전환시켰다. 4개 주요 잔토모나스 염색체 삽입 균주(플라스미드 인코딩된 K4 유전자를 함유하지 않음)인, MSC480, MSC469, MSC461 및 MAC494의 유전자 구조는 표 10a에 요약되어 있다.
[표 10a]
재조합 잔토모나스 캄페스트리스의 진탕 플라스크에서의 콘드로이틴 생산
달리 언급하지 않는 한, 콘드로이틴 생산의 평가를 위한 진탕 플라스크에서의 잔토모나스 캄페스트리스 균주의 성장은 YMG 배지(5g/L 프로테오스 펩톤, 3 g/L 효모 추출물, 3 g/L 맥아 추출물, 10 g/L 글루코즈)에서 수행했다. 배양물은 통상 48시간 동안 선별에 요구된 항생제(예: 2 내지 5 ㎍/mL 테트라사이클린, 10 ㎍/mL 카나마이신)과 함께 200 내지 225 rpm으로 250 mL 성장 플라스크 중의 50 mL 배지에서 30℃로 성장시켰다. Pm-구동된 유전자 세트의 유도를 위해, 배양물 밀도가 대략 OD600=0.5에 도달할 때 2 mM m-Ta를 첨가했다.
염색체외 K4 생합성 유전자를 갖는 균주. 다양한 플라스미드로 형질전환시킨 잔토모나스 캄페스트리스 균주 MSC255(ΔgumB-gumM)에서 콘드로이틴 생산은 상기한 바와 같이 배양 및 분석함으로써 측정했다. 결과는 표 10b에 제시되어 있다.
[표 10b]
공 벡터를 함유하는 대조군 균주 MSC397은 검출가능한 콘드로이틴이 없었다. 영역 1, 2 및 3 유전자를 함유하는 균주 MSC348 및 MSC350은 이들 조건하에 약 40 ㎍/mL 콘드로이틴을 생산했다. 영역 2 유전자만을 함유하는 균주 MSC326은 약 100 ㎍/mL 콘드로이틴을 생산했다.
또 다른 실험에서, kfoABCFG 유전자를 함유하는 균주 MSC326(MSC255 pCX039)에서 콘드로이틴 생산은 48시간 후에 166 ㎍/mL이었고, 대조군 균주 MSC397(MSC255 pDD63 - 벡터 대조군)은 검출가능한 콘드로이틴을 생산하지 못했다. MSC326 배양물의 비오토클레이빙 샘플로부터의 분획에서, 무세포 상청액 및 세포 펠렛 분획은 각각 100 ㎍/mL 및 71 ㎍/mL 콘드로이틴을 함유했다. 이들 결과는 K4 영역 2 유전자(프럭토실화 개시 유전자 제외)가 잔토모나스 캄페스트리스에서 콘드로이틴 생산에 충분함을 시사하고, 콘드로이틴이 일부 특성화되지 않은 내인성 메카니즘 또는 세포 파괴 또는 용해에 의해 세포로부터 이출되는 것을 추가로 시사한다.
염색체에 의해 인코딩된 K4 생합성 유전자를 갖는 균주. 상기 기재된 염색체외 플라스미드는, 상이한 빈도로, 항생제 내성의 소실에 의해 규정된 바와 같이 배양물 중의 박테리아 세포로부터 소실된다. 잔토모나스 캄페스트리스 염색체 내로 K4 생합성 유전자의 통합은 이들 균주의 대규모 배양을 촉진시킬 뿐만 아니라 이러한 불안정성을 최소화시켜야 한다. 염색체 통합된 K4 유전자(상기 참조)를 갖는 4개 균주에서의 콘드로이틴 생산은 하기 표 10c에 제시되어 있다. 당해 균주를 48시간 동안 변형된 YMG 배지(YMGM(5): 80 mM MOPS(pH 7.0)로 완충된 YMG, 5 g/L 글루코즈) 또는 TB 배지에서 성장시켰다. 테트라사이클린은 pDD63를 갖는 균주에서 5 ㎍/mL로 존재한다. 콘드로이틴은 프로모터 둘 다 및 배지 둘 다로부터 생산되었다. 중요하게는, 콘드로이틴은 영역 2 유전자만이 존재하는 경우에 생산되었다. 표 10c 참조.
[표 10c]
또 다른 실험에서, 선택된 균주는 상이한 글루코즈 농도로 YMGM 배지에서 성장시켰다. 콘드로이틴은 생합성 유전자의 세트를 함유하는 균주에서 모든 글루코즈 농도에서 생산되었다(그러나, 이러한 유전자를 결여하는 대조군 균주에서는 생산되지 않음). 이들 조건하의 최대 생산은 Pm/xylS 유도의 조절하에 영역 2 유전자만을 함유하는 균주 MSC469에서 390 ㎍/mL였다. MSC469의 YMGM + 10 g/L 글루코즈 배양물의 비오토클레이빙 무세포 상청액 및 세포 펠렛의 분석은 각각 167 ㎍/mL 및 150 ㎍/mL 콘드로이틴인 것으로 밝혀졌다. 전과 같이, 이들 결과는 콘드로이틴이 세포로부터 이출되는 것을 시사한다. 표 10d 참조.
[표 10d]
실시예
14
본
실시예는
프럭토실화된
및
비프럭토실화된
콘드로이틴을 분석하는 방법을 기재한다.
박테리아로부터 콘드로이틴의 제조
재조합 콘드로이틴(rCH)는 음이온-교환기 DEAE-셀룰로즈 DE52 컬럼을 사용하여 포획했다. 5용적의 100 mM NaCl로 세척한 후, 컬럼을 5용적의 300 mM NaCl로 용출시켰다. 용출물을 농축시키고, 10용적의 증류수에 투석했다. 투석된 용액을 동결건조시켰다. 동결건조 분말을 rCH로서 사용했다.
프럭토실화된 콘드로이틴 캡슐 다당류(K4P)를 문헌[참조: Manzoni, M. et al ., Biotechnology Letters 1996;18:383-386]의 방법에 따라 균주 U1-41(Escherichia coli O5:K4:H4)의 배양물로부터 정제했다. K4P로부터 탈프럭토실화된 K4P(DFK4P)의 제조는 문헌[참조: Lidholt, K., et al ., J. Biol . Chem. 1997;272: 2682]의 방법에 따라 수행했다.
샘플 제조 및
HPLC
에 의한 콘드로이틴 분석
플라스크 배양물 샘플(통상 5 mL)을 5분 동안 > 15 psi에서 121℃로 오토클레이빙시키고, 냉각시켰다. 이어서, 샘플을 오토클레이빙 동안의 소실에 기인하여 필요한 만큼의 물로 본래 용적까지 재조절했다. 샘플(1.5 내지 5 mL)을 원심분리(통상 세포 밀도가 보다 낮은 플라스크 배양물의 경우에 10분 동안 3500g; 발효 또는 보다 고밀도 배양물의 경우에 5분 동안 12000g)하여 상청액 및 펠렛 분획을 수득했다. 몇몇 경우, 나타낸 바와 같이, 샘플을 사전 오토클레이빙 없이 원심분리했다. 배양물 샘플 또는 분리된 상청액 및 펠렛은 통상 분석할 때까지 -20℃에서 저장했다.
세포 결합된 콘드로이틴의 분석을 위해, 세포 펠렛을 본래 용적의 50mM 인산나트륨 완충제(pH 7.2)에 재현탁시키고, 5 내지 10mg/mL 리소자임(Sigma L-7561) 및 60 U/mL 데옥시리보뉴클레아제 I(Sigma D-4527)로 37℃에서 2시간 동안, 이어서 100 ㎍/mL 프로테이나제 K(Promega V3021)로 37℃에서 1시간 동안 가수분해했다. 반응을 종결한 후(90℃, 5분), 용액을 원심분리하여 세포 파편을 제거했다.
프럭토실화된 콘드로이틴 캡슐 다당류(K4P)의 분석을 위해, 샘플(플라스크/발효조 상청액 또는 원심분리 가수분해된 세포 펠렛)을 먼저 온화한 산 가수분해(즉, HCl로 pH 1.5까지 조절됨)를 사용하여 탈프럭토실화시키고; 80℃에서 30분 동안 배양한 다음, 0.5 M 탄산나트륨으로 중화시켰다. 동결건조 전에, DFK4P 샘플 및 비프럭토실화된 rCH 샘플(발효조 상청액, 동결건조된 세포 펠렛 또는 재구성된 침전물)을 탈이온수에 대해 밤새 투석하거나(PPierce Biotechnology Slide-A-LyzerR, 분자량 컷-오프 7 kD), 탈이온수로 용출시키는 원심분리 한외여과(Amicon Ultra-0.5 Centrifugal Filter Device, 10kD 명목상 분자량 컷-오프)로 부분 정제했다.
프럭토실화되지 않은 콘드로이틴은, 콘드로이티나제 ABC(Seikagaku Biobusiness, Japan)으로 명명된 콘드로이틴-분해 효소에 의해 불포화 비설페이트화 이당류인 2-아세트아미도-2-데옥시-3-O-(β-D-글루코-4-엔피라노실루론산)-D-갈락토즈(Δdi-0S)로 완전히 가수분해될 수 있다. 결과적으로, 프럭토실화되지 않은 샘플 용액 중의 콘드로이틴의 양은 HPLC 시스템을 사용하여 다당류로부터 효소에 의해 생산된 당해 이당류를 정량화함으로써 측정할 수 있다.
동결건조 후의 잔사를 THB(50 mM 나트륨 아세테이트를 갖는 50 mM 트리스-HCl 완충제, pH 8.0)에 용해시키고, 콘드로이틴 ABC(2 단위/mL, 3시간 동안 37℃)로 가수분해시켰다. 90℃에서 5분 동안 가열시켜 효소 반응을 종결시킨 후, 혼합물을 5분 동안 10000 rpm으로 원심분리하여 불용성 침전물을 제거했다. 상청액은 마이크로콘 원심분리 필터(Ultracel YM-10; Millipore)를 사용하여 여과하여 효소 및 비-콘드로이틴 다당류를 제거했다. 생성된 불포화 이당류(2-아세트아미도-2-데옥시-3-O-(β-D-글루코-4-엔피라노실루론산)-D-갈락토즈; Δdi-0S)는 역상 이온쌍 HPLC(Senshu Pak Docosil, 4.6 x 150 mm; 입자 크기, 5 ㎛)로 분리하고, 2-시아노아세트아미드로 컬럼후 표지하고, 형광[참조: Toyoda, H., et al . J. Biol . Chem., 2000; 275:2269]으로 검출하고, 상업적으로 입수가능한 콘드로이틴(Seikagaku Biobusiness, Japan) 또는 rCH로부터 제조된 외부 표준에 대해 정량화했다. 이당류에 대한 통상의 보정 곡선은 도 11b에 도시되어 있다. 이당류에 대한 보정 곡선은 2 내지 200 ㎍/mL 범위에서 선형이었고, 이당류의 검출 한계는 1 ㎍/mL이었다. 콘드로이틴 다당류의 농도는 다음 식을 사용하여 계산할 수 있다.
농도; ㎍/mL = [A] / [S] ×[D],
여기서, [A]는 샘플 크로마토그램에서 Δdi-0S의 피크 면적이고, [S]는 Δdi-0S 농도에 대한 보정 곡선의 기울기이고, [D]는 희석 계수이다.
프럭토실화된
콘드로이틴의 정량화를 위한
ELISA
방법
K4P의 카복실기를 통한 비오티닐화 결합은 문헌[참조: Osmond, R. I.W. et al ., Analytical Biochemistry 2002;310: 199-207]의 방법에 따라 수행했다. 100 ㎕의 비오티닐화 K4P(1 ㎍/ml)를 실온에서 30분 동안 스트렙토아비딘 코팅된 96-웰 미세역가 플레이트(Thermo Scientific, Japan)에 접합시켰다. 플레이트를 0.05 % 트윈R 20 및 0.05% 프로클린(pH 7.5)으로 보충된 50 mM 트리스-HCl 완충된 염수(NaCl 100 mM)을 사용하여 세척한 후, 50 ㎕의 배양 상청액 또는 표준 K4P 용액, 및 50 ㎕의 2.5 x 106로 희석도의 항-K4P 혈청(Statens Serum Institut, Denmark)을 웰에 첨가하고, 60분 동안 항온처리하였다. 웰을 다시 세척한 후, 2000배 희석도의 HRP-표지된 항-래빗 면역글로불린(P0448, DAKO JAPAN, Japan)을 첨가하고, 60분 동안 항온처리하였다. 웰을 다시 세척한 후, H2O2를 함유하는 TMB 용액(TMBW-1000-01, BioFX Laboratories Inc., Owings Mills, MD)을 기질로서 첨가하고, 실온에서 30분 동안 배양했다. 50 ml의 정지 시약(STRP-1000-01, BioFX Laboratories Inc., Owings Mills, MD)을 첨가하고, 450 nm에서의 흡광도를 측정했다. 이들 분석 조건하에, 다른 다당류, 예를 들면, 프럭토실화되지 않은 콘드로이틴, 헤파로산 및 DFK4P는 K4P와 경쟁하지 않는다. 통상의 표준 곡선은 도 11a에 도시되어 있다.
rCH
,
K4P
및
DFK4P
의
SEC
-
HPLC
분석
다당류의 중량 평균 분자량("Mw") 및 콘드로이티나제-분해능은, 굴절률 검출기 및 TSK-겔 PWXL-4000, PWXL-3000 및 PWXL-2500(TOSOH, Japan)의 직렬 컬럼이 구비된 TOSOH HLC-8220GPC 시스템을 사용하여 0.6 mL/분의 일정 유속에서 0.2 M NaCl로 SEC-HPLC 상에서 분석함으로써 측정했다. 50 ㎕의 다당류 용액을 컬럼 상에 0.6 mg/mL의 농도로 주입했다. 컬럼 및 검출기 구획은 40℃로 유지시켰다. Mw 규정 콘드로이틴 설페이트(Mw: 52.2, 31.4, 20.0, 10.0, 6.6 및 1.0 kDa)를 분자량 기준으로 사용했다.
콘드로이티나제 ABC 분해 전후의 rCH(프럭토실화되지 않음)의 전형적인 용출 프로파일은 도 12에 도시되어 있다. rCH의 계산된 중량 평균 분자량은 120 kDa였다.
K4P 및 DFK4P의 콘드로이티나제 분해능의 측정은 다음과 같이 수행했다. K4P 및 DFK4P를 50 mM THB(50 mM 나트륨 아세테이트를 갖는 트리스-HCl, pH 8.0)에 용해시켜 1 mg/mL의 최종 농도를 수득하고, 동일한 부분으로 나누었다. 용액 부분은 상기한 바와 같이 SEC-HPLC 상에서 직접 분석했다. 또 다른 부분은 동일한 시스템 상에서 분석한 다음, 콘드로이티나제 ABC(최종 농도: 2 단위/mL)로 37℃에서 3시간 동안 처리했다. 결과는 도 13에 도시되어 있다. 에스케리키아 콜라이 K4 U1-41의 배양물로부터 제조한 K4P 및 DFK4P의 분자량 값은 각각 33 kDa 및 28 kDa이었다. DFK4P는 콘드로이티나제 처리에 의해 이당류, Δdi-0S로 완전히 분해된 반면, K4P는 효소로 부분 분해되었다(도 13). 이들 결과는 K4P가 상기한 바와 같은 탈프럭토실화 처리에 의해 K4P의 콘드로이틴 골격 구조에 영향을 미치지 않고서 탈프럭토실화 형태로 전환되었음을 나타냈다. 결과적으로, 샘플 중의 K4P의 양은 또한, 샘플이 효소 분해 전에 탈프럭토실화 처리로 처리되는 경우, 콘드로이티나제/HPLC 방법을 사용하여 다당류로부터 효소에 의해 생산된 이당류를 정량화함으로써 측정할 수 있다.
실시예
15
본
실시예는
콘드로이틴의
황산화를
설명한다.
실시예 14에서 제조된 콘드로이틴을 부분 해중합화시켜 분자량 약 30 kDa의 콘드로이틴을 수득했다. 30 mg의 이 콘드로이틴을 60℃에서 교반시키면서 0.6 mL의 무수 포름아미드(FA)에 용해시켰다. 용액이 완전히 균질화되면, 고형 황 트리옥사이드-TEA 복합체(5당량의 콘드로이틴 이당류 단위)를 첨가하고, 교반을 120분 동안 지속했다. 황산화 반응은 3용적의 1M 나트륨 아세테이트의 첨가에 의해 중단시키고, 실온에서 30분 동안 추가로 정치시켰다. 용액을 3일 동안 증류수에 대해 투석하고, NaOH로 중화시키고, 백색 분말(32 mg, 107%)로 동결건조시켰다. 재조합 콘드로이틴 설페이트의 추가 분석은 분자량 29 kDa, 5.2%의 황을 입증했다.
또 다른 실험에서, 상기한 콘드로이틴(50 mg)을 주위 온도에서 1.0 mL의 무수 포름아미드(FA)에 용해시켰다. 용액이 투명해지면, 클로로설폰산(5당량의 CH 이당류 단위)를 서서히 첨가하고, 20분 동안 연속 교반하면서 유지시켰다. 황산화 반응은 3배 용적의 1M 나트륨 아세테이트 용액을 첨가하여 중단시키고, 추가로 10분 동안 실온에서 정치시켰다. 용액을 3일 동안 증류수에 대해 투석하고, NaOH로 중화시키고, 동결건조시켜 백색 분말(47 mg, 94%)을 수득했다. 재조합 콘드로이틴 설페이트의 분석은 분자량 33 kDa, 5.2 %의 황을 나타냈다.
실시예
16
본 실시예는 콘드로이틴 생합성 영역 2 유전자 세트(kfoABCFG)가 에스케리키아 콜라이 균주 MSC562에서 콘드로이틴 생산의 최대 향상에 충분함을 설명한다.
영역 1, 2 및 3(R1, R2 및 R3) 유전자 세트의 조합을 함유하는 플라스미드 세트는 pBR1052(도 8k) 및 pDD67(도 8j)로부터 제조했다. 상기한 바와 같이, 유전자 세트는 출발 플라스미드를 특정 제한 효소로 분해시켜 결실시켰다; 예를 들면, T4 폴리머라제를 사용한 블런트 말단의 생성; 및 생성 벡터 단편의 연결. 에스케리키아 콜라이 균주 MSC188(실시예 3)을 연결 반응물로 형질전환시키고, 선택된 항생제 내성 형질전환체를 목적하는 특성에 대해 평가했다. pBR1052가 영역 1 유전자 세트에 선행하는 제2 Pm 프로모터를 함유하는 사실에 기인하여, 여기에 기재된 플라스미드 중의 일부는 제2 Pm 프로모터를 함유한다. 이들 기재된 플라스미드 모두는 xylS를 함유한다. 하기 표 11에서, R1 = kpsFEDUCS, R2 = kfoABCFG, 및 R3 = kpsMT이다. "Pm:R2" 플라스미드는 미리 작제되었음에 주목한다(pCX039; 실시예 4). 플라스미드 pCX096(서열 번호 149), pCX097, pCX100, pCX101(서열 번호 150) 및 pCX102에 대한 DNA 맵은 도 14a, 14b, 14c, 14d 및 14e에 각각 도시되어 있다. 플라스미드 pCX097 및 pCX101은 각각 pCX100 및 pCX102에 대한 출발 플라스미드로서 사용되었다.
[표 11]
최종 플라스미드 각각을 숙주 균주 MSC562에 형질전환시켜 하기 표 12에 제공된 균주를 생성했다. 이들 균주 및 기존 대조군 균주를 2xM9/tet5 배지를 갖는 진탕 플라스크에서 성장시키고, 대략 0.1 내지 0.12의 OD600 값에서 1 mM 메타-톨루엔산으로 유도하고, 성장(OD600) 및 72시간 후의 rCH 생산에 대해 평가했다.
[표 12]
최대 생산능은 영역 2(MSC564) 단독 또는 영역 2와 1의 조합(MSC683)을 함유하는 플라스미드를 갖는 균주에서 관찰되었다. 영역 2 및 3의 조합(MSC688)은 보다 낮은 생산능을 나타냈다. 사실, 플라스미드-함유 영역 3의 존재는 다른 관련 균주 대조군에서 억제를 나타냈다(예를 들면, MSC683 vs MSC690). 이들 발견은 균주 MSC562에서 영역 2 카피 수만을 증가시킴으로써 rCH 생산능의 증가 방법을 뒷받침한다.
실시예
17
본
실시예는
콘드로이틴 생합성 유전자 영역 2의 포지티브 카피 수 효과가
kfo
ABCDG 유전자 5개 모두를 필요함을 설명한다.
플라스미드 pCX039(도 8q; 영역 2 유전자 kfoABCFG 함유)는 숙주 에스케리키아 콜라이 균주 MSC562에 존재하는 경우에 rCH 생산의 거대한(8 내지 10배) 증가를 유도했다(공 벡터 pDD63을 함유하는 MSC562와 비교하여). pDD66 및 pDD67로부터의 유전자 결실에 대한 상기한 방법(실시예 4 참조)을 사용하여, 2개 세트의 플라스미드를 pCX039로부터 유도하여, pCX039에 의해 생산된 rCH의 자극에 대한 개개 영역 2 유전자의 역할을 입증했다.
5개 플라스미드 중의 1개 세트는 영역 2 유전자 중 1개 제거의 효과를 평가하기 위해 설계되었다. MSC562 등의 에스케리키아 콜라이 숙주에서, 이들 유전자의 1개 카피가 여전히 존재할 것이다(염색체 내로 통합됨). 이 세트의 플라스미드는 각각의 kfoABCFG가 개별적으로 결실된 pCX039 유도체를 포함했다. 하기 표 13은 kfo 유전자의 결실에 사용된 제한 효소 및 생성 플라스미드의 명칭을 수록한다. 상기 실시예 4는 pCX044의 유도체화를 상세히 기재한다. 모든 플라스미드는 xylS를 함유한다.
[표 13]
이들 플라스미드를 숙주 균주 MSC562(영역 1, 2 및 3 + xylS의 염색체 카피) 내로 형질전환시켜 하기 표 14에 제시된 균주를 생성했다. 배양물은 30℃에서 2xM9 배지(10 g/L 글리세롤 및 2 ㎍/mL Tet를 가짐)에서 성장시키고, 대략 0.1의 OD600 값에서 1 mM mTA로 유도하고, 성장 72시간 후에 rCH 생산에 대해 분석했다.
[표 14]
이들 결과는 모든 5개의 영역 2 유전자(kfoABCFG)가 이들 조건하에 최대 생산능을 달성하는데 요구됨을 나타낸다. 또한, MSC563에 대한 결과는 염색체 삽입으로부터 kfoABCFG 유전자의 발현이 플라스미드 함유 유전자 카피의 부재하에 현저한 rCH 생산을 뒷받침하기에 충분함을 나타낸다.
제2 세트의 pCX039 유도체는 숙주 균주 MSC562에서 rCH 역가의 향상에 대한 개개 플라스미드-함유 영역 2 유전자의 존재 효과를 평가하기 위해 설계되었다. 생성 플라스미드 중에서 견줄만한 발현 수준을 유지하는 수단으로서, 프로모터-인접 kfoA 유전자가 모든 작제물에 유지되었다. 이러한 설계 전략은 완전 분리시에 플라스미드 인코딩된 kfoB, C, F 또는 G 유전자의 평가를 허용하지 않지만, kfoA 유전자의 보유, 및 모든 이들 플라스미드에서 Pm 프로모터와 제1 판독 프레임 사이의 생성된 고정 관계는 Pm 프로모터로부터의 발현 수준을 필적하게 할 것으로 예상된다. 상기와 동일한 전략을 사용하여, 다음 유도체화(표 15)를 수행했다. 모든 플라스미드는 xylS를 함유한다.
[표 15]
최종 세트의 플라스미드 각각을 숙주 균주 MSC562 내로 형질전환시켜 하기 표 16에 제공된 균주를 수득했다. 이들 균주 및 MSC563 및 MSC564 대조군을 2xM9/tet2 배지를 갖는 진탕 플라스크에서 성장시키고, 0.08 내지 0.18의 OD600 값에서 1 mM meta-톨루엔산에 의해 유도하고, 성장(OD600) 및 68시간 후의 rCH 생산에 대해 평가했다.
[표 16]
이들 데이타는 K4 영역 2 유전자(kfoABCFG)의 어떤 것도 개별적으로는 MSC562 숙주 균주에서 rCH 생산을 최대로 자극하는데 충분하지 않음을 입증한다. 상기한 발견(예: 실시예 16)과 함께 고려하면, 영역 2 유전자 세트의 모든 5개 유전자를 포함하는 것은 rCH 생산을 최대로 향상시킨다는 것이 명백하다.
실시예
18
본 실시예는 보다 많은 콘드로이틴 생산을 위해 콘드로이틴 생합성 유전자 영역 2의 증가된 염색체 카피 수를 위한 작제물을 설명한다.
실시예 12는, 영역 1, 2 및 3의 단일 염색체 카피를 이미 함유하는 에스케리키아 콜라이 숙주에서 영역 2 유전자 세트(kfoABCFG)의 단일 염색체 카피의 부가가 rCH 생산에 있어서 상당한 20 내지 30% 증가를 유도함을 입증한다. 실시예 11은, 영역 2 유전자 세트를 함유하는 복수 카피 플라스미드를 함유하는 유사한 숙주가 rCH 생산에 있어서 300% 증가를 유도함을 입증한다. 높은 생산능의 플라스미드 비함유 균주를 생성하는 목적에 따라, 본 실시예는, 이러한 삽입체의 동정을 촉진하기 위해 특이적으로 선택된 다양한 비필수 염색체 유전자 내로 이들을 삽입함으로써 영역 2 카피(Pm 프로모터에 의해 유도됨)의 염색체 상보성을 증가시키도록 설계된 플라스미드의 작제 및 용도를 기재한다. 상동성 구동된 "팝-인/팝-아웃" 방법(실시예 4 및 12 참조)을 사용하여 영역 2 유전자 세트의 카피를 숙주 에스케리키아 콜라이 염색체 내의 상이한 유전자좌로 성공적으로 삽입함에 있어서 목적하는 유전자좌 대신에 기존의 영역 2 삽입체 내로의 바람직하지 않은 표적화(방법 유도된 재조합)에 대한 경쟁이 증가한다. 따라서, 보다 많은 노력 및 시간 소비적인 PCR 대신에 단순한 콜로니 스크리닝에 의해 목적하는 유전자좌에서 삽입체 함유 균주를 초기에 동정하는 수단을 가지면 숙주 균주에서 영역 2 카피의 수가 상승함에 따라 점차 유리해진다.
본 실시예에서, 3개의 에스케리키아 콜라이 표적 유전자좌가 기재되어 있다. 이들은, 각각 당 락토즈, 만니톨 및 프럭토즈 상에서의 성장에 필수적이지만 글루코즈 또는 글리세린 등의 다른 탄소원 상에서의 성장에는 필수적이지 않은 유전자 lacZ, mtlA 및 fruBKA 오페론(일부 경우에 단순화를 위해 "fruA"로 지칭됨)이다. 이들 유전자에 대해 파괴된 균주의 콜로니는 콜로니 색차에 의해 맥콘키(MacConkey)[참조: Miller, JH, Experiments in Molecular Genetics, 1972] 등의 표시 아가 상에서 시각적으로 동정될 수 있다: 도입된 당을 이용할 수 있는 균주의 경우에 분홍색/적색 및 유전자 파괴(예: 삽입체)를 갖는 균주의 경우에 백색/연분홍색. 또는, LB/Xgal/IPTG 아가 배지(ibid.)를 사용하여 락토즈 대사에서 결함을 검출할 수 있다: 락토즈를 이용할 수 있는 균주의 경우에 청색 콜로니 및 락토즈를 이용할 수 없는 균주(예: lacZ 유전자 내에 삽입체를 갖는 균주)의 경우에 백색/담황색 콜로니. 색차를 사용하는 이와 같은 방법은 삽입체를 갖는 콜로니 모집단 중에서 목적하는 유전자좌 내로의 삽입체를 갖는 균주를 시각적으로 동정하게 한다. 당해 기술분야의 통상의 지식을 가진 자는 목적하는 삽입체 성과의 스크리닝 또는 선별을 가능하게 하는 다른 표적 유전자좌가 에스케리키아 콜라이에 존재함을 인지할 것이다: 비제한적 예는 pepP, pepQ, feuA(cirA), malB(lamB), nupA(tsx)을 포함한다.
fruBKA, lacZ 및 mtlA 유전자 내로 영역 2("R2")의 삽입을 위해 플라스미드 pMAK705의 사용을 촉진하기 위해, 다중 클로닝 부위를 함유하는 pMAK705의 유도체를 먼저 개발했다. 프라이머 DHD266c 및 DHD267c는 다중 제한(클로닝) 부위(NotI, XhoI, AscI, SalI, BglII, HindIII)의 일본쇄 절반을 함유하고, AseI 및 ClaI을 사용한 pMAK705의 분해에 의해 생성된 오버행에 적합한(어닐링되는 경우) 2-염기 일본쇄 말단을 제외하고 상보성이다. AseI 또는 ClaI 제한 부위 어떠한 것도 이들 적합한 말단의 결찰시에 재생되지 않는다.
플라스미드 pMAK705를 AseI 및 ClaI로 분해시키고, 벡터 단편을 겔 정제했다. 인산화된 올리고뉴클레오티드 DHD266c 및 DHD267c를 어닐링시키고(각각 200 nM 올리고뉴클레오티드, 5분 동안 90℃, 30분 동안 50℃로 완만한 냉각), 이어서 pMAK705 벡터 단편에 연결시켰다. 연결 반응물을 클로람페니콜 내성에 대한 선별과 함께 에스케리키아 콜라이 NEB10β 내로 형질전환시켰다. 분리된 형질전환체로부터의 플라스미드를 PCR에 의해 및 MCS 제한 효소 부위의 존재에 대해 스크리닝했다. MCS 영역의 서열분석은 목적하는 구조를 갖는 플라스미드를 동정했다. 이 플라스미드는 pMAK705pl(서열 번호 157; 도 14q)로 명명되었다.
R2를 fruBKA, lacZ 및 mtlA 유전자좌 내로 삽입하기 위한 3개 벡터의 작제는 모두 동일한 2단계 방법을 취했다. 제1 단계에서, 상부 및 하부 상동성 영역은 PCR 생성물의 "내부" 말단 사이의 어닐링을 허용하는 PCR 프라이머를 사용하여 각 표적 유전자좌에 대해 생성했다. 이러한 상동성 영역은 R2의 부가를 위해 이후에 사용된 다중 제한 부위를 포함한다. 제2 단계에서, 각 유전자좌에 대한 상부 및 하부 PCR 생성물을, 개개 주형 구성원을 합성하기 위해 본래 사용된 2개의 "외부" 프라이머와 PCR 반응에서 혼합했다. 상부 및 하부 PCR 생성물(단계 2에서 이제 주형) 내에 설계된 말단 상동성으로 인해, 단계 2 반응의 결과는 다중 클로닝 부위 측면에 위치하는 상부 및 하부 영역의 적절한 배향을 포함하는 DNA 단편이었다. 단계 2로부터의 PCR 생성물을 효소로 분해시켰으며, 효소의 인지 서열은 "외부" 프라이머로 설계되었다: 상부 말단의 경우에 NotI 및 하부 말단의 경우에 HindIII. 이어서, 이들 단편을 NotI 및 HindIII로 분해시킨 pMAK705pl(서열 번호 157) 내로 각각 클로닝시켰다. 생성된 3개의 플라스미드는, R2 카피의 수용에 사용되는 다중 클로닝 부위(MCS)의 측면에 위치하는 적절히 배향된 상부(UP) 및 하부(DN) 영역 약 900 내지 1000bp를 함유했다. pBR1093의 경우, MCS는 약 20bp의 lacZ 코딩 영역을 치환했다. pBR1094의 경우, MCS는 mtlA 코딩 영역 내로 삽입되었다. pBR1095의 경우, MCS는 fruB의 3-프라이머 말단, fruK 모두, 및 fruA의 5-프라이머 말단을 치환했다. 이들 중간 작제물의 제조에 사용된 프라이머는 하기 표 25에 수록되어 있다.
pBR1093, pBR1094 및 pBR1095 내로 클로닝하는 영역 2 유전자 세트를 제조하기 위해, kfoABCFG 유전자를 PacI + ClaI을 사용하여 pCX074(실시예 11 참조)로부터 (Pm 프로모터 없이) 분해시켰다. 이어서, 정제된 R2 단편을 동일한 효소로 분해된 pJ201:11352(도 8b 참조) 내로 클로닝시켰다. 이는 kfoABCFG 유전자가 Pm 프로모터 뒤에 다시 배향되어 있는 플라스미드 pBR1096을 생성했다. 이제, 그러나, Pm:R2는 pBR1093(도 14s), pBR1094(도 14v) 및 pBR1095(도 14w) 내로 클로닝하기 위한 XhoI/AscI 단편으로서 pBR1096으로부터 분리할 수 있다. 표 17은 최종 치환 pMAK705-기반 Pm:R2 삽입 플라스미드pBR1100(lacA 유전자좌의 경우), pBR1101(mtlA 유전자좌의 경우) 및 pBR1102(fruBKA 유전자좌의 경우)의 설계를 제공한다. 프라이머 DHD280c, DHD281c, DHD283, DHD285, DHD268c, DHD269c, DHD271, DHD273, DHD274c, DHD275c, DHD277 및 DHD279의 서열은 각각 서열 번호 158 내지 169에 제시되어 있다.
[표 17]
상기한 "팝-인/팝-아웃" 방법을 플라스미드 pBR1100(서열 번호 171; 도 14t), pBR1101(서열 번호 172; 도 14v) 및 pBR1102(서열 번호 170; 도 14x)에 사용하여 선택된 에스케리키아 콜라이 균주에 추가의 Pm:R2 카피를 제공했다. 균주를 클로람페니콜 내성에 대해 선택하면서 30℃에서 pBR1100, pBR1101 또는 pBR1102에 형질전환시켰다. 이어서, 형질전환체를 43℃에서 맥콘키(MacConkey)/프럭토즈/Cm 아가(pBR1102 형질전환체의 경우), 맥콘키/만니톨/Cm 아가(pBR1101 형질전환체의 경우) 또는 LB/Xgal/IPTG/Cm 아가(pBR1100 형질전환체의 경우)에 플레이팅시켰다. 뚜렷하게 착색되지 않은 콜로니를 추가의 분석을 위해 선택했다. 이들 중에서, 표적 유전자좌 내로 통합된 플라스미드를 갖는 균주를 PCR에 의해 동정했다. 이어서, 성공적으로 통합된 플라스미드를 갖는 균주를 클로람페니콜 선택의 부재하에 다중(예: 20 내지 30) 세대용으로 성장시켰다. 이들 배양물로부터 유래된 콜로니를 클로람페니콜 민감성(플라스미드의 절단 반영) 및 당 대사의 결함(표적화 Pm:R2 삽입의 보유 반영)에 대해 스크리닝했다. 목적하는 표현형을 갖는 분리물을 정확한 염색체 구조에 대해 PCR에 의해 평가했다. 도 15는 본 실시예 및 다른 실시예에 기재된 방법을 사용하는 균주 유도에서의 다중 단계를 도시한다. 설명 및 요약으로서, 균주 MSC702는 다음과 같은 주요 요소를 함유한다: 콜란산 유전자좌에 삽입된 Pm[kpsMTkfoABCFG]Pm[kpsFEDUCS], fhuA 유전자좌에 삽입된 Psyn[xylS], fruBKA, lacZ 및 mtlA에 삽입된 Pm[kfoABCFG], 및 (MSC691로부터의 이의 유도에 기인하여 추정됨; 실시예 19 참조) leuB 유전자 내의 8 염기쌍 변화.
실시예
19
본 실시예는 에스케리키아 콜라이 균주에서 자발적-발생 영양요구체의 동정 및 교정을 설명한다.
최소 성장 배지에서 rCH 생산에 대한 재조합 에스케리키아 콜라이 균주를 평가하는 과정 동안, 특정 균주가 성장하지 않음이 발견되었다. 이어서, 균주 MSC561는 류신 공급원으로 수정되는 경우에만 최소 배지 상에서 성장하는 것으로 측정되었다; 즉, 이 균주는 류신 영양요구체이다. MSC561에서 류신 생합성 오페론 leuABCD의 서열분석은 당해 균주가 류신 원영양체 MSC467로부터 이의 유도 동안 leuB 유전자 코딩 영역 내의 단일 염기쌍 결실(코딩 영역의 위치 383에서 C/G 염기쌍)을 동시에 획득했음을 나타냈다(실시예 10 참조). 이러한 결실은 판독 프레임 쉬프트 및 조기 해독 종결을 생성했다. 이러한 결함은, 유전자 조작 및 초기 생산 시험이 복합체 배지에서 수행되었기 때문에 초기에는 검출되지 않았다. 이러한 돌연변이는 fhuA 및 콜란산 유전자좌에서 이전 표적화 재조합의 결과인 것 같지는 않은데, 이는 이들이 leuB에 친밀하게 연결되어 있지 않기 때문이다(fhuA 및 leuB은 약 85 Kb 떨어져 있다; 콜란산 오페론 및 leuB은 약 2Mb 떨어져 있다). R2 카피(예: MSC627, MSC650, MSC646, MSC679 및 MSC700; 도 15 참조)의 부가에 의해 MSC561로부터 즉시 또는 순차로 유래된 모든 균주는 또한 류신 영양요구체이고, leuB 서열에서 동일한 결실을 함유했다. MSC467의 별개 계통의 균주(MSC537, MSC562 및 MSC619)는 류신 원영양체이다(도 15 참조).
2개 방법을 사용하여 선별된 류신 영양요구체를 원영양체로 전환시켰다(따라서 류신의 부가 없이 최소 배지에서 성장함). 한 가지 방법에서, 영양요구체 균주의 다수(약 106 내지 107)의 세포를 최소 배지 아가 플레이트에 적용한 다음, 30℃에서 3 내지 7일 동안 배양했다. 통상적으로, 몇몇 콜로니는 이들 조건하에 성장했다. 이들 콜로니로부터 분리된 균주("자발성 회복체")는 류신 없이 고체 및 액체 최소 배지에서 재현가능하게 성장했다. 선별된 회복체의 leuB 유전자의 서열 분석은, 정확한 leuB 판독 프레임의 회복을 생성하는 본래 단일 염기쌍 결실 부위 부근에서 적은 삽입 또는 결실을 나타냈다(대부분의 경우). 하기 표 18은 leuB 코딩 영역의 상대적 동조와 함께 뉴클레오티드 변화 위치를 제공한다. 이들 자발성 회복체 균주 중의 LeuB 효소는 이들 영역 내에 변경된 아미노산 서열을 갖지만, 천연 구조로부터의 변화는 류신 비함유 배지에서의 성장을 뒷받침하는 충분한 기능을 하는 것 같다. 자발성 회복체 MSC692에서, leuB에서 어떠한 보상 뉴클레오티드 변화도 검출되지 않았다. 이들 균주에서 유전자 변화의 성질은 특성화되지 않는다.
류신 영양요구체를 원영양체로 전환시키는 제2 방법에서, 선별된 균주의 leuB에서의 자발성 돌연변이는 천연 서열로 특이적으로 수정되었다. PCR 프라이머 BLR513(서열 번호 173) 및 BLR516(서열 번호 174)을 사용하여, 야생형 에스케리키아 콜라이 W3110로부터의 gDNA를 주형으로서 사용하여 646 염기쌍 영역을 증폭시켰다. MSC561에서 결실이 발견된 염기쌍 부위는 이 PCR 단편의 상부 말단으로부터 288 bp였고, PCR 프라이머는 pMAK705pl(실시예 18; 서열 번호 157; 도 14q) 내로 클로닝시켜 pBR1103(서열 번호 175; 도 14r)을 생성하는 HindIII 및 XhoI 말단을 생성한다. pBR1103 중의 leuB 유전자 단편은 서열 번호 175의 bp = 5059 내지 5064에 있는 HindIII 제한 부위로부터 서열 번호 175의 bp = 5712 내지 5717에 있는 XhoI 제한 부위까지 연장한다. 이들 제한 부위는 천연 leuB 서열의 일부는 아니지만, 프라이머 BLR513 및 BLR516을 사용하여 PCR에 의한 클로닝 목적으로 도입되었다.
이어서, 표준 "팝-인/팝-아웃" 방법을 사용하여 영양요구체 균주 MSC650, MSC679 및 MSC700에서 천연 영역으로 결함 leuB 영역을 치환함으로써 각각 원영양체 균주 MSC722, MSC723 및 MSC724를 수득했다. 요약하면, pBR1103을 갖는 MSC650, MSC679 및 MSC700의 초기 형질전환체를 30℃에서 LB/Cm34 상에서 선택했다. 선택된 형질전환체를 43℃에서 LB/Cm34에 플레이팅시키고, 분리된 생존체는 leuB 유전자좌에서 통합된 pBR1103l을 갖는 것으로 PCR에 의해 확인되었다. 선택된 통합체를 약 10세대 동안 30℃에서 LB(Cm 부재) 상에서 성장시킨 다음, 약 15 세대 동안 2xM9 배지(Cm 부재, 류신 부재)에서 성장시켰다. 이들 배양물로부터 분리된 LB 플레이트 상의 콜로니로부터 유래된 균주를 클로람페니콜-민감성 및 원영양체에 대해 스크리닝했다. 3개의 초기 모 균주 각각으로부터 유래된 원영양성 클로람페니콜-민감성 균주 중의 leuB 유전자의 DNA 서열분석은 본래 야생형 서열이 회복되었음을 확인시켰다. 도 15는 본원에 기재된 다른 균주와 비교하여 이들 균주의 유도를 나타낸다.
[표 18]
균주 MSC722, MSC723 및 MSC724에서 rCH 생산(특이적으로 수정된 Leu+ 원영양체)을, 동일한 K4 유전자 상보성 및 배열을 갖지만 원영양체: 각각 MSC677, MSC692 및 MSC702로의 자발적 전환에 의해 유도된 균주에서의 생산과 비교했다. 6개 균주를 30℃에서 이중 2xM9 플라스크에서 성장시키고, 대략 0.1의 OD600 값에서 1 mM mTA에 의해 유도했다. 유도후 72시간에서 배양조의 샘플을 상기한 바와 같이 rCH 함량에 대해 분석했다. 평균 OD600 및 rCH 농도는 표 19에 제시되어 있다.
[표 19]
3개 균주 쌍중의 2개에서, rCH 생산은 leuB로의 특이적 수정을 갖는 균주에서 더욱 크지만, 최종 세포 밀도(말기 OD600에 의해 측정됨)은 유사했다. 이들 결과는 에스케리키아 콜라이 균주 개발 과정 동안 발견된 자발성 돌연변이를 특이적으로 수정하는 것의 rCH 생산 측면에서의 잇점을 입증한다.
실시예
20
본 실시예는 발효조에서 에스케리키아 콜라이 중의 콘드로이틴의 재조합 DNA-매개 생산을 기재한다.
1. 에스케리키아 콜라이(MSC537)의 10-L 발효
통상적인 발효 조건하에 10-L 발효조를 사용하여, 에스케리키아 콜라이 균주 MSC537의 배양물을 탄소원으로서 글리세린을 사용하여 배양했다. 발효조를 탈이온수를 사용하여 6L 용적으로 다음 배지(표 20a)를 사용하여 일괄 처리(batch)했다.
[표 20a]
상기 배지를 함유하는 발효조의 오토클레이빙 후, 다음 성분(표 20b)을 무균 상태로 첨가했다.
[표 20b]
발효조를 통상적인 씨드(seed) 배양물로 접종하고, 4.25시간 후 2mM m-TA로 유도한 다음, 69시간 동안 배양하고, 배양 동안 탄소원(625g/L 글리세린 용액으로 구성됨)을 공급했다. 69시간 후, 발효조를 오토클레이빙하고, 원심분리로 수거했다. 발효 조절 조건 및 생성물 수율은 표 20c 및 20d에 각각 제시한다.
[표 20c]
[표 20d]
2. 에스케리키아 콜라이(MSC564)의 2-L 발효
통상적인 발효 조건하에 2ℓ 발효조를 사용하여, 에스케리키아 콜라이 균주 MSC564의 배양물을 탄소원으로서 글리세린을 사용하여 배양했다. 발효조를 탈이온수를 사용하여 1.5L 용적으로 다음 배지(표 21a)를 사용하여 일괄 처리했다.
[표 21a]
상기 배지를 함유하는 발효조의 오토클레이빙 후, 다음 성분(표 21b)을 무균 상태로 첨가했다.
[표 21b]
발효조를 통상적인 씨드 배양물로 접종하고, 66시간 동안 배양하고, 배양 동안 170mL의 탄소원(625g/L 글리세린 용액으로 구성됨)을 공급했다. 5시간 배양 후, 이를 2mM m-TA로 유도했다. 발효조를 pH, 용해된 산소, 온도, 글리세린 농도 및 아세테이트 농도(탄소 대사 부산물)에 대해 조절했다. 글리세린 공급 속도는 < 2g/L 아세테이트의 표적으로 아세테이트 농도에 기초하여 조정했다. 표적 글리세린 농도는 < 5g/L였다. 발효를 66시간 동안 작동시키고, 그 시점에서 글리세린 소비는 < 1.5g/L/h로 감퇴되었다. 샘플링 및 증발에 기인하여, 최종 용적은 1.35L였다. 조절 조건 및 생성물 수율은 이하 나열된다. 66시간 후, 발효조를 오토클레이빙하고, 원심분리 수거했다. 원심분리 후 회수된 용적은 상청액 약 1L였다. 발효 조절 조건 및 생성물 수율은 표 21c 및 21d에 각각 제시한다.
[표 21c]
[표 21d]
3개의 10L 반응기가 숙주 염색체(참조: 실시예 19; 도 15) 중의 영역 2 유전자의 상이한 수 및 배열을 함유하는 균주 MSC619, MSC677 및 MSC702를 비교하면서 동일한 조건하에 나란히 작동된 하나의 실험으로부터 다음 3개의 발효(3 내지 5)를 취했다. 요약하면, MSC619 및 MSC677은 각각 영역 2의 3개 총 카피를 갖지만, MSC619 중의 하나의 카피는 Pm 프로모터 대신 Psyn 프로모터로 구동된다. 균주 MSC702는 모두 Pm에 의해 구동되는 영역 2 유전자 세트의 4개의 카피를 갖는다.
3. 에스케리키아 콜라이(MSC619)의 10-L 발효
통상적인 발효 조건하에 10-L 발효조를 사용하여, 에스케리키아 콜라이 균주 MSC619의 배양물을 각각 주요 탄소원 및 질소원으로서 글리세린, 카제인 가수분해물 및 수산화암모늄을 사용하여 배양했다. 발효조를 탈이온수를 사용하여 6L 용적으로 다음 배지(표 22a)를 사용하여 일괄 처리했다.
[표 22a]
상기 배지를 함유하는 발효조의 오토클레이빙 후, 다음 성분(표 22b)을 무균 상태로 첨가했다.
[표 22b]
발효조를 통상적인 씨드 배양물로 접종하고, 4.2시간 후 2mM m-TA로 유도한 다음, 80시간 동안 배양하고, 탄소원(625g/L 글리세린 용액으로 구성됨) 및 4N 수산화암모늄 형태의 질소원을 공급했다. 탄소원 및 질소원을 NOVA 300A 생물분석기 상에서 오프라인으로 취한 샘플 판독에 기초하여 수동으로 조정했다. 글리세린의 농도를 1g/L 미만을 유지하도록 표적화하고, 공급률을 아세테이트 축적의 존재하에 추가로 감소시켰다. 암모니아 농도 표적은 배양액 중의 암모니아 100mg/L 이하였다. 2N 황산 형태의 산 및 4N 수산화나트륨 형태의 염기를 배양 동안 자동적으로 첨가하여 pH를 조절했다. 소포제를 또한 발효조에 자동적으로 공급하여 배양액의 발포를 조절했다. 발효조 조절 조건 및 생성물 수율은 이하 표 22c 및 22d에 각각 제시한다.
[표 22c]
[표 22d]
4. 에스케리키아 콜라이(MSC677)의 10-L 발효
통상적인 발효 조건하에 10-L 발효조를 사용하여, 에스케리키아 콜라이 균주 MSC677의 배양물을 각각 주요 탄소원 및 질소원으로서 글리세린, 카제인 가수분해물 및 수산화암모늄을 사용하여 배양했다. 발효조를 탈이온수를 사용하여 6L 용적으로 다음 배지(표 23a)를 사용하여 일괄 처리했다.
[표 23a]
상기 배지를 함유하는 발효조의 오토클레이빙 후, 다음 성분(표 23b)을 무균 상태로 첨가했다.
[표 23b]
발효조를 통상적인 씨드 배양물로 접종하고, 4.2시간 후 2mM m-TA로 유도한 다음, 80시간 동안 배양하고, 탄소원(625g/L 글리세린 용액으로 구성됨) 및 4N 수산화암모늄 형태의 질소원을 공급했다. 탄소원 및 질소원을 NOVA 300A 생물분석기 상에서 오프라인으로 취한 샘플 판독에 기초하여 수동으로 조정했다. 글리세린의 농도를 1g/L 미만을 유지하도록 표적화하고, 공급률을 아세테이트 축적의 존재하에 추가로 감소시켰다. 암모니아 농도 표적은 배양액 중의 암모니아 100mg/L 이하였다. 2N 황산 형태의 산 및 4N 수산화나트륨 형태의 염기를 배양 동안 자동적으로 첨가하여 pH를 조절했다. 소포제를 또한 발효조에 자동적으로 공급하여 배양액의 발포를 조절했다. 발효조 조절 조건 및 생성물 수율은 이하 표 23c 및 23d에 각각 제시한다.
[표 23c]
[표 23d]
5. 에스케리키아 콜라이(MSC702)의 10-L 발효
통상적인 발효 조건하에 10-L 발효조를 사용하여, 에스케리키아 콜라이 균주 MSC702의 배양물을 각각 주요 탄소원 및 질소원으로서 글리세린, 카제인 가수분해물 및 수산화암모늄을 사용하여 배양했다. 발효조를 탈이온수를 사용하여 6L 용적으로 다음 배지(표 24a)를 사용하여 일괄 처리했다.
[표 24a]
상기 배지를 함유하는 발효조의 오토클레이빙 후, 다음 성분(표 24b)을 무균 상태로 첨가했다.
[표 24b]
발효조를 통상적인 씨드 배양물로 접종하고, 4.2시간 후 2mM m-TA로 유도한 다음, 80시간 동안 배양하고, 탄소원(625g/L 글리세린 용액으로 구성됨) 및 4N 수산화암모늄 형태의 질소원을 공급했다. 탄소원 및 질소원을 NOVA 300A 생물분석기 상에서 오프라인으로 취해진 샘플 판독에 기초하여 수동으로 조정했다. 글리세린의 농도를 1g/L 미만을 유지하도록 표적화하고, 공급률을 아세테이트 축적의 존재하에 추가로 감소시켰다. 암모니아 농도 표적은 배양액 중의 암모니아 100mg/L 이하였다. 2N 황산 형태의 산 및 4N 수산화나트륨 형태의 염기를 배양 동안 자동적으로 첨가하여 pH를 조절했다. 소포제를 또한 발효조에 자동적으로 공급하여 배양액의 발포를 조절했다. 발효조 조절 조건 및 생성물 수율은 이하 표 24c 및 24d에 각각 제시한다.
[표 24c]
[표 24d]
실험 3 내지 5를 요약하기 위해, 균주 MSC619, MSC677 및 MSC702는 각각 3.45, 4.3 및 5.3g/L 콘드로이틴을 수득하여, 콘드로이틴 생산능을 향상시키는데 영역 2 배열(배경) 및 카피 수의 효과를 입증한다.
6. 에스케리키아 콜라이(MSC702)의 10-L 발효
통상적인 발효 조건하에 10-L 발효조를 사용하여, 에스케리키아 콜라이 균주 MSC702의 배양물을 각각 주요 탄소원 및 질소원으로서 글리세린, 카제인 가수분해물 및 수산화암모늄을 사용하여 배양했다. 발효조를 탈이온수를 사용하여 6L 용적으로 다음 배지(표 25a)를 사용하여 일괄 처리했다.
[표 25a]
상기 배지를 함유하는 발효조의 오토클레이빙 후, 다음 성분(표 25b)을 무균 상태로 첨가했다.
[표 25b]
발효조를 통상적인 씨드 배양물로 접종하고, 4시간 후 2mM m-TA로 유도한 다음, 82시간 동안 배양하고, 탄소원(625g/L 글리세린 용액으로 구성됨) 및 4N 수산화암모늄 형태의 질소원을 공급했다. 탄소원 및 질소원을 NOVA 300A 생물분석기 상에서 오프라인으로 취해진 샘플 판독에 기초하여 수동으로 조정했다. 글리세린의 농도를 1g/L 미만을 유지하도록 표적화하고, 공급률을 아세테이트 축적의 존재하에 추가로 감소시켰다. 암모니아 농도 표적은 배양액 중의 암모니아 100mg/L 이하였다. 2N 황산 형태의 산 및 4N 수산화나트륨 형태의 염기를 배양 동안 자동적으로 첨가하여 pH를 조절했다. 소포제를 또한 발효조에 자동적으로 공급하여 배양액의 발포를 조절했다. 발효조 조절 조건 및 생성물 수율은 이하 표 25c 및 25d에 각각 제시한다.
[표 25c]
[표 25d]
이 작동은 발효 실험 5(상기)의 반복으로서 고안되었지만, 콘드로이틴 수율에서 상당한 증가를 달성했다. 수율의 차이는 적어도 부분적으로 증가된 수준의 아세테이트 축적과 함께 실험 5에 사용된 과량의 소포제에 기인하는 것으로 간주되지만, 이들 둘 다 콘드로이틴 수율에 부정적으로 영향을 미치는 것으로 간주된다.
7. 에스케리키아 콜라이(MSC702)의 50-L 발효
통상적인 발효 조건하에 50-L 발효조를 사용하여, 에스케리키아 콜라이 균주 MSC702의 배양물을 각각 주요 탄소원 및 질소원으로서 글리세린 및 수산화암모늄을 사용하여 규정된 배지 중에서 배양했다. 발효조를 탈이온수를 사용하여 40L 용적으로 다음 배지(표 26a)를 사용하여 일괄 처리했다.
[표 26a]
상기 배지를 함유하는 발효조의 오토클레이빙 후, 다음 성분(표 26b)을 무균 상태로 첨가했다.
[표 26b]
발효조를 통상적인 씨드 배양물로 접종하고, 4시간 후 2mM m-TA로 유도한 다음, 91시간 동안 배양하고, 탄소원(625g/L 글리세린 용액으로 구성됨) 및 6N 수산화암모늄 형태의 질소원을 공급했다. 탄소원 및 질소원을 NOVA 300A 생물분석기 상에서 오프라인으로 취해진 샘플 판독에 기초하여 수동으로 조정했다. 글리세린의 농도를 1g/L 미만을 유지하도록 표적화하고, 공급률을 아세테이트 축적의 존재하에 추가로 감소시켰다. 암모니아 농도 표적은 배양액 중의 암모니아 100mg/L 이하였다. 3N 황산 형태의 산 및 4N 수산화나트륨 형태의 염기를 배양 동안 자동적으로 첨가하여 pH를 조절했다. 소포제를 발효조에 수동으로 공급하여 배양액의 발포를 조절했다. 발효조 조절 조건 및 생성물 수율은 표 26c 및 26d에 각각 제시한다.
[표 26c]
[표 26d]
이 발효 실험은 높은 콘드로이틴 생산이 중간 발효 규모에서 규정된 (최소) 성장 배지에서 달성되었다는 것을 입증한다.
다음 두 발효(8 및 9)는 2개의 10L 반응기가 균주 MSC702 및 MSC724를 비교하면서 동일한 조건하에 나란히 작동된 하나의 실험으로부터 취했다.
8. 에스케리키아 콜라이(MSC702)의 10-L 발효
통상적인 발효 조건하에 10-L 발효조를 사용하여, 에스케리키아 콜라이 균주 MSC702의 배양물을 각각 주요 탄소원 및 질소원으로서 글리세린, 카제인 가수분해물 및 수산화암모늄을 사용하여 배양했다. 발효조를 탈이온수를 사용하여 6L 용적으로 다음 배지(표 27a)를 사용하여 일괄 처리했다.
[표 27a]
상기 배지를 함유하는 발효조의 오토클레이빙 후, 다음 성분(표 27b)을 무균 상태로 첨가했다.
[표 27b]
발효조를 통상적인 씨드 배양물로 접종하고, 4시간 후 2mM m-TA로 유도한 다음, 92시간 동안 배양하고, 탄소원(625g/L 글리세린 용액으로 구성됨) 및 황산암모늄 형태의 질소원을 공급했다. 탄소원 및 질소원을 NOVA 300A 생물분석기 상에서 오프라인으로 취해진 샘플 판독에 기초하여 수동으로 조정했다. 배양액 중의 글리세린의 농도를 1g/L 미만을 유지하도록 표적화하고, 공급률을 아세테이트 축적의 존재하에 추가로 감소시켰다. 암모니아 농도 표적은 배양액 중의 암모니아 100mg/L 이하였다. 2N 황산 형태의 산 및 4N 수산화나트륨 형태의 염기를 배양 동안 자동적으로 첨가하여 pH를 조절했다. 소포제를 또한 발효조에 자동적으로 공급하여 배양액의 발포를 조절했다. 발효조 조절 조건 및 생성물 수율은 표 27c 및 27d에 각각 제시한다.
[표 27c]
[표 27d]
9. 에스케리키아 콜라이(MSC724)의 10-L 발효
통상적인 발효 조건하에 10-L 발효조를 사용하여, 에스케리키아 콜라이 균주 MSC724의 배양물을 각각 주요 탄소원 및 질소원으로서 글리세린, 카제인 가수분해물 및 황산암모늄을 사용하여 배양했다. 발효조를 탈이온수를 사용하여 6L 용적으로 다음 배지(표 28a)를 사용하여 일괄 처리했다.
[표 28a]
상기 배지를 함유하는 발효조의 오토클레이빙 후, 다음 성분(표 28b)을 무균 상태로 첨가했다.
[표 28b]
발효조를 통상적인 씨드 배양물로 접종하고, 4시간 후 2mM m-TA로 유도한 다음, 92시간 동안 배양하고, 탄소원(625g/L 글리세린 용액으로 구성됨) 및 황산암모늄 형태의 질소원을 공급했다. 탄소원 및 질소원을 NOVA 300A 생물분석기 상에서 오프라인으로 취해진 샘플 판독에 기초하여 수동으로 조정했다. 배양액 중의 글리세린의 농도를 1g/L 미만을 유지하도록 표적화하고, 공급률을 아세테이트 축적의 존재하에 추가로 감소시켰다. 암모니아 농도 표적은 배양액 중의 암모니아 100mg/L 이하였다. 2N 황산 형태의 산 및 4N 수산화나트륨 형태의 염기를 배양 동안 자동적으로 첨가하여 pH를 조절했다. 소포제를 또한 발효조에 자동적으로 공급하여 배양액의 발포를 조절했다. 발효조 조절 조건 및 생성물 수율은 표 28c 및 28d에 각각 제시한다.
[표 28c]
[표 28d]
본 실시예에서 발효 8 및 9는 복합 배지 중의 MSC702에 비해 균주 MSC724의 향상된 rCH 수율을 입증한다. 이는 MSC702 중의 작용성이지만, 변경된 LeuB 효소(참조: 실시예 19)와 비교하여, MSC724 중의 천연 LeuB 효소의 보다 큰 대사 효율 결과일 수 있다.
실시예
21
본 실시예는 발효조에서 잔토모나스 캄페스트리스에서 콘드로이틴의 재조합 DNA-매개 생산을 기술한다.
잔토모나스 캄페스트리스(MSC480)의 10-L 발효
통상적인 발효 조건하에 10-L 발효조를 사용하여, 잔토모나스 캄페스트리스 균주 MSC480의 배양물을 탄소원으로서 글루코즈를 사용하여 배양했다. 발효조를 탈이온수를 사용하여 7.5L 용적으로 다음 배지(표 29a)를 사용하여 일괄 처리했다.
[표 29a]
상기 배지를 함유하는 발효조의 오토클레이빙 후, 60g의 글루코즈(가열-멸균됨)를 무균 상태로 첨가했다.
발효조를 통상적인 씨드 배양물로 접종한 다음, 70시간 동안 배양하고, 배양 동안 탄소원(871g/L 글루코즈 용액으로 구성됨)을 공급했다. 70시간 후, 발효조를 오토클레이빙하고, 원심분리로 수거했다. 발효조 조절 조건 및 생성물 수율은 표 29b 및 29c에 각각 제시한다.
[표 29b]
[표 29c]
실시예
22
본 실시예는 개량된 에스케리키아 콜라이 성장 배지를 예시한다.
상기 실시예 4, 7, 및 8은 rCH-생산 재조합 에스케리키아 콜라이 K-12 균주의 성장을 위한 복합 TB 배지의 용도를 기술한다. 통상적으로 제형화된 바와 같이, TB 배지는 제1 탄소원으로서 5g/L 글리세린을 함유한다. 본 실시예는 진탕 플라스크에서 rCH 용적 측정 및 특정 생산능을 향상시키는 TB 배지에 대한 변형을 기술한다.
균주 MSC564의 작은 배양물을 접종물로서 사용하기 위해 30℃에서 TB/Tc5 배지에서 성장시켰다. 표준 TB 배지[참조: Sambrook et al., 1989; Difco "Terrific Broth"]를 0.1M MOPS 완충제(4-모르폴린프로판설폰산; NaOH로 7.2로 pH 조정된 1.0M 스톡 용액으로부터 제조됨), 10vg/L 글리세린(2X 표준 TB 처방), 또는 둘 다로 변형시켰다. 각 배지 50mL를 함유하는 삼각 진탕 플라스크(250mL)를 MSC564 배양물로 접종하여 OD600 = 0.03을 달성했다. 플라스크를 OD600 값이 약 0.125에 도달할 때까지 30℃에서 진탕시켰고(225rpm), 그 시간에 메타-톨루엔산을 1mM로 첨가하여 rCH 생산을 유도했다. 72시간 동안 계속 진탕 후, pH 및 OD600을 측정하고, 5mL 분취량을 5 내지 7분 동안 오토클래이빙하고, 냉각시키고 동결 저장했다. rCH 함량을 실시예 14에 기술된 바와 같이 측정했다. 최종 OD600 및 rCH 농도는 표 30에 제시한다.
[표 30]
완충되고 과잉 글리세린(2X 표준)으로 수정된 TB 배지는 추가의 세포 밀도(더 큰 특정 생산능) 없이 rCH 역가(더 큰 용적 생산능)의 50% 초과 증가를 유도했다. 2X 글리세린을 포함하지만 완충제가 없는 배지 중의 성장 및 생산능은 글리세린으로부터 과량의 산 생산에 기인할 것 같은 불량한 생산능을 유도했다. 이는 재조합 균주에서 증가된 생산 용량을 입증하고, 신규 에스케리키아 콜라이 균주를 평가하기 위해 보다 높은 생산능 성장 조건을 제공한다.
본 발명의 상기 설명은 예시 및 설명 목적으로 제시되었다. 또한, 설명은 본 발명은 본원에 기술된 형태로 제한하고자 하지 않는다.
본원에 기술된 각종 국면, 양태 및 선택안 모두를 임의의 모든 변화에서 결합시킬 수 있다.
본 명세서에서 언급된 모든 공보, 특허 및 특허원은 각각 개별 공보, 특허 또는 특허원이 본원에 참조되는 것으로 구체적이고 개별적으로 기술되는 것처럼 동일한 정도로 참조로 인용된다.
<110> DSIM IP Assets B.V.
SEIKAGAKU CORPORATION
<120> Compositions and Methods for Bacterial Production of Chondroitin
<130> IPA120861
<150> US 61/309,407
<151> 2010-03-01
<160> 175
<170> PatentIn version 3.5
<210> 1
<211> 981
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Sequence
<400> 1
atgagcgaac gccacttgcc ggatgaccag tcctcgacca ttgatccgta tctgattacg 60
agcgtccgcc agaccctggc cgaacaaagc gcggcactgc aaaacctgtc caaacaactg 120
gatagcggtc agtaccagcg cgtcctgaat ctcatcatga attgtaaagg gcacgtcatc 180
ctgagcggca tgggtaaaag cggccatgtg ggccgcaaga tgtcggcgac cttggcctcg 240
accgggacgc cctccttctt tattcatccg gcggaagcgt tccatggtga tctgggcatg 300
atcaccccgt atgacctgct catcttgatt tcggcgagcg gtgagacgga cgagatcctg 360
aaactggtgc cgagcctgaa gaacttcggc aatcgcatca tcgcaatcac caataacggg 420
aatagcaccc tggccaaaaa tgcagatgcg gtcctggagc tgcacatggc gaacgaaacg 480
tgcccgaaca atctcgcccc gaccacctcc acgacgctca cgatggcgat cggggacgcg 540
ctggccatcg cgatgattca ccagcgtaag tttatgccca atgactttgc acgctaccac 600
cccggtggca gcctgggtcg gcgcctgctg acccgcgtcg ccgacgtgat gcaacatgat 660
gtgccggcag tgcagctcga tgccagcttc aaaacggtca ttcagcgcat cacctcgggc 720
tgccagggta tggtgatggt cgaagatgcg gaaggtgggc tggcaggcat catcaccgat 780
ggcgatctgc ggcgctttat ggagaaagaa gacagcctga cgagcgcaac ggccgcacag 840
atgatgaccc gcgaaccgct gaccttgccc gaagacacca tgatcatcga agcagaagag 900
aagatgcaga aacaccgcgt ctcgaccctg ctggtgacca acaaagcaaa taaggtgacc 960
gggttggtgc gcattttcga t 981
<210> 2
<211> 327
<212> PRT
<213> Escherichia coli
<400> 2
Met Ser Glu Arg His Leu Pro Asp Asp Gln Ser Ser Thr Ile Asp Pro
1 5 10 15
Tyr Leu Ile Thr Ser Val Arg Gln Thr Leu Ala Glu Gln Ser Ala Ala
20 25 30
Leu Gln Asn Leu Ser Lys Gln Leu Asp Ser Gly Gln Tyr Gln Arg Val
35 40 45
Leu Asn Leu Ile Met Asn Cys Lys Gly His Val Ile Leu Ser Gly Met
50 55 60
Gly Lys Ser Gly His Val Gly Arg Lys Met Ser Ala Thr Leu Ala Ser
65 70 75 80
Thr Gly Thr Pro Ser Phe Phe Ile His Pro Ala Glu Ala Phe His Gly
85 90 95
Asp Leu Gly Met Ile Thr Pro Tyr Asp Leu Leu Ile Leu Ile Ser Ala
100 105 110
Ser Gly Glu Thr Asp Glu Ile Leu Lys Leu Val Pro Ser Leu Lys Asn
115 120 125
Phe Gly Asn Arg Ile Ile Ala Ile Thr Asn Asn Gly Asn Ser Thr Leu
130 135 140
Ala Lys Asn Ala Asp Ala Val Leu Glu Leu His Met Ala Asn Glu Thr
145 150 155 160
Cys Pro Asn Asn Leu Ala Pro Thr Thr Ser Thr Thr Leu Thr Met Ala
165 170 175
Ile Gly Asp Ala Leu Ala Ile Ala Met Ile His Gln Arg Lys Phe Met
180 185 190
Pro Asn Asp Phe Ala Arg Tyr His Pro Gly Gly Ser Leu Gly Arg Arg
195 200 205
Leu Leu Thr Arg Val Ala Asp Val Met Gln His Asp Val Pro Ala Val
210 215 220
Gln Leu Asp Ala Ser Phe Lys Thr Val Ile Gln Arg Ile Thr Ser Gly
225 230 235 240
Cys Gln Gly Met Val Met Val Glu Asp Ala Glu Gly Gly Leu Ala Gly
245 250 255
Ile Ile Thr Asp Gly Asp Leu Arg Arg Phe Met Glu Lys Glu Asp Ser
260 265 270
Leu Thr Ser Ala Thr Ala Ala Gln Met Met Thr Arg Glu Pro Leu Thr
275 280 285
Leu Pro Glu Asp Thr Met Ile Ile Glu Ala Glu Glu Lys Met Gln Lys
290 295 300
His Arg Val Ser Thr Leu Leu Val Thr Asn Lys Ala Asn Lys Val Thr
305 310 315 320
Gly Leu Val Arg Ile Phe Asp
325
<210> 3
<211> 1146
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Sequence
<400> 3
atgctgatca aagtgaaaag cgccgtctcg tggatgcgtg cgcgtctgag cgcgatcagc 60
ctggcagata ttcagaagca cctggcaaaa atcattattc tggcacccat ggcggtgctg 120
ctgatctact tggcgatctt ctcccagccc cgctatatgt cggaaagcaa ggtggccatc 180
aagcgcagcg acgatctcaa ctccggcagc ctgaacttcg gcctgctgtt gggtgcctcc 240
aacccgtcgt ccgccgaaga cgcactgtac ctgaaggaat acatcaacag cccggatatg 300
ctggccgcgc tggataaaca gctgaacttc cgcgaagcgt tctcccattc gggcctggac 360
ttcctgaacc atctgtccaa ggatgaaacc gccgaggggt tcctgaagta ctataaagat 420
cgcatcaacg tcagctacga cgacaagacc gggctgctga acatccagac ccagggcttt 480
tcgcccgagt tcgcgctgaa attcaaccag accgtgctca aggaatccga gcggttcatc 540
aatgaaatgt cgcaccgtat cgcccgcgat caattggcgt ttgcggaaac cgaaatggaa 600
aaagcgcgcc agcggctgga tgcatcgaaa gccgaattgt tgtcctacca agacaacaac 660
aatgtgctgg acccgcaggc acaggcccag gcggcatcca ccctggtgaa tacgctgatg 720
ggccagaaaa ttcagatgga agccgacctg cgcaacctgc tcacgtacct gcgcgaggat 780
gcgccccaag tcgtgagcgc ccgcaatgca attcagagcc tccaggcaca gatcgacgaa 840
gaaaagtcga aaattaccgc accccagggc gataaactga accgcatggc cgtggatttt 900
gaggagatca aatccaaggt cgagttcaat accgagttgt acaagctcac gctcaccagc 960
atcgaaaaga cccgtgtcga agcggcccgt aagctgaaag tcctgagcgt gatctcgtcc 1020
ccgcagctgc cccaggaaag ctccttcccg aatatcccgt atttgatcgc gtgttggctg 1080
ctggtgtgtt gcctgctctt tggcaccctg aaattgctcc tggcggtgat tgaagaccac 1140
cgtgac 1146
<210> 4
<211> 382
<212> PRT
<213> Escherichia coli
<400> 4
Met Leu Ile Lys Val Lys Ser Ala Val Ser Trp Met Arg Ala Arg Leu
1 5 10 15
Ser Ala Ile Ser Leu Ala Asp Ile Gln Lys His Leu Ala Lys Ile Ile
20 25 30
Ile Leu Ala Pro Met Ala Val Leu Leu Ile Tyr Leu Ala Ile Phe Ser
35 40 45
Gln Pro Arg Tyr Met Ser Glu Ser Lys Val Ala Ile Lys Arg Ser Asp
50 55 60
Asp Leu Asn Ser Gly Ser Leu Asn Phe Gly Leu Leu Leu Gly Ala Ser
65 70 75 80
Asn Pro Ser Ser Ala Glu Asp Ala Leu Tyr Leu Lys Glu Tyr Ile Asn
85 90 95
Ser Pro Asp Met Leu Ala Ala Leu Asp Lys Gln Leu Asn Phe Arg Glu
100 105 110
Ala Phe Ser His Ser Gly Leu Asp Phe Leu Asn His Leu Ser Lys Asp
115 120 125
Glu Thr Ala Glu Gly Phe Leu Lys Tyr Tyr Lys Asp Arg Ile Asn Val
130 135 140
Ser Tyr Asp Asp Lys Thr Gly Leu Leu Asn Ile Gln Thr Gln Gly Phe
145 150 155 160
Ser Pro Glu Phe Ala Leu Lys Phe Asn Gln Thr Val Leu Lys Glu Ser
165 170 175
Glu Arg Phe Ile Asn Glu Met Ser His Arg Ile Ala Arg Asp Gln Leu
180 185 190
Ala Phe Ala Glu Thr Glu Met Glu Lys Ala Arg Gln Arg Leu Asp Ala
195 200 205
Ser Lys Ala Glu Leu Leu Ser Tyr Gln Asp Asn Asn Asn Val Leu Asp
210 215 220
Pro Gln Ala Gln Ala Gln Ala Ala Ser Thr Leu Val Asn Thr Leu Met
225 230 235 240
Gly Gln Lys Ile Gln Met Glu Ala Asp Leu Arg Asn Leu Leu Thr Tyr
245 250 255
Leu Arg Glu Asp Ala Pro Gln Val Val Ser Ala Arg Asn Ala Ile Gln
260 265 270
Ser Leu Gln Ala Gln Ile Asp Glu Glu Lys Ser Lys Ile Thr Ala Pro
275 280 285
Gln Gly Asp Lys Leu Asn Arg Met Ala Val Asp Phe Glu Glu Ile Lys
290 295 300
Ser Lys Val Glu Phe Asn Thr Glu Leu Tyr Lys Leu Thr Leu Thr Ser
305 310 315 320
Ile Glu Lys Thr Arg Val Glu Ala Ala Arg Lys Leu Lys Val Leu Ser
325 330 335
Val Ile Ser Ser Pro Gln Leu Pro Gln Glu Ser Ser Phe Pro Asn Ile
340 345 350
Pro Tyr Leu Ile Ala Cys Trp Leu Leu Val Cys Cys Leu Leu Phe Gly
355 360 365
Thr Leu Lys Leu Leu Leu Ala Val Ile Glu Asp His Arg Asp
370 375 380
<210> 5
<211> 1674
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Sequence
<400> 5
atgaagctgt ttaagtcgat cctgctgatc gcagcgtgcc atgcagcaca ggcgagcgca 60
accatcgaca ttaatgccga tccgaacctc acgggtgccg caccgttgac cggcatcctg 120
aacgggcaga aaagcgacac ccagaacatg agcggcttcg ataacacccc gccccccgca 180
cccccggtcg tgatgagccg tatgttcggg gcgcagctgt tcaacggtac gagcgcagac 240
tcgggggcaa ccgtgggttt caatccggac tacatcctga atcccggcga ttccatccag 300
gtccgcctgt ggggtgcgtt caccttcgat ggcgcactcc aggtggaccc gaagggcaac 360
atcttcctgc cgaatgtcgg ccccgtcaaa gtcgcaggtg tgtcgaactc ccagttgaac 420
gcgctggtga cgagcaaggt gaaggaagtc taccagagca acgtgaacgt ctatgcgtcg 480
ctcttgcagg cgcagccggt caaggtctat gtgaccggct ttgtccgcaa ccccggcctg 540
tacggcggtg tcacctccga cagcctgctg aactacctga tcaaggcggg tggtgtggac 600
ccggaacgcg gcagctacgt ggacatcgtc gtgaaacgcg gcaatcgtgt gcgctcgaac 660
gtcaacctct atgacttcct gctcaacggc aaactggggc tgtcccagtt tgcggacggt 720
gatacgatca ttgtgggtcc gcgccagcat acgttctcgg tgcagggcga tgtgttcaat 780
tcctacgact ttgaatttcg cgaatcgagc atcccggtca ccgaagcact gtcctgggca 840
cgtcccaaac cgggtgcgac ccatatcacg attatgcgga agcagggcct ccagaagcgc 900
tcggaatatt atccgatctc gtccgcaccg gggcgtatgc tgcaaaacgg tgataccctc 960
attgtctcca ccgaccgcta tgcgggcacc attcaagtgc gtgtggaagg cgcacattcc 1020
ggggaacacg ccatggtgct gccctacggt agcaccatgc gggccgtgct cgaaaaagtg 1080
cgcccgaact ccatgtcgca gatgaacgcc gtgcagttgt atcggccgag cgtcgcgcaa 1140
cggcagaaag aaatgctgaa tttgtccctg caaaagctcg aagaggccag cctcagcgca 1200
cagagcagca ccaaggaaga ggccagcctg cgtatgcagg aagcccaact gatctcccgc 1260
ttcgtcgcga aagcccgcac cgtcgtgccg aagggcgaag tgatcctcaa tgaaagcaac 1320
attgactccg tcctcctgga ggacggcgac gtgatcaata ttcccgaaaa gacgtcgttg 1380
gtcatggtcc acggggaagt gctgttcccg aacgcggtgt cgtggcagaa aggtatgacg 1440
accgaggact acatcgagaa gtgcggtggg ctgacccaga agtccggcaa cgcccgtatt 1500
atcgtcatcc gtcagaacgg cgcagcggtg aacgcagaag acgtcgattc cctgaaaccc 1560
ggtgatgaaa ttatggtgtt gccgaaatac gagtcgaaga acatcgaagt gacgcgcggt 1620
atcagcacca ttctgtacca actggcggtg ggcgcgaaag tgattctgtc gctg 1674
<210> 6
<211> 558
<212> PRT
<213> Escherichia coli
<400> 6
Met Lys Leu Phe Lys Ser Ile Leu Leu Ile Ala Ala Cys His Ala Ala
1 5 10 15
Gln Ala Ser Ala Thr Ile Asp Ile Asn Ala Asp Pro Asn Leu Thr Gly
20 25 30
Ala Ala Pro Leu Thr Gly Ile Leu Asn Gly Gln Lys Ser Asp Thr Gln
35 40 45
Asn Met Ser Gly Phe Asp Asn Thr Pro Pro Pro Ala Pro Pro Val Val
50 55 60
Met Ser Arg Met Phe Gly Ala Gln Leu Phe Asn Gly Thr Ser Ala Asp
65 70 75 80
Ser Gly Ala Thr Val Gly Phe Asn Pro Asp Tyr Ile Leu Asn Pro Gly
85 90 95
Asp Ser Ile Gln Val Arg Leu Trp Gly Ala Phe Thr Phe Asp Gly Ala
100 105 110
Leu Gln Val Asp Pro Lys Gly Asn Ile Phe Leu Pro Asn Val Gly Pro
115 120 125
Val Lys Val Ala Gly Val Ser Asn Ser Gln Leu Asn Ala Leu Val Thr
130 135 140
Ser Lys Val Lys Glu Val Tyr Gln Ser Asn Val Asn Val Tyr Ala Ser
145 150 155 160
Leu Leu Gln Ala Gln Pro Val Lys Val Tyr Val Thr Gly Phe Val Arg
165 170 175
Asn Pro Gly Leu Tyr Gly Gly Val Thr Ser Asp Ser Leu Leu Asn Tyr
180 185 190
Leu Ile Lys Ala Gly Gly Val Asp Pro Glu Arg Gly Ser Tyr Val Asp
195 200 205
Ile Val Val Lys Arg Gly Asn Arg Val Arg Ser Asn Val Asn Leu Tyr
210 215 220
Asp Phe Leu Leu Asn Gly Lys Leu Gly Leu Ser Gln Phe Ala Asp Gly
225 230 235 240
Asp Thr Ile Ile Val Gly Pro Arg Gln His Thr Phe Ser Val Gln Gly
245 250 255
Asp Val Phe Asn Ser Tyr Asp Phe Glu Phe Arg Glu Ser Ser Ile Pro
260 265 270
Val Thr Glu Ala Leu Ser Trp Ala Arg Pro Lys Pro Gly Ala Thr His
275 280 285
Ile Thr Ile Met Arg Lys Gln Gly Leu Gln Lys Arg Ser Glu Tyr Tyr
290 295 300
Pro Ile Ser Ser Ala Pro Gly Arg Met Leu Gln Asn Gly Asp Thr Leu
305 310 315 320
Ile Val Ser Thr Asp Arg Tyr Ala Gly Thr Ile Gln Val Arg Val Glu
325 330 335
Gly Ala His Ser Gly Glu His Ala Met Val Leu Pro Tyr Gly Ser Thr
340 345 350
Met Arg Ala Val Leu Glu Lys Val Arg Pro Asn Ser Met Ser Gln Met
355 360 365
Asn Ala Val Gln Leu Tyr Arg Pro Ser Val Ala Gln Arg Gln Lys Glu
370 375 380
Met Leu Asn Leu Ser Leu Gln Lys Leu Glu Glu Ala Ser Leu Ser Ala
385 390 395 400
Gln Ser Ser Thr Lys Glu Glu Ala Ser Leu Arg Met Gln Glu Ala Gln
405 410 415
Leu Ile Ser Arg Phe Val Ala Lys Ala Arg Thr Val Val Pro Lys Gly
420 425 430
Glu Val Ile Leu Asn Glu Ser Asn Ile Asp Ser Val Leu Leu Glu Asp
435 440 445
Gly Asp Val Ile Asn Ile Pro Glu Lys Thr Ser Leu Val Met Val His
450 455 460
Gly Glu Val Leu Phe Pro Asn Ala Val Ser Trp Gln Lys Gly Met Thr
465 470 475 480
Thr Glu Asp Tyr Ile Glu Lys Cys Gly Gly Leu Thr Gln Lys Ser Gly
485 490 495
Asn Ala Arg Ile Ile Val Ile Arg Gln Asn Gly Ala Ala Val Asn Ala
500 505 510
Glu Asp Val Asp Ser Leu Lys Pro Gly Asp Glu Ile Met Val Leu Pro
515 520 525
Lys Tyr Glu Ser Lys Asn Ile Glu Val Thr Arg Gly Ile Ser Thr Ile
530 535 540
Leu Tyr Gln Leu Ala Val Gly Ala Lys Val Ile Leu Ser Leu
545 550 555
<210> 7
<211> 738
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Sequence
<400> 7
atgtcgaagg ccgtgattgt gatcccggca cgctacggca gcagccgtct gccgggcaaa 60
ccgctgctgg atatcgtcgg gaaaccgatg atccagcacg tctacgaacg ggccctgcaa 120
gtggcaggcg tggcagaggt gtgggtcgca accgacgacc cgcgtgtgga gcaggcagtc 180
caggcgttcg gcggcaaagc gatcatgacc cgcaacgatc atgagagcgg caccgatcgc 240
ctggtggaag tcatgcataa ggtggaggcg gatatctata tcaacctgca aggggatgag 300
ccgatgattc gcccgcgtga cgtcgaaacc ctgctgcaag gtatgcggga cgacccggcg 360
ctgccggtgg cgaccctgtg tcatgcgatc agcgcggcag aagccgccga accgtccacc 420
gtcaaggtcg tggtgaacac gcggcaggac gccctgtatt tctcccgctc ccccattccg 480
tacccgcgca acgccgagaa ggcgcgctac ctgaagcacg tcgggatcta cgcctatcgg 540
cgggatgtcc tgcaaaatta cagccagttg ccggagtcca tgcccgaaca ggccgaatcc 600
ctggagcaac tgcggctgat gagcgcgggc attaacattc gcaccttcga ggtcgccgcg 660
accggtcccg gcgtcgatac cccggcgtgc ttggagaagg tccgggccct gatggcgcag 720
gagctcgcgg agaacgca 738
<210> 8
<211> 246
<212> PRT
<213> Escherichia coli
<400> 8
Met Ser Lys Ala Val Ile Val Ile Pro Ala Arg Tyr Gly Ser Ser Arg
1 5 10 15
Leu Pro Gly Lys Pro Leu Leu Asp Ile Val Gly Lys Pro Met Ile Gln
20 25 30
His Val Tyr Glu Arg Ala Leu Gln Val Ala Gly Val Ala Glu Val Trp
35 40 45
Val Ala Thr Asp Asp Pro Arg Val Glu Gln Ala Val Gln Ala Phe Gly
50 55 60
Gly Lys Ala Ile Met Thr Arg Asn Asp His Glu Ser Gly Thr Asp Arg
65 70 75 80
Leu Val Glu Val Met His Lys Val Glu Ala Asp Ile Tyr Ile Asn Leu
85 90 95
Gln Gly Asp Glu Pro Met Ile Arg Pro Arg Asp Val Glu Thr Leu Leu
100 105 110
Gln Gly Met Arg Asp Asp Pro Ala Leu Pro Val Ala Thr Leu Cys His
115 120 125
Ala Ile Ser Ala Ala Glu Ala Ala Glu Pro Ser Thr Val Lys Val Val
130 135 140
Val Asn Thr Arg Gln Asp Ala Leu Tyr Phe Ser Arg Ser Pro Ile Pro
145 150 155 160
Tyr Pro Arg Asn Ala Glu Lys Ala Arg Tyr Leu Lys His Val Gly Ile
165 170 175
Tyr Ala Tyr Arg Arg Asp Val Leu Gln Asn Tyr Ser Gln Leu Pro Glu
180 185 190
Ser Met Pro Glu Gln Ala Glu Ser Leu Glu Gln Leu Arg Leu Met Ser
195 200 205
Ala Gly Ile Asn Ile Arg Thr Phe Glu Val Ala Ala Thr Gly Pro Gly
210 215 220
Val Asp Thr Pro Ala Cys Leu Glu Lys Val Arg Ala Leu Met Ala Gln
225 230 235 240
Glu Leu Ala Glu Asn Ala
245
<210> 9
<211> 2025
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Sequence
<400> 9
atgattggca tttatagccc cggcatttgg cgtattccgc acctggaaaa attcctcgcc 60
cagccctgcc aaaagctgtc gctgctgcgc ccggtcccgc aggaagtgga tgcaatcgcg 120
gtgtgggggc accgcccctc ggccgcaaag ccggtggcca tcgccaaagc cgcaggcaag 180
ccggtgatcc gcttggagga tggtttcgtc cgctcgctgg acctgggcgt gaacggtgaa 240
ccgcccctct cgctcgtcgt ggatgactgc ggcatttact acgacgcctc gaaaccgagc 300
gcgctggaaa aactcgtgca ggacaaggcc ggcaacgcgg ccctggcgga tcaggcgcgc 360
gaggcgatgc acaccattgt gacgggcgac atgagcaagt acaacctggc accggcgttc 420
gtggcggatg aaagcgagcg cacgaacatc gtgctggtgg tggaccagac cttcaatgac 480
atgagcgtga cctacggcaa cgcaggcccc catgagttcg ccgcaatgct ggaagcagcg 540
atggcggaaa acccgcaggc agaaatctgg gtcaaagtgc atcccgatgt cctggaaggg 600
aaaaagaccg gctacttcgc ggacttgcgt gccacccagc gcgtgcgcct gattgcggaa 660
aacgtgtcgc cgcagtccct gctgcgtcat gtgtcccgcg tgtacgtcgt gacctcccag 720
tacggttttg aagccctgct ggccggtaag cccgtgacct gctttggcca accctggtat 780
gcagggtggg gcctcaccga tgaccgccac ccccaatcgg cgctgctgtc ggcgcgtcgc 840
ggctcggcca ccctggagga actgttcgca gcggcctatc tgcgctattg ccgctacatt 900
gatccgcaga ccggggaggt gtcggccctg ttcacggtgc tccaatggct ccagctgcaa 960
cgtcgtcacc tgcaacagcg gaatggttat ctctgggtgc cgggcctgac cctgtggaaa 1020
agcgcgatcc tgaagccctt cctgcaaacg gccacgaatc gtctctcctt ttcccgtcgc 1080
tgtaccgcag caagcgcctg cgtcgtgtgg ggcgtgaaag gcgaacagca atggcgtgcg 1140
gaggcacagc gcaaatccct gccgctgtgg cgcatggaag acggcttcct gcgcagctcc 1200
ggcctgggga gcgatctgct gccgccgttg agcctggtcc tggataagcg cggtatctat 1260
tacgatgcca cccgtccgtc ggaactggag gtcctgctga atcacagcca gctgaccctc 1320
gcgcaccaga tgcgcgcgga aaagttgcgc caacgtctgg tggaaagcaa attgagcaaa 1380
tataacctgg gggccgattt cagcctcccg gcagaagcga aggacaagaa agtcatcctg 1440
gtgccgggcc aggtggaaga cgatgcgtcg attaagacgg gcaccgtgtc gatcaagtcg 1500
aatctggagc tgctgcgcac cgtgcgggaa cgtaatccgc acgcctacat catctacaag 1560
ccgcaccccg atgtgctcgt cggcaaccgt aagggtgaca ttccggcgga acagatcgcg 1620
gaactcgcag actaccaggc actggatgcc gatatcattc agtgtattca gcgtgcggac 1680
gaggtgcaca cgatgacgag cctcagcggc tttgaagcat tgctgcacgg taaacaggtg 1740
cactgctacg gcctgccgtt ctacgcctcg tggggcctga ccgtcgatga gcaccactgc 1800
ccccgtcgcg agcggcggct gaccatcgcc gacctgatct atcaagccct gattgtctat 1860
cccacctata ttcatccgac gcggttgcag ccgatcacgg tggaggaagc ggcagaatat 1920
ctgatcaaaa cgccccgcaa acccatcttt atcacccgca agaaagccgg ccgtgtgatt 1980
cgctactatc gcaagttgat catgttctgc aaagtgcgct ttggt 2025
<210> 10
<211> 675
<212> PRT
<213> Escherichia coli
<400> 10
Met Ile Gly Ile Tyr Ser Pro Gly Ile Trp Arg Ile Pro His Leu Glu
1 5 10 15
Lys Phe Leu Ala Gln Pro Cys Gln Lys Leu Ser Leu Leu Arg Pro Val
20 25 30
Pro Gln Glu Val Asp Ala Ile Ala Val Trp Gly His Arg Pro Ser Ala
35 40 45
Ala Lys Pro Val Ala Ile Ala Lys Ala Ala Gly Lys Pro Val Ile Arg
50 55 60
Leu Glu Asp Gly Phe Val Arg Ser Leu Asp Leu Gly Val Asn Gly Glu
65 70 75 80
Pro Pro Leu Ser Leu Val Val Asp Asp Cys Gly Ile Tyr Tyr Asp Ala
85 90 95
Ser Lys Pro Ser Ala Leu Glu Lys Leu Val Gln Asp Lys Ala Gly Asn
100 105 110
Ala Ala Leu Ala Asp Gln Ala Arg Glu Ala Met His Thr Ile Val Thr
115 120 125
Gly Asp Met Ser Lys Tyr Asn Leu Ala Pro Ala Phe Val Ala Asp Glu
130 135 140
Ser Glu Arg Thr Asn Ile Val Leu Val Val Asp Gln Thr Phe Asn Asp
145 150 155 160
Met Ser Val Thr Tyr Gly Asn Ala Gly Pro His Glu Phe Ala Ala Met
165 170 175
Leu Glu Ala Ala Met Ala Glu Asn Pro Gln Ala Glu Ile Trp Val Lys
180 185 190
Val His Pro Asp Val Leu Glu Gly Lys Lys Thr Gly Tyr Phe Ala Asp
195 200 205
Leu Arg Ala Thr Gln Arg Val Arg Leu Ile Ala Glu Asn Val Ser Pro
210 215 220
Gln Ser Leu Leu Arg His Val Ser Arg Val Tyr Val Val Thr Ser Gln
225 230 235 240
Tyr Gly Phe Glu Ala Leu Leu Ala Gly Lys Pro Val Thr Cys Phe Gly
245 250 255
Gln Pro Trp Tyr Ala Gly Trp Gly Leu Thr Asp Asp Arg His Pro Gln
260 265 270
Ser Ala Leu Leu Ser Ala Arg Arg Gly Ser Ala Thr Leu Glu Glu Leu
275 280 285
Phe Ala Ala Ala Tyr Leu Arg Tyr Cys Arg Tyr Ile Asp Pro Gln Thr
290 295 300
Gly Glu Val Ser Ala Leu Phe Thr Val Leu Gln Trp Leu Gln Leu Gln
305 310 315 320
Arg Arg His Leu Gln Gln Arg Asn Gly Tyr Leu Trp Val Pro Gly Leu
325 330 335
Thr Leu Trp Lys Ser Ala Ile Leu Lys Pro Phe Leu Gln Thr Ala Thr
340 345 350
Asn Arg Leu Ser Phe Ser Arg Arg Cys Thr Ala Ala Ser Ala Cys Val
355 360 365
Val Trp Gly Val Lys Gly Glu Gln Gln Trp Arg Ala Glu Ala Gln Arg
370 375 380
Lys Ser Leu Pro Leu Trp Arg Met Glu Asp Gly Phe Leu Arg Ser Ser
385 390 395 400
Gly Leu Gly Ser Asp Leu Leu Pro Pro Leu Ser Leu Val Leu Asp Lys
405 410 415
Arg Gly Ile Tyr Tyr Asp Ala Thr Arg Pro Ser Glu Leu Glu Val Leu
420 425 430
Leu Asn His Ser Gln Leu Thr Leu Ala His Gln Met Arg Ala Glu Lys
435 440 445
Leu Arg Gln Arg Leu Val Glu Ser Lys Leu Ser Lys Tyr Asn Leu Gly
450 455 460
Ala Asp Phe Ser Leu Pro Ala Glu Ala Lys Asp Lys Lys Val Ile Leu
465 470 475 480
Val Pro Gly Gln Val Glu Asp Asp Ala Ser Ile Lys Thr Gly Thr Val
485 490 495
Ser Ile Lys Ser Asn Leu Glu Leu Leu Arg Thr Val Arg Glu Arg Asn
500 505 510
Pro His Ala Tyr Ile Ile Tyr Lys Pro His Pro Asp Val Leu Val Gly
515 520 525
Asn Arg Lys Gly Asp Ile Pro Ala Glu Gln Ile Ala Glu Leu Ala Asp
530 535 540
Tyr Gln Ala Leu Asp Ala Asp Ile Ile Gln Cys Ile Gln Arg Ala Asp
545 550 555 560
Glu Val His Thr Met Thr Ser Leu Ser Gly Phe Glu Ala Leu Leu His
565 570 575
Gly Lys Gln Val His Cys Tyr Gly Leu Pro Phe Tyr Ala Ser Trp Gly
580 585 590
Leu Thr Val Asp Glu His His Cys Pro Arg Arg Glu Arg Arg Leu Thr
595 600 605
Ile Ala Asp Leu Ile Tyr Gln Ala Leu Ile Val Tyr Pro Thr Tyr Ile
610 615 620
His Pro Thr Arg Leu Gln Pro Ile Thr Val Glu Glu Ala Ala Glu Tyr
625 630 635 640
Leu Ile Lys Thr Pro Arg Lys Pro Ile Phe Ile Thr Arg Lys Lys Ala
645 650 655
Gly Arg Val Ile Arg Tyr Tyr Arg Lys Leu Ile Met Phe Cys Lys Val
660 665 670
Arg Phe Gly
675
<210> 11
<211> 1209
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Sequence
<400> 11
atgcacggca atgcgctgac ggtgctgttg agcggtaaaa agtacctcct gctccaaggt 60
ccgatgggtc cgttcttcaa cgatgtggcg gaatggttgg agagcctcgg tcgcaacgcg 120
gtcaacgtcg tctttaatgg cggtgatcgc ttctactgcc gccaccgcca atacctggcg 180
tactaccaaa ccccgaagga gttccccggt tggctgcggg acttgcatcg tcagtatgac 240
tttgacacga ttttgtgttt cggtgactgc cgcctgctgc acaaggaggc caaacgctgg 300
gccaagtcga aggggattcg ttttctggcc ttcgaggaag gctacctgcg tccgcaattt 360
atcaccgtgg aagaaggcgg tgtgaacgcc tatagcagct tgccccgcga tccggacttt 420
taccgcaaat tgcccgatat gccgacgccg cacgtcgaga acctgaaacc gagcaccatg 480
aagcgcatcg gccacgccat gtggtattac ctgatgggtt ggcactatcg tcacgaattt 540
ccgcgctatc gccaccacaa atcgttcagc ccgtggtatg aagcgcgctg ctgggtccgc 600
gcctactggc gcaaacagct gtataaggtc acccaacgca aggtcctccc ccgcctgatg 660
aacgagctgg atcagcgcta ttacctggcg gtcctgcaag tgtacaacga cagccagatc 720
cgcaaccata gcaactataa tgatgtgcgt gattacatca acgaagtgat gtacagcttt 780
tcccgcaagg cccccaagga gtcctatctg gtgatcaaac atcacccgat ggatcgcggg 840
caccgcctgt accgcccgtt gatcaagcgt ctgtcgaagg aatacggttt ggatgaacgt 900
gtcatctatg tgcacgatct gcccatgccg gagctgttgc gccacgccaa agcggtggtc 960
accatcaata gcacggccgg catttccgcg ttgatccaca acaagcccct gaaagtcatg 1020
ggcaacgcct tgtacgatat caagggtctg acgtaccagg ggcatttgca tcagttctgg 1080
caagccgact ttaaaccgaa catgaagttg tttaagaaat ttcgcggcta cttgctggtg 1140
aagacccagg tcaatgcggt gtactacggc gaaatgatct ttaacaaaat taagaagtat 1200
aagaaacgt 1209
<210> 12
<211> 403
<212> PRT
<213> Escherichia coli
<400> 12
Met His Gly Asn Ala Leu Thr Val Leu Leu Ser Gly Lys Lys Tyr Leu
1 5 10 15
Leu Leu Gln Gly Pro Met Gly Pro Phe Phe Asn Asp Val Ala Glu Trp
20 25 30
Leu Glu Ser Leu Gly Arg Asn Ala Val Asn Val Val Phe Asn Gly Gly
35 40 45
Asp Arg Phe Tyr Cys Arg His Arg Gln Tyr Leu Ala Tyr Tyr Gln Thr
50 55 60
Pro Lys Glu Phe Pro Gly Trp Leu Arg Asp Leu His Arg Gln Tyr Asp
65 70 75 80
Phe Asp Thr Ile Leu Cys Phe Gly Asp Cys Arg Leu Leu His Lys Glu
85 90 95
Ala Lys Arg Trp Ala Lys Ser Lys Gly Ile Arg Phe Leu Ala Phe Glu
100 105 110
Glu Gly Tyr Leu Arg Pro Gln Phe Ile Thr Val Glu Glu Gly Gly Val
115 120 125
Asn Ala Tyr Ser Ser Leu Pro Arg Asp Pro Asp Phe Tyr Arg Lys Leu
130 135 140
Pro Asp Met Pro Thr Pro His Val Glu Asn Leu Lys Pro Ser Thr Met
145 150 155 160
Lys Arg Ile Gly His Ala Met Trp Tyr Tyr Leu Met Gly Trp His Tyr
165 170 175
Arg His Glu Phe Pro Arg Tyr Arg His His Lys Ser Phe Ser Pro Trp
180 185 190
Tyr Glu Ala Arg Cys Trp Val Arg Ala Tyr Trp Arg Lys Gln Leu Tyr
195 200 205
Lys Val Thr Gln Arg Lys Val Leu Pro Arg Leu Met Asn Glu Leu Asp
210 215 220
Gln Arg Tyr Tyr Leu Ala Val Leu Gln Val Tyr Asn Asp Ser Gln Ile
225 230 235 240
Arg Asn His Ser Asn Tyr Asn Asp Val Arg Asp Tyr Ile Asn Glu Val
245 250 255
Met Tyr Ser Phe Ser Arg Lys Ala Pro Lys Glu Ser Tyr Leu Val Ile
260 265 270
Lys His His Pro Met Asp Arg Gly His Arg Leu Tyr Arg Pro Leu Ile
275 280 285
Lys Arg Leu Ser Lys Glu Tyr Gly Leu Asp Glu Arg Val Ile Tyr Val
290 295 300
His Asp Leu Pro Met Pro Glu Leu Leu Arg His Ala Lys Ala Val Val
305 310 315 320
Thr Ile Asn Ser Thr Ala Gly Ile Ser Ala Leu Ile His Asn Lys Pro
325 330 335
Leu Lys Val Met Gly Asn Ala Leu Tyr Asp Ile Lys Gly Leu Thr Tyr
340 345 350
Gln Gly His Leu His Gln Phe Trp Gln Ala Asp Phe Lys Pro Asn Met
355 360 365
Lys Leu Phe Lys Lys Phe Arg Gly Tyr Leu Leu Val Lys Thr Gln Val
370 375 380
Asn Ala Val Tyr Tyr Gly Glu Met Ile Phe Asn Lys Ile Lys Lys Tyr
385 390 395 400
Lys Lys Arg
<210> 13
<211> 774
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Sequence
<400> 13
atggcacgtt cgggttttga agtccagaaa gtgacggtcg aagcactgtt tctccgcgaa 60
atccgtacgc gctttggcaa gtttcgcctg ggctatctgt gggcgatcct ggaaccgagc 120
gcacatctgc tgattctgct cgggatcttt ggctatatca tgcatcgcac catgccggat 180
atctccttcc cggtgttcct gctcaatggc ctgatcccgt tctttatttt cagcagcatc 240
agcaatcgct ccgtgggcgc catcgaagcc aatcaggggc tgtttaacta ccggcccgtg 300
aagccgatcg acacgatcat tgcacgcgcc ctcttggaaa cgctgatcta tgtggcggtc 360
tacatcctcc tgatgctgat catctggatg gcgggcgaat atttcgagat taccaacttc 420
ctgcaatttg tgctcacctg gagcctcctg atcatcctgt cgtgcggtgt gggcctgatc 480
ttcatggtcg tgggcaagac gttccccgaa atgcagaaag tcttgccgat cttgctgaag 540
ccgctgtact ttatttcgtg catcatgttc ccgctgcact ccattccgaa gcagtattgg 600
tcgtacctgc tgtggaatcc cctggtgcac gtcgtcgaac tgagccgcga ggccgtgatg 660
cccggttata tcagcgaagg ggtcagcctg aattatctgg caatgttcac cctggtgacc 720
ctgtttattg gtttggccct gtaccgtacg cgtgaggagg caatgttgac ctca 774
<210> 14
<211> 258
<212> PRT
<213> Escherichia coli
<400> 14
Met Ala Arg Ser Gly Phe Glu Val Gln Lys Val Thr Val Glu Ala Leu
1 5 10 15
Phe Leu Arg Glu Ile Arg Thr Arg Phe Gly Lys Phe Arg Leu Gly Tyr
20 25 30
Leu Trp Ala Ile Leu Glu Pro Ser Ala His Leu Leu Ile Leu Leu Gly
35 40 45
Ile Phe Gly Tyr Ile Met His Arg Thr Met Pro Asp Ile Ser Phe Pro
50 55 60
Val Phe Leu Leu Asn Gly Leu Ile Pro Phe Phe Ile Phe Ser Ser Ile
65 70 75 80
Ser Asn Arg Ser Val Gly Ala Ile Glu Ala Asn Gln Gly Leu Phe Asn
85 90 95
Tyr Arg Pro Val Lys Pro Ile Asp Thr Ile Ile Ala Arg Ala Leu Leu
100 105 110
Glu Thr Leu Ile Tyr Val Ala Val Tyr Ile Leu Leu Met Leu Ile Ile
115 120 125
Trp Met Ala Gly Glu Tyr Phe Glu Ile Thr Asn Phe Leu Gln Phe Val
130 135 140
Leu Thr Trp Ser Leu Leu Ile Ile Leu Ser Cys Gly Val Gly Leu Ile
145 150 155 160
Phe Met Val Val Gly Lys Thr Phe Pro Glu Met Gln Lys Val Leu Pro
165 170 175
Ile Leu Leu Lys Pro Leu Tyr Phe Ile Ser Cys Ile Met Phe Pro Leu
180 185 190
His Ser Ile Pro Lys Gln Tyr Trp Ser Tyr Leu Leu Trp Asn Pro Leu
195 200 205
Val His Val Val Glu Leu Ser Arg Glu Ala Val Met Pro Gly Tyr Ile
210 215 220
Ser Glu Gly Val Ser Leu Asn Tyr Leu Ala Met Phe Thr Leu Val Thr
225 230 235 240
Leu Phe Ile Gly Leu Ala Leu Tyr Arg Thr Arg Glu Glu Ala Met Leu
245 250 255
Thr Ser
<210> 15
<211> 666
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Sequence
<400> 15
atgattaaga tcgaaaacct gacgaaaagc taccgcaccc cggtgggccg tcactatgtc 60
ttcaagaacc tgaacattga gatccccagc ggcaaaagcg tggcgttcat cgggcgcaat 120
ggggcgggta aatccacgct gttgcgcatg attgggggca tcgaccgccc ggatagcggt 180
aaaatcatca cgaataaaac gatctcgtgg ccggtgggtc tggcaggcgg cttccagggc 240
agcttgaccg ggcgtgaaaa cgtgaagttc gtggcccggc tgtacgcgaa gcaggaggag 300
ctgaaagaaa agattgagtt tgtggaagag ttcgcggagc tggggaagta ttttgatatg 360
ccgatcaaga cctattcgag cggtatgcgc agccgcctcg gcttcggcct gagcatggcg 420
ttcaagttcg attactacat cgtggacgag gtgacggcgg tgggggacgc ccgtttcaag 480
gaaaaatgtg cccaactctt caaggagcgt cataaggaaa gctccttcct catggtgtcg 540
cactcgctga actcgttgaa agagttctgc gatgtggcaa tcgtgtttaa agacgacaac 600
gccgtgtcgt tccatgaaga cgtgcaagaa ggcattgaag aatatatcac cgaacaaaac 660
aactac 666
<210> 16
<211> 222
<212> PRT
<213> Escherichia coli
<400> 16
Met Ile Lys Ile Glu Asn Leu Thr Lys Ser Tyr Arg Thr Pro Val Gly
1 5 10 15
Arg His Tyr Val Phe Lys Asn Leu Asn Ile Glu Ile Pro Ser Gly Lys
20 25 30
Ser Val Ala Phe Ile Gly Arg Asn Gly Ala Gly Lys Ser Thr Leu Leu
35 40 45
Arg Met Ile Gly Gly Ile Asp Arg Pro Asp Ser Gly Lys Ile Ile Thr
50 55 60
Asn Lys Thr Ile Ser Trp Pro Val Gly Leu Ala Gly Gly Phe Gln Gly
65 70 75 80
Ser Leu Thr Gly Arg Glu Asn Val Lys Phe Val Ala Arg Leu Tyr Ala
85 90 95
Lys Gln Glu Glu Leu Lys Glu Lys Ile Glu Phe Val Glu Glu Phe Ala
100 105 110
Glu Leu Gly Lys Tyr Phe Asp Met Pro Ile Lys Thr Tyr Ser Ser Gly
115 120 125
Met Arg Ser Arg Leu Gly Phe Gly Leu Ser Met Ala Phe Lys Phe Asp
130 135 140
Tyr Tyr Ile Val Asp Glu Val Thr Ala Val Gly Asp Ala Arg Phe Lys
145 150 155 160
Glu Lys Cys Ala Gln Leu Phe Lys Glu Arg His Lys Glu Ser Ser Phe
165 170 175
Leu Met Val Ser His Ser Leu Asn Ser Leu Lys Glu Phe Cys Asp Val
180 185 190
Ala Ile Val Phe Lys Asp Asp Asn Ala Val Ser Phe His Glu Asp Val
195 200 205
Gln Glu Gly Ile Glu Glu Tyr Ile Thr Glu Gln Asn Asn Tyr
210 215 220
<210> 17
<211> 1017
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Sequence
<400> 17
atgaacatcc tggtcaccgg cggtgcaggc tacatcggca gccacacgtc gctctgcctg 60
ctgaacaaag gctacaatgt cgtcatcatt gacaatctca tcaacagcag ctgcgaaagc 120
atccgtcgca ttgagctgat cgcaaagaag aaagtcacgt tctacgaact caatatcaac 180
aacgagaagg aagtgaacca gatcctgaag aaacacaaat tcgactgcat catgcacttt 240
gcaggtgcga aatcggtcgc agaaagcctg atcaagccca tcttctacta tgacaacaac 300
gtgagcggca ccctgcaact catcaattgc gccatcaaga acgacgtcgc caacttcatc 360
tttagctcgt cggcgacggt gtatggggaa agcaagatca tgcccgtcac cgaagactgc 420
catattggtg gcacgctgaa tccgtatggt acgtccaagt acatctcgga gctgatgatc 480
cgcgacatcg ccaagaaata ctccgacacg aatttcctct gcttgcgcta ctttaatccg 540
acgggcgccc acgaatccgg tatgattggt gaaagcccgg cagacatccc ctccaacttg 600
gtgccgtaca tcttgcaggt cgcgatgggg aaactggaaa aactgatggt gttcggtggt 660
gattatccca ccaaagacgg cacgggggtc cgtgactata tccatgtgat ggacctggcc 720
gaagggcacg tcgcagcgct gtcctatctc ttccgcgaca ataacaccaa ctaccacgtc 780
tttaatttgg gcacgggtaa aggttattcg gtgctggaac tggtgtccac ctttgaaaag 840
atttccggcg tgcggattcc gtatgaaatc gtgagccgcc gtgacggtga tatcgcggag 900
agctggtcct cccccgaaaa ggccaacaaa tatctgaact ggaaagccaa gcgggaactc 960
gaaaccatgc tggaggacgc ctggcgctgg cagatgaaga atccgaatgg ctatatt 1017
<210> 18
<211> 339
<212> PRT
<213> Escherichia coli
<400> 18
Met Asn Ile Leu Val Thr Gly Gly Ala Gly Tyr Ile Gly Ser His Thr
1 5 10 15
Ser Leu Cys Leu Leu Asn Lys Gly Tyr Asn Val Val Ile Ile Asp Asn
20 25 30
Leu Ile Asn Ser Ser Cys Glu Ser Ile Arg Arg Ile Glu Leu Ile Ala
35 40 45
Lys Lys Lys Val Thr Phe Tyr Glu Leu Asn Ile Asn Asn Glu Lys Glu
50 55 60
Val Asn Gln Ile Leu Lys Lys His Lys Phe Asp Cys Ile Met His Phe
65 70 75 80
Ala Gly Ala Lys Ser Val Ala Glu Ser Leu Ile Lys Pro Ile Phe Tyr
85 90 95
Tyr Asp Asn Asn Val Ser Gly Thr Leu Gln Leu Ile Asn Cys Ala Ile
100 105 110
Lys Asn Asp Val Ala Asn Phe Ile Phe Ser Ser Ser Ala Thr Val Tyr
115 120 125
Gly Glu Ser Lys Ile Met Pro Val Thr Glu Asp Cys His Ile Gly Gly
130 135 140
Thr Leu Asn Pro Tyr Gly Thr Ser Lys Tyr Ile Ser Glu Leu Met Ile
145 150 155 160
Arg Asp Ile Ala Lys Lys Tyr Ser Asp Thr Asn Phe Leu Cys Leu Arg
165 170 175
Tyr Phe Asn Pro Thr Gly Ala His Glu Ser Gly Met Ile Gly Glu Ser
180 185 190
Pro Ala Asp Ile Pro Ser Asn Leu Val Pro Tyr Ile Leu Gln Val Ala
195 200 205
Met Gly Lys Leu Glu Lys Leu Met Val Phe Gly Gly Asp Tyr Pro Thr
210 215 220
Lys Asp Gly Thr Gly Val Arg Asp Tyr Ile His Val Met Asp Leu Ala
225 230 235 240
Glu Gly His Val Ala Ala Leu Ser Tyr Leu Phe Arg Asp Asn Asn Thr
245 250 255
Asn Tyr His Val Phe Asn Leu Gly Thr Gly Lys Gly Tyr Ser Val Leu
260 265 270
Glu Leu Val Ser Thr Phe Glu Lys Ile Ser Gly Val Arg Ile Pro Tyr
275 280 285
Glu Ile Val Ser Arg Arg Asp Gly Asp Ile Ala Glu Ser Trp Ser Ser
290 295 300
Pro Glu Lys Ala Asn Lys Tyr Leu Asn Trp Lys Ala Lys Arg Glu Leu
305 310 315 320
Glu Thr Met Leu Glu Asp Ala Trp Arg Trp Gln Met Lys Asn Pro Asn
325 330 335
Gly Tyr Ile
<210> 19
<211> 1638
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Sequence
<400> 19
atgaaccgcc tggtgatcgt gggccatccg agcagcaact accaaatcgt ggaagaactc 60
ctgcatcagc gcggcatgaa ctccctgtgc ccgtccaaac gtgagaacct ctcgccccag 120
gacatcaccc agacgctgcg gaaggcgtac cagtcgccgg acatctatac ggtgaccgat 180
tccgccgact ttgaaccgct ccatgtgagc accgtctgga acggtatcgc attggatctg 240
atgctgtcca acctgaacca gaaactgtgc ggttggagcg accccaacgc aattcacacg 300
ttggaatatt ggaaatcggt ggatgagaac atcaccttta tcctcatcta cgaccacccc 360
aaaagcatcc tgacgaacta cttctcggac cagaacatct ccagcaacta tacctcggag 420
catctgatca aaaactggct ggcatacaac accgccttgc tgcacttctt cctcaacaac 480
cggggtcggt gcctgctggt gtcgagcgaa caggtgaagc gcaacgccga ggactgcatc 540
cagcaactgc aacacaaact gaaactgaaa ttcgggttgt cgttctccaa taccatcaac 600
cactcgctgg agcagagcgt gaatgacttt aagaccgccg aagcctccat tacgctggaa 660
aaagaacatc aggagatcat gtccctcagc ggtattgaca tcgggaccgg ggatatcatt 720
ttcaagcaaa gcgagacgga ggagtacttg atcttcaacg tcctgaacga ctatcccgat 780
tgcaaggaac tgtactttga attgcaatcg aacgccaaca cccccttgcg ggtgctggag 840
aaggaaaact ataagccgtc ctttatttgg gagacgttca ttaaacaacg ccagatcacc 900
ctcgatatcg tgaacggtct gtaccagagc agcaaaaaga tcattctgga caacgaactg 960
cacacgtcca aacagctgaa cgcctatcaa gccattctga aagagctgtc ggatagcaag 1020
gaagaactga tccagtatga tctgatcatt aaaaacaaaa ccatccaggt ccaggaactg 1080
gagtgcgcga tcgagaactt cgagtccctg ctgaaaaagg aacagaacaa aaatgaactg 1140
caacaacagc gcctcgaaaa gctgtcgtgc gaaaaagaat tgctgctcaa tcagctgcat 1200
ctggtgcagc aaaagctcga acagtacttc atcgacaatc aacgtctcga aaagaaacaa 1260
ctgccggagc tgtatggtgc ggccgaacgc atcaagcaag atatcggcta ccgcctgggt 1320
gcggtgatgg tgagccgctc caagacgttc ctcggtctga tctcgattcc gtttgcgttg 1380
atcagcgaat ggcggacctg gaagaagaaa tatgattcgg agtaccaagt gagcctgccg 1440
agcatcttcc tgtacgcgga taaacacgaa gccgaacggg tcaagaaaca cctgagctat 1500
cagctgggca agctcatcat caataagaac aattttccgc tcggtctgat cagcctgccc 1560
tttagcatct accgtaccat ccgccaattc aaacgcacca aaaacaattc ccaggtgggt 1620
gtcaagtact gcggtaag 1638
<210> 20
<211> 546
<212> PRT
<213> Escherichia coli
<400> 20
Met Asn Arg Leu Val Ile Val Gly His Pro Ser Ser Asn Tyr Gln Ile
1 5 10 15
Val Glu Glu Leu Leu His Gln Arg Gly Met Asn Ser Leu Cys Pro Ser
20 25 30
Lys Arg Glu Asn Leu Ser Pro Gln Asp Ile Thr Gln Thr Leu Arg Lys
35 40 45
Ala Tyr Gln Ser Pro Asp Ile Tyr Thr Val Thr Asp Ser Ala Asp Phe
50 55 60
Glu Pro Leu His Val Ser Thr Val Trp Asn Gly Ile Ala Leu Asp Leu
65 70 75 80
Met Leu Ser Asn Leu Asn Gln Lys Leu Cys Gly Trp Ser Asp Pro Asn
85 90 95
Ala Ile His Thr Leu Glu Tyr Trp Lys Ser Val Asp Glu Asn Ile Thr
100 105 110
Phe Ile Leu Ile Tyr Asp His Pro Lys Ser Ile Leu Thr Asn Tyr Phe
115 120 125
Ser Asp Gln Asn Ile Ser Ser Asn Tyr Thr Ser Glu His Leu Ile Lys
130 135 140
Asn Trp Leu Ala Tyr Asn Thr Ala Leu Leu His Phe Phe Leu Asn Asn
145 150 155 160
Arg Gly Arg Cys Leu Leu Val Ser Ser Glu Gln Val Lys Arg Asn Ala
165 170 175
Glu Asp Cys Ile Gln Gln Leu Gln His Lys Leu Lys Leu Lys Phe Gly
180 185 190
Leu Ser Phe Ser Asn Thr Ile Asn His Ser Leu Glu Gln Ser Val Asn
195 200 205
Asp Phe Lys Thr Ala Glu Ala Ser Ile Thr Leu Glu Lys Glu His Gln
210 215 220
Glu Ile Met Ser Leu Ser Gly Ile Asp Ile Gly Thr Gly Asp Ile Ile
225 230 235 240
Phe Lys Gln Ser Glu Thr Glu Glu Tyr Leu Ile Phe Asn Val Leu Asn
245 250 255
Asp Tyr Pro Asp Cys Lys Glu Leu Tyr Phe Glu Leu Gln Ser Asn Ala
260 265 270
Asn Thr Pro Leu Arg Val Leu Glu Lys Glu Asn Tyr Lys Pro Ser Phe
275 280 285
Ile Trp Glu Thr Phe Ile Lys Gln Arg Gln Ile Thr Leu Asp Ile Val
290 295 300
Asn Gly Leu Tyr Gln Ser Ser Lys Lys Ile Ile Leu Asp Asn Glu Leu
305 310 315 320
His Thr Ser Lys Gln Leu Asn Ala Tyr Gln Ala Ile Leu Lys Glu Leu
325 330 335
Ser Asp Ser Lys Glu Glu Leu Ile Gln Tyr Asp Leu Ile Ile Lys Asn
340 345 350
Lys Thr Ile Gln Val Gln Glu Leu Glu Cys Ala Ile Glu Asn Phe Glu
355 360 365
Ser Leu Leu Lys Lys Glu Gln Asn Lys Asn Glu Leu Gln Gln Gln Arg
370 375 380
Leu Glu Lys Leu Ser Cys Glu Lys Glu Leu Leu Leu Asn Gln Leu His
385 390 395 400
Leu Val Gln Gln Lys Leu Glu Gln Tyr Phe Ile Asp Asn Gln Arg Leu
405 410 415
Glu Lys Lys Gln Leu Pro Glu Leu Tyr Gly Ala Ala Glu Arg Ile Lys
420 425 430
Gln Asp Ile Gly Tyr Arg Leu Gly Ala Val Met Val Ser Arg Ser Lys
435 440 445
Thr Phe Leu Gly Leu Ile Ser Ile Pro Phe Ala Leu Ile Ser Glu Trp
450 455 460
Arg Thr Trp Lys Lys Lys Tyr Asp Ser Glu Tyr Gln Val Ser Leu Pro
465 470 475 480
Ser Ile Phe Leu Tyr Ala Asp Lys His Glu Ala Glu Arg Val Lys Lys
485 490 495
His Leu Ser Tyr Gln Leu Gly Lys Leu Ile Ile Asn Lys Asn Asn Phe
500 505 510
Pro Leu Gly Leu Ile Ser Leu Pro Phe Ser Ile Tyr Arg Thr Ile Arg
515 520 525
Gln Phe Lys Arg Thr Lys Asn Asn Ser Gln Val Gly Val Lys Tyr Cys
530 535 540
Gly Lys
545
<210> 21
<211> 2058
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Sequence
<400> 21
atgagcattt tgaaccaggc aatcaatctg tataagaata agaactaccg ccaagccctc 60
tccctgtttg aaaaagtggc ggaaatctat gatgtgagct gggtggaagc caatatcaag 120
ctgtgccaaa ccgccctgaa tctgagcgaa gaagtggaca agctgaatcg gaaagcggtc 180
attgatatcg acgcggcaac caaaattatg tgcagcaatg caaaggcgat ctcgctgaat 240
gaggtggaaa agaatgaaat cattagcaaa tatcgggaaa ttaccgcaaa gaaatccgag 300
cgcgccgaat tgaaagaagt cgaacccatt ccgctggatt ggccgagcga cctgaccttg 360
ccgccgctgc cggaaagcac gaacgactac gtctgggcag ggaaacgtaa agaactggat 420
gattatccgc gcaagcaact gatcatcgac ggcctgtcca tcgtgattcc gacgtacaat 480
cgcgccaaaa tcctggcgat caccctggcc tgcctctgca atcagaaaac gatttatgac 540
tatgaggtca tcgtcgcgga tgacggttcc aaggaaaaca tcgaagagat cgtccgcgag 600
ttcgagtcgt tgctgaacat caaatacgtc cgccagaaag actacggcta ccagctgtgc 660
gccgtgcgga acctgggcct gcgggcagcg aaatacaact acgtggcgat cttggactgc 720
gatatggcgc cgaacccgtt gtgggtgcag tcctatatgg aactcctggc cgtggatgat 780
aacgtggcac tgattggccc gcgtaaatac atcgacacgt cgaagcatac ctatctggac 840
tttttgtccc agaaaagcct gatcaatgaa atcccggaga ttattaccaa taatcaggtc 900
gcaggcaagg tcgagcagaa caaatccgtc gattggcgca tcgaacattt caagaatacc 960
gacaatctgc gcctgtgcaa caccccgttc cggttcttta gcggtggcaa tgtggcgttt 1020
gcaaagaagt ggctgtttcg cgcgggttgg tttgacgaag agttcacgca ttggggcggt 1080
gaggataatg agttcggcta tcggctgtac cgcgagggtt gttatttccg tagcgtggaa 1140
ggcgcgatgg catatcatca ggaaccgccc ggtaaggaga acgaaaccga tcgcgcggca 1200
ggtaaaaaca ttaccgtcca gctgttgcag cagaaggtgc cctactttta tcgcaagaag 1260
gagaaaatcg agagcgccac cctgaaacgt gtgcccctgg tgagcatcta catccccgcg 1320
tataattgca gcaaatatat cgtgcgctgc gtcgaatcgg cactgaacca aacgatcacc 1380
gatctggagg tctgcatctg cgatgacggg agcaccgatg atacgctgcg catcctgcaa 1440
gaacattacg caaaccaccc gcgcgtccgt ttcatcagcc agaaaaacaa aggcatcggc 1500
tccgcctcga ataccgcagt ccgcctgtgc cggggtttct acatcgggca gctggattcc 1560
gatgatttcc tggagcccga tgccgtggaa ctgtgtctgg atgaatttcg caaagacctg 1620
agcctcgcct gcgtgtacac caccaatcgc aatattgatc gtgaaggtaa cttgattagc 1680
aatggctaca actggccgat ttacagccgc gaaaagctca cgagcgcgat gatctgccac 1740
cacttccgta tgttcacggc gcgtgcatgg aacctcaccg aaggcttcaa cgagagcatc 1800
agcaatgcgg tggattacga tatgtatttg aaactcagcg aagtcggccc gtttaagcat 1860
atcaataaga tttgctacaa ccgtgtcctg cacggcgaga acacgtcgat caagaaactg 1920
gacatccaaa aggaaaacca tttcaaggtg gtgaacgaaa gcctgtcgcg cctcggtatc 1980
aaaaagtaca aatactcgcc gctgaccaac ttgaatgaat gtcgcaaata tacctgggag 2040
aagatcgaaa acgacttg 2058
<210> 22
<211> 686
<212> PRT
<213> Escherichia coli
<400> 22
Met Ser Ile Leu Asn Gln Ala Ile Asn Leu Tyr Lys Asn Lys Asn Tyr
1 5 10 15
Arg Gln Ala Leu Ser Leu Phe Glu Lys Val Ala Glu Ile Tyr Asp Val
20 25 30
Ser Trp Val Glu Ala Asn Ile Lys Leu Cys Gln Thr Ala Leu Asn Leu
35 40 45
Ser Glu Glu Val Asp Lys Leu Asn Arg Lys Ala Val Ile Asp Ile Asp
50 55 60
Ala Ala Thr Lys Ile Met Cys Ser Asn Ala Lys Ala Ile Ser Leu Asn
65 70 75 80
Glu Val Glu Lys Asn Glu Ile Ile Ser Lys Tyr Arg Glu Ile Thr Ala
85 90 95
Lys Lys Ser Glu Arg Ala Glu Leu Lys Glu Val Glu Pro Ile Pro Leu
100 105 110
Asp Trp Pro Ser Asp Leu Thr Leu Pro Pro Leu Pro Glu Ser Thr Asn
115 120 125
Asp Tyr Val Trp Ala Gly Lys Arg Lys Glu Leu Asp Asp Tyr Pro Arg
130 135 140
Lys Gln Leu Ile Ile Asp Gly Leu Ser Ile Val Ile Pro Thr Tyr Asn
145 150 155 160
Arg Ala Lys Ile Leu Ala Ile Thr Leu Ala Cys Leu Cys Asn Gln Lys
165 170 175
Thr Ile Tyr Asp Tyr Glu Val Ile Val Ala Asp Asp Gly Ser Lys Glu
180 185 190
Asn Ile Glu Glu Ile Val Arg Glu Phe Glu Ser Leu Leu Asn Ile Lys
195 200 205
Tyr Val Arg Gln Lys Asp Tyr Gly Tyr Gln Leu Cys Ala Val Arg Asn
210 215 220
Leu Gly Leu Arg Ala Ala Lys Tyr Asn Tyr Val Ala Ile Leu Asp Cys
225 230 235 240
Asp Met Ala Pro Asn Pro Leu Trp Val Gln Ser Tyr Met Glu Leu Leu
245 250 255
Ala Val Asp Asp Asn Val Ala Leu Ile Gly Pro Arg Lys Tyr Ile Asp
260 265 270
Thr Ser Lys His Thr Tyr Leu Asp Phe Leu Ser Gln Lys Ser Leu Ile
275 280 285
Asn Glu Ile Pro Glu Ile Ile Thr Asn Asn Gln Val Ala Gly Lys Val
290 295 300
Glu Gln Asn Lys Ser Val Asp Trp Arg Ile Glu His Phe Lys Asn Thr
305 310 315 320
Asp Asn Leu Arg Leu Cys Asn Thr Pro Phe Arg Phe Phe Ser Gly Gly
325 330 335
Asn Val Ala Phe Ala Lys Lys Trp Leu Phe Arg Ala Gly Trp Phe Asp
340 345 350
Glu Glu Phe Thr His Trp Gly Gly Glu Asp Asn Glu Phe Gly Tyr Arg
355 360 365
Leu Tyr Arg Glu Gly Cys Tyr Phe Arg Ser Val Glu Gly Ala Met Ala
370 375 380
Tyr His Gln Glu Pro Pro Gly Lys Glu Asn Glu Thr Asp Arg Ala Ala
385 390 395 400
Gly Lys Asn Ile Thr Val Gln Leu Leu Gln Gln Lys Val Pro Tyr Phe
405 410 415
Tyr Arg Lys Lys Glu Lys Ile Glu Ser Ala Thr Leu Lys Arg Val Pro
420 425 430
Leu Val Ser Ile Tyr Ile Pro Ala Tyr Asn Cys Ser Lys Tyr Ile Val
435 440 445
Arg Cys Val Glu Ser Ala Leu Asn Gln Thr Ile Thr Asp Leu Glu Val
450 455 460
Cys Ile Cys Asp Asp Gly Ser Thr Asp Asp Thr Leu Arg Ile Leu Gln
465 470 475 480
Glu His Tyr Ala Asn His Pro Arg Val Arg Phe Ile Ser Gln Lys Asn
485 490 495
Lys Gly Ile Gly Ser Ala Ser Asn Thr Ala Val Arg Leu Cys Arg Gly
500 505 510
Phe Tyr Ile Gly Gln Leu Asp Ser Asp Asp Phe Leu Glu Pro Asp Ala
515 520 525
Val Glu Leu Cys Leu Asp Glu Phe Arg Lys Asp Leu Ser Leu Ala Cys
530 535 540
Val Tyr Thr Thr Asn Arg Asn Ile Asp Arg Glu Gly Asn Leu Ile Ser
545 550 555 560
Asn Gly Tyr Asn Trp Pro Ile Tyr Ser Arg Glu Lys Leu Thr Ser Ala
565 570 575
Met Ile Cys His His Phe Arg Met Phe Thr Ala Arg Ala Trp Asn Leu
580 585 590
Thr Glu Gly Phe Asn Glu Ser Ile Ser Asn Ala Val Asp Tyr Asp Met
595 600 605
Tyr Leu Lys Leu Ser Glu Val Gly Pro Phe Lys His Ile Asn Lys Ile
610 615 620
Cys Tyr Asn Arg Val Leu His Gly Glu Asn Thr Ser Ile Lys Lys Leu
625 630 635 640
Asp Ile Gln Lys Glu Asn His Phe Lys Val Val Asn Glu Ser Leu Ser
645 650 655
Arg Leu Gly Ile Lys Lys Tyr Lys Tyr Ser Pro Leu Thr Asn Leu Asn
660 665 670
Glu Cys Arg Lys Tyr Thr Trp Glu Lys Ile Glu Asn Asp Leu
675 680 685
<210> 23
<211> 1431
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Sequence
<400> 23
atgttgaaga acttgacctt cgatcacatc ctgagcctga gcaagaaaga agataaaatc 60
aaactggtgc agctcatcgt caaccatctg gacgagcgca cgctgtcctg catcaagaac 120
atttcgaccg gcaaaggctt taatgcgcat ctcaaaatcc tggagttgtt cgacttgtgg 180
ctgtcggaat acttcgagta tattatcatc ccgaacaagt tgtcgaacgc agggacgttt 240
tacttcgcgt tcttctttcc ggagttctac atcaaacgtt tcaacaagaa taacacggac 300
ctgtccagct tgggtgatac cagcttcaag cgcctgatga gccgtccgca catccccaac 360
tacgtgtata atctcgtgat caactcgaac ggctgcacct tcaattcgat taagttgttg 420
ctgctcgcac tgtccctgac cagcaaacgc ttctacgaaa ccccgcagca ggagcgcaac 480
ttcttgtgcc acatcaatga aattgtcctg gcaaacgccg acgaatatag cggcatcatt 540
tcctgtatca tcaaatcgcg catctcggtg attgatgatt tcattagcag caatgtgagc 600
ctgaatacca atcgccagat cgcattgttc atcacggggc agtcgcgcgg tttcatcgac 660
gcgctgccga acctggtcag caagatcacg attccgtcgg acgtcgatgt gtttatctcc 720
acctggaagg atatcgggca tacgcaactg agcaaagaac gcatctgccg catttttgat 780
tcggaagccg cccaatacgt gtccgaaccc gacaattaca gcttcgtgga tgaacattat 840
gatgagctga aagacctgtc gctctcctcc tataagaaca ataacctgga agaaatctac 900
tcgtcgttct tctccggctg caactccgtc ctgatcaata tcaaggatga tggcgaatat 960
ccgtataaca agatgagcaa cgcggaaaag atgtactacc acaattcctt ttggttctgc 1020
tcgctgaaaa atcataactg ggataagtac cgctgcatca tcaaaatccg ccccgatgcc 1080
ctgctgcaag tggataacgt gaccatcaac gatatcgacg tggacgacag cgtgtattgc 1140
gaggacagca acggttggat ttttcgcgag tgggggtttg gcatcggcga tcagctgttc 1200
tatggcgacc cggacatcat gaagaaactg atgtgcgtgc atggtctgga taacatttac 1260
tcgcaactga cgagcctgat ctcgtcgtcg aatgtgtact actcggggca catcaacgtc 1320
ggcttgtgcg cctgggccaa tgtgtacgac tgtaaagtga gcaatctgaa gatcaagaat 1380
attgtggccc cgcgtaaaat cagcctggag caaattctga gcctgcggga a 1431
<210> 24
<211> 477
<212> PRT
<213> Escherichia coli
<400> 24
Met Leu Lys Asn Leu Thr Phe Asp His Ile Leu Ser Leu Ser Lys Lys
1 5 10 15
Glu Asp Lys Ile Lys Leu Val Gln Leu Ile Val Asn His Leu Asp Glu
20 25 30
Arg Thr Leu Ser Cys Ile Lys Asn Ile Ser Thr Gly Lys Gly Phe Asn
35 40 45
Ala His Leu Lys Ile Leu Glu Leu Phe Asp Leu Trp Leu Ser Glu Tyr
50 55 60
Phe Glu Tyr Ile Ile Ile Pro Asn Lys Leu Ser Asn Ala Gly Thr Phe
65 70 75 80
Tyr Phe Ala Phe Phe Phe Pro Glu Phe Tyr Ile Lys Arg Phe Asn Lys
85 90 95
Asn Asn Thr Asp Leu Ser Ser Leu Gly Asp Thr Ser Phe Lys Arg Leu
100 105 110
Met Ser Arg Pro His Ile Pro Asn Tyr Val Tyr Asn Leu Val Ile Asn
115 120 125
Ser Asn Gly Cys Thr Phe Asn Ser Ile Lys Leu Leu Leu Leu Ala Leu
130 135 140
Ser Leu Thr Ser Lys Arg Phe Tyr Glu Thr Pro Gln Gln Glu Arg Asn
145 150 155 160
Phe Leu Cys His Ile Asn Glu Ile Val Leu Ala Asn Ala Asp Glu Tyr
165 170 175
Ser Gly Ile Ile Ser Cys Ile Ile Lys Ser Arg Ile Ser Val Ile Asp
180 185 190
Asp Phe Ile Ser Ser Asn Val Ser Leu Asn Thr Asn Arg Gln Ile Ala
195 200 205
Leu Phe Ile Thr Gly Gln Ser Arg Gly Phe Ile Asp Ala Leu Pro Asn
210 215 220
Leu Val Ser Lys Ile Thr Ile Pro Ser Asp Val Asp Val Phe Ile Ser
225 230 235 240
Thr Trp Lys Asp Ile Gly His Thr Gln Leu Ser Lys Glu Arg Ile Cys
245 250 255
Arg Ile Phe Asp Ser Glu Ala Ala Gln Tyr Val Ser Glu Pro Asp Asn
260 265 270
Tyr Ser Phe Val Asp Glu His Tyr Asp Glu Leu Lys Asp Leu Ser Leu
275 280 285
Ser Ser Tyr Lys Asn Asn Asn Leu Glu Glu Ile Tyr Ser Ser Phe Phe
290 295 300
Ser Gly Cys Asn Ser Val Leu Ile Asn Ile Lys Asp Asp Gly Glu Tyr
305 310 315 320
Pro Tyr Asn Lys Met Ser Asn Ala Glu Lys Met Tyr Tyr His Asn Ser
325 330 335
Phe Trp Phe Cys Ser Leu Lys Asn His Asn Trp Asp Lys Tyr Arg Cys
340 345 350
Ile Ile Lys Ile Arg Pro Asp Ala Leu Leu Gln Val Asp Asn Val Thr
355 360 365
Ile Asn Asp Ile Asp Val Asp Asp Ser Val Tyr Cys Glu Asp Ser Asn
370 375 380
Gly Trp Ile Phe Arg Glu Trp Gly Phe Gly Ile Gly Asp Gln Leu Phe
385 390 395 400
Tyr Gly Asp Pro Asp Ile Met Lys Lys Leu Met Cys Val His Gly Leu
405 410 415
Asp Asn Ile Tyr Ser Gln Leu Thr Ser Leu Ile Ser Ser Ser Asn Val
420 425 430
Tyr Tyr Ser Gly His Ile Asn Val Gly Leu Cys Ala Trp Ala Asn Val
435 440 445
Tyr Asp Cys Lys Val Ser Asn Leu Lys Ile Lys Asn Ile Val Ala Pro
450 455 460
Arg Lys Ile Ser Leu Glu Gln Ile Leu Ser Leu Arg Glu
465 470 475
<210> 25
<211> 1566
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Sequence
<400> 25
atgcttctaa taatgtctgg tagctacgtg cagcaggaat tgggcgcgga gttcggtagc 60
atcccgccgt cgttcctgcc gttggcaaac aagcgtctgt tcaagcacca ggtcagcttg 120
gggcacgatg gccatgcgat ctacctggtc ctgccggaag atttcgtgtt cgacaaacac 180
gattacgaat ggttgctgcg caataaagtg acgatgattc cggtcgatag caatctgacc 240
ctgggccagg caatcgtcac ggcctggaat ctgatcggcg acaaagatga taaaggcctg 300
caactgctgt ttggtgatac cttgttcaag aagattccgg cgggtgatga cctcgtggcg 360
atctcccatt ccgatgataa ctaccagtgg tcctttttct atgagacgga attgcgggca 420
gtctcccgcg aggacaacaa aaatgtcatc tgcgggtact tctcgttcag caaacccaat 480
ttcttcattc gcgaactggt caccagcaag tttgacttca cggcagccct gaaaaagtac 540
catgattcgt acagcttggc gtcgatttac gtcagcgact ggctcgattt cggtcacatc 600
aatacctact ataagtcgaa agtccagtac acgacccagc gtgccttcaa tgagctgtgc 660
atcacgacca agtccgtgat taagtcctcc tcgaatgaaa gcaagatcga ggcagaatcg 720
aaatggttcg agacgattcc gggtgaactg aaaatctaca ccccgatgtt gctggaaccg 780
ttcgatcaca ttcgcaaaag ctacaaactc gaatacctgt acaataccac cctgaacgaa 840
ctgttcgtgt tctcccgcct gccgaataat atcctgacca acattctgat cagctgcctg 900
gattttatcg acctctgcaa agagtatcat agcattgata cggataaaaa cattctccag 960
gatctgtttt acgaaaagac catcgagcgc gtcagcaagt atatcaccga tctcaacatt 1020
gacccgaacg cgaaatggaa ttttaacaac aatattagcg tgagcatcaa cgacatcctg 1080
tacgacacga acaaattcat tccgtccgaa ctgcaataca agaccatcat gcacggggac 1140
ctgtgcttca gcaatattat ctttaacttc cgcacgggcc ggattcaggt gttcgatccg 1200
cgcggtctga accacagcgg cgaaatctcg atctatggcg atttccgcta cgatattgcg 1260
aaactgtcgc actccattct aggcctgtat gactggatca tcgcgggcta ctacattatc 1320
aacaaaaaga ataagaccca ttccattgag ttcaaaatca atattgataa caaactcttt 1380
gaaatccaat cgaccttcgt gtccattatt aaggaaaaat acagcatctc cgaaaagtcg 1440
ctgtacgcca tgcaaattca tctgttcttg tcgatgctgc cgttgcatag cgacgacaag 1500
aagcggcagg acgccctgtt tgcgaatgcc ttccgcctgt atgaaatctt taaggaggca 1560
gcagta 1566
<210> 26
<211> 522
<212> PRT
<213> Escherichia coli
<400> 26
Met Leu Leu Ile Met Ser Gly Ser Tyr Val Gln Gln Glu Leu Gly Ala
1 5 10 15
Glu Phe Gly Ser Ile Pro Pro Ser Phe Leu Pro Leu Ala Asn Lys Arg
20 25 30
Leu Phe Lys His Gln Val Ser Leu Gly His Asp Gly His Ala Ile Tyr
35 40 45
Leu Val Leu Pro Glu Asp Phe Val Phe Asp Lys His Asp Tyr Glu Trp
50 55 60
Leu Leu Arg Asn Lys Val Thr Met Ile Pro Val Asp Ser Asn Leu Thr
65 70 75 80
Leu Gly Gln Ala Ile Val Thr Ala Trp Asn Leu Ile Gly Asp Lys Asp
85 90 95
Asp Lys Gly Leu Gln Leu Leu Phe Gly Asp Thr Leu Phe Lys Lys Ile
100 105 110
Pro Ala Gly Asp Asp Leu Val Ala Ile Ser His Ser Asp Asp Asn Tyr
115 120 125
Gln Trp Ser Phe Phe Tyr Glu Thr Glu Leu Arg Ala Val Ser Arg Glu
130 135 140
Asp Asn Lys Asn Val Ile Cys Gly Tyr Phe Ser Phe Ser Lys Pro Asn
145 150 155 160
Phe Phe Ile Arg Glu Leu Val Thr Ser Lys Phe Asp Phe Thr Ala Ala
165 170 175
Leu Lys Lys Tyr His Asp Ser Tyr Ser Leu Ala Ser Ile Tyr Val Ser
180 185 190
Asp Trp Leu Asp Phe Gly His Ile Asn Thr Tyr Tyr Lys Ser Lys Val
195 200 205
Gln Tyr Thr Thr Gln Arg Ala Phe Asn Glu Leu Cys Ile Thr Thr Lys
210 215 220
Ser Val Ile Lys Ser Ser Ser Asn Glu Ser Lys Ile Glu Ala Glu Ser
225 230 235 240
Lys Trp Phe Glu Thr Ile Pro Gly Glu Leu Lys Ile Tyr Thr Pro Met
245 250 255
Leu Leu Glu Pro Phe Asp His Ile Arg Lys Ser Tyr Lys Leu Glu Tyr
260 265 270
Leu Tyr Asn Thr Thr Leu Asn Glu Leu Phe Val Phe Ser Arg Leu Pro
275 280 285
Asn Asn Ile Leu Thr Asn Ile Leu Ile Ser Cys Leu Asp Phe Ile Asp
290 295 300
Leu Cys Lys Glu Tyr His Ser Ile Asp Thr Asp Lys Asn Ile Leu Gln
305 310 315 320
Asp Leu Phe Tyr Glu Lys Thr Ile Glu Arg Val Ser Lys Tyr Ile Thr
325 330 335
Asp Leu Asn Ile Asp Pro Asn Ala Lys Trp Asn Phe Asn Asn Asn Ile
340 345 350
Ser Val Ser Ile Asn Asp Ile Leu Tyr Asp Thr Asn Lys Phe Ile Pro
355 360 365
Ser Glu Leu Gln Tyr Lys Thr Ile Met His Gly Asp Leu Cys Phe Ser
370 375 380
Asn Ile Ile Phe Asn Phe Arg Thr Gly Arg Ile Gln Val Phe Asp Pro
385 390 395 400
Arg Gly Leu Asn His Ser Gly Glu Ile Ser Ile Tyr Gly Asp Phe Arg
405 410 415
Tyr Asp Ile Ala Lys Leu Ser His Ser Ile Leu Gly Leu Tyr Asp Trp
420 425 430
Ile Ile Ala Gly Tyr Tyr Ile Ile Asn Lys Lys Asn Lys Thr His Ser
435 440 445
Ile Glu Phe Lys Ile Asn Ile Asp Asn Lys Leu Phe Glu Ile Gln Ser
450 455 460
Thr Phe Val Ser Ile Ile Lys Glu Lys Tyr Ser Ile Ser Glu Lys Ser
465 470 475 480
Leu Tyr Ala Met Gln Ile His Leu Phe Leu Ser Met Leu Pro Leu His
485 490 495
Ser Asp Asp Lys Lys Arg Gln Asp Ala Leu Phe Ala Asn Ala Phe Arg
500 505 510
Leu Tyr Glu Ile Phe Lys Glu Ala Ala Val
515 520
<210> 27
<211> 1167
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Sequence
<400> 27
atgaaaattg ccgtggccgg cgtcggctat gtgggtatca gcattgcgat cctcctctcc 60
caaaaacacg acatcatcgc cctggacatc gacccgaaga aggtccagct cattaacaag 120
aaaatctcgc cgatttgcga cccggaaatc cagaagtttc tctccaatcg taagctgaac 180
ctctacgcga cgacggaaaa atacgaggca tatcgcgatg cagactacgt gatcatcgcc 240
accccgacga actatgatcc gattaataac aactttgata ccctgagcgt cgaaagcgtc 300
gcgtgtgacg tgctgtccat taacccgaac gcgaccatca ttatcaaatc caccgtcccc 360
gtcgggttca ccgaacgcct gaagcgcgat ctgaacacga ataatatcat cttttccccg 420
gagttcctgc gcgaaggcaa agccctgtat gataatctct atccgagccg cattgtcgtg 480
ggcgaatcgt cggaacgcgc acggaagttc gccgaactcc tgtcggaagg tgccatcaaa 540
aaggatattc cgatcctgct gacggattcg cccgaggcag aagccatcaa actgttcgcg 600
aacacgtatc tggcgatgcg tatcgcgtac tttaacgagc tggacaccta cgcgagcgtg 660
cacggcctgg ataccaaaca aatcatcgaa ggcgtctccc tcgatccgcg cattggtcaa 720
cattacaaca acccgtcctt cggctacggc ggttactgtc tgccgaagga tacgaagcag 780
ctgttggcca attatcgcga cgtcccgcaa aacctgatcc aggccatcgt ggatgcgaat 840
acgacccgta aggacttcgt ggccgaggac atcctgtccc gtaagcccaa agtggtcggt 900
atctatcgcc tgatcatgaa ggcgggtagc gacaatttcc gggccagcag catccagggg 960
gtcatgaaac gtttgaaggc caagggtatc gagattgtgg tgtacgagcc ggtcctgaaa 1020
gaaccctact tcttcggttc ctacgtcgag cgcgacatca attcctttaa ggagcgcgtc 1080
gatgtcattg tggcgaatcg ccgcaccagc gaactggaag atgtctcgga gaaagtctac 1140
acccgcgacc tgttcggcgt cgattcg 1167
<210> 28
<211> 389
<212> PRT
<213> Escherichia coli
<400> 28
Met Lys Ile Ala Val Ala Gly Val Gly Tyr Val Gly Ile Ser Ile Ala
1 5 10 15
Ile Leu Leu Ser Gln Lys His Asp Ile Ile Ala Leu Asp Ile Asp Pro
20 25 30
Lys Lys Val Gln Leu Ile Asn Lys Lys Ile Ser Pro Ile Cys Asp Pro
35 40 45
Glu Ile Gln Lys Phe Leu Ser Asn Arg Lys Leu Asn Leu Tyr Ala Thr
50 55 60
Thr Glu Lys Tyr Glu Ala Tyr Arg Asp Ala Asp Tyr Val Ile Ile Ala
65 70 75 80
Thr Pro Thr Asn Tyr Asp Pro Ile Asn Asn Asn Phe Asp Thr Leu Ser
85 90 95
Val Glu Ser Val Ala Cys Asp Val Leu Ser Ile Asn Pro Asn Ala Thr
100 105 110
Ile Ile Ile Lys Ser Thr Val Pro Val Gly Phe Thr Glu Arg Leu Lys
115 120 125
Arg Asp Leu Asn Thr Asn Asn Ile Ile Phe Ser Pro Glu Phe Leu Arg
130 135 140
Glu Gly Lys Ala Leu Tyr Asp Asn Leu Tyr Pro Ser Arg Ile Val Val
145 150 155 160
Gly Glu Ser Ser Glu Arg Ala Arg Lys Phe Ala Glu Leu Leu Ser Glu
165 170 175
Gly Ala Ile Lys Lys Asp Ile Pro Ile Leu Leu Thr Asp Ser Pro Glu
180 185 190
Ala Glu Ala Ile Lys Leu Phe Ala Asn Thr Tyr Leu Ala Met Arg Ile
195 200 205
Ala Tyr Phe Asn Glu Leu Asp Thr Tyr Ala Ser Val His Gly Leu Asp
210 215 220
Thr Lys Gln Ile Ile Glu Gly Val Ser Leu Asp Pro Arg Ile Gly Gln
225 230 235 240
His Tyr Asn Asn Pro Ser Phe Gly Tyr Gly Gly Tyr Cys Leu Pro Lys
245 250 255
Asp Thr Lys Gln Leu Leu Ala Asn Tyr Arg Asp Val Pro Gln Asn Leu
260 265 270
Ile Gln Ala Ile Val Asp Ala Asn Thr Thr Arg Lys Asp Phe Val Ala
275 280 285
Glu Asp Ile Leu Ser Arg Lys Pro Lys Val Val Gly Ile Tyr Arg Leu
290 295 300
Ile Met Lys Ala Gly Ser Asp Asn Phe Arg Ala Ser Ser Ile Gln Gly
305 310 315 320
Val Met Lys Arg Leu Lys Ala Lys Gly Ile Glu Ile Val Val Tyr Glu
325 330 335
Pro Val Leu Lys Glu Pro Tyr Phe Phe Gly Ser Tyr Val Glu Arg Asp
340 345 350
Ile Asn Ser Phe Lys Glu Arg Val Asp Val Ile Val Ala Asn Arg Arg
355 360 365
Thr Ser Glu Leu Glu Asp Val Ser Glu Lys Val Tyr Thr Arg Asp Leu
370 375 380
Phe Gly Val Asp Ser
385
<210> 29
<211> 1464
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Sequence
<400> 29
atgttcaata atctcaaatt cttgtggctg ctcaaaaaga gccgctacgt ccacgcgctc 60
gcggccatcc aggatgattg ccggttctgg cagtcgaaac gcatcctcgc gatgtatcgt 120
ctgaatatgt actggtcgct gcataacttg acggataccc cgtccgattg gcgctgcaaa 180
ctggcaatca agatcgcaaa aatcgcctgc ggcgacatca gcctgacgcc cgagctgctg 240
atggagttca aggacgagtt caccgatacc catcagaaag tggaactggc gaaaaccctg 300
gcgtcctact cgccgacctt tagcctgagc ctgttggaca acgtggacaa ctgcccgctg 360
gacctgtata ccgcactgca actccggatc ggcctgaccc aaaaggccat ctcgaccctc 420
gcccagatcg acgcatccga tatcgtctat agcccggata tcctgctgct gcaaaataac 480
gccttccgcg aaaccgccga aattagcctg aatcggctga atgaatacta taaatacttc 540
ggcctcagcc ccgtggcctt gacggacaac agctccccgc tctccccgtg caacatcatc 600
accagcatcc cgtacccggc ccagacgggg ccgttgatct ccatcctgat gaccacctat 660
aatacgggtc gccgcgtgga aaatgcggtg atttcgctcc tcaatcagac ctaccgttcc 720
ttcgagctga tcattgtgga tgacgcgagc accgatgaca ccctgtttcg tctccagcgg 780
ctcgccctca aagacacgcg catcaagatc attagcctgc cgcagaatgt cggcacctat 840
gccgcgaagc gtatcggctt gatccaagcg aagggcgagt tcgtcacctg ccacgattcg 900
gatgactgga gccatccgga aaagctgttc cgccaaatct cccccttgtt gctcaatccg 960
aagctcatct gctccatctc ggactgggtg cgcctgcaag acaacggtat tttctatgcc 1020
cgcgcagtgt accccttgaa gcgtctgaat ccgtcgtcgc tcctgtttcg ccgtgccgac 1080
gtcttgcaga aggccggtgt ctgggattgt gtgaaaacgg gtgcggatag cgaatttatc 1140
gcgcgtctga agctgatctt cggcgattcc acggtgcatc ggatcaagtt gccgctgacg 1200
ctgggctcgc accgcaccga ctcgttgatg aacagcccga cgaccggcta caccagccaa 1260
ggtatctcgc cggatcgcca gaagtattgg gattcgtggt cccgctggca catccaggcg 1320
ctgcgtaaca aggaatcgct gtacattggt aacagcgatt tcaccaacaa gaaccgtccg 1380
ttttccgcac ccgactcgat cctcgtggac accaacgcca ttaagacggc cctgcaaagc 1440
gcccacgtca atttcacgag catc 1464
<210> 30
<211> 488
<212> PRT
<213> Escherichia coli
<400> 30
Met Phe Asn Asn Leu Lys Phe Leu Trp Leu Leu Lys Lys Ser Arg Tyr
1 5 10 15
Val His Ala Leu Ala Ala Ile Gln Asp Asp Cys Arg Phe Trp Gln Ser
20 25 30
Lys Arg Ile Leu Ala Met Tyr Arg Leu Asn Met Tyr Trp Ser Leu His
35 40 45
Asn Leu Thr Asp Thr Pro Ser Asp Trp Arg Cys Lys Leu Ala Ile Lys
50 55 60
Ile Ala Lys Ile Ala Cys Gly Asp Ile Ser Leu Thr Pro Glu Leu Leu
65 70 75 80
Met Glu Phe Lys Asp Glu Phe Thr Asp Thr His Gln Lys Val Glu Leu
85 90 95
Ala Lys Thr Leu Ala Ser Tyr Ser Pro Thr Phe Ser Leu Ser Leu Leu
100 105 110
Asp Asn Val Asp Asn Cys Pro Leu Asp Leu Tyr Thr Ala Leu Gln Leu
115 120 125
Arg Ile Gly Leu Thr Gln Lys Ala Ile Ser Thr Leu Ala Gln Ile Asp
130 135 140
Ala Ser Asp Ile Val Tyr Ser Pro Asp Ile Leu Leu Leu Gln Asn Asn
145 150 155 160
Ala Phe Arg Glu Thr Ala Glu Ile Ser Leu Asn Arg Leu Asn Glu Tyr
165 170 175
Tyr Lys Tyr Phe Gly Leu Ser Pro Val Ala Leu Thr Asp Asn Ser Ser
180 185 190
Pro Leu Ser Pro Cys Asn Ile Ile Thr Ser Ile Pro Tyr Pro Ala Gln
195 200 205
Thr Gly Pro Leu Ile Ser Ile Leu Met Thr Thr Tyr Asn Thr Gly Arg
210 215 220
Arg Val Glu Asn Ala Val Ile Ser Leu Leu Asn Gln Thr Tyr Arg Ser
225 230 235 240
Phe Glu Leu Ile Ile Val Asp Asp Ala Ser Thr Asp Asp Thr Leu Phe
245 250 255
Arg Leu Gln Arg Leu Ala Leu Lys Asp Thr Arg Ile Lys Ile Ile Ser
260 265 270
Leu Pro Gln Asn Val Gly Thr Tyr Ala Ala Lys Arg Ile Gly Leu Ile
275 280 285
Gln Ala Lys Gly Glu Phe Val Thr Cys His Asp Ser Asp Asp Trp Ser
290 295 300
His Pro Glu Lys Leu Phe Arg Gln Ile Ser Pro Leu Leu Leu Asn Pro
305 310 315 320
Lys Leu Ile Cys Ser Ile Ser Asp Trp Val Arg Leu Gln Asp Asn Gly
325 330 335
Ile Phe Tyr Ala Arg Ala Val Tyr Pro Leu Lys Arg Leu Asn Pro Ser
340 345 350
Ser Leu Leu Phe Arg Arg Ala Asp Val Leu Gln Lys Ala Gly Val Trp
355 360 365
Asp Cys Val Lys Thr Gly Ala Asp Ser Glu Phe Ile Ala Arg Leu Lys
370 375 380
Leu Ile Phe Gly Asp Ser Thr Val His Arg Ile Lys Leu Pro Leu Thr
385 390 395 400
Leu Gly Ser His Arg Thr Asp Ser Leu Met Asn Ser Pro Thr Thr Gly
405 410 415
Tyr Thr Ser Gln Gly Ile Ser Pro Asp Arg Gln Lys Tyr Trp Asp Ser
420 425 430
Trp Ser Arg Trp His Ile Gln Ala Leu Arg Asn Lys Glu Ser Leu Tyr
435 440 445
Ile Gly Asn Ser Asp Phe Thr Asn Lys Asn Arg Pro Phe Ser Ala Pro
450 455 460
Asp Ser Ile Leu Val Asp Thr Asn Ala Ile Lys Thr Ala Leu Gln Ser
465 470 475 480
Ala His Val Asn Phe Thr Ser Ile
485
<210> 31
<211> 723
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Sequence
<400> 31
atgattatta tcccgatggc aggtatgtcg agccgctttt tcaaagccgg ttatagcaaa 60
ccgaagtata tgctggagct gaatggcgag tttctgttcg atttgtgcct caagagcttc 120
aaactgtact tcgagacgga acactttgtc ttcatcctcc gtgacgtgtt taacacgaaa 180
tcgttcgtgc tccagcgtat cgccagcctg ggcattaata gctatacgct gatcaccctg 240
gataaggaaa cgcggggtca agcagagacg gtctatttgg ccatctcgaa actgtttaat 300
atcgaacagc cgatcaccat cttcaacatc gacacgattc gtcccaactt catcttcacc 360
aagttcgagg gcgagaatga atgttacatt gaagtgtttc gcggcgatgg cgacaactgg 420
tcgttcgtga tgcccagcaa tgacgtcaaa aatgaagtga ttgccacgtc cgaaaagaaa 480
cagattagca atttgtgttg caccgggctg taccacttca gcacgatcaa aaactttatt 540
tccgcgtatg aacattacaa gaacctgccg caagaaaact gggatgcggg cgagctgtat 600
attgcgccga tctacaatta cctgatctcc aatgggatca aagtgtatta taccgaaatc 660
aataagtccg acgtgatctt ctgcggcacc ccgcgtgagt atgagaatct ccaggggaaa 720
aag 723
<210> 32
<211> 241
<212> PRT
<213> Escherichia coli
<400> 32
Met Ile Ile Ile Pro Met Ala Gly Met Ser Ser Arg Phe Phe Lys Ala
1 5 10 15
Gly Tyr Ser Lys Pro Lys Tyr Met Leu Glu Leu Asn Gly Glu Phe Leu
20 25 30
Phe Asp Leu Cys Leu Lys Ser Phe Lys Leu Tyr Phe Glu Thr Glu His
35 40 45
Phe Val Phe Ile Leu Arg Asp Val Phe Asn Thr Lys Ser Phe Val Leu
50 55 60
Gln Arg Ile Ala Ser Leu Gly Ile Asn Ser Tyr Thr Leu Ile Thr Leu
65 70 75 80
Asp Lys Glu Thr Arg Gly Gln Ala Glu Thr Val Tyr Leu Ala Ile Ser
85 90 95
Lys Leu Phe Asn Ile Glu Gln Pro Ile Thr Ile Phe Asn Ile Asp Thr
100 105 110
Ile Arg Pro Asn Phe Ile Phe Thr Lys Phe Glu Gly Glu Asn Glu Cys
115 120 125
Tyr Ile Glu Val Phe Arg Gly Asp Gly Asp Asn Trp Ser Phe Val Met
130 135 140
Pro Ser Asn Asp Val Lys Asn Glu Val Ile Ala Thr Ser Glu Lys Lys
145 150 155 160
Gln Ile Ser Asn Leu Cys Cys Thr Gly Leu Tyr His Phe Ser Thr Ile
165 170 175
Lys Asn Phe Ile Ser Ala Tyr Glu His Tyr Lys Asn Leu Pro Gln Glu
180 185 190
Asn Trp Asp Ala Gly Glu Leu Tyr Ile Ala Pro Ile Tyr Asn Tyr Leu
195 200 205
Ile Ser Asn Gly Ile Lys Val Tyr Tyr Thr Glu Ile Asn Lys Ser Asp
210 215 220
Val Ile Phe Cys Gly Thr Pro Arg Glu Tyr Glu Asn Leu Gln Gly Lys
225 230 235 240
Lys
<210> 33
<211> 378
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Sequence
<400> 33
atgaagaaaa ttatcgtcga tctggataat acgattagct tcaatctgag cggcaaatac 60
agccatgcaa cccccaataa gaaattgatc gaaaaactct atgagtacaa gctgaacggt 120
ttctacatcg tcatctttac cgcgcgcaat atgcggacgt acaaggaaaa cattggcaag 180
atcaatattc atacgctgcc ggtgatcatc gactggctga acgaaaaccg cgtcccgtat 240
gacgaggtga ttgtcggcaa gccgtggtgc ggcgacgagg gcttctatgt ggacgatcgg 300
gccatccggc cctcggaact gtgcaatatg accttggaag aaatctctaa tatgttagaa 360
caggagaaaa aatgcttc 378
<210> 34
<211> 126
<212> PRT
<213> Escherichia coli
<400> 34
Met Lys Lys Ile Ile Val Asp Leu Asp Asn Thr Ile Ser Phe Asn Leu
1 5 10 15
Ser Gly Lys Tyr Ser His Ala Thr Pro Asn Lys Lys Leu Ile Glu Lys
20 25 30
Leu Tyr Glu Tyr Lys Leu Asn Gly Phe Tyr Ile Val Ile Phe Thr Ala
35 40 45
Arg Asn Met Arg Thr Tyr Lys Glu Asn Ile Gly Lys Ile Asn Ile His
50 55 60
Thr Leu Pro Val Ile Ile Asp Trp Leu Asn Glu Asn Arg Val Pro Tyr
65 70 75 80
Asp Glu Val Ile Val Gly Lys Pro Trp Cys Gly Asp Glu Gly Phe Tyr
85 90 95
Val Asp Asp Arg Ala Ile Arg Pro Ser Glu Leu Cys Asn Met Thr Leu
100 105 110
Glu Glu Ile Ser Asn Met Leu Glu Gln Glu Lys Lys Cys Phe
115 120 125
<210> 35
<211> 24433
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Sequence
<400> 35
ctcgggccgt ctcttgggct tgatcggcct tcttgcgcat ctcacgcgct cctgcggcgg 60
cctgtagggc aggctcatac ccctgccgaa ccgcttttgt cagccggtcg gccacggctt 120
ccggcgtctc aacgcgcttt gagattccca gcttttcggc caatccctgc ggtgcatagg 180
cgcgtggctc gaccgcttgc gggctgatgg tgacgtggcc cactggtggc cgctccaggg 240
cctcgtagaa cgcctgaatg cgcgtgtgac gtgccttgct gccctcgatg ccccgttgca 300
gccctagatc ggccacagcg gccgcaaacg tggtctggtc gcgggtcatc tgcgctttgt 360
tgccgatgaa ctccttggcc gacagcctgc cgtcctgcgt cagcggcacc acgaacgcgg 420
tcatgtgcgg gctggtttcg tcacggtgga tgctggccgt cacgatgcga tccgccccgt 480
acttgtccgc cagccacttg tgcgccttct cgaagaacgc cgcctgctgt tcttggctgg 540
ccgacttcca ccattccggg ctggccgtca tgacgtactc gaccgccaac acagcgtcct 600
tgcgccgctt ctctggcagc aactcgcgca gtcggcccat cgcttcatcg gtgctgctgg 660
ccgcccagtg ctcgttctct ggcgtcctgc tggcgtcagc gttgggcgtc tcgcgctcgc 720
ggtaggcgtg cttgagactg gccgccacgt tgcccatttt cgccagcttc ttgcatcgca 780
tgatcgcgta tgccgccatg cctgcccctc ccttttggtg tccaaccggc tcgacggggg 840
cagcgcaagg cggtgcctcc ggcgggccac tcaatgcttg agtatactca ctagactttg 900
cttcgcaaag tcgtgaccgc ctacggcggc tgcggcgccc tacgggcttg ctctccgggc 960
ttcgccctgc gcggtcgctg cgctcccttg ccagcccgtg gatatgtgga cgatggccgc 1020
gagcggccac cggctggctc gcttcgctcg gcccgtggac aaccctgctg gacaagctga 1080
tggacaggct gcgcctgccc acgagcttga ccacagggat tgcccaccgg ctacccagcc 1140
ttcgaccaca tacccaccgg ctccaactgc gcggcctgcg gccttgcccc atcaattttt 1200
ttaattttct ctggggaaaa gcctccggcc tgcggcctgc gcgcttcgct tgccggttgg 1260
acaccaagtg gaaggcgggt caaggctcgc gcagcgaccg cgcagcggct tggccttgac 1320
gcgcctggaa cgacccaagc ctatgcgagt gggggcagtc gaaggcgaag cccgcccgcc 1380
tgccccccga gacctgcaga tccacatcct tgaaggccgc agcgacgagc agaaggaaac 1440
cctcattcgg gaagtcagcg aggccatctc gcgctccctg gatgcgccgc tgaccagcgt 1500
gcgagtgatt atcacggaga tggccaaggg ccacttcggc atcggcggcg aactggccag 1560
caaggtcaga cgctgaagtg gagatgccca agggcacttc gggtcgagga acccgacctg 1620
cattgggacg cggccacgga gagcgcgggc aaacgccggc actatagcca gtggagtttg 1680
taaaacgcta tttcagagct tggagagtgt ctaagaaagc cggggcgatg ccaacccatc 1740
ccttcttcgg ctatgcatcg ttcgtaatca agccacttcc tttttgcatt gacgcagggt 1800
gtcggaaggc aactcgccga acgcgctcct atagttttca gcgaagcgtc ccaaatgtaa 1860
gaagccgtag tctagggcta tctcagttat actacgcaca ttggcactgg gatcgttcaa 1920
gcaggcgcgg atgctttcga gcttgcggtt gcggatgtag ttcttcggcg tggtgccggc 1980
atgcttctcg aacaaattgt agagcgagcg tggactcatc atcgccagct ccgctaaccg 2040
ctcaaggctg atattccgtt tgagattctc ctcaatgaat tgaacgactc gctcgaaaga 2100
cgggttacct ttgctgaaaa tttcacggct gacattgctg cccagcattt cgagcagctt 2160
ggaagcgatg atccccgcat agtgctcttg gacccgaggc atcgactttg tatgttccgc 2220
ttcgtcacaa actaacccga gtagattgat aaagccatcg agttgctgga gattgtgtcg 2280
cgcggcgaaa cggataccct ccctcggctt gtgccaattg ttgtcactgc atgcccgatc 2340
aaggaccact gagggcaatt taacgataaa tttctcgcaa tcttctgaat aggtcaggtc 2400
ggcttggtca tccggattga gcagcaatag ttcgcccggc gcaaaatagt gctcctggcc 2460
atggccacgc cacaggcaat ggcctttgag tattatttgc agatgataac aggtctctaa 2520
tccaggcgag attaccctca cgctaccgcc gtagctgatt cgacacaggt cgaggcatcc 2580
gaagattctg tggtgcagcc tgcctgccgg gcgcccgccc ttgggcaggc gaatagagtg 2640
cgtaccgaca tactggttaa cataatcgga gactgcatag ggctcggcgt ggacgaagat 2700
ctgacttttc tcgttcaata agcaaaaatc catagttcac ggttctctta ttttaatgtg 2760
ggctgcttgg tgtgatgtag aaaggcgcca agtcgatgaa aatgcatctc gacgtgatgc 2820
gtatacgggt tacccccatt gccacgttgc gccatccttt ttgcaatcag tgaccacttt 2880
tccaagcaaa aataacgcca agcagaacga agacgttctt tttaagaagc gagaacacca 2940
gaagttcgtg ctgtcggggc atgcggcgac gaattggcgg ataaagggga tctgcaggtc 3000
ccgagcctca cggcggcgag tgcgggggtt ccaagggggc agcgccacct tgggcaaggc 3060
cgaaggccgc gcagtcgatc aacaagcccc ggaggggcca ctttttgccg gagggggagc 3120
cgcgccgaag gcgtggggga accccgcagg ggtgcccttc tttgggcacc aaagaactag 3180
atatagggcg aaatgcgaaa gacttaaaaa tcaacaactt aaaaaagggg ggtacgcaac 3240
agctcattgc ggcacccccc gcaatagctc attgcgtagg ttaaagaaaa tctgtaattg 3300
actgccactt ttacgcaacg cataattgtt gtcgcgctgc cgaaaagttg cagctgattg 3360
cgcatggtgc cgcaaccgtg cggcacccta ccgcatggag ataagcatgg ccacgcagtc 3420
cagagaaatc ggcattcaag ccaagaacaa gcccggtcac tgggtgcaaa cggaacgcaa 3480
agcgcatgag gcgtgggccg ggcttattgc gaggaaaccc acggcggcaa tgctgctgca 3540
tcacctcgtg gcgcagatgg gccaccagaa cgccgtggtg gtcagccaga agacactttc 3600
caagctcatc ggacgttctt tgcggacggt ccaatacgca gtcaaggact tggtggccga 3660
gcgctggatc tccgtcgtga agctcaacgg ccccggcacc gtgtcggcct acgtggtcaa 3720
tgaccgcgtg gcgtggggcc agccccgcga ccagttgcgc ctgtcggtgt tcagtgccgc 3780
cgtggtggtt gatcacgacg accaggacga atcgctgttg gggcatggcg acctgcgccg 3840
catcccgacc ctgtatccgg gcgagcagca actaccgacc ggccccggcg aggagccgcc 3900
cagccagccc ggcattccgg gcatggaacc agacctgcca gccttgaccg aaacggagga 3960
atgggaacgg cgcgggcagc agcgcctgcc gatgcccgat gagccgtgtt ttctggacga 4020
tggcgagccg ttggagccgc cgacacgggt cacgctgccg cgccggtagc acttgggttg 4080
cgcagcaacc cgtaagtgcg ctgttccaga ctatcggctg tagccgcctc gccgccctat 4140
accttgtctg cctccccgcg ttgcgtcgcg gtgcatggag ccgggccacc tcgacctgaa 4200
tggaagccgg cggcacctcg ctaacggatt caccgttttt atcaggctct gggaggcaga 4260
ataaatgatc atatcgtcaa ttattacctc cacggggaga gcctgagcaa actggcctca 4320
ggcatttgag aagcacacgg tcacactgct tccggtagtc aataaaccgg taaaccagca 4380
atagacataa gcggctattt aacgaccctg ccctgaaccg acgaccgggt cgaatttgct 4440
ttcgactatc ggcgcgccag agctcatcgt taatgtcttc gtgcgccgtc agtcggcgca 4500
cgttttttct ctctggtacc gtgtcactga tctagtcaat tactcgaagt atccacaagt 4560
gaagcatact aagtaatgta caagaatcaa aaaaatcggc tacgcaagtc gcgtagccga 4620
atcatttaag gatccttcca ttcaggtcga ggtggcccgg ctccatgcac cgcgacgcaa 4680
cgcggggagg cagacaaggt atagggcggc gcctacaatc catgccaacc cgttccatgt 4740
gctcgccgag gcggcataaa tcgccgtgac gatcagcggt ccagtgatcg aagttaggct 4800
ggtaagagcc gcgagcgatc cttgaagctg tccctgatgg tcgtcatcta cctgcctgga 4860
cagcatggcc tgcaacgcgg gcatcccgat gccgccggaa gcgagaagaa tcataatggg 4920
gaaggccatc cagcctcgcg tcgcgaacgc cagcaagacg tagcccagcg cgtcggccgc 4980
catgccggcg ataatggcct gcttctcgcc gaaacgtttg gtggcgggac cagtgacgaa 5040
ggcttgagcg agggcgtgca agattccgaa taccgcaagc gacaggccga tcatcgtcgc 5100
gctccagcga aagcggtcct cgccgaaaat gacccagagc gctgccggca cctgtcctac 5160
gagttgcatg ataaagaaga cagtcataag tgcggcgacg atagtcatgc cccgcgccca 5220
ccggaaggag ctgactgggt tgaaggctct caagggcatc ggtcgacgct ctcccttatg 5280
cgactcctgc attaggaagc agcccagtag taggttgagg ccgttgagca ccgccgccgc 5340
aaggaatggt gcatgcaagg agatggcgcc caacagtccc ccggccacgg ggcctgccac 5400
catacccacg ccgaaacaag cgctcatgag cccgaagtgg cgagcccgat cttccccatc 5460
ggtgatgtcg gcgatatagg cgccagcaac cgcacctgtg gcgccggtga tgccggccac 5520
gatgcgtccg gcgtacaaga tccacaggac gggtgtggtc gccatgatcg cgtagtcgat 5580
agtggctcca agtagcgaag cgagcaggac tgggcggcgg ccaaagcggt cggacagtgc 5640
tccgagaacg ggtgcgcata gaaattgcat caacgcatat agcgctagca gcacgccata 5700
gtgactggcg atgctgtcgg aatggacgat atcccgcaag aggcccggca gtaccggcat 5760
aaccaagcct atgcctacag catccagggt gacggtgccg aggatgacga tgagcgcatt 5820
gttagatttc atacacggtg cctgactgcg ttagcaattt aactgtgata aactaccgca 5880
ttaaagccga gcgatgataa gctgtcaaac atgagatcca atctagattg tttaaacttc 5940
tgcagaacac gcggtgttaa cgtttcttat acttcttaat tttgttaaag atcatttcgc 6000
cgtagtacac cgcattgacc tgggtcttca ccagcaagta gccgcgaaat ttcttaaaca 6060
acttcatgtt cggtttaaag tcggcttgcc agaactgatg caaatgcccc tggtacgtca 6120
gacccttgat atcgtacaag gcgttgccca tgactttcag gggcttgttg tggatcaacg 6180
cggaaatgcc ggccgtgcta ttgatggtga ccaccgcttt ggcgtggcgc aacagctccg 6240
gcatgggcag atcgtgcaca tagatgacac gttcatccaa accgtattcc ttcgacagac 6300
gcttgatcaa cgggcggtac aggcggtgcc cgcgatccat cgggtgatgt ttgatcacca 6360
gataggactc cttgggggcc ttgcgggaaa agctgtacat cacttcgttg atgtaatcac 6420
gcacatcatt atagttgcta tggttgcgga tctggctgtc gttgtacact tgcaggaccg 6480
ccaggtaata gcgctgatcc agctcgttca tcaggcgggg gaggaccttg cgttgggtga 6540
ccttatacag ctgtttgcgc cagtaggcgc ggacccagca gcgcgcttca taccacgggc 6600
tgaacgattt gtggtggcga tagcgcggaa attcgtgacg atagtgccaa cccatcaggt 6660
aataccacat ggcgtggccg atgcgcttca tggtgctcgg tttcaggttc tcgacgtgcg 6720
gcgtcggcat atcgggcaat ttgcggtaaa agtccggatc gcggggcaag ctgctatagg 6780
cgttcacacc gccttcttcc acggtgataa attgcggacg caggtagcct tcctcgaagg 6840
ccagaaaacg aatccccttc gacttggccc agcgtttggc ctccttgtgc agcaggcggc 6900
agtcaccgaa acacaaaatc gtgtcaaagt catactgacg atgcaagtcc cgcagccaac 6960
cggggaactc cttcggggtt tggtagtacg ccaggtattg gcggtggcgg cagtagaagc 7020
gatcaccgcc attaaagacg acgttgaccg cgttgcgacc gaggctctcc aaccattccg 7080
ccacatcgtt gaagaacgga cccatcggac cttggagcag gaggtacttt ttaccgctca 7140
acagcaccgt cagcgcattg ccgtgcattt attaacctcc taacacgcgg tgttaagcgt 7200
tttcggcgag ctcttaacca aagcgcactt tgcagaacat gatcaacttg cgatagtagc 7260
gaatcacacg gccggctttc ttgcgggtga taaagatggg tttgcggggc gttttgatca 7320
gatattctgc cgcttcctcc accgtgatcg gctgcaaccg cgtcggatga atataggtgg 7380
gatagacaat cagggcttga tagatcaggt cggcgatggt cagccgccgc tcgcgacggg 7440
ggcagtggtg ctcatcgacg gtcaggcccc acgaggcgta gaacggcagg ccgtagcagt 7500
gcacctgttt accgtgcagc aatgcttcaa agccgctgag gctcgtcatc gtgtgcacct 7560
cgtccgcacg ctgaatacac tgaatgatat cggcatccag tgcctggtag tctgcgagtt 7620
ccgcgatctg ttccgccgga atgtcaccct tacggttgcc gacgagcaca tcggggtgcg 7680
gcttgtagat gatgtaggcg tgcggattac gttcccgcac ggtgcgcagc agctccagat 7740
tcgacttgat cgacacggtg cccgtcttaa tcgacgcatc gtcttccacc tggcccggca 7800
ccaggatgac tttcttgtcc ttcgcttctg ccgggaggct gaaatcggcc cccaggttat 7860
atttgctcaa tttgctttcc accagacgtt ggcgcaactt ttccgcgcgc atctggtgcg 7920
cgagggtcag ctggctgtga ttcagcagga cctccagttc cgacggacgg gtggcatcgt 7980
aatagatacc gcgcttatcc aggaccaggc tcaacggcgg cagcagatcg ctccccaggc 8040
cggagctgcg caggaagccg tcttccatgc gccacagcgg cagggatttg cgctgtgcct 8100
ccgcacgcca ttgctgttcg cctttcacgc cccacacgac gcaggcgctt gctgcggtac 8160
agcgacggga aaaggagaga cgattcgtgg ccgtttgcag gaagggcttc aggatcgcgc 8220
ttttccacag ggtcaggccc ggcacccaga gataaccatt ccgctgttgc aggtgacgac 8280
gttgcagctg gagccattgg agcaccgtga acagggccga cacctccccg gtctgcggat 8340
caatgtagcg gcaatagcgc agataggccg ctgcgaacag ttcctccagg gtggccgagc 8400
cgcgacgcgc cgacagcagc gccgattggg ggtggcggtc atcggtgagg ccccaccctg 8460
cataccaggg ttggccaaag caggtcacgg gcttaccggc cagcagggct tcaaaaccgt 8520
actgggaggt cacgacgtac acgcgggaca catgacgcag cagggactgc ggcgacacgt 8580
tttccgcaat caggcgcacg cgctgggtgg cacgcaagtc cgcgaagtag ccggtctttt 8640
tcccttccag gacatcggga tgcactttga cccagatttc tgcctgcggg ttttccgcca 8700
tcgctgcttc cagcattgcg gcgaactcat gggggcctgc gttgccgtag gtcacgctca 8760
tgtcattgaa ggtctggtcc accaccagca cgatgttcgt gcgctcgctt tcatccgcca 8820
cgaacgccgg tgccaggttg tacttgctca tgtcgcccgt cacaatggtg tgcatcgcct 8880
cgcgcgcctg atccgccagg gccgcgttgc cggccttgtc ctgcacgagt ttttccagcg 8940
cgctcggttt cgaggcgtcg tagtaaatgc cgcagtcatc cacgacgagc gagaggggcg 9000
gttcaccgtt cacgcccagg tccagcgagc ggacgaaacc atcctccaag cggatcaccg 9060
gcttgcctgc ggctttggcg atggccaccg gctttgcggc cgaggggcgg tgcccccaca 9120
ccgcgattgc atccacttcc tgcgggaccg ggcgcagcag cgacagcttt tggcagggct 9180
gggcgaggaa tttttccagg tgcggaatac gccaaatgcc ggggctataa atgccaatca 9240
tgcgttctcc gcgagctcct gcgccatcag ggcccggacc ttctccaagc acgccggggt 9300
atcgacgccg ggaccggtcg cggcgacctc gaaggtgcga atgttaatgc ccgcgctcat 9360
cagccgcagt tgctccaggg attcggcctg ttcgggcatg gactccggca actggctgta 9420
attttgcagg acatcccgcc gataggcgta gatcccgacg tgcttcaggt agcgcgcctt 9480
ctcggcgttg cgcgggtacg gaatggggga gcgggagaaa tacagggcgt cctgccgcgt 9540
gttcaccacg accttgacgg tggacggttc ggcggcttct gccgcgctga tcgcatgaca 9600
cagggtcgcc accggcagcg ccgggtcgtc ccgcatacct tgcagcaggg tttcgacgtc 9660
acgcgggcga atcatcggct catccccttg caggttgata tagatatccg cctccacctt 9720
atgcatgact tccaccaggc gatcggtgcc gctctcatga tcgttgcggg tcatgatcgc 9780
tttgccgccg aacgcctgga ctgcctgctc cacacgcggg tcgtcggttg cgacccacac 9840
ctctgccacg cctgccactt gcagggcccg ttcgtagacg tgctggatca tcggtttccc 9900
gacgatatcc agcagcggtt tgcccggcag acggctgctg ccgtagcgtg ccgggatcac 9960
aatcacggcc ttcgacattt attaacctcc tcgagttaca gcgacagaat cactttcgcg 10020
cccaccgcca gttggtacag aatggtgctg ataccgcgcg tcacttcgat gttcttcgac 10080
tcgtatttcg gcaacaccat aatttcatca ccgggtttca gggaatcgac gtcttctgcg 10140
ttcaccgctg cgccgttctg acggatgacg ataatacggg cgttgccgga cttctgggtc 10200
agcccaccgc acttctcgat gtagtcctcg gtcgtcatac ctttctgcca cgacaccgcg 10260
ttcgggaaca gcacttcccc gtggaccatg accaacgacg tcttttcggg aatattgatc 10320
acgtcgccgt cctccaggag gacggagtca atgttgcttt cattgaggat cacttcgccc 10380
ttcggcacga cggtgcgggc tttcgcgacg aagcgggaga tcagttgggc ttcctgcata 10440
cgcaggctgg cctcttcctt ggtgctgctc tgtgcgctga ggctggcctc ttcgagcttt 10500
tgcagggaca aattcagcat ttctttctgc cgttgcgcga cgctcggccg atacaactgc 10560
acggcgttca tctgcgacat ggagttcggg cgcacttttt cgagcacggc ccgcatggtg 10620
ctaccgtagg gcagcaccat ggcgtgttcc ccggaatgtg cgccttccac acgcacttga 10680
atggtgcccg catagcggtc ggtggagaca atgagggtat caccgttttg cagcatacgc 10740
cccggtgcgg acgagatcgg ataatattcc gagcgcttct ggaggccctg cttccgcata 10800
atcgtgatat gggtcgcacc cggtttggga cgtgcccagg acagtgcttc ggtgaccggg 10860
atgctcgatt cgcgaaattc aaagtcgtag gaattgaaca catcgccctg caccgagaac 10920
gtatgctggc gcggacccac aatgatcgta tcaccgtccg caaactggga cagccccagt 10980
ttgccgttga gcaggaagtc atagaggttg acgttcgagc gcacacgatt gccgcgtttc 11040
acgacgatgt ccacgtagct gccgcgttcc gggtccacac cacccgcctt gatcaggtag 11100
ttcagcaggc tgtcggaggt gacaccgccg tacaggccgg ggttgcggac aaagccggtc 11160
acatagacct tgaccggctg cgcctgcaag agcgacgcat agacgttcac gttgctctgg 11220
tagacttcct tcaccttgct cgtcaccagc gcgttcaact gggagttcga cacacctgcg 11280
actttgacgg ggccgacatt cggcaggaag atgttgccct tcgggtccac ctggagtgcg 11340
ccatcgaagg tgaacgcacc ccacaggcgg acctggatgg aatcgccggg attcaggatg 11400
tagtccggat tgaaacccac ggttgccccc gagtctgcgc tcgtaccgtt gaacagctgc 11460
gccccgaaca tacggctcat cacgaccggg ggtgcggggg gcggggtgtt atcgaagccg 11520
ctcatgttct gggtgtcgct tttctgcccg ttcaggatgc cggtcaacgg tgcggcaccc 11580
gtgaggttcg gatcggcatt aatgtcgatg gttgcgctcg cctgtgctgc atggcacgct 11640
gcgatcagca ggatcgactt aaacagcttc atttattaac ctcctcgaga agtcgactta 11700
gtcacggtgg tcttcaatca ccgccaggag caatttcagg gtgccaaaga gcaggcaaca 11760
caccagcagc caacacgcga tcaaatacgg gatattcggg aaggagcttt cctggggcag 11820
ctgcggggac gagatcacgc tcaggacttt cagcttacgg gccgcttcga cacgggtctt 11880
ttcgatgctg gtgagcgtga gcttgtacaa ctcggtattg aactcgacct tggatttgat 11940
ctcctcaaaa tccacggcca tgcggttcag tttatcgccc tggggtgcgg taattttcga 12000
cttttcttcg tcgatctgtg cctggaggct ctgaattgca ttgcgggcgc tcacgacttg 12060
gggcgcatcc tcgcgcaggt acgtgagcag gttgcgcagg tcggcttcca tctgaatttt 12120
ctggcccatc agcgtattca ccagggtgga tgccgcctgg gcctgtgcct gcgggtccag 12180
cacattgttg ttgtcttggt aggacaacaa ttcggctttc gatgcatcca gccgctggcg 12240
cgctttttcc atttcggttt ccgcaaacgc caattgatcg cgggcgatac ggtgcgacat 12300
ttcattgatg aaccgctcgg attccttgag cacggtctgg ttgaatttca gcgcgaactc 12360
gggcgaaaag ccctgggtct ggatgttcag cagcccggtc ttgtcgtcgt agctgacgtt 12420
gatgcgatct ttatagtact tcaggaaccc ctcggcggtt tcatccttgg acagatggtt 12480
caggaagtcc aggcccgaat gggagaacgc ttcgcggaag ttcagctgtt tatccagcgc 12540
ggccagcata tccgggctgt tgatgtattc cttcaggtac agtgcgtctt cggcggacga 12600
cgggttggag gcacccaaca gcaggccgaa gttcaggctg ccggagttga gatcgtcgct 12660
gcgcttgatg gccaccttgc tttccgacat atagcggggc tgggagaaga tcgccaagta 12720
gatcagcagc accgccatgg gtgccagaat aatgattttt gccaggtgct tctgaatatc 12780
tgccaggctg atcgcgctca gacgcgcacg catccacgag acggcgcttt tcactttgat 12840
cagcatttat taacctcctg tcgacaacac gtgttaatcg aaaatgcgca ccaacccggt 12900
caccttattt gctttgttgg tcaccagcag ggtcgagacg cggtgtttct gcatcttctc 12960
ttctgcttcg atgatcatgg tgtcttcggg caaggtcagc ggttcgcggg tcatcatctg 13020
tgcggccgtt gcgctcgtca ggctgtcttc tttctccata aagcgccgca gatcgccatc 13080
ggtgatgatg cctgccagcc caccttccgc atcttcgacc atcaccatac cctggcagcc 13140
cgaggtgatg cgctgaatga ccgttttgaa gctggcatcg agctgcactg ccggcacatc 13200
atgttgcatc acgtcggcga cgcgggtcag caggcgccga cccaggctgc caccggggtg 13260
gtagcgtgca aagtcattgg gcataaactt acgctggtga atcatcgcga tggccagcgc 13320
gtccccgatc gccatcgtga gcgtcgtgga ggtggtcggg gcgagattgt tcgggcacgt 13380
ttcgttcgcc atgtgcagct ccaggaccgc atctgcattt ttggccaggg tgctattccc 13440
gttattggtg attgcgatga tgcgattgcc gaagttcttc aggctcggca ccagtttcag 13500
gatctcgtcc gtctcaccgc tcgccgaaat caagatgagc aggtcatacg gggtgatcat 13560
gcccagatca ccatggaacg cttccgccgg atgaataaag aaggagggcg tcccggtcga 13620
ggccaaggtc gccgacatct tgcggcccac atggccgctt ttacccatgc cgctcaggat 13680
gacgtgccct ttacaattca tgatgagatt caggacgcgc tggtactgac cgctatccag 13740
ttgtttggac aggttttgca gtgccgcgct ttgttcggcc agggtctggc ggacgctcgt 13800
aatcagatac ggatcaatgg tcgaggactg gtcatccggc aagtggcgtt cgctcattta 13860
ttaacctcct cacgtgttaa ttaagtaatc gatagtgatt taaatatgca agatccgata 13920
aatcgattga tagatttaaa taagaactgc agaagctagc ttagatgctc gtgaaattga 13980
cgtgggcgct ttgcagggcc gtcttaatgg cgttggtgtc cacgaggatc gagtcgggtg 14040
cggaaaacgg acggttcttg ttggtgaaat cgctgttacc aatgtacagc gattccttgt 14100
tacgcagcgc ctggatgtgc cagcgggacc acgaatccca atacttctgg cgatccggcg 14160
agataccttg gctggtgtag ccggtcgtcg ggctgttcat caacgagtcg gtgcggtgcg 14220
agcccagcgt cagcggcaac ttgatccgat gcaccgtgga atcgccgaag atcagcttca 14280
gacgcgcgat aaattcgcta tccgcacccg ttttcacaca atcccagaca ccggccttct 14340
gcaagacgtc ggcacggcga aacaggagcg acgacggatt cagacgcttc aaggggtaca 14400
ctgcgcgggc atagaaaata ccgttgtctt gcaggcgcac ccagtccgag atggagcaga 14460
tgagcttcgg attgagcaac aagggggaga tttggcggaa cagcttttcc ggatggctcc 14520
agtcatccga atcgtggcag gtgacgaact cgcccttcgc ttggatcaag ccgatacgct 14580
tcgcggcata ggtgccgaca ttctgcggca ggctaatgat cttgatgcgc gtgtctttga 14640
gggcgagccg ctggagacga aacagggtgt catcggtgct cgcgtcatcc acaatgatca 14700
gctcgaagga acggtaggtc tgattgagga gcgaaatcac cgcattttcc acgcggcgac 14760
ccgtattata ggtggtcatc aggatggaga tcaacggccc cgtctgggcc gggtacggga 14820
tgctggtgat gatgttgcac ggggagagcg gggagctgtt gtccgtcaag gccacggggc 14880
tgaggccgaa gtatttatag tattcattca gccgattcag gctaatttcg gcggtttcgc 14940
ggaaggcgtt attttgcagc agcaggatat ccgggctata gacgatatcg gatgcgtcga 15000
tctgggcgag ggtcgagatg gccttttggg tcaggccgat ccggagttgc agtgcggtat 15060
acaggtccag cgggcagttg tccacgttgt ccaacaggct caggctaaag gtcggcgagt 15120
aggacgccag ggttttcgcc agttccactt tctgatgggt atcggtgaac tcgtccttga 15180
actccatcag cagctcgggc gtcaggctga tgtcgccgca ggcgattttt gcgatcttga 15240
ttgccagttt gcagcgccaa tcggacgggg tatccgtcaa gttatgcagc gaccagtaca 15300
tattcagacg atacatcgcg aggatgcgtt tcgactgcca gaaccggcaa tcatcctgga 15360
tggccgcgag cgcgtggacg tagcggctct ttttgagcag ccacaagaat ttgagattat 15420
tgaacattta ttaacctcct gctagcaact taagttacga atcgacgccg aacaggtcgc 15480
gggtgtagac tttctccgag acatcttcca gttcgctggt gcggcgattc gccacaatga 15540
catcgacgcg ctccttaaag gaattgatgt cgcgctcgac gtaggaaccg aagaagtagg 15600
gttctttcag gaccggctcg tacaccacaa tctcgatacc cttggccttc aaacgtttca 15660
tgaccccctg gatgctgctg gcccggaaat tgtcgctacc cgccttcatg atcaggcgat 15720
agataccgac cactttgggc ttacgggaca ggatgtcctc ggccacgaag tccttacggg 15780
tcgtattcgc atccacgatg gcctggatca ggttttgcgg gacgtcgcga taattggcca 15840
acagctgctt cgtatccttc ggcagacagt aaccgccgta gccgaaggac gggttgttgt 15900
aatgttgacc aatgcgcgga tcgagggaga cgccttcgat gatttgtttg gtatccaggc 15960
cgtgcacgct cgcgtaggtg tccagctcgt taaagtacgc gatacgcatc gccagatacg 16020
tgttcgcgaa cagtttgatg gcttctgcct cgggcgaatc cgtcagcagg atcggaatat 16080
cctttttgat ggcaccttcc gacaggagtt cggcgaactt ccgtgcgcgt tccgacgatt 16140
cgcccacgac aatgcggctc ggatagagat tatcatacag ggctttgcct tcgcgcagga 16200
actccgggga aaagatgata ttattcgtgt tcagatcgcg cttcaggcgt tcggtgaacc 16260
cgacggggac ggtggatttg ataatgatgg tcgcgttcgg gttaatggac agcacgtcac 16320
acgcgacgct ttcgacgctc agggtatcaa agttgttatt aatcggatca tagttcgtcg 16380
gggtggcgat gatcacgtag tctgcatcgc gatatgcctc gtatttttcc gtcgtcgcgt 16440
agaggttcag cttacgattg gagagaaact tctggatttc cgggtcgcaa atcggcgaga 16500
ttttcttgtt aatgagctgg accttcttcg ggtcgatgtc cagggcgatg atgtcgtgtt 16560
tttgggagag gaggatcgca atgctgatac ccacatagcc gacgccggcc acggcaattt 16620
tcatttatta acctccttaa gtgaattcaa actagtttac aagtcgtttt cgatcttctc 16680
ccaggtatat ttgcgacatt cattcaagtt ggtcagcggc gagtatttgt actttttgat 16740
accgaggcgc gacaggcttt cgttcaccac cttgaaatgg ttttcctttt ggatgtccag 16800
tttcttgatc gacgtgttct cgccgtgcag gacacggttg tagcaaatct tattgatatg 16860
cttaaacggg ccgacttcgc tgagtttcaa atacatatcg taatccaccg cattgctgat 16920
gctctcgttg aagccttcgg tgaggttcca tgcacgcgcc gtgaacatac ggaagtggtg 16980
gcagatcatc gcgctcgtga gcttttcgcg gctgtaaatc ggccagttgt agccattgct 17040
aatcaagtta ccttcacgat caatattgcg attggtggtg tacacgcagg cgaggctcag 17100
gtctttgcga aattcatcca gacacagttc cacggcatcg ggctccagga aatcatcgga 17160
atccagctgc ccgatgtaga aaccccggca caggcggact gcggtattcg aggcggagcc 17220
gatgcctttg tttttctggc tgatgaaacg gacgcgcggg tggtttgcgt aatgttcttg 17280
caggatgcgc agcgtatcat cggtgctccc gtcatcgcag atgcagacct ccagatcggt 17340
gatcgtttgg ttcagtgccg attcgacgca gcgcacgata tatttgctgc aattatacgc 17400
ggggatgtag atgctcacca ggggcacacg tttcagggtg gcgctctcga ttttctcctt 17460
cttgcgataa aagtagggca ccttctgctg caacagctgg acggtaatgt ttttacctgc 17520
cgcgcgatcg gtttcgttct ccttaccggg cggttcctga tgatatgcca tcgcgccttc 17580
cacgctacgg aaataacaac cctcgcggta cagccgatag ccgaactcat tatcctcacc 17640
gccccaatgc gtgaactctt cgtcaaacca acccgcgcga aacagccact tctttgcaaa 17700
cgccacattg ccaccgctaa agaaccggaa cggggtgttg cacaggcgca gattgtcggt 17760
attcttgaaa tgttcgatgc gccaatcgac ggatttgttc tgctcgacct tgcctgcgac 17820
ctgattattg gtaataatct ccgggatttc attgatcagg cttttctggg acaaaaagtc 17880
cagataggta tgcttcgacg tgtcgatgta tttacgcggg ccaatcagtg ccacgttatc 17940
atccacggcc aggagttcca tataggactg cacccacaac gggttcggcg ccatatcgca 18000
gtccaagatc gccacgtagt tgtatttcgc tgcccgcagg cccaggttcc gcacggcgca 18060
cagctggtag ccgtagtctt tctggcggac gtatttgatg ttcagcaacg actcgaactc 18120
gcggacgatc tcttcgatgt tttccttgga accgtcatcc gcgacgatga cctcatagtc 18180
ataaatcgtt ttctgattgc agaggcaggc cagggtgatc gccaggattt tggcgcgatt 18240
gtacgtcgga atcacgatgg acaggccgtc gatgatcagt tgcttgcgcg gataatcatc 18300
cagttcttta cgtttccctg cccagacgta gtcgttcgtg ctttccggca gcggcggcaa 18360
ggtcaggtcg ctcggccaat ccagcggaat gggttcgact tctttcaatt cggcgcgctc 18420
ggatttcttt gcggtaattt cccgatattt gctaatgatt tcattctttt ccacctcatt 18480
cagcgagatc gcctttgcat tgctgcacat aattttggtt gccgcgtcga tatcaatgac 18540
cgctttccga ttcagcttgt ccacttcttc gctcagattc agggcggttt ggcacagctt 18600
gatattggct tccacccagc tcacatcata gatttccgcc actttttcaa acagggagag 18660
ggcttggcgg tagttcttat tcttatacag attgattgcc tggttcaaaa tgctcattta 18720
ttaacctcct actagtgaat tttcgaatta cttaccgcag tacttgacac ccacctggga 18780
attgtttttg gtgcgtttga attggcggat ggtacggtag atgctaaagg gcaggctgat 18840
cagaccgagc ggaaaattgt tcttattgat gatgagcttg cccagctgat agctcaggtg 18900
tttcttgacc cgttcggctt cgtgtttatc cgcgtacagg aagatgctcg gcaggctcac 18960
ttggtactcc gaatcatatt tcttcttcca ggtccgccat tcgctgatca acgcaaacgg 19020
aatcgagatc agaccgagga acgtcttgga gcggctcacc atcaccgcac ccaggcggta 19080
gccgatatct tgcttgatgc gttcggccgc accatacagc tccggcagtt gtttcttttc 19140
gagacgttga ttgtcgatga agtactgttc gagcttttgc tgcaccagat gcagctgatt 19200
gagcagcaat tctttttcgc acgacagctt ttcgaggcgc tgttgttgca gttcattttt 19260
gttctgttcc tttttcagca gggactcgaa gttctcgatc gcgcactcca gttcctggac 19320
ctggatggtt ttgtttttaa tgatcagatc atactggatc agttcttcct tgctatccga 19380
cagctctttc agaatggctt gataggcgtt cagctgtttg gacgtgtgca gttcgttgtc 19440
cagaatgatc tttttgctgc tctggtacag accgttcacg atatcgaggg tgatctggcg 19500
ttgtttaatg aacgtctccc aaataaagga cggcttatag ttttccttct ccagcacccg 19560
caagggggtg ttggcgttcg attgcaattc aaagtacagt tccttgcaat cgggatagtc 19620
gttcaggacg ttgaagatca agtactcctc cgtctcgctt tgcttgaaaa tgatatcccc 19680
ggtcccgatg tcaataccgc tgagggacat gatctcctga tgttcttttt ccagcgtaat 19740
ggaggcttcg gcggtcttaa agtcattcac gctctgctcc agcgagtggt tgatggtatt 19800
ggagaacgac aacccgaatt tcagtttcag tttgtgttgc agttgctgga tgcagtcctc 19860
ggcgttgcgc ttcacctgtt cgctcgacac cagcaggcac cgaccccggt tgttgaggaa 19920
gaagtgcagc aaggcggtgt tgtatgccag ccagtttttg atcagatgct ccgaggtata 19980
gttgctggag atgttctggt ccgagaagta gttcgtcagg atgcttttgg ggtggtcgta 20040
gatgaggata aaggtgatgt tctcatccac cgatttccaa tattccaacg tgtgaattgc 20100
gttggggtcg ctccaaccgc acagtttctg gttcaggttg gacagcatca gatccaatgc 20160
gataccgttc cagacggtgc tcacatggag cggttcaaag tcggcggaat cggtcaccgt 20220
atagatgtcc ggcgactggt acgccttccg cagcgtctgg gtgatgtcct ggggcgagag 20280
gttctcacgt ttggacgggc acagggagtt catgccgcgc tgatgcagga gttcttccac 20340
gatttggtag ttgctgctcg gatggcccac gatcaccagg cggttcattt attaacctcc 20400
tttcgaaaat gaacggtccg ttaaatatag ccattcggat tcttcatctg ccagcgccag 20460
gcgtcctcca gcatggtttc gagttcccgc ttggctttcc agttcagata tttgttggcc 20520
ttttcggggg aggaccagct ctccgcgata tcaccgtcac ggcggctcac gatttcatac 20580
ggaatccgca cgccggaaat cttttcaaag gtggacacca gttccagcac cgaataacct 20640
ttacccgtgc ccaaattaaa gacgtggtag ttggtgttat tgtcgcggaa gagataggac 20700
agcgctgcga cgtgcccttc ggccaggtcc atcacatgga tatagtcacg gacccccgtg 20760
ccgtctttgg tgggataatc accaccgaac accatcagtt tttccagttt ccccatcgcg 20820
acctgcaaga tgtacggcac caagttggag gggatgtctg ccgggctttc accaatcata 20880
ccggattcgt gggcgcccgt cggattaaag tagcgcaagc agaggaaatt cgtgtcggag 20940
tatttcttgg cgatgtcgcg gatcatcagc tccgagatgt acttggacgt accatacgga 21000
ttcagcgtgc caccaatatg gcagtcttcg gtgacgggca tgatcttgct ttccccatac 21060
accgtcgccg acgagctaaa gatgaagttg gcgacgtcgt tcttgatggc gcaattgatg 21120
agttgcaggg tgccgctcac gttgttgtca tagtagaaga tgggcttgat caggctttct 21180
gcgaccgatt tcgcacctgc aaagtgcatg atgcagtcga atttgtgttt cttcaggatc 21240
tggttcactt ccttctcgtt gttgatattg agttcgtaga acgtgacttt cttctttgcg 21300
atcagctcaa tgcgacggat gctttcgcag ctgctgttga tgagattgtc aatgatgacg 21360
acattgtagc ctttgttcag caggcagagc gacgtgtggc tgccgatgta gcctgcaccg 21420
ccggtgacca ggatgttcat ttattaacct cctcggtccg aattaaccta ggttatgagg 21480
tcagcattgc ttcttcacgc gtttagtagt tgttttgttc ggtgatatat tcttcaatgc 21540
cttcttgcac gtcttcatgg aacgacacgg cgttgtcgtc tttaaacacg attgccacat 21600
cgcagaactc tttcaacgag ttcagcgagt gcgacaccat gaggaaggag ctttccttat 21660
gacgctcctt gaagagttgg gcacattttt ccttgaaacg ggcgtccccc accgccgtca 21720
cctcgtccac gatgtagtaa tcgaacttga acgccatgct caggccgaag ccgaggcggc 21780
tgcgcatacc gctcgaatag gtcttgatcg gcatatcaaa atacttcccc agctccgcga 21840
actcttccac aaactcaatc ttttctttca gctcctcctg cttcgcgtac agccgggcca 21900
cgaacttcac gttttcacgc ccggtcaagc tgccctggaa gccgcctgcc agacccaccg 21960
gccacgagat cgttttattc gtgatgattt taccgctatc cgggcggtcg atgcccccaa 22020
tcatgcgcaa cagcgtggat ttacccgccc cattgcgccc gatgaacgcc acgcttttgc 22080
cgctggggat ctcaatgttc aggttcttga agacatagtg acggcccacc ggggtgcggt 22140
agcttttcgt caggttttcg atcttaatca tgaggtcaac attgcctcct cacgcgtacg 22200
gtacagggcc aaaccaataa acagggtcac cagggtgaac attgccagat aattcaggct 22260
gaccccttcg ctgatataac cgggcatcac ggcctcgcgg ctcagttcga cgacgtgcac 22320
caggggattc cacagcaggt acgaccaata ctgcttcgga atggagtgca gcgggaacat 22380
gatgcacgaa ataaagtaca gcggcttcag caagatcggc aagactttct gcatttcggg 22440
gaacgtcttg cccacgacca tgaagatcag gcccacaccg cacgacagga tgatcaggag 22500
gctccaggtg agcacaaatt gcaggaagtt ggtaatctcg aaatattcgc ccgccatcca 22560
gatgatcagc atcaggagga tgtagaccgc cacatagatc agcgtttcca agagggcgcg 22620
tgcaatgatc gtgtcgatcg gcttcacggg ccggtagtta aacagcccct gattggcttc 22680
gatggcgccc acggagcgat tgctgatgct gctgaaaata aagaacggga tcaggccatt 22740
gagcaggaac accgggaagg agatatccgg catggtgcga tgcatgatat agccaaagat 22800
cccgagcaga atcagcagat gtgcgctcgg ttccaggatc gcccacagat agcccaggcg 22860
aaacttgcca aagcgcgtac ggatttcgcg gagaaacagt gcttcgaccg tcactttctg 22920
gacttcaaaa cccgaacgtg ccatttatta acctcctggt accaatctag attgtttaaa 22980
cagatctgtt acctgcagga ttattgtttc tgttgcataa agcctaaggg gtaggccttt 23040
ctagagatag ccattttttg cactcctgta tccgcttctt gcaaggctgg acttatccct 23100
atcaaaccgg acactgcagg ctgacaagct ttcattacat atgaagagtt tgtagaaacg 23160
caaaaaggcc atccgtcagg atggccttct aagaaggctc gagtggcgcg cctaagtcga 23220
atttctgcca ttcatccgct tattatactt attcaggcgt agcaccaggc gtttaagggc 23280
accaataact gccttaaaaa aattacgccc cgccctgcca ctcatcgcag tactgttgta 23340
attcattaag cattctgccg acatggaagc catcacagac ggcatgatga acctgaatcg 23400
ccagcggcat cagcaccttg tcgccttgcg tataatattt gcccatggtg aaaacggggg 23460
cgaagaagtt gtccatattg gccacgttta aatcaaaact ggtgaaactc acccagggat 23520
tggctgagac gaaaaacata ttctcaataa accctttagg gaaataggcc aggttttcac 23580
cgtaacacgc cacatcttgc gaatatatgt gtagaaactg ccggaaatcg tcgtggtatt 23640
cactccagag cgatgaaaac gtttcagttt gctcatggaa aacggtgtaa caagggtgaa 23700
cactatccca tatcaccagc tcaccgtctt tcattgccat acggaattcc ggatgagcat 23760
tcatcaggcg ggcaagaatg tgaataaagg ccggataaaa cttgtgctta tttttcttta 23820
cggtctttaa aaaggccgta atatccagct gaacggtctg gttataggta cattgagcaa 23880
ctgactgaaa tgcctcaaaa tgttctttac gatgccattg ggatatatca acggtggtat 23940
atccagtgat ttttttctcc attttagctt ccttagctcc tgaaaatctc gataactcaa 24000
aaaatacgcc cggtagtgat cttatttcat tatggtgaaa gttggaacct cttacgtgcc 24060
gatcaacgtc tcattttcgc caaaagttgg cccagggctt cccggtatca acagggacac 24120
caggatttat ttattctgcg aagtgatctt ccgtcacagg tatttattcg gcgcaaaggg 24180
cctcgtgata cgcctatttt tataggttaa tgtcatgata ataatggttt cttagacgtc 24240
aggtggcact tttcggggaa atgtgcgcgc ccgcgttcct gctggcgctg ggcctgtttc 24300
tggcgctgga cttcccgctg ttccgtcagc agcttttcgc ccacggcctt gatgatcgcg 24360
gcggccttgg cctgcatatc ccgattcaac ggccccaggg cgtccagaac gggcttcagg 24420
cgctcccgaa ggt 24433
<210> 36
<211> 24434
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Sequence
<400> 36
ctcgggccgt ctcttgggct tgatcggcct tcttgcgcat ctcacgcgct cctgcggcgg 60
cctgtagggc aggctcatac ccctgccgaa ccgcttttgt cagccggtcg gccacggctt 120
ccggcgtctc aacgcgcttt gagattccca gcttttcggc caatccctgc ggtgcatagg 180
cgcgtggctc gaccgcttgc gggctgatgg tgacgtggcc cactggtggc cgctccaggg 240
cctcgtagaa cgcctgaatg cgcgtgtgac gtgccttgct gccctcgatg ccccgttgca 300
gccctagatc ggccacagcg gccgcaaacg tggtctggtc gcgggtcatc tgcgctttgt 360
tgccgatgaa ctccttggcc gacagcctgc cgtcctgcgt cagcggcacc acgaacgcgg 420
tcatgtgcgg gctggtttcg tcacggtgga tgctggccgt cacgatgcga tccgccccgt 480
acttgtccgc cagccacttg tgcgccttct cgaagaacgc cgcctgctgt tcttggctgg 540
ccgacttcca ccattccggg ctggccgtca tgacgtactc gaccgccaac acagcgtcct 600
tgcgccgctt ctctggcagc aactcgcgca gtcggcccat cgcttcatcg gtgctgctgg 660
ccgcccagtg ctcgttctct ggcgtcctgc tggcgtcagc gttgggcgtc tcgcgctcgc 720
ggtaggcgtg cttgagactg gccgccacgt tgcccatttt cgccagcttc ttgcatcgca 780
tgatcgcgta tgccgccatg cctgcccctc ccttttggtg tccaaccggc tcgacggggg 840
cagcgcaagg cggtgcctcc ggcgggccac tcaatgcttg agtatactca ctagactttg 900
cttcgcaaag tcgtgaccgc ctacggcggc tgcggcgccc tacgggcttg ctctccgggc 960
ttcgccctgc gcggtcgctg cgctcccttg ccagcccgtg gatatgtgga cgatggccgc 1020
gagcggccac cggctggctc gcttcgctcg gcccgtggac aaccctgctg gacaagctga 1080
tggacaggct gcgcctgccc acgagcttga ccacagggat tgcccaccgg ctacccagcc 1140
ttcgaccaca tacccaccgg ctccaactgc gcggcctgcg gccttgcccc atcaattttt 1200
ttaattttct ctggggaaaa gcctccggcc tgcggcctgc gcgcttcgct tgccggttgg 1260
acaccaagtg gaaggcgggt caaggctcgc gcagcgaccg cgcagcggct tggccttgac 1320
gcgcctggaa cgacccaagc ctatgcgagt gggggcagtc gaaggcgaag cccgcccgcc 1380
tgccccccga gacctgcaga tccacatcct tgaaggccgc agcgacgagc agaaggaaac 1440
cctcattcgg gaagtcagcg aggccatctc gcgctccctg gatgcgccgc tgaccagcgt 1500
gcgagtgatt atcacggaga tggccaaggg ccacttcggc atcggcggcg aactggccag 1560
caaggtcaga cgctgaagtg gagatgccca agggcacttc gggtcgagga acccgacctg 1620
cattgggacg cggccacgga gagcgcgggc aaacgccggc actatagcca gtggagtttg 1680
taaaacgcta tttcagagct tggagagtgt ctaagaaagc cggggcgatg ccaacccatc 1740
ccttcttcgg ctatgcatcg ttcgtaatca agccacttcc tttttgcatt gacgcagggt 1800
gtcggaaggc aactcgccga acgcgctcct atagttttca gcgaagcgtc ccaaatgtaa 1860
gaagccgtag tctagggcta tctcagttat actacgcaca ttggcactgg gatcgttcaa 1920
gcaggcgcgg atgctttcga gcttgcggtt gcggatgtag ttcttcggcg tggtgccggc 1980
atgcttctcg aacaaattgt agagcgagcg tggactcatc atcgccagct ccgctaaccg 2040
ctcaaggctg atattccgtt tgagattctc ctcaatgaat tgaacgactc gctcgaaaga 2100
cgggttacct ttgctgaaaa tttcacggct gacattgctg cccagcattt cgagcagctt 2160
ggaagcgatg atccccgcat agtgctcttg gacccgaggc atcgactttg tatgttccgc 2220
ttcgtcacaa actaacccga gtagattgat aaagccatcg agttgctgga gattgtgtcg 2280
cgcggcgaaa cggataccct ccctcggctt gtgccaattg ttgtcactgc atgcccgatc 2340
aaggaccact gagggcaatt taacgataaa tttctcgcaa tcttctgaat aggtcaggtc 2400
ggcttggtca tccggattga gcagcaatag ttcgcccggc gcaaaatagt gctcctggcc 2460
atggccacgc cacaggcaat ggcctttgag tattatttgc agatgataac aggtctctaa 2520
tccaggcgag attaccctca cgctaccgcc gtagctgatt cgacacaggt cgaggcatcc 2580
gaagattctg tggtgcagcc tgcctgccgg gcgcccgccc ttgggcaggc gaatagagtg 2640
cgtaccgaca tactggttaa cataatcgga gactgcatag ggctcggcgt ggacgaagat 2700
ctgacttttc tcgttcaata agcaaaaatc catagttcac ggttctctta ttttaatgtg 2760
ggctgcttgg tgtgatgtag aaaggcgcca agtcgatgaa aatgcatctc gacgtgatgc 2820
gtatacgggt tacccccatt gccacgttgc gccatccttt ttgcaatcag tgaccacttt 2880
tccaagcaaa aataacgcca agcagaacga agacgttctt tttaagaagc gagaacacca 2940
gaagttcgtg ctgtcggggc atgcggcgac gaattggcgg ataaagggga tctgcaggtc 3000
ccgagcctca cggcggcgag tgcgggggtt ccaagggggc agcgccacct tgggcaaggc 3060
cgaaggccgc gcagtcgatc aacaagcccc ggaggggcca ctttttgccg gagggggagc 3120
cgcgccgaag gcgtggggga accccgcagg ggtgcccttc tttgggcacc aaagaactag 3180
atatagggcg aaatgcgaaa gacttaaaaa tcaacaactt aaaaaagggg ggtacgcaac 3240
agctcattgc ggcacccccc gcaatagctc attgcgtagg ttaaagaaaa tctgtaattg 3300
actgccactt ttacgcaacg cataattgtt gtcgcgctgc cgaaaagttg cagctgattg 3360
cgcatggtgc cgcaaccgtg cggcacccta ccgcatggag ataagcatgg ccacgcagtc 3420
cagagaaatc ggcattcaag ccaagaacaa gcccggtcac tgggtgcaaa cggaacgcaa 3480
agcgcatgag gcgtgggccg ggcttattgc gaggaaaccc acggcggcaa tgctgctgca 3540
tcacctcgtg gcgcagatgg gccaccagaa cgccgtggtg gtcagccaga agacactttc 3600
caagctcatc ggacgttctt tgcggacggt ccaatacgca gtcaaggact tggtggccga 3660
gcgctggatc tccgtcgtga agctcaacgg ccccggcacc gtgtcggcct acgtggtcaa 3720
tgaccgcgtg gcgtggggcc agccccgcga ccagttgcgc ctgtcggtgt tcagtgccgc 3780
cgtggtggtt gatcacgacg accaggacga atcgctgttg gggcatggcg acctgcgccg 3840
catcccgacc ctgtatccgg gcgagcagca actaccgacc ggccccggcg aggagccgcc 3900
cagccagccc ggcattccgg gcatggaacc agacctgcca gccttgaccg aaacggagga 3960
atgggaacgg cgcgggcagc agcgcctgcc gatgcccgat gagccgtgtt ttctggacga 4020
tggcgagccg ttggagccgc cgacacgggt cacgctgccg cgccggtagc acttgggttg 4080
cgcagcaacc cgtaagtgcg ctgttccaga ctatcggctg tagccgcctc gccgccctat 4140
accttgtctg cctccccgcg ttgcgtcgcg gtgcatggag ccgggccacc tcgacctgaa 4200
tggaagccgg cggcacctcg ctaacggatt caccgttttt atcaggctct gggaggcaga 4260
ataaatgatc atatcgtcaa ttattacctc cacggggaga gcctgagcaa actggcctca 4320
ggcatttgag aagcacacgg tcacactgct tccggtagtc aataaaccgg taaaccagca 4380
atagacataa gcggctattt aacgaccctg ccctgaaccg acgaccgggt cgaatttgct 4440
ttcgactatc ggcgcgccag agctcatcgt taatgtcttc gtgcgccgtc agtcggcgca 4500
cgttttttct ctctggtacc gtgtcactga tctagtcaat tactcgaagt atccacaagt 4560
gaagcatact aagtaatgta caagaatcaa aaaaatcggc tacgcaagtc gcgtagccga 4620
atcatttaag gatccttcca ttcaggtcga ggtggcccgg ctccatgcac cgcgacgcaa 4680
cgcggggagg cagacaaggt atagggcggc gcctacaatc catgccaacc cgttccatgt 4740
gctcgccgag gcggcataaa tcgccgtgac gatcagcggt ccagtgatcg aagttaggct 4800
ggtaagagcc gcgagcgatc cttgaagctg tccctgatgg tcgtcatcta cctgcctgga 4860
cagcatggcc tgcaacgcgg gcatcccgat gccgccggaa gcgagaagaa tcataatggg 4920
gaaggccatc cagcctcgcg tcgcgaacgc cagcaagacg tagcccagcg cgtcggccgc 4980
catgccggcg ataatggcct gcttctcgcc gaaacgtttg gtggcgggac cagtgacgaa 5040
ggcttgagcg agggcgtgca agattccgaa taccgcaagc gacaggccga tcatcgtcgc 5100
gctccagcga aagcggtcct cgccgaaaat gacccagagc gctgccggca cctgtcctac 5160
gagttgcatg ataaagaaga cagtcataag tgcggcgacg atagtcatgc cccgcgccca 5220
ccggaaggag ctgactgggt tgaaggctct caagggcatc ggtcgacgct ctcccttatg 5280
cgactcctgc attaggaagc agcccagtag taggttgagg ccgttgagca ccgccgccgc 5340
aaggaatggt gcatgcaagg agatggcgcc caacagtccc ccggccacgg ggcctgccac 5400
catacccacg ccgaaacaag cgctcatgag cccgaagtgg cgagcccgat cttccccatc 5460
ggtgatgtcg gcgatatagg cgccagcaac cgcacctgtg gcgccggtga tgccggccac 5520
gatgcgtccg gcgtacaaga tccacaggac gggtgtggtc gccatgatcg cgtagtcgat 5580
agtggctcca agtagcgaag cgagcaggac tgggcggcgg ccaaagcggt cggacagtgc 5640
tccgagaacg ggtgcgcata gaaattgcat caacgcatat agcgctagca gcacgccata 5700
gtgactggcg atgctgtcgg aatggacgat atcccgcaag aggcccggca gtaccggcat 5760
aaccaagcct atgcctacag catccagggt gacggtgccg aggatgacga tgagcgcatt 5820
gttagatttc atacacggtg cctgactgcg ttagcaattt aactgtgata aactaccgca 5880
ttaaagccga gcgatgataa gctgtcaaac atgagatccg ataaatcgat tgatagattt 5940
aaataagaac tgcagaagct agcttagatg ctcgtgaaat tgacgtgggc gctttgcagg 6000
gccgtcttaa tggcgttggt gtccacgagg atcgagtcgg gtgcggaaaa cggacggttc 6060
ttgttggtga aatcgctgtt accaatgtac agcgattcct tgttacgcag cgcctggatg 6120
tgccagcggg accacgaatc ccaatacttc tggcgatccg gcgagatacc ttggctggtg 6180
tagccggtcg tcgggctgtt catcaacgag tcggtgcggt gcgagcccag cgtcagcggc 6240
aacttgatcc gatgcaccgt ggaatcgccg aagatcagct tcagacgcgc gataaattcg 6300
ctatccgcac ccgttttcac acaatcccag acaccggcct tctgcaagac gtcggcacgg 6360
cgaaacagga gcgacgacgg attcagacgc ttcaaggggt acactgcgcg ggcatagaaa 6420
ataccgttgt cttgcaggcg cacccagtcc gagatggagc agatgagctt cggattgagc 6480
aacaaggggg agatttggcg gaacagcttt tccggatggc tccagtcatc cgaatcgtgg 6540
caggtgacga actcgccctt cgcttggatc aagccgatac gcttcgcggc ataggtgccg 6600
acattctgcg gcaggctaat gatcttgatg cgcgtgtctt tgagggcgag ccgctggaga 6660
cgaaacaggg tgtcatcggt gctcgcgtca tccacaatga tcagctcgaa ggaacggtag 6720
gtctgattga ggagcgaaat caccgcattt tccacgcggc gacccgtatt ataggtggtc 6780
atcaggatgg agatcaacgg ccccgtctgg gccgggtacg ggatgctggt gatgatgttg 6840
cacggggaga gcggggagct gttgtccgtc aaggccacgg ggctgaggcc gaagtattta 6900
tagtattcat tcagccgatt caggctaatt tcggcggttt cgcggaaggc gttattttgc 6960
agcagcagga tatccgggct atagacgata tcggatgcgt cgatctgggc gagggtcgag 7020
atggcctttt gggtcaggcc gatccggagt tgcagtgcgg tatacaggtc cagcgggcag 7080
ttgtccacgt tgtccaacag gctcaggcta aaggtcggcg agtaggacgc cagggttttc 7140
gccagttcca ctttctgatg ggtatcggtg aactcgtcct tgaactccat cagcagctcg 7200
ggcgtcaggc tgatgtcgcc gcaggcgatt tttgcgatct tgattgccag tttgcagcgc 7260
caatcggacg gggtatccgt caagttatgc agcgaccagt acatattcag acgatacatc 7320
gcgaggatgc gtttcgactg ccagaaccgg caatcatcct ggatggccgc gagcgcgtgg 7380
acgtagcggc tctttttgag cagccacaag aatttgagat tattgaacat ttattaacct 7440
cctgctagca acttaagtta cgaatcgacg ccgaacaggt cgcgggtgta gactttctcc 7500
gagacatctt ccagttcgct ggtgcggcga ttcgccacaa tgacatcgac gcgctcctta 7560
aaggaattga tgtcgcgctc gacgtaggaa ccgaagaagt agggttcttt caggaccggc 7620
tcgtacacca caatctcgat acccttggcc ttcaaacgtt tcatgacccc ctggatgctg 7680
ctggcccgga aattgtcgct acccgccttc atgatcaggc gatagatacc gaccactttg 7740
ggcttacggg acaggatgtc ctcggccacg aagtccttac gggtcgtatt cgcatccacg 7800
atggcctgga tcaggttttg cgggacgtcg cgataattgg ccaacagctg cttcgtatcc 7860
ttcggcagac agtaaccgcc gtagccgaag gacgggttgt tgtaatgttg accaatgcgc 7920
ggatcgaggg agacgccttc gatgatttgt ttggtatcca ggccgtgcac gctcgcgtag 7980
gtgtccagct cgttaaagta cgcgatacgc atcgccagat acgtgttcgc gaacagtttg 8040
atggcttctg cctcgggcga atccgtcagc aggatcggaa tatccttttt gatggcacct 8100
tccgacagga gttcggcgaa cttccgtgcg cgttccgacg attcgcccac gacaatgcgg 8160
ctcggataga gattatcata cagggctttg ccttcgcgca ggaactccgg ggaaaagatg 8220
atattattcg tgttcagatc gcgcttcagg cgttcggtga acccgacggg gacggtggat 8280
ttgataatga tggtcgcgtt cgggttaatg gacagcacgt cacacgcgac gctttcgacg 8340
ctcagggtat caaagttgtt attaatcgga tcatagttcg tcggggtggc gatgatcacg 8400
tagtctgcat cgcgatatgc ctcgtatttt tccgtcgtcg cgtagaggtt cagcttacga 8460
ttggagagaa acttctggat ttccgggtcg caaatcggcg agattttctt gttaatgagc 8520
tggaccttct tcgggtcgat gtccagggcg atgatgtcgt gtttttggga gaggaggatc 8580
gcaatgctga tacccacata gccgacgccg gccacggcaa ttttcattta ttaacctcct 8640
taagtgaatt caaactagtt tacaagtcgt tttcgatctt ctcccaggta tatttgcgac 8700
attcattcaa gttggtcagc ggcgagtatt tgtacttttt gataccgagg cgcgacaggc 8760
tttcgttcac caccttgaaa tggttttcct tttggatgtc cagtttcttg atcgacgtgt 8820
tctcgccgtg caggacacgg ttgtagcaaa tcttattgat atgcttaaac gggccgactt 8880
cgctgagttt caaatacata tcgtaatcca ccgcattgct gatgctctcg ttgaagcctt 8940
cggtgaggtt ccatgcacgc gccgtgaaca tacggaagtg gtggcagatc atcgcgctcg 9000
tgagcttttc gcggctgtaa atcggccagt tgtagccatt gctaatcaag ttaccttcac 9060
gatcaatatt gcgattggtg gtgtacacgc aggcgaggct caggtctttg cgaaattcat 9120
ccagacacag ttccacggca tcgggctcca ggaaatcatc ggaatccagc tgcccgatgt 9180
agaaaccccg gcacaggcgg actgcggtat tcgaggcgga gccgatgcct ttgtttttct 9240
ggctgatgaa acggacgcgc gggtggtttg cgtaatgttc ttgcaggatg cgcagcgtat 9300
catcggtgct cccgtcatcg cagatgcaga cctccagatc ggtgatcgtt tggttcagtg 9360
ccgattcgac gcagcgcacg atatatttgc tgcaattata cgcggggatg tagatgctca 9420
ccaggggcac acgtttcagg gtggcgctct cgattttctc cttcttgcga taaaagtagg 9480
gcaccttctg ctgcaacagc tggacggtaa tgtttttacc tgccgcgcga tcggtttcgt 9540
tctccttacc gggcggttcc tgatgatatg ccatcgcgcc ttccacgcta cggaaataac 9600
aaccctcgcg gtacagccga tagccgaact cattatcctc accgccccaa tgcgtgaact 9660
cttcgtcaaa ccaacccgcg cgaaacagcc acttctttgc aaacgccaca ttgccaccgc 9720
taaagaaccg gaacggggtg ttgcacaggc gcagattgtc ggtattcttg aaatgttcga 9780
tgcgccaatc gacggatttg ttctgctcga ccttgcctgc gacctgatta ttggtaataa 9840
tctccgggat ttcattgatc aggcttttct gggacaaaaa gtccagatag gtatgcttcg 9900
acgtgtcgat gtatttacgc gggccaatca gtgccacgtt atcatccacg gccaggagtt 9960
ccatatagga ctgcacccac aacgggttcg gcgccatatc gcagtccaag atcgccacgt 10020
agttgtattt cgctgcccgc aggcccaggt tccgcacggc gcacagctgg tagccgtagt 10080
ctttctggcg gacgtatttg atgttcagca acgactcgaa ctcgcggacg atctcttcga 10140
tgttttcctt ggaaccgtca tccgcgacga tgacctcata gtcataaatc gttttctgat 10200
tgcagaggca ggccagggtg atcgccagga ttttggcgcg attgtacgtc ggaatcacga 10260
tggacaggcc gtcgatgatc agttgcttgc gcggataatc atccagttct ttacgtttcc 10320
ctgcccagac gtagtcgttc gtgctttccg gcagcggcgg caaggtcagg tcgctcggcc 10380
aatccagcgg aatgggttcg acttctttca attcggcgcg ctcggatttc tttgcggtaa 10440
tttcccgata tttgctaatg atttcattct tttccacctc attcagcgag atcgcctttg 10500
cattgctgca cataattttg gttgccgcgt cgatatcaat gaccgctttc cgattcagct 10560
tgtccacttc ttcgctcaga ttcagggcgg tttggcacag cttgatattg gcttccaccc 10620
agctcacatc atagatttcc gccacttttt caaacaggga gagggcttgg cggtagttct 10680
tattcttata cagattgatt gcctggttca aaatgctcat ttattaacct cctactagtg 10740
aattttcgaa ttacttaccg cagtacttga cacccacctg ggaattgttt ttggtgcgtt 10800
tgaattggcg gatggtacgg tagatgctaa agggcaggct gatcagaccg agcggaaaat 10860
tgttcttatt gatgatgagc ttgcccagct gatagctcag gtgtttcttg acccgttcgg 10920
cttcgtgttt atccgcgtac aggaagatgc tcggcaggct cacttggtac tccgaatcat 10980
atttcttctt ccaggtccgc cattcgctga tcaacgcaaa cggaatcgag atcagaccga 11040
ggaacgtctt ggagcggctc accatcaccg cacccaggcg gtagccgata tcttgcttga 11100
tgcgttcggc cgcaccatac agctccggca gttgtttctt ttcgagacgt tgattgtcga 11160
tgaagtactg ttcgagcttt tgctgcacca gatgcagctg attgagcagc aattcttttt 11220
cgcacgacag cttttcgagg cgctgttgtt gcagttcatt tttgttctgt tcctttttca 11280
gcagggactc gaagttctcg atcgcgcact ccagttcctg gacctggatg gttttgtttt 11340
taatgatcag atcatactgg atcagttctt ccttgctatc cgacagctct ttcagaatgg 11400
cttgataggc gttcagctgt ttggacgtgt gcagttcgtt gtccagaatg atctttttgc 11460
tgctctggta cagaccgttc acgatatcga gggtgatctg gcgttgttta atgaacgtct 11520
cccaaataaa ggacggctta tagttttcct tctccagcac ccgcaagggg gtgttggcgt 11580
tcgattgcaa ttcaaagtac agttccttgc aatcgggata gtcgttcagg acgttgaaga 11640
tcaagtactc ctccgtctcg ctttgcttga aaatgatatc cccggtcccg atgtcaatac 11700
cgctgaggga catgatctcc tgatgttctt tttccagcgt aatggaggct tcggcggtct 11760
taaagtcatt cacgctctgc tccagcgagt ggttgatggt attggagaac gacaacccga 11820
atttcagttt cagtttgtgt tgcagttgct ggatgcagtc ctcggcgttg cgcttcacct 11880
gttcgctcga caccagcagg caccgacccc ggttgttgag gaagaagtgc agcaaggcgg 11940
tgttgtatgc cagccagttt ttgatcagat gctccgaggt atagttgctg gagatgttct 12000
ggtccgagaa gtagttcgtc aggatgcttt tggggtggtc gtagatgagg ataaaggtga 12060
tgttctcatc caccgatttc caatattcca acgtgtgaat tgcgttgggg tcgctccaac 12120
cgcacagttt ctggttcagg ttggacagca tcagatccaa tgcgataccg ttccagacgg 12180
tgctcacatg gagcggttca aagtcggcgg aatcggtcac cgtatagatg tccggcgact 12240
ggtacgcctt ccgcagcgtc tgggtgatgt cctggggcga gaggttctca cgtttggacg 12300
ggcacaggga gttcatgccg cgctgatgca ggagttcttc cacgatttgg tagttgctgc 12360
tcggatggcc cacgatcacc aggcggttca tttattaacc tcctttcgaa aatgaacggt 12420
ccgttaaata tagccattcg gattcttcat ctgccagcgc caggcgtcct ccagcatggt 12480
ttcgagttcc cgcttggctt tccagttcag atatttgttg gccttttcgg gggaggacca 12540
gctctccgcg atatcaccgt cacggcggct cacgatttca tacggaatcc gcacgccgga 12600
aatcttttca aaggtggaca ccagttccag caccgaataa cctttacccg tgcccaaatt 12660
aaagacgtgg tagttggtgt tattgtcgcg gaagagatag gacagcgctg cgacgtgccc 12720
ttcggccagg tccatcacat ggatatagtc acggaccccc gtgccgtctt tggtgggata 12780
atcaccaccg aacaccatca gtttttccag tttccccatc gcgacctgca agatgtacgg 12840
caccaagttg gaggggatgt ctgccgggct ttcaccaatc ataccggatt cgtgggcgcc 12900
cgtcggatta aagtagcgca agcagaggaa attcgtgtcg gagtatttct tggcgatgtc 12960
gcggatcatc agctccgaga tgtacttgga cgtaccatac ggattcagcg tgccaccaat 13020
atggcagtct tcggtgacgg gcatgatctt gctttcccca tacaccgtcg ccgacgagct 13080
aaagatgaag ttggcgacgt cgttcttgat ggcgcaattg atgagttgca gggtgccgct 13140
cacgttgttg tcatagtaga agatgggctt gatcaggctt tctgcgaccg atttcgcacc 13200
tgcaaagtgc atgatgcagt cgaatttgtg tttcttcagg atctggttca cttccttctc 13260
gttgttgata ttgagttcgt agaacgtgac tttcttcttt gcgatcagct caatgcgacg 13320
gatgctttcg cagctgctgt tgatgagatt gtcaatgatg acgacattgt agcctttgtt 13380
cagcaggcag agcgacgtgt ggctgccgat gtagcctgca ccgccggtga ccaggatgtt 13440
catttattaa cctcctcggt ccgaattaac ctaggttatg aggtcagcat tgcttcttca 13500
cgcgtttagt agttgttttg ttcggtgata tattcttcaa tgccttcttg cacgtcttca 13560
tggaacgaca cggcgttgtc gtctttaaac acgattgcca catcgcagaa ctctttcaac 13620
gagttcagcg agtgcgacac catgaggaag gagctttcct tatgacgctc cttgaagagt 13680
tgggcacatt tttccttgaa acgggcgtcc cccaccgccg tcacctcgtc cacgatgtag 13740
taatcgaact tgaacgccat gctcaggccg aagccgaggc ggctgcgcat accgctcgaa 13800
taggtcttga tcggcatatc aaaatacttc cccagctccg cgaactcttc cacaaactca 13860
atcttttctt tcagctcctc ctgcttcgcg tacagccggg ccacgaactt cacgttttca 13920
cgcccggtca agctgccctg gaagccgcct gccagaccca ccggccacga gatcgtttta 13980
ttcgtgatga ttttaccgct atccgggcgg tcgatgcccc caatcatgcg caacagcgtg 14040
gatttacccg ccccattgcg cccgatgaac gccacgcttt tgccgctggg gatctcaatg 14100
ttcaggttct tgaagacata gtgacggccc accggggtgc ggtagctttt cgtcaggttt 14160
tcgatcttaa tcatgaggtc aacattgcct cctcacgcgt acggtacagg gccaaaccaa 14220
taaacagggt caccagggtg aacattgcca gataattcag gctgacccct tcgctgatat 14280
aaccgggcat cacggcctcg cggctcagtt cgacgacgtg caccagggga ttccacagca 14340
ggtacgacca atactgcttc ggaatggagt gcagcgggaa catgatgcac gaaataaagt 14400
acagcggctt cagcaagatc ggcaagactt tctgcatttc ggggaacgtc ttgcccacga 14460
ccatgaagat caggcccaca ccgcacgaca ggatgatcag gaggctccag gtgagcacaa 14520
attgcaggaa gttggtaatc tcgaaatatt cgcccgccat ccagatgatc agcatcagga 14580
ggatgtagac cgccacatag atcagcgttt ccaagagggc gcgtgcaatg atcgtgtcga 14640
tcggcttcac gggccggtag ttaaacagcc cctgattggc ttcgatggcg cccacggagc 14700
gattgctgat gctgctgaaa ataaagaacg ggatcaggcc attgagcagg aacaccggga 14760
aggagatatc cggcatggtg cgatgcatga tatagccaaa gatcccgagc agaatcagca 14820
gatgtgcgct cggttccagg atcgcccaca gatagcccag gcgaaacttg ccaaagcgcg 14880
tacggatttc gcggagaaac agtgcttcga ccgtcacttt ctggacttca aaacccgaac 14940
gtgccattta ttaacctcct ggtaccaatc tagattgttt aaacagatcc aatctagatt 15000
gtttaaactt ctgcagaaca cgcggtgtta acgtttctta tacttcttaa ttttgttaaa 15060
gatcatttcg ccgtagtaca ccgcattgac ctgggtcttc accagcaagt agccgcgaaa 15120
tttcttaaac aacttcatgt tcggtttaaa gtcggcttgc cagaactgat gcaaatgccc 15180
ctggtacgtc agacccttga tatcgtacaa ggcgttgccc atgactttca ggggcttgtt 15240
gtggatcaac gcggaaatgc cggccgtgct attgatggtg accaccgctt tggcgtggcg 15300
caacagctcc ggcatgggca gatcgtgcac atagatgaca cgttcatcca aaccgtattc 15360
cttcgacaga cgcttgatca acgggcggta caggcggtgc ccgcgatcca tcgggtgatg 15420
tttgatcacc agataggact ccttgggggc cttgcgggaa aagctgtaca tcacttcgtt 15480
gatgtaatca cgcacatcat tatagttgct atggttgcgg atctggctgt cgttgtacac 15540
ttgcaggacc gccaggtaat agcgctgatc cagctcgttc atcaggcggg ggaggacctt 15600
gcgttgggtg accttataca gctgtttgcg ccagtaggcg cggacccagc agcgcgcttc 15660
ataccacggg ctgaacgatt tgtggtggcg atagcgcgga aattcgtgac gatagtgcca 15720
acccatcagg taataccaca tggcgtggcc gatgcgcttc atggtgctcg gtttcaggtt 15780
ctcgacgtgc ggcgtcggca tatcgggcaa tttgcggtaa aagtccggat cgcggggcaa 15840
gctgctatag gcgttcacac cgccttcttc cacggtgata aattgcggac gcaggtagcc 15900
ttcctcgaag gccagaaaac gaatcccctt cgacttggcc cagcgtttgg cctccttgtg 15960
cagcaggcgg cagtcaccga aacacaaaat cgtgtcaaag tcatactgac gatgcaagtc 16020
ccgcagccaa ccggggaact ccttcggggt ttggtagtac gccaggtatt ggcggtggcg 16080
gcagtagaag cgatcaccgc cattaaagac gacgttgacc gcgttgcgac cgaggctctc 16140
caaccattcc gccacatcgt tgaagaacgg acccatcgga ccttggagca ggaggtactt 16200
tttaccgctc aacagcaccg tcagcgcatt gccgtgcatt tattaacctc ctaacacgcg 16260
gtgttaagcg ttttcggcga gctcttaacc aaagcgcact ttgcagaaca tgatcaactt 16320
gcgatagtag cgaatcacac ggccggcttt cttgcgggtg ataaagatgg gtttgcgggg 16380
cgttttgatc agatattctg ccgcttcctc caccgtgatc ggctgcaacc gcgtcggatg 16440
aatataggtg ggatagacaa tcagggcttg atagatcagg tcggcgatgg tcagccgccg 16500
ctcgcgacgg gggcagtggt gctcatcgac ggtcaggccc cacgaggcgt agaacggcag 16560
gccgtagcag tgcacctgtt taccgtgcag caatgcttca aagccgctga ggctcgtcat 16620
cgtgtgcacc tcgtccgcac gctgaataca ctgaatgata tcggcatcca gtgcctggta 16680
gtctgcgagt tccgcgatct gttccgccgg aatgtcaccc ttacggttgc cgacgagcac 16740
atcggggtgc ggcttgtaga tgatgtaggc gtgcggatta cgttcccgca cggtgcgcag 16800
cagctccaga ttcgacttga tcgacacggt gcccgtctta atcgacgcat cgtcttccac 16860
ctggcccggc accaggatga ctttcttgtc cttcgcttct gccgggaggc tgaaatcggc 16920
ccccaggtta tatttgctca atttgctttc caccagacgt tggcgcaact tttccgcgcg 16980
catctggtgc gcgagggtca gctggctgtg attcagcagg acctccagtt ccgacggacg 17040
ggtggcatcg taatagatac cgcgcttatc caggaccagg ctcaacggcg gcagcagatc 17100
gctccccagg ccggagctgc gcaggaagcc gtcttccatg cgccacagcg gcagggattt 17160
gcgctgtgcc tccgcacgcc attgctgttc gcctttcacg ccccacacga cgcaggcgct 17220
tgctgcggta cagcgacggg aaaaggagag acgattcgtg gccgtttgca ggaagggctt 17280
caggatcgcg cttttccaca gggtcaggcc cggcacccag agataaccat tccgctgttg 17340
caggtgacga cgttgcagct ggagccattg gagcaccgtg aacagggccg acacctcccc 17400
ggtctgcgga tcaatgtagc ggcaatagcg cagataggcc gctgcgaaca gttcctccag 17460
ggtggccgag ccgcgacgcg ccgacagcag cgccgattgg gggtggcggt catcggtgag 17520
gccccaccct gcataccagg gttggccaaa gcaggtcacg ggcttaccgg ccagcagggc 17580
ttcaaaaccg tactgggagg tcacgacgta cacgcgggac acatgacgca gcagggactg 17640
cggcgacacg ttttccgcaa tcaggcgcac gcgctgggtg gcacgcaagt ccgcgaagta 17700
gccggtcttt ttcccttcca ggacatcggg atgcactttg acccagattt ctgcctgcgg 17760
gttttccgcc atcgctgctt ccagcattgc ggcgaactca tgggggcctg cgttgccgta 17820
ggtcacgctc atgtcattga aggtctggtc caccaccagc acgatgttcg tgcgctcgct 17880
ttcatccgcc acgaacgccg gtgccaggtt gtacttgctc atgtcgcccg tcacaatggt 17940
gtgcatcgcc tcgcgcgcct gatccgccag ggccgcgttg ccggccttgt cctgcacgag 18000
tttttccagc gcgctcggtt tcgaggcgtc gtagtaaatg ccgcagtcat ccacgacgag 18060
cgagaggggc ggttcaccgt tcacgcccag gtccagcgag cggacgaaac catcctccaa 18120
gcggatcacc ggcttgcctg cggctttggc gatggccacc ggctttgcgg ccgaggggcg 18180
gtgcccccac accgcgattg catccacttc ctgcgggacc gggcgcagca gcgacagctt 18240
ttggcagggc tgggcgagga atttttccag gtgcggaata cgccaaatgc cggggctata 18300
aatgccaatc atgcgttctc cgcgagctcc tgcgccatca gggcccggac cttctccaag 18360
cacgccgggg tatcgacgcc gggaccggtc gcggcgacct cgaaggtgcg aatgttaatg 18420
cccgcgctca tcagccgcag ttgctccagg gattcggcct gttcgggcat ggactccggc 18480
aactggctgt aattttgcag gacatcccgc cgataggcgt agatcccgac gtgcttcagg 18540
tagcgcgcct tctcggcgtt gcgcgggtac ggaatggggg agcgggagaa atacagggcg 18600
tcctgccgcg tgttcaccac gaccttgacg gtggacggtt cggcggcttc tgccgcgctg 18660
atcgcatgac acagggtcgc caccggcagc gccgggtcgt cccgcatacc ttgcagcagg 18720
gtttcgacgt cacgcgggcg aatcatcggc tcatcccctt gcaggttgat atagatatcc 18780
gcctccacct tatgcatgac ttccaccagg cgatcggtgc cgctctcatg atcgttgcgg 18840
gtcatgatcg ctttgccgcc gaacgcctgg actgcctgct ccacacgcgg gtcgtcggtt 18900
gcgacccaca cctctgccac gcctgccact tgcagggccc gttcgtagac gtgctggatc 18960
atcggtttcc cgacgatatc cagcagcggt ttgcccggca gacggctgct gccgtagcgt 19020
gccgggatca caatcacggc cttcgacatt tattaacctc ctcgagttac agcgacagaa 19080
tcactttcgc gcccaccgcc agttggtaca gaatggtgct gataccgcgc gtcacttcga 19140
tgttcttcga ctcgtatttc ggcaacacca taatttcatc accgggtttc agggaatcga 19200
cgtcttctgc gttcaccgct gcgccgttct gacggatgac gataatacgg gcgttgccgg 19260
acttctgggt cagcccaccg cacttctcga tgtagtcctc ggtcgtcata cctttctgcc 19320
acgacaccgc gttcgggaac agcacttccc cgtggaccat gaccaacgac gtcttttcgg 19380
gaatattgat cacgtcgccg tcctccagga ggacggagtc aatgttgctt tcattgagga 19440
tcacttcgcc cttcggcacg acggtgcggg ctttcgcgac gaagcgggag atcagttggg 19500
cttcctgcat acgcaggctg gcctcttcct tggtgctgct ctgtgcgctg aggctggcct 19560
cttcgagctt ttgcagggac aaattcagca tttctttctg ccgttgcgcg acgctcggcc 19620
gatacaactg cacggcgttc atctgcgaca tggagttcgg gcgcactttt tcgagcacgg 19680
cccgcatggt gctaccgtag ggcagcacca tggcgtgttc cccggaatgt gcgccttcca 19740
cacgcacttg aatggtgccc gcatagcggt cggtggagac aatgagggta tcaccgtttt 19800
gcagcatacg ccccggtgcg gacgagatcg gataatattc cgagcgcttc tggaggccct 19860
gcttccgcat aatcgtgata tgggtcgcac ccggtttggg acgtgcccag gacagtgctt 19920
cggtgaccgg gatgctcgat tcgcgaaatt caaagtcgta ggaattgaac acatcgccct 19980
gcaccgagaa cgtatgctgg cgcggaccca caatgatcgt atcaccgtcc gcaaactggg 20040
acagccccag tttgccgttg agcaggaagt catagaggtt gacgttcgag cgcacacgat 20100
tgccgcgttt cacgacgatg tccacgtagc tgccgcgttc cgggtccaca ccacccgcct 20160
tgatcaggta gttcagcagg ctgtcggagg tgacaccgcc gtacaggccg gggttgcgga 20220
caaagccggt cacatagacc ttgaccggct gcgcctgcaa gagcgacgca tagacgttca 20280
cgttgctctg gtagacttcc ttcaccttgc tcgtcaccag cgcgttcaac tgggagttcg 20340
acacacctgc gactttgacg gggccgacat tcggcaggaa gatgttgccc ttcgggtcca 20400
cctggagtgc gccatcgaag gtgaacgcac cccacaggcg gacctggatg gaatcgccgg 20460
gattcaggat gtagtccgga ttgaaaccca cggttgcccc cgagtctgcg ctcgtaccgt 20520
tgaacagctg cgccccgaac atacggctca tcacgaccgg gggtgcgggg ggcggggtgt 20580
tatcgaagcc gctcatgttc tgggtgtcgc ttttctgccc gttcaggatg ccggtcaacg 20640
gtgcggcacc cgtgaggttc ggatcggcat taatgtcgat ggttgcgctc gcctgtgctg 20700
catggcacgc tgcgatcagc aggatcgact taaacagctt catttattaa cctcctcgag 20760
aagtcgactt agtcacggtg gtcttcaatc accgccagga gcaatttcag ggtgccaaag 20820
agcaggcaac acaccagcag ccaacacgcg atcaaatacg ggatattcgg gaaggagctt 20880
tcctggggca gctgcgggga cgagatcacg ctcaggactt tcagcttacg ggccgcttcg 20940
acacgggtct tttcgatgct ggtgagcgtg agcttgtaca actcggtatt gaactcgacc 21000
ttggatttga tctcctcaaa atccacggcc atgcggttca gtttatcgcc ctggggtgcg 21060
gtaattttcg acttttcttc gtcgatctgt gcctggaggc tctgaattgc attgcgggcg 21120
ctcacgactt ggggcgcatc ctcgcgcagg tacgtgagca ggttgcgcag gtcggcttcc 21180
atctgaattt tctggcccat cagcgtattc accagggtgg atgccgcctg ggcctgtgcc 21240
tgcgggtcca gcacattgtt gttgtcttgg taggacaaca attcggcttt cgatgcatcc 21300
agccgctggc gcgctttttc catttcggtt tccgcaaacg ccaattgatc gcgggcgata 21360
cggtgcgaca tttcattgat gaaccgctcg gattccttga gcacggtctg gttgaatttc 21420
agcgcgaact cgggcgaaaa gccctgggtc tggatgttca gcagcccggt cttgtcgtcg 21480
tagctgacgt tgatgcgatc tttatagtac ttcaggaacc cctcggcggt ttcatccttg 21540
gacagatggt tcaggaagtc caggcccgaa tgggagaacg cttcgcggaa gttcagctgt 21600
ttatccagcg cggccagcat atccgggctg ttgatgtatt ccttcaggta cagtgcgtct 21660
tcggcggacg acgggttgga ggcacccaac agcaggccga agttcaggct gccggagttg 21720
agatcgtcgc tgcgcttgat ggccaccttg ctttccgaca tatagcgggg ctgggagaag 21780
atcgccaagt agatcagcag caccgccatg ggtgccagaa taatgatttt tgccaggtgc 21840
ttctgaatat ctgccaggct gatcgcgctc agacgcgcac gcatccacga gacggcgctt 21900
ttcactttga tcagcattta ttaacctcct gtcgacaaca cgtgttaatc gaaaatgcgc 21960
accaacccgg tcaccttatt tgctttgttg gtcaccagca gggtcgagac gcggtgtttc 22020
tgcatcttct cttctgcttc gatgatcatg gtgtcttcgg gcaaggtcag cggttcgcgg 22080
gtcatcatct gtgcggccgt tgcgctcgtc aggctgtctt ctttctccat aaagcgccgc 22140
agatcgccat cggtgatgat gcctgccagc ccaccttccg catcttcgac catcaccata 22200
ccctggcagc ccgaggtgat gcgctgaatg accgttttga agctggcatc gagctgcact 22260
gccggcacat catgttgcat cacgtcggcg acgcgggtca gcaggcgccg acccaggctg 22320
ccaccggggt ggtagcgtgc aaagtcattg ggcataaact tacgctggtg aatcatcgcg 22380
atggccagcg cgtccccgat cgccatcgtg agcgtcgtgg aggtggtcgg ggcgagattg 22440
ttcgggcacg tttcgttcgc catgtgcagc tccaggaccg catctgcatt tttggccagg 22500
gtgctattcc cgttattggt gattgcgatg atgcgattgc cgaagttctt caggctcggc 22560
accagtttca ggatctcgtc cgtctcaccg ctcgccgaaa tcaagatgag caggtcatac 22620
ggggtgatca tgcccagatc accatggaac gcttccgccg gatgaataaa gaaggagggc 22680
gtcccggtcg aggccaaggt cgccgacatc ttgcggccca catggccgct tttacccatg 22740
ccgctcagga tgacgtgccc tttacaattc atgatgagat tcaggacgcg ctggtactga 22800
ccgctatcca gttgtttgga caggttttgc agtgccgcgc tttgttcggc cagggtctgg 22860
cggacgctcg taatcagata cggatcaatg gtcgaggact ggtcatccgg caagtggcgt 22920
tcgctcattt attaacctcc tcacgtgtta attaagtaat cgatagtgat ttaaatatgc 22980
aagatctagt tacctgcagg attattgttt ctgttgcata aagcctaagg ggtaggcctt 23040
tctagagata gccatttttt gcactcctgt atccgcttct tgcaaggctg gacttatccc 23100
tatcaaaccg gacactgcag gctgacaagc tttcattaca tatgaagagt ttgtagaaac 23160
gcaaaaaggc catccgtcag gatggccttc taagaaggct cgagtggcgc gcctaagtcg 23220
aatttctgcc attcatccgc ttattatact tattcaggcg tagcaccagg cgtttaaggg 23280
caccaataac tgccttaaaa aaattacgcc ccgccctgcc actcatcgca gtactgttgt 23340
aattcattaa gcattctgcc gacatggaag ccatcacaga cggcatgatg aacctgaatc 23400
gccagcggca tcagcacctt gtcgccttgc gtataatatt tgcccatggt gaaaacgggg 23460
gcgaagaagt tgtccatatt ggccacgttt aaatcaaaac tggtgaaact cacccaggga 23520
ttggctgaga cgaaaaacat attctcaata aaccctttag ggaaataggc caggttttca 23580
ccgtaacacg ccacatcttg cgaatatatg tgtagaaact gccggaaatc gtcgtggtat 23640
tcactccaga gcgatgaaaa cgtttcagtt tgctcatgga aaacggtgta acaagggtga 23700
acactatccc atatcaccag ctcaccgtct ttcattgcca tacggaattc cggatgagca 23760
ttcatcaggc gggcaagaat gtgaataaag gccggataaa acttgtgctt atttttcttt 23820
acggtcttta aaaaggccgt aatatccagc tgaacggtct ggttataggt acattgagca 23880
actgactgaa atgcctcaaa atgttcttta cgatgccatt gggatatatc aacggtggta 23940
tatccagtga tttttttctc cattttagct tccttagctc ctgaaaatct cgataactca 24000
aaaaatacgc ccggtagtga tcttatttca ttatggtgaa agttggaacc tcttacgtgc 24060
cgatcaacgt ctcattttcg ccaaaagttg gcccagggct tcccggtatc aacagggaca 24120
ccaggattta tttattctgc gaagtgatct tccgtcacag gtatttattc ggcgcaaagg 24180
gcctcgtgat acgcctattt ttataggtta atgtcatgat aataatggtt tcttagacgt 24240
caggtggcac ttttcgggga aatgtgcgcg cccgcgttcc tgctggcgct gggcctgttt 24300
ctggcgctgg acttcccgct gttccgtcag cagcttttcg cccacggcct tgatgatcgc 24360
ggcggccttg gcctgcatat cccgattcaa cggccccagg gcgtccagaa cgggcttcag 24420
gcgctcccga aggt 24434
<210> 37
<211> 22773
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Sequence
<400> 37
ctcgggccgt ctcttgggct tgatcggcct tcttgcgcat ctcacgcgct cctgcggcgg 60
cctgtagggc aggctcatac ccctgccgaa ccgcttttgt cagccggtcg gccacggctt 120
ccggcgtctc aacgcgcttt gagattccca gcttttcggc caatccctgc ggtgcatagg 180
cgcgtggctc gaccgcttgc gggctgatgg tgacgtggcc cactggtggc cgctccaggg 240
cctcgtagaa cgcctgaatg cgcgtgtgac gtgccttgct gccctcgatg ccccgttgca 300
gccctagatc ggccacagcg gccgcaaacg tggtctggtc gcgggtcatc tgcgctttgt 360
tgccgatgaa ctccttggcc gacagcctgc cgtcctgcgt cagcggcacc acgaacgcgg 420
tcatgtgcgg gctggtttcg tcacggtgga tgctggccgt cacgatgcga tccgccccgt 480
acttgtccgc cagccacttg tgcgccttct cgaagaacgc cgcctgctgt tcttggctgg 540
ccgacttcca ccattccggg ctggccgtca tgacgtactc gaccgccaac acagcgtcct 600
tgcgccgctt ctctggcagc aactcgcgca gtcggcccat cgcttcatcg gtgctgctgg 660
ccgcccagtg ctcgttctct ggcgtcctgc tggcgtcagc gttgggcgtc tcgcgctcgc 720
ggtaggcgtg cttgagactg gccgccacgt tgcccatttt cgccagcttc ttgcatcgca 780
tgatcgcgta tgccgccatg cctgcccctc ccttttggtg tccaaccggc tcgacggggg 840
cagcgcaagg cggtgcctcc ggcgggccac tcaatgcttg agtatactca ctagactttg 900
cttcgcaaag tcgtgaccgc ctacggcggc tgcggcgccc tacgggcttg ctctccgggc 960
ttcgccctgc gcggtcgctg cgctcccttg ccagcccgtg gatatgtgga cgatggccgc 1020
gagcggccac cggctggctc gcttcgctcg gcccgtggac aaccctgctg gacaagctga 1080
tggacaggct gcgcctgccc acgagcttga ccacagggat tgcccaccgg ctacccagcc 1140
ttcgaccaca tacccaccgg ctccaactgc gcggcctgcg gccttgcccc atcaattttt 1200
ttaattttct ctggggaaaa gcctccggcc tgcggcctgc gcgcttcgct tgccggttgg 1260
acaccaagtg gaaggcgggt caaggctcgc gcagcgaccg cgcagcggct tggccttgac 1320
gcgcctggaa cgacccaagc ctatgcgagt gggggcagtc gaaggcgaag cccgcccgcc 1380
tgccccccga gacctgcaga tccacatcct tgaaggccgc agcgacgagc agaaggaaac 1440
cctcattcgg gaagtcagcg aggccatctc gcgctccctg gatgcgccgc tgaccagcgt 1500
gcgagtgatt atcacggaga tggccaaggg ccacttcggc atcggcggcg aactggccag 1560
caaggtcaga cgctgaagtg gagatgccca agggcacttc gggtcgagga acccgacctg 1620
cattgggacg cggccacgga gagcgcgggc aaacgccggc actatagcca gtggagtttg 1680
taaaacgcta tttcagagct tggagagtgt ctaagaaagc cggggcgatg ccaacccatc 1740
ccttcttcgg ctatgcatcg ttcgtaatca agccacttcc tttttgcatt gacgcagggt 1800
gtcggaaggc aactcgccga acgcgctcct atagttttca gcgaagcgtc ccaaatgtaa 1860
gaagccgtag tctagggcta tctcagttat actacgcaca ttggcactgg gatcgttcaa 1920
gcaggcgcgg atgctttcga gcttgcggtt gcggatgtag ttcttcggcg tggtgccggc 1980
atgcttctcg aacaaattgt agagcgagcg tggactcatc atcgccagct ccgctaaccg 2040
ctcaaggctg atattccgtt tgagattctc ctcaatgaat tgaacgactc gctcgaaaga 2100
cgggttacct ttgctgaaaa tttcacggct gacattgctg cccagcattt cgagcagctt 2160
ggaagcgatg atccccgcat agtgctcttg gacccgaggc atcgactttg tatgttccgc 2220
ttcgtcacaa actaacccga gtagattgat aaagccatcg agttgctgga gattgtgtcg 2280
cgcggcgaaa cggataccct ccctcggctt gtgccaattg ttgtcactgc atgcccgatc 2340
aaggaccact gagggcaatt taacgataaa tttctcgcaa tcttctgaat aggtcaggtc 2400
ggcttggtca tccggattga gcagcaatag ttcgcccggc gcaaaatagt gctcctggcc 2460
atggccacgc cacaggcaat ggcctttgag tattatttgc agatgataac aggtctctaa 2520
tccaggcgag attaccctca cgctaccgcc gtagctgatt cgacacaggt cgaggcatcc 2580
gaagattctg tggtgcagcc tgcctgccgg gcgcccgccc ttgggcaggc gaatagagtg 2640
cgtaccgaca tactggttaa cataatcgga gactgcatag ggctcggcgt ggacgaagat 2700
ctgacttttc tcgttcaata agcaaaaatc catagttcac ggttctctta ttttaatgtg 2760
ggctgcttgg tgtgatgtag aaaggcgcca agtcgatgaa aatgcatctc gacgtgatgc 2820
gtatacgggt tacccccatt gccacgttgc gccatccttt ttgcaatcag tgaccacttt 2880
tccaagcaaa aataacgcca agcagaacga agacgttctt tttaagaagc gagaacacca 2940
gaagttcgtg ctgtcggggc atgcggcgac gaattggcgg ataaagggga tctgcaggtc 3000
ccgagcctca cggcggcgag tgcgggggtt ccaagggggc agcgccacct tgggcaaggc 3060
cgaaggccgc gcagtcgatc aacaagcccc ggaggggcca ctttttgccg gagggggagc 3120
cgcgccgaag gcgtggggga accccgcagg ggtgcccttc tttgggcacc aaagaactag 3180
atatagggcg aaatgcgaaa gacttaaaaa tcaacaactt aaaaaagggg ggtacgcaac 3240
agctcattgc ggcacccccc gcaatagctc attgcgtagg ttaaagaaaa tctgtaattg 3300
actgccactt ttacgcaacg cataattgtt gtcgcgctgc cgaaaagttg cagctgattg 3360
cgcatggtgc cgcaaccgtg cggcacccta ccgcatggag ataagcatgg ccacgcagtc 3420
cagagaaatc ggcattcaag ccaagaacaa gcccggtcac tgggtgcaaa cggaacgcaa 3480
agcgcatgag gcgtgggccg ggcttattgc gaggaaaccc acggcggcaa tgctgctgca 3540
tcacctcgtg gcgcagatgg gccaccagaa cgccgtggtg gtcagccaga agacactttc 3600
caagctcatc ggacgttctt tgcggacggt ccaatacgca gtcaaggact tggtggccga 3660
gcgctggatc tccgtcgtga agctcaacgg ccccggcacc gtgtcggcct acgtggtcaa 3720
tgaccgcgtg gcgtggggcc agccccgcga ccagttgcgc ctgtcggtgt tcagtgccgc 3780
cgtggtggtt gatcacgacg accaggacga atcgctgttg gggcatggcg acctgcgccg 3840
catcccgacc ctgtatccgg gcgagcagca actaccgacc ggccccggcg aggagccgcc 3900
cagccagccc ggcattccgg gcatggaacc agacctgcca gccttgaccg aaacggagga 3960
atgggaacgg cgcgggcagc agcgcctgcc gatgcccgat gagccgtgtt ttctggacga 4020
tggcgagccg ttggagccgc cgacacgggt cacgctgccg cgccggtagc acttgggttg 4080
cgcagcaacc cgtaagtgcg ctgttccaga ctatcggctg tagccgcctc gccgccctat 4140
accttgtctg cctccccgcg ttgcgtcgcg gtgcatggag ccgggccacc tcgacctgaa 4200
tggaagccgg cggcacctcg ctaacggatt caccgttttt atcaggctct gggaggcaga 4260
ataaatgatc atatcgtcaa ttattacctc cacggggaga gcctgagcaa actggcctca 4320
ggcatttgag aagcacacgg tcacactgct tccggtagtc aataaaccgg taaaccagca 4380
atagacataa gcggctattt aacgaccctg ccctgaaccg acgaccgggt cgaatttgct 4440
ttcgactatc ggcgcgccag agctcatcgt taatgtcttc gtgcgccgtc agtcggcgca 4500
cgttttttct ctctggtacc gtgtcactga tctagtcaat tactcgaagt atccacaagt 4560
gaagcatact aagtaatgta caagaatcaa aaaaatcggc tacgcaagtc gcgtagccga 4620
atcatttaag gatccttcca ttcaggtcga ggtggcccgg ctccatgcac cgcgacgcaa 4680
cgcggggagg cagacaaggt atagggcggc gcctacaatc catgccaacc cgttccatgt 4740
gctcgccgag gcggcataaa tcgccgtgac gatcagcggt ccagtgatcg aagttaggct 4800
ggtaagagcc gcgagcgatc cttgaagctg tccctgatgg tcgtcatcta cctgcctgga 4860
cagcatggcc tgcaacgcgg gcatcccgat gccgccggaa gcgagaagaa tcataatggg 4920
gaaggccatc cagcctcgcg tcgcgaacgc cagcaagacg tagcccagcg cgtcggccgc 4980
catgccggcg ataatggcct gcttctcgcc gaaacgtttg gtggcgggac cagtgacgaa 5040
ggcttgagcg agggcgtgca agattccgaa taccgcaagc gacaggccga tcatcgtcgc 5100
gctccagcga aagcggtcct cgccgaaaat gacccagagc gctgccggca cctgtcctac 5160
gagttgcatg ataaagaaga cagtcataag tgcggcgacg atagtcatgc cccgcgccca 5220
ccggaaggag ctgactgggt tgaaggctct caagggcatc ggtcgacgct ctcccttatg 5280
cgactcctgc attaggaagc agcccagtag taggttgagg ccgttgagca ccgccgccgc 5340
aaggaatggt gcatgcaagg agatggcgcc caacagtccc ccggccacgg ggcctgccac 5400
catacccacg ccgaaacaag cgctcatgag cccgaagtgg cgagcccgat cttccccatc 5460
ggtgatgtcg gcgatatagg cgccagcaac cgcacctgtg gcgccggtga tgccggccac 5520
gatgcgtccg gcgtacaaga tccacaggac gggtgtggtc gccatgatcg cgtagtcgat 5580
agtggctcca agtagcgaag cgagcaggac tgggcggcgg ccaaagcggt cggacagtgc 5640
tccgagaacg ggtgcgcata gaaattgcat caacgcatat agcgctagca gcacgccata 5700
gtgactggcg atgctgtcgg aatggacgat atcccgcaag aggcccggca gtaccggcat 5760
aaccaagcct atgcctacag catccagggt gacggtgccg aggatgacga tgagcgcatt 5820
gttagatttc atacacggtg cctgactgcg ttagcaattt aactgtgata aactaccgca 5880
ttaaagccga gcgatgataa gctgtcaaac atgagatcca atctagattg tttaaacttc 5940
tgcagaacac gcggtgttaa cgtttcttat acttcttaat tttgttaaag atcatttcgc 6000
cgtagtacac cgcattgacc tgggtcttca ccagcaagta gccgcgaaat ttcttaaaca 6060
acttcatgtt cggtttaaag tcggcttgcc agaactgatg caaatgcccc tggtacgtca 6120
gacccttgat atcgtacaag gcgttgccca tgactttcag gggcttgttg tggatcaacg 6180
cggaaatgcc ggccgtgcta ttgatggtga ccaccgcttt ggcgtggcgc aacagctccg 6240
gcatgggcag atcgtgcaca tagatgacac gttcatccaa accgtattcc ttcgacagac 6300
gcttgatcaa cgggcggtac aggcggtgcc cgcgatccat cgggtgatgt ttgatcacca 6360
gataggactc cttgggggcc ttgcgggaaa agctgtacat cacttcgttg atgtaatcac 6420
gcacatcatt atagttgcta tggttgcgga tctggctgtc gttgtacact tgcaggaccg 6480
ccaggtaata gcgctgatcc agctcgttca tcaggcgggg gaggaccttg cgttgggtga 6540
ccttatacag ctgtttgcgc cagtaggcgc ggacccagca gcgcgcttca taccacgggc 6600
tgaacgattt gtggtggcga tagcgcggaa attcgtgacg atagtgccaa cccatcaggt 6660
aataccacat ggcgtggccg atgcgcttca tggtgctcgg tttcaggttc tcgacgtgcg 6720
gcgtcggcat atcgggcaat ttgcggtaaa agtccggatc gcggggcaag ctgctatagg 6780
cgttcacacc gccttcttcc acggtgataa attgcggacg caggtagcct tcctcgaagg 6840
ccagaaaacg aatccccttc gacttggccc agcgtttggc ctccttgtgc agcaggcggc 6900
agtcaccgaa acacaaaatc gtgtcaaagt catactgacg atgcaagtcc cgcagccaac 6960
cggggaactc cttcggggtt tggtagtacg ccaggtattg gcggtggcgg cagtagaagc 7020
gatcaccgcc attaaagacg acgttgaccg cgttgcgacc gaggctctcc aaccattccg 7080
ccacatcgtt gaagaacgga cccatcggac cttggagcag gaggtacttt ttaccgctca 7140
acagcaccgt cagcgcattg ccgtgcattt attaacctcc taacacgcgg tgttaagcgt 7200
tttcggcgag ctcttaacca aagcgcactt tgcagaacat gatcaacttg cgatagtagc 7260
gaatcacacg gccggctttc ttgcgggtga taaagatggg tttgcggggc gttttgatca 7320
gatattctgc cgcttcctcc accgtgatcg gctgcaaccg cgtcggatga atataggtgg 7380
gatagacaat cagggcttga tagatcaggt cggcgatggt cagccgccgc tcgcgacggg 7440
ggcagtggtg ctcatcgacg gtcaggcccc acgaggcgta gaacggcagg ccgtagcagt 7500
gcacctgttt accgtgcagc aatgcttcaa agccgctgag gctcgtcatc gtgtgcacct 7560
cgtccgcacg ctgaatacac tgaatgatat cggcatccag tgcctggtag tctgcgagtt 7620
ccgcgatctg ttccgccgga atgtcaccct tacggttgcc gacgagcaca tcggggtgcg 7680
gcttgtagat gatgtaggcg tgcggattac gttcccgcac ggtgcgcagc agctccagat 7740
tcgacttgat cgacacggtg cccgtcttaa tcgacgcatc gtcttccacc tggcccggca 7800
ccaggatgac tttcttgtcc ttcgcttctg ccgggaggct gaaatcggcc cccaggttat 7860
atttgctcaa tttgctttcc accagacgtt ggcgcaactt ttccgcgcgc atctggtgcg 7920
cgagggtcag ctggctgtga ttcagcagga cctccagttc cgacggacgg gtggcatcgt 7980
aatagatacc gcgcttatcc aggaccaggc tcaacggcgg cagcagatcg ctccccaggc 8040
cggagctgcg caggaagccg tcttccatgc gccacagcgg cagggatttg cgctgtgcct 8100
ccgcacgcca ttgctgttcg cctttcacgc cccacacgac gcaggcgctt gctgcggtac 8160
agcgacggga aaaggagaga cgattcgtgg ccgtttgcag gaagggcttc aggatcgcgc 8220
ttttccacag ggtcaggccc ggcacccaga gataaccatt ccgctgttgc aggtgacgac 8280
gttgcagctg gagccattgg agcaccgtga acagggccga cacctccccg gtctgcggat 8340
caatgtagcg gcaatagcgc agataggccg ctgcgaacag ttcctccagg gtggccgagc 8400
cgcgacgcgc cgacagcagc gccgattggg ggtggcggtc atcggtgagg ccccaccctg 8460
cataccaggg ttggccaaag caggtcacgg gcttaccggc cagcagggct tcaaaaccgt 8520
actgggaggt cacgacgtac acgcgggaca catgacgcag cagggactgc ggcgacacgt 8580
tttccgcaat caggcgcacg cgctgggtgg cacgcaagtc cgcgaagtag ccggtctttt 8640
tcccttccag gacatcggga tgcactttga cccagatttc tgcctgcggg ttttccgcca 8700
tcgctgcttc cagcattgcg gcgaactcat gggggcctgc gttgccgtag gtcacgctca 8760
tgtcattgaa ggtctggtcc accaccagca cgatgttcgt gcgctcgctt tcatccgcca 8820
cgaacgccgg tgccaggttg tacttgctca tgtcgcccgt cacaatggtg tgcatcgcct 8880
cgcgcgcctg atccgccagg gccgcgttgc cggccttgtc ctgcacgagt ttttccagcg 8940
cgctcggttt cgaggcgtcg tagtaaatgc cgcagtcatc cacgacgagc gagaggggcg 9000
gttcaccgtt cacgcccagg tccagcgagc ggacgaaacc atcctccaag cggatcaccg 9060
gcttgcctgc ggctttggcg atggccaccg gctttgcggc cgaggggcgg tgcccccaca 9120
ccgcgattgc atccacttcc tgcgggaccg ggcgcagcag cgacagcttt tggcagggct 9180
gggcgaggaa tttttccagg tgcggaatac gccaaatgcc ggggctataa atgccaatca 9240
tgcgttctcc gcgagctcct gcgccatcag ggcccggacc ttctccaagc acgccggggt 9300
atcgacgccg ggaccggtcg cggcgacctc gaaggtgcga atgttaatgc ccgcgctcat 9360
cagccgcagt tgctccaggg attcggcctg ttcgggcatg gactccggca actggctgta 9420
attttgcagg acatcccgcc gataggcgta gatcccgacg tgcttcaggt agcgcgcctt 9480
ctcggcgttg cgcgggtacg gaatggggga gcgggagaaa tacagggcgt cctgccgcgt 9540
gttcaccacg accttgacgg tggacggttc ggcggcttct gccgcgctga tcgcatgaca 9600
cagggtcgcc accggcagcg ccgggtcgtc ccgcatacct tgcagcaggg tttcgacgtc 9660
acgcgggcga atcatcggct catccccttg caggttgata tagatatccg cctccacctt 9720
atgcatgact tccaccaggc gatcggtgcc gctctcatga tcgttgcggg tcatgatcgc 9780
tttgccgccg aacgcctgga ctgcctgctc cacacgcggg tcgtcggttg cgacccacac 9840
ctctgccacg cctgccactt gcagggcccg ttcgtagacg tgctggatca tcggtttccc 9900
gacgatatcc agcagcggtt tgcccggcag acggctgctg ccgtagcgtg ccgggatcac 9960
aatcacggcc ttcgacattt attaacctcc tcgagttaca gcgacagaat cactttcgcg 10020
cccaccgcca gttggtacag aatggtgctg ataccgcgcg tcacttcgat gttcttcgac 10080
tcgtatttcg gcaacaccat aatttcatca ccgggtttca gggaatcgac gtcttctgcg 10140
ttcaccgctg cgccgttctg acggatgacg ataatacggg cgttgccgga cttctgggtc 10200
agcccaccgc acttctcgat gtagtcctcg gtcgtcatac ctttctgcca cgacaccgcg 10260
ttcgggaaca gcacttcccc gtggaccatg accaacgacg tcttttcggg aatattgatc 10320
acgtcgccgt cctccaggag gacggagtca atgttgcttt cattgaggat cacttcgccc 10380
ttcggcacga cggtgcgggc tttcgcgacg aagcgggaga tcagttgggc ttcctgcata 10440
cgcaggctgg cctcttcctt ggtgctgctc tgtgcgctga ggctggcctc ttcgagcttt 10500
tgcagggaca aattcagcat ttctttctgc cgttgcgcga cgctcggccg atacaactgc 10560
acggcgttca tctgcgacat ggagttcggg cgcacttttt cgagcacggc ccgcatggtg 10620
ctaccgtagg gcagcaccat ggcgtgttcc ccggaatgtg cgccttccac acgcacttga 10680
atggtgcccg catagcggtc ggtggagaca atgagggtat caccgttttg cagcatacgc 10740
cccggtgcgg acgagatcgg ataatattcc gagcgcttct ggaggccctg cttccgcata 10800
atcgtgatat gggtcgcacc cggtttggga cgtgcccagg acagtgcttc ggtgaccggg 10860
atgctcgatt cgcgaaattc aaagtcgtag gaattgaaca catcgccctg caccgagaac 10920
gtatgctggc gcggacccac aatgatcgta tcaccgtccg caaactggga cagccccagt 10980
ttgccgttga gcaggaagtc atagaggttg acgttcgagc gcacacgatt gccgcgtttc 11040
acgacgatgt ccacgtagct gccgcgttcc gggtccacac cacccgcctt gatcaggtag 11100
ttcagcaggc tgtcggaggt gacaccgccg tacaggccgg ggttgcggac aaagccggtc 11160
acatagacct tgaccggctg cgcctgcaag agcgacgcat agacgttcac gttgctctgg 11220
tagacttcct tcaccttgct cgtcaccagc gcgttcaact gggagttcga cacacctgcg 11280
actttgacgg ggccgacatt cggcaggaag atgttgccct tcgggtccac ctggagtgcg 11340
ccatcgaagg tgaacgcacc ccacaggcgg acctggatgg aatcgccggg attcaggatg 11400
tagtccggat tgaaacccac ggttgccccc gagtctgcgc tcgtaccgtt gaacagctgc 11460
gccccgaaca tacggctcat cacgaccggg ggtgcggggg gcggggtgtt atcgaagccg 11520
ctcatgttct gggtgtcgct tttctgcccg ttcaggatgc cggtcaacgg tgcggcaccc 11580
gtgaggttcg gatcggcatt aatgtcgatg gttgcgctcg cctgtgctgc atggcacgct 11640
gcgatcagca ggatcgactt aaacagcttc atttattaac ctcctcgaga agtcgactta 11700
gtcacggtgg tcttcaatca ccgccaggag caatttcagg gtgccaaaga gcaggcaaca 11760
caccagcagc caacacgcga tcaaatacgg gatattcggg aaggagcttt cctggggcag 11820
ctgcggggac gagatcacgc tcaggacttt cagcttacgg gccgcttcga cacgggtctt 11880
ttcgatgctg gtgagcgtga gcttgtacaa ctcggtattg aactcgacct tggatttgat 11940
ctcctcaaaa tccacggcca tgcggttcag tttatcgccc tggggtgcgg taattttcga 12000
cttttcttcg tcgatctgtg cctggaggct ctgaattgca ttgcgggcgc tcacgacttg 12060
gggcgcatcc tcgcgcaggt acgtgagcag gttgcgcagg tcggcttcca tctgaatttt 12120
ctggcccatc agcgtattca ccagggtgga tgccgcctgg gcctgtgcct gcgggtccag 12180
cacattgttg ttgtcttggt aggacaacaa ttcggctttc gatgcatcca gccgctggcg 12240
cgctttttcc atttcggttt ccgcaaacgc caattgatcg cgggcgatac ggtgcgacat 12300
ttcattgatg aaccgctcgg attccttgag cacggtctgg ttgaatttca gcgcgaactc 12360
gggcgaaaag ccctgggtct ggatgttcag cagcccggtc ttgtcgtcgt agctgacgtt 12420
gatgcgatct ttatagtact tcaggaaccc ctcggcggtt tcatccttgg acagatggtt 12480
caggaagtcc aggcccgaat gggagaacgc ttcgcggaag ttcagctgtt tatccagcgc 12540
ggccagcata tccgggctgt tgatgtattc cttcaggtac agtgcgtctt cggcggacga 12600
cgggttggag gcacccaaca gcaggccgaa gttcaggctg ccggagttga gatcgtcgct 12660
gcgcttgatg gccaccttgc tttccgacat atagcggggc tgggagaaga tcgccaagta 12720
gatcagcagc accgccatgg gtgccagaat aatgattttt gccaggtgct tctgaatatc 12780
tgccaggctg atcgcgctca gacgcgcacg catccacgag acggcgcttt tcactttgat 12840
cagcatttat taacctcctg tcgacaacac gtgttaatcg aaaatgcgca ccaacccggt 12900
caccttattt gctttgttgg tcaccagcag ggtcgagacg cggtgtttct gcatcttctc 12960
ttctgcttcg atgatcatgg tgtcttcggg caaggtcagc ggttcgcggg tcatcatctg 13020
tgcggccgtt gcgctcgtca ggctgtcttc tttctccata aagcgccgca gatcgccatc 13080
ggtgatgatg cctgccagcc caccttccgc atcttcgacc atcaccatac cctggcagcc 13140
cgaggtgatg cgctgaatga ccgttttgaa gctggcatcg agctgcactg ccggcacatc 13200
atgttgcatc acgtcggcga cgcgggtcag caggcgccga cccaggctgc caccggggtg 13260
gtagcgtgca aagtcattgg gcataaactt acgctggtga atcatcgcga tggccagcgc 13320
gtccccgatc gccatcgtga gcgtcgtgga ggtggtcggg gcgagattgt tcgggcacgt 13380
ttcgttcgcc atgtgcagct ccaggaccgc atctgcattt ttggccaggg tgctattccc 13440
gttattggtg attgcgatga tgcgattgcc gaagttcttc aggctcggca ccagtttcag 13500
gatctcgtcc gtctcaccgc tcgccgaaat caagatgagc aggtcatacg gggtgatcat 13560
gcccagatca ccatggaacg cttccgccgg atgaataaag aaggagggcg tcccggtcga 13620
ggccaaggtc gccgacatct tgcggcccac atggccgctt ttacccatgc cgctcaggat 13680
gacgtgccct ttacaattca tgatgagatt caggacgcgc tggtactgac cgctatccag 13740
ttgtttggac aggttttgca gtgccgcgct ttgttcggcc agggtctggc ggacgctcgt 13800
aatcagatac ggatcaatgg tcgaggactg gtcatccggc aagtggcgtt cgctcattta 13860
ttaacctcct cacgtgttaa ttaagtaatc gatagtgatt taaatatgca agatccgata 13920
aatcgattga tagatttaaa taagaactgc agaagctagc ttagatgctc gtgaaattga 13980
cgtgggcgct ttgcagggcc gtcttaatgg cgttggtgtc cacgaggatc gagtcgggtg 14040
cggaaaacgg acggttcttg ttggtgaaat cgctgttacc aatgtacagc gattccttgt 14100
tacgcagcgc ctggatgtgc cagcgggacc acgaatccca atacttctgg cgatccggcg 14160
agataccttg gctggtgtag ccggtcgtcg ggctgttcat caacgagtcg gtgcggtgcg 14220
agcccagcgt cagcggcaac ttgatccgat gcaccgtgga atcgccgaag atcagcttca 14280
gacgcgcgat aaattcgcta tccgcacccg ttttcacaca atcccagaca ccggccttct 14340
gcaagacgtc ggcacggcga aacaggagcg acgacggatt cagacgcttc aaggggtaca 14400
ctgcgcgggc atagaaaata ccgttgtctt gcaggcgcac ccagtccgag atggagcaga 14460
tgagcttcgg attgagcaac aagggggaga tttggcggaa cagcttttcc ggatggctcc 14520
agtcatccga atcgtggcag gtgacgaact cgcccttcgc ttggatcaag ccgatacgct 14580
tcgcggcata ggtgccgaca ttctgcggca ggctaatgat cttgatgcgc gtgtctttga 14640
gggcgagccg ctggagacga aacagggtgt catcggtgct cgcgtcatcc acaatgatca 14700
gctcgaagga acggtaggtc tgattgagga gcgaaatcac cgcattttcc acgcggcgac 14760
ccgtattata ggtggtcatc aggatggaga tcaacggccc cgtctgggcc gggtacggga 14820
tgctggtgat gatgttgcac ggggagagcg gggagctgtt gtccgtcaag gccacggggc 14880
tgaggccgaa gtatttatag tattcattca gccgattcag gctaatttcg gcggtttcgc 14940
ggaaggcgtt attttgcagc agcaggatat ccgggctata gacgatatcg gatgcgtcga 15000
tctgggcgag ggtcgagatg gccttttggg tcaggccgat ccggagttgc agtgcggtat 15060
acaggtccag cgggcagttg tccacgttgt ccaacaggct caggctaaag gtcggcgagt 15120
aggacgccag ggttttcgcc agttccactt tctgatgggt atcggtgaac tcgtccttga 15180
actccatcag cagctcgggc gtcaggctga tgtcgccgca ggcgattttt gcgatcttga 15240
ttgccagttt gcagcgccaa tcggacgggg tatccgtcaa gttatgcagc gaccagtaca 15300
tattcagacg atacatcgcg aggatgcgtt tcgactgcca gaaccggcaa tcatcctgga 15360
tggccgcgag cgcgtggacg tagcggctct ttttgagcag ccacaagaat ttgagattat 15420
tgaacattta ttaacctcct gctagcaact taagttacga atcgacgccg aacaggtcgc 15480
gggtgtagac tttctccgag acatcttcca gttcgctggt gcggcgattc gccacaatga 15540
catcgacgcg ctccttaaag gaattgatgt cgcgctcgac gtaggaaccg aagaagtagg 15600
gttctttcag gaccggctcg tacaccacaa tctcgatacc cttggccttc aaacgtttca 15660
tgaccccctg gatgctgctg gcccggaaat tgtcgctacc cgccttcatg atcaggcgat 15720
agataccgac cactttgggc ttacgggaca ggatgtcctc ggccacgaag tccttacggg 15780
tcgtattcgc atccacgatg gcctggatca ggttttgcgg gacgtcgcga taattggcca 15840
acagctgctt cgtatccttc ggcagacagt aaccgccgta gccgaaggac gggttgttgt 15900
aatgttgacc aatgcgcgga tcgagggaga cgccttcgat gatttgtttg gtatccaggc 15960
cgtgcacgct cgcgtaggtg tccagctcgt taaagtacgc gatacgcatc gccagatacg 16020
tgttcgcgaa cagtttgatg gcttctgcct cgggcgaatc cgtcagcagg atcggaatat 16080
cctttttgat ggcaccttcc gacaggagtt cggcgaactt ccgtgcgcgt tccgacgatt 16140
cgcccacgac aatgcggctc ggatagagat tatcatacag ggctttgcct tcgcgcagga 16200
actccgggga aaagatgata ttattcgtgt tcagatcgcg cttcaggcgt tcggtgaacc 16260
cgacggggac ggtggatttg ataatgatgg tcgcgttcgg gttaatggac agcacgtcac 16320
acgcgacgct ttcgacgctc agggtatcaa agttgttatt aatcggatca tagttcgtcg 16380
gggtggcgat gatcacgtag tctgcatcgc gatatgcctc gtatttttcc gtcgtcgcgt 16440
agaggttcag cttacgattg gagagaaact tctggatttc cgggtcgcaa atcggcgaga 16500
ttttcttgtt aatgagctgg accttcttcg ggtcgatgtc cagggcgatg atgtcgtgtt 16560
tttgggagag gaggatcgca atgctgatac ccacatagcc gacgccggcc acggcaattt 16620
tcatttatta acctccttaa gtgaattcaa actagtttac aagtcgtttt cgatcttctc 16680
ccaggtatat ttgcgacatt cattcaagtt ggtcagcggc gagtatttgt actttttgat 16740
accgaggcgc gacaggcttt cgttcaccac cttgaaatgg ttttcctttt ggatgtccag 16800
tttcttgatc gacgtgttct cgccgtgcag gacacggttg tagcaaatct tattgatatg 16860
cttaaacggg ccgacttcgc tgagtttcaa atacatatcg taatccaccg cattgctgat 16920
gctctcgttg aagccttcgg tgaggttcca tgcacgcgcc gtgaacatac ggaagtggtg 16980
gcagatcatc gcgctcgtga gcttttcgcg gctgtaaatc ggccagttgt agccattgct 17040
aatcaagtta ccttcacgat caatattgcg attggtggtg tacacgcagg cgaggctcag 17100
gtctttgcga aattcatcca gacacagttc cacggcatcg ggctccagga aatcatcgga 17160
atccagctgc ccgatgtaga aaccccggca caggcggact gcggtattcg aggcggagcc 17220
gatgcctttg tttttctggc tgatgaaacg gacgcgcggg tggtttgcgt aatgttcttg 17280
caggatgcgc agcgtatcat cggtgctccc gtcatcgcag atgcagacct ccagatcggt 17340
gatcgtttgg ttcagtgccg attcgacgca gcgcacgata tatttgctgc aattatacgc 17400
ggggatgtag atgctcacca ggggcacacg tttcagggtg gcgctctcga ttttctcctt 17460
cttgcgataa aagtagggca ccttctgctg caacagctgg acggtaatgt ttttacctgc 17520
cgcgcgatcg gtttcgttct ccttaccggg cggttcctga tgatatgcca tcgcgccttc 17580
cacgctacgg aaataacaac cctcgcggta cagccgatag ccgaactcat tatcctcacc 17640
gccccaatgc gtgaactctt cgtcaaacca acccgcgcga aacagccact tctttgcaaa 17700
cgccacattg ccaccgctaa agaaccggaa cggggtgttg cacaggcgca gattgtcggt 17760
attcttgaaa tgttcgatgc gccaatcgac ggatttgttc tgctcgacct tgcctgcgac 17820
ctgattattg gtaataatct ccgggatttc attgatcagg cttttctggg acaaaaagtc 17880
cagataggta tgcttcgacg tgtcgatgta tttacgcggg ccaatcagtg ccacgttatc 17940
atccacggcc aggagttcca tataggactg cacccacaac gggttcggcg ccatatcgca 18000
gtccaagatc gccacgtagt tgtatttcgc tgcccgcagg cccaggttcc gcacggcgca 18060
cagctggtag ccgtagtctt tctggcggac gtatttgatg ttcagcaacg actcgaactc 18120
gcggacgatc tcttcgatgt tttccttgga accgtcatcc gcgacgatga cctcatagtc 18180
ataaatcgtt ttctgattgc agaggcaggc cagggtgatc gccaggattt tggcgcgatt 18240
gtacgtcgga atcacgatgg acaggccgtc gatgatcagt tgcttgcgcg gataatcatc 18300
cagttcttta cgtttccctg cccagacgta gtcgttcgtg ctttccggca gcggcggcaa 18360
ggtcaggtcg ctcggccaat ccagcggaat gggttcgact tctttcaatt cggcgcgctc 18420
ggatttcttt gcggtaattt cccgatattt gctaatgatt tcattctttt ccacctcatt 18480
cagcgagatc gcctttgcat tgctgcacat aattttggtt gccgcgtcga tatcaatgac 18540
cgctttccga ttcagcttgt ccacttcttc gctcagattc agggcggttt ggcacagctt 18600
gatattggct tccacccagc tcacatcata gatttccgcc actttttcaa acagggagag 18660
ggcttggcgg tagttcttat tcttatacag attgattgcc tggttcaaaa tgctcattta 18720
ttaacctcct actagtgaat tttcgaaaat gaacggtccg ttaaatatag ccattcggat 18780
tcttcatctg ccagcgccag gcgtcctcca gcatggtttc gagttcccgc ttggctttcc 18840
agttcagata tttgttggcc ttttcggggg aggaccagct ctccgcgata tcaccgtcac 18900
ggcggctcac gatttcatac ggaatccgca cgccggaaat cttttcaaag gtggacacca 18960
gttccagcac cgaataacct ttacccgtgc ccaaattaaa gacgtggtag ttggtgttat 19020
tgtcgcggaa gagataggac agcgctgcga cgtgcccttc ggccaggtcc atcacatgga 19080
tatagtcacg gacccccgtg ccgtctttgg tgggataatc accaccgaac accatcagtt 19140
tttccagttt ccccatcgcg acctgcaaga tgtacggcac caagttggag gggatgtctg 19200
ccgggctttc accaatcata ccggattcgt gggcgcccgt cggattaaag tagcgcaagc 19260
agaggaaatt cgtgtcggag tatttcttgg cgatgtcgcg gatcatcagc tccgagatgt 19320
acttggacgt accatacgga ttcagcgtgc caccaatatg gcagtcttcg gtgacgggca 19380
tgatcttgct ttccccatac accgtcgccg acgagctaaa gatgaagttg gcgacgtcgt 19440
tcttgatggc gcaattgatg agttgcaggg tgccgctcac gttgttgtca tagtagaaga 19500
tgggcttgat caggctttct gcgaccgatt tcgcacctgc aaagtgcatg atgcagtcga 19560
atttgtgttt cttcaggatc tggttcactt ccttctcgtt gttgatattg agttcgtaga 19620
acgtgacttt cttctttgcg atcagctcaa tgcgacggat gctttcgcag ctgctgttga 19680
tgagattgtc aatgatgacg acattgtagc ctttgttcag caggcagagc gacgtgtggc 19740
tgccgatgta gcctgcaccg ccggtgacca ggatgttcat ttattaacct cctcggtccg 19800
aattaaccta ggttatgagg tcagcattgc ttcttcacgc gtttagtagt tgttttgttc 19860
ggtgatatat tcttcaatgc cttcttgcac gtcttcatgg aacgacacgg cgttgtcgtc 19920
tttaaacacg attgccacat cgcagaactc tttcaacgag ttcagcgagt gcgacaccat 19980
gaggaaggag ctttccttat gacgctcctt gaagagttgg gcacattttt ccttgaaacg 20040
ggcgtccccc accgccgtca cctcgtccac gatgtagtaa tcgaacttga acgccatgct 20100
caggccgaag ccgaggcggc tgcgcatacc gctcgaatag gtcttgatcg gcatatcaaa 20160
atacttcccc agctccgcga actcttccac aaactcaatc ttttctttca gctcctcctg 20220
cttcgcgtac agccgggcca cgaacttcac gttttcacgc ccggtcaagc tgccctggaa 20280
gccgcctgcc agacccaccg gccacgagat cgttttattc gtgatgattt taccgctatc 20340
cgggcggtcg atgcccccaa tcatgcgcaa cagcgtggat ttacccgccc cattgcgccc 20400
gatgaacgcc acgcttttgc cgctggggat ctcaatgttc aggttcttga agacatagtg 20460
acggcccacc ggggtgcggt agcttttcgt caggttttcg atcttaatca tgaggtcaac 20520
attgcctcct cacgcgtacg gtacagggcc aaaccaataa acagggtcac cagggtgaac 20580
attgccagat aattcaggct gaccccttcg ctgatataac cgggcatcac ggcctcgcgg 20640
ctcagttcga cgacgtgcac caggggattc cacagcaggt acgaccaata ctgcttcgga 20700
atggagtgca gcgggaacat gatgcacgaa ataaagtaca gcggcttcag caagatcggc 20760
aagactttct gcatttcggg gaacgtcttg cccacgacca tgaagatcag gcccacaccg 20820
cacgacagga tgatcaggag gctccaggtg agcacaaatt gcaggaagtt ggtaatctcg 20880
aaatattcgc ccgccatcca gatgatcagc atcaggagga tgtagaccgc cacatagatc 20940
agcgtttcca agagggcgcg tgcaatgatc gtgtcgatcg gcttcacggg ccggtagtta 21000
aacagcccct gattggcttc gatggcgccc acggagcgat tgctgatgct gctgaaaata 21060
aagaacggga tcaggccatt gagcaggaac accgggaagg agatatccgg catggtgcga 21120
tgcatgatat agccaaagat cccgagcaga atcagcagat gtgcgctcgg ttccaggatc 21180
gcccacagat agcccaggcg aaacttgcca aagcgcgtac ggatttcgcg gagaaacagt 21240
gcttcgaccg tcactttctg gacttcaaaa cccgaacgtg ccatttatta acctcctggt 21300
accaatctag attgtttaaa cagatctgtt acctgcagga ttattgtttc tgttgcataa 21360
agcctaaggg gtaggccttt ctagagatag ccattttttg cactcctgta tccgcttctt 21420
gcaaggctgg acttatccct atcaaaccgg acactgcagg ctgacaagct ttcattacat 21480
atgaagagtt tgtagaaacg caaaaaggcc atccgtcagg atggccttct aagaaggctc 21540
gagtggcgcg cctaagtcga atttctgcca ttcatccgct tattatactt attcaggcgt 21600
agcaccaggc gtttaagggc accaataact gccttaaaaa aattacgccc cgccctgcca 21660
ctcatcgcag tactgttgta attcattaag cattctgccg acatggaagc catcacagac 21720
ggcatgatga acctgaatcg ccagcggcat cagcaccttg tcgccttgcg tataatattt 21780
gcccatggtg aaaacggggg cgaagaagtt gtccatattg gccacgttta aatcaaaact 21840
ggtgaaactc acccagggat tggctgagac gaaaaacata ttctcaataa accctttagg 21900
gaaataggcc aggttttcac cgtaacacgc cacatcttgc gaatatatgt gtagaaactg 21960
ccggaaatcg tcgtggtatt cactccagag cgatgaaaac gtttcagttt gctcatggaa 22020
aacggtgtaa caagggtgaa cactatccca tatcaccagc tcaccgtctt tcattgccat 22080
acggaattcc ggatgagcat tcatcaggcg ggcaagaatg tgaataaagg ccggataaaa 22140
cttgtgctta tttttcttta cggtctttaa aaaggccgta atatccagct gaacggtctg 22200
gttataggta cattgagcaa ctgactgaaa tgcctcaaaa tgttctttac gatgccattg 22260
ggatatatca acggtggtat atccagtgat ttttttctcc attttagctt ccttagctcc 22320
tgaaaatctc gataactcaa aaaatacgcc cggtagtgat cttatttcat tatggtgaaa 22380
gttggaacct cttacgtgcc gatcaacgtc tcattttcgc caaaagttgg cccagggctt 22440
cccggtatca acagggacac caggatttat ttattctgcg aagtgatctt ccgtcacagg 22500
tatttattcg gcgcaaaggg cctcgtgata cgcctatttt tataggttaa tgtcatgata 22560
ataatggttt cttagacgtc aggtggcact tttcggggaa atgtgcgcgc ccgcgttcct 22620
gctggcgctg ggcctgtttc tggcgctgga cttcccgctg ttccgtcagc agcttttcgc 22680
ccacggcctt gatgatcgcg gcggccttgg cctgcatatc ccgattcaac ggccccaggg 22740
cgtccagaac gggcttcagg cgctcccgaa ggt 22773
<210> 38
<211> 22947
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Sequence
<400> 38
ctcgggccgt ctcttgggct tgatcggcct tcttgcgcat ctcacgcgct cctgcggcgg 60
cctgtagggc aggctcatac ccctgccgaa ccgcttttgt cagccggtcg gccacggctt 120
ccggcgtctc aacgcgcttt gagattccca gcttttcggc caatccctgc ggtgcatagg 180
cgcgtggctc gaccgcttgc gggctgatgg tgacgtggcc cactggtggc cgctccaggg 240
cctcgtagaa cgcctgaatg cgcgtgtgac gtgccttgct gccctcgatg ccccgttgca 300
gccctagatc ggccacagcg gccgcaaacg tggtctggtc gcgggtcatc tgcgctttgt 360
tgccgatgaa ctccttggcc gacagcctgc cgtcctgcgt cagcggcacc acgaacgcgg 420
tcatgtgcgg gctggtttcg tcacggtgga tgctggccgt cacgatgcga tccgccccgt 480
acttgtccgc cagccacttg tgcgccttct cgaagaacgc cgcctgctgt tcttggctgg 540
ccgacttcca ccattccggg ctggccgtca tgacgtactc gaccgccaac acagcgtcct 600
tgcgccgctt ctctggcagc aactcgcgca gtcggcccat cgcttcatcg gtgctgctgg 660
ccgcccagtg ctcgttctct ggcgtcctgc tggcgtcagc gttgggcgtc tcgcgctcgc 720
ggtaggcgtg cttgagactg gccgccacgt tgcccatttt cgccagcttc ttgcatcgca 780
tgatcgcgta tgccgccatg cctgcccctc ccttttggtg tccaaccggc tcgacggggg 840
cagcgcaagg cggtgcctcc ggcgggccac tcaatgcttg agtatactca ctagactttg 900
cttcgcaaag tcgtgaccgc ctacggcggc tgcggcgccc tacgggcttg ctctccgggc 960
ttcgccctgc gcggtcgctg cgctcccttg ccagcccgtg gatatgtgga cgatggccgc 1020
gagcggccac cggctggctc gcttcgctcg gcccgtggac aaccctgctg gacaagctga 1080
tggacaggct gcgcctgccc acgagcttga ccacagggat tgcccaccgg ctacccagcc 1140
ttcgaccaca tacccaccgg ctccaactgc gcggcctgcg gccttgcccc atcaattttt 1200
ttaattttct ctggggaaaa gcctccggcc tgcggcctgc gcgcttcgct tgccggttgg 1260
acaccaagtg gaaggcgggt caaggctcgc gcagcgaccg cgcagcggct tggccttgac 1320
gcgcctggaa cgacccaagc ctatgcgagt gggggcagtc gaaggcgaag cccgcccgcc 1380
tgccccccga gacctgcaga tccacatcct tgaaggccgc agcgacgagc agaaggaaac 1440
cctcattcgg gaagtcagcg aggccatctc gcgctccctg gatgcgccgc tgaccagcgt 1500
gcgagtgatt atcacggaga tggccaaggg ccacttcggc atcggcggcg aactggccag 1560
caaggtcaga cgctgaagtg gagatgccca agggcacttc gggtcgagga acccgacctg 1620
cattgggacg cggccacgga gagcgcgggc aaacgccggc actatagcca gtggagtttg 1680
taaaacgcta tttcagagct tggagagtgt ctaagaaagc cggggcgatg ccaacccatc 1740
ccttcttcgg ctatgcatcg ttcgtaatca agccacttcc tttttgcatt gacgcagggt 1800
gtcggaaggc aactcgccga acgcgctcct atagttttca gcgaagcgtc ccaaatgtaa 1860
gaagccgtag tctagggcta tctcagttat actacgcaca ttggcactgg gatcgttcaa 1920
gcaggcgcgg atgctttcga gcttgcggtt gcggatgtag ttcttcggcg tggtgccggc 1980
atgcttctcg aacaaattgt agagcgagcg tggactcatc atcgccagct ccgctaaccg 2040
ctcaaggctg atattccgtt tgagattctc ctcaatgaat tgaacgactc gctcgaaaga 2100
cgggttacct ttgctgaaaa tttcacggct gacattgctg cccagcattt cgagcagctt 2160
ggaagcgatg atccccgcat agtgctcttg gacccgaggc atcgactttg tatgttccgc 2220
ttcgtcacaa actaacccga gtagattgat aaagccatcg agttgctgga gattgtgtcg 2280
cgcggcgaaa cggataccct ccctcggctt gtgccaattg ttgtcactgc atgcccgatc 2340
aaggaccact gagggcaatt taacgataaa tttctcgcaa tcttctgaat aggtcaggtc 2400
ggcttggtca tccggattga gcagcaatag ttcgcccggc gcaaaatagt gctcctggcc 2460
atggccacgc cacaggcaat ggcctttgag tattatttgc agatgataac aggtctctaa 2520
tccaggcgag attaccctca cgctaccgcc gtagctgatt cgacacaggt cgaggcatcc 2580
gaagattctg tggtgcagcc tgcctgccgg gcgcccgccc ttgggcaggc gaatagagtg 2640
cgtaccgaca tactggttaa cataatcgga gactgcatag ggctcggcgt ggacgaagat 2700
ctgacttttc tcgttcaata agcaaaaatc catagttcac ggttctctta ttttaatgtg 2760
ggctgcttgg tgtgatgtag aaaggcgcca agtcgatgaa aatgcatctc gacgtgatgc 2820
gtatacgggt tacccccatt gccacgttgc gccatccttt ttgcaatcag tgaccacttt 2880
tccaagcaaa aataacgcca agcagaacga agacgttctt tttaagaagc gagaacacca 2940
gaagttcgtg ctgtcggggc atgcggcgac gaattggcgg ataaagggga tctgcaggtc 3000
ccgagcctca cggcggcgag tgcgggggtt ccaagggggc agcgccacct tgggcaaggc 3060
cgaaggccgc gcagtcgatc aacaagcccc ggaggggcca ctttttgccg gagggggagc 3120
cgcgccgaag gcgtggggga accccgcagg ggtgcccttc tttgggcacc aaagaactag 3180
atatagggcg aaatgcgaaa gacttaaaaa tcaacaactt aaaaaagggg ggtacgcaac 3240
agctcattgc ggcacccccc gcaatagctc attgcgtagg ttaaagaaaa tctgtaattg 3300
actgccactt ttacgcaacg cataattgtt gtcgcgctgc cgaaaagttg cagctgattg 3360
cgcatggtgc cgcaaccgtg cggcacccta ccgcatggag ataagcatgg ccacgcagtc 3420
cagagaaatc ggcattcaag ccaagaacaa gcccggtcac tgggtgcaaa cggaacgcaa 3480
agcgcatgag gcgtgggccg ggcttattgc gaggaaaccc acggcggcaa tgctgctgca 3540
tcacctcgtg gcgcagatgg gccaccagaa cgccgtggtg gtcagccaga agacactttc 3600
caagctcatc ggacgttctt tgcggacggt ccaatacgca gtcaaggact tggtggccga 3660
gcgctggatc tccgtcgtga agctcaacgg ccccggcacc gtgtcggcct acgtggtcaa 3720
tgaccgcgtg gcgtggggcc agccccgcga ccagttgcgc ctgtcggtgt tcagtgccgc 3780
cgtggtggtt gatcacgacg accaggacga atcgctgttg gggcatggcg acctgcgccg 3840
catcccgacc ctgtatccgg gcgagcagca actaccgacc ggccccggcg aggagccgcc 3900
cagccagccc ggcattccgg gcatggaacc agacctgcca gccttgaccg aaacggagga 3960
atgggaacgg cgcgggcagc agcgcctgcc gatgcccgat gagccgtgtt ttctggacga 4020
tggcgagccg ttggagccgc cgacacgggt cacgctgccg cgccggtagc acttgggttg 4080
cgcagcaacc cgtaagtgcg ctgttccaga ctatcggctg tagccgcctc gccgccctat 4140
accttgtctg cctccccgcg ttgcgtcgcg gtgcatggag ccgggccacc tcgacctgaa 4200
tggaagccgg cggcacctcg ctaacggatt caccgttttt atcaggctct gggaggcaga 4260
ataaatgatc atatcgtcaa ttattacctc cacggggaga gcctgagcaa actggcctca 4320
ggcatttgag aagcacacgg tcacactgct tccggtagtc aataaaccgg taaaccagca 4380
atagacataa gcggctattt aacgaccctg ccctgaaccg acgaccgggt cgaatttgct 4440
ttcgactatc ggcgcgccag agctcatcgt taatgtcttc gtgcgccgtc agtcggcgca 4500
cgttttttct ctctggtacc gtgtcactga tctagtcaat tactcgaagt atccacaagt 4560
gaagcatact aagtaatgta caagaatcaa aaaaatcggc tacgcaagtc gcgtagccga 4620
atcatttaag gatccttcca ttcaggtcga ggtggcccgg ctccatgcac cgcgacgcaa 4680
cgcggggagg cagacaaggt atagggcggc gcctacaatc catgccaacc cgttccatgt 4740
gctcgccgag gcggcataaa tcgccgtgac gatcagcggt ccagtgatcg aagttaggct 4800
ggtaagagcc gcgagcgatc cttgaagctg tccctgatgg tcgtcatcta cctgcctgga 4860
cagcatggcc tgcaacgcgg gcatcccgat gccgccggaa gcgagaagaa tcataatggg 4920
gaaggccatc cagcctcgcg tcgcgaacgc cagcaagacg tagcccagcg cgtcggccgc 4980
catgccggcg ataatggcct gcttctcgcc gaaacgtttg gtggcgggac cagtgacgaa 5040
ggcttgagcg agggcgtgca agattccgaa taccgcaagc gacaggccga tcatcgtcgc 5100
gctccagcga aagcggtcct cgccgaaaat gacccagagc gctgccggca cctgtcctac 5160
gagttgcatg ataaagaaga cagtcataag tgcggcgacg atagtcatgc cccgcgccca 5220
ccggaaggag ctgactgggt tgaaggctct caagggcatc ggtcgacgct ctcccttatg 5280
cgactcctgc attaggaagc agcccagtag taggttgagg ccgttgagca ccgccgccgc 5340
aaggaatggt gcatgcaagg agatggcgcc caacagtccc ccggccacgg ggcctgccac 5400
catacccacg ccgaaacaag cgctcatgag cccgaagtgg cgagcccgat cttccccatc 5460
ggtgatgtcg gcgatatagg cgccagcaac cgcacctgtg gcgccggtga tgccggccac 5520
gatgcgtccg gcgtacaaga tccacaggac gggtgtggtc gccatgatcg cgtagtcgat 5580
agtggctcca agtagcgaag cgagcaggac tgggcggcgg ccaaagcggt cggacagtgc 5640
tccgagaacg ggtgcgcata gaaattgcat caacgcatat agcgctagca gcacgccata 5700
gtgactggcg atgctgtcgg aatggacgat atcccgcaag aggcccggca gtaccggcat 5760
aaccaagcct atgcctacag catccagggt gacggtgccg aggatgacga tgagcgcatt 5820
gttagatttc atacacggtg cctgactgcg ttagcaattt aactgtgata aactaccgca 5880
ttaaagccga gcgatgataa gctgtcaaac atgagatcca atctagattg tttaaacttc 5940
tgcagaacac gcggtgttaa cgtttcttat acttcttaat tttgttaaag atcatttcgc 6000
cgtagtacac cgcattgacc tgggtcttca ccagcaagta gccgcgaaat ttcttaaaca 6060
acttcatgtt cggtttaaag tcggcttgcc agaactgatg caaatgcccc tggtacgtca 6120
gacccttgat atcgtacaag gcgttgccca tgactttcag gggcttgttg tggatcaacg 6180
cggaaatgcc ggccgtgcta ttgatggtga ccaccgcttt ggcgtggcgc aacagctccg 6240
gcatgggcag atcgtgcaca tagatgacac gttcatccaa accgtattcc ttcgacagac 6300
gcttgatcaa cgggcggtac aggcggtgcc cgcgatccat cgggtgatgt ttgatcacca 6360
gataggactc cttgggggcc ttgcgggaaa agctgtacat cacttcgttg atgtaatcac 6420
gcacatcatt atagttgcta tggttgcgga tctggctgtc gttgtacact tgcaggaccg 6480
ccaggtaata gcgctgatcc agctcgttca tcaggcgggg gaggaccttg cgttgggtga 6540
ccttatacag ctgtttgcgc cagtaggcgc ggacccagca gcgcgcttca taccacgggc 6600
tgaacgattt gtggtggcga tagcgcggaa attcgtgacg atagtgccaa cccatcaggt 6660
aataccacat ggcgtggccg atgcgcttca tggtgctcgg tttcaggttc tcgacgtgcg 6720
gcgtcggcat atcgggcaat ttgcggtaaa agtccggatc gcggggcaag ctgctatagg 6780
cgttcacacc gccttcttcc acggtgataa attgcggacg caggtagcct tcctcgaagg 6840
ccagaaaacg aatccccttc gacttggccc agcgtttggc ctccttgtgc agcaggcggc 6900
agtcaccgaa acacaaaatc gtgtcaaagt catactgacg atgcaagtcc cgcagccaac 6960
cggggaactc cttcggggtt tggtagtacg ccaggtattg gcggtggcgg cagtagaagc 7020
gatcaccgcc attaaagacg acgttgaccg cgttgcgacc gaggctctcc aaccattccg 7080
ccacatcgtt gaagaacgga cccatcggac cttggagcag gaggtacttt ttaccgctca 7140
acagcaccgt cagcgcattg ccgtgcattt attaacctcc taacacgcgg tgttaagcgt 7200
tttcggcgag ctcttaacca aagcgcactt tgcagaacat gatcaacttg cgatagtagc 7260
gaatcacacg gccggctttc ttgcgggtga taaagatggg tttgcggggc gttttgatca 7320
gatattctgc cgcttcctcc accgtgatcg gctgcaaccg cgtcggatga atataggtgg 7380
gatagacaat cagggcttga tagatcaggt cggcgatggt cagccgccgc tcgcgacggg 7440
ggcagtggtg ctcatcgacg gtcaggcccc acgaggcgta gaacggcagg ccgtagcagt 7500
gcacctgttt accgtgcagc aatgcttcaa agccgctgag gctcgtcatc gtgtgcacct 7560
cgtccgcacg ctgaatacac tgaatgatat cggcatccag tgcctggtag tctgcgagtt 7620
ccgcgatctg ttccgccgga atgtcaccct tacggttgcc gacgagcaca tcggggtgcg 7680
gcttgtagat gatgtaggcg tgcggattac gttcccgcac ggtgcgcagc agctccagat 7740
tcgacttgat cgacacggtg cccgtcttaa tcgacgcatc gtcttccacc tggcccggca 7800
ccaggatgac tttcttgtcc ttcgcttctg ccgggaggct gaaatcggcc cccaggttat 7860
atttgctcaa tttgctttcc accagacgtt ggcgcaactt ttccgcgcgc atctggtgcg 7920
cgagggtcag ctggctgtga ttcagcagga cctccagttc cgacggacgg gtggcatcgt 7980
aatagatacc gcgcttatcc aggaccaggc tcaacggcgg cagcagatcg ctccccaggc 8040
cggagctgcg caggaagccg tcttccatgc gccacagcgg cagggatttg cgctgtgcct 8100
ccgcacgcca ttgctgttcg cctttcacgc cccacacgac gcaggcgctt gctgcggtac 8160
agcgacggga aaaggagaga cgattcgtgg ccgtttgcag gaagggcttc aggatcgcgc 8220
ttttccacag ggtcaggccc ggcacccaga gataaccatt ccgctgttgc aggtgacgac 8280
gttgcagctg gagccattgg agcaccgtga acagggccga cacctccccg gtctgcggat 8340
caatgtagcg gcaatagcgc agataggccg ctgcgaacag ttcctccagg gtggccgagc 8400
cgcgacgcgc cgacagcagc gccgattggg ggtggcggtc atcggtgagg ccccaccctg 8460
cataccaggg ttggccaaag caggtcacgg gcttaccggc cagcagggct tcaaaaccgt 8520
actgggaggt cacgacgtac acgcgggaca catgacgcag cagggactgc ggcgacacgt 8580
tttccgcaat caggcgcacg cgctgggtgg cacgcaagtc cgcgaagtag ccggtctttt 8640
tcccttccag gacatcggga tgcactttga cccagatttc tgcctgcggg ttttccgcca 8700
tcgctgcttc cagcattgcg gcgaactcat gggggcctgc gttgccgtag gtcacgctca 8760
tgtcattgaa ggtctggtcc accaccagca cgatgttcgt gcgctcgctt tcatccgcca 8820
cgaacgccgg tgccaggttg tacttgctca tgtcgcccgt cacaatggtg tgcatcgcct 8880
cgcgcgcctg atccgccagg gccgcgttgc cggccttgtc ctgcacgagt ttttccagcg 8940
cgctcggttt cgaggcgtcg tagtaaatgc cgcagtcatc cacgacgagc gagaggggcg 9000
gttcaccgtt cacgcccagg tccagcgagc ggacgaaacc atcctccaag cggatcaccg 9060
gcttgcctgc ggctttggcg atggccaccg gctttgcggc cgaggggcgg tgcccccaca 9120
ccgcgattgc atccacttcc tgcgggaccg ggcgcagcag cgacagcttt tggcagggct 9180
gggcgaggaa tttttccagg tgcggaatac gccaaatgcc ggggctataa atgccaatca 9240
tgcgttctcc gcgagctcct gcgccatcag ggcccggacc ttctccaagc acgccggggt 9300
atcgacgccg ggaccggtcg cggcgacctc gaaggtgcga atgttaatgc ccgcgctcat 9360
cagccgcagt tgctccaggg attcggcctg ttcgggcatg gactccggca actggctgta 9420
attttgcagg acatcccgcc gataggcgta gatcccgacg tgcttcaggt agcgcgcctt 9480
ctcggcgttg cgcgggtacg gaatggggga gcgggagaaa tacagggcgt cctgccgcgt 9540
gttcaccacg accttgacgg tggacggttc ggcggcttct gccgcgctga tcgcatgaca 9600
cagggtcgcc accggcagcg ccgggtcgtc ccgcatacct tgcagcaggg tttcgacgtc 9660
acgcgggcga atcatcggct catccccttg caggttgata tagatatccg cctccacctt 9720
atgcatgact tccaccaggc gatcggtgcc gctctcatga tcgttgcggg tcatgatcgc 9780
tttgccgccg aacgcctgga ctgcctgctc cacacgcggg tcgtcggttg cgacccacac 9840
ctctgccacg cctgccactt gcagggcccg ttcgtagacg tgctggatca tcggtttccc 9900
gacgatatcc agcagcggtt tgcccggcag acggctgctg ccgtagcgtg ccgggatcac 9960
aatcacggcc ttcgacattt attaacctcc tcgagttaca gcgacagaat cactttcgcg 10020
cccaccgcca gttggtacag aatggtgctg ataccgcgcg tcacttcgat gttcttcgac 10080
tcgtatttcg gcaacaccat aatttcatca ccgggtttca gggaatcgac gtcttctgcg 10140
ttcaccgctg cgccgttctg acggatgacg ataatacggg cgttgccgga cttctgggtc 10200
agcccaccgc acttctcgat gtagtcctcg gtcgtcatac ctttctgcca cgacaccgcg 10260
ttcgggaaca gcacttcccc gtggaccatg accaacgacg tcttttcggg aatattgatc 10320
acgtcgccgt cctccaggag gacggagtca atgttgcttt cattgaggat cacttcgccc 10380
ttcggcacga cggtgcgggc tttcgcgacg aagcgggaga tcagttgggc ttcctgcata 10440
cgcaggctgg cctcttcctt ggtgctgctc tgtgcgctga ggctggcctc ttcgagcttt 10500
tgcagggaca aattcagcat ttctttctgc cgttgcgcga cgctcggccg atacaactgc 10560
acggcgttca tctgcgacat ggagttcggg cgcacttttt cgagcacggc ccgcatggtg 10620
ctaccgtagg gcagcaccat ggcgtgttcc ccggaatgtg cgccttccac acgcacttga 10680
atggtgcccg catagcggtc ggtggagaca atgagggtat caccgttttg cagcatacgc 10740
cccggtgcgg acgagatcgg ataatattcc gagcgcttct ggaggccctg cttccgcata 10800
atcgtgatat gggtcgcacc cggtttggga cgtgcccagg acagtgcttc ggtgaccggg 10860
atgctcgatt cgcgaaattc aaagtcgtag gaattgaaca catcgccctg caccgagaac 10920
gtatgctggc gcggacccac aatgatcgta tcaccgtccg caaactggga cagccccagt 10980
ttgccgttga gcaggaagtc atagaggttg acgttcgagc gcacacgatt gccgcgtttc 11040
acgacgatgt ccacgtagct gccgcgttcc gggtccacac cacccgcctt gatcaggtag 11100
ttcagcaggc tgtcggaggt gacaccgccg tacaggccgg ggttgcggac aaagccggtc 11160
acatagacct tgaccggctg cgcctgcaag agcgacgcat agacgttcac gttgctctgg 11220
tagacttcct tcaccttgct cgtcaccagc gcgttcaact gggagttcga cacacctgcg 11280
actttgacgg ggccgacatt cggcaggaag atgttgccct tcgggtccac ctggagtgcg 11340
ccatcgaagg tgaacgcacc ccacaggcgg acctggatgg aatcgccggg attcaggatg 11400
tagtccggat tgaaacccac ggttgccccc gagtctgcgc tcgtaccgtt gaacagctgc 11460
gccccgaaca tacggctcat cacgaccggg ggtgcggggg gcggggtgtt atcgaagccg 11520
ctcatgttct gggtgtcgct tttctgcccg ttcaggatgc cggtcaacgg tgcggcaccc 11580
gtgaggttcg gatcggcatt aatgtcgatg gttgcgctcg cctgtgctgc atggcacgct 11640
gcgatcagca ggatcgactt aaacagcttc atttattaac ctcctcgaga agtcgactta 11700
gtcacggtgg tcttcaatca ccgccaggag caatttcagg gtgccaaaga gcaggcaaca 11760
caccagcagc caacacgcga tcaaatacgg gatattcggg aaggagcttt cctggggcag 11820
ctgcggggac gagatcacgc tcaggacttt cagcttacgg gccgcttcga cacgggtctt 11880
ttcgatgctg gtgagcgtga gcttgtacaa ctcggtattg aactcgacct tggatttgat 11940
ctcctcaaaa tccacggcca tgcggttcag tttatcgccc tggggtgcgg taattttcga 12000
cttttcttcg tcgatctgtg cctggaggct ctgaattgca ttgcgggcgc tcacgacttg 12060
gggcgcatcc tcgcgcaggt acgtgagcag gttgcgcagg tcggcttcca tctgaatttt 12120
ctggcccatc agcgtattca ccagggtgga tgccgcctgg gcctgtgcct gcgggtccag 12180
cacattgttg ttgtcttggt aggacaacaa ttcggctttc gatgcatcca gccgctggcg 12240
cgctttttcc atttcggttt ccgcaaacgc caattgatcg cgggcgatac ggtgcgacat 12300
ttcattgatg aaccgctcgg attccttgag cacggtctgg ttgaatttca gcgcgaactc 12360
gggcgaaaag ccctgggtct ggatgttcag cagcccggtc ttgtcgtcgt agctgacgtt 12420
gatgcgatct ttatagtact tcaggaaccc ctcggcggtt tcatccttgg acagatggtt 12480
caggaagtcc aggcccgaat gggagaacgc ttcgcggaag ttcagctgtt tatccagcgc 12540
ggccagcata tccgggctgt tgatgtattc cttcaggtac agtgcgtctt cggcggacga 12600
cgggttggag gcacccaaca gcaggccgaa gttcaggctg ccggagttga gatcgtcgct 12660
gcgcttgatg gccaccttgc tttccgacat atagcggggc tgggagaaga tcgccaagta 12720
gatcagcagc accgccatgg gtgccagaat aatgattttt gccaggtgct tctgaatatc 12780
tgccaggctg atcgcgctca gacgcgcacg catccacgag acggcgcttt tcactttgat 12840
cagcatttat taacctcctg tcgacaacac gtgttaatcg aaaatgcgca ccaacccggt 12900
caccttattt gctttgttgg tcaccagcag ggtcgagacg cggtgtttct gcatcttctc 12960
ttctgcttcg atgatcatgg tgtcttcggg caaggtcagc ggttcgcggg tcatcatctg 13020
tgcggccgtt gcgctcgtca ggctgtcttc tttctccata aagcgccgca gatcgccatc 13080
ggtgatgatg cctgccagcc caccttccgc atcttcgacc atcaccatac cctggcagcc 13140
cgaggtgatg cgctgaatga ccgttttgaa gctggcatcg agctgcactg ccggcacatc 13200
atgttgcatc acgtcggcga cgcgggtcag caggcgccga cccaggctgc caccggggtg 13260
gtagcgtgca aagtcattgg gcataaactt acgctggtga atcatcgcga tggccagcgc 13320
gtccccgatc gccatcgtga gcgtcgtgga ggtggtcggg gcgagattgt tcgggcacgt 13380
ttcgttcgcc atgtgcagct ccaggaccgc atctgcattt ttggccaggg tgctattccc 13440
gttattggtg attgcgatga tgcgattgcc gaagttcttc aggctcggca ccagtttcag 13500
gatctcgtcc gtctcaccgc tcgccgaaat caagatgagc aggtcatacg gggtgatcat 13560
gcccagatca ccatggaacg cttccgccgg atgaataaag aaggagggcg tcccggtcga 13620
ggccaaggtc gccgacatct tgcggcccac atggccgctt ttacccatgc cgctcaggat 13680
gacgtgccct ttacaattca tgatgagatt caggacgcgc tggtactgac cgctatccag 13740
ttgtttggac aggttttgca gtgccgcgct ttgttcggcc agggtctggc ggacgctcgt 13800
aatcagatac ggatcaatgg tcgaggactg gtcatccggc aagtggcgtt cgctcattta 13860
ttaacctcct cacgtgttaa ttaagtaatc gatagtgatt taaatatgca agatccgata 13920
aatcgattga tagatttaaa taagaactgc agaagctagc aacttaagtt acgaatcgac 13980
gccgaacagg tcgcgggtgt agactttctc cgagacatct tccagttcgc tggtgcggcg 14040
attcgccaca atgacatcga cgcgctcctt aaaggaattg atgtcgcgct cgacgtagga 14100
accgaagaag tagggttctt tcaggaccgg ctcgtacacc acaatctcga tacccttggc 14160
cttcaaacgt ttcatgaccc cctggatgct gctggcccgg aaattgtcgc tacccgcctt 14220
catgatcagg cgatagatac cgaccacttt gggcttacgg gacaggatgt cctcggccac 14280
gaagtcctta cgggtcgtat tcgcatccac gatggcctgg atcaggtttt gcgggacgtc 14340
gcgataattg gccaacagct gcttcgtatc cttcggcaga cagtaaccgc cgtagccgaa 14400
ggacgggttg ttgtaatgtt gaccaatgcg cggatcgagg gagacgcctt cgatgatttg 14460
tttggtatcc aggccgtgca cgctcgcgta ggtgtccagc tcgttaaagt acgcgatacg 14520
catcgccaga tacgtgttcg cgaacagttt gatggcttct gcctcgggcg aatccgtcag 14580
caggatcgga atatcctttt tgatggcacc ttccgacagg agttcggcga acttccgtgc 14640
gcgttccgac gattcgccca cgacaatgcg gctcggatag agattatcat acagggcttt 14700
gccttcgcgc aggaactccg gggaaaagat gatattattc gtgttcagat cgcgcttcag 14760
gcgttcggtg aacccgacgg ggacggtgga tttgataatg atggtcgcgt tcgggttaat 14820
ggacagcacg tcacacgcga cgctttcgac gctcagggta tcaaagttgt tattaatcgg 14880
atcatagttc gtcggggtgg cgatgatcac gtagtctgca tcgcgatatg cctcgtattt 14940
ttccgtcgtc gcgtagaggt tcagcttacg attggagaga aacttctgga tttccgggtc 15000
gcaaatcggc gagattttct tgttaatgag ctggaccttc ttcgggtcga tgtccagggc 15060
gatgatgtcg tgtttttggg agaggaggat cgcaatgctg atacccacat agccgacgcc 15120
ggccacggca attttcattt attaacctcc ttaagtgaat tcaaactagt ttacaagtcg 15180
ttttcgatct tctcccaggt atatttgcga cattcattca agttggtcag cggcgagtat 15240
ttgtactttt tgataccgag gcgcgacagg ctttcgttca ccaccttgaa atggttttcc 15300
ttttggatgt ccagtttctt gatcgacgtg ttctcgccgt gcaggacacg gttgtagcaa 15360
atcttattga tatgcttaaa cgggccgact tcgctgagtt tcaaatacat atcgtaatcc 15420
accgcattgc tgatgctctc gttgaagcct tcggtgaggt tccatgcacg cgccgtgaac 15480
atacggaagt ggtggcagat catcgcgctc gtgagctttt cgcggctgta aatcggccag 15540
ttgtagccat tgctaatcaa gttaccttca cgatcaatat tgcgattggt ggtgtacacg 15600
caggcgaggc tcaggtcttt gcgaaattca tccagacaca gttccacggc atcgggctcc 15660
aggaaatcat cggaatccag ctgcccgatg tagaaacccc ggcacaggcg gactgcggta 15720
ttcgaggcgg agccgatgcc tttgtttttc tggctgatga aacggacgcg cgggtggttt 15780
gcgtaatgtt cttgcaggat gcgcagcgta tcatcggtgc tcccgtcatc gcagatgcag 15840
acctccagat cggtgatcgt ttggttcagt gccgattcga cgcagcgcac gatatatttg 15900
ctgcaattat acgcggggat gtagatgctc accaggggca cacgtttcag ggtggcgctc 15960
tcgattttct ccttcttgcg ataaaagtag ggcaccttct gctgcaacag ctggacggta 16020
atgtttttac ctgccgcgcg atcggtttcg ttctccttac cgggcggttc ctgatgatat 16080
gccatcgcgc cttccacgct acggaaataa caaccctcgc ggtacagccg atagccgaac 16140
tcattatcct caccgcccca atgcgtgaac tcttcgtcaa accaacccgc gcgaaacagc 16200
cacttctttg caaacgccac attgccaccg ctaaagaacc ggaacggggt gttgcacagg 16260
cgcagattgt cggtattctt gaaatgttcg atgcgccaat cgacggattt gttctgctcg 16320
accttgcctg cgacctgatt attggtaata atctccggga tttcattgat caggcttttc 16380
tgggacaaaa agtccagata ggtatgcttc gacgtgtcga tgtatttacg cgggccaatc 16440
agtgccacgt tatcatccac ggccaggagt tccatatagg actgcaccca caacgggttc 16500
ggcgccatat cgcagtccaa gatcgccacg tagttgtatt tcgctgcccg caggcccagg 16560
ttccgcacgg cgcacagctg gtagccgtag tctttctggc ggacgtattt gatgttcagc 16620
aacgactcga actcgcggac gatctcttcg atgttttcct tggaaccgtc atccgcgacg 16680
atgacctcat agtcataaat cgttttctga ttgcagaggc aggccagggt gatcgccagg 16740
attttggcgc gattgtacgt cggaatcacg atggacaggc cgtcgatgat cagttgcttg 16800
cgcggataat catccagttc tttacgtttc cctgcccaga cgtagtcgtt cgtgctttcc 16860
ggcagcggcg gcaaggtcag gtcgctcggc caatccagcg gaatgggttc gacttctttc 16920
aattcggcgc gctcggattt ctttgcggta atttcccgat atttgctaat gatttcattc 16980
ttttccacct cattcagcga gatcgccttt gcattgctgc acataatttt ggttgccgcg 17040
tcgatatcaa tgaccgcttt ccgattcagc ttgtccactt cttcgctcag attcagggcg 17100
gtttggcaca gcttgatatt ggcttccacc cagctcacat catagatttc cgccactttt 17160
tcaaacaggg agagggcttg gcggtagttc ttattcttat acagattgat tgcctggttc 17220
aaaatgctca tttattaacc tcctactagt gaattttcga attacttacc gcagtacttg 17280
acacccacct gggaattgtt tttggtgcgt ttgaattggc ggatggtacg gtagatgcta 17340
aagggcaggc tgatcagacc gagcggaaaa ttgttcttat tgatgatgag cttgcccagc 17400
tgatagctca ggtgtttctt gacccgttcg gcttcgtgtt tatccgcgta caggaagatg 17460
ctcggcaggc tcacttggta ctccgaatca tatttcttct tccaggtccg ccattcgctg 17520
atcaacgcaa acggaatcga gatcagaccg aggaacgtct tggagcggct caccatcacc 17580
gcacccaggc ggtagccgat atcttgcttg atgcgttcgg ccgcaccata cagctccggc 17640
agttgtttct tttcgagacg ttgattgtcg atgaagtact gttcgagctt ttgctgcacc 17700
agatgcagct gattgagcag caattctttt tcgcacgaca gcttttcgag gcgctgttgt 17760
tgcagttcat ttttgttctg ttcctttttc agcagggact cgaagttctc gatcgcgcac 17820
tccagttcct ggacctggat ggttttgttt ttaatgatca gatcatactg gatcagttct 17880
tccttgctat ccgacagctc tttcagaatg gcttgatagg cgttcagctg tttggacgtg 17940
tgcagttcgt tgtccagaat gatctttttg ctgctctggt acagaccgtt cacgatatcg 18000
agggtgatct ggcgttgttt aatgaacgtc tcccaaataa aggacggctt atagttttcc 18060
ttctccagca cccgcaaggg ggtgttggcg ttcgattgca attcaaagta cagttccttg 18120
caatcgggat agtcgttcag gacgttgaag atcaagtact cctccgtctc gctttgcttg 18180
aaaatgatat ccccggtccc gatgtcaata ccgctgaggg acatgatctc ctgatgttct 18240
ttttccagcg taatggaggc ttcggcggtc ttaaagtcat tcacgctctg ctccagcgag 18300
tggttgatgg tattggagaa cgacaacccg aatttcagtt tcagtttgtg ttgcagttgc 18360
tggatgcagt cctcggcgtt gcgcttcacc tgttcgctcg acaccagcag gcaccgaccc 18420
cggttgttga ggaagaagtg cagcaaggcg gtgttgtatg ccagccagtt tttgatcaga 18480
tgctccgagg tatagttgct ggagatgttc tggtccgaga agtagttcgt caggatgctt 18540
ttggggtggt cgtagatgag gataaaggtg atgttctcat ccaccgattt ccaatattcc 18600
aacgtgtgaa ttgcgttggg gtcgctccaa ccgcacagtt tctggttcag gttggacagc 18660
atcagatcca atgcgatacc gttccagacg gtgctcacat ggagcggttc aaagtcggcg 18720
gaatcggtca ccgtatagat gtccggcgac tggtacgcct tccgcagcgt ctgggtgatg 18780
tcctggggcg agaggttctc acgtttggac gggcacaggg agttcatgcc gcgctgatgc 18840
aggagttctt ccacgatttg gtagttgctg ctcggatggc ccacgatcac caggcggttc 18900
atttattaac ctcctttcga aaatgaacgg tccgttaaat atagccattc ggattcttca 18960
tctgccagcg ccaggcgtcc tccagcatgg tttcgagttc ccgcttggct ttccagttca 19020
gatatttgtt ggccttttcg ggggaggacc agctctccgc gatatcaccg tcacggcggc 19080
tcacgatttc atacggaatc cgcacgccgg aaatcttttc aaaggtggac accagttcca 19140
gcaccgaata acctttaccc gtgcccaaat taaagacgtg gtagttggtg ttattgtcgc 19200
ggaagagata ggacagcgct gcgacgtgcc cttcggccag gtccatcaca tggatatagt 19260
cacggacccc cgtgccgtct ttggtgggat aatcaccacc gaacaccatc agtttttcca 19320
gtttccccat cgcgacctgc aagatgtacg gcaccaagtt ggaggggatg tctgccgggc 19380
tttcaccaat cataccggat tcgtgggcgc ccgtcggatt aaagtagcgc aagcagagga 19440
aattcgtgtc ggagtatttc ttggcgatgt cgcggatcat cagctccgag atgtacttgg 19500
acgtaccata cggattcagc gtgccaccaa tatggcagtc ttcggtgacg ggcatgatct 19560
tgctttcccc atacaccgtc gccgacgagc taaagatgaa gttggcgacg tcgttcttga 19620
tggcgcaatt gatgagttgc agggtgccgc tcacgttgtt gtcatagtag aagatgggct 19680
tgatcaggct ttctgcgacc gatttcgcac ctgcaaagtg catgatgcag tcgaatttgt 19740
gtttcttcag gatctggttc acttccttct cgttgttgat attgagttcg tagaacgtga 19800
ctttcttctt tgcgatcagc tcaatgcgac ggatgctttc gcagctgctg ttgatgagat 19860
tgtcaatgat gacgacattg tagcctttgt tcagcaggca gagcgacgtg tggctgccga 19920
tgtagcctgc accgccggtg accaggatgt tcatttatta acctcctcgg tccgaattaa 19980
cctaggttat gaggtcagca ttgcttcttc acgcgtttag tagttgtttt gttcggtgat 20040
atattcttca atgccttctt gcacgtcttc atggaacgac acggcgttgt cgtctttaaa 20100
cacgattgcc acatcgcaga actctttcaa cgagttcagc gagtgcgaca ccatgaggaa 20160
ggagctttcc ttatgacgct ccttgaagag ttgggcacat ttttccttga aacgggcgtc 20220
ccccaccgcc gtcacctcgt ccacgatgta gtaatcgaac ttgaacgcca tgctcaggcc 20280
gaagccgagg cggctgcgca taccgctcga ataggtcttg atcggcatat caaaatactt 20340
ccccagctcc gcgaactctt ccacaaactc aatcttttct ttcagctcct cctgcttcgc 20400
gtacagccgg gccacgaact tcacgttttc acgcccggtc aagctgccct ggaagccgcc 20460
tgccagaccc accggccacg agatcgtttt attcgtgatg attttaccgc tatccgggcg 20520
gtcgatgccc ccaatcatgc gcaacagcgt ggatttaccc gccccattgc gcccgatgaa 20580
cgccacgctt ttgccgctgg ggatctcaat gttcaggttc ttgaagacat agtgacggcc 20640
caccggggtg cggtagcttt tcgtcaggtt ttcgatctta atcatgaggt caacattgcc 20700
tcctcacgcg tacggtacag ggccaaacca ataaacaggg tcaccagggt gaacattgcc 20760
agataattca ggctgacccc ttcgctgata taaccgggca tcacggcctc gcggctcagt 20820
tcgacgacgt gcaccagggg attccacagc aggtacgacc aatactgctt cggaatggag 20880
tgcagcggga acatgatgca cgaaataaag tacagcggct tcagcaagat cggcaagact 20940
ttctgcattt cggggaacgt cttgcccacg accatgaaga tcaggcccac accgcacgac 21000
aggatgatca ggaggctcca ggtgagcaca aattgcagga agttggtaat ctcgaaatat 21060
tcgcccgcca tccagatgat cagcatcagg aggatgtaga ccgccacata gatcagcgtt 21120
tccaagaggg cgcgtgcaat gatcgtgtcg atcggcttca cgggccggta gttaaacagc 21180
ccctgattgg cttcgatggc gcccacggag cgattgctga tgctgctgaa aataaagaac 21240
gggatcaggc cattgagcag gaacaccggg aaggagatat ccggcatggt gcgatgcatg 21300
atatagccaa agatcccgag cagaatcagc agatgtgcgc tcggttccag gatcgcccac 21360
agatagccca ggcgaaactt gccaaagcgc gtacggattt cgcggagaaa cagtgcttcg 21420
accgtcactt tctggacttc aaaacccgaa cgtgccattt attaacctcc tggtaccaat 21480
ctagattgtt taaacagatc tgttacctgc aggattattg tttctgttgc ataaagccta 21540
aggggtaggc ctttctagag atagccattt tttgcactcc tgtatccgct tcttgcaagg 21600
ctggacttat ccctatcaaa ccggacactg caggctgaca agctttcatt acatatgaag 21660
agtttgtaga aacgcaaaaa ggccatccgt caggatggcc ttctaagaag gctcgagtgg 21720
cgcgcctaag tcgaatttct gccattcatc cgcttattat acttattcag gcgtagcacc 21780
aggcgtttaa gggcaccaat aactgcctta aaaaaattac gccccgccct gccactcatc 21840
gcagtactgt tgtaattcat taagcattct gccgacatgg aagccatcac agacggcatg 21900
atgaacctga atcgccagcg gcatcagcac cttgtcgcct tgcgtataat atttgcccat 21960
ggtgaaaacg ggggcgaaga agttgtccat attggccacg tttaaatcaa aactggtgaa 22020
actcacccag ggattggctg agacgaaaaa catattctca ataaaccctt tagggaaata 22080
ggccaggttt tcaccgtaac acgccacatc ttgcgaatat atgtgtagaa actgccggaa 22140
atcgtcgtgg tattcactcc agagcgatga aaacgtttca gtttgctcat ggaaaacggt 22200
gtaacaaggg tgaacactat cccatatcac cagctcaccg tctttcattg ccatacggaa 22260
ttccggatga gcattcatca ggcgggcaag aatgtgaata aaggccggat aaaacttgtg 22320
cttatttttc tttacggtct ttaaaaaggc cgtaatatcc agctgaacgg tctggttata 22380
ggtacattga gcaactgact gaaatgcctc aaaatgttct ttacgatgcc attgggatat 22440
atcaacggtg gtatatccag tgattttttt ctccatttta gcttccttag ctcctgaaaa 22500
tctcgataac tcaaaaaata cgcccggtag tgatcttatt tcattatggt gaaagttgga 22560
acctcttacg tgccgatcaa cgtctcattt tcgccaaaag ttggcccagg gcttcccggt 22620
atcaacaggg acaccaggat ttatttattc tgcgaagtga tcttccgtca caggtattta 22680
ttcggcgcaa agggcctcgt gatacgccta tttttatagg ttaatgtcat gataataatg 22740
gtttcttaga cgtcaggtgg cacttttcgg ggaaatgtgc gcgcccgcgt tcctgctggc 22800
gctgggcctg tttctggcgc tggacttccc gctgttccgt cagcagcttt tcgcccacgg 22860
ccttgatgat cgcggcggcc ttggcctgca tatcccgatt caacggcccc agggcgtcca 22920
gaacgggctt caggcgctcc cgaaggt 22947
<210> 39
<211> 22774
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Sequence
<400> 39
ctcgggccgt ctcttgggct tgatcggcct tcttgcgcat ctcacgcgct cctgcggcgg 60
cctgtagggc aggctcatac ccctgccgaa ccgcttttgt cagccggtcg gccacggctt 120
ccggcgtctc aacgcgcttt gagattccca gcttttcggc caatccctgc ggtgcatagg 180
cgcgtggctc gaccgcttgc gggctgatgg tgacgtggcc cactggtggc cgctccaggg 240
cctcgtagaa cgcctgaatg cgcgtgtgac gtgccttgct gccctcgatg ccccgttgca 300
gccctagatc ggccacagcg gccgcaaacg tggtctggtc gcgggtcatc tgcgctttgt 360
tgccgatgaa ctccttggcc gacagcctgc cgtcctgcgt cagcggcacc acgaacgcgg 420
tcatgtgcgg gctggtttcg tcacggtgga tgctggccgt cacgatgcga tccgccccgt 480
acttgtccgc cagccacttg tgcgccttct cgaagaacgc cgcctgctgt tcttggctgg 540
ccgacttcca ccattccggg ctggccgtca tgacgtactc gaccgccaac acagcgtcct 600
tgcgccgctt ctctggcagc aactcgcgca gtcggcccat cgcttcatcg gtgctgctgg 660
ccgcccagtg ctcgttctct ggcgtcctgc tggcgtcagc gttgggcgtc tcgcgctcgc 720
ggtaggcgtg cttgagactg gccgccacgt tgcccatttt cgccagcttc ttgcatcgca 780
tgatcgcgta tgccgccatg cctgcccctc ccttttggtg tccaaccggc tcgacggggg 840
cagcgcaagg cggtgcctcc ggcgggccac tcaatgcttg agtatactca ctagactttg 900
cttcgcaaag tcgtgaccgc ctacggcggc tgcggcgccc tacgggcttg ctctccgggc 960
ttcgccctgc gcggtcgctg cgctcccttg ccagcccgtg gatatgtgga cgatggccgc 1020
gagcggccac cggctggctc gcttcgctcg gcccgtggac aaccctgctg gacaagctga 1080
tggacaggct gcgcctgccc acgagcttga ccacagggat tgcccaccgg ctacccagcc 1140
ttcgaccaca tacccaccgg ctccaactgc gcggcctgcg gccttgcccc atcaattttt 1200
ttaattttct ctggggaaaa gcctccggcc tgcggcctgc gcgcttcgct tgccggttgg 1260
acaccaagtg gaaggcgggt caaggctcgc gcagcgaccg cgcagcggct tggccttgac 1320
gcgcctggaa cgacccaagc ctatgcgagt gggggcagtc gaaggcgaag cccgcccgcc 1380
tgccccccga gacctgcaga tccacatcct tgaaggccgc agcgacgagc agaaggaaac 1440
cctcattcgg gaagtcagcg aggccatctc gcgctccctg gatgcgccgc tgaccagcgt 1500
gcgagtgatt atcacggaga tggccaaggg ccacttcggc atcggcggcg aactggccag 1560
caaggtcaga cgctgaagtg gagatgccca agggcacttc gggtcgagga acccgacctg 1620
cattgggacg cggccacgga gagcgcgggc aaacgccggc actatagcca gtggagtttg 1680
taaaacgcta tttcagagct tggagagtgt ctaagaaagc cggggcgatg ccaacccatc 1740
ccttcttcgg ctatgcatcg ttcgtaatca agccacttcc tttttgcatt gacgcagggt 1800
gtcggaaggc aactcgccga acgcgctcct atagttttca gcgaagcgtc ccaaatgtaa 1860
gaagccgtag tctagggcta tctcagttat actacgcaca ttggcactgg gatcgttcaa 1920
gcaggcgcgg atgctttcga gcttgcggtt gcggatgtag ttcttcggcg tggtgccggc 1980
atgcttctcg aacaaattgt agagcgagcg tggactcatc atcgccagct ccgctaaccg 2040
ctcaaggctg atattccgtt tgagattctc ctcaatgaat tgaacgactc gctcgaaaga 2100
cgggttacct ttgctgaaaa tttcacggct gacattgctg cccagcattt cgagcagctt 2160
ggaagcgatg atccccgcat agtgctcttg gacccgaggc atcgactttg tatgttccgc 2220
ttcgtcacaa actaacccga gtagattgat aaagccatcg agttgctgga gattgtgtcg 2280
cgcggcgaaa cggataccct ccctcggctt gtgccaattg ttgtcactgc atgcccgatc 2340
aaggaccact gagggcaatt taacgataaa tttctcgcaa tcttctgaat aggtcaggtc 2400
ggcttggtca tccggattga gcagcaatag ttcgcccggc gcaaaatagt gctcctggcc 2460
atggccacgc cacaggcaat ggcctttgag tattatttgc agatgataac aggtctctaa 2520
tccaggcgag attaccctca cgctaccgcc gtagctgatt cgacacaggt cgaggcatcc 2580
gaagattctg tggtgcagcc tgcctgccgg gcgcccgccc ttgggcaggc gaatagagtg 2640
cgtaccgaca tactggttaa cataatcgga gactgcatag ggctcggcgt ggacgaagat 2700
ctgacttttc tcgttcaata agcaaaaatc catagttcac ggttctctta ttttaatgtg 2760
ggctgcttgg tgtgatgtag aaaggcgcca agtcgatgaa aatgcatctc gacgtgatgc 2820
gtatacgggt tacccccatt gccacgttgc gccatccttt ttgcaatcag tgaccacttt 2880
tccaagcaaa aataacgcca agcagaacga agacgttctt tttaagaagc gagaacacca 2940
gaagttcgtg ctgtcggggc atgcggcgac gaattggcgg ataaagggga tctgcaggtc 3000
ccgagcctca cggcggcgag tgcgggggtt ccaagggggc agcgccacct tgggcaaggc 3060
cgaaggccgc gcagtcgatc aacaagcccc ggaggggcca ctttttgccg gagggggagc 3120
cgcgccgaag gcgtggggga accccgcagg ggtgcccttc tttgggcacc aaagaactag 3180
atatagggcg aaatgcgaaa gacttaaaaa tcaacaactt aaaaaagggg ggtacgcaac 3240
agctcattgc ggcacccccc gcaatagctc attgcgtagg ttaaagaaaa tctgtaattg 3300
actgccactt ttacgcaacg cataattgtt gtcgcgctgc cgaaaagttg cagctgattg 3360
cgcatggtgc cgcaaccgtg cggcacccta ccgcatggag ataagcatgg ccacgcagtc 3420
cagagaaatc ggcattcaag ccaagaacaa gcccggtcac tgggtgcaaa cggaacgcaa 3480
agcgcatgag gcgtgggccg ggcttattgc gaggaaaccc acggcggcaa tgctgctgca 3540
tcacctcgtg gcgcagatgg gccaccagaa cgccgtggtg gtcagccaga agacactttc 3600
caagctcatc ggacgttctt tgcggacggt ccaatacgca gtcaaggact tggtggccga 3660
gcgctggatc tccgtcgtga agctcaacgg ccccggcacc gtgtcggcct acgtggtcaa 3720
tgaccgcgtg gcgtggggcc agccccgcga ccagttgcgc ctgtcggtgt tcagtgccgc 3780
cgtggtggtt gatcacgacg accaggacga atcgctgttg gggcatggcg acctgcgccg 3840
catcccgacc ctgtatccgg gcgagcagca actaccgacc ggccccggcg aggagccgcc 3900
cagccagccc ggcattccgg gcatggaacc agacctgcca gccttgaccg aaacggagga 3960
atgggaacgg cgcgggcagc agcgcctgcc gatgcccgat gagccgtgtt ttctggacga 4020
tggcgagccg ttggagccgc cgacacgggt cacgctgccg cgccggtagc acttgggttg 4080
cgcagcaacc cgtaagtgcg ctgttccaga ctatcggctg tagccgcctc gccgccctat 4140
accttgtctg cctccccgcg ttgcgtcgcg gtgcatggag ccgggccacc tcgacctgaa 4200
tggaagccgg cggcacctcg ctaacggatt caccgttttt atcaggctct gggaggcaga 4260
ataaatgatc atatcgtcaa ttattacctc cacggggaga gcctgagcaa actggcctca 4320
ggcatttgag aagcacacgg tcacactgct tccggtagtc aataaaccgg taaaccagca 4380
atagacataa gcggctattt aacgaccctg ccctgaaccg acgaccgggt cgaatttgct 4440
ttcgactatc ggcgcgccag agctcatcgt taatgtcttc gtgcgccgtc agtcggcgca 4500
cgttttttct ctctggtacc gtgtcactga tctagtcaat tactcgaagt atccacaagt 4560
gaagcatact aagtaatgta caagaatcaa aaaaatcggc tacgcaagtc gcgtagccga 4620
atcatttaag gatccttcca ttcaggtcga ggtggcccgg ctccatgcac cgcgacgcaa 4680
cgcggggagg cagacaaggt atagggcggc gcctacaatc catgccaacc cgttccatgt 4740
gctcgccgag gcggcataaa tcgccgtgac gatcagcggt ccagtgatcg aagttaggct 4800
ggtaagagcc gcgagcgatc cttgaagctg tccctgatgg tcgtcatcta cctgcctgga 4860
cagcatggcc tgcaacgcgg gcatcccgat gccgccggaa gcgagaagaa tcataatggg 4920
gaaggccatc cagcctcgcg tcgcgaacgc cagcaagacg tagcccagcg cgtcggccgc 4980
catgccggcg ataatggcct gcttctcgcc gaaacgtttg gtggcgggac cagtgacgaa 5040
ggcttgagcg agggcgtgca agattccgaa taccgcaagc gacaggccga tcatcgtcgc 5100
gctccagcga aagcggtcct cgccgaaaat gacccagagc gctgccggca cctgtcctac 5160
gagttgcatg ataaagaaga cagtcataag tgcggcgacg atagtcatgc cccgcgccca 5220
ccggaaggag ctgactgggt tgaaggctct caagggcatc ggtcgacgct ctcccttatg 5280
cgactcctgc attaggaagc agcccagtag taggttgagg ccgttgagca ccgccgccgc 5340
aaggaatggt gcatgcaagg agatggcgcc caacagtccc ccggccacgg ggcctgccac 5400
catacccacg ccgaaacaag cgctcatgag cccgaagtgg cgagcccgat cttccccatc 5460
ggtgatgtcg gcgatatagg cgccagcaac cgcacctgtg gcgccggtga tgccggccac 5520
gatgcgtccg gcgtacaaga tccacaggac gggtgtggtc gccatgatcg cgtagtcgat 5580
agtggctcca agtagcgaag cgagcaggac tgggcggcgg ccaaagcggt cggacagtgc 5640
tccgagaacg ggtgcgcata gaaattgcat caacgcatat agcgctagca gcacgccata 5700
gtgactggcg atgctgtcgg aatggacgat atcccgcaag aggcccggca gtaccggcat 5760
aaccaagcct atgcctacag catccagggt gacggtgccg aggatgacga tgagcgcatt 5820
gttagatttc atacacggtg cctgactgcg ttagcaattt aactgtgata aactaccgca 5880
ttaaagccga gcgatgataa gctgtcaaac atgagatccg ataaatcgat tgatagattt 5940
aaataagaac tgcagaagct agcttagatg ctcgtgaaat tgacgtgggc gctttgcagg 6000
gccgtcttaa tggcgttggt gtccacgagg atcgagtcgg gtgcggaaaa cggacggttc 6060
ttgttggtga aatcgctgtt accaatgtac agcgattcct tgttacgcag cgcctggatg 6120
tgccagcggg accacgaatc ccaatacttc tggcgatccg gcgagatacc ttggctggtg 6180
tagccggtcg tcgggctgtt catcaacgag tcggtgcggt gcgagcccag cgtcagcggc 6240
aacttgatcc gatgcaccgt ggaatcgccg aagatcagct tcagacgcgc gataaattcg 6300
ctatccgcac ccgttttcac acaatcccag acaccggcct tctgcaagac gtcggcacgg 6360
cgaaacagga gcgacgacgg attcagacgc ttcaaggggt acactgcgcg ggcatagaaa 6420
ataccgttgt cttgcaggcg cacccagtcc gagatggagc agatgagctt cggattgagc 6480
aacaaggggg agatttggcg gaacagcttt tccggatggc tccagtcatc cgaatcgtgg 6540
caggtgacga actcgccctt cgcttggatc aagccgatac gcttcgcggc ataggtgccg 6600
acattctgcg gcaggctaat gatcttgatg cgcgtgtctt tgagggcgag ccgctggaga 6660
cgaaacaggg tgtcatcggt gctcgcgtca tccacaatga tcagctcgaa ggaacggtag 6720
gtctgattga ggagcgaaat caccgcattt tccacgcggc gacccgtatt ataggtggtc 6780
atcaggatgg agatcaacgg ccccgtctgg gccgggtacg ggatgctggt gatgatgttg 6840
cacggggaga gcggggagct gttgtccgtc aaggccacgg ggctgaggcc gaagtattta 6900
tagtattcat tcagccgatt caggctaatt tcggcggttt cgcggaaggc gttattttgc 6960
agcagcagga tatccgggct atagacgata tcggatgcgt cgatctgggc gagggtcgag 7020
atggcctttt gggtcaggcc gatccggagt tgcagtgcgg tatacaggtc cagcgggcag 7080
ttgtccacgt tgtccaacag gctcaggcta aaggtcggcg agtaggacgc cagggttttc 7140
gccagttcca ctttctgatg ggtatcggtg aactcgtcct tgaactccat cagcagctcg 7200
ggcgtcaggc tgatgtcgcc gcaggcgatt tttgcgatct tgattgccag tttgcagcgc 7260
caatcggacg gggtatccgt caagttatgc agcgaccagt acatattcag acgatacatc 7320
gcgaggatgc gtttcgactg ccagaaccgg caatcatcct ggatggccgc gagcgcgtgg 7380
acgtagcggc tctttttgag cagccacaag aatttgagat tattgaacat ttattaacct 7440
cctgctagca acttaagtta cgaatcgacg ccgaacaggt cgcgggtgta gactttctcc 7500
gagacatctt ccagttcgct ggtgcggcga ttcgccacaa tgacatcgac gcgctcctta 7560
aaggaattga tgtcgcgctc gacgtaggaa ccgaagaagt agggttcttt caggaccggc 7620
tcgtacacca caatctcgat acccttggcc ttcaaacgtt tcatgacccc ctggatgctg 7680
ctggcccgga aattgtcgct acccgccttc atgatcaggc gatagatacc gaccactttg 7740
ggcttacggg acaggatgtc ctcggccacg aagtccttac gggtcgtatt cgcatccacg 7800
atggcctgga tcaggttttg cgggacgtcg cgataattgg ccaacagctg cttcgtatcc 7860
ttcggcagac agtaaccgcc gtagccgaag gacgggttgt tgtaatgttg accaatgcgc 7920
ggatcgaggg agacgccttc gatgatttgt ttggtatcca ggccgtgcac gctcgcgtag 7980
gtgtccagct cgttaaagta cgcgatacgc atcgccagat acgtgttcgc gaacagtttg 8040
atggcttctg cctcgggcga atccgtcagc aggatcggaa tatccttttt gatggcacct 8100
tccgacagga gttcggcgaa cttccgtgcg cgttccgacg attcgcccac gacaatgcgg 8160
ctcggataga gattatcata cagggctttg ccttcgcgca ggaactccgg ggaaaagatg 8220
atattattcg tgttcagatc gcgcttcagg cgttcggtga acccgacggg gacggtggat 8280
ttgataatga tggtcgcgtt cgggttaatg gacagcacgt cacacgcgac gctttcgacg 8340
ctcagggtat caaagttgtt attaatcgga tcatagttcg tcggggtggc gatgatcacg 8400
tagtctgcat cgcgatatgc ctcgtatttt tccgtcgtcg cgtagaggtt cagcttacga 8460
ttggagagaa acttctggat ttccgggtcg caaatcggcg agattttctt gttaatgagc 8520
tggaccttct tcgggtcgat gtccagggcg atgatgtcgt gtttttggga gaggaggatc 8580
gcaatgctga tacccacata gccgacgccg gccacggcaa ttttcattta ttaacctcct 8640
taagtgaatt caaactagtt tacaagtcgt tttcgatctt ctcccaggta tatttgcgac 8700
attcattcaa gttggtcagc ggcgagtatt tgtacttttt gataccgagg cgcgacaggc 8760
tttcgttcac caccttgaaa tggttttcct tttggatgtc cagtttcttg atcgacgtgt 8820
tctcgccgtg caggacacgg ttgtagcaaa tcttattgat atgcttaaac gggccgactt 8880
cgctgagttt caaatacata tcgtaatcca ccgcattgct gatgctctcg ttgaagcctt 8940
cggtgaggtt ccatgcacgc gccgtgaaca tacggaagtg gtggcagatc atcgcgctcg 9000
tgagcttttc gcggctgtaa atcggccagt tgtagccatt gctaatcaag ttaccttcac 9060
gatcaatatt gcgattggtg gtgtacacgc aggcgaggct caggtctttg cgaaattcat 9120
ccagacacag ttccacggca tcgggctcca ggaaatcatc ggaatccagc tgcccgatgt 9180
agaaaccccg gcacaggcgg actgcggtat tcgaggcgga gccgatgcct ttgtttttct 9240
ggctgatgaa acggacgcgc gggtggtttg cgtaatgttc ttgcaggatg cgcagcgtat 9300
catcggtgct cccgtcatcg cagatgcaga cctccagatc ggtgatcgtt tggttcagtg 9360
ccgattcgac gcagcgcacg atatatttgc tgcaattata cgcggggatg tagatgctca 9420
ccaggggcac acgtttcagg gtggcgctct cgattttctc cttcttgcga taaaagtagg 9480
gcaccttctg ctgcaacagc tggacggtaa tgtttttacc tgccgcgcga tcggtttcgt 9540
tctccttacc gggcggttcc tgatgatatg ccatcgcgcc ttccacgcta cggaaataac 9600
aaccctcgcg gtacagccga tagccgaact cattatcctc accgccccaa tgcgtgaact 9660
cttcgtcaaa ccaacccgcg cgaaacagcc acttctttgc aaacgccaca ttgccaccgc 9720
taaagaaccg gaacggggtg ttgcacaggc gcagattgtc ggtattcttg aaatgttcga 9780
tgcgccaatc gacggatttg ttctgctcga ccttgcctgc gacctgatta ttggtaataa 9840
tctccgggat ttcattgatc aggcttttct gggacaaaaa gtccagatag gtatgcttcg 9900
acgtgtcgat gtatttacgc gggccaatca gtgccacgtt atcatccacg gccaggagtt 9960
ccatatagga ctgcacccac aacgggttcg gcgccatatc gcagtccaag atcgccacgt 10020
agttgtattt cgctgcccgc aggcccaggt tccgcacggc gcacagctgg tagccgtagt 10080
ctttctggcg gacgtatttg atgttcagca acgactcgaa ctcgcggacg atctcttcga 10140
tgttttcctt ggaaccgtca tccgcgacga tgacctcata gtcataaatc gttttctgat 10200
tgcagaggca ggccagggtg atcgccagga ttttggcgcg attgtacgtc ggaatcacga 10260
tggacaggcc gtcgatgatc agttgcttgc gcggataatc atccagttct ttacgtttcc 10320
ctgcccagac gtagtcgttc gtgctttccg gcagcggcgg caaggtcagg tcgctcggcc 10380
aatccagcgg aatgggttcg acttctttca attcggcgcg ctcggatttc tttgcggtaa 10440
tttcccgata tttgctaatg atttcattct tttccacctc attcagcgag atcgcctttg 10500
cattgctgca cataattttg gttgccgcgt cgatatcaat gaccgctttc cgattcagct 10560
tgtccacttc ttcgctcaga ttcagggcgg tttggcacag cttgatattg gcttccaccc 10620
agctcacatc atagatttcc gccacttttt caaacaggga gagggcttgg cggtagttct 10680
tattcttata cagattgatt gcctggttca aaatgctcat ttattaacct cctactagtg 10740
aattttcgaa aatgaacggt ccgttaaata tagccattcg gattcttcat ctgccagcgc 10800
caggcgtcct ccagcatggt ttcgagttcc cgcttggctt tccagttcag atatttgttg 10860
gccttttcgg gggaggacca gctctccgcg atatcaccgt cacggcggct cacgatttca 10920
tacggaatcc gcacgccgga aatcttttca aaggtggaca ccagttccag caccgaataa 10980
cctttacccg tgcccaaatt aaagacgtgg tagttggtgt tattgtcgcg gaagagatag 11040
gacagcgctg cgacgtgccc ttcggccagg tccatcacat ggatatagtc acggaccccc 11100
gtgccgtctt tggtgggata atcaccaccg aacaccatca gtttttccag tttccccatc 11160
gcgacctgca agatgtacgg caccaagttg gaggggatgt ctgccgggct ttcaccaatc 11220
ataccggatt cgtgggcgcc cgtcggatta aagtagcgca agcagaggaa attcgtgtcg 11280
gagtatttct tggcgatgtc gcggatcatc agctccgaga tgtacttgga cgtaccatac 11340
ggattcagcg tgccaccaat atggcagtct tcggtgacgg gcatgatctt gctttcccca 11400
tacaccgtcg ccgacgagct aaagatgaag ttggcgacgt cgttcttgat ggcgcaattg 11460
atgagttgca gggtgccgct cacgttgttg tcatagtaga agatgggctt gatcaggctt 11520
tctgcgaccg atttcgcacc tgcaaagtgc atgatgcagt cgaatttgtg tttcttcagg 11580
atctggttca cttccttctc gttgttgata ttgagttcgt agaacgtgac tttcttcttt 11640
gcgatcagct caatgcgacg gatgctttcg cagctgctgt tgatgagatt gtcaatgatg 11700
acgacattgt agcctttgtt cagcaggcag agcgacgtgt ggctgccgat gtagcctgca 11760
ccgccggtga ccaggatgtt catttattaa cctcctcggt ccgaattaac ctaggttatg 11820
aggtcagcat tgcttcttca cgcgtttagt agttgttttg ttcggtgata tattcttcaa 11880
tgccttcttg cacgtcttca tggaacgaca cggcgttgtc gtctttaaac acgattgcca 11940
catcgcagaa ctctttcaac gagttcagcg agtgcgacac catgaggaag gagctttcct 12000
tatgacgctc cttgaagagt tgggcacatt tttccttgaa acgggcgtcc cccaccgccg 12060
tcacctcgtc cacgatgtag taatcgaact tgaacgccat gctcaggccg aagccgaggc 12120
ggctgcgcat accgctcgaa taggtcttga tcggcatatc aaaatacttc cccagctccg 12180
cgaactcttc cacaaactca atcttttctt tcagctcctc ctgcttcgcg tacagccggg 12240
ccacgaactt cacgttttca cgcccggtca agctgccctg gaagccgcct gccagaccca 12300
ccggccacga gatcgtttta ttcgtgatga ttttaccgct atccgggcgg tcgatgcccc 12360
caatcatgcg caacagcgtg gatttacccg ccccattgcg cccgatgaac gccacgcttt 12420
tgccgctggg gatctcaatg ttcaggttct tgaagacata gtgacggccc accggggtgc 12480
ggtagctttt cgtcaggttt tcgatcttaa tcatgaggtc aacattgcct cctcacgcgt 12540
acggtacagg gccaaaccaa taaacagggt caccagggtg aacattgcca gataattcag 12600
gctgacccct tcgctgatat aaccgggcat cacggcctcg cggctcagtt cgacgacgtg 12660
caccagggga ttccacagca ggtacgacca atactgcttc ggaatggagt gcagcgggaa 12720
catgatgcac gaaataaagt acagcggctt cagcaagatc ggcaagactt tctgcatttc 12780
ggggaacgtc ttgcccacga ccatgaagat caggcccaca ccgcacgaca ggatgatcag 12840
gaggctccag gtgagcacaa attgcaggaa gttggtaatc tcgaaatatt cgcccgccat 12900
ccagatgatc agcatcagga ggatgtagac cgccacatag atcagcgttt ccaagagggc 12960
gcgtgcaatg atcgtgtcga tcggcttcac gggccggtag ttaaacagcc cctgattggc 13020
ttcgatggcg cccacggagc gattgctgat gctgctgaaa ataaagaacg ggatcaggcc 13080
attgagcagg aacaccggga aggagatatc cggcatggtg cgatgcatga tatagccaaa 13140
gatcccgagc agaatcagca gatgtgcgct cggttccagg atcgcccaca gatagcccag 13200
gcgaaacttg ccaaagcgcg tacggatttc gcggagaaac agtgcttcga ccgtcacttt 13260
ctggacttca aaacccgaac gtgccattta ttaacctcct ggtaccaatc tagattgttt 13320
aaacagatcc aatctagatt gtttaaactt ctgcagaaca cgcggtgtta acgtttctta 13380
tacttcttaa ttttgttaaa gatcatttcg ccgtagtaca ccgcattgac ctgggtcttc 13440
accagcaagt agccgcgaaa tttcttaaac aacttcatgt tcggtttaaa gtcggcttgc 13500
cagaactgat gcaaatgccc ctggtacgtc agacccttga tatcgtacaa ggcgttgccc 13560
atgactttca ggggcttgtt gtggatcaac gcggaaatgc cggccgtgct attgatggtg 13620
accaccgctt tggcgtggcg caacagctcc ggcatgggca gatcgtgcac atagatgaca 13680
cgttcatcca aaccgtattc cttcgacaga cgcttgatca acgggcggta caggcggtgc 13740
ccgcgatcca tcgggtgatg tttgatcacc agataggact ccttgggggc cttgcgggaa 13800
aagctgtaca tcacttcgtt gatgtaatca cgcacatcat tatagttgct atggttgcgg 13860
atctggctgt cgttgtacac ttgcaggacc gccaggtaat agcgctgatc cagctcgttc 13920
atcaggcggg ggaggacctt gcgttgggtg accttataca gctgtttgcg ccagtaggcg 13980
cggacccagc agcgcgcttc ataccacggg ctgaacgatt tgtggtggcg atagcgcgga 14040
aattcgtgac gatagtgcca acccatcagg taataccaca tggcgtggcc gatgcgcttc 14100
atggtgctcg gtttcaggtt ctcgacgtgc ggcgtcggca tatcgggcaa tttgcggtaa 14160
aagtccggat cgcggggcaa gctgctatag gcgttcacac cgccttcttc cacggtgata 14220
aattgcggac gcaggtagcc ttcctcgaag gccagaaaac gaatcccctt cgacttggcc 14280
cagcgtttgg cctccttgtg cagcaggcgg cagtcaccga aacacaaaat cgtgtcaaag 14340
tcatactgac gatgcaagtc ccgcagccaa ccggggaact ccttcggggt ttggtagtac 14400
gccaggtatt ggcggtggcg gcagtagaag cgatcaccgc cattaaagac gacgttgacc 14460
gcgttgcgac cgaggctctc caaccattcc gccacatcgt tgaagaacgg acccatcgga 14520
ccttggagca ggaggtactt tttaccgctc aacagcaccg tcagcgcatt gccgtgcatt 14580
tattaacctc ctaacacgcg gtgttaagcg ttttcggcga gctcttaacc aaagcgcact 14640
ttgcagaaca tgatcaactt gcgatagtag cgaatcacac ggccggcttt cttgcgggtg 14700
ataaagatgg gtttgcgggg cgttttgatc agatattctg ccgcttcctc caccgtgatc 14760
ggctgcaacc gcgtcggatg aatataggtg ggatagacaa tcagggcttg atagatcagg 14820
tcggcgatgg tcagccgccg ctcgcgacgg gggcagtggt gctcatcgac ggtcaggccc 14880
cacgaggcgt agaacggcag gccgtagcag tgcacctgtt taccgtgcag caatgcttca 14940
aagccgctga ggctcgtcat cgtgtgcacc tcgtccgcac gctgaataca ctgaatgata 15000
tcggcatcca gtgcctggta gtctgcgagt tccgcgatct gttccgccgg aatgtcaccc 15060
ttacggttgc cgacgagcac atcggggtgc ggcttgtaga tgatgtaggc gtgcggatta 15120
cgttcccgca cggtgcgcag cagctccaga ttcgacttga tcgacacggt gcccgtctta 15180
atcgacgcat cgtcttccac ctggcccggc accaggatga ctttcttgtc cttcgcttct 15240
gccgggaggc tgaaatcggc ccccaggtta tatttgctca atttgctttc caccagacgt 15300
tggcgcaact tttccgcgcg catctggtgc gcgagggtca gctggctgtg attcagcagg 15360
acctccagtt ccgacggacg ggtggcatcg taatagatac cgcgcttatc caggaccagg 15420
ctcaacggcg gcagcagatc gctccccagg ccggagctgc gcaggaagcc gtcttccatg 15480
cgccacagcg gcagggattt gcgctgtgcc tccgcacgcc attgctgttc gcctttcacg 15540
ccccacacga cgcaggcgct tgctgcggta cagcgacggg aaaaggagag acgattcgtg 15600
gccgtttgca ggaagggctt caggatcgcg cttttccaca gggtcaggcc cggcacccag 15660
agataaccat tccgctgttg caggtgacga cgttgcagct ggagccattg gagcaccgtg 15720
aacagggccg acacctcccc ggtctgcgga tcaatgtagc ggcaatagcg cagataggcc 15780
gctgcgaaca gttcctccag ggtggccgag ccgcgacgcg ccgacagcag cgccgattgg 15840
gggtggcggt catcggtgag gccccaccct gcataccagg gttggccaaa gcaggtcacg 15900
ggcttaccgg ccagcagggc ttcaaaaccg tactgggagg tcacgacgta cacgcgggac 15960
acatgacgca gcagggactg cggcgacacg ttttccgcaa tcaggcgcac gcgctgggtg 16020
gcacgcaagt ccgcgaagta gccggtcttt ttcccttcca ggacatcggg atgcactttg 16080
acccagattt ctgcctgcgg gttttccgcc atcgctgctt ccagcattgc ggcgaactca 16140
tgggggcctg cgttgccgta ggtcacgctc atgtcattga aggtctggtc caccaccagc 16200
acgatgttcg tgcgctcgct ttcatccgcc acgaacgccg gtgccaggtt gtacttgctc 16260
atgtcgcccg tcacaatggt gtgcatcgcc tcgcgcgcct gatccgccag ggccgcgttg 16320
ccggccttgt cctgcacgag tttttccagc gcgctcggtt tcgaggcgtc gtagtaaatg 16380
ccgcagtcat ccacgacgag cgagaggggc ggttcaccgt tcacgcccag gtccagcgag 16440
cggacgaaac catcctccaa gcggatcacc ggcttgcctg cggctttggc gatggccacc 16500
ggctttgcgg ccgaggggcg gtgcccccac accgcgattg catccacttc ctgcgggacc 16560
gggcgcagca gcgacagctt ttggcagggc tgggcgagga atttttccag gtgcggaata 16620
cgccaaatgc cggggctata aatgccaatc atgcgttctc cgcgagctcc tgcgccatca 16680
gggcccggac cttctccaag cacgccgggg tatcgacgcc gggaccggtc gcggcgacct 16740
cgaaggtgcg aatgttaatg cccgcgctca tcagccgcag ttgctccagg gattcggcct 16800
gttcgggcat ggactccggc aactggctgt aattttgcag gacatcccgc cgataggcgt 16860
agatcccgac gtgcttcagg tagcgcgcct tctcggcgtt gcgcgggtac ggaatggggg 16920
agcgggagaa atacagggcg tcctgccgcg tgttcaccac gaccttgacg gtggacggtt 16980
cggcggcttc tgccgcgctg atcgcatgac acagggtcgc caccggcagc gccgggtcgt 17040
cccgcatacc ttgcagcagg gtttcgacgt cacgcgggcg aatcatcggc tcatcccctt 17100
gcaggttgat atagatatcc gcctccacct tatgcatgac ttccaccagg cgatcggtgc 17160
cgctctcatg atcgttgcgg gtcatgatcg ctttgccgcc gaacgcctgg actgcctgct 17220
ccacacgcgg gtcgtcggtt gcgacccaca cctctgccac gcctgccact tgcagggccc 17280
gttcgtagac gtgctggatc atcggtttcc cgacgatatc cagcagcggt ttgcccggca 17340
gacggctgct gccgtagcgt gccgggatca caatcacggc cttcgacatt tattaacctc 17400
ctcgagttac agcgacagaa tcactttcgc gcccaccgcc agttggtaca gaatggtgct 17460
gataccgcgc gtcacttcga tgttcttcga ctcgtatttc ggcaacacca taatttcatc 17520
accgggtttc agggaatcga cgtcttctgc gttcaccgct gcgccgttct gacggatgac 17580
gataatacgg gcgttgccgg acttctgggt cagcccaccg cacttctcga tgtagtcctc 17640
ggtcgtcata cctttctgcc acgacaccgc gttcgggaac agcacttccc cgtggaccat 17700
gaccaacgac gtcttttcgg gaatattgat cacgtcgccg tcctccagga ggacggagtc 17760
aatgttgctt tcattgagga tcacttcgcc cttcggcacg acggtgcggg ctttcgcgac 17820
gaagcgggag atcagttggg cttcctgcat acgcaggctg gcctcttcct tggtgctgct 17880
ctgtgcgctg aggctggcct cttcgagctt ttgcagggac aaattcagca tttctttctg 17940
ccgttgcgcg acgctcggcc gatacaactg cacggcgttc atctgcgaca tggagttcgg 18000
gcgcactttt tcgagcacgg cccgcatggt gctaccgtag ggcagcacca tggcgtgttc 18060
cccggaatgt gcgccttcca cacgcacttg aatggtgccc gcatagcggt cggtggagac 18120
aatgagggta tcaccgtttt gcagcatacg ccccggtgcg gacgagatcg gataatattc 18180
cgagcgcttc tggaggccct gcttccgcat aatcgtgata tgggtcgcac ccggtttggg 18240
acgtgcccag gacagtgctt cggtgaccgg gatgctcgat tcgcgaaatt caaagtcgta 18300
ggaattgaac acatcgccct gcaccgagaa cgtatgctgg cgcggaccca caatgatcgt 18360
atcaccgtcc gcaaactggg acagccccag tttgccgttg agcaggaagt catagaggtt 18420
gacgttcgag cgcacacgat tgccgcgttt cacgacgatg tccacgtagc tgccgcgttc 18480
cgggtccaca ccacccgcct tgatcaggta gttcagcagg ctgtcggagg tgacaccgcc 18540
gtacaggccg gggttgcgga caaagccggt cacatagacc ttgaccggct gcgcctgcaa 18600
gagcgacgca tagacgttca cgttgctctg gtagacttcc ttcaccttgc tcgtcaccag 18660
cgcgttcaac tgggagttcg acacacctgc gactttgacg gggccgacat tcggcaggaa 18720
gatgttgccc ttcgggtcca cctggagtgc gccatcgaag gtgaacgcac cccacaggcg 18780
gacctggatg gaatcgccgg gattcaggat gtagtccgga ttgaaaccca cggttgcccc 18840
cgagtctgcg ctcgtaccgt tgaacagctg cgccccgaac atacggctca tcacgaccgg 18900
gggtgcgggg ggcggggtgt tatcgaagcc gctcatgttc tgggtgtcgc ttttctgccc 18960
gttcaggatg ccggtcaacg gtgcggcacc cgtgaggttc ggatcggcat taatgtcgat 19020
ggttgcgctc gcctgtgctg catggcacgc tgcgatcagc aggatcgact taaacagctt 19080
catttattaa cctcctcgag aagtcgactt agtcacggtg gtcttcaatc accgccagga 19140
gcaatttcag ggtgccaaag agcaggcaac acaccagcag ccaacacgcg atcaaatacg 19200
ggatattcgg gaaggagctt tcctggggca gctgcgggga cgagatcacg ctcaggactt 19260
tcagcttacg ggccgcttcg acacgggtct tttcgatgct ggtgagcgtg agcttgtaca 19320
actcggtatt gaactcgacc ttggatttga tctcctcaaa atccacggcc atgcggttca 19380
gtttatcgcc ctggggtgcg gtaattttcg acttttcttc gtcgatctgt gcctggaggc 19440
tctgaattgc attgcgggcg ctcacgactt ggggcgcatc ctcgcgcagg tacgtgagca 19500
ggttgcgcag gtcggcttcc atctgaattt tctggcccat cagcgtattc accagggtgg 19560
atgccgcctg ggcctgtgcc tgcgggtcca gcacattgtt gttgtcttgg taggacaaca 19620
attcggcttt cgatgcatcc agccgctggc gcgctttttc catttcggtt tccgcaaacg 19680
ccaattgatc gcgggcgata cggtgcgaca tttcattgat gaaccgctcg gattccttga 19740
gcacggtctg gttgaatttc agcgcgaact cgggcgaaaa gccctgggtc tggatgttca 19800
gcagcccggt cttgtcgtcg tagctgacgt tgatgcgatc tttatagtac ttcaggaacc 19860
cctcggcggt ttcatccttg gacagatggt tcaggaagtc caggcccgaa tgggagaacg 19920
cttcgcggaa gttcagctgt ttatccagcg cggccagcat atccgggctg ttgatgtatt 19980
ccttcaggta cagtgcgtct tcggcggacg acgggttgga ggcacccaac agcaggccga 20040
agttcaggct gccggagttg agatcgtcgc tgcgcttgat ggccaccttg ctttccgaca 20100
tatagcgggg ctgggagaag atcgccaagt agatcagcag caccgccatg ggtgccagaa 20160
taatgatttt tgccaggtgc ttctgaatat ctgccaggct gatcgcgctc agacgcgcac 20220
gcatccacga gacggcgctt ttcactttga tcagcattta ttaacctcct gtcgacaaca 20280
cgtgttaatc gaaaatgcgc accaacccgg tcaccttatt tgctttgttg gtcaccagca 20340
gggtcgagac gcggtgtttc tgcatcttct cttctgcttc gatgatcatg gtgtcttcgg 20400
gcaaggtcag cggttcgcgg gtcatcatct gtgcggccgt tgcgctcgtc aggctgtctt 20460
ctttctccat aaagcgccgc agatcgccat cggtgatgat gcctgccagc ccaccttccg 20520
catcttcgac catcaccata ccctggcagc ccgaggtgat gcgctgaatg accgttttga 20580
agctggcatc gagctgcact gccggcacat catgttgcat cacgtcggcg acgcgggtca 20640
gcaggcgccg acccaggctg ccaccggggt ggtagcgtgc aaagtcattg ggcataaact 20700
tacgctggtg aatcatcgcg atggccagcg cgtccccgat cgccatcgtg agcgtcgtgg 20760
aggtggtcgg ggcgagattg ttcgggcacg tttcgttcgc catgtgcagc tccaggaccg 20820
catctgcatt tttggccagg gtgctattcc cgttattggt gattgcgatg atgcgattgc 20880
cgaagttctt caggctcggc accagtttca ggatctcgtc cgtctcaccg ctcgccgaaa 20940
tcaagatgag caggtcatac ggggtgatca tgcccagatc accatggaac gcttccgccg 21000
gatgaataaa gaaggagggc gtcccggtcg aggccaaggt cgccgacatc ttgcggccca 21060
catggccgct tttacccatg ccgctcagga tgacgtgccc tttacaattc atgatgagat 21120
tcaggacgcg ctggtactga ccgctatcca gttgtttgga caggttttgc agtgccgcgc 21180
tttgttcggc cagggtctgg cggacgctcg taatcagata cggatcaatg gtcgaggact 21240
ggtcatccgg caagtggcgt tcgctcattt attaacctcc tcacgtgtta attaagtaat 21300
cgatagtgat ttaaatatgc aagatctagt tacctgcagg attattgttt ctgttgcata 21360
aagcctaagg ggtaggcctt tctagagata gccatttttt gcactcctgt atccgcttct 21420
tgcaaggctg gacttatccc tatcaaaccg gacactgcag gctgacaagc tttcattaca 21480
tatgaagagt ttgtagaaac gcaaaaaggc catccgtcag gatggccttc taagaaggct 21540
cgagtggcgc gcctaagtcg aatttctgcc attcatccgc ttattatact tattcaggcg 21600
tagcaccagg cgtttaaggg caccaataac tgccttaaaa aaattacgcc ccgccctgcc 21660
actcatcgca gtactgttgt aattcattaa gcattctgcc gacatggaag ccatcacaga 21720
cggcatgatg aacctgaatc gccagcggca tcagcacctt gtcgccttgc gtataatatt 21780
tgcccatggt gaaaacgggg gcgaagaagt tgtccatatt ggccacgttt aaatcaaaac 21840
tggtgaaact cacccaggga ttggctgaga cgaaaaacat attctcaata aaccctttag 21900
ggaaataggc caggttttca ccgtaacacg ccacatcttg cgaatatatg tgtagaaact 21960
gccggaaatc gtcgtggtat tcactccaga gcgatgaaaa cgtttcagtt tgctcatgga 22020
aaacggtgta acaagggtga acactatccc atatcaccag ctcaccgtct ttcattgcca 22080
tacggaattc cggatgagca ttcatcaggc gggcaagaat gtgaataaag gccggataaa 22140
acttgtgctt atttttcttt acggtcttta aaaaggccgt aatatccagc tgaacggtct 22200
ggttataggt acattgagca actgactgaa atgcctcaaa atgttcttta cgatgccatt 22260
gggatatatc aacggtggta tatccagtga tttttttctc cattttagct tccttagctc 22320
ctgaaaatct cgataactca aaaaatacgc ccggtagtga tcttatttca ttatggtgaa 22380
agttggaacc tcttacgtgc cgatcaacgt ctcattttcg ccaaaagttg gcccagggct 22440
tcccggtatc aacagggaca ccaggattta tttattctgc gaagtgatct tccgtcacag 22500
gtatttattc ggcgcaaagg gcctcgtgat acgcctattt ttataggtta atgtcatgat 22560
aataatggtt tcttagacgt caggtggcac ttttcgggga aatgtgcgcg cccgcgttcc 22620
tgctggcgct gggcctgttt ctggcgctgg acttcccgct gttccgtcag cagcttttcg 22680
cccacggcct tgatgatcgc ggcggccttg gcctgcatat cccgattcaa cggccccagg 22740
gcgtccagaa cgggcttcag gcgctcccga aggt 22774
<210> 40
<211> 22948
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Sequence
<400> 40
ctcgggccgt ctcttgggct tgatcggcct tcttgcgcat ctcacgcgct cctgcggcgg 60
cctgtagggc aggctcatac ccctgccgaa ccgcttttgt cagccggtcg gccacggctt 120
ccggcgtctc aacgcgcttt gagattccca gcttttcggc caatccctgc ggtgcatagg 180
cgcgtggctc gaccgcttgc gggctgatgg tgacgtggcc cactggtggc cgctccaggg 240
cctcgtagaa cgcctgaatg cgcgtgtgac gtgccttgct gccctcgatg ccccgttgca 300
gccctagatc ggccacagcg gccgcaaacg tggtctggtc gcgggtcatc tgcgctttgt 360
tgccgatgaa ctccttggcc gacagcctgc cgtcctgcgt cagcggcacc acgaacgcgg 420
tcatgtgcgg gctggtttcg tcacggtgga tgctggccgt cacgatgcga tccgccccgt 480
acttgtccgc cagccacttg tgcgccttct cgaagaacgc cgcctgctgt tcttggctgg 540
ccgacttcca ccattccggg ctggccgtca tgacgtactc gaccgccaac acagcgtcct 600
tgcgccgctt ctctggcagc aactcgcgca gtcggcccat cgcttcatcg gtgctgctgg 660
ccgcccagtg ctcgttctct ggcgtcctgc tggcgtcagc gttgggcgtc tcgcgctcgc 720
ggtaggcgtg cttgagactg gccgccacgt tgcccatttt cgccagcttc ttgcatcgca 780
tgatcgcgta tgccgccatg cctgcccctc ccttttggtg tccaaccggc tcgacggggg 840
cagcgcaagg cggtgcctcc ggcgggccac tcaatgcttg agtatactca ctagactttg 900
cttcgcaaag tcgtgaccgc ctacggcggc tgcggcgccc tacgggcttg ctctccgggc 960
ttcgccctgc gcggtcgctg cgctcccttg ccagcccgtg gatatgtgga cgatggccgc 1020
gagcggccac cggctggctc gcttcgctcg gcccgtggac aaccctgctg gacaagctga 1080
tggacaggct gcgcctgccc acgagcttga ccacagggat tgcccaccgg ctacccagcc 1140
ttcgaccaca tacccaccgg ctccaactgc gcggcctgcg gccttgcccc atcaattttt 1200
ttaattttct ctggggaaaa gcctccggcc tgcggcctgc gcgcttcgct tgccggttgg 1260
acaccaagtg gaaggcgggt caaggctcgc gcagcgaccg cgcagcggct tggccttgac 1320
gcgcctggaa cgacccaagc ctatgcgagt gggggcagtc gaaggcgaag cccgcccgcc 1380
tgccccccga gacctgcaga tccacatcct tgaaggccgc agcgacgagc agaaggaaac 1440
cctcattcgg gaagtcagcg aggccatctc gcgctccctg gatgcgccgc tgaccagcgt 1500
gcgagtgatt atcacggaga tggccaaggg ccacttcggc atcggcggcg aactggccag 1560
caaggtcaga cgctgaagtg gagatgccca agggcacttc gggtcgagga acccgacctg 1620
cattgggacg cggccacgga gagcgcgggc aaacgccggc actatagcca gtggagtttg 1680
taaaacgcta tttcagagct tggagagtgt ctaagaaagc cggggcgatg ccaacccatc 1740
ccttcttcgg ctatgcatcg ttcgtaatca agccacttcc tttttgcatt gacgcagggt 1800
gtcggaaggc aactcgccga acgcgctcct atagttttca gcgaagcgtc ccaaatgtaa 1860
gaagccgtag tctagggcta tctcagttat actacgcaca ttggcactgg gatcgttcaa 1920
gcaggcgcgg atgctttcga gcttgcggtt gcggatgtag ttcttcggcg tggtgccggc 1980
atgcttctcg aacaaattgt agagcgagcg tggactcatc atcgccagct ccgctaaccg 2040
ctcaaggctg atattccgtt tgagattctc ctcaatgaat tgaacgactc gctcgaaaga 2100
cgggttacct ttgctgaaaa tttcacggct gacattgctg cccagcattt cgagcagctt 2160
ggaagcgatg atccccgcat agtgctcttg gacccgaggc atcgactttg tatgttccgc 2220
ttcgtcacaa actaacccga gtagattgat aaagccatcg agttgctgga gattgtgtcg 2280
cgcggcgaaa cggataccct ccctcggctt gtgccaattg ttgtcactgc atgcccgatc 2340
aaggaccact gagggcaatt taacgataaa tttctcgcaa tcttctgaat aggtcaggtc 2400
ggcttggtca tccggattga gcagcaatag ttcgcccggc gcaaaatagt gctcctggcc 2460
atggccacgc cacaggcaat ggcctttgag tattatttgc agatgataac aggtctctaa 2520
tccaggcgag attaccctca cgctaccgcc gtagctgatt cgacacaggt cgaggcatcc 2580
gaagattctg tggtgcagcc tgcctgccgg gcgcccgccc ttgggcaggc gaatagagtg 2640
cgtaccgaca tactggttaa cataatcgga gactgcatag ggctcggcgt ggacgaagat 2700
ctgacttttc tcgttcaata agcaaaaatc catagttcac ggttctctta ttttaatgtg 2760
ggctgcttgg tgtgatgtag aaaggcgcca agtcgatgaa aatgcatctc gacgtgatgc 2820
gtatacgggt tacccccatt gccacgttgc gccatccttt ttgcaatcag tgaccacttt 2880
tccaagcaaa aataacgcca agcagaacga agacgttctt tttaagaagc gagaacacca 2940
gaagttcgtg ctgtcggggc atgcggcgac gaattggcgg ataaagggga tctgcaggtc 3000
ccgagcctca cggcggcgag tgcgggggtt ccaagggggc agcgccacct tgggcaaggc 3060
cgaaggccgc gcagtcgatc aacaagcccc ggaggggcca ctttttgccg gagggggagc 3120
cgcgccgaag gcgtggggga accccgcagg ggtgcccttc tttgggcacc aaagaactag 3180
atatagggcg aaatgcgaaa gacttaaaaa tcaacaactt aaaaaagggg ggtacgcaac 3240
agctcattgc ggcacccccc gcaatagctc attgcgtagg ttaaagaaaa tctgtaattg 3300
actgccactt ttacgcaacg cataattgtt gtcgcgctgc cgaaaagttg cagctgattg 3360
cgcatggtgc cgcaaccgtg cggcacccta ccgcatggag ataagcatgg ccacgcagtc 3420
cagagaaatc ggcattcaag ccaagaacaa gcccggtcac tgggtgcaaa cggaacgcaa 3480
agcgcatgag gcgtgggccg ggcttattgc gaggaaaccc acggcggcaa tgctgctgca 3540
tcacctcgtg gcgcagatgg gccaccagaa cgccgtggtg gtcagccaga agacactttc 3600
caagctcatc ggacgttctt tgcggacggt ccaatacgca gtcaaggact tggtggccga 3660
gcgctggatc tccgtcgtga agctcaacgg ccccggcacc gtgtcggcct acgtggtcaa 3720
tgaccgcgtg gcgtggggcc agccccgcga ccagttgcgc ctgtcggtgt tcagtgccgc 3780
cgtggtggtt gatcacgacg accaggacga atcgctgttg gggcatggcg acctgcgccg 3840
catcccgacc ctgtatccgg gcgagcagca actaccgacc ggccccggcg aggagccgcc 3900
cagccagccc ggcattccgg gcatggaacc agacctgcca gccttgaccg aaacggagga 3960
atgggaacgg cgcgggcagc agcgcctgcc gatgcccgat gagccgtgtt ttctggacga 4020
tggcgagccg ttggagccgc cgacacgggt cacgctgccg cgccggtagc acttgggttg 4080
cgcagcaacc cgtaagtgcg ctgttccaga ctatcggctg tagccgcctc gccgccctat 4140
accttgtctg cctccccgcg ttgcgtcgcg gtgcatggag ccgggccacc tcgacctgaa 4200
tggaagccgg cggcacctcg ctaacggatt caccgttttt atcaggctct gggaggcaga 4260
ataaatgatc atatcgtcaa ttattacctc cacggggaga gcctgagcaa actggcctca 4320
ggcatttgag aagcacacgg tcacactgct tccggtagtc aataaaccgg taaaccagca 4380
atagacataa gcggctattt aacgaccctg ccctgaaccg acgaccgggt cgaatttgct 4440
ttcgactatc ggcgcgccag agctcatcgt taatgtcttc gtgcgccgtc agtcggcgca 4500
cgttttttct ctctggtacc gtgtcactga tctagtcaat tactcgaagt atccacaagt 4560
gaagcatact aagtaatgta caagaatcaa aaaaatcggc tacgcaagtc gcgtagccga 4620
atcatttaag gatccttcca ttcaggtcga ggtggcccgg ctccatgcac cgcgacgcaa 4680
cgcggggagg cagacaaggt atagggcggc gcctacaatc catgccaacc cgttccatgt 4740
gctcgccgag gcggcataaa tcgccgtgac gatcagcggt ccagtgatcg aagttaggct 4800
ggtaagagcc gcgagcgatc cttgaagctg tccctgatgg tcgtcatcta cctgcctgga 4860
cagcatggcc tgcaacgcgg gcatcccgat gccgccggaa gcgagaagaa tcataatggg 4920
gaaggccatc cagcctcgcg tcgcgaacgc cagcaagacg tagcccagcg cgtcggccgc 4980
catgccggcg ataatggcct gcttctcgcc gaaacgtttg gtggcgggac cagtgacgaa 5040
ggcttgagcg agggcgtgca agattccgaa taccgcaagc gacaggccga tcatcgtcgc 5100
gctccagcga aagcggtcct cgccgaaaat gacccagagc gctgccggca cctgtcctac 5160
gagttgcatg ataaagaaga cagtcataag tgcggcgacg atagtcatgc cccgcgccca 5220
ccggaaggag ctgactgggt tgaaggctct caagggcatc ggtcgacgct ctcccttatg 5280
cgactcctgc attaggaagc agcccagtag taggttgagg ccgttgagca ccgccgccgc 5340
aaggaatggt gcatgcaagg agatggcgcc caacagtccc ccggccacgg ggcctgccac 5400
catacccacg ccgaaacaag cgctcatgag cccgaagtgg cgagcccgat cttccccatc 5460
ggtgatgtcg gcgatatagg cgccagcaac cgcacctgtg gcgccggtga tgccggccac 5520
gatgcgtccg gcgtacaaga tccacaggac gggtgtggtc gccatgatcg cgtagtcgat 5580
agtggctcca agtagcgaag cgagcaggac tgggcggcgg ccaaagcggt cggacagtgc 5640
tccgagaacg ggtgcgcata gaaattgcat caacgcatat agcgctagca gcacgccata 5700
gtgactggcg atgctgtcgg aatggacgat atcccgcaag aggcccggca gtaccggcat 5760
aaccaagcct atgcctacag catccagggt gacggtgccg aggatgacga tgagcgcatt 5820
gttagatttc atacacggtg cctgactgcg ttagcaattt aactgtgata aactaccgca 5880
ttaaagccga gcgatgataa gctgtcaaac atgagatccg ataaatcgat tgatagattt 5940
aaataagaac tgcagaagct agcaacttaa gttacgaatc gacgccgaac aggtcgcggg 6000
tgtagacttt ctccgagaca tcttccagtt cgctggtgcg gcgattcgcc acaatgacat 6060
cgacgcgctc cttaaaggaa ttgatgtcgc gctcgacgta ggaaccgaag aagtagggtt 6120
ctttcaggac cggctcgtac accacaatct cgataccctt ggccttcaaa cgtttcatga 6180
ccccctggat gctgctggcc cggaaattgt cgctacccgc cttcatgatc aggcgataga 6240
taccgaccac tttgggctta cgggacagga tgtcctcggc cacgaagtcc ttacgggtcg 6300
tattcgcatc cacgatggcc tggatcaggt tttgcgggac gtcgcgataa ttggccaaca 6360
gctgcttcgt atccttcggc agacagtaac cgccgtagcc gaaggacggg ttgttgtaat 6420
gttgaccaat gcgcggatcg agggagacgc cttcgatgat ttgtttggta tccaggccgt 6480
gcacgctcgc gtaggtgtcc agctcgttaa agtacgcgat acgcatcgcc agatacgtgt 6540
tcgcgaacag tttgatggct tctgcctcgg gcgaatccgt cagcaggatc ggaatatcct 6600
ttttgatggc accttccgac aggagttcgg cgaacttccg tgcgcgttcc gacgattcgc 6660
ccacgacaat gcggctcgga tagagattat catacagggc tttgccttcg cgcaggaact 6720
ccggggaaaa gatgatatta ttcgtgttca gatcgcgctt caggcgttcg gtgaacccga 6780
cggggacggt ggatttgata atgatggtcg cgttcgggtt aatggacagc acgtcacacg 6840
cgacgctttc gacgctcagg gtatcaaagt tgttattaat cggatcatag ttcgtcgggg 6900
tggcgatgat cacgtagtct gcatcgcgat atgcctcgta tttttccgtc gtcgcgtaga 6960
ggttcagctt acgattggag agaaacttct ggatttccgg gtcgcaaatc ggcgagattt 7020
tcttgttaat gagctggacc ttcttcgggt cgatgtccag ggcgatgatg tcgtgttttt 7080
gggagaggag gatcgcaatg ctgataccca catagccgac gccggccacg gcaattttca 7140
tttattaacc tccttaagtg aattcaaact agtttacaag tcgttttcga tcttctccca 7200
ggtatatttg cgacattcat tcaagttggt cagcggcgag tatttgtact ttttgatacc 7260
gaggcgcgac aggctttcgt tcaccacctt gaaatggttt tccttttgga tgtccagttt 7320
cttgatcgac gtgttctcgc cgtgcaggac acggttgtag caaatcttat tgatatgctt 7380
aaacgggccg acttcgctga gtttcaaata catatcgtaa tccaccgcat tgctgatgct 7440
ctcgttgaag ccttcggtga ggttccatgc acgcgccgtg aacatacgga agtggtggca 7500
gatcatcgcg ctcgtgagct tttcgcggct gtaaatcggc cagttgtagc cattgctaat 7560
caagttacct tcacgatcaa tattgcgatt ggtggtgtac acgcaggcga ggctcaggtc 7620
tttgcgaaat tcatccagac acagttccac ggcatcgggc tccaggaaat catcggaatc 7680
cagctgcccg atgtagaaac cccggcacag gcggactgcg gtattcgagg cggagccgat 7740
gcctttgttt ttctggctga tgaaacggac gcgcgggtgg tttgcgtaat gttcttgcag 7800
gatgcgcagc gtatcatcgg tgctcccgtc atcgcagatg cagacctcca gatcggtgat 7860
cgtttggttc agtgccgatt cgacgcagcg cacgatatat ttgctgcaat tatacgcggg 7920
gatgtagatg ctcaccaggg gcacacgttt cagggtggcg ctctcgattt tctccttctt 7980
gcgataaaag tagggcacct tctgctgcaa cagctggacg gtaatgtttt tacctgccgc 8040
gcgatcggtt tcgttctcct taccgggcgg ttcctgatga tatgccatcg cgccttccac 8100
gctacggaaa taacaaccct cgcggtacag ccgatagccg aactcattat cctcaccgcc 8160
ccaatgcgtg aactcttcgt caaaccaacc cgcgcgaaac agccacttct ttgcaaacgc 8220
cacattgcca ccgctaaaga accggaacgg ggtgttgcac aggcgcagat tgtcggtatt 8280
cttgaaatgt tcgatgcgcc aatcgacgga tttgttctgc tcgaccttgc ctgcgacctg 8340
attattggta ataatctccg ggatttcatt gatcaggctt ttctgggaca aaaagtccag 8400
ataggtatgc ttcgacgtgt cgatgtattt acgcgggcca atcagtgcca cgttatcatc 8460
cacggccagg agttccatat aggactgcac ccacaacggg ttcggcgcca tatcgcagtc 8520
caagatcgcc acgtagttgt atttcgctgc ccgcaggccc aggttccgca cggcgcacag 8580
ctggtagccg tagtctttct ggcggacgta tttgatgttc agcaacgact cgaactcgcg 8640
gacgatctct tcgatgtttt ccttggaacc gtcatccgcg acgatgacct catagtcata 8700
aatcgttttc tgattgcaga ggcaggccag ggtgatcgcc aggattttgg cgcgattgta 8760
cgtcggaatc acgatggaca ggccgtcgat gatcagttgc ttgcgcggat aatcatccag 8820
ttctttacgt ttccctgccc agacgtagtc gttcgtgctt tccggcagcg gcggcaaggt 8880
caggtcgctc ggccaatcca gcggaatggg ttcgacttct ttcaattcgg cgcgctcgga 8940
tttctttgcg gtaatttccc gatatttgct aatgatttca ttcttttcca cctcattcag 9000
cgagatcgcc tttgcattgc tgcacataat tttggttgcc gcgtcgatat caatgaccgc 9060
tttccgattc agcttgtcca cttcttcgct cagattcagg gcggtttggc acagcttgat 9120
attggcttcc acccagctca catcatagat ttccgccact ttttcaaaca gggagagggc 9180
ttggcggtag ttcttattct tatacagatt gattgcctgg ttcaaaatgc tcatttatta 9240
acctcctact agtgaatttt cgaattactt accgcagtac ttgacaccca cctgggaatt 9300
gtttttggtg cgtttgaatt ggcggatggt acggtagatg ctaaagggca ggctgatcag 9360
accgagcgga aaattgttct tattgatgat gagcttgccc agctgatagc tcaggtgttt 9420
cttgacccgt tcggcttcgt gtttatccgc gtacaggaag atgctcggca ggctcacttg 9480
gtactccgaa tcatatttct tcttccaggt ccgccattcg ctgatcaacg caaacggaat 9540
cgagatcaga ccgaggaacg tcttggagcg gctcaccatc accgcaccca ggcggtagcc 9600
gatatcttgc ttgatgcgtt cggccgcacc atacagctcc ggcagttgtt tcttttcgag 9660
acgttgattg tcgatgaagt actgttcgag cttttgctgc accagatgca gctgattgag 9720
cagcaattct ttttcgcacg acagcttttc gaggcgctgt tgttgcagtt catttttgtt 9780
ctgttccttt ttcagcaggg actcgaagtt ctcgatcgcg cactccagtt cctggacctg 9840
gatggttttg tttttaatga tcagatcata ctggatcagt tcttccttgc tatccgacag 9900
ctctttcaga atggcttgat aggcgttcag ctgtttggac gtgtgcagtt cgttgtccag 9960
aatgatcttt ttgctgctct ggtacagacc gttcacgata tcgagggtga tctggcgttg 10020
tttaatgaac gtctcccaaa taaaggacgg cttatagttt tccttctcca gcacccgcaa 10080
gggggtgttg gcgttcgatt gcaattcaaa gtacagttcc ttgcaatcgg gatagtcgtt 10140
caggacgttg aagatcaagt actcctccgt ctcgctttgc ttgaaaatga tatccccggt 10200
cccgatgtca ataccgctga gggacatgat ctcctgatgt tctttttcca gcgtaatgga 10260
ggcttcggcg gtcttaaagt cattcacgct ctgctccagc gagtggttga tggtattgga 10320
gaacgacaac ccgaatttca gtttcagttt gtgttgcagt tgctggatgc agtcctcggc 10380
gttgcgcttc acctgttcgc tcgacaccag caggcaccga ccccggttgt tgaggaagaa 10440
gtgcagcaag gcggtgttgt atgccagcca gtttttgatc agatgctccg aggtatagtt 10500
gctggagatg ttctggtccg agaagtagtt cgtcaggatg cttttggggt ggtcgtagat 10560
gaggataaag gtgatgttct catccaccga tttccaatat tccaacgtgt gaattgcgtt 10620
ggggtcgctc caaccgcaca gtttctggtt caggttggac agcatcagat ccaatgcgat 10680
accgttccag acggtgctca catggagcgg ttcaaagtcg gcggaatcgg tcaccgtata 10740
gatgtccggc gactggtacg ccttccgcag cgtctgggtg atgtcctggg gcgagaggtt 10800
ctcacgtttg gacgggcaca gggagttcat gccgcgctga tgcaggagtt cttccacgat 10860
ttggtagttg ctgctcggat ggcccacgat caccaggcgg ttcatttatt aacctccttt 10920
cgaaaatgaa cggtccgtta aatatagcca ttcggattct tcatctgcca gcgccaggcg 10980
tcctccagca tggtttcgag ttcccgcttg gctttccagt tcagatattt gttggccttt 11040
tcgggggagg accagctctc cgcgatatca ccgtcacggc ggctcacgat ttcatacgga 11100
atccgcacgc cggaaatctt ttcaaaggtg gacaccagtt ccagcaccga ataaccttta 11160
cccgtgccca aattaaagac gtggtagttg gtgttattgt cgcggaagag ataggacagc 11220
gctgcgacgt gcccttcggc caggtccatc acatggatat agtcacggac ccccgtgccg 11280
tctttggtgg gataatcacc accgaacacc atcagttttt ccagtttccc catcgcgacc 11340
tgcaagatgt acggcaccaa gttggagggg atgtctgccg ggctttcacc aatcataccg 11400
gattcgtggg cgcccgtcgg attaaagtag cgcaagcaga ggaaattcgt gtcggagtat 11460
ttcttggcga tgtcgcggat catcagctcc gagatgtact tggacgtacc atacggattc 11520
agcgtgccac caatatggca gtcttcggtg acgggcatga tcttgctttc cccatacacc 11580
gtcgccgacg agctaaagat gaagttggcg acgtcgttct tgatggcgca attgatgagt 11640
tgcagggtgc cgctcacgtt gttgtcatag tagaagatgg gcttgatcag gctttctgcg 11700
accgatttcg cacctgcaaa gtgcatgatg cagtcgaatt tgtgtttctt caggatctgg 11760
ttcacttcct tctcgttgtt gatattgagt tcgtagaacg tgactttctt ctttgcgatc 11820
agctcaatgc gacggatgct ttcgcagctg ctgttgatga gattgtcaat gatgacgaca 11880
ttgtagcctt tgttcagcag gcagagcgac gtgtggctgc cgatgtagcc tgcaccgccg 11940
gtgaccagga tgttcattta ttaacctcct cggtccgaat taacctaggt tatgaggtca 12000
gcattgcttc ttcacgcgtt tagtagttgt tttgttcggt gatatattct tcaatgcctt 12060
cttgcacgtc ttcatggaac gacacggcgt tgtcgtcttt aaacacgatt gccacatcgc 12120
agaactcttt caacgagttc agcgagtgcg acaccatgag gaaggagctt tccttatgac 12180
gctccttgaa gagttgggca catttttcct tgaaacgggc gtcccccacc gccgtcacct 12240
cgtccacgat gtagtaatcg aacttgaacg ccatgctcag gccgaagccg aggcggctgc 12300
gcataccgct cgaataggtc ttgatcggca tatcaaaata cttccccagc tccgcgaact 12360
cttccacaaa ctcaatcttt tctttcagct cctcctgctt cgcgtacagc cgggccacga 12420
acttcacgtt ttcacgcccg gtcaagctgc cctggaagcc gcctgccaga cccaccggcc 12480
acgagatcgt tttattcgtg atgattttac cgctatccgg gcggtcgatg cccccaatca 12540
tgcgcaacag cgtggattta cccgccccat tgcgcccgat gaacgccacg cttttgccgc 12600
tggggatctc aatgttcagg ttcttgaaga catagtgacg gcccaccggg gtgcggtagc 12660
ttttcgtcag gttttcgatc ttaatcatga ggtcaacatt gcctcctcac gcgtacggta 12720
cagggccaaa ccaataaaca gggtcaccag ggtgaacatt gccagataat tcaggctgac 12780
cccttcgctg atataaccgg gcatcacggc ctcgcggctc agttcgacga cgtgcaccag 12840
gggattccac agcaggtacg accaatactg cttcggaatg gagtgcagcg ggaacatgat 12900
gcacgaaata aagtacagcg gcttcagcaa gatcggcaag actttctgca tttcggggaa 12960
cgtcttgccc acgaccatga agatcaggcc cacaccgcac gacaggatga tcaggaggct 13020
ccaggtgagc acaaattgca ggaagttggt aatctcgaaa tattcgcccg ccatccagat 13080
gatcagcatc aggaggatgt agaccgccac atagatcagc gtttccaaga gggcgcgtgc 13140
aatgatcgtg tcgatcggct tcacgggccg gtagttaaac agcccctgat tggcttcgat 13200
ggcgcccacg gagcgattgc tgatgctgct gaaaataaag aacgggatca ggccattgag 13260
caggaacacc gggaaggaga tatccggcat ggtgcgatgc atgatatagc caaagatccc 13320
gagcagaatc agcagatgtg cgctcggttc caggatcgcc cacagatagc ccaggcgaaa 13380
cttgccaaag cgcgtacgga tttcgcggag aaacagtgct tcgaccgtca ctttctggac 13440
ttcaaaaccc gaacgtgcca tttattaacc tcctggtacc aatctagatt gtttaaacag 13500
atccaatcta gattgtttaa acttctgcag aacacgcggt gttaacgttt cttatacttc 13560
ttaattttgt taaagatcat ttcgccgtag tacaccgcat tgacctgggt cttcaccagc 13620
aagtagccgc gaaatttctt aaacaacttc atgttcggtt taaagtcggc ttgccagaac 13680
tgatgcaaat gcccctggta cgtcagaccc ttgatatcgt acaaggcgtt gcccatgact 13740
ttcaggggct tgttgtggat caacgcggaa atgccggccg tgctattgat ggtgaccacc 13800
gctttggcgt ggcgcaacag ctccggcatg ggcagatcgt gcacatagat gacacgttca 13860
tccaaaccgt attccttcga cagacgcttg atcaacgggc ggtacaggcg gtgcccgcga 13920
tccatcgggt gatgtttgat caccagatag gactccttgg gggccttgcg ggaaaagctg 13980
tacatcactt cgttgatgta atcacgcaca tcattatagt tgctatggtt gcggatctgg 14040
ctgtcgttgt acacttgcag gaccgccagg taatagcgct gatccagctc gttcatcagg 14100
cgggggagga ccttgcgttg ggtgacctta tacagctgtt tgcgccagta ggcgcggacc 14160
cagcagcgcg cttcatacca cgggctgaac gatttgtggt ggcgatagcg cggaaattcg 14220
tgacgatagt gccaacccat caggtaatac cacatggcgt ggccgatgcg cttcatggtg 14280
ctcggtttca ggttctcgac gtgcggcgtc ggcatatcgg gcaatttgcg gtaaaagtcc 14340
ggatcgcggg gcaagctgct ataggcgttc acaccgcctt cttccacggt gataaattgc 14400
ggacgcaggt agccttcctc gaaggccaga aaacgaatcc ccttcgactt ggcccagcgt 14460
ttggcctcct tgtgcagcag gcggcagtca ccgaaacaca aaatcgtgtc aaagtcatac 14520
tgacgatgca agtcccgcag ccaaccgggg aactccttcg gggtttggta gtacgccagg 14580
tattggcggt ggcggcagta gaagcgatca ccgccattaa agacgacgtt gaccgcgttg 14640
cgaccgaggc tctccaacca ttccgccaca tcgttgaaga acggacccat cggaccttgg 14700
agcaggaggt actttttacc gctcaacagc accgtcagcg cattgccgtg catttattaa 14760
cctcctaaca cgcggtgtta agcgttttcg gcgagctctt aaccaaagcg cactttgcag 14820
aacatgatca acttgcgata gtagcgaatc acacggccgg ctttcttgcg ggtgataaag 14880
atgggtttgc ggggcgtttt gatcagatat tctgccgctt cctccaccgt gatcggctgc 14940
aaccgcgtcg gatgaatata ggtgggatag acaatcaggg cttgatagat caggtcggcg 15000
atggtcagcc gccgctcgcg acgggggcag tggtgctcat cgacggtcag gccccacgag 15060
gcgtagaacg gcaggccgta gcagtgcacc tgtttaccgt gcagcaatgc ttcaaagccg 15120
ctgaggctcg tcatcgtgtg cacctcgtcc gcacgctgaa tacactgaat gatatcggca 15180
tccagtgcct ggtagtctgc gagttccgcg atctgttccg ccggaatgtc acccttacgg 15240
ttgccgacga gcacatcggg gtgcggcttg tagatgatgt aggcgtgcgg attacgttcc 15300
cgcacggtgc gcagcagctc cagattcgac ttgatcgaca cggtgcccgt cttaatcgac 15360
gcatcgtctt ccacctggcc cggcaccagg atgactttct tgtccttcgc ttctgccggg 15420
aggctgaaat cggcccccag gttatatttg ctcaatttgc tttccaccag acgttggcgc 15480
aacttttccg cgcgcatctg gtgcgcgagg gtcagctggc tgtgattcag caggacctcc 15540
agttccgacg gacgggtggc atcgtaatag ataccgcgct tatccaggac caggctcaac 15600
ggcggcagca gatcgctccc caggccggag ctgcgcagga agccgtcttc catgcgccac 15660
agcggcaggg atttgcgctg tgcctccgca cgccattgct gttcgccttt cacgccccac 15720
acgacgcagg cgcttgctgc ggtacagcga cgggaaaagg agagacgatt cgtggccgtt 15780
tgcaggaagg gcttcaggat cgcgcttttc cacagggtca ggcccggcac ccagagataa 15840
ccattccgct gttgcaggtg acgacgttgc agctggagcc attggagcac cgtgaacagg 15900
gccgacacct ccccggtctg cggatcaatg tagcggcaat agcgcagata ggccgctgcg 15960
aacagttcct ccagggtggc cgagccgcga cgcgccgaca gcagcgccga ttgggggtgg 16020
cggtcatcgg tgaggcccca ccctgcatac cagggttggc caaagcaggt cacgggctta 16080
ccggccagca gggcttcaaa accgtactgg gaggtcacga cgtacacgcg ggacacatga 16140
cgcagcaggg actgcggcga cacgttttcc gcaatcaggc gcacgcgctg ggtggcacgc 16200
aagtccgcga agtagccggt ctttttccct tccaggacat cgggatgcac tttgacccag 16260
atttctgcct gcgggttttc cgccatcgct gcttccagca ttgcggcgaa ctcatggggg 16320
cctgcgttgc cgtaggtcac gctcatgtca ttgaaggtct ggtccaccac cagcacgatg 16380
ttcgtgcgct cgctttcatc cgccacgaac gccggtgcca ggttgtactt gctcatgtcg 16440
cccgtcacaa tggtgtgcat cgcctcgcgc gcctgatccg ccagggccgc gttgccggcc 16500
ttgtcctgca cgagtttttc cagcgcgctc ggtttcgagg cgtcgtagta aatgccgcag 16560
tcatccacga cgagcgagag gggcggttca ccgttcacgc ccaggtccag cgagcggacg 16620
aaaccatcct ccaagcggat caccggcttg cctgcggctt tggcgatggc caccggcttt 16680
gcggccgagg ggcggtgccc ccacaccgcg attgcatcca cttcctgcgg gaccgggcgc 16740
agcagcgaca gcttttggca gggctgggcg aggaattttt ccaggtgcgg aatacgccaa 16800
atgccggggc tataaatgcc aatcatgcgt tctccgcgag ctcctgcgcc atcagggccc 16860
ggaccttctc caagcacgcc ggggtatcga cgccgggacc ggtcgcggcg acctcgaagg 16920
tgcgaatgtt aatgcccgcg ctcatcagcc gcagttgctc cagggattcg gcctgttcgg 16980
gcatggactc cggcaactgg ctgtaatttt gcaggacatc ccgccgatag gcgtagatcc 17040
cgacgtgctt caggtagcgc gccttctcgg cgttgcgcgg gtacggaatg ggggagcggg 17100
agaaatacag ggcgtcctgc cgcgtgttca ccacgacctt gacggtggac ggttcggcgg 17160
cttctgccgc gctgatcgca tgacacaggg tcgccaccgg cagcgccggg tcgtcccgca 17220
taccttgcag cagggtttcg acgtcacgcg ggcgaatcat cggctcatcc ccttgcaggt 17280
tgatatagat atccgcctcc accttatgca tgacttccac caggcgatcg gtgccgctct 17340
catgatcgtt gcgggtcatg atcgctttgc cgccgaacgc ctggactgcc tgctccacac 17400
gcgggtcgtc ggttgcgacc cacacctctg ccacgcctgc cacttgcagg gcccgttcgt 17460
agacgtgctg gatcatcggt ttcccgacga tatccagcag cggtttgccc ggcagacggc 17520
tgctgccgta gcgtgccggg atcacaatca cggccttcga catttattaa cctcctcgag 17580
ttacagcgac agaatcactt tcgcgcccac cgccagttgg tacagaatgg tgctgatacc 17640
gcgcgtcact tcgatgttct tcgactcgta tttcggcaac accataattt catcaccggg 17700
tttcagggaa tcgacgtctt ctgcgttcac cgctgcgccg ttctgacgga tgacgataat 17760
acgggcgttg ccggacttct gggtcagccc accgcacttc tcgatgtagt cctcggtcgt 17820
catacctttc tgccacgaca ccgcgttcgg gaacagcact tccccgtgga ccatgaccaa 17880
cgacgtcttt tcgggaatat tgatcacgtc gccgtcctcc aggaggacgg agtcaatgtt 17940
gctttcattg aggatcactt cgcccttcgg cacgacggtg cgggctttcg cgacgaagcg 18000
ggagatcagt tgggcttcct gcatacgcag gctggcctct tccttggtgc tgctctgtgc 18060
gctgaggctg gcctcttcga gcttttgcag ggacaaattc agcatttctt tctgccgttg 18120
cgcgacgctc ggccgataca actgcacggc gttcatctgc gacatggagt tcgggcgcac 18180
tttttcgagc acggcccgca tggtgctacc gtagggcagc accatggcgt gttccccgga 18240
atgtgcgcct tccacacgca cttgaatggt gcccgcatag cggtcggtgg agacaatgag 18300
ggtatcaccg ttttgcagca tacgccccgg tgcggacgag atcggataat attccgagcg 18360
cttctggagg ccctgcttcc gcataatcgt gatatgggtc gcacccggtt tgggacgtgc 18420
ccaggacagt gcttcggtga ccgggatgct cgattcgcga aattcaaagt cgtaggaatt 18480
gaacacatcg ccctgcaccg agaacgtatg ctggcgcgga cccacaatga tcgtatcacc 18540
gtccgcaaac tgggacagcc ccagtttgcc gttgagcagg aagtcataga ggttgacgtt 18600
cgagcgcaca cgattgccgc gtttcacgac gatgtccacg tagctgccgc gttccgggtc 18660
cacaccaccc gccttgatca ggtagttcag caggctgtcg gaggtgacac cgccgtacag 18720
gccggggttg cggacaaagc cggtcacata gaccttgacc ggctgcgcct gcaagagcga 18780
cgcatagacg ttcacgttgc tctggtagac ttccttcacc ttgctcgtca ccagcgcgtt 18840
caactgggag ttcgacacac ctgcgacttt gacggggccg acattcggca ggaagatgtt 18900
gcccttcggg tccacctgga gtgcgccatc gaaggtgaac gcaccccaca ggcggacctg 18960
gatggaatcg ccgggattca ggatgtagtc cggattgaaa cccacggttg cccccgagtc 19020
tgcgctcgta ccgttgaaca gctgcgcccc gaacatacgg ctcatcacga ccgggggtgc 19080
ggggggcggg gtgttatcga agccgctcat gttctgggtg tcgcttttct gcccgttcag 19140
gatgccggtc aacggtgcgg cacccgtgag gttcggatcg gcattaatgt cgatggttgc 19200
gctcgcctgt gctgcatggc acgctgcgat cagcaggatc gacttaaaca gcttcattta 19260
ttaacctcct cgagaagtcg acttagtcac ggtggtcttc aatcaccgcc aggagcaatt 19320
tcagggtgcc aaagagcagg caacacacca gcagccaaca cgcgatcaaa tacgggatat 19380
tcgggaagga gctttcctgg ggcagctgcg gggacgagat cacgctcagg actttcagct 19440
tacgggccgc ttcgacacgg gtcttttcga tgctggtgag cgtgagcttg tacaactcgg 19500
tattgaactc gaccttggat ttgatctcct caaaatccac ggccatgcgg ttcagtttat 19560
cgccctgggg tgcggtaatt ttcgactttt cttcgtcgat ctgtgcctgg aggctctgaa 19620
ttgcattgcg ggcgctcacg acttggggcg catcctcgcg caggtacgtg agcaggttgc 19680
gcaggtcggc ttccatctga attttctggc ccatcagcgt attcaccagg gtggatgccg 19740
cctgggcctg tgcctgcggg tccagcacat tgttgttgtc ttggtaggac aacaattcgg 19800
ctttcgatgc atccagccgc tggcgcgctt tttccatttc ggtttccgca aacgccaatt 19860
gatcgcgggc gatacggtgc gacatttcat tgatgaaccg ctcggattcc ttgagcacgg 19920
tctggttgaa tttcagcgcg aactcgggcg aaaagccctg ggtctggatg ttcagcagcc 19980
cggtcttgtc gtcgtagctg acgttgatgc gatctttata gtacttcagg aacccctcgg 20040
cggtttcatc cttggacaga tggttcagga agtccaggcc cgaatgggag aacgcttcgc 20100
ggaagttcag ctgtttatcc agcgcggcca gcatatccgg gctgttgatg tattccttca 20160
ggtacagtgc gtcttcggcg gacgacgggt tggaggcacc caacagcagg ccgaagttca 20220
ggctgccgga gttgagatcg tcgctgcgct tgatggccac cttgctttcc gacatatagc 20280
ggggctggga gaagatcgcc aagtagatca gcagcaccgc catgggtgcc agaataatga 20340
tttttgccag gtgcttctga atatctgcca ggctgatcgc gctcagacgc gcacgcatcc 20400
acgagacggc gcttttcact ttgatcagca tttattaacc tcctgtcgac aacacgtgtt 20460
aatcgaaaat gcgcaccaac ccggtcacct tatttgcttt gttggtcacc agcagggtcg 20520
agacgcggtg tttctgcatc ttctcttctg cttcgatgat catggtgtct tcgggcaagg 20580
tcagcggttc gcgggtcatc atctgtgcgg ccgttgcgct cgtcaggctg tcttctttct 20640
ccataaagcg ccgcagatcg ccatcggtga tgatgcctgc cagcccacct tccgcatctt 20700
cgaccatcac cataccctgg cagcccgagg tgatgcgctg aatgaccgtt ttgaagctgg 20760
catcgagctg cactgccggc acatcatgtt gcatcacgtc ggcgacgcgg gtcagcaggc 20820
gccgacccag gctgccaccg gggtggtagc gtgcaaagtc attgggcata aacttacgct 20880
ggtgaatcat cgcgatggcc agcgcgtccc cgatcgccat cgtgagcgtc gtggaggtgg 20940
tcggggcgag attgttcggg cacgtttcgt tcgccatgtg cagctccagg accgcatctg 21000
catttttggc cagggtgcta ttcccgttat tggtgattgc gatgatgcga ttgccgaagt 21060
tcttcaggct cggcaccagt ttcaggatct cgtccgtctc accgctcgcc gaaatcaaga 21120
tgagcaggtc atacggggtg atcatgccca gatcaccatg gaacgcttcc gccggatgaa 21180
taaagaagga gggcgtcccg gtcgaggcca aggtcgccga catcttgcgg cccacatggc 21240
cgcttttacc catgccgctc aggatgacgt gccctttaca attcatgatg agattcagga 21300
cgcgctggta ctgaccgcta tccagttgtt tggacaggtt ttgcagtgcc gcgctttgtt 21360
cggccagggt ctggcggacg ctcgtaatca gatacggatc aatggtcgag gactggtcat 21420
ccggcaagtg gcgttcgctc atttattaac ctcctcacgt gttaattaag taatcgatag 21480
tgatttaaat atgcaagatc tagttacctg caggattatt gtttctgttg cataaagcct 21540
aaggggtagg cctttctaga gatagccatt ttttgcactc ctgtatccgc ttcttgcaag 21600
gctggactta tccctatcaa accggacact gcaggctgac aagctttcat tacatatgaa 21660
gagtttgtag aaacgcaaaa aggccatccg tcaggatggc cttctaagaa ggctcgagtg 21720
gcgcgcctaa gtcgaatttc tgccattcat ccgcttatta tacttattca ggcgtagcac 21780
caggcgttta agggcaccaa taactgcctt aaaaaaatta cgccccgccc tgccactcat 21840
cgcagtactg ttgtaattca ttaagcattc tgccgacatg gaagccatca cagacggcat 21900
gatgaacctg aatcgccagc ggcatcagca ccttgtcgcc ttgcgtataa tatttgccca 21960
tggtgaaaac gggggcgaag aagttgtcca tattggccac gtttaaatca aaactggtga 22020
aactcaccca gggattggct gagacgaaaa acatattctc aataaaccct ttagggaaat 22080
aggccaggtt ttcaccgtaa cacgccacat cttgcgaata tatgtgtaga aactgccgga 22140
aatcgtcgtg gtattcactc cagagcgatg aaaacgtttc agtttgctca tggaaaacgg 22200
tgtaacaagg gtgaacacta tcccatatca ccagctcacc gtctttcatt gccatacgga 22260
attccggatg agcattcatc aggcgggcaa gaatgtgaat aaaggccgga taaaacttgt 22320
gcttattttt ctttacggtc tttaaaaagg ccgtaatatc cagctgaacg gtctggttat 22380
aggtacattg agcaactgac tgaaatgcct caaaatgttc tttacgatgc cattgggata 22440
tatcaacggt ggtatatcca gtgatttttt tctccatttt agcttcctta gctcctgaaa 22500
atctcgataa ctcaaaaaat acgcccggta gtgatcttat ttcattatgg tgaaagttgg 22560
aacctcttac gtgccgatca acgtctcatt ttcgccaaaa gttggcccag ggcttcccgg 22620
tatcaacagg gacaccagga tttatttatt ctgcgaagtg atcttccgtc acaggtattt 22680
attcggcgca aagggcctcg tgatacgcct atttttatag gttaatgtca tgataataat 22740
ggtttcttag acgtcaggtg gcacttttcg gggaaatgtg cgcgcccgcg ttcctgctgg 22800
cgctgggcct gtttctggcg ctggacttcc cgctgttccg tcagcagctt ttcgcccacg 22860
gccttgatga tcgcggcggc cttggcctgc atatcccgat tcaacggccc cagggcgtcc 22920
agaacgggct tcaggcgctc ccgaaggt 22948
<210> 41
<211> 24509
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Sequence
<400> 41
ctcgggccgt ctcttgggct tgatcggcct tcttgcgcat ctcacgcgct cctgcggcgg 60
cctgtagggc aggctcatac ccctgccgaa ccgcttttgt cagccggtcg gccacggctt 120
ccggcgtctc aacgcgcttt gagattccca gcttttcggc caatccctgc ggtgcatagg 180
cgcgtggctc gaccgcttgc gggctgatgg tgacgtggcc cactggtggc cgctccaggg 240
cctcgtagaa cgcctgaatg cgcgtgtgac gtgccttgct gccctcgatg ccccgttgca 300
gccctagatc ggccacagcg gccgcaaacg tggtctggtc gcgggtcatc tgcgctttgt 360
tgccgatgaa ctccttggcc gacagcctgc cgtcctgcgt cagcggcacc acgaacgcgg 420
tcatgtgcgg gctggtttcg tcacggtgga tgctggccgt cacgatgcga tccgccccgt 480
acttgtccgc cagccacttg tgcgccttct cgaagaacgc cgcctgctgt tcttggctgg 540
ccgacttcca ccattccggg ctggccgtca tgacgtactc gaccgccaac acagcgtcct 600
tgcgccgctt ctctggcagc aactcgcgca gtcggcccat cgcttcatcg gtgctgctgg 660
ccgcccagtg ctcgttctct ggcgtcctgc tggcgtcagc gttgggcgtc tcgcgctcgc 720
ggtaggcgtg cttgagactg gccgccacgt tgcccatttt cgccagcttc ttgcatcgca 780
tgatcgcgta tgccgccatg cctgcccctc ccttttggtg tccaaccggc tcgacggggg 840
cagcgcaagg cggtgcctcc ggcgggccac tcaatgcttg agtatactca ctagactttg 900
cttcgcaaag tcgtgaccgc ctacggcggc tgcggcgccc tacgggcttg ctctccgggc 960
ttcgccctgc gcggtcgctg cgctcccttg ccagcccgtg gatatgtgga cgatggccgc 1020
gagcggccac cggctggctc gcttcgctcg gcccgtggac aaccctgctg gacaagctga 1080
tggacaggct gcgcctgccc acgagcttga ccacagggat tgcccaccgg ctacccagcc 1140
ttcgaccaca tacccaccgg ctccaactgc gcggcctgcg gccttgcccc atcaattttt 1200
ttaattttct ctggggaaaa gcctccggcc tgcggcctgc gcgcttcgct tgccggttgg 1260
acaccaagtg gaaggcgggt caaggctcgc gcagcgaccg cgcagcggct tggccttgac 1320
gcgcctggaa cgacccaagc ctatgcgagt gggggcagtc gaaggcgaag cccgcccgcc 1380
tgccccccga gacctgcaga tccacatcct tgaaggccgc agcgacgagc agaaggaaac 1440
cctcattcgg gaagtcagcg aggccatctc gcgctccctg gatgcgccgc tgaccagcgt 1500
gcgagtgatt atcacggaga tggccaaggg ccacttcggc atcggcggcg aactggccag 1560
caaggtcaga cgctgaagtg gagatgccca agggcacttc gggtcgagga acccgacctg 1620
cattgggacg cggccacgga gagcgcgggc aaacgccggc actatagcca gtggagtttg 1680
taaaacgcta tttcagagct tggagagtgt ctaagaaagc cggggcgatg ccaacccatc 1740
ccttcttcgg ctatgcatcg ttcgtaatca agccacttcc tttttgcatt gacgcagggt 1800
gtcggaaggc aactcgccga acgcgctcct atagttttca gcgaagcgtc ccaaatgtaa 1860
gaagccgtag tctagggcta tctcagttat actacgcaca ttggcactgg gatcgttcaa 1920
gcaggcgcgg atgctttcga gcttgcggtt gcggatgtag ttcttcggcg tggtgccggc 1980
atgcttctcg aacaaattgt agagcgagcg tggactcatc atcgccagct ccgctaaccg 2040
ctcaaggctg atattccgtt tgagattctc ctcaatgaat tgaacgactc gctcgaaaga 2100
cgggttacct ttgctgaaaa tttcacggct gacattgctg cccagcattt cgagcagctt 2160
ggaagcgatg atccccgcat agtgctcttg gacccgaggc atcgactttg tatgttccgc 2220
ttcgtcacaa actaacccga gtagattgat aaagccatcg agttgctgga gattgtgtcg 2280
cgcggcgaaa cggataccct ccctcggctt gtgccaattg ttgtcactgc atgcccgatc 2340
aaggaccact gagggcaatt taacgataaa tttctcgcaa tcttctgaat aggtcaggtc 2400
ggcttggtca tccggattga gcagcaatag ttcgcccggc gcaaaatagt gctcctggcc 2460
atggccacgc cacaggcaat ggcctttgag tattatttgc agatgataac aggtctctaa 2520
tccaggcgag attaccctca cgctaccgcc gtagctgatt cgacacaggt cgaggcatcc 2580
gaagattctg tggtgcagcc tgcctgccgg gcgcccgccc ttgggcaggc gaatagagtg 2640
cgtaccgaca tactggttaa cataatcgga gactgcatag ggctcggcgt ggacgaagat 2700
ctgacttttc tcgttcaata agcaaaaatc catagttcac ggttctctta ttttaatgtg 2760
ggctgcttgg tgtgatgtag aaaggcgcca agtcgatgaa aatgcatctc gacgtgatgc 2820
gtatacgggt tacccccatt gccacgttgc gccatccttt ttgcaatcag tgaccacttt 2880
tccaagcaaa aataacgcca agcagaacga agacgttctt tttaagaagc gagaacacca 2940
gaagttcgtg ctgtcggggc atgcggcgac gaattggcgg ataaagggga tctgcaggtc 3000
ccgagcctca cggcggcgag tgcgggggtt ccaagggggc agcgccacct tgggcaaggc 3060
cgaaggccgc gcagtcgatc aacaagcccc ggaggggcca ctttttgccg gagggggagc 3120
cgcgccgaag gcgtggggga accccgcagg ggtgcccttc tttgggcacc aaagaactag 3180
atatagggcg aaatgcgaaa gacttaaaaa tcaacaactt aaaaaagggg ggtacgcaac 3240
agctcattgc ggcacccccc gcaatagctc attgcgtagg ttaaagaaaa tctgtaattg 3300
actgccactt ttacgcaacg cataattgtt gtcgcgctgc cgaaaagttg cagctgattg 3360
cgcatggtgc cgcaaccgtg cggcacccta ccgcatggag ataagcatgg ccacgcagtc 3420
cagagaaatc ggcattcaag ccaagaacaa gcccggtcac tgggtgcaaa cggaacgcaa 3480
agcgcatgag gcgtgggccg ggcttattgc gaggaaaccc acggcggcaa tgctgctgca 3540
tcacctcgtg gcgcagatgg gccaccagaa cgccgtggtg gtcagccaga agacactttc 3600
caagctcatc ggacgttctt tgcggacggt ccaatacgca gtcaaggact tggtggccga 3660
gcgctggatc tccgtcgtga agctcaacgg ccccggcacc gtgtcggcct acgtggtcaa 3720
tgaccgcgtg gcgtggggcc agccccgcga ccagttgcgc ctgtcggtgt tcagtgccgc 3780
cgtggtggtt gatcacgacg accaggacga atcgctgttg gggcatggcg acctgcgccg 3840
catcccgacc ctgtatccgg gcgagcagca actaccgacc ggccccggcg aggagccgcc 3900
cagccagccc ggcattccgg gcatggaacc agacctgcca gccttgaccg aaacggagga 3960
atgggaacgg cgcgggcagc agcgcctgcc gatgcccgat gagccgtgtt ttctggacga 4020
tggcgagccg ttggagccgc cgacacgggt cacgctgccg cgccggtagc acttgggttg 4080
cgcagcaacc cgtaagtgcg ctgttccaga ctatcggctg tagccgcctc gccgccctat 4140
accttgtctg cctccccgcg ttgcgtcgcg gtgcatggag ccgggccacc tcgacctgaa 4200
tggaagccgg cggcacctcg ctaacggatt caccgttttt atcaggctct gggaggcaga 4260
ataaatgatc atatcgtcaa ttattacctc cacggggaga gcctgagcaa actggcctca 4320
ggcatttgag aagcacacgg tcacactgct tccggtagtc aataaaccgg taaaccagca 4380
atagacataa gcggctattt aacgaccctg ccctgaaccg acgaccgggt cgaatttgct 4440
ttcgactatc ggcgcgccag agctcatcgt taatgtcttc gtgcgccgtc agtcggcgca 4500
cgttttttct ctctggtacc gtgtcactga tctagtcaat tactcgaagt atccacaagt 4560
gaagcatact aagtaatgta caagaatcaa aaaaatcggc tacgcaagtc gcgtagccga 4620
atcatttaag gatccttcca ttcaggtcga ggtggcccgg ctccatgcac cgcgacgcaa 4680
cgcggggagg cagacaaggt atagggcggc gcctacaatc catgccaacc cgttccatgt 4740
gctcgccgag gcggcataaa tcgccgtgac gatcagcggt ccagtgatcg aagttaggct 4800
ggtaagagcc gcgagcgatc cttgaagctg tccctgatgg tcgtcatcta cctgcctgga 4860
cagcatggcc tgcaacgcgg gcatcccgat gccgccggaa gcgagaagaa tcataatggg 4920
gaaggccatc cagcctcgcg tcgcgaacgc cagcaagacg tagcccagcg cgtcggccgc 4980
catgccggcg ataatggcct gcttctcgcc gaaacgtttg gtggcgggac cagtgacgaa 5040
ggcttgagcg agggcgtgca agattccgaa taccgcaagc gacaggccga tcatcgtcgc 5100
gctccagcga aagcggtcct cgccgaaaat gacccagagc gctgccggca cctgtcctac 5160
gagttgcatg ataaagaaga cagtcataag tgcggcgacg atagtcatgc cccgcgccca 5220
ccggaaggag ctgactgggt tgaaggctct caagggcatc ggtcgacgct ctcccttatg 5280
cgactcctgc attaggaagc agcccagtag taggttgagg ccgttgagca ccgccgccgc 5340
aaggaatggt gcatgcaagg agatggcgcc caacagtccc ccggccacgg ggcctgccac 5400
catacccacg ccgaaacaag cgctcatgag cccgaagtgg cgagcccgat cttccccatc 5460
ggtgatgtcg gcgatatagg cgccagcaac cgcacctgtg gcgccggtga tgccggccac 5520
gatgcgtccg gcgtacaaga tccacaggac gggtgtggtc gccatgatcg cgtagtcgat 5580
agtggctcca agtagcgaag cgagcaggac tgggcggcgg ccaaagcggt cggacagtgc 5640
tccgagaacg ggtgcgcata gaaattgcat caacgcatat agcgctagca gcacgccata 5700
gtgactggcg atgctgtcgg aatggacgat atcccgcaag aggcccggca gtaccggcat 5760
aaccaagcct atgcctacag catccagggt gacggtgccg aggatgacga tgagcgcatt 5820
gttagatttc atacacggtg cctgactgcg ttagcaattt aactgtgata aactaccgca 5880
ttaaagccga gcgatgataa gctgtcaaac atgagatcca atctagattg tttaaacttc 5940
tgcagaacac gcggtgttaa cgtttcttat acttcttaat tttgttaaag atcatttcgc 6000
cgtagtacac cgcattgacc tgggtcttca ccagcaagta gccgcgaaat ttcttaaaca 6060
acttcatgtt cggtttaaag tcggcttgcc agaactgatg caaatgcccc tggtacgtca 6120
gacccttgat atcgtacaag gcgttgccca tgactttcag gggcttgttg tggatcaacg 6180
cggaaatgcc ggccgtgcta ttgatggtga ccaccgcttt ggcgtggcgc aacagctccg 6240
gcatgggcag atcgtgcaca tagatgacac gttcatccaa accgtattcc ttcgacagac 6300
gcttgatcaa cgggcggtac aggcggtgcc cgcgatccat cgggtgatgt ttgatcacca 6360
gataggactc cttgggggcc ttgcgggaaa agctgtacat cacttcgttg atgtaatcac 6420
gcacatcatt atagttgcta tggttgcgga tctggctgtc gttgtacact tgcaggaccg 6480
ccaggtaata gcgctgatcc agctcgttca tcaggcgggg gaggaccttg cgttgggtga 6540
ccttatacag ctgtttgcgc cagtaggcgc ggacccagca gcgcgcttca taccacgggc 6600
tgaacgattt gtggtggcga tagcgcggaa attcgtgacg atagtgccaa cccatcaggt 6660
aataccacat ggcgtggccg atgcgcttca tggtgctcgg tttcaggttc tcgacgtgcg 6720
gcgtcggcat atcgggcaat ttgcggtaaa agtccggatc gcggggcaag ctgctatagg 6780
cgttcacacc gccttcttcc acggtgataa attgcggacg caggtagcct tcctcgaagg 6840
ccagaaaacg aatccccttc gacttggccc agcgtttggc ctccttgtgc agcaggcggc 6900
agtcaccgaa acacaaaatc gtgtcaaagt catactgacg atgcaagtcc cgcagccaac 6960
cggggaactc cttcggggtt tggtagtacg ccaggtattg gcggtggcgg cagtagaagc 7020
gatcaccgcc attaaagacg acgttgaccg cgttgcgacc gaggctctcc aaccattccg 7080
ccacatcgtt gaagaacgga cccatcggac cttggagcag gaggtacttt ttaccgctca 7140
acagcaccgt cagcgcattg ccgtgcattt attaacctcc taacacgcgg tgttaagcgt 7200
tttcggcgag ctcttaacca aagcgcactt tgcagaacat gatcaacttg cgatagtagc 7260
gaatcacacg gccggctttc ttgcgggtga taaagatggg tttgcggggc gttttgatca 7320
gatattctgc cgcttcctcc accgtgatcg gctgcaaccg cgtcggatga atataggtgg 7380
gatagacaat cagggcttga tagatcaggt cggcgatggt cagccgccgc tcgcgacggg 7440
ggcagtggtg ctcatcgacg gtcaggcccc acgaggcgta gaacggcagg ccgtagcagt 7500
gcacctgttt accgtgcagc aatgcttcaa agccgctgag gctcgtcatc gtgtgcacct 7560
cgtccgcacg ctgaatacac tgaatgatat cggcatccag tgcctggtag tctgcgagtt 7620
ccgcgatctg ttccgccgga atgtcaccct tacggttgcc gacgagcaca tcggggtgcg 7680
gcttgtagat gatgtaggcg tgcggattac gttcccgcac ggtgcgcagc agctccagat 7740
tcgacttgat cgacacggtg cccgtcttaa tcgacgcatc gtcttccacc tggcccggca 7800
ccaggatgac tttcttgtcc ttcgcttctg ccgggaggct gaaatcggcc cccaggttat 7860
atttgctcaa tttgctttcc accagacgtt ggcgcaactt ttccgcgcgc atctggtgcg 7920
cgagggtcag ctggctgtga ttcagcagga cctccagttc cgacggacgg gtggcatcgt 7980
aatagatacc gcgcttatcc aggaccaggc tcaacggcgg cagcagatcg ctccccaggc 8040
cggagctgcg caggaagccg tcttccatgc gccacagcgg cagggatttg cgctgtgcct 8100
ccgcacgcca ttgctgttcg cctttcacgc cccacacgac gcaggcgctt gctgcggtac 8160
agcgacggga aaaggagaga cgattcgtgg ccgtttgcag gaagggcttc aggatcgcgc 8220
ttttccacag ggtcaggccc ggcacccaga gataaccatt ccgctgttgc aggtgacgac 8280
gttgcagctg gagccattgg agcaccgtga acagggccga cacctccccg gtctgcggat 8340
caatgtagcg gcaatagcgc agataggccg ctgcgaacag ttcctccagg gtggccgagc 8400
cgcgacgcgc cgacagcagc gccgattggg ggtggcggtc atcggtgagg ccccaccctg 8460
cataccaggg ttggccaaag caggtcacgg gcttaccggc cagcagggct tcaaaaccgt 8520
actgggaggt cacgacgtac acgcgggaca catgacgcag cagggactgc ggcgacacgt 8580
tttccgcaat caggcgcacg cgctgggtgg cacgcaagtc cgcgaagtag ccggtctttt 8640
tcccttccag gacatcggga tgcactttga cccagatttc tgcctgcggg ttttccgcca 8700
tcgctgcttc cagcattgcg gcgaactcat gggggcctgc gttgccgtag gtcacgctca 8760
tgtcattgaa ggtctggtcc accaccagca cgatgttcgt gcgctcgctt tcatccgcca 8820
cgaacgccgg tgccaggttg tacttgctca tgtcgcccgt cacaatggtg tgcatcgcct 8880
cgcgcgcctg atccgccagg gccgcgttgc cggccttgtc ctgcacgagt ttttccagcg 8940
cgctcggttt cgaggcgtcg tagtaaatgc cgcagtcatc cacgacgagc gagaggggcg 9000
gttcaccgtt cacgcccagg tccagcgagc ggacgaaacc atcctccaag cggatcaccg 9060
gcttgcctgc ggctttggcg atggccaccg gctttgcggc cgaggggcgg tgcccccaca 9120
ccgcgattgc atccacttcc tgcgggaccg ggcgcagcag cgacagcttt tggcagggct 9180
gggcgaggaa tttttccagg tgcggaatac gccaaatgcc ggggctataa atgccaatca 9240
tgcgttctcc gcgagctcct gcgccatcag ggcccggacc ttctccaagc acgccggggt 9300
atcgacgccg ggaccggtcg cggcgacctc gaaggtgcga atgttaatgc ccgcgctcat 9360
cagccgcagt tgctccaggg attcggcctg ttcgggcatg gactccggca actggctgta 9420
attttgcagg acatcccgcc gataggcgta gatcccgacg tgcttcaggt agcgcgcctt 9480
ctcggcgttg cgcgggtacg gaatggggga gcgggagaaa tacagggcgt cctgccgcgt 9540
gttcaccacg accttgacgg tggacggttc ggcggcttct gccgcgctga tcgcatgaca 9600
cagggtcgcc accggcagcg ccgggtcgtc ccgcatacct tgcagcaggg tttcgacgtc 9660
acgcgggcga atcatcggct catccccttg caggttgata tagatatccg cctccacctt 9720
atgcatgact tccaccaggc gatcggtgcc gctctcatga tcgttgcggg tcatgatcgc 9780
tttgccgccg aacgcctgga ctgcctgctc cacacgcggg tcgtcggttg cgacccacac 9840
ctctgccacg cctgccactt gcagggcccg ttcgtagacg tgctggatca tcggtttccc 9900
gacgatatcc agcagcggtt tgcccggcag acggctgctg ccgtagcgtg ccgggatcac 9960
aatcacggcc ttcgacattt attaacctcc tcgagttaca gcgacagaat cactttcgcg 10020
cccaccgcca gttggtacag aatggtgctg ataccgcgcg tcacttcgat gttcttcgac 10080
tcgtatttcg gcaacaccat aatttcatca ccgggtttca gggaatcgac gtcttctgcg 10140
ttcaccgctg cgccgttctg acggatgacg ataatacggg cgttgccgga cttctgggtc 10200
agcccaccgc acttctcgat gtagtcctcg gtcgtcatac ctttctgcca cgacaccgcg 10260
ttcgggaaca gcacttcccc gtggaccatg accaacgacg tcttttcggg aatattgatc 10320
acgtcgccgt cctccaggag gacggagtca atgttgcttt cattgaggat cacttcgccc 10380
ttcggcacga cggtgcgggc tttcgcgacg aagcgggaga tcagttgggc ttcctgcata 10440
cgcaggctgg cctcttcctt ggtgctgctc tgtgcgctga ggctggcctc ttcgagcttt 10500
tgcagggaca aattcagcat ttctttctgc cgttgcgcga cgctcggccg atacaactgc 10560
acggcgttca tctgcgacat ggagttcggg cgcacttttt cgagcacggc ccgcatggtg 10620
ctaccgtagg gcagcaccat ggcgtgttcc ccggaatgtg cgccttccac acgcacttga 10680
atggtgcccg catagcggtc ggtggagaca atgagggtat caccgttttg cagcatacgc 10740
cccggtgcgg acgagatcgg ataatattcc gagcgcttct ggaggccctg cttccgcata 10800
atcgtgatat gggtcgcacc cggtttggga cgtgcccagg acagtgcttc ggtgaccggg 10860
atgctcgatt cgcgaaattc aaagtcgtag gaattgaaca catcgccctg caccgagaac 10920
gtatgctggc gcggacccac aatgatcgta tcaccgtccg caaactggga cagccccagt 10980
ttgccgttga gcaggaagtc atagaggttg acgttcgagc gcacacgatt gccgcgtttc 11040
acgacgatgt ccacgtagct gccgcgttcc gggtccacac cacccgcctt gatcaggtag 11100
ttcagcaggc tgtcggaggt gacaccgccg tacaggccgg ggttgcggac aaagccggtc 11160
acatagacct tgaccggctg cgcctgcaag agcgacgcat agacgttcac gttgctctgg 11220
tagacttcct tcaccttgct cgtcaccagc gcgttcaact gggagttcga cacacctgcg 11280
actttgacgg ggccgacatt cggcaggaag atgttgccct tcgggtccac ctggagtgcg 11340
ccatcgaagg tgaacgcacc ccacaggcgg acctggatgg aatcgccggg attcaggatg 11400
tagtccggat tgaaacccac ggttgccccc gagtctgcgc tcgtaccgtt gaacagctgc 11460
gccccgaaca tacggctcat cacgaccggg ggtgcggggg gcggggtgtt atcgaagccg 11520
ctcatgttct gggtgtcgct tttctgcccg ttcaggatgc cggtcaacgg tgcggcaccc 11580
gtgaggttcg gatcggcatt aatgtcgatg gttgcgctcg cctgtgctgc atggcacgct 11640
gcgatcagca ggatcgactt aaacagcttc atttattaac ctcctcgaga agtcgactta 11700
gtcacggtgg tcttcaatca ccgccaggag caatttcagg gtgccaaaga gcaggcaaca 11760
caccagcagc caacacgcga tcaaatacgg gatattcggg aaggagcttt cctggggcag 11820
ctgcggggac gagatcacgc tcaggacttt cagcttacgg gccgcttcga cacgggtctt 11880
ttcgatgctg gtgagcgtga gcttgtacaa ctcggtattg aactcgacct tggatttgat 11940
ctcctcaaaa tccacggcca tgcggttcag tttatcgccc tggggtgcgg taattttcga 12000
cttttcttcg tcgatctgtg cctggaggct ctgaattgca ttgcgggcgc tcacgacttg 12060
gggcgcatcc tcgcgcaggt acgtgagcag gttgcgcagg tcggcttcca tctgaatttt 12120
ctggcccatc agcgtattca ccagggtgga tgccgcctgg gcctgtgcct gcgggtccag 12180
cacattgttg ttgtcttggt aggacaacaa ttcggctttc gatgcatcca gccgctggcg 12240
cgctttttcc atttcggttt ccgcaaacgc caattgatcg cgggcgatac ggtgcgacat 12300
ttcattgatg aaccgctcgg attccttgag cacggtctgg ttgaatttca gcgcgaactc 12360
gggcgaaaag ccctgggtct ggatgttcag cagcccggtc ttgtcgtcgt agctgacgtt 12420
gatgcgatct ttatagtact tcaggaaccc ctcggcggtt tcatccttgg acagatggtt 12480
caggaagtcc aggcccgaat gggagaacgc ttcgcggaag ttcagctgtt tatccagcgc 12540
ggccagcata tccgggctgt tgatgtattc cttcaggtac agtgcgtctt cggcggacga 12600
cgggttggag gcacccaaca gcaggccgaa gttcaggctg ccggagttga gatcgtcgct 12660
gcgcttgatg gccaccttgc tttccgacat atagcggggc tgggagaaga tcgccaagta 12720
gatcagcagc accgccatgg gtgccagaat aatgattttt gccaggtgct tctgaatatc 12780
tgccaggctg atcgcgctca gacgcgcacg catccacgag acggcgcttt tcactttgat 12840
cagcatttat taacctcctg tcgacaacac gtgttaatcg aaaatgcgca ccaacccggt 12900
caccttattt gctttgttgg tcaccagcag ggtcgagacg cggtgtttct gcatcttctc 12960
ttctgcttcg atgatcatgg tgtcttcggg caaggtcagc ggttcgcggg tcatcatctg 13020
tgcggccgtt gcgctcgtca ggctgtcttc tttctccata aagcgccgca gatcgccatc 13080
ggtgatgatg cctgccagcc caccttccgc atcttcgacc atcaccatac cctggcagcc 13140
cgaggtgatg cgctgaatga ccgttttgaa gctggcatcg agctgcactg ccggcacatc 13200
atgttgcatc acgtcggcga cgcgggtcag caggcgccga cccaggctgc caccggggtg 13260
gtagcgtgca aagtcattgg gcataaactt acgctggtga atcatcgcga tggccagcgc 13320
gtccccgatc gccatcgtga gcgtcgtgga ggtggtcggg gcgagattgt tcgggcacgt 13380
ttcgttcgcc atgtgcagct ccaggaccgc atctgcattt ttggccaggg tgctattccc 13440
gttattggtg attgcgatga tgcgattgcc gaagttcttc aggctcggca ccagtttcag 13500
gatctcgtcc gtctcaccgc tcgccgaaat caagatgagc aggtcatacg gggtgatcat 13560
gcccagatca ccatggaacg cttccgccgg atgaataaag aaggagggcg tcccggtcga 13620
ggccaaggtc gccgacatct tgcggcccac atggccgctt ttacccatgc cgctcaggat 13680
gacgtgccct ttacaattca tgatgagatt caggacgcgc tggtactgac cgctatccag 13740
ttgtttggac aggttttgca gtgccgcgct ttgttcggcc agggtctggc ggacgctcgt 13800
aatcagatac ggatcaatgg tcgaggactg gtcatccggc aagtggcgtt cgctcattta 13860
ttaacctcct cacgtgttaa ttaatgtttc tgttgcataa agcctaaggg gtaggccttt 13920
ctagagatag ccattttttg cactcctgta tccgcttctt gcaaggctgg acttatccct 13980
atcaaaccgg acactgcatc gattgataga tttaaataag aactgcagaa gctagcttag 14040
atgctcgtga aattgacgtg ggcgctttgc agggccgtct taatggcgtt ggtgtccacg 14100
aggatcgagt cgggtgcgga aaacggacgg ttcttgttgg tgaaatcgct gttaccaatg 14160
tacagcgatt ccttgttacg cagcgcctgg atgtgccagc gggaccacga atcccaatac 14220
ttctggcgat ccggcgagat accttggctg gtgtagccgg tcgtcgggct gttcatcaac 14280
gagtcggtgc ggtgcgagcc cagcgtcagc ggcaacttga tccgatgcac cgtggaatcg 14340
ccgaagatca gcttcagacg cgcgataaat tcgctatccg cacccgtttt cacacaatcc 14400
cagacaccgg ccttctgcaa gacgtcggca cggcgaaaca ggagcgacga cggattcaga 14460
cgcttcaagg ggtacactgc gcgggcatag aaaataccgt tgtcttgcag gcgcacccag 14520
tccgagatgg agcagatgag cttcggattg agcaacaagg gggagatttg gcggaacagc 14580
ttttccggat ggctccagtc atccgaatcg tggcaggtga cgaactcgcc cttcgcttgg 14640
atcaagccga tacgcttcgc ggcataggtg ccgacattct gcggcaggct aatgatcttg 14700
atgcgcgtgt ctttgagggc gagccgctgg agacgaaaca gggtgtcatc ggtgctcgcg 14760
tcatccacaa tgatcagctc gaaggaacgg taggtctgat tgaggagcga aatcaccgca 14820
ttttccacgc ggcgacccgt attataggtg gtcatcagga tggagatcaa cggccccgtc 14880
tgggccgggt acgggatgct ggtgatgatg ttgcacgggg agagcgggga gctgttgtcc 14940
gtcaaggcca cggggctgag gccgaagtat ttatagtatt cattcagccg attcaggcta 15000
atttcggcgg tttcgcggaa ggcgttattt tgcagcagca ggatatccgg gctatagacg 15060
atatcggatg cgtcgatctg ggcgagggtc gagatggcct tttgggtcag gccgatccgg 15120
agttgcagtg cggtatacag gtccagcggg cagttgtcca cgttgtccaa caggctcagg 15180
ctaaaggtcg gcgagtagga cgccagggtt ttcgccagtt ccactttctg atgggtatcg 15240
gtgaactcgt ccttgaactc catcagcagc tcgggcgtca ggctgatgtc gccgcaggcg 15300
atttttgcga tcttgattgc cagtttgcag cgccaatcgg acggggtatc cgtcaagtta 15360
tgcagcgacc agtacatatt cagacgatac atcgcgagga tgcgtttcga ctgccagaac 15420
cggcaatcat cctggatggc cgcgagcgcg tggacgtagc ggctcttttt gagcagccac 15480
aagaatttga gattattgaa catttattaa cctcctgcta gcaacttaag ttacgaatcg 15540
acgccgaaca ggtcgcgggt gtagactttc tccgagacat cttccagttc gctggtgcgg 15600
cgattcgcca caatgacatc gacgcgctcc ttaaaggaat tgatgtcgcg ctcgacgtag 15660
gaaccgaaga agtagggttc tttcaggacc ggctcgtaca ccacaatctc gatacccttg 15720
gccttcaaac gtttcatgac cccctggatg ctgctggccc ggaaattgtc gctacccgcc 15780
ttcatgatca ggcgatagat accgaccact ttgggcttac gggacaggat gtcctcggcc 15840
acgaagtcct tacgggtcgt attcgcatcc acgatggcct ggatcaggtt ttgcgggacg 15900
tcgcgataat tggccaacag ctgcttcgta tccttcggca gacagtaacc gccgtagccg 15960
aaggacgggt tgttgtaatg ttgaccaatg cgcggatcga gggagacgcc ttcgatgatt 16020
tgtttggtat ccaggccgtg cacgctcgcg taggtgtcca gctcgttaaa gtacgcgata 16080
cgcatcgcca gatacgtgtt cgcgaacagt ttgatggctt ctgcctcggg cgaatccgtc 16140
agcaggatcg gaatatcctt tttgatggca ccttccgaca ggagttcggc gaacttccgt 16200
gcgcgttccg acgattcgcc cacgacaatg cggctcggat agagattatc atacagggct 16260
ttgccttcgc gcaggaactc cggggaaaag atgatattat tcgtgttcag atcgcgcttc 16320
aggcgttcgg tgaacccgac ggggacggtg gatttgataa tgatggtcgc gttcgggtta 16380
atggacagca cgtcacacgc gacgctttcg acgctcaggg tatcaaagtt gttattaatc 16440
ggatcatagt tcgtcggggt ggcgatgatc acgtagtctg catcgcgata tgcctcgtat 16500
ttttccgtcg tcgcgtagag gttcagctta cgattggaga gaaacttctg gatttccggg 16560
tcgcaaatcg gcgagatttt cttgttaatg agctggacct tcttcgggtc gatgtccagg 16620
gcgatgatgt cgtgtttttg ggagaggagg atcgcaatgc tgatacccac atagccgacg 16680
ccggccacgg caattttcat ttattaacct ccttaagtga attcaaacta gtttacaagt 16740
cgttttcgat cttctcccag gtatatttgc gacattcatt caagttggtc agcggcgagt 16800
atttgtactt tttgataccg aggcgcgaca ggctttcgtt caccaccttg aaatggtttt 16860
ccttttggat gtccagtttc ttgatcgacg tgttctcgcc gtgcaggaca cggttgtagc 16920
aaatcttatt gatatgctta aacgggccga cttcgctgag tttcaaatac atatcgtaat 16980
ccaccgcatt gctgatgctc tcgttgaagc cttcggtgag gttccatgca cgcgccgtga 17040
acatacggaa gtggtggcag atcatcgcgc tcgtgagctt ttcgcggctg taaatcggcc 17100
agttgtagcc attgctaatc aagttacctt cacgatcaat attgcgattg gtggtgtaca 17160
cgcaggcgag gctcaggtct ttgcgaaatt catccagaca cagttccacg gcatcgggct 17220
ccaggaaatc atcggaatcc agctgcccga tgtagaaacc ccggcacagg cggactgcgg 17280
tattcgaggc ggagccgatg cctttgtttt tctggctgat gaaacggacg cgcgggtggt 17340
ttgcgtaatg ttcttgcagg atgcgcagcg tatcatcggt gctcccgtca tcgcagatgc 17400
agacctccag atcggtgatc gtttggttca gtgccgattc gacgcagcgc acgatatatt 17460
tgctgcaatt atacgcgggg atgtagatgc tcaccagggg cacacgtttc agggtggcgc 17520
tctcgatttt ctccttcttg cgataaaagt agggcacctt ctgctgcaac agctggacgg 17580
taatgttttt acctgccgcg cgatcggttt cgttctcctt accgggcggt tcctgatgat 17640
atgccatcgc gccttccacg ctacggaaat aacaaccctc gcggtacagc cgatagccga 17700
actcattatc ctcaccgccc caatgcgtga actcttcgtc aaaccaaccc gcgcgaaaca 17760
gccacttctt tgcaaacgcc acattgccac cgctaaagaa ccggaacggg gtgttgcaca 17820
ggcgcagatt gtcggtattc ttgaaatgtt cgatgcgcca atcgacggat ttgttctgct 17880
cgaccttgcc tgcgacctga ttattggtaa taatctccgg gatttcattg atcaggcttt 17940
tctgggacaa aaagtccaga taggtatgct tcgacgtgtc gatgtattta cgcgggccaa 18000
tcagtgccac gttatcatcc acggccagga gttccatata ggactgcacc cacaacgggt 18060
tcggcgccat atcgcagtcc aagatcgcca cgtagttgta tttcgctgcc cgcaggccca 18120
ggttccgcac ggcgcacagc tggtagccgt agtctttctg gcggacgtat ttgatgttca 18180
gcaacgactc gaactcgcgg acgatctctt cgatgttttc cttggaaccg tcatccgcga 18240
cgatgacctc atagtcataa atcgttttct gattgcagag gcaggccagg gtgatcgcca 18300
ggattttggc gcgattgtac gtcggaatca cgatggacag gccgtcgatg atcagttgct 18360
tgcgcggata atcatccagt tctttacgtt tccctgccca gacgtagtcg ttcgtgcttt 18420
ccggcagcgg cggcaaggtc aggtcgctcg gccaatccag cggaatgggt tcgacttctt 18480
tcaattcggc gcgctcggat ttctttgcgg taatttcccg atatttgcta atgatttcat 18540
tcttttccac ctcattcagc gagatcgcct ttgcattgct gcacataatt ttggttgccg 18600
cgtcgatatc aatgaccgct ttccgattca gcttgtccac ttcttcgctc agattcaggg 18660
cggtttggca cagcttgata ttggcttcca cccagctcac atcatagatt tccgccactt 18720
tttcaaacag ggagagggct tggcggtagt tcttattctt atacagattg attgcctggt 18780
tcaaaatgct catttattaa cctcctacta gtgaattttc gaattactta ccgcagtact 18840
tgacacccac ctgggaattg tttttggtgc gtttgaattg gcggatggta cggtagatgc 18900
taaagggcag gctgatcaga ccgagcggaa aattgttctt attgatgatg agcttgccca 18960
gctgatagct caggtgtttc ttgacccgtt cggcttcgtg tttatccgcg tacaggaaga 19020
tgctcggcag gctcacttgg tactccgaat catatttctt cttccaggtc cgccattcgc 19080
tgatcaacgc aaacggaatc gagatcagac cgaggaacgt cttggagcgg ctcaccatca 19140
ccgcacccag gcggtagccg atatcttgct tgatgcgttc ggccgcacca tacagctccg 19200
gcagttgttt cttttcgaga cgttgattgt cgatgaagta ctgttcgagc ttttgctgca 19260
ccagatgcag ctgattgagc agcaattctt tttcgcacga cagcttttcg aggcgctgtt 19320
gttgcagttc atttttgttc tgttcctttt tcagcaggga ctcgaagttc tcgatcgcgc 19380
actccagttc ctggacctgg atggttttgt ttttaatgat cagatcatac tggatcagtt 19440
cttccttgct atccgacagc tctttcagaa tggcttgata ggcgttcagc tgtttggacg 19500
tgtgcagttc gttgtccaga atgatctttt tgctgctctg gtacagaccg ttcacgatat 19560
cgagggtgat ctggcgttgt ttaatgaacg tctcccaaat aaaggacggc ttatagtttt 19620
ccttctccag cacccgcaag ggggtgttgg cgttcgattg caattcaaag tacagttcct 19680
tgcaatcggg atagtcgttc aggacgttga agatcaagta ctcctccgtc tcgctttgct 19740
tgaaaatgat atccccggtc ccgatgtcaa taccgctgag ggacatgatc tcctgatgtt 19800
ctttttccag cgtaatggag gcttcggcgg tcttaaagtc attcacgctc tgctccagcg 19860
agtggttgat ggtattggag aacgacaacc cgaatttcag tttcagtttg tgttgcagtt 19920
gctggatgca gtcctcggcg ttgcgcttca cctgttcgct cgacaccagc aggcaccgac 19980
cccggttgtt gaggaagaag tgcagcaagg cggtgttgta tgccagccag tttttgatca 20040
gatgctccga ggtatagttg ctggagatgt tctggtccga gaagtagttc gtcaggatgc 20100
ttttggggtg gtcgtagatg aggataaagg tgatgttctc atccaccgat ttccaatatt 20160
ccaacgtgtg aattgcgttg gggtcgctcc aaccgcacag tttctggttc aggttggaca 20220
gcatcagatc caatgcgata ccgttccaga cggtgctcac atggagcggt tcaaagtcgg 20280
cggaatcggt caccgtatag atgtccggcg actggtacgc cttccgcagc gtctgggtga 20340
tgtcctgggg cgagaggttc tcacgtttgg acgggcacag ggagttcatg ccgcgctgat 20400
gcaggagttc ttccacgatt tggtagttgc tgctcggatg gcccacgatc accaggcggt 20460
tcatttatta acctcctttc gaaaatgaac ggtccgttaa atatagccat tcggattctt 20520
catctgccag cgccaggcgt cctccagcat ggtttcgagt tcccgcttgg ctttccagtt 20580
cagatatttg ttggcctttt cgggggagga ccagctctcc gcgatatcac cgtcacggcg 20640
gctcacgatt tcatacggaa tccgcacgcc ggaaatcttt tcaaaggtgg acaccagttc 20700
cagcaccgaa taacctttac ccgtgcccaa attaaagacg tggtagttgg tgttattgtc 20760
gcggaagaga taggacagcg ctgcgacgtg cccttcggcc aggtccatca catggatata 20820
gtcacggacc cccgtgccgt ctttggtggg ataatcacca ccgaacacca tcagtttttc 20880
cagtttcccc atcgcgacct gcaagatgta cggcaccaag ttggagggga tgtctgccgg 20940
gctttcacca atcataccgg attcgtgggc gcccgtcgga ttaaagtagc gcaagcagag 21000
gaaattcgtg tcggagtatt tcttggcgat gtcgcggatc atcagctccg agatgtactt 21060
ggacgtacca tacggattca gcgtgccacc aatatggcag tcttcggtga cgggcatgat 21120
cttgctttcc ccatacaccg tcgccgacga gctaaagatg aagttggcga cgtcgttctt 21180
gatggcgcaa ttgatgagtt gcagggtgcc gctcacgttg ttgtcatagt agaagatggg 21240
cttgatcagg ctttctgcga ccgatttcgc acctgcaaag tgcatgatgc agtcgaattt 21300
gtgtttcttc aggatctggt tcacttcctt ctcgttgttg atattgagtt cgtagaacgt 21360
gactttcttc tttgcgatca gctcaatgcg acggatgctt tcgcagctgc tgttgatgag 21420
attgtcaatg atgacgacat tgtagccttt gttcagcagg cagagcgacg tgtggctgcc 21480
gatgtagcct gcaccgccgg tgaccaggat gttcatttat taacctcctc ggtccgaatt 21540
aacctaggtt atgaggtcag cattgcttct tcacgcgttt agtagttgtt ttgttcggtg 21600
atatattctt caatgccttc ttgcacgtct tcatggaacg acacggcgtt gtcgtcttta 21660
aacacgattg ccacatcgca gaactctttc aacgagttca gcgagtgcga caccatgagg 21720
aaggagcttt ccttatgacg ctccttgaag agttgggcac atttttcctt gaaacgggcg 21780
tcccccaccg ccgtcacctc gtccacgatg tagtaatcga acttgaacgc catgctcagg 21840
ccgaagccga ggcggctgcg cataccgctc gaataggtct tgatcggcat atcaaaatac 21900
ttccccagct ccgcgaactc ttccacaaac tcaatctttt ctttcagctc ctcctgcttc 21960
gcgtacagcc gggccacgaa cttcacgttt tcacgcccgg tcaagctgcc ctggaagccg 22020
cctgccagac ccaccggcca cgagatcgtt ttattcgtga tgattttacc gctatccggg 22080
cggtcgatgc ccccaatcat gcgcaacagc gtggatttac ccgccccatt gcgcccgatg 22140
aacgccacgc ttttgccgct ggggatctca atgttcaggt tcttgaagac atagtgacgg 22200
cccaccgggg tgcggtagct tttcgtcagg ttttcgatct taatcatgag gtcaacattg 22260
cctcctcacg cgtacggtac agggccaaac caataaacag ggtcaccagg gtgaacattg 22320
ccagataatt caggctgacc ccttcgctga tataaccggg catcacggcc tcgcggctca 22380
gttcgacgac gtgcaccagg ggattccaca gcaggtacga ccaatactgc ttcggaatgg 22440
agtgcagcgg gaacatgatg cacgaaataa agtacagcgg cttcagcaag atcggcaaga 22500
ctttctgcat ttcggggaac gtcttgccca cgaccatgaa gatcaggccc acaccgcacg 22560
acaggatgat caggaggctc caggtgagca caaattgcag gaagttggta atctcgaaat 22620
attcgcccgc catccagatg atcagcatca ggaggatgta gaccgccaca tagatcagcg 22680
tttccaagag ggcgcgtgca atgatcgtgt cgatcggctt cacgggccgg tagttaaaca 22740
gcccctgatt ggcttcgatg gcgcccacgg agcgattgct gatgctgctg aaaataaaga 22800
acgggatcag gccattgagc aggaacaccg ggaaggagat atccggcatg gtgcgatgca 22860
tgatatagcc aaagatcccg agcagaatca gcagatgtgc gctcggttcc aggatcgccc 22920
acagatagcc caggcgaaac ttgccaaagc gcgtacggat ttcgcggaga aacagtgctt 22980
cgaccgtcac tttctggact tcaaaacccg aacgtgccat ttattaacct cctggtacca 23040
atctagattg tttaaacaga tctgttacct gcaggattat tgtttctgtt gcataaagcc 23100
taaggggtag gcctttctag agatagccat tttttgcact cctgtatccg cttcttgcaa 23160
ggctggactt atccctatca aaccggacac tgcaggctga caagctttca ttacatatga 23220
agagtttgta gaaacgcaaa aaggccatcc gtcaggatgg ccttctaaga aggctcgagt 23280
ggcgcgccta agtcgaattt ctgccattca tccgcttatt atacttattc aggcgtagca 23340
ccaggcgttt aagggcacca ataactgcct taaaaaaatt acgccccgcc ctgccactca 23400
tcgcagtact gttgtaattc attaagcatt ctgccgacat ggaagccatc acagacggca 23460
tgatgaacct gaatcgccag cggcatcagc accttgtcgc cttgcgtata atatttgccc 23520
atggtgaaaa cgggggcgaa gaagttgtcc atattggcca cgtttaaatc aaaactggtg 23580
aaactcaccc agggattggc tgagacgaaa aacatattct caataaaccc tttagggaaa 23640
taggccaggt tttcaccgta acacgccaca tcttgcgaat atatgtgtag aaactgccgg 23700
aaatcgtcgt ggtattcact ccagagcgat gaaaacgttt cagtttgctc atggaaaacg 23760
gtgtaacaag ggtgaacact atcccatatc accagctcac cgtctttcat tgccatacgg 23820
aattccggat gagcattcat caggcgggca agaatgtgaa taaaggccgg ataaaacttg 23880
tgcttatttt tctttacggt ctttaaaaag gccgtaatat ccagctgaac ggtctggtta 23940
taggtacatt gagcaactga ctgaaatgcc tcaaaatgtt ctttacgatg ccattgggat 24000
atatcaacgg tggtatatcc agtgattttt ttctccattt tagcttcctt agctcctgaa 24060
aatctcgata actcaaaaaa tacgcccggt agtgatctta tttcattatg gtgaaagttg 24120
gaacctctta cgtgccgatc aacgtctcat tttcgccaaa agttggccca gggcttcccg 24180
gtatcaacag ggacaccagg atttatttat tctgcgaagt gatcttccgt cacaggtatt 24240
tattcggcgc aaagggcctc gtgatacgcc tatttttata ggttaatgtc atgataataa 24300
tggtttctta gacgtcaggt ggcacttttc ggggaaatgt gcgcgcccgc gttcctgctg 24360
gcgctgggcc tgtttctggc gctggacttc ccgctgttcc gtcagcagct tttcgcccac 24420
ggccttgatg atcgcggcgg ccttggcctg catatcccga ttcaacggcc ccagggcgtc 24480
cagaacgggc ttcaggcgct cccgaaggt 24509
<210> 42
<211> 14996
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Sequence
<400> 42
ctcgggccgt ctcttgggct tgatcggcct tcttgcgcat ctcacgcgct cctgcggcgg 60
cctgtagggc aggctcatac ccctgccgaa ccgcttttgt cagccggtcg gccacggctt 120
ccggcgtctc aacgcgcttt gagattccca gcttttcggc caatccctgc ggtgcatagg 180
cgcgtggctc gaccgcttgc gggctgatgg tgacgtggcc cactggtggc cgctccaggg 240
cctcgtagaa cgcctgaatg cgcgtgtgac gtgccttgct gccctcgatg ccccgttgca 300
gccctagatc ggccacagcg gccgcaaacg tggtctggtc gcgggtcatc tgcgctttgt 360
tgccgatgaa ctccttggcc gacagcctgc cgtcctgcgt cagcggcacc acgaacgcgg 420
tcatgtgcgg gctggtttcg tcacggtgga tgctggccgt cacgatgcga tccgccccgt 480
acttgtccgc cagccacttg tgcgccttct cgaagaacgc cgcctgctgt tcttggctgg 540
ccgacttcca ccattccggg ctggccgtca tgacgtactc gaccgccaac acagcgtcct 600
tgcgccgctt ctctggcagc aactcgcgca gtcggcccat cgcttcatcg gtgctgctgg 660
ccgcccagtg ctcgttctct ggcgtcctgc tggcgtcagc gttgggcgtc tcgcgctcgc 720
ggtaggcgtg cttgagactg gccgccacgt tgcccatttt cgccagcttc ttgcatcgca 780
tgatcgcgta tgccgccatg cctgcccctc ccttttggtg tccaaccggc tcgacggggg 840
cagcgcaagg cggtgcctcc ggcgggccac tcaatgcttg agtatactca ctagactttg 900
cttcgcaaag tcgtgaccgc ctacggcggc tgcggcgccc tacgggcttg ctctccgggc 960
ttcgccctgc gcggtcgctg cgctcccttg ccagcccgtg gatatgtgga cgatggccgc 1020
gagcggccac cggctggctc gcttcgctcg gcccgtggac aaccctgctg gacaagctga 1080
tggacaggct gcgcctgccc acgagcttga ccacagggat tgcccaccgg ctacccagcc 1140
ttcgaccaca tacccaccgg ctccaactgc gcggcctgcg gccttgcccc atcaattttt 1200
ttaattttct ctggggaaaa gcctccggcc tgcggcctgc gcgcttcgct tgccggttgg 1260
acaccaagtg gaaggcgggt caaggctcgc gcagcgaccg cgcagcggct tggccttgac 1320
gcgcctggaa cgacccaagc ctatgcgagt gggggcagtc gaaggcgaag cccgcccgcc 1380
tgccccccga gacctgcaga tccacatcct tgaaggccgc agcgacgagc agaaggaaac 1440
cctcattcgg gaagtcagcg aggccatctc gcgctccctg gatgcgccgc tgaccagcgt 1500
gcgagtgatt atcacggaga tggccaaggg ccacttcggc atcggcggcg aactggccag 1560
caaggtcaga cgctgaagtg gagatgccca agggcacttc gggtcgagga acccgacctg 1620
cattgggacg cggccacgga gagcgcgggc aaacgccggc actatagcca gtggagtttg 1680
taaaacgcta tttcagagct tggagagtgt ctaagaaagc cggggcgatg ccaacccatc 1740
ccttcttcgg ctatgcatcg ttcgtaatca agccacttcc tttttgcatt gacgcagggt 1800
gtcggaaggc aactcgccga acgcgctcct atagttttca gcgaagcgtc ccaaatgtaa 1860
gaagccgtag tctagggcta tctcagttat actacgcaca ttggcactgg gatcgttcaa 1920
gcaggcgcgg atgctttcga gcttgcggtt gcggatgtag ttcttcggcg tggtgccggc 1980
atgcttctcg aacaaattgt agagcgagcg tggactcatc atcgccagct ccgctaaccg 2040
ctcaaggctg atattccgtt tgagattctc ctcaatgaat tgaacgactc gctcgaaaga 2100
cgggttacct ttgctgaaaa tttcacggct gacattgctg cccagcattt cgagcagctt 2160
ggaagcgatg atccccgcat agtgctcttg gacccgaggc atcgactttg tatgttccgc 2220
ttcgtcacaa actaacccga gtagattgat aaagccatcg agttgctgga gattgtgtcg 2280
cgcggcgaaa cggataccct ccctcggctt gtgccaattg ttgtcactgc atgcccgatc 2340
aaggaccact gagggcaatt taacgataaa tttctcgcaa tcttctgaat aggtcaggtc 2400
ggcttggtca tccggattga gcagcaatag ttcgcccggc gcaaaatagt gctcctggcc 2460
atggccacgc cacaggcaat ggcctttgag tattatttgc agatgataac aggtctctaa 2520
tccaggcgag attaccctca cgctaccgcc gtagctgatt cgacacaggt cgaggcatcc 2580
gaagattctg tggtgcagcc tgcctgccgg gcgcccgccc ttgggcaggc gaatagagtg 2640
cgtaccgaca tactggttaa cataatcgga gactgcatag ggctcggcgt ggacgaagat 2700
ctgacttttc tcgttcaata agcaaaaatc catagttcac ggttctctta ttttaatgtg 2760
ggctgcttgg tgtgatgtag aaaggcgcca agtcgatgaa aatgcatctc gacgtgatgc 2820
gtatacgggt tacccccatt gccacgttgc gccatccttt ttgcaatcag tgaccacttt 2880
tccaagcaaa aataacgcca agcagaacga agacgttctt tttaagaagc gagaacacca 2940
gaagttcgtg ctgtcggggc atgcggcgac gaattggcgg ataaagggga tctgcaggtc 3000
ccgagcctca cggcggcgag tgcgggggtt ccaagggggc agcgccacct tgggcaaggc 3060
cgaaggccgc gcagtcgatc aacaagcccc ggaggggcca ctttttgccg gagggggagc 3120
cgcgccgaag gcgtggggga accccgcagg ggtgcccttc tttgggcacc aaagaactag 3180
atatagggcg aaatgcgaaa gacttaaaaa tcaacaactt aaaaaagggg ggtacgcaac 3240
agctcattgc ggcacccccc gcaatagctc attgcgtagg ttaaagaaaa tctgtaattg 3300
actgccactt ttacgcaacg cataattgtt gtcgcgctgc cgaaaagttg cagctgattg 3360
cgcatggtgc cgcaaccgtg cggcacccta ccgcatggag ataagcatgg ccacgcagtc 3420
cagagaaatc ggcattcaag ccaagaacaa gcccggtcac tgggtgcaaa cggaacgcaa 3480
agcgcatgag gcgtgggccg ggcttattgc gaggaaaccc acggcggcaa tgctgctgca 3540
tcacctcgtg gcgcagatgg gccaccagaa cgccgtggtg gtcagccaga agacactttc 3600
caagctcatc ggacgttctt tgcggacggt ccaatacgca gtcaaggact tggtggccga 3660
gcgctggatc tccgtcgtga agctcaacgg ccccggcacc gtgtcggcct acgtggtcaa 3720
tgaccgcgtg gcgtggggcc agccccgcga ccagttgcgc ctgtcggtgt tcagtgccgc 3780
cgtggtggtt gatcacgacg accaggacga atcgctgttg gggcatggcg acctgcgccg 3840
catcccgacc ctgtatccgg gcgagcagca actaccgacc ggccccggcg aggagccgcc 3900
cagccagccc ggcattccgg gcatggaacc agacctgcca gccttgaccg aaacggagga 3960
atgggaacgg cgcgggcagc agcgcctgcc gatgcccgat gagccgtgtt ttctggacga 4020
tggcgagccg ttggagccgc cgacacgggt cacgctgccg cgccggtagc acttgggttg 4080
cgcagcaacc cgtaagtgcg ctgttccaga ctatcggctg tagccgcctc gccgccctat 4140
accttgtctg cctccccgcg ttgcgtcgcg gtgcatggag ccgggccacc tcgacctgaa 4200
tggaagccgg cggcacctcg ctaacggatt caccgttttt atcaggctct gggaggcaga 4260
ataaatgatc atatcgtcaa ttattacctc cacggggaga gcctgagcaa actggcctca 4320
ggcatttgag aagcacacgg tcacactgct tccggtagtc aataaaccgg taaaccagca 4380
atagacataa gcggctattt aacgaccctg ccctgaaccg acgaccgggt cgaatttgct 4440
ttcgactatc ggcgcgccag agctcatcgt taatgtcttc gtgcgccgtc agtcggcgca 4500
cgttttttct ctctggtacc gtgtcactga tctagtcaat tactcgaagt atccacaagt 4560
gaagcatact aagtaatgta caagaatcaa aaaaatcggc tacgcaagtc gcgtagccga 4620
atcatttaag gatccttcca ttcaggtcga ggtggcccgg ctccatgcac cgcgacgcaa 4680
cgcggggagg cagacaaggt atagggcggc gcctacaatc catgccaacc cgttccatgt 4740
gctcgccgag gcggcataaa tcgccgtgac gatcagcggt ccagtgatcg aagttaggct 4800
ggtaagagcc gcgagcgatc cttgaagctg tccctgatgg tcgtcatcta cctgcctgga 4860
cagcatggcc tgcaacgcgg gcatcccgat gccgccggaa gcgagaagaa tcataatggg 4920
gaaggccatc cagcctcgcg tcgcgaacgc cagcaagacg tagcccagcg cgtcggccgc 4980
catgccggcg ataatggcct gcttctcgcc gaaacgtttg gtggcgggac cagtgacgaa 5040
ggcttgagcg agggcgtgca agattccgaa taccgcaagc gacaggccga tcatcgtcgc 5100
gctccagcga aagcggtcct cgccgaaaat gacccagagc gctgccggca cctgtcctac 5160
gagttgcatg ataaagaaga cagtcataag tgcggcgacg atagtcatgc cccgcgccca 5220
ccggaaggag ctgactgggt tgaaggctct caagggcatc ggtcgacgct ctcccttatg 5280
cgactcctgc attaggaagc agcccagtag taggttgagg ccgttgagca ccgccgccgc 5340
aaggaatggt gcatgcaagg agatggcgcc caacagtccc ccggccacgg ggcctgccac 5400
catacccacg ccgaaacaag cgctcatgag cccgaagtgg cgagcccgat cttccccatc 5460
ggtgatgtcg gcgatatagg cgccagcaac cgcacctgtg gcgccggtga tgccggccac 5520
gatgcgtccg gcgtacaaga tccacaggac gggtgtggtc gccatgatcg cgtagtcgat 5580
agtggctcca agtagcgaag cgagcaggac tgggcggcgg ccaaagcggt cggacagtgc 5640
tccgagaacg ggtgcgcata gaaattgcat caacgcatat agcgctagca gcacgccata 5700
gtgactggcg atgctgtcgg aatggacgat atcccgcaag aggcccggca gtaccggcat 5760
aaccaagcct atgcctacag catccagggt gacggtgccg aggatgacga tgagcgcatt 5820
gttagatttc atacacggtg cctgactgcg ttagcaattt aactgtgata aactaccgca 5880
ttaaagccga gcgatgataa gctgtcaaac atgagatccg ataaatcgat tgatagattt 5940
aaataagaac tgcagaagct agcttagatg ctcgtgaaat tgacgtgggc gctttgcagg 6000
gccgtcttaa tggcgttggt gtccacgagg atcgagtcgg gtgcggaaaa cggacggttc 6060
ttgttggtga aatcgctgtt accaatgtac agcgattcct tgttacgcag cgcctggatg 6120
tgccagcggg accacgaatc ccaatacttc tggcgatccg gcgagatacc ttggctggtg 6180
tagccggtcg tcgggctgtt catcaacgag tcggtgcggt gcgagcccag cgtcagcggc 6240
aacttgatcc gatgcaccgt ggaatcgccg aagatcagct tcagacgcgc gataaattcg 6300
ctatccgcac ccgttttcac acaatcccag acaccggcct tctgcaagac gtcggcacgg 6360
cgaaacagga gcgacgacgg attcagacgc ttcaaggggt acactgcgcg ggcatagaaa 6420
ataccgttgt cttgcaggcg cacccagtcc gagatggagc agatgagctt cggattgagc 6480
aacaaggggg agatttggcg gaacagcttt tccggatggc tccagtcatc cgaatcgtgg 6540
caggtgacga actcgccctt cgcttggatc aagccgatac gcttcgcggc ataggtgccg 6600
acattctgcg gcaggctaat gatcttgatg cgcgtgtctt tgagggcgag ccgctggaga 6660
cgaaacaggg tgtcatcggt gctcgcgtca tccacaatga tcagctcgaa ggaacggtag 6720
gtctgattga ggagcgaaat caccgcattt tccacgcggc gacccgtatt ataggtggtc 6780
atcaggatgg agatcaacgg ccccgtctgg gccgggtacg ggatgctggt gatgatgttg 6840
cacggggaga gcggggagct gttgtccgtc aaggccacgg ggctgaggcc gaagtattta 6900
tagtattcat tcagccgatt caggctaatt tcggcggttt cgcggaaggc gttattttgc 6960
agcagcagga tatccgggct atagacgata tcggatgcgt cgatctgggc gagggtcgag 7020
atggcctttt gggtcaggcc gatccggagt tgcagtgcgg tatacaggtc cagcgggcag 7080
ttgtccacgt tgtccaacag gctcaggcta aaggtcggcg agtaggacgc cagggttttc 7140
gccagttcca ctttctgatg ggtatcggtg aactcgtcct tgaactccat cagcagctcg 7200
ggcgtcaggc tgatgtcgcc gcaggcgatt tttgcgatct tgattgccag tttgcagcgc 7260
caatcggacg gggtatccgt caagttatgc agcgaccagt acatattcag acgatacatc 7320
gcgaggatgc gtttcgactg ccagaaccgg caatcatcct ggatggccgc gagcgcgtgg 7380
acgtagcggc tctttttgag cagccacaag aatttgagat tattgaacat ttattaacct 7440
cctgctagca acttaagtta cgaatcgacg ccgaacaggt cgcgggtgta gactttctcc 7500
gagacatctt ccagttcgct ggtgcggcga ttcgccacaa tgacatcgac gcgctcctta 7560
aaggaattga tgtcgcgctc gacgtaggaa ccgaagaagt agggttcttt caggaccggc 7620
tcgtacacca caatctcgat acccttggcc ttcaaacgtt tcatgacccc ctggatgctg 7680
ctggcccgga aattgtcgct acccgccttc atgatcaggc gatagatacc gaccactttg 7740
ggcttacggg acaggatgtc ctcggccacg aagtccttac gggtcgtatt cgcatccacg 7800
atggcctgga tcaggttttg cgggacgtcg cgataattgg ccaacagctg cttcgtatcc 7860
ttcggcagac agtaaccgcc gtagccgaag gacgggttgt tgtaatgttg accaatgcgc 7920
ggatcgaggg agacgccttc gatgatttgt ttggtatcca ggccgtgcac gctcgcgtag 7980
gtgtccagct cgttaaagta cgcgatacgc atcgccagat acgtgttcgc gaacagtttg 8040
atggcttctg cctcgggcga atccgtcagc aggatcggaa tatccttttt gatggcacct 8100
tccgacagga gttcggcgaa cttccgtgcg cgttccgacg attcgcccac gacaatgcgg 8160
ctcggataga gattatcata cagggctttg ccttcgcgca ggaactccgg ggaaaagatg 8220
atattattcg tgttcagatc gcgcttcagg cgttcggtga acccgacggg gacggtggat 8280
ttgataatga tggtcgcgtt cgggttaatg gacagcacgt cacacgcgac gctttcgacg 8340
ctcagggtat caaagttgtt attaatcgga tcatagttcg tcggggtggc gatgatcacg 8400
tagtctgcat cgcgatatgc ctcgtatttt tccgtcgtcg cgtagaggtt cagcttacga 8460
ttggagagaa acttctggat ttccgggtcg caaatcggcg agattttctt gttaatgagc 8520
tggaccttct tcgggtcgat gtccagggcg atgatgtcgt gtttttggga gaggaggatc 8580
gcaatgctga tacccacata gccgacgccg gccacggcaa ttttcattta ttaacctcct 8640
taagtgaatt caaactagtt tacaagtcgt tttcgatctt ctcccaggta tatttgcgac 8700
attcattcaa gttggtcagc ggcgagtatt tgtacttttt gataccgagg cgcgacaggc 8760
tttcgttcac caccttgaaa tggttttcct tttggatgtc cagtttcttg atcgacgtgt 8820
tctcgccgtg caggacacgg ttgtagcaaa tcttattgat atgcttaaac gggccgactt 8880
cgctgagttt caaatacata tcgtaatcca ccgcattgct gatgctctcg ttgaagcctt 8940
cggtgaggtt ccatgcacgc gccgtgaaca tacggaagtg gtggcagatc atcgcgctcg 9000
tgagcttttc gcggctgtaa atcggccagt tgtagccatt gctaatcaag ttaccttcac 9060
gatcaatatt gcgattggtg gtgtacacgc aggcgaggct caggtctttg cgaaattcat 9120
ccagacacag ttccacggca tcgggctcca ggaaatcatc ggaatccagc tgcccgatgt 9180
agaaaccccg gcacaggcgg actgcggtat tcgaggcgga gccgatgcct ttgtttttct 9240
ggctgatgaa acggacgcgc gggtggtttg cgtaatgttc ttgcaggatg cgcagcgtat 9300
catcggtgct cccgtcatcg cagatgcaga cctccagatc ggtgatcgtt tggttcagtg 9360
ccgattcgac gcagcgcacg atatatttgc tgcaattata cgcggggatg tagatgctca 9420
ccaggggcac acgtttcagg gtggcgctct cgattttctc cttcttgcga taaaagtagg 9480
gcaccttctg ctgcaacagc tggacggtaa tgtttttacc tgccgcgcga tcggtttcgt 9540
tctccttacc gggcggttcc tgatgatatg ccatcgcgcc ttccacgcta cggaaataac 9600
aaccctcgcg gtacagccga tagccgaact cattatcctc accgccccaa tgcgtgaact 9660
cttcgtcaaa ccaacccgcg cgaaacagcc acttctttgc aaacgccaca ttgccaccgc 9720
taaagaaccg gaacggggtg ttgcacaggc gcagattgtc ggtattcttg aaatgttcga 9780
tgcgccaatc gacggatttg ttctgctcga ccttgcctgc gacctgatta ttggtaataa 9840
tctccgggat ttcattgatc aggcttttct gggacaaaaa gtccagatag gtatgcttcg 9900
acgtgtcgat gtatttacgc gggccaatca gtgccacgtt atcatccacg gccaggagtt 9960
ccatatagga ctgcacccac aacgggttcg gcgccatatc gcagtccaag atcgccacgt 10020
agttgtattt cgctgcccgc aggcccaggt tccgcacggc gcacagctgg tagccgtagt 10080
ctttctggcg gacgtatttg atgttcagca acgactcgaa ctcgcggacg atctcttcga 10140
tgttttcctt ggaaccgtca tccgcgacga tgacctcata gtcataaatc gttttctgat 10200
tgcagaggca ggccagggtg atcgccagga ttttggcgcg attgtacgtc ggaatcacga 10260
tggacaggcc gtcgatgatc agttgcttgc gcggataatc atccagttct ttacgtttcc 10320
ctgcccagac gtagtcgttc gtgctttccg gcagcggcgg caaggtcagg tcgctcggcc 10380
aatccagcgg aatgggttcg acttctttca attcggcgcg ctcggatttc tttgcggtaa 10440
tttcccgata tttgctaatg atttcattct tttccacctc attcagcgag atcgcctttg 10500
cattgctgca cataattttg gttgccgcgt cgatatcaat gaccgctttc cgattcagct 10560
tgtccacttc ttcgctcaga ttcagggcgg tttggcacag cttgatattg gcttccaccc 10620
agctcacatc atagatttcc gccacttttt caaacaggga gagggcttgg cggtagttct 10680
tattcttata cagattgatt gcctggttca aaatgctcat ttattaacct cctactagtg 10740
aattttcgaa ttacttaccg cagtacttga cacccacctg ggaattgttt ttggtgcgtt 10800
tgaattggcg gatggtacgg tagatgctaa agggcaggct gatcagaccg agcggaaaat 10860
tgttcttatt gatgatgagc ttgcccagct gatagctcag gtgtttcttg acccgttcgg 10920
cttcgtgttt atccgcgtac aggaagatgc tcggcaggct cacttggtac tccgaatcat 10980
atttcttctt ccaggtccgc cattcgctga tcaacgcaaa cggaatcgag atcagaccga 11040
ggaacgtctt ggagcggctc accatcaccg cacccaggcg gtagccgata tcttgcttga 11100
tgcgttcggc cgcaccatac agctccggca gttgtttctt ttcgagacgt tgattgtcga 11160
tgaagtactg ttcgagcttt tgctgcacca gatgcagctg attgagcagc aattcttttt 11220
cgcacgacag cttttcgagg cgctgttgtt gcagttcatt tttgttctgt tcctttttca 11280
gcagggactc gaagttctcg atcgcgcact ccagttcctg gacctggatg gttttgtttt 11340
taatgatcag atcatactgg atcagttctt ccttgctatc cgacagctct ttcagaatgg 11400
cttgataggc gttcagctgt ttggacgtgt gcagttcgtt gtccagaatg atctttttgc 11460
tgctctggta cagaccgttc acgatatcga gggtgatctg gcgttgttta atgaacgtct 11520
cccaaataaa ggacggctta tagttttcct tctccagcac ccgcaagggg gtgttggcgt 11580
tcgattgcaa ttcaaagtac agttccttgc aatcgggata gtcgttcagg acgttgaaga 11640
tcaagtactc ctccgtctcg ctttgcttga aaatgatatc cccggtcccg atgtcaatac 11700
cgctgaggga catgatctcc tgatgttctt tttccagcgt aatggaggct tcggcggtct 11760
taaagtcatt cacgctctgc tccagcgagt ggttgatggt attggagaac gacaacccga 11820
atttcagttt cagtttgtgt tgcagttgct ggatgcagtc ctcggcgttg cgcttcacct 11880
gttcgctcga caccagcagg caccgacccc ggttgttgag gaagaagtgc agcaaggcgg 11940
tgttgtatgc cagccagttt ttgatcagat gctccgaggt atagttgctg gagatgttct 12000
ggtccgagaa gtagttcgtc aggatgcttt tggggtggtc gtagatgagg ataaaggtga 12060
tgttctcatc caccgatttc caatattcca acgtgtgaat tgcgttgggg tcgctccaac 12120
cgcacagttt ctggttcagg ttggacagca tcagatccaa tgcgataccg ttccagacgg 12180
tgctcacatg gagcggttca aagtcggcgg aatcggtcac cgtatagatg tccggcgact 12240
ggtacgcctt ccgcagcgtc tgggtgatgt cctggggcga gaggttctca cgtttggacg 12300
ggcacaggga gttcatgccg cgctgatgca ggagttcttc cacgatttgg tagttgctgc 12360
tcggatggcc cacgatcacc aggcggttca tttattaacc tcctttcgaa aatgaacggt 12420
ccgttaaata tagccattcg gattcttcat ctgccagcgc caggcgtcct ccagcatggt 12480
ttcgagttcc cgcttggctt tccagttcag atatttgttg gccttttcgg gggaggacca 12540
gctctccgcg atatcaccgt cacggcggct cacgatttca tacggaatcc gcacgccgga 12600
aatcttttca aaggtggaca ccagttccag caccgaataa cctttacccg tgcccaaatt 12660
aaagacgtgg tagttggtgt tattgtcgcg gaagagatag gacagcgctg cgacgtgccc 12720
ttcggccagg tccatcacat ggatatagtc acggaccccc gtgccgtctt tggtgggata 12780
atcaccaccg aacaccatca gtttttccag tttccccatc gcgacctgca agatgtacgg 12840
caccaagttg gaggggatgt ctgccgggct ttcaccaatc ataccggatt cgtgggcgcc 12900
cgtcggatta aagtagcgca agcagaggaa attcgtgtcg gagtatttct tggcgatgtc 12960
gcggatcatc agctccgaga tgtacttgga cgtaccatac ggattcagcg tgccaccaat 13020
atggcagtct tcggtgacgg gcatgatctt gctttcccca tacaccgtcg ccgacgagct 13080
aaagatgaag ttggcgacgt cgttcttgat ggcgcaattg atgagttgca gggtgccgct 13140
cacgttgttg tcatagtaga agatgggctt gatcaggctt tctgcgaccg atttcgcacc 13200
tgcaaagtgc atgatgcagt cgaatttgtg tttcttcagg atctggttca cttccttctc 13260
gttgttgata ttgagttcgt agaacgtgac tttcttcttt gcgatcagct caatgcgacg 13320
gatgctttcg cagctgctgt tgatgagatt gtcaatgatg acgacattgt agcctttgtt 13380
cagcaggcag agcgacgtgt ggctgccgat gtagcctgca ccgccggtga ccaggatgtt 13440
catttattaa cctcctcggt ccgaattaac ctaggttatg aggtcagcat tgcttcttca 13500
cgcggtgtta attaagtaat cgatagtgat ttaaatatgc aagatctagt tacctgcagg 13560
attattgttt ctgttgcata aagcctaagg ggtaggcctt tctagagata gccatttttt 13620
gcactcctgt atccgcttct tgcaaggctg gacttatccc tatcaaaccg gacactgcag 13680
gctgacaagc tttcattaca tatgaagagt ttgtagaaac gcaaaaaggc catccgtcag 13740
gatggccttc taagaaggct cgagtggcgc gcctaagtcg aatttctgcc attcatccgc 13800
ttattatcac ttattcaggc gtagcaacca ggcgtttaag ggcaccaata actgccttaa 13860
aaaaattacg ccccgccctg ccactcatcg cagtactgtt gtaattcatt aagcattctg 13920
ccgacatgga agccatcaca aacggcatga tgaacctgaa tcgccagcgg catcagcacc 13980
ttgtcgcctt gcgtataata tttgcccatg gtgaaaacgg gggcgaagaa gttgtccata 14040
ttggccacgt ttaaatcaaa actggtgaaa ctcacccagg gattggctga gacgaaaaac 14100
atattctcaa taaacccttt agggaaatag gccaggtttt caccgtaaca cgccacatct 14160
tgcgaatata tgtgtagaaa ctgccggaaa tcgtcgtggt attcactcca gagcgatgaa 14220
aacgtttcag tttgctcatg gaaaacggtg taacaagggt gaacactatc ccatatcacc 14280
agctcaccgt ctttcattgc catacggaat tccggatgag cattcatcag gcgggcaaga 14340
atgtgaataa aggccggata aaacttgtgc ttatttttct ttacggtctt taaaaaggcc 14400
gtaatatcca gctgaacggt ctggttatag gtacattgag caactgactg aaatgcctca 14460
aaatgttctt tacgatgcca ttgggatata tcaacggtgg tatatccagt gatttttttc 14520
tccattttag cttccttagc tcctgaaaat ctcgataact caaaaaatac gcccggtagt 14580
gatcttattt cattatggtg aaagttggaa cctcttacgt gccgatcaac gtctcatttt 14640
cgccaaaagt tggcccaggg cttcccggta tcaacaggga caccaggatt tatttattct 14700
gcgaagtgat cttccgtcac aggtatttat tcggcgcaaa gggcctcgtg atacgcctat 14760
ttttataggt taatgtcatg ataataatgg tttcttagac gtcaggtggc acttttcggg 14820
gaaatgtgcg cgcccgcgtt cctgctggcg ctgggcctgt ttctggcgct ggacttcccg 14880
ctgttccgtc agcagctttt cgcccacggc cttgatgatc gcggcggcct tggcctgcat 14940
atcccgattc aacggcccca gggcgtccag aacgggcttc aggcgctccc gaaggt 14996
<210> 43
<211> 13336
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Sequence
<400> 43
ctcgggccgt ctcttgggct tgatcggcct tcttgcgcat ctcacgcgct cctgcggcgg 60
cctgtagggc aggctcatac ccctgccgaa ccgcttttgt cagccggtcg gccacggctt 120
ccggcgtctc aacgcgcttt gagattccca gcttttcggc caatccctgc ggtgcatagg 180
cgcgtggctc gaccgcttgc gggctgatgg tgacgtggcc cactggtggc cgctccaggg 240
cctcgtagaa cgcctgaatg cgcgtgtgac gtgccttgct gccctcgatg ccccgttgca 300
gccctagatc ggccacagcg gccgcaaacg tggtctggtc gcgggtcatc tgcgctttgt 360
tgccgatgaa ctccttggcc gacagcctgc cgtcctgcgt cagcggcacc acgaacgcgg 420
tcatgtgcgg gctggtttcg tcacggtgga tgctggccgt cacgatgcga tccgccccgt 480
acttgtccgc cagccacttg tgcgccttct cgaagaacgc cgcctgctgt tcttggctgg 540
ccgacttcca ccattccggg ctggccgtca tgacgtactc gaccgccaac acagcgtcct 600
tgcgccgctt ctctggcagc aactcgcgca gtcggcccat cgcttcatcg gtgctgctgg 660
ccgcccagtg ctcgttctct ggcgtcctgc tggcgtcagc gttgggcgtc tcgcgctcgc 720
ggtaggcgtg cttgagactg gccgccacgt tgcccatttt cgccagcttc ttgcatcgca 780
tgatcgcgta tgccgccatg cctgcccctc ccttttggtg tccaaccggc tcgacggggg 840
cagcgcaagg cggtgcctcc ggcgggccac tcaatgcttg agtatactca ctagactttg 900
cttcgcaaag tcgtgaccgc ctacggcggc tgcggcgccc tacgggcttg ctctccgggc 960
ttcgccctgc gcggtcgctg cgctcccttg ccagcccgtg gatatgtgga cgatggccgc 1020
gagcggccac cggctggctc gcttcgctcg gcccgtggac aaccctgctg gacaagctga 1080
tggacaggct gcgcctgccc acgagcttga ccacagggat tgcccaccgg ctacccagcc 1140
ttcgaccaca tacccaccgg ctccaactgc gcggcctgcg gccttgcccc atcaattttt 1200
ttaattttct ctggggaaaa gcctccggcc tgcggcctgc gcgcttcgct tgccggttgg 1260
acaccaagtg gaaggcgggt caaggctcgc gcagcgaccg cgcagcggct tggccttgac 1320
gcgcctggaa cgacccaagc ctatgcgagt gggggcagtc gaaggcgaag cccgcccgcc 1380
tgccccccga gacctgcaga tccacatcct tgaaggccgc agcgacgagc agaaggaaac 1440
cctcattcgg gaagtcagcg aggccatctc gcgctccctg gatgcgccgc tgaccagcgt 1500
gcgagtgatt atcacggaga tggccaaggg ccacttcggc atcggcggcg aactggccag 1560
caaggtcaga cgctgaagtg gagatgccca agggcacttc gggtcgagga acccgacctg 1620
cattgggacg cggccacgga gagcgcgggc aaacgccggc actatagcca gtggagtttg 1680
taaaacgcta tttcagagct tggagagtgt ctaagaaagc cggggcgatg ccaacccatc 1740
ccttcttcgg ctatgcatcg ttcgtaatca agccacttcc tttttgcatt gacgcagggt 1800
gtcggaaggc aactcgccga acgcgctcct atagttttca gcgaagcgtc ccaaatgtaa 1860
gaagccgtag tctagggcta tctcagttat actacgcaca ttggcactgg gatcgttcaa 1920
gcaggcgcgg atgctttcga gcttgcggtt gcggatgtag ttcttcggcg tggtgccggc 1980
atgcttctcg aacaaattgt agagcgagcg tggactcatc atcgccagct ccgctaaccg 2040
ctcaaggctg atattccgtt tgagattctc ctcaatgaat tgaacgactc gctcgaaaga 2100
cgggttacct ttgctgaaaa tttcacggct gacattgctg cccagcattt cgagcagctt 2160
ggaagcgatg atccccgcat agtgctcttg gacccgaggc atcgactttg tatgttccgc 2220
ttcgtcacaa actaacccga gtagattgat aaagccatcg agttgctgga gattgtgtcg 2280
cgcggcgaaa cggataccct ccctcggctt gtgccaattg ttgtcactgc atgcccgatc 2340
aaggaccact gagggcaatt taacgataaa tttctcgcaa tcttctgaat aggtcaggtc 2400
ggcttggtca tccggattga gcagcaatag ttcgcccggc gcaaaatagt gctcctggcc 2460
atggccacgc cacaggcaat ggcctttgag tattatttgc agatgataac aggtctctaa 2520
tccaggcgag attaccctca cgctaccgcc gtagctgatt cgacacaggt cgaggcatcc 2580
gaagattctg tggtgcagcc tgcctgccgg gcgcccgccc ttgggcaggc gaatagagtg 2640
cgtaccgaca tactggttaa cataatcgga gactgcatag ggctcggcgt ggacgaagat 2700
ctgacttttc tcgttcaata agcaaaaatc catagttcac ggttctctta ttttaatgtg 2760
ggctgcttgg tgtgatgtag aaaggcgcca agtcgatgaa aatgcatctc gacgtgatgc 2820
gtatacgggt tacccccatt gccacgttgc gccatccttt ttgcaatcag tgaccacttt 2880
tccaagcaaa aataacgcca agcagaacga agacgttctt tttaagaagc gagaacacca 2940
gaagttcgtg ctgtcggggc atgcggcgac gaattggcgg ataaagggga tctgcaggtc 3000
ccgagcctca cggcggcgag tgcgggggtt ccaagggggc agcgccacct tgggcaaggc 3060
cgaaggccgc gcagtcgatc aacaagcccc ggaggggcca ctttttgccg gagggggagc 3120
cgcgccgaag gcgtggggga accccgcagg ggtgcccttc tttgggcacc aaagaactag 3180
atatagggcg aaatgcgaaa gacttaaaaa tcaacaactt aaaaaagggg ggtacgcaac 3240
agctcattgc ggcacccccc gcaatagctc attgcgtagg ttaaagaaaa tctgtaattg 3300
actgccactt ttacgcaacg cataattgtt gtcgcgctgc cgaaaagttg cagctgattg 3360
cgcatggtgc cgcaaccgtg cggcacccta ccgcatggag ataagcatgg ccacgcagtc 3420
cagagaaatc ggcattcaag ccaagaacaa gcccggtcac tgggtgcaaa cggaacgcaa 3480
agcgcatgag gcgtgggccg ggcttattgc gaggaaaccc acggcggcaa tgctgctgca 3540
tcacctcgtg gcgcagatgg gccaccagaa cgccgtggtg gtcagccaga agacactttc 3600
caagctcatc ggacgttctt tgcggacggt ccaatacgca gtcaaggact tggtggccga 3660
gcgctggatc tccgtcgtga agctcaacgg ccccggcacc gtgtcggcct acgtggtcaa 3720
tgaccgcgtg gcgtggggcc agccccgcga ccagttgcgc ctgtcggtgt tcagtgccgc 3780
cgtggtggtt gatcacgacg accaggacga atcgctgttg gggcatggcg acctgcgccg 3840
catcccgacc ctgtatccgg gcgagcagca actaccgacc ggccccggcg aggagccgcc 3900
cagccagccc ggcattccgg gcatggaacc agacctgcca gccttgaccg aaacggagga 3960
atgggaacgg cgcgggcagc agcgcctgcc gatgcccgat gagccgtgtt ttctggacga 4020
tggcgagccg ttggagccgc cgacacgggt cacgctgccg cgccggtagc acttgggttg 4080
cgcagcaacc cgtaagtgcg ctgttccaga ctatcggctg tagccgcctc gccgccctat 4140
accttgtctg cctccccgcg ttgcgtcgcg gtgcatggag ccgggccacc tcgacctgaa 4200
tggaagccgg cggcacctcg ctaacggatt caccgttttt atcaggctct gggaggcaga 4260
ataaatgatc atatcgtcaa ttattacctc cacggggaga gcctgagcaa actggcctca 4320
ggcatttgag aagcacacgg tcacactgct tccggtagtc aataaaccgg taaaccagca 4380
atagacataa gcggctattt aacgaccctg ccctgaaccg acgaccgggt cgaatttgct 4440
ttcgactatc ggcgcgccag agctcatcgt taatgtcttc gtgcgccgtc agtcggcgca 4500
cgttttttct ctctggtacc gtgtcactga tctagtcaat tactcgaagt atccacaagt 4560
gaagcatact aagtaatgta caagaatcaa aaaaatcggc tacgcaagtc gcgtagccga 4620
atcatttaag gatccttcca ttcaggtcga ggtggcccgg ctccatgcac cgcgacgcaa 4680
cgcggggagg cagacaaggt atagggcggc gcctacaatc catgccaacc cgttccatgt 4740
gctcgccgag gcggcataaa tcgccgtgac gatcagcggt ccagtgatcg aagttaggct 4800
ggtaagagcc gcgagcgatc cttgaagctg tccctgatgg tcgtcatcta cctgcctgga 4860
cagcatggcc tgcaacgcgg gcatcccgat gccgccggaa gcgagaagaa tcataatggg 4920
gaaggccatc cagcctcgcg tcgcgaacgc cagcaagacg tagcccagcg cgtcggccgc 4980
catgccggcg ataatggcct gcttctcgcc gaaacgtttg gtggcgggac cagtgacgaa 5040
ggcttgagcg agggcgtgca agattccgaa taccgcaagc gacaggccga tcatcgtcgc 5100
gctccagcga aagcggtcct cgccgaaaat gacccagagc gctgccggca cctgtcctac 5160
gagttgcatg ataaagaaga cagtcataag tgcggcgacg atagtcatgc cccgcgccca 5220
ccggaaggag ctgactgggt tgaaggctct caagggcatc ggtcgacgct ctcccttatg 5280
cgactcctgc attaggaagc agcccagtag taggttgagg ccgttgagca ccgccgccgc 5340
aaggaatggt gcatgcaagg agatggcgcc caacagtccc ccggccacgg ggcctgccac 5400
catacccacg ccgaaacaag cgctcatgag cccgaagtgg cgagcccgat cttccccatc 5460
ggtgatgtcg gcgatatagg cgccagcaac cgcacctgtg gcgccggtga tgccggccac 5520
gatgcgtccg gcgtacaaga tccacaggac gggtgtggtc gccatgatcg cgtagtcgat 5580
agtggctcca agtagcgaag cgagcaggac tgggcggcgg ccaaagcggt cggacagtgc 5640
tccgagaacg ggtgcgcata gaaattgcat caacgcatat agcgctagca gcacgccata 5700
gtgactggcg atgctgtcgg aatggacgat atcccgcaag aggcccggca gtaccggcat 5760
aaccaagcct atgcctacag catccagggt gacggtgccg aggatgacga tgagcgcatt 5820
gttagatttc atacacggtg cctgactgcg ttagcaattt aactgtgata aactaccgca 5880
ttaaagccga gcgatgataa gctgtcaaac atgagatccg ataaatcgat tgatagattt 5940
aaataagaac tgcagaagct agcttagatg ctcgtgaaat tgacgtgggc gctttgcagg 6000
gccgtcttaa tggcgttggt gtccacgagg atcgagtcgg gtgcggaaaa cggacggttc 6060
ttgttggtga aatcgctgtt accaatgtac agcgattcct tgttacgcag cgcctggatg 6120
tgccagcggg accacgaatc ccaatacttc tggcgatccg gcgagatacc ttggctggtg 6180
tagccggtcg tcgggctgtt catcaacgag tcggtgcggt gcgagcccag cgtcagcggc 6240
aacttgatcc gatgcaccgt ggaatcgccg aagatcagct tcagacgcgc gataaattcg 6300
ctatccgcac ccgttttcac acaatcccag acaccggcct tctgcaagac gtcggcacgg 6360
cgaaacagga gcgacgacgg attcagacgc ttcaaggggt acactgcgcg ggcatagaaa 6420
ataccgttgt cttgcaggcg cacccagtcc gagatggagc agatgagctt cggattgagc 6480
aacaaggggg agatttggcg gaacagcttt tccggatggc tccagtcatc cgaatcgtgg 6540
caggtgacga actcgccctt cgcttggatc aagccgatac gcttcgcggc ataggtgccg 6600
acattctgcg gcaggctaat gatcttgatg cgcgtgtctt tgagggcgag ccgctggaga 6660
cgaaacaggg tgtcatcggt gctcgcgtca tccacaatga tcagctcgaa ggaacggtag 6720
gtctgattga ggagcgaaat caccgcattt tccacgcggc gacccgtatt ataggtggtc 6780
atcaggatgg agatcaacgg ccccgtctgg gccgggtacg ggatgctggt gatgatgttg 6840
cacggggaga gcggggagct gttgtccgtc aaggccacgg ggctgaggcc gaagtattta 6900
tagtattcat tcagccgatt caggctaatt tcggcggttt cgcggaaggc gttattttgc 6960
agcagcagga tatccgggct atagacgata tcggatgcgt cgatctgggc gagggtcgag 7020
atggcctttt gggtcaggcc gatccggagt tgcagtgcgg tatacaggtc cagcgggcag 7080
ttgtccacgt tgtccaacag gctcaggcta aaggtcggcg agtaggacgc cagggttttc 7140
gccagttcca ctttctgatg ggtatcggtg aactcgtcct tgaactccat cagcagctcg 7200
ggcgtcaggc tgatgtcgcc gcaggcgatt tttgcgatct tgattgccag tttgcagcgc 7260
caatcggacg gggtatccgt caagttatgc agcgaccagt acatattcag acgatacatc 7320
gcgaggatgc gtttcgactg ccagaaccgg caatcatcct ggatggccgc gagcgcgtgg 7380
acgtagcggc tctttttgag cagccacaag aatttgagat tattgaacat ttattaacct 7440
cctgctagca acttaagtta cgaatcgacg ccgaacaggt cgcgggtgta gactttctcc 7500
gagacatctt ccagttcgct ggtgcggcga ttcgccacaa tgacatcgac gcgctcctta 7560
aaggaattga tgtcgcgctc gacgtaggaa ccgaagaagt agggttcttt caggaccggc 7620
tcgtacacca caatctcgat acccttggcc ttcaaacgtt tcatgacccc ctggatgctg 7680
ctggcccgga aattgtcgct acccgccttc atgatcaggc gatagatacc gaccactttg 7740
ggcttacggg acaggatgtc ctcggccacg aagtccttac gggtcgtatt cgcatccacg 7800
atggcctgga tcaggttttg cgggacgtcg cgataattgg ccaacagctg cttcgtatcc 7860
ttcggcagac agtaaccgcc gtagccgaag gacgggttgt tgtaatgttg accaatgcgc 7920
ggatcgaggg agacgccttc gatgatttgt ttggtatcca ggccgtgcac gctcgcgtag 7980
gtgtccagct cgttaaagta cgcgatacgc atcgccagat acgtgttcgc gaacagtttg 8040
atggcttctg cctcgggcga atccgtcagc aggatcggaa tatccttttt gatggcacct 8100
tccgacagga gttcggcgaa cttccgtgcg cgttccgacg attcgcccac gacaatgcgg 8160
ctcggataga gattatcata cagggctttg ccttcgcgca ggaactccgg ggaaaagatg 8220
atattattcg tgttcagatc gcgcttcagg cgttcggtga acccgacggg gacggtggat 8280
ttgataatga tggtcgcgtt cgggttaatg gacagcacgt cacacgcgac gctttcgacg 8340
ctcagggtat caaagttgtt attaatcgga tcatagttcg tcggggtggc gatgatcacg 8400
tagtctgcat cgcgatatgc ctcgtatttt tccgtcgtcg cgtagaggtt cagcttacga 8460
ttggagagaa acttctggat ttccgggtcg caaatcggcg agattttctt gttaatgagc 8520
tggaccttct tcgggtcgat gtccagggcg atgatgtcgt gtttttggga gaggaggatc 8580
gcaatgctga tacccacata gccgacgccg gccacggcaa ttttcattta ttaacctcct 8640
taagtgaatt caaactagtt tacaagtcgt tttcgatctt ctcccaggta tatttgcgac 8700
attcattcaa gttggtcagc ggcgagtatt tgtacttttt gataccgagg cgcgacaggc 8760
tttcgttcac caccttgaaa tggttttcct tttggatgtc cagtttcttg atcgacgtgt 8820
tctcgccgtg caggacacgg ttgtagcaaa tcttattgat atgcttaaac gggccgactt 8880
cgctgagttt caaatacata tcgtaatcca ccgcattgct gatgctctcg ttgaagcctt 8940
cggtgaggtt ccatgcacgc gccgtgaaca tacggaagtg gtggcagatc atcgcgctcg 9000
tgagcttttc gcggctgtaa atcggccagt tgtagccatt gctaatcaag ttaccttcac 9060
gatcaatatt gcgattggtg gtgtacacgc aggcgaggct caggtctttg cgaaattcat 9120
ccagacacag ttccacggca tcgggctcca ggaaatcatc ggaatccagc tgcccgatgt 9180
agaaaccccg gcacaggcgg actgcggtat tcgaggcgga gccgatgcct ttgtttttct 9240
ggctgatgaa acggacgcgc gggtggtttg cgtaatgttc ttgcaggatg cgcagcgtat 9300
catcggtgct cccgtcatcg cagatgcaga cctccagatc ggtgatcgtt tggttcagtg 9360
ccgattcgac gcagcgcacg atatatttgc tgcaattata cgcggggatg tagatgctca 9420
ccaggggcac acgtttcagg gtggcgctct cgattttctc cttcttgcga taaaagtagg 9480
gcaccttctg ctgcaacagc tggacggtaa tgtttttacc tgccgcgcga tcggtttcgt 9540
tctccttacc gggcggttcc tgatgatatg ccatcgcgcc ttccacgcta cggaaataac 9600
aaccctcgcg gtacagccga tagccgaact cattatcctc accgccccaa tgcgtgaact 9660
cttcgtcaaa ccaacccgcg cgaaacagcc acttctttgc aaacgccaca ttgccaccgc 9720
taaagaaccg gaacggggtg ttgcacaggc gcagattgtc ggtattcttg aaatgttcga 9780
tgcgccaatc gacggatttg ttctgctcga ccttgcctgc gacctgatta ttggtaataa 9840
tctccgggat ttcattgatc aggcttttct gggacaaaaa gtccagatag gtatgcttcg 9900
acgtgtcgat gtatttacgc gggccaatca gtgccacgtt atcatccacg gccaggagtt 9960
ccatatagga ctgcacccac aacgggttcg gcgccatatc gcagtccaag atcgccacgt 10020
agttgtattt cgctgcccgc aggcccaggt tccgcacggc gcacagctgg tagccgtagt 10080
ctttctggcg gacgtatttg atgttcagca acgactcgaa ctcgcggacg atctcttcga 10140
tgttttcctt ggaaccgtca tccgcgacga tgacctcata gtcataaatc gttttctgat 10200
tgcagaggca ggccagggtg atcgccagga ttttggcgcg attgtacgtc ggaatcacga 10260
tggacaggcc gtcgatgatc agttgcttgc gcggataatc atccagttct ttacgtttcc 10320
ctgcccagac gtagtcgttc gtgctttccg gcagcggcgg caaggtcagg tcgctcggcc 10380
aatccagcgg aatgggttcg acttctttca attcggcgcg ctcggatttc tttgcggtaa 10440
tttcccgata tttgctaatg atttcattct tttccacctc attcagcgag atcgcctttg 10500
cattgctgca cataattttg gttgccgcgt cgatatcaat gaccgctttc cgattcagct 10560
tgtccacttc ttcgctcaga ttcagggcgg tttggcacag cttgatattg gcttccaccc 10620
agctcacatc atagatttcc gccacttttt caaacaggga gagggcttgg cggtagttct 10680
tattcttata cagattgatt gcctggttca aaatgctcat ttattaacct cctactagtg 10740
aattttcgaa aatgaacggt ccgttaaata tagccattcg gattcttcat ctgccagcgc 10800
caggcgtcct ccagcatggt ttcgagttcc cgcttggctt tccagttcag atatttgttg 10860
gccttttcgg gggaggacca gctctccgcg atatcaccgt cacggcggct cacgatttca 10920
tacggaatcc gcacgccgga aatcttttca aaggtggaca ccagttccag caccgaataa 10980
cctttacccg tgcccaaatt aaagacgtgg tagttggtgt tattgtcgcg gaagagatag 11040
gacagcgctg cgacgtgccc ttcggccagg tccatcacat ggatatagtc acggaccccc 11100
gtgccgtctt tggtgggata atcaccaccg aacaccatca gtttttccag tttccccatc 11160
gcgacctgca agatgtacgg caccaagttg gaggggatgt ctgccgggct ttcaccaatc 11220
ataccggatt cgtgggcgcc cgtcggatta aagtagcgca agcagaggaa attcgtgtcg 11280
gagtatttct tggcgatgtc gcggatcatc agctccgaga tgtacttgga cgtaccatac 11340
ggattcagcg tgccaccaat atggcagtct tcggtgacgg gcatgatctt gctttcccca 11400
tacaccgtcg ccgacgagct aaagatgaag ttggcgacgt cgttcttgat ggcgcaattg 11460
atgagttgca gggtgccgct cacgttgttg tcatagtaga agatgggctt gatcaggctt 11520
tctgcgaccg atttcgcacc tgcaaagtgc atgatgcagt cgaatttgtg tttcttcagg 11580
atctggttca cttccttctc gttgttgata ttgagttcgt agaacgtgac tttcttcttt 11640
gcgatcagct caatgcgacg gatgctttcg cagctgctgt tgatgagatt gtcaatgatg 11700
acgacattgt agcctttgtt cagcaggcag agcgacgtgt ggctgccgat gtagcctgca 11760
ccgccggtga ccaggatgtt catttattaa cctcctcggt ccgaattaac ctaggttatg 11820
aggtcagcat tgcttcttca cgcggtgtta attaagtaat cgatagtgat ttaaatatgc 11880
aagatctagt tacctgcagg attattgttt ctgttgcata aagcctaagg ggtaggcctt 11940
tctagagata gccatttttt gcactcctgt atccgcttct tgcaaggctg gacttatccc 12000
tatcaaaccg gacactgcag gctgacaagc tttcattaca tatgaagagt ttgtagaaac 12060
gcaaaaaggc catccgtcag gatggccttc taagaaggct cgagtggcgc gcctaagtcg 12120
aatttctgcc attcatccgc ttattatcac ttattcaggc gtagcaacca ggcgtttaag 12180
ggcaccaata actgccttaa aaaaattacg ccccgccctg ccactcatcg cagtactgtt 12240
gtaattcatt aagcattctg ccgacatgga agccatcaca aacggcatga tgaacctgaa 12300
tcgccagcgg catcagcacc ttgtcgcctt gcgtataata tttgcccatg gtgaaaacgg 12360
gggcgaagaa gttgtccata ttggccacgt ttaaatcaaa actggtgaaa ctcacccagg 12420
gattggctga gacgaaaaac atattctcaa taaacccttt agggaaatag gccaggtttt 12480
caccgtaaca cgccacatct tgcgaatata tgtgtagaaa ctgccggaaa tcgtcgtggt 12540
attcactcca gagcgatgaa aacgtttcag tttgctcatg gaaaacggtg taacaagggt 12600
gaacactatc ccatatcacc agctcaccgt ctttcattgc catacggaat tccggatgag 12660
cattcatcag gcgggcaaga atgtgaataa aggccggata aaacttgtgc ttatttttct 12720
ttacggtctt taaaaaggcc gtaatatcca gctgaacggt ctggttatag gtacattgag 12780
caactgactg aaatgcctca aaatgttctt tacgatgcca ttgggatata tcaacggtgg 12840
tatatccagt gatttttttc tccattttag cttccttagc tcctgaaaat ctcgataact 12900
caaaaaatac gcccggtagt gatcttattt cattatggtg aaagttggaa cctcttacgt 12960
gccgatcaac gtctcatttt cgccaaaagt tggcccaggg cttcccggta tcaacaggga 13020
caccaggatt tatttattct gcgaagtgat cttccgtcac aggtatttat tcggcgcaaa 13080
gggcctcgtg atacgcctat ttttataggt taatgtcatg ataataatgg tttcttagac 13140
gtcaggtggc acttttcggg gaaatgtgcg cgcccgcgtt cctgctggcg ctgggcctgt 13200
ttctggcgct ggacttcccg ctgttccgtc agcagctttt cgcccacggc cttgatgatc 13260
gcggcggcct tggcctgcat atcccgattc aacggcccca gggcgtccag aacgggcttc 13320
aggcgctccc gaaggt 13336
<210> 44
<211> 22388
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Sequence
<400> 44
ctcgggccgt ctcttgggct tgatcggcct tcttgcgcat ctcacgcgct cctgcggcgg 60
cctgtagggc aggctcatac ccctgccgaa ccgcttttgt cagccggtcg gccacggctt 120
ccggcgtctc aacgcgcttt gagattccca gcttttcggc caatccctgc ggtgcatagg 180
cgcgtggctc gaccgcttgc gggctgatgg tgacgtggcc cactggtggc cgctccaggg 240
cctcgtagaa cgcctgaatg cgcgtgtgac gtgccttgct gccctcgatg ccccgttgca 300
gccctagatc ggccacagcg gccgcaaacg tggtctggtc gcgggtcatc tgcgctttgt 360
tgccgatgaa ctccttggcc gacagcctgc cgtcctgcgt cagcggcacc acgaacgcgg 420
tcatgtgcgg gctggtttcg tcacggtgga tgctggccgt cacgatgcga tccgccccgt 480
acttgtccgc cagccacttg tgcgccttct cgaagaacgc cgcctgctgt tcttggctgg 540
ccgacttcca ccattccggg ctggccgtca tgacgtactc gaccgccaac acagcgtcct 600
tgcgccgctt ctctggcagc aactcgcgca gtcggcccat cgcttcatcg gtgctgctgg 660
ccgcccagtg ctcgttctct ggcgtcctgc tggcgtcagc gttgggcgtc tcgcgctcgc 720
ggtaggcgtg cttgagactg gccgccacgt tgcccatttt cgccagcttc ttgcatcgca 780
tgatcgcgta tgccgccatg cctgcccctc ccttttggtg tccaaccggc tcgacggggg 840
cagcgcaagg cggtgcctcc ggcgggccac tcaatgcttg agtatactca ctagactttg 900
cttcgcaaag tcgtgaccgc ctacggcggc tgcggcgccc tacgggcttg ctctccgggc 960
ttcgccctgc gcggtcgctg cgctcccttg ccagcccgtg gatatgtgga cgatggccgc 1020
gagcggccac cggctggctc gcttcgctcg gcccgtggac aaccctgctg gacaagctga 1080
tggacaggct gcgcctgccc acgagcttga ccacagggat tgcccaccgg ctacccagcc 1140
ttcgaccaca tacccaccgg ctccaactgc gcggcctgcg gccttgcccc atcaattttt 1200
ttaattttct ctggggaaaa gcctccggcc tgcggcctgc gcgcttcgct tgccggttgg 1260
acaccaagtg gaaggcgggt caaggctcgc gcagcgaccg cgcagcggct tggccttgac 1320
gcgcctggaa cgacccaagc ctatgcgagt gggggcagtc gaaggcgaag cccgcccgcc 1380
tgccccccga gacctgcaga tccacatcct tgaaggccgc agcgacgagc agaaggaaac 1440
cctcattcgg gaagtcagcg aggccatctc gcgctccctg gatgcgccgc tgaccagcgt 1500
gcgagtgatt atcacggaga tggccaaggg ccacttcggc atcggcggcg aactggccag 1560
caaggtcaga cgctgaagtg gagatgccca agggcacttc gggtcgagga acccgacctg 1620
cattgggacg cggccacgga gagcgcgggc aaacgccggc actatagcca gtggagtttg 1680
taaaacgcta tttcagagct tggagagtgt ctaagaaagc cggggcgatg ccaacccatc 1740
ccttcttcgg ctatgcatcg ttcgtaatca agccacttcc tttttgcatt gacgcagggt 1800
gtcggaaggc aactcgccga acgcgctcct atagttttca gcgaagcgtc ccaaatgtaa 1860
gaagccgtag tctagggcta tctcagttat actacgcaca ttggcactgg gatcgttcaa 1920
gcaggcgcgg atgctttcga gcttgcggtt gcggatgtag ttcttcggcg tggtgccggc 1980
atgcttctcg aacaaattgt agagcgagcg tggactcatc atcgccagct ccgctaaccg 2040
ctcaaggctg atattccgtt tgagattctc ctcaatgaat tgaacgactc gctcgaaaga 2100
cgggttacct ttgctgaaaa tttcacggct gacattgctg cccagcattt cgagcagctt 2160
ggaagcgatg atccccgcat agtgctcttg gacccgaggc atcgactttg tatgttccgc 2220
ttcgtcacaa actaacccga gtagattgat aaagccatcg agttgctgga gattgtgtcg 2280
cgcggcgaaa cggataccct ccctcggctt gtgccaattg ttgtcactgc atgcccgatc 2340
aaggaccact gagggcaatt taacgataaa tttctcgcaa tcttctgaat aggtcaggtc 2400
ggcttggtca tccggattga gcagcaatag ttcgcccggc gcaaaatagt gctcctggcc 2460
atggccacgc cacaggcaat ggcctttgag tattatttgc agatgataac aggtctctaa 2520
tccaggcgag attaccctca cgctaccgcc gtagctgatt cgacacaggt cgaggcatcc 2580
gaagattctg tggtgcagcc tgcctgccgg gcgcccgccc ttgggcaggc gaatagagtg 2640
cgtaccgaca tactggttaa cataatcgga gactgcatag ggctcggcgt ggacgaagat 2700
ctgacttttc tcgttcaata agcaaaaatc catagttcac ggttctctta ttttaatgtg 2760
ggctgcttgg tgtgatgtag aaaggcgcca agtcgatgaa aatgcatctc gacgtgatgc 2820
gtatacgggt tacccccatt gccacgttgc gccatccttt ttgcaatcag tgaccacttt 2880
tccaagcaaa aataacgcca agcagaacga agacgttctt tttaagaagc gagaacacca 2940
gaagttcgtg ctgtcggggc atgcggcgac gaattggcgg ataaagggga tctgcaggtc 3000
ccgagcctca cggcggcgag tgcgggggtt ccaagggggc agcgccacct tgggcaaggc 3060
cgaaggccgc gcagtcgatc aacaagcccc ggaggggcca ctttttgccg gagggggagc 3120
cgcgccgaag gcgtggggga accccgcagg ggtgcccttc tttgggcacc aaagaactag 3180
atatagggcg aaatgcgaaa gacttaaaaa tcaacaactt aaaaaagggg ggtacgcaac 3240
agctcattgc ggcacccccc gcaatagctc attgcgtagg ttaaagaaaa tctgtaattg 3300
actgccactt ttacgcaacg cataattgtt gtcgcgctgc cgaaaagttg cagctgattg 3360
cgcatggtgc cgcaaccgtg cggcacccta ccgcatggag ataagcatgg ccacgcagtc 3420
cagagaaatc ggcattcaag ccaagaacaa gcccggtcac tgggtgcaaa cggaacgcaa 3480
agcgcatgag gcgtgggccg ggcttattgc gaggaaaccc acggcggcaa tgctgctgca 3540
tcacctcgtg gcgcagatgg gccaccagaa cgccgtggtg gtcagccaga agacactttc 3600
caagctcatc ggacgttctt tgcggacggt ccaatacgca gtcaaggact tggtggccga 3660
gcgctggatc tccgtcgtga agctcaacgg ccccggcacc gtgtcggcct acgtggtcaa 3720
tgaccgcgtg gcgtggggcc agccccgcga ccagttgcgc ctgtcggtgt tcagtgccgc 3780
cgtggtggtt gatcacgacg accaggacga atcgctgttg gggcatggcg acctgcgccg 3840
catcccgacc ctgtatccgg gcgagcagca actaccgacc ggccccggcg aggagccgcc 3900
cagccagccc ggcattccgg gcatggaacc agacctgcca gccttgaccg aaacggagga 3960
atgggaacgg cgcgggcagc agcgcctgcc gatgcccgat gagccgtgtt ttctggacga 4020
tggcgagccg ttggagccgc cgacacgggt cacgctgccg cgccggtagc acttgggttg 4080
cgcagcaacc cgtaagtgcg ctgttccaga ctatcggctg tagccgcctc gccgccctat 4140
accttgtctg cctccccgcg ttgcgtcgcg gtgcatggag ccgggccacc tcgacctgaa 4200
tggaagccgg cggcacctcg ctaacggatt caccgttttt atcaggctct gggaggcaga 4260
ataaatgatc atatcgtcaa ttattacctc cacggggaga gcctgagcaa actggcctca 4320
ggcatttgag aagcacacgg tcacactgct tccggtagtc aataaaccgg taaaccagca 4380
atagacataa gcggctattt aacgaccctg ccctgaaccg acgaccgggt cgaatttgct 4440
ttcgactatc ggcgcgccag agctcatcgt taatgtcttc gtgcgccgtc agtcggcgca 4500
cgttttttct ctctggtacc gtgtcactga tctagtcaat tactcgaagt atccacaagt 4560
gaagcatact aagtaatgta caagaatcaa aaaaatcggc tacgcaagtc gcgtagccga 4620
atcatttaag gatccttcca ttcaggtcga ggtggcccgg ctccatgcac cgcgacgcaa 4680
cgcggggagg cagacaaggt atagggcggc gcctacaatc catgccaacc cgttccatgt 4740
gctcgccgag gcggcataaa tcgccgtgac gatcagcggt ccagtgatcg aagttaggct 4800
ggtaagagcc gcgagcgatc cttgaagctg tccctgatgg tcgtcatcta cctgcctgga 4860
cagcatggcc tgcaacgcgg gcatcccgat gccgccggaa gcgagaagaa tcataatggg 4920
gaaggccatc cagcctcgcg tcgcgaacgc cagcaagacg tagcccagcg cgtcggccgc 4980
catgccggcg ataatggcct gcttctcgcc gaaacgtttg gtggcgggac cagtgacgaa 5040
ggcttgagcg agggcgtgca agattccgaa taccgcaagc gacaggccga tcatcgtcgc 5100
gctccagcga aagcggtcct cgccgaaaat gacccagagc gctgccggca cctgtcctac 5160
gagttgcatg ataaagaaga cagtcataag tgcggcgacg atagtcatgc cccgcgccca 5220
ccggaaggag ctgactgggt tgaaggctct caagggcatc ggtcgacgct ctcccttatg 5280
cgactcctgc attaggaagc agcccagtag taggttgagg ccgttgagca ccgccgccgc 5340
aaggaatggt gcatgcaagg agatggcgcc caacagtccc ccggccacgg ggcctgccac 5400
catacccacg ccgaaacaag cgctcatgag cccgaagtgg cgagcccgat cttccccatc 5460
ggtgatgtcg gcgatatagg cgccagcaac cgcacctgtg gcgccggtga tgccggccac 5520
gatgcgtccg gcgtacaaga tccacaggac gggtgtggtc gccatgatcg cgtagtcgat 5580
agtggctcca agtagcgaag cgagcaggac tgggcggcgg ccaaagcggt cggacagtgc 5640
tccgagaacg ggtgcgcata gaaattgcat caacgcatat agcgctagca gcacgccata 5700
gtgactggcg atgctgtcgg aatggacgat atcccgcaag aggcccggca gtaccggcat 5760
aaccaagcct atgcctacag catccagggt gacggtgccg aggatgacga tgagcgcatt 5820
gttagatttc atacacggtg cctgactgcg ttagcaattt aactgtgata aactaccgca 5880
ttaaagccga gcgatgataa gctgtcaaac atgagatcca atctagattg tttaaacttc 5940
tgcagaacac gcggtgttaa cgtttcttat acttcttaat tttgttaaag atcatttcgc 6000
cgtagtacac cgcattgacc tgggtcttca ccagcaagta gccgcgaaat ttcttaaaca 6060
acttcatgtt cggtttaaag tcggcttgcc agaactgatg caaatgcccc tggtacgtca 6120
gacccttgat atcgtacaag gcgttgccca tgactttcag gggcttgttg tggatcaacg 6180
cggaaatgcc ggccgtgcta ttgatggtga ccaccgcttt ggcgtggcgc aacagctccg 6240
gcatgggcag atcgtgcaca tagatgacac gttcatccaa accgtattcc ttcgacagac 6300
gcttgatcaa cgggcggtac aggcggtgcc cgcgatccat cgggtgatgt ttgatcacca 6360
gataggactc cttgggggcc ttgcgggaaa agctgtacat cacttcgttg atgtaatcac 6420
gcacatcatt atagttgcta tggttgcgga tctggctgtc gttgtacact tgcaggaccg 6480
ccaggtaata gcgctgatcc agctcgttca tcaggcgggg gaggaccttg cgttgggtga 6540
ccttatacag ctgtttgcgc cagtaggcgc ggacccagca gcgcgcttca taccacgggc 6600
tgaacgattt gtggtggcga tagcgcggaa attcgtgacg atagtgccaa cccatcaggt 6660
aataccacat ggcgtggccg atgcgcttca tggtgctcgg tttcaggttc tcgacgtgcg 6720
gcgtcggcat atcgggcaat ttgcggtaaa agtccggatc gcggggcaag ctgctatagg 6780
cgttcacacc gccttcttcc acggtgataa attgcggacg caggtagcct tcctcgaagg 6840
ccagaaaacg aatccccttc gacttggccc agcgtttggc ctccttgtgc agcaggcggc 6900
agtcaccgaa acacaaaatc gtgtcaaagt catactgacg atgcaagtcc cgcagccaac 6960
cggggaactc cttcggggtt tggtagtacg ccaggtattg gcggtggcgg cagtagaagc 7020
gatcaccgcc attaaagacg acgttgaccg cgttgcgacc gaggctctcc aaccattccg 7080
ccacatcgtt gaagaacgga cccatcggac cttggagcag gaggtacttt ttaccgctca 7140
acagcaccgt cagcgcattg ccgtgcattt attaacctcc taacacgcgg tgttaagcgt 7200
tttcggcgag ctcctgcgcc atcagggccc ggaccttctc caagcacgcc ggggtatcga 7260
cgccgggacc ggtcgcggcg acctcgaagg tgcgaatgtt aatgcccgcg ctcatcagcc 7320
gcagttgctc cagggattcg gcctgttcgg gcatggactc cggcaactgg ctgtaatttt 7380
gcaggacatc ccgccgatag gcgtagatcc cgacgtgctt caggtagcgc gccttctcgg 7440
cgttgcgcgg gtacggaatg ggggagcggg agaaatacag ggcgtcctgc cgcgtgttca 7500
ccacgacctt gacggtggac ggttcggcgg cttctgccgc gctgatcgca tgacacaggg 7560
tcgccaccgg cagcgccggg tcgtcccgca taccttgcag cagggtttcg acgtcacgcg 7620
ggcgaatcat cggctcatcc ccttgcaggt tgatatagat atccgcctcc accttatgca 7680
tgacttccac caggcgatcg gtgccgctct catgatcgtt gcgggtcatg atcgctttgc 7740
cgccgaacgc ctggactgcc tgctccacac gcgggtcgtc ggttgcgacc cacacctctg 7800
ccacgcctgc cacttgcagg gcccgttcgt agacgtgctg gatcatcggt ttcccgacga 7860
tatccagcag cggtttgccc ggcagacggc tgctgccgta gcgtgccggg atcacaatca 7920
cggccttcga catttattaa cctcctcgag ttacagcgac agaatcactt tcgcgcccac 7980
cgccagttgg tacagaatgg tgctgatacc gcgcgtcact tcgatgttct tcgactcgta 8040
tttcggcaac accataattt catcaccggg tttcagggaa tcgacgtctt ctgcgttcac 8100
cgctgcgccg ttctgacgga tgacgataat acgggcgttg ccggacttct gggtcagccc 8160
accgcacttc tcgatgtagt cctcggtcgt catacctttc tgccacgaca ccgcgttcgg 8220
gaacagcact tccccgtgga ccatgaccaa cgacgtcttt tcgggaatat tgatcacgtc 8280
gccgtcctcc aggaggacgg agtcaatgtt gctttcattg aggatcactt cgcccttcgg 8340
cacgacggtg cgggctttcg cgacgaagcg ggagatcagt tgggcttcct gcatacgcag 8400
gctggcctct tccttggtgc tgctctgtgc gctgaggctg gcctcttcga gcttttgcag 8460
ggacaaattc agcatttctt tctgccgttg cgcgacgctc ggccgataca actgcacggc 8520
gttcatctgc gacatggagt tcgggcgcac tttttcgagc acggcccgca tggtgctacc 8580
gtagggcagc accatggcgt gttccccgga atgtgcgcct tccacacgca cttgaatggt 8640
gcccgcatag cggtcggtgg agacaatgag ggtatcaccg ttttgcagca tacgccccgg 8700
tgcggacgag atcggataat attccgagcg cttctggagg ccctgcttcc gcataatcgt 8760
gatatgggtc gcacccggtt tgggacgtgc ccaggacagt gcttcggtga ccgggatgct 8820
cgattcgcga aattcaaagt cgtaggaatt gaacacatcg ccctgcaccg agaacgtatg 8880
ctggcgcgga cccacaatga tcgtatcacc gtccgcaaac tgggacagcc ccagtttgcc 8940
gttgagcagg aagtcataga ggttgacgtt cgagcgcaca cgattgccgc gtttcacgac 9000
gatgtccacg tagctgccgc gttccgggtc cacaccaccc gccttgatca ggtagttcag 9060
caggctgtcg gaggtgacac cgccgtacag gccggggttg cggacaaagc cggtcacata 9120
gaccttgacc ggctgcgcct gcaagagcga cgcatagacg ttcacgttgc tctggtagac 9180
ttccttcacc ttgctcgtca ccagcgcgtt caactgggag ttcgacacac ctgcgacttt 9240
gacggggccg acattcggca ggaagatgtt gcccttcggg tccacctgga gtgcgccatc 9300
gaaggtgaac gcaccccaca ggcggacctg gatggaatcg ccgggattca ggatgtagtc 9360
cggattgaaa cccacggttg cccccgagtc tgcgctcgta ccgttgaaca gctgcgcccc 9420
gaacatacgg ctcatcacga ccgggggtgc ggggggcggg gtgttatcga agccgctcat 9480
gttctgggtg tcgcttttct gcccgttcag gatgccggtc aacggtgcgg cacccgtgag 9540
gttcggatcg gcattaatgt cgatggttgc gctcgcctgt gctgcatggc acgctgcgat 9600
cagcaggatc gacttaaaca gcttcattta ttaacctcct cgagaagtcg acttagtcac 9660
ggtggtcttc aatcaccgcc aggagcaatt tcagggtgcc aaagagcagg caacacacca 9720
gcagccaaca cgcgatcaaa tacgggatat tcgggaagga gctttcctgg ggcagctgcg 9780
gggacgagat cacgctcagg actttcagct tacgggccgc ttcgacacgg gtcttttcga 9840
tgctggtgag cgtgagcttg tacaactcgg tattgaactc gaccttggat ttgatctcct 9900
caaaatccac ggccatgcgg ttcagtttat cgccctgggg tgcggtaatt ttcgactttt 9960
cttcgtcgat ctgtgcctgg aggctctgaa ttgcattgcg ggcgctcacg acttggggcg 10020
catcctcgcg caggtacgtg agcaggttgc gcaggtcggc ttccatctga attttctggc 10080
ccatcagcgt attcaccagg gtggatgccg cctgggcctg tgcctgcggg tccagcacat 10140
tgttgttgtc ttggtaggac aacaattcgg ctttcgatgc atccagccgc tggcgcgctt 10200
tttccatttc ggtttccgca aacgccaatt gatcgcgggc gatacggtgc gacatttcat 10260
tgatgaaccg ctcggattcc ttgagcacgg tctggttgaa tttcagcgcg aactcgggcg 10320
aaaagccctg ggtctggatg ttcagcagcc cggtcttgtc gtcgtagctg acgttgatgc 10380
gatctttata gtacttcagg aacccctcgg cggtttcatc cttggacaga tggttcagga 10440
agtccaggcc cgaatgggag aacgcttcgc ggaagttcag ctgtttatcc agcgcggcca 10500
gcatatccgg gctgttgatg tattccttca ggtacagtgc gtcttcggcg gacgacgggt 10560
tggaggcacc caacagcagg ccgaagttca ggctgccgga gttgagatcg tcgctgcgct 10620
tgatggccac cttgctttcc gacatatagc ggggctggga gaagatcgcc aagtagatca 10680
gcagcaccgc catgggtgcc agaataatga tttttgccag gtgcttctga atatctgcca 10740
ggctgatcgc gctcagacgc gcacgcatcc acgagacggc gcttttcact ttgatcagca 10800
tttattaacc tcctgtcgac aacacgtgtt aatcgaaaat gcgcaccaac ccggtcacct 10860
tatttgcttt gttggtcacc agcagggtcg agacgcggtg tttctgcatc ttctcttctg 10920
cttcgatgat catggtgtct tcgggcaagg tcagcggttc gcgggtcatc atctgtgcgg 10980
ccgttgcgct cgtcaggctg tcttctttct ccataaagcg ccgcagatcg ccatcggtga 11040
tgatgcctgc cagcccacct tccgcatctt cgaccatcac cataccctgg cagcccgagg 11100
tgatgcgctg aatgaccgtt ttgaagctgg catcgagctg cactgccggc acatcatgtt 11160
gcatcacgtc ggcgacgcgg gtcagcaggc gccgacccag gctgccaccg gggtggtagc 11220
gtgcaaagtc attgggcata aacttacgct ggtgaatcat cgcgatggcc agcgcgtccc 11280
cgatcgccat cgtgagcgtc gtggaggtgg tcggggcgag attgttcggg cacgtttcgt 11340
tcgccatgtg cagctccagg accgcatctg catttttggc cagggtgcta ttcccgttat 11400
tggtgattgc gatgatgcga ttgccgaagt tcttcaggct cggcaccagt ttcaggatct 11460
cgtccgtctc accgctcgcc gaaatcaaga tgagcaggtc atacggggtg atcatgccca 11520
gatcaccatg gaacgcttcc gccggatgaa taaagaagga gggcgtcccg gtcgaggcca 11580
aggtcgccga catcttgcgg cccacatggc cgcttttacc catgccgctc aggatgacgt 11640
gccctttaca attcatgatg agattcagga cgcgctggta ctgaccgcta tccagttgtt 11700
tggacaggtt ttgcagtgcc gcgctttgtt cggccagggt ctggcggacg ctcgtaatca 11760
gatacggatc aatggtcgag gactggtcat ccggcaagtg gcgttcgctc atttattaac 11820
ctcctcacgt gttaattaag taatcgatag tgatttaaat atgcaagatc cgataaatcg 11880
attgatagat ttaaataaga actgcagaag ctagcttaga tgctcgtgaa attgacgtgg 11940
gcgctttgca gggccgtctt aatggcgttg gtgtccacga ggatcgagtc gggtgcggaa 12000
aacggacggt tcttgttggt gaaatcgctg ttaccaatgt acagcgattc cttgttacgc 12060
agcgcctgga tgtgccagcg ggaccacgaa tcccaatact tctggcgatc cggcgagata 12120
ccttggctgg tgtagccggt cgtcgggctg ttcatcaacg agtcggtgcg gtgcgagccc 12180
agcgtcagcg gcaacttgat ccgatgcacc gtggaatcgc cgaagatcag cttcagacgc 12240
gcgataaatt cgctatccgc acccgttttc acacaatccc agacaccggc cttctgcaag 12300
acgtcggcac ggcgaaacag gagcgacgac ggattcagac gcttcaaggg gtacactgcg 12360
cgggcataga aaataccgtt gtcttgcagg cgcacccagt ccgagatgga gcagatgagc 12420
ttcggattga gcaacaaggg ggagatttgg cggaacagct tttccggatg gctccagtca 12480
tccgaatcgt ggcaggtgac gaactcgccc ttcgcttgga tcaagccgat acgcttcgcg 12540
gcataggtgc cgacattctg cggcaggcta atgatcttga tgcgcgtgtc tttgagggcg 12600
agccgctgga gacgaaacag ggtgtcatcg gtgctcgcgt catccacaat gatcagctcg 12660
aaggaacggt aggtctgatt gaggagcgaa atcaccgcat tttccacgcg gcgacccgta 12720
ttataggtgg tcatcaggat ggagatcaac ggccccgtct gggccgggta cgggatgctg 12780
gtgatgatgt tgcacgggga gagcggggag ctgttgtccg tcaaggccac ggggctgagg 12840
ccgaagtatt tatagtattc attcagccga ttcaggctaa tttcggcggt ttcgcggaag 12900
gcgttatttt gcagcagcag gatatccggg ctatagacga tatcggatgc gtcgatctgg 12960
gcgagggtcg agatggcctt ttgggtcagg ccgatccgga gttgcagtgc ggtatacagg 13020
tccagcgggc agttgtccac gttgtccaac aggctcaggc taaaggtcgg cgagtaggac 13080
gccagggttt tcgccagttc cactttctga tgggtatcgg tgaactcgtc cttgaactcc 13140
atcagcagct cgggcgtcag gctgatgtcg ccgcaggcga tttttgcgat cttgattgcc 13200
agtttgcagc gccaatcgga cggggtatcc gtcaagttat gcagcgacca gtacatattc 13260
agacgataca tcgcgaggat gcgtttcgac tgccagaacc ggcaatcatc ctggatggcc 13320
gcgagcgcgt ggacgtagcg gctctttttg agcagccaca agaatttgag attattgaac 13380
atttattaac ctcctgctag caacttaagt tacgaatcga cgccgaacag gtcgcgggtg 13440
tagactttct ccgagacatc ttccagttcg ctggtgcggc gattcgccac aatgacatcg 13500
acgcgctcct taaaggaatt gatgtcgcgc tcgacgtagg aaccgaagaa gtagggttct 13560
ttcaggaccg gctcgtacac cacaatctcg atacccttgg ccttcaaacg tttcatgacc 13620
ccctggatgc tgctggcccg gaaattgtcg ctacccgcct tcatgatcag gcgatagata 13680
ccgaccactt tgggcttacg ggacaggatg tcctcggcca cgaagtcctt acgggtcgta 13740
ttcgcatcca cgatggcctg gatcaggttt tgcgggacgt cgcgataatt ggccaacagc 13800
tgcttcgtat ccttcggcag acagtaaccg ccgtagccga aggacgggtt gttgtaatgt 13860
tgaccaatgc gcggatcgag ggagacgcct tcgatgattt gtttggtatc caggccgtgc 13920
acgctcgcgt aggtgtccag ctcgttaaag tacgcgatac gcatcgccag atacgtgttc 13980
gcgaacagtt tgatggcttc tgcctcgggc gaatccgtca gcaggatcgg aatatccttt 14040
ttgatggcac cttccgacag gagttcggcg aacttccgtg cgcgttccga cgattcgccc 14100
acgacaatgc ggctcggata gagattatca tacagggctt tgccttcgcg caggaactcc 14160
ggggaaaaga tgatattatt cgtgttcaga tcgcgcttca ggcgttcggt gaacccgacg 14220
gggacggtgg atttgataat gatggtcgcg ttcgggttaa tggacagcac gtcacacgcg 14280
acgctttcga cgctcagggt atcaaagttg ttattaatcg gatcatagtt cgtcggggtg 14340
gcgatgatca cgtagtctgc atcgcgatat gcctcgtatt tttccgtcgt cgcgtagagg 14400
ttcagcttac gattggagag aaacttctgg atttccgggt cgcaaatcgg cgagattttc 14460
ttgttaatga gctggacctt cttcgggtcg atgtccaggg cgatgatgtc gtgtttttgg 14520
gagaggagga tcgcaatgct gatacccaca tagccgacgc cggccacggc aattttcatt 14580
tattaacctc cttaagtgaa ttcaaactag tttacaagtc gttttcgatc ttctcccagg 14640
tatatttgcg acattcattc aagttggtca gcggcgagta tttgtacttt ttgataccga 14700
ggcgcgacag gctttcgttc accaccttga aatggttttc cttttggatg tccagtttct 14760
tgatcgacgt gttctcgccg tgcaggacac ggttgtagca aatcttattg atatgcttaa 14820
acgggccgac ttcgctgagt ttcaaataca tatcgtaatc caccgcattg ctgatgctct 14880
cgttgaagcc ttcggtgagg ttccatgcac gcgccgtgaa catacggaag tggtggcaga 14940
tcatcgcgct cgtgagcttt tcgcggctgt aaatcggcca gttgtagcca ttgctaatca 15000
agttaccttc acgatcaata ttgcgattgg tggtgtacac gcaggcgagg ctcaggtctt 15060
tgcgaaattc atccagacac agttccacgg catcgggctc caggaaatca tcggaatcca 15120
gctgcccgat gtagaaaccc cggcacaggc ggactgcggt attcgaggcg gagccgatgc 15180
ctttgttttt ctggctgatg aaacggacgc gcgggtggtt tgcgtaatgt tcttgcagga 15240
tgcgcagcgt atcatcggtg ctcccgtcat cgcagatgca gacctccaga tcggtgatcg 15300
tttggttcag tgccgattcg acgcagcgca cgatatattt gctgcaatta tacgcgggga 15360
tgtagatgct caccaggggc acacgtttca gggtggcgct ctcgattttc tccttcttgc 15420
gataaaagta gggcaccttc tgctgcaaca gctggacggt aatgttttta cctgccgcgc 15480
gatcggtttc gttctcctta ccgggcggtt cctgatgata tgccatcgcg ccttccacgc 15540
tacggaaata acaaccctcg cggtacagcc gatagccgaa ctcattatcc tcaccgcccc 15600
aatgcgtgaa ctcttcgtca aaccaacccg cgcgaaacag ccacttcttt gcaaacgcca 15660
cattgccacc gctaaagaac cggaacgggg tgttgcacag gcgcagattg tcggtattct 15720
tgaaatgttc gatgcgccaa tcgacggatt tgttctgctc gaccttgcct gcgacctgat 15780
tattggtaat aatctccggg atttcattga tcaggctttt ctgggacaaa aagtccagat 15840
aggtatgctt cgacgtgtcg atgtatttac gcgggccaat cagtgccacg ttatcatcca 15900
cggccaggag ttccatatag gactgcaccc acaacgggtt cggcgccata tcgcagtcca 15960
agatcgccac gtagttgtat ttcgctgccc gcaggcccag gttccgcacg gcgcacagct 16020
ggtagccgta gtctttctgg cggacgtatt tgatgttcag caacgactcg aactcgcgga 16080
cgatctcttc gatgttttcc ttggaaccgt catccgcgac gatgacctca tagtcataaa 16140
tcgttttctg attgcagagg caggccaggg tgatcgccag gattttggcg cgattgtacg 16200
tcggaatcac gatggacagg ccgtcgatga tcagttgctt gcgcggataa tcatccagtt 16260
ctttacgttt ccctgcccag acgtagtcgt tcgtgctttc cggcagcggc ggcaaggtca 16320
ggtcgctcgg ccaatccagc ggaatgggtt cgacttcttt caattcggcg cgctcggatt 16380
tctttgcggt aatttcccga tatttgctaa tgatttcatt cttttccacc tcattcagcg 16440
agatcgcctt tgcattgctg cacataattt tggttgccgc gtcgatatca atgaccgctt 16500
tccgattcag cttgtccact tcttcgctca gattcagggc ggtttggcac agcttgatat 16560
tggcttccac ccagctcaca tcatagattt ccgccacttt ttcaaacagg gagagggctt 16620
ggcggtagtt cttattctta tacagattga ttgcctggtt caaaatgctc atttattaac 16680
ctcctactag tgaattttcg aattacttac cgcagtactt gacacccacc tgggaattgt 16740
ttttggtgcg tttgaattgg cggatggtac ggtagatgct aaagggcagg ctgatcagac 16800
cgagcggaaa attgttctta ttgatgatga gcttgcccag ctgatagctc aggtgtttct 16860
tgacccgttc ggcttcgtgt ttatccgcgt acaggaagat gctcggcagg ctcacttggt 16920
actccgaatc atatttcttc ttccaggtcc gccattcgct gatcaacgca aacggaatcg 16980
agatcagacc gaggaacgtc ttggagcggc tcaccatcac cgcacccagg cggtagccga 17040
tatcttgctt gatgcgttcg gccgcaccat acagctccgg cagttgtttc ttttcgagac 17100
gttgattgtc gatgaagtac tgttcgagct tttgctgcac cagatgcagc tgattgagca 17160
gcaattcttt ttcgcacgac agcttttcga ggcgctgttg ttgcagttca tttttgttct 17220
gttccttttt cagcagggac tcgaagttct cgatcgcgca ctccagttcc tggacctgga 17280
tggttttgtt tttaatgatc agatcatact ggatcagttc ttccttgcta tccgacagct 17340
ctttcagaat ggcttgatag gcgttcagct gtttggacgt gtgcagttcg ttgtccagaa 17400
tgatcttttt gctgctctgg tacagaccgt tcacgatatc gagggtgatc tggcgttgtt 17460
taatgaacgt ctcccaaata aaggacggct tatagttttc cttctccagc acccgcaagg 17520
gggtgttggc gttcgattgc aattcaaagt acagttcctt gcaatcggga tagtcgttca 17580
ggacgttgaa gatcaagtac tcctccgtct cgctttgctt gaaaatgata tccccggtcc 17640
cgatgtcaat accgctgagg gacatgatct cctgatgttc tttttccagc gtaatggagg 17700
cttcggcggt cttaaagtca ttcacgctct gctccagcga gtggttgatg gtattggaga 17760
acgacaaccc gaatttcagt ttcagtttgt gttgcagttg ctggatgcag tcctcggcgt 17820
tgcgcttcac ctgttcgctc gacaccagca ggcaccgacc ccggttgttg aggaagaagt 17880
gcagcaaggc ggtgttgtat gccagccagt ttttgatcag atgctccgag gtatagttgc 17940
tggagatgtt ctggtccgag aagtagttcg tcaggatgct tttggggtgg tcgtagatga 18000
ggataaaggt gatgttctca tccaccgatt tccaatattc caacgtgtga attgcgttgg 18060
ggtcgctcca accgcacagt ttctggttca ggttggacag catcagatcc aatgcgatac 18120
cgttccagac ggtgctcaca tggagcggtt caaagtcggc ggaatcggtc accgtataga 18180
tgtccggcga ctggtacgcc ttccgcagcg tctgggtgat gtcctggggc gagaggttct 18240
cacgtttgga cgggcacagg gagttcatgc cgcgctgatg caggagttct tccacgattt 18300
ggtagttgct gctcggatgg cccacgatca ccaggcggtt catttattaa cctcctttcg 18360
aaaatgaacg gtccgttaaa tatagccatt cggattcttc atctgccagc gccaggcgtc 18420
ctccagcatg gtttcgagtt cccgcttggc tttccagttc agatatttgt tggccttttc 18480
gggggaggac cagctctccg cgatatcacc gtcacggcgg ctcacgattt catacggaat 18540
ccgcacgccg gaaatctttt caaaggtgga caccagttcc agcaccgaat aacctttacc 18600
cgtgcccaaa ttaaagacgt ggtagttggt gttattgtcg cggaagagat aggacagcgc 18660
tgcgacgtgc ccttcggcca ggtccatcac atggatatag tcacggaccc ccgtgccgtc 18720
tttggtggga taatcaccac cgaacaccat cagtttttcc agtttcccca tcgcgacctg 18780
caagatgtac ggcaccaagt tggaggggat gtctgccggg ctttcaccaa tcataccgga 18840
ttcgtgggcg cccgtcggat taaagtagcg caagcagagg aaattcgtgt cggagtattt 18900
cttggcgatg tcgcggatca tcagctccga gatgtacttg gacgtaccat acggattcag 18960
cgtgccacca atatggcagt cttcggtgac gggcatgatc ttgctttccc catacaccgt 19020
cgccgacgag ctaaagatga agttggcgac gtcgttcttg atggcgcaat tgatgagttg 19080
cagggtgccg ctcacgttgt tgtcatagta gaagatgggc ttgatcaggc tttctgcgac 19140
cgatttcgca cctgcaaagt gcatgatgca gtcgaatttg tgtttcttca ggatctggtt 19200
cacttccttc tcgttgttga tattgagttc gtagaacgtg actttcttct ttgcgatcag 19260
ctcaatgcga cggatgcttt cgcagctgct gttgatgaga ttgtcaatga tgacgacatt 19320
gtagcctttg ttcagcaggc agagcgacgt gtggctgccg atgtagcctg caccgccggt 19380
gaccaggatg ttcatttatt aacctcctcg gtccgaatta acctaggtta tgaggtcagc 19440
attgcttctt cacgcgttta gtagttgttt tgttcggtga tatattcttc aatgccttct 19500
tgcacgtctt catggaacga cacggcgttg tcgtctttaa acacgattgc cacatcgcag 19560
aactctttca acgagttcag cgagtgcgac accatgagga aggagctttc cttatgacgc 19620
tccttgaaga gttgggcaca tttttccttg aaacgggcgt cccccaccgc cgtcacctcg 19680
tccacgatgt agtaatcgaa cttgaacgcc atgctcaggc cgaagccgag gcggctgcgc 19740
ataccgctcg aataggtctt gatcggcata tcaaaatact tccccagctc cgcgaactct 19800
tccacaaact caatcttttc tttcagctcc tcctgcttcg cgtacagccg ggccacgaac 19860
ttcacgtttt cacgcccggt caagctgccc tggaagccgc ctgccagacc caccggccac 19920
gagatcgttt tattcgtgat gattttaccg ctatccgggc ggtcgatgcc cccaatcatg 19980
cgcaacagcg tggatttacc cgccccattg cgcccgatga acgccacgct tttgccgctg 20040
gggatctcaa tgttcaggtt cttgaagaca tagtgacggc ccaccggggt gcggtagctt 20100
ttcgtcaggt tttcgatctt aatcatgagg tcaacattgc ctcctcacgc gtacggtaca 20160
gggccaaacc aataaacagg gtcaccaggg tgaacattgc cagataattc aggctgaccc 20220
cttcgctgat ataaccgggc atcacggcct cgcggctcag ttcgacgacg tgcaccaggg 20280
gattccacag caggtacgac caatactgct tcggaatgga gtgcagcggg aacatgatgc 20340
acgaaataaa gtacagcggc ttcagcaaga tcggcaagac tttctgcatt tcggggaacg 20400
tcttgcccac gaccatgaag atcaggccca caccgcacga caggatgatc aggaggctcc 20460
aggtgagcac aaattgcagg aagttggtaa tctcgaaata ttcgcccgcc atccagatga 20520
tcagcatcag gaggatgtag accgccacat agatcagcgt ttccaagagg gcgcgtgcaa 20580
tgatcgtgtc gatcggcttc acgggccggt agttaaacag cccctgattg gcttcgatgg 20640
cgcccacgga gcgattgctg atgctgctga aaataaagaa cgggatcagg ccattgagca 20700
ggaacaccgg gaaggagata tccggcatgg tgcgatgcat gatatagcca aagatcccga 20760
gcagaatcag cagatgtgcg ctcggttcca ggatcgccca cagatagccc aggcgaaact 20820
tgccaaagcg cgtacggatt tcgcggagaa acagtgcttc gaccgtcact ttctggactt 20880
caaaacccga acgtgccatt tattaacctc ctggtaccaa tctagattgt ttaaacagat 20940
ctgttacctg caggattatt gtttctgttg cataaagcct aaggggtagg cctttctaga 21000
gatagccatt ttttgcactc ctgtatccgc ttcttgcaag gctggactta tccctatcaa 21060
accggacact gcaggctgac aagctttcat tacatatgaa gagtttgtag aaacgcaaaa 21120
aggccatccg tcaggatggc cttctaagaa ggctcgagtg gcgcgcctaa gtcgaatttc 21180
tgccattcat ccgcttatta tacttattca ggcgtagcac caggcgttta agggcaccaa 21240
taactgcctt aaaaaaatta cgccccgccc tgccactcat cgcagtactg ttgtaattca 21300
ttaagcattc tgccgacatg gaagccatca cagacggcat gatgaacctg aatcgccagc 21360
ggcatcagca ccttgtcgcc ttgcgtataa tatttgccca tggtgaaaac gggggcgaag 21420
aagttgtcca tattggccac gtttaaatca aaactggtga aactcaccca gggattggct 21480
gagacgaaaa acatattctc aataaaccct ttagggaaat aggccaggtt ttcaccgtaa 21540
cacgccacat cttgcgaata tatgtgtaga aactgccgga aatcgtcgtg gtattcactc 21600
cagagcgatg aaaacgtttc agtttgctca tggaaaacgg tgtaacaagg gtgaacacta 21660
tcccatatca ccagctcacc gtctttcatt gccatacgga attccggatg agcattcatc 21720
aggcgggcaa gaatgtgaat aaaggccgga taaaacttgt gcttattttt ctttacggtc 21780
tttaaaaagg ccgtaatatc cagctgaacg gtctggttat aggtacattg agcaactgac 21840
tgaaatgcct caaaatgttc tttacgatgc cattgggata tatcaacggt ggtatatcca 21900
gtgatttttt tctccatttt agcttcctta gctcctgaaa atctcgataa ctcaaaaaat 21960
acgcccggta gtgatcttat ttcattatgg tgaaagttgg aacctcttac gtgccgatca 22020
acgtctcatt ttcgccaaaa gttggcccag ggcttcccgg tatcaacagg gacaccagga 22080
tttatttatt ctgcgaagtg atcttccgtc acaggtattt attcggcgca aagggcctcg 22140
tgatacgcct atttttatag gttaatgtca tgataataat ggtttcttag acgtcaggtg 22200
gcacttttcg gggaaatgtg cgcgcccgcg ttcctgctgg cgctgggcct gtttctggcg 22260
ctggacttcc cgctgttccg tcagcagctt ttcgcccacg gccttgatga tcgcggcggc 22320
cttggcctgc atatcccgat tcaacggccc cagggcgtcc agaacgggct tcaggcgctc 22380
ccgaaggt 22388
<210> 45
<211> 23738
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Sequence
<400> 45
ctcgggccgt ctcttgggct tgatcggcct tcttgcgcat ctcacgcgct cctgcggcgg 60
cctgtagggc aggctcatac ccctgccgaa ccgcttttgt cagccggtcg gccacggctt 120
ccggcgtctc aacgcgcttt gagattccca gcttttcggc caatccctgc ggtgcatagg 180
cgcgtggctc gaccgcttgc gggctgatgg tgacgtggcc cactggtggc cgctccaggg 240
cctcgtagaa cgcctgaatg cgcgtgtgac gtgccttgct gccctcgatg ccccgttgca 300
gccctagatc ggccacagcg gccgcaaacg tggtctggtc gcgggtcatc tgcgctttgt 360
tgccgatgaa ctccttggcc gacagcctgc cgtcctgcgt cagcggcacc acgaacgcgg 420
tcatgtgcgg gctggtttcg tcacggtgga tgctggccgt cacgatgcga tccgccccgt 480
acttgtccgc cagccacttg tgcgccttct cgaagaacgc cgcctgctgt tcttggctgg 540
ccgacttcca ccattccggg ctggccgtca tgacgtactc gaccgccaac acagcgtcct 600
tgcgccgctt ctctggcagc aactcgcgca gtcggcccat cgcttcatcg gtgctgctgg 660
ccgcccagtg ctcgttctct ggcgtcctgc tggcgtcagc gttgggcgtc tcgcgctcgc 720
ggtaggcgtg cttgagactg gccgccacgt tgcccatttt cgccagcttc ttgcatcgca 780
tgatcgcgta tgccgccatg cctgcccctc ccttttggtg tccaaccggc tcgacggggg 840
cagcgcaagg cggtgcctcc ggcgggccac tcaatgcttg agtatactca ctagactttg 900
cttcgcaaag tcgtgaccgc ctacggcggc tgcggcgccc tacgggcttg ctctccgggc 960
ttcgccctgc gcggtcgctg cgctcccttg ccagcccgtg gatatgtgga cgatggccgc 1020
gagcggccac cggctggctc gcttcgctcg gcccgtggac aaccctgctg gacaagctga 1080
tggacaggct gcgcctgccc acgagcttga ccacagggat tgcccaccgg ctacccagcc 1140
ttcgaccaca tacccaccgg ctccaactgc gcggcctgcg gccttgcccc atcaattttt 1200
ttaattttct ctggggaaaa gcctccggcc tgcggcctgc gcgcttcgct tgccggttgg 1260
acaccaagtg gaaggcgggt caaggctcgc gcagcgaccg cgcagcggct tggccttgac 1320
gcgcctggaa cgacccaagc ctatgcgagt gggggcagtc gaaggcgaag cccgcccgcc 1380
tgccccccga gacctgcaga tccacatcct tgaaggccgc agcgacgagc agaaggaaac 1440
cctcattcgg gaagtcagcg aggccatctc gcgctccctg gatgcgccgc tgaccagcgt 1500
gcgagtgatt atcacggaga tggccaaggg ccacttcggc atcggcggcg aactggccag 1560
caaggtcaga cgctgaagtg gagatgccca agggcacttc gggtcgagga acccgacctg 1620
cattgggacg cggccacgga gagcgcgggc aaacgccggc actatagcca gtggagtttg 1680
taaaacgcta tttcagagct tggagagtgt ctaagaaagc cggggcgatg ccaacccatc 1740
ccttcttcgg ctatgcatcg ttcgtaatca agccacttcc tttttgcatt gacgcagggt 1800
gtcggaaggc aactcgccga acgcgctcct atagttttca gcgaagcgtc ccaaatgtaa 1860
gaagccgtag tctagggcta tctcagttat actacgcaca ttggcactgg gatcgttcaa 1920
gcaggcgcgg atgctttcga gcttgcggtt gcggatgtag ttcttcggcg tggtgccggc 1980
atgcttctcg aacaaattgt agagcgagcg tggactcatc atcgccagct ccgctaaccg 2040
ctcaaggctg atattccgtt tgagattctc ctcaatgaat tgaacgactc gctcgaaaga 2100
cgggttacct ttgctgaaaa tttcacggct gacattgctg cccagcattt cgagcagctt 2160
ggaagcgatg atccccgcat agtgctcttg gacccgaggc atcgactttg tatgttccgc 2220
ttcgtcacaa actaacccga gtagattgat aaagccatcg agttgctgga gattgtgtcg 2280
cgcggcgaaa cggataccct ccctcggctt gtgccaattg ttgtcactgc atgcccgatc 2340
aaggaccact gagggcaatt taacgataaa tttctcgcaa tcttctgaat aggtcaggtc 2400
ggcttggtca tccggattga gcagcaatag ttcgcccggc gcaaaatagt gctcctggcc 2460
atggccacgc cacaggcaat ggcctttgag tattatttgc agatgataac aggtctctaa 2520
tccaggcgag attaccctca cgctaccgcc gtagctgatt cgacacaggt cgaggcatcc 2580
gaagattctg tggtgcagcc tgcctgccgg gcgcccgccc ttgggcaggc gaatagagtg 2640
cgtaccgaca tactggttaa cataatcgga gactgcatag ggctcggcgt ggacgaagat 2700
ctgacttttc tcgttcaata agcaaaaatc catagttcac ggttctctta ttttaatgtg 2760
ggctgcttgg tgtgatgtag aaaggcgcca agtcgatgaa aatgcatctc gacgtgatgc 2820
gtatacgggt tacccccatt gccacgttgc gccatccttt ttgcaatcag tgaccacttt 2880
tccaagcaaa aataacgcca agcagaacga agacgttctt tttaagaagc gagaacacca 2940
gaagttcgtg ctgtcggggc atgcggcgac gaattggcgg ataaagggga tctgcaggtc 3000
ccgagcctca cggcggcgag tgcgggggtt ccaagggggc agcgccacct tgggcaaggc 3060
cgaaggccgc gcagtcgatc aacaagcccc ggaggggcca ctttttgccg gagggggagc 3120
cgcgccgaag gcgtggggga accccgcagg ggtgcccttc tttgggcacc aaagaactag 3180
atatagggcg aaatgcgaaa gacttaaaaa tcaacaactt aaaaaagggg ggtacgcaac 3240
agctcattgc ggcacccccc gcaatagctc attgcgtagg ttaaagaaaa tctgtaattg 3300
actgccactt ttacgcaacg cataattgtt gtcgcgctgc cgaaaagttg cagctgattg 3360
cgcatggtgc cgcaaccgtg cggcacccta ccgcatggag ataagcatgg ccacgcagtc 3420
cagagaaatc ggcattcaag ccaagaacaa gcccggtcac tgggtgcaaa cggaacgcaa 3480
agcgcatgag gcgtgggccg ggcttattgc gaggaaaccc acggcggcaa tgctgctgca 3540
tcacctcgtg gcgcagatgg gccaccagaa cgccgtggtg gtcagccaga agacactttc 3600
caagctcatc ggacgttctt tgcggacggt ccaatacgca gtcaaggact tggtggccga 3660
gcgctggatc tccgtcgtga agctcaacgg ccccggcacc gtgtcggcct acgtggtcaa 3720
tgaccgcgtg gcgtggggcc agccccgcga ccagttgcgc ctgtcggtgt tcagtgccgc 3780
cgtggtggtt gatcacgacg accaggacga atcgctgttg gggcatggcg acctgcgccg 3840
catcccgacc ctgtatccgg gcgagcagca actaccgacc ggccccggcg aggagccgcc 3900
cagccagccc ggcattccgg gcatggaacc agacctgcca gccttgaccg aaacggagga 3960
atgggaacgg cgcgggcagc agcgcctgcc gatgcccgat gagccgtgtt ttctggacga 4020
tggcgagccg ttggagccgc cgacacgggt cacgctgccg cgccggtagc acttgggttg 4080
cgcagcaacc cgtaagtgcg ctgttccaga ctatcggctg tagccgcctc gccgccctat 4140
accttgtctg cctccccgcg ttgcgtcgcg gtgcatggag ccgggccacc tcgacctgaa 4200
tggaagccgg cggcacctcg ctaacggatt caccgttttt atcaggctct gggaggcaga 4260
ataaatgatc atatcgtcaa ttattacctc cacggggaga gcctgagcaa actggcctca 4320
ggcatttgag aagcacacgg tcacactgct tccggtagtc aataaaccgg taaaccagca 4380
atagacataa gcggctattt aacgaccctg ccctgaaccg acgaccgggt cgaatttgct 4440
ttcgactatc ggcgcgccag agctcatcgt taatgtcttc gtgcgccgtc agtcggcgca 4500
cgttttttct ctctggtacc gtgtcactga tctagtcaat tactcgaagt atccacaagt 4560
gaagcatact aagtaatgta caagaatcaa aaaaatcggc tacgcaagtc gcgtagccga 4620
atcatttaag gatccttcca ttcaggtcga ggtggcccgg ctccatgcac cgcgacgcaa 4680
cgcggggagg cagacaaggt atagggcggc gcctacaatc catgccaacc cgttccatgt 4740
gctcgccgag gcggcataaa tcgccgtgac gatcagcggt ccagtgatcg aagttaggct 4800
ggtaagagcc gcgagcgatc cttgaagctg tccctgatgg tcgtcatcta cctgcctgga 4860
cagcatggcc tgcaacgcgg gcatcccgat gccgccggaa gcgagaagaa tcataatggg 4920
gaaggccatc cagcctcgcg tcgcgaacgc cagcaagacg tagcccagcg cgtcggccgc 4980
catgccggcg ataatggcct gcttctcgcc gaaacgtttg gtggcgggac cagtgacgaa 5040
ggcttgagcg agggcgtgca agattccgaa taccgcaagc gacaggccga tcatcgtcgc 5100
gctccagcga aagcggtcct cgccgaaaat gacccagagc gctgccggca cctgtcctac 5160
gagttgcatg ataaagaaga cagtcataag tgcggcgacg atagtcatgc cccgcgccca 5220
ccggaaggag ctgactgggt tgaaggctct caagggcatc ggtcgacgct ctcccttatg 5280
cgactcctgc attaggaagc agcccagtag taggttgagg ccgttgagca ccgccgccgc 5340
aaggaatggt gcatgcaagg agatggcgcc caacagtccc ccggccacgg ggcctgccac 5400
catacccacg ccgaaacaag cgctcatgag cccgaagtgg cgagcccgat cttccccatc 5460
ggtgatgtcg gcgatatagg cgccagcaac cgcacctgtg gcgccggtga tgccggccac 5520
gatgcgtccg gcgtacaaga tccacaggac gggtgtggtc gccatgatcg cgtagtcgat 5580
agtggctcca agtagcgaag cgagcaggac tgggcggcgg ccaaagcggt cggacagtgc 5640
tccgagaacg ggtgcgcata gaaattgcat caacgcatat agcgctagca gcacgccata 5700
gtgactggcg atgctgtcgg aatggacgat atcccgcaag aggcccggca gtaccggcat 5760
aaccaagcct atgcctacag catccagggt gacggtgccg aggatgacga tgagcgcatt 5820
gttagatttc atacacggtg cctgactgcg ttagcaattt aactgtgata aactaccgca 5880
ttaaagccga gcgatgataa gctgtcaaac atgagatcca atctagattg tttaaacttc 5940
tgcagaacac gcggtgttaa cgtttcttat acttcttaat tttgttaaag atcatttcgc 6000
cgtagtacac cgcattgacc tgggtcttca ccagcaagta gccgcgaaat ttcttaaaca 6060
acttcatgtt cggtttaaag tcggcttgcc agaactgatg caaatgcccc tggtacgtca 6120
gacccttgat atcgtacaag gcgttgccca tgactttcag gggcttgttg tggatcaacg 6180
cggaaatgcc ggccgtgcta ttgatggtga ccaccgcttt ggcgtggcgc aacagctccg 6240
gcatgggcag atcgtgcaca tagatgacac gttcatccaa accgtattcc ttcgacagac 6300
gcttgatcaa cgggcggtac aggcggtgcc cgcgatccat cgggtgatgt ttgatcacca 6360
gataggactc cttgggggcc ttgcgggaaa agctgtacat cacttcgttg atgtaatcac 6420
gcacatcatt atagttgcta tggttgcgga tctggctgtc gttgtacact tgcaggaccg 6480
ccaggtaata gcgctgatcc agctcgttca tcaggcgggg gaggaccttg cgttgggtga 6540
ccttatacag ctgtttgcgc cagtaggcgc ggacccagca gcgcgcttca taccacgggc 6600
tgaacgattt gtggtggcga tagcgcggaa attcgtgacg atagtgccaa cccatcaggt 6660
aataccacat ggcgtggccg atgcgcttca tggtgctcgg tttcaggttc tcgacgtgcg 6720
gcgtcggcat atcgggcaat ttgcggtaaa agtccggatc gcggggcaag ctgctatagg 6780
cgttcacacc gccttcttcc acggtgataa attgcggacg caggtagcct tcctcgaagg 6840
ccagaaaacg aatccccttc gacttggccc agcgtttggc ctccttgtgc agcaggcggc 6900
agtcaccgaa acacaaaatc gtgtcaaagt catactgacg atgcaagtcc cgcagccaac 6960
cggggaactc cttcggggtt tggtagtacg ccaggtattg gcggtggcgg cagtagaagc 7020
gatcaccgcc attaaagacg acgttgaccg cgttgcgacc gaggctctcc aaccattccg 7080
ccacatcgtt gaagaacgga cccatcggac cttggagcag gaggtacttt ttaccgctca 7140
acagcaccgt cagcgcattg ccgtgcattt attaacctcc taacacgcgg tgttaagcgt 7200
tttcggcgag ctcttaacca aagcgcactt tgcagaacat gatcaacttg cgatagtagc 7260
gaatcacacg gccggctttc ttgcgggtga taaagatggg tttgcggggc gttttgatca 7320
gatattctgc cgcttcctcc accgtgatcg gctgcaaccg cgtcggatga atataggtgg 7380
gatagacaat cagggcttga tagatcaggt cggcgatggt cagccgccgc tcgcgacggg 7440
ggcagtggtg ctcatcgacg gtcaggcccc acgaggcgta gaacggcagg ccgtagcagt 7500
gcacctgttt accgtgcagc aatgcttcaa agccgctgag gctcgtcatc gtgtgcacct 7560
cgtccgcacg ctgaatacac tgaatgatat cggcatccag tgcctggtag tctgcgagtt 7620
ccgcgatctg ttccgccgga atgtcaccct tacggttgcc gacgagcaca tcggggtgcg 7680
gcttgtagat gatgtaggcg tgcggattac gttcccgcac ggtgcgcagc agctccagat 7740
tcgacttgat cgacacggtg cccgtcttaa tcgacgcatc gtcttccacc tggcccggca 7800
ccaggatgac tttcttgtcc ttcgcttctg ccgggaggct gaaatcggcc cccaggttat 7860
atttgctcaa tttgctttcc accagacgtt ggcgcaactt ttccgcgcgc atctggtgcg 7920
cgagggtcag ctggctgtga ttcagcagga cctccagttc cgacggacgg gtggcatcgt 7980
aatagatacc gcgcttatcc aggaccaggc tcaacggcgg cagcagatcg ctccccaggc 8040
cggagctgcg caggaagccg tcttccatgc gccacagcgg cagggatttg cgctgtgcct 8100
ccgcacgcca ttgctgttcg cctttcacgc cccacacgac gcaggcgctt gctgcggtac 8160
agcgacggga aaaggagaga cgattcgtgg ccgtttgcag gaagggcttc aggatcgcgc 8220
ttttccacag ggtcaggccc ggcacccaga gataaccatt ccgctgttgc aggtgacgac 8280
gttgcagctg gagccattgg agcaccgtga acagggccga cacctccccg gtctgcggat 8340
caatgtagcg gcaatagcgc agataggccg ctgcgaacag ttcctccagg gtggccgagc 8400
cgcgacgcgc cgacagcagc gccgattggg ggtggcggtc atcggtgagg ccccaccctg 8460
cataccaggg ttggccaaag caggtcacgg gcttaccggc cagcagggct tcaaaaccgt 8520
actgggaggt cacgacgtac acgcgggaca catgacgcag cagggactgc ggcgacacgt 8580
tttccgcaat caggcgcacg cgctgggtgg cacgcaagtc cgcgaagtag ccggtctttt 8640
tcccttccag gacatcggga tgcactttga cccagatttc tgcctgcggg ttttccgcca 8700
tcgctgcttc cagcattgcg gcgaactcat gggggcctgc gttgccgtag gtcacgctca 8760
tgtcattgaa ggtctggtcc accaccagca cgatgttcgt gcgctcgctt tcatccgcca 8820
cgaacgccgg tgccaggttg tacttgctca tgtcgcccgt cacaatggtg tgcatcgcct 8880
cgcgcgcctg atccgccagg gccgcgttgc cggccttgtc ctgcacgagt ttttccagcg 8940
cgctcggttt cgaggcgtcg tagtaaatgc cgcagtcatc cacgacgagc gagaggggcg 9000
gttcaccgtt cacgcccagg tccagcgagc ggacgaaacc atcctccaag cggatcaccg 9060
gcttgcctgc ggctttggcg atggccaccg gctttgcggc cgaggggcgg tgcccccaca 9120
ccgcgattgc atccacttcc tgcgggaccg ggcgcagcag cgacagcttt tggcagggct 9180
gggcgaggaa tttttccagg tgcggaatac gccaaatgcc ggggctataa atgccaatca 9240
tgcgttctcc gcgagctcct gcgccatcag ggcccggacc ttctccaagc acgccggggt 9300
atcgacgccg ggaccggtcg cggcgacctc gaaggtgcga atgttaatgc ccgcgctcat 9360
cagccgcagt tgctccaggg attcggcctg ttcgggcatg gactccggca actggctgta 9420
attttgcagg acatcccgcc gataggcgta gatcccgacg tgcttcaggt agcgcgcctt 9480
ctcggcgttg cgcgggtacg gaatggggga gcgggagaaa tacagggcgt cctgccgcgt 9540
gttcaccacg accttgacgg tggacggttc ggcggcttct gccgcgctga tcgcatgaca 9600
cagggtcgcc accggcagcg ccgggtcgtc ccgcatacct tgcagcaggg tttcgacgtc 9660
acgcgggcga atcatcggct catccccttg caggttgata tagatatccg cctccacctt 9720
atgcatgact tccaccaggc gatcggtgcc gctctcatga tcgttgcggg tcatgatcgc 9780
tttgccgccg aacgcctgga ctgcctgctc cacacgcggg tcgtcggttg cgacccacac 9840
ctctgccacg cctgccactt gcagggcccg ttcgtagacg tgctggatca tcggtttccc 9900
gacgatatcc agcagcggtt tgcccggcag acggctgctg ccgtagcgtg ccgggatcac 9960
aatcacggcc ttcgacattt attaacctcc tcgagttaca gcgacagaat cactttcgcg 10020
cccaccgcca gttggtacag aatggtgctg ataccgcgcg tcacttcgat gttcttcgac 10080
tcgtatttcg gcaacaccat aatttcatca ccgggtttca gggaatcgac gtcttctgcg 10140
ttcaccgctg cgccgttctg acggatgacg ataatacggg cgttgccgga cttctgggtc 10200
agcccaccgc acttctcgat gtagtcctcg gtcgtcatac ctttctgcca cgacaccgcg 10260
ttcgggaaca gcacttcccc gtggaccatg accaacgacg tcttttcggg aatattgatc 10320
acgtcgccgt cctccaggag gacggagtca atgttgcttt cattgaggat cacttcgccc 10380
ttcggcacga cggtgcgggc tttcgcgacg aagcgggaga tcagttgggc ttcctgcata 10440
cgcaggctgg cctcttcctt ggtgctgctc tgtgcgctga ggctggcctc ttcgagcttt 10500
tgcagggaca aattcagcat ttctttctgc cgttgcgcga cgctcggccg atacaactgc 10560
acggcgttca tctgcgacat ggagttcggg cgcacttttt cgagcacggc ccgcatggtg 10620
ctaccgtagg gcagcaccat ggcgtgttcc ccggaatgtg cgccttccac acgcacttga 10680
atggtgcccg catagcggtc ggtggagaca atgagggtat caccgttttg cagcatacgc 10740
cccggtgcgg acgagatcgg ataatattcc gagcgcttct ggaggccctg cttccgcata 10800
atcgtgatat gggtcgcacc cggtttggga cgtgcccagg acagtgcttc ggtgaccggg 10860
atgctcgatt cgcgaaattc aaagtcgtag gaattgaaca catcgccctg caccgagaac 10920
gtatgctggc gcggacccac aatgatcgta tcaccgtccg caaactggga cagccccagt 10980
ttgccgttga gcaggaagtc atagaggttg acgttcgagc gcacacgatt gccgcgtttc 11040
acgacgatgt ccacgtagct gccgcgttcc gggtccacac cacccgcctt gatcaggtag 11100
ttcagcaggc tgtcggaggt gacaccgccg tacaggccgg ggttgcggac aaagccggtc 11160
acatagacct tgaccggctg cgcctgcaag agcgacgcat agacgttcac gttgctctgg 11220
tagacttcct tcaccttgct cgtcaccagc gcgttcaact gggagttcga cacacctgcg 11280
actttgacgg ggccgacatt cggcaggaag atgttgccct tcgggtccac ctggagtgcg 11340
ccatcgaagg tgaacgcacc ccacaggcgg acctggatgg aatcgccggg attcaggatg 11400
tagtccggat tgaaacccac ggttgccccc gagtctgcgc tcgtaccgtt gaacagctgc 11460
gccccgaaca tacggctcat cacgaccggg ggtgcggggg gcggggtgtt atcgaagccg 11520
ctcatgttct gggtgtcgct tttctgcccg ttcaggatgc cggtcaacgg tgcggcaccc 11580
gtgaggttcg gatcggcatt aatgtcgatg gttgcgctcg cctgtgctgc atggcacgct 11640
gcgatcagca ggatcgactt aaacagcttc atttattaac ctcctcgaga agtcgactta 11700
gtcacggtgg tcttcaatca ccgccaggag caatttcagg gtgccaaaga gcaggcaaca 11760
caccagcagc caacacgcga tcaaatacgg gatattcggg aaggagcttt cctggggcag 11820
ctgcggggac gagatcacgc tcaggacttt cagcttacgg gccgcttcga cacgggtctt 11880
ttcgatgctg gtgagcgtga gcttgtacaa ctcggtattg aactcgacct tggatttgat 11940
ctcctcaaaa tccacggcca tgcggttcag tttatcgccc tggggtgcgg taattttcga 12000
cttttcttcg tcgatctgtg cctggaggct ctgaattgca ttgcgggcgc tcacgacttg 12060
gggcgcatcc tcgcgcaggt acgtgagcag gttgcgcagg tcggcttcca tctgaatttt 12120
ctggcccatc agcgtattca ccagggtgga tgccgcctgg gcctgtgcct gcgggtccag 12180
cacattgttg ttgtcttggt aggacaacaa ttcggctttc gatgcatcca gccgctggcg 12240
cgctttttcc atttcggttt ccgcaaacgc caattgatcg cgggcgatac ggtgcgacat 12300
ttcattgatg aaccgctcgg attccttgag cacggtctgg ttgaatttca gcgcgaactc 12360
gggcgaaaag ccctgggtct ggatgttcag cagcccggtc ttgtcgtcgt agctgacgtt 12420
gatgcgatct ttatagtact tcaggaaccc ctcggcggtt tcatccttgg acagatggtt 12480
caggaagtcc aggcccgaat gggagaacgc ttcgcggaag ttcagctgtt tatccagcgc 12540
ggccagcata tccgggctgt tgatgtattc cttcaggtac agtgcgtctt cggcggacga 12600
cgggttggag gcacccaaca gcaggccgaa gttcaggctg ccggagttga gatcgtcgct 12660
gcgcttgatg gccaccttgc tttccgacat atagcggggc tgggagaaga tcgccaagta 12720
gatcagcagc accgccatgg gtgccagaat aatgattttt gccaggtgct tctgaatatc 12780
tgccaggctg atcgcgctca gacgcgcacg catccacgag acggcgcttt tcactttgat 12840
cagcatttat taacctcctg tcgacaacac gtgttaatcg aaaatgcgca ccaacccggt 12900
caccttattt gctttgttgg tcaccagcag ggtcgagacg cggtgtttct gcatcttctc 12960
ttctgcttcg atgatcatgg tgtcttcggg caaggtcagc ggttcgcggg tcatcatctg 13020
tgcggccgtt gcgctcgtca ggctgtcttc tttctccata aagcgccgca gatcgccatc 13080
ggtgatgatg cctgccagcc caccttccgc atcttcgacc atcaccatac cctggcagcc 13140
cgaggtgatg cgctgaatga ccgttttgaa gctggcatcg agctgcactg ccggcacatc 13200
atgttgcatc acgtcggcga cgcgggtcag caggcgccga cccaggctgc caccggggtg 13260
gtagcgtgca aagtcattgg gcataaactt acgctggtga atcatcgcga tggccagcgc 13320
gtccccgatc gccatcgtga gcgtcgtgga ggtggtcggg gcgagattgt tcgggcacgt 13380
ttcgttcgcc atgtgcagct ccaggaccgc atctgcattt ttggccaggg tgctattccc 13440
gttattggtg attgcgatga tgcgattgcc gaagttcttc aggctcggca ccagtttcag 13500
gatctcgtcc gtctcaccgc tcgccgaaat caagatgagc aggtcatacg gggtgatcat 13560
gcccagatca ccatggaacg cttccgccgg atgaataaag aaggagggcg tcccggtcga 13620
ggccaaggtc gccgacatct tgcggcccac atggccgctt ttacccatgc cgctcaggat 13680
gacgtgccct ttacaattca tgatgagatt caggacgcgc tggtactgac cgctatccag 13740
ttgtttggac aggttttgca gtgccgcgct ttgttcggcc agggtctggc ggacgctcgt 13800
aatcagatac ggatcaatgg tcgaggactg gtcatccggc aagtggcgtt cgctcattta 13860
ttaacctcct cacgtgttaa ttaagtaatc gatagtgatt taaatatgca agatccgata 13920
aatcgattga tagatttaaa taagaactgc agaagctagc ttagatgctc gtgaaattga 13980
cgtgggcgct ttgcagggcc gtcttaatgg cgttggtgtc cacgaggatc gagtcgggtg 14040
cggaaaacgg acggttcttg ttggtgaaat cgctgttacc aatgtacagc gattccttgt 14100
tacgcagcgc ctggatgtgc cagcgggacc acgaatccca atacttctgg cgatccggcg 14160
agataccttg gctggtgtag ccggtcgtcg ggctgttcat caacgagtcg gtgcggtgcg 14220
agcccagcgt cagcggcaac ttgatccgat gcaccgtgga atcgccgaag atcagcttca 14280
gacgcgcgat aaattcgcta tccgcacccg ttttcacaca atcccagaca ccggccttct 14340
gcaagacgtc ggcacggcga aacaggagcg acgacggatt cagacgcttc aaggggtaca 14400
ctgcgcgggc atagaaaata ccgttgtctt gcaggcgcac ccagtccgag atggagcaga 14460
tgagcttcgg attgagcaac aagggggaga tttggcggaa cagcttttcc ggatggctcc 14520
agtcatccga atcgtggcag gtgacgaact cgcccttcgc ttggatcaag ccgatacgct 14580
tcgcggcata ggtgccgaca ttctgcggca ggctaatgat cttgatgcgc gtgtctttga 14640
gggcgagccg ctggagacga aacagggtgt catcggtgct cgcgtcatcc acaatgatca 14700
gctcgaagga acggtaggtc tgattgagga gcgaaatcac cgcattttcc acgcggcgac 14760
ccgtattata ggtggtcatc aggatggaga tcaacggccc cgtctgggcc gggtacggga 14820
tgctggtgat gatgttgcac ggggagagcg gggagctgtt gtccgtcaag gccacggggc 14880
tgaggccgaa gtatttatag tattcattca gccgattcag gctaatttcg gcggtttcgc 14940
ggaaggcgtt attttgcagc agcaggatat ccgggctata gacgatatcg gatgcgtcga 15000
tctgggcgag ggtcgagatg gccttttggg tcaggccgat ccggagttgc agtgcggtat 15060
acaggtccag cgggcagttg tccacgttgt ccaacaggct caggctaaag gtcggcgagt 15120
aggacgccag ggttttcgcc agttccactt tctgatgggt atcggtgaac tcgtccttga 15180
actccatcag cagctcgggc gtcaggctga tgtcgccgca ggcgattttt gcgatcttga 15240
ttgccagttt gcagcgccaa tcggacgggg tatccgtcaa gttatgcagc gaccagtaca 15300
tattcagacg atacatcgcg aggatgcgtt tcgactgcca gaaccggcaa tcatcctgga 15360
tggccgcgag cgcgtggacg tagcggctct ttttgagcag ccacaagaat ttgagattat 15420
tgaacattta ttaacctcct gctagcaact taagttacga atcgacgccg aacaggtcgc 15480
gggtgtagac tttctccgag acatcttcca gttcgctggt gcggcgattc gccacaatga 15540
catcgacgcg ctccttaaag gaattgatgt cgcgctcgac gtaggaaccg aagaagtagg 15600
gttctttcag gaccggctcg tacaccacaa tctcgatacc cttggccttc aaacgtttca 15660
tgaccccctg gatgctgctg gcccggaaat tgtcgctacc cgccttcatg atcaggcgat 15720
agataccgac cactttgggc ttacgggaca ggatgtcctc ggccacgaag tccttacggg 15780
tcgtattcgc atccacgatg gcctggatca ggttttgcgg gacgtcgcga taattggcca 15840
acagctgctt cgtatccttc ggcagacagt aaccgccgta gccgaaggac gggttgttgt 15900
aatgttgacc aatgcgcgga tcgagggaga cgccttcgat gatttgtttg gtatccaggc 15960
cgtgcacgct cgcgtaggtg tccagctcgt taaagtacgc gatacgcatc gccagatacg 16020
tgttcgcgaa cagtttgatg gcttctgcct cgggcgaatc cgtcagcagg atcggaatat 16080
cctttttgat ggcaccttcc gacaggagtt cggcgaactt ccgtgcgcgt tccgacgatt 16140
cgcccacgac aatgcggctc ggatagagat tatcatacag ggctttgcct tcgcgcagga 16200
actccgggga aaagatgata ttattcgtgt tcagatcgcg cttcaggcgt tcggtgaacc 16260
cgacggggac ggtggatttg ataatgatgg tcgcgttcgg gttaatggac agcacgtcac 16320
acgcgacgct ttcgacgctc agggtatcaa agttgttatt aatcggatca tagttcgtcg 16380
gggtggcgat gatcacgtag tctgcatcgc gatatgcctc gtatttttcc gtcgtcgcgt 16440
agaggttcag cttacgattg gagagaaact tctggatttc cgggtcgcaa atcggcgaga 16500
ttttcttgtt aatgagctgg accttcttcg ggtcgatgtc cagggcgatg atgtcgtgtt 16560
tttgggagag gaggatcgca atgctgatac ccacatagcc gacgccggcc acggcaattt 16620
tcatttatta acctccttaa gtgaattcaa actagtttac aagtcgtttt cgatcttctc 16680
ccaggtatat ttgcgacatt cattcaagtt ggtcagcggc gagtatttgt actttttgat 16740
accgaggcgc gacaggcttt cgttcaccac cttgaaatgg ttttcctttt ggatgtccag 16800
tttcttgatc gacgtgttct cgccgtgcag gacacggttg tagcaaatct tattgatatg 16860
cttaaacggg ccgacttcgc tgagtttcaa atacatatcg taatccaccg cattgctgat 16920
gctctcgttg aagccttcgg tgaggttcca tgcacgcgcc gtgaacatac ggaagtggtg 16980
gcagatcatc gcgctcgtga gcttttcgcg gctgtaaatc ggccagttgt agccattgct 17040
aatcaagtta ccttcacgat caatattgcg attggtggtg tacacgcagg cgaggctcag 17100
gtctttgcga aattcatcca gacacagttc cacggcatcg ggctccagga aatcatcgga 17160
atccagctgc ccgatgtaga aaccccggca caggcggact gcggtattcg aggcggagcc 17220
gatgcctttg tttttctggc tgatgaaacg gacgcgcggg tggtttgcgt aatgttcttg 17280
caggatgcgc agcgtatcat cggtgctccc gtcatcgcag atgcagacct ccagatcggt 17340
gatcgtttgg ttcagtgccg attcgacgca gcgcacgata tatttgctgc aattatacgc 17400
ggggatgtag atgctcacca ggggcacacg tttcagggtg gcgctctcga ttttctcctt 17460
cttgcgataa aagtagggca ccttctgctg caacagctgg acggtaatgt ttttacctgc 17520
cgcgcgatcg gtttcgttct ccttaccggg cggttcctga tgatatgcca tcgcgccttc 17580
cacgctacgg aaataacaac cctcgcggta cagccgatag ccgaactcat tatcctcacc 17640
gccccaatgc gtgaactctt cgtcaaacca acccgcgcga aacagccact tctttgcaaa 17700
cgccacattg ccaccgctaa agaaccggaa cggggtgttg cacaggcgca gattgtcggt 17760
attcttgaaa tgttcgatgc gccaatcgac ggatttgttc tgctcgacct tgcctgcgac 17820
ctgattattg gtaataatct ccgggatttc attgatcagg cttttctggg acaaaaagtc 17880
cagataggta tgcttcgacg tgtcgatgta tttacgcggg ccaatcagtg ccacgttatc 17940
atccacggcc aggagttcca tataggactg cacccacaac gggttcggcg ccatatcgca 18000
gtccaagatc gccacgtagt tgtatttcgc tgcccgcagg cccaggttcc gcacggcgca 18060
cagctggtag ccgtagtctt tctggcggac gtatttgatg ttcagcaacg actcgaactc 18120
gcggacgatc tcttcgatgt tttccttgga accgtcatcc gcgacgatga cctcatagtc 18180
ataaatcgtt ttctgattgc agaggcaggc cagggtgatc gccaggattt tggcgcgatt 18240
gtacgtcgga atcacgatgg acaggccgtc gatgatcagt tgcttgcgcg gataatcatc 18300
cagttcttta cgtttccctg cccagacgta gtcgttcgtg ctttccggca gcggcggcaa 18360
ggtcaggtcg ctcggccaat ccagcggaat gggttcgact tctttcaatt cggcgcgctc 18420
ggatttcttt gcggtaattt cccgatattt gctaatgatt tcattctttt ccacctcatt 18480
cagcgagatc gcctttgcat tgctgcacat aattttggtt gccgcgtcga tatcaatgac 18540
cgctttccga ttcagcttgt ccacttcttc gctcagattc agggcggttt ggcacagctt 18600
gatattggct tccacccagc tcacatcata gatttccgcc actttttcaa acagggagag 18660
ggcttggcgg tagttcttat tcttatacag attgattgcc tggttcaaaa tgctcattta 18720
ttaacctcct actagtgaat tttcgaatta cttaccgcag tacttgacac ccacctggga 18780
attgtttttg gtgcgtttga attggcggat ggtacggtag atgctaaagg gcaggctgat 18840
cagaccgagc ggaaaattgt tcttattgat gatgagcttg cccagctgat agctcaggtg 18900
tttcttgacc cgttcggctt cgtgtttatc cgcgtacagg aagatgctcg gcaggctcac 18960
ttggtactcc gaatcatatt tcttcttcca ggtccgccat tcgctgatca acgcaaacgg 19020
aatcgagatc agaccgagga acgtcttgga gcggctcacc atcaccgcac ccaggcggta 19080
gccgatatct tgcttgatgc gttcggccgc accatacagc tccggcagtt gtttcttttc 19140
gagacgttga ttgtcgatga agtactgttc gagcttttgc tgcaccagat gcagctgatt 19200
gagcagcaat tctttttcgc acgacagctt ttcgaggcgc tgttgttgca gttcattttt 19260
gttctgttcc tttttcagca gggactcgaa gttctcgatc gcgcactcca gttcctggac 19320
ctggatggtt ttgtttttaa tgatcagatc atactggatc agttcttcct tgctatccga 19380
cagctctttc agaatggctt gataggcgtt cagctgtttg gacgtgtgca gttcgttgtc 19440
cagaatgatc tttttgctgc tctggtacag accgttcacg atatcgaggg tgatctggcg 19500
ttgtttaatg aacgtctccc aaataaagga cggcttatag ttttccttct ccagcacccg 19560
caagggggtg ttggcgttcg attgcaattc aaagtacagt tccttgcaat cgggatagtc 19620
gttcaggacg ttgaagatca agtactcctc cgtctcgctt tgcttgaaaa tgatatcccc 19680
ggtcccgatg tcaataccgc tgagggacat gatctcctga tgttcttttt ccagcgtaat 19740
ggaggcttcg gcggtcttaa agtcattcac gctctgctcc agcgagtggt tgatggtatt 19800
ggagaacgac aacccgaatt tcagtttcag tttgtgttgc agttgctgga tgcagtcctc 19860
ggcgttgcgc ttcacctgtt cgctcgacac cagcaggcac cgaccccggt tgttgaggaa 19920
gaagtgcagc aaggcggtgt tgtatgccag ccagtttttg atcagatgct ccgaggtata 19980
gttgctggag atgttctggt ccgagaagta gttcgtcagg atgcttttgg ggtggtcgta 20040
gatgaggata aaggtgatgt tctcatccac cgatttccaa tattccaacg tgtgaattgc 20100
gttggggtcg ctccaaccgc acagtttctg gttcaggttg gacagcatca gatccaatgc 20160
gataccgttc cagacggtgc tcacatggag cggttcaaag tcggcggaat cggtcaccgt 20220
atagatgtcc ggcgactggt acgccttccg cagcgtctgg gtgatgtcct ggggcgagag 20280
gttctcacgt ttggacgggc acagggagtt catgccgcgc tgatgcagga gttcttccac 20340
gatttggtag ttgctgctcg gatggcccac gatcaccagg cggttcattt attaacctcc 20400
tttcgaaaat gaacggtccg ttaaatatag ccattcggat tcttcatctg ccagcgccag 20460
gcgtcctcca gcatggtttc gagttcccgc ttggctttcc agttcagata tttgttggcc 20520
ttttcggggg aggaccagct ctccgcgata tcaccgtcac ggcggctcac gatttcatac 20580
ggaatccgca cgccggaaat cttttcaaag gtggacacca gttccagcac cgaataacct 20640
ttacccgtgc ccaaattaaa gacgtggtag ttggtgttat tgtcgcggaa gagataggac 20700
agcgctgcga cgtgcccttc ggccaggtcc atcacatgga tatagtcacg gacccccgtg 20760
ccgtctttgg tgggataatc accaccgaac accatcagtt tttccagttt ccccatcgcg 20820
acctgcaaga tgtacggcac caagttggag gggatgtctg ccgggctttc accaatcata 20880
ccggattcgt gggcgcccgt cggattaaag tagcgcaagc agaggaaatt cgtgtcggag 20940
tatttcttgg cgatgtcgcg gatcatcagc tccgagatgt acttggacgt accatacgga 21000
ttcagcgtgc caccaatatg gcagtcttcg gtgacgggca tgatcttgct ttccccatac 21060
accgtcgccg acgagctaaa gatgaagttg gcgacgtcgt tcttgatggc gcaattgatg 21120
agttgcaggg tgccgctcac gttgttgtca tagtagaaga tgggcttgat caggctttct 21180
gcgaccgatt tcgcacctgc aaagtgcatg atgcagtcga atttgtgttt cttcaggatc 21240
tggttcactt ccttctcgtt gttgatattg agttcgtaga acgtgacttt cttctttgcg 21300
atcagctcaa tgcgacggat gctttcgcag ctgctgttga tgagattgtc aatgatgacg 21360
acattgtagc ctttgttcag caggcagagc gacgtgtggc tgccgatgta gcctgcaccg 21420
ccggtgacca ggatgttcat ttattaacct cctcggtccg aattaaccta ggttatgagg 21480
tcagcattgc ttcttcacgc gtacggtaca gggccaaacc aataaacagg gtcaccaggg 21540
tgaacattgc cagataattc aggctgaccc cttcgctgat ataaccgggc atcacggcct 21600
cgcggctcag ttcgacgacg tgcaccaggg gattccacag caggtacgac caatactgct 21660
tcggaatgga gtgcagcggg aacatgatgc acgaaataaa gtacagcggc ttcagcaaga 21720
tcggcaagac tttctgcatt tcggggaacg tcttgcccac gaccatgaag atcaggccca 21780
caccgcacga caggatgatc aggaggctcc aggtgagcac aaattgcagg aagttggtaa 21840
tctcgaaata ttcgcccgcc atccagatga tcagcatcag gaggatgtag accgccacat 21900
agatcagcgt ttccaagagg gcgcgtgcaa tgatcgtgtc gatcggcttc acgggccggt 21960
agttaaacag cccctgattg gcttcgatgg cgcccacgga gcgattgctg atgctgctga 22020
aaataaagaa cgggatcagg ccattgagca ggaacaccgg gaaggagata tccggcatgg 22080
tgcgatgcat gatatagcca aagatcccga gcagaatcag cagatgtgcg ctcggttcca 22140
ggatcgccca cagatagccc aggcgaaact tgccaaagcg cgtacggatt tcgcggagaa 22200
acagtgcttc gaccgtcact ttctggactt caaaacccga acgtgccatt tattaacctc 22260
ctggtaccaa tctagattgt ttaaacagat ctgttacctg caggattatt gtttctgttg 22320
cataaagcct aaggggtagg cctttctaga gatagccatt ttttgcactc ctgtatccgc 22380
ttcttgcaag gctggactta tccctatcaa accggacact gcaggctgac aagctttcat 22440
tacatatgaa gagtttgtag aaacgcaaaa aggccatccg tcaggatggc cttctaagaa 22500
ggctcgagtg gcgcgcctaa gtcgaatttc tgccattcat ccgcttatta tacttattca 22560
ggcgtagcac caggcgttta agggcaccaa taactgcctt aaaaaaatta cgccccgccc 22620
tgccactcat cgcagtactg ttgtaattca ttaagcattc tgccgacatg gaagccatca 22680
cagacggcat gatgaacctg aatcgccagc ggcatcagca ccttgtcgcc ttgcgtataa 22740
tatttgccca tggtgaaaac gggggcgaag aagttgtcca tattggccac gtttaaatca 22800
aaactggtga aactcaccca gggattggct gagacgaaaa acatattctc aataaaccct 22860
ttagggaaat aggccaggtt ttcaccgtaa cacgccacat cttgcgaata tatgtgtaga 22920
aactgccgga aatcgtcgtg gtattcactc cagagcgatg aaaacgtttc agtttgctca 22980
tggaaaacgg tgtaacaagg gtgaacacta tcccatatca ccagctcacc gtctttcatt 23040
gccatacgga attccggatg agcattcatc aggcgggcaa gaatgtgaat aaaggccgga 23100
taaaacttgt gcttattttt ctttacggtc tttaaaaagg ccgtaatatc cagctgaacg 23160
gtctggttat aggtacattg agcaactgac tgaaatgcct caaaatgttc tttacgatgc 23220
cattgggata tatcaacggt ggtatatcca gtgatttttt tctccatttt agcttcctta 23280
gctcctgaaa atctcgataa ctcaaaaaat acgcccggta gtgatcttat ttcattatgg 23340
tgaaagttgg aacctcttac gtgccgatca acgtctcatt ttcgccaaaa gttggcccag 23400
ggcttcccgg tatcaacagg gacaccagga tttatttatt ctgcgaagtg atcttccgtc 23460
acaggtattt attcggcgca aagggcctcg tgatacgcct atttttatag gttaatgtca 23520
tgataataat ggtttcttag acgtcaggtg gcacttttcg gggaaatgtg cgcgcccgcg 23580
ttcctgctgg cgctgggcct gtttctggcg ctggacttcc cgctgttccg tcagcagctt 23640
ttcgcccacg gccttgatga tcgcggcggc cttggcctgc atatcccgat tcaacggccc 23700
cagggcgtcc agaacgggct tcaggcgctc ccgaaggt 23738
<210> 46
<211> 16
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Sequence
<400> 46
aggaggttaa taaatg 16
<210> 47
<211> 9089
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Sequence
<400> 47
cctgcaggta acagatctgt ttaaacaatc tagattggta ccaggaggtt aataaatggc 60
acgttcgggt tttgaagtcc agaaagtgac ggtcgaagca ctgtttctcc gcgaaatccg 120
tacgcgcttt ggcaagtttc gcctgggcta tctgtgggcg atcctggaac cgagcgcaca 180
tctgctgatt ctgctcggga tctttggcta tatcatgcat cgcaccatgc cggatatctc 240
cttcccggtg ttcctgctca atggcctgat cccgttcttt attttcagca gcatcagcaa 300
tcgctccgtg ggcgccatcg aagccaatca ggggctgttt aactaccggc ccgtgaagcc 360
gatcgacacg atcattgcac gcgccctctt ggaaacgctg atctatgtgg cggtctacat 420
cctcctgatg ctgatcatct ggatggcggg cgaatatttc gagattacca acttcctgca 480
atttgtgctc acctggagcc tcctgatcat cctgtcgtgc ggtgtgggcc tgatcttcat 540
ggtcgtgggc aagacgttcc ccgaaatgca gaaagtcttg ccgatcttgc tgaagccgct 600
gtactttatt tcgtgcatca tgttcccgct gcactccatt ccgaagcagt attggtcgta 660
cctgctgtgg aatcccctgg tgcacgtcgt cgaactgagc cgcgaggccg tgatgcccgg 720
ttatatcagc gaaggggtca gcctgaatta tctggcaatg ttcaccctgg tgaccctgtt 780
tattggtttg gccctgtacc gtacgcgtga ggaggcaatg ttgacctcat gattaagatc 840
gaaaacctga cgaaaagcta ccgcaccccg gtgggccgtc actatgtctt caagaacctg 900
aacattgaga tccccagcgg caaaagcgtg gcgttcatcg ggcgcaatgg ggcgggtaaa 960
tccacgctgt tgcgcatgat tgggggcatc gaccgcccgg atagcggtaa aatcatcacg 1020
aataaaacga tctcgtggcc ggtgggtctg gcaggcggct tccagggcag cttgaccggg 1080
cgtgaaaacg tgaagttcgt ggcccggctg tacgcgaagc aggaggagct gaaagaaaag 1140
attgagtttg tggaagagtt cgcggagctg gggaagtatt ttgatatgcc gatcaagacc 1200
tattcgagcg gtatgcgcag ccgcctcggc ttcggcctga gcatggcgtt caagttcgat 1260
tactacatcg tggacgaggt gacggcggtg ggggacgccc gtttcaagga aaaatgtgcc 1320
caactcttca aggagcgtca taaggaaagc tccttcctca tggtgtcgca ctcgctgaac 1380
tcgttgaaag agttctgcga tgtggcaatc gtgtttaaag acgacaacgc cgtgtcgttc 1440
catgaagacg tgcaagaagg cattgaagaa tatatcaccg aacaaaacaa ctactaaacg 1500
cgtgaagaag caatgctgac ctcataacct aggttaattc ggaccgagga ggttaataaa 1560
tgaacatcct ggtcaccggc ggtgcaggct acatcggcag ccacacgtcg ctctgcctgc 1620
tgaacaaagg ctacaatgtc gtcatcattg acaatctcat caacagcagc tgcgaaagca 1680
tccgtcgcat tgagctgatc gcaaagaaga aagtcacgtt ctacgaactc aatatcaaca 1740
acgagaagga agtgaaccag atcctgaaga aacacaaatt cgactgcatc atgcactttg 1800
caggtgcgaa atcggtcgca gaaagcctga tcaagcccat cttctactat gacaacaacg 1860
tgagcggcac cctgcaactc atcaattgcg ccatcaagaa cgacgtcgcc aacttcatct 1920
ttagctcgtc ggcgacggtg tatggggaaa gcaagatcat gcccgtcacc gaagactgcc 1980
atattggtgg cacgctgaat ccgtatggta cgtccaagta catctcggag ctgatgatcc 2040
gcgacatcgc caagaaatac tccgacacga atttcctctg cttgcgctac tttaatccga 2100
cgggcgccca cgaatccggt atgattggtg aaagcccggc agacatcccc tccaacttgg 2160
tgccgtacat cttgcaggtc gcgatgggga aactggaaaa actgatggtg ttcggtggtg 2220
attatcccac caaagacggc acgggggtcc gtgactatat ccatgtgatg gacctggccg 2280
aagggcacgt cgcagcgctg tcctatctct tccgcgacaa taacaccaac taccacgtct 2340
ttaatttggg cacgggtaaa ggttattcgg tgctggaact ggtgtccacc tttgaaaaga 2400
tttccggcgt gcggattccg tatgaaatcg tgagccgccg tgacggtgat atcgcggaga 2460
gctggtcctc ccccgaaaag gccaacaaat atctgaactg gaaagccaag cgggaactcg 2520
aaaccatgct ggaggacgcc tggcgctggc agatgaagaa tccgaatggc tatatttaac 2580
ggaccgttca ttttcgaaag gaggttaata aatgaaccgc ctggtgatcg tgggccatcc 2640
gagcagcaac taccaaatcg tggaagaact cctgcatcag cgcggcatga actccctgtg 2700
cccgtccaaa cgtgagaacc tctcgcccca ggacatcacc cagacgctgc ggaaggcgta 2760
ccagtcgccg gacatctata cggtgaccga ttccgccgac tttgaaccgc tccatgtgag 2820
caccgtctgg aacggtatcg cattggatct gatgctgtcc aacctgaacc agaaactgtg 2880
cggttggagc gaccccaacg caattcacac gttggaatat tggaaatcgg tggatgagaa 2940
catcaccttt atcctcatct acgaccaccc caaaagcatc ctgacgaact acttctcgga 3000
ccagaacatc tccagcaact atacctcgga gcatctgatc aaaaactggc tggcatacaa 3060
caccgccttg ctgcacttct tcctcaacaa ccggggtcgg tgcctgctgg tgtcgagcga 3120
acaggtgaag cgcaacgccg aggactgcat ccagcaactg caacacaaac tgaaactgaa 3180
attcgggttg tcgttctcca ataccatcaa ccactcgctg gagcagagcg tgaatgactt 3240
taagaccgcc gaagcctcca ttacgctgga aaaagaacat caggagatca tgtccctcag 3300
cggtattgac atcgggaccg gggatatcat tttcaagcaa agcgagacgg aggagtactt 3360
gatcttcaac gtcctgaacg actatcccga ttgcaaggaa ctgtactttg aattgcaatc 3420
gaacgccaac acccccttgc gggtgctgga gaaggaaaac tataagccgt cctttatttg 3480
ggagacgttc attaaacaac gccagatcac cctcgatatc gtgaacggtc tgtaccagag 3540
cagcaaaaag atcattctgg acaacgaact gcacacgtcc aaacagctga acgcctatca 3600
agccattctg aaagagctgt cggatagcaa ggaagaactg atccagtatg atctgatcat 3660
taaaaacaaa accatccagg tccaggaact ggagtgcgcg atcgagaact tcgagtccct 3720
gctgaaaaag gaacagaaca aaaatgaact gcaacaacag cgcctcgaaa agctgtcgtg 3780
cgaaaaagaa ttgctgctca atcagctgca tctggtgcag caaaagctcg aacagtactt 3840
catcgacaat caacgtctcg aaaagaaaca actgccggag ctgtatggtg cggccgaacg 3900
catcaagcaa gatatcggct accgcctggg tgcggtgatg gtgagccgct ccaagacgtt 3960
cctcggtctg atctcgattc cgtttgcgtt gatcagcgaa tggcggacct ggaagaagaa 4020
atatgattcg gagtaccaag tgagcctgcc gagcatcttc ctgtacgcgg ataaacacga 4080
agccgaacgg gtcaagaaac acctgagcta tcagctgggc aagctcatca tcaataagaa 4140
caattttccg ctcggtctga tcagcctgcc ctttagcatc taccgtacca tccgccaatt 4200
caaacgcacc aaaaacaatt cccaggtggg tgtcaagtac tgcggtaagt aattcgaaaa 4260
ttcactagta ggaggttaat aaatgagcat tttgaaccag gcaatcaatc tgtataagaa 4320
taagaactac cgccaagccc tctccctgtt tgaaaaagtg gcggaaatct atgatgtgag 4380
ctgggtggaa gccaatatca agctgtgcca aaccgccctg aatctgagcg aagaagtgga 4440
caagctgaat cggaaagcgg tcattgatat cgacgcggca accaaaatta tgtgcagcaa 4500
tgcaaaggcg atctcgctga atgaggtgga aaagaatgaa atcattagca aatatcggga 4560
aattaccgca aagaaatccg agcgcgccga attgaaagaa gtcgaaccca ttccgctgga 4620
ttggccgagc gacctgacct tgccgccgct gccggaaagc acgaacgact acgtctgggc 4680
agggaaacgt aaagaactgg atgattatcc gcgcaagcaa ctgatcatcg acggcctgtc 4740
catcgtgatt ccgacgtaca atcgcgccaa aatcctggcg atcaccctgg cctgcctctg 4800
caatcagaaa acgatttatg actatgaggt catcgtcgcg gatgacggtt ccaaggaaaa 4860
catcgaagag atcgtccgcg agttcgagtc gttgctgaac atcaaatacg tccgccagaa 4920
agactacggc taccagctgt gcgccgtgcg gaacctgggc ctgcgggcag cgaaatacaa 4980
ctacgtggcg atcttggact gcgatatggc gccgaacccg ttgtgggtgc agtcctatat 5040
ggaactcctg gccgtggatg ataacgtggc actgattggc ccgcgtaaat acatcgacac 5100
gtcgaagcat acctatctgg actttttgtc ccagaaaagc ctgatcaatg aaatcccgga 5160
gattattacc aataatcagg tcgcaggcaa ggtcgagcag aacaaatccg tcgattggcg 5220
catcgaacat ttcaagaata ccgacaatct gcgcctgtgc aacaccccgt tccggttctt 5280
tagcggtggc aatgtggcgt ttgcaaagaa gtggctgttt cgcgcgggtt ggtttgacga 5340
agagttcacg cattggggcg gtgaggataa tgagttcggc tatcggctgt accgcgaggg 5400
ttgttatttc cgtagcgtgg aaggcgcgat ggcatatcat caggaaccgc ccggtaagga 5460
gaacgaaacc gatcgcgcgg caggtaaaaa cattaccgtc cagctgttgc agcagaaggt 5520
gccctacttt tatcgcaaga aggagaaaat cgagagcgcc accctgaaac gtgtgcccct 5580
ggtgagcatc tacatccccg cgtataattg cagcaaatat atcgtgcgct gcgtcgaatc 5640
ggcactgaac caaacgatca ccgatctgga ggtctgcatc tgcgatgacg ggagcaccga 5700
tgatacgctg cgcatcctgc aagaacatta cgcaaaccac ccgcgcgtcc gtttcatcag 5760
ccagaaaaac aaaggcatcg gctccgcctc gaataccgca gtccgcctgt gccggggttt 5820
ctacatcggg cagctggatt ccgatgattt cctggagccc gatgccgtgg aactgtgtct 5880
ggatgaattt cgcaaagacc tgagcctcgc ctgcgtgtac accaccaatc gcaatattga 5940
tcgtgaaggt aacttgatta gcaatggcta caactggccg atttacagcc gcgaaaagct 6000
cacgagcgcg atgatctgcc accacttccg tatgttcacg gcgcgtgcat ggaacctcac 6060
cgaaggcttc aacgagagca tcagcaatgc ggtggattac gatatgtatt tgaaactcag 6120
cgaagtcggc ccgtttaagc atatcaataa gatttgctac aaccgtgtcc tgcacggcga 6180
gaacacgtcg atcaagaaac tggacatcca aaaggaaaac catttcaagg tggtgaacga 6240
aagcctgtcg cgcctcggta tcaaaaagta caaatactcg ccgctgacca acttgaatga 6300
atgtcgcaaa tatacctggg agaagatcga aaacgacttg taaactagtt tgaattcact 6360
taaggaggtt aataaatgaa aattgccgtg gccggcgtcg gctatgtggg tatcagcatt 6420
gcgatcctcc tctcccaaaa acacgacatc atcgccctgg acatcgaccc gaagaaggtc 6480
cagctcatta acaagaaaat ctcgccgatt tgcgacccgg aaatccagaa gtttctctcc 6540
aatcgtaagc tgaacctcta cgcgacgacg gaaaaatacg aggcatatcg cgatgcagac 6600
tacgtgatca tcgccacccc gacgaactat gatccgatta ataacaactt tgataccctg 6660
agcgtcgaaa gcgtcgcgtg tgacgtgctg tccattaacc cgaacgcgac catcattatc 6720
aaatccaccg tccccgtcgg gttcaccgaa cgcctgaagc gcgatctgaa cacgaataat 6780
atcatctttt ccccggagtt cctgcgcgaa ggcaaagccc tgtatgataa tctctatccg 6840
agccgcattg tcgtgggcga atcgtcggaa cgcgcacgga agttcgccga actcctgtcg 6900
gaaggtgcca tcaaaaagga tattccgatc ctgctgacgg attcgcccga ggcagaagcc 6960
atcaaactgt tcgcgaacac gtatctggcg atgcgtatcg cgtactttaa cgagctggac 7020
acctacgcga gcgtgcacgg cctggatacc aaacaaatca tcgaaggcgt ctccctcgat 7080
ccgcgcattg gtcaacatta caacaacccg tccttcggct acggcggtta ctgtctgccg 7140
aaggatacga agcagctgtt ggccaattat cgcgacgtcc cgcaaaacct gatccaggcc 7200
atcgtggatg cgaatacgac ccgtaaggac ttcgtggccg aggacatcct gtcccgtaag 7260
cccaaagtgg tcggtatcta tcgcctgatc atgaaggcgg gtagcgacaa tttccgggcc 7320
agcagcatcc agggggtcat gaaacgtttg aaggccaagg gtatcgagat tgtggtgtac 7380
gagccggtcc tgaaagaacc ctacttcttc ggttcctacg tcgagcgcga catcaattcc 7440
tttaaggagc gcgtcgatgt cattgtggcg aatcgccgca ccagcgaact ggaagatgtc 7500
tcggagaaag tctacacccg cgacctgttc ggcgtcgatt cgtaacttaa gttgctagca 7560
ggaggttaat aaatgttcaa taatctcaaa ttcttgtggc tgctcaaaaa gagccgctac 7620
gtccacgcgc tcgcggccat ccaggatgat tgccggttct ggcagtcgaa acgcatcctc 7680
gcgatgtatc gtctgaatat gtactggtcg ctgcataact tgacggatac cccgtccgat 7740
tggcgctgca aactggcaat caagatcgca aaaatcgcct gcggcgacat cagcctgacg 7800
cccgagctgc tgatggagtt caaggacgag ttcaccgata cccatcagaa agtggaactg 7860
gcgaaaaccc tggcgtccta ctcgccgacc tttagcctga gcctgttgga caacgtggac 7920
aactgcccgc tggacctgta taccgcactg caactccgga tcggcctgac ccaaaaggcc 7980
atctcgaccc tcgcccagat cgacgcatcc gatatcgtct atagcccgga tatcctgctg 8040
ctgcaaaata acgccttccg cgaaaccgcc gaaattagcc tgaatcggct gaatgaatac 8100
tataaatact tcggcctcag ccccgtggcc ttgacggaca acagctcccc gctctccccg 8160
tgcaacatca tcaccagcat cccgtacccg gcccagacgg ggccgttgat ctccatcctg 8220
atgaccacct ataatacggg tcgccgcgtg gaaaatgcgg tgatttcgct cctcaatcag 8280
acctaccgtt ccttcgagct gatcattgtg gatgacgcga gcaccgatga caccctgttt 8340
cgtctccagc ggctcgccct caaagacacg cgcatcaaga tcattagcct gccgcagaat 8400
gtcggcacct atgccgcgaa gcgtatcggc ttgatccaag cgaagggcga gttcgtcacc 8460
tgccacgatt cggatgactg gagccatccg gaaaagctgt tccgccaaat ctcccccttg 8520
ttgctcaatc cgaagctcat ctgctccatc tcggactggg tgcgcctgca agacaacggt 8580
attttctatg cccgcgcagt gtaccccttg aagcgtctga atccgtcgtc gctcctgttt 8640
cgccgtgccg acgtcttgca gaaggccggt gtctgggatt gtgtgaaaac gggtgcggat 8700
agcgaattta tcgcgcgtct gaagctgatc ttcggcgatt ccacggtgca tcggatcaag 8760
ttgccgctga cgctgggctc gcaccgcacc gactcgttga tgaacagccc gacgaccggc 8820
tacaccagcc aaggtatctc gccggatcgc cagaagtatt gggattcgtg gtcccgctgg 8880
cacatccagg cgctgcgtaa caaggaatcg ctgtacattg gtaacagcga tttcaccaac 8940
aagaaccgtc cgttttccgc acccgactcg atcctcgtgg acaccaacgc cattaagacg 9000
gccctgcaaa gcgcccacgt caatttcacg agcatctaag ctagcttctg cagttcttat 9060
ttaaatctat caatcgattt atcggatcc 9089
<210> 48
<211> 8016
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Sequence
<400> 48
cctgcaggta actagatctt gcatatttaa atcactatcg attacttaat taacacgtga 60
ggaggttaat aaatgagcga acgccacttg ccggatgacc agtcctcgac cattgatccg 120
tatctgatta cgagcgtccg ccagaccctg gccgaacaaa gcgcggcact gcaaaacctg 180
tccaaacaac tggatagcgg tcagtaccag cgcgtcctga atctcatcat gaattgtaaa 240
gggcacgtca tcctgagcgg catgggtaaa agcggccatg tgggccgcaa gatgtcggcg 300
accttggcct cgaccgggac gccctccttc tttattcatc cggcggaagc gttccatggt 360
gatctgggca tgatcacccc gtatgacctg ctcatcttga tttcggcgag cggtgagacg 420
gacgagatcc tgaaactggt gccgagcctg aagaacttcg gcaatcgcat catcgcaatc 480
accaataacg ggaatagcac cctggccaaa aatgcagatg cggtcctgga gctgcacatg 540
gcgaacgaaa cgtgcccgaa caatctcgcc ccgaccacct ccacgacgct cacgatggcg 600
atcggggacg cgctggccat cgcgatgatt caccagcgta agtttatgcc caatgacttt 660
gcacgctacc accccggtgg cagcctgggt cggcgcctgc tgacccgcgt cgccgacgtg 720
atgcaacatg atgtgccggc agtgcagctc gatgccagct tcaaaacggt cattcagcgc 780
atcacctcgg gctgccaggg tatggtgatg gtcgaagatg cggaaggtgg gctggcaggc 840
atcatcaccg atggcgatct gcggcgcttt atggagaaag aagacagcct gacgagcgca 900
acggccgcac agatgatgac ccgcgaaccg ctgaccttgc ccgaagacac catgatcatc 960
gaagcagaag agaagatgca gaaacaccgc gtctcgaccc tgctggtgac caacaaagca 1020
aataaggtga ccgggttggt gcgcattttc gattaacacg tgttgtcgac aggaggttaa 1080
taaatgctga tcaaagtgaa aagcgccgtc tcgtggatgc gtgcgcgtct gagcgcgatc 1140
agcctggcag atattcagaa gcacctggca aaaatcatta ttctggcacc catggcggtg 1200
ctgctgatct acttggcgat cttctcccag ccccgctata tgtcggaaag caaggtggcc 1260
atcaagcgca gcgacgatct caactccggc agcctgaact tcggcctgct gttgggtgcc 1320
tccaacccgt cgtccgccga agacgcactg tacctgaagg aatacatcaa cagcccggat 1380
atgctggccg cgctggataa acagctgaac ttccgcgaag cgttctccca ttcgggcctg 1440
gacttcctga accatctgtc caaggatgaa accgccgagg ggttcctgaa gtactataaa 1500
gatcgcatca acgtcagcta cgacgacaag accgggctgc tgaacatcca gacccagggc 1560
ttttcgcccg agttcgcgct gaaattcaac cagaccgtgc tcaaggaatc cgagcggttc 1620
atcaatgaaa tgtcgcaccg tatcgcccgc gatcaattgg cgtttgcgga aaccgaaatg 1680
gaaaaagcgc gccagcggct ggatgcatcg aaagccgaat tgttgtccta ccaagacaac 1740
aacaatgtgc tggacccgca ggcacaggcc caggcggcat ccaccctggt gaatacgctg 1800
atgggccaga aaattcagat ggaagccgac ctgcgcaacc tgctcacgta cctgcgcgag 1860
gatgcgcccc aagtcgtgag cgcccgcaat gcaattcaga gcctccaggc acagatcgac 1920
gaagaaaagt cgaaaattac cgcaccccag ggcgataaac tgaaccgcat ggccgtggat 1980
tttgaggaga tcaaatccaa ggtcgagttc aataccgagt tgtacaagct cacgctcacc 2040
agcatcgaaa agacccgtgt cgaagcggcc cgtaagctga aagtcctgag cgtgatctcg 2100
tccccgcagc tgccccagga aagctccttc ccgaatatcc cgtatttgat cgcgtgttgg 2160
ctgctggtgt gttgcctgct ctttggcacc ctgaaattgc tcctggcggt gattgaagac 2220
caccgtgact aagtcgactt ctcgaggagg ttaataaatg aagctgttta agtcgatcct 2280
gctgatcgca gcgtgccatg cagcacaggc gagcgcaacc atcgacatta atgccgatcc 2340
gaacctcacg ggtgccgcac cgttgaccgg catcctgaac gggcagaaaa gcgacaccca 2400
gaacatgagc ggcttcgata acaccccgcc ccccgcaccc ccggtcgtga tgagccgtat 2460
gttcggggcg cagctgttca acggtacgag cgcagactcg ggggcaaccg tgggtttcaa 2520
tccggactac atcctgaatc ccggcgattc catccaggtc cgcctgtggg gtgcgttcac 2580
cttcgatggc gcactccagg tggacccgaa gggcaacatc ttcctgccga atgtcggccc 2640
cgtcaaagtc gcaggtgtgt cgaactccca gttgaacgcg ctggtgacga gcaaggtgaa 2700
ggaagtctac cagagcaacg tgaacgtcta tgcgtcgctc ttgcaggcgc agccggtcaa 2760
ggtctatgtg accggctttg tccgcaaccc cggcctgtac ggcggtgtca cctccgacag 2820
cctgctgaac tacctgatca aggcgggtgg tgtggacccg gaacgcggca gctacgtgga 2880
catcgtcgtg aaacgcggca atcgtgtgcg ctcgaacgtc aacctctatg acttcctgct 2940
caacggcaaa ctggggctgt cccagtttgc ggacggtgat acgatcattg tgggtccgcg 3000
ccagcatacg ttctcggtgc agggcgatgt gttcaattcc tacgactttg aatttcgcga 3060
atcgagcatc ccggtcaccg aagcactgtc ctgggcacgt cccaaaccgg gtgcgaccca 3120
tatcacgatt atgcggaagc agggcctcca gaagcgctcg gaatattatc cgatctcgtc 3180
cgcaccgggg cgtatgctgc aaaacggtga taccctcatt gtctccaccg accgctatgc 3240
gggcaccatt caagtgcgtg tggaaggcgc acattccggg gaacacgcca tggtgctgcc 3300
ctacggtagc accatgcggg ccgtgctcga aaaagtgcgc ccgaactcca tgtcgcagat 3360
gaacgccgtg cagttgtatc ggccgagcgt cgcgcaacgg cagaaagaaa tgctgaattt 3420
gtccctgcaa aagctcgaag aggccagcct cagcgcacag agcagcacca aggaagaggc 3480
cagcctgcgt atgcaggaag cccaactgat ctcccgcttc gtcgcgaaag cccgcaccgt 3540
cgtgccgaag ggcgaagtga tcctcaatga aagcaacatt gactccgtcc tcctggagga 3600
cggcgacgtg atcaatattc ccgaaaagac gtcgttggtc atggtccacg gggaagtgct 3660
gttcccgaac gcggtgtcgt ggcagaaagg tatgacgacc gaggactaca tcgagaagtg 3720
cggtgggctg acccagaagt ccggcaacgc ccgtattatc gtcatccgtc agaacggcgc 3780
agcggtgaac gcagaagacg tcgattccct gaaacccggt gatgaaatta tggtgttgcc 3840
gaaatacgag tcgaagaaca tcgaagtgac gcgcggtatc agcaccattc tgtaccaact 3900
ggcggtgggc gcgaaagtga ttctgtcgct gtaactcgag gaggttaata aatgtcgaag 3960
gccgtgattg tgatcccggc acgctacggc agcagccgtc tgccgggcaa accgctgctg 4020
gatatcgtcg ggaaaccgat gatccagcac gtctacgaac gggccctgca agtggcaggc 4080
gtggcagagg tgtgggtcgc aaccgacgac ccgcgtgtgg agcaggcagt ccaggcgttc 4140
ggcggcaaag cgatcatgac ccgcaacgat catgagagcg gcaccgatcg cctggtggaa 4200
gtcatgcata aggtggaggc ggatatctat atcaacctgc aaggggatga gccgatgatt 4260
cgcccgcgtg acgtcgaaac cctgctgcaa ggtatgcggg acgacccggc gctgccggtg 4320
gcgaccctgt gtcatgcgat cagcgcggca gaagccgccg aaccgtccac cgtcaaggtc 4380
gtggtgaaca cgcggcagga cgccctgtat ttctcccgct cccccattcc gtacccgcgc 4440
aacgccgaga aggcgcgcta cctgaagcac gtcgggatct acgcctatcg gcgggatgtc 4500
ctgcaaaatt acagccagtt gccggagtcc atgcccgaac aggccgaatc cctggagcaa 4560
ctgcggctga tgagcgcggg cattaacatt cgcaccttcg aggtcgccgc gaccggtccc 4620
ggcgtcgata ccccggcgtg cttggagaag gtccgggccc tgatggcgca ggagctcgcg 4680
gagaacgcat gattggcatt tatagccccg gcatttggcg tattccgcac ctggaaaaat 4740
tcctcgccca gccctgccaa aagctgtcgc tgctgcgccc ggtcccgcag gaagtggatg 4800
caatcgcggt gtgggggcac cgcccctcgg ccgcaaagcc ggtggccatc gccaaagccg 4860
caggcaagcc ggtgatccgc ttggaggatg gtttcgtccg ctcgctggac ctgggcgtga 4920
acggtgaacc gcccctctcg ctcgtcgtgg atgactgcgg catttactac gacgcctcga 4980
aaccgagcgc gctggaaaaa ctcgtgcagg acaaggccgg caacgcggcc ctggcggatc 5040
aggcgcgcga ggcgatgcac accattgtga cgggcgacat gagcaagtac aacctggcac 5100
cggcgttcgt ggcggatgaa agcgagcgca cgaacatcgt gctggtggtg gaccagacct 5160
tcaatgacat gagcgtgacc tacggcaacg caggccccca tgagttcgcc gcaatgctgg 5220
aagcagcgat ggcggaaaac ccgcaggcag aaatctgggt caaagtgcat cccgatgtcc 5280
tggaagggaa aaagaccggc tacttcgcgg acttgcgtgc cacccagcgc gtgcgcctga 5340
ttgcggaaaa cgtgtcgccg cagtccctgc tgcgtcatgt gtcccgcgtg tacgtcgtga 5400
cctcccagta cggttttgaa gccctgctgg ccggtaagcc cgtgacctgc tttggccaac 5460
cctggtatgc agggtggggc ctcaccgatg accgccaccc ccaatcggcg ctgctgtcgg 5520
cgcgtcgcgg ctcggccacc ctggaggaac tgttcgcagc ggcctatctg cgctattgcc 5580
gctacattga tccgcagacc ggggaggtgt cggccctgtt cacggtgctc caatggctcc 5640
agctgcaacg tcgtcacctg caacagcgga atggttatct ctgggtgccg ggcctgaccc 5700
tgtggaaaag cgcgatcctg aagcccttcc tgcaaacggc cacgaatcgt ctctcctttt 5760
cccgtcgctg taccgcagca agcgcctgcg tcgtgtgggg cgtgaaaggc gaacagcaat 5820
ggcgtgcgga ggcacagcgc aaatccctgc cgctgtggcg catggaagac ggcttcctgc 5880
gcagctccgg cctggggagc gatctgctgc cgccgttgag cctggtcctg gataagcgcg 5940
gtatctatta cgatgccacc cgtccgtcgg aactggaggt cctgctgaat cacagccagc 6000
tgaccctcgc gcaccagatg cgcgcggaaa agttgcgcca acgtctggtg gaaagcaaat 6060
tgagcaaata taacctgggg gccgatttca gcctcccggc agaagcgaag gacaagaaag 6120
tcatcctggt gccgggccag gtggaagacg atgcgtcgat taagacgggc accgtgtcga 6180
tcaagtcgaa tctggagctg ctgcgcaccg tgcgggaacg taatccgcac gcctacatca 6240
tctacaagcc gcaccccgat gtgctcgtcg gcaaccgtaa gggtgacatt ccggcggaac 6300
agatcgcgga actcgcagac taccaggcac tggatgccga tatcattcag tgtattcagc 6360
gtgcggacga ggtgcacacg atgacgagcc tcagcggctt tgaagcattg ctgcacggta 6420
aacaggtgca ctgctacggc ctgccgttct acgcctcgtg gggcctgacc gtcgatgagc 6480
accactgccc ccgtcgcgag cggcggctga ccatcgccga cctgatctat caagccctga 6540
ttgtctatcc cacctatatt catccgacgc ggttgcagcc gatcacggtg gaggaagcgg 6600
cagaatatct gatcaaaacg ccccgcaaac ccatctttat cacccgcaag aaagccggcc 6660
gtgtgattcg ctactatcgc aagttgatca tgttctgcaa agtgcgcttt ggttaagagc 6720
tcgccgaaaa cgcttaacac cgcgtgttag gaggttaata aatgcacggc aatgcgctga 6780
cggtgctgtt gagcggtaaa aagtacctcc tgctccaagg tccgatgggt ccgttcttca 6840
acgatgtggc ggaatggttg gagagcctcg gtcgcaacgc ggtcaacgtc gtctttaatg 6900
gcggtgatcg cttctactgc cgccaccgcc aatacctggc gtactaccaa accccgaagg 6960
agttccccgg ttggctgcgg gacttgcatc gtcagtatga ctttgacacg attttgtgtt 7020
tcggtgactg ccgcctgctg cacaaggagg ccaaacgctg ggccaagtcg aaggggattc 7080
gttttctggc cttcgaggaa ggctacctgc gtccgcaatt tatcaccgtg gaagaaggcg 7140
gtgtgaacgc ctatagcagc ttgccccgcg atccggactt ttaccgcaaa ttgcccgata 7200
tgccgacgcc gcacgtcgag aacctgaaac cgagcaccat gaagcgcatc ggccacgcca 7260
tgtggtatta cctgatgggt tggcactatc gtcacgaatt tccgcgctat cgccaccaca 7320
aatcgttcag cccgtggtat gaagcgcgct gctgggtccg cgcctactgg cgcaaacagc 7380
tgtataaggt cacccaacgc aaggtcctcc cccgcctgat gaacgagctg gatcagcgct 7440
attacctggc ggtcctgcaa gtgtacaacg acagccagat ccgcaaccat agcaactata 7500
atgatgtgcg tgattacatc aacgaagtga tgtacagctt ttcccgcaag gcccccaagg 7560
agtcctatct ggtgatcaaa catcacccga tggatcgcgg gcaccgcctg taccgcccgt 7620
tgatcaagcg tctgtcgaag gaatacggtt tggatgaacg tgtcatctat gtgcacgatc 7680
tgcccatgcc ggagctgttg cgccacgcca aagcggtggt caccatcaat agcacggccg 7740
gcatttccgc gttgatccac aacaagcccc tgaaagtcat gggcaacgcc ttgtacgata 7800
tcaagggtct gacgtaccag gggcatttgc atcagttctg gcaagccgac tttaaaccga 7860
acatgaagtt gtttaagaaa tttcgcggct acttgctggt gaagacccag gtcaatgcgg 7920
tgtactacgg cgaaatgatc tttaacaaaa ttaagaagta taagaaacgt taacaccgcg 7980
tgttctgcag aagtttaaac aatctagatt ggatcc 8016
<210> 49
<211> 4213
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Sequence
<400> 49
gaattcaaag cttattagga ggattaataa atgttgaaga acttgacctt cgatcacatc 60
ctgagcctga gcaagaaaga agataaaatc aaactggtgc agctcatcgt caaccatctg 120
gacgagcgca cgctgtcctg catcaagaac atttcgaccg gcaaaggctt taatgcgcat 180
ctcaaaatcc tggagttgtt cgacttgtgg ctgtcggaat acttcgagta tattatcatc 240
ccgaacaagt tgtcgaacgc agggacgttt tacttcgcgt tcttctttcc ggagttctac 300
atcaaacgtt tcaacaagaa taacacggac ctgtccagct tgggtgatac cagcttcaag 360
cgcctgatga gccgtccgca catccccaac tacgtgtata atctcgtgat caactcgaac 420
ggctgcacct tcaattcgat taagttgttg ctgctcgcac tgtccctgac cagcaaacgc 480
ttctacgaaa ccccgcagca ggagcgcaac ttcttgtgcc acatcaatga aattgtcctg 540
gcaaacgccg acgaatatag cggcatcatt tcctgtatca tcaaatcgcg catctcggtg 600
attgatgatt tcattagcag caatgtgagc ctgaatacca atcgccagat cgcattgttc 660
atcacggggc agtcgcgcgg tttcatcgac gcgctgccga acctggtcag caagatcacg 720
attccgtcgg acgtcgatgt gtttatctcc acctggaagg atatcgggca tacgcaactg 780
agcaaagaac gcatctgccg catttttgat tcggaagccg cccaatacgt gtccgaaccc 840
gacaattaca gcttcgtgga tgaacattat gatgagctga aagacctgtc gctctcctcc 900
tataagaaca ataacctgga agaaatctac tcgtcgttct tctccggctg caactccgtc 960
ctgatcaata tcaaggatga tggcgaatat ccgtataaca agatgagcaa cgcggaaaag 1020
atgtactacc acaattcctt ttggttctgc tcgctgaaaa atcataactg ggataagtac 1080
cgctgcatca tcaaaatccg ccccgatgcc ctgctgcaag tggataacgt gaccatcaac 1140
gatatcgacg tggacgacag cgtgtattgc gaggacagca acggttggat ttttcgcgag 1200
tgggggtttg gcatcggcga tcagctgttc tatggcgacc cggacatcat gaagaaactg 1260
atgtgcgtgc atggtctgga taacatttac tcgcaactga cgagcctgat ctcgtcgtcg 1320
aatgtgtact actcggggca catcaacgtc ggcttgtgcg cctgggccaa tgtgtacgac 1380
tgtaaagtga gcaatctgaa gatcaagaat attgtggccc cgcgtaaaat cagcctggag 1440
caaattctga gcctgcggga ataaaagctt accttggttt atattaagga ggttaataaa 1500
tgaagaaaat tatcgtcgat ctggataata cgattagctt caatctgagc ggcaaataca 1560
gccatgcaac ccccaataag aaattgatcg aaaaactcta tgagtacaag ctgaacggtt 1620
tctacatcgt catctttacc gcgcgcaata tgcggacgta caaggaaaac attggcaaga 1680
tcaatattca tacgctgccg gtgatcatcg actggctgaa cgaaaaccgc gtcccgtatg 1740
acgaggtgat tgtcggcaag ccgtggtgcg gcgacgaggg cttctatgtg gacgatcggg 1800
ccatccggcc ctcggaactg tgcaatatga ccttggaaga aatctctaat atgttagaac 1860
aggagaaaaa atgcttctaa taatgtctgg tagctacgtg cagcaggaat tgggcgcgga 1920
gttcggtagc atcccgccgt cgttcctgcc gttggcaaac aagcgtctgt tcaagcacca 1980
ggtcagcttg gggcacgatg gccatgcgat ctacctggtc ctgccggaag atttcgtgtt 2040
cgacaaacac gattacgaat ggttgctgcg caataaagtg acgatgattc cggtcgatag 2100
caatctgacc ctgggccagg caatcgtcac ggcctggaat ctgatcggcg acaaagatga 2160
taaaggcctg caactgctgt ttggtgatac cttgttcaag aagattccgg cgggtgatga 2220
cctcgtggcg atctcccatt ccgatgataa ctaccagtgg tcctttttct atgagacgga 2280
attgcgggca gtctcccgcg aggacaacaa aaatgtcatc tgcgggtact tctcgttcag 2340
caaacccaat ttcttcattc gcgaactggt caccagcaag tttgacttca cggcagccct 2400
gaaaaagtac catgattcgt acagcttggc gtcgatttac gtcagcgact ggctcgattt 2460
cggtcacatc aatacctact ataagtcgaa agtccagtac acgacccagc gtgccttcaa 2520
tgagctgtgc atcacgacca agtccgtgat taagtcctcc tcgaatgaaa gcaagatcga 2580
ggcagaatcg aaatggttcg agacgattcc gggtgaactg aaaatctaca ccccgatgtt 2640
gctggaaccg ttcgatcaca ttcgcaaaag ctacaaactc gaatacctgt acaataccac 2700
cctgaacgaa ctgttcgtgt tctcccgcct gccgaataat atcctgacca acattctgat 2760
cagctgcctg gattttatcg acctctgcaa agagtatcat agcattgata cggataaaaa 2820
cattctccag gatctgtttt acgaaaagac catcgagcgc gtcagcaagt atatcaccga 2880
tctcaacatt gacccgaacg cgaaatggaa ttttaacaac aatattagcg tgagcatcaa 2940
cgacatcctg tacgacacga acaaattcat tccgtccgaa ctgcaataca agaccatcat 3000
gcacggggac ctgtgcttca gcaatattat ctttaacttc cgcacgggcc ggattcaggt 3060
gttcgatccg cgcggtctga accacagcgg cgaaatctcg atctatggcg atttccgcta 3120
cgatattgcg aaactgtcgc actccattct aggcctgtat gactggatca tcgcgggcta 3180
ctacattatc aacaaaaaga ataagaccca ttccattgag ttcaaaatca atattgataa 3240
caaactcttt gaaatccaat cgaccttcgt gtccattatt aaggaaaaat acagcatctc 3300
cgaaaagtcg ctgtacgcca tgcaaattca tctgttcttg tcgatgctgc cgttgcatag 3360
cgacgacaag aagcggcagg acgccctgtt tgcgaatgcc ttccgcctgt atgaaatctt 3420
taaggaggca gcagtatgat tattatcccg atggcaggta tgtcgagccg ctttttcaaa 3480
gccggttata gcaaaccgaa gtatatgctg gagctgaatg gcgagtttct gttcgatttg 3540
tgcctcaaga gcttcaaact gtacttcgag acggaacact ttgtcttcat cctccgtgac 3600
gtgtttaaca cgaaatcgtt cgtgctccag cgtatcgcca gcctgggcat taatagctat 3660
acgctgatca ccctggataa ggaaacgcgg ggtcaagcag agacggtcta tttggccatc 3720
tcgaaactgt ttaatatcga acagccgatc accatcttca acatcgacac gattcgtccc 3780
aacttcatct tcaccaagtt cgagggcgag aatgaatgtt acattgaagt gtttcgcggc 3840
gatggcgaca actggtcgtt cgtgatgccc agcaatgacg tcaaaaatga agtgattgcc 3900
acgtccgaaa agaaacagat tagcaatttg tgttgcaccg ggctgtacca cttcagcacg 3960
atcaaaaact ttatttccgc gtatgaacat tacaagaacc tgccgcaaga aaactgggat 4020
gcgggcgagc tgtatattgc gccgatctac aattacctga tctccaatgg gatcaaagtg 4080
tattataccg aaatcaataa gtccgacgtg atcttctgcg gcaccccgcg tgagtatgag 4140
aatctccagg ggaaaaagta agaatgcctt tcgtctgtac gaaatcttca aagaagctgc 4200
ggtataagaa ttc 4213
<210> 50
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Primer
<400> 50
ggcgcgccag cgtcctgctg tttgatgacg 30
<210> 51
<211> 26
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Primer
<400> 51
aagcttgcca ggagattgac gccagc 26
<210> 52
<211> 29
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Primer
<400> 52
ggcgcgccgg aatcctcagt tggacccgc 29
<210> 53
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Primer
<400> 53
tctagaactt taccctcacg gtccagcg 28
<210> 54
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Primer
<400> 54
ccgaattgtt atcttgcctg c 21
<210> 55
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Primer
<400> 55
ggtagcatct ctttgggtat cg 22
<210> 56
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Primer
<400> 56
gaacagcggt tgagtcaggg 20
<210> 57
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Primer
<400> 57
ggcagaaagc acatagcgac c 21
<210> 58
<211> 31
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Primer
<400> 58
ttaattaaca aaggtttcgt taacaaagcg g 31
<210> 59
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Primer
<400> 59
ttaattaaat tggttttcgc tcgctcgc 28
<210> 60
<211> 27
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Primer
<400> 60
aagcttggaa gacgccatct atggtgg 27
<210> 61
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Primer
<400> 61
tctagagaag cccgccagca ccgc 24
<210> 62
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Primer
<400> 62
ccgttgatgt ggtgactgcc 20
<210> 63
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Primer
<400> 63
aaacagcagc gttctcaccg 20
<210> 64
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Primer
<400> 64
cctgcagggt cgaacactcg caagaccagg 30
<210> 65
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Primer
<400> 65
cctgcaggta tccgcatcat cgtgctgacg 30
<210> 66
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Primer
<400> 66
ccttggtgat ggtgtggcg 19
<210> 67
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Primer
<400> 67
gcccatccac gactcgaacg 20
<210> 68
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Primer
<400> 68
gaccaatgac acgatgatcg 20
<210> 69
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Primer
<400> 69
gcatccgcta caacatgctc 20
<210> 70
<211> 26
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Primer
<400> 70
agatctggcg gtaacagggg attggc 26
<210> 71
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Primer
<400> 71
gcggccgcca agacggtatt cgggctgc 28
<210> 72
<211> 29
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Primer
<400> 72
gcggccgcga tctgctggtg ttcttccgc 29
<210> 73
<211> 26
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Primer
<400> 73
agatctccta ccgaccaggc attggc 26
<210> 74
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Primer
<400> 74
ccgaatttcc gagcctgg 18
<210> 75
<211> 17
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Primer
<400> 75
gcccgctcgc ttcgtcg 17
<210> 76
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Primer
<400> 76
acgtggatgc ggtcgtcgc 19
<210> 77
<211> 17
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Primer
<400> 77
ggggcttgcg ggtcggc 17
<210> 78
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Primer
<400> 78
cgtatgctga gaatgacgac c 21
<210> 79
<211> 470
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Sequence
<400> 79
ttcgaattgt cgacttaggc gcgccactcg agccttctta gaaggccatc ctgacggatg 60
gcctttttgc gtttctacaa actcttcata tgtaatgaaa gcttgtcagc ctgcagtgtc 120
cggtttgata gggataagtc cagccttgca agaagcggat acaggagtgc aaaaaatggc 180
tatctctaga aaggcctacc ccttaggctt tatgcaacag aaacaataat cctgcaggtc 240
tattaattaa ccaacatcga ttacactgga tccttaaatg attcggctac gcgacttgcg 300
tagccgattt ttttgattct tgtacattac ttagtatgct tcacttgtgg atacttcgag 360
taattgacta gatcagtgac acggtaccag agagaaaaaa cgtgcgccga ctgacggcgc 420
acgaagacat taacgatgag ctctggcgcg ccgatagtcg acgattcgaa 470
<210> 80
<211> 127
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Sequence
<400> 80
ttaattaatg tttctgttgc ataaagccta aggggtaggc ctttctagag atagccattt 60
tttgcactcc tgtatccgct tcttgcaagg ctggacttat ccctatcaaa ccggacactg 120
catcgat 127
<210> 81
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Primer
<400> 81
aaggcgacaa ggtgctgatg 20
<210> 82
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Primer
<400> 82
caatgcgacg gatgctttcg 20
<210> 83
<211> 211
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Sequence
<400> 83
Met Gly Ser Leu Asn Lys Gly Tyr Asn Val Val Ile Ile Asp Asn Leu
1 5 10 15
Ile Asn Ser Ser Cys Glu Ser Ile Arg Arg Ile Glu Leu Ile Ala Lys
20 25 30
Lys Lys Val Thr Phe Tyr Glu Leu Asn Ile Asn Asn Glu Lys Glu Val
35 40 45
Asn Gln Ile Leu Lys Lys His Lys Phe Asp Cys Ile Met His Phe Ala
50 55 60
Gly Ala Lys Ser Val Ala Glu Ser Leu Ile Lys Pro Ile Phe Tyr Tyr
65 70 75 80
Asp Asn Asn Val Ser Gly Thr Leu Gln Leu Ile Asn Cys Ala Ile Lys
85 90 95
Asn Asp Val Ala Asn Phe Ile Phe Ser Ser Ser Ala Thr Val Tyr Gly
100 105 110
Glu Ser Lys Ile Met Pro Val Thr Glu Asp Cys His Ile Gly Gly Thr
115 120 125
Leu Asn Pro Tyr Gly Thr Ser Lys Tyr Ile Ser Glu Leu Met Ile Arg
130 135 140
Asp Ile Ala Lys Lys Tyr Ser Asp Thr Asn Phe Leu Cys Leu Arg Tyr
145 150 155 160
Phe Asn Pro Thr Gly Ala His Glu Ser Gly Met Ile Gly Glu Ser Pro
165 170 175
Ala Asp Ile Pro Ser Asn Leu Val Pro Tyr Ile Leu Gln Val Ala Met
180 185 190
Gly Lys Leu Glu Lys Leu Met Val Phe Gly Gly Asp Tyr Pro Thr Lys
195 200 205
Asp Gly Thr
210
<210> 84
<211> 220
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Sequence
<400> 84
Met Gly Ser Trp Leu Ala Tyr Asn Thr Ala Leu Leu His Phe Phe Leu
1 5 10 15
Asn Asn Arg Gly Arg Cys Leu Leu Val Ser Ser Glu Gln Val Lys Arg
20 25 30
Asn Ala Glu Asp Cys Ile Gln Gln Leu Gln His Lys Leu Lys Leu Lys
35 40 45
Phe Gly Leu Ser Phe Ser Asn Thr Ile Asn His Ser Leu Glu Gln Ser
50 55 60
Val Asn Asp Phe Lys Thr Ala Glu Ala Ser Ile Thr Leu Glu Lys Glu
65 70 75 80
His Gln Glu Ile Met Ser Leu Ser Gly Ile Asp Ile Gly Thr Gly Asp
85 90 95
Ile Ile Phe Lys Gln Ser Glu Thr Glu Glu Tyr Leu Ile Phe Asn Val
100 105 110
Leu Asn Asp Tyr Pro Asp Cys Lys Glu Leu Tyr Phe Glu Leu Gln Ser
115 120 125
Asn Ala Asn Thr Pro Leu Arg Val Leu Glu Lys Glu Asn Tyr Lys Pro
130 135 140
Ser Phe Ile Trp Glu Thr Phe Ile Lys Gln Arg Gln Ile Thr Leu Asp
145 150 155 160
Ile Val Asn Gly Leu Tyr Gln Ser Ser Lys Lys Ile Ile Leu Asp Asn
165 170 175
Glu Leu His Thr Ser Lys Gln Leu Asn Ala Tyr Gln Ala Ile Leu Lys
180 185 190
Glu Leu Ser Asp Ser Lys Glu Glu Leu Ile Gln Tyr Asp Leu Ile Ile
195 200 205
Lys Asn Lys Thr Ile Gln Val Gln Glu Leu Glu Cys
210 215 220
<210> 85
<211> 182
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Sequence
<400> 85
Met Arg Gly Ser His His His His His His Gly Ser Ala Ile Ser Leu
1 5 10 15
Asn Glu Val Glu Lys Asn Glu Ile Ile Ser Lys Tyr Arg Glu Ile Thr
20 25 30
Ala Lys Lys Ser Glu Arg Ala Glu Leu Lys Glu Val Glu Pro Ile Pro
35 40 45
Leu Asp Trp Pro Ser Asp Leu Thr Leu Pro Pro Leu Pro Glu Ser Thr
50 55 60
Asn Asp Tyr Val Trp Ala Gly Lys Arg Lys Glu Leu Asp Asp Tyr Pro
65 70 75 80
Arg Lys Gln Leu Ile Ile Asp Gly Leu Ser Ile Val Ile Pro Thr Tyr
85 90 95
Asn Arg Ala Lys Ile Leu Ala Ile Thr Leu Ala Cys Leu Cys Asn Gln
100 105 110
Lys Thr Ile Tyr Asp Tyr Glu Val Ile Val Ala Asp Asp Gly Ser Lys
115 120 125
Glu Asn Ile Glu Glu Ile Val Arg Glu Phe Glu Ser Leu Leu Asn Ile
130 135 140
Lys Tyr Val Arg Gln Lys Asp Tyr Gly Tyr Gln Leu Cys Ala Val Arg
145 150 155 160
Asn Leu Gly Leu Arg Ala Ala Lys Tyr Asn Tyr Val Ala Ile Leu Asp
165 170 175
Cys Asp Met Lys Leu Asn
180
<210> 86
<211> 124
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Sequence
<400> 86
Met Gly Ser Val Asp Leu Asp Asn Thr Ile Ser Phe Asn Leu Ser Gly
1 5 10 15
Lys Tyr Ser His Ala Thr Pro Asn Lys Lys Leu Ile Glu Lys Leu Tyr
20 25 30
Glu Tyr Lys Leu Asn Gly Phe Tyr Ile Val Ile Phe Thr Ala Arg Asn
35 40 45
Met Arg Thr Tyr Lys Glu Asn Ile Gly Lys Ile Asn Ile His Thr Leu
50 55 60
Pro Val Ile Ile Asp Trp Leu Asn Glu Asn Arg Val Pro Tyr Asp Glu
65 70 75 80
Val Ile Val Gly Lys Pro Trp Cys Gly Asp Glu Gly Phe Tyr Val Asp
85 90 95
Asp Arg Ala Ile Arg Pro Ser Glu Leu Cys Asn Met Thr Leu Glu Glu
100 105 110
Ile Ser Asn Met Leu Glu Gln Glu Lys Lys Cys Phe
115 120
<210> 87
<211> 199
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Sequence
<400> 87
Met Gly Ser Pro Glu Asp Phe Val Phe Asp Lys His Asp Tyr Glu Trp
1 5 10 15
Leu Leu Arg Asn Lys Val Thr Met Ile Pro Val Asp Ser Asn Leu Thr
20 25 30
Leu Gly Gln Ala Ile Val Thr Ala Trp Asn Leu Ile Gly Asp Lys Asp
35 40 45
Asp Lys Gly Leu Gln Leu Leu Phe Gly Asp Thr Leu Phe Lys Lys Ile
50 55 60
Pro Ala Gly Asp Asp Leu Val Ala Ile Ser His Ser Asp Asp Asn Tyr
65 70 75 80
Gln Trp Ser Phe Phe Tyr Glu Thr Glu Leu Arg Ala Val Ser Arg Glu
85 90 95
Asp Asn Lys Asn Val Ile Cys Gly Tyr Phe Ser Phe Ser Lys Pro Asn
100 105 110
Phe Phe Ile Arg Glu Leu Val Thr Ser Lys Phe Asp Phe Thr Ala Ala
115 120 125
Leu Lys Lys Tyr His Asp Ser Tyr Ser Leu Ala Ser Ile Tyr Val Ser
130 135 140
Asp Trp Leu Asp Phe Gly His Ile Asn Thr Tyr Tyr Lys Ser Lys Val
145 150 155 160
Gln Tyr Thr Thr Gln Arg Ala Phe Asn Glu Leu Cys Ile Thr Thr Lys
165 170 175
Ser Val Ile Lys Ser Ser Ser Asn Glu Ser Lys Ile Glu Ala Glu Ser
180 185 190
Lys Trp Phe Glu Thr Ile Pro
195
<210> 88
<211> 184
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Sequence
<400> 88
Met Arg Gly Ser His His His His His His Gly Ser Ala Ser Leu Gly
1 5 10 15
Ile Asn Ser Tyr Thr Leu Ile Thr Leu Asp Lys Glu Thr Arg Gly Gln
20 25 30
Ala Glu Thr Val Tyr Leu Ala Ile Ser Lys Leu Phe Asn Ile Glu Gln
35 40 45
Pro Ile Thr Ile Phe Asn Ile Asp Thr Ile Arg Pro Asn Phe Ile Phe
50 55 60
Thr Lys Phe Glu Gly Glu Asn Glu Cys Tyr Ile Glu Val Phe Arg Gly
65 70 75 80
Asp Gly Asp Asn Trp Ser Phe Val Met Pro Ser Asn Asp Val Lys Asn
85 90 95
Glu Val Ile Ala Thr Ser Glu Lys Lys Gln Ile Ser Asn Leu Cys Cys
100 105 110
Thr Gly Leu Tyr His Phe Ser Thr Ile Lys Asn Phe Ile Ser Ala Tyr
115 120 125
Glu His Tyr Lys Asn Leu Pro Gln Glu Asn Trp Asp Ala Gly Glu Leu
130 135 140
Tyr Ile Ala Pro Ile Tyr Asn Tyr Leu Ile Ser Asn Gly Ile Lys Val
145 150 155 160
Tyr Tyr Thr Glu Ile Asn Lys Ser Asp Val Ile Phe Cys Gly Thr Pro
165 170 175
Arg Glu Tyr Glu Asn Leu Gln Gly
180
<210> 89
<211> 195
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Sequence
<400> 89
Met Gly Ser Val Gly Phe Thr Glu Arg Leu Lys Arg Asp Leu Asn Thr
1 5 10 15
Asn Asn Ile Ile Phe Ser Pro Glu Phe Leu Arg Glu Gly Lys Ala Leu
20 25 30
Tyr Asp Asn Leu Tyr Pro Ser Arg Ile Val Val Gly Glu Ser Ser Glu
35 40 45
Arg Ala Arg Lys Phe Ala Glu Leu Leu Ser Glu Gly Ala Ile Lys Lys
50 55 60
Asp Ile Pro Ile Leu Leu Thr Asp Ser Pro Glu Ala Glu Ala Ile Lys
65 70 75 80
Leu Phe Ala Asn Thr Tyr Leu Ala Met Arg Ile Ala Tyr Phe Asn Glu
85 90 95
Leu Asp Thr Tyr Ala Ser Val His Gly Leu Asp Thr Lys Gln Ile Ile
100 105 110
Glu Gly Val Ser Leu Asp Pro Arg Ile Gly Gln His Tyr Asn Asn Pro
115 120 125
Ser Phe Gly Tyr Gly Gly Tyr Cys Leu Pro Lys Asp Thr Lys Gln Leu
130 135 140
Leu Ala Asn Tyr Arg Asp Val Pro Gln Asn Leu Ile Gln Ala Ile Val
145 150 155 160
Asp Ala Asn Thr Thr Arg Lys Asp Phe Val Ala Glu Asp Ile Leu Ser
165 170 175
Arg Lys Pro Lys Val Val Gly Ile Tyr Arg Leu Ile Met Lys Ala Gly
180 185 190
Ser Asp Asn
195
<210> 90
<211> 247
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Sequence
<400> 90
Met Arg Gly Ser His His His His His His Gly Ser Asp Asp Thr Leu
1 5 10 15
Phe Arg Leu Gln Arg Leu Ala Leu Lys Asp Thr Arg Ile Lys Ile Ile
20 25 30
Ser Leu Pro Gln Asn Val Gly Thr Tyr Ala Ala Lys Arg Ile Gly Leu
35 40 45
Ile Gln Ala Lys Gly Glu Phe Val Thr Cys His Asp Ser Asp Asp Trp
50 55 60
Ser His Pro Glu Lys Leu Phe Arg Gln Ile Ser Pro Leu Leu Leu Asn
65 70 75 80
Pro Lys Leu Ile Cys Ser Ile Ser Asp Trp Val Arg Leu Gln Asp Asn
85 90 95
Gly Ile Phe Tyr Ala Arg Ala Val Tyr Pro Leu Lys Arg Leu Asn Pro
100 105 110
Ser Ser Leu Leu Phe Arg Arg Ala Asp Val Leu Gln Lys Ala Gly Val
115 120 125
Trp Asp Cys Val Lys Thr Gly Ala Asp Ser Glu Phe Ile Ala Arg Leu
130 135 140
Lys Leu Ile Phe Gly Asp Ser Thr Val His Arg Ile Lys Leu Pro Leu
145 150 155 160
Thr Leu Gly Ser His Arg Thr Asp Ser Leu Met Asn Ser Pro Thr Thr
165 170 175
Gly Tyr Thr Ser Gln Gly Ile Ser Pro Asp Arg Gln Lys Tyr Trp Asp
180 185 190
Ser Trp Ser Arg Trp His Ile Gln Ala Leu Arg Asn Lys Glu Ser Leu
195 200 205
Tyr Ile Gly Asn Ser Asp Phe Thr Asn Lys Asn Arg Pro Phe Ser Ala
210 215 220
Pro Asp Ser Ile Leu Val Asp Thr Asn Ala Ile Lys Thr Ala Leu Gln
225 230 235 240
Ser Ala His Val Asn Phe Thr
245
<210> 91
<211> 225
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Sequence
<400> 91
Met Gly Ser Met Ile Lys Ile Glu Asn Leu Thr Lys Ser Tyr Arg Thr
1 5 10 15
Pro Val Gly Arg His Tyr Val Phe Lys Asn Leu Asn Ile Glu Ile Pro
20 25 30
Ser Gly Lys Ser Val Ala Phe Ile Gly Arg Asn Gly Ala Gly Lys Ser
35 40 45
Thr Leu Leu Arg Met Ile Gly Gly Ile Asp Arg Pro Asp Ser Gly Lys
50 55 60
Ile Ile Thr Asn Lys Thr Ile Ser Trp Pro Val Gly Leu Ala Gly Gly
65 70 75 80
Phe Gln Gly Ser Leu Thr Gly Arg Glu Asn Val Lys Phe Val Ala Arg
85 90 95
Leu Tyr Ala Lys Gln Glu Glu Leu Lys Glu Lys Ile Glu Phe Val Glu
100 105 110
Glu Phe Ala Glu Leu Gly Lys Tyr Phe Asp Met Pro Ile Lys Thr Tyr
115 120 125
Ser Ser Gly Met Arg Ser Arg Leu Gly Phe Gly Leu Ser Met Ala Phe
130 135 140
Lys Phe Asp Tyr Tyr Ile Val Asp Glu Val Thr Ala Val Gly Asp Ala
145 150 155 160
Arg Phe Lys Glu Lys Cys Ala Gln Leu Phe Lys Glu Arg His Lys Glu
165 170 175
Ser Ser Phe Leu Met Val Ser His Ser Leu Asn Ser Leu Lys Glu Phe
180 185 190
Cys Asp Val Ala Ile Val Phe Lys Asp Asp Asn Ala Val Ser Phe His
195 200 205
Glu Asp Val Gln Glu Gly Ile Glu Glu Tyr Ile Thr Glu Gln Asn Asn
210 215 220
Tyr
225
<210> 92
<211> 159
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Sequence
<400> 92
Met Arg Gly Ser His His His His His His Gly Ser Leu Ala Ile Ala
1 5 10 15
Met Ile His Gln Arg Lys Phe Met Pro Asn Asp Phe Ala Arg Tyr His
20 25 30
Pro Gly Gly Ser Leu Gly Arg Arg Leu Leu Thr Arg Val Ala Asp Val
35 40 45
Met Gln His Asp Val Pro Ala Val Gln Leu Asp Ala Ser Phe Lys Thr
50 55 60
Val Ile Gln Arg Ile Thr Ser Gly Cys Gln Gly Met Val Met Val Glu
65 70 75 80
Asp Ala Glu Gly Gly Leu Ala Gly Ile Ile Thr Asp Gly Asp Leu Arg
85 90 95
Arg Phe Met Glu Lys Glu Asp Ser Leu Thr Ser Ala Thr Ala Ala Gln
100 105 110
Met Met Thr Arg Glu Pro Leu Thr Leu Pro Glu Asp Thr Met Ile Ile
115 120 125
Glu Ala Glu Glu Lys Met Gln Lys His Arg Val Ser Thr Leu Leu Val
130 135 140
Thr Asn Lys Ala Asn Lys Val Thr Gly Leu Val Arg Ile Phe Asp
145 150 155
<210> 93
<211> 188
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Sequence
<400> 93
Met Arg Gly Ser His His His His His His Gly Ser Ala Cys Glu Leu
1 5 10 15
Pro Glu Phe Ala Leu Lys Phe Asn Gln Thr Val Leu Lys Glu Ser Glu
20 25 30
Arg Phe Ile Asn Glu Met Ser His Arg Ile Ala Arg Asp Gln Leu Ala
35 40 45
Phe Ala Glu Thr Glu Met Glu Lys Ala Arg Gln Arg Leu Asp Ala Ser
50 55 60
Lys Ala Glu Leu Leu Ser Tyr Gln Asp Asn Asn Asn Val Leu Asp Pro
65 70 75 80
Gln Ala Gln Ala Gln Ala Ala Ser Thr Leu Val Asn Thr Leu Met Gly
85 90 95
Gln Lys Ile Gln Met Glu Ala Asp Leu Arg Asn Leu Leu Thr Tyr Leu
100 105 110
Arg Glu Asp Ala Pro Gln Val Val Ser Ala Arg Asn Ala Ile Gln Ser
115 120 125
Leu Gln Ala Gln Ile Asp Glu Glu Lys Ser Lys Ile Thr Ala Pro Gln
130 135 140
Gly Asp Lys Leu Asn Arg Met Ala Val Asp Phe Glu Glu Ile Lys Ser
145 150 155 160
Lys Val Glu Phe Asn Thr Glu Leu Tyr Lys Leu Thr Leu Thr Ser Ile
165 170 175
Glu Lys Thr Arg Val Glu Ala Ala Arg Lys Leu Lys
180 185
<210> 94
<211> 223
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Sequence
<400> 94
Met Gly Ser Leu Asn Tyr Leu Ile Lys Ala Gly Gly Val Asp Pro Glu
1 5 10 15
Arg Gly Ser Tyr Val Asp Ile Val Val Lys Arg Gly Asn Arg Val Arg
20 25 30
Ser Asn Val Asn Leu Tyr Asp Phe Leu Leu Asn Gly Lys Leu Gly Leu
35 40 45
Ser Gln Phe Ala Asp Gly Asp Thr Ile Ile Val Gly Pro Arg Gln His
50 55 60
Thr Phe Ser Val Gln Gly Asp Val Phe Asn Ser Tyr Asp Phe Glu Phe
65 70 75 80
Arg Glu Ser Ser Ile Pro Val Thr Glu Ala Leu Ser Trp Ala Arg Pro
85 90 95
Lys Pro Gly Ala Thr His Ile Thr Ile Met Arg Lys Gln Gly Leu Gln
100 105 110
Lys Arg Ser Glu Tyr Tyr Pro Ile Ser Ser Ala Pro Gly Arg Met Leu
115 120 125
Gln Asn Gly Asp Thr Leu Ile Val Ser Thr Asp Arg Tyr Ala Gly Thr
130 135 140
Ile Gln Val Arg Val Glu Gly Ala His Ser Gly Glu His Ala Met Val
145 150 155 160
Leu Pro Tyr Gly Ser Thr Met Arg Ala Val Leu Glu Lys Val Arg Pro
165 170 175
Asn Ser Met Ser Gln Met Asn Ala Val Gln Leu Tyr Arg Pro Ser Val
180 185 190
Ala Gln Arg Gln Lys Glu Met Leu Asn Leu Ser Leu Gln Lys Leu Glu
195 200 205
Glu Ala Ser Leu Ser Ala Gln Ser Ser Thr Lys Glu Glu Ala Ser
210 215 220
<210> 95
<211> 249
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Sequence
<400> 95
Met Gly Ser Met Ser Lys Ala Val Ile Val Ile Pro Ala Arg Tyr Gly
1 5 10 15
Ser Ser Arg Leu Pro Gly Lys Pro Leu Leu Asp Ile Val Gly Lys Pro
20 25 30
Met Ile Gln His Val Tyr Glu Arg Ala Leu Gln Val Ala Gly Val Ala
35 40 45
Glu Val Trp Val Ala Thr Asp Asp Pro Arg Val Glu Gln Ala Val Gln
50 55 60
Ala Phe Gly Gly Lys Ala Ile Met Thr Arg Asn Asp His Glu Ser Gly
65 70 75 80
Thr Asp Arg Leu Val Glu Val Met His Lys Val Glu Ala Asp Ile Tyr
85 90 95
Ile Asn Leu Gln Gly Asp Glu Pro Met Ile Arg Pro Arg Asp Val Glu
100 105 110
Thr Leu Leu Gln Gly Met Arg Asp Asp Pro Ala Leu Pro Val Ala Thr
115 120 125
Leu Cys His Ala Ile Ser Ala Ala Glu Ala Ala Glu Pro Ser Thr Val
130 135 140
Lys Val Val Val Asn Thr Arg Gln Asp Ala Leu Tyr Phe Ser Arg Ser
145 150 155 160
Pro Ile Pro Tyr Pro Arg Asn Ala Glu Lys Ala Arg Tyr Leu Lys His
165 170 175
Val Gly Ile Tyr Ala Tyr Arg Arg Asp Val Leu Gln Asn Tyr Ser Gln
180 185 190
Leu Pro Glu Ser Met Pro Glu Gln Ala Glu Ser Leu Glu Gln Leu Arg
195 200 205
Leu Met Ser Ala Gly Ile Asn Ile Arg Thr Phe Glu Val Ala Ala Thr
210 215 220
Gly Pro Gly Val Asp Thr Pro Ala Cys Leu Glu Lys Val Arg Ala Leu
225 230 235 240
Met Ala Gln Glu Leu Ala Glu Asn Ala
245
<210> 96
<211> 256
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Sequence
<400> 96
Met Gly Ser Gln Arg Val Arg Leu Ile Ala Glu Asn Val Ser Pro Gln
1 5 10 15
Ser Leu Leu Arg His Val Ser Arg Val Tyr Val Val Thr Ser Gln Tyr
20 25 30
Gly Phe Glu Ala Leu Leu Ala Gly Lys Pro Val Thr Cys Phe Gly Gln
35 40 45
Pro Trp Tyr Ala Gly Trp Gly Leu Thr Asp Asp Arg His Pro Gln Ser
50 55 60
Ala Leu Leu Ser Ala Arg Arg Gly Ser Ala Thr Leu Glu Glu Leu Phe
65 70 75 80
Ala Ala Ala Tyr Leu Arg Tyr Cys Arg Tyr Ile Asp Pro Gln Thr Gly
85 90 95
Glu Val Ser Ala Leu Phe Thr Val Leu Gln Trp Leu Gln Leu Gln Arg
100 105 110
Arg His Leu Gln Gln Arg Asn Gly Tyr Leu Trp Val Pro Gly Leu Thr
115 120 125
Leu Trp Lys Ser Ala Ile Leu Lys Pro Phe Leu Gln Thr Ala Thr Asn
130 135 140
Arg Leu Ser Phe Ser Arg Arg Cys Thr Ala Ala Ser Ala Cys Val Val
145 150 155 160
Trp Gly Val Lys Gly Glu Gln Gln Trp Arg Ala Glu Ala Gln Arg Lys
165 170 175
Ser Leu Pro Leu Trp Arg Met Glu Asp Gly Phe Leu Arg Ser Ser Gly
180 185 190
Leu Gly Ser Asp Leu Leu Pro Pro Leu Ser Leu Val Leu Asp Lys Arg
195 200 205
Gly Ile Tyr Tyr Asp Ala Thr Arg Pro Ser Glu Leu Glu Val Leu Leu
210 215 220
Asn His Ser Gln Leu Thr Leu Ala His Gln Met Arg Ala Glu Lys Leu
225 230 235 240
Arg Gln Arg Leu Val Glu Ser Lys Leu Ser Lys Tyr Asn Leu Gly Ala
245 250 255
<210> 97
<211> 251
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Sequence
<400> 97
Met Arg Gly Ser His His His His His His Gly Ser Ala Cys Glu Leu
1 5 10 15
Cys Phe Gly Asp Cys Arg Leu Leu His Lys Glu Ala Lys Arg Trp Ala
20 25 30
Lys Ser Lys Gly Ile Arg Phe Leu Ala Phe Glu Glu Gly Tyr Leu Arg
35 40 45
Pro Gln Phe Ile Thr Val Glu Glu Gly Gly Val Asn Ala Tyr Ser Ser
50 55 60
Leu Pro Arg Asp Pro Asp Phe Tyr Arg Lys Leu Pro Asp Met Pro Thr
65 70 75 80
Pro His Val Glu Asn Leu Lys Pro Ser Thr Met Lys Arg Ile Gly His
85 90 95
Ala Met Trp Tyr Tyr Leu Met Gly Trp His Tyr Arg His Glu Phe Pro
100 105 110
Arg Tyr Arg His His Lys Ser Phe Ser Pro Trp Tyr Glu Ala Arg Cys
115 120 125
Trp Val Arg Ala Tyr Trp Arg Lys Gln Leu Tyr Lys Val Thr Gln Arg
130 135 140
Lys Val Leu Pro Arg Leu Met Asn Glu Leu Asp Gln Arg Tyr Tyr Leu
145 150 155 160
Ala Val Leu Gln Val Tyr Asn Asp Ser Gln Ile Arg Asn His Ser Asn
165 170 175
Tyr Asn Asp Val Arg Asp Tyr Ile Asn Glu Val Met Tyr Ser Phe Ser
180 185 190
Arg Lys Ala Pro Lys Glu Ser Tyr Leu Val Ile Lys His His Pro Met
195 200 205
Asp Arg Gly His Arg Leu Tyr Arg Pro Leu Ile Lys Arg Leu Ser Lys
210 215 220
Glu Tyr Gly Leu Asp Glu Arg Val Ile Tyr Val His Asp Leu Pro Met
225 230 235 240
Pro Glu Leu Leu Arg His Ala Ser Leu Ile Ser
245 250
<210> 98
<211> 86
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Sequence
<400> 98
gctagctaat tcttgacata gtttcacaga ttgtgttata ataactacac gacgttcatc 60
gtcgtcaatg tacaggaggt caacaa 86
<210> 99
<211> 36
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Primer
<400> 99
ggccgcggcg cgcctgcagg atttaaatct cgaggc 36
<210> 100
<211> 36
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Primer
<400> 100
ggccgcctcg agatttaaat cctgcaggcg cgccgc 36
<210> 101
<211> 31
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Primer
<400> 101
cgtcaagctt gtgaacgcct atagcagctt g 31
<210> 102
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Primer
<400> 102
cagtggcgcg ccgagcgatg ataagctgtc 30
<210> 103
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Primer
<400> 103
gcactgcaga tcccctttat ccgcc 25
<210> 104
<211> 39
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Primer
<400> 104
cttcttcggc tatgcatcgt tcgtaatcaa gccacttcc 39
<210> 105
<211> 38
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Primer
<400> 105
gattacgaac gatgcatagc cgaagaaggg atgggttg 38
<210> 106
<211> 27
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Primer
<400> 106
gcactgcaga tccacatcct tgaaggc 27
<210> 107
<211> 1604
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Sequence
<400> 107
ctgcagatcc acatccttga aggccgcagc gacgagcaga aggaaaccct cattcgggaa 60
gtcagcgagg ccatctcgcg ctccctggat gcgccgctga ccagcgtgcg agtgattatc 120
acggagatgg ccaagggcca cttcggcatc ggcggcgaac tggccagcaa ggtcagacgc 180
tgaagtggag atgcccaagg gcacttcggg tcgaggaacc cgacctgcat tgggacgcgg 240
ccacggagag cgcgggcaaa cgccggcact atagccagtg gagtttgtaa aacgctattt 300
cagagcttgg agagtgtcta agaaagccgg ggcgatgcca acccatccct tcttcggcta 360
tgcatcgttc gtaatcaagc cacttccttt ttgcattgac gcagggtgtc ggaaggcaac 420
tcgccgaacg cgctcctata gttttcagcg aagcgtccca aatgtaagaa gccgtagtct 480
agggctatct cagttatact acgcacattg gcactgggat cgttcaagca ggcgcggatg 540
ctttcgagct tgcggttgcg gatgtagttc ttcggcgtgg tgccggcatg cttctcgaac 600
aaattgtaga gcgagcgtgg actcatcatc gccagctccg ctaaccgctc aaggctgata 660
ttccgtttga gattctcctc aatgaattga acgactcgct cgaaagacgg gttacctttg 720
ctgaaaattt cacggctgac attgctgccc agcatttcga gcagcttgga agcgatgatc 780
cccgcatagt gctcttggac ccgaggcatc gactttgtat gttccgcttc gtcacaaact 840
aacccgagta gattgataaa gccatcgagt tgctggagat tgtgtcgcgc ggcgaaacgg 900
ataccctccc tcggcttgtg ccaattgttg tcactgcatg cccgatcaag gaccactgag 960
ggcaatttaa cgataaattt ctcgcaatct tctgaatagg tcaggtcggc ttggtcatcc 1020
ggattgagca gcaatagttc gcccggcgca aaatagtgct cctggccatg gccacgccac 1080
aggcaatggc ctttgagtat tatttgcaga tgataacagg tctctaatcc aggcgagatt 1140
accctcacgc taccgccgta gctgattcga cacaggtcga ggcatccgaa gattctgtgg 1200
tgcagcctgc ctgccgggcg cccgcccttg ggcaggcgaa tagagtgcgt accgacatac 1260
tggttaacat aatcggagac tgcatagggc tcggcgtgga cgaagatctg acttttctcg 1320
ttcaataagc aaaaatccat agttcacggt tctcttattt taatgtgggc tgcttggtgt 1380
gatgtagaaa ggcgccaagt cgatgaaaat gcatctcgac gtgatgcgta tacgggttac 1440
ccccattgcc acgttgcgcc atcctttttg caatcagtga ccacttttcc aagcaaaaat 1500
aacgccaagc agaacgaaga cgttcttttt aagaagcgag aacaccagaa gttcgtgctg 1560
tcggggcatg cggcgacgaa ttggcggata aaggggatct gcag 1604
<210> 108
<211> 29
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Primer
<400> 108
cgcaagcttc gtaccgaaag atcagttgc 29
<210> 109
<211> 41
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Primer
<400> 109
ccaaaagaga aatctgcagt agatgggatg ttattttacc g 41
<210> 110
<211> 38
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Primer
<400> 110
acatcccatc tactgcagat ttctcttttg gggcacgg 38
<210> 111
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Primer
<400> 111
gctctagaca tctgccataa caacggag 28
<210> 112
<211> 1750
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Sequence
<400> 112
gctctagaca tctgccataa caacggagaa agcgccatcg ccgttaacag tcgacggcgc 60
gaaataagag gtaagccgct catcaataaa caaaactcac aggtgcagca cccgccggat 120
gcggcaaaat acccatcggg atgccataaa tcatttcgag ggtttcgccg cgcataattt 180
ccgcaggcgt tccctgagca atcatttcac cgccgcgcag ggcgaccaga taatcacagt 240
agcgtgccgc catattgata tcgtgcaaca cggcaatgac cgtcaggcca cgctcctgac 300
ttaaacggtg caccagcgac agcacatcaa cctggtgggc gatatccagc gccgaggtcg 360
gttcgtcgag caacagacaa cggctatcct gcgccaccag catggcgatc cacgcccgct 420
gacgttcgcc gccagagaga ctatcgacca gccgatgcgc cagcggtttt aagccaacca 480
gcgagatagc ttcctcgact ttttcgcgat ctgccgcccc aaagcgcccc agcgcgccat 540
gccacgggta acgaccaatc gccaccagtt cacgcacggt catcccttct gccggaggaa 600
gctgctgcgg caaataagcc actttgcggg caaacgcttt gctgctccag ctttccagcg 660
gttgggcatc aagaagaatc tccccttccg acggcggctg atgacggcca agcattttga 720
gcagagtgga tttaccagaa ccgttgtgac caatcagacc ggtcactttc ccggcaggaa 780
aggttaacga cagcggatgc aaaagcgtgc gcccgggcac acgaaaggag atattacgca 840
gtgcaaaagt ggtatcggaa tgattcgtgt attcctgcat aacagccaac ttgtgaaatg 900
ggcacggaaa tccgtgcccc aaaagagaaa tctgcagtag atgggatgtt attttaccgg 960
atggcaactc gccatccggt atttcacgct tagatgttaa ttactaccaa acatatcctt 1020
gatccaaccg gctacaccgt cgctgtcttt ctgctcttgc tgagcaggtt gctgttgcgg 1080
ctgttgctgc ggctgagaag actgatcaaa cggattgcct gacggctgct gctgcatctc 1140
gctctgctgg cacagcgatt gcggatcgct ggtccagacc ggcaagatac gcatgccacc 1200
gctgcaaaca aagttgccgt cgtagtccac gcccatatct gcaatatctt ctggcggaac 1260
aagattcagc ggcgttggcg tctggttagc cagataacgc tgataaatcg acattgcccc 1320
gctggcacca tacagtttgg tcggctggtt gttatcacgg ccgacccagg tgatggtcac 1380
cgtgctgccg tcaatgcccg caaaccaggt atctacgtta ttgttggtag tccctgtttt 1440
ccctgccaga tgcaggttcg ggtatttcgc cccaagctga cgacccgtac cgcgttgtac 1500
cacctgctgc atggtccata gtgtcagata cgccgcctgc gccggaacag cgcgttccgc 1560
ctgcgggaag ctctgataca gcactttgcc atcttccgcg attaccgaac gcagcgcaga 1620
aagcggtgca cggttaccac cgctggcgat ggtctggaat gcctgcgcca cttcgattgg 1680
cgttaagttc aacgccccca gcagcattgc cggaaccgga tgcaactgat ctttcggtac 1740
gaagcttgcg 1750
<210> 113
<211> 58
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Primer
<400> 113
gcgagatctc atgtttgaca gcttatcatc gctcggcttt aatgcggtag tttatcac 58
<210> 114
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Primer
<400> 114
ccggcgtaca agatccacag gacgggtgtg 30
<210> 115
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Primer
<400> 115
ctgtggatct tgtacgccgg acgcatcgtg 30
<210> 116
<211> 27
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Primer
<400> 116
gcggatcctt ccattcaggt cgaggtg 27
<210> 117
<211> 23230
<212> DNA
<213> Escherichia coli
<400> 117
gcatggactg accatggttt tatattcatt aaaaattttg ttacaaccca ttgatttagc 60
ataaataaat tatagtgggt tcgggtttgt tgtgactgtg gcattatttc cgtgcaaagg 120
agctgatatg tctgaaagac atttacctga tgaccagagc agtactatcg atccatatct 180
aattacctct gttcgccaga ctctggcaga acaaagcgca gcattacaaa acttgtctaa 240
acaactggat tccgggcagt accagcgtgt ccttaatttg ataatgaact gtaaagggca 300
cgttattctt tcgggaatgg gtaaatcagg gcatgtcggt cgtaaaatgt cagcgacgct 360
ggcctctacg ggtacgccta gtttctttat tcatcctgca gaagctttcc atggcgatct 420
gggcatgatt acgccttacg atcttctgat ccttatttct gccagcggtg aaacggatga 480
aatcctcaag ctagttcctt cactgaaaaa tttcggcaac cgaattatcg ccattaccaa 540
taatggaaat tccacgctgg cgaaaaatgc tgatgccgtg ctggaactcc acatggcgaa 600
tgaaacctgc ccgaataatc ttgcaccaac aacgtctacc acgctgacga tggcgatcgg 660
cgatgcgctg gcgattgcca tgatccacca acgcaaattt atgccgaatg attttgcgcg 720
ctatcacccg ggcggttcat taggtcgtcg cctgctgacc cgcgttgctg atgtcatgca 780
gcatgatgtt cctgcggtac agctggatgc gtcatttaaa accgtgattc aacgtatcac 840
cagcggatgc cagggaatgg tgatggtaga agacgcagaa ggtgggctag cgggcattat 900
caccgacggt gacctgcgtc gctttatgga aaaagaggat tctctgacat ccgccacggc 960
tgcgcagatg atgacacgtg aaccgctgac gctaccggaa gacaccatga tcattgaagc 1020
ggaagaaaaa atgcaaaagc accgcgtctc aacgttattg gtgaccaaca aggcaaataa 1080
agtcactggc cttgtgcgca ttttcgacta attaagcaac ggggtgcgag aggttagtct 1140
ctcattgagt ttgcgcccca ctgaaacttt gataatcgtt acatgttgat aaaagtgaag 1200
tctgccgtat cctggatgcg tgctcgtctg tctgccatct cactggcaga tatccaaaaa 1260
cacctggcga aaatcatcat tctggcaccg atggcggtgc tgctgatcta tctggctatc 1320
ttcagccagc ctcgctatat gagcgagtcg aaagtcgcca ttaaacgctc ggatgattta 1380
aacagcggca gcctgaattt tggtctgctt ctgggtgcct ctaaccccag ttccgcagaa 1440
gatgcgttgt atctgaaaga gtacatcaac tcgccggata tgctggcggc gctggataag 1500
caactaaatt ttcgtgaagc gtttagccac agcgggctcg attttcttaa tcatcttagc 1560
aaggatgaaa ccgcagaagg cttcctgaag tactacaagg accgtatcaa cgtctcgtat 1620
gacgataaaa ccggattact gaatattcag acgcagggct ttagcccgga gtttgcgctt 1680
aagtttaacc aaaccgtgct gaaagagtca gagcgcttta tcaatgagat gtcacatcgc 1740
atcgcgcgtg accagcttgc ctttgcagaa acggagatgg aaaaggcacg ccagcgtctg 1800
gacgccagca aagcggaatt gctctcttat caggacaaca acaacgttct ggatccacag 1860
gcacaggcac aggcggcgag cacgttagtg aatacgctga tgggccagaa gatccagatg 1920
gaagcggacc tgcggaactt gctgacgtat ctgcgtgagg acgccccgca agttgtgagt 1980
gcgcgtaatg cgattcagtc attgcaggca caaattgacg aagaaaaaag caaaatcact 2040
gcgccacagg gtgacaagct aaaccgtatg gcagtggatt ttgaagaaat caaatcaaaa 2100
gtagagttca acaccgagct gtacaaactg accctgacct ccattgaaaa gacccgtgta 2160
gaagcggctc gtaagctcaa ggtgctgtca gtgatcagtt cgccacagtt gccgcaggaa 2220
tcgtcttttc caaatatccc ttatttgatc gcctgctggt tactggtgtg ctgcctgctg 2280
ttcggcaccc tgaaactgtt gctggctgtt attgaagatc accgagacta acgctgtcgc 2340
tgaatgagtt tgtgatgaaa ttatttaaat caattttact gattgccgcc tgtcacgcgg 2400
cgcaggccag cgcgaccatt gatattaacg ctgacccaaa cctgacagga gccgcgccgc 2460
ttaccggtat tctgaacgga cagaagtcgg atacgcaaaa catgagcggc ttcgacaata 2520
ccccgccgcc cgcaccgccg gtggtaatga gccgtatgtt tggtgctcaa cttttcaacg 2580
gcaccagcgc ggatagcggt gcgacggtag gattcaaccc tgactatatt ctgaatccgg 2640
gtgatagcat tcaggttcgc ttgtggggtg cgttcacctt tgatggtgcg ttacaggttg 2700
atcccaaagg taatattttc ctgccgaacg ttggtccggt gaaagttgct ggcgtcagta 2760
atagtcagct aaatgccttg gtcacatcca aagtgaagga agtataccag tccaacgtca 2820
acgtctacgc ctccttatta caggcgcagc cagtaaaagt gtacgtgacc ggatttgtgc 2880
gtaatcctgg tctgtatggc ggtgtgacgt ctgattcgtt actcaattat ctgatcaagg 2940
ctggcggcgt tgatccagag cgcggaagtt acgttgatat tgtggtcaag cgcggtaacc 3000
gcgtgcgctc caacgtcaac ctgtacgact tcctgctgaa cggcaaactg ggactttcgc 3060
agttcgccga tggtgacacc atcatcgtcg ggccacgtca gcatactttc agcgttcagg 3120
gcgatgtctt taacagctac gactttgagt tccgcgaaag cagcattccc gtaacggaag 3180
cgttgagctg ggcgcgccct aagcctggcg cgactcacat tacgattatg cgtaaacagg 3240
ggctgcaaaa acgcagcgaa tactatccga tcagttctgc gccaggccgt atgttgcaaa 3300
atggcgatac cttaatcgtg agcactgacc gctatgccgg caccattcag gtgcgggttg 3360
aaggcgcaca ctccggtgaa catgccatgg tattgcctta tggttccact atgcgtgcgg 3420
ttctggaaaa agtccgcccg aacagcatgt cgcagatgaa cgcagttcag ctttatcgcc 3480
catcagtggc tcagcgtcag aaagagatgc tgaatctctc gctgcaaaag ctggaggaag 3540
cctcactttc tgcccagtca tccaccaaag aagaagccag cctgcgaatg caggaagcac 3600
aactgatcag ccgctttgtg gcgaaagcac gcaccgtggt tccgaaaggt gaagtgatcc 3660
tcaacgaatc caatattgat tctgttctgc ttgaagatgg cgacgtcatc aatattccgg 3720
agaaaacatc gctggttatg gttcatggcg aggtgctgtt cccgaacgcg gtgagctggc 3780
agaaagggat gaccaccgag gattacatcg agaaatgcgg tggcctgacg caaaaatcgg 3840
gtaacgccag aattatcgtc attcgtcaga acggtgcggc agtcaacgct gaagatgtag 3900
attcactcaa gcctggcgat gagattatgg ttctgccgaa atatgaatcg aaaaacattg 3960
aagttacccg tggtatttcc accatcctct atcagctggc ggtgggtgca aaagtgattc 4020
tgtctttgta aggggttgaa atgagcaaag cagttattgt cattccggct cgctatggct 4080
cctcgcgcct gccgggtaag ccactgctcg atattgttgg taaaccgatg atccagcatg 4140
tttacgagcg tgcgttacag gtggcgggcg ttgcggaagt ttgggtggca acagacgatc 4200
cgcgtgttga acaggccgta caggcgtttg gcgggaaagc catcatgacg cgcaacgatc 4260
atgaatccgg caccgatcgg ctggtcgagg tgatgcataa agtcgaggca gatatctaca 4320
ttaacctgca gggcgacgaa ccaatgattc gcccgcggga tgtagaaacg ctgctacaag 4380
gaatgcgtga cgatcccgcg ttgccggtgg caacgctatg ccacgcgatt tctgccgcag 4440
aagcggctga gccaagcacg gtaaaagtgg ttgtgaatac ccgccaggat gcgctttatt 4500
tcagccgctc accgattccg tatccgcgta atgctgaaaa agcgcgctac ctgaaacacg 4560
tcggtattta cgcttatcgt cgcgatgtgc tgcaaaacta cagccagtta ccggagtcca 4620
tgccggagca ggcggaatca ctggagcagc tgcggttgat gagcgcgggg atcaacatcc 4680
gcacatttga ggttgccgca accggtccgg gcgtcgacac cccagcatgc ctggaaaaag 4740
tgcgcgccct gatggcacag gaactggctg aaaacgcatg attggcattt actcgcctgg 4800
catctggcgt attccgcatc tggagaaatt tctggcgcaa ccgtgccaga aactttctct 4860
gctgcgccct gttccgcaag aagttgatgc tatcgccgtg tggggacatc gtcccagtgc 4920
ggcgaaacca gtcgccatcg ccaaagcagc gggaaaaccc gtcattcgtc tggaagatgg 4980
atttgtgcgt tcgctggatc ttggcgtcaa tggcgagccg ccgctttctc tggtggtgga 5040
tgattgtggc atttactacg atgccagcaa gccttcggcg ctggagaaac tggtacagga 5100
taaagccgga aatgcggcat tggctgatca ggccagagaa gcgatgcaca ccatcgtgac 5160
cggggatatg tcgaaatata atctggcgcc tgcgtttgtg gcggatgaat cagaacgtac 5220
aaacatcgtt ctggttgtcg atcagacatt taatgatatg tcagtgacgt atggcaatgc 5280
tggcccgcat gagtttgctg ccatgctgga agccgcgatg gcggaaaatc ctcaagctga 5340
aatttgggtg aaggtgcacc cagatgtact ggaaggaaag aaaacaggtt atttcgccga 5400
tctgcgcgcc acgcaacgag tacgtttaat tgccgagaat gtcagcccgc agtcgctgtt 5460
gcgacacgtt tcccgggttt acgtcgtgac atcccaatac ggctttgaag ccttgctggc 5520
aggaaaacca gtaacatgtt tcggccagcc ctggtatgca ggctggggct taaccgacga 5580
tcgccatccg cagtccgctt tgttatctgc ccgacgcggt tctgccacgc tggaggaact 5640
ttttgccgct gcatacctgc gttactgtcg ctatatcgat ccgcaaacgg gagaagtaag 5700
cgctctattt accgtgctgc aatggctgca attacaacgt cgacatctgc aacagcgtaa 5760
tggttattta tgggtgccag gcttaacgct gtggaagtca gcgatcctga aacctttctt 5820
gcaaacggca acaaaccggc tgagtttttc acgtcgctgt actgcggcga gcgcctgcgt 5880
ggtatggggt gtaaagggag aacagcaatg gcgagccgaa gcgcagcgaa aatcactgcc 5940
gttatggcga atggaagatg gttttctgcg ttcatccgga cttggctctg accttttgcc 6000
accgctatcg ctggtgctgg ataaacgcgg aatctactat gacgccacgc gccccagcga 6060
actggaagtg ctgcttaatc atagccagct aacgctggcg catcagatgc gagctgaaaa 6120
attacgccag cgactggttg aaagtaaact gagcaagtac aacctgggag ccgatttctc 6180
tctaccagcc gaagccaaag ataaaaaagt tatcctggtg ccgggtcagg tagaggacga 6240
tgcctctatt aaaacaggca ctgtgtcgat taagagcaac cttgagttat tacgcacagt 6300
acgcgagcgc aatccgcacg cctacattat ttataaaccg cacccggatg tattagtggg 6360
gaatcgcaag ggcgatattc cggcagaaca gattgctgaa cttgctgatt atcaggcact 6420
ggacgcagat attattcaat gcatccaacg cgcagatgaa gtgcatacca tgacgtcgct 6480
gtcggggttt gaagcgttat tacatggcaa gcaagttcat tgttacggcc tgcccttcta 6540
tgccagttgg ggtttaaccg ttgatgaaca tcattgcccg cgccgcgagc gcagattaac 6600
gatagcagac ttgatctatc aggcgttgat tgtttatcca acctatatcc acccaacacg 6660
gctacaacct attacggttg aagaagctgc ggaatattta atcaagacac cgcgaaagcc 6720
gatatttatt acccgaaaaa aagcggggcg ggtaatacgc tattaccgca aattaattat 6780
gttctgcaag gtcagatttg gctaaacaat ttcatagttg actattacgc aaattattta 6840
tgcacggtaa tgcactaacc gttttattat ccggtaaaaa atatctgcta ttgcaggggc 6900
caatgggacc ttttttcaat gacgtcgccg aatggttaga gtcattaggc cgtaacgctg 6960
tgaatgttgt cttcaacggt ggggatcgtt tttactgccg ccatcgacaa tacctggctt 7020
actaccaaac gccgaaagag ttccccggat ggttacggga tctccaccgg caatatgact 7080
ttgataccat cctctgcttt ggcgactgcc gcctattgca caaagaagca aaacgttggg 7140
caaagtcgaa agggatccgc tttctggcat ttgaggaagg atatttacgc ccgcaattta 7200
ttaccgttga agaaggcgga gtaaacgcat attcatcgct accgcgcgat ccggattttt 7260
atcgtaagtt accagatatg cctacgccgc acgttgagaa cttaaaacct tcaacgatga 7320
aacgtatagg tcatgcgatg tggtattacc tgatgggctg gcattaccgc catgagttcc 7380
ctcgctaccg ccaccataaa tcgttttccc cctggtatga ggctcgttgc tgggttcgtg 7440
catactggcg caagcaactt tacaaggtaa cacagcgtaa ggtattaccg aggttaatga 7500
atgagctgga ccagcgttat tatcttgccg ttttgcaggt gtataacgat agccagattc 7560
gtaaccacag caattataac gatgtgcgtg actatattaa tgaagtcatg tactcatttt 7620
cacgtaaagc accgaaagaa agttatttgg tgatcaagca ccatccaatg gatcgtggtc 7680
acagactcta tcgaccatta attaagcgat tgagtaagga atatggctta gatgagcgag 7740
tcatttatgt gcacgatctc ccgatgccgg aattattacg ccatgcaaaa gcggtagtga 7800
cgattaacag tacggcgggg atctctgcgc tgattcataa caaaccactc aaagtgatgg 7860
gcaatgccct gtacgacatc aaaggcttga cgtatcaagg gcatttgcac cagttctggc 7920
aggccgattt taaaccgaat atgaaactgt ttaagaagtt tcgagggtat ttattggtta 7980
agacgcaggt taatgcggtt tattatgggg agatgatttt taacaagata aaaaaatata 8040
aaaaaagata aaaaagattg tattatgcta tcaaaaaaac atcacaatga atggcattaa 8100
cataaccatt cataaactcc cattcattaa ataaatgatt aacatactat aattagaaaa 8160
cacaataaat tattaaaata aatattatag attatacatt tagtgataag ttatatactg 8220
gtaaagttaa catgagcact ttgtaatgca gttttgatgg cattagtatc tactaatatt 8280
gagtcgggcg cagaaaatgg tcgattttta ttagtgaaat cagaatttcc tatgtaaaga 8340
ctttctttat ttcttaacgc ctgaatgtgc catcgcgacc aggaatccca atatttttgg 8400
cgatctggtg aaattccctg agatgtatat cctgttgtag gtgaattcat taacgagtcg 8460
gtacgatggc ttcctagcgt caaaggcaat ttaatacgat gtacagtgga atcaccaaaa 8520
attagcttaa gtcgagcaat gaattcacta tcagcccccg ttttaacaca gtcccaaacg 8580
cccgcttttt gcaatacatc cgctcttcta aacaacagag aagaaggatt cagtcttttt 8640
agtggataga ccgcacgcgc atagaaaatc ccattatctt gcaaccttac ccaatcagaa 8700
atcgaacaaa ttagtttagg gtttaacaat aaaggtgata tctgtctaaa taatttttca 8760
ggatgggacc agtcatctga gtcatggcat gtcacaaact ctccctttgc ctgtattaag 8820
cctattcgtt ttgcagcata tgttccaaca ttttgtggca ggctaataat ttttattcga 8880
gtatctttga gtgctaatct ctgaagacgg aatagcgtat catcggtgct ggcatcatcc 8940
acaataatta gctcaaatga acggtatgtt tgattaagca atgatattac tgcattttct 9000
acccgcctac cggtattgta tgttgtcatt aaaatagaaa tcagggggcc cgtttgggca 9060
ggataaggaa tcgatgtaat aatattacaa ggtgacaaag gagatgagtt atctgtcagt 9120
gcgaccggag ataaaccaaa gtacttatag tattcgttaa gtctatttaa cgagatttct 9180
gccgtttctc tgaaagcatt attttgcaag agtaatatat caggggaata tacaatatca 9240
ctggcatcaa tctgagcgag tgttgatata gctttttgag ttaacccgat tcttaattga 9300
agagctgtat acaagtctaa gggacaatta tcgacattat ctaataatga taatgaaaac 9360
gtaggagagt atgatgctaa ggtttttgct aactcaactt tttgatgtgt gtctgtgaac 9420
tcgtctttaa actccatgag taattccgga gttaagctta tgtcaccaca ggcaatttta 9480
gctattttga ttgctaattt acaccgccaa tctgacggtg tatcagtaag attatgtaat 9540
gaccaataca tattaagcct gtacattgcc aatatacgtt ttgactgcca aaatcggcag 9600
tcatcttgta ttgcagctaa agcatgtaca tatcgacttt tctttaatag ccataaaaat 9660
tttaaattat tgaacataat caagagtcga caccaaataa atctcgcgta taaacttttt 9720
cacttacatc ttctaattct gacgtgcggc gattggctac tataacatca acacgttctt 9780
taaaagaatt aatatcacgc tcaacataag aaccaaagaa ataaggctct tttagtacag 9840
gttcatatac aactatctca attcctttgg ctttgagtcg tttcattaca ccttgaatac 9900
tacttgctct aaagttatca ctacctgctt tcattatgag gcgatagatt cctacaactt 9960
ttggtttacg acttaatata tcctccgcaa caaagtcttt tcgggtagta ttggcatcga 10020
caatagcctg gattaagttc tgcggaacat cacgataatt tgcgagtaat tgcttggtat 10080
ccttaggtaa gcagtaacct ccataaccaa aagaaggatt attataatgt tgaccaattc 10140
taggatctaa actaacaccc tctataattt gctttgtatc taaaccatga acggaggcat 10200
aagtatccaa ttcattgaaa taagcaatcc gcattgcaag gtaagtattt gcaaaaagtt 10260
taatggcttc agcttcaggg ctatccgtta acaatattgg aatatctttt tttatagcgc 10320
cttcactgag aagctctgcg aactttcttg ctcgttcgct actctctccc acaactatac 10380
gagatggata taggttgtca taaagagctt taccttcacg taaaaattct ggggaaaaga 10440
taatattatt cgtgtttaga tcgcgtttta gtcgttcagt aaatccgacg gggactgtag 10500
atttaattat gatagttgca ttaggattta tacttagtac gtcacatgct actgattcta 10560
ctgagagtgt atcgaagtta ttattaatgg gatcataatt ggttggtgtt gcgattataa 10620
cataatcagc atctctatac gcttcgtatt tttctgttgt agcatatagg tttaattttc 10680
tattagataa aaatttttgt atttcaggat cacatattgg tgatattttt ttattaatca 10740
actgaacttt cttaggatct atatcgagag cgataatatc atgtttttgt gaaagtaata 10800
tagcaattga tataccaaca tatcctacac cagcaactgc aattttcata atagattata 10860
tttaattccg tgtataaaat caaagaaatg tgattaagca ttgataacaa taaattatca 10920
gatttattag gccaaaccta atttttattt ttttccttgc aaattttcat attctctagg 10980
agtaccacaa aaaataacat cagacttatt tatttctgta taatacactt tgatcccatt 11040
actaattaga taattgtata ttggggctat atataactct ccagcatccc aattttcttg 11100
aggtagattt ttataatgtt catatgctga aataaaattt ttaattgtag aaaaatgata 11160
taatcctgtg cagcataagt tagaaatttg ttttttttcg ctagtagcaa tgacctcatt 11220
ttttacatca tttgatggca taacaaaaga ccagttatcc ccatctcctc gaaatacttc 11280
aatataacat tcattttccc cttcgaactt agtaaatata aaattaggcc taattgtatc 11340
aatgttaaaa atagtgattg gttgttctat attaaataat tttgatatag ccaaatatac 11400
tgtttctgct tgcccccgag tttctttatc aagagtaatc aaggtgtagc tattaatccc 11460
taaagatgct attctttgta atacaaaaga cttcgtattg aaaacatccc taaggataaa 11520
gacaaaatgt tcagtctcaa aatataattt gaaacttttc aaacatagat cgaatagaaa 11580
ctcaccattc aattcaagca tatattttgg tttggaatat ccagccttga aaaaacgcga 11640
actcatcccc gccattggaa ttataatcat actgcagcct ccttaaaaat ttcatataat 11700
ctaaatgcat tagcaaatag tgcatcttgc ctttttttgt catcggaatg aaggggaagc 11760
attgataaaa ataaatgtat ttgcatcgca tacaatgatt tttcggagat tgaatatttc 11820
tcttttatta tagaaacaaa tgttgattga atttcaaaca atttattatc aatattaatt 11880
ttgaattcaa tactatgagt tttatttttt ttatttatta tataatatcc tgcaattatc 11940
caatcataga gccctagtat tgaatgtgat aatttagcta tatcataacg aaaatcacca 12000
taaatactta tttctccaga gtggttcaat cctctgggat caaaaacttg tattctacca 12060
gttctaaagt taaaaattat attactaaag cataaatcgc catgcataat agttttatat 12120
tgcagttcac ttgggataaa tttattagta tcataaagaa tatcattaat tgaaacgctt 12180
atattattat taaaattcca ttttgcattt ggatcaatat ttaaatctgt tatgtacttg 12240
ctaacccgct caatcgtttt ttcataaaat aaatcttgca gtatattttt gtcagtatca 12300
attgaatgat attctttgca cagatcgatg aagtctaaac aacttattaa tatatttgtt 12360
aaaatattat ttggtaggcg agaaaaaaca aataattcat ttaacgtcgt attatataaa 12420
tattcaagct tataactctt tctgatatga tcaaacggtt ccaataacat tggagtatag 12480
atctttaatt ctccgggaat agtttcaaac cattttgatt cagcttcaat tttactttca 12540
tttgaacttg atttgataac ggattttgtt gtaatgcata attcattaaa tgcacgctgg 12600
gttgtgtatt gtacttttga cttatagtat gtattaatat gtccaaaatc aagccaatca 12660
gacacgtata tagaagctaa actatagctg tcgtgatact ttttaagtgc cgccgtaaaa 12720
tcaaattttg aagtaactaa ttccctaata aaaaaattcg gtttactaaa agaaaaatac 12780
ccacaaatta catttttatt atcttctcta ctgacggctc ttaactctgt ttcgtaaaaa 12840
aatgaccatt gataattatc atcagaatga cttattgcta ctaaatcatc ccctgcagga 12900
atttttttaa agagtgtatc gccaaacaat aattgtaagc ctttgtcatc tttatctcct 12960
attaaattcc atgcggtaac tatcgcttgc cctaatgtca agttactatc gacaggaatc 13020
attgttactt tattacgaag caaccattca taatcatgtt tgtcaaacac aaaatcttcc 13080
ggtaaaacca gatatattgc atgaccatca tgccctaaag atacttgatg cttaaataat 13140
cgtttattag ctaaaggaag aaagcttgga ggaatagaac caaattcggc ccctaattct 13200
tgttgaacat aggaaccaga cattattaga agcatttttt ctcctgttct aacatattag 13260
aaatctcttc taaggtcata ttgcaaagtt ctgatggtcg aatagctcta tcatcaacat 13320
aaaacccctc atctccacac caaggtttac caacaatcac ctcatcataa gggactctat 13380
tttcattcaa ccaatcaatt ataactggta atgtatgaat attaatctta cctatatttt 13440
ctttatatgt cctcatattc cttgctgtaa aaataacaat ataaaaacca ttaagcttat 13500
attcatacaa tttttcaatt agttttttgt ttggagttgc atgtgaatat tttcctgata 13560
aattaaaaga tatggtgtta tctaaatcta caattatttt tttcatatag tgcatctttc 13620
attgttaagt gatatctata ccttgcaata aataactcat tcccgcaaag aaagtatttg 13680
ttctagcgat atttttcgag gcgctacaat attttttatt tttaaattag aaaccttgca 13740
atcatataca ttagcccaag cacataaccc tacattaata tgacctgaat aataaacatt 13800
agaacttgag atcaaggatg ttagctgact atatatatta tctaaaccat ggacacacat 13860
cagctttttc attatatcag gatcgccgta aaataattgg tcgcctatgc caaaccccca 13920
ttctctaaat atccacccat tactatcctc acaataaaca gaatcatcta catctatatc 13980
attaattgtc acattatcaa cttgcaataa agcatcaggc cttatcttta taatgcacct 14040
atatttatcc caattatgat ttttaagact acagaaccaa aatgaattat ggtaatacat 14100
tttttctgca ttactcattt tattatatgg atattcccca tcatctttaa tgtttattaa 14160
aactgagtta catccagaga aaaaacttga atatatctcc tctaaattat tatttttata 14220
tgaacttaag ctcaagtctt ttaattcatc atagtgttcg tctacaaacg agtagttatc 14280
tggctctgaa acatattgtg cagcctcgct gtcaaatatc ctacatattc tttctttaga 14340
taactgtgtg tgtccgatat ctttccatgt actaataaaa acatcaacat cagaaggaat 14400
cgttatttta cttacgagat taggtagggc atctataaaa cctcttgatt gtccagttat 14460
gaataaagct atttgcctgt ttgtatttaa tgaaacatta cttgaaataa agtcatcaat 14520
tacagatatt ctacttttta taatgcaaga aatgataccg gagtattcgt cagcattagc 14580
caagacaatt tcatttatat gacacaaaaa attacgttct tgctgaggtg tttcataaaa 14640
cctttttgat gttagactaa gagccagcaa taataattta atggagttaa aagtacatcc 14700
attagagttt atcacaagat tgtaaacata gtttggtata tgtggtcgac tcataagtcg 14760
tttaaaagat gtgtctccta acgaggaaag atcagtatta ttcttattga atcttttaat 14820
ataaaactcg ggaaaaaaga atgcaaaata aaaagtccct gcattgctta acttattagg 14880
tataataata tattcaaaat actcactcaa ccataggtca aaaagttcaa gtatttttaa 14940
atgagcatta aatcccttac cagtagagat attttttata cagcttaatg ttctctcatc 15000
taaatgattt acaattaatt gtacaagttt aattttatct tctttctttg aaagacttaa 15060
tatatgatca aatgttaagt tttttagcat gttggatttg cccctatgtt tccagatacc 15120
tgttatcact taacccatca ctggcccact gccgcagata ttcccgtggc gagcgataac 15180
ccagcgcact atgcggatgc cattcgttat aatgctcgaa cgcctctgca aggttctttg 15240
ctgccgttaa cccgtctggt ttgggcatga tacttatgta gtcacgcttt atcgttttca 15300
cgaagctctc tgctattccg ttactctccg gactccgcac tgccgtgttc ttcggttcaa 15360
gtcccaacat cctggcgaac tgacgtgttt cattcgcccg gtagcatgaa ccattatccg 15420
tcagccactc cactggagac gccggaagct cgctgccaaa gcggcgttcc actgctccca 15480
gcatgacgtc ctgtactgtt tcactgtcga agccacccgt tgtgaccgcc cagtgcagtg 15540
cctcacggtc acagcagtcc agcgcgaacg tgacccgcag tttttctccg ttatcacagc 15600
ggaactcaaa cccgtcagag caccatcgct gattactttc tttcacagcc actctgccgg 15660
tatgtgcccg tttcgatggc ggtacagcgg gttttcgctc aagcaacagc gcattctggc 15720
gcatggtccg gtaaacacgt ttggcattga tcgcaggcat accatcaagt tctgtttgtc 15780
tgcgaagcag cgcccatacc cgacgataac catacgtggg cagctctccg ataacatggt 15840
gtatacggcg aagcacatcc gtatcatccg tgtgacggct gcggcggccg tccttccagt 15900
catcggctcg tctgagaatg acgtgcaact gcgcacgcga cacccggaga caacggctga 15960
cgaagcttac tccccatccc cgggcaataa gggcgcgtgc gctatccact tttttgctcg 16020
cccatattca acggcttctt taaggagttc attttccatc gtttttttgc cgagcagacg 16080
ctggagttct ttaatctgct tcatggcggc agcaagttca gaggcaggaa cgacctgttc 16140
tccggcagcc acagcagtaa gacttccctc ctggtattgc ttacgccaga gaaatagctg 16200
gctggctgcc acaccatgtt gccgggcaac aagggagacc gtcattcccg gttcaaagct 16260
ctgctgaacg atagcgatct tttcctgtgt agtacgccgt ctgcgtttct ccggccctaa 16320
gacatcaatc atctgttctc caatgactag tctaaaaact agtattaaga ctatcactta 16380
tttaagtgat attggttgtc tggagattca gggggccagt ctacatgttt atcacttgta 16440
atatatcaat aattataaat cattctctat tttttcccag gtatattttc tacattcatt 16500
caaattagtt aatggtgaat atttatattt ttttatgcct agcctactta atgattcgtt 16560
aacaacttta aaatgatttt ccttttgaat atccaacttt tttatagacg tattttcacc 16620
atgcaatacg cgattataac aaattttgtt tatatgcttg aacggtccaa cttcactaag 16680
ttttaaatac atatcgtaat caactgcgtt gctgatcgat tcgttgaaac cttcagttag 16740
gttccatgct cttgctgtga acatcctgaa atgatgacat atcattgcac tagtaagttt 16800
ttctcgcgaa taaatgggcc aattatagcc atttgatatc aaattacctt cacgatctat 16860
attacggtta gttgtataaa cacatgccaa tgatagatct tttctaaatt catctagaca 16920
tagttcaaca gcatctggtt caagaaagtc atcagagtct aactgaccta tatagaatcc 16980
ccgacacaat ctaactgctg tattagatgc tgaaccaatt cctttgtttt tttgtgaaat 17040
aaaacgaact cgaggatggt ttgcataatg ctcctgaaga atccgcaatg tatcatctgt 17100
ggaaccatca tcgcatatgc atacttctaa gtcagttatt gtctgattaa gggcgctttc 17160
aacacaacga acaatatatt tagagcagtt ataggcggga atatatatag atactagtgg 17220
tactcttttt aatgtcgcgg attctatttt ttcttttttt ctatagaaat aaggaacttt 17280
ttgctgtaac aattgaacag taatattttt ccctgccgca cgatccgtct cgttttcttt 17340
cccgggtggt tcttgatgat atgccattgc tccttcaaca gaccgaaagt aacatccttc 17400
tctgtagaga cgatatccaa actcattatc ctcccccccc caatgcgtaa actcttcatc 17460
aaaccatcct gcacggaaaa gccatttttt cgcaaaagcg acattacctc cgctaaaaaa 17520
tcgaaatggt gtgttgcata atcttagatt atcggtattt ttgaaatgtt ctattcgcca 17580
gtcaactgat ttgttttgct caaccttgcc tgcaacctga ttattagtaa tgatttcagg 17640
aatttcattt attagtgatt tttgggaaag gaaatctaaa tatgtatgct tgcttgtatc 17700
tatatatttt ctagggccaa ttagagcaac attatcgtcc accgctaata gttccatata 17760
tgactgaacc catagtgggt tcggagccat atcacaatcc agaattgcaa cataattata 17820
ctttgcagcc ctaagcccaa gatttctaac agcacacagt tgatatccat aatccttctg 17880
acgtacatat tttatattta ataaactttc aaattctctt actatttctt caatattttc 17940
tttacttcca tcatcggcaa caataacttc atagtcgtat atggtctttt ggttacaaag 18000
acaagcaagt gtaattgcaa gtatttttgc tcgattatat gtaggaatta caatactaag 18060
cccgtcaatg attaactgtt ttcttggata atcatcaagc tcttttcttt tccccgccca 18120
aacataatcg tttgtgctct caggtaacgg cggtaaagtt aaatcactag gccaatctaa 18180
aggaatgggt tcgacttcct ttaactccgc ccgttctgat ttctttgcgg ttatttctcg 18240
gtatttgctt attatttcat ttttttcaac ctcgttcaga ctaattgctt tggcgttaga 18300
acacattatt tttgttgctg catcaatatc aataacagct ttacgattta acttatcaac 18360
ttcttcagaa agattgagtg cggtttggca taattttata tttgcttcga cccaactaac 18420
atcataaatt tcagcaacct tctcaaaaag agataaagct tggcgataat ttttgttttt 18480
atataaattt attgcttgat taagaatact catattattt caacctaatc tagtataatt 18540
aaagtatcaa cacgcataat aatcatgtcc ctatatatat attttcatgc gatatcataa 18600
tcttgcccca ttaaatccta attgatactt gaagaaatat tgagaatcgt atttttaatt 18660
tattatttta tttttttaat taaataaagc gtaaaccact atgacttaaa caattagaaa 18720
aaagctattt cacttaacta agaaaatttt cactattaat tcgcacgcat ttatagccga 18780
tattttaact ttatatttag tagcctggat ttattttcca cagtatttaa cccctacctg 18840
agaattattt tttgttcttt tgaattgacg tattgttctg tatatcgaaa atggcaaaga 18900
tatcaaccct agtggaaaat tatttttatt tatgattaat tttcctaatt gataggataa 18960
atgttttttc accctttctg cctcatgttt atcagcataa agaaatattg atggcagaga 19020
gacttgatat tcactatcgt atttcttttt ccatgttcgc cattcggata tcaaagcaaa 19080
aggaatgcta attaatccta aaaatgtttt tgaacgacta accattacag cacccaggcg 19140
atatccaatg tcctgtttta tacgttctgc tgcaccatat aattctggaa gttgtttttt 19200
ttctaatcgt tgattatcaa taaaatattg ttcaagtttt tgttgtacta aatgcaattg 19260
attaagcagt agttcttttt cacaacttaa tttttccaat ctttgttgtt gcaattcatt 19320
tttattttgt tctttcttta acagcgattc aaaattttct atggcgcatt caagctcctg 19380
aacttgtatt gtcttatttt ttattattaa atcatattga atcaattctt ctttagagtc 19440
actcaattct tttaaaatag cctgatatgc atttaattgt tttgatgtgt gtaactcgtt 19500
atctaaaatt atttttttag aggactgata taatccattg acaatatcta atgttatttg 19560
gcgttgtttt ataaatgtct cccatataaa ggaaggcttg taattttcct tttctaaaac 19620
cctaagcgga gtatttgcat tagattgtaa ttcaaaataa agctctttac aatctggata 19680
atcattcaat acattgaaaa ttaaatattc ctctgtttca ctctgtttga atataatatc 19740
tccggttcct atatcaatac ctgatagaga cattatttcc tgatgctctt tttccagagt 19800
aatcgaagct tcagccgtct taaaatcatt tacagattgt tctagtgaat gattaatcgt 19860
atttgaaaat gaaagaccaa atttcaactt aagcttatgt tgaagttgtt gtatgcaatc 19920
ctctgcatta cgtttgactt gttctgagct tactaataaa cacctaccgc gattattaag 19980
aaaaaagtgt aacaatgctg tattataggc aagccagttt ttaattaaat gttctgacgt 20040
atagttggac gatatatttt gatctgaaaa ataatttgtt aaaatagact ttggatgatc 20100
gtaaattaga ataaatgtaa tgttttcatc aacactcttc caatattcta atgtatggat 20160
tgcattagga tccgaccatc cgcacaattt ttggttcaaa ttactaagca tcaagtcaag 20220
ggctatacca ttccagacag tagaaacgtg taatggttcg aaatcagcac tatctgttac 20280
agtgtatata tcaggggatt gatatgcctt acgaagcgtc tgagtgatat cttgggggct 20340
taaattttct cgcttcgatg gacatagaga attcattcct ctttgatgca aaagttcttc 20400
tacaatttga taattagagc tcggatgacc aactattact agtctattca tgatgtttta 20460
tccccccaag gcagaaaacc ctttattcgc catttgttta gttagcttta attaacaccc 20520
catctacttt ttagtgtcta cgaatttatt aaaccaattc accacactaa atttcgatta 20580
ttaagatgcc aatagatata gaagttatcg taaaattttg ctttacctta tgcatgatta 20640
aatataacca tttgggtttt tcatttgcca gcgccaggca tcctcaagca ttgtttccaa 20700
ttccctttta gctttccaat tgagatactt atttgctttt tctggtgatg accaactttc 20760
agcaatatcc ccatctcttc tcgaaacaat ttcatatgga attctaaccc cagatatttt 20820
ttcaaaggta gaaaccagct ctaaaacaga atatccttta ccagtaccta aattaaaaac 20880
atgataatta gtgttattat cacggaaaag gtaagataaa gcagccacat gcccttccgc 20940
taaatccatt acgtgtatat aatcacgaac accggttcca tcctttgtag ggtaatcccc 21000
cccaaacacc ataagttttt ctagtttacc catagcaact tgtaatatat aaggaactaa 21060
attgcttggt atatcagcgg gactttcacc gatcattccc gactcgtgag cacctgttgg 21120
gttaaaatat ctcagacaca aaaaattagt atcgctatat ttttttgcaa tatctctaat 21180
catcaattct gatatatact ttgatgtacc atatggattt aatgttcctc ctatatggca 21240
atcttctgta acaggcatta ttttgctttc accataaacc gttgcagaag agctaaaaat 21300
aaaattagcc acatcgtttt ttatagcgca attaattaat tgcaacgtcc ctgaaacatt 21360
attatcataa taaaaaatgg gttttattaa agattcagca acagactttg caccggcaaa 21420
atgcattata caatcaaatt tgtgtttttt tagaatttga ttaacttctt tttcattgtt 21480
gatgttcaac tcatagaaag taactttttt tttagctatt aattcaatcc ttcgaatgct 21540
ctcgcaagat gaattaatta agttgtcaat gattacaaca ttgtaacctt tattcagaag 21600
acataaacta gtatgcgagc caatatagcc tgctccacct gtaactaata tattcatttt 21660
tcacccttga aaacaacatc agtaattatt ttgttccgtt atatactctt ctatcccctc 21720
ctgaacatcc tcatgaaaac taaccgcatt gtcatcctta aaaacaatgg ccacatcaca 21780
aaactctttc aatgaattca aactatgtga aaccattaaa aaactagatt ctttatgcct 21840
ttctttaaac aattgagcgc atttttcttt aaacctggca tcaccgactg cggttacttc 21900
atcgacgata taataatcaa atttaaatgc catacttaaa ccaaagccta ggcgagatcg 21960
cataccagag gagtaagttt tgatcggcat atcaaaatac ttgccgagtt cggcaaattc 22020
ttcaacaaac tcaattttct ctttcagttc ttcttgcttc gcgtataacc tcgcgacaaa 22080
ttttacattt tcgcgtccgg ttaaacttcc ctgaaatcca cctgcaaggc cgactggcca 22140
tgatatcgtt ttattggtga tgatctttcc gctatcgggg cggtcaatgc caccaatcat 22200
tctcagtaac gttgatttac ccgcaccatt acgaccaata aaggcaacac tttttcctga 22260
agggatttca atatttaaat tcttaaagac ataatgtcga cccactggcg tgcgatatga 22320
cttcgtcaaa ttttcaatct taatcatgat gtcagcattg cctcttcacg cgttcggtat 22380
aacgccagac cgatgaacag ggtgaccaga gtgaacattg caaggtagtt cagactcacg 22440
ccttcgctga tatagccagg cataactgcc tcgcggctta actctacgac atgcactaat 22500
gggttccaga gtagatatga ccagtattgc tttggaatcg agtgtaaagg gaacatgatg 22560
caggagatga aatacagcgg cttaagcagt atcggcagga ccttttgcat ttcagggaaa 22620
gtcttaccaa cgaccatgaa tattaagcca acgccacatg aaagaatgat taacaaactc 22680
caggtaagca caaattgtaa aaagtttgtt atttcgaaat attcgcctgc catccagatg 22740
ataagcataa gcaatatata aacagcaacg taaatcagtg tctcaagcaa tgcacgcgca 22800
atgatcgtat cgatgggttt tactggtcga taattaaaca gcccctgatt cgcttcaata 22860
gcacctacag aacgattgct gatactgcta aagataaaaa agggaatcag gccattaagt 22920
aaaaacaccg ggaatgagat gtctggcatc gtgcggtgca taatgtaacc aaaaatgccc 22980
aacagtatca gcaaatgcgc agagggttcg agaatcgccc acagatatcc cagacggaac 23040
ttaccaaagc gtgttcgtat ttctcgtaga aataatgcct ctacggtgac tttctggact 23100
tcaaatccac ttcttgccat ttgatgatgt gaccctattc tcttcaggta tgctaccgcc 23160
cctggcttaa cagctaccaa tacactggag gtaatacttg tttgtaactg gataaaattt 23220
actcagacgg 23230
<210> 118
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Primer
<400> 118
gcacctccat gagacattgc 20
<210> 119
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Primer
<400> 119
ccactgccat acggtttagc 20
<210> 120
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Primer
<400> 120
gcttgccttt gcagaaacgg 20
<210> 121
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Primer
<400> 121
ccaacaatat cgagcagtgg 20
<210> 122
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Primer
<400> 122
gtcattcgtc agaacggtgc 20
<210> 123
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Primer
<400> 123
ccagtgcctg ataatcagc 19
<210> 124
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Primer
<400> 124
ggcttaacgc tgtggaagtc 20
<210> 125
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Primer
<400> 125
atattgggat tcctggtcgc 20
<210> 126
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Primer
<400> 126
acgacatcaa aggcttgacg 20
<210> 127
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Primer
<400> 127
atagccctga agctgaagcc 20
<210> 128
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Primer
<400> 128
cgagtgattg cttggtatcc 20
<210> 129
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Primer
<400> 129
aaacgattga gcgggttagc 20
<210> 130
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Primer
<400> 130
agagtggttc aatcctctgg 20
<210> 131
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Primer
<400> 131
tgtcttggct aatgctgacg 20
<210> 132
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Primer
<400> 132
cgagtagtta tctggctctg 20
<210> 133
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Primer
<400> 133
gtcagttaga ctctgatgac 20
<210> 134
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Primer
<400> 134
cttgaacggt ccaacttcac 20
<210> 135
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Primer
<400> 135
agttcaggag cttgaatgcg 20
<210> 136
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Primer
<400> 136
ttcgcacgca tttatagccg 20
<210> 137
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Primer
<400> 137
tcatcttgcg agagcattcg 20
<210> 138
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Primer
<400> 138
cttccgctaa atccattacg 20
<210> 139
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Primer
<400> 139
agatctattt atccctgcgg 20
<210> 140
<211> 257
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Sequence
<400> 140
gctcagcaag agcagaaaga cagcgacggt gtagccggtt ggatcaagga tatgtttggt 60
agtaattaac atctaagcgt gaaataccgg atggcgagtt gccatccggt aaaataacat 120
cccatctact gcaggctagc taattcttga catagtttca cagattgtgt tataataact 180
acacgacgtt catcgtcgtc aatgtacagg aggtcaacaa atggattttt gcttattgaa 240
cgagaaaagt cagatct 257
<210> 141
<211> 5409
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic plasmid pCX027
<400> 141
ttaccaatgc ttaatcagtg aggcacctat ctcagcgatc tgtctatttc gttcatccat 60
agttgcctga ctccccgtcg tgtagataac tacgatacgg gagggcttac catctggccc 120
cagtgctgca atgataccgc gagacccacg ctcaccggct ccagatttat cagcaataaa 180
ccagccagcc ggaagggccg agcgcagaag tggtcctgca actttatccg cctccatcca 240
gtctattaat tgttgccggg aagctagagt aagtagttcg ccagttaata gtttgcgcaa 300
cgttgttgcc attgctacag gcatcgtggt gtcacgctcg tcgtttggta tggcttcatt 360
cagctccggt tcccaacgat caaggcgagt tacatgatcc cccatgttgt gcaaaaaagc 420
ggttagctcc ttcggtcctc cgatcgttgt cagaagtaag ttggccgcag tgttatcact 480
catggttatg gcagcactgc ataattctct tactgtcatg ccatccgtaa gatgcttttc 540
tgtgactggt gagtactcaa ccaagtcatt ctgagaatag tgtatgcggc gaccgagttg 600
ctcttgcccg gcgtcaatac gggataatac cgcgccacat agcagaactt taaaagtgct 660
catcattgga aaacgttctt cggggcgaaa actctcaagg atcttaccgc tgttgagatc 720
cagttcgatg taacccactc gtgcacccaa ctgatcttca gcatctttta ctttcaccag 780
cgtttctggg tgagcaaaaa caggaaggca aaatgccgca aaaaagggaa taagggcgac 840
acggaaatgt tgaatactca tactcttcct ttttcaatat tattgaagca tttatcaggg 900
ttattgtctc atgagcggat acatatttga atgtatttag aaaaataaac aaataggggt 960
tccgcgcaca tttccccgaa aagtgccacc tgacgtctag atctgaattc agctgtacaa 1020
ttggtaccat ggatgcatat ggcggccggg ccctacgtac gcgtgttaac cggtgagctc 1080
actagaggat ccagccgacc aggctttcca cgcccgcgtg ccgctccatg tcgttcgcgc 1140
ggttctcgga aacgcgctgc cgcgtttcgt gattgtcacg ctcaagcccg tagtcccgtt 1200
cgagcgtcgc gcagaggtca gcgagggcgc ggtaggcccg atacggctca tggatggtgt 1260
ttcgggtcgg gtgaatcttg ttgatggcga tatggatgtg caggttgtcg gtgtcgtgat 1320
gcacggcact gacgcgctga tgctcggcga agccaagccc agcgcagatg cggtcctcaa 1380
tcgcgcgcaa cgtctccgcg tcgggcttct ctcccgcgcg gaagctaacc agcaggtgat 1440
aggtcttgtc ggcctcggaa cgggtgttgc cgtgctgggt cgccatcacc tcggccatga 1500
cagcgggcag ggtgtttgcc tcgcagttcg tgacgcgcac gtgacccagg cgctcggtct 1560
tgccttgctc gtcggtgatg tacttcacca gctccgcgaa gtcgctcttc ttgatggagc 1620
gcatggggac gtgcttggca atcacgcgca ccccccggcc gttttagcgg ctaaaaaagt 1680
catggctctg ccctcgggcg gaccacgccc atcatgacct tgccaagctc gtcctgcttc 1740
tcttcgatct tcgccagcag ggcgaggatc gtggcatcac cgaaccgcgc cgtgcgcggg 1800
tcgtcggtga gccagagttt cagcaggccg cccaggcggc ccaggtcgcc attgatgcgg 1860
gccagctcgc ggacgtgctc atagtccacg acgcccgtga ttttgtagcc ctggccgacg 1920
gccagcaggt aggccgacag gctcatgccg gccgccgccg ccttttcctc aatcgctctt 1980
cgttcgtctg gaaggcagta caccttgata ggtgggctgc ccttcctggt tggcttggtt 2040
tcatcagcca tccgcttgcc ctcatctgtt acgccggcgg tagccggcca gcctcgcaga 2100
gcaggattcc cgttgagcac cgccaggtgc gaataaggga cagtgaagaa ggaacacccg 2160
ctcgcgggtg ggcctacttc acctatcctg cccggctgac gccgttggat acaccaagga 2220
aagtctacac gaaccctttg gcaaaatcct gtatatcgtg cgaaaaagga tggatatacc 2280
gaaaaaatcg ctataatgac cccgaagcag ggttatgcag cggaaaagcg ctgcttccct 2340
gctgttttgt ggaatatcta ccgactggaa acaggcaaat gcaggaaatt actgaactga 2400
ggggacaggc gagagacgat gccaaagagc tacaccgacg agctggccga gtgggttgaa 2460
tcccgcgcgg ccaagaagcg ccggcgtgat gaggctgcgg ttgcgttcct ggcggtgagg 2520
gcggatgtcg aggcggcgtt agcgtccggc tatgcgctcg tcaccatttg ggagcacatg 2580
cgggaaacgg ggaaggtcaa gttctcctac gagacgttcc gctcgcacgc caggcggcac 2640
atcaaggcca agcccgccga tgtgcccgca ccgcaggcca aggctgcgga acccgcgccg 2700
gcacccaaga cgccggagcc acggcggccg aagcaggggg gcaaggctga aaagccggcc 2760
cccgctgcgg ccccgaccgg cttcaccttc aacccaacac cggacaaaaa ggatccccaa 2820
ttctcatgtt tgacagctta tcatcgataa gctttaatgc ggtagtttat cacagttaaa 2880
ttgctaacgc agtcaggcac cgtgtatgaa atctaacaat gcgctcatcg tcatcctcgg 2940
caccgtcacc ctggatgctg taggcatagg cttggttatg ccggtactgc cgggcctctt 3000
gcgggatatc gtccattccg acagcatcgc cagtcactat ggcgtgctgc tagcgctata 3060
tgcgttgatg caatttctat gcgcacccgt tctcggagca ctgtccgacc gctttggccg 3120
ccgcccagtc ctgctcgctt cgctacttgg agccactatc gactacgcga tcatggcgac 3180
cacacccgtc ctgtggatcc tctacgccgg acgcatcgtg gccggcatca ccggcgccac 3240
aggtgcggtt gctggcgcct atatcgccga catcaccgat ggggaagatc gggctcgcca 3300
cttcgggctc atgagcgctt gtttcggcgt gggtatggtg gcaggccccg tggccggggg 3360
actgttgggc gccatctcct tgcatgcacc attccttgcg gcggcggtgc tcaacggcct 3420
caacctacta ctgggctgct tcctaatgca ggagtcgcat aagggagagc gtcgaccgat 3480
gcccttgaga gccttcaacc cagtcagctc cttccggtgg gcgcggggca tgactatcgt 3540
cgccgcactt atgactgtct tctttatcat gcaactcgta ggacaggtgc cggcagcgct 3600
ctgggtcatt ttcggcgagg accgctttcg ctggagcgcg acgatgatcg gcctgtcgct 3660
tgcggtattc ggaatcttgc acgccctcgc tcaagccttc gtcactggtc ccgccaccaa 3720
acgtttcggc gagaagcagg ccattatcgc cggcatggcg gccgacgcgc tgggctacgt 3780
cttgctggcg ttcgcgacgc gaggctggat ggccttcccc attatgattc ttctcgcttc 3840
cggcggcatc gggatgcccg cgttgcaggc catgctgtcc aggcaggtag atgacgacca 3900
tcagggacag cttcaaggat cgctcgcggc tcttaccagc ctaacttcga tcactggacc 3960
gctgatcgtc acggcgattt atgccgcctc ggcgagcaca tggaacgggt tggcatggat 4020
tgtaggcgcc gccctatacc ttgtctgcct ccccgcgttg cgtcgcggtg catggagccg 4080
ggccacctcg acctgaatgg aagccggcgg cacctcgcta acggattcac cactccaaga 4140
attggagcca atcaattctt gcggagaact gtgaatgcgc aaaccaaccc ttggcagaac 4200
atatccatcg cgtccgccat ctccagcagc cgcacgcggc gcatctcggg cagcgttggg 4260
tcctggccac gggtgcgcat gatcgtgctc ctgtcgttga ggacccggct aggctggcgg 4320
ggttgcctta ctggttagca gaatgaatca ccgatacgcg agcgaacgtg aagcgactgc 4380
tgctgcaaaa cgtctgcgac ctgagcaaca acatgaatgg tcttcggttt ccgtgtttcg 4440
taaagtctgg aaacgcggaa gtcagcgctc ttccgcttcc tcgctcactg actcgctgcg 4500
ctcggtcgtt cggctgcggc gagcggtatc agctcactca aaggcggtaa tacggttatc 4560
cacagaatca ggggataacg caggaaagaa catgtgagca aaaggccagc aaaaggccag 4620
gaaccgtaaa aaggccgcgt tgctggcgtt tttccatagg ctccgccccc ctgacgagca 4680
tcacaaaaat cgacgctcaa gtcagaggtg gcgaaacccg acaggactat aaagatacca 4740
ggcgtttccc cctggaagct ccctcgtgcg ctctcctgtt ccgaccctgc cgcttaccgg 4800
atacctgtcc gcctttctcc cttcgggaag cgtggcgctt tctcatagct cacgctgtag 4860
gtatctcagt tcggtgtagg tcgttcgctc caagctgggc tgtgtgcacg aaccccccgt 4920
tcagcccgac cgctgcgcct tatccggtaa ctatcgtctt gagtccaacc cggtaagaca 4980
cgacttatcg ccactggcag cagccactgg taacaggatt agcagagcga ggtatgtagg 5040
cggtgctaca gagttcttga agtggtggcc taactacggc tacactagaa ggacagtatt 5100
tggtatctgc gctctgctga agccagttac cttcggaaaa agagttggta gctcttgatc 5160
cggcaaacaa accaccgctg gtagcggtgg tttttttgtt tgcaagcagc agattacgcg 5220
cagaaaaaaa ggatctcaag aagatccttt gatcttttct acggggtctg acgctcagtg 5280
gaacgaaaac tcacgttaag ggattttggt catgagatta tcaaaaagga tcttcaccta 5340
gatcctttta aattaaaaat gaagttttaa atcaatctaa agtatatatg agtaaacttg 5400
gtctgacag 5409
<210> 142
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic polylinker
<400> 142
ttaattaagg gtttaaacta c 21
<210> 143
<211> 28641
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic plasmid pDD61
<400> 143
ctcgggccgt ctcttgggct tgatcggcct tcttgcgcat ctcacgcgct cctgcggcgg 60
cctgtagggc aggctcatac ccctgccgaa ccgcttttgt cagccggtcg gccacggctt 120
ccggcgtctc aacgcgcttt gagattccca gcttttcggc caatccctgc ggtgcatagg 180
cgcgtggctc gaccgcttgc gggctgatgg tgacgtggcc cactggtggc cgctccaggg 240
cctcgtagaa cgcctgaatg cgcgtgtgac gtgccttgct gccctcgatg ccccgttgca 300
gccctagatc ggccacagcg gccgcaaacg tggtctggtc gcgggtcatc tgcgctttgt 360
tgccgatgaa ctccttggcc gacagcctgc cgtcctgcgt cagcggcacc acgaacgcgg 420
tcatgtgcgg gctggtttcg tcacggtgga tgctggccgt cacgatgcga tccgccccgt 480
acttgtccgc cagccacttg tgcgccttct cgaagaacgc cgcctgctgt tcttggctgg 540
ccgacttcca ccattccggg ctggccgtca tgacgtactc gaccgccaac acagcgtcct 600
tgcgccgctt ctctggcagc aactcgcgca gtcggcccat cgcttcatcg gtgctgctgg 660
ccgcccagtg ctcgttctct ggcgtcctgc tggcgtcagc gttgggcgtc tcgcgctcgc 720
ggtaggcgtg cttgagactg gccgccacgt tgcccatttt cgccagcttc ttgcatcgca 780
tgatcgcgta tgccgccatg cctgcccctc ccttttggtg tccaaccggc tcgacggggg 840
cagcgcaagg cggtgcctcc ggcgggccac tcaatgcttg agtatactca ctagactttg 900
cttcgcaaag tcgtgaccgc ctacggcggc tgcggcgccc tacgggcttg ctctccgggc 960
ttcgccctgc gcggtcgctg cgctcccttg ccagcccgtg gatatgtgga cgatggccgc 1020
gagcggccac cggctggctc gcttcgctcg gcccgtggac aaccctgctg gacaagctga 1080
tggacaggct gcgcctgccc acgagcttga ccacagggat tgcccaccgg ctacccagcc 1140
ttcgaccaca tacccaccgg ctccaactgc gcggcctgcg gccttgcccc atcaattttt 1200
ttaattttct ctggggaaaa gcctccggcc tgcggcctgc gcgcttcgct tgccggttgg 1260
acaccaagtg gaaggcgggt caaggctcgc gcagcgaccg cgcagcggct tggccttgac 1320
gcgcctggaa cgacccaagc ctatgcgagt gggggcagtc gaaggcgaag cccgcccgcc 1380
tgccccccga gacctgcaga tccacatcct tgaaggccgc agcgacgagc agaaggaaac 1440
cctcattcgg gaagtcagcg aggccatctc gcgctccctg gatgcgccgc tgaccagcgt 1500
gcgagtgatt atcacggaga tggccaaggg ccacttcggc atcggcggcg aactggccag 1560
caaggtcaga cgctgaagtg gagatgccca agggcacttc gggtcgagga acccgacctg 1620
cattgggacg cggccacgga gagcgcgggc aaacgccggc actatagcca gtggagtttg 1680
taaaacgcta tttcagagct tggagagtgt ctaagaaagc cggggcgatg ccaacccatc 1740
ccttcttcgg ctatgcatcg ttcgtaatca agccacttcc tttttgcatt gacgcagggt 1800
gtcggaaggc aactcgccga acgcgctcct atagttttca gcgaagcgtc ccaaatgtaa 1860
gaagccgtag tctagggcta tctcagttat actacgcaca ttggcactgg gatcgttcaa 1920
gcaggcgcgg atgctttcga gcttgcggtt gcggatgtag ttcttcggcg tggtgccggc 1980
atgcttctcg aacaaattgt agagcgagcg tggactcatc atcgccagct ccgctaaccg 2040
ctcaaggctg atattccgtt tgagattctc ctcaatgaat tgaacgactc gctcgaaaga 2100
cgggttacct ttgctgaaaa tttcacggct gacattgctg cccagcattt cgagcagctt 2160
ggaagcgatg atccccgcat agtgctcttg gacccgaggc atcgactttg tatgttccgc 2220
ttcgtcacaa actaacccga gtagattgat aaagccatcg agttgctgga gattgtgtcg 2280
cgcggcgaaa cggataccct ccctcggctt gtgccaattg ttgtcactgc atgcccgatc 2340
aaggaccact gagggcaatt taacgataaa tttctcgcaa tcttctgaat aggtcaggtc 2400
ggcttggtca tccggattga gcagcaatag ttcgcccggc gcaaaatagt gctcctggcc 2460
atggccacgc cacaggcaat ggcctttgag tattatttgc agatgataac aggtctctaa 2520
tccaggcgag attaccctca cgctaccgcc gtagctgatt cgacacaggt cgaggcatcc 2580
gaagattctg tggtgcagcc tgcctgccgg gcgcccgccc ttgggcaggc gaatagagtg 2640
cgtaccgaca tactggttaa cataatcgga gactgcatag ggctcggcgt ggacgaagat 2700
ctgacttttc tcgttcaata agcaaaaatc catagttcac ggttctctta ttttaatgtg 2760
ggctgcttgg tgtgatgtag aaaggcgcca agtcgatgaa aatgcatctc gacgtgatgc 2820
gtatacgggt tacccccatt gccacgttgc gccatccttt ttgcaatcag tgaccacttt 2880
tccaagcaaa aataacgcca agcagaacga agacgttctt tttaagaagc gagaacacca 2940
gaagttcgtg ctgtcggggc atgcggcgac gaattggcgg ataaagggga tctgcaggtc 3000
ccgagcctca cggcggcgag tgcgggggtt ccaagggggc agcgccacct tgggcaaggc 3060
cgaaggccgc gcagtcgatc aacaagcccc ggaggggcca ctttttgccg gagggggagc 3120
cgcgccgaag gcgtggggga accccgcagg ggtgcccttc tttgggcacc aaagaactag 3180
atatagggcg aaatgcgaaa gacttaaaaa tcaacaactt aaaaaagggg ggtacgcaac 3240
agctcattgc ggcacccccc gcaatagctc attgcgtagg ttaaagaaaa tctgtaattg 3300
actgccactt ttacgcaacg cataattgtt gtcgcgctgc cgaaaagttg cagctgattg 3360
cgcatggtgc cgcaaccgtg cggcacccta ccgcatggag ataagcatgg ccacgcagtc 3420
cagagaaatc ggcattcaag ccaagaacaa gcccggtcac tgggtgcaaa cggaacgcaa 3480
agcgcatgag gcgtgggccg ggcttattgc gaggaaaccc acggcggcaa tgctgctgca 3540
tcacctcgtg gcgcagatgg gccaccagaa cgccgtggtg gtcagccaga agacactttc 3600
caagctcatc ggacgttctt tgcggacggt ccaatacgca gtcaaggact tggtggccga 3660
gcgctggatc tccgtcgtga agctcaacgg ccccggcacc gtgtcggcct acgtggtcaa 3720
tgaccgcgtg gcgtggggcc agccccgcga ccagttgcgc ctgtcggtgt tcagtgccgc 3780
cgtggtggtt gatcacgacg accaggacga atcgctgttg gggcatggcg acctgcgccg 3840
catcccgacc ctgtatccgg gcgagcagca actaccgacc ggccccggcg aggagccgcc 3900
cagccagccc ggcattccgg gcatggaacc agacctgcca gccttgaccg aaacggagga 3960
atgggaacgg cgcgggcagc agcgcctgcc gatgcccgat gagccgtgtt ttctggacga 4020
tggcgagccg ttggagccgc cgacacgggt cacgctgccg cgccggtagc acttgggttg 4080
cgcagcaacc cgtaagtgcg ctgttccaga ctatcggctg tagccgcctc gccgccctat 4140
accttgtctg cctccccgcg ttgcgtcgcg gtgcatggag ccgggccacc tcgacctgaa 4200
tggaagccgg cggcacctcg ctaacggatt caccgttttt atcaggctct gggaggcaga 4260
ataaatgatc atatcgtcaa ttattacctc cacggggaga gcctgagcaa actggcctca 4320
ggcatttgag aagcacacgg tcacactgct tccggtagtc aataaaccgg taaaccagca 4380
atagacataa gcggctattt aacgaccctg ccctgaaccg acgaccgggt cgaatttgct 4440
ttcgactatc ggcgcgccag agctcatcgt taatgtcttc gtgcgccgtc agtcggcgca 4500
cgttttttct ctctggtacc gtgtcactga tctagtcaat tactcgaagt atccacaagt 4560
gaagcatact aagtaatgta caagaatcaa aaaaatcggc tacgcaagtc gcgtagccga 4620
atcatttaag gatccttcca ttcaggtcga ggtggcccgg ctccatgcac cgcgacgcaa 4680
cgcggggagg cagacaaggt atagggcggc gcctacaatc catgccaacc cgttccatgt 4740
gctcgccgag gcggcataaa tcgccgtgac gatcagcggt ccagtgatcg aagttaggct 4800
ggtaagagcc gcgagcgatc cttgaagctg tccctgatgg tcgtcatcta cctgcctgga 4860
cagcatggcc tgcaacgcgg gcatcccgat gccgccggaa gcgagaagaa tcataatggg 4920
gaaggccatc cagcctcgcg tcgcgaacgc cagcaagacg tagcccagcg cgtcggccgc 4980
catgccggcg ataatggcct gcttctcgcc gaaacgtttg gtggcgggac cagtgacgaa 5040
ggcttgagcg agggcgtgca agattccgaa taccgcaagc gacaggccga tcatcgtcgc 5100
gctccagcga aagcggtcct cgccgaaaat gacccagagc gctgccggca cctgtcctac 5160
gagttgcatg ataaagaaga cagtcataag tgcggcgacg atagtcatgc cccgcgccca 5220
ccggaaggag ctgactgggt tgaaggctct caagggcatc ggtcgacgct ctcccttatg 5280
cgactcctgc attaggaagc agcccagtag taggttgagg ccgttgagca ccgccgccgc 5340
aaggaatggt gcatgcaagg agatggcgcc caacagtccc ccggccacgg ggcctgccac 5400
catacccacg ccgaaacaag cgctcatgag cccgaagtgg cgagcccgat cttccccatc 5460
ggtgatgtcg gcgatatagg cgccagcaac cgcacctgtg gcgccggtga tgccggccac 5520
gatgcgtccg gcgtacaaga tccacaggac gggtgtggtc gccatgatcg cgtagtcgat 5580
agtggctcca agtagcgaag cgagcaggac tgggcggcgg ccaaagcggt cggacagtgc 5640
tccgagaacg ggtgcgcata gaaattgcat caacgcatat agcgctagca gcacgccata 5700
gtgactggcg atgctgtcgg aatggacgat atcccgcaag aggcccggca gtaccggcat 5760
aaccaagcct atgcctacag catccagggt gacggtgccg aggatgacga tgagcgcatt 5820
gttagatttc atacacggtg cctgactgcg ttagcaattt aactgtgata aactaccgca 5880
ttaaagccga gcgatgataa gctgtcaaac atgagatccg ataaatcgat tgatagattt 5940
aaataagaac tgcagaagct agcttagatg ctcgtgaaat tgacgtgggc gctttgcagg 6000
gccgtcttaa tggcgttggt gtccacgagg atcgagtcgg gtgcggaaaa cggacggttc 6060
ttgttggtga aatcgctgtt accaatgtac agcgattcct tgttacgcag cgcctggatg 6120
tgccagcggg accacgaatc ccaatacttc tggcgatccg gcgagatacc ttggctggtg 6180
tagccggtcg tcgggctgtt catcaacgag tcggtgcggt gcgagcccag cgtcagcggc 6240
aacttgatcc gatgcaccgt ggaatcgccg aagatcagct tcagacgcgc gataaattcg 6300
ctatccgcac ccgttttcac acaatcccag acaccggcct tctgcaagac gtcggcacgg 6360
cgaaacagga gcgacgacgg attcagacgc ttcaaggggt acactgcgcg ggcatagaaa 6420
ataccgttgt cttgcaggcg cacccagtcc gagatggagc agatgagctt cggattgagc 6480
aacaaggggg agatttggcg gaacagcttt tccggatggc tccagtcatc cgaatcgtgg 6540
caggtgacga actcgccctt cgcttggatc aagccgatac gcttcgcggc ataggtgccg 6600
acattctgcg gcaggctaat gatcttgatg cgcgtgtctt tgagggcgag ccgctggaga 6660
cgaaacaggg tgtcatcggt gctcgcgtca tccacaatga tcagctcgaa ggaacggtag 6720
gtctgattga ggagcgaaat caccgcattt tccacgcggc gacccgtatt ataggtggtc 6780
atcaggatgg agatcaacgg ccccgtctgg gccgggtacg ggatgctggt gatgatgttg 6840
cacggggaga gcggggagct gttgtccgtc aaggccacgg ggctgaggcc gaagtattta 6900
tagtattcat tcagccgatt caggctaatt tcggcggttt cgcggaaggc gttattttgc 6960
agcagcagga tatccgggct atagacgata tcggatgcgt cgatctgggc gagggtcgag 7020
atggcctttt gggtcaggcc gatccggagt tgcagtgcgg tatacaggtc cagcgggcag 7080
ttgtccacgt tgtccaacag gctcaggcta aaggtcggcg agtaggacgc cagggttttc 7140
gccagttcca ctttctgatg ggtatcggtg aactcgtcct tgaactccat cagcagctcg 7200
ggcgtcaggc tgatgtcgcc gcaggcgatt tttgcgatct tgattgccag tttgcagcgc 7260
caatcggacg gggtatccgt caagttatgc agcgaccagt acatattcag acgatacatc 7320
gcgaggatgc gtttcgactg ccagaaccgg caatcatcct ggatggccgc gagcgcgtgg 7380
acgtagcggc tctttttgag cagccacaag aatttgagat tattgaacat ttattaacct 7440
cctgctagca acttaagtta cgaatcgacg ccgaacaggt cgcgggtgta gactttctcc 7500
gagacatctt ccagttcgct ggtgcggcga ttcgccacaa tgacatcgac gcgctcctta 7560
aaggaattga tgtcgcgctc gacgtaggaa ccgaagaagt agggttcttt caggaccggc 7620
tcgtacacca caatctcgat acccttggcc ttcaaacgtt tcatgacccc ctggatgctg 7680
ctggcccgga aattgtcgct acccgccttc atgatcaggc gatagatacc gaccactttg 7740
ggcttacggg acaggatgtc ctcggccacg aagtccttac gggtcgtatt cgcatccacg 7800
atggcctgga tcaggttttg cgggacgtcg cgataattgg ccaacagctg cttcgtatcc 7860
ttcggcagac agtaaccgcc gtagccgaag gacgggttgt tgtaatgttg accaatgcgc 7920
ggatcgaggg agacgccttc gatgatttgt ttggtatcca ggccgtgcac gctcgcgtag 7980
gtgtccagct cgttaaagta cgcgatacgc atcgccagat acgtgttcgc gaacagtttg 8040
atggcttctg cctcgggcga atccgtcagc aggatcggaa tatccttttt gatggcacct 8100
tccgacagga gttcggcgaa cttccgtgcg cgttccgacg attcgcccac gacaatgcgg 8160
ctcggataga gattatcata cagggctttg ccttcgcgca ggaactccgg ggaaaagatg 8220
atattattcg tgttcagatc gcgcttcagg cgttcggtga acccgacggg gacggtggat 8280
ttgataatga tggtcgcgtt cgggttaatg gacagcacgt cacacgcgac gctttcgacg 8340
ctcagggtat caaagttgtt attaatcgga tcatagttcg tcggggtggc gatgatcacg 8400
tagtctgcat cgcgatatgc ctcgtatttt tccgtcgtcg cgtagaggtt cagcttacga 8460
ttggagagaa acttctggat ttccgggtcg caaatcggcg agattttctt gttaatgagc 8520
tggaccttct tcgggtcgat gtccagggcg atgatgtcgt gtttttggga gaggaggatc 8580
gcaatgctga tacccacata gccgacgccg gccacggcaa ttttcattta ttaacctcct 8640
taagtgaatt cttataccgc agcttctttg aagatttcgt acagacgaaa ggcattctta 8700
ctttttcccc tggagattct catactcacg cggggtgccg cagaagatca cgtcggactt 8760
attgatttcg gtataataca ctttgatccc attggagatc aggtaattgt agatcggcgc 8820
aatatacagc tcgcccgcat cccagttttc ttgcggcagg ttcttgtaat gttcatacgc 8880
ggaaataaag tttttgatcg tgctgaagtg gtacagcccg gtgcaacaca aattgctaat 8940
ctgtttcttt tcggacgtgg caatcacttc atttttgacg tcattgctgg gcatcacgaa 9000
cgaccagttg tcgccatcgc cgcgaaacac ttcaatgtaa cattcattct cgccctcgaa 9060
cttggtgaag atgaagttgg gacgaatcgt gtcgatgttg aagatggtga tcggctgttc 9120
gatattaaac agtttcgaga tggccaaata gaccgtctct gcttgacccc gcgtttcctt 9180
atccagggtg atcagcgtat agctattaat gcccaggctg gcgatacgct ggagcacgaa 9240
cgatttcgtg ttaaacacgt cacggaggat gaagacaaag tgttccgtct cgaagtacag 9300
tttgaagctc ttgaggcaca aatcgaacag aaactcgcca ttcagctcca gcatatactt 9360
cggtttgcta taaccggctt tgaaaaagcg gctcgacata cctgccatcg ggataataat 9420
catactgctg cctccttaaa gatttcatac aggcggaagg cattcgcaaa cagggcgtcc 9480
tgccgcttct tgtcgtcgct atgcaacggc agcatcgaca agaacagatg aatttgcatg 9540
gcgtacagcg acttttcgga gatgctgtat ttttccttaa taatggacac gaaggtcgat 9600
tggatttcaa agagtttgtt atcaatattg attttgaact caatggaatg ggtcttattc 9660
tttttgttga taatgtagta gcccgcgatg atccagtcat acaggcctag aatggagtgc 9720
gacagtttcg caatatcgta gcggaaatcg ccatagatcg agatttcgcc gctgtggttc 9780
agaccgcgcg gatcgaacac ctgaatccgg cccgtgcgga agttaaagat aatattgctg 9840
aagcacaggt ccccgtgcat gatggtcttg tattgcagtt cggacggaat gaatttgttc 9900
gtgtcgtaca ggatgtcgtt gatgctcacg ctaatattgt tgttaaaatt ccatttcgcg 9960
ttcgggtcaa tgttgagatc ggtgatatac ttgctgacgc gctcgatggt cttttcgtaa 10020
aacagatcct ggagaatgtt tttatccgta tcaatgctat gatactcttt gcagaggtcg 10080
ataaaatcca ggcagctgat cagaatgttg gtcaggatat tattcggcag gcgggagaac 10140
acgaacagtt cgttcagggt ggtattgtac aggtattcga gtttgtagct tttgcgaatg 10200
tgatcgaacg gttccagcaa catcggggtg tagattttca gttcacccgg aatcgtctcg 10260
aaccatttcg attctgcctc gatcttgctt tcattcgagg aggacttaat cacggacttg 10320
gtcgtgatgc acagctcatt gaaggcacgc tgggtcgtgt actggacttt cgacttatag 10380
taggtattga tgtgaccgaa atcgagccag tcgctgacgt aaatcgacgc caagctgtac 10440
gaatcatggt actttttcag ggctgccgtg aagtcaaact tgctggtgac cagttcgcga 10500
atgaagaaat tgggtttgct gaacgagaag tacccgcaga tgacattttt gttgtcctcg 10560
cgggagactg cccgcaattc cgtctcatag aaaaaggacc actggtagtt atcatcggaa 10620
tgggagatcg ccacgaggtc atcacccgcc ggaatcttct tgaacaaggt atcaccaaac 10680
agcagttgca ggcctttatc atctttgtcg ccgatcagat tccaggccgt gacgattgcc 10740
tggcccaggg tcagattgct atcgaccgga atcatcgtca ctttattgcg cagcaaccat 10800
tcgtaatcgt gtttgtcgaa cacgaaatct tccggcagga ccaggtagat cgcatggcca 10860
tcgtgcccca agctgacctg gtgcttgaac agacgcttgt ttgccaacgg caggaacgac 10920
ggcgggatgc taccgaactc cgcgcccaat tcctgctgca cgtagctacc agacattatt 10980
agaagcattt tttctcctgt tctaacatat tagagatttc ttccaaggtc atattgcaca 11040
gttccgaggg ccggatggcc cgatcgtcca catagaagcc ctcgtcgccg caccacggct 11100
tgccgacaat cacctcgtca tacgggacgc ggttttcgtt cagccagtcg atgatcaccg 11160
gcagcgtatg aatattgatc ttgccaatgt tttccttgta cgtccgcata ttgcgcgcgg 11220
taaagatgac gatgtagaaa ccgttcagct tgtactcata gagtttttcg atcaatttct 11280
tattgggggt tgcatggctg tatttgccgc tcagattgaa gctaatcgta ttatccagat 11340
cgacgataat tttcttcatt tattaacctc cttaatataa accaaggtaa gcttttattc 11400
ccgcaggctc agaatttgct ccaggctgat tttacgcggg gccacaatat tcttgatctt 11460
cagattgctc actttacagt cgtacacatt ggcccaggcg cacaagccga cgttgatgtg 11520
ccccgagtag tacacattcg acgacgagat caggctcgtc agttgcgagt aaatgttatc 11580
cagaccatgc acgcacatca gtttcttcat gatgtccggg tcgccataga acagctgatc 11640
gccgatgcca aacccccact cgcgaaaaat ccaaccgttg ctgtcctcgc aatacacgct 11700
gtcgtccacg tcgatatcgt tgatggtcac gttatccact tgcagcaggg catcggggcg 11760
gattttgatg atgcagcggt acttatccca gttatgattt ttcagcgagc agaaccaaaa 11820
ggaattgtgg tagtacatct tttccgcgtt gctcatcttg ttatacggat attcgccatc 11880
atccttgata ttgatcagga cggagttgca gccggagaag aacgacgagt agatttcttc 11940
caggttattg ttcttatagg aggagagcga caggtctttc agctcatcat aatgttcatc 12000
cacgaagctg taattgtcgg gttcggacac gtattgggcg gcttccgaat caaaaatgcg 12060
gcagatgcgt tctttgctca gttgcgtatg cccgatatcc ttccaggtgg agataaacac 12120
atcgacgtcc gacggaatcg tgatcttgct gaccaggttc ggcagcgcgt cgatgaaacc 12180
gcgcgactgc cccgtgatga acaatgcgat ctggcgattg gtattcaggc tcacattgct 12240
gctaatgaaa tcatcaatca ccgagatgcg cgatttgatg atacaggaaa tgatgccgct 12300
atattcgtcg gcgtttgcca ggacaatttc attgatgtgg cacaagaagt tgcgctcctg 12360
ctgcggggtt tcgtagaagc gtttgctggt cagggacagt gcgagcagca acaacttaat 12420
cgaattgaag gtgcagccgt tcgagttgat cacgagatta tacacgtagt tggggatgtg 12480
cggacggctc atcaggcgct tgaagctggt atcacccaag ctggacaggt ccgtgttatt 12540
cttgttgaaa cgtttgatgt agaactccgg aaagaagaac gcgaagtaaa acgtccctgc 12600
gttcgacaac ttgttcggga tgataatata ctcgaagtat tccgacagcc acaagtcgaa 12660
caactccagg attttgagat gcgcattaaa gcctttgccg gtcgaaatgt tcttgatgca 12720
ggacagcgtg cgctcgtcca gatggttgac gatgagctgc accagtttga ttttatcttc 12780
tttcttgctc aggctcagga tgtgatcgaa ggtcaagttc ttcaacattt attaatcctc 12840
ctaataagct ttgaattcaa actagtttac aagtcgtttt cgatcttctc ccaggtatat 12900
ttgcgacatt cattcaagtt ggtcagcggc gagtatttgt actttttgat accgaggcgc 12960
gacaggcttt cgttcaccac cttgaaatgg ttttcctttt ggatgtccag tttcttgatc 13020
gacgtgttct cgccgtgcag gacacggttg tagcaaatct tattgatatg cttaaacggg 13080
ccgacttcgc tgagtttcaa atacatatcg taatccaccg cattgctgat gctctcgttg 13140
aagccttcgg tgaggttcca tgcacgcgcc gtgaacatac ggaagtggtg gcagatcatc 13200
gcgctcgtga gcttttcgcg gctgtaaatc ggccagttgt agccattgct aatcaagtta 13260
ccttcacgat caatattgcg attggtggtg tacacgcagg cgaggctcag gtctttgcga 13320
aattcatcca gacacagttc cacggcatcg ggctccagga aatcatcgga atccagctgc 13380
ccgatgtaga aaccccggca caggcggact gcggtattcg aggcggagcc gatgcctttg 13440
tttttctggc tgatgaaacg gacgcgcggg tggtttgcgt aatgttcttg caggatgcgc 13500
agcgtatcat cggtgctccc gtcatcgcag atgcagacct ccagatcggt gatcgtttgg 13560
ttcagtgccg attcgacgca gcgcacgata tatttgctgc aattatacgc ggggatgtag 13620
atgctcacca ggggcacacg tttcagggtg gcgctctcga ttttctcctt cttgcgataa 13680
aagtagggca ccttctgctg caacagctgg acggtaatgt ttttacctgc cgcgcgatcg 13740
gtttcgttct ccttaccggg cggttcctga tgatatgcca tcgcgccttc cacgctacgg 13800
aaataacaac cctcgcggta cagccgatag ccgaactcat tatcctcacc gccccaatgc 13860
gtgaactctt cgtcaaacca acccgcgcga aacagccact tctttgcaaa cgccacattg 13920
ccaccgctaa agaaccggaa cggggtgttg cacaggcgca gattgtcggt attcttgaaa 13980
tgttcgatgc gccaatcgac ggatttgttc tgctcgacct tgcctgcgac ctgattattg 14040
gtaataatct ccgggatttc attgatcagg cttttctggg acaaaaagtc cagataggta 14100
tgcttcgacg tgtcgatgta tttacgcggg ccaatcagtg ccacgttatc atccacggcc 14160
aggagttcca tataggactg cacccacaac gggttcggcg ccatatcgca gtccaagatc 14220
gccacgtagt tgtatttcgc tgcccgcagg cccaggttcc gcacggcgca cagctggtag 14280
ccgtagtctt tctggcggac gtatttgatg ttcagcaacg actcgaactc gcggacgatc 14340
tcttcgatgt tttccttgga accgtcatcc gcgacgatga cctcatagtc ataaatcgtt 14400
ttctgattgc agaggcaggc cagggtgatc gccaggattt tggcgcgatt gtacgtcgga 14460
atcacgatgg acaggccgtc gatgatcagt tgcttgcgcg gataatcatc cagttcttta 14520
cgtttccctg cccagacgta gtcgttcgtg ctttccggca gcggcggcaa ggtcaggtcg 14580
ctcggccaat ccagcggaat gggttcgact tctttcaatt cggcgcgctc ggatttcttt 14640
gcggtaattt cccgatattt gctaatgatt tcattctttt ccacctcatt cagcgagatc 14700
gcctttgcat tgctgcacat aattttggtt gccgcgtcga tatcaatgac cgctttccga 14760
ttcagcttgt ccacttcttc gctcagattc agggcggttt ggcacagctt gatattggct 14820
tccacccagc tcacatcata gatttccgcc actttttcaa acagggagag ggcttggcgg 14880
tagttcttat tcttatacag attgattgcc tggttcaaaa tgctcattta ttaacctcct 14940
actagtgaat tttcgaatta cttaccgcag tacttgacac ccacctggga attgtttttg 15000
gtgcgtttga attggcggat ggtacggtag atgctaaagg gcaggctgat cagaccgagc 15060
ggaaaattgt tcttattgat gatgagcttg cccagctgat agctcaggtg tttcttgacc 15120
cgttcggctt cgtgtttatc cgcgtacagg aagatgctcg gcaggctcac ttggtactcc 15180
gaatcatatt tcttcttcca ggtccgccat tcgctgatca acgcaaacgg aatcgagatc 15240
agaccgagga acgtcttgga gcggctcacc atcaccgcac ccaggcggta gccgatatct 15300
tgcttgatgc gttcggccgc accatacagc tccggcagtt gtttcttttc gagacgttga 15360
ttgtcgatga agtactgttc gagcttttgc tgcaccagat gcagctgatt gagcagcaat 15420
tctttttcgc acgacagctt ttcgaggcgc tgttgttgca gttcattttt gttctgttcc 15480
tttttcagca gggactcgaa gttctcgatc gcgcactcca gttcctggac ctggatggtt 15540
ttgtttttaa tgatcagatc atactggatc agttcttcct tgctatccga cagctctttc 15600
agaatggctt gataggcgtt cagctgtttg gacgtgtgca gttcgttgtc cagaatgatc 15660
tttttgctgc tctggtacag accgttcacg atatcgaggg tgatctggcg ttgtttaatg 15720
aacgtctccc aaataaagga cggcttatag ttttccttct ccagcacccg caagggggtg 15780
ttggcgttcg attgcaattc aaagtacagt tccttgcaat cgggatagtc gttcaggacg 15840
ttgaagatca agtactcctc cgtctcgctt tgcttgaaaa tgatatcccc ggtcccgatg 15900
tcaataccgc tgagggacat gatctcctga tgttcttttt ccagcgtaat ggaggcttcg 15960
gcggtcttaa agtcattcac gctctgctcc agcgagtggt tgatggtatt ggagaacgac 16020
aacccgaatt tcagtttcag tttgtgttgc agttgctgga tgcagtcctc ggcgttgcgc 16080
ttcacctgtt cgctcgacac cagcaggcac cgaccccggt tgttgaggaa gaagtgcagc 16140
aaggcggtgt tgtatgccag ccagtttttg atcagatgct ccgaggtata gttgctggag 16200
atgttctggt ccgagaagta gttcgtcagg atgcttttgg ggtggtcgta gatgaggata 16260
aaggtgatgt tctcatccac cgatttccaa tattccaacg tgtgaattgc gttggggtcg 16320
ctccaaccgc acagtttctg gttcaggttg gacagcatca gatccaatgc gataccgttc 16380
cagacggtgc tcacatggag cggttcaaag tcggcggaat cggtcaccgt atagatgtcc 16440
ggcgactggt acgccttccg cagcgtctgg gtgatgtcct ggggcgagag gttctcacgt 16500
ttggacgggc acagggagtt catgccgcgc tgatgcagga gttcttccac gatttggtag 16560
ttgctgctcg gatggcccac gatcaccagg cggttcattt attaacctcc tttcgaaaat 16620
gaacggtccg ttaaatatag ccattcggat tcttcatctg ccagcgccag gcgtcctcca 16680
gcatggtttc gagttcccgc ttggctttcc agttcagata tttgttggcc ttttcggggg 16740
aggaccagct ctccgcgata tcaccgtcac ggcggctcac gatttcatac ggaatccgca 16800
cgccggaaat cttttcaaag gtggacacca gttccagcac cgaataacct ttacccgtgc 16860
ccaaattaaa gacgtggtag ttggtgttat tgtcgcggaa gagataggac agcgctgcga 16920
cgtgcccttc ggccaggtcc atcacatgga tatagtcacg gacccccgtg ccgtctttgg 16980
tgggataatc accaccgaac accatcagtt tttccagttt ccccatcgcg acctgcaaga 17040
tgtacggcac caagttggag gggatgtctg ccgggctttc accaatcata ccggattcgt 17100
gggcgcccgt cggattaaag tagcgcaagc agaggaaatt cgtgtcggag tatttcttgg 17160
cgatgtcgcg gatcatcagc tccgagatgt acttggacgt accatacgga ttcagcgtgc 17220
caccaatatg gcagtcttcg gtgacgggca tgatcttgct ttccccatac accgtcgccg 17280
acgagctaaa gatgaagttg gcgacgtcgt tcttgatggc gcaattgatg agttgcaggg 17340
tgccgctcac gttgttgtca tagtagaaga tgggcttgat caggctttct gcgaccgatt 17400
tcgcacctgc aaagtgcatg atgcagtcga atttgtgttt cttcaggatc tggttcactt 17460
ccttctcgtt gttgatattg agttcgtaga acgtgacttt cttctttgcg atcagctcaa 17520
tgcgacggat gctttcgcag ctgctgttga tgagattgtc aatgatgacg acattgtagc 17580
ctttgttcag caggcagagc gacgtgtggc tgccgatgta gcctgcaccg ccggtgacca 17640
ggatgttcat ttattaacct cctcggtccg aattaaccta ggttatgagg tcagcattgc 17700
ttcttcacgc gtttagtagt tgttttgttc ggtgatatat tcttcaatgc cttcttgcac 17760
gtcttcatgg aacgacacgg cgttgtcgtc tttaaacacg attgccacat cgcagaactc 17820
tttcaacgag ttcagcgagt gcgacaccat gaggaaggag ctttccttat gacgctcctt 17880
gaagagttgg gcacattttt ccttgaaacg ggcgtccccc accgccgtca cctcgtccac 17940
gatgtagtaa tcgaacttga acgccatgct caggccgaag ccgaggcggc tgcgcatacc 18000
gctcgaatag gtcttgatcg gcatatcaaa atacttcccc agctccgcga actcttccac 18060
aaactcaatc ttttctttca gctcctcctg cttcgcgtac agccgggcca cgaacttcac 18120
gttttcacgc ccggtcaagc tgccctggaa gccgcctgcc agacccaccg gccacgagat 18180
cgttttattc gtgatgattt taccgctatc cgggcggtcg atgcccccaa tcatgcgcaa 18240
cagcgtggat ttacccgccc cattgcgccc gatgaacgcc acgcttttgc cgctggggat 18300
ctcaatgttc aggttcttga agacatagtg acggcccacc ggggtgcggt agcttttcgt 18360
caggttttcg atcttaatca tgaggtcaac attgcctcct cacgcgtacg gtacagggcc 18420
aaaccaataa acagggtcac cagggtgaac attgccagat aattcaggct gaccccttcg 18480
ctgatataac cgggcatcac ggcctcgcgg ctcagttcga cgacgtgcac caggggattc 18540
cacagcaggt acgaccaata ctgcttcgga atggagtgca gcgggaacat gatgcacgaa 18600
ataaagtaca gcggcttcag caagatcggc aagactttct gcatttcggg gaacgtcttg 18660
cccacgacca tgaagatcag gcccacaccg cacgacagga tgatcaggag gctccaggtg 18720
agcacaaatt gcaggaagtt ggtaatctcg aaatattcgc ccgccatcca gatgatcagc 18780
atcaggagga tgtagaccgc cacatagatc agcgtttcca agagggcgcg tgcaatgatc 18840
gtgtcgatcg gcttcacggg ccggtagtta aacagcccct gattggcttc gatggcgccc 18900
acggagcgat tgctgatgct gctgaaaata aagaacggga tcaggccatt gagcaggaac 18960
accgggaagg agatatccgg catggtgcga tgcatgatat agccaaagat cccgagcaga 19020
atcagcagat gtgcgctcgg ttccaggatc gcccacagat agcccaggcg aaacttgcca 19080
aagcgcgtac ggatttcgcg gagaaacagt gcttcgaccg tcactttctg gacttcaaaa 19140
cccgaacgtg ccatttatta acctcctggt accaatctag attgtttaaa cagatccaat 19200
ctagattgtt taaacttctg cagaacacgc ggtgttaacg tttcttatac ttcttaattt 19260
tgttaaagat catttcgccg tagtacaccg cattgacctg ggtcttcacc agcaagtagc 19320
cgcgaaattt cttaaacaac ttcatgttcg gtttaaagtc ggcttgccag aactgatgca 19380
aatgcccctg gtacgtcaga cccttgatat cgtacaaggc gttgcccatg actttcaggg 19440
gcttgttgtg gatcaacgcg gaaatgccgg ccgtgctatt gatggtgacc accgctttgg 19500
cgtggcgcaa cagctccggc atgggcagat cgtgcacata gatgacacgt tcatccaaac 19560
cgtattcctt cgacagacgc ttgatcaacg ggcggtacag gcggtgcccg cgatccatcg 19620
ggtgatgttt gatcaccaga taggactcct tgggggcctt gcgggaaaag ctgtacatca 19680
cttcgttgat gtaatcacgc acatcattat agttgctatg gttgcggatc tggctgtcgt 19740
tgtacacttg caggaccgcc aggtaatagc gctgatccag ctcgttcatc aggcggggga 19800
ggaccttgcg ttgggtgacc ttatacagct gtttgcgcca gtaggcgcgg acccagcagc 19860
gcgcttcata ccacgggctg aacgatttgt ggtggcgata gcgcggaaat tcgtgacgat 19920
agtgccaacc catcaggtaa taccacatgg cgtggccgat gcgcttcatg gtgctcggtt 19980
tcaggttctc gacgtgcggc gtcggcatat cgggcaattt gcggtaaaag tccggatcgc 20040
ggggcaagct gctataggcg ttcacaccgc cttcttccac ggtgataaat tgcggacgca 20100
ggtagccttc ctcgaaggcc agaaaacgaa tccccttcga cttggcccag cgtttggcct 20160
ccttgtgcag caggcggcag tcaccgaaac acaaaatcgt gtcaaagtca tactgacgat 20220
gcaagtcccg cagccaaccg gggaactcct tcggggtttg gtagtacgcc aggtattggc 20280
ggtggcggca gtagaagcga tcaccgccat taaagacgac gttgaccgcg ttgcgaccga 20340
ggctctccaa ccattccgcc acatcgttga agaacggacc catcggacct tggagcagga 20400
ggtacttttt accgctcaac agcaccgtca gcgcattgcc gtgcatttat taacctccta 20460
acacgcggtg ttaagcgttt tcggcgagct cttaaccaaa gcgcactttg cagaacatga 20520
tcaacttgcg atagtagcga atcacacggc cggctttctt gcgggtgata aagatgggtt 20580
tgcggggcgt tttgatcaga tattctgccg cttcctccac cgtgatcggc tgcaaccgcg 20640
tcggatgaat ataggtggga tagacaatca gggcttgata gatcaggtcg gcgatggtca 20700
gccgccgctc gcgacggggg cagtggtgct catcgacggt caggccccac gaggcgtaga 20760
acggcaggcc gtagcagtgc acctgtttac cgtgcagcaa tgcttcaaag ccgctgaggc 20820
tcgtcatcgt gtgcacctcg tccgcacgct gaatacactg aatgatatcg gcatccagtg 20880
cctggtagtc tgcgagttcc gcgatctgtt ccgccggaat gtcaccctta cggttgccga 20940
cgagcacatc ggggtgcggc ttgtagatga tgtaggcgtg cggattacgt tcccgcacgg 21000
tgcgcagcag ctccagattc gacttgatcg acacggtgcc cgtcttaatc gacgcatcgt 21060
cttccacctg gcccggcacc aggatgactt tcttgtcctt cgcttctgcc gggaggctga 21120
aatcggcccc caggttatat ttgctcaatt tgctttccac cagacgttgg cgcaactttt 21180
ccgcgcgcat ctggtgcgcg agggtcagct ggctgtgatt cagcaggacc tccagttccg 21240
acggacgggt ggcatcgtaa tagataccgc gcttatccag gaccaggctc aacggcggca 21300
gcagatcgct ccccaggccg gagctgcgca ggaagccgtc ttccatgcgc cacagcggca 21360
gggatttgcg ctgtgcctcc gcacgccatt gctgttcgcc tttcacgccc cacacgacgc 21420
aggcgcttgc tgcggtacag cgacgggaaa aggagagacg attcgtggcc gtttgcagga 21480
agggcttcag gatcgcgctt ttccacaggg tcaggcccgg cacccagaga taaccattcc 21540
gctgttgcag gtgacgacgt tgcagctgga gccattggag caccgtgaac agggccgaca 21600
cctccccggt ctgcggatca atgtagcggc aatagcgcag ataggccgct gcgaacagtt 21660
cctccagggt ggccgagccg cgacgcgccg acagcagcgc cgattggggg tggcggtcat 21720
cggtgaggcc ccaccctgca taccagggtt ggccaaagca ggtcacgggc ttaccggcca 21780
gcagggcttc aaaaccgtac tgggaggtca cgacgtacac gcgggacaca tgacgcagca 21840
gggactgcgg cgacacgttt tccgcaatca ggcgcacgcg ctgggtggca cgcaagtccg 21900
cgaagtagcc ggtctttttc ccttccagga catcgggatg cactttgacc cagatttctg 21960
cctgcgggtt ttccgccatc gctgcttcca gcattgcggc gaactcatgg gggcctgcgt 22020
tgccgtaggt cacgctcatg tcattgaagg tctggtccac caccagcacg atgttcgtgc 22080
gctcgctttc atccgccacg aacgccggtg ccaggttgta cttgctcatg tcgcccgtca 22140
caatggtgtg catcgcctcg cgcgcctgat ccgccagggc cgcgttgccg gccttgtcct 22200
gcacgagttt ttccagcgcg ctcggtttcg aggcgtcgta gtaaatgccg cagtcatcca 22260
cgacgagcga gaggggcggt tcaccgttca cgcccaggtc cagcgagcgg acgaaaccat 22320
cctccaagcg gatcaccggc ttgcctgcgg ctttggcgat ggccaccggc tttgcggccg 22380
aggggcggtg cccccacacc gcgattgcat ccacttcctg cgggaccggg cgcagcagcg 22440
acagcttttg gcagggctgg gcgaggaatt tttccaggtg cggaatacgc caaatgccgg 22500
ggctataaat gccaatcatg cgttctccgc gagctcctgc gccatcaggg cccggacctt 22560
ctccaagcac gccggggtat cgacgccggg accggtcgcg gcgacctcga aggtgcgaat 22620
gttaatgccc gcgctcatca gccgcagttg ctccagggat tcggcctgtt cgggcatgga 22680
ctccggcaac tggctgtaat tttgcaggac atcccgccga taggcgtaga tcccgacgtg 22740
cttcaggtag cgcgccttct cggcgttgcg cgggtacgga atgggggagc gggagaaata 22800
cagggcgtcc tgccgcgtgt tcaccacgac cttgacggtg gacggttcgg cggcttctgc 22860
cgcgctgatc gcatgacaca gggtcgccac cggcagcgcc gggtcgtccc gcataccttg 22920
cagcagggtt tcgacgtcac gcgggcgaat catcggctca tccccttgca ggttgatata 22980
gatatccgcc tccaccttat gcatgacttc caccaggcga tcggtgccgc tctcatgatc 23040
gttgcgggtc atgatcgctt tgccgccgaa cgcctggact gcctgctcca cacgcgggtc 23100
gtcggttgcg acccacacct ctgccacgcc tgccacttgc agggcccgtt cgtagacgtg 23160
ctggatcatc ggtttcccga cgatatccag cagcggtttg cccggcagac ggctgctgcc 23220
gtagcgtgcc gggatcacaa tcacggcctt cgacatttat taacctcctc gagttacagc 23280
gacagaatca ctttcgcgcc caccgccagt tggtacagaa tggtgctgat accgcgcgtc 23340
acttcgatgt tcttcgactc gtatttcggc aacaccataa tttcatcacc gggtttcagg 23400
gaatcgacgt cttctgcgtt caccgctgcg ccgttctgac ggatgacgat aatacgggcg 23460
ttgccggact tctgggtcag cccaccgcac ttctcgatgt agtcctcggt cgtcatacct 23520
ttctgccacg acaccgcgtt cgggaacagc acttccccgt ggaccatgac caacgacgtc 23580
ttttcgggaa tattgatcac gtcgccgtcc tccaggagga cggagtcaat gttgctttca 23640
ttgaggatca cttcgccctt cggcacgacg gtgcgggctt tcgcgacgaa gcgggagatc 23700
agttgggctt cctgcatacg caggctggcc tcttccttgg tgctgctctg tgcgctgagg 23760
ctggcctctt cgagcttttg cagggacaaa ttcagcattt ctttctgccg ttgcgcgacg 23820
ctcggccgat acaactgcac ggcgttcatc tgcgacatgg agttcgggcg cactttttcg 23880
agcacggccc gcatggtgct accgtagggc agcaccatgg cgtgttcccc ggaatgtgcg 23940
ccttccacac gcacttgaat ggtgcccgca tagcggtcgg tggagacaat gagggtatca 24000
ccgttttgca gcatacgccc cggtgcggac gagatcggat aatattccga gcgcttctgg 24060
aggccctgct tccgcataat cgtgatatgg gtcgcacccg gtttgggacg tgcccaggac 24120
agtgcttcgg tgaccgggat gctcgattcg cgaaattcaa agtcgtagga attgaacaca 24180
tcgccctgca ccgagaacgt atgctggcgc ggacccacaa tgatcgtatc accgtccgca 24240
aactgggaca gccccagttt gccgttgagc aggaagtcat agaggttgac gttcgagcgc 24300
acacgattgc cgcgtttcac gacgatgtcc acgtagctgc cgcgttccgg gtccacacca 24360
cccgccttga tcaggtagtt cagcaggctg tcggaggtga caccgccgta caggccgggg 24420
ttgcggacaa agccggtcac atagaccttg accggctgcg cctgcaagag cgacgcatag 24480
acgttcacgt tgctctggta gacttccttc accttgctcg tcaccagcgc gttcaactgg 24540
gagttcgaca cacctgcgac tttgacgggg ccgacattcg gcaggaagat gttgcccttc 24600
gggtccacct ggagtgcgcc atcgaaggtg aacgcacccc acaggcggac ctggatggaa 24660
tcgccgggat tcaggatgta gtccggattg aaacccacgg ttgcccccga gtctgcgctc 24720
gtaccgttga acagctgcgc cccgaacata cggctcatca cgaccggggg tgcggggggc 24780
ggggtgttat cgaagccgct catgttctgg gtgtcgcttt tctgcccgtt caggatgccg 24840
gtcaacggtg cggcacccgt gaggttcgga tcggcattaa tgtcgatggt tgcgctcgcc 24900
tgtgctgcat ggcacgctgc gatcagcagg atcgacttaa acagcttcat ttattaacct 24960
cctcgagaag tcgacttagt cacggtggtc ttcaatcacc gccaggagca atttcagggt 25020
gccaaagagc aggcaacaca ccagcagcca acacgcgatc aaatacggga tattcgggaa 25080
ggagctttcc tggggcagct gcggggacga gatcacgctc aggactttca gcttacgggc 25140
cgcttcgaca cgggtctttt cgatgctggt gagcgtgagc ttgtacaact cggtattgaa 25200
ctcgaccttg gatttgatct cctcaaaatc cacggccatg cggttcagtt tatcgccctg 25260
gggtgcggta attttcgact tttcttcgtc gatctgtgcc tggaggctct gaattgcatt 25320
gcgggcgctc acgacttggg gcgcatcctc gcgcaggtac gtgagcaggt tgcgcaggtc 25380
ggcttccatc tgaattttct ggcccatcag cgtattcacc agggtggatg ccgcctgggc 25440
ctgtgcctgc gggtccagca cattgttgtt gtcttggtag gacaacaatt cggctttcga 25500
tgcatccagc cgctggcgcg ctttttccat ttcggtttcc gcaaacgcca attgatcgcg 25560
ggcgatacgg tgcgacattt cattgatgaa ccgctcggat tccttgagca cggtctggtt 25620
gaatttcagc gcgaactcgg gcgaaaagcc ctgggtctgg atgttcagca gcccggtctt 25680
gtcgtcgtag ctgacgttga tgcgatcttt atagtacttc aggaacccct cggcggtttc 25740
atccttggac agatggttca ggaagtccag gcccgaatgg gagaacgctt cgcggaagtt 25800
cagctgttta tccagcgcgg ccagcatatc cgggctgttg atgtattcct tcaggtacag 25860
tgcgtcttcg gcggacgacg ggttggaggc acccaacagc aggccgaagt tcaggctgcc 25920
ggagttgaga tcgtcgctgc gcttgatggc caccttgctt tccgacatat agcggggctg 25980
ggagaagatc gccaagtaga tcagcagcac cgccatgggt gccagaataa tgatttttgc 26040
caggtgcttc tgaatatctg ccaggctgat cgcgctcaga cgcgcacgca tccacgagac 26100
ggcgcttttc actttgatca gcatttatta acctcctgtc gacaacacgt gttaatcgaa 26160
aatgcgcacc aacccggtca ccttatttgc tttgttggtc accagcaggg tcgagacgcg 26220
gtgtttctgc atcttctctt ctgcttcgat gatcatggtg tcttcgggca aggtcagcgg 26280
ttcgcgggtc atcatctgtg cggccgttgc gctcgtcagg ctgtcttctt tctccataaa 26340
gcgccgcaga tcgccatcgg tgatgatgcc tgccagccca ccttccgcat cttcgaccat 26400
caccataccc tggcagcccg aggtgatgcg ctgaatgacc gttttgaagc tggcatcgag 26460
ctgcactgcc ggcacatcat gttgcatcac gtcggcgacg cgggtcagca ggcgccgacc 26520
caggctgcca ccggggtggt agcgtgcaaa gtcattgggc ataaacttac gctggtgaat 26580
catcgcgatg gccagcgcgt ccccgatcgc catcgtgagc gtcgtggagg tggtcggggc 26640
gagattgttc gggcacgttt cgttcgccat gtgcagctcc aggaccgcat ctgcattttt 26700
ggccagggtg ctattcccgt tattggtgat tgcgatgatg cgattgccga agttcttcag 26760
gctcggcacc agtttcagga tctcgtccgt ctcaccgctc gccgaaatca agatgagcag 26820
gtcatacggg gtgatcatgc ccagatcacc atggaacgct tccgccggat gaataaagaa 26880
ggagggcgtc ccggtcgagg ccaaggtcgc cgacatcttg cggcccacat ggccgctttt 26940
acccatgccg ctcaggatga cgtgcccttt acaattcatg atgagattca ggacgcgctg 27000
gtactgaccg ctatccagtt gtttggacag gttttgcagt gccgcgcttt gttcggccag 27060
ggtctggcgg acgctcgtaa tcagatacgg atcaatggtc gaggactggt catccggcaa 27120
gtggcgttcg ctcatttatt aacctcctca cgtgttaatt aagtaatcga tagtgattta 27180
aatatgcaag atctagttac ctgcaggatt attgtttctg ttgcataaag cctaaggggt 27240
aggcctttct agagatagcc attttttgca ctcctgtatc cgcttcttgc aaggctggac 27300
ttatccctat caaaccggac actgcaggct gacaagcttt cattacatat gaagagtttg 27360
tagaaacgca aaaaggccat ccgtcaggat ggccttctaa gaaggctcga gtggcgcgcc 27420
taagtcgaat ttctgccatt catccgctta ttatacttat tcaggcgtag caccaggcgt 27480
ttaagggcac caataactgc cttaaaaaaa ttacgccccg ccctgccact catcgcagta 27540
ctgttgtaat tcattaagca ttctgccgac atggaagcca tcacagacgg catgatgaac 27600
ctgaatcgcc agcggcatca gcaccttgtc gccttgcgta taatatttgc ccatggtgaa 27660
aacgggggcg aagaagttgt ccatattggc cacgtttaaa tcaaaactgg tgaaactcac 27720
ccagggattg gctgagacga aaaacatatt ctcaataaac cctttaggga aataggccag 27780
gttttcaccg taacacgcca catcttgcga atatatgtgt agaaactgcc ggaaatcgtc 27840
gtggtattca ctccagagcg atgaaaacgt ttcagtttgc tcatggaaaa cggtgtaaca 27900
agggtgaaca ctatcccata tcaccagctc accgtctttc attgccatac ggaattccgg 27960
atgagcattc atcaggcggg caagaatgtg aataaaggcc ggataaaact tgtgcttatt 28020
tttctttacg gtctttaaaa aggccgtaat atccagctga acggtctggt tataggtaca 28080
ttgagcaact gactgaaatg cctcaaaatg ttctttacga tgccattggg atatatcaac 28140
ggtggtatat ccagtgattt ttttctccat tttagcttcc ttagctcctg aaaatctcga 28200
taactcaaaa aatacgcccg gtagtgatct tatttcatta tggtgaaagt tggaacctct 28260
tacgtgccga tcaacgtctc attttcgcca aaagttggcc cagggcttcc cggtatcaac 28320
agggacacca ggatttattt attctgcgaa gtgatcttcc gtcacaggta tttattcggc 28380
gcaaagggcc tcgtgatacg cctattttta taggttaatg tcatgataat aatggtttct 28440
tagacgtcag gtggcacttt tcggggaaat gtgcgcgccc gcgttcctgc tggcgctggg 28500
cctgtttctg gcgctggact tcccgctgtt ccgtcagcag cttttcgccc acggccttga 28560
tgatcgcggc ggccttggcc tgcatatccc gattcaacgg ccccagggcg tccagaacgg 28620
gcttcaggcg ctcccgaagg t 28641
<210> 144
<211> 28640
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic plasmid pDD62
<400> 144
ctcgggccgt ctcttgggct tgatcggcct tcttgcgcat ctcacgcgct cctgcggcgg 60
cctgtagggc aggctcatac ccctgccgaa ccgcttttgt cagccggtcg gccacggctt 120
ccggcgtctc aacgcgcttt gagattccca gcttttcggc caatccctgc ggtgcatagg 180
cgcgtggctc gaccgcttgc gggctgatgg tgacgtggcc cactggtggc cgctccaggg 240
cctcgtagaa cgcctgaatg cgcgtgtgac gtgccttgct gccctcgatg ccccgttgca 300
gccctagatc ggccacagcg gccgcaaacg tggtctggtc gcgggtcatc tgcgctttgt 360
tgccgatgaa ctccttggcc gacagcctgc cgtcctgcgt cagcggcacc acgaacgcgg 420
tcatgtgcgg gctggtttcg tcacggtgga tgctggccgt cacgatgcga tccgccccgt 480
acttgtccgc cagccacttg tgcgccttct cgaagaacgc cgcctgctgt tcttggctgg 540
ccgacttcca ccattccggg ctggccgtca tgacgtactc gaccgccaac acagcgtcct 600
tgcgccgctt ctctggcagc aactcgcgca gtcggcccat cgcttcatcg gtgctgctgg 660
ccgcccagtg ctcgttctct ggcgtcctgc tggcgtcagc gttgggcgtc tcgcgctcgc 720
ggtaggcgtg cttgagactg gccgccacgt tgcccatttt cgccagcttc ttgcatcgca 780
tgatcgcgta tgccgccatg cctgcccctc ccttttggtg tccaaccggc tcgacggggg 840
cagcgcaagg cggtgcctcc ggcgggccac tcaatgcttg agtatactca ctagactttg 900
cttcgcaaag tcgtgaccgc ctacggcggc tgcggcgccc tacgggcttg ctctccgggc 960
ttcgccctgc gcggtcgctg cgctcccttg ccagcccgtg gatatgtgga cgatggccgc 1020
gagcggccac cggctggctc gcttcgctcg gcccgtggac aaccctgctg gacaagctga 1080
tggacaggct gcgcctgccc acgagcttga ccacagggat tgcccaccgg ctacccagcc 1140
ttcgaccaca tacccaccgg ctccaactgc gcggcctgcg gccttgcccc atcaattttt 1200
ttaattttct ctggggaaaa gcctccggcc tgcggcctgc gcgcttcgct tgccggttgg 1260
acaccaagtg gaaggcgggt caaggctcgc gcagcgaccg cgcagcggct tggccttgac 1320
gcgcctggaa cgacccaagc ctatgcgagt gggggcagtc gaaggcgaag cccgcccgcc 1380
tgccccccga gacctgcaga tccacatcct tgaaggccgc agcgacgagc agaaggaaac 1440
cctcattcgg gaagtcagcg aggccatctc gcgctccctg gatgcgccgc tgaccagcgt 1500
gcgagtgatt atcacggaga tggccaaggg ccacttcggc atcggcggcg aactggccag 1560
caaggtcaga cgctgaagtg gagatgccca agggcacttc gggtcgagga acccgacctg 1620
cattgggacg cggccacgga gagcgcgggc aaacgccggc actatagcca gtggagtttg 1680
taaaacgcta tttcagagct tggagagtgt ctaagaaagc cggggcgatg ccaacccatc 1740
ccttcttcgg ctatgcatcg ttcgtaatca agccacttcc tttttgcatt gacgcagggt 1800
gtcggaaggc aactcgccga acgcgctcct atagttttca gcgaagcgtc ccaaatgtaa 1860
gaagccgtag tctagggcta tctcagttat actacgcaca ttggcactgg gatcgttcaa 1920
gcaggcgcgg atgctttcga gcttgcggtt gcggatgtag ttcttcggcg tggtgccggc 1980
atgcttctcg aacaaattgt agagcgagcg tggactcatc atcgccagct ccgctaaccg 2040
ctcaaggctg atattccgtt tgagattctc ctcaatgaat tgaacgactc gctcgaaaga 2100
cgggttacct ttgctgaaaa tttcacggct gacattgctg cccagcattt cgagcagctt 2160
ggaagcgatg atccccgcat agtgctcttg gacccgaggc atcgactttg tatgttccgc 2220
ttcgtcacaa actaacccga gtagattgat aaagccatcg agttgctgga gattgtgtcg 2280
cgcggcgaaa cggataccct ccctcggctt gtgccaattg ttgtcactgc atgcccgatc 2340
aaggaccact gagggcaatt taacgataaa tttctcgcaa tcttctgaat aggtcaggtc 2400
ggcttggtca tccggattga gcagcaatag ttcgcccggc gcaaaatagt gctcctggcc 2460
atggccacgc cacaggcaat ggcctttgag tattatttgc agatgataac aggtctctaa 2520
tccaggcgag attaccctca cgctaccgcc gtagctgatt cgacacaggt cgaggcatcc 2580
gaagattctg tggtgcagcc tgcctgccgg gcgcccgccc ttgggcaggc gaatagagtg 2640
cgtaccgaca tactggttaa cataatcgga gactgcatag ggctcggcgt ggacgaagat 2700
ctgacttttc tcgttcaata agcaaaaatc catagttcac ggttctctta ttttaatgtg 2760
ggctgcttgg tgtgatgtag aaaggcgcca agtcgatgaa aatgcatctc gacgtgatgc 2820
gtatacgggt tacccccatt gccacgttgc gccatccttt ttgcaatcag tgaccacttt 2880
tccaagcaaa aataacgcca agcagaacga agacgttctt tttaagaagc gagaacacca 2940
gaagttcgtg ctgtcggggc atgcggcgac gaattggcgg ataaagggga tctgcaggtc 3000
ccgagcctca cggcggcgag tgcgggggtt ccaagggggc agcgccacct tgggcaaggc 3060
cgaaggccgc gcagtcgatc aacaagcccc ggaggggcca ctttttgccg gagggggagc 3120
cgcgccgaag gcgtggggga accccgcagg ggtgcccttc tttgggcacc aaagaactag 3180
atatagggcg aaatgcgaaa gacttaaaaa tcaacaactt aaaaaagggg ggtacgcaac 3240
agctcattgc ggcacccccc gcaatagctc attgcgtagg ttaaagaaaa tctgtaattg 3300
actgccactt ttacgcaacg cataattgtt gtcgcgctgc cgaaaagttg cagctgattg 3360
cgcatggtgc cgcaaccgtg cggcacccta ccgcatggag ataagcatgg ccacgcagtc 3420
cagagaaatc ggcattcaag ccaagaacaa gcccggtcac tgggtgcaaa cggaacgcaa 3480
agcgcatgag gcgtgggccg ggcttattgc gaggaaaccc acggcggcaa tgctgctgca 3540
tcacctcgtg gcgcagatgg gccaccagaa cgccgtggtg gtcagccaga agacactttc 3600
caagctcatc ggacgttctt tgcggacggt ccaatacgca gtcaaggact tggtggccga 3660
gcgctggatc tccgtcgtga agctcaacgg ccccggcacc gtgtcggcct acgtggtcaa 3720
tgaccgcgtg gcgtggggcc agccccgcga ccagttgcgc ctgtcggtgt tcagtgccgc 3780
cgtggtggtt gatcacgacg accaggacga atcgctgttg gggcatggcg acctgcgccg 3840
catcccgacc ctgtatccgg gcgagcagca actaccgacc ggccccggcg aggagccgcc 3900
cagccagccc ggcattccgg gcatggaacc agacctgcca gccttgaccg aaacggagga 3960
atgggaacgg cgcgggcagc agcgcctgcc gatgcccgat gagccgtgtt ttctggacga 4020
tggcgagccg ttggagccgc cgacacgggt cacgctgccg cgccggtagc acttgggttg 4080
cgcagcaacc cgtaagtgcg ctgttccaga ctatcggctg tagccgcctc gccgccctat 4140
accttgtctg cctccccgcg ttgcgtcgcg gtgcatggag ccgggccacc tcgacctgaa 4200
tggaagccgg cggcacctcg ctaacggatt caccgttttt atcaggctct gggaggcaga 4260
ataaatgatc atatcgtcaa ttattacctc cacggggaga gcctgagcaa actggcctca 4320
ggcatttgag aagcacacgg tcacactgct tccggtagtc aataaaccgg taaaccagca 4380
atagacataa gcggctattt aacgaccctg ccctgaaccg acgaccgggt cgaatttgct 4440
ttcgactatc ggcgcgccag agctcatcgt taatgtcttc gtgcgccgtc agtcggcgca 4500
cgttttttct ctctggtacc gtgtcactga tctagtcaat tactcgaagt atccacaagt 4560
gaagcatact aagtaatgta caagaatcaa aaaaatcggc tacgcaagtc gcgtagccga 4620
atcatttaag gatccttcca ttcaggtcga ggtggcccgg ctccatgcac cgcgacgcaa 4680
cgcggggagg cagacaaggt atagggcggc gcctacaatc catgccaacc cgttccatgt 4740
gctcgccgag gcggcataaa tcgccgtgac gatcagcggt ccagtgatcg aagttaggct 4800
ggtaagagcc gcgagcgatc cttgaagctg tccctgatgg tcgtcatcta cctgcctgga 4860
cagcatggcc tgcaacgcgg gcatcccgat gccgccggaa gcgagaagaa tcataatggg 4920
gaaggccatc cagcctcgcg tcgcgaacgc cagcaagacg tagcccagcg cgtcggccgc 4980
catgccggcg ataatggcct gcttctcgcc gaaacgtttg gtggcgggac cagtgacgaa 5040
ggcttgagcg agggcgtgca agattccgaa taccgcaagc gacaggccga tcatcgtcgc 5100
gctccagcga aagcggtcct cgccgaaaat gacccagagc gctgccggca cctgtcctac 5160
gagttgcatg ataaagaaga cagtcataag tgcggcgacg atagtcatgc cccgcgccca 5220
ccggaaggag ctgactgggt tgaaggctct caagggcatc ggtcgacgct ctcccttatg 5280
cgactcctgc attaggaagc agcccagtag taggttgagg ccgttgagca ccgccgccgc 5340
aaggaatggt gcatgcaagg agatggcgcc caacagtccc ccggccacgg ggcctgccac 5400
catacccacg ccgaaacaag cgctcatgag cccgaagtgg cgagcccgat cttccccatc 5460
ggtgatgtcg gcgatatagg cgccagcaac cgcacctgtg gcgccggtga tgccggccac 5520
gatgcgtccg gcgtacaaga tccacaggac gggtgtggtc gccatgatcg cgtagtcgat 5580
agtggctcca agtagcgaag cgagcaggac tgggcggcgg ccaaagcggt cggacagtgc 5640
tccgagaacg ggtgcgcata gaaattgcat caacgcatat agcgctagca gcacgccata 5700
gtgactggcg atgctgtcgg aatggacgat atcccgcaag aggcccggca gtaccggcat 5760
aaccaagcct atgcctacag catccagggt gacggtgccg aggatgacga tgagcgcatt 5820
gttagatttc atacacggtg cctgactgcg ttagcaattt aactgtgata aactaccgca 5880
ttaaagccga gcgatgataa gctgtcaaac atgagatcca atctagattg tttaaacttc 5940
tgcagaacac gcggtgttaa cgtttcttat acttcttaat tttgttaaag atcatttcgc 6000
cgtagtacac cgcattgacc tgggtcttca ccagcaagta gccgcgaaat ttcttaaaca 6060
acttcatgtt cggtttaaag tcggcttgcc agaactgatg caaatgcccc tggtacgtca 6120
gacccttgat atcgtacaag gcgttgccca tgactttcag gggcttgttg tggatcaacg 6180
cggaaatgcc ggccgtgcta ttgatggtga ccaccgcttt ggcgtggcgc aacagctccg 6240
gcatgggcag atcgtgcaca tagatgacac gttcatccaa accgtattcc ttcgacagac 6300
gcttgatcaa cgggcggtac aggcggtgcc cgcgatccat cgggtgatgt ttgatcacca 6360
gataggactc cttgggggcc ttgcgggaaa agctgtacat cacttcgttg atgtaatcac 6420
gcacatcatt atagttgcta tggttgcgga tctggctgtc gttgtacact tgcaggaccg 6480
ccaggtaata gcgctgatcc agctcgttca tcaggcgggg gaggaccttg cgttgggtga 6540
ccttatacag ctgtttgcgc cagtaggcgc ggacccagca gcgcgcttca taccacgggc 6600
tgaacgattt gtggtggcga tagcgcggaa attcgtgacg atagtgccaa cccatcaggt 6660
aataccacat ggcgtggccg atgcgcttca tggtgctcgg tttcaggttc tcgacgtgcg 6720
gcgtcggcat atcgggcaat ttgcggtaaa agtccggatc gcggggcaag ctgctatagg 6780
cgttcacacc gccttcttcc acggtgataa attgcggacg caggtagcct tcctcgaagg 6840
ccagaaaacg aatccccttc gacttggccc agcgtttggc ctccttgtgc agcaggcggc 6900
agtcaccgaa acacaaaatc gtgtcaaagt catactgacg atgcaagtcc cgcagccaac 6960
cggggaactc cttcggggtt tggtagtacg ccaggtattg gcggtggcgg cagtagaagc 7020
gatcaccgcc attaaagacg acgttgaccg cgttgcgacc gaggctctcc aaccattccg 7080
ccacatcgtt gaagaacgga cccatcggac cttggagcag gaggtacttt ttaccgctca 7140
acagcaccgt cagcgcattg ccgtgcattt attaacctcc taacacgcgg tgttaagcgt 7200
tttcggcgag ctcttaacca aagcgcactt tgcagaacat gatcaacttg cgatagtagc 7260
gaatcacacg gccggctttc ttgcgggtga taaagatggg tttgcggggc gttttgatca 7320
gatattctgc cgcttcctcc accgtgatcg gctgcaaccg cgtcggatga atataggtgg 7380
gatagacaat cagggcttga tagatcaggt cggcgatggt cagccgccgc tcgcgacggg 7440
ggcagtggtg ctcatcgacg gtcaggcccc acgaggcgta gaacggcagg ccgtagcagt 7500
gcacctgttt accgtgcagc aatgcttcaa agccgctgag gctcgtcatc gtgtgcacct 7560
cgtccgcacg ctgaatacac tgaatgatat cggcatccag tgcctggtag tctgcgagtt 7620
ccgcgatctg ttccgccgga atgtcaccct tacggttgcc gacgagcaca tcggggtgcg 7680
gcttgtagat gatgtaggcg tgcggattac gttcccgcac ggtgcgcagc agctccagat 7740
tcgacttgat cgacacggtg cccgtcttaa tcgacgcatc gtcttccacc tggcccggca 7800
ccaggatgac tttcttgtcc ttcgcttctg ccgggaggct gaaatcggcc cccaggttat 7860
atttgctcaa tttgctttcc accagacgtt ggcgcaactt ttccgcgcgc atctggtgcg 7920
cgagggtcag ctggctgtga ttcagcagga cctccagttc cgacggacgg gtggcatcgt 7980
aatagatacc gcgcttatcc aggaccaggc tcaacggcgg cagcagatcg ctccccaggc 8040
cggagctgcg caggaagccg tcttccatgc gccacagcgg cagggatttg cgctgtgcct 8100
ccgcacgcca ttgctgttcg cctttcacgc cccacacgac gcaggcgctt gctgcggtac 8160
agcgacggga aaaggagaga cgattcgtgg ccgtttgcag gaagggcttc aggatcgcgc 8220
ttttccacag ggtcaggccc ggcacccaga gataaccatt ccgctgttgc aggtgacgac 8280
gttgcagctg gagccattgg agcaccgtga acagggccga cacctccccg gtctgcggat 8340
caatgtagcg gcaatagcgc agataggccg ctgcgaacag ttcctccagg gtggccgagc 8400
cgcgacgcgc cgacagcagc gccgattggg ggtggcggtc atcggtgagg ccccaccctg 8460
cataccaggg ttggccaaag caggtcacgg gcttaccggc cagcagggct tcaaaaccgt 8520
actgggaggt cacgacgtac acgcgggaca catgacgcag cagggactgc ggcgacacgt 8580
tttccgcaat caggcgcacg cgctgggtgg cacgcaagtc cgcgaagtag ccggtctttt 8640
tcccttccag gacatcggga tgcactttga cccagatttc tgcctgcggg ttttccgcca 8700
tcgctgcttc cagcattgcg gcgaactcat gggggcctgc gttgccgtag gtcacgctca 8760
tgtcattgaa ggtctggtcc accaccagca cgatgttcgt gcgctcgctt tcatccgcca 8820
cgaacgccgg tgccaggttg tacttgctca tgtcgcccgt cacaatggtg tgcatcgcct 8880
cgcgcgcctg atccgccagg gccgcgttgc cggccttgtc ctgcacgagt ttttccagcg 8940
cgctcggttt cgaggcgtcg tagtaaatgc cgcagtcatc cacgacgagc gagaggggcg 9000
gttcaccgtt cacgcccagg tccagcgagc ggacgaaacc atcctccaag cggatcaccg 9060
gcttgcctgc ggctttggcg atggccaccg gctttgcggc cgaggggcgg tgcccccaca 9120
ccgcgattgc atccacttcc tgcgggaccg ggcgcagcag cgacagcttt tggcagggct 9180
gggcgaggaa tttttccagg tgcggaatac gccaaatgcc ggggctataa atgccaatca 9240
tgcgttctcc gcgagctcct gcgccatcag ggcccggacc ttctccaagc acgccggggt 9300
atcgacgccg ggaccggtcg cggcgacctc gaaggtgcga atgttaatgc ccgcgctcat 9360
cagccgcagt tgctccaggg attcggcctg ttcgggcatg gactccggca actggctgta 9420
attttgcagg acatcccgcc gataggcgta gatcccgacg tgcttcaggt agcgcgcctt 9480
ctcggcgttg cgcgggtacg gaatggggga gcgggagaaa tacagggcgt cctgccgcgt 9540
gttcaccacg accttgacgg tggacggttc ggcggcttct gccgcgctga tcgcatgaca 9600
cagggtcgcc accggcagcg ccgggtcgtc ccgcatacct tgcagcaggg tttcgacgtc 9660
acgcgggcga atcatcggct catccccttg caggttgata tagatatccg cctccacctt 9720
atgcatgact tccaccaggc gatcggtgcc gctctcatga tcgttgcggg tcatgatcgc 9780
tttgccgccg aacgcctgga ctgcctgctc cacacgcggg tcgtcggttg cgacccacac 9840
ctctgccacg cctgccactt gcagggcccg ttcgtagacg tgctggatca tcggtttccc 9900
gacgatatcc agcagcggtt tgcccggcag acggctgctg ccgtagcgtg ccgggatcac 9960
aatcacggcc ttcgacattt attaacctcc tcgagttaca gcgacagaat cactttcgcg 10020
cccaccgcca gttggtacag aatggtgctg ataccgcgcg tcacttcgat gttcttcgac 10080
tcgtatttcg gcaacaccat aatttcatca ccgggtttca gggaatcgac gtcttctgcg 10140
ttcaccgctg cgccgttctg acggatgacg ataatacggg cgttgccgga cttctgggtc 10200
agcccaccgc acttctcgat gtagtcctcg gtcgtcatac ctttctgcca cgacaccgcg 10260
ttcgggaaca gcacttcccc gtggaccatg accaacgacg tcttttcggg aatattgatc 10320
acgtcgccgt cctccaggag gacggagtca atgttgcttt cattgaggat cacttcgccc 10380
ttcggcacga cggtgcgggc tttcgcgacg aagcgggaga tcagttgggc ttcctgcata 10440
cgcaggctgg cctcttcctt ggtgctgctc tgtgcgctga ggctggcctc ttcgagcttt 10500
tgcagggaca aattcagcat ttctttctgc cgttgcgcga cgctcggccg atacaactgc 10560
acggcgttca tctgcgacat ggagttcggg cgcacttttt cgagcacggc ccgcatggtg 10620
ctaccgtagg gcagcaccat ggcgtgttcc ccggaatgtg cgccttccac acgcacttga 10680
atggtgcccg catagcggtc ggtggagaca atgagggtat caccgttttg cagcatacgc 10740
cccggtgcgg acgagatcgg ataatattcc gagcgcttct ggaggccctg cttccgcata 10800
atcgtgatat gggtcgcacc cggtttggga cgtgcccagg acagtgcttc ggtgaccggg 10860
atgctcgatt cgcgaaattc aaagtcgtag gaattgaaca catcgccctg caccgagaac 10920
gtatgctggc gcggacccac aatgatcgta tcaccgtccg caaactggga cagccccagt 10980
ttgccgttga gcaggaagtc atagaggttg acgttcgagc gcacacgatt gccgcgtttc 11040
acgacgatgt ccacgtagct gccgcgttcc gggtccacac cacccgcctt gatcaggtag 11100
ttcagcaggc tgtcggaggt gacaccgccg tacaggccgg ggttgcggac aaagccggtc 11160
acatagacct tgaccggctg cgcctgcaag agcgacgcat agacgttcac gttgctctgg 11220
tagacttcct tcaccttgct cgtcaccagc gcgttcaact gggagttcga cacacctgcg 11280
actttgacgg ggccgacatt cggcaggaag atgttgccct tcgggtccac ctggagtgcg 11340
ccatcgaagg tgaacgcacc ccacaggcgg acctggatgg aatcgccggg attcaggatg 11400
tagtccggat tgaaacccac ggttgccccc gagtctgcgc tcgtaccgtt gaacagctgc 11460
gccccgaaca tacggctcat cacgaccggg ggtgcggggg gcggggtgtt atcgaagccg 11520
ctcatgttct gggtgtcgct tttctgcccg ttcaggatgc cggtcaacgg tgcggcaccc 11580
gtgaggttcg gatcggcatt aatgtcgatg gttgcgctcg cctgtgctgc atggcacgct 11640
gcgatcagca ggatcgactt aaacagcttc atttattaac ctcctcgaga agtcgactta 11700
gtcacggtgg tcttcaatca ccgccaggag caatttcagg gtgccaaaga gcaggcaaca 11760
caccagcagc caacacgcga tcaaatacgg gatattcggg aaggagcttt cctggggcag 11820
ctgcggggac gagatcacgc tcaggacttt cagcttacgg gccgcttcga cacgggtctt 11880
ttcgatgctg gtgagcgtga gcttgtacaa ctcggtattg aactcgacct tggatttgat 11940
ctcctcaaaa tccacggcca tgcggttcag tttatcgccc tggggtgcgg taattttcga 12000
cttttcttcg tcgatctgtg cctggaggct ctgaattgca ttgcgggcgc tcacgacttg 12060
gggcgcatcc tcgcgcaggt acgtgagcag gttgcgcagg tcggcttcca tctgaatttt 12120
ctggcccatc agcgtattca ccagggtgga tgccgcctgg gcctgtgcct gcgggtccag 12180
cacattgttg ttgtcttggt aggacaacaa ttcggctttc gatgcatcca gccgctggcg 12240
cgctttttcc atttcggttt ccgcaaacgc caattgatcg cgggcgatac ggtgcgacat 12300
ttcattgatg aaccgctcgg attccttgag cacggtctgg ttgaatttca gcgcgaactc 12360
gggcgaaaag ccctgggtct ggatgttcag cagcccggtc ttgtcgtcgt agctgacgtt 12420
gatgcgatct ttatagtact tcaggaaccc ctcggcggtt tcatccttgg acagatggtt 12480
caggaagtcc aggcccgaat gggagaacgc ttcgcggaag ttcagctgtt tatccagcgc 12540
ggccagcata tccgggctgt tgatgtattc cttcaggtac agtgcgtctt cggcggacga 12600
cgggttggag gcacccaaca gcaggccgaa gttcaggctg ccggagttga gatcgtcgct 12660
gcgcttgatg gccaccttgc tttccgacat atagcggggc tgggagaaga tcgccaagta 12720
gatcagcagc accgccatgg gtgccagaat aatgattttt gccaggtgct tctgaatatc 12780
tgccaggctg atcgcgctca gacgcgcacg catccacgag acggcgcttt tcactttgat 12840
cagcatttat taacctcctg tcgacaacac gtgttaatcg aaaatgcgca ccaacccggt 12900
caccttattt gctttgttgg tcaccagcag ggtcgagacg cggtgtttct gcatcttctc 12960
ttctgcttcg atgatcatgg tgtcttcggg caaggtcagc ggttcgcggg tcatcatctg 13020
tgcggccgtt gcgctcgtca ggctgtcttc tttctccata aagcgccgca gatcgccatc 13080
ggtgatgatg cctgccagcc caccttccgc atcttcgacc atcaccatac cctggcagcc 13140
cgaggtgatg cgctgaatga ccgttttgaa gctggcatcg agctgcactg ccggcacatc 13200
atgttgcatc acgtcggcga cgcgggtcag caggcgccga cccaggctgc caccggggtg 13260
gtagcgtgca aagtcattgg gcataaactt acgctggtga atcatcgcga tggccagcgc 13320
gtccccgatc gccatcgtga gcgtcgtgga ggtggtcggg gcgagattgt tcgggcacgt 13380
ttcgttcgcc atgtgcagct ccaggaccgc atctgcattt ttggccaggg tgctattccc 13440
gttattggtg attgcgatga tgcgattgcc gaagttcttc aggctcggca ccagtttcag 13500
gatctcgtcc gtctcaccgc tcgccgaaat caagatgagc aggtcatacg gggtgatcat 13560
gcccagatca ccatggaacg cttccgccgg atgaataaag aaggagggcg tcccggtcga 13620
ggccaaggtc gccgacatct tgcggcccac atggccgctt ttacccatgc cgctcaggat 13680
gacgtgccct ttacaattca tgatgagatt caggacgcgc tggtactgac cgctatccag 13740
ttgtttggac aggttttgca gtgccgcgct ttgttcggcc agggtctggc ggacgctcgt 13800
aatcagatac ggatcaatgg tcgaggactg gtcatccggc aagtggcgtt cgctcattta 13860
ttaacctcct cacgtgttaa ttaagtaatc gatagtgatt taaatatgca agatccgata 13920
aatcgattga tagatttaaa taagaactgc agaagctagc ttagatgctc gtgaaattga 13980
cgtgggcgct ttgcagggcc gtcttaatgg cgttggtgtc cacgaggatc gagtcgggtg 14040
cggaaaacgg acggttcttg ttggtgaaat cgctgttacc aatgtacagc gattccttgt 14100
tacgcagcgc ctggatgtgc cagcgggacc acgaatccca atacttctgg cgatccggcg 14160
agataccttg gctggtgtag ccggtcgtcg ggctgttcat caacgagtcg gtgcggtgcg 14220
agcccagcgt cagcggcaac ttgatccgat gcaccgtgga atcgccgaag atcagcttca 14280
gacgcgcgat aaattcgcta tccgcacccg ttttcacaca atcccagaca ccggccttct 14340
gcaagacgtc ggcacggcga aacaggagcg acgacggatt cagacgcttc aaggggtaca 14400
ctgcgcgggc atagaaaata ccgttgtctt gcaggcgcac ccagtccgag atggagcaga 14460
tgagcttcgg attgagcaac aagggggaga tttggcggaa cagcttttcc ggatggctcc 14520
agtcatccga atcgtggcag gtgacgaact cgcccttcgc ttggatcaag ccgatacgct 14580
tcgcggcata ggtgccgaca ttctgcggca ggctaatgat cttgatgcgc gtgtctttga 14640
gggcgagccg ctggagacga aacagggtgt catcggtgct cgcgtcatcc acaatgatca 14700
gctcgaagga acggtaggtc tgattgagga gcgaaatcac cgcattttcc acgcggcgac 14760
ccgtattata ggtggtcatc aggatggaga tcaacggccc cgtctgggcc gggtacggga 14820
tgctggtgat gatgttgcac ggggagagcg gggagctgtt gtccgtcaag gccacggggc 14880
tgaggccgaa gtatttatag tattcattca gccgattcag gctaatttcg gcggtttcgc 14940
ggaaggcgtt attttgcagc agcaggatat ccgggctata gacgatatcg gatgcgtcga 15000
tctgggcgag ggtcgagatg gccttttggg tcaggccgat ccggagttgc agtgcggtat 15060
acaggtccag cgggcagttg tccacgttgt ccaacaggct caggctaaag gtcggcgagt 15120
aggacgccag ggttttcgcc agttccactt tctgatgggt atcggtgaac tcgtccttga 15180
actccatcag cagctcgggc gtcaggctga tgtcgccgca ggcgattttt gcgatcttga 15240
ttgccagttt gcagcgccaa tcggacgggg tatccgtcaa gttatgcagc gaccagtaca 15300
tattcagacg atacatcgcg aggatgcgtt tcgactgcca gaaccggcaa tcatcctgga 15360
tggccgcgag cgcgtggacg tagcggctct ttttgagcag ccacaagaat ttgagattat 15420
tgaacattta ttaacctcct gctagcaact taagttacga atcgacgccg aacaggtcgc 15480
gggtgtagac tttctccgag acatcttcca gttcgctggt gcggcgattc gccacaatga 15540
catcgacgcg ctccttaaag gaattgatgt cgcgctcgac gtaggaaccg aagaagtagg 15600
gttctttcag gaccggctcg tacaccacaa tctcgatacc cttggccttc aaacgtttca 15660
tgaccccctg gatgctgctg gcccggaaat tgtcgctacc cgccttcatg atcaggcgat 15720
agataccgac cactttgggc ttacgggaca ggatgtcctc ggccacgaag tccttacggg 15780
tcgtattcgc atccacgatg gcctggatca ggttttgcgg gacgtcgcga taattggcca 15840
acagctgctt cgtatccttc ggcagacagt aaccgccgta gccgaaggac gggttgttgt 15900
aatgttgacc aatgcgcgga tcgagggaga cgccttcgat gatttgtttg gtatccaggc 15960
cgtgcacgct cgcgtaggtg tccagctcgt taaagtacgc gatacgcatc gccagatacg 16020
tgttcgcgaa cagtttgatg gcttctgcct cgggcgaatc cgtcagcagg atcggaatat 16080
cctttttgat ggcaccttcc gacaggagtt cggcgaactt ccgtgcgcgt tccgacgatt 16140
cgcccacgac aatgcggctc ggatagagat tatcatacag ggctttgcct tcgcgcagga 16200
actccgggga aaagatgata ttattcgtgt tcagatcgcg cttcaggcgt tcggtgaacc 16260
cgacggggac ggtggatttg ataatgatgg tcgcgttcgg gttaatggac agcacgtcac 16320
acgcgacgct ttcgacgctc agggtatcaa agttgttatt aatcggatca tagttcgtcg 16380
gggtggcgat gatcacgtag tctgcatcgc gatatgcctc gtatttttcc gtcgtcgcgt 16440
agaggttcag cttacgattg gagagaaact tctggatttc cgggtcgcaa atcggcgaga 16500
ttttcttgtt aatgagctgg accttcttcg ggtcgatgtc cagggcgatg atgtcgtgtt 16560
tttgggagag gaggatcgca atgctgatac ccacatagcc gacgccggcc acggcaattt 16620
tcatttatta acctccttaa gtgaattctt ataccgcagc ttctttgaag atttcgtaca 16680
gacgaaaggc attcttactt tttcccctgg agattctcat actcacgcgg ggtgccgcag 16740
aagatcacgt cggacttatt gatttcggta taatacactt tgatcccatt ggagatcagg 16800
taattgtaga tcggcgcaat atacagctcg cccgcatccc agttttcttg cggcaggttc 16860
ttgtaatgtt catacgcgga aataaagttt ttgatcgtgc tgaagtggta cagcccggtg 16920
caacacaaat tgctaatctg tttcttttcg gacgtggcaa tcacttcatt tttgacgtca 16980
ttgctgggca tcacgaacga ccagttgtcg ccatcgccgc gaaacacttc aatgtaacat 17040
tcattctcgc cctcgaactt ggtgaagatg aagttgggac gaatcgtgtc gatgttgaag 17100
atggtgatcg gctgttcgat attaaacagt ttcgagatgg ccaaatagac cgtctctgct 17160
tgaccccgcg tttccttatc cagggtgatc agcgtatagc tattaatgcc caggctggcg 17220
atacgctgga gcacgaacga tttcgtgtta aacacgtcac ggaggatgaa gacaaagtgt 17280
tccgtctcga agtacagttt gaagctcttg aggcacaaat cgaacagaaa ctcgccattc 17340
agctccagca tatacttcgg tttgctataa ccggctttga aaaagcggct cgacatacct 17400
gccatcggga taataatcat actgctgcct ccttaaagat ttcatacagg cggaaggcat 17460
tcgcaaacag ggcgtcctgc cgcttcttgt cgtcgctatg caacggcagc atcgacaaga 17520
acagatgaat ttgcatggcg tacagcgact tttcggagat gctgtatttt tccttaataa 17580
tggacacgaa ggtcgattgg atttcaaaga gtttgttatc aatattgatt ttgaactcaa 17640
tggaatgggt cttattcttt ttgttgataa tgtagtagcc cgcgatgatc cagtcataca 17700
ggcctagaat ggagtgcgac agtttcgcaa tatcgtagcg gaaatcgcca tagatcgaga 17760
tttcgccgct gtggttcaga ccgcgcggat cgaacacctg aatccggccc gtgcggaagt 17820
taaagataat attgctgaag cacaggtccc cgtgcatgat ggtcttgtat tgcagttcgg 17880
acggaatgaa tttgttcgtg tcgtacagga tgtcgttgat gctcacgcta atattgttgt 17940
taaaattcca tttcgcgttc gggtcaatgt tgagatcggt gatatacttg ctgacgcgct 18000
cgatggtctt ttcgtaaaac agatcctgga gaatgttttt atccgtatca atgctatgat 18060
actctttgca gaggtcgata aaatccaggc agctgatcag aatgttggtc aggatattat 18120
tcggcaggcg ggagaacacg aacagttcgt tcagggtggt attgtacagg tattcgagtt 18180
tgtagctttt gcgaatgtga tcgaacggtt ccagcaacat cggggtgtag attttcagtt 18240
cacccggaat cgtctcgaac catttcgatt ctgcctcgat cttgctttca ttcgaggagg 18300
acttaatcac ggacttggtc gtgatgcaca gctcattgaa ggcacgctgg gtcgtgtact 18360
ggactttcga cttatagtag gtattgatgt gaccgaaatc gagccagtcg ctgacgtaaa 18420
tcgacgccaa gctgtacgaa tcatggtact ttttcagggc tgccgtgaag tcaaacttgc 18480
tggtgaccag ttcgcgaatg aagaaattgg gtttgctgaa cgagaagtac ccgcagatga 18540
catttttgtt gtcctcgcgg gagactgccc gcaattccgt ctcatagaaa aaggaccact 18600
ggtagttatc atcggaatgg gagatcgcca cgaggtcatc acccgccgga atcttcttga 18660
acaaggtatc accaaacagc agttgcaggc ctttatcatc tttgtcgccg atcagattcc 18720
aggccgtgac gattgcctgg cccagggtca gattgctatc gaccggaatc atcgtcactt 18780
tattgcgcag caaccattcg taatcgtgtt tgtcgaacac gaaatcttcc ggcaggacca 18840
ggtagatcgc atggccatcg tgccccaagc tgacctggtg cttgaacaga cgcttgtttg 18900
ccaacggcag gaacgacggc gggatgctac cgaactccgc gcccaattcc tgctgcacgt 18960
agctaccaga cattattaga agcatttttt ctcctgttct aacatattag agatttcttc 19020
caaggtcata ttgcacagtt ccgagggccg gatggcccga tcgtccacat agaagccctc 19080
gtcgccgcac cacggcttgc cgacaatcac ctcgtcatac gggacgcggt tttcgttcag 19140
ccagtcgatg atcaccggca gcgtatgaat attgatcttg ccaatgtttt ccttgtacgt 19200
ccgcatattg cgcgcggtaa agatgacgat gtagaaaccg ttcagcttgt actcatagag 19260
tttttcgatc aatttcttat tgggggttgc atggctgtat ttgccgctca gattgaagct 19320
aatcgtatta tccagatcga cgataatttt cttcatttat taacctcctt aatataaacc 19380
aaggtaagct tttattcccg caggctcaga atttgctcca ggctgatttt acgcggggcc 19440
acaatattct tgatcttcag attgctcact ttacagtcgt acacattggc ccaggcgcac 19500
aagccgacgt tgatgtgccc cgagtagtac acattcgacg acgagatcag gctcgtcagt 19560
tgcgagtaaa tgttatccag accatgcacg cacatcagtt tcttcatgat gtccgggtcg 19620
ccatagaaca gctgatcgcc gatgccaaac ccccactcgc gaaaaatcca accgttgctg 19680
tcctcgcaat acacgctgtc gtccacgtcg atatcgttga tggtcacgtt atccacttgc 19740
agcagggcat cggggcggat tttgatgatg cagcggtact tatcccagtt atgatttttc 19800
agcgagcaga accaaaagga attgtggtag tacatctttt ccgcgttgct catcttgtta 19860
tacggatatt cgccatcatc cttgatattg atcaggacgg agttgcagcc ggagaagaac 19920
gacgagtaga tttcttccag gttattgttc ttataggagg agagcgacag gtctttcagc 19980
tcatcataat gttcatccac gaagctgtaa ttgtcgggtt cggacacgta ttgggcggct 20040
tccgaatcaa aaatgcggca gatgcgttct ttgctcagtt gcgtatgccc gatatccttc 20100
caggtggaga taaacacatc gacgtccgac ggaatcgtga tcttgctgac caggttcggc 20160
agcgcgtcga tgaaaccgcg cgactgcccc gtgatgaaca atgcgatctg gcgattggta 20220
ttcaggctca cattgctgct aatgaaatca tcaatcaccg agatgcgcga tttgatgata 20280
caggaaatga tgccgctata ttcgtcggcg tttgccagga caatttcatt gatgtggcac 20340
aagaagttgc gctcctgctg cggggtttcg tagaagcgtt tgctggtcag ggacagtgcg 20400
agcagcaaca acttaatcga attgaaggtg cagccgttcg agttgatcac gagattatac 20460
acgtagttgg ggatgtgcgg acggctcatc aggcgcttga agctggtatc acccaagctg 20520
gacaggtccg tgttattctt gttgaaacgt ttgatgtaga actccggaaa gaagaacgcg 20580
aagtaaaacg tccctgcgtt cgacaacttg ttcgggatga taatatactc gaagtattcc 20640
gacagccaca agtcgaacaa ctccaggatt ttgagatgcg cattaaagcc tttgccggtc 20700
gaaatgttct tgatgcagga cagcgtgcgc tcgtccagat ggttgacgat gagctgcacc 20760
agtttgattt tatcttcttt cttgctcagg ctcaggatgt gatcgaaggt caagttcttc 20820
aacatttatt aatcctccta ataagctttg aattcaaact agtttacaag tcgttttcga 20880
tcttctccca ggtatatttg cgacattcat tcaagttggt cagcggcgag tatttgtact 20940
ttttgatacc gaggcgcgac aggctttcgt tcaccacctt gaaatggttt tccttttgga 21000
tgtccagttt cttgatcgac gtgttctcgc cgtgcaggac acggttgtag caaatcttat 21060
tgatatgctt aaacgggccg acttcgctga gtttcaaata catatcgtaa tccaccgcat 21120
tgctgatgct ctcgttgaag ccttcggtga ggttccatgc acgcgccgtg aacatacgga 21180
agtggtggca gatcatcgcg ctcgtgagct tttcgcggct gtaaatcggc cagttgtagc 21240
cattgctaat caagttacct tcacgatcaa tattgcgatt ggtggtgtac acgcaggcga 21300
ggctcaggtc tttgcgaaat tcatccagac acagttccac ggcatcgggc tccaggaaat 21360
catcggaatc cagctgcccg atgtagaaac cccggcacag gcggactgcg gtattcgagg 21420
cggagccgat gcctttgttt ttctggctga tgaaacggac gcgcgggtgg tttgcgtaat 21480
gttcttgcag gatgcgcagc gtatcatcgg tgctcccgtc atcgcagatg cagacctcca 21540
gatcggtgat cgtttggttc agtgccgatt cgacgcagcg cacgatatat ttgctgcaat 21600
tatacgcggg gatgtagatg ctcaccaggg gcacacgttt cagggtggcg ctctcgattt 21660
tctccttctt gcgataaaag tagggcacct tctgctgcaa cagctggacg gtaatgtttt 21720
tacctgccgc gcgatcggtt tcgttctcct taccgggcgg ttcctgatga tatgccatcg 21780
cgccttccac gctacggaaa taacaaccct cgcggtacag ccgatagccg aactcattat 21840
cctcaccgcc ccaatgcgtg aactcttcgt caaaccaacc cgcgcgaaac agccacttct 21900
ttgcaaacgc cacattgcca ccgctaaaga accggaacgg ggtgttgcac aggcgcagat 21960
tgtcggtatt cttgaaatgt tcgatgcgcc aatcgacgga tttgttctgc tcgaccttgc 22020
ctgcgacctg attattggta ataatctccg ggatttcatt gatcaggctt ttctgggaca 22080
aaaagtccag ataggtatgc ttcgacgtgt cgatgtattt acgcgggcca atcagtgcca 22140
cgttatcatc cacggccagg agttccatat aggactgcac ccacaacggg ttcggcgcca 22200
tatcgcagtc caagatcgcc acgtagttgt atttcgctgc ccgcaggccc aggttccgca 22260
cggcgcacag ctggtagccg tagtctttct ggcggacgta tttgatgttc agcaacgact 22320
cgaactcgcg gacgatctct tcgatgtttt ccttggaacc gtcatccgcg acgatgacct 22380
catagtcata aatcgttttc tgattgcaga ggcaggccag ggtgatcgcc aggattttgg 22440
cgcgattgta cgtcggaatc acgatggaca ggccgtcgat gatcagttgc ttgcgcggat 22500
aatcatccag ttctttacgt ttccctgccc agacgtagtc gttcgtgctt tccggcagcg 22560
gcggcaaggt caggtcgctc ggccaatcca gcggaatggg ttcgacttct ttcaattcgg 22620
cgcgctcgga tttctttgcg gtaatttccc gatatttgct aatgatttca ttcttttcca 22680
cctcattcag cgagatcgcc tttgcattgc tgcacataat tttggttgcc gcgtcgatat 22740
caatgaccgc tttccgattc agcttgtcca cttcttcgct cagattcagg gcggtttggc 22800
acagcttgat attggcttcc acccagctca catcatagat ttccgccact ttttcaaaca 22860
gggagagggc ttggcggtag ttcttattct tatacagatt gattgcctgg ttcaaaatgc 22920
tcatttatta acctcctact agtgaatttt cgaattactt accgcagtac ttgacaccca 22980
cctgggaatt gtttttggtg cgtttgaatt ggcggatggt acggtagatg ctaaagggca 23040
ggctgatcag accgagcgga aaattgttct tattgatgat gagcttgccc agctgatagc 23100
tcaggtgttt cttgacccgt tcggcttcgt gtttatccgc gtacaggaag atgctcggca 23160
ggctcacttg gtactccgaa tcatatttct tcttccaggt ccgccattcg ctgatcaacg 23220
caaacggaat cgagatcaga ccgaggaacg tcttggagcg gctcaccatc accgcaccca 23280
ggcggtagcc gatatcttgc ttgatgcgtt cggccgcacc atacagctcc ggcagttgtt 23340
tcttttcgag acgttgattg tcgatgaagt actgttcgag cttttgctgc accagatgca 23400
gctgattgag cagcaattct ttttcgcacg acagcttttc gaggcgctgt tgttgcagtt 23460
catttttgtt ctgttccttt ttcagcaggg actcgaagtt ctcgatcgcg cactccagtt 23520
cctggacctg gatggttttg tttttaatga tcagatcata ctggatcagt tcttccttgc 23580
tatccgacag ctctttcaga atggcttgat aggcgttcag ctgtttggac gtgtgcagtt 23640
cgttgtccag aatgatcttt ttgctgctct ggtacagacc gttcacgata tcgagggtga 23700
tctggcgttg tttaatgaac gtctcccaaa taaaggacgg cttatagttt tccttctcca 23760
gcacccgcaa gggggtgttg gcgttcgatt gcaattcaaa gtacagttcc ttgcaatcgg 23820
gatagtcgtt caggacgttg aagatcaagt actcctccgt ctcgctttgc ttgaaaatga 23880
tatccccggt cccgatgtca ataccgctga gggacatgat ctcctgatgt tctttttcca 23940
gcgtaatgga ggcttcggcg gtcttaaagt cattcacgct ctgctccagc gagtggttga 24000
tggtattgga gaacgacaac ccgaatttca gtttcagttt gtgttgcagt tgctggatgc 24060
agtcctcggc gttgcgcttc acctgttcgc tcgacaccag caggcaccga ccccggttgt 24120
tgaggaagaa gtgcagcaag gcggtgttgt atgccagcca gtttttgatc agatgctccg 24180
aggtatagtt gctggagatg ttctggtccg agaagtagtt cgtcaggatg cttttggggt 24240
ggtcgtagat gaggataaag gtgatgttct catccaccga tttccaatat tccaacgtgt 24300
gaattgcgtt ggggtcgctc caaccgcaca gtttctggtt caggttggac agcatcagat 24360
ccaatgcgat accgttccag acggtgctca catggagcgg ttcaaagtcg gcggaatcgg 24420
tcaccgtata gatgtccggc gactggtacg ccttccgcag cgtctgggtg atgtcctggg 24480
gcgagaggtt ctcacgtttg gacgggcaca gggagttcat gccgcgctga tgcaggagtt 24540
cttccacgat ttggtagttg ctgctcggat ggcccacgat caccaggcgg ttcatttatt 24600
aacctccttt cgaaaatgaa cggtccgtta aatatagcca ttcggattct tcatctgcca 24660
gcgccaggcg tcctccagca tggtttcgag ttcccgcttg gctttccagt tcagatattt 24720
gttggccttt tcgggggagg accagctctc cgcgatatca ccgtcacggc ggctcacgat 24780
ttcatacgga atccgcacgc cggaaatctt ttcaaaggtg gacaccagtt ccagcaccga 24840
ataaccttta cccgtgccca aattaaagac gtggtagttg gtgttattgt cgcggaagag 24900
ataggacagc gctgcgacgt gcccttcggc caggtccatc acatggatat agtcacggac 24960
ccccgtgccg tctttggtgg gataatcacc accgaacacc atcagttttt ccagtttccc 25020
catcgcgacc tgcaagatgt acggcaccaa gttggagggg atgtctgccg ggctttcacc 25080
aatcataccg gattcgtggg cgcccgtcgg attaaagtag cgcaagcaga ggaaattcgt 25140
gtcggagtat ttcttggcga tgtcgcggat catcagctcc gagatgtact tggacgtacc 25200
atacggattc agcgtgccac caatatggca gtcttcggtg acgggcatga tcttgctttc 25260
cccatacacc gtcgccgacg agctaaagat gaagttggcg acgtcgttct tgatggcgca 25320
attgatgagt tgcagggtgc cgctcacgtt gttgtcatag tagaagatgg gcttgatcag 25380
gctttctgcg accgatttcg cacctgcaaa gtgcatgatg cagtcgaatt tgtgtttctt 25440
caggatctgg ttcacttcct tctcgttgtt gatattgagt tcgtagaacg tgactttctt 25500
ctttgcgatc agctcaatgc gacggatgct ttcgcagctg ctgttgatga gattgtcaat 25560
gatgacgaca ttgtagcctt tgttcagcag gcagagcgac gtgtggctgc cgatgtagcc 25620
tgcaccgccg gtgaccagga tgttcattta ttaacctcct cggtccgaat taacctaggt 25680
tatgaggtca gcattgcttc ttcacgcgtt tagtagttgt tttgttcggt gatatattct 25740
tcaatgcctt cttgcacgtc ttcatggaac gacacggcgt tgtcgtcttt aaacacgatt 25800
gccacatcgc agaactcttt caacgagttc agcgagtgcg acaccatgag gaaggagctt 25860
tccttatgac gctccttgaa gagttgggca catttttcct tgaaacgggc gtcccccacc 25920
gccgtcacct cgtccacgat gtagtaatcg aacttgaacg ccatgctcag gccgaagccg 25980
aggcggctgc gcataccgct cgaataggtc ttgatcggca tatcaaaata cttccccagc 26040
tccgcgaact cttccacaaa ctcaatcttt tctttcagct cctcctgctt cgcgtacagc 26100
cgggccacga acttcacgtt ttcacgcccg gtcaagctgc cctggaagcc gcctgccaga 26160
cccaccggcc acgagatcgt tttattcgtg atgattttac cgctatccgg gcggtcgatg 26220
cccccaatca tgcgcaacag cgtggattta cccgccccat tgcgcccgat gaacgccacg 26280
cttttgccgc tggggatctc aatgttcagg ttcttgaaga catagtgacg gcccaccggg 26340
gtgcggtagc ttttcgtcag gttttcgatc ttaatcatga ggtcaacatt gcctcctcac 26400
gcgtacggta cagggccaaa ccaataaaca gggtcaccag ggtgaacatt gccagataat 26460
tcaggctgac cccttcgctg atataaccgg gcatcacggc ctcgcggctc agttcgacga 26520
cgtgcaccag gggattccac agcaggtacg accaatactg cttcggaatg gagtgcagcg 26580
ggaacatgat gcacgaaata aagtacagcg gcttcagcaa gatcggcaag actttctgca 26640
tttcggggaa cgtcttgccc acgaccatga agatcaggcc cacaccgcac gacaggatga 26700
tcaggaggct ccaggtgagc acaaattgca ggaagttggt aatctcgaaa tattcgcccg 26760
ccatccagat gatcagcatc aggaggatgt agaccgccac atagatcagc gtttccaaga 26820
gggcgcgtgc aatgatcgtg tcgatcggct tcacgggccg gtagttaaac agcccctgat 26880
tggcttcgat ggcgcccacg gagcgattgc tgatgctgct gaaaataaag aacgggatca 26940
ggccattgag caggaacacc gggaaggaga tatccggcat ggtgcgatgc atgatatagc 27000
caaagatccc gagcagaatc agcagatgtg cgctcggttc caggatcgcc cacagatagc 27060
ccaggcgaaa cttgccaaag cgcgtacgga tttcgcggag aaacagtgct tcgaccgtca 27120
ctttctggac ttcaaaaccc gaacgtgcca tttattaacc tcctggtacc aatctagatt 27180
gtttaaacag atctgttacc tgcaggatta ttgtttctgt tgcataaagc ctaaggggta 27240
ggcctttcta gagatagcca ttttttgcac tcctgtatcc gcttcttgca aggctggact 27300
tatccctatc aaaccggaca ctgcaggctg acaagctttc attacatatg aagagtttgt 27360
agaaacgcaa aaaggccatc cgtcaggatg gccttctaag aaggctcgag tggcgcgcct 27420
aagtcgaatt tctgccattc atccgcttat tatacttatt caggcgtagc accaggcgtt 27480
taagggcacc aataactgcc ttaaaaaaat tacgccccgc cctgccactc atcgcagtac 27540
tgttgtaatt cattaagcat tctgccgaca tggaagccat cacagacggc atgatgaacc 27600
tgaatcgcca gcggcatcag caccttgtcg ccttgcgtat aatatttgcc catggtgaaa 27660
acgggggcga agaagttgtc catattggcc acgtttaaat caaaactggt gaaactcacc 27720
cagggattgg ctgagacgaa aaacatattc tcaataaacc ctttagggaa ataggccagg 27780
ttttcaccgt aacacgccac atcttgcgaa tatatgtgta gaaactgccg gaaatcgtcg 27840
tggtattcac tccagagcga tgaaaacgtt tcagtttgct catggaaaac ggtgtaacaa 27900
gggtgaacac tatcccatat caccagctca ccgtctttca ttgccatacg gaattccgga 27960
tgagcattca tcaggcgggc aagaatgtga ataaaggccg gataaaactt gtgcttattt 28020
ttctttacgg tctttaaaaa ggccgtaata tccagctgaa cggtctggtt ataggtacat 28080
tgagcaactg actgaaatgc ctcaaaatgt tctttacgat gccattggga tatatcaacg 28140
gtggtatatc cagtgatttt tttctccatt ttagcttcct tagctcctga aaatctcgat 28200
aactcaaaaa atacgcccgg tagtgatctt atttcattat ggtgaaagtt ggaacctctt 28260
acgtgccgat caacgtctca ttttcgccaa aagttggccc agggcttccc ggtatcaaca 28320
gggacaccag gatttattta ttctgcgaag tgatcttccg tcacaggtat ttattcggcg 28380
caaagggcct cgtgatacgc ctatttttat aggttaatgt catgataata atggtttctt 28440
agacgtcagg tggcactttt cggggaaatg tgcgcgcccg cgttcctgct ggcgctgggc 28500
ctgtttctgg cgctggactt cccgctgttc cgtcagcagc ttttcgccca cggccttgat 28560
gatcgcggcg gccttggcct gcatatcccg attcaacggc cccagggcgt ccagaacggg 28620
cttcaggcgc tcccgaaggt 28640
<210> 145
<211> 16562
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic plasmid pKM010
<400> 145
ttaccaatgc ttaatcagtg aggcacctat ctcagcgatc tgtctatttc gttcatccat 60
agttgcctga ctccccgtcg tgtagataac tacgatacgg gagggcttac catctggccc 120
cagtgctgca atgataccgc gagacccacg ctcaccggct ccagatttat cagcaataaa 180
ccagccagcc ggaagggccg agcgcagaag tggtcctgca actttatccg cctccatcca 240
gtctattaat tgttgccggg aagctagagt aagtagttcg ccagttaata gtttgcgcaa 300
cgttgttgcc attgctacag gcatcgtggt gtcacgctcg tcgtttggta tggcttcatt 360
cagctccggt tcccaacgat caaggcgagt tacatgatcc cccatgttgt gcaaaaaagc 420
ggttagctcc ttcggtcctc cgatcgttgt cagaagtaag ttggccgcag tgttatcact 480
catggttatg gcagcactgc ataattctct tactgtcatg ccatccgtaa gatgcttttc 540
tgtgactggt gagtactcaa ccaagtcatt ctgagaatag tgtatgcggc gaccgagttg 600
ctcttgcccg gcgtcaatac gggataatac cgcgccacat agcagaactt taaaagtgct 660
catcattgga aaacgttctt cggggcgaaa actctcaagg atcttaccgc tgttgagatc 720
cagttcgatg taacccactc gtgcacccaa ctgatcttca gcatctttta ctttcaccag 780
cgtttctggg tgagcaaaaa caggaaggca aaatgccgca aaaaagggaa taagggcgac 840
acggaaatgt tgaatactca tactcttcct ttttcaatat tattgaagca tttatcaggg 900
ttattgtctc atgagcggat acatatttga atgtatttag aaaaataaac aaataggggt 960
tccgcgcaca tttccccgaa aagtgccacc tgacgtctag atctcctacc gaccaggcat 1020
tggcgcgttc caccatcgtc ggcaaatcgc gttcgacagt caccagaatg ctgcgaaagc 1080
acgcagtgtc gtccataccg cccgcacgga aatccttgat cgcctgccgc gggttgtcga 1140
tcttgtattc gagcgtggtc gaggtcggct tgataccggc gcgcttggca gcgcgctcca 1200
ccaccgacca gatcaccggc gagcgggcca ggccagagcg tttgagcgca gcctgataca 1260
actcgccggc agccagcatc ggccgcttgc gctccacgcc acggtcgcgc cccatgtaac 1320
gcgccttggc aacggtccag cgcgcataca actcaggcgg cagcacatcg cgcagctcac 1380
gcccgtcttc gttcttcatc gccttcatcg ccgcgggcat cagggccaat ttgccgaaca 1440
tgccaacgtc ggcatccacc tgcaccatcg gcgccatcag cacctgctgc gattggccga 1500
tgatggtttc gacctcggtc gcttgccact ccaggtcctt cggcaacggt gacaacgtgc 1560
ccaggatcca cagcacgtgg tcgcccttgc tgaccttcca caggccgggg ccgggttgct 1620
gcccgcgcac caccatggct tccagatcga ccaccgttgg cggcgctgcc ggcgcctgta 1680
cggccacctc gacggcacac gccagcatcg gtgccaacaa cgacaccaac gcgattcctg 1740
cccgccacac cgcccccctg cgctgcatca cgtaccgcct cccggttgga acgcggacac 1800
tacgcgaacg cgggcccgca cgcgttaggg aagcgttggc ggctccggcg cggcgccttc 1860
ggcaaccaac gcggccagct gtgccgccag cggcgagccg tcttcgagca gcgcgaaacc 1920
ttcccagaca aaccctggcg aaaccgtgca gcccaccagg gtgaagtccc ccagcgagcg 1980
cgccgcctgc cagcagccgg ccggcaccac gtgcatggcg tcgccgcgct ctgcggcgtc 2040
cagcacttcg cgccgcaact gcccgctcgc ttcgtcgaag atcagcaact ccagcggcgc 2100
accttgctgc cagtgccagc actcctcggc atccacccga tgccagcgac tggcttcgcc 2160
tgcgcacaac aggaagcgga tggcggtcag cgccggacgc ggcggcgcac cgctgtcatc 2220
cagcacctgg cgcgtcgacg cgtacacgcg ccggtagtgg ccgccctccg gatggggggc 2280
aaggcccaat gttcgaatca gcgcggcggc ggttggatgc atgcacgcat gctaggccac 2340
acaccgccgc cgtgcatcac gccagctgtt tgcccgcacg caggcaggtg cggaagaaca 2400
ccagcagatc gcggccgcct cgacgctctc ccttatgcga ctcctgcatt aggaagcagc 2460
ccagtagtag gttgaggccg ttgagcaccg ccgccgcaag gaatggtgca tgcaaggaga 2520
tggcgcccaa cagtcccccg gccacggggc ctgccaccat acccacgccg aaacaagcgc 2580
tcatgagccc gaagtggcga gcccgatctt ccccatcggt gatgtcggcg atataggcgc 2640
cagcaaccgc acctgtggcg ccggtgatgc cggccacgat gcgtccggcg tacaagatcc 2700
acaggacggg tgtggtcgcc atgatcgcgt agtcgatagt ggctccaagt agcgaagcga 2760
gcaggactgg gcggcggcca aagcggtcgg acagtgctcc gagaacgggt gcgcatagaa 2820
attgcatcaa cgcatatagc gctagcagca cgccatagtg actggcgatg ctgtcggaat 2880
ggacgatatc ccgcaagagg cccggcagta ccggcataac caagcctatg cctacagcat 2940
ccagggtgac ggtgccgagg atgacgatga gcgcattgtt agatttcata cacggtgcct 3000
gactgcgtta gcaatttaac tgtgataaac taccgcatta aagccgagcg atgataagct 3060
gtcaaacatg agatccgata aatcgattga tagatttaaa taagaactgc agaagctagc 3120
ttagatgctc gtgaaattga cgtgggcgct ttgcagggcc gtcttaatgg cgttggtgtc 3180
cacgaggatc gagtcgggtg cggaaaacgg acggttcttg ttggtgaaat cgctgttacc 3240
aatgtacagc gattccttgt tacgcagcgc ctggatgtgc cagcgggacc acgaatccca 3300
atacttctgg cgatccggcg agataccttg gctggtgtag ccggtcgtcg ggctgttcat 3360
caacgagtcg gtgcggtgcg agcccagcgt cagcggcaac ttgatccgat gcaccgtgga 3420
atcgccgaag atcagcttca gacgcgcgat aaattcgcta tccgcacccg ttttcacaca 3480
atcccagaca ccggccttct gcaagacgtc ggcacggcga aacaggagcg acgacggatt 3540
cagacgcttc aaggggtaca ctgcgcgggc atagaaaata ccgttgtctt gcaggcgcac 3600
ccagtccgag atggagcaga tgagcttcgg attgagcaac aagggggaga tttggcggaa 3660
cagcttttcc ggatggctcc agtcatccga atcgtggcag gtgacgaact cgcccttcgc 3720
ttggatcaag ccgatacgct tcgcggcata ggtgccgaca ttctgcggca ggctaatgat 3780
cttgatgcgc gtgtctttga gggcgagccg ctggagacga aacagggtgt catcggtgct 3840
cgcgtcatcc acaatgatca gctcgaagga acggtaggtc tgattgagga gcgaaatcac 3900
cgcattttcc acgcggcgac ccgtattata ggtggtcatc aggatggaga tcaacggccc 3960
cgtctgggcc gggtacggga tgctggtgat gatgttgcac ggggagagcg gggagctgtt 4020
gtccgtcaag gccacggggc tgaggccgaa gtatttatag tattcattca gccgattcag 4080
gctaatttcg gcggtttcgc ggaaggcgtt attttgcagc agcaggatat ccgggctata 4140
gacgatatcg gatgcgtcga tctgggcgag ggtcgagatg gccttttggg tcaggccgat 4200
ccggagttgc agtgcggtat acaggtccag cgggcagttg tccacgttgt ccaacaggct 4260
caggctaaag gtcggcgagt aggacgccag ggttttcgcc agttccactt tctgatgggt 4320
atcggtgaac tcgtccttga actccatcag cagctcgggc gtcaggctga tgtcgccgca 4380
ggcgattttt gcgatcttga ttgccagttt gcagcgccaa tcggacgggg tatccgtcaa 4440
gttatgcagc gaccagtaca tattcagacg atacatcgcg aggatgcgtt tcgactgcca 4500
gaaccggcaa tcatcctgga tggccgcgag cgcgtggacg tagcggctct ttttgagcag 4560
ccacaagaat ttgagattat tgaacattta ttaacctcct gctagcaact taagttacga 4620
atcgacgccg aacaggtcgc gggtgtagac tttctccgag acatcttcca gttcgctggt 4680
gcggcgattc gccacaatga catcgacgcg ctccttaaag gaattgatgt cgcgctcgac 4740
gtaggaaccg aagaagtagg gttctttcag gaccggctcg tacaccacaa tctcgatacc 4800
cttggccttc aaacgtttca tgaccccctg gatgctgctg gcccggaaat tgtcgctacc 4860
cgccttcatg atcaggcgat agataccgac cactttgggc ttacgggaca ggatgtcctc 4920
ggccacgaag tccttacggg tcgtattcgc atccacgatg gcctggatca ggttttgcgg 4980
gacgtcgcga taattggcca acagctgctt cgtatccttc ggcagacagt aaccgccgta 5040
gccgaaggac gggttgttgt aatgttgacc aatgcgcgga tcgagggaga cgccttcgat 5100
gatttgtttg gtatccaggc cgtgcacgct cgcgtaggtg tccagctcgt taaagtacgc 5160
gatacgcatc gccagatacg tgttcgcgaa cagtttgatg gcttctgcct cgggcgaatc 5220
cgtcagcagg atcggaatat cctttttgat ggcaccttcc gacaggagtt cggcgaactt 5280
ccgtgcgcgt tccgacgatt cgcccacgac aatgcggctc ggatagagat tatcatacag 5340
ggctttgcct tcgcgcagga actccgggga aaagatgata ttattcgtgt tcagatcgcg 5400
cttcaggcgt tcggtgaacc cgacggggac ggtggatttg ataatgatgg tcgcgttcgg 5460
gttaatggac agcacgtcac acgcgacgct ttcgacgctc agggtatcaa agttgttatt 5520
aatcggatca tagttcgtcg gggtggcgat gatcacgtag tctgcatcgc gatatgcctc 5580
gtatttttcc gtcgtcgcgt agaggttcag cttacgattg gagagaaact tctggatttc 5640
cgggtcgcaa atcggcgaga ttttcttgtt aatgagctgg accttcttcg ggtcgatgtc 5700
cagggcgatg atgtcgtgtt tttgggagag gaggatcgca atgctgatac ccacatagcc 5760
gacgccggcc acggcaattt tcatttatta acctccttaa gtgaattcaa actagtttac 5820
aagtcgtttt cgatcttctc ccaggtatat ttgcgacatt cattcaagtt ggtcagcggc 5880
gagtatttgt actttttgat accgaggcgc gacaggcttt cgttcaccac cttgaaatgg 5940
ttttcctttt ggatgtccag tttcttgatc gacgtgttct cgccgtgcag gacacggttg 6000
tagcaaatct tattgatatg cttaaacggg ccgacttcgc tgagtttcaa atacatatcg 6060
taatccaccg cattgctgat gctctcgttg aagccttcgg tgaggttcca tgcacgcgcc 6120
gtgaacatac ggaagtggtg gcagatcatc gcgctcgtga gcttttcgcg gctgtaaatc 6180
ggccagttgt agccattgct aatcaagtta ccttcacgat caatattgcg attggtggtg 6240
tacacgcagg cgaggctcag gtctttgcga aattcatcca gacacagttc cacggcatcg 6300
ggctccagga aatcatcgga atccagctgc ccgatgtaga aaccccggca caggcggact 6360
gcggtattcg aggcggagcc gatgcctttg tttttctggc tgatgaaacg gacgcgcggg 6420
tggtttgcgt aatgttcttg caggatgcgc agcgtatcat cggtgctccc gtcatcgcag 6480
atgcagacct ccagatcggt gatcgtttgg ttcagtgccg attcgacgca gcgcacgata 6540
tatttgctgc aattatacgc ggggatgtag atgctcacca ggggcacacg tttcagggtg 6600
gcgctctcga ttttctcctt cttgcgataa aagtagggca ccttctgctg caacagctgg 6660
acggtaatgt ttttacctgc cgcgcgatcg gtttcgttct ccttaccggg cggttcctga 6720
tgatatgcca tcgcgccttc cacgctacgg aaataacaac cctcgcggta cagccgatag 6780
ccgaactcat tatcctcacc gccccaatgc gtgaactctt cgtcaaacca acccgcgcga 6840
aacagccact tctttgcaaa cgccacattg ccaccgctaa agaaccggaa cggggtgttg 6900
cacaggcgca gattgtcggt attcttgaaa tgttcgatgc gccaatcgac ggatttgttc 6960
tgctcgacct tgcctgcgac ctgattattg gtaataatct ccgggatttc attgatcagg 7020
cttttctggg acaaaaagtc cagataggta tgcttcgacg tgtcgatgta tttacgcggg 7080
ccaatcagtg ccacgttatc atccacggcc aggagttcca tataggactg cacccacaac 7140
gggttcggcg ccatatcgca gtccaagatc gccacgtagt tgtatttcgc tgcccgcagg 7200
cccaggttcc gcacggcgca cagctggtag ccgtagtctt tctggcggac gtatttgatg 7260
ttcagcaacg actcgaactc gcggacgatc tcttcgatgt tttccttgga accgtcatcc 7320
gcgacgatga cctcatagtc ataaatcgtt ttctgattgc agaggcaggc cagggtgatc 7380
gccaggattt tggcgcgatt gtacgtcgga atcacgatgg acaggccgtc gatgatcagt 7440
tgcttgcgcg gataatcatc cagttcttta cgtttccctg cccagacgta gtcgttcgtg 7500
ctttccggca gcggcggcaa ggtcaggtcg ctcggccaat ccagcggaat gggttcgact 7560
tctttcaatt cggcgcgctc ggatttcttt gcggtaattt cccgatattt gctaatgatt 7620
tcattctttt ccacctcatt cagcgagatc gcctttgcat tgctgcacat aattttggtt 7680
gccgcgtcga tatcaatgac cgctttccga ttcagcttgt ccacttcttc gctcagattc 7740
agggcggttt ggcacagctt gatattggct tccacccagc tcacatcata gatttccgcc 7800
actttttcaa acagggagag ggcttggcgg tagttcttat tcttatacag attgattgcc 7860
tggttcaaaa tgctcattta ttaacctcct actagtgaat tttcgaatta cttaccgcag 7920
tacttgacac ccacctggga attgtttttg gtgcgtttga attggcggat ggtacggtag 7980
atgctaaagg gcaggctgat cagaccgagc ggaaaattgt tcttattgat gatgagcttg 8040
cccagctgat agctcaggtg tttcttgacc cgttcggctt cgtgtttatc cgcgtacagg 8100
aagatgctcg gcaggctcac ttggtactcc gaatcatatt tcttcttcca ggtccgccat 8160
tcgctgatca acgcaaacgg aatcgagatc agaccgagga acgtcttgga gcggctcacc 8220
atcaccgcac ccaggcggta gccgatatct tgcttgatgc gttcggccgc accatacagc 8280
tccggcagtt gtttcttttc gagacgttga ttgtcgatga agtactgttc gagcttttgc 8340
tgcaccagat gcagctgatt gagcagcaat tctttttcgc acgacagctt ttcgaggcgc 8400
tgttgttgca gttcattttt gttctgttcc tttttcagca gggactcgaa gttctcgatc 8460
gcgcactcca gttcctggac ctggatggtt ttgtttttaa tgatcagatc atactggatc 8520
agttcttcct tgctatccga cagctctttc agaatggctt gataggcgtt cagctgtttg 8580
gacgtgtgca gttcgttgtc cagaatgatc tttttgctgc tctggtacag accgttcacg 8640
atatcgaggg tgatctggcg ttgtttaatg aacgtctccc aaataaagga cggcttatag 8700
ttttccttct ccagcacccg caagggggtg ttggcgttcg attgcaattc aaagtacagt 8760
tccttgcaat cgggatagtc gttcaggacg ttgaagatca agtactcctc cgtctcgctt 8820
tgcttgaaaa tgatatcccc ggtcccgatg tcaataccgc tgagggacat gatctcctga 8880
tgttcttttt ccagcgtaat ggaggcttcg gcggtcttaa agtcattcac gctctgctcc 8940
agcgagtggt tgatggtatt ggagaacgac aacccgaatt tcagtttcag tttgtgttgc 9000
agttgctgga tgcagtcctc ggcgttgcgc ttcacctgtt cgctcgacac cagcaggcac 9060
cgaccccggt tgttgaggaa gaagtgcagc aaggcggtgt tgtatgccag ccagtttttg 9120
atcagatgct ccgaggtata gttgctggag atgttctggt ccgagaagta gttcgtcagg 9180
atgcttttgg ggtggtcgta gatgaggata aaggtgatgt tctcatccac cgatttccaa 9240
tattccaacg tgtgaattgc gttggggtcg ctccaaccgc acagtttctg gttcaggttg 9300
gacagcatca gatccaatgc gataccgttc cagacggtgc tcacatggag cggttcaaag 9360
tcggcggaat cggtcaccgt atagatgtcc ggcgactggt acgccttccg cagcgtctgg 9420
gtgatgtcct ggggcgagag gttctcacgt ttggacgggc acagggagtt catgccgcgc 9480
tgatgcagga gttcttccac gatttggtag ttgctgctcg gatggcccac gatcaccagg 9540
cggttcattt attaacctcc tttcgaaaat gaacggtccg ttaaatatag ccattcggat 9600
tcttcatctg ccagcgccag gcgtcctcca gcatggtttc gagttcccgc ttggctttcc 9660
agttcagata tttgttggcc ttttcggggg aggaccagct ctccgcgata tcaccgtcac 9720
ggcggctcac gatttcatac ggaatccgca cgccggaaat cttttcaaag gtggacacca 9780
gttccagcac cgaataacct ttacccgtgc ccaaattaaa gacgtggtag ttggtgttat 9840
tgtcgcggaa gagataggac agcgctgcga cgtgcccttc ggccaggtcc atcacatgga 9900
tatagtcacg gacccccgtg ccgtctttgg tgggataatc accaccgaac accatcagtt 9960
tttccagttt ccccatcgcg acctgcaaga tgtacggcac caagttggag gggatgtctg 10020
ccgggctttc accaatcata ccggattcgt gggcgcccgt cggattaaag tagcgcaagc 10080
agaggaaatt cgtgtcggag tatttcttgg cgatgtcgcg gatcatcagc tccgagatgt 10140
acttggacgt accatacgga ttcagcgtgc caccaatatg gcagtcttcg gtgacgggca 10200
tgatcttgct ttccccatac accgtcgccg acgagctaaa gatgaagttg gcgacgtcgt 10260
tcttgatggc gcaattgatg agttgcaggg tgccgctcac gttgttgtca tagtagaaga 10320
tgggcttgat caggctttct gcgaccgatt tcgcacctgc aaagtgcatg atgcagtcga 10380
atttgtgttt cttcaggatc tggttcactt ccttctcgtt gttgatattg agttcgtaga 10440
acgtgacttt cttctttgcg atcagctcaa tgcgacggat gctttcgcag ctgctgttga 10500
tgagattgtc aatgatgacg acattgtagc ctttgttcag caggcagagc gacgtgtggc 10560
tgccgatgta gcctgcaccg ccggtgacca ggatgttcat ttattaacct cctcggtccg 10620
aattaaccta ggttatgagg tcagcattgc ttcttcacgc ggtgttaatt aagtaatcga 10680
tagtgattta aatatgcaag atctagttac ctgcaggcgc gccgcggccg ccaagacggt 10740
attcgggctg caccgtggac attgccagcg ggtccggatg cggcagcgaa gacgccatct 10800
ccgggccggt gctgcaagcg cccagcgaca tcgagcagag cagagccagg ctgaggcctt 10860
ggcagagtcg tccgatcagt ttcttcatgc gtgtagctgg ctgcctctgt tgggtgggac 10920
aggacctcgc gcagcattca accggctcag gcgccagcac gaacgtacga caggaagttg 10980
catcccgacg cgtgccggga ccaacgttga atcgcgtgtt gcagtgcact atggcataga 11040
acgaacacat cgcaaggcac aacacgccat ttttttgacg gcgttggcct attgattcaa 11100
gttcgtcgcc tcgacgttaa gagaacgtga cctgggtcgt cattctcagc atacgaactc 11160
tagcgtttcc gggcacttac ggacgcctgc tgatcccgac ttgtagcagc ctgaaccgcg 11220
aaataattgc gtacaggact tgcatatgcc gccttgcaat atgccgttgc gcatagtggc 11280
atagcctgga atgccatcga actgacatgt tgcgacgcaa caaaaaggcc cacgtcttgc 11340
gacgtaggcc tgttgtttgg tcggggtagc cggattcgaa ccgacgacca ctagtccccc 11400
agactagtgc gctaccaggc tgcgctatac cccgaagatg ttgcgtcccg ccctgaggcg 11460
gcctgcgatt atagcggctt tatgcggcgc tttcctagcg tcgcagcagc tgcaggactt 11520
cttcaagctc catgcgcacc tgcttgatga tctgattgct cagcgctgac tcgctcttgg 11580
ccccatcccc ttcaagacgc agacgcgcgc ccccgatggt gtaaccctgc tcgtacagca 11640
ggccacgaat ctgccgcacc atcagcacat cgtgccgctg gtagtagcgt cggttgccgc 11700
gccgcttgac tggctccagg ctcggaaatt cggtttccca atagcgcagc acgtgcggct 11760
tgacgtcgca cagctcgctc acctcaccga tggtgaagta gcgcttggcc ggaatcggcg 11820
gtagctcgcg attactgccc ggatccagca taagcctcca cccgttcctt gagtttctgg 11880
ccggggcgga aggtcaccac cgtcctggcc gagatcggaa tttcctcacc ggtcttggga 11940
ttgcgaccgg gccgttggtt cttgcgccgc agatcgaagt tgccgaagcc cgacaacttc 12000
acctgacggc cctgctccag tgcatcgcgc agcacatcga aaaacgcgtc gacgaattcc 12060
ttcgcctcac gcttgttcag gccgacttcg tcgaacagac gctcggccat ctccgctttc 12120
gtcaatgcca tgccaatccc ctgttaccgc cagatctgaa ttcagctgta caattggtac 12180
catggatgca tatggcggcc gggccctacg tacgcgtgtt aaccggtgag ctcactagag 12240
gatccagccg accaggcttt ccacgcccgc gtgccgctcc atgtcgttcg cgcggttctc 12300
ggaaacgcgc tgccgcgttt cgtgattgtc acgctcaagc ccgtagtccc gttcgagcgt 12360
cgcgcagagg tcagcgaggg cgcggtaggc ccgatacggc tcatggatgg tgtttcgggt 12420
cgggtgaatc ttgttgatgg cgatatggat gtgcaggttg tcggtgtcgt gatgcacggc 12480
actgacgcgc tgatgctcgg cgaagccaag cccagcgcag atgcggtcct caatcgcgcg 12540
caacgtctcc gcgtcgggct tctctcccgc gcggaagcta accagcaggt gataggtctt 12600
gtcggcctcg gaacgggtgt tgccgtgctg ggtcgccatc acctcggcca tgacagcggg 12660
cagggtgttt gcctcgcagt tcgtgacgcg cacgtgaccc aggcgctcgg tcttgccttg 12720
ctcgtcggtg atgtacttca ccagctccgc gaagtcgctc ttcttgatgg agcgcatggg 12780
gacgtgcttg gcaatcacgc gcaccccccg gccgttttag cggctaaaaa agtcatggct 12840
ctgccctcgg gcggaccacg cccatcatga ccttgccaag ctcgtcctgc ttctcttcga 12900
tcttcgccag cagggcgagg atcgtggcat caccgaaccg cgccgtgcgc gggtcgtcgg 12960
tgagccagag tttcagcagg ccgcccaggc ggcccaggtc gccattgatg cgggccagct 13020
cgcggacgtg ctcatagtcc acgacgcccg tgattttgta gccctggccg acggccagca 13080
ggtaggccga caggctcatg ccggccgccg ccgccttttc ctcaatcgct cttcgttcgt 13140
ctggaaggca gtacaccttg ataggtgggc tgcccttcct ggttggcttg gtttcatcag 13200
ccatccgctt gccctcatct gttacgccgg cggtagccgg ccagcctcgc agagcaggat 13260
tcccgttgag caccgccagg tgcgaataag ggacagtgaa gaaggaacac ccgctcgcgg 13320
gtgggcctac ttcacctatc ctgcccggct gacgccgttg gatacaccaa ggaaagtcta 13380
cacgaaccct ttggcaaaat cctgtatatc gtgcgaaaaa ggatggatat accgaaaaaa 13440
tcgctataat gaccccgaag cagggttatg cagcggaaaa gcgctgcttc cctgctgttt 13500
tgtggaatat ctaccgactg gaaacaggca aatgcaggaa attactgaac tgaggggaca 13560
ggcgagagac gatgccaaag agctacaccg acgagctggc cgagtgggtt gaatcccgcg 13620
cggccaagaa gcgccggcgt gatgaggctg cggttgcgtt cctggcggtg agggcggatg 13680
tcgaggcggc gttagcgtcc ggctatgcgc tcgtcaccat ttgggagcac atgcgggaaa 13740
cggggaaggt caagttctcc tacgagacgt tccgctcgca cgccaggcgg cacatcaagg 13800
ccaagcccgc cgatgtgccc gcaccgcagg ccaaggctgc ggaacccgcg ccggcaccca 13860
agacgccgga gccacggcgg ccgaagcagg ggggcaaggc tgaaaagccg gcccccgctg 13920
cggccccgac cggcttcacc ttcaacccaa caccggacaa aaaggatccc caattctcat 13980
gtttgacagc ttatcatcga taagctttaa tgcggtagtt tatcacagtt aaattgctaa 14040
cgcagtcagg caccgtgtat gaaatctaac aatgcgctca tcgtcatcct cggcaccgtc 14100
accctggatg ctgtaggcat aggcttggtt atgccggtac tgccgggcct cttgcgggat 14160
atcgtccatt ccgacagcat cgccagtcac tatggcgtgc tgctagcgct atatgcgttg 14220
atgcaatttc tatgcgcacc cgttctcgga gcactgtccg accgctttgg ccgccgccca 14280
gtcctgctcg cttcgctact tggagccact atcgactacg cgatcatggc gaccacaccc 14340
gtcctgtgga tcctctacgc cggacgcatc gtggccggca tcaccggcgc cacaggtgcg 14400
gttgctggcg cctatatcgc cgacatcacc gatggggaag atcgggctcg ccacttcggg 14460
ctcatgagcg cttgtttcgg cgtgggtatg gtggcaggcc ccgtggccgg gggactgttg 14520
ggcgccatct ccttgcatgc accattcctt gcggcggcgg tgctcaacgg cctcaaccta 14580
ctactgggct gcttcctaat gcaggagtcg cataagggag agcgtcgacc gatgcccttg 14640
agagccttca acccagtcag ctccttccgg tgggcgcggg gcatgactat cgtcgccgca 14700
cttatgactg tcttctttat catgcaactc gtaggacagg tgccggcagc gctctgggtc 14760
attttcggcg aggaccgctt tcgctggagc gcgacgatga tcggcctgtc gcttgcggta 14820
ttcggaatct tgcacgccct cgctcaagcc ttcgtcactg gtcccgccac caaacgtttc 14880
ggcgagaagc aggccattat cgccggcatg gcggccgacg cgctgggcta cgtcttgctg 14940
gcgttcgcga cgcgaggctg gatggccttc cccattatga ttcttctcgc ttccggcggc 15000
atcgggatgc ccgcgttgca ggccatgctg tccaggcagg tagatgacga ccatcaggga 15060
cagcttcaag gatcgctcgc ggctcttacc agcctaactt cgatcactgg accgctgatc 15120
gtcacggcga tttatgccgc ctcggcgagc acatggaacg ggttggcatg gattgtaggc 15180
gccgccctat accttgtctg cctccccgcg ttgcgtcgcg gtgcatggag ccgggccacc 15240
tcgacctgaa tggaagccgg cggcacctcg ctaacggatt caccactcca agaattggag 15300
ccaatcaatt cttgcggaga actgtgaatg cgcaaaccaa cccttggcag aacatatcca 15360
tcgcgtccgc catctccagc agccgcacgc ggcgcatctc gggcagcgtt gggtcctggc 15420
cacgggtgcg catgatcgtg ctcctgtcgt tgaggacccg gctaggctgg cggggttgcc 15480
ttactggtta gcagaatgaa tcaccgatac gcgagcgaac gtgaagcgac tgctgctgca 15540
aaacgtctgc gacctgagca acaacatgaa tggtcttcgg tttccgtgtt tcgtaaagtc 15600
tggaaacgcg gaagtcagcg ctcttccgct tcctcgctca ctgactcgct gcgctcggtc 15660
gttcggctgc ggcgagcggt atcagctcac tcaaaggcgg taatacggtt atccacagaa 15720
tcaggggata acgcaggaaa gaacatgtga gcaaaaggcc agcaaaaggc caggaaccgt 15780
aaaaaggccg cgttgctggc gtttttccat aggctccgcc cccctgacga gcatcacaaa 15840
aatcgacgct caagtcagag gtggcgaaac ccgacaggac tataaagata ccaggcgttt 15900
ccccctggaa gctccctcgt gcgctctcct gttccgaccc tgccgcttac cggatacctg 15960
tccgcctttc tcccttcggg aagcgtggcg ctttctcata gctcacgctg taggtatctc 16020
agttcggtgt aggtcgttcg ctccaagctg ggctgtgtgc acgaaccccc cgttcagccc 16080
gaccgctgcg ccttatccgg taactatcgt cttgagtcca acccggtaag acacgactta 16140
tcgccactgg cagcagccac tggtaacagg attagcagag cgaggtatgt aggcggtgct 16200
acagagttct tgaagtggtg gcctaactac ggctacacta gaaggacagt atttggtatc 16260
tgcgctctgc tgaagccagt taccttcgga aaaagagttg gtagctcttg atccggcaaa 16320
caaaccaccg ctggtagcgg tggttttttt gtttgcaagc agcagattac gcgcagaaaa 16380
aaaggatctc aagaagatcc tttgatcttt tctacggggt ctgacgctca gtggaacgaa 16440
aactcacgtt aagggatttt ggtcatgaga ttatcaaaaa ggatcttcac ctagatcctt 16500
ttaaattaaa aatgaagttt taaatcaatc taaagtatat atgagtaaac ttggtctgac 16560
ag 16562
<210> 146
<211> 16769
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic plasmid pKM011
<400> 146
ttaccaatgc ttaatcagtg aggcacctat ctcagcgatc tgtctatttc gttcatccat 60
agttgcctga ctccccgtcg tgtagataac tacgatacgg gagggcttac catctggccc 120
cagtgctgca atgataccgc gagacccacg ctcaccggct ccagatttat cagcaataaa 180
ccagccagcc ggaagggccg agcgcagaag tggtcctgca actttatccg cctccatcca 240
gtctattaat tgttgccggg aagctagagt aagtagttcg ccagttaata gtttgcgcaa 300
cgttgttgcc attgctacag gcatcgtggt gtcacgctcg tcgtttggta tggcttcatt 360
cagctccggt tcccaacgat caaggcgagt tacatgatcc cccatgttgt gcaaaaaagc 420
ggttagctcc ttcggtcctc cgatcgttgt cagaagtaag ttggccgcag tgttatcact 480
catggttatg gcagcactgc ataattctct tactgtcatg ccatccgtaa gatgcttttc 540
tgtgactggt gagtactcaa ccaagtcatt ctgagaatag tgtatgcggc gaccgagttg 600
ctcttgcccg gcgtcaatac gggataatac cgcgccacat agcagaactt taaaagtgct 660
catcattgga aaacgttctt cggggcgaaa actctcaagg atcttaccgc tgttgagatc 720
cagttcgatg taacccactc gtgcacccaa ctgatcttca gcatctttta ctttcaccag 780
cgtttctggg tgagcaaaaa caggaaggca aaatgccgca aaaaagggaa taagggcgac 840
acggaaatgt tgaatactca tactcttcct ttttcaatat tattgaagca tttatcaggg 900
ttattgtctc atgagcggat acatatttga atgtatttag aaaaataaac aaataggggt 960
tccgcgcaca tttccccgaa aagtgccacc tgacgtctag atctcctacc gaccaggcat 1020
tggcgcgttc caccatcgtc ggcaaatcgc gttcgacagt caccagaatg ctgcgaaagc 1080
acgcagtgtc gtccataccg cccgcacgga aatccttgat cgcctgccgc gggttgtcga 1140
tcttgtattc gagcgtggtc gaggtcggct tgataccggc gcgcttggca gcgcgctcca 1200
ccaccgacca gatcaccggc gagcgggcca ggccagagcg tttgagcgca gcctgataca 1260
actcgccggc agccagcatc ggccgcttgc gctccacgcc acggtcgcgc cccatgtaac 1320
gcgccttggc aacggtccag cgcgcataca actcaggcgg cagcacatcg cgcagctcac 1380
gcccgtcttc gttcttcatc gccttcatcg ccgcgggcat cagggccaat ttgccgaaca 1440
tgccaacgtc ggcatccacc tgcaccatcg gcgccatcag cacctgctgc gattggccga 1500
tgatggtttc gacctcggtc gcttgccact ccaggtcctt cggcaacggt gacaacgtgc 1560
ccaggatcca cagcacgtgg tcgcccttgc tgaccttcca caggccgggg ccgggttgct 1620
gcccgcgcac caccatggct tccagatcga ccaccgttgg cggcgctgcc ggcgcctgta 1680
cggccacctc gacggcacac gccagcatcg gtgccaacaa cgacaccaac gcgattcctg 1740
cccgccacac cgcccccctg cgctgcatca cgtaccgcct cccggttgga acgcggacac 1800
tacgcgaacg cgggcccgca cgcgttaggg aagcgttggc ggctccggcg cggcgccttc 1860
ggcaaccaac gcggccagct gtgccgccag cggcgagccg tcttcgagca gcgcgaaacc 1920
ttcccagaca aaccctggcg aaaccgtgca gcccaccagg gtgaagtccc ccagcgagcg 1980
cgccgcctgc cagcagccgg ccggcaccac gtgcatggcg tcgccgcgct ctgcggcgtc 2040
cagcacttcg cgccgcaact gcccgctcgc ttcgtcgaag atcagcaact ccagcggcgc 2100
accttgctgc cagtgccagc actcctcggc atccacccga tgccagcgac tggcttcgcc 2160
tgcgcacaac aggaagcgga tggcggtcag cgccggacgc ggcggcgcac cgctgtcatc 2220
cagcacctgg cgcgtcgacg cgtacacgcg ccggtagtgg ccgccctccg gatggggggc 2280
aaggcccaat gttcgaatca gcgcggcggc ggttggatgc atgcacgcat gctaggccac 2340
acaccgccgc cgtgcatcac gccagctgtt tgcccgcacg caggcaggtg cggaagaaca 2400
ccagcagatc gcggccgcct cgacgctctc ccttatgcga ctcctgcatt aggaagcagc 2460
ccagtagtag gttgaggccg ttgagcaccg ccgccgcaag gaatggtgca tgcaaggaga 2520
tggcgcccaa cagtcccccg gccacggggc ctgccaccat acccacgccg aaacaagcgc 2580
tcatgagccc gaagtggcga gcccgatctt ccccatcggt gatgtcggcg atataggcgc 2640
cagcaaccgc acctgtggcg ccggtgatgc cggccacgat gcgtccggcg tacaagatcc 2700
acaggacggg tgtggtcgcc atgatcgcgt agtcgatagt ggctccaagt agcgaagcga 2760
gcaggactgg gcggcggcca aagcggtcgg acagtgctcc gagaacgggt gcgcatagaa 2820
attgcatcaa cgcatatagc gctagcagca cgccatagtg actggcgatg ctgtcggaat 2880
ggacgatatc ccgcaagagg cccggcagta ccggcataac caagcctatg cctacagcat 2940
ccagggtgac ggtgccgagg atgacgatga gcgcattgtt agatttcata cacggtgcct 3000
gactgcgtta gcaatttaac tgtgataaac taccgcatta aagccgagcg atgataagct 3060
gtcaaacatg agatccgata aatcgattga tagatttaaa taagaactgc agaagctagc 3120
ttagatgctc gtgaaattga cgtgggcgct ttgcagggcc gtcttaatgg cgttggtgtc 3180
cacgaggatc gagtcgggtg cggaaaacgg acggttcttg ttggtgaaat cgctgttacc 3240
aatgtacagc gattccttgt tacgcagcgc ctggatgtgc cagcgggacc acgaatccca 3300
atacttctgg cgatccggcg agataccttg gctggtgtag ccggtcgtcg ggctgttcat 3360
caacgagtcg gtgcggtgcg agcccagcgt cagcggcaac ttgatccgat gcaccgtgga 3420
atcgccgaag atcagcttca gacgcgcgat aaattcgcta tccgcacccg ttttcacaca 3480
atcccagaca ccggccttct gcaagacgtc ggcacggcga aacaggagcg acgacggatt 3540
cagacgcttc aaggggtaca ctgcgcgggc atagaaaata ccgttgtctt gcaggcgcac 3600
ccagtccgag atggagcaga tgagcttcgg attgagcaac aagggggaga tttggcggaa 3660
cagcttttcc ggatggctcc agtcatccga atcgtggcag gtgacgaact cgcccttcgc 3720
ttggatcaag ccgatacgct tcgcggcata ggtgccgaca ttctgcggca ggctaatgat 3780
cttgatgcgc gtgtctttga gggcgagccg ctggagacga aacagggtgt catcggtgct 3840
cgcgtcatcc acaatgatca gctcgaagga acggtaggtc tgattgagga gcgaaatcac 3900
cgcattttcc acgcggcgac ccgtattata ggtggtcatc aggatggaga tcaacggccc 3960
cgtctgggcc gggtacggga tgctggtgat gatgttgcac ggggagagcg gggagctgtt 4020
gtccgtcaag gccacggggc tgaggccgaa gtatttatag tattcattca gccgattcag 4080
gctaatttcg gcggtttcgc ggaaggcgtt attttgcagc agcaggatat ccgggctata 4140
gacgatatcg gatgcgtcga tctgggcgag ggtcgagatg gccttttggg tcaggccgat 4200
ccggagttgc agtgcggtat acaggtccag cgggcagttg tccacgttgt ccaacaggct 4260
caggctaaag gtcggcgagt aggacgccag ggttttcgcc agttccactt tctgatgggt 4320
atcggtgaac tcgtccttga actccatcag cagctcgggc gtcaggctga tgtcgccgca 4380
ggcgattttt gcgatcttga ttgccagttt gcagcgccaa tcggacgggg tatccgtcaa 4440
gttatgcagc gaccagtaca tattcagacg atacatcgcg aggatgcgtt tcgactgcca 4500
gaaccggcaa tcatcctgga tggccgcgag cgcgtggacg tagcggctct ttttgagcag 4560
ccacaagaat ttgagattat tgaacattta ttaacctcct gctagcaact taagttacga 4620
atcgacgccg aacaggtcgc gggtgtagac tttctccgag acatcttcca gttcgctggt 4680
gcggcgattc gccacaatga catcgacgcg ctccttaaag gaattgatgt cgcgctcgac 4740
gtaggaaccg aagaagtagg gttctttcag gaccggctcg tacaccacaa tctcgatacc 4800
cttggccttc aaacgtttca tgaccccctg gatgctgctg gcccggaaat tgtcgctacc 4860
cgccttcatg atcaggcgat agataccgac cactttgggc ttacgggaca ggatgtcctc 4920
ggccacgaag tccttacggg tcgtattcgc atccacgatg gcctggatca ggttttgcgg 4980
gacgtcgcga taattggcca acagctgctt cgtatccttc ggcagacagt aaccgccgta 5040
gccgaaggac gggttgttgt aatgttgacc aatgcgcgga tcgagggaga cgccttcgat 5100
gatttgtttg gtatccaggc cgtgcacgct cgcgtaggtg tccagctcgt taaagtacgc 5160
gatacgcatc gccagatacg tgttcgcgaa cagtttgatg gcttctgcct cgggcgaatc 5220
cgtcagcagg atcggaatat cctttttgat ggcaccttcc gacaggagtt cggcgaactt 5280
ccgtgcgcgt tccgacgatt cgcccacgac aatgcggctc ggatagagat tatcatacag 5340
ggctttgcct tcgcgcagga actccgggga aaagatgata ttattcgtgt tcagatcgcg 5400
cttcaggcgt tcggtgaacc cgacggggac ggtggatttg ataatgatgg tcgcgttcgg 5460
gttaatggac agcacgtcac acgcgacgct ttcgacgctc agggtatcaa agttgttatt 5520
aatcggatca tagttcgtcg gggtggcgat gatcacgtag tctgcatcgc gatatgcctc 5580
gtatttttcc gtcgtcgcgt agaggttcag cttacgattg gagagaaact tctggatttc 5640
cgggtcgcaa atcggcgaga ttttcttgtt aatgagctgg accttcttcg ggtcgatgtc 5700
cagggcgatg atgtcgtgtt tttgggagag gaggatcgca atgctgatac ccacatagcc 5760
gacgccggcc acggcaattt tcatttatta acctccttaa gtgaattcaa actagtttac 5820
aagtcgtttt cgatcttctc ccaggtatat ttgcgacatt cattcaagtt ggtcagcggc 5880
gagtatttgt actttttgat accgaggcgc gacaggcttt cgttcaccac cttgaaatgg 5940
ttttcctttt ggatgtccag tttcttgatc gacgtgttct cgccgtgcag gacacggttg 6000
tagcaaatct tattgatatg cttaaacggg ccgacttcgc tgagtttcaa atacatatcg 6060
taatccaccg cattgctgat gctctcgttg aagccttcgg tgaggttcca tgcacgcgcc 6120
gtgaacatac ggaagtggtg gcagatcatc gcgctcgtga gcttttcgcg gctgtaaatc 6180
ggccagttgt agccattgct aatcaagtta ccttcacgat caatattgcg attggtggtg 6240
tacacgcagg cgaggctcag gtctttgcga aattcatcca gacacagttc cacggcatcg 6300
ggctccagga aatcatcgga atccagctgc ccgatgtaga aaccccggca caggcggact 6360
gcggtattcg aggcggagcc gatgcctttg tttttctggc tgatgaaacg gacgcgcggg 6420
tggtttgcgt aatgttcttg caggatgcgc agcgtatcat cggtgctccc gtcatcgcag 6480
atgcagacct ccagatcggt gatcgtttgg ttcagtgccg attcgacgca gcgcacgata 6540
tatttgctgc aattatacgc ggggatgtag atgctcacca ggggcacacg tttcagggtg 6600
gcgctctcga ttttctcctt cttgcgataa aagtagggca ccttctgctg caacagctgg 6660
acggtaatgt ttttacctgc cgcgcgatcg gtttcgttct ccttaccggg cggttcctga 6720
tgatatgcca tcgcgccttc cacgctacgg aaataacaac cctcgcggta cagccgatag 6780
ccgaactcat tatcctcacc gccccaatgc gtgaactctt cgtcaaacca acccgcgcga 6840
aacagccact tctttgcaaa cgccacattg ccaccgctaa agaaccggaa cggggtgttg 6900
cacaggcgca gattgtcggt attcttgaaa tgttcgatgc gccaatcgac ggatttgttc 6960
tgctcgacct tgcctgcgac ctgattattg gtaataatct ccgggatttc attgatcagg 7020
cttttctggg acaaaaagtc cagataggta tgcttcgacg tgtcgatgta tttacgcggg 7080
ccaatcagtg ccacgttatc atccacggcc aggagttcca tataggactg cacccacaac 7140
gggttcggcg ccatatcgca gtccaagatc gccacgtagt tgtatttcgc tgcccgcagg 7200
cccaggttcc gcacggcgca cagctggtag ccgtagtctt tctggcggac gtatttgatg 7260
ttcagcaacg actcgaactc gcggacgatc tcttcgatgt tttccttgga accgtcatcc 7320
gcgacgatga cctcatagtc ataaatcgtt ttctgattgc agaggcaggc cagggtgatc 7380
gccaggattt tggcgcgatt gtacgtcgga atcacgatgg acaggccgtc gatgatcagt 7440
tgcttgcgcg gataatcatc cagttcttta cgtttccctg cccagacgta gtcgttcgtg 7500
ctttccggca gcggcggcaa ggtcaggtcg ctcggccaat ccagcggaat gggttcgact 7560
tctttcaatt cggcgcgctc ggatttcttt gcggtaattt cccgatattt gctaatgatt 7620
tcattctttt ccacctcatt cagcgagatc gcctttgcat tgctgcacat aattttggtt 7680
gccgcgtcga tatcaatgac cgctttccga ttcagcttgt ccacttcttc gctcagattc 7740
agggcggttt ggcacagctt gatattggct tccacccagc tcacatcata gatttccgcc 7800
actttttcaa acagggagag ggcttggcgg tagttcttat tcttatacag attgattgcc 7860
tggttcaaaa tgctcattta ttaacctcct actagtgaat tttcgaatta cttaccgcag 7920
tacttgacac ccacctggga attgtttttg gtgcgtttga attggcggat ggtacggtag 7980
atgctaaagg gcaggctgat cagaccgagc ggaaaattgt tcttattgat gatgagcttg 8040
cccagctgat agctcaggtg tttcttgacc cgttcggctt cgtgtttatc cgcgtacagg 8100
aagatgctcg gcaggctcac ttggtactcc gaatcatatt tcttcttcca ggtccgccat 8160
tcgctgatca acgcaaacgg aatcgagatc agaccgagga acgtcttgga gcggctcacc 8220
atcaccgcac ccaggcggta gccgatatct tgcttgatgc gttcggccgc accatacagc 8280
tccggcagtt gtttcttttc gagacgttga ttgtcgatga agtactgttc gagcttttgc 8340
tgcaccagat gcagctgatt gagcagcaat tctttttcgc acgacagctt ttcgaggcgc 8400
tgttgttgca gttcattttt gttctgttcc tttttcagca gggactcgaa gttctcgatc 8460
gcgcactcca gttcctggac ctggatggtt ttgtttttaa tgatcagatc atactggatc 8520
agttcttcct tgctatccga cagctctttc agaatggctt gataggcgtt cagctgtttg 8580
gacgtgtgca gttcgttgtc cagaatgatc tttttgctgc tctggtacag accgttcacg 8640
atatcgaggg tgatctggcg ttgtttaatg aacgtctccc aaataaagga cggcttatag 8700
ttttccttct ccagcacccg caagggggtg ttggcgttcg attgcaattc aaagtacagt 8760
tccttgcaat cgggatagtc gttcaggacg ttgaagatca agtactcctc cgtctcgctt 8820
tgcttgaaaa tgatatcccc ggtcccgatg tcaataccgc tgagggacat gatctcctga 8880
tgttcttttt ccagcgtaat ggaggcttcg gcggtcttaa agtcattcac gctctgctcc 8940
agcgagtggt tgatggtatt ggagaacgac aacccgaatt tcagtttcag tttgtgttgc 9000
agttgctgga tgcagtcctc ggcgttgcgc ttcacctgtt cgctcgacac cagcaggcac 9060
cgaccccggt tgttgaggaa gaagtgcagc aaggcggtgt tgtatgccag ccagtttttg 9120
atcagatgct ccgaggtata gttgctggag atgttctggt ccgagaagta gttcgtcagg 9180
atgcttttgg ggtggtcgta gatgaggata aaggtgatgt tctcatccac cgatttccaa 9240
tattccaacg tgtgaattgc gttggggtcg ctccaaccgc acagtttctg gttcaggttg 9300
gacagcatca gatccaatgc gataccgttc cagacggtgc tcacatggag cggttcaaag 9360
tcggcggaat cggtcaccgt atagatgtcc ggcgactggt acgccttccg cagcgtctgg 9420
gtgatgtcct ggggcgagag gttctcacgt ttggacgggc acagggagtt catgccgcgc 9480
tgatgcagga gttcttccac gatttggtag ttgctgctcg gatggcccac gatcaccagg 9540
cggttcattt attaacctcc tttcgaaaat gaacggtccg ttaaatatag ccattcggat 9600
tcttcatctg ccagcgccag gcgtcctcca gcatggtttc gagttcccgc ttggctttcc 9660
agttcagata tttgttggcc ttttcggggg aggaccagct ctccgcgata tcaccgtcac 9720
ggcggctcac gatttcatac ggaatccgca cgccggaaat cttttcaaag gtggacacca 9780
gttccagcac cgaataacct ttacccgtgc ccaaattaaa gacgtggtag ttggtgttat 9840
tgtcgcggaa gagataggac agcgctgcga cgtgcccttc ggccaggtcc atcacatgga 9900
tatagtcacg gacccccgtg ccgtctttgg tgggataatc accaccgaac accatcagtt 9960
tttccagttt ccccatcgcg acctgcaaga tgtacggcac caagttggag gggatgtctg 10020
ccgggctttc accaatcata ccggattcgt gggcgcccgt cggattaaag tagcgcaagc 10080
agaggaaatt cgtgtcggag tatttcttgg cgatgtcgcg gatcatcagc tccgagatgt 10140
acttggacgt accatacgga ttcagcgtgc caccaatatg gcagtcttcg gtgacgggca 10200
tgatcttgct ttccccatac accgtcgccg acgagctaaa gatgaagttg gcgacgtcgt 10260
tcttgatggc gcaattgatg agttgcaggg tgccgctcac gttgttgtca tagtagaaga 10320
tgggcttgat caggctttct gcgaccgatt tcgcacctgc aaagtgcatg atgcagtcga 10380
atttgtgttt cttcaggatc tggttcactt ccttctcgtt gttgatattg agttcgtaga 10440
acgtgacttt cttctttgcg atcagctcaa tgcgacggat gctttcgcag ctgctgttga 10500
tgagattgtc aatgatgacg acattgtagc ctttgttcag caggcagagc gacgtgtggc 10560
tgccgatgta gcctgcaccg ccggtgacca ggatgttcat ttattaacct cctcggtccg 10620
aattaaccta ggttatgagg tcagcattgc ttcttcacgc ggtgttaatt aagtaatcga 10680
tagtgattta aatatgcaag atctagttac ctgcaggatt attgtttctg ttgcataaag 10740
cctaaggggt aggcctttct agagatagcc attttttgca ctcctgtatc cgcttcttgc 10800
aaggctggac ttatccctat caaaccggac actgcaggct gacaagcttt cattacatat 10860
gaagagtttg tagaaacgca aaaaggccat ccgtcaggat ggccttctaa gaaggctcga 10920
gtggcgcgcc gcggccgcca agacggtatt cgggctgcac cgtggacatt gccagcgggt 10980
ccggatgcgg cagcgaagac gccatctccg ggccggtgct gcaagcgccc agcgacatcg 11040
agcagagcag agccaggctg aggccttggc agagtcgtcc gatcagtttc ttcatgcgtg 11100
tagctggctg cctctgttgg gtgggacagg acctcgcgca gcattcaacc ggctcaggcg 11160
ccagcacgaa cgtacgacag gaagttgcat cccgacgcgt gccgggacca acgttgaatc 11220
gcgtgttgca gtgcactatg gcatagaacg aacacatcgc aaggcacaac acgccatttt 11280
tttgacggcg ttggcctatt gattcaagtt cgtcgcctcg acgttaagag aacgtgacct 11340
gggtcgtcat tctcagcata cgaactctag cgtttccggg cacttacgga cgcctgctga 11400
tcccgacttg tagcagcctg aaccgcgaaa taattgcgta caggacttgc atatgccgcc 11460
ttgcaatatg ccgttgcgca tagtggcata gcctggaatg ccatcgaact gacatgttgc 11520
gacgcaacaa aaaggcccac gtcttgcgac gtaggcctgt tgtttggtcg gggtagccgg 11580
attcgaaccg acgaccacta gtcccccaga ctagtgcgct accaggctgc gctatacccc 11640
gaagatgttg cgtcccgccc tgaggcggcc tgcgattata gcggctttat gcggcgcttt 11700
cctagcgtcg cagcagctgc aggacttctt caagctccat gcgcacctgc ttgatgatct 11760
gattgctcag cgctgactcg ctcttggccc catccccttc aagacgcaga cgcgcgcccc 11820
cgatggtgta accctgctcg tacagcaggc cacgaatctg ccgcaccatc agcacatcgt 11880
gccgctggta gtagcgtcgg ttgccgcgcc gcttgactgg ctccaggctc ggaaattcgg 11940
tttcccaata gcgcagcacg tgcggcttga cgtcgcacag ctcgctcacc tcaccgatgg 12000
tgaagtagcg cttggccgga atcggcggta gctcgcgatt actgcccgga tccagcataa 12060
gcctccaccc gttccttgag tttctggccg gggcggaagg tcaccaccgt cctggccgag 12120
atcggaattt cctcaccggt cttgggattg cgaccgggcc gttggttctt gcgccgcaga 12180
tcgaagttgc cgaagcccga caacttcacc tgacggccct gctccagtgc atcgcgcagc 12240
acatcgaaaa acgcgtcgac gaattccttc gcctcacgct tgttcaggcc gacttcgtcg 12300
aacagacgct cggccatctc cgctttcgtc aatgccatgc caatcccctg ttaccgccag 12360
atctgaattc agctgtacaa ttggtaccat ggatgcatat ggcggccggg ccctacgtac 12420
gcgtgttaac cggtgagctc actagaggat ccagccgacc aggctttcca cgcccgcgtg 12480
ccgctccatg tcgttcgcgc ggttctcgga aacgcgctgc cgcgtttcgt gattgtcacg 12540
ctcaagcccg tagtcccgtt cgagcgtcgc gcagaggtca gcgagggcgc ggtaggcccg 12600
atacggctca tggatggtgt ttcgggtcgg gtgaatcttg ttgatggcga tatggatgtg 12660
caggttgtcg gtgtcgtgat gcacggcact gacgcgctga tgctcggcga agccaagccc 12720
agcgcagatg cggtcctcaa tcgcgcgcaa cgtctccgcg tcgggcttct ctcccgcgcg 12780
gaagctaacc agcaggtgat aggtcttgtc ggcctcggaa cgggtgttgc cgtgctgggt 12840
cgccatcacc tcggccatga cagcgggcag ggtgtttgcc tcgcagttcg tgacgcgcac 12900
gtgacccagg cgctcggtct tgccttgctc gtcggtgatg tacttcacca gctccgcgaa 12960
gtcgctcttc ttgatggagc gcatggggac gtgcttggca atcacgcgca ccccccggcc 13020
gttttagcgg ctaaaaaagt catggctctg ccctcgggcg gaccacgccc atcatgacct 13080
tgccaagctc gtcctgcttc tcttcgatct tcgccagcag ggcgaggatc gtggcatcac 13140
cgaaccgcgc cgtgcgcggg tcgtcggtga gccagagttt cagcaggccg cccaggcggc 13200
ccaggtcgcc attgatgcgg gccagctcgc ggacgtgctc atagtccacg acgcccgtga 13260
ttttgtagcc ctggccgacg gccagcaggt aggccgacag gctcatgccg gccgccgccg 13320
ccttttcctc aatcgctctt cgttcgtctg gaaggcagta caccttgata ggtgggctgc 13380
ccttcctggt tggcttggtt tcatcagcca tccgcttgcc ctcatctgtt acgccggcgg 13440
tagccggcca gcctcgcaga gcaggattcc cgttgagcac cgccaggtgc gaataaggga 13500
cagtgaagaa ggaacacccg ctcgcgggtg ggcctacttc acctatcctg cccggctgac 13560
gccgttggat acaccaagga aagtctacac gaaccctttg gcaaaatcct gtatatcgtg 13620
cgaaaaagga tggatatacc gaaaaaatcg ctataatgac cccgaagcag ggttatgcag 13680
cggaaaagcg ctgcttccct gctgttttgt ggaatatcta ccgactggaa acaggcaaat 13740
gcaggaaatt actgaactga ggggacaggc gagagacgat gccaaagagc tacaccgacg 13800
agctggccga gtgggttgaa tcccgcgcgg ccaagaagcg ccggcgtgat gaggctgcgg 13860
ttgcgttcct ggcggtgagg gcggatgtcg aggcggcgtt agcgtccggc tatgcgctcg 13920
tcaccatttg ggagcacatg cgggaaacgg ggaaggtcaa gttctcctac gagacgttcc 13980
gctcgcacgc caggcggcac atcaaggcca agcccgccga tgtgcccgca ccgcaggcca 14040
aggctgcgga acccgcgccg gcacccaaga cgccggagcc acggcggccg aagcaggggg 14100
gcaaggctga aaagccggcc cccgctgcgg ccccgaccgg cttcaccttc aacccaacac 14160
cggacaaaaa ggatccccaa ttctcatgtt tgacagctta tcatcgataa gctttaatgc 14220
ggtagtttat cacagttaaa ttgctaacgc agtcaggcac cgtgtatgaa atctaacaat 14280
gcgctcatcg tcatcctcgg caccgtcacc ctggatgctg taggcatagg cttggttatg 14340
ccggtactgc cgggcctctt gcgggatatc gtccattccg acagcatcgc cagtcactat 14400
ggcgtgctgc tagcgctata tgcgttgatg caatttctat gcgcacccgt tctcggagca 14460
ctgtccgacc gctttggccg ccgcccagtc ctgctcgctt cgctacttgg agccactatc 14520
gactacgcga tcatggcgac cacacccgtc ctgtggatcc tctacgccgg acgcatcgtg 14580
gccggcatca ccggcgccac aggtgcggtt gctggcgcct atatcgccga catcaccgat 14640
ggggaagatc gggctcgcca cttcgggctc atgagcgctt gtttcggcgt gggtatggtg 14700
gcaggccccg tggccggggg actgttgggc gccatctcct tgcatgcacc attccttgcg 14760
gcggcggtgc tcaacggcct caacctacta ctgggctgct tcctaatgca ggagtcgcat 14820
aagggagagc gtcgaccgat gcccttgaga gccttcaacc cagtcagctc cttccggtgg 14880
gcgcggggca tgactatcgt cgccgcactt atgactgtct tctttatcat gcaactcgta 14940
ggacaggtgc cggcagcgct ctgggtcatt ttcggcgagg accgctttcg ctggagcgcg 15000
acgatgatcg gcctgtcgct tgcggtattc ggaatcttgc acgccctcgc tcaagccttc 15060
gtcactggtc ccgccaccaa acgtttcggc gagaagcagg ccattatcgc cggcatggcg 15120
gccgacgcgc tgggctacgt cttgctggcg ttcgcgacgc gaggctggat ggccttcccc 15180
attatgattc ttctcgcttc cggcggcatc gggatgcccg cgttgcaggc catgctgtcc 15240
aggcaggtag atgacgacca tcagggacag cttcaaggat cgctcgcggc tcttaccagc 15300
ctaacttcga tcactggacc gctgatcgtc acggcgattt atgccgcctc ggcgagcaca 15360
tggaacgggt tggcatggat tgtaggcgcc gccctatacc ttgtctgcct ccccgcgttg 15420
cgtcgcggtg catggagccg ggccacctcg acctgaatgg aagccggcgg cacctcgcta 15480
acggattcac cactccaaga attggagcca atcaattctt gcggagaact gtgaatgcgc 15540
aaaccaaccc ttggcagaac atatccatcg cgtccgccat ctccagcagc cgcacgcggc 15600
gcatctcggg cagcgttggg tcctggccac gggtgcgcat gatcgtgctc ctgtcgttga 15660
ggacccggct aggctggcgg ggttgcctta ctggttagca gaatgaatca ccgatacgcg 15720
agcgaacgtg aagcgactgc tgctgcaaaa cgtctgcgac ctgagcaaca acatgaatgg 15780
tcttcggttt ccgtgtttcg taaagtctgg aaacgcggaa gtcagcgctc ttccgcttcc 15840
tcgctcactg actcgctgcg ctcggtcgtt cggctgcggc gagcggtatc agctcactca 15900
aaggcggtaa tacggttatc cacagaatca ggggataacg caggaaagaa catgtgagca 15960
aaaggccagc aaaaggccag gaaccgtaaa aaggccgcgt tgctggcgtt tttccatagg 16020
ctccgccccc ctgacgagca tcacaaaaat cgacgctcaa gtcagaggtg gcgaaacccg 16080
acaggactat aaagatacca ggcgtttccc cctggaagct ccctcgtgcg ctctcctgtt 16140
ccgaccctgc cgcttaccgg atacctgtcc gcctttctcc cttcgggaag cgtggcgctt 16200
tctcatagct cacgctgtag gtatctcagt tcggtgtagg tcgttcgctc caagctgggc 16260
tgtgtgcacg aaccccccgt tcagcccgac cgctgcgcct tatccggtaa ctatcgtctt 16320
gagtccaacc cggtaagaca cgacttatcg ccactggcag cagccactgg taacaggatt 16380
agcagagcga ggtatgtagg cggtgctaca gagttcttga agtggtggcc taactacggc 16440
tacactagaa ggacagtatt tggtatctgc gctctgctga agccagttac cttcggaaaa 16500
agagttggta gctcttgatc cggcaaacaa accaccgctg gtagcggtgg tttttttgtt 16560
tgcaagcagc agattacgcg cagaaaaaaa ggatctcaag aagatccttt gatcttttct 16620
acggggtctg acgctcagtg gaacgaaaac tcacgttaag ggattttggt catgagatta 16680
tcaaaaagga tcttcaccta gatcctttta aattaaaaat gaagttttaa atcaatctaa 16740
agtatatatg agtaaacttg gtctgacag 16769
<210> 147
<211> 26002
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic plasmid pKM012
<400> 147
ttaccaatgc ttaatcagtg aggcacctat ctcagcgatc tgtctatttc gttcatccat 60
agttgcctga ctccccgtcg tgtagataac tacgatacgg gagggcttac catctggccc 120
cagtgctgca atgataccgc gagacccacg ctcaccggct ccagatttat cagcaataaa 180
ccagccagcc ggaagggccg agcgcagaag tggtcctgca actttatccg cctccatcca 240
gtctattaat tgttgccggg aagctagagt aagtagttcg ccagttaata gtttgcgcaa 300
cgttgttgcc attgctacag gcatcgtggt gtcacgctcg tcgtttggta tggcttcatt 360
cagctccggt tcccaacgat caaggcgagt tacatgatcc cccatgttgt gcaaaaaagc 420
ggttagctcc ttcggtcctc cgatcgttgt cagaagtaag ttggccgcag tgttatcact 480
catggttatg gcagcactgc ataattctct tactgtcatg ccatccgtaa gatgcttttc 540
tgtgactggt gagtactcaa ccaagtcatt ctgagaatag tgtatgcggc gaccgagttg 600
ctcttgcccg gcgtcaatac gggataatac cgcgccacat agcagaactt taaaagtgct 660
catcattgga aaacgttctt cggggcgaaa actctcaagg atcttaccgc tgttgagatc 720
cagttcgatg taacccactc gtgcacccaa ctgatcttca gcatctttta ctttcaccag 780
cgtttctggg tgagcaaaaa caggaaggca aaatgccgca aaaaagggaa taagggcgac 840
acggaaatgt tgaatactca tactcttcct ttttcaatat tattgaagca tttatcaggg 900
ttattgtctc atgagcggat acatatttga atgtatttag aaaaataaac aaataggggt 960
tccgcgcaca tttccccgaa aagtgccacc tgacgtctag atctcctacc gaccaggcat 1020
tggcgcgttc caccatcgtc ggcaaatcgc gttcgacagt caccagaatg ctgcgaaagc 1080
acgcagtgtc gtccataccg cccgcacgga aatccttgat cgcctgccgc gggttgtcga 1140
tcttgtattc gagcgtggtc gaggtcggct tgataccggc gcgcttggca gcgcgctcca 1200
ccaccgacca gatcaccggc gagcgggcca ggccagagcg tttgagcgca gcctgataca 1260
actcgccggc agccagcatc ggccgcttgc gctccacgcc acggtcgcgc cccatgtaac 1320
gcgccttggc aacggtccag cgcgcataca actcaggcgg cagcacatcg cgcagctcac 1380
gcccgtcttc gttcttcatc gccttcatcg ccgcgggcat cagggccaat ttgccgaaca 1440
tgccaacgtc ggcatccacc tgcaccatcg gcgccatcag cacctgctgc gattggccga 1500
tgatggtttc gacctcggtc gcttgccact ccaggtcctt cggcaacggt gacaacgtgc 1560
ccaggatcca cagcacgtgg tcgcccttgc tgaccttcca caggccgggg ccgggttgct 1620
gcccgcgcac caccatggct tccagatcga ccaccgttgg cggcgctgcc ggcgcctgta 1680
cggccacctc gacggcacac gccagcatcg gtgccaacaa cgacaccaac gcgattcctg 1740
cccgccacac cgcccccctg cgctgcatca cgtaccgcct cccggttgga acgcggacac 1800
tacgcgaacg cgggcccgca cgcgttaggg aagcgttggc ggctccggcg cggcgccttc 1860
ggcaaccaac gcggccagct gtgccgccag cggcgagccg tcttcgagca gcgcgaaacc 1920
ttcccagaca aaccctggcg aaaccgtgca gcccaccagg gtgaagtccc ccagcgagcg 1980
cgccgcctgc cagcagccgg ccggcaccac gtgcatggcg tcgccgcgct ctgcggcgtc 2040
cagcacttcg cgccgcaact gcccgctcgc ttcgtcgaag atcagcaact ccagcggcgc 2100
accttgctgc cagtgccagc actcctcggc atccacccga tgccagcgac tggcttcgcc 2160
tgcgcacaac aggaagcgga tggcggtcag cgccggacgc ggcggcgcac cgctgtcatc 2220
cagcacctgg cgcgtcgacg cgtacacgcg ccggtagtgg ccgccctccg gatggggggc 2280
aaggcccaat gttcgaatca gcgcggcggc ggttggatgc atgcacgcat gctaggccac 2340
acaccgccgc cgtgcatcac gccagctgtt tgcccgcacg caggcaggtg cggaagaaca 2400
ccagcagatc gcggccgcct cgacgctctc ccttatgcga ctcctgcatt aggaagcagc 2460
ccagtagtag gttgaggccg ttgagcaccg ccgccgcaag gaatggtgca tgcaaggaga 2520
tggcgcccaa cagtcccccg gccacggggc ctgccaccat acccacgccg aaacaagcgc 2580
tcatgagccc gaagtggcga gcccgatctt ccccatcggt gatgtcggcg atataggcgc 2640
cagcaaccgc acctgtggcg ccggtgatgc cggccacgat gcgtccggcg tacaagatcc 2700
acaggacggg tgtggtcgcc atgatcgcgt agtcgatagt ggctccaagt agcgaagcga 2760
gcaggactgg gcggcggcca aagcggtcgg acagtgctcc gagaacgggt gcgcatagaa 2820
attgcatcaa cgcatatagc gctagcagca cgccatagtg actggcgatg ctgtcggaat 2880
ggacgatatc ccgcaagagg cccggcagta ccggcataac caagcctatg cctacagcat 2940
ccagggtgac ggtgccgagg atgacgatga gcgcattgtt agatttcata cacggtgcct 3000
gactgcgtta gcaatttaac tgtgataaac taccgcatta aagccgagcg atgataagct 3060
gtcaaacatg agatccgata aatcgattga tagatttaaa taagaactgc agaagctagc 3120
ttagatgctc gtgaaattga cgtgggcgct ttgcagggcc gtcttaatgg cgttggtgtc 3180
cacgaggatc gagtcgggtg cggaaaacgg acggttcttg ttggtgaaat cgctgttacc 3240
aatgtacagc gattccttgt tacgcagcgc ctggatgtgc cagcgggacc acgaatccca 3300
atacttctgg cgatccggcg agataccttg gctggtgtag ccggtcgtcg ggctgttcat 3360
caacgagtcg gtgcggtgcg agcccagcgt cagcggcaac ttgatccgat gcaccgtgga 3420
atcgccgaag atcagcttca gacgcgcgat aaattcgcta tccgcacccg ttttcacaca 3480
atcccagaca ccggccttct gcaagacgtc ggcacggcga aacaggagcg acgacggatt 3540
cagacgcttc aaggggtaca ctgcgcgggc atagaaaata ccgttgtctt gcaggcgcac 3600
ccagtccgag atggagcaga tgagcttcgg attgagcaac aagggggaga tttggcggaa 3660
cagcttttcc ggatggctcc agtcatccga atcgtggcag gtgacgaact cgcccttcgc 3720
ttggatcaag ccgatacgct tcgcggcata ggtgccgaca ttctgcggca ggctaatgat 3780
cttgatgcgc gtgtctttga gggcgagccg ctggagacga aacagggtgt catcggtgct 3840
cgcgtcatcc acaatgatca gctcgaagga acggtaggtc tgattgagga gcgaaatcac 3900
cgcattttcc acgcggcgac ccgtattata ggtggtcatc aggatggaga tcaacggccc 3960
cgtctgggcc gggtacggga tgctggtgat gatgttgcac ggggagagcg gggagctgtt 4020
gtccgtcaag gccacggggc tgaggccgaa gtatttatag tattcattca gccgattcag 4080
gctaatttcg gcggtttcgc ggaaggcgtt attttgcagc agcaggatat ccgggctata 4140
gacgatatcg gatgcgtcga tctgggcgag ggtcgagatg gccttttggg tcaggccgat 4200
ccggagttgc agtgcggtat acaggtccag cgggcagttg tccacgttgt ccaacaggct 4260
caggctaaag gtcggcgagt aggacgccag ggttttcgcc agttccactt tctgatgggt 4320
atcggtgaac tcgtccttga actccatcag cagctcgggc gtcaggctga tgtcgccgca 4380
ggcgattttt gcgatcttga ttgccagttt gcagcgccaa tcggacgggg tatccgtcaa 4440
gttatgcagc gaccagtaca tattcagacg atacatcgcg aggatgcgtt tcgactgcca 4500
gaaccggcaa tcatcctgga tggccgcgag cgcgtggacg tagcggctct ttttgagcag 4560
ccacaagaat ttgagattat tgaacattta ttaacctcct gctagcaact taagttacga 4620
atcgacgccg aacaggtcgc gggtgtagac tttctccgag acatcttcca gttcgctggt 4680
gcggcgattc gccacaatga catcgacgcg ctccttaaag gaattgatgt cgcgctcgac 4740
gtaggaaccg aagaagtagg gttctttcag gaccggctcg tacaccacaa tctcgatacc 4800
cttggccttc aaacgtttca tgaccccctg gatgctgctg gcccggaaat tgtcgctacc 4860
cgccttcatg atcaggcgat agataccgac cactttgggc ttacgggaca ggatgtcctc 4920
ggccacgaag tccttacggg tcgtattcgc atccacgatg gcctggatca ggttttgcgg 4980
gacgtcgcga taattggcca acagctgctt cgtatccttc ggcagacagt aaccgccgta 5040
gccgaaggac gggttgttgt aatgttgacc aatgcgcgga tcgagggaga cgccttcgat 5100
gatttgtttg gtatccaggc cgtgcacgct cgcgtaggtg tccagctcgt taaagtacgc 5160
gatacgcatc gccagatacg tgttcgcgaa cagtttgatg gcttctgcct cgggcgaatc 5220
cgtcagcagg atcggaatat cctttttgat ggcaccttcc gacaggagtt cggcgaactt 5280
ccgtgcgcgt tccgacgatt cgcccacgac aatgcggctc ggatagagat tatcatacag 5340
ggctttgcct tcgcgcagga actccgggga aaagatgata ttattcgtgt tcagatcgcg 5400
cttcaggcgt tcggtgaacc cgacggggac ggtggatttg ataatgatgg tcgcgttcgg 5460
gttaatggac agcacgtcac acgcgacgct ttcgacgctc agggtatcaa agttgttatt 5520
aatcggatca tagttcgtcg gggtggcgat gatcacgtag tctgcatcgc gatatgcctc 5580
gtatttttcc gtcgtcgcgt agaggttcag cttacgattg gagagaaact tctggatttc 5640
cgggtcgcaa atcggcgaga ttttcttgtt aatgagctgg accttcttcg ggtcgatgtc 5700
cagggcgatg atgtcgtgtt tttgggagag gaggatcgca atgctgatac ccacatagcc 5760
gacgccggcc acggcaattt tcatttatta acctccttaa gtgaattcaa actagtttac 5820
aagtcgtttt cgatcttctc ccaggtatat ttgcgacatt cattcaagtt ggtcagcggc 5880
gagtatttgt actttttgat accgaggcgc gacaggcttt cgttcaccac cttgaaatgg 5940
ttttcctttt ggatgtccag tttcttgatc gacgtgttct cgccgtgcag gacacggttg 6000
tagcaaatct tattgatatg cttaaacggg ccgacttcgc tgagtttcaa atacatatcg 6060
taatccaccg cattgctgat gctctcgttg aagccttcgg tgaggttcca tgcacgcgcc 6120
gtgaacatac ggaagtggtg gcagatcatc gcgctcgtga gcttttcgcg gctgtaaatc 6180
ggccagttgt agccattgct aatcaagtta ccttcacgat caatattgcg attggtggtg 6240
tacacgcagg cgaggctcag gtctttgcga aattcatcca gacacagttc cacggcatcg 6300
ggctccagga aatcatcgga atccagctgc ccgatgtaga aaccccggca caggcggact 6360
gcggtattcg aggcggagcc gatgcctttg tttttctggc tgatgaaacg gacgcgcggg 6420
tggtttgcgt aatgttcttg caggatgcgc agcgtatcat cggtgctccc gtcatcgcag 6480
atgcagacct ccagatcggt gatcgtttgg ttcagtgccg attcgacgca gcgcacgata 6540
tatttgctgc aattatacgc ggggatgtag atgctcacca ggggcacacg tttcagggtg 6600
gcgctctcga ttttctcctt cttgcgataa aagtagggca ccttctgctg caacagctgg 6660
acggtaatgt ttttacctgc cgcgcgatcg gtttcgttct ccttaccggg cggttcctga 6720
tgatatgcca tcgcgccttc cacgctacgg aaataacaac cctcgcggta cagccgatag 6780
ccgaactcat tatcctcacc gccccaatgc gtgaactctt cgtcaaacca acccgcgcga 6840
aacagccact tctttgcaaa cgccacattg ccaccgctaa agaaccggaa cggggtgttg 6900
cacaggcgca gattgtcggt attcttgaaa tgttcgatgc gccaatcgac ggatttgttc 6960
tgctcgacct tgcctgcgac ctgattattg gtaataatct ccgggatttc attgatcagg 7020
cttttctggg acaaaaagtc cagataggta tgcttcgacg tgtcgatgta tttacgcggg 7080
ccaatcagtg ccacgttatc atccacggcc aggagttcca tataggactg cacccacaac 7140
gggttcggcg ccatatcgca gtccaagatc gccacgtagt tgtatttcgc tgcccgcagg 7200
cccaggttcc gcacggcgca cagctggtag ccgtagtctt tctggcggac gtatttgatg 7260
ttcagcaacg actcgaactc gcggacgatc tcttcgatgt tttccttgga accgtcatcc 7320
gcgacgatga cctcatagtc ataaatcgtt ttctgattgc agaggcaggc cagggtgatc 7380
gccaggattt tggcgcgatt gtacgtcgga atcacgatgg acaggccgtc gatgatcagt 7440
tgcttgcgcg gataatcatc cagttcttta cgtttccctg cccagacgta gtcgttcgtg 7500
ctttccggca gcggcggcaa ggtcaggtcg ctcggccaat ccagcggaat gggttcgact 7560
tctttcaatt cggcgcgctc ggatttcttt gcggtaattt cccgatattt gctaatgatt 7620
tcattctttt ccacctcatt cagcgagatc gcctttgcat tgctgcacat aattttggtt 7680
gccgcgtcga tatcaatgac cgctttccga ttcagcttgt ccacttcttc gctcagattc 7740
agggcggttt ggcacagctt gatattggct tccacccagc tcacatcata gatttccgcc 7800
actttttcaa acagggagag ggcttggcgg tagttcttat tcttatacag attgattgcc 7860
tggttcaaaa tgctcattta ttaacctcct actagtgaat tttcgaatta cttaccgcag 7920
tacttgacac ccacctggga attgtttttg gtgcgtttga attggcggat ggtacggtag 7980
atgctaaagg gcaggctgat cagaccgagc ggaaaattgt tcttattgat gatgagcttg 8040
cccagctgat agctcaggtg tttcttgacc cgttcggctt cgtgtttatc cgcgtacagg 8100
aagatgctcg gcaggctcac ttggtactcc gaatcatatt tcttcttcca ggtccgccat 8160
tcgctgatca acgcaaacgg aatcgagatc agaccgagga acgtcttgga gcggctcacc 8220
atcaccgcac ccaggcggta gccgatatct tgcttgatgc gttcggccgc accatacagc 8280
tccggcagtt gtttcttttc gagacgttga ttgtcgatga agtactgttc gagcttttgc 8340
tgcaccagat gcagctgatt gagcagcaat tctttttcgc acgacagctt ttcgaggcgc 8400
tgttgttgca gttcattttt gttctgttcc tttttcagca gggactcgaa gttctcgatc 8460
gcgcactcca gttcctggac ctggatggtt ttgtttttaa tgatcagatc atactggatc 8520
agttcttcct tgctatccga cagctctttc agaatggctt gataggcgtt cagctgtttg 8580
gacgtgtgca gttcgttgtc cagaatgatc tttttgctgc tctggtacag accgttcacg 8640
atatcgaggg tgatctggcg ttgtttaatg aacgtctccc aaataaagga cggcttatag 8700
ttttccttct ccagcacccg caagggggtg ttggcgttcg attgcaattc aaagtacagt 8760
tccttgcaat cgggatagtc gttcaggacg ttgaagatca agtactcctc cgtctcgctt 8820
tgcttgaaaa tgatatcccc ggtcccgatg tcaataccgc tgagggacat gatctcctga 8880
tgttcttttt ccagcgtaat ggaggcttcg gcggtcttaa agtcattcac gctctgctcc 8940
agcgagtggt tgatggtatt ggagaacgac aacccgaatt tcagtttcag tttgtgttgc 9000
agttgctgga tgcagtcctc ggcgttgcgc ttcacctgtt cgctcgacac cagcaggcac 9060
cgaccccggt tgttgaggaa gaagtgcagc aaggcggtgt tgtatgccag ccagtttttg 9120
atcagatgct ccgaggtata gttgctggag atgttctggt ccgagaagta gttcgtcagg 9180
atgcttttgg ggtggtcgta gatgaggata aaggtgatgt tctcatccac cgatttccaa 9240
tattccaacg tgtgaattgc gttggggtcg ctccaaccgc acagtttctg gttcaggttg 9300
gacagcatca gatccaatgc gataccgttc cagacggtgc tcacatggag cggttcaaag 9360
tcggcggaat cggtcaccgt atagatgtcc ggcgactggt acgccttccg cagcgtctgg 9420
gtgatgtcct ggggcgagag gttctcacgt ttggacgggc acagggagtt catgccgcgc 9480
tgatgcagga gttcttccac gatttggtag ttgctgctcg gatggcccac gatcaccagg 9540
cggttcattt attaacctcc tttcgaaaat gaacggtccg ttaaatatag ccattcggat 9600
tcttcatctg ccagcgccag gcgtcctcca gcatggtttc gagttcccgc ttggctttcc 9660
agttcagata tttgttggcc ttttcggggg aggaccagct ctccgcgata tcaccgtcac 9720
ggcggctcac gatttcatac ggaatccgca cgccggaaat cttttcaaag gtggacacca 9780
gttccagcac cgaataacct ttacccgtgc ccaaattaaa gacgtggtag ttggtgttat 9840
tgtcgcggaa gagataggac agcgctgcga cgtgcccttc ggccaggtcc atcacatgga 9900
tatagtcacg gacccccgtg ccgtctttgg tgggataatc accaccgaac accatcagtt 9960
tttccagttt ccccatcgcg acctgcaaga tgtacggcac caagttggag gggatgtctg 10020
ccgggctttc accaatcata ccggattcgt gggcgcccgt cggattaaag tagcgcaagc 10080
agaggaaatt cgtgtcggag tatttcttgg cgatgtcgcg gatcatcagc tccgagatgt 10140
acttggacgt accatacgga ttcagcgtgc caccaatatg gcagtcttcg gtgacgggca 10200
tgatcttgct ttccccatac accgtcgccg acgagctaaa gatgaagttg gcgacgtcgt 10260
tcttgatggc gcaattgatg agttgcaggg tgccgctcac gttgttgtca tagtagaaga 10320
tgggcttgat caggctttct gcgaccgatt tcgcacctgc aaagtgcatg atgcagtcga 10380
atttgtgttt cttcaggatc tggttcactt ccttctcgtt gttgatattg agttcgtaga 10440
acgtgacttt cttctttgcg atcagctcaa tgcgacggat gctttcgcag ctgctgttga 10500
tgagattgtc aatgatgacg acattgtagc ctttgttcag caggcagagc gacgtgtggc 10560
tgccgatgta gcctgcaccg ccggtgacca ggatgttcat ttattaacct cctcggtccg 10620
aattaaccta ggttatgagg tcagcattgc ttcttcacgc gtttagtagt tgttttgttc 10680
ggtgatatat tcttcaatgc cttcttgcac gtcttcatgg aacgacacgg cgttgtcgtc 10740
tttaaacacg attgccacat cgcagaactc tttcaacgag ttcagcgagt gcgacaccat 10800
gaggaaggag ctttccttat gacgctcctt gaagagttgg gcacattttt ccttgaaacg 10860
ggcgtccccc accgccgtca cctcgtccac gatgtagtaa tcgaacttga acgccatgct 10920
caggccgaag ccgaggcggc tgcgcatacc gctcgaatag gtcttgatcg gcatatcaaa 10980
atacttcccc agctccgcga actcttccac aaactcaatc ttttctttca gctcctcctg 11040
cttcgcgtac agccgggcca cgaacttcac gttttcacgc ccggtcaagc tgccctggaa 11100
gccgcctgcc agacccaccg gccacgagat cgttttattc gtgatgattt taccgctatc 11160
cgggcggtcg atgcccccaa tcatgcgcaa cagcgtggat ttacccgccc cattgcgccc 11220
gatgaacgcc acgcttttgc cgctggggat ctcaatgttc aggttcttga agacatagtg 11280
acggcccacc ggggtgcggt agcttttcgt caggttttcg atcttaatca tgaggtcaac 11340
attgcctcct cacgcgtacg gtacagggcc aaaccaataa acagggtcac cagggtgaac 11400
attgccagat aattcaggct gaccccttcg ctgatataac cgggcatcac ggcctcgcgg 11460
ctcagttcga cgacgtgcac caggggattc cacagcaggt acgaccaata ctgcttcgga 11520
atggagtgca gcgggaacat gatgcacgaa ataaagtaca gcggcttcag caagatcggc 11580
aagactttct gcatttcggg gaacgtcttg cccacgacca tgaagatcag gcccacaccg 11640
cacgacagga tgatcaggag gctccaggtg agcacaaatt gcaggaagtt ggtaatctcg 11700
aaatattcgc ccgccatcca gatgatcagc atcaggagga tgtagaccgc cacatagatc 11760
agcgtttcca agagggcgcg tgcaatgatc gtgtcgatcg gcttcacggg ccggtagtta 11820
aacagcccct gattggcttc gatggcgccc acggagcgat tgctgatgct gctgaaaata 11880
aagaacggga tcaggccatt gagcaggaac accgggaagg agatatccgg catggtgcga 11940
tgcatgatat agccaaagat cccgagcaga atcagcagat gtgcgctcgg ttccaggatc 12000
gcccacagat agcccaggcg aaacttgcca aagcgcgtac ggatttcgcg gagaaacagt 12060
gcttcgaccg tcactttctg gacttcaaaa cccgaacgtg ccatttatta acctcctggt 12120
accaatctag attgtttaaa cagatccaat ctagattgtt taaacttctg cagaacacgc 12180
ggtgttaacg tttcttatac ttcttaattt tgttaaagat catttcgccg tagtacaccg 12240
cattgacctg ggtcttcacc agcaagtagc cgcgaaattt cttaaacaac ttcatgttcg 12300
gtttaaagtc ggcttgccag aactgatgca aatgcccctg gtacgtcaga cccttgatat 12360
cgtacaaggc gttgcccatg actttcaggg gcttgttgtg gatcaacgcg gaaatgccgg 12420
ccgtgctatt gatggtgacc accgctttgg cgtggcgcaa cagctccggc atgggcagat 12480
cgtgcacata gatgacacgt tcatccaaac cgtattcctt cgacagacgc ttgatcaacg 12540
ggcggtacag gcggtgcccg cgatccatcg ggtgatgttt gatcaccaga taggactcct 12600
tgggggcctt gcgggaaaag ctgtacatca cttcgttgat gtaatcacgc acatcattat 12660
agttgctatg gttgcggatc tggctgtcgt tgtacacttg caggaccgcc aggtaatagc 12720
gctgatccag ctcgttcatc aggcggggga ggaccttgcg ttgggtgacc ttatacagct 12780
gtttgcgcca gtaggcgcgg acccagcagc gcgcttcata ccacgggctg aacgatttgt 12840
ggtggcgata gcgcggaaat tcgtgacgat agtgccaacc catcaggtaa taccacatgg 12900
cgtggccgat gcgcttcatg gtgctcggtt tcaggttctc gacgtgcggc gtcggcatat 12960
cgggcaattt gcggtaaaag tccggatcgc ggggcaagct gctataggcg ttcacaccgc 13020
cttcttccac ggtgataaat tgcggacgca ggtagccttc ctcgaaggcc agaaaacgaa 13080
tccccttcga cttggcccag cgtttggcct ccttgtgcag caggcggcag tcaccgaaac 13140
acaaaatcgt gtcaaagtca tactgacgat gcaagtcccg cagccaaccg gggaactcct 13200
tcggggtttg gtagtacgcc aggtattggc ggtggcggca gtagaagcga tcaccgccat 13260
taaagacgac gttgaccgcg ttgcgaccga ggctctccaa ccattccgcc acatcgttga 13320
agaacggacc catcggacct tggagcagga ggtacttttt accgctcaac agcaccgtca 13380
gcgcattgcc gtgcatttat taacctccta acacgcggtg ttaagcgttt tcggcgagct 13440
cttaaccaaa gcgcactttg cagaacatga tcaacttgcg atagtagcga atcacacggc 13500
cggctttctt gcgggtgata aagatgggtt tgcggggcgt tttgatcaga tattctgccg 13560
cttcctccac cgtgatcggc tgcaaccgcg tcggatgaat ataggtggga tagacaatca 13620
gggcttgata gatcaggtcg gcgatggtca gccgccgctc gcgacggggg cagtggtgct 13680
catcgacggt caggccccac gaggcgtaga acggcaggcc gtagcagtgc acctgtttac 13740
cgtgcagcaa tgcttcaaag ccgctgaggc tcgtcatcgt gtgcacctcg tccgcacgct 13800
gaatacactg aatgatatcg gcatccagtg cctggtagtc tgcgagttcc gcgatctgtt 13860
ccgccggaat gtcaccctta cggttgccga cgagcacatc ggggtgcggc ttgtagatga 13920
tgtaggcgtg cggattacgt tcccgcacgg tgcgcagcag ctccagattc gacttgatcg 13980
acacggtgcc cgtcttaatc gacgcatcgt cttccacctg gcccggcacc aggatgactt 14040
tcttgtcctt cgcttctgcc gggaggctga aatcggcccc caggttatat ttgctcaatt 14100
tgctttccac cagacgttgg cgcaactttt ccgcgcgcat ctggtgcgcg agggtcagct 14160
ggctgtgatt cagcaggacc tccagttccg acggacgggt ggcatcgtaa tagataccgc 14220
gcttatccag gaccaggctc aacggcggca gcagatcgct ccccaggccg gagctgcgca 14280
ggaagccgtc ttccatgcgc cacagcggca gggatttgcg ctgtgcctcc gcacgccatt 14340
gctgttcgcc tttcacgccc cacacgacgc aggcgcttgc tgcggtacag cgacgggaaa 14400
aggagagacg attcgtggcc gtttgcagga agggcttcag gatcgcgctt ttccacaggg 14460
tcaggcccgg cacccagaga taaccattcc gctgttgcag gtgacgacgt tgcagctgga 14520
gccattggag caccgtgaac agggccgaca cctccccggt ctgcggatca atgtagcggc 14580
aatagcgcag ataggccgct gcgaacagtt cctccagggt ggccgagccg cgacgcgccg 14640
acagcagcgc cgattggggg tggcggtcat cggtgaggcc ccaccctgca taccagggtt 14700
ggccaaagca ggtcacgggc ttaccggcca gcagggcttc aaaaccgtac tgggaggtca 14760
cgacgtacac gcgggacaca tgacgcagca gggactgcgg cgacacgttt tccgcaatca 14820
ggcgcacgcg ctgggtggca cgcaagtccg cgaagtagcc ggtctttttc ccttccagga 14880
catcgggatg cactttgacc cagatttctg cctgcgggtt ttccgccatc gctgcttcca 14940
gcattgcggc gaactcatgg gggcctgcgt tgccgtaggt cacgctcatg tcattgaagg 15000
tctggtccac caccagcacg atgttcgtgc gctcgctttc atccgccacg aacgccggtg 15060
ccaggttgta cttgctcatg tcgcccgtca caatggtgtg catcgcctcg cgcgcctgat 15120
ccgccagggc cgcgttgccg gccttgtcct gcacgagttt ttccagcgcg ctcggtttcg 15180
aggcgtcgta gtaaatgccg cagtcatcca cgacgagcga gaggggcggt tcaccgttca 15240
cgcccaggtc cagcgagcgg acgaaaccat cctccaagcg gatcaccggc ttgcctgcgg 15300
ctttggcgat ggccaccggc tttgcggccg aggggcggtg cccccacacc gcgattgcat 15360
ccacttcctg cgggaccggg cgcagcagcg acagcttttg gcagggctgg gcgaggaatt 15420
tttccaggtg cggaatacgc caaatgccgg ggctataaat gccaatcatg cgttctccgc 15480
gagctcctgc gccatcaggg cccggacctt ctccaagcac gccggggtat cgacgccggg 15540
accggtcgcg gcgacctcga aggtgcgaat gttaatgccc gcgctcatca gccgcagttg 15600
ctccagggat tcggcctgtt cgggcatgga ctccggcaac tggctgtaat tttgcaggac 15660
atcccgccga taggcgtaga tcccgacgtg cttcaggtag cgcgccttct cggcgttgcg 15720
cgggtacgga atgggggagc gggagaaata cagggcgtcc tgccgcgtgt tcaccacgac 15780
cttgacggtg gacggttcgg cggcttctgc cgcgctgatc gcatgacaca gggtcgccac 15840
cggcagcgcc gggtcgtccc gcataccttg cagcagggtt tcgacgtcac gcgggcgaat 15900
catcggctca tccccttgca ggttgatata gatatccgcc tccaccttat gcatgacttc 15960
caccaggcga tcggtgccgc tctcatgatc gttgcgggtc atgatcgctt tgccgccgaa 16020
cgcctggact gcctgctcca cacgcgggtc gtcggttgcg acccacacct ctgccacgcc 16080
tgccacttgc agggcccgtt cgtagacgtg ctggatcatc ggtttcccga cgatatccag 16140
cagcggtttg cccggcagac ggctgctgcc gtagcgtgcc gggatcacaa tcacggcctt 16200
cgacatttat taacctcctc gagttacagc gacagaatca ctttcgcgcc caccgccagt 16260
tggtacagaa tggtgctgat accgcgcgtc acttcgatgt tcttcgactc gtatttcggc 16320
aacaccataa tttcatcacc gggtttcagg gaatcgacgt cttctgcgtt caccgctgcg 16380
ccgttctgac ggatgacgat aatacgggcg ttgccggact tctgggtcag cccaccgcac 16440
ttctcgatgt agtcctcggt cgtcatacct ttctgccacg acaccgcgtt cgggaacagc 16500
acttccccgt ggaccatgac caacgacgtc ttttcgggaa tattgatcac gtcgccgtcc 16560
tccaggagga cggagtcaat gttgctttca ttgaggatca cttcgccctt cggcacgacg 16620
gtgcgggctt tcgcgacgaa gcgggagatc agttgggctt cctgcatacg caggctggcc 16680
tcttccttgg tgctgctctg tgcgctgagg ctggcctctt cgagcttttg cagggacaaa 16740
ttcagcattt ctttctgccg ttgcgcgacg ctcggccgat acaactgcac ggcgttcatc 16800
tgcgacatgg agttcgggcg cactttttcg agcacggccc gcatggtgct accgtagggc 16860
agcaccatgg cgtgttcccc ggaatgtgcg ccttccacac gcacttgaat ggtgcccgca 16920
tagcggtcgg tggagacaat gagggtatca ccgttttgca gcatacgccc cggtgcggac 16980
gagatcggat aatattccga gcgcttctgg aggccctgct tccgcataat cgtgatatgg 17040
gtcgcacccg gtttgggacg tgcccaggac agtgcttcgg tgaccgggat gctcgattcg 17100
cgaaattcaa agtcgtagga attgaacaca tcgccctgca ccgagaacgt atgctggcgc 17160
ggacccacaa tgatcgtatc accgtccgca aactgggaca gccccagttt gccgttgagc 17220
aggaagtcat agaggttgac gttcgagcgc acacgattgc cgcgtttcac gacgatgtcc 17280
acgtagctgc cgcgttccgg gtccacacca cccgccttga tcaggtagtt cagcaggctg 17340
tcggaggtga caccgccgta caggccgggg ttgcggacaa agccggtcac atagaccttg 17400
accggctgcg cctgcaagag cgacgcatag acgttcacgt tgctctggta gacttccttc 17460
accttgctcg tcaccagcgc gttcaactgg gagttcgaca cacctgcgac tttgacgggg 17520
ccgacattcg gcaggaagat gttgcccttc gggtccacct ggagtgcgcc atcgaaggtg 17580
aacgcacccc acaggcggac ctggatggaa tcgccgggat tcaggatgta gtccggattg 17640
aaacccacgg ttgcccccga gtctgcgctc gtaccgttga acagctgcgc cccgaacata 17700
cggctcatca cgaccggggg tgcggggggc ggggtgttat cgaagccgct catgttctgg 17760
gtgtcgcttt tctgcccgtt caggatgccg gtcaacggtg cggcacccgt gaggttcgga 17820
tcggcattaa tgtcgatggt tgcgctcgcc tgtgctgcat ggcacgctgc gatcagcagg 17880
atcgacttaa acagcttcat ttattaacct cctcgagaag tcgacttagt cacggtggtc 17940
ttcaatcacc gccaggagca atttcagggt gccaaagagc aggcaacaca ccagcagcca 18000
acacgcgatc aaatacggga tattcgggaa ggagctttcc tggggcagct gcggggacga 18060
gatcacgctc aggactttca gcttacgggc cgcttcgaca cgggtctttt cgatgctggt 18120
gagcgtgagc ttgtacaact cggtattgaa ctcgaccttg gatttgatct cctcaaaatc 18180
cacggccatg cggttcagtt tatcgccctg gggtgcggta attttcgact tttcttcgtc 18240
gatctgtgcc tggaggctct gaattgcatt gcgggcgctc acgacttggg gcgcatcctc 18300
gcgcaggtac gtgagcaggt tgcgcaggtc ggcttccatc tgaattttct ggcccatcag 18360
cgtattcacc agggtggatg ccgcctgggc ctgtgcctgc gggtccagca cattgttgtt 18420
gtcttggtag gacaacaatt cggctttcga tgcatccagc cgctggcgcg ctttttccat 18480
ttcggtttcc gcaaacgcca attgatcgcg ggcgatacgg tgcgacattt cattgatgaa 18540
ccgctcggat tccttgagca cggtctggtt gaatttcagc gcgaactcgg gcgaaaagcc 18600
ctgggtctgg atgttcagca gcccggtctt gtcgtcgtag ctgacgttga tgcgatcttt 18660
atagtacttc aggaacccct cggcggtttc atccttggac agatggttca ggaagtccag 18720
gcccgaatgg gagaacgctt cgcggaagtt cagctgttta tccagcgcgg ccagcatatc 18780
cgggctgttg atgtattcct tcaggtacag tgcgtcttcg gcggacgacg ggttggaggc 18840
acccaacagc aggccgaagt tcaggctgcc ggagttgaga tcgtcgctgc gcttgatggc 18900
caccttgctt tccgacatat agcggggctg ggagaagatc gccaagtaga tcagcagcac 18960
cgccatgggt gccagaataa tgatttttgc caggtgcttc tgaatatctg ccaggctgat 19020
cgcgctcaga cgcgcacgca tccacgagac ggcgcttttc actttgatca gcatttatta 19080
acctcctgtc gacaacacgt gttaatcgaa aatgcgcacc aacccggtca ccttatttgc 19140
tttgttggtc accagcaggg tcgagacgcg gtgtttctgc atcttctctt ctgcttcgat 19200
gatcatggtg tcttcgggca aggtcagcgg ttcgcgggtc atcatctgtg cggccgttgc 19260
gctcgtcagg ctgtcttctt tctccataaa gcgccgcaga tcgccatcgg tgatgatgcc 19320
tgccagccca ccttccgcat cttcgaccat caccataccc tggcagcccg aggtgatgcg 19380
ctgaatgacc gttttgaagc tggcatcgag ctgcactgcc ggcacatcat gttgcatcac 19440
gtcggcgacg cgggtcagca ggcgccgacc caggctgcca ccggggtggt agcgtgcaaa 19500
gtcattgggc ataaacttac gctggtgaat catcgcgatg gccagcgcgt ccccgatcgc 19560
catcgtgagc gtcgtggagg tggtcggggc gagattgttc gggcacgttt cgttcgccat 19620
gtgcagctcc aggaccgcat ctgcattttt ggccagggtg ctattcccgt tattggtgat 19680
tgcgatgatg cgattgccga agttcttcag gctcggcacc agtttcagga tctcgtccgt 19740
ctcaccgctc gccgaaatca agatgagcag gtcatacggg gtgatcatgc ccagatcacc 19800
atggaacgct tccgccggat gaataaagaa ggagggcgtc ccggtcgagg ccaaggtcgc 19860
cgacatcttg cggcccacat ggccgctttt acccatgccg ctcaggatga cgtgcccttt 19920
acaattcatg atgagattca ggacgcgctg gtactgaccg ctatccagtt gtttggacag 19980
gttttgcagt gccgcgcttt gttcggccag ggtctggcgg acgctcgtaa tcagatacgg 20040
atcaatggtc gaggactggt catccggcaa gtggcgttcg ctcatttatt aacctcctca 20100
cgtgttaatt aagtaatcga tagtgattta aatatgcaag atctagttac ctgcaggcgc 20160
gccgcggccg ccaagacggt attcgggctg caccgtggac attgccagcg ggtccggatg 20220
cggcagcgaa gacgccatct ccgggccggt gctgcaagcg cccagcgaca tcgagcagag 20280
cagagccagg ctgaggcctt ggcagagtcg tccgatcagt ttcttcatgc gtgtagctgg 20340
ctgcctctgt tgggtgggac aggacctcgc gcagcattca accggctcag gcgccagcac 20400
gaacgtacga caggaagttg catcccgacg cgtgccggga ccaacgttga atcgcgtgtt 20460
gcagtgcact atggcataga acgaacacat cgcaaggcac aacacgccat ttttttgacg 20520
gcgttggcct attgattcaa gttcgtcgcc tcgacgttaa gagaacgtga cctgggtcgt 20580
cattctcagc atacgaactc tagcgtttcc gggcacttac ggacgcctgc tgatcccgac 20640
ttgtagcagc ctgaaccgcg aaataattgc gtacaggact tgcatatgcc gccttgcaat 20700
atgccgttgc gcatagtggc atagcctgga atgccatcga actgacatgt tgcgacgcaa 20760
caaaaaggcc cacgtcttgc gacgtaggcc tgttgtttgg tcggggtagc cggattcgaa 20820
ccgacgacca ctagtccccc agactagtgc gctaccaggc tgcgctatac cccgaagatg 20880
ttgcgtcccg ccctgaggcg gcctgcgatt atagcggctt tatgcggcgc tttcctagcg 20940
tcgcagcagc tgcaggactt cttcaagctc catgcgcacc tgcttgatga tctgattgct 21000
cagcgctgac tcgctcttgg ccccatcccc ttcaagacgc agacgcgcgc ccccgatggt 21060
gtaaccctgc tcgtacagca ggccacgaat ctgccgcacc atcagcacat cgtgccgctg 21120
gtagtagcgt cggttgccgc gccgcttgac tggctccagg ctcggaaatt cggtttccca 21180
atagcgcagc acgtgcggct tgacgtcgca cagctcgctc acctcaccga tggtgaagta 21240
gcgcttggcc ggaatcggcg gtagctcgcg attactgccc ggatccagca taagcctcca 21300
cccgttcctt gagtttctgg ccggggcgga aggtcaccac cgtcctggcc gagatcggaa 21360
tttcctcacc ggtcttggga ttgcgaccgg gccgttggtt cttgcgccgc agatcgaagt 21420
tgccgaagcc cgacaacttc acctgacggc cctgctccag tgcatcgcgc agcacatcga 21480
aaaacgcgtc gacgaattcc ttcgcctcac gcttgttcag gccgacttcg tcgaacagac 21540
gctcggccat ctccgctttc gtcaatgcca tgccaatccc ctgttaccgc cagatctgaa 21600
ttcagctgta caattggtac catggatgca tatggcggcc gggccctacg tacgcgtgtt 21660
aaccggtgag ctcactagag gatccagccg accaggcttt ccacgcccgc gtgccgctcc 21720
atgtcgttcg cgcggttctc ggaaacgcgc tgccgcgttt cgtgattgtc acgctcaagc 21780
ccgtagtccc gttcgagcgt cgcgcagagg tcagcgaggg cgcggtaggc ccgatacggc 21840
tcatggatgg tgtttcgggt cgggtgaatc ttgttgatgg cgatatggat gtgcaggttg 21900
tcggtgtcgt gatgcacggc actgacgcgc tgatgctcgg cgaagccaag cccagcgcag 21960
atgcggtcct caatcgcgcg caacgtctcc gcgtcgggct tctctcccgc gcggaagcta 22020
accagcaggt gataggtctt gtcggcctcg gaacgggtgt tgccgtgctg ggtcgccatc 22080
acctcggcca tgacagcggg cagggtgttt gcctcgcagt tcgtgacgcg cacgtgaccc 22140
aggcgctcgg tcttgccttg ctcgtcggtg atgtacttca ccagctccgc gaagtcgctc 22200
ttcttgatgg agcgcatggg gacgtgcttg gcaatcacgc gcaccccccg gccgttttag 22260
cggctaaaaa agtcatggct ctgccctcgg gcggaccacg cccatcatga ccttgccaag 22320
ctcgtcctgc ttctcttcga tcttcgccag cagggcgagg atcgtggcat caccgaaccg 22380
cgccgtgcgc gggtcgtcgg tgagccagag tttcagcagg ccgcccaggc ggcccaggtc 22440
gccattgatg cgggccagct cgcggacgtg ctcatagtcc acgacgcccg tgattttgta 22500
gccctggccg acggccagca ggtaggccga caggctcatg ccggccgccg ccgccttttc 22560
ctcaatcgct cttcgttcgt ctggaaggca gtacaccttg ataggtgggc tgcccttcct 22620
ggttggcttg gtttcatcag ccatccgctt gccctcatct gttacgccgg cggtagccgg 22680
ccagcctcgc agagcaggat tcccgttgag caccgccagg tgcgaataag ggacagtgaa 22740
gaaggaacac ccgctcgcgg gtgggcctac ttcacctatc ctgcccggct gacgccgttg 22800
gatacaccaa ggaaagtcta cacgaaccct ttggcaaaat cctgtatatc gtgcgaaaaa 22860
ggatggatat accgaaaaaa tcgctataat gaccccgaag cagggttatg cagcggaaaa 22920
gcgctgcttc cctgctgttt tgtggaatat ctaccgactg gaaacaggca aatgcaggaa 22980
attactgaac tgaggggaca ggcgagagac gatgccaaag agctacaccg acgagctggc 23040
cgagtgggtt gaatcccgcg cggccaagaa gcgccggcgt gatgaggctg cggttgcgtt 23100
cctggcggtg agggcggatg tcgaggcggc gttagcgtcc ggctatgcgc tcgtcaccat 23160
ttgggagcac atgcgggaaa cggggaaggt caagttctcc tacgagacgt tccgctcgca 23220
cgccaggcgg cacatcaagg ccaagcccgc cgatgtgccc gcaccgcagg ccaaggctgc 23280
ggaacccgcg ccggcaccca agacgccgga gccacggcgg ccgaagcagg ggggcaaggc 23340
tgaaaagccg gcccccgctg cggccccgac cggcttcacc ttcaacccaa caccggacaa 23400
aaaggatccc caattctcat gtttgacagc ttatcatcga taagctttaa tgcggtagtt 23460
tatcacagtt aaattgctaa cgcagtcagg caccgtgtat gaaatctaac aatgcgctca 23520
tcgtcatcct cggcaccgtc accctggatg ctgtaggcat aggcttggtt atgccggtac 23580
tgccgggcct cttgcgggat atcgtccatt ccgacagcat cgccagtcac tatggcgtgc 23640
tgctagcgct atatgcgttg atgcaatttc tatgcgcacc cgttctcgga gcactgtccg 23700
accgctttgg ccgccgccca gtcctgctcg cttcgctact tggagccact atcgactacg 23760
cgatcatggc gaccacaccc gtcctgtgga tcctctacgc cggacgcatc gtggccggca 23820
tcaccggcgc cacaggtgcg gttgctggcg cctatatcgc cgacatcacc gatggggaag 23880
atcgggctcg ccacttcggg ctcatgagcg cttgtttcgg cgtgggtatg gtggcaggcc 23940
ccgtggccgg gggactgttg ggcgccatct ccttgcatgc accattcctt gcggcggcgg 24000
tgctcaacgg cctcaaccta ctactgggct gcttcctaat gcaggagtcg cataagggag 24060
agcgtcgacc gatgcccttg agagccttca acccagtcag ctccttccgg tgggcgcggg 24120
gcatgactat cgtcgccgca cttatgactg tcttctttat catgcaactc gtaggacagg 24180
tgccggcagc gctctgggtc attttcggcg aggaccgctt tcgctggagc gcgacgatga 24240
tcggcctgtc gcttgcggta ttcggaatct tgcacgccct cgctcaagcc ttcgtcactg 24300
gtcccgccac caaacgtttc ggcgagaagc aggccattat cgccggcatg gcggccgacg 24360
cgctgggcta cgtcttgctg gcgttcgcga cgcgaggctg gatggccttc cccattatga 24420
ttcttctcgc ttccggcggc atcgggatgc ccgcgttgca ggccatgctg tccaggcagg 24480
tagatgacga ccatcaggga cagcttcaag gatcgctcgc ggctcttacc agcctaactt 24540
cgatcactgg accgctgatc gtcacggcga tttatgccgc ctcggcgagc acatggaacg 24600
ggttggcatg gattgtaggc gccgccctat accttgtctg cctccccgcg ttgcgtcgcg 24660
gtgcatggag ccgggccacc tcgacctgaa tggaagccgg cggcacctcg ctaacggatt 24720
caccactcca agaattggag ccaatcaatt cttgcggaga actgtgaatg cgcaaaccaa 24780
cccttggcag aacatatcca tcgcgtccgc catctccagc agccgcacgc ggcgcatctc 24840
gggcagcgtt gggtcctggc cacgggtgcg catgatcgtg ctcctgtcgt tgaggacccg 24900
gctaggctgg cggggttgcc ttactggtta gcagaatgaa tcaccgatac gcgagcgaac 24960
gtgaagcgac tgctgctgca aaacgtctgc gacctgagca acaacatgaa tggtcttcgg 25020
tttccgtgtt tcgtaaagtc tggaaacgcg gaagtcagcg ctcttccgct tcctcgctca 25080
ctgactcgct gcgctcggtc gttcggctgc ggcgagcggt atcagctcac tcaaaggcgg 25140
taatacggtt atccacagaa tcaggggata acgcaggaaa gaacatgtga gcaaaaggcc 25200
agcaaaaggc caggaaccgt aaaaaggccg cgttgctggc gtttttccat aggctccgcc 25260
cccctgacga gcatcacaaa aatcgacgct caagtcagag gtggcgaaac ccgacaggac 25320
tataaagata ccaggcgttt ccccctggaa gctccctcgt gcgctctcct gttccgaccc 25380
tgccgcttac cggatacctg tccgcctttc tcccttcggg aagcgtggcg ctttctcata 25440
gctcacgctg taggtatctc agttcggtgt aggtcgttcg ctccaagctg ggctgtgtgc 25500
acgaaccccc cgttcagccc gaccgctgcg ccttatccgg taactatcgt cttgagtcca 25560
acccggtaag acacgactta tcgccactgg cagcagccac tggtaacagg attagcagag 25620
cgaggtatgt aggcggtgct acagagttct tgaagtggtg gcctaactac ggctacacta 25680
gaaggacagt atttggtatc tgcgctctgc tgaagccagt taccttcgga aaaagagttg 25740
gtagctcttg atccggcaaa caaaccaccg ctggtagcgg tggttttttt gtttgcaagc 25800
agcagattac gcgcagaaaa aaaggatctc aagaagatcc tttgatcttt tctacggggt 25860
ctgacgctca gtggaacgaa aactcacgtt aagggatttt ggtcatgaga ttatcaaaaa 25920
ggatcttcac ctagatcctt ttaaattaaa aatgaagttt taaatcaatc taaagtatat 25980
atgagtaaac ttggtctgac ag 26002
<210> 148
<211> 26209
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic plasmid pKM013
<400> 148
ttaccaatgc ttaatcagtg aggcacctat ctcagcgatc tgtctatttc gttcatccat 60
agttgcctga ctccccgtcg tgtagataac tacgatacgg gagggcttac catctggccc 120
cagtgctgca atgataccgc gagacccacg ctcaccggct ccagatttat cagcaataaa 180
ccagccagcc ggaagggccg agcgcagaag tggtcctgca actttatccg cctccatcca 240
gtctattaat tgttgccggg aagctagagt aagtagttcg ccagttaata gtttgcgcaa 300
cgttgttgcc attgctacag gcatcgtggt gtcacgctcg tcgtttggta tggcttcatt 360
cagctccggt tcccaacgat caaggcgagt tacatgatcc cccatgttgt gcaaaaaagc 420
ggttagctcc ttcggtcctc cgatcgttgt cagaagtaag ttggccgcag tgttatcact 480
catggttatg gcagcactgc ataattctct tactgtcatg ccatccgtaa gatgcttttc 540
tgtgactggt gagtactcaa ccaagtcatt ctgagaatag tgtatgcggc gaccgagttg 600
ctcttgcccg gcgtcaatac gggataatac cgcgccacat agcagaactt taaaagtgct 660
catcattgga aaacgttctt cggggcgaaa actctcaagg atcttaccgc tgttgagatc 720
cagttcgatg taacccactc gtgcacccaa ctgatcttca gcatctttta ctttcaccag 780
cgtttctggg tgagcaaaaa caggaaggca aaatgccgca aaaaagggaa taagggcgac 840
acggaaatgt tgaatactca tactcttcct ttttcaatat tattgaagca tttatcaggg 900
ttattgtctc atgagcggat acatatttga atgtatttag aaaaataaac aaataggggt 960
tccgcgcaca tttccccgaa aagtgccacc tgacgtctag atctcctacc gaccaggcat 1020
tggcgcgttc caccatcgtc ggcaaatcgc gttcgacagt caccagaatg ctgcgaaagc 1080
acgcagtgtc gtccataccg cccgcacgga aatccttgat cgcctgccgc gggttgtcga 1140
tcttgtattc gagcgtggtc gaggtcggct tgataccggc gcgcttggca gcgcgctcca 1200
ccaccgacca gatcaccggc gagcgggcca ggccagagcg tttgagcgca gcctgataca 1260
actcgccggc agccagcatc ggccgcttgc gctccacgcc acggtcgcgc cccatgtaac 1320
gcgccttggc aacggtccag cgcgcataca actcaggcgg cagcacatcg cgcagctcac 1380
gcccgtcttc gttcttcatc gccttcatcg ccgcgggcat cagggccaat ttgccgaaca 1440
tgccaacgtc ggcatccacc tgcaccatcg gcgccatcag cacctgctgc gattggccga 1500
tgatggtttc gacctcggtc gcttgccact ccaggtcctt cggcaacggt gacaacgtgc 1560
ccaggatcca cagcacgtgg tcgcccttgc tgaccttcca caggccgggg ccgggttgct 1620
gcccgcgcac caccatggct tccagatcga ccaccgttgg cggcgctgcc ggcgcctgta 1680
cggccacctc gacggcacac gccagcatcg gtgccaacaa cgacaccaac gcgattcctg 1740
cccgccacac cgcccccctg cgctgcatca cgtaccgcct cccggttgga acgcggacac 1800
tacgcgaacg cgggcccgca cgcgttaggg aagcgttggc ggctccggcg cggcgccttc 1860
ggcaaccaac gcggccagct gtgccgccag cggcgagccg tcttcgagca gcgcgaaacc 1920
ttcccagaca aaccctggcg aaaccgtgca gcccaccagg gtgaagtccc ccagcgagcg 1980
cgccgcctgc cagcagccgg ccggcaccac gtgcatggcg tcgccgcgct ctgcggcgtc 2040
cagcacttcg cgccgcaact gcccgctcgc ttcgtcgaag atcagcaact ccagcggcgc 2100
accttgctgc cagtgccagc actcctcggc atccacccga tgccagcgac tggcttcgcc 2160
tgcgcacaac aggaagcgga tggcggtcag cgccggacgc ggcggcgcac cgctgtcatc 2220
cagcacctgg cgcgtcgacg cgtacacgcg ccggtagtgg ccgccctccg gatggggggc 2280
aaggcccaat gttcgaatca gcgcggcggc ggttggatgc atgcacgcat gctaggccac 2340
acaccgccgc cgtgcatcac gccagctgtt tgcccgcacg caggcaggtg cggaagaaca 2400
ccagcagatc gcggccgcct cgacgctctc ccttatgcga ctcctgcatt aggaagcagc 2460
ccagtagtag gttgaggccg ttgagcaccg ccgccgcaag gaatggtgca tgcaaggaga 2520
tggcgcccaa cagtcccccg gccacggggc ctgccaccat acccacgccg aaacaagcgc 2580
tcatgagccc gaagtggcga gcccgatctt ccccatcggt gatgtcggcg atataggcgc 2640
cagcaaccgc acctgtggcg ccggtgatgc cggccacgat gcgtccggcg tacaagatcc 2700
acaggacggg tgtggtcgcc atgatcgcgt agtcgatagt ggctccaagt agcgaagcga 2760
gcaggactgg gcggcggcca aagcggtcgg acagtgctcc gagaacgggt gcgcatagaa 2820
attgcatcaa cgcatatagc gctagcagca cgccatagtg actggcgatg ctgtcggaat 2880
ggacgatatc ccgcaagagg cccggcagta ccggcataac caagcctatg cctacagcat 2940
ccagggtgac ggtgccgagg atgacgatga gcgcattgtt agatttcata cacggtgcct 3000
gactgcgtta gcaatttaac tgtgataaac taccgcatta aagccgagcg atgataagct 3060
gtcaaacatg agatccgata aatcgattga tagatttaaa taagaactgc agaagctagc 3120
ttagatgctc gtgaaattga cgtgggcgct ttgcagggcc gtcttaatgg cgttggtgtc 3180
cacgaggatc gagtcgggtg cggaaaacgg acggttcttg ttggtgaaat cgctgttacc 3240
aatgtacagc gattccttgt tacgcagcgc ctggatgtgc cagcgggacc acgaatccca 3300
atacttctgg cgatccggcg agataccttg gctggtgtag ccggtcgtcg ggctgttcat 3360
caacgagtcg gtgcggtgcg agcccagcgt cagcggcaac ttgatccgat gcaccgtgga 3420
atcgccgaag atcagcttca gacgcgcgat aaattcgcta tccgcacccg ttttcacaca 3480
atcccagaca ccggccttct gcaagacgtc ggcacggcga aacaggagcg acgacggatt 3540
cagacgcttc aaggggtaca ctgcgcgggc atagaaaata ccgttgtctt gcaggcgcac 3600
ccagtccgag atggagcaga tgagcttcgg attgagcaac aagggggaga tttggcggaa 3660
cagcttttcc ggatggctcc agtcatccga atcgtggcag gtgacgaact cgcccttcgc 3720
ttggatcaag ccgatacgct tcgcggcata ggtgccgaca ttctgcggca ggctaatgat 3780
cttgatgcgc gtgtctttga gggcgagccg ctggagacga aacagggtgt catcggtgct 3840
cgcgtcatcc acaatgatca gctcgaagga acggtaggtc tgattgagga gcgaaatcac 3900
cgcattttcc acgcggcgac ccgtattata ggtggtcatc aggatggaga tcaacggccc 3960
cgtctgggcc gggtacggga tgctggtgat gatgttgcac ggggagagcg gggagctgtt 4020
gtccgtcaag gccacggggc tgaggccgaa gtatttatag tattcattca gccgattcag 4080
gctaatttcg gcggtttcgc ggaaggcgtt attttgcagc agcaggatat ccgggctata 4140
gacgatatcg gatgcgtcga tctgggcgag ggtcgagatg gccttttggg tcaggccgat 4200
ccggagttgc agtgcggtat acaggtccag cgggcagttg tccacgttgt ccaacaggct 4260
caggctaaag gtcggcgagt aggacgccag ggttttcgcc agttccactt tctgatgggt 4320
atcggtgaac tcgtccttga actccatcag cagctcgggc gtcaggctga tgtcgccgca 4380
ggcgattttt gcgatcttga ttgccagttt gcagcgccaa tcggacgggg tatccgtcaa 4440
gttatgcagc gaccagtaca tattcagacg atacatcgcg aggatgcgtt tcgactgcca 4500
gaaccggcaa tcatcctgga tggccgcgag cgcgtggacg tagcggctct ttttgagcag 4560
ccacaagaat ttgagattat tgaacattta ttaacctcct gctagcaact taagttacga 4620
atcgacgccg aacaggtcgc gggtgtagac tttctccgag acatcttcca gttcgctggt 4680
gcggcgattc gccacaatga catcgacgcg ctccttaaag gaattgatgt cgcgctcgac 4740
gtaggaaccg aagaagtagg gttctttcag gaccggctcg tacaccacaa tctcgatacc 4800
cttggccttc aaacgtttca tgaccccctg gatgctgctg gcccggaaat tgtcgctacc 4860
cgccttcatg atcaggcgat agataccgac cactttgggc ttacgggaca ggatgtcctc 4920
ggccacgaag tccttacggg tcgtattcgc atccacgatg gcctggatca ggttttgcgg 4980
gacgtcgcga taattggcca acagctgctt cgtatccttc ggcagacagt aaccgccgta 5040
gccgaaggac gggttgttgt aatgttgacc aatgcgcgga tcgagggaga cgccttcgat 5100
gatttgtttg gtatccaggc cgtgcacgct cgcgtaggtg tccagctcgt taaagtacgc 5160
gatacgcatc gccagatacg tgttcgcgaa cagtttgatg gcttctgcct cgggcgaatc 5220
cgtcagcagg atcggaatat cctttttgat ggcaccttcc gacaggagtt cggcgaactt 5280
ccgtgcgcgt tccgacgatt cgcccacgac aatgcggctc ggatagagat tatcatacag 5340
ggctttgcct tcgcgcagga actccgggga aaagatgata ttattcgtgt tcagatcgcg 5400
cttcaggcgt tcggtgaacc cgacggggac ggtggatttg ataatgatgg tcgcgttcgg 5460
gttaatggac agcacgtcac acgcgacgct ttcgacgctc agggtatcaa agttgttatt 5520
aatcggatca tagttcgtcg gggtggcgat gatcacgtag tctgcatcgc gatatgcctc 5580
gtatttttcc gtcgtcgcgt agaggttcag cttacgattg gagagaaact tctggatttc 5640
cgggtcgcaa atcggcgaga ttttcttgtt aatgagctgg accttcttcg ggtcgatgtc 5700
cagggcgatg atgtcgtgtt tttgggagag gaggatcgca atgctgatac ccacatagcc 5760
gacgccggcc acggcaattt tcatttatta acctccttaa gtgaattcaa actagtttac 5820
aagtcgtttt cgatcttctc ccaggtatat ttgcgacatt cattcaagtt ggtcagcggc 5880
gagtatttgt actttttgat accgaggcgc gacaggcttt cgttcaccac cttgaaatgg 5940
ttttcctttt ggatgtccag tttcttgatc gacgtgttct cgccgtgcag gacacggttg 6000
tagcaaatct tattgatatg cttaaacggg ccgacttcgc tgagtttcaa atacatatcg 6060
taatccaccg cattgctgat gctctcgttg aagccttcgg tgaggttcca tgcacgcgcc 6120
gtgaacatac ggaagtggtg gcagatcatc gcgctcgtga gcttttcgcg gctgtaaatc 6180
ggccagttgt agccattgct aatcaagtta ccttcacgat caatattgcg attggtggtg 6240
tacacgcagg cgaggctcag gtctttgcga aattcatcca gacacagttc cacggcatcg 6300
ggctccagga aatcatcgga atccagctgc ccgatgtaga aaccccggca caggcggact 6360
gcggtattcg aggcggagcc gatgcctttg tttttctggc tgatgaaacg gacgcgcggg 6420
tggtttgcgt aatgttcttg caggatgcgc agcgtatcat cggtgctccc gtcatcgcag 6480
atgcagacct ccagatcggt gatcgtttgg ttcagtgccg attcgacgca gcgcacgata 6540
tatttgctgc aattatacgc ggggatgtag atgctcacca ggggcacacg tttcagggtg 6600
gcgctctcga ttttctcctt cttgcgataa aagtagggca ccttctgctg caacagctgg 6660
acggtaatgt ttttacctgc cgcgcgatcg gtttcgttct ccttaccggg cggttcctga 6720
tgatatgcca tcgcgccttc cacgctacgg aaataacaac cctcgcggta cagccgatag 6780
ccgaactcat tatcctcacc gccccaatgc gtgaactctt cgtcaaacca acccgcgcga 6840
aacagccact tctttgcaaa cgccacattg ccaccgctaa agaaccggaa cggggtgttg 6900
cacaggcgca gattgtcggt attcttgaaa tgttcgatgc gccaatcgac ggatttgttc 6960
tgctcgacct tgcctgcgac ctgattattg gtaataatct ccgggatttc attgatcagg 7020
cttttctggg acaaaaagtc cagataggta tgcttcgacg tgtcgatgta tttacgcggg 7080
ccaatcagtg ccacgttatc atccacggcc aggagttcca tataggactg cacccacaac 7140
gggttcggcg ccatatcgca gtccaagatc gccacgtagt tgtatttcgc tgcccgcagg 7200
cccaggttcc gcacggcgca cagctggtag ccgtagtctt tctggcggac gtatttgatg 7260
ttcagcaacg actcgaactc gcggacgatc tcttcgatgt tttccttgga accgtcatcc 7320
gcgacgatga cctcatagtc ataaatcgtt ttctgattgc agaggcaggc cagggtgatc 7380
gccaggattt tggcgcgatt gtacgtcgga atcacgatgg acaggccgtc gatgatcagt 7440
tgcttgcgcg gataatcatc cagttcttta cgtttccctg cccagacgta gtcgttcgtg 7500
ctttccggca gcggcggcaa ggtcaggtcg ctcggccaat ccagcggaat gggttcgact 7560
tctttcaatt cggcgcgctc ggatttcttt gcggtaattt cccgatattt gctaatgatt 7620
tcattctttt ccacctcatt cagcgagatc gcctttgcat tgctgcacat aattttggtt 7680
gccgcgtcga tatcaatgac cgctttccga ttcagcttgt ccacttcttc gctcagattc 7740
agggcggttt ggcacagctt gatattggct tccacccagc tcacatcata gatttccgcc 7800
actttttcaa acagggagag ggcttggcgg tagttcttat tcttatacag attgattgcc 7860
tggttcaaaa tgctcattta ttaacctcct actagtgaat tttcgaatta cttaccgcag 7920
tacttgacac ccacctggga attgtttttg gtgcgtttga attggcggat ggtacggtag 7980
atgctaaagg gcaggctgat cagaccgagc ggaaaattgt tcttattgat gatgagcttg 8040
cccagctgat agctcaggtg tttcttgacc cgttcggctt cgtgtttatc cgcgtacagg 8100
aagatgctcg gcaggctcac ttggtactcc gaatcatatt tcttcttcca ggtccgccat 8160
tcgctgatca acgcaaacgg aatcgagatc agaccgagga acgtcttgga gcggctcacc 8220
atcaccgcac ccaggcggta gccgatatct tgcttgatgc gttcggccgc accatacagc 8280
tccggcagtt gtttcttttc gagacgttga ttgtcgatga agtactgttc gagcttttgc 8340
tgcaccagat gcagctgatt gagcagcaat tctttttcgc acgacagctt ttcgaggcgc 8400
tgttgttgca gttcattttt gttctgttcc tttttcagca gggactcgaa gttctcgatc 8460
gcgcactcca gttcctggac ctggatggtt ttgtttttaa tgatcagatc atactggatc 8520
agttcttcct tgctatccga cagctctttc agaatggctt gataggcgtt cagctgtttg 8580
gacgtgtgca gttcgttgtc cagaatgatc tttttgctgc tctggtacag accgttcacg 8640
atatcgaggg tgatctggcg ttgtttaatg aacgtctccc aaataaagga cggcttatag 8700
ttttccttct ccagcacccg caagggggtg ttggcgttcg attgcaattc aaagtacagt 8760
tccttgcaat cgggatagtc gttcaggacg ttgaagatca agtactcctc cgtctcgctt 8820
tgcttgaaaa tgatatcccc ggtcccgatg tcaataccgc tgagggacat gatctcctga 8880
tgttcttttt ccagcgtaat ggaggcttcg gcggtcttaa agtcattcac gctctgctcc 8940
agcgagtggt tgatggtatt ggagaacgac aacccgaatt tcagtttcag tttgtgttgc 9000
agttgctgga tgcagtcctc ggcgttgcgc ttcacctgtt cgctcgacac cagcaggcac 9060
cgaccccggt tgttgaggaa gaagtgcagc aaggcggtgt tgtatgccag ccagtttttg 9120
atcagatgct ccgaggtata gttgctggag atgttctggt ccgagaagta gttcgtcagg 9180
atgcttttgg ggtggtcgta gatgaggata aaggtgatgt tctcatccac cgatttccaa 9240
tattccaacg tgtgaattgc gttggggtcg ctccaaccgc acagtttctg gttcaggttg 9300
gacagcatca gatccaatgc gataccgttc cagacggtgc tcacatggag cggttcaaag 9360
tcggcggaat cggtcaccgt atagatgtcc ggcgactggt acgccttccg cagcgtctgg 9420
gtgatgtcct ggggcgagag gttctcacgt ttggacgggc acagggagtt catgccgcgc 9480
tgatgcagga gttcttccac gatttggtag ttgctgctcg gatggcccac gatcaccagg 9540
cggttcattt attaacctcc tttcgaaaat gaacggtccg ttaaatatag ccattcggat 9600
tcttcatctg ccagcgccag gcgtcctcca gcatggtttc gagttcccgc ttggctttcc 9660
agttcagata tttgttggcc ttttcggggg aggaccagct ctccgcgata tcaccgtcac 9720
ggcggctcac gatttcatac ggaatccgca cgccggaaat cttttcaaag gtggacacca 9780
gttccagcac cgaataacct ttacccgtgc ccaaattaaa gacgtggtag ttggtgttat 9840
tgtcgcggaa gagataggac agcgctgcga cgtgcccttc ggccaggtcc atcacatgga 9900
tatagtcacg gacccccgtg ccgtctttgg tgggataatc accaccgaac accatcagtt 9960
tttccagttt ccccatcgcg acctgcaaga tgtacggcac caagttggag gggatgtctg 10020
ccgggctttc accaatcata ccggattcgt gggcgcccgt cggattaaag tagcgcaagc 10080
agaggaaatt cgtgtcggag tatttcttgg cgatgtcgcg gatcatcagc tccgagatgt 10140
acttggacgt accatacgga ttcagcgtgc caccaatatg gcagtcttcg gtgacgggca 10200
tgatcttgct ttccccatac accgtcgccg acgagctaaa gatgaagttg gcgacgtcgt 10260
tcttgatggc gcaattgatg agttgcaggg tgccgctcac gttgttgtca tagtagaaga 10320
tgggcttgat caggctttct gcgaccgatt tcgcacctgc aaagtgcatg atgcagtcga 10380
atttgtgttt cttcaggatc tggttcactt ccttctcgtt gttgatattg agttcgtaga 10440
acgtgacttt cttctttgcg atcagctcaa tgcgacggat gctttcgcag ctgctgttga 10500
tgagattgtc aatgatgacg acattgtagc ctttgttcag caggcagagc gacgtgtggc 10560
tgccgatgta gcctgcaccg ccggtgacca ggatgttcat ttattaacct cctcggtccg 10620
aattaaccta ggttatgagg tcagcattgc ttcttcacgc gtttagtagt tgttttgttc 10680
ggtgatatat tcttcaatgc cttcttgcac gtcttcatgg aacgacacgg cgttgtcgtc 10740
tttaaacacg attgccacat cgcagaactc tttcaacgag ttcagcgagt gcgacaccat 10800
gaggaaggag ctttccttat gacgctcctt gaagagttgg gcacattttt ccttgaaacg 10860
ggcgtccccc accgccgtca cctcgtccac gatgtagtaa tcgaacttga acgccatgct 10920
caggccgaag ccgaggcggc tgcgcatacc gctcgaatag gtcttgatcg gcatatcaaa 10980
atacttcccc agctccgcga actcttccac aaactcaatc ttttctttca gctcctcctg 11040
cttcgcgtac agccgggcca cgaacttcac gttttcacgc ccggtcaagc tgccctggaa 11100
gccgcctgcc agacccaccg gccacgagat cgttttattc gtgatgattt taccgctatc 11160
cgggcggtcg atgcccccaa tcatgcgcaa cagcgtggat ttacccgccc cattgcgccc 11220
gatgaacgcc acgcttttgc cgctggggat ctcaatgttc aggttcttga agacatagtg 11280
acggcccacc ggggtgcggt agcttttcgt caggttttcg atcttaatca tgaggtcaac 11340
attgcctcct cacgcgtacg gtacagggcc aaaccaataa acagggtcac cagggtgaac 11400
attgccagat aattcaggct gaccccttcg ctgatataac cgggcatcac ggcctcgcgg 11460
ctcagttcga cgacgtgcac caggggattc cacagcaggt acgaccaata ctgcttcgga 11520
atggagtgca gcgggaacat gatgcacgaa ataaagtaca gcggcttcag caagatcggc 11580
aagactttct gcatttcggg gaacgtcttg cccacgacca tgaagatcag gcccacaccg 11640
cacgacagga tgatcaggag gctccaggtg agcacaaatt gcaggaagtt ggtaatctcg 11700
aaatattcgc ccgccatcca gatgatcagc atcaggagga tgtagaccgc cacatagatc 11760
agcgtttcca agagggcgcg tgcaatgatc gtgtcgatcg gcttcacggg ccggtagtta 11820
aacagcccct gattggcttc gatggcgccc acggagcgat tgctgatgct gctgaaaata 11880
aagaacggga tcaggccatt gagcaggaac accgggaagg agatatccgg catggtgcga 11940
tgcatgatat agccaaagat cccgagcaga atcagcagat gtgcgctcgg ttccaggatc 12000
gcccacagat agcccaggcg aaacttgcca aagcgcgtac ggatttcgcg gagaaacagt 12060
gcttcgaccg tcactttctg gacttcaaaa cccgaacgtg ccatttatta acctcctggt 12120
accaatctag attgtttaaa cagatccaat ctagattgtt taaacttctg cagaacacgc 12180
ggtgttaacg tttcttatac ttcttaattt tgttaaagat catttcgccg tagtacaccg 12240
cattgacctg ggtcttcacc agcaagtagc cgcgaaattt cttaaacaac ttcatgttcg 12300
gtttaaagtc ggcttgccag aactgatgca aatgcccctg gtacgtcaga cccttgatat 12360
cgtacaaggc gttgcccatg actttcaggg gcttgttgtg gatcaacgcg gaaatgccgg 12420
ccgtgctatt gatggtgacc accgctttgg cgtggcgcaa cagctccggc atgggcagat 12480
cgtgcacata gatgacacgt tcatccaaac cgtattcctt cgacagacgc ttgatcaacg 12540
ggcggtacag gcggtgcccg cgatccatcg ggtgatgttt gatcaccaga taggactcct 12600
tgggggcctt gcgggaaaag ctgtacatca cttcgttgat gtaatcacgc acatcattat 12660
agttgctatg gttgcggatc tggctgtcgt tgtacacttg caggaccgcc aggtaatagc 12720
gctgatccag ctcgttcatc aggcggggga ggaccttgcg ttgggtgacc ttatacagct 12780
gtttgcgcca gtaggcgcgg acccagcagc gcgcttcata ccacgggctg aacgatttgt 12840
ggtggcgata gcgcggaaat tcgtgacgat agtgccaacc catcaggtaa taccacatgg 12900
cgtggccgat gcgcttcatg gtgctcggtt tcaggttctc gacgtgcggc gtcggcatat 12960
cgggcaattt gcggtaaaag tccggatcgc ggggcaagct gctataggcg ttcacaccgc 13020
cttcttccac ggtgataaat tgcggacgca ggtagccttc ctcgaaggcc agaaaacgaa 13080
tccccttcga cttggcccag cgtttggcct ccttgtgcag caggcggcag tcaccgaaac 13140
acaaaatcgt gtcaaagtca tactgacgat gcaagtcccg cagccaaccg gggaactcct 13200
tcggggtttg gtagtacgcc aggtattggc ggtggcggca gtagaagcga tcaccgccat 13260
taaagacgac gttgaccgcg ttgcgaccga ggctctccaa ccattccgcc acatcgttga 13320
agaacggacc catcggacct tggagcagga ggtacttttt accgctcaac agcaccgtca 13380
gcgcattgcc gtgcatttat taacctccta acacgcggtg ttaagcgttt tcggcgagct 13440
cttaaccaaa gcgcactttg cagaacatga tcaacttgcg atagtagcga atcacacggc 13500
cggctttctt gcgggtgata aagatgggtt tgcggggcgt tttgatcaga tattctgccg 13560
cttcctccac cgtgatcggc tgcaaccgcg tcggatgaat ataggtggga tagacaatca 13620
gggcttgata gatcaggtcg gcgatggtca gccgccgctc gcgacggggg cagtggtgct 13680
catcgacggt caggccccac gaggcgtaga acggcaggcc gtagcagtgc acctgtttac 13740
cgtgcagcaa tgcttcaaag ccgctgaggc tcgtcatcgt gtgcacctcg tccgcacgct 13800
gaatacactg aatgatatcg gcatccagtg cctggtagtc tgcgagttcc gcgatctgtt 13860
ccgccggaat gtcaccctta cggttgccga cgagcacatc ggggtgcggc ttgtagatga 13920
tgtaggcgtg cggattacgt tcccgcacgg tgcgcagcag ctccagattc gacttgatcg 13980
acacggtgcc cgtcttaatc gacgcatcgt cttccacctg gcccggcacc aggatgactt 14040
tcttgtcctt cgcttctgcc gggaggctga aatcggcccc caggttatat ttgctcaatt 14100
tgctttccac cagacgttgg cgcaactttt ccgcgcgcat ctggtgcgcg agggtcagct 14160
ggctgtgatt cagcaggacc tccagttccg acggacgggt ggcatcgtaa tagataccgc 14220
gcttatccag gaccaggctc aacggcggca gcagatcgct ccccaggccg gagctgcgca 14280
ggaagccgtc ttccatgcgc cacagcggca gggatttgcg ctgtgcctcc gcacgccatt 14340
gctgttcgcc tttcacgccc cacacgacgc aggcgcttgc tgcggtacag cgacgggaaa 14400
aggagagacg attcgtggcc gtttgcagga agggcttcag gatcgcgctt ttccacaggg 14460
tcaggcccgg cacccagaga taaccattcc gctgttgcag gtgacgacgt tgcagctgga 14520
gccattggag caccgtgaac agggccgaca cctccccggt ctgcggatca atgtagcggc 14580
aatagcgcag ataggccgct gcgaacagtt cctccagggt ggccgagccg cgacgcgccg 14640
acagcagcgc cgattggggg tggcggtcat cggtgaggcc ccaccctgca taccagggtt 14700
ggccaaagca ggtcacgggc ttaccggcca gcagggcttc aaaaccgtac tgggaggtca 14760
cgacgtacac gcgggacaca tgacgcagca gggactgcgg cgacacgttt tccgcaatca 14820
ggcgcacgcg ctgggtggca cgcaagtccg cgaagtagcc ggtctttttc ccttccagga 14880
catcgggatg cactttgacc cagatttctg cctgcgggtt ttccgccatc gctgcttcca 14940
gcattgcggc gaactcatgg gggcctgcgt tgccgtaggt cacgctcatg tcattgaagg 15000
tctggtccac caccagcacg atgttcgtgc gctcgctttc atccgccacg aacgccggtg 15060
ccaggttgta cttgctcatg tcgcccgtca caatggtgtg catcgcctcg cgcgcctgat 15120
ccgccagggc cgcgttgccg gccttgtcct gcacgagttt ttccagcgcg ctcggtttcg 15180
aggcgtcgta gtaaatgccg cagtcatcca cgacgagcga gaggggcggt tcaccgttca 15240
cgcccaggtc cagcgagcgg acgaaaccat cctccaagcg gatcaccggc ttgcctgcgg 15300
ctttggcgat ggccaccggc tttgcggccg aggggcggtg cccccacacc gcgattgcat 15360
ccacttcctg cgggaccggg cgcagcagcg acagcttttg gcagggctgg gcgaggaatt 15420
tttccaggtg cggaatacgc caaatgccgg ggctataaat gccaatcatg cgttctccgc 15480
gagctcctgc gccatcaggg cccggacctt ctccaagcac gccggggtat cgacgccggg 15540
accggtcgcg gcgacctcga aggtgcgaat gttaatgccc gcgctcatca gccgcagttg 15600
ctccagggat tcggcctgtt cgggcatgga ctccggcaac tggctgtaat tttgcaggac 15660
atcccgccga taggcgtaga tcccgacgtg cttcaggtag cgcgccttct cggcgttgcg 15720
cgggtacgga atgggggagc gggagaaata cagggcgtcc tgccgcgtgt tcaccacgac 15780
cttgacggtg gacggttcgg cggcttctgc cgcgctgatc gcatgacaca gggtcgccac 15840
cggcagcgcc gggtcgtccc gcataccttg cagcagggtt tcgacgtcac gcgggcgaat 15900
catcggctca tccccttgca ggttgatata gatatccgcc tccaccttat gcatgacttc 15960
caccaggcga tcggtgccgc tctcatgatc gttgcgggtc atgatcgctt tgccgccgaa 16020
cgcctggact gcctgctcca cacgcgggtc gtcggttgcg acccacacct ctgccacgcc 16080
tgccacttgc agggcccgtt cgtagacgtg ctggatcatc ggtttcccga cgatatccag 16140
cagcggtttg cccggcagac ggctgctgcc gtagcgtgcc gggatcacaa tcacggcctt 16200
cgacatttat taacctcctc gagttacagc gacagaatca ctttcgcgcc caccgccagt 16260
tggtacagaa tggtgctgat accgcgcgtc acttcgatgt tcttcgactc gtatttcggc 16320
aacaccataa tttcatcacc gggtttcagg gaatcgacgt cttctgcgtt caccgctgcg 16380
ccgttctgac ggatgacgat aatacgggcg ttgccggact tctgggtcag cccaccgcac 16440
ttctcgatgt agtcctcggt cgtcatacct ttctgccacg acaccgcgtt cgggaacagc 16500
acttccccgt ggaccatgac caacgacgtc ttttcgggaa tattgatcac gtcgccgtcc 16560
tccaggagga cggagtcaat gttgctttca ttgaggatca cttcgccctt cggcacgacg 16620
gtgcgggctt tcgcgacgaa gcgggagatc agttgggctt cctgcatacg caggctggcc 16680
tcttccttgg tgctgctctg tgcgctgagg ctggcctctt cgagcttttg cagggacaaa 16740
ttcagcattt ctttctgccg ttgcgcgacg ctcggccgat acaactgcac ggcgttcatc 16800
tgcgacatgg agttcgggcg cactttttcg agcacggccc gcatggtgct accgtagggc 16860
agcaccatgg cgtgttcccc ggaatgtgcg ccttccacac gcacttgaat ggtgcccgca 16920
tagcggtcgg tggagacaat gagggtatca ccgttttgca gcatacgccc cggtgcggac 16980
gagatcggat aatattccga gcgcttctgg aggccctgct tccgcataat cgtgatatgg 17040
gtcgcacccg gtttgggacg tgcccaggac agtgcttcgg tgaccgggat gctcgattcg 17100
cgaaattcaa agtcgtagga attgaacaca tcgccctgca ccgagaacgt atgctggcgc 17160
ggacccacaa tgatcgtatc accgtccgca aactgggaca gccccagttt gccgttgagc 17220
aggaagtcat agaggttgac gttcgagcgc acacgattgc cgcgtttcac gacgatgtcc 17280
acgtagctgc cgcgttccgg gtccacacca cccgccttga tcaggtagtt cagcaggctg 17340
tcggaggtga caccgccgta caggccgggg ttgcggacaa agccggtcac atagaccttg 17400
accggctgcg cctgcaagag cgacgcatag acgttcacgt tgctctggta gacttccttc 17460
accttgctcg tcaccagcgc gttcaactgg gagttcgaca cacctgcgac tttgacgggg 17520
ccgacattcg gcaggaagat gttgcccttc gggtccacct ggagtgcgcc atcgaaggtg 17580
aacgcacccc acaggcggac ctggatggaa tcgccgggat tcaggatgta gtccggattg 17640
aaacccacgg ttgcccccga gtctgcgctc gtaccgttga acagctgcgc cccgaacata 17700
cggctcatca cgaccggggg tgcggggggc ggggtgttat cgaagccgct catgttctgg 17760
gtgtcgcttt tctgcccgtt caggatgccg gtcaacggtg cggcacccgt gaggttcgga 17820
tcggcattaa tgtcgatggt tgcgctcgcc tgtgctgcat ggcacgctgc gatcagcagg 17880
atcgacttaa acagcttcat ttattaacct cctcgagaag tcgacttagt cacggtggtc 17940
ttcaatcacc gccaggagca atttcagggt gccaaagagc aggcaacaca ccagcagcca 18000
acacgcgatc aaatacggga tattcgggaa ggagctttcc tggggcagct gcggggacga 18060
gatcacgctc aggactttca gcttacgggc cgcttcgaca cgggtctttt cgatgctggt 18120
gagcgtgagc ttgtacaact cggtattgaa ctcgaccttg gatttgatct cctcaaaatc 18180
cacggccatg cggttcagtt tatcgccctg gggtgcggta attttcgact tttcttcgtc 18240
gatctgtgcc tggaggctct gaattgcatt gcgggcgctc acgacttggg gcgcatcctc 18300
gcgcaggtac gtgagcaggt tgcgcaggtc ggcttccatc tgaattttct ggcccatcag 18360
cgtattcacc agggtggatg ccgcctgggc ctgtgcctgc gggtccagca cattgttgtt 18420
gtcttggtag gacaacaatt cggctttcga tgcatccagc cgctggcgcg ctttttccat 18480
ttcggtttcc gcaaacgcca attgatcgcg ggcgatacgg tgcgacattt cattgatgaa 18540
ccgctcggat tccttgagca cggtctggtt gaatttcagc gcgaactcgg gcgaaaagcc 18600
ctgggtctgg atgttcagca gcccggtctt gtcgtcgtag ctgacgttga tgcgatcttt 18660
atagtacttc aggaacccct cggcggtttc atccttggac agatggttca ggaagtccag 18720
gcccgaatgg gagaacgctt cgcggaagtt cagctgttta tccagcgcgg ccagcatatc 18780
cgggctgttg atgtattcct tcaggtacag tgcgtcttcg gcggacgacg ggttggaggc 18840
acccaacagc aggccgaagt tcaggctgcc ggagttgaga tcgtcgctgc gcttgatggc 18900
caccttgctt tccgacatat agcggggctg ggagaagatc gccaagtaga tcagcagcac 18960
cgccatgggt gccagaataa tgatttttgc caggtgcttc tgaatatctg ccaggctgat 19020
cgcgctcaga cgcgcacgca tccacgagac ggcgcttttc actttgatca gcatttatta 19080
acctcctgtc gacaacacgt gttaatcgaa aatgcgcacc aacccggtca ccttatttgc 19140
tttgttggtc accagcaggg tcgagacgcg gtgtttctgc atcttctctt ctgcttcgat 19200
gatcatggtg tcttcgggca aggtcagcgg ttcgcgggtc atcatctgtg cggccgttgc 19260
gctcgtcagg ctgtcttctt tctccataaa gcgccgcaga tcgccatcgg tgatgatgcc 19320
tgccagccca ccttccgcat cttcgaccat caccataccc tggcagcccg aggtgatgcg 19380
ctgaatgacc gttttgaagc tggcatcgag ctgcactgcc ggcacatcat gttgcatcac 19440
gtcggcgacg cgggtcagca ggcgccgacc caggctgcca ccggggtggt agcgtgcaaa 19500
gtcattgggc ataaacttac gctggtgaat catcgcgatg gccagcgcgt ccccgatcgc 19560
catcgtgagc gtcgtggagg tggtcggggc gagattgttc gggcacgttt cgttcgccat 19620
gtgcagctcc aggaccgcat ctgcattttt ggccagggtg ctattcccgt tattggtgat 19680
tgcgatgatg cgattgccga agttcttcag gctcggcacc agtttcagga tctcgtccgt 19740
ctcaccgctc gccgaaatca agatgagcag gtcatacggg gtgatcatgc ccagatcacc 19800
atggaacgct tccgccggat gaataaagaa ggagggcgtc ccggtcgagg ccaaggtcgc 19860
cgacatcttg cggcccacat ggccgctttt acccatgccg ctcaggatga cgtgcccttt 19920
acaattcatg atgagattca ggacgcgctg gtactgaccg ctatccagtt gtttggacag 19980
gttttgcagt gccgcgcttt gttcggccag ggtctggcgg acgctcgtaa tcagatacgg 20040
atcaatggtc gaggactggt catccggcaa gtggcgttcg ctcatttatt aacctcctca 20100
cgtgttaatt aagtaatcga tagtgattta aatatgcaag atctagttac ctgcaggatt 20160
attgtttctg ttgcataaag cctaaggggt aggcctttct agagatagcc attttttgca 20220
ctcctgtatc cgcttcttgc aaggctggac ttatccctat caaaccggac actgcaggct 20280
gacaagcttt cattacatat gaagagtttg tagaaacgca aaaaggccat ccgtcaggat 20340
ggccttctaa gaaggctcga gtggcgcgcc gcggccgcca agacggtatt cgggctgcac 20400
cgtggacatt gccagcgggt ccggatgcgg cagcgaagac gccatctccg ggccggtgct 20460
gcaagcgccc agcgacatcg agcagagcag agccaggctg aggccttggc agagtcgtcc 20520
gatcagtttc ttcatgcgtg tagctggctg cctctgttgg gtgggacagg acctcgcgca 20580
gcattcaacc ggctcaggcg ccagcacgaa cgtacgacag gaagttgcat cccgacgcgt 20640
gccgggacca acgttgaatc gcgtgttgca gtgcactatg gcatagaacg aacacatcgc 20700
aaggcacaac acgccatttt tttgacggcg ttggcctatt gattcaagtt cgtcgcctcg 20760
acgttaagag aacgtgacct gggtcgtcat tctcagcata cgaactctag cgtttccggg 20820
cacttacgga cgcctgctga tcccgacttg tagcagcctg aaccgcgaaa taattgcgta 20880
caggacttgc atatgccgcc ttgcaatatg ccgttgcgca tagtggcata gcctggaatg 20940
ccatcgaact gacatgttgc gacgcaacaa aaaggcccac gtcttgcgac gtaggcctgt 21000
tgtttggtcg gggtagccgg attcgaaccg acgaccacta gtcccccaga ctagtgcgct 21060
accaggctgc gctatacccc gaagatgttg cgtcccgccc tgaggcggcc tgcgattata 21120
gcggctttat gcggcgcttt cctagcgtcg cagcagctgc aggacttctt caagctccat 21180
gcgcacctgc ttgatgatct gattgctcag cgctgactcg ctcttggccc catccccttc 21240
aagacgcaga cgcgcgcccc cgatggtgta accctgctcg tacagcaggc cacgaatctg 21300
ccgcaccatc agcacatcgt gccgctggta gtagcgtcgg ttgccgcgcc gcttgactgg 21360
ctccaggctc ggaaattcgg tttcccaata gcgcagcacg tgcggcttga cgtcgcacag 21420
ctcgctcacc tcaccgatgg tgaagtagcg cttggccgga atcggcggta gctcgcgatt 21480
actgcccgga tccagcataa gcctccaccc gttccttgag tttctggccg gggcggaagg 21540
tcaccaccgt cctggccgag atcggaattt cctcaccggt cttgggattg cgaccgggcc 21600
gttggttctt gcgccgcaga tcgaagttgc cgaagcccga caacttcacc tgacggccct 21660
gctccagtgc atcgcgcagc acatcgaaaa acgcgtcgac gaattccttc gcctcacgct 21720
tgttcaggcc gacttcgtcg aacagacgct cggccatctc cgctttcgtc aatgccatgc 21780
caatcccctg ttaccgccag atctgaattc agctgtacaa ttggtaccat ggatgcatat 21840
ggcggccggg ccctacgtac gcgtgttaac cggtgagctc actagaggat ccagccgacc 21900
aggctttcca cgcccgcgtg ccgctccatg tcgttcgcgc ggttctcgga aacgcgctgc 21960
cgcgtttcgt gattgtcacg ctcaagcccg tagtcccgtt cgagcgtcgc gcagaggtca 22020
gcgagggcgc ggtaggcccg atacggctca tggatggtgt ttcgggtcgg gtgaatcttg 22080
ttgatggcga tatggatgtg caggttgtcg gtgtcgtgat gcacggcact gacgcgctga 22140
tgctcggcga agccaagccc agcgcagatg cggtcctcaa tcgcgcgcaa cgtctccgcg 22200
tcgggcttct ctcccgcgcg gaagctaacc agcaggtgat aggtcttgtc ggcctcggaa 22260
cgggtgttgc cgtgctgggt cgccatcacc tcggccatga cagcgggcag ggtgtttgcc 22320
tcgcagttcg tgacgcgcac gtgacccagg cgctcggtct tgccttgctc gtcggtgatg 22380
tacttcacca gctccgcgaa gtcgctcttc ttgatggagc gcatggggac gtgcttggca 22440
atcacgcgca ccccccggcc gttttagcgg ctaaaaaagt catggctctg ccctcgggcg 22500
gaccacgccc atcatgacct tgccaagctc gtcctgcttc tcttcgatct tcgccagcag 22560
ggcgaggatc gtggcatcac cgaaccgcgc cgtgcgcggg tcgtcggtga gccagagttt 22620
cagcaggccg cccaggcggc ccaggtcgcc attgatgcgg gccagctcgc ggacgtgctc 22680
atagtccacg acgcccgtga ttttgtagcc ctggccgacg gccagcaggt aggccgacag 22740
gctcatgccg gccgccgccg ccttttcctc aatcgctctt cgttcgtctg gaaggcagta 22800
caccttgata ggtgggctgc ccttcctggt tggcttggtt tcatcagcca tccgcttgcc 22860
ctcatctgtt acgccggcgg tagccggcca gcctcgcaga gcaggattcc cgttgagcac 22920
cgccaggtgc gaataaggga cagtgaagaa ggaacacccg ctcgcgggtg ggcctacttc 22980
acctatcctg cccggctgac gccgttggat acaccaagga aagtctacac gaaccctttg 23040
gcaaaatcct gtatatcgtg cgaaaaagga tggatatacc gaaaaaatcg ctataatgac 23100
cccgaagcag ggttatgcag cggaaaagcg ctgcttccct gctgttttgt ggaatatcta 23160
ccgactggaa acaggcaaat gcaggaaatt actgaactga ggggacaggc gagagacgat 23220
gccaaagagc tacaccgacg agctggccga gtgggttgaa tcccgcgcgg ccaagaagcg 23280
ccggcgtgat gaggctgcgg ttgcgttcct ggcggtgagg gcggatgtcg aggcggcgtt 23340
agcgtccggc tatgcgctcg tcaccatttg ggagcacatg cgggaaacgg ggaaggtcaa 23400
gttctcctac gagacgttcc gctcgcacgc caggcggcac atcaaggcca agcccgccga 23460
tgtgcccgca ccgcaggcca aggctgcgga acccgcgccg gcacccaaga cgccggagcc 23520
acggcggccg aagcaggggg gcaaggctga aaagccggcc cccgctgcgg ccccgaccgg 23580
cttcaccttc aacccaacac cggacaaaaa ggatccccaa ttctcatgtt tgacagctta 23640
tcatcgataa gctttaatgc ggtagtttat cacagttaaa ttgctaacgc agtcaggcac 23700
cgtgtatgaa atctaacaat gcgctcatcg tcatcctcgg caccgtcacc ctggatgctg 23760
taggcatagg cttggttatg ccggtactgc cgggcctctt gcgggatatc gtccattccg 23820
acagcatcgc cagtcactat ggcgtgctgc tagcgctata tgcgttgatg caatttctat 23880
gcgcacccgt tctcggagca ctgtccgacc gctttggccg ccgcccagtc ctgctcgctt 23940
cgctacttgg agccactatc gactacgcga tcatggcgac cacacccgtc ctgtggatcc 24000
tctacgccgg acgcatcgtg gccggcatca ccggcgccac aggtgcggtt gctggcgcct 24060
atatcgccga catcaccgat ggggaagatc gggctcgcca cttcgggctc atgagcgctt 24120
gtttcggcgt gggtatggtg gcaggccccg tggccggggg actgttgggc gccatctcct 24180
tgcatgcacc attccttgcg gcggcggtgc tcaacggcct caacctacta ctgggctgct 24240
tcctaatgca ggagtcgcat aagggagagc gtcgaccgat gcccttgaga gccttcaacc 24300
cagtcagctc cttccggtgg gcgcggggca tgactatcgt cgccgcactt atgactgtct 24360
tctttatcat gcaactcgta ggacaggtgc cggcagcgct ctgggtcatt ttcggcgagg 24420
accgctttcg ctggagcgcg acgatgatcg gcctgtcgct tgcggtattc ggaatcttgc 24480
acgccctcgc tcaagccttc gtcactggtc ccgccaccaa acgtttcggc gagaagcagg 24540
ccattatcgc cggcatggcg gccgacgcgc tgggctacgt cttgctggcg ttcgcgacgc 24600
gaggctggat ggccttcccc attatgattc ttctcgcttc cggcggcatc gggatgcccg 24660
cgttgcaggc catgctgtcc aggcaggtag atgacgacca tcagggacag cttcaaggat 24720
cgctcgcggc tcttaccagc ctaacttcga tcactggacc gctgatcgtc acggcgattt 24780
atgccgcctc ggcgagcaca tggaacgggt tggcatggat tgtaggcgcc gccctatacc 24840
ttgtctgcct ccccgcgttg cgtcgcggtg catggagccg ggccacctcg acctgaatgg 24900
aagccggcgg cacctcgcta acggattcac cactccaaga attggagcca atcaattctt 24960
gcggagaact gtgaatgcgc aaaccaaccc ttggcagaac atatccatcg cgtccgccat 25020
ctccagcagc cgcacgcggc gcatctcggg cagcgttggg tcctggccac gggtgcgcat 25080
gatcgtgctc ctgtcgttga ggacccggct aggctggcgg ggttgcctta ctggttagca 25140
gaatgaatca ccgatacgcg agcgaacgtg aagcgactgc tgctgcaaaa cgtctgcgac 25200
ctgagcaaca acatgaatgg tcttcggttt ccgtgtttcg taaagtctgg aaacgcggaa 25260
gtcagcgctc ttccgcttcc tcgctcactg actcgctgcg ctcggtcgtt cggctgcggc 25320
gagcggtatc agctcactca aaggcggtaa tacggttatc cacagaatca ggggataacg 25380
caggaaagaa catgtgagca aaaggccagc aaaaggccag gaaccgtaaa aaggccgcgt 25440
tgctggcgtt tttccatagg ctccgccccc ctgacgagca tcacaaaaat cgacgctcaa 25500
gtcagaggtg gcgaaacccg acaggactat aaagatacca ggcgtttccc cctggaagct 25560
ccctcgtgcg ctctcctgtt ccgaccctgc cgcttaccgg atacctgtcc gcctttctcc 25620
cttcgggaag cgtggcgctt tctcatagct cacgctgtag gtatctcagt tcggtgtagg 25680
tcgttcgctc caagctgggc tgtgtgcacg aaccccccgt tcagcccgac cgctgcgcct 25740
tatccggtaa ctatcgtctt gagtccaacc cggtaagaca cgacttatcg ccactggcag 25800
cagccactgg taacaggatt agcagagcga ggtatgtagg cggtgctaca gagttcttga 25860
agtggtggcc taactacggc tacactagaa ggacagtatt tggtatctgc gctctgctga 25920
agccagttac cttcggaaaa agagttggta gctcttgatc cggcaaacaa accaccgctg 25980
gtagcggtgg tttttttgtt tgcaagcagc agattacgcg cagaaaaaaa ggatctcaag 26040
aagatccttt gatcttttct acggggtctg acgctcagtg gaacgaaaac tcacgttaag 26100
ggattttggt catgagatta tcaaaaagga tcttcaccta gatcctttta aattaaaaat 26160
gaagttttaa atcaatctaa agtatatatg agtaaacttg gtctgacag 26209
<210> 149
<211> 23013
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic plasmid pCX096
<400> 149
ctcgggccgt ctcttgggct tgatcggcct tcttgcgcat ctcacgcgct cctgcggcgg 60
cctgtagggc aggctcatac ccctgccgaa ccgcttttgt cagccggtcg gccacggctt 120
ccggcgtctc aacgcgcttt gagattccca gcttttcggc caatccctgc ggtgcatagg 180
cgcgtggctc gaccgcttgc gggctgatgg tgacgtggcc cactggtggc cgctccaggg 240
cctcgtagaa cgcctgaatg cgcgtgtgac gtgccttgct gccctcgatg ccccgttgca 300
gccctagatc ggccacagcg gccgcaaacg tggtctggtc gcgggtcatc tgcgctttgt 360
tgccgatgaa ctccttggcc gacagcctgc cgtcctgcgt cagcggcacc acgaacgcgg 420
tcatgtgcgg gctggtttcg tcacggtgga tgctggccgt cacgatgcga tccgccccgt 480
acttgtccgc cagccacttg tgcgccttct cgaagaacgc cgcctgctgt tcttggctgg 540
ccgacttcca ccattccggg ctggccgtca tgacgtactc gaccgccaac acagcgtcct 600
tgcgccgctt ctctggcagc aactcgcgca gtcggcccat cgcttcatcg gtgctgctgg 660
ccgcccagtg ctcgttctct ggcgtcctgc tggcgtcagc gttgggcgtc tcgcgctcgc 720
ggtaggcgtg cttgagactg gccgccacgt tgcccatttt cgccagcttc ttgcatcgca 780
tgatcgcgta tgccgccatg cctgcccctc ccttttggtg tccaaccggc tcgacggggg 840
cagcgcaagg cggtgcctcc ggcgggccac tcaatgcttg agtatactca ctagactttg 900
cttcgcaaag tcgtgaccgc ctacggcggc tgcggcgccc tacgggcttg ctctccgggc 960
ttcgccctgc gcggtcgctg cgctcccttg ccagcccgtg gatatgtgga cgatggccgc 1020
gagcggccac cggctggctc gcttcgctcg gcccgtggac aaccctgctg gacaagctga 1080
tggacaggct gcgcctgccc acgagcttga ccacagggat tgcccaccgg ctacccagcc 1140
ttcgaccaca tacccaccgg ctccaactgc gcggcctgcg gccttgcccc atcaattttt 1200
ttaattttct ctggggaaaa gcctccggcc tgcggcctgc gcgcttcgct tgccggttgg 1260
acaccaagtg gaaggcgggt caaggctcgc gcagcgaccg cgcagcggct tggccttgac 1320
gcgcctggaa cgacccaagc ctatgcgagt gggggcagtc gaaggcgaag cccgcccgcc 1380
tgccccccga gacctgcaga tccacatcct tgaaggccgc agcgacgagc agaaggaaac 1440
cctcattcgg gaagtcagcg aggccatctc gcgctccctg gatgcgccgc tgaccagcgt 1500
gcgagtgatt atcacggaga tggccaaggg ccacttcggc atcggcggcg aactggccag 1560
caaggtcaga cgctgaagtg gagatgccca agggcacttc gggtcgagga acccgacctg 1620
cattgggacg cggccacgga gagcgcgggc aaacgccggc actatagcca gtggagtttg 1680
taaaacgcta tttcagagct tggagagtgt ctaagaaagc cggggcgatg ccaacccatc 1740
ccttcttcgg ctatgcatcg ttcgtaatca agccacttcc tttttgcatt gacgcagggt 1800
gtcggaaggc aactcgccga acgcgctcct atagttttca gcgaagcgtc ccaaatgtaa 1860
gaagccgtag tctagggcta tctcagttat actacgcaca ttggcactgg gatcgttcaa 1920
gcaggcgcgg atgctttcga gcttgcggtt gcggatgtag ttcttcggcg tggtgccggc 1980
atgcttctcg aacaaattgt agagcgagcg tggactcatc atcgccagct ccgctaaccg 2040
ctcaaggctg atattccgtt tgagattctc ctcaatgaat tgaacgactc gctcgaaaga 2100
cgggttacct ttgctgaaaa tttcacggct gacattgctg cccagcattt cgagcagctt 2160
ggaagcgatg atccccgcat agtgctcttg gacccgaggc atcgactttg tatgttccgc 2220
ttcgtcacaa actaacccga gtagattgat aaagccatcg agttgctgga gattgtgtcg 2280
cgcggcgaaa cggataccct ccctcggctt gtgccaattg ttgtcactgc atgcccgatc 2340
aaggaccact gagggcaatt taacgataaa tttctcgcaa tcttctgaat aggtcaggtc 2400
ggcttggtca tccggattga gcagcaatag ttcgcccggc gcaaaatagt gctcctggcc 2460
atggccacgc cacaggcaat ggcctttgag tattatttgc agatgataac aggtctctaa 2520
tccaggcgag attaccctca cgctaccgcc gtagctgatt cgacacaggt cgaggcatcc 2580
gaagattctg tggtgcagcc tgcctgccgg gcgcccgccc ttgggcaggc gaatagagtg 2640
cgtaccgaca tactggttaa cataatcgga gactgcatag ggctcggcgt ggacgaagat 2700
ctgacttttc tcgttcaata agcaaaaatc catagttcac ggttctctta ttttaatgtg 2760
ggctgcttgg tgtgatgtag aaaggcgcca agtcgatgaa aatgcatctc gacgtgatgc 2820
gtatacgggt tacccccatt gccacgttgc gccatccttt ttgcaatcag tgaccacttt 2880
tccaagcaaa aataacgcca agcagaacga agacgttctt tttaagaagc gagaacacca 2940
gaagttcgtg ctgtcggggc atgcggcgac gaattggcgg ataaagggga tctgcaggtc 3000
ccgagcctca cggcggcgag tgcgggggtt ccaagggggc agcgccacct tgggcaaggc 3060
cgaaggccgc gcagtcgatc aacaagcccc ggaggggcca ctttttgccg gagggggagc 3120
cgcgccgaag gcgtggggga accccgcagg ggtgcccttc tttgggcacc aaagaactag 3180
atatagggcg aaatgcgaaa gacttaaaaa tcaacaactt aaaaaagggg ggtacgcaac 3240
agctcattgc ggcacccccc gcaatagctc attgcgtagg ttaaagaaaa tctgtaattg 3300
actgccactt ttacgcaacg cataattgtt gtcgcgctgc cgaaaagttg cagctgattg 3360
cgcatggtgc cgcaaccgtg cggcacccta ccgcatggag ataagcatgg ccacgcagtc 3420
cagagaaatc ggcattcaag ccaagaacaa gcccggtcac tgggtgcaaa cggaacgcaa 3480
agcgcatgag gcgtgggccg ggcttattgc gaggaaaccc acggcggcaa tgctgctgca 3540
tcacctcgtg gcgcagatgg gccaccagaa cgccgtggtg gtcagccaga agacactttc 3600
caagctcatc ggacgttctt tgcggacggt ccaatacgca gtcaaggact tggtggccga 3660
gcgctggatc tccgtcgtga agctcaacgg ccccggcacc gtgtcggcct acgtggtcaa 3720
tgaccgcgtg gcgtggggcc agccccgcga ccagttgcgc ctgtcggtgt tcagtgccgc 3780
cgtggtggtt gatcacgacg accaggacga atcgctgttg gggcatggcg acctgcgccg 3840
catcccgacc ctgtatccgg gcgagcagca actaccgacc ggccccggcg aggagccgcc 3900
cagccagccc ggcattccgg gcatggaacc agacctgcca gccttgaccg aaacggagga 3960
atgggaacgg cgcgggcagc agcgcctgcc gatgcccgat gagccgtgtt ttctggacga 4020
tggcgagccg ttggagccgc cgacacgggt cacgctgccg cgccggtagc acttgggttg 4080
cgcagcaacc cgtaagtgcg ctgttccaga ctatcggctg tagccgcctc gccgccctat 4140
accttgtctg cctccccgcg ttgcgtcgcg gtgcatggag ccgggccacc tcgacctgaa 4200
tggaagccgg cggcacctcg ctaacggatt caccgttttt atcaggctct gggaggcaga 4260
ataaatgatc atatcgtcaa ttattacctc cacggggaga gcctgagcaa actggcctca 4320
ggcatttgag aagcacacgg tcacactgct tccggtagtc aataaaccgg taaaccagca 4380
atagacataa gcggctattt aacgaccctg ccctgaaccg acgaccgggt cgaatttgct 4440
ttcgactatc ggcgcgccag agctcatcgt taatgtcttc gtgcgccgtc agtcggcgca 4500
cgttttttct ctctggtacc gtgtcactga tctagtcaat tactcgaagt atccacaagt 4560
gaagcatact aagtaatgta caagaatcaa aaaaatcggc tacgcaagtc gcgtagccga 4620
atcatttaag gatccttcca ttcaggtcga ggtggcccgg ctccatgcac cgcgacgcaa 4680
cgcggggagg cagacaaggt atagggcggc gcctacaatc catgccaacc cgttccatgt 4740
gctcgccgag gcggcataaa tcgccgtgac gatcagcggt ccagtgatcg aagttaggct 4800
ggtaagagcc gcgagcgatc cttgaagctg tccctgatgg tcgtcatcta cctgcctgga 4860
cagcatggcc tgcaacgcgg gcatcccgat gccgccggaa gcgagaagaa tcataatggg 4920
gaaggccatc cagcctcgcg tcgcgaacgc cagcaagacg tagcccagcg cgtcggccgc 4980
catgccggcg ataatggcct gcttctcgcc gaaacgtttg gtggcgggac cagtgacgaa 5040
ggcttgagcg agggcgtgca agattccgaa taccgcaagc gacaggccga tcatcgtcgc 5100
gctccagcga aagcggtcct cgccgaaaat gacccagagc gctgccggca cctgtcctac 5160
gagttgcatg ataaagaaga cagtcataag tgcggcgacg atagtcatgc cccgcgccca 5220
ccggaaggag ctgactgggt tgaaggctct caagggcatc ggtcgacgct ctcccttatg 5280
cgactcctgc attaggaagc agcccagtag taggttgagg ccgttgagca ccgccgccgc 5340
aaggaatggt gcatgcaagg agatggcgcc caacagtccc ccggccacgg ggcctgccac 5400
catacccacg ccgaaacaag cgctcatgag cccgaagtgg cgagcccgat cttccccatc 5460
ggtgatgtcg gcgatatagg cgccagcaac cgcacctgtg gcgccggtga tgccggccac 5520
gatgcgtccg gcgtacaaga tccacaggac gggtgtggtc gccatgatcg cgtagtcgat 5580
agtggctcca agtagcgaag cgagcaggac tgggcggcgg ccaaagcggt cggacagtgc 5640
tccgagaacg ggtgcgcata gaaattgcat caacgcatat agcgctagca gcacgccata 5700
gtgactggcg atgctgtcgg aatggacgat atcccgcaag aggcccggca gtaccggcat 5760
aaccaagcct atgcctacag catccagggt gacggtgccg aggatgacga tgagcgcatt 5820
gttagatttc atacacggtg cctgactgcg ttagcaattt aactgtgata aactaccgca 5880
ttaaagccga gcgatgataa gctgtcaaac atgagatcca atctagattg tttaaacttc 5940
tgcagaacac gcggtgttaa cgtttcttat acttcttaat tttgttaaag atcatttcgc 6000
cgtagtacac cgcattgacc tgggtcttca ccagcaagta gccgcgaaat ttcttaaaca 6060
acttcatgtt cggtttaaag tcggcttgcc agaactgatg caaatgcccc tggtacgtca 6120
gacccttgat atcgtacaag gcgttgccca tgactttcag gggcttgttg tggatcaacg 6180
cggaaatgcc ggccgtgcta ttgatggtga ccaccgcttt ggcgtggcgc aacagctccg 6240
gcatgggcag atcgtgcaca tagatgacac gttcatccaa accgtattcc ttcgacagac 6300
gcttgatcaa cgggcggtac aggcggtgcc cgcgatccat cgggtgatgt ttgatcacca 6360
gataggactc cttgggggcc ttgcgggaaa agctgtacat cacttcgttg atgtaatcac 6420
gcacatcatt atagttgcta tggttgcgga tctggctgtc gttgtacact tgcaggaccg 6480
ccaggtaata gcgctgatcc agctcgttca tcaggcgggg gaggaccttg cgttgggtga 6540
ccttatacag ctgtttgcgc cagtaggcgc ggacccagca gcgcgcttca taccacgggc 6600
tgaacgattt gtggtggcga tagcgcggaa attcgtgacg atagtgccaa cccatcaggt 6660
aataccacat ggcgtggccg atgcgcttca tggtgctcgg tttcaggttc tcgacgtgcg 6720
gcgtcggcat atcgggcaat ttgcggtaaa agtccggatc gcggggcaag ctgctatagg 6780
cgttcacacc gccttcttcc acggtgataa attgcggacg caggtagcct tcctcgaagg 6840
ccagaaaacg aatccccttc gacttggccc agcgtttggc ctccttgtgc agcaggcggc 6900
agtcaccgaa acacaaaatc gtgtcaaagt catactgacg atgcaagtcc cgcagccaac 6960
cggggaactc cttcggggtt tggtagtacg ccaggtattg gcggtggcgg cagtagaagc 7020
gatcaccgcc attaaagacg acgttgaccg cgttgcgacc gaggctctcc aaccattccg 7080
ccacatcgtt gaagaacgga cccatcggac cttggagcag gaggtacttt ttaccgctca 7140
acagcaccgt cagcgcattg ccgtgcattt attaacctcc taacacgcgg tgttaagcgt 7200
tttcggcgag ctcttaacca aagcgcactt tgcagaacat gatcaacttg cgatagtagc 7260
gaatcacacg gccggctttc ttgcgggtga taaagatggg tttgcggggc gttttgatca 7320
gatattctgc cgcttcctcc accgtgatcg gctgcaaccg cgtcggatga atataggtgg 7380
gatagacaat cagggcttga tagatcaggt cggcgatggt cagccgccgc tcgcgacggg 7440
ggcagtggtg ctcatcgacg gtcaggcccc acgaggcgta gaacggcagg ccgtagcagt 7500
gcacctgttt accgtgcagc aatgcttcaa agccgctgag gctcgtcatc gtgtgcacct 7560
cgtccgcacg ctgaatacac tgaatgatat cggcatccag tgcctggtag tctgcgagtt 7620
ccgcgatctg ttccgccgga atgtcaccct tacggttgcc gacgagcaca tcggggtgcg 7680
gcttgtagat gatgtaggcg tgcggattac gttcccgcac ggtgcgcagc agctccagat 7740
tcgacttgat cgacacggtg cccgtcttaa tcgacgcatc gtcttccacc tggcccggca 7800
ccaggatgac tttcttgtcc ttcgcttctg ccgggaggct gaaatcggcc cccaggttat 7860
atttgctcaa tttgctttcc accagacgtt ggcgcaactt ttccgcgcgc atctggtgcg 7920
cgagggtcag ctggctgtga ttcagcagga cctccagttc cgacggacgg gtggcatcgt 7980
aatagatacc gcgcttatcc aggaccaggc tcaacggcgg cagcagatcg ctccccaggc 8040
cggagctgcg caggaagccg tcttccatgc gccacagcgg cagggatttg cgctgtgcct 8100
ccgcacgcca ttgctgttcg cctttcacgc cccacacgac gcaggcgctt gctgcggtac 8160
agcgacggga aaaggagaga cgattcgtgg ccgtttgcag gaagggcttc aggatcgcgc 8220
ttttccacag ggtcaggccc ggcacccaga gataaccatt ccgctgttgc aggtgacgac 8280
gttgcagctg gagccattgg agcaccgtga acagggccga cacctccccg gtctgcggat 8340
caatgtagcg gcaatagcgc agataggccg ctgcgaacag ttcctccagg gtggccgagc 8400
cgcgacgcgc cgacagcagc gccgattggg ggtggcggtc atcggtgagg ccccaccctg 8460
cataccaggg ttggccaaag caggtcacgg gcttaccggc cagcagggct tcaaaaccgt 8520
actgggaggt cacgacgtac acgcgggaca catgacgcag cagggactgc ggcgacacgt 8580
tttccgcaat caggcgcacg cgctgggtgg cacgcaagtc cgcgaagtag ccggtctttt 8640
tcccttccag gacatcggga tgcactttga cccagatttc tgcctgcggg ttttccgcca 8700
tcgctgcttc cagcattgcg gcgaactcat gggggcctgc gttgccgtag gtcacgctca 8760
tgtcattgaa ggtctggtcc accaccagca cgatgttcgt gcgctcgctt tcatccgcca 8820
cgaacgccgg tgccaggttg tacttgctca tgtcgcccgt cacaatggtg tgcatcgcct 8880
cgcgcgcctg atccgccagg gccgcgttgc cggccttgtc ctgcacgagt ttttccagcg 8940
cgctcggttt cgaggcgtcg tagtaaatgc cgcagtcatc cacgacgagc gagaggggcg 9000
gttcaccgtt cacgcccagg tccagcgagc ggacgaaacc atcctccaag cggatcaccg 9060
gcttgcctgc ggctttggcg atggccaccg gctttgcggc cgaggggcgg tgcccccaca 9120
ccgcgattgc atccacttcc tgcgggaccg ggcgcagcag cgacagcttt tggcagggct 9180
gggcgaggaa tttttccagg tgcggaatac gccaaatgcc ggggctataa atgccaatca 9240
tgcgttctcc gcgagctcct gcgccatcag ggcccggacc ttctccaagc acgccggggt 9300
atcgacgccg ggaccggtcg cggcgacctc gaaggtgcga atgttaatgc ccgcgctcat 9360
cagccgcagt tgctccaggg attcggcctg ttcgggcatg gactccggca actggctgta 9420
attttgcagg acatcccgcc gataggcgta gatcccgacg tgcttcaggt agcgcgcctt 9480
ctcggcgttg cgcgggtacg gaatggggga gcgggagaaa tacagggcgt cctgccgcgt 9540
gttcaccacg accttgacgg tggacggttc ggcggcttct gccgcgctga tcgcatgaca 9600
cagggtcgcc accggcagcg ccgggtcgtc ccgcatacct tgcagcaggg tttcgacgtc 9660
acgcgggcga atcatcggct catccccttg caggttgata tagatatccg cctccacctt 9720
atgcatgact tccaccaggc gatcggtgcc gctctcatga tcgttgcggg tcatgatcgc 9780
tttgccgccg aacgcctgga ctgcctgctc cacacgcggg tcgtcggttg cgacccacac 9840
ctctgccacg cctgccactt gcagggcccg ttcgtagacg tgctggatca tcggtttccc 9900
gacgatatcc agcagcggtt tgcccggcag acggctgctg ccgtagcgtg ccgggatcac 9960
aatcacggcc ttcgacattt attaacctcc tcgagttaca gcgacagaat cactttcgcg 10020
cccaccgcca gttggtacag aatggtgctg ataccgcgcg tcacttcgat gttcttcgac 10080
tcgtatttcg gcaacaccat aatttcatca ccgggtttca gggaatcgac gtcttctgcg 10140
ttcaccgctg cgccgttctg acggatgacg ataatacggg cgttgccgga cttctgggtc 10200
agcccaccgc acttctcgat gtagtcctcg gtcgtcatac ctttctgcca cgacaccgcg 10260
ttcgggaaca gcacttcccc gtggaccatg accaacgacg tcttttcggg aatattgatc 10320
acgtcgccgt cctccaggag gacggagtca atgttgcttt cattgaggat cacttcgccc 10380
ttcggcacga cggtgcgggc tttcgcgacg aagcgggaga tcagttgggc ttcctgcata 10440
cgcaggctgg cctcttcctt ggtgctgctc tgtgcgctga ggctggcctc ttcgagcttt 10500
tgcagggaca aattcagcat ttctttctgc cgttgcgcga cgctcggccg atacaactgc 10560
acggcgttca tctgcgacat ggagttcggg cgcacttttt cgagcacggc ccgcatggtg 10620
ctaccgtagg gcagcaccat ggcgtgttcc ccggaatgtg cgccttccac acgcacttga 10680
atggtgcccg catagcggtc ggtggagaca atgagggtat caccgttttg cagcatacgc 10740
cccggtgcgg acgagatcgg ataatattcc gagcgcttct ggaggccctg cttccgcata 10800
atcgtgatat gggtcgcacc cggtttggga cgtgcccagg acagtgcttc ggtgaccggg 10860
atgctcgatt cgcgaaattc aaagtcgtag gaattgaaca catcgccctg caccgagaac 10920
gtatgctggc gcggacccac aatgatcgta tcaccgtccg caaactggga cagccccagt 10980
ttgccgttga gcaggaagtc atagaggttg acgttcgagc gcacacgatt gccgcgtttc 11040
acgacgatgt ccacgtagct gccgcgttcc gggtccacac cacccgcctt gatcaggtag 11100
ttcagcaggc tgtcggaggt gacaccgccg tacaggccgg ggttgcggac aaagccggtc 11160
acatagacct tgaccggctg cgcctgcaag agcgacgcat agacgttcac gttgctctgg 11220
tagacttcct tcaccttgct cgtcaccagc gcgttcaact gggagttcga cacacctgcg 11280
actttgacgg ggccgacatt cggcaggaag atgttgccct tcgggtccac ctggagtgcg 11340
ccatcgaagg tgaacgcacc ccacaggcgg acctggatgg aatcgccggg attcaggatg 11400
tagtccggat tgaaacccac ggttgccccc gagtctgcgc tcgtaccgtt gaacagctgc 11460
gccccgaaca tacggctcat cacgaccggg ggtgcggggg gcggggtgtt atcgaagccg 11520
ctcatgttct gggtgtcgct tttctgcccg ttcaggatgc cggtcaacgg tgcggcaccc 11580
gtgaggttcg gatcggcatt aatgtcgatg gttgcgctcg cctgtgctgc atggcacgct 11640
gcgatcagca ggatcgactt aaacagcttc atttattaac ctcctcgaga agtcgactta 11700
gtcacggtgg tcttcaatca ccgccaggag caatttcagg gtgccaaaga gcaggcaaca 11760
caccagcagc caacacgcga tcaaatacgg gatattcggg aaggagcttt cctggggcag 11820
ctgcggggac gagatcacgc tcaggacttt cagcttacgg gccgcttcga cacgggtctt 11880
ttcgatgctg gtgagcgtga gcttgtacaa ctcggtattg aactcgacct tggatttgat 11940
ctcctcaaaa tccacggcca tgcggttcag tttatcgccc tggggtgcgg taattttcga 12000
cttttcttcg tcgatctgtg cctggaggct ctgaattgca ttgcgggcgc tcacgacttg 12060
gggcgcatcc tcgcgcaggt acgtgagcag gttgcgcagg tcggcttcca tctgaatttt 12120
ctggcccatc agcgtattca ccagggtgga tgccgcctgg gcctgtgcct gcgggtccag 12180
cacattgttg ttgtcttggt aggacaacaa ttcggctttc gatgcatcca gccgctggcg 12240
cgctttttcc atttcggttt ccgcaaacgc caattgatcg cgggcgatac ggtgcgacat 12300
ttcattgatg aaccgctcgg attccttgag cacggtctgg ttgaatttca gcgcgaactc 12360
gggcgaaaag ccctgggtct ggatgttcag cagcccggtc ttgtcgtcgt agctgacgtt 12420
gatgcgatct ttatagtact tcaggaaccc ctcggcggtt tcatccttgg acagatggtt 12480
caggaagtcc aggcccgaat gggagaacgc ttcgcggaag ttcagctgtt tatccagcgc 12540
ggccagcata tccgggctgt tgatgtattc cttcaggtac agtgcgtctt cggcggacga 12600
cgggttggag gcacccaaca gcaggccgaa gttcaggctg ccggagttga gatcgtcgct 12660
gcgcttgatg gccaccttgc tttccgacat atagcggggc tgggagaaga tcgccaagta 12720
gatcagcagc accgccatgg gtgccagaat aatgattttt gccaggtgct tctgaatatc 12780
tgccaggctg atcgcgctca gacgcgcacg catccacgag acggcgcttt tcactttgat 12840
cagcatttat taacctcctg tcgacaacac gtgttaatcg aaaatgcgca ccaacccggt 12900
caccttattt gctttgttgg tcaccagcag ggtcgagacg cggtgtttct gcatcttctc 12960
ttctgcttcg atgatcatgg tgtcttcggg caaggtcagc ggttcgcggg tcatcatctg 13020
tgcggccgtt gcgctcgtca ggctgtcttc tttctccata aagcgccgca gatcgccatc 13080
ggtgatgatg cctgccagcc caccttccgc atcttcgacc atcaccatac cctggcagcc 13140
cgaggtgatg cgctgaatga ccgttttgaa gctggcatcg agctgcactg ccggcacatc 13200
atgttgcatc acgtcggcga cgcgggtcag caggcgccga cccaggctgc caccggggtg 13260
gtagcgtgca aagtcattgg gcataaactt acgctggtga atcatcgcga tggccagcgc 13320
gtccccgatc gccatcgtga gcgtcgtgga ggtggtcggg gcgagattgt tcgggcacgt 13380
ttcgttcgcc atgtgcagct ccaggaccgc atctgcattt ttggccaggg tgctattccc 13440
gttattggtg attgcgatga tgcgattgcc gaagttcttc aggctcggca ccagtttcag 13500
gatctcgtcc gtctcaccgc tcgccgaaat caagatgagc aggtcatacg gggtgatcat 13560
gcccagatca ccatggaacg cttccgccgg atgaataaag aaggagggcg tcccggtcga 13620
ggccaaggtc gccgacatct tgcggcccac atggccgctt ttacccatgc cgctcaggat 13680
gacgtgccct ttacaattca tgatgagatt caggacgcgc tggtactgac cgctatccag 13740
ttgtttggac aggttttgca gtgccgcgct ttgttcggcc agggtctggc ggacgctcgt 13800
aatcagatac ggatcaatgg tcgaggactg gtcatccggc aagtggcgtt cgctcattta 13860
ttaacctcct cacgtgttaa ttaatgtttc tgttgcataa agcctaaggg gtaggccttt 13920
ctagagatag ccattttttg cactcctgta tccgcttctt gcaaggctgg acttatccct 13980
atcaaaccgg acactgcatc gattgataga tttaaataag aactgcagaa gctagcttag 14040
atgctcgtga aattgacgtg ggcgctttgc agggccgtct taatggcgtt ggtgtccacg 14100
aggatcgagt cgggtgcgga aaacggacgg ttcttgttgg tgaaatcgct gttaccaatg 14160
tacagcgatt ccttgttacg cagcgcctgg atgtgccagc gggaccacga atcccaatac 14220
ttctggcgat ccggcgagat accttggctg gtgtagccgg tcgtcgggct gttcatcaac 14280
gagtcggtgc ggtgcgagcc cagcgtcagc ggcaacttga tccgatgcac cgtggaatcg 14340
ccgaagatca gcttcagacg cgcgataaat tcgctatccg cacccgtttt cacacaatcc 14400
cagacaccgg ccttctgcaa gacgtcggca cggcgaaaca ggagcgacga cggattcaga 14460
cgcttcaagg ggtacactgc gcgggcatag aaaataccgt tgtcttgcag gcgcacccag 14520
tccgagatgg agcagatgag cttcggattg agcaacaagg gggagatttg gcggaacagc 14580
ttttccggat ggctccagtc atccgaatcg tggcaggtga cgaactcgcc cttcgcttgg 14640
atcaagccga tacgcttcgc ggcataggtg ccgacattct gcggcaggct aatgatcttg 14700
atgcgcgtgt ctttgagggc gagccgctgg agacgaaaca gggtgtcatc ggtgctcgcg 14760
tcatccacaa tgatcagctc gaaggaacgg taggtctgat tgaggagcga aatcaccgca 14820
ttttccacgc ggcgacccgt attataggtg gtcatcagga tggagatcaa cggccccgtc 14880
tgggccgggt acgggatgct ggtgatgatg ttgcacgggg agagcgggga gctgttgtcc 14940
gtcaaggcca cggggctgag gccgaagtat ttatagtatt cattcagccg attcaggcta 15000
atttcggcgg tttcgcggaa ggcgttattt tgcagcagca ggatatccgg gctatagacg 15060
atatcggatg cgtcgatctg ggcgagggtc gagatggcct tttgggtcag gccgatccgg 15120
agttgcagtg cggtatacag gtccagcggg cagttgtcca cgttgtccaa caggctcagg 15180
ctaaaggtcg gcgagtagga cgccagggtt ttcgccagtt ccactttctg atgggtatcg 15240
gtgaactcgt ccttgaactc catcagcagc tcgggcgtca ggctgatgtc gccgcaggcg 15300
atttttgcga tcttgattgc cagtttgcag cgccaatcgg acggggtatc cgtcaagtta 15360
tgcagcgacc agtacatatt cagacgatac atcgcgagga tgcgtttcga ctgccagaac 15420
cggcaatcat cctggatggc cgcgagcgcg tggacgtagc ggctcttttt gagcagccac 15480
aagaatttga gattattgaa catttattaa cctcctgcta gcaacttaag ttacgaatcg 15540
acgccgaaca ggtcgcgggt gtagactttc tccgagacat cttccagttc gctggtgcgg 15600
cgattcgcca caatgacatc gacgcgctcc ttaaaggaat tgatgtcgcg ctcgacgtag 15660
gaaccgaaga agtagggttc tttcaggacc ggctcgtaca ccacaatctc gatacccttg 15720
gccttcaaac gtttcatgac cccctggatg ctgctggccc ggaaattgtc gctacccgcc 15780
ttcatgatca ggcgatagat accgaccact ttgggcttac gggacaggat gtcctcggcc 15840
acgaagtcct tacgggtcgt attcgcatcc acgatggcct ggatcaggtt ttgcgggacg 15900
tcgcgataat tggccaacag ctgcttcgta tccttcggca gacagtaacc gccgtagccg 15960
aaggacgggt tgttgtaatg ttgaccaatg cgcggatcga gggagacgcc ttcgatgatt 16020
tgtttggtat ccaggccgtg cacgctcgcg taggtgtcca gctcgttaaa gtacgcgata 16080
cgcatcgcca gatacgtgtt cgcgaacagt ttgatggctt ctgcctcggg cgaatccgtc 16140
agcaggatcg gaatatcctt tttgatggca ccttccgaca ggagttcggc gaacttccgt 16200
gcgcgttccg acgattcgcc cacgacaatg cggctcggat agagattatc atacagggct 16260
ttgccttcgc gcaggaactc cggggaaaag atgatattat tcgtgttcag atcgcgcttc 16320
aggcgttcgg tgaacccgac ggggacggtg gatttgataa tgatggtcgc gttcgggtta 16380
atggacagca cgtcacacgc gacgctttcg acgctcaggg tatcaaagtt gttattaatc 16440
ggatcatagt tcgtcggggt ggcgatgatc acgtagtctg catcgcgata tgcctcgtat 16500
ttttccgtcg tcgcgtagag gttcagctta cgattggaga gaaacttctg gatttccggg 16560
tcgcaaatcg gcgagatttt cttgttaatg agctggacct tcttcgggtc gatgtccagg 16620
gcgatgatgt cgtgtttttg ggagaggagg atcgcaatgc tgatacccac atagccgacg 16680
ccggccacgg caattttcat ttattaacct ccttaagtga attcaaacta gtttacaagt 16740
cgttttcgat cttctcccag gtatatttgc gacattcatt caagttggtc agcggcgagt 16800
atttgtactt tttgataccg aggcgcgaca ggctttcgtt caccaccttg aaatggtttt 16860
ccttttggat gtccagtttc ttgatcgacg tgttctcgcc gtgcaggaca cggttgtagc 16920
aaatcttatt gatatgctta aacgggccga cttcgctgag tttcaaatac atatcgtaat 16980
ccaccgcatt gctgatgctc tcgttgaagc cttcggtgag gttccatgca cgcgccgtga 17040
acatacggaa gtggtggcag atcatcgcgc tcgtgagctt ttcgcggctg taaatcggcc 17100
agttgtagcc attgctaatc aagttacctt cacgatcaat attgcgattg gtggtgtaca 17160
cgcaggcgag gctcaggtct ttgcgaaatt catccagaca cagttccacg gcatcgggct 17220
ccaggaaatc atcggaatcc agctgcccga tgtagaaacc ccggcacagg cggactgcgg 17280
tattcgaggc ggagccgatg cctttgtttt tctggctgat gaaacggacg cgcgggtggt 17340
ttgcgtaatg ttcttgcagg atgcgcagcg tatcatcggt gctcccgtca tcgcagatgc 17400
agacctccag atcggtgatc gtttggttca gtgccgattc gacgcagcgc acgatatatt 17460
tgctgcaatt atacgcgggg atgtagatgc tcaccagggg cacacgtttc agggtggcgc 17520
tctcgatttt ctccttcttg cgataaaagt agggcacctt ctgctgcaac agctggacgg 17580
taatgttttt acctgccgcg cgatcggttt cgttctcctt accgggcggt tcctgatgat 17640
atgccatcgc gccttccacg ctacggaaat aacaaccctc gcggtacagc cgatagccga 17700
actcattatc ctcaccgccc caatgcgtga actcttcgtc aaaccaaccc gcgcgaaaca 17760
gccacttctt tgcaaacgcc acattgccac cgctaaagaa ccggaacggg gtgttgcaca 17820
ggcgcagatt gtcggtattc ttgaaatgtt cgatgcgcca atcgacggat ttgttctgct 17880
cgaccttgcc tgcgacctga ttattggtaa taatctccgg gatttcattg atcaggcttt 17940
tctgggacaa aaagtccaga taggtatgct tcgacgtgtc gatgtattta cgcgggccaa 18000
tcagtgccac gttatcatcc acggccagga gttccatata ggactgcacc cacaacgggt 18060
tcggcgccat atcgcagtcc aagatcgcca cgtagttgta tttcgctgcc cgcaggccca 18120
ggttccgcac ggcgcacagc tggtagccgt agtctttctg gcggacgtat ttgatgttca 18180
gcaacgactc gaactcgcgg acgatctctt cgatgttttc cttggaaccg tcatccgcga 18240
cgatgacctc atagtcataa atcgttttct gattgcagag gcaggccagg gtgatcgcca 18300
ggattttggc gcgattgtac gtcggaatca cgatggacag gccgtcgatg atcagttgct 18360
tgcgcggata atcatccagt tctttacgtt tccctgccca gacgtagtcg ttcgtgcttt 18420
ccggcagcgg cggcaaggtc aggtcgctcg gccaatccag cggaatgggt tcgacttctt 18480
tcaattcggc gcgctcggat ttctttgcgg taatttcccg atatttgcta atgatttcat 18540
tcttttccac ctcattcagc gagatcgcct ttgcattgct gcacataatt ttggttgccg 18600
cgtcgatatc aatgaccgct ttccgattca gcttgtccac ttcttcgctc agattcaggg 18660
cggtttggca cagcttgata ttggcttcca cccagctcac atcatagatt tccgccactt 18720
tttcaaacag ggagagggct tggcggtagt tcttattctt atacagattg attgcctggt 18780
tcaaaatgct catttattaa cctcctacta gtgaattttc gaattactta ccgcagtact 18840
tgacacccac ctgggaattg tttttggtgc gtttgaattg gcggatggta cggtagatgc 18900
taaagggcag gctgatcaga ccgagcggaa aattgttctt attgatgatg agcttgccca 18960
gctgatagct caggtgtttc ttgacccgtt cggcttcgtg tttatccgcg tacaggaaga 19020
tgctcggcag gctcacttgg tactccgaat catatttctt cttccaggtc cgccattcgc 19080
tgatcaacgc aaacggaatc gagatcagac cgaggaacgt cttggagcgg ctcaccatca 19140
ccgcacccag gcggtagccg atatcttgct tgatgcgttc ggccgcacca tacagctccg 19200
gcagttgttt cttttcgaga cgttgattgt cgatgaagta ctgttcgagc ttttgctgca 19260
ccagatgcag ctgattgagc agcaattctt tttcgcacga cagcttttcg aggcgctgtt 19320
gttgcagttc atttttgttc tgttcctttt tcagcaggga ctcgaagttc tcgatcgcgc 19380
actccagttc ctggacctgg atggttttgt ttttaatgat cagatcatac tggatcagtt 19440
cttccttgct atccgacagc tctttcagaa tggcttgata ggcgttcagc tgtttggacg 19500
tgtgcagttc gttgtccaga atgatctttt tgctgctctg gtacagaccg ttcacgatat 19560
cgagggtgat ctggcgttgt ttaatgaacg tctcccaaat aaaggacggc ttatagtttt 19620
ccttctccag cacccgcaag ggggtgttgg cgttcgattg caattcaaag tacagttcct 19680
tgcaatcggg atagtcgttc aggacgttga agatcaagta ctcctccgtc tcgctttgct 19740
tgaaaatgat atccccggtc ccgatgtcaa taccgctgag ggacatgatc tcctgatgtt 19800
ctttttccag cgtaatggag gcttcggcgg tcttaaagtc attcacgctc tgctccagcg 19860
agtggttgat ggtattggag aacgacaacc cgaatttcag tttcagtttg tgttgcagtt 19920
gctggatgca gtcctcggcg ttgcgcttca cctgttcgct cgacaccagc aggcaccgac 19980
cccggttgtt gaggaagaag tgcagcaagg cggtgttgta tgccagccag tttttgatca 20040
gatgctccga ggtatagttg ctggagatgt tctggtccga gaagtagttc gtcaggatgc 20100
ttttggggtg gtcgtagatg aggataaagg tgatgttctc atccaccgat ttccaatatt 20160
ccaacgtgtg aattgcgttg gggtcgctcc aaccgcacag tttctggttc aggttggaca 20220
gcatcagatc caatgcgata ccgttccaga cggtgctcac atggagcggt tcaaagtcgg 20280
cggaatcggt caccgtatag atgtccggcg actggtacgc cttccgcagc gtctgggtga 20340
tgtcctgggg cgagaggttc tcacgtttgg acgggcacag ggagttcatg ccgcgctgat 20400
gcaggagttc ttccacgatt tggtagttgc tgctcggatg gcccacgatc accaggcggt 20460
tcatttatta acctcctttc gaaaatgaac ggtccgttaa atatagccat tcggattctt 20520
catctgccag cgccaggcgt cctccagcat ggtttcgagt tcccgcttgg ctttccagtt 20580
cagatatttg ttggcctttt cgggggagga ccagctctcc gcgatatcac cgtcacggcg 20640
gctcacgatt tcatacggaa tccgcacgcc ggaaatcttt tcaaaggtgg acaccagttc 20700
cagcaccgaa taacctttac ccgtgcccaa attaaagacg tggtagttgg tgttattgtc 20760
gcggaagaga taggacagcg ctgcgacgtg cccttcggcc aggtccatca catggatata 20820
gtcacggacc cccgtgccgt ctttggtggg ataatcacca ccgaacacca tcagtttttc 20880
cagtttcccc atcgcgacct gcaagatgta cggcaccaag ttggagggga tgtctgccgg 20940
gctttcacca atcataccgg attcgtgggc gcccgtcgga ttaaagtagc gcaagcagag 21000
gaaattcgtg tcggagtatt tcttggcgat gtcgcggatc atcagctccg agatgtactt 21060
ggacgtacca tacggattca gcgtgccacc aatatggcag tcttcggtga cgggcatgat 21120
cttgctttcc ccatacaccg tcgccgacga gctaaagatg aagttggcga cgtcgttctt 21180
gatggcgcaa ttgatgagtt gcagggtgcc gctcacgttg ttgtcatagt agaagatggg 21240
cttgatcagg ctttctgcga ccgatttcgc acctgcaaag tgcatgatgc agtcgaattt 21300
gtgtttcttc aggatctggt tcacttcctt ctcgttgttg atattgagtt cgtagaacgt 21360
gactttcttc tttgcgatca gctcaatgcg acggatgctt tcgcagctgc tgttgatgag 21420
attgtcaatg atgacgacat tgtagccttt gttcagcagg cagagcgacg tgtggctgcc 21480
gatgtagcct gcaccgccgg tgaccaggat gttcatttat taacctcctc ggtccgaatt 21540
aacctaggtt atgaggtcag cattgcttct tcacgcggga ttattgtttc tgttgcataa 21600
agcctaaggg gtaggccttt ctagagatag ccattttttg cactcctgta tccgcttctt 21660
gcaaggctgg acttatccct atcaaaccgg acactgcagg ctgacaagct ttcattacat 21720
atgaagagtt tgtagaaacg caaaaaggcc atccgtcagg atggccttct aagaaggctc 21780
gagtggcgcg cctaagtcga atttctgcca ttcatccgct tattatactt attcaggcgt 21840
agcaccaggc gtttaagggc accaataact gccttaaaaa aattacgccc cgccctgcca 21900
ctcatcgcag tactgttgta attcattaag cattctgccg acatggaagc catcacagac 21960
ggcatgatga acctgaatcg ccagcggcat cagcaccttg tcgccttgcg tataatattt 22020
gcccatggtg aaaacggggg cgaagaagtt gtccatattg gccacgttta aatcaaaact 22080
ggtgaaactc acccagggat tggctgagac gaaaaacata ttctcaataa accctttagg 22140
gaaataggcc aggttttcac cgtaacacgc cacatcttgc gaatatatgt gtagaaactg 22200
ccggaaatcg tcgtggtatt cactccagag cgatgaaaac gtttcagttt gctcatggaa 22260
aacggtgtaa caagggtgaa cactatccca tatcaccagc tcaccgtctt tcattgccat 22320
acggaattcc ggatgagcat tcatcaggcg ggcaagaatg tgaataaagg ccggataaaa 22380
cttgtgctta tttttcttta cggtctttaa aaaggccgta atatccagct gaacggtctg 22440
gttataggta cattgagcaa ctgactgaaa tgcctcaaaa tgttctttac gatgccattg 22500
ggatatatca acggtggtat atccagtgat ttttttctcc attttagctt ccttagctcc 22560
tgaaaatctc gataactcaa aaaatacgcc cggtagtgat cttatttcat tatggtgaaa 22620
gttggaacct cttacgtgcc gatcaacgtc tcattttcgc caaaagttgg cccagggctt 22680
cccggtatca acagggacac caggatttat ttattctgcg aagtgatctt ccgtcacagg 22740
tatttattcg gcgcaaaggg cctcgtgata cgcctatttt tataggttaa tgtcatgata 22800
ataatggttt cttagacgtc aggtggcact tttcggggaa atgtgcgcgc ccgcgttcct 22860
gctggcgctg ggcctgtttc tggcgctgga cttcccgctg ttccgtcagc agcttttcgc 22920
ccacggcctt gatgatcgcg gcggccttgg cctgcatatc ccgattcaac ggccccaggg 22980
cgtccagaac gggcttcagg cgctcccgaa ggt 23013
<210> 150
<211> 16462
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic plasmid pCX101
<400> 150
ctcgggccgt ctcttgggct tgatcggcct tcttgcgcat ctcacgcgct cctgcggcgg 60
cctgtagggc aggctcatac ccctgccgaa ccgcttttgt cagccggtcg gccacggctt 120
ccggcgtctc aacgcgcttt gagattccca gcttttcggc caatccctgc ggtgcatagg 180
cgcgtggctc gaccgcttgc gggctgatgg tgacgtggcc cactggtggc cgctccaggg 240
cctcgtagaa cgcctgaatg cgcgtgtgac gtgccttgct gccctcgatg ccccgttgca 300
gccctagatc ggccacagcg gccgcaaacg tggtctggtc gcgggtcatc tgcgctttgt 360
tgccgatgaa ctccttggcc gacagcctgc cgtcctgcgt cagcggcacc acgaacgcgg 420
tcatgtgcgg gctggtttcg tcacggtgga tgctggccgt cacgatgcga tccgccccgt 480
acttgtccgc cagccacttg tgcgccttct cgaagaacgc cgcctgctgt tcttggctgg 540
ccgacttcca ccattccggg ctggccgtca tgacgtactc gaccgccaac acagcgtcct 600
tgcgccgctt ctctggcagc aactcgcgca gtcggcccat cgcttcatcg gtgctgctgg 660
ccgcccagtg ctcgttctct ggcgtcctgc tggcgtcagc gttgggcgtc tcgcgctcgc 720
ggtaggcgtg cttgagactg gccgccacgt tgcccatttt cgccagcttc ttgcatcgca 780
tgatcgcgta tgccgccatg cctgcccctc ccttttggtg tccaaccggc tcgacggggg 840
cagcgcaagg cggtgcctcc ggcgggccac tcaatgcttg agtatactca ctagactttg 900
cttcgcaaag tcgtgaccgc ctacggcggc tgcggcgccc tacgggcttg ctctccgggc 960
ttcgccctgc gcggtcgctg cgctcccttg ccagcccgtg gatatgtgga cgatggccgc 1020
gagcggccac cggctggctc gcttcgctcg gcccgtggac aaccctgctg gacaagctga 1080
tggacaggct gcgcctgccc acgagcttga ccacagggat tgcccaccgg ctacccagcc 1140
ttcgaccaca tacccaccgg ctccaactgc gcggcctgcg gccttgcccc atcaattttt 1200
ttaattttct ctggggaaaa gcctccggcc tgcggcctgc gcgcttcgct tgccggttgg 1260
acaccaagtg gaaggcgggt caaggctcgc gcagcgaccg cgcagcggct tggccttgac 1320
gcgcctggaa cgacccaagc ctatgcgagt gggggcagtc gaaggcgaag cccgcccgcc 1380
tgccccccga gacctgcaga tccacatcct tgaaggccgc agcgacgagc agaaggaaac 1440
cctcattcgg gaagtcagcg aggccatctc gcgctccctg gatgcgccgc tgaccagcgt 1500
gcgagtgatt atcacggaga tggccaaggg ccacttcggc atcggcggcg aactggccag 1560
caaggtcaga cgctgaagtg gagatgccca agggcacttc gggtcgagga acccgacctg 1620
cattgggacg cggccacgga gagcgcgggc aaacgccggc actatagcca gtggagtttg 1680
taaaacgcta tttcagagct tggagagtgt ctaagaaagc cggggcgatg ccaacccatc 1740
ccttcttcgg ctatgcatcg ttcgtaatca agccacttcc tttttgcatt gacgcagggt 1800
gtcggaaggc aactcgccga acgcgctcct atagttttca gcgaagcgtc ccaaatgtaa 1860
gaagccgtag tctagggcta tctcagttat actacgcaca ttggcactgg gatcgttcaa 1920
gcaggcgcgg atgctttcga gcttgcggtt gcggatgtag ttcttcggcg tggtgccggc 1980
atgcttctcg aacaaattgt agagcgagcg tggactcatc atcgccagct ccgctaaccg 2040
ctcaaggctg atattccgtt tgagattctc ctcaatgaat tgaacgactc gctcgaaaga 2100
cgggttacct ttgctgaaaa tttcacggct gacattgctg cccagcattt cgagcagctt 2160
ggaagcgatg atccccgcat agtgctcttg gacccgaggc atcgactttg tatgttccgc 2220
ttcgtcacaa actaacccga gtagattgat aaagccatcg agttgctgga gattgtgtcg 2280
cgcggcgaaa cggataccct ccctcggctt gtgccaattg ttgtcactgc atgcccgatc 2340
aaggaccact gagggcaatt taacgataaa tttctcgcaa tcttctgaat aggtcaggtc 2400
ggcttggtca tccggattga gcagcaatag ttcgcccggc gcaaaatagt gctcctggcc 2460
atggccacgc cacaggcaat ggcctttgag tattatttgc agatgataac aggtctctaa 2520
tccaggcgag attaccctca cgctaccgcc gtagctgatt cgacacaggt cgaggcatcc 2580
gaagattctg tggtgcagcc tgcctgccgg gcgcccgccc ttgggcaggc gaatagagtg 2640
cgtaccgaca tactggttaa cataatcgga gactgcatag ggctcggcgt ggacgaagat 2700
ctgacttttc tcgttcaata agcaaaaatc catagttcac ggttctctta ttttaatgtg 2760
ggctgcttgg tgtgatgtag aaaggcgcca agtcgatgaa aatgcatctc gacgtgatgc 2820
gtatacgggt tacccccatt gccacgttgc gccatccttt ttgcaatcag tgaccacttt 2880
tccaagcaaa aataacgcca agcagaacga agacgttctt tttaagaagc gagaacacca 2940
gaagttcgtg ctgtcggggc atgcggcgac gaattggcgg ataaagggga tctgcaggtc 3000
ccgagcctca cggcggcgag tgcgggggtt ccaagggggc agcgccacct tgggcaaggc 3060
cgaaggccgc gcagtcgatc aacaagcccc ggaggggcca ctttttgccg gagggggagc 3120
cgcgccgaag gcgtggggga accccgcagg ggtgcccttc tttgggcacc aaagaactag 3180
atatagggcg aaatgcgaaa gacttaaaaa tcaacaactt aaaaaagggg ggtacgcaac 3240
agctcattgc ggcacccccc gcaatagctc attgcgtagg ttaaagaaaa tctgtaattg 3300
actgccactt ttacgcaacg cataattgtt gtcgcgctgc cgaaaagttg cagctgattg 3360
cgcatggtgc cgcaaccgtg cggcacccta ccgcatggag ataagcatgg ccacgcagtc 3420
cagagaaatc ggcattcaag ccaagaacaa gcccggtcac tgggtgcaaa cggaacgcaa 3480
agcgcatgag gcgtgggccg ggcttattgc gaggaaaccc acggcggcaa tgctgctgca 3540
tcacctcgtg gcgcagatgg gccaccagaa cgccgtggtg gtcagccaga agacactttc 3600
caagctcatc ggacgttctt tgcggacggt ccaatacgca gtcaaggact tggtggccga 3660
gcgctggatc tccgtcgtga agctcaacgg ccccggcacc gtgtcggcct acgtggtcaa 3720
tgaccgcgtg gcgtggggcc agccccgcga ccagttgcgc ctgtcggtgt tcagtgccgc 3780
cgtggtggtt gatcacgacg accaggacga atcgctgttg gggcatggcg acctgcgccg 3840
catcccgacc ctgtatccgg gcgagcagca actaccgacc ggccccggcg aggagccgcc 3900
cagccagccc ggcattccgg gcatggaacc agacctgcca gccttgaccg aaacggagga 3960
atgggaacgg cgcgggcagc agcgcctgcc gatgcccgat gagccgtgtt ttctggacga 4020
tggcgagccg ttggagccgc cgacacgggt cacgctgccg cgccggtagc acttgggttg 4080
cgcagcaacc cgtaagtgcg ctgttccaga ctatcggctg tagccgcctc gccgccctat 4140
accttgtctg cctccccgcg ttgcgtcgcg gtgcatggag ccgggccacc tcgacctgaa 4200
tggaagccgg cggcacctcg ctaacggatt caccgttttt atcaggctct gggaggcaga 4260
ataaatgatc atatcgtcaa ttattacctc cacggggaga gcctgagcaa actggcctca 4320
ggcatttgag aagcacacgg tcacactgct tccggtagtc aataaaccgg taaaccagca 4380
atagacataa gcggctattt aacgaccctg ccctgaaccg acgaccgggt cgaatttgct 4440
ttcgactatc ggcgcgccag agctcatcgt taatgtcttc gtgcgccgtc agtcggcgca 4500
cgttttttct ctctggtacc gtgtcactga tctagtcaat tactcgaagt atccacaagt 4560
gaagcatact aagtaatgta caagaatcaa aaaaatcggc tacgcaagtc gcgtagccga 4620
atcatttaag gatccttcca ttcaggtcga ggtggcccgg ctccatgcac cgcgacgcaa 4680
cgcggggagg cagacaaggt atagggcggc gcctacaatc catgccaacc cgttccatgt 4740
gctcgccgag gcggcataaa tcgccgtgac gatcagcggt ccagtgatcg aagttaggct 4800
ggtaagagcc gcgagcgatc cttgaagctg tccctgatgg tcgtcatcta cctgcctgga 4860
cagcatggcc tgcaacgcgg gcatcccgat gccgccggaa gcgagaagaa tcataatggg 4920
gaaggccatc cagcctcgcg tcgcgaacgc cagcaagacg tagcccagcg cgtcggccgc 4980
catgccggcg ataatggcct gcttctcgcc gaaacgtttg gtggcgggac cagtgacgaa 5040
ggcttgagcg agggcgtgca agattccgaa taccgcaagc gacaggccga tcatcgtcgc 5100
gctccagcga aagcggtcct cgccgaaaat gacccagagc gctgccggca cctgtcctac 5160
gagttgcatg ataaagaaga cagtcataag tgcggcgacg atagtcatgc cccgcgccca 5220
ccggaaggag ctgactgggt tgaaggctct caagggcatc ggtcgacgct ctcccttatg 5280
cgactcctgc attaggaagc agcccagtag taggttgagg ccgttgagca ccgccgccgc 5340
aaggaatggt gcatgcaagg agatggcgcc caacagtccc ccggccacgg ggcctgccac 5400
catacccacg ccgaaacaag cgctcatgag cccgaagtgg cgagcccgat cttccccatc 5460
ggtgatgtcg gcgatatagg cgccagcaac cgcacctgtg gcgccggtga tgccggccac 5520
gatgcgtccg gcgtacaaga tccacaggac gggtgtggtc gccatgatcg cgtagtcgat 5580
agtggctcca agtagcgaag cgagcaggac tgggcggcgg ccaaagcggt cggacagtgc 5640
tccgagaacg ggtgcgcata gaaattgcat caacgcatat agcgctagca gcacgccata 5700
gtgactggcg atgctgtcgg aatggacgat atcccgcaag aggcccggca gtaccggcat 5760
aaccaagcct atgcctacag catccagggt gacggtgccg aggatgacga tgagcgcatt 5820
gttagatttc atacacggtg cctgactgcg ttagcaattt aactgtgata aactaccgca 5880
ttaaagccga gcgatgataa gctgtcaaac atgagatccg ataaatcgat tgatagattt 5940
aaataagaac tgcagaagct agcttagatg ctcgtgaaat tgacgtgggc gctttgcagg 6000
gccgtcttaa tggcgttggt gtccacgagg atcgagtcgg gtgcggaaaa cggacggttc 6060
ttgttggtga aatcgctgtt accaatgtac agcgattcct tgttacgcag cgcctggatg 6120
tgccagcggg accacgaatc ccaatacttc tggcgatccg gcgagatacc ttggctggtg 6180
tagccggtcg tcgggctgtt catcaacgag tcggtgcggt gcgagcccag cgtcagcggc 6240
aacttgatcc gatgcaccgt ggaatcgccg aagatcagct tcagacgcgc gataaattcg 6300
ctatccgcac ccgttttcac acaatcccag acaccggcct tctgcaagac gtcggcacgg 6360
cgaaacagga gcgacgacgg attcagacgc ttcaaggggt acactgcgcg ggcatagaaa 6420
ataccgttgt cttgcaggcg cacccagtcc gagatggagc agatgagctt cggattgagc 6480
aacaaggggg agatttggcg gaacagcttt tccggatggc tccagtcatc cgaatcgtgg 6540
caggtgacga actcgccctt cgcttggatc aagccgatac gcttcgcggc ataggtgccg 6600
acattctgcg gcaggctaat gatcttgatg cgcgtgtctt tgagggcgag ccgctggaga 6660
cgaaacaggg tgtcatcggt gctcgcgtca tccacaatga tcagctcgaa ggaacggtag 6720
gtctgattga ggagcgaaat caccgcattt tccacgcggc gacccgtatt ataggtggtc 6780
atcaggatgg agatcaacgg ccccgtctgg gccgggtacg ggatgctggt gatgatgttg 6840
cacggggaga gcggggagct gttgtccgtc aaggccacgg ggctgaggcc gaagtattta 6900
tagtattcat tcagccgatt caggctaatt tcggcggttt cgcggaaggc gttattttgc 6960
agcagcagga tatccgggct atagacgata tcggatgcgt cgatctgggc gagggtcgag 7020
atggcctttt gggtcaggcc gatccggagt tgcagtgcgg tatacaggtc cagcgggcag 7080
ttgtccacgt tgtccaacag gctcaggcta aaggtcggcg agtaggacgc cagggttttc 7140
gccagttcca ctttctgatg ggtatcggtg aactcgtcct tgaactccat cagcagctcg 7200
ggcgtcaggc tgatgtcgcc gcaggcgatt tttgcgatct tgattgccag tttgcagcgc 7260
caatcggacg gggtatccgt caagttatgc agcgaccagt acatattcag acgatacatc 7320
gcgaggatgc gtttcgactg ccagaaccgg caatcatcct ggatggccgc gagcgcgtgg 7380
acgtagcggc tctttttgag cagccacaag aatttgagat tattgaacat ttattaacct 7440
cctgctagca acttaagtta cgaatcgacg ccgaacaggt cgcgggtgta gactttctcc 7500
gagacatctt ccagttcgct ggtgcggcga ttcgccacaa tgacatcgac gcgctcctta 7560
aaggaattga tgtcgcgctc gacgtaggaa ccgaagaagt agggttcttt caggaccggc 7620
tcgtacacca caatctcgat acccttggcc ttcaaacgtt tcatgacccc ctggatgctg 7680
ctggcccgga aattgtcgct acccgccttc atgatcaggc gatagatacc gaccactttg 7740
ggcttacggg acaggatgtc ctcggccacg aagtccttac gggtcgtatt cgcatccacg 7800
atggcctgga tcaggttttg cgggacgtcg cgataattgg ccaacagctg cttcgtatcc 7860
ttcggcagac agtaaccgcc gtagccgaag gacgggttgt tgtaatgttg accaatgcgc 7920
ggatcgaggg agacgccttc gatgatttgt ttggtatcca ggccgtgcac gctcgcgtag 7980
gtgtccagct cgttaaagta cgcgatacgc atcgccagat acgtgttcgc gaacagtttg 8040
atggcttctg cctcgggcga atccgtcagc aggatcggaa tatccttttt gatggcacct 8100
tccgacagga gttcggcgaa cttccgtgcg cgttccgacg attcgcccac gacaatgcgg 8160
ctcggataga gattatcata cagggctttg ccttcgcgca ggaactccgg ggaaaagatg 8220
atattattcg tgttcagatc gcgcttcagg cgttcggtga acccgacggg gacggtggat 8280
ttgataatga tggtcgcgtt cgggttaatg gacagcacgt cacacgcgac gctttcgacg 8340
ctcagggtat caaagttgtt attaatcgga tcatagttcg tcggggtggc gatgatcacg 8400
tagtctgcat cgcgatatgc ctcgtatttt tccgtcgtcg cgtagaggtt cagcttacga 8460
ttggagagaa acttctggat ttccgggtcg caaatcggcg agattttctt gttaatgagc 8520
tggaccttct tcgggtcgat gtccagggcg atgatgtcgt gtttttggga gaggaggatc 8580
gcaatgctga tacccacata gccgacgccg gccacggcaa ttttcattta ttaacctcct 8640
taagtgaatt caaactagtt tacaagtcgt tttcgatctt ctcccaggta tatttgcgac 8700
attcattcaa gttggtcagc ggcgagtatt tgtacttttt gataccgagg cgcgacaggc 8760
tttcgttcac caccttgaaa tggttttcct tttggatgtc cagtttcttg atcgacgtgt 8820
tctcgccgtg caggacacgg ttgtagcaaa tcttattgat atgcttaaac gggccgactt 8880
cgctgagttt caaatacata tcgtaatcca ccgcattgct gatgctctcg ttgaagcctt 8940
cggtgaggtt ccatgcacgc gccgtgaaca tacggaagtg gtggcagatc atcgcgctcg 9000
tgagcttttc gcggctgtaa atcggccagt tgtagccatt gctaatcaag ttaccttcac 9060
gatcaatatt gcgattggtg gtgtacacgc aggcgaggct caggtctttg cgaaattcat 9120
ccagacacag ttccacggca tcgggctcca ggaaatcatc ggaatccagc tgcccgatgt 9180
agaaaccccg gcacaggcgg actgcggtat tcgaggcgga gccgatgcct ttgtttttct 9240
ggctgatgaa acggacgcgc gggtggtttg cgtaatgttc ttgcaggatg cgcagcgtat 9300
catcggtgct cccgtcatcg cagatgcaga cctccagatc ggtgatcgtt tggttcagtg 9360
ccgattcgac gcagcgcacg atatatttgc tgcaattata cgcggggatg tagatgctca 9420
ccaggggcac acgtttcagg gtggcgctct cgattttctc cttcttgcga taaaagtagg 9480
gcaccttctg ctgcaacagc tggacggtaa tgtttttacc tgccgcgcga tcggtttcgt 9540
tctccttacc gggcggttcc tgatgatatg ccatcgcgcc ttccacgcta cggaaataac 9600
aaccctcgcg gtacagccga tagccgaact cattatcctc accgccccaa tgcgtgaact 9660
cttcgtcaaa ccaacccgcg cgaaacagcc acttctttgc aaacgccaca ttgccaccgc 9720
taaagaaccg gaacggggtg ttgcacaggc gcagattgtc ggtattcttg aaatgttcga 9780
tgcgccaatc gacggatttg ttctgctcga ccttgcctgc gacctgatta ttggtaataa 9840
tctccgggat ttcattgatc aggcttttct gggacaaaaa gtccagatag gtatgcttcg 9900
acgtgtcgat gtatttacgc gggccaatca gtgccacgtt atcatccacg gccaggagtt 9960
ccatatagga ctgcacccac aacgggttcg gcgccatatc gcagtccaag atcgccacgt 10020
agttgtattt cgctgcccgc aggcccaggt tccgcacggc gcacagctgg tagccgtagt 10080
ctttctggcg gacgtatttg atgttcagca acgactcgaa ctcgcggacg atctcttcga 10140
tgttttcctt ggaaccgtca tccgcgacga tgacctcata gtcataaatc gttttctgat 10200
tgcagaggca ggccagggtg atcgccagga ttttggcgcg attgtacgtc ggaatcacga 10260
tggacaggcc gtcgatgatc agttgcttgc gcggataatc atccagttct ttacgtttcc 10320
ctgcccagac gtagtcgttc gtgctttccg gcagcggcgg caaggtcagg tcgctcggcc 10380
aatccagcgg aatgggttcg acttctttca attcggcgcg ctcggatttc tttgcggtaa 10440
tttcccgata tttgctaatg atttcattct tttccacctc attcagcgag atcgcctttg 10500
cattgctgca cataattttg gttgccgcgt cgatatcaat gaccgctttc cgattcagct 10560
tgtccacttc ttcgctcaga ttcagggcgg tttggcacag cttgatattg gcttccaccc 10620
agctcacatc atagatttcc gccacttttt caaacaggga gagggcttgg cggtagttct 10680
tattcttata cagattgatt gcctggttca aaatgctcat ttattaacct cctactagtg 10740
aattttcgaa ttacttaccg cagtacttga cacccacctg ggaattgttt ttggtgcgtt 10800
tgaattggcg gatggtacgg tagatgctaa agggcaggct gatcagaccg agcggaaaat 10860
tgttcttatt gatgatgagc ttgcccagct gatagctcag gtgtttcttg acccgttcgg 10920
cttcgtgttt atccgcgtac aggaagatgc tcggcaggct cacttggtac tccgaatcat 10980
atttcttctt ccaggtccgc cattcgctga tcaacgcaaa cggaatcgag atcagaccga 11040
ggaacgtctt ggagcggctc accatcaccg cacccaggcg gtagccgata tcttgcttga 11100
tgcgttcggc cgcaccatac agctccggca gttgtttctt ttcgagacgt tgattgtcga 11160
tgaagtactg ttcgagcttt tgctgcacca gatgcagctg attgagcagc aattcttttt 11220
cgcacgacag cttttcgagg cgctgttgtt gcagttcatt tttgttctgt tcctttttca 11280
gcagggactc gaagttctcg atcgcgcact ccagttcctg gacctggatg gttttgtttt 11340
taatgatcag atcatactgg atcagttctt ccttgctatc cgacagctct ttcagaatgg 11400
cttgataggc gttcagctgt ttggacgtgt gcagttcgtt gtccagaatg atctttttgc 11460
tgctctggta cagaccgttc acgatatcga gggtgatctg gcgttgttta atgaacgtct 11520
cccaaataaa ggacggctta tagttttcct tctccagcac ccgcaagggg gtgttggcgt 11580
tcgattgcaa ttcaaagtac agttccttgc aatcgggata gtcgttcagg acgttgaaga 11640
tcaagtactc ctccgtctcg ctttgcttga aaatgatatc cccggtcccg atgtcaatac 11700
cgctgaggga catgatctcc tgatgttctt tttccagcgt aatggaggct tcggcggtct 11760
taaagtcatt cacgctctgc tccagcgagt ggttgatggt attggagaac gacaacccga 11820
atttcagttt cagtttgtgt tgcagttgct ggatgcagtc ctcggcgttg cgcttcacct 11880
gttcgctcga caccagcagg caccgacccc ggttgttgag gaagaagtgc agcaaggcgg 11940
tgttgtatgc cagccagttt ttgatcagat gctccgaggt atagttgctg gagatgttct 12000
ggtccgagaa gtagttcgtc aggatgcttt tggggtggtc gtagatgagg ataaaggtga 12060
tgttctcatc caccgatttc caatattcca acgtgtgaat tgcgttgggg tcgctccaac 12120
cgcacagttt ctggttcagg ttggacagca tcagatccaa tgcgataccg ttccagacgg 12180
tgctcacatg gagcggttca aagtcggcgg aatcggtcac cgtatagatg tccggcgact 12240
ggtacgcctt ccgcagcgtc tgggtgatgt cctggggcga gaggttctca cgtttggacg 12300
ggcacaggga gttcatgccg cgctgatgca ggagttcttc cacgatttgg tagttgctgc 12360
tcggatggcc cacgatcacc aggcggttca tttattaacc tcctttcgaa aatgaacggt 12420
ccgttaaata tagccattcg gattcttcat ctgccagcgc caggcgtcct ccagcatggt 12480
ttcgagttcc cgcttggctt tccagttcag atatttgttg gccttttcgg gggaggacca 12540
gctctccgcg atatcaccgt cacggcggct cacgatttca tacggaatcc gcacgccgga 12600
aatcttttca aaggtggaca ccagttccag caccgaataa cctttacccg tgcccaaatt 12660
aaagacgtgg tagttggtgt tattgtcgcg gaagagatag gacagcgctg cgacgtgccc 12720
ttcggccagg tccatcacat ggatatagtc acggaccccc gtgccgtctt tggtgggata 12780
atcaccaccg aacaccatca gtttttccag tttccccatc gcgacctgca agatgtacgg 12840
caccaagttg gaggggatgt ctgccgggct ttcaccaatc ataccggatt cgtgggcgcc 12900
cgtcggatta aagtagcgca agcagaggaa attcgtgtcg gagtatttct tggcgatgtc 12960
gcggatcatc agctccgaga tgtacttgga cgtaccatac ggattcagcg tgccaccaat 13020
atggcagtct tcggtgacgg gcatgatctt gctttcccca tacaccgtcg ccgacgagct 13080
aaagatgaag ttggcgacgt cgttcttgat ggcgcaattg atgagttgca gggtgccgct 13140
cacgttgttg tcatagtaga agatgggctt gatcaggctt tctgcgaccg atttcgcacc 13200
tgcaaagtgc atgatgcagt cgaatttgtg tttcttcagg atctggttca cttccttctc 13260
gttgttgata ttgagttcgt agaacgtgac tttcttcttt gcgatcagct caatgcgacg 13320
gatgctttcg cagctgctgt tgatgagatt gtcaatgatg acgacattgt agcctttgtt 13380
cagcaggcag agcgacgtgt ggctgccgat gtagcctgca ccgccggtga ccaggatgtt 13440
catttattaa cctcctcggt ccgaattaac ctaggttatg aggtcagcat tgcttcttca 13500
cgcgtttagt agttgttttg ttcggtgata tattcttcaa tgccttcttg cacgtcttca 13560
tggaacgaca cggcgttgtc gtctttaaac acgattgcca catcgcagaa ctctttcaac 13620
gagttcagcg agtgcgacac catgaggaag gagctttcct tatgacgctc cttgaagagt 13680
tgggcacatt tttccttgaa acgggcgtcc cccaccgccg tcacctcgtc cacgatgtag 13740
taatcgaact tgaacgccat gctcaggccg aagccgaggc ggctgcgcat accgctcgaa 13800
taggtcttga tcggcatatc aaaatacttc cccagctccg cgaactcttc cacaaactca 13860
atcttttctt tcagctcctc ctgcttcgcg tacagccggg ccacgaactt cacgttttca 13920
cgcccggtca agctgccctg gaagccgcct gccagaccca ccggccacga gatcgtttta 13980
ttcgtgatga ttttaccgct atccgggcgg tcgatgcccc caatcatgcg caacagcgtg 14040
gatttacccg ccccattgcg cccgatgaac gccacgcttt tgccgctggg gatctcaatg 14100
ttcaggttct tgaagacata gtgacggccc accggggtgc ggtagctttt cgtcaggttt 14160
tcgatcttaa tcatgaggtc aacattgcct cctcacgcgt acggtacagg gccaaaccaa 14220
taaacagggt caccagggtg aacattgcca gataattcag gctgacccct tcgctgatat 14280
aaccgggcat cacggcctcg cggctcagtt cgacgacgtg caccagggga ttccacagca 14340
ggtacgacca atactgcttc ggaatggagt gcagcgggaa catgatgcac gaaataaagt 14400
acagcggctt cagcaagatc ggcaagactt tctgcatttc ggggaacgtc ttgcccacga 14460
ccatgaagat caggcccaca ccgcacgaca ggatgatcag gaggctccag gtgagcacaa 14520
attgcaggaa gttggtaatc tcgaaatatt cgcccgccat ccagatgatc agcatcagga 14580
ggatgtagac cgccacatag atcagcgttt ccaagagggc gcgtgcaatg atcgtgtcga 14640
tcggcttcac gggccggtag ttaaacagcc cctgattggc ttcgatggcg cccacggagc 14700
gattgctgat gctgctgaaa ataaagaacg ggatcaggcc attgagcagg aacaccggga 14760
aggagatatc cggcatggtg cgatgcatga tatagccaaa gatcccgagc agaatcagca 14820
gatgtgcgct cggttccagg atcgcccaca gatagcccag gcgaaacttg ccaaagcgcg 14880
tacggatttc gcggagaaac agtgcttcga ccgtcacttt ctggacttca aaacccgaac 14940
gtgccattta ttaacctcct ggtaccaatc tagattgttt taagtaatcg atagtgattt 15000
aaatatgcaa gatctagtta cctgcaggat tattgtttct gttgcataaa gcctaagggg 15060
taggcctttc tagagatagc cattttttgc actcctgtat ccgcttcttg caaggctgga 15120
cttatcccta tcaaaccgga cactgcaggc tgacaagctt tcattacata tgaagagttt 15180
gtagaaacgc aaaaaggcca tccgtcagga tggccttcta agaaggctcg agtggcgcgc 15240
ctaagtcgaa tttctgccat tcatccgctt attatactta ttcaggcgta gcaccaggcg 15300
tttaagggca ccaataactg ccttaaaaaa attacgcccc gccctgccac tcatcgcagt 15360
actgttgtaa ttcattaagc attctgccga catggaagcc atcacagacg gcatgatgaa 15420
cctgaatcgc cagcggcatc agcaccttgt cgccttgcgt ataatatttg cccatggtga 15480
aaacgggggc gaagaagttg tccatattgg ccacgtttaa atcaaaactg gtgaaactca 15540
cccagggatt ggctgagacg aaaaacatat tctcaataaa ccctttaggg aaataggcca 15600
ggttttcacc gtaacacgcc acatcttgcg aatatatgtg tagaaactgc cggaaatcgt 15660
cgtggtattc actccagagc gatgaaaacg tttcagtttg ctcatggaaa acggtgtaac 15720
aagggtgaac actatcccat atcaccagct caccgtcttt cattgccata cggaattccg 15780
gatgagcatt catcaggcgg gcaagaatgt gaataaaggc cggataaaac ttgtgcttat 15840
ttttctttac ggtctttaaa aaggccgtaa tatccagctg aacggtctgg ttataggtac 15900
attgagcaac tgactgaaat gcctcaaaat gttctttacg atgccattgg gatatatcaa 15960
cggtggtata tccagtgatt tttttctcca ttttagcttc cttagctcct gaaaatctcg 16020
ataactcaaa aaatacgccc ggtagtgatc ttatttcatt atggtgaaag ttggaacctc 16080
ttacgtgccg atcaacgtct cattttcgcc aaaagttggc ccagggcttc ccggtatcaa 16140
cagggacacc aggatttatt tattctgcga agtgatcttc cgtcacaggt atttattcgg 16200
cgcaaagggc ctcgtgatac gcctattttt ataggttaat gtcatgataa taatggtttc 16260
ttagacgtca ggtggcactt ttcggggaaa tgtgcgcgcc cgcgttcctg ctggcgctgg 16320
gcctgtttct ggcgctggac ttcccgctgt tccgtcagca gcttttcgcc cacggccttg 16380
atgatcgcgg cggccttggc ctgcatatcc cgattcaacg gccccagggc gtccagaacg 16440
ggcttcaggc gctcccgaag gt 16462
<210> 151
<211> 13809
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic plasmid pCX081
<400> 151
ctcgggccgt ctcttgggct tgatcggcct tcttgcgcat ctcacgcgct cctgcggcgg 60
cctgtagggc aggctcatac ccctgccgaa ccgcttttgt cagccggtcg gccacggctt 120
ccggcgtctc aacgcgcttt gagattccca gcttttcggc caatccctgc ggtgcatagg 180
cgcgtggctc gaccgcttgc gggctgatgg tgacgtggcc cactggtggc cgctccaggg 240
cctcgtagaa cgcctgaatg cgcgtgtgac gtgccttgct gccctcgatg ccccgttgca 300
gccctagatc ggccacagcg gccgcaaacg tggtctggtc gcgggtcatc tgcgctttgt 360
tgccgatgaa ctccttggcc gacagcctgc cgtcctgcgt cagcggcacc acgaacgcgg 420
tcatgtgcgg gctggtttcg tcacggtgga tgctggccgt cacgatgcga tccgccccgt 480
acttgtccgc cagccacttg tgcgccttct cgaagaacgc cgcctgctgt tcttggctgg 540
ccgacttcca ccattccggg ctggccgtca tgacgtactc gaccgccaac acagcgtcct 600
tgcgccgctt ctctggcagc aactcgcgca gtcggcccat cgcttcatcg gtgctgctgg 660
ccgcccagtg ctcgttctct ggcgtcctgc tggcgtcagc gttgggcgtc tcgcgctcgc 720
ggtaggcgtg cttgagactg gccgccacgt tgcccatttt cgccagcttc ttgcatcgca 780
tgatcgcgta tgccgccatg cctgcccctc ccttttggtg tccaaccggc tcgacggggg 840
cagcgcaagg cggtgcctcc ggcgggccac tcaatgcttg agtatactca ctagactttg 900
cttcgcaaag tcgtgaccgc ctacggcggc tgcggcgccc tacgggcttg ctctccgggc 960
ttcgccctgc gcggtcgctg cgctcccttg ccagcccgtg gatatgtgga cgatggccgc 1020
gagcggccac cggctggctc gcttcgctcg gcccgtggac aaccctgctg gacaagctga 1080
tggacaggct gcgcctgccc acgagcttga ccacagggat tgcccaccgg ctacccagcc 1140
ttcgaccaca tacccaccgg ctccaactgc gcggcctgcg gccttgcccc atcaattttt 1200
ttaattttct ctggggaaaa gcctccggcc tgcggcctgc gcgcttcgct tgccggttgg 1260
acaccaagtg gaaggcgggt caaggctcgc gcagcgaccg cgcagcggct tggccttgac 1320
gcgcctggaa cgacccaagc ctatgcgagt gggggcagtc gaaggcgaag cccgcccgcc 1380
tgccccccga gacctgcaga tccacatcct tgaaggccgc agcgacgagc agaaggaaac 1440
cctcattcgg gaagtcagcg aggccatctc gcgctccctg gatgcgccgc tgaccagcgt 1500
gcgagtgatt atcacggaga tggccaaggg ccacttcggc atcggcggcg aactggccag 1560
caaggtcaga cgctgaagtg gagatgccca agggcacttc gggtcgagga acccgacctg 1620
cattgggacg cggccacgga gagcgcgggc aaacgccggc actatagcca gtggagtttg 1680
taaaacgcta tttcagagct tggagagtgt ctaagaaagc cggggcgatg ccaacccatc 1740
ccttcttcgg ctatgcatcg ttcgtaatca agccacttcc tttttgcatt gacgcagggt 1800
gtcggaaggc aactcgccga acgcgctcct atagttttca gcgaagcgtc ccaaatgtaa 1860
gaagccgtag tctagggcta tctcagttat actacgcaca ttggcactgg gatcgttcaa 1920
gcaggcgcgg atgctttcga gcttgcggtt gcggatgtag ttcttcggcg tggtgccggc 1980
atgcttctcg aacaaattgt agagcgagcg tggactcatc atcgccagct ccgctaaccg 2040
ctcaaggctg atattccgtt tgagattctc ctcaatgaat tgaacgactc gctcgaaaga 2100
cgggttacct ttgctgaaaa tttcacggct gacattgctg cccagcattt cgagcagctt 2160
ggaagcgatg atccccgcat agtgctcttg gacccgaggc atcgactttg tatgttccgc 2220
ttcgtcacaa actaacccga gtagattgat aaagccatcg agttgctgga gattgtgtcg 2280
cgcggcgaaa cggataccct ccctcggctt gtgccaattg ttgtcactgc atgcccgatc 2340
aaggaccact gagggcaatt taacgataaa tttctcgcaa tcttctgaat aggtcaggtc 2400
ggcttggtca tccggattga gcagcaatag ttcgcccggc gcaaaatagt gctcctggcc 2460
atggccacgc cacaggcaat ggcctttgag tattatttgc agatgataac aggtctctaa 2520
tccaggcgag attaccctca cgctaccgcc gtagctgatt cgacacaggt cgaggcatcc 2580
gaagattctg tggtgcagcc tgcctgccgg gcgcccgccc ttgggcaggc gaatagagtg 2640
cgtaccgaca tactggttaa cataatcgga gactgcatag ggctcggcgt ggacgaagat 2700
ctgacttttc tcgttcaata agcaaaaatc catagttcac ggttctctta ttttaatgtg 2760
ggctgcttgg tgtgatgtag aaaggcgcca agtcgatgaa aatgcatctc gacgtgatgc 2820
gtatacgggt tacccccatt gccacgttgc gccatccttt ttgcaatcag tgaccacttt 2880
tccaagcaaa aataacgcca agcagaacga agacgttctt tttaagaagc gagaacacca 2940
gaagttcgtg ctgtcggggc atgcggcgac gaattggcgg ataaagggga tctgcaggtc 3000
ccgagcctca cggcggcgag tgcgggggtt ccaagggggc agcgccacct tgggcaaggc 3060
cgaaggccgc gcagtcgatc aacaagcccc ggaggggcca ctttttgccg gagggggagc 3120
cgcgccgaag gcgtggggga accccgcagg ggtgcccttc tttgggcacc aaagaactag 3180
atatagggcg aaatgcgaaa gacttaaaaa tcaacaactt aaaaaagggg ggtacgcaac 3240
agctcattgc ggcacccccc gcaatagctc attgcgtagg ttaaagaaaa tctgtaattg 3300
actgccactt ttacgcaacg cataattgtt gtcgcgctgc cgaaaagttg cagctgattg 3360
cgcatggtgc cgcaaccgtg cggcacccta ccgcatggag ataagcatgg ccacgcagtc 3420
cagagaaatc ggcattcaag ccaagaacaa gcccggtcac tgggtgcaaa cggaacgcaa 3480
agcgcatgag gcgtgggccg ggcttattgc gaggaaaccc acggcggcaa tgctgctgca 3540
tcacctcgtg gcgcagatgg gccaccagaa cgccgtggtg gtcagccaga agacactttc 3600
caagctcatc ggacgttctt tgcggacggt ccaatacgca gtcaaggact tggtggccga 3660
gcgctggatc tccgtcgtga agctcaacgg ccccggcacc gtgtcggcct acgtggtcaa 3720
tgaccgcgtg gcgtggggcc agccccgcga ccagttgcgc ctgtcggtgt tcagtgccgc 3780
cgtggtggtt gatcacgacg accaggacga atcgctgttg gggcatggcg acctgcgccg 3840
catcccgacc ctgtatccgg gcgagcagca actaccgacc ggccccggcg aggagccgcc 3900
cagccagccc ggcattccgg gcatggaacc agacctgcca gccttgaccg aaacggagga 3960
atgggaacgg cgcgggcagc agcgcctgcc gatgcccgat gagccgtgtt ttctggacga 4020
tggcgagccg ttggagccgc cgacacgggt cacgctgccg cgccggtagc acttgggttg 4080
cgcagcaacc cgtaagtgcg ctgttccaga ctatcggctg tagccgcctc gccgccctat 4140
accttgtctg cctccccgcg ttgcgtcgcg gtgcatggag ccgggccacc tcgacctgaa 4200
tggaagccgg cggcacctcg ctaacggatt caccgttttt atcaggctct gggaggcaga 4260
ataaatgatc atatcgtcaa ttattacctc cacggggaga gcctgagcaa actggcctca 4320
ggcatttgag aagcacacgg tcacactgct tccggtagtc aataaaccgg taaaccagca 4380
atagacataa gcggctattt aacgaccctg ccctgaaccg acgaccgggt cgaatttgct 4440
ttcgactatc ggcgcgccag agctcatcgt taatgtcttc gtgcgccgtc agtcggcgca 4500
cgttttttct ctctggtacc gtgtcactga tctagtcaat tactcgaagt atccacaagt 4560
gaagcatact aagtaatgta caagaatcaa aaaaatcggc tacgcaagtc gcgtagccga 4620
atcatttaag gatccttcca ttcaggtcga ggtggcccgg ctccatgcac cgcgacgcaa 4680
cgcggggagg cagacaaggt atagggcggc gcctacaatc catgccaacc cgttccatgt 4740
gctcgccgag gcggcataaa tcgccgtgac gatcagcggt ccagtgatcg aagttaggct 4800
ggtaagagcc gcgagcgatc cttgaagctg tccctgatgg tcgtcatcta cctgcctgga 4860
cagcatggcc tgcaacgcgg gcatcccgat gccgccggaa gcgagaagaa tcataatggg 4920
gaaggccatc cagcctcgcg tcgcgaacgc cagcaagacg tagcccagcg cgtcggccgc 4980
catgccggcg ataatggcct gcttctcgcc gaaacgtttg gtggcgggac cagtgacgaa 5040
ggcttgagcg agggcgtgca agattccgaa taccgcaagc gacaggccga tcatcgtcgc 5100
gctccagcga aagcggtcct cgccgaaaat gacccagagc gctgccggca cctgtcctac 5160
gagttgcatg ataaagaaga cagtcataag tgcggcgacg atagtcatgc cccgcgccca 5220
ccggaaggag ctgactgggt tgaaggctct caagggcatc ggtcgacgct ctcccttatg 5280
cgactcctgc attaggaagc agcccagtag taggttgagg ccgttgagca ccgccgccgc 5340
aaggaatggt gcatgcaagg agatggcgcc caacagtccc ccggccacgg ggcctgccac 5400
catacccacg ccgaaacaag cgctcatgag cccgaagtgg cgagcccgat cttccccatc 5460
ggtgatgtcg gcgatatagg cgccagcaac cgcacctgtg gcgccggtga tgccggccac 5520
gatgcgtccg gcgtacaaga tccacaggac gggtgtggtc gccatgatcg cgtagtcgat 5580
agtggctcca agtagcgaag cgagcaggac tgggcggcgg ccaaagcggt cggacagtgc 5640
tccgagaacg ggtgcgcata gaaattgcat caacgcatat agcgctagca gcacgccata 5700
gtgactggcg atgctgtcgg aatggacgat atcccgcaag aggcccggca gtaccggcat 5760
aaccaagcct atgcctacag catccagggt gacggtgccg aggatgacga tgagcgcatt 5820
gttagatttc atacacggtg cctgactgcg ttagcaattt aactgtgata aactaccgca 5880
ttaaagccga gcgatgataa gctgtcaaac atgagatccg ataaatcgat tgatagattt 5940
aaataagaac tgcagaagct agcttagatg ctcgtgaaat tgacgtgggc gctttgcagg 6000
gccgtcttaa tggcgttggt gtccacgagg atcgagtcgg gtgcggaaaa cggacggttc 6060
ttgttggtga aatcgctgtt accaatgtac agcgattcct tgttacgcag cgcctggatg 6120
tgccagcggg accacgaatc ccaatacttc tggcgatccg gcgagatacc ttggctggtg 6180
tagccggtcg tcgggctgtt catcaacgag tcggtgcggt gcgagcccag cgtcagcggc 6240
aacttgatcc gatgcaccgt ggaatcgccg aagatcagct tcagacgcgc gataaattcg 6300
ctatccgcac ccgttttcac acaatcccag acaccggcct tctgcaagac gtcggcacgg 6360
cgaaacagga gcgacgacgg attcagacgc ttcaaggggt acactgcgcg ggcatagaaa 6420
ataccgttgt cttgcaggcg cacccagtcc gagatggagc agatgagctt cggattgagc 6480
aacaaggggg agatttggcg gaacagcttt tccggatggc tccagtcatc cgaatcgtgg 6540
caggtgacga actcgccctt cgcttggatc aagccgatac gcttcgcggc ataggtgccg 6600
acattctgcg gcaggctaat gatcttgatg cgcgtgtctt tgagggcgag ccgctggaga 6660
cgaaacaggg tgtcatcggt gctcgcgtca tccacaatga tcagctcgaa ggaacggtag 6720
gtctgattga ggagcgaaat caccgcattt tccacgcggc gacccgtatt ataggtggtc 6780
atcaggatgg agatcaacgg ccccgtctgg gccgggtacg ggatgctggt gatgatgttg 6840
cacggggaga gcggggagct gttgtccgtc aaggccacgg ggctgaggcc gaagtattta 6900
tagtattcat tcagccgatt caggctaatt tcggcggttt cgcggaaggc gttattttgc 6960
agcagcagga tatccgggct atagacgata tcggatgcgt cgatctgggc gagggtcgag 7020
atggcctttt gggtcaggcc gatccggagt tgcagtgcgg tatacaggtc cagcgggcag 7080
ttgtccacgt tgtccaacag gctcaggcta aaggtcggcg agtaggacgc cagggttttc 7140
gccagttcca ctttctgatg ggtatcggtg aactcgtcct tgaactccat cagcagctcg 7200
ggcgtcaggc tgatgtcgcc gcaggcgatt tttgcgatct tgattgccag tttgcagcgc 7260
caatcggacg gggtatccgt caagttatgc agcgaccagt acatattcag acgatacatc 7320
gcgaggatgc gtttcgactg ccagaaccgg caatcatcct ggatggccgc gagcgcgtgg 7380
acgtagcggc tctttttgag cagccacaag aatttgagat tattgaacat ttattaacct 7440
cctgctagca acttaagtga attcaaacta gtttacaagt cgttttcgat cttctcccag 7500
gtatatttgc gacattcatt caagttggtc agcggcgagt atttgtactt tttgataccg 7560
aggcgcgaca ggctttcgtt caccaccttg aaatggtttt ccttttggat gtccagtttc 7620
ttgatcgacg tgttctcgcc gtgcaggaca cggttgtagc aaatcttatt gatatgctta 7680
aacgggccga cttcgctgag tttcaaatac atatcgtaat ccaccgcatt gctgatgctc 7740
tcgttgaagc cttcggtgag gttccatgca cgcgccgtga acatacggaa gtggtggcag 7800
atcatcgcgc tcgtgagctt ttcgcggctg taaatcggcc agttgtagcc attgctaatc 7860
aagttacctt cacgatcaat attgcgattg gtggtgtaca cgcaggcgag gctcaggtct 7920
ttgcgaaatt catccagaca cagttccacg gcatcgggct ccaggaaatc atcggaatcc 7980
agctgcccga tgtagaaacc ccggcacagg cggactgcgg tattcgaggc ggagccgatg 8040
cctttgtttt tctggctgat gaaacggacg cgcgggtggt ttgcgtaatg ttcttgcagg 8100
atgcgcagcg tatcatcggt gctcccgtca tcgcagatgc agacctccag atcggtgatc 8160
gtttggttca gtgccgattc gacgcagcgc acgatatatt tgctgcaatt atacgcgggg 8220
atgtagatgc tcaccagggg cacacgtttc agggtggcgc tctcgatttt ctccttcttg 8280
cgataaaagt agggcacctt ctgctgcaac agctggacgg taatgttttt acctgccgcg 8340
cgatcggttt cgttctcctt accgggcggt tcctgatgat atgccatcgc gccttccacg 8400
ctacggaaat aacaaccctc gcggtacagc cgatagccga actcattatc ctcaccgccc 8460
caatgcgtga actcttcgtc aaaccaaccc gcgcgaaaca gccacttctt tgcaaacgcc 8520
acattgccac cgctaaagaa ccggaacggg gtgttgcaca ggcgcagatt gtcggtattc 8580
ttgaaatgtt cgatgcgcca atcgacggat ttgttctgct cgaccttgcc tgcgacctga 8640
ttattggtaa taatctccgg gatttcattg atcaggcttt tctgggacaa aaagtccaga 8700
taggtatgct tcgacgtgtc gatgtattta cgcgggccaa tcagtgccac gttatcatcc 8760
acggccagga gttccatata ggactgcacc cacaacgggt tcggcgccat atcgcagtcc 8820
aagatcgcca cgtagttgta tttcgctgcc cgcaggccca ggttccgcac ggcgcacagc 8880
tggtagccgt agtctttctg gcggacgtat ttgatgttca gcaacgactc gaactcgcgg 8940
acgatctctt cgatgttttc cttggaaccg tcatccgcga cgatgacctc atagtcataa 9000
atcgttttct gattgcagag gcaggccagg gtgatcgcca ggattttggc gcgattgtac 9060
gtcggaatca cgatggacag gccgtcgatg atcagttgct tgcgcggata atcatccagt 9120
tctttacgtt tccctgccca gacgtagtcg ttcgtgcttt ccggcagcgg cggcaaggtc 9180
aggtcgctcg gccaatccag cggaatgggt tcgacttctt tcaattcggc gcgctcggat 9240
ttctttgcgg taatttcccg atatttgcta atgatttcat tcttttccac ctcattcagc 9300
gagatcgcct ttgcattgct gcacataatt ttggttgccg cgtcgatatc aatgaccgct 9360
ttccgattca gcttgtccac ttcttcgctc agattcaggg cggtttggca cagcttgata 9420
ttggcttcca cccagctcac atcatagatt tccgccactt tttcaaacag ggagagggct 9480
tggcggtagt tcttattctt atacagattg attgcctggt tcaaaatgct catttattaa 9540
cctcctacta gtgaattttc gaattactta ccgcagtact tgacacccac ctgggaattg 9600
tttttggtgc gtttgaattg gcggatggta cggtagatgc taaagggcag gctgatcaga 9660
ccgagcggaa aattgttctt attgatgatg agcttgccca gctgatagct caggtgtttc 9720
ttgacccgtt cggcttcgtg tttatccgcg tacaggaaga tgctcggcag gctcacttgg 9780
tactccgaat catatttctt cttccaggtc cgccattcgc tgatcaacgc aaacggaatc 9840
gagatcagac cgaggaacgt cttggagcgg ctcaccatca ccgcacccag gcggtagccg 9900
atatcttgct tgatgcgttc ggccgcacca tacagctccg gcagttgttt cttttcgaga 9960
cgttgattgt cgatgaagta ctgttcgagc ttttgctgca ccagatgcag ctgattgagc 10020
agcaattctt tttcgcacga cagcttttcg aggcgctgtt gttgcagttc atttttgttc 10080
tgttcctttt tcagcaggga ctcgaagttc tcgatcgcgc actccagttc ctggacctgg 10140
atggttttgt ttttaatgat cagatcatac tggatcagtt cttccttgct atccgacagc 10200
tctttcagaa tggcttgata ggcgttcagc tgtttggacg tgtgcagttc gttgtccaga 10260
atgatctttt tgctgctctg gtacagaccg ttcacgatat cgagggtgat ctggcgttgt 10320
ttaatgaacg tctcccaaat aaaggacggc ttatagtttt ccttctccag cacccgcaag 10380
ggggtgttgg cgttcgattg caattcaaag tacagttcct tgcaatcggg atagtcgttc 10440
aggacgttga agatcaagta ctcctccgtc tcgctttgct tgaaaatgat atccccggtc 10500
ccgatgtcaa taccgctgag ggacatgatc tcctgatgtt ctttttccag cgtaatggag 10560
gcttcggcgg tcttaaagtc attcacgctc tgctccagcg agtggttgat ggtattggag 10620
aacgacaacc cgaatttcag tttcagtttg tgttgcagtt gctggatgca gtcctcggcg 10680
ttgcgcttca cctgttcgct cgacaccagc aggcaccgac cccggttgtt gaggaagaag 10740
tgcagcaagg cggtgttgta tgccagccag tttttgatca gatgctccga ggtatagttg 10800
ctggagatgt tctggtccga gaagtagttc gtcaggatgc ttttggggtg gtcgtagatg 10860
aggataaagg tgatgttctc atccaccgat ttccaatatt ccaacgtgtg aattgcgttg 10920
gggtcgctcc aaccgcacag tttctggttc aggttggaca gcatcagatc caatgcgata 10980
ccgttccaga cggtgctcac atggagcggt tcaaagtcgg cggaatcggt caccgtatag 11040
atgtccggcg actggtacgc cttccgcagc gtctgggtga tgtcctgggg cgagaggttc 11100
tcacgtttgg acgggcacag ggagttcatg ccgcgctgat gcaggagttc ttccacgatt 11160
tggtagttgc tgctcggatg gcccacgatc accaggcggt tcatttatta acctcctttc 11220
gaaaatgaac ggtccgttaa atatagccat tcggattctt catctgccag cgccaggcgt 11280
cctccagcat ggtttcgagt tcccgcttgg ctttccagtt cagatatttg ttggcctttt 11340
cgggggagga ccagctctcc gcgatatcac cgtcacggcg gctcacgatt tcatacggaa 11400
tccgcacgcc ggaaatcttt tcaaaggtgg acaccagttc cagcaccgaa taacctttac 11460
ccgtgcccaa attaaagacg tggtagttgg tgttattgtc gcggaagaga taggacagcg 11520
ctgcgacgtg cccttcggcc aggtccatca catggatata gtcacggacc cccgtgccgt 11580
ctttggtggg ataatcacca ccgaacacca tcagtttttc cagtttcccc atcgcgacct 11640
gcaagatgta cggcaccaag ttggagggga tgtctgccgg gctttcacca atcataccgg 11700
attcgtgggc gcccgtcgga ttaaagtagc gcaagcagag gaaattcgtg tcggagtatt 11760
tcttggcgat gtcgcggatc atcagctccg agatgtactt ggacgtacca tacggattca 11820
gcgtgccacc aatatggcag tcttcggtga cgggcatgat cttgctttcc ccatacaccg 11880
tcgccgacga gctaaagatg aagttggcga cgtcgttctt gatggcgcaa ttgatgagtt 11940
gcagggtgcc gctcacgttg ttgtcatagt agaagatggg cttgatcagg ctttctgcga 12000
ccgatttcgc acctgcaaag tgcatgatgc agtcgaattt gtgtttcttc aggatctggt 12060
tcacttcctt ctcgttgttg atattgagtt cgtagaacgt gactttcttc tttgcgatca 12120
gctcaatgcg acggatgctt tcgcagctgc tgttgatgag attgtcaatg atgacgacat 12180
tgtagccttt gttcagcagg cagagcgacg tgtggctgcc gatgtagcct gcaccgccgg 12240
tgaccaggat gttcatttat taacctcctc ggtccgaatt aacctaggtt atgaggtcag 12300
cattgcttct tcacgcggtg ttaattaagt aatcgatagt gatttaaata tgcaagatct 12360
agttacctgc aggattattg tttctgttgc ataaagccta aggggtaggc ctttctagag 12420
atagccattt tttgcactcc tgtatccgct tcttgcaagg ctggacttat ccctatcaaa 12480
ccggacactg caggctgaca agctttcatt acatatgaag agtttgtaga aacgcaaaaa 12540
ggccatccgt caggatggcc ttctaagaag gctcgagtgg cgcgcctaag tcgaatttct 12600
gccattcatc cgcttattat cacttattca ggcgtagcaa ccaggcgttt aagggcacca 12660
ataactgcct taaaaaaatt acgccccgcc ctgccactca tcgcagtact gttgtaattc 12720
attaagcatt ctgccgacat ggaagccatc acaaacggca tgatgaacct gaatcgccag 12780
cggcatcagc accttgtcgc cttgcgtata atatttgccc atggtgaaaa cgggggcgaa 12840
gaagttgtcc atattggcca cgtttaaatc aaaactggtg aaactcaccc agggattggc 12900
tgagacgaaa aacatattct caataaaccc tttagggaaa taggccaggt tttcaccgta 12960
acacgccaca tcttgcgaat atatgtgtag aaactgccgg aaatcgtcgt ggtattcact 13020
ccagagcgat gaaaacgttt cagtttgctc atggaaaacg gtgtaacaag ggtgaacact 13080
atcccatatc accagctcac cgtctttcat tgccatacgg aattccggat gagcattcat 13140
caggcgggca agaatgtgaa taaaggccgg ataaaacttg tgcttatttt tctttacggt 13200
ctttaaaaag gccgtaatat ccagctgaac ggtctggtta taggtacatt gagcaactga 13260
ctgaaatgcc tcaaaatgtt ctttacgatg ccattgggat atatcaacgg tggtatatcc 13320
agtgattttt ttctccattt tagcttcctt agctcctgaa aatctcgata actcaaaaaa 13380
tacgcccggt agtgatctta tttcattatg gtgaaagttg gaacctctta cgtgccgatc 13440
aacgtctcat tttcgccaaa agttggccca gggcttcccg gtatcaacag ggacaccagg 13500
atttatttat tctgcgaagt gatcttccgt cacaggtatt tattcggcgc aaagggcctc 13560
gtgatacgcc tatttttata ggttaatgtc atgataataa tggtttctta gacgtcaggt 13620
ggcacttttc ggggaaatgt gcgcgcccgc gttcctgctg gcgctgggcc tgtttctggc 13680
gctggacttc ccgctgttcc gtcagcagct tttcgcccac ggccttgatg atcgcggcgg 13740
ccttggcctg catatcccga ttcaacggcc ccagggcgtc cagaacgggc ttcaggcgct 13800
cccgaaggt 13809
<210> 152
<211> 13956
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic plasmid pCX082
<400> 152
ctcgggccgt ctcttgggct tgatcggcct tcttgcgcat ctcacgcgct cctgcggcgg 60
cctgtagggc aggctcatac ccctgccgaa ccgcttttgt cagccggtcg gccacggctt 120
ccggcgtctc aacgcgcttt gagattccca gcttttcggc caatccctgc ggtgcatagg 180
cgcgtggctc gaccgcttgc gggctgatgg tgacgtggcc cactggtggc cgctccaggg 240
cctcgtagaa cgcctgaatg cgcgtgtgac gtgccttgct gccctcgatg ccccgttgca 300
gccctagatc ggccacagcg gccgcaaacg tggtctggtc gcgggtcatc tgcgctttgt 360
tgccgatgaa ctccttggcc gacagcctgc cgtcctgcgt cagcggcacc acgaacgcgg 420
tcatgtgcgg gctggtttcg tcacggtgga tgctggccgt cacgatgcga tccgccccgt 480
acttgtccgc cagccacttg tgcgccttct cgaagaacgc cgcctgctgt tcttggctgg 540
ccgacttcca ccattccggg ctggccgtca tgacgtactc gaccgccaac acagcgtcct 600
tgcgccgctt ctctggcagc aactcgcgca gtcggcccat cgcttcatcg gtgctgctgg 660
ccgcccagtg ctcgttctct ggcgtcctgc tggcgtcagc gttgggcgtc tcgcgctcgc 720
ggtaggcgtg cttgagactg gccgccacgt tgcccatttt cgccagcttc ttgcatcgca 780
tgatcgcgta tgccgccatg cctgcccctc ccttttggtg tccaaccggc tcgacggggg 840
cagcgcaagg cggtgcctcc ggcgggccac tcaatgcttg agtatactca ctagactttg 900
cttcgcaaag tcgtgaccgc ctacggcggc tgcggcgccc tacgggcttg ctctccgggc 960
ttcgccctgc gcggtcgctg cgctcccttg ccagcccgtg gatatgtgga cgatggccgc 1020
gagcggccac cggctggctc gcttcgctcg gcccgtggac aaccctgctg gacaagctga 1080
tggacaggct gcgcctgccc acgagcttga ccacagggat tgcccaccgg ctacccagcc 1140
ttcgaccaca tacccaccgg ctccaactgc gcggcctgcg gccttgcccc atcaattttt 1200
ttaattttct ctggggaaaa gcctccggcc tgcggcctgc gcgcttcgct tgccggttgg 1260
acaccaagtg gaaggcgggt caaggctcgc gcagcgaccg cgcagcggct tggccttgac 1320
gcgcctggaa cgacccaagc ctatgcgagt gggggcagtc gaaggcgaag cccgcccgcc 1380
tgccccccga gacctgcaga tccacatcct tgaaggccgc agcgacgagc agaaggaaac 1440
cctcattcgg gaagtcagcg aggccatctc gcgctccctg gatgcgccgc tgaccagcgt 1500
gcgagtgatt atcacggaga tggccaaggg ccacttcggc atcggcggcg aactggccag 1560
caaggtcaga cgctgaagtg gagatgccca agggcacttc gggtcgagga acccgacctg 1620
cattgggacg cggccacgga gagcgcgggc aaacgccggc actatagcca gtggagtttg 1680
taaaacgcta tttcagagct tggagagtgt ctaagaaagc cggggcgatg ccaacccatc 1740
ccttcttcgg ctatgcatcg ttcgtaatca agccacttcc tttttgcatt gacgcagggt 1800
gtcggaaggc aactcgccga acgcgctcct atagttttca gcgaagcgtc ccaaatgtaa 1860
gaagccgtag tctagggcta tctcagttat actacgcaca ttggcactgg gatcgttcaa 1920
gcaggcgcgg atgctttcga gcttgcggtt gcggatgtag ttcttcggcg tggtgccggc 1980
atgcttctcg aacaaattgt agagcgagcg tggactcatc atcgccagct ccgctaaccg 2040
ctcaaggctg atattccgtt tgagattctc ctcaatgaat tgaacgactc gctcgaaaga 2100
cgggttacct ttgctgaaaa tttcacggct gacattgctg cccagcattt cgagcagctt 2160
ggaagcgatg atccccgcat agtgctcttg gacccgaggc atcgactttg tatgttccgc 2220
ttcgtcacaa actaacccga gtagattgat aaagccatcg agttgctgga gattgtgtcg 2280
cgcggcgaaa cggataccct ccctcggctt gtgccaattg ttgtcactgc atgcccgatc 2340
aaggaccact gagggcaatt taacgataaa tttctcgcaa tcttctgaat aggtcaggtc 2400
ggcttggtca tccggattga gcagcaatag ttcgcccggc gcaaaatagt gctcctggcc 2460
atggccacgc cacaggcaat ggcctttgag tattatttgc agatgataac aggtctctaa 2520
tccaggcgag attaccctca cgctaccgcc gtagctgatt cgacacaggt cgaggcatcc 2580
gaagattctg tggtgcagcc tgcctgccgg gcgcccgccc ttgggcaggc gaatagagtg 2640
cgtaccgaca tactggttaa cataatcgga gactgcatag ggctcggcgt ggacgaagat 2700
ctgacttttc tcgttcaata agcaaaaatc catagttcac ggttctctta ttttaatgtg 2760
ggctgcttgg tgtgatgtag aaaggcgcca agtcgatgaa aatgcatctc gacgtgatgc 2820
gtatacgggt tacccccatt gccacgttgc gccatccttt ttgcaatcag tgaccacttt 2880
tccaagcaaa aataacgcca agcagaacga agacgttctt tttaagaagc gagaacacca 2940
gaagttcgtg ctgtcggggc atgcggcgac gaattggcgg ataaagggga tctgcaggtc 3000
ccgagcctca cggcggcgag tgcgggggtt ccaagggggc agcgccacct tgggcaaggc 3060
cgaaggccgc gcagtcgatc aacaagcccc ggaggggcca ctttttgccg gagggggagc 3120
cgcgccgaag gcgtggggga accccgcagg ggtgcccttc tttgggcacc aaagaactag 3180
atatagggcg aaatgcgaaa gacttaaaaa tcaacaactt aaaaaagggg ggtacgcaac 3240
agctcattgc ggcacccccc gcaatagctc attgcgtagg ttaaagaaaa tctgtaattg 3300
actgccactt ttacgcaacg cataattgtt gtcgcgctgc cgaaaagttg cagctgattg 3360
cgcatggtgc cgcaaccgtg cggcacccta ccgcatggag ataagcatgg ccacgcagtc 3420
cagagaaatc ggcattcaag ccaagaacaa gcccggtcac tgggtgcaaa cggaacgcaa 3480
agcgcatgag gcgtgggccg ggcttattgc gaggaaaccc acggcggcaa tgctgctgca 3540
tcacctcgtg gcgcagatgg gccaccagaa cgccgtggtg gtcagccaga agacactttc 3600
caagctcatc ggacgttctt tgcggacggt ccaatacgca gtcaaggact tggtggccga 3660
gcgctggatc tccgtcgtga agctcaacgg ccccggcacc gtgtcggcct acgtggtcaa 3720
tgaccgcgtg gcgtggggcc agccccgcga ccagttgcgc ctgtcggtgt tcagtgccgc 3780
cgtggtggtt gatcacgacg accaggacga atcgctgttg gggcatggcg acctgcgccg 3840
catcccgacc ctgtatccgg gcgagcagca actaccgacc ggccccggcg aggagccgcc 3900
cagccagccc ggcattccgg gcatggaacc agacctgcca gccttgaccg aaacggagga 3960
atgggaacgg cgcgggcagc agcgcctgcc gatgcccgat gagccgtgtt ttctggacga 4020
tggcgagccg ttggagccgc cgacacgggt cacgctgccg cgccggtagc acttgggttg 4080
cgcagcaacc cgtaagtgcg ctgttccaga ctatcggctg tagccgcctc gccgccctat 4140
accttgtctg cctccccgcg ttgcgtcgcg gtgcatggag ccgggccacc tcgacctgaa 4200
tggaagccgg cggcacctcg ctaacggatt caccgttttt atcaggctct gggaggcaga 4260
ataaatgatc atatcgtcaa ttattacctc cacggggaga gcctgagcaa actggcctca 4320
ggcatttgag aagcacacgg tcacactgct tccggtagtc aataaaccgg taaaccagca 4380
atagacataa gcggctattt aacgaccctg ccctgaaccg acgaccgggt cgaatttgct 4440
ttcgactatc ggcgcgccag agctcatcgt taatgtcttc gtgcgccgtc agtcggcgca 4500
cgttttttct ctctggtacc gtgtcactga tctagtcaat tactcgaagt atccacaagt 4560
gaagcatact aagtaatgta caagaatcaa aaaaatcggc tacgcaagtc gcgtagccga 4620
atcatttaag gatccttcca ttcaggtcga ggtggcccgg ctccatgcac cgcgacgcaa 4680
cgcggggagg cagacaaggt atagggcggc gcctacaatc catgccaacc cgttccatgt 4740
gctcgccgag gcggcataaa tcgccgtgac gatcagcggt ccagtgatcg aagttaggct 4800
ggtaagagcc gcgagcgatc cttgaagctg tccctgatgg tcgtcatcta cctgcctgga 4860
cagcatggcc tgcaacgcgg gcatcccgat gccgccggaa gcgagaagaa tcataatggg 4920
gaaggccatc cagcctcgcg tcgcgaacgc cagcaagacg tagcccagcg cgtcggccgc 4980
catgccggcg ataatggcct gcttctcgcc gaaacgtttg gtggcgggac cagtgacgaa 5040
ggcttgagcg agggcgtgca agattccgaa taccgcaagc gacaggccga tcatcgtcgc 5100
gctccagcga aagcggtcct cgccgaaaat gacccagagc gctgccggca cctgtcctac 5160
gagttgcatg ataaagaaga cagtcataag tgcggcgacg atagtcatgc cccgcgccca 5220
ccggaaggag ctgactgggt tgaaggctct caagggcatc ggtcgacgct ctcccttatg 5280
cgactcctgc attaggaagc agcccagtag taggttgagg ccgttgagca ccgccgccgc 5340
aaggaatggt gcatgcaagg agatggcgcc caacagtccc ccggccacgg ggcctgccac 5400
catacccacg ccgaaacaag cgctcatgag cccgaagtgg cgagcccgat cttccccatc 5460
ggtgatgtcg gcgatatagg cgccagcaac cgcacctgtg gcgccggtga tgccggccac 5520
gatgcgtccg gcgtacaaga tccacaggac gggtgtggtc gccatgatcg cgtagtcgat 5580
agtggctcca agtagcgaag cgagcaggac tgggcggcgg ccaaagcggt cggacagtgc 5640
tccgagaacg ggtgcgcata gaaattgcat caacgcatat agcgctagca gcacgccata 5700
gtgactggcg atgctgtcgg aatggacgat atcccgcaag aggcccggca gtaccggcat 5760
aaccaagcct atgcctacag catccagggt gacggtgccg aggatgacga tgagcgcatt 5820
gttagatttc atacacggtg cctgactgcg ttagcaattt aactgtgata aactaccgca 5880
ttaaagccga gcgatgataa gctgtcaaac atgagatccg ataaatcgat tgatagattt 5940
aaataagaac tgcagaagct agcttagatg ctcgtgaaat tgacgtgggc gctttgcagg 6000
gccgtcttaa tggcgttggt gtccacgagg atcgagtcgg gtgcggaaaa cggacggttc 6060
ttgttggtga aatcgctgtt accaatgtac agcgattcct tgttacgcag cgcctggatg 6120
tgccagcggg accacgaatc ccaatacttc tggcgatccg gcgagatacc ttggctggtg 6180
tagccggtcg tcgggctgtt catcaacgag tcggtgcggt gcgagcccag cgtcagcggc 6240
aacttgatcc gatgcaccgt ggaatcgccg aagatcagct tcagacgcgc gataaattcg 6300
ctatccgcac ccgttttcac acaatcccag acaccggcct tctgcaagac gtcggcacgg 6360
cgaaacagga gcgacgacgg attcagacgc ttcaaggggt acactgcgcg ggcatagaaa 6420
ataccgttgt cttgcaggcg cacccagtcc gagatggagc agatgagctt cggattgagc 6480
aacaaggggg agatttggcg gaacagcttt tccggatggc tccagtcatc cgaatcgtgg 6540
caggtgacga actcgccctt cgcttggatc aagccgatac gcttcgcggc ataggtgccg 6600
acattctgcg gcaggctaat gatcttgatg cgcgtgtctt tgagggcgag ccgctggaga 6660
cgaaacaggg tgtcatcggt gctcgcgtca tccacaatga tcagctcgaa ggaacggtag 6720
gtctgattga ggagcgaaat caccgcattt tccacgcggc gacccgtatt ataggtggtc 6780
atcaggatgg agatcaacgg ccccgtctgg gccgggtacg ggatgctggt gatgatgttg 6840
cacggggaga gcggggagct gttgtccgtc aaggccacgg ggctgaggcc gaagtattta 6900
tagtattcat tcagccgatt caggctaatt tcggcggttt cgcggaaggc gttattttgc 6960
agcagcagga tatccgggct atagacgata tcggatgcgt cgatctgggc gagggtcgag 7020
atggcctttt gggtcaggcc gatccggagt tgcagtgcgg tatacaggtc cagcgggcag 7080
ttgtccacgt tgtccaacag gctcaggcta aaggtcggcg agtaggacgc cagggttttc 7140
gccagttcca ctttctgatg ggtatcggtg aactcgtcct tgaactccat cagcagctcg 7200
ggcgtcaggc tgatgtcgcc gcaggcgatt tttgcgatct tgattgccag tttgcagcgc 7260
caatcggacg gggtatccgt caagttatgc agcgaccagt acatattcag acgatacatc 7320
gcgaggatgc gtttcgactg ccagaaccgg caatcatcct ggatggccgc gagcgcgtgg 7380
acgtagcggc tctttttgag cagccacaag aatttgagat tattgaacat ttattaacct 7440
cctgctagca acttaagtta cgaatcgacg ccgaacaggt cgcgggtgta gactttctcc 7500
gagacatctt ccagttcgct ggtgcggcga ttcgccacaa tgacatcgac gcgctcctta 7560
aaggaattga tgtcgcgctc gacgtaggaa ccgaagaagt agggttcttt caggaccggc 7620
tcgtacacca caatctcgat acccttggcc ttcaaacgtt tcatgacccc ctggatgctg 7680
ctggcccgga aattgtcgct acccgccttc atgatcaggc gatagatacc gaccactttg 7740
ggcttacggg acaggatgtc ctcggccacg aagtccttac gggtcgtatt cgcatccacg 7800
atggcctgga tcaggttttg cgggacgtcg cgataattgg ccaacagctg cttcgtatcc 7860
ttcggcagac agtaaccgcc gtagccgaag gacgggttgt tgtaatgttg accaatgcgc 7920
ggatcgaggg agacgccttc gatgatttgt ttggtatcca ggccgtgcac gctcgcgtag 7980
gtgtccagct cgttaaagta cgcgatacgc atcgccagat acgtgttcgc gaacagtttg 8040
atggcttctg cctcgggcga atccgtcagc aggatcggaa tatccttttt gatggcacct 8100
tccgacagga gttcggcgaa cttccgtgcg cgttccgacg attcgcccac gacaatgcgg 8160
ctcggataga gattatcata cagggctttg ccttcgcgca ggaactccgg ggaaaagatg 8220
atattattcg tgttcagatc gcgcttcagg cgttcggtga acccgacggg gacggtggat 8280
ttgataatga tggtcgcgtt cgggttaatg gacagcacgt cacacgcgac gctttcgacg 8340
ctcagggtat caaagttgtt attaatcgga tcatagttcg tcggggtggc gatgatcacg 8400
tagtctgcat cgcgatatgc ctcgtatttt tccgtcgtcg cgtagaggtt cagcttacga 8460
ttggagagaa acttctggat ttccgggtcg caaatcggcg agattttctt gttaatgagc 8520
tggaccttct tcgggtcgat gtccagggcg atgatgtcgt gtttttggga gaggaggatc 8580
gcaatgctga tacccacata gccgacgccg gccacggcaa ttttcattta ttaacctcct 8640
taagtgaatt caaactagtt tacaagtcgt tttcgatctt ctcccaggta tatttgcgac 8700
attcattcaa gttggtcagc ggcgagtatt tgtacttttt gataccgagg cgcgacaggc 8760
tttcgttcac caccttgaaa tggttttcct tttggatgtc cagtttcttg atcgacgtgt 8820
tctcgccgtg caggacacgg ttgtagcaaa tcttattgat atgcttaaac gggccgactt 8880
cgctgagttt caaatacata tcgtaatcca ccgcattgct gatgctctcg ttgaagcctt 8940
cggtgaggtt ccatgcacgc gccgtgaaca tacggaagtg gtggcagatc atcgcgctcg 9000
tgagcttttc gcggctgtaa atcggccagt tgtagccatt gctaatcaag ttaccttcac 9060
gatcaatatt gcgattggtg gtgtacacgc aggcgaggct caggtctttg cgaaattcat 9120
ccagacacag ttccacggca tcgggctcca ggaaatcatc ggaatccagc tgcccgatgt 9180
agaaaccccg gcacaggcgg actgcggtat tcgaggcgga gccgatgcct ttgtttttct 9240
ggctgatgaa acggacgcgc gggtggtttg cgtaatgttc ttgcaggatg cgcagcgtat 9300
catcggtgct cccgtcatcg cagatgcaga cctccagatc ggtgatcgtt tggttcagtg 9360
ccgattcgac gcagcgcacg atatatttgc tgcaattata cgcggggatg tagatgctca 9420
ccaggggcac acgtttcagg gtggcgctct cgattttctc cttcttgcga taaaagtagg 9480
gcaccttctg ctgcaacagc tggacggtaa tgtttttacc tgccgcgcga tcggtttcgt 9540
tctccttacc gggcggttcc tgatgatatg ccatcgcgcc ttccacgcta cggaaataac 9600
aaccctcgcg gtacagccga tagccgaact cattatcctc accgccccaa tgcgtgaact 9660
cttcgtcaaa ccaacccgcg cgaaacagcc acttctttgc aaacgccaca ttgccaccgc 9720
taaagaaccg gaacggggtg ttgcacaggc gcagattgtc ggtattcttg aaatgttcga 9780
tgcgccaatc gacggatttg ttctgctcga ccttgcctgc gacctgatta ttggtaataa 9840
tctccgggat ttcattgatc aggcttttct gggacaaaaa gtccagatag gtatgcttcg 9900
acgtgtcgat gtatttacgc gggccaatca gtgccacgtt atcatccacg gccaggagtt 9960
ccatatagga ctgcacccac aacgggttcg gcgccatatc gcagtccaag atcgccacgt 10020
agttgtattt cgctgcccgc aggcccaggt tccgcacggc gcacagctgg tagccgtagt 10080
ctttctggcg gacgtatttg atgttcagca acgactcgaa ctcgcggacg atctcttcga 10140
tgttttcctt ggaaccgtca tccgcgacga tgacctcata gtcataaatc gttttctgat 10200
tgcagaggca ggccagggtg atcgccagga ttttggcgcg attgtacgtc ggaatcacga 10260
tggacaggcc gtcgatgatc agttgcttgc gcggataatc atccagttct ttacgtttcc 10320
ctgcccagac gtagtcgttc gtgctttccg gcagcggcgg caaggtcagg tcgctcggcc 10380
aatccagcgg aatgggttcg acttctttca attcggcgcg ctcggatttc tttgcggtaa 10440
tttcccgata tttgctaatg atttcattct tttccacctc attcagcgag atcgcctttg 10500
cattgctgca cataattttg gttgccgcgt cgatatcaat gaccgctttc cgattcagct 10560
tgtccacttc ttcgctcaga ttcagggcgg tttggcacag cttgatattg gcttccaccc 10620
agctcacatc atagatttcc gccacttttt caaacaggga gagggcttgg cggtagttct 10680
tattcttata cagattgatt gcctggttca aaatgctcat ttattaacct cctactagtg 10740
aattttcgaa ttacttaccg cagtacttga cacccacctg ggaattgttt ttggtgcgtt 10800
tgaattggcg gatggtacgg tagatgctaa agggcaggct gatcagaccg agcggaaaat 10860
tgttcttatt gatgatgagc ttgcccagct gatagctcag gtgtttcttg acccgttcgg 10920
cttcgtgttt atccgcgtac aggaagatgc tcggcaggct cacttggtac tccgaatcat 10980
atttcttctt ccaggtccgc cattcgctga tcaacgcaaa cggaatcgag atcagaccga 11040
ggaacgtctt ggagcggctc accatcaccg cacccaggcg gtagccgata tcttgcttga 11100
tgcgttcggc cgcaccatac agctccggca gttgtttctt ttcgagacgt tgattgtcga 11160
tgaagtactg ttcgagcttt tgctgcacca gatgcagctg attgagcagc aattcttttt 11220
cgcacgacag cttttcgagg cgctgttgtt gcagttcatt tttgttctgt tcctttttca 11280
gcagggactc gaagttctcg atcgcgcact ccagttcctg gacctggatg gttttgtttt 11340
taatgatcag atcatactgg atcagttctt ccttgctatc cgacagctct ttcagaatgg 11400
cttgataggc gttcagctgt ttggacgtgt gcagttcgtt gtccagaatg atctttttgc 11460
tgctctggta cagaccgttc acgatatcga gggtgatctg gcgttgttta atgaacgtct 11520
cccaaataaa ggacggctta tagttttcct tctccagcac ccgcaagggg gtgttggcgt 11580
tcgattgcaa ttcaaagtac agttccttgc aatcgggata gtcgttcagg acgttgaaga 11640
tcaagtactc ctccgtctcg ctttgcttga aaatgatatc cccggtcccg atgtcaatac 11700
cgctgaggga catgatctcc tgatgttctt tttccagcgt aatggaggct tcggcggtct 11760
taaagtcatt cacgctctgc tccagcgagt ggttgatggt attggagaac gacaacccga 11820
atttcagttt cagtttgtgt tgcagttgct ggatgcagtc ctcggcgttg cgcttcacct 11880
gttcgctcga caccagcagg caccgacccc ggttgttgag gaagaagtgc agcaaggcgg 11940
tgttgtatgc cagccagttt ttgatcagat gctccgaggt atagttgctg gagatgttct 12000
ggtccgagaa gtagttcgtc aggatgcttt tggggtggtc gtagatgagg ataaaggtga 12060
tgttctcatc caccgatttc caatattcca acgtgtgaat tgcgttgggg tcgctccaac 12120
cgcacagttt ctggttcagg ttggacagca tcagatccaa tgcgataccg ttccagacgg 12180
tgctcacatg gagcggttca aagtcggcgg aatcggtcac cgtatagatg tccggcgact 12240
ggtacgcctt ccgcagcgtc tgggtgatgt cctggggcga gaggttctca cgtttggacg 12300
ggcacaggga gttcatgccg cgctgatgca ggagttcttc cacgatttgg tagttgctgc 12360
tcggatggcc cacgatcacc aggcggttca tttattaacc tcctttcgaa aatgaacggt 12420
ccgaattaac ctaggttatg aggtcagcat tgcttcttca cgcggtgtta attaagtaat 12480
cgatagtgat ttaaatatgc aagatctagt tacctgcagg attattgttt ctgttgcata 12540
aagcctaagg ggtaggcctt tctagagata gccatttttt gcactcctgt atccgcttct 12600
tgcaaggctg gacttatccc tatcaaaccg gacactgcag gctgacaagc tttcattaca 12660
tatgaagagt ttgtagaaac gcaaaaaggc catccgtcag gatggccttc taagaaggct 12720
cgagtggcgc gcctaagtcg aatttctgcc attcatccgc ttattatcac ttattcaggc 12780
gtagcaacca ggcgtttaag ggcaccaata actgccttaa aaaaattacg ccccgccctg 12840
ccactcatcg cagtactgtt gtaattcatt aagcattctg ccgacatgga agccatcaca 12900
aacggcatga tgaacctgaa tcgccagcgg catcagcacc ttgtcgcctt gcgtataata 12960
tttgcccatg gtgaaaacgg gggcgaagaa gttgtccata ttggccacgt ttaaatcaaa 13020
actggtgaaa ctcacccagg gattggctga gacgaaaaac atattctcaa taaacccttt 13080
agggaaatag gccaggtttt caccgtaaca cgccacatct tgcgaatata tgtgtagaaa 13140
ctgccggaaa tcgtcgtggt attcactcca gagcgatgaa aacgtttcag tttgctcatg 13200
gaaaacggtg taacaagggt gaacactatc ccatatcacc agctcaccgt ctttcattgc 13260
catacggaat tccggatgag cattcatcag gcgggcaaga atgtgaataa aggccggata 13320
aaacttgtgc ttatttttct ttacggtctt taaaaaggcc gtaatatcca gctgaacggt 13380
ctggttatag gtacattgag caactgactg aaatgcctca aaatgttctt tacgatgcca 13440
ttgggatata tcaacggtgg tatatccagt gatttttttc tccattttag cttccttagc 13500
tcctgaaaat ctcgataact caaaaaatac gcccggtagt gatcttattt cattatggtg 13560
aaagttggaa cctcttacgt gccgatcaac gtctcatttt cgccaaaagt tggcccaggg 13620
cttcccggta tcaacaggga caccaggatt tatttattct gcgaagtgat cttccgtcac 13680
aggtatttat tcggcgcaaa gggcctcgtg atacgcctat ttttataggt taatgtcatg 13740
ataataatgg tttcttagac gtcaggtggc acttttcggg gaaatgtgcg cgcccgcgtt 13800
cctgctggcg ctgggcctgt ttctggcgct ggacttcccg ctgttccgtc agcagctttt 13860
cgcccacggc cttgatgatc gcggcggcct tggcctgcat atcccgattc aacggcccca 13920
gggcgtccag aacgggcttc aggcgctccc gaaggt 13956
<210> 153
<211> 12916
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic plasmid pCX075
<400> 153
ctcgggccgt ctcttgggct tgatcggcct tcttgcgcat ctcacgcgct cctgcggcgg 60
cctgtagggc aggctcatac ccctgccgaa ccgcttttgt cagccggtcg gccacggctt 120
ccggcgtctc aacgcgcttt gagattccca gcttttcggc caatccctgc ggtgcatagg 180
cgcgtggctc gaccgcttgc gggctgatgg tgacgtggcc cactggtggc cgctccaggg 240
cctcgtagaa cgcctgaatg cgcgtgtgac gtgccttgct gccctcgatg ccccgttgca 300
gccctagatc ggccacagcg gccgcaaacg tggtctggtc gcgggtcatc tgcgctttgt 360
tgccgatgaa ctccttggcc gacagcctgc cgtcctgcgt cagcggcacc acgaacgcgg 420
tcatgtgcgg gctggtttcg tcacggtgga tgctggccgt cacgatgcga tccgccccgt 480
acttgtccgc cagccacttg tgcgccttct cgaagaacgc cgcctgctgt tcttggctgg 540
ccgacttcca ccattccggg ctggccgtca tgacgtactc gaccgccaac acagcgtcct 600
tgcgccgctt ctctggcagc aactcgcgca gtcggcccat cgcttcatcg gtgctgctgg 660
ccgcccagtg ctcgttctct ggcgtcctgc tggcgtcagc gttgggcgtc tcgcgctcgc 720
ggtaggcgtg cttgagactg gccgccacgt tgcccatttt cgccagcttc ttgcatcgca 780
tgatcgcgta tgccgccatg cctgcccctc ccttttggtg tccaaccggc tcgacggggg 840
cagcgcaagg cggtgcctcc ggcgggccac tcaatgcttg agtatactca ctagactttg 900
cttcgcaaag tcgtgaccgc ctacggcggc tgcggcgccc tacgggcttg ctctccgggc 960
ttcgccctgc gcggtcgctg cgctcccttg ccagcccgtg gatatgtgga cgatggccgc 1020
gagcggccac cggctggctc gcttcgctcg gcccgtggac aaccctgctg gacaagctga 1080
tggacaggct gcgcctgccc acgagcttga ccacagggat tgcccaccgg ctacccagcc 1140
ttcgaccaca tacccaccgg ctccaactgc gcggcctgcg gccttgcccc atcaattttt 1200
ttaattttct ctggggaaaa gcctccggcc tgcggcctgc gcgcttcgct tgccggttgg 1260
acaccaagtg gaaggcgggt caaggctcgc gcagcgaccg cgcagcggct tggccttgac 1320
gcgcctggaa cgacccaagc ctatgcgagt gggggcagtc gaaggcgaag cccgcccgcc 1380
tgccccccga gacctgcaga tccacatcct tgaaggccgc agcgacgagc agaaggaaac 1440
cctcattcgg gaagtcagcg aggccatctc gcgctccctg gatgcgccgc tgaccagcgt 1500
gcgagtgatt atcacggaga tggccaaggg ccacttcggc atcggcggcg aactggccag 1560
caaggtcaga cgctgaagtg gagatgccca agggcacttc gggtcgagga acccgacctg 1620
cattgggacg cggccacgga gagcgcgggc aaacgccggc actatagcca gtggagtttg 1680
taaaacgcta tttcagagct tggagagtgt ctaagaaagc cggggcgatg ccaacccatc 1740
ccttcttcgg ctatgcatcg ttcgtaatca agccacttcc tttttgcatt gacgcagggt 1800
gtcggaaggc aactcgccga acgcgctcct atagttttca gcgaagcgtc ccaaatgtaa 1860
gaagccgtag tctagggcta tctcagttat actacgcaca ttggcactgg gatcgttcaa 1920
gcaggcgcgg atgctttcga gcttgcggtt gcggatgtag ttcttcggcg tggtgccggc 1980
atgcttctcg aacaaattgt agagcgagcg tggactcatc atcgccagct ccgctaaccg 2040
ctcaaggctg atattccgtt tgagattctc ctcaatgaat tgaacgactc gctcgaaaga 2100
cgggttacct ttgctgaaaa tttcacggct gacattgctg cccagcattt cgagcagctt 2160
ggaagcgatg atccccgcat agtgctcttg gacccgaggc atcgactttg tatgttccgc 2220
ttcgtcacaa actaacccga gtagattgat aaagccatcg agttgctgga gattgtgtcg 2280
cgcggcgaaa cggataccct ccctcggctt gtgccaattg ttgtcactgc atgcccgatc 2340
aaggaccact gagggcaatt taacgataaa tttctcgcaa tcttctgaat aggtcaggtc 2400
ggcttggtca tccggattga gcagcaatag ttcgcccggc gcaaaatagt gctcctggcc 2460
atggccacgc cacaggcaat ggcctttgag tattatttgc agatgataac aggtctctaa 2520
tccaggcgag attaccctca cgctaccgcc gtagctgatt cgacacaggt cgaggcatcc 2580
gaagattctg tggtgcagcc tgcctgccgg gcgcccgccc ttgggcaggc gaatagagtg 2640
cgtaccgaca tactggttaa cataatcgga gactgcatag ggctcggcgt ggacgaagat 2700
ctgacttttc tcgttcaata agcaaaaatc catagttcac ggttctctta ttttaatgtg 2760
ggctgcttgg tgtgatgtag aaaggcgcca agtcgatgaa aatgcatctc gacgtgatgc 2820
gtatacgggt tacccccatt gccacgttgc gccatccttt ttgcaatcag tgaccacttt 2880
tccaagcaaa aataacgcca agcagaacga agacgttctt tttaagaagc gagaacacca 2940
gaagttcgtg ctgtcggggc atgcggcgac gaattggcgg ataaagggga tctgcaggtc 3000
ccgagcctca cggcggcgag tgcgggggtt ccaagggggc agcgccacct tgggcaaggc 3060
cgaaggccgc gcagtcgatc aacaagcccc ggaggggcca ctttttgccg gagggggagc 3120
cgcgccgaag gcgtggggga accccgcagg ggtgcccttc tttgggcacc aaagaactag 3180
atatagggcg aaatgcgaaa gacttaaaaa tcaacaactt aaaaaagggg ggtacgcaac 3240
agctcattgc ggcacccccc gcaatagctc attgcgtagg ttaaagaaaa tctgtaattg 3300
actgccactt ttacgcaacg cataattgtt gtcgcgctgc cgaaaagttg cagctgattg 3360
cgcatggtgc cgcaaccgtg cggcacccta ccgcatggag ataagcatgg ccacgcagtc 3420
cagagaaatc ggcattcaag ccaagaacaa gcccggtcac tgggtgcaaa cggaacgcaa 3480
agcgcatgag gcgtgggccg ggcttattgc gaggaaaccc acggcggcaa tgctgctgca 3540
tcacctcgtg gcgcagatgg gccaccagaa cgccgtggtg gtcagccaga agacactttc 3600
caagctcatc ggacgttctt tgcggacggt ccaatacgca gtcaaggact tggtggccga 3660
gcgctggatc tccgtcgtga agctcaacgg ccccggcacc gtgtcggcct acgtggtcaa 3720
tgaccgcgtg gcgtggggcc agccccgcga ccagttgcgc ctgtcggtgt tcagtgccgc 3780
cgtggtggtt gatcacgacg accaggacga atcgctgttg gggcatggcg acctgcgccg 3840
catcccgacc ctgtatccgg gcgagcagca actaccgacc ggccccggcg aggagccgcc 3900
cagccagccc ggcattccgg gcatggaacc agacctgcca gccttgaccg aaacggagga 3960
atgggaacgg cgcgggcagc agcgcctgcc gatgcccgat gagccgtgtt ttctggacga 4020
tggcgagccg ttggagccgc cgacacgggt cacgctgccg cgccggtagc acttgggttg 4080
cgcagcaacc cgtaagtgcg ctgttccaga ctatcggctg tagccgcctc gccgccctat 4140
accttgtctg cctccccgcg ttgcgtcgcg gtgcatggag ccgggccacc tcgacctgaa 4200
tggaagccgg cggcacctcg ctaacggatt caccgttttt atcaggctct gggaggcaga 4260
ataaatgatc atatcgtcaa ttattacctc cacggggaga gcctgagcaa actggcctca 4320
ggcatttgag aagcacacgg tcacactgct tccggtagtc aataaaccgg taaaccagca 4380
atagacataa gcggctattt aacgaccctg ccctgaaccg acgaccgggt cgaatttgct 4440
ttcgactatc ggcgcgccag agctcatcgt taatgtcttc gtgcgccgtc agtcggcgca 4500
cgttttttct ctctggtacc gtgtcactga tctagtcaat tactcgaagt atccacaagt 4560
gaagcatact aagtaatgta caagaatcaa aaaaatcggc tacgcaagtc gcgtagccga 4620
atcatttaag gatccttcca ttcaggtcga ggtggcccgg ctccatgcac cgcgacgcaa 4680
cgcggggagg cagacaaggt atagggcggc gcctacaatc catgccaacc cgttccatgt 4740
gctcgccgag gcggcataaa tcgccgtgac gatcagcggt ccagtgatcg aagttaggct 4800
ggtaagagcc gcgagcgatc cttgaagctg tccctgatgg tcgtcatcta cctgcctgga 4860
cagcatggcc tgcaacgcgg gcatcccgat gccgccggaa gcgagaagaa tcataatggg 4920
gaaggccatc cagcctcgcg tcgcgaacgc cagcaagacg tagcccagcg cgtcggccgc 4980
catgccggcg ataatggcct gcttctcgcc gaaacgtttg gtggcgggac cagtgacgaa 5040
ggcttgagcg agggcgtgca agattccgaa taccgcaagc gacaggccga tcatcgtcgc 5100
gctccagcga aagcggtcct cgccgaaaat gacccagagc gctgccggca cctgtcctac 5160
gagttgcatg ataaagaaga cagtcataag tgcggcgacg atagtcatgc cccgcgccca 5220
ccggaaggag ctgactgggt tgaaggctct caagggcatc ggtcgacgct ctcccttatg 5280
cgactcctgc attaggaagc agcccagtag taggttgagg ccgttgagca ccgccgccgc 5340
aaggaatggt gcatgcaagg agatggcgcc caacagtccc ccggccacgg ggcctgccac 5400
catacccacg ccgaaacaag cgctcatgag cccgaagtgg cgagcccgat cttccccatc 5460
ggtgatgtcg gcgatatagg cgccagcaac cgcacctgtg gcgccggtga tgccggccac 5520
gatgcgtccg gcgtacaaga tccacaggac gggtgtggtc gccatgatcg cgtagtcgat 5580
agtggctcca agtagcgaag cgagcaggac tgggcggcgg ccaaagcggt cggacagtgc 5640
tccgagaacg ggtgcgcata gaaattgcat caacgcatat agcgctagca gcacgccata 5700
gtgactggcg atgctgtcgg aatggacgat atcccgcaag aggcccggca gtaccggcat 5760
aaccaagcct atgcctacag catccagggt gacggtgccg aggatgacga tgagcgcatt 5820
gttagatttc atacacggtg cctgactgcg ttagcaattt aactgtgata aactaccgca 5880
ttaaagccga gcgatgataa gctgtcaaac atgagatccg ataaatcgat tgatagattt 5940
aaataagaac tgcagaagct agcttagatg ctcgtgaaat tgacgtgggc gctttgcagg 6000
gccgtcttaa tggcgttggt gtccacgagg atcgagtcgg gtgcggaaaa cggacggttc 6060
ttgttggtga aatcgctgtt accaatgtac agcgattcct tgttacgcag cgcctggatg 6120
tgccagcggg accacgaatc ccaatacttc tggcgatccg gcgagatacc ttggctggtg 6180
tagccggtcg tcgggctgtt catcaacgag tcggtgcggt gcgagcccag cgtcagcggc 6240
aacttgatcc gatgcaccgt ggaatcgccg aagatcagct tcagacgcgc gataaattcg 6300
ctatccgcac ccgttttcac acaatcccag acaccggcct tctgcaagac gtcggcacgg 6360
cgaaacagga gcgacgacgg attcagacgc ttcaaggggt acactgcgcg ggcatagaaa 6420
ataccgttgt cttgcaggcg cacccagtcc gagatggagc agatgagctt cggattgagc 6480
aacaaggggg agatttggcg gaacagcttt tccggatggc tccagtcatc cgaatcgtgg 6540
caggtgacga actcgccctt cgcttggatc aagccgatac gcttcgcggc ataggtgccg 6600
acattctgcg gcaggctaat gatcttgatg cgcgtgtctt tgagggcgag ccgctggaga 6660
cgaaacaggg tgtcatcggt gctcgcgtca tccacaatga tcagctcgaa ggaacggtag 6720
gtctgattga ggagcgaaat caccgcattt tccacgcggc gacccgtatt ataggtggtc 6780
atcaggatgg agatcaacgg ccccgtctgg gccgggtacg ggatgctggt gatgatgttg 6840
cacggggaga gcggggagct gttgtccgtc aaggccacgg ggctgaggcc gaagtattta 6900
tagtattcat tcagccgatt caggctaatt tcggcggttt cgcggaaggc gttattttgc 6960
agcagcagga tatccgggct atagacgata tcggatgcgt cgatctgggc gagggtcgag 7020
atggcctttt gggtcaggcc gatccggagt tgcagtgcgg tatacaggtc cagcgggcag 7080
ttgtccacgt tgtccaacag gctcaggcta aaggtcggcg agtaggacgc cagggttttc 7140
gccagttcca ctttctgatg ggtatcggtg aactcgtcct tgaactccat cagcagctcg 7200
ggcgtcaggc tgatgtcgcc gcaggcgatt tttgcgatct tgattgccag tttgcagcgc 7260
caatcggacg gggtatccgt caagttatgc agcgaccagt acatattcag acgatacatc 7320
gcgaggatgc gtttcgactg ccagaaccgg caatcatcct ggatggccgc gagcgcgtgg 7380
acgtagcggc tctttttgag cagccacaag aatttgagat tattgaacat ttattaacct 7440
cctgctagca acttaagtta cgaatcgacg ccgaacaggt cgcgggtgta gactttctcc 7500
gagacatctt ccagttcgct ggtgcggcga ttcgccacaa tgacatcgac gcgctcctta 7560
aaggaattga tgtcgcgctc gacgtaggaa ccgaagaagt agggttcttt caggaccggc 7620
tcgtacacca caatctcgat acccttggcc ttcaaacgtt tcatgacccc ctggatgctg 7680
ctggcccgga aattgtcgct acccgccttc atgatcaggc gatagatacc gaccactttg 7740
ggcttacggg acaggatgtc ctcggccacg aagtccttac gggtcgtatt cgcatccacg 7800
atggcctgga tcaggttttg cgggacgtcg cgataattgg ccaacagctg cttcgtatcc 7860
ttcggcagac agtaaccgcc gtagccgaag gacgggttgt tgtaatgttg accaatgcgc 7920
ggatcgaggg agacgccttc gatgatttgt ttggtatcca ggccgtgcac gctcgcgtag 7980
gtgtccagct cgttaaagta cgcgatacgc atcgccagat acgtgttcgc gaacagtttg 8040
atggcttctg cctcgggcga atccgtcagc aggatcggaa tatccttttt gatggcacct 8100
tccgacagga gttcggcgaa cttccgtgcg cgttccgacg attcgcccac gacaatgcgg 8160
ctcggataga gattatcata cagggctttg ccttcgcgca ggaactccgg ggaaaagatg 8220
atattattcg tgttcagatc gcgcttcagg cgttcggtga acccgacggg gacggtggat 8280
ttgataatga tggtcgcgtt cgggttaatg gacagcacgt cacacgcgac gctttcgacg 8340
ctcagggtat caaagttgtt attaatcgga tcatagttcg tcggggtggc gatgatcacg 8400
tagtctgcat cgcgatatgc ctcgtatttt tccgtcgtcg cgtagaggtt cagcttacga 8460
ttggagagaa acttctggat ttccgggtcg caaatcggcg agattttctt gttaatgagc 8520
tggaccttct tcgggtcgat gtccagggcg atgatgtcgt gtttttggga gaggaggatc 8580
gcaatgctga tacccacata gccgacgccg gccacggcaa ttttcattta ttaacctcct 8640
taagtgaatt caaactagtg aattttcgaa ttacttaccg cagtacttga cacccacctg 8700
ggaattgttt ttggtgcgtt tgaattggcg gatggtacgg tagatgctaa agggcaggct 8760
gatcagaccg agcggaaaat tgttcttatt gatgatgagc ttgcccagct gatagctcag 8820
gtgtttcttg acccgttcgg cttcgtgttt atccgcgtac aggaagatgc tcggcaggct 8880
cacttggtac tccgaatcat atttcttctt ccaggtccgc cattcgctga tcaacgcaaa 8940
cggaatcgag atcagaccga ggaacgtctt ggagcggctc accatcaccg cacccaggcg 9000
gtagccgata tcttgcttga tgcgttcggc cgcaccatac agctccggca gttgtttctt 9060
ttcgagacgt tgattgtcga tgaagtactg ttcgagcttt tgctgcacca gatgcagctg 9120
attgagcagc aattcttttt cgcacgacag cttttcgagg cgctgttgtt gcagttcatt 9180
tttgttctgt tcctttttca gcagggactc gaagttctcg atcgcgcact ccagttcctg 9240
gacctggatg gttttgtttt taatgatcag atcatactgg atcagttctt ccttgctatc 9300
cgacagctct ttcagaatgg cttgataggc gttcagctgt ttggacgtgt gcagttcgtt 9360
gtccagaatg atctttttgc tgctctggta cagaccgttc acgatatcga gggtgatctg 9420
gcgttgttta atgaacgtct cccaaataaa ggacggctta tagttttcct tctccagcac 9480
ccgcaagggg gtgttggcgt tcgattgcaa ttcaaagtac agttccttgc aatcgggata 9540
gtcgttcagg acgttgaaga tcaagtactc ctccgtctcg ctttgcttga aaatgatatc 9600
cccggtcccg atgtcaatac cgctgaggga catgatctcc tgatgttctt tttccagcgt 9660
aatggaggct tcggcggtct taaagtcatt cacgctctgc tccagcgagt ggttgatggt 9720
attggagaac gacaacccga atttcagttt cagtttgtgt tgcagttgct ggatgcagtc 9780
ctcggcgttg cgcttcacct gttcgctcga caccagcagg caccgacccc ggttgttgag 9840
gaagaagtgc agcaaggcgg tgttgtatgc cagccagttt ttgatcagat gctccgaggt 9900
atagttgctg gagatgttct ggtccgagaa gtagttcgtc aggatgcttt tggggtggtc 9960
gtagatgagg ataaaggtga tgttctcatc caccgatttc caatattcca acgtgtgaat 10020
tgcgttgggg tcgctccaac cgcacagttt ctggttcagg ttggacagca tcagatccaa 10080
tgcgataccg ttccagacgg tgctcacatg gagcggttca aagtcggcgg aatcggtcac 10140
cgtatagatg tccggcgact ggtacgcctt ccgcagcgtc tgggtgatgt cctggggcga 10200
gaggttctca cgtttggacg ggcacaggga gttcatgccg cgctgatgca ggagttcttc 10260
cacgatttgg tagttgctgc tcggatggcc cacgatcacc aggcggttca tttattaacc 10320
tcctttcgaa aatgaacggt ccgttaaata tagccattcg gattcttcat ctgccagcgc 10380
caggcgtcct ccagcatggt ttcgagttcc cgcttggctt tccagttcag atatttgttg 10440
gccttttcgg gggaggacca gctctccgcg atatcaccgt cacggcggct cacgatttca 10500
tacggaatcc gcacgccgga aatcttttca aaggtggaca ccagttccag caccgaataa 10560
cctttacccg tgcccaaatt aaagacgtgg tagttggtgt tattgtcgcg gaagagatag 10620
gacagcgctg cgacgtgccc ttcggccagg tccatcacat ggatatagtc acggaccccc 10680
gtgccgtctt tggtgggata atcaccaccg aacaccatca gtttttccag tttccccatc 10740
gcgacctgca agatgtacgg caccaagttg gaggggatgt ctgccgggct ttcaccaatc 10800
ataccggatt cgtgggcgcc cgtcggatta aagtagcgca agcagaggaa attcgtgtcg 10860
gagtatttct tggcgatgtc gcggatcatc agctccgaga tgtacttgga cgtaccatac 10920
ggattcagcg tgccaccaat atggcagtct tcggtgacgg gcatgatctt gctttcccca 10980
tacaccgtcg ccgacgagct aaagatgaag ttggcgacgt cgttcttgat ggcgcaattg 11040
atgagttgca gggtgccgct cacgttgttg tcatagtaga agatgggctt gatcaggctt 11100
tctgcgaccg atttcgcacc tgcaaagtgc atgatgcagt cgaatttgtg tttcttcagg 11160
atctggttca cttccttctc gttgttgata ttgagttcgt agaacgtgac tttcttcttt 11220
gcgatcagct caatgcgacg gatgctttcg cagctgctgt tgatgagatt gtcaatgatg 11280
acgacattgt agcctttgtt cagcaggcag agcgacgtgt ggctgccgat gtagcctgca 11340
ccgccggtga ccaggatgtt catttattaa cctcctcggt ccgaattaac ctaggttatg 11400
aggtcagcat tgcttcttca cgcggtgtta attaagtaat cgatagtgat ttaaatatgc 11460
aagatctagt tacctgcagg attattgttt ctgttgcata aagcctaagg ggtaggcctt 11520
tctagagata gccatttttt gcactcctgt atccgcttct tgcaaggctg gacttatccc 11580
tatcaaaccg gacactgcag gctgacaagc tttcattaca tatgaagagt ttgtagaaac 11640
gcaaaaaggc catccgtcag gatggccttc taagaaggct cgagtggcgc gcctaagtcg 11700
aatttctgcc attcatccgc ttattatcac ttattcaggc gtagcaacca ggcgtttaag 11760
ggcaccaata actgccttaa aaaaattacg ccccgccctg ccactcatcg cagtactgtt 11820
gtaattcatt aagcattctg ccgacatgga agccatcaca aacggcatga tgaacctgaa 11880
tcgccagcgg catcagcacc ttgtcgcctt gcgtataata tttgcccatg gtgaaaacgg 11940
gggcgaagaa gttgtccata ttggccacgt ttaaatcaaa actggtgaaa ctcacccagg 12000
gattggctga gacgaaaaac atattctcaa taaacccttt agggaaatag gccaggtttt 12060
caccgtaaca cgccacatct tgcgaatata tgtgtagaaa ctgccggaaa tcgtcgtggt 12120
attcactcca gagcgatgaa aacgtttcag tttgctcatg gaaaacggtg taacaagggt 12180
gaacactatc ccatatcacc agctcaccgt ctttcattgc catacggaat tccggatgag 12240
cattcatcag gcgggcaaga atgtgaataa aggccggata aaacttgtgc ttatttttct 12300
ttacggtctt taaaaaggcc gtaatatcca gctgaacggt ctggttatag gtacattgag 12360
caactgactg aaatgcctca aaatgttctt tacgatgcca ttgggatata tcaacggtgg 12420
tatatccagt gatttttttc tccattttag cttccttagc tcctgaaaat ctcgataact 12480
caaaaaatac gcccggtagt gatcttattt cattatggtg aaagttggaa cctcttacgt 12540
gccgatcaac gtctcatttt cgccaaaagt tggcccaggg cttcccggta tcaacaggga 12600
caccaggatt tatttattct gcgaagtgat cttccgtcac aggtatttat tcggcgcaaa 12660
gggcctcgtg atacgcctat ttttataggt taatgtcatg ataataatgg tttcttagac 12720
gtcaggtggc acttttcggg gaaatgtgcg cgcccgcgtt cctgctggcg ctgggcctgt 12780
ttctggcgct ggacttcccg ctgttccgtc agcagctttt cgcccacggc cttgatgatc 12840
gcggcggcct tggcctgcat atcccgattc aacggcccca gggcgtccag aacgggcttc 12900
aggcgctccc gaaggt 12916
<210> 154
<211> 13510
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic plasmid pCX092
<400> 154
ctcgggccgt ctcttgggct tgatcggcct tcttgcgcat ctcacgcgct cctgcggcgg 60
cctgtagggc aggctcatac ccctgccgaa ccgcttttgt cagccggtcg gccacggctt 120
ccggcgtctc aacgcgcttt gagattccca gcttttcggc caatccctgc ggtgcatagg 180
cgcgtggctc gaccgcttgc gggctgatgg tgacgtggcc cactggtggc cgctccaggg 240
cctcgtagaa cgcctgaatg cgcgtgtgac gtgccttgct gccctcgatg ccccgttgca 300
gccctagatc ggccacagcg gccgcaaacg tggtctggtc gcgggtcatc tgcgctttgt 360
tgccgatgaa ctccttggcc gacagcctgc cgtcctgcgt cagcggcacc acgaacgcgg 420
tcatgtgcgg gctggtttcg tcacggtgga tgctggccgt cacgatgcga tccgccccgt 480
acttgtccgc cagccacttg tgcgccttct cgaagaacgc cgcctgctgt tcttggctgg 540
ccgacttcca ccattccggg ctggccgtca tgacgtactc gaccgccaac acagcgtcct 600
tgcgccgctt ctctggcagc aactcgcgca gtcggcccat cgcttcatcg gtgctgctgg 660
ccgcccagtg ctcgttctct ggcgtcctgc tggcgtcagc gttgggcgtc tcgcgctcgc 720
ggtaggcgtg cttgagactg gccgccacgt tgcccatttt cgccagcttc ttgcatcgca 780
tgatcgcgta tgccgccatg cctgcccctc ccttttggtg tccaaccggc tcgacggggg 840
cagcgcaagg cggtgcctcc ggcgggccac tcaatgcttg agtatactca ctagactttg 900
cttcgcaaag tcgtgaccgc ctacggcggc tgcggcgccc tacgggcttg ctctccgggc 960
ttcgccctgc gcggtcgctg cgctcccttg ccagcccgtg gatatgtgga cgatggccgc 1020
gagcggccac cggctggctc gcttcgctcg gcccgtggac aaccctgctg gacaagctga 1080
tggacaggct gcgcctgccc acgagcttga ccacagggat tgcccaccgg ctacccagcc 1140
ttcgaccaca tacccaccgg ctccaactgc gcggcctgcg gccttgcccc atcaattttt 1200
ttaattttct ctggggaaaa gcctccggcc tgcggcctgc gcgcttcgct tgccggttgg 1260
acaccaagtg gaaggcgggt caaggctcgc gcagcgaccg cgcagcggct tggccttgac 1320
gcgcctggaa cgacccaagc ctatgcgagt gggggcagtc gaaggcgaag cccgcccgcc 1380
tgccccccga gacctgcaga tccacatcct tgaaggccgc agcgacgagc agaaggaaac 1440
cctcattcgg gaagtcagcg aggccatctc gcgctccctg gatgcgccgc tgaccagcgt 1500
gcgagtgatt atcacggaga tggccaaggg ccacttcggc atcggcggcg aactggccag 1560
caaggtcaga cgctgaagtg gagatgccca agggcacttc gggtcgagga acccgacctg 1620
cattgggacg cggccacgga gagcgcgggc aaacgccggc actatagcca gtggagtttg 1680
taaaacgcta tttcagagct tggagagtgt ctaagaaagc cggggcgatg ccaacccatc 1740
ccttcttcgg ctatgcatcg ttcgtaatca agccacttcc tttttgcatt gacgcagggt 1800
gtcggaaggc aactcgccga acgcgctcct atagttttca gcgaagcgtc ccaaatgtaa 1860
gaagccgtag tctagggcta tctcagttat actacgcaca ttggcactgg gatcgttcaa 1920
gcaggcgcgg atgctttcga gcttgcggtt gcggatgtag ttcttcggcg tggtgccggc 1980
atgcttctcg aacaaattgt agagcgagcg tggactcatc atcgccagct ccgctaaccg 2040
ctcaaggctg atattccgtt tgagattctc ctcaatgaat tgaacgactc gctcgaaaga 2100
cgggttacct ttgctgaaaa tttcacggct gacattgctg cccagcattt cgagcagctt 2160
ggaagcgatg atccccgcat agtgctcttg gacccgaggc atcgactttg tatgttccgc 2220
ttcgtcacaa actaacccga gtagattgat aaagccatcg agttgctgga gattgtgtcg 2280
cgcggcgaaa cggataccct ccctcggctt gtgccaattg ttgtcactgc atgcccgatc 2340
aaggaccact gagggcaatt taacgataaa tttctcgcaa tcttctgaat aggtcaggtc 2400
ggcttggtca tccggattga gcagcaatag ttcgcccggc gcaaaatagt gctcctggcc 2460
atggccacgc cacaggcaat ggcctttgag tattatttgc agatgataac aggtctctaa 2520
tccaggcgag attaccctca cgctaccgcc gtagctgatt cgacacaggt cgaggcatcc 2580
gaagattctg tggtgcagcc tgcctgccgg gcgcccgccc ttgggcaggc gaatagagtg 2640
cgtaccgaca tactggttaa cataatcgga gactgcatag ggctcggcgt ggacgaagat 2700
ctgacttttc tcgttcaata agcaaaaatc catagttcac ggttctctta ttttaatgtg 2760
ggctgcttgg tgtgatgtag aaaggcgcca agtcgatgaa aatgcatctc gacgtgatgc 2820
gtatacgggt tacccccatt gccacgttgc gccatccttt ttgcaatcag tgaccacttt 2880
tccaagcaaa aataacgcca agcagaacga agacgttctt tttaagaagc gagaacacca 2940
gaagttcgtg ctgtcggggc atgcggcgac gaattggcgg ataaagggga tctgcaggtc 3000
ccgagcctca cggcggcgag tgcgggggtt ccaagggggc agcgccacct tgggcaaggc 3060
cgaaggccgc gcagtcgatc aacaagcccc ggaggggcca ctttttgccg gagggggagc 3120
cgcgccgaag gcgtggggga accccgcagg ggtgcccttc tttgggcacc aaagaactag 3180
atatagggcg aaatgcgaaa gacttaaaaa tcaacaactt aaaaaagggg ggtacgcaac 3240
agctcattgc ggcacccccc gcaatagctc attgcgtagg ttaaagaaaa tctgtaattg 3300
actgccactt ttacgcaacg cataattgtt gtcgcgctgc cgaaaagttg cagctgattg 3360
cgcatggtgc cgcaaccgtg cggcacccta ccgcatggag ataagcatgg ccacgcagtc 3420
cagagaaatc ggcattcaag ccaagaacaa gcccggtcac tgggtgcaaa cggaacgcaa 3480
agcgcatgag gcgtgggccg ggcttattgc gaggaaaccc acggcggcaa tgctgctgca 3540
tcacctcgtg gcgcagatgg gccaccagaa cgccgtggtg gtcagccaga agacactttc 3600
caagctcatc ggacgttctt tgcggacggt ccaatacgca gtcaaggact tggtggccga 3660
gcgctggatc tccgtcgtga agctcaacgg ccccggcacc gtgtcggcct acgtggtcaa 3720
tgaccgcgtg gcgtggggcc agccccgcga ccagttgcgc ctgtcggtgt tcagtgccgc 3780
cgtggtggtt gatcacgacg accaggacga atcgctgttg gggcatggcg acctgcgccg 3840
catcccgacc ctgtatccgg gcgagcagca actaccgacc ggccccggcg aggagccgcc 3900
cagccagccc ggcattccgg gcatggaacc agacctgcca gccttgaccg aaacggagga 3960
atgggaacgg cgcgggcagc agcgcctgcc gatgcccgat gagccgtgtt ttctggacga 4020
tggcgagccg ttggagccgc cgacacgggt cacgctgccg cgccggtagc acttgggttg 4080
cgcagcaacc cgtaagtgcg ctgttccaga ctatcggctg tagccgcctc gccgccctat 4140
accttgtctg cctccccgcg ttgcgtcgcg gtgcatggag ccgggccacc tcgacctgaa 4200
tggaagccgg cggcacctcg ctaacggatt caccgttttt atcaggctct gggaggcaga 4260
ataaatgatc atatcgtcaa ttattacctc cacggggaga gcctgagcaa actggcctca 4320
ggcatttgag aagcacacgg tcacactgct tccggtagtc aataaaccgg taaaccagca 4380
atagacataa gcggctattt aacgaccctg ccctgaaccg acgaccgggt cgaatttgct 4440
ttcgactatc ggcgcgccag agctcatcgt taatgtcttc gtgcgccgtc agtcggcgca 4500
cgttttttct ctctggtacc gtgtcactga tctagtcaat tactcgaagt atccacaagt 4560
gaagcatact aagtaatgta caagaatcaa aaaaatcggc tacgcaagtc gcgtagccga 4620
atcatttaag gatccttcca ttcaggtcga ggtggcccgg ctccatgcac cgcgacgcaa 4680
cgcggggagg cagacaaggt atagggcggc gcctacaatc catgccaacc cgttccatgt 4740
gctcgccgag gcggcataaa tcgccgtgac gatcagcggt ccagtgatcg aagttaggct 4800
ggtaagagcc gcgagcgatc cttgaagctg tccctgatgg tcgtcatcta cctgcctgga 4860
cagcatggcc tgcaacgcgg gcatcccgat gccgccggaa gcgagaagaa tcataatggg 4920
gaaggccatc cagcctcgcg tcgcgaacgc cagcaagacg tagcccagcg cgtcggccgc 4980
catgccggcg ataatggcct gcttctcgcc gaaacgtttg gtggcgggac cagtgacgaa 5040
ggcttgagcg agggcgtgca agattccgaa taccgcaagc gacaggccga tcatcgtcgc 5100
gctccagcga aagcggtcct cgccgaaaat gacccagagc gctgccggca cctgtcctac 5160
gagttgcatg ataaagaaga cagtcataag tgcggcgacg atagtcatgc cccgcgccca 5220
ccggaaggag ctgactgggt tgaaggctct caagggcatc ggtcgacgct ctcccttatg 5280
cgactcctgc attaggaagc agcccagtag taggttgagg ccgttgagca ccgccgccgc 5340
aaggaatggt gcatgcaagg agatggcgcc caacagtccc ccggccacgg ggcctgccac 5400
catacccacg ccgaaacaag cgctcatgag cccgaagtgg cgagcccgat cttccccatc 5460
ggtgatgtcg gcgatatagg cgccagcaac cgcacctgtg gcgccggtga tgccggccac 5520
gatgcgtccg gcgtacaaga tccacaggac gggtgtggtc gccatgatcg cgtagtcgat 5580
agtggctcca agtagcgaag cgagcaggac tgggcggcgg ccaaagcggt cggacagtgc 5640
tccgagaacg ggtgcgcata gaaattgcat caacgcatat agcgctagca gcacgccata 5700
gtgactggcg atgctgtcgg aatggacgat atcccgcaag aggcccggca gtaccggcat 5760
aaccaagcct atgcctacag catccagggt gacggtgccg aggatgacga tgagcgcatt 5820
gttagatttc atacacggtg cctgactgcg ttagcaattt aactgtgata aactaccgca 5880
ttaaagccga gcgatgataa gctgtcaaac atgagatccg ataaatcgat tgatagattt 5940
aaataagaac tgcagaagct agcaacttaa gttacgaatc gacgccgaac aggtcgcggg 6000
tgtagacttt ctccgagaca tcttccagtt cgctggtgcg gcgattcgcc acaatgacat 6060
cgacgcgctc cttaaaggaa ttgatgtcgc gctcgacgta ggaaccgaag aagtagggtt 6120
ctttcaggac cggctcgtac accacaatct cgataccctt ggccttcaaa cgtttcatga 6180
ccccctggat gctgctggcc cggaaattgt cgctacccgc cttcatgatc aggcgataga 6240
taccgaccac tttgggctta cgggacagga tgtcctcggc cacgaagtcc ttacgggtcg 6300
tattcgcatc cacgatggcc tggatcaggt tttgcgggac gtcgcgataa ttggccaaca 6360
gctgcttcgt atccttcggc agacagtaac cgccgtagcc gaaggacggg ttgttgtaat 6420
gttgaccaat gcgcggatcg agggagacgc cttcgatgat ttgtttggta tccaggccgt 6480
gcacgctcgc gtaggtgtcc agctcgttaa agtacgcgat acgcatcgcc agatacgtgt 6540
tcgcgaacag tttgatggct tctgcctcgg gcgaatccgt cagcaggatc ggaatatcct 6600
ttttgatggc accttccgac aggagttcgg cgaacttccg tgcgcgttcc gacgattcgc 6660
ccacgacaat gcggctcgga tagagattat catacagggc tttgccttcg cgcaggaact 6720
ccggggaaaa gatgatatta ttcgtgttca gatcgcgctt caggcgttcg gtgaacccga 6780
cggggacggt ggatttgata atgatggtcg cgttcgggtt aatggacagc acgtcacacg 6840
cgacgctttc gacgctcagg gtatcaaagt tgttattaat cggatcatag ttcgtcgggg 6900
tggcgatgat cacgtagtct gcatcgcgat atgcctcgta tttttccgtc gtcgcgtaga 6960
ggttcagctt acgattggag agaaacttct ggatttccgg gtcgcaaatc ggcgagattt 7020
tcttgttaat gagctggacc ttcttcgggt cgatgtccag ggcgatgatg tcgtgttttt 7080
gggagaggag gatcgcaatg ctgataccca catagccgac gccggccacg gcaattttca 7140
tttattaacc tccttaagtg aattcaaact agtttacaag tcgttttcga tcttctccca 7200
ggtatatttg cgacattcat tcaagttggt cagcggcgag tatttgtact ttttgatacc 7260
gaggcgcgac aggctttcgt tcaccacctt gaaatggttt tccttttgga tgtccagttt 7320
cttgatcgac gtgttctcgc cgtgcaggac acggttgtag caaatcttat tgatatgctt 7380
aaacgggccg acttcgctga gtttcaaata catatcgtaa tccaccgcat tgctgatgct 7440
ctcgttgaag ccttcggtga ggttccatgc acgcgccgtg aacatacgga agtggtggca 7500
gatcatcgcg ctcgtgagct tttcgcggct gtaaatcggc cagttgtagc cattgctaat 7560
caagttacct tcacgatcaa tattgcgatt ggtggtgtac acgcaggcga ggctcaggtc 7620
tttgcgaaat tcatccagac acagttccac ggcatcgggc tccaggaaat catcggaatc 7680
cagctgcccg atgtagaaac cccggcacag gcggactgcg gtattcgagg cggagccgat 7740
gcctttgttt ttctggctga tgaaacggac gcgcgggtgg tttgcgtaat gttcttgcag 7800
gatgcgcagc gtatcatcgg tgctcccgtc atcgcagatg cagacctcca gatcggtgat 7860
cgtttggttc agtgccgatt cgacgcagcg cacgatatat ttgctgcaat tatacgcggg 7920
gatgtagatg ctcaccaggg gcacacgttt cagggtggcg ctctcgattt tctccttctt 7980
gcgataaaag tagggcacct tctgctgcaa cagctggacg gtaatgtttt tacctgccgc 8040
gcgatcggtt tcgttctcct taccgggcgg ttcctgatga tatgccatcg cgccttccac 8100
gctacggaaa taacaaccct cgcggtacag ccgatagccg aactcattat cctcaccgcc 8160
ccaatgcgtg aactcttcgt caaaccaacc cgcgcgaaac agccacttct ttgcaaacgc 8220
cacattgcca ccgctaaaga accggaacgg ggtgttgcac aggcgcagat tgtcggtatt 8280
cttgaaatgt tcgatgcgcc aatcgacgga tttgttctgc tcgaccttgc ctgcgacctg 8340
attattggta ataatctccg ggatttcatt gatcaggctt ttctgggaca aaaagtccag 8400
ataggtatgc ttcgacgtgt cgatgtattt acgcgggcca atcagtgcca cgttatcatc 8460
cacggccagg agttccatat aggactgcac ccacaacggg ttcggcgcca tatcgcagtc 8520
caagatcgcc acgtagttgt atttcgctgc ccgcaggccc aggttccgca cggcgcacag 8580
ctggtagccg tagtctttct ggcggacgta tttgatgttc agcaacgact cgaactcgcg 8640
gacgatctct tcgatgtttt ccttggaacc gtcatccgcg acgatgacct catagtcata 8700
aatcgttttc tgattgcaga ggcaggccag ggtgatcgcc aggattttgg cgcgattgta 8760
cgtcggaatc acgatggaca ggccgtcgat gatcagttgc ttgcgcggat aatcatccag 8820
ttctttacgt ttccctgccc agacgtagtc gttcgtgctt tccggcagcg gcggcaaggt 8880
caggtcgctc ggccaatcca gcggaatggg ttcgacttct ttcaattcgg cgcgctcgga 8940
tttctttgcg gtaatttccc gatatttgct aatgatttca ttcttttcca cctcattcag 9000
cgagatcgcc tttgcattgc tgcacataat tttggttgcc gcgtcgatat caatgaccgc 9060
tttccgattc agcttgtcca cttcttcgct cagattcagg gcggtttggc acagcttgat 9120
attggcttcc acccagctca catcatagat ttccgccact ttttcaaaca gggagagggc 9180
ttggcggtag ttcttattct tatacagatt gattgcctgg ttcaaaatgc tcatttatta 9240
acctcctact agtgaatttt cgaattactt accgcagtac ttgacaccca cctgggaatt 9300
gtttttggtg cgtttgaatt ggcggatggt acggtagatg ctaaagggca ggctgatcag 9360
accgagcgga aaattgttct tattgatgat gagcttgccc agctgatagc tcaggtgttt 9420
cttgacccgt tcggcttcgt gtttatccgc gtacaggaag atgctcggca ggctcacttg 9480
gtactccgaa tcatatttct tcttccaggt ccgccattcg ctgatcaacg caaacggaat 9540
cgagatcaga ccgaggaacg tcttggagcg gctcaccatc accgcaccca ggcggtagcc 9600
gatatcttgc ttgatgcgtt cggccgcacc atacagctcc ggcagttgtt tcttttcgag 9660
acgttgattg tcgatgaagt actgttcgag cttttgctgc accagatgca gctgattgag 9720
cagcaattct ttttcgcacg acagcttttc gaggcgctgt tgttgcagtt catttttgtt 9780
ctgttccttt ttcagcaggg actcgaagtt ctcgatcgcg cactccagtt cctggacctg 9840
gatggttttg tttttaatga tcagatcata ctggatcagt tcttccttgc tatccgacag 9900
ctctttcaga atggcttgat aggcgttcag ctgtttggac gtgtgcagtt cgttgtccag 9960
aatgatcttt ttgctgctct ggtacagacc gttcacgata tcgagggtga tctggcgttg 10020
tttaatgaac gtctcccaaa taaaggacgg cttatagttt tccttctcca gcacccgcaa 10080
gggggtgttg gcgttcgatt gcaattcaaa gtacagttcc ttgcaatcgg gatagtcgtt 10140
caggacgttg aagatcaagt actcctccgt ctcgctttgc ttgaaaatga tatccccggt 10200
cccgatgtca ataccgctga gggacatgat ctcctgatgt tctttttcca gcgtaatgga 10260
ggcttcggcg gtcttaaagt cattcacgct ctgctccagc gagtggttga tggtattgga 10320
gaacgacaac ccgaatttca gtttcagttt gtgttgcagt tgctggatgc agtcctcggc 10380
gttgcgcttc acctgttcgc tcgacaccag caggcaccga ccccggttgt tgaggaagaa 10440
gtgcagcaag gcggtgttgt atgccagcca gtttttgatc agatgctccg aggtatagtt 10500
gctggagatg ttctggtccg agaagtagtt cgtcaggatg cttttggggt ggtcgtagat 10560
gaggataaag gtgatgttct catccaccga tttccaatat tccaacgtgt gaattgcgtt 10620
ggggtcgctc caaccgcaca gtttctggtt caggttggac agcatcagat ccaatgcgat 10680
accgttccag acggtgctca catggagcgg ttcaaagtcg gcggaatcgg tcaccgtata 10740
gatgtccggc gactggtacg ccttccgcag cgtctgggtg atgtcctggg gcgagaggtt 10800
ctcacgtttg gacgggcaca gggagttcat gccgcgctga tgcaggagtt cttccacgat 10860
ttggtagttg ctgctcggat ggcccacgat caccaggcgg ttcatttatt aacctccttt 10920
cgaaaatgaa cggtccgtta aatatagcca ttcggattct tcatctgcca gcgccaggcg 10980
tcctccagca tggtttcgag ttcccgcttg gctttccagt tcagatattt gttggccttt 11040
tcgggggagg accagctctc cgcgatatca ccgtcacggc ggctcacgat ttcatacgga 11100
atccgcacgc cggaaatctt ttcaaaggtg gacaccagtt ccagcaccga ataaccttta 11160
cccgtgccca aattaaagac gtggtagttg gtgttattgt cgcggaagag ataggacagc 11220
gctgcgacgt gcccttcggc caggtccatc acatggatat agtcacggac ccccgtgccg 11280
tctttggtgg gataatcacc accgaacacc atcagttttt ccagtttccc catcgcgacc 11340
tgcaagatgt acggcaccaa gttggagggg atgtctgccg ggctttcacc aatcataccg 11400
gattcgtggg cgcccgtcgg attaaagtag cgcaagcaga ggaaattcgt gtcggagtat 11460
ttcttggcga tgtcgcggat catcagctcc gagatgtact tggacgtacc atacggattc 11520
agcgtgccac caatatggca gtcttcggtg acgggcatga tcttgctttc cccatacacc 11580
gtcgccgacg agctaaagat gaagttggcg acgtcgttct tgatggcgca attgatgagt 11640
tgcagggtgc cgctcacgtt gttgtcatag tagaagatgg gcttgatcag gctttctgcg 11700
accgatttcg cacctgcaaa gtgcatgatg cagtcgaatt tgtgtttctt caggatctgg 11760
ttcacttcct tctcgttgtt gatattgagt tcgtagaacg tgactttctt ctttgcgatc 11820
agctcaatgc gacggatgct ttcgcagctg ctgttgatga gattgtcaat gatgacgaca 11880
ttgtagcctt tgttcagcag gcagagcgac gtgtggctgc cgatgtagcc tgcaccgccg 11940
gtgaccagga tgttcattta ttaacctcct cggtccgaat taacctaggt tatgaggtca 12000
gcattgcttc ttcacgcggt gttaattaag taatcgatag tgatttaaat atgcaagatc 12060
tagttacctg caggattatt gtttctgttg cataaagcct aaggggtagg cctttctaga 12120
gatagccatt ttttgcactc ctgtatccgc ttcttgcaag gctggactta tccctatcaa 12180
accggacact gcaggctgac aagctttcat tacatatgaa gagtttgtag aaacgcaaaa 12240
aggccatccg tcaggatggc cttctaagaa ggctcgagtg gcgcgcctaa gtcgaatttc 12300
tgccattcat ccgcttatta tcacttattc aggcgtagca accaggcgtt taagggcacc 12360
aataactgcc ttaaaaaaat tacgccccgc cctgccactc atcgcagtac tgttgtaatt 12420
cattaagcat tctgccgaca tggaagccat cacaaacggc atgatgaacc tgaatcgcca 12480
gcggcatcag caccttgtcg ccttgcgtat aatatttgcc catggtgaaa acgggggcga 12540
agaagttgtc catattggcc acgtttaaat caaaactggt gaaactcacc cagggattgg 12600
ctgagacgaa aaacatattc tcaataaacc ctttagggaa ataggccagg ttttcaccgt 12660
aacacgccac atcttgcgaa tatatgtgta gaaactgccg gaaatcgtcg tggtattcac 12720
tccagagcga tgaaaacgtt tcagtttgct catggaaaac ggtgtaacaa gggtgaacac 12780
tatcccatat caccagctca ccgtctttca ttgccatacg gaattccgga tgagcattca 12840
tcaggcgggc aagaatgtga ataaaggccg gataaaactt gtgcttattt ttctttacgg 12900
tctttaaaaa ggccgtaata tccagctgaa cggtctggtt ataggtacat tgagcaactg 12960
actgaaatgc ctcaaaatgt tctttacgat gccattggga tatatcaacg gtggtatatc 13020
cagtgatttt tttctccatt ttagcttcct tagctcctga aaatctcgat aactcaaaaa 13080
atacgcccgg tagtgatctt atttcattat ggtgaaagtt ggaacctctt acgtgccgat 13140
caacgtctca ttttcgccaa aagttggccc agggcttccc ggtatcaaca gggacaccag 13200
gatttattta ttctgcgaag tgatcttccg tcacaggtat ttattcggcg caaagggcct 13260
cgtgatacgc ctatttttat aggttaatgt catgataata atggtttctt agacgtcagg 13320
tggcactttt cggggaaatg tgcgcgcccg cgttcctgct ggcgctgggc ctgtttctgg 13380
cgctggactt cccgctgttc cgtcagcagc ttttcgccca cggccttgat gatcgcggcg 13440
gccttggcct gcatatcccg attcaacggc cccagggcgt ccagaacggg cttcaggcgc 13500
tcccgaaggt 13510
<210> 155
<211> 56
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic primer DHD266c
<400> 155
tagcggccgc atactcgagc atggcgcgcc taacgtcgac taagatctct aagctt 56
<210> 156
<211> 56
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic primer DHD267c
<400> 156
cgaagcttag agatcttagt cgacgttagg cgcgccatgc tcgagtatgc ggccgc 56
<210> 157
<211> 5243
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic plasmid pMAK705pI
<400> 157
gatccccgac agtaagacgg gtaagcctgt tgatgatacc gctgccttac tgggtgcatt 60
agccagtctg aatgacctgt cacgggataa tccgaagtgg tcagactgga aaatcagagg 120
gcaggaactg ctgaacagca aaaagtcaga tagcaccaca tagcagaccc gccataaaac 180
gccctgagaa gcccgtgacg ggcttttctt gtattatggg tagtttcctt gcatgaatcc 240
ataaaaggcg cctgtagtgc catttacccc cattcactgc cagagccgtg agcgcagcga 300
actgaatgtc acgaaaaaga cagcgactca ggtgcctgat ggtcggagac aaaaggaata 360
ttcagcgatt tgcccgagct tgcgagggtg ctacttaagc ctttagggtt ttaaggtctg 420
ttttgtagag gagcaaacag cgtttgcgac atccttttgt aatactgcgg aactgactaa 480
agtagtgagt tatacacagg gctgggatct attcttttta tcttttttta ttctttcttt 540
attctataaa ttataaccac ttgaatataa acaaaaaaaa cacacaaagg tctagcggaa 600
tttacagagg gtctagcaga atttacaagt tttccagcaa aggtctagca gaatttacag 660
atacccacaa ctcaaaggaa aaggactagt aattatcatt gactagccca tctcaattgg 720
tatagtgatt aaaatcacct agaccaattg agatgtatgt ctgaattagt tgttttcaaa 780
gcaaatgaac tagcgattag tcgctatgac ttaacggagc atgaaaccaa gctaatttta 840
tgctgtgtgg cactactcaa ccccacgatt gaaaacccta caaggaaaga acggacggta 900
tcgttcactt ataaccaata cgttcagatg atgaacatca gtagggaaaa tgcttatggt 960
gtattagcta aagcaaccag agagctgatg acgagaactg tggaaatcag gaatcctttg 1020
gttaaaggct ttgagatttt ccagtggaca aactatgcca agttctcaag cgaaaaatta 1080
gaattagttt ttagtgaaga gatattgcct tatcttttcc agttaaaaaa attcataaaa 1140
tataatctgg aacatgttaa gtcttttgaa aacaaatact ctatgaggat ttatgagtgg 1200
ttattaaaag aactaacaca aaagaaaact cacaaggcaa atatagagat tagccttgat 1260
gaatttaagt tcatgttaat gcttgaaaat aactaccatg agtttaaaag gcttaaccaa 1320
tgggttttga aaccaataag taaagattta aacacttaca gcaatatgaa attggtggtt 1380
gataagcgag gccgcccgac tgatacgttg attttccaag ttgaactaga tagacaaatg 1440
gatctcgtaa ccgaacttga gaacaaccag ataaaaatga atggtgacaa aataccaaca 1500
accattacat cagattccta cctacataac ggactaagaa aaacactaca cgatgcttta 1560
actgcaaaaa ttcagctcac cagttttgag gcaaaatttt tgagtgacat gcaaagtaag 1620
tatgatctca atggttcgtt ctcatggctc acgcaaaaac aacgaaccac actagagaac 1680
atactggcta aatacggaag gatctgaggt tcttatggct cttgtatcta tcagtgaagc 1740
atcaagacta acaaacaaaa gtagaacaac tgttcaccgt tacatatcaa agggaaaact 1800
gtccatatgc acagatgaaa acggtgtaaa aaagatagat acatcagagc ttttacgagt 1860
ttttggtgca tttaaagctg ttcaccatga acagatcgac aatgtaacag atgaacagca 1920
tgtaacacct aatagaacag gtgaaaccag taaaacaaag caactagaac atgaaattga 1980
acacctgaga caacttgtta cagctcaaca gtcacacata gacagcctga aacaggcgat 2040
gctgcttatc gaatcaaagc tgccgacaac acgggagcca gtgacgcctc ccgtggggaa 2100
aaaatcatgg caattctgga agaaatagcg ctttcagccg gcaaaccggc tgaagccgga 2160
tctgcgattc tgataacaaa ctagcaacac cagaacagcc cgtttgcggg cagcaaaacc 2220
cgtacttttg gacgttccgg cggttttttg tggcgagtgg tgttcgggcg gtgcgcgcaa 2280
gatccattat gttaaacggg cgagtttaca tctcaaaacc gcccgcttaa caccatcaga 2340
aatcctcagc gcgattttaa gcaccaaccc ccccccgtaa cacccaaatc catactgaaa 2400
gtggctttgt tgaataaatc gaacttttgc tgagttgaag gatcagatca cgcatcctcc 2460
cgacaacaca gaccattccg tggcaaagca aaagttcaga atcaccaact ggtccaccta 2520
caacaaagct ctcatcaacc gtggctccct cactttctgg ctggatgatg aggcgattca 2580
ggcctggtat gagtcggcaa caccttcatc acgaggaagg ccccagcgct attctgatct 2640
cgccatcacc accgttctgg tgattaaacg cgtattccgg ctgaccctgc gggctgcgca 2700
gggttttatt gattccattt ttgccctgat gaacgttccg ttgcgctgcc cggattacac 2760
cagtgtcagt aagcgggcaa agtcggttaa tgtcagtttc aaaacgtcca cccggggtga 2820
aatcgcacac ctggtgattg attccaccgg gctgaaggtc tttggtgaag gcgaatggaa 2880
agtcagaaag cacggcaaag agcgccgtcg tatctggcga aagttgcatc ttgctgtggg 2940
gatcaacacg ggataatacc gcgccacata gcagaacttt aaaagtgctc atcattggaa 3000
aacgttcttc ggggcgaaaa ctctcaagga tcttaccgct gttgagatcc agttcgatgt 3060
aacccactcg tgcacccaac tgatcttcag catcttttac tttcaccagc gtttctgggt 3120
gagcaaaaac aggaaggcaa aatgccgcaa aaaagggaat aagggcgaca cggaaatgtt 3180
gaatactcat actcttcctt tttcaatatt attgaagcat ttatcagggt tattgtctca 3240
tgagcggata catatttgaa tgtatttaga aaaataaaca aataggggtt ccgcgcacat 3300
ttccccgaaa agtgccacct gacgtctaag aaaccattat tatcatgaca ttaacctata 3360
aaaataggcg tatcacgagg ccctttcgtc ttcgaataaa tacctgtgac ggaagatcac 3420
ttcgcagaat aaataaatcc tggtgtccct gttgataccg ggaagccctg ggccaacttt 3480
tggcgaaaat gagacgttga tcggcacgta agaggttcca actttcacca taatgaaata 3540
agatcactac cgggcgtatt ttttgagtta tcgagatttt caggagctaa ggaagctaaa 3600
atggagaaaa aaatcactgg atataccacc gttgatatat cccaatggca tcgtaaagaa 3660
cattttgagg catttcagtc agttgctcaa tgtacctata accagaccgt tcagctggat 3720
attacggcct ttttaaagac cgtaaagaaa aataagcaca agttttatcc ggcctttatt 3780
cacattcttg cccgcctgat gaatgctcat ccggaattcc gtatggcaat gaaagacggt 3840
gagctggtga tatgggatag tgttcaccct tgttacaccg ttttccatga gcaaactgaa 3900
acgttttcat cgctctggag tgaataccac gacgatttcc ggcagtttct acacatatat 3960
tcgcaagatg tggcgtgtta cggtgaaaac ctggcctatt tccctaaagg gtttattgag 4020
aatatgtttt tcgtctcagc caatccctgg gtgagtttca ccagttttga tttaaacgtg 4080
gccaatatgg acaacttctt cgcccccgtt ttcaccatgg gcaaatatta tacgcaaggc 4140
gacaaggtgc tgatgccgct ggcgattcag gttcatcatg ccgtttgtga tggcttccat 4200
gtcggcagaa tgcttaatga attacaacag tactgcgatg agtggcaggg cggggcgtaa 4260
tttttttaag gcagttattg gtgcccttaa acgcctggtt gctacgcctg aataagtgat 4320
aataagcgga tgaatggcag aaattcgaaa gcaaattcga cccggtcgtc ggttcagggc 4380
agggtcgtta aatagccgct tatgtctatt gctggtttac cggtttattg actaccggaa 4440
gcagtgtgac cgtgtgcttc tcaaatgcct gaggccagtt tgctcaggct ctccccgtgg 4500
aggtaataat tgacgatatg atcatttatt ctgcctccca gagcctgata aaaacggtga 4560
atccgttagc gaggtgccgc cggcttccat tcaggtcgag gtggcccggc tccatgcacc 4620
gcgacgcaac gcggggaggc agacaaggta tagggcggcg cctacaatcc atgccaaccc 4680
gttccatgtg ctcgccgagg cggcataaat cgccgtgacg atcagcggtc caatgatcga 4740
agttaggctg gtaagagccg cgagcgatcc ttgaagctgt ccctgatggt cgtcatctac 4800
ctgcctggac agcatggcct gcaacgcggg catcccgatg ccgccggaag cgagaagaat 4860
cataatgggg aaggccatcc agcctcgcgt cgcgaacgcc agcaagacgt agcccagcgc 4920
gtcggccgcc atgccggcga taatggcctg cttctcgccg aaacgtttgg tggcgggacc 4980
agtgacgaag gcttgagcga gggcgtgcaa gattccgaat accgcaagcg acaggccatg 5040
tttgacagct tatcatcgaa gcttagagat cttagtcgac gttaggcgcg ccatgctcga 5100
gtatgcggcc gctaatgaat cggccaacgc gcggggagag gcggtttgcg tattggcacc 5160
attccttgcg gcggcggtgc tcaacggcct caacctacta ctgggctgct tcctaatgca 5220
ggagtcgcat aagggagagc gtc 5243
<210> 158
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic primer DHD280c
<400> 158
catatggcgg ccgctaataa gcaga 25
<210> 159
<211> 58
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic primer DHD281c
<400> 159
ttagatctta gtcgacgtta ggcgcgccat gctcgagtaa tggtattgac cagcatgg 58
<210> 160
<211> 55
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic primer DHD283
<400> 160
cgagcatggc gcgcctaacg tcgactaaga tctaagagct gttcctgagt gaagc 55
<210> 161
<211> 32
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic primer DHD285
<400> 161
ttcgaaaagc ttttcgcaat gtaaccagcc ag 32
<210> 162
<211> 40
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic primer DHD268c
<400> 162
catatggcgg ccgctaataa acgggttgtt actcgctcac 40
<210> 163
<211> 57
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic primer DHD269c
<400> 163
ttagatctta gtcgacgtta ggcgcgccat gctcgagctt catccaccac atacagg 57
<210> 164
<211> 57
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic primer DHD271
<400> 164
ctcgagcatg gcgcgcctaa cgtcgactaa gatctaagtg ccaatgaatc gtctgac 57
<210> 165
<211> 32
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic primer DHD273
<400> 165
ttcgaaaagc tttccatttc gctggtggtc ag 32
<210> 166
<211> 40
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic primer DHD274c
<400> 166
catatggcgg ccgctaataa attccaacag ggtggttacc 40
<210> 167
<211> 58
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic primer DHD275c
<400> 167
ttagatctta gtcgacgtta ggcgcgccat gctcgagcag tacagcaagg atagaacc 58
<210> 168
<211> 57
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic primer DHD277
<400> 168
ctcgagcatg gcgcgcctaa cgtcgactaa gatctaagcg atgacaccaa aaggtgc 57
<210> 169
<211> 32
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic primer DHD279
<400> 169
ttcgaaaagc ttagactcac ccagataagt cg 32
<210> 170
<211> 14823
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic plasmid pBR1102
<400> 170
gatccccgac agtaagacgg gtaagcctgt tgatgatacc gctgccttac tgggtgcatt 60
agccagtctg aatgacctgt cacgggataa tccgaagtgg tcagactgga aaatcagagg 120
gcaggaactg ctgaacagca aaaagtcaga tagcaccaca tagcagaccc gccataaaac 180
gccctgagaa gcccgtgacg ggcttttctt gtattatggg tagtttcctt gcatgaatcc 240
ataaaaggcg cctgtagtgc catttacccc cattcactgc cagagccgtg agcgcagcga 300
actgaatgtc acgaaaaaga cagcgactca ggtgcctgat ggtcggagac aaaaggaata 360
ttcagcgatt tgcccgagct tgcgagggtg ctacttaagc ctttagggtt ttaaggtctg 420
ttttgtagag gagcaaacag cgtttgcgac atccttttgt aatactgcgg aactgactaa 480
agtagtgagt tatacacagg gctgggatct attcttttta tcttttttta ttctttcttt 540
attctataaa ttataaccac ttgaatataa acaaaaaaaa cacacaaagg tctagcggaa 600
tttacagagg gtctagcaga atttacaagt tttccagcaa aggtctagca gaatttacag 660
atacccacaa ctcaaaggaa aaggactagt aattatcatt gactagccca tctcaattgg 720
tatagtgatt aaaatcacct agaccaattg agatgtatgt ctgaattagt tgttttcaaa 780
gcaaatgaac tagcgattag tcgctatgac ttaacggagc atgaaaccaa gctaatttta 840
tgctgtgtgg cactactcaa ccccacgatt gaaaacccta caaggaaaga acggacggta 900
tcgttcactt ataaccaata cgttcagatg atgaacatca gtagggaaaa tgcttatggt 960
gtattagcta aagcaaccag agagctgatg acgagaactg tggaaatcag gaatcctttg 1020
gttaaaggct ttgagatttt ccagtggaca aactatgcca agttctcaag cgaaaaatta 1080
gaattagttt ttagtgaaga gatattgcct tatcttttcc agttaaaaaa attcataaaa 1140
tataatctgg aacatgttaa gtcttttgaa aacaaatact ctatgaggat ttatgagtgg 1200
ttattaaaag aactaacaca aaagaaaact cacaaggcaa atatagagat tagccttgat 1260
gaatttaagt tcatgttaat gcttgaaaat aactaccatg agtttaaaag gcttaaccaa 1320
tgggttttga aaccaataag taaagattta aacacttaca gcaatatgaa attggtggtt 1380
gataagcgag gccgcccgac tgatacgttg attttccaag ttgaactaga tagacaaatg 1440
gatctcgtaa ccgaacttga gaacaaccag ataaaaatga atggtgacaa aataccaaca 1500
accattacat cagattccta cctacataac ggactaagaa aaacactaca cgatgcttta 1560
actgcaaaaa ttcagctcac cagttttgag gcaaaatttt tgagtgacat gcaaagtaag 1620
tatgatctca atggttcgtt ctcatggctc acgcaaaaac aacgaaccac actagagaac 1680
atactggcta aatacggaag gatctgaggt tcttatggct cttgtatcta tcagtgaagc 1740
atcaagacta acaaacaaaa gtagaacaac tgttcaccgt tacatatcaa agggaaaact 1800
gtccatatgc acagatgaaa acggtgtaaa aaagatagat acatcagagc ttttacgagt 1860
ttttggtgca tttaaagctg ttcaccatga acagatcgac aatgtaacag atgaacagca 1920
tgtaacacct aatagaacag gtgaaaccag taaaacaaag caactagaac atgaaattga 1980
acacctgaga caacttgtta cagctcaaca gtcacacata gacagcctga aacaggcgat 2040
gctgcttatc gaatcaaagc tgccgacaac acgggagcca gtgacgcctc ccgtggggaa 2100
aaaatcatgg caattctgga agaaatagcg ctttcagccg gcaaaccggc tgaagccgga 2160
tctgcgattc tgataacaaa ctagcaacac cagaacagcc cgtttgcggg cagcaaaacc 2220
cgtacttttg gacgttccgg cggttttttg tggcgagtgg tgttcgggcg gtgcgcgcaa 2280
gatccattat gttaaacggg cgagtttaca tctcaaaacc gcccgcttaa caccatcaga 2340
aatcctcagc gcgattttaa gcaccaaccc ccccccgtaa cacccaaatc catactgaaa 2400
gtggctttgt tgaataaatc gaacttttgc tgagttgaag gatcagatca cgcatcctcc 2460
cgacaacaca gaccattccg tggcaaagca aaagttcaga atcaccaact ggtccaccta 2520
caacaaagct ctcatcaacc gtggctccct cactttctgg ctggatgatg aggcgattca 2580
ggcctggtat gagtcggcaa caccttcatc acgaggaagg ccccagcgct attctgatct 2640
cgccatcacc accgttctgg tgattaaacg cgtattccgg ctgaccctgc gggctgcgca 2700
gggttttatt gattccattt ttgccctgat gaacgttccg ttgcgctgcc cggattacac 2760
cagtgtcagt aagcgggcaa agtcggttaa tgtcagtttc aaaacgtcca cccggggtga 2820
aatcgcacac ctggtgattg attccaccgg gctgaaggtc tttggtgaag gcgaatggaa 2880
agtcagaaag cacggcaaag agcgccgtcg tatctggcga aagttgcatc ttgctgtggg 2940
gatcaacacg ggataatacc gcgccacata gcagaacttt aaaagtgctc atcattggaa 3000
aacgttcttc ggggcgaaaa ctctcaagga tcttaccgct gttgagatcc agttcgatgt 3060
aacccactcg tgcacccaac tgatcttcag catcttttac tttcaccagc gtttctgggt 3120
gagcaaaaac aggaaggcaa aatgccgcaa aaaagggaat aagggcgaca cggaaatgtt 3180
gaatactcat actcttcctt tttcaatatt attgaagcat ttatcagggt tattgtctca 3240
tgagcggata catatttgaa tgtatttaga aaaataaaca aataggggtt ccgcgcacat 3300
ttccccgaaa agtgccacct gacgtctaag aaaccattat tatcatgaca ttaacctata 3360
aaaataggcg tatcacgagg ccctttcgtc ttcgaataaa tacctgtgac ggaagatcac 3420
ttcgcagaat aaataaatcc tggtgtccct gttgataccg ggaagccctg ggccaacttt 3480
tggcgaaaat gagacgttga tcggcacgta agaggttcca actttcacca taatgaaata 3540
agatcactac cgggcgtatt ttttgagtta tcgagatttt caggagctaa ggaagctaaa 3600
atggagaaaa aaatcactgg atataccacc gttgatatat cccaatggca tcgtaaagaa 3660
cattttgagg catttcagtc agttgctcaa tgtacctata accagaccgt tcagctggat 3720
attacggcct ttttaaagac cgtaaagaaa aataagcaca agttttatcc ggcctttatt 3780
cacattcttg cccgcctgat gaatgctcat ccggaattcc gtatggcaat gaaagacggt 3840
gagctggtga tatgggatag tgttcaccct tgttacaccg ttttccatga gcaaactgaa 3900
acgttttcat cgctctggag tgaataccac gacgatttcc ggcagtttct acacatatat 3960
tcgcaagatg tggcgtgtta cggtgaaaac ctggcctatt tccctaaagg gtttattgag 4020
aatatgtttt tcgtctcagc caatccctgg gtgagtttca ccagttttga tttaaacgtg 4080
gccaatatgg acaacttctt cgcccccgtt ttcaccatgg gcaaatatta tacgcaaggc 4140
gacaaggtgc tgatgccgct ggcgattcag gttcatcatg ccgtttgtga tggcttccat 4200
gtcggcagaa tgcttaatga attacaacag tactgcgatg agtggcaggg cggggcgtaa 4260
tttttttaag gcagttattg gtgcccttaa acgcctggtt gctacgcctg aataagtgat 4320
aataagcgga tgaatggcag aaattcgaaa gcaaattcga cccggtcgtc ggttcagggc 4380
agggtcgtta aatagccgct tatgtctatt gctggtttac cggtttattg actaccggaa 4440
gcagtgtgac cgtgtgcttc tcaaatgcct gaggccagtt tgctcaggct ctccccgtgg 4500
aggtaataat tgacgatatg atcatttatt ctgcctccca gagcctgata aaaacggtga 4560
atccgttagc gaggtgccgc cggcttccat tcaggtcgag gtggcccggc tccatgcacc 4620
gcgacgcaac gcggggaggc agacaaggta tagggcggcg cctacaatcc atgccaaccc 4680
gttccatgtg ctcgccgagg cggcataaat cgccgtgacg atcagcggtc caatgatcga 4740
agttaggctg gtaagagccg cgagcgatcc ttgaagctgt ccctgatggt cgtcatctac 4800
ctgcctggac agcatggcct gcaacgcggg catcccgatg ccgccggaag cgagaagaat 4860
cataatgggg aaggccatcc agcctcgcgt cgcgaacgcc agcaagacgt agcccagcgc 4920
gtcggccgcc atgccggcga taatggcctg cttctcgccg aaacgtttgg tggcgggacc 4980
agtgacgaag gcttgagcga gggcgtgcaa gattccgaat accgcaagcg acaggccatg 5040
tttgacagct tatcatcgaa gcttttcgca atgtaaccag ccaggaagcc cgcaataata 5100
ccaccaatga agccagaacc ggtgctgacc gccagcatac cgccaatcag acccggagtg 5160
aggcccggac gatcggcaat ggaaaaggca atataacctg ccagtaccgg caccatcagc 5220
gcaaaggctg aaccaccacc aatctgcatc agcgccgcag ccaacgtacc cggctcttta 5280
aacgcttcga taccaaaagc aaaagaaagc gcgatacaca gaccacctgc aacgaccatc 5340
ggcagcatgt aagaaacgcc cgtcagcaag tgacggtatg cgcctgcact ctctttctta 5400
ctttcagtgg tcgccgtttg agctttgccc gccggttcat acggcgttgc ttcagcaacc 5460
gctttatcca gttcctgcgc ggttttcttc agcgccagac cggtagaggt acgatacatc 5520
ggtttaccag caaatttcgc cagatccact tcgatatctg ccgccacaat caccagatcc 5580
gctgctgcga cttcttcggg agtgattgca ttacccgcgc caacagaacc acgggtttca 5640
actttcaccc accagccacg ttttttcgct tcggtttcaa tggcttcagc cgccataaag 5700
gtgtgtgcta cgccagtcgg gcaagcagtc accgcaacta cgcgtttcgg accgctggcg 5760
gcaactggtg ctgtcgcagc gaccggcgca gtgtaaggtt tcgcatggcc tttggcttca 5820
ctcaggaaca gctcttagat cttagtcgac gttaggcgcg ccagagctca tcgttaatgt 5880
cttcgtgcgc cgtcagtcgg cgcacgtttt ttctctctgg taccgtgtca ctgatctagt 5940
caattactcg aagtatccac aagtgaagca tactaagtaa tgtacaagaa tcaaaaaaat 6000
cggctacgca agtcgcgtag ccgaatcatt taaggatcca gtgtaatcga ttgatagatt 6060
taaataagaa ctgcagaagc tagcttagat gctcgtgaaa ttgacgtggg cgctttgcag 6120
ggccgtctta atggcgttgg tgtccacgag gatcgagtcg ggtgcggaaa acggacggtt 6180
cttgttggtg aaatcgctgt taccaatgta cagcgattcc ttgttacgca gcgcctggat 6240
gtgccagcgg gaccacgaat cccaatactt ctggcgatcc ggcgagatac cttggctggt 6300
gtagccggtc gtcgggctgt tcatcaacga gtcggtgcgg tgcgagccca gcgtcagcgg 6360
caacttgatc cgatgcaccg tggaatcgcc gaagatcagc ttcagacgcg cgataaattc 6420
gctatccgca cccgttttca cacaatccca gacaccggcc ttctgcaaga cgtcggcacg 6480
gcgaaacagg agcgacgacg gattcagacg cttcaagggg tacactgcgc gggcatagaa 6540
aataccgttg tcttgcaggc gcacccagtc cgagatggag cagatgagct tcggattgag 6600
caacaagggg gagatttggc ggaacagctt ttccggatgg ctccagtcat ccgaatcgtg 6660
gcaggtgacg aactcgccct tcgcttggat caagccgata cgcttcgcgg cataggtgcc 6720
gacattctgc ggcaggctaa tgatcttgat gcgcgtgtct ttgagggcga gccgctggag 6780
acgaaacagg gtgtcatcgg tgctcgcgtc atccacaatg atcagctcga aggaacggta 6840
ggtctgattg aggagcgaaa tcaccgcatt ttccacgcgg cgacccgtat tataggtggt 6900
catcaggatg gagatcaacg gccccgtctg ggccgggtac gggatgctgg tgatgatgtt 6960
gcacggggag agcggggagc tgttgtccgt caaggccacg gggctgaggc cgaagtattt 7020
atagtattca ttcagccgat tcaggctaat ttcggcggtt tcgcggaagg cgttattttg 7080
cagcagcagg atatccgggc tatagacgat atcggatgcg tcgatctggg cgagggtcga 7140
gatggccttt tgggtcaggc cgatccggag ttgcagtgcg gtatacaggt ccagcgggca 7200
gttgtccacg ttgtccaaca ggctcaggct aaaggtcggc gagtaggacg ccagggtttt 7260
cgccagttcc actttctgat gggtatcggt gaactcgtcc ttgaactcca tcagcagctc 7320
gggcgtcagg ctgatgtcgc cgcaggcgat ttttgcgatc ttgattgcca gtttgcagcg 7380
ccaatcggac ggggtatccg tcaagttatg cagcgaccag tacatattca gacgatacat 7440
cgcgaggatg cgtttcgact gccagaaccg gcaatcatcc tggatggccg cgagcgcgtg 7500
gacgtagcgg ctctttttga gcagccacaa gaatttgaga ttattgaaca tttattaacc 7560
tcctgctagc aacttaagtt acgaatcgac gccgaacagg tcgcgggtgt agactttctc 7620
cgagacatct tccagttcgc tggtgcggcg attcgccaca atgacatcga cgcgctcctt 7680
aaaggaattg atgtcgcgct cgacgtagga accgaagaag tagggttctt tcaggaccgg 7740
ctcgtacacc acaatctcga tacccttggc cttcaaacgt ttcatgaccc cctggatgct 7800
gctggcccgg aaattgtcgc tacccgcctt catgatcagg cgatagatac cgaccacttt 7860
gggcttacgg gacaggatgt cctcggccac gaagtcctta cgggtcgtat tcgcatccac 7920
gatggcctgg atcaggtttt gcgggacgtc gcgataattg gccaacagct gcttcgtatc 7980
cttcggcaga cagtaaccgc cgtagccgaa ggacgggttg ttgtaatgtt gaccaatgcg 8040
cggatcgagg gagacgcctt cgatgatttg tttggtatcc aggccgtgca cgctcgcgta 8100
ggtgtccagc tcgttaaagt acgcgatacg catcgccaga tacgtgttcg cgaacagttt 8160
gatggcttct gcctcgggcg aatccgtcag caggatcgga atatcctttt tgatggcacc 8220
ttccgacagg agttcggcga acttccgtgc gcgttccgac gattcgccca cgacaatgcg 8280
gctcggatag agattatcat acagggcttt gccttcgcgc aggaactccg gggaaaagat 8340
gatattattc gtgttcagat cgcgcttcag gcgttcggtg aacccgacgg ggacggtgga 8400
tttgataatg atggtcgcgt tcgggttaat ggacagcacg tcacacgcga cgctttcgac 8460
gctcagggta tcaaagttgt tattaatcgg atcatagttc gtcggggtgg cgatgatcac 8520
gtagtctgca tcgcgatatg cctcgtattt ttccgtcgtc gcgtagaggt tcagcttacg 8580
attggagaga aacttctgga tttccgggtc gcaaatcggc gagattttct tgttaatgag 8640
ctggaccttc ttcgggtcga tgtccagggc gatgatgtcg tgtttttggg agaggaggat 8700
cgcaatgctg atacccacat agccgacgcc ggccacggca attttcattt attaacctcc 8760
ttaagtgaat tcaaactagt ttacaagtcg ttttcgatct tctcccaggt atatttgcga 8820
cattcattca agttggtcag cggcgagtat ttgtactttt tgataccgag gcgcgacagg 8880
ctttcgttca ccaccttgaa atggttttcc ttttggatgt ccagtttctt gatcgacgtg 8940
ttctcgccgt gcaggacacg gttgtagcaa atcttattga tatgcttaaa cgggccgact 9000
tcgctgagtt tcaaatacat atcgtaatcc accgcattgc tgatgctctc gttgaagcct 9060
tcggtgaggt tccatgcacg cgccgtgaac atacggaagt ggtggcagat catcgcgctc 9120
gtgagctttt cgcggctgta aatcggccag ttgtagccat tgctaatcaa gttaccttca 9180
cgatcaatat tgcgattggt ggtgtacacg caggcgaggc tcaggtcttt gcgaaattca 9240
tccagacaca gttccacggc atcgggctcc aggaaatcat cggaatccag ctgcccgatg 9300
tagaaacccc ggcacaggcg gactgcggta ttcgaggcgg agccgatgcc tttgtttttc 9360
tggctgatga aacggacgcg cgggtggttt gcgtaatgtt cttgcaggat gcgcagcgta 9420
tcatcggtgc tcccgtcatc gcagatgcag acctccagat cggtgatcgt ttggttcagt 9480
gccgattcga cgcagcgcac gatatatttg ctgcaattat acgcggggat gtagatgctc 9540
accaggggca cacgtttcag ggtggcgctc tcgattttct ccttcttgcg ataaaagtag 9600
ggcaccttct gctgcaacag ctggacggta atgtttttac ctgccgcgcg atcggtttcg 9660
ttctccttac cgggcggttc ctgatgatat gccatcgcgc cttccacgct acggaaataa 9720
caaccctcgc ggtacagccg atagccgaac tcattatcct caccgcccca atgcgtgaac 9780
tcttcgtcaa accaacccgc gcgaaacagc cacttctttg caaacgccac attgccaccg 9840
ctaaagaacc ggaacggggt gttgcacagg cgcagattgt cggtattctt gaaatgttcg 9900
atgcgccaat cgacggattt gttctgctcg accttgcctg cgacctgatt attggtaata 9960
atctccggga tttcattgat caggcttttc tgggacaaaa agtccagata ggtatgcttc 10020
gacgtgtcga tgtatttacg cgggccaatc agtgccacgt tatcatccac ggccaggagt 10080
tccatatagg actgcaccca caacgggttc ggcgccatat cgcagtccaa gatcgccacg 10140
tagttgtatt tcgctgcccg caggcccagg ttccgcacgg cgcacagctg gtagccgtag 10200
tctttctggc ggacgtattt gatgttcagc aacgactcga actcgcggac gatctcttcg 10260
atgttttcct tggaaccgtc atccgcgacg atgacctcat agtcataaat cgttttctga 10320
ttgcagaggc aggccagggt gatcgccagg attttggcgc gattgtacgt cggaatcacg 10380
atggacaggc cgtcgatgat cagttgcttg cgcggataat catccagttc tttacgtttc 10440
cctgcccaga cgtagtcgtt cgtgctttcc ggcagcggcg gcaaggtcag gtcgctcggc 10500
caatccagcg gaatgggttc gacttctttc aattcggcgc gctcggattt ctttgcggta 10560
atttcccgat atttgctaat gatttcattc ttttccacct cattcagcga gatcgccttt 10620
gcattgctgc acataatttt ggttgccgcg tcgatatcaa tgaccgcttt ccgattcagc 10680
ttgtccactt cttcgctcag attcagggcg gtttggcaca gcttgatatt ggcttccacc 10740
cagctcacat catagatttc cgccactttt tcaaacaggg agagggcttg gcggtagttc 10800
ttattcttat acagattgat tgcctggttc aaaatgctca tttattaacc tcctactagt 10860
gaattttcga attacttacc gcagtacttg acacccacct gggaattgtt tttggtgcgt 10920
ttgaattggc ggatggtacg gtagatgcta aagggcaggc tgatcagacc gagcggaaaa 10980
ttgttcttat tgatgatgag cttgcccagc tgatagctca ggtgtttctt gacccgttcg 11040
gcttcgtgtt tatccgcgta caggaagatg ctcggcaggc tcacttggta ctccgaatca 11100
tatttcttct tccaggtccg ccattcgctg atcaacgcaa acggaatcga gatcagaccg 11160
aggaacgtct tggagcggct caccatcacc gcacccaggc ggtagccgat atcttgcttg 11220
atgcgttcgg ccgcaccata cagctccggc agttgtttct tttcgagacg ttgattgtcg 11280
atgaagtact gttcgagctt ttgctgcacc agatgcagct gattgagcag caattctttt 11340
tcgcacgaca gcttttcgag gcgctgttgt tgcagttcat ttttgttctg ttcctttttc 11400
agcagggact cgaagttctc gatcgcgcac tccagttcct ggacctggat ggttttgttt 11460
ttaatgatca gatcatactg gatcagttct tccttgctat ccgacagctc tttcagaatg 11520
gcttgatagg cgttcagctg tttggacgtg tgcagttcgt tgtccagaat gatctttttg 11580
ctgctctggt acagaccgtt cacgatatcg agggtgatct ggcgttgttt aatgaacgtc 11640
tcccaaataa aggacggctt atagttttcc ttctccagca cccgcaaggg ggtgttggcg 11700
ttcgattgca attcaaagta cagttccttg caatcgggat agtcgttcag gacgttgaag 11760
atcaagtact cctccgtctc gctttgcttg aaaatgatat ccccggtccc gatgtcaata 11820
ccgctgaggg acatgatctc ctgatgttct ttttccagcg taatggaggc ttcggcggtc 11880
ttaaagtcat tcacgctctg ctccagcgag tggttgatgg tattggagaa cgacaacccg 11940
aatttcagtt tcagtttgtg ttgcagttgc tggatgcagt cctcggcgtt gcgcttcacc 12000
tgttcgctcg acaccagcag gcaccgaccc cggttgttga ggaagaagtg cagcaaggcg 12060
gtgttgtatg ccagccagtt tttgatcaga tgctccgagg tatagttgct ggagatgttc 12120
tggtccgaga agtagttcgt caggatgctt ttggggtggt cgtagatgag gataaaggtg 12180
atgttctcat ccaccgattt ccaatattcc aacgtgtgaa ttgcgttggg gtcgctccaa 12240
ccgcacagtt tctggttcag gttggacagc atcagatcca atgcgatacc gttccagacg 12300
gtgctcacat ggagcggttc aaagtcggcg gaatcggtca ccgtatagat gtccggcgac 12360
tggtacgcct tccgcagcgt ctgggtgatg tcctggggcg agaggttctc acgtttggac 12420
gggcacaggg agttcatgcc gcgctgatgc aggagttctt ccacgatttg gtagttgctg 12480
ctcggatggc ccacgatcac caggcggttc atttattaac ctcctttcga aaatgaacgg 12540
tccgttaaat atagccattc ggattcttca tctgccagcg ccaggcgtcc tccagcatgg 12600
tttcgagttc ccgcttggct ttccagttca gatatttgtt ggccttttcg ggggaggacc 12660
agctctccgc gatatcaccg tcacggcggc tcacgatttc atacggaatc cgcacgccgg 12720
aaatcttttc aaaggtggac accagttcca gcaccgaata acctttaccc gtgcccaaat 12780
taaagacgtg gtagttggtg ttattgtcgc ggaagagata ggacagcgct gcgacgtgcc 12840
cttcggccag gtccatcaca tggatatagt cacggacccc cgtgccgtct ttggtgggat 12900
aatcaccacc gaacaccatc agtttttcca gtttccccat cgcgacctgc aagatgtacg 12960
gcaccaagtt ggaggggatg tctgccgggc tttcaccaat cataccggat tcgtgggcgc 13020
ccgtcggatt aaagtagcgc aagcagagga aattcgtgtc ggagtatttc ttggcgatgt 13080
cgcggatcat cagctccgag atgtacttgg acgtaccata cggattcagc gtgccaccaa 13140
tatggcagtc ttcggtgacg ggcatgatct tgctttcccc atacaccgtc gccgacgagc 13200
taaagatgaa gttggcgacg tcgttcttga tggcgcaatt gatgagttgc agggtgccgc 13260
tcacgttgtt gtcatagtag aagatgggct tgatcaggct ttctgcgacc gatttcgcac 13320
ctgcaaagtg catgatgcag tcgaatttgt gtttcttcag gatctggttc acttccttct 13380
cgttgttgat attgagttcg tagaacgtga ctttcttctt tgcgatcagc tcaatgcgac 13440
ggatgctttc gcagctgctg ttgatgagat tgtcaatgat gacgacattg tagcctttgt 13500
tcagcaggca gagcgacgtg tggctgccga tgtagcctgc accgccggtg accaggatgt 13560
tcatttatta acctcctcgg tccgaattaa cctaggttat gaggtcagca ttgcttcttc 13620
acgcggtgtt aattaataga cctgcaggat tattgtttct gttgcataaa gcctaagggg 13680
taggcctttc tagagatagc cattttttgc actcctgtat ccgcttcttg caaggctgga 13740
cttatcccta tcaaaccgga cactgcaggc tgacaagctt tcattacata tgaagagttt 13800
gtagaaacgc aaaaaggcca tccgtcagga tggccttcta agaaggctcg agtaatggta 13860
ttgaccagca tggtacctgg acgagcatgc aggccgtgtt cattgcgcac cacaaactcc 13920
gcgcttaaca cgtcgtcggt cggcgcatca tcgctggtca gcagcgccag caacgttgcc 13980
gcatccgctt tcagcaagcg gtcagcttta ttgtcgagca ataaatcagc gagacgctta 14040
agaaccgcga tgggctgatc gtcattcatc gccacactca ccagcatggc tgccgtttcg 14100
ccgtccacat caaaagcatt tgccgcacgg cttaccgcaa tcgcgctacg cagattgcct 14160
tcggcgctat cgctcagcca gataccctgt ccgagattca gcggttgttc attgatggct 14220
ttggtgacga aagtggcgtc aactgccccc gcctctttca gacgcgcagc gttcagcgcc 14280
tgaagagtca gcagatcgct ggcgacgata tccagtgtca gcatttcgtt gtcgagcttc 14340
agctgctcac tctgcttttc gcccatcagt aatgcgcgaa gttcttctgc tgttgttgct 14400
gacttcagtt gttcagcaac ggaatcatcg ctcagtacgt gggtcagctg gcgtagcagg 14460
cccagatgtt catccgagct ggcagcaata ccgattgcca cgtacgctac ctgaccgtca 14520
ccccaggtga cgccttccgg gaactgaaat acctgaacgc cggttttcag cacctgatcg 14580
cgggtgtcgg tagtgccgtg tggaatagca ataccattgc cgaggaacgt tgaggtttgc 14640
tgttcgcgcg ccagcatgcc attgacgtag ccttctgctt attagcggcc gctaatgaat 14700
cggccaacgc gcggggagag gcggtttgcg tattggcacc attccttgcg gcggcggtgc 14760
tcaacggcct caacctacta ctgggctgct tcctaatgca ggagtcgcat aagggagagc 14820
gtc 14823
<210> 171
<211> 15084
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic plasmid pBR1100
<400> 171
gatccccgac agtaagacgg gtaagcctgt tgatgatacc gctgccttac tgggtgcatt 60
agccagtctg aatgacctgt cacgggataa tccgaagtgg tcagactgga aaatcagagg 120
gcaggaactg ctgaacagca aaaagtcaga tagcaccaca tagcagaccc gccataaaac 180
gccctgagaa gcccgtgacg ggcttttctt gtattatggg tagtttcctt gcatgaatcc 240
ataaaaggcg cctgtagtgc catttacccc cattcactgc cagagccgtg agcgcagcga 300
actgaatgtc acgaaaaaga cagcgactca ggtgcctgat ggtcggagac aaaaggaata 360
ttcagcgatt tgcccgagct tgcgagggtg ctacttaagc ctttagggtt ttaaggtctg 420
ttttgtagag gagcaaacag cgtttgcgac atccttttgt aatactgcgg aactgactaa 480
agtagtgagt tatacacagg gctgggatct attcttttta tcttttttta ttctttcttt 540
attctataaa ttataaccac ttgaatataa acaaaaaaaa cacacaaagg tctagcggaa 600
tttacagagg gtctagcaga atttacaagt tttccagcaa aggtctagca gaatttacag 660
atacccacaa ctcaaaggaa aaggactagt aattatcatt gactagccca tctcaattgg 720
tatagtgatt aaaatcacct agaccaattg agatgtatgt ctgaattagt tgttttcaaa 780
gcaaatgaac tagcgattag tcgctatgac ttaacggagc atgaaaccaa gctaatttta 840
tgctgtgtgg cactactcaa ccccacgatt gaaaacccta caaggaaaga acggacggta 900
tcgttcactt ataaccaata cgttcagatg atgaacatca gtagggaaaa tgcttatggt 960
gtattagcta aagcaaccag agagctgatg acgagaactg tggaaatcag gaatcctttg 1020
gttaaaggct ttgagatttt ccagtggaca aactatgcca agttctcaag cgaaaaatta 1080
gaattagttt ttagtgaaga gatattgcct tatcttttcc agttaaaaaa attcataaaa 1140
tataatctgg aacatgttaa gtcttttgaa aacaaatact ctatgaggat ttatgagtgg 1200
ttattaaaag aactaacaca aaagaaaact cacaaggcaa atatagagat tagccttgat 1260
gaatttaagt tcatgttaat gcttgaaaat aactaccatg agtttaaaag gcttaaccaa 1320
tgggttttga aaccaataag taaagattta aacacttaca gcaatatgaa attggtggtt 1380
gataagcgag gccgcccgac tgatacgttg attttccaag ttgaactaga tagacaaatg 1440
gatctcgtaa ccgaacttga gaacaaccag ataaaaatga atggtgacaa aataccaaca 1500
accattacat cagattccta cctacataac ggactaagaa aaacactaca cgatgcttta 1560
actgcaaaaa ttcagctcac cagttttgag gcaaaatttt tgagtgacat gcaaagtaag 1620
tatgatctca atggttcgtt ctcatggctc acgcaaaaac aacgaaccac actagagaac 1680
atactggcta aatacggaag gatctgaggt tcttatggct cttgtatcta tcagtgaagc 1740
atcaagacta acaaacaaaa gtagaacaac tgttcaccgt tacatatcaa agggaaaact 1800
gtccatatgc acagatgaaa acggtgtaaa aaagatagat acatcagagc ttttacgagt 1860
ttttggtgca tttaaagctg ttcaccatga acagatcgac aatgtaacag atgaacagca 1920
tgtaacacct aatagaacag gtgaaaccag taaaacaaag caactagaac atgaaattga 1980
acacctgaga caacttgtta cagctcaaca gtcacacata gacagcctga aacaggcgat 2040
gctgcttatc gaatcaaagc tgccgacaac acgggagcca gtgacgcctc ccgtggggaa 2100
aaaatcatgg caattctgga agaaatagcg ctttcagccg gcaaaccggc tgaagccgga 2160
tctgcgattc tgataacaaa ctagcaacac cagaacagcc cgtttgcggg cagcaaaacc 2220
cgtacttttg gacgttccgg cggttttttg tggcgagtgg tgttcgggcg gtgcgcgcaa 2280
gatccattat gttaaacggg cgagtttaca tctcaaaacc gcccgcttaa caccatcaga 2340
aatcctcagc gcgattttaa gcaccaaccc ccccccgtaa cacccaaatc catactgaaa 2400
gtggctttgt tgaataaatc gaacttttgc tgagttgaag gatcagatca cgcatcctcc 2460
cgacaacaca gaccattccg tggcaaagca aaagttcaga atcaccaact ggtccaccta 2520
caacaaagct ctcatcaacc gtggctccct cactttctgg ctggatgatg aggcgattca 2580
ggcctggtat gagtcggcaa caccttcatc acgaggaagg ccccagcgct attctgatct 2640
cgccatcacc accgttctgg tgattaaacg cgtattccgg ctgaccctgc gggctgcgca 2700
gggttttatt gattccattt ttgccctgat gaacgttccg ttgcgctgcc cggattacac 2760
cagtgtcagt aagcgggcaa agtcggttaa tgtcagtttc aaaacgtcca cccggggtga 2820
aatcgcacac ctggtgattg attccaccgg gctgaaggtc tttggtgaag gcgaatggaa 2880
agtcagaaag cacggcaaag agcgccgtcg tatctggcga aagttgcatc ttgctgtggg 2940
gatcaacacg ggataatacc gcgccacata gcagaacttt aaaagtgctc atcattggaa 3000
aacgttcttc ggggcgaaaa ctctcaagga tcttaccgct gttgagatcc agttcgatgt 3060
aacccactcg tgcacccaac tgatcttcag catcttttac tttcaccagc gtttctgggt 3120
gagcaaaaac aggaaggcaa aatgccgcaa aaaagggaat aagggcgaca cggaaatgtt 3180
gaatactcat actcttcctt tttcaatatt attgaagcat ttatcagggt tattgtctca 3240
tgagcggata catatttgaa tgtatttaga aaaataaaca aataggggtt ccgcgcacat 3300
ttccccgaaa agtgccacct gacgtctaag aaaccattat tatcatgaca ttaacctata 3360
aaaataggcg tatcacgagg ccctttcgtc ttcgaataaa tacctgtgac ggaagatcac 3420
ttcgcagaat aaataaatcc tggtgtccct gttgataccg ggaagccctg ggccaacttt 3480
tggcgaaaat gagacgttga tcggcacgta agaggttcca actttcacca taatgaaata 3540
agatcactac cgggcgtatt ttttgagtta tcgagatttt caggagctaa ggaagctaaa 3600
atggagaaaa aaatcactgg atataccacc gttgatatat cccaatggca tcgtaaagaa 3660
cattttgagg catttcagtc agttgctcaa tgtacctata accagaccgt tcagctggat 3720
attacggcct ttttaaagac cgtaaagaaa aataagcaca agttttatcc ggcctttatt 3780
cacattcttg cccgcctgat gaatgctcat ccggaattcc gtatggcaat gaaagacggt 3840
gagctggtga tatgggatag tgttcaccct tgttacaccg ttttccatga gcaaactgaa 3900
acgttttcat cgctctggag tgaataccac gacgatttcc ggcagtttct acacatatat 3960
tcgcaagatg tggcgtgtta cggtgaaaac ctggcctatt tccctaaagg gtttattgag 4020
aatatgtttt tcgtctcagc caatccctgg gtgagtttca ccagttttga tttaaacgtg 4080
gccaatatgg acaacttctt cgcccccgtt ttcaccatgg gcaaatatta tacgcaaggc 4140
gacaaggtgc tgatgccgct ggcgattcag gttcatcatg ccgtttgtga tggcttccat 4200
gtcggcagaa tgcttaatga attacaacag tactgcgatg agtggcaggg cggggcgtaa 4260
tttttttaag gcagttattg gtgcccttaa acgcctggtt gctacgcctg aataagtgat 4320
aataagcgga tgaatggcag aaattcgaaa gcaaattcga cccggtcgtc ggttcagggc 4380
agggtcgtta aatagccgct tatgtctatt gctggtttac cggtttattg actaccggaa 4440
gcagtgtgac cgtgtgcttc tcaaatgcct gaggccagtt tgctcaggct ctccccgtgg 4500
aggtaataat tgacgatatg atcatttatt ctgcctccca gagcctgata aaaacggtga 4560
atccgttagc gaggtgccgc cggcttccat tcaggtcgag gtggcccggc tccatgcacc 4620
gcgacgcaac gcggggaggc agacaaggta tagggcggcg cctacaatcc atgccaaccc 4680
gttccatgtg ctcgccgagg cggcataaat cgccgtgacg atcagcggtc caatgatcga 4740
agttaggctg gtaagagccg cgagcgatcc ttgaagctgt ccctgatggt cgtcatctac 4800
ctgcctggac agcatggcct gcaacgcggg catcccgatg ccgccggaag cgagaagaat 4860
cataatgggg aaggccatcc agcctcgcgt cgcgaacgcc agcaagacgt agcccagcgc 4920
gtcggccgcc atgccggcga taatggcctg cttctcgccg aaacgtttgg tggcgggacc 4980
agtgacgaag gcttgagcga gggcgtgcaa gattccgaat accgcaagcg acaggccatg 5040
tttgacagct tatcatcgaa gctttccatt tcgctggtgg tcagatgcgg gatggcgtgg 5100
gacgcggcgg ggagcgtcac actgaggttt tccgccagac gccactgctg ccaggcgctg 5160
atgtgcccgg cttctgacca tgcggtcgcg ttcggttgca ctacgcgtac tgtgagccag 5220
agttgcccgg cgctctccgg ctgcggtagt tcaggcagtt caatcaactg tttaccttgt 5280
ggagcgacat ccagaggcac ttcaccgctt gccagcggct taccatccag cgccaccatc 5340
cagtgcagga gctcgttatc gctatgacgg aacaggtatt cgctggtcac ttcgatggtt 5400
tgcccggata aacggaactg gaaaaactgc tgctggtgtt ttgcttccgt cagcgctgga 5460
tgcggcgtgc ggtcggcaaa gaccagaccg ttcatacaga actggcgatc gttcggcgta 5520
tcgccaaaat caccgccgta agccgaccac gggttgccgt tttcatcata tttaatcagc 5580
gactgatcca cccagtccca gacgaagccg ccctgtaaac ggggatactg acgaaacgcc 5640
tgccagtatt tagcgaaacc gccaagactg ttacccatcg cgtgggcgta ttcgcaaagg 5700
atcagcgggc gcgtctctcc aggtagcgaa agccattttt tgatggacca tttcggcaca 5760
gccgggaagg gctggtcttc atccacgcgc gcgtacatcg ggcaaataat atcggtggcc 5820
gtggtgtcgg ctccgccgcc ttcatactgc accgggcggg aaggatcgac agatttgatc 5880
cagcgataca gcgcgtcgtg attagcgccg tggcctgatt cattccccag cgaccagatg 5940
atcacactcg ggtgattacg atcgcgctgc accattcgcg ttacgcgttc gctcatcgcc 6000
ggtagccagc gcggatcatc ggtcagacga ttcattggca cttagatctt agtcgacgtt 6060
aggcgcgcca gagctcatcg ttaatgtctt cgtgcgccgt cagtcggcgc acgttttttc 6120
tctctggtac cgtgtcactg atctagtcaa ttactcgaag tatccacaag tgaagcatac 6180
taagtaatgt acaagaatca aaaaaatcgg ctacgcaagt cgcgtagccg aatcatttaa 6240
ggatccagtg taatcgattg atagatttaa ataagaactg cagaagctag cttagatgct 6300
cgtgaaattg acgtgggcgc tttgcagggc cgtcttaatg gcgttggtgt ccacgaggat 6360
cgagtcgggt gcggaaaacg gacggttctt gttggtgaaa tcgctgttac caatgtacag 6420
cgattccttg ttacgcagcg cctggatgtg ccagcgggac cacgaatccc aatacttctg 6480
gcgatccggc gagatacctt ggctggtgta gccggtcgtc gggctgttca tcaacgagtc 6540
ggtgcggtgc gagcccagcg tcagcggcaa cttgatccga tgcaccgtgg aatcgccgaa 6600
gatcagcttc agacgcgcga taaattcgct atccgcaccc gttttcacac aatcccagac 6660
accggccttc tgcaagacgt cggcacggcg aaacaggagc gacgacggat tcagacgctt 6720
caaggggtac actgcgcggg catagaaaat accgttgtct tgcaggcgca cccagtccga 6780
gatggagcag atgagcttcg gattgagcaa caagggggag atttggcgga acagcttttc 6840
cggatggctc cagtcatccg aatcgtggca ggtgacgaac tcgcccttcg cttggatcaa 6900
gccgatacgc ttcgcggcat aggtgccgac attctgcggc aggctaatga tcttgatgcg 6960
cgtgtctttg agggcgagcc gctggagacg aaacagggtg tcatcggtgc tcgcgtcatc 7020
cacaatgatc agctcgaagg aacggtaggt ctgattgagg agcgaaatca ccgcattttc 7080
cacgcggcga cccgtattat aggtggtcat caggatggag atcaacggcc ccgtctgggc 7140
cgggtacggg atgctggtga tgatgttgca cggggagagc ggggagctgt tgtccgtcaa 7200
ggccacgggg ctgaggccga agtatttata gtattcattc agccgattca ggctaatttc 7260
ggcggtttcg cggaaggcgt tattttgcag cagcaggata tccgggctat agacgatatc 7320
ggatgcgtcg atctgggcga gggtcgagat ggccttttgg gtcaggccga tccggagttg 7380
cagtgcggta tacaggtcca gcgggcagtt gtccacgttg tccaacaggc tcaggctaaa 7440
ggtcggcgag taggacgcca gggttttcgc cagttccact ttctgatggg tatcggtgaa 7500
ctcgtccttg aactccatca gcagctcggg cgtcaggctg atgtcgccgc aggcgatttt 7560
tgcgatcttg attgccagtt tgcagcgcca atcggacggg gtatccgtca agttatgcag 7620
cgaccagtac atattcagac gatacatcgc gaggatgcgt ttcgactgcc agaaccggca 7680
atcatcctgg atggccgcga gcgcgtggac gtagcggctc tttttgagca gccacaagaa 7740
tttgagatta ttgaacattt attaacctcc tgctagcaac ttaagttacg aatcgacgcc 7800
gaacaggtcg cgggtgtaga ctttctccga gacatcttcc agttcgctgg tgcggcgatt 7860
cgccacaatg acatcgacgc gctccttaaa ggaattgatg tcgcgctcga cgtaggaacc 7920
gaagaagtag ggttctttca ggaccggctc gtacaccaca atctcgatac ccttggcctt 7980
caaacgtttc atgaccccct ggatgctgct ggcccggaaa ttgtcgctac ccgccttcat 8040
gatcaggcga tagataccga ccactttggg cttacgggac aggatgtcct cggccacgaa 8100
gtccttacgg gtcgtattcg catccacgat ggcctggatc aggttttgcg ggacgtcgcg 8160
ataattggcc aacagctgct tcgtatcctt cggcagacag taaccgccgt agccgaagga 8220
cgggttgttg taatgttgac caatgcgcgg atcgagggag acgccttcga tgatttgttt 8280
ggtatccagg ccgtgcacgc tcgcgtaggt gtccagctcg ttaaagtacg cgatacgcat 8340
cgccagatac gtgttcgcga acagtttgat ggcttctgcc tcgggcgaat ccgtcagcag 8400
gatcggaata tcctttttga tggcaccttc cgacaggagt tcggcgaact tccgtgcgcg 8460
ttccgacgat tcgcccacga caatgcggct cggatagaga ttatcataca gggctttgcc 8520
ttcgcgcagg aactccgggg aaaagatgat attattcgtg ttcagatcgc gcttcaggcg 8580
ttcggtgaac ccgacgggga cggtggattt gataatgatg gtcgcgttcg ggttaatgga 8640
cagcacgtca cacgcgacgc tttcgacgct cagggtatca aagttgttat taatcggatc 8700
atagttcgtc ggggtggcga tgatcacgta gtctgcatcg cgatatgcct cgtatttttc 8760
cgtcgtcgcg tagaggttca gcttacgatt ggagagaaac ttctggattt ccgggtcgca 8820
aatcggcgag attttcttgt taatgagctg gaccttcttc gggtcgatgt ccagggcgat 8880
gatgtcgtgt ttttgggaga ggaggatcgc aatgctgata cccacatagc cgacgccggc 8940
cacggcaatt ttcatttatt aacctcctta agtgaattca aactagttta caagtcgttt 9000
tcgatcttct cccaggtata tttgcgacat tcattcaagt tggtcagcgg cgagtatttg 9060
tactttttga taccgaggcg cgacaggctt tcgttcacca ccttgaaatg gttttccttt 9120
tggatgtcca gtttcttgat cgacgtgttc tcgccgtgca ggacacggtt gtagcaaatc 9180
ttattgatat gcttaaacgg gccgacttcg ctgagtttca aatacatatc gtaatccacc 9240
gcattgctga tgctctcgtt gaagccttcg gtgaggttcc atgcacgcgc cgtgaacata 9300
cggaagtggt ggcagatcat cgcgctcgtg agcttttcgc ggctgtaaat cggccagttg 9360
tagccattgc taatcaagtt accttcacga tcaatattgc gattggtggt gtacacgcag 9420
gcgaggctca ggtctttgcg aaattcatcc agacacagtt ccacggcatc gggctccagg 9480
aaatcatcgg aatccagctg cccgatgtag aaaccccggc acaggcggac tgcggtattc 9540
gaggcggagc cgatgccttt gtttttctgg ctgatgaaac ggacgcgcgg gtggtttgcg 9600
taatgttctt gcaggatgcg cagcgtatca tcggtgctcc cgtcatcgca gatgcagacc 9660
tccagatcgg tgatcgtttg gttcagtgcc gattcgacgc agcgcacgat atatttgctg 9720
caattatacg cggggatgta gatgctcacc aggggcacac gtttcagggt ggcgctctcg 9780
attttctcct tcttgcgata aaagtagggc accttctgct gcaacagctg gacggtaatg 9840
tttttacctg ccgcgcgatc ggtttcgttc tccttaccgg gcggttcctg atgatatgcc 9900
atcgcgcctt ccacgctacg gaaataacaa ccctcgcggt acagccgata gccgaactca 9960
ttatcctcac cgccccaatg cgtgaactct tcgtcaaacc aacccgcgcg aaacagccac 10020
ttctttgcaa acgccacatt gccaccgcta aagaaccgga acggggtgtt gcacaggcgc 10080
agattgtcgg tattcttgaa atgttcgatg cgccaatcga cggatttgtt ctgctcgacc 10140
ttgcctgcga cctgattatt ggtaataatc tccgggattt cattgatcag gcttttctgg 10200
gacaaaaagt ccagataggt atgcttcgac gtgtcgatgt atttacgcgg gccaatcagt 10260
gccacgttat catccacggc caggagttcc atataggact gcacccacaa cgggttcggc 10320
gccatatcgc agtccaagat cgccacgtag ttgtatttcg ctgcccgcag gcccaggttc 10380
cgcacggcgc acagctggta gccgtagtct ttctggcgga cgtatttgat gttcagcaac 10440
gactcgaact cgcggacgat ctcttcgatg ttttccttgg aaccgtcatc cgcgacgatg 10500
acctcatagt cataaatcgt tttctgattg cagaggcagg ccagggtgat cgccaggatt 10560
ttggcgcgat tgtacgtcgg aatcacgatg gacaggccgt cgatgatcag ttgcttgcgc 10620
ggataatcat ccagttcttt acgtttccct gcccagacgt agtcgttcgt gctttccggc 10680
agcggcggca aggtcaggtc gctcggccaa tccagcggaa tgggttcgac ttctttcaat 10740
tcggcgcgct cggatttctt tgcggtaatt tcccgatatt tgctaatgat ttcattcttt 10800
tccacctcat tcagcgagat cgcctttgca ttgctgcaca taattttggt tgccgcgtcg 10860
atatcaatga ccgctttccg attcagcttg tccacttctt cgctcagatt cagggcggtt 10920
tggcacagct tgatattggc ttccacccag ctcacatcat agatttccgc cactttttca 10980
aacagggaga gggcttggcg gtagttctta ttcttataca gattgattgc ctggttcaaa 11040
atgctcattt attaacctcc tactagtgaa ttttcgaatt acttaccgca gtacttgaca 11100
cccacctggg aattgttttt ggtgcgtttg aattggcgga tggtacggta gatgctaaag 11160
ggcaggctga tcagaccgag cggaaaattg ttcttattga tgatgagctt gcccagctga 11220
tagctcaggt gtttcttgac ccgttcggct tcgtgtttat ccgcgtacag gaagatgctc 11280
ggcaggctca cttggtactc cgaatcatat ttcttcttcc aggtccgcca ttcgctgatc 11340
aacgcaaacg gaatcgagat cagaccgagg aacgtcttgg agcggctcac catcaccgca 11400
cccaggcggt agccgatatc ttgcttgatg cgttcggccg caccatacag ctccggcagt 11460
tgtttctttt cgagacgttg attgtcgatg aagtactgtt cgagcttttg ctgcaccaga 11520
tgcagctgat tgagcagcaa ttctttttcg cacgacagct tttcgaggcg ctgttgttgc 11580
agttcatttt tgttctgttc ctttttcagc agggactcga agttctcgat cgcgcactcc 11640
agttcctgga cctggatggt tttgttttta atgatcagat catactggat cagttcttcc 11700
ttgctatccg acagctcttt cagaatggct tgataggcgt tcagctgttt ggacgtgtgc 11760
agttcgttgt ccagaatgat ctttttgctg ctctggtaca gaccgttcac gatatcgagg 11820
gtgatctggc gttgtttaat gaacgtctcc caaataaagg acggcttata gttttccttc 11880
tccagcaccc gcaagggggt gttggcgttc gattgcaatt caaagtacag ttccttgcaa 11940
tcgggatagt cgttcaggac gttgaagatc aagtactcct ccgtctcgct ttgcttgaaa 12000
atgatatccc cggtcccgat gtcaataccg ctgagggaca tgatctcctg atgttctttt 12060
tccagcgtaa tggaggcttc ggcggtctta aagtcattca cgctctgctc cagcgagtgg 12120
ttgatggtat tggagaacga caacccgaat ttcagtttca gtttgtgttg cagttgctgg 12180
atgcagtcct cggcgttgcg cttcacctgt tcgctcgaca ccagcaggca ccgaccccgg 12240
ttgttgagga agaagtgcag caaggcggtg ttgtatgcca gccagttttt gatcagatgc 12300
tccgaggtat agttgctgga gatgttctgg tccgagaagt agttcgtcag gatgcttttg 12360
gggtggtcgt agatgaggat aaaggtgatg ttctcatcca ccgatttcca atattccaac 12420
gtgtgaattg cgttggggtc gctccaaccg cacagtttct ggttcaggtt ggacagcatc 12480
agatccaatg cgataccgtt ccagacggtg ctcacatgga gcggttcaaa gtcggcggaa 12540
tcggtcaccg tatagatgtc cggcgactgg tacgccttcc gcagcgtctg ggtgatgtcc 12600
tggggcgaga ggttctcacg tttggacggg cacagggagt tcatgccgcg ctgatgcagg 12660
agttcttcca cgatttggta gttgctgctc ggatggccca cgatcaccag gcggttcatt 12720
tattaacctc ctttcgaaaa tgaacggtcc gttaaatata gccattcgga ttcttcatct 12780
gccagcgcca ggcgtcctcc agcatggttt cgagttcccg cttggctttc cagttcagat 12840
atttgttggc cttttcgggg gaggaccagc tctccgcgat atcaccgtca cggcggctca 12900
cgatttcata cggaatccgc acgccggaaa tcttttcaaa ggtggacacc agttccagca 12960
ccgaataacc tttacccgtg cccaaattaa agacgtggta gttggtgtta ttgtcgcgga 13020
agagatagga cagcgctgcg acgtgccctt cggccaggtc catcacatgg atatagtcac 13080
ggacccccgt gccgtctttg gtgggataat caccaccgaa caccatcagt ttttccagtt 13140
tccccatcgc gacctgcaag atgtacggca ccaagttgga ggggatgtct gccgggcttt 13200
caccaatcat accggattcg tgggcgcccg tcggattaaa gtagcgcaag cagaggaaat 13260
tcgtgtcgga gtatttcttg gcgatgtcgc ggatcatcag ctccgagatg tacttggacg 13320
taccatacgg attcagcgtg ccaccaatat ggcagtcttc ggtgacgggc atgatcttgc 13380
tttccccata caccgtcgcc gacgagctaa agatgaagtt ggcgacgtcg ttcttgatgg 13440
cgcaattgat gagttgcagg gtgccgctca cgttgttgtc atagtagaag atgggcttga 13500
tcaggctttc tgcgaccgat ttcgcacctg caaagtgcat gatgcagtcg aatttgtgtt 13560
tcttcaggat ctggttcact tccttctcgt tgttgatatt gagttcgtag aacgtgactt 13620
tcttctttgc gatcagctca atgcgacgga tgctttcgca gctgctgttg atgagattgt 13680
caatgatgac gacattgtag cctttgttca gcaggcagag cgacgtgtgg ctgccgatgt 13740
agcctgcacc gccggtgacc aggatgttca tttattaacc tcctcggtcc gaattaacct 13800
aggttatgag gtcagcattg cttcttcacg cggtgttaat taatagacct gcaggattat 13860
tgtttctgtt gcataaagcc taaggggtag gcctttctag agatagccat tttttgcact 13920
cctgtatccg cttcttgcaa ggctggactt atccctatca aaccggacac tgcaggctga 13980
caagctttca ttacatatga agagtttgta gaaacgcaaa aaggccatcc gtcaggatgg 14040
ccttctaaga aggctcgagc ttcatccacc acatacaggc cgtagcggtc gcacagcgtg 14100
taccacagcg gatggttcgg ataatgcgaa cagcgcacgg cgttaaagtt gttctgcttc 14160
atcagcagga tatcctgcac catcgtctgc tcatccatga cctgaccatg cagaggatga 14220
tgctcgtgac ggttaacgcc tcgaatcagc aacggcttgc cgttcagcag cagcagacca 14280
ttttcaatcc gcacctcgcg gaaaccgaca tcgcaggctt ctgcttcaat cagcgtgccg 14340
tcggcggtgt gcagttcaac caccgcacga tagagattcg ggatttcggc gctccacagt 14400
ttcgggtttt cgacgttcag acgtagtgtg acgcgatcgg cataaccacc acgctcatcg 14460
ataatttcac cgccgaaagg cgcggtgccg ctggcgacct gcgtttcacc ctgccataaa 14520
gaaactgtta cccgtaggta gtcacgcaac tcgccgcaca tctgaacttc agcctccagt 14580
acagcgcggc tgaaatcatc attaaagcga gtggcaacat ggaaatcgct gatttgtgta 14640
gtcggtttat gcagcaacga gacgtcacgg aaaatgccgc tcatccgcca catatcctga 14700
tcttccagat aactgccgtc actccagcgc agcaccatca ccgcgaggcg gttttctccg 14760
gcgcgtaaaa atgcgctcag gtcaaattca gacggcaaac gactgtcctg gccgtaaccg 14820
acccagcgcc cgttgcacca cagatgaaac gccgagttaa cgccatcaaa aataattcgc 14880
gtctggcctt cctgtagcca gctttcatca acattaaatg tgagcgagta acaacccgtt 14940
tattagcggc cgctaatgaa tcggccaacg cgcggggaga ggcggtttgc gtattggcac 15000
cattccttgc ggcggcggtg ctcaacggcc tcaacctact actgggctgc ttcctaatgc 15060
aggagtcgca taagggagag cgtc 15084
<210> 172
<211> 14763
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic plasmid pBR1101
<400> 172
gatccccgac agtaagacgg gtaagcctgt tgatgatacc gctgccttac tgggtgcatt 60
agccagtctg aatgacctgt cacgggataa tccgaagtgg tcagactgga aaatcagagg 120
gcaggaactg ctgaacagca aaaagtcaga tagcaccaca tagcagaccc gccataaaac 180
gccctgagaa gcccgtgacg ggcttttctt gtattatggg tagtttcctt gcatgaatcc 240
ataaaaggcg cctgtagtgc catttacccc cattcactgc cagagccgtg agcgcagcga 300
actgaatgtc acgaaaaaga cagcgactca ggtgcctgat ggtcggagac aaaaggaata 360
ttcagcgatt tgcccgagct tgcgagggtg ctacttaagc ctttagggtt ttaaggtctg 420
ttttgtagag gagcaaacag cgtttgcgac atccttttgt aatactgcgg aactgactaa 480
agtagtgagt tatacacagg gctgggatct attcttttta tcttttttta ttctttcttt 540
attctataaa ttataaccac ttgaatataa acaaaaaaaa cacacaaagg tctagcggaa 600
tttacagagg gtctagcaga atttacaagt tttccagcaa aggtctagca gaatttacag 660
atacccacaa ctcaaaggaa aaggactagt aattatcatt gactagccca tctcaattgg 720
tatagtgatt aaaatcacct agaccaattg agatgtatgt ctgaattagt tgttttcaaa 780
gcaaatgaac tagcgattag tcgctatgac ttaacggagc atgaaaccaa gctaatttta 840
tgctgtgtgg cactactcaa ccccacgatt gaaaacccta caaggaaaga acggacggta 900
tcgttcactt ataaccaata cgttcagatg atgaacatca gtagggaaaa tgcttatggt 960
gtattagcta aagcaaccag agagctgatg acgagaactg tggaaatcag gaatcctttg 1020
gttaaaggct ttgagatttt ccagtggaca aactatgcca agttctcaag cgaaaaatta 1080
gaattagttt ttagtgaaga gatattgcct tatcttttcc agttaaaaaa attcataaaa 1140
tataatctgg aacatgttaa gtcttttgaa aacaaatact ctatgaggat ttatgagtgg 1200
ttattaaaag aactaacaca aaagaaaact cacaaggcaa atatagagat tagccttgat 1260
gaatttaagt tcatgttaat gcttgaaaat aactaccatg agtttaaaag gcttaaccaa 1320
tgggttttga aaccaataag taaagattta aacacttaca gcaatatgaa attggtggtt 1380
gataagcgag gccgcccgac tgatacgttg attttccaag ttgaactaga tagacaaatg 1440
gatctcgtaa ccgaacttga gaacaaccag ataaaaatga atggtgacaa aataccaaca 1500
accattacat cagattccta cctacataac ggactaagaa aaacactaca cgatgcttta 1560
actgcaaaaa ttcagctcac cagttttgag gcaaaatttt tgagtgacat gcaaagtaag 1620
tatgatctca atggttcgtt ctcatggctc acgcaaaaac aacgaaccac actagagaac 1680
atactggcta aatacggaag gatctgaggt tcttatggct cttgtatcta tcagtgaagc 1740
atcaagacta acaaacaaaa gtagaacaac tgttcaccgt tacatatcaa agggaaaact 1800
gtccatatgc acagatgaaa acggtgtaaa aaagatagat acatcagagc ttttacgagt 1860
ttttggtgca tttaaagctg ttcaccatga acagatcgac aatgtaacag atgaacagca 1920
tgtaacacct aatagaacag gtgaaaccag taaaacaaag caactagaac atgaaattga 1980
acacctgaga caacttgtta cagctcaaca gtcacacata gacagcctga aacaggcgat 2040
gctgcttatc gaatcaaagc tgccgacaac acgggagcca gtgacgcctc ccgtggggaa 2100
aaaatcatgg caattctgga agaaatagcg ctttcagccg gcaaaccggc tgaagccgga 2160
tctgcgattc tgataacaaa ctagcaacac cagaacagcc cgtttgcggg cagcaaaacc 2220
cgtacttttg gacgttccgg cggttttttg tggcgagtgg tgttcgggcg gtgcgcgcaa 2280
gatccattat gttaaacggg cgagtttaca tctcaaaacc gcccgcttaa caccatcaga 2340
aatcctcagc gcgattttaa gcaccaaccc ccccccgtaa cacccaaatc catactgaaa 2400
gtggctttgt tgaataaatc gaacttttgc tgagttgaag gatcagatca cgcatcctcc 2460
cgacaacaca gaccattccg tggcaaagca aaagttcaga atcaccaact ggtccaccta 2520
caacaaagct ctcatcaacc gtggctccct cactttctgg ctggatgatg aggcgattca 2580
ggcctggtat gagtcggcaa caccttcatc acgaggaagg ccccagcgct attctgatct 2640
cgccatcacc accgttctgg tgattaaacg cgtattccgg ctgaccctgc gggctgcgca 2700
gggttttatt gattccattt ttgccctgat gaacgttccg ttgcgctgcc cggattacac 2760
cagtgtcagt aagcgggcaa agtcggttaa tgtcagtttc aaaacgtcca cccggggtga 2820
aatcgcacac ctggtgattg attccaccgg gctgaaggtc tttggtgaag gcgaatggaa 2880
agtcagaaag cacggcaaag agcgccgtcg tatctggcga aagttgcatc ttgctgtggg 2940
gatcaacacg ggataatacc gcgccacata gcagaacttt aaaagtgctc atcattggaa 3000
aacgttcttc ggggcgaaaa ctctcaagga tcttaccgct gttgagatcc agttcgatgt 3060
aacccactcg tgcacccaac tgatcttcag catcttttac tttcaccagc gtttctgggt 3120
gagcaaaaac aggaaggcaa aatgccgcaa aaaagggaat aagggcgaca cggaaatgtt 3180
gaatactcat actcttcctt tttcaatatt attgaagcat ttatcagggt tattgtctca 3240
tgagcggata catatttgaa tgtatttaga aaaataaaca aataggggtt ccgcgcacat 3300
ttccccgaaa agtgccacct gacgtctaag aaaccattat tatcatgaca ttaacctata 3360
aaaataggcg tatcacgagg ccctttcgtc ttcgaataaa tacctgtgac ggaagatcac 3420
ttcgcagaat aaataaatcc tggtgtccct gttgataccg ggaagccctg ggccaacttt 3480
tggcgaaaat gagacgttga tcggcacgta agaggttcca actttcacca taatgaaata 3540
agatcactac cgggcgtatt ttttgagtta tcgagatttt caggagctaa ggaagctaaa 3600
atggagaaaa aaatcactgg atataccacc gttgatatat cccaatggca tcgtaaagaa 3660
cattttgagg catttcagtc agttgctcaa tgtacctata accagaccgt tcagctggat 3720
attacggcct ttttaaagac cgtaaagaaa aataagcaca agttttatcc ggcctttatt 3780
cacattcttg cccgcctgat gaatgctcat ccggaattcc gtatggcaat gaaagacggt 3840
gagctggtga tatgggatag tgttcaccct tgttacaccg ttttccatga gcaaactgaa 3900
acgttttcat cgctctggag tgaataccac gacgatttcc ggcagtttct acacatatat 3960
tcgcaagatg tggcgtgtta cggtgaaaac ctggcctatt tccctaaagg gtttattgag 4020
aatatgtttt tcgtctcagc caatccctgg gtgagtttca ccagttttga tttaaacgtg 4080
gccaatatgg acaacttctt cgcccccgtt ttcaccatgg gcaaatatta tacgcaaggc 4140
gacaaggtgc tgatgccgct ggcgattcag gttcatcatg ccgtttgtga tggcttccat 4200
gtcggcagaa tgcttaatga attacaacag tactgcgatg agtggcaggg cggggcgtaa 4260
tttttttaag gcagttattg gtgcccttaa acgcctggtt gctacgcctg aataagtgat 4320
aataagcgga tgaatggcag aaattcgaaa gcaaattcga cccggtcgtc ggttcagggc 4380
agggtcgtta aatagccgct tatgtctatt gctggtttac cggtttattg actaccggaa 4440
gcagtgtgac cgtgtgcttc tcaaatgcct gaggccagtt tgctcaggct ctccccgtgg 4500
aggtaataat tgacgatatg atcatttatt ctgcctccca gagcctgata aaaacggtga 4560
atccgttagc gaggtgccgc cggcttccat tcaggtcgag gtggcccggc tccatgcacc 4620
gcgacgcaac gcggggaggc agacaaggta tagggcggcg cctacaatcc atgccaaccc 4680
gttccatgtg ctcgccgagg cggcataaat cgccgtgacg atcagcggtc caatgatcga 4740
agttaggctg gtaagagccg cgagcgatcc ttgaagctgt ccctgatggt cgtcatctac 4800
ctgcctggac agcatggcct gcaacgcggg catcccgatg ccgccggaag cgagaagaat 4860
cataatgggg aaggccatcc agcctcgcgt cgcgaacgcc agcaagacgt agcccagcgc 4920
gtcggccgcc atgccggcga taatggcctg cttctcgccg aaacgtttgg tggcgggacc 4980
agtgacgaag gcttgagcga gggcgtgcaa gattccgaat accgcaagcg acaggccatg 5040
tttgacagct tatcatcgaa gcttagactc acccagataa gtcggggtca gtttttcacg 5100
atccagcatc gcctgaacgt attccggctc aacgtaaccg cctttcacca gctgctcgcc 5160
agcaaaacga atcgcttctt ctttggttgc cgctttgcga ccgaggaaga tgttctccgc 5220
gcctagcttg aacaggttag cactggaatc gtcaaagctg tctttcaggc tgtcttttac 5280
tttctcttcg tttgccgtgt ggcgttgggc agcaaccaga cgttcggtca ggctggtgta 5340
caggccgctg tcgaggaagt tggtcagcga aatatgctgt gcctgcggaa cctggcgcat 5400
agcgcgttcg gtcaggtcac ggtgagtgat gacgaggtcc acatctggcg gcaggttgtt 5460
gatcgcgctg ttagtaacag aaatctgcga cagacctgca tcctgaattt tcttacgcag 5520
aacgcctgcg cccatcgcac tggaacccat accggcgtca caggcaacga tgattttacg 5580
tacgtggctc aggtcgttag tcacatcgcc agcagacagc ggagatgcgc ctttagactc 5640
agctttcatg tcctgcatac gacgagttgc tgcttcaata tcatcttctt ctttcacttt 5700
gctggttttc agcaaaatag cagagacaac gaaggagaca gccatcgccg cacacacacc 5760
cgcgatgtta gcgaagtaag caccttttgg tgtcatcgct tagatcttag tcgacgttag 5820
gcgcgccaga gctcatcgtt aatgtcttcg tgcgccgtca gtcggcgcac gttttttctc 5880
tctggtaccg tgtcactgat ctagtcaatt actcgaagta tccacaagtg aagcatacta 5940
agtaatgtac aagaatcaaa aaaatcggct acgcaagtcg cgtagccgaa tcatttaagg 6000
atccagtgta atcgattgat agatttaaat aagaactgca gaagctagct tagatgctcg 6060
tgaaattgac gtgggcgctt tgcagggccg tcttaatggc gttggtgtcc acgaggatcg 6120
agtcgggtgc ggaaaacgga cggttcttgt tggtgaaatc gctgttacca atgtacagcg 6180
attccttgtt acgcagcgcc tggatgtgcc agcgggacca cgaatcccaa tacttctggc 6240
gatccggcga gataccttgg ctggtgtagc cggtcgtcgg gctgttcatc aacgagtcgg 6300
tgcggtgcga gcccagcgtc agcggcaact tgatccgatg caccgtggaa tcgccgaaga 6360
tcagcttcag acgcgcgata aattcgctat ccgcacccgt tttcacacaa tcccagacac 6420
cggccttctg caagacgtcg gcacggcgaa acaggagcga cgacggattc agacgcttca 6480
aggggtacac tgcgcgggca tagaaaatac cgttgtcttg caggcgcacc cagtccgaga 6540
tggagcagat gagcttcgga ttgagcaaca agggggagat ttggcggaac agcttttccg 6600
gatggctcca gtcatccgaa tcgtggcagg tgacgaactc gcccttcgct tggatcaagc 6660
cgatacgctt cgcggcatag gtgccgacat tctgcggcag gctaatgatc ttgatgcgcg 6720
tgtctttgag ggcgagccgc tggagacgaa acagggtgtc atcggtgctc gcgtcatcca 6780
caatgatcag ctcgaaggaa cggtaggtct gattgaggag cgaaatcacc gcattttcca 6840
cgcggcgacc cgtattatag gtggtcatca ggatggagat caacggcccc gtctgggccg 6900
ggtacgggat gctggtgatg atgttgcacg gggagagcgg ggagctgttg tccgtcaagg 6960
ccacggggct gaggccgaag tatttatagt attcattcag ccgattcagg ctaatttcgg 7020
cggtttcgcg gaaggcgtta ttttgcagca gcaggatatc cgggctatag acgatatcgg 7080
atgcgtcgat ctgggcgagg gtcgagatgg ccttttgggt caggccgatc cggagttgca 7140
gtgcggtata caggtccagc gggcagttgt ccacgttgtc caacaggctc aggctaaagg 7200
tcggcgagta ggacgccagg gttttcgcca gttccacttt ctgatgggta tcggtgaact 7260
cgtccttgaa ctccatcagc agctcgggcg tcaggctgat gtcgccgcag gcgatttttg 7320
cgatcttgat tgccagtttg cagcgccaat cggacggggt atccgtcaag ttatgcagcg 7380
accagtacat attcagacga tacatcgcga ggatgcgttt cgactgccag aaccggcaat 7440
catcctggat ggccgcgagc gcgtggacgt agcggctctt tttgagcagc cacaagaatt 7500
tgagattatt gaacatttat taacctcctg ctagcaactt aagttacgaa tcgacgccga 7560
acaggtcgcg ggtgtagact ttctccgaga catcttccag ttcgctggtg cggcgattcg 7620
ccacaatgac atcgacgcgc tccttaaagg aattgatgtc gcgctcgacg taggaaccga 7680
agaagtaggg ttctttcagg accggctcgt acaccacaat ctcgataccc ttggccttca 7740
aacgtttcat gaccccctgg atgctgctgg cccggaaatt gtcgctaccc gccttcatga 7800
tcaggcgata gataccgacc actttgggct tacgggacag gatgtcctcg gccacgaagt 7860
ccttacgggt cgtattcgca tccacgatgg cctggatcag gttttgcggg acgtcgcgat 7920
aattggccaa cagctgcttc gtatccttcg gcagacagta accgccgtag ccgaaggacg 7980
ggttgttgta atgttgacca atgcgcggat cgagggagac gccttcgatg atttgtttgg 8040
tatccaggcc gtgcacgctc gcgtaggtgt ccagctcgtt aaagtacgcg atacgcatcg 8100
ccagatacgt gttcgcgaac agtttgatgg cttctgcctc gggcgaatcc gtcagcagga 8160
tcggaatatc ctttttgatg gcaccttccg acaggagttc ggcgaacttc cgtgcgcgtt 8220
ccgacgattc gcccacgaca atgcggctcg gatagagatt atcatacagg gctttgcctt 8280
cgcgcaggaa ctccggggaa aagatgatat tattcgtgtt cagatcgcgc ttcaggcgtt 8340
cggtgaaccc gacggggacg gtggatttga taatgatggt cgcgttcggg ttaatggaca 8400
gcacgtcaca cgcgacgctt tcgacgctca gggtatcaaa gttgttatta atcggatcat 8460
agttcgtcgg ggtggcgatg atcacgtagt ctgcatcgcg atatgcctcg tatttttccg 8520
tcgtcgcgta gaggttcagc ttacgattgg agagaaactt ctggatttcc gggtcgcaaa 8580
tcggcgagat tttcttgtta atgagctgga ccttcttcgg gtcgatgtcc agggcgatga 8640
tgtcgtgttt ttgggagagg aggatcgcaa tgctgatacc cacatagccg acgccggcca 8700
cggcaatttt catttattaa cctccttaag tgaattcaaa ctagtttaca agtcgttttc 8760
gatcttctcc caggtatatt tgcgacattc attcaagttg gtcagcggcg agtatttgta 8820
ctttttgata ccgaggcgcg acaggctttc gttcaccacc ttgaaatggt tttccttttg 8880
gatgtccagt ttcttgatcg acgtgttctc gccgtgcagg acacggttgt agcaaatctt 8940
attgatatgc ttaaacgggc cgacttcgct gagtttcaaa tacatatcgt aatccaccgc 9000
attgctgatg ctctcgttga agccttcggt gaggttccat gcacgcgccg tgaacatacg 9060
gaagtggtgg cagatcatcg cgctcgtgag cttttcgcgg ctgtaaatcg gccagttgta 9120
gccattgcta atcaagttac cttcacgatc aatattgcga ttggtggtgt acacgcaggc 9180
gaggctcagg tctttgcgaa attcatccag acacagttcc acggcatcgg gctccaggaa 9240
atcatcggaa tccagctgcc cgatgtagaa accccggcac aggcggactg cggtattcga 9300
ggcggagccg atgcctttgt ttttctggct gatgaaacgg acgcgcgggt ggtttgcgta 9360
atgttcttgc aggatgcgca gcgtatcatc ggtgctcccg tcatcgcaga tgcagacctc 9420
cagatcggtg atcgtttggt tcagtgccga ttcgacgcag cgcacgatat atttgctgca 9480
attatacgcg gggatgtaga tgctcaccag gggcacacgt ttcagggtgg cgctctcgat 9540
tttctccttc ttgcgataaa agtagggcac cttctgctgc aacagctgga cggtaatgtt 9600
tttacctgcc gcgcgatcgg tttcgttctc cttaccgggc ggttcctgat gatatgccat 9660
cgcgccttcc acgctacgga aataacaacc ctcgcggtac agccgatagc cgaactcatt 9720
atcctcaccg ccccaatgcg tgaactcttc gtcaaaccaa cccgcgcgaa acagccactt 9780
ctttgcaaac gccacattgc caccgctaaa gaaccggaac ggggtgttgc acaggcgcag 9840
attgtcggta ttcttgaaat gttcgatgcg ccaatcgacg gatttgttct gctcgacctt 9900
gcctgcgacc tgattattgg taataatctc cgggatttca ttgatcaggc ttttctggga 9960
caaaaagtcc agataggtat gcttcgacgt gtcgatgtat ttacgcgggc caatcagtgc 10020
cacgttatca tccacggcca ggagttccat ataggactgc acccacaacg ggttcggcgc 10080
catatcgcag tccaagatcg ccacgtagtt gtatttcgct gcccgcaggc ccaggttccg 10140
cacggcgcac agctggtagc cgtagtcttt ctggcggacg tatttgatgt tcagcaacga 10200
ctcgaactcg cggacgatct cttcgatgtt ttccttggaa ccgtcatccg cgacgatgac 10260
ctcatagtca taaatcgttt tctgattgca gaggcaggcc agggtgatcg ccaggatttt 10320
ggcgcgattg tacgtcggaa tcacgatgga caggccgtcg atgatcagtt gcttgcgcgg 10380
ataatcatcc agttctttac gtttccctgc ccagacgtag tcgttcgtgc tttccggcag 10440
cggcggcaag gtcaggtcgc tcggccaatc cagcggaatg ggttcgactt ctttcaattc 10500
ggcgcgctcg gatttctttg cggtaatttc ccgatatttg ctaatgattt cattcttttc 10560
cacctcattc agcgagatcg cctttgcatt gctgcacata attttggttg ccgcgtcgat 10620
atcaatgacc gctttccgat tcagcttgtc cacttcttcg ctcagattca gggcggtttg 10680
gcacagcttg atattggctt ccacccagct cacatcatag atttccgcca ctttttcaaa 10740
cagggagagg gcttggcggt agttcttatt cttatacaga ttgattgcct ggttcaaaat 10800
gctcatttat taacctccta ctagtgaatt ttcgaattac ttaccgcagt acttgacacc 10860
cacctgggaa ttgtttttgg tgcgtttgaa ttggcggatg gtacggtaga tgctaaaggg 10920
caggctgatc agaccgagcg gaaaattgtt cttattgatg atgagcttgc ccagctgata 10980
gctcaggtgt ttcttgaccc gttcggcttc gtgtttatcc gcgtacagga agatgctcgg 11040
caggctcact tggtactccg aatcatattt cttcttccag gtccgccatt cgctgatcaa 11100
cgcaaacgga atcgagatca gaccgaggaa cgtcttggag cggctcacca tcaccgcacc 11160
caggcggtag ccgatatctt gcttgatgcg ttcggccgca ccatacagct ccggcagttg 11220
tttcttttcg agacgttgat tgtcgatgaa gtactgttcg agcttttgct gcaccagatg 11280
cagctgattg agcagcaatt ctttttcgca cgacagcttt tcgaggcgct gttgttgcag 11340
ttcatttttg ttctgttcct ttttcagcag ggactcgaag ttctcgatcg cgcactccag 11400
ttcctggacc tggatggttt tgtttttaat gatcagatca tactggatca gttcttcctt 11460
gctatccgac agctctttca gaatggcttg ataggcgttc agctgtttgg acgtgtgcag 11520
ttcgttgtcc agaatgatct ttttgctgct ctggtacaga ccgttcacga tatcgagggt 11580
gatctggcgt tgtttaatga acgtctccca aataaaggac ggcttatagt tttccttctc 11640
cagcacccgc aagggggtgt tggcgttcga ttgcaattca aagtacagtt ccttgcaatc 11700
gggatagtcg ttcaggacgt tgaagatcaa gtactcctcc gtctcgcttt gcttgaaaat 11760
gatatccccg gtcccgatgt caataccgct gagggacatg atctcctgat gttctttttc 11820
cagcgtaatg gaggcttcgg cggtcttaaa gtcattcacg ctctgctcca gcgagtggtt 11880
gatggtattg gagaacgaca acccgaattt cagtttcagt ttgtgttgca gttgctggat 11940
gcagtcctcg gcgttgcgct tcacctgttc gctcgacacc agcaggcacc gaccccggtt 12000
gttgaggaag aagtgcagca aggcggtgtt gtatgccagc cagtttttga tcagatgctc 12060
cgaggtatag ttgctggaga tgttctggtc cgagaagtag ttcgtcagga tgcttttggg 12120
gtggtcgtag atgaggataa aggtgatgtt ctcatccacc gatttccaat attccaacgt 12180
gtgaattgcg ttggggtcgc tccaaccgca cagtttctgg ttcaggttgg acagcatcag 12240
atccaatgcg ataccgttcc agacggtgct cacatggagc ggttcaaagt cggcggaatc 12300
ggtcaccgta tagatgtccg gcgactggta cgccttccgc agcgtctggg tgatgtcctg 12360
gggcgagagg ttctcacgtt tggacgggca cagggagttc atgccgcgct gatgcaggag 12420
ttcttccacg atttggtagt tgctgctcgg atggcccacg atcaccaggc ggttcattta 12480
ttaacctcct ttcgaaaatg aacggtccgt taaatatagc cattcggatt cttcatctgc 12540
cagcgccagg cgtcctccag catggtttcg agttcccgct tggctttcca gttcagatat 12600
ttgttggcct tttcggggga ggaccagctc tccgcgatat caccgtcacg gcggctcacg 12660
atttcatacg gaatccgcac gccggaaatc ttttcaaagg tggacaccag ttccagcacc 12720
gaataacctt tacccgtgcc caaattaaag acgtggtagt tggtgttatt gtcgcggaag 12780
agataggaca gcgctgcgac gtgcccttcg gccaggtcca tcacatggat atagtcacgg 12840
acccccgtgc cgtctttggt gggataatca ccaccgaaca ccatcagttt ttccagtttc 12900
cccatcgcga cctgcaagat gtacggcacc aagttggagg ggatgtctgc cgggctttca 12960
ccaatcatac cggattcgtg ggcgcccgtc ggattaaagt agcgcaagca gaggaaattc 13020
gtgtcggagt atttcttggc gatgtcgcgg atcatcagct ccgagatgta cttggacgta 13080
ccatacggat tcagcgtgcc accaatatgg cagtcttcgg tgacgggcat gatcttgctt 13140
tccccataca ccgtcgccga cgagctaaag atgaagttgg cgacgtcgtt cttgatggcg 13200
caattgatga gttgcagggt gccgctcacg ttgttgtcat agtagaagat gggcttgatc 13260
aggctttctg cgaccgattt cgcacctgca aagtgcatga tgcagtcgaa tttgtgtttc 13320
ttcaggatct ggttcacttc cttctcgttg ttgatattga gttcgtagaa cgtgactttc 13380
ttctttgcga tcagctcaat gcgacggatg ctttcgcagc tgctgttgat gagattgtca 13440
atgatgacga cattgtagcc tttgttcagc aggcagagcg acgtgtggct gccgatgtag 13500
cctgcaccgc cggtgaccag gatgttcatt tattaacctc ctcggtccga attaacctag 13560
gttatgaggt cagcattgct tcttcacgcg gtgttaatta atagacctgc aggattattg 13620
tttctgttgc ataaagccta aggggtaggc ctttctagag atagccattt tttgcactcc 13680
tgtatccgct tcttgcaagg ctggacttat ccctatcaaa ccggacactg caggctgaca 13740
agctttcatt acatatgaag agtttgtaga aacgcaaaaa ggccatccgt caggatggcc 13800
ttctaagaag gctcgagcag tacagcaagg atagaacccg gagatgccgg agaaaccaga 13860
ccaccgccca ggatagtcag cgtgaacacg ccagtcatac cgccgaggat gactgcgagg 13920
atcagacgcg gattcatcag cacatacggg aagtagattt cgtggatacc ccccaggaag 13980
tggatgattg ccgcaccgcc cgcagactgt ttagcgctac cacgaccaaa gaacatgtac 14040
gccagcagca cgcccatacc tggacctggg ttagcttcaa tcaggaagaa gattgattta 14100
cccagttcat gggactgctg aatacccagc ggcgagaaga taccgtggtt aatggcgttg 14160
ttgaggaaca ggattttcgc cggttcaaca aagatagacg ccagcggcag catgtcatgg 14220
acaaccatga agttaacgcc cgcagccagc attttggaca gggcttcaac aatcgggcca 14280
atgccgagga atgccagaat agcgaggatc atcccgatga tgcctgcgga gaagttattc 14340
accagcatct caaaaccgga tttgatctta ccgtctaccc agcggtcgaa gtgcttaatg 14400
caccagccgc ccagcggacc tgcaatcata gaaccgagga acatcggcat gtctgcgccg 14460
acgataacgc ccatggtggt gatggcaccg actacgccgc cacgttcgcc gcctaccagc 14520
ttaccaccgg tataaccgat cagcagcggc aggagataag tgatcatcgg cccgaccagc 14580
ttcgccagcg tctcgttcgg taaccaccct gttggaattt attagcggcc gctaatgaat 14640
cggccaacgc gcggggagag gcggtttgcg tattggcacc attccttgcg gcggcggtgc 14700
tcaacggcct caacctacta ctgggctgct tcctaatgca ggagtcgcat aagggagagc 14760
gtc 14763
<210> 173
<211> 29
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic primer BLR513
<400> 173
tcatcaagct tgtccggaag tgatgaccc 29
<210> 174
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic primer BLR516
<400> 174
gtagcctcga gcatggtggc gttgtcgatg 30
<210> 175
<211> 5859
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic plasmid pBR1103
<400> 175
gatccccgac agtaagacgg gtaagcctgt tgatgatacc gctgccttac tgggtgcatt 60
agccagtctg aatgacctgt cacgggataa tccgaagtgg tcagactgga aaatcagagg 120
gcaggaactg ctgaacagca aaaagtcaga tagcaccaca tagcagaccc gccataaaac 180
gccctgagaa gcccgtgacg ggcttttctt gtattatggg tagtttcctt gcatgaatcc 240
ataaaaggcg cctgtagtgc catttacccc cattcactgc cagagccgtg agcgcagcga 300
actgaatgtc acgaaaaaga cagcgactca ggtgcctgat ggtcggagac aaaaggaata 360
ttcagcgatt tgcccgagct tgcgagggtg ctacttaagc ctttagggtt ttaaggtctg 420
ttttgtagag gagcaaacag cgtttgcgac atccttttgt aatactgcgg aactgactaa 480
agtagtgagt tatacacagg gctgggatct attcttttta tcttttttta ttctttcttt 540
attctataaa ttataaccac ttgaatataa acaaaaaaaa cacacaaagg tctagcggaa 600
tttacagagg gtctagcaga atttacaagt tttccagcaa aggtctagca gaatttacag 660
atacccacaa ctcaaaggaa aaggactagt aattatcatt gactagccca tctcaattgg 720
tatagtgatt aaaatcacct agaccaattg agatgtatgt ctgaattagt tgttttcaaa 780
gcaaatgaac tagcgattag tcgctatgac ttaacggagc atgaaaccaa gctaatttta 840
tgctgtgtgg cactactcaa ccccacgatt gaaaacccta caaggaaaga acggacggta 900
tcgttcactt ataaccaata cgttcagatg atgaacatca gtagggaaaa tgcttatggt 960
gtattagcta aagcaaccag agagctgatg acgagaactg tggaaatcag gaatcctttg 1020
gttaaaggct ttgagatttt ccagtggaca aactatgcca agttctcaag cgaaaaatta 1080
gaattagttt ttagtgaaga gatattgcct tatcttttcc agttaaaaaa attcataaaa 1140
tataatctgg aacatgttaa gtcttttgaa aacaaatact ctatgaggat ttatgagtgg 1200
ttattaaaag aactaacaca aaagaaaact cacaaggcaa atatagagat tagccttgat 1260
gaatttaagt tcatgttaat gcttgaaaat aactaccatg agtttaaaag gcttaaccaa 1320
tgggttttga aaccaataag taaagattta aacacttaca gcaatatgaa attggtggtt 1380
gataagcgag gccgcccgac tgatacgttg attttccaag ttgaactaga tagacaaatg 1440
gatctcgtaa ccgaacttga gaacaaccag ataaaaatga atggtgacaa aataccaaca 1500
accattacat cagattccta cctacataac ggactaagaa aaacactaca cgatgcttta 1560
actgcaaaaa ttcagctcac cagttttgag gcaaaatttt tgagtgacat gcaaagtaag 1620
tatgatctca atggttcgtt ctcatggctc acgcaaaaac aacgaaccac actagagaac 1680
atactggcta aatacggaag gatctgaggt tcttatggct cttgtatcta tcagtgaagc 1740
atcaagacta acaaacaaaa gtagaacaac tgttcaccgt tacatatcaa agggaaaact 1800
gtccatatgc acagatgaaa acggtgtaaa aaagatagat acatcagagc ttttacgagt 1860
ttttggtgca tttaaagctg ttcaccatga acagatcgac aatgtaacag atgaacagca 1920
tgtaacacct aatagaacag gtgaaaccag taaaacaaag caactagaac atgaaattga 1980
acacctgaga caacttgtta cagctcaaca gtcacacata gacagcctga aacaggcgat 2040
gctgcttatc gaatcaaagc tgccgacaac acgggagcca gtgacgcctc ccgtggggaa 2100
aaaatcatgg caattctgga agaaatagcg ctttcagccg gcaaaccggc tgaagccgga 2160
tctgcgattc tgataacaaa ctagcaacac cagaacagcc cgtttgcggg cagcaaaacc 2220
cgtacttttg gacgttccgg cggttttttg tggcgagtgg tgttcgggcg gtgcgcgcaa 2280
gatccattat gttaaacggg cgagtttaca tctcaaaacc gcccgcttaa caccatcaga 2340
aatcctcagc gcgattttaa gcaccaaccc ccccccgtaa cacccaaatc catactgaaa 2400
gtggctttgt tgaataaatc gaacttttgc tgagttgaag gatcagatca cgcatcctcc 2460
cgacaacaca gaccattccg tggcaaagca aaagttcaga atcaccaact ggtccaccta 2520
caacaaagct ctcatcaacc gtggctccct cactttctgg ctggatgatg aggcgattca 2580
ggcctggtat gagtcggcaa caccttcatc acgaggaagg ccccagcgct attctgatct 2640
cgccatcacc accgttctgg tgattaaacg cgtattccgg ctgaccctgc gggctgcgca 2700
gggttttatt gattccattt ttgccctgat gaacgttccg ttgcgctgcc cggattacac 2760
cagtgtcagt aagcgggcaa agtcggttaa tgtcagtttc aaaacgtcca cccggggtga 2820
aatcgcacac ctggtgattg attccaccgg gctgaaggtc tttggtgaag gcgaatggaa 2880
agtcagaaag cacggcaaag agcgccgtcg tatctggcga aagttgcatc ttgctgtggg 2940
gatcaacacg ggataatacc gcgccacata gcagaacttt aaaagtgctc atcattggaa 3000
aacgttcttc ggggcgaaaa ctctcaagga tcttaccgct gttgagatcc agttcgatgt 3060
aacccactcg tgcacccaac tgatcttcag catcttttac tttcaccagc gtttctgggt 3120
gagcaaaaac aggaaggcaa aatgccgcaa aaaagggaat aagggcgaca cggaaatgtt 3180
gaatactcat actcttcctt tttcaatatt attgaagcat ttatcagggt tattgtctca 3240
tgagcggata catatttgaa tgtatttaga aaaataaaca aataggggtt ccgcgcacat 3300
ttccccgaaa agtgccacct gacgtctaag aaaccattat tatcatgaca ttaacctata 3360
aaaataggcg tatcacgagg ccctttcgtc ttcgaataaa tacctgtgac ggaagatcac 3420
ttcgcagaat aaataaatcc tggtgtccct gttgataccg ggaagccctg ggccaacttt 3480
tggcgaaaat gagacgttga tcggcacgta agaggttcca actttcacca taatgaaata 3540
agatcactac cgggcgtatt ttttgagtta tcgagatttt caggagctaa ggaagctaaa 3600
atggagaaaa aaatcactgg atataccacc gttgatatat cccaatggca tcgtaaagaa 3660
cattttgagg catttcagtc agttgctcaa tgtacctata accagaccgt tcagctggat 3720
attacggcct ttttaaagac cgtaaagaaa aataagcaca agttttatcc ggcctttatt 3780
cacattcttg cccgcctgat gaatgctcat ccggaattcc gtatggcaat gaaagacggt 3840
gagctggtga tatgggatag tgttcaccct tgttacaccg ttttccatga gcaaactgaa 3900
acgttttcat cgctctggag tgaataccac gacgatttcc ggcagtttct acacatatat 3960
tcgcaagatg tggcgtgtta cggtgaaaac ctggcctatt tccctaaagg gtttattgag 4020
aatatgtttt tcgtctcagc caatccctgg gtgagtttca ccagttttga tttaaacgtg 4080
gccaatatgg acaacttctt cgcccccgtt ttcaccatgg gcaaatatta tacgcaaggc 4140
gacaaggtgc tgatgccgct ggcgattcag gttcatcatg ccgtttgtga tggcttccat 4200
gtcggcagaa tgcttaatga attacaacag tactgcgatg agtggcaggg cggggcgtaa 4260
tttttttaag gcagttattg gtgcccttaa acgcctggtt gctacgcctg aataagtgat 4320
aataagcgga tgaatggcag aaattcgaaa gcaaattcga cccggtcgtc ggttcagggc 4380
agggtcgtta aatagccgct tatgtctatt gctggtttac cggtttattg actaccggaa 4440
gcagtgtgac cgtgtgcttc tcaaatgcct gaggccagtt tgctcaggct ctccccgtgg 4500
aggtaataat tgacgatatg atcatttatt ctgcctccca gagcctgata aaaacggtga 4560
atccgttagc gaggtgccgc cggcttccat tcaggtcgag gtggcccggc tccatgcacc 4620
gcgacgcaac gcggggaggc agacaaggta tagggcggcg cctacaatcc atgccaaccc 4680
gttccatgtg ctcgccgagg cggcataaat cgccgtgacg atcagcggtc caatgatcga 4740
agttaggctg gtaagagccg cgagcgatcc ttgaagctgt ccctgatggt cgtcatctac 4800
ctgcctggac agcatggcct gcaacgcggg catcccgatg ccgccggaag cgagaagaat 4860
cataatgggg aaggccatcc agcctcgcgt cgcgaacgcc agcaagacgt agcccagcgc 4920
gtcggccgcc atgccggcga taatggcctg cttctcgccg aaacgtttgg tggcgggacc 4980
agtgacgaag gcttgagcga gggcgtgcaa gattccgaat accgcaagcg acaggccatg 5040
tttgacagct tatcatcgaa gcttgtccgg aagtgatgac ccaggcgctg aaagtgctgg 5100
atgccgtgcg caaccgcttt gcgatgcgca tcaccaccag ccattacgat gtaggcggcg 5160
cagccattga taaccacggg caaccactgc cgcctgcgac ggttgaaggt tgtgagcaag 5220
ccgatgccgt gctgtttggc tcggtaggcg gcccgaagtg ggaacattta ccaccagacc 5280
agcaaccaga acgcggcgcg ctgctgcctc tgcgtaagca cttcaaatta ttcagcaacc 5340
tgcgcccggc aaaactgtat caggggctgg aagcattctg tccgctgcgt gcagacattg 5400
ccgcaaacgg cttcgacatc ctgtgtgtgc gcgaactgac cggcggcatc tatttcggtc 5460
agccaaaagg ccgcgaaggt agcggacaat atgaaaaagc ctttgatacc gaggtgtatc 5520
accgttttga gatcgaacgt atcgcccgca tcgcgtttga atctgctcgc aagcgtcgcc 5580
acaaagtgac gtcgatcgat aaagccaacg tgctgcaatc ctctatttta tggcgggaga 5640
tcgttaacga gatcgccacg gaatacccgg atgtcgaact ggcgcatatg tacatcgaca 5700
acgccaccat gctcgagtat gcggccgcta atgaatcggc caacgcgcgg ggagaggcgg 5760
tttgcgtatt ggcaccattc cttgcggcgg cggtgctcaa cggcctcaac ctactactgg 5820
gctgcttcct aatgcaggag tcgcataagg gagagcgtc 5859
Claims (64)
- kfoA 유전자, kfoC 유전자 및 kfoF 유전자를 포함하되, kfoD, orf3(kfoI), kfoE 및 orf1(kfoH) 중 하나 이상의 기능성 유전자를 함유하지 않고, 비-병원성 박테리아 숙주 세포에서 콘드로이틴을 생산하기에 적합한 작제물(construct).
- 제1항에 있어서,
kfoG 유전자, kfoB 유전자 또는 이들의 조합을 추가로 포함하는 작제물. - 제1항에 있어서,
콘드로이틴이 프럭토실화되지 않은(non-fructosylated), 작제물. - 제1항에 있어서,
kpsF 유전자, kpsE 유전자, kpsD 유전자, kpsU 유전자, kpsC 유전자 및 kpsS 유전자를 추가로 포함하는 작제물. - 제4항에 있어서,
kpsM 유전자 및 kpsT 유전자를 추가로 포함하는 작제물. - 제4항에 있어서,
콘드로이틴이 숙주 세포로부터 분비되는, 작제물. - 제1항에 있어서,
kpsM, kpsT, kpsE, kpsD, kpsC 및 kpsS 중 하나 이상의 기능성 유전자를 또한 함유하지 않는 작제물. - 제7항에 있어서,
콘드로이틴이 숙주 세포로부터 분비되지 않는, 작제물. - 제1항에 있어서,
하나 이상의 유전자가 박테리아 숙주 세포에서의 최적의 코돈 사용빈도(codon usage)를 위해 변형되는, 작제물. - 제1항에 있어서,
K4 유전자 클러스터를 포함하는 작제물. - 제1항에 따른 작제물을 포함하는 비-병원성 박테리아 숙주 세포.
- 제11항에 있어서,
에스케리키아(Escherichia), 슈도모나스(Pseudomonas), 잔토모나스(Xanthomonas), 메틸로모나스(Methylomonas), 아시네토박터(Acinetobacter) 및 스핑고모나스(Sphingomonas)로 이루어진 군으로부터 선택되는 비-병원성 유기체이거나 이로부터 유도되는 비-병원성 박테리아 숙주 세포. - 제12항에 있어서,
MSC279, MSC280, MSC315, MSC316, MSC317, MSC319, MSC322, MSC323, MSC324, MSC325, MSC326, MSC328, MSC346, MSC347, MSC348, MSC350, MSC356, MSC359, MSC392, MSC402, MSC403, MSC404, MSC405, MSC410, MSC411, MSC436, MSC437, MSC438, MSC439, MSC458, MSC459, MSC460, MSC461, MSC466, MSC467, MSC469, MSC480, MSC494, MSC498, MSC499, MSC500, MSC510, MSC511, MSC522, MSC526, MSC537, MSC551, MSC561, MSC562, MSC563, MSC564, MSC566, MSC567, MSC619, MSC625, MSC627, MSC640, MSC641, MSC643, MSC646, MSC650, MSC656, MSC657, MSC658, MSC659, MSC660, MSC669, MSC670, MSC671, MSC672, MSC673, MSC674, MSC675, MSC676, MSC677, MSC678, MSC679, MSC680, MSC681, MSC682, MSC683, MSC684, MSC687, MSC688, MSC689, MSC690, MSC691, MSC692, MSC693, MSC694, MSC700, MSC701, MSC702, MSC722, MSC723 및 MSC724로 이루어진 군으로부터 선택되는 박테리아 균주인 비-병원성 박테리아 숙주 세포. - 제1항에 따른 작제물을 포함하는 비-병원성 박테리아 숙주 세포의 생산 방법으로서, 상기 작제물을 비-병원성 박테리아 숙주 세포에 전달하는 단계를 포함하는, 생산 방법.
- 프럭토실화되지 않은 콘드로이틴을 생산할 수 있고 kfoA 유전자, kfoC 유전자 및 kfoF 유전자를 포함하는 박테리아 세포의 생산 방법으로서, 세포에서 kfoD, orf3(kfoI), kfoE, orf1(kfoH) 및 이들의 조합으로 이루어진 군으로부터 선택되는 유전자를 불활성화시키는 단계를 포함하는 생산 방법.
- kfoA 유전자, kfoC 유전자 및 kfoF 유전자를 포함하되, kfoD, orf3(kfoI), kfoE 및 orf1(kfoH) 중 하나 이상의 기능성 유전자를 함유하지 않고, 콘드로이틴을 생산할 수 있는 재조합 박테리아 세포.
- 제16항에 있어서,
kfoA 유전자, kfoC 유전자, kfoF 유전자 또는 이들의 조합이 Pm, Plac, Ptrp, Ptac, λpL, PT7, PphoA, ParaC, PxapA, Pcad 및 PrecA로 이루어진 군으로부터 선택되는 프로모터로부터 발현되는, 재조합 박테리아 세포. - kfoA 유전자, kfoC 유전자 및 kfoF 유전자를 포함하고, 유전적으로 변형되어 kfoD, orf3(kfoI), kfoE 및 orf1(kfoH) 중 하나 이상의 유전자를 결실시키거나 불활성화시키고, 콘드로이틴을 생산할 수 있는 유전적으로 변형된 미생물.
- 콘드로이틴의 생산에 충분한 발효 조건하에서 제16항에 따른 재조합 박테리아 세포를 배양하는 단계를 포함하는, 콘드로이틴의 생산 방법.
- 콘드로이틴의 생산에 충분한 발효 조건하에서 제18항에 따른 유전적으로 변형된 미생물을 배양하는 단계를 포함하는, 콘드로이틴의 생산 방법.
- 콘드로이틴의 생산에 충분한 발효 조건하에서 제1항에 따른 작제물을 포함하는 비-병원성 박테리아 숙주 세포를 배양하는 단계를 포함하는, 콘드로이틴의 생산 방법.
- 제21항에 있어서,
작제물의 유전자가 박테리아 숙주 세포의 염색체 내로 통합되는, 생산 방법. - 제22항에 있어서,
작제물의 유전자의 2개 이상의 카피가 박테리아 숙주 세포의 염색체 내로 통합되는, 생산 방법. - 제19항 내지 제21항 중 어느 한 항에 있어서,
콘드로이틴이 프럭토실화되지 않은, 생산 방법. - (a) 제19항 내지 제21항 중 어느 한 항에 따른 생산 방법에 의해 콘드로이틴을 생산하는 단계; 및
(b) 콘드로이틴을 황산화시키는 단계
를 포함하는, 콘드로이틴 설페이트의 생산 방법. - 제25항에 있어서,
황산화시키는 단계가 설퍼트라이옥사이드-트라이에틸아민 복합체 또는 클로로설폰산을 포름아미드 내의 콘드로이틴과 혼합하는 것을 포함하는, 생산 방법. - 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US30940710P | 2010-03-01 | 2010-03-01 | |
US61/309,407 | 2010-03-01 | ||
PCT/US2011/026748 WO2011109438A1 (en) | 2010-03-01 | 2011-03-01 | Compositions and methods for bacterial production of chondroitin |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20130055571A KR20130055571A (ko) | 2013-05-28 |
KR101848102B1 true KR101848102B1 (ko) | 2018-04-11 |
Family
ID=44542545
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020127025916A KR101848102B1 (ko) | 2010-03-01 | 2011-03-01 | 콘드로이틴의 박테리아 생산을 위한 조성물 및 방법 |
Country Status (8)
Country | Link |
---|---|
US (2) | US8697398B2 (ko) |
EP (1) | EP2542686B1 (ko) |
JP (1) | JP5875531B2 (ko) |
KR (1) | KR101848102B1 (ko) |
CN (1) | CN102869782B (ko) |
BR (1) | BR112012021995A8 (ko) |
ES (1) | ES2661593T3 (ko) |
WO (1) | WO2011109438A1 (ko) |
Families Citing this family (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
BR112012021995A8 (pt) | 2010-03-01 | 2018-01-02 | Dsm Ip Assets Bv | Composição,célula hospedeira bacteriana não patogênica, método para a produção de um sulfato de condroitina,condroitina, composição e anticorpo ou fragmento de anticorpo |
WO2012004063A1 (en) * | 2010-07-09 | 2012-01-12 | Gnosis S.P.A. | Biotechnological production of chondroitin |
US9040257B2 (en) * | 2012-05-17 | 2015-05-26 | Toyobo Co., Ltd. | Basidiomycetous yeast mutant |
ITMI20120896A1 (it) | 2012-05-23 | 2013-11-24 | Bongulielmi Reto | Condroitina per uso in medicina |
ITMI20121316A1 (it) * | 2012-07-27 | 2014-01-28 | Altergon Sa | Complessi di condroitina ad assorbimento transcutaneo |
EP2919806A4 (en) * | 2012-11-16 | 2016-06-22 | Jackson H M Found Military Med | PEPTIDES GONORRHEA MOTHER AND VACCINES |
US20150247174A1 (en) * | 2012-12-28 | 2015-09-03 | Anhui Huaheng Bioengineering Co., Ltd, | Engineering bacteria for producing dl-alanine and method for producing dl-alanine by using engineering bacteria |
US10196625B2 (en) | 2013-09-30 | 2019-02-05 | Seikagaku Corporation | Method for improving blood persistence of protein |
FR3016637B1 (fr) * | 2014-01-23 | 2020-11-27 | Centre Nat Rech Scient | Procede de production in vivo de glycosaminoglycane |
US9616114B1 (en) | 2014-09-18 | 2017-04-11 | David Gordon Bermudes | Modified bacteria having improved pharmacokinetics and tumor colonization enhancing antitumor activity |
EP3050973A1 (en) * | 2015-01-30 | 2016-08-03 | Jennewein Biotechnologie GmbH | Fermentation process for producing monosaccharides in free form from nucleotide-activated sugars |
CN107406525B (zh) | 2015-03-31 | 2020-06-12 | 生化学工业株式会社 | 糖胺聚糖的硫酸化方法 |
US11180535B1 (en) | 2016-12-07 | 2021-11-23 | David Gordon Bermudes | Saccharide binding, tumor penetration, and cytotoxic antitumor chimeric peptides from therapeutic bacteria |
US11129906B1 (en) | 2016-12-07 | 2021-09-28 | David Gordon Bermudes | Chimeric protein toxins for expression by therapeutic bacteria |
IT202000013633A1 (it) * | 2020-06-08 | 2021-12-08 | Vivatis Pharma Gmbh | Processo di estrazione di una condroitina solfato da un fungo, una condroitina solfato di origine vegetale e suo uso |
EP4067487A1 (en) | 2021-04-01 | 2022-10-05 | Givaudan SA | Chondroitin-producing recombinant cell |
Family Cites Families (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20030104601A1 (en) | 1999-04-01 | 2003-06-05 | Deangelis Paul L. | Chondroitin synthase gene and methods of making and using same |
EP1129209B1 (en) | 1998-11-11 | 2009-01-21 | The Board Of Regents Of The University Of Oklahoma | Polymer grafting by polysaccharide synthases |
US20060105431A1 (en) | 1998-11-11 | 2006-05-18 | Deangelis Paul L | Polymer grafting by polysaccharide synthases using artificial sugar acceptors |
US6235510B1 (en) | 1999-08-18 | 2001-05-22 | Smithkline Beecham Corporation | ppGaNTase-T6 |
CA2392463C (en) | 1999-11-25 | 2009-10-20 | Yamasa Corporation | Novel use of uridine diphosphate glucose 4-epimerase |
DE10019881A1 (de) * | 2000-04-20 | 2001-11-15 | Gerhard Miksch | Verfahren zur Überexpression und extrazellulären Produktion bakterieller Phytasen in Escherichia coli |
EP1470235A4 (en) | 2001-07-13 | 2008-05-21 | Univ Oklahoma | GLYCOSAMINOGLYCAN POLYMERS AND METHODS OF PREPARING AND USING THE SAME |
JP4702819B2 (ja) | 2001-08-01 | 2011-06-15 | 生化学工業株式会社 | コンドロイチン合成酵素 |
JP4101548B2 (ja) | 2001-08-10 | 2008-06-18 | 生化学工業株式会社 | コンドロイチン合成酵素及びそれをコードするdna |
ATE388233T1 (de) | 2002-05-31 | 2008-03-15 | Seikagaku Kogyo Co Ltd | Chondroitinsynthetase und das enzym codierende nukleinsäure |
AU2003241687A1 (en) | 2002-05-31 | 2003-12-19 | Amersham Biosciences K.K. | Chondroitin synthetase and dna coding for the enzyme |
AU2005287397A1 (en) | 2004-06-30 | 2006-03-30 | Paul L. Deangelis | Methods of selectively treating diseases with specific glycosaminoglycan polymers |
ES2299284B1 (es) * | 2004-11-04 | 2009-04-16 | Universidad Pablo De Olavide | Control de la expresion genica mediante el uso de un atenuador de la transcripcion. |
US20080219960A1 (en) | 2004-12-16 | 2008-09-11 | Masja Nathalie Nierop Groot | Novel Efficient Production Process for Capsular Polysaccharides of Pathogenic Grampositive Bacteria by Heterologous Expression and Secretion of Complex Polysaccharides in Non-Pathogenic, Non-Invasive Gram-Positive Bacteria |
EP1888763B1 (en) * | 2005-06-06 | 2015-08-12 | Pfenex Inc. | Mannitol induced promoter systems in bacterial host cells |
US8067204B2 (en) | 2005-12-15 | 2011-11-29 | Seikagaku Corporation | Long-chain chondroitin sugar chain and method for producing the same and method for promoting synthesis of chondroitin |
EP2690178B1 (en) | 2006-10-03 | 2021-12-22 | The Board Of Regents Of The University Of Oklahoma | Targeted glycosaminoglycan polymers by polymer grafting and methods of making and using same |
KR101548139B1 (ko) | 2007-04-24 | 2015-08-28 | 세이가가쿠 고교 가부시키가이샤 | 콘드로이틴 생산 세균 및 콘드로이틴 생산 방법 |
BR112012021995A8 (pt) | 2010-03-01 | 2018-01-02 | Dsm Ip Assets Bv | Composição,célula hospedeira bacteriana não patogênica, método para a produção de um sulfato de condroitina,condroitina, composição e anticorpo ou fragmento de anticorpo |
WO2012004063A1 (en) | 2010-07-09 | 2012-01-12 | Gnosis S.P.A. | Biotechnological production of chondroitin |
-
2011
- 2011-03-01 BR BR112012021995A patent/BR112012021995A8/pt not_active Application Discontinuation
- 2011-03-01 US US13/038,326 patent/US8697398B2/en active Active
- 2011-03-01 KR KR1020127025916A patent/KR101848102B1/ko active IP Right Grant
- 2011-03-01 CN CN201180022154.5A patent/CN102869782B/zh active Active
- 2011-03-01 ES ES11751231.9T patent/ES2661593T3/es active Active
- 2011-03-01 EP EP11751231.9A patent/EP2542686B1/en active Active
- 2011-03-01 JP JP2012556184A patent/JP5875531B2/ja active Active
- 2011-03-01 WO PCT/US2011/026748 patent/WO2011109438A1/en active Application Filing
-
2014
- 2014-02-20 US US14/185,639 patent/US9175293B2/en active Active
Non-Patent Citations (1)
Title |
---|
Ninomiya 등. THE JOURNAL OF BIOLOGICAL CHEMISTRY. Vol. 277, No. 24, 페이지 21567-21575 (2002.04.09.)* |
Also Published As
Publication number | Publication date |
---|---|
US8697398B2 (en) | 2014-04-15 |
KR20130055571A (ko) | 2013-05-28 |
EP2542686A1 (en) | 2013-01-09 |
JP5875531B2 (ja) | 2016-03-02 |
EP2542686A4 (en) | 2014-03-26 |
US20140296505A1 (en) | 2014-10-02 |
ES2661593T3 (es) | 2018-04-02 |
BR112012021995A8 (pt) | 2018-01-02 |
US9175293B2 (en) | 2015-11-03 |
BR112012021995A2 (pt) | 2015-10-06 |
JP2013520995A (ja) | 2013-06-10 |
CN102869782B (zh) | 2015-11-25 |
WO2011109438A1 (en) | 2011-09-09 |
US20110244520A1 (en) | 2011-10-06 |
CN102869782A (zh) | 2013-01-09 |
EP2542686B1 (en) | 2018-01-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101848102B1 (ko) | 콘드로이틴의 박테리아 생산을 위한 조성물 및 방법 | |
AU2020244599B2 (en) | Compositions comprising bacterial strains | |
KR102563191B1 (ko) | 비피도박테리움 애니멀리스 ssp. 락티스를 이용한 암 치료 조성물 및 방법 | |
AU2018203835B2 (en) | Recombinant dna constructs and methods for modulating expression of a target gene | |
KR102644935B1 (ko) | 항-PD1/PD-L1/PD-L2 항체에 대한 반응성의 마커로서의 미생물총 조성물, 및 항-PD1/PD-L1/PD-L2 Ab-기반 치료의 효능을 개선하기 위한 미생물 조정제의 용도 | |
AU2020227049A1 (en) | Fast diagnosis and personalized treatments for acne | |
CN101365788B (zh) | Δ-9延伸酶及其在制备多不饱和脂肪酸中的用途 | |
CN100558896C (zh) | 双岐杆菌的基因组 | |
KR20140015136A (ko) | 3-히드록시프로피온산 및 다른 생성물의 제조 방법 | |
KR20120136349A (ko) | 고가의 화학적 생성물의 미생물 생산, 및 관련 조성물, 방법 및 시스템 | |
KR20130117753A (ko) | 포스포케톨라아제를 포함하는 재조합 숙주 세포 | |
KR20130027063A (ko) | Fe-s 클러스터 요구성 단백질의 활성 향상 | |
KR20070086634A (ko) | 공업적으로 유용한 미생물 | |
CN113227364A (zh) | 用于产生熊去氧胆酸及其前体的细胞和方法 | |
KR20220012327A (ko) | 피토칸나비노이드 및 피토칸나비노이드 전구체의 생산을 위한 방법 및 세포 | |
CN116249779A (zh) | 免疫刺激细菌递送平台及其用于递送治疗产物的用途 | |
AU2016295177A1 (en) | Genetic testing for predicting resistance of serratia species against antimicrobial agents | |
KR20230111189A (ko) | 재프로그램 가능한 iscb 뉴클레아제 및 이의 용도 | |
KR20210097723A (ko) | 발효에 의한 1,5-디아미노펜탄의 생산을 위한 조작된 생합성 경로 | |
KR20230127308A (ko) | 신규 핵산-가이드 뉴클레아제 | |
CN107208149A (zh) | 结直肠癌相关疾病的生物标志物 | |
KR20220116504A (ko) | 정밀 화학물의 제조에서 공시 수율, 탄소-전환-효율 및 탄소 기질 적응성의 증가 | |
KR101561591B1 (ko) | 지질 분해효소 LipT를 생산하는 신규한 내냉성 슈도모나스 만델리 JR-1 균주 및 그 유전체의 염기서열 | |
CN112384624A (zh) | 用于对阿克曼菌进行基因操纵的系统和方法 | |
KR102125235B1 (ko) | 닭 대장균 예방 및 치료를 위한 신규 박테리오파지 및 이를 이용한 항균조성물 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
N231 | Notification of change of applicant | ||
E902 | Notification of reason for refusal | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant |