KR101848102B1 - 콘드로이틴의 박테리아 생산을 위한 조성물 및 방법 - Google Patents

콘드로이틴의 박테리아 생산을 위한 조성물 및 방법 Download PDF

Info

Publication number
KR101848102B1
KR101848102B1 KR1020127025916A KR20127025916A KR101848102B1 KR 101848102 B1 KR101848102 B1 KR 101848102B1 KR 1020127025916 A KR1020127025916 A KR 1020127025916A KR 20127025916 A KR20127025916 A KR 20127025916A KR 101848102 B1 KR101848102 B1 KR 101848102B1
Authority
KR
South Korea
Prior art keywords
gene
kfo
chondroitin
kps
delete delete
Prior art date
Application number
KR1020127025916A
Other languages
English (en)
Other versions
KR20130055571A (ko
Inventor
다니엘 에이치. 도헐티
크레그 에이. 위버
켄타로 미야모토
토시카주 미나미사와
Original Assignee
세이가가쿠 고교 가부시키가이샤
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 세이가가쿠 고교 가부시키가이샤 filed Critical 세이가가쿠 고교 가부시키가이샤
Publication of KR20130055571A publication Critical patent/KR20130055571A/ko
Application granted granted Critical
Publication of KR101848102B1 publication Critical patent/KR101848102B1/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/195Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
    • C07K14/24Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria from Enterobacteriaceae (F), e.g. Citrobacter, Serratia, Proteus, Providencia, Morganella, Yersinia
    • C07K14/245Escherichia (G)
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K16/00Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies
    • C07K16/12Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from bacteria
    • C07K16/1203Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from bacteria from Gram-negative bacteria
    • C07K16/1228Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from bacteria from Gram-negative bacteria from Enterobacteriaceae (F), e.g. Citrobacter, Serratia, Proteus, Providencia, Morganella, Yersinia
    • C07K16/1232Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from bacteria from Gram-negative bacteria from Enterobacteriaceae (F), e.g. Citrobacter, Serratia, Proteus, Providencia, Morganella, Yersinia from Escherichia (G)
    • CCHEMISTRY; METALLURGY
    • C08ORGANIC MACROMOLECULAR COMPOUNDS; THEIR PREPARATION OR CHEMICAL WORKING-UP; COMPOSITIONS BASED THEREON
    • C08BPOLYSACCHARIDES; DERIVATIVES THEREOF
    • C08B37/00Preparation of polysaccharides not provided for in groups C08B1/00 - C08B35/00; Derivatives thereof
    • C08B37/006Heteroglycans, i.e. polysaccharides having more than one sugar residue in the main chain in either alternating or less regular sequence; Gellans; Succinoglycans; Arabinogalactans; Tragacanth or gum tragacanth or traganth from Astragalus; Gum Karaya from Sterculia urens; Gum Ghatti from Anogeissus latifolia; Derivatives thereof
    • C08B37/0063Glycosaminoglycans or mucopolysaccharides, e.g. keratan sulfate; Derivatives thereof, e.g. fucoidan
    • C08B37/0069Chondroitin-4-sulfate, i.e. chondroitin sulfate A; Dermatan sulfate, i.e. chondroitin sulfate B or beta-heparin; Chondroitin-6-sulfate, i.e. chondroitin sulfate C; Derivatives thereof
    • CCHEMISTRY; METALLURGY
    • C08ORGANIC MACROMOLECULAR COMPOUNDS; THEIR PREPARATION OR CHEMICAL WORKING-UP; COMPOSITIONS BASED THEREON
    • C08LCOMPOSITIONS OF MACROMOLECULAR COMPOUNDS
    • C08L5/00Compositions of polysaccharides or of their derivatives not provided for in groups C08L1/00 or C08L3/00
    • C08L5/08Chitin; Chondroitin sulfate; Hyaluronic acid; Derivatives thereof
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/52Genes encoding for enzymes or proenzymes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/70Vectors or expression systems specially adapted for E. coli
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/74Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P19/00Preparation of compounds containing saccharide radicals
    • C12P19/04Polysaccharides, i.e. compounds containing more than five saccharide radicals attached to each other by glycosidic bonds
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P19/00Preparation of compounds containing saccharide radicals
    • C12P19/26Preparation of nitrogen-containing carbohydrates

Landscapes

  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Microbiology (AREA)
  • Biophysics (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Medicinal Chemistry (AREA)
  • General Chemical & Material Sciences (AREA)
  • Polymers & Plastics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Dermatology (AREA)
  • Materials Engineering (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Immunology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Polysaccharides And Polysaccharide Derivatives (AREA)
  • Peptides Or Proteins (AREA)

Abstract

본 발명은 재조합 박테리아 발효와 발효 후 황산화의 조합을 통한 콘드로이틴 설페이트의 생산을 비롯한, 콘드로이틴의 생산을 위한 재조합 DNA 기술 분야에 관한 것이다.

Description

콘드로이틴의 박테리아 생산을 위한 조성물 및 방법{Compositions and Methods for Bacterial Production of Chondroitin}
본 발명은 재조합 박테리아 발효 및 발효-후 황산화의 조합을 통해 콘드로이틴 설페이트를 생산함을 포함하는, 콘드로이틴의 생산을 위한 재조합 DNA 기술의 분야에 관한 것이다.
콘드로이틴은 글리코스아미노글리칸이라고 불리는 헤테로다당류의 계열에 속한다. 글리코스아미노글리칸(GAG)은, 둘 중 하나는 산성 당이고 다른 것은 황산화될 수 있는 아미노 당(N-아세틸글루코스아민 또는 N-아세틸갈락토스아민)인, 반복되는 이당류 단위로 구성된 분지되지 않은, 음성으로 하전된 다당류 쇄이다. 이들의 유연하지 않은 특성 및 높은 음성 전하로 인하여, GAG는 다량의 공간을 점유하고, 양이온과 물을 끌어들여 세포외 매트릭스 속에서 다공성 겔을 형성하는 고도로 연장된 형태를 나타낸다. 따라서, 대부분의 동물에서 발견되는 GAG는, 조직이 수화되어 확장하는 것을 돕고 매트릭스가 압축력을 견디도록 할 수 있게 돕는다. 예를 들어, 무릎 관절을 라이닝(lining)하는 연골 매트릭스는 이러한 메카니즘에 의해 수백의 대기압을 지지할 수 있다.
콘드로이틴 설페이트는 연골 강도 및 탄성의 유지에 중요하며 관절 통증을 감소시키고 건강한 연골과 관절 기능을 촉진시키기 위한 영양 보조제로서 시판된다. 임상 연구는 골관절염(참조: 예를 들면, Kahan et al ., Arthritis and Rheumatism 2009;60:524-533; Michel et al ., Arthritis and Rheumatism 2005;52:779-786 및 Uebelhardt et al ., Osteoarthritis and Cartilage 2004;12:269-276), 사이질 방광염(참조: 예를 들면, Nickel et . al., BJU Int . 2009;103:56-60 and Cervigni et al ., Int. Urogynecol. J. Pelvic Floor Dysfunct. 2008;19:943-947), 및 윤활막염[참조: 예를 들면, Hochberg and Clegg, Osteoarthritis and Cartilage 2008;16(Suppl. 3):S22-S24 and Moller, Osteoarthritis and Cartilage 2009;17(Suppl. 1):S32-S33]의 치료를 위한 콘드로이틴 설페이트의 용도를 지지한다. 이들 문헌들은, 이들의 전문이 본원에 참조로 포함된다.
콘드로이틴 설페이트는 현재 단백질로부터 다당류를 분해하여 다양한 품질의 다당류 생성물을 생산하기 위한 화학적 및 효소적 처리를 사용하여, 소, 돼지, 상어 및 가금류를 포함하는 동물의 연골로부터 추출함으로써 생산된다(참조: Barnhill et al ., J. Am. Pharm. Assoc . 2006;46:14-24, Volpi, J. Pharm . Pharmacol . 2009;61:1271-1280).
콘드로이틴은 D-글루쿠론산(GlcUA) 및 N-아세틸-D-갈락토스아민(GalNAc)을 함유한다. 이는 이당류 반복 단위 β3GalNAc-β4GlcUA로 구성된다. 전형적으로, GalNAc 잔기는 4 및 6번 위치에서 다양하게 황산화된다. 콘드로이틴 설페이트는 천연적으로 사람 및 다른 동물에서 관절과 같은, 연골 조직의 구조 성분인 프로테오글리칸의 성분으로서 발생한다. 프로테오글리칸은 코어 단백질 및, 도 1에 나타낸 바와 같이 올리고사카라이드 링커를 통해 단백질에 공유결합으로 부착된, 콘드로이틴 설페이트와 같은 다당류 성분으로 구성된다. 코어 단백질은 다수의 다당류 쇄로 장식된다. 프로테오글리칸은 세포 막내에서 세포외 공간에 존재하는 단백질의 다당류-함유 부위를 사용하여 고정(anchor)될 수 있거나 세포외 매트릭스내에 분비되어 국재화할 수 있다(참조: Prydz and Dalen, J. Cell Sci. 2000;113:193-205).
콘드로이틴 골격을 합성하는데 관여하는 글리코실트랜스퍼라제 효소(콘드로이틴 신타제)는 수용하는 기질에 UDP-GalNAc 및 UDP-GlcUA 공여체로부터의 GalNAc 및 GlcUA의 교번되는 단당류 단위를 가함으로써 이를 수행한다. 이들 효소는 사람에서 확인되어 있으며(참조: Kitagawa et al., J. Biol. Chem. 2001;276:43894-43900; Yada et al., J. Biol. Chem. 2003;278:39711-39725), 사람 콘드로이틴 신타제의 상동체는 말, 소, 설치류, 개, 닭, 제브라 피쉬(zebra fish), 선충, 및 곤충을 포함하는 각종의 다른 동물에서 확인되어 왔다(참조: www.ncbi.nlm.nih.gov/homologene/8950).
일부 박테리아는 또한 이들의 캡슐 성분으로서 콘드로이틴 또는 콘드로이틴-유사 다당류 중합체를 생산한다. 척추동물에서 발견된 콘드로이틴 설페이트와는 달리, 미생물 콘드로이틴은 프로테오글리칸으로서 존재하지 않으며, 오히려 박테리아 세포 표면에 지질-결합된 다당류로서 및 배양 배지 속에서 유리된(즉, 세포-연합되지 않은) 다당류로서 존재한다(참조: Whitfield, Annu. Rev. Biochem. 2006;75:39-68; DeAngelis, Glycobiol. 2002;12:9R-16R).
2개의 박테리아, 에스케리키아 콜라이(Escherichia coli) K4(참조: Rodriguez et al., Eur. J. Biochem. 1988;177:117-124) 및 파스퇴렐라 물토시다(Pasteurella multocida) 혈청형 F(참조: Rimler, Vet. Rec. 1994;134:191-192)은 화학적으로 변형되어 콘드로이틴 설페이트를 잠재적으로 생산할 수 있는 황산화되지 않은, 콘드로이틴-유사, 캡슐 다당류(capsular polysaccharide)를 생산하는 것으로 보고되었다. 에스케리키아 콜라이 K4는 로드리게즈(Rodriguez) 등에 의해 캡슐 중합체 성분으로서 프럭토즈 측쇄(K4 항원)를 지닌 황산화되지 않은 콘드로이틴 골격을 생산하는 것으로 밝혀졌다. 니노미야(Ninomiya) 등(참조: J. Biol. Chem. 2002;277:21567-21575)은 에스케리키아 콜라이 K4내에서 콘드로이틴-유사 캡슐 다당류의 생합성에 필요한 주요 유전자를 확인하고 서열분석하였다. 이들 서열은 수탁 번호 AB079602로 GenBankTM에 기탁되었다. 니노미야 등에 의해 기재된 서열은 에스케리키아 콜라이 K4의 "2 군(group 2)" 캡슐 유전자 클러스터의 소위 "영역 2" 부위를 포함한다. 에스케리키아 콜라이내 캡슐 유전자 클러스터의 구성의 상세한 설명은 휘트필드(Whitfield)(참조: Annu. Rev. Biochem. 2006;75:39-68)에 의해 제공된다. 에스케리키아 콜라이 2 군 캡슐 유전자 클러스터의 영역 2 유전자는 캡슐 다당류의 구조를 결정하는 단백질을 코딩(encoding)한다. AB079602 서열은 에스케리키아 콜라이 K4 콘드로이틴 폴리머라제를 인코딩하는 kfoC로 명명된 서열을 포함한다. 에스케리키아 콜라이 K4 콘드로이틴 폴리머라제는 GlcUA 및 GalNAc를 교번적으로 콘드로이틴 당 쇄 및 관련된 올리고사카라이드의 비-환원 말단에 이전시켜, K4 항원 다당류의 콘드로이틴 골격을 생산하는 이기능성 글리코실트랜스퍼라제이다. 에스케리키아 콜라이 K4에 의해 생산된 콘드로이틴-유사 캡슐 다당류는 콘드로이틴의 GlcUA 잔기에 연결된(β1,3), 프럭토즈를 함유한다. 파스퇴렐라 물토시다 F형은 또한 황산화되지 않은 콘드로이틴 캡슐 성분을 생산하며 당해 유기체내에서 콘드로이틴 중합에 관여하는 글리코실트랜스퍼라제는 또한 문헌(참조: DeAngelis & Padgett-McCue, J. Biol. Chem. 2000;275:24124-29)에 보고된 바와 같이 클로닝되어 있다. K4 콘드로이틴 폴리머라제와 유사하게, 파스퇴렐라 콘드로이틴 신타제(pmCS, Genbank 수탁 번호 AAF97500)는 적절한 수용체 기질과 함께 제공되는 경우, UDP-GlcUA 및 UDP-GalNAc로부터 콘드로이틴 중합체를 합성할 수 있는 단일 폴리펩타이드 효소이다.
동물 조직으로부터의 정제를 포함하는 콘드로이틴 설페이트 생산의 전통적인 방법은 노동 및 비용 집약적일 수 있다. 또한, 동물 조직으로부터 콘드로이틴 설페이트의 생산은, 감염성 제제가 콘드로이틴 설페이트 생성물내에 존재할 가능성과 필수적으로 관련되어 있다. 이러한 잠재적인 감염성 제제의 경향성을 최소화하기 위해 동물 조직으로부터 생산 동안 주의를 기울여야만 한다. 이러한 단점들은 콘드로이틴의 생산을 위해 재조합 DNA 기술을 이용하는 대체 시도를 사용함으로써 해결될 수 있다. 최근에, 콘드로이틴의 미생물 생산은 데안젤리스(DeAngelis)(미국 특허출원 공개 제20030109693호) 및 시미니(Cimini) 등[참조: Appl. Microbiol. Biotechnol. 2010;85(6):1779-87 (Epub Oct. 1, 2009)]에 의해 제안되어 있다. 그러나, 콘드로이틴{파스퇴렐라 물토시다} 또는 콘드로이틴-유사(에스케리키아 콜라이 K4) 다당류를 생산하는 공지된 미생물은 각종 포유동물에 대한 공지된 병원균이므로 대규모 발효에 적합하지 않다. 이들은 또한 다당류의 비교적 낮은 생산자이다.
특히, 파스퇴렐라 물토시다는 이의 저 수율, 고가의 배지의 요구, 및 특수하고 고가의 시설을 요구하는 생물학적 위험 수준 2(Biohazard Level 2: BL2) 상태로 인하여 콘드로이틴의 상업적인 생산에 적합하지 않은 것으로 고려된다. 미생물로부터의 고 수율은 콘드로이틴의 상업적으로 수익성이 있는 생산에 필수적일 수 있다. 데안젤리스(DeAngelis)(미국 특허출원 공개 제20030109693호)는 식품 등급 락토코쿠스(Lactococcus) 또는 바실러스(Bacillus)와 같은 숙주 세포내에서 pmCS를 발현하여 재조합 콘드로이틴을 합성할 가능성을 언급하고 있다. 그러나, 바실러스는 그람 양성 박테리아이며, 따라서 에스케리키아 콜라이 및 파스퇴렐라 물토시다와 같은 그람 음성 유기체보다 매우 상이한 막/세포벽 구조를 갖는다. 따라서, 중합체의 효과적인 분비는 바실러스에서 문제가 될 것으로 예측될 수 있다.
에스케리키아 콜라이 K4는 또한 사람 병원체인 것으로 공지되어 있으므로 콘드로이틴의 생산에 적합하지 않다. 또한, 이는 콘드로이틴 그 자체를 생산하지 않으나, 위에 주목한 바와 같이 콘드로이틴의 프럭토실화된(fructosylated) 형태를 대신 생산한다. 이러한 다당류의 집중적인 화학적 또는 효소적 변형이 콘드로이틴을 생산하기 위해 필요하다. 이러한 변형은 공정의 전체 비용을 증가시킨다. 또한, 이는, 이러한 변형이 완료되어 일관된 생성물을 생성하는 것을 측정하기 위한 추가의 과정 및 품질 조절 측정의 도입을 필요로 한다.
따라서, 콘드로이틴을 생산하기 위한 효율적이고, 안전하며 비용 효과적인 공정이 요구되고 있다. 본 발명은 콘드로이틴 설페이트를 생산하기 위해 후속적으로 황산화될 수 있는 콘드로이틴의 재조합 미생물 생산을 위한, 작제물(construct) 및 숙주 세포 및 방법을 제공함으로써 이러한 요구를 해결한다.
발명의 간단한 요약
본 발명은 kpsF, kpsE, kpsD, kpsU, kpsC, kpsS, kfoA, kfoC, 및 kfoF를 포함하는 유전자 클러스터를 포함하는 작제물에 관한 것이며, 여기서 유전자 클러스터는 kfoD, orf3(kfoI), kfoE, 또는 orf1(kfoH) 중 하나 이상의 기능성 유전자를 함유하지 않으며, 여기서 작제물은 비-병원성 박테리아 숙주 세포에서 콘드로이틴을 생산하는데 적합하다. 일부 양태에서, 콘드로이틴은 프럭토실화되지 않는다. 일부 양태에서, 콘드로이틴은 숙주 세포로부터 분비된다. 일부 양태에서, 유전자 클러스터는 또한 kfoG, kfoB, 또는 kfoG 및  kfoB 둘다를 추가로 포함한다. 일부 양태에서, 유전자 클러스터는 kfoM 및  kfoT를 추가로 포함한다. 일부 양태에서, 작제물은 pDD66, pDD67, pCX040, pCX041, pCX042, pCX043, pCX096, 또는 pBR1052를 포함한다.
본 발명은 kfoA, kfoC, 및 kfoF를 포함하는 유전자 클러스터를 포함하는 작제물에 관한 것이며, 여기서 유전자 클러스터는 kpsM, kpsT, kpsE, kpsD, kpsC, 또는 kpsS 중 하나 이상의 기능성 유전자를 함유하지 않으며, 여기서 작제물은 비-병원성 박테리아 숙주 세포내에서 콘드로이틴을 생산하기에 적합하다. 일부 양태에서, 콘드로이틴은 숙주 세포로부터 분비되지 않는다. 일부 양태에서, 작제물은 또한 kfoD, orf3, kfoE, 또는 orf1 중 하나 이상의 기능성 유전자를 함유하지 않는다. 일부 양태에서, 콘드로이틴은 비-프럭토실화된다. 일부 양태에서, 유전자 클러스터는 또한 kfoG, kfoB, 또는 kfoG 및 kfoB 둘다를 추가로 포함한다. 일부 양태에서, 작제물은 kfoA, kfoB, kfoC, kfoF, 및 kfoG를 포함한다. 일부 양태에서, 작제물은 pCX039, pCX044, 또는 pCX092를 포함한다. 일부 양태에서, 작제물은 pCX045 또는 pCX048을 포함한다.
본 발명은 kfoA, kfoB, kfoC, kfoF, kfoG, 및 이의 조합으로 이루어진 군으로부터 선택된 유전자를 포함하는 작제물에 관한 것이며, 여기서 작제물은 kpsM, kpsT, kpsE, kpsD, kpsC, 또는 kpsS 중 하나 이상의 기능성 유전자를 함유하지 않으며, 작제물은 비-병원성 박테리아 숙주 세포내에서 콘드로이틴을 생산하거나 콘드로이틴의 양을 증가시키기에 적합하다. 일부 양태에서, 콘드로이틴은 숙주 세포로부터 분비되지 않는다. 일부 양태에서, 작제물은 또한 kfoD, orf3, kfoE, 또는 orf1 중 하나 이상의 기능성 유전자를 함유하지 않는다. 일부 양태에서, 콘드로이틴은 프럭토실화되어 있지 않다. 일부 양태에서, 작제물은 kfoA, kfoB, kfoC, kfoF, 및 kfoG를 포함한다. 일부 양태에서, 작제물은 pCX075, pCX081, pCX082, pCX092, pCX101, pBR1102, pBR1100 또는 pBR1101을 포함한다. 일부 양태에서, 작제물은 pCX045 또는 pCX048을 포함한다.
일부 양태에서, 본 발명의 작제물 중 어느 것에서 하나 이상의 유전자는 박테리아 숙주 세포내에서 최적의 코돈 사용빈도(codon usage)를 위해 변형된다.
일부 양태에서, 본 발명의 작제물 중 임의의 것은 프로모터를 추가로 포함한다. 일부 양태에서, 프로모터는 Pm, Plac, Ptrp, Ptac, λpL, PT7, PphoA, ParaC, PxapA, Pcad, 및 PrecA로 이루어진 군으로부터 선택된다. 일부 양태에서, 프로모터는 Pm이다.
일부 양태에서, 본 발명의 작제물 중 임의의 것은 제2 프로모터를 추가로 포함한다. 일부 양태에서, 제2 프로모터는 Pm, Plac, Ptrp, Ptac, λpL, PT7, PphoA, ParaC, PxapA, Pcad, 및 PrecA로 이루어진 군으로부터 선택된다. 일부 양태에서, 제2 프로모터는 Pm이다.  일부 양태에서, 제2 프로모터는 작제물내 하나 이상의 유전자에 작동적으로 연결된다. 일부 양태에서, 제2 프로모터는 kpsFEDUCS에 작동적으로 연결된다.
일부 양태에서, 작제물은 xylS 조절 유전자를 추가로 포함한다.
일부 양태에서, 본 발명의 작제물 중 임의의 것은 항생제 내성 유전자를 추가로 포함한다. 일부 양태에서, 항생제 내성 유전자는 클로람페니콜(CamR), 카나마이신(KanR), 암피실린(AmpR), 테트라사이클린(TetR), 블레오마이신(BleR), 스펙티노마이신(SpcR), 설폰아미드(SuR), 스트렙토마이신(StrR), 카르베니실린(CbR), 및 에리트로마이신(EryR)으로 이루어진 군으로부터 선택된다.
일부 양태에서, 본 발명의 작제물 중 임의의 것은 K4 유전자 클러스터를 포함한다.
일부 양태에서, 본 발명의 작제물 중 임의의 것은 비-병원성 박테리아 숙주 세포내에서 콘드로이틴을 생산하기에 적합하며, 여기서, 박테리아 숙주 세포는 에스케리키아(Escherichia), 슈도모나스(Pseudomonas), 잔토모나스(Xanthomonas), 메틸로모나스(Mehtylomonas), 악시네토박터(Acinetobacter) 및 스핑고모나스(Sphingomonas)로 이루어진 군으로부터 선택된 비-병원성 유기체이거나 이로부터 유래된다.
본 발명은 본 발명의 작제물 중 어느 것을 포함하는 비-병원성 박테리아 숙주 세포에 관한 것이다. 일부 양태에서, 박테리아 숙주 세포는 에스케리키아, 슈도모나스, 잔토모나스, 메틸로모나스, 악시네토박터, 및 스핑고모나스로 이루어진 군으로부터 선택된 비-병원성 유기체이거나 이로부터 유래한다. 일부 양태에서, 박테리아 숙주 세포는 MSC279, MSC280, MSC315, MSC316, MSC317, MSC319, MSC322, MSC323, MSC324, MSC325, MSC326, MSC328, MSC346, MSC347, MSC348, MSC350, MSC356, MSC359, MSC392, MSC402, MSC403, MSC404, MSC405, MSC410, MSC411, MSC436, MSC437, MSC438, MSC439, MSC458, MSC459, MSC460, MSC461, MSC466, MSC467, MSC469, MSC480, MSC494, MSC498, MSC499, MSC500, MSC510, MSC511, MSC522, MSC526, MSC537, MSC551, MSC561, MSC562, MSC563, MSC564, MSC566, MSC567, MSC619, MSC625, MSC627, MSC640, MSC641, MSC643, MSC646, MSC650, MSC656, MSC657, MSC658, MSC659, MSC660, MSC669, MSC670, MSC671, MSC672, MSC673, MSC674, MSC675, MSC676, MSC677, MSC678, MSC679, MSC680, MSC681, MSC682, MSC683, MSC684, MSC687, MSC688, MSC689, MSC690, MSC691, MSC692, MSC693, MSC694, MSC700, MSC701, MSC702, MSC722, MSC723 및 MSC724로 이루어진 군으로부터 선택된 박테리아 균주이다.
본 발명은 본 발명의 작제물 중 어느 것을 비-병원성 박테리아 숙주 세포로 이전시키고, 당해 박테리아 숙주 세포를 콘드로이틴이 박테리아 숙주 세포에 의해 생산되는 발효 조건하에서 배양함을 포함하는, 콘드로이틴을 생산하는 방법에 관한 것이다.
본 발명은 본 발명의 작제물 중 어느 것을 포함하는 비-병원성 박테리아 숙주 세포를 콘드로이틴의 생산에 충분한 발효 조건하에서 배양함을 포함하는, 콘드로이틴을 생산하는 방법에 관한 것이다.
본 발명은 본 발명의 작제물 중 어느 것을 비-병원성 박테리아 숙주 세포로 전달함을 포함하는, 비-병원성 박테리아 숙주 세포를 생산하는 방법에 관한 것이다.
일부 양태에서, 본 발명의 작제물 중 어느 것의 유전자 또는 유전자 클러스터는 본 발명의 방법 중 어느 것에서 박테리아 숙주 세포의 염색체 내로 통합된다.
일부 양태에서, 본 발명의 작제물 중 어느 것의 유전자 또는 유전자 클러스터의 2개 이상의 카피가 본 발명의 방법 중 어느 것에서 박테리아 숙주 세포의 염색체 내로 통합된다. 일부 양태에서, 유전자 클러스터 또는 유전자의 2개 이상의 카피는 동일한 유전자 또는 유전자 클러스터 중 2개 이상의 카피를 포함한다.
일부 양태에서, 본 발명의 방법 중 어느 것에 의해 생산된 콘드로이틴은 프럭토실화되지 않는다.
일부 양태에서, 본 발명의 방법은 콘드로이틴을 황산화시키는 것을 추가로 포함한다.
본 발명은 본 발명의 방법 중 어느 것에 의해 콘드로이틴을 생산하고; 콘드로이틴을 황산화시키는 것을 포함하는, 콘드로이틴 설페이트를 생산하는 방법에 관한 것이다.
일부 양태에서, 본 발명의 방법 중 어느 것에서 콘드로이틴을 황산화하는 공정은 설퍼트라이옥사이드-트라이에틸아민 복합체 또는 클로로설폰산을 포름아미드 내의 콘드로이틴과 혼합함을 포함한다.
일부 양태에서, 본 발명의 방법 중 어느 것에서 박테리아 숙주 세포는 에스케리키아, 슈도모나스, 잔토모나스, 메틸로모나스, 악시네토박터, 및 스핑고모나스로 이루어진 군으로부터 선택된 비-병원성 유기체이거나 이로부터 유래된다.
일부 양태에서, 본 발명의 방법 중 어느 것에서 박테리아 숙주 세포는 그람-음성 유기체이거나 이로부터 유래된다.
일부 양태에서, 본 발명의 방법 중 어느 것에서 박테리아 숙주 세포는 잔토모나스 캄페스트리스(Xanthomonas campestris)이다.  일부 양태에서, 잔토모나스 캄페스트리스는 MSC255, MSC256, MSC257, MSC225, 및 MSC226으로 이루어진 군으로부터 선택된 박테리아 균주이다.
일부 양태에서, 본 발명의 방법 중 어느 것에서 박테리아 숙주 세포는 비-병원성 에스케리키아 콜라이이다. 일부 양태에서, 비-병원성 에스케리키아 콜라이는 에스케리키아 콜라이 K-12 및 에스케리키아 콜라이 B로 이루어진 군으로부터 선택된다. 일부 양태에서, 에스케리키아 콜라이 K-12는 MSC188 및 MSC175로 이루어진 군으로부터 선택된 박테리아 균주이다. 일부 양태에서, 에스케리키아 콜라이 B는 박테리아 균주 MSC364이다.
일부 양태에서, 본 발명의 방법 중 어느 것에서 박테리아 숙주 세포의 내인성 유전자는 상동성 재조합에 의해 결실되거나 불활성화된다.
일부 양태에서, 본 발명의 방법 중 어느 것에서 박테리아 숙주 세포는 숙주 세포에 대해 내인성인 세포외 다당류를 발현하지 않는다.
일부 양태에서, 본 발명의 방법 중 어느 것에서 박테리아 숙주 세포는 실험실 클로닝 균주로부터 접합 전달(conjugal transfer)에 적합하다.
일부 양태에서, 본 발명의 방법은 박테리아 숙주 세포로부터 콘드로이틴을 회수하는 것을 추가로 포함한다.
일부 양태에서, 본 발명의 방법은 세포외 배양 배지로부터 콘드로이틴을 회수함을 추가로 포함한다.
일부 양태에서, 1 g/L 내지 50 g/L의 콘드로이틴이 24 내지 72시간내에 본 발명의 방법 중 어느 것에서 박테리아 숙주 세포로부터 분비된다. 일부 양태에서, 5 g/L 내지 50 g/L의 콘드로이틴이 24 내지 72시간내에 박테리아 숙주 세포로부터 분비된다. 일부 양태에서, 15 g/L 내지 50 g/L의 콘드로이틴이 24 내지 72시간내에 박테리아 숙주 세포로부터 분비된다.
일부 양태에서, 본 발명의 방법 중 임의의 것은 콘드로이틴을 정제함을 추가로 포함한다.
일부 양태에서, 본 발명의 방법 중 어느 것에서 박테리아 숙주 세포는 25℃ 내지 37℃에서 배양된다.
일부 양태에서, 본 발명의 방법 중 어느 것에서 박테리아 숙주 세포는 글리세린을 포함하는 배지 속에서 배양된다.
본 발명은 본 발명의 방법 중 어느 것에 의해 생산된 콘드로이틴에 관한 것이다.
본 발명은 본 발명의 방법 중 어느 것에 의해 생산된 콘드로이틴을 포함하는 조성물에 관한 것이다.
본 발명은 KpsF의 서열 번호 92, KpsE의 서열 번호 93, KpsD의 서열 번호 94, KpsU의 서열 번호 95, KpsC의 서열 번호 96, KpsS의 서열 번호 97, KpsT의 서열 번호 91, KfoA의 서열 번호 83, KfoB의 서열 번호 84, KfoC의 서열 번호 85, KfoI(Orf3)의 서열 번호 86, KfoE의 서열 번호 87, KfoH(Orf1)의 서열 번호 88, KfoF의 서열 번호 89, 및 KfoG의 서열 번호 90의 군으로부터 선택된 아미노산 서열에 결합하는 항체 또는 항체 단편에 관한 것이다.
본 발명은 콘드로이틴의 생산을 위한 작제물 및 재조합 세포, 콘드로이틴을 생산하는 방법, 이러한 방법으로 생산된 콘드로이틴, 및 콘드로이틴의 용도에 관한 것이다. 본원에 기술된 대로, 본 발명은 콘드로이틴 및 콘드로이틴 설페이트의 생산을 허용하는 신규 기술을 기초로 한다. 본 발명은 보다 저렴한 비용으로 콘드로이틴 및 콘드로이틴 설페이트의 안전하고, 일관되며 신뢰할만한 공급을 제공하면서, 우수한 생성물 품질을 제공함으로써 당해 분야의 중요한 요구를 충족한다. 당해 공정은 또한 채식주의자 및 유대교인 제품을 제공할 수 있다. 재조합적으로 생산된 콘드로이틴은 공지된 방법을 사용하여 황산화함으로써 콘드로이틴 설페이트를 형성시킬 수 있다. 따라서, 본 발명은 재조합적으로 생산된 콘드로이틴의 황산화 방법, 재조합적으로 생산된 콘드로이틴 설페이트 생성물, 및 재조합적으로 생산된 콘드로이틴 설페이트 생성물의 용도를 포함한다.
도 1a는 콘드로이틴 및 콘드로이틴 설페이트의 구조를 나타낸다. 도 1b는 콘드로이틴 설페이트와 프로테오글리칸의 코어 단백질 사이의 연결을 나타낸다.
도 2는 본 발명 이전에 제안된 바와 같은, 에스케리키아 콜라이 K4 캡슐의 합성에 관여하는 유전자 클러스터의 구성을 나타낸다. 당해 도에 나타낸 영역 2의 구성은 문헌(참조: Ninomiya et al., J. Biol. Chem. 2002;277:21567-21575)에 기술된 바와 같다. 에스케리키아 콜라이 K4 캡슐 유전자 클러스터의 영역 1 및 3은 본 발명 이전에 서열분석되지 않았으므로, 이들의 구조는 본 발명 이전에 공지되어 있지 않았다.
도 3은 문헌(참조: Ninomiya et al., J. Biol. Chem. 2002;277:21567-21575)에 기술된 바와 같이 에스케리키아 콜라이 K4 캡슐 영역 2 서열(AB079602)의 본 발명의 발명자들에 의한 분석을 나타낸다. 도 3a는 추가의 추정된 코딩 서열 orf1, orf2 orf3의 존재를 나타내며, 에스케리키아 콜라이 K4로부터의 영역 2와 파스퇴렐라 물토시다 혈청형 B 및 E의 서열 정렬을 기초로 하여, 에스케리키아 콜라이 K4로부터의 유전자(도 3b에 나타낸 정렬 데이타), kfoD, orf3, kfoE, orf1이 파스퇴렐라 물토시다 M1404 혈청형 B 유전자 bcbDEFG 및 파스퇴렐라 물토시다 P1234 혈청형 E 유전자 ecbDEFG 중에서 상동체를 가짐을 추가로 나타낸다. 상동체는 쌍두 화살표로 연결되어 있다.
도 4는 본 발명자들에 의해 측정된 것으로서 에스케리키아 콜라이 K4 균주 ATCC 23502의 영역 2 유전자의 서열에 관한 것이다. 도 4a는 니노미야(Ninomiya) 등에 의해 앞서 보고된 서열과 비교하여 본 발명자들에 의해 측정된 서열들 사이의 차이를 나열한다. 도 4b는 본 발명자들에 의해 측정된 것으로서, 영역 2 유전자의 서열(도 4b에서 서열 번호 30; 서열 번호 32; 서열 번호 26; 서열 번호 24; 및 서열 번호 20으로 나타냄)에 의해 인코딩된 예측된 아미노산 서열과 니노미야 등에 의해 보고된 서열(도 4b에서 K4 Kfo putORF2 및 K4 KfoG_BAC00518; K4 Kfo putORF_1; K4 KfoE_BAC00520; K4 KfoD_BAC00521; K4 KfoB_BAC00524로 나타냄)에 의해 인코딩된 것들의 비교를 나타낸다.
도 5는 에스케리키아 콜라이 K4 균주 U1-41로부터의 K4 캡슐 유전자 클러스터의 구성을 나타낸다. 유전자 클러스터는 단백질을 인코딩하는 것으로 예측된 17개의 개방 판독 프레임(open reading frame)(IS2 배제)을 함유한다.
도 6은 3개의 분절, kpsFEDUCS("FS 분절"), kpsMTkfoABCFG("MG 분절") 및 kfoDIEH("DH 분절")로 작제된 합성 유전자의 구조를 도표로 나타낸다. 묘사한 바와 같이, 제한 부위는 전략적 위치에서 혼입되어 합성 단편이 하나 이상의 오페론내로 조립되도록하고 개개 유전자의 조작을 촉진하였다.
도 7a는 특정 유전자 또는 유전자 클러스터의 결실에 의해 유도체 박테리아 균주를 작제하기 위한 팝 인(pop in), 팝-아웃(pop-out) 전략을 나타낸다. 도 7b는 당해 전략에서 잔토모나스 캄페스트리스내에서 당해 전략을 사용하기 위해 사용된 자살 벡터 pCX027(서열 번호 141)의 지도를 나타낸다.
도 8a 내지 8u는 본 발명의 플라스미드 및 DNA 단편 pBHR1, pDD39, pDD42, pDD47, pREZ6, pDD49, pJ201:11352, pDD50, pDD54, pJ241:10662, pJ241:10664, pJ241:10663, pDD37, pDD38, pDD51, pDD52, pDD57, pDD58, pDD61, pDD62, pDD63, pDD59, pDD67, pDD60, pDD66, pBR1052, pMAK-CL, pDD74, pDD76, pDD73, pDD77, pDD79, pDD80, pCX045, pCS048, pCX039, pCX044, pCX040, pCX042, pCX041, pCX043, MSC467, MSC561, 및 pBR1087에 대한 DNA 지도를 나타낸다.
도 9는 에스케리키아 콜라이 K4 2 군 캡슐 유전자 클러스터에 의해 인코딩된 단백질에 대해 지시된 항혈청을 사용하여 수행된 웨스턴 블롯으로부터의 결과의 예를 나타낸다.
도 10a 내지 10d는 잔토모나스 캄페스트리스내로 클로닝된 에스케리키아 콜라이 K4 콘드로이틴 생합성 유전자를 도입시키기 위해 사용된 플라스미드 작제물의 DNA 지도를 나타낸다.
도 11a는 억제성 ELISA에서 측정된 K4 프럭토실화된 콘드로이틴 캡슐 다당류("K4P")에 대한 대표적인 교정 곡선을 나타낸다. 도 11b는 콘드로이틴을 위한 콘드로이티나제/HPLC에서 측정된, 이당류, 2-아세트아미도-2-데옥시-3-O-(β-D-글루코-4-에네피라노실우론산)-D-갈락토즈("△di-0S")의 대표적인 표준 곡선을 나타낸다.
도 12는 재조합 콘드로이틴의 콘드로이티나제 분해능을 나타낸다.
도 13은 K4 프럭토실화된 콘드로이틴 캡슐 다당류(K4P) 및 탈푸럭토실화된(defructosylated) K4P(DFK4P) 둘다의 콘드로이티나제 분해능을 나타낸다.
도 14a 내지 14x는 본 발명의 플라스미드 작제물 pCX096, pCX097, pCX100, pCX101, pCS102, pCX075, pCX082, pCX081, pCX092, pBR1077, pBR1082, pCX050, pCX070, pCX093, pCX094, pCX095, pMAK705p1, pBR1103, pBR1093lacZ, pBR100-lac, pBR1094mt1, pBR1101-mt1, pBR1095fru, 및 pBR1102-fru에 대한 DNA 지도를 나타낸다.
도 15는 콘드로이틴-생산 에스케리키아 콜라이 균주의 가계수 및 균주 유도체화에 사용된 단계들을 나타낸다.
하기 상세히 기술된 바와 같이, 본 발명자들은 에스케리키아 콜라이 K4 프럭토실화된 콘드로이틴 캡슐 다당류(K4P)의 생합성에 관여된 단백질을 인코딩하는 에스케리키아 콜라이 K4 유전자를 서열분석하고, 천연 서열을 기초로 하여, DNA 분절을 합성하고 조립하였으며, 이들 유전자를 대규모 발효에 적합한 대체 숙주 세포내로 이전시켜, 이들 숙주 세포내에서 재조합 프럭토실화된 콘드로이틴 캡슐 다당류의 생산을 입증하였다. 대안의 숙주 세포는 비-프럭토실화된 콘드로이틴을 생산하여야 하는 것이 바람직하므로, 에스케리키아 콜라이 K4에 의한 콘드로이틴의 프럭토실화에 관여하는 유전자를 확인하고 대체 숙주로 전달된 에스케리키아 콜라이 K4 콘드로이틴 생합성 유전자 세트로부터 결실시켰다. 그 결과, 당해 유전자 세트를 함유하는 대체 숙주는 비-프럭토실화된 콘드로이틴을 생산하였다. 대체 숙주에 의해 생산된 이러한 재조합 콘드로이틴(rCH)은 황산화되어 콘드로이틴 설페이트 생성물을 생산할 수 있다.
본원에 사용된 것으로서, 용어 "K4P"는 야생형 에스케리키아 콜라이 K4 균주에 의해 합성된 천연의 또는 천연적으로 존재하는 프럭토실화된 콘드로이틴 캡슐 다당류를 말한다. 용어 "콘드로이틴"은 콘드로이틴 골격을 말한다. 콘드로이틴은 프럭토실화되거나 프럭토실화되지 않을 수 있다(또는 비-프럭토실화 될 수 있다). 본원에 사용된 것으로서, 용어 "콘드로이틴"은 구체적으로 나타내지 않는 한 프럭토실화된 형태 및 프럭토실화되지 않은 형태 둘다를 포함한다. 또한, 본원에 사용된 것으로서, 용어 콘드로이틴은 황산화되지 않은 콘드로이틴을 말한다. 본 발명의 방법에 의해 생산된 콘드로이틴은 하기 상세히 설명한 바와 같이 효소적 수단 또는 화학적 수단에 의해 황산화될 수 있으며, 여기서 이는 콘드로이틴 설페이트로 언급된다.
하나의 국면에서, 본 발명은 에스케리키아 콜라이 K4 유전자 세트 또는 유전자 클러스터를 포함하는 DNA 작제물을 포함한다. 본원에 사용된 것으로서 용어 "K4 유전자 클러스터"는 콘드로이틴-유사 캡슐 다당류(K4P)의 생합성에 관여하는 에스케리키아 콜라이 K4로부터의 유전자 세트를 말한다. 용어 "K4 유전자 클러스터"는 콘드로이틴-유사 캡슐 다당류의 생합성에 관여한 에스케리키아 콜라이 K4로부터의 모든 유전자 또는 이들 유전자의 서브세트를 말할 수 있다.
실시예 1에 기술된 바와 같이, 에스케리키아 콜라이 K4는 K4P로서 언급된 콘드로이틴-유사 캡슐 다당류의 합성에 관여된 다수 유전자의 세트를 함유한다. 위에 나타낸 바와 같이, 당해 다당류는 프럭토즈 잔기의 첨가에 의해 변형된 콘드로이틴 골격으로 이루어진다. 도 2에 나타낸 바와 같이, 이들 유전자는 3개의 주요 영역[영역 1("R1"), 영역2("R2") 및 영역 3("R3")]으로 구성된다. 문헌[참조: Ninomiya et al. (2002)](GenBank 수탁 번호 AB079602)]에 기술된 영역 2의 서열을 기초로 하여, 영역 2는 캡슐 생합성과 관련된 7개의 유전자, kfoA, kfoB, kfoC, kfoD, kfoE, kfoF kfoG를 포함하는 것으로 예측되었다. 니노미야 등은 에스케리키아 콜라이 K4 캡슐 유전자 클러스터의 예측된 영역 1 및 영역 3 부분의 서열을 기재하지 않았다. 그러나, 다른 에스케리키아 콜라이 캡슐 유전자 클러스터의 공지된 구성을 기초로 하여, 영역 1은 6개의 유전자, kpsF, kpsE, kpsD, kpsU, kpsC, kpsS를 포함하는 것으로 예측될 수 있으며 영역 3은 2개의 유전자, kpsM 및 kpsT를 포함하는 것으로 예측될 수 있다. kpsM, kpsT, kpsD, kpsE, kpsC 및 kpsS 유전자는 세포 세포질로부터 세포 표면으로 캡슐 다당류의 전좌에 요구된 단백질을 인코딩하며, 여기서 성숙한 캡슐 다당류는 이러한 막의 지질 성분에의 공유 결합을 통해 외부 세포 막에 고정되는 것으로 여겨진다(참조: Whitfield, 2006). kpsF 및 kpsU 유전자는 CMP-Kdo의 생합성에서 단계들을 촉매하는 것으로 예측된 단백질을 인코딩한다. 에스케리키아 콜라이내에서 콘드로이틴 캡슐의 생합성시 CMP-Kdo의 역활은 제안되어 있지만(참조: Roberts, Annu. Rev. Microbiol. 1996;50:285-315) 실험적으로 입증되어 있지는 않다(참조: Whitfield, 2006). 따라서, 본 발명의 기재내용 이전에, 전체 K4 유전자 클러스터는 15개 유전자를 포함하는 것으로 고려되었다.
니노미야 등에 의해 보고된 서열(GenBank 수탁 번호 AB079602)을 확인하기 위해, 본 발명자들은 에스케리키아 콜라이 K4 균주 ATCC 23502로부터의 K4 캡슐 유전자 클러스터의 영역 2를 서열분석하였다. 본 발명자들에 의해 측정된 서열 및 AB079602 서열을 비교했을 때, 26번 위치에서 치환, 결실 및 삽입을 포함하는, 단일 염기 쌍 차이가 발견되었다. 실시예 1에 상세히 설명된 바와 같이, 이들 차이들 중 일부는 유전자 클러스터에 의해 코딩된 영역 2 단백질의 예측된 아미노산 서열에서 상당한 차이를 생성한다. 또한, 본 발명자들은 유전자를 분리하는 유전자간 서열로서 니노미야 등에 의해 확인된 영역을 시험하고, 앞서 확인되지 않았던 영역 2내 3개의 추가의 개방 판독 프레임 orf1(또한 본원에서 kfoH로 언급됨), orf2 및 orf3(또한 본원에서 kfoI으로 언급됨)을 확인하였다.
모든 3개 영역으로부터의 유전자를 포함하는 전체 K4 유전자 클러스터의 정확한 서열을 측정하기 위하여, 에스케리키아 콜라이 혈청형 K4 균주 U1-41을 Statens Serum Institut(덴마크 코펜하겐 소재)로부터 입수하였다. U1-41은 ATCC 23502 균주의 조상이며 배양물 속에 K4 캡슐 다당류를 생산하는 것으로 보고되어 있다. 이는 또한 에스케리키아 콜라이 혈청형구분(serotyping)을 위한 K4 참조 균주이며 문헌[참조: Rodriguez et al. (1988)]에 의해 K4P 구조적 측정에 사용된 다당류 제제를 생산하는데 사용되었다. 에스케리키아 콜라이 U1-41내 K4 캡슐 유전자 클러스터에 걸친(spanning) 총 약 23kb의 DNA를 서열분석하였다. 당해 서열(서열 번호 117)은 영역 1내 kpsF, kpsE, kpsD, kpsU, kpsC kpsS 유전자의 존재 및 영역 3내 kpsM kpsT 유전자의 존재를 확인하였다. U1-41의 영역 2 서열 및 ATCC 23502의 영역 2에 대해 본 발명자들에 의해 측정된 서열은 동일한 것으로 밝혀졌다.
실시예 1에 상세히 기재되어 있는 바와 같이, U1-41로부터의 유전자 클러스터는 콘드로이틴의 생합성에 관련된 단백질을 인코딩하는 것으로 예측되는 (IS2 서열 배제) 17개의 개방 판독 프레임(Nonomiya 등에 의해 앞서 기술된 바와 같은 15개 대신)을 함유하는 것으로 밝혀졌다. 이들 유전자의 정렬은 에스케리키아 콜라이 2 군 캡슐 유전자 클러스터에 대해 전형적이다. 보존된 유전자 kpsF, kpsE, kpsD, kpsU, kpsC kpsS을 포함하는 영역 1, 및 보존된 유전자 kpsM kpsT를 포함하는 영역 3은 영역 2의 9개의 개방 판독 프레임을 플랭킹(flanking)한다. 영역 1 및 영역 3 유전자는 에스케리키아 콜라이내 모든 2 군 캡슐의 합성 및 전좌에 요구되는 단백질을 포함한다. 영역 1은 또한 상기 나타낸 바와 같이, CMP-Kdo의 생합성에서 단계들을 촉매하는 것으로 예측된, 효소를 인코딩하는 2개의 유전자(kpsF 및 kpsU)를 포함한다. 영역 2내에 확인된 9개 유전자 중에서, 3개는 캡슐 생합성과 관련된 명확하게 정의된 활성을 지닌 단백질: kfoA(UDP-GlcNAc를 UDP-GalNAc 전구체로 전환하는 UDP-GlcNAc 에피머라제), kfoF(UDP-Glc를 UDP-GlcUA 전구체로 전환하는 UDP-Glc 데하이드로게나제) 및 kfoC(콘드로이틴 신타제, 즉, 전구체 UDP-GalNAc 또는 UDP-GlcUA 중 하나를 수용체 콘드로이틴 분자에 가할 수 있는 폴리머라제)를 인코딩한다.
K4 캡슐 유전자 클러스터의 영역 2내에 존재하는 다른 유전자, kfoB, kfoG, kfoD, kfoE, kfoH(orf1) kfoI(orf3)에 의해 인코딩된 단백질의 기능은 알려져 있지 않았다. kfoB 및 kfoG 유전자는 파스퇴렐라 물토시다 혈청형 A, F 및 D(참조: Townsend et al., J. Clin. Microbiol. 2001;39:924-929) 및 에스케리키아 콜라이 혈청형 K5(참조: Petit et al., Mol. Microbiol. 1995;4:611-620)와 같은 다른 글리코사미노글리칸(GAG) 캡슐을 생산하는 것으로 공지된 박테리아의 캡슐 클러스터내에 존재하는 유전자에 의해 인코딩된 것들과 상동성인 단백질을 인코딩한다. 이러한 상황 증거는, kfoB kfoG가 GAG-함유 K4 캡슐의 생합성에서 역활을 할 수 있음을 제안하였다. 실시예 7에서 상세히 설명한 바와 같이, 본 발명자들은, kfoB 및 kfoG 유전자가 에스케리키아 콜라이내 콘드로이틴의 생산에 필수적이지 않지만, kfoG 유전자는 콘드로이틴의 최적 생산에 필요함을 발견하였다.
본 발명 이전에, kfoD, kfoE, kfoH(또는 orf1) kfoI(또는 orf3)가 K4 캡슐의 생합성시 관여되는 것으로 시사한 증거는 없었다. 흥미롭게도, 4개의 연속된 K4 유전자, kfoD, kfoI(또는 orf3), kfoE, kfoH(또는 orf1)는 인접한 파스퇴렐라 물토시다 혈청형 B 유전자 bcbDEFG 및 파스퇴렐라 물토시다 혈청형 E 유전자 ecbDEFG 중에서 상동체를 가짐이 밝혀졌다. 그러나, 이들 2개의 파스퇴렐라 균주는 콘드로이틴 생산자인 것으로 알려져 있지 않으며, 에스케리키아 콜라이 K4내 이들 유전자의 역활은 본 발명 이전에 알려져 있지 않았다. 따라서, kfoD, kfoI(orf3), kfoE kfoH(orf1)는 콘드로이틴의 합성시 관여되지 않을 수 있는 것으로 여겨졌다. 실시예 6 및 7에 나타나 있는 바와 같이, 이들 유전자들 중 어느 것도 콘드로이틴의 생합성에 요구되지 않지만, 이들 유전자들 중 하나 이상은 K4 유전자 세트에 의해 생산된 콘드로이틴의 프럭토실화에 필수적이다.
기초로서 U1-41 K4 캡슐 유전자 클러스터의 서열을 사용하여, 본 발명자들은 에스케리키아 콜라이, 잔토모나스 캄페스트리스, 스핑고모나스 엘로데아(Sphingomonas elodea) 및 바실러스 서브틸리스(Bacillus subtilis)와 같은 숙주내에서 발현을 위해 코돈-최적화되는 합성 유전자를 추가로 설계하였다. 이들 코돈-최적화된 유전자의 설계 및 합성은 실시예 2에 상세히 설명되어 있다. 실시예 4는 이종 박테리아내에서 이들 유전자의 발현을 위한 플라스미드 벡터의 작제를 기술한다.
본 발명의 코돈-최적화된 유전자의 완전한 뉴클레오타이드 서열, 및 이들에 의해 인코딩된 아미노산 서열은 다음과 같다. 본 발명에서 사용된 kpsF에 대한 완전한 뉴클레오타이드 서열은 본원에서 서열 번호 1로 나타나 있다. kpsF는 서열 번호 2로서 본원에 나타낸, 327개 아미노산 서열을 인코딩하는 981개 뉴클레오타이드 서열(정지 코돈을 포함하지 않음)이다. kpsE에 대한 완전한 뉴클레오타이드 서열은 본원에서 서열 번호 3으로 나타낸다. kpsE는 본원에서 서열 번호 4로 나타낸, 382개 아미노산 서열을 인코딩하는 1146개 뉴클레오타이드 서열(정지 코돈을 포함하지 않음)이다. kpsD에 대한 완전한 뉴클레오타이드 서열은 본원에 서열 번호 5로서 나타나 있다. kpsD는 본원에서 서열 번호 6으로 나타낸, 558개 아미노산 서열을 코딩하는 1674개 뉴클레오타이드 서열(정지 코돈을 포함하지 않음)이다. kpsU에 대한 완전한 뉴클레오타이드 서열은 본원에서 서열 번호 7로 나타낸다. kpsU는 본원에서 서열 번호 8로 나타낸, 246개 아미노산 서열을 인코딩하는 738개 뉴클레오타이드 서열(정지 코돈을 포함하지 않음)이다. kpsC에 대한 완전한 뉴클레오타이드 서열은 본원에서 서열 번호 9로 나타나 있다. kpsC는 본원에서 서열 번호 10으로 나타낸, 675개 아미노산 서열을 인코딩하는 2025개 뉴클레오타이드 서열(정지 코돈은 포함하지 않음)이다. kpsS에 대한 완전한 뉴클레오타이드 서열은 본원에서 서열 번호 11로 나타나 있다. kpsS는 본원에서 서열 번호 12로 나타낸, 403개 아미노산 서열을 인코딩하는 1209개 뉴클레오타이드 서열(정지 코돈을 포함하지 않음)이다. kpsM에 대한 완전한 뉴클레오타이드 서열은 본원에서 서열 번호 13으로 나타나 있다. kpsM은 본원에서 서열 번호 14로 나타낸, 258개 아미노산 서열을 인코딩하는 774개 뉴클레오타이드 서열(정지 코돈을 포함하지 않음)이다. kpsT에 대한 완전한 뉴클레오타이드 서열은 본원에서 서열 번호 15로 나타나 있다. kpsT는 본원에서 서열 번호 16으로 나타낸, 222개 아미노산 서열을 코딩하는 666개 뉴클레오타이드 서열(정지 코돈을 포함하지 않음)이다. kfoA에 대한 완전한 뉴클레오타이드 서열은 본원에서 서열 번호 17로 나타나 있다. kfoA는 본원에서 서열 번호 18로 나타낸, 339개 아미노산 서열을 인코딩하는 1017개 뉴클레오타이드 서열(정지 코돈을 포함하지 않음)이다. kfoB에 대한 완전한 뉴클레오타이드 서열은 본원에서 서열 번호 19로 나타나 있다. kfoB는 본원에서 서열 번호 20으로 나타낸, 546개 아미노산 서열을 인코딩하는 1638개 뉴클레오타이드 서열(정지 코돈을 포함하지 않음)이다. kfoC에 대한 완전한 뉴클레오타이드 서열은 본원에서 서열 번호 21로 나타나 있다. kfoC는 본원에서 서열 번호 22로 나타낸, 686개 아미노산 서열을 인코딩하는 2058개 뉴클레오타이드 서열(정지 코돈을 포함하지 않음)이다. kfoD에 대한 완전한 뉴클레오타이드 서열은 본원에서 서열 번호 23으로 나타나 있다. kfoD는 본원에서 서열 번호 24로 나타낸, 477개 아미노산 서열을 코딩하는 1431개 뉴클레오타이드 서열(정지 코돈을 포함하지 않음)이다. kfoE에 대한 완전한 뉴클레오타이드 서열은 본원에서 서열 번호 25로 나타나 있다. kfoE는 본원에서 서열 번호 26으로 나타낸, 522개 아미노산 서열을 인코딩하는 1566개 뉴클레오타이드 서열(정지 코돈을 포함하지 않음)이다. kfoF에 대한 완전한 뉴클레오타이드 서열은 본원에서 서열 번호 27로 나타나 있다. kfoF는 본원에서 서열 번호 28로 나타낸, 389개 아미노산 서열을 인코딩하는 1167개 뉴클레오타이드 서열(정지 코돈을 포함하지 않음)이다. kfoG에 대한 완전한 뉴클레오타이드 서열은 본원에서 서열 번호 29로 나타나 있다. kfoG는 본원에서 서열 번호 30으로 나타낸, 488개 아미노산 서열을 인코딩하는 1464개 뉴클레오타이드 서열(정지 코돈을 포함하지 않음)이다.
orf1(본원에서 또한 kfoH로 언급됨)에 대한 완전한 뉴클레오타이드 서열은 본원에서 서열 번호 31로 나타나 있다. orf1은 본원에서 서열 번호 32로 나타낸, 241개 아미노산 서열을 인코딩하는 723개 뉴클레오타이드 서열(정지 코돈을 포함하지 않음)이다. orf3(또한 본원에서 kfoI로 언급됨)에 대한 완전한 뉴클레오타이드 서열은 본원에서 서열 번호 33으로 나타나 있다. orf3는 본원에서 서열 번호 34로 나타낸, 126개 아미노산 서열을 인코딩하는 378개 뉴클레오타이드 서열(정지 코돈을 포함하지 않음)이다.
각종 양태에서, 본 발명은 에스케리키아 콜라이 K4 유전자 클러스터, 에스케리키아 콜라이 K4 유전자 클러스터의 하나 이상의 영역, 에스케리키아 콜라이 K4 유전자 클러스터로부터의 유전자의 하나 이상의 서브세트, 에스케리키아 콜라이 K4 유전자 클러스터로부터의 하나 이상의 개개 유전자, 또는 이의 조합을 포함하는 작제물을 포함하며, 여기서 작제물은 박테리아 숙주 세포내에서 콘드로이틴을 생산하거나 이의 양을 증가시키는데 유용하다. 각종 양태에서, 작제물은 위에 기술된 전체 17개의 유전자 클러스터 또는 위에 기술된 17개 유전자 클러스터 중 하나 이상의 유전자, 즉, kpsF, kpsE, kpsD, kpsU, kpsC, kpsS, kpsM, kpsT, kfoA, kfoB, kfoC, kfoD, kfoE, kfoF, kfoG, kfoH 및 kfoI를 포함할 수 있다. 일부 양태에서, 작제물은 K4 클러스터의 하나 이상의 영역(즉, 본원에 기술된 바와 같은 영역 1, 2, 및/또는 3)을 포함한다. 일부 양태에서, 작제물은 K4 클러스터로부터의 유전자의 하나 이상의 서브세트(본원에 기술된 바와 같은 영역 1, 2 및/또는 3으로부터의 유전자의 서브세트를 포함함)를 포함한다. 작제물은, 클러스터내 유전자가 클러스터내 어떠한 다른 유전자에 대해 어떠한 순서로도 존재하는 유전자 클러스터를 포함할 수 있다. 따라서, 작제물내의 유전자 클러스터내 유전자의 순서는 K4 클러스터내의 천연적으로 존재하는 유전자의 순서와는 상이할 수 있다. 유사하게, 작제물은 K4 클러스터로부터의 어떠한 다른 영역, 유전자 서브세트, 또는 개개 유전자와 관련하여 작제물내에 어떠한 순서로도 존재할 수 있는 K4 클러스터로부터의 영역, 유전자의 서브세트, 또는 유전자를 포함할 수 있다. 일부 양태에서, 유전자는 작제물내에 규정된 순서로 존재한다. 작제물은 상기 언급된 에스케리키아 콜라이 혈청형 K4 균주 U1-41로부터 분리된 하나 이상의 천연 유전자(즉, 에스케리키아 콜라이 K4 U1-41 또는 다른 혈청형 K4 균주내에 존재하는 서열을 갖는 유전자) 및/또는 하나 이상의 합성 유전자, 즉, U1-41로부터 분리된 천연 유전자를 기초로 하지만, 여기서 DNA 서열이 이들 유전자에 의해 코딩된 아미노산 서열을 변경시키지 않고, 박테리아 숙주 세포내에서 최적의 코돈 사용빈도를 위해 변형된 유전자를 포함할 수 있다. 이러한 합성 유전자의 설계 및 제조는 실시예 2에 설명되어 있다.
위에서 주목하고 실시예 6 및 7에서 상세히 추가로 설명한 바와 같이, kfoD, kfoI, kfoE kfoH 유전자 중 하나 이상은 에스케리키아 콜라이내 콘드로이틴의 프럭토실화에 필수적이지만, 이들 유전자중 어느 것도 콘드로이틴의 합성에 필요하지 않다. 이들 유전자들 중 4개 모두의 동시 누락 또는 불활성화는 프럭토실화되지 않은 콘드로이틴의 생산을 야기한다. 일부 양태에서, 본 발명의 작제물은 kfoD, kfoI, kfoE kfoH 중 하나 이상의 기능성 유전자를 함유하지 않는다. 다시 말해서, kfoD, kfoI, kfoE kfoH 중 하나 이상의 기능성 유전자는 이들 양태에서 작제물로부터 부재한다. 기능성 유전자를 함유하지 않는 작제물(즉, 기능성 유전자가 부재한 작제물)은, 전체 유전자가 부재한 작제물 및 또한 유전자 또는 이의 일부가 존재하지만 비-기능성(즉, 불활성)인 작제물을 포함한다. 일부 양태에서, 본 발명의 작제물은 변형되어 kfoD, kfoI, kfoE kfoH 중 하나 이상을 불활성화시킨 유전자 클러스터를 포함한다.
일부 양태에서, 본 발명은 kpsF, kpsE, kpsD, kpsU, kpsC, kpsS, kfoA, kfoC, 및 kfoF를 포함하는 유전자 클러스터를 포함하는 작제물을 포함하며, 여기서 작제물은 kfoD, kfoI, kfoE kfoH 중 하나 이상의 기능성 유전자를 함유하지 않는다. 일부 양태에서, 작제물은 본원에 기술된 바와 같이 비-병원성 박테리아 숙주 세포내에서 콘드로이틴을 생산하기에 적합하다. 일부 양태에서, 콘드로이틴은 비-프럭토실화된다. 일부 양태에서, 작제물은 kfoG 및/또는 kfoB를 추가로 포함할 수 있다. 위에 주목한 바와 같이, kfoB 및 kfoG 유전자는 콘드로이틴의 생산을 위해 필수적인 것으로 밝혀지지 않았으나, kfoG 유전자는 콘드로이틴의 최적 생산에 필요한 것으로 밝혀졌다(참조: 실시예 7). 일부 양태에서, 본 발명의 작제물은 kpsM 및/또는 kpsT를 추가로 포함할 수 있다.
일부 양태에서, 작제물은 세포로부터 분비된 재조합 콘드로이틴의 생산에 유용하다.
일부 양태에서, 이들 작제물은 발현 벡터 pDD66(kpsMT-kfoABCFG-kpsFEDUCS를 함유하는 발현 벡터), pDD67(kpsFEDUCS-kpsMT-kfoABCFG를 함유하는 발현 벡터), pCX040(kpsMT-kfoACFG-kpsFEDUCS를 함유하는 발현 벡터), pCX041(kpsMT-kfoABCF-kpsFEDUCS를 함유하는 발현 벡터), pCX042(kpsFEDUCS-kpsMT-kfoACFG를 함유하는 발현 벡터), pCX043(kpsFEDUCS-kpsMT-kfoABCF를 함유하는 발현 벡터), 및 pCX096(kpsFEDUCS-kfoABCFG를 함유하는 발현 벡터)를 포함한다. 다른 양태는 발현 플라스미드 pBR1052이다. 실시예 4에 기술된 바와 같이, pBR1052는 pDD66(kpsMT-kfoABCFG-kpsFEDUCS)과 동일한 K4 유전자 세트를 함유하고 추가로 kpsF 유전자의 바로 상부(upstream)에 삽입된 Pm 프로모터 서열의 제2 카피를 갖는다. pDD66의 뉴클레오타이드 서열은 서열 번호 35로 나타내며; pDD67의 뉴클레오타이드 서열은 서열 번호 36로 나타내고; pCX040의 뉴클레오타이드 서열은 서열 번호 37로 나타내고; pCX041의 뉴클레오타이드 서열은 서열 번호 38로 나타내며; pCX042의 뉴클레오타이드 서열은 서열 번호 39로 나타내고; pCX043의 뉴클레오타이드 서열은 서열 번호 40으로 나타내며; pCX096의 뉴클레오타이드 서열은 서열 번호 149로 나타내고; pBR1052의 뉴클레오타이드 서열은 서열 번호 41로 나타낸다. 이들 DNA 작제물의 설계 및 작제는 실시예 4에서 상세히 설명된다.
일부 양태에서, 본 발명은 세포내 콘드로이틴, 즉, 숙주 세포로부터 분비되지 않는 콘드로이틴을 생산하는 목적에 유용한 작제물을 포함한다. 콘드로이틴의 세포내 생산은, 배양 배지내 높은 수준의 다당류로부터 생성되는 발효의 점도를 제거하기 위해 요구될 수 있다. 또한, 세포내 생산이 분비보다 더 높은 수준의 콘드로이틴을 달성할 수 있는 것이 가능하다. 일부 양태에서, 작제물은 영역 3의 kpsM 및 kpsT 중 적어도 하나의 기능성 유전자를 함유하지 않는다. 일부 양태에서, 작제물은 영역 3의 kpsM 및 kpsT 중 적어도 하나를 함유하지 않거나 불활성화시키기 위해 변형시킨 유전자 클러스터를 포함한다. 일부 양태에서, 작제물은 영역 1의 kpsE, kpsD, kpsC 및 kpsS 중 적어도 하나의 기능성 유전자를 함유하지 않는다. 일부 양태에서, 작제물은 영역 1의 kpsE, kpsD, kpsC 및 kpsS 중 적어도 하나를 함유하지 않거나 이를 불활성화시키기 위해 변형된 유전자 클러스터를 포함한다. 일부 양태에서, 작제물은 영역 3의 kpsM 및 kpsT 중 적어도 하나 및 영역 1의 kpsE, kpsD, kpsC 및 kpsS 중 적어도 하나의 기능성 유전자를 함유하지 않는다. 일부 양태에서, 작제물은 영역 3의 kpsM 및 kpsT 중 적어도 하나 및 영역 1의 kpsE, kpsD, kpsC 및 kpsS 중 적어도 하나를 함유하지 않거나 이를 불활성화시키기 위해 변형된 유전자 클러스터를 포함한다. 이들 작제물은 실시예 4 및 9에 기술되어 있다.
일부 양태에서, 본 발명은 kfoA, kfoC, 및 kfoF를 포함하는 유전자 클러스터를 포함하는 작제물을 포함하며, 여기서 유전자 클러스터는 kpsM, kpsT, kpsE, kpsD, kpsCkpsS 중 하나 이상의 기능성 유전자를 함유하지 않는다. 일부 양태에서, 작제물은 본원에 기술된 바와 같은 비-병원성 박테리아 숙주 세포내에서 콘드로이틴을 생산하기에 적합하다. 일부 양태에서, 콘드로이틴은 숙주 세포로부터 분비되지 않는다. 일부 양태에서, 콘드로이틴은 비-프럭토실화된다. 일부 양태에서, 작제물은 또한 kfoD, orf3, kfoE, 및 orf1 중 하나 이상의 기능성 유전자를 함유하지 않는다. 일부 양태에서, 작제물은 kfoG 및/또는 kfoB를 추가로 포함할 수 있다. 일부 양태에서, 작제물은 kfoA, kfoB, kfoC, kfoF kfoG를 포함한다.
일부 양태에서, 본 발명의 작제물은 kfoA, kfoB, kfoC, kfoF, kfoG, 및 이의 조합으로 이루어진 군으로부터 선택된 유전자를 포함하며, 여기서 작제물은 kpsM, kpsT, kpsE, kpsD, kpsCkpsS 중 하나 이상의 기능성 유전자를 함유하지 않는다. 일부 양태에서, 작제물은 본원에 기술된 바와 같이 비-병원성 박테리아 숙주 세포내에서 콘드로이틴을 생산하는데 적합하다. 일부 양태에서, 작제물은 본원에 기술된 바와 같은 비-병원성 박테리아 숙주 세포내에서 콘드로이틴의 양을 증가시키는데 적합하다. 일부 양태에서, 작제물은 에스케리키아 콜라이 K4 유전자 클러스터, 클러스터의 영역, 클러스터의 유전자의 서브세트, 또는 숙주 염색체 내로 통합된 클러스터의 유전자의 하나 이상의 존재하는 카피를 포함하는 박테리아 숙주 세포로 이전된다. 일부 양태에서, 콘드로이틴은 프럭토실화되어 있지 않다. 일부 양태에서, 작제물은 또한 kfoD, orf3, kfoE, 및 orf1 중 하나 이상의 기능성 유전자를 함유하지 않는다. 일부 양태에서, 작제물은 kfoA, kfoB, kfoC, kfoF kfoG를 포함한다.
일부 양태에서, 본 발명의 작제물은 발현 벡터 pCX039(kfoABCFG를 함유하는 발현 벡터), pCX044(kfoACFG를 함유하는 발현 벡터), pCX092(kfoABCF를 함유하는 발현 벡터), pCX045(kpsMT-kfoABCFG-kpsFEDUS를 함유하는 발현 벡터), 및 pCX048(kpsM-kfoABCFG-kpsFEDUCS를 함유하는 발현 벡터)를 포함한다. pCX039의 뉴클레오타이드 서열은 서열 번호 42로 나타내며; pCX044의 뉴클레오타이드 서열은 서열 번호 43로 나타내고; pCX092의 뉴클레오타이드 서열은 서열 번호 154로 나타내고; pCX045의 뉴클레오타이드 서열은 서열 번호 44로 나타내고; pCX048의 뉴클레오타이드 서열은 서열 번호 45로 나타낸다. 이들 DNA 작제물의 설계 및 작제는 실시예 4에 상세히 설명되어 있다.
일부 양태에서, 본 발명의 작제물은 발현 벡터 pCX075(kfoABFG를 함유하는 발현 벡터), pCX081(kfoABCG를 함유하는 발현 벡터), pCX082(kfoBCFG를 함유하는 발현 벡터), pCX101(kfoABCFG-kpsMT를 함유하는 발현 벡터), pBR1102(kfoABCFG를 함유하는 발현 벡터), pBR1100(kfoABCFG를 함유하는 발현 벡터), 및 pBR1101(kfoABCFG를 함유하는 발현 벡터)를 포함한다. pCX075의 뉴클레오타이드 서열은 서열 번호 153으로 나타내고; pCX081의 뉴클레오타이드 서열은 서열 번호 151로 나타내고; pCX082의 뉴클레오타이드 서열은 서열 번호 152로 나타내고; pCX101의 뉴클레오타이드 서열은 서열 번호 150으로 나타내고; pBR1102의 뉴클레오타이드 서열은 서열 번호 170으로 나타내고; pBR1100의 뉴클레오타이드 서열은 서열 번호 171로 나타내고; pBR1101의 뉴클레오타이드 서열은 서열 번호 172로 나타낸다. 이들 DNA 작제물의 설계 및 작제는 실시예 18 및 20에 상세히 설명되어 있다.
본 발명의 작제물은 본원에 기술된 바와 같이 박테리아 숙주 세포내에서 최적의 코돈 사용빈도를 위해 변형된 하나 이상의 유전자를 포함할 수 있다.
본 발명의 작제물은 프로모터를 추가로 포함할 수 있다. 프로모터는 본원에 기술된 바와 같은 박테리아 숙주 세포내에서 유전자 클러스터의 발현을 구동할 수 있어야 한다. 바람직한 박테리아 숙주 세포내에서 발현을 구동하는데 유용한, 다수의 이러한 프로모터는 당해 분야의 숙련가에게 친숙하며 본 발명에서 사용될 수 있다. 이종 단백질을 발현하는데 일반적으로 사용된 프로모터의 예는 Pm, lac, trp, tac, λpL, T7, phoA, araC, xapA, cadrecA를 포함하나, 이에 한정되지 않는다(참조: 예를 들면, Weikert et al ., Curr . Opin . Biotechnol . 1996;7:494-499). 이러한 프로모터는 구성적이거나 유도성일 수 있다. 종결 제어 영역은 또한 바람직한 숙주에 대해 천연인 다양한 유전자로부터 유래될 수 있다. 임의로, 종결 부위는 불필요할 수 있다.
일부 양태에서, 본 발명의 작제물은 xylS 조절 유전자와 함께 Pm 프로모터를 포함한다(참조: Mermod et al ., J. Bacteriol . 1986;167:447-54).  슈도모나스 푸티다(Pseudomonas putida ) TOL 플라스미드로부터 분리된 Pm 프로모터 및 이의 조절 유전자 xylS는 각종 그람 음성 박테리아에서 기능하는 것으로 밝혀진 강력하고, 잘 조절된 프로모터를 제공한다(참조: Blatny et al., 플라스미드 1997;38:35-51). XylS 단백질은 단량체 또는 이량체로서 존재할 수 있다. 이량체 형태에서, XylS 단백질은 Pm 프로모터에 결합하여 전사를 자극할 수 있다. XylS 단백질의 이량체화, 및 이에 따른 Pm 프로모터에서 전사 개시는 XylS에 직접 결합하여 단백질의 이량체화를 촉진하는 메타-톨루산(3-메틸벤조에이트)와 같은 특정의 효과인자(effector) 분자에 의해 향상된다(참조: Dominguez-Cuevas et al ., J. Bact . 2008; 190:3118-3128). 프로모터는 유전자 클러스터의 하나 이상의 유전자에 작동적으로 연결될 수 있다.
본 발명의 작제물은 제2 프로모터를 추가로 포함할 수 있다. 예를 들면, 대체 숙주내에서 클로닝된 K4 유전자의 발현의 분석이, 특정 유전자, 또는 유전자 세트의 발현 수준이 최적 미만임을 나타내는 경우, 제2 프로모터가, 최적 수준에서 발현되지 않는 유전자 또는 유전자 세트의 전사를 향상시키기 위해 선택된 위치에서 발현 작제물에 추가될 수 있다. 전형적으로, 추가된 프로모터는 목적한 유전자 또는 유전자 세트 바로 상부(즉, 유전자 또는 유전자 세트에 대해 5')에 삽입될 수 있다. 제2 프로모터는 Pm, 또는 K4 유전자 세트를 발현시키는데 유용한 프로모터의 예로서 상기 나열된 프로모터 중 어느 것일 수 있다. 일부 양태에서, 제2 프로모터는 Pm일 수 있다. 제2 프로모터는 유전자 클러스터의 하나 이상의 유전자에 작동적으로 연결될 수 있다. 하나의 양태에서, 제2 프로모터는 kpsFEDUCS 유전자 세트에 작동적으로 연결될 수 있다. 예를 들면, 실시예 4에 기술된 바와 같은 발현 벡터 pBR1052를 참조한다. 제2 프로모터의 사용에 의해 유전자 또는 유전자들의 조합을 발현시키거나, 증강시키는데 유리할 수 있는 유전자, 또는 유전자들의 조합은 어떠한 제공된 플라스미드, 또는 웨스턴 블롯 분석에 의해 설정된 염색체의 유전자에 대해 실험적으로 측정될 수 있다.
본 발명의 작제물은 특수 항생제에 대해 내성을 부여하는 항생제 내성 유전자를 추가로 포함할 수 있다. 이러한 유전자는 당해 분야에 잘 공지되어 있다. 항생제 내성 유전자의 예는 클로람페니콜 내성 유전자(CamR), 카나마이신 내성 유전자(KanR), 암피실린 내성 유전자(AmpR), 테트라사이클린 내성 유전자(TetR), 스펙티노마이신 내성 유전자(SpcR), 설폰아미드 내성 유전자(SuR), 블레오마이신 내성 유전자(BleR), 스트렙토마이신 내성 유전자(StrR), 카르베니실린 내성 유전자(CbR) 및 에리트로마이신 내성 유전자(EryR)를 포함하나, 이에 한정되지 않는다.
본 발명의 작제물은 박테리아 숙주 세포내에서 콘드로이틴을 생산하는데 유용하다. 어떠한 박테리아 세포도 본 발명에서 숙주 세포로서 사용될 수 있으며, 일부 양태에서, 숙주는 그람-음성 박테리아이다. 그람 음성 박테리아의 예는 에스케리키아, 슈도모나스, 잔토모나스, 메틸로모나스, 악시네토박터 및 스핑고모나스를 포함하나, 이에 한정되지 않는다. 일부 양태에서 숙주는 비-병원성 그람-음성 박테리아이다. 비-병원성 그람-음성 박테리아의 예는 비-병원성 에스케리키아 콜라이, 예를 들면, 에스케리키아 콜라이 K-12 또는 에스케리키아 콜라이 B, 잔토모나스 캄페스트리스, 스핑고모나스 엘로데아 및 슈도모나스 푸티다(Pseudomonas putida)를 포함하나, 이에 한정되지 않는다.
일부 양태에서, 본원에 기술된 것으로서 박테리아 숙주 세포의 내인성 유전자는 상동성 재조합에 의해 결실되거나 불활성화된다.
자체의 천연의 세포외 다당류를 제조할 수 없는 숙주의 유도체가 바람직하다. 이러한 유도체 숙주를 사용하면 재조합 콘드로이틴(rCH)의 생합성의 가시적이고 화학적인 확인, 및 또한 K4 유전자 세트가 도입되는 경우 숙주에 의해 생산된 rCH의 정제를 촉진할 수 있다. 또한, 적절하게 설계된 유도체 숙주내에서 rCH의 생합성은 천연의 다당류 합성과의 경쟁에 의해 제한되지 않을 것이다. 예를 들면, 천연의 다당류 생합성 경로의 제1의 글리코실트랜스퍼라제 유전자의 불활성화 또는 결실은, 천연의 경로에 의한 임의의 잠재적인 지질 담체의 이용을 방지하고 천연의 경로의 효소와 K4 효소 사이의 지질 담체, 또는 초기 다당류 쇄에서 작용하여 이용가능성을 제한할 수 있는 어떠한 다른 세포 성분(들)에 대한 경쟁을 방지할 수 있다. 전체 천연의 생합성 유전자 클러스터의 불활성화(예를 들면, 결실에 의함)는 대부분의 경쟁적 성분을 제거할 수 있지만, 생리학 및/또는 막 구조에 대한 바람직하지 않은 효과를 잠재적으로 가질 수 있다.
실시예 3에 상세히 기술된 바와 같이, 본 발명자들은 본 발명의 작제물의 발현을 위한 숙주로서, 에스케리키아 콜라이 K-12("K-12"), 에스케리키아 콜라이 B("EcB"), 및 잔토모나스 캄페스트리스 피브이. 캄페스트리스(Xanthomonas campestris pv. campestris)("Xcc")를 예로서 사용하였으나, 이들 예에 한정하는 것으로 의도되지 않는다. 천연의 세포외 다당류의 합성을 위한 효소를 인코딩하는 유전자 클러스터의 하나 이상의 유전자내 결실을 포함하는 유도체 숙주의 생성은 실시예 3에 상세히 기술된 바와 같이 2-단계, "팝-인/팝-아웃" 상동성-유도된 방법을 사용하여 수행하였다. 예를 들면, 콜란산(M 항원)은 많은 장 박테리아에 의해 생산된 세포외 다당류이다. 콜란산 생합성에서 결핍성이거나 결함이 있는 에스케리키아 콜라이 K-12 및 에스케리키아 콜라이 B 균주가 생성되었다. 균주 MSC188 및 MSC175는 전체 콜란산 오페론, 및 콜란산 생합성 동안 지질 담체 위로의 제1 당의 로딩(loading)에 관여하는 글리코실트랜스퍼라제 효소를 인코딩하는 wcaJ 유전자 각각의 결실을 포함하는 에스케리키아 콜라이 K-12의 유도체이다. 균주 MSC364는 전체 콜란산 오페론의 결실을 포함하는 에스케리키아 콜라이 B의 유도체이다. 유사하게, 세포외 다당류 크산탄 검의 생합성에 있어 결핍성이거나 결함이 있는 잔토모나스 캄페스트리스 피브이. 캄페스트리스 균주가 생성되었다. 균주 MSC225 및 MSC226은 글리코실트랜스퍼라제 I 효소를 인코딩하는 gumD 유전자의 결실을 포함하는 Xcc 균주의 유도체이며 균주 MSC255, MSC256, 및 MSC257은 전체 크산탄 검 오페론의 결실을 포함한다.
본 발명은 본 발명의 임의의 하나 이상의 작제물을 비-병원성 박테리아 숙주 세포로 이전시킴을 포함하는, 본 발명의 작제물의 임의의 하나 이상을 포함하는 비-병원성 박테리아 숙주 세포를 생산하는 방법에 관한 것이다. 본 발명의 작제물은 작제물내에 존재하는 유전자의 발현을 위한 어떠한 공지된 방법에 의해 박테리아 숙주 세포내로 도입될 수 있다. 이러한 방법은, 제한하지 않고 형질전환, 전기천공(electroporation), 접합 또는 형질도입을 포함할 수 있다.
본 발명은 본 발명의 작제물 중 어느 하나 이상을 포함하는 비-병원성 박테리아 숙주 세포에 관한 것이다. 따라서, 본 발명은 또한 본 발명의 발현 벡터를 포함하는 작제물을, 결실을 포함하는 유도체 균주를 포함하는 숙주 균주내로 도입시킴으로써 생성된 각종 균주를 포함한다. 특정의 예들은 실시예 6 내지 9, 11, 13 및 14에 상세히 기술되어 있다.
일부 양태에서, 본 발명의 작제물내에 함유된 유전자는 수용체 숙주 균주의 염색체 내로 도입됨으로써 유전자가 숙주 염색체내에 통합되도록 한다. 염색체내에 클로닝된 유전자를 위치시키면 콘드로이틴 생합성 유전자를 수반하는 플라스미드(들) 또는 벡터(들)을 유지하기 위한 선택적인 압력을 유지하기 위한 요건을 제거하는 장점을 제공함으로써 임의의 선택적인 압력의 부재하에서 안정한 발현 균주 또는 보다 안정한 발현 균주를 잠재적으로 제공할 수 있다. 따라서, 본 발명은 이들의 염색체 내로 통합된 본 발명의 작제물내에 함유된 유전자들중 임의의 하나 이상의 하나 이상의 카피를 포함하는 박테리아 균주를 포함한다.
예로서, 본 발명자들은 이들의 염색체 내로 통합된 콘드로이틴의 생합성을 위한 합성 유전자들 중 하나 이상을 포함하는 에스케리키아 콜라이 K-12 및 Xcc 균주를 생성하였다. 본 발명은 또한 본 발명의 발현 벡터를 포함하는 작제물을, 그들의 염색체 내로 통합된 작제물의 하나 이상의 카피를 포함하는 본 발명의 균주내로 도입시킴으로써 생성된 균주를 포함한다.
일부 양태에서, K4 유전자 클러스터, 당해 클러스터의 하나 이상의 영역, 당해 클러스터의 유전자의 하나 이상의 서브세트, 또는 클러스터의 하나 이상의 유전자를 본원에 기술된 본 발명의 작제물 및 방법을 사용하여 본원에 기술된 바와 같은 비-병원성 박테리아 숙주 세포의 염색체 내로 통합시킨다. 일부 양태에서, 유전자 클러스터, 영역, 서브세트 또는 유전자의 2개 이상의 카피를 비-병원성 박테리아 숙주 세포의 염색체 내로 통합시킨다. 일부 양태에서, 유전자 클러스터, 영역, 서브세트 또는 유전자의 2 내지 20; 2 내지 19; 2 내지 18; 2 내지 17; 2 내지 16; 2 내지 15; 2 내지 14; 2 내지 13; 2 내지 12; 2 내지 11; 2 내지 10; 2 내지 9; 2 내지 8; 2 내지 7; 2 내지 6; 2 내지 5; 2 내지 4; 또는 2 내지 3개의 카피를 비-병원성 박테리아 숙주 세포의 염색체 내로 통합시킨다. 일부 양태에서, 유전자 클러스터, 영역, 서브세트, 또는 유전자의 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 또는 20개 카피를 비-병원성 박테리아 숙주 세포의 염색체 내로 통합시킨다. 일부 양태에서, 2개 이상의 카피를 동일한 작제물을 사용하여 숙주 염색체 내로 통합시킨다. 일부 양태에서, 2개 이상의 카피를 상이한 작제물을 사용하여 숙주 염색체 내로 통합시킨다. 일부 양태에서, 프로모터를 또한 숙주 염색체 내로 통합시켜 숙주 염색체 내로 통합된 유전자 클러스터, 영역, 서브세트 또는 유전자의 발현을 조절한다. 일부 양태에서, 숙주 염색체 내로 통합된 2개 이상의 카피는 동일한 프로모터 또는 상이한 프로모터로부터 발현된다. 일부 양태에서, kfoA, kfoB, kfoC, kfoF, kfoG, 및 이의 조합으로 이루어진 군으로부터 선택된 영역 2 유전자의 2개 이상의 카피가 숙주 염색체 내로 통합된다. 일부 양태에서, kfoA, kfoB, kfoC, kfoF, 및 kfoG의 2개 이상의 카피는 숙주 염색체 내로 통합된다. 일부 양태에서, 영역 1, 영역 3, 또는 영역 1 또는 영역 3으로부터 하나 이상의 유전자의 2개 이상의 카피는 숙주 염색체 내로 통합된다. 일부 양태에서, 본 발명의 작제물내에 함유된 유전자는 염색체 내로 통합되지 않은 유전자를 포함하는 본 발명의 하나 이상의 작제물을 또한 함유하는 박테리아 숙주 세포의 염색체 내로 통합된다.
이러한 균주의 예는 실시예 10 내지 13, 20 및 21에 상세히 기술되어 있다. 기술된 작제물 및 균주는 콘드로이틴의 생산에 사용될 수 있다.
본 발명의 균주의 예는, 제한되지 않고, 에스케리키아 콜라이 K-12 균주 MSC279, MSC280, MSC322, MSC323, MSC324, MSC325, MSC328, MSC346, MSC356, MSC359, MSC392, MSC402, MSC403, MSC404, MSC405, MSC410, MSC411, MSC436, MSC437, MSC438, MSC439, MSC458, MSC459, MSC460, MSC466, MSC467, MSC498, MSC499, MSC500, MSC510, MSC511, MSC522, MSC526, MSC537, MSC551, MSC561, MSC562, MSC563, MSC564, MSC566, MSC567, MSC619, MSC625, MSC627, MSC640, MSC641, MSC643, MSC646, MSC650, MSC656, MSC657, MSC658, MSC659, MSC660, MSC669, MSC670, MSC671, MSC672, MSC673, MSC674, MSC675, MSC676, MSC677, MSC678, MSC679, MSC680, MSC681, MSC682, MSC683, MSC684, MSC687, MSC688, MSC689, MSC690, MSC691, MSC692, MSC693, MSC694, MSC700, MSC701, MSC702, MSC722, MSC723, 및 MSC724; 에스케리키아 콜라이 B 균주 MSC315, MSC316, MSC317, MSC319, 및 MSC347; 잔토모나스 캄페스트리스 균주 MSC326, MSC348, MSC350, MSC480, MSC461, MSC469 및 MSC494를 포함한다.
본 발명은 본 발명의 작제물 중 어느 하나 이상을 비-병원성 박테리아 숙주 세포내로 이전시키고, 박테리아 숙주 세포를, 콘드로이틴이 박테리아 숙주 세포에 의해 생산되는 발효 조건하에서 배양함을 포함하는, 콘드로이틴의 생산 방법에 관한 것이다.
본 발명은 본 발명의 작제물 중 어느 하나 이상을 포함하는 비-병원성 숙주 세포를 콘드로이틴의 생산에 충분한 발효 조건하에서 배양함을 포함하는, 콘드로이틴을 생산하는 방법에 관한 것이다.
본 발명은 황산화되지 않은 콘드로이틴을 생산하는 방법을 포함한다. 당해 방법은 본 발명의 비-병원성 박테리아 숙주 세포를 황산화되지 않은 콘드로이틴의 생산에 충분한 발효 조건하에서 배양함을 포함한다. 일부 양태에서, 당해 방법은 본 발명의 작제물을 비-병원성 박테리아 숙주 세포로 이전시키고 박테리아 숙주 세포를 박테리아 숙주 세포에 의해 황산화되지 않은 콘드로이틴이 생산되는 발효 조건하에서 배양함을 포함한다.
각종 양태가 실시예 7 내지 15에 기술되어 있다. 구체적으로, 실시예 6 내지 9, 11, 13 및 14는, 본 발명의 작제물이 숙주 세포내로 형질전환되는 경우 콘드로이틴의 생산을 입증하는 데이타를 제공하며 실시예 10 내지 15는, 본 발명의 작제물이 숙주 세포의 염색체 내로 통합되는 경우 콘드로이틴의 생산을 입증하는 데이타를 제공한다.
구체적인 작제물 및 그안의 유전자들의 조합에 따라, 프럭토실화되거나 비-프럭토실화된 콘드로이틴을 생산하는 것이 가능하다(참조: 실시예 6 및 7). 또한, 구체적인 작제물 및 그안의 유전자들의 조합에 따라, 재조합 콘드로이틴을 배양 배지내로 분비시키거나 세포내 위치에 유지시킬 수 있다(참조: 실시예 9).
박테리아 세포를 배양하는 방법 및 배양 배지의 조성은 당해 분야에 잘 공지되어 있으며 본 발명에서 사용될 수 있다. 재조합 콘드로이틴의 최적의 생산을 위해, 온도, pH, 용존 산소 농도, 유도인자 농도 및 유도-후 배양 기간, 및 또한 그안의 영양물 및 염의 내용물을 포함하는 배지의 조성과 같은 각종 배양 매개변수는 최적화되어야 한다. 실시예 8은 각종 성장 배지, 온도 및 유도 조건에서 콘드로이틴의 재조합 생산을 기술한다. 당해 정보를 기초로 하여, 이러한 매개변수의 추가의 최적화는 당해 분야의 숙련가에게 매우 명백할 것이다. 일부 양태에서, 박테리아 숙주 세포는 20℃ 내지 37℃, 예를 들면, 20℃, 21℃, 22℃, 23℃, 24℃, 25℃, 26℃, 27℃, 28℃, 29℃, 30℃, 31℃, 32℃, 33℃, 34℃, 35℃, 36℃ 또는 37℃에서 배양된다. 일부 양태에서, 배양 배지는 효모 추출물, 단백질 분해물, 인산칼륨, 및 물을 포함한다. 일부 양태에서, 배양 배지는 글리세린(또한 글리세롤로 공지됨)을 포함한다. 일부 양태에서, 1 g/L 내지 50 g/L, 5 g/L 내지 50 g/L 또는 15 g/L 내지 50 g/L의 황산화되지 않은 콘드로이틴이 24 내지 72시간내에 박테리아 숙주 세포로부터 분비된다.
일부 양태에서, 본 발명의 콘드로이틴을 생산하는 방법은 박테리아 숙주 세포로부터 콘드로이틴을 회수함을 추가로 포함한다.
일부 양태에서, 본 발명의 콘드로이틴을 생산하는 방법은 세포외 배양 배지로부터 콘드로이틴을 회수함을 추가로 포함한다. 콘드로이틴은 배양 브로쓰로부터 알코올 침전 또는, 무수 분말을 수득하기 위한 동결건조를 포함하나, 이에 한정되지 않는 당해 분야에 공지된 임의의 기술에 의해 발효 브로쓰로부터 회수될 수 있다.
일부 양태에서, 콘드로이틴을 생산하는 방법은 회수된 콘드로이틴을 정제하는 단계를 포함할 수 있다. 콘드로이틴의 정제는 예를 들면, 알칼리 처리, 산 처리, 프로테이나제 처리, 크로마토그래피, 추출, 용매 추출, 막 분리, 전기분해, 역 삼투압, 증류, 침전, 화학적 유도체화, 결정화, 한외여과 및/또는 유기 용매를 사용한 다당류의 침전을 포함하는 당해 분야에 공지된 어떠한 기술에 의해서도 달성할 수 있다[참조: 예를 들면, Taniguchi, N., 1982. Isolation and analysis of glycosaminoglycans. Pages 20-40 in: Glycosaminoglycans and Proteoglycans in Physiological and Pathological Process of Body Systems. R. S. Varma and R. Varma, ed. Karger, Basel, Switzerland; Fraquharson et al., Oral. Microbiol. Immunol. 2000;15:151-157; Manzoni et al., J. Bioact. Comp. Polm. 1993;8:251-257; Manzoni et al., Biotechnol. Letters 2000;22:759-766; Johns et al., Aust. J. Biotechnol. 1991;5:73-77; 이들 문서들 각각은, 본원에 이의 전문이 참조로 혼입되어 있다]. 침전 용매의 예는, 제한되지 않고, 아세톤, 메탄올, 에탄올 또는 이소프로판올을 포함할 수 있다.
일부 양태에서, 콘드로이틴을 생산하는 방법은 콘드로이틴을 황산화함을 추가로 포함한다.
본 발명은 본 발명의 방법에 의해 콘드로이틴을 생산하여 콘드로이틴을 황산화함을 포함하는, 콘드로이틴 설페이트를 생산하는 방법에 관한 것이다.
황산화는 화학적으로 또는 효소적으로 수행될 수 있다. 다당류의 화학적 황산화를 위한 여러 과정이 당해 분야에 공지되어 있으며, 이중 어느 하나가 본원에서 사용될 수 있다. 예를 들면, 황산화는 다당류를 유기 용매내로 가용화시킨 후 황산화제와 조절된 온도하에서 반응시켜 달성할 수 있다. 가용화 용매의 예는 포름아미드, N,N-디메틸포름아미드(DMF), 피리딘, 또는 디메틸설폭사이드를 포함할 수 있으나, 이에 한정되지 않는다. 황산화제의 예는 클로로설폰산, 설퍼트라이옥사이드 및 각종 설퍼트라이옥사이드-아민 복합체를 포함할 수 있으나, 이에 한정되지 않는다. 설퍼트라이옥사이드-아민 복합체에 적합한 아민의 예는 피리딘, DMF, 트리메틸아민, 트라이에틸아민(TEA) 및 피페리딘을 포함하나, 이에 한정되지 않는다. 일부 양태에서, 재조합 콘드로이틴의 황산화시, 황산화된 생성물은 천연의 콘드로이틴 설페이트의 것에 상응하는 5.0 내지 7.5%의 황 함량을 함유한다. 추가의 양태에서, 황산화된 생성물은 유의적인 해중합(depolymerization)을 겪지 않는다. 실시예 15는 재조합 콘드로이틴의 화학적 황산화 방법을 기술한다. 일부 양태에서, 본 발명의 방법에 의해 생산된 콘드로이틴의 황산화는 설퍼트라이옥사이드-트라이에틸아민 복합체 또는 클로로설폰산을 포름아미드 속에서 콘드로이틴과 혼합시킴을 포함한다.
본 발명은 본원에 기술된 방법 중 어느 것에 의해 생산된 재조합 콘드로이틴 또는 재조합 콘드로이틴 설페이트에 관한 것이다.
본 발명은 본원에 기술된 방법 중 어느 것에 의해 생산된 재조합 콘드로이틴 또는 재조합 콘드로이틴 설페이트를 포함하는 조성물에 관한 것이다.
일부 양태에서, 조성물은 글루코스아민, 글루코스아민 설페이트 또는 글루코스아민 하이드로클로라이드와 같은 보충물을 포함할 수 있다. 글루코스아민(2-아세트아미도-2-데옥시글루코즈)는 연골에서 발견된 천연적으로 존재하는 화합물이다. 글루코스아민 설페이트는 연골 매트릭스 및 윤활액내 글리코스아미노글리칸의 일반적인 성분이다. 일부 임상 시험은 골관절염, 특히 무릎의 골관절염의 치료시 글루코스아민 설페이트의 용도를 지지한다(참조: Herrero-Beaumont et al ., Arthritis Rheum . 2007;56:555-67; Bruyere et al ., Osteoarthritis Cartilage 2008;16:254-60). 설페이트 잔기는 연골을 강화시키고 글루코스아미노글리칸 합성을 보조함으로써 윤활액에 있어 임상적 잇점을 제공함이 제안되었다(참조: Silbert Glycobiology 2009;19:564-567). 글루코스아민은 일반적으로 관절 건강을 촉진시키기 위해 의도된 영양 보충물내 콘드로이틴 설페이트와 함께 및 골관절염 치료로서 일반적으로 제공된다.
일부 양태에서, 본 발명은 대상체에서 건강한 관절 기능을 유지시키는 방법을 포함한다. 다른 양태에서, 본 발명은 골관절염, 사이질 방광염 및/또는 윤활막염을 치료하거나 예방하기 위한 방법을 포함한다. 이들 방법은 상기 기술한 재조합 콘드로이틴 설페이트를 포함하는 조성물을 대상체에게 투여함을 포함한다. 본 발명의 조성물은 일반적으로 치료학적으로 효과적인 양으로 투여될 수 있다.
본 발명은 K4 콘드로이틴 생합성 유전자 클러스터의 유전자에 의해 인코딩된 단백질에 선택적으로 결합하는 항체 또는 항체 단편에 관한 것이다. 이들 항체 및 항체 단편을 사용하여 박테리아 숙주내에서 K4 콘드로이틴 생합성 유전자 클러스터의 유전자의 발현을 확인할 수 있다. 일부 양태에서, 항체 또는 항체 단편은 KpsF의 서열 번호 92, KpsE의 서열 번호 93, KpsD의 서열 번호 94, KpsU의 서열 번호 95, KpsC의 서열 번호 96, KpsS의 서열 번호 97, KpsT의 서열 번호 91, KfoA의 서열 번호 83, KfoB의 서열 번호 84, KfoC의 서열 번호 85, KfoI(Orf3)의 서열 번호 86, KfoE의 서열 번호 87, KfoH(Orf1)의 서열 번호 88, KfoF의 서열 번호 89, 및 KfoG의 서열 번호 90로 이루어진 군으로부터 선택된 아미노산 서열에 결합한다. 항체의 생성은 실시예 5에 상세히 기술되어 있다.
발효 배지 및 조건
콘드로이틴의 생산 방법에서, 본원에 기술된 유전적 변형을 갖는 미생물을 발효 배지 속에서 배양하여 콘드로이틴을 생산한다. 적절한, 또는 효과적인 발효 배지는, 본 발명의 유전적으로 변형된 미생물이, 배양되는 경우 콘드로이틴을 생산할 수 있는 특정 배지를 말한다. 이러한 배지는 전형적으로 동화할 수 있는 탄소, 질소 및 인산염 공급원을 포함하는 수성 배지이다. 이러한 배지는 또한 적절한 염, 무기물, 금속 및 다른 영양소를 포함할 수 있다. 예시적인 배지는 하기 및 실시예 단락에 기술되어 있다. 그러나, 각종 발효 조건이 적합하며 당해 분야의 숙련가에 의해 선택될 수 있음이 인식되어야 한다.
적합한 발효 배지 속에 사용될 수 있는 동화가능한 탄소의 공급원은 당 및 이들의 중합체, 예를 들면, 덱스트린, 슈크로즈, 말토즈, 락토즈, 글루코즈, 프럭토즈, 만노즈, 소르보즈, 아라비노즈 및 크실로즈; 지방산; 유기산, 예를 들면, 아세테이트; 1급 알코올, 예를 들면, 에탄올 및 n-프로판올; 및 다가알코올, 예를 들면, 글리세린을 포함하나, 이에 한정되지 않는다. 본 발명에서 탄소원은 다가알코올, 단당류, 이당류, 및 삼당류를 포함한다. 일부 양태에서, 탄소원은 글리세린이다.
발효 배지속에서 글리세린과 같은 탄소원의 농도는 세포 성장을 촉진하여야 하지만, 사용된 미생물의 성장을 억제하는 정도로 높지 않아야 한다. 전형적으로, 발효는 목적하는 수준의 성장 및 생물량을 달성하기 위한 수준에서 첨가되지만 유기 산, 특히 아세테이트의 축적을 피하기 위한 낮은 농도 수준(1 g/L 미만)에서 유지되는 글리세린과 같은 탄소원을 사용하여 수행된다. 다른 양태에서, 발효 배지 속의 글리세린과 같은 탄소원의 농도는 1 g/L 초과, 2 g/L 초과, 또는 5 g/L 초과이다. 또한, 발효 배지 속에서 글리세린과 같은 탄소원의 농도는 전형적으로 100 g/L 미만, 50 g/L 미만, 또는 20 g/L 미만이다. 발효 성분 농도에 대한 참조는 초기 및/또는 진행하는 성분 농도 둘다를 언급할 수 있다. 일부 경우에, 발효 배지에서 발효 동안 탄소원이 고갈되도록 하는 것이 바람직할 수 있다.
적합한 발효 배지 속에서 사용될 수 있는 동화가능한 질소원은 단순 질소원, 유기 질소원 및 복합 질소원을 포함하나, 이에 한정되지 않는다. 이러한 질소원은 무수 암모니아, 암모늄 염 및, 동물, 야채 및/또는 미생물 유래된 물질을 포함한다. 적합한 질소원은 단백질 가수분해물, 미생물 생물량 가수분해물, 펩톤, 효모 추출물, 황산암모늄, 수산화암모늄, 우레아, 및 아미노산을 포함하나, 이에 한정되지 않는다. 전형적으로, 발효 배지속의 질소원의 농도는 0.1 g/L 초과, 0.25 g/L 초과, 또는 1.0 g/L 초과이다. 그러나, 특정 농도 초과시, 발효 배지에 질소원의 첨가는 미생물 성장에 유리하지 않다. 그 결과, 발효 배지속 질소원의 농도는 20 g/L 미만, 10 g/L 미만, 또는 5 g/L 미만이다. 또한, 일부 경우에 발효 배지에서 발효 동안 질소원이 고갈되도록 하는 것이 바람직할 수 있다.
효과적인 발효 배지는 소포제, 무기 염, 비타민, 미량 금속 및/또는 성장 촉진제와 같은 다른 화합물을 함유할 수 있다. 이러한 다른 화합물들은 효과적인 배지 속에 탄소, 질소 또는 광물원 속에 존재할 수 있거나 배지에 구체적으로 첨가될 수 있다.
발효 배지는 또한 적합한 인산염 공급원을 함유할 수 있다. 이러한 인산염 공급원은 무기 및 유기 인산염 공급원 둘다를 포함한다. 인산염 공급원은 일염기성 또는 이염기성 인산나트륨, 인산칼륨, 인산암모늄과 같은 인산염, 및 이의 혼합물을 포함하나, 이에 한정되지 않는다. 전형적으로, 발효 배지 속의 인산염의 농도는 1.0 g/L 초과, 2.0 g/L 초과, 또는 5.0 g/L 초과이다. 그러나, 특정 농도를 초과하여, 발효 배지에 대한 인산염의 첨가는 미생물의 성장에 유리하지 않다. 따라서, 발효 배지 중의 인산염의 농도는 전형적으로 20 g/L 미만, 15 g/L 미만, 또는 10 g/L 미만이다.
적합한 발효 배지는 또한 마그네슘 공급원을 포함할 수 있다. 일부 양태에서, 마그네슘 공급원은, 비록 유사한 양의 마그네슘에 기여하는 농도의 다른 마그네슘 공급원이 사용될 수 있다고 해도, 생리학적으로 허용되는 염의 형태, 예를 들면, 황산마그네슘 오수화물이다. 전형적으로, 발효 배지 중의 마그네슘의 농도는 0.5 g/L 초과, 1.0 g/L 초과, 또는 2.0 g/L 초과이다. 그러나, 특정 농도를 초과하여, 발효 배지에 대한 마그네슘의 첨가는 미생물의 성장에 유리하지 않다. 따라서, 발효 배지 중의 마그네슘의 농도는 전형적으로 10 g/L 미만, 5 g/L 미만, 또는 3 g/L 미만이다. 또한, 일부 경우에, 발효 배지에서 발효 동안 마그네슘 공급원이 고갈되도록 하는 것이 바람직할 수 있다.
발효 배지는 또한 생물학적으로 허용되는 킬레이트제, 예를 들면, 시트르산삼나트륨 또는 시트르산의 이수화물을 포함할 수 있다. 이러한 예에서, 발효 배지 속 킬레이트제의 농도는 0.1 g/L 초과, 0.2 g/L 초과, 0.5 g/L 초과, 또는 1 g/L 초과이다. 그러나, 특정 농도를 초과하는, 발효 배지에 대한 킬레이트제의 첨가는 미생물의 성장에 유리하지 않다. 따라서, 발효 배지중의 킬레이트제의 농도는 전형적으로 10 g/L 미만, 5 g/L 미만, 또는 2 g/L 미만이다.
발효 배지는 또한 초기에 발효 배지의 목적하는 pH를 유지하기 위한 생물학적으로 허용되는 산 또는 염기를 포함할 수 있다. 생물학적으로 허용되는 산은 염산, 황산, 질산, 인산 및 이의 혼합물을 포함하나, 이에 한정되지 않는다. 생물학적으로 허용되는 염기는 무수 암모니아, 수산화암모늄, 수산화나트륨, 수산화칼륨 및 이의 혼합물을 포함하나, 이에 한정되지 않는다. 본 발명의 일부 양태에서, 사용된 염기는 수산화암모늄이다.
발효 배지는 또한 염화칼슘을 포함하나, 이에 한정되지 않는 생물학적으로 허용되는 칼슘원을 포함할 수 있다. 전형적으로, 발효 배지 속의 염화칼슘 이수화물과 같은 칼슘원의 농도는 5 mg/L 내지 2000 mg/L, 20 mg/L 내지 1000 mg/L, 또는 50 mg/L 내지 500 mg/L의 범위내이다.
발효 배지는 또한 염화나트륨을 포함할 수 있다. 전형적으로, 발효 배지 중의 염화나트륨의 농도는 0.1 g/L 내지 5 g/L, 1 g/L 내지 4 g/L, 또는 2 g/L 내지 4 g/L의 범위내이다.
앞서 논의한 바와 같이, 발효 배지는 또한 미량의 금속을 포함할 수 있다. 이러한 미량의 금속은 편의상 발효 배지의 나머지로부터 별도로 제조될 수 있는 스톡 용액(stock solution)으로서 발효 배지에 가해질 수 있다. 발효 배지에서 사용하기 위한 적합한 미량 금속 스톡 용액은 하기 표 1a 및 1b에 나타낸다. 전형적으로, 발효 배지에 첨가된 미량의 이러한 금속 용액의 양은 1 mL/L 초과, 5 mL/L 초과, 또는 10 mL/L 초과이다. 그러나, 특정 농도를 초과하여, 발효 배지에 대한 미량 금속의 첨가는 미생물의 성장에 유리하지 않다. 따라서, 발효 배지에 첨가된 이러한 미량 금속 용액의 양은 전형적으로 100 mL/L 미만, 50 mL/L 미만, 또는 30 mL/L 미만이다. 스톡 용액 속에 미량의 금속을 첨가하는 것 외에, 개개 성분들은 미량의 금속 용액의 상기 범위로 나타낸 성분의 양에 독립적으로 상응하는 범위내에서 각각 별도로 첨가될 수 있다.
하기 표 1a에 나타낸 바와 같이, 본 발명에서 사용하기 위한 적합한 미량 금속 용액은 황산제1철, 칠수화물; 황산구리, 오수화물; 황산아연, 칠수화물; 몰리브덴산나트륨, 이수화물; 염화코발트, 육수화물; 및 황산마그네슘, 일수화물을 포함할 수 있으나, 이에 한정되지 않는다. 염산을 스톡 용액에 가하여 용액 속 미량 금속 염을 유지시킨다.
[표 1a]
미량 금속 스톡 용액 A
Figure 112016019550472-pct00162
본 발명에서 사용하기 위한 다른 적합한 미량 금속 용액은 표 1b에 나타내며 킬레이트제로서 염화제1철, 육수화물; 염화아염; 염화코발트, 육수화물; 몰리브덴산나트륨; 염화망간; 붕산; 및 시트르산을 포함할 수 있으나, 이에 한정되지 않는다.
[표 1b]
미량 금속 스톡 용액 B
Figure 112012080180037-pct00002
발효 배지는 또한 비타민을 포함할 수 있다. 이러한 비타민은 발효 배지에 편의상 발효 배지의 나머지로부터 별도로 제조될 수 있는 스톡 용액으로서 가할 수 있다. 발효 배지에 사용하기 위한 적합한 비타민 스톡 용액은 하기 표 2에 나타낸다. 전형적으로, 발효 배지에 첨가된 이러한 비타민 용액의 양은 1 ml/L 초과, 5 ml/L 초과, 또는 10 ml/L 초과이다. 그러나, 특정 농도를 초과하는, 발효 배지에 대한 비타민의 첨가는 미생물의 성장에 유리하지 않다. 따라서, 발효 배지에 첨가된 이러한 비타민 용액의 양은 전형적으로 50 ml/L 미만, 30 ml/L 미만, 또는 20 ml/L 미만이다. 스톡 용액 속에 비타민을 첨가하는 것 외에, 개개 성분들은 각각 비타민 스톡 용액의 상기 범위로 나타낸 성분들의 양에 독립적으로 상응하는 범위내에서 별도로 첨가될 수 있다.
표 2에 나타낸 바와 같이, 본 발명에 사용하기 위한 적합한 비타민 용액은 바이오틴, 판토텐산칼슘, 이노시톨, 피리독신-HCl 및 티아민-HCl을 포함할 수 있으나, 이에 한정되지 않는다.
[표 2]
비타민 스톡 용액
Figure 112012080180037-pct00003
본 발명의 미생물은 뱃치(batch), 유가-뱃치(fed-batch), 세포 재순환(cell recycle), 및 연속을 포함하나, 이에 한정되지 않는 통상의 발효 양식으로 배양할 수 있다. 일부 양태에서, 발효는 유가-뱃치 방식으로 수행된다. 이러한 경우에, 발효 동안 배지 중 성분의 일부가 고갈된다. 발효를 비교적 높은 농도의 이러한 성분들을 사용하여 개시함으로써 성장이, 첨가가 요구되기 전 일정 시간의 기간 동안 지지되도록 할 수 있다. 이들 성분의 바람직한 범위는 발효에 의해 농도가 고갈될 때 첨가함으로써 발효 전체에서 유지된다. 발효 배지 속 성분들의 수준은 예를 들면, 발효 배지를 주기적으로 시료채취하여 농도를 검정함으로써 모니터링할 수 있다. 대안적으로, 일단 표준 발효 과정이 전개되면, 첨가를 발효 전체에서 특정 시간에 공지된 수준에 상응하는 시간 간격에서 이룰 수 있다. 당해 분야의 숙련가에 의해 인식될 바와 같이, 영양물 소비 속도는, 배지의 세포 밀도가 증가함에 따라, 발효 동안 증가한다. 또한, 발효 배지내로 외부 미생물의 도입을 피하기 위하여, 당해 분야에 공지된 바와 같이, 첨가를 혐기성 첨가 방법을 사용하여 수행한다. 또한, 소량의 소포제를 발효 동안 가할 수 있다.
발효 배지의 온도는 콘드로이틴의 성장 및 생산에 적합한 임의의 온도일 수 있다. 예를 들면, 발효 배지에 접종물로 접종하기 전에, 발효 배지를 20℃ 내지 45℃, 25℃ 내지 40℃, 또는 28℃ 내지 32℃의 범위내의 온도에서 유지시킬 수 있다.
발효 배지의 pH는 발효 배지에 산 또는 염기를 첨가함으로써 조절할 수 있다. 암모니아를 사용하여 pH를 조절하는 경우, 이는 발효 배지 속에서 질소원으로서 편리하게 작용한다. 일부 양태에서, pH는 3.0 내지 8.0, 5.5 내지 7.5, 또는 6.0 내지 7에서 유지된다.
발효 배지는 또한 발효 과정 동안 일정한 용존 산소 함량을 갖도록 유지함으로써 세포 성장을 유지하고 콘드로이틴의 생산을 위한 세포 대사를 유지할 수 있다. 발효 배지 중 산소 농도는 산소 전극의 사용을 통해서와 같은, 공지된 방법을 사용하여 모니터링할 수 있다. 산소는 발효 배지에 당해 분야에 공지된 방법을 사용하여, 예를 들면, 교반, 진탕 또는 살포(sparging)에 의한 배지의 교반 및 통기를 통해 가할 수 있다. 일부 양태에서, 발효 배지 중의 산소 농도는 대기압 및 20℃ 내지 40℃ 범위의 온도에서 발효 배지 중의 산소의 용해도를 기준으로 하여 배지 속 산소의 포화 값의 10% 내지 200%의 범위내에 있다. 그러나, 발효에 부정적으로 영향을 미치지 않으면서, 발효 동안 산소 농도가 주기적으로 당해 범위 미만으로 내려갈 수 있다.
배지의 통기가 공기의 사용과 관련하여 본원에 기술되어 있다고 해도, 다른 산소원을 사용할 수 있다. 주변 공기 중의 산소의 용적분률보다 높은 산소의 용적분률을 함유하는 통기 가스의 사용이 특히 유용하다. 또한, 이러한 통기 가스는 발효에 부정적으로 영향을 미치지 않는 다른 가스를 포함할 수 있다.
본 발명의 발효 공정의 양태에서, 발효 배지는 위에서 기술한 바와 같이 제조된다. 당해 발효 배지는 합리적인 성장 기간 후, 고 세포 밀도를 생산하기에 충분한 양의, 본 발명의 유전적으로 변형된 미생물의 활성적으로 성장하는 배양물로 접종된다. 대표적인 접종 세포 밀도는, 세포의 무수 중량을 기준으로 하여, 0.001 g/L 내지 10 g/L, 0.01 g/L 내지 5 g/L, 또는 0.05 g/L 내지 1.0 g/L의 범위이내이다. 그러나, 생산 규모 발효기에서, 보다 높은 접종 세포 밀도가 바람직하다. 이후에, 세포를 10 g/L 내지 150 g/L, 20 g/L 내지 80 g/L, 또는 50 g/L 내지 70 g/L 범위의 세포 밀도로 성장시킨다. 발효 동안 목적하는 세포 밀도에 이르기 위한 미생물에 대한 잔류 시간은 전형적으로 200 시간 미만, 120 시간 미만, 또는 96시간 미만이다.
본 발명의 작동 중 하나의 방식에서, 발효 배지 속 글리세린 농도와 같은 탄소원 농도는 발효 동안 모니터링된다. 발효 배지 속 글리세린 농도는 예를 들면, 발효 배지의 무세포(cell-free) 성분인, 상층액 중 글리세린 농도를 모니터하는데 사용될 수 있는, 예를 들면, 고압 액체 크로마토그래피의 사용과 같은 공지된 기술을 사용하여 모니터링할 수 있다. 앞서 기술한 바와 같이, 탄소원 농도는, 세포 성장 억제가 일어나는 수준 미만에서 유지되어야 한다. 비록 이러한 농도가 유기체간에 변할 수 있다고 해도, 탄소원으로서 글리세린의 경우, 세포 성장 억제는 약 60 g/L 보다 큰 글리세린 농도에서 발생하며, 시도에 의해 용이하게 측정될 수 있다. 따라서, 글리세린이 탄소원으로 사용되는 경우 글리세린은 바람직하게는 발효기에 공급되어 검출 한계 미만에서 유지된다. 대안적으로, 발효 배지 속 글리세린 농도는 1 g/L 내지 100 g/L, 2 g/L 내지 50 g/L, 또는 5 g/L 내지 20 g/L의 범위에서 유지된다. 비록 탄소원 농도가 예를 들면, 실질적으로 순수한 글리세린 용액의 첨가에 의해 목적한 수준내에서 유지될 수 있다고 해도, 원래의 발효 배지의 분취량의 첨가에 의해 발효 배지의 탄소원 농도를 유지하는 것이 허용될 수 있다. 원래의 발효 배지의 분취량의 사용은, 배지 속 다른 영양물(예를 들면, 질소 및 인산염 공급원)의 농도가 동시에 유지될 수 있으므로 바람직할 수 있다. 유사하게, 미량의 금속 농도는 미량의 금속 용액의 분취량을 가함에 의해 발효 배지 속에서 유지될 수 있다.
콘드로이틴 회수
일단 콘드로이틴이 발효 방법에 의해 생산되면, 이는 후속적인 사용을 위해 회수할 수 있다. 본 발명자들은, 콘드로이틴이 배양 배지 속에 무세포 형태("분비된 콘드로이틴")으로 존재할 수 있고/있거나 세포와 연합될 수 있음을 밝혀내었다. 세포와 연합되는 콘드로이틴은 세포 표면("세포-표면 콘드로이틴")과 연합될 수 있고/있거나 세포내에("세포내 콘드로이틴") 유지될 수 있다.
"분비된 콘드로이틴"과 관련하여, 콘드로이틴의 회수는 세포 제거 후 무세포 배양 배지의 알코올 침전에 의해, 또는 무수 분말을 수득하기 위한 무세포 배양 배지의 동결건조를 포함하나, 이에 한정되지 않는, 당해 분야에 공지된 어떠한 기술에 의해 달성될 수 있다.
"세포-표면 콘드로이틴'과 관련하여, 콘드로이틴의 회수는 세포 표면으로부터 콘드로이틴을 탈착시키는 단계 후 유리 콘드로이틴을 함유하는 배양 배지로부터 세포를 제거하는 세포 제거 단계를 추가로 포함할 수 있다. "세포내 콘드로이틴"과 관련하여, 회수는 또한 세포를 침투시키거나 분해하는 단계 후, 분해되거나 침투된 세포를 유리된 콘드로이틴을 이제 함유하는 배양 배지로부터 제거함을 달성하는 단계를 포함할 수 있다. 콘드로이틴은 배양 배지의 알코올 침전, 또는 무수 분말을 수득하기 위한 배양 배지의 동결건조를 포함하나, 이에 한정되지 않는 당해 분야에 공지된 어떠한 기술에 의해 배양 배지로부터 회수할 수 있다.
또한, 회수된 콘드로이틴 중합체를 해중합하여 중합체의 분자량을 감소시킬 수 있다. 콘드로이틴의 해중합은 산성 해중합을 포함하나, 이에 한정되지 않는, 당해 분야에 공지된 어떠한 기술에 의해서도 달성할 수 있다(참조: 예를 들면, Tommeraas and Melander, Biomacromolecules 2008;9:1535-1540). 회수된 콘드로이틴은 예를 들면, 해중합되어 동물-유래된 콘드로이틴과 유사하거나 동일한 분자량을 갖는 콘드로이틴을 생산하고/하거나 회수된 황산화되지 않은 콘드로이틴의 황산화를 보조할 수 있다. 예를 들면, 회수된 콘드로이틴은 해중합되어 분자량이 5 kDa 내지 100 kDa, 바람직하게는, 10 kDa 내지 70 kDa, 보다 바람직하게는, 20 kDa 내지 40 kDa인 중합체를 수득할 수 있다.
다음의 정의 및 약어는 특허청구범위 및 명세서의 해석에 사용되어야 한다.
본원에 사용된 것으로서 용어 "유전자"는, 선택적으로 코딩 서열의 선행(5' 비-코딩 서열) 및 후행(3' 비코딩 서열) 조절서열을 포함하는, 특정 단백질로 발현될 수 있는 핵산 단편(또는 폴리뉴클레오타이드)을 말한다. "천연 유전자"는 이의 자체의 조절 서열과 함께 천연에서 발견되는 유전자를 말한다. "내인성 유전자"는 유기체의 게놈내 이의 천연 위치내 천연 유전자를 말한다.
본원에 사용된 것으로서, 용어 "코딩 서열"은 특정 아미노산 서열을 코딩하는 DNA 서열을 말한다.
"적합한 조절 서열"은 코딩 서열의 상부(5' 비-코딩 서열), 당해 서열내, 또는 하부(downstream)(3' 비-코딩 서열)에 위치하며 전사, RNA 프로세싱 또는 안전성, 또는 연합된 코딩 서열의 해독에 영향을 미치는 뉴클레오타이드 서열을 말한다. 조절 서열은 프로모터, 해독 리더 서열, 인트론, 폴리아데닐화 인식 서열, RNA 프로세싱 부위, 효과기 결합 부위 및 스템-루프 구조(stem-loop structure)를 포함할 수 있다.
용어 "프로모터"는 코딩 서열 또는 기능성 RNA의 발현을 조절할 수 있는 DNA 서열을 말한다. 일반적으로, 코딩 서열은 프로모터 서열에 대해 3'에 위치한다. 프로모터는 천연 유전자로부터 그 전체가 유래될 수 있거나, 천연에서 발견된 상이한 프로모터로부터 유래된 상이한 성분으로 구성되거나, 심지어 합성 DNA 분절을 포함할 수 있다. 상이한 프로모터가 상이한 조직 또는 세포 유형, 또는 발달의 상이한 단계, 또는 상이한 환경적 또는 생리학적 상태에 대한 반응시 유전자의 발현을 지시할 수 있음은 당해 분야의 숙련가에 의해 이해된다. 유전자가 대부분의 시간에 대부분의 세포 유형에서 발현되도록 하는 프로모터는 "구성적 프로모터"로 일반적으로 언급된다. 대부분의 경우 조절 서열의 정확한 경계는 완전히 정의되지 않으므로, 상이한 길이의 DNA 단편이 동일한 프로모터 활성을 가질 수 있음이 또한 인식된다.
본원에 사용된 것으로서, 용어 "발현"은 본 발명의 핵산 단편으로부터 유래된 센스(mRNA) 또는 안티센스 RNA의 전사 및 안정한 축적을 말한다. 발현은 또한 mRNA의 폴리펩타이드로의 해독을 말할 수 있다.
본원에 사용된 것으로서, 용어 "형질전환"은 숙주 유기체 내로 핵산 단편이 전달되어 유전적으로 안정한 유전을 생성함을 말한다. 형질전환된 핵산 단편을 함유하는 숙주 유기체는 "트랜스제닉" 또는 "재조합" 또는 "형질전환된" 유기체로 언급된다.
용어 "작제물", "플라스미드", "벡터" 및 "카세트"는 세포의 중심 대사의 일부가 아니며, 일반적으로 환형, 또는 선형, 이본쇄 DNA 단편의 형태인 유전자를 흔히 수반하는 염색체외 성분을 말한다. 이러한 성분은 어떠한 공급원으로부터 유래된, 일본쇄 또는 이본쇄 DNA 또는 RNA의 자가 복제하는 게놈 서열, 통합 서열, 파아지 또는 뉴클레오타이드 서열일 수 있으며, 여기서 다수의 뉴클레오타이드 서열은 적절한 3' 해독되지 않은 서열과 함께 선택된 유전자 생성물에 대한 프로모터 단편 및 DNA 서열을 세포내로 도입할 수 있는 유일한 작제물로 결합되거나 재조합된다.
본원에 사용된 것으로서, 용어 "코돈 축퇴성(codon degeneracy)"은 인코딩된 폴리펩타이드의 아미노산 서열내 변화없이 뉴클레오타이드 서열의 변이를 허용하는 유전 코드의 특성을 말한다. 당해 분야의 숙련가는 주어진 아미노산을 특정하기 위하여 뉴클레오타이드 코돈의 사용시 특정 숙주 세포에 의해 나타난 "코돈-성향(condon-bias)"을 잘 인식한다. 따라서, 숙주 세포내에서 개선된 발현을 위해 유전자를 합성하는 경우, 코돈 사용빈도의 이의 빈도가 숙주 세포의 바람직한 코돈 사용빈도의 빈도에 근접하도록 유전자를 설계하는 것이 바람직할 수 있다.
용어 "코돈-최적화된"은, 이것이 각종 숙주의 형질전환을 위한 핵산 분자의 유전자 또는 코딩 영역을 언급할 경우, DNA에 의해 인코딩된 폴리펩타이드를 변경하지 않고 숙주 유기체의 대표적인 코돈 사용빈도를 반영하기 위한 핵산 분자의 유전자 또는 코딩 영역내 코돈의 변형을 말한다.
용어 "작동적으로 연결된"은 하나의 기능이 다른 것에 의해 영향받도록 하는 단일 핵산 단편위의 핵산 서열의 연합을 말한다. 예를 들면, 프로모터는, 이것이 이러한 코딩 서열의 발현에 영향을 미칠 수 있는 경우(즉, 코딩 서열이 프로모터의 전사 조절하에 있음) 코딩 서열과 작동적으로 연결되어 있다. 코딩 서열은 센스 또는 안티센스 배향으로 조절 서열에 작동적으로 연결될 수 있다.
본원에 사용된 표준 재조합 DNA 및 분자 클로닝 기술은 당해 분야에 잘 공지되어 있으며 문헌[참조: Sambrook, J., Fritsch, E. F. and Maniatis, T., Molecular Cloning: A Laboratory Manual, Second Edition, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY (1989) (hereinafter "Maniatis"); and by Silhavy, T. J., Bennan, M. L. and Enquist, L. W., Experiments with 유전자 Fusions, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY (1984); and by Ausubel, F. M. et al., Current Protocols in Molecular Biology, published by Greene Publishing Assoc. and Wiley-Interscience (1987)]에 기술되어 있다. 이들 문헌 각각은, 이의 전문이 본원에 참조로 통합된다.
본 발명의 추가의 목적, 이점 및 신규 특징은 본원의 다음 실시예들의 시험시 당해 분야의 숙련가에게 명백해질 것이며, 이들 실시예는 제한하는 것으로 의도되지 않는다.
실시예
실시예 1
K4 캡슐 생합성의 유전학
에스케리키아 콜라이 K4 캡슐은 "2 군" 캡슐로 분류된다. 휘트필드(Whitfield)에 의해 고찰된 바와 같이(참조: Annu Rev Biochem. 2006; 75:39-68), 에스케리키아 콜라이 2 군 캡슐의 합성은 3개 영역으로 이루어진 일반적인 유전적 구조를 지닌 유전자 클러스터에 의해 인코딩된 단백질의 세트에 의해 지시된다. 에스케리키아 콜라이 K4 캡슐 유전자 클러스터의 예측된 구조(본 발명 이전)은 도 2에 나타낸다. 영역 1은 6개의 유전자, kpsFEDUCS를 함유하는 것으로 예측되었으며, 영역 3은 2개의 유전자, kpsM 및 kpsT를 함유하는 것으로 예측되었다. 공지된 단백질과의 서열 상동성을 기초로 하여, kpsF 및 kpsU 유전자는 당 뉴클레오타이드 CMP-Kdo의 생합성시 단계들을 촉매하는 단백질을 인코딩하는 것으로 예측되었다. 에스케리키아 콜라이내 2 군 캡슐의 CMP-Kdo 생합성의 역활이 제안되어 왔으나(참조: Roberts, Annu. Rev. Microbiol. 1996; 50:285-315) 실험적으로 입증되어 있지 않다(참조: Whitfield, Annu Rev Biochem. 2006; 75:39-68). kpsM, kpsT, kpsD, kpsE, kpsC 및 kpsS 유전자는 당 전구체의 중합이 발생하는 세포 세포질로부터 성숙한 캡슐 다당류가 외부 세포 막의 지질 성분에 대한 공유 결합을 통해 외부 세포 막에 고정된 것으로 여겨지는 세포 표면으로의 캡슐 다당류의 전좌에 요구되는 단백질을 인코딩하는 것으로 예상되었다(참조: Roberts, Annu. Rev. Microbiol. 1996;50:285-315; Whitfield, Annu Rev Biochem. 2006;75:39-68). 에스케리키아 콜라이 K4 캡슐의 경우, 대부분 에스케리키아 콜라이 2 군 캡슐에 대해서와 같이, 다당류와 캡슐의 지질 성분 사이의 공유 결합의 구조는 실험적으로 측정되지 않았다. 더우기, 지질 성분의 실체는 알려져 있지 않다. 영역 1 및 영역 3 유전자, 및 이들이 인코딩하는 단백질은 매우 다양한 다당류 조성 및 구조를 갖는 캡슐을 생산하는 에스케리키아 콜라이 균주 중에서 고도로 보존된다(참조: Whitfield, Annu Rev Biochem. 2006;75:39-68). 에스케리키아 콜라이내 2 군 캡슐 클러스터의 영역 2에 함유된 유전자는 당 뉴클레오타이드 전구체 생합성 및 이들 전구체의 중합을 위한 효소를 코딩하는 유전자를 포함함으로써, 영역 2는 캡슐 다당류의 구조를 결정한다. 에스케리키아 콜라이내 2 군 캡슐 클러스터의 영역 2내 다른 유전자는, 기능이 공지되어 있지 않고 캡슐 생합성에 있어 역활을 갖는 것으로 입증되어 있지 않은 단백질을 인코딩한다. 니노미야(Ninomiya) 등이 기술한 바와 같이(참조: J. Biol. Chem. 2002;277:21567-21575, GenBank AB079602), 에스케리키아 콜라이 K4 캡슐 유전자 클러스터의 영역 2의 서열은 단백질을 인코딩하는 것으로 예측된 7개의 주석이 달린 개방 판독 프레임(kfoABCDEFG)을 함유한다. 삽입 성분, IS2는 유전자 kfoC와 kfoD 사이에 위치한다.
K4 캡슐 생합성 유전자에 대한 합성 코딩 서열의 설계시 예비 단계로서, 각각의 유전자 쌍을 분리하는 유전자간 서열을 검사하였다. 당해 서열 분석을 기초로 하여, 당해 영역내에, 발현되고 캡슐 생합성에 잠재적으로 관련될 가능성이 있는 단백질을 인코딩하는 적어도 2개의 추가의 개방-판독-프레임(open-reading-frames: ORF)이 존재한 것으로 여겨졌다. 니노미야 등의 서열을 기본으로 하여, 다음의 유전자간 거리를 수득하였다: kfoA-kfoB: 186 bp; kfoB-kfoC: 297 bp; kfoC-IS2: 29 bp; IS2-kfoD: 9 bp; kfoD-kfoE: 389 bp; kfoE-kfoF: 818 bp; kfoF-k foG: 431 bp. 하나의 개방 판독 프레임은 각각의 3개의 최대 유전자간 영역내에서 확인되었다.
대부분의 kfoD-kfoE 영역은 kfoD의 정지 코돈 후 10개 뉴클레오타이드에서 개시하여 kfoE의 코딩 영역내에서 종결하는, "ORF3"로 명명된 390 bp ORF에 의해 포함된다. 즉, 추정적인 orf3 유전자는 10개 뉴클레오타이드에 의해 kfoE 유전자와 중첩한다. 당해 ORF는 ATG에 의해 개시하며 제2의 가능한 ATG 출발점은 9bp 하부에 인프레임으로(in frame) 위치한다. 이들 가능한 출발 둘다는 인식가능한 샤인-달가노(Shine-Dalgarno: SD) 서열(참조: Shine and Dalgarno Proc. Natl. Acad. Sci. U S A. 1974;71:1342-6)을 결실하고 있다. orf3의 단백질 생성물이 BLAST 조사에서 사용된 경우, 8개의 "우수한" 히트(hit), 즉, > 138의 점수, < 3e-31의 E 값이 수득되었다. 이들 히트 중 2개는 캡슐 생합성을 위한 유전자 클러스터내에 위치한 파스퇴렐라 물토시다 유전자(bcbF & ecbF)에 의해 인코딩된 단백질에 대한 것이었다. 이들 파스퇴렐라 물토시다 캡슐 유전자 클러스터는 도 3a에 본 발명자에 의해 분석된 대로 니노미야 등의 서열에 따라 K4 영역 2 유전자와 함께, 도표화되어 있다. Orf3, BcbF 및 EcbF 단백질에 대한 단백질 서열의 정렬은 도 3b에 나타낸다. 이들 파스퇴렐라 물토시다 서열은 혈청형 B 균주(M1404) 및 혈청형 E 균주(P1234) 각각으로부터 온다. 혈청형 E 캡슐의 조성은 알려져 있지 않지만 혈청형 B 캡슐은 만노즈, 갈락토즈 및 아라비노즈로 구성된 것으로 보고되어 있으나 구조는 보고되어 있지 않다(참조: Townsend et al., J. Clin. Microbiol. 2001;39:924-929).
kfoE-kfoF 영역내에서, "ORF1"으로 명명된 630 bp ORF가 도 3a에 나타난 대로 존재한다. 당해 ORF에 대한 ATG 출발 코돈은 kfoE 유전자의 상부의 TGA 정지 코돈과 중첩된다. KfoE에 대한 코딩 서열내 당해 ATG의 상부의 7개 염기 쌍, 강력한 SD 서열(AGGAGG)이 존재한다. 따라서, 당해 ORF가 발현되어야 하는 환경적 증거는 강력하다. ORF1에 의해 코딩된 단백질에 대한 BLAST 결과는 ORF3를 사용하여 수득된 파스퇴렐라 물토시다 유전자 히트에 근접한 파스퇴렐라 물토시다 유전자(bcbE & ecbE)에 대한 강력한 히트를 포함한다. 즉, K4 클러스터의 추정적인 ORF 1 및 3 둘 다는 캡슐 다당류를 인코딩하는 2개의 파스퇴렐라 물토시다 유전자 클러스터내에 상동체를 갖는다. ORF1, BcbE 및 EcbE 단백질 서열의 정렬은 도 3b에 나타낸다.
kfoF-kfoG 영역에서, "ORF2"로 명명된 384 bp ORF가 존재한다. 당해 ORF의 ATG 개시 코돈은 약한 SD 서열을 제공할 수 있는 GG 서열 15 bp 상부 이후에 온다. 당해 단백질 서열을 사용한 BLAST 조사에서 유의적인 히트는 발견되지 않았다. 이는, 당해 ORF가 실제 생산되는 폴리펩타이드를 인코딩하지 않을 수 있음을 제안하였다.
영역 2로부터의 2개의 다른 K4 캡슐 클러스터 유전자(kfoD 및 kfoE)는 파스퇴렐라 물토시다 P1234 및 파스퇴렐라 물토시다 M1404 캡슐 유전자 클러스터내에 위치하는 피, 물토시다 유전자에 대해 상동성을 갖는 것에 주목하는 것이 흥미롭다. kfoD에 의해 인코딩된 단백질은 EcbD 및 BcbD와 상동성을 공유하며 유사하게 kfoE 유전자 생성물은 EcbG 및 BcbG와 상동성을 공유한다. 따라서, 도 3a에 나타낸 바와 같이, 4개의 인접한 K4 유전자(kfoD, orf3, kfoE, orf1)는 인접한 파스퇴렐라 물토시다 혈청형 B 유전자 bcbDEFG 및 파스퇴렐라 물토시다 혈청형 E 유전자 ecbDEFG 중에서 상동체를 갖는다. 위에 나타낸 바와 같이, 이들 2개의 파스퇴렐라 균주는 콘드로이틴 생산자가 아니며 K4 유전자 kfoD, orf3, kfoE, orf1이 콘드로이틴 생합성에 역활을 하는 경우 역활은 본 발명 이전에 알려져 있지 않았다.
K4내의 kfoD, orf3, kfoE, orf1 유전자 세트는 IS2가 바로 앞에(9bp) 선행한다는 사실은 이들의 기원 및 콘드로이틴 캡슐 합성시 역활과 관련된 다수의 가능성을 유발한다. 이론에 얽매이지 않고, 본 발명자들은, K4 영역 2 유전자 클러스터가 IS2-매개된 재조합/삽입을 통해 kfoABCFG로 구성된 모(parental) 콘드로이틴-생산 클러스터로 유발되는 것으로 고려한다. 또한, 본 발명자들은, kfoD, orf3, kfoE orf1 유전자가 콘드로이틴 골격의 프럭토실화에 관여할 수 있다고 가설을 세웠다. 프럭토실화는 파스퇴렐라 물토시다 혈청형 F 캡슐과 에스케리키아 콜라이 K4 캡슐 사이의 하나의 명백한 구조적 차이이다. 2개 사이의 유전적 구조에 있어서 유의적인 차이, 즉, kfoD, orf3, kfoE, orf1 유전자 세트의 존재 또는 부재는 이러한 구조적 차이의 반영임이 가능하다. 파스퇴렐라 물토시다 콘드로이틴-생산 혈청형 F 균주 P4182의 캡슐 생합성 유전자 클러스터와 유사하게(참조: Townsend et al., J. Clin. Microbiol. 2001;39:924-929), 콘드로이틴 골격의 생산을 위한 유일한 관련된 K4 영역 2 유전자가 kfoA, kfoB, kfoC, kfoF 및 kfoG일 수 있음은 가능할 수 있다. 실시예 6 및 7에 기술된 바와 같이, 본 발명자들은, kfoD, orf3, kfoE orf1 유전자가 콘드로이틴의 생산에 필요하지 않으며 이들 유전자들 중 하나 이상은 콘드로이틴의 프럭토실화에 필수적임을 확인하였다.
K4 캡슐 생합성 유전자에 대한 합성 코딩 서열을 설계하기 전에 니노미야 등의 서열을 확인하기 위하여, 본 발명자들은 ATCC로부터 입수한 에스케리키아 콜라이 K4 균주 ATCC 23502로부터의 K4 캡슐 유전자 클러스터의 영역 2를 서열분석하였다. 게놈 DNA를 퀴아젠 게놈 DNA 키트(Qiagen Genomic DNA Kit)(제조원: Qiagen Inc., 미국 캘리포니아주 발렌시아 소재)를 사용하여 ATCC 균주 23502의 새로운 밤새 배양물로부터 판매회사의 프로토콜에 따라 제조하였다. 20 게이지 바늘을 통한 통과(5회)에 의해 전단된 게놈 DNA의 분취량을 PCR 반응에서 주형으로 사용하여 크기가 2.2 kB 내지 2.7 kB의 범위인 6개의 중첩된 PCR 생성물의 시리즈를 생산하였다. PCR 반응의 생성물을 퀴아젠 퀴아퀵 PCR 정제 키트(Qiagen QIAquick PCR Purification Kit)를 사용하여 판매회사 프로토콜에 따라 정제하여 상업적 판매회사(Biotechnology Resource Center, DNA Sequencing Facility, Cornell University, 미국 뉴욕 이타카 소재)에 DNA 서열 측정을 위해 보냈다. 이들 6개의 중첩 PCR 생성물의 서열은 니노미야 등(2002)에 의해 측정된 대로 영역 2 서열에 걸쳐 있었다. 전체적으로 본 발명자들에 의해 측정된 서열과 니노미야 등에 의해 보고된 서열이 99.8% 유사성으로 일치하였다. 그러나, 26번 위치에서 치환, 결실 및 삽입을 포함하는 단일 염기쌍 차이가 존재하였다. 이들 차이들 중의 일부는 유전자 클러스터에 의해 코딩된 영역 2 단백질의 예측된 아미노산 서열내 실질적인 차이를 초래하였다. 관찰된 뉴클레오타이드 서열 차이 및 예측된 단백질 서열에서 수득되는 효과는 도 4a 및 4b에 나타낸다.
K4 캡슐 생합성 유전자의 정확한 서열을 결정하기 위하여, 에스케리키아 콜라이 혈청형 K4 균주 U1-41을 스타텐스 혈청 연구소(Statens Serum Institut)(덴마크 코펜하겐 소재)로부터 입수하였다. U1-41은 ATCC 23502 균주의 조상이며 K4 다당류의 구조적 측정을 위해 사용된 다당류 제제를 생산하기 위해 사용되었다(참조: Rodriguez et al., 1988). 에스케리키아 콜라이 U1-41내 K4 캡슐 유전자 클러스터의 영역 1, 2 및 3에 걸친 대략 23 kb의 DNA의 서열을 측정하였다. 당해 서열(서열 번호 117)은 영역 1의 kpsF 유전자의 ATG 해독 개시 코돈 상부의 125bp로부터 영역 3의 kpsM 유전자의 ATG 해독 개시 코돈 상부의 110bp 까지의 영역에 걸친 23,230개 염기 쌍으로 이루어진다.
서열 결정을 위해, 게놈 DNA를 에스케리키아 콜라이 U1-41의 새로운 밤샘 배양물로부터 퀴아젠 게놈 DNA 키트(Qiagen Genomic DNA Kit)(제조원: Qiagen Inc., 미국 캘리포니아주 발렌시아 소재)를 사용하여 판매회사의 프로코콜에 따라 제조하였다. 20 게이지 바늘을 통한 통과(5회)에 의해 전단된 게놈 DNA의 분취량을 PCR 반응에서 주형으로 사용하여 크기가 2.1 kB 내지 2.8 kB 범위의 11개의 중첩된 PCR 생성물의 시리즈를 생산하였다. 본원에서 반응물 1 내지 11로 명명된 이들 PCR 반응은 다음 올리고뉴클레오타이드 프라이머를 사용하였다: 반응 1; (DHD089 및 DHD090), 반응 2; (DHD091 및 DHD092), 반응 3; (DHD093 및 DHD175), 반응 4; (DHD120 및 DHD096), 반응 5; (DHD097 및 DHD098), 반응 6; (DHD099 및 DHD100), 반응 7; (DHD101 및 DHD102), 반응 8; (DHD103 및 DHD104), 반응 9; (DHD105 및 DHD106), 반응 10; (DHD162 및 DHD108), 반응 11; (DHD169 및 DHD110). 이들 프라이머의 서열은 하기 나타낸다.
DHD089 5> GCACCTCCATGAGACATTGC >3 (서열 번호 118)
DHD090 5> CCACTGCCATACGGTTTAGC >3 (서열 번호 119)
DHD091 5> GCTTGCCTTTGCAGAAACGG >3 (서열 번호 120)
DHD092 5> CCAACAATATCGAGCAGTGG >3 (서열 번호 121)
DHD093 5> GTCATTCGTCAGAACGGTGC >3 (서열 번호 122)
DHD175 5> CCAGTGCCTGATAATCAGC >3 (서열 번호 123)
DHD120 5> GGCTTAACGCTGTGGAAGTC >3 (서열 번호 124)
DHD096 5> ATATTGGGATTCCTGGTCGC >3 (서열 번호 125)
DHD097 5> ACGACATCAAAGGCTTGACG >3 (서열 번호 126)
DHD098 5> ATAGCCCTGAAGCTGAAGCC >3 (서열 번호 127)
DHD099 5> CGAGTGATTGCTTGGTATCC >3 (서열 번호 128)
DHD100 5> AAACGATTGAGCGGGTTAGC >3 (서열 번호 129)
DHD101 5> AGAGTGGTTCAATCCTCTGG >3 (서열 번호 130)
DHD102 5> TGTCTTGGCTAATGCTGACG >3 (서열 번호 131)
DHD103 5> CGAGTAGTTATCTGGCTCTG >3 (서열 번호 132)
DHD104 5> GTCAGTTAGACTCTGATGAC >3 (서열 번호 133)
DHD105 5> CTTGAACGGTCCAACTTCAC >3 (서열 번호 134)
DHD106 5> AGTTCAGGAGCTTGAATGCG >3 (서열 번호 135)
DHD162 5> TTCGCACGCATTTATAGCCG >3 (서열 번호 136)
DHD108 5> TCATCTTGCGAGAGCATTCG >3 (서열 번호 137)
DHD169 5> CTTCCGCTAAATCCATTACG >3 (서열 번호 138)
DHD110 5> AGATCTATTTATCCCTGCGG >3 (서열 번호 139)
PCR 반응 1, 2, 3, 7, 8, 9, 10 및 11은 PfuUltra II 폴리머라제(제조원: Stratagene, 미국 캘리포니아주 라 졸라 소재)를 사용하여 판매회사 프로토콜에 따라 수행하였다. 각각의 100μL 반응물에서, Pfu 반응 완충액(판매회사에 의해 공급됨)을 1X의 최종 농도로 가하고, 프라이머를 각각 0.4μM의 최종 농도로 가하고, dNTP를 각각 250μM의 최종 농도에서 가하고 100 ng의 U1-41 게놈 DNA를 주형으로서 가하였다. PCR 반응을 Perkin-Elmer GeneAmp 2400 열순환기 속에서 다음 주기 매개변수를 사용하여 수행하였다: 95℃에서 2분의 1 주기; 95℃에서 20초, 55℃에서 20초, 및 72℃에서 40초의 35 주기; 72℃에서 3분의 1주기; 및 4℃에서 유지. PCR 반응 4, 5 및 6을 하기의 예외들과 함께 상기와 같이 수행하였다. 반응 5 및 6의 경우에, 프라이머를 각각 0.5μM의 최종 농도로 가하고 어닐링 단계(annealing step)를 55℃ 대신 60℃에서 수행하였다. 반응 4의 경우에, 프라이머를 각각 0.5μM의 최종 농도로 가하고 PCR 반응을 RoboCycler® 구배 96 열순환기(제조원: Stratagene, 미국 캘리포니아주 라 졸라 소재) 속에서 다음의 주기 매개변수를 사용하여 수행하였다: 95℃에서 1분의 1 주기; 95℃에서 30초, 52℃에서 30초, 및 72℃에서 1분의 35 주기; 72℃에서 5분의 1 주기; 및 6℃에서 유지.
PCR 반응 1, 2, 3, 7, 8, 9, 10 및 11의 생성물을 퀴아젠 퀴아퀵 PCR 정제 키트(Qiagen QIAquick PCR Purification Kit)(제조원: QIAGEN, 미국 캘리포니아주 발렌시아 소재)를 사용하여 판매회사의 프로토콜에 따라 정제하고, 100μL의 EB 용출 완충액 속에 회수한 후, 서열분석 반응용 주형으로 사용하였다. PCR 반응 4, 5 및 6의 생성물을 퀴아젠 퀴아퀵 PCR 정제 키트(제조원: QIAGEN, 미국 캘리포니아주 발렌시아가 소재)를 사용하여 판매회사 프로토콜에 따라 정제한 후 예비(preparative) 아가로즈 겔 전기영동에 의해 추가로 정제하였다. 단편들을 퀴아퀵 겔 추출 키트(QIAquick Gel Extraction Kit)(제조원: QIAGEN Inc., 미국 캘리포니아주 발렌시아가 소재)를 사용하여 판매회사 프로토콜에 따라 겔 슬라이스(gel slice)로부터 용출하고 100μL의 EB 용출 완충액 속에 회수하였다. 겔-정제된 단편을 서열분석 반응을 위한 주형으로 제공하였다. 반응 1 내지 11의 정제된 PCR 생성물을 상업 판매회사(Cornell University Life Sciences Core Laboratories Center, Cornell University, 미국 뉴욕주 이타카 소재)로 DNA 서열분석 측정을 위해 보냈다. 이들 11개의 중첩 PCR 생성물로부터 수득된 서열은 니노미야 등(2002)에 의해 측정된 바와 같이 영역 2 서열에 걸쳐 있고 또한 영역 1 및 영역 3 유전자 모두를 포함하였다.
U1-41로부터의 K4 캡슐 유전자 클러스터의 서열은 에스케리키아 콜라이내 2 군 캡슐 유전자 클러스터에 대해 전형적인 것으로서 영역 1내 kpsF, kpsE, kpsD, kpsU, kpsC 및 kpsS 유전자의 존재를 입증한다. U1-41 KpsF, KpsE, KpsD, KpsU, KpsC 및 KpsS 단백질의 예측된 아미노산 서열은 다른 에스케리키아 콜라이 2 군 캡슐 생산인자에 의해 인코딩된 이들 단백질의 서열에 대해 상동성이다. 이들은 모두 이들 단백질에 대한 컨센수스(consensus) 서열에 대해 및 에스케리키아 콜라이 니슬(Escherichia coli Nissle) 1917(혈청형 K5) KpsF, KpsE, KpsD, KpsU, KpsC 및 KpsS 서열에 대해 >95% 동일성을 나타낸다(참조: Grozdanov et al., J. Bacteriol. 2004;186:5432-41). 당해 서열은 또한 에스케리키아 콜라이내 2 군 캡슐 유전자 클러스터에 대해 전형적인 것으로서 영역 3내 kpsM 및 kpsT 유전자의 존재를 나타낸다. U1-41 KpsM 및 KpsT 단백질의 예측된 아미노산 서열은 다른 에스케리키아 콜라이 2 군 캡슐 생산인자에 의해 인코딩된 이들 단백질의 서열에 대해 상동성이다. 이들은 모두 이들 단백질에 대한 컨센수스 서열에 대해 및 에스케리키아 콜라이 니슬 1917(혈청형 K5) KpsM 및 KpsT 서열에 대해 >90% 동일성을 나타낸다.
U1-41 DNA 서열은 니노미야 등의 영역 2 서열에 대해 및 ATCC 23502의 영역 2에 대해 본 발명자들에 의해 결정된 서열에 대해 정렬될 수 있는 대략 13.5 kb 영역 2 분절을 포함한다. U1-41 서열 및 ATCC 23502의 영역 2에 대해 본 발명자들에 의해 결정된 서열은 이들 스패닝 영역에 걸쳐 동일하다. 폴리펩타이드로서 발현될 것으로 예측된 9개의 개방 판독 프레임(ORF)은 IS2 서열을 배제하고, 확인된 영역 2내에 존재한다. 이들 9개는 상기 상세한, 앞서 확인되지 않은 2개의 ORF를 포함한다. 이들 ORF를 인코딩하는 유전자는 초기에 본원에서 orf1 및 orf3로 명명되었으며 이제 각각 kfoH 및 kfoI로 지정되는 것으로 제안된다. 도 5는 ATCC 23502 및 U1-41의 DNA 서열로부터 본 발명자들에 의해 결정된 바와 같은 K4 캡슐 유전자 클러스터의 정렬을 나타낸다. 상기 언급된 Orf2는 본 발명자들에 의해 결정된 영역 2의 서열내 별도의 개방 판독 프레임으로서 존재하는 것으로 밝혀지지 않았다. 본 발명자들에 의해 측정된 서열내에서, orf2를 포함하는 서열은 kfoG의 코딩 서열의 일부이다. 니노미야 등에 의해 발표된 서열내 프레임쉬프트(frameshift)는 kfoG 서열을 2개의 보다 작은 개방 판독 프레임인, 니노미야 등에 의해 주석이 달린 것으로서 kfoG 유전자 및 본 발명자들에 의해 주석이 달린 것으로서 orf2 서열로 분할한다. 따라서, orf2는 니노미야 등에 의해 발표된 잘못된 서열의 인공물이었다.
IS2 서열을 배제하고, 유전자 클러스터는 단백질을 인코딩하는 것으로 예측된 17개의 개방 판독 프레임을 함유한다. 이들 유전자의 정렬은 에스케리키아 콜라이 2 군 캡슐 유전자 클러스터(참조: Whitfield 2006)에 대해 전형적이다. 보존된 유전자 kpsFEDUCS를 포함하는 영역 1, 및 보존된 유전자 kpsMT를 포함하는 영역 3은 영역 2의 9개의 개방 판독 프레임(및 IS2)을 플랭킹한다. 영역 1 및 영역 3 유전자는 에스케리키아 콜라이내 모든 2 군 캡슐의 합성 및 전좌에 필요한 단백질을 포함한다. 영역 1은 또한 CMP-Kdo의 생합성시 단계들을 촉매하는 것으로 예측된 효소를 코딩하는 2개의 유전자(kpsF 및 kpsU)를 포함하다. 위에 주목한 바와 같이, 에스케리키아 콜라이내 2 군 캡슐의 생합성시 CMP-Kdo의 역활은 제안되어 있지만, 실험적으로 입증되어 있지 않았다. 2 군 캡슐 유전자 클러스터에서, 영역 2 유전자는 전형적으로 캡슐 다당류의 구조를 결정하는 혈청형-특이적인 단백질을 인코딩하는 것들을 포함한다. 영역 2내에서 확인된 9개의 유전자들 중에서, 3개는 캡슐 생합성과 관련된 명확하게 정의된 활성을 갖는 단백질: kfoC(콘드로이틴 신타제, 즉 폴리머라제), kfoA(UDPGlcNAc 에피머라제, UDPGlcNAc를 UDPGalNAc 전구체로 전환함) 및 kfoF(UDPGlc-데하이드로게나제, UDPGlc를 UDPGlcUA 전구체로 전환함)를 인코딩한다.
K4 캡슐 유전자 클러스터의 영역 2에 존재하는 다른 유전자에 대해 기능이 미지이다: kfoB, kfoG, kfoD, kfoE, kfoH kfoI. kfoB는 다른 글리코스아미노글리칸(GAG) 캡슐, 파스퇴렐라 물토시다 혈청형 A, F 및 D 및 에스케리키아 콜라이 혈청형 K5를 생산하는 것으로 공지된 박테리아의 캡슐 클러스터내에 존재하는 유전자에 의해 인코딩된 단백질에 대해 상동성인 단백질을 인코딩한다. 유사하게, KfoG 단백질은 또한 파스퇴렐라 물토시다 혈청형 A, F 및 D의 캡슐 클러스터내에 존재하는 유전자에 의해 코딩된 단백질에 대해 상동성이다. 이러한 환경적 증거는, kfoB 및 kfoG가 GAG-함유 K4 캡슐의 생합성에 역활을 할 수 있음을 제안한다.
KfoB 및 KfoG와는 대조적으로, 본 발명 이전에, kfoD, kfoE, kfoH kfoI가 GAG 생합성에 관련되는 것으로 나타낸 증거는 없었다. 위에 나타내고 실시예 6 및 7에 기술된 바와 같이, 본 발명자들은, 이들 유전자(즉, 유전자 kfoD, kfoE, kfoH kfoI) 중 하나 이상이 K4 캡슐 다당류의 콘드로이틴 골격의 프럭토실화에 필수적이지만, 이들 유전자들 중 어느 것도 콘드로이틴 골격의 생산에 필요하지 않음을 본원에서 나타낸다.
삽입 성분 IS2는 U1-41 및 ATCC 23502내의 유전자 kfoC 및 kfoD 사이에 존재한다. 관찰된 배향에서 IS2의 삽입은 IS2내에서 기원하는 전사로 인하여 하부 유전자의 발현을 활성화시키는 것으로 보고되었다(참조: Glansdorf et al ., Cold Spring Harbor Symp . Quant . Biol ., 1981;45:153-156). 따라서, 이론에 얽메이지 않고, IS2의 존재는 하부 유전자 kfoD, kfoI, kfoE, kfoH, kfoF 및 kfoG의 발현을 조절할 수 있지만, 이들 유전자의 발현을 방지하는 것으로 예측되지 않음이 제안된다.
실시예 2
코돈-최적화된 에스케리키아 콜라이 4 캡슐 생합성 유전자의 합성
본 발명자에 의해 결정된 U1-41 K4 캡슐 유전자 클러스터의 서열을 대체 숙주에서 발현에 사용할 합성 유전자의 설계를 위한 기초로 사용하였다. 합성 작제물을 설계하여 K4 캡슐 생합성 유전자를 함유하는 하나 이상의 합성 오페론의 발현을 허용하고 에스케리키아 콜라이, 잔토모나스 캄페스트리스, 스핑고모나스 엘로데아 및 바실러스 서브틸리스에서 발현을 위해 허용가능한 코돈을 사용하는 컨센수스 바람직한 코돈 표에 기초하여 코돈 사용빈도에 대해 최적화하였다. 표 3a는 에스케리키아 콜라이, 잔토모나스 캄페스트리스 및 바실러스 서브틸리스 게놈에 대한 및 K4P 캡슐 생합성과 관련된 에스케리키아 콜라이 K4 영역 2 유전자, 및 또한 젤란 생합성과 관련된 것들을 포함하는 53개의 스핑고모나스 엘로데아 유전자에 대한 코돈 사용빈도 표를 제공한다. 당해 표는 K4 영역 2 생합성 유전자에서 선호하지 않는 코돈의 현저한 사용을 설명한다. 이들 코돈은 잔토모나스 캄페스트리스 또는 스핑고모나스 엘로데아 발현에 극도로 불리할 뿐 아니라 에스케리키아 콜라이내 발현도 불리하다. 에스케리키아 콜라이내에서 최적 발현을 위해, 유의적인 코돈 최적화가 필수적일 수 있음이 예측될 수 있다. 이들 코돈 사용빈도 표의 비교에 기초하여, 컨센수스 바람직한 코돈 사용빈도 표를 설계하여, 합성 콘드로이틴 생합성 유전자에 대해 표 3b에 나타낸다. 당해 코돈 사용빈도 패턴은 광범위한 잠재적인 대체 숙주에서 효과적인 해독을 제공하는 것으로 예측된다.
[표 3a]
Figure 112016019550472-pct00163
Figure 112012080180037-pct00005
나타낸 값들은, 코돈이 인코딩하는 주어진 아미노산을 규정하는 전체 코돈의, 각각의 코돈에 대한 퍼센트로서 발생을 반영한다. 코돈 사용빈도는 바실러스 서브틸리스 균주 168, 잔토모나스 캄페스트리스 피브이. 캄페스트리스 ATCC33913, 에스케리키아 콜라이 K-12 W3110의 게놈 및 20,972개의 코돈을 함유하는 스핑고모나스 엘로데아의 53개의 CDS로부터 계산하였다.
표 3b에서 하기 나타낸 코돈 사용빈도는 합성 유전자의 설계시 사용된 컨센수스 코돈 사용빈도 표 및 하기 작제된 바와 같은 합성 유전자 세트의 최종 코돈 사용빈도이다. 합성 유전자에서 실제 사용빈도는 DNA 및 mRNA 2차 구조, 제한 부위의 포함 및 배제, 및 전체 GC 함량과 같은 설계 고려사항을 반영한다.
[표 3b]
Figure 112012080180037-pct00006
2 값은 합성된 것으로서 합성 유전자 세트내 코돈의 총 수이다.
합성 유전자 세트를 3개의 분절, kpsFEDUCS("FS 분절"), kpsMTkfoABCFG("MG 분절") 및 kfoDIEH("DH 분절")로서 작제하였다. 도 6은 이들 3개의 합성 분절의 구조를 도해로 나타낸다. 도 6에 나타낸 유일한 제한 부위를 전략적 위치에 혼입하여 합성 단편이 플라스미드 발현 벡터내로 삽입될 수 있는 하나 이상의 오페론으로 조립되도록 하였다. 초기 전략은 유전자를 발현 실험용 단일 오페론으로서 조립하기 위한 것이었다. 다른 제한 부위는 또한 어떠한 제공된 유전자(들)에 대해서도 비-극성 결실의 작제를 허용하는 위치에서 합성 서열 전체에 전략적으로 위치하였다. 이는 K4 캡슐 클러스터에 의해 인코딩된 단백질의 기능 뿐만 아니라 플라스미드 서열의 다른 변형의 유전적 분석도 용이하게 할 수 있다. 컨센수스 강력한 리보소옴 결합 부위(AGGAGGttaataaATG, 서열 번호 46)를 kpsC, kpsT, kfoE, 및 kfoH를 제외하고는 모두의 합성 유전자 대부분에 대해 사용하였다. 에스케리키아 콜라이 K4 U1-41 서열에서, 이들 유전자의 해독 개시 부위를 바로 상부의 유전자의 해독 정지에 커플링하며 그 결과 리보소옴 결합 부위는 이들 상부 유전자의 코딩 영역과 중첩된다.
위에 정의한 것으로서 FS, MG 및 DH 분절을 포함하는 합성 서열은 상업적 판매회사, DNA2.0(미국 캘리포니아주 멘로 파크 소재)에 의해 3개의 별도의 단편으로 합성하였다. 3개의 합성 분절의 뉴클레오타이드 서열을 FS 분절(서열 번호 47), MG 분절(서열 번호 48) 및 DH 분절(서열 번호 49)로서 나열한다.
실시예 3
대체 숙주 균주의 작제
K4 생합성 유전자의 발현을 위해 선택한 초기 대체 숙주는 에스케리키아 콜라이 K-12("K-12"), 에스케리키아 콜라이. 비("EcB"), 스핀고모나스 엘로데아("Sph"), 및 잔토모나스 캄페스트리스 피브이. 캄페스트리스("Xcc")를 포함하였다. K-12 균주 W3110 및 MG1655를 예일대의 콜리 유전 스톡 센터(Coli 유전자tic Stock Center)로부터 입수하였다. Sph 균주 ATCC 31461을 ATCC로부터 입수하였다. Xcc 균주 NRRL B-1459(ATCC 13951)를 미국 일리노이주 페오리아 소재의 ARS 컬쳐 컬렉션(NCUAR)으로부터 입수하였다. 에스케리키아 콜라이 B(ATCC 11303)를 ATCC로부터 입수하였다.
일반적으로, 대체 숙주는 K4 유전자의 도입을 위해 2가지 방식으로 제조하였다. 이동하는(mobilizing) 플라스미드 pRK2013을 함유하는 에스케리키아 콜라이와 3-부모 교차(tri-parental cross)하는 에스케리키아 콜라이의 실험실 클로닝 균주로부터의 접합 전달에 의해 특정의 대체 숙주로 유전자/플라스미드를 전달할 수 있는 것이 유리할 수 있다. 접합 환경 중에서 대체 숙주의 피전달접합균주(transconjugant)를 선택하기 위하여, 대체 숙주의 항생제-내성 유도체(전형적으로 스트렙토마이신 내성)가 요구된다. 대안적으로, 에스케리키아 콜라이 균주 S17-1(참조: Simon et al., BioTechnology 1983;1:784-791)을 사용할 수 있다. 당해 균주는 플라스미드 RP4의 염색체 통합된 형태를 가지며 적절한 플라스미드를 새로운 숙주로 직접 이동시킬 것이다. 그러나, 당해 균주는 스트렙토마이신 내성이므로, 스트렙토마이신은 접합완료체(exconjugant) 중에서 당해 균주에 대해 선택하는데 사용될 수 없다.
Sph, Xcc, 및 K-12에서 유전자 또는 유전자 클러스터 결실의 생성은 2-단계, "팝-인/팝-아웃" 상동성-구동된(driven) 방법을 사용하여 수행하였다(참조: 도 7a). 제 1 단계에서, 목적하는 결실 구조의 클로닝된 버젼(결실을 플랭킹하는 상동성 영역)을 함유하는 플라스미드를 플랭킹 영역 중 하나에서의 재조합(및 벡터 상의 마커에 대한 선택)에 의해 염색체(팝-인)내로 통합시켜 상동성 플랭킹 영역의 중복을 생성하였다. 제2 단계에서, 재조합이 반대쪽 플랭킹 영역내에서 발생하여 클로닝 벡터(및 마커)와 표적화된 염색체 영역을 제거하지만[팝핑-아웃(popping-out); "분해하는"], 설계된 결실은 남겼다. 이러한 균주는 마커 선택의 부재하에서의 다-세대 성장에 이은, 마커 및 목적하는 표현형(콜로니 형태학 및/또는 PCR에 의해 측정됨)의 손실에 대한 스크리닝에 의해 수득하였다. 에스케리키아 콜라이 외의 그람-음성 유기체의 경우, 목적하는 결실은 표적(비-에스케리키아 콜라이) 숙주 균주로 접합에 의해 이전할 수 있지만, 이것 내에서 복제할 수 없는 "자살(suicide)" 벡터내에서 전형적으로 창조된다. 본 발명의 목적을 위해, 본 발명자들은 pCM184(참조: 도 7b; Marx and Lidstrom, BioTechniques 2002;33(5):1062-1067)를 변형시킴으로써 "자살" 벡터를 생성하였다. 카나마이신-내성 유전자 및 플랭킹 loxP 부위들은 NotI 및 SacII로 분해하고, 말단을 T4 DNA 폴리머라제로 폴리싱(polishing)하여 연결시킴으로써 제거하였다. 도 7b에 나타낸 바와 같이, 수득되는 플라스미드, pCX027(서열 번호 141)은 통합체(integrant)(Sph 또는 Xcc내) 및 거대한 다중-클로닝 부위의 선택을 위한 테트라사이클린-내성을 함유하였다. 에스케리키아 콜라이내에서 결실을 생성시키기 위해, 플라스미드 pMAK705[참조: Hamilton et al., J. Bacteriol. 1989;171 (9):4617-4622]를 사용하였다. 당해 플라스미드는 온도-민감성 pSC101 레플리콘을 함유함으로써, 제1 단계 통합의 생성 및 제2 ("분해") 단계에서 플라스미드 서열의 손실이 고온에서 용이하게 되었다. "세포외 다당류(EPS) 마이너스" 돌연변이체의 유전자 구조는 PCR 및 서던 블롯 분석으로 확인하였다.
결실 작제물을 생성하기 위한 시도는 위에서 기술한 모든 표적에 대해 동일하였다. 상동성의 상부 및 하부 영역은 적절한 게놈 DNA를 주형으로 사용하는 PCR에 의해 유래되었다. 제한 부위를 PCR 프라이머내로 설계함으로써, 수득되는 DNA 단편이 목적하는 플라스미드내로 클로닝될 수 있도록 하거나, 하기 기술된 Xcc 검D 유전자(gumD gene)의 경우, 게놈내에 천연적으로 존재하는 제한 부위를 사용하였다. 결실(및 클로닝에 사용된 제한 부위)를 설계함으로써 인프레임 융합체를 표적 유전자(들)의 N-말단 및 C-말단 코딩 영역의 짧은 영역들 사이에 생성시켰다. 실제로, 표적화된 코딩 영역을 제한 효소 인식 서열로 대체하였다. 상부 단편과 하부 단편 사이의 가공된 제한 부위 서열은 2 내지 3개의 비-천연 코돈을 융합된 코딩 영역에 추가하였다. 당해 과정은 하부 유전자의 발현시 아주 적은 극성 효과/비 극성 효과의 예측과 함께 잘-정의된 돌연변이를 생성하였다.
에스케리키아 콜라이 K-12
콜란산(M 항원)은 많은 장 박테리아에 의해 생산된 세포외 다당류이며(참조: Grant, W.D., et al., J. Bacteriol.1969;100:1187-1193), 보다 많은 생산이 전형적으로 저 성장 온도에서 발견되었다(참조: Stout, V., J. Bacteriol. 1996;178:4273-4280). 콜란산 생합성에 있어 결함이 있는 에스케리키아 콜라이 K-12 균주의 생성은 당해 실시예에 기술되어 있다. 이러한 균주는, 이들이 30℃ 이하에서 수행할 수 있는 재조합 콘드로이틴의 생산을 위해 추가로 가공되는 경우, 방해하거나 오염되는 콜란산을 생산하지 않는다. 플라스미드 pMAK705(참조: Hamilton, C.M., et al., J. Bacteriol. 1989;171:4617-4622)를 사용하여 염색체 콜란산 생합성 유전자 클러스터내에 정밀한 결실을 생성하였다. 당해 플라스미드는 온도 민감성 레플리콘(replicon)을 함유하며 고온에서 염색체외 상태로 존재할 수 없다. 일반적으로, 표적 유전자자리에서 정밀한 돌연변이를 생성하기 위한 단계는 "팝-인/팝-아웃" 메카니즘으로부터 생성되며 문헌[Hamilton et al.(상기 참조)]에 기술되어 있다. 설계된 돌연변이를 함유하는 플라스미드 클론은 통상적으로 표적 유전자자리에서 상동성 재조합을 통해, 허용되지 않는 온도에서 형질전환체의 성장 및 플라스미드-코딩된 항생제(클로람페니콜; Cm) 내성에 대한 선택에 의해 염색체 내로 구동된다("팝-인"). 클로람페니콜의 부재하에서 이들 구성요소의 후속적인 다-세대 성장은, 플라스미드가 염색체로부터 재조합되어 세포 분열 동안 세포로부터 손실되어 원래의 야생형 구조 또는 돌연변이체 구조를 남긴 세포의 소-집단을 생성한다. 이들 "팝-아웃"은 Cm 민감성으로 확인된다. 목적하는 돌연변이체 구조를 갖는 균주를 이후에 표현형(가능하게는) 및 PCR 또는 서던 블롯팅으로 확인한다.
에스케리키아 콜라이 K-12에서 콜란산 생합성 오페론은 약 24kb를 포함하는 19 또는 20개의 연속된 유전자로 이루어진다(참조: Stevenson, G., et al., J. Bacteriol. 1996;178:4885-4893). 20번째 유전자, wcaM은 오페론/전사 단위의 일부인 것으로 여겨지지만 콜란산 생산을 위해 요구되지 않는다. 여기에 포함된 것은 제1 당을 콜란산 생합성 동안 지질 담체 위로 로딩하는데 관여하는 글리코실트랜스퍼라제 효소를 코딩하는 wcaJ 유전자이다. 당해 실시예는 전체 20-유전자 오페론 또는 wcaJ 유전자만의 결실을 함유하는 에스케리키아 콜라이 K-12 균주의 생성을 기술한다. 에스케리키아 콜라이 K-12 균주 W3110의 게놈의 서열은 GenBank AP009048로서 발표되어 있다(참조: Blattner, F.R., et al., Science 1997;277:1453-1462).
콜란산 오페론의 결실: PCR 프라이머를 W3110 콜란산 오페론의 제1 유전자(wza) 상부의 대략 950 bp 상부 및 마지막 유전자(wcaM) 하부의 대략 950 bp를 증폭시키기 위해 설계하였다. 이들 단편은 염색체내에서 목적하는 재조합 부위에 대해 상동성을 제공하였다. PCR 프라이머는 후속적인 클로닝에 사용될 증폭된 PCR 생성물의 말단에 비-천연 제한 부위를 생성하도록 설계하였다. 상부 영역을 프라이머 CAX129(밑줄친 HindIII 부위) 및 CAX128(밑줄친 AscI 부위)를 사용하여 증폭시켰다. 하부 영역을 프라이머 CAX130(밑줄친 AscI 부위) 및 CAX131(밑줄친 XbaI 부위)를 사용하여 증폭시켰다.
CAX128 GGCGCGCCAGCGTCCTGCTGTTTGATGACG (서열 번호 50)
CAX129 AAGCTTGCCAGGAGATTGACGCCAGC (서열 번호 51)
CAX130 GGCGCGCCGGAATCCTCAGTTGGACCCGC (서열 번호 52)
CAX131 TCTAGAACTTTACCCTCACGGTCCAGCG (서열 번호 53)
PCR은 Pfu 폴리머라제(제조원: Stratagene)를 사용하여 95℃에서 변성, 57℃에서 어닐링 및 72℃에서 연장(각 단계에서 20초)의 30 주기 동안 수행하였다. 주형은 100 ng의 에스케리키아 콜라이 K-12 W3110 게놈 DNA로 이루어져 있다. PCR 단편을 pCR-Blunt II-TOPO(제조원: Invitrogen)내로 클로닝하고 에스케리키아 콜라이 TOP10(제조원: Invitrogen)내로 형질전환하고, 선택된 클로닝된 삽입체의 서열을 발표된 데이타와 일치하는지 확인하였다. 상부 클론을 HindIII 및 AscI으로 분해하고, 하부 클론을 XbaI 및 AscI으로 분해하였다. 목적하는 단편을 겔-정제(유전자 Clean Turbo, 제조원: Q-BIO유전자)하고 HindIII 및 XbaI으로 분해한 후 안트악틱 포스파타제(Antarctic phosphatase)(제조원: New England Biolabs)로 처리한 pMAK705와 연결시켰다. 에스케리키아 콜라이 DH5α의 Cm-내성(LB Cm 34㎍/mL, 30℃) 형질전환체(제조원: Invitrogen)를 플라스미드 구조에 대해 분석하고, 목적하는 구조를 갖는 것을 pMAK-CL로 명명하였다. 당해 플라스미드(및 이로부터 궁극적으로 유래된 염색체 결실)에서, AscI 부위에서 상부 및 하부 단편의 통합은 wza 유전자의 5' 말단 및 wcaM 유전자의 3' 말단으로 이루어진 작은 345bp 개방 판독 프레임을 생성하였다. 이러한 특징은 wcaM 하부의 더 먼 임의의 유전자의 콜란산 오페론 프로모터로부터의 잠재적인 발현의 파괴를 최소화하기 위해 설계되었다.
플라스미드 pMAK-CL을 에스케리키아 콜라이 W3110내로 30℃(허용되는 온도)에서 17㎍/mL에서 Cm을 함유하는 LB(참조: Maniatis, 1989) 아가 플레이트(agar plate) 상에 플레이팅함으로써 Cm 내성에 대한 선택과 함께 전기영동으로 형질전환시켰다. 몇가지 형질전환 콜로니를 M9(참조: Maniatis, 1989) Cm 17㎍/mL 아가 플레이트에 스트리킹(streaking)하고 43℃(허용되지 않는 온도)에서 항온처리하였다. 2일 후, 다수 콜로니(추정상의 통합체)가 존재하였으며, 이들을 M9 Cm에 43℃에서 확인을 위해 재-스트리킹하였다. 2개의 추정상의 통합체를 약 25 세대 동안 LB 배지 속에서 37℃로 성장시키고, 희석물을 제조하여 실온(22 내지 24℃)에서 성장시키기 위해 LB 플레이트에 스프레딩하였다. 3일 후, 콜로니를, 하나는 30℃에서 성장을 위해 Cm 17㎍/mL를 함유하는 2개의 LB 아가 플레이트로 이전시켰다. Cm-민감성 분리체는 2개의 원래의 구성요소의 유도체 중에 62% 및 94%의 빈도로 존재하였다. 이들은 아마도 "팝-아웃" 및 pMAK-CL 플라스미드의 손실로부터 생성되었다. "콜로니 PCR"을 사용하여 이들 균주내 콜란산 오페론에서 구조를 평가하였다. 소량의 콜로니를 PCR과 양립할 수 있는 튜브 내의 10μL의 멸균 탈-이온수 속에 현탁시켰다. 여기에 20μL의 "태크 마스터(Taq Master)(에펜도르프) 성분의 1.5배 농축된 혼합물을 가함으로써 반응물 중 최종 농도/양이 1X 태크 폴리머라제 완충액, 1X "태크 마스터" 시약, 0.33 mM 각각의 dNTP, 0.4μM 각각의 프라이머, 및 0.5 단위의 태크 폴리머라제가 되도록 하였다. PCR을 95℃에서 8분으로 개시하여, 95℃에서 30초 동안 변성, 55℃에서 30초 동안의 어닐링, 및 68℃에서 3분의 연장의 35 주기로 지속하고, 68℃에서 7분 동안 연장시켜 종료하였다. 초기 특성화를 상부 상동성 영역내 전방 프라이머(CAX132) 및 하부 상동성 영역내 역방 프라이머(CAX135)를 사용하여 수행하였다.
CAX132 CCGAATTGTTATCTTGCCTGC (서열 번호 54)
CAX135 GGTAGCATCTCTTTGGGTATCG (서열 번호 55)
바람직한 오페론 결실을 함유하는 균주의 PCR은 1000 bp 단편을 생산하는 것으로 예측되었으며, 이는 분석된 23개 "팝-아웃" 균주 중 9개에서 발견되었다. 바람직하지 않은 재배열이 이들 균주에서 발생하지 않았는지를 보증하기 위해, 상동체의 영역 외부의 프라이머를 이용한 "콜로니 PCR"을 사용하였다: CAX162(전방) 및 CAX163(역방).
CAX162 GAACAGCGGTTGAGTCAGGG (서열 번호 56)
CAX163 GGCAGAAAGCACATAGCGACC (서열 번호 57)
이들 외부 프라이머는 바람직한 구조의 결실시 2065 bp의 PCR 생성물을 제공하였으며, 9개 균주 중 4개는 당해 PCR 생성물을 생성하였으며; 이들 중 하나는 MSC188로 지정되었다. 균주 MSC188내 결실의 구조의 추가 확인은 서던 블롯팅으로 달성하였다. "DIG"-표지된 프로브(제조원: Roche)를 프라이머 CAX128 및 CAX129(1000 bp)로 pMAK-CL을 주형으로서 사용하여 생성시켰다. 야생형 에스케리키아 콜라이 W3110 및 MSC188로부터의 염색체 DNA를 제한 효소 KpnI, PstI 및 BglII로 분해하고, 분해물을 겔 전기영동 및 블롯팅에 적용시켰다. 프로빙(probing)은 MSC188 및 W3110 각각에서 예측된 밴드 패턴을 나타내었다: KpnI, 5921 bp 대 9431 bp; PstI, 3902 bp 대 12893 bp, 및 BglII, 9361 bp 대 6201 bp.
wca J의 결실: 에스케리키아 콜라이 K-12 W3110내에서 wcaJ 유전자의 결실을 위한 전략은 전체 콜란산 생합성 오페론의 결실에 대해 위에 기술된 바에 따랐다. PCR 프라이머를 설계하여 W3110 콜란산 오페론의 wcaJ 유전자 상부 및 하부의 대략 500bp를 증폭시켰다. 상부 영역을 프라이머 CAX126(밑줄친 HindIII 부위) 및 CAX125(밑줄친 PacI 부위)로 증폭시켰다. 하부 영역은 프라이머 CAX124(밑줄친 PacI 부위) 및 CAX127(밑줄친 XbaI 부위)로 증폭시켰다.
CAX124 TTAATTAACAAAGGTTTCGTTAACAAAGCGG (서열 번호 58)
CAX125 TTAATTAAATTGGTTTTCGCTCGCTCGC (서열 번호 59)
CAX126 AAGCTTGGAAGACGCCATCTATGGTGG (서열 번호 60)
CAX127 TCTAGAGAAGCCCGCCAGCACCGC (서열 번호 61)
상부 및 하부 PCR 생성물의 제한 단편을 pMAK705내로 클로닝하여 pMAK-wca를 수득하였다. 당해 플라스미드 및 이로부터 궁극적으로 유래된 염색체 결실에 있어서, PacI 부위에서 상부 및 하부 단편의 통합은 wcaJ 유전자의 5' 및 3' 말단으로 이루어진 작은 75bp 개방 판독 프레임을 생성하였다. 당해 특징은 이들이 콘드로이틴의 생산에 유리한 상황에서 모든 다른 오페론 유전자의 방해되지 않은 발현을 허용하도록 설계하였다. 콜로니 PCR에 의한 에스케리키아 콜라이 W3110의 추정적 wcaJ 결실 유도체의 초기 특성화는 프라이머 CAX126 및 CAX127을 사용하여 수행하였으며, 23개의 유망한 "팝-아웃"중 11개는 바람직한 시그날을 제공하였다. 외부 프라이머 CAX160(전방) 및 CAX161(후방)을 사용하여 추정적 wcaJ 결실을 확인하였고, 시험한 4개 균주 중 3개는 예측된 생성물(1188 bp)을 함유하였다. 바람직한 DNA 구조를 갖는 하나의 균주를 MSC175로 지정하였다.
CAX160 CCGTTGATGTGGTGACTGCC (서열 번호 62)
CAX161 AAACAGCAGCGTTCTCACCG (서열 번호 63)
서던 블롯 확인을 위해, "DIG"-표지된 프로브를 프라이머 CAX124 및 CAX127(514 bp)로 pMAK-wca를 주형으로서 사용하여 생성시켰다. 야생형 에스케리키아 콜라이 W3110 및 MSC175로부터의 염색체 DNA를 제한 효소 PacI, DraIII 및 NdeI로 분해하고, 분해물을 겔 전기영동 및 블롯팅에 적용시켰다. 프로빙은 MSC175 및 W3110 각각에서 예측된 밴드 패턴을 나타내었다: PacI, 8456 bp 대 >28000 bp; DraIII, 4502 bp 대 5819 bp, 및 NdeI, 8512 bp 대 9829 bp.
잔토모나스 캄페스트리스
잔토모나스 캄페스트리스 피브이. 캄페스트리스(Xcc)는 상업적으로 사용되어 다양한 산업 및 식품 적용을 위한 세포외 탄수화물 중합체 크산탄 검을 생산한다(참조: Baird, J., et al., BioTechnology 1983;1:778-783). 당해 균주 및 콘드로이틴의 생산 방법을 사용하기 위해서는, 크산탄 검을 생합성할 수 없는 Xcc 균주가 요구된다. 에스케리키아 콜라이용으로 사용된(상기) 것과 유사한 전략을 사용하여 NRRL B-1459로서 또한 공지된(참조: Capage, M.R. et al., World Patent WO87/05938; Katzen, F., et al., J. Bacteriol. 1998;180(7):1607-1617), 잔토모나스 캄페스트리스 피브이. 캄페스트리스 균주 ATCC13951 내에서 전체 크산탄 검 생합성 오페론 또는 제1 글리코실트랜스퍼라제용 유전자, gumD 만을 결실시켰다. 우선, 30℃에서 영양 아가 속에서 100㎍/mL 스트렙토마이신 설페이트에 대해 내성인 자발적으로-생성된 유도체를 수득하고 MSC116으로 명명하였다. PCR 프라이머를 균주 NRRL B-1459(GenBank 수탁번호 #U22511)의 크산탄 검 생합성 클러스터의 서열 및, 필요에 따라 잔토모나스 캄페스트리스 피브이. 캄페스트리스 ATCC33913(GenBank 수탁번호 AE008922)에 대한 게놈 서열에 대해 설계하였다.
gum D 의 결실: gumD 유전자의 결실을 위한 전략은 코딩 영역의 대략 1650 bp 상부(5') 및 1000 bp 하부(3')를 이용한다. PCR 프라이머를 이들 제한 부위의 외부에 설계하고, 이들을 gumD 코딩 서열의 바로 내부의 PCR 프라이머 표적화 영역과 쌍을 지어 상동성의 상부 및 하부 영역을 생성하였다. 대략 1800 bp의 상부 상동성을 증폭시키기 위해, 프라이머 CAX114 및 CAX116을 사용하였다. 대략 1100 bp의 하부 상동성을 증폭시키기 위해, 프라이머 CAX115 및 CAX117을 사용하였다. gumD 코딩 영역의 말단내 2개의 중앙 프라이머를 SbfI 제한 부위(하기 밑줄침)를 사용하여 정정하였다.
CAX114 CCTGCAGGGTCGAACACTCGCAAGACCAGG (서열 번호 64)
CAX115 CCTGCAGGTATCCGCATCATCGTGCTGACG (서열 번호 65)
CAX116 CCTTGGTGATGGTGTGGCG (서열 번호 66)
CAX117 GCCCATCCACGACTCGAACG (서열 번호 67)
PCR을 Pfu Ultra II 폴리머라제(제조원: Stratagene)를 사용하여 95℃에서 변성(20초), 62℃에서 어닐링(20초) 및 72℃에서 연장(30초)의 30 주기 동안 수행하였다. 주형은 100 ng의 잔토모나스 캄페스트리스 피브이. 캄페스트리스(균주 ATCC13951; "Xcc") 게놈 DNA로 이루어졌다. PCR 단편을 pCR-Blunt II-TOPO(제조원: Invitrogen)내로 클로닝하고 에스케리키아 콜라이 TOP10(제조원: Invitrogen)내로 클로닝시켰다. 상부 상동성 클론의 관련 서열은 PCR 생성물의 서열과 일치하였으나, 이는 당해 영역에 대한 발표된 Xcc 서열(프라이머는 배제됨)로부터 2개의 염기 쌍에 의해 상이하다. 발표된 서열은 소수의 부정확한 지정(assignment)을 함유하는 것으로 여겨진다. 하부 상동성 클론의 관련 서열은 이의 PCR 생성물의 서열 및 당해 영역에 대한 발표된 Xcc 서열(프라이머는 배제됨)의 것과 일치하였다.
잔토모나스에서 "팝-인/팝-아웃" 메카니즘을 사용한 특이적인 유전자 결실을 생성하기 위한 전략은 플라스미드 pCM184의 유도체를 기초로 한다(참조: Marx, C.J., and Lidstrom, M.E., BioTechniques 33(5):1062-1067, 2002). 플라스미드 pCM184는, 에스케리키아 콜라이내에서 플라스미드의 복제를 허용하지만, 잔토모나스(또는 다른 비-장내 박테리아)에서는 허용하지 않는 ColE1 레플리콘(replicon), 그람 음성 박테리아 중에서 접합성 전달을 위한 oriT 영역, 암피실린 및 테트라사이클린에 대한 내성 유전자, 및 loxP 서열에 의해 플랭킹된 카나마이신(Kanr)에 대한 내성 유전자로 이루어졌다. 당해 플라스미드를 설계하여 비-에스케리키아 콜라이 균주에서 표지되지 않은(나머지 항생제 내성 유전자가 없는) 결실을 생성하였지만, 기술된 과정은 결실 부위에 작은 loxP 서열을 남겼다. 그러나, 본 발명에서 생성된 균주의 경우 loxP와 같은 불필요한 서열을 함유하지 않는 것이 바람직하였다. 따라서, pCM184를 변형시켜 loxP 부위 및 개재된 카나마이신 내성 유전자를 제거하였다. 이는 위에서 기술한 "팝-인/팝-아웃" 메카니즘에 있어서의 변이에 의해 잔토모나스내에서 바람직한 표지되지 않은 결실의 생성을 허용하였다.
약 1.8㎍의 플라스미드 pCM184를 NotI 및 SacII 제한 효소(loxP/Kanr/loxP 영역을 제거하기 위해 선택하지만 추가의 사용을 위해 제한 부위 대부분은 남긴다)로 분해하고, 완료된 반응물을 75℃에서 15분 동안 가열하여 효소를 불활성화시켰다. 이후에, 시료(20μL)를 T4 DNA 폴리머라제(1.8 U, 제조원: New England Biolabs) 및 100μM의 각각의 dNTP로 15분 동안 12℃에서 처리하여 NotI 분해로부터 일본쇄 오버행(overhang)을 채우고(fill-in) SacII 분해로부터의 오버행을 역으로 잘라내었다(즉, 평활 말단을 생성). 반응은 EDTA를 10 mM까지 첨가하고 75℃에서 20분 동안 가열하여 종결하였다. 약 170㎍의 처리된 플라스미드를 400 U T4 DNA 리가제(제조원: New England Biolabs)와 10μL 용적 속에서 16℃로 4시간 동안 반응시켰다. 연결 반응물을 2.5 U SbfI로 90분 동안 후속적으로 처리하여 원치않는 DNA 구조를 분해하였다(예를 들면, 재형성된 pCM184). 0.5μL 용적의 당해 반응물을 사용하여 에스케리키아 콜라이 TOP10(제조원: Invitrogen)을 형질전환시키고, LB Tc5에 플레이팅하여 37℃에서 밤새 항온처리한 후 다수의 콜로니를 생성하였다. 선택된 콜로니로부터의 세포내에 함유된 플라스미드는 제한 효소 분석 및 DNA 서열 분석에 의해 바람직한 구조인 것으로 나타났다: 당해 플라스미드는 pCX027(서열 번호 141)로 명명되었으며 도 7b에 도해되어 있다.
gumD 상부 및 하부 영역(상기)에 대한 클로닝된 PCR 생성물을 함유하는 플라스미드(각각 약 2㎍)를 10 U SbfI로 2시간 동안 37℃에서 분해한 후, 10 U EcoRI(효소-특이적인 완충액)으로 동일한 조건하에서 분해하였다. 열처리(70℃에서 20분 동안)한 후, 분해물을 아가로즈 겔 전기영동에 적용시키고, 바람직한 단편(약 1.6 kb의 상부 단편; 약 1.1 kb의 하부 단편)을 QIAGEN 미니-용출 키트(Mini-Elute kit)로 정제하였다. 플라스미드 pCX027(약 3.5㎍)을 20 U EcoRI을 사용하여 50μL 반응물 속에서 2.5 시간 동안 37℃에서 분해하고, 약 18U 안트악틱 포스파타제(제조원: New England Biolabs)으로 60μL 반응물 속에서 15분 동안 37℃에서 처리한 후, 70℃에서 20분 동안 가열하였다. 3-방식 연결(ligation)을 각각 약 100ng의 처리된 pCX027 및 정제된 gumD 상부 및 하부 단편으로 10pL 반응물 속에서 16℃에서 약 20시간 동안 수행하였다. 당해 반응물의 1/2을 에스케리키아 콜라이 DH5α(제조원: Stratagene)내로 형질전환한 후 LB Ap100 또는 LB Tc5에 37℃에서 플레이팅하였다. 콜로니 PCR을 수행하여(위에서 기술한 바와 같이) 각각 상부 및 하부 서열에서 영역에 대해 상동성인 프라이머 CAX122 및 CAX119를 사용하여 바람직한 구조를 가진 클론을 확인하였다.
CAX119 GACCAATGACACGATGATCG (서열 번호 68)
CAX122 GCATCCGCTACAACATGCTC (서열 번호 69)
예상한 크기(1169bp)의 PCR 생성물을 수개의 콜로니에서 검출하고, 목적하는 구조를 제한 분석으로 확인하였다. 쌍을 이룬 상동성 영역의 배향(gum 유전자 판독 프레임으로서 제공됨)이 벡터 Tetr 유전자에 대한 배향과 동일하거나 반대인 플라스미드를 각각 pCX030 및 pCX031로 명명하였다.
잔토모나스 캄페스트리스 피브이. 캄페스트리스["Xcc"; ARS 컬쳐 컬렉션(NCUAR), 미국 일리노이아주 페오리아 소재; 또한 ATCC13951로서 공지됨]를 영양 브로쓰(NB, 제조원: Difco) 속에서 밤새 30℃에서 성장시키고(달리 나타내지 않는 한 30℃에서 Xcc 균주 모두 성장), 새로운 NB 속에서 1:5로 희석시키고, 100μL의 분취량을 스트렙토마이신(str)을 100㎍/mL로 함유하는 영양 아가(NA, 제조원: Difco) 플레이트에 스프래딩(spreading)시킨 후 30℃에서 항온처리하였다. 수일 후, 콜로니가 약 1/107개의 원래-플레이팅된 세포의 빈도로 검출되었다. 수개의 자발적으로-발생된 스트렙토마이신-내성 Xcc 균주를 NA str50 플레이트에 스트리킹하여 정제하고, 이러한 분리체 하나를 MSC116로 명명하였다.
플라스미드 pCX030 또는 pCX031을 전기영동에 의해 Xcc 균주 MSC116으로 전달하였다(참조: Oshiro et al., J. Microbiol. Method 2006;65:171-179). 테트라사이클린-내성 콜로니(TcR)를 pCX030(4.1 x 104/㎍) 및 pCX031(3.1 x 104/㎍) 각각으로부터 수득하였다. 게놈 DNA를 pCX031 형질전환으로부터 유래된 분리된 TcR 균주로부터 제조하고 PCR에 의해 pCX031 통합 부위에 대해 평가하였다. 프라이머 쌍을 선택하여 하부 영역에 대한 pCX031내에서 사용된 상부 영역의 외부의 게놈 서열 및 상부 영역에 대한 pCX031에서 사용된 하부 영역의 외부의 서열의 연결을 측정하였다. 구체적으로, 프라이머 CAX116(상부 영역에 대한 "외부 프라이머") 및 CAX119(하부 상동성 영역; 상기 참조)를 사용하여 상부 연결을 시험하고 CAX117("하부 여역에 대한 '외부 프라이머"; 상기 참조) 및 CAX122(상부 상동성 영역내; 상기 참조)를 사용하여 하부 연결을 시험하였다. PCR을 Go Taq DNA 폴리머라제(제조원: Promega, 미국 위스콘신주 매디슨 소재)를 0.5μM의 각각의 프라이머, 250μM의 각각의 dNTP, 1000 ng의 DNA 주형, 및 0.5 U 효소를 사용하여 수행하였다. 반응 조건은 94℃에서 4분 동안의 초기 변성, 94℃에서, 30초 동안 15초 변성, 55℃에서 30초 동안 어닐링, 및 72℃에서 4분 동안 연장 및 2분 동안의 최종 연장의 30 주기를 포함한다. "팝-인" 분리체를 pCX031의 상부 및 하부 통합 둘다에 대해 확인하였다. 2개의 분리된 "팝-인" 균주를 MSC221 및 MSC222로 지정하였다. 이들 균주를 LBLS(10 g/L 박토 펩톤, 5 g/L NaCl, 5 g/L 효모 추출물, 항생제 포함하지 않음) 속에서 30℃에서 성장시키기 위해 접종한 후, 동일한 배지내로 48시간 간격에서 1:1000 희석을 사용하여 3회 서브-배양(sub-culturing)하였다. 수득되는 배양물을 희석시키고, 분취량을 NA Str50 플레이트에 스프레딩하였다. 수득되는 콜로니를 NA 및 NA Tc5 플레이트에 전달하였다. TcS 균주는 균주 둘다로부터 2%의 빈도로 발견되었다. 상기 기술된 바와 같이, 선택된 TcS 균주에 대해 프라이머 쌍(CAX116와 CAX119 및 CAX117와 CAX122)를 사용한 콜로니 PCR 분석은, 시험된 모든 균주가 gumD 결실과 일치하였음을 입증하였다. MSC221 및 MSC222로부터의 이들 분리된 "팝-아웃" 균주를 각각 MSC225 및 MSC226으로 지정하였다. 아가 플레이트 상의 MSC225 및 MSC226의 콜로니는 MSC116 모 균주의 콜로니와 비교하여 명확하게 비점액성이었다.
크산탄 검 생합성 유전자 클러스터의 결실: gumB 내지 gumM 생합성 클러스터의 결실은 주로 gumD 유전자의 결실에 대해 상세히 설명한 동일한 단계에 따른다. gumB의 상부 및 gumM의 하부의 상동성의 영역을 PCR에 의해 프라이머 CAX136 x CAX137(1434 bp) 및 CAX138 x CAX139(1420 bp) 각각을 사용하여 생성시킴으로써, pCX027 내로 클로닝하기 위한 BglII 제한 부위 및 상부 단편과 하부 단편 사이의 융합을 위한 NotI 부위를 혼입시켰다. NotI 부위의 융합은 gumB의 5' 말단 및 gumM 코딩 서열의 3' 말단으로 이루어진 53 아미노산 폴리펩타이드에 대한 개방 판독 프레임을 생성시킬 것이다. 제한 부위는 밑줄쳐져 있다: CAX136 및 CAX139내 BglII; CAX137 및 CAX138내 NotI.
CAX136 AGATCTGGCGGTAACAGGGGATTGGC (서열 번호 70)
CAX137 GCGGCCGCCAAGACGGTATTCGGGCTGC (서열 번호 71)
CAX138 GCGGCCGCGATCTGCTGGTGTTCTTCCGC (서열 번호 72)
CAX139 AGATCTCCTACCGACCAGGCATTGGC (서열 번호 73)
PCR을 상부 및 하부 단편의 증폭을 위해 Pfu Ultra II 폴리머라제(제조원: Stratagene)를 사용하여 수행하였다. 반응 조건은 94℃에서 4분 동안의 초기 변성, 95℃에서 20초 변성, 57℃에서 30초 어닐링, 72℃에서 30분 연장 및 72℃에서 5분 동안 최종 연장의 30 주기를 포함한다. 주형은 100 ng의 잔토모나스 캄페스트리스 피브이. 캄페스트리스(균주 ATCC13951; "Xcc") 게놈 DNA로 이루어졌다. PCR 단편을 pCR-Blunt II-TOPO(제조원: Invitrogen)내로 클로닝하고 에스케리키아 콜라이 TOP10(제조원: Invitrogen)내로 형질전환하였다. 상부 상동성 클론의 관련 서열은 PCR 생성물의 서열과 일치하나, 이러한 공유된 서열은 당해 영역(프라이머 배제됨)에 대한 Xcc 균주 ATCC33913의 발표된 서열과 14개 염기 쌍이 상이하다. 이들 서열 변이는 B-1459/ATCC13951과 ATCC33913 게놈 사이의 미묘한 차이를 반영하는 경향이 있다. 하부 상동성 클론의 관련 서열은 PCR 생성물의 서열과 일치하며 당해 서열은 당해 영역(프라이머는 배제됨)에 대해 발표된 Xcc ATCC33913 서열과 상이하지 않다. gumB의 상부 영역(상기) 및 gumM의 하부 영역(상기)에 대한 클로닝된 PCR 생성물을 함유하는 플라스미드(각각 약 1㎍)를 7.5 U NotI 및 7.5 U BglII을 사용하여 37℃에서 2시간 동안 분해하였다. 분해물을 아가로즈 겔 전기영동에 적용시키고 목적하는 단편(각각 약 1.4 kb)을 QIAGEN 미니-용출 키트로 정제하였다. 플라스미드 pCX027(약 1.0㎍)을 15U BglII를 사용하여 15μL의 반응물 속에서 37℃에서 2시간 동안 분해하고, 약 5U의 안트악틱 포스파타제(제조원: New England Biolabs)로 75μL의 반응물 속에서 15분 동안 37℃로 처리한 후 65℃에서 10분 동안 가열하였다. BglII 분해된 pCX027의 정제 후, 3-방식 연결을 20μL의 반응물 속에서 정제된 pCX027, gumB의 상부 단편, 및 gumM의 하부 단편을 이용하여 실온으로 3시간 동안 수행하였다. 반응 혼합물의 1/2을 에스케리키아 콜라이 TOP10(제조원: Invitrogen)내로 형질전환한 후 LB Ap100 또는 LB Tc5에 37℃에서 플레이팅하였다. 콜로니 PCR을 수행하여(위에서 기술한 바와 같음) CAX140(상부 상동성 영역내) 및 CAX145(하부 상동성 영역내)를 사용하여 바람직한 구조를 갖는 클론을 확인하였다.
CAX140 CCGAATTTCCGAGCCTGG (서열 번호 74)
CAX145 GCCCGCTCGCTTCGTCG (서열 번호 75)
플라스미드를 PCR 양성 클론으로부터 퀴아젠 퀴아프렙 스핀 미니프렙 키트(QIAGEN Qiaprep Spin Miniprep Kit)를 사용하여 제조하고 BglII, NdeI 또는 NcoI를 사용하여 분해함으로써 상부 및 하부 서열내 상동성 영역의 이의 배향을 포함하는 플라스미드의 구조를 확인하였다. 쌍을 이룬 상동성 영역의 배향이 벡터 Tetr 유전자에 대한 배향과 동일하거나 반대인 플라스미드를 각각 pKM001 및 pKM002로 지정하였다.
플라스미드 pKM001 또는 pKM002를 Xcc 균주 MSC116에 전기천공에 의해 전달하였다(참조: Oshiro et al., J. Microbiol. Method 2006;65:171-179). TcR 콜로니를 pKM001(5.3 x 103/㎍) 및 pKM00(5.0 x 103 /㎍)의 형질전환체 각각으로부터 수득하였다. 게놈 DNA를 pKM001 형질전환체로부터 유래된 분리된 TcR 균주로부터 제조하고 PCR에 의해 pKM001 통합의 부위에 대해 평가하였다. 프라이머 쌍을 선택하여 하부 영역에 대한 pKM001에 사용된 상부 영역 외부의 게놈 서열 및 상부 영역에 대해 pKM001에서 사용된 하부 영역 외부의 서열의 연결을 측정하였다. 구체적으로, 프라이머 prKM001(상부 영역에 대한 "외부 프라이머"; 하기 참조) 및 CAX145(하부 상동성 영역내; 상기 참조)를 사용하여 상부 연결 및 prKM002(하부 영역에 대한 "외부 프라이머"; 하기 참조)와 CAX142(상부 상동성 영역내; 하기 참조)를 사용하여 하부 연결을 시험하였다.
prKM001 ACGTGGATGCGGTCGTCGC (서열 번호 76)
prKM003 GGGGCTTGCGGGTCGGC (서열 번호 77)
CAX142 CGTATGCTGAGAATGACGACC (서열 번호 78)
PCR을 Go Taq DNA 폴리머라제(제조원: Promega)를 사용하여 0.5μM의 각각의 프라이머, 250μM의 각각의 dNTP, 600 내지 1000ng의 DNA 주형, 및 0.5 U 효소로 수행하였다. 반응 조건은 94℃에서 5분 동안의 초기 변성, 94℃에서 15초의 변성, 55℃에서 30초 어닐링, 및 72℃에서 4분 연장 및 2분 동안 최종 연장의 30 주기를 포함한다. "팝-인" 분리체를 pKM001의 상부 통합을 위해 확인하였다. 이들 분리된 균주를 MSC242, MSC247 및 MSC248로 지정하였다.
MSC242, MSC247 및 MSC248을 LBLS 배지 속에 30℃에서 성장을 위해 접종한 후, 동일한 배지내로 48시간 간격에서 1:1000 희석을 사용하여 3회 서브-배양하였다. 수득되는 배양물을 희석시키고, 분취량을 NA Str50 플레이트에 스프래딩시켰다. 수득되는 콜로니를 NA 및 NA Tc5 플레이트에 전달하였다. TcS 균주는 3개 균주로부터 1 내지 2%의 빈도로 관찰되었다. 선택된 TcS 균주에서 게놈 구조를 PCR에 의해 평가하여 상부 연결에 대해 prKM001과 CAX145 및 하부 연결에 대해 prKM003와 CAX142를 사용하여 gumB로부터 gumM까지의 크산탄 검 합성 유전자의 결실을 확인하였다(상기 참조). PCR을 헤르쿨라제 II 융합 DNA 폴리머라제(제조원: Stratagene)를 사용하여 0.25μM의 각각의 프라이머, 250μM의 각각의 dNTP, 500 내지 700 ng의 DNA 주형 및 0.5 U 효소로 수행하였다. 반응 조건은 98℃에서 4분 동안의 초기 변성, 98℃에서 20초의 변성, 60℃에서 20초 어닐링, 및 72℃에서 2분 연장 및 3분 동안의 최종 연장의 30주기를 포함하였다. 3개의 "팝-아웃" 균주(1개는 각각의 "팝-인" 균주로부터)는 크산탄 검 생합성 유전자 클러스터의 결실과 일치하는 PCR 생성물을 나타내었다. MSC242, MSC247 및 MSC248로부터의 이들 크산탄 검 생합성 유전자 결실 "팝-아웃" 균주를 각각 MSC255, MSC256 및 MSC257로 지정하였다. 아가 플레이트 상의 MSC255, MSC256, 및 MSC257의 콜로니는 MSC116 모 균주의 콜로니와 비교하여 명확하게 비-점액성이었다.
에스케리키아 콜라이 B
야생형 에스케리키아 콜라이 B의 유도체(ATCC11303)인 에스케리키아 콜라이 BL21(DE3)의 게놈이 불활성인 2 군 캡슐 유전자 클러스터를 함유하는 것으로 보고되었으며, 여기서 영역 1 및 3은 완전(및 기능성)하였지만, 영역 2는 파괴되어 비-기능성이었다(참조: Andreishcheva, E.N., and Vann, W.F., Gene 2006;384:113-119). 영역 2의 유전자가 중합체-특이적이지만 영역 1 및 3은 유전적이고 거의 특이적이 아님을 고려할 때, 에스케리키아 콜라이 B를 가공하여 플라스미드 상에 단지 K4 영역 2개 유전자를 제공함으로써 콘드로이틴을 합성하거나 염색체 내로 통합시킬 수 있다(하기 참조). 콘드로이틴 생산용 숙주로서 에스케리키아 콜라이 B의 유용성을 개선시키기 위해, 콜란 산의 생산을 상기 에스케리키아 콜라이 K-12에 대해 기술된 바와 같은 유전적 돌연변이로 제거하였다.
콜란산 오페론의 결실: 에스케리키아 콜라이 B 콜란산 오페론의 결실을 위한 공정은 위에서 기술한 K-12 균주에 대해 사용된 것을 따른다. 본 발명의 시점에, 에스케리키아 콜라이 B 게놈 서열은 공공 이용가능하지 않았다. 비록 K-12 및 B 균주가 밀접하게 관련되어 있지만, DNA 서열내 일부 차이가 예측된다. 따라서, 새로운 상부 및 하부 상동성 영역의 생성이 요구되었으며, 균주 K-12에 대해 사용된 기존의 프라이머를 사용하였다. 구체적으로, 프라이머 쌍 CAX128xCAX129 및 CAX130xCAX131 및 에스케리키아 콜라이 B 게놈 DNA 주형을 사용한 PCR을 사용하여 상부 및 하부 상동성 영역 각각을 생성하였다. 크기가 약 1kb인 생성물을 수득하고, 클로닝하며, 서열분석하였다. 비-프라이머 서열에서, 상부 상동성 영역(944 bp)은 K-12 상부 영역과 단지 2개 염기(전이) 만이 상이하며, 하부 상동성 영역(911 bp)은 30개 염기(24개의 전이, 6개의 변위)가 상이하다. 상부 및 하부 단편을 pMAK705내로 클로닝하여 pMAK-BCL을 생성하였다.
플라스미드 pMAK-BCL을 에스케리키아 콜라이 B내로 전기천공에 의해 도입하였다. LB 배지에 새로운 콜로니를 접종하고 밤새 37℃에서 격렬하게 진탕하면서 항온처리하였다. 새로운, 예비-가온된 LB의 용적을 밤샘 배양물에 접종하여 0.03의 초기 OD600 판독값(암순응측정기(BioPhotometer), 에펜도르프)를 수득하였다. 배양물을 OD600 ~0.8까지 성장시킨 후 빙상에서 30 내지 40분 동안 급냉시켰다. 세포를 원심분리(10분, 4000g)에 의해 수집하고, 세포를 원래의 용적의 빙-냉 탈이온수 속에서 재-현탁한 후 재-원심분리시켜 2회 세척하였다. 최종 원심분리로부터의 세포를 1/500th 용적의 빙-냉수 속에 현탁시켰다. pMAK-BCL(200 ng)을 50μL의 제조된 에스케리키아 콜라이 B 현탁액에 가하고 빙상에서 약 20분 동안 항온처리하였다. 전기천공을 Gene Pulser Xcell(제조원: BioRad)을 사용하여 0.1 mm 갭 큐베트(gap cuvette) 속에서 25μP, 200Ω, 및 1.8 kV의 셋팅으로 수행하여 4.5 내지 5.0 msec의 기간을 수득하였다. 펄스화된 세포를 350μL의 SOC 배지로 희석시키고(참조: Maniatis, 1989) 37℃에서 1시간 동안 항온처리한 후; 5 내지 10μL를 LB Cm34 아가 플레이트에 43℃에서 항온처리와 함께 스프래딩시켰다. 2일 후 나타나는 콜로니("팝-인" 후보물을 나타냄)를 LB Cm34 아가 플레이트에 43℃에서 스트리킹하고, 수득되는 콜로니를 LB 배지(Cm 없음)에 성장 및 일련 계대를 위해 30℃에서 접종하였다. 이들 배양물로부터 유래된 콜로니를 Cm-민감성에 대해 시험하고, "팝-아웃" 후보물을 확인하였다. 콜로니 PCR을 사용하여 후보물 균주를 특성화하였다. 하나의 분리체가 프라이머 쌍 CAX129 x CAX132, CAX131 x CAX132, CAX132 x CAX135, CAX129 x CAX135, 및 CAX162 x CAX163을 사용하여 예측된 PCR 생성물을 제공하는 것으로 밝혀졌다. 콜란산 유전자 클러스터를 결실한 당해 에스케리키아 콜라이 B 분리체는 MSC364로 명명하였다.
실시예 4
발현 벡터의 작제
에스케리키아 콜라이에 대해 특이적인 잘 특성화된 고-카피-수(hig-copy-number) 및 저-카피-수 플라스미드 벡터가 기술되어 있다(참조: Balbas and Bolivar, Methods Enzymol. 1990;185:14-37, Das, Methods Enzymol. 1990;182:93-112, Mardanov et al. 유전자 2007;15(395):15-21). 이러한 벡터는 에스케리키아 콜라이내에서 조절된 유전자 발현을 위한 다양한 잘 특성화된 프로모터 시스템을 사용한다. 또한, 에스케리키아 콜라이, 엑스 캄페스트리스 및 광범위한 다른 그람 음성 박테리아에서 기능하는 RK2(저 카피 수 IncP) 및 RSF1010(고 카피 수 IncQ)와 같은 광범위한 숙주 범위 플라스미드를 기초로 한 접합적으로(conjugally)-전파가능한 플라스미드 벡터가 또한 이용가능하다[참조: Franklin and Spooner, Promiscuous plasmids in Gram-negative bacteria Academic Press (London) 1989 pp247-267, Mather et al. Gene 1995;15:85-88, Haugen et al., Plasmid 1995;33:27-39. Mermod et al., J Bact. 1986;167:447-454]. 합성 콘드로이틴 생합성 유전자 세트를 이들 다용도의(versatile) 광범위한 숙주 범위 벡터내로 클로닝함으로써 동일한 플라스미드가 잔토모나스 캄페스트리스, 스핑고모나스 엘로데아, 슈도모나스 푸티다, 및 비-병원성 에스케리키아 콜라이를 포함하는 광범위한 배열의 그람-음성 박테리아내에서 유전자 전달 및 발현을 위해 사용될 수 있다[참조: Guiney and Lanka, Promiscuous plasmids in Gram-negative bacteria Academic Press (London) 1989 pp27-54].
많은 유용한 IncP-계 벡터가, 임상 슈도모나스 분리체로부터 원래 분리된 후 시험한 거의 모든 그람 음성 박테리아내로 자가 전달되어 당해 박테리아내에서 기능할 수 있음이 밝혀진 접합적으로 자가-전파가능한 플라스미드인 RK2로부터 유래된다. "헬퍼(helper)" 기능이 제2 플라스미드로부터 인 트랜스(in trans)로 공급되는 경우, 안정한 레플리콘(replicon)이며 접합적으로 전달될 수 있는, RK2의 보다 작은 유도체가 작제되었다. 하나의 이러한 플라스미드는 pFF1이다(참조: Durland et al., J. Bact. 1990;172:3859-3867). 당해 플라스미드의 일부 유용한 유도체가 기술되어 있으며; 이들 중 하나는 슈도모나스 TOL 플라스미드의 Pm 프로모터 및 조절 유전자 xylS를 가하여 다양한 그람 음성 박테리아내에서 기능하는 것으로 밝혀진 강력하고, 잘 조절된 프로모터를 제공하는 pJB653(참조: Blatny et al., Appl. Enviorn. Micro. 1997;63:370-379)이다. 이러한 벡터 및 관련된 작제물은 미국 특허 제6,258,565호의 대상이다. 다양한 IncQ-계 플라스미드 벡터가 슈도모나스 푸티다로부터 원래 분리된 8.7kb 플라스미드인 RSF1010로부터 유래된다. RSF1010은 에스케리키아 콜라이 및 광범위한 그람 음성 박테리아내에서 증식할 수 있다. Pm 프로모터 및 xylS 조절 단백질을 수반하는 RSF1010의 유도체가 작제되고 기술되어 있다. 플라스미드 pNM185(참조: Mermod et al., J. Bact. 1986;167:447-454)는 Pm 프로모터 및 xylS 조절 유전자를 수반하는 RSF1010 유도체이다.
슈만(Schumann) 등의 문헌(참조: Plasmid 2005;54:241-248)은 재조합 단백질의 안정한 세포내 발현을 허용하는 바실러스 서브틸리스를 위한 일련의 플라스미드-계 발현 벡터를 기술하였다. 이들 발현 벡터는 쎄타 환(theta circle)으로서 바실러스 서브틸리스내에서 복제하는 에스케리키아 콜라이-바실러스 서브틸리스 셔틀 벡터 pMTLBS72를 기초로 하며 결과적으로 롤링 환 메카니즘(rolling circle mechanism)을 통해 복제하는 pUB110과 같은 전형적인 바실러스 서브틸리스 플라스미드보다 더 안정하다. 구성적 프로모터 PlepA, 열 및 산 쇼크에 의해, 및 에탄올에 의해 유도될 수 있는 프로모터 PgsiB, 및 크실로즈 및 IPTG 각각의 첨가에 반응하는 PxylA 및 Pspac 프로모터를 함유하는 당해 플라스미드의 유도체가 기술되어 있다.
IhcP 및 IncQ 플라스미드와 양립성인 것으로 보고된 광범위한 숙주 범위 플라스미드 pBHR1(참조: Szpirer et al ., J. Bacteriol. 2001;183:2101-10)은 MoBiTec GmbH(독일 괴팅겐 소재)에서 구입하였다. 당해 플라스미드를 변형시켜 상기 참조된 Pm / xylS 발현 시스템을 사용하는 벡터(pDD54)를 생성하였다. pBHR1-계 발현 벡터를 작제하는데 있어서 제1 단계는 당해 플라스미드에 존재하는 카나마이신 내성(KanR) 유전자를 제거하는 것이었다. 이는, pBHRI 및 유도체의 접합적 전달을 지시하기 위해 사용될 수 있는 플라스미드인 pRK201301이, 또한 KanR 유전자를 보유하므로 바람직하였다. 또한, 이러한 유전자, 및 플랭킹 서열의 결실은 하기 설명한 특정의 후속적인 클로닝 단계를 촉진하였다. pBHR1은 또한 클로람페니콜-내성(CamR)을 부여하는 유전자를 보유하며 이 항생제가 당해 플라스미드를 선택하기 위해 카나마이신대신 사용될 수 있다. 플라스미드 DNA를 SbfI로 분해한 pBHR1(도 8a에 도해됨)으로부터 제조하고, 분해 생성물을 연결시키고 클로람페니콜-내성, 카나마이신-민감성 형질전환체에 대해 스크리닝함으로써 KanR 유전자를 함유하는 1.2 kb SbfI 단편을 결실시켰다. 하나의 이러한 형질전환체로부터의 플라스미드를 pDD39(참조: 도 8a)로 지정하고 추가의 작제 단계에서 사용하였다.
Pm 프로모터로부터의 발현을 양성적으로 조절하는, xylS 유전자를 PCR에 의해, 슈도모나스 푸티다(Pseudomonas putida) ATCC 33015로부터 제조된 pWW0(TOL 플라스미드) DNA로부터 증폭시켰다. 판매회사의 프로토콜에 따라 퀴아젠 플라스미드 미니 키트(제조원: QIAGEN Inc., 미국 캘리포니아주 발렌시아 소재)를 사용하여, 4㎍의 pWW0 DNA를 슈도모나스 푸티다 ATCC 33015의 20 mL의 새로운 밤샘 배양물로부터 분리하였다. 당해 DNA 제제를, xylS 유전자 및 플랭킹 DNA 서열을 후속적인 PCR 스플라이싱 반응에 의해 함께 후속적으로 연결되는 2개의 단편으로서 증폭시키는 PCR 반응을 위한 주형으로서 사용하였다. 당해 과정은 xylS의 해독 정지 코돈의 하부의 NsiI 부위 9개 염기 쌍의 첨가를 촉진하였다. PCR의 초기 라운드에서 1개의 반응(반응 A)은 프라이머 DHD197(서열 번호 103) 및 DHD201(서열 번호 104)을 사용하였고 제2 반응(반응 B)은 프라이머 DHD200(서열 번호 105) 및 DHD198(서열 번호 106)을 사용하였다. 이들 프라이머의 서열은 다음과 같다;
DHD197 5> GCACTGCAGATCCCCTTTATCCGCC >3 (서열 번호 103)
DHD198 5> GCACTGCAGATCCACATCCTTGAAGGC >3 (서열 번호 106)
DHD200 5> GATTACGAACGATGCATAGCCGAAGAAGGGATGGGTTG >3 (서열 번호 105)
DHD201 5> CTTCTTCGGCTATGCATCGTTCGTAATCAAGCCACTTCC >3 (서열 번호 104)
PCR 반응을 PfuUltra II 폴리머라제(제조원: Stratagene, 미국 캘리포니아 라 졸라 소재)를 사용하여 판매회사 프로토콜에 따라 수행하였다. 각각의 100μL의 반응물에서, 프라이머를 각각 0.4μM의 최종 농도로 가하고, dNTP를 각각 200μM의 최종 농도로 가하고 10 나노그람의 pWW0 DNA를 주형으로서 가하였다. PCR 반응을 퍼킨-엘머(Perkin-Elmer) GeneAmp 2400 열순환기 속에서 다음 주기 매개변수를 이용하여 수행하였다: 95℃에서 2분의 1 주기; 95℃에서 20초, 60℃에서 20초, 및 72℃에서 40초의 30 주기; 72℃에서 3분의 1주기를 사용하여 수행하고; 4℃에서 유지. 이들 반응의 생성물을 아가로즈 겔 전기영동으로 분석하였다. 관찰된 PCR 생성물의 크기는 반응 A(1259 bp) 및 반응 B(422 bp) 둘다의 생성물에 대해 예측된 크기와 일치하였다.
이들 반응의 생성물을 퀴아젠 퀴아퀵 PCR 정제 키트(Qiagen QIAquick PCR Purification Kit)(제조원; QIAGEN, 미국 캘리포니아주 발렌시아 소재)를 사용하여 판매회사의 프로토콜에 따라 정제하고, 각각 1μL를 1 mL의 멸균 증류된 탈이온수에 가하였다. 50μL의 당해 혼합물에 10μL의 10X PfuUltra II 반응 완충액, 10μL의 dNTPS의 스톡 용액(각각 10 mM), 10μL의 DHD197의 스톡 용액(4μM), 10μL의 DHD198의 스톡 용액(4μM), 16μL의 멸균 증류된 탈이온수 및 2μL의 PfuUltra II 폴리머라제를 가하였다. 당해 PCR 반응을 반응 A 및 B에 대해 위에서 기술한 과정을 사용하여 수행하였다. 당해 반응의 생성물을 퀴아젠 퀴아퀵 PCR 정제 키트(제조원: QIAGEN, 미국 캘리포니아주 발렌시아 소재)를 사용하여 판매회사 프로토콜에 따라 정제하고 아가로즈 겔 전기영동으로 분석하였다. 강력한 밴드가 PCR 스플라이싱 반응의 생성물의 예측된 크기, 1610 bp와 일치하는 위치에서 관찰되었다. 당해 밴드를 겔로부터 퀴아퀵 겔 추출 키트(QIAquick Gel Extraction Kit)(제조원: QIAGEN Inc., 미국 캘리포니아주 발렌시아가 소재)를 사용하여 판매회사 프로토콜에 따라 잘라냈다.
당해 PCR 단편을 pCR-Blunt II-TOPO 클로닝 벡터(제조원: Invitrogen, 미국 캘리포니아주 칼스바드 소재)내로 판매회사 프로토콜에 따라 클로닝하였다. 수득되는 플라스미드를 pDD42로 지정하였으며 도 8a에 도해한다. PCR 프라이머 DHD197 및 DHD198은 1610 bp PCR 단편의 각각의 말단으로부터 3개 염기쌍에 PstI 부위를 가하였다. pDD42내 PstI 단편의 서열을 측정하였다(서열 번호 107). 당해 서열은 보고된 pWWO 서열(GenBank, AJ344068)에 기초하여 xylS 유전자에 대해 예측된 서열과 일치하였으며, xylS의 해독 정지 코돈의 하부(3') 9개 염기 쌍에서 Nsil 부위를 생성하는, 프라이머 DHD200 및 DHD201로부터 유래된 5개 염기 쌍의 첨가를 나타내었다. xylS의 하부 비-코딩 영역에서, 2개의 서열 차이가 pDD42내 클로닝된 PstI 단편과 GenBank, AJ344068에서 보고된 서열 사이에서 관찰되었다. G 잔기의 삽입은 xylS 유전자의 TGA 정지 코돈에 대해 3' 방향으로 119 및 181 bp에서 관찰된다. 이들 서열 차이는 xylS 유전자와 xylH 유전자 사이의 유전자간 영역내에서 발생한다.
xylS 유전자를 함유하는 PstI 단편을 pDD42으로부터 절개하고, 젤-정제하고 pDD39의 SbfI 부위내로 클로닝하였다. PstI 및 SbfI 효소는 함께 연결될 수 있는 동일한 4bp의 오버행(overhang)을 갖는 분해 생성물을 생성하지만, SbfI 인식 부위는 생성되는 재조합체내에서 파괴된다. pDD42로부터의 PstI 단편 위에 함유된 xylS 유전자를 함유하는 pDD39 유도체는 pDD47로 명명하며 도 8a에 나타낸다.
RNA 폴리머라제의 결합에 요구되는 최소의 Pm 프로모터 서열 및 XylS 단백질(참조: Dominguez-Cuevas et al., 2008)과 합성 상부 및 하부 전사 종결인자 및 Pm 프로모터의 바로 하부의 유전자를 클로닝하기 위한 다수의 제한 부위에 걸친 대략 90bp의 TOL 플라스미드 DNA 서열을 포함하는 470bp DNA 단편(서열 번호 79)을 DNA 2.0(Carlsbad, CA)에 의해 새로이(de novo) 합성하였다. 도 8b는 DNA 2.0 pJ201 벡터내에 클로닝된 당해 470bp 단편을 함유하는 pJ201:11352를 나타낸다. 프로모터-함유 단편을 플랭킹 AccI 부위로 설계하여 pBHR1 및 유도체 pDD47 플라스미드내에 위치한 양립성의, 및 추정상, 유일한 BstB I 부위내로 클로닝되도록 하였다. 그러나, pDD47, 및 후속적으로 pBHR1의 분해는 2개의 BstBI 부위의 존재를 나타내었다. 분명히, 문헌(참조: GenBank: Y14439.1)에 보고된 pBHR1의 서열은 전체적으로 정확하지 않다. 이러한 차이로 인하여, 클로닝된 Pm 프로모터를 pDD47에 가하기 위해 추가의 클로닝 단계가 요구되었다.
도 8a에 나타낸 바와 같이, pDD47은 프로모터의 삽입을 위해 표적화된 주석이 달린 BstBI 부위를 플랭킹하는 유일한 EcoRI 및 AgeI 부위를 함유한다. 이는 또한 AgeI 부위의 하부의 NgoM IV 부위를 함유한다. pDD47의 763 bp EcoRI-NgoMIV 단편을 잘라내어 pREZ6를 절단한 EcoRI-NgoMIV내로 클로닝함으로써 pDD49를 생성하였다(도 8b). 또한 도 8b에 도해된 pREZ6은 pBluescript SK+(제조원: Stratagene, 미국 캘리포니아주 라 졸라 소재)의 유도체이며, 여기서 짧은 폴리링커 서열(ttaattaagggtttaaactac(서열 번호 142))은 pBluescript SK+의 유일한 DraIII 부위에서 삽입되었다. 당해 작제물에서, 목적한 BstBI는 유일하므로, Pm 프로모터를 함유하는 pJ201:11352의 AccI 단편을 잘라내어 pDD49의 BstBI 부위내로 클로닝함으로써 pDD50을 생성하였다. 후속적으로, pDD50의 EcoRI-AgeI 단편을 잘라내어 pDD47의 5055 bp EcoRI-AgeI 단편에 연결함으로써 도 8c에 나타낸 발현 벡터 pDD54를 생성하였다. pDD54를 하기 및 실시예 6, 7, 8 및 9에 기술된 바와 같이 대체 숙주로 전달하여 발현시키기 위한 K4 캡슐 유전자의 초기 클로닝에서 발현 벡터로서 사용하였다.
3개의 합성 유전자 단편 kpsFEDUCS(FS 분절), kpsMTkfoABCFG(MG 분절) 및 kfoDIEH(DH 분절)은 합성 판매회사, DNA2.0(미국 캘리포니아주 칼스바드 소재)로부터 입수하였다. 합성 DNA는 플라스미드 벡터, pJ241내에서 클로닝된 단편으로서 제공되었다. 도 8d는 이들 작제물의 플라스미드 도해를 나타낸다. 합성 유전자를 pDD54내에 후속적으로 클로닝되는 단일 오페론으로 조립하였다. 당해 공정에서 제1 단계는 FS 및 MG 분절을 단일 단편으로 조합시키는 것이었다. FS 분절과 MG 분절을 플라스미드 벡터, pJ241 상에 상이한 순열로 조합시킨 2개의 플라스미드를 작제하였다.
플라스미드 pJ241:10662 및 pJ241:10664의 분취량을 SbfI + BglII로 분해하고, 알칼린 포스파타제로 처리하고 QIAEX II 겔 추출 키트(제조원: Qiagen Inc., 미국 캘리포니아주 발렌시아 소재)를 사용하여 판매업자의 프로토콜에 따라 겔-정제하였다. 이와 동시에, pJ241:10662 및 pJ241:10664 DNA의 분취량을 SbfI 및 BamHI로 분해하고 수득되는 합성 MG 및 FS 유전자 분절을 각각 함유하는 대략 9.1 kb 및 대략 8.0 kb의 SbfI-BamHI 단편을 상기와 같이 겔-정제하였다. 겔-정제된 대략 9.1 kb의 SbfI-BamHI MG 분절을 FS 유전자 분절을 함유하는 SbfI 및 BglII 분해되고 포스파타제처리된 pJ241:10664 벡터내로 연결하였다. 비록 BamH I 및 BglII 효소는 상이한 서열, GGATCC 대 AGATCT 각각을 인식하지만, 이들은 동일한 4 bp 오버행(GATC) 을 생산하므로 분해 생성물을 함께 연결할 수 있으나 수득되는 연결 생성물은 후속적으로 효소에 의해 인식될 수 없다. pDD37로 지정된, 수득되는 재조합 플라스미드는 도 8e에 나타낸다. 당해 작제물은 합성 유전자에 대해 5'에 SbfI 및 합성 유전자에 대해 3'에 pJ241:10664내에 존재하는 BamHI 부위를 보유한다. 따라서, 합성 유전자 세트 kpsMTkfoABCFGkpsFEDUCS(MGFS 분절)을 대략 17.1kb의 SbfI-BamHI 단편으로 잘라낼 수 있다. 유사하게, 겔-정제된 SbfI-BamHI 대략 8.0 kb FS 분절을, MG 유전자 분절을 함유하는, SbfI 및 BglII 분해되고, 포스파타제 처리된 pJ241:10662 벡터내로 연결하였다. pDD38로 지정된 수득되는 재조합 플라스미드는 도 8e에 나타낸다. 다시, 당해 작제물은 합성 유전자에 대해 5' 에 SbfI 부위 및 합성 유전자에 대해 3'에 pJ241:10662내에 존재하는 BamHI를 보유한다. 따라서, 당해 합성 유전자 세트, kpsFEDUCSkpsMTkfoABCFG(FSMG 분절)은 대략 17.1kb의 SbfI-BamHI 분절로 잘라낼 수 있다.
pJ241:10663에 함유된 합성 유전자 kfoD, kfoI(또는 orf3), kfoE 및 kfoH(또는 orf1)(DH 분절)(참조: 도 8d)를 플라스미드 pDD37 및 pDD38내로 클로닝하였다. 플라스미드 pDD37 및 pDD38을 EcoRI으로 분해하고, 알칼린 포스파타제로 처리하고 QIAEX II 겔 추출 키트(제조원: Qiagen Inc., 미국 캘리포니아주 발렌시아 소재)를 사용하여 판매회사 프로토콜에 따라 겔-정제하였다. 이들 플라스미드 각각에서 유일한 EcoRI 부위는 kfoC 및 kfoF를 분리하는 유전자간 영역내에 위치한다. 합성 유전자 kfoD, kfoI, kfoE 및 kfoH를 함유하는 DH 분절은 pJ241:10663로부터 대략 4.2 kb EcoRI 단편으로서 잘라내고 겔-정제하였다. 당해 단편을 EcoRI-절단되고 포스파타제 처리된 pDD37 및 pDD38 플라스미드 둘다내로 연결시켰다. 수득되는 재조합체를 진단 제한 효소로 절단함으로써 대략 4.2 kb EcoRI 단편의 배향에 대해 시험하였다. 정확한 배향으로 첨가된 DH 분절을 함유한 재조합체가 용이하게 수득되었다. 수득되는 플라스미드, pDD37로부터 유래된 pDD51, 및 pDD38로부터 유래된 pDD52를 도 8f에 나타낸다. 이들 작제물 각각은 K4 캡슐 클러스터 유전자 모두를 함유하지만, 나타낸 바와 같이, 유전자 순서는 2개 플라스미드에 대해 상이하다: pDD51에서 유전자 순서는 kpsMTkfoABCDIEHFGkpsFEDUCS이고, pDD52에서 그 순서는 kpsFEDUCSkpsMTkfoABCDIEHFG이다. 둘다의 경우에서 전체 K4 유전자 세트는 대략 21kb의 SbfI-BamHI 단편으로서 잘라낼 수 있다. 이들 플라스미드로부터의 K4 캡슐 유전자를 위에서 기술한 발현 벡터 pDD54내로 서브클로닝하여 발현 플라스미드 pDD57 및 pDD58을 각각 생성하였다. 이들 플라스미드 둘다는 도 8g에 나타낸다. 전체 합성 K4 캡슐 유전자 세트를 pDD51 및 pDD52로부터 대략 21 kb SbfI-BamHI 단편으로서 잘라내고, QIAEX II 겔 추출 키트(제조원: Qiagen Inc., 미국 캘리포니아주 발렌시아 소재)를 사용하여 판매업자의 프로토콜에 따라 겔-정제하고 SbfI-BamHI 분해된 pDD54내로 클로닝하였다.
pDD57 및 pDD58에서 전체 K4 캡슐 유전자 세트(17개 유전자)는 Pm 프로모터 및 xylS 유전자에 의해 코딩된 XylS 조절 단백질의 조절하에 있다. pDD54 및 pDD58 플라스미드는, 유전자 클로닝을 위한 이의 용도를 향상시키는 다수의 돌연변이를 포함하는 시판되는 에스케리키아 콜라이 "TOP10" 균주"(제조원: Invitrogen, 미국 캘리포니아주 칼스바드 소재)내에서 원래 작제되었다. 당해 플라스미드를 또한 일반적으로 재조합 DNA 실험에 사용되는 다른 에스케리키아 콜라이 숙주("DH5a")내로 후속적으로 전달하였다. 이들 에스케리키아 콜라이 균주는 생산 플랫포옴(platform)으로서 개발을 위한 이상적인 후보물이 아니다. 따라서, 초기 실험에서, pDD54 및 pDD58을 보다 적합한 에스케리키아 콜라이-12 균주내로 형질전환시키고 수득되는 균주를 실시예 6에서 하기 기술된 바와 같이 콘드로이틴 생산에 대해 시험하였다.
추가의 발현 플라스미드를 또한 pDD57 및 pDD58의 변형으로 작제하였다. 테트라사이클린-내성 유전자를 하기 설명한 바와 같이 발현 플라스미드 pDD57 및 pDD58에 가하였다. 테트라사이클린-내성은 플라스미드 도입 및 유지를 위한 선택으로서 잠재적으로 2가지 장점을 갖는다. 첫째는, 테트라사이클린-내성(TcR)은, 내성 메카니즘이 세포 밖으로 항생제의 수송에 기초하며, 클로람페니콜 및 많은 다른 항생체의 경우에서와 같이, 항생제의 불활성화에 기초하지 않기 때문에 플라스미드 유지에 대한 전형적으로 더욱 엄격한 선택이다. 따라서, 배양 배지 속에서 선택제의 효과적인 농도는 세포 성장 및 대사에 의해 변경되지 않는다. 둘째로, 테트라사이클린에 대해 내성을 부여하는 자발적인 염색체 돌연변이는 일반적이지 않으며, 잔토모나스 캄페스트리스에서 관찰되지 않았다. 대조적으로, 클로람페니콜에 대해 내성을 부여하는 자발적인 염색제 돌연변이가 실시예 6에 기술된 것들과 같은 플라스미드 전달 실험에서 잔토모나스 캄페스트리스에서 관찰되었다. 이들 돌연변이는 pDD57 또는 pDD58와 같은, 목적한 플라스미드를 획득한 CmR 형질전환체/외부-접합체를 잠재적으로 모호하게 할 수 있다.
발현 플라스미드 pDD57 및 pDD58은 테트라사이클린-내성(TcR)의 특성을 부여하는 유전자의 첨가로 변형된 반면, 당해 플라스미드의 클로람페니콜-내성(CmR) 특성은 유지되었다. 플라스미드 pCX027(실시예 3 및 상기 도 7b에 기술됨)에 존재하고, 에스케리키아 콜라이 플라스미드 벡터 pBR322내에 존재하는 테트라사이클린-내성 유전자(tetR)를 PCR로 증폭시켜 pDD57 및 pDD58에 존재하는 유일한 BamHI 부위내로 클로닝하였다. tetR 유전자를 증폭시키고 클로닝하는 공정에서, 당해 유전자를 다음과 같이 변형시켰다. PCR 프라이머는 프로모터의 상부의 tetR 유전자의 5' 말단에서 BglII 부위를, 그리고 tetR 정지 코돈의 3'에 BamHI 부위를 추가하였다. 프라이머는 유전자를 추가로 변형시켜 내부 BamHI 부위(단백질의 아미노산 서열을 변화시키지 않음)를 제거하고 증폭되었던 단편에 일반적으로 존재하는 소위 "항-tet" 프로모터를 제거하였다. 당해 프로모터는 tetR 프로모터 근처에 위치하나 반대 방향으로 전사를 지시한다(참조: Balbas et al., Gene 1986;50:3-40). 이러한 변형된 tetR 유전자는 tetR 유전자의 2개의 중첩 분절을 증폭시켜 바람직한 서열 변화를 도입한 2회의 PCR 반응을 수행함으로써 생성하였다. 후속적으로, 이들 2개 단편을 후속적인 PCR 스플라이싱(splicing) 반응에 의해 함께 결합하여, tetR 유전자 및 프로모터의 상부의 tetR 유전자의 5' 말단에서 BglII 부위를 갖는 바람직한 서열의 프로모터 영역, 및 tetR 해독 정지 코돈에 대해 3'에 BamHI 부위를 생성하였다.
제1 PCR 반응(반응 A)은 프라이머 DHD218(서열 번호 113) 및 DHD219(서열 번호 114)를 사용하여 tetR 코딩 서열 및 상부 프로모터 서열의 아미노-말단 부위를 포함하는 대략 400 bp의 DNA를 증폭시켰다. 제2 반응(반응 B)은 프라이머 DHD220(서열 번호 115) 및 DHD221(서열 번호 116)을 사용하여 tetR 코딩 서열의 나머지 및 해독 정지 코돈을 포함하는 대략 900 bp의 DNA를 증폭시켰다. 이들 프라이머의 서열들은 다음과 같이 하기에 나타낸다. DHD218내에 나타낸 밑줄친 서열은 pCX027내에 존재하는 서열 ATCGATAAGCTT(서열 번호 141의 핵산 2843 내지 2854)을 대체하며, 이를 수행함으로써 tetR 프로모터 영역내에 위치한 ClaI 및 HindIII 부위를 제거하고 항-tet 프로모터의 -10 영역의 서열을 변화시킨다. DHD219 및 DHD220의 상보적인 밑줄친 서열은 pCX027의 tetR 유전자의 BamHI 부위를 제거하는 사일런트 돌연변이를 생성한다. 당해 돌연변이는 CTC 루이신 코돈을 TTG 루이신 코돈으로 변화시키므로 TetR 단백질의 아미노산 서열을 변경시키지 않는다.
DHD218 5> GCGAGATCTCATGTTTGACAGCTTATCATCGCTCGGCTTTAATGC
GGTAGTTTATCAC >3 (서열 번호 113)
DHD219 5> CCGGCGTACAAGATCCACAGGACGGGTGTG >3 (서열 번호 114)
DHD220 5> CTGTGGATCTTGTACGCCGGACGCATCGTG >3 (서열 번호 115)
DHD221 5> GCGGATCCTTCCATTCAGGTCGAGGTG >3 (서열 번호 116)
PCR 반응 A 및 B를 PfuUltra II 폴리머라제(제조원: Stratagnen, 미국 캘리포니아주 라 졸라 소재)를 사용하여 수행하였다. 각각 40μL의 반응물에, Pfu 반응 완충액(판매회사에 의해 제공됨)을 1X의 최종 농도로 가하고, 프라이머를 각각 0.4μM의 최종 농도로 가하고, dNTP를 각각 200μM의 최종 농도로 가하며, 1 ng의 pCX027 플라스미드 DNA를 주형으로 가하고 2.5 단위의 PfuUltra II 폴리머라제를 가하였다. PCR 반응 A 및 B를 RoboCycler® 구배 96 열순환기(제조원: Stratagene, 미국 캘리포니아주 라 졸라 소재) 속에서 다음의 주기 매개변수를 사용하여 수행하였다: 95℃에서 1분의 1주기; 95℃에서 30초, 55℃에서 30초, 및 72℃에서 30초의 30 주기; 및 72℃에서 5분의 1 주기; 및 6℃에서 유지. 이들 반응의 생성물을 퀴아젠 퀴아퀵 PCR 정제 키트(제조원: QIAGEN, 미국 캘리포니아주 발렌시아 소재)를 사용하여 판매회사 프로토콜에 따라 정제하고, 아가로즈 겔 전기영동으로 분석하였다. 관찰된 PCR 생성물의 크기는 반응 A(395 bp) 및 반응 B(920 bp) 둘다의 생성물에 대한 예측된 크기와 일치하였다. 이들 단편을 겔로부터 잘라내고 겔 슬라이스로부터 퀴아퀵 겔 추출 키트(제조원: QIAGEN Inc., 미국 캘리포니아주 발렌시아 소재)를 사용하여 판매회사 프로토콜에 따라 용출시키고 30μL의 EB 용출 완충액 속에 회수하였다. 겔-정제된 단편을 후속적인 PCR 스플라이싱 반응: 반응 SP에서 주형으로 제공하였다. 50 μL의 반응물에서, Pfu 반응 완충액을 1X의 최종 농도로 가하고, 프라이머를 각각 0.4μM의 최종 농도로 가하고, dNTP를 각각 200μM의 최종 농도에서 가하고, 반응물 A 및 B의 3μL의 겔-정제된 반응 생성물 각각을 주형으로서 가하고 2.5 단위의 PfuUltra II 폴리머라제를 가하였다. PCR 반응 SP를 RoboCycler® 구배 96 열순환기(제조원: Stratagene, 미국 캘리포니아주 라 졸라 소재) 속에서 다음의 주기 매개변수를 사용하여 수행하였다: 95℃에서 1분의 1 주기; 95℃에서 30초, 55℃에서 30초, 및 72℃에서 30초의 30 주기; 72℃에서 5분의 1 주기; 및 6℃에서 유지. 당해 반응의 생성물을 퀴아젠 퀴아퀵 PCR 정제 키트(제조원: QIAGEN, 미국 캘리포니아주 발렌시아 소재)를 사용하여 판매회사의 프로토콜에 따라 정제하고 아가로즈 겔 전기영동으로 분석하였다. 강력한 밴드가 PCR 스플라이싱 반응의 생성물의 예측된 크기, 1295bp와 일치하는 위치에서 관찰되었다.
당해 PCR 생성물을 BglII 및 BamHI로 분해하고 BamHI-분해된 pDD57 및 pDD58과 연결하였다. 연결 생성물을 사용하여 에스케리키아 콜라이 TOP10(제조원: Invitrogen, 미국 캘리포니아주 칼스바드 소재)를 형질전환시키고 테트라사이클린 내성을 획득한 형질전환체를 10㎍/mL 테트라사이클린을 함유하는 LB 플레이트 위에서 30℃에서 플레이팅하여 선택하였다. 수득되는 테트라사이클린-내성 형질전환체를 진단 PCR 반응으로 스크리닝하고 제한 분해하여 tetR 유전자의 존재를 확인하고 이의 배향을 측정하였다. 바람직한 구조를 갖는 플라스미드를 확인하고 pDD61(pDD57::tetR)(서열 번호 143) 및 pDD62(pDD58::tetR)(서열 번호 144)로 지정하였다. 당해 플라스미드의 도해는 도 8h에 나타낸다. tetR 유전자의 유사한 삽입을 벡터 pDD54의 BamHI 부위내로 수행하여 pDD63을 생성하였으며; 도 8i에 나타내었다. 당해 플라스미드는 클로닝된 K4 유전자를 발현하는 TcR 플라스미드 중 어느 것을 사용한 실험을 위한 TcR 벡터-유일 대조군으로서 제공할 수 있다.
합성 유전자 세트는 생성시킬 목적한 임의의 유전자(들)의 비-극성 결실을 허용하는 제한 부위를 함유한다. 4개 유전자 kfoDIEH의 세트는 단일의 4.2 kb EcoRI 단편의 결실에 의해 결실시켰다. 당해 4.2 kb EcoRI 단편을 발현 플라스미드 pDD57 및 pDD58로부터 및 상기 기술된 이들의 각각의 TcR 유도체, pDD61 및 pDD62로부터 결실시켰다. 도 8g 및 8h에 나타낸, 이들 4개의 플라스미드 모두는 3개의 EcoRI 부위를 함유한다. 2개 부위는 목적한 4.2 kb 단편을 정의하며 제3 부위는 클로람페니콜-내성(CmR)을 부여하는 플라스미드 유전자의 코딩 서열내에서 분해한다. 이들 플라스미드 각각을 EcoRI를 사용하여 완전히 분해하고 수득되는 분해 생성물을 재연결하였다. 연결 생성물을 사용한 형질전환 후, CmR 형질전환체를 선택하고 제한 엔도뉴클레아제 분해로 분석하였다. 4.2 kb EcoRI 단편을 결실한 플라스미드를 모든 예에서 용이하게 수득하였다. 플라스미드 pDD59, pDD60, pDD67 및 pDD66은 각각 pDD57, pDD58, pDD61 및 pDD62의 4.2 kb EcoRI 단편 결실 유도체이며, 모두는 kfoDIEH 유전자가 결실되어 있다. 이들 플라스미드는 도 8j에 묘사한다.
클로닝된 K4 유전자의 발현의 웨스턴 블롯 분석(하기 실시예 5 참조)은, pDD66을 함유하는 에스케리키아 콜라이 균주에서, kpsFEDUCS 유전자의 발현이 최적 미만이었음을 나타내었다. 따라서, pDD66을 변형시켜 kfoG와 kpsF 사이의 유전자내 영역내에 프로모터(Pm)를 혼입시켰다. pDD66에서, 당해 유전자간 영역은 도 8k에 나타낸 바와 같이 유일한 PacI 부위 및 2개의 ClaI 부위를 함유한다. PacI 및 ClaI를 사용한 분해는 2개 단편인 34 bp ClaI 단편 및 12 bp ClaI-PacI 단편을 절개하여 ClaI 및 PacI 말단을 갖는 보다 큰 벡터 단편을 남긴다. 다음 서열:
TTAATTAATGTTTCTGTTGCATAAAGCCTAAGGGGTAGGCCTTTCTAGAGATAGCCATTTTTTGCACTCCTGTATCCGCTTCTTGCAAGGCTGGACTTATCCCTATCAAACCGGACACTGCATCGAT(서열 번호 80)을 갖는 127 bp PacI-ClaI DNA 단편을 ClaI-PacI 분해된 pDD66 벡터 단편내로 삽입하여 pBR1052를 생성하였다. 추가된 127 bp PacI-ClaI 단편은 Pm 프로모터 서열의 카피를 포함한다. 도 8k에 나타낸 바와 같이, pBR1052에서 Pm 프로모터의 첨가된 카피는, 당해 프로모터에서 전사 개시가 kpsFEDUCS 유전자를 포함하는 RNA 전사체를 생성할 수 있도록 배향된다.
발현 플라스미드인 pDD66 및 pBR1052는 하기 기술되어 있다. K4 콘드로이틴 생합성 유전자를 염색체 내로 삽입시키기 위한 유전자 대체 벡터를 작제하기 위하여(하기 실시예 10에서 기술된 바와 같음), pDD66 및 pBR1052로부터의 K4 콘드로이틴 생합성 유전자를 실시예 3에서 상기 기술된 pMAK-CL 대체 벡터내로 클로닝하였다. 도 8l에 도해된 pMAK-CL 벡터는 콜란산(CA) 유전자 클러스터의 상부 및 하부의 클로닝된 DNA 영역 및 이들 영역의 연결부에서 유일한 AscI 클로닝 부위를 함유한다. 실시예 3에 설명되어 있는 바와 같이, 당해 벡터를 사용하여 에스케리키아 콜라이 K-12 W3110내에서 전체 CA 유전자 클러스터의 결실을 작제하여 균주 MSC188을 생성하였다. K4 유전자 발현 카세트를 잘라내고 QIAEX II 겔 추출 키트(제조원: Qiagen Inc., 미국 캘리포니아주 발렌시아 소재)를 사용하여 판매회사 프로토콜에 따라 pDD66 및 pBR1052로 부터 대략 19 kb AscI 단편으로서 겔-정제하고 이들 단편을 AscI-분해되고, 포스파타제-처리되며 겔-정제된 pMAK-CL DNA와 연결하였다. 형질전환체를 테트라사이클린에 대한 내성에 대해 선택하였다. 테트라사이클린에 대한 내성을 부여하는 유전자는 pDD66 및 pBR1052의 AscI 단편 상에, Pm 프로모터 및 상부와 하부 전사 종결인자 서열과 함께 존재한다. pBR1052 또는 pDD66의 AscI 단편을 함유한 pMAK-CL의 유도체를 확인하여 각각 pDD74 및 pDD76으로 지정하였다. 이들 플라스미드는 도 8l에 도해되어 있다.
에스케리키아 콜라이 fhuA 유전자의 상부(5') 및 하부(3')의 DNA 영역을 PCR로 클로닝하고, 조립하고 서열분석하였으며, 당해 결실 단편을 pMAK705 자살 플라스미드내로 이동시켜 pMAK705-△fluA, 또는 pDD73으로 명명된 fluA 유전자좌에 대한 대체 벡터를 생성하였다(도 8m). fhuA 유전자의 상부 및 하부의 DNA 분절을 에스케리키아 콜라이 K-12 균주 W3110로부터 제조한 게놈 DNA로부터 PCR에 의해 증폭시키고(참조: 실시예 3) 이들 2개 단편을 후속적인 PCR 스플라이싱 반응에 의해 후속적으로 함께 결합시켰다. 당해 과정은 DNA 분절의 상부 및 하부의 연결부에서 PstI 부위의 첨가를 촉진시켰다.
PCR의 초기 라운드에서 1개의 반응(반응 A)는 프라이머 DHD236(서열 번호 108) 및 DHD237-S(서열 번호 109)를 사용하여 fhuA 유전자의 상부 대략 800 bp DNA를 증폭시켰으며 제2 반응(반응 B)은 프라이머 DHD238-S(서열 번호 110) 및 DHD239(서열 번호 111)를 사용하여 fhuA 유전자의 하부 대략 950 bp의 DNA를 증폭시켰다. 이들 프라이머의 서열은 다음과 같다:
DHD236 5>CGCAAGCTTCGTACCGAAAGATCAGTTGC>3 (서열 번호 108)
DHD237-S 5>CCAAAAGAGAAATCTGCAGTAGATGGGATGTTATTTTACCG>3 (서열 번호109)
DHD238-S 5>ACATCCCATCTACTGCAGATTTCTCTTTTGGGGCACGG>3 (서열 번호110)
DHA239 5> GCTCTAGACATCTGCCATAACAACGGAG >3 (서열 번호 111)
PCR 반응 A를 PfuUltra II 폴리머라제(제조원: Stratagene, 미국 캘리포니아주 라 졸라 소재)를 사용하여 수행하였다. 50μL의 반응물에서, Pfu 반응 완충액(판매회사에 의해 공급됨)을 1X의 최종 농도로 가하고, 프라이머를 0.4μM 각각의 최종 농도로 가하며, dNTP를 200μM 각각의 최종 농도로 가하고, 50 ng의 W3110 게놈 DNA를 주형으로서 가하고 2.5 단위의 PfuUltra II 폴리머라제를 가하였다. PCR 반응 A를 RoboCycler® 구배 96 열순환기(제조원: Stratagene, 미국 캘리포니아주 라 졸라 소재) 속에서 다음의 주기 매개변수를 사용하여 수행하였다: 95℃에서 1분의 1주기; 95℃에서 1분, 55℃에서 1분, 및 72℃에서 1분의 30 주기; 72℃에서 4분의 1주기; 및 6℃에서 유지.
PCR 반응 B는 헤르큘라제 폴리머라제(제조원: Stratagene, 미국 캘리포니아주 라 졸라 소재)를 사용하여 수행하였다. 50μL의 반응물 속에, 헤르쿨라제 반응 완충액(판매회사에 의해 공급됨)을 1X의 최종 농도로 가하고, 프라이머를 각각 0.4μM의 최종 농도로 가하고, dNTP를 각각 200μM의 최종 농도로 가하며, 25 ng의 W3110 게놈 DNA를 주형으로서 가하고 2.5 단위의 헤르쿨라제 폴리머라제를 가하였다. PCR 반응 B를 RoboCycler® 구배 96 열순환기(제조원: Stratagene, 미국 캘리포니아주 라 졸라 소재) 속에서 다음의 주기 매개변수를 사용하여 수행하였다: 92℃에서 2분의 1주기; 95℃에서 30초, 50℃에서 30초, 및 72℃에서 1분의 33 주기; 68℃에서 10분의 1 주기; 및 6℃에서 유지.
이들 반응의 생성물을 퀴아젠 퀴아퀵 PCR 정제 키트(제조원: QIAGEN, 미국 캘리포니아주 발렌시아 소재)을 사용하여 판매회사의 프로토콜에 따라 정제하고, 아가로즈 겔 전기영동으로 분석하였다. 관찰된 PCR 생성물의 크기는 반응 A(832 bp) 및 반응 B(949 bp) 둘다의 생성물에 대한 예측된 크기와 일치하였다. 이들 단편을 겔로부터 잘라내고 퀴아퀵 겔 추출 키트(제조원: QIAGEN Inc., 미국 캘리포니아주 발렌시아 소재)를 사용하여 판매회사 프로토콜에 따라 용출시키고 30μL의 EB 용출 완충액 속에 회수하였다. 겔-정제된 단편을 후속적인 PCR 스플라이싱 반응; 반응 SP에서 주형으로 제공하였다. 50μL의 반응물에서, Pfu 반응 완충액을 1X의 최종 농도로 가하고, 프라이머를 각각 0.4 μM의 최종 농도로 가하며, dNTP를 각각 200μM의 최종 농도로 가하고, 반응 A 및 B의 3μL의 각각의 겔-정제된 반응 생성물을 주형으로 가하고 2.5 단위의 PfuUltra II 폴리머라제를 가하였다. PCR 반응 SP를 RoboCycler® 구배 96 열순환기(제조원: Stratagene, 미국 캘리포니아주 라 졸라 소재) 속에서 다음의 주기 매개변수를 사용하여 수행하였다. 95℃에서 1분의 1주기; 95℃에서 30초, 60℃에서 30초, 및 72℃에서 40초의 33 주기; 72℃에서 5분의 1주기; 및 6℃에서 유지. 당해 반응 생성물을 아가로즈 겔 전기영동으로 분석하였다. 강력한 밴드가 PCR 스플라이싱 반응의 생성물의 예측된 크기, 1750 bp와 일치하는 위치에서 관찰되었다. 당해 밴드를 겔로부터 퀴아퀵 겔 추출 키트(QIAGEN Inc., 미국 캘리포니아주 발렌시아 소재)를 사용하여 판매회사 프로토콜에 따라 잘라냈다. 이후에, 당해 단편을 pCR-Blunt II-TOPO 클로닝 벡터(제조원: Invitrogen, 미국 캘리포니아주 칼스바드 소재)내로 판매회사 프로토콜에 따라 클로닝하고 클로닝된 PstI 단편의 서열을 측정하였다(서열 번호 112).
당해 서열은 W3110(GenBank, AP009048)에 대한 보고된 게놈 서열을 기초로 fhuA 유전자의 상부 및 하부 DNA 분절에 대한 예측된 서열과 일치하였으며, 상부 및 하부 분절의 연결부에서 프라이머 DHD237-S 및 DHD238-S로부터 유래된 6 bp PstI 부위의 첨가를 나타내었다. 프라이머 DHD236 및 DHD239 각각으로부터 유래된, 상부 DNA 분절의 5' 말단에서 HindIII 부위 및 하부 DNA 분절의 3' 말단에서 XbaI 부위의 첨가가 또한 확인되었다. 서열-확인된 PCR 단편을 pCR-Blunt II-TOPO 벡터로부터 잘라내고 1739 bp의 HindIII-XbaI 단편으로서 겔-정제하고 온도-민감성 pMAK705 벡터(참조: 실시예 3)에 연결하고 이를 HindIII 및 XbaI로 분해하여 안트악틱 포스파타제(제조원: New England BioLabs, 미국 메사추세츠주 입스위치 소재)로 판매회사 프로토콜에 따라 처리하였다. 연결 생성물을 사용하여 에스케리키아 콜라이 NEB5α(제조원: New England BioLabs, 미국 메사추세츠주 입스위치 소재)를 형질전환시키고 pMAK705 복제를 위해 허용된 온도인, 30℃에서의 플레이팅으로부터 수득된 클로람페니콜-내성 형질전환체를 PstI, 및 XbaI와 HindIII로 분해하여 분석함으로써, 에스케리키아 콜라이 fhuA 유전자의 상부 및 하부의 클로닝된 DNA 영역을 함유하는 1739 XbaI-HindIII bp 단편을 보유하는 재조합체를 확인하였다. 하나의 이러한 재조합 플라스미드를 pDD73(도 8m)로 지정하고 후속적인 실험에 사용하였다.
xylS 조절 유전자를 다음과 같이 pDD73 대체 벡터내로 클로닝하였다. xylS 유전자를 pDD42로부터 PstI 단편으로서 잘라내고 pDD73의 PstI 부위내로 클로닝하여 pDD77를 생성시키고, 이를 도 8n에 도해한다. xylS 유전자를 함유하는 pDD77의 PstI 단편은 발현 플라스미드 pDD66 및 pBR1052, 모벡터 pDD54 및 pDD54의 테트라사이클린 내성 유도체인 pDD63내에 존재하는 xylS-함유 PstI 단편과 동일하다.
하기 실시예 10에 설명되어 있는 바와 같이, xylS 유전자 프로모터의 합성 최적화된 버젼, 리보소옴 결합 부위, 및 5' 해독되지 않은 영역(UTR)을 설계하여 합성하고, 이들 변형된 서열을 xylS 대체 벡터 pDD77내로 도입한 후 염색체 내로 도입하였다. 257 bp BlpI-BglII 단편(서열 번호 140)은 상업적인 판매회사(DNA2.0)에 의해 합성되었으며, 변형된 서열을 함유하는 합성 DNA를, 천연의 xylS 조절 서열을 함유하는 천연의 Blp I-Bgl II 단편 대신 Blp I-Bgl II 단편으로서, xylS 대체 벡터, pDD77내로 클로닝하였다. 변형된 xylS를 함유하는 플라스미드를 pDD79(도 8n)로 명명하였다.
대체 벡터는 kfoABCFG 유전자 분절의 카피를 에스케리키아 콜라이 K-12 염색체 내로 fhuA 유전자좌에서 삽입시키기 위해 작제하였다. kfoABCFG 유전자 분절(Pm 프로모터 부재)을 pCX039로부터 PstI 단편상에서 잘라내고 당해 단편을 당해 플라스미드내에 유일한 pDD79의 양립성 NsiI 부위내로 클로닝하였다. 수득되는 플라스미드, pDD80(도 8o)에서, kfoABCFG 유전자는 강력한 구성적 프로모터가 되도록 설계되었던, 합성 xylS 프로모터에 의해 전사된다.
pDD66 및 pDD67 발현 플라스미드의 결실 유도체를 작제하여 개개 유전자 또는 유전자 군의 역활을 평가하였다. 이들 유도체의 작제는 위에서 기술한 바와 같이 합성 K4 유전자 단편내로 설계된 플랭킹 제한 효소 부위를 이용하였다. kpsC 유전자(K4 영역 1)은 0.6㎍의 DNA를 10 U SacI로 2시간 동안 10μL의 반응물 속에서 분해한 후 12μL의 반응물 속에서 반응물의 열처리(효소를 불활성화시키기 위해) 및 연결(1 mM ATP 및 T4 DNA 리가제 사용)하여 pDD66으로부터 결실시켰다. 당해 반응물의 1/2를 에스케리키아 콜라이 DH5α(제조원: Invitrogen)내로 LB Tc5에 30℃에서 플레이팅하면서 형질전환시켰다. pDD66에서, kpsC 유전자는 SacI 부위에 의해 플랭킹되지만, 또한 벡터내에 제3의 SacI 부위가 존재하여, 분해는 tetR 유전자를 함유하지만 플라스미드의 복제 오리진을 함유하지 않는 제3의 단편을 생성한다. 따라서, TcR 형질전환체는 적어도 벡터/오리진 단편과 tetR 단편으로 구성된 플라스미드를 함유하는 것으로 예측되었다. 형질전환체를 이들 2개의 SacI 단편을 함유하지만 kpsC SacI 단편을 결여한 플라스미드에 대해 스크리닝하고, 후보 pDD66△kpsC 클론을 또한 SalI 분해에 의해 전자의 2개의 SacI 단편의 바람직한 배향을 갖는 것들에 대해 추가로 스크리닝하였다. 하나의 이러한 플라스미드는 pCX045로 명명되었다(도 8p).
pDD66 내 kpsT 유전자(K4 영역 3)는 MluI 제한 부위에 의해 플랭킹되며, 플라스미드내에 다른 MluI 부위는 존재하지 않는다. 상기 기술한 것과 유사한 단계를 사용하여, pDD66을 MluI로 분해한 후 재-연결하여 pCX048로 명명된 pDD66△kpsT 유도체를 생성하였다(도 8p).
플라스미드 pCX039는 K4 영역 1 및 3 유전자의 결실에 의해 pDD67(위에서 기술됨, 참조: 도 8j)로부터 생성시켰다. 플라스미드 pDD67(1.5㎍)을 효소 PmlI 및 MluI(각각 10U)로 동시에 분해한 후, T4 DNA 폴리머라제(1.5 U) 및 dNTP(각각 150μM)로 12℃에서 15분 동안 처리하여 MluI에 의해 생성된 오버행을 채웠다(평활 말단을 남김). PmlI 분해는 평활 말단을 남긴다. 처리된 pDD67을 후속적으로 T4 DNA 리가제와 함께 항온처리하고 에스케리키아 콜라이 TOP10(제조원: Invitrogen)내로 형질전환시킨 후 Tet-내성에 대해 선택하고 Cm-내성에 대해 스크리닝하였다. 48개의 이중 항생제 내성 콜로니 상에서 콜로니 PCR을 프라이머 DHD229 및 DHD231을 사용하여 수행하였다.
DHD229 AAGGCGACAAGGTGCTGATG (서열 번호 81)
DHD231 CAATGCGACGGATGCTTTCG (서열 번호 82)
48개의 분리체 중 14개는 아가로즈 겔 전기영동에 의해 측정할 때 바람직한 작제물에 대해 예측된 678 bp에 근접하는 PCR 생성물을 수득하였다. 8개의 선택된 후보물 중 6개에서의 플라스미드는 (아가로즈 겔 전기영동에 의해) 예측된 크기였고, 2개의 선택된 플라스미드 분리체는 PmlI/MluI 연결부에서 바람직한 DNA 서열을 함유하였다. 하나의 플라스미드를 pCX039(도 8q)로 명명하였다. 이는 Pm 프로모터에 의해 구동된 xylS 및 K4 영역 2 유전자 kfoABCFG를 함유한다.
pCX039내 kfoB 유전자(및 이의 리보소옴 결합 부위)는 BstBI 제한 부위에 의해 밀접하게 플랭킹되며, 벡터 골격내에 제3의 BstBI 부위가 존재한다. 따라서, BstBI를 사용한 pCX039의 분해는 kfoB 유전자 단편, 플라스미드 복제 오리진, Tet-내성 유전자, 및 kfoCFG 유전자를 포함하는 거대 단편, 및 Cm-내성 유전자 및 Pm/kfoA를 포함하는 단편의 3개 단편을 생성한다(참조: 도 8q). kfoB 유전자가 결여된 pCX039의 유도체를 생성하기 위하여, 플라스미드(600 ng)를 BstBI(10 U)로 90분 동안 65℃에서 완전히 분해하였다. 효소를 반응물로부터 MinElute 키트(제조원: QIAGEN)을 사용하여 12μL 용출 완충액 중 최종 용출로 제거하였다. 대략 250 ng(5μL)의 당해 분해물을 T4 DNA 리가제와 함께 항온처리하고 에스케리키아 콜라이 DH5α(제조원: Invitrogen)내로 Cm-내성에 대한 선택과 함께 형질전환시켰다. Cm-내성에 대해 선택함으로써, 적어도 거대 벡터 단편(즉, kfoCFG/오리진)과 Cm/Pm/kfoA 단편을 함유하는 플라스미드를 수득할 수 있다. 8개의 선택된 형질전환체 내의 플라스미드를 제한 분해에 의해 분석하였으며, 5개는 kfoB BstBI 단편이 결여되고 바람직한 상대적 배향으로 다른 2개의 단편을 갖는 것으로 밝혀졌다. 하나의 이러한 분리체내의 플라스미드는 pCX044(도 8q; xylS 및 kfoACFG)로 명명되었다. 당해 분야의 숙련가는, 동일한 플라스미드 구조가 BstBI 효소를 사용한 부분 플라스미드 분해에 의해 수득될 수 있었음을 인식할 것이다.
당해 실시예에서 위에 기술된 바와 같이, 플라스미드 pDD66 및 pDD67은 상이한 배열로 13개의 K4 유전자를 함유한다: pDD66-Pm/kpsMT/kfoABCFG/kpsFEDUCS; pDD67-Pm/kpsFEDUCS/kpsMT/kfoABCFG. 이들 플라스미드내 K4 유전자(이들의 각각의 리보소옴 결합 부위와 함께) 중 대부분은 플라스미드내에서 단지 2 또는 3회 절단하는 제한 효소 부위의 쌍에 의해 밀접하게 플랭킹된다. 이러한 특징(및 위에서 기술한 다른 서열 성분)은 개개의 K4 유전자의 선택적인, 비-극성 결실을 허용한다. pCX039로부터의 pCX044의 생성을 위해 위에서 기술한 단계들을 사용하여, pDD66 및 pDD67의 △kfoB 유도체를 생성시키고, 도 8r에 묘사한 이들 플라스미드를 각각 pCX040, 및 pCX042로 지정하였다. pDD66 및 pDD67내 kfoG 유전자는 NheI 제한 부위에 의해 밀접하게 플랭킹되어 있으나 각각의 플라스미드내에서 테트라사이클린 내성 유전자에 대한 코딩 영역내 제3의 NheI 부위가 존재한다. pDD66 및 pDD67의 △kfoG 유도체의 생성을 위해, △kfoB 유도체의 생성을 위한 것과 유사한 시도를 이용하였다: NheI을 사용한 완전한 분해, 연결 및, 에스케리키아 콜라이의 Tet-내성 형질전환체에 대한 선택. 당해 시도는 플라스미드 복제 오리진과 함께 테트라사이클린 내성 유전자의 재생에 대해 선택한다. 생성되는 형질전환체내 플라스미드를 kfoG NheI 단편의 부재에 대해 스크리닝하고, pCX041(pDD66 △kfoG) 및 pCX043(pDD67 △kfoG)를 확인하여 도 8s에 나타낸다. 당해 분야의 숙련가는, 동일한 플라스미드 구조가 BstBI 또는 NheI 효소를 사용한 부분 플라스미드 분해에 의해 수득될 수 있었음을 인식할 것이다.
실시예 5
K4 캡슐 생합성 단백질을 인식하는 항체
항체의 생산: K4 콘드로이틴 생합성 유전자 클러스터에 의해 인코딩된 단백질 중 15개에 대해 지시된 항체를 하기 기술된 바와 같이 생산하였다. 이들 항체를 사용하여 대체 숙주 및 천연 에스케리키아 콜라이 K4 균주내에서 클로닝된 K4 콘드로이틴 생합성 유전자의 발현을 평가하였다. 이들을 또한 사용하여 다른 2 군 캡슐을 생산하는 에스케리키아 콜라이내에서 영역 1 및 영역 3 유전자 발현을 평가하고, 다른 혈청군 K4 에스케리키아 콜라이와 함께 잠재적으로 사용하여 영역 2 유전자 발현을 평가하였다. 항체는 다음과 같이 생성하였다.
PCR 프라이머를 설계하여, K4 캡슐 유전자 클러스터내에서 확인된 17개 유전자에 상응하는, 크기가 각각 약 20 내지 30kDa인 일련의 폴리펩타이드 또는 완전한 단백질을 증폭시켰다. PCR 프라이머의 초기 세트는 실시예 1에서 결정된 U1-41 K4 캡슐 유전자 클러스터의 서열을 기초로 하였다. 일부 예에서, 클로닝된 PCR 단편을 서열을 확인한 후 에스케리키아 콜라이 플라스미드 벡터인, pQE30(제조원: Qiagen, Inc., 미국 캘리포니아주 발렌시아 소재) 내로, 에스케리키아 콜라이내 고 수준 발현을 위해 서브클로닝하였다. 다르게는, PCR 단편을 발현 벡터내로 직접 클로닝한 후 서열분석하였다. pQE30 벡터는 강력한 박테리오파아지 T5 프로모터를 LacI 억제인자 단백질의 조절하에 사용하여 에스케리키아 콜라이내에서 고 수준의 IPTG 유도성 발현을 달성하였다. 정제를 촉진시키기 위해 클로닝된 폴리펩타이드의 아미노-말단에서 폴리-His 태그를 융합시키도록 당해 벡터를 설계하였다. 초기에, KpsM, KpsF, KpsE, KpsS, KfoC, KfoH 및 KfoC로부터 유래된 항원을 pQE30 벡터내에서 His-태그된 폴리펩타이드로서 발현시키고, KpsD, KpsU, KpsC, KfoD, KfoI, KfoE 및 KfoF로부터 유래된 항원을 His-태그없이 발현시켰다. His 태그가 없는 작제물은, His 잔기를 코딩하는 서열이 결실된, pQE30-dH으로 명명된, pQE30의 유도체 내로 클로닝시켜 생성하였다. 후속되는 발현 실험은, His 태그가 KfoC, KfoH 및 KfoG로부터 유래된 폴리펩타이드 항원의 효율적인 발현을 위해 필요하지만, 다른 항원은 태그되지 않은 형태로서 pQE30-dH내에서 효율적으로 발현되었음을 나타내었다. 따라서, 대부분의 항원은 주사된 항원에 존재하지만 천연의 표적 단백질내에 존재하지 않는 에피토프를 인식하는 항혈청을 수득하는 가능성을 피하기 위하여 태그되지 않은 형태로 발현되었다.
항원의 발현을 위해, pQE30 또는 pQE30-dH내로 클로닝된 항원 서열을 함유하는 배양물을 37℃에서 루리아 브로쓰(Luria Broth) 속에서 중기-로그 상(mid-log phase)까지 성장시킨 후, 1 mM의 IPTG를 첨가하여 유도시켰다. 전형적으로, 유도 후 4시간에, 세포를 수거하고 BugBuster® 단백질 추출 시약(제조원: Novagen, 미국 위스콘신주 매디슨 소재), 세제-계 분해 시스템을 사용하여, 판매회사 프로토콜에 따라 가용성 및 불용성 분획으로 분획화하였다. 전형적으로, T5 프로모터 시스템에서의 과-발현은, 비록 일부 발현된 폴리펩타이드가 가용성 형태로 축적된다고 해도, 에스케리키아 콜라이 세포질내에 불용성 형태로 발현된 폴리펩타이드의 축적을 초래한다. KpsU-유래된 항원은 불용성 형태로 발현되었고; 모든 다른 항원은 불용성 분획으로 분할됨이 밝혀졌다. 종종, 재조합 단백질은 BugBuster® 분해 및 추출 과정에 의해 생성된 불용성 분획내에서 우세한 폴리펩타이드이다. 면역화 목적을 위해, 이들 폴리펩타이드 항원의 발현을 100 ㎖들이의 진탕-플라스크 배양물 속에서 수행하였다. 유도된 배양물의 분해에 이어서, 모든 배양물(KpsU 항원-발현 배양물 제외)의 불용성 분획을 예비 겔에서 이동시켰다. KpsU 항원의 경우에, 폴리펩타이드 항원은 세포 분해물의 가용성 분획으로 분할되므로 이러한 가용성 분획을 예비 겔 위에서 이동시켰다. 목적한 단백질을 함유하는 겔 영역을 잘라내고 추가 가공 및 토끼의 후속적인 면역화로 항혈청을 생산하기 위해 상업적 판매회사, Open Biosystems(미국 알라바마주 헌트스빌 소재)에 보냈다.
초기 실험에서, 12개 항원은 충분히 잘 발현되어 항원의 정제를 보장하는 것으로 여겨졌다. 이들 12개의 항원은 KpsE, KpsD, KpsU, KpsC, KpsS, KpsT, KfoA, KfoB, KfoI(Orf3), KfoE, KfoH(Orf1) 및 KfoF로부터 유래되었다. KpsF, KpsM, KfoC, KfoD, 및 KfoG의 단백질 서열로부터 유래된 항원은 발현되지 않거나 불량하게 발현되었다. 불량하게 발현된 항원의 폴리펩타이드 서열을 코돈 사용빈도, 및 소수성과 같은 물리적 특성과 관련하여 분석하고 pI를 계산하였다. 잘-발현된 폴리펩타이드 항원에 대해 결정된 것으로서 이들 동일한 특성에 대한 비교는 어떠한 명확한 상관관계도 나타내지 않았다. 코돈 사용빈도는 KfoG와 같은, 일부 불량하게 발현된 항원에서 불리하였지만, 다른 잘-발현된 항원에서도 불리하였다. KpsM 항원은 극도로 소수성이며 이는 발현된 항원의 안정성에 잠재적으로 영향을 미칠 수 있으나, KpsM이 필수적인 막 단백질이므로, 이의 전체 서열은 매우 소수성이며 KpsM로부터 유래된 유의적인 크기의 어떠한 폴리펩타이드도 고도로 소수성일 것이다.
추가의 항원 코딩 서열은 합성의, 코돈-최적화된, KpsM, KpsF, KfoC, 및 KfoG에 대한 유전자로부터 실시예 2에 기술된 합성 K4 유전자 세트를 사용하여 유래되었다. 합성 DNA 주형으로부터 유래된 PCR 생성물을 pQE-30, 6X-His 태그 벡터내로 클로닝하고, 발현에 대해 시험하였다. 합성 서열 KfoC, KfoG, 및 KpsF 항원은 6X-His 태그를 지닌 pQE-30 벡터내에서 발현되는 경우, 고도로, 또는 중간으로 높게 축적되는 것으로 밝혀졌다. 이들 항원은 유도된 배양물로부터 위에서 기술한 바와 같이 겔-정제하였고 토끼에서 항혈청 생산을 위해 Open Biosystems(미국 알라바마주 헌트스빌 소재)에 보냈다. 6X-His 태그를 지닌 합성 서열 KpsM 항원은 유도된 배양물의 쿠마시 염색(Coomassie staining)에 의해 측정된 것으로서 검출가능한 수준에서 발현되지 않았다.
면역 토끼로부터의 항혈청을 유도된 항원을 발현하는 에스케리키아 콜라이 균주로부터의 세포 추출물을 사용하여 역가 및 특이성에 대해 웨스턴 블롯으로 시험하였다. 모든 항혈청은 이러한 웨스턴 블롯에서 그들의 각각의 항원을 인식하였다. 사용하기 위한 역가는 허용가능한 비-특이적인 배경과 전형적으로 1:1500이었다. 이들 항혈청을 사용하여 수행된 웨스턴 블롯으로부터의 결과의 예는 도 9에 나타낸다.
도 9에 나타낸 바와 같이, 일부 항혈청(예를 들면, 항-KfoA, 항-KpsD 및 항-KpsS)은 다른 에스케리키아 콜라이 단백질에 대해 관측가능한 비특이적인 반응성을 거의 또는 전혀 갖지 않는 클로닝된 K4 유전자를 수반하는 균주내에서 표적 단백질 밴드를 확인하였다. 다른 항혈청(예를 들면, 항-KpsC 및 항-KpsF)에서, 보다 비-특이적인 결합이 관찰되었지만, 표적 단백질은 클로닝된 K4 유전자를 결여하고 있는 에스케리키아 콜라이 대조군 균주와 비교함에 의해 명확하게 확인될 수 있었다. 대부분의 항혈청은 웨스턴 블롯에서 이들의 특이적인 표적으로서 단일 단백질 밴드를 확인하였지만, 일부 예(예를 들면, KfoC)에서 다수의 밴드가 특이적으로 인식되었다. KfoC 폴리펩타이드는 웨스턴 블롯 전에 추출물의 가공 동안 또는 세포내적으로 일부 단백질분해적 파괴 또는 프로세싱을 겪는 것으로 여겨졌으며, 도 9에 나타낸 바와 같이, 이중 밴드가 지속적으로 관찰되었다.
따라서, 에스케리키아 콜라이 K4 균주 및 클로닝된 K4 캡슐 유전자 클러스터를 발현하는 재조합 균주, 및 이들 유전자 중 일부 또는 모두를 함유할 수 있는 천연의 에스케리키아 콜라이 균주에서 KpsF, KpsE, KpsD, KpsU, KpsC, KpsS, KpsT, KfoA, KfoB, KfoC, KfoI(Orf3), KfoE, KfoH(Orf1), KfoF 및 KfoG를 검출할 수 있는 항혈청이 성공적으로 생성되었다.
표시된 단백질을 인식하는 항혈청을 생성하기 위하여 토끼를 면역화하기 위하여 재조합적으로-발현된 폴리펩타이드의 아미노산 서열이 하기 제공된다. pQE30-dH 벡터내에서 발현된 항원은 플라스미드 발현 벡터로부터 유래되지만 표적 단백질의 서열내에는 존재하지 않는, 발현된 폴리펩타이드의 아미노-말단에서 첨가된 MGS 서열을 함유한다. BamHI 부위내로 클로닝함에 의해 pQE30 벡터내에서 발현된 항원은 플라스미드 발현 벡터로부터 유래되지만 표적 단백질에 존재하지 않는 아미노-말단에서 첨가된 MRGSHHHHHHGS(서열 번호 85의 아미노산 1 내지 12번) 서열을 함유한다. SacI 부위내로 클로닝함으로써 pQE30 벡터내에서 발현된 항원은 플라스미드 발현 벡터로부터 유래되지만 표적 단백질에 존재하지 않는 아미노-말단에서 첨가된 MRGSHHHHHHGSACEL(서열 번호 93의 아미노산 1 내지 16번) 서열을 함유한다. 발현 벡터 DNA 서열로부터 유래된 폴리펩타이드 항원의 아미노-말단 서열은 하기에 밑줄로 표시되어 있다.
KfoA-유래된 항원(서열 번호 83):
MGSLNKGYNVVIIDNLINSSCESIRRIELIAKKKVTFYELNINNEKEVNQILKKHKFDCIMHFAGAKSVAESLIKPIFYYDNNVSGTLQLINCAIKNDVANFIFSSSATVYGESKIMPVTEDCHIGGTLNPYGTSKYISELMIRDIAKKYSDTNFLCLRYFNPTGAHESG MIGESPADIPSNLVPYILQVAMGKLEKLMVFGGDYPTKDGT
KfoB-유래된 항원(서열 번호 84):
MGSWLAYNTALLHFFLNNRGRCLLVSSEQVKRNAEDCIQQLQHKLKLKFGLSFSNTINHSLEQSVNDFKTAEASITLEKEHQEIMSLSGIDIGTGDIIFKQSETEEYLIFNVLNDYPDCKELYFELQSNANTPLRVLEKENYKPSFIWETFIKQRQITLDIVNGLYQSSKKIILDNELHTSKQLNAYQAILKELSDSKEELIQYDLIIKNKTIQVQELEC
KfoC-유래된 항원(서열 번호 85):
MRGSHHHHHHGSAISLNEVEKNEIISKYREITAKKSERAELKEVEPIPLDWPSDLTLPPLPESTNDYVWAGKRKELDDYPRKQLIIDGLSIVIPTYNRAKILAITLACLCNQKTIYDYEVIVADDGSKENIEEIVREFESLLNIKYVRQKDYGYQLCAVRNLGLRAAKYNYVAILDCDMKLN
KfoI(Orf3)-유래된 항원(서열 번호 86):
MGSVDLDNTISFNLSGKYSHATPNKKLIEKLYEYKLNGFYIVIFTARNMRTYKENIGKINIHTLPVIIDWLNENRVPYDEVIVGKPWCGDEGFYVDDRAIRPSELCNMTLEE ISNMLEQEKKCF
KfoE-유래된 항원(서열 번호 87):
MGSPEDFVFDKHDYEWLLRNKVTMIPVDSNLTLGQAIVTAWNLIGDKDDKGLQLLFGDTLFKKIPAGDDLVAISHSDDNYQWSFFYETELRAVSREDNKNVICGYFSFSKPNFFIRELVTSKFDFTAALKKYHDSYSLASIYVSDWLDFGHINTYYKSKVQYTTQRAFNELCITTKSVIKSSSNESKIEAESKWFETIP
KfoH(Orf1)-유래된 항원(서열 번호 88):
MRGSHHHHHHGSASLGINSYTLITLDKETRGQAETVYLAISKLFNIEQPITIFNIDTIRPNFIFTKFE유전자CYIEVFRGDGDNWSFVMPSNDVKNEVIATSEKKQISNLCCTGLYHFSTIKNFISAYEHYKNLPQENWDAGELYIAPIYNYLISNGIKVYYTEINKSDVIFCGTPREYENLQG
KfoF-유래된 항원(서열 번호 89):
MGSVGFTERLKRDLNTNNIIFSPEFLREGKALYDNLYPSRIVVGESSERARKFAELLSEGAIKKDIPILLTDSPEAEAIKLFANTYLAMRIAYFNELDTYASVHGLDTKQIIEGVSLDPRIGQHYNNPSFGYGGYCLPKDTKQLLANYRDVPQNLIQAIVDANTTRKDFVAEDILSRKPKVVGIYRLIMKAGSDN
KfoG-유래된 항원(서열 번호 90):
MRGSHHHHHHGSDDTLFRLQRLALKDTRIKIISLPQNVGTYAAKRIGLIQAKGEFVTCHDSDDWSHPEKLFRQISPLLLNPKLICSISDWVRLQDNGIFYARAVYPLKRLNPSSLLFRRADVLQKAGVWDCVKTGADSEFIARLKLIFGDSTVHRIKLPLTLGSHRTDSLMNSPTTGYTSQGISPDRQKYWDSWSRWHIQALRNKESLYIGNSDFTNKNRPF SAPDSILVDTNAIKTALQSAHVNFT
KpsT-유래된 항원(서열 번호 91):
MGSMIKIENLTKSYRTPVGRHYVFKNLNIEIPSGKSVAFIGRNGAGKSTLLRMIGGIDRPDSGKIITNKTISWPVGLAGGFQGSLTGRENVKFVARLYAKQEELKEKIEFVEEFAELGKYFDMPIKTYSSGMRSRLGFGLSMAFKFDYYIVDEVTAVGDARFKEKCAQLFKERHKESSFLMVSHSLNSLKEFCDVAIVFKDDNAVSFHEDVQEGIEEYITEQ NNY
KpsF-유래된 항원(서열 번호 92):
MRGSHHHHHHGSLAIAMIHQRKFMPNDFARYHPGGSLGRRLLTRVADVMQHDVPAVQLDASFKTVIQRITSGCQGMVMVEDAEGGLAGIITDGDLRRFMEKEDSLTSATAAQMMTREPLTLPEDTMIIEAEEKMQKHRVSTLLVTNKANKVTGLVRIFD
KpsE-유래된 항원(서열 번호 93):
MRGSHHHHHHGSACELPEFALKFNQTVLKESERFINEMSHRIARDQLAFAETEMEKARQRLDASKAELLSYQDNNNVLDPQAQAQAASTLVNTLMGQKIQMEADLRNLLTYLREDAPQVVSARNAIQSLQAQIDEEKSKITAPQGDKLNRMAVDFEEIKSKVEFNTELYKLTLTSIEKTRVEAARKLK
KpsD-유래된 항원(서열 번호 94):
MGSLNYLIKAGGVDPERGSYVDIVVKRGNRVRSNVNLYDFLLNGKLGLSQFADGDTIIVGPRQHTFSVQGDVFNSYDFEFRESSIPVTEALSWARPKPGATHITIMRKQGLQKRSEYYPISSAPGRMLQNGDTLIVSTDRYAGTIQVRVEGAHSGEHAMVLPYGSTMRAVLEKVRPNSMSQMNAVQLYRPSVAQRQKEMLNLSLQKLEEASLSAQSSTKEEAS
KpsU-유래된 항원(서열 번호 95):
MGSMSKAVIVIPARYGSSRLPGKPLLDIVGKPMIQHVYERALQVAGVAEVWVATDDPRVEQAVQAFGGKAIMTRNDHESGTDRLVEVMHKVEADIYINLQGDEPMIRPRDVETLLQGMRDDPALPVATLCHAISAAEAAEPSTVKVVVNTRQDALYFSRSPIPYPRNAEKARYLKHVGIYAYRRDVLQNYSQLPESMPEQAESLEQLRLMSAGINIRTFEVAATGPGVDTPACLEKVRALMAQELAENA
KpsC-유래된 항원(서열 번호 96)
MGSQRVRLIAENVSPQSLLRHVSRVYVVTSQYGFEALLAGKPVTCFGQPWYAGWGLTDDRHPQSALLSARRGSATLEELFAAAYLRYCRYIDPQTGEVSALFTVLQWLQLQRRHLQQRNGYLWVPGLTLWKSAILKPFLQTATNRLSFSRRCTAASACVVWGVKGEQQWRAEAQRKSLPLWRMEDGFLRSSGLGSDLLPPLSLVLDKRGIYYDATRPSELEVLLNHSQLTLAHQMRAEKLRQRLVESKLSKYNLGA
KpsS-유래된 항원(서열 번호 97):
MRGSHHHHHHGSACELCFGDCRLLHKEAKRWAKSKGIRFLAFEEGYLRPQFITVEEGGVNAYSSLPRDPDFYRKLPDMPTPHVENLKPSTMKRIGHAMWYYLMGWHYRHEFPRYRHHKSFSPWYEARCWVRAYWRKQLYKVTQRKVLPRLMNELDQRYYLAVLQVYNDSQIRNHSNYNDVRDYINEVMYSFSRKAPKESYLVIKHHPMDRGH RLYRPLIKRLSKEYGLDERVIYVHDLPMPELLRHASLIS
실시예 6
합성 유전자 세트[kpsFEDUCS+kpsMT+kfoABCDIEHFG]는 에스케리키아 콜라이 K-12에서 발현되는 경우에 프럭토실화된 콘드로이틴을 생산한다.
상기 실시예 4에 기재된 플라스미드 pDD54 및 pDD58을 MSC188(실시예 3에 기재된 바와 같이 콜란산 생합성 유전자 클러스터에 대해 결실된 에스케리키아 콜라이 K-12 균주 W3110)로 형질전환시켰다. 생성된 균주 MSC204[MSC188(pDD54)] 및 MSC206 [MSC188(pDD58)]를 진탕 플라스크 배양물에서 성장시키고, 콘드로이틴 생산에 대해 시험했다. 균주를 30℃에서 CYG 배지(20 g/L 카스아미노산, 5 g/L 효모 추출물, 2 g/L 글루코즈, pH 7.2) + 클로람페니콜(20 ㎍/mL) 중의 신선한 콜로니로부터 밤새 성장시키고, 이들 배양물을 동일한 배지에서 OD A600=0.05로 희석시켰다. 약 0.1의 OD A600(대략 1시간 후)에서, 유도인자 m-톨루엔산을 최종 농도 2 mM까지 첨가했다. 유도후 4, 8 및 24시간에서, OD A600 값을 측정하고, 샘플을 분석을 위해 취했다. 배양물 OD는 하기 표 6-1에 제공되어 있다. 각 시점에서 각 균주에 대해, 다당류 분석을 위한 10 mL 샘플을 오토클레이빙(121℃, >15psi, 5분)한 다음, 동결 저장했다. 각 시점에서 각 균주의 5 ml 2개 분취량을 원심분리하고, 생성된 세포 펠렛을 후속 웨스턴 블롯 분석을 위해 동결 저장했다.
표 4a에 제시된 바와 같이, 에스케리키아 콜라이 K-12 균주, MSC204 및 MSC206은 유도후 잘 성장했다: 유도후 24시간에서 이들 배양물 둘 다의 OD는 대략 7이었다. 이들 실험으로부터의 배양물 샘플을, 실시예 14에 상세히 기재된 바와 같이, 콘드로이틴 및 프럭토실화된 콘드로이틴에 대한 HPLC 기반 콘드로이티나제-의존성 분석을 사용하여 분석했다. 배양물 샘플은 이들 분석에서 효소적 분해 전에 탈프럭토실화 단계(산 처리)로 처리했다. 배양물 샘플은 또한 프럭토실화된 콘드로이틴에 특이적인 ELISA 분석으로 분석했다(실시예 14). 분석 결과는 표 4a에 제시되어 있다.
[표 4a]
Figure 112012080180037-pct00007
이들 결과는 pDD58 함유 재조합 에스케리키아 콜라이 K12(균주 MSC206)이 프럭토실화된 콘드로이틴을 생산함을 명백히 입증한다. ELISA에 의한 다당류의 검출은 이들 균주에서 생산된 재조합 다당류가 프럭토실화된 콘드로이틴임을 입증하는데, 이는 ELISA 분석에 사용된 항혈청이 콘드로이틴의 프럭토실화된 형태에 특이적이고 프럭토실화되지 않은 콘드로이틴을 인지하지 않기 때문이다. 이 실험에서 관찰된 최고 수준의 프럭토실화된 콘드로이틴 생산은 약 25 ㎍/mL이었다. 프럭토실화된 콘드로이틴 생산은 벡터-단독 플라스미드, pDD54를 함유하는 대조군 균주 MSC204에서 일관되게 검출불가능했다. 4시간 및 8시간 샘플에서 MSC206에 대한 ELISA 및 HPLC 분석 사이에서 측정된 프럭토실화된 콘드로이틴 값에 정량적 차이가 있다. 이들 차이는 아마도 ELISA 분석의 보다 낮은 감도를 반영한다. 전형적으로, 제공된 샘플에서 프럭토실화된 콘드로이틴 농도가 높을수록, ELISA 및 HPLC 분석 사이의 일치는 보다 근접하다.
후속 실험은, MSC206에 의한 프럭토실화된 콘드로이틴의 생산을 확인하고 생산된 콘드로이틴의 수준에 대한 유도인자 농도의 효과를 시험하기 위해 수행했다. MSC206의 신선한 밤새 배양물을 0.05 OD A600으로 희석시키고, 약 0.1의 OD A600까지 CYG 배지 + 클로람페니콜(10 ㎍/mL)에서 30℃로 성장시켰다. 이어서, 배양물의 분취량은 m-톨루엔산을 0, 0.5, 1.0 또는 2.0 mM의 최종 농도까지 첨가하여 유도했다. 배양물을 유도후 24시간 동안 성장시키고, 이 시점에서의 OD를 측정하고, 샘플을 다당류 분석을 위해 상기한 바와 같이 취했다. 또한, 유도후 24시간에서, 각 배양물의 분취량을 희석시키고, LB 상에 플레이팅하여 전체 생존 세포를 정량화하고, LB + 클로람페니콜(17 ㎍/mL) 상에 플레이팅하여 플라스미드 함유 생존 세포를 정량화했다. 이들 배양물의 성장 및 콘드로이틴 생산은 표 4b에 요약되어 있다.
[표 4b]
Figure 112012080180037-pct00008
표 4b에 제시된 바와 같이, 최고 수준의 유도인자만이 24시간에서 성장 및 생존 세포수에 대한 네가티브 효과를 가졌다. 이 실험에서, 발현 플라스미드 pDD58은, 당해 균주가 선택적 항생제인 클로람페니콜의 존재하에 성장했지만, 안정하게 유지되지 않았다. LB 플레이트와 비교하여 샘플을 LB+Cm17 플레이트 상에 플레이팅한 경우에 수득한 콜로니-형성 단위의 보다 낮은 역가에 의해 입증된 바와 같이 24시간 시점에서 플라스미드가 현저히 소실되는 것 같다. 그러나, 플라스미드 함유 세포의 분획은 유도인자 농도에 의해 현저한 영향을 받지 않았다. ELISA 분석의 결과는 MSC206에서 프럭토실화된 콘드로이틴의 생산을 확인시켜 주고, 탈프럭토실화 단계가 포함될 경우 HPLC 분석을 사용하여 수득한 결과와 일치한다. 최고 콘드로이틴 역가를 갖는 샘플은 ELISA 및 HPLC 분석 사이에 최상의 일치를 나타냈다. 이들 결과는 또한 m-TA 첨가에 의한 유도의 부재하에도 프럭토실화된 콘드로이틴의 생산을 입증한다. 그러나, 유도된 모든 배양물은 비유도된 배양물보다 많은 프럭토실화된 콘트로이틴을 생산하였으며, 최고 수준의 프럭토실화된 콘드로이틴은 1.0 mM m-TA로 유도된 배양물에 의해 생산되었다.
실시예 7
유전자 세트[kpsFEDUCS+kpsMT+kfoABCFG]은 에스케리키아 콜라이 K-12 또는 에스케리키아 콜라이 B에서 발형되는 경우에 비프럭토실화된 콘드로이틴을 생산한다. kfoB 및 kfoG은 비프럭토실화된 콘트로이틴의 생산에 필수적이지는 않지만, kfoG은 최적 생산을 위해 요구된다.
이 연구 전에, K4 캡슐 다당류의 프럭토실화에 관여하는 단백질을 인코딩하는 유전자는 동정되지 않았다. K4 캡슐 유전자 클러스터의 영역 2에 존재하는 다수의 유전자에 의해 인코딩된 단백질에 대한 어떠한 기능도 동정되지 않았다:kfoB, kfoG, kfoD, kfoE, kfoH(orf1) 및 kfoI(orf3).
2군 에스케리키아 콜라이 캡슐의 영역 2내에 존재하는 유전자는 다당류 또는 다당류의 당 뉴클레오티드 전구체의 합성에 모두 통상적으로 관련된다(Whitfield 2006). 상기 언급된 바와 같이(실시예 1), kfoB 및 kfoG 유전자는, 다른 글리코스아미노글리칸 캡슐을 생산하는 것으로 공지된 박테리아의 캡슐 클러스터에 존재하는 유전자에 의해 인코딩된 것들과 상동성이다. 이러한 부수적 증거는 글리코스아미노글리칸 캡슐의 생합성에서 kfoB 및 kfoG에 대한 잠재적 역활을 시사한다. 대조적으로, 본 발명 이전에는 kfoD, kfoI, kfoE 및 kfoH 유전자가 K4 캡슐 다당류의 콘드로이틴 골격의 생합성에 관여하는 것과 관련된 어떠한 증거도 없었다. 다른 연구자들은 kfoD 및 kfoE 유전자가 아마도 프럭토실화에 관련되지 않음을 가정했지만[참조: Ninomiya et al., 2002 and Krahulec et al., Molec. Biotech., 2005;30:129-134.], 본 발명자들은 kfoD, kfoI, kfoE 및 kfoH 유전자가 콘드로이틴의 프럭토실화에 관련되는 단백질을 인코딩할 수 있음을 가정했다. 당해 가정을 시험하기 위해, kfoDIEH 유전자 세트를 함유하지 않지만 kpsFEDUCS, kpsMT 및 kfoABCFG 유전자를 함유하는 재조합 플라스미드를 작제했다. pDD66 및 pDD67로 명명된 이러한 2개 플라스미드는 상기 실시예 4에 기재된 바와 같이 작제했다. 이들 2개의 플라스미드는 또한 테트라사이클린 내성을 부여하는 유전자를 함유하여, 테트라사이클린을 세포 배양물에 사용하여 플라스미드 유지에 대해 선별할 수 있다. pDD62로 명명된 pDD58의 유도체는 대조군 플라스미드로서 또한 작제했다. 상기 실시예 4에 상세히 기재된 pDD62 플라스미드는 kpsFEDUCS, kpsMT 및 kfoABCDIEHFG 유전자를 함유하고, 또한 테트라사이클린 내성을 제공하는 유전자를 함유한다.
kfoDIEH 유전자의 결실이 프럭토실화된 콘드로이틴의 생합성에 영향을 주는지를 측정하기 위해, pDD62, pDD66 및 pDD67를 MSC188 또는 MSC175(상기 실시예 3에 기재된 W3110△wcaJ) 내로 형질전환시키고, 생성 균주를 배양하고, 프럭토실화된 콘드로이틴 및 비프럭토실화된 콘드로이틴의 생산에 대해 분석했다. 균주 MSC274(MSC175 + pDD62), MSC279(MSC188 + pDD66) 및 MSC280(MSC188 + pDD67)를 진탕 플라스크 중의 CYG 배지에서 30℃로 2 ㎛/mL 테트라사이클린(Tc)와 함께 성장시키고, 지시된 바와 같이 1 mM m-TA로 유도했다. 배양물은 상기한 바와 같이 유도후 24시간에서 샘플링하고, 오토클레이빙하고, 원심분리하고, 생성 상청액을 탈프럭토실화 단계의 존재 또는 부재하에 HPLC 분석에 의해 분석했다.
하기 표 5a에 제시된 바와 같이, 모든 균주는 콘드로이틴을 생산했지만, 플라스미드 pDD66 또는 pDD67를 함유하는 균주에 의해 생산된 콘드로이틴 다당류는 프럭토실화 증거를 나타내지 않는다. 즉, MSC279 및 MSC280 샘플에 대해 HPLC에 의해 측정된 콘드로이틴 역가는 탈프럭토실화 단계로 처리하지 않은 샘플과 비교하여 탈프럭토실화 단계로 처리한 샘플에 있어서 현저히 상이하지 않다. 대조적으로, MSC274 샘플을 탈프럭토실화 단계의 부재하에 분석하는 경우에는 매우 적은 콘드로이틴이 관찰된다. 상당한 콘드로이틴은 탈프럭토실화 단계로 처리한 MSC274 샘플에서만 검출된다. 실시예 14에서 상세한 바와 같이, 프럭토실화된 콘드로이틴은 HPLC 분석에 사용되는 콘드로이티나제에 의해 분해되지 않고, 따라서 당해 분석에 의해 검출할 수 없다. 이들 데이타는 kfoDIEH 유전자 중 하나 이상이 콘드로이틴의 프럭토실화에 요구되지만 이들 유전자중 어떤 유전자도 콘드로이틴 생합성에 요구되지 않음을 명백히 입증한다. 이들 결과는 또한, 콘드로이틴이 m-TA에 의한 유도의 부재하에 생산되지만 유도된 배양물은 비유도된 배양물보다 많은 콘드로이틴을 생산했음을 입증한다. 놀랍게도, MSC279 및 MSC280 둘 다에 의해 생산된 비프럭토실화된 콘드로이틴의 역가는 MSC274에 의해 생산된 프럭토실화된 콘드로이틴의 역가보다 (2.5 내지 4배) 크다. 이 결과는 프럭토실화 사건이 콘드로이틴 생산 효율을 감소시킴을 시사한다. 이는, 시험관내에서 프럭토실화된 콘드로이틴이 비프럭토실화된 콘드로이틴과 비교하여 KfoC 효소(콘드로이틴 폴리머라제)에 대한 불량한 기질이라는 관찰과 일치한다[참조: Lidholt and Fjelstad, J. Biol . Chem . 1997;272:2682-2687].
[표 5a]
Figure 112016019550472-pct00164
이들 균주는 균주 MSC206과 비교하여 개선된 플라스미드 보유, 즉 항생제 내성의 보유를 나타낸다. MSC206 플라스미드 보유 데이타에 대한 상기 실시예 6의 표 4b를 참조한다. 이는 아마도 플라스미드의 선별을 위한 테트라사이클린 대 클로람페니콜의 사용을 반영한다. 추가의 실험은, 최대 콘드로이틴 생산을 달성하기 위해, 세포 성장의 손상 없이, 플라스미드 보유를 최대화하기 위해 사용된 테트라사이클린 또는 기타 바람직한 항생제의 농도를 최적화하기 위해 수행될 수 있다.
플라스미드 pDD66 및 pDD67을 MSC139, 에스케리키아 콜라이(ATCC11303) 내로 형질전환시키고, 생성 균주를 콘드로이틴 생산에 대해 시험했다. 대조군 플라스미드, pDD63을 또한 MSC139 내로 형질전환시켰다. 상기 실시예 4에 기재된 이 플라스미드는 테트라사이클린-내성 유전자가 부가된 pDD54 벡터의 유도체이다. 이는 어떠한 K4 콘드로이틴 생합성 유전자도 함유하지 않는다. pDD63(MSC314), pDD66(MSC315) 또는 pDD67(MSC316)를 함유하는 에스케리키아 콜라이 B에서의 콘드로이틴 생산을 진탕 플라스크에서 평가했다.
이 실험에서, 배양물은 5 ㎍/mL 테트라사이클린(Tc5)을 함유하는 TB 배지에서 30℃에서 성장시켰다. 하기 실시예 8에 기재된 바와 같이, TB 배지에서의 성장은 CYG 배지와 비교하여 에스케리키아 콜라이에서 콘드로이틴의 재조합 생산을 향상시키는 것으로 밝혀졌고, Tc5는 세포 성장의 손상 없이 플라스미드 유지를 위해 유효 농도인 것으로 밝혀졌다. 배양물은 0.05 OD A600으로 접종했고, 2 mM m-TA의 첨가에 의해 0.10 내지 0.13에서 유도했다. 유도 후, 배양물은 3일 이하 동안 30℃에서 성장시켰다. 균주 MSC315는 초기에 다른 균주보다 서서히 성장했고, MSC314 및 MSC316 배양물보다 수시간 후에 유도되었다. 유도후 48시간(MSC315의 경우에 유도후 42시간)에서, 테트라사이클린의 존재 또는 부재하에서의 생존 세포 계수 및 HPLC 방법에 의한 콘드로이틴 분석을 위해 샘플을 취했다.
하기 표 5b에 제시된 분석 결과는 pDD66 또는 pDD67 중의 하나가 존재하는 경우에 에스케리키아 콜라이에서 상당한 수준의 콘드로이틴 생산을 입증한다. pDD63을 함유하는 균주 MSC314, "공 벡터(empty vector)" 대조군에서는 어떠한 콘드로이틴도 검출되지 않았다. 이 실험에서 플라스미드 보유(% Tcr)는 pDD66 및 pDD67에 대해 대략 50%인 반면, 대조군 벡터 pDD63의 검출가능한 소실은 없었다.
[표 5b]
Figure 112016019550472-pct00165
에스케리키아 콜라이는 캡슐을 생산하지 않지만, 영역 2 유전자가 삽입 요소에 의해 파괴되어 있고 영역 1 및 3 유전자가 작용성인 것처럼 보이는 미소(cryptic) 그룹 2 캡슐 유전자를 함유한다[참조: Andreishcheva and Vann, Gene 2004;484:113-119]. 에스케리키아 콜라이 K4 유전자가 에스케리키아 콜라이 B 영역 2 결함을 "보충"할 수 있는지를 측정하기 위해, kfoABCFG 유전자만을 함유하는 플라스미드를 작제했다. 이 플라스미드, pCX039는 실시예 4에 기재되어 있다. 플라스미드 pCX039를 MSC139, 에스케리키아 콜라이 B(ATCC11303)에 형질전환시키고, MSC317로서 명명된 생성 균주에서의 콘드로이틴 생산을 진탕 플라스크에서 평가했다. 당해 균주를 30℃에서 TB 배지 + 5 ㎍/mL Tc에서 성장시켰다. 배양물을 대략 0.05 OD A600으로 접종시키고, 대략 0.10의 OD에서 2 mM m-TA로 유도했다. 유도후 48시간에서, 테트라사이클린의 존재 또는 부재하의 생존 세포 계수 및 HPLC 방법에 의한 콘드로이틴 분석을 위해 샘플을 취했다.
LB 플레이트에서 분석하는 경우, 5.9 x 109 cfu/mL가 수득되었고, 5 ㎍/mL Tc를 함유하는 LB 플레이트 상에의 병행 플레이팅으로부터 수득된 cfu의 역가는 현저히 상이하지 않았다. 이는, pCX039 플라스미드가 당해 실험에서 정량적으로 유지됨을 나타낸다. HPLC 기반 콘드로이틴 분석은 탈프럭토실화 단계 없이 수행했다. 이 분석에서 측정된 콘드로이틴 역가는 205 ㎍/mL이었다. 이 결과는 영역 2 K4 유전자 kfoABCFG만이 에스케리키아 콜라이 B에서 콘드로이틴 생합성을 달성하는데 요구됨을 입증한다. 하기 실시예 9에서, 에스케리키아 콜라이 B 중의 영역 1 및 3 유전자는 K4 영역 2 유전자와 함께 작용하여 콘드로이틴 분비를 야기하는 것으로 밝혀졌고, 이러한 발견은 문헌[참조: Andreishcheva and Vann (2004)]의 것과 일치한다.
상기 주목한 바와 같이, KfoB 및 KfoG 상동체는 다른 글리코스아미노글리칸-생산 박테리아의 유전자 클러스터에 인코딩되어 있지만, 이들 단백질의 기능은 알려져 있지 않은 상태이다. 실시예 4에 기재된 바와 같이, kfoB 또는 kfoG 유전자는 pDD66 및 pDD67로부터 결실되어 플라스미드 pCX040, pCX041, pCX042 및 pCX043을 생성하며, 이들은 하기 표 5c에 요약되어 있다. 이들 플라스미드를 숙주 균주 MSC188 내로 형질전환시키고, 생성 균주의 배양물을 콘드로이틴 생합성에 대해 시험했다. 배양물을 30℃로 TB 배지에서 성장시키고, OD A600 약 0.2에서 2 mM m-TA로 유도하고, 유도후 48시간에서 생존 세포 계수 및 콘드로이틴 분석을 위해 샘플링했다. 하기 제시된 이들 분석의 결과는 어떠한 유전자도 재조합 에스케리키아 콜라이 K-12에서 콘드로이틴 생합성에 절대적으로 필수적인 것은 아님을 시사했다.
[표 5c]
Figure 112012080180037-pct00011
이들 결과에 기반하여, KfoB 단백질 활성은 이들 성장 조건하에 이들 균주에서 콘드로이틴 생산에 필수적이지 않은 것 같다. 사실, 이들 실험에서, pDD66으로부터 kfoB의 결실을 함유하는 균주는 pDD66을 함유하는 균주보다 대략 20% 더 많은 콘드로이틴을 생산했다; MSC279 대 MSC322 참조. 이러한 차이는 유의적일 수 있지만, 재조합 에스케리키아 콜라이에서 콘드로이틴 생산에 대해 관찰된 일상의 편차 내이다. MSC279와 MSC322를 비교하는 반복 실험에서, kfoB 결실 균주에 의한 콘드로이틴의 생산 향상은 콘드로이틴 생산에 거의 효과가 없거나 전혀 효과가 없는 것으로 나타났다.
kfoG를 불활성화시키기 위해 돌연변이된 에스케리키아 콜라이 K4 균주의 이전 공개된 연구는 생산된 프럭토실화된 콘드로이틴의 수준에 대한 kfoG 돌연변이의 어떠한 효과도 보고하지 않았다[참조: Krahulec et al., 2005]. 대조적으로, 본 발명자들의 결과는 KfoG 단백질이, 콘드로이틴의 생산에 절대적으로 필수적이지는 않지만, 이러한 실험의 이들 성장 조건하에 에스케리키아 콜라이에서 재조합 콘드로이틴의 생산의 최적 수준을 위해 요구되는 것을 입증한다. kfoG 유전자의 결실은 pDD66 및 pDD67에 의한 콘드로이틴의 생산을 매우 감소시켰다. pDD66 배경에서, kfoG가 결실된 균주(MSC323)는 야생형 대조군 균주 MSC279가 생산한 콘드로이틴의 대략 20%만을 생산했다. 유사하게는, pDD67 배경에서, kfoG가 결실된 균주(MSC325)는 야생형 대조군 균주 MSC280이 생산한 콘드로이틴의 대략 5%만을 생산했다.
실시예 8
실시예는 다양한 성장 배지, 온도 및 유도 조건에서 콘드로이틴의 재조합 생산을 입증한다.
각종 상이한 성장 배지는 에스케리키아 콜라이 K4 콘드로이틴 생합성 유전자를 함유하는 재조합 에스케리키아 콜라이 균주에 의한 콘드로이틴의 생산을 뒷받침할 수 있다. 재조합 콘드로이틴의 최적 생산을 위해, 배지 조성, 온도, 유도인자 농도 및 유도후 배양 기간 등의 배양 조건을 최적화시킬 필요가 있다.
에스케리키아 콜라이에서 콘드로이틴의 재조합 생산에 대한 초기 연구는 CYG 성장 배지(20 g/L 카스아미노산, 5 g/L 효모 추출물, 2 g/L 글루코즈, pH 7.2)를 사용했다. 각종 대체 성장 배지 및 배양 조건을 사용하여, 콘드로이틴을 생산할 수 있는 재조합 에스케리키아 콜라이 균주를 배양하고 콘드로이틴 생산을 달성할 수 있다.
에스케리키아 콜라이의 성장을 뒷받침하는 것으로 공지된 한 가지 대체 배양 배지는 TB 배지이다[참조: Sambrook, J., Fritsch, E. F. and Maniatis, T., Molecular Cloning: A Laboratory Manual, Second Edition, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY (1989)]. 이 배지를 시험했고, 재조합 에스케리키아 콜라이에 의한 콘드로이틴의 생산을 뒷받침하는 것으로 밝혀졌다. 추가로, 콘드로이틴 생산에 대한 연장된 배양 시간(유도후 72시간 이내)의 효과를 또한 시험했다. 또한, 1 mM 대 2 mM m-TA를 사용한 유도에 대한 콘드로이틴 생산의 효과를 또한 시험했다.
균주 MSC279 및 MSC280는 테트라사이클린을 5 ㎍/mL로 함유하는 TB에서 30℃로 진탕 플라스크에서 성장시켰다. 배양물은 0.05 OD A600에서 접종하고, 대략 (0.1 내지 0.2) OD A600에서 1 mM 또는 2 mM m-TA의 첨가에 의해 유도했다. 유도후 24 및 48시간에서, 배양물을 콘드로이틴 분석 및 생존 세포 계수를 위해 샘플링했다. 이 실험의 결과는 하기 표 6a에 요약되어 있다.
[표 6a]
Figure 112012080180037-pct00012
이 결과는 TB 배지가 현저한 수준의 콘드로이틴 생산을 뒷받침할 수 있음을 입증한다. 또한, 배양 시간의 연장은 콘드로이틴 역가를 현저히 증가시켰고; 콘드로이틴 수준은 유도후 24 내지 48시간에서 대략 2배가 되었다. 0.4 내지 0.5 g/L의 최종 콘드로이틴 역가는 유도후 48시간에서 달성되었다. 이들 데이타는 또한 보다 높은 유도인자 농도가, 효과의 정도가 크지는 않지만, 보다 큰 생산능을 제공할 수 있음을 시사한다.
CYG 및 TB 둘 다는 가수분해된 카세인 생성물 및 자가분해된 효소를 함유하는 "복합" 성장 배지이고, 여기서 배지의 성분들은 화학적으로 규정되지 않는다. 일부 상황에서, 세포 배양을 위해 최소 또는 규정 성장 배지를 사용하는 것이 바람직할 수도 있다. 가능한 규정 또는 최소 배지의 일부 예는 효모 추출물(YE)의 보충하에 또는 보충 없이 "2XM9" + 글루코즈 또는 글리세린을 포함한다. "2XM9"의 기본 무기 염은 22.6 g/L Na2HPO4·H2O, 6 g/L KH2PO4, 1 g/L NaCl, 2mM MgSO4, 0.2 mM CaCl2, 및 2.0 g/L NH4Cl(pH 7.4)이다. 이러한 제형에 탄소원을 첨가하고, 기타 보충제를 지시된 바와 같이 첨가할 수 있다. 균주 MSC279 및 MSC280은 탄소원으로서 10 g/L 글루코즈 또는 글리세린을 함유하는 2XM9에서 30℃로 진탕 플라스크에서 배양했다. YE와 함께 1 g/L로 글루코즈 함유 배지의 보충 효과를 또한 시험했다. 이 실험을 위해, 접종물로서 사용된 밤새 배양물을 LB 배지에서 성장시켰다. 배양물은 0.05 OD A600으로 접종시키고, 대략 0.1 내지 0.2 OD A600에서 1 mM m-TA의 첨가에 의해 유도했다. 탄소원으로서 글루코즈를 함유하는 배양물을 생존 세포 계수 및 콘드로이틴 분석을 위해 유도후 24 및 48시간에서 샘플링했다. 그러나, 글리세린 배양물은 초기 및 유도후 24시간에서 비교적 서서히 성장했고, 미약한 성장만이 있었기 때문에, 글리세린 배양물의 성장은 72시간까지 연장했고 샘플은 48 및 72시간에서 취했다. 하기 표 6b는 이 실험의 결과를 요약한 것이다.
[표 6b]
Figure 112012080180037-pct00013
균주 둘 다는 모든 3개 배지 조성물에서 대략 5 내지 6의 최종 OD A600에 도달했고, 플라스미드 보유는 대략 75 내지 90%로 비교적 양호했다. 콘드로이틴은 시험된 모든 배지에서 상당량으로 생산되었다. 수거시의 역가는 대략 100 내지 350 ㎍/mL 범위였다. 2XM9 + 글루코즈 배지에 대한 효모 추출물의 첨가는 최종 콘드로이틴 역가에 대한 적절한 효과를 대부분 갖는다. 초기 성장 지연에도 불구하고, 글리세린 배양물은 글루코즈로 관찰된 것과 유사한 최종 세포 밀도까지 성장했다. 콘드로이틴의 최종 역가는 글루코즈 배양물과 비교하여 글리세린 배양물에서 (1.5 내지 3배) 더 높았다. 이들 결과는 현저한 수준의 콘드로이틴 생산을 뒷받침할 수 있는 최소/규정 배지의 예를 제공한다. 추가의 배지 개발 및 최적화는 미생물 발효 공정 개발 분야의 통상의 지식을 가진 자에게 공지된 표준 방법을 사용하여 수행할 수 있다.
또 다른 실험은 콘드로이틴 축적에 대한 성장 온도 및 유도후 연장된 성장 시간의 효과를 입증한다. MSC280의 배양물을 CYG 배지 + 2 ㎍/mL Tc에서 성장시켰다. 플라스크를 20℃, 25℃, 30℃ 및 37℃에서 배양했다. 배양물을 대략 0.05 OD A600으로 접종시키고, 지시된 온도에서 대략 0.1 내지 0.2 OD A600으로 성장시키고, 이 시점에서 배양물을 지시된 1 mM m-TA의 첨가에 의해 유도했다. 30℃에서 한 가지 대조군 배양물은 유도하지 않았다. 샘플은 콘드로이틴 분석 및 생존 세포 계수를 위해 유도후 24, 48 및 72시간에서 수집했다. 말기 수거 시점으로부터의 결과는 표 6c에 하기 제시되어 있다. 이들 조건하에, 콘드로이틴 생산은 시험된 모든 온도에서 달성되었지만, 최고의 콘드로이틴 역가는 25℃ 및 30℃에서 달성되었다. 콘드로이틴 축적은 시험된 모든 온도에서 성장 2일차 및 3일차 동안 현저히 증가했다(데이타는 도시하지 않음). 37℃에서, 콘드로이틴 생산은 30℃에서보다 실질적으로 낮았고(대략 10배), 37℃ 배양물의 생존률은 불량했다. 추가의 최적화는 20℃ 내지 30℃ 범위의 추가 온도를 시험함으로써 콘드로이틴 생산에 대한 바람직한 온도 범위의 정의를 밝힘으로써 달성할 수 있다. 유사하게는, 추가의 최적화는 콘드로이틴 역가에 대한 유도후 배양 시간의 효과를 밝힘으로써 달성할 수 있다.
[표 6c]
Figure 112012080180037-pct00014
배양 시간을 연장함으로써 배양 시간을 최적화하기 위한 추가의 연구는 콘드로이틴 생산을 추가로 증가시킬 수도 있다. 유사하게는, 유도인자의 추가 농도를 시험하여 콘드로이틴 생산에 대한 최적 농도를 확인할 수 있다.
실시예 9
본 실시예는 재조합 콘드로이틴이 에스케리키아 콜라이 K-12 및 에스케리키아 콜라이 B에서 배양 배지로 분비될 수 있음을 입증한다. 본 실시예는 추가로 콘드로이틴이 또한 세포내에서 고도로 생산될 수 있음을 입증한다.
에스케리키아 콜라이 K4를 액체 배지에서 배양하는 경우, 캡슐 다당류(K4P), 프럭토실화된 콘드로이틴은 배양 배지에 무세포 형태로 및 세포 결합 형태로서 축적되는 것으로 보고되어 있다[참조: Manzoni et al., Biotech. Lett. 1996;18:383-386, Cimini at al. Appl. Mocrobiol. Biotechnol. E-Publication, E-Pub. October 2009]. 다른 2군 캡슐 다당류, 예를 들면, 에스케리키아 콜라이 혈청형 K1 및 에스케리키아 콜라이 혈청형 K5에 의해 생산된 것들과 유사하게, 세포 결합 형태는 주로 지질 앵커(anchor)에 의해 세포의 외막의 외엽과 결합하는 것으로 믿어진다[참조: Whitfield, 2006]. 다당류와 지질 앵커 사이의 연결의 성질은 구조 수준에서 정의되어 있지 않고, 지질 앵커가 무엇인지도 측정된 바 없다. 상기 실시예 6 내지 8에 기재된 바와 같이 생산 및 검출된 재조합 콘드로이틴은 배양 배지에 명백하게 존재한다. 저속 원심분리(3500g에서 10분)는 콘드로이틴에 대해 분석되는 샘플의 배양 배지로부터 세포를 제거하기에 충분하고, 상당량의 콘드로이틴 무세포 상청액에서 검출되었다. 그러나, 상기 실시예 6 내지 8에서 콘드로이틴에 대해 분석된 모든 샘플은 박테리아를 사멸시켜 샘플 취급을 용이하게 하기 위해 원심분리 전에 오토클레이빙시켰다. 오토클레이빙 단계는 임의의 세포 결합된 콘드로이틴의 연결을 잠재적으로 분쇄하고, 세포로부터 이러한 세포 결합 콘드로이틴을 방출시킬 것이다. 재조합 콘드로이틴이 무세포 및/또는 세포 결합 형태로 생산되는지를 측정하기 위해, 이어서 콘드로이틴 생산 배양물로부터의 샘플의 원심분리 후 상청액 및 펠렛 분획 내로의 재조합 콘드로이틴의 분배에 대한 오토클레이빙의 효과를 시험하는 실험을 수행했다.
균주 MSC279를 30℃에서 TB 배지 5 ㎍/mL Tc에서 진탕 플라스크에서 성장시켰다. 배양물은 대략 0.03 OD A600으로 접종하고, 대략 0.1 내지 0.2 A600으로 성장시켰으며, 이 시점에서 2 mM m-TA의 첨가에 의해 유도했다. 유도후 48시간에서 샘플을 취하고, 콘드로이틴에 대해 분석했다. 이 배양물의 하나의 분취량을 원심분리 전에 오토클레이빙시키고, 생성된 상청액 및 세포 펠렛 분획을 실시예 14의 HPLC 방법에 따라 콘드로이틴에 대해 분석했다. 또 다른 분취량을 오토클레이빙 없이 원심분리하고, 생성된 상청액 및 세포 펠렛 분획을 실시예 14의 HPLC 방법에 따라 콘드로이틴에 대해 분석했다. 비-오토클레이빙 샘플로부터의 세포 펠렛은 THB(50 mM 나트륨 아세테이트와 함께 50 mM 트리스-HCl, pH 8.0)에 재현탁시키고, 콘드로이티나제 ABC("CHase")로 직접 처리하고, 다시 원심분리하여 분석용 상청액 및 펠렛 분획을 생성했다. 잔류 배양 배지에 함유된 무세포 콘드로이틴을 시험하기 위해, 비-오토클레이빙 샘플로부터의 또 다른 세포 펠렛을 THB에서 천천히 세척한 다음, 재원심분리했다. 세척으로부터의 상청액(샘플 #7) 및 세척액으로부터 세포 펠렛(용해 없음)(샘플 #8)을 상기와 같이 콘드로이틴에 대해 분석했다. 이 실험의 결과는 하기 표 7a에 제시되어 있다.
[표 7a]
Figure 112012080180037-pct00015
오토클레이빙 샘플에서, 전체 콘드로이틴 중의 11%만이 세포 펠렛(샘플 #2)에 존재하는 반면, 원심분리 전에 오토클레이빙하지 않은 샘플(샘플 #4) 에서는 전체 콘드로이틴 중의 45%가 세포 펠렛에 존재했다. 이 결과는 MSC279에 의해 생산된 콘드로이틴의 상당 분획이 세포 결합 상태로 존재하고 오토클레이빙 단계가 세포와 콘드로이틴의 결합을 파괴함을 나타낸다. 비오토클레이빙 균주의 펠렛 중의 세포 결합 콘드로이틴은 용해 처리 부재하에 재현탁된 세포의 직접 CHase 처리에 의해 분해되는 것으로 밝혀졌다. 방출된 이당류의 양에 기반한 표면 결합된 콘드로이틴의 계산된 양은 본래 배양물에서 130 내지 154 ㎍/ml(샘플 #5 및 샘플 #8)인 것으로 밝혀졌다. 이 값은 실시예 14의 "세포 용해" 기술에 의해 측정된 세포 결합 콘드로이틴 역가(178 ㎍/mL)(샘플 #4)보다 다소 낮은데, 이는 내부 콘드로이틴 폴리머를 반영할 수 있다(샘플 #2 및 샘플 #6에서 측정된 바와 같음). 그러나, 분석 방법 둘 다로부터의 데이타는 상당히 높은 콘드로이틴 분획이 오토클레이빙 샘플과 비교하여 비오토클레이빙 샘플에서 세포 결합되어 있음을 나타내는 것과 정량적으로 일치한다. 세포 결합된 콘드로이틴이 전체 세포 현탁액의 CHase 처리에 의해 이당류로 분해되었다는 사실은, 다당류가 세포 외부 및 배양 배지 내에 잔류하는 방식으로, 이러한 콘드로이틴 분획이 세포의 외막과 결합되는 것을 나타낸다. 이는 캡슐의 예상된 구조와 일치한다.
이들 결과는 균주 MSC279에 의해 생산된 재조합 콘드로이틴의 상당 분획(≥50%)이 세포 결합되지 않은 형태로 배양 배지 내에 존재함을 입증한다. MSC279에 의해 생산된 세포 결합된 콘드로이틴의 벌크는 세포에 부착하지만, 첨가된 CHase에 의한 분해에 의해 입증된 바와 같이 주위 배지에 접근가능하다. 천연 에스케리키아 콜라이 K4에 의한 무세포 및 세포 결합된 형태의 K4P의 생산은 이미 문헌[참조: Manzoni et al., Biotechnol. Lett. 1996;18(4):383-386 and Cimini et al., Appl. Microbiol. Biotechnol. E-Publication, October 2009]에 보고되어 있다. 재조합체 생산 동안 두 형태의 관찰은 MSC279에서 재조합 콘드로이틴의 합성 및 분비가 천연 균주에서 작용하는 동일한 경로에 의해 진행된다는 관찰과 일치한다. 이는 MSC279 내로 도입된 클로닝된 유전자 모두가 에스케리키아 콜라이 K4에서와 동일한 방식으로 작용하고 캡슐 다당류의 합성 및 이출에 대한 완전한 경로가 재조합 균주에서 작용하는 것을 시사한다.
박테리아 발효에 의해 콘드로이틴을 생산하기 위해, 대규모 발효기를 사용하는 것이 바람직하고, 이는 너무 커서, 세포 결합 콘드로이틴을 배양 배지로 방출하는 방법으로서 가능할 오토클레이빙을 실시할 수 없는 배양 배지의 용적을 생성한다. 산 또는 염기 처리와 조합하여 승온을 사용하는 또 다른 처리를 대규모 제조에 사용할 수 있다.
콘드로이틴을 배양 배지로 분비하는 유사한 결과는 콘드로이틴을 생산하는 재조합 에스케리키아 콜라이 B 균주로 수득되었다. 본 발명자들은 재조합 에스케리키아 콜라이 K-12에서 kfoB 유전자가 콘드로이틴 생산에 필수적이지 않음을 이미 관찰했다. 에스케리키아 콜라이 B에서 콘드로이틴의 분비를 시험하기 위해, MSC347(MSC139 pCX044, 즉 pCX039△kfoB)을 30℃로 TB/Tc5 배지에서 성장시키고, 2 mM m-TA로 대략 0.15의 OD A600에서 유도했다. 48시간에서, 브로쓰 샘플을 취하고, 오토클레이빙의 존재 및 부재하에 원심분리하여 상청액 및 세포 펠렛 분획을 생성했다. 이 실험의 콘드로이틴 분석 결과는 하기 표 7b에 제시되어 있다. 오토클레이빙은 상청액 분획에서 90% 초과의 전체 측정가능한 rCH를 생성했다. 그러나, 비오토클레이빙 샘플에서는, 대략 30%의 콘드로이틴만이 상청액에서 관찰되었다. 이들 결과는 상기 상세한 바와 같은 재조합 에스케리키아 콜라이 K-12를 사용한 발견과 일치하며, 이는 오토클레이빙 단계(5분, 121℃, 15 psi)가 실질적으로 모든 rCH를 배지로 방출함을 시사한다. 이들 결과는 에스케리키아 콜라이 B 중의 영역 1 및 3 유전자가, 영역 2 유전자가 존재하는 경우, 콘드로이틴을 분비하도록 작용함을 추가로 나타낸다.
[표 7b]
Figure 112012080180037-pct00016
세포 배양 배지 내로 콘드로이틴의 분비 및 배양 배지 내로 세포 결합 콘드로이틴의 방출은, 무세포이고 원심분리 또는 여과에 의해 세포로부터 분리된 후에 정제될 수 있는 콘드로이틴을 수득하는 방법을 제공한다. 또한, 콘드로이틴 생합성 유전자의 유전자 조작에 의해 세포내 콘드로이틴을 생산할 수 있다. 콘드로이틴의 세포내 생산은 배양 배지에서 고도의 다당류로부터 발생하는 발현 점도를 제거하기 위해 요구될 수 있다. 또한, 에스케리키아 콜라이에서 콘드로이틴 생산 및 콘드로이틴 생합성의 생화학에 대한 본질적인 제한은 불완전하게 이해되고 있다. 세포내 생산은 분비보다는 콘드로이틴의 보다 높은 수준을 달성할 수 있다. 따라서, 배양 배지로의 분비의 부재하에 현저한 수준의 콘드로이틴을 축적하는 재조합 유전자 세트가 동정되었다.
특정한 조건하에 다른 에스케리키아 콜라이 캡슐 다당류를 합성하고 세포내에 축적할 수 있다는 것은 문헌에 입증되어 있다. 브로너 등[참조: J. Bact. 1993;175:5984-5992]의 전자 현미경(EM) 결과는 kpsC 및 kpsS 내의 돌연변이체 결함에 의해 에스케리키아 콜라이 혈청형 K5 캡슐 다당류(헤파로산)의 일부 세포내 축적이 존재함을 시사했다. 유사한 관찰은, kpsC, kpsS, kpsE 또는 kpsT 중의 돌연변이체 결함을 EM으로 검사하는 경우, 에스케리키아 콜라이 K1의 폴리시알산 캡슐 다당류에 대해 시에스레비츠 및 빔르(Cieslewicz and Vimr)에 의해 보고되었다[참조: J. Bact. 1996;178:3212-3220]. 세포내 K1 및 K5 다당류의 수준은 이들 연구에서 정량화되지 않았다.
영역 1 또는 영역 3 유전자의 돌연변이가 에스케리키아 콜라이 K-12에서 재조합에 의해 생산된 콘드로이틴의 분비를 차단할 수 있는지를 측정하기 위해, kpsC 또는 kpsT 유전자가 결실된 플라스미드 pDD66의 유도체(각각 pCX045 및 pCX048)를 실시예 4에 기재된 바와 같이 작제했다. 이들 플라스미드를 MSC188에 형질전환시키고, 생성된 균주는 콘드로이틴을 생산하여 배양 배지로 분비하는 능력에 대해 MSC279(MSC188은 비변형된 pDD66을 함유한다)과 함께 시험했다.
배양물을 30℃에서 TB + Tc5 배지에서 성장시키고, 대략 0.15의 OD A600에서 2 mM m-TA로 유도하고, 48시간 후에 샘플링했다. 48시간 시점에서 각 균주에 대해, 콘드로이틴을 오토클레이빙 및 비오토클레이빙 샘플 둘 다로부터의 상청액 및 세포 펠렛에서 분석했다. 하기 표 7c에 제시된 바와 같이, 48시간에서의 OD는 동등했다. 각각 kpsC 및 kpsT 유전자가 결실된 균주 MSC356 및 MSC359로부터의 비오토클레이빙 샘플에서, 콘드로이틴은 주로(대략 85 내지 90%) 세포 펠렛으로 국지화되었다. 이는, 콘드로이틴의 대략 50%가 세포 펠렛으로 국지화되고 대략 50%가 상청액에 존재하는 MSC279(야생형 대조군)의 결과와 대조적이다.
[표 7c]
Figure 112012080180037-pct00017
균주 MSC279에서 상기(표 7c) 기재된 바와 같이, MSC270 배양물의 비오토클레이빙 샘플에서 세포 펠렛으로 국지화된 콘드로이틴의 대부분은 세포 외막의 외엽에서 지질 앵커에 공유 부착되는 것 같다. 오토클레이빙은, 오토클레이빙의 부재하에 세포 결합되는 콘드로이틴과 세포 막의 결합을 파괴하는 것 같지만, 세포의 오토클레이빙 처리 효과는 완전히 이해되지 않는다. kpsC 또는 kpsT 결함 균주의 세포 펠렛으로 국지화되는 콘드로이틴 및 세포 사이의 결합 성질은 이들 데이타에 의해 해결되지 않는다. 원칙적으로, 이러한 콘드로이틴은 세포 세포질, 주변세포질 공간에 존재할 수 있거나, 세포 외막에 여전히 부착될 수 있다. 그러나, 이들 돌연변이 균주에 대한 결과는 kpsC 및 kpsT 에서 돌연변이가 콘드로이틴의 분비를 차단하고 콘드로이틴의 세포내 축적을 생성한다는 관찰과 일치한다. 세포 표면 상에 이러한 콘드로이틴의 존재는 비오토클레이빙 세포 펠렛을 재현탁시키고 재현탁된 세포를 CHase 효소로 처리하고 콘드로이틴 특이적 이당류의 생산을 측정함으로써 시험할 수 있다. 또는, 전자 현미경을 사용하여, MSC356 및 MSC359에 의해 생산된 세포 결합된 콘드로이틴의 세포 위치를 측정할 수 있다.
하기 상세한 추가의 실험은, 야생형 균주 MSC279를 이용하여 세포로부터 콘드로이틴의 방출에서 오토클레이빙의 역할을 확인하고 K4 영역 2 유전자만을 함유하는 에스케리키아 콜라이 K-12(MSC346; MSC188 pCX039)가 세포내 콘드로이틴을 생산할 수 있는지를 측정하기 위해 설계되었다. 균주 MSC279 및 MSC346은 30℃에서 TB/Tc5에서 성장시키고, 2 mM m-TA로 대략 0.15의 OD A600에서 유도했다. 48시간 후, 이중 브로쓰 샘플을 취하여, 원심분리 전에 오토클레이빙의 존재 및 부재하에 상청액 및 세포 펠렛 분획을 생성했다. 이들 샘플로부터의 콘드로이틴 분석 결과는 하기 표 7d에 제시되어 있다. 완전 콘드로이틴 생합성 유전자 세트를 함유하는 균주 MSC279로부터의 비오토클레이빙 샘플에서, 콘드로이틴은 상청액(55%) 및 펠렛(45%) 사이에서 대략 균일하게 분포되어 있었다. 대조적으로, 영역 2 유전자만을 함유하는 균주 MSC346으로부터 비오토클레이빙 펠렛은 당해 배양물에 의해 생산된 콘드로이틴의 대략 90%를 함유했고, 상청액에서는 거의 발견되지 않았다. 두 균주의 경우, 오토클레이빙은 주로(>90%) 상청액 내로의 CH의 분배를 생성했다.
[표 7d]
Figure 112012080180037-pct00018
이들 결과는 오토클레이빙(5분, 121℃, 15 psi)이 배지 내로 모든 세포 결합된 콘드로이틴을 거의 방출함을 입증한다. 결과적으로, MSC279의 비오토클레이빙 세포 펠렛에서 검출된 콘드로이틴은 원칙적으로 외막에 결합할 수 있거나 세포내 위치를 갖는다. 오토클레이빙의 부재하에, 콘드로이틴은 균주 MSC346 배양물의 상청액에서 거의 발견되지 않았다. 이 결과는, 모든 영역 1 및 영역 3 기능을 결여하여 세포내 콘드로이틴만을 생성하는 MSC346과 일치한다. 보다 낮은 양의 콘드로이틴이 MSC279와 비교하여 MSC346에 의해 생산되지만, 생산된 콘드로이틴의 양은 여전히 현저하고, 이는 콘드로이틴이 재조합 에스케리키아 콜라이 K-12 중의 클로닝된 유전자 kfoABCFG만을 사용하여 성공적으로 생산될 수 있음을 입증한다. 이들 결과는 또한 이러한 콘드로이틴이 오토클레이빙에 의해 세포로부터 유리되고, 원심분리하여 세포 파편을 제거한 후에 오토클레이빙 배양물의 상청액에서 수득될 수 있음을 입증한다. 또는, MSC346의 세포는 공지된 다양한 방법(예: 균질화, 세정 및/또는 효소 용해, 기계적 분쇄, 초음파 등)에 의해 용해될 수 있고, 이들 방법에 의해 방출된 콘드로이틴은 또한 원심분리 후에 상청액에서 회수될 수 있다. 이렇게 회수된 콘드로이틴은 당해 기술분야에 공지된 알콜 침전 등의 방법으로 추가로 정제할 수 있다.
실시예 10
본 실시예는, 염색체에 삽입된 콘드로이틴 생합성 유전자를 함유하는 에스케리키아 콜라이 K-12 균주의 작제를 기재하며, 이들 균주에서 콘드로이틴 생산을 입증한다.
상기 실시예 6 내지 9는, 콘드로이틴 생합성 단백질을 인코딩하는 클로닝된 유전자를 이종성 숙주 균주로 도입하기 위해 플라스미드 벡터를 사용하여 재조합 에스케리키아 콜라이 균주에서 콘드로이틴을 생산하는 것을 기재한다. 몇몇 상황에서, 수용체 숙주 균주의 염색체 내로 클로닝된 콘드로이틴 생합성 유전자를 도입하는 것이 요구될 수 있다. 염색체내에 클로닝된 유전자를 위치시키는 것은, 콘드로이틴 생합성 유전자를 함유하여, 선택된 압력의 부재하에 안정한 발현 균주 또는 보다 안정한 발현 균주를 잠재적으로 제공할 수 있는 플라스미드(들)를 유지하기 위해 선택 압력을 유지하는 요구를 제거한다. 따라서, 콘드로이틴 생합성을 위한 에스케리키아 콜라이 K4 유전자가 숙주 염색체 내로 안정하게 통합되어 있는 에스케리키아 콜라이 K-12 균주를 작제하였다. 이들 "염색체 발현 균주"는 콜란산 생합성 유전자좌에서 통합된 pDD66 및 pBR1052로부터의 Pm 프로모터 및 K4 유전자 세트를 사용한다. 또한, xylS 조절 유전자가 별도의 유전자좌인 fhuA 유전자좌에서 염색체 내로 통합되었다. 생성된 작제물은 진탕 플라스크 및 발효조에서 높은 수준의 콘드로이틴을 생산하는 것으로 밝혀졌다(실시예 14 및 15).
발현 플라스미드 pDD66 및 pBR1052는 실시예 4에 기재되어 있다. pDD66 및 pBR1052로부터의 K4 콘드로이틴 생합성 유전자를, 실시예 3에 또한 기재되어 있는 pMAK-CL 치환 벡터 내로 클로닝하였다. 도 8l에 도시된 이러한 벡터는 콜란산(CA) 유전자 클러스터의 상부 및 하부에 클로닝된 DNA 영역을 함유하고, 이들 영역의 연결부에 유일한 AscI 클로닝 부위를 함유한다. 실시예 3에 상세한 바와 같이, 이러한 벡터를 사용하여, 에스케리키아 콜라이 K-12 W3110 중의 전체 CA 유전자 클러스터의 결실을 작제함으로써 균주 MSC188을 생성했다. K4 유전자 발현 카세트를 잘라내고, pDD66 및 pBR1052로부터 판매자 프로토콜에 따라 QIAEX II 겔 추출 키트(QIAGEN Inc., Valencia, CA)를 사용하여 대략 19 kb AscI 단편으로서 겔 정제하고, 이들 단편을, AscI-분해되고 포스파타제 처리되고 겔 정제된 pMAK-CL DNA와 연결시켰다. 형질전환체는 Pm 프로모터 및 상부 및 하부 전사 터미네이터와 함께 pDD66 및 pDD1052의 AscI 단편 상에 함유되는 테트라사이클린의 내성에 대해 선별했다. pBR1052 또는 pDD66의 AscI 단편을 함유하는 pMAK-CL의 유도체를 동정하고, 각각 pDD77 및 pDD76으로 명명했다. 이들 플라스미드는 도 8l에 도시되어 있다.
플라스미드 pDD74 및 pDD76을 MSC188에 형질전환시켜 각각 균주 MSC373 및 MSC377을 생성하고, K4 유전자 세트가 염색체 내로 통합된 이들 균주의 유도체를 다음과 같이 수득했다. MSC373 및 MSC377을 LB + 5 ㎍/mL 테트라사이클린(Tc5)에서 30℃로 밤새 성장시키고, 대략 20 μL의 분취량을 스폿팅하고, LB + Tc5 플레이트 내로 스트리킹하여 밤새 41℃에서 배양했다. 이 플레이트 상에 발생한 콜로니를 골라내고, 43℃에서 LB + Tc5 플레이트 상에 재스트리킹했다. 고온에서 플라스미드 함유 항생제 내성의 유지에 대한 선택은 염색체 내로 플라스미드의 재조합에 대해 선택하는데, 이는 pDD74 및 pDD76 플라스미드가 pMAK705 벡터의 유도체로서 복제에 대한 온도 민감성이기 때문이다[참조: Hamilton et al ., J Bact . 1989;171:4617-4622]. 테트라사이클린 상에서 43℃로 성장할 수 있는 MSC373 및 MSC377의 유도체를 30℃에서 LB + Tc5 액체 배지에서 밤새 한번 2차 배양하고, 이어서 30℃에서 LB 액체 배지(테트라사이클린 부재)에서 밤새 한번 2차 배양했다. 이어서, 이들 밤새 배양물을 희석하고, 30℃에서 LB 플레이트 상에 플레이팅하고, 분리된 콜로니를 30℃에서 LB, LB + Tc5 및 LB + 34 ㎍/mL 클로람페니콜(Cm34) 상에 이쑤시개로 찍어 넣었다. 하나의 테트라사이클린 내성(TcR), 클로람페니콜 민감성(CmS) 유도체가 각각의 MSC377 및 MSC373으로부터 동정되었다. 각각 MSC391 및 MSC392로 명명된 이들 TcR, CmS 유도체는 추정의 치환 균주였고, 여기서 재조합은 K4 DNA 서열이 CA 유전자좌에서 염색체에 잔류하는 방식으로 발생하는 반면, 플라스미드 서열의 나머지는 상동성 재조합에 의해 잘려지고 플라스미드가 후속적으로 소실되었다. 이들 분리물의 PCR 분석은 대략 19 kb K4 DNA 단편의 5' 및 3' 말단이 콜란산 유전자좌에 플랭킹하는 염색체 DNA 서열과 관련하여 예상된 위치에 존재함을 보여주었다.
실시예 4에서 상세한 바와 같이, 에스케리키아 콜라이 fhuA 유전자의 상부 및 하부의 DNA 영역을 PCR에 의해 클로닝하고, 조립하고, 서열분석하고, 이러한 결실 단편을 pMAK705 자살 플라스미드로 옮겨 pMAK705-△fhuA 또는 pDD73(도 8m)으로 명명된 fhuA 유전자좌에 대한 치환 벡터를 생성했다. xylS 조절 유전자를 다음과 같이 이 치환 벡터 내로 클로닝시켰다. xylS 유전자를 PstI 단편으로서 pDD42로부터 잘라내고, pDD73의 PstI 부위에 클로닝시켜 pDD77을 생성했고, 이는 도 8n에 도시되어 있다. pDD77의 PstI 단편은 발현 플라스미드 pDD66 및 pBR1052 및 모 벡터 pDD54에 존재하는 xylS 함유 PstI 단편과 동일하다. 상기한 바와 같은 K4 유전자 클러스터 치환 균주, MSC391 및 MSC392를 pDD77에 형질전환시켰다. pDD77에 의한 MSC391 및 MSC392로부터의 각각 2개 분리물을 선별하고 다음과 같이 명명했다:
MSC402 = MSC391 pDD77 "분리물 A"
MSC403 = MSC391 pDD77 "분리물 B"
MSC404 = MSC392 pDD77 "분리물 A"
MSC405 = MSC392 pDD77 "분리물 B"
이들 균주를 모두 콘드로이틴 생합성에 대해 진탕 플라스크에서 시험하였다. 균주를 30℃의 TB 배지 + CM34에서 성장시켜 pDD77 플라스미드의 유지에 대해 선별했다. 대략 0.2의 OD A600에서, 배양물을 2 mM m-톨루엔산(m-TA)의 첨가에 의해 유도했다. 샘플은 유도후 24 및 48시간에서 취하고, 콘드로이틴에 대해 분석했다. 4개의 모든 균주는 콘드로이틴을 생산했다. 이들 분석 결과는 하기 표 8a에 제시되어 있다. 유도된 MSC404 및 MSC405에 대한 콘드로이틴 수준은 MSC402 및 MSC403보다 대략 2.5배 높았다. 이 실험에서, MSC404 및 MSC405는 이들 배양 조건하에 진탕 플라스크에서 MSC279(MSC188 pDD66)으로 통상 관찰된 양(대략 0.5 g/L)의 약 65 내지 70%를 생산했다. 이들 결과는 K4 콘드로이틴 생합성 유전자의 단일 염색체 카피를 함유하는 재조합 에스케리키아 콜라이가 현저한 양의 콘드로이틴을 생산할 수 있음을 나타낸다.
[표 8a]
Figure 112012080180037-pct00019
pBR1052로부터 유도된 균주(MSC404 및 MSC405)는 pDD66으로부터 유도된 균주보다 더욱 생산적인 것처럼 보였지만, 염색체 유전자 세트 둘 다는 콘드로이틴을 생산하기에 충분히 양호하게 작용했다. pBR1052로부터 유래된 염색체 K4 유전자는 kpsF 유전자 바로 상부에 삽입된 Pm 프로모터의 제2 카피를 함유한다. 이러한 부가된 프로모터는 pDD66에서의 발현과 비교하여 플라스미드 pBR1052에서 하부 유전자(kpsFEDUCS)의 발현을 향상시키는 것으로 밝혀졌다. 추가의 Pm 프로모터는 또한 염색체 환경에서 하부 유전자 발현을 증가시키고 이들 유전자의 향상된 발현은 CH 생산을 현저히 증가시킬 수 있다.
다음과 같이 2단계 "팝-인(pop-in)/팝-아웃(pop-out)" 방법을 사용하여 pDD77의 플라스미드-함유(plasmid-borne) xylS 유전자가 fhuA 유전자좌에서 염색체 내로 통합된 MSC403 및 MSC405의 유도체를 수득했다. MSC403 및 MSC405를 LB + Cm34에서 30℃로 밤새 성장시켰다. 이들 배양물을 104배로 희석시키고, 0.1mL 분취량을 43℃에서 LB + Cm34 상에 플레이팅시켰다. 밤새 배양한 후, 상이한 크기의 대략 100개 콜로니를 수득했다. 분리된 콜로니를 골라내고, LB + Cm34 플레이트 상에 스트리킹하고, 43℃에서 밤새 성장시켰다. 이들 플레이팅으로부터 분리된 콜로니를 골라내고, 임의의 항생제 없이 LB의 5 mL 배양물을 접종하는데 사용했다. 이들 배양물을 30℃에서 밤새 성장시키고, 이어서 1000배 희석하여 2회 계대 배양하고, 30℃로 LB에서 밤새 성장시켰다. 이어서, 이러한 3차 계대를 106배로 희석하고, 0.1 mL 분취량을 30℃ 및 37℃에서 LB 상에 플레이팅시켰다. 이들 플레이팅으로부터의 개개 콜로니를 LB 및 LB + Cm34 상에 이쑤시개로 찍어 넣어 플라스미드의 소실을 시험했다. 클로람페닐콜-민감성(CmS) 분리물은 용이하게 수득되었고, 이들을 PCR에 의해 스크리닝하여, xylS 함유 DNA 서열이 fhuA 유전자좌에서 염색체에 유지되면서 플라스미드 서열의 나머지가 잘라져서 플라스미드가 후속적으로 소실되는 방식으로 재조합이 발생하는 목적하는 "팝-아웃" 치환 균주를 동정했다. 이 작업은 또한 에스케리키아 콜라이 염색체로부터 전체 fhuA 유전자를 결실시켰다. 이들 분리물의 PCR 분석은 xylS DNA 단편의 5' 및 3' 말단이 fhuA 유전자좌에 플랭킹하는 염색체 DNA 단편에 대하여 예상된 위치에 존재함을 나타냈다. MSC403로부터 유도된 MSC410 및 MSC405로부터 유도된 MSC411은 fhuA 유전자좌에 삽입된 xylS 유전자를 함유하고, 콜란산 유전자좌에 삽입된 K4 유전자를 보유한다.
MSC410 및 MSC411을 콘드로이틴 생합성에 대해 시험했다. 균주를 30℃로 TB 배지 및 대략 0.2의 OD A600으로 성장시키고, 배양물을 2 mM m-TA의 첨가에 의해 유도했다. 샘플을 유도후 24시간 및 48시간에서 취하고, 콘드로이틴에 대해 분석했다. 하기 표 8b에 제시된 바와 같이, 이들 균주 모두는 매우 낮은 수준의 콘드로이틴을 생산했다.
[표 8b]
Figure 112012080180037-pct00020
이러한 낮은 생산능은 예상치 못한 것인데, 이는 직전 조상 균주가 동일한 배양 조건하에서 필적하는 세포 밀도로 상당량의 콘드로이틴을 생산했기 때문이다. 먼저, 이들 결과는 xylS 유전자의 염색체 삽입이 유도인자 m-TA의 존재하에서도 Pm 프로모터를 활성화시키기에 충분한 양의 SylS 단백질을 생산하지 못하는 것을 나타낼 수 있다. 또는, 이들 균주에서 삽입된 K4 및/또는 xylS 유전자의 추정된 DNA 구조가 정확하지 않을 수도 있다. 상동성 콜란산 유전자좌 및 fhuA 유전자좌 서열에 플랭킹하는 염색체 서열과 관련하여 두 절편의 5' 및 3' 말단의 연결 관계는 PCR에 의해 입증되었다. 그러나, 이들 데이타는 단독으로 이들 균주에서 삽입된 DNA의 정확한 구조 및 서열을 확증하지 못한다. K4 또는 xylS DNA 절편 내의 재배열, 결실 또는 돌연변이가 이들의 개개 CH 생산 모균주(MSC403 및 MSC405)로부터 MSC410 및 MSC411의 유도 과정에서 발생되었을 수 있고, CH 생합성의 손상을 발생시켰을 수 있다.
이들 가설을 시험하기 위해 실험을 수행하였다. 플라스미드 pDD77을 MSC410 및 MSC411에 형질전환시켜 이들 두 균주에서 염색체 K4 유전자의 작용을 시험했다. 생성되는 균주는 MSC436(MSC410 pDD77 "분리물 A"), MSC437(MSC410 pDD77 "분리물 B"), MSC438(MSC411 pDD77 "분리물 A") 및 MSC439(MSC411 pDD77 "분리물 B")로서 명명하였다. 이들 균주는 30℃의 TB 배지 및 대략 0.2의 OD A600으로 성장시키고, 배양물은 2 mM m-TA의 첨가에 의해 유도했다. 샘플은 유도후 24 및 48시간에서 취하고, 콘드로이틴에 대해 분석했다. 하기 표 8c에 제시된 바와 같이, 이들 4개 균주는 이들의 선조 균주 MSC403 및 MSC405에서 관찰된 역가와 매우 유사하고 이들의 직전 조상 균주 MSC410 및 MSC411보다 훨씬 높은 콘드로이틴의 현저한 역가를 생성했다. 이들 결과는 균주 MSC410 및 MSC411에서 콘드로이틴 생합성의 결함은 K4 콘드로이틴 생합성 유전자 자체로부터 발생하지 않음을 나타냈다.
[표 8c]
Figure 112012080180037-pct00021
이들 발견은 균주 MSC410 및 MSC411에서 콘드로이틴 생합성이 낮을 수 있음을 시사하며, 이는 (각각 MSC403 및 MSC405로부터) MSC410 및 MSC411의 생성 동안 발생할 수 있는 유전자 코딩 서열의 일부 구조적 오차로부터 발생하는 XylS 단백질 기능의 결함에 기인하거나, xylS 유전자 서열은 정확할 수 있지만 이들 작제물에서 염색체 xylS 유전자의 발현 수준이 K4 유전자의 최적 발현을 달성하는데 불충분할 수 있기 때문임을 제안한다.
MSC410 및 MSC411의 염색체 중 xylS 유전자를 이들 가설을 시험하기 위해 서열분석했다. xylS 유전자 삽입을 함유하는 에스케리키아 콜라이 염색체의 영역은 통합 부위의 측면에 위치하는 프라이머를 사용하여 PCR에 의해 증폭시키고, 증폭된 DNA 절편을 서열분석했다. xylS 프로모터 및 코딩 영역의 서열은 예상된 서열과 정확히 일치했다. 이 결과는 MSC410 및 MSC411에서 xylS 기능의 결함이 염색체 유전자로부터의 XylS 단백질의 불충분한 발현에 기인함을 시사했다. 따라서, xylS 유전자의 발현을 향상시키기 위해 실험을 수행하였다. 이를 위해, xylS 유전자 프로모터, 리보솜 결합 부위 및 5' 비해독된 영역(UTR)의 합성 최적화 버젼을 설계 및 합성했고, 이들 변형된 서열을 xylS 치환 벡터 pDD77 및 이어서 염색체로 도입했다.
합성된 단편은 pDD77의 BlpI-PstI 서열과 일치하는 134bp의 서열, 이어서 xylS의 ATG 개시 코돈까지의 86bp의 합성 서열을 함유하고, 유일한 BglII 부위를 통해 xylS 코딩 서열 내로 추가로 37bp 연장한다. ATG로부터 BglII 부위까지의 서열은 pDD77에 존재하는 서열과 일치한다. BlpI-BglII 단편은 pDD77 내로 용이하게 도입될 수 있는데, 이는 이들 제한 부위가 이 플라스미드에서 유일하기 때문이다. 86bp 합성 서열(하기 제시됨)(서열 번호 98)은 컨센수스 에스케리키아 콜라이 프로모터[참조: Hawley and McClure, Gene 1983;11:2237-2255.] 및 컨센수스 샤인-달가노(Shine-Dalgarno)(S-D) 서열[참조: Shine and Dalgarno Proc. Natl. Acad. Sci. U S A. 1974;71:1342-6]을 포함한다. 당해 서열은 또한 예상된 mRNA의 5' 말단에 스템-루프(stem-loop) 구조(밑줄친 문자로 나타냄)를 도입한다. 이들 특징 모두는 XylS 단백질의 충분한 발현을 촉진시킬 것으로 예상된다.
Figure 112012080180037-pct00022

BlpI-BglII 단편(서열 번호 140)은 상업적 판매자(DNA2.0)에 의해 합성되었고, 변형된 서열을 함유하는 합성 DNA는, 천연 xylS 조절 서열을 함유하는 천연 BlpI-BglII 단편 대신에 BlpI-BglII 단편으로서 xylS 치환 벡터, pDD77 내로 클로닝되었다. 변형된 xylS를 함유하는 플라스미드(pDD79(도 8n)로 명명됨)는, Pm 프로모터를 활성화시키고 콘드로이틴 생산을 유도하는 변형된 xylS 유전자의 능력을 시험하기 위해 MSC392 내로 형질전환시켰다. pDD79를 함유하는 3개 MSC392 형질전환체를 골라내고, MSC458, MSC459 및 MSC460으로 지정했다. 이들 균주는, MSC392 모체와 함께, 표준 진탕 플라스크 실험으로 콘드로이틴 생산에 대해 시험했다. 균주를 30℃에서 TB 배지(MSC392) 또는 TB + Cm34(MSC458-460)에서 성장시키고 대략 0.2의 OD A600에서 배양물을 2 mM m-TA의 첨가에 의해 유도했다. 샘플은 유도후 24, 48 및 72시간에서 취했다. 48시간 샘플을 콘드로이틴에 대해 분석했다. pDD79 함유 균주 모두는 유도된 및 비유도된 배양물 둘 다에서 대략 300 ㎍/mL를 생산했다. 대조적으로, xylS 유전자를 결여하는 MSC392는 유도된 및 비유도된 배양물 둘 다에서 4 ㎍/mL 콘드로이틴만을 생산했다. 이들 결과는 하기 표 8d에 제시되어 있다.
[표 8d]
Figure 112012080180037-pct00023
대략 300 ㎍/mL 콘드로이틴의 관찰된 값은, 플라스미드 pDD77 상에 천연 xylS 유전자를 함유하는 MSC405 및 MSC438의 유도된 배양물에서 관찰된 역가와 유사하다. 그러나, MSC458, MSC459 및 MSC460의 비유도된 및 유도된 배양물 둘 다는 실질적으로 동등한 CH 역가를 생성했다. 이 결과는 pDD79의 변형된 xylS 유전자에 의한 XylS의 증가된 생산과 일치하며, 이는 XylS의 과생성이 임의의 첨가된 유도인자의 부재하에 Pm 프로모터를 활성화시키는 것으로 보고되었기 때문이다[참조: Dominguez-Cuevas et al ., J. Bact . 2008;190:3118-3128.].
염색체 내로 삽입되는 경우, 변형된 xylS 유전자의 기능성을 시험하기 위해, 상기 실시예 3에 상세한 바와 같이 2단계 "팝-인/팝-아웃" 방법을 사용하여 pDD79의 플라스미드-함유 xylS 유전자가 fhuA 유전자좌에서 염색체 내로 통합된 MSC459의 유도체를 수득했다. MSC459를 30℃로 LB + 34 ㎍/mL 클로람페니콜(Cm34)에서 밤새 성장시키고, 43℃에서 LB + Cm34 상에 플레이팅시켰다. 밤새 배양한 후, 분리된 콜로니를 골라내고, LB + Cm34 상에 스트리킹시키고, 43℃에서 다시 밤새 성장시켰다. 이들 플레이팅으로부터 분리된 콜로니를 골라내고, 콜로니 PCR에 의해 시험하여 염색체 내로 플라스미드의 통합을 확인했다.
PCR에 의해 양성으로 시험된 2개 콜로니를 사용하여, 임의의 항생제 없이 LB의 5 mL 배양물을 접종시켰다. 이들 배양물을 30℃에서 밤새 성장시키고, 이어서 1000배 희석하여 계대하고, 30℃로 LB에서 밤새 성장시켰다. 이어서, 이들 배양물을 106배 희석하고, 0.1 mL 분취량을 37℃에서 LB 상에 플레이팅했다. 이들 플레이팅으로부터의 개개 콜로니를 LB 및 LB + Cm34 상에 이쑤시개로 찍어 넣어 플라스미드의 소실에 대해 시험했다. 클로람페니콜 민감성(CmS) 분리물은 용이하게 수득되었고, 각 배양물로부터 이러한 6개 분리물을 PCR에 의해 스크리닝하여, xylS 함유 DNA 서열이 fhuA 유전자좌에서 염색체 중에 잔류하면서 플라스미드 서열의 나머지가 잘려나가 플라스미드가 소실되는 방식으로 재조합이 발생한 목적하는 "팝-아웃" 치환 균주를 동정했다. 이 결과는 에스케리키아 콜라이 염색체로부터 전체 fhuA 유전자를 결실시켰다. 이들 분리물의 PCR 분석은 xylS DNA 단편의 5' 및 3' 말단이 fhuA 유전자좌의 측면에 위치하는 염색체 DNA 서열과 관련하여 예상된 위치에 존재함을 나타냈다. MSC459로부터 유도된 이러한 2개 균주, MSC466 및 MSC467은 이제 fhuA 유전자좌에 삽입된 xylS 유전자(합성 프로모터를 가짐) 및 콜란산 유전자좌에 삽입된 K4 유전자를 보유한다.
MSC466 및 MSC467을 진탕 플라스크에서 콘드로이틴 생합성에 대해 시험했다. 균주는 30℃의 TB 배지에서 성장시키고 대략 0.2의 OD A600에서 배양물을 0, 1, 2 또는 4 mM m-TA의 첨가에 의해 유도했다. 샘플은 유도후 24, 48 및 72시간에서 취했다. 48시간 샘플로부터의 콘드로이틴 분석 데이타는 하기 표 8e에 제시되어 있다. 두 균주는, 1 또는 2 mM m-TA로 유도하는 경우, 콘드로이틴의 상당한 역가(> 400 ㎍/mL)를 생성했다. 4 mM m-TA로 유도된 배양물은 다소 낮은 콘드로이틴 역가를 생성했다. 비유도된 배양물은 보다 적은 양의 콘드로이틴, 대략 160 내지 170 ㎍/mL를 생성했다. 이들 결과는, 합성 프로모터 및 최적화된 리보솜 결합 부위 및 5' UTR 헤어핀 구조를 갖는 변형된 xylS 유전자가 천연 xylS 유전자보다 효율적으로 발현되어, Pm 프로모터에 의한 K4 콘드로이틴 생합성 유전자의 전사 자극시에 더욱 효과적이라는 가설과 일치한다. 염색체 균주 MSC467 및 MSC466은 K4 콘드로이틴 생합성 유전자 또는 조절 xylS 유전자를 함유하는 어떠한 플라스미드도 포함하지 않고, 둘 다 상당량의 콘드로이틴을 생성할 수 있다.
[표 8e]
Figure 112012080180037-pct00024
MSC467은 염색체 K4 유전자 클러스터의 kpsS 유전자의 바로 하부(3')의 염색체에 삽입된, pDD74(도 8l 참조)로부터 유도된 테트라사이클린 내성 유전자를 함유한다(도 8t 참조). 특정 플라스미드의 도입 및 유지를 위한 선별로서 플라스미드-함유 유전자에 의해 인코딩된 테트라사이클린 내성을 사용하기 위해, 이러한 염색체 테트라사이클린 내성 유전자를, 하기 상세한 바와 같이, 실시예 3에 기재된 "팝-인/팝 아웃" 방법을 사용하여 MSC467의 염색체로부터 결실시켰다. MSC467의 생성된 테트라사이클린 민감성 유도체는 MSC561로서 지정했다. MSC561의 작제는 다음과 같이 수행했다.
MSC467 및 pDD74에서 tetR 유전자의 바로 하부의 염색체 서열의 대략 900 염기쌍을 주형으로서 pDD74 DNA 및 프라이머 BLR476 및 BLR478을 사용하여 증폭시켰다:
BLR476 5> CGTCAAGCTTGTGAACGCCTATAGCAGCTTG >3 (서열 번호 101)
BLR478 5> CAGTGGCGCGCCGAGCGATGATAAGCTGTC >3 (서열 번호 102)
생성된 PCR 생성물을 HindIII 및 AscI으로 분해시키고, HindIII 및 AscI로 분해시켜 판매자 프로토콜에 따라 안타르틱 포스파타제(New England BioLabs, 미국 메사추세츠주 입스위치 소재)로 처리한 pMAK-CL(실시예 3 및 도 8l에 기재됨)에 연결시켰다. 연결 생성물을 에스케리키아 콜라이 NEB5α(New England BioLabs, 미국 메사추세츠주 입스위치 소재)로 형질전환시키고, 생성 형질전환체로부터 플라스미드 DNA를 진단 제한 엔도뉴클레아제 분해에 의해, 클로닝된 PCR 단편의 존재에 대해 스크리닝했다. 이러한 하나의 형질전환체로부터의 재조합 플라스미드를 pBR1087로 지정하고, 유전자 치환 실험에 사용하여 MSC467 염색체로부터 tetR 유전자를 결실시켰다. pBR1087의 구조는 도 8u에 도시되어 있다. 이 플라스미드를 30℃(mPAK705 기반 레플리콘의 복제에 허용되는 온도)에서 클로람페니콜 내성에 대해 선택하면서 MSC467로 형질전환시켰다. 이어서, 30℃에서 성장시킨 배양물을 34 ㎍/mL(Cm34)의 클로람페니콜의 존재하에 43℃에서 플레이팅시키고, 생성된 콜로니를 골라내고, 43℃에서 LB + Cm34 플레이트 상에 스트리킹시켰다. 생성된 콜로니는 표적 유전자좌에서 pBR1087의 통합에 대해 PCR에 의해 스크리닝하고, 당해 유전자좌에서 통합된 플라스미드 서열을 함유하는 것으로 동정된 분리물은 클로람페니콜의 부재하에 30℃에서 LB 액체 배지에서 2차 배양했다. 이어서, 이렇게 2차 배양된 분리물은 클로람페니콜의 부재하에 30℃에서 LB 상에 플레이팅시키고, 생성된 콜로니는 클로람페니콜 및 테트라사이클린에 대한 민감성에 대해 시험했다. 통합된 플라스미드가 잘려진 결과로서 tetR 유전자가 결실되어 있는 클로람페니콜 민감성, 테트라사이클린 민감성 유도체인 추정의 유전자 치환 균주가 수득되었고, 이러한 추정의 염색체 구조를 확인하기 위해 PCR에 의해 스크리닝했다.
tetR 유전자가 결실된 것으로 동정된 하나의 균주는 MSC561로서 지정했고, MSC561의 염색체 K4 유전자 클러스터의 구조는 도 8t에 제시되어 있다. 당해 결실은 kpsS 코딩 서열 하부의 71 bp로부터 콜란산 유전자좌 하부 서열의 5' 말단의 AscI 부위까지이다. 당해 결실은 전체 tetR 유전자를 포함한다.
실시예 11
본 실시예는 영역 1 및 3 유전자에 대한 K4 영역 2 유전자(kfoABCFG)의 유전자 용량을 증가시키면 에스케리키아 콜라이 K-12 진탕 플라스크 배양물에서 상당히 더 많은 콘드로이틴 생산을 유도한다는 것을 입증한다.
에스케리키아 콜라이 K-12 균주 MSC467(실시예 10)은 Pm 프로모터의 조절하에 콜란산 유전자좌에서 영역 1, 2 및 3을 그리고 합성 컨센수스 프로모터의 조절하에 fhuA 유전자좌에서 xylS를 함유한다. 플라스미드 pCX039(실시예 4)는 Pm 프로모터의 조절하에 영역 2 kfoABCFG 유전자를 함유하고, 또한 천연 xylS 유전자를 함유한다. pCX039는 균주 MSC499를 생성하기 위해 MSC467로 형질전환시켰다. 대조군 균주 MSC498은 pDD63(실시예 4)을 MSC467로 형질전환시켜 생성했다. 가변성 유도인자 농도를 갖는 진탕 플라스크 배양물(TB/Cm34 배지, 30℃, 72hr) 중에서 콘드로이틴 생산을 이러한 두 균주에 대해 측정했다(표 9a).
[표 9a]
Figure 112012080180037-pct00025
이들을 플라스미드 상에 제시함으로써 영역 2 유전자 용량을 증가시키면 명백하게 높은 콘드로이틴 생산을 유도했다. 비교적 높은 수준의 생산은 유도 없이 균주 MSC499에서 나타났다. 이는 아마 MSC499 염색체 중에 존재하는 변형된 xylS 유전자의 향상된 발현에 기인하는 K4 유전자의 비유도 발현에 기인하였다. 상기 주목된 바와 같이, 높은 수준의 XylS 단백질은 첨가된 유도인자의 부재하에서도 Pm 프로모터를 활성화시킬 수 있다고 공지되었다[참조: Dominguez-Cuevas et al., 2008]. 추가의 플라스미드-인코딩된 XylS가 이 플라스미드 시스템 중에서 최적의 콘드로이틴 생산에 필요한지의 여부를 측정하기 위해, xylS 유전자가 결실된 플라스미드 pDD63 및 pCX039의 유도체를 작제했다. 이들 플라스미드는 각각 1049 bp 단편 내의 전체 xylS 유전자 코딩 서열의 측면에 위치하는 2개의 Nsi I 제한 부위를 함유한다(참조: 실시예 4). 이러한 플라스미드의 샘플을 NsiI로 분해시키고, 효소를 불활성화시키기 위해 가열 처리한 다음, T4 DNA 리가아제로 처리하여 xylS 유전자 단편이 결여된 환상 플라스미드를 생성하였다. pDD63ΔNsi를 먼저 에스케리키아 콜라이 MSC188(실시예 3)로 형질전환시켰다. 특성화된 pDD63ΔxylS 플라스미드는 pCX069라 명명했다. 이 플라스미드를 후속적으로 에스케리키아 콜라이 MSC467(실시예 10)로 형질전환시켜 균주 MSC510을 생성시켰다. pCX039ΔNsi 샘플을 직접 MSC467로 형질전환시키고, 특성화된 ΔxylS 플라스미드를 pCX074라 명명했다. 이들 균주 + MSC498 및 MSC499 대조군 균주에 의한 콘드로이틴 생산은 본 실시예에서 이미 기술된 바와 같이 측정하였고, 결과는 표 9b에 제시된다.
[표 9b]
Figure 112012080180037-pct00026
pCX039로부터 xylS의 결실은 생산된 콘드로이틴의 최대량을 감소시키지 않았지만, 높은 유도인자 수준이 최고 수준을 달성하는데 필요했고, 표 9b에서 MSC511 대 MSC499를 참조한다. 이 결과는 XylS 수준, 유도인자 수준, K4 유전자 보충 및 콘드로이틴 생산능의 상호관련성을 예시한다.
상기 실시예 4는 fhuA 유전자좌에서, 모두 합성 컨센수스 프로모터로부터 발현된, xylS 및 영역 2 kfoABCFG 유전자의 에스케리키아 콜라이 염색체로의 삽입용으로 설계된 pMAK705-기반 치환 플라스미드인 플라스미드 pDD80 유도를 기술한다. 하기 표 9c는 과잉 염색체 요소로서 pDD80을 함유하는 MSC467(염색체 xylS) 및 MSC392(xylS 없음) 균주(실시예 10)에서 콘드로이틴 생산을 기술한다.
[표 9c]
Figure 112012080180037-pct00027
pCX039를 사용하는 경우와 유사하게, 플라스미드 pDD80은 K4 콘드로이틴 생합성 유전자(영역 1, 2 및 3)의 전체 보충의 염색체 카피를 함유하는 에스케리키아 콜라이 숙주 균주에서 콘드로이틴 생산을 향상시켰다. 유도는 염색체 중에 xylS 카피의 존재 또는 부재와 무관하게 pDD80을 함유하는 균주에서 콘드로이틴 생산에 대해 거의 효과가 없었다. 이는 아마도 강한 합성 프로모터에 의해 유도되고, mRNA 5-프라임 말단에 첨가된 최적화된 리보솜 결합 부위 및 헤어핀 구조를 함유하는 변형된 xylS 유전자의, 다중카피 플라스미드로부터의, 발현에 기인하는, 이들 균주에서의 비교적 높은 수준의 XylS의 결과이다.
실시예 12
실시예는 균주 MSC467 의 염색체에 kfo ABCFG 유전자의 단일 추가 카피의 부가가 콘드로이틴 생산을 증가시킴을 입증한다.
상기 실시예 11은 진탕 플라스크 중에서 균주 MSC467에 의한 콘드로이틴 생산이 Pm 프로모터의 조절하에 K4 영역 2 유전자 kfoABCFG의 과잉 카피를 플라스미드 pCX039 상의 MSC467에 도입시킬 경우에 크게 향상되었다는 것을 입증한다. 유사한 결과가 플라스미드 pDD80을 MSC467에 도입할 경우에 수득되었다. 실시예 4에 기술된 플라스미드 pDD80은 상기 실시예 10에 기술된 합성 xylS 프로모터의 전사 조절하에 kfoABCFG 유전자를 함유한다. 이들 결과는 kfoABCFG 유전자로 인코딩된 하나 이상의 단백질의 수준을 증가시키면 콘드로이틴 생산을 상당히 증가시킨다는 것을 나타낸다. 다중-카피 플라스미드 상에서 이들 유전자의 클로닝은 이들 단백질의 생산을 증가시키는 하나의 방법을 제공한다. 플라스미드 발현 플랫폼을 사용하지 않고 이러한 단백질의 생산을 증가시키는 또 다른 방법은 이들 유전자의 다수의 카피를 숙주 유기체의 염색체에 삽입시키는 것이다.
kfoABCFG 유전자 세트의 제2 카피를 합성 xylS 프로모터의 전사 조절하에, 변형된 xylS 유전자의 바로 하부의, fhuA 유전자좌에서 MSC467의 염색체로 삽입했다. 이러한 목적을 위해 치환 벡터를, 실시예 4에 상세한 바와 같이 pDD79의 양립성 NsiI 내로 pCX039로부터 분해된 PstI 단편 상의 kfoABCFG 유전자를 클로닝함으로써 작제했다. 생성되는 플라스미드, pDD80에서, kfoABCFG 유전자는 강한 구성적 프로모터인 것으로 설계된 합성 xylS 프로모터에 의해 전사된다. pDD80을 MSC467로 형질전환시켜 상기 실시예 10에서 진탕 플라스크에서 약 1g/L 콘드로이틴을 생산하는 것으로 밝혀진 균주 MSC522를 제조했다. 치환 균주(MSC537)는 상기 실시예 3 및 실시예 10에 상세한 바와 같은 pMAK705-기본 플라스미드 치환 공정을 통해 MSC522로부터 유도했다. 이 균주는 MSC467 염색체 중에 xylS 유전자의 바로 하부의, fhuA 유전자좌에서 삽입된 kfoABCFG 유전자의 하나의 추가의 카피를 보유한다.
MSC537을 콘드로이틴 생산에 대해 MSC467과 병행하여 시험했다. 배양물을 30℃로 TB 배지에서 0.01 OD A600에서 접종시켰다. 약 0.10의 OD에서, 배양물을 1 mM m-TA를 첨가하여 유도하였고, 추가의 72시간 동안 배양시켰다. 샘플을 유도후 48시간 및 72시간에 콘드로이틴 분석용으로 취했다. 유도후 72시간에서 MSC537은 0.57 g/L의 콘드로이틴을 생성한 반면, MSC467은 0.45 g/L를 수득했고; MSC 467에 대해 MSC537의 경우 약 25% 증가했다. 추가의 양태에서, MSC537 및 MSC467을 진탕 플라스크에서 콘드로이틴 생산에 대해 동시에 시험했을 경우, MSC537이 일관적으로 MSC467보다 많은 콘드로이틴(20 내지 30%)을 생산했다. 이 결과는 K4 영역 2 유전자 kfoABCFG의 단일 추가 카피를 MSC467 염색체에 부가하면, kfoABCFG 유전자의 다중 카피의 부가가 균주 MSC499 및 MSC522 중의 콘드로이틴 생산을 증가시키는 정도와 동일하지는 않지만 콘드로이틴 생산을 증가시킬 수 있음을 나타낸다. 다중-카피 플라스미드 상에 클로닝된 kfoABCFG 유전자를 함유하는 이들 두 균주는 MSC467보다 약 2배 이상의 콘드로이틴을 생산한다(참조: 실시예 10). 플라스미드 pCX039를 MSC537로 형질전환시켜 균주 MSC551을 생성했다.
MSC467과 같이, MSC537 균주는 MSC537에 존재하는 염색체 K4 유전자 클러스터의 kpsS 유전자의 바로 하부(3')에서 염색체에 삽입된 pDD74(참조: 도 8l)로부터 유래된 테트라사이클린 내성 유전자를 함유한다. 상기 주목된 바와 같이, 일부 양태에서, 균주가 테트라사이클린 민감성인 것이 바람직하다. 따라서, tetR 유전자는 동일한 공정 및 MSC467의 염색체로부터 tetR 유전자를 결실시키기 위한 실시예 10에서 상기 기재한 바와 같은 치환 플라스미드(pBR1087)를 사용하여 MSC537의 염색체로부터 결실시켰다. 생성되는 MSC537의 테트라사이클린-민감성 유도체는 MSC562로 지정했다. 진탕 플라스크 실험에서, MSC562 및 MSC537를 30℃에서 TB 배지에서 성장시켰고, 1 mM의 m-TA를 첨가하여 유도했다. 유도 후 72시간에서 수거한 배양 샘플의 콘드로이틴 역가를 측정하고, MSC562의 경우 0.51 g/L 대 MSC537의 경우 0.57 g/L로 서로 견줄만한 것으로 밝혀졌다.
도 8q에 도시된 바와 같은 kfoABCFG 유전자를 함유하는 플라스미드 pCX039, 및 도 8i에 도시된 백터-단독 대조군 플라스미드 pDD63을 균주 MSC562 내에 형질전환시켜 각각 MSC564 및 MSC563을 생성했다. 진탕 플라스크 실험에서, MSC563 및 MSC564를 플라스미드 선별을 위해 테트라사이클린 함유 TB 배지(5㎍/mL)에서 30℃로 성장시키고, 1 mM m-TA로 유도했다. 유도후 72시간에서, MSC564 및 MSC563의 배양물은 각각 0.81g/L 및 0.29 g/L의 역가의 콘드로이틴을 생성했다.
배양물이 테트라사이클린의 존재하에 성장된 이 실험에서, MSC564에서 pCX039의 플라스미드 보유가 매우 효율적이었다. MSC564의 72시간 배양물로부터의 샘플을 희석시키고, LB 플레이트 및 5㎍/mL 테트라사이클린을 함유하는 LB 플레이트 상에 플레이팅시켰다. 콜로니 형성 단위(CFU)의 역가는 이들 두 플레이팅 조건하에 유의하게 상이하지 않았다: LB 상의 1.16 x 109 CFU/mL 대 LB + 테트라사이클린 상의 1.28 x 109 CFU/mL. 따라서, 이 실험 조건하에, 어떤 플라스미드의 소실도 검출되지 않았다.
kfoABCFG 유전자의 추가 카피의 MSC537의 염색체로의 후속적인 부가는 이 균주에서 콘드로이틴 생산을 추가로 증가시킬 것으로 기대된다. 이들 유전자의 추가의 카피는 실시예 3에 상세한 유전자 표적화 공정을 사용하여 기타 염색체 유전자좌에 삽입시킬 수 있다. 이들 유전자의 통합을 위한 추가의 부위로서 작용할 수 있는 광범위한 종류의 비필수 유전자좌가 에스케리키아 콜라이에서 공지되었다. 또한, kfoABCFG 유전자 세트의 둘 이상의 카피로 구성된 직렬 어레이를 유전자 치환 플라스미드 상에서 작제하여 단일 유전자 치환 사건으로 염색체에 도입할 수 있었다.
또한, kfoABCFG 유전자에 의해 인코딩된 단백질의 생산을 증가시키는 추가의 방법은 단백질 코딩 서열의 코돈 최적화, 및 프로모터, 리보솜 결합 부위 및 이들 유전자의 mRNA의 5-프라임 비해독 영역의 최적화를 포함한다. 이러한 서열 최적화는 플라스미드 벡터로부터 발현된 유전자 및 염색체에 삽입된 유전자에 적용할 수 있었다.
실시예 13
본 실시예는 플라스미드 벡터 및 염색체 통합을 사용하여 잔토모나스 캄페스트리스로의 콘드로이틴 생합성 유전자의 도입을 기재하고, 진탕 플라스크 중에서 잔토모나스 캄페스트리스에서 재조합 DNA 매개된 콘드로이틴 생합성을 입증한다.
구체적으로, K4 생합성 유전자의 조합물을 함유하는 플라스미드의 작제 및 잔토모나스 캄페스트리스 균주 MSC255로의 이들의 도입이 본원에서 기재된다. 콘드로이틴 생합성 유전자 및 이의 서브세트를 크산탄 검 오페론의 결실 부위에서 잔토모나스 캄페스트리스 균주 MSC255 염색체에 안정하게 삽입하기 위한 플라스미드 pKM001 및 pKM002(실시예 3에 기술됨)의 유도체의 용도가 추가로 기술된다.
과잉 염색체 요소로서 콘드로이틴 생합성 유전자의 잔토모나스 캄페스트리스로의 도입
본 발명자들은 거대한 플라스미드를 에스케리키아 콜라이 공여체로부터 직접(예: 삼조 크로스를 통해) 또는 에스케리키아 콜라이 균주로부터 정제된 플라스미드로서(예: 전기천공을 통해 - 이하 참조) 잔토모나스 캄페스트리스에 도입하면, 잔토모나스 캄페스트리스 중의 생성되는 플라스미드에서 구조적 변칙성을 유도할 수 있다는 것을 발견했다. 비교적 작은 플라스미드는 이 현상에 덜 민감한 것으로 나타나고, 이는 거대한 DNA 분자에 비교적 큰 효과를 갖는 잔토모나스 캄페스트리스에 고유한 제한 시스템에 기인할 수 있다[참조: Feyter and Gabriel, J. Bact. 1991;173:6421-6427, da Silva et al., Nature 2002;417:459, Roberts et al., Nuc. Acid Res. 2010;38:D234]. 본 발명자들은 이 효과를 성공적으로 극복한 두 접근법을 사용했다. 하나의 접근법에서, 영역 1, 2 및 3 유전자를 포함하는 거대한 플라스미드를 잔토모나스 캄페스트리스 형질전환체로부터 정제된 작은 플라스미드로부터 재작제하였다. 제2 접근법에서, 영역 1, 2 및 3 유전자를 두(소형) 적합성 플라스미드 사이에서 분할하였다.
전기천공을 사용하여 플라스미드를 잔토모나스 캄페스트리스 세포에 도입했다[참조: Oshiro et al, J. Microbiol. Method 65:171-179, 2006]. 플라스미드 pDD67(실시예 4에 기술됨)을 제한 효소 BamHI 및 RsrII(이는 영역 2 유전자에 결합됨)로 분해하고, 이어서 (블런트 말단을 생성하기 위해) T4 DNA 폴리머라제와 반응시키고 연결시켰다. 생성되는 혼합물을 에스케리키아 콜라이로 형질전환시키고, 테트라사이클릭-내성 분리물을 특성화했다. 이어서, Pm 구동된(driven) 영역 1 및 3 유전자를 함유하는, 도 10a에 도시된 생성되는 플라스미드, pKM005를 전기천공에 의해 잔토모나스 캄페스트리스로 형질전환시켜 균주 MSC338을 생성했다. 또한, pCX039(실시예 4)를 잔토모나스 캄페스트리스로 형질전환시켜 MSC326을 생성했다. MSC338로부터 정제된 플라스미드 pKM005, 및 MSC326으로부터 정제된 pCX039를 각각 HindIII + AvrII로 분해시키고, pKM005로부터 영역 1, 3 단편을 pCX039의 벡터/영역 2 단편과 연결시켰다. 생성되는 혼합물을 테트라사이클린-내성에 대한 선별과 함께 MSC255로 직접 형질전환시켰다. 하나의 잔토모나스 캄페스트리스 형질전환체, MSC348은 에스케리키아 콜라이로 역 이전되었던 플라스미드의 제한 분해에 의해 pDD67로부터 구별되지 않는 플라스미드 pKM007(도 10a)을 함유하는 것으로 밝혀졌다. 대조군 목적으로, 잔토모나스 캄페스트리스 균주 MSC255를 pDD63 벡터로 형질전환시켜 균주 MSC397을 생성했다.
플라스미드 pJAK15(ATCC77290, ATCC로부터 수득)는 IncQ 부적합성 그룹에 속하고, 카나마이신 내성을 인코딩한다. pKM005(Pm-구동 영역 1 및 3 함유; 상기 참조)로부터의 HindIII/AvrII 단편을 pJAK15로부터의 벡터/카나마이신 내성 HindIII/XbaI 단편과 연결시켰다. 도 10b에 도시된 바와 같은 생성되는 플라스미드 pKM006은 각종 pBHR1-유래 플라스미드와 양립성인 벡터 상에 유도성 영역 1 및 3 유전자를 함유한다. 균주 MSC326(MSC255 pCX039)을 카나마이신 및 테트라사이클린 내성에 대해 동시 선택성을 가진 pKM006으로 형질전환시켜 균주 MSC350을 생성했다.
AscI, SbfI, SwaI 및 XhoI 클로닝 부위를 함유하는 짧은 DNA 올리고뉴클레오티드 링커를 pKM001 및 pKM002에서 상동성의 상부 및 하부 영역의 접합부를 규정하는 NotI 제한 부위에 도입시켜 녹-아웃 벡터 pKM001 및 pKM002를 먼저 변형시켰다. 링커는, pKM001 및 pKM002의 NotI 분해에 의해 생성된 것들과 양립성인 일본쇄 오버행이 존재하도록, 어닐링된 올리고뉴클레오티드 prKM015 및 prKM016으로부터 제조하였다. 각각 pKM008 및 pKM009로 지정된 생성 플라스미드는, AscI 제한 부위가 상부 영역에 인접하도록 배향된 링커를 함유한다.
Figure 112016019550472-pct00166
K4 영역 2 유전자(kfoA, kfoB, kfoC, kfoF 및 kfoG)만을 갖는 치환 벡터는 다음과 같이 작제했다: pKM008을 SbfI-XhoI 또는 AscI-XhoI로 분해시키고, pCX039를 SbfI-SalI 또는 AscI-SalI로 분해시켰다. SbfI-SalI 처리는 pCX039로부터 kfoABCFG-함유 단편을 생산하고, AscI-SalI 처리는 Pm 프로모터-kfoABCFG-함유 단편을 생산한다. 이들 단편은, 먼저 SbfI-XhoI 또는 AscI-XhoI로 분해시킨 pKM008로 클로닝하여 각각 플라스미드 pKM010(kfoABCFG: Pm-) 및 pKM011(kfoABCFG: Pm+)을 생성하였다. 플라스미드 pKM010(서열 번호 145) 및 pKM011(서열 번호 146)를 사용하여, K4 영역 3(kpsF, kpsE, kpsD, kpsU, kpsC 및 kpsC) 및 영역 1(kpsM 및 kpsT) 유전자를 또한 도입한 추가의 치환 벡터를 작제했다. pKM010 및 pKM011를 SbfI-AvrII로 분해시키고, 선형화된 이들 벡터를 pDD67의 SbfI-AvrII 분해에 의해 생산된 kpsFEDUCSMT-함유 단편과 연결시켰다. 생성된 플라스미드를 pKM012(Pm-) 및 pKM013(Pm+)로 지정했다. 플라스미드 pKM010(서열 번호 145) 및 pKM012(서열 번호 147)의 유도체화는 도 10c에 도시되어 있다. 플라스미드 pKM011(서열 번호 146) 및 pKM013(서열 번호 148)의 유도체화는 도 10d에 도시되어 있다.
pKM008 - pKM013 작제물 모두에 클로닝된 크산탄 검 유전자 클러스터의 상부 영역은 gum 유전자 클러스터 프로모터를 포함하는 것으로 보고되어 있다[참조: Federico et al; J. Bact. 1996;178:4313-4318]. 따라서, 염색체 내로 재조합된 pKM010 또는 pKM012로부터 유래된 서열을 함유하는 잔토모나스 캄페스트리스 균주는 내인성 gum 프로모터로부터 K4 유전자를 전사할 것으로 예상된다. 대조적으로, pKM011 및 pKM013은 gum 프로모터 및 Pm 프로모터 사이에 위치된 터미네이터 서열(pDD67로부터 유래됨)을 갖는다. 따라서, pKM011 또는 pKM013 서열을 함유하는 재조합 잔토모나스 캄페스트리스에서 K4 유전자의 발현은 Pm/XylS 시스템에 의해 조절될 것으로 예상된다.
각각의 이들 치환 플라스미드에 있어서, (결실된) gum 유전자좌에서 잔토모나스 캄페스트리스 균주 MSC255의 염색체 내로 각 K4 유전자를 재조합하기 위해 (상기 상세한) "팝-인/팝-아웃" 방법을 사용하였다. 당해 플라스미드를 테트라사이클린 내성의 선별과 함께 전기천공에 의해 MSC255 내로 도입시켰다. 중간 및 최종 균주는 하기 표 10a에 제시되어 있다. gum 유전자좌에서 "팝-인"이 발생한 재조합체를 PCR에 의해 동정하였다. 통합체의 분리(resolution)는 항생제 선택의 부재하에 배양함으로써 발생했고, 이어서 테트라사이클린 민감성("팝-인") 유도체를 동정하였다. 이어서, PCR을 사용하여, 각각의 K4 유전자 클러스터가 목적하는 배향으로 gum 유전자좌 내로 성공적으로 통합된 "팝-아웃" 유도체를 동정했다. 이어서, 플라스미드 pDD63(xylS 유도인자 유전자를 함유)를, Pm 프로모터가 K4 유전자 세트를 구동하는 재조합체 내로 형질전환시켰다. 4개 주요 잔토모나스 염색체 삽입 균주(플라스미드 인코딩된 K4 유전자를 함유하지 않음)인, MSC480, MSC469, MSC461 및 MAC494의 유전자 구조는 표 10a에 요약되어 있다.
[표 10a]
Figure 112012080180037-pct00029
재조합 잔토모나스 캄페스트리스의 진탕 플라스크에서의 콘드로이틴 생산
달리 언급하지 않는 한, 콘드로이틴 생산의 평가를 위한 진탕 플라스크에서의 잔토모나스 캄페스트리스 균주의 성장은 YMG 배지(5g/L 프로테오스 펩톤, 3 g/L 효모 추출물, 3 g/L 맥아 추출물, 10 g/L 글루코즈)에서 수행했다. 배양물은 통상 48시간 동안 선별에 요구된 항생제(예: 2 내지 5 ㎍/mL 테트라사이클린, 10 ㎍/mL 카나마이신)과 함께 200 내지 225 rpm으로 250 mL 성장 플라스크 중의 50 mL 배지에서 30℃로 성장시켰다. Pm-구동된 유전자 세트의 유도를 위해, 배양물 밀도가 대략 OD600=0.5에 도달할 때 2 mM m-Ta를 첨가했다.
염색체외 K4 생합성 유전자를 갖는 균주. 다양한 플라스미드로 형질전환시킨 잔토모나스 캄페스트리스 균주 MSC255(ΔgumB-gumM)에서 콘드로이틴 생산은 상기한 바와 같이 배양 및 분석함으로써 측정했다. 결과는 표 10b에 제시되어 있다.
[표 10b]
Figure 112012080180037-pct00030
공 벡터를 함유하는 대조군 균주 MSC397은 검출가능한 콘드로이틴이 없었다. 영역 1, 2 및 3 유전자를 함유하는 균주 MSC348 및 MSC350은 이들 조건하에 약 40 ㎍/mL 콘드로이틴을 생산했다. 영역 2 유전자만을 함유하는 균주 MSC326은 약 100 ㎍/mL 콘드로이틴을 생산했다.
또 다른 실험에서, kfoABCFG 유전자를 함유하는 균주 MSC326(MSC255 pCX039)에서 콘드로이틴 생산은 48시간 후에 166 ㎍/mL이었고, 대조군 균주 MSC397(MSC255 pDD63 - 벡터 대조군)은 검출가능한 콘드로이틴을 생산하지 못했다. MSC326 배양물의 비오토클레이빙 샘플로부터의 분획에서, 무세포 상청액 및 세포 펠렛 분획은 각각 100 ㎍/mL 및 71 ㎍/mL 콘드로이틴을 함유했다. 이들 결과는 K4 영역 2 유전자(프럭토실화 개시 유전자 제외)가 잔토모나스 캄페스트리스에서 콘드로이틴 생산에 충분함을 시사하고, 콘드로이틴이 일부 특성화되지 않은 내인성 메카니즘 또는 세포 파괴 또는 용해에 의해 세포로부터 이출되는 것을 추가로 시사한다.
염색체에 의해 인코딩된 K4 생합성 유전자를 갖는 균주. 상기 기재된 염색체외 플라스미드는, 상이한 빈도로, 항생제 내성의 소실에 의해 규정된 바와 같이 배양물 중의 박테리아 세포로부터 소실된다. 잔토모나스 캄페스트리스 염색체 내로 K4 생합성 유전자의 통합은 이들 균주의 대규모 배양을 촉진시킬 뿐만 아니라 이러한 불안정성을 최소화시켜야 한다. 염색체 통합된 K4 유전자(상기 참조)를 갖는 4개 균주에서의 콘드로이틴 생산은 하기 표 10c에 제시되어 있다. 당해 균주를 48시간 동안 변형된 YMG 배지(YMGM(5): 80 mM MOPS(pH 7.0)로 완충된 YMG, 5 g/L 글루코즈) 또는 TB 배지에서 성장시켰다. 테트라사이클린은 pDD63를 갖는 균주에서 5 ㎍/mL로 존재한다. 콘드로이틴은 프로모터 둘 다 및 배지 둘 다로부터 생산되었다. 중요하게는, 콘드로이틴은 영역 2 유전자만이 존재하는 경우에 생산되었다. 표 10c 참조.
[표 10c]
Figure 112012080180037-pct00031
또 다른 실험에서, 선택된 균주는 상이한 글루코즈 농도로 YMGM 배지에서 성장시켰다. 콘드로이틴은 생합성 유전자의 세트를 함유하는 균주에서 모든 글루코즈 농도에서 생산되었다(그러나, 이러한 유전자를 결여하는 대조군 균주에서는 생산되지 않음). 이들 조건하의 최대 생산은 Pm/xylS 유도의 조절하에 영역 2 유전자만을 함유하는 균주 MSC469에서 390 ㎍/mL였다. MSC469의 YMGM + 10 g/L 글루코즈 배양물의 비오토클레이빙 무세포 상청액 및 세포 펠렛의 분석은 각각 167 ㎍/mL 및 150 ㎍/mL 콘드로이틴인 것으로 밝혀졌다. 전과 같이, 이들 결과는 콘드로이틴이 세포로부터 이출되는 것을 시사한다. 표 10d 참조.
[표 10d]
Figure 112012080180037-pct00032
실시예 14
실시예는 프럭토실화된 비프럭토실화된 콘드로이틴을 분석하는 방법을 기재한다.
박테리아로부터 콘드로이틴의 제조
재조합 콘드로이틴(rCH)는 음이온-교환기 DEAE-셀룰로즈 DE52 컬럼을 사용하여 포획했다. 5용적의 100 mM NaCl로 세척한 후, 컬럼을 5용적의 300 mM NaCl로 용출시켰다. 용출물을 농축시키고, 10용적의 증류수에 투석했다. 투석된 용액을 동결건조시켰다. 동결건조 분말을 rCH로서 사용했다.
프럭토실화된 콘드로이틴 캡슐 다당류(K4P)를 문헌[참조: Manzoni, M. et al ., Biotechnology Letters 1996;18:383-386]의 방법에 따라 균주 U1-41(Escherichia coli O5:K4:H4)의 배양물로부터 정제했다. K4P로부터 탈프럭토실화된 K4P(DFK4P)의 제조는 문헌[참조: Lidholt, K., et al ., J. Biol . Chem. 1997;272: 2682]의 방법에 따라 수행했다.
샘플 제조 및 HPLC 에 의한 콘드로이틴 분석
플라스크 배양물 샘플(통상 5 mL)을 5분 동안 > 15 psi에서 121℃로 오토클레이빙시키고, 냉각시켰다. 이어서, 샘플을 오토클레이빙 동안의 소실에 기인하여 필요한 만큼의 물로 본래 용적까지 재조절했다. 샘플(1.5 내지 5 mL)을 원심분리(통상 세포 밀도가 보다 낮은 플라스크 배양물의 경우에 10분 동안 3500g; 발효 또는 보다 고밀도 배양물의 경우에 5분 동안 12000g)하여 상청액 및 펠렛 분획을 수득했다. 몇몇 경우, 나타낸 바와 같이, 샘플을 사전 오토클레이빙 없이 원심분리했다. 배양물 샘플 또는 분리된 상청액 및 펠렛은 통상 분석할 때까지 -20℃에서 저장했다.
세포 결합된 콘드로이틴의 분석을 위해, 세포 펠렛을 본래 용적의 50mM 인산나트륨 완충제(pH 7.2)에 재현탁시키고, 5 내지 10mg/mL 리소자임(Sigma L-7561) 및 60 U/mL 데옥시리보뉴클레아제 I(Sigma D-4527)로 37℃에서 2시간 동안, 이어서 100 ㎍/mL 프로테이나제 K(Promega V3021)로 37℃에서 1시간 동안 가수분해했다. 반응을 종결한 후(90℃, 5분), 용액을 원심분리하여 세포 파편을 제거했다.
프럭토실화된 콘드로이틴 캡슐 다당류(K4P)의 분석을 위해, 샘플(플라스크/발효조 상청액 또는 원심분리 가수분해된 세포 펠렛)을 먼저 온화한 산 가수분해(즉, HCl로 pH 1.5까지 조절됨)를 사용하여 탈프럭토실화시키고; 80℃에서 30분 동안 배양한 다음, 0.5 M 탄산나트륨으로 중화시켰다. 동결건조 전에, DFK4P 샘플 및 비프럭토실화된 rCH 샘플(발효조 상청액, 동결건조된 세포 펠렛 또는 재구성된 침전물)을 탈이온수에 대해 밤새 투석하거나(PPierce Biotechnology Slide-A-LyzerR, 분자량 컷-오프 7 kD), 탈이온수로 용출시키는 원심분리 한외여과(Amicon Ultra-0.5 Centrifugal Filter Device, 10kD 명목상 분자량 컷-오프)로 부분 정제했다.
프럭토실화되지 않은 콘드로이틴은, 콘드로이티나제 ABC(Seikagaku Biobusiness, Japan)으로 명명된 콘드로이틴-분해 효소에 의해 불포화 비설페이트화 이당류인 2-아세트아미도-2-데옥시-3-O-(β-D-글루코-4-엔피라노실루론산)-D-갈락토즈(Δdi-0S)로 완전히 가수분해될 수 있다. 결과적으로, 프럭토실화되지 않은 샘플 용액 중의 콘드로이틴의 양은 HPLC 시스템을 사용하여 다당류로부터 효소에 의해 생산된 당해 이당류를 정량화함으로써 측정할 수 있다.
동결건조 후의 잔사를 THB(50 mM 나트륨 아세테이트를 갖는 50 mM 트리스-HCl 완충제, pH 8.0)에 용해시키고, 콘드로이틴 ABC(2 단위/mL, 3시간 동안 37℃)로 가수분해시켰다. 90℃에서 5분 동안 가열시켜 효소 반응을 종결시킨 후, 혼합물을 5분 동안 10000 rpm으로 원심분리하여 불용성 침전물을 제거했다. 상청액은 마이크로콘 원심분리 필터(Ultracel YM-10; Millipore)를 사용하여 여과하여 효소 및 비-콘드로이틴 다당류를 제거했다. 생성된 불포화 이당류(2-아세트아미도-2-데옥시-3-O-(β-D-글루코-4-엔피라노실루론산)-D-갈락토즈; Δdi-0S)는 역상 이온쌍 HPLC(Senshu Pak Docosil, 4.6 x 150 mm; 입자 크기, 5 ㎛)로 분리하고, 2-시아노아세트아미드로 컬럼후 표지하고, 형광[참조: Toyoda, H., et al . J. Biol . Chem., 2000; 275:2269]으로 검출하고, 상업적으로 입수가능한 콘드로이틴(Seikagaku Biobusiness, Japan) 또는 rCH로부터 제조된 외부 표준에 대해 정량화했다. 이당류에 대한 통상의 보정 곡선은 도 11b에 도시되어 있다. 이당류에 대한 보정 곡선은 2 내지 200 ㎍/mL 범위에서 선형이었고, 이당류의 검출 한계는 1 ㎍/mL이었다. 콘드로이틴 다당류의 농도는 다음 식을 사용하여 계산할 수 있다.
농도; ㎍/mL = [A] / [S] ×[D],
여기서, [A]는 샘플 크로마토그램에서 Δdi-0S의 피크 면적이고, [S]는 Δdi-0S 농도에 대한 보정 곡선의 기울기이고, [D]는 희석 계수이다.
프럭토실화된 콘드로이틴의 정량화를 위한 ELISA 방법
K4P의 카복실기를 통한 비오티닐화 결합은 문헌[참조: Osmond, R. I.W. et al ., Analytical Biochemistry 2002;310: 199-207]의 방법에 따라 수행했다. 100 ㎕의 비오티닐화 K4P(1 ㎍/ml)를 실온에서 30분 동안 스트렙토아비딘 코팅된 96-웰 미세역가 플레이트(Thermo Scientific, Japan)에 접합시켰다. 플레이트를 0.05 % 트윈R 20 및 0.05% 프로클린(pH 7.5)으로 보충된 50 mM 트리스-HCl 완충된 염수(NaCl 100 mM)을 사용하여 세척한 후, 50 ㎕의 배양 상청액 또는 표준 K4P 용액, 및 50 ㎕의 2.5 x 106로 희석도의 항-K4P 혈청(Statens Serum Institut, Denmark)을 웰에 첨가하고, 60분 동안 항온처리하였다. 웰을 다시 세척한 후, 2000배 희석도의 HRP-표지된 항-래빗 면역글로불린(P0448, DAKO JAPAN, Japan)을 첨가하고, 60분 동안 항온처리하였다. 웰을 다시 세척한 후, H2O2를 함유하는 TMB 용액(TMBW-1000-01, BioFX Laboratories Inc., Owings Mills, MD)을 기질로서 첨가하고, 실온에서 30분 동안 배양했다. 50 ml의 정지 시약(STRP-1000-01, BioFX Laboratories Inc., Owings Mills, MD)을 첨가하고, 450 nm에서의 흡광도를 측정했다. 이들 분석 조건하에, 다른 다당류, 예를 들면, 프럭토실화되지 않은 콘드로이틴, 헤파로산 및 DFK4P는 K4P와 경쟁하지 않는다. 통상의 표준 곡선은 도 11a에 도시되어 있다.
rCH , K4P DFK4P SEC - HPLC 분석
다당류의 중량 평균 분자량("Mw") 및 콘드로이티나제-분해능은, 굴절률 검출기 및 TSK-겔 PWXL-4000, PWXL-3000 및 PWXL-2500(TOSOH, Japan)의 직렬 컬럼이 구비된 TOSOH HLC-8220GPC 시스템을 사용하여 0.6 mL/분의 일정 유속에서 0.2 M NaCl로 SEC-HPLC 상에서 분석함으로써 측정했다. 50 ㎕의 다당류 용액을 컬럼 상에 0.6 mg/mL의 농도로 주입했다. 컬럼 및 검출기 구획은 40℃로 유지시켰다. Mw 규정 콘드로이틴 설페이트(Mw: 52.2, 31.4, 20.0, 10.0, 6.6 및 1.0 kDa)를 분자량 기준으로 사용했다.
콘드로이티나제 ABC 분해 전후의 rCH(프럭토실화되지 않음)의 전형적인 용출 프로파일은 도 12에 도시되어 있다. rCH의 계산된 중량 평균 분자량은 120 kDa였다.
K4P 및 DFK4P의 콘드로이티나제 분해능의 측정은 다음과 같이 수행했다. K4P 및 DFK4P를 50 mM THB(50 mM 나트륨 아세테이트를 갖는 트리스-HCl, pH 8.0)에 용해시켜 1 mg/mL의 최종 농도를 수득하고, 동일한 부분으로 나누었다. 용액 부분은 상기한 바와 같이 SEC-HPLC 상에서 직접 분석했다. 또 다른 부분은 동일한 시스템 상에서 분석한 다음, 콘드로이티나제 ABC(최종 농도: 2 단위/mL)로 37℃에서 3시간 동안 처리했다. 결과는 도 13에 도시되어 있다. 에스케리키아 콜라이 K4 U1-41의 배양물로부터 제조한 K4P 및 DFK4P의 분자량 값은 각각 33 kDa 및 28 kDa이었다. DFK4P는 콘드로이티나제 처리에 의해 이당류, Δdi-0S로 완전히 분해된 반면, K4P는 효소로 부분 분해되었다(도 13). 이들 결과는 K4P가 상기한 바와 같은 탈프럭토실화 처리에 의해 K4P의 콘드로이틴 골격 구조에 영향을 미치지 않고서 탈프럭토실화 형태로 전환되었음을 나타냈다. 결과적으로, 샘플 중의 K4P의 양은 또한, 샘플이 효소 분해 전에 탈프럭토실화 처리로 처리되는 경우, 콘드로이티나제/HPLC 방법을 사용하여 다당류로부터 효소에 의해 생산된 이당류를 정량화함으로써 측정할 수 있다.
실시예 15
실시예는 콘드로이틴의 황산화를 설명한다.
실시예 14에서 제조된 콘드로이틴을 부분 해중합화시켜 분자량 약 30 kDa의 콘드로이틴을 수득했다. 30 mg의 이 콘드로이틴을 60℃에서 교반시키면서 0.6 mL의 무수 포름아미드(FA)에 용해시켰다. 용액이 완전히 균질화되면, 고형 황 트리옥사이드-TEA 복합체(5당량의 콘드로이틴 이당류 단위)를 첨가하고, 교반을 120분 동안 지속했다. 황산화 반응은 3용적의 1M 나트륨 아세테이트의 첨가에 의해 중단시키고, 실온에서 30분 동안 추가로 정치시켰다. 용액을 3일 동안 증류수에 대해 투석하고, NaOH로 중화시키고, 백색 분말(32 mg, 107%)로 동결건조시켰다. 재조합 콘드로이틴 설페이트의 추가 분석은 분자량 29 kDa, 5.2%의 황을 입증했다.
또 다른 실험에서, 상기한 콘드로이틴(50 mg)을 주위 온도에서 1.0 mL의 무수 포름아미드(FA)에 용해시켰다. 용액이 투명해지면, 클로로설폰산(5당량의 CH 이당류 단위)를 서서히 첨가하고, 20분 동안 연속 교반하면서 유지시켰다. 황산화 반응은 3배 용적의 1M 나트륨 아세테이트 용액을 첨가하여 중단시키고, 추가로 10분 동안 실온에서 정치시켰다. 용액을 3일 동안 증류수에 대해 투석하고, NaOH로 중화시키고, 동결건조시켜 백색 분말(47 mg, 94%)을 수득했다. 재조합 콘드로이틴 설페이트의 분석은 분자량 33 kDa, 5.2 %의 황을 나타냈다.
실시예 16
본 실시예는 콘드로이틴 생합성 영역 2 유전자 세트(kfoABCFG)가 에스케리키아 콜라이 균주 MSC562에서 콘드로이틴 생산의 최대 향상에 충분함을 설명한다.
영역 1, 2 및 3(R1, R2 및 R3) 유전자 세트의 조합을 함유하는 플라스미드 세트는 pBR1052(도 8k) 및 pDD67(도 8j)로부터 제조했다. 상기한 바와 같이, 유전자 세트는 출발 플라스미드를 특정 제한 효소로 분해시켜 결실시켰다; 예를 들면, T4 폴리머라제를 사용한 블런트 말단의 생성; 및 생성 벡터 단편의 연결. 에스케리키아 콜라이 균주 MSC188(실시예 3)을 연결 반응물로 형질전환시키고, 선택된 항생제 내성 형질전환체를 목적하는 특성에 대해 평가했다. pBR1052가 영역 1 유전자 세트에 선행하는 제2 Pm 프로모터를 함유하는 사실에 기인하여, 여기에 기재된 플라스미드 중의 일부는 제2 Pm 프로모터를 함유한다. 이들 기재된 플라스미드 모두는 xylS를 함유한다. 하기 표 11에서, R1 = kpsFEDUCS, R2 = kfoABCFG, 및 R3 = kpsMT이다. "Pm:R2" 플라스미드는 미리 작제되었음에 주목한다(pCX039; 실시예 4). 플라스미드 pCX096(서열 번호 149), pCX097, pCX100, pCX101(서열 번호 150) 및 pCX102에 대한 DNA 맵은 도 14a, 14b, 14c, 14d 및 14e에 각각 도시되어 있다. 플라스미드 pCX097 및 pCX101은 각각 pCX100 및 pCX102에 대한 출발 플라스미드로서 사용되었다.
[표 11]
Figure 112012080180037-pct00033
최종 플라스미드 각각을 숙주 균주 MSC562에 형질전환시켜 하기 표 12에 제공된 균주를 생성했다. 이들 균주 및 기존 대조군 균주를 2xM9/tet5 배지를 갖는 진탕 플라스크에서 성장시키고, 대략 0.1 내지 0.12의 OD600 값에서 1 mM 메타-톨루엔산으로 유도하고, 성장(OD600) 및 72시간 후의 rCH 생산에 대해 평가했다.
[표 12]
Figure 112012080180037-pct00034
최대 생산능은 영역 2(MSC564) 단독 또는 영역 2와 1의 조합(MSC683)을 함유하는 플라스미드를 갖는 균주에서 관찰되었다. 영역 2 및 3의 조합(MSC688)은 보다 낮은 생산능을 나타냈다. 사실, 플라스미드-함유 영역 3의 존재는 다른 관련 균주 대조군에서 억제를 나타냈다(예를 들면, MSC683 vs MSC690). 이들 발견은 균주 MSC562에서 영역 2 카피 수만을 증가시킴으로써 rCH 생산능의 증가 방법을 뒷받침한다.
실시예 17
실시예는 콘드로이틴 생합성 유전자 영역 2의 포지티브 카피 수 효과가 kfo ABCDG 유전자 5개 모두를 필요함을 설명한다.
플라스미드 pCX039(도 8q; 영역 2 유전자 kfoABCFG 함유)는 숙주 에스케리키아 콜라이 균주 MSC562에 존재하는 경우에 rCH 생산의 거대한(8 내지 10배) 증가를 유도했다(공 벡터 pDD63을 함유하는 MSC562와 비교하여). pDD66 및 pDD67로부터의 유전자 결실에 대한 상기한 방법(실시예 4 참조)을 사용하여, 2개 세트의 플라스미드를 pCX039로부터 유도하여, pCX039에 의해 생산된 rCH의 자극에 대한 개개 영역 2 유전자의 역할을 입증했다.
5개 플라스미드 중의 1개 세트는 영역 2 유전자 중 1개 제거의 효과를 평가하기 위해 설계되었다. MSC562 등의 에스케리키아 콜라이 숙주에서, 이들 유전자의 1개 카피가 여전히 존재할 것이다(염색체 내로 통합됨). 이 세트의 플라스미드는 각각의 kfoABCFG가 개별적으로 결실된 pCX039 유도체를 포함했다. 하기 표 13은 kfo 유전자의 결실에 사용된 제한 효소 및 생성 플라스미드의 명칭을 수록한다. 상기 실시예 4는 pCX044의 유도체화를 상세히 기재한다. 모든 플라스미드는 xylS를 함유한다.
[표 13]
Figure 112016019550472-pct00167
이들 플라스미드를 숙주 균주 MSC562(영역 1, 2 및 3 + xylS의 염색체 카피) 내로 형질전환시켜 하기 표 14에 제시된 균주를 생성했다. 배양물은 30℃에서 2xM9 배지(10 g/L 글리세롤 및 2 ㎍/mL Tet를 가짐)에서 성장시키고, 대략 0.1의 OD600 값에서 1 mM mTA로 유도하고, 성장 72시간 후에 rCH 생산에 대해 분석했다.
[표 14]
Figure 112012080180037-pct00036
이들 결과는 모든 5개의 영역 2 유전자(kfoABCFG)가 이들 조건하에 최대 생산능을 달성하는데 요구됨을 나타낸다. 또한, MSC563에 대한 결과는 염색체 삽입으로부터 kfoABCFG 유전자의 발현이 플라스미드 함유 유전자 카피의 부재하에 현저한 rCH 생산을 뒷받침하기에 충분함을 나타낸다.
제2 세트의 pCX039 유도체는 숙주 균주 MSC562에서 rCH 역가의 향상에 대한 개개 플라스미드-함유 영역 2 유전자의 존재 효과를 평가하기 위해 설계되었다. 생성 플라스미드 중에서 견줄만한 발현 수준을 유지하는 수단으로서, 프로모터-인접 kfoA 유전자가 모든 작제물에 유지되었다. 이러한 설계 전략은 완전 분리시에 플라스미드 인코딩된 kfoB, C, F 또는 G 유전자의 평가를 허용하지 않지만, kfoA 유전자의 보유, 및 모든 이들 플라스미드에서 Pm 프로모터와 제1 판독 프레임 사이의 생성된 고정 관계는 Pm 프로모터로부터의 발현 수준을 필적하게 할 것으로 예상된다. 상기와 동일한 전략을 사용하여, 다음 유도체화(표 15)를 수행했다. 모든 플라스미드는 xylS를 함유한다.
[표 15]
Figure 112012080180037-pct00037
최종 세트의 플라스미드 각각을 숙주 균주 MSC562 내로 형질전환시켜 하기 표 16에 제공된 균주를 수득했다. 이들 균주 및 MSC563 및 MSC564 대조군을 2xM9/tet2 배지를 갖는 진탕 플라스크에서 성장시키고, 0.08 내지 0.18의 OD600 값에서 1 mM meta-톨루엔산에 의해 유도하고, 성장(OD600) 및 68시간 후의 rCH 생산에 대해 평가했다.
[표 16]
Figure 112012080180037-pct00038
이들 데이타는 K4 영역 2 유전자(kfoABCFG)의 어떤 것도 개별적으로는 MSC562 숙주 균주에서 rCH 생산을 최대로 자극하는데 충분하지 않음을 입증한다. 상기한 발견(예: 실시예 16)과 함께 고려하면, 영역 2 유전자 세트의 모든 5개 유전자를 포함하는 것은 rCH 생산을 최대로 향상시킨다는 것이 명백하다.
실시예 18
본 실시예는 보다 많은 콘드로이틴 생산을 위해 콘드로이틴 생합성 유전자 영역 2의 증가된 염색체 카피 수를 위한 작제물을 설명한다.
실시예 12는, 영역 1, 2 및 3의 단일 염색체 카피를 이미 함유하는 에스케리키아 콜라이 숙주에서 영역 2 유전자 세트(kfoABCFG)의 단일 염색체 카피의 부가가 rCH 생산에 있어서 상당한 20 내지 30% 증가를 유도함을 입증한다. 실시예 11은, 영역 2 유전자 세트를 함유하는 복수 카피 플라스미드를 함유하는 유사한 숙주가 rCH 생산에 있어서 300% 증가를 유도함을 입증한다. 높은 생산능의 플라스미드 비함유 균주를 생성하는 목적에 따라, 본 실시예는, 이러한 삽입체의 동정을 촉진하기 위해 특이적으로 선택된 다양한 비필수 염색체 유전자 내로 이들을 삽입함으로써 영역 2 카피(Pm 프로모터에 의해 유도됨)의 염색체 상보성을 증가시키도록 설계된 플라스미드의 작제 및 용도를 기재한다. 상동성 구동된 "팝-인/팝-아웃" 방법(실시예 4 및 12 참조)을 사용하여 영역 2 유전자 세트의 카피를 숙주 에스케리키아 콜라이 염색체 내의 상이한 유전자좌로 성공적으로 삽입함에 있어서 목적하는 유전자좌 대신에 기존의 영역 2 삽입체 내로의 바람직하지 않은 표적화(방법 유도된 재조합)에 대한 경쟁이 증가한다. 따라서, 보다 많은 노력 및 시간 소비적인 PCR 대신에 단순한 콜로니 스크리닝에 의해 목적하는 유전자좌에서 삽입체 함유 균주를 초기에 동정하는 수단을 가지면 숙주 균주에서 영역 2 카피의 수가 상승함에 따라 점차 유리해진다.
본 실시예에서, 3개의 에스케리키아 콜라이 표적 유전자좌가 기재되어 있다. 이들은, 각각 당 락토즈, 만니톨 및 프럭토즈 상에서의 성장에 필수적이지만 글루코즈 또는 글리세린 등의 다른 탄소원 상에서의 성장에는 필수적이지 않은 유전자 lacZ, mtlA 및 fruBKA 오페론(일부 경우에 단순화를 위해 "fruA"로 지칭됨)이다. 이들 유전자에 대해 파괴된 균주의 콜로니는 콜로니 색차에 의해 맥콘키(MacConkey)[참조: Miller, JH, Experiments in Molecular Genetics, 1972] 등의 표시 아가 상에서 시각적으로 동정될 수 있다: 도입된 당을 이용할 수 있는 균주의 경우에 분홍색/적색 및 유전자 파괴(예: 삽입체)를 갖는 균주의 경우에 백색/연분홍색. 또는, LB/Xgal/IPTG 아가 배지(ibid.)를 사용하여 락토즈 대사에서 결함을 검출할 수 있다: 락토즈를 이용할 수 있는 균주의 경우에 청색 콜로니 및 락토즈를 이용할 수 없는 균주(예: lacZ 유전자 내에 삽입체를 갖는 균주)의 경우에 백색/담황색 콜로니. 색차를 사용하는 이와 같은 방법은 삽입체를 갖는 콜로니 모집단 중에서 목적하는 유전자좌 내로의 삽입체를 갖는 균주를 시각적으로 동정하게 한다. 당해 기술분야의 통상의 지식을 가진 자는 목적하는 삽입체 성과의 스크리닝 또는 선별을 가능하게 하는 다른 표적 유전자좌가 에스케리키아 콜라이에 존재함을 인지할 것이다: 비제한적 예는 pepP, pepQ, feuA(cirA), malB(lamB), nupA(tsx)을 포함한다.
fruBKA, lacZ 및 mtlA 유전자 내로 영역 2("R2")의 삽입을 위해 플라스미드 pMAK705의 사용을 촉진하기 위해, 다중 클로닝 부위를 함유하는 pMAK705의 유도체를 먼저 개발했다. 프라이머 DHD266c 및 DHD267c는 다중 제한(클로닝) 부위(NotI, XhoI, AscI, SalI, BglII, HindIII)의 일본쇄 절반을 함유하고, AseI 및 ClaI을 사용한 pMAK705의 분해에 의해 생성된 오버행에 적합한(어닐링되는 경우) 2-염기 일본쇄 말단을 제외하고 상보성이다. AseI 또는 ClaI 제한 부위 어떠한 것도 이들 적합한 말단의 결찰시에 재생되지 않는다.
Figure 112016019550472-pct00168
플라스미드 pMAK705를 AseI 및 ClaI로 분해시키고, 벡터 단편을 겔 정제했다. 인산화된 올리고뉴클레오티드 DHD266c 및 DHD267c를 어닐링시키고(각각 200 nM 올리고뉴클레오티드, 5분 동안 90℃, 30분 동안 50℃로 완만한 냉각), 이어서 pMAK705 벡터 단편에 연결시켰다. 연결 반응물을 클로람페니콜 내성에 대한 선별과 함께 에스케리키아 콜라이 NEB10β 내로 형질전환시켰다. 분리된 형질전환체로부터의 플라스미드를 PCR에 의해 및 MCS 제한 효소 부위의 존재에 대해 스크리닝했다. MCS 영역의 서열분석은 목적하는 구조를 갖는 플라스미드를 동정했다. 이 플라스미드는 pMAK705pl(서열 번호 157; 도 14q)로 명명되었다.
R2를 fruBKA, lacZ 및 mtlA 유전자좌 내로 삽입하기 위한 3개 벡터의 작제는 모두 동일한 2단계 방법을 취했다. 제1 단계에서, 상부 및 하부 상동성 영역은 PCR 생성물의 "내부" 말단 사이의 어닐링을 허용하는 PCR 프라이머를 사용하여 각 표적 유전자좌에 대해 생성했다. 이러한 상동성 영역은 R2의 부가를 위해 이후에 사용된 다중 제한 부위를 포함한다. 제2 단계에서, 각 유전자좌에 대한 상부 및 하부 PCR 생성물을, 개개 주형 구성원을 합성하기 위해 본래 사용된 2개의 "외부" 프라이머와 PCR 반응에서 혼합했다. 상부 및 하부 PCR 생성물(단계 2에서 이제 주형) 내에 설계된 말단 상동성으로 인해, 단계 2 반응의 결과는 다중 클로닝 부위 측면에 위치하는 상부 및 하부 영역의 적절한 배향을 포함하는 DNA 단편이었다. 단계 2로부터의 PCR 생성물을 효소로 분해시켰으며, 효소의 인지 서열은 "외부" 프라이머로 설계되었다: 상부 말단의 경우에 NotI 및 하부 말단의 경우에 HindIII. 이어서, 이들 단편을 NotI 및 HindIII로 분해시킨 pMAK705pl(서열 번호 157) 내로 각각 클로닝시켰다. 생성된 3개의 플라스미드는, R2 카피의 수용에 사용되는 다중 클로닝 부위(MCS)의 측면에 위치하는 적절히 배향된 상부(UP) 및 하부(DN) 영역 약 900 내지 1000bp를 함유했다. pBR1093의 경우, MCS는 약 20bp의 lacZ 코딩 영역을 치환했다. pBR1094의 경우, MCS는 mtlA 코딩 영역 내로 삽입되었다. pBR1095의 경우, MCS는 fruB의 3-프라이머 말단, fruK 모두, 및 fruA의 5-프라이머 말단을 치환했다. 이들 중간 작제물의 제조에 사용된 프라이머는 하기 표 25에 수록되어 있다.
pBR1093, pBR1094 및 pBR1095 내로 클로닝하는 영역 2 유전자 세트를 제조하기 위해, kfoABCFG 유전자를 PacI + ClaI을 사용하여 pCX074(실시예 11 참조)로부터 (Pm 프로모터 없이) 분해시켰다. 이어서, 정제된 R2 단편을 동일한 효소로 분해된 pJ201:11352(도 8b 참조) 내로 클로닝시켰다. 이는 kfoABCFG 유전자가 Pm 프로모터 뒤에 다시 배향되어 있는 플라스미드 pBR1096을 생성했다. 이제, 그러나, Pm:R2는 pBR1093(도 14s), pBR1094(도 14v) 및 pBR1095(도 14w) 내로 클로닝하기 위한 XhoI/AscI 단편으로서 pBR1096으로부터 분리할 수 있다. 표 17은 최종 치환 pMAK705-기반 Pm:R2 삽입 플라스미드pBR1100(lacA 유전자좌의 경우), pBR1101(mtlA 유전자좌의 경우) 및 pBR1102(fruBKA 유전자좌의 경우)의 설계를 제공한다. 프라이머 DHD280c, DHD281c, DHD283, DHD285, DHD268c, DHD269c, DHD271, DHD273, DHD274c, DHD275c, DHD277 및 DHD279의 서열은 각각 서열 번호 158 내지 169에 제시되어 있다.
[표 17]
Figure 112016019550472-pct00169
상기한 "팝-인/팝-아웃" 방법을 플라스미드 pBR1100(서열 번호 171; 도 14t), pBR1101(서열 번호 172; 도 14v) 및 pBR1102(서열 번호 170; 도 14x)에 사용하여 선택된 에스케리키아 콜라이 균주에 추가의 Pm:R2 카피를 제공했다. 균주를 클로람페니콜 내성에 대해 선택하면서 30℃에서 pBR1100, pBR1101 또는 pBR1102에 형질전환시켰다. 이어서, 형질전환체를 43℃에서 맥콘키(MacConkey)/프럭토즈/Cm 아가(pBR1102 형질전환체의 경우), 맥콘키/만니톨/Cm 아가(pBR1101 형질전환체의 경우) 또는 LB/Xgal/IPTG/Cm 아가(pBR1100 형질전환체의 경우)에 플레이팅시켰다. 뚜렷하게 착색되지 않은 콜로니를 추가의 분석을 위해 선택했다. 이들 중에서, 표적 유전자좌 내로 통합된 플라스미드를 갖는 균주를 PCR에 의해 동정했다. 이어서, 성공적으로 통합된 플라스미드를 갖는 균주를 클로람페니콜 선택의 부재하에 다중(예: 20 내지 30) 세대용으로 성장시켰다. 이들 배양물로부터 유래된 콜로니를 클로람페니콜 민감성(플라스미드의 절단 반영) 및 당 대사의 결함(표적화 Pm:R2 삽입의 보유 반영)에 대해 스크리닝했다. 목적하는 표현형을 갖는 분리물을 정확한 염색체 구조에 대해 PCR에 의해 평가했다. 도 15는 본 실시예 및 다른 실시예에 기재된 방법을 사용하는 균주 유도에서의 다중 단계를 도시한다. 설명 및 요약으로서, 균주 MSC702는 다음과 같은 주요 요소를 함유한다: 콜란산 유전자좌에 삽입된 Pm[kpsMTkfoABCFG]Pm[kpsFEDUCS], fhuA 유전자좌에 삽입된 Psyn[xylS], fruBKA, lacZ 및 mtlA에 삽입된 Pm[kfoABCFG], 및 (MSC691로부터의 이의 유도에 기인하여 추정됨; 실시예 19 참조) leuB 유전자 내의 8 염기쌍 변화.
실시예 19
본 실시예는 에스케리키아 콜라이 균주에서 자발적-발생 영양요구체의 동정 및 교정을 설명한다.
최소 성장 배지에서 rCH 생산에 대한 재조합 에스케리키아 콜라이 균주를 평가하는 과정 동안, 특정 균주가 성장하지 않음이 발견되었다. 이어서, 균주 MSC561는 류신 공급원으로 수정되는 경우에만 최소 배지 상에서 성장하는 것으로 측정되었다; 즉, 이 균주는 류신 영양요구체이다. MSC561에서 류신 생합성 오페론 leuABCD의 서열분석은 당해 균주가 류신 원영양체 MSC467로부터 이의 유도 동안 leuB 유전자 코딩 영역 내의 단일 염기쌍 결실(코딩 영역의 위치 383에서 C/G 염기쌍)을 동시에 획득했음을 나타냈다(실시예 10 참조). 이러한 결실은 판독 프레임 쉬프트 및 조기 해독 종결을 생성했다. 이러한 결함은, 유전자 조작 및 초기 생산 시험이 복합체 배지에서 수행되었기 때문에 초기에는 검출되지 않았다. 이러한 돌연변이는 fhuA 및 콜란산 유전자좌에서 이전 표적화 재조합의 결과인 것 같지는 않은데, 이는 이들이 leuB에 친밀하게 연결되어 있지 않기 때문이다(fhuA 및 leuB은 약 85 Kb 떨어져 있다; 콜란산 오페론 및 leuB은 약 2Mb 떨어져 있다). R2 카피(예: MSC627, MSC650, MSC646, MSC679 및 MSC700; 도 15 참조)의 부가에 의해 MSC561로부터 즉시 또는 순차로 유래된 모든 균주는 또한 류신 영양요구체이고, leuB 서열에서 동일한 결실을 함유했다. MSC467의 별개 계통의 균주(MSC537, MSC562 및 MSC619)는 류신 원영양체이다(도 15 참조).
2개 방법을 사용하여 선별된 류신 영양요구체를 원영양체로 전환시켰다(따라서 류신의 부가 없이 최소 배지에서 성장함). 한 가지 방법에서, 영양요구체 균주의 다수(약 106 내지 107)의 세포를 최소 배지 아가 플레이트에 적용한 다음, 30℃에서 3 내지 7일 동안 배양했다. 통상적으로, 몇몇 콜로니는 이들 조건하에 성장했다. 이들 콜로니로부터 분리된 균주("자발성 회복체")는 류신 없이 고체 및 액체 최소 배지에서 재현가능하게 성장했다. 선별된 회복체의 leuB 유전자의 서열 분석은, 정확한 leuB 판독 프레임의 회복을 생성하는 본래 단일 염기쌍 결실 부위 부근에서 적은 삽입 또는 결실을 나타냈다(대부분의 경우). 하기 표 18은 leuB 코딩 영역의 상대적 동조와 함께 뉴클레오티드 변화 위치를 제공한다. 이들 자발성 회복체 균주 중의 LeuB 효소는 이들 영역 내에 변경된 아미노산 서열을 갖지만, 천연 구조로부터의 변화는 류신 비함유 배지에서의 성장을 뒷받침하는 충분한 기능을 하는 것 같다. 자발성 회복체 MSC692에서, leuB에서 어떠한 보상 뉴클레오티드 변화도 검출되지 않았다. 이들 균주에서 유전자 변화의 성질은 특성화되지 않는다.
류신 영양요구체를 원영양체로 전환시키는 제2 방법에서, 선별된 균주의 leuB에서의 자발성 돌연변이는 천연 서열로 특이적으로 수정되었다. PCR 프라이머 BLR513(서열 번호 173) 및 BLR516(서열 번호 174)을 사용하여, 야생형 에스케리키아 콜라이 W3110로부터의 gDNA를 주형으로서 사용하여 646 염기쌍 영역을 증폭시켰다. MSC561에서 결실이 발견된 염기쌍 부위는 이 PCR 단편의 상부 말단으로부터 288 bp였고, PCR 프라이머는 pMAK705pl(실시예 18; 서열 번호 157; 도 14q) 내로 클로닝시켜 pBR1103(서열 번호 175; 도 14r)을 생성하는 HindIII 및 XhoI 말단을 생성한다. pBR1103 중의 leuB 유전자 단편은 서열 번호 175의 bp = 5059 내지 5064에 있는 HindIII 제한 부위로부터 서열 번호 175의 bp = 5712 내지 5717에 있는 XhoI 제한 부위까지 연장한다. 이들 제한 부위는 천연 leuB 서열의 일부는 아니지만, 프라이머 BLR513 및 BLR516을 사용하여 PCR에 의한 클로닝 목적으로 도입되었다.
이어서, 표준 "팝-인/팝-아웃" 방법을 사용하여 영양요구체 균주 MSC650, MSC679 및 MSC700에서 천연 영역으로 결함 leuB 영역을 치환함으로써 각각 원영양체 균주 MSC722, MSC723 및 MSC724를 수득했다. 요약하면, pBR1103을 갖는 MSC650, MSC679 및 MSC700의 초기 형질전환체를 30℃에서 LB/Cm34 상에서 선택했다. 선택된 형질전환체를 43℃에서 LB/Cm34에 플레이팅시키고, 분리된 생존체는 leuB 유전자좌에서 통합된 pBR1103l을 갖는 것으로 PCR에 의해 확인되었다. 선택된 통합체를 약 10세대 동안 30℃에서 LB(Cm 부재) 상에서 성장시킨 다음, 약 15 세대 동안 2xM9 배지(Cm 부재, 류신 부재)에서 성장시켰다. 이들 배양물로부터 분리된 LB 플레이트 상의 콜로니로부터 유래된 균주를 클로람페니콜-민감성 및 원영양체에 대해 스크리닝했다. 3개의 초기 모 균주 각각으로부터 유래된 원영양성 클로람페니콜-민감성 균주 중의 leuB 유전자의 DNA 서열분석은 본래 야생형 서열이 회복되었음을 확인시켰다. 도 15는 본원에 기재된 다른 균주와 비교하여 이들 균주의 유도를 나타낸다.
[표 18]
Figure 112012080180037-pct00041
균주 MSC722, MSC723 및 MSC724에서 rCH 생산(특이적으로 수정된 Leu+ 원영양체)을, 동일한 K4 유전자 상보성 및 배열을 갖지만 원영양체: 각각 MSC677, MSC692 및 MSC702로의 자발적 전환에 의해 유도된 균주에서의 생산과 비교했다. 6개 균주를 30℃에서 이중 2xM9 플라스크에서 성장시키고, 대략 0.1의 OD600 값에서 1 mM mTA에 의해 유도했다. 유도후 72시간에서 배양조의 샘플을 상기한 바와 같이 rCH 함량에 대해 분석했다. 평균 OD600 및 rCH 농도는 표 19에 제시되어 있다.
[표 19]
Figure 112012080180037-pct00042
3개 균주 쌍중의 2개에서, rCH 생산은 leuB로의 특이적 수정을 갖는 균주에서 더욱 크지만, 최종 세포 밀도(말기 OD600에 의해 측정됨)은 유사했다. 이들 결과는 에스케리키아 콜라이 균주 개발 과정 동안 발견된 자발성 돌연변이를 특이적으로 수정하는 것의 rCH 생산 측면에서의 잇점을 입증한다.
실시예 20
본 실시예는 발효조에서 에스케리키아 콜라이 중의 콘드로이틴의 재조합 DNA-매개 생산을 기재한다.
1. 에스케리키아 콜라이(MSC537)의 10-L 발효
통상적인 발효 조건하에 10-L 발효조를 사용하여, 에스케리키아 콜라이 균주 MSC537의 배양물을 탄소원으로서 글리세린을 사용하여 배양했다. 발효조를 탈이온수를 사용하여 6L 용적으로 다음 배지(표 20a)를 사용하여 일괄 처리(batch)했다.
[표 20a]
Figure 112012080180037-pct00043
상기 배지를 함유하는 발효조의 오토클레이빙 후, 다음 성분(표 20b)을 무균 상태로 첨가했다.
[표 20b]
Figure 112012080180037-pct00044
발효조를 통상적인 씨드(seed) 배양물로 접종하고, 4.25시간 후 2mM m-TA로 유도한 다음, 69시간 동안 배양하고, 배양 동안 탄소원(625g/L 글리세린 용액으로 구성됨)을 공급했다. 69시간 후, 발효조를 오토클레이빙하고, 원심분리로 수거했다. 발효 조절 조건 및 생성물 수율은 표 20c 및 20d에 각각 제시한다.
[표 20c]
Figure 112012080180037-pct00045
[표 20d]
Figure 112012080180037-pct00046
2. 에스케리키아 콜라이(MSC564)의 2-L 발효
통상적인 발효 조건하에 2ℓ 발효조를 사용하여, 에스케리키아 콜라이 균주 MSC564의 배양물을 탄소원으로서 글리세린을 사용하여 배양했다. 발효조를 탈이온수를 사용하여 1.5L 용적으로 다음 배지(표 21a)를 사용하여 일괄 처리했다.
[표 21a]
Figure 112012080180037-pct00047
상기 배지를 함유하는 발효조의 오토클레이빙 후, 다음 성분(표 21b)을 무균 상태로 첨가했다.
[표 21b]
Figure 112012080180037-pct00048
발효조를 통상적인 씨드 배양물로 접종하고, 66시간 동안 배양하고, 배양 동안 170mL의 탄소원(625g/L 글리세린 용액으로 구성됨)을 공급했다. 5시간 배양 후, 이를 2mM m-TA로 유도했다. 발효조를 pH, 용해된 산소, 온도, 글리세린 농도 및 아세테이트 농도(탄소 대사 부산물)에 대해 조절했다. 글리세린 공급 속도는 < 2g/L 아세테이트의 표적으로 아세테이트 농도에 기초하여 조정했다. 표적 글리세린 농도는 < 5g/L였다. 발효를 66시간 동안 작동시키고, 그 시점에서 글리세린 소비는 < 1.5g/L/h로 감퇴되었다. 샘플링 및 증발에 기인하여, 최종 용적은 1.35L였다. 조절 조건 및 생성물 수율은 이하 나열된다. 66시간 후, 발효조를 오토클레이빙하고, 원심분리 수거했다. 원심분리 후 회수된 용적은 상청액 약 1L였다. 발효 조절 조건 및 생성물 수율은 표 21c 및 21d에 각각 제시한다.
[표 21c]
Figure 112012080180037-pct00049
[표 21d]
Figure 112012080180037-pct00050
3개의 10L 반응기가 숙주 염색체(참조: 실시예 19; 도 15) 중의 영역 2 유전자의 상이한 수 및 배열을 함유하는 균주 MSC619, MSC677 및 MSC702를 비교하면서 동일한 조건하에 나란히 작동된 하나의 실험으로부터 다음 3개의 발효(3 내지 5)를 취했다. 요약하면, MSC619 및 MSC677은 각각 영역 2의 3개 총 카피를 갖지만, MSC619 중의 하나의 카피는 Pm 프로모터 대신 Psyn 프로모터로 구동된다. 균주 MSC702는 모두 Pm에 의해 구동되는 영역 2 유전자 세트의 4개의 카피를 갖는다.
3. 에스케리키아 콜라이(MSC619)의 10-L 발효
통상적인 발효 조건하에 10-L 발효조를 사용하여, 에스케리키아 콜라이 균주 MSC619의 배양물을 각각 주요 탄소원 및 질소원으로서 글리세린, 카제인 가수분해물 및 수산화암모늄을 사용하여 배양했다. 발효조를 탈이온수를 사용하여 6L 용적으로 다음 배지(표 22a)를 사용하여 일괄 처리했다.
[표 22a]
Figure 112012080180037-pct00051
상기 배지를 함유하는 발효조의 오토클레이빙 후, 다음 성분(표 22b)을 무균 상태로 첨가했다.
[표 22b]
Figure 112012080180037-pct00052
발효조를 통상적인 씨드 배양물로 접종하고, 4.2시간 후 2mM m-TA로 유도한 다음, 80시간 동안 배양하고, 탄소원(625g/L 글리세린 용액으로 구성됨) 및 4N 수산화암모늄 형태의 질소원을 공급했다. 탄소원 및 질소원을 NOVA 300A 생물분석기 상에서 오프라인으로 취한 샘플 판독에 기초하여 수동으로 조정했다. 글리세린의 농도를 1g/L 미만을 유지하도록 표적화하고, 공급률을 아세테이트 축적의 존재하에 추가로 감소시켰다. 암모니아 농도 표적은 배양액 중의 암모니아 100mg/L 이하였다. 2N 황산 형태의 산 및 4N 수산화나트륨 형태의 염기를 배양 동안 자동적으로 첨가하여 pH를 조절했다. 소포제를 또한 발효조에 자동적으로 공급하여 배양액의 발포를 조절했다. 발효조 조절 조건 및 생성물 수율은 이하 표 22c 및 22d에 각각 제시한다.
[표 22c]
Figure 112016019550472-pct00170
[표 22d]
Figure 112012080180037-pct00054
4. 에스케리키아 콜라이(MSC677)의 10-L 발효
통상적인 발효 조건하에 10-L 발효조를 사용하여, 에스케리키아 콜라이 균주 MSC677의 배양물을 각각 주요 탄소원 및 질소원으로서 글리세린, 카제인 가수분해물 및 수산화암모늄을 사용하여 배양했다. 발효조를 탈이온수를 사용하여 6L 용적으로 다음 배지(표 23a)를 사용하여 일괄 처리했다.
[표 23a]
Figure 112012080180037-pct00055
상기 배지를 함유하는 발효조의 오토클레이빙 후, 다음 성분(표 23b)을 무균 상태로 첨가했다.
[표 23b]
Figure 112012080180037-pct00056
발효조를 통상적인 씨드 배양물로 접종하고, 4.2시간 후 2mM m-TA로 유도한 다음, 80시간 동안 배양하고, 탄소원(625g/L 글리세린 용액으로 구성됨) 및 4N 수산화암모늄 형태의 질소원을 공급했다. 탄소원 및 질소원을 NOVA 300A 생물분석기 상에서 오프라인으로 취한 샘플 판독에 기초하여 수동으로 조정했다. 글리세린의 농도를 1g/L 미만을 유지하도록 표적화하고, 공급률을 아세테이트 축적의 존재하에 추가로 감소시켰다. 암모니아 농도 표적은 배양액 중의 암모니아 100mg/L 이하였다. 2N 황산 형태의 산 및 4N 수산화나트륨 형태의 염기를 배양 동안 자동적으로 첨가하여 pH를 조절했다. 소포제를 또한 발효조에 자동적으로 공급하여 배양액의 발포를 조절했다. 발효조 조절 조건 및 생성물 수율은 이하 표 23c 및 23d에 각각 제시한다.
[표 23c]
Figure 112016019550472-pct00171
[표 23d]
Figure 112012080180037-pct00058
5. 에스케리키아 콜라이(MSC702)의 10-L 발효
통상적인 발효 조건하에 10-L 발효조를 사용하여, 에스케리키아 콜라이 균주 MSC702의 배양물을 각각 주요 탄소원 및 질소원으로서 글리세린, 카제인 가수분해물 및 수산화암모늄을 사용하여 배양했다. 발효조를 탈이온수를 사용하여 6L 용적으로 다음 배지(표 24a)를 사용하여 일괄 처리했다.
[표 24a]
Figure 112012080180037-pct00059
상기 배지를 함유하는 발효조의 오토클레이빙 후, 다음 성분(표 24b)을 무균 상태로 첨가했다.
[표 24b]
Figure 112012080180037-pct00060
발효조를 통상적인 씨드 배양물로 접종하고, 4.2시간 후 2mM m-TA로 유도한 다음, 80시간 동안 배양하고, 탄소원(625g/L 글리세린 용액으로 구성됨) 및 4N 수산화암모늄 형태의 질소원을 공급했다. 탄소원 및 질소원을 NOVA 300A 생물분석기 상에서 오프라인으로 취해진 샘플 판독에 기초하여 수동으로 조정했다. 글리세린의 농도를 1g/L 미만을 유지하도록 표적화하고, 공급률을 아세테이트 축적의 존재하에 추가로 감소시켰다. 암모니아 농도 표적은 배양액 중의 암모니아 100mg/L 이하였다. 2N 황산 형태의 산 및 4N 수산화나트륨 형태의 염기를 배양 동안 자동적으로 첨가하여 pH를 조절했다. 소포제를 또한 발효조에 자동적으로 공급하여 배양액의 발포를 조절했다. 발효조 조절 조건 및 생성물 수율은 이하 표 24c 및 24d에 각각 제시한다.
[표 24c]
Figure 112012080180037-pct00061
[표 24d]
Figure 112012080180037-pct00062
실험 3 내지 5를 요약하기 위해, 균주 MSC619, MSC677 및 MSC702는 각각 3.45, 4.3 및 5.3g/L 콘드로이틴을 수득하여, 콘드로이틴 생산능을 향상시키는데 영역 2 배열(배경) 및 카피 수의 효과를 입증한다.
6. 에스케리키아 콜라이(MSC702)의 10-L 발효
통상적인 발효 조건하에 10-L 발효조를 사용하여, 에스케리키아 콜라이 균주 MSC702의 배양물을 각각 주요 탄소원 및 질소원으로서 글리세린, 카제인 가수분해물 및 수산화암모늄을 사용하여 배양했다. 발효조를 탈이온수를 사용하여 6L 용적으로 다음 배지(표 25a)를 사용하여 일괄 처리했다.
[표 25a]
Figure 112012080180037-pct00063
상기 배지를 함유하는 발효조의 오토클레이빙 후, 다음 성분(표 25b)을 무균 상태로 첨가했다.
[표 25b]
Figure 112012080180037-pct00064
발효조를 통상적인 씨드 배양물로 접종하고, 4시간 후 2mM m-TA로 유도한 다음, 82시간 동안 배양하고, 탄소원(625g/L 글리세린 용액으로 구성됨) 및 4N 수산화암모늄 형태의 질소원을 공급했다. 탄소원 및 질소원을 NOVA 300A 생물분석기 상에서 오프라인으로 취해진 샘플 판독에 기초하여 수동으로 조정했다. 글리세린의 농도를 1g/L 미만을 유지하도록 표적화하고, 공급률을 아세테이트 축적의 존재하에 추가로 감소시켰다. 암모니아 농도 표적은 배양액 중의 암모니아 100mg/L 이하였다. 2N 황산 형태의 산 및 4N 수산화나트륨 형태의 염기를 배양 동안 자동적으로 첨가하여 pH를 조절했다. 소포제를 또한 발효조에 자동적으로 공급하여 배양액의 발포를 조절했다. 발효조 조절 조건 및 생성물 수율은 이하 표 25c 및 25d에 각각 제시한다.
[표 25c]
[표 25d]
Figure 112012080180037-pct00066
이 작동은 발효 실험 5(상기)의 반복으로서 고안되었지만, 콘드로이틴 수율에서 상당한 증가를 달성했다. 수율의 차이는 적어도 부분적으로 증가된 수준의 아세테이트 축적과 함께 실험 5에 사용된 과량의 소포제에 기인하는 것으로 간주되지만, 이들 둘 다 콘드로이틴 수율에 부정적으로 영향을 미치는 것으로 간주된다.
7. 에스케리키아 콜라이(MSC702)의 50-L 발효
통상적인 발효 조건하에 50-L 발효조를 사용하여, 에스케리키아 콜라이 균주 MSC702의 배양물을 각각 주요 탄소원 및 질소원으로서 글리세린 및 수산화암모늄을 사용하여 규정된 배지 중에서 배양했다. 발효조를 탈이온수를 사용하여 40L 용적으로 다음 배지(표 26a)를 사용하여 일괄 처리했다.
[표 26a]
Figure 112012080180037-pct00067
상기 배지를 함유하는 발효조의 오토클레이빙 후, 다음 성분(표 26b)을 무균 상태로 첨가했다.
[표 26b]
Figure 112012080180037-pct00068
발효조를 통상적인 씨드 배양물로 접종하고, 4시간 후 2mM m-TA로 유도한 다음, 91시간 동안 배양하고, 탄소원(625g/L 글리세린 용액으로 구성됨) 및 6N 수산화암모늄 형태의 질소원을 공급했다. 탄소원 및 질소원을 NOVA 300A 생물분석기 상에서 오프라인으로 취해진 샘플 판독에 기초하여 수동으로 조정했다. 글리세린의 농도를 1g/L 미만을 유지하도록 표적화하고, 공급률을 아세테이트 축적의 존재하에 추가로 감소시켰다. 암모니아 농도 표적은 배양액 중의 암모니아 100mg/L 이하였다. 3N 황산 형태의 산 및 4N 수산화나트륨 형태의 염기를 배양 동안 자동적으로 첨가하여 pH를 조절했다. 소포제를 발효조에 수동으로 공급하여 배양액의 발포를 조절했다. 발효조 조절 조건 및 생성물 수율은 표 26c 및 26d에 각각 제시한다.
[표 26c]
Figure 112012080180037-pct00069
[표 26d]
Figure 112012080180037-pct00070
이 발효 실험은 높은 콘드로이틴 생산이 중간 발효 규모에서 규정된 (최소) 성장 배지에서 달성되었다는 것을 입증한다.
다음 두 발효(8 및 9)는 2개의 10L 반응기가 균주 MSC702 및 MSC724를 비교하면서 동일한 조건하에 나란히 작동된 하나의 실험으로부터 취했다.
8. 에스케리키아 콜라이(MSC702)의 10-L 발효
통상적인 발효 조건하에 10-L 발효조를 사용하여, 에스케리키아 콜라이 균주 MSC702의 배양물을 각각 주요 탄소원 및 질소원으로서 글리세린, 카제인 가수분해물 및 수산화암모늄을 사용하여 배양했다. 발효조를 탈이온수를 사용하여 6L 용적으로 다음 배지(표 27a)를 사용하여 일괄 처리했다.
[표 27a]
Figure 112012080180037-pct00071
상기 배지를 함유하는 발효조의 오토클레이빙 후, 다음 성분(표 27b)을 무균 상태로 첨가했다.
[표 27b]
Figure 112012080180037-pct00072
발효조를 통상적인 씨드 배양물로 접종하고, 4시간 후 2mM m-TA로 유도한 다음, 92시간 동안 배양하고, 탄소원(625g/L 글리세린 용액으로 구성됨) 및 황산암모늄 형태의 질소원을 공급했다. 탄소원 및 질소원을 NOVA 300A 생물분석기 상에서 오프라인으로 취해진 샘플 판독에 기초하여 수동으로 조정했다. 배양액 중의 글리세린의 농도를 1g/L 미만을 유지하도록 표적화하고, 공급률을 아세테이트 축적의 존재하에 추가로 감소시켰다. 암모니아 농도 표적은 배양액 중의 암모니아 100mg/L 이하였다. 2N 황산 형태의 산 및 4N 수산화나트륨 형태의 염기를 배양 동안 자동적으로 첨가하여 pH를 조절했다. 소포제를 또한 발효조에 자동적으로 공급하여 배양액의 발포를 조절했다. 발효조 조절 조건 및 생성물 수율은 표 27c 및 27d에 각각 제시한다.
[표 27c]
Figure 112012080180037-pct00073
[표 27d]
Figure 112012080180037-pct00074
9. 에스케리키아 콜라이(MSC724)의 10-L 발효
통상적인 발효 조건하에 10-L 발효조를 사용하여, 에스케리키아 콜라이 균주 MSC724의 배양물을 각각 주요 탄소원 및 질소원으로서 글리세린, 카제인 가수분해물 및 황산암모늄을 사용하여 배양했다. 발효조를 탈이온수를 사용하여 6L 용적으로 다음 배지(표 28a)를 사용하여 일괄 처리했다.
[표 28a]
Figure 112012080180037-pct00075
상기 배지를 함유하는 발효조의 오토클레이빙 후, 다음 성분(표 28b)을 무균 상태로 첨가했다.
[표 28b]
Figure 112012080180037-pct00076
발효조를 통상적인 씨드 배양물로 접종하고, 4시간 후 2mM m-TA로 유도한 다음, 92시간 동안 배양하고, 탄소원(625g/L 글리세린 용액으로 구성됨) 및 황산암모늄 형태의 질소원을 공급했다. 탄소원 및 질소원을 NOVA 300A 생물분석기 상에서 오프라인으로 취해진 샘플 판독에 기초하여 수동으로 조정했다. 배양액 중의 글리세린의 농도를 1g/L 미만을 유지하도록 표적화하고, 공급률을 아세테이트 축적의 존재하에 추가로 감소시켰다. 암모니아 농도 표적은 배양액 중의 암모니아 100mg/L 이하였다. 2N 황산 형태의 산 및 4N 수산화나트륨 형태의 염기를 배양 동안 자동적으로 첨가하여 pH를 조절했다. 소포제를 또한 발효조에 자동적으로 공급하여 배양액의 발포를 조절했다. 발효조 조절 조건 및 생성물 수율은 표 28c 및 28d에 각각 제시한다.
[표 28c]
Figure 112012080180037-pct00077
[표 28d]
Figure 112012080180037-pct00078
본 실시예에서 발효 8 및 9는 복합 배지 중의 MSC702에 비해 균주 MSC724의 향상된 rCH 수율을 입증한다. 이는 MSC702 중의 작용성이지만, 변경된 LeuB 효소(참조: 실시예 19)와 비교하여, MSC724 중의 천연 LeuB 효소의 보다 큰 대사 효율 결과일 수 있다.
실시예 21
본 실시예는 발효조에서 잔토모나스 캄페스트리스에서 콘드로이틴의 재조합 DNA-매개 생산을 기술한다.
잔토모나스 캄페스트리스(MSC480)의 10-L 발효
통상적인 발효 조건하에 10-L 발효조를 사용하여, 잔토모나스 캄페스트리스 균주 MSC480의 배양물을 탄소원으로서 글루코즈를 사용하여 배양했다. 발효조를 탈이온수를 사용하여 7.5L 용적으로 다음 배지(표 29a)를 사용하여 일괄 처리했다.
[표 29a]
Figure 112012080180037-pct00079
상기 배지를 함유하는 발효조의 오토클레이빙 후, 60g의 글루코즈(가열-멸균됨)를 무균 상태로 첨가했다.
발효조를 통상적인 씨드 배양물로 접종한 다음, 70시간 동안 배양하고, 배양 동안 탄소원(871g/L 글루코즈 용액으로 구성됨)을 공급했다. 70시간 후, 발효조를 오토클레이빙하고, 원심분리로 수거했다. 발효조 조절 조건 및 생성물 수율은 표 29b 및 29c에 각각 제시한다.
[표 29b]
Figure 112012080180037-pct00080
[표 29c]
Figure 112016019550472-pct00173
실시예 22
본 실시예는 개량된 에스케리키아 콜라이 성장 배지를 예시한다.
상기 실시예 4, 7, 및 8은 rCH-생산 재조합 에스케리키아 콜라이 K-12 균주의 성장을 위한 복합 TB 배지의 용도를 기술한다. 통상적으로 제형화된 바와 같이, TB 배지는 제1 탄소원으로서 5g/L 글리세린을 함유한다. 본 실시예는 진탕 플라스크에서 rCH 용적 측정 및 특정 생산능을 향상시키는 TB 배지에 대한 변형을 기술한다.
균주 MSC564의 작은 배양물을 접종물로서 사용하기 위해 30℃에서 TB/Tc5 배지에서 성장시켰다. 표준 TB 배지[참조: Sambrook et al., 1989; Difco "Terrific Broth"]를 0.1M MOPS 완충제(4-모르폴린프로판설폰산; NaOH로 7.2로 pH 조정된 1.0M 스톡 용액으로부터 제조됨), 10vg/L 글리세린(2X 표준 TB 처방), 또는 둘 다로 변형시켰다. 각 배지 50mL를 함유하는 삼각 진탕 플라스크(250mL)를 MSC564 배양물로 접종하여 OD600 = 0.03을 달성했다. 플라스크를 OD600 값이 약 0.125에 도달할 때까지 30℃에서 진탕시켰고(225rpm), 그 시간에 메타-톨루엔산을 1mM로 첨가하여 rCH 생산을 유도했다. 72시간 동안 계속 진탕 후, pH 및 OD600을 측정하고, 5mL 분취량을 5 내지 7분 동안 오토클래이빙하고, 냉각시키고 동결 저장했다. rCH 함량을 실시예 14에 기술된 바와 같이 측정했다. 최종 OD600 및 rCH 농도는 표 30에 제시한다.
[표 30]
Figure 112012080180037-pct00082
완충되고 과잉 글리세린(2X 표준)으로 수정된 TB 배지는 추가의 세포 밀도(더 큰 특정 생산능) 없이 rCH 역가(더 큰 용적 생산능)의 50% 초과 증가를 유도했다. 2X 글리세린을 포함하지만 완충제가 없는 배지 중의 성장 및 생산능은 글리세린으로부터 과량의 산 생산에 기인할 것 같은 불량한 생산능을 유도했다. 이는 재조합 균주에서 증가된 생산 용량을 입증하고, 신규 에스케리키아 콜라이 균주를 평가하기 위해 보다 높은 생산능 성장 조건을 제공한다.
본 발명의 상기 설명은 예시 및 설명 목적으로 제시되었다. 또한, 설명은 본 발명은 본원에 기술된 형태로 제한하고자 하지 않는다.
본원에 기술된 각종 국면, 양태 및 선택안 모두를 임의의 모든 변화에서 결합시킬 수 있다.
본 명세서에서 언급된 모든 공보, 특허 및 특허원은 각각 개별 공보, 특허 또는 특허원이 본원에 참조되는 것으로 구체적이고 개별적으로 기술되는 것처럼 동일한 정도로 참조로 인용된다.
<110> DSIM IP Assets B.V. SEIKAGAKU CORPORATION <120> Compositions and Methods for Bacterial Production of Chondroitin <130> IPA120861 <150> US 61/309,407 <151> 2010-03-01 <160> 175 <170> PatentIn version 3.5 <210> 1 <211> 981 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 1 atgagcgaac gccacttgcc ggatgaccag tcctcgacca ttgatccgta tctgattacg 60 agcgtccgcc agaccctggc cgaacaaagc gcggcactgc aaaacctgtc caaacaactg 120 gatagcggtc agtaccagcg cgtcctgaat ctcatcatga attgtaaagg gcacgtcatc 180 ctgagcggca tgggtaaaag cggccatgtg ggccgcaaga tgtcggcgac cttggcctcg 240 accgggacgc cctccttctt tattcatccg gcggaagcgt tccatggtga tctgggcatg 300 atcaccccgt atgacctgct catcttgatt tcggcgagcg gtgagacgga cgagatcctg 360 aaactggtgc cgagcctgaa gaacttcggc aatcgcatca tcgcaatcac caataacggg 420 aatagcaccc tggccaaaaa tgcagatgcg gtcctggagc tgcacatggc gaacgaaacg 480 tgcccgaaca atctcgcccc gaccacctcc acgacgctca cgatggcgat cggggacgcg 540 ctggccatcg cgatgattca ccagcgtaag tttatgccca atgactttgc acgctaccac 600 cccggtggca gcctgggtcg gcgcctgctg acccgcgtcg ccgacgtgat gcaacatgat 660 gtgccggcag tgcagctcga tgccagcttc aaaacggtca ttcagcgcat cacctcgggc 720 tgccagggta tggtgatggt cgaagatgcg gaaggtgggc tggcaggcat catcaccgat 780 ggcgatctgc ggcgctttat ggagaaagaa gacagcctga cgagcgcaac ggccgcacag 840 atgatgaccc gcgaaccgct gaccttgccc gaagacacca tgatcatcga agcagaagag 900 aagatgcaga aacaccgcgt ctcgaccctg ctggtgacca acaaagcaaa taaggtgacc 960 gggttggtgc gcattttcga t 981 <210> 2 <211> 327 <212> PRT <213> Escherichia coli <400> 2 Met Ser Glu Arg His Leu Pro Asp Asp Gln Ser Ser Thr Ile Asp Pro 1 5 10 15 Tyr Leu Ile Thr Ser Val Arg Gln Thr Leu Ala Glu Gln Ser Ala Ala 20 25 30 Leu Gln Asn Leu Ser Lys Gln Leu Asp Ser Gly Gln Tyr Gln Arg Val 35 40 45 Leu Asn Leu Ile Met Asn Cys Lys Gly His Val Ile Leu Ser Gly Met 50 55 60 Gly Lys Ser Gly His Val Gly Arg Lys Met Ser Ala Thr Leu Ala Ser 65 70 75 80 Thr Gly Thr Pro Ser Phe Phe Ile His Pro Ala Glu Ala Phe His Gly 85 90 95 Asp Leu Gly Met Ile Thr Pro Tyr Asp Leu Leu Ile Leu Ile Ser Ala 100 105 110 Ser Gly Glu Thr Asp Glu Ile Leu Lys Leu Val Pro Ser Leu Lys Asn 115 120 125 Phe Gly Asn Arg Ile Ile Ala Ile Thr Asn Asn Gly Asn Ser Thr Leu 130 135 140 Ala Lys Asn Ala Asp Ala Val Leu Glu Leu His Met Ala Asn Glu Thr 145 150 155 160 Cys Pro Asn Asn Leu Ala Pro Thr Thr Ser Thr Thr Leu Thr Met Ala 165 170 175 Ile Gly Asp Ala Leu Ala Ile Ala Met Ile His Gln Arg Lys Phe Met 180 185 190 Pro Asn Asp Phe Ala Arg Tyr His Pro Gly Gly Ser Leu Gly Arg Arg 195 200 205 Leu Leu Thr Arg Val Ala Asp Val Met Gln His Asp Val Pro Ala Val 210 215 220 Gln Leu Asp Ala Ser Phe Lys Thr Val Ile Gln Arg Ile Thr Ser Gly 225 230 235 240 Cys Gln Gly Met Val Met Val Glu Asp Ala Glu Gly Gly Leu Ala Gly 245 250 255 Ile Ile Thr Asp Gly Asp Leu Arg Arg Phe Met Glu Lys Glu Asp Ser 260 265 270 Leu Thr Ser Ala Thr Ala Ala Gln Met Met Thr Arg Glu Pro Leu Thr 275 280 285 Leu Pro Glu Asp Thr Met Ile Ile Glu Ala Glu Glu Lys Met Gln Lys 290 295 300 His Arg Val Ser Thr Leu Leu Val Thr Asn Lys Ala Asn Lys Val Thr 305 310 315 320 Gly Leu Val Arg Ile Phe Asp 325 <210> 3 <211> 1146 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 3 atgctgatca aagtgaaaag cgccgtctcg tggatgcgtg cgcgtctgag cgcgatcagc 60 ctggcagata ttcagaagca cctggcaaaa atcattattc tggcacccat ggcggtgctg 120 ctgatctact tggcgatctt ctcccagccc cgctatatgt cggaaagcaa ggtggccatc 180 aagcgcagcg acgatctcaa ctccggcagc ctgaacttcg gcctgctgtt gggtgcctcc 240 aacccgtcgt ccgccgaaga cgcactgtac ctgaaggaat acatcaacag cccggatatg 300 ctggccgcgc tggataaaca gctgaacttc cgcgaagcgt tctcccattc gggcctggac 360 ttcctgaacc atctgtccaa ggatgaaacc gccgaggggt tcctgaagta ctataaagat 420 cgcatcaacg tcagctacga cgacaagacc gggctgctga acatccagac ccagggcttt 480 tcgcccgagt tcgcgctgaa attcaaccag accgtgctca aggaatccga gcggttcatc 540 aatgaaatgt cgcaccgtat cgcccgcgat caattggcgt ttgcggaaac cgaaatggaa 600 aaagcgcgcc agcggctgga tgcatcgaaa gccgaattgt tgtcctacca agacaacaac 660 aatgtgctgg acccgcaggc acaggcccag gcggcatcca ccctggtgaa tacgctgatg 720 ggccagaaaa ttcagatgga agccgacctg cgcaacctgc tcacgtacct gcgcgaggat 780 gcgccccaag tcgtgagcgc ccgcaatgca attcagagcc tccaggcaca gatcgacgaa 840 gaaaagtcga aaattaccgc accccagggc gataaactga accgcatggc cgtggatttt 900 gaggagatca aatccaaggt cgagttcaat accgagttgt acaagctcac gctcaccagc 960 atcgaaaaga cccgtgtcga agcggcccgt aagctgaaag tcctgagcgt gatctcgtcc 1020 ccgcagctgc cccaggaaag ctccttcccg aatatcccgt atttgatcgc gtgttggctg 1080 ctggtgtgtt gcctgctctt tggcaccctg aaattgctcc tggcggtgat tgaagaccac 1140 cgtgac 1146 <210> 4 <211> 382 <212> PRT <213> Escherichia coli <400> 4 Met Leu Ile Lys Val Lys Ser Ala Val Ser Trp Met Arg Ala Arg Leu 1 5 10 15 Ser Ala Ile Ser Leu Ala Asp Ile Gln Lys His Leu Ala Lys Ile Ile 20 25 30 Ile Leu Ala Pro Met Ala Val Leu Leu Ile Tyr Leu Ala Ile Phe Ser 35 40 45 Gln Pro Arg Tyr Met Ser Glu Ser Lys Val Ala Ile Lys Arg Ser Asp 50 55 60 Asp Leu Asn Ser Gly Ser Leu Asn Phe Gly Leu Leu Leu Gly Ala Ser 65 70 75 80 Asn Pro Ser Ser Ala Glu Asp Ala Leu Tyr Leu Lys Glu Tyr Ile Asn 85 90 95 Ser Pro Asp Met Leu Ala Ala Leu Asp Lys Gln Leu Asn Phe Arg Glu 100 105 110 Ala Phe Ser His Ser Gly Leu Asp Phe Leu Asn His Leu Ser Lys Asp 115 120 125 Glu Thr Ala Glu Gly Phe Leu Lys Tyr Tyr Lys Asp Arg Ile Asn Val 130 135 140 Ser Tyr Asp Asp Lys Thr Gly Leu Leu Asn Ile Gln Thr Gln Gly Phe 145 150 155 160 Ser Pro Glu Phe Ala Leu Lys Phe Asn Gln Thr Val Leu Lys Glu Ser 165 170 175 Glu Arg Phe Ile Asn Glu Met Ser His Arg Ile Ala Arg Asp Gln Leu 180 185 190 Ala Phe Ala Glu Thr Glu Met Glu Lys Ala Arg Gln Arg Leu Asp Ala 195 200 205 Ser Lys Ala Glu Leu Leu Ser Tyr Gln Asp Asn Asn Asn Val Leu Asp 210 215 220 Pro Gln Ala Gln Ala Gln Ala Ala Ser Thr Leu Val Asn Thr Leu Met 225 230 235 240 Gly Gln Lys Ile Gln Met Glu Ala Asp Leu Arg Asn Leu Leu Thr Tyr 245 250 255 Leu Arg Glu Asp Ala Pro Gln Val Val Ser Ala Arg Asn Ala Ile Gln 260 265 270 Ser Leu Gln Ala Gln Ile Asp Glu Glu Lys Ser Lys Ile Thr Ala Pro 275 280 285 Gln Gly Asp Lys Leu Asn Arg Met Ala Val Asp Phe Glu Glu Ile Lys 290 295 300 Ser Lys Val Glu Phe Asn Thr Glu Leu Tyr Lys Leu Thr Leu Thr Ser 305 310 315 320 Ile Glu Lys Thr Arg Val Glu Ala Ala Arg Lys Leu Lys Val Leu Ser 325 330 335 Val Ile Ser Ser Pro Gln Leu Pro Gln Glu Ser Ser Phe Pro Asn Ile 340 345 350 Pro Tyr Leu Ile Ala Cys Trp Leu Leu Val Cys Cys Leu Leu Phe Gly 355 360 365 Thr Leu Lys Leu Leu Leu Ala Val Ile Glu Asp His Arg Asp 370 375 380 <210> 5 <211> 1674 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 5 atgaagctgt ttaagtcgat cctgctgatc gcagcgtgcc atgcagcaca ggcgagcgca 60 accatcgaca ttaatgccga tccgaacctc acgggtgccg caccgttgac cggcatcctg 120 aacgggcaga aaagcgacac ccagaacatg agcggcttcg ataacacccc gccccccgca 180 cccccggtcg tgatgagccg tatgttcggg gcgcagctgt tcaacggtac gagcgcagac 240 tcgggggcaa ccgtgggttt caatccggac tacatcctga atcccggcga ttccatccag 300 gtccgcctgt ggggtgcgtt caccttcgat ggcgcactcc aggtggaccc gaagggcaac 360 atcttcctgc cgaatgtcgg ccccgtcaaa gtcgcaggtg tgtcgaactc ccagttgaac 420 gcgctggtga cgagcaaggt gaaggaagtc taccagagca acgtgaacgt ctatgcgtcg 480 ctcttgcagg cgcagccggt caaggtctat gtgaccggct ttgtccgcaa ccccggcctg 540 tacggcggtg tcacctccga cagcctgctg aactacctga tcaaggcggg tggtgtggac 600 ccggaacgcg gcagctacgt ggacatcgtc gtgaaacgcg gcaatcgtgt gcgctcgaac 660 gtcaacctct atgacttcct gctcaacggc aaactggggc tgtcccagtt tgcggacggt 720 gatacgatca ttgtgggtcc gcgccagcat acgttctcgg tgcagggcga tgtgttcaat 780 tcctacgact ttgaatttcg cgaatcgagc atcccggtca ccgaagcact gtcctgggca 840 cgtcccaaac cgggtgcgac ccatatcacg attatgcgga agcagggcct ccagaagcgc 900 tcggaatatt atccgatctc gtccgcaccg gggcgtatgc tgcaaaacgg tgataccctc 960 attgtctcca ccgaccgcta tgcgggcacc attcaagtgc gtgtggaagg cgcacattcc 1020 ggggaacacg ccatggtgct gccctacggt agcaccatgc gggccgtgct cgaaaaagtg 1080 cgcccgaact ccatgtcgca gatgaacgcc gtgcagttgt atcggccgag cgtcgcgcaa 1140 cggcagaaag aaatgctgaa tttgtccctg caaaagctcg aagaggccag cctcagcgca 1200 cagagcagca ccaaggaaga ggccagcctg cgtatgcagg aagcccaact gatctcccgc 1260 ttcgtcgcga aagcccgcac cgtcgtgccg aagggcgaag tgatcctcaa tgaaagcaac 1320 attgactccg tcctcctgga ggacggcgac gtgatcaata ttcccgaaaa gacgtcgttg 1380 gtcatggtcc acggggaagt gctgttcccg aacgcggtgt cgtggcagaa aggtatgacg 1440 accgaggact acatcgagaa gtgcggtggg ctgacccaga agtccggcaa cgcccgtatt 1500 atcgtcatcc gtcagaacgg cgcagcggtg aacgcagaag acgtcgattc cctgaaaccc 1560 ggtgatgaaa ttatggtgtt gccgaaatac gagtcgaaga acatcgaagt gacgcgcggt 1620 atcagcacca ttctgtacca actggcggtg ggcgcgaaag tgattctgtc gctg 1674 <210> 6 <211> 558 <212> PRT <213> Escherichia coli <400> 6 Met Lys Leu Phe Lys Ser Ile Leu Leu Ile Ala Ala Cys His Ala Ala 1 5 10 15 Gln Ala Ser Ala Thr Ile Asp Ile Asn Ala Asp Pro Asn Leu Thr Gly 20 25 30 Ala Ala Pro Leu Thr Gly Ile Leu Asn Gly Gln Lys Ser Asp Thr Gln 35 40 45 Asn Met Ser Gly Phe Asp Asn Thr Pro Pro Pro Ala Pro Pro Val Val 50 55 60 Met Ser Arg Met Phe Gly Ala Gln Leu Phe Asn Gly Thr Ser Ala Asp 65 70 75 80 Ser Gly Ala Thr Val Gly Phe Asn Pro Asp Tyr Ile Leu Asn Pro Gly 85 90 95 Asp Ser Ile Gln Val Arg Leu Trp Gly Ala Phe Thr Phe Asp Gly Ala 100 105 110 Leu Gln Val Asp Pro Lys Gly Asn Ile Phe Leu Pro Asn Val Gly Pro 115 120 125 Val Lys Val Ala Gly Val Ser Asn Ser Gln Leu Asn Ala Leu Val Thr 130 135 140 Ser Lys Val Lys Glu Val Tyr Gln Ser Asn Val Asn Val Tyr Ala Ser 145 150 155 160 Leu Leu Gln Ala Gln Pro Val Lys Val Tyr Val Thr Gly Phe Val Arg 165 170 175 Asn Pro Gly Leu Tyr Gly Gly Val Thr Ser Asp Ser Leu Leu Asn Tyr 180 185 190 Leu Ile Lys Ala Gly Gly Val Asp Pro Glu Arg Gly Ser Tyr Val Asp 195 200 205 Ile Val Val Lys Arg Gly Asn Arg Val Arg Ser Asn Val Asn Leu Tyr 210 215 220 Asp Phe Leu Leu Asn Gly Lys Leu Gly Leu Ser Gln Phe Ala Asp Gly 225 230 235 240 Asp Thr Ile Ile Val Gly Pro Arg Gln His Thr Phe Ser Val Gln Gly 245 250 255 Asp Val Phe Asn Ser Tyr Asp Phe Glu Phe Arg Glu Ser Ser Ile Pro 260 265 270 Val Thr Glu Ala Leu Ser Trp Ala Arg Pro Lys Pro Gly Ala Thr His 275 280 285 Ile Thr Ile Met Arg Lys Gln Gly Leu Gln Lys Arg Ser Glu Tyr Tyr 290 295 300 Pro Ile Ser Ser Ala Pro Gly Arg Met Leu Gln Asn Gly Asp Thr Leu 305 310 315 320 Ile Val Ser Thr Asp Arg Tyr Ala Gly Thr Ile Gln Val Arg Val Glu 325 330 335 Gly Ala His Ser Gly Glu His Ala Met Val Leu Pro Tyr Gly Ser Thr 340 345 350 Met Arg Ala Val Leu Glu Lys Val Arg Pro Asn Ser Met Ser Gln Met 355 360 365 Asn Ala Val Gln Leu Tyr Arg Pro Ser Val Ala Gln Arg Gln Lys Glu 370 375 380 Met Leu Asn Leu Ser Leu Gln Lys Leu Glu Glu Ala Ser Leu Ser Ala 385 390 395 400 Gln Ser Ser Thr Lys Glu Glu Ala Ser Leu Arg Met Gln Glu Ala Gln 405 410 415 Leu Ile Ser Arg Phe Val Ala Lys Ala Arg Thr Val Val Pro Lys Gly 420 425 430 Glu Val Ile Leu Asn Glu Ser Asn Ile Asp Ser Val Leu Leu Glu Asp 435 440 445 Gly Asp Val Ile Asn Ile Pro Glu Lys Thr Ser Leu Val Met Val His 450 455 460 Gly Glu Val Leu Phe Pro Asn Ala Val Ser Trp Gln Lys Gly Met Thr 465 470 475 480 Thr Glu Asp Tyr Ile Glu Lys Cys Gly Gly Leu Thr Gln Lys Ser Gly 485 490 495 Asn Ala Arg Ile Ile Val Ile Arg Gln Asn Gly Ala Ala Val Asn Ala 500 505 510 Glu Asp Val Asp Ser Leu Lys Pro Gly Asp Glu Ile Met Val Leu Pro 515 520 525 Lys Tyr Glu Ser Lys Asn Ile Glu Val Thr Arg Gly Ile Ser Thr Ile 530 535 540 Leu Tyr Gln Leu Ala Val Gly Ala Lys Val Ile Leu Ser Leu 545 550 555 <210> 7 <211> 738 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 7 atgtcgaagg ccgtgattgt gatcccggca cgctacggca gcagccgtct gccgggcaaa 60 ccgctgctgg atatcgtcgg gaaaccgatg atccagcacg tctacgaacg ggccctgcaa 120 gtggcaggcg tggcagaggt gtgggtcgca accgacgacc cgcgtgtgga gcaggcagtc 180 caggcgttcg gcggcaaagc gatcatgacc cgcaacgatc atgagagcgg caccgatcgc 240 ctggtggaag tcatgcataa ggtggaggcg gatatctata tcaacctgca aggggatgag 300 ccgatgattc gcccgcgtga cgtcgaaacc ctgctgcaag gtatgcggga cgacccggcg 360 ctgccggtgg cgaccctgtg tcatgcgatc agcgcggcag aagccgccga accgtccacc 420 gtcaaggtcg tggtgaacac gcggcaggac gccctgtatt tctcccgctc ccccattccg 480 tacccgcgca acgccgagaa ggcgcgctac ctgaagcacg tcgggatcta cgcctatcgg 540 cgggatgtcc tgcaaaatta cagccagttg ccggagtcca tgcccgaaca ggccgaatcc 600 ctggagcaac tgcggctgat gagcgcgggc attaacattc gcaccttcga ggtcgccgcg 660 accggtcccg gcgtcgatac cccggcgtgc ttggagaagg tccgggccct gatggcgcag 720 gagctcgcgg agaacgca 738 <210> 8 <211> 246 <212> PRT <213> Escherichia coli <400> 8 Met Ser Lys Ala Val Ile Val Ile Pro Ala Arg Tyr Gly Ser Ser Arg 1 5 10 15 Leu Pro Gly Lys Pro Leu Leu Asp Ile Val Gly Lys Pro Met Ile Gln 20 25 30 His Val Tyr Glu Arg Ala Leu Gln Val Ala Gly Val Ala Glu Val Trp 35 40 45 Val Ala Thr Asp Asp Pro Arg Val Glu Gln Ala Val Gln Ala Phe Gly 50 55 60 Gly Lys Ala Ile Met Thr Arg Asn Asp His Glu Ser Gly Thr Asp Arg 65 70 75 80 Leu Val Glu Val Met His Lys Val Glu Ala Asp Ile Tyr Ile Asn Leu 85 90 95 Gln Gly Asp Glu Pro Met Ile Arg Pro Arg Asp Val Glu Thr Leu Leu 100 105 110 Gln Gly Met Arg Asp Asp Pro Ala Leu Pro Val Ala Thr Leu Cys His 115 120 125 Ala Ile Ser Ala Ala Glu Ala Ala Glu Pro Ser Thr Val Lys Val Val 130 135 140 Val Asn Thr Arg Gln Asp Ala Leu Tyr Phe Ser Arg Ser Pro Ile Pro 145 150 155 160 Tyr Pro Arg Asn Ala Glu Lys Ala Arg Tyr Leu Lys His Val Gly Ile 165 170 175 Tyr Ala Tyr Arg Arg Asp Val Leu Gln Asn Tyr Ser Gln Leu Pro Glu 180 185 190 Ser Met Pro Glu Gln Ala Glu Ser Leu Glu Gln Leu Arg Leu Met Ser 195 200 205 Ala Gly Ile Asn Ile Arg Thr Phe Glu Val Ala Ala Thr Gly Pro Gly 210 215 220 Val Asp Thr Pro Ala Cys Leu Glu Lys Val Arg Ala Leu Met Ala Gln 225 230 235 240 Glu Leu Ala Glu Asn Ala 245 <210> 9 <211> 2025 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 9 atgattggca tttatagccc cggcatttgg cgtattccgc acctggaaaa attcctcgcc 60 cagccctgcc aaaagctgtc gctgctgcgc ccggtcccgc aggaagtgga tgcaatcgcg 120 gtgtgggggc accgcccctc ggccgcaaag ccggtggcca tcgccaaagc cgcaggcaag 180 ccggtgatcc gcttggagga tggtttcgtc cgctcgctgg acctgggcgt gaacggtgaa 240 ccgcccctct cgctcgtcgt ggatgactgc ggcatttact acgacgcctc gaaaccgagc 300 gcgctggaaa aactcgtgca ggacaaggcc ggcaacgcgg ccctggcgga tcaggcgcgc 360 gaggcgatgc acaccattgt gacgggcgac atgagcaagt acaacctggc accggcgttc 420 gtggcggatg aaagcgagcg cacgaacatc gtgctggtgg tggaccagac cttcaatgac 480 atgagcgtga cctacggcaa cgcaggcccc catgagttcg ccgcaatgct ggaagcagcg 540 atggcggaaa acccgcaggc agaaatctgg gtcaaagtgc atcccgatgt cctggaaggg 600 aaaaagaccg gctacttcgc ggacttgcgt gccacccagc gcgtgcgcct gattgcggaa 660 aacgtgtcgc cgcagtccct gctgcgtcat gtgtcccgcg tgtacgtcgt gacctcccag 720 tacggttttg aagccctgct ggccggtaag cccgtgacct gctttggcca accctggtat 780 gcagggtggg gcctcaccga tgaccgccac ccccaatcgg cgctgctgtc ggcgcgtcgc 840 ggctcggcca ccctggagga actgttcgca gcggcctatc tgcgctattg ccgctacatt 900 gatccgcaga ccggggaggt gtcggccctg ttcacggtgc tccaatggct ccagctgcaa 960 cgtcgtcacc tgcaacagcg gaatggttat ctctgggtgc cgggcctgac cctgtggaaa 1020 agcgcgatcc tgaagccctt cctgcaaacg gccacgaatc gtctctcctt ttcccgtcgc 1080 tgtaccgcag caagcgcctg cgtcgtgtgg ggcgtgaaag gcgaacagca atggcgtgcg 1140 gaggcacagc gcaaatccct gccgctgtgg cgcatggaag acggcttcct gcgcagctcc 1200 ggcctgggga gcgatctgct gccgccgttg agcctggtcc tggataagcg cggtatctat 1260 tacgatgcca cccgtccgtc ggaactggag gtcctgctga atcacagcca gctgaccctc 1320 gcgcaccaga tgcgcgcgga aaagttgcgc caacgtctgg tggaaagcaa attgagcaaa 1380 tataacctgg gggccgattt cagcctcccg gcagaagcga aggacaagaa agtcatcctg 1440 gtgccgggcc aggtggaaga cgatgcgtcg attaagacgg gcaccgtgtc gatcaagtcg 1500 aatctggagc tgctgcgcac cgtgcgggaa cgtaatccgc acgcctacat catctacaag 1560 ccgcaccccg atgtgctcgt cggcaaccgt aagggtgaca ttccggcgga acagatcgcg 1620 gaactcgcag actaccaggc actggatgcc gatatcattc agtgtattca gcgtgcggac 1680 gaggtgcaca cgatgacgag cctcagcggc tttgaagcat tgctgcacgg taaacaggtg 1740 cactgctacg gcctgccgtt ctacgcctcg tggggcctga ccgtcgatga gcaccactgc 1800 ccccgtcgcg agcggcggct gaccatcgcc gacctgatct atcaagccct gattgtctat 1860 cccacctata ttcatccgac gcggttgcag ccgatcacgg tggaggaagc ggcagaatat 1920 ctgatcaaaa cgccccgcaa acccatcttt atcacccgca agaaagccgg ccgtgtgatt 1980 cgctactatc gcaagttgat catgttctgc aaagtgcgct ttggt 2025 <210> 10 <211> 675 <212> PRT <213> Escherichia coli <400> 10 Met Ile Gly Ile Tyr Ser Pro Gly Ile Trp Arg Ile Pro His Leu Glu 1 5 10 15 Lys Phe Leu Ala Gln Pro Cys Gln Lys Leu Ser Leu Leu Arg Pro Val 20 25 30 Pro Gln Glu Val Asp Ala Ile Ala Val Trp Gly His Arg Pro Ser Ala 35 40 45 Ala Lys Pro Val Ala Ile Ala Lys Ala Ala Gly Lys Pro Val Ile Arg 50 55 60 Leu Glu Asp Gly Phe Val Arg Ser Leu Asp Leu Gly Val Asn Gly Glu 65 70 75 80 Pro Pro Leu Ser Leu Val Val Asp Asp Cys Gly Ile Tyr Tyr Asp Ala 85 90 95 Ser Lys Pro Ser Ala Leu Glu Lys Leu Val Gln Asp Lys Ala Gly Asn 100 105 110 Ala Ala Leu Ala Asp Gln Ala Arg Glu Ala Met His Thr Ile Val Thr 115 120 125 Gly Asp Met Ser Lys Tyr Asn Leu Ala Pro Ala Phe Val Ala Asp Glu 130 135 140 Ser Glu Arg Thr Asn Ile Val Leu Val Val Asp Gln Thr Phe Asn Asp 145 150 155 160 Met Ser Val Thr Tyr Gly Asn Ala Gly Pro His Glu Phe Ala Ala Met 165 170 175 Leu Glu Ala Ala Met Ala Glu Asn Pro Gln Ala Glu Ile Trp Val Lys 180 185 190 Val His Pro Asp Val Leu Glu Gly Lys Lys Thr Gly Tyr Phe Ala Asp 195 200 205 Leu Arg Ala Thr Gln Arg Val Arg Leu Ile Ala Glu Asn Val Ser Pro 210 215 220 Gln Ser Leu Leu Arg His Val Ser Arg Val Tyr Val Val Thr Ser Gln 225 230 235 240 Tyr Gly Phe Glu Ala Leu Leu Ala Gly Lys Pro Val Thr Cys Phe Gly 245 250 255 Gln Pro Trp Tyr Ala Gly Trp Gly Leu Thr Asp Asp Arg His Pro Gln 260 265 270 Ser Ala Leu Leu Ser Ala Arg Arg Gly Ser Ala Thr Leu Glu Glu Leu 275 280 285 Phe Ala Ala Ala Tyr Leu Arg Tyr Cys Arg Tyr Ile Asp Pro Gln Thr 290 295 300 Gly Glu Val Ser Ala Leu Phe Thr Val Leu Gln Trp Leu Gln Leu Gln 305 310 315 320 Arg Arg His Leu Gln Gln Arg Asn Gly Tyr Leu Trp Val Pro Gly Leu 325 330 335 Thr Leu Trp Lys Ser Ala Ile Leu Lys Pro Phe Leu Gln Thr Ala Thr 340 345 350 Asn Arg Leu Ser Phe Ser Arg Arg Cys Thr Ala Ala Ser Ala Cys Val 355 360 365 Val Trp Gly Val Lys Gly Glu Gln Gln Trp Arg Ala Glu Ala Gln Arg 370 375 380 Lys Ser Leu Pro Leu Trp Arg Met Glu Asp Gly Phe Leu Arg Ser Ser 385 390 395 400 Gly Leu Gly Ser Asp Leu Leu Pro Pro Leu Ser Leu Val Leu Asp Lys 405 410 415 Arg Gly Ile Tyr Tyr Asp Ala Thr Arg Pro Ser Glu Leu Glu Val Leu 420 425 430 Leu Asn His Ser Gln Leu Thr Leu Ala His Gln Met Arg Ala Glu Lys 435 440 445 Leu Arg Gln Arg Leu Val Glu Ser Lys Leu Ser Lys Tyr Asn Leu Gly 450 455 460 Ala Asp Phe Ser Leu Pro Ala Glu Ala Lys Asp Lys Lys Val Ile Leu 465 470 475 480 Val Pro Gly Gln Val Glu Asp Asp Ala Ser Ile Lys Thr Gly Thr Val 485 490 495 Ser Ile Lys Ser Asn Leu Glu Leu Leu Arg Thr Val Arg Glu Arg Asn 500 505 510 Pro His Ala Tyr Ile Ile Tyr Lys Pro His Pro Asp Val Leu Val Gly 515 520 525 Asn Arg Lys Gly Asp Ile Pro Ala Glu Gln Ile Ala Glu Leu Ala Asp 530 535 540 Tyr Gln Ala Leu Asp Ala Asp Ile Ile Gln Cys Ile Gln Arg Ala Asp 545 550 555 560 Glu Val His Thr Met Thr Ser Leu Ser Gly Phe Glu Ala Leu Leu His 565 570 575 Gly Lys Gln Val His Cys Tyr Gly Leu Pro Phe Tyr Ala Ser Trp Gly 580 585 590 Leu Thr Val Asp Glu His His Cys Pro Arg Arg Glu Arg Arg Leu Thr 595 600 605 Ile Ala Asp Leu Ile Tyr Gln Ala Leu Ile Val Tyr Pro Thr Tyr Ile 610 615 620 His Pro Thr Arg Leu Gln Pro Ile Thr Val Glu Glu Ala Ala Glu Tyr 625 630 635 640 Leu Ile Lys Thr Pro Arg Lys Pro Ile Phe Ile Thr Arg Lys Lys Ala 645 650 655 Gly Arg Val Ile Arg Tyr Tyr Arg Lys Leu Ile Met Phe Cys Lys Val 660 665 670 Arg Phe Gly 675 <210> 11 <211> 1209 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 11 atgcacggca atgcgctgac ggtgctgttg agcggtaaaa agtacctcct gctccaaggt 60 ccgatgggtc cgttcttcaa cgatgtggcg gaatggttgg agagcctcgg tcgcaacgcg 120 gtcaacgtcg tctttaatgg cggtgatcgc ttctactgcc gccaccgcca atacctggcg 180 tactaccaaa ccccgaagga gttccccggt tggctgcggg acttgcatcg tcagtatgac 240 tttgacacga ttttgtgttt cggtgactgc cgcctgctgc acaaggaggc caaacgctgg 300 gccaagtcga aggggattcg ttttctggcc ttcgaggaag gctacctgcg tccgcaattt 360 atcaccgtgg aagaaggcgg tgtgaacgcc tatagcagct tgccccgcga tccggacttt 420 taccgcaaat tgcccgatat gccgacgccg cacgtcgaga acctgaaacc gagcaccatg 480 aagcgcatcg gccacgccat gtggtattac ctgatgggtt ggcactatcg tcacgaattt 540 ccgcgctatc gccaccacaa atcgttcagc ccgtggtatg aagcgcgctg ctgggtccgc 600 gcctactggc gcaaacagct gtataaggtc acccaacgca aggtcctccc ccgcctgatg 660 aacgagctgg atcagcgcta ttacctggcg gtcctgcaag tgtacaacga cagccagatc 720 cgcaaccata gcaactataa tgatgtgcgt gattacatca acgaagtgat gtacagcttt 780 tcccgcaagg cccccaagga gtcctatctg gtgatcaaac atcacccgat ggatcgcggg 840 caccgcctgt accgcccgtt gatcaagcgt ctgtcgaagg aatacggttt ggatgaacgt 900 gtcatctatg tgcacgatct gcccatgccg gagctgttgc gccacgccaa agcggtggtc 960 accatcaata gcacggccgg catttccgcg ttgatccaca acaagcccct gaaagtcatg 1020 ggcaacgcct tgtacgatat caagggtctg acgtaccagg ggcatttgca tcagttctgg 1080 caagccgact ttaaaccgaa catgaagttg tttaagaaat ttcgcggcta cttgctggtg 1140 aagacccagg tcaatgcggt gtactacggc gaaatgatct ttaacaaaat taagaagtat 1200 aagaaacgt 1209 <210> 12 <211> 403 <212> PRT <213> Escherichia coli <400> 12 Met His Gly Asn Ala Leu Thr Val Leu Leu Ser Gly Lys Lys Tyr Leu 1 5 10 15 Leu Leu Gln Gly Pro Met Gly Pro Phe Phe Asn Asp Val Ala Glu Trp 20 25 30 Leu Glu Ser Leu Gly Arg Asn Ala Val Asn Val Val Phe Asn Gly Gly 35 40 45 Asp Arg Phe Tyr Cys Arg His Arg Gln Tyr Leu Ala Tyr Tyr Gln Thr 50 55 60 Pro Lys Glu Phe Pro Gly Trp Leu Arg Asp Leu His Arg Gln Tyr Asp 65 70 75 80 Phe Asp Thr Ile Leu Cys Phe Gly Asp Cys Arg Leu Leu His Lys Glu 85 90 95 Ala Lys Arg Trp Ala Lys Ser Lys Gly Ile Arg Phe Leu Ala Phe Glu 100 105 110 Glu Gly Tyr Leu Arg Pro Gln Phe Ile Thr Val Glu Glu Gly Gly Val 115 120 125 Asn Ala Tyr Ser Ser Leu Pro Arg Asp Pro Asp Phe Tyr Arg Lys Leu 130 135 140 Pro Asp Met Pro Thr Pro His Val Glu Asn Leu Lys Pro Ser Thr Met 145 150 155 160 Lys Arg Ile Gly His Ala Met Trp Tyr Tyr Leu Met Gly Trp His Tyr 165 170 175 Arg His Glu Phe Pro Arg Tyr Arg His His Lys Ser Phe Ser Pro Trp 180 185 190 Tyr Glu Ala Arg Cys Trp Val Arg Ala Tyr Trp Arg Lys Gln Leu Tyr 195 200 205 Lys Val Thr Gln Arg Lys Val Leu Pro Arg Leu Met Asn Glu Leu Asp 210 215 220 Gln Arg Tyr Tyr Leu Ala Val Leu Gln Val Tyr Asn Asp Ser Gln Ile 225 230 235 240 Arg Asn His Ser Asn Tyr Asn Asp Val Arg Asp Tyr Ile Asn Glu Val 245 250 255 Met Tyr Ser Phe Ser Arg Lys Ala Pro Lys Glu Ser Tyr Leu Val Ile 260 265 270 Lys His His Pro Met Asp Arg Gly His Arg Leu Tyr Arg Pro Leu Ile 275 280 285 Lys Arg Leu Ser Lys Glu Tyr Gly Leu Asp Glu Arg Val Ile Tyr Val 290 295 300 His Asp Leu Pro Met Pro Glu Leu Leu Arg His Ala Lys Ala Val Val 305 310 315 320 Thr Ile Asn Ser Thr Ala Gly Ile Ser Ala Leu Ile His Asn Lys Pro 325 330 335 Leu Lys Val Met Gly Asn Ala Leu Tyr Asp Ile Lys Gly Leu Thr Tyr 340 345 350 Gln Gly His Leu His Gln Phe Trp Gln Ala Asp Phe Lys Pro Asn Met 355 360 365 Lys Leu Phe Lys Lys Phe Arg Gly Tyr Leu Leu Val Lys Thr Gln Val 370 375 380 Asn Ala Val Tyr Tyr Gly Glu Met Ile Phe Asn Lys Ile Lys Lys Tyr 385 390 395 400 Lys Lys Arg <210> 13 <211> 774 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 13 atggcacgtt cgggttttga agtccagaaa gtgacggtcg aagcactgtt tctccgcgaa 60 atccgtacgc gctttggcaa gtttcgcctg ggctatctgt gggcgatcct ggaaccgagc 120 gcacatctgc tgattctgct cgggatcttt ggctatatca tgcatcgcac catgccggat 180 atctccttcc cggtgttcct gctcaatggc ctgatcccgt tctttatttt cagcagcatc 240 agcaatcgct ccgtgggcgc catcgaagcc aatcaggggc tgtttaacta ccggcccgtg 300 aagccgatcg acacgatcat tgcacgcgcc ctcttggaaa cgctgatcta tgtggcggtc 360 tacatcctcc tgatgctgat catctggatg gcgggcgaat atttcgagat taccaacttc 420 ctgcaatttg tgctcacctg gagcctcctg atcatcctgt cgtgcggtgt gggcctgatc 480 ttcatggtcg tgggcaagac gttccccgaa atgcagaaag tcttgccgat cttgctgaag 540 ccgctgtact ttatttcgtg catcatgttc ccgctgcact ccattccgaa gcagtattgg 600 tcgtacctgc tgtggaatcc cctggtgcac gtcgtcgaac tgagccgcga ggccgtgatg 660 cccggttata tcagcgaagg ggtcagcctg aattatctgg caatgttcac cctggtgacc 720 ctgtttattg gtttggccct gtaccgtacg cgtgaggagg caatgttgac ctca 774 <210> 14 <211> 258 <212> PRT <213> Escherichia coli <400> 14 Met Ala Arg Ser Gly Phe Glu Val Gln Lys Val Thr Val Glu Ala Leu 1 5 10 15 Phe Leu Arg Glu Ile Arg Thr Arg Phe Gly Lys Phe Arg Leu Gly Tyr 20 25 30 Leu Trp Ala Ile Leu Glu Pro Ser Ala His Leu Leu Ile Leu Leu Gly 35 40 45 Ile Phe Gly Tyr Ile Met His Arg Thr Met Pro Asp Ile Ser Phe Pro 50 55 60 Val Phe Leu Leu Asn Gly Leu Ile Pro Phe Phe Ile Phe Ser Ser Ile 65 70 75 80 Ser Asn Arg Ser Val Gly Ala Ile Glu Ala Asn Gln Gly Leu Phe Asn 85 90 95 Tyr Arg Pro Val Lys Pro Ile Asp Thr Ile Ile Ala Arg Ala Leu Leu 100 105 110 Glu Thr Leu Ile Tyr Val Ala Val Tyr Ile Leu Leu Met Leu Ile Ile 115 120 125 Trp Met Ala Gly Glu Tyr Phe Glu Ile Thr Asn Phe Leu Gln Phe Val 130 135 140 Leu Thr Trp Ser Leu Leu Ile Ile Leu Ser Cys Gly Val Gly Leu Ile 145 150 155 160 Phe Met Val Val Gly Lys Thr Phe Pro Glu Met Gln Lys Val Leu Pro 165 170 175 Ile Leu Leu Lys Pro Leu Tyr Phe Ile Ser Cys Ile Met Phe Pro Leu 180 185 190 His Ser Ile Pro Lys Gln Tyr Trp Ser Tyr Leu Leu Trp Asn Pro Leu 195 200 205 Val His Val Val Glu Leu Ser Arg Glu Ala Val Met Pro Gly Tyr Ile 210 215 220 Ser Glu Gly Val Ser Leu Asn Tyr Leu Ala Met Phe Thr Leu Val Thr 225 230 235 240 Leu Phe Ile Gly Leu Ala Leu Tyr Arg Thr Arg Glu Glu Ala Met Leu 245 250 255 Thr Ser <210> 15 <211> 666 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 15 atgattaaga tcgaaaacct gacgaaaagc taccgcaccc cggtgggccg tcactatgtc 60 ttcaagaacc tgaacattga gatccccagc ggcaaaagcg tggcgttcat cgggcgcaat 120 ggggcgggta aatccacgct gttgcgcatg attgggggca tcgaccgccc ggatagcggt 180 aaaatcatca cgaataaaac gatctcgtgg ccggtgggtc tggcaggcgg cttccagggc 240 agcttgaccg ggcgtgaaaa cgtgaagttc gtggcccggc tgtacgcgaa gcaggaggag 300 ctgaaagaaa agattgagtt tgtggaagag ttcgcggagc tggggaagta ttttgatatg 360 ccgatcaaga cctattcgag cggtatgcgc agccgcctcg gcttcggcct gagcatggcg 420 ttcaagttcg attactacat cgtggacgag gtgacggcgg tgggggacgc ccgtttcaag 480 gaaaaatgtg cccaactctt caaggagcgt cataaggaaa gctccttcct catggtgtcg 540 cactcgctga actcgttgaa agagttctgc gatgtggcaa tcgtgtttaa agacgacaac 600 gccgtgtcgt tccatgaaga cgtgcaagaa ggcattgaag aatatatcac cgaacaaaac 660 aactac 666 <210> 16 <211> 222 <212> PRT <213> Escherichia coli <400> 16 Met Ile Lys Ile Glu Asn Leu Thr Lys Ser Tyr Arg Thr Pro Val Gly 1 5 10 15 Arg His Tyr Val Phe Lys Asn Leu Asn Ile Glu Ile Pro Ser Gly Lys 20 25 30 Ser Val Ala Phe Ile Gly Arg Asn Gly Ala Gly Lys Ser Thr Leu Leu 35 40 45 Arg Met Ile Gly Gly Ile Asp Arg Pro Asp Ser Gly Lys Ile Ile Thr 50 55 60 Asn Lys Thr Ile Ser Trp Pro Val Gly Leu Ala Gly Gly Phe Gln Gly 65 70 75 80 Ser Leu Thr Gly Arg Glu Asn Val Lys Phe Val Ala Arg Leu Tyr Ala 85 90 95 Lys Gln Glu Glu Leu Lys Glu Lys Ile Glu Phe Val Glu Glu Phe Ala 100 105 110 Glu Leu Gly Lys Tyr Phe Asp Met Pro Ile Lys Thr Tyr Ser Ser Gly 115 120 125 Met Arg Ser Arg Leu Gly Phe Gly Leu Ser Met Ala Phe Lys Phe Asp 130 135 140 Tyr Tyr Ile Val Asp Glu Val Thr Ala Val Gly Asp Ala Arg Phe Lys 145 150 155 160 Glu Lys Cys Ala Gln Leu Phe Lys Glu Arg His Lys Glu Ser Ser Phe 165 170 175 Leu Met Val Ser His Ser Leu Asn Ser Leu Lys Glu Phe Cys Asp Val 180 185 190 Ala Ile Val Phe Lys Asp Asp Asn Ala Val Ser Phe His Glu Asp Val 195 200 205 Gln Glu Gly Ile Glu Glu Tyr Ile Thr Glu Gln Asn Asn Tyr 210 215 220 <210> 17 <211> 1017 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 17 atgaacatcc tggtcaccgg cggtgcaggc tacatcggca gccacacgtc gctctgcctg 60 ctgaacaaag gctacaatgt cgtcatcatt gacaatctca tcaacagcag ctgcgaaagc 120 atccgtcgca ttgagctgat cgcaaagaag aaagtcacgt tctacgaact caatatcaac 180 aacgagaagg aagtgaacca gatcctgaag aaacacaaat tcgactgcat catgcacttt 240 gcaggtgcga aatcggtcgc agaaagcctg atcaagccca tcttctacta tgacaacaac 300 gtgagcggca ccctgcaact catcaattgc gccatcaaga acgacgtcgc caacttcatc 360 tttagctcgt cggcgacggt gtatggggaa agcaagatca tgcccgtcac cgaagactgc 420 catattggtg gcacgctgaa tccgtatggt acgtccaagt acatctcgga gctgatgatc 480 cgcgacatcg ccaagaaata ctccgacacg aatttcctct gcttgcgcta ctttaatccg 540 acgggcgccc acgaatccgg tatgattggt gaaagcccgg cagacatccc ctccaacttg 600 gtgccgtaca tcttgcaggt cgcgatgggg aaactggaaa aactgatggt gttcggtggt 660 gattatccca ccaaagacgg cacgggggtc cgtgactata tccatgtgat ggacctggcc 720 gaagggcacg tcgcagcgct gtcctatctc ttccgcgaca ataacaccaa ctaccacgtc 780 tttaatttgg gcacgggtaa aggttattcg gtgctggaac tggtgtccac ctttgaaaag 840 atttccggcg tgcggattcc gtatgaaatc gtgagccgcc gtgacggtga tatcgcggag 900 agctggtcct cccccgaaaa ggccaacaaa tatctgaact ggaaagccaa gcgggaactc 960 gaaaccatgc tggaggacgc ctggcgctgg cagatgaaga atccgaatgg ctatatt 1017 <210> 18 <211> 339 <212> PRT <213> Escherichia coli <400> 18 Met Asn Ile Leu Val Thr Gly Gly Ala Gly Tyr Ile Gly Ser His Thr 1 5 10 15 Ser Leu Cys Leu Leu Asn Lys Gly Tyr Asn Val Val Ile Ile Asp Asn 20 25 30 Leu Ile Asn Ser Ser Cys Glu Ser Ile Arg Arg Ile Glu Leu Ile Ala 35 40 45 Lys Lys Lys Val Thr Phe Tyr Glu Leu Asn Ile Asn Asn Glu Lys Glu 50 55 60 Val Asn Gln Ile Leu Lys Lys His Lys Phe Asp Cys Ile Met His Phe 65 70 75 80 Ala Gly Ala Lys Ser Val Ala Glu Ser Leu Ile Lys Pro Ile Phe Tyr 85 90 95 Tyr Asp Asn Asn Val Ser Gly Thr Leu Gln Leu Ile Asn Cys Ala Ile 100 105 110 Lys Asn Asp Val Ala Asn Phe Ile Phe Ser Ser Ser Ala Thr Val Tyr 115 120 125 Gly Glu Ser Lys Ile Met Pro Val Thr Glu Asp Cys His Ile Gly Gly 130 135 140 Thr Leu Asn Pro Tyr Gly Thr Ser Lys Tyr Ile Ser Glu Leu Met Ile 145 150 155 160 Arg Asp Ile Ala Lys Lys Tyr Ser Asp Thr Asn Phe Leu Cys Leu Arg 165 170 175 Tyr Phe Asn Pro Thr Gly Ala His Glu Ser Gly Met Ile Gly Glu Ser 180 185 190 Pro Ala Asp Ile Pro Ser Asn Leu Val Pro Tyr Ile Leu Gln Val Ala 195 200 205 Met Gly Lys Leu Glu Lys Leu Met Val Phe Gly Gly Asp Tyr Pro Thr 210 215 220 Lys Asp Gly Thr Gly Val Arg Asp Tyr Ile His Val Met Asp Leu Ala 225 230 235 240 Glu Gly His Val Ala Ala Leu Ser Tyr Leu Phe Arg Asp Asn Asn Thr 245 250 255 Asn Tyr His Val Phe Asn Leu Gly Thr Gly Lys Gly Tyr Ser Val Leu 260 265 270 Glu Leu Val Ser Thr Phe Glu Lys Ile Ser Gly Val Arg Ile Pro Tyr 275 280 285 Glu Ile Val Ser Arg Arg Asp Gly Asp Ile Ala Glu Ser Trp Ser Ser 290 295 300 Pro Glu Lys Ala Asn Lys Tyr Leu Asn Trp Lys Ala Lys Arg Glu Leu 305 310 315 320 Glu Thr Met Leu Glu Asp Ala Trp Arg Trp Gln Met Lys Asn Pro Asn 325 330 335 Gly Tyr Ile <210> 19 <211> 1638 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 19 atgaaccgcc tggtgatcgt gggccatccg agcagcaact accaaatcgt ggaagaactc 60 ctgcatcagc gcggcatgaa ctccctgtgc ccgtccaaac gtgagaacct ctcgccccag 120 gacatcaccc agacgctgcg gaaggcgtac cagtcgccgg acatctatac ggtgaccgat 180 tccgccgact ttgaaccgct ccatgtgagc accgtctgga acggtatcgc attggatctg 240 atgctgtcca acctgaacca gaaactgtgc ggttggagcg accccaacgc aattcacacg 300 ttggaatatt ggaaatcggt ggatgagaac atcaccttta tcctcatcta cgaccacccc 360 aaaagcatcc tgacgaacta cttctcggac cagaacatct ccagcaacta tacctcggag 420 catctgatca aaaactggct ggcatacaac accgccttgc tgcacttctt cctcaacaac 480 cggggtcggt gcctgctggt gtcgagcgaa caggtgaagc gcaacgccga ggactgcatc 540 cagcaactgc aacacaaact gaaactgaaa ttcgggttgt cgttctccaa taccatcaac 600 cactcgctgg agcagagcgt gaatgacttt aagaccgccg aagcctccat tacgctggaa 660 aaagaacatc aggagatcat gtccctcagc ggtattgaca tcgggaccgg ggatatcatt 720 ttcaagcaaa gcgagacgga ggagtacttg atcttcaacg tcctgaacga ctatcccgat 780 tgcaaggaac tgtactttga attgcaatcg aacgccaaca cccccttgcg ggtgctggag 840 aaggaaaact ataagccgtc ctttatttgg gagacgttca ttaaacaacg ccagatcacc 900 ctcgatatcg tgaacggtct gtaccagagc agcaaaaaga tcattctgga caacgaactg 960 cacacgtcca aacagctgaa cgcctatcaa gccattctga aagagctgtc ggatagcaag 1020 gaagaactga tccagtatga tctgatcatt aaaaacaaaa ccatccaggt ccaggaactg 1080 gagtgcgcga tcgagaactt cgagtccctg ctgaaaaagg aacagaacaa aaatgaactg 1140 caacaacagc gcctcgaaaa gctgtcgtgc gaaaaagaat tgctgctcaa tcagctgcat 1200 ctggtgcagc aaaagctcga acagtacttc atcgacaatc aacgtctcga aaagaaacaa 1260 ctgccggagc tgtatggtgc ggccgaacgc atcaagcaag atatcggcta ccgcctgggt 1320 gcggtgatgg tgagccgctc caagacgttc ctcggtctga tctcgattcc gtttgcgttg 1380 atcagcgaat ggcggacctg gaagaagaaa tatgattcgg agtaccaagt gagcctgccg 1440 agcatcttcc tgtacgcgga taaacacgaa gccgaacggg tcaagaaaca cctgagctat 1500 cagctgggca agctcatcat caataagaac aattttccgc tcggtctgat cagcctgccc 1560 tttagcatct accgtaccat ccgccaattc aaacgcacca aaaacaattc ccaggtgggt 1620 gtcaagtact gcggtaag 1638 <210> 20 <211> 546 <212> PRT <213> Escherichia coli <400> 20 Met Asn Arg Leu Val Ile Val Gly His Pro Ser Ser Asn Tyr Gln Ile 1 5 10 15 Val Glu Glu Leu Leu His Gln Arg Gly Met Asn Ser Leu Cys Pro Ser 20 25 30 Lys Arg Glu Asn Leu Ser Pro Gln Asp Ile Thr Gln Thr Leu Arg Lys 35 40 45 Ala Tyr Gln Ser Pro Asp Ile Tyr Thr Val Thr Asp Ser Ala Asp Phe 50 55 60 Glu Pro Leu His Val Ser Thr Val Trp Asn Gly Ile Ala Leu Asp Leu 65 70 75 80 Met Leu Ser Asn Leu Asn Gln Lys Leu Cys Gly Trp Ser Asp Pro Asn 85 90 95 Ala Ile His Thr Leu Glu Tyr Trp Lys Ser Val Asp Glu Asn Ile Thr 100 105 110 Phe Ile Leu Ile Tyr Asp His Pro Lys Ser Ile Leu Thr Asn Tyr Phe 115 120 125 Ser Asp Gln Asn Ile Ser Ser Asn Tyr Thr Ser Glu His Leu Ile Lys 130 135 140 Asn Trp Leu Ala Tyr Asn Thr Ala Leu Leu His Phe Phe Leu Asn Asn 145 150 155 160 Arg Gly Arg Cys Leu Leu Val Ser Ser Glu Gln Val Lys Arg Asn Ala 165 170 175 Glu Asp Cys Ile Gln Gln Leu Gln His Lys Leu Lys Leu Lys Phe Gly 180 185 190 Leu Ser Phe Ser Asn Thr Ile Asn His Ser Leu Glu Gln Ser Val Asn 195 200 205 Asp Phe Lys Thr Ala Glu Ala Ser Ile Thr Leu Glu Lys Glu His Gln 210 215 220 Glu Ile Met Ser Leu Ser Gly Ile Asp Ile Gly Thr Gly Asp Ile Ile 225 230 235 240 Phe Lys Gln Ser Glu Thr Glu Glu Tyr Leu Ile Phe Asn Val Leu Asn 245 250 255 Asp Tyr Pro Asp Cys Lys Glu Leu Tyr Phe Glu Leu Gln Ser Asn Ala 260 265 270 Asn Thr Pro Leu Arg Val Leu Glu Lys Glu Asn Tyr Lys Pro Ser Phe 275 280 285 Ile Trp Glu Thr Phe Ile Lys Gln Arg Gln Ile Thr Leu Asp Ile Val 290 295 300 Asn Gly Leu Tyr Gln Ser Ser Lys Lys Ile Ile Leu Asp Asn Glu Leu 305 310 315 320 His Thr Ser Lys Gln Leu Asn Ala Tyr Gln Ala Ile Leu Lys Glu Leu 325 330 335 Ser Asp Ser Lys Glu Glu Leu Ile Gln Tyr Asp Leu Ile Ile Lys Asn 340 345 350 Lys Thr Ile Gln Val Gln Glu Leu Glu Cys Ala Ile Glu Asn Phe Glu 355 360 365 Ser Leu Leu Lys Lys Glu Gln Asn Lys Asn Glu Leu Gln Gln Gln Arg 370 375 380 Leu Glu Lys Leu Ser Cys Glu Lys Glu Leu Leu Leu Asn Gln Leu His 385 390 395 400 Leu Val Gln Gln Lys Leu Glu Gln Tyr Phe Ile Asp Asn Gln Arg Leu 405 410 415 Glu Lys Lys Gln Leu Pro Glu Leu Tyr Gly Ala Ala Glu Arg Ile Lys 420 425 430 Gln Asp Ile Gly Tyr Arg Leu Gly Ala Val Met Val Ser Arg Ser Lys 435 440 445 Thr Phe Leu Gly Leu Ile Ser Ile Pro Phe Ala Leu Ile Ser Glu Trp 450 455 460 Arg Thr Trp Lys Lys Lys Tyr Asp Ser Glu Tyr Gln Val Ser Leu Pro 465 470 475 480 Ser Ile Phe Leu Tyr Ala Asp Lys His Glu Ala Glu Arg Val Lys Lys 485 490 495 His Leu Ser Tyr Gln Leu Gly Lys Leu Ile Ile Asn Lys Asn Asn Phe 500 505 510 Pro Leu Gly Leu Ile Ser Leu Pro Phe Ser Ile Tyr Arg Thr Ile Arg 515 520 525 Gln Phe Lys Arg Thr Lys Asn Asn Ser Gln Val Gly Val Lys Tyr Cys 530 535 540 Gly Lys 545 <210> 21 <211> 2058 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 21 atgagcattt tgaaccaggc aatcaatctg tataagaata agaactaccg ccaagccctc 60 tccctgtttg aaaaagtggc ggaaatctat gatgtgagct gggtggaagc caatatcaag 120 ctgtgccaaa ccgccctgaa tctgagcgaa gaagtggaca agctgaatcg gaaagcggtc 180 attgatatcg acgcggcaac caaaattatg tgcagcaatg caaaggcgat ctcgctgaat 240 gaggtggaaa agaatgaaat cattagcaaa tatcgggaaa ttaccgcaaa gaaatccgag 300 cgcgccgaat tgaaagaagt cgaacccatt ccgctggatt ggccgagcga cctgaccttg 360 ccgccgctgc cggaaagcac gaacgactac gtctgggcag ggaaacgtaa agaactggat 420 gattatccgc gcaagcaact gatcatcgac ggcctgtcca tcgtgattcc gacgtacaat 480 cgcgccaaaa tcctggcgat caccctggcc tgcctctgca atcagaaaac gatttatgac 540 tatgaggtca tcgtcgcgga tgacggttcc aaggaaaaca tcgaagagat cgtccgcgag 600 ttcgagtcgt tgctgaacat caaatacgtc cgccagaaag actacggcta ccagctgtgc 660 gccgtgcgga acctgggcct gcgggcagcg aaatacaact acgtggcgat cttggactgc 720 gatatggcgc cgaacccgtt gtgggtgcag tcctatatgg aactcctggc cgtggatgat 780 aacgtggcac tgattggccc gcgtaaatac atcgacacgt cgaagcatac ctatctggac 840 tttttgtccc agaaaagcct gatcaatgaa atcccggaga ttattaccaa taatcaggtc 900 gcaggcaagg tcgagcagaa caaatccgtc gattggcgca tcgaacattt caagaatacc 960 gacaatctgc gcctgtgcaa caccccgttc cggttcttta gcggtggcaa tgtggcgttt 1020 gcaaagaagt ggctgtttcg cgcgggttgg tttgacgaag agttcacgca ttggggcggt 1080 gaggataatg agttcggcta tcggctgtac cgcgagggtt gttatttccg tagcgtggaa 1140 ggcgcgatgg catatcatca ggaaccgccc ggtaaggaga acgaaaccga tcgcgcggca 1200 ggtaaaaaca ttaccgtcca gctgttgcag cagaaggtgc cctactttta tcgcaagaag 1260 gagaaaatcg agagcgccac cctgaaacgt gtgcccctgg tgagcatcta catccccgcg 1320 tataattgca gcaaatatat cgtgcgctgc gtcgaatcgg cactgaacca aacgatcacc 1380 gatctggagg tctgcatctg cgatgacggg agcaccgatg atacgctgcg catcctgcaa 1440 gaacattacg caaaccaccc gcgcgtccgt ttcatcagcc agaaaaacaa aggcatcggc 1500 tccgcctcga ataccgcagt ccgcctgtgc cggggtttct acatcgggca gctggattcc 1560 gatgatttcc tggagcccga tgccgtggaa ctgtgtctgg atgaatttcg caaagacctg 1620 agcctcgcct gcgtgtacac caccaatcgc aatattgatc gtgaaggtaa cttgattagc 1680 aatggctaca actggccgat ttacagccgc gaaaagctca cgagcgcgat gatctgccac 1740 cacttccgta tgttcacggc gcgtgcatgg aacctcaccg aaggcttcaa cgagagcatc 1800 agcaatgcgg tggattacga tatgtatttg aaactcagcg aagtcggccc gtttaagcat 1860 atcaataaga tttgctacaa ccgtgtcctg cacggcgaga acacgtcgat caagaaactg 1920 gacatccaaa aggaaaacca tttcaaggtg gtgaacgaaa gcctgtcgcg cctcggtatc 1980 aaaaagtaca aatactcgcc gctgaccaac ttgaatgaat gtcgcaaata tacctgggag 2040 aagatcgaaa acgacttg 2058 <210> 22 <211> 686 <212> PRT <213> Escherichia coli <400> 22 Met Ser Ile Leu Asn Gln Ala Ile Asn Leu Tyr Lys Asn Lys Asn Tyr 1 5 10 15 Arg Gln Ala Leu Ser Leu Phe Glu Lys Val Ala Glu Ile Tyr Asp Val 20 25 30 Ser Trp Val Glu Ala Asn Ile Lys Leu Cys Gln Thr Ala Leu Asn Leu 35 40 45 Ser Glu Glu Val Asp Lys Leu Asn Arg Lys Ala Val Ile Asp Ile Asp 50 55 60 Ala Ala Thr Lys Ile Met Cys Ser Asn Ala Lys Ala Ile Ser Leu Asn 65 70 75 80 Glu Val Glu Lys Asn Glu Ile Ile Ser Lys Tyr Arg Glu Ile Thr Ala 85 90 95 Lys Lys Ser Glu Arg Ala Glu Leu Lys Glu Val Glu Pro Ile Pro Leu 100 105 110 Asp Trp Pro Ser Asp Leu Thr Leu Pro Pro Leu Pro Glu Ser Thr Asn 115 120 125 Asp Tyr Val Trp Ala Gly Lys Arg Lys Glu Leu Asp Asp Tyr Pro Arg 130 135 140 Lys Gln Leu Ile Ile Asp Gly Leu Ser Ile Val Ile Pro Thr Tyr Asn 145 150 155 160 Arg Ala Lys Ile Leu Ala Ile Thr Leu Ala Cys Leu Cys Asn Gln Lys 165 170 175 Thr Ile Tyr Asp Tyr Glu Val Ile Val Ala Asp Asp Gly Ser Lys Glu 180 185 190 Asn Ile Glu Glu Ile Val Arg Glu Phe Glu Ser Leu Leu Asn Ile Lys 195 200 205 Tyr Val Arg Gln Lys Asp Tyr Gly Tyr Gln Leu Cys Ala Val Arg Asn 210 215 220 Leu Gly Leu Arg Ala Ala Lys Tyr Asn Tyr Val Ala Ile Leu Asp Cys 225 230 235 240 Asp Met Ala Pro Asn Pro Leu Trp Val Gln Ser Tyr Met Glu Leu Leu 245 250 255 Ala Val Asp Asp Asn Val Ala Leu Ile Gly Pro Arg Lys Tyr Ile Asp 260 265 270 Thr Ser Lys His Thr Tyr Leu Asp Phe Leu Ser Gln Lys Ser Leu Ile 275 280 285 Asn Glu Ile Pro Glu Ile Ile Thr Asn Asn Gln Val Ala Gly Lys Val 290 295 300 Glu Gln Asn Lys Ser Val Asp Trp Arg Ile Glu His Phe Lys Asn Thr 305 310 315 320 Asp Asn Leu Arg Leu Cys Asn Thr Pro Phe Arg Phe Phe Ser Gly Gly 325 330 335 Asn Val Ala Phe Ala Lys Lys Trp Leu Phe Arg Ala Gly Trp Phe Asp 340 345 350 Glu Glu Phe Thr His Trp Gly Gly Glu Asp Asn Glu Phe Gly Tyr Arg 355 360 365 Leu Tyr Arg Glu Gly Cys Tyr Phe Arg Ser Val Glu Gly Ala Met Ala 370 375 380 Tyr His Gln Glu Pro Pro Gly Lys Glu Asn Glu Thr Asp Arg Ala Ala 385 390 395 400 Gly Lys Asn Ile Thr Val Gln Leu Leu Gln Gln Lys Val Pro Tyr Phe 405 410 415 Tyr Arg Lys Lys Glu Lys Ile Glu Ser Ala Thr Leu Lys Arg Val Pro 420 425 430 Leu Val Ser Ile Tyr Ile Pro Ala Tyr Asn Cys Ser Lys Tyr Ile Val 435 440 445 Arg Cys Val Glu Ser Ala Leu Asn Gln Thr Ile Thr Asp Leu Glu Val 450 455 460 Cys Ile Cys Asp Asp Gly Ser Thr Asp Asp Thr Leu Arg Ile Leu Gln 465 470 475 480 Glu His Tyr Ala Asn His Pro Arg Val Arg Phe Ile Ser Gln Lys Asn 485 490 495 Lys Gly Ile Gly Ser Ala Ser Asn Thr Ala Val Arg Leu Cys Arg Gly 500 505 510 Phe Tyr Ile Gly Gln Leu Asp Ser Asp Asp Phe Leu Glu Pro Asp Ala 515 520 525 Val Glu Leu Cys Leu Asp Glu Phe Arg Lys Asp Leu Ser Leu Ala Cys 530 535 540 Val Tyr Thr Thr Asn Arg Asn Ile Asp Arg Glu Gly Asn Leu Ile Ser 545 550 555 560 Asn Gly Tyr Asn Trp Pro Ile Tyr Ser Arg Glu Lys Leu Thr Ser Ala 565 570 575 Met Ile Cys His His Phe Arg Met Phe Thr Ala Arg Ala Trp Asn Leu 580 585 590 Thr Glu Gly Phe Asn Glu Ser Ile Ser Asn Ala Val Asp Tyr Asp Met 595 600 605 Tyr Leu Lys Leu Ser Glu Val Gly Pro Phe Lys His Ile Asn Lys Ile 610 615 620 Cys Tyr Asn Arg Val Leu His Gly Glu Asn Thr Ser Ile Lys Lys Leu 625 630 635 640 Asp Ile Gln Lys Glu Asn His Phe Lys Val Val Asn Glu Ser Leu Ser 645 650 655 Arg Leu Gly Ile Lys Lys Tyr Lys Tyr Ser Pro Leu Thr Asn Leu Asn 660 665 670 Glu Cys Arg Lys Tyr Thr Trp Glu Lys Ile Glu Asn Asp Leu 675 680 685 <210> 23 <211> 1431 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 23 atgttgaaga acttgacctt cgatcacatc ctgagcctga gcaagaaaga agataaaatc 60 aaactggtgc agctcatcgt caaccatctg gacgagcgca cgctgtcctg catcaagaac 120 atttcgaccg gcaaaggctt taatgcgcat ctcaaaatcc tggagttgtt cgacttgtgg 180 ctgtcggaat acttcgagta tattatcatc ccgaacaagt tgtcgaacgc agggacgttt 240 tacttcgcgt tcttctttcc ggagttctac atcaaacgtt tcaacaagaa taacacggac 300 ctgtccagct tgggtgatac cagcttcaag cgcctgatga gccgtccgca catccccaac 360 tacgtgtata atctcgtgat caactcgaac ggctgcacct tcaattcgat taagttgttg 420 ctgctcgcac tgtccctgac cagcaaacgc ttctacgaaa ccccgcagca ggagcgcaac 480 ttcttgtgcc acatcaatga aattgtcctg gcaaacgccg acgaatatag cggcatcatt 540 tcctgtatca tcaaatcgcg catctcggtg attgatgatt tcattagcag caatgtgagc 600 ctgaatacca atcgccagat cgcattgttc atcacggggc agtcgcgcgg tttcatcgac 660 gcgctgccga acctggtcag caagatcacg attccgtcgg acgtcgatgt gtttatctcc 720 acctggaagg atatcgggca tacgcaactg agcaaagaac gcatctgccg catttttgat 780 tcggaagccg cccaatacgt gtccgaaccc gacaattaca gcttcgtgga tgaacattat 840 gatgagctga aagacctgtc gctctcctcc tataagaaca ataacctgga agaaatctac 900 tcgtcgttct tctccggctg caactccgtc ctgatcaata tcaaggatga tggcgaatat 960 ccgtataaca agatgagcaa cgcggaaaag atgtactacc acaattcctt ttggttctgc 1020 tcgctgaaaa atcataactg ggataagtac cgctgcatca tcaaaatccg ccccgatgcc 1080 ctgctgcaag tggataacgt gaccatcaac gatatcgacg tggacgacag cgtgtattgc 1140 gaggacagca acggttggat ttttcgcgag tgggggtttg gcatcggcga tcagctgttc 1200 tatggcgacc cggacatcat gaagaaactg atgtgcgtgc atggtctgga taacatttac 1260 tcgcaactga cgagcctgat ctcgtcgtcg aatgtgtact actcggggca catcaacgtc 1320 ggcttgtgcg cctgggccaa tgtgtacgac tgtaaagtga gcaatctgaa gatcaagaat 1380 attgtggccc cgcgtaaaat cagcctggag caaattctga gcctgcggga a 1431 <210> 24 <211> 477 <212> PRT <213> Escherichia coli <400> 24 Met Leu Lys Asn Leu Thr Phe Asp His Ile Leu Ser Leu Ser Lys Lys 1 5 10 15 Glu Asp Lys Ile Lys Leu Val Gln Leu Ile Val Asn His Leu Asp Glu 20 25 30 Arg Thr Leu Ser Cys Ile Lys Asn Ile Ser Thr Gly Lys Gly Phe Asn 35 40 45 Ala His Leu Lys Ile Leu Glu Leu Phe Asp Leu Trp Leu Ser Glu Tyr 50 55 60 Phe Glu Tyr Ile Ile Ile Pro Asn Lys Leu Ser Asn Ala Gly Thr Phe 65 70 75 80 Tyr Phe Ala Phe Phe Phe Pro Glu Phe Tyr Ile Lys Arg Phe Asn Lys 85 90 95 Asn Asn Thr Asp Leu Ser Ser Leu Gly Asp Thr Ser Phe Lys Arg Leu 100 105 110 Met Ser Arg Pro His Ile Pro Asn Tyr Val Tyr Asn Leu Val Ile Asn 115 120 125 Ser Asn Gly Cys Thr Phe Asn Ser Ile Lys Leu Leu Leu Leu Ala Leu 130 135 140 Ser Leu Thr Ser Lys Arg Phe Tyr Glu Thr Pro Gln Gln Glu Arg Asn 145 150 155 160 Phe Leu Cys His Ile Asn Glu Ile Val Leu Ala Asn Ala Asp Glu Tyr 165 170 175 Ser Gly Ile Ile Ser Cys Ile Ile Lys Ser Arg Ile Ser Val Ile Asp 180 185 190 Asp Phe Ile Ser Ser Asn Val Ser Leu Asn Thr Asn Arg Gln Ile Ala 195 200 205 Leu Phe Ile Thr Gly Gln Ser Arg Gly Phe Ile Asp Ala Leu Pro Asn 210 215 220 Leu Val Ser Lys Ile Thr Ile Pro Ser Asp Val Asp Val Phe Ile Ser 225 230 235 240 Thr Trp Lys Asp Ile Gly His Thr Gln Leu Ser Lys Glu Arg Ile Cys 245 250 255 Arg Ile Phe Asp Ser Glu Ala Ala Gln Tyr Val Ser Glu Pro Asp Asn 260 265 270 Tyr Ser Phe Val Asp Glu His Tyr Asp Glu Leu Lys Asp Leu Ser Leu 275 280 285 Ser Ser Tyr Lys Asn Asn Asn Leu Glu Glu Ile Tyr Ser Ser Phe Phe 290 295 300 Ser Gly Cys Asn Ser Val Leu Ile Asn Ile Lys Asp Asp Gly Glu Tyr 305 310 315 320 Pro Tyr Asn Lys Met Ser Asn Ala Glu Lys Met Tyr Tyr His Asn Ser 325 330 335 Phe Trp Phe Cys Ser Leu Lys Asn His Asn Trp Asp Lys Tyr Arg Cys 340 345 350 Ile Ile Lys Ile Arg Pro Asp Ala Leu Leu Gln Val Asp Asn Val Thr 355 360 365 Ile Asn Asp Ile Asp Val Asp Asp Ser Val Tyr Cys Glu Asp Ser Asn 370 375 380 Gly Trp Ile Phe Arg Glu Trp Gly Phe Gly Ile Gly Asp Gln Leu Phe 385 390 395 400 Tyr Gly Asp Pro Asp Ile Met Lys Lys Leu Met Cys Val His Gly Leu 405 410 415 Asp Asn Ile Tyr Ser Gln Leu Thr Ser Leu Ile Ser Ser Ser Asn Val 420 425 430 Tyr Tyr Ser Gly His Ile Asn Val Gly Leu Cys Ala Trp Ala Asn Val 435 440 445 Tyr Asp Cys Lys Val Ser Asn Leu Lys Ile Lys Asn Ile Val Ala Pro 450 455 460 Arg Lys Ile Ser Leu Glu Gln Ile Leu Ser Leu Arg Glu 465 470 475 <210> 25 <211> 1566 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 25 atgcttctaa taatgtctgg tagctacgtg cagcaggaat tgggcgcgga gttcggtagc 60 atcccgccgt cgttcctgcc gttggcaaac aagcgtctgt tcaagcacca ggtcagcttg 120 gggcacgatg gccatgcgat ctacctggtc ctgccggaag atttcgtgtt cgacaaacac 180 gattacgaat ggttgctgcg caataaagtg acgatgattc cggtcgatag caatctgacc 240 ctgggccagg caatcgtcac ggcctggaat ctgatcggcg acaaagatga taaaggcctg 300 caactgctgt ttggtgatac cttgttcaag aagattccgg cgggtgatga cctcgtggcg 360 atctcccatt ccgatgataa ctaccagtgg tcctttttct atgagacgga attgcgggca 420 gtctcccgcg aggacaacaa aaatgtcatc tgcgggtact tctcgttcag caaacccaat 480 ttcttcattc gcgaactggt caccagcaag tttgacttca cggcagccct gaaaaagtac 540 catgattcgt acagcttggc gtcgatttac gtcagcgact ggctcgattt cggtcacatc 600 aatacctact ataagtcgaa agtccagtac acgacccagc gtgccttcaa tgagctgtgc 660 atcacgacca agtccgtgat taagtcctcc tcgaatgaaa gcaagatcga ggcagaatcg 720 aaatggttcg agacgattcc gggtgaactg aaaatctaca ccccgatgtt gctggaaccg 780 ttcgatcaca ttcgcaaaag ctacaaactc gaatacctgt acaataccac cctgaacgaa 840 ctgttcgtgt tctcccgcct gccgaataat atcctgacca acattctgat cagctgcctg 900 gattttatcg acctctgcaa agagtatcat agcattgata cggataaaaa cattctccag 960 gatctgtttt acgaaaagac catcgagcgc gtcagcaagt atatcaccga tctcaacatt 1020 gacccgaacg cgaaatggaa ttttaacaac aatattagcg tgagcatcaa cgacatcctg 1080 tacgacacga acaaattcat tccgtccgaa ctgcaataca agaccatcat gcacggggac 1140 ctgtgcttca gcaatattat ctttaacttc cgcacgggcc ggattcaggt gttcgatccg 1200 cgcggtctga accacagcgg cgaaatctcg atctatggcg atttccgcta cgatattgcg 1260 aaactgtcgc actccattct aggcctgtat gactggatca tcgcgggcta ctacattatc 1320 aacaaaaaga ataagaccca ttccattgag ttcaaaatca atattgataa caaactcttt 1380 gaaatccaat cgaccttcgt gtccattatt aaggaaaaat acagcatctc cgaaaagtcg 1440 ctgtacgcca tgcaaattca tctgttcttg tcgatgctgc cgttgcatag cgacgacaag 1500 aagcggcagg acgccctgtt tgcgaatgcc ttccgcctgt atgaaatctt taaggaggca 1560 gcagta 1566 <210> 26 <211> 522 <212> PRT <213> Escherichia coli <400> 26 Met Leu Leu Ile Met Ser Gly Ser Tyr Val Gln Gln Glu Leu Gly Ala 1 5 10 15 Glu Phe Gly Ser Ile Pro Pro Ser Phe Leu Pro Leu Ala Asn Lys Arg 20 25 30 Leu Phe Lys His Gln Val Ser Leu Gly His Asp Gly His Ala Ile Tyr 35 40 45 Leu Val Leu Pro Glu Asp Phe Val Phe Asp Lys His Asp Tyr Glu Trp 50 55 60 Leu Leu Arg Asn Lys Val Thr Met Ile Pro Val Asp Ser Asn Leu Thr 65 70 75 80 Leu Gly Gln Ala Ile Val Thr Ala Trp Asn Leu Ile Gly Asp Lys Asp 85 90 95 Asp Lys Gly Leu Gln Leu Leu Phe Gly Asp Thr Leu Phe Lys Lys Ile 100 105 110 Pro Ala Gly Asp Asp Leu Val Ala Ile Ser His Ser Asp Asp Asn Tyr 115 120 125 Gln Trp Ser Phe Phe Tyr Glu Thr Glu Leu Arg Ala Val Ser Arg Glu 130 135 140 Asp Asn Lys Asn Val Ile Cys Gly Tyr Phe Ser Phe Ser Lys Pro Asn 145 150 155 160 Phe Phe Ile Arg Glu Leu Val Thr Ser Lys Phe Asp Phe Thr Ala Ala 165 170 175 Leu Lys Lys Tyr His Asp Ser Tyr Ser Leu Ala Ser Ile Tyr Val Ser 180 185 190 Asp Trp Leu Asp Phe Gly His Ile Asn Thr Tyr Tyr Lys Ser Lys Val 195 200 205 Gln Tyr Thr Thr Gln Arg Ala Phe Asn Glu Leu Cys Ile Thr Thr Lys 210 215 220 Ser Val Ile Lys Ser Ser Ser Asn Glu Ser Lys Ile Glu Ala Glu Ser 225 230 235 240 Lys Trp Phe Glu Thr Ile Pro Gly Glu Leu Lys Ile Tyr Thr Pro Met 245 250 255 Leu Leu Glu Pro Phe Asp His Ile Arg Lys Ser Tyr Lys Leu Glu Tyr 260 265 270 Leu Tyr Asn Thr Thr Leu Asn Glu Leu Phe Val Phe Ser Arg Leu Pro 275 280 285 Asn Asn Ile Leu Thr Asn Ile Leu Ile Ser Cys Leu Asp Phe Ile Asp 290 295 300 Leu Cys Lys Glu Tyr His Ser Ile Asp Thr Asp Lys Asn Ile Leu Gln 305 310 315 320 Asp Leu Phe Tyr Glu Lys Thr Ile Glu Arg Val Ser Lys Tyr Ile Thr 325 330 335 Asp Leu Asn Ile Asp Pro Asn Ala Lys Trp Asn Phe Asn Asn Asn Ile 340 345 350 Ser Val Ser Ile Asn Asp Ile Leu Tyr Asp Thr Asn Lys Phe Ile Pro 355 360 365 Ser Glu Leu Gln Tyr Lys Thr Ile Met His Gly Asp Leu Cys Phe Ser 370 375 380 Asn Ile Ile Phe Asn Phe Arg Thr Gly Arg Ile Gln Val Phe Asp Pro 385 390 395 400 Arg Gly Leu Asn His Ser Gly Glu Ile Ser Ile Tyr Gly Asp Phe Arg 405 410 415 Tyr Asp Ile Ala Lys Leu Ser His Ser Ile Leu Gly Leu Tyr Asp Trp 420 425 430 Ile Ile Ala Gly Tyr Tyr Ile Ile Asn Lys Lys Asn Lys Thr His Ser 435 440 445 Ile Glu Phe Lys Ile Asn Ile Asp Asn Lys Leu Phe Glu Ile Gln Ser 450 455 460 Thr Phe Val Ser Ile Ile Lys Glu Lys Tyr Ser Ile Ser Glu Lys Ser 465 470 475 480 Leu Tyr Ala Met Gln Ile His Leu Phe Leu Ser Met Leu Pro Leu His 485 490 495 Ser Asp Asp Lys Lys Arg Gln Asp Ala Leu Phe Ala Asn Ala Phe Arg 500 505 510 Leu Tyr Glu Ile Phe Lys Glu Ala Ala Val 515 520 <210> 27 <211> 1167 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 27 atgaaaattg ccgtggccgg cgtcggctat gtgggtatca gcattgcgat cctcctctcc 60 caaaaacacg acatcatcgc cctggacatc gacccgaaga aggtccagct cattaacaag 120 aaaatctcgc cgatttgcga cccggaaatc cagaagtttc tctccaatcg taagctgaac 180 ctctacgcga cgacggaaaa atacgaggca tatcgcgatg cagactacgt gatcatcgcc 240 accccgacga actatgatcc gattaataac aactttgata ccctgagcgt cgaaagcgtc 300 gcgtgtgacg tgctgtccat taacccgaac gcgaccatca ttatcaaatc caccgtcccc 360 gtcgggttca ccgaacgcct gaagcgcgat ctgaacacga ataatatcat cttttccccg 420 gagttcctgc gcgaaggcaa agccctgtat gataatctct atccgagccg cattgtcgtg 480 ggcgaatcgt cggaacgcgc acggaagttc gccgaactcc tgtcggaagg tgccatcaaa 540 aaggatattc cgatcctgct gacggattcg cccgaggcag aagccatcaa actgttcgcg 600 aacacgtatc tggcgatgcg tatcgcgtac tttaacgagc tggacaccta cgcgagcgtg 660 cacggcctgg ataccaaaca aatcatcgaa ggcgtctccc tcgatccgcg cattggtcaa 720 cattacaaca acccgtcctt cggctacggc ggttactgtc tgccgaagga tacgaagcag 780 ctgttggcca attatcgcga cgtcccgcaa aacctgatcc aggccatcgt ggatgcgaat 840 acgacccgta aggacttcgt ggccgaggac atcctgtccc gtaagcccaa agtggtcggt 900 atctatcgcc tgatcatgaa ggcgggtagc gacaatttcc gggccagcag catccagggg 960 gtcatgaaac gtttgaaggc caagggtatc gagattgtgg tgtacgagcc ggtcctgaaa 1020 gaaccctact tcttcggttc ctacgtcgag cgcgacatca attcctttaa ggagcgcgtc 1080 gatgtcattg tggcgaatcg ccgcaccagc gaactggaag atgtctcgga gaaagtctac 1140 acccgcgacc tgttcggcgt cgattcg 1167 <210> 28 <211> 389 <212> PRT <213> Escherichia coli <400> 28 Met Lys Ile Ala Val Ala Gly Val Gly Tyr Val Gly Ile Ser Ile Ala 1 5 10 15 Ile Leu Leu Ser Gln Lys His Asp Ile Ile Ala Leu Asp Ile Asp Pro 20 25 30 Lys Lys Val Gln Leu Ile Asn Lys Lys Ile Ser Pro Ile Cys Asp Pro 35 40 45 Glu Ile Gln Lys Phe Leu Ser Asn Arg Lys Leu Asn Leu Tyr Ala Thr 50 55 60 Thr Glu Lys Tyr Glu Ala Tyr Arg Asp Ala Asp Tyr Val Ile Ile Ala 65 70 75 80 Thr Pro Thr Asn Tyr Asp Pro Ile Asn Asn Asn Phe Asp Thr Leu Ser 85 90 95 Val Glu Ser Val Ala Cys Asp Val Leu Ser Ile Asn Pro Asn Ala Thr 100 105 110 Ile Ile Ile Lys Ser Thr Val Pro Val Gly Phe Thr Glu Arg Leu Lys 115 120 125 Arg Asp Leu Asn Thr Asn Asn Ile Ile Phe Ser Pro Glu Phe Leu Arg 130 135 140 Glu Gly Lys Ala Leu Tyr Asp Asn Leu Tyr Pro Ser Arg Ile Val Val 145 150 155 160 Gly Glu Ser Ser Glu Arg Ala Arg Lys Phe Ala Glu Leu Leu Ser Glu 165 170 175 Gly Ala Ile Lys Lys Asp Ile Pro Ile Leu Leu Thr Asp Ser Pro Glu 180 185 190 Ala Glu Ala Ile Lys Leu Phe Ala Asn Thr Tyr Leu Ala Met Arg Ile 195 200 205 Ala Tyr Phe Asn Glu Leu Asp Thr Tyr Ala Ser Val His Gly Leu Asp 210 215 220 Thr Lys Gln Ile Ile Glu Gly Val Ser Leu Asp Pro Arg Ile Gly Gln 225 230 235 240 His Tyr Asn Asn Pro Ser Phe Gly Tyr Gly Gly Tyr Cys Leu Pro Lys 245 250 255 Asp Thr Lys Gln Leu Leu Ala Asn Tyr Arg Asp Val Pro Gln Asn Leu 260 265 270 Ile Gln Ala Ile Val Asp Ala Asn Thr Thr Arg Lys Asp Phe Val Ala 275 280 285 Glu Asp Ile Leu Ser Arg Lys Pro Lys Val Val Gly Ile Tyr Arg Leu 290 295 300 Ile Met Lys Ala Gly Ser Asp Asn Phe Arg Ala Ser Ser Ile Gln Gly 305 310 315 320 Val Met Lys Arg Leu Lys Ala Lys Gly Ile Glu Ile Val Val Tyr Glu 325 330 335 Pro Val Leu Lys Glu Pro Tyr Phe Phe Gly Ser Tyr Val Glu Arg Asp 340 345 350 Ile Asn Ser Phe Lys Glu Arg Val Asp Val Ile Val Ala Asn Arg Arg 355 360 365 Thr Ser Glu Leu Glu Asp Val Ser Glu Lys Val Tyr Thr Arg Asp Leu 370 375 380 Phe Gly Val Asp Ser 385 <210> 29 <211> 1464 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 29 atgttcaata atctcaaatt cttgtggctg ctcaaaaaga gccgctacgt ccacgcgctc 60 gcggccatcc aggatgattg ccggttctgg cagtcgaaac gcatcctcgc gatgtatcgt 120 ctgaatatgt actggtcgct gcataacttg acggataccc cgtccgattg gcgctgcaaa 180 ctggcaatca agatcgcaaa aatcgcctgc ggcgacatca gcctgacgcc cgagctgctg 240 atggagttca aggacgagtt caccgatacc catcagaaag tggaactggc gaaaaccctg 300 gcgtcctact cgccgacctt tagcctgagc ctgttggaca acgtggacaa ctgcccgctg 360 gacctgtata ccgcactgca actccggatc ggcctgaccc aaaaggccat ctcgaccctc 420 gcccagatcg acgcatccga tatcgtctat agcccggata tcctgctgct gcaaaataac 480 gccttccgcg aaaccgccga aattagcctg aatcggctga atgaatacta taaatacttc 540 ggcctcagcc ccgtggcctt gacggacaac agctccccgc tctccccgtg caacatcatc 600 accagcatcc cgtacccggc ccagacgggg ccgttgatct ccatcctgat gaccacctat 660 aatacgggtc gccgcgtgga aaatgcggtg atttcgctcc tcaatcagac ctaccgttcc 720 ttcgagctga tcattgtgga tgacgcgagc accgatgaca ccctgtttcg tctccagcgg 780 ctcgccctca aagacacgcg catcaagatc attagcctgc cgcagaatgt cggcacctat 840 gccgcgaagc gtatcggctt gatccaagcg aagggcgagt tcgtcacctg ccacgattcg 900 gatgactgga gccatccgga aaagctgttc cgccaaatct cccccttgtt gctcaatccg 960 aagctcatct gctccatctc ggactgggtg cgcctgcaag acaacggtat tttctatgcc 1020 cgcgcagtgt accccttgaa gcgtctgaat ccgtcgtcgc tcctgtttcg ccgtgccgac 1080 gtcttgcaga aggccggtgt ctgggattgt gtgaaaacgg gtgcggatag cgaatttatc 1140 gcgcgtctga agctgatctt cggcgattcc acggtgcatc ggatcaagtt gccgctgacg 1200 ctgggctcgc accgcaccga ctcgttgatg aacagcccga cgaccggcta caccagccaa 1260 ggtatctcgc cggatcgcca gaagtattgg gattcgtggt cccgctggca catccaggcg 1320 ctgcgtaaca aggaatcgct gtacattggt aacagcgatt tcaccaacaa gaaccgtccg 1380 ttttccgcac ccgactcgat cctcgtggac accaacgcca ttaagacggc cctgcaaagc 1440 gcccacgtca atttcacgag catc 1464 <210> 30 <211> 488 <212> PRT <213> Escherichia coli <400> 30 Met Phe Asn Asn Leu Lys Phe Leu Trp Leu Leu Lys Lys Ser Arg Tyr 1 5 10 15 Val His Ala Leu Ala Ala Ile Gln Asp Asp Cys Arg Phe Trp Gln Ser 20 25 30 Lys Arg Ile Leu Ala Met Tyr Arg Leu Asn Met Tyr Trp Ser Leu His 35 40 45 Asn Leu Thr Asp Thr Pro Ser Asp Trp Arg Cys Lys Leu Ala Ile Lys 50 55 60 Ile Ala Lys Ile Ala Cys Gly Asp Ile Ser Leu Thr Pro Glu Leu Leu 65 70 75 80 Met Glu Phe Lys Asp Glu Phe Thr Asp Thr His Gln Lys Val Glu Leu 85 90 95 Ala Lys Thr Leu Ala Ser Tyr Ser Pro Thr Phe Ser Leu Ser Leu Leu 100 105 110 Asp Asn Val Asp Asn Cys Pro Leu Asp Leu Tyr Thr Ala Leu Gln Leu 115 120 125 Arg Ile Gly Leu Thr Gln Lys Ala Ile Ser Thr Leu Ala Gln Ile Asp 130 135 140 Ala Ser Asp Ile Val Tyr Ser Pro Asp Ile Leu Leu Leu Gln Asn Asn 145 150 155 160 Ala Phe Arg Glu Thr Ala Glu Ile Ser Leu Asn Arg Leu Asn Glu Tyr 165 170 175 Tyr Lys Tyr Phe Gly Leu Ser Pro Val Ala Leu Thr Asp Asn Ser Ser 180 185 190 Pro Leu Ser Pro Cys Asn Ile Ile Thr Ser Ile Pro Tyr Pro Ala Gln 195 200 205 Thr Gly Pro Leu Ile Ser Ile Leu Met Thr Thr Tyr Asn Thr Gly Arg 210 215 220 Arg Val Glu Asn Ala Val Ile Ser Leu Leu Asn Gln Thr Tyr Arg Ser 225 230 235 240 Phe Glu Leu Ile Ile Val Asp Asp Ala Ser Thr Asp Asp Thr Leu Phe 245 250 255 Arg Leu Gln Arg Leu Ala Leu Lys Asp Thr Arg Ile Lys Ile Ile Ser 260 265 270 Leu Pro Gln Asn Val Gly Thr Tyr Ala Ala Lys Arg Ile Gly Leu Ile 275 280 285 Gln Ala Lys Gly Glu Phe Val Thr Cys His Asp Ser Asp Asp Trp Ser 290 295 300 His Pro Glu Lys Leu Phe Arg Gln Ile Ser Pro Leu Leu Leu Asn Pro 305 310 315 320 Lys Leu Ile Cys Ser Ile Ser Asp Trp Val Arg Leu Gln Asp Asn Gly 325 330 335 Ile Phe Tyr Ala Arg Ala Val Tyr Pro Leu Lys Arg Leu Asn Pro Ser 340 345 350 Ser Leu Leu Phe Arg Arg Ala Asp Val Leu Gln Lys Ala Gly Val Trp 355 360 365 Asp Cys Val Lys Thr Gly Ala Asp Ser Glu Phe Ile Ala Arg Leu Lys 370 375 380 Leu Ile Phe Gly Asp Ser Thr Val His Arg Ile Lys Leu Pro Leu Thr 385 390 395 400 Leu Gly Ser His Arg Thr Asp Ser Leu Met Asn Ser Pro Thr Thr Gly 405 410 415 Tyr Thr Ser Gln Gly Ile Ser Pro Asp Arg Gln Lys Tyr Trp Asp Ser 420 425 430 Trp Ser Arg Trp His Ile Gln Ala Leu Arg Asn Lys Glu Ser Leu Tyr 435 440 445 Ile Gly Asn Ser Asp Phe Thr Asn Lys Asn Arg Pro Phe Ser Ala Pro 450 455 460 Asp Ser Ile Leu Val Asp Thr Asn Ala Ile Lys Thr Ala Leu Gln Ser 465 470 475 480 Ala His Val Asn Phe Thr Ser Ile 485 <210> 31 <211> 723 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 31 atgattatta tcccgatggc aggtatgtcg agccgctttt tcaaagccgg ttatagcaaa 60 ccgaagtata tgctggagct gaatggcgag tttctgttcg atttgtgcct caagagcttc 120 aaactgtact tcgagacgga acactttgtc ttcatcctcc gtgacgtgtt taacacgaaa 180 tcgttcgtgc tccagcgtat cgccagcctg ggcattaata gctatacgct gatcaccctg 240 gataaggaaa cgcggggtca agcagagacg gtctatttgg ccatctcgaa actgtttaat 300 atcgaacagc cgatcaccat cttcaacatc gacacgattc gtcccaactt catcttcacc 360 aagttcgagg gcgagaatga atgttacatt gaagtgtttc gcggcgatgg cgacaactgg 420 tcgttcgtga tgcccagcaa tgacgtcaaa aatgaagtga ttgccacgtc cgaaaagaaa 480 cagattagca atttgtgttg caccgggctg taccacttca gcacgatcaa aaactttatt 540 tccgcgtatg aacattacaa gaacctgccg caagaaaact gggatgcggg cgagctgtat 600 attgcgccga tctacaatta cctgatctcc aatgggatca aagtgtatta taccgaaatc 660 aataagtccg acgtgatctt ctgcggcacc ccgcgtgagt atgagaatct ccaggggaaa 720 aag 723 <210> 32 <211> 241 <212> PRT <213> Escherichia coli <400> 32 Met Ile Ile Ile Pro Met Ala Gly Met Ser Ser Arg Phe Phe Lys Ala 1 5 10 15 Gly Tyr Ser Lys Pro Lys Tyr Met Leu Glu Leu Asn Gly Glu Phe Leu 20 25 30 Phe Asp Leu Cys Leu Lys Ser Phe Lys Leu Tyr Phe Glu Thr Glu His 35 40 45 Phe Val Phe Ile Leu Arg Asp Val Phe Asn Thr Lys Ser Phe Val Leu 50 55 60 Gln Arg Ile Ala Ser Leu Gly Ile Asn Ser Tyr Thr Leu Ile Thr Leu 65 70 75 80 Asp Lys Glu Thr Arg Gly Gln Ala Glu Thr Val Tyr Leu Ala Ile Ser 85 90 95 Lys Leu Phe Asn Ile Glu Gln Pro Ile Thr Ile Phe Asn Ile Asp Thr 100 105 110 Ile Arg Pro Asn Phe Ile Phe Thr Lys Phe Glu Gly Glu Asn Glu Cys 115 120 125 Tyr Ile Glu Val Phe Arg Gly Asp Gly Asp Asn Trp Ser Phe Val Met 130 135 140 Pro Ser Asn Asp Val Lys Asn Glu Val Ile Ala Thr Ser Glu Lys Lys 145 150 155 160 Gln Ile Ser Asn Leu Cys Cys Thr Gly Leu Tyr His Phe Ser Thr Ile 165 170 175 Lys Asn Phe Ile Ser Ala Tyr Glu His Tyr Lys Asn Leu Pro Gln Glu 180 185 190 Asn Trp Asp Ala Gly Glu Leu Tyr Ile Ala Pro Ile Tyr Asn Tyr Leu 195 200 205 Ile Ser Asn Gly Ile Lys Val Tyr Tyr Thr Glu Ile Asn Lys Ser Asp 210 215 220 Val Ile Phe Cys Gly Thr Pro Arg Glu Tyr Glu Asn Leu Gln Gly Lys 225 230 235 240 Lys <210> 33 <211> 378 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 33 atgaagaaaa ttatcgtcga tctggataat acgattagct tcaatctgag cggcaaatac 60 agccatgcaa cccccaataa gaaattgatc gaaaaactct atgagtacaa gctgaacggt 120 ttctacatcg tcatctttac cgcgcgcaat atgcggacgt acaaggaaaa cattggcaag 180 atcaatattc atacgctgcc ggtgatcatc gactggctga acgaaaaccg cgtcccgtat 240 gacgaggtga ttgtcggcaa gccgtggtgc ggcgacgagg gcttctatgt ggacgatcgg 300 gccatccggc cctcggaact gtgcaatatg accttggaag aaatctctaa tatgttagaa 360 caggagaaaa aatgcttc 378 <210> 34 <211> 126 <212> PRT <213> Escherichia coli <400> 34 Met Lys Lys Ile Ile Val Asp Leu Asp Asn Thr Ile Ser Phe Asn Leu 1 5 10 15 Ser Gly Lys Tyr Ser His Ala Thr Pro Asn Lys Lys Leu Ile Glu Lys 20 25 30 Leu Tyr Glu Tyr Lys Leu Asn Gly Phe Tyr Ile Val Ile Phe Thr Ala 35 40 45 Arg Asn Met Arg Thr Tyr Lys Glu Asn Ile Gly Lys Ile Asn Ile His 50 55 60 Thr Leu Pro Val Ile Ile Asp Trp Leu Asn Glu Asn Arg Val Pro Tyr 65 70 75 80 Asp Glu Val Ile Val Gly Lys Pro Trp Cys Gly Asp Glu Gly Phe Tyr 85 90 95 Val Asp Asp Arg Ala Ile Arg Pro Ser Glu Leu Cys Asn Met Thr Leu 100 105 110 Glu Glu Ile Ser Asn Met Leu Glu Gln Glu Lys Lys Cys Phe 115 120 125 <210> 35 <211> 24433 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 35 ctcgggccgt ctcttgggct tgatcggcct tcttgcgcat ctcacgcgct cctgcggcgg 60 cctgtagggc aggctcatac ccctgccgaa ccgcttttgt cagccggtcg gccacggctt 120 ccggcgtctc aacgcgcttt gagattccca gcttttcggc caatccctgc ggtgcatagg 180 cgcgtggctc gaccgcttgc gggctgatgg tgacgtggcc cactggtggc cgctccaggg 240 cctcgtagaa cgcctgaatg cgcgtgtgac gtgccttgct gccctcgatg ccccgttgca 300 gccctagatc ggccacagcg gccgcaaacg tggtctggtc gcgggtcatc tgcgctttgt 360 tgccgatgaa ctccttggcc gacagcctgc cgtcctgcgt cagcggcacc acgaacgcgg 420 tcatgtgcgg gctggtttcg tcacggtgga tgctggccgt cacgatgcga tccgccccgt 480 acttgtccgc cagccacttg tgcgccttct cgaagaacgc cgcctgctgt tcttggctgg 540 ccgacttcca ccattccggg ctggccgtca tgacgtactc gaccgccaac acagcgtcct 600 tgcgccgctt ctctggcagc aactcgcgca gtcggcccat cgcttcatcg gtgctgctgg 660 ccgcccagtg ctcgttctct ggcgtcctgc tggcgtcagc gttgggcgtc tcgcgctcgc 720 ggtaggcgtg cttgagactg gccgccacgt tgcccatttt cgccagcttc ttgcatcgca 780 tgatcgcgta tgccgccatg cctgcccctc ccttttggtg tccaaccggc tcgacggggg 840 cagcgcaagg cggtgcctcc ggcgggccac tcaatgcttg agtatactca ctagactttg 900 cttcgcaaag tcgtgaccgc ctacggcggc tgcggcgccc tacgggcttg ctctccgggc 960 ttcgccctgc gcggtcgctg cgctcccttg ccagcccgtg gatatgtgga cgatggccgc 1020 gagcggccac cggctggctc gcttcgctcg gcccgtggac aaccctgctg gacaagctga 1080 tggacaggct gcgcctgccc acgagcttga ccacagggat tgcccaccgg ctacccagcc 1140 ttcgaccaca tacccaccgg ctccaactgc gcggcctgcg gccttgcccc atcaattttt 1200 ttaattttct ctggggaaaa gcctccggcc tgcggcctgc gcgcttcgct tgccggttgg 1260 acaccaagtg gaaggcgggt caaggctcgc gcagcgaccg cgcagcggct tggccttgac 1320 gcgcctggaa cgacccaagc ctatgcgagt gggggcagtc gaaggcgaag cccgcccgcc 1380 tgccccccga gacctgcaga tccacatcct tgaaggccgc agcgacgagc agaaggaaac 1440 cctcattcgg gaagtcagcg aggccatctc gcgctccctg gatgcgccgc tgaccagcgt 1500 gcgagtgatt atcacggaga tggccaaggg ccacttcggc atcggcggcg aactggccag 1560 caaggtcaga cgctgaagtg gagatgccca agggcacttc gggtcgagga acccgacctg 1620 cattgggacg cggccacgga gagcgcgggc aaacgccggc actatagcca gtggagtttg 1680 taaaacgcta tttcagagct tggagagtgt ctaagaaagc cggggcgatg ccaacccatc 1740 ccttcttcgg ctatgcatcg ttcgtaatca agccacttcc tttttgcatt gacgcagggt 1800 gtcggaaggc aactcgccga acgcgctcct atagttttca gcgaagcgtc ccaaatgtaa 1860 gaagccgtag tctagggcta tctcagttat actacgcaca ttggcactgg gatcgttcaa 1920 gcaggcgcgg atgctttcga gcttgcggtt gcggatgtag ttcttcggcg tggtgccggc 1980 atgcttctcg aacaaattgt agagcgagcg tggactcatc atcgccagct ccgctaaccg 2040 ctcaaggctg atattccgtt tgagattctc ctcaatgaat tgaacgactc gctcgaaaga 2100 cgggttacct ttgctgaaaa tttcacggct gacattgctg cccagcattt cgagcagctt 2160 ggaagcgatg atccccgcat agtgctcttg gacccgaggc atcgactttg tatgttccgc 2220 ttcgtcacaa actaacccga gtagattgat aaagccatcg agttgctgga gattgtgtcg 2280 cgcggcgaaa cggataccct ccctcggctt gtgccaattg ttgtcactgc atgcccgatc 2340 aaggaccact gagggcaatt taacgataaa tttctcgcaa tcttctgaat aggtcaggtc 2400 ggcttggtca tccggattga gcagcaatag ttcgcccggc gcaaaatagt gctcctggcc 2460 atggccacgc cacaggcaat ggcctttgag tattatttgc agatgataac aggtctctaa 2520 tccaggcgag attaccctca cgctaccgcc gtagctgatt cgacacaggt cgaggcatcc 2580 gaagattctg tggtgcagcc tgcctgccgg gcgcccgccc ttgggcaggc gaatagagtg 2640 cgtaccgaca tactggttaa cataatcgga gactgcatag ggctcggcgt ggacgaagat 2700 ctgacttttc tcgttcaata agcaaaaatc catagttcac ggttctctta ttttaatgtg 2760 ggctgcttgg tgtgatgtag aaaggcgcca agtcgatgaa aatgcatctc gacgtgatgc 2820 gtatacgggt tacccccatt gccacgttgc gccatccttt ttgcaatcag tgaccacttt 2880 tccaagcaaa aataacgcca agcagaacga agacgttctt tttaagaagc gagaacacca 2940 gaagttcgtg ctgtcggggc atgcggcgac gaattggcgg ataaagggga tctgcaggtc 3000 ccgagcctca cggcggcgag tgcgggggtt ccaagggggc agcgccacct tgggcaaggc 3060 cgaaggccgc gcagtcgatc aacaagcccc ggaggggcca ctttttgccg gagggggagc 3120 cgcgccgaag gcgtggggga accccgcagg ggtgcccttc tttgggcacc aaagaactag 3180 atatagggcg aaatgcgaaa gacttaaaaa tcaacaactt aaaaaagggg ggtacgcaac 3240 agctcattgc ggcacccccc gcaatagctc attgcgtagg ttaaagaaaa tctgtaattg 3300 actgccactt ttacgcaacg cataattgtt gtcgcgctgc cgaaaagttg cagctgattg 3360 cgcatggtgc cgcaaccgtg cggcacccta ccgcatggag ataagcatgg ccacgcagtc 3420 cagagaaatc ggcattcaag ccaagaacaa gcccggtcac tgggtgcaaa cggaacgcaa 3480 agcgcatgag gcgtgggccg ggcttattgc gaggaaaccc acggcggcaa tgctgctgca 3540 tcacctcgtg gcgcagatgg gccaccagaa cgccgtggtg gtcagccaga agacactttc 3600 caagctcatc ggacgttctt tgcggacggt ccaatacgca gtcaaggact tggtggccga 3660 gcgctggatc tccgtcgtga agctcaacgg ccccggcacc gtgtcggcct acgtggtcaa 3720 tgaccgcgtg gcgtggggcc agccccgcga ccagttgcgc ctgtcggtgt tcagtgccgc 3780 cgtggtggtt gatcacgacg accaggacga atcgctgttg gggcatggcg acctgcgccg 3840 catcccgacc ctgtatccgg gcgagcagca actaccgacc ggccccggcg aggagccgcc 3900 cagccagccc ggcattccgg gcatggaacc agacctgcca gccttgaccg aaacggagga 3960 atgggaacgg cgcgggcagc agcgcctgcc gatgcccgat gagccgtgtt ttctggacga 4020 tggcgagccg ttggagccgc cgacacgggt cacgctgccg cgccggtagc acttgggttg 4080 cgcagcaacc cgtaagtgcg ctgttccaga ctatcggctg tagccgcctc gccgccctat 4140 accttgtctg cctccccgcg ttgcgtcgcg gtgcatggag ccgggccacc tcgacctgaa 4200 tggaagccgg cggcacctcg ctaacggatt caccgttttt atcaggctct gggaggcaga 4260 ataaatgatc atatcgtcaa ttattacctc cacggggaga gcctgagcaa actggcctca 4320 ggcatttgag aagcacacgg tcacactgct tccggtagtc aataaaccgg taaaccagca 4380 atagacataa gcggctattt aacgaccctg ccctgaaccg acgaccgggt cgaatttgct 4440 ttcgactatc ggcgcgccag agctcatcgt taatgtcttc gtgcgccgtc agtcggcgca 4500 cgttttttct ctctggtacc gtgtcactga tctagtcaat tactcgaagt atccacaagt 4560 gaagcatact aagtaatgta caagaatcaa aaaaatcggc tacgcaagtc gcgtagccga 4620 atcatttaag gatccttcca ttcaggtcga ggtggcccgg ctccatgcac cgcgacgcaa 4680 cgcggggagg cagacaaggt atagggcggc gcctacaatc catgccaacc cgttccatgt 4740 gctcgccgag gcggcataaa tcgccgtgac gatcagcggt ccagtgatcg aagttaggct 4800 ggtaagagcc gcgagcgatc cttgaagctg tccctgatgg tcgtcatcta cctgcctgga 4860 cagcatggcc tgcaacgcgg gcatcccgat gccgccggaa gcgagaagaa tcataatggg 4920 gaaggccatc cagcctcgcg tcgcgaacgc cagcaagacg tagcccagcg cgtcggccgc 4980 catgccggcg ataatggcct gcttctcgcc gaaacgtttg gtggcgggac cagtgacgaa 5040 ggcttgagcg agggcgtgca agattccgaa taccgcaagc gacaggccga tcatcgtcgc 5100 gctccagcga aagcggtcct cgccgaaaat gacccagagc gctgccggca cctgtcctac 5160 gagttgcatg ataaagaaga cagtcataag tgcggcgacg atagtcatgc cccgcgccca 5220 ccggaaggag ctgactgggt tgaaggctct caagggcatc ggtcgacgct ctcccttatg 5280 cgactcctgc attaggaagc agcccagtag taggttgagg ccgttgagca ccgccgccgc 5340 aaggaatggt gcatgcaagg agatggcgcc caacagtccc ccggccacgg ggcctgccac 5400 catacccacg ccgaaacaag cgctcatgag cccgaagtgg cgagcccgat cttccccatc 5460 ggtgatgtcg gcgatatagg cgccagcaac cgcacctgtg gcgccggtga tgccggccac 5520 gatgcgtccg gcgtacaaga tccacaggac gggtgtggtc gccatgatcg cgtagtcgat 5580 agtggctcca agtagcgaag cgagcaggac tgggcggcgg ccaaagcggt cggacagtgc 5640 tccgagaacg ggtgcgcata gaaattgcat caacgcatat agcgctagca gcacgccata 5700 gtgactggcg atgctgtcgg aatggacgat atcccgcaag aggcccggca gtaccggcat 5760 aaccaagcct atgcctacag catccagggt gacggtgccg aggatgacga tgagcgcatt 5820 gttagatttc atacacggtg cctgactgcg ttagcaattt aactgtgata aactaccgca 5880 ttaaagccga gcgatgataa gctgtcaaac atgagatcca atctagattg tttaaacttc 5940 tgcagaacac gcggtgttaa cgtttcttat acttcttaat tttgttaaag atcatttcgc 6000 cgtagtacac cgcattgacc tgggtcttca ccagcaagta gccgcgaaat ttcttaaaca 6060 acttcatgtt cggtttaaag tcggcttgcc agaactgatg caaatgcccc tggtacgtca 6120 gacccttgat atcgtacaag gcgttgccca tgactttcag gggcttgttg tggatcaacg 6180 cggaaatgcc ggccgtgcta ttgatggtga ccaccgcttt ggcgtggcgc aacagctccg 6240 gcatgggcag atcgtgcaca tagatgacac gttcatccaa accgtattcc ttcgacagac 6300 gcttgatcaa cgggcggtac aggcggtgcc cgcgatccat cgggtgatgt ttgatcacca 6360 gataggactc cttgggggcc ttgcgggaaa agctgtacat cacttcgttg atgtaatcac 6420 gcacatcatt atagttgcta tggttgcgga tctggctgtc gttgtacact tgcaggaccg 6480 ccaggtaata gcgctgatcc agctcgttca tcaggcgggg gaggaccttg cgttgggtga 6540 ccttatacag ctgtttgcgc cagtaggcgc ggacccagca gcgcgcttca taccacgggc 6600 tgaacgattt gtggtggcga tagcgcggaa attcgtgacg atagtgccaa cccatcaggt 6660 aataccacat ggcgtggccg atgcgcttca tggtgctcgg tttcaggttc tcgacgtgcg 6720 gcgtcggcat atcgggcaat ttgcggtaaa agtccggatc gcggggcaag ctgctatagg 6780 cgttcacacc gccttcttcc acggtgataa attgcggacg caggtagcct tcctcgaagg 6840 ccagaaaacg aatccccttc gacttggccc agcgtttggc ctccttgtgc agcaggcggc 6900 agtcaccgaa acacaaaatc gtgtcaaagt catactgacg atgcaagtcc cgcagccaac 6960 cggggaactc cttcggggtt tggtagtacg ccaggtattg gcggtggcgg cagtagaagc 7020 gatcaccgcc attaaagacg acgttgaccg cgttgcgacc gaggctctcc aaccattccg 7080 ccacatcgtt gaagaacgga cccatcggac cttggagcag gaggtacttt ttaccgctca 7140 acagcaccgt cagcgcattg ccgtgcattt attaacctcc taacacgcgg tgttaagcgt 7200 tttcggcgag ctcttaacca aagcgcactt tgcagaacat gatcaacttg cgatagtagc 7260 gaatcacacg gccggctttc ttgcgggtga taaagatggg tttgcggggc gttttgatca 7320 gatattctgc cgcttcctcc accgtgatcg gctgcaaccg cgtcggatga atataggtgg 7380 gatagacaat cagggcttga tagatcaggt cggcgatggt cagccgccgc tcgcgacggg 7440 ggcagtggtg ctcatcgacg gtcaggcccc acgaggcgta gaacggcagg ccgtagcagt 7500 gcacctgttt accgtgcagc aatgcttcaa agccgctgag gctcgtcatc gtgtgcacct 7560 cgtccgcacg ctgaatacac tgaatgatat cggcatccag tgcctggtag tctgcgagtt 7620 ccgcgatctg ttccgccgga atgtcaccct tacggttgcc gacgagcaca tcggggtgcg 7680 gcttgtagat gatgtaggcg tgcggattac gttcccgcac ggtgcgcagc agctccagat 7740 tcgacttgat cgacacggtg cccgtcttaa tcgacgcatc gtcttccacc tggcccggca 7800 ccaggatgac tttcttgtcc ttcgcttctg ccgggaggct gaaatcggcc cccaggttat 7860 atttgctcaa tttgctttcc accagacgtt ggcgcaactt ttccgcgcgc atctggtgcg 7920 cgagggtcag ctggctgtga ttcagcagga cctccagttc cgacggacgg gtggcatcgt 7980 aatagatacc gcgcttatcc aggaccaggc tcaacggcgg cagcagatcg ctccccaggc 8040 cggagctgcg caggaagccg tcttccatgc gccacagcgg cagggatttg cgctgtgcct 8100 ccgcacgcca ttgctgttcg cctttcacgc cccacacgac gcaggcgctt gctgcggtac 8160 agcgacggga aaaggagaga cgattcgtgg ccgtttgcag gaagggcttc aggatcgcgc 8220 ttttccacag ggtcaggccc ggcacccaga gataaccatt ccgctgttgc aggtgacgac 8280 gttgcagctg gagccattgg agcaccgtga acagggccga cacctccccg gtctgcggat 8340 caatgtagcg gcaatagcgc agataggccg ctgcgaacag ttcctccagg gtggccgagc 8400 cgcgacgcgc cgacagcagc gccgattggg ggtggcggtc atcggtgagg ccccaccctg 8460 cataccaggg ttggccaaag caggtcacgg gcttaccggc cagcagggct tcaaaaccgt 8520 actgggaggt cacgacgtac acgcgggaca catgacgcag cagggactgc ggcgacacgt 8580 tttccgcaat caggcgcacg cgctgggtgg cacgcaagtc cgcgaagtag ccggtctttt 8640 tcccttccag gacatcggga tgcactttga cccagatttc tgcctgcggg ttttccgcca 8700 tcgctgcttc cagcattgcg gcgaactcat gggggcctgc gttgccgtag gtcacgctca 8760 tgtcattgaa ggtctggtcc accaccagca cgatgttcgt gcgctcgctt tcatccgcca 8820 cgaacgccgg tgccaggttg tacttgctca tgtcgcccgt cacaatggtg tgcatcgcct 8880 cgcgcgcctg atccgccagg gccgcgttgc cggccttgtc ctgcacgagt ttttccagcg 8940 cgctcggttt cgaggcgtcg tagtaaatgc cgcagtcatc cacgacgagc gagaggggcg 9000 gttcaccgtt cacgcccagg tccagcgagc ggacgaaacc atcctccaag cggatcaccg 9060 gcttgcctgc ggctttggcg atggccaccg gctttgcggc cgaggggcgg tgcccccaca 9120 ccgcgattgc atccacttcc tgcgggaccg ggcgcagcag cgacagcttt tggcagggct 9180 gggcgaggaa tttttccagg tgcggaatac gccaaatgcc ggggctataa atgccaatca 9240 tgcgttctcc gcgagctcct gcgccatcag ggcccggacc ttctccaagc acgccggggt 9300 atcgacgccg ggaccggtcg cggcgacctc gaaggtgcga atgttaatgc ccgcgctcat 9360 cagccgcagt tgctccaggg attcggcctg ttcgggcatg gactccggca actggctgta 9420 attttgcagg acatcccgcc gataggcgta gatcccgacg tgcttcaggt agcgcgcctt 9480 ctcggcgttg cgcgggtacg gaatggggga gcgggagaaa tacagggcgt cctgccgcgt 9540 gttcaccacg accttgacgg tggacggttc ggcggcttct gccgcgctga tcgcatgaca 9600 cagggtcgcc accggcagcg ccgggtcgtc ccgcatacct tgcagcaggg tttcgacgtc 9660 acgcgggcga atcatcggct catccccttg caggttgata tagatatccg cctccacctt 9720 atgcatgact tccaccaggc gatcggtgcc gctctcatga tcgttgcggg tcatgatcgc 9780 tttgccgccg aacgcctgga ctgcctgctc cacacgcggg tcgtcggttg cgacccacac 9840 ctctgccacg cctgccactt gcagggcccg ttcgtagacg tgctggatca tcggtttccc 9900 gacgatatcc agcagcggtt tgcccggcag acggctgctg ccgtagcgtg ccgggatcac 9960 aatcacggcc ttcgacattt attaacctcc tcgagttaca gcgacagaat cactttcgcg 10020 cccaccgcca gttggtacag aatggtgctg ataccgcgcg tcacttcgat gttcttcgac 10080 tcgtatttcg gcaacaccat aatttcatca ccgggtttca gggaatcgac gtcttctgcg 10140 ttcaccgctg cgccgttctg acggatgacg ataatacggg cgttgccgga cttctgggtc 10200 agcccaccgc acttctcgat gtagtcctcg gtcgtcatac ctttctgcca cgacaccgcg 10260 ttcgggaaca gcacttcccc gtggaccatg accaacgacg tcttttcggg aatattgatc 10320 acgtcgccgt cctccaggag gacggagtca atgttgcttt cattgaggat cacttcgccc 10380 ttcggcacga cggtgcgggc tttcgcgacg aagcgggaga tcagttgggc ttcctgcata 10440 cgcaggctgg cctcttcctt ggtgctgctc tgtgcgctga ggctggcctc ttcgagcttt 10500 tgcagggaca aattcagcat ttctttctgc cgttgcgcga cgctcggccg atacaactgc 10560 acggcgttca tctgcgacat ggagttcggg cgcacttttt cgagcacggc ccgcatggtg 10620 ctaccgtagg gcagcaccat ggcgtgttcc ccggaatgtg cgccttccac acgcacttga 10680 atggtgcccg catagcggtc ggtggagaca atgagggtat caccgttttg cagcatacgc 10740 cccggtgcgg acgagatcgg ataatattcc gagcgcttct ggaggccctg cttccgcata 10800 atcgtgatat gggtcgcacc cggtttggga cgtgcccagg acagtgcttc ggtgaccggg 10860 atgctcgatt cgcgaaattc aaagtcgtag gaattgaaca catcgccctg caccgagaac 10920 gtatgctggc gcggacccac aatgatcgta tcaccgtccg caaactggga cagccccagt 10980 ttgccgttga gcaggaagtc atagaggttg acgttcgagc gcacacgatt gccgcgtttc 11040 acgacgatgt ccacgtagct gccgcgttcc gggtccacac cacccgcctt gatcaggtag 11100 ttcagcaggc tgtcggaggt gacaccgccg tacaggccgg ggttgcggac aaagccggtc 11160 acatagacct tgaccggctg cgcctgcaag agcgacgcat agacgttcac gttgctctgg 11220 tagacttcct tcaccttgct cgtcaccagc gcgttcaact gggagttcga cacacctgcg 11280 actttgacgg ggccgacatt cggcaggaag atgttgccct tcgggtccac ctggagtgcg 11340 ccatcgaagg tgaacgcacc ccacaggcgg acctggatgg aatcgccggg attcaggatg 11400 tagtccggat tgaaacccac ggttgccccc gagtctgcgc tcgtaccgtt gaacagctgc 11460 gccccgaaca tacggctcat cacgaccggg ggtgcggggg gcggggtgtt atcgaagccg 11520 ctcatgttct gggtgtcgct tttctgcccg ttcaggatgc cggtcaacgg tgcggcaccc 11580 gtgaggttcg gatcggcatt aatgtcgatg gttgcgctcg cctgtgctgc atggcacgct 11640 gcgatcagca ggatcgactt aaacagcttc atttattaac ctcctcgaga agtcgactta 11700 gtcacggtgg tcttcaatca ccgccaggag caatttcagg gtgccaaaga gcaggcaaca 11760 caccagcagc caacacgcga tcaaatacgg gatattcggg aaggagcttt cctggggcag 11820 ctgcggggac gagatcacgc tcaggacttt cagcttacgg gccgcttcga cacgggtctt 11880 ttcgatgctg gtgagcgtga gcttgtacaa ctcggtattg aactcgacct tggatttgat 11940 ctcctcaaaa tccacggcca tgcggttcag tttatcgccc tggggtgcgg taattttcga 12000 cttttcttcg tcgatctgtg cctggaggct ctgaattgca ttgcgggcgc tcacgacttg 12060 gggcgcatcc tcgcgcaggt acgtgagcag gttgcgcagg tcggcttcca tctgaatttt 12120 ctggcccatc agcgtattca ccagggtgga tgccgcctgg gcctgtgcct gcgggtccag 12180 cacattgttg ttgtcttggt aggacaacaa ttcggctttc gatgcatcca gccgctggcg 12240 cgctttttcc atttcggttt ccgcaaacgc caattgatcg cgggcgatac ggtgcgacat 12300 ttcattgatg aaccgctcgg attccttgag cacggtctgg ttgaatttca gcgcgaactc 12360 gggcgaaaag ccctgggtct ggatgttcag cagcccggtc ttgtcgtcgt agctgacgtt 12420 gatgcgatct ttatagtact tcaggaaccc ctcggcggtt tcatccttgg acagatggtt 12480 caggaagtcc aggcccgaat gggagaacgc ttcgcggaag ttcagctgtt tatccagcgc 12540 ggccagcata tccgggctgt tgatgtattc cttcaggtac agtgcgtctt cggcggacga 12600 cgggttggag gcacccaaca gcaggccgaa gttcaggctg ccggagttga gatcgtcgct 12660 gcgcttgatg gccaccttgc tttccgacat atagcggggc tgggagaaga tcgccaagta 12720 gatcagcagc accgccatgg gtgccagaat aatgattttt gccaggtgct tctgaatatc 12780 tgccaggctg atcgcgctca gacgcgcacg catccacgag acggcgcttt tcactttgat 12840 cagcatttat taacctcctg tcgacaacac gtgttaatcg aaaatgcgca ccaacccggt 12900 caccttattt gctttgttgg tcaccagcag ggtcgagacg cggtgtttct gcatcttctc 12960 ttctgcttcg atgatcatgg tgtcttcggg caaggtcagc ggttcgcggg tcatcatctg 13020 tgcggccgtt gcgctcgtca ggctgtcttc tttctccata aagcgccgca gatcgccatc 13080 ggtgatgatg cctgccagcc caccttccgc atcttcgacc atcaccatac cctggcagcc 13140 cgaggtgatg cgctgaatga ccgttttgaa gctggcatcg agctgcactg ccggcacatc 13200 atgttgcatc acgtcggcga cgcgggtcag caggcgccga cccaggctgc caccggggtg 13260 gtagcgtgca aagtcattgg gcataaactt acgctggtga atcatcgcga tggccagcgc 13320 gtccccgatc gccatcgtga gcgtcgtgga ggtggtcggg gcgagattgt tcgggcacgt 13380 ttcgttcgcc atgtgcagct ccaggaccgc atctgcattt ttggccaggg tgctattccc 13440 gttattggtg attgcgatga tgcgattgcc gaagttcttc aggctcggca ccagtttcag 13500 gatctcgtcc gtctcaccgc tcgccgaaat caagatgagc aggtcatacg gggtgatcat 13560 gcccagatca ccatggaacg cttccgccgg atgaataaag aaggagggcg tcccggtcga 13620 ggccaaggtc gccgacatct tgcggcccac atggccgctt ttacccatgc cgctcaggat 13680 gacgtgccct ttacaattca tgatgagatt caggacgcgc tggtactgac cgctatccag 13740 ttgtttggac aggttttgca gtgccgcgct ttgttcggcc agggtctggc ggacgctcgt 13800 aatcagatac ggatcaatgg tcgaggactg gtcatccggc aagtggcgtt cgctcattta 13860 ttaacctcct cacgtgttaa ttaagtaatc gatagtgatt taaatatgca agatccgata 13920 aatcgattga tagatttaaa taagaactgc agaagctagc ttagatgctc gtgaaattga 13980 cgtgggcgct ttgcagggcc gtcttaatgg cgttggtgtc cacgaggatc gagtcgggtg 14040 cggaaaacgg acggttcttg ttggtgaaat cgctgttacc aatgtacagc gattccttgt 14100 tacgcagcgc ctggatgtgc cagcgggacc acgaatccca atacttctgg cgatccggcg 14160 agataccttg gctggtgtag ccggtcgtcg ggctgttcat caacgagtcg gtgcggtgcg 14220 agcccagcgt cagcggcaac ttgatccgat gcaccgtgga atcgccgaag atcagcttca 14280 gacgcgcgat aaattcgcta tccgcacccg ttttcacaca atcccagaca ccggccttct 14340 gcaagacgtc ggcacggcga aacaggagcg acgacggatt cagacgcttc aaggggtaca 14400 ctgcgcgggc atagaaaata ccgttgtctt gcaggcgcac ccagtccgag atggagcaga 14460 tgagcttcgg attgagcaac aagggggaga tttggcggaa cagcttttcc ggatggctcc 14520 agtcatccga atcgtggcag gtgacgaact cgcccttcgc ttggatcaag ccgatacgct 14580 tcgcggcata ggtgccgaca ttctgcggca ggctaatgat cttgatgcgc gtgtctttga 14640 gggcgagccg ctggagacga aacagggtgt catcggtgct cgcgtcatcc acaatgatca 14700 gctcgaagga acggtaggtc tgattgagga gcgaaatcac cgcattttcc acgcggcgac 14760 ccgtattata ggtggtcatc aggatggaga tcaacggccc cgtctgggcc gggtacggga 14820 tgctggtgat gatgttgcac ggggagagcg gggagctgtt gtccgtcaag gccacggggc 14880 tgaggccgaa gtatttatag tattcattca gccgattcag gctaatttcg gcggtttcgc 14940 ggaaggcgtt attttgcagc agcaggatat ccgggctata gacgatatcg gatgcgtcga 15000 tctgggcgag ggtcgagatg gccttttggg tcaggccgat ccggagttgc agtgcggtat 15060 acaggtccag cgggcagttg tccacgttgt ccaacaggct caggctaaag gtcggcgagt 15120 aggacgccag ggttttcgcc agttccactt tctgatgggt atcggtgaac tcgtccttga 15180 actccatcag cagctcgggc gtcaggctga tgtcgccgca ggcgattttt gcgatcttga 15240 ttgccagttt gcagcgccaa tcggacgggg tatccgtcaa gttatgcagc gaccagtaca 15300 tattcagacg atacatcgcg aggatgcgtt tcgactgcca gaaccggcaa tcatcctgga 15360 tggccgcgag cgcgtggacg tagcggctct ttttgagcag ccacaagaat ttgagattat 15420 tgaacattta ttaacctcct gctagcaact taagttacga atcgacgccg aacaggtcgc 15480 gggtgtagac tttctccgag acatcttcca gttcgctggt gcggcgattc gccacaatga 15540 catcgacgcg ctccttaaag gaattgatgt cgcgctcgac gtaggaaccg aagaagtagg 15600 gttctttcag gaccggctcg tacaccacaa tctcgatacc cttggccttc aaacgtttca 15660 tgaccccctg gatgctgctg gcccggaaat tgtcgctacc cgccttcatg atcaggcgat 15720 agataccgac cactttgggc ttacgggaca ggatgtcctc ggccacgaag tccttacggg 15780 tcgtattcgc atccacgatg gcctggatca ggttttgcgg gacgtcgcga taattggcca 15840 acagctgctt cgtatccttc ggcagacagt aaccgccgta gccgaaggac gggttgttgt 15900 aatgttgacc aatgcgcgga tcgagggaga cgccttcgat gatttgtttg gtatccaggc 15960 cgtgcacgct cgcgtaggtg tccagctcgt taaagtacgc gatacgcatc gccagatacg 16020 tgttcgcgaa cagtttgatg gcttctgcct cgggcgaatc cgtcagcagg atcggaatat 16080 cctttttgat ggcaccttcc gacaggagtt cggcgaactt ccgtgcgcgt tccgacgatt 16140 cgcccacgac aatgcggctc ggatagagat tatcatacag ggctttgcct tcgcgcagga 16200 actccgggga aaagatgata ttattcgtgt tcagatcgcg cttcaggcgt tcggtgaacc 16260 cgacggggac ggtggatttg ataatgatgg tcgcgttcgg gttaatggac agcacgtcac 16320 acgcgacgct ttcgacgctc agggtatcaa agttgttatt aatcggatca tagttcgtcg 16380 gggtggcgat gatcacgtag tctgcatcgc gatatgcctc gtatttttcc gtcgtcgcgt 16440 agaggttcag cttacgattg gagagaaact tctggatttc cgggtcgcaa atcggcgaga 16500 ttttcttgtt aatgagctgg accttcttcg ggtcgatgtc cagggcgatg atgtcgtgtt 16560 tttgggagag gaggatcgca atgctgatac ccacatagcc gacgccggcc acggcaattt 16620 tcatttatta acctccttaa gtgaattcaa actagtttac aagtcgtttt cgatcttctc 16680 ccaggtatat ttgcgacatt cattcaagtt ggtcagcggc gagtatttgt actttttgat 16740 accgaggcgc gacaggcttt cgttcaccac cttgaaatgg ttttcctttt ggatgtccag 16800 tttcttgatc gacgtgttct cgccgtgcag gacacggttg tagcaaatct tattgatatg 16860 cttaaacggg ccgacttcgc tgagtttcaa atacatatcg taatccaccg cattgctgat 16920 gctctcgttg aagccttcgg tgaggttcca tgcacgcgcc gtgaacatac ggaagtggtg 16980 gcagatcatc gcgctcgtga gcttttcgcg gctgtaaatc ggccagttgt agccattgct 17040 aatcaagtta ccttcacgat caatattgcg attggtggtg tacacgcagg cgaggctcag 17100 gtctttgcga aattcatcca gacacagttc cacggcatcg ggctccagga aatcatcgga 17160 atccagctgc ccgatgtaga aaccccggca caggcggact gcggtattcg aggcggagcc 17220 gatgcctttg tttttctggc tgatgaaacg gacgcgcggg tggtttgcgt aatgttcttg 17280 caggatgcgc agcgtatcat cggtgctccc gtcatcgcag atgcagacct ccagatcggt 17340 gatcgtttgg ttcagtgccg attcgacgca gcgcacgata tatttgctgc aattatacgc 17400 ggggatgtag atgctcacca ggggcacacg tttcagggtg gcgctctcga ttttctcctt 17460 cttgcgataa aagtagggca ccttctgctg caacagctgg acggtaatgt ttttacctgc 17520 cgcgcgatcg gtttcgttct ccttaccggg cggttcctga tgatatgcca tcgcgccttc 17580 cacgctacgg aaataacaac cctcgcggta cagccgatag ccgaactcat tatcctcacc 17640 gccccaatgc gtgaactctt cgtcaaacca acccgcgcga aacagccact tctttgcaaa 17700 cgccacattg ccaccgctaa agaaccggaa cggggtgttg cacaggcgca gattgtcggt 17760 attcttgaaa tgttcgatgc gccaatcgac ggatttgttc tgctcgacct tgcctgcgac 17820 ctgattattg gtaataatct ccgggatttc attgatcagg cttttctggg acaaaaagtc 17880 cagataggta tgcttcgacg tgtcgatgta tttacgcggg ccaatcagtg ccacgttatc 17940 atccacggcc aggagttcca tataggactg cacccacaac gggttcggcg ccatatcgca 18000 gtccaagatc gccacgtagt tgtatttcgc tgcccgcagg cccaggttcc gcacggcgca 18060 cagctggtag ccgtagtctt tctggcggac gtatttgatg ttcagcaacg actcgaactc 18120 gcggacgatc tcttcgatgt tttccttgga accgtcatcc gcgacgatga cctcatagtc 18180 ataaatcgtt ttctgattgc agaggcaggc cagggtgatc gccaggattt tggcgcgatt 18240 gtacgtcgga atcacgatgg acaggccgtc gatgatcagt tgcttgcgcg gataatcatc 18300 cagttcttta cgtttccctg cccagacgta gtcgttcgtg ctttccggca gcggcggcaa 18360 ggtcaggtcg ctcggccaat ccagcggaat gggttcgact tctttcaatt cggcgcgctc 18420 ggatttcttt gcggtaattt cccgatattt gctaatgatt tcattctttt ccacctcatt 18480 cagcgagatc gcctttgcat tgctgcacat aattttggtt gccgcgtcga tatcaatgac 18540 cgctttccga ttcagcttgt ccacttcttc gctcagattc agggcggttt ggcacagctt 18600 gatattggct tccacccagc tcacatcata gatttccgcc actttttcaa acagggagag 18660 ggcttggcgg tagttcttat tcttatacag attgattgcc tggttcaaaa tgctcattta 18720 ttaacctcct actagtgaat tttcgaatta cttaccgcag tacttgacac ccacctggga 18780 attgtttttg gtgcgtttga attggcggat ggtacggtag atgctaaagg gcaggctgat 18840 cagaccgagc ggaaaattgt tcttattgat gatgagcttg cccagctgat agctcaggtg 18900 tttcttgacc cgttcggctt cgtgtttatc cgcgtacagg aagatgctcg gcaggctcac 18960 ttggtactcc gaatcatatt tcttcttcca ggtccgccat tcgctgatca acgcaaacgg 19020 aatcgagatc agaccgagga acgtcttgga gcggctcacc atcaccgcac ccaggcggta 19080 gccgatatct tgcttgatgc gttcggccgc accatacagc tccggcagtt gtttcttttc 19140 gagacgttga ttgtcgatga agtactgttc gagcttttgc tgcaccagat gcagctgatt 19200 gagcagcaat tctttttcgc acgacagctt ttcgaggcgc tgttgttgca gttcattttt 19260 gttctgttcc tttttcagca gggactcgaa gttctcgatc gcgcactcca gttcctggac 19320 ctggatggtt ttgtttttaa tgatcagatc atactggatc agttcttcct tgctatccga 19380 cagctctttc agaatggctt gataggcgtt cagctgtttg gacgtgtgca gttcgttgtc 19440 cagaatgatc tttttgctgc tctggtacag accgttcacg atatcgaggg tgatctggcg 19500 ttgtttaatg aacgtctccc aaataaagga cggcttatag ttttccttct ccagcacccg 19560 caagggggtg ttggcgttcg attgcaattc aaagtacagt tccttgcaat cgggatagtc 19620 gttcaggacg ttgaagatca agtactcctc cgtctcgctt tgcttgaaaa tgatatcccc 19680 ggtcccgatg tcaataccgc tgagggacat gatctcctga tgttcttttt ccagcgtaat 19740 ggaggcttcg gcggtcttaa agtcattcac gctctgctcc agcgagtggt tgatggtatt 19800 ggagaacgac aacccgaatt tcagtttcag tttgtgttgc agttgctgga tgcagtcctc 19860 ggcgttgcgc ttcacctgtt cgctcgacac cagcaggcac cgaccccggt tgttgaggaa 19920 gaagtgcagc aaggcggtgt tgtatgccag ccagtttttg atcagatgct ccgaggtata 19980 gttgctggag atgttctggt ccgagaagta gttcgtcagg atgcttttgg ggtggtcgta 20040 gatgaggata aaggtgatgt tctcatccac cgatttccaa tattccaacg tgtgaattgc 20100 gttggggtcg ctccaaccgc acagtttctg gttcaggttg gacagcatca gatccaatgc 20160 gataccgttc cagacggtgc tcacatggag cggttcaaag tcggcggaat cggtcaccgt 20220 atagatgtcc ggcgactggt acgccttccg cagcgtctgg gtgatgtcct ggggcgagag 20280 gttctcacgt ttggacgggc acagggagtt catgccgcgc tgatgcagga gttcttccac 20340 gatttggtag ttgctgctcg gatggcccac gatcaccagg cggttcattt attaacctcc 20400 tttcgaaaat gaacggtccg ttaaatatag ccattcggat tcttcatctg ccagcgccag 20460 gcgtcctcca gcatggtttc gagttcccgc ttggctttcc agttcagata tttgttggcc 20520 ttttcggggg aggaccagct ctccgcgata tcaccgtcac ggcggctcac gatttcatac 20580 ggaatccgca cgccggaaat cttttcaaag gtggacacca gttccagcac cgaataacct 20640 ttacccgtgc ccaaattaaa gacgtggtag ttggtgttat tgtcgcggaa gagataggac 20700 agcgctgcga cgtgcccttc ggccaggtcc atcacatgga tatagtcacg gacccccgtg 20760 ccgtctttgg tgggataatc accaccgaac accatcagtt tttccagttt ccccatcgcg 20820 acctgcaaga tgtacggcac caagttggag gggatgtctg ccgggctttc accaatcata 20880 ccggattcgt gggcgcccgt cggattaaag tagcgcaagc agaggaaatt cgtgtcggag 20940 tatttcttgg cgatgtcgcg gatcatcagc tccgagatgt acttggacgt accatacgga 21000 ttcagcgtgc caccaatatg gcagtcttcg gtgacgggca tgatcttgct ttccccatac 21060 accgtcgccg acgagctaaa gatgaagttg gcgacgtcgt tcttgatggc gcaattgatg 21120 agttgcaggg tgccgctcac gttgttgtca tagtagaaga tgggcttgat caggctttct 21180 gcgaccgatt tcgcacctgc aaagtgcatg atgcagtcga atttgtgttt cttcaggatc 21240 tggttcactt ccttctcgtt gttgatattg agttcgtaga acgtgacttt cttctttgcg 21300 atcagctcaa tgcgacggat gctttcgcag ctgctgttga tgagattgtc aatgatgacg 21360 acattgtagc ctttgttcag caggcagagc gacgtgtggc tgccgatgta gcctgcaccg 21420 ccggtgacca ggatgttcat ttattaacct cctcggtccg aattaaccta ggttatgagg 21480 tcagcattgc ttcttcacgc gtttagtagt tgttttgttc ggtgatatat tcttcaatgc 21540 cttcttgcac gtcttcatgg aacgacacgg cgttgtcgtc tttaaacacg attgccacat 21600 cgcagaactc tttcaacgag ttcagcgagt gcgacaccat gaggaaggag ctttccttat 21660 gacgctcctt gaagagttgg gcacattttt ccttgaaacg ggcgtccccc accgccgtca 21720 cctcgtccac gatgtagtaa tcgaacttga acgccatgct caggccgaag ccgaggcggc 21780 tgcgcatacc gctcgaatag gtcttgatcg gcatatcaaa atacttcccc agctccgcga 21840 actcttccac aaactcaatc ttttctttca gctcctcctg cttcgcgtac agccgggcca 21900 cgaacttcac gttttcacgc ccggtcaagc tgccctggaa gccgcctgcc agacccaccg 21960 gccacgagat cgttttattc gtgatgattt taccgctatc cgggcggtcg atgcccccaa 22020 tcatgcgcaa cagcgtggat ttacccgccc cattgcgccc gatgaacgcc acgcttttgc 22080 cgctggggat ctcaatgttc aggttcttga agacatagtg acggcccacc ggggtgcggt 22140 agcttttcgt caggttttcg atcttaatca tgaggtcaac attgcctcct cacgcgtacg 22200 gtacagggcc aaaccaataa acagggtcac cagggtgaac attgccagat aattcaggct 22260 gaccccttcg ctgatataac cgggcatcac ggcctcgcgg ctcagttcga cgacgtgcac 22320 caggggattc cacagcaggt acgaccaata ctgcttcgga atggagtgca gcgggaacat 22380 gatgcacgaa ataaagtaca gcggcttcag caagatcggc aagactttct gcatttcggg 22440 gaacgtcttg cccacgacca tgaagatcag gcccacaccg cacgacagga tgatcaggag 22500 gctccaggtg agcacaaatt gcaggaagtt ggtaatctcg aaatattcgc ccgccatcca 22560 gatgatcagc atcaggagga tgtagaccgc cacatagatc agcgtttcca agagggcgcg 22620 tgcaatgatc gtgtcgatcg gcttcacggg ccggtagtta aacagcccct gattggcttc 22680 gatggcgccc acggagcgat tgctgatgct gctgaaaata aagaacggga tcaggccatt 22740 gagcaggaac accgggaagg agatatccgg catggtgcga tgcatgatat agccaaagat 22800 cccgagcaga atcagcagat gtgcgctcgg ttccaggatc gcccacagat agcccaggcg 22860 aaacttgcca aagcgcgtac ggatttcgcg gagaaacagt gcttcgaccg tcactttctg 22920 gacttcaaaa cccgaacgtg ccatttatta acctcctggt accaatctag attgtttaaa 22980 cagatctgtt acctgcagga ttattgtttc tgttgcataa agcctaaggg gtaggccttt 23040 ctagagatag ccattttttg cactcctgta tccgcttctt gcaaggctgg acttatccct 23100 atcaaaccgg acactgcagg ctgacaagct ttcattacat atgaagagtt tgtagaaacg 23160 caaaaaggcc atccgtcagg atggccttct aagaaggctc gagtggcgcg cctaagtcga 23220 atttctgcca ttcatccgct tattatactt attcaggcgt agcaccaggc gtttaagggc 23280 accaataact gccttaaaaa aattacgccc cgccctgcca ctcatcgcag tactgttgta 23340 attcattaag cattctgccg acatggaagc catcacagac ggcatgatga acctgaatcg 23400 ccagcggcat cagcaccttg tcgccttgcg tataatattt gcccatggtg aaaacggggg 23460 cgaagaagtt gtccatattg gccacgttta aatcaaaact ggtgaaactc acccagggat 23520 tggctgagac gaaaaacata ttctcaataa accctttagg gaaataggcc aggttttcac 23580 cgtaacacgc cacatcttgc gaatatatgt gtagaaactg ccggaaatcg tcgtggtatt 23640 cactccagag cgatgaaaac gtttcagttt gctcatggaa aacggtgtaa caagggtgaa 23700 cactatccca tatcaccagc tcaccgtctt tcattgccat acggaattcc ggatgagcat 23760 tcatcaggcg ggcaagaatg tgaataaagg ccggataaaa cttgtgctta tttttcttta 23820 cggtctttaa aaaggccgta atatccagct gaacggtctg gttataggta cattgagcaa 23880 ctgactgaaa tgcctcaaaa tgttctttac gatgccattg ggatatatca acggtggtat 23940 atccagtgat ttttttctcc attttagctt ccttagctcc tgaaaatctc gataactcaa 24000 aaaatacgcc cggtagtgat cttatttcat tatggtgaaa gttggaacct cttacgtgcc 24060 gatcaacgtc tcattttcgc caaaagttgg cccagggctt cccggtatca acagggacac 24120 caggatttat ttattctgcg aagtgatctt ccgtcacagg tatttattcg gcgcaaaggg 24180 cctcgtgata cgcctatttt tataggttaa tgtcatgata ataatggttt cttagacgtc 24240 aggtggcact tttcggggaa atgtgcgcgc ccgcgttcct gctggcgctg ggcctgtttc 24300 tggcgctgga cttcccgctg ttccgtcagc agcttttcgc ccacggcctt gatgatcgcg 24360 gcggccttgg cctgcatatc ccgattcaac ggccccaggg cgtccagaac gggcttcagg 24420 cgctcccgaa ggt 24433 <210> 36 <211> 24434 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 36 ctcgggccgt ctcttgggct tgatcggcct tcttgcgcat ctcacgcgct cctgcggcgg 60 cctgtagggc aggctcatac ccctgccgaa ccgcttttgt cagccggtcg gccacggctt 120 ccggcgtctc aacgcgcttt gagattccca gcttttcggc caatccctgc ggtgcatagg 180 cgcgtggctc gaccgcttgc gggctgatgg tgacgtggcc cactggtggc cgctccaggg 240 cctcgtagaa cgcctgaatg cgcgtgtgac gtgccttgct gccctcgatg ccccgttgca 300 gccctagatc ggccacagcg gccgcaaacg tggtctggtc gcgggtcatc tgcgctttgt 360 tgccgatgaa ctccttggcc gacagcctgc cgtcctgcgt cagcggcacc acgaacgcgg 420 tcatgtgcgg gctggtttcg tcacggtgga tgctggccgt cacgatgcga tccgccccgt 480 acttgtccgc cagccacttg tgcgccttct cgaagaacgc cgcctgctgt tcttggctgg 540 ccgacttcca ccattccggg ctggccgtca tgacgtactc gaccgccaac acagcgtcct 600 tgcgccgctt ctctggcagc aactcgcgca gtcggcccat cgcttcatcg gtgctgctgg 660 ccgcccagtg ctcgttctct ggcgtcctgc tggcgtcagc gttgggcgtc tcgcgctcgc 720 ggtaggcgtg cttgagactg gccgccacgt tgcccatttt cgccagcttc ttgcatcgca 780 tgatcgcgta tgccgccatg cctgcccctc ccttttggtg tccaaccggc tcgacggggg 840 cagcgcaagg cggtgcctcc ggcgggccac tcaatgcttg agtatactca ctagactttg 900 cttcgcaaag tcgtgaccgc ctacggcggc tgcggcgccc tacgggcttg ctctccgggc 960 ttcgccctgc gcggtcgctg cgctcccttg ccagcccgtg gatatgtgga cgatggccgc 1020 gagcggccac cggctggctc gcttcgctcg gcccgtggac aaccctgctg gacaagctga 1080 tggacaggct gcgcctgccc acgagcttga ccacagggat tgcccaccgg ctacccagcc 1140 ttcgaccaca tacccaccgg ctccaactgc gcggcctgcg gccttgcccc atcaattttt 1200 ttaattttct ctggggaaaa gcctccggcc tgcggcctgc gcgcttcgct tgccggttgg 1260 acaccaagtg gaaggcgggt caaggctcgc gcagcgaccg cgcagcggct tggccttgac 1320 gcgcctggaa cgacccaagc ctatgcgagt gggggcagtc gaaggcgaag cccgcccgcc 1380 tgccccccga gacctgcaga tccacatcct tgaaggccgc agcgacgagc agaaggaaac 1440 cctcattcgg gaagtcagcg aggccatctc gcgctccctg gatgcgccgc tgaccagcgt 1500 gcgagtgatt atcacggaga tggccaaggg ccacttcggc atcggcggcg aactggccag 1560 caaggtcaga cgctgaagtg gagatgccca agggcacttc gggtcgagga acccgacctg 1620 cattgggacg cggccacgga gagcgcgggc aaacgccggc actatagcca gtggagtttg 1680 taaaacgcta tttcagagct tggagagtgt ctaagaaagc cggggcgatg ccaacccatc 1740 ccttcttcgg ctatgcatcg ttcgtaatca agccacttcc tttttgcatt gacgcagggt 1800 gtcggaaggc aactcgccga acgcgctcct atagttttca gcgaagcgtc ccaaatgtaa 1860 gaagccgtag tctagggcta tctcagttat actacgcaca ttggcactgg gatcgttcaa 1920 gcaggcgcgg atgctttcga gcttgcggtt gcggatgtag ttcttcggcg tggtgccggc 1980 atgcttctcg aacaaattgt agagcgagcg tggactcatc atcgccagct ccgctaaccg 2040 ctcaaggctg atattccgtt tgagattctc ctcaatgaat tgaacgactc gctcgaaaga 2100 cgggttacct ttgctgaaaa tttcacggct gacattgctg cccagcattt cgagcagctt 2160 ggaagcgatg atccccgcat agtgctcttg gacccgaggc atcgactttg tatgttccgc 2220 ttcgtcacaa actaacccga gtagattgat aaagccatcg agttgctgga gattgtgtcg 2280 cgcggcgaaa cggataccct ccctcggctt gtgccaattg ttgtcactgc atgcccgatc 2340 aaggaccact gagggcaatt taacgataaa tttctcgcaa tcttctgaat aggtcaggtc 2400 ggcttggtca tccggattga gcagcaatag ttcgcccggc gcaaaatagt gctcctggcc 2460 atggccacgc cacaggcaat ggcctttgag tattatttgc agatgataac aggtctctaa 2520 tccaggcgag attaccctca cgctaccgcc gtagctgatt cgacacaggt cgaggcatcc 2580 gaagattctg tggtgcagcc tgcctgccgg gcgcccgccc ttgggcaggc gaatagagtg 2640 cgtaccgaca tactggttaa cataatcgga gactgcatag ggctcggcgt ggacgaagat 2700 ctgacttttc tcgttcaata agcaaaaatc catagttcac ggttctctta ttttaatgtg 2760 ggctgcttgg tgtgatgtag aaaggcgcca agtcgatgaa aatgcatctc gacgtgatgc 2820 gtatacgggt tacccccatt gccacgttgc gccatccttt ttgcaatcag tgaccacttt 2880 tccaagcaaa aataacgcca agcagaacga agacgttctt tttaagaagc gagaacacca 2940 gaagttcgtg ctgtcggggc atgcggcgac gaattggcgg ataaagggga tctgcaggtc 3000 ccgagcctca cggcggcgag tgcgggggtt ccaagggggc agcgccacct tgggcaaggc 3060 cgaaggccgc gcagtcgatc aacaagcccc ggaggggcca ctttttgccg gagggggagc 3120 cgcgccgaag gcgtggggga accccgcagg ggtgcccttc tttgggcacc aaagaactag 3180 atatagggcg aaatgcgaaa gacttaaaaa tcaacaactt aaaaaagggg ggtacgcaac 3240 agctcattgc ggcacccccc gcaatagctc attgcgtagg ttaaagaaaa tctgtaattg 3300 actgccactt ttacgcaacg cataattgtt gtcgcgctgc cgaaaagttg cagctgattg 3360 cgcatggtgc cgcaaccgtg cggcacccta ccgcatggag ataagcatgg ccacgcagtc 3420 cagagaaatc ggcattcaag ccaagaacaa gcccggtcac tgggtgcaaa cggaacgcaa 3480 agcgcatgag gcgtgggccg ggcttattgc gaggaaaccc acggcggcaa tgctgctgca 3540 tcacctcgtg gcgcagatgg gccaccagaa cgccgtggtg gtcagccaga agacactttc 3600 caagctcatc ggacgttctt tgcggacggt ccaatacgca gtcaaggact tggtggccga 3660 gcgctggatc tccgtcgtga agctcaacgg ccccggcacc gtgtcggcct acgtggtcaa 3720 tgaccgcgtg gcgtggggcc agccccgcga ccagttgcgc ctgtcggtgt tcagtgccgc 3780 cgtggtggtt gatcacgacg accaggacga atcgctgttg gggcatggcg acctgcgccg 3840 catcccgacc ctgtatccgg gcgagcagca actaccgacc ggccccggcg aggagccgcc 3900 cagccagccc ggcattccgg gcatggaacc agacctgcca gccttgaccg aaacggagga 3960 atgggaacgg cgcgggcagc agcgcctgcc gatgcccgat gagccgtgtt ttctggacga 4020 tggcgagccg ttggagccgc cgacacgggt cacgctgccg cgccggtagc acttgggttg 4080 cgcagcaacc cgtaagtgcg ctgttccaga ctatcggctg tagccgcctc gccgccctat 4140 accttgtctg cctccccgcg ttgcgtcgcg gtgcatggag ccgggccacc tcgacctgaa 4200 tggaagccgg cggcacctcg ctaacggatt caccgttttt atcaggctct gggaggcaga 4260 ataaatgatc atatcgtcaa ttattacctc cacggggaga gcctgagcaa actggcctca 4320 ggcatttgag aagcacacgg tcacactgct tccggtagtc aataaaccgg taaaccagca 4380 atagacataa gcggctattt aacgaccctg ccctgaaccg acgaccgggt cgaatttgct 4440 ttcgactatc ggcgcgccag agctcatcgt taatgtcttc gtgcgccgtc agtcggcgca 4500 cgttttttct ctctggtacc gtgtcactga tctagtcaat tactcgaagt atccacaagt 4560 gaagcatact aagtaatgta caagaatcaa aaaaatcggc tacgcaagtc gcgtagccga 4620 atcatttaag gatccttcca ttcaggtcga ggtggcccgg ctccatgcac cgcgacgcaa 4680 cgcggggagg cagacaaggt atagggcggc gcctacaatc catgccaacc cgttccatgt 4740 gctcgccgag gcggcataaa tcgccgtgac gatcagcggt ccagtgatcg aagttaggct 4800 ggtaagagcc gcgagcgatc cttgaagctg tccctgatgg tcgtcatcta cctgcctgga 4860 cagcatggcc tgcaacgcgg gcatcccgat gccgccggaa gcgagaagaa tcataatggg 4920 gaaggccatc cagcctcgcg tcgcgaacgc cagcaagacg tagcccagcg cgtcggccgc 4980 catgccggcg ataatggcct gcttctcgcc gaaacgtttg gtggcgggac cagtgacgaa 5040 ggcttgagcg agggcgtgca agattccgaa taccgcaagc gacaggccga tcatcgtcgc 5100 gctccagcga aagcggtcct cgccgaaaat gacccagagc gctgccggca cctgtcctac 5160 gagttgcatg ataaagaaga cagtcataag tgcggcgacg atagtcatgc cccgcgccca 5220 ccggaaggag ctgactgggt tgaaggctct caagggcatc ggtcgacgct ctcccttatg 5280 cgactcctgc attaggaagc agcccagtag taggttgagg ccgttgagca ccgccgccgc 5340 aaggaatggt gcatgcaagg agatggcgcc caacagtccc ccggccacgg ggcctgccac 5400 catacccacg ccgaaacaag cgctcatgag cccgaagtgg cgagcccgat cttccccatc 5460 ggtgatgtcg gcgatatagg cgccagcaac cgcacctgtg gcgccggtga tgccggccac 5520 gatgcgtccg gcgtacaaga tccacaggac gggtgtggtc gccatgatcg cgtagtcgat 5580 agtggctcca agtagcgaag cgagcaggac tgggcggcgg ccaaagcggt cggacagtgc 5640 tccgagaacg ggtgcgcata gaaattgcat caacgcatat agcgctagca gcacgccata 5700 gtgactggcg atgctgtcgg aatggacgat atcccgcaag aggcccggca gtaccggcat 5760 aaccaagcct atgcctacag catccagggt gacggtgccg aggatgacga tgagcgcatt 5820 gttagatttc atacacggtg cctgactgcg ttagcaattt aactgtgata aactaccgca 5880 ttaaagccga gcgatgataa gctgtcaaac atgagatccg ataaatcgat tgatagattt 5940 aaataagaac tgcagaagct agcttagatg ctcgtgaaat tgacgtgggc gctttgcagg 6000 gccgtcttaa tggcgttggt gtccacgagg atcgagtcgg gtgcggaaaa cggacggttc 6060 ttgttggtga aatcgctgtt accaatgtac agcgattcct tgttacgcag cgcctggatg 6120 tgccagcggg accacgaatc ccaatacttc tggcgatccg gcgagatacc ttggctggtg 6180 tagccggtcg tcgggctgtt catcaacgag tcggtgcggt gcgagcccag cgtcagcggc 6240 aacttgatcc gatgcaccgt ggaatcgccg aagatcagct tcagacgcgc gataaattcg 6300 ctatccgcac ccgttttcac acaatcccag acaccggcct tctgcaagac gtcggcacgg 6360 cgaaacagga gcgacgacgg attcagacgc ttcaaggggt acactgcgcg ggcatagaaa 6420 ataccgttgt cttgcaggcg cacccagtcc gagatggagc agatgagctt cggattgagc 6480 aacaaggggg agatttggcg gaacagcttt tccggatggc tccagtcatc cgaatcgtgg 6540 caggtgacga actcgccctt cgcttggatc aagccgatac gcttcgcggc ataggtgccg 6600 acattctgcg gcaggctaat gatcttgatg cgcgtgtctt tgagggcgag ccgctggaga 6660 cgaaacaggg tgtcatcggt gctcgcgtca tccacaatga tcagctcgaa ggaacggtag 6720 gtctgattga ggagcgaaat caccgcattt tccacgcggc gacccgtatt ataggtggtc 6780 atcaggatgg agatcaacgg ccccgtctgg gccgggtacg ggatgctggt gatgatgttg 6840 cacggggaga gcggggagct gttgtccgtc aaggccacgg ggctgaggcc gaagtattta 6900 tagtattcat tcagccgatt caggctaatt tcggcggttt cgcggaaggc gttattttgc 6960 agcagcagga tatccgggct atagacgata tcggatgcgt cgatctgggc gagggtcgag 7020 atggcctttt gggtcaggcc gatccggagt tgcagtgcgg tatacaggtc cagcgggcag 7080 ttgtccacgt tgtccaacag gctcaggcta aaggtcggcg agtaggacgc cagggttttc 7140 gccagttcca ctttctgatg ggtatcggtg aactcgtcct tgaactccat cagcagctcg 7200 ggcgtcaggc tgatgtcgcc gcaggcgatt tttgcgatct tgattgccag tttgcagcgc 7260 caatcggacg gggtatccgt caagttatgc agcgaccagt acatattcag acgatacatc 7320 gcgaggatgc gtttcgactg ccagaaccgg caatcatcct ggatggccgc gagcgcgtgg 7380 acgtagcggc tctttttgag cagccacaag aatttgagat tattgaacat ttattaacct 7440 cctgctagca acttaagtta cgaatcgacg ccgaacaggt cgcgggtgta gactttctcc 7500 gagacatctt ccagttcgct ggtgcggcga ttcgccacaa tgacatcgac gcgctcctta 7560 aaggaattga tgtcgcgctc gacgtaggaa ccgaagaagt agggttcttt caggaccggc 7620 tcgtacacca caatctcgat acccttggcc ttcaaacgtt tcatgacccc ctggatgctg 7680 ctggcccgga aattgtcgct acccgccttc atgatcaggc gatagatacc gaccactttg 7740 ggcttacggg acaggatgtc ctcggccacg aagtccttac gggtcgtatt cgcatccacg 7800 atggcctgga tcaggttttg cgggacgtcg cgataattgg ccaacagctg cttcgtatcc 7860 ttcggcagac agtaaccgcc gtagccgaag gacgggttgt tgtaatgttg accaatgcgc 7920 ggatcgaggg agacgccttc gatgatttgt ttggtatcca ggccgtgcac gctcgcgtag 7980 gtgtccagct cgttaaagta cgcgatacgc atcgccagat acgtgttcgc gaacagtttg 8040 atggcttctg cctcgggcga atccgtcagc aggatcggaa tatccttttt gatggcacct 8100 tccgacagga gttcggcgaa cttccgtgcg cgttccgacg attcgcccac gacaatgcgg 8160 ctcggataga gattatcata cagggctttg ccttcgcgca ggaactccgg ggaaaagatg 8220 atattattcg tgttcagatc gcgcttcagg cgttcggtga acccgacggg gacggtggat 8280 ttgataatga tggtcgcgtt cgggttaatg gacagcacgt cacacgcgac gctttcgacg 8340 ctcagggtat caaagttgtt attaatcgga tcatagttcg tcggggtggc gatgatcacg 8400 tagtctgcat cgcgatatgc ctcgtatttt tccgtcgtcg cgtagaggtt cagcttacga 8460 ttggagagaa acttctggat ttccgggtcg caaatcggcg agattttctt gttaatgagc 8520 tggaccttct tcgggtcgat gtccagggcg atgatgtcgt gtttttggga gaggaggatc 8580 gcaatgctga tacccacata gccgacgccg gccacggcaa ttttcattta ttaacctcct 8640 taagtgaatt caaactagtt tacaagtcgt tttcgatctt ctcccaggta tatttgcgac 8700 attcattcaa gttggtcagc ggcgagtatt tgtacttttt gataccgagg cgcgacaggc 8760 tttcgttcac caccttgaaa tggttttcct tttggatgtc cagtttcttg atcgacgtgt 8820 tctcgccgtg caggacacgg ttgtagcaaa tcttattgat atgcttaaac gggccgactt 8880 cgctgagttt caaatacata tcgtaatcca ccgcattgct gatgctctcg ttgaagcctt 8940 cggtgaggtt ccatgcacgc gccgtgaaca tacggaagtg gtggcagatc atcgcgctcg 9000 tgagcttttc gcggctgtaa atcggccagt tgtagccatt gctaatcaag ttaccttcac 9060 gatcaatatt gcgattggtg gtgtacacgc aggcgaggct caggtctttg cgaaattcat 9120 ccagacacag ttccacggca tcgggctcca ggaaatcatc ggaatccagc tgcccgatgt 9180 agaaaccccg gcacaggcgg actgcggtat tcgaggcgga gccgatgcct ttgtttttct 9240 ggctgatgaa acggacgcgc gggtggtttg cgtaatgttc ttgcaggatg cgcagcgtat 9300 catcggtgct cccgtcatcg cagatgcaga cctccagatc ggtgatcgtt tggttcagtg 9360 ccgattcgac gcagcgcacg atatatttgc tgcaattata cgcggggatg tagatgctca 9420 ccaggggcac acgtttcagg gtggcgctct cgattttctc cttcttgcga taaaagtagg 9480 gcaccttctg ctgcaacagc tggacggtaa tgtttttacc tgccgcgcga tcggtttcgt 9540 tctccttacc gggcggttcc tgatgatatg ccatcgcgcc ttccacgcta cggaaataac 9600 aaccctcgcg gtacagccga tagccgaact cattatcctc accgccccaa tgcgtgaact 9660 cttcgtcaaa ccaacccgcg cgaaacagcc acttctttgc aaacgccaca ttgccaccgc 9720 taaagaaccg gaacggggtg ttgcacaggc gcagattgtc ggtattcttg aaatgttcga 9780 tgcgccaatc gacggatttg ttctgctcga ccttgcctgc gacctgatta ttggtaataa 9840 tctccgggat ttcattgatc aggcttttct gggacaaaaa gtccagatag gtatgcttcg 9900 acgtgtcgat gtatttacgc gggccaatca gtgccacgtt atcatccacg gccaggagtt 9960 ccatatagga ctgcacccac aacgggttcg gcgccatatc gcagtccaag atcgccacgt 10020 agttgtattt cgctgcccgc aggcccaggt tccgcacggc gcacagctgg tagccgtagt 10080 ctttctggcg gacgtatttg atgttcagca acgactcgaa ctcgcggacg atctcttcga 10140 tgttttcctt ggaaccgtca tccgcgacga tgacctcata gtcataaatc gttttctgat 10200 tgcagaggca ggccagggtg atcgccagga ttttggcgcg attgtacgtc ggaatcacga 10260 tggacaggcc gtcgatgatc agttgcttgc gcggataatc atccagttct ttacgtttcc 10320 ctgcccagac gtagtcgttc gtgctttccg gcagcggcgg caaggtcagg tcgctcggcc 10380 aatccagcgg aatgggttcg acttctttca attcggcgcg ctcggatttc tttgcggtaa 10440 tttcccgata tttgctaatg atttcattct tttccacctc attcagcgag atcgcctttg 10500 cattgctgca cataattttg gttgccgcgt cgatatcaat gaccgctttc cgattcagct 10560 tgtccacttc ttcgctcaga ttcagggcgg tttggcacag cttgatattg gcttccaccc 10620 agctcacatc atagatttcc gccacttttt caaacaggga gagggcttgg cggtagttct 10680 tattcttata cagattgatt gcctggttca aaatgctcat ttattaacct cctactagtg 10740 aattttcgaa ttacttaccg cagtacttga cacccacctg ggaattgttt ttggtgcgtt 10800 tgaattggcg gatggtacgg tagatgctaa agggcaggct gatcagaccg agcggaaaat 10860 tgttcttatt gatgatgagc ttgcccagct gatagctcag gtgtttcttg acccgttcgg 10920 cttcgtgttt atccgcgtac aggaagatgc tcggcaggct cacttggtac tccgaatcat 10980 atttcttctt ccaggtccgc cattcgctga tcaacgcaaa cggaatcgag atcagaccga 11040 ggaacgtctt ggagcggctc accatcaccg cacccaggcg gtagccgata tcttgcttga 11100 tgcgttcggc cgcaccatac agctccggca gttgtttctt ttcgagacgt tgattgtcga 11160 tgaagtactg ttcgagcttt tgctgcacca gatgcagctg attgagcagc aattcttttt 11220 cgcacgacag cttttcgagg cgctgttgtt gcagttcatt tttgttctgt tcctttttca 11280 gcagggactc gaagttctcg atcgcgcact ccagttcctg gacctggatg gttttgtttt 11340 taatgatcag atcatactgg atcagttctt ccttgctatc cgacagctct ttcagaatgg 11400 cttgataggc gttcagctgt ttggacgtgt gcagttcgtt gtccagaatg atctttttgc 11460 tgctctggta cagaccgttc acgatatcga gggtgatctg gcgttgttta atgaacgtct 11520 cccaaataaa ggacggctta tagttttcct tctccagcac ccgcaagggg gtgttggcgt 11580 tcgattgcaa ttcaaagtac agttccttgc aatcgggata gtcgttcagg acgttgaaga 11640 tcaagtactc ctccgtctcg ctttgcttga aaatgatatc cccggtcccg atgtcaatac 11700 cgctgaggga catgatctcc tgatgttctt tttccagcgt aatggaggct tcggcggtct 11760 taaagtcatt cacgctctgc tccagcgagt ggttgatggt attggagaac gacaacccga 11820 atttcagttt cagtttgtgt tgcagttgct ggatgcagtc ctcggcgttg cgcttcacct 11880 gttcgctcga caccagcagg caccgacccc ggttgttgag gaagaagtgc agcaaggcgg 11940 tgttgtatgc cagccagttt ttgatcagat gctccgaggt atagttgctg gagatgttct 12000 ggtccgagaa gtagttcgtc aggatgcttt tggggtggtc gtagatgagg ataaaggtga 12060 tgttctcatc caccgatttc caatattcca acgtgtgaat tgcgttgggg tcgctccaac 12120 cgcacagttt ctggttcagg ttggacagca tcagatccaa tgcgataccg ttccagacgg 12180 tgctcacatg gagcggttca aagtcggcgg aatcggtcac cgtatagatg tccggcgact 12240 ggtacgcctt ccgcagcgtc tgggtgatgt cctggggcga gaggttctca cgtttggacg 12300 ggcacaggga gttcatgccg cgctgatgca ggagttcttc cacgatttgg tagttgctgc 12360 tcggatggcc cacgatcacc aggcggttca tttattaacc tcctttcgaa aatgaacggt 12420 ccgttaaata tagccattcg gattcttcat ctgccagcgc caggcgtcct ccagcatggt 12480 ttcgagttcc cgcttggctt tccagttcag atatttgttg gccttttcgg gggaggacca 12540 gctctccgcg atatcaccgt cacggcggct cacgatttca tacggaatcc gcacgccgga 12600 aatcttttca aaggtggaca ccagttccag caccgaataa cctttacccg tgcccaaatt 12660 aaagacgtgg tagttggtgt tattgtcgcg gaagagatag gacagcgctg cgacgtgccc 12720 ttcggccagg tccatcacat ggatatagtc acggaccccc gtgccgtctt tggtgggata 12780 atcaccaccg aacaccatca gtttttccag tttccccatc gcgacctgca agatgtacgg 12840 caccaagttg gaggggatgt ctgccgggct ttcaccaatc ataccggatt cgtgggcgcc 12900 cgtcggatta aagtagcgca agcagaggaa attcgtgtcg gagtatttct tggcgatgtc 12960 gcggatcatc agctccgaga tgtacttgga cgtaccatac ggattcagcg tgccaccaat 13020 atggcagtct tcggtgacgg gcatgatctt gctttcccca tacaccgtcg ccgacgagct 13080 aaagatgaag ttggcgacgt cgttcttgat ggcgcaattg atgagttgca gggtgccgct 13140 cacgttgttg tcatagtaga agatgggctt gatcaggctt tctgcgaccg atttcgcacc 13200 tgcaaagtgc atgatgcagt cgaatttgtg tttcttcagg atctggttca cttccttctc 13260 gttgttgata ttgagttcgt agaacgtgac tttcttcttt gcgatcagct caatgcgacg 13320 gatgctttcg cagctgctgt tgatgagatt gtcaatgatg acgacattgt agcctttgtt 13380 cagcaggcag agcgacgtgt ggctgccgat gtagcctgca ccgccggtga ccaggatgtt 13440 catttattaa cctcctcggt ccgaattaac ctaggttatg aggtcagcat tgcttcttca 13500 cgcgtttagt agttgttttg ttcggtgata tattcttcaa tgccttcttg cacgtcttca 13560 tggaacgaca cggcgttgtc gtctttaaac acgattgcca catcgcagaa ctctttcaac 13620 gagttcagcg agtgcgacac catgaggaag gagctttcct tatgacgctc cttgaagagt 13680 tgggcacatt tttccttgaa acgggcgtcc cccaccgccg tcacctcgtc cacgatgtag 13740 taatcgaact tgaacgccat gctcaggccg aagccgaggc ggctgcgcat accgctcgaa 13800 taggtcttga tcggcatatc aaaatacttc cccagctccg cgaactcttc cacaaactca 13860 atcttttctt tcagctcctc ctgcttcgcg tacagccggg ccacgaactt cacgttttca 13920 cgcccggtca agctgccctg gaagccgcct gccagaccca ccggccacga gatcgtttta 13980 ttcgtgatga ttttaccgct atccgggcgg tcgatgcccc caatcatgcg caacagcgtg 14040 gatttacccg ccccattgcg cccgatgaac gccacgcttt tgccgctggg gatctcaatg 14100 ttcaggttct tgaagacata gtgacggccc accggggtgc ggtagctttt cgtcaggttt 14160 tcgatcttaa tcatgaggtc aacattgcct cctcacgcgt acggtacagg gccaaaccaa 14220 taaacagggt caccagggtg aacattgcca gataattcag gctgacccct tcgctgatat 14280 aaccgggcat cacggcctcg cggctcagtt cgacgacgtg caccagggga ttccacagca 14340 ggtacgacca atactgcttc ggaatggagt gcagcgggaa catgatgcac gaaataaagt 14400 acagcggctt cagcaagatc ggcaagactt tctgcatttc ggggaacgtc ttgcccacga 14460 ccatgaagat caggcccaca ccgcacgaca ggatgatcag gaggctccag gtgagcacaa 14520 attgcaggaa gttggtaatc tcgaaatatt cgcccgccat ccagatgatc agcatcagga 14580 ggatgtagac cgccacatag atcagcgttt ccaagagggc gcgtgcaatg atcgtgtcga 14640 tcggcttcac gggccggtag ttaaacagcc cctgattggc ttcgatggcg cccacggagc 14700 gattgctgat gctgctgaaa ataaagaacg ggatcaggcc attgagcagg aacaccggga 14760 aggagatatc cggcatggtg cgatgcatga tatagccaaa gatcccgagc agaatcagca 14820 gatgtgcgct cggttccagg atcgcccaca gatagcccag gcgaaacttg ccaaagcgcg 14880 tacggatttc gcggagaaac agtgcttcga ccgtcacttt ctggacttca aaacccgaac 14940 gtgccattta ttaacctcct ggtaccaatc tagattgttt aaacagatcc aatctagatt 15000 gtttaaactt ctgcagaaca cgcggtgtta acgtttctta tacttcttaa ttttgttaaa 15060 gatcatttcg ccgtagtaca ccgcattgac ctgggtcttc accagcaagt agccgcgaaa 15120 tttcttaaac aacttcatgt tcggtttaaa gtcggcttgc cagaactgat gcaaatgccc 15180 ctggtacgtc agacccttga tatcgtacaa ggcgttgccc atgactttca ggggcttgtt 15240 gtggatcaac gcggaaatgc cggccgtgct attgatggtg accaccgctt tggcgtggcg 15300 caacagctcc ggcatgggca gatcgtgcac atagatgaca cgttcatcca aaccgtattc 15360 cttcgacaga cgcttgatca acgggcggta caggcggtgc ccgcgatcca tcgggtgatg 15420 tttgatcacc agataggact ccttgggggc cttgcgggaa aagctgtaca tcacttcgtt 15480 gatgtaatca cgcacatcat tatagttgct atggttgcgg atctggctgt cgttgtacac 15540 ttgcaggacc gccaggtaat agcgctgatc cagctcgttc atcaggcggg ggaggacctt 15600 gcgttgggtg accttataca gctgtttgcg ccagtaggcg cggacccagc agcgcgcttc 15660 ataccacggg ctgaacgatt tgtggtggcg atagcgcgga aattcgtgac gatagtgcca 15720 acccatcagg taataccaca tggcgtggcc gatgcgcttc atggtgctcg gtttcaggtt 15780 ctcgacgtgc ggcgtcggca tatcgggcaa tttgcggtaa aagtccggat cgcggggcaa 15840 gctgctatag gcgttcacac cgccttcttc cacggtgata aattgcggac gcaggtagcc 15900 ttcctcgaag gccagaaaac gaatcccctt cgacttggcc cagcgtttgg cctccttgtg 15960 cagcaggcgg cagtcaccga aacacaaaat cgtgtcaaag tcatactgac gatgcaagtc 16020 ccgcagccaa ccggggaact ccttcggggt ttggtagtac gccaggtatt ggcggtggcg 16080 gcagtagaag cgatcaccgc cattaaagac gacgttgacc gcgttgcgac cgaggctctc 16140 caaccattcc gccacatcgt tgaagaacgg acccatcgga ccttggagca ggaggtactt 16200 tttaccgctc aacagcaccg tcagcgcatt gccgtgcatt tattaacctc ctaacacgcg 16260 gtgttaagcg ttttcggcga gctcttaacc aaagcgcact ttgcagaaca tgatcaactt 16320 gcgatagtag cgaatcacac ggccggcttt cttgcgggtg ataaagatgg gtttgcgggg 16380 cgttttgatc agatattctg ccgcttcctc caccgtgatc ggctgcaacc gcgtcggatg 16440 aatataggtg ggatagacaa tcagggcttg atagatcagg tcggcgatgg tcagccgccg 16500 ctcgcgacgg gggcagtggt gctcatcgac ggtcaggccc cacgaggcgt agaacggcag 16560 gccgtagcag tgcacctgtt taccgtgcag caatgcttca aagccgctga ggctcgtcat 16620 cgtgtgcacc tcgtccgcac gctgaataca ctgaatgata tcggcatcca gtgcctggta 16680 gtctgcgagt tccgcgatct gttccgccgg aatgtcaccc ttacggttgc cgacgagcac 16740 atcggggtgc ggcttgtaga tgatgtaggc gtgcggatta cgttcccgca cggtgcgcag 16800 cagctccaga ttcgacttga tcgacacggt gcccgtctta atcgacgcat cgtcttccac 16860 ctggcccggc accaggatga ctttcttgtc cttcgcttct gccgggaggc tgaaatcggc 16920 ccccaggtta tatttgctca atttgctttc caccagacgt tggcgcaact tttccgcgcg 16980 catctggtgc gcgagggtca gctggctgtg attcagcagg acctccagtt ccgacggacg 17040 ggtggcatcg taatagatac cgcgcttatc caggaccagg ctcaacggcg gcagcagatc 17100 gctccccagg ccggagctgc gcaggaagcc gtcttccatg cgccacagcg gcagggattt 17160 gcgctgtgcc tccgcacgcc attgctgttc gcctttcacg ccccacacga cgcaggcgct 17220 tgctgcggta cagcgacggg aaaaggagag acgattcgtg gccgtttgca ggaagggctt 17280 caggatcgcg cttttccaca gggtcaggcc cggcacccag agataaccat tccgctgttg 17340 caggtgacga cgttgcagct ggagccattg gagcaccgtg aacagggccg acacctcccc 17400 ggtctgcgga tcaatgtagc ggcaatagcg cagataggcc gctgcgaaca gttcctccag 17460 ggtggccgag ccgcgacgcg ccgacagcag cgccgattgg gggtggcggt catcggtgag 17520 gccccaccct gcataccagg gttggccaaa gcaggtcacg ggcttaccgg ccagcagggc 17580 ttcaaaaccg tactgggagg tcacgacgta cacgcgggac acatgacgca gcagggactg 17640 cggcgacacg ttttccgcaa tcaggcgcac gcgctgggtg gcacgcaagt ccgcgaagta 17700 gccggtcttt ttcccttcca ggacatcggg atgcactttg acccagattt ctgcctgcgg 17760 gttttccgcc atcgctgctt ccagcattgc ggcgaactca tgggggcctg cgttgccgta 17820 ggtcacgctc atgtcattga aggtctggtc caccaccagc acgatgttcg tgcgctcgct 17880 ttcatccgcc acgaacgccg gtgccaggtt gtacttgctc atgtcgcccg tcacaatggt 17940 gtgcatcgcc tcgcgcgcct gatccgccag ggccgcgttg ccggccttgt cctgcacgag 18000 tttttccagc gcgctcggtt tcgaggcgtc gtagtaaatg ccgcagtcat ccacgacgag 18060 cgagaggggc ggttcaccgt tcacgcccag gtccagcgag cggacgaaac catcctccaa 18120 gcggatcacc ggcttgcctg cggctttggc gatggccacc ggctttgcgg ccgaggggcg 18180 gtgcccccac accgcgattg catccacttc ctgcgggacc gggcgcagca gcgacagctt 18240 ttggcagggc tgggcgagga atttttccag gtgcggaata cgccaaatgc cggggctata 18300 aatgccaatc atgcgttctc cgcgagctcc tgcgccatca gggcccggac cttctccaag 18360 cacgccgggg tatcgacgcc gggaccggtc gcggcgacct cgaaggtgcg aatgttaatg 18420 cccgcgctca tcagccgcag ttgctccagg gattcggcct gttcgggcat ggactccggc 18480 aactggctgt aattttgcag gacatcccgc cgataggcgt agatcccgac gtgcttcagg 18540 tagcgcgcct tctcggcgtt gcgcgggtac ggaatggggg agcgggagaa atacagggcg 18600 tcctgccgcg tgttcaccac gaccttgacg gtggacggtt cggcggcttc tgccgcgctg 18660 atcgcatgac acagggtcgc caccggcagc gccgggtcgt cccgcatacc ttgcagcagg 18720 gtttcgacgt cacgcgggcg aatcatcggc tcatcccctt gcaggttgat atagatatcc 18780 gcctccacct tatgcatgac ttccaccagg cgatcggtgc cgctctcatg atcgttgcgg 18840 gtcatgatcg ctttgccgcc gaacgcctgg actgcctgct ccacacgcgg gtcgtcggtt 18900 gcgacccaca cctctgccac gcctgccact tgcagggccc gttcgtagac gtgctggatc 18960 atcggtttcc cgacgatatc cagcagcggt ttgcccggca gacggctgct gccgtagcgt 19020 gccgggatca caatcacggc cttcgacatt tattaacctc ctcgagttac agcgacagaa 19080 tcactttcgc gcccaccgcc agttggtaca gaatggtgct gataccgcgc gtcacttcga 19140 tgttcttcga ctcgtatttc ggcaacacca taatttcatc accgggtttc agggaatcga 19200 cgtcttctgc gttcaccgct gcgccgttct gacggatgac gataatacgg gcgttgccgg 19260 acttctgggt cagcccaccg cacttctcga tgtagtcctc ggtcgtcata cctttctgcc 19320 acgacaccgc gttcgggaac agcacttccc cgtggaccat gaccaacgac gtcttttcgg 19380 gaatattgat cacgtcgccg tcctccagga ggacggagtc aatgttgctt tcattgagga 19440 tcacttcgcc cttcggcacg acggtgcggg ctttcgcgac gaagcgggag atcagttggg 19500 cttcctgcat acgcaggctg gcctcttcct tggtgctgct ctgtgcgctg aggctggcct 19560 cttcgagctt ttgcagggac aaattcagca tttctttctg ccgttgcgcg acgctcggcc 19620 gatacaactg cacggcgttc atctgcgaca tggagttcgg gcgcactttt tcgagcacgg 19680 cccgcatggt gctaccgtag ggcagcacca tggcgtgttc cccggaatgt gcgccttcca 19740 cacgcacttg aatggtgccc gcatagcggt cggtggagac aatgagggta tcaccgtttt 19800 gcagcatacg ccccggtgcg gacgagatcg gataatattc cgagcgcttc tggaggccct 19860 gcttccgcat aatcgtgata tgggtcgcac ccggtttggg acgtgcccag gacagtgctt 19920 cggtgaccgg gatgctcgat tcgcgaaatt caaagtcgta ggaattgaac acatcgccct 19980 gcaccgagaa cgtatgctgg cgcggaccca caatgatcgt atcaccgtcc gcaaactggg 20040 acagccccag tttgccgttg agcaggaagt catagaggtt gacgttcgag cgcacacgat 20100 tgccgcgttt cacgacgatg tccacgtagc tgccgcgttc cgggtccaca ccacccgcct 20160 tgatcaggta gttcagcagg ctgtcggagg tgacaccgcc gtacaggccg gggttgcgga 20220 caaagccggt cacatagacc ttgaccggct gcgcctgcaa gagcgacgca tagacgttca 20280 cgttgctctg gtagacttcc ttcaccttgc tcgtcaccag cgcgttcaac tgggagttcg 20340 acacacctgc gactttgacg gggccgacat tcggcaggaa gatgttgccc ttcgggtcca 20400 cctggagtgc gccatcgaag gtgaacgcac cccacaggcg gacctggatg gaatcgccgg 20460 gattcaggat gtagtccgga ttgaaaccca cggttgcccc cgagtctgcg ctcgtaccgt 20520 tgaacagctg cgccccgaac atacggctca tcacgaccgg gggtgcgggg ggcggggtgt 20580 tatcgaagcc gctcatgttc tgggtgtcgc ttttctgccc gttcaggatg ccggtcaacg 20640 gtgcggcacc cgtgaggttc ggatcggcat taatgtcgat ggttgcgctc gcctgtgctg 20700 catggcacgc tgcgatcagc aggatcgact taaacagctt catttattaa cctcctcgag 20760 aagtcgactt agtcacggtg gtcttcaatc accgccagga gcaatttcag ggtgccaaag 20820 agcaggcaac acaccagcag ccaacacgcg atcaaatacg ggatattcgg gaaggagctt 20880 tcctggggca gctgcgggga cgagatcacg ctcaggactt tcagcttacg ggccgcttcg 20940 acacgggtct tttcgatgct ggtgagcgtg agcttgtaca actcggtatt gaactcgacc 21000 ttggatttga tctcctcaaa atccacggcc atgcggttca gtttatcgcc ctggggtgcg 21060 gtaattttcg acttttcttc gtcgatctgt gcctggaggc tctgaattgc attgcgggcg 21120 ctcacgactt ggggcgcatc ctcgcgcagg tacgtgagca ggttgcgcag gtcggcttcc 21180 atctgaattt tctggcccat cagcgtattc accagggtgg atgccgcctg ggcctgtgcc 21240 tgcgggtcca gcacattgtt gttgtcttgg taggacaaca attcggcttt cgatgcatcc 21300 agccgctggc gcgctttttc catttcggtt tccgcaaacg ccaattgatc gcgggcgata 21360 cggtgcgaca tttcattgat gaaccgctcg gattccttga gcacggtctg gttgaatttc 21420 agcgcgaact cgggcgaaaa gccctgggtc tggatgttca gcagcccggt cttgtcgtcg 21480 tagctgacgt tgatgcgatc tttatagtac ttcaggaacc cctcggcggt ttcatccttg 21540 gacagatggt tcaggaagtc caggcccgaa tgggagaacg cttcgcggaa gttcagctgt 21600 ttatccagcg cggccagcat atccgggctg ttgatgtatt ccttcaggta cagtgcgtct 21660 tcggcggacg acgggttgga ggcacccaac agcaggccga agttcaggct gccggagttg 21720 agatcgtcgc tgcgcttgat ggccaccttg ctttccgaca tatagcgggg ctgggagaag 21780 atcgccaagt agatcagcag caccgccatg ggtgccagaa taatgatttt tgccaggtgc 21840 ttctgaatat ctgccaggct gatcgcgctc agacgcgcac gcatccacga gacggcgctt 21900 ttcactttga tcagcattta ttaacctcct gtcgacaaca cgtgttaatc gaaaatgcgc 21960 accaacccgg tcaccttatt tgctttgttg gtcaccagca gggtcgagac gcggtgtttc 22020 tgcatcttct cttctgcttc gatgatcatg gtgtcttcgg gcaaggtcag cggttcgcgg 22080 gtcatcatct gtgcggccgt tgcgctcgtc aggctgtctt ctttctccat aaagcgccgc 22140 agatcgccat cggtgatgat gcctgccagc ccaccttccg catcttcgac catcaccata 22200 ccctggcagc ccgaggtgat gcgctgaatg accgttttga agctggcatc gagctgcact 22260 gccggcacat catgttgcat cacgtcggcg acgcgggtca gcaggcgccg acccaggctg 22320 ccaccggggt ggtagcgtgc aaagtcattg ggcataaact tacgctggtg aatcatcgcg 22380 atggccagcg cgtccccgat cgccatcgtg agcgtcgtgg aggtggtcgg ggcgagattg 22440 ttcgggcacg tttcgttcgc catgtgcagc tccaggaccg catctgcatt tttggccagg 22500 gtgctattcc cgttattggt gattgcgatg atgcgattgc cgaagttctt caggctcggc 22560 accagtttca ggatctcgtc cgtctcaccg ctcgccgaaa tcaagatgag caggtcatac 22620 ggggtgatca tgcccagatc accatggaac gcttccgccg gatgaataaa gaaggagggc 22680 gtcccggtcg aggccaaggt cgccgacatc ttgcggccca catggccgct tttacccatg 22740 ccgctcagga tgacgtgccc tttacaattc atgatgagat tcaggacgcg ctggtactga 22800 ccgctatcca gttgtttgga caggttttgc agtgccgcgc tttgttcggc cagggtctgg 22860 cggacgctcg taatcagata cggatcaatg gtcgaggact ggtcatccgg caagtggcgt 22920 tcgctcattt attaacctcc tcacgtgtta attaagtaat cgatagtgat ttaaatatgc 22980 aagatctagt tacctgcagg attattgttt ctgttgcata aagcctaagg ggtaggcctt 23040 tctagagata gccatttttt gcactcctgt atccgcttct tgcaaggctg gacttatccc 23100 tatcaaaccg gacactgcag gctgacaagc tttcattaca tatgaagagt ttgtagaaac 23160 gcaaaaaggc catccgtcag gatggccttc taagaaggct cgagtggcgc gcctaagtcg 23220 aatttctgcc attcatccgc ttattatact tattcaggcg tagcaccagg cgtttaaggg 23280 caccaataac tgccttaaaa aaattacgcc ccgccctgcc actcatcgca gtactgttgt 23340 aattcattaa gcattctgcc gacatggaag ccatcacaga cggcatgatg aacctgaatc 23400 gccagcggca tcagcacctt gtcgccttgc gtataatatt tgcccatggt gaaaacgggg 23460 gcgaagaagt tgtccatatt ggccacgttt aaatcaaaac tggtgaaact cacccaggga 23520 ttggctgaga cgaaaaacat attctcaata aaccctttag ggaaataggc caggttttca 23580 ccgtaacacg ccacatcttg cgaatatatg tgtagaaact gccggaaatc gtcgtggtat 23640 tcactccaga gcgatgaaaa cgtttcagtt tgctcatgga aaacggtgta acaagggtga 23700 acactatccc atatcaccag ctcaccgtct ttcattgcca tacggaattc cggatgagca 23760 ttcatcaggc gggcaagaat gtgaataaag gccggataaa acttgtgctt atttttcttt 23820 acggtcttta aaaaggccgt aatatccagc tgaacggtct ggttataggt acattgagca 23880 actgactgaa atgcctcaaa atgttcttta cgatgccatt gggatatatc aacggtggta 23940 tatccagtga tttttttctc cattttagct tccttagctc ctgaaaatct cgataactca 24000 aaaaatacgc ccggtagtga tcttatttca ttatggtgaa agttggaacc tcttacgtgc 24060 cgatcaacgt ctcattttcg ccaaaagttg gcccagggct tcccggtatc aacagggaca 24120 ccaggattta tttattctgc gaagtgatct tccgtcacag gtatttattc ggcgcaaagg 24180 gcctcgtgat acgcctattt ttataggtta atgtcatgat aataatggtt tcttagacgt 24240 caggtggcac ttttcgggga aatgtgcgcg cccgcgttcc tgctggcgct gggcctgttt 24300 ctggcgctgg acttcccgct gttccgtcag cagcttttcg cccacggcct tgatgatcgc 24360 ggcggccttg gcctgcatat cccgattcaa cggccccagg gcgtccagaa cgggcttcag 24420 gcgctcccga aggt 24434 <210> 37 <211> 22773 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 37 ctcgggccgt ctcttgggct tgatcggcct tcttgcgcat ctcacgcgct cctgcggcgg 60 cctgtagggc aggctcatac ccctgccgaa ccgcttttgt cagccggtcg gccacggctt 120 ccggcgtctc aacgcgcttt gagattccca gcttttcggc caatccctgc ggtgcatagg 180 cgcgtggctc gaccgcttgc gggctgatgg tgacgtggcc cactggtggc cgctccaggg 240 cctcgtagaa cgcctgaatg cgcgtgtgac gtgccttgct gccctcgatg ccccgttgca 300 gccctagatc ggccacagcg gccgcaaacg tggtctggtc gcgggtcatc tgcgctttgt 360 tgccgatgaa ctccttggcc gacagcctgc cgtcctgcgt cagcggcacc acgaacgcgg 420 tcatgtgcgg gctggtttcg tcacggtgga tgctggccgt cacgatgcga tccgccccgt 480 acttgtccgc cagccacttg tgcgccttct cgaagaacgc cgcctgctgt tcttggctgg 540 ccgacttcca ccattccggg ctggccgtca tgacgtactc gaccgccaac acagcgtcct 600 tgcgccgctt ctctggcagc aactcgcgca gtcggcccat cgcttcatcg gtgctgctgg 660 ccgcccagtg ctcgttctct ggcgtcctgc tggcgtcagc gttgggcgtc tcgcgctcgc 720 ggtaggcgtg cttgagactg gccgccacgt tgcccatttt cgccagcttc ttgcatcgca 780 tgatcgcgta tgccgccatg cctgcccctc ccttttggtg tccaaccggc tcgacggggg 840 cagcgcaagg cggtgcctcc ggcgggccac tcaatgcttg agtatactca ctagactttg 900 cttcgcaaag tcgtgaccgc ctacggcggc tgcggcgccc tacgggcttg ctctccgggc 960 ttcgccctgc gcggtcgctg cgctcccttg ccagcccgtg gatatgtgga cgatggccgc 1020 gagcggccac cggctggctc gcttcgctcg gcccgtggac aaccctgctg gacaagctga 1080 tggacaggct gcgcctgccc acgagcttga ccacagggat tgcccaccgg ctacccagcc 1140 ttcgaccaca tacccaccgg ctccaactgc gcggcctgcg gccttgcccc atcaattttt 1200 ttaattttct ctggggaaaa gcctccggcc tgcggcctgc gcgcttcgct tgccggttgg 1260 acaccaagtg gaaggcgggt caaggctcgc gcagcgaccg cgcagcggct tggccttgac 1320 gcgcctggaa cgacccaagc ctatgcgagt gggggcagtc gaaggcgaag cccgcccgcc 1380 tgccccccga gacctgcaga tccacatcct tgaaggccgc agcgacgagc agaaggaaac 1440 cctcattcgg gaagtcagcg aggccatctc gcgctccctg gatgcgccgc tgaccagcgt 1500 gcgagtgatt atcacggaga tggccaaggg ccacttcggc atcggcggcg aactggccag 1560 caaggtcaga cgctgaagtg gagatgccca agggcacttc gggtcgagga acccgacctg 1620 cattgggacg cggccacgga gagcgcgggc aaacgccggc actatagcca gtggagtttg 1680 taaaacgcta tttcagagct tggagagtgt ctaagaaagc cggggcgatg ccaacccatc 1740 ccttcttcgg ctatgcatcg ttcgtaatca agccacttcc tttttgcatt gacgcagggt 1800 gtcggaaggc aactcgccga acgcgctcct atagttttca gcgaagcgtc ccaaatgtaa 1860 gaagccgtag tctagggcta tctcagttat actacgcaca ttggcactgg gatcgttcaa 1920 gcaggcgcgg atgctttcga gcttgcggtt gcggatgtag ttcttcggcg tggtgccggc 1980 atgcttctcg aacaaattgt agagcgagcg tggactcatc atcgccagct ccgctaaccg 2040 ctcaaggctg atattccgtt tgagattctc ctcaatgaat tgaacgactc gctcgaaaga 2100 cgggttacct ttgctgaaaa tttcacggct gacattgctg cccagcattt cgagcagctt 2160 ggaagcgatg atccccgcat agtgctcttg gacccgaggc atcgactttg tatgttccgc 2220 ttcgtcacaa actaacccga gtagattgat aaagccatcg agttgctgga gattgtgtcg 2280 cgcggcgaaa cggataccct ccctcggctt gtgccaattg ttgtcactgc atgcccgatc 2340 aaggaccact gagggcaatt taacgataaa tttctcgcaa tcttctgaat aggtcaggtc 2400 ggcttggtca tccggattga gcagcaatag ttcgcccggc gcaaaatagt gctcctggcc 2460 atggccacgc cacaggcaat ggcctttgag tattatttgc agatgataac aggtctctaa 2520 tccaggcgag attaccctca cgctaccgcc gtagctgatt cgacacaggt cgaggcatcc 2580 gaagattctg tggtgcagcc tgcctgccgg gcgcccgccc ttgggcaggc gaatagagtg 2640 cgtaccgaca tactggttaa cataatcgga gactgcatag ggctcggcgt ggacgaagat 2700 ctgacttttc tcgttcaata agcaaaaatc catagttcac ggttctctta ttttaatgtg 2760 ggctgcttgg tgtgatgtag aaaggcgcca agtcgatgaa aatgcatctc gacgtgatgc 2820 gtatacgggt tacccccatt gccacgttgc gccatccttt ttgcaatcag tgaccacttt 2880 tccaagcaaa aataacgcca agcagaacga agacgttctt tttaagaagc gagaacacca 2940 gaagttcgtg ctgtcggggc atgcggcgac gaattggcgg ataaagggga tctgcaggtc 3000 ccgagcctca cggcggcgag tgcgggggtt ccaagggggc agcgccacct tgggcaaggc 3060 cgaaggccgc gcagtcgatc aacaagcccc ggaggggcca ctttttgccg gagggggagc 3120 cgcgccgaag gcgtggggga accccgcagg ggtgcccttc tttgggcacc aaagaactag 3180 atatagggcg aaatgcgaaa gacttaaaaa tcaacaactt aaaaaagggg ggtacgcaac 3240 agctcattgc ggcacccccc gcaatagctc attgcgtagg ttaaagaaaa tctgtaattg 3300 actgccactt ttacgcaacg cataattgtt gtcgcgctgc cgaaaagttg cagctgattg 3360 cgcatggtgc cgcaaccgtg cggcacccta ccgcatggag ataagcatgg ccacgcagtc 3420 cagagaaatc ggcattcaag ccaagaacaa gcccggtcac tgggtgcaaa cggaacgcaa 3480 agcgcatgag gcgtgggccg ggcttattgc gaggaaaccc acggcggcaa tgctgctgca 3540 tcacctcgtg gcgcagatgg gccaccagaa cgccgtggtg gtcagccaga agacactttc 3600 caagctcatc ggacgttctt tgcggacggt ccaatacgca gtcaaggact tggtggccga 3660 gcgctggatc tccgtcgtga agctcaacgg ccccggcacc gtgtcggcct acgtggtcaa 3720 tgaccgcgtg gcgtggggcc agccccgcga ccagttgcgc ctgtcggtgt tcagtgccgc 3780 cgtggtggtt gatcacgacg accaggacga atcgctgttg gggcatggcg acctgcgccg 3840 catcccgacc ctgtatccgg gcgagcagca actaccgacc ggccccggcg aggagccgcc 3900 cagccagccc ggcattccgg gcatggaacc agacctgcca gccttgaccg aaacggagga 3960 atgggaacgg cgcgggcagc agcgcctgcc gatgcccgat gagccgtgtt ttctggacga 4020 tggcgagccg ttggagccgc cgacacgggt cacgctgccg cgccggtagc acttgggttg 4080 cgcagcaacc cgtaagtgcg ctgttccaga ctatcggctg tagccgcctc gccgccctat 4140 accttgtctg cctccccgcg ttgcgtcgcg gtgcatggag ccgggccacc tcgacctgaa 4200 tggaagccgg cggcacctcg ctaacggatt caccgttttt atcaggctct gggaggcaga 4260 ataaatgatc atatcgtcaa ttattacctc cacggggaga gcctgagcaa actggcctca 4320 ggcatttgag aagcacacgg tcacactgct tccggtagtc aataaaccgg taaaccagca 4380 atagacataa gcggctattt aacgaccctg ccctgaaccg acgaccgggt cgaatttgct 4440 ttcgactatc ggcgcgccag agctcatcgt taatgtcttc gtgcgccgtc agtcggcgca 4500 cgttttttct ctctggtacc gtgtcactga tctagtcaat tactcgaagt atccacaagt 4560 gaagcatact aagtaatgta caagaatcaa aaaaatcggc tacgcaagtc gcgtagccga 4620 atcatttaag gatccttcca ttcaggtcga ggtggcccgg ctccatgcac cgcgacgcaa 4680 cgcggggagg cagacaaggt atagggcggc gcctacaatc catgccaacc cgttccatgt 4740 gctcgccgag gcggcataaa tcgccgtgac gatcagcggt ccagtgatcg aagttaggct 4800 ggtaagagcc gcgagcgatc cttgaagctg tccctgatgg tcgtcatcta cctgcctgga 4860 cagcatggcc tgcaacgcgg gcatcccgat gccgccggaa gcgagaagaa tcataatggg 4920 gaaggccatc cagcctcgcg tcgcgaacgc cagcaagacg tagcccagcg cgtcggccgc 4980 catgccggcg ataatggcct gcttctcgcc gaaacgtttg gtggcgggac cagtgacgaa 5040 ggcttgagcg agggcgtgca agattccgaa taccgcaagc gacaggccga tcatcgtcgc 5100 gctccagcga aagcggtcct cgccgaaaat gacccagagc gctgccggca cctgtcctac 5160 gagttgcatg ataaagaaga cagtcataag tgcggcgacg atagtcatgc cccgcgccca 5220 ccggaaggag ctgactgggt tgaaggctct caagggcatc ggtcgacgct ctcccttatg 5280 cgactcctgc attaggaagc agcccagtag taggttgagg ccgttgagca ccgccgccgc 5340 aaggaatggt gcatgcaagg agatggcgcc caacagtccc ccggccacgg ggcctgccac 5400 catacccacg ccgaaacaag cgctcatgag cccgaagtgg cgagcccgat cttccccatc 5460 ggtgatgtcg gcgatatagg cgccagcaac cgcacctgtg gcgccggtga tgccggccac 5520 gatgcgtccg gcgtacaaga tccacaggac gggtgtggtc gccatgatcg cgtagtcgat 5580 agtggctcca agtagcgaag cgagcaggac tgggcggcgg ccaaagcggt cggacagtgc 5640 tccgagaacg ggtgcgcata gaaattgcat caacgcatat agcgctagca gcacgccata 5700 gtgactggcg atgctgtcgg aatggacgat atcccgcaag aggcccggca gtaccggcat 5760 aaccaagcct atgcctacag catccagggt gacggtgccg aggatgacga tgagcgcatt 5820 gttagatttc atacacggtg cctgactgcg ttagcaattt aactgtgata aactaccgca 5880 ttaaagccga gcgatgataa gctgtcaaac atgagatcca atctagattg tttaaacttc 5940 tgcagaacac gcggtgttaa cgtttcttat acttcttaat tttgttaaag atcatttcgc 6000 cgtagtacac cgcattgacc tgggtcttca ccagcaagta gccgcgaaat ttcttaaaca 6060 acttcatgtt cggtttaaag tcggcttgcc agaactgatg caaatgcccc tggtacgtca 6120 gacccttgat atcgtacaag gcgttgccca tgactttcag gggcttgttg tggatcaacg 6180 cggaaatgcc ggccgtgcta ttgatggtga ccaccgcttt ggcgtggcgc aacagctccg 6240 gcatgggcag atcgtgcaca tagatgacac gttcatccaa accgtattcc ttcgacagac 6300 gcttgatcaa cgggcggtac aggcggtgcc cgcgatccat cgggtgatgt ttgatcacca 6360 gataggactc cttgggggcc ttgcgggaaa agctgtacat cacttcgttg atgtaatcac 6420 gcacatcatt atagttgcta tggttgcgga tctggctgtc gttgtacact tgcaggaccg 6480 ccaggtaata gcgctgatcc agctcgttca tcaggcgggg gaggaccttg cgttgggtga 6540 ccttatacag ctgtttgcgc cagtaggcgc ggacccagca gcgcgcttca taccacgggc 6600 tgaacgattt gtggtggcga tagcgcggaa attcgtgacg atagtgccaa cccatcaggt 6660 aataccacat ggcgtggccg atgcgcttca tggtgctcgg tttcaggttc tcgacgtgcg 6720 gcgtcggcat atcgggcaat ttgcggtaaa agtccggatc gcggggcaag ctgctatagg 6780 cgttcacacc gccttcttcc acggtgataa attgcggacg caggtagcct tcctcgaagg 6840 ccagaaaacg aatccccttc gacttggccc agcgtttggc ctccttgtgc agcaggcggc 6900 agtcaccgaa acacaaaatc gtgtcaaagt catactgacg atgcaagtcc cgcagccaac 6960 cggggaactc cttcggggtt tggtagtacg ccaggtattg gcggtggcgg cagtagaagc 7020 gatcaccgcc attaaagacg acgttgaccg cgttgcgacc gaggctctcc aaccattccg 7080 ccacatcgtt gaagaacgga cccatcggac cttggagcag gaggtacttt ttaccgctca 7140 acagcaccgt cagcgcattg ccgtgcattt attaacctcc taacacgcgg tgttaagcgt 7200 tttcggcgag ctcttaacca aagcgcactt tgcagaacat gatcaacttg cgatagtagc 7260 gaatcacacg gccggctttc ttgcgggtga taaagatggg tttgcggggc gttttgatca 7320 gatattctgc cgcttcctcc accgtgatcg gctgcaaccg cgtcggatga atataggtgg 7380 gatagacaat cagggcttga tagatcaggt cggcgatggt cagccgccgc tcgcgacggg 7440 ggcagtggtg ctcatcgacg gtcaggcccc acgaggcgta gaacggcagg ccgtagcagt 7500 gcacctgttt accgtgcagc aatgcttcaa agccgctgag gctcgtcatc gtgtgcacct 7560 cgtccgcacg ctgaatacac tgaatgatat cggcatccag tgcctggtag tctgcgagtt 7620 ccgcgatctg ttccgccgga atgtcaccct tacggttgcc gacgagcaca tcggggtgcg 7680 gcttgtagat gatgtaggcg tgcggattac gttcccgcac ggtgcgcagc agctccagat 7740 tcgacttgat cgacacggtg cccgtcttaa tcgacgcatc gtcttccacc tggcccggca 7800 ccaggatgac tttcttgtcc ttcgcttctg ccgggaggct gaaatcggcc cccaggttat 7860 atttgctcaa tttgctttcc accagacgtt ggcgcaactt ttccgcgcgc atctggtgcg 7920 cgagggtcag ctggctgtga ttcagcagga cctccagttc cgacggacgg gtggcatcgt 7980 aatagatacc gcgcttatcc aggaccaggc tcaacggcgg cagcagatcg ctccccaggc 8040 cggagctgcg caggaagccg tcttccatgc gccacagcgg cagggatttg cgctgtgcct 8100 ccgcacgcca ttgctgttcg cctttcacgc cccacacgac gcaggcgctt gctgcggtac 8160 agcgacggga aaaggagaga cgattcgtgg ccgtttgcag gaagggcttc aggatcgcgc 8220 ttttccacag ggtcaggccc ggcacccaga gataaccatt ccgctgttgc aggtgacgac 8280 gttgcagctg gagccattgg agcaccgtga acagggccga cacctccccg gtctgcggat 8340 caatgtagcg gcaatagcgc agataggccg ctgcgaacag ttcctccagg gtggccgagc 8400 cgcgacgcgc cgacagcagc gccgattggg ggtggcggtc atcggtgagg ccccaccctg 8460 cataccaggg ttggccaaag caggtcacgg gcttaccggc cagcagggct tcaaaaccgt 8520 actgggaggt cacgacgtac acgcgggaca catgacgcag cagggactgc ggcgacacgt 8580 tttccgcaat caggcgcacg cgctgggtgg cacgcaagtc cgcgaagtag ccggtctttt 8640 tcccttccag gacatcggga tgcactttga cccagatttc tgcctgcggg ttttccgcca 8700 tcgctgcttc cagcattgcg gcgaactcat gggggcctgc gttgccgtag gtcacgctca 8760 tgtcattgaa ggtctggtcc accaccagca cgatgttcgt gcgctcgctt tcatccgcca 8820 cgaacgccgg tgccaggttg tacttgctca tgtcgcccgt cacaatggtg tgcatcgcct 8880 cgcgcgcctg atccgccagg gccgcgttgc cggccttgtc ctgcacgagt ttttccagcg 8940 cgctcggttt cgaggcgtcg tagtaaatgc cgcagtcatc cacgacgagc gagaggggcg 9000 gttcaccgtt cacgcccagg tccagcgagc ggacgaaacc atcctccaag cggatcaccg 9060 gcttgcctgc ggctttggcg atggccaccg gctttgcggc cgaggggcgg tgcccccaca 9120 ccgcgattgc atccacttcc tgcgggaccg ggcgcagcag cgacagcttt tggcagggct 9180 gggcgaggaa tttttccagg tgcggaatac gccaaatgcc ggggctataa atgccaatca 9240 tgcgttctcc gcgagctcct gcgccatcag ggcccggacc ttctccaagc acgccggggt 9300 atcgacgccg ggaccggtcg cggcgacctc gaaggtgcga atgttaatgc ccgcgctcat 9360 cagccgcagt tgctccaggg attcggcctg ttcgggcatg gactccggca actggctgta 9420 attttgcagg acatcccgcc gataggcgta gatcccgacg tgcttcaggt agcgcgcctt 9480 ctcggcgttg cgcgggtacg gaatggggga gcgggagaaa tacagggcgt cctgccgcgt 9540 gttcaccacg accttgacgg tggacggttc ggcggcttct gccgcgctga tcgcatgaca 9600 cagggtcgcc accggcagcg ccgggtcgtc ccgcatacct tgcagcaggg tttcgacgtc 9660 acgcgggcga atcatcggct catccccttg caggttgata tagatatccg cctccacctt 9720 atgcatgact tccaccaggc gatcggtgcc gctctcatga tcgttgcggg tcatgatcgc 9780 tttgccgccg aacgcctgga ctgcctgctc cacacgcggg tcgtcggttg cgacccacac 9840 ctctgccacg cctgccactt gcagggcccg ttcgtagacg tgctggatca tcggtttccc 9900 gacgatatcc agcagcggtt tgcccggcag acggctgctg ccgtagcgtg ccgggatcac 9960 aatcacggcc ttcgacattt attaacctcc tcgagttaca gcgacagaat cactttcgcg 10020 cccaccgcca gttggtacag aatggtgctg ataccgcgcg tcacttcgat gttcttcgac 10080 tcgtatttcg gcaacaccat aatttcatca ccgggtttca gggaatcgac gtcttctgcg 10140 ttcaccgctg cgccgttctg acggatgacg ataatacggg cgttgccgga cttctgggtc 10200 agcccaccgc acttctcgat gtagtcctcg gtcgtcatac ctttctgcca cgacaccgcg 10260 ttcgggaaca gcacttcccc gtggaccatg accaacgacg tcttttcggg aatattgatc 10320 acgtcgccgt cctccaggag gacggagtca atgttgcttt cattgaggat cacttcgccc 10380 ttcggcacga cggtgcgggc tttcgcgacg aagcgggaga tcagttgggc ttcctgcata 10440 cgcaggctgg cctcttcctt ggtgctgctc tgtgcgctga ggctggcctc ttcgagcttt 10500 tgcagggaca aattcagcat ttctttctgc cgttgcgcga cgctcggccg atacaactgc 10560 acggcgttca tctgcgacat ggagttcggg cgcacttttt cgagcacggc ccgcatggtg 10620 ctaccgtagg gcagcaccat ggcgtgttcc ccggaatgtg cgccttccac acgcacttga 10680 atggtgcccg catagcggtc ggtggagaca atgagggtat caccgttttg cagcatacgc 10740 cccggtgcgg acgagatcgg ataatattcc gagcgcttct ggaggccctg cttccgcata 10800 atcgtgatat gggtcgcacc cggtttggga cgtgcccagg acagtgcttc ggtgaccggg 10860 atgctcgatt cgcgaaattc aaagtcgtag gaattgaaca catcgccctg caccgagaac 10920 gtatgctggc gcggacccac aatgatcgta tcaccgtccg caaactggga cagccccagt 10980 ttgccgttga gcaggaagtc atagaggttg acgttcgagc gcacacgatt gccgcgtttc 11040 acgacgatgt ccacgtagct gccgcgttcc gggtccacac cacccgcctt gatcaggtag 11100 ttcagcaggc tgtcggaggt gacaccgccg tacaggccgg ggttgcggac aaagccggtc 11160 acatagacct tgaccggctg cgcctgcaag agcgacgcat agacgttcac gttgctctgg 11220 tagacttcct tcaccttgct cgtcaccagc gcgttcaact gggagttcga cacacctgcg 11280 actttgacgg ggccgacatt cggcaggaag atgttgccct tcgggtccac ctggagtgcg 11340 ccatcgaagg tgaacgcacc ccacaggcgg acctggatgg aatcgccggg attcaggatg 11400 tagtccggat tgaaacccac ggttgccccc gagtctgcgc tcgtaccgtt gaacagctgc 11460 gccccgaaca tacggctcat cacgaccggg ggtgcggggg gcggggtgtt atcgaagccg 11520 ctcatgttct gggtgtcgct tttctgcccg ttcaggatgc cggtcaacgg tgcggcaccc 11580 gtgaggttcg gatcggcatt aatgtcgatg gttgcgctcg cctgtgctgc atggcacgct 11640 gcgatcagca ggatcgactt aaacagcttc atttattaac ctcctcgaga agtcgactta 11700 gtcacggtgg tcttcaatca ccgccaggag caatttcagg gtgccaaaga gcaggcaaca 11760 caccagcagc caacacgcga tcaaatacgg gatattcggg aaggagcttt cctggggcag 11820 ctgcggggac gagatcacgc tcaggacttt cagcttacgg gccgcttcga cacgggtctt 11880 ttcgatgctg gtgagcgtga gcttgtacaa ctcggtattg aactcgacct tggatttgat 11940 ctcctcaaaa tccacggcca tgcggttcag tttatcgccc tggggtgcgg taattttcga 12000 cttttcttcg tcgatctgtg cctggaggct ctgaattgca ttgcgggcgc tcacgacttg 12060 gggcgcatcc tcgcgcaggt acgtgagcag gttgcgcagg tcggcttcca tctgaatttt 12120 ctggcccatc agcgtattca ccagggtgga tgccgcctgg gcctgtgcct gcgggtccag 12180 cacattgttg ttgtcttggt aggacaacaa ttcggctttc gatgcatcca gccgctggcg 12240 cgctttttcc atttcggttt ccgcaaacgc caattgatcg cgggcgatac ggtgcgacat 12300 ttcattgatg aaccgctcgg attccttgag cacggtctgg ttgaatttca gcgcgaactc 12360 gggcgaaaag ccctgggtct ggatgttcag cagcccggtc ttgtcgtcgt agctgacgtt 12420 gatgcgatct ttatagtact tcaggaaccc ctcggcggtt tcatccttgg acagatggtt 12480 caggaagtcc aggcccgaat gggagaacgc ttcgcggaag ttcagctgtt tatccagcgc 12540 ggccagcata tccgggctgt tgatgtattc cttcaggtac agtgcgtctt cggcggacga 12600 cgggttggag gcacccaaca gcaggccgaa gttcaggctg ccggagttga gatcgtcgct 12660 gcgcttgatg gccaccttgc tttccgacat atagcggggc tgggagaaga tcgccaagta 12720 gatcagcagc accgccatgg gtgccagaat aatgattttt gccaggtgct tctgaatatc 12780 tgccaggctg atcgcgctca gacgcgcacg catccacgag acggcgcttt tcactttgat 12840 cagcatttat taacctcctg tcgacaacac gtgttaatcg aaaatgcgca ccaacccggt 12900 caccttattt gctttgttgg tcaccagcag ggtcgagacg cggtgtttct gcatcttctc 12960 ttctgcttcg atgatcatgg tgtcttcggg caaggtcagc ggttcgcggg tcatcatctg 13020 tgcggccgtt gcgctcgtca ggctgtcttc tttctccata aagcgccgca gatcgccatc 13080 ggtgatgatg cctgccagcc caccttccgc atcttcgacc atcaccatac cctggcagcc 13140 cgaggtgatg cgctgaatga ccgttttgaa gctggcatcg agctgcactg ccggcacatc 13200 atgttgcatc acgtcggcga cgcgggtcag caggcgccga cccaggctgc caccggggtg 13260 gtagcgtgca aagtcattgg gcataaactt acgctggtga atcatcgcga tggccagcgc 13320 gtccccgatc gccatcgtga gcgtcgtgga ggtggtcggg gcgagattgt tcgggcacgt 13380 ttcgttcgcc atgtgcagct ccaggaccgc atctgcattt ttggccaggg tgctattccc 13440 gttattggtg attgcgatga tgcgattgcc gaagttcttc aggctcggca ccagtttcag 13500 gatctcgtcc gtctcaccgc tcgccgaaat caagatgagc aggtcatacg gggtgatcat 13560 gcccagatca ccatggaacg cttccgccgg atgaataaag aaggagggcg tcccggtcga 13620 ggccaaggtc gccgacatct tgcggcccac atggccgctt ttacccatgc cgctcaggat 13680 gacgtgccct ttacaattca tgatgagatt caggacgcgc tggtactgac cgctatccag 13740 ttgtttggac aggttttgca gtgccgcgct ttgttcggcc agggtctggc ggacgctcgt 13800 aatcagatac ggatcaatgg tcgaggactg gtcatccggc aagtggcgtt cgctcattta 13860 ttaacctcct cacgtgttaa ttaagtaatc gatagtgatt taaatatgca agatccgata 13920 aatcgattga tagatttaaa taagaactgc agaagctagc ttagatgctc gtgaaattga 13980 cgtgggcgct ttgcagggcc gtcttaatgg cgttggtgtc cacgaggatc gagtcgggtg 14040 cggaaaacgg acggttcttg ttggtgaaat cgctgttacc aatgtacagc gattccttgt 14100 tacgcagcgc ctggatgtgc cagcgggacc acgaatccca atacttctgg cgatccggcg 14160 agataccttg gctggtgtag ccggtcgtcg ggctgttcat caacgagtcg gtgcggtgcg 14220 agcccagcgt cagcggcaac ttgatccgat gcaccgtgga atcgccgaag atcagcttca 14280 gacgcgcgat aaattcgcta tccgcacccg ttttcacaca atcccagaca ccggccttct 14340 gcaagacgtc ggcacggcga aacaggagcg acgacggatt cagacgcttc aaggggtaca 14400 ctgcgcgggc atagaaaata ccgttgtctt gcaggcgcac ccagtccgag atggagcaga 14460 tgagcttcgg attgagcaac aagggggaga tttggcggaa cagcttttcc ggatggctcc 14520 agtcatccga atcgtggcag gtgacgaact cgcccttcgc ttggatcaag ccgatacgct 14580 tcgcggcata ggtgccgaca ttctgcggca ggctaatgat cttgatgcgc gtgtctttga 14640 gggcgagccg ctggagacga aacagggtgt catcggtgct cgcgtcatcc acaatgatca 14700 gctcgaagga acggtaggtc tgattgagga gcgaaatcac cgcattttcc acgcggcgac 14760 ccgtattata ggtggtcatc aggatggaga tcaacggccc cgtctgggcc gggtacggga 14820 tgctggtgat gatgttgcac ggggagagcg gggagctgtt gtccgtcaag gccacggggc 14880 tgaggccgaa gtatttatag tattcattca gccgattcag gctaatttcg gcggtttcgc 14940 ggaaggcgtt attttgcagc agcaggatat ccgggctata gacgatatcg gatgcgtcga 15000 tctgggcgag ggtcgagatg gccttttggg tcaggccgat ccggagttgc agtgcggtat 15060 acaggtccag cgggcagttg tccacgttgt ccaacaggct caggctaaag gtcggcgagt 15120 aggacgccag ggttttcgcc agttccactt tctgatgggt atcggtgaac tcgtccttga 15180 actccatcag cagctcgggc gtcaggctga tgtcgccgca ggcgattttt gcgatcttga 15240 ttgccagttt gcagcgccaa tcggacgggg tatccgtcaa gttatgcagc gaccagtaca 15300 tattcagacg atacatcgcg aggatgcgtt tcgactgcca gaaccggcaa tcatcctgga 15360 tggccgcgag cgcgtggacg tagcggctct ttttgagcag ccacaagaat ttgagattat 15420 tgaacattta ttaacctcct gctagcaact taagttacga atcgacgccg aacaggtcgc 15480 gggtgtagac tttctccgag acatcttcca gttcgctggt gcggcgattc gccacaatga 15540 catcgacgcg ctccttaaag gaattgatgt cgcgctcgac gtaggaaccg aagaagtagg 15600 gttctttcag gaccggctcg tacaccacaa tctcgatacc cttggccttc aaacgtttca 15660 tgaccccctg gatgctgctg gcccggaaat tgtcgctacc cgccttcatg atcaggcgat 15720 agataccgac cactttgggc ttacgggaca ggatgtcctc ggccacgaag tccttacggg 15780 tcgtattcgc atccacgatg gcctggatca ggttttgcgg gacgtcgcga taattggcca 15840 acagctgctt cgtatccttc ggcagacagt aaccgccgta gccgaaggac gggttgttgt 15900 aatgttgacc aatgcgcgga tcgagggaga cgccttcgat gatttgtttg gtatccaggc 15960 cgtgcacgct cgcgtaggtg tccagctcgt taaagtacgc gatacgcatc gccagatacg 16020 tgttcgcgaa cagtttgatg gcttctgcct cgggcgaatc cgtcagcagg atcggaatat 16080 cctttttgat ggcaccttcc gacaggagtt cggcgaactt ccgtgcgcgt tccgacgatt 16140 cgcccacgac aatgcggctc ggatagagat tatcatacag ggctttgcct tcgcgcagga 16200 actccgggga aaagatgata ttattcgtgt tcagatcgcg cttcaggcgt tcggtgaacc 16260 cgacggggac ggtggatttg ataatgatgg tcgcgttcgg gttaatggac agcacgtcac 16320 acgcgacgct ttcgacgctc agggtatcaa agttgttatt aatcggatca tagttcgtcg 16380 gggtggcgat gatcacgtag tctgcatcgc gatatgcctc gtatttttcc gtcgtcgcgt 16440 agaggttcag cttacgattg gagagaaact tctggatttc cgggtcgcaa atcggcgaga 16500 ttttcttgtt aatgagctgg accttcttcg ggtcgatgtc cagggcgatg atgtcgtgtt 16560 tttgggagag gaggatcgca atgctgatac ccacatagcc gacgccggcc acggcaattt 16620 tcatttatta acctccttaa gtgaattcaa actagtttac aagtcgtttt cgatcttctc 16680 ccaggtatat ttgcgacatt cattcaagtt ggtcagcggc gagtatttgt actttttgat 16740 accgaggcgc gacaggcttt cgttcaccac cttgaaatgg ttttcctttt ggatgtccag 16800 tttcttgatc gacgtgttct cgccgtgcag gacacggttg tagcaaatct tattgatatg 16860 cttaaacggg ccgacttcgc tgagtttcaa atacatatcg taatccaccg cattgctgat 16920 gctctcgttg aagccttcgg tgaggttcca tgcacgcgcc gtgaacatac ggaagtggtg 16980 gcagatcatc gcgctcgtga gcttttcgcg gctgtaaatc ggccagttgt agccattgct 17040 aatcaagtta ccttcacgat caatattgcg attggtggtg tacacgcagg cgaggctcag 17100 gtctttgcga aattcatcca gacacagttc cacggcatcg ggctccagga aatcatcgga 17160 atccagctgc ccgatgtaga aaccccggca caggcggact gcggtattcg aggcggagcc 17220 gatgcctttg tttttctggc tgatgaaacg gacgcgcggg tggtttgcgt aatgttcttg 17280 caggatgcgc agcgtatcat cggtgctccc gtcatcgcag atgcagacct ccagatcggt 17340 gatcgtttgg ttcagtgccg attcgacgca gcgcacgata tatttgctgc aattatacgc 17400 ggggatgtag atgctcacca ggggcacacg tttcagggtg gcgctctcga ttttctcctt 17460 cttgcgataa aagtagggca ccttctgctg caacagctgg acggtaatgt ttttacctgc 17520 cgcgcgatcg gtttcgttct ccttaccggg cggttcctga tgatatgcca tcgcgccttc 17580 cacgctacgg aaataacaac cctcgcggta cagccgatag ccgaactcat tatcctcacc 17640 gccccaatgc gtgaactctt cgtcaaacca acccgcgcga aacagccact tctttgcaaa 17700 cgccacattg ccaccgctaa agaaccggaa cggggtgttg cacaggcgca gattgtcggt 17760 attcttgaaa tgttcgatgc gccaatcgac ggatttgttc tgctcgacct tgcctgcgac 17820 ctgattattg gtaataatct ccgggatttc attgatcagg cttttctggg acaaaaagtc 17880 cagataggta tgcttcgacg tgtcgatgta tttacgcggg ccaatcagtg ccacgttatc 17940 atccacggcc aggagttcca tataggactg cacccacaac gggttcggcg ccatatcgca 18000 gtccaagatc gccacgtagt tgtatttcgc tgcccgcagg cccaggttcc gcacggcgca 18060 cagctggtag ccgtagtctt tctggcggac gtatttgatg ttcagcaacg actcgaactc 18120 gcggacgatc tcttcgatgt tttccttgga accgtcatcc gcgacgatga cctcatagtc 18180 ataaatcgtt ttctgattgc agaggcaggc cagggtgatc gccaggattt tggcgcgatt 18240 gtacgtcgga atcacgatgg acaggccgtc gatgatcagt tgcttgcgcg gataatcatc 18300 cagttcttta cgtttccctg cccagacgta gtcgttcgtg ctttccggca gcggcggcaa 18360 ggtcaggtcg ctcggccaat ccagcggaat gggttcgact tctttcaatt cggcgcgctc 18420 ggatttcttt gcggtaattt cccgatattt gctaatgatt tcattctttt ccacctcatt 18480 cagcgagatc gcctttgcat tgctgcacat aattttggtt gccgcgtcga tatcaatgac 18540 cgctttccga ttcagcttgt ccacttcttc gctcagattc agggcggttt ggcacagctt 18600 gatattggct tccacccagc tcacatcata gatttccgcc actttttcaa acagggagag 18660 ggcttggcgg tagttcttat tcttatacag attgattgcc tggttcaaaa tgctcattta 18720 ttaacctcct actagtgaat tttcgaaaat gaacggtccg ttaaatatag ccattcggat 18780 tcttcatctg ccagcgccag gcgtcctcca gcatggtttc gagttcccgc ttggctttcc 18840 agttcagata tttgttggcc ttttcggggg aggaccagct ctccgcgata tcaccgtcac 18900 ggcggctcac gatttcatac ggaatccgca cgccggaaat cttttcaaag gtggacacca 18960 gttccagcac cgaataacct ttacccgtgc ccaaattaaa gacgtggtag ttggtgttat 19020 tgtcgcggaa gagataggac agcgctgcga cgtgcccttc ggccaggtcc atcacatgga 19080 tatagtcacg gacccccgtg ccgtctttgg tgggataatc accaccgaac accatcagtt 19140 tttccagttt ccccatcgcg acctgcaaga tgtacggcac caagttggag gggatgtctg 19200 ccgggctttc accaatcata ccggattcgt gggcgcccgt cggattaaag tagcgcaagc 19260 agaggaaatt cgtgtcggag tatttcttgg cgatgtcgcg gatcatcagc tccgagatgt 19320 acttggacgt accatacgga ttcagcgtgc caccaatatg gcagtcttcg gtgacgggca 19380 tgatcttgct ttccccatac accgtcgccg acgagctaaa gatgaagttg gcgacgtcgt 19440 tcttgatggc gcaattgatg agttgcaggg tgccgctcac gttgttgtca tagtagaaga 19500 tgggcttgat caggctttct gcgaccgatt tcgcacctgc aaagtgcatg atgcagtcga 19560 atttgtgttt cttcaggatc tggttcactt ccttctcgtt gttgatattg agttcgtaga 19620 acgtgacttt cttctttgcg atcagctcaa tgcgacggat gctttcgcag ctgctgttga 19680 tgagattgtc aatgatgacg acattgtagc ctttgttcag caggcagagc gacgtgtggc 19740 tgccgatgta gcctgcaccg ccggtgacca ggatgttcat ttattaacct cctcggtccg 19800 aattaaccta ggttatgagg tcagcattgc ttcttcacgc gtttagtagt tgttttgttc 19860 ggtgatatat tcttcaatgc cttcttgcac gtcttcatgg aacgacacgg cgttgtcgtc 19920 tttaaacacg attgccacat cgcagaactc tttcaacgag ttcagcgagt gcgacaccat 19980 gaggaaggag ctttccttat gacgctcctt gaagagttgg gcacattttt ccttgaaacg 20040 ggcgtccccc accgccgtca cctcgtccac gatgtagtaa tcgaacttga acgccatgct 20100 caggccgaag ccgaggcggc tgcgcatacc gctcgaatag gtcttgatcg gcatatcaaa 20160 atacttcccc agctccgcga actcttccac aaactcaatc ttttctttca gctcctcctg 20220 cttcgcgtac agccgggcca cgaacttcac gttttcacgc ccggtcaagc tgccctggaa 20280 gccgcctgcc agacccaccg gccacgagat cgttttattc gtgatgattt taccgctatc 20340 cgggcggtcg atgcccccaa tcatgcgcaa cagcgtggat ttacccgccc cattgcgccc 20400 gatgaacgcc acgcttttgc cgctggggat ctcaatgttc aggttcttga agacatagtg 20460 acggcccacc ggggtgcggt agcttttcgt caggttttcg atcttaatca tgaggtcaac 20520 attgcctcct cacgcgtacg gtacagggcc aaaccaataa acagggtcac cagggtgaac 20580 attgccagat aattcaggct gaccccttcg ctgatataac cgggcatcac ggcctcgcgg 20640 ctcagttcga cgacgtgcac caggggattc cacagcaggt acgaccaata ctgcttcgga 20700 atggagtgca gcgggaacat gatgcacgaa ataaagtaca gcggcttcag caagatcggc 20760 aagactttct gcatttcggg gaacgtcttg cccacgacca tgaagatcag gcccacaccg 20820 cacgacagga tgatcaggag gctccaggtg agcacaaatt gcaggaagtt ggtaatctcg 20880 aaatattcgc ccgccatcca gatgatcagc atcaggagga tgtagaccgc cacatagatc 20940 agcgtttcca agagggcgcg tgcaatgatc gtgtcgatcg gcttcacggg ccggtagtta 21000 aacagcccct gattggcttc gatggcgccc acggagcgat tgctgatgct gctgaaaata 21060 aagaacggga tcaggccatt gagcaggaac accgggaagg agatatccgg catggtgcga 21120 tgcatgatat agccaaagat cccgagcaga atcagcagat gtgcgctcgg ttccaggatc 21180 gcccacagat agcccaggcg aaacttgcca aagcgcgtac ggatttcgcg gagaaacagt 21240 gcttcgaccg tcactttctg gacttcaaaa cccgaacgtg ccatttatta acctcctggt 21300 accaatctag attgtttaaa cagatctgtt acctgcagga ttattgtttc tgttgcataa 21360 agcctaaggg gtaggccttt ctagagatag ccattttttg cactcctgta tccgcttctt 21420 gcaaggctgg acttatccct atcaaaccgg acactgcagg ctgacaagct ttcattacat 21480 atgaagagtt tgtagaaacg caaaaaggcc atccgtcagg atggccttct aagaaggctc 21540 gagtggcgcg cctaagtcga atttctgcca ttcatccgct tattatactt attcaggcgt 21600 agcaccaggc gtttaagggc accaataact gccttaaaaa aattacgccc cgccctgcca 21660 ctcatcgcag tactgttgta attcattaag cattctgccg acatggaagc catcacagac 21720 ggcatgatga acctgaatcg ccagcggcat cagcaccttg tcgccttgcg tataatattt 21780 gcccatggtg aaaacggggg cgaagaagtt gtccatattg gccacgttta aatcaaaact 21840 ggtgaaactc acccagggat tggctgagac gaaaaacata ttctcaataa accctttagg 21900 gaaataggcc aggttttcac cgtaacacgc cacatcttgc gaatatatgt gtagaaactg 21960 ccggaaatcg tcgtggtatt cactccagag cgatgaaaac gtttcagttt gctcatggaa 22020 aacggtgtaa caagggtgaa cactatccca tatcaccagc tcaccgtctt tcattgccat 22080 acggaattcc ggatgagcat tcatcaggcg ggcaagaatg tgaataaagg ccggataaaa 22140 cttgtgctta tttttcttta cggtctttaa aaaggccgta atatccagct gaacggtctg 22200 gttataggta cattgagcaa ctgactgaaa tgcctcaaaa tgttctttac gatgccattg 22260 ggatatatca acggtggtat atccagtgat ttttttctcc attttagctt ccttagctcc 22320 tgaaaatctc gataactcaa aaaatacgcc cggtagtgat cttatttcat tatggtgaaa 22380 gttggaacct cttacgtgcc gatcaacgtc tcattttcgc caaaagttgg cccagggctt 22440 cccggtatca acagggacac caggatttat ttattctgcg aagtgatctt ccgtcacagg 22500 tatttattcg gcgcaaaggg cctcgtgata cgcctatttt tataggttaa tgtcatgata 22560 ataatggttt cttagacgtc aggtggcact tttcggggaa atgtgcgcgc ccgcgttcct 22620 gctggcgctg ggcctgtttc tggcgctgga cttcccgctg ttccgtcagc agcttttcgc 22680 ccacggcctt gatgatcgcg gcggccttgg cctgcatatc ccgattcaac ggccccaggg 22740 cgtccagaac gggcttcagg cgctcccgaa ggt 22773 <210> 38 <211> 22947 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 38 ctcgggccgt ctcttgggct tgatcggcct tcttgcgcat ctcacgcgct cctgcggcgg 60 cctgtagggc aggctcatac ccctgccgaa ccgcttttgt cagccggtcg gccacggctt 120 ccggcgtctc aacgcgcttt gagattccca gcttttcggc caatccctgc ggtgcatagg 180 cgcgtggctc gaccgcttgc gggctgatgg tgacgtggcc cactggtggc cgctccaggg 240 cctcgtagaa cgcctgaatg cgcgtgtgac gtgccttgct gccctcgatg ccccgttgca 300 gccctagatc ggccacagcg gccgcaaacg tggtctggtc gcgggtcatc tgcgctttgt 360 tgccgatgaa ctccttggcc gacagcctgc cgtcctgcgt cagcggcacc acgaacgcgg 420 tcatgtgcgg gctggtttcg tcacggtgga tgctggccgt cacgatgcga tccgccccgt 480 acttgtccgc cagccacttg tgcgccttct cgaagaacgc cgcctgctgt tcttggctgg 540 ccgacttcca ccattccggg ctggccgtca tgacgtactc gaccgccaac acagcgtcct 600 tgcgccgctt ctctggcagc aactcgcgca gtcggcccat cgcttcatcg gtgctgctgg 660 ccgcccagtg ctcgttctct ggcgtcctgc tggcgtcagc gttgggcgtc tcgcgctcgc 720 ggtaggcgtg cttgagactg gccgccacgt tgcccatttt cgccagcttc ttgcatcgca 780 tgatcgcgta tgccgccatg cctgcccctc ccttttggtg tccaaccggc tcgacggggg 840 cagcgcaagg cggtgcctcc ggcgggccac tcaatgcttg agtatactca ctagactttg 900 cttcgcaaag tcgtgaccgc ctacggcggc tgcggcgccc tacgggcttg ctctccgggc 960 ttcgccctgc gcggtcgctg cgctcccttg ccagcccgtg gatatgtgga cgatggccgc 1020 gagcggccac cggctggctc gcttcgctcg gcccgtggac aaccctgctg gacaagctga 1080 tggacaggct gcgcctgccc acgagcttga ccacagggat tgcccaccgg ctacccagcc 1140 ttcgaccaca tacccaccgg ctccaactgc gcggcctgcg gccttgcccc atcaattttt 1200 ttaattttct ctggggaaaa gcctccggcc tgcggcctgc gcgcttcgct tgccggttgg 1260 acaccaagtg gaaggcgggt caaggctcgc gcagcgaccg cgcagcggct tggccttgac 1320 gcgcctggaa cgacccaagc ctatgcgagt gggggcagtc gaaggcgaag cccgcccgcc 1380 tgccccccga gacctgcaga tccacatcct tgaaggccgc agcgacgagc agaaggaaac 1440 cctcattcgg gaagtcagcg aggccatctc gcgctccctg gatgcgccgc tgaccagcgt 1500 gcgagtgatt atcacggaga tggccaaggg ccacttcggc atcggcggcg aactggccag 1560 caaggtcaga cgctgaagtg gagatgccca agggcacttc gggtcgagga acccgacctg 1620 cattgggacg cggccacgga gagcgcgggc aaacgccggc actatagcca gtggagtttg 1680 taaaacgcta tttcagagct tggagagtgt ctaagaaagc cggggcgatg ccaacccatc 1740 ccttcttcgg ctatgcatcg ttcgtaatca agccacttcc tttttgcatt gacgcagggt 1800 gtcggaaggc aactcgccga acgcgctcct atagttttca gcgaagcgtc ccaaatgtaa 1860 gaagccgtag tctagggcta tctcagttat actacgcaca ttggcactgg gatcgttcaa 1920 gcaggcgcgg atgctttcga gcttgcggtt gcggatgtag ttcttcggcg tggtgccggc 1980 atgcttctcg aacaaattgt agagcgagcg tggactcatc atcgccagct ccgctaaccg 2040 ctcaaggctg atattccgtt tgagattctc ctcaatgaat tgaacgactc gctcgaaaga 2100 cgggttacct ttgctgaaaa tttcacggct gacattgctg cccagcattt cgagcagctt 2160 ggaagcgatg atccccgcat agtgctcttg gacccgaggc atcgactttg tatgttccgc 2220 ttcgtcacaa actaacccga gtagattgat aaagccatcg agttgctgga gattgtgtcg 2280 cgcggcgaaa cggataccct ccctcggctt gtgccaattg ttgtcactgc atgcccgatc 2340 aaggaccact gagggcaatt taacgataaa tttctcgcaa tcttctgaat aggtcaggtc 2400 ggcttggtca tccggattga gcagcaatag ttcgcccggc gcaaaatagt gctcctggcc 2460 atggccacgc cacaggcaat ggcctttgag tattatttgc agatgataac aggtctctaa 2520 tccaggcgag attaccctca cgctaccgcc gtagctgatt cgacacaggt cgaggcatcc 2580 gaagattctg tggtgcagcc tgcctgccgg gcgcccgccc ttgggcaggc gaatagagtg 2640 cgtaccgaca tactggttaa cataatcgga gactgcatag ggctcggcgt ggacgaagat 2700 ctgacttttc tcgttcaata agcaaaaatc catagttcac ggttctctta ttttaatgtg 2760 ggctgcttgg tgtgatgtag aaaggcgcca agtcgatgaa aatgcatctc gacgtgatgc 2820 gtatacgggt tacccccatt gccacgttgc gccatccttt ttgcaatcag tgaccacttt 2880 tccaagcaaa aataacgcca agcagaacga agacgttctt tttaagaagc gagaacacca 2940 gaagttcgtg ctgtcggggc atgcggcgac gaattggcgg ataaagggga tctgcaggtc 3000 ccgagcctca cggcggcgag tgcgggggtt ccaagggggc agcgccacct tgggcaaggc 3060 cgaaggccgc gcagtcgatc aacaagcccc ggaggggcca ctttttgccg gagggggagc 3120 cgcgccgaag gcgtggggga accccgcagg ggtgcccttc tttgggcacc aaagaactag 3180 atatagggcg aaatgcgaaa gacttaaaaa tcaacaactt aaaaaagggg ggtacgcaac 3240 agctcattgc ggcacccccc gcaatagctc attgcgtagg ttaaagaaaa tctgtaattg 3300 actgccactt ttacgcaacg cataattgtt gtcgcgctgc cgaaaagttg cagctgattg 3360 cgcatggtgc cgcaaccgtg cggcacccta ccgcatggag ataagcatgg ccacgcagtc 3420 cagagaaatc ggcattcaag ccaagaacaa gcccggtcac tgggtgcaaa cggaacgcaa 3480 agcgcatgag gcgtgggccg ggcttattgc gaggaaaccc acggcggcaa tgctgctgca 3540 tcacctcgtg gcgcagatgg gccaccagaa cgccgtggtg gtcagccaga agacactttc 3600 caagctcatc ggacgttctt tgcggacggt ccaatacgca gtcaaggact tggtggccga 3660 gcgctggatc tccgtcgtga agctcaacgg ccccggcacc gtgtcggcct acgtggtcaa 3720 tgaccgcgtg gcgtggggcc agccccgcga ccagttgcgc ctgtcggtgt tcagtgccgc 3780 cgtggtggtt gatcacgacg accaggacga atcgctgttg gggcatggcg acctgcgccg 3840 catcccgacc ctgtatccgg gcgagcagca actaccgacc ggccccggcg aggagccgcc 3900 cagccagccc ggcattccgg gcatggaacc agacctgcca gccttgaccg aaacggagga 3960 atgggaacgg cgcgggcagc agcgcctgcc gatgcccgat gagccgtgtt ttctggacga 4020 tggcgagccg ttggagccgc cgacacgggt cacgctgccg cgccggtagc acttgggttg 4080 cgcagcaacc cgtaagtgcg ctgttccaga ctatcggctg tagccgcctc gccgccctat 4140 accttgtctg cctccccgcg ttgcgtcgcg gtgcatggag ccgggccacc tcgacctgaa 4200 tggaagccgg cggcacctcg ctaacggatt caccgttttt atcaggctct gggaggcaga 4260 ataaatgatc atatcgtcaa ttattacctc cacggggaga gcctgagcaa actggcctca 4320 ggcatttgag aagcacacgg tcacactgct tccggtagtc aataaaccgg taaaccagca 4380 atagacataa gcggctattt aacgaccctg ccctgaaccg acgaccgggt cgaatttgct 4440 ttcgactatc ggcgcgccag agctcatcgt taatgtcttc gtgcgccgtc agtcggcgca 4500 cgttttttct ctctggtacc gtgtcactga tctagtcaat tactcgaagt atccacaagt 4560 gaagcatact aagtaatgta caagaatcaa aaaaatcggc tacgcaagtc gcgtagccga 4620 atcatttaag gatccttcca ttcaggtcga ggtggcccgg ctccatgcac cgcgacgcaa 4680 cgcggggagg cagacaaggt atagggcggc gcctacaatc catgccaacc cgttccatgt 4740 gctcgccgag gcggcataaa tcgccgtgac gatcagcggt ccagtgatcg aagttaggct 4800 ggtaagagcc gcgagcgatc cttgaagctg tccctgatgg tcgtcatcta cctgcctgga 4860 cagcatggcc tgcaacgcgg gcatcccgat gccgccggaa gcgagaagaa tcataatggg 4920 gaaggccatc cagcctcgcg tcgcgaacgc cagcaagacg tagcccagcg cgtcggccgc 4980 catgccggcg ataatggcct gcttctcgcc gaaacgtttg gtggcgggac cagtgacgaa 5040 ggcttgagcg agggcgtgca agattccgaa taccgcaagc gacaggccga tcatcgtcgc 5100 gctccagcga aagcggtcct cgccgaaaat gacccagagc gctgccggca cctgtcctac 5160 gagttgcatg ataaagaaga cagtcataag tgcggcgacg atagtcatgc cccgcgccca 5220 ccggaaggag ctgactgggt tgaaggctct caagggcatc ggtcgacgct ctcccttatg 5280 cgactcctgc attaggaagc agcccagtag taggttgagg ccgttgagca ccgccgccgc 5340 aaggaatggt gcatgcaagg agatggcgcc caacagtccc ccggccacgg ggcctgccac 5400 catacccacg ccgaaacaag cgctcatgag cccgaagtgg cgagcccgat cttccccatc 5460 ggtgatgtcg gcgatatagg cgccagcaac cgcacctgtg gcgccggtga tgccggccac 5520 gatgcgtccg gcgtacaaga tccacaggac gggtgtggtc gccatgatcg cgtagtcgat 5580 agtggctcca agtagcgaag cgagcaggac tgggcggcgg ccaaagcggt cggacagtgc 5640 tccgagaacg ggtgcgcata gaaattgcat caacgcatat agcgctagca gcacgccata 5700 gtgactggcg atgctgtcgg aatggacgat atcccgcaag aggcccggca gtaccggcat 5760 aaccaagcct atgcctacag catccagggt gacggtgccg aggatgacga tgagcgcatt 5820 gttagatttc atacacggtg cctgactgcg ttagcaattt aactgtgata aactaccgca 5880 ttaaagccga gcgatgataa gctgtcaaac atgagatcca atctagattg tttaaacttc 5940 tgcagaacac gcggtgttaa cgtttcttat acttcttaat tttgttaaag atcatttcgc 6000 cgtagtacac cgcattgacc tgggtcttca ccagcaagta gccgcgaaat ttcttaaaca 6060 acttcatgtt cggtttaaag tcggcttgcc agaactgatg caaatgcccc tggtacgtca 6120 gacccttgat atcgtacaag gcgttgccca tgactttcag gggcttgttg tggatcaacg 6180 cggaaatgcc ggccgtgcta ttgatggtga ccaccgcttt ggcgtggcgc aacagctccg 6240 gcatgggcag atcgtgcaca tagatgacac gttcatccaa accgtattcc ttcgacagac 6300 gcttgatcaa cgggcggtac aggcggtgcc cgcgatccat cgggtgatgt ttgatcacca 6360 gataggactc cttgggggcc ttgcgggaaa agctgtacat cacttcgttg atgtaatcac 6420 gcacatcatt atagttgcta tggttgcgga tctggctgtc gttgtacact tgcaggaccg 6480 ccaggtaata gcgctgatcc agctcgttca tcaggcgggg gaggaccttg cgttgggtga 6540 ccttatacag ctgtttgcgc cagtaggcgc ggacccagca gcgcgcttca taccacgggc 6600 tgaacgattt gtggtggcga tagcgcggaa attcgtgacg atagtgccaa cccatcaggt 6660 aataccacat ggcgtggccg atgcgcttca tggtgctcgg tttcaggttc tcgacgtgcg 6720 gcgtcggcat atcgggcaat ttgcggtaaa agtccggatc gcggggcaag ctgctatagg 6780 cgttcacacc gccttcttcc acggtgataa attgcggacg caggtagcct tcctcgaagg 6840 ccagaaaacg aatccccttc gacttggccc agcgtttggc ctccttgtgc agcaggcggc 6900 agtcaccgaa acacaaaatc gtgtcaaagt catactgacg atgcaagtcc cgcagccaac 6960 cggggaactc cttcggggtt tggtagtacg ccaggtattg gcggtggcgg cagtagaagc 7020 gatcaccgcc attaaagacg acgttgaccg cgttgcgacc gaggctctcc aaccattccg 7080 ccacatcgtt gaagaacgga cccatcggac cttggagcag gaggtacttt ttaccgctca 7140 acagcaccgt cagcgcattg ccgtgcattt attaacctcc taacacgcgg tgttaagcgt 7200 tttcggcgag ctcttaacca aagcgcactt tgcagaacat gatcaacttg cgatagtagc 7260 gaatcacacg gccggctttc ttgcgggtga taaagatggg tttgcggggc gttttgatca 7320 gatattctgc cgcttcctcc accgtgatcg gctgcaaccg cgtcggatga atataggtgg 7380 gatagacaat cagggcttga tagatcaggt cggcgatggt cagccgccgc tcgcgacggg 7440 ggcagtggtg ctcatcgacg gtcaggcccc acgaggcgta gaacggcagg ccgtagcagt 7500 gcacctgttt accgtgcagc aatgcttcaa agccgctgag gctcgtcatc gtgtgcacct 7560 cgtccgcacg ctgaatacac tgaatgatat cggcatccag tgcctggtag tctgcgagtt 7620 ccgcgatctg ttccgccgga atgtcaccct tacggttgcc gacgagcaca tcggggtgcg 7680 gcttgtagat gatgtaggcg tgcggattac gttcccgcac ggtgcgcagc agctccagat 7740 tcgacttgat cgacacggtg cccgtcttaa tcgacgcatc gtcttccacc tggcccggca 7800 ccaggatgac tttcttgtcc ttcgcttctg ccgggaggct gaaatcggcc cccaggttat 7860 atttgctcaa tttgctttcc accagacgtt ggcgcaactt ttccgcgcgc atctggtgcg 7920 cgagggtcag ctggctgtga ttcagcagga cctccagttc cgacggacgg gtggcatcgt 7980 aatagatacc gcgcttatcc aggaccaggc tcaacggcgg cagcagatcg ctccccaggc 8040 cggagctgcg caggaagccg tcttccatgc gccacagcgg cagggatttg cgctgtgcct 8100 ccgcacgcca ttgctgttcg cctttcacgc cccacacgac gcaggcgctt gctgcggtac 8160 agcgacggga aaaggagaga cgattcgtgg ccgtttgcag gaagggcttc aggatcgcgc 8220 ttttccacag ggtcaggccc ggcacccaga gataaccatt ccgctgttgc aggtgacgac 8280 gttgcagctg gagccattgg agcaccgtga acagggccga cacctccccg gtctgcggat 8340 caatgtagcg gcaatagcgc agataggccg ctgcgaacag ttcctccagg gtggccgagc 8400 cgcgacgcgc cgacagcagc gccgattggg ggtggcggtc atcggtgagg ccccaccctg 8460 cataccaggg ttggccaaag caggtcacgg gcttaccggc cagcagggct tcaaaaccgt 8520 actgggaggt cacgacgtac acgcgggaca catgacgcag cagggactgc ggcgacacgt 8580 tttccgcaat caggcgcacg cgctgggtgg cacgcaagtc cgcgaagtag ccggtctttt 8640 tcccttccag gacatcggga tgcactttga cccagatttc tgcctgcggg ttttccgcca 8700 tcgctgcttc cagcattgcg gcgaactcat gggggcctgc gttgccgtag gtcacgctca 8760 tgtcattgaa ggtctggtcc accaccagca cgatgttcgt gcgctcgctt tcatccgcca 8820 cgaacgccgg tgccaggttg tacttgctca tgtcgcccgt cacaatggtg tgcatcgcct 8880 cgcgcgcctg atccgccagg gccgcgttgc cggccttgtc ctgcacgagt ttttccagcg 8940 cgctcggttt cgaggcgtcg tagtaaatgc cgcagtcatc cacgacgagc gagaggggcg 9000 gttcaccgtt cacgcccagg tccagcgagc ggacgaaacc atcctccaag cggatcaccg 9060 gcttgcctgc ggctttggcg atggccaccg gctttgcggc cgaggggcgg tgcccccaca 9120 ccgcgattgc atccacttcc tgcgggaccg ggcgcagcag cgacagcttt tggcagggct 9180 gggcgaggaa tttttccagg tgcggaatac gccaaatgcc ggggctataa atgccaatca 9240 tgcgttctcc gcgagctcct gcgccatcag ggcccggacc ttctccaagc acgccggggt 9300 atcgacgccg ggaccggtcg cggcgacctc gaaggtgcga atgttaatgc ccgcgctcat 9360 cagccgcagt tgctccaggg attcggcctg ttcgggcatg gactccggca actggctgta 9420 attttgcagg acatcccgcc gataggcgta gatcccgacg tgcttcaggt agcgcgcctt 9480 ctcggcgttg cgcgggtacg gaatggggga gcgggagaaa tacagggcgt cctgccgcgt 9540 gttcaccacg accttgacgg tggacggttc ggcggcttct gccgcgctga tcgcatgaca 9600 cagggtcgcc accggcagcg ccgggtcgtc ccgcatacct tgcagcaggg tttcgacgtc 9660 acgcgggcga atcatcggct catccccttg caggttgata tagatatccg cctccacctt 9720 atgcatgact tccaccaggc gatcggtgcc gctctcatga tcgttgcggg tcatgatcgc 9780 tttgccgccg aacgcctgga ctgcctgctc cacacgcggg tcgtcggttg cgacccacac 9840 ctctgccacg cctgccactt gcagggcccg ttcgtagacg tgctggatca tcggtttccc 9900 gacgatatcc agcagcggtt tgcccggcag acggctgctg ccgtagcgtg ccgggatcac 9960 aatcacggcc ttcgacattt attaacctcc tcgagttaca gcgacagaat cactttcgcg 10020 cccaccgcca gttggtacag aatggtgctg ataccgcgcg tcacttcgat gttcttcgac 10080 tcgtatttcg gcaacaccat aatttcatca ccgggtttca gggaatcgac gtcttctgcg 10140 ttcaccgctg cgccgttctg acggatgacg ataatacggg cgttgccgga cttctgggtc 10200 agcccaccgc acttctcgat gtagtcctcg gtcgtcatac ctttctgcca cgacaccgcg 10260 ttcgggaaca gcacttcccc gtggaccatg accaacgacg tcttttcggg aatattgatc 10320 acgtcgccgt cctccaggag gacggagtca atgttgcttt cattgaggat cacttcgccc 10380 ttcggcacga cggtgcgggc tttcgcgacg aagcgggaga tcagttgggc ttcctgcata 10440 cgcaggctgg cctcttcctt ggtgctgctc tgtgcgctga ggctggcctc ttcgagcttt 10500 tgcagggaca aattcagcat ttctttctgc cgttgcgcga cgctcggccg atacaactgc 10560 acggcgttca tctgcgacat ggagttcggg cgcacttttt cgagcacggc ccgcatggtg 10620 ctaccgtagg gcagcaccat ggcgtgttcc ccggaatgtg cgccttccac acgcacttga 10680 atggtgcccg catagcggtc ggtggagaca atgagggtat caccgttttg cagcatacgc 10740 cccggtgcgg acgagatcgg ataatattcc gagcgcttct ggaggccctg cttccgcata 10800 atcgtgatat gggtcgcacc cggtttggga cgtgcccagg acagtgcttc ggtgaccggg 10860 atgctcgatt cgcgaaattc aaagtcgtag gaattgaaca catcgccctg caccgagaac 10920 gtatgctggc gcggacccac aatgatcgta tcaccgtccg caaactggga cagccccagt 10980 ttgccgttga gcaggaagtc atagaggttg acgttcgagc gcacacgatt gccgcgtttc 11040 acgacgatgt ccacgtagct gccgcgttcc gggtccacac cacccgcctt gatcaggtag 11100 ttcagcaggc tgtcggaggt gacaccgccg tacaggccgg ggttgcggac aaagccggtc 11160 acatagacct tgaccggctg cgcctgcaag agcgacgcat agacgttcac gttgctctgg 11220 tagacttcct tcaccttgct cgtcaccagc gcgttcaact gggagttcga cacacctgcg 11280 actttgacgg ggccgacatt cggcaggaag atgttgccct tcgggtccac ctggagtgcg 11340 ccatcgaagg tgaacgcacc ccacaggcgg acctggatgg aatcgccggg attcaggatg 11400 tagtccggat tgaaacccac ggttgccccc gagtctgcgc tcgtaccgtt gaacagctgc 11460 gccccgaaca tacggctcat cacgaccggg ggtgcggggg gcggggtgtt atcgaagccg 11520 ctcatgttct gggtgtcgct tttctgcccg ttcaggatgc cggtcaacgg tgcggcaccc 11580 gtgaggttcg gatcggcatt aatgtcgatg gttgcgctcg cctgtgctgc atggcacgct 11640 gcgatcagca ggatcgactt aaacagcttc atttattaac ctcctcgaga agtcgactta 11700 gtcacggtgg tcttcaatca ccgccaggag caatttcagg gtgccaaaga gcaggcaaca 11760 caccagcagc caacacgcga tcaaatacgg gatattcggg aaggagcttt cctggggcag 11820 ctgcggggac gagatcacgc tcaggacttt cagcttacgg gccgcttcga cacgggtctt 11880 ttcgatgctg gtgagcgtga gcttgtacaa ctcggtattg aactcgacct tggatttgat 11940 ctcctcaaaa tccacggcca tgcggttcag tttatcgccc tggggtgcgg taattttcga 12000 cttttcttcg tcgatctgtg cctggaggct ctgaattgca ttgcgggcgc tcacgacttg 12060 gggcgcatcc tcgcgcaggt acgtgagcag gttgcgcagg tcggcttcca tctgaatttt 12120 ctggcccatc agcgtattca ccagggtgga tgccgcctgg gcctgtgcct gcgggtccag 12180 cacattgttg ttgtcttggt aggacaacaa ttcggctttc gatgcatcca gccgctggcg 12240 cgctttttcc atttcggttt ccgcaaacgc caattgatcg cgggcgatac ggtgcgacat 12300 ttcattgatg aaccgctcgg attccttgag cacggtctgg ttgaatttca gcgcgaactc 12360 gggcgaaaag ccctgggtct ggatgttcag cagcccggtc ttgtcgtcgt agctgacgtt 12420 gatgcgatct ttatagtact tcaggaaccc ctcggcggtt tcatccttgg acagatggtt 12480 caggaagtcc aggcccgaat gggagaacgc ttcgcggaag ttcagctgtt tatccagcgc 12540 ggccagcata tccgggctgt tgatgtattc cttcaggtac agtgcgtctt cggcggacga 12600 cgggttggag gcacccaaca gcaggccgaa gttcaggctg ccggagttga gatcgtcgct 12660 gcgcttgatg gccaccttgc tttccgacat atagcggggc tgggagaaga tcgccaagta 12720 gatcagcagc accgccatgg gtgccagaat aatgattttt gccaggtgct tctgaatatc 12780 tgccaggctg atcgcgctca gacgcgcacg catccacgag acggcgcttt tcactttgat 12840 cagcatttat taacctcctg tcgacaacac gtgttaatcg aaaatgcgca ccaacccggt 12900 caccttattt gctttgttgg tcaccagcag ggtcgagacg cggtgtttct gcatcttctc 12960 ttctgcttcg atgatcatgg tgtcttcggg caaggtcagc ggttcgcggg tcatcatctg 13020 tgcggccgtt gcgctcgtca ggctgtcttc tttctccata aagcgccgca gatcgccatc 13080 ggtgatgatg cctgccagcc caccttccgc atcttcgacc atcaccatac cctggcagcc 13140 cgaggtgatg cgctgaatga ccgttttgaa gctggcatcg agctgcactg ccggcacatc 13200 atgttgcatc acgtcggcga cgcgggtcag caggcgccga cccaggctgc caccggggtg 13260 gtagcgtgca aagtcattgg gcataaactt acgctggtga atcatcgcga tggccagcgc 13320 gtccccgatc gccatcgtga gcgtcgtgga ggtggtcggg gcgagattgt tcgggcacgt 13380 ttcgttcgcc atgtgcagct ccaggaccgc atctgcattt ttggccaggg tgctattccc 13440 gttattggtg attgcgatga tgcgattgcc gaagttcttc aggctcggca ccagtttcag 13500 gatctcgtcc gtctcaccgc tcgccgaaat caagatgagc aggtcatacg gggtgatcat 13560 gcccagatca ccatggaacg cttccgccgg atgaataaag aaggagggcg tcccggtcga 13620 ggccaaggtc gccgacatct tgcggcccac atggccgctt ttacccatgc cgctcaggat 13680 gacgtgccct ttacaattca tgatgagatt caggacgcgc tggtactgac cgctatccag 13740 ttgtttggac aggttttgca gtgccgcgct ttgttcggcc agggtctggc ggacgctcgt 13800 aatcagatac ggatcaatgg tcgaggactg gtcatccggc aagtggcgtt cgctcattta 13860 ttaacctcct cacgtgttaa ttaagtaatc gatagtgatt taaatatgca agatccgata 13920 aatcgattga tagatttaaa taagaactgc agaagctagc aacttaagtt acgaatcgac 13980 gccgaacagg tcgcgggtgt agactttctc cgagacatct tccagttcgc tggtgcggcg 14040 attcgccaca atgacatcga cgcgctcctt aaaggaattg atgtcgcgct cgacgtagga 14100 accgaagaag tagggttctt tcaggaccgg ctcgtacacc acaatctcga tacccttggc 14160 cttcaaacgt ttcatgaccc cctggatgct gctggcccgg aaattgtcgc tacccgcctt 14220 catgatcagg cgatagatac cgaccacttt gggcttacgg gacaggatgt cctcggccac 14280 gaagtcctta cgggtcgtat tcgcatccac gatggcctgg atcaggtttt gcgggacgtc 14340 gcgataattg gccaacagct gcttcgtatc cttcggcaga cagtaaccgc cgtagccgaa 14400 ggacgggttg ttgtaatgtt gaccaatgcg cggatcgagg gagacgcctt cgatgatttg 14460 tttggtatcc aggccgtgca cgctcgcgta ggtgtccagc tcgttaaagt acgcgatacg 14520 catcgccaga tacgtgttcg cgaacagttt gatggcttct gcctcgggcg aatccgtcag 14580 caggatcgga atatcctttt tgatggcacc ttccgacagg agttcggcga acttccgtgc 14640 gcgttccgac gattcgccca cgacaatgcg gctcggatag agattatcat acagggcttt 14700 gccttcgcgc aggaactccg gggaaaagat gatattattc gtgttcagat cgcgcttcag 14760 gcgttcggtg aacccgacgg ggacggtgga tttgataatg atggtcgcgt tcgggttaat 14820 ggacagcacg tcacacgcga cgctttcgac gctcagggta tcaaagttgt tattaatcgg 14880 atcatagttc gtcggggtgg cgatgatcac gtagtctgca tcgcgatatg cctcgtattt 14940 ttccgtcgtc gcgtagaggt tcagcttacg attggagaga aacttctgga tttccgggtc 15000 gcaaatcggc gagattttct tgttaatgag ctggaccttc ttcgggtcga tgtccagggc 15060 gatgatgtcg tgtttttggg agaggaggat cgcaatgctg atacccacat agccgacgcc 15120 ggccacggca attttcattt attaacctcc ttaagtgaat tcaaactagt ttacaagtcg 15180 ttttcgatct tctcccaggt atatttgcga cattcattca agttggtcag cggcgagtat 15240 ttgtactttt tgataccgag gcgcgacagg ctttcgttca ccaccttgaa atggttttcc 15300 ttttggatgt ccagtttctt gatcgacgtg ttctcgccgt gcaggacacg gttgtagcaa 15360 atcttattga tatgcttaaa cgggccgact tcgctgagtt tcaaatacat atcgtaatcc 15420 accgcattgc tgatgctctc gttgaagcct tcggtgaggt tccatgcacg cgccgtgaac 15480 atacggaagt ggtggcagat catcgcgctc gtgagctttt cgcggctgta aatcggccag 15540 ttgtagccat tgctaatcaa gttaccttca cgatcaatat tgcgattggt ggtgtacacg 15600 caggcgaggc tcaggtcttt gcgaaattca tccagacaca gttccacggc atcgggctcc 15660 aggaaatcat cggaatccag ctgcccgatg tagaaacccc ggcacaggcg gactgcggta 15720 ttcgaggcgg agccgatgcc tttgtttttc tggctgatga aacggacgcg cgggtggttt 15780 gcgtaatgtt cttgcaggat gcgcagcgta tcatcggtgc tcccgtcatc gcagatgcag 15840 acctccagat cggtgatcgt ttggttcagt gccgattcga cgcagcgcac gatatatttg 15900 ctgcaattat acgcggggat gtagatgctc accaggggca cacgtttcag ggtggcgctc 15960 tcgattttct ccttcttgcg ataaaagtag ggcaccttct gctgcaacag ctggacggta 16020 atgtttttac ctgccgcgcg atcggtttcg ttctccttac cgggcggttc ctgatgatat 16080 gccatcgcgc cttccacgct acggaaataa caaccctcgc ggtacagccg atagccgaac 16140 tcattatcct caccgcccca atgcgtgaac tcttcgtcaa accaacccgc gcgaaacagc 16200 cacttctttg caaacgccac attgccaccg ctaaagaacc ggaacggggt gttgcacagg 16260 cgcagattgt cggtattctt gaaatgttcg atgcgccaat cgacggattt gttctgctcg 16320 accttgcctg cgacctgatt attggtaata atctccggga tttcattgat caggcttttc 16380 tgggacaaaa agtccagata ggtatgcttc gacgtgtcga tgtatttacg cgggccaatc 16440 agtgccacgt tatcatccac ggccaggagt tccatatagg actgcaccca caacgggttc 16500 ggcgccatat cgcagtccaa gatcgccacg tagttgtatt tcgctgcccg caggcccagg 16560 ttccgcacgg cgcacagctg gtagccgtag tctttctggc ggacgtattt gatgttcagc 16620 aacgactcga actcgcggac gatctcttcg atgttttcct tggaaccgtc atccgcgacg 16680 atgacctcat agtcataaat cgttttctga ttgcagaggc aggccagggt gatcgccagg 16740 attttggcgc gattgtacgt cggaatcacg atggacaggc cgtcgatgat cagttgcttg 16800 cgcggataat catccagttc tttacgtttc cctgcccaga cgtagtcgtt cgtgctttcc 16860 ggcagcggcg gcaaggtcag gtcgctcggc caatccagcg gaatgggttc gacttctttc 16920 aattcggcgc gctcggattt ctttgcggta atttcccgat atttgctaat gatttcattc 16980 ttttccacct cattcagcga gatcgccttt gcattgctgc acataatttt ggttgccgcg 17040 tcgatatcaa tgaccgcttt ccgattcagc ttgtccactt cttcgctcag attcagggcg 17100 gtttggcaca gcttgatatt ggcttccacc cagctcacat catagatttc cgccactttt 17160 tcaaacaggg agagggcttg gcggtagttc ttattcttat acagattgat tgcctggttc 17220 aaaatgctca tttattaacc tcctactagt gaattttcga attacttacc gcagtacttg 17280 acacccacct gggaattgtt tttggtgcgt ttgaattggc ggatggtacg gtagatgcta 17340 aagggcaggc tgatcagacc gagcggaaaa ttgttcttat tgatgatgag cttgcccagc 17400 tgatagctca ggtgtttctt gacccgttcg gcttcgtgtt tatccgcgta caggaagatg 17460 ctcggcaggc tcacttggta ctccgaatca tatttcttct tccaggtccg ccattcgctg 17520 atcaacgcaa acggaatcga gatcagaccg aggaacgtct tggagcggct caccatcacc 17580 gcacccaggc ggtagccgat atcttgcttg atgcgttcgg ccgcaccata cagctccggc 17640 agttgtttct tttcgagacg ttgattgtcg atgaagtact gttcgagctt ttgctgcacc 17700 agatgcagct gattgagcag caattctttt tcgcacgaca gcttttcgag gcgctgttgt 17760 tgcagttcat ttttgttctg ttcctttttc agcagggact cgaagttctc gatcgcgcac 17820 tccagttcct ggacctggat ggttttgttt ttaatgatca gatcatactg gatcagttct 17880 tccttgctat ccgacagctc tttcagaatg gcttgatagg cgttcagctg tttggacgtg 17940 tgcagttcgt tgtccagaat gatctttttg ctgctctggt acagaccgtt cacgatatcg 18000 agggtgatct ggcgttgttt aatgaacgtc tcccaaataa aggacggctt atagttttcc 18060 ttctccagca cccgcaaggg ggtgttggcg ttcgattgca attcaaagta cagttccttg 18120 caatcgggat agtcgttcag gacgttgaag atcaagtact cctccgtctc gctttgcttg 18180 aaaatgatat ccccggtccc gatgtcaata ccgctgaggg acatgatctc ctgatgttct 18240 ttttccagcg taatggaggc ttcggcggtc ttaaagtcat tcacgctctg ctccagcgag 18300 tggttgatgg tattggagaa cgacaacccg aatttcagtt tcagtttgtg ttgcagttgc 18360 tggatgcagt cctcggcgtt gcgcttcacc tgttcgctcg acaccagcag gcaccgaccc 18420 cggttgttga ggaagaagtg cagcaaggcg gtgttgtatg ccagccagtt tttgatcaga 18480 tgctccgagg tatagttgct ggagatgttc tggtccgaga agtagttcgt caggatgctt 18540 ttggggtggt cgtagatgag gataaaggtg atgttctcat ccaccgattt ccaatattcc 18600 aacgtgtgaa ttgcgttggg gtcgctccaa ccgcacagtt tctggttcag gttggacagc 18660 atcagatcca atgcgatacc gttccagacg gtgctcacat ggagcggttc aaagtcggcg 18720 gaatcggtca ccgtatagat gtccggcgac tggtacgcct tccgcagcgt ctgggtgatg 18780 tcctggggcg agaggttctc acgtttggac gggcacaggg agttcatgcc gcgctgatgc 18840 aggagttctt ccacgatttg gtagttgctg ctcggatggc ccacgatcac caggcggttc 18900 atttattaac ctcctttcga aaatgaacgg tccgttaaat atagccattc ggattcttca 18960 tctgccagcg ccaggcgtcc tccagcatgg tttcgagttc ccgcttggct ttccagttca 19020 gatatttgtt ggccttttcg ggggaggacc agctctccgc gatatcaccg tcacggcggc 19080 tcacgatttc atacggaatc cgcacgccgg aaatcttttc aaaggtggac accagttcca 19140 gcaccgaata acctttaccc gtgcccaaat taaagacgtg gtagttggtg ttattgtcgc 19200 ggaagagata ggacagcgct gcgacgtgcc cttcggccag gtccatcaca tggatatagt 19260 cacggacccc cgtgccgtct ttggtgggat aatcaccacc gaacaccatc agtttttcca 19320 gtttccccat cgcgacctgc aagatgtacg gcaccaagtt ggaggggatg tctgccgggc 19380 tttcaccaat cataccggat tcgtgggcgc ccgtcggatt aaagtagcgc aagcagagga 19440 aattcgtgtc ggagtatttc ttggcgatgt cgcggatcat cagctccgag atgtacttgg 19500 acgtaccata cggattcagc gtgccaccaa tatggcagtc ttcggtgacg ggcatgatct 19560 tgctttcccc atacaccgtc gccgacgagc taaagatgaa gttggcgacg tcgttcttga 19620 tggcgcaatt gatgagttgc agggtgccgc tcacgttgtt gtcatagtag aagatgggct 19680 tgatcaggct ttctgcgacc gatttcgcac ctgcaaagtg catgatgcag tcgaatttgt 19740 gtttcttcag gatctggttc acttccttct cgttgttgat attgagttcg tagaacgtga 19800 ctttcttctt tgcgatcagc tcaatgcgac ggatgctttc gcagctgctg ttgatgagat 19860 tgtcaatgat gacgacattg tagcctttgt tcagcaggca gagcgacgtg tggctgccga 19920 tgtagcctgc accgccggtg accaggatgt tcatttatta acctcctcgg tccgaattaa 19980 cctaggttat gaggtcagca ttgcttcttc acgcgtttag tagttgtttt gttcggtgat 20040 atattcttca atgccttctt gcacgtcttc atggaacgac acggcgttgt cgtctttaaa 20100 cacgattgcc acatcgcaga actctttcaa cgagttcagc gagtgcgaca ccatgaggaa 20160 ggagctttcc ttatgacgct ccttgaagag ttgggcacat ttttccttga aacgggcgtc 20220 ccccaccgcc gtcacctcgt ccacgatgta gtaatcgaac ttgaacgcca tgctcaggcc 20280 gaagccgagg cggctgcgca taccgctcga ataggtcttg atcggcatat caaaatactt 20340 ccccagctcc gcgaactctt ccacaaactc aatcttttct ttcagctcct cctgcttcgc 20400 gtacagccgg gccacgaact tcacgttttc acgcccggtc aagctgccct ggaagccgcc 20460 tgccagaccc accggccacg agatcgtttt attcgtgatg attttaccgc tatccgggcg 20520 gtcgatgccc ccaatcatgc gcaacagcgt ggatttaccc gccccattgc gcccgatgaa 20580 cgccacgctt ttgccgctgg ggatctcaat gttcaggttc ttgaagacat agtgacggcc 20640 caccggggtg cggtagcttt tcgtcaggtt ttcgatctta atcatgaggt caacattgcc 20700 tcctcacgcg tacggtacag ggccaaacca ataaacaggg tcaccagggt gaacattgcc 20760 agataattca ggctgacccc ttcgctgata taaccgggca tcacggcctc gcggctcagt 20820 tcgacgacgt gcaccagggg attccacagc aggtacgacc aatactgctt cggaatggag 20880 tgcagcggga acatgatgca cgaaataaag tacagcggct tcagcaagat cggcaagact 20940 ttctgcattt cggggaacgt cttgcccacg accatgaaga tcaggcccac accgcacgac 21000 aggatgatca ggaggctcca ggtgagcaca aattgcagga agttggtaat ctcgaaatat 21060 tcgcccgcca tccagatgat cagcatcagg aggatgtaga ccgccacata gatcagcgtt 21120 tccaagaggg cgcgtgcaat gatcgtgtcg atcggcttca cgggccggta gttaaacagc 21180 ccctgattgg cttcgatggc gcccacggag cgattgctga tgctgctgaa aataaagaac 21240 gggatcaggc cattgagcag gaacaccggg aaggagatat ccggcatggt gcgatgcatg 21300 atatagccaa agatcccgag cagaatcagc agatgtgcgc tcggttccag gatcgcccac 21360 agatagccca ggcgaaactt gccaaagcgc gtacggattt cgcggagaaa cagtgcttcg 21420 accgtcactt tctggacttc aaaacccgaa cgtgccattt attaacctcc tggtaccaat 21480 ctagattgtt taaacagatc tgttacctgc aggattattg tttctgttgc ataaagccta 21540 aggggtaggc ctttctagag atagccattt tttgcactcc tgtatccgct tcttgcaagg 21600 ctggacttat ccctatcaaa ccggacactg caggctgaca agctttcatt acatatgaag 21660 agtttgtaga aacgcaaaaa ggccatccgt caggatggcc ttctaagaag gctcgagtgg 21720 cgcgcctaag tcgaatttct gccattcatc cgcttattat acttattcag gcgtagcacc 21780 aggcgtttaa gggcaccaat aactgcctta aaaaaattac gccccgccct gccactcatc 21840 gcagtactgt tgtaattcat taagcattct gccgacatgg aagccatcac agacggcatg 21900 atgaacctga atcgccagcg gcatcagcac cttgtcgcct tgcgtataat atttgcccat 21960 ggtgaaaacg ggggcgaaga agttgtccat attggccacg tttaaatcaa aactggtgaa 22020 actcacccag ggattggctg agacgaaaaa catattctca ataaaccctt tagggaaata 22080 ggccaggttt tcaccgtaac acgccacatc ttgcgaatat atgtgtagaa actgccggaa 22140 atcgtcgtgg tattcactcc agagcgatga aaacgtttca gtttgctcat ggaaaacggt 22200 gtaacaaggg tgaacactat cccatatcac cagctcaccg tctttcattg ccatacggaa 22260 ttccggatga gcattcatca ggcgggcaag aatgtgaata aaggccggat aaaacttgtg 22320 cttatttttc tttacggtct ttaaaaaggc cgtaatatcc agctgaacgg tctggttata 22380 ggtacattga gcaactgact gaaatgcctc aaaatgttct ttacgatgcc attgggatat 22440 atcaacggtg gtatatccag tgattttttt ctccatttta gcttccttag ctcctgaaaa 22500 tctcgataac tcaaaaaata cgcccggtag tgatcttatt tcattatggt gaaagttgga 22560 acctcttacg tgccgatcaa cgtctcattt tcgccaaaag ttggcccagg gcttcccggt 22620 atcaacaggg acaccaggat ttatttattc tgcgaagtga tcttccgtca caggtattta 22680 ttcggcgcaa agggcctcgt gatacgccta tttttatagg ttaatgtcat gataataatg 22740 gtttcttaga cgtcaggtgg cacttttcgg ggaaatgtgc gcgcccgcgt tcctgctggc 22800 gctgggcctg tttctggcgc tggacttccc gctgttccgt cagcagcttt tcgcccacgg 22860 ccttgatgat cgcggcggcc ttggcctgca tatcccgatt caacggcccc agggcgtcca 22920 gaacgggctt caggcgctcc cgaaggt 22947 <210> 39 <211> 22774 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 39 ctcgggccgt ctcttgggct tgatcggcct tcttgcgcat ctcacgcgct cctgcggcgg 60 cctgtagggc aggctcatac ccctgccgaa ccgcttttgt cagccggtcg gccacggctt 120 ccggcgtctc aacgcgcttt gagattccca gcttttcggc caatccctgc ggtgcatagg 180 cgcgtggctc gaccgcttgc gggctgatgg tgacgtggcc cactggtggc cgctccaggg 240 cctcgtagaa cgcctgaatg cgcgtgtgac gtgccttgct gccctcgatg ccccgttgca 300 gccctagatc ggccacagcg gccgcaaacg tggtctggtc gcgggtcatc tgcgctttgt 360 tgccgatgaa ctccttggcc gacagcctgc cgtcctgcgt cagcggcacc acgaacgcgg 420 tcatgtgcgg gctggtttcg tcacggtgga tgctggccgt cacgatgcga tccgccccgt 480 acttgtccgc cagccacttg tgcgccttct cgaagaacgc cgcctgctgt tcttggctgg 540 ccgacttcca ccattccggg ctggccgtca tgacgtactc gaccgccaac acagcgtcct 600 tgcgccgctt ctctggcagc aactcgcgca gtcggcccat cgcttcatcg gtgctgctgg 660 ccgcccagtg ctcgttctct ggcgtcctgc tggcgtcagc gttgggcgtc tcgcgctcgc 720 ggtaggcgtg cttgagactg gccgccacgt tgcccatttt cgccagcttc ttgcatcgca 780 tgatcgcgta tgccgccatg cctgcccctc ccttttggtg tccaaccggc tcgacggggg 840 cagcgcaagg cggtgcctcc ggcgggccac tcaatgcttg agtatactca ctagactttg 900 cttcgcaaag tcgtgaccgc ctacggcggc tgcggcgccc tacgggcttg ctctccgggc 960 ttcgccctgc gcggtcgctg cgctcccttg ccagcccgtg gatatgtgga cgatggccgc 1020 gagcggccac cggctggctc gcttcgctcg gcccgtggac aaccctgctg gacaagctga 1080 tggacaggct gcgcctgccc acgagcttga ccacagggat tgcccaccgg ctacccagcc 1140 ttcgaccaca tacccaccgg ctccaactgc gcggcctgcg gccttgcccc atcaattttt 1200 ttaattttct ctggggaaaa gcctccggcc tgcggcctgc gcgcttcgct tgccggttgg 1260 acaccaagtg gaaggcgggt caaggctcgc gcagcgaccg cgcagcggct tggccttgac 1320 gcgcctggaa cgacccaagc ctatgcgagt gggggcagtc gaaggcgaag cccgcccgcc 1380 tgccccccga gacctgcaga tccacatcct tgaaggccgc agcgacgagc agaaggaaac 1440 cctcattcgg gaagtcagcg aggccatctc gcgctccctg gatgcgccgc tgaccagcgt 1500 gcgagtgatt atcacggaga tggccaaggg ccacttcggc atcggcggcg aactggccag 1560 caaggtcaga cgctgaagtg gagatgccca agggcacttc gggtcgagga acccgacctg 1620 cattgggacg cggccacgga gagcgcgggc aaacgccggc actatagcca gtggagtttg 1680 taaaacgcta tttcagagct tggagagtgt ctaagaaagc cggggcgatg ccaacccatc 1740 ccttcttcgg ctatgcatcg ttcgtaatca agccacttcc tttttgcatt gacgcagggt 1800 gtcggaaggc aactcgccga acgcgctcct atagttttca gcgaagcgtc ccaaatgtaa 1860 gaagccgtag tctagggcta tctcagttat actacgcaca ttggcactgg gatcgttcaa 1920 gcaggcgcgg atgctttcga gcttgcggtt gcggatgtag ttcttcggcg tggtgccggc 1980 atgcttctcg aacaaattgt agagcgagcg tggactcatc atcgccagct ccgctaaccg 2040 ctcaaggctg atattccgtt tgagattctc ctcaatgaat tgaacgactc gctcgaaaga 2100 cgggttacct ttgctgaaaa tttcacggct gacattgctg cccagcattt cgagcagctt 2160 ggaagcgatg atccccgcat agtgctcttg gacccgaggc atcgactttg tatgttccgc 2220 ttcgtcacaa actaacccga gtagattgat aaagccatcg agttgctgga gattgtgtcg 2280 cgcggcgaaa cggataccct ccctcggctt gtgccaattg ttgtcactgc atgcccgatc 2340 aaggaccact gagggcaatt taacgataaa tttctcgcaa tcttctgaat aggtcaggtc 2400 ggcttggtca tccggattga gcagcaatag ttcgcccggc gcaaaatagt gctcctggcc 2460 atggccacgc cacaggcaat ggcctttgag tattatttgc agatgataac aggtctctaa 2520 tccaggcgag attaccctca cgctaccgcc gtagctgatt cgacacaggt cgaggcatcc 2580 gaagattctg tggtgcagcc tgcctgccgg gcgcccgccc ttgggcaggc gaatagagtg 2640 cgtaccgaca tactggttaa cataatcgga gactgcatag ggctcggcgt ggacgaagat 2700 ctgacttttc tcgttcaata agcaaaaatc catagttcac ggttctctta ttttaatgtg 2760 ggctgcttgg tgtgatgtag aaaggcgcca agtcgatgaa aatgcatctc gacgtgatgc 2820 gtatacgggt tacccccatt gccacgttgc gccatccttt ttgcaatcag tgaccacttt 2880 tccaagcaaa aataacgcca agcagaacga agacgttctt tttaagaagc gagaacacca 2940 gaagttcgtg ctgtcggggc atgcggcgac gaattggcgg ataaagggga tctgcaggtc 3000 ccgagcctca cggcggcgag tgcgggggtt ccaagggggc agcgccacct tgggcaaggc 3060 cgaaggccgc gcagtcgatc aacaagcccc ggaggggcca ctttttgccg gagggggagc 3120 cgcgccgaag gcgtggggga accccgcagg ggtgcccttc tttgggcacc aaagaactag 3180 atatagggcg aaatgcgaaa gacttaaaaa tcaacaactt aaaaaagggg ggtacgcaac 3240 agctcattgc ggcacccccc gcaatagctc attgcgtagg ttaaagaaaa tctgtaattg 3300 actgccactt ttacgcaacg cataattgtt gtcgcgctgc cgaaaagttg cagctgattg 3360 cgcatggtgc cgcaaccgtg cggcacccta ccgcatggag ataagcatgg ccacgcagtc 3420 cagagaaatc ggcattcaag ccaagaacaa gcccggtcac tgggtgcaaa cggaacgcaa 3480 agcgcatgag gcgtgggccg ggcttattgc gaggaaaccc acggcggcaa tgctgctgca 3540 tcacctcgtg gcgcagatgg gccaccagaa cgccgtggtg gtcagccaga agacactttc 3600 caagctcatc ggacgttctt tgcggacggt ccaatacgca gtcaaggact tggtggccga 3660 gcgctggatc tccgtcgtga agctcaacgg ccccggcacc gtgtcggcct acgtggtcaa 3720 tgaccgcgtg gcgtggggcc agccccgcga ccagttgcgc ctgtcggtgt tcagtgccgc 3780 cgtggtggtt gatcacgacg accaggacga atcgctgttg gggcatggcg acctgcgccg 3840 catcccgacc ctgtatccgg gcgagcagca actaccgacc ggccccggcg aggagccgcc 3900 cagccagccc ggcattccgg gcatggaacc agacctgcca gccttgaccg aaacggagga 3960 atgggaacgg cgcgggcagc agcgcctgcc gatgcccgat gagccgtgtt ttctggacga 4020 tggcgagccg ttggagccgc cgacacgggt cacgctgccg cgccggtagc acttgggttg 4080 cgcagcaacc cgtaagtgcg ctgttccaga ctatcggctg tagccgcctc gccgccctat 4140 accttgtctg cctccccgcg ttgcgtcgcg gtgcatggag ccgggccacc tcgacctgaa 4200 tggaagccgg cggcacctcg ctaacggatt caccgttttt atcaggctct gggaggcaga 4260 ataaatgatc atatcgtcaa ttattacctc cacggggaga gcctgagcaa actggcctca 4320 ggcatttgag aagcacacgg tcacactgct tccggtagtc aataaaccgg taaaccagca 4380 atagacataa gcggctattt aacgaccctg ccctgaaccg acgaccgggt cgaatttgct 4440 ttcgactatc ggcgcgccag agctcatcgt taatgtcttc gtgcgccgtc agtcggcgca 4500 cgttttttct ctctggtacc gtgtcactga tctagtcaat tactcgaagt atccacaagt 4560 gaagcatact aagtaatgta caagaatcaa aaaaatcggc tacgcaagtc gcgtagccga 4620 atcatttaag gatccttcca ttcaggtcga ggtggcccgg ctccatgcac cgcgacgcaa 4680 cgcggggagg cagacaaggt atagggcggc gcctacaatc catgccaacc cgttccatgt 4740 gctcgccgag gcggcataaa tcgccgtgac gatcagcggt ccagtgatcg aagttaggct 4800 ggtaagagcc gcgagcgatc cttgaagctg tccctgatgg tcgtcatcta cctgcctgga 4860 cagcatggcc tgcaacgcgg gcatcccgat gccgccggaa gcgagaagaa tcataatggg 4920 gaaggccatc cagcctcgcg tcgcgaacgc cagcaagacg tagcccagcg cgtcggccgc 4980 catgccggcg ataatggcct gcttctcgcc gaaacgtttg gtggcgggac cagtgacgaa 5040 ggcttgagcg agggcgtgca agattccgaa taccgcaagc gacaggccga tcatcgtcgc 5100 gctccagcga aagcggtcct cgccgaaaat gacccagagc gctgccggca cctgtcctac 5160 gagttgcatg ataaagaaga cagtcataag tgcggcgacg atagtcatgc cccgcgccca 5220 ccggaaggag ctgactgggt tgaaggctct caagggcatc ggtcgacgct ctcccttatg 5280 cgactcctgc attaggaagc agcccagtag taggttgagg ccgttgagca ccgccgccgc 5340 aaggaatggt gcatgcaagg agatggcgcc caacagtccc ccggccacgg ggcctgccac 5400 catacccacg ccgaaacaag cgctcatgag cccgaagtgg cgagcccgat cttccccatc 5460 ggtgatgtcg gcgatatagg cgccagcaac cgcacctgtg gcgccggtga tgccggccac 5520 gatgcgtccg gcgtacaaga tccacaggac gggtgtggtc gccatgatcg cgtagtcgat 5580 agtggctcca agtagcgaag cgagcaggac tgggcggcgg ccaaagcggt cggacagtgc 5640 tccgagaacg ggtgcgcata gaaattgcat caacgcatat agcgctagca gcacgccata 5700 gtgactggcg atgctgtcgg aatggacgat atcccgcaag aggcccggca gtaccggcat 5760 aaccaagcct atgcctacag catccagggt gacggtgccg aggatgacga tgagcgcatt 5820 gttagatttc atacacggtg cctgactgcg ttagcaattt aactgtgata aactaccgca 5880 ttaaagccga gcgatgataa gctgtcaaac atgagatccg ataaatcgat tgatagattt 5940 aaataagaac tgcagaagct agcttagatg ctcgtgaaat tgacgtgggc gctttgcagg 6000 gccgtcttaa tggcgttggt gtccacgagg atcgagtcgg gtgcggaaaa cggacggttc 6060 ttgttggtga aatcgctgtt accaatgtac agcgattcct tgttacgcag cgcctggatg 6120 tgccagcggg accacgaatc ccaatacttc tggcgatccg gcgagatacc ttggctggtg 6180 tagccggtcg tcgggctgtt catcaacgag tcggtgcggt gcgagcccag cgtcagcggc 6240 aacttgatcc gatgcaccgt ggaatcgccg aagatcagct tcagacgcgc gataaattcg 6300 ctatccgcac ccgttttcac acaatcccag acaccggcct tctgcaagac gtcggcacgg 6360 cgaaacagga gcgacgacgg attcagacgc ttcaaggggt acactgcgcg ggcatagaaa 6420 ataccgttgt cttgcaggcg cacccagtcc gagatggagc agatgagctt cggattgagc 6480 aacaaggggg agatttggcg gaacagcttt tccggatggc tccagtcatc cgaatcgtgg 6540 caggtgacga actcgccctt cgcttggatc aagccgatac gcttcgcggc ataggtgccg 6600 acattctgcg gcaggctaat gatcttgatg cgcgtgtctt tgagggcgag ccgctggaga 6660 cgaaacaggg tgtcatcggt gctcgcgtca tccacaatga tcagctcgaa ggaacggtag 6720 gtctgattga ggagcgaaat caccgcattt tccacgcggc gacccgtatt ataggtggtc 6780 atcaggatgg agatcaacgg ccccgtctgg gccgggtacg ggatgctggt gatgatgttg 6840 cacggggaga gcggggagct gttgtccgtc aaggccacgg ggctgaggcc gaagtattta 6900 tagtattcat tcagccgatt caggctaatt tcggcggttt cgcggaaggc gttattttgc 6960 agcagcagga tatccgggct atagacgata tcggatgcgt cgatctgggc gagggtcgag 7020 atggcctttt gggtcaggcc gatccggagt tgcagtgcgg tatacaggtc cagcgggcag 7080 ttgtccacgt tgtccaacag gctcaggcta aaggtcggcg agtaggacgc cagggttttc 7140 gccagttcca ctttctgatg ggtatcggtg aactcgtcct tgaactccat cagcagctcg 7200 ggcgtcaggc tgatgtcgcc gcaggcgatt tttgcgatct tgattgccag tttgcagcgc 7260 caatcggacg gggtatccgt caagttatgc agcgaccagt acatattcag acgatacatc 7320 gcgaggatgc gtttcgactg ccagaaccgg caatcatcct ggatggccgc gagcgcgtgg 7380 acgtagcggc tctttttgag cagccacaag aatttgagat tattgaacat ttattaacct 7440 cctgctagca acttaagtta cgaatcgacg ccgaacaggt cgcgggtgta gactttctcc 7500 gagacatctt ccagttcgct ggtgcggcga ttcgccacaa tgacatcgac gcgctcctta 7560 aaggaattga tgtcgcgctc gacgtaggaa ccgaagaagt agggttcttt caggaccggc 7620 tcgtacacca caatctcgat acccttggcc ttcaaacgtt tcatgacccc ctggatgctg 7680 ctggcccgga aattgtcgct acccgccttc atgatcaggc gatagatacc gaccactttg 7740 ggcttacggg acaggatgtc ctcggccacg aagtccttac gggtcgtatt cgcatccacg 7800 atggcctgga tcaggttttg cgggacgtcg cgataattgg ccaacagctg cttcgtatcc 7860 ttcggcagac agtaaccgcc gtagccgaag gacgggttgt tgtaatgttg accaatgcgc 7920 ggatcgaggg agacgccttc gatgatttgt ttggtatcca ggccgtgcac gctcgcgtag 7980 gtgtccagct cgttaaagta cgcgatacgc atcgccagat acgtgttcgc gaacagtttg 8040 atggcttctg cctcgggcga atccgtcagc aggatcggaa tatccttttt gatggcacct 8100 tccgacagga gttcggcgaa cttccgtgcg cgttccgacg attcgcccac gacaatgcgg 8160 ctcggataga gattatcata cagggctttg ccttcgcgca ggaactccgg ggaaaagatg 8220 atattattcg tgttcagatc gcgcttcagg cgttcggtga acccgacggg gacggtggat 8280 ttgataatga tggtcgcgtt cgggttaatg gacagcacgt cacacgcgac gctttcgacg 8340 ctcagggtat caaagttgtt attaatcgga tcatagttcg tcggggtggc gatgatcacg 8400 tagtctgcat cgcgatatgc ctcgtatttt tccgtcgtcg cgtagaggtt cagcttacga 8460 ttggagagaa acttctggat ttccgggtcg caaatcggcg agattttctt gttaatgagc 8520 tggaccttct tcgggtcgat gtccagggcg atgatgtcgt gtttttggga gaggaggatc 8580 gcaatgctga tacccacata gccgacgccg gccacggcaa ttttcattta ttaacctcct 8640 taagtgaatt caaactagtt tacaagtcgt tttcgatctt ctcccaggta tatttgcgac 8700 attcattcaa gttggtcagc ggcgagtatt tgtacttttt gataccgagg cgcgacaggc 8760 tttcgttcac caccttgaaa tggttttcct tttggatgtc cagtttcttg atcgacgtgt 8820 tctcgccgtg caggacacgg ttgtagcaaa tcttattgat atgcttaaac gggccgactt 8880 cgctgagttt caaatacata tcgtaatcca ccgcattgct gatgctctcg ttgaagcctt 8940 cggtgaggtt ccatgcacgc gccgtgaaca tacggaagtg gtggcagatc atcgcgctcg 9000 tgagcttttc gcggctgtaa atcggccagt tgtagccatt gctaatcaag ttaccttcac 9060 gatcaatatt gcgattggtg gtgtacacgc aggcgaggct caggtctttg cgaaattcat 9120 ccagacacag ttccacggca tcgggctcca ggaaatcatc ggaatccagc tgcccgatgt 9180 agaaaccccg gcacaggcgg actgcggtat tcgaggcgga gccgatgcct ttgtttttct 9240 ggctgatgaa acggacgcgc gggtggtttg cgtaatgttc ttgcaggatg cgcagcgtat 9300 catcggtgct cccgtcatcg cagatgcaga cctccagatc ggtgatcgtt tggttcagtg 9360 ccgattcgac gcagcgcacg atatatttgc tgcaattata cgcggggatg tagatgctca 9420 ccaggggcac acgtttcagg gtggcgctct cgattttctc cttcttgcga taaaagtagg 9480 gcaccttctg ctgcaacagc tggacggtaa tgtttttacc tgccgcgcga tcggtttcgt 9540 tctccttacc gggcggttcc tgatgatatg ccatcgcgcc ttccacgcta cggaaataac 9600 aaccctcgcg gtacagccga tagccgaact cattatcctc accgccccaa tgcgtgaact 9660 cttcgtcaaa ccaacccgcg cgaaacagcc acttctttgc aaacgccaca ttgccaccgc 9720 taaagaaccg gaacggggtg ttgcacaggc gcagattgtc ggtattcttg aaatgttcga 9780 tgcgccaatc gacggatttg ttctgctcga ccttgcctgc gacctgatta ttggtaataa 9840 tctccgggat ttcattgatc aggcttttct gggacaaaaa gtccagatag gtatgcttcg 9900 acgtgtcgat gtatttacgc gggccaatca gtgccacgtt atcatccacg gccaggagtt 9960 ccatatagga ctgcacccac aacgggttcg gcgccatatc gcagtccaag atcgccacgt 10020 agttgtattt cgctgcccgc aggcccaggt tccgcacggc gcacagctgg tagccgtagt 10080 ctttctggcg gacgtatttg atgttcagca acgactcgaa ctcgcggacg atctcttcga 10140 tgttttcctt ggaaccgtca tccgcgacga tgacctcata gtcataaatc gttttctgat 10200 tgcagaggca ggccagggtg atcgccagga ttttggcgcg attgtacgtc ggaatcacga 10260 tggacaggcc gtcgatgatc agttgcttgc gcggataatc atccagttct ttacgtttcc 10320 ctgcccagac gtagtcgttc gtgctttccg gcagcggcgg caaggtcagg tcgctcggcc 10380 aatccagcgg aatgggttcg acttctttca attcggcgcg ctcggatttc tttgcggtaa 10440 tttcccgata tttgctaatg atttcattct tttccacctc attcagcgag atcgcctttg 10500 cattgctgca cataattttg gttgccgcgt cgatatcaat gaccgctttc cgattcagct 10560 tgtccacttc ttcgctcaga ttcagggcgg tttggcacag cttgatattg gcttccaccc 10620 agctcacatc atagatttcc gccacttttt caaacaggga gagggcttgg cggtagttct 10680 tattcttata cagattgatt gcctggttca aaatgctcat ttattaacct cctactagtg 10740 aattttcgaa aatgaacggt ccgttaaata tagccattcg gattcttcat ctgccagcgc 10800 caggcgtcct ccagcatggt ttcgagttcc cgcttggctt tccagttcag atatttgttg 10860 gccttttcgg gggaggacca gctctccgcg atatcaccgt cacggcggct cacgatttca 10920 tacggaatcc gcacgccgga aatcttttca aaggtggaca ccagttccag caccgaataa 10980 cctttacccg tgcccaaatt aaagacgtgg tagttggtgt tattgtcgcg gaagagatag 11040 gacagcgctg cgacgtgccc ttcggccagg tccatcacat ggatatagtc acggaccccc 11100 gtgccgtctt tggtgggata atcaccaccg aacaccatca gtttttccag tttccccatc 11160 gcgacctgca agatgtacgg caccaagttg gaggggatgt ctgccgggct ttcaccaatc 11220 ataccggatt cgtgggcgcc cgtcggatta aagtagcgca agcagaggaa attcgtgtcg 11280 gagtatttct tggcgatgtc gcggatcatc agctccgaga tgtacttgga cgtaccatac 11340 ggattcagcg tgccaccaat atggcagtct tcggtgacgg gcatgatctt gctttcccca 11400 tacaccgtcg ccgacgagct aaagatgaag ttggcgacgt cgttcttgat ggcgcaattg 11460 atgagttgca gggtgccgct cacgttgttg tcatagtaga agatgggctt gatcaggctt 11520 tctgcgaccg atttcgcacc tgcaaagtgc atgatgcagt cgaatttgtg tttcttcagg 11580 atctggttca cttccttctc gttgttgata ttgagttcgt agaacgtgac tttcttcttt 11640 gcgatcagct caatgcgacg gatgctttcg cagctgctgt tgatgagatt gtcaatgatg 11700 acgacattgt agcctttgtt cagcaggcag agcgacgtgt ggctgccgat gtagcctgca 11760 ccgccggtga ccaggatgtt catttattaa cctcctcggt ccgaattaac ctaggttatg 11820 aggtcagcat tgcttcttca cgcgtttagt agttgttttg ttcggtgata tattcttcaa 11880 tgccttcttg cacgtcttca tggaacgaca cggcgttgtc gtctttaaac acgattgcca 11940 catcgcagaa ctctttcaac gagttcagcg agtgcgacac catgaggaag gagctttcct 12000 tatgacgctc cttgaagagt tgggcacatt tttccttgaa acgggcgtcc cccaccgccg 12060 tcacctcgtc cacgatgtag taatcgaact tgaacgccat gctcaggccg aagccgaggc 12120 ggctgcgcat accgctcgaa taggtcttga tcggcatatc aaaatacttc cccagctccg 12180 cgaactcttc cacaaactca atcttttctt tcagctcctc ctgcttcgcg tacagccggg 12240 ccacgaactt cacgttttca cgcccggtca agctgccctg gaagccgcct gccagaccca 12300 ccggccacga gatcgtttta ttcgtgatga ttttaccgct atccgggcgg tcgatgcccc 12360 caatcatgcg caacagcgtg gatttacccg ccccattgcg cccgatgaac gccacgcttt 12420 tgccgctggg gatctcaatg ttcaggttct tgaagacata gtgacggccc accggggtgc 12480 ggtagctttt cgtcaggttt tcgatcttaa tcatgaggtc aacattgcct cctcacgcgt 12540 acggtacagg gccaaaccaa taaacagggt caccagggtg aacattgcca gataattcag 12600 gctgacccct tcgctgatat aaccgggcat cacggcctcg cggctcagtt cgacgacgtg 12660 caccagggga ttccacagca ggtacgacca atactgcttc ggaatggagt gcagcgggaa 12720 catgatgcac gaaataaagt acagcggctt cagcaagatc ggcaagactt tctgcatttc 12780 ggggaacgtc ttgcccacga ccatgaagat caggcccaca ccgcacgaca ggatgatcag 12840 gaggctccag gtgagcacaa attgcaggaa gttggtaatc tcgaaatatt cgcccgccat 12900 ccagatgatc agcatcagga ggatgtagac cgccacatag atcagcgttt ccaagagggc 12960 gcgtgcaatg atcgtgtcga tcggcttcac gggccggtag ttaaacagcc cctgattggc 13020 ttcgatggcg cccacggagc gattgctgat gctgctgaaa ataaagaacg ggatcaggcc 13080 attgagcagg aacaccggga aggagatatc cggcatggtg cgatgcatga tatagccaaa 13140 gatcccgagc agaatcagca gatgtgcgct cggttccagg atcgcccaca gatagcccag 13200 gcgaaacttg ccaaagcgcg tacggatttc gcggagaaac agtgcttcga ccgtcacttt 13260 ctggacttca aaacccgaac gtgccattta ttaacctcct ggtaccaatc tagattgttt 13320 aaacagatcc aatctagatt gtttaaactt ctgcagaaca cgcggtgtta acgtttctta 13380 tacttcttaa ttttgttaaa gatcatttcg ccgtagtaca ccgcattgac ctgggtcttc 13440 accagcaagt agccgcgaaa tttcttaaac aacttcatgt tcggtttaaa gtcggcttgc 13500 cagaactgat gcaaatgccc ctggtacgtc agacccttga tatcgtacaa ggcgttgccc 13560 atgactttca ggggcttgtt gtggatcaac gcggaaatgc cggccgtgct attgatggtg 13620 accaccgctt tggcgtggcg caacagctcc ggcatgggca gatcgtgcac atagatgaca 13680 cgttcatcca aaccgtattc cttcgacaga cgcttgatca acgggcggta caggcggtgc 13740 ccgcgatcca tcgggtgatg tttgatcacc agataggact ccttgggggc cttgcgggaa 13800 aagctgtaca tcacttcgtt gatgtaatca cgcacatcat tatagttgct atggttgcgg 13860 atctggctgt cgttgtacac ttgcaggacc gccaggtaat agcgctgatc cagctcgttc 13920 atcaggcggg ggaggacctt gcgttgggtg accttataca gctgtttgcg ccagtaggcg 13980 cggacccagc agcgcgcttc ataccacggg ctgaacgatt tgtggtggcg atagcgcgga 14040 aattcgtgac gatagtgcca acccatcagg taataccaca tggcgtggcc gatgcgcttc 14100 atggtgctcg gtttcaggtt ctcgacgtgc ggcgtcggca tatcgggcaa tttgcggtaa 14160 aagtccggat cgcggggcaa gctgctatag gcgttcacac cgccttcttc cacggtgata 14220 aattgcggac gcaggtagcc ttcctcgaag gccagaaaac gaatcccctt cgacttggcc 14280 cagcgtttgg cctccttgtg cagcaggcgg cagtcaccga aacacaaaat cgtgtcaaag 14340 tcatactgac gatgcaagtc ccgcagccaa ccggggaact ccttcggggt ttggtagtac 14400 gccaggtatt ggcggtggcg gcagtagaag cgatcaccgc cattaaagac gacgttgacc 14460 gcgttgcgac cgaggctctc caaccattcc gccacatcgt tgaagaacgg acccatcgga 14520 ccttggagca ggaggtactt tttaccgctc aacagcaccg tcagcgcatt gccgtgcatt 14580 tattaacctc ctaacacgcg gtgttaagcg ttttcggcga gctcttaacc aaagcgcact 14640 ttgcagaaca tgatcaactt gcgatagtag cgaatcacac ggccggcttt cttgcgggtg 14700 ataaagatgg gtttgcgggg cgttttgatc agatattctg ccgcttcctc caccgtgatc 14760 ggctgcaacc gcgtcggatg aatataggtg ggatagacaa tcagggcttg atagatcagg 14820 tcggcgatgg tcagccgccg ctcgcgacgg gggcagtggt gctcatcgac ggtcaggccc 14880 cacgaggcgt agaacggcag gccgtagcag tgcacctgtt taccgtgcag caatgcttca 14940 aagccgctga ggctcgtcat cgtgtgcacc tcgtccgcac gctgaataca ctgaatgata 15000 tcggcatcca gtgcctggta gtctgcgagt tccgcgatct gttccgccgg aatgtcaccc 15060 ttacggttgc cgacgagcac atcggggtgc ggcttgtaga tgatgtaggc gtgcggatta 15120 cgttcccgca cggtgcgcag cagctccaga ttcgacttga tcgacacggt gcccgtctta 15180 atcgacgcat cgtcttccac ctggcccggc accaggatga ctttcttgtc cttcgcttct 15240 gccgggaggc tgaaatcggc ccccaggtta tatttgctca atttgctttc caccagacgt 15300 tggcgcaact tttccgcgcg catctggtgc gcgagggtca gctggctgtg attcagcagg 15360 acctccagtt ccgacggacg ggtggcatcg taatagatac cgcgcttatc caggaccagg 15420 ctcaacggcg gcagcagatc gctccccagg ccggagctgc gcaggaagcc gtcttccatg 15480 cgccacagcg gcagggattt gcgctgtgcc tccgcacgcc attgctgttc gcctttcacg 15540 ccccacacga cgcaggcgct tgctgcggta cagcgacggg aaaaggagag acgattcgtg 15600 gccgtttgca ggaagggctt caggatcgcg cttttccaca gggtcaggcc cggcacccag 15660 agataaccat tccgctgttg caggtgacga cgttgcagct ggagccattg gagcaccgtg 15720 aacagggccg acacctcccc ggtctgcgga tcaatgtagc ggcaatagcg cagataggcc 15780 gctgcgaaca gttcctccag ggtggccgag ccgcgacgcg ccgacagcag cgccgattgg 15840 gggtggcggt catcggtgag gccccaccct gcataccagg gttggccaaa gcaggtcacg 15900 ggcttaccgg ccagcagggc ttcaaaaccg tactgggagg tcacgacgta cacgcgggac 15960 acatgacgca gcagggactg cggcgacacg ttttccgcaa tcaggcgcac gcgctgggtg 16020 gcacgcaagt ccgcgaagta gccggtcttt ttcccttcca ggacatcggg atgcactttg 16080 acccagattt ctgcctgcgg gttttccgcc atcgctgctt ccagcattgc ggcgaactca 16140 tgggggcctg cgttgccgta ggtcacgctc atgtcattga aggtctggtc caccaccagc 16200 acgatgttcg tgcgctcgct ttcatccgcc acgaacgccg gtgccaggtt gtacttgctc 16260 atgtcgcccg tcacaatggt gtgcatcgcc tcgcgcgcct gatccgccag ggccgcgttg 16320 ccggccttgt cctgcacgag tttttccagc gcgctcggtt tcgaggcgtc gtagtaaatg 16380 ccgcagtcat ccacgacgag cgagaggggc ggttcaccgt tcacgcccag gtccagcgag 16440 cggacgaaac catcctccaa gcggatcacc ggcttgcctg cggctttggc gatggccacc 16500 ggctttgcgg ccgaggggcg gtgcccccac accgcgattg catccacttc ctgcgggacc 16560 gggcgcagca gcgacagctt ttggcagggc tgggcgagga atttttccag gtgcggaata 16620 cgccaaatgc cggggctata aatgccaatc atgcgttctc cgcgagctcc tgcgccatca 16680 gggcccggac cttctccaag cacgccgggg tatcgacgcc gggaccggtc gcggcgacct 16740 cgaaggtgcg aatgttaatg cccgcgctca tcagccgcag ttgctccagg gattcggcct 16800 gttcgggcat ggactccggc aactggctgt aattttgcag gacatcccgc cgataggcgt 16860 agatcccgac gtgcttcagg tagcgcgcct tctcggcgtt gcgcgggtac ggaatggggg 16920 agcgggagaa atacagggcg tcctgccgcg tgttcaccac gaccttgacg gtggacggtt 16980 cggcggcttc tgccgcgctg atcgcatgac acagggtcgc caccggcagc gccgggtcgt 17040 cccgcatacc ttgcagcagg gtttcgacgt cacgcgggcg aatcatcggc tcatcccctt 17100 gcaggttgat atagatatcc gcctccacct tatgcatgac ttccaccagg cgatcggtgc 17160 cgctctcatg atcgttgcgg gtcatgatcg ctttgccgcc gaacgcctgg actgcctgct 17220 ccacacgcgg gtcgtcggtt gcgacccaca cctctgccac gcctgccact tgcagggccc 17280 gttcgtagac gtgctggatc atcggtttcc cgacgatatc cagcagcggt ttgcccggca 17340 gacggctgct gccgtagcgt gccgggatca caatcacggc cttcgacatt tattaacctc 17400 ctcgagttac agcgacagaa tcactttcgc gcccaccgcc agttggtaca gaatggtgct 17460 gataccgcgc gtcacttcga tgttcttcga ctcgtatttc ggcaacacca taatttcatc 17520 accgggtttc agggaatcga cgtcttctgc gttcaccgct gcgccgttct gacggatgac 17580 gataatacgg gcgttgccgg acttctgggt cagcccaccg cacttctcga tgtagtcctc 17640 ggtcgtcata cctttctgcc acgacaccgc gttcgggaac agcacttccc cgtggaccat 17700 gaccaacgac gtcttttcgg gaatattgat cacgtcgccg tcctccagga ggacggagtc 17760 aatgttgctt tcattgagga tcacttcgcc cttcggcacg acggtgcggg ctttcgcgac 17820 gaagcgggag atcagttggg cttcctgcat acgcaggctg gcctcttcct tggtgctgct 17880 ctgtgcgctg aggctggcct cttcgagctt ttgcagggac aaattcagca tttctttctg 17940 ccgttgcgcg acgctcggcc gatacaactg cacggcgttc atctgcgaca tggagttcgg 18000 gcgcactttt tcgagcacgg cccgcatggt gctaccgtag ggcagcacca tggcgtgttc 18060 cccggaatgt gcgccttcca cacgcacttg aatggtgccc gcatagcggt cggtggagac 18120 aatgagggta tcaccgtttt gcagcatacg ccccggtgcg gacgagatcg gataatattc 18180 cgagcgcttc tggaggccct gcttccgcat aatcgtgata tgggtcgcac ccggtttggg 18240 acgtgcccag gacagtgctt cggtgaccgg gatgctcgat tcgcgaaatt caaagtcgta 18300 ggaattgaac acatcgccct gcaccgagaa cgtatgctgg cgcggaccca caatgatcgt 18360 atcaccgtcc gcaaactggg acagccccag tttgccgttg agcaggaagt catagaggtt 18420 gacgttcgag cgcacacgat tgccgcgttt cacgacgatg tccacgtagc tgccgcgttc 18480 cgggtccaca ccacccgcct tgatcaggta gttcagcagg ctgtcggagg tgacaccgcc 18540 gtacaggccg gggttgcgga caaagccggt cacatagacc ttgaccggct gcgcctgcaa 18600 gagcgacgca tagacgttca cgttgctctg gtagacttcc ttcaccttgc tcgtcaccag 18660 cgcgttcaac tgggagttcg acacacctgc gactttgacg gggccgacat tcggcaggaa 18720 gatgttgccc ttcgggtcca cctggagtgc gccatcgaag gtgaacgcac cccacaggcg 18780 gacctggatg gaatcgccgg gattcaggat gtagtccgga ttgaaaccca cggttgcccc 18840 cgagtctgcg ctcgtaccgt tgaacagctg cgccccgaac atacggctca tcacgaccgg 18900 gggtgcgggg ggcggggtgt tatcgaagcc gctcatgttc tgggtgtcgc ttttctgccc 18960 gttcaggatg ccggtcaacg gtgcggcacc cgtgaggttc ggatcggcat taatgtcgat 19020 ggttgcgctc gcctgtgctg catggcacgc tgcgatcagc aggatcgact taaacagctt 19080 catttattaa cctcctcgag aagtcgactt agtcacggtg gtcttcaatc accgccagga 19140 gcaatttcag ggtgccaaag agcaggcaac acaccagcag ccaacacgcg atcaaatacg 19200 ggatattcgg gaaggagctt tcctggggca gctgcgggga cgagatcacg ctcaggactt 19260 tcagcttacg ggccgcttcg acacgggtct tttcgatgct ggtgagcgtg agcttgtaca 19320 actcggtatt gaactcgacc ttggatttga tctcctcaaa atccacggcc atgcggttca 19380 gtttatcgcc ctggggtgcg gtaattttcg acttttcttc gtcgatctgt gcctggaggc 19440 tctgaattgc attgcgggcg ctcacgactt ggggcgcatc ctcgcgcagg tacgtgagca 19500 ggttgcgcag gtcggcttcc atctgaattt tctggcccat cagcgtattc accagggtgg 19560 atgccgcctg ggcctgtgcc tgcgggtcca gcacattgtt gttgtcttgg taggacaaca 19620 attcggcttt cgatgcatcc agccgctggc gcgctttttc catttcggtt tccgcaaacg 19680 ccaattgatc gcgggcgata cggtgcgaca tttcattgat gaaccgctcg gattccttga 19740 gcacggtctg gttgaatttc agcgcgaact cgggcgaaaa gccctgggtc tggatgttca 19800 gcagcccggt cttgtcgtcg tagctgacgt tgatgcgatc tttatagtac ttcaggaacc 19860 cctcggcggt ttcatccttg gacagatggt tcaggaagtc caggcccgaa tgggagaacg 19920 cttcgcggaa gttcagctgt ttatccagcg cggccagcat atccgggctg ttgatgtatt 19980 ccttcaggta cagtgcgtct tcggcggacg acgggttgga ggcacccaac agcaggccga 20040 agttcaggct gccggagttg agatcgtcgc tgcgcttgat ggccaccttg ctttccgaca 20100 tatagcgggg ctgggagaag atcgccaagt agatcagcag caccgccatg ggtgccagaa 20160 taatgatttt tgccaggtgc ttctgaatat ctgccaggct gatcgcgctc agacgcgcac 20220 gcatccacga gacggcgctt ttcactttga tcagcattta ttaacctcct gtcgacaaca 20280 cgtgttaatc gaaaatgcgc accaacccgg tcaccttatt tgctttgttg gtcaccagca 20340 gggtcgagac gcggtgtttc tgcatcttct cttctgcttc gatgatcatg gtgtcttcgg 20400 gcaaggtcag cggttcgcgg gtcatcatct gtgcggccgt tgcgctcgtc aggctgtctt 20460 ctttctccat aaagcgccgc agatcgccat cggtgatgat gcctgccagc ccaccttccg 20520 catcttcgac catcaccata ccctggcagc ccgaggtgat gcgctgaatg accgttttga 20580 agctggcatc gagctgcact gccggcacat catgttgcat cacgtcggcg acgcgggtca 20640 gcaggcgccg acccaggctg ccaccggggt ggtagcgtgc aaagtcattg ggcataaact 20700 tacgctggtg aatcatcgcg atggccagcg cgtccccgat cgccatcgtg agcgtcgtgg 20760 aggtggtcgg ggcgagattg ttcgggcacg tttcgttcgc catgtgcagc tccaggaccg 20820 catctgcatt tttggccagg gtgctattcc cgttattggt gattgcgatg atgcgattgc 20880 cgaagttctt caggctcggc accagtttca ggatctcgtc cgtctcaccg ctcgccgaaa 20940 tcaagatgag caggtcatac ggggtgatca tgcccagatc accatggaac gcttccgccg 21000 gatgaataaa gaaggagggc gtcccggtcg aggccaaggt cgccgacatc ttgcggccca 21060 catggccgct tttacccatg ccgctcagga tgacgtgccc tttacaattc atgatgagat 21120 tcaggacgcg ctggtactga ccgctatcca gttgtttgga caggttttgc agtgccgcgc 21180 tttgttcggc cagggtctgg cggacgctcg taatcagata cggatcaatg gtcgaggact 21240 ggtcatccgg caagtggcgt tcgctcattt attaacctcc tcacgtgtta attaagtaat 21300 cgatagtgat ttaaatatgc aagatctagt tacctgcagg attattgttt ctgttgcata 21360 aagcctaagg ggtaggcctt tctagagata gccatttttt gcactcctgt atccgcttct 21420 tgcaaggctg gacttatccc tatcaaaccg gacactgcag gctgacaagc tttcattaca 21480 tatgaagagt ttgtagaaac gcaaaaaggc catccgtcag gatggccttc taagaaggct 21540 cgagtggcgc gcctaagtcg aatttctgcc attcatccgc ttattatact tattcaggcg 21600 tagcaccagg cgtttaaggg caccaataac tgccttaaaa aaattacgcc ccgccctgcc 21660 actcatcgca gtactgttgt aattcattaa gcattctgcc gacatggaag ccatcacaga 21720 cggcatgatg aacctgaatc gccagcggca tcagcacctt gtcgccttgc gtataatatt 21780 tgcccatggt gaaaacgggg gcgaagaagt tgtccatatt ggccacgttt aaatcaaaac 21840 tggtgaaact cacccaggga ttggctgaga cgaaaaacat attctcaata aaccctttag 21900 ggaaataggc caggttttca ccgtaacacg ccacatcttg cgaatatatg tgtagaaact 21960 gccggaaatc gtcgtggtat tcactccaga gcgatgaaaa cgtttcagtt tgctcatgga 22020 aaacggtgta acaagggtga acactatccc atatcaccag ctcaccgtct ttcattgcca 22080 tacggaattc cggatgagca ttcatcaggc gggcaagaat gtgaataaag gccggataaa 22140 acttgtgctt atttttcttt acggtcttta aaaaggccgt aatatccagc tgaacggtct 22200 ggttataggt acattgagca actgactgaa atgcctcaaa atgttcttta cgatgccatt 22260 gggatatatc aacggtggta tatccagtga tttttttctc cattttagct tccttagctc 22320 ctgaaaatct cgataactca aaaaatacgc ccggtagtga tcttatttca ttatggtgaa 22380 agttggaacc tcttacgtgc cgatcaacgt ctcattttcg ccaaaagttg gcccagggct 22440 tcccggtatc aacagggaca ccaggattta tttattctgc gaagtgatct tccgtcacag 22500 gtatttattc ggcgcaaagg gcctcgtgat acgcctattt ttataggtta atgtcatgat 22560 aataatggtt tcttagacgt caggtggcac ttttcgggga aatgtgcgcg cccgcgttcc 22620 tgctggcgct gggcctgttt ctggcgctgg acttcccgct gttccgtcag cagcttttcg 22680 cccacggcct tgatgatcgc ggcggccttg gcctgcatat cccgattcaa cggccccagg 22740 gcgtccagaa cgggcttcag gcgctcccga aggt 22774 <210> 40 <211> 22948 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 40 ctcgggccgt ctcttgggct tgatcggcct tcttgcgcat ctcacgcgct cctgcggcgg 60 cctgtagggc aggctcatac ccctgccgaa ccgcttttgt cagccggtcg gccacggctt 120 ccggcgtctc aacgcgcttt gagattccca gcttttcggc caatccctgc ggtgcatagg 180 cgcgtggctc gaccgcttgc gggctgatgg tgacgtggcc cactggtggc cgctccaggg 240 cctcgtagaa cgcctgaatg cgcgtgtgac gtgccttgct gccctcgatg ccccgttgca 300 gccctagatc ggccacagcg gccgcaaacg tggtctggtc gcgggtcatc tgcgctttgt 360 tgccgatgaa ctccttggcc gacagcctgc cgtcctgcgt cagcggcacc acgaacgcgg 420 tcatgtgcgg gctggtttcg tcacggtgga tgctggccgt cacgatgcga tccgccccgt 480 acttgtccgc cagccacttg tgcgccttct cgaagaacgc cgcctgctgt tcttggctgg 540 ccgacttcca ccattccggg ctggccgtca tgacgtactc gaccgccaac acagcgtcct 600 tgcgccgctt ctctggcagc aactcgcgca gtcggcccat cgcttcatcg gtgctgctgg 660 ccgcccagtg ctcgttctct ggcgtcctgc tggcgtcagc gttgggcgtc tcgcgctcgc 720 ggtaggcgtg cttgagactg gccgccacgt tgcccatttt cgccagcttc ttgcatcgca 780 tgatcgcgta tgccgccatg cctgcccctc ccttttggtg tccaaccggc tcgacggggg 840 cagcgcaagg cggtgcctcc ggcgggccac tcaatgcttg agtatactca ctagactttg 900 cttcgcaaag tcgtgaccgc ctacggcggc tgcggcgccc tacgggcttg ctctccgggc 960 ttcgccctgc gcggtcgctg cgctcccttg ccagcccgtg gatatgtgga cgatggccgc 1020 gagcggccac cggctggctc gcttcgctcg gcccgtggac aaccctgctg gacaagctga 1080 tggacaggct gcgcctgccc acgagcttga ccacagggat tgcccaccgg ctacccagcc 1140 ttcgaccaca tacccaccgg ctccaactgc gcggcctgcg gccttgcccc atcaattttt 1200 ttaattttct ctggggaaaa gcctccggcc tgcggcctgc gcgcttcgct tgccggttgg 1260 acaccaagtg gaaggcgggt caaggctcgc gcagcgaccg cgcagcggct tggccttgac 1320 gcgcctggaa cgacccaagc ctatgcgagt gggggcagtc gaaggcgaag cccgcccgcc 1380 tgccccccga gacctgcaga tccacatcct tgaaggccgc agcgacgagc agaaggaaac 1440 cctcattcgg gaagtcagcg aggccatctc gcgctccctg gatgcgccgc tgaccagcgt 1500 gcgagtgatt atcacggaga tggccaaggg ccacttcggc atcggcggcg aactggccag 1560 caaggtcaga cgctgaagtg gagatgccca agggcacttc gggtcgagga acccgacctg 1620 cattgggacg cggccacgga gagcgcgggc aaacgccggc actatagcca gtggagtttg 1680 taaaacgcta tttcagagct tggagagtgt ctaagaaagc cggggcgatg ccaacccatc 1740 ccttcttcgg ctatgcatcg ttcgtaatca agccacttcc tttttgcatt gacgcagggt 1800 gtcggaaggc aactcgccga acgcgctcct atagttttca gcgaagcgtc ccaaatgtaa 1860 gaagccgtag tctagggcta tctcagttat actacgcaca ttggcactgg gatcgttcaa 1920 gcaggcgcgg atgctttcga gcttgcggtt gcggatgtag ttcttcggcg tggtgccggc 1980 atgcttctcg aacaaattgt agagcgagcg tggactcatc atcgccagct ccgctaaccg 2040 ctcaaggctg atattccgtt tgagattctc ctcaatgaat tgaacgactc gctcgaaaga 2100 cgggttacct ttgctgaaaa tttcacggct gacattgctg cccagcattt cgagcagctt 2160 ggaagcgatg atccccgcat agtgctcttg gacccgaggc atcgactttg tatgttccgc 2220 ttcgtcacaa actaacccga gtagattgat aaagccatcg agttgctgga gattgtgtcg 2280 cgcggcgaaa cggataccct ccctcggctt gtgccaattg ttgtcactgc atgcccgatc 2340 aaggaccact gagggcaatt taacgataaa tttctcgcaa tcttctgaat aggtcaggtc 2400 ggcttggtca tccggattga gcagcaatag ttcgcccggc gcaaaatagt gctcctggcc 2460 atggccacgc cacaggcaat ggcctttgag tattatttgc agatgataac aggtctctaa 2520 tccaggcgag attaccctca cgctaccgcc gtagctgatt cgacacaggt cgaggcatcc 2580 gaagattctg tggtgcagcc tgcctgccgg gcgcccgccc ttgggcaggc gaatagagtg 2640 cgtaccgaca tactggttaa cataatcgga gactgcatag ggctcggcgt ggacgaagat 2700 ctgacttttc tcgttcaata agcaaaaatc catagttcac ggttctctta ttttaatgtg 2760 ggctgcttgg tgtgatgtag aaaggcgcca agtcgatgaa aatgcatctc gacgtgatgc 2820 gtatacgggt tacccccatt gccacgttgc gccatccttt ttgcaatcag tgaccacttt 2880 tccaagcaaa aataacgcca agcagaacga agacgttctt tttaagaagc gagaacacca 2940 gaagttcgtg ctgtcggggc atgcggcgac gaattggcgg ataaagggga tctgcaggtc 3000 ccgagcctca cggcggcgag tgcgggggtt ccaagggggc agcgccacct tgggcaaggc 3060 cgaaggccgc gcagtcgatc aacaagcccc ggaggggcca ctttttgccg gagggggagc 3120 cgcgccgaag gcgtggggga accccgcagg ggtgcccttc tttgggcacc aaagaactag 3180 atatagggcg aaatgcgaaa gacttaaaaa tcaacaactt aaaaaagggg ggtacgcaac 3240 agctcattgc ggcacccccc gcaatagctc attgcgtagg ttaaagaaaa tctgtaattg 3300 actgccactt ttacgcaacg cataattgtt gtcgcgctgc cgaaaagttg cagctgattg 3360 cgcatggtgc cgcaaccgtg cggcacccta ccgcatggag ataagcatgg ccacgcagtc 3420 cagagaaatc ggcattcaag ccaagaacaa gcccggtcac tgggtgcaaa cggaacgcaa 3480 agcgcatgag gcgtgggccg ggcttattgc gaggaaaccc acggcggcaa tgctgctgca 3540 tcacctcgtg gcgcagatgg gccaccagaa cgccgtggtg gtcagccaga agacactttc 3600 caagctcatc ggacgttctt tgcggacggt ccaatacgca gtcaaggact tggtggccga 3660 gcgctggatc tccgtcgtga agctcaacgg ccccggcacc gtgtcggcct acgtggtcaa 3720 tgaccgcgtg gcgtggggcc agccccgcga ccagttgcgc ctgtcggtgt tcagtgccgc 3780 cgtggtggtt gatcacgacg accaggacga atcgctgttg gggcatggcg acctgcgccg 3840 catcccgacc ctgtatccgg gcgagcagca actaccgacc ggccccggcg aggagccgcc 3900 cagccagccc ggcattccgg gcatggaacc agacctgcca gccttgaccg aaacggagga 3960 atgggaacgg cgcgggcagc agcgcctgcc gatgcccgat gagccgtgtt ttctggacga 4020 tggcgagccg ttggagccgc cgacacgggt cacgctgccg cgccggtagc acttgggttg 4080 cgcagcaacc cgtaagtgcg ctgttccaga ctatcggctg tagccgcctc gccgccctat 4140 accttgtctg cctccccgcg ttgcgtcgcg gtgcatggag ccgggccacc tcgacctgaa 4200 tggaagccgg cggcacctcg ctaacggatt caccgttttt atcaggctct gggaggcaga 4260 ataaatgatc atatcgtcaa ttattacctc cacggggaga gcctgagcaa actggcctca 4320 ggcatttgag aagcacacgg tcacactgct tccggtagtc aataaaccgg taaaccagca 4380 atagacataa gcggctattt aacgaccctg ccctgaaccg acgaccgggt cgaatttgct 4440 ttcgactatc ggcgcgccag agctcatcgt taatgtcttc gtgcgccgtc agtcggcgca 4500 cgttttttct ctctggtacc gtgtcactga tctagtcaat tactcgaagt atccacaagt 4560 gaagcatact aagtaatgta caagaatcaa aaaaatcggc tacgcaagtc gcgtagccga 4620 atcatttaag gatccttcca ttcaggtcga ggtggcccgg ctccatgcac cgcgacgcaa 4680 cgcggggagg cagacaaggt atagggcggc gcctacaatc catgccaacc cgttccatgt 4740 gctcgccgag gcggcataaa tcgccgtgac gatcagcggt ccagtgatcg aagttaggct 4800 ggtaagagcc gcgagcgatc cttgaagctg tccctgatgg tcgtcatcta cctgcctgga 4860 cagcatggcc tgcaacgcgg gcatcccgat gccgccggaa gcgagaagaa tcataatggg 4920 gaaggccatc cagcctcgcg tcgcgaacgc cagcaagacg tagcccagcg cgtcggccgc 4980 catgccggcg ataatggcct gcttctcgcc gaaacgtttg gtggcgggac cagtgacgaa 5040 ggcttgagcg agggcgtgca agattccgaa taccgcaagc gacaggccga tcatcgtcgc 5100 gctccagcga aagcggtcct cgccgaaaat gacccagagc gctgccggca cctgtcctac 5160 gagttgcatg ataaagaaga cagtcataag tgcggcgacg atagtcatgc cccgcgccca 5220 ccggaaggag ctgactgggt tgaaggctct caagggcatc ggtcgacgct ctcccttatg 5280 cgactcctgc attaggaagc agcccagtag taggttgagg ccgttgagca ccgccgccgc 5340 aaggaatggt gcatgcaagg agatggcgcc caacagtccc ccggccacgg ggcctgccac 5400 catacccacg ccgaaacaag cgctcatgag cccgaagtgg cgagcccgat cttccccatc 5460 ggtgatgtcg gcgatatagg cgccagcaac cgcacctgtg gcgccggtga tgccggccac 5520 gatgcgtccg gcgtacaaga tccacaggac gggtgtggtc gccatgatcg cgtagtcgat 5580 agtggctcca agtagcgaag cgagcaggac tgggcggcgg ccaaagcggt cggacagtgc 5640 tccgagaacg ggtgcgcata gaaattgcat caacgcatat agcgctagca gcacgccata 5700 gtgactggcg atgctgtcgg aatggacgat atcccgcaag aggcccggca gtaccggcat 5760 aaccaagcct atgcctacag catccagggt gacggtgccg aggatgacga tgagcgcatt 5820 gttagatttc atacacggtg cctgactgcg ttagcaattt aactgtgata aactaccgca 5880 ttaaagccga gcgatgataa gctgtcaaac atgagatccg ataaatcgat tgatagattt 5940 aaataagaac tgcagaagct agcaacttaa gttacgaatc gacgccgaac aggtcgcggg 6000 tgtagacttt ctccgagaca tcttccagtt cgctggtgcg gcgattcgcc acaatgacat 6060 cgacgcgctc cttaaaggaa ttgatgtcgc gctcgacgta ggaaccgaag aagtagggtt 6120 ctttcaggac cggctcgtac accacaatct cgataccctt ggccttcaaa cgtttcatga 6180 ccccctggat gctgctggcc cggaaattgt cgctacccgc cttcatgatc aggcgataga 6240 taccgaccac tttgggctta cgggacagga tgtcctcggc cacgaagtcc ttacgggtcg 6300 tattcgcatc cacgatggcc tggatcaggt tttgcgggac gtcgcgataa ttggccaaca 6360 gctgcttcgt atccttcggc agacagtaac cgccgtagcc gaaggacggg ttgttgtaat 6420 gttgaccaat gcgcggatcg agggagacgc cttcgatgat ttgtttggta tccaggccgt 6480 gcacgctcgc gtaggtgtcc agctcgttaa agtacgcgat acgcatcgcc agatacgtgt 6540 tcgcgaacag tttgatggct tctgcctcgg gcgaatccgt cagcaggatc ggaatatcct 6600 ttttgatggc accttccgac aggagttcgg cgaacttccg tgcgcgttcc gacgattcgc 6660 ccacgacaat gcggctcgga tagagattat catacagggc tttgccttcg cgcaggaact 6720 ccggggaaaa gatgatatta ttcgtgttca gatcgcgctt caggcgttcg gtgaacccga 6780 cggggacggt ggatttgata atgatggtcg cgttcgggtt aatggacagc acgtcacacg 6840 cgacgctttc gacgctcagg gtatcaaagt tgttattaat cggatcatag ttcgtcgggg 6900 tggcgatgat cacgtagtct gcatcgcgat atgcctcgta tttttccgtc gtcgcgtaga 6960 ggttcagctt acgattggag agaaacttct ggatttccgg gtcgcaaatc ggcgagattt 7020 tcttgttaat gagctggacc ttcttcgggt cgatgtccag ggcgatgatg tcgtgttttt 7080 gggagaggag gatcgcaatg ctgataccca catagccgac gccggccacg gcaattttca 7140 tttattaacc tccttaagtg aattcaaact agtttacaag tcgttttcga tcttctccca 7200 ggtatatttg cgacattcat tcaagttggt cagcggcgag tatttgtact ttttgatacc 7260 gaggcgcgac aggctttcgt tcaccacctt gaaatggttt tccttttgga tgtccagttt 7320 cttgatcgac gtgttctcgc cgtgcaggac acggttgtag caaatcttat tgatatgctt 7380 aaacgggccg acttcgctga gtttcaaata catatcgtaa tccaccgcat tgctgatgct 7440 ctcgttgaag ccttcggtga ggttccatgc acgcgccgtg aacatacgga agtggtggca 7500 gatcatcgcg ctcgtgagct tttcgcggct gtaaatcggc cagttgtagc cattgctaat 7560 caagttacct tcacgatcaa tattgcgatt ggtggtgtac acgcaggcga ggctcaggtc 7620 tttgcgaaat tcatccagac acagttccac ggcatcgggc tccaggaaat catcggaatc 7680 cagctgcccg atgtagaaac cccggcacag gcggactgcg gtattcgagg cggagccgat 7740 gcctttgttt ttctggctga tgaaacggac gcgcgggtgg tttgcgtaat gttcttgcag 7800 gatgcgcagc gtatcatcgg tgctcccgtc atcgcagatg cagacctcca gatcggtgat 7860 cgtttggttc agtgccgatt cgacgcagcg cacgatatat ttgctgcaat tatacgcggg 7920 gatgtagatg ctcaccaggg gcacacgttt cagggtggcg ctctcgattt tctccttctt 7980 gcgataaaag tagggcacct tctgctgcaa cagctggacg gtaatgtttt tacctgccgc 8040 gcgatcggtt tcgttctcct taccgggcgg ttcctgatga tatgccatcg cgccttccac 8100 gctacggaaa taacaaccct cgcggtacag ccgatagccg aactcattat cctcaccgcc 8160 ccaatgcgtg aactcttcgt caaaccaacc cgcgcgaaac agccacttct ttgcaaacgc 8220 cacattgcca ccgctaaaga accggaacgg ggtgttgcac aggcgcagat tgtcggtatt 8280 cttgaaatgt tcgatgcgcc aatcgacgga tttgttctgc tcgaccttgc ctgcgacctg 8340 attattggta ataatctccg ggatttcatt gatcaggctt ttctgggaca aaaagtccag 8400 ataggtatgc ttcgacgtgt cgatgtattt acgcgggcca atcagtgcca cgttatcatc 8460 cacggccagg agttccatat aggactgcac ccacaacggg ttcggcgcca tatcgcagtc 8520 caagatcgcc acgtagttgt atttcgctgc ccgcaggccc aggttccgca cggcgcacag 8580 ctggtagccg tagtctttct ggcggacgta tttgatgttc agcaacgact cgaactcgcg 8640 gacgatctct tcgatgtttt ccttggaacc gtcatccgcg acgatgacct catagtcata 8700 aatcgttttc tgattgcaga ggcaggccag ggtgatcgcc aggattttgg cgcgattgta 8760 cgtcggaatc acgatggaca ggccgtcgat gatcagttgc ttgcgcggat aatcatccag 8820 ttctttacgt ttccctgccc agacgtagtc gttcgtgctt tccggcagcg gcggcaaggt 8880 caggtcgctc ggccaatcca gcggaatggg ttcgacttct ttcaattcgg cgcgctcgga 8940 tttctttgcg gtaatttccc gatatttgct aatgatttca ttcttttcca cctcattcag 9000 cgagatcgcc tttgcattgc tgcacataat tttggttgcc gcgtcgatat caatgaccgc 9060 tttccgattc agcttgtcca cttcttcgct cagattcagg gcggtttggc acagcttgat 9120 attggcttcc acccagctca catcatagat ttccgccact ttttcaaaca gggagagggc 9180 ttggcggtag ttcttattct tatacagatt gattgcctgg ttcaaaatgc tcatttatta 9240 acctcctact agtgaatttt cgaattactt accgcagtac ttgacaccca cctgggaatt 9300 gtttttggtg cgtttgaatt ggcggatggt acggtagatg ctaaagggca ggctgatcag 9360 accgagcgga aaattgttct tattgatgat gagcttgccc agctgatagc tcaggtgttt 9420 cttgacccgt tcggcttcgt gtttatccgc gtacaggaag atgctcggca ggctcacttg 9480 gtactccgaa tcatatttct tcttccaggt ccgccattcg ctgatcaacg caaacggaat 9540 cgagatcaga ccgaggaacg tcttggagcg gctcaccatc accgcaccca ggcggtagcc 9600 gatatcttgc ttgatgcgtt cggccgcacc atacagctcc ggcagttgtt tcttttcgag 9660 acgttgattg tcgatgaagt actgttcgag cttttgctgc accagatgca gctgattgag 9720 cagcaattct ttttcgcacg acagcttttc gaggcgctgt tgttgcagtt catttttgtt 9780 ctgttccttt ttcagcaggg actcgaagtt ctcgatcgcg cactccagtt cctggacctg 9840 gatggttttg tttttaatga tcagatcata ctggatcagt tcttccttgc tatccgacag 9900 ctctttcaga atggcttgat aggcgttcag ctgtttggac gtgtgcagtt cgttgtccag 9960 aatgatcttt ttgctgctct ggtacagacc gttcacgata tcgagggtga tctggcgttg 10020 tttaatgaac gtctcccaaa taaaggacgg cttatagttt tccttctcca gcacccgcaa 10080 gggggtgttg gcgttcgatt gcaattcaaa gtacagttcc ttgcaatcgg gatagtcgtt 10140 caggacgttg aagatcaagt actcctccgt ctcgctttgc ttgaaaatga tatccccggt 10200 cccgatgtca ataccgctga gggacatgat ctcctgatgt tctttttcca gcgtaatgga 10260 ggcttcggcg gtcttaaagt cattcacgct ctgctccagc gagtggttga tggtattgga 10320 gaacgacaac ccgaatttca gtttcagttt gtgttgcagt tgctggatgc agtcctcggc 10380 gttgcgcttc acctgttcgc tcgacaccag caggcaccga ccccggttgt tgaggaagaa 10440 gtgcagcaag gcggtgttgt atgccagcca gtttttgatc agatgctccg aggtatagtt 10500 gctggagatg ttctggtccg agaagtagtt cgtcaggatg cttttggggt ggtcgtagat 10560 gaggataaag gtgatgttct catccaccga tttccaatat tccaacgtgt gaattgcgtt 10620 ggggtcgctc caaccgcaca gtttctggtt caggttggac agcatcagat ccaatgcgat 10680 accgttccag acggtgctca catggagcgg ttcaaagtcg gcggaatcgg tcaccgtata 10740 gatgtccggc gactggtacg ccttccgcag cgtctgggtg atgtcctggg gcgagaggtt 10800 ctcacgtttg gacgggcaca gggagttcat gccgcgctga tgcaggagtt cttccacgat 10860 ttggtagttg ctgctcggat ggcccacgat caccaggcgg ttcatttatt aacctccttt 10920 cgaaaatgaa cggtccgtta aatatagcca ttcggattct tcatctgcca gcgccaggcg 10980 tcctccagca tggtttcgag ttcccgcttg gctttccagt tcagatattt gttggccttt 11040 tcgggggagg accagctctc cgcgatatca ccgtcacggc ggctcacgat ttcatacgga 11100 atccgcacgc cggaaatctt ttcaaaggtg gacaccagtt ccagcaccga ataaccttta 11160 cccgtgccca aattaaagac gtggtagttg gtgttattgt cgcggaagag ataggacagc 11220 gctgcgacgt gcccttcggc caggtccatc acatggatat agtcacggac ccccgtgccg 11280 tctttggtgg gataatcacc accgaacacc atcagttttt ccagtttccc catcgcgacc 11340 tgcaagatgt acggcaccaa gttggagggg atgtctgccg ggctttcacc aatcataccg 11400 gattcgtggg cgcccgtcgg attaaagtag cgcaagcaga ggaaattcgt gtcggagtat 11460 ttcttggcga tgtcgcggat catcagctcc gagatgtact tggacgtacc atacggattc 11520 agcgtgccac caatatggca gtcttcggtg acgggcatga tcttgctttc cccatacacc 11580 gtcgccgacg agctaaagat gaagttggcg acgtcgttct tgatggcgca attgatgagt 11640 tgcagggtgc cgctcacgtt gttgtcatag tagaagatgg gcttgatcag gctttctgcg 11700 accgatttcg cacctgcaaa gtgcatgatg cagtcgaatt tgtgtttctt caggatctgg 11760 ttcacttcct tctcgttgtt gatattgagt tcgtagaacg tgactttctt ctttgcgatc 11820 agctcaatgc gacggatgct ttcgcagctg ctgttgatga gattgtcaat gatgacgaca 11880 ttgtagcctt tgttcagcag gcagagcgac gtgtggctgc cgatgtagcc tgcaccgccg 11940 gtgaccagga tgttcattta ttaacctcct cggtccgaat taacctaggt tatgaggtca 12000 gcattgcttc ttcacgcgtt tagtagttgt tttgttcggt gatatattct tcaatgcctt 12060 cttgcacgtc ttcatggaac gacacggcgt tgtcgtcttt aaacacgatt gccacatcgc 12120 agaactcttt caacgagttc agcgagtgcg acaccatgag gaaggagctt tccttatgac 12180 gctccttgaa gagttgggca catttttcct tgaaacgggc gtcccccacc gccgtcacct 12240 cgtccacgat gtagtaatcg aacttgaacg ccatgctcag gccgaagccg aggcggctgc 12300 gcataccgct cgaataggtc ttgatcggca tatcaaaata cttccccagc tccgcgaact 12360 cttccacaaa ctcaatcttt tctttcagct cctcctgctt cgcgtacagc cgggccacga 12420 acttcacgtt ttcacgcccg gtcaagctgc cctggaagcc gcctgccaga cccaccggcc 12480 acgagatcgt tttattcgtg atgattttac cgctatccgg gcggtcgatg cccccaatca 12540 tgcgcaacag cgtggattta cccgccccat tgcgcccgat gaacgccacg cttttgccgc 12600 tggggatctc aatgttcagg ttcttgaaga catagtgacg gcccaccggg gtgcggtagc 12660 ttttcgtcag gttttcgatc ttaatcatga ggtcaacatt gcctcctcac gcgtacggta 12720 cagggccaaa ccaataaaca gggtcaccag ggtgaacatt gccagataat tcaggctgac 12780 cccttcgctg atataaccgg gcatcacggc ctcgcggctc agttcgacga cgtgcaccag 12840 gggattccac agcaggtacg accaatactg cttcggaatg gagtgcagcg ggaacatgat 12900 gcacgaaata aagtacagcg gcttcagcaa gatcggcaag actttctgca tttcggggaa 12960 cgtcttgccc acgaccatga agatcaggcc cacaccgcac gacaggatga tcaggaggct 13020 ccaggtgagc acaaattgca ggaagttggt aatctcgaaa tattcgcccg ccatccagat 13080 gatcagcatc aggaggatgt agaccgccac atagatcagc gtttccaaga gggcgcgtgc 13140 aatgatcgtg tcgatcggct tcacgggccg gtagttaaac agcccctgat tggcttcgat 13200 ggcgcccacg gagcgattgc tgatgctgct gaaaataaag aacgggatca ggccattgag 13260 caggaacacc gggaaggaga tatccggcat ggtgcgatgc atgatatagc caaagatccc 13320 gagcagaatc agcagatgtg cgctcggttc caggatcgcc cacagatagc ccaggcgaaa 13380 cttgccaaag cgcgtacgga tttcgcggag aaacagtgct tcgaccgtca ctttctggac 13440 ttcaaaaccc gaacgtgcca tttattaacc tcctggtacc aatctagatt gtttaaacag 13500 atccaatcta gattgtttaa acttctgcag aacacgcggt gttaacgttt cttatacttc 13560 ttaattttgt taaagatcat ttcgccgtag tacaccgcat tgacctgggt cttcaccagc 13620 aagtagccgc gaaatttctt aaacaacttc atgttcggtt taaagtcggc ttgccagaac 13680 tgatgcaaat gcccctggta cgtcagaccc ttgatatcgt acaaggcgtt gcccatgact 13740 ttcaggggct tgttgtggat caacgcggaa atgccggccg tgctattgat ggtgaccacc 13800 gctttggcgt ggcgcaacag ctccggcatg ggcagatcgt gcacatagat gacacgttca 13860 tccaaaccgt attccttcga cagacgcttg atcaacgggc ggtacaggcg gtgcccgcga 13920 tccatcgggt gatgtttgat caccagatag gactccttgg gggccttgcg ggaaaagctg 13980 tacatcactt cgttgatgta atcacgcaca tcattatagt tgctatggtt gcggatctgg 14040 ctgtcgttgt acacttgcag gaccgccagg taatagcgct gatccagctc gttcatcagg 14100 cgggggagga ccttgcgttg ggtgacctta tacagctgtt tgcgccagta ggcgcggacc 14160 cagcagcgcg cttcatacca cgggctgaac gatttgtggt ggcgatagcg cggaaattcg 14220 tgacgatagt gccaacccat caggtaatac cacatggcgt ggccgatgcg cttcatggtg 14280 ctcggtttca ggttctcgac gtgcggcgtc ggcatatcgg gcaatttgcg gtaaaagtcc 14340 ggatcgcggg gcaagctgct ataggcgttc acaccgcctt cttccacggt gataaattgc 14400 ggacgcaggt agccttcctc gaaggccaga aaacgaatcc ccttcgactt ggcccagcgt 14460 ttggcctcct tgtgcagcag gcggcagtca ccgaaacaca aaatcgtgtc aaagtcatac 14520 tgacgatgca agtcccgcag ccaaccgggg aactccttcg gggtttggta gtacgccagg 14580 tattggcggt ggcggcagta gaagcgatca ccgccattaa agacgacgtt gaccgcgttg 14640 cgaccgaggc tctccaacca ttccgccaca tcgttgaaga acggacccat cggaccttgg 14700 agcaggaggt actttttacc gctcaacagc accgtcagcg cattgccgtg catttattaa 14760 cctcctaaca cgcggtgtta agcgttttcg gcgagctctt aaccaaagcg cactttgcag 14820 aacatgatca acttgcgata gtagcgaatc acacggccgg ctttcttgcg ggtgataaag 14880 atgggtttgc ggggcgtttt gatcagatat tctgccgctt cctccaccgt gatcggctgc 14940 aaccgcgtcg gatgaatata ggtgggatag acaatcaggg cttgatagat caggtcggcg 15000 atggtcagcc gccgctcgcg acgggggcag tggtgctcat cgacggtcag gccccacgag 15060 gcgtagaacg gcaggccgta gcagtgcacc tgtttaccgt gcagcaatgc ttcaaagccg 15120 ctgaggctcg tcatcgtgtg cacctcgtcc gcacgctgaa tacactgaat gatatcggca 15180 tccagtgcct ggtagtctgc gagttccgcg atctgttccg ccggaatgtc acccttacgg 15240 ttgccgacga gcacatcggg gtgcggcttg tagatgatgt aggcgtgcgg attacgttcc 15300 cgcacggtgc gcagcagctc cagattcgac ttgatcgaca cggtgcccgt cttaatcgac 15360 gcatcgtctt ccacctggcc cggcaccagg atgactttct tgtccttcgc ttctgccggg 15420 aggctgaaat cggcccccag gttatatttg ctcaatttgc tttccaccag acgttggcgc 15480 aacttttccg cgcgcatctg gtgcgcgagg gtcagctggc tgtgattcag caggacctcc 15540 agttccgacg gacgggtggc atcgtaatag ataccgcgct tatccaggac caggctcaac 15600 ggcggcagca gatcgctccc caggccggag ctgcgcagga agccgtcttc catgcgccac 15660 agcggcaggg atttgcgctg tgcctccgca cgccattgct gttcgccttt cacgccccac 15720 acgacgcagg cgcttgctgc ggtacagcga cgggaaaagg agagacgatt cgtggccgtt 15780 tgcaggaagg gcttcaggat cgcgcttttc cacagggtca ggcccggcac ccagagataa 15840 ccattccgct gttgcaggtg acgacgttgc agctggagcc attggagcac cgtgaacagg 15900 gccgacacct ccccggtctg cggatcaatg tagcggcaat agcgcagata ggccgctgcg 15960 aacagttcct ccagggtggc cgagccgcga cgcgccgaca gcagcgccga ttgggggtgg 16020 cggtcatcgg tgaggcccca ccctgcatac cagggttggc caaagcaggt cacgggctta 16080 ccggccagca gggcttcaaa accgtactgg gaggtcacga cgtacacgcg ggacacatga 16140 cgcagcaggg actgcggcga cacgttttcc gcaatcaggc gcacgcgctg ggtggcacgc 16200 aagtccgcga agtagccggt ctttttccct tccaggacat cgggatgcac tttgacccag 16260 atttctgcct gcgggttttc cgccatcgct gcttccagca ttgcggcgaa ctcatggggg 16320 cctgcgttgc cgtaggtcac gctcatgtca ttgaaggtct ggtccaccac cagcacgatg 16380 ttcgtgcgct cgctttcatc cgccacgaac gccggtgcca ggttgtactt gctcatgtcg 16440 cccgtcacaa tggtgtgcat cgcctcgcgc gcctgatccg ccagggccgc gttgccggcc 16500 ttgtcctgca cgagtttttc cagcgcgctc ggtttcgagg cgtcgtagta aatgccgcag 16560 tcatccacga cgagcgagag gggcggttca ccgttcacgc ccaggtccag cgagcggacg 16620 aaaccatcct ccaagcggat caccggcttg cctgcggctt tggcgatggc caccggcttt 16680 gcggccgagg ggcggtgccc ccacaccgcg attgcatcca cttcctgcgg gaccgggcgc 16740 agcagcgaca gcttttggca gggctgggcg aggaattttt ccaggtgcgg aatacgccaa 16800 atgccggggc tataaatgcc aatcatgcgt tctccgcgag ctcctgcgcc atcagggccc 16860 ggaccttctc caagcacgcc ggggtatcga cgccgggacc ggtcgcggcg acctcgaagg 16920 tgcgaatgtt aatgcccgcg ctcatcagcc gcagttgctc cagggattcg gcctgttcgg 16980 gcatggactc cggcaactgg ctgtaatttt gcaggacatc ccgccgatag gcgtagatcc 17040 cgacgtgctt caggtagcgc gccttctcgg cgttgcgcgg gtacggaatg ggggagcggg 17100 agaaatacag ggcgtcctgc cgcgtgttca ccacgacctt gacggtggac ggttcggcgg 17160 cttctgccgc gctgatcgca tgacacaggg tcgccaccgg cagcgccggg tcgtcccgca 17220 taccttgcag cagggtttcg acgtcacgcg ggcgaatcat cggctcatcc ccttgcaggt 17280 tgatatagat atccgcctcc accttatgca tgacttccac caggcgatcg gtgccgctct 17340 catgatcgtt gcgggtcatg atcgctttgc cgccgaacgc ctggactgcc tgctccacac 17400 gcgggtcgtc ggttgcgacc cacacctctg ccacgcctgc cacttgcagg gcccgttcgt 17460 agacgtgctg gatcatcggt ttcccgacga tatccagcag cggtttgccc ggcagacggc 17520 tgctgccgta gcgtgccggg atcacaatca cggccttcga catttattaa cctcctcgag 17580 ttacagcgac agaatcactt tcgcgcccac cgccagttgg tacagaatgg tgctgatacc 17640 gcgcgtcact tcgatgttct tcgactcgta tttcggcaac accataattt catcaccggg 17700 tttcagggaa tcgacgtctt ctgcgttcac cgctgcgccg ttctgacgga tgacgataat 17760 acgggcgttg ccggacttct gggtcagccc accgcacttc tcgatgtagt cctcggtcgt 17820 catacctttc tgccacgaca ccgcgttcgg gaacagcact tccccgtgga ccatgaccaa 17880 cgacgtcttt tcgggaatat tgatcacgtc gccgtcctcc aggaggacgg agtcaatgtt 17940 gctttcattg aggatcactt cgcccttcgg cacgacggtg cgggctttcg cgacgaagcg 18000 ggagatcagt tgggcttcct gcatacgcag gctggcctct tccttggtgc tgctctgtgc 18060 gctgaggctg gcctcttcga gcttttgcag ggacaaattc agcatttctt tctgccgttg 18120 cgcgacgctc ggccgataca actgcacggc gttcatctgc gacatggagt tcgggcgcac 18180 tttttcgagc acggcccgca tggtgctacc gtagggcagc accatggcgt gttccccgga 18240 atgtgcgcct tccacacgca cttgaatggt gcccgcatag cggtcggtgg agacaatgag 18300 ggtatcaccg ttttgcagca tacgccccgg tgcggacgag atcggataat attccgagcg 18360 cttctggagg ccctgcttcc gcataatcgt gatatgggtc gcacccggtt tgggacgtgc 18420 ccaggacagt gcttcggtga ccgggatgct cgattcgcga aattcaaagt cgtaggaatt 18480 gaacacatcg ccctgcaccg agaacgtatg ctggcgcgga cccacaatga tcgtatcacc 18540 gtccgcaaac tgggacagcc ccagtttgcc gttgagcagg aagtcataga ggttgacgtt 18600 cgagcgcaca cgattgccgc gtttcacgac gatgtccacg tagctgccgc gttccgggtc 18660 cacaccaccc gccttgatca ggtagttcag caggctgtcg gaggtgacac cgccgtacag 18720 gccggggttg cggacaaagc cggtcacata gaccttgacc ggctgcgcct gcaagagcga 18780 cgcatagacg ttcacgttgc tctggtagac ttccttcacc ttgctcgtca ccagcgcgtt 18840 caactgggag ttcgacacac ctgcgacttt gacggggccg acattcggca ggaagatgtt 18900 gcccttcggg tccacctgga gtgcgccatc gaaggtgaac gcaccccaca ggcggacctg 18960 gatggaatcg ccgggattca ggatgtagtc cggattgaaa cccacggttg cccccgagtc 19020 tgcgctcgta ccgttgaaca gctgcgcccc gaacatacgg ctcatcacga ccgggggtgc 19080 ggggggcggg gtgttatcga agccgctcat gttctgggtg tcgcttttct gcccgttcag 19140 gatgccggtc aacggtgcgg cacccgtgag gttcggatcg gcattaatgt cgatggttgc 19200 gctcgcctgt gctgcatggc acgctgcgat cagcaggatc gacttaaaca gcttcattta 19260 ttaacctcct cgagaagtcg acttagtcac ggtggtcttc aatcaccgcc aggagcaatt 19320 tcagggtgcc aaagagcagg caacacacca gcagccaaca cgcgatcaaa tacgggatat 19380 tcgggaagga gctttcctgg ggcagctgcg gggacgagat cacgctcagg actttcagct 19440 tacgggccgc ttcgacacgg gtcttttcga tgctggtgag cgtgagcttg tacaactcgg 19500 tattgaactc gaccttggat ttgatctcct caaaatccac ggccatgcgg ttcagtttat 19560 cgccctgggg tgcggtaatt ttcgactttt cttcgtcgat ctgtgcctgg aggctctgaa 19620 ttgcattgcg ggcgctcacg acttggggcg catcctcgcg caggtacgtg agcaggttgc 19680 gcaggtcggc ttccatctga attttctggc ccatcagcgt attcaccagg gtggatgccg 19740 cctgggcctg tgcctgcggg tccagcacat tgttgttgtc ttggtaggac aacaattcgg 19800 ctttcgatgc atccagccgc tggcgcgctt tttccatttc ggtttccgca aacgccaatt 19860 gatcgcgggc gatacggtgc gacatttcat tgatgaaccg ctcggattcc ttgagcacgg 19920 tctggttgaa tttcagcgcg aactcgggcg aaaagccctg ggtctggatg ttcagcagcc 19980 cggtcttgtc gtcgtagctg acgttgatgc gatctttata gtacttcagg aacccctcgg 20040 cggtttcatc cttggacaga tggttcagga agtccaggcc cgaatgggag aacgcttcgc 20100 ggaagttcag ctgtttatcc agcgcggcca gcatatccgg gctgttgatg tattccttca 20160 ggtacagtgc gtcttcggcg gacgacgggt tggaggcacc caacagcagg ccgaagttca 20220 ggctgccgga gttgagatcg tcgctgcgct tgatggccac cttgctttcc gacatatagc 20280 ggggctggga gaagatcgcc aagtagatca gcagcaccgc catgggtgcc agaataatga 20340 tttttgccag gtgcttctga atatctgcca ggctgatcgc gctcagacgc gcacgcatcc 20400 acgagacggc gcttttcact ttgatcagca tttattaacc tcctgtcgac aacacgtgtt 20460 aatcgaaaat gcgcaccaac ccggtcacct tatttgcttt gttggtcacc agcagggtcg 20520 agacgcggtg tttctgcatc ttctcttctg cttcgatgat catggtgtct tcgggcaagg 20580 tcagcggttc gcgggtcatc atctgtgcgg ccgttgcgct cgtcaggctg tcttctttct 20640 ccataaagcg ccgcagatcg ccatcggtga tgatgcctgc cagcccacct tccgcatctt 20700 cgaccatcac cataccctgg cagcccgagg tgatgcgctg aatgaccgtt ttgaagctgg 20760 catcgagctg cactgccggc acatcatgtt gcatcacgtc ggcgacgcgg gtcagcaggc 20820 gccgacccag gctgccaccg gggtggtagc gtgcaaagtc attgggcata aacttacgct 20880 ggtgaatcat cgcgatggcc agcgcgtccc cgatcgccat cgtgagcgtc gtggaggtgg 20940 tcggggcgag attgttcggg cacgtttcgt tcgccatgtg cagctccagg accgcatctg 21000 catttttggc cagggtgcta ttcccgttat tggtgattgc gatgatgcga ttgccgaagt 21060 tcttcaggct cggcaccagt ttcaggatct cgtccgtctc accgctcgcc gaaatcaaga 21120 tgagcaggtc atacggggtg atcatgccca gatcaccatg gaacgcttcc gccggatgaa 21180 taaagaagga gggcgtcccg gtcgaggcca aggtcgccga catcttgcgg cccacatggc 21240 cgcttttacc catgccgctc aggatgacgt gccctttaca attcatgatg agattcagga 21300 cgcgctggta ctgaccgcta tccagttgtt tggacaggtt ttgcagtgcc gcgctttgtt 21360 cggccagggt ctggcggacg ctcgtaatca gatacggatc aatggtcgag gactggtcat 21420 ccggcaagtg gcgttcgctc atttattaac ctcctcacgt gttaattaag taatcgatag 21480 tgatttaaat atgcaagatc tagttacctg caggattatt gtttctgttg cataaagcct 21540 aaggggtagg cctttctaga gatagccatt ttttgcactc ctgtatccgc ttcttgcaag 21600 gctggactta tccctatcaa accggacact gcaggctgac aagctttcat tacatatgaa 21660 gagtttgtag aaacgcaaaa aggccatccg tcaggatggc cttctaagaa ggctcgagtg 21720 gcgcgcctaa gtcgaatttc tgccattcat ccgcttatta tacttattca ggcgtagcac 21780 caggcgttta agggcaccaa taactgcctt aaaaaaatta cgccccgccc tgccactcat 21840 cgcagtactg ttgtaattca ttaagcattc tgccgacatg gaagccatca cagacggcat 21900 gatgaacctg aatcgccagc ggcatcagca ccttgtcgcc ttgcgtataa tatttgccca 21960 tggtgaaaac gggggcgaag aagttgtcca tattggccac gtttaaatca aaactggtga 22020 aactcaccca gggattggct gagacgaaaa acatattctc aataaaccct ttagggaaat 22080 aggccaggtt ttcaccgtaa cacgccacat cttgcgaata tatgtgtaga aactgccgga 22140 aatcgtcgtg gtattcactc cagagcgatg aaaacgtttc agtttgctca tggaaaacgg 22200 tgtaacaagg gtgaacacta tcccatatca ccagctcacc gtctttcatt gccatacgga 22260 attccggatg agcattcatc aggcgggcaa gaatgtgaat aaaggccgga taaaacttgt 22320 gcttattttt ctttacggtc tttaaaaagg ccgtaatatc cagctgaacg gtctggttat 22380 aggtacattg agcaactgac tgaaatgcct caaaatgttc tttacgatgc cattgggata 22440 tatcaacggt ggtatatcca gtgatttttt tctccatttt agcttcctta gctcctgaaa 22500 atctcgataa ctcaaaaaat acgcccggta gtgatcttat ttcattatgg tgaaagttgg 22560 aacctcttac gtgccgatca acgtctcatt ttcgccaaaa gttggcccag ggcttcccgg 22620 tatcaacagg gacaccagga tttatttatt ctgcgaagtg atcttccgtc acaggtattt 22680 attcggcgca aagggcctcg tgatacgcct atttttatag gttaatgtca tgataataat 22740 ggtttcttag acgtcaggtg gcacttttcg gggaaatgtg cgcgcccgcg ttcctgctgg 22800 cgctgggcct gtttctggcg ctggacttcc cgctgttccg tcagcagctt ttcgcccacg 22860 gccttgatga tcgcggcggc cttggcctgc atatcccgat tcaacggccc cagggcgtcc 22920 agaacgggct tcaggcgctc ccgaaggt 22948 <210> 41 <211> 24509 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 41 ctcgggccgt ctcttgggct tgatcggcct tcttgcgcat ctcacgcgct cctgcggcgg 60 cctgtagggc aggctcatac ccctgccgaa ccgcttttgt cagccggtcg gccacggctt 120 ccggcgtctc aacgcgcttt gagattccca gcttttcggc caatccctgc ggtgcatagg 180 cgcgtggctc gaccgcttgc gggctgatgg tgacgtggcc cactggtggc cgctccaggg 240 cctcgtagaa cgcctgaatg cgcgtgtgac gtgccttgct gccctcgatg ccccgttgca 300 gccctagatc ggccacagcg gccgcaaacg tggtctggtc gcgggtcatc tgcgctttgt 360 tgccgatgaa ctccttggcc gacagcctgc cgtcctgcgt cagcggcacc acgaacgcgg 420 tcatgtgcgg gctggtttcg tcacggtgga tgctggccgt cacgatgcga tccgccccgt 480 acttgtccgc cagccacttg tgcgccttct cgaagaacgc cgcctgctgt tcttggctgg 540 ccgacttcca ccattccggg ctggccgtca tgacgtactc gaccgccaac acagcgtcct 600 tgcgccgctt ctctggcagc aactcgcgca gtcggcccat cgcttcatcg gtgctgctgg 660 ccgcccagtg ctcgttctct ggcgtcctgc tggcgtcagc gttgggcgtc tcgcgctcgc 720 ggtaggcgtg cttgagactg gccgccacgt tgcccatttt cgccagcttc ttgcatcgca 780 tgatcgcgta tgccgccatg cctgcccctc ccttttggtg tccaaccggc tcgacggggg 840 cagcgcaagg cggtgcctcc ggcgggccac tcaatgcttg agtatactca ctagactttg 900 cttcgcaaag tcgtgaccgc ctacggcggc tgcggcgccc tacgggcttg ctctccgggc 960 ttcgccctgc gcggtcgctg cgctcccttg ccagcccgtg gatatgtgga cgatggccgc 1020 gagcggccac cggctggctc gcttcgctcg gcccgtggac aaccctgctg gacaagctga 1080 tggacaggct gcgcctgccc acgagcttga ccacagggat tgcccaccgg ctacccagcc 1140 ttcgaccaca tacccaccgg ctccaactgc gcggcctgcg gccttgcccc atcaattttt 1200 ttaattttct ctggggaaaa gcctccggcc tgcggcctgc gcgcttcgct tgccggttgg 1260 acaccaagtg gaaggcgggt caaggctcgc gcagcgaccg cgcagcggct tggccttgac 1320 gcgcctggaa cgacccaagc ctatgcgagt gggggcagtc gaaggcgaag cccgcccgcc 1380 tgccccccga gacctgcaga tccacatcct tgaaggccgc agcgacgagc agaaggaaac 1440 cctcattcgg gaagtcagcg aggccatctc gcgctccctg gatgcgccgc tgaccagcgt 1500 gcgagtgatt atcacggaga tggccaaggg ccacttcggc atcggcggcg aactggccag 1560 caaggtcaga cgctgaagtg gagatgccca agggcacttc gggtcgagga acccgacctg 1620 cattgggacg cggccacgga gagcgcgggc aaacgccggc actatagcca gtggagtttg 1680 taaaacgcta tttcagagct tggagagtgt ctaagaaagc cggggcgatg ccaacccatc 1740 ccttcttcgg ctatgcatcg ttcgtaatca agccacttcc tttttgcatt gacgcagggt 1800 gtcggaaggc aactcgccga acgcgctcct atagttttca gcgaagcgtc ccaaatgtaa 1860 gaagccgtag tctagggcta tctcagttat actacgcaca ttggcactgg gatcgttcaa 1920 gcaggcgcgg atgctttcga gcttgcggtt gcggatgtag ttcttcggcg tggtgccggc 1980 atgcttctcg aacaaattgt agagcgagcg tggactcatc atcgccagct ccgctaaccg 2040 ctcaaggctg atattccgtt tgagattctc ctcaatgaat tgaacgactc gctcgaaaga 2100 cgggttacct ttgctgaaaa tttcacggct gacattgctg cccagcattt cgagcagctt 2160 ggaagcgatg atccccgcat agtgctcttg gacccgaggc atcgactttg tatgttccgc 2220 ttcgtcacaa actaacccga gtagattgat aaagccatcg agttgctgga gattgtgtcg 2280 cgcggcgaaa cggataccct ccctcggctt gtgccaattg ttgtcactgc atgcccgatc 2340 aaggaccact gagggcaatt taacgataaa tttctcgcaa tcttctgaat aggtcaggtc 2400 ggcttggtca tccggattga gcagcaatag ttcgcccggc gcaaaatagt gctcctggcc 2460 atggccacgc cacaggcaat ggcctttgag tattatttgc agatgataac aggtctctaa 2520 tccaggcgag attaccctca cgctaccgcc gtagctgatt cgacacaggt cgaggcatcc 2580 gaagattctg tggtgcagcc tgcctgccgg gcgcccgccc ttgggcaggc gaatagagtg 2640 cgtaccgaca tactggttaa cataatcgga gactgcatag ggctcggcgt ggacgaagat 2700 ctgacttttc tcgttcaata agcaaaaatc catagttcac ggttctctta ttttaatgtg 2760 ggctgcttgg tgtgatgtag aaaggcgcca agtcgatgaa aatgcatctc gacgtgatgc 2820 gtatacgggt tacccccatt gccacgttgc gccatccttt ttgcaatcag tgaccacttt 2880 tccaagcaaa aataacgcca agcagaacga agacgttctt tttaagaagc gagaacacca 2940 gaagttcgtg ctgtcggggc atgcggcgac gaattggcgg ataaagggga tctgcaggtc 3000 ccgagcctca cggcggcgag tgcgggggtt ccaagggggc agcgccacct tgggcaaggc 3060 cgaaggccgc gcagtcgatc aacaagcccc ggaggggcca ctttttgccg gagggggagc 3120 cgcgccgaag gcgtggggga accccgcagg ggtgcccttc tttgggcacc aaagaactag 3180 atatagggcg aaatgcgaaa gacttaaaaa tcaacaactt aaaaaagggg ggtacgcaac 3240 agctcattgc ggcacccccc gcaatagctc attgcgtagg ttaaagaaaa tctgtaattg 3300 actgccactt ttacgcaacg cataattgtt gtcgcgctgc cgaaaagttg cagctgattg 3360 cgcatggtgc cgcaaccgtg cggcacccta ccgcatggag ataagcatgg ccacgcagtc 3420 cagagaaatc ggcattcaag ccaagaacaa gcccggtcac tgggtgcaaa cggaacgcaa 3480 agcgcatgag gcgtgggccg ggcttattgc gaggaaaccc acggcggcaa tgctgctgca 3540 tcacctcgtg gcgcagatgg gccaccagaa cgccgtggtg gtcagccaga agacactttc 3600 caagctcatc ggacgttctt tgcggacggt ccaatacgca gtcaaggact tggtggccga 3660 gcgctggatc tccgtcgtga agctcaacgg ccccggcacc gtgtcggcct acgtggtcaa 3720 tgaccgcgtg gcgtggggcc agccccgcga ccagttgcgc ctgtcggtgt tcagtgccgc 3780 cgtggtggtt gatcacgacg accaggacga atcgctgttg gggcatggcg acctgcgccg 3840 catcccgacc ctgtatccgg gcgagcagca actaccgacc ggccccggcg aggagccgcc 3900 cagccagccc ggcattccgg gcatggaacc agacctgcca gccttgaccg aaacggagga 3960 atgggaacgg cgcgggcagc agcgcctgcc gatgcccgat gagccgtgtt ttctggacga 4020 tggcgagccg ttggagccgc cgacacgggt cacgctgccg cgccggtagc acttgggttg 4080 cgcagcaacc cgtaagtgcg ctgttccaga ctatcggctg tagccgcctc gccgccctat 4140 accttgtctg cctccccgcg ttgcgtcgcg gtgcatggag ccgggccacc tcgacctgaa 4200 tggaagccgg cggcacctcg ctaacggatt caccgttttt atcaggctct gggaggcaga 4260 ataaatgatc atatcgtcaa ttattacctc cacggggaga gcctgagcaa actggcctca 4320 ggcatttgag aagcacacgg tcacactgct tccggtagtc aataaaccgg taaaccagca 4380 atagacataa gcggctattt aacgaccctg ccctgaaccg acgaccgggt cgaatttgct 4440 ttcgactatc ggcgcgccag agctcatcgt taatgtcttc gtgcgccgtc agtcggcgca 4500 cgttttttct ctctggtacc gtgtcactga tctagtcaat tactcgaagt atccacaagt 4560 gaagcatact aagtaatgta caagaatcaa aaaaatcggc tacgcaagtc gcgtagccga 4620 atcatttaag gatccttcca ttcaggtcga ggtggcccgg ctccatgcac cgcgacgcaa 4680 cgcggggagg cagacaaggt atagggcggc gcctacaatc catgccaacc cgttccatgt 4740 gctcgccgag gcggcataaa tcgccgtgac gatcagcggt ccagtgatcg aagttaggct 4800 ggtaagagcc gcgagcgatc cttgaagctg tccctgatgg tcgtcatcta cctgcctgga 4860 cagcatggcc tgcaacgcgg gcatcccgat gccgccggaa gcgagaagaa tcataatggg 4920 gaaggccatc cagcctcgcg tcgcgaacgc cagcaagacg tagcccagcg cgtcggccgc 4980 catgccggcg ataatggcct gcttctcgcc gaaacgtttg gtggcgggac cagtgacgaa 5040 ggcttgagcg agggcgtgca agattccgaa taccgcaagc gacaggccga tcatcgtcgc 5100 gctccagcga aagcggtcct cgccgaaaat gacccagagc gctgccggca cctgtcctac 5160 gagttgcatg ataaagaaga cagtcataag tgcggcgacg atagtcatgc cccgcgccca 5220 ccggaaggag ctgactgggt tgaaggctct caagggcatc ggtcgacgct ctcccttatg 5280 cgactcctgc attaggaagc agcccagtag taggttgagg ccgttgagca ccgccgccgc 5340 aaggaatggt gcatgcaagg agatggcgcc caacagtccc ccggccacgg ggcctgccac 5400 catacccacg ccgaaacaag cgctcatgag cccgaagtgg cgagcccgat cttccccatc 5460 ggtgatgtcg gcgatatagg cgccagcaac cgcacctgtg gcgccggtga tgccggccac 5520 gatgcgtccg gcgtacaaga tccacaggac gggtgtggtc gccatgatcg cgtagtcgat 5580 agtggctcca agtagcgaag cgagcaggac tgggcggcgg ccaaagcggt cggacagtgc 5640 tccgagaacg ggtgcgcata gaaattgcat caacgcatat agcgctagca gcacgccata 5700 gtgactggcg atgctgtcgg aatggacgat atcccgcaag aggcccggca gtaccggcat 5760 aaccaagcct atgcctacag catccagggt gacggtgccg aggatgacga tgagcgcatt 5820 gttagatttc atacacggtg cctgactgcg ttagcaattt aactgtgata aactaccgca 5880 ttaaagccga gcgatgataa gctgtcaaac atgagatcca atctagattg tttaaacttc 5940 tgcagaacac gcggtgttaa cgtttcttat acttcttaat tttgttaaag atcatttcgc 6000 cgtagtacac cgcattgacc tgggtcttca ccagcaagta gccgcgaaat ttcttaaaca 6060 acttcatgtt cggtttaaag tcggcttgcc agaactgatg caaatgcccc tggtacgtca 6120 gacccttgat atcgtacaag gcgttgccca tgactttcag gggcttgttg tggatcaacg 6180 cggaaatgcc ggccgtgcta ttgatggtga ccaccgcttt ggcgtggcgc aacagctccg 6240 gcatgggcag atcgtgcaca tagatgacac gttcatccaa accgtattcc ttcgacagac 6300 gcttgatcaa cgggcggtac aggcggtgcc cgcgatccat cgggtgatgt ttgatcacca 6360 gataggactc cttgggggcc ttgcgggaaa agctgtacat cacttcgttg atgtaatcac 6420 gcacatcatt atagttgcta tggttgcgga tctggctgtc gttgtacact tgcaggaccg 6480 ccaggtaata gcgctgatcc agctcgttca tcaggcgggg gaggaccttg cgttgggtga 6540 ccttatacag ctgtttgcgc cagtaggcgc ggacccagca gcgcgcttca taccacgggc 6600 tgaacgattt gtggtggcga tagcgcggaa attcgtgacg atagtgccaa cccatcaggt 6660 aataccacat ggcgtggccg atgcgcttca tggtgctcgg tttcaggttc tcgacgtgcg 6720 gcgtcggcat atcgggcaat ttgcggtaaa agtccggatc gcggggcaag ctgctatagg 6780 cgttcacacc gccttcttcc acggtgataa attgcggacg caggtagcct tcctcgaagg 6840 ccagaaaacg aatccccttc gacttggccc agcgtttggc ctccttgtgc agcaggcggc 6900 agtcaccgaa acacaaaatc gtgtcaaagt catactgacg atgcaagtcc cgcagccaac 6960 cggggaactc cttcggggtt tggtagtacg ccaggtattg gcggtggcgg cagtagaagc 7020 gatcaccgcc attaaagacg acgttgaccg cgttgcgacc gaggctctcc aaccattccg 7080 ccacatcgtt gaagaacgga cccatcggac cttggagcag gaggtacttt ttaccgctca 7140 acagcaccgt cagcgcattg ccgtgcattt attaacctcc taacacgcgg tgttaagcgt 7200 tttcggcgag ctcttaacca aagcgcactt tgcagaacat gatcaacttg cgatagtagc 7260 gaatcacacg gccggctttc ttgcgggtga taaagatggg tttgcggggc gttttgatca 7320 gatattctgc cgcttcctcc accgtgatcg gctgcaaccg cgtcggatga atataggtgg 7380 gatagacaat cagggcttga tagatcaggt cggcgatggt cagccgccgc tcgcgacggg 7440 ggcagtggtg ctcatcgacg gtcaggcccc acgaggcgta gaacggcagg ccgtagcagt 7500 gcacctgttt accgtgcagc aatgcttcaa agccgctgag gctcgtcatc gtgtgcacct 7560 cgtccgcacg ctgaatacac tgaatgatat cggcatccag tgcctggtag tctgcgagtt 7620 ccgcgatctg ttccgccgga atgtcaccct tacggttgcc gacgagcaca tcggggtgcg 7680 gcttgtagat gatgtaggcg tgcggattac gttcccgcac ggtgcgcagc agctccagat 7740 tcgacttgat cgacacggtg cccgtcttaa tcgacgcatc gtcttccacc tggcccggca 7800 ccaggatgac tttcttgtcc ttcgcttctg ccgggaggct gaaatcggcc cccaggttat 7860 atttgctcaa tttgctttcc accagacgtt ggcgcaactt ttccgcgcgc atctggtgcg 7920 cgagggtcag ctggctgtga ttcagcagga cctccagttc cgacggacgg gtggcatcgt 7980 aatagatacc gcgcttatcc aggaccaggc tcaacggcgg cagcagatcg ctccccaggc 8040 cggagctgcg caggaagccg tcttccatgc gccacagcgg cagggatttg cgctgtgcct 8100 ccgcacgcca ttgctgttcg cctttcacgc cccacacgac gcaggcgctt gctgcggtac 8160 agcgacggga aaaggagaga cgattcgtgg ccgtttgcag gaagggcttc aggatcgcgc 8220 ttttccacag ggtcaggccc ggcacccaga gataaccatt ccgctgttgc aggtgacgac 8280 gttgcagctg gagccattgg agcaccgtga acagggccga cacctccccg gtctgcggat 8340 caatgtagcg gcaatagcgc agataggccg ctgcgaacag ttcctccagg gtggccgagc 8400 cgcgacgcgc cgacagcagc gccgattggg ggtggcggtc atcggtgagg ccccaccctg 8460 cataccaggg ttggccaaag caggtcacgg gcttaccggc cagcagggct tcaaaaccgt 8520 actgggaggt cacgacgtac acgcgggaca catgacgcag cagggactgc ggcgacacgt 8580 tttccgcaat caggcgcacg cgctgggtgg cacgcaagtc cgcgaagtag ccggtctttt 8640 tcccttccag gacatcggga tgcactttga cccagatttc tgcctgcggg ttttccgcca 8700 tcgctgcttc cagcattgcg gcgaactcat gggggcctgc gttgccgtag gtcacgctca 8760 tgtcattgaa ggtctggtcc accaccagca cgatgttcgt gcgctcgctt tcatccgcca 8820 cgaacgccgg tgccaggttg tacttgctca tgtcgcccgt cacaatggtg tgcatcgcct 8880 cgcgcgcctg atccgccagg gccgcgttgc cggccttgtc ctgcacgagt ttttccagcg 8940 cgctcggttt cgaggcgtcg tagtaaatgc cgcagtcatc cacgacgagc gagaggggcg 9000 gttcaccgtt cacgcccagg tccagcgagc ggacgaaacc atcctccaag cggatcaccg 9060 gcttgcctgc ggctttggcg atggccaccg gctttgcggc cgaggggcgg tgcccccaca 9120 ccgcgattgc atccacttcc tgcgggaccg ggcgcagcag cgacagcttt tggcagggct 9180 gggcgaggaa tttttccagg tgcggaatac gccaaatgcc ggggctataa atgccaatca 9240 tgcgttctcc gcgagctcct gcgccatcag ggcccggacc ttctccaagc acgccggggt 9300 atcgacgccg ggaccggtcg cggcgacctc gaaggtgcga atgttaatgc ccgcgctcat 9360 cagccgcagt tgctccaggg attcggcctg ttcgggcatg gactccggca actggctgta 9420 attttgcagg acatcccgcc gataggcgta gatcccgacg tgcttcaggt agcgcgcctt 9480 ctcggcgttg cgcgggtacg gaatggggga gcgggagaaa tacagggcgt cctgccgcgt 9540 gttcaccacg accttgacgg tggacggttc ggcggcttct gccgcgctga tcgcatgaca 9600 cagggtcgcc accggcagcg ccgggtcgtc ccgcatacct tgcagcaggg tttcgacgtc 9660 acgcgggcga atcatcggct catccccttg caggttgata tagatatccg cctccacctt 9720 atgcatgact tccaccaggc gatcggtgcc gctctcatga tcgttgcggg tcatgatcgc 9780 tttgccgccg aacgcctgga ctgcctgctc cacacgcggg tcgtcggttg cgacccacac 9840 ctctgccacg cctgccactt gcagggcccg ttcgtagacg tgctggatca tcggtttccc 9900 gacgatatcc agcagcggtt tgcccggcag acggctgctg ccgtagcgtg ccgggatcac 9960 aatcacggcc ttcgacattt attaacctcc tcgagttaca gcgacagaat cactttcgcg 10020 cccaccgcca gttggtacag aatggtgctg ataccgcgcg tcacttcgat gttcttcgac 10080 tcgtatttcg gcaacaccat aatttcatca ccgggtttca gggaatcgac gtcttctgcg 10140 ttcaccgctg cgccgttctg acggatgacg ataatacggg cgttgccgga cttctgggtc 10200 agcccaccgc acttctcgat gtagtcctcg gtcgtcatac ctttctgcca cgacaccgcg 10260 ttcgggaaca gcacttcccc gtggaccatg accaacgacg tcttttcggg aatattgatc 10320 acgtcgccgt cctccaggag gacggagtca atgttgcttt cattgaggat cacttcgccc 10380 ttcggcacga cggtgcgggc tttcgcgacg aagcgggaga tcagttgggc ttcctgcata 10440 cgcaggctgg cctcttcctt ggtgctgctc tgtgcgctga ggctggcctc ttcgagcttt 10500 tgcagggaca aattcagcat ttctttctgc cgttgcgcga cgctcggccg atacaactgc 10560 acggcgttca tctgcgacat ggagttcggg cgcacttttt cgagcacggc ccgcatggtg 10620 ctaccgtagg gcagcaccat ggcgtgttcc ccggaatgtg cgccttccac acgcacttga 10680 atggtgcccg catagcggtc ggtggagaca atgagggtat caccgttttg cagcatacgc 10740 cccggtgcgg acgagatcgg ataatattcc gagcgcttct ggaggccctg cttccgcata 10800 atcgtgatat gggtcgcacc cggtttggga cgtgcccagg acagtgcttc ggtgaccggg 10860 atgctcgatt cgcgaaattc aaagtcgtag gaattgaaca catcgccctg caccgagaac 10920 gtatgctggc gcggacccac aatgatcgta tcaccgtccg caaactggga cagccccagt 10980 ttgccgttga gcaggaagtc atagaggttg acgttcgagc gcacacgatt gccgcgtttc 11040 acgacgatgt ccacgtagct gccgcgttcc gggtccacac cacccgcctt gatcaggtag 11100 ttcagcaggc tgtcggaggt gacaccgccg tacaggccgg ggttgcggac aaagccggtc 11160 acatagacct tgaccggctg cgcctgcaag agcgacgcat agacgttcac gttgctctgg 11220 tagacttcct tcaccttgct cgtcaccagc gcgttcaact gggagttcga cacacctgcg 11280 actttgacgg ggccgacatt cggcaggaag atgttgccct tcgggtccac ctggagtgcg 11340 ccatcgaagg tgaacgcacc ccacaggcgg acctggatgg aatcgccggg attcaggatg 11400 tagtccggat tgaaacccac ggttgccccc gagtctgcgc tcgtaccgtt gaacagctgc 11460 gccccgaaca tacggctcat cacgaccggg ggtgcggggg gcggggtgtt atcgaagccg 11520 ctcatgttct gggtgtcgct tttctgcccg ttcaggatgc cggtcaacgg tgcggcaccc 11580 gtgaggttcg gatcggcatt aatgtcgatg gttgcgctcg cctgtgctgc atggcacgct 11640 gcgatcagca ggatcgactt aaacagcttc atttattaac ctcctcgaga agtcgactta 11700 gtcacggtgg tcttcaatca ccgccaggag caatttcagg gtgccaaaga gcaggcaaca 11760 caccagcagc caacacgcga tcaaatacgg gatattcggg aaggagcttt cctggggcag 11820 ctgcggggac gagatcacgc tcaggacttt cagcttacgg gccgcttcga cacgggtctt 11880 ttcgatgctg gtgagcgtga gcttgtacaa ctcggtattg aactcgacct tggatttgat 11940 ctcctcaaaa tccacggcca tgcggttcag tttatcgccc tggggtgcgg taattttcga 12000 cttttcttcg tcgatctgtg cctggaggct ctgaattgca ttgcgggcgc tcacgacttg 12060 gggcgcatcc tcgcgcaggt acgtgagcag gttgcgcagg tcggcttcca tctgaatttt 12120 ctggcccatc agcgtattca ccagggtgga tgccgcctgg gcctgtgcct gcgggtccag 12180 cacattgttg ttgtcttggt aggacaacaa ttcggctttc gatgcatcca gccgctggcg 12240 cgctttttcc atttcggttt ccgcaaacgc caattgatcg cgggcgatac ggtgcgacat 12300 ttcattgatg aaccgctcgg attccttgag cacggtctgg ttgaatttca gcgcgaactc 12360 gggcgaaaag ccctgggtct ggatgttcag cagcccggtc ttgtcgtcgt agctgacgtt 12420 gatgcgatct ttatagtact tcaggaaccc ctcggcggtt tcatccttgg acagatggtt 12480 caggaagtcc aggcccgaat gggagaacgc ttcgcggaag ttcagctgtt tatccagcgc 12540 ggccagcata tccgggctgt tgatgtattc cttcaggtac agtgcgtctt cggcggacga 12600 cgggttggag gcacccaaca gcaggccgaa gttcaggctg ccggagttga gatcgtcgct 12660 gcgcttgatg gccaccttgc tttccgacat atagcggggc tgggagaaga tcgccaagta 12720 gatcagcagc accgccatgg gtgccagaat aatgattttt gccaggtgct tctgaatatc 12780 tgccaggctg atcgcgctca gacgcgcacg catccacgag acggcgcttt tcactttgat 12840 cagcatttat taacctcctg tcgacaacac gtgttaatcg aaaatgcgca ccaacccggt 12900 caccttattt gctttgttgg tcaccagcag ggtcgagacg cggtgtttct gcatcttctc 12960 ttctgcttcg atgatcatgg tgtcttcggg caaggtcagc ggttcgcggg tcatcatctg 13020 tgcggccgtt gcgctcgtca ggctgtcttc tttctccata aagcgccgca gatcgccatc 13080 ggtgatgatg cctgccagcc caccttccgc atcttcgacc atcaccatac cctggcagcc 13140 cgaggtgatg cgctgaatga ccgttttgaa gctggcatcg agctgcactg ccggcacatc 13200 atgttgcatc acgtcggcga cgcgggtcag caggcgccga cccaggctgc caccggggtg 13260 gtagcgtgca aagtcattgg gcataaactt acgctggtga atcatcgcga tggccagcgc 13320 gtccccgatc gccatcgtga gcgtcgtgga ggtggtcggg gcgagattgt tcgggcacgt 13380 ttcgttcgcc atgtgcagct ccaggaccgc atctgcattt ttggccaggg tgctattccc 13440 gttattggtg attgcgatga tgcgattgcc gaagttcttc aggctcggca ccagtttcag 13500 gatctcgtcc gtctcaccgc tcgccgaaat caagatgagc aggtcatacg gggtgatcat 13560 gcccagatca ccatggaacg cttccgccgg atgaataaag aaggagggcg tcccggtcga 13620 ggccaaggtc gccgacatct tgcggcccac atggccgctt ttacccatgc cgctcaggat 13680 gacgtgccct ttacaattca tgatgagatt caggacgcgc tggtactgac cgctatccag 13740 ttgtttggac aggttttgca gtgccgcgct ttgttcggcc agggtctggc ggacgctcgt 13800 aatcagatac ggatcaatgg tcgaggactg gtcatccggc aagtggcgtt cgctcattta 13860 ttaacctcct cacgtgttaa ttaatgtttc tgttgcataa agcctaaggg gtaggccttt 13920 ctagagatag ccattttttg cactcctgta tccgcttctt gcaaggctgg acttatccct 13980 atcaaaccgg acactgcatc gattgataga tttaaataag aactgcagaa gctagcttag 14040 atgctcgtga aattgacgtg ggcgctttgc agggccgtct taatggcgtt ggtgtccacg 14100 aggatcgagt cgggtgcgga aaacggacgg ttcttgttgg tgaaatcgct gttaccaatg 14160 tacagcgatt ccttgttacg cagcgcctgg atgtgccagc gggaccacga atcccaatac 14220 ttctggcgat ccggcgagat accttggctg gtgtagccgg tcgtcgggct gttcatcaac 14280 gagtcggtgc ggtgcgagcc cagcgtcagc ggcaacttga tccgatgcac cgtggaatcg 14340 ccgaagatca gcttcagacg cgcgataaat tcgctatccg cacccgtttt cacacaatcc 14400 cagacaccgg ccttctgcaa gacgtcggca cggcgaaaca ggagcgacga cggattcaga 14460 cgcttcaagg ggtacactgc gcgggcatag aaaataccgt tgtcttgcag gcgcacccag 14520 tccgagatgg agcagatgag cttcggattg agcaacaagg gggagatttg gcggaacagc 14580 ttttccggat ggctccagtc atccgaatcg tggcaggtga cgaactcgcc cttcgcttgg 14640 atcaagccga tacgcttcgc ggcataggtg ccgacattct gcggcaggct aatgatcttg 14700 atgcgcgtgt ctttgagggc gagccgctgg agacgaaaca gggtgtcatc ggtgctcgcg 14760 tcatccacaa tgatcagctc gaaggaacgg taggtctgat tgaggagcga aatcaccgca 14820 ttttccacgc ggcgacccgt attataggtg gtcatcagga tggagatcaa cggccccgtc 14880 tgggccgggt acgggatgct ggtgatgatg ttgcacgggg agagcgggga gctgttgtcc 14940 gtcaaggcca cggggctgag gccgaagtat ttatagtatt cattcagccg attcaggcta 15000 atttcggcgg tttcgcggaa ggcgttattt tgcagcagca ggatatccgg gctatagacg 15060 atatcggatg cgtcgatctg ggcgagggtc gagatggcct tttgggtcag gccgatccgg 15120 agttgcagtg cggtatacag gtccagcggg cagttgtcca cgttgtccaa caggctcagg 15180 ctaaaggtcg gcgagtagga cgccagggtt ttcgccagtt ccactttctg atgggtatcg 15240 gtgaactcgt ccttgaactc catcagcagc tcgggcgtca ggctgatgtc gccgcaggcg 15300 atttttgcga tcttgattgc cagtttgcag cgccaatcgg acggggtatc cgtcaagtta 15360 tgcagcgacc agtacatatt cagacgatac atcgcgagga tgcgtttcga ctgccagaac 15420 cggcaatcat cctggatggc cgcgagcgcg tggacgtagc ggctcttttt gagcagccac 15480 aagaatttga gattattgaa catttattaa cctcctgcta gcaacttaag ttacgaatcg 15540 acgccgaaca ggtcgcgggt gtagactttc tccgagacat cttccagttc gctggtgcgg 15600 cgattcgcca caatgacatc gacgcgctcc ttaaaggaat tgatgtcgcg ctcgacgtag 15660 gaaccgaaga agtagggttc tttcaggacc ggctcgtaca ccacaatctc gatacccttg 15720 gccttcaaac gtttcatgac cccctggatg ctgctggccc ggaaattgtc gctacccgcc 15780 ttcatgatca ggcgatagat accgaccact ttgggcttac gggacaggat gtcctcggcc 15840 acgaagtcct tacgggtcgt attcgcatcc acgatggcct ggatcaggtt ttgcgggacg 15900 tcgcgataat tggccaacag ctgcttcgta tccttcggca gacagtaacc gccgtagccg 15960 aaggacgggt tgttgtaatg ttgaccaatg cgcggatcga gggagacgcc ttcgatgatt 16020 tgtttggtat ccaggccgtg cacgctcgcg taggtgtcca gctcgttaaa gtacgcgata 16080 cgcatcgcca gatacgtgtt cgcgaacagt ttgatggctt ctgcctcggg cgaatccgtc 16140 agcaggatcg gaatatcctt tttgatggca ccttccgaca ggagttcggc gaacttccgt 16200 gcgcgttccg acgattcgcc cacgacaatg cggctcggat agagattatc atacagggct 16260 ttgccttcgc gcaggaactc cggggaaaag atgatattat tcgtgttcag atcgcgcttc 16320 aggcgttcgg tgaacccgac ggggacggtg gatttgataa tgatggtcgc gttcgggtta 16380 atggacagca cgtcacacgc gacgctttcg acgctcaggg tatcaaagtt gttattaatc 16440 ggatcatagt tcgtcggggt ggcgatgatc acgtagtctg catcgcgata tgcctcgtat 16500 ttttccgtcg tcgcgtagag gttcagctta cgattggaga gaaacttctg gatttccggg 16560 tcgcaaatcg gcgagatttt cttgttaatg agctggacct tcttcgggtc gatgtccagg 16620 gcgatgatgt cgtgtttttg ggagaggagg atcgcaatgc tgatacccac atagccgacg 16680 ccggccacgg caattttcat ttattaacct ccttaagtga attcaaacta gtttacaagt 16740 cgttttcgat cttctcccag gtatatttgc gacattcatt caagttggtc agcggcgagt 16800 atttgtactt tttgataccg aggcgcgaca ggctttcgtt caccaccttg aaatggtttt 16860 ccttttggat gtccagtttc ttgatcgacg tgttctcgcc gtgcaggaca cggttgtagc 16920 aaatcttatt gatatgctta aacgggccga cttcgctgag tttcaaatac atatcgtaat 16980 ccaccgcatt gctgatgctc tcgttgaagc cttcggtgag gttccatgca cgcgccgtga 17040 acatacggaa gtggtggcag atcatcgcgc tcgtgagctt ttcgcggctg taaatcggcc 17100 agttgtagcc attgctaatc aagttacctt cacgatcaat attgcgattg gtggtgtaca 17160 cgcaggcgag gctcaggtct ttgcgaaatt catccagaca cagttccacg gcatcgggct 17220 ccaggaaatc atcggaatcc agctgcccga tgtagaaacc ccggcacagg cggactgcgg 17280 tattcgaggc ggagccgatg cctttgtttt tctggctgat gaaacggacg cgcgggtggt 17340 ttgcgtaatg ttcttgcagg atgcgcagcg tatcatcggt gctcccgtca tcgcagatgc 17400 agacctccag atcggtgatc gtttggttca gtgccgattc gacgcagcgc acgatatatt 17460 tgctgcaatt atacgcgggg atgtagatgc tcaccagggg cacacgtttc agggtggcgc 17520 tctcgatttt ctccttcttg cgataaaagt agggcacctt ctgctgcaac agctggacgg 17580 taatgttttt acctgccgcg cgatcggttt cgttctcctt accgggcggt tcctgatgat 17640 atgccatcgc gccttccacg ctacggaaat aacaaccctc gcggtacagc cgatagccga 17700 actcattatc ctcaccgccc caatgcgtga actcttcgtc aaaccaaccc gcgcgaaaca 17760 gccacttctt tgcaaacgcc acattgccac cgctaaagaa ccggaacggg gtgttgcaca 17820 ggcgcagatt gtcggtattc ttgaaatgtt cgatgcgcca atcgacggat ttgttctgct 17880 cgaccttgcc tgcgacctga ttattggtaa taatctccgg gatttcattg atcaggcttt 17940 tctgggacaa aaagtccaga taggtatgct tcgacgtgtc gatgtattta cgcgggccaa 18000 tcagtgccac gttatcatcc acggccagga gttccatata ggactgcacc cacaacgggt 18060 tcggcgccat atcgcagtcc aagatcgcca cgtagttgta tttcgctgcc cgcaggccca 18120 ggttccgcac ggcgcacagc tggtagccgt agtctttctg gcggacgtat ttgatgttca 18180 gcaacgactc gaactcgcgg acgatctctt cgatgttttc cttggaaccg tcatccgcga 18240 cgatgacctc atagtcataa atcgttttct gattgcagag gcaggccagg gtgatcgcca 18300 ggattttggc gcgattgtac gtcggaatca cgatggacag gccgtcgatg atcagttgct 18360 tgcgcggata atcatccagt tctttacgtt tccctgccca gacgtagtcg ttcgtgcttt 18420 ccggcagcgg cggcaaggtc aggtcgctcg gccaatccag cggaatgggt tcgacttctt 18480 tcaattcggc gcgctcggat ttctttgcgg taatttcccg atatttgcta atgatttcat 18540 tcttttccac ctcattcagc gagatcgcct ttgcattgct gcacataatt ttggttgccg 18600 cgtcgatatc aatgaccgct ttccgattca gcttgtccac ttcttcgctc agattcaggg 18660 cggtttggca cagcttgata ttggcttcca cccagctcac atcatagatt tccgccactt 18720 tttcaaacag ggagagggct tggcggtagt tcttattctt atacagattg attgcctggt 18780 tcaaaatgct catttattaa cctcctacta gtgaattttc gaattactta ccgcagtact 18840 tgacacccac ctgggaattg tttttggtgc gtttgaattg gcggatggta cggtagatgc 18900 taaagggcag gctgatcaga ccgagcggaa aattgttctt attgatgatg agcttgccca 18960 gctgatagct caggtgtttc ttgacccgtt cggcttcgtg tttatccgcg tacaggaaga 19020 tgctcggcag gctcacttgg tactccgaat catatttctt cttccaggtc cgccattcgc 19080 tgatcaacgc aaacggaatc gagatcagac cgaggaacgt cttggagcgg ctcaccatca 19140 ccgcacccag gcggtagccg atatcttgct tgatgcgttc ggccgcacca tacagctccg 19200 gcagttgttt cttttcgaga cgttgattgt cgatgaagta ctgttcgagc ttttgctgca 19260 ccagatgcag ctgattgagc agcaattctt tttcgcacga cagcttttcg aggcgctgtt 19320 gttgcagttc atttttgttc tgttcctttt tcagcaggga ctcgaagttc tcgatcgcgc 19380 actccagttc ctggacctgg atggttttgt ttttaatgat cagatcatac tggatcagtt 19440 cttccttgct atccgacagc tctttcagaa tggcttgata ggcgttcagc tgtttggacg 19500 tgtgcagttc gttgtccaga atgatctttt tgctgctctg gtacagaccg ttcacgatat 19560 cgagggtgat ctggcgttgt ttaatgaacg tctcccaaat aaaggacggc ttatagtttt 19620 ccttctccag cacccgcaag ggggtgttgg cgttcgattg caattcaaag tacagttcct 19680 tgcaatcggg atagtcgttc aggacgttga agatcaagta ctcctccgtc tcgctttgct 19740 tgaaaatgat atccccggtc ccgatgtcaa taccgctgag ggacatgatc tcctgatgtt 19800 ctttttccag cgtaatggag gcttcggcgg tcttaaagtc attcacgctc tgctccagcg 19860 agtggttgat ggtattggag aacgacaacc cgaatttcag tttcagtttg tgttgcagtt 19920 gctggatgca gtcctcggcg ttgcgcttca cctgttcgct cgacaccagc aggcaccgac 19980 cccggttgtt gaggaagaag tgcagcaagg cggtgttgta tgccagccag tttttgatca 20040 gatgctccga ggtatagttg ctggagatgt tctggtccga gaagtagttc gtcaggatgc 20100 ttttggggtg gtcgtagatg aggataaagg tgatgttctc atccaccgat ttccaatatt 20160 ccaacgtgtg aattgcgttg gggtcgctcc aaccgcacag tttctggttc aggttggaca 20220 gcatcagatc caatgcgata ccgttccaga cggtgctcac atggagcggt tcaaagtcgg 20280 cggaatcggt caccgtatag atgtccggcg actggtacgc cttccgcagc gtctgggtga 20340 tgtcctgggg cgagaggttc tcacgtttgg acgggcacag ggagttcatg ccgcgctgat 20400 gcaggagttc ttccacgatt tggtagttgc tgctcggatg gcccacgatc accaggcggt 20460 tcatttatta acctcctttc gaaaatgaac ggtccgttaa atatagccat tcggattctt 20520 catctgccag cgccaggcgt cctccagcat ggtttcgagt tcccgcttgg ctttccagtt 20580 cagatatttg ttggcctttt cgggggagga ccagctctcc gcgatatcac cgtcacggcg 20640 gctcacgatt tcatacggaa tccgcacgcc ggaaatcttt tcaaaggtgg acaccagttc 20700 cagcaccgaa taacctttac ccgtgcccaa attaaagacg tggtagttgg tgttattgtc 20760 gcggaagaga taggacagcg ctgcgacgtg cccttcggcc aggtccatca catggatata 20820 gtcacggacc cccgtgccgt ctttggtggg ataatcacca ccgaacacca tcagtttttc 20880 cagtttcccc atcgcgacct gcaagatgta cggcaccaag ttggagggga tgtctgccgg 20940 gctttcacca atcataccgg attcgtgggc gcccgtcgga ttaaagtagc gcaagcagag 21000 gaaattcgtg tcggagtatt tcttggcgat gtcgcggatc atcagctccg agatgtactt 21060 ggacgtacca tacggattca gcgtgccacc aatatggcag tcttcggtga cgggcatgat 21120 cttgctttcc ccatacaccg tcgccgacga gctaaagatg aagttggcga cgtcgttctt 21180 gatggcgcaa ttgatgagtt gcagggtgcc gctcacgttg ttgtcatagt agaagatggg 21240 cttgatcagg ctttctgcga ccgatttcgc acctgcaaag tgcatgatgc agtcgaattt 21300 gtgtttcttc aggatctggt tcacttcctt ctcgttgttg atattgagtt cgtagaacgt 21360 gactttcttc tttgcgatca gctcaatgcg acggatgctt tcgcagctgc tgttgatgag 21420 attgtcaatg atgacgacat tgtagccttt gttcagcagg cagagcgacg tgtggctgcc 21480 gatgtagcct gcaccgccgg tgaccaggat gttcatttat taacctcctc ggtccgaatt 21540 aacctaggtt atgaggtcag cattgcttct tcacgcgttt agtagttgtt ttgttcggtg 21600 atatattctt caatgccttc ttgcacgtct tcatggaacg acacggcgtt gtcgtcttta 21660 aacacgattg ccacatcgca gaactctttc aacgagttca gcgagtgcga caccatgagg 21720 aaggagcttt ccttatgacg ctccttgaag agttgggcac atttttcctt gaaacgggcg 21780 tcccccaccg ccgtcacctc gtccacgatg tagtaatcga acttgaacgc catgctcagg 21840 ccgaagccga ggcggctgcg cataccgctc gaataggtct tgatcggcat atcaaaatac 21900 ttccccagct ccgcgaactc ttccacaaac tcaatctttt ctttcagctc ctcctgcttc 21960 gcgtacagcc gggccacgaa cttcacgttt tcacgcccgg tcaagctgcc ctggaagccg 22020 cctgccagac ccaccggcca cgagatcgtt ttattcgtga tgattttacc gctatccggg 22080 cggtcgatgc ccccaatcat gcgcaacagc gtggatttac ccgccccatt gcgcccgatg 22140 aacgccacgc ttttgccgct ggggatctca atgttcaggt tcttgaagac atagtgacgg 22200 cccaccgggg tgcggtagct tttcgtcagg ttttcgatct taatcatgag gtcaacattg 22260 cctcctcacg cgtacggtac agggccaaac caataaacag ggtcaccagg gtgaacattg 22320 ccagataatt caggctgacc ccttcgctga tataaccggg catcacggcc tcgcggctca 22380 gttcgacgac gtgcaccagg ggattccaca gcaggtacga ccaatactgc ttcggaatgg 22440 agtgcagcgg gaacatgatg cacgaaataa agtacagcgg cttcagcaag atcggcaaga 22500 ctttctgcat ttcggggaac gtcttgccca cgaccatgaa gatcaggccc acaccgcacg 22560 acaggatgat caggaggctc caggtgagca caaattgcag gaagttggta atctcgaaat 22620 attcgcccgc catccagatg atcagcatca ggaggatgta gaccgccaca tagatcagcg 22680 tttccaagag ggcgcgtgca atgatcgtgt cgatcggctt cacgggccgg tagttaaaca 22740 gcccctgatt ggcttcgatg gcgcccacgg agcgattgct gatgctgctg aaaataaaga 22800 acgggatcag gccattgagc aggaacaccg ggaaggagat atccggcatg gtgcgatgca 22860 tgatatagcc aaagatcccg agcagaatca gcagatgtgc gctcggttcc aggatcgccc 22920 acagatagcc caggcgaaac ttgccaaagc gcgtacggat ttcgcggaga aacagtgctt 22980 cgaccgtcac tttctggact tcaaaacccg aacgtgccat ttattaacct cctggtacca 23040 atctagattg tttaaacaga tctgttacct gcaggattat tgtttctgtt gcataaagcc 23100 taaggggtag gcctttctag agatagccat tttttgcact cctgtatccg cttcttgcaa 23160 ggctggactt atccctatca aaccggacac tgcaggctga caagctttca ttacatatga 23220 agagtttgta gaaacgcaaa aaggccatcc gtcaggatgg ccttctaaga aggctcgagt 23280 ggcgcgccta agtcgaattt ctgccattca tccgcttatt atacttattc aggcgtagca 23340 ccaggcgttt aagggcacca ataactgcct taaaaaaatt acgccccgcc ctgccactca 23400 tcgcagtact gttgtaattc attaagcatt ctgccgacat ggaagccatc acagacggca 23460 tgatgaacct gaatcgccag cggcatcagc accttgtcgc cttgcgtata atatttgccc 23520 atggtgaaaa cgggggcgaa gaagttgtcc atattggcca cgtttaaatc aaaactggtg 23580 aaactcaccc agggattggc tgagacgaaa aacatattct caataaaccc tttagggaaa 23640 taggccaggt tttcaccgta acacgccaca tcttgcgaat atatgtgtag aaactgccgg 23700 aaatcgtcgt ggtattcact ccagagcgat gaaaacgttt cagtttgctc atggaaaacg 23760 gtgtaacaag ggtgaacact atcccatatc accagctcac cgtctttcat tgccatacgg 23820 aattccggat gagcattcat caggcgggca agaatgtgaa taaaggccgg ataaaacttg 23880 tgcttatttt tctttacggt ctttaaaaag gccgtaatat ccagctgaac ggtctggtta 23940 taggtacatt gagcaactga ctgaaatgcc tcaaaatgtt ctttacgatg ccattgggat 24000 atatcaacgg tggtatatcc agtgattttt ttctccattt tagcttcctt agctcctgaa 24060 aatctcgata actcaaaaaa tacgcccggt agtgatctta tttcattatg gtgaaagttg 24120 gaacctctta cgtgccgatc aacgtctcat tttcgccaaa agttggccca gggcttcccg 24180 gtatcaacag ggacaccagg atttatttat tctgcgaagt gatcttccgt cacaggtatt 24240 tattcggcgc aaagggcctc gtgatacgcc tatttttata ggttaatgtc atgataataa 24300 tggtttctta gacgtcaggt ggcacttttc ggggaaatgt gcgcgcccgc gttcctgctg 24360 gcgctgggcc tgtttctggc gctggacttc ccgctgttcc gtcagcagct tttcgcccac 24420 ggccttgatg atcgcggcgg ccttggcctg catatcccga ttcaacggcc ccagggcgtc 24480 cagaacgggc ttcaggcgct cccgaaggt 24509 <210> 42 <211> 14996 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 42 ctcgggccgt ctcttgggct tgatcggcct tcttgcgcat ctcacgcgct cctgcggcgg 60 cctgtagggc aggctcatac ccctgccgaa ccgcttttgt cagccggtcg gccacggctt 120 ccggcgtctc aacgcgcttt gagattccca gcttttcggc caatccctgc ggtgcatagg 180 cgcgtggctc gaccgcttgc gggctgatgg tgacgtggcc cactggtggc cgctccaggg 240 cctcgtagaa cgcctgaatg cgcgtgtgac gtgccttgct gccctcgatg ccccgttgca 300 gccctagatc ggccacagcg gccgcaaacg tggtctggtc gcgggtcatc tgcgctttgt 360 tgccgatgaa ctccttggcc gacagcctgc cgtcctgcgt cagcggcacc acgaacgcgg 420 tcatgtgcgg gctggtttcg tcacggtgga tgctggccgt cacgatgcga tccgccccgt 480 acttgtccgc cagccacttg tgcgccttct cgaagaacgc cgcctgctgt tcttggctgg 540 ccgacttcca ccattccggg ctggccgtca tgacgtactc gaccgccaac acagcgtcct 600 tgcgccgctt ctctggcagc aactcgcgca gtcggcccat cgcttcatcg gtgctgctgg 660 ccgcccagtg ctcgttctct ggcgtcctgc tggcgtcagc gttgggcgtc tcgcgctcgc 720 ggtaggcgtg cttgagactg gccgccacgt tgcccatttt cgccagcttc ttgcatcgca 780 tgatcgcgta tgccgccatg cctgcccctc ccttttggtg tccaaccggc tcgacggggg 840 cagcgcaagg cggtgcctcc ggcgggccac tcaatgcttg agtatactca ctagactttg 900 cttcgcaaag tcgtgaccgc ctacggcggc tgcggcgccc tacgggcttg ctctccgggc 960 ttcgccctgc gcggtcgctg cgctcccttg ccagcccgtg gatatgtgga cgatggccgc 1020 gagcggccac cggctggctc gcttcgctcg gcccgtggac aaccctgctg gacaagctga 1080 tggacaggct gcgcctgccc acgagcttga ccacagggat tgcccaccgg ctacccagcc 1140 ttcgaccaca tacccaccgg ctccaactgc gcggcctgcg gccttgcccc atcaattttt 1200 ttaattttct ctggggaaaa gcctccggcc tgcggcctgc gcgcttcgct tgccggttgg 1260 acaccaagtg gaaggcgggt caaggctcgc gcagcgaccg cgcagcggct tggccttgac 1320 gcgcctggaa cgacccaagc ctatgcgagt gggggcagtc gaaggcgaag cccgcccgcc 1380 tgccccccga gacctgcaga tccacatcct tgaaggccgc agcgacgagc agaaggaaac 1440 cctcattcgg gaagtcagcg aggccatctc gcgctccctg gatgcgccgc tgaccagcgt 1500 gcgagtgatt atcacggaga tggccaaggg ccacttcggc atcggcggcg aactggccag 1560 caaggtcaga cgctgaagtg gagatgccca agggcacttc gggtcgagga acccgacctg 1620 cattgggacg cggccacgga gagcgcgggc aaacgccggc actatagcca gtggagtttg 1680 taaaacgcta tttcagagct tggagagtgt ctaagaaagc cggggcgatg ccaacccatc 1740 ccttcttcgg ctatgcatcg ttcgtaatca agccacttcc tttttgcatt gacgcagggt 1800 gtcggaaggc aactcgccga acgcgctcct atagttttca gcgaagcgtc ccaaatgtaa 1860 gaagccgtag tctagggcta tctcagttat actacgcaca ttggcactgg gatcgttcaa 1920 gcaggcgcgg atgctttcga gcttgcggtt gcggatgtag ttcttcggcg tggtgccggc 1980 atgcttctcg aacaaattgt agagcgagcg tggactcatc atcgccagct ccgctaaccg 2040 ctcaaggctg atattccgtt tgagattctc ctcaatgaat tgaacgactc gctcgaaaga 2100 cgggttacct ttgctgaaaa tttcacggct gacattgctg cccagcattt cgagcagctt 2160 ggaagcgatg atccccgcat agtgctcttg gacccgaggc atcgactttg tatgttccgc 2220 ttcgtcacaa actaacccga gtagattgat aaagccatcg agttgctgga gattgtgtcg 2280 cgcggcgaaa cggataccct ccctcggctt gtgccaattg ttgtcactgc atgcccgatc 2340 aaggaccact gagggcaatt taacgataaa tttctcgcaa tcttctgaat aggtcaggtc 2400 ggcttggtca tccggattga gcagcaatag ttcgcccggc gcaaaatagt gctcctggcc 2460 atggccacgc cacaggcaat ggcctttgag tattatttgc agatgataac aggtctctaa 2520 tccaggcgag attaccctca cgctaccgcc gtagctgatt cgacacaggt cgaggcatcc 2580 gaagattctg tggtgcagcc tgcctgccgg gcgcccgccc ttgggcaggc gaatagagtg 2640 cgtaccgaca tactggttaa cataatcgga gactgcatag ggctcggcgt ggacgaagat 2700 ctgacttttc tcgttcaata agcaaaaatc catagttcac ggttctctta ttttaatgtg 2760 ggctgcttgg tgtgatgtag aaaggcgcca agtcgatgaa aatgcatctc gacgtgatgc 2820 gtatacgggt tacccccatt gccacgttgc gccatccttt ttgcaatcag tgaccacttt 2880 tccaagcaaa aataacgcca agcagaacga agacgttctt tttaagaagc gagaacacca 2940 gaagttcgtg ctgtcggggc atgcggcgac gaattggcgg ataaagggga tctgcaggtc 3000 ccgagcctca cggcggcgag tgcgggggtt ccaagggggc agcgccacct tgggcaaggc 3060 cgaaggccgc gcagtcgatc aacaagcccc ggaggggcca ctttttgccg gagggggagc 3120 cgcgccgaag gcgtggggga accccgcagg ggtgcccttc tttgggcacc aaagaactag 3180 atatagggcg aaatgcgaaa gacttaaaaa tcaacaactt aaaaaagggg ggtacgcaac 3240 agctcattgc ggcacccccc gcaatagctc attgcgtagg ttaaagaaaa tctgtaattg 3300 actgccactt ttacgcaacg cataattgtt gtcgcgctgc cgaaaagttg cagctgattg 3360 cgcatggtgc cgcaaccgtg cggcacccta ccgcatggag ataagcatgg ccacgcagtc 3420 cagagaaatc ggcattcaag ccaagaacaa gcccggtcac tgggtgcaaa cggaacgcaa 3480 agcgcatgag gcgtgggccg ggcttattgc gaggaaaccc acggcggcaa tgctgctgca 3540 tcacctcgtg gcgcagatgg gccaccagaa cgccgtggtg gtcagccaga agacactttc 3600 caagctcatc ggacgttctt tgcggacggt ccaatacgca gtcaaggact tggtggccga 3660 gcgctggatc tccgtcgtga agctcaacgg ccccggcacc gtgtcggcct acgtggtcaa 3720 tgaccgcgtg gcgtggggcc agccccgcga ccagttgcgc ctgtcggtgt tcagtgccgc 3780 cgtggtggtt gatcacgacg accaggacga atcgctgttg gggcatggcg acctgcgccg 3840 catcccgacc ctgtatccgg gcgagcagca actaccgacc ggccccggcg aggagccgcc 3900 cagccagccc ggcattccgg gcatggaacc agacctgcca gccttgaccg aaacggagga 3960 atgggaacgg cgcgggcagc agcgcctgcc gatgcccgat gagccgtgtt ttctggacga 4020 tggcgagccg ttggagccgc cgacacgggt cacgctgccg cgccggtagc acttgggttg 4080 cgcagcaacc cgtaagtgcg ctgttccaga ctatcggctg tagccgcctc gccgccctat 4140 accttgtctg cctccccgcg ttgcgtcgcg gtgcatggag ccgggccacc tcgacctgaa 4200 tggaagccgg cggcacctcg ctaacggatt caccgttttt atcaggctct gggaggcaga 4260 ataaatgatc atatcgtcaa ttattacctc cacggggaga gcctgagcaa actggcctca 4320 ggcatttgag aagcacacgg tcacactgct tccggtagtc aataaaccgg taaaccagca 4380 atagacataa gcggctattt aacgaccctg ccctgaaccg acgaccgggt cgaatttgct 4440 ttcgactatc ggcgcgccag agctcatcgt taatgtcttc gtgcgccgtc agtcggcgca 4500 cgttttttct ctctggtacc gtgtcactga tctagtcaat tactcgaagt atccacaagt 4560 gaagcatact aagtaatgta caagaatcaa aaaaatcggc tacgcaagtc gcgtagccga 4620 atcatttaag gatccttcca ttcaggtcga ggtggcccgg ctccatgcac cgcgacgcaa 4680 cgcggggagg cagacaaggt atagggcggc gcctacaatc catgccaacc cgttccatgt 4740 gctcgccgag gcggcataaa tcgccgtgac gatcagcggt ccagtgatcg aagttaggct 4800 ggtaagagcc gcgagcgatc cttgaagctg tccctgatgg tcgtcatcta cctgcctgga 4860 cagcatggcc tgcaacgcgg gcatcccgat gccgccggaa gcgagaagaa tcataatggg 4920 gaaggccatc cagcctcgcg tcgcgaacgc cagcaagacg tagcccagcg cgtcggccgc 4980 catgccggcg ataatggcct gcttctcgcc gaaacgtttg gtggcgggac cagtgacgaa 5040 ggcttgagcg agggcgtgca agattccgaa taccgcaagc gacaggccga tcatcgtcgc 5100 gctccagcga aagcggtcct cgccgaaaat gacccagagc gctgccggca cctgtcctac 5160 gagttgcatg ataaagaaga cagtcataag tgcggcgacg atagtcatgc cccgcgccca 5220 ccggaaggag ctgactgggt tgaaggctct caagggcatc ggtcgacgct ctcccttatg 5280 cgactcctgc attaggaagc agcccagtag taggttgagg ccgttgagca ccgccgccgc 5340 aaggaatggt gcatgcaagg agatggcgcc caacagtccc ccggccacgg ggcctgccac 5400 catacccacg ccgaaacaag cgctcatgag cccgaagtgg cgagcccgat cttccccatc 5460 ggtgatgtcg gcgatatagg cgccagcaac cgcacctgtg gcgccggtga tgccggccac 5520 gatgcgtccg gcgtacaaga tccacaggac gggtgtggtc gccatgatcg cgtagtcgat 5580 agtggctcca agtagcgaag cgagcaggac tgggcggcgg ccaaagcggt cggacagtgc 5640 tccgagaacg ggtgcgcata gaaattgcat caacgcatat agcgctagca gcacgccata 5700 gtgactggcg atgctgtcgg aatggacgat atcccgcaag aggcccggca gtaccggcat 5760 aaccaagcct atgcctacag catccagggt gacggtgccg aggatgacga tgagcgcatt 5820 gttagatttc atacacggtg cctgactgcg ttagcaattt aactgtgata aactaccgca 5880 ttaaagccga gcgatgataa gctgtcaaac atgagatccg ataaatcgat tgatagattt 5940 aaataagaac tgcagaagct agcttagatg ctcgtgaaat tgacgtgggc gctttgcagg 6000 gccgtcttaa tggcgttggt gtccacgagg atcgagtcgg gtgcggaaaa cggacggttc 6060 ttgttggtga aatcgctgtt accaatgtac agcgattcct tgttacgcag cgcctggatg 6120 tgccagcggg accacgaatc ccaatacttc tggcgatccg gcgagatacc ttggctggtg 6180 tagccggtcg tcgggctgtt catcaacgag tcggtgcggt gcgagcccag cgtcagcggc 6240 aacttgatcc gatgcaccgt ggaatcgccg aagatcagct tcagacgcgc gataaattcg 6300 ctatccgcac ccgttttcac acaatcccag acaccggcct tctgcaagac gtcggcacgg 6360 cgaaacagga gcgacgacgg attcagacgc ttcaaggggt acactgcgcg ggcatagaaa 6420 ataccgttgt cttgcaggcg cacccagtcc gagatggagc agatgagctt cggattgagc 6480 aacaaggggg agatttggcg gaacagcttt tccggatggc tccagtcatc cgaatcgtgg 6540 caggtgacga actcgccctt cgcttggatc aagccgatac gcttcgcggc ataggtgccg 6600 acattctgcg gcaggctaat gatcttgatg cgcgtgtctt tgagggcgag ccgctggaga 6660 cgaaacaggg tgtcatcggt gctcgcgtca tccacaatga tcagctcgaa ggaacggtag 6720 gtctgattga ggagcgaaat caccgcattt tccacgcggc gacccgtatt ataggtggtc 6780 atcaggatgg agatcaacgg ccccgtctgg gccgggtacg ggatgctggt gatgatgttg 6840 cacggggaga gcggggagct gttgtccgtc aaggccacgg ggctgaggcc gaagtattta 6900 tagtattcat tcagccgatt caggctaatt tcggcggttt cgcggaaggc gttattttgc 6960 agcagcagga tatccgggct atagacgata tcggatgcgt cgatctgggc gagggtcgag 7020 atggcctttt gggtcaggcc gatccggagt tgcagtgcgg tatacaggtc cagcgggcag 7080 ttgtccacgt tgtccaacag gctcaggcta aaggtcggcg agtaggacgc cagggttttc 7140 gccagttcca ctttctgatg ggtatcggtg aactcgtcct tgaactccat cagcagctcg 7200 ggcgtcaggc tgatgtcgcc gcaggcgatt tttgcgatct tgattgccag tttgcagcgc 7260 caatcggacg gggtatccgt caagttatgc agcgaccagt acatattcag acgatacatc 7320 gcgaggatgc gtttcgactg ccagaaccgg caatcatcct ggatggccgc gagcgcgtgg 7380 acgtagcggc tctttttgag cagccacaag aatttgagat tattgaacat ttattaacct 7440 cctgctagca acttaagtta cgaatcgacg ccgaacaggt cgcgggtgta gactttctcc 7500 gagacatctt ccagttcgct ggtgcggcga ttcgccacaa tgacatcgac gcgctcctta 7560 aaggaattga tgtcgcgctc gacgtaggaa ccgaagaagt agggttcttt caggaccggc 7620 tcgtacacca caatctcgat acccttggcc ttcaaacgtt tcatgacccc ctggatgctg 7680 ctggcccgga aattgtcgct acccgccttc atgatcaggc gatagatacc gaccactttg 7740 ggcttacggg acaggatgtc ctcggccacg aagtccttac gggtcgtatt cgcatccacg 7800 atggcctgga tcaggttttg cgggacgtcg cgataattgg ccaacagctg cttcgtatcc 7860 ttcggcagac agtaaccgcc gtagccgaag gacgggttgt tgtaatgttg accaatgcgc 7920 ggatcgaggg agacgccttc gatgatttgt ttggtatcca ggccgtgcac gctcgcgtag 7980 gtgtccagct cgttaaagta cgcgatacgc atcgccagat acgtgttcgc gaacagtttg 8040 atggcttctg cctcgggcga atccgtcagc aggatcggaa tatccttttt gatggcacct 8100 tccgacagga gttcggcgaa cttccgtgcg cgttccgacg attcgcccac gacaatgcgg 8160 ctcggataga gattatcata cagggctttg ccttcgcgca ggaactccgg ggaaaagatg 8220 atattattcg tgttcagatc gcgcttcagg cgttcggtga acccgacggg gacggtggat 8280 ttgataatga tggtcgcgtt cgggttaatg gacagcacgt cacacgcgac gctttcgacg 8340 ctcagggtat caaagttgtt attaatcgga tcatagttcg tcggggtggc gatgatcacg 8400 tagtctgcat cgcgatatgc ctcgtatttt tccgtcgtcg cgtagaggtt cagcttacga 8460 ttggagagaa acttctggat ttccgggtcg caaatcggcg agattttctt gttaatgagc 8520 tggaccttct tcgggtcgat gtccagggcg atgatgtcgt gtttttggga gaggaggatc 8580 gcaatgctga tacccacata gccgacgccg gccacggcaa ttttcattta ttaacctcct 8640 taagtgaatt caaactagtt tacaagtcgt tttcgatctt ctcccaggta tatttgcgac 8700 attcattcaa gttggtcagc ggcgagtatt tgtacttttt gataccgagg cgcgacaggc 8760 tttcgttcac caccttgaaa tggttttcct tttggatgtc cagtttcttg atcgacgtgt 8820 tctcgccgtg caggacacgg ttgtagcaaa tcttattgat atgcttaaac gggccgactt 8880 cgctgagttt caaatacata tcgtaatcca ccgcattgct gatgctctcg ttgaagcctt 8940 cggtgaggtt ccatgcacgc gccgtgaaca tacggaagtg gtggcagatc atcgcgctcg 9000 tgagcttttc gcggctgtaa atcggccagt tgtagccatt gctaatcaag ttaccttcac 9060 gatcaatatt gcgattggtg gtgtacacgc aggcgaggct caggtctttg cgaaattcat 9120 ccagacacag ttccacggca tcgggctcca ggaaatcatc ggaatccagc tgcccgatgt 9180 agaaaccccg gcacaggcgg actgcggtat tcgaggcgga gccgatgcct ttgtttttct 9240 ggctgatgaa acggacgcgc gggtggtttg cgtaatgttc ttgcaggatg cgcagcgtat 9300 catcggtgct cccgtcatcg cagatgcaga cctccagatc ggtgatcgtt tggttcagtg 9360 ccgattcgac gcagcgcacg atatatttgc tgcaattata cgcggggatg tagatgctca 9420 ccaggggcac acgtttcagg gtggcgctct cgattttctc cttcttgcga taaaagtagg 9480 gcaccttctg ctgcaacagc tggacggtaa tgtttttacc tgccgcgcga tcggtttcgt 9540 tctccttacc gggcggttcc tgatgatatg ccatcgcgcc ttccacgcta cggaaataac 9600 aaccctcgcg gtacagccga tagccgaact cattatcctc accgccccaa tgcgtgaact 9660 cttcgtcaaa ccaacccgcg cgaaacagcc acttctttgc aaacgccaca ttgccaccgc 9720 taaagaaccg gaacggggtg ttgcacaggc gcagattgtc ggtattcttg aaatgttcga 9780 tgcgccaatc gacggatttg ttctgctcga ccttgcctgc gacctgatta ttggtaataa 9840 tctccgggat ttcattgatc aggcttttct gggacaaaaa gtccagatag gtatgcttcg 9900 acgtgtcgat gtatttacgc gggccaatca gtgccacgtt atcatccacg gccaggagtt 9960 ccatatagga ctgcacccac aacgggttcg gcgccatatc gcagtccaag atcgccacgt 10020 agttgtattt cgctgcccgc aggcccaggt tccgcacggc gcacagctgg tagccgtagt 10080 ctttctggcg gacgtatttg atgttcagca acgactcgaa ctcgcggacg atctcttcga 10140 tgttttcctt ggaaccgtca tccgcgacga tgacctcata gtcataaatc gttttctgat 10200 tgcagaggca ggccagggtg atcgccagga ttttggcgcg attgtacgtc ggaatcacga 10260 tggacaggcc gtcgatgatc agttgcttgc gcggataatc atccagttct ttacgtttcc 10320 ctgcccagac gtagtcgttc gtgctttccg gcagcggcgg caaggtcagg tcgctcggcc 10380 aatccagcgg aatgggttcg acttctttca attcggcgcg ctcggatttc tttgcggtaa 10440 tttcccgata tttgctaatg atttcattct tttccacctc attcagcgag atcgcctttg 10500 cattgctgca cataattttg gttgccgcgt cgatatcaat gaccgctttc cgattcagct 10560 tgtccacttc ttcgctcaga ttcagggcgg tttggcacag cttgatattg gcttccaccc 10620 agctcacatc atagatttcc gccacttttt caaacaggga gagggcttgg cggtagttct 10680 tattcttata cagattgatt gcctggttca aaatgctcat ttattaacct cctactagtg 10740 aattttcgaa ttacttaccg cagtacttga cacccacctg ggaattgttt ttggtgcgtt 10800 tgaattggcg gatggtacgg tagatgctaa agggcaggct gatcagaccg agcggaaaat 10860 tgttcttatt gatgatgagc ttgcccagct gatagctcag gtgtttcttg acccgttcgg 10920 cttcgtgttt atccgcgtac aggaagatgc tcggcaggct cacttggtac tccgaatcat 10980 atttcttctt ccaggtccgc cattcgctga tcaacgcaaa cggaatcgag atcagaccga 11040 ggaacgtctt ggagcggctc accatcaccg cacccaggcg gtagccgata tcttgcttga 11100 tgcgttcggc cgcaccatac agctccggca gttgtttctt ttcgagacgt tgattgtcga 11160 tgaagtactg ttcgagcttt tgctgcacca gatgcagctg attgagcagc aattcttttt 11220 cgcacgacag cttttcgagg cgctgttgtt gcagttcatt tttgttctgt tcctttttca 11280 gcagggactc gaagttctcg atcgcgcact ccagttcctg gacctggatg gttttgtttt 11340 taatgatcag atcatactgg atcagttctt ccttgctatc cgacagctct ttcagaatgg 11400 cttgataggc gttcagctgt ttggacgtgt gcagttcgtt gtccagaatg atctttttgc 11460 tgctctggta cagaccgttc acgatatcga gggtgatctg gcgttgttta atgaacgtct 11520 cccaaataaa ggacggctta tagttttcct tctccagcac ccgcaagggg gtgttggcgt 11580 tcgattgcaa ttcaaagtac agttccttgc aatcgggata gtcgttcagg acgttgaaga 11640 tcaagtactc ctccgtctcg ctttgcttga aaatgatatc cccggtcccg atgtcaatac 11700 cgctgaggga catgatctcc tgatgttctt tttccagcgt aatggaggct tcggcggtct 11760 taaagtcatt cacgctctgc tccagcgagt ggttgatggt attggagaac gacaacccga 11820 atttcagttt cagtttgtgt tgcagttgct ggatgcagtc ctcggcgttg cgcttcacct 11880 gttcgctcga caccagcagg caccgacccc ggttgttgag gaagaagtgc agcaaggcgg 11940 tgttgtatgc cagccagttt ttgatcagat gctccgaggt atagttgctg gagatgttct 12000 ggtccgagaa gtagttcgtc aggatgcttt tggggtggtc gtagatgagg ataaaggtga 12060 tgttctcatc caccgatttc caatattcca acgtgtgaat tgcgttgggg tcgctccaac 12120 cgcacagttt ctggttcagg ttggacagca tcagatccaa tgcgataccg ttccagacgg 12180 tgctcacatg gagcggttca aagtcggcgg aatcggtcac cgtatagatg tccggcgact 12240 ggtacgcctt ccgcagcgtc tgggtgatgt cctggggcga gaggttctca cgtttggacg 12300 ggcacaggga gttcatgccg cgctgatgca ggagttcttc cacgatttgg tagttgctgc 12360 tcggatggcc cacgatcacc aggcggttca tttattaacc tcctttcgaa aatgaacggt 12420 ccgttaaata tagccattcg gattcttcat ctgccagcgc caggcgtcct ccagcatggt 12480 ttcgagttcc cgcttggctt tccagttcag atatttgttg gccttttcgg gggaggacca 12540 gctctccgcg atatcaccgt cacggcggct cacgatttca tacggaatcc gcacgccgga 12600 aatcttttca aaggtggaca ccagttccag caccgaataa cctttacccg tgcccaaatt 12660 aaagacgtgg tagttggtgt tattgtcgcg gaagagatag gacagcgctg cgacgtgccc 12720 ttcggccagg tccatcacat ggatatagtc acggaccccc gtgccgtctt tggtgggata 12780 atcaccaccg aacaccatca gtttttccag tttccccatc gcgacctgca agatgtacgg 12840 caccaagttg gaggggatgt ctgccgggct ttcaccaatc ataccggatt cgtgggcgcc 12900 cgtcggatta aagtagcgca agcagaggaa attcgtgtcg gagtatttct tggcgatgtc 12960 gcggatcatc agctccgaga tgtacttgga cgtaccatac ggattcagcg tgccaccaat 13020 atggcagtct tcggtgacgg gcatgatctt gctttcccca tacaccgtcg ccgacgagct 13080 aaagatgaag ttggcgacgt cgttcttgat ggcgcaattg atgagttgca gggtgccgct 13140 cacgttgttg tcatagtaga agatgggctt gatcaggctt tctgcgaccg atttcgcacc 13200 tgcaaagtgc atgatgcagt cgaatttgtg tttcttcagg atctggttca cttccttctc 13260 gttgttgata ttgagttcgt agaacgtgac tttcttcttt gcgatcagct caatgcgacg 13320 gatgctttcg cagctgctgt tgatgagatt gtcaatgatg acgacattgt agcctttgtt 13380 cagcaggcag agcgacgtgt ggctgccgat gtagcctgca ccgccggtga ccaggatgtt 13440 catttattaa cctcctcggt ccgaattaac ctaggttatg aggtcagcat tgcttcttca 13500 cgcggtgtta attaagtaat cgatagtgat ttaaatatgc aagatctagt tacctgcagg 13560 attattgttt ctgttgcata aagcctaagg ggtaggcctt tctagagata gccatttttt 13620 gcactcctgt atccgcttct tgcaaggctg gacttatccc tatcaaaccg gacactgcag 13680 gctgacaagc tttcattaca tatgaagagt ttgtagaaac gcaaaaaggc catccgtcag 13740 gatggccttc taagaaggct cgagtggcgc gcctaagtcg aatttctgcc attcatccgc 13800 ttattatcac ttattcaggc gtagcaacca ggcgtttaag ggcaccaata actgccttaa 13860 aaaaattacg ccccgccctg ccactcatcg cagtactgtt gtaattcatt aagcattctg 13920 ccgacatgga agccatcaca aacggcatga tgaacctgaa tcgccagcgg catcagcacc 13980 ttgtcgcctt gcgtataata tttgcccatg gtgaaaacgg gggcgaagaa gttgtccata 14040 ttggccacgt ttaaatcaaa actggtgaaa ctcacccagg gattggctga gacgaaaaac 14100 atattctcaa taaacccttt agggaaatag gccaggtttt caccgtaaca cgccacatct 14160 tgcgaatata tgtgtagaaa ctgccggaaa tcgtcgtggt attcactcca gagcgatgaa 14220 aacgtttcag tttgctcatg gaaaacggtg taacaagggt gaacactatc ccatatcacc 14280 agctcaccgt ctttcattgc catacggaat tccggatgag cattcatcag gcgggcaaga 14340 atgtgaataa aggccggata aaacttgtgc ttatttttct ttacggtctt taaaaaggcc 14400 gtaatatcca gctgaacggt ctggttatag gtacattgag caactgactg aaatgcctca 14460 aaatgttctt tacgatgcca ttgggatata tcaacggtgg tatatccagt gatttttttc 14520 tccattttag cttccttagc tcctgaaaat ctcgataact caaaaaatac gcccggtagt 14580 gatcttattt cattatggtg aaagttggaa cctcttacgt gccgatcaac gtctcatttt 14640 cgccaaaagt tggcccaggg cttcccggta tcaacaggga caccaggatt tatttattct 14700 gcgaagtgat cttccgtcac aggtatttat tcggcgcaaa gggcctcgtg atacgcctat 14760 ttttataggt taatgtcatg ataataatgg tttcttagac gtcaggtggc acttttcggg 14820 gaaatgtgcg cgcccgcgtt cctgctggcg ctgggcctgt ttctggcgct ggacttcccg 14880 ctgttccgtc agcagctttt cgcccacggc cttgatgatc gcggcggcct tggcctgcat 14940 atcccgattc aacggcccca gggcgtccag aacgggcttc aggcgctccc gaaggt 14996 <210> 43 <211> 13336 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 43 ctcgggccgt ctcttgggct tgatcggcct tcttgcgcat ctcacgcgct cctgcggcgg 60 cctgtagggc aggctcatac ccctgccgaa ccgcttttgt cagccggtcg gccacggctt 120 ccggcgtctc aacgcgcttt gagattccca gcttttcggc caatccctgc ggtgcatagg 180 cgcgtggctc gaccgcttgc gggctgatgg tgacgtggcc cactggtggc cgctccaggg 240 cctcgtagaa cgcctgaatg cgcgtgtgac gtgccttgct gccctcgatg ccccgttgca 300 gccctagatc ggccacagcg gccgcaaacg tggtctggtc gcgggtcatc tgcgctttgt 360 tgccgatgaa ctccttggcc gacagcctgc cgtcctgcgt cagcggcacc acgaacgcgg 420 tcatgtgcgg gctggtttcg tcacggtgga tgctggccgt cacgatgcga tccgccccgt 480 acttgtccgc cagccacttg tgcgccttct cgaagaacgc cgcctgctgt tcttggctgg 540 ccgacttcca ccattccggg ctggccgtca tgacgtactc gaccgccaac acagcgtcct 600 tgcgccgctt ctctggcagc aactcgcgca gtcggcccat cgcttcatcg gtgctgctgg 660 ccgcccagtg ctcgttctct ggcgtcctgc tggcgtcagc gttgggcgtc tcgcgctcgc 720 ggtaggcgtg cttgagactg gccgccacgt tgcccatttt cgccagcttc ttgcatcgca 780 tgatcgcgta tgccgccatg cctgcccctc ccttttggtg tccaaccggc tcgacggggg 840 cagcgcaagg cggtgcctcc ggcgggccac tcaatgcttg agtatactca ctagactttg 900 cttcgcaaag tcgtgaccgc ctacggcggc tgcggcgccc tacgggcttg ctctccgggc 960 ttcgccctgc gcggtcgctg cgctcccttg ccagcccgtg gatatgtgga cgatggccgc 1020 gagcggccac cggctggctc gcttcgctcg gcccgtggac aaccctgctg gacaagctga 1080 tggacaggct gcgcctgccc acgagcttga ccacagggat tgcccaccgg ctacccagcc 1140 ttcgaccaca tacccaccgg ctccaactgc gcggcctgcg gccttgcccc atcaattttt 1200 ttaattttct ctggggaaaa gcctccggcc tgcggcctgc gcgcttcgct tgccggttgg 1260 acaccaagtg gaaggcgggt caaggctcgc gcagcgaccg cgcagcggct tggccttgac 1320 gcgcctggaa cgacccaagc ctatgcgagt gggggcagtc gaaggcgaag cccgcccgcc 1380 tgccccccga gacctgcaga tccacatcct tgaaggccgc agcgacgagc agaaggaaac 1440 cctcattcgg gaagtcagcg aggccatctc gcgctccctg gatgcgccgc tgaccagcgt 1500 gcgagtgatt atcacggaga tggccaaggg ccacttcggc atcggcggcg aactggccag 1560 caaggtcaga cgctgaagtg gagatgccca agggcacttc gggtcgagga acccgacctg 1620 cattgggacg cggccacgga gagcgcgggc aaacgccggc actatagcca gtggagtttg 1680 taaaacgcta tttcagagct tggagagtgt ctaagaaagc cggggcgatg ccaacccatc 1740 ccttcttcgg ctatgcatcg ttcgtaatca agccacttcc tttttgcatt gacgcagggt 1800 gtcggaaggc aactcgccga acgcgctcct atagttttca gcgaagcgtc ccaaatgtaa 1860 gaagccgtag tctagggcta tctcagttat actacgcaca ttggcactgg gatcgttcaa 1920 gcaggcgcgg atgctttcga gcttgcggtt gcggatgtag ttcttcggcg tggtgccggc 1980 atgcttctcg aacaaattgt agagcgagcg tggactcatc atcgccagct ccgctaaccg 2040 ctcaaggctg atattccgtt tgagattctc ctcaatgaat tgaacgactc gctcgaaaga 2100 cgggttacct ttgctgaaaa tttcacggct gacattgctg cccagcattt cgagcagctt 2160 ggaagcgatg atccccgcat agtgctcttg gacccgaggc atcgactttg tatgttccgc 2220 ttcgtcacaa actaacccga gtagattgat aaagccatcg agttgctgga gattgtgtcg 2280 cgcggcgaaa cggataccct ccctcggctt gtgccaattg ttgtcactgc atgcccgatc 2340 aaggaccact gagggcaatt taacgataaa tttctcgcaa tcttctgaat aggtcaggtc 2400 ggcttggtca tccggattga gcagcaatag ttcgcccggc gcaaaatagt gctcctggcc 2460 atggccacgc cacaggcaat ggcctttgag tattatttgc agatgataac aggtctctaa 2520 tccaggcgag attaccctca cgctaccgcc gtagctgatt cgacacaggt cgaggcatcc 2580 gaagattctg tggtgcagcc tgcctgccgg gcgcccgccc ttgggcaggc gaatagagtg 2640 cgtaccgaca tactggttaa cataatcgga gactgcatag ggctcggcgt ggacgaagat 2700 ctgacttttc tcgttcaata agcaaaaatc catagttcac ggttctctta ttttaatgtg 2760 ggctgcttgg tgtgatgtag aaaggcgcca agtcgatgaa aatgcatctc gacgtgatgc 2820 gtatacgggt tacccccatt gccacgttgc gccatccttt ttgcaatcag tgaccacttt 2880 tccaagcaaa aataacgcca agcagaacga agacgttctt tttaagaagc gagaacacca 2940 gaagttcgtg ctgtcggggc atgcggcgac gaattggcgg ataaagggga tctgcaggtc 3000 ccgagcctca cggcggcgag tgcgggggtt ccaagggggc agcgccacct tgggcaaggc 3060 cgaaggccgc gcagtcgatc aacaagcccc ggaggggcca ctttttgccg gagggggagc 3120 cgcgccgaag gcgtggggga accccgcagg ggtgcccttc tttgggcacc aaagaactag 3180 atatagggcg aaatgcgaaa gacttaaaaa tcaacaactt aaaaaagggg ggtacgcaac 3240 agctcattgc ggcacccccc gcaatagctc attgcgtagg ttaaagaaaa tctgtaattg 3300 actgccactt ttacgcaacg cataattgtt gtcgcgctgc cgaaaagttg cagctgattg 3360 cgcatggtgc cgcaaccgtg cggcacccta ccgcatggag ataagcatgg ccacgcagtc 3420 cagagaaatc ggcattcaag ccaagaacaa gcccggtcac tgggtgcaaa cggaacgcaa 3480 agcgcatgag gcgtgggccg ggcttattgc gaggaaaccc acggcggcaa tgctgctgca 3540 tcacctcgtg gcgcagatgg gccaccagaa cgccgtggtg gtcagccaga agacactttc 3600 caagctcatc ggacgttctt tgcggacggt ccaatacgca gtcaaggact tggtggccga 3660 gcgctggatc tccgtcgtga agctcaacgg ccccggcacc gtgtcggcct acgtggtcaa 3720 tgaccgcgtg gcgtggggcc agccccgcga ccagttgcgc ctgtcggtgt tcagtgccgc 3780 cgtggtggtt gatcacgacg accaggacga atcgctgttg gggcatggcg acctgcgccg 3840 catcccgacc ctgtatccgg gcgagcagca actaccgacc ggccccggcg aggagccgcc 3900 cagccagccc ggcattccgg gcatggaacc agacctgcca gccttgaccg aaacggagga 3960 atgggaacgg cgcgggcagc agcgcctgcc gatgcccgat gagccgtgtt ttctggacga 4020 tggcgagccg ttggagccgc cgacacgggt cacgctgccg cgccggtagc acttgggttg 4080 cgcagcaacc cgtaagtgcg ctgttccaga ctatcggctg tagccgcctc gccgccctat 4140 accttgtctg cctccccgcg ttgcgtcgcg gtgcatggag ccgggccacc tcgacctgaa 4200 tggaagccgg cggcacctcg ctaacggatt caccgttttt atcaggctct gggaggcaga 4260 ataaatgatc atatcgtcaa ttattacctc cacggggaga gcctgagcaa actggcctca 4320 ggcatttgag aagcacacgg tcacactgct tccggtagtc aataaaccgg taaaccagca 4380 atagacataa gcggctattt aacgaccctg ccctgaaccg acgaccgggt cgaatttgct 4440 ttcgactatc ggcgcgccag agctcatcgt taatgtcttc gtgcgccgtc agtcggcgca 4500 cgttttttct ctctggtacc gtgtcactga tctagtcaat tactcgaagt atccacaagt 4560 gaagcatact aagtaatgta caagaatcaa aaaaatcggc tacgcaagtc gcgtagccga 4620 atcatttaag gatccttcca ttcaggtcga ggtggcccgg ctccatgcac cgcgacgcaa 4680 cgcggggagg cagacaaggt atagggcggc gcctacaatc catgccaacc cgttccatgt 4740 gctcgccgag gcggcataaa tcgccgtgac gatcagcggt ccagtgatcg aagttaggct 4800 ggtaagagcc gcgagcgatc cttgaagctg tccctgatgg tcgtcatcta cctgcctgga 4860 cagcatggcc tgcaacgcgg gcatcccgat gccgccggaa gcgagaagaa tcataatggg 4920 gaaggccatc cagcctcgcg tcgcgaacgc cagcaagacg tagcccagcg cgtcggccgc 4980 catgccggcg ataatggcct gcttctcgcc gaaacgtttg gtggcgggac cagtgacgaa 5040 ggcttgagcg agggcgtgca agattccgaa taccgcaagc gacaggccga tcatcgtcgc 5100 gctccagcga aagcggtcct cgccgaaaat gacccagagc gctgccggca cctgtcctac 5160 gagttgcatg ataaagaaga cagtcataag tgcggcgacg atagtcatgc cccgcgccca 5220 ccggaaggag ctgactgggt tgaaggctct caagggcatc ggtcgacgct ctcccttatg 5280 cgactcctgc attaggaagc agcccagtag taggttgagg ccgttgagca ccgccgccgc 5340 aaggaatggt gcatgcaagg agatggcgcc caacagtccc ccggccacgg ggcctgccac 5400 catacccacg ccgaaacaag cgctcatgag cccgaagtgg cgagcccgat cttccccatc 5460 ggtgatgtcg gcgatatagg cgccagcaac cgcacctgtg gcgccggtga tgccggccac 5520 gatgcgtccg gcgtacaaga tccacaggac gggtgtggtc gccatgatcg cgtagtcgat 5580 agtggctcca agtagcgaag cgagcaggac tgggcggcgg ccaaagcggt cggacagtgc 5640 tccgagaacg ggtgcgcata gaaattgcat caacgcatat agcgctagca gcacgccata 5700 gtgactggcg atgctgtcgg aatggacgat atcccgcaag aggcccggca gtaccggcat 5760 aaccaagcct atgcctacag catccagggt gacggtgccg aggatgacga tgagcgcatt 5820 gttagatttc atacacggtg cctgactgcg ttagcaattt aactgtgata aactaccgca 5880 ttaaagccga gcgatgataa gctgtcaaac atgagatccg ataaatcgat tgatagattt 5940 aaataagaac tgcagaagct agcttagatg ctcgtgaaat tgacgtgggc gctttgcagg 6000 gccgtcttaa tggcgttggt gtccacgagg atcgagtcgg gtgcggaaaa cggacggttc 6060 ttgttggtga aatcgctgtt accaatgtac agcgattcct tgttacgcag cgcctggatg 6120 tgccagcggg accacgaatc ccaatacttc tggcgatccg gcgagatacc ttggctggtg 6180 tagccggtcg tcgggctgtt catcaacgag tcggtgcggt gcgagcccag cgtcagcggc 6240 aacttgatcc gatgcaccgt ggaatcgccg aagatcagct tcagacgcgc gataaattcg 6300 ctatccgcac ccgttttcac acaatcccag acaccggcct tctgcaagac gtcggcacgg 6360 cgaaacagga gcgacgacgg attcagacgc ttcaaggggt acactgcgcg ggcatagaaa 6420 ataccgttgt cttgcaggcg cacccagtcc gagatggagc agatgagctt cggattgagc 6480 aacaaggggg agatttggcg gaacagcttt tccggatggc tccagtcatc cgaatcgtgg 6540 caggtgacga actcgccctt cgcttggatc aagccgatac gcttcgcggc ataggtgccg 6600 acattctgcg gcaggctaat gatcttgatg cgcgtgtctt tgagggcgag ccgctggaga 6660 cgaaacaggg tgtcatcggt gctcgcgtca tccacaatga tcagctcgaa ggaacggtag 6720 gtctgattga ggagcgaaat caccgcattt tccacgcggc gacccgtatt ataggtggtc 6780 atcaggatgg agatcaacgg ccccgtctgg gccgggtacg ggatgctggt gatgatgttg 6840 cacggggaga gcggggagct gttgtccgtc aaggccacgg ggctgaggcc gaagtattta 6900 tagtattcat tcagccgatt caggctaatt tcggcggttt cgcggaaggc gttattttgc 6960 agcagcagga tatccgggct atagacgata tcggatgcgt cgatctgggc gagggtcgag 7020 atggcctttt gggtcaggcc gatccggagt tgcagtgcgg tatacaggtc cagcgggcag 7080 ttgtccacgt tgtccaacag gctcaggcta aaggtcggcg agtaggacgc cagggttttc 7140 gccagttcca ctttctgatg ggtatcggtg aactcgtcct tgaactccat cagcagctcg 7200 ggcgtcaggc tgatgtcgcc gcaggcgatt tttgcgatct tgattgccag tttgcagcgc 7260 caatcggacg gggtatccgt caagttatgc agcgaccagt acatattcag acgatacatc 7320 gcgaggatgc gtttcgactg ccagaaccgg caatcatcct ggatggccgc gagcgcgtgg 7380 acgtagcggc tctttttgag cagccacaag aatttgagat tattgaacat ttattaacct 7440 cctgctagca acttaagtta cgaatcgacg ccgaacaggt cgcgggtgta gactttctcc 7500 gagacatctt ccagttcgct ggtgcggcga ttcgccacaa tgacatcgac gcgctcctta 7560 aaggaattga tgtcgcgctc gacgtaggaa ccgaagaagt agggttcttt caggaccggc 7620 tcgtacacca caatctcgat acccttggcc ttcaaacgtt tcatgacccc ctggatgctg 7680 ctggcccgga aattgtcgct acccgccttc atgatcaggc gatagatacc gaccactttg 7740 ggcttacggg acaggatgtc ctcggccacg aagtccttac gggtcgtatt cgcatccacg 7800 atggcctgga tcaggttttg cgggacgtcg cgataattgg ccaacagctg cttcgtatcc 7860 ttcggcagac agtaaccgcc gtagccgaag gacgggttgt tgtaatgttg accaatgcgc 7920 ggatcgaggg agacgccttc gatgatttgt ttggtatcca ggccgtgcac gctcgcgtag 7980 gtgtccagct cgttaaagta cgcgatacgc atcgccagat acgtgttcgc gaacagtttg 8040 atggcttctg cctcgggcga atccgtcagc aggatcggaa tatccttttt gatggcacct 8100 tccgacagga gttcggcgaa cttccgtgcg cgttccgacg attcgcccac gacaatgcgg 8160 ctcggataga gattatcata cagggctttg ccttcgcgca ggaactccgg ggaaaagatg 8220 atattattcg tgttcagatc gcgcttcagg cgttcggtga acccgacggg gacggtggat 8280 ttgataatga tggtcgcgtt cgggttaatg gacagcacgt cacacgcgac gctttcgacg 8340 ctcagggtat caaagttgtt attaatcgga tcatagttcg tcggggtggc gatgatcacg 8400 tagtctgcat cgcgatatgc ctcgtatttt tccgtcgtcg cgtagaggtt cagcttacga 8460 ttggagagaa acttctggat ttccgggtcg caaatcggcg agattttctt gttaatgagc 8520 tggaccttct tcgggtcgat gtccagggcg atgatgtcgt gtttttggga gaggaggatc 8580 gcaatgctga tacccacata gccgacgccg gccacggcaa ttttcattta ttaacctcct 8640 taagtgaatt caaactagtt tacaagtcgt tttcgatctt ctcccaggta tatttgcgac 8700 attcattcaa gttggtcagc ggcgagtatt tgtacttttt gataccgagg cgcgacaggc 8760 tttcgttcac caccttgaaa tggttttcct tttggatgtc cagtttcttg atcgacgtgt 8820 tctcgccgtg caggacacgg ttgtagcaaa tcttattgat atgcttaaac gggccgactt 8880 cgctgagttt caaatacata tcgtaatcca ccgcattgct gatgctctcg ttgaagcctt 8940 cggtgaggtt ccatgcacgc gccgtgaaca tacggaagtg gtggcagatc atcgcgctcg 9000 tgagcttttc gcggctgtaa atcggccagt tgtagccatt gctaatcaag ttaccttcac 9060 gatcaatatt gcgattggtg gtgtacacgc aggcgaggct caggtctttg cgaaattcat 9120 ccagacacag ttccacggca tcgggctcca ggaaatcatc ggaatccagc tgcccgatgt 9180 agaaaccccg gcacaggcgg actgcggtat tcgaggcgga gccgatgcct ttgtttttct 9240 ggctgatgaa acggacgcgc gggtggtttg cgtaatgttc ttgcaggatg cgcagcgtat 9300 catcggtgct cccgtcatcg cagatgcaga cctccagatc ggtgatcgtt tggttcagtg 9360 ccgattcgac gcagcgcacg atatatttgc tgcaattata cgcggggatg tagatgctca 9420 ccaggggcac acgtttcagg gtggcgctct cgattttctc cttcttgcga taaaagtagg 9480 gcaccttctg ctgcaacagc tggacggtaa tgtttttacc tgccgcgcga tcggtttcgt 9540 tctccttacc gggcggttcc tgatgatatg ccatcgcgcc ttccacgcta cggaaataac 9600 aaccctcgcg gtacagccga tagccgaact cattatcctc accgccccaa tgcgtgaact 9660 cttcgtcaaa ccaacccgcg cgaaacagcc acttctttgc aaacgccaca ttgccaccgc 9720 taaagaaccg gaacggggtg ttgcacaggc gcagattgtc ggtattcttg aaatgttcga 9780 tgcgccaatc gacggatttg ttctgctcga ccttgcctgc gacctgatta ttggtaataa 9840 tctccgggat ttcattgatc aggcttttct gggacaaaaa gtccagatag gtatgcttcg 9900 acgtgtcgat gtatttacgc gggccaatca gtgccacgtt atcatccacg gccaggagtt 9960 ccatatagga ctgcacccac aacgggttcg gcgccatatc gcagtccaag atcgccacgt 10020 agttgtattt cgctgcccgc aggcccaggt tccgcacggc gcacagctgg tagccgtagt 10080 ctttctggcg gacgtatttg atgttcagca acgactcgaa ctcgcggacg atctcttcga 10140 tgttttcctt ggaaccgtca tccgcgacga tgacctcata gtcataaatc gttttctgat 10200 tgcagaggca ggccagggtg atcgccagga ttttggcgcg attgtacgtc ggaatcacga 10260 tggacaggcc gtcgatgatc agttgcttgc gcggataatc atccagttct ttacgtttcc 10320 ctgcccagac gtagtcgttc gtgctttccg gcagcggcgg caaggtcagg tcgctcggcc 10380 aatccagcgg aatgggttcg acttctttca attcggcgcg ctcggatttc tttgcggtaa 10440 tttcccgata tttgctaatg atttcattct tttccacctc attcagcgag atcgcctttg 10500 cattgctgca cataattttg gttgccgcgt cgatatcaat gaccgctttc cgattcagct 10560 tgtccacttc ttcgctcaga ttcagggcgg tttggcacag cttgatattg gcttccaccc 10620 agctcacatc atagatttcc gccacttttt caaacaggga gagggcttgg cggtagttct 10680 tattcttata cagattgatt gcctggttca aaatgctcat ttattaacct cctactagtg 10740 aattttcgaa aatgaacggt ccgttaaata tagccattcg gattcttcat ctgccagcgc 10800 caggcgtcct ccagcatggt ttcgagttcc cgcttggctt tccagttcag atatttgttg 10860 gccttttcgg gggaggacca gctctccgcg atatcaccgt cacggcggct cacgatttca 10920 tacggaatcc gcacgccgga aatcttttca aaggtggaca ccagttccag caccgaataa 10980 cctttacccg tgcccaaatt aaagacgtgg tagttggtgt tattgtcgcg gaagagatag 11040 gacagcgctg cgacgtgccc ttcggccagg tccatcacat ggatatagtc acggaccccc 11100 gtgccgtctt tggtgggata atcaccaccg aacaccatca gtttttccag tttccccatc 11160 gcgacctgca agatgtacgg caccaagttg gaggggatgt ctgccgggct ttcaccaatc 11220 ataccggatt cgtgggcgcc cgtcggatta aagtagcgca agcagaggaa attcgtgtcg 11280 gagtatttct tggcgatgtc gcggatcatc agctccgaga tgtacttgga cgtaccatac 11340 ggattcagcg tgccaccaat atggcagtct tcggtgacgg gcatgatctt gctttcccca 11400 tacaccgtcg ccgacgagct aaagatgaag ttggcgacgt cgttcttgat ggcgcaattg 11460 atgagttgca gggtgccgct cacgttgttg tcatagtaga agatgggctt gatcaggctt 11520 tctgcgaccg atttcgcacc tgcaaagtgc atgatgcagt cgaatttgtg tttcttcagg 11580 atctggttca cttccttctc gttgttgata ttgagttcgt agaacgtgac tttcttcttt 11640 gcgatcagct caatgcgacg gatgctttcg cagctgctgt tgatgagatt gtcaatgatg 11700 acgacattgt agcctttgtt cagcaggcag agcgacgtgt ggctgccgat gtagcctgca 11760 ccgccggtga ccaggatgtt catttattaa cctcctcggt ccgaattaac ctaggttatg 11820 aggtcagcat tgcttcttca cgcggtgtta attaagtaat cgatagtgat ttaaatatgc 11880 aagatctagt tacctgcagg attattgttt ctgttgcata aagcctaagg ggtaggcctt 11940 tctagagata gccatttttt gcactcctgt atccgcttct tgcaaggctg gacttatccc 12000 tatcaaaccg gacactgcag gctgacaagc tttcattaca tatgaagagt ttgtagaaac 12060 gcaaaaaggc catccgtcag gatggccttc taagaaggct cgagtggcgc gcctaagtcg 12120 aatttctgcc attcatccgc ttattatcac ttattcaggc gtagcaacca ggcgtttaag 12180 ggcaccaata actgccttaa aaaaattacg ccccgccctg ccactcatcg cagtactgtt 12240 gtaattcatt aagcattctg ccgacatgga agccatcaca aacggcatga tgaacctgaa 12300 tcgccagcgg catcagcacc ttgtcgcctt gcgtataata tttgcccatg gtgaaaacgg 12360 gggcgaagaa gttgtccata ttggccacgt ttaaatcaaa actggtgaaa ctcacccagg 12420 gattggctga gacgaaaaac atattctcaa taaacccttt agggaaatag gccaggtttt 12480 caccgtaaca cgccacatct tgcgaatata tgtgtagaaa ctgccggaaa tcgtcgtggt 12540 attcactcca gagcgatgaa aacgtttcag tttgctcatg gaaaacggtg taacaagggt 12600 gaacactatc ccatatcacc agctcaccgt ctttcattgc catacggaat tccggatgag 12660 cattcatcag gcgggcaaga atgtgaataa aggccggata aaacttgtgc ttatttttct 12720 ttacggtctt taaaaaggcc gtaatatcca gctgaacggt ctggttatag gtacattgag 12780 caactgactg aaatgcctca aaatgttctt tacgatgcca ttgggatata tcaacggtgg 12840 tatatccagt gatttttttc tccattttag cttccttagc tcctgaaaat ctcgataact 12900 caaaaaatac gcccggtagt gatcttattt cattatggtg aaagttggaa cctcttacgt 12960 gccgatcaac gtctcatttt cgccaaaagt tggcccaggg cttcccggta tcaacaggga 13020 caccaggatt tatttattct gcgaagtgat cttccgtcac aggtatttat tcggcgcaaa 13080 gggcctcgtg atacgcctat ttttataggt taatgtcatg ataataatgg tttcttagac 13140 gtcaggtggc acttttcggg gaaatgtgcg cgcccgcgtt cctgctggcg ctgggcctgt 13200 ttctggcgct ggacttcccg ctgttccgtc agcagctttt cgcccacggc cttgatgatc 13260 gcggcggcct tggcctgcat atcccgattc aacggcccca gggcgtccag aacgggcttc 13320 aggcgctccc gaaggt 13336 <210> 44 <211> 22388 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 44 ctcgggccgt ctcttgggct tgatcggcct tcttgcgcat ctcacgcgct cctgcggcgg 60 cctgtagggc aggctcatac ccctgccgaa ccgcttttgt cagccggtcg gccacggctt 120 ccggcgtctc aacgcgcttt gagattccca gcttttcggc caatccctgc ggtgcatagg 180 cgcgtggctc gaccgcttgc gggctgatgg tgacgtggcc cactggtggc cgctccaggg 240 cctcgtagaa cgcctgaatg cgcgtgtgac gtgccttgct gccctcgatg ccccgttgca 300 gccctagatc ggccacagcg gccgcaaacg tggtctggtc gcgggtcatc tgcgctttgt 360 tgccgatgaa ctccttggcc gacagcctgc cgtcctgcgt cagcggcacc acgaacgcgg 420 tcatgtgcgg gctggtttcg tcacggtgga tgctggccgt cacgatgcga tccgccccgt 480 acttgtccgc cagccacttg tgcgccttct cgaagaacgc cgcctgctgt tcttggctgg 540 ccgacttcca ccattccggg ctggccgtca tgacgtactc gaccgccaac acagcgtcct 600 tgcgccgctt ctctggcagc aactcgcgca gtcggcccat cgcttcatcg gtgctgctgg 660 ccgcccagtg ctcgttctct ggcgtcctgc tggcgtcagc gttgggcgtc tcgcgctcgc 720 ggtaggcgtg cttgagactg gccgccacgt tgcccatttt cgccagcttc ttgcatcgca 780 tgatcgcgta tgccgccatg cctgcccctc ccttttggtg tccaaccggc tcgacggggg 840 cagcgcaagg cggtgcctcc ggcgggccac tcaatgcttg agtatactca ctagactttg 900 cttcgcaaag tcgtgaccgc ctacggcggc tgcggcgccc tacgggcttg ctctccgggc 960 ttcgccctgc gcggtcgctg cgctcccttg ccagcccgtg gatatgtgga cgatggccgc 1020 gagcggccac cggctggctc gcttcgctcg gcccgtggac aaccctgctg gacaagctga 1080 tggacaggct gcgcctgccc acgagcttga ccacagggat tgcccaccgg ctacccagcc 1140 ttcgaccaca tacccaccgg ctccaactgc gcggcctgcg gccttgcccc atcaattttt 1200 ttaattttct ctggggaaaa gcctccggcc tgcggcctgc gcgcttcgct tgccggttgg 1260 acaccaagtg gaaggcgggt caaggctcgc gcagcgaccg cgcagcggct tggccttgac 1320 gcgcctggaa cgacccaagc ctatgcgagt gggggcagtc gaaggcgaag cccgcccgcc 1380 tgccccccga gacctgcaga tccacatcct tgaaggccgc agcgacgagc agaaggaaac 1440 cctcattcgg gaagtcagcg aggccatctc gcgctccctg gatgcgccgc tgaccagcgt 1500 gcgagtgatt atcacggaga tggccaaggg ccacttcggc atcggcggcg aactggccag 1560 caaggtcaga cgctgaagtg gagatgccca agggcacttc gggtcgagga acccgacctg 1620 cattgggacg cggccacgga gagcgcgggc aaacgccggc actatagcca gtggagtttg 1680 taaaacgcta tttcagagct tggagagtgt ctaagaaagc cggggcgatg ccaacccatc 1740 ccttcttcgg ctatgcatcg ttcgtaatca agccacttcc tttttgcatt gacgcagggt 1800 gtcggaaggc aactcgccga acgcgctcct atagttttca gcgaagcgtc ccaaatgtaa 1860 gaagccgtag tctagggcta tctcagttat actacgcaca ttggcactgg gatcgttcaa 1920 gcaggcgcgg atgctttcga gcttgcggtt gcggatgtag ttcttcggcg tggtgccggc 1980 atgcttctcg aacaaattgt agagcgagcg tggactcatc atcgccagct ccgctaaccg 2040 ctcaaggctg atattccgtt tgagattctc ctcaatgaat tgaacgactc gctcgaaaga 2100 cgggttacct ttgctgaaaa tttcacggct gacattgctg cccagcattt cgagcagctt 2160 ggaagcgatg atccccgcat agtgctcttg gacccgaggc atcgactttg tatgttccgc 2220 ttcgtcacaa actaacccga gtagattgat aaagccatcg agttgctgga gattgtgtcg 2280 cgcggcgaaa cggataccct ccctcggctt gtgccaattg ttgtcactgc atgcccgatc 2340 aaggaccact gagggcaatt taacgataaa tttctcgcaa tcttctgaat aggtcaggtc 2400 ggcttggtca tccggattga gcagcaatag ttcgcccggc gcaaaatagt gctcctggcc 2460 atggccacgc cacaggcaat ggcctttgag tattatttgc agatgataac aggtctctaa 2520 tccaggcgag attaccctca cgctaccgcc gtagctgatt cgacacaggt cgaggcatcc 2580 gaagattctg tggtgcagcc tgcctgccgg gcgcccgccc ttgggcaggc gaatagagtg 2640 cgtaccgaca tactggttaa cataatcgga gactgcatag ggctcggcgt ggacgaagat 2700 ctgacttttc tcgttcaata agcaaaaatc catagttcac ggttctctta ttttaatgtg 2760 ggctgcttgg tgtgatgtag aaaggcgcca agtcgatgaa aatgcatctc gacgtgatgc 2820 gtatacgggt tacccccatt gccacgttgc gccatccttt ttgcaatcag tgaccacttt 2880 tccaagcaaa aataacgcca agcagaacga agacgttctt tttaagaagc gagaacacca 2940 gaagttcgtg ctgtcggggc atgcggcgac gaattggcgg ataaagggga tctgcaggtc 3000 ccgagcctca cggcggcgag tgcgggggtt ccaagggggc agcgccacct tgggcaaggc 3060 cgaaggccgc gcagtcgatc aacaagcccc ggaggggcca ctttttgccg gagggggagc 3120 cgcgccgaag gcgtggggga accccgcagg ggtgcccttc tttgggcacc aaagaactag 3180 atatagggcg aaatgcgaaa gacttaaaaa tcaacaactt aaaaaagggg ggtacgcaac 3240 agctcattgc ggcacccccc gcaatagctc attgcgtagg ttaaagaaaa tctgtaattg 3300 actgccactt ttacgcaacg cataattgtt gtcgcgctgc cgaaaagttg cagctgattg 3360 cgcatggtgc cgcaaccgtg cggcacccta ccgcatggag ataagcatgg ccacgcagtc 3420 cagagaaatc ggcattcaag ccaagaacaa gcccggtcac tgggtgcaaa cggaacgcaa 3480 agcgcatgag gcgtgggccg ggcttattgc gaggaaaccc acggcggcaa tgctgctgca 3540 tcacctcgtg gcgcagatgg gccaccagaa cgccgtggtg gtcagccaga agacactttc 3600 caagctcatc ggacgttctt tgcggacggt ccaatacgca gtcaaggact tggtggccga 3660 gcgctggatc tccgtcgtga agctcaacgg ccccggcacc gtgtcggcct acgtggtcaa 3720 tgaccgcgtg gcgtggggcc agccccgcga ccagttgcgc ctgtcggtgt tcagtgccgc 3780 cgtggtggtt gatcacgacg accaggacga atcgctgttg gggcatggcg acctgcgccg 3840 catcccgacc ctgtatccgg gcgagcagca actaccgacc ggccccggcg aggagccgcc 3900 cagccagccc ggcattccgg gcatggaacc agacctgcca gccttgaccg aaacggagga 3960 atgggaacgg cgcgggcagc agcgcctgcc gatgcccgat gagccgtgtt ttctggacga 4020 tggcgagccg ttggagccgc cgacacgggt cacgctgccg cgccggtagc acttgggttg 4080 cgcagcaacc cgtaagtgcg ctgttccaga ctatcggctg tagccgcctc gccgccctat 4140 accttgtctg cctccccgcg ttgcgtcgcg gtgcatggag ccgggccacc tcgacctgaa 4200 tggaagccgg cggcacctcg ctaacggatt caccgttttt atcaggctct gggaggcaga 4260 ataaatgatc atatcgtcaa ttattacctc cacggggaga gcctgagcaa actggcctca 4320 ggcatttgag aagcacacgg tcacactgct tccggtagtc aataaaccgg taaaccagca 4380 atagacataa gcggctattt aacgaccctg ccctgaaccg acgaccgggt cgaatttgct 4440 ttcgactatc ggcgcgccag agctcatcgt taatgtcttc gtgcgccgtc agtcggcgca 4500 cgttttttct ctctggtacc gtgtcactga tctagtcaat tactcgaagt atccacaagt 4560 gaagcatact aagtaatgta caagaatcaa aaaaatcggc tacgcaagtc gcgtagccga 4620 atcatttaag gatccttcca ttcaggtcga ggtggcccgg ctccatgcac cgcgacgcaa 4680 cgcggggagg cagacaaggt atagggcggc gcctacaatc catgccaacc cgttccatgt 4740 gctcgccgag gcggcataaa tcgccgtgac gatcagcggt ccagtgatcg aagttaggct 4800 ggtaagagcc gcgagcgatc cttgaagctg tccctgatgg tcgtcatcta cctgcctgga 4860 cagcatggcc tgcaacgcgg gcatcccgat gccgccggaa gcgagaagaa tcataatggg 4920 gaaggccatc cagcctcgcg tcgcgaacgc cagcaagacg tagcccagcg cgtcggccgc 4980 catgccggcg ataatggcct gcttctcgcc gaaacgtttg gtggcgggac cagtgacgaa 5040 ggcttgagcg agggcgtgca agattccgaa taccgcaagc gacaggccga tcatcgtcgc 5100 gctccagcga aagcggtcct cgccgaaaat gacccagagc gctgccggca cctgtcctac 5160 gagttgcatg ataaagaaga cagtcataag tgcggcgacg atagtcatgc cccgcgccca 5220 ccggaaggag ctgactgggt tgaaggctct caagggcatc ggtcgacgct ctcccttatg 5280 cgactcctgc attaggaagc agcccagtag taggttgagg ccgttgagca ccgccgccgc 5340 aaggaatggt gcatgcaagg agatggcgcc caacagtccc ccggccacgg ggcctgccac 5400 catacccacg ccgaaacaag cgctcatgag cccgaagtgg cgagcccgat cttccccatc 5460 ggtgatgtcg gcgatatagg cgccagcaac cgcacctgtg gcgccggtga tgccggccac 5520 gatgcgtccg gcgtacaaga tccacaggac gggtgtggtc gccatgatcg cgtagtcgat 5580 agtggctcca agtagcgaag cgagcaggac tgggcggcgg ccaaagcggt cggacagtgc 5640 tccgagaacg ggtgcgcata gaaattgcat caacgcatat agcgctagca gcacgccata 5700 gtgactggcg atgctgtcgg aatggacgat atcccgcaag aggcccggca gtaccggcat 5760 aaccaagcct atgcctacag catccagggt gacggtgccg aggatgacga tgagcgcatt 5820 gttagatttc atacacggtg cctgactgcg ttagcaattt aactgtgata aactaccgca 5880 ttaaagccga gcgatgataa gctgtcaaac atgagatcca atctagattg tttaaacttc 5940 tgcagaacac gcggtgttaa cgtttcttat acttcttaat tttgttaaag atcatttcgc 6000 cgtagtacac cgcattgacc tgggtcttca ccagcaagta gccgcgaaat ttcttaaaca 6060 acttcatgtt cggtttaaag tcggcttgcc agaactgatg caaatgcccc tggtacgtca 6120 gacccttgat atcgtacaag gcgttgccca tgactttcag gggcttgttg tggatcaacg 6180 cggaaatgcc ggccgtgcta ttgatggtga ccaccgcttt ggcgtggcgc aacagctccg 6240 gcatgggcag atcgtgcaca tagatgacac gttcatccaa accgtattcc ttcgacagac 6300 gcttgatcaa cgggcggtac aggcggtgcc cgcgatccat cgggtgatgt ttgatcacca 6360 gataggactc cttgggggcc ttgcgggaaa agctgtacat cacttcgttg atgtaatcac 6420 gcacatcatt atagttgcta tggttgcgga tctggctgtc gttgtacact tgcaggaccg 6480 ccaggtaata gcgctgatcc agctcgttca tcaggcgggg gaggaccttg cgttgggtga 6540 ccttatacag ctgtttgcgc cagtaggcgc ggacccagca gcgcgcttca taccacgggc 6600 tgaacgattt gtggtggcga tagcgcggaa attcgtgacg atagtgccaa cccatcaggt 6660 aataccacat ggcgtggccg atgcgcttca tggtgctcgg tttcaggttc tcgacgtgcg 6720 gcgtcggcat atcgggcaat ttgcggtaaa agtccggatc gcggggcaag ctgctatagg 6780 cgttcacacc gccttcttcc acggtgataa attgcggacg caggtagcct tcctcgaagg 6840 ccagaaaacg aatccccttc gacttggccc agcgtttggc ctccttgtgc agcaggcggc 6900 agtcaccgaa acacaaaatc gtgtcaaagt catactgacg atgcaagtcc cgcagccaac 6960 cggggaactc cttcggggtt tggtagtacg ccaggtattg gcggtggcgg cagtagaagc 7020 gatcaccgcc attaaagacg acgttgaccg cgttgcgacc gaggctctcc aaccattccg 7080 ccacatcgtt gaagaacgga cccatcggac cttggagcag gaggtacttt ttaccgctca 7140 acagcaccgt cagcgcattg ccgtgcattt attaacctcc taacacgcgg tgttaagcgt 7200 tttcggcgag ctcctgcgcc atcagggccc ggaccttctc caagcacgcc ggggtatcga 7260 cgccgggacc ggtcgcggcg acctcgaagg tgcgaatgtt aatgcccgcg ctcatcagcc 7320 gcagttgctc cagggattcg gcctgttcgg gcatggactc cggcaactgg ctgtaatttt 7380 gcaggacatc ccgccgatag gcgtagatcc cgacgtgctt caggtagcgc gccttctcgg 7440 cgttgcgcgg gtacggaatg ggggagcggg agaaatacag ggcgtcctgc cgcgtgttca 7500 ccacgacctt gacggtggac ggttcggcgg cttctgccgc gctgatcgca tgacacaggg 7560 tcgccaccgg cagcgccggg tcgtcccgca taccttgcag cagggtttcg acgtcacgcg 7620 ggcgaatcat cggctcatcc ccttgcaggt tgatatagat atccgcctcc accttatgca 7680 tgacttccac caggcgatcg gtgccgctct catgatcgtt gcgggtcatg atcgctttgc 7740 cgccgaacgc ctggactgcc tgctccacac gcgggtcgtc ggttgcgacc cacacctctg 7800 ccacgcctgc cacttgcagg gcccgttcgt agacgtgctg gatcatcggt ttcccgacga 7860 tatccagcag cggtttgccc ggcagacggc tgctgccgta gcgtgccggg atcacaatca 7920 cggccttcga catttattaa cctcctcgag ttacagcgac agaatcactt tcgcgcccac 7980 cgccagttgg tacagaatgg tgctgatacc gcgcgtcact tcgatgttct tcgactcgta 8040 tttcggcaac accataattt catcaccggg tttcagggaa tcgacgtctt ctgcgttcac 8100 cgctgcgccg ttctgacgga tgacgataat acgggcgttg ccggacttct gggtcagccc 8160 accgcacttc tcgatgtagt cctcggtcgt catacctttc tgccacgaca ccgcgttcgg 8220 gaacagcact tccccgtgga ccatgaccaa cgacgtcttt tcgggaatat tgatcacgtc 8280 gccgtcctcc aggaggacgg agtcaatgtt gctttcattg aggatcactt cgcccttcgg 8340 cacgacggtg cgggctttcg cgacgaagcg ggagatcagt tgggcttcct gcatacgcag 8400 gctggcctct tccttggtgc tgctctgtgc gctgaggctg gcctcttcga gcttttgcag 8460 ggacaaattc agcatttctt tctgccgttg cgcgacgctc ggccgataca actgcacggc 8520 gttcatctgc gacatggagt tcgggcgcac tttttcgagc acggcccgca tggtgctacc 8580 gtagggcagc accatggcgt gttccccgga atgtgcgcct tccacacgca cttgaatggt 8640 gcccgcatag cggtcggtgg agacaatgag ggtatcaccg ttttgcagca tacgccccgg 8700 tgcggacgag atcggataat attccgagcg cttctggagg ccctgcttcc gcataatcgt 8760 gatatgggtc gcacccggtt tgggacgtgc ccaggacagt gcttcggtga ccgggatgct 8820 cgattcgcga aattcaaagt cgtaggaatt gaacacatcg ccctgcaccg agaacgtatg 8880 ctggcgcgga cccacaatga tcgtatcacc gtccgcaaac tgggacagcc ccagtttgcc 8940 gttgagcagg aagtcataga ggttgacgtt cgagcgcaca cgattgccgc gtttcacgac 9000 gatgtccacg tagctgccgc gttccgggtc cacaccaccc gccttgatca ggtagttcag 9060 caggctgtcg gaggtgacac cgccgtacag gccggggttg cggacaaagc cggtcacata 9120 gaccttgacc ggctgcgcct gcaagagcga cgcatagacg ttcacgttgc tctggtagac 9180 ttccttcacc ttgctcgtca ccagcgcgtt caactgggag ttcgacacac ctgcgacttt 9240 gacggggccg acattcggca ggaagatgtt gcccttcggg tccacctgga gtgcgccatc 9300 gaaggtgaac gcaccccaca ggcggacctg gatggaatcg ccgggattca ggatgtagtc 9360 cggattgaaa cccacggttg cccccgagtc tgcgctcgta ccgttgaaca gctgcgcccc 9420 gaacatacgg ctcatcacga ccgggggtgc ggggggcggg gtgttatcga agccgctcat 9480 gttctgggtg tcgcttttct gcccgttcag gatgccggtc aacggtgcgg cacccgtgag 9540 gttcggatcg gcattaatgt cgatggttgc gctcgcctgt gctgcatggc acgctgcgat 9600 cagcaggatc gacttaaaca gcttcattta ttaacctcct cgagaagtcg acttagtcac 9660 ggtggtcttc aatcaccgcc aggagcaatt tcagggtgcc aaagagcagg caacacacca 9720 gcagccaaca cgcgatcaaa tacgggatat tcgggaagga gctttcctgg ggcagctgcg 9780 gggacgagat cacgctcagg actttcagct tacgggccgc ttcgacacgg gtcttttcga 9840 tgctggtgag cgtgagcttg tacaactcgg tattgaactc gaccttggat ttgatctcct 9900 caaaatccac ggccatgcgg ttcagtttat cgccctgggg tgcggtaatt ttcgactttt 9960 cttcgtcgat ctgtgcctgg aggctctgaa ttgcattgcg ggcgctcacg acttggggcg 10020 catcctcgcg caggtacgtg agcaggttgc gcaggtcggc ttccatctga attttctggc 10080 ccatcagcgt attcaccagg gtggatgccg cctgggcctg tgcctgcggg tccagcacat 10140 tgttgttgtc ttggtaggac aacaattcgg ctttcgatgc atccagccgc tggcgcgctt 10200 tttccatttc ggtttccgca aacgccaatt gatcgcgggc gatacggtgc gacatttcat 10260 tgatgaaccg ctcggattcc ttgagcacgg tctggttgaa tttcagcgcg aactcgggcg 10320 aaaagccctg ggtctggatg ttcagcagcc cggtcttgtc gtcgtagctg acgttgatgc 10380 gatctttata gtacttcagg aacccctcgg cggtttcatc cttggacaga tggttcagga 10440 agtccaggcc cgaatgggag aacgcttcgc ggaagttcag ctgtttatcc agcgcggcca 10500 gcatatccgg gctgttgatg tattccttca ggtacagtgc gtcttcggcg gacgacgggt 10560 tggaggcacc caacagcagg ccgaagttca ggctgccgga gttgagatcg tcgctgcgct 10620 tgatggccac cttgctttcc gacatatagc ggggctggga gaagatcgcc aagtagatca 10680 gcagcaccgc catgggtgcc agaataatga tttttgccag gtgcttctga atatctgcca 10740 ggctgatcgc gctcagacgc gcacgcatcc acgagacggc gcttttcact ttgatcagca 10800 tttattaacc tcctgtcgac aacacgtgtt aatcgaaaat gcgcaccaac ccggtcacct 10860 tatttgcttt gttggtcacc agcagggtcg agacgcggtg tttctgcatc ttctcttctg 10920 cttcgatgat catggtgtct tcgggcaagg tcagcggttc gcgggtcatc atctgtgcgg 10980 ccgttgcgct cgtcaggctg tcttctttct ccataaagcg ccgcagatcg ccatcggtga 11040 tgatgcctgc cagcccacct tccgcatctt cgaccatcac cataccctgg cagcccgagg 11100 tgatgcgctg aatgaccgtt ttgaagctgg catcgagctg cactgccggc acatcatgtt 11160 gcatcacgtc ggcgacgcgg gtcagcaggc gccgacccag gctgccaccg gggtggtagc 11220 gtgcaaagtc attgggcata aacttacgct ggtgaatcat cgcgatggcc agcgcgtccc 11280 cgatcgccat cgtgagcgtc gtggaggtgg tcggggcgag attgttcggg cacgtttcgt 11340 tcgccatgtg cagctccagg accgcatctg catttttggc cagggtgcta ttcccgttat 11400 tggtgattgc gatgatgcga ttgccgaagt tcttcaggct cggcaccagt ttcaggatct 11460 cgtccgtctc accgctcgcc gaaatcaaga tgagcaggtc atacggggtg atcatgccca 11520 gatcaccatg gaacgcttcc gccggatgaa taaagaagga gggcgtcccg gtcgaggcca 11580 aggtcgccga catcttgcgg cccacatggc cgcttttacc catgccgctc aggatgacgt 11640 gccctttaca attcatgatg agattcagga cgcgctggta ctgaccgcta tccagttgtt 11700 tggacaggtt ttgcagtgcc gcgctttgtt cggccagggt ctggcggacg ctcgtaatca 11760 gatacggatc aatggtcgag gactggtcat ccggcaagtg gcgttcgctc atttattaac 11820 ctcctcacgt gttaattaag taatcgatag tgatttaaat atgcaagatc cgataaatcg 11880 attgatagat ttaaataaga actgcagaag ctagcttaga tgctcgtgaa attgacgtgg 11940 gcgctttgca gggccgtctt aatggcgttg gtgtccacga ggatcgagtc gggtgcggaa 12000 aacggacggt tcttgttggt gaaatcgctg ttaccaatgt acagcgattc cttgttacgc 12060 agcgcctgga tgtgccagcg ggaccacgaa tcccaatact tctggcgatc cggcgagata 12120 ccttggctgg tgtagccggt cgtcgggctg ttcatcaacg agtcggtgcg gtgcgagccc 12180 agcgtcagcg gcaacttgat ccgatgcacc gtggaatcgc cgaagatcag cttcagacgc 12240 gcgataaatt cgctatccgc acccgttttc acacaatccc agacaccggc cttctgcaag 12300 acgtcggcac ggcgaaacag gagcgacgac ggattcagac gcttcaaggg gtacactgcg 12360 cgggcataga aaataccgtt gtcttgcagg cgcacccagt ccgagatgga gcagatgagc 12420 ttcggattga gcaacaaggg ggagatttgg cggaacagct tttccggatg gctccagtca 12480 tccgaatcgt ggcaggtgac gaactcgccc ttcgcttgga tcaagccgat acgcttcgcg 12540 gcataggtgc cgacattctg cggcaggcta atgatcttga tgcgcgtgtc tttgagggcg 12600 agccgctgga gacgaaacag ggtgtcatcg gtgctcgcgt catccacaat gatcagctcg 12660 aaggaacggt aggtctgatt gaggagcgaa atcaccgcat tttccacgcg gcgacccgta 12720 ttataggtgg tcatcaggat ggagatcaac ggccccgtct gggccgggta cgggatgctg 12780 gtgatgatgt tgcacgggga gagcggggag ctgttgtccg tcaaggccac ggggctgagg 12840 ccgaagtatt tatagtattc attcagccga ttcaggctaa tttcggcggt ttcgcggaag 12900 gcgttatttt gcagcagcag gatatccggg ctatagacga tatcggatgc gtcgatctgg 12960 gcgagggtcg agatggcctt ttgggtcagg ccgatccgga gttgcagtgc ggtatacagg 13020 tccagcgggc agttgtccac gttgtccaac aggctcaggc taaaggtcgg cgagtaggac 13080 gccagggttt tcgccagttc cactttctga tgggtatcgg tgaactcgtc cttgaactcc 13140 atcagcagct cgggcgtcag gctgatgtcg ccgcaggcga tttttgcgat cttgattgcc 13200 agtttgcagc gccaatcgga cggggtatcc gtcaagttat gcagcgacca gtacatattc 13260 agacgataca tcgcgaggat gcgtttcgac tgccagaacc ggcaatcatc ctggatggcc 13320 gcgagcgcgt ggacgtagcg gctctttttg agcagccaca agaatttgag attattgaac 13380 atttattaac ctcctgctag caacttaagt tacgaatcga cgccgaacag gtcgcgggtg 13440 tagactttct ccgagacatc ttccagttcg ctggtgcggc gattcgccac aatgacatcg 13500 acgcgctcct taaaggaatt gatgtcgcgc tcgacgtagg aaccgaagaa gtagggttct 13560 ttcaggaccg gctcgtacac cacaatctcg atacccttgg ccttcaaacg tttcatgacc 13620 ccctggatgc tgctggcccg gaaattgtcg ctacccgcct tcatgatcag gcgatagata 13680 ccgaccactt tgggcttacg ggacaggatg tcctcggcca cgaagtcctt acgggtcgta 13740 ttcgcatcca cgatggcctg gatcaggttt tgcgggacgt cgcgataatt ggccaacagc 13800 tgcttcgtat ccttcggcag acagtaaccg ccgtagccga aggacgggtt gttgtaatgt 13860 tgaccaatgc gcggatcgag ggagacgcct tcgatgattt gtttggtatc caggccgtgc 13920 acgctcgcgt aggtgtccag ctcgttaaag tacgcgatac gcatcgccag atacgtgttc 13980 gcgaacagtt tgatggcttc tgcctcgggc gaatccgtca gcaggatcgg aatatccttt 14040 ttgatggcac cttccgacag gagttcggcg aacttccgtg cgcgttccga cgattcgccc 14100 acgacaatgc ggctcggata gagattatca tacagggctt tgccttcgcg caggaactcc 14160 ggggaaaaga tgatattatt cgtgttcaga tcgcgcttca ggcgttcggt gaacccgacg 14220 gggacggtgg atttgataat gatggtcgcg ttcgggttaa tggacagcac gtcacacgcg 14280 acgctttcga cgctcagggt atcaaagttg ttattaatcg gatcatagtt cgtcggggtg 14340 gcgatgatca cgtagtctgc atcgcgatat gcctcgtatt tttccgtcgt cgcgtagagg 14400 ttcagcttac gattggagag aaacttctgg atttccgggt cgcaaatcgg cgagattttc 14460 ttgttaatga gctggacctt cttcgggtcg atgtccaggg cgatgatgtc gtgtttttgg 14520 gagaggagga tcgcaatgct gatacccaca tagccgacgc cggccacggc aattttcatt 14580 tattaacctc cttaagtgaa ttcaaactag tttacaagtc gttttcgatc ttctcccagg 14640 tatatttgcg acattcattc aagttggtca gcggcgagta tttgtacttt ttgataccga 14700 ggcgcgacag gctttcgttc accaccttga aatggttttc cttttggatg tccagtttct 14760 tgatcgacgt gttctcgccg tgcaggacac ggttgtagca aatcttattg atatgcttaa 14820 acgggccgac ttcgctgagt ttcaaataca tatcgtaatc caccgcattg ctgatgctct 14880 cgttgaagcc ttcggtgagg ttccatgcac gcgccgtgaa catacggaag tggtggcaga 14940 tcatcgcgct cgtgagcttt tcgcggctgt aaatcggcca gttgtagcca ttgctaatca 15000 agttaccttc acgatcaata ttgcgattgg tggtgtacac gcaggcgagg ctcaggtctt 15060 tgcgaaattc atccagacac agttccacgg catcgggctc caggaaatca tcggaatcca 15120 gctgcccgat gtagaaaccc cggcacaggc ggactgcggt attcgaggcg gagccgatgc 15180 ctttgttttt ctggctgatg aaacggacgc gcgggtggtt tgcgtaatgt tcttgcagga 15240 tgcgcagcgt atcatcggtg ctcccgtcat cgcagatgca gacctccaga tcggtgatcg 15300 tttggttcag tgccgattcg acgcagcgca cgatatattt gctgcaatta tacgcgggga 15360 tgtagatgct caccaggggc acacgtttca gggtggcgct ctcgattttc tccttcttgc 15420 gataaaagta gggcaccttc tgctgcaaca gctggacggt aatgttttta cctgccgcgc 15480 gatcggtttc gttctcctta ccgggcggtt cctgatgata tgccatcgcg ccttccacgc 15540 tacggaaata acaaccctcg cggtacagcc gatagccgaa ctcattatcc tcaccgcccc 15600 aatgcgtgaa ctcttcgtca aaccaacccg cgcgaaacag ccacttcttt gcaaacgcca 15660 cattgccacc gctaaagaac cggaacgggg tgttgcacag gcgcagattg tcggtattct 15720 tgaaatgttc gatgcgccaa tcgacggatt tgttctgctc gaccttgcct gcgacctgat 15780 tattggtaat aatctccggg atttcattga tcaggctttt ctgggacaaa aagtccagat 15840 aggtatgctt cgacgtgtcg atgtatttac gcgggccaat cagtgccacg ttatcatcca 15900 cggccaggag ttccatatag gactgcaccc acaacgggtt cggcgccata tcgcagtcca 15960 agatcgccac gtagttgtat ttcgctgccc gcaggcccag gttccgcacg gcgcacagct 16020 ggtagccgta gtctttctgg cggacgtatt tgatgttcag caacgactcg aactcgcgga 16080 cgatctcttc gatgttttcc ttggaaccgt catccgcgac gatgacctca tagtcataaa 16140 tcgttttctg attgcagagg caggccaggg tgatcgccag gattttggcg cgattgtacg 16200 tcggaatcac gatggacagg ccgtcgatga tcagttgctt gcgcggataa tcatccagtt 16260 ctttacgttt ccctgcccag acgtagtcgt tcgtgctttc cggcagcggc ggcaaggtca 16320 ggtcgctcgg ccaatccagc ggaatgggtt cgacttcttt caattcggcg cgctcggatt 16380 tctttgcggt aatttcccga tatttgctaa tgatttcatt cttttccacc tcattcagcg 16440 agatcgcctt tgcattgctg cacataattt tggttgccgc gtcgatatca atgaccgctt 16500 tccgattcag cttgtccact tcttcgctca gattcagggc ggtttggcac agcttgatat 16560 tggcttccac ccagctcaca tcatagattt ccgccacttt ttcaaacagg gagagggctt 16620 ggcggtagtt cttattctta tacagattga ttgcctggtt caaaatgctc atttattaac 16680 ctcctactag tgaattttcg aattacttac cgcagtactt gacacccacc tgggaattgt 16740 ttttggtgcg tttgaattgg cggatggtac ggtagatgct aaagggcagg ctgatcagac 16800 cgagcggaaa attgttctta ttgatgatga gcttgcccag ctgatagctc aggtgtttct 16860 tgacccgttc ggcttcgtgt ttatccgcgt acaggaagat gctcggcagg ctcacttggt 16920 actccgaatc atatttcttc ttccaggtcc gccattcgct gatcaacgca aacggaatcg 16980 agatcagacc gaggaacgtc ttggagcggc tcaccatcac cgcacccagg cggtagccga 17040 tatcttgctt gatgcgttcg gccgcaccat acagctccgg cagttgtttc ttttcgagac 17100 gttgattgtc gatgaagtac tgttcgagct tttgctgcac cagatgcagc tgattgagca 17160 gcaattcttt ttcgcacgac agcttttcga ggcgctgttg ttgcagttca tttttgttct 17220 gttccttttt cagcagggac tcgaagttct cgatcgcgca ctccagttcc tggacctgga 17280 tggttttgtt tttaatgatc agatcatact ggatcagttc ttccttgcta tccgacagct 17340 ctttcagaat ggcttgatag gcgttcagct gtttggacgt gtgcagttcg ttgtccagaa 17400 tgatcttttt gctgctctgg tacagaccgt tcacgatatc gagggtgatc tggcgttgtt 17460 taatgaacgt ctcccaaata aaggacggct tatagttttc cttctccagc acccgcaagg 17520 gggtgttggc gttcgattgc aattcaaagt acagttcctt gcaatcggga tagtcgttca 17580 ggacgttgaa gatcaagtac tcctccgtct cgctttgctt gaaaatgata tccccggtcc 17640 cgatgtcaat accgctgagg gacatgatct cctgatgttc tttttccagc gtaatggagg 17700 cttcggcggt cttaaagtca ttcacgctct gctccagcga gtggttgatg gtattggaga 17760 acgacaaccc gaatttcagt ttcagtttgt gttgcagttg ctggatgcag tcctcggcgt 17820 tgcgcttcac ctgttcgctc gacaccagca ggcaccgacc ccggttgttg aggaagaagt 17880 gcagcaaggc ggtgttgtat gccagccagt ttttgatcag atgctccgag gtatagttgc 17940 tggagatgtt ctggtccgag aagtagttcg tcaggatgct tttggggtgg tcgtagatga 18000 ggataaaggt gatgttctca tccaccgatt tccaatattc caacgtgtga attgcgttgg 18060 ggtcgctcca accgcacagt ttctggttca ggttggacag catcagatcc aatgcgatac 18120 cgttccagac ggtgctcaca tggagcggtt caaagtcggc ggaatcggtc accgtataga 18180 tgtccggcga ctggtacgcc ttccgcagcg tctgggtgat gtcctggggc gagaggttct 18240 cacgtttgga cgggcacagg gagttcatgc cgcgctgatg caggagttct tccacgattt 18300 ggtagttgct gctcggatgg cccacgatca ccaggcggtt catttattaa cctcctttcg 18360 aaaatgaacg gtccgttaaa tatagccatt cggattcttc atctgccagc gccaggcgtc 18420 ctccagcatg gtttcgagtt cccgcttggc tttccagttc agatatttgt tggccttttc 18480 gggggaggac cagctctccg cgatatcacc gtcacggcgg ctcacgattt catacggaat 18540 ccgcacgccg gaaatctttt caaaggtgga caccagttcc agcaccgaat aacctttacc 18600 cgtgcccaaa ttaaagacgt ggtagttggt gttattgtcg cggaagagat aggacagcgc 18660 tgcgacgtgc ccttcggcca ggtccatcac atggatatag tcacggaccc ccgtgccgtc 18720 tttggtggga taatcaccac cgaacaccat cagtttttcc agtttcccca tcgcgacctg 18780 caagatgtac ggcaccaagt tggaggggat gtctgccggg ctttcaccaa tcataccgga 18840 ttcgtgggcg cccgtcggat taaagtagcg caagcagagg aaattcgtgt cggagtattt 18900 cttggcgatg tcgcggatca tcagctccga gatgtacttg gacgtaccat acggattcag 18960 cgtgccacca atatggcagt cttcggtgac gggcatgatc ttgctttccc catacaccgt 19020 cgccgacgag ctaaagatga agttggcgac gtcgttcttg atggcgcaat tgatgagttg 19080 cagggtgccg ctcacgttgt tgtcatagta gaagatgggc ttgatcaggc tttctgcgac 19140 cgatttcgca cctgcaaagt gcatgatgca gtcgaatttg tgtttcttca ggatctggtt 19200 cacttccttc tcgttgttga tattgagttc gtagaacgtg actttcttct ttgcgatcag 19260 ctcaatgcga cggatgcttt cgcagctgct gttgatgaga ttgtcaatga tgacgacatt 19320 gtagcctttg ttcagcaggc agagcgacgt gtggctgccg atgtagcctg caccgccggt 19380 gaccaggatg ttcatttatt aacctcctcg gtccgaatta acctaggtta tgaggtcagc 19440 attgcttctt cacgcgttta gtagttgttt tgttcggtga tatattcttc aatgccttct 19500 tgcacgtctt catggaacga cacggcgttg tcgtctttaa acacgattgc cacatcgcag 19560 aactctttca acgagttcag cgagtgcgac accatgagga aggagctttc cttatgacgc 19620 tccttgaaga gttgggcaca tttttccttg aaacgggcgt cccccaccgc cgtcacctcg 19680 tccacgatgt agtaatcgaa cttgaacgcc atgctcaggc cgaagccgag gcggctgcgc 19740 ataccgctcg aataggtctt gatcggcata tcaaaatact tccccagctc cgcgaactct 19800 tccacaaact caatcttttc tttcagctcc tcctgcttcg cgtacagccg ggccacgaac 19860 ttcacgtttt cacgcccggt caagctgccc tggaagccgc ctgccagacc caccggccac 19920 gagatcgttt tattcgtgat gattttaccg ctatccgggc ggtcgatgcc cccaatcatg 19980 cgcaacagcg tggatttacc cgccccattg cgcccgatga acgccacgct tttgccgctg 20040 gggatctcaa tgttcaggtt cttgaagaca tagtgacggc ccaccggggt gcggtagctt 20100 ttcgtcaggt tttcgatctt aatcatgagg tcaacattgc ctcctcacgc gtacggtaca 20160 gggccaaacc aataaacagg gtcaccaggg tgaacattgc cagataattc aggctgaccc 20220 cttcgctgat ataaccgggc atcacggcct cgcggctcag ttcgacgacg tgcaccaggg 20280 gattccacag caggtacgac caatactgct tcggaatgga gtgcagcggg aacatgatgc 20340 acgaaataaa gtacagcggc ttcagcaaga tcggcaagac tttctgcatt tcggggaacg 20400 tcttgcccac gaccatgaag atcaggccca caccgcacga caggatgatc aggaggctcc 20460 aggtgagcac aaattgcagg aagttggtaa tctcgaaata ttcgcccgcc atccagatga 20520 tcagcatcag gaggatgtag accgccacat agatcagcgt ttccaagagg gcgcgtgcaa 20580 tgatcgtgtc gatcggcttc acgggccggt agttaaacag cccctgattg gcttcgatgg 20640 cgcccacgga gcgattgctg atgctgctga aaataaagaa cgggatcagg ccattgagca 20700 ggaacaccgg gaaggagata tccggcatgg tgcgatgcat gatatagcca aagatcccga 20760 gcagaatcag cagatgtgcg ctcggttcca ggatcgccca cagatagccc aggcgaaact 20820 tgccaaagcg cgtacggatt tcgcggagaa acagtgcttc gaccgtcact ttctggactt 20880 caaaacccga acgtgccatt tattaacctc ctggtaccaa tctagattgt ttaaacagat 20940 ctgttacctg caggattatt gtttctgttg cataaagcct aaggggtagg cctttctaga 21000 gatagccatt ttttgcactc ctgtatccgc ttcttgcaag gctggactta tccctatcaa 21060 accggacact gcaggctgac aagctttcat tacatatgaa gagtttgtag aaacgcaaaa 21120 aggccatccg tcaggatggc cttctaagaa ggctcgagtg gcgcgcctaa gtcgaatttc 21180 tgccattcat ccgcttatta tacttattca ggcgtagcac caggcgttta agggcaccaa 21240 taactgcctt aaaaaaatta cgccccgccc tgccactcat cgcagtactg ttgtaattca 21300 ttaagcattc tgccgacatg gaagccatca cagacggcat gatgaacctg aatcgccagc 21360 ggcatcagca ccttgtcgcc ttgcgtataa tatttgccca tggtgaaaac gggggcgaag 21420 aagttgtcca tattggccac gtttaaatca aaactggtga aactcaccca gggattggct 21480 gagacgaaaa acatattctc aataaaccct ttagggaaat aggccaggtt ttcaccgtaa 21540 cacgccacat cttgcgaata tatgtgtaga aactgccgga aatcgtcgtg gtattcactc 21600 cagagcgatg aaaacgtttc agtttgctca tggaaaacgg tgtaacaagg gtgaacacta 21660 tcccatatca ccagctcacc gtctttcatt gccatacgga attccggatg agcattcatc 21720 aggcgggcaa gaatgtgaat aaaggccgga taaaacttgt gcttattttt ctttacggtc 21780 tttaaaaagg ccgtaatatc cagctgaacg gtctggttat aggtacattg agcaactgac 21840 tgaaatgcct caaaatgttc tttacgatgc cattgggata tatcaacggt ggtatatcca 21900 gtgatttttt tctccatttt agcttcctta gctcctgaaa atctcgataa ctcaaaaaat 21960 acgcccggta gtgatcttat ttcattatgg tgaaagttgg aacctcttac gtgccgatca 22020 acgtctcatt ttcgccaaaa gttggcccag ggcttcccgg tatcaacagg gacaccagga 22080 tttatttatt ctgcgaagtg atcttccgtc acaggtattt attcggcgca aagggcctcg 22140 tgatacgcct atttttatag gttaatgtca tgataataat ggtttcttag acgtcaggtg 22200 gcacttttcg gggaaatgtg cgcgcccgcg ttcctgctgg cgctgggcct gtttctggcg 22260 ctggacttcc cgctgttccg tcagcagctt ttcgcccacg gccttgatga tcgcggcggc 22320 cttggcctgc atatcccgat tcaacggccc cagggcgtcc agaacgggct tcaggcgctc 22380 ccgaaggt 22388 <210> 45 <211> 23738 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 45 ctcgggccgt ctcttgggct tgatcggcct tcttgcgcat ctcacgcgct cctgcggcgg 60 cctgtagggc aggctcatac ccctgccgaa ccgcttttgt cagccggtcg gccacggctt 120 ccggcgtctc aacgcgcttt gagattccca gcttttcggc caatccctgc ggtgcatagg 180 cgcgtggctc gaccgcttgc gggctgatgg tgacgtggcc cactggtggc cgctccaggg 240 cctcgtagaa cgcctgaatg cgcgtgtgac gtgccttgct gccctcgatg ccccgttgca 300 gccctagatc ggccacagcg gccgcaaacg tggtctggtc gcgggtcatc tgcgctttgt 360 tgccgatgaa ctccttggcc gacagcctgc cgtcctgcgt cagcggcacc acgaacgcgg 420 tcatgtgcgg gctggtttcg tcacggtgga tgctggccgt cacgatgcga tccgccccgt 480 acttgtccgc cagccacttg tgcgccttct cgaagaacgc cgcctgctgt tcttggctgg 540 ccgacttcca ccattccggg ctggccgtca tgacgtactc gaccgccaac acagcgtcct 600 tgcgccgctt ctctggcagc aactcgcgca gtcggcccat cgcttcatcg gtgctgctgg 660 ccgcccagtg ctcgttctct ggcgtcctgc tggcgtcagc gttgggcgtc tcgcgctcgc 720 ggtaggcgtg cttgagactg gccgccacgt tgcccatttt cgccagcttc ttgcatcgca 780 tgatcgcgta tgccgccatg cctgcccctc ccttttggtg tccaaccggc tcgacggggg 840 cagcgcaagg cggtgcctcc ggcgggccac tcaatgcttg agtatactca ctagactttg 900 cttcgcaaag tcgtgaccgc ctacggcggc tgcggcgccc tacgggcttg ctctccgggc 960 ttcgccctgc gcggtcgctg cgctcccttg ccagcccgtg gatatgtgga cgatggccgc 1020 gagcggccac cggctggctc gcttcgctcg gcccgtggac aaccctgctg gacaagctga 1080 tggacaggct gcgcctgccc acgagcttga ccacagggat tgcccaccgg ctacccagcc 1140 ttcgaccaca tacccaccgg ctccaactgc gcggcctgcg gccttgcccc atcaattttt 1200 ttaattttct ctggggaaaa gcctccggcc tgcggcctgc gcgcttcgct tgccggttgg 1260 acaccaagtg gaaggcgggt caaggctcgc gcagcgaccg cgcagcggct tggccttgac 1320 gcgcctggaa cgacccaagc ctatgcgagt gggggcagtc gaaggcgaag cccgcccgcc 1380 tgccccccga gacctgcaga tccacatcct tgaaggccgc agcgacgagc agaaggaaac 1440 cctcattcgg gaagtcagcg aggccatctc gcgctccctg gatgcgccgc tgaccagcgt 1500 gcgagtgatt atcacggaga tggccaaggg ccacttcggc atcggcggcg aactggccag 1560 caaggtcaga cgctgaagtg gagatgccca agggcacttc gggtcgagga acccgacctg 1620 cattgggacg cggccacgga gagcgcgggc aaacgccggc actatagcca gtggagtttg 1680 taaaacgcta tttcagagct tggagagtgt ctaagaaagc cggggcgatg ccaacccatc 1740 ccttcttcgg ctatgcatcg ttcgtaatca agccacttcc tttttgcatt gacgcagggt 1800 gtcggaaggc aactcgccga acgcgctcct atagttttca gcgaagcgtc ccaaatgtaa 1860 gaagccgtag tctagggcta tctcagttat actacgcaca ttggcactgg gatcgttcaa 1920 gcaggcgcgg atgctttcga gcttgcggtt gcggatgtag ttcttcggcg tggtgccggc 1980 atgcttctcg aacaaattgt agagcgagcg tggactcatc atcgccagct ccgctaaccg 2040 ctcaaggctg atattccgtt tgagattctc ctcaatgaat tgaacgactc gctcgaaaga 2100 cgggttacct ttgctgaaaa tttcacggct gacattgctg cccagcattt cgagcagctt 2160 ggaagcgatg atccccgcat agtgctcttg gacccgaggc atcgactttg tatgttccgc 2220 ttcgtcacaa actaacccga gtagattgat aaagccatcg agttgctgga gattgtgtcg 2280 cgcggcgaaa cggataccct ccctcggctt gtgccaattg ttgtcactgc atgcccgatc 2340 aaggaccact gagggcaatt taacgataaa tttctcgcaa tcttctgaat aggtcaggtc 2400 ggcttggtca tccggattga gcagcaatag ttcgcccggc gcaaaatagt gctcctggcc 2460 atggccacgc cacaggcaat ggcctttgag tattatttgc agatgataac aggtctctaa 2520 tccaggcgag attaccctca cgctaccgcc gtagctgatt cgacacaggt cgaggcatcc 2580 gaagattctg tggtgcagcc tgcctgccgg gcgcccgccc ttgggcaggc gaatagagtg 2640 cgtaccgaca tactggttaa cataatcgga gactgcatag ggctcggcgt ggacgaagat 2700 ctgacttttc tcgttcaata agcaaaaatc catagttcac ggttctctta ttttaatgtg 2760 ggctgcttgg tgtgatgtag aaaggcgcca agtcgatgaa aatgcatctc gacgtgatgc 2820 gtatacgggt tacccccatt gccacgttgc gccatccttt ttgcaatcag tgaccacttt 2880 tccaagcaaa aataacgcca agcagaacga agacgttctt tttaagaagc gagaacacca 2940 gaagttcgtg ctgtcggggc atgcggcgac gaattggcgg ataaagggga tctgcaggtc 3000 ccgagcctca cggcggcgag tgcgggggtt ccaagggggc agcgccacct tgggcaaggc 3060 cgaaggccgc gcagtcgatc aacaagcccc ggaggggcca ctttttgccg gagggggagc 3120 cgcgccgaag gcgtggggga accccgcagg ggtgcccttc tttgggcacc aaagaactag 3180 atatagggcg aaatgcgaaa gacttaaaaa tcaacaactt aaaaaagggg ggtacgcaac 3240 agctcattgc ggcacccccc gcaatagctc attgcgtagg ttaaagaaaa tctgtaattg 3300 actgccactt ttacgcaacg cataattgtt gtcgcgctgc cgaaaagttg cagctgattg 3360 cgcatggtgc cgcaaccgtg cggcacccta ccgcatggag ataagcatgg ccacgcagtc 3420 cagagaaatc ggcattcaag ccaagaacaa gcccggtcac tgggtgcaaa cggaacgcaa 3480 agcgcatgag gcgtgggccg ggcttattgc gaggaaaccc acggcggcaa tgctgctgca 3540 tcacctcgtg gcgcagatgg gccaccagaa cgccgtggtg gtcagccaga agacactttc 3600 caagctcatc ggacgttctt tgcggacggt ccaatacgca gtcaaggact tggtggccga 3660 gcgctggatc tccgtcgtga agctcaacgg ccccggcacc gtgtcggcct acgtggtcaa 3720 tgaccgcgtg gcgtggggcc agccccgcga ccagttgcgc ctgtcggtgt tcagtgccgc 3780 cgtggtggtt gatcacgacg accaggacga atcgctgttg gggcatggcg acctgcgccg 3840 catcccgacc ctgtatccgg gcgagcagca actaccgacc ggccccggcg aggagccgcc 3900 cagccagccc ggcattccgg gcatggaacc agacctgcca gccttgaccg aaacggagga 3960 atgggaacgg cgcgggcagc agcgcctgcc gatgcccgat gagccgtgtt ttctggacga 4020 tggcgagccg ttggagccgc cgacacgggt cacgctgccg cgccggtagc acttgggttg 4080 cgcagcaacc cgtaagtgcg ctgttccaga ctatcggctg tagccgcctc gccgccctat 4140 accttgtctg cctccccgcg ttgcgtcgcg gtgcatggag ccgggccacc tcgacctgaa 4200 tggaagccgg cggcacctcg ctaacggatt caccgttttt atcaggctct gggaggcaga 4260 ataaatgatc atatcgtcaa ttattacctc cacggggaga gcctgagcaa actggcctca 4320 ggcatttgag aagcacacgg tcacactgct tccggtagtc aataaaccgg taaaccagca 4380 atagacataa gcggctattt aacgaccctg ccctgaaccg acgaccgggt cgaatttgct 4440 ttcgactatc ggcgcgccag agctcatcgt taatgtcttc gtgcgccgtc agtcggcgca 4500 cgttttttct ctctggtacc gtgtcactga tctagtcaat tactcgaagt atccacaagt 4560 gaagcatact aagtaatgta caagaatcaa aaaaatcggc tacgcaagtc gcgtagccga 4620 atcatttaag gatccttcca ttcaggtcga ggtggcccgg ctccatgcac cgcgacgcaa 4680 cgcggggagg cagacaaggt atagggcggc gcctacaatc catgccaacc cgttccatgt 4740 gctcgccgag gcggcataaa tcgccgtgac gatcagcggt ccagtgatcg aagttaggct 4800 ggtaagagcc gcgagcgatc cttgaagctg tccctgatgg tcgtcatcta cctgcctgga 4860 cagcatggcc tgcaacgcgg gcatcccgat gccgccggaa gcgagaagaa tcataatggg 4920 gaaggccatc cagcctcgcg tcgcgaacgc cagcaagacg tagcccagcg cgtcggccgc 4980 catgccggcg ataatggcct gcttctcgcc gaaacgtttg gtggcgggac cagtgacgaa 5040 ggcttgagcg agggcgtgca agattccgaa taccgcaagc gacaggccga tcatcgtcgc 5100 gctccagcga aagcggtcct cgccgaaaat gacccagagc gctgccggca cctgtcctac 5160 gagttgcatg ataaagaaga cagtcataag tgcggcgacg atagtcatgc cccgcgccca 5220 ccggaaggag ctgactgggt tgaaggctct caagggcatc ggtcgacgct ctcccttatg 5280 cgactcctgc attaggaagc agcccagtag taggttgagg ccgttgagca ccgccgccgc 5340 aaggaatggt gcatgcaagg agatggcgcc caacagtccc ccggccacgg ggcctgccac 5400 catacccacg ccgaaacaag cgctcatgag cccgaagtgg cgagcccgat cttccccatc 5460 ggtgatgtcg gcgatatagg cgccagcaac cgcacctgtg gcgccggtga tgccggccac 5520 gatgcgtccg gcgtacaaga tccacaggac gggtgtggtc gccatgatcg cgtagtcgat 5580 agtggctcca agtagcgaag cgagcaggac tgggcggcgg ccaaagcggt cggacagtgc 5640 tccgagaacg ggtgcgcata gaaattgcat caacgcatat agcgctagca gcacgccata 5700 gtgactggcg atgctgtcgg aatggacgat atcccgcaag aggcccggca gtaccggcat 5760 aaccaagcct atgcctacag catccagggt gacggtgccg aggatgacga tgagcgcatt 5820 gttagatttc atacacggtg cctgactgcg ttagcaattt aactgtgata aactaccgca 5880 ttaaagccga gcgatgataa gctgtcaaac atgagatcca atctagattg tttaaacttc 5940 tgcagaacac gcggtgttaa cgtttcttat acttcttaat tttgttaaag atcatttcgc 6000 cgtagtacac cgcattgacc tgggtcttca ccagcaagta gccgcgaaat ttcttaaaca 6060 acttcatgtt cggtttaaag tcggcttgcc agaactgatg caaatgcccc tggtacgtca 6120 gacccttgat atcgtacaag gcgttgccca tgactttcag gggcttgttg tggatcaacg 6180 cggaaatgcc ggccgtgcta ttgatggtga ccaccgcttt ggcgtggcgc aacagctccg 6240 gcatgggcag atcgtgcaca tagatgacac gttcatccaa accgtattcc ttcgacagac 6300 gcttgatcaa cgggcggtac aggcggtgcc cgcgatccat cgggtgatgt ttgatcacca 6360 gataggactc cttgggggcc ttgcgggaaa agctgtacat cacttcgttg atgtaatcac 6420 gcacatcatt atagttgcta tggttgcgga tctggctgtc gttgtacact tgcaggaccg 6480 ccaggtaata gcgctgatcc agctcgttca tcaggcgggg gaggaccttg cgttgggtga 6540 ccttatacag ctgtttgcgc cagtaggcgc ggacccagca gcgcgcttca taccacgggc 6600 tgaacgattt gtggtggcga tagcgcggaa attcgtgacg atagtgccaa cccatcaggt 6660 aataccacat ggcgtggccg atgcgcttca tggtgctcgg tttcaggttc tcgacgtgcg 6720 gcgtcggcat atcgggcaat ttgcggtaaa agtccggatc gcggggcaag ctgctatagg 6780 cgttcacacc gccttcttcc acggtgataa attgcggacg caggtagcct tcctcgaagg 6840 ccagaaaacg aatccccttc gacttggccc agcgtttggc ctccttgtgc agcaggcggc 6900 agtcaccgaa acacaaaatc gtgtcaaagt catactgacg atgcaagtcc cgcagccaac 6960 cggggaactc cttcggggtt tggtagtacg ccaggtattg gcggtggcgg cagtagaagc 7020 gatcaccgcc attaaagacg acgttgaccg cgttgcgacc gaggctctcc aaccattccg 7080 ccacatcgtt gaagaacgga cccatcggac cttggagcag gaggtacttt ttaccgctca 7140 acagcaccgt cagcgcattg ccgtgcattt attaacctcc taacacgcgg tgttaagcgt 7200 tttcggcgag ctcttaacca aagcgcactt tgcagaacat gatcaacttg cgatagtagc 7260 gaatcacacg gccggctttc ttgcgggtga taaagatggg tttgcggggc gttttgatca 7320 gatattctgc cgcttcctcc accgtgatcg gctgcaaccg cgtcggatga atataggtgg 7380 gatagacaat cagggcttga tagatcaggt cggcgatggt cagccgccgc tcgcgacggg 7440 ggcagtggtg ctcatcgacg gtcaggcccc acgaggcgta gaacggcagg ccgtagcagt 7500 gcacctgttt accgtgcagc aatgcttcaa agccgctgag gctcgtcatc gtgtgcacct 7560 cgtccgcacg ctgaatacac tgaatgatat cggcatccag tgcctggtag tctgcgagtt 7620 ccgcgatctg ttccgccgga atgtcaccct tacggttgcc gacgagcaca tcggggtgcg 7680 gcttgtagat gatgtaggcg tgcggattac gttcccgcac ggtgcgcagc agctccagat 7740 tcgacttgat cgacacggtg cccgtcttaa tcgacgcatc gtcttccacc tggcccggca 7800 ccaggatgac tttcttgtcc ttcgcttctg ccgggaggct gaaatcggcc cccaggttat 7860 atttgctcaa tttgctttcc accagacgtt ggcgcaactt ttccgcgcgc atctggtgcg 7920 cgagggtcag ctggctgtga ttcagcagga cctccagttc cgacggacgg gtggcatcgt 7980 aatagatacc gcgcttatcc aggaccaggc tcaacggcgg cagcagatcg ctccccaggc 8040 cggagctgcg caggaagccg tcttccatgc gccacagcgg cagggatttg cgctgtgcct 8100 ccgcacgcca ttgctgttcg cctttcacgc cccacacgac gcaggcgctt gctgcggtac 8160 agcgacggga aaaggagaga cgattcgtgg ccgtttgcag gaagggcttc aggatcgcgc 8220 ttttccacag ggtcaggccc ggcacccaga gataaccatt ccgctgttgc aggtgacgac 8280 gttgcagctg gagccattgg agcaccgtga acagggccga cacctccccg gtctgcggat 8340 caatgtagcg gcaatagcgc agataggccg ctgcgaacag ttcctccagg gtggccgagc 8400 cgcgacgcgc cgacagcagc gccgattggg ggtggcggtc atcggtgagg ccccaccctg 8460 cataccaggg ttggccaaag caggtcacgg gcttaccggc cagcagggct tcaaaaccgt 8520 actgggaggt cacgacgtac acgcgggaca catgacgcag cagggactgc ggcgacacgt 8580 tttccgcaat caggcgcacg cgctgggtgg cacgcaagtc cgcgaagtag ccggtctttt 8640 tcccttccag gacatcggga tgcactttga cccagatttc tgcctgcggg ttttccgcca 8700 tcgctgcttc cagcattgcg gcgaactcat gggggcctgc gttgccgtag gtcacgctca 8760 tgtcattgaa ggtctggtcc accaccagca cgatgttcgt gcgctcgctt tcatccgcca 8820 cgaacgccgg tgccaggttg tacttgctca tgtcgcccgt cacaatggtg tgcatcgcct 8880 cgcgcgcctg atccgccagg gccgcgttgc cggccttgtc ctgcacgagt ttttccagcg 8940 cgctcggttt cgaggcgtcg tagtaaatgc cgcagtcatc cacgacgagc gagaggggcg 9000 gttcaccgtt cacgcccagg tccagcgagc ggacgaaacc atcctccaag cggatcaccg 9060 gcttgcctgc ggctttggcg atggccaccg gctttgcggc cgaggggcgg tgcccccaca 9120 ccgcgattgc atccacttcc tgcgggaccg ggcgcagcag cgacagcttt tggcagggct 9180 gggcgaggaa tttttccagg tgcggaatac gccaaatgcc ggggctataa atgccaatca 9240 tgcgttctcc gcgagctcct gcgccatcag ggcccggacc ttctccaagc acgccggggt 9300 atcgacgccg ggaccggtcg cggcgacctc gaaggtgcga atgttaatgc ccgcgctcat 9360 cagccgcagt tgctccaggg attcggcctg ttcgggcatg gactccggca actggctgta 9420 attttgcagg acatcccgcc gataggcgta gatcccgacg tgcttcaggt agcgcgcctt 9480 ctcggcgttg cgcgggtacg gaatggggga gcgggagaaa tacagggcgt cctgccgcgt 9540 gttcaccacg accttgacgg tggacggttc ggcggcttct gccgcgctga tcgcatgaca 9600 cagggtcgcc accggcagcg ccgggtcgtc ccgcatacct tgcagcaggg tttcgacgtc 9660 acgcgggcga atcatcggct catccccttg caggttgata tagatatccg cctccacctt 9720 atgcatgact tccaccaggc gatcggtgcc gctctcatga tcgttgcggg tcatgatcgc 9780 tttgccgccg aacgcctgga ctgcctgctc cacacgcggg tcgtcggttg cgacccacac 9840 ctctgccacg cctgccactt gcagggcccg ttcgtagacg tgctggatca tcggtttccc 9900 gacgatatcc agcagcggtt tgcccggcag acggctgctg ccgtagcgtg ccgggatcac 9960 aatcacggcc ttcgacattt attaacctcc tcgagttaca gcgacagaat cactttcgcg 10020 cccaccgcca gttggtacag aatggtgctg ataccgcgcg tcacttcgat gttcttcgac 10080 tcgtatttcg gcaacaccat aatttcatca ccgggtttca gggaatcgac gtcttctgcg 10140 ttcaccgctg cgccgttctg acggatgacg ataatacggg cgttgccgga cttctgggtc 10200 agcccaccgc acttctcgat gtagtcctcg gtcgtcatac ctttctgcca cgacaccgcg 10260 ttcgggaaca gcacttcccc gtggaccatg accaacgacg tcttttcggg aatattgatc 10320 acgtcgccgt cctccaggag gacggagtca atgttgcttt cattgaggat cacttcgccc 10380 ttcggcacga cggtgcgggc tttcgcgacg aagcgggaga tcagttgggc ttcctgcata 10440 cgcaggctgg cctcttcctt ggtgctgctc tgtgcgctga ggctggcctc ttcgagcttt 10500 tgcagggaca aattcagcat ttctttctgc cgttgcgcga cgctcggccg atacaactgc 10560 acggcgttca tctgcgacat ggagttcggg cgcacttttt cgagcacggc ccgcatggtg 10620 ctaccgtagg gcagcaccat ggcgtgttcc ccggaatgtg cgccttccac acgcacttga 10680 atggtgcccg catagcggtc ggtggagaca atgagggtat caccgttttg cagcatacgc 10740 cccggtgcgg acgagatcgg ataatattcc gagcgcttct ggaggccctg cttccgcata 10800 atcgtgatat gggtcgcacc cggtttggga cgtgcccagg acagtgcttc ggtgaccggg 10860 atgctcgatt cgcgaaattc aaagtcgtag gaattgaaca catcgccctg caccgagaac 10920 gtatgctggc gcggacccac aatgatcgta tcaccgtccg caaactggga cagccccagt 10980 ttgccgttga gcaggaagtc atagaggttg acgttcgagc gcacacgatt gccgcgtttc 11040 acgacgatgt ccacgtagct gccgcgttcc gggtccacac cacccgcctt gatcaggtag 11100 ttcagcaggc tgtcggaggt gacaccgccg tacaggccgg ggttgcggac aaagccggtc 11160 acatagacct tgaccggctg cgcctgcaag agcgacgcat agacgttcac gttgctctgg 11220 tagacttcct tcaccttgct cgtcaccagc gcgttcaact gggagttcga cacacctgcg 11280 actttgacgg ggccgacatt cggcaggaag atgttgccct tcgggtccac ctggagtgcg 11340 ccatcgaagg tgaacgcacc ccacaggcgg acctggatgg aatcgccggg attcaggatg 11400 tagtccggat tgaaacccac ggttgccccc gagtctgcgc tcgtaccgtt gaacagctgc 11460 gccccgaaca tacggctcat cacgaccggg ggtgcggggg gcggggtgtt atcgaagccg 11520 ctcatgttct gggtgtcgct tttctgcccg ttcaggatgc cggtcaacgg tgcggcaccc 11580 gtgaggttcg gatcggcatt aatgtcgatg gttgcgctcg cctgtgctgc atggcacgct 11640 gcgatcagca ggatcgactt aaacagcttc atttattaac ctcctcgaga agtcgactta 11700 gtcacggtgg tcttcaatca ccgccaggag caatttcagg gtgccaaaga gcaggcaaca 11760 caccagcagc caacacgcga tcaaatacgg gatattcggg aaggagcttt cctggggcag 11820 ctgcggggac gagatcacgc tcaggacttt cagcttacgg gccgcttcga cacgggtctt 11880 ttcgatgctg gtgagcgtga gcttgtacaa ctcggtattg aactcgacct tggatttgat 11940 ctcctcaaaa tccacggcca tgcggttcag tttatcgccc tggggtgcgg taattttcga 12000 cttttcttcg tcgatctgtg cctggaggct ctgaattgca ttgcgggcgc tcacgacttg 12060 gggcgcatcc tcgcgcaggt acgtgagcag gttgcgcagg tcggcttcca tctgaatttt 12120 ctggcccatc agcgtattca ccagggtgga tgccgcctgg gcctgtgcct gcgggtccag 12180 cacattgttg ttgtcttggt aggacaacaa ttcggctttc gatgcatcca gccgctggcg 12240 cgctttttcc atttcggttt ccgcaaacgc caattgatcg cgggcgatac ggtgcgacat 12300 ttcattgatg aaccgctcgg attccttgag cacggtctgg ttgaatttca gcgcgaactc 12360 gggcgaaaag ccctgggtct ggatgttcag cagcccggtc ttgtcgtcgt agctgacgtt 12420 gatgcgatct ttatagtact tcaggaaccc ctcggcggtt tcatccttgg acagatggtt 12480 caggaagtcc aggcccgaat gggagaacgc ttcgcggaag ttcagctgtt tatccagcgc 12540 ggccagcata tccgggctgt tgatgtattc cttcaggtac agtgcgtctt cggcggacga 12600 cgggttggag gcacccaaca gcaggccgaa gttcaggctg ccggagttga gatcgtcgct 12660 gcgcttgatg gccaccttgc tttccgacat atagcggggc tgggagaaga tcgccaagta 12720 gatcagcagc accgccatgg gtgccagaat aatgattttt gccaggtgct tctgaatatc 12780 tgccaggctg atcgcgctca gacgcgcacg catccacgag acggcgcttt tcactttgat 12840 cagcatttat taacctcctg tcgacaacac gtgttaatcg aaaatgcgca ccaacccggt 12900 caccttattt gctttgttgg tcaccagcag ggtcgagacg cggtgtttct gcatcttctc 12960 ttctgcttcg atgatcatgg tgtcttcggg caaggtcagc ggttcgcggg tcatcatctg 13020 tgcggccgtt gcgctcgtca ggctgtcttc tttctccata aagcgccgca gatcgccatc 13080 ggtgatgatg cctgccagcc caccttccgc atcttcgacc atcaccatac cctggcagcc 13140 cgaggtgatg cgctgaatga ccgttttgaa gctggcatcg agctgcactg ccggcacatc 13200 atgttgcatc acgtcggcga cgcgggtcag caggcgccga cccaggctgc caccggggtg 13260 gtagcgtgca aagtcattgg gcataaactt acgctggtga atcatcgcga tggccagcgc 13320 gtccccgatc gccatcgtga gcgtcgtgga ggtggtcggg gcgagattgt tcgggcacgt 13380 ttcgttcgcc atgtgcagct ccaggaccgc atctgcattt ttggccaggg tgctattccc 13440 gttattggtg attgcgatga tgcgattgcc gaagttcttc aggctcggca ccagtttcag 13500 gatctcgtcc gtctcaccgc tcgccgaaat caagatgagc aggtcatacg gggtgatcat 13560 gcccagatca ccatggaacg cttccgccgg atgaataaag aaggagggcg tcccggtcga 13620 ggccaaggtc gccgacatct tgcggcccac atggccgctt ttacccatgc cgctcaggat 13680 gacgtgccct ttacaattca tgatgagatt caggacgcgc tggtactgac cgctatccag 13740 ttgtttggac aggttttgca gtgccgcgct ttgttcggcc agggtctggc ggacgctcgt 13800 aatcagatac ggatcaatgg tcgaggactg gtcatccggc aagtggcgtt cgctcattta 13860 ttaacctcct cacgtgttaa ttaagtaatc gatagtgatt taaatatgca agatccgata 13920 aatcgattga tagatttaaa taagaactgc agaagctagc ttagatgctc gtgaaattga 13980 cgtgggcgct ttgcagggcc gtcttaatgg cgttggtgtc cacgaggatc gagtcgggtg 14040 cggaaaacgg acggttcttg ttggtgaaat cgctgttacc aatgtacagc gattccttgt 14100 tacgcagcgc ctggatgtgc cagcgggacc acgaatccca atacttctgg cgatccggcg 14160 agataccttg gctggtgtag ccggtcgtcg ggctgttcat caacgagtcg gtgcggtgcg 14220 agcccagcgt cagcggcaac ttgatccgat gcaccgtgga atcgccgaag atcagcttca 14280 gacgcgcgat aaattcgcta tccgcacccg ttttcacaca atcccagaca ccggccttct 14340 gcaagacgtc ggcacggcga aacaggagcg acgacggatt cagacgcttc aaggggtaca 14400 ctgcgcgggc atagaaaata ccgttgtctt gcaggcgcac ccagtccgag atggagcaga 14460 tgagcttcgg attgagcaac aagggggaga tttggcggaa cagcttttcc ggatggctcc 14520 agtcatccga atcgtggcag gtgacgaact cgcccttcgc ttggatcaag ccgatacgct 14580 tcgcggcata ggtgccgaca ttctgcggca ggctaatgat cttgatgcgc gtgtctttga 14640 gggcgagccg ctggagacga aacagggtgt catcggtgct cgcgtcatcc acaatgatca 14700 gctcgaagga acggtaggtc tgattgagga gcgaaatcac cgcattttcc acgcggcgac 14760 ccgtattata ggtggtcatc aggatggaga tcaacggccc cgtctgggcc gggtacggga 14820 tgctggtgat gatgttgcac ggggagagcg gggagctgtt gtccgtcaag gccacggggc 14880 tgaggccgaa gtatttatag tattcattca gccgattcag gctaatttcg gcggtttcgc 14940 ggaaggcgtt attttgcagc agcaggatat ccgggctata gacgatatcg gatgcgtcga 15000 tctgggcgag ggtcgagatg gccttttggg tcaggccgat ccggagttgc agtgcggtat 15060 acaggtccag cgggcagttg tccacgttgt ccaacaggct caggctaaag gtcggcgagt 15120 aggacgccag ggttttcgcc agttccactt tctgatgggt atcggtgaac tcgtccttga 15180 actccatcag cagctcgggc gtcaggctga tgtcgccgca ggcgattttt gcgatcttga 15240 ttgccagttt gcagcgccaa tcggacgggg tatccgtcaa gttatgcagc gaccagtaca 15300 tattcagacg atacatcgcg aggatgcgtt tcgactgcca gaaccggcaa tcatcctgga 15360 tggccgcgag cgcgtggacg tagcggctct ttttgagcag ccacaagaat ttgagattat 15420 tgaacattta ttaacctcct gctagcaact taagttacga atcgacgccg aacaggtcgc 15480 gggtgtagac tttctccgag acatcttcca gttcgctggt gcggcgattc gccacaatga 15540 catcgacgcg ctccttaaag gaattgatgt cgcgctcgac gtaggaaccg aagaagtagg 15600 gttctttcag gaccggctcg tacaccacaa tctcgatacc cttggccttc aaacgtttca 15660 tgaccccctg gatgctgctg gcccggaaat tgtcgctacc cgccttcatg atcaggcgat 15720 agataccgac cactttgggc ttacgggaca ggatgtcctc ggccacgaag tccttacggg 15780 tcgtattcgc atccacgatg gcctggatca ggttttgcgg gacgtcgcga taattggcca 15840 acagctgctt cgtatccttc ggcagacagt aaccgccgta gccgaaggac gggttgttgt 15900 aatgttgacc aatgcgcgga tcgagggaga cgccttcgat gatttgtttg gtatccaggc 15960 cgtgcacgct cgcgtaggtg tccagctcgt taaagtacgc gatacgcatc gccagatacg 16020 tgttcgcgaa cagtttgatg gcttctgcct cgggcgaatc cgtcagcagg atcggaatat 16080 cctttttgat ggcaccttcc gacaggagtt cggcgaactt ccgtgcgcgt tccgacgatt 16140 cgcccacgac aatgcggctc ggatagagat tatcatacag ggctttgcct tcgcgcagga 16200 actccgggga aaagatgata ttattcgtgt tcagatcgcg cttcaggcgt tcggtgaacc 16260 cgacggggac ggtggatttg ataatgatgg tcgcgttcgg gttaatggac agcacgtcac 16320 acgcgacgct ttcgacgctc agggtatcaa agttgttatt aatcggatca tagttcgtcg 16380 gggtggcgat gatcacgtag tctgcatcgc gatatgcctc gtatttttcc gtcgtcgcgt 16440 agaggttcag cttacgattg gagagaaact tctggatttc cgggtcgcaa atcggcgaga 16500 ttttcttgtt aatgagctgg accttcttcg ggtcgatgtc cagggcgatg atgtcgtgtt 16560 tttgggagag gaggatcgca atgctgatac ccacatagcc gacgccggcc acggcaattt 16620 tcatttatta acctccttaa gtgaattcaa actagtttac aagtcgtttt cgatcttctc 16680 ccaggtatat ttgcgacatt cattcaagtt ggtcagcggc gagtatttgt actttttgat 16740 accgaggcgc gacaggcttt cgttcaccac cttgaaatgg ttttcctttt ggatgtccag 16800 tttcttgatc gacgtgttct cgccgtgcag gacacggttg tagcaaatct tattgatatg 16860 cttaaacggg ccgacttcgc tgagtttcaa atacatatcg taatccaccg cattgctgat 16920 gctctcgttg aagccttcgg tgaggttcca tgcacgcgcc gtgaacatac ggaagtggtg 16980 gcagatcatc gcgctcgtga gcttttcgcg gctgtaaatc ggccagttgt agccattgct 17040 aatcaagtta ccttcacgat caatattgcg attggtggtg tacacgcagg cgaggctcag 17100 gtctttgcga aattcatcca gacacagttc cacggcatcg ggctccagga aatcatcgga 17160 atccagctgc ccgatgtaga aaccccggca caggcggact gcggtattcg aggcggagcc 17220 gatgcctttg tttttctggc tgatgaaacg gacgcgcggg tggtttgcgt aatgttcttg 17280 caggatgcgc agcgtatcat cggtgctccc gtcatcgcag atgcagacct ccagatcggt 17340 gatcgtttgg ttcagtgccg attcgacgca gcgcacgata tatttgctgc aattatacgc 17400 ggggatgtag atgctcacca ggggcacacg tttcagggtg gcgctctcga ttttctcctt 17460 cttgcgataa aagtagggca ccttctgctg caacagctgg acggtaatgt ttttacctgc 17520 cgcgcgatcg gtttcgttct ccttaccggg cggttcctga tgatatgcca tcgcgccttc 17580 cacgctacgg aaataacaac cctcgcggta cagccgatag ccgaactcat tatcctcacc 17640 gccccaatgc gtgaactctt cgtcaaacca acccgcgcga aacagccact tctttgcaaa 17700 cgccacattg ccaccgctaa agaaccggaa cggggtgttg cacaggcgca gattgtcggt 17760 attcttgaaa tgttcgatgc gccaatcgac ggatttgttc tgctcgacct tgcctgcgac 17820 ctgattattg gtaataatct ccgggatttc attgatcagg cttttctggg acaaaaagtc 17880 cagataggta tgcttcgacg tgtcgatgta tttacgcggg ccaatcagtg ccacgttatc 17940 atccacggcc aggagttcca tataggactg cacccacaac gggttcggcg ccatatcgca 18000 gtccaagatc gccacgtagt tgtatttcgc tgcccgcagg cccaggttcc gcacggcgca 18060 cagctggtag ccgtagtctt tctggcggac gtatttgatg ttcagcaacg actcgaactc 18120 gcggacgatc tcttcgatgt tttccttgga accgtcatcc gcgacgatga cctcatagtc 18180 ataaatcgtt ttctgattgc agaggcaggc cagggtgatc gccaggattt tggcgcgatt 18240 gtacgtcgga atcacgatgg acaggccgtc gatgatcagt tgcttgcgcg gataatcatc 18300 cagttcttta cgtttccctg cccagacgta gtcgttcgtg ctttccggca gcggcggcaa 18360 ggtcaggtcg ctcggccaat ccagcggaat gggttcgact tctttcaatt cggcgcgctc 18420 ggatttcttt gcggtaattt cccgatattt gctaatgatt tcattctttt ccacctcatt 18480 cagcgagatc gcctttgcat tgctgcacat aattttggtt gccgcgtcga tatcaatgac 18540 cgctttccga ttcagcttgt ccacttcttc gctcagattc agggcggttt ggcacagctt 18600 gatattggct tccacccagc tcacatcata gatttccgcc actttttcaa acagggagag 18660 ggcttggcgg tagttcttat tcttatacag attgattgcc tggttcaaaa tgctcattta 18720 ttaacctcct actagtgaat tttcgaatta cttaccgcag tacttgacac ccacctggga 18780 attgtttttg gtgcgtttga attggcggat ggtacggtag atgctaaagg gcaggctgat 18840 cagaccgagc ggaaaattgt tcttattgat gatgagcttg cccagctgat agctcaggtg 18900 tttcttgacc cgttcggctt cgtgtttatc cgcgtacagg aagatgctcg gcaggctcac 18960 ttggtactcc gaatcatatt tcttcttcca ggtccgccat tcgctgatca acgcaaacgg 19020 aatcgagatc agaccgagga acgtcttgga gcggctcacc atcaccgcac ccaggcggta 19080 gccgatatct tgcttgatgc gttcggccgc accatacagc tccggcagtt gtttcttttc 19140 gagacgttga ttgtcgatga agtactgttc gagcttttgc tgcaccagat gcagctgatt 19200 gagcagcaat tctttttcgc acgacagctt ttcgaggcgc tgttgttgca gttcattttt 19260 gttctgttcc tttttcagca gggactcgaa gttctcgatc gcgcactcca gttcctggac 19320 ctggatggtt ttgtttttaa tgatcagatc atactggatc agttcttcct tgctatccga 19380 cagctctttc agaatggctt gataggcgtt cagctgtttg gacgtgtgca gttcgttgtc 19440 cagaatgatc tttttgctgc tctggtacag accgttcacg atatcgaggg tgatctggcg 19500 ttgtttaatg aacgtctccc aaataaagga cggcttatag ttttccttct ccagcacccg 19560 caagggggtg ttggcgttcg attgcaattc aaagtacagt tccttgcaat cgggatagtc 19620 gttcaggacg ttgaagatca agtactcctc cgtctcgctt tgcttgaaaa tgatatcccc 19680 ggtcccgatg tcaataccgc tgagggacat gatctcctga tgttcttttt ccagcgtaat 19740 ggaggcttcg gcggtcttaa agtcattcac gctctgctcc agcgagtggt tgatggtatt 19800 ggagaacgac aacccgaatt tcagtttcag tttgtgttgc agttgctgga tgcagtcctc 19860 ggcgttgcgc ttcacctgtt cgctcgacac cagcaggcac cgaccccggt tgttgaggaa 19920 gaagtgcagc aaggcggtgt tgtatgccag ccagtttttg atcagatgct ccgaggtata 19980 gttgctggag atgttctggt ccgagaagta gttcgtcagg atgcttttgg ggtggtcgta 20040 gatgaggata aaggtgatgt tctcatccac cgatttccaa tattccaacg tgtgaattgc 20100 gttggggtcg ctccaaccgc acagtttctg gttcaggttg gacagcatca gatccaatgc 20160 gataccgttc cagacggtgc tcacatggag cggttcaaag tcggcggaat cggtcaccgt 20220 atagatgtcc ggcgactggt acgccttccg cagcgtctgg gtgatgtcct ggggcgagag 20280 gttctcacgt ttggacgggc acagggagtt catgccgcgc tgatgcagga gttcttccac 20340 gatttggtag ttgctgctcg gatggcccac gatcaccagg cggttcattt attaacctcc 20400 tttcgaaaat gaacggtccg ttaaatatag ccattcggat tcttcatctg ccagcgccag 20460 gcgtcctcca gcatggtttc gagttcccgc ttggctttcc agttcagata tttgttggcc 20520 ttttcggggg aggaccagct ctccgcgata tcaccgtcac ggcggctcac gatttcatac 20580 ggaatccgca cgccggaaat cttttcaaag gtggacacca gttccagcac cgaataacct 20640 ttacccgtgc ccaaattaaa gacgtggtag ttggtgttat tgtcgcggaa gagataggac 20700 agcgctgcga cgtgcccttc ggccaggtcc atcacatgga tatagtcacg gacccccgtg 20760 ccgtctttgg tgggataatc accaccgaac accatcagtt tttccagttt ccccatcgcg 20820 acctgcaaga tgtacggcac caagttggag gggatgtctg ccgggctttc accaatcata 20880 ccggattcgt gggcgcccgt cggattaaag tagcgcaagc agaggaaatt cgtgtcggag 20940 tatttcttgg cgatgtcgcg gatcatcagc tccgagatgt acttggacgt accatacgga 21000 ttcagcgtgc caccaatatg gcagtcttcg gtgacgggca tgatcttgct ttccccatac 21060 accgtcgccg acgagctaaa gatgaagttg gcgacgtcgt tcttgatggc gcaattgatg 21120 agttgcaggg tgccgctcac gttgttgtca tagtagaaga tgggcttgat caggctttct 21180 gcgaccgatt tcgcacctgc aaagtgcatg atgcagtcga atttgtgttt cttcaggatc 21240 tggttcactt ccttctcgtt gttgatattg agttcgtaga acgtgacttt cttctttgcg 21300 atcagctcaa tgcgacggat gctttcgcag ctgctgttga tgagattgtc aatgatgacg 21360 acattgtagc ctttgttcag caggcagagc gacgtgtggc tgccgatgta gcctgcaccg 21420 ccggtgacca ggatgttcat ttattaacct cctcggtccg aattaaccta ggttatgagg 21480 tcagcattgc ttcttcacgc gtacggtaca gggccaaacc aataaacagg gtcaccaggg 21540 tgaacattgc cagataattc aggctgaccc cttcgctgat ataaccgggc atcacggcct 21600 cgcggctcag ttcgacgacg tgcaccaggg gattccacag caggtacgac caatactgct 21660 tcggaatgga gtgcagcggg aacatgatgc acgaaataaa gtacagcggc ttcagcaaga 21720 tcggcaagac tttctgcatt tcggggaacg tcttgcccac gaccatgaag atcaggccca 21780 caccgcacga caggatgatc aggaggctcc aggtgagcac aaattgcagg aagttggtaa 21840 tctcgaaata ttcgcccgcc atccagatga tcagcatcag gaggatgtag accgccacat 21900 agatcagcgt ttccaagagg gcgcgtgcaa tgatcgtgtc gatcggcttc acgggccggt 21960 agttaaacag cccctgattg gcttcgatgg cgcccacgga gcgattgctg atgctgctga 22020 aaataaagaa cgggatcagg ccattgagca ggaacaccgg gaaggagata tccggcatgg 22080 tgcgatgcat gatatagcca aagatcccga gcagaatcag cagatgtgcg ctcggttcca 22140 ggatcgccca cagatagccc aggcgaaact tgccaaagcg cgtacggatt tcgcggagaa 22200 acagtgcttc gaccgtcact ttctggactt caaaacccga acgtgccatt tattaacctc 22260 ctggtaccaa tctagattgt ttaaacagat ctgttacctg caggattatt gtttctgttg 22320 cataaagcct aaggggtagg cctttctaga gatagccatt ttttgcactc ctgtatccgc 22380 ttcttgcaag gctggactta tccctatcaa accggacact gcaggctgac aagctttcat 22440 tacatatgaa gagtttgtag aaacgcaaaa aggccatccg tcaggatggc cttctaagaa 22500 ggctcgagtg gcgcgcctaa gtcgaatttc tgccattcat ccgcttatta tacttattca 22560 ggcgtagcac caggcgttta agggcaccaa taactgcctt aaaaaaatta cgccccgccc 22620 tgccactcat cgcagtactg ttgtaattca ttaagcattc tgccgacatg gaagccatca 22680 cagacggcat gatgaacctg aatcgccagc ggcatcagca ccttgtcgcc ttgcgtataa 22740 tatttgccca tggtgaaaac gggggcgaag aagttgtcca tattggccac gtttaaatca 22800 aaactggtga aactcaccca gggattggct gagacgaaaa acatattctc aataaaccct 22860 ttagggaaat aggccaggtt ttcaccgtaa cacgccacat cttgcgaata tatgtgtaga 22920 aactgccgga aatcgtcgtg gtattcactc cagagcgatg aaaacgtttc agtttgctca 22980 tggaaaacgg tgtaacaagg gtgaacacta tcccatatca ccagctcacc gtctttcatt 23040 gccatacgga attccggatg agcattcatc aggcgggcaa gaatgtgaat aaaggccgga 23100 taaaacttgt gcttattttt ctttacggtc tttaaaaagg ccgtaatatc cagctgaacg 23160 gtctggttat aggtacattg agcaactgac tgaaatgcct caaaatgttc tttacgatgc 23220 cattgggata tatcaacggt ggtatatcca gtgatttttt tctccatttt agcttcctta 23280 gctcctgaaa atctcgataa ctcaaaaaat acgcccggta gtgatcttat ttcattatgg 23340 tgaaagttgg aacctcttac gtgccgatca acgtctcatt ttcgccaaaa gttggcccag 23400 ggcttcccgg tatcaacagg gacaccagga tttatttatt ctgcgaagtg atcttccgtc 23460 acaggtattt attcggcgca aagggcctcg tgatacgcct atttttatag gttaatgtca 23520 tgataataat ggtttcttag acgtcaggtg gcacttttcg gggaaatgtg cgcgcccgcg 23580 ttcctgctgg cgctgggcct gtttctggcg ctggacttcc cgctgttccg tcagcagctt 23640 ttcgcccacg gccttgatga tcgcggcggc cttggcctgc atatcccgat tcaacggccc 23700 cagggcgtcc agaacgggct tcaggcgctc ccgaaggt 23738 <210> 46 <211> 16 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 46 aggaggttaa taaatg 16 <210> 47 <211> 9089 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 47 cctgcaggta acagatctgt ttaaacaatc tagattggta ccaggaggtt aataaatggc 60 acgttcgggt tttgaagtcc agaaagtgac ggtcgaagca ctgtttctcc gcgaaatccg 120 tacgcgcttt ggcaagtttc gcctgggcta tctgtgggcg atcctggaac cgagcgcaca 180 tctgctgatt ctgctcggga tctttggcta tatcatgcat cgcaccatgc cggatatctc 240 cttcccggtg ttcctgctca atggcctgat cccgttcttt attttcagca gcatcagcaa 300 tcgctccgtg ggcgccatcg aagccaatca ggggctgttt aactaccggc ccgtgaagcc 360 gatcgacacg atcattgcac gcgccctctt ggaaacgctg atctatgtgg cggtctacat 420 cctcctgatg ctgatcatct ggatggcggg cgaatatttc gagattacca acttcctgca 480 atttgtgctc acctggagcc tcctgatcat cctgtcgtgc ggtgtgggcc tgatcttcat 540 ggtcgtgggc aagacgttcc ccgaaatgca gaaagtcttg ccgatcttgc tgaagccgct 600 gtactttatt tcgtgcatca tgttcccgct gcactccatt ccgaagcagt attggtcgta 660 cctgctgtgg aatcccctgg tgcacgtcgt cgaactgagc cgcgaggccg tgatgcccgg 720 ttatatcagc gaaggggtca gcctgaatta tctggcaatg ttcaccctgg tgaccctgtt 780 tattggtttg gccctgtacc gtacgcgtga ggaggcaatg ttgacctcat gattaagatc 840 gaaaacctga cgaaaagcta ccgcaccccg gtgggccgtc actatgtctt caagaacctg 900 aacattgaga tccccagcgg caaaagcgtg gcgttcatcg ggcgcaatgg ggcgggtaaa 960 tccacgctgt tgcgcatgat tgggggcatc gaccgcccgg atagcggtaa aatcatcacg 1020 aataaaacga tctcgtggcc ggtgggtctg gcaggcggct tccagggcag cttgaccggg 1080 cgtgaaaacg tgaagttcgt ggcccggctg tacgcgaagc aggaggagct gaaagaaaag 1140 attgagtttg tggaagagtt cgcggagctg gggaagtatt ttgatatgcc gatcaagacc 1200 tattcgagcg gtatgcgcag ccgcctcggc ttcggcctga gcatggcgtt caagttcgat 1260 tactacatcg tggacgaggt gacggcggtg ggggacgccc gtttcaagga aaaatgtgcc 1320 caactcttca aggagcgtca taaggaaagc tccttcctca tggtgtcgca ctcgctgaac 1380 tcgttgaaag agttctgcga tgtggcaatc gtgtttaaag acgacaacgc cgtgtcgttc 1440 catgaagacg tgcaagaagg cattgaagaa tatatcaccg aacaaaacaa ctactaaacg 1500 cgtgaagaag caatgctgac ctcataacct aggttaattc ggaccgagga ggttaataaa 1560 tgaacatcct ggtcaccggc ggtgcaggct acatcggcag ccacacgtcg ctctgcctgc 1620 tgaacaaagg ctacaatgtc gtcatcattg acaatctcat caacagcagc tgcgaaagca 1680 tccgtcgcat tgagctgatc gcaaagaaga aagtcacgtt ctacgaactc aatatcaaca 1740 acgagaagga agtgaaccag atcctgaaga aacacaaatt cgactgcatc atgcactttg 1800 caggtgcgaa atcggtcgca gaaagcctga tcaagcccat cttctactat gacaacaacg 1860 tgagcggcac cctgcaactc atcaattgcg ccatcaagaa cgacgtcgcc aacttcatct 1920 ttagctcgtc ggcgacggtg tatggggaaa gcaagatcat gcccgtcacc gaagactgcc 1980 atattggtgg cacgctgaat ccgtatggta cgtccaagta catctcggag ctgatgatcc 2040 gcgacatcgc caagaaatac tccgacacga atttcctctg cttgcgctac tttaatccga 2100 cgggcgccca cgaatccggt atgattggtg aaagcccggc agacatcccc tccaacttgg 2160 tgccgtacat cttgcaggtc gcgatgggga aactggaaaa actgatggtg ttcggtggtg 2220 attatcccac caaagacggc acgggggtcc gtgactatat ccatgtgatg gacctggccg 2280 aagggcacgt cgcagcgctg tcctatctct tccgcgacaa taacaccaac taccacgtct 2340 ttaatttggg cacgggtaaa ggttattcgg tgctggaact ggtgtccacc tttgaaaaga 2400 tttccggcgt gcggattccg tatgaaatcg tgagccgccg tgacggtgat atcgcggaga 2460 gctggtcctc ccccgaaaag gccaacaaat atctgaactg gaaagccaag cgggaactcg 2520 aaaccatgct ggaggacgcc tggcgctggc agatgaagaa tccgaatggc tatatttaac 2580 ggaccgttca ttttcgaaag gaggttaata aatgaaccgc ctggtgatcg tgggccatcc 2640 gagcagcaac taccaaatcg tggaagaact cctgcatcag cgcggcatga actccctgtg 2700 cccgtccaaa cgtgagaacc tctcgcccca ggacatcacc cagacgctgc ggaaggcgta 2760 ccagtcgccg gacatctata cggtgaccga ttccgccgac tttgaaccgc tccatgtgag 2820 caccgtctgg aacggtatcg cattggatct gatgctgtcc aacctgaacc agaaactgtg 2880 cggttggagc gaccccaacg caattcacac gttggaatat tggaaatcgg tggatgagaa 2940 catcaccttt atcctcatct acgaccaccc caaaagcatc ctgacgaact acttctcgga 3000 ccagaacatc tccagcaact atacctcgga gcatctgatc aaaaactggc tggcatacaa 3060 caccgccttg ctgcacttct tcctcaacaa ccggggtcgg tgcctgctgg tgtcgagcga 3120 acaggtgaag cgcaacgccg aggactgcat ccagcaactg caacacaaac tgaaactgaa 3180 attcgggttg tcgttctcca ataccatcaa ccactcgctg gagcagagcg tgaatgactt 3240 taagaccgcc gaagcctcca ttacgctgga aaaagaacat caggagatca tgtccctcag 3300 cggtattgac atcgggaccg gggatatcat tttcaagcaa agcgagacgg aggagtactt 3360 gatcttcaac gtcctgaacg actatcccga ttgcaaggaa ctgtactttg aattgcaatc 3420 gaacgccaac acccccttgc gggtgctgga gaaggaaaac tataagccgt cctttatttg 3480 ggagacgttc attaaacaac gccagatcac cctcgatatc gtgaacggtc tgtaccagag 3540 cagcaaaaag atcattctgg acaacgaact gcacacgtcc aaacagctga acgcctatca 3600 agccattctg aaagagctgt cggatagcaa ggaagaactg atccagtatg atctgatcat 3660 taaaaacaaa accatccagg tccaggaact ggagtgcgcg atcgagaact tcgagtccct 3720 gctgaaaaag gaacagaaca aaaatgaact gcaacaacag cgcctcgaaa agctgtcgtg 3780 cgaaaaagaa ttgctgctca atcagctgca tctggtgcag caaaagctcg aacagtactt 3840 catcgacaat caacgtctcg aaaagaaaca actgccggag ctgtatggtg cggccgaacg 3900 catcaagcaa gatatcggct accgcctggg tgcggtgatg gtgagccgct ccaagacgtt 3960 cctcggtctg atctcgattc cgtttgcgtt gatcagcgaa tggcggacct ggaagaagaa 4020 atatgattcg gagtaccaag tgagcctgcc gagcatcttc ctgtacgcgg ataaacacga 4080 agccgaacgg gtcaagaaac acctgagcta tcagctgggc aagctcatca tcaataagaa 4140 caattttccg ctcggtctga tcagcctgcc ctttagcatc taccgtacca tccgccaatt 4200 caaacgcacc aaaaacaatt cccaggtggg tgtcaagtac tgcggtaagt aattcgaaaa 4260 ttcactagta ggaggttaat aaatgagcat tttgaaccag gcaatcaatc tgtataagaa 4320 taagaactac cgccaagccc tctccctgtt tgaaaaagtg gcggaaatct atgatgtgag 4380 ctgggtggaa gccaatatca agctgtgcca aaccgccctg aatctgagcg aagaagtgga 4440 caagctgaat cggaaagcgg tcattgatat cgacgcggca accaaaatta tgtgcagcaa 4500 tgcaaaggcg atctcgctga atgaggtgga aaagaatgaa atcattagca aatatcggga 4560 aattaccgca aagaaatccg agcgcgccga attgaaagaa gtcgaaccca ttccgctgga 4620 ttggccgagc gacctgacct tgccgccgct gccggaaagc acgaacgact acgtctgggc 4680 agggaaacgt aaagaactgg atgattatcc gcgcaagcaa ctgatcatcg acggcctgtc 4740 catcgtgatt ccgacgtaca atcgcgccaa aatcctggcg atcaccctgg cctgcctctg 4800 caatcagaaa acgatttatg actatgaggt catcgtcgcg gatgacggtt ccaaggaaaa 4860 catcgaagag atcgtccgcg agttcgagtc gttgctgaac atcaaatacg tccgccagaa 4920 agactacggc taccagctgt gcgccgtgcg gaacctgggc ctgcgggcag cgaaatacaa 4980 ctacgtggcg atcttggact gcgatatggc gccgaacccg ttgtgggtgc agtcctatat 5040 ggaactcctg gccgtggatg ataacgtggc actgattggc ccgcgtaaat acatcgacac 5100 gtcgaagcat acctatctgg actttttgtc ccagaaaagc ctgatcaatg aaatcccgga 5160 gattattacc aataatcagg tcgcaggcaa ggtcgagcag aacaaatccg tcgattggcg 5220 catcgaacat ttcaagaata ccgacaatct gcgcctgtgc aacaccccgt tccggttctt 5280 tagcggtggc aatgtggcgt ttgcaaagaa gtggctgttt cgcgcgggtt ggtttgacga 5340 agagttcacg cattggggcg gtgaggataa tgagttcggc tatcggctgt accgcgaggg 5400 ttgttatttc cgtagcgtgg aaggcgcgat ggcatatcat caggaaccgc ccggtaagga 5460 gaacgaaacc gatcgcgcgg caggtaaaaa cattaccgtc cagctgttgc agcagaaggt 5520 gccctacttt tatcgcaaga aggagaaaat cgagagcgcc accctgaaac gtgtgcccct 5580 ggtgagcatc tacatccccg cgtataattg cagcaaatat atcgtgcgct gcgtcgaatc 5640 ggcactgaac caaacgatca ccgatctgga ggtctgcatc tgcgatgacg ggagcaccga 5700 tgatacgctg cgcatcctgc aagaacatta cgcaaaccac ccgcgcgtcc gtttcatcag 5760 ccagaaaaac aaaggcatcg gctccgcctc gaataccgca gtccgcctgt gccggggttt 5820 ctacatcggg cagctggatt ccgatgattt cctggagccc gatgccgtgg aactgtgtct 5880 ggatgaattt cgcaaagacc tgagcctcgc ctgcgtgtac accaccaatc gcaatattga 5940 tcgtgaaggt aacttgatta gcaatggcta caactggccg atttacagcc gcgaaaagct 6000 cacgagcgcg atgatctgcc accacttccg tatgttcacg gcgcgtgcat ggaacctcac 6060 cgaaggcttc aacgagagca tcagcaatgc ggtggattac gatatgtatt tgaaactcag 6120 cgaagtcggc ccgtttaagc atatcaataa gatttgctac aaccgtgtcc tgcacggcga 6180 gaacacgtcg atcaagaaac tggacatcca aaaggaaaac catttcaagg tggtgaacga 6240 aagcctgtcg cgcctcggta tcaaaaagta caaatactcg ccgctgacca acttgaatga 6300 atgtcgcaaa tatacctggg agaagatcga aaacgacttg taaactagtt tgaattcact 6360 taaggaggtt aataaatgaa aattgccgtg gccggcgtcg gctatgtggg tatcagcatt 6420 gcgatcctcc tctcccaaaa acacgacatc atcgccctgg acatcgaccc gaagaaggtc 6480 cagctcatta acaagaaaat ctcgccgatt tgcgacccgg aaatccagaa gtttctctcc 6540 aatcgtaagc tgaacctcta cgcgacgacg gaaaaatacg aggcatatcg cgatgcagac 6600 tacgtgatca tcgccacccc gacgaactat gatccgatta ataacaactt tgataccctg 6660 agcgtcgaaa gcgtcgcgtg tgacgtgctg tccattaacc cgaacgcgac catcattatc 6720 aaatccaccg tccccgtcgg gttcaccgaa cgcctgaagc gcgatctgaa cacgaataat 6780 atcatctttt ccccggagtt cctgcgcgaa ggcaaagccc tgtatgataa tctctatccg 6840 agccgcattg tcgtgggcga atcgtcggaa cgcgcacgga agttcgccga actcctgtcg 6900 gaaggtgcca tcaaaaagga tattccgatc ctgctgacgg attcgcccga ggcagaagcc 6960 atcaaactgt tcgcgaacac gtatctggcg atgcgtatcg cgtactttaa cgagctggac 7020 acctacgcga gcgtgcacgg cctggatacc aaacaaatca tcgaaggcgt ctccctcgat 7080 ccgcgcattg gtcaacatta caacaacccg tccttcggct acggcggtta ctgtctgccg 7140 aaggatacga agcagctgtt ggccaattat cgcgacgtcc cgcaaaacct gatccaggcc 7200 atcgtggatg cgaatacgac ccgtaaggac ttcgtggccg aggacatcct gtcccgtaag 7260 cccaaagtgg tcggtatcta tcgcctgatc atgaaggcgg gtagcgacaa tttccgggcc 7320 agcagcatcc agggggtcat gaaacgtttg aaggccaagg gtatcgagat tgtggtgtac 7380 gagccggtcc tgaaagaacc ctacttcttc ggttcctacg tcgagcgcga catcaattcc 7440 tttaaggagc gcgtcgatgt cattgtggcg aatcgccgca ccagcgaact ggaagatgtc 7500 tcggagaaag tctacacccg cgacctgttc ggcgtcgatt cgtaacttaa gttgctagca 7560 ggaggttaat aaatgttcaa taatctcaaa ttcttgtggc tgctcaaaaa gagccgctac 7620 gtccacgcgc tcgcggccat ccaggatgat tgccggttct ggcagtcgaa acgcatcctc 7680 gcgatgtatc gtctgaatat gtactggtcg ctgcataact tgacggatac cccgtccgat 7740 tggcgctgca aactggcaat caagatcgca aaaatcgcct gcggcgacat cagcctgacg 7800 cccgagctgc tgatggagtt caaggacgag ttcaccgata cccatcagaa agtggaactg 7860 gcgaaaaccc tggcgtccta ctcgccgacc tttagcctga gcctgttgga caacgtggac 7920 aactgcccgc tggacctgta taccgcactg caactccgga tcggcctgac ccaaaaggcc 7980 atctcgaccc tcgcccagat cgacgcatcc gatatcgtct atagcccgga tatcctgctg 8040 ctgcaaaata acgccttccg cgaaaccgcc gaaattagcc tgaatcggct gaatgaatac 8100 tataaatact tcggcctcag ccccgtggcc ttgacggaca acagctcccc gctctccccg 8160 tgcaacatca tcaccagcat cccgtacccg gcccagacgg ggccgttgat ctccatcctg 8220 atgaccacct ataatacggg tcgccgcgtg gaaaatgcgg tgatttcgct cctcaatcag 8280 acctaccgtt ccttcgagct gatcattgtg gatgacgcga gcaccgatga caccctgttt 8340 cgtctccagc ggctcgccct caaagacacg cgcatcaaga tcattagcct gccgcagaat 8400 gtcggcacct atgccgcgaa gcgtatcggc ttgatccaag cgaagggcga gttcgtcacc 8460 tgccacgatt cggatgactg gagccatccg gaaaagctgt tccgccaaat ctcccccttg 8520 ttgctcaatc cgaagctcat ctgctccatc tcggactggg tgcgcctgca agacaacggt 8580 attttctatg cccgcgcagt gtaccccttg aagcgtctga atccgtcgtc gctcctgttt 8640 cgccgtgccg acgtcttgca gaaggccggt gtctgggatt gtgtgaaaac gggtgcggat 8700 agcgaattta tcgcgcgtct gaagctgatc ttcggcgatt ccacggtgca tcggatcaag 8760 ttgccgctga cgctgggctc gcaccgcacc gactcgttga tgaacagccc gacgaccggc 8820 tacaccagcc aaggtatctc gccggatcgc cagaagtatt gggattcgtg gtcccgctgg 8880 cacatccagg cgctgcgtaa caaggaatcg ctgtacattg gtaacagcga tttcaccaac 8940 aagaaccgtc cgttttccgc acccgactcg atcctcgtgg acaccaacgc cattaagacg 9000 gccctgcaaa gcgcccacgt caatttcacg agcatctaag ctagcttctg cagttcttat 9060 ttaaatctat caatcgattt atcggatcc 9089 <210> 48 <211> 8016 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 48 cctgcaggta actagatctt gcatatttaa atcactatcg attacttaat taacacgtga 60 ggaggttaat aaatgagcga acgccacttg ccggatgacc agtcctcgac cattgatccg 120 tatctgatta cgagcgtccg ccagaccctg gccgaacaaa gcgcggcact gcaaaacctg 180 tccaaacaac tggatagcgg tcagtaccag cgcgtcctga atctcatcat gaattgtaaa 240 gggcacgtca tcctgagcgg catgggtaaa agcggccatg tgggccgcaa gatgtcggcg 300 accttggcct cgaccgggac gccctccttc tttattcatc cggcggaagc gttccatggt 360 gatctgggca tgatcacccc gtatgacctg ctcatcttga tttcggcgag cggtgagacg 420 gacgagatcc tgaaactggt gccgagcctg aagaacttcg gcaatcgcat catcgcaatc 480 accaataacg ggaatagcac cctggccaaa aatgcagatg cggtcctgga gctgcacatg 540 gcgaacgaaa cgtgcccgaa caatctcgcc ccgaccacct ccacgacgct cacgatggcg 600 atcggggacg cgctggccat cgcgatgatt caccagcgta agtttatgcc caatgacttt 660 gcacgctacc accccggtgg cagcctgggt cggcgcctgc tgacccgcgt cgccgacgtg 720 atgcaacatg atgtgccggc agtgcagctc gatgccagct tcaaaacggt cattcagcgc 780 atcacctcgg gctgccaggg tatggtgatg gtcgaagatg cggaaggtgg gctggcaggc 840 atcatcaccg atggcgatct gcggcgcttt atggagaaag aagacagcct gacgagcgca 900 acggccgcac agatgatgac ccgcgaaccg ctgaccttgc ccgaagacac catgatcatc 960 gaagcagaag agaagatgca gaaacaccgc gtctcgaccc tgctggtgac caacaaagca 1020 aataaggtga ccgggttggt gcgcattttc gattaacacg tgttgtcgac aggaggttaa 1080 taaatgctga tcaaagtgaa aagcgccgtc tcgtggatgc gtgcgcgtct gagcgcgatc 1140 agcctggcag atattcagaa gcacctggca aaaatcatta ttctggcacc catggcggtg 1200 ctgctgatct acttggcgat cttctcccag ccccgctata tgtcggaaag caaggtggcc 1260 atcaagcgca gcgacgatct caactccggc agcctgaact tcggcctgct gttgggtgcc 1320 tccaacccgt cgtccgccga agacgcactg tacctgaagg aatacatcaa cagcccggat 1380 atgctggccg cgctggataa acagctgaac ttccgcgaag cgttctccca ttcgggcctg 1440 gacttcctga accatctgtc caaggatgaa accgccgagg ggttcctgaa gtactataaa 1500 gatcgcatca acgtcagcta cgacgacaag accgggctgc tgaacatcca gacccagggc 1560 ttttcgcccg agttcgcgct gaaattcaac cagaccgtgc tcaaggaatc cgagcggttc 1620 atcaatgaaa tgtcgcaccg tatcgcccgc gatcaattgg cgtttgcgga aaccgaaatg 1680 gaaaaagcgc gccagcggct ggatgcatcg aaagccgaat tgttgtccta ccaagacaac 1740 aacaatgtgc tggacccgca ggcacaggcc caggcggcat ccaccctggt gaatacgctg 1800 atgggccaga aaattcagat ggaagccgac ctgcgcaacc tgctcacgta cctgcgcgag 1860 gatgcgcccc aagtcgtgag cgcccgcaat gcaattcaga gcctccaggc acagatcgac 1920 gaagaaaagt cgaaaattac cgcaccccag ggcgataaac tgaaccgcat ggccgtggat 1980 tttgaggaga tcaaatccaa ggtcgagttc aataccgagt tgtacaagct cacgctcacc 2040 agcatcgaaa agacccgtgt cgaagcggcc cgtaagctga aagtcctgag cgtgatctcg 2100 tccccgcagc tgccccagga aagctccttc ccgaatatcc cgtatttgat cgcgtgttgg 2160 ctgctggtgt gttgcctgct ctttggcacc ctgaaattgc tcctggcggt gattgaagac 2220 caccgtgact aagtcgactt ctcgaggagg ttaataaatg aagctgttta agtcgatcct 2280 gctgatcgca gcgtgccatg cagcacaggc gagcgcaacc atcgacatta atgccgatcc 2340 gaacctcacg ggtgccgcac cgttgaccgg catcctgaac gggcagaaaa gcgacaccca 2400 gaacatgagc ggcttcgata acaccccgcc ccccgcaccc ccggtcgtga tgagccgtat 2460 gttcggggcg cagctgttca acggtacgag cgcagactcg ggggcaaccg tgggtttcaa 2520 tccggactac atcctgaatc ccggcgattc catccaggtc cgcctgtggg gtgcgttcac 2580 cttcgatggc gcactccagg tggacccgaa gggcaacatc ttcctgccga atgtcggccc 2640 cgtcaaagtc gcaggtgtgt cgaactccca gttgaacgcg ctggtgacga gcaaggtgaa 2700 ggaagtctac cagagcaacg tgaacgtcta tgcgtcgctc ttgcaggcgc agccggtcaa 2760 ggtctatgtg accggctttg tccgcaaccc cggcctgtac ggcggtgtca cctccgacag 2820 cctgctgaac tacctgatca aggcgggtgg tgtggacccg gaacgcggca gctacgtgga 2880 catcgtcgtg aaacgcggca atcgtgtgcg ctcgaacgtc aacctctatg acttcctgct 2940 caacggcaaa ctggggctgt cccagtttgc ggacggtgat acgatcattg tgggtccgcg 3000 ccagcatacg ttctcggtgc agggcgatgt gttcaattcc tacgactttg aatttcgcga 3060 atcgagcatc ccggtcaccg aagcactgtc ctgggcacgt cccaaaccgg gtgcgaccca 3120 tatcacgatt atgcggaagc agggcctcca gaagcgctcg gaatattatc cgatctcgtc 3180 cgcaccgggg cgtatgctgc aaaacggtga taccctcatt gtctccaccg accgctatgc 3240 gggcaccatt caagtgcgtg tggaaggcgc acattccggg gaacacgcca tggtgctgcc 3300 ctacggtagc accatgcggg ccgtgctcga aaaagtgcgc ccgaactcca tgtcgcagat 3360 gaacgccgtg cagttgtatc ggccgagcgt cgcgcaacgg cagaaagaaa tgctgaattt 3420 gtccctgcaa aagctcgaag aggccagcct cagcgcacag agcagcacca aggaagaggc 3480 cagcctgcgt atgcaggaag cccaactgat ctcccgcttc gtcgcgaaag cccgcaccgt 3540 cgtgccgaag ggcgaagtga tcctcaatga aagcaacatt gactccgtcc tcctggagga 3600 cggcgacgtg atcaatattc ccgaaaagac gtcgttggtc atggtccacg gggaagtgct 3660 gttcccgaac gcggtgtcgt ggcagaaagg tatgacgacc gaggactaca tcgagaagtg 3720 cggtgggctg acccagaagt ccggcaacgc ccgtattatc gtcatccgtc agaacggcgc 3780 agcggtgaac gcagaagacg tcgattccct gaaacccggt gatgaaatta tggtgttgcc 3840 gaaatacgag tcgaagaaca tcgaagtgac gcgcggtatc agcaccattc tgtaccaact 3900 ggcggtgggc gcgaaagtga ttctgtcgct gtaactcgag gaggttaata aatgtcgaag 3960 gccgtgattg tgatcccggc acgctacggc agcagccgtc tgccgggcaa accgctgctg 4020 gatatcgtcg ggaaaccgat gatccagcac gtctacgaac gggccctgca agtggcaggc 4080 gtggcagagg tgtgggtcgc aaccgacgac ccgcgtgtgg agcaggcagt ccaggcgttc 4140 ggcggcaaag cgatcatgac ccgcaacgat catgagagcg gcaccgatcg cctggtggaa 4200 gtcatgcata aggtggaggc ggatatctat atcaacctgc aaggggatga gccgatgatt 4260 cgcccgcgtg acgtcgaaac cctgctgcaa ggtatgcggg acgacccggc gctgccggtg 4320 gcgaccctgt gtcatgcgat cagcgcggca gaagccgccg aaccgtccac cgtcaaggtc 4380 gtggtgaaca cgcggcagga cgccctgtat ttctcccgct cccccattcc gtacccgcgc 4440 aacgccgaga aggcgcgcta cctgaagcac gtcgggatct acgcctatcg gcgggatgtc 4500 ctgcaaaatt acagccagtt gccggagtcc atgcccgaac aggccgaatc cctggagcaa 4560 ctgcggctga tgagcgcggg cattaacatt cgcaccttcg aggtcgccgc gaccggtccc 4620 ggcgtcgata ccccggcgtg cttggagaag gtccgggccc tgatggcgca ggagctcgcg 4680 gagaacgcat gattggcatt tatagccccg gcatttggcg tattccgcac ctggaaaaat 4740 tcctcgccca gccctgccaa aagctgtcgc tgctgcgccc ggtcccgcag gaagtggatg 4800 caatcgcggt gtgggggcac cgcccctcgg ccgcaaagcc ggtggccatc gccaaagccg 4860 caggcaagcc ggtgatccgc ttggaggatg gtttcgtccg ctcgctggac ctgggcgtga 4920 acggtgaacc gcccctctcg ctcgtcgtgg atgactgcgg catttactac gacgcctcga 4980 aaccgagcgc gctggaaaaa ctcgtgcagg acaaggccgg caacgcggcc ctggcggatc 5040 aggcgcgcga ggcgatgcac accattgtga cgggcgacat gagcaagtac aacctggcac 5100 cggcgttcgt ggcggatgaa agcgagcgca cgaacatcgt gctggtggtg gaccagacct 5160 tcaatgacat gagcgtgacc tacggcaacg caggccccca tgagttcgcc gcaatgctgg 5220 aagcagcgat ggcggaaaac ccgcaggcag aaatctgggt caaagtgcat cccgatgtcc 5280 tggaagggaa aaagaccggc tacttcgcgg acttgcgtgc cacccagcgc gtgcgcctga 5340 ttgcggaaaa cgtgtcgccg cagtccctgc tgcgtcatgt gtcccgcgtg tacgtcgtga 5400 cctcccagta cggttttgaa gccctgctgg ccggtaagcc cgtgacctgc tttggccaac 5460 cctggtatgc agggtggggc ctcaccgatg accgccaccc ccaatcggcg ctgctgtcgg 5520 cgcgtcgcgg ctcggccacc ctggaggaac tgttcgcagc ggcctatctg cgctattgcc 5580 gctacattga tccgcagacc ggggaggtgt cggccctgtt cacggtgctc caatggctcc 5640 agctgcaacg tcgtcacctg caacagcgga atggttatct ctgggtgccg ggcctgaccc 5700 tgtggaaaag cgcgatcctg aagcccttcc tgcaaacggc cacgaatcgt ctctcctttt 5760 cccgtcgctg taccgcagca agcgcctgcg tcgtgtgggg cgtgaaaggc gaacagcaat 5820 ggcgtgcgga ggcacagcgc aaatccctgc cgctgtggcg catggaagac ggcttcctgc 5880 gcagctccgg cctggggagc gatctgctgc cgccgttgag cctggtcctg gataagcgcg 5940 gtatctatta cgatgccacc cgtccgtcgg aactggaggt cctgctgaat cacagccagc 6000 tgaccctcgc gcaccagatg cgcgcggaaa agttgcgcca acgtctggtg gaaagcaaat 6060 tgagcaaata taacctgggg gccgatttca gcctcccggc agaagcgaag gacaagaaag 6120 tcatcctggt gccgggccag gtggaagacg atgcgtcgat taagacgggc accgtgtcga 6180 tcaagtcgaa tctggagctg ctgcgcaccg tgcgggaacg taatccgcac gcctacatca 6240 tctacaagcc gcaccccgat gtgctcgtcg gcaaccgtaa gggtgacatt ccggcggaac 6300 agatcgcgga actcgcagac taccaggcac tggatgccga tatcattcag tgtattcagc 6360 gtgcggacga ggtgcacacg atgacgagcc tcagcggctt tgaagcattg ctgcacggta 6420 aacaggtgca ctgctacggc ctgccgttct acgcctcgtg gggcctgacc gtcgatgagc 6480 accactgccc ccgtcgcgag cggcggctga ccatcgccga cctgatctat caagccctga 6540 ttgtctatcc cacctatatt catccgacgc ggttgcagcc gatcacggtg gaggaagcgg 6600 cagaatatct gatcaaaacg ccccgcaaac ccatctttat cacccgcaag aaagccggcc 6660 gtgtgattcg ctactatcgc aagttgatca tgttctgcaa agtgcgcttt ggttaagagc 6720 tcgccgaaaa cgcttaacac cgcgtgttag gaggttaata aatgcacggc aatgcgctga 6780 cggtgctgtt gagcggtaaa aagtacctcc tgctccaagg tccgatgggt ccgttcttca 6840 acgatgtggc ggaatggttg gagagcctcg gtcgcaacgc ggtcaacgtc gtctttaatg 6900 gcggtgatcg cttctactgc cgccaccgcc aatacctggc gtactaccaa accccgaagg 6960 agttccccgg ttggctgcgg gacttgcatc gtcagtatga ctttgacacg attttgtgtt 7020 tcggtgactg ccgcctgctg cacaaggagg ccaaacgctg ggccaagtcg aaggggattc 7080 gttttctggc cttcgaggaa ggctacctgc gtccgcaatt tatcaccgtg gaagaaggcg 7140 gtgtgaacgc ctatagcagc ttgccccgcg atccggactt ttaccgcaaa ttgcccgata 7200 tgccgacgcc gcacgtcgag aacctgaaac cgagcaccat gaagcgcatc ggccacgcca 7260 tgtggtatta cctgatgggt tggcactatc gtcacgaatt tccgcgctat cgccaccaca 7320 aatcgttcag cccgtggtat gaagcgcgct gctgggtccg cgcctactgg cgcaaacagc 7380 tgtataaggt cacccaacgc aaggtcctcc cccgcctgat gaacgagctg gatcagcgct 7440 attacctggc ggtcctgcaa gtgtacaacg acagccagat ccgcaaccat agcaactata 7500 atgatgtgcg tgattacatc aacgaagtga tgtacagctt ttcccgcaag gcccccaagg 7560 agtcctatct ggtgatcaaa catcacccga tggatcgcgg gcaccgcctg taccgcccgt 7620 tgatcaagcg tctgtcgaag gaatacggtt tggatgaacg tgtcatctat gtgcacgatc 7680 tgcccatgcc ggagctgttg cgccacgcca aagcggtggt caccatcaat agcacggccg 7740 gcatttccgc gttgatccac aacaagcccc tgaaagtcat gggcaacgcc ttgtacgata 7800 tcaagggtct gacgtaccag gggcatttgc atcagttctg gcaagccgac tttaaaccga 7860 acatgaagtt gtttaagaaa tttcgcggct acttgctggt gaagacccag gtcaatgcgg 7920 tgtactacgg cgaaatgatc tttaacaaaa ttaagaagta taagaaacgt taacaccgcg 7980 tgttctgcag aagtttaaac aatctagatt ggatcc 8016 <210> 49 <211> 4213 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 49 gaattcaaag cttattagga ggattaataa atgttgaaga acttgacctt cgatcacatc 60 ctgagcctga gcaagaaaga agataaaatc aaactggtgc agctcatcgt caaccatctg 120 gacgagcgca cgctgtcctg catcaagaac atttcgaccg gcaaaggctt taatgcgcat 180 ctcaaaatcc tggagttgtt cgacttgtgg ctgtcggaat acttcgagta tattatcatc 240 ccgaacaagt tgtcgaacgc agggacgttt tacttcgcgt tcttctttcc ggagttctac 300 atcaaacgtt tcaacaagaa taacacggac ctgtccagct tgggtgatac cagcttcaag 360 cgcctgatga gccgtccgca catccccaac tacgtgtata atctcgtgat caactcgaac 420 ggctgcacct tcaattcgat taagttgttg ctgctcgcac tgtccctgac cagcaaacgc 480 ttctacgaaa ccccgcagca ggagcgcaac ttcttgtgcc acatcaatga aattgtcctg 540 gcaaacgccg acgaatatag cggcatcatt tcctgtatca tcaaatcgcg catctcggtg 600 attgatgatt tcattagcag caatgtgagc ctgaatacca atcgccagat cgcattgttc 660 atcacggggc agtcgcgcgg tttcatcgac gcgctgccga acctggtcag caagatcacg 720 attccgtcgg acgtcgatgt gtttatctcc acctggaagg atatcgggca tacgcaactg 780 agcaaagaac gcatctgccg catttttgat tcggaagccg cccaatacgt gtccgaaccc 840 gacaattaca gcttcgtgga tgaacattat gatgagctga aagacctgtc gctctcctcc 900 tataagaaca ataacctgga agaaatctac tcgtcgttct tctccggctg caactccgtc 960 ctgatcaata tcaaggatga tggcgaatat ccgtataaca agatgagcaa cgcggaaaag 1020 atgtactacc acaattcctt ttggttctgc tcgctgaaaa atcataactg ggataagtac 1080 cgctgcatca tcaaaatccg ccccgatgcc ctgctgcaag tggataacgt gaccatcaac 1140 gatatcgacg tggacgacag cgtgtattgc gaggacagca acggttggat ttttcgcgag 1200 tgggggtttg gcatcggcga tcagctgttc tatggcgacc cggacatcat gaagaaactg 1260 atgtgcgtgc atggtctgga taacatttac tcgcaactga cgagcctgat ctcgtcgtcg 1320 aatgtgtact actcggggca catcaacgtc ggcttgtgcg cctgggccaa tgtgtacgac 1380 tgtaaagtga gcaatctgaa gatcaagaat attgtggccc cgcgtaaaat cagcctggag 1440 caaattctga gcctgcggga ataaaagctt accttggttt atattaagga ggttaataaa 1500 tgaagaaaat tatcgtcgat ctggataata cgattagctt caatctgagc ggcaaataca 1560 gccatgcaac ccccaataag aaattgatcg aaaaactcta tgagtacaag ctgaacggtt 1620 tctacatcgt catctttacc gcgcgcaata tgcggacgta caaggaaaac attggcaaga 1680 tcaatattca tacgctgccg gtgatcatcg actggctgaa cgaaaaccgc gtcccgtatg 1740 acgaggtgat tgtcggcaag ccgtggtgcg gcgacgaggg cttctatgtg gacgatcggg 1800 ccatccggcc ctcggaactg tgcaatatga ccttggaaga aatctctaat atgttagaac 1860 aggagaaaaa atgcttctaa taatgtctgg tagctacgtg cagcaggaat tgggcgcgga 1920 gttcggtagc atcccgccgt cgttcctgcc gttggcaaac aagcgtctgt tcaagcacca 1980 ggtcagcttg gggcacgatg gccatgcgat ctacctggtc ctgccggaag atttcgtgtt 2040 cgacaaacac gattacgaat ggttgctgcg caataaagtg acgatgattc cggtcgatag 2100 caatctgacc ctgggccagg caatcgtcac ggcctggaat ctgatcggcg acaaagatga 2160 taaaggcctg caactgctgt ttggtgatac cttgttcaag aagattccgg cgggtgatga 2220 cctcgtggcg atctcccatt ccgatgataa ctaccagtgg tcctttttct atgagacgga 2280 attgcgggca gtctcccgcg aggacaacaa aaatgtcatc tgcgggtact tctcgttcag 2340 caaacccaat ttcttcattc gcgaactggt caccagcaag tttgacttca cggcagccct 2400 gaaaaagtac catgattcgt acagcttggc gtcgatttac gtcagcgact ggctcgattt 2460 cggtcacatc aatacctact ataagtcgaa agtccagtac acgacccagc gtgccttcaa 2520 tgagctgtgc atcacgacca agtccgtgat taagtcctcc tcgaatgaaa gcaagatcga 2580 ggcagaatcg aaatggttcg agacgattcc gggtgaactg aaaatctaca ccccgatgtt 2640 gctggaaccg ttcgatcaca ttcgcaaaag ctacaaactc gaatacctgt acaataccac 2700 cctgaacgaa ctgttcgtgt tctcccgcct gccgaataat atcctgacca acattctgat 2760 cagctgcctg gattttatcg acctctgcaa agagtatcat agcattgata cggataaaaa 2820 cattctccag gatctgtttt acgaaaagac catcgagcgc gtcagcaagt atatcaccga 2880 tctcaacatt gacccgaacg cgaaatggaa ttttaacaac aatattagcg tgagcatcaa 2940 cgacatcctg tacgacacga acaaattcat tccgtccgaa ctgcaataca agaccatcat 3000 gcacggggac ctgtgcttca gcaatattat ctttaacttc cgcacgggcc ggattcaggt 3060 gttcgatccg cgcggtctga accacagcgg cgaaatctcg atctatggcg atttccgcta 3120 cgatattgcg aaactgtcgc actccattct aggcctgtat gactggatca tcgcgggcta 3180 ctacattatc aacaaaaaga ataagaccca ttccattgag ttcaaaatca atattgataa 3240 caaactcttt gaaatccaat cgaccttcgt gtccattatt aaggaaaaat acagcatctc 3300 cgaaaagtcg ctgtacgcca tgcaaattca tctgttcttg tcgatgctgc cgttgcatag 3360 cgacgacaag aagcggcagg acgccctgtt tgcgaatgcc ttccgcctgt atgaaatctt 3420 taaggaggca gcagtatgat tattatcccg atggcaggta tgtcgagccg ctttttcaaa 3480 gccggttata gcaaaccgaa gtatatgctg gagctgaatg gcgagtttct gttcgatttg 3540 tgcctcaaga gcttcaaact gtacttcgag acggaacact ttgtcttcat cctccgtgac 3600 gtgtttaaca cgaaatcgtt cgtgctccag cgtatcgcca gcctgggcat taatagctat 3660 acgctgatca ccctggataa ggaaacgcgg ggtcaagcag agacggtcta tttggccatc 3720 tcgaaactgt ttaatatcga acagccgatc accatcttca acatcgacac gattcgtccc 3780 aacttcatct tcaccaagtt cgagggcgag aatgaatgtt acattgaagt gtttcgcggc 3840 gatggcgaca actggtcgtt cgtgatgccc agcaatgacg tcaaaaatga agtgattgcc 3900 acgtccgaaa agaaacagat tagcaatttg tgttgcaccg ggctgtacca cttcagcacg 3960 atcaaaaact ttatttccgc gtatgaacat tacaagaacc tgccgcaaga aaactgggat 4020 gcgggcgagc tgtatattgc gccgatctac aattacctga tctccaatgg gatcaaagtg 4080 tattataccg aaatcaataa gtccgacgtg atcttctgcg gcaccccgcg tgagtatgag 4140 aatctccagg ggaaaaagta agaatgcctt tcgtctgtac gaaatcttca aagaagctgc 4200 ggtataagaa ttc 4213 <210> 50 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Primer <400> 50 ggcgcgccag cgtcctgctg tttgatgacg 30 <210> 51 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Primer <400> 51 aagcttgcca ggagattgac gccagc 26 <210> 52 <211> 29 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Primer <400> 52 ggcgcgccgg aatcctcagt tggacccgc 29 <210> 53 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Primer <400> 53 tctagaactt taccctcacg gtccagcg 28 <210> 54 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Primer <400> 54 ccgaattgtt atcttgcctg c 21 <210> 55 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Primer <400> 55 ggtagcatct ctttgggtat cg 22 <210> 56 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Primer <400> 56 gaacagcggt tgagtcaggg 20 <210> 57 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Primer <400> 57 ggcagaaagc acatagcgac c 21 <210> 58 <211> 31 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Primer <400> 58 ttaattaaca aaggtttcgt taacaaagcg g 31 <210> 59 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Primer <400> 59 ttaattaaat tggttttcgc tcgctcgc 28 <210> 60 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Primer <400> 60 aagcttggaa gacgccatct atggtgg 27 <210> 61 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Primer <400> 61 tctagagaag cccgccagca ccgc 24 <210> 62 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Primer <400> 62 ccgttgatgt ggtgactgcc 20 <210> 63 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Primer <400> 63 aaacagcagc gttctcaccg 20 <210> 64 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Primer <400> 64 cctgcagggt cgaacactcg caagaccagg 30 <210> 65 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Primer <400> 65 cctgcaggta tccgcatcat cgtgctgacg 30 <210> 66 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Primer <400> 66 ccttggtgat ggtgtggcg 19 <210> 67 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Primer <400> 67 gcccatccac gactcgaacg 20 <210> 68 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Primer <400> 68 gaccaatgac acgatgatcg 20 <210> 69 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Primer <400> 69 gcatccgcta caacatgctc 20 <210> 70 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Primer <400> 70 agatctggcg gtaacagggg attggc 26 <210> 71 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Primer <400> 71 gcggccgcca agacggtatt cgggctgc 28 <210> 72 <211> 29 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Primer <400> 72 gcggccgcga tctgctggtg ttcttccgc 29 <210> 73 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Primer <400> 73 agatctccta ccgaccaggc attggc 26 <210> 74 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Primer <400> 74 ccgaatttcc gagcctgg 18 <210> 75 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Primer <400> 75 gcccgctcgc ttcgtcg 17 <210> 76 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Primer <400> 76 acgtggatgc ggtcgtcgc 19 <210> 77 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Primer <400> 77 ggggcttgcg ggtcggc 17 <210> 78 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Primer <400> 78 cgtatgctga gaatgacgac c 21 <210> 79 <211> 470 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 79 ttcgaattgt cgacttaggc gcgccactcg agccttctta gaaggccatc ctgacggatg 60 gcctttttgc gtttctacaa actcttcata tgtaatgaaa gcttgtcagc ctgcagtgtc 120 cggtttgata gggataagtc cagccttgca agaagcggat acaggagtgc aaaaaatggc 180 tatctctaga aaggcctacc ccttaggctt tatgcaacag aaacaataat cctgcaggtc 240 tattaattaa ccaacatcga ttacactgga tccttaaatg attcggctac gcgacttgcg 300 tagccgattt ttttgattct tgtacattac ttagtatgct tcacttgtgg atacttcgag 360 taattgacta gatcagtgac acggtaccag agagaaaaaa cgtgcgccga ctgacggcgc 420 acgaagacat taacgatgag ctctggcgcg ccgatagtcg acgattcgaa 470 <210> 80 <211> 127 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 80 ttaattaatg tttctgttgc ataaagccta aggggtaggc ctttctagag atagccattt 60 tttgcactcc tgtatccgct tcttgcaagg ctggacttat ccctatcaaa ccggacactg 120 catcgat 127 <210> 81 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Primer <400> 81 aaggcgacaa ggtgctgatg 20 <210> 82 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Primer <400> 82 caatgcgacg gatgctttcg 20 <210> 83 <211> 211 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 83 Met Gly Ser Leu Asn Lys Gly Tyr Asn Val Val Ile Ile Asp Asn Leu 1 5 10 15 Ile Asn Ser Ser Cys Glu Ser Ile Arg Arg Ile Glu Leu Ile Ala Lys 20 25 30 Lys Lys Val Thr Phe Tyr Glu Leu Asn Ile Asn Asn Glu Lys Glu Val 35 40 45 Asn Gln Ile Leu Lys Lys His Lys Phe Asp Cys Ile Met His Phe Ala 50 55 60 Gly Ala Lys Ser Val Ala Glu Ser Leu Ile Lys Pro Ile Phe Tyr Tyr 65 70 75 80 Asp Asn Asn Val Ser Gly Thr Leu Gln Leu Ile Asn Cys Ala Ile Lys 85 90 95 Asn Asp Val Ala Asn Phe Ile Phe Ser Ser Ser Ala Thr Val Tyr Gly 100 105 110 Glu Ser Lys Ile Met Pro Val Thr Glu Asp Cys His Ile Gly Gly Thr 115 120 125 Leu Asn Pro Tyr Gly Thr Ser Lys Tyr Ile Ser Glu Leu Met Ile Arg 130 135 140 Asp Ile Ala Lys Lys Tyr Ser Asp Thr Asn Phe Leu Cys Leu Arg Tyr 145 150 155 160 Phe Asn Pro Thr Gly Ala His Glu Ser Gly Met Ile Gly Glu Ser Pro 165 170 175 Ala Asp Ile Pro Ser Asn Leu Val Pro Tyr Ile Leu Gln Val Ala Met 180 185 190 Gly Lys Leu Glu Lys Leu Met Val Phe Gly Gly Asp Tyr Pro Thr Lys 195 200 205 Asp Gly Thr 210 <210> 84 <211> 220 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 84 Met Gly Ser Trp Leu Ala Tyr Asn Thr Ala Leu Leu His Phe Phe Leu 1 5 10 15 Asn Asn Arg Gly Arg Cys Leu Leu Val Ser Ser Glu Gln Val Lys Arg 20 25 30 Asn Ala Glu Asp Cys Ile Gln Gln Leu Gln His Lys Leu Lys Leu Lys 35 40 45 Phe Gly Leu Ser Phe Ser Asn Thr Ile Asn His Ser Leu Glu Gln Ser 50 55 60 Val Asn Asp Phe Lys Thr Ala Glu Ala Ser Ile Thr Leu Glu Lys Glu 65 70 75 80 His Gln Glu Ile Met Ser Leu Ser Gly Ile Asp Ile Gly Thr Gly Asp 85 90 95 Ile Ile Phe Lys Gln Ser Glu Thr Glu Glu Tyr Leu Ile Phe Asn Val 100 105 110 Leu Asn Asp Tyr Pro Asp Cys Lys Glu Leu Tyr Phe Glu Leu Gln Ser 115 120 125 Asn Ala Asn Thr Pro Leu Arg Val Leu Glu Lys Glu Asn Tyr Lys Pro 130 135 140 Ser Phe Ile Trp Glu Thr Phe Ile Lys Gln Arg Gln Ile Thr Leu Asp 145 150 155 160 Ile Val Asn Gly Leu Tyr Gln Ser Ser Lys Lys Ile Ile Leu Asp Asn 165 170 175 Glu Leu His Thr Ser Lys Gln Leu Asn Ala Tyr Gln Ala Ile Leu Lys 180 185 190 Glu Leu Ser Asp Ser Lys Glu Glu Leu Ile Gln Tyr Asp Leu Ile Ile 195 200 205 Lys Asn Lys Thr Ile Gln Val Gln Glu Leu Glu Cys 210 215 220 <210> 85 <211> 182 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 85 Met Arg Gly Ser His His His His His His Gly Ser Ala Ile Ser Leu 1 5 10 15 Asn Glu Val Glu Lys Asn Glu Ile Ile Ser Lys Tyr Arg Glu Ile Thr 20 25 30 Ala Lys Lys Ser Glu Arg Ala Glu Leu Lys Glu Val Glu Pro Ile Pro 35 40 45 Leu Asp Trp Pro Ser Asp Leu Thr Leu Pro Pro Leu Pro Glu Ser Thr 50 55 60 Asn Asp Tyr Val Trp Ala Gly Lys Arg Lys Glu Leu Asp Asp Tyr Pro 65 70 75 80 Arg Lys Gln Leu Ile Ile Asp Gly Leu Ser Ile Val Ile Pro Thr Tyr 85 90 95 Asn Arg Ala Lys Ile Leu Ala Ile Thr Leu Ala Cys Leu Cys Asn Gln 100 105 110 Lys Thr Ile Tyr Asp Tyr Glu Val Ile Val Ala Asp Asp Gly Ser Lys 115 120 125 Glu Asn Ile Glu Glu Ile Val Arg Glu Phe Glu Ser Leu Leu Asn Ile 130 135 140 Lys Tyr Val Arg Gln Lys Asp Tyr Gly Tyr Gln Leu Cys Ala Val Arg 145 150 155 160 Asn Leu Gly Leu Arg Ala Ala Lys Tyr Asn Tyr Val Ala Ile Leu Asp 165 170 175 Cys Asp Met Lys Leu Asn 180 <210> 86 <211> 124 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 86 Met Gly Ser Val Asp Leu Asp Asn Thr Ile Ser Phe Asn Leu Ser Gly 1 5 10 15 Lys Tyr Ser His Ala Thr Pro Asn Lys Lys Leu Ile Glu Lys Leu Tyr 20 25 30 Glu Tyr Lys Leu Asn Gly Phe Tyr Ile Val Ile Phe Thr Ala Arg Asn 35 40 45 Met Arg Thr Tyr Lys Glu Asn Ile Gly Lys Ile Asn Ile His Thr Leu 50 55 60 Pro Val Ile Ile Asp Trp Leu Asn Glu Asn Arg Val Pro Tyr Asp Glu 65 70 75 80 Val Ile Val Gly Lys Pro Trp Cys Gly Asp Glu Gly Phe Tyr Val Asp 85 90 95 Asp Arg Ala Ile Arg Pro Ser Glu Leu Cys Asn Met Thr Leu Glu Glu 100 105 110 Ile Ser Asn Met Leu Glu Gln Glu Lys Lys Cys Phe 115 120 <210> 87 <211> 199 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 87 Met Gly Ser Pro Glu Asp Phe Val Phe Asp Lys His Asp Tyr Glu Trp 1 5 10 15 Leu Leu Arg Asn Lys Val Thr Met Ile Pro Val Asp Ser Asn Leu Thr 20 25 30 Leu Gly Gln Ala Ile Val Thr Ala Trp Asn Leu Ile Gly Asp Lys Asp 35 40 45 Asp Lys Gly Leu Gln Leu Leu Phe Gly Asp Thr Leu Phe Lys Lys Ile 50 55 60 Pro Ala Gly Asp Asp Leu Val Ala Ile Ser His Ser Asp Asp Asn Tyr 65 70 75 80 Gln Trp Ser Phe Phe Tyr Glu Thr Glu Leu Arg Ala Val Ser Arg Glu 85 90 95 Asp Asn Lys Asn Val Ile Cys Gly Tyr Phe Ser Phe Ser Lys Pro Asn 100 105 110 Phe Phe Ile Arg Glu Leu Val Thr Ser Lys Phe Asp Phe Thr Ala Ala 115 120 125 Leu Lys Lys Tyr His Asp Ser Tyr Ser Leu Ala Ser Ile Tyr Val Ser 130 135 140 Asp Trp Leu Asp Phe Gly His Ile Asn Thr Tyr Tyr Lys Ser Lys Val 145 150 155 160 Gln Tyr Thr Thr Gln Arg Ala Phe Asn Glu Leu Cys Ile Thr Thr Lys 165 170 175 Ser Val Ile Lys Ser Ser Ser Asn Glu Ser Lys Ile Glu Ala Glu Ser 180 185 190 Lys Trp Phe Glu Thr Ile Pro 195 <210> 88 <211> 184 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 88 Met Arg Gly Ser His His His His His His Gly Ser Ala Ser Leu Gly 1 5 10 15 Ile Asn Ser Tyr Thr Leu Ile Thr Leu Asp Lys Glu Thr Arg Gly Gln 20 25 30 Ala Glu Thr Val Tyr Leu Ala Ile Ser Lys Leu Phe Asn Ile Glu Gln 35 40 45 Pro Ile Thr Ile Phe Asn Ile Asp Thr Ile Arg Pro Asn Phe Ile Phe 50 55 60 Thr Lys Phe Glu Gly Glu Asn Glu Cys Tyr Ile Glu Val Phe Arg Gly 65 70 75 80 Asp Gly Asp Asn Trp Ser Phe Val Met Pro Ser Asn Asp Val Lys Asn 85 90 95 Glu Val Ile Ala Thr Ser Glu Lys Lys Gln Ile Ser Asn Leu Cys Cys 100 105 110 Thr Gly Leu Tyr His Phe Ser Thr Ile Lys Asn Phe Ile Ser Ala Tyr 115 120 125 Glu His Tyr Lys Asn Leu Pro Gln Glu Asn Trp Asp Ala Gly Glu Leu 130 135 140 Tyr Ile Ala Pro Ile Tyr Asn Tyr Leu Ile Ser Asn Gly Ile Lys Val 145 150 155 160 Tyr Tyr Thr Glu Ile Asn Lys Ser Asp Val Ile Phe Cys Gly Thr Pro 165 170 175 Arg Glu Tyr Glu Asn Leu Gln Gly 180 <210> 89 <211> 195 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 89 Met Gly Ser Val Gly Phe Thr Glu Arg Leu Lys Arg Asp Leu Asn Thr 1 5 10 15 Asn Asn Ile Ile Phe Ser Pro Glu Phe Leu Arg Glu Gly Lys Ala Leu 20 25 30 Tyr Asp Asn Leu Tyr Pro Ser Arg Ile Val Val Gly Glu Ser Ser Glu 35 40 45 Arg Ala Arg Lys Phe Ala Glu Leu Leu Ser Glu Gly Ala Ile Lys Lys 50 55 60 Asp Ile Pro Ile Leu Leu Thr Asp Ser Pro Glu Ala Glu Ala Ile Lys 65 70 75 80 Leu Phe Ala Asn Thr Tyr Leu Ala Met Arg Ile Ala Tyr Phe Asn Glu 85 90 95 Leu Asp Thr Tyr Ala Ser Val His Gly Leu Asp Thr Lys Gln Ile Ile 100 105 110 Glu Gly Val Ser Leu Asp Pro Arg Ile Gly Gln His Tyr Asn Asn Pro 115 120 125 Ser Phe Gly Tyr Gly Gly Tyr Cys Leu Pro Lys Asp Thr Lys Gln Leu 130 135 140 Leu Ala Asn Tyr Arg Asp Val Pro Gln Asn Leu Ile Gln Ala Ile Val 145 150 155 160 Asp Ala Asn Thr Thr Arg Lys Asp Phe Val Ala Glu Asp Ile Leu Ser 165 170 175 Arg Lys Pro Lys Val Val Gly Ile Tyr Arg Leu Ile Met Lys Ala Gly 180 185 190 Ser Asp Asn 195 <210> 90 <211> 247 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 90 Met Arg Gly Ser His His His His His His Gly Ser Asp Asp Thr Leu 1 5 10 15 Phe Arg Leu Gln Arg Leu Ala Leu Lys Asp Thr Arg Ile Lys Ile Ile 20 25 30 Ser Leu Pro Gln Asn Val Gly Thr Tyr Ala Ala Lys Arg Ile Gly Leu 35 40 45 Ile Gln Ala Lys Gly Glu Phe Val Thr Cys His Asp Ser Asp Asp Trp 50 55 60 Ser His Pro Glu Lys Leu Phe Arg Gln Ile Ser Pro Leu Leu Leu Asn 65 70 75 80 Pro Lys Leu Ile Cys Ser Ile Ser Asp Trp Val Arg Leu Gln Asp Asn 85 90 95 Gly Ile Phe Tyr Ala Arg Ala Val Tyr Pro Leu Lys Arg Leu Asn Pro 100 105 110 Ser Ser Leu Leu Phe Arg Arg Ala Asp Val Leu Gln Lys Ala Gly Val 115 120 125 Trp Asp Cys Val Lys Thr Gly Ala Asp Ser Glu Phe Ile Ala Arg Leu 130 135 140 Lys Leu Ile Phe Gly Asp Ser Thr Val His Arg Ile Lys Leu Pro Leu 145 150 155 160 Thr Leu Gly Ser His Arg Thr Asp Ser Leu Met Asn Ser Pro Thr Thr 165 170 175 Gly Tyr Thr Ser Gln Gly Ile Ser Pro Asp Arg Gln Lys Tyr Trp Asp 180 185 190 Ser Trp Ser Arg Trp His Ile Gln Ala Leu Arg Asn Lys Glu Ser Leu 195 200 205 Tyr Ile Gly Asn Ser Asp Phe Thr Asn Lys Asn Arg Pro Phe Ser Ala 210 215 220 Pro Asp Ser Ile Leu Val Asp Thr Asn Ala Ile Lys Thr Ala Leu Gln 225 230 235 240 Ser Ala His Val Asn Phe Thr 245 <210> 91 <211> 225 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 91 Met Gly Ser Met Ile Lys Ile Glu Asn Leu Thr Lys Ser Tyr Arg Thr 1 5 10 15 Pro Val Gly Arg His Tyr Val Phe Lys Asn Leu Asn Ile Glu Ile Pro 20 25 30 Ser Gly Lys Ser Val Ala Phe Ile Gly Arg Asn Gly Ala Gly Lys Ser 35 40 45 Thr Leu Leu Arg Met Ile Gly Gly Ile Asp Arg Pro Asp Ser Gly Lys 50 55 60 Ile Ile Thr Asn Lys Thr Ile Ser Trp Pro Val Gly Leu Ala Gly Gly 65 70 75 80 Phe Gln Gly Ser Leu Thr Gly Arg Glu Asn Val Lys Phe Val Ala Arg 85 90 95 Leu Tyr Ala Lys Gln Glu Glu Leu Lys Glu Lys Ile Glu Phe Val Glu 100 105 110 Glu Phe Ala Glu Leu Gly Lys Tyr Phe Asp Met Pro Ile Lys Thr Tyr 115 120 125 Ser Ser Gly Met Arg Ser Arg Leu Gly Phe Gly Leu Ser Met Ala Phe 130 135 140 Lys Phe Asp Tyr Tyr Ile Val Asp Glu Val Thr Ala Val Gly Asp Ala 145 150 155 160 Arg Phe Lys Glu Lys Cys Ala Gln Leu Phe Lys Glu Arg His Lys Glu 165 170 175 Ser Ser Phe Leu Met Val Ser His Ser Leu Asn Ser Leu Lys Glu Phe 180 185 190 Cys Asp Val Ala Ile Val Phe Lys Asp Asp Asn Ala Val Ser Phe His 195 200 205 Glu Asp Val Gln Glu Gly Ile Glu Glu Tyr Ile Thr Glu Gln Asn Asn 210 215 220 Tyr 225 <210> 92 <211> 159 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 92 Met Arg Gly Ser His His His His His His Gly Ser Leu Ala Ile Ala 1 5 10 15 Met Ile His Gln Arg Lys Phe Met Pro Asn Asp Phe Ala Arg Tyr His 20 25 30 Pro Gly Gly Ser Leu Gly Arg Arg Leu Leu Thr Arg Val Ala Asp Val 35 40 45 Met Gln His Asp Val Pro Ala Val Gln Leu Asp Ala Ser Phe Lys Thr 50 55 60 Val Ile Gln Arg Ile Thr Ser Gly Cys Gln Gly Met Val Met Val Glu 65 70 75 80 Asp Ala Glu Gly Gly Leu Ala Gly Ile Ile Thr Asp Gly Asp Leu Arg 85 90 95 Arg Phe Met Glu Lys Glu Asp Ser Leu Thr Ser Ala Thr Ala Ala Gln 100 105 110 Met Met Thr Arg Glu Pro Leu Thr Leu Pro Glu Asp Thr Met Ile Ile 115 120 125 Glu Ala Glu Glu Lys Met Gln Lys His Arg Val Ser Thr Leu Leu Val 130 135 140 Thr Asn Lys Ala Asn Lys Val Thr Gly Leu Val Arg Ile Phe Asp 145 150 155 <210> 93 <211> 188 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 93 Met Arg Gly Ser His His His His His His Gly Ser Ala Cys Glu Leu 1 5 10 15 Pro Glu Phe Ala Leu Lys Phe Asn Gln Thr Val Leu Lys Glu Ser Glu 20 25 30 Arg Phe Ile Asn Glu Met Ser His Arg Ile Ala Arg Asp Gln Leu Ala 35 40 45 Phe Ala Glu Thr Glu Met Glu Lys Ala Arg Gln Arg Leu Asp Ala Ser 50 55 60 Lys Ala Glu Leu Leu Ser Tyr Gln Asp Asn Asn Asn Val Leu Asp Pro 65 70 75 80 Gln Ala Gln Ala Gln Ala Ala Ser Thr Leu Val Asn Thr Leu Met Gly 85 90 95 Gln Lys Ile Gln Met Glu Ala Asp Leu Arg Asn Leu Leu Thr Tyr Leu 100 105 110 Arg Glu Asp Ala Pro Gln Val Val Ser Ala Arg Asn Ala Ile Gln Ser 115 120 125 Leu Gln Ala Gln Ile Asp Glu Glu Lys Ser Lys Ile Thr Ala Pro Gln 130 135 140 Gly Asp Lys Leu Asn Arg Met Ala Val Asp Phe Glu Glu Ile Lys Ser 145 150 155 160 Lys Val Glu Phe Asn Thr Glu Leu Tyr Lys Leu Thr Leu Thr Ser Ile 165 170 175 Glu Lys Thr Arg Val Glu Ala Ala Arg Lys Leu Lys 180 185 <210> 94 <211> 223 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 94 Met Gly Ser Leu Asn Tyr Leu Ile Lys Ala Gly Gly Val Asp Pro Glu 1 5 10 15 Arg Gly Ser Tyr Val Asp Ile Val Val Lys Arg Gly Asn Arg Val Arg 20 25 30 Ser Asn Val Asn Leu Tyr Asp Phe Leu Leu Asn Gly Lys Leu Gly Leu 35 40 45 Ser Gln Phe Ala Asp Gly Asp Thr Ile Ile Val Gly Pro Arg Gln His 50 55 60 Thr Phe Ser Val Gln Gly Asp Val Phe Asn Ser Tyr Asp Phe Glu Phe 65 70 75 80 Arg Glu Ser Ser Ile Pro Val Thr Glu Ala Leu Ser Trp Ala Arg Pro 85 90 95 Lys Pro Gly Ala Thr His Ile Thr Ile Met Arg Lys Gln Gly Leu Gln 100 105 110 Lys Arg Ser Glu Tyr Tyr Pro Ile Ser Ser Ala Pro Gly Arg Met Leu 115 120 125 Gln Asn Gly Asp Thr Leu Ile Val Ser Thr Asp Arg Tyr Ala Gly Thr 130 135 140 Ile Gln Val Arg Val Glu Gly Ala His Ser Gly Glu His Ala Met Val 145 150 155 160 Leu Pro Tyr Gly Ser Thr Met Arg Ala Val Leu Glu Lys Val Arg Pro 165 170 175 Asn Ser Met Ser Gln Met Asn Ala Val Gln Leu Tyr Arg Pro Ser Val 180 185 190 Ala Gln Arg Gln Lys Glu Met Leu Asn Leu Ser Leu Gln Lys Leu Glu 195 200 205 Glu Ala Ser Leu Ser Ala Gln Ser Ser Thr Lys Glu Glu Ala Ser 210 215 220 <210> 95 <211> 249 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 95 Met Gly Ser Met Ser Lys Ala Val Ile Val Ile Pro Ala Arg Tyr Gly 1 5 10 15 Ser Ser Arg Leu Pro Gly Lys Pro Leu Leu Asp Ile Val Gly Lys Pro 20 25 30 Met Ile Gln His Val Tyr Glu Arg Ala Leu Gln Val Ala Gly Val Ala 35 40 45 Glu Val Trp Val Ala Thr Asp Asp Pro Arg Val Glu Gln Ala Val Gln 50 55 60 Ala Phe Gly Gly Lys Ala Ile Met Thr Arg Asn Asp His Glu Ser Gly 65 70 75 80 Thr Asp Arg Leu Val Glu Val Met His Lys Val Glu Ala Asp Ile Tyr 85 90 95 Ile Asn Leu Gln Gly Asp Glu Pro Met Ile Arg Pro Arg Asp Val Glu 100 105 110 Thr Leu Leu Gln Gly Met Arg Asp Asp Pro Ala Leu Pro Val Ala Thr 115 120 125 Leu Cys His Ala Ile Ser Ala Ala Glu Ala Ala Glu Pro Ser Thr Val 130 135 140 Lys Val Val Val Asn Thr Arg Gln Asp Ala Leu Tyr Phe Ser Arg Ser 145 150 155 160 Pro Ile Pro Tyr Pro Arg Asn Ala Glu Lys Ala Arg Tyr Leu Lys His 165 170 175 Val Gly Ile Tyr Ala Tyr Arg Arg Asp Val Leu Gln Asn Tyr Ser Gln 180 185 190 Leu Pro Glu Ser Met Pro Glu Gln Ala Glu Ser Leu Glu Gln Leu Arg 195 200 205 Leu Met Ser Ala Gly Ile Asn Ile Arg Thr Phe Glu Val Ala Ala Thr 210 215 220 Gly Pro Gly Val Asp Thr Pro Ala Cys Leu Glu Lys Val Arg Ala Leu 225 230 235 240 Met Ala Gln Glu Leu Ala Glu Asn Ala 245 <210> 96 <211> 256 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 96 Met Gly Ser Gln Arg Val Arg Leu Ile Ala Glu Asn Val Ser Pro Gln 1 5 10 15 Ser Leu Leu Arg His Val Ser Arg Val Tyr Val Val Thr Ser Gln Tyr 20 25 30 Gly Phe Glu Ala Leu Leu Ala Gly Lys Pro Val Thr Cys Phe Gly Gln 35 40 45 Pro Trp Tyr Ala Gly Trp Gly Leu Thr Asp Asp Arg His Pro Gln Ser 50 55 60 Ala Leu Leu Ser Ala Arg Arg Gly Ser Ala Thr Leu Glu Glu Leu Phe 65 70 75 80 Ala Ala Ala Tyr Leu Arg Tyr Cys Arg Tyr Ile Asp Pro Gln Thr Gly 85 90 95 Glu Val Ser Ala Leu Phe Thr Val Leu Gln Trp Leu Gln Leu Gln Arg 100 105 110 Arg His Leu Gln Gln Arg Asn Gly Tyr Leu Trp Val Pro Gly Leu Thr 115 120 125 Leu Trp Lys Ser Ala Ile Leu Lys Pro Phe Leu Gln Thr Ala Thr Asn 130 135 140 Arg Leu Ser Phe Ser Arg Arg Cys Thr Ala Ala Ser Ala Cys Val Val 145 150 155 160 Trp Gly Val Lys Gly Glu Gln Gln Trp Arg Ala Glu Ala Gln Arg Lys 165 170 175 Ser Leu Pro Leu Trp Arg Met Glu Asp Gly Phe Leu Arg Ser Ser Gly 180 185 190 Leu Gly Ser Asp Leu Leu Pro Pro Leu Ser Leu Val Leu Asp Lys Arg 195 200 205 Gly Ile Tyr Tyr Asp Ala Thr Arg Pro Ser Glu Leu Glu Val Leu Leu 210 215 220 Asn His Ser Gln Leu Thr Leu Ala His Gln Met Arg Ala Glu Lys Leu 225 230 235 240 Arg Gln Arg Leu Val Glu Ser Lys Leu Ser Lys Tyr Asn Leu Gly Ala 245 250 255 <210> 97 <211> 251 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 97 Met Arg Gly Ser His His His His His His Gly Ser Ala Cys Glu Leu 1 5 10 15 Cys Phe Gly Asp Cys Arg Leu Leu His Lys Glu Ala Lys Arg Trp Ala 20 25 30 Lys Ser Lys Gly Ile Arg Phe Leu Ala Phe Glu Glu Gly Tyr Leu Arg 35 40 45 Pro Gln Phe Ile Thr Val Glu Glu Gly Gly Val Asn Ala Tyr Ser Ser 50 55 60 Leu Pro Arg Asp Pro Asp Phe Tyr Arg Lys Leu Pro Asp Met Pro Thr 65 70 75 80 Pro His Val Glu Asn Leu Lys Pro Ser Thr Met Lys Arg Ile Gly His 85 90 95 Ala Met Trp Tyr Tyr Leu Met Gly Trp His Tyr Arg His Glu Phe Pro 100 105 110 Arg Tyr Arg His His Lys Ser Phe Ser Pro Trp Tyr Glu Ala Arg Cys 115 120 125 Trp Val Arg Ala Tyr Trp Arg Lys Gln Leu Tyr Lys Val Thr Gln Arg 130 135 140 Lys Val Leu Pro Arg Leu Met Asn Glu Leu Asp Gln Arg Tyr Tyr Leu 145 150 155 160 Ala Val Leu Gln Val Tyr Asn Asp Ser Gln Ile Arg Asn His Ser Asn 165 170 175 Tyr Asn Asp Val Arg Asp Tyr Ile Asn Glu Val Met Tyr Ser Phe Ser 180 185 190 Arg Lys Ala Pro Lys Glu Ser Tyr Leu Val Ile Lys His His Pro Met 195 200 205 Asp Arg Gly His Arg Leu Tyr Arg Pro Leu Ile Lys Arg Leu Ser Lys 210 215 220 Glu Tyr Gly Leu Asp Glu Arg Val Ile Tyr Val His Asp Leu Pro Met 225 230 235 240 Pro Glu Leu Leu Arg His Ala Ser Leu Ile Ser 245 250 <210> 98 <211> 86 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 98 gctagctaat tcttgacata gtttcacaga ttgtgttata ataactacac gacgttcatc 60 gtcgtcaatg tacaggaggt caacaa 86 <210> 99 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Primer <400> 99 ggccgcggcg cgcctgcagg atttaaatct cgaggc 36 <210> 100 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Primer <400> 100 ggccgcctcg agatttaaat cctgcaggcg cgccgc 36 <210> 101 <211> 31 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Primer <400> 101 cgtcaagctt gtgaacgcct atagcagctt g 31 <210> 102 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Primer <400> 102 cagtggcgcg ccgagcgatg ataagctgtc 30 <210> 103 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Primer <400> 103 gcactgcaga tcccctttat ccgcc 25 <210> 104 <211> 39 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Primer <400> 104 cttcttcggc tatgcatcgt tcgtaatcaa gccacttcc 39 <210> 105 <211> 38 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Primer <400> 105 gattacgaac gatgcatagc cgaagaaggg atgggttg 38 <210> 106 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Primer <400> 106 gcactgcaga tccacatcct tgaaggc 27 <210> 107 <211> 1604 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 107 ctgcagatcc acatccttga aggccgcagc gacgagcaga aggaaaccct cattcgggaa 60 gtcagcgagg ccatctcgcg ctccctggat gcgccgctga ccagcgtgcg agtgattatc 120 acggagatgg ccaagggcca cttcggcatc ggcggcgaac tggccagcaa ggtcagacgc 180 tgaagtggag atgcccaagg gcacttcggg tcgaggaacc cgacctgcat tgggacgcgg 240 ccacggagag cgcgggcaaa cgccggcact atagccagtg gagtttgtaa aacgctattt 300 cagagcttgg agagtgtcta agaaagccgg ggcgatgcca acccatccct tcttcggcta 360 tgcatcgttc gtaatcaagc cacttccttt ttgcattgac gcagggtgtc ggaaggcaac 420 tcgccgaacg cgctcctata gttttcagcg aagcgtccca aatgtaagaa gccgtagtct 480 agggctatct cagttatact acgcacattg gcactgggat cgttcaagca ggcgcggatg 540 ctttcgagct tgcggttgcg gatgtagttc ttcggcgtgg tgccggcatg cttctcgaac 600 aaattgtaga gcgagcgtgg actcatcatc gccagctccg ctaaccgctc aaggctgata 660 ttccgtttga gattctcctc aatgaattga acgactcgct cgaaagacgg gttacctttg 720 ctgaaaattt cacggctgac attgctgccc agcatttcga gcagcttgga agcgatgatc 780 cccgcatagt gctcttggac ccgaggcatc gactttgtat gttccgcttc gtcacaaact 840 aacccgagta gattgataaa gccatcgagt tgctggagat tgtgtcgcgc ggcgaaacgg 900 ataccctccc tcggcttgtg ccaattgttg tcactgcatg cccgatcaag gaccactgag 960 ggcaatttaa cgataaattt ctcgcaatct tctgaatagg tcaggtcggc ttggtcatcc 1020 ggattgagca gcaatagttc gcccggcgca aaatagtgct cctggccatg gccacgccac 1080 aggcaatggc ctttgagtat tatttgcaga tgataacagg tctctaatcc aggcgagatt 1140 accctcacgc taccgccgta gctgattcga cacaggtcga ggcatccgaa gattctgtgg 1200 tgcagcctgc ctgccgggcg cccgcccttg ggcaggcgaa tagagtgcgt accgacatac 1260 tggttaacat aatcggagac tgcatagggc tcggcgtgga cgaagatctg acttttctcg 1320 ttcaataagc aaaaatccat agttcacggt tctcttattt taatgtgggc tgcttggtgt 1380 gatgtagaaa ggcgccaagt cgatgaaaat gcatctcgac gtgatgcgta tacgggttac 1440 ccccattgcc acgttgcgcc atcctttttg caatcagtga ccacttttcc aagcaaaaat 1500 aacgccaagc agaacgaaga cgttcttttt aagaagcgag aacaccagaa gttcgtgctg 1560 tcggggcatg cggcgacgaa ttggcggata aaggggatct gcag 1604 <210> 108 <211> 29 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Primer <400> 108 cgcaagcttc gtaccgaaag atcagttgc 29 <210> 109 <211> 41 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Primer <400> 109 ccaaaagaga aatctgcagt agatgggatg ttattttacc g 41 <210> 110 <211> 38 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Primer <400> 110 acatcccatc tactgcagat ttctcttttg gggcacgg 38 <210> 111 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Primer <400> 111 gctctagaca tctgccataa caacggag 28 <210> 112 <211> 1750 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 112 gctctagaca tctgccataa caacggagaa agcgccatcg ccgttaacag tcgacggcgc 60 gaaataagag gtaagccgct catcaataaa caaaactcac aggtgcagca cccgccggat 120 gcggcaaaat acccatcggg atgccataaa tcatttcgag ggtttcgccg cgcataattt 180 ccgcaggcgt tccctgagca atcatttcac cgccgcgcag ggcgaccaga taatcacagt 240 agcgtgccgc catattgata tcgtgcaaca cggcaatgac cgtcaggcca cgctcctgac 300 ttaaacggtg caccagcgac agcacatcaa cctggtgggc gatatccagc gccgaggtcg 360 gttcgtcgag caacagacaa cggctatcct gcgccaccag catggcgatc cacgcccgct 420 gacgttcgcc gccagagaga ctatcgacca gccgatgcgc cagcggtttt aagccaacca 480 gcgagatagc ttcctcgact ttttcgcgat ctgccgcccc aaagcgcccc agcgcgccat 540 gccacgggta acgaccaatc gccaccagtt cacgcacggt catcccttct gccggaggaa 600 gctgctgcgg caaataagcc actttgcggg caaacgcttt gctgctccag ctttccagcg 660 gttgggcatc aagaagaatc tccccttccg acggcggctg atgacggcca agcattttga 720 gcagagtgga tttaccagaa ccgttgtgac caatcagacc ggtcactttc ccggcaggaa 780 aggttaacga cagcggatgc aaaagcgtgc gcccgggcac acgaaaggag atattacgca 840 gtgcaaaagt ggtatcggaa tgattcgtgt attcctgcat aacagccaac ttgtgaaatg 900 ggcacggaaa tccgtgcccc aaaagagaaa tctgcagtag atgggatgtt attttaccgg 960 atggcaactc gccatccggt atttcacgct tagatgttaa ttactaccaa acatatcctt 1020 gatccaaccg gctacaccgt cgctgtcttt ctgctcttgc tgagcaggtt gctgttgcgg 1080 ctgttgctgc ggctgagaag actgatcaaa cggattgcct gacggctgct gctgcatctc 1140 gctctgctgg cacagcgatt gcggatcgct ggtccagacc ggcaagatac gcatgccacc 1200 gctgcaaaca aagttgccgt cgtagtccac gcccatatct gcaatatctt ctggcggaac 1260 aagattcagc ggcgttggcg tctggttagc cagataacgc tgataaatcg acattgcccc 1320 gctggcacca tacagtttgg tcggctggtt gttatcacgg ccgacccagg tgatggtcac 1380 cgtgctgccg tcaatgcccg caaaccaggt atctacgtta ttgttggtag tccctgtttt 1440 ccctgccaga tgcaggttcg ggtatttcgc cccaagctga cgacccgtac cgcgttgtac 1500 cacctgctgc atggtccata gtgtcagata cgccgcctgc gccggaacag cgcgttccgc 1560 ctgcgggaag ctctgataca gcactttgcc atcttccgcg attaccgaac gcagcgcaga 1620 aagcggtgca cggttaccac cgctggcgat ggtctggaat gcctgcgcca cttcgattgg 1680 cgttaagttc aacgccccca gcagcattgc cggaaccgga tgcaactgat ctttcggtac 1740 gaagcttgcg 1750 <210> 113 <211> 58 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Primer <400> 113 gcgagatctc atgtttgaca gcttatcatc gctcggcttt aatgcggtag tttatcac 58 <210> 114 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Primer <400> 114 ccggcgtaca agatccacag gacgggtgtg 30 <210> 115 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Primer <400> 115 ctgtggatct tgtacgccgg acgcatcgtg 30 <210> 116 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Primer <400> 116 gcggatcctt ccattcaggt cgaggtg 27 <210> 117 <211> 23230 <212> DNA <213> Escherichia coli <400> 117 gcatggactg accatggttt tatattcatt aaaaattttg ttacaaccca ttgatttagc 60 ataaataaat tatagtgggt tcgggtttgt tgtgactgtg gcattatttc cgtgcaaagg 120 agctgatatg tctgaaagac atttacctga tgaccagagc agtactatcg atccatatct 180 aattacctct gttcgccaga ctctggcaga acaaagcgca gcattacaaa acttgtctaa 240 acaactggat tccgggcagt accagcgtgt ccttaatttg ataatgaact gtaaagggca 300 cgttattctt tcgggaatgg gtaaatcagg gcatgtcggt cgtaaaatgt cagcgacgct 360 ggcctctacg ggtacgccta gtttctttat tcatcctgca gaagctttcc atggcgatct 420 gggcatgatt acgccttacg atcttctgat ccttatttct gccagcggtg aaacggatga 480 aatcctcaag ctagttcctt cactgaaaaa tttcggcaac cgaattatcg ccattaccaa 540 taatggaaat tccacgctgg cgaaaaatgc tgatgccgtg ctggaactcc acatggcgaa 600 tgaaacctgc ccgaataatc ttgcaccaac aacgtctacc acgctgacga tggcgatcgg 660 cgatgcgctg gcgattgcca tgatccacca acgcaaattt atgccgaatg attttgcgcg 720 ctatcacccg ggcggttcat taggtcgtcg cctgctgacc cgcgttgctg atgtcatgca 780 gcatgatgtt cctgcggtac agctggatgc gtcatttaaa accgtgattc aacgtatcac 840 cagcggatgc cagggaatgg tgatggtaga agacgcagaa ggtgggctag cgggcattat 900 caccgacggt gacctgcgtc gctttatgga aaaagaggat tctctgacat ccgccacggc 960 tgcgcagatg atgacacgtg aaccgctgac gctaccggaa gacaccatga tcattgaagc 1020 ggaagaaaaa atgcaaaagc accgcgtctc aacgttattg gtgaccaaca aggcaaataa 1080 agtcactggc cttgtgcgca ttttcgacta attaagcaac ggggtgcgag aggttagtct 1140 ctcattgagt ttgcgcccca ctgaaacttt gataatcgtt acatgttgat aaaagtgaag 1200 tctgccgtat cctggatgcg tgctcgtctg tctgccatct cactggcaga tatccaaaaa 1260 cacctggcga aaatcatcat tctggcaccg atggcggtgc tgctgatcta tctggctatc 1320 ttcagccagc ctcgctatat gagcgagtcg aaagtcgcca ttaaacgctc ggatgattta 1380 aacagcggca gcctgaattt tggtctgctt ctgggtgcct ctaaccccag ttccgcagaa 1440 gatgcgttgt atctgaaaga gtacatcaac tcgccggata tgctggcggc gctggataag 1500 caactaaatt ttcgtgaagc gtttagccac agcgggctcg attttcttaa tcatcttagc 1560 aaggatgaaa ccgcagaagg cttcctgaag tactacaagg accgtatcaa cgtctcgtat 1620 gacgataaaa ccggattact gaatattcag acgcagggct ttagcccgga gtttgcgctt 1680 aagtttaacc aaaccgtgct gaaagagtca gagcgcttta tcaatgagat gtcacatcgc 1740 atcgcgcgtg accagcttgc ctttgcagaa acggagatgg aaaaggcacg ccagcgtctg 1800 gacgccagca aagcggaatt gctctcttat caggacaaca acaacgttct ggatccacag 1860 gcacaggcac aggcggcgag cacgttagtg aatacgctga tgggccagaa gatccagatg 1920 gaagcggacc tgcggaactt gctgacgtat ctgcgtgagg acgccccgca agttgtgagt 1980 gcgcgtaatg cgattcagtc attgcaggca caaattgacg aagaaaaaag caaaatcact 2040 gcgccacagg gtgacaagct aaaccgtatg gcagtggatt ttgaagaaat caaatcaaaa 2100 gtagagttca acaccgagct gtacaaactg accctgacct ccattgaaaa gacccgtgta 2160 gaagcggctc gtaagctcaa ggtgctgtca gtgatcagtt cgccacagtt gccgcaggaa 2220 tcgtcttttc caaatatccc ttatttgatc gcctgctggt tactggtgtg ctgcctgctg 2280 ttcggcaccc tgaaactgtt gctggctgtt attgaagatc accgagacta acgctgtcgc 2340 tgaatgagtt tgtgatgaaa ttatttaaat caattttact gattgccgcc tgtcacgcgg 2400 cgcaggccag cgcgaccatt gatattaacg ctgacccaaa cctgacagga gccgcgccgc 2460 ttaccggtat tctgaacgga cagaagtcgg atacgcaaaa catgagcggc ttcgacaata 2520 ccccgccgcc cgcaccgccg gtggtaatga gccgtatgtt tggtgctcaa cttttcaacg 2580 gcaccagcgc ggatagcggt gcgacggtag gattcaaccc tgactatatt ctgaatccgg 2640 gtgatagcat tcaggttcgc ttgtggggtg cgttcacctt tgatggtgcg ttacaggttg 2700 atcccaaagg taatattttc ctgccgaacg ttggtccggt gaaagttgct ggcgtcagta 2760 atagtcagct aaatgccttg gtcacatcca aagtgaagga agtataccag tccaacgtca 2820 acgtctacgc ctccttatta caggcgcagc cagtaaaagt gtacgtgacc ggatttgtgc 2880 gtaatcctgg tctgtatggc ggtgtgacgt ctgattcgtt actcaattat ctgatcaagg 2940 ctggcggcgt tgatccagag cgcggaagtt acgttgatat tgtggtcaag cgcggtaacc 3000 gcgtgcgctc caacgtcaac ctgtacgact tcctgctgaa cggcaaactg ggactttcgc 3060 agttcgccga tggtgacacc atcatcgtcg ggccacgtca gcatactttc agcgttcagg 3120 gcgatgtctt taacagctac gactttgagt tccgcgaaag cagcattccc gtaacggaag 3180 cgttgagctg ggcgcgccct aagcctggcg cgactcacat tacgattatg cgtaaacagg 3240 ggctgcaaaa acgcagcgaa tactatccga tcagttctgc gccaggccgt atgttgcaaa 3300 atggcgatac cttaatcgtg agcactgacc gctatgccgg caccattcag gtgcgggttg 3360 aaggcgcaca ctccggtgaa catgccatgg tattgcctta tggttccact atgcgtgcgg 3420 ttctggaaaa agtccgcccg aacagcatgt cgcagatgaa cgcagttcag ctttatcgcc 3480 catcagtggc tcagcgtcag aaagagatgc tgaatctctc gctgcaaaag ctggaggaag 3540 cctcactttc tgcccagtca tccaccaaag aagaagccag cctgcgaatg caggaagcac 3600 aactgatcag ccgctttgtg gcgaaagcac gcaccgtggt tccgaaaggt gaagtgatcc 3660 tcaacgaatc caatattgat tctgttctgc ttgaagatgg cgacgtcatc aatattccgg 3720 agaaaacatc gctggttatg gttcatggcg aggtgctgtt cccgaacgcg gtgagctggc 3780 agaaagggat gaccaccgag gattacatcg agaaatgcgg tggcctgacg caaaaatcgg 3840 gtaacgccag aattatcgtc attcgtcaga acggtgcggc agtcaacgct gaagatgtag 3900 attcactcaa gcctggcgat gagattatgg ttctgccgaa atatgaatcg aaaaacattg 3960 aagttacccg tggtatttcc accatcctct atcagctggc ggtgggtgca aaagtgattc 4020 tgtctttgta aggggttgaa atgagcaaag cagttattgt cattccggct cgctatggct 4080 cctcgcgcct gccgggtaag ccactgctcg atattgttgg taaaccgatg atccagcatg 4140 tttacgagcg tgcgttacag gtggcgggcg ttgcggaagt ttgggtggca acagacgatc 4200 cgcgtgttga acaggccgta caggcgtttg gcgggaaagc catcatgacg cgcaacgatc 4260 atgaatccgg caccgatcgg ctggtcgagg tgatgcataa agtcgaggca gatatctaca 4320 ttaacctgca gggcgacgaa ccaatgattc gcccgcggga tgtagaaacg ctgctacaag 4380 gaatgcgtga cgatcccgcg ttgccggtgg caacgctatg ccacgcgatt tctgccgcag 4440 aagcggctga gccaagcacg gtaaaagtgg ttgtgaatac ccgccaggat gcgctttatt 4500 tcagccgctc accgattccg tatccgcgta atgctgaaaa agcgcgctac ctgaaacacg 4560 tcggtattta cgcttatcgt cgcgatgtgc tgcaaaacta cagccagtta ccggagtcca 4620 tgccggagca ggcggaatca ctggagcagc tgcggttgat gagcgcgggg atcaacatcc 4680 gcacatttga ggttgccgca accggtccgg gcgtcgacac cccagcatgc ctggaaaaag 4740 tgcgcgccct gatggcacag gaactggctg aaaacgcatg attggcattt actcgcctgg 4800 catctggcgt attccgcatc tggagaaatt tctggcgcaa ccgtgccaga aactttctct 4860 gctgcgccct gttccgcaag aagttgatgc tatcgccgtg tggggacatc gtcccagtgc 4920 ggcgaaacca gtcgccatcg ccaaagcagc gggaaaaccc gtcattcgtc tggaagatgg 4980 atttgtgcgt tcgctggatc ttggcgtcaa tggcgagccg ccgctttctc tggtggtgga 5040 tgattgtggc atttactacg atgccagcaa gccttcggcg ctggagaaac tggtacagga 5100 taaagccgga aatgcggcat tggctgatca ggccagagaa gcgatgcaca ccatcgtgac 5160 cggggatatg tcgaaatata atctggcgcc tgcgtttgtg gcggatgaat cagaacgtac 5220 aaacatcgtt ctggttgtcg atcagacatt taatgatatg tcagtgacgt atggcaatgc 5280 tggcccgcat gagtttgctg ccatgctgga agccgcgatg gcggaaaatc ctcaagctga 5340 aatttgggtg aaggtgcacc cagatgtact ggaaggaaag aaaacaggtt atttcgccga 5400 tctgcgcgcc acgcaacgag tacgtttaat tgccgagaat gtcagcccgc agtcgctgtt 5460 gcgacacgtt tcccgggttt acgtcgtgac atcccaatac ggctttgaag ccttgctggc 5520 aggaaaacca gtaacatgtt tcggccagcc ctggtatgca ggctggggct taaccgacga 5580 tcgccatccg cagtccgctt tgttatctgc ccgacgcggt tctgccacgc tggaggaact 5640 ttttgccgct gcatacctgc gttactgtcg ctatatcgat ccgcaaacgg gagaagtaag 5700 cgctctattt accgtgctgc aatggctgca attacaacgt cgacatctgc aacagcgtaa 5760 tggttattta tgggtgccag gcttaacgct gtggaagtca gcgatcctga aacctttctt 5820 gcaaacggca acaaaccggc tgagtttttc acgtcgctgt actgcggcga gcgcctgcgt 5880 ggtatggggt gtaaagggag aacagcaatg gcgagccgaa gcgcagcgaa aatcactgcc 5940 gttatggcga atggaagatg gttttctgcg ttcatccgga cttggctctg accttttgcc 6000 accgctatcg ctggtgctgg ataaacgcgg aatctactat gacgccacgc gccccagcga 6060 actggaagtg ctgcttaatc atagccagct aacgctggcg catcagatgc gagctgaaaa 6120 attacgccag cgactggttg aaagtaaact gagcaagtac aacctgggag ccgatttctc 6180 tctaccagcc gaagccaaag ataaaaaagt tatcctggtg ccgggtcagg tagaggacga 6240 tgcctctatt aaaacaggca ctgtgtcgat taagagcaac cttgagttat tacgcacagt 6300 acgcgagcgc aatccgcacg cctacattat ttataaaccg cacccggatg tattagtggg 6360 gaatcgcaag ggcgatattc cggcagaaca gattgctgaa cttgctgatt atcaggcact 6420 ggacgcagat attattcaat gcatccaacg cgcagatgaa gtgcatacca tgacgtcgct 6480 gtcggggttt gaagcgttat tacatggcaa gcaagttcat tgttacggcc tgcccttcta 6540 tgccagttgg ggtttaaccg ttgatgaaca tcattgcccg cgccgcgagc gcagattaac 6600 gatagcagac ttgatctatc aggcgttgat tgtttatcca acctatatcc acccaacacg 6660 gctacaacct attacggttg aagaagctgc ggaatattta atcaagacac cgcgaaagcc 6720 gatatttatt acccgaaaaa aagcggggcg ggtaatacgc tattaccgca aattaattat 6780 gttctgcaag gtcagatttg gctaaacaat ttcatagttg actattacgc aaattattta 6840 tgcacggtaa tgcactaacc gttttattat ccggtaaaaa atatctgcta ttgcaggggc 6900 caatgggacc ttttttcaat gacgtcgccg aatggttaga gtcattaggc cgtaacgctg 6960 tgaatgttgt cttcaacggt ggggatcgtt tttactgccg ccatcgacaa tacctggctt 7020 actaccaaac gccgaaagag ttccccggat ggttacggga tctccaccgg caatatgact 7080 ttgataccat cctctgcttt ggcgactgcc gcctattgca caaagaagca aaacgttggg 7140 caaagtcgaa agggatccgc tttctggcat ttgaggaagg atatttacgc ccgcaattta 7200 ttaccgttga agaaggcgga gtaaacgcat attcatcgct accgcgcgat ccggattttt 7260 atcgtaagtt accagatatg cctacgccgc acgttgagaa cttaaaacct tcaacgatga 7320 aacgtatagg tcatgcgatg tggtattacc tgatgggctg gcattaccgc catgagttcc 7380 ctcgctaccg ccaccataaa tcgttttccc cctggtatga ggctcgttgc tgggttcgtg 7440 catactggcg caagcaactt tacaaggtaa cacagcgtaa ggtattaccg aggttaatga 7500 atgagctgga ccagcgttat tatcttgccg ttttgcaggt gtataacgat agccagattc 7560 gtaaccacag caattataac gatgtgcgtg actatattaa tgaagtcatg tactcatttt 7620 cacgtaaagc accgaaagaa agttatttgg tgatcaagca ccatccaatg gatcgtggtc 7680 acagactcta tcgaccatta attaagcgat tgagtaagga atatggctta gatgagcgag 7740 tcatttatgt gcacgatctc ccgatgccgg aattattacg ccatgcaaaa gcggtagtga 7800 cgattaacag tacggcgggg atctctgcgc tgattcataa caaaccactc aaagtgatgg 7860 gcaatgccct gtacgacatc aaaggcttga cgtatcaagg gcatttgcac cagttctggc 7920 aggccgattt taaaccgaat atgaaactgt ttaagaagtt tcgagggtat ttattggtta 7980 agacgcaggt taatgcggtt tattatgggg agatgatttt taacaagata aaaaaatata 8040 aaaaaagata aaaaagattg tattatgcta tcaaaaaaac atcacaatga atggcattaa 8100 cataaccatt cataaactcc cattcattaa ataaatgatt aacatactat aattagaaaa 8160 cacaataaat tattaaaata aatattatag attatacatt tagtgataag ttatatactg 8220 gtaaagttaa catgagcact ttgtaatgca gttttgatgg cattagtatc tactaatatt 8280 gagtcgggcg cagaaaatgg tcgattttta ttagtgaaat cagaatttcc tatgtaaaga 8340 ctttctttat ttcttaacgc ctgaatgtgc catcgcgacc aggaatccca atatttttgg 8400 cgatctggtg aaattccctg agatgtatat cctgttgtag gtgaattcat taacgagtcg 8460 gtacgatggc ttcctagcgt caaaggcaat ttaatacgat gtacagtgga atcaccaaaa 8520 attagcttaa gtcgagcaat gaattcacta tcagcccccg ttttaacaca gtcccaaacg 8580 cccgcttttt gcaatacatc cgctcttcta aacaacagag aagaaggatt cagtcttttt 8640 agtggataga ccgcacgcgc atagaaaatc ccattatctt gcaaccttac ccaatcagaa 8700 atcgaacaaa ttagtttagg gtttaacaat aaaggtgata tctgtctaaa taatttttca 8760 ggatgggacc agtcatctga gtcatggcat gtcacaaact ctccctttgc ctgtattaag 8820 cctattcgtt ttgcagcata tgttccaaca ttttgtggca ggctaataat ttttattcga 8880 gtatctttga gtgctaatct ctgaagacgg aatagcgtat catcggtgct ggcatcatcc 8940 acaataatta gctcaaatga acggtatgtt tgattaagca atgatattac tgcattttct 9000 acccgcctac cggtattgta tgttgtcatt aaaatagaaa tcagggggcc cgtttgggca 9060 ggataaggaa tcgatgtaat aatattacaa ggtgacaaag gagatgagtt atctgtcagt 9120 gcgaccggag ataaaccaaa gtacttatag tattcgttaa gtctatttaa cgagatttct 9180 gccgtttctc tgaaagcatt attttgcaag agtaatatat caggggaata tacaatatca 9240 ctggcatcaa tctgagcgag tgttgatata gctttttgag ttaacccgat tcttaattga 9300 agagctgtat acaagtctaa gggacaatta tcgacattat ctaataatga taatgaaaac 9360 gtaggagagt atgatgctaa ggtttttgct aactcaactt tttgatgtgt gtctgtgaac 9420 tcgtctttaa actccatgag taattccgga gttaagctta tgtcaccaca ggcaatttta 9480 gctattttga ttgctaattt acaccgccaa tctgacggtg tatcagtaag attatgtaat 9540 gaccaataca tattaagcct gtacattgcc aatatacgtt ttgactgcca aaatcggcag 9600 tcatcttgta ttgcagctaa agcatgtaca tatcgacttt tctttaatag ccataaaaat 9660 tttaaattat tgaacataat caagagtcga caccaaataa atctcgcgta taaacttttt 9720 cacttacatc ttctaattct gacgtgcggc gattggctac tataacatca acacgttctt 9780 taaaagaatt aatatcacgc tcaacataag aaccaaagaa ataaggctct tttagtacag 9840 gttcatatac aactatctca attcctttgg ctttgagtcg tttcattaca ccttgaatac 9900 tacttgctct aaagttatca ctacctgctt tcattatgag gcgatagatt cctacaactt 9960 ttggtttacg acttaatata tcctccgcaa caaagtcttt tcgggtagta ttggcatcga 10020 caatagcctg gattaagttc tgcggaacat cacgataatt tgcgagtaat tgcttggtat 10080 ccttaggtaa gcagtaacct ccataaccaa aagaaggatt attataatgt tgaccaattc 10140 taggatctaa actaacaccc tctataattt gctttgtatc taaaccatga acggaggcat 10200 aagtatccaa ttcattgaaa taagcaatcc gcattgcaag gtaagtattt gcaaaaagtt 10260 taatggcttc agcttcaggg ctatccgtta acaatattgg aatatctttt tttatagcgc 10320 cttcactgag aagctctgcg aactttcttg ctcgttcgct actctctccc acaactatac 10380 gagatggata taggttgtca taaagagctt taccttcacg taaaaattct ggggaaaaga 10440 taatattatt cgtgtttaga tcgcgtttta gtcgttcagt aaatccgacg gggactgtag 10500 atttaattat gatagttgca ttaggattta tacttagtac gtcacatgct actgattcta 10560 ctgagagtgt atcgaagtta ttattaatgg gatcataatt ggttggtgtt gcgattataa 10620 cataatcagc atctctatac gcttcgtatt tttctgttgt agcatatagg tttaattttc 10680 tattagataa aaatttttgt atttcaggat cacatattgg tgatattttt ttattaatca 10740 actgaacttt cttaggatct atatcgagag cgataatatc atgtttttgt gaaagtaata 10800 tagcaattga tataccaaca tatcctacac cagcaactgc aattttcata atagattata 10860 tttaattccg tgtataaaat caaagaaatg tgattaagca ttgataacaa taaattatca 10920 gatttattag gccaaaccta atttttattt ttttccttgc aaattttcat attctctagg 10980 agtaccacaa aaaataacat cagacttatt tatttctgta taatacactt tgatcccatt 11040 actaattaga taattgtata ttggggctat atataactct ccagcatccc aattttcttg 11100 aggtagattt ttataatgtt catatgctga aataaaattt ttaattgtag aaaaatgata 11160 taatcctgtg cagcataagt tagaaatttg ttttttttcg ctagtagcaa tgacctcatt 11220 ttttacatca tttgatggca taacaaaaga ccagttatcc ccatctcctc gaaatacttc 11280 aatataacat tcattttccc cttcgaactt agtaaatata aaattaggcc taattgtatc 11340 aatgttaaaa atagtgattg gttgttctat attaaataat tttgatatag ccaaatatac 11400 tgtttctgct tgcccccgag tttctttatc aagagtaatc aaggtgtagc tattaatccc 11460 taaagatgct attctttgta atacaaaaga cttcgtattg aaaacatccc taaggataaa 11520 gacaaaatgt tcagtctcaa aatataattt gaaacttttc aaacatagat cgaatagaaa 11580 ctcaccattc aattcaagca tatattttgg tttggaatat ccagccttga aaaaacgcga 11640 actcatcccc gccattggaa ttataatcat actgcagcct ccttaaaaat ttcatataat 11700 ctaaatgcat tagcaaatag tgcatcttgc ctttttttgt catcggaatg aaggggaagc 11760 attgataaaa ataaatgtat ttgcatcgca tacaatgatt tttcggagat tgaatatttc 11820 tcttttatta tagaaacaaa tgttgattga atttcaaaca atttattatc aatattaatt 11880 ttgaattcaa tactatgagt tttatttttt ttatttatta tataatatcc tgcaattatc 11940 caatcataga gccctagtat tgaatgtgat aatttagcta tatcataacg aaaatcacca 12000 taaatactta tttctccaga gtggttcaat cctctgggat caaaaacttg tattctacca 12060 gttctaaagt taaaaattat attactaaag cataaatcgc catgcataat agttttatat 12120 tgcagttcac ttgggataaa tttattagta tcataaagaa tatcattaat tgaaacgctt 12180 atattattat taaaattcca ttttgcattt ggatcaatat ttaaatctgt tatgtacttg 12240 ctaacccgct caatcgtttt ttcataaaat aaatcttgca gtatattttt gtcagtatca 12300 attgaatgat attctttgca cagatcgatg aagtctaaac aacttattaa tatatttgtt 12360 aaaatattat ttggtaggcg agaaaaaaca aataattcat ttaacgtcgt attatataaa 12420 tattcaagct tataactctt tctgatatga tcaaacggtt ccaataacat tggagtatag 12480 atctttaatt ctccgggaat agtttcaaac cattttgatt cagcttcaat tttactttca 12540 tttgaacttg atttgataac ggattttgtt gtaatgcata attcattaaa tgcacgctgg 12600 gttgtgtatt gtacttttga cttatagtat gtattaatat gtccaaaatc aagccaatca 12660 gacacgtata tagaagctaa actatagctg tcgtgatact ttttaagtgc cgccgtaaaa 12720 tcaaattttg aagtaactaa ttccctaata aaaaaattcg gtttactaaa agaaaaatac 12780 ccacaaatta catttttatt atcttctcta ctgacggctc ttaactctgt ttcgtaaaaa 12840 aatgaccatt gataattatc atcagaatga cttattgcta ctaaatcatc ccctgcagga 12900 atttttttaa agagtgtatc gccaaacaat aattgtaagc ctttgtcatc tttatctcct 12960 attaaattcc atgcggtaac tatcgcttgc cctaatgtca agttactatc gacaggaatc 13020 attgttactt tattacgaag caaccattca taatcatgtt tgtcaaacac aaaatcttcc 13080 ggtaaaacca gatatattgc atgaccatca tgccctaaag atacttgatg cttaaataat 13140 cgtttattag ctaaaggaag aaagcttgga ggaatagaac caaattcggc ccctaattct 13200 tgttgaacat aggaaccaga cattattaga agcatttttt ctcctgttct aacatattag 13260 aaatctcttc taaggtcata ttgcaaagtt ctgatggtcg aatagctcta tcatcaacat 13320 aaaacccctc atctccacac caaggtttac caacaatcac ctcatcataa gggactctat 13380 tttcattcaa ccaatcaatt ataactggta atgtatgaat attaatctta cctatatttt 13440 ctttatatgt cctcatattc cttgctgtaa aaataacaat ataaaaacca ttaagcttat 13500 attcatacaa tttttcaatt agttttttgt ttggagttgc atgtgaatat tttcctgata 13560 aattaaaaga tatggtgtta tctaaatcta caattatttt tttcatatag tgcatctttc 13620 attgttaagt gatatctata ccttgcaata aataactcat tcccgcaaag aaagtatttg 13680 ttctagcgat atttttcgag gcgctacaat attttttatt tttaaattag aaaccttgca 13740 atcatataca ttagcccaag cacataaccc tacattaata tgacctgaat aataaacatt 13800 agaacttgag atcaaggatg ttagctgact atatatatta tctaaaccat ggacacacat 13860 cagctttttc attatatcag gatcgccgta aaataattgg tcgcctatgc caaaccccca 13920 ttctctaaat atccacccat tactatcctc acaataaaca gaatcatcta catctatatc 13980 attaattgtc acattatcaa cttgcaataa agcatcaggc cttatcttta taatgcacct 14040 atatttatcc caattatgat ttttaagact acagaaccaa aatgaattat ggtaatacat 14100 tttttctgca ttactcattt tattatatgg atattcccca tcatctttaa tgtttattaa 14160 aactgagtta catccagaga aaaaacttga atatatctcc tctaaattat tatttttata 14220 tgaacttaag ctcaagtctt ttaattcatc atagtgttcg tctacaaacg agtagttatc 14280 tggctctgaa acatattgtg cagcctcgct gtcaaatatc ctacatattc tttctttaga 14340 taactgtgtg tgtccgatat ctttccatgt actaataaaa acatcaacat cagaaggaat 14400 cgttatttta cttacgagat taggtagggc atctataaaa cctcttgatt gtccagttat 14460 gaataaagct atttgcctgt ttgtatttaa tgaaacatta cttgaaataa agtcatcaat 14520 tacagatatt ctacttttta taatgcaaga aatgataccg gagtattcgt cagcattagc 14580 caagacaatt tcatttatat gacacaaaaa attacgttct tgctgaggtg tttcataaaa 14640 cctttttgat gttagactaa gagccagcaa taataattta atggagttaa aagtacatcc 14700 attagagttt atcacaagat tgtaaacata gtttggtata tgtggtcgac tcataagtcg 14760 tttaaaagat gtgtctccta acgaggaaag atcagtatta ttcttattga atcttttaat 14820 ataaaactcg ggaaaaaaga atgcaaaata aaaagtccct gcattgctta acttattagg 14880 tataataata tattcaaaat actcactcaa ccataggtca aaaagttcaa gtatttttaa 14940 atgagcatta aatcccttac cagtagagat attttttata cagcttaatg ttctctcatc 15000 taaatgattt acaattaatt gtacaagttt aattttatct tctttctttg aaagacttaa 15060 tatatgatca aatgttaagt tttttagcat gttggatttg cccctatgtt tccagatacc 15120 tgttatcact taacccatca ctggcccact gccgcagata ttcccgtggc gagcgataac 15180 ccagcgcact atgcggatgc cattcgttat aatgctcgaa cgcctctgca aggttctttg 15240 ctgccgttaa cccgtctggt ttgggcatga tacttatgta gtcacgcttt atcgttttca 15300 cgaagctctc tgctattccg ttactctccg gactccgcac tgccgtgttc ttcggttcaa 15360 gtcccaacat cctggcgaac tgacgtgttt cattcgcccg gtagcatgaa ccattatccg 15420 tcagccactc cactggagac gccggaagct cgctgccaaa gcggcgttcc actgctccca 15480 gcatgacgtc ctgtactgtt tcactgtcga agccacccgt tgtgaccgcc cagtgcagtg 15540 cctcacggtc acagcagtcc agcgcgaacg tgacccgcag tttttctccg ttatcacagc 15600 ggaactcaaa cccgtcagag caccatcgct gattactttc tttcacagcc actctgccgg 15660 tatgtgcccg tttcgatggc ggtacagcgg gttttcgctc aagcaacagc gcattctggc 15720 gcatggtccg gtaaacacgt ttggcattga tcgcaggcat accatcaagt tctgtttgtc 15780 tgcgaagcag cgcccatacc cgacgataac catacgtggg cagctctccg ataacatggt 15840 gtatacggcg aagcacatcc gtatcatccg tgtgacggct gcggcggccg tccttccagt 15900 catcggctcg tctgagaatg acgtgcaact gcgcacgcga cacccggaga caacggctga 15960 cgaagcttac tccccatccc cgggcaataa gggcgcgtgc gctatccact tttttgctcg 16020 cccatattca acggcttctt taaggagttc attttccatc gtttttttgc cgagcagacg 16080 ctggagttct ttaatctgct tcatggcggc agcaagttca gaggcaggaa cgacctgttc 16140 tccggcagcc acagcagtaa gacttccctc ctggtattgc ttacgccaga gaaatagctg 16200 gctggctgcc acaccatgtt gccgggcaac aagggagacc gtcattcccg gttcaaagct 16260 ctgctgaacg atagcgatct tttcctgtgt agtacgccgt ctgcgtttct ccggccctaa 16320 gacatcaatc atctgttctc caatgactag tctaaaaact agtattaaga ctatcactta 16380 tttaagtgat attggttgtc tggagattca gggggccagt ctacatgttt atcacttgta 16440 atatatcaat aattataaat cattctctat tttttcccag gtatattttc tacattcatt 16500 caaattagtt aatggtgaat atttatattt ttttatgcct agcctactta atgattcgtt 16560 aacaacttta aaatgatttt ccttttgaat atccaacttt tttatagacg tattttcacc 16620 atgcaatacg cgattataac aaattttgtt tatatgcttg aacggtccaa cttcactaag 16680 ttttaaatac atatcgtaat caactgcgtt gctgatcgat tcgttgaaac cttcagttag 16740 gttccatgct cttgctgtga acatcctgaa atgatgacat atcattgcac tagtaagttt 16800 ttctcgcgaa taaatgggcc aattatagcc atttgatatc aaattacctt cacgatctat 16860 attacggtta gttgtataaa cacatgccaa tgatagatct tttctaaatt catctagaca 16920 tagttcaaca gcatctggtt caagaaagtc atcagagtct aactgaccta tatagaatcc 16980 ccgacacaat ctaactgctg tattagatgc tgaaccaatt cctttgtttt tttgtgaaat 17040 aaaacgaact cgaggatggt ttgcataatg ctcctgaaga atccgcaatg tatcatctgt 17100 ggaaccatca tcgcatatgc atacttctaa gtcagttatt gtctgattaa gggcgctttc 17160 aacacaacga acaatatatt tagagcagtt ataggcggga atatatatag atactagtgg 17220 tactcttttt aatgtcgcgg attctatttt ttcttttttt ctatagaaat aaggaacttt 17280 ttgctgtaac aattgaacag taatattttt ccctgccgca cgatccgtct cgttttcttt 17340 cccgggtggt tcttgatgat atgccattgc tccttcaaca gaccgaaagt aacatccttc 17400 tctgtagaga cgatatccaa actcattatc ctcccccccc caatgcgtaa actcttcatc 17460 aaaccatcct gcacggaaaa gccatttttt cgcaaaagcg acattacctc cgctaaaaaa 17520 tcgaaatggt gtgttgcata atcttagatt atcggtattt ttgaaatgtt ctattcgcca 17580 gtcaactgat ttgttttgct caaccttgcc tgcaacctga ttattagtaa tgatttcagg 17640 aatttcattt attagtgatt tttgggaaag gaaatctaaa tatgtatgct tgcttgtatc 17700 tatatatttt ctagggccaa ttagagcaac attatcgtcc accgctaata gttccatata 17760 tgactgaacc catagtgggt tcggagccat atcacaatcc agaattgcaa cataattata 17820 ctttgcagcc ctaagcccaa gatttctaac agcacacagt tgatatccat aatccttctg 17880 acgtacatat tttatattta ataaactttc aaattctctt actatttctt caatattttc 17940 tttacttcca tcatcggcaa caataacttc atagtcgtat atggtctttt ggttacaaag 18000 acaagcaagt gtaattgcaa gtatttttgc tcgattatat gtaggaatta caatactaag 18060 cccgtcaatg attaactgtt ttcttggata atcatcaagc tcttttcttt tccccgccca 18120 aacataatcg tttgtgctct caggtaacgg cggtaaagtt aaatcactag gccaatctaa 18180 aggaatgggt tcgacttcct ttaactccgc ccgttctgat ttctttgcgg ttatttctcg 18240 gtatttgctt attatttcat ttttttcaac ctcgttcaga ctaattgctt tggcgttaga 18300 acacattatt tttgttgctg catcaatatc aataacagct ttacgattta acttatcaac 18360 ttcttcagaa agattgagtg cggtttggca taattttata tttgcttcga cccaactaac 18420 atcataaatt tcagcaacct tctcaaaaag agataaagct tggcgataat ttttgttttt 18480 atataaattt attgcttgat taagaatact catattattt caacctaatc tagtataatt 18540 aaagtatcaa cacgcataat aatcatgtcc ctatatatat attttcatgc gatatcataa 18600 tcttgcccca ttaaatccta attgatactt gaagaaatat tgagaatcgt atttttaatt 18660 tattatttta tttttttaat taaataaagc gtaaaccact atgacttaaa caattagaaa 18720 aaagctattt cacttaacta agaaaatttt cactattaat tcgcacgcat ttatagccga 18780 tattttaact ttatatttag tagcctggat ttattttcca cagtatttaa cccctacctg 18840 agaattattt tttgttcttt tgaattgacg tattgttctg tatatcgaaa atggcaaaga 18900 tatcaaccct agtggaaaat tatttttatt tatgattaat tttcctaatt gataggataa 18960 atgttttttc accctttctg cctcatgttt atcagcataa agaaatattg atggcagaga 19020 gacttgatat tcactatcgt atttcttttt ccatgttcgc cattcggata tcaaagcaaa 19080 aggaatgcta attaatccta aaaatgtttt tgaacgacta accattacag cacccaggcg 19140 atatccaatg tcctgtttta tacgttctgc tgcaccatat aattctggaa gttgtttttt 19200 ttctaatcgt tgattatcaa taaaatattg ttcaagtttt tgttgtacta aatgcaattg 19260 attaagcagt agttcttttt cacaacttaa tttttccaat ctttgttgtt gcaattcatt 19320 tttattttgt tctttcttta acagcgattc aaaattttct atggcgcatt caagctcctg 19380 aacttgtatt gtcttatttt ttattattaa atcatattga atcaattctt ctttagagtc 19440 actcaattct tttaaaatag cctgatatgc atttaattgt tttgatgtgt gtaactcgtt 19500 atctaaaatt atttttttag aggactgata taatccattg acaatatcta atgttatttg 19560 gcgttgtttt ataaatgtct cccatataaa ggaaggcttg taattttcct tttctaaaac 19620 cctaagcgga gtatttgcat tagattgtaa ttcaaaataa agctctttac aatctggata 19680 atcattcaat acattgaaaa ttaaatattc ctctgtttca ctctgtttga atataatatc 19740 tccggttcct atatcaatac ctgatagaga cattatttcc tgatgctctt tttccagagt 19800 aatcgaagct tcagccgtct taaaatcatt tacagattgt tctagtgaat gattaatcgt 19860 atttgaaaat gaaagaccaa atttcaactt aagcttatgt tgaagttgtt gtatgcaatc 19920 ctctgcatta cgtttgactt gttctgagct tactaataaa cacctaccgc gattattaag 19980 aaaaaagtgt aacaatgctg tattataggc aagccagttt ttaattaaat gttctgacgt 20040 atagttggac gatatatttt gatctgaaaa ataatttgtt aaaatagact ttggatgatc 20100 gtaaattaga ataaatgtaa tgttttcatc aacactcttc caatattcta atgtatggat 20160 tgcattagga tccgaccatc cgcacaattt ttggttcaaa ttactaagca tcaagtcaag 20220 ggctatacca ttccagacag tagaaacgtg taatggttcg aaatcagcac tatctgttac 20280 agtgtatata tcaggggatt gatatgcctt acgaagcgtc tgagtgatat cttgggggct 20340 taaattttct cgcttcgatg gacatagaga attcattcct ctttgatgca aaagttcttc 20400 tacaatttga taattagagc tcggatgacc aactattact agtctattca tgatgtttta 20460 tccccccaag gcagaaaacc ctttattcgc catttgttta gttagcttta attaacaccc 20520 catctacttt ttagtgtcta cgaatttatt aaaccaattc accacactaa atttcgatta 20580 ttaagatgcc aatagatata gaagttatcg taaaattttg ctttacctta tgcatgatta 20640 aatataacca tttgggtttt tcatttgcca gcgccaggca tcctcaagca ttgtttccaa 20700 ttccctttta gctttccaat tgagatactt atttgctttt tctggtgatg accaactttc 20760 agcaatatcc ccatctcttc tcgaaacaat ttcatatgga attctaaccc cagatatttt 20820 ttcaaaggta gaaaccagct ctaaaacaga atatccttta ccagtaccta aattaaaaac 20880 atgataatta gtgttattat cacggaaaag gtaagataaa gcagccacat gcccttccgc 20940 taaatccatt acgtgtatat aatcacgaac accggttcca tcctttgtag ggtaatcccc 21000 cccaaacacc ataagttttt ctagtttacc catagcaact tgtaatatat aaggaactaa 21060 attgcttggt atatcagcgg gactttcacc gatcattccc gactcgtgag cacctgttgg 21120 gttaaaatat ctcagacaca aaaaattagt atcgctatat ttttttgcaa tatctctaat 21180 catcaattct gatatatact ttgatgtacc atatggattt aatgttcctc ctatatggca 21240 atcttctgta acaggcatta ttttgctttc accataaacc gttgcagaag agctaaaaat 21300 aaaattagcc acatcgtttt ttatagcgca attaattaat tgcaacgtcc ctgaaacatt 21360 attatcataa taaaaaatgg gttttattaa agattcagca acagactttg caccggcaaa 21420 atgcattata caatcaaatt tgtgtttttt tagaatttga ttaacttctt tttcattgtt 21480 gatgttcaac tcatagaaag taactttttt tttagctatt aattcaatcc ttcgaatgct 21540 ctcgcaagat gaattaatta agttgtcaat gattacaaca ttgtaacctt tattcagaag 21600 acataaacta gtatgcgagc caatatagcc tgctccacct gtaactaata tattcatttt 21660 tcacccttga aaacaacatc agtaattatt ttgttccgtt atatactctt ctatcccctc 21720 ctgaacatcc tcatgaaaac taaccgcatt gtcatcctta aaaacaatgg ccacatcaca 21780 aaactctttc aatgaattca aactatgtga aaccattaaa aaactagatt ctttatgcct 21840 ttctttaaac aattgagcgc atttttcttt aaacctggca tcaccgactg cggttacttc 21900 atcgacgata taataatcaa atttaaatgc catacttaaa ccaaagccta ggcgagatcg 21960 cataccagag gagtaagttt tgatcggcat atcaaaatac ttgccgagtt cggcaaattc 22020 ttcaacaaac tcaattttct ctttcagttc ttcttgcttc gcgtataacc tcgcgacaaa 22080 ttttacattt tcgcgtccgg ttaaacttcc ctgaaatcca cctgcaaggc cgactggcca 22140 tgatatcgtt ttattggtga tgatctttcc gctatcgggg cggtcaatgc caccaatcat 22200 tctcagtaac gttgatttac ccgcaccatt acgaccaata aaggcaacac tttttcctga 22260 agggatttca atatttaaat tcttaaagac ataatgtcga cccactggcg tgcgatatga 22320 cttcgtcaaa ttttcaatct taatcatgat gtcagcattg cctcttcacg cgttcggtat 22380 aacgccagac cgatgaacag ggtgaccaga gtgaacattg caaggtagtt cagactcacg 22440 ccttcgctga tatagccagg cataactgcc tcgcggctta actctacgac atgcactaat 22500 gggttccaga gtagatatga ccagtattgc tttggaatcg agtgtaaagg gaacatgatg 22560 caggagatga aatacagcgg cttaagcagt atcggcagga ccttttgcat ttcagggaaa 22620 gtcttaccaa cgaccatgaa tattaagcca acgccacatg aaagaatgat taacaaactc 22680 caggtaagca caaattgtaa aaagtttgtt atttcgaaat attcgcctgc catccagatg 22740 ataagcataa gcaatatata aacagcaacg taaatcagtg tctcaagcaa tgcacgcgca 22800 atgatcgtat cgatgggttt tactggtcga taattaaaca gcccctgatt cgcttcaata 22860 gcacctacag aacgattgct gatactgcta aagataaaaa agggaatcag gccattaagt 22920 aaaaacaccg ggaatgagat gtctggcatc gtgcggtgca taatgtaacc aaaaatgccc 22980 aacagtatca gcaaatgcgc agagggttcg agaatcgccc acagatatcc cagacggaac 23040 ttaccaaagc gtgttcgtat ttctcgtaga aataatgcct ctacggtgac tttctggact 23100 tcaaatccac ttcttgccat ttgatgatgt gaccctattc tcttcaggta tgctaccgcc 23160 cctggcttaa cagctaccaa tacactggag gtaatacttg tttgtaactg gataaaattt 23220 actcagacgg 23230 <210> 118 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Primer <400> 118 gcacctccat gagacattgc 20 <210> 119 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Primer <400> 119 ccactgccat acggtttagc 20 <210> 120 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Primer <400> 120 gcttgccttt gcagaaacgg 20 <210> 121 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Primer <400> 121 ccaacaatat cgagcagtgg 20 <210> 122 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Primer <400> 122 gtcattcgtc agaacggtgc 20 <210> 123 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Primer <400> 123 ccagtgcctg ataatcagc 19 <210> 124 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Primer <400> 124 ggcttaacgc tgtggaagtc 20 <210> 125 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Primer <400> 125 atattgggat tcctggtcgc 20 <210> 126 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Primer <400> 126 acgacatcaa aggcttgacg 20 <210> 127 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Primer <400> 127 atagccctga agctgaagcc 20 <210> 128 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Primer <400> 128 cgagtgattg cttggtatcc 20 <210> 129 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Primer <400> 129 aaacgattga gcgggttagc 20 <210> 130 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Primer <400> 130 agagtggttc aatcctctgg 20 <210> 131 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Primer <400> 131 tgtcttggct aatgctgacg 20 <210> 132 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Primer <400> 132 cgagtagtta tctggctctg 20 <210> 133 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Primer <400> 133 gtcagttaga ctctgatgac 20 <210> 134 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Primer <400> 134 cttgaacggt ccaacttcac 20 <210> 135 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Primer <400> 135 agttcaggag cttgaatgcg 20 <210> 136 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Primer <400> 136 ttcgcacgca tttatagccg 20 <210> 137 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Primer <400> 137 tcatcttgcg agagcattcg 20 <210> 138 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Primer <400> 138 cttccgctaa atccattacg 20 <210> 139 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Primer <400> 139 agatctattt atccctgcgg 20 <210> 140 <211> 257 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 140 gctcagcaag agcagaaaga cagcgacggt gtagccggtt ggatcaagga tatgtttggt 60 agtaattaac atctaagcgt gaaataccgg atggcgagtt gccatccggt aaaataacat 120 cccatctact gcaggctagc taattcttga catagtttca cagattgtgt tataataact 180 acacgacgtt catcgtcgtc aatgtacagg aggtcaacaa atggattttt gcttattgaa 240 cgagaaaagt cagatct 257 <210> 141 <211> 5409 <212> DNA <213> Artificial Sequence <220> <223> synthetic plasmid pCX027 <400> 141 ttaccaatgc ttaatcagtg aggcacctat ctcagcgatc tgtctatttc gttcatccat 60 agttgcctga ctccccgtcg tgtagataac tacgatacgg gagggcttac catctggccc 120 cagtgctgca atgataccgc gagacccacg ctcaccggct ccagatttat cagcaataaa 180 ccagccagcc ggaagggccg agcgcagaag tggtcctgca actttatccg cctccatcca 240 gtctattaat tgttgccggg aagctagagt aagtagttcg ccagttaata gtttgcgcaa 300 cgttgttgcc attgctacag gcatcgtggt gtcacgctcg tcgtttggta tggcttcatt 360 cagctccggt tcccaacgat caaggcgagt tacatgatcc cccatgttgt gcaaaaaagc 420 ggttagctcc ttcggtcctc cgatcgttgt cagaagtaag ttggccgcag tgttatcact 480 catggttatg gcagcactgc ataattctct tactgtcatg ccatccgtaa gatgcttttc 540 tgtgactggt gagtactcaa ccaagtcatt ctgagaatag tgtatgcggc gaccgagttg 600 ctcttgcccg gcgtcaatac gggataatac cgcgccacat agcagaactt taaaagtgct 660 catcattgga aaacgttctt cggggcgaaa actctcaagg atcttaccgc tgttgagatc 720 cagttcgatg taacccactc gtgcacccaa ctgatcttca gcatctttta ctttcaccag 780 cgtttctggg tgagcaaaaa caggaaggca aaatgccgca aaaaagggaa taagggcgac 840 acggaaatgt tgaatactca tactcttcct ttttcaatat tattgaagca tttatcaggg 900 ttattgtctc atgagcggat acatatttga atgtatttag aaaaataaac aaataggggt 960 tccgcgcaca tttccccgaa aagtgccacc tgacgtctag atctgaattc agctgtacaa 1020 ttggtaccat ggatgcatat ggcggccggg ccctacgtac gcgtgttaac cggtgagctc 1080 actagaggat ccagccgacc aggctttcca cgcccgcgtg ccgctccatg tcgttcgcgc 1140 ggttctcgga aacgcgctgc cgcgtttcgt gattgtcacg ctcaagcccg tagtcccgtt 1200 cgagcgtcgc gcagaggtca gcgagggcgc ggtaggcccg atacggctca tggatggtgt 1260 ttcgggtcgg gtgaatcttg ttgatggcga tatggatgtg caggttgtcg gtgtcgtgat 1320 gcacggcact gacgcgctga tgctcggcga agccaagccc agcgcagatg cggtcctcaa 1380 tcgcgcgcaa cgtctccgcg tcgggcttct ctcccgcgcg gaagctaacc agcaggtgat 1440 aggtcttgtc ggcctcggaa cgggtgttgc cgtgctgggt cgccatcacc tcggccatga 1500 cagcgggcag ggtgtttgcc tcgcagttcg tgacgcgcac gtgacccagg cgctcggtct 1560 tgccttgctc gtcggtgatg tacttcacca gctccgcgaa gtcgctcttc ttgatggagc 1620 gcatggggac gtgcttggca atcacgcgca ccccccggcc gttttagcgg ctaaaaaagt 1680 catggctctg ccctcgggcg gaccacgccc atcatgacct tgccaagctc gtcctgcttc 1740 tcttcgatct tcgccagcag ggcgaggatc gtggcatcac cgaaccgcgc cgtgcgcggg 1800 tcgtcggtga gccagagttt cagcaggccg cccaggcggc ccaggtcgcc attgatgcgg 1860 gccagctcgc ggacgtgctc atagtccacg acgcccgtga ttttgtagcc ctggccgacg 1920 gccagcaggt aggccgacag gctcatgccg gccgccgccg ccttttcctc aatcgctctt 1980 cgttcgtctg gaaggcagta caccttgata ggtgggctgc ccttcctggt tggcttggtt 2040 tcatcagcca tccgcttgcc ctcatctgtt acgccggcgg tagccggcca gcctcgcaga 2100 gcaggattcc cgttgagcac cgccaggtgc gaataaggga cagtgaagaa ggaacacccg 2160 ctcgcgggtg ggcctacttc acctatcctg cccggctgac gccgttggat acaccaagga 2220 aagtctacac gaaccctttg gcaaaatcct gtatatcgtg cgaaaaagga tggatatacc 2280 gaaaaaatcg ctataatgac cccgaagcag ggttatgcag cggaaaagcg ctgcttccct 2340 gctgttttgt ggaatatcta ccgactggaa acaggcaaat gcaggaaatt actgaactga 2400 ggggacaggc gagagacgat gccaaagagc tacaccgacg agctggccga gtgggttgaa 2460 tcccgcgcgg ccaagaagcg ccggcgtgat gaggctgcgg ttgcgttcct ggcggtgagg 2520 gcggatgtcg aggcggcgtt agcgtccggc tatgcgctcg tcaccatttg ggagcacatg 2580 cgggaaacgg ggaaggtcaa gttctcctac gagacgttcc gctcgcacgc caggcggcac 2640 atcaaggcca agcccgccga tgtgcccgca ccgcaggcca aggctgcgga acccgcgccg 2700 gcacccaaga cgccggagcc acggcggccg aagcaggggg gcaaggctga aaagccggcc 2760 cccgctgcgg ccccgaccgg cttcaccttc aacccaacac cggacaaaaa ggatccccaa 2820 ttctcatgtt tgacagctta tcatcgataa gctttaatgc ggtagtttat cacagttaaa 2880 ttgctaacgc agtcaggcac cgtgtatgaa atctaacaat gcgctcatcg tcatcctcgg 2940 caccgtcacc ctggatgctg taggcatagg cttggttatg ccggtactgc cgggcctctt 3000 gcgggatatc gtccattccg acagcatcgc cagtcactat ggcgtgctgc tagcgctata 3060 tgcgttgatg caatttctat gcgcacccgt tctcggagca ctgtccgacc gctttggccg 3120 ccgcccagtc ctgctcgctt cgctacttgg agccactatc gactacgcga tcatggcgac 3180 cacacccgtc ctgtggatcc tctacgccgg acgcatcgtg gccggcatca ccggcgccac 3240 aggtgcggtt gctggcgcct atatcgccga catcaccgat ggggaagatc gggctcgcca 3300 cttcgggctc atgagcgctt gtttcggcgt gggtatggtg gcaggccccg tggccggggg 3360 actgttgggc gccatctcct tgcatgcacc attccttgcg gcggcggtgc tcaacggcct 3420 caacctacta ctgggctgct tcctaatgca ggagtcgcat aagggagagc gtcgaccgat 3480 gcccttgaga gccttcaacc cagtcagctc cttccggtgg gcgcggggca tgactatcgt 3540 cgccgcactt atgactgtct tctttatcat gcaactcgta ggacaggtgc cggcagcgct 3600 ctgggtcatt ttcggcgagg accgctttcg ctggagcgcg acgatgatcg gcctgtcgct 3660 tgcggtattc ggaatcttgc acgccctcgc tcaagccttc gtcactggtc ccgccaccaa 3720 acgtttcggc gagaagcagg ccattatcgc cggcatggcg gccgacgcgc tgggctacgt 3780 cttgctggcg ttcgcgacgc gaggctggat ggccttcccc attatgattc ttctcgcttc 3840 cggcggcatc gggatgcccg cgttgcaggc catgctgtcc aggcaggtag atgacgacca 3900 tcagggacag cttcaaggat cgctcgcggc tcttaccagc ctaacttcga tcactggacc 3960 gctgatcgtc acggcgattt atgccgcctc ggcgagcaca tggaacgggt tggcatggat 4020 tgtaggcgcc gccctatacc ttgtctgcct ccccgcgttg cgtcgcggtg catggagccg 4080 ggccacctcg acctgaatgg aagccggcgg cacctcgcta acggattcac cactccaaga 4140 attggagcca atcaattctt gcggagaact gtgaatgcgc aaaccaaccc ttggcagaac 4200 atatccatcg cgtccgccat ctccagcagc cgcacgcggc gcatctcggg cagcgttggg 4260 tcctggccac gggtgcgcat gatcgtgctc ctgtcgttga ggacccggct aggctggcgg 4320 ggttgcctta ctggttagca gaatgaatca ccgatacgcg agcgaacgtg aagcgactgc 4380 tgctgcaaaa cgtctgcgac ctgagcaaca acatgaatgg tcttcggttt ccgtgtttcg 4440 taaagtctgg aaacgcggaa gtcagcgctc ttccgcttcc tcgctcactg actcgctgcg 4500 ctcggtcgtt cggctgcggc gagcggtatc agctcactca aaggcggtaa tacggttatc 4560 cacagaatca ggggataacg caggaaagaa catgtgagca aaaggccagc aaaaggccag 4620 gaaccgtaaa aaggccgcgt tgctggcgtt tttccatagg ctccgccccc ctgacgagca 4680 tcacaaaaat cgacgctcaa gtcagaggtg gcgaaacccg acaggactat aaagatacca 4740 ggcgtttccc cctggaagct ccctcgtgcg ctctcctgtt ccgaccctgc cgcttaccgg 4800 atacctgtcc gcctttctcc cttcgggaag cgtggcgctt tctcatagct cacgctgtag 4860 gtatctcagt tcggtgtagg tcgttcgctc caagctgggc tgtgtgcacg aaccccccgt 4920 tcagcccgac cgctgcgcct tatccggtaa ctatcgtctt gagtccaacc cggtaagaca 4980 cgacttatcg ccactggcag cagccactgg taacaggatt agcagagcga ggtatgtagg 5040 cggtgctaca gagttcttga agtggtggcc taactacggc tacactagaa ggacagtatt 5100 tggtatctgc gctctgctga agccagttac cttcggaaaa agagttggta gctcttgatc 5160 cggcaaacaa accaccgctg gtagcggtgg tttttttgtt tgcaagcagc agattacgcg 5220 cagaaaaaaa ggatctcaag aagatccttt gatcttttct acggggtctg acgctcagtg 5280 gaacgaaaac tcacgttaag ggattttggt catgagatta tcaaaaagga tcttcaccta 5340 gatcctttta aattaaaaat gaagttttaa atcaatctaa agtatatatg agtaaacttg 5400 gtctgacag 5409 <210> 142 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> synthetic polylinker <400> 142 ttaattaagg gtttaaacta c 21 <210> 143 <211> 28641 <212> DNA <213> Artificial Sequence <220> <223> synthetic plasmid pDD61 <400> 143 ctcgggccgt ctcttgggct tgatcggcct tcttgcgcat ctcacgcgct cctgcggcgg 60 cctgtagggc aggctcatac ccctgccgaa ccgcttttgt cagccggtcg gccacggctt 120 ccggcgtctc aacgcgcttt gagattccca gcttttcggc caatccctgc ggtgcatagg 180 cgcgtggctc gaccgcttgc gggctgatgg tgacgtggcc cactggtggc cgctccaggg 240 cctcgtagaa cgcctgaatg cgcgtgtgac gtgccttgct gccctcgatg ccccgttgca 300 gccctagatc ggccacagcg gccgcaaacg tggtctggtc gcgggtcatc tgcgctttgt 360 tgccgatgaa ctccttggcc gacagcctgc cgtcctgcgt cagcggcacc acgaacgcgg 420 tcatgtgcgg gctggtttcg tcacggtgga tgctggccgt cacgatgcga tccgccccgt 480 acttgtccgc cagccacttg tgcgccttct cgaagaacgc cgcctgctgt tcttggctgg 540 ccgacttcca ccattccggg ctggccgtca tgacgtactc gaccgccaac acagcgtcct 600 tgcgccgctt ctctggcagc aactcgcgca gtcggcccat cgcttcatcg gtgctgctgg 660 ccgcccagtg ctcgttctct ggcgtcctgc tggcgtcagc gttgggcgtc tcgcgctcgc 720 ggtaggcgtg cttgagactg gccgccacgt tgcccatttt cgccagcttc ttgcatcgca 780 tgatcgcgta tgccgccatg cctgcccctc ccttttggtg tccaaccggc tcgacggggg 840 cagcgcaagg cggtgcctcc ggcgggccac tcaatgcttg agtatactca ctagactttg 900 cttcgcaaag tcgtgaccgc ctacggcggc tgcggcgccc tacgggcttg ctctccgggc 960 ttcgccctgc gcggtcgctg cgctcccttg ccagcccgtg gatatgtgga cgatggccgc 1020 gagcggccac cggctggctc gcttcgctcg gcccgtggac aaccctgctg gacaagctga 1080 tggacaggct gcgcctgccc acgagcttga ccacagggat tgcccaccgg ctacccagcc 1140 ttcgaccaca tacccaccgg ctccaactgc gcggcctgcg gccttgcccc atcaattttt 1200 ttaattttct ctggggaaaa gcctccggcc tgcggcctgc gcgcttcgct tgccggttgg 1260 acaccaagtg gaaggcgggt caaggctcgc gcagcgaccg cgcagcggct tggccttgac 1320 gcgcctggaa cgacccaagc ctatgcgagt gggggcagtc gaaggcgaag cccgcccgcc 1380 tgccccccga gacctgcaga tccacatcct tgaaggccgc agcgacgagc agaaggaaac 1440 cctcattcgg gaagtcagcg aggccatctc gcgctccctg gatgcgccgc tgaccagcgt 1500 gcgagtgatt atcacggaga tggccaaggg ccacttcggc atcggcggcg aactggccag 1560 caaggtcaga cgctgaagtg gagatgccca agggcacttc gggtcgagga acccgacctg 1620 cattgggacg cggccacgga gagcgcgggc aaacgccggc actatagcca gtggagtttg 1680 taaaacgcta tttcagagct tggagagtgt ctaagaaagc cggggcgatg ccaacccatc 1740 ccttcttcgg ctatgcatcg ttcgtaatca agccacttcc tttttgcatt gacgcagggt 1800 gtcggaaggc aactcgccga acgcgctcct atagttttca gcgaagcgtc ccaaatgtaa 1860 gaagccgtag tctagggcta tctcagttat actacgcaca ttggcactgg gatcgttcaa 1920 gcaggcgcgg atgctttcga gcttgcggtt gcggatgtag ttcttcggcg tggtgccggc 1980 atgcttctcg aacaaattgt agagcgagcg tggactcatc atcgccagct ccgctaaccg 2040 ctcaaggctg atattccgtt tgagattctc ctcaatgaat tgaacgactc gctcgaaaga 2100 cgggttacct ttgctgaaaa tttcacggct gacattgctg cccagcattt cgagcagctt 2160 ggaagcgatg atccccgcat agtgctcttg gacccgaggc atcgactttg tatgttccgc 2220 ttcgtcacaa actaacccga gtagattgat aaagccatcg agttgctgga gattgtgtcg 2280 cgcggcgaaa cggataccct ccctcggctt gtgccaattg ttgtcactgc atgcccgatc 2340 aaggaccact gagggcaatt taacgataaa tttctcgcaa tcttctgaat aggtcaggtc 2400 ggcttggtca tccggattga gcagcaatag ttcgcccggc gcaaaatagt gctcctggcc 2460 atggccacgc cacaggcaat ggcctttgag tattatttgc agatgataac aggtctctaa 2520 tccaggcgag attaccctca cgctaccgcc gtagctgatt cgacacaggt cgaggcatcc 2580 gaagattctg tggtgcagcc tgcctgccgg gcgcccgccc ttgggcaggc gaatagagtg 2640 cgtaccgaca tactggttaa cataatcgga gactgcatag ggctcggcgt ggacgaagat 2700 ctgacttttc tcgttcaata agcaaaaatc catagttcac ggttctctta ttttaatgtg 2760 ggctgcttgg tgtgatgtag aaaggcgcca agtcgatgaa aatgcatctc gacgtgatgc 2820 gtatacgggt tacccccatt gccacgttgc gccatccttt ttgcaatcag tgaccacttt 2880 tccaagcaaa aataacgcca agcagaacga agacgttctt tttaagaagc gagaacacca 2940 gaagttcgtg ctgtcggggc atgcggcgac gaattggcgg ataaagggga tctgcaggtc 3000 ccgagcctca cggcggcgag tgcgggggtt ccaagggggc agcgccacct tgggcaaggc 3060 cgaaggccgc gcagtcgatc aacaagcccc ggaggggcca ctttttgccg gagggggagc 3120 cgcgccgaag gcgtggggga accccgcagg ggtgcccttc tttgggcacc aaagaactag 3180 atatagggcg aaatgcgaaa gacttaaaaa tcaacaactt aaaaaagggg ggtacgcaac 3240 agctcattgc ggcacccccc gcaatagctc attgcgtagg ttaaagaaaa tctgtaattg 3300 actgccactt ttacgcaacg cataattgtt gtcgcgctgc cgaaaagttg cagctgattg 3360 cgcatggtgc cgcaaccgtg cggcacccta ccgcatggag ataagcatgg ccacgcagtc 3420 cagagaaatc ggcattcaag ccaagaacaa gcccggtcac tgggtgcaaa cggaacgcaa 3480 agcgcatgag gcgtgggccg ggcttattgc gaggaaaccc acggcggcaa tgctgctgca 3540 tcacctcgtg gcgcagatgg gccaccagaa cgccgtggtg gtcagccaga agacactttc 3600 caagctcatc ggacgttctt tgcggacggt ccaatacgca gtcaaggact tggtggccga 3660 gcgctggatc tccgtcgtga agctcaacgg ccccggcacc gtgtcggcct acgtggtcaa 3720 tgaccgcgtg gcgtggggcc agccccgcga ccagttgcgc ctgtcggtgt tcagtgccgc 3780 cgtggtggtt gatcacgacg accaggacga atcgctgttg gggcatggcg acctgcgccg 3840 catcccgacc ctgtatccgg gcgagcagca actaccgacc ggccccggcg aggagccgcc 3900 cagccagccc ggcattccgg gcatggaacc agacctgcca gccttgaccg aaacggagga 3960 atgggaacgg cgcgggcagc agcgcctgcc gatgcccgat gagccgtgtt ttctggacga 4020 tggcgagccg ttggagccgc cgacacgggt cacgctgccg cgccggtagc acttgggttg 4080 cgcagcaacc cgtaagtgcg ctgttccaga ctatcggctg tagccgcctc gccgccctat 4140 accttgtctg cctccccgcg ttgcgtcgcg gtgcatggag ccgggccacc tcgacctgaa 4200 tggaagccgg cggcacctcg ctaacggatt caccgttttt atcaggctct gggaggcaga 4260 ataaatgatc atatcgtcaa ttattacctc cacggggaga gcctgagcaa actggcctca 4320 ggcatttgag aagcacacgg tcacactgct tccggtagtc aataaaccgg taaaccagca 4380 atagacataa gcggctattt aacgaccctg ccctgaaccg acgaccgggt cgaatttgct 4440 ttcgactatc ggcgcgccag agctcatcgt taatgtcttc gtgcgccgtc agtcggcgca 4500 cgttttttct ctctggtacc gtgtcactga tctagtcaat tactcgaagt atccacaagt 4560 gaagcatact aagtaatgta caagaatcaa aaaaatcggc tacgcaagtc gcgtagccga 4620 atcatttaag gatccttcca ttcaggtcga ggtggcccgg ctccatgcac cgcgacgcaa 4680 cgcggggagg cagacaaggt atagggcggc gcctacaatc catgccaacc cgttccatgt 4740 gctcgccgag gcggcataaa tcgccgtgac gatcagcggt ccagtgatcg aagttaggct 4800 ggtaagagcc gcgagcgatc cttgaagctg tccctgatgg tcgtcatcta cctgcctgga 4860 cagcatggcc tgcaacgcgg gcatcccgat gccgccggaa gcgagaagaa tcataatggg 4920 gaaggccatc cagcctcgcg tcgcgaacgc cagcaagacg tagcccagcg cgtcggccgc 4980 catgccggcg ataatggcct gcttctcgcc gaaacgtttg gtggcgggac cagtgacgaa 5040 ggcttgagcg agggcgtgca agattccgaa taccgcaagc gacaggccga tcatcgtcgc 5100 gctccagcga aagcggtcct cgccgaaaat gacccagagc gctgccggca cctgtcctac 5160 gagttgcatg ataaagaaga cagtcataag tgcggcgacg atagtcatgc cccgcgccca 5220 ccggaaggag ctgactgggt tgaaggctct caagggcatc ggtcgacgct ctcccttatg 5280 cgactcctgc attaggaagc agcccagtag taggttgagg ccgttgagca ccgccgccgc 5340 aaggaatggt gcatgcaagg agatggcgcc caacagtccc ccggccacgg ggcctgccac 5400 catacccacg ccgaaacaag cgctcatgag cccgaagtgg cgagcccgat cttccccatc 5460 ggtgatgtcg gcgatatagg cgccagcaac cgcacctgtg gcgccggtga tgccggccac 5520 gatgcgtccg gcgtacaaga tccacaggac gggtgtggtc gccatgatcg cgtagtcgat 5580 agtggctcca agtagcgaag cgagcaggac tgggcggcgg ccaaagcggt cggacagtgc 5640 tccgagaacg ggtgcgcata gaaattgcat caacgcatat agcgctagca gcacgccata 5700 gtgactggcg atgctgtcgg aatggacgat atcccgcaag aggcccggca gtaccggcat 5760 aaccaagcct atgcctacag catccagggt gacggtgccg aggatgacga tgagcgcatt 5820 gttagatttc atacacggtg cctgactgcg ttagcaattt aactgtgata aactaccgca 5880 ttaaagccga gcgatgataa gctgtcaaac atgagatccg ataaatcgat tgatagattt 5940 aaataagaac tgcagaagct agcttagatg ctcgtgaaat tgacgtgggc gctttgcagg 6000 gccgtcttaa tggcgttggt gtccacgagg atcgagtcgg gtgcggaaaa cggacggttc 6060 ttgttggtga aatcgctgtt accaatgtac agcgattcct tgttacgcag cgcctggatg 6120 tgccagcggg accacgaatc ccaatacttc tggcgatccg gcgagatacc ttggctggtg 6180 tagccggtcg tcgggctgtt catcaacgag tcggtgcggt gcgagcccag cgtcagcggc 6240 aacttgatcc gatgcaccgt ggaatcgccg aagatcagct tcagacgcgc gataaattcg 6300 ctatccgcac ccgttttcac acaatcccag acaccggcct tctgcaagac gtcggcacgg 6360 cgaaacagga gcgacgacgg attcagacgc ttcaaggggt acactgcgcg ggcatagaaa 6420 ataccgttgt cttgcaggcg cacccagtcc gagatggagc agatgagctt cggattgagc 6480 aacaaggggg agatttggcg gaacagcttt tccggatggc tccagtcatc cgaatcgtgg 6540 caggtgacga actcgccctt cgcttggatc aagccgatac gcttcgcggc ataggtgccg 6600 acattctgcg gcaggctaat gatcttgatg cgcgtgtctt tgagggcgag ccgctggaga 6660 cgaaacaggg tgtcatcggt gctcgcgtca tccacaatga tcagctcgaa ggaacggtag 6720 gtctgattga ggagcgaaat caccgcattt tccacgcggc gacccgtatt ataggtggtc 6780 atcaggatgg agatcaacgg ccccgtctgg gccgggtacg ggatgctggt gatgatgttg 6840 cacggggaga gcggggagct gttgtccgtc aaggccacgg ggctgaggcc gaagtattta 6900 tagtattcat tcagccgatt caggctaatt tcggcggttt cgcggaaggc gttattttgc 6960 agcagcagga tatccgggct atagacgata tcggatgcgt cgatctgggc gagggtcgag 7020 atggcctttt gggtcaggcc gatccggagt tgcagtgcgg tatacaggtc cagcgggcag 7080 ttgtccacgt tgtccaacag gctcaggcta aaggtcggcg agtaggacgc cagggttttc 7140 gccagttcca ctttctgatg ggtatcggtg aactcgtcct tgaactccat cagcagctcg 7200 ggcgtcaggc tgatgtcgcc gcaggcgatt tttgcgatct tgattgccag tttgcagcgc 7260 caatcggacg gggtatccgt caagttatgc agcgaccagt acatattcag acgatacatc 7320 gcgaggatgc gtttcgactg ccagaaccgg caatcatcct ggatggccgc gagcgcgtgg 7380 acgtagcggc tctttttgag cagccacaag aatttgagat tattgaacat ttattaacct 7440 cctgctagca acttaagtta cgaatcgacg ccgaacaggt cgcgggtgta gactttctcc 7500 gagacatctt ccagttcgct ggtgcggcga ttcgccacaa tgacatcgac gcgctcctta 7560 aaggaattga tgtcgcgctc gacgtaggaa ccgaagaagt agggttcttt caggaccggc 7620 tcgtacacca caatctcgat acccttggcc ttcaaacgtt tcatgacccc ctggatgctg 7680 ctggcccgga aattgtcgct acccgccttc atgatcaggc gatagatacc gaccactttg 7740 ggcttacggg acaggatgtc ctcggccacg aagtccttac gggtcgtatt cgcatccacg 7800 atggcctgga tcaggttttg cgggacgtcg cgataattgg ccaacagctg cttcgtatcc 7860 ttcggcagac agtaaccgcc gtagccgaag gacgggttgt tgtaatgttg accaatgcgc 7920 ggatcgaggg agacgccttc gatgatttgt ttggtatcca ggccgtgcac gctcgcgtag 7980 gtgtccagct cgttaaagta cgcgatacgc atcgccagat acgtgttcgc gaacagtttg 8040 atggcttctg cctcgggcga atccgtcagc aggatcggaa tatccttttt gatggcacct 8100 tccgacagga gttcggcgaa cttccgtgcg cgttccgacg attcgcccac gacaatgcgg 8160 ctcggataga gattatcata cagggctttg ccttcgcgca ggaactccgg ggaaaagatg 8220 atattattcg tgttcagatc gcgcttcagg cgttcggtga acccgacggg gacggtggat 8280 ttgataatga tggtcgcgtt cgggttaatg gacagcacgt cacacgcgac gctttcgacg 8340 ctcagggtat caaagttgtt attaatcgga tcatagttcg tcggggtggc gatgatcacg 8400 tagtctgcat cgcgatatgc ctcgtatttt tccgtcgtcg cgtagaggtt cagcttacga 8460 ttggagagaa acttctggat ttccgggtcg caaatcggcg agattttctt gttaatgagc 8520 tggaccttct tcgggtcgat gtccagggcg atgatgtcgt gtttttggga gaggaggatc 8580 gcaatgctga tacccacata gccgacgccg gccacggcaa ttttcattta ttaacctcct 8640 taagtgaatt cttataccgc agcttctttg aagatttcgt acagacgaaa ggcattctta 8700 ctttttcccc tggagattct catactcacg cggggtgccg cagaagatca cgtcggactt 8760 attgatttcg gtataataca ctttgatccc attggagatc aggtaattgt agatcggcgc 8820 aatatacagc tcgcccgcat cccagttttc ttgcggcagg ttcttgtaat gttcatacgc 8880 ggaaataaag tttttgatcg tgctgaagtg gtacagcccg gtgcaacaca aattgctaat 8940 ctgtttcttt tcggacgtgg caatcacttc atttttgacg tcattgctgg gcatcacgaa 9000 cgaccagttg tcgccatcgc cgcgaaacac ttcaatgtaa cattcattct cgccctcgaa 9060 cttggtgaag atgaagttgg gacgaatcgt gtcgatgttg aagatggtga tcggctgttc 9120 gatattaaac agtttcgaga tggccaaata gaccgtctct gcttgacccc gcgtttcctt 9180 atccagggtg atcagcgtat agctattaat gcccaggctg gcgatacgct ggagcacgaa 9240 cgatttcgtg ttaaacacgt cacggaggat gaagacaaag tgttccgtct cgaagtacag 9300 tttgaagctc ttgaggcaca aatcgaacag aaactcgcca ttcagctcca gcatatactt 9360 cggtttgcta taaccggctt tgaaaaagcg gctcgacata cctgccatcg ggataataat 9420 catactgctg cctccttaaa gatttcatac aggcggaagg cattcgcaaa cagggcgtcc 9480 tgccgcttct tgtcgtcgct atgcaacggc agcatcgaca agaacagatg aatttgcatg 9540 gcgtacagcg acttttcgga gatgctgtat ttttccttaa taatggacac gaaggtcgat 9600 tggatttcaa agagtttgtt atcaatattg attttgaact caatggaatg ggtcttattc 9660 tttttgttga taatgtagta gcccgcgatg atccagtcat acaggcctag aatggagtgc 9720 gacagtttcg caatatcgta gcggaaatcg ccatagatcg agatttcgcc gctgtggttc 9780 agaccgcgcg gatcgaacac ctgaatccgg cccgtgcgga agttaaagat aatattgctg 9840 aagcacaggt ccccgtgcat gatggtcttg tattgcagtt cggacggaat gaatttgttc 9900 gtgtcgtaca ggatgtcgtt gatgctcacg ctaatattgt tgttaaaatt ccatttcgcg 9960 ttcgggtcaa tgttgagatc ggtgatatac ttgctgacgc gctcgatggt cttttcgtaa 10020 aacagatcct ggagaatgtt tttatccgta tcaatgctat gatactcttt gcagaggtcg 10080 ataaaatcca ggcagctgat cagaatgttg gtcaggatat tattcggcag gcgggagaac 10140 acgaacagtt cgttcagggt ggtattgtac aggtattcga gtttgtagct tttgcgaatg 10200 tgatcgaacg gttccagcaa catcggggtg tagattttca gttcacccgg aatcgtctcg 10260 aaccatttcg attctgcctc gatcttgctt tcattcgagg aggacttaat cacggacttg 10320 gtcgtgatgc acagctcatt gaaggcacgc tgggtcgtgt actggacttt cgacttatag 10380 taggtattga tgtgaccgaa atcgagccag tcgctgacgt aaatcgacgc caagctgtac 10440 gaatcatggt actttttcag ggctgccgtg aagtcaaact tgctggtgac cagttcgcga 10500 atgaagaaat tgggtttgct gaacgagaag tacccgcaga tgacattttt gttgtcctcg 10560 cgggagactg cccgcaattc cgtctcatag aaaaaggacc actggtagtt atcatcggaa 10620 tgggagatcg ccacgaggtc atcacccgcc ggaatcttct tgaacaaggt atcaccaaac 10680 agcagttgca ggcctttatc atctttgtcg ccgatcagat tccaggccgt gacgattgcc 10740 tggcccaggg tcagattgct atcgaccgga atcatcgtca ctttattgcg cagcaaccat 10800 tcgtaatcgt gtttgtcgaa cacgaaatct tccggcagga ccaggtagat cgcatggcca 10860 tcgtgcccca agctgacctg gtgcttgaac agacgcttgt ttgccaacgg caggaacgac 10920 ggcgggatgc taccgaactc cgcgcccaat tcctgctgca cgtagctacc agacattatt 10980 agaagcattt tttctcctgt tctaacatat tagagatttc ttccaaggtc atattgcaca 11040 gttccgaggg ccggatggcc cgatcgtcca catagaagcc ctcgtcgccg caccacggct 11100 tgccgacaat cacctcgtca tacgggacgc ggttttcgtt cagccagtcg atgatcaccg 11160 gcagcgtatg aatattgatc ttgccaatgt tttccttgta cgtccgcata ttgcgcgcgg 11220 taaagatgac gatgtagaaa ccgttcagct tgtactcata gagtttttcg atcaatttct 11280 tattgggggt tgcatggctg tatttgccgc tcagattgaa gctaatcgta ttatccagat 11340 cgacgataat tttcttcatt tattaacctc cttaatataa accaaggtaa gcttttattc 11400 ccgcaggctc agaatttgct ccaggctgat tttacgcggg gccacaatat tcttgatctt 11460 cagattgctc actttacagt cgtacacatt ggcccaggcg cacaagccga cgttgatgtg 11520 ccccgagtag tacacattcg acgacgagat caggctcgtc agttgcgagt aaatgttatc 11580 cagaccatgc acgcacatca gtttcttcat gatgtccggg tcgccataga acagctgatc 11640 gccgatgcca aacccccact cgcgaaaaat ccaaccgttg ctgtcctcgc aatacacgct 11700 gtcgtccacg tcgatatcgt tgatggtcac gttatccact tgcagcaggg catcggggcg 11760 gattttgatg atgcagcggt acttatccca gttatgattt ttcagcgagc agaaccaaaa 11820 ggaattgtgg tagtacatct tttccgcgtt gctcatcttg ttatacggat attcgccatc 11880 atccttgata ttgatcagga cggagttgca gccggagaag aacgacgagt agatttcttc 11940 caggttattg ttcttatagg aggagagcga caggtctttc agctcatcat aatgttcatc 12000 cacgaagctg taattgtcgg gttcggacac gtattgggcg gcttccgaat caaaaatgcg 12060 gcagatgcgt tctttgctca gttgcgtatg cccgatatcc ttccaggtgg agataaacac 12120 atcgacgtcc gacggaatcg tgatcttgct gaccaggttc ggcagcgcgt cgatgaaacc 12180 gcgcgactgc cccgtgatga acaatgcgat ctggcgattg gtattcaggc tcacattgct 12240 gctaatgaaa tcatcaatca ccgagatgcg cgatttgatg atacaggaaa tgatgccgct 12300 atattcgtcg gcgtttgcca ggacaatttc attgatgtgg cacaagaagt tgcgctcctg 12360 ctgcggggtt tcgtagaagc gtttgctggt cagggacagt gcgagcagca acaacttaat 12420 cgaattgaag gtgcagccgt tcgagttgat cacgagatta tacacgtagt tggggatgtg 12480 cggacggctc atcaggcgct tgaagctggt atcacccaag ctggacaggt ccgtgttatt 12540 cttgttgaaa cgtttgatgt agaactccgg aaagaagaac gcgaagtaaa acgtccctgc 12600 gttcgacaac ttgttcggga tgataatata ctcgaagtat tccgacagcc acaagtcgaa 12660 caactccagg attttgagat gcgcattaaa gcctttgccg gtcgaaatgt tcttgatgca 12720 ggacagcgtg cgctcgtcca gatggttgac gatgagctgc accagtttga ttttatcttc 12780 tttcttgctc aggctcagga tgtgatcgaa ggtcaagttc ttcaacattt attaatcctc 12840 ctaataagct ttgaattcaa actagtttac aagtcgtttt cgatcttctc ccaggtatat 12900 ttgcgacatt cattcaagtt ggtcagcggc gagtatttgt actttttgat accgaggcgc 12960 gacaggcttt cgttcaccac cttgaaatgg ttttcctttt ggatgtccag tttcttgatc 13020 gacgtgttct cgccgtgcag gacacggttg tagcaaatct tattgatatg cttaaacggg 13080 ccgacttcgc tgagtttcaa atacatatcg taatccaccg cattgctgat gctctcgttg 13140 aagccttcgg tgaggttcca tgcacgcgcc gtgaacatac ggaagtggtg gcagatcatc 13200 gcgctcgtga gcttttcgcg gctgtaaatc ggccagttgt agccattgct aatcaagtta 13260 ccttcacgat caatattgcg attggtggtg tacacgcagg cgaggctcag gtctttgcga 13320 aattcatcca gacacagttc cacggcatcg ggctccagga aatcatcgga atccagctgc 13380 ccgatgtaga aaccccggca caggcggact gcggtattcg aggcggagcc gatgcctttg 13440 tttttctggc tgatgaaacg gacgcgcggg tggtttgcgt aatgttcttg caggatgcgc 13500 agcgtatcat cggtgctccc gtcatcgcag atgcagacct ccagatcggt gatcgtttgg 13560 ttcagtgccg attcgacgca gcgcacgata tatttgctgc aattatacgc ggggatgtag 13620 atgctcacca ggggcacacg tttcagggtg gcgctctcga ttttctcctt cttgcgataa 13680 aagtagggca ccttctgctg caacagctgg acggtaatgt ttttacctgc cgcgcgatcg 13740 gtttcgttct ccttaccggg cggttcctga tgatatgcca tcgcgccttc cacgctacgg 13800 aaataacaac cctcgcggta cagccgatag ccgaactcat tatcctcacc gccccaatgc 13860 gtgaactctt cgtcaaacca acccgcgcga aacagccact tctttgcaaa cgccacattg 13920 ccaccgctaa agaaccggaa cggggtgttg cacaggcgca gattgtcggt attcttgaaa 13980 tgttcgatgc gccaatcgac ggatttgttc tgctcgacct tgcctgcgac ctgattattg 14040 gtaataatct ccgggatttc attgatcagg cttttctggg acaaaaagtc cagataggta 14100 tgcttcgacg tgtcgatgta tttacgcggg ccaatcagtg ccacgttatc atccacggcc 14160 aggagttcca tataggactg cacccacaac gggttcggcg ccatatcgca gtccaagatc 14220 gccacgtagt tgtatttcgc tgcccgcagg cccaggttcc gcacggcgca cagctggtag 14280 ccgtagtctt tctggcggac gtatttgatg ttcagcaacg actcgaactc gcggacgatc 14340 tcttcgatgt tttccttgga accgtcatcc gcgacgatga cctcatagtc ataaatcgtt 14400 ttctgattgc agaggcaggc cagggtgatc gccaggattt tggcgcgatt gtacgtcgga 14460 atcacgatgg acaggccgtc gatgatcagt tgcttgcgcg gataatcatc cagttcttta 14520 cgtttccctg cccagacgta gtcgttcgtg ctttccggca gcggcggcaa ggtcaggtcg 14580 ctcggccaat ccagcggaat gggttcgact tctttcaatt cggcgcgctc ggatttcttt 14640 gcggtaattt cccgatattt gctaatgatt tcattctttt ccacctcatt cagcgagatc 14700 gcctttgcat tgctgcacat aattttggtt gccgcgtcga tatcaatgac cgctttccga 14760 ttcagcttgt ccacttcttc gctcagattc agggcggttt ggcacagctt gatattggct 14820 tccacccagc tcacatcata gatttccgcc actttttcaa acagggagag ggcttggcgg 14880 tagttcttat tcttatacag attgattgcc tggttcaaaa tgctcattta ttaacctcct 14940 actagtgaat tttcgaatta cttaccgcag tacttgacac ccacctggga attgtttttg 15000 gtgcgtttga attggcggat ggtacggtag atgctaaagg gcaggctgat cagaccgagc 15060 ggaaaattgt tcttattgat gatgagcttg cccagctgat agctcaggtg tttcttgacc 15120 cgttcggctt cgtgtttatc cgcgtacagg aagatgctcg gcaggctcac ttggtactcc 15180 gaatcatatt tcttcttcca ggtccgccat tcgctgatca acgcaaacgg aatcgagatc 15240 agaccgagga acgtcttgga gcggctcacc atcaccgcac ccaggcggta gccgatatct 15300 tgcttgatgc gttcggccgc accatacagc tccggcagtt gtttcttttc gagacgttga 15360 ttgtcgatga agtactgttc gagcttttgc tgcaccagat gcagctgatt gagcagcaat 15420 tctttttcgc acgacagctt ttcgaggcgc tgttgttgca gttcattttt gttctgttcc 15480 tttttcagca gggactcgaa gttctcgatc gcgcactcca gttcctggac ctggatggtt 15540 ttgtttttaa tgatcagatc atactggatc agttcttcct tgctatccga cagctctttc 15600 agaatggctt gataggcgtt cagctgtttg gacgtgtgca gttcgttgtc cagaatgatc 15660 tttttgctgc tctggtacag accgttcacg atatcgaggg tgatctggcg ttgtttaatg 15720 aacgtctccc aaataaagga cggcttatag ttttccttct ccagcacccg caagggggtg 15780 ttggcgttcg attgcaattc aaagtacagt tccttgcaat cgggatagtc gttcaggacg 15840 ttgaagatca agtactcctc cgtctcgctt tgcttgaaaa tgatatcccc ggtcccgatg 15900 tcaataccgc tgagggacat gatctcctga tgttcttttt ccagcgtaat ggaggcttcg 15960 gcggtcttaa agtcattcac gctctgctcc agcgagtggt tgatggtatt ggagaacgac 16020 aacccgaatt tcagtttcag tttgtgttgc agttgctgga tgcagtcctc ggcgttgcgc 16080 ttcacctgtt cgctcgacac cagcaggcac cgaccccggt tgttgaggaa gaagtgcagc 16140 aaggcggtgt tgtatgccag ccagtttttg atcagatgct ccgaggtata gttgctggag 16200 atgttctggt ccgagaagta gttcgtcagg atgcttttgg ggtggtcgta gatgaggata 16260 aaggtgatgt tctcatccac cgatttccaa tattccaacg tgtgaattgc gttggggtcg 16320 ctccaaccgc acagtttctg gttcaggttg gacagcatca gatccaatgc gataccgttc 16380 cagacggtgc tcacatggag cggttcaaag tcggcggaat cggtcaccgt atagatgtcc 16440 ggcgactggt acgccttccg cagcgtctgg gtgatgtcct ggggcgagag gttctcacgt 16500 ttggacgggc acagggagtt catgccgcgc tgatgcagga gttcttccac gatttggtag 16560 ttgctgctcg gatggcccac gatcaccagg cggttcattt attaacctcc tttcgaaaat 16620 gaacggtccg ttaaatatag ccattcggat tcttcatctg ccagcgccag gcgtcctcca 16680 gcatggtttc gagttcccgc ttggctttcc agttcagata tttgttggcc ttttcggggg 16740 aggaccagct ctccgcgata tcaccgtcac ggcggctcac gatttcatac ggaatccgca 16800 cgccggaaat cttttcaaag gtggacacca gttccagcac cgaataacct ttacccgtgc 16860 ccaaattaaa gacgtggtag ttggtgttat tgtcgcggaa gagataggac agcgctgcga 16920 cgtgcccttc ggccaggtcc atcacatgga tatagtcacg gacccccgtg ccgtctttgg 16980 tgggataatc accaccgaac accatcagtt tttccagttt ccccatcgcg acctgcaaga 17040 tgtacggcac caagttggag gggatgtctg ccgggctttc accaatcata ccggattcgt 17100 gggcgcccgt cggattaaag tagcgcaagc agaggaaatt cgtgtcggag tatttcttgg 17160 cgatgtcgcg gatcatcagc tccgagatgt acttggacgt accatacgga ttcagcgtgc 17220 caccaatatg gcagtcttcg gtgacgggca tgatcttgct ttccccatac accgtcgccg 17280 acgagctaaa gatgaagttg gcgacgtcgt tcttgatggc gcaattgatg agttgcaggg 17340 tgccgctcac gttgttgtca tagtagaaga tgggcttgat caggctttct gcgaccgatt 17400 tcgcacctgc aaagtgcatg atgcagtcga atttgtgttt cttcaggatc tggttcactt 17460 ccttctcgtt gttgatattg agttcgtaga acgtgacttt cttctttgcg atcagctcaa 17520 tgcgacggat gctttcgcag ctgctgttga tgagattgtc aatgatgacg acattgtagc 17580 ctttgttcag caggcagagc gacgtgtggc tgccgatgta gcctgcaccg ccggtgacca 17640 ggatgttcat ttattaacct cctcggtccg aattaaccta ggttatgagg tcagcattgc 17700 ttcttcacgc gtttagtagt tgttttgttc ggtgatatat tcttcaatgc cttcttgcac 17760 gtcttcatgg aacgacacgg cgttgtcgtc tttaaacacg attgccacat cgcagaactc 17820 tttcaacgag ttcagcgagt gcgacaccat gaggaaggag ctttccttat gacgctcctt 17880 gaagagttgg gcacattttt ccttgaaacg ggcgtccccc accgccgtca cctcgtccac 17940 gatgtagtaa tcgaacttga acgccatgct caggccgaag ccgaggcggc tgcgcatacc 18000 gctcgaatag gtcttgatcg gcatatcaaa atacttcccc agctccgcga actcttccac 18060 aaactcaatc ttttctttca gctcctcctg cttcgcgtac agccgggcca cgaacttcac 18120 gttttcacgc ccggtcaagc tgccctggaa gccgcctgcc agacccaccg gccacgagat 18180 cgttttattc gtgatgattt taccgctatc cgggcggtcg atgcccccaa tcatgcgcaa 18240 cagcgtggat ttacccgccc cattgcgccc gatgaacgcc acgcttttgc cgctggggat 18300 ctcaatgttc aggttcttga agacatagtg acggcccacc ggggtgcggt agcttttcgt 18360 caggttttcg atcttaatca tgaggtcaac attgcctcct cacgcgtacg gtacagggcc 18420 aaaccaataa acagggtcac cagggtgaac attgccagat aattcaggct gaccccttcg 18480 ctgatataac cgggcatcac ggcctcgcgg ctcagttcga cgacgtgcac caggggattc 18540 cacagcaggt acgaccaata ctgcttcgga atggagtgca gcgggaacat gatgcacgaa 18600 ataaagtaca gcggcttcag caagatcggc aagactttct gcatttcggg gaacgtcttg 18660 cccacgacca tgaagatcag gcccacaccg cacgacagga tgatcaggag gctccaggtg 18720 agcacaaatt gcaggaagtt ggtaatctcg aaatattcgc ccgccatcca gatgatcagc 18780 atcaggagga tgtagaccgc cacatagatc agcgtttcca agagggcgcg tgcaatgatc 18840 gtgtcgatcg gcttcacggg ccggtagtta aacagcccct gattggcttc gatggcgccc 18900 acggagcgat tgctgatgct gctgaaaata aagaacggga tcaggccatt gagcaggaac 18960 accgggaagg agatatccgg catggtgcga tgcatgatat agccaaagat cccgagcaga 19020 atcagcagat gtgcgctcgg ttccaggatc gcccacagat agcccaggcg aaacttgcca 19080 aagcgcgtac ggatttcgcg gagaaacagt gcttcgaccg tcactttctg gacttcaaaa 19140 cccgaacgtg ccatttatta acctcctggt accaatctag attgtttaaa cagatccaat 19200 ctagattgtt taaacttctg cagaacacgc ggtgttaacg tttcttatac ttcttaattt 19260 tgttaaagat catttcgccg tagtacaccg cattgacctg ggtcttcacc agcaagtagc 19320 cgcgaaattt cttaaacaac ttcatgttcg gtttaaagtc ggcttgccag aactgatgca 19380 aatgcccctg gtacgtcaga cccttgatat cgtacaaggc gttgcccatg actttcaggg 19440 gcttgttgtg gatcaacgcg gaaatgccgg ccgtgctatt gatggtgacc accgctttgg 19500 cgtggcgcaa cagctccggc atgggcagat cgtgcacata gatgacacgt tcatccaaac 19560 cgtattcctt cgacagacgc ttgatcaacg ggcggtacag gcggtgcccg cgatccatcg 19620 ggtgatgttt gatcaccaga taggactcct tgggggcctt gcgggaaaag ctgtacatca 19680 cttcgttgat gtaatcacgc acatcattat agttgctatg gttgcggatc tggctgtcgt 19740 tgtacacttg caggaccgcc aggtaatagc gctgatccag ctcgttcatc aggcggggga 19800 ggaccttgcg ttgggtgacc ttatacagct gtttgcgcca gtaggcgcgg acccagcagc 19860 gcgcttcata ccacgggctg aacgatttgt ggtggcgata gcgcggaaat tcgtgacgat 19920 agtgccaacc catcaggtaa taccacatgg cgtggccgat gcgcttcatg gtgctcggtt 19980 tcaggttctc gacgtgcggc gtcggcatat cgggcaattt gcggtaaaag tccggatcgc 20040 ggggcaagct gctataggcg ttcacaccgc cttcttccac ggtgataaat tgcggacgca 20100 ggtagccttc ctcgaaggcc agaaaacgaa tccccttcga cttggcccag cgtttggcct 20160 ccttgtgcag caggcggcag tcaccgaaac acaaaatcgt gtcaaagtca tactgacgat 20220 gcaagtcccg cagccaaccg gggaactcct tcggggtttg gtagtacgcc aggtattggc 20280 ggtggcggca gtagaagcga tcaccgccat taaagacgac gttgaccgcg ttgcgaccga 20340 ggctctccaa ccattccgcc acatcgttga agaacggacc catcggacct tggagcagga 20400 ggtacttttt accgctcaac agcaccgtca gcgcattgcc gtgcatttat taacctccta 20460 acacgcggtg ttaagcgttt tcggcgagct cttaaccaaa gcgcactttg cagaacatga 20520 tcaacttgcg atagtagcga atcacacggc cggctttctt gcgggtgata aagatgggtt 20580 tgcggggcgt tttgatcaga tattctgccg cttcctccac cgtgatcggc tgcaaccgcg 20640 tcggatgaat ataggtggga tagacaatca gggcttgata gatcaggtcg gcgatggtca 20700 gccgccgctc gcgacggggg cagtggtgct catcgacggt caggccccac gaggcgtaga 20760 acggcaggcc gtagcagtgc acctgtttac cgtgcagcaa tgcttcaaag ccgctgaggc 20820 tcgtcatcgt gtgcacctcg tccgcacgct gaatacactg aatgatatcg gcatccagtg 20880 cctggtagtc tgcgagttcc gcgatctgtt ccgccggaat gtcaccctta cggttgccga 20940 cgagcacatc ggggtgcggc ttgtagatga tgtaggcgtg cggattacgt tcccgcacgg 21000 tgcgcagcag ctccagattc gacttgatcg acacggtgcc cgtcttaatc gacgcatcgt 21060 cttccacctg gcccggcacc aggatgactt tcttgtcctt cgcttctgcc gggaggctga 21120 aatcggcccc caggttatat ttgctcaatt tgctttccac cagacgttgg cgcaactttt 21180 ccgcgcgcat ctggtgcgcg agggtcagct ggctgtgatt cagcaggacc tccagttccg 21240 acggacgggt ggcatcgtaa tagataccgc gcttatccag gaccaggctc aacggcggca 21300 gcagatcgct ccccaggccg gagctgcgca ggaagccgtc ttccatgcgc cacagcggca 21360 gggatttgcg ctgtgcctcc gcacgccatt gctgttcgcc tttcacgccc cacacgacgc 21420 aggcgcttgc tgcggtacag cgacgggaaa aggagagacg attcgtggcc gtttgcagga 21480 agggcttcag gatcgcgctt ttccacaggg tcaggcccgg cacccagaga taaccattcc 21540 gctgttgcag gtgacgacgt tgcagctgga gccattggag caccgtgaac agggccgaca 21600 cctccccggt ctgcggatca atgtagcggc aatagcgcag ataggccgct gcgaacagtt 21660 cctccagggt ggccgagccg cgacgcgccg acagcagcgc cgattggggg tggcggtcat 21720 cggtgaggcc ccaccctgca taccagggtt ggccaaagca ggtcacgggc ttaccggcca 21780 gcagggcttc aaaaccgtac tgggaggtca cgacgtacac gcgggacaca tgacgcagca 21840 gggactgcgg cgacacgttt tccgcaatca ggcgcacgcg ctgggtggca cgcaagtccg 21900 cgaagtagcc ggtctttttc ccttccagga catcgggatg cactttgacc cagatttctg 21960 cctgcgggtt ttccgccatc gctgcttcca gcattgcggc gaactcatgg gggcctgcgt 22020 tgccgtaggt cacgctcatg tcattgaagg tctggtccac caccagcacg atgttcgtgc 22080 gctcgctttc atccgccacg aacgccggtg ccaggttgta cttgctcatg tcgcccgtca 22140 caatggtgtg catcgcctcg cgcgcctgat ccgccagggc cgcgttgccg gccttgtcct 22200 gcacgagttt ttccagcgcg ctcggtttcg aggcgtcgta gtaaatgccg cagtcatcca 22260 cgacgagcga gaggggcggt tcaccgttca cgcccaggtc cagcgagcgg acgaaaccat 22320 cctccaagcg gatcaccggc ttgcctgcgg ctttggcgat ggccaccggc tttgcggccg 22380 aggggcggtg cccccacacc gcgattgcat ccacttcctg cgggaccggg cgcagcagcg 22440 acagcttttg gcagggctgg gcgaggaatt tttccaggtg cggaatacgc caaatgccgg 22500 ggctataaat gccaatcatg cgttctccgc gagctcctgc gccatcaggg cccggacctt 22560 ctccaagcac gccggggtat cgacgccggg accggtcgcg gcgacctcga aggtgcgaat 22620 gttaatgccc gcgctcatca gccgcagttg ctccagggat tcggcctgtt cgggcatgga 22680 ctccggcaac tggctgtaat tttgcaggac atcccgccga taggcgtaga tcccgacgtg 22740 cttcaggtag cgcgccttct cggcgttgcg cgggtacgga atgggggagc gggagaaata 22800 cagggcgtcc tgccgcgtgt tcaccacgac cttgacggtg gacggttcgg cggcttctgc 22860 cgcgctgatc gcatgacaca gggtcgccac cggcagcgcc gggtcgtccc gcataccttg 22920 cagcagggtt tcgacgtcac gcgggcgaat catcggctca tccccttgca ggttgatata 22980 gatatccgcc tccaccttat gcatgacttc caccaggcga tcggtgccgc tctcatgatc 23040 gttgcgggtc atgatcgctt tgccgccgaa cgcctggact gcctgctcca cacgcgggtc 23100 gtcggttgcg acccacacct ctgccacgcc tgccacttgc agggcccgtt cgtagacgtg 23160 ctggatcatc ggtttcccga cgatatccag cagcggtttg cccggcagac ggctgctgcc 23220 gtagcgtgcc gggatcacaa tcacggcctt cgacatttat taacctcctc gagttacagc 23280 gacagaatca ctttcgcgcc caccgccagt tggtacagaa tggtgctgat accgcgcgtc 23340 acttcgatgt tcttcgactc gtatttcggc aacaccataa tttcatcacc gggtttcagg 23400 gaatcgacgt cttctgcgtt caccgctgcg ccgttctgac ggatgacgat aatacgggcg 23460 ttgccggact tctgggtcag cccaccgcac ttctcgatgt agtcctcggt cgtcatacct 23520 ttctgccacg acaccgcgtt cgggaacagc acttccccgt ggaccatgac caacgacgtc 23580 ttttcgggaa tattgatcac gtcgccgtcc tccaggagga cggagtcaat gttgctttca 23640 ttgaggatca cttcgccctt cggcacgacg gtgcgggctt tcgcgacgaa gcgggagatc 23700 agttgggctt cctgcatacg caggctggcc tcttccttgg tgctgctctg tgcgctgagg 23760 ctggcctctt cgagcttttg cagggacaaa ttcagcattt ctttctgccg ttgcgcgacg 23820 ctcggccgat acaactgcac ggcgttcatc tgcgacatgg agttcgggcg cactttttcg 23880 agcacggccc gcatggtgct accgtagggc agcaccatgg cgtgttcccc ggaatgtgcg 23940 ccttccacac gcacttgaat ggtgcccgca tagcggtcgg tggagacaat gagggtatca 24000 ccgttttgca gcatacgccc cggtgcggac gagatcggat aatattccga gcgcttctgg 24060 aggccctgct tccgcataat cgtgatatgg gtcgcacccg gtttgggacg tgcccaggac 24120 agtgcttcgg tgaccgggat gctcgattcg cgaaattcaa agtcgtagga attgaacaca 24180 tcgccctgca ccgagaacgt atgctggcgc ggacccacaa tgatcgtatc accgtccgca 24240 aactgggaca gccccagttt gccgttgagc aggaagtcat agaggttgac gttcgagcgc 24300 acacgattgc cgcgtttcac gacgatgtcc acgtagctgc cgcgttccgg gtccacacca 24360 cccgccttga tcaggtagtt cagcaggctg tcggaggtga caccgccgta caggccgggg 24420 ttgcggacaa agccggtcac atagaccttg accggctgcg cctgcaagag cgacgcatag 24480 acgttcacgt tgctctggta gacttccttc accttgctcg tcaccagcgc gttcaactgg 24540 gagttcgaca cacctgcgac tttgacgggg ccgacattcg gcaggaagat gttgcccttc 24600 gggtccacct ggagtgcgcc atcgaaggtg aacgcacccc acaggcggac ctggatggaa 24660 tcgccgggat tcaggatgta gtccggattg aaacccacgg ttgcccccga gtctgcgctc 24720 gtaccgttga acagctgcgc cccgaacata cggctcatca cgaccggggg tgcggggggc 24780 ggggtgttat cgaagccgct catgttctgg gtgtcgcttt tctgcccgtt caggatgccg 24840 gtcaacggtg cggcacccgt gaggttcgga tcggcattaa tgtcgatggt tgcgctcgcc 24900 tgtgctgcat ggcacgctgc gatcagcagg atcgacttaa acagcttcat ttattaacct 24960 cctcgagaag tcgacttagt cacggtggtc ttcaatcacc gccaggagca atttcagggt 25020 gccaaagagc aggcaacaca ccagcagcca acacgcgatc aaatacggga tattcgggaa 25080 ggagctttcc tggggcagct gcggggacga gatcacgctc aggactttca gcttacgggc 25140 cgcttcgaca cgggtctttt cgatgctggt gagcgtgagc ttgtacaact cggtattgaa 25200 ctcgaccttg gatttgatct cctcaaaatc cacggccatg cggttcagtt tatcgccctg 25260 gggtgcggta attttcgact tttcttcgtc gatctgtgcc tggaggctct gaattgcatt 25320 gcgggcgctc acgacttggg gcgcatcctc gcgcaggtac gtgagcaggt tgcgcaggtc 25380 ggcttccatc tgaattttct ggcccatcag cgtattcacc agggtggatg ccgcctgggc 25440 ctgtgcctgc gggtccagca cattgttgtt gtcttggtag gacaacaatt cggctttcga 25500 tgcatccagc cgctggcgcg ctttttccat ttcggtttcc gcaaacgcca attgatcgcg 25560 ggcgatacgg tgcgacattt cattgatgaa ccgctcggat tccttgagca cggtctggtt 25620 gaatttcagc gcgaactcgg gcgaaaagcc ctgggtctgg atgttcagca gcccggtctt 25680 gtcgtcgtag ctgacgttga tgcgatcttt atagtacttc aggaacccct cggcggtttc 25740 atccttggac agatggttca ggaagtccag gcccgaatgg gagaacgctt cgcggaagtt 25800 cagctgttta tccagcgcgg ccagcatatc cgggctgttg atgtattcct tcaggtacag 25860 tgcgtcttcg gcggacgacg ggttggaggc acccaacagc aggccgaagt tcaggctgcc 25920 ggagttgaga tcgtcgctgc gcttgatggc caccttgctt tccgacatat agcggggctg 25980 ggagaagatc gccaagtaga tcagcagcac cgccatgggt gccagaataa tgatttttgc 26040 caggtgcttc tgaatatctg ccaggctgat cgcgctcaga cgcgcacgca tccacgagac 26100 ggcgcttttc actttgatca gcatttatta acctcctgtc gacaacacgt gttaatcgaa 26160 aatgcgcacc aacccggtca ccttatttgc tttgttggtc accagcaggg tcgagacgcg 26220 gtgtttctgc atcttctctt ctgcttcgat gatcatggtg tcttcgggca aggtcagcgg 26280 ttcgcgggtc atcatctgtg cggccgttgc gctcgtcagg ctgtcttctt tctccataaa 26340 gcgccgcaga tcgccatcgg tgatgatgcc tgccagccca ccttccgcat cttcgaccat 26400 caccataccc tggcagcccg aggtgatgcg ctgaatgacc gttttgaagc tggcatcgag 26460 ctgcactgcc ggcacatcat gttgcatcac gtcggcgacg cgggtcagca ggcgccgacc 26520 caggctgcca ccggggtggt agcgtgcaaa gtcattgggc ataaacttac gctggtgaat 26580 catcgcgatg gccagcgcgt ccccgatcgc catcgtgagc gtcgtggagg tggtcggggc 26640 gagattgttc gggcacgttt cgttcgccat gtgcagctcc aggaccgcat ctgcattttt 26700 ggccagggtg ctattcccgt tattggtgat tgcgatgatg cgattgccga agttcttcag 26760 gctcggcacc agtttcagga tctcgtccgt ctcaccgctc gccgaaatca agatgagcag 26820 gtcatacggg gtgatcatgc ccagatcacc atggaacgct tccgccggat gaataaagaa 26880 ggagggcgtc ccggtcgagg ccaaggtcgc cgacatcttg cggcccacat ggccgctttt 26940 acccatgccg ctcaggatga cgtgcccttt acaattcatg atgagattca ggacgcgctg 27000 gtactgaccg ctatccagtt gtttggacag gttttgcagt gccgcgcttt gttcggccag 27060 ggtctggcgg acgctcgtaa tcagatacgg atcaatggtc gaggactggt catccggcaa 27120 gtggcgttcg ctcatttatt aacctcctca cgtgttaatt aagtaatcga tagtgattta 27180 aatatgcaag atctagttac ctgcaggatt attgtttctg ttgcataaag cctaaggggt 27240 aggcctttct agagatagcc attttttgca ctcctgtatc cgcttcttgc aaggctggac 27300 ttatccctat caaaccggac actgcaggct gacaagcttt cattacatat gaagagtttg 27360 tagaaacgca aaaaggccat ccgtcaggat ggccttctaa gaaggctcga gtggcgcgcc 27420 taagtcgaat ttctgccatt catccgctta ttatacttat tcaggcgtag caccaggcgt 27480 ttaagggcac caataactgc cttaaaaaaa ttacgccccg ccctgccact catcgcagta 27540 ctgttgtaat tcattaagca ttctgccgac atggaagcca tcacagacgg catgatgaac 27600 ctgaatcgcc agcggcatca gcaccttgtc gccttgcgta taatatttgc ccatggtgaa 27660 aacgggggcg aagaagttgt ccatattggc cacgtttaaa tcaaaactgg tgaaactcac 27720 ccagggattg gctgagacga aaaacatatt ctcaataaac cctttaggga aataggccag 27780 gttttcaccg taacacgcca catcttgcga atatatgtgt agaaactgcc ggaaatcgtc 27840 gtggtattca ctccagagcg atgaaaacgt ttcagtttgc tcatggaaaa cggtgtaaca 27900 agggtgaaca ctatcccata tcaccagctc accgtctttc attgccatac ggaattccgg 27960 atgagcattc atcaggcggg caagaatgtg aataaaggcc ggataaaact tgtgcttatt 28020 tttctttacg gtctttaaaa aggccgtaat atccagctga acggtctggt tataggtaca 28080 ttgagcaact gactgaaatg cctcaaaatg ttctttacga tgccattggg atatatcaac 28140 ggtggtatat ccagtgattt ttttctccat tttagcttcc ttagctcctg aaaatctcga 28200 taactcaaaa aatacgcccg gtagtgatct tatttcatta tggtgaaagt tggaacctct 28260 tacgtgccga tcaacgtctc attttcgcca aaagttggcc cagggcttcc cggtatcaac 28320 agggacacca ggatttattt attctgcgaa gtgatcttcc gtcacaggta tttattcggc 28380 gcaaagggcc tcgtgatacg cctattttta taggttaatg tcatgataat aatggtttct 28440 tagacgtcag gtggcacttt tcggggaaat gtgcgcgccc gcgttcctgc tggcgctggg 28500 cctgtttctg gcgctggact tcccgctgtt ccgtcagcag cttttcgccc acggccttga 28560 tgatcgcggc ggccttggcc tgcatatccc gattcaacgg ccccagggcg tccagaacgg 28620 gcttcaggcg ctcccgaagg t 28641 <210> 144 <211> 28640 <212> DNA <213> Artificial Sequence <220> <223> synthetic plasmid pDD62 <400> 144 ctcgggccgt ctcttgggct tgatcggcct tcttgcgcat ctcacgcgct cctgcggcgg 60 cctgtagggc aggctcatac ccctgccgaa ccgcttttgt cagccggtcg gccacggctt 120 ccggcgtctc aacgcgcttt gagattccca gcttttcggc caatccctgc ggtgcatagg 180 cgcgtggctc gaccgcttgc gggctgatgg tgacgtggcc cactggtggc cgctccaggg 240 cctcgtagaa cgcctgaatg cgcgtgtgac gtgccttgct gccctcgatg ccccgttgca 300 gccctagatc ggccacagcg gccgcaaacg tggtctggtc gcgggtcatc tgcgctttgt 360 tgccgatgaa ctccttggcc gacagcctgc cgtcctgcgt cagcggcacc acgaacgcgg 420 tcatgtgcgg gctggtttcg tcacggtgga tgctggccgt cacgatgcga tccgccccgt 480 acttgtccgc cagccacttg tgcgccttct cgaagaacgc cgcctgctgt tcttggctgg 540 ccgacttcca ccattccggg ctggccgtca tgacgtactc gaccgccaac acagcgtcct 600 tgcgccgctt ctctggcagc aactcgcgca gtcggcccat cgcttcatcg gtgctgctgg 660 ccgcccagtg ctcgttctct ggcgtcctgc tggcgtcagc gttgggcgtc tcgcgctcgc 720 ggtaggcgtg cttgagactg gccgccacgt tgcccatttt cgccagcttc ttgcatcgca 780 tgatcgcgta tgccgccatg cctgcccctc ccttttggtg tccaaccggc tcgacggggg 840 cagcgcaagg cggtgcctcc ggcgggccac tcaatgcttg agtatactca ctagactttg 900 cttcgcaaag tcgtgaccgc ctacggcggc tgcggcgccc tacgggcttg ctctccgggc 960 ttcgccctgc gcggtcgctg cgctcccttg ccagcccgtg gatatgtgga cgatggccgc 1020 gagcggccac cggctggctc gcttcgctcg gcccgtggac aaccctgctg gacaagctga 1080 tggacaggct gcgcctgccc acgagcttga ccacagggat tgcccaccgg ctacccagcc 1140 ttcgaccaca tacccaccgg ctccaactgc gcggcctgcg gccttgcccc atcaattttt 1200 ttaattttct ctggggaaaa gcctccggcc tgcggcctgc gcgcttcgct tgccggttgg 1260 acaccaagtg gaaggcgggt caaggctcgc gcagcgaccg cgcagcggct tggccttgac 1320 gcgcctggaa cgacccaagc ctatgcgagt gggggcagtc gaaggcgaag cccgcccgcc 1380 tgccccccga gacctgcaga tccacatcct tgaaggccgc agcgacgagc agaaggaaac 1440 cctcattcgg gaagtcagcg aggccatctc gcgctccctg gatgcgccgc tgaccagcgt 1500 gcgagtgatt atcacggaga tggccaaggg ccacttcggc atcggcggcg aactggccag 1560 caaggtcaga cgctgaagtg gagatgccca agggcacttc gggtcgagga acccgacctg 1620 cattgggacg cggccacgga gagcgcgggc aaacgccggc actatagcca gtggagtttg 1680 taaaacgcta tttcagagct tggagagtgt ctaagaaagc cggggcgatg ccaacccatc 1740 ccttcttcgg ctatgcatcg ttcgtaatca agccacttcc tttttgcatt gacgcagggt 1800 gtcggaaggc aactcgccga acgcgctcct atagttttca gcgaagcgtc ccaaatgtaa 1860 gaagccgtag tctagggcta tctcagttat actacgcaca ttggcactgg gatcgttcaa 1920 gcaggcgcgg atgctttcga gcttgcggtt gcggatgtag ttcttcggcg tggtgccggc 1980 atgcttctcg aacaaattgt agagcgagcg tggactcatc atcgccagct ccgctaaccg 2040 ctcaaggctg atattccgtt tgagattctc ctcaatgaat tgaacgactc gctcgaaaga 2100 cgggttacct ttgctgaaaa tttcacggct gacattgctg cccagcattt cgagcagctt 2160 ggaagcgatg atccccgcat agtgctcttg gacccgaggc atcgactttg tatgttccgc 2220 ttcgtcacaa actaacccga gtagattgat aaagccatcg agttgctgga gattgtgtcg 2280 cgcggcgaaa cggataccct ccctcggctt gtgccaattg ttgtcactgc atgcccgatc 2340 aaggaccact gagggcaatt taacgataaa tttctcgcaa tcttctgaat aggtcaggtc 2400 ggcttggtca tccggattga gcagcaatag ttcgcccggc gcaaaatagt gctcctggcc 2460 atggccacgc cacaggcaat ggcctttgag tattatttgc agatgataac aggtctctaa 2520 tccaggcgag attaccctca cgctaccgcc gtagctgatt cgacacaggt cgaggcatcc 2580 gaagattctg tggtgcagcc tgcctgccgg gcgcccgccc ttgggcaggc gaatagagtg 2640 cgtaccgaca tactggttaa cataatcgga gactgcatag ggctcggcgt ggacgaagat 2700 ctgacttttc tcgttcaata agcaaaaatc catagttcac ggttctctta ttttaatgtg 2760 ggctgcttgg tgtgatgtag aaaggcgcca agtcgatgaa aatgcatctc gacgtgatgc 2820 gtatacgggt tacccccatt gccacgttgc gccatccttt ttgcaatcag tgaccacttt 2880 tccaagcaaa aataacgcca agcagaacga agacgttctt tttaagaagc gagaacacca 2940 gaagttcgtg ctgtcggggc atgcggcgac gaattggcgg ataaagggga tctgcaggtc 3000 ccgagcctca cggcggcgag tgcgggggtt ccaagggggc agcgccacct tgggcaaggc 3060 cgaaggccgc gcagtcgatc aacaagcccc ggaggggcca ctttttgccg gagggggagc 3120 cgcgccgaag gcgtggggga accccgcagg ggtgcccttc tttgggcacc aaagaactag 3180 atatagggcg aaatgcgaaa gacttaaaaa tcaacaactt aaaaaagggg ggtacgcaac 3240 agctcattgc ggcacccccc gcaatagctc attgcgtagg ttaaagaaaa tctgtaattg 3300 actgccactt ttacgcaacg cataattgtt gtcgcgctgc cgaaaagttg cagctgattg 3360 cgcatggtgc cgcaaccgtg cggcacccta ccgcatggag ataagcatgg ccacgcagtc 3420 cagagaaatc ggcattcaag ccaagaacaa gcccggtcac tgggtgcaaa cggaacgcaa 3480 agcgcatgag gcgtgggccg ggcttattgc gaggaaaccc acggcggcaa tgctgctgca 3540 tcacctcgtg gcgcagatgg gccaccagaa cgccgtggtg gtcagccaga agacactttc 3600 caagctcatc ggacgttctt tgcggacggt ccaatacgca gtcaaggact tggtggccga 3660 gcgctggatc tccgtcgtga agctcaacgg ccccggcacc gtgtcggcct acgtggtcaa 3720 tgaccgcgtg gcgtggggcc agccccgcga ccagttgcgc ctgtcggtgt tcagtgccgc 3780 cgtggtggtt gatcacgacg accaggacga atcgctgttg gggcatggcg acctgcgccg 3840 catcccgacc ctgtatccgg gcgagcagca actaccgacc ggccccggcg aggagccgcc 3900 cagccagccc ggcattccgg gcatggaacc agacctgcca gccttgaccg aaacggagga 3960 atgggaacgg cgcgggcagc agcgcctgcc gatgcccgat gagccgtgtt ttctggacga 4020 tggcgagccg ttggagccgc cgacacgggt cacgctgccg cgccggtagc acttgggttg 4080 cgcagcaacc cgtaagtgcg ctgttccaga ctatcggctg tagccgcctc gccgccctat 4140 accttgtctg cctccccgcg ttgcgtcgcg gtgcatggag ccgggccacc tcgacctgaa 4200 tggaagccgg cggcacctcg ctaacggatt caccgttttt atcaggctct gggaggcaga 4260 ataaatgatc atatcgtcaa ttattacctc cacggggaga gcctgagcaa actggcctca 4320 ggcatttgag aagcacacgg tcacactgct tccggtagtc aataaaccgg taaaccagca 4380 atagacataa gcggctattt aacgaccctg ccctgaaccg acgaccgggt cgaatttgct 4440 ttcgactatc ggcgcgccag agctcatcgt taatgtcttc gtgcgccgtc agtcggcgca 4500 cgttttttct ctctggtacc gtgtcactga tctagtcaat tactcgaagt atccacaagt 4560 gaagcatact aagtaatgta caagaatcaa aaaaatcggc tacgcaagtc gcgtagccga 4620 atcatttaag gatccttcca ttcaggtcga ggtggcccgg ctccatgcac cgcgacgcaa 4680 cgcggggagg cagacaaggt atagggcggc gcctacaatc catgccaacc cgttccatgt 4740 gctcgccgag gcggcataaa tcgccgtgac gatcagcggt ccagtgatcg aagttaggct 4800 ggtaagagcc gcgagcgatc cttgaagctg tccctgatgg tcgtcatcta cctgcctgga 4860 cagcatggcc tgcaacgcgg gcatcccgat gccgccggaa gcgagaagaa tcataatggg 4920 gaaggccatc cagcctcgcg tcgcgaacgc cagcaagacg tagcccagcg cgtcggccgc 4980 catgccggcg ataatggcct gcttctcgcc gaaacgtttg gtggcgggac cagtgacgaa 5040 ggcttgagcg agggcgtgca agattccgaa taccgcaagc gacaggccga tcatcgtcgc 5100 gctccagcga aagcggtcct cgccgaaaat gacccagagc gctgccggca cctgtcctac 5160 gagttgcatg ataaagaaga cagtcataag tgcggcgacg atagtcatgc cccgcgccca 5220 ccggaaggag ctgactgggt tgaaggctct caagggcatc ggtcgacgct ctcccttatg 5280 cgactcctgc attaggaagc agcccagtag taggttgagg ccgttgagca ccgccgccgc 5340 aaggaatggt gcatgcaagg agatggcgcc caacagtccc ccggccacgg ggcctgccac 5400 catacccacg ccgaaacaag cgctcatgag cccgaagtgg cgagcccgat cttccccatc 5460 ggtgatgtcg gcgatatagg cgccagcaac cgcacctgtg gcgccggtga tgccggccac 5520 gatgcgtccg gcgtacaaga tccacaggac gggtgtggtc gccatgatcg cgtagtcgat 5580 agtggctcca agtagcgaag cgagcaggac tgggcggcgg ccaaagcggt cggacagtgc 5640 tccgagaacg ggtgcgcata gaaattgcat caacgcatat agcgctagca gcacgccata 5700 gtgactggcg atgctgtcgg aatggacgat atcccgcaag aggcccggca gtaccggcat 5760 aaccaagcct atgcctacag catccagggt gacggtgccg aggatgacga tgagcgcatt 5820 gttagatttc atacacggtg cctgactgcg ttagcaattt aactgtgata aactaccgca 5880 ttaaagccga gcgatgataa gctgtcaaac atgagatcca atctagattg tttaaacttc 5940 tgcagaacac gcggtgttaa cgtttcttat acttcttaat tttgttaaag atcatttcgc 6000 cgtagtacac cgcattgacc tgggtcttca ccagcaagta gccgcgaaat ttcttaaaca 6060 acttcatgtt cggtttaaag tcggcttgcc agaactgatg caaatgcccc tggtacgtca 6120 gacccttgat atcgtacaag gcgttgccca tgactttcag gggcttgttg tggatcaacg 6180 cggaaatgcc ggccgtgcta ttgatggtga ccaccgcttt ggcgtggcgc aacagctccg 6240 gcatgggcag atcgtgcaca tagatgacac gttcatccaa accgtattcc ttcgacagac 6300 gcttgatcaa cgggcggtac aggcggtgcc cgcgatccat cgggtgatgt ttgatcacca 6360 gataggactc cttgggggcc ttgcgggaaa agctgtacat cacttcgttg atgtaatcac 6420 gcacatcatt atagttgcta tggttgcgga tctggctgtc gttgtacact tgcaggaccg 6480 ccaggtaata gcgctgatcc agctcgttca tcaggcgggg gaggaccttg cgttgggtga 6540 ccttatacag ctgtttgcgc cagtaggcgc ggacccagca gcgcgcttca taccacgggc 6600 tgaacgattt gtggtggcga tagcgcggaa attcgtgacg atagtgccaa cccatcaggt 6660 aataccacat ggcgtggccg atgcgcttca tggtgctcgg tttcaggttc tcgacgtgcg 6720 gcgtcggcat atcgggcaat ttgcggtaaa agtccggatc gcggggcaag ctgctatagg 6780 cgttcacacc gccttcttcc acggtgataa attgcggacg caggtagcct tcctcgaagg 6840 ccagaaaacg aatccccttc gacttggccc agcgtttggc ctccttgtgc agcaggcggc 6900 agtcaccgaa acacaaaatc gtgtcaaagt catactgacg atgcaagtcc cgcagccaac 6960 cggggaactc cttcggggtt tggtagtacg ccaggtattg gcggtggcgg cagtagaagc 7020 gatcaccgcc attaaagacg acgttgaccg cgttgcgacc gaggctctcc aaccattccg 7080 ccacatcgtt gaagaacgga cccatcggac cttggagcag gaggtacttt ttaccgctca 7140 acagcaccgt cagcgcattg ccgtgcattt attaacctcc taacacgcgg tgttaagcgt 7200 tttcggcgag ctcttaacca aagcgcactt tgcagaacat gatcaacttg cgatagtagc 7260 gaatcacacg gccggctttc ttgcgggtga taaagatggg tttgcggggc gttttgatca 7320 gatattctgc cgcttcctcc accgtgatcg gctgcaaccg cgtcggatga atataggtgg 7380 gatagacaat cagggcttga tagatcaggt cggcgatggt cagccgccgc tcgcgacggg 7440 ggcagtggtg ctcatcgacg gtcaggcccc acgaggcgta gaacggcagg ccgtagcagt 7500 gcacctgttt accgtgcagc aatgcttcaa agccgctgag gctcgtcatc gtgtgcacct 7560 cgtccgcacg ctgaatacac tgaatgatat cggcatccag tgcctggtag tctgcgagtt 7620 ccgcgatctg ttccgccgga atgtcaccct tacggttgcc gacgagcaca tcggggtgcg 7680 gcttgtagat gatgtaggcg tgcggattac gttcccgcac ggtgcgcagc agctccagat 7740 tcgacttgat cgacacggtg cccgtcttaa tcgacgcatc gtcttccacc tggcccggca 7800 ccaggatgac tttcttgtcc ttcgcttctg ccgggaggct gaaatcggcc cccaggttat 7860 atttgctcaa tttgctttcc accagacgtt ggcgcaactt ttccgcgcgc atctggtgcg 7920 cgagggtcag ctggctgtga ttcagcagga cctccagttc cgacggacgg gtggcatcgt 7980 aatagatacc gcgcttatcc aggaccaggc tcaacggcgg cagcagatcg ctccccaggc 8040 cggagctgcg caggaagccg tcttccatgc gccacagcgg cagggatttg cgctgtgcct 8100 ccgcacgcca ttgctgttcg cctttcacgc cccacacgac gcaggcgctt gctgcggtac 8160 agcgacggga aaaggagaga cgattcgtgg ccgtttgcag gaagggcttc aggatcgcgc 8220 ttttccacag ggtcaggccc ggcacccaga gataaccatt ccgctgttgc aggtgacgac 8280 gttgcagctg gagccattgg agcaccgtga acagggccga cacctccccg gtctgcggat 8340 caatgtagcg gcaatagcgc agataggccg ctgcgaacag ttcctccagg gtggccgagc 8400 cgcgacgcgc cgacagcagc gccgattggg ggtggcggtc atcggtgagg ccccaccctg 8460 cataccaggg ttggccaaag caggtcacgg gcttaccggc cagcagggct tcaaaaccgt 8520 actgggaggt cacgacgtac acgcgggaca catgacgcag cagggactgc ggcgacacgt 8580 tttccgcaat caggcgcacg cgctgggtgg cacgcaagtc cgcgaagtag ccggtctttt 8640 tcccttccag gacatcggga tgcactttga cccagatttc tgcctgcggg ttttccgcca 8700 tcgctgcttc cagcattgcg gcgaactcat gggggcctgc gttgccgtag gtcacgctca 8760 tgtcattgaa ggtctggtcc accaccagca cgatgttcgt gcgctcgctt tcatccgcca 8820 cgaacgccgg tgccaggttg tacttgctca tgtcgcccgt cacaatggtg tgcatcgcct 8880 cgcgcgcctg atccgccagg gccgcgttgc cggccttgtc ctgcacgagt ttttccagcg 8940 cgctcggttt cgaggcgtcg tagtaaatgc cgcagtcatc cacgacgagc gagaggggcg 9000 gttcaccgtt cacgcccagg tccagcgagc ggacgaaacc atcctccaag cggatcaccg 9060 gcttgcctgc ggctttggcg atggccaccg gctttgcggc cgaggggcgg tgcccccaca 9120 ccgcgattgc atccacttcc tgcgggaccg ggcgcagcag cgacagcttt tggcagggct 9180 gggcgaggaa tttttccagg tgcggaatac gccaaatgcc ggggctataa atgccaatca 9240 tgcgttctcc gcgagctcct gcgccatcag ggcccggacc ttctccaagc acgccggggt 9300 atcgacgccg ggaccggtcg cggcgacctc gaaggtgcga atgttaatgc ccgcgctcat 9360 cagccgcagt tgctccaggg attcggcctg ttcgggcatg gactccggca actggctgta 9420 attttgcagg acatcccgcc gataggcgta gatcccgacg tgcttcaggt agcgcgcctt 9480 ctcggcgttg cgcgggtacg gaatggggga gcgggagaaa tacagggcgt cctgccgcgt 9540 gttcaccacg accttgacgg tggacggttc ggcggcttct gccgcgctga tcgcatgaca 9600 cagggtcgcc accggcagcg ccgggtcgtc ccgcatacct tgcagcaggg tttcgacgtc 9660 acgcgggcga atcatcggct catccccttg caggttgata tagatatccg cctccacctt 9720 atgcatgact tccaccaggc gatcggtgcc gctctcatga tcgttgcggg tcatgatcgc 9780 tttgccgccg aacgcctgga ctgcctgctc cacacgcggg tcgtcggttg cgacccacac 9840 ctctgccacg cctgccactt gcagggcccg ttcgtagacg tgctggatca tcggtttccc 9900 gacgatatcc agcagcggtt tgcccggcag acggctgctg ccgtagcgtg ccgggatcac 9960 aatcacggcc ttcgacattt attaacctcc tcgagttaca gcgacagaat cactttcgcg 10020 cccaccgcca gttggtacag aatggtgctg ataccgcgcg tcacttcgat gttcttcgac 10080 tcgtatttcg gcaacaccat aatttcatca ccgggtttca gggaatcgac gtcttctgcg 10140 ttcaccgctg cgccgttctg acggatgacg ataatacggg cgttgccgga cttctgggtc 10200 agcccaccgc acttctcgat gtagtcctcg gtcgtcatac ctttctgcca cgacaccgcg 10260 ttcgggaaca gcacttcccc gtggaccatg accaacgacg tcttttcggg aatattgatc 10320 acgtcgccgt cctccaggag gacggagtca atgttgcttt cattgaggat cacttcgccc 10380 ttcggcacga cggtgcgggc tttcgcgacg aagcgggaga tcagttgggc ttcctgcata 10440 cgcaggctgg cctcttcctt ggtgctgctc tgtgcgctga ggctggcctc ttcgagcttt 10500 tgcagggaca aattcagcat ttctttctgc cgttgcgcga cgctcggccg atacaactgc 10560 acggcgttca tctgcgacat ggagttcggg cgcacttttt cgagcacggc ccgcatggtg 10620 ctaccgtagg gcagcaccat ggcgtgttcc ccggaatgtg cgccttccac acgcacttga 10680 atggtgcccg catagcggtc ggtggagaca atgagggtat caccgttttg cagcatacgc 10740 cccggtgcgg acgagatcgg ataatattcc gagcgcttct ggaggccctg cttccgcata 10800 atcgtgatat gggtcgcacc cggtttggga cgtgcccagg acagtgcttc ggtgaccggg 10860 atgctcgatt cgcgaaattc aaagtcgtag gaattgaaca catcgccctg caccgagaac 10920 gtatgctggc gcggacccac aatgatcgta tcaccgtccg caaactggga cagccccagt 10980 ttgccgttga gcaggaagtc atagaggttg acgttcgagc gcacacgatt gccgcgtttc 11040 acgacgatgt ccacgtagct gccgcgttcc gggtccacac cacccgcctt gatcaggtag 11100 ttcagcaggc tgtcggaggt gacaccgccg tacaggccgg ggttgcggac aaagccggtc 11160 acatagacct tgaccggctg cgcctgcaag agcgacgcat agacgttcac gttgctctgg 11220 tagacttcct tcaccttgct cgtcaccagc gcgttcaact gggagttcga cacacctgcg 11280 actttgacgg ggccgacatt cggcaggaag atgttgccct tcgggtccac ctggagtgcg 11340 ccatcgaagg tgaacgcacc ccacaggcgg acctggatgg aatcgccggg attcaggatg 11400 tagtccggat tgaaacccac ggttgccccc gagtctgcgc tcgtaccgtt gaacagctgc 11460 gccccgaaca tacggctcat cacgaccggg ggtgcggggg gcggggtgtt atcgaagccg 11520 ctcatgttct gggtgtcgct tttctgcccg ttcaggatgc cggtcaacgg tgcggcaccc 11580 gtgaggttcg gatcggcatt aatgtcgatg gttgcgctcg cctgtgctgc atggcacgct 11640 gcgatcagca ggatcgactt aaacagcttc atttattaac ctcctcgaga agtcgactta 11700 gtcacggtgg tcttcaatca ccgccaggag caatttcagg gtgccaaaga gcaggcaaca 11760 caccagcagc caacacgcga tcaaatacgg gatattcggg aaggagcttt cctggggcag 11820 ctgcggggac gagatcacgc tcaggacttt cagcttacgg gccgcttcga cacgggtctt 11880 ttcgatgctg gtgagcgtga gcttgtacaa ctcggtattg aactcgacct tggatttgat 11940 ctcctcaaaa tccacggcca tgcggttcag tttatcgccc tggggtgcgg taattttcga 12000 cttttcttcg tcgatctgtg cctggaggct ctgaattgca ttgcgggcgc tcacgacttg 12060 gggcgcatcc tcgcgcaggt acgtgagcag gttgcgcagg tcggcttcca tctgaatttt 12120 ctggcccatc agcgtattca ccagggtgga tgccgcctgg gcctgtgcct gcgggtccag 12180 cacattgttg ttgtcttggt aggacaacaa ttcggctttc gatgcatcca gccgctggcg 12240 cgctttttcc atttcggttt ccgcaaacgc caattgatcg cgggcgatac ggtgcgacat 12300 ttcattgatg aaccgctcgg attccttgag cacggtctgg ttgaatttca gcgcgaactc 12360 gggcgaaaag ccctgggtct ggatgttcag cagcccggtc ttgtcgtcgt agctgacgtt 12420 gatgcgatct ttatagtact tcaggaaccc ctcggcggtt tcatccttgg acagatggtt 12480 caggaagtcc aggcccgaat gggagaacgc ttcgcggaag ttcagctgtt tatccagcgc 12540 ggccagcata tccgggctgt tgatgtattc cttcaggtac agtgcgtctt cggcggacga 12600 cgggttggag gcacccaaca gcaggccgaa gttcaggctg ccggagttga gatcgtcgct 12660 gcgcttgatg gccaccttgc tttccgacat atagcggggc tgggagaaga tcgccaagta 12720 gatcagcagc accgccatgg gtgccagaat aatgattttt gccaggtgct tctgaatatc 12780 tgccaggctg atcgcgctca gacgcgcacg catccacgag acggcgcttt tcactttgat 12840 cagcatttat taacctcctg tcgacaacac gtgttaatcg aaaatgcgca ccaacccggt 12900 caccttattt gctttgttgg tcaccagcag ggtcgagacg cggtgtttct gcatcttctc 12960 ttctgcttcg atgatcatgg tgtcttcggg caaggtcagc ggttcgcggg tcatcatctg 13020 tgcggccgtt gcgctcgtca ggctgtcttc tttctccata aagcgccgca gatcgccatc 13080 ggtgatgatg cctgccagcc caccttccgc atcttcgacc atcaccatac cctggcagcc 13140 cgaggtgatg cgctgaatga ccgttttgaa gctggcatcg agctgcactg ccggcacatc 13200 atgttgcatc acgtcggcga cgcgggtcag caggcgccga cccaggctgc caccggggtg 13260 gtagcgtgca aagtcattgg gcataaactt acgctggtga atcatcgcga tggccagcgc 13320 gtccccgatc gccatcgtga gcgtcgtgga ggtggtcggg gcgagattgt tcgggcacgt 13380 ttcgttcgcc atgtgcagct ccaggaccgc atctgcattt ttggccaggg tgctattccc 13440 gttattggtg attgcgatga tgcgattgcc gaagttcttc aggctcggca ccagtttcag 13500 gatctcgtcc gtctcaccgc tcgccgaaat caagatgagc aggtcatacg gggtgatcat 13560 gcccagatca ccatggaacg cttccgccgg atgaataaag aaggagggcg tcccggtcga 13620 ggccaaggtc gccgacatct tgcggcccac atggccgctt ttacccatgc cgctcaggat 13680 gacgtgccct ttacaattca tgatgagatt caggacgcgc tggtactgac cgctatccag 13740 ttgtttggac aggttttgca gtgccgcgct ttgttcggcc agggtctggc ggacgctcgt 13800 aatcagatac ggatcaatgg tcgaggactg gtcatccggc aagtggcgtt cgctcattta 13860 ttaacctcct cacgtgttaa ttaagtaatc gatagtgatt taaatatgca agatccgata 13920 aatcgattga tagatttaaa taagaactgc agaagctagc ttagatgctc gtgaaattga 13980 cgtgggcgct ttgcagggcc gtcttaatgg cgttggtgtc cacgaggatc gagtcgggtg 14040 cggaaaacgg acggttcttg ttggtgaaat cgctgttacc aatgtacagc gattccttgt 14100 tacgcagcgc ctggatgtgc cagcgggacc acgaatccca atacttctgg cgatccggcg 14160 agataccttg gctggtgtag ccggtcgtcg ggctgttcat caacgagtcg gtgcggtgcg 14220 agcccagcgt cagcggcaac ttgatccgat gcaccgtgga atcgccgaag atcagcttca 14280 gacgcgcgat aaattcgcta tccgcacccg ttttcacaca atcccagaca ccggccttct 14340 gcaagacgtc ggcacggcga aacaggagcg acgacggatt cagacgcttc aaggggtaca 14400 ctgcgcgggc atagaaaata ccgttgtctt gcaggcgcac ccagtccgag atggagcaga 14460 tgagcttcgg attgagcaac aagggggaga tttggcggaa cagcttttcc ggatggctcc 14520 agtcatccga atcgtggcag gtgacgaact cgcccttcgc ttggatcaag ccgatacgct 14580 tcgcggcata ggtgccgaca ttctgcggca ggctaatgat cttgatgcgc gtgtctttga 14640 gggcgagccg ctggagacga aacagggtgt catcggtgct cgcgtcatcc acaatgatca 14700 gctcgaagga acggtaggtc tgattgagga gcgaaatcac cgcattttcc acgcggcgac 14760 ccgtattata ggtggtcatc aggatggaga tcaacggccc cgtctgggcc gggtacggga 14820 tgctggtgat gatgttgcac ggggagagcg gggagctgtt gtccgtcaag gccacggggc 14880 tgaggccgaa gtatttatag tattcattca gccgattcag gctaatttcg gcggtttcgc 14940 ggaaggcgtt attttgcagc agcaggatat ccgggctata gacgatatcg gatgcgtcga 15000 tctgggcgag ggtcgagatg gccttttggg tcaggccgat ccggagttgc agtgcggtat 15060 acaggtccag cgggcagttg tccacgttgt ccaacaggct caggctaaag gtcggcgagt 15120 aggacgccag ggttttcgcc agttccactt tctgatgggt atcggtgaac tcgtccttga 15180 actccatcag cagctcgggc gtcaggctga tgtcgccgca ggcgattttt gcgatcttga 15240 ttgccagttt gcagcgccaa tcggacgggg tatccgtcaa gttatgcagc gaccagtaca 15300 tattcagacg atacatcgcg aggatgcgtt tcgactgcca gaaccggcaa tcatcctgga 15360 tggccgcgag cgcgtggacg tagcggctct ttttgagcag ccacaagaat ttgagattat 15420 tgaacattta ttaacctcct gctagcaact taagttacga atcgacgccg aacaggtcgc 15480 gggtgtagac tttctccgag acatcttcca gttcgctggt gcggcgattc gccacaatga 15540 catcgacgcg ctccttaaag gaattgatgt cgcgctcgac gtaggaaccg aagaagtagg 15600 gttctttcag gaccggctcg tacaccacaa tctcgatacc cttggccttc aaacgtttca 15660 tgaccccctg gatgctgctg gcccggaaat tgtcgctacc cgccttcatg atcaggcgat 15720 agataccgac cactttgggc ttacgggaca ggatgtcctc ggccacgaag tccttacggg 15780 tcgtattcgc atccacgatg gcctggatca ggttttgcgg gacgtcgcga taattggcca 15840 acagctgctt cgtatccttc ggcagacagt aaccgccgta gccgaaggac gggttgttgt 15900 aatgttgacc aatgcgcgga tcgagggaga cgccttcgat gatttgtttg gtatccaggc 15960 cgtgcacgct cgcgtaggtg tccagctcgt taaagtacgc gatacgcatc gccagatacg 16020 tgttcgcgaa cagtttgatg gcttctgcct cgggcgaatc cgtcagcagg atcggaatat 16080 cctttttgat ggcaccttcc gacaggagtt cggcgaactt ccgtgcgcgt tccgacgatt 16140 cgcccacgac aatgcggctc ggatagagat tatcatacag ggctttgcct tcgcgcagga 16200 actccgggga aaagatgata ttattcgtgt tcagatcgcg cttcaggcgt tcggtgaacc 16260 cgacggggac ggtggatttg ataatgatgg tcgcgttcgg gttaatggac agcacgtcac 16320 acgcgacgct ttcgacgctc agggtatcaa agttgttatt aatcggatca tagttcgtcg 16380 gggtggcgat gatcacgtag tctgcatcgc gatatgcctc gtatttttcc gtcgtcgcgt 16440 agaggttcag cttacgattg gagagaaact tctggatttc cgggtcgcaa atcggcgaga 16500 ttttcttgtt aatgagctgg accttcttcg ggtcgatgtc cagggcgatg atgtcgtgtt 16560 tttgggagag gaggatcgca atgctgatac ccacatagcc gacgccggcc acggcaattt 16620 tcatttatta acctccttaa gtgaattctt ataccgcagc ttctttgaag atttcgtaca 16680 gacgaaaggc attcttactt tttcccctgg agattctcat actcacgcgg ggtgccgcag 16740 aagatcacgt cggacttatt gatttcggta taatacactt tgatcccatt ggagatcagg 16800 taattgtaga tcggcgcaat atacagctcg cccgcatccc agttttcttg cggcaggttc 16860 ttgtaatgtt catacgcgga aataaagttt ttgatcgtgc tgaagtggta cagcccggtg 16920 caacacaaat tgctaatctg tttcttttcg gacgtggcaa tcacttcatt tttgacgtca 16980 ttgctgggca tcacgaacga ccagttgtcg ccatcgccgc gaaacacttc aatgtaacat 17040 tcattctcgc cctcgaactt ggtgaagatg aagttgggac gaatcgtgtc gatgttgaag 17100 atggtgatcg gctgttcgat attaaacagt ttcgagatgg ccaaatagac cgtctctgct 17160 tgaccccgcg tttccttatc cagggtgatc agcgtatagc tattaatgcc caggctggcg 17220 atacgctgga gcacgaacga tttcgtgtta aacacgtcac ggaggatgaa gacaaagtgt 17280 tccgtctcga agtacagttt gaagctcttg aggcacaaat cgaacagaaa ctcgccattc 17340 agctccagca tatacttcgg tttgctataa ccggctttga aaaagcggct cgacatacct 17400 gccatcggga taataatcat actgctgcct ccttaaagat ttcatacagg cggaaggcat 17460 tcgcaaacag ggcgtcctgc cgcttcttgt cgtcgctatg caacggcagc atcgacaaga 17520 acagatgaat ttgcatggcg tacagcgact tttcggagat gctgtatttt tccttaataa 17580 tggacacgaa ggtcgattgg atttcaaaga gtttgttatc aatattgatt ttgaactcaa 17640 tggaatgggt cttattcttt ttgttgataa tgtagtagcc cgcgatgatc cagtcataca 17700 ggcctagaat ggagtgcgac agtttcgcaa tatcgtagcg gaaatcgcca tagatcgaga 17760 tttcgccgct gtggttcaga ccgcgcggat cgaacacctg aatccggccc gtgcggaagt 17820 taaagataat attgctgaag cacaggtccc cgtgcatgat ggtcttgtat tgcagttcgg 17880 acggaatgaa tttgttcgtg tcgtacagga tgtcgttgat gctcacgcta atattgttgt 17940 taaaattcca tttcgcgttc gggtcaatgt tgagatcggt gatatacttg ctgacgcgct 18000 cgatggtctt ttcgtaaaac agatcctgga gaatgttttt atccgtatca atgctatgat 18060 actctttgca gaggtcgata aaatccaggc agctgatcag aatgttggtc aggatattat 18120 tcggcaggcg ggagaacacg aacagttcgt tcagggtggt attgtacagg tattcgagtt 18180 tgtagctttt gcgaatgtga tcgaacggtt ccagcaacat cggggtgtag attttcagtt 18240 cacccggaat cgtctcgaac catttcgatt ctgcctcgat cttgctttca ttcgaggagg 18300 acttaatcac ggacttggtc gtgatgcaca gctcattgaa ggcacgctgg gtcgtgtact 18360 ggactttcga cttatagtag gtattgatgt gaccgaaatc gagccagtcg ctgacgtaaa 18420 tcgacgccaa gctgtacgaa tcatggtact ttttcagggc tgccgtgaag tcaaacttgc 18480 tggtgaccag ttcgcgaatg aagaaattgg gtttgctgaa cgagaagtac ccgcagatga 18540 catttttgtt gtcctcgcgg gagactgccc gcaattccgt ctcatagaaa aaggaccact 18600 ggtagttatc atcggaatgg gagatcgcca cgaggtcatc acccgccgga atcttcttga 18660 acaaggtatc accaaacagc agttgcaggc ctttatcatc tttgtcgccg atcagattcc 18720 aggccgtgac gattgcctgg cccagggtca gattgctatc gaccggaatc atcgtcactt 18780 tattgcgcag caaccattcg taatcgtgtt tgtcgaacac gaaatcttcc ggcaggacca 18840 ggtagatcgc atggccatcg tgccccaagc tgacctggtg cttgaacaga cgcttgtttg 18900 ccaacggcag gaacgacggc gggatgctac cgaactccgc gcccaattcc tgctgcacgt 18960 agctaccaga cattattaga agcatttttt ctcctgttct aacatattag agatttcttc 19020 caaggtcata ttgcacagtt ccgagggccg gatggcccga tcgtccacat agaagccctc 19080 gtcgccgcac cacggcttgc cgacaatcac ctcgtcatac gggacgcggt tttcgttcag 19140 ccagtcgatg atcaccggca gcgtatgaat attgatcttg ccaatgtttt ccttgtacgt 19200 ccgcatattg cgcgcggtaa agatgacgat gtagaaaccg ttcagcttgt actcatagag 19260 tttttcgatc aatttcttat tgggggttgc atggctgtat ttgccgctca gattgaagct 19320 aatcgtatta tccagatcga cgataatttt cttcatttat taacctcctt aatataaacc 19380 aaggtaagct tttattcccg caggctcaga atttgctcca ggctgatttt acgcggggcc 19440 acaatattct tgatcttcag attgctcact ttacagtcgt acacattggc ccaggcgcac 19500 aagccgacgt tgatgtgccc cgagtagtac acattcgacg acgagatcag gctcgtcagt 19560 tgcgagtaaa tgttatccag accatgcacg cacatcagtt tcttcatgat gtccgggtcg 19620 ccatagaaca gctgatcgcc gatgccaaac ccccactcgc gaaaaatcca accgttgctg 19680 tcctcgcaat acacgctgtc gtccacgtcg atatcgttga tggtcacgtt atccacttgc 19740 agcagggcat cggggcggat tttgatgatg cagcggtact tatcccagtt atgatttttc 19800 agcgagcaga accaaaagga attgtggtag tacatctttt ccgcgttgct catcttgtta 19860 tacggatatt cgccatcatc cttgatattg atcaggacgg agttgcagcc ggagaagaac 19920 gacgagtaga tttcttccag gttattgttc ttataggagg agagcgacag gtctttcagc 19980 tcatcataat gttcatccac gaagctgtaa ttgtcgggtt cggacacgta ttgggcggct 20040 tccgaatcaa aaatgcggca gatgcgttct ttgctcagtt gcgtatgccc gatatccttc 20100 caggtggaga taaacacatc gacgtccgac ggaatcgtga tcttgctgac caggttcggc 20160 agcgcgtcga tgaaaccgcg cgactgcccc gtgatgaaca atgcgatctg gcgattggta 20220 ttcaggctca cattgctgct aatgaaatca tcaatcaccg agatgcgcga tttgatgata 20280 caggaaatga tgccgctata ttcgtcggcg tttgccagga caatttcatt gatgtggcac 20340 aagaagttgc gctcctgctg cggggtttcg tagaagcgtt tgctggtcag ggacagtgcg 20400 agcagcaaca acttaatcga attgaaggtg cagccgttcg agttgatcac gagattatac 20460 acgtagttgg ggatgtgcgg acggctcatc aggcgcttga agctggtatc acccaagctg 20520 gacaggtccg tgttattctt gttgaaacgt ttgatgtaga actccggaaa gaagaacgcg 20580 aagtaaaacg tccctgcgtt cgacaacttg ttcgggatga taatatactc gaagtattcc 20640 gacagccaca agtcgaacaa ctccaggatt ttgagatgcg cattaaagcc tttgccggtc 20700 gaaatgttct tgatgcagga cagcgtgcgc tcgtccagat ggttgacgat gagctgcacc 20760 agtttgattt tatcttcttt cttgctcagg ctcaggatgt gatcgaaggt caagttcttc 20820 aacatttatt aatcctccta ataagctttg aattcaaact agtttacaag tcgttttcga 20880 tcttctccca ggtatatttg cgacattcat tcaagttggt cagcggcgag tatttgtact 20940 ttttgatacc gaggcgcgac aggctttcgt tcaccacctt gaaatggttt tccttttgga 21000 tgtccagttt cttgatcgac gtgttctcgc cgtgcaggac acggttgtag caaatcttat 21060 tgatatgctt aaacgggccg acttcgctga gtttcaaata catatcgtaa tccaccgcat 21120 tgctgatgct ctcgttgaag ccttcggtga ggttccatgc acgcgccgtg aacatacgga 21180 agtggtggca gatcatcgcg ctcgtgagct tttcgcggct gtaaatcggc cagttgtagc 21240 cattgctaat caagttacct tcacgatcaa tattgcgatt ggtggtgtac acgcaggcga 21300 ggctcaggtc tttgcgaaat tcatccagac acagttccac ggcatcgggc tccaggaaat 21360 catcggaatc cagctgcccg atgtagaaac cccggcacag gcggactgcg gtattcgagg 21420 cggagccgat gcctttgttt ttctggctga tgaaacggac gcgcgggtgg tttgcgtaat 21480 gttcttgcag gatgcgcagc gtatcatcgg tgctcccgtc atcgcagatg cagacctcca 21540 gatcggtgat cgtttggttc agtgccgatt cgacgcagcg cacgatatat ttgctgcaat 21600 tatacgcggg gatgtagatg ctcaccaggg gcacacgttt cagggtggcg ctctcgattt 21660 tctccttctt gcgataaaag tagggcacct tctgctgcaa cagctggacg gtaatgtttt 21720 tacctgccgc gcgatcggtt tcgttctcct taccgggcgg ttcctgatga tatgccatcg 21780 cgccttccac gctacggaaa taacaaccct cgcggtacag ccgatagccg aactcattat 21840 cctcaccgcc ccaatgcgtg aactcttcgt caaaccaacc cgcgcgaaac agccacttct 21900 ttgcaaacgc cacattgcca ccgctaaaga accggaacgg ggtgttgcac aggcgcagat 21960 tgtcggtatt cttgaaatgt tcgatgcgcc aatcgacgga tttgttctgc tcgaccttgc 22020 ctgcgacctg attattggta ataatctccg ggatttcatt gatcaggctt ttctgggaca 22080 aaaagtccag ataggtatgc ttcgacgtgt cgatgtattt acgcgggcca atcagtgcca 22140 cgttatcatc cacggccagg agttccatat aggactgcac ccacaacggg ttcggcgcca 22200 tatcgcagtc caagatcgcc acgtagttgt atttcgctgc ccgcaggccc aggttccgca 22260 cggcgcacag ctggtagccg tagtctttct ggcggacgta tttgatgttc agcaacgact 22320 cgaactcgcg gacgatctct tcgatgtttt ccttggaacc gtcatccgcg acgatgacct 22380 catagtcata aatcgttttc tgattgcaga ggcaggccag ggtgatcgcc aggattttgg 22440 cgcgattgta cgtcggaatc acgatggaca ggccgtcgat gatcagttgc ttgcgcggat 22500 aatcatccag ttctttacgt ttccctgccc agacgtagtc gttcgtgctt tccggcagcg 22560 gcggcaaggt caggtcgctc ggccaatcca gcggaatggg ttcgacttct ttcaattcgg 22620 cgcgctcgga tttctttgcg gtaatttccc gatatttgct aatgatttca ttcttttcca 22680 cctcattcag cgagatcgcc tttgcattgc tgcacataat tttggttgcc gcgtcgatat 22740 caatgaccgc tttccgattc agcttgtcca cttcttcgct cagattcagg gcggtttggc 22800 acagcttgat attggcttcc acccagctca catcatagat ttccgccact ttttcaaaca 22860 gggagagggc ttggcggtag ttcttattct tatacagatt gattgcctgg ttcaaaatgc 22920 tcatttatta acctcctact agtgaatttt cgaattactt accgcagtac ttgacaccca 22980 cctgggaatt gtttttggtg cgtttgaatt ggcggatggt acggtagatg ctaaagggca 23040 ggctgatcag accgagcgga aaattgttct tattgatgat gagcttgccc agctgatagc 23100 tcaggtgttt cttgacccgt tcggcttcgt gtttatccgc gtacaggaag atgctcggca 23160 ggctcacttg gtactccgaa tcatatttct tcttccaggt ccgccattcg ctgatcaacg 23220 caaacggaat cgagatcaga ccgaggaacg tcttggagcg gctcaccatc accgcaccca 23280 ggcggtagcc gatatcttgc ttgatgcgtt cggccgcacc atacagctcc ggcagttgtt 23340 tcttttcgag acgttgattg tcgatgaagt actgttcgag cttttgctgc accagatgca 23400 gctgattgag cagcaattct ttttcgcacg acagcttttc gaggcgctgt tgttgcagtt 23460 catttttgtt ctgttccttt ttcagcaggg actcgaagtt ctcgatcgcg cactccagtt 23520 cctggacctg gatggttttg tttttaatga tcagatcata ctggatcagt tcttccttgc 23580 tatccgacag ctctttcaga atggcttgat aggcgttcag ctgtttggac gtgtgcagtt 23640 cgttgtccag aatgatcttt ttgctgctct ggtacagacc gttcacgata tcgagggtga 23700 tctggcgttg tttaatgaac gtctcccaaa taaaggacgg cttatagttt tccttctcca 23760 gcacccgcaa gggggtgttg gcgttcgatt gcaattcaaa gtacagttcc ttgcaatcgg 23820 gatagtcgtt caggacgttg aagatcaagt actcctccgt ctcgctttgc ttgaaaatga 23880 tatccccggt cccgatgtca ataccgctga gggacatgat ctcctgatgt tctttttcca 23940 gcgtaatgga ggcttcggcg gtcttaaagt cattcacgct ctgctccagc gagtggttga 24000 tggtattgga gaacgacaac ccgaatttca gtttcagttt gtgttgcagt tgctggatgc 24060 agtcctcggc gttgcgcttc acctgttcgc tcgacaccag caggcaccga ccccggttgt 24120 tgaggaagaa gtgcagcaag gcggtgttgt atgccagcca gtttttgatc agatgctccg 24180 aggtatagtt gctggagatg ttctggtccg agaagtagtt cgtcaggatg cttttggggt 24240 ggtcgtagat gaggataaag gtgatgttct catccaccga tttccaatat tccaacgtgt 24300 gaattgcgtt ggggtcgctc caaccgcaca gtttctggtt caggttggac agcatcagat 24360 ccaatgcgat accgttccag acggtgctca catggagcgg ttcaaagtcg gcggaatcgg 24420 tcaccgtata gatgtccggc gactggtacg ccttccgcag cgtctgggtg atgtcctggg 24480 gcgagaggtt ctcacgtttg gacgggcaca gggagttcat gccgcgctga tgcaggagtt 24540 cttccacgat ttggtagttg ctgctcggat ggcccacgat caccaggcgg ttcatttatt 24600 aacctccttt cgaaaatgaa cggtccgtta aatatagcca ttcggattct tcatctgcca 24660 gcgccaggcg tcctccagca tggtttcgag ttcccgcttg gctttccagt tcagatattt 24720 gttggccttt tcgggggagg accagctctc cgcgatatca ccgtcacggc ggctcacgat 24780 ttcatacgga atccgcacgc cggaaatctt ttcaaaggtg gacaccagtt ccagcaccga 24840 ataaccttta cccgtgccca aattaaagac gtggtagttg gtgttattgt cgcggaagag 24900 ataggacagc gctgcgacgt gcccttcggc caggtccatc acatggatat agtcacggac 24960 ccccgtgccg tctttggtgg gataatcacc accgaacacc atcagttttt ccagtttccc 25020 catcgcgacc tgcaagatgt acggcaccaa gttggagggg atgtctgccg ggctttcacc 25080 aatcataccg gattcgtggg cgcccgtcgg attaaagtag cgcaagcaga ggaaattcgt 25140 gtcggagtat ttcttggcga tgtcgcggat catcagctcc gagatgtact tggacgtacc 25200 atacggattc agcgtgccac caatatggca gtcttcggtg acgggcatga tcttgctttc 25260 cccatacacc gtcgccgacg agctaaagat gaagttggcg acgtcgttct tgatggcgca 25320 attgatgagt tgcagggtgc cgctcacgtt gttgtcatag tagaagatgg gcttgatcag 25380 gctttctgcg accgatttcg cacctgcaaa gtgcatgatg cagtcgaatt tgtgtttctt 25440 caggatctgg ttcacttcct tctcgttgtt gatattgagt tcgtagaacg tgactttctt 25500 ctttgcgatc agctcaatgc gacggatgct ttcgcagctg ctgttgatga gattgtcaat 25560 gatgacgaca ttgtagcctt tgttcagcag gcagagcgac gtgtggctgc cgatgtagcc 25620 tgcaccgccg gtgaccagga tgttcattta ttaacctcct cggtccgaat taacctaggt 25680 tatgaggtca gcattgcttc ttcacgcgtt tagtagttgt tttgttcggt gatatattct 25740 tcaatgcctt cttgcacgtc ttcatggaac gacacggcgt tgtcgtcttt aaacacgatt 25800 gccacatcgc agaactcttt caacgagttc agcgagtgcg acaccatgag gaaggagctt 25860 tccttatgac gctccttgaa gagttgggca catttttcct tgaaacgggc gtcccccacc 25920 gccgtcacct cgtccacgat gtagtaatcg aacttgaacg ccatgctcag gccgaagccg 25980 aggcggctgc gcataccgct cgaataggtc ttgatcggca tatcaaaata cttccccagc 26040 tccgcgaact cttccacaaa ctcaatcttt tctttcagct cctcctgctt cgcgtacagc 26100 cgggccacga acttcacgtt ttcacgcccg gtcaagctgc cctggaagcc gcctgccaga 26160 cccaccggcc acgagatcgt tttattcgtg atgattttac cgctatccgg gcggtcgatg 26220 cccccaatca tgcgcaacag cgtggattta cccgccccat tgcgcccgat gaacgccacg 26280 cttttgccgc tggggatctc aatgttcagg ttcttgaaga catagtgacg gcccaccggg 26340 gtgcggtagc ttttcgtcag gttttcgatc ttaatcatga ggtcaacatt gcctcctcac 26400 gcgtacggta cagggccaaa ccaataaaca gggtcaccag ggtgaacatt gccagataat 26460 tcaggctgac cccttcgctg atataaccgg gcatcacggc ctcgcggctc agttcgacga 26520 cgtgcaccag gggattccac agcaggtacg accaatactg cttcggaatg gagtgcagcg 26580 ggaacatgat gcacgaaata aagtacagcg gcttcagcaa gatcggcaag actttctgca 26640 tttcggggaa cgtcttgccc acgaccatga agatcaggcc cacaccgcac gacaggatga 26700 tcaggaggct ccaggtgagc acaaattgca ggaagttggt aatctcgaaa tattcgcccg 26760 ccatccagat gatcagcatc aggaggatgt agaccgccac atagatcagc gtttccaaga 26820 gggcgcgtgc aatgatcgtg tcgatcggct tcacgggccg gtagttaaac agcccctgat 26880 tggcttcgat ggcgcccacg gagcgattgc tgatgctgct gaaaataaag aacgggatca 26940 ggccattgag caggaacacc gggaaggaga tatccggcat ggtgcgatgc atgatatagc 27000 caaagatccc gagcagaatc agcagatgtg cgctcggttc caggatcgcc cacagatagc 27060 ccaggcgaaa cttgccaaag cgcgtacgga tttcgcggag aaacagtgct tcgaccgtca 27120 ctttctggac ttcaaaaccc gaacgtgcca tttattaacc tcctggtacc aatctagatt 27180 gtttaaacag atctgttacc tgcaggatta ttgtttctgt tgcataaagc ctaaggggta 27240 ggcctttcta gagatagcca ttttttgcac tcctgtatcc gcttcttgca aggctggact 27300 tatccctatc aaaccggaca ctgcaggctg acaagctttc attacatatg aagagtttgt 27360 agaaacgcaa aaaggccatc cgtcaggatg gccttctaag aaggctcgag tggcgcgcct 27420 aagtcgaatt tctgccattc atccgcttat tatacttatt caggcgtagc accaggcgtt 27480 taagggcacc aataactgcc ttaaaaaaat tacgccccgc cctgccactc atcgcagtac 27540 tgttgtaatt cattaagcat tctgccgaca tggaagccat cacagacggc atgatgaacc 27600 tgaatcgcca gcggcatcag caccttgtcg ccttgcgtat aatatttgcc catggtgaaa 27660 acgggggcga agaagttgtc catattggcc acgtttaaat caaaactggt gaaactcacc 27720 cagggattgg ctgagacgaa aaacatattc tcaataaacc ctttagggaa ataggccagg 27780 ttttcaccgt aacacgccac atcttgcgaa tatatgtgta gaaactgccg gaaatcgtcg 27840 tggtattcac tccagagcga tgaaaacgtt tcagtttgct catggaaaac ggtgtaacaa 27900 gggtgaacac tatcccatat caccagctca ccgtctttca ttgccatacg gaattccgga 27960 tgagcattca tcaggcgggc aagaatgtga ataaaggccg gataaaactt gtgcttattt 28020 ttctttacgg tctttaaaaa ggccgtaata tccagctgaa cggtctggtt ataggtacat 28080 tgagcaactg actgaaatgc ctcaaaatgt tctttacgat gccattggga tatatcaacg 28140 gtggtatatc cagtgatttt tttctccatt ttagcttcct tagctcctga aaatctcgat 28200 aactcaaaaa atacgcccgg tagtgatctt atttcattat ggtgaaagtt ggaacctctt 28260 acgtgccgat caacgtctca ttttcgccaa aagttggccc agggcttccc ggtatcaaca 28320 gggacaccag gatttattta ttctgcgaag tgatcttccg tcacaggtat ttattcggcg 28380 caaagggcct cgtgatacgc ctatttttat aggttaatgt catgataata atggtttctt 28440 agacgtcagg tggcactttt cggggaaatg tgcgcgcccg cgttcctgct ggcgctgggc 28500 ctgtttctgg cgctggactt cccgctgttc cgtcagcagc ttttcgccca cggccttgat 28560 gatcgcggcg gccttggcct gcatatcccg attcaacggc cccagggcgt ccagaacggg 28620 cttcaggcgc tcccgaaggt 28640 <210> 145 <211> 16562 <212> DNA <213> Artificial Sequence <220> <223> synthetic plasmid pKM010 <400> 145 ttaccaatgc ttaatcagtg aggcacctat ctcagcgatc tgtctatttc gttcatccat 60 agttgcctga ctccccgtcg tgtagataac tacgatacgg gagggcttac catctggccc 120 cagtgctgca atgataccgc gagacccacg ctcaccggct ccagatttat cagcaataaa 180 ccagccagcc ggaagggccg agcgcagaag tggtcctgca actttatccg cctccatcca 240 gtctattaat tgttgccggg aagctagagt aagtagttcg ccagttaata gtttgcgcaa 300 cgttgttgcc attgctacag gcatcgtggt gtcacgctcg tcgtttggta tggcttcatt 360 cagctccggt tcccaacgat caaggcgagt tacatgatcc cccatgttgt gcaaaaaagc 420 ggttagctcc ttcggtcctc cgatcgttgt cagaagtaag ttggccgcag tgttatcact 480 catggttatg gcagcactgc ataattctct tactgtcatg ccatccgtaa gatgcttttc 540 tgtgactggt gagtactcaa ccaagtcatt ctgagaatag tgtatgcggc gaccgagttg 600 ctcttgcccg gcgtcaatac gggataatac cgcgccacat agcagaactt taaaagtgct 660 catcattgga aaacgttctt cggggcgaaa actctcaagg atcttaccgc tgttgagatc 720 cagttcgatg taacccactc gtgcacccaa ctgatcttca gcatctttta ctttcaccag 780 cgtttctggg tgagcaaaaa caggaaggca aaatgccgca aaaaagggaa taagggcgac 840 acggaaatgt tgaatactca tactcttcct ttttcaatat tattgaagca tttatcaggg 900 ttattgtctc atgagcggat acatatttga atgtatttag aaaaataaac aaataggggt 960 tccgcgcaca tttccccgaa aagtgccacc tgacgtctag atctcctacc gaccaggcat 1020 tggcgcgttc caccatcgtc ggcaaatcgc gttcgacagt caccagaatg ctgcgaaagc 1080 acgcagtgtc gtccataccg cccgcacgga aatccttgat cgcctgccgc gggttgtcga 1140 tcttgtattc gagcgtggtc gaggtcggct tgataccggc gcgcttggca gcgcgctcca 1200 ccaccgacca gatcaccggc gagcgggcca ggccagagcg tttgagcgca gcctgataca 1260 actcgccggc agccagcatc ggccgcttgc gctccacgcc acggtcgcgc cccatgtaac 1320 gcgccttggc aacggtccag cgcgcataca actcaggcgg cagcacatcg cgcagctcac 1380 gcccgtcttc gttcttcatc gccttcatcg ccgcgggcat cagggccaat ttgccgaaca 1440 tgccaacgtc ggcatccacc tgcaccatcg gcgccatcag cacctgctgc gattggccga 1500 tgatggtttc gacctcggtc gcttgccact ccaggtcctt cggcaacggt gacaacgtgc 1560 ccaggatcca cagcacgtgg tcgcccttgc tgaccttcca caggccgggg ccgggttgct 1620 gcccgcgcac caccatggct tccagatcga ccaccgttgg cggcgctgcc ggcgcctgta 1680 cggccacctc gacggcacac gccagcatcg gtgccaacaa cgacaccaac gcgattcctg 1740 cccgccacac cgcccccctg cgctgcatca cgtaccgcct cccggttgga acgcggacac 1800 tacgcgaacg cgggcccgca cgcgttaggg aagcgttggc ggctccggcg cggcgccttc 1860 ggcaaccaac gcggccagct gtgccgccag cggcgagccg tcttcgagca gcgcgaaacc 1920 ttcccagaca aaccctggcg aaaccgtgca gcccaccagg gtgaagtccc ccagcgagcg 1980 cgccgcctgc cagcagccgg ccggcaccac gtgcatggcg tcgccgcgct ctgcggcgtc 2040 cagcacttcg cgccgcaact gcccgctcgc ttcgtcgaag atcagcaact ccagcggcgc 2100 accttgctgc cagtgccagc actcctcggc atccacccga tgccagcgac tggcttcgcc 2160 tgcgcacaac aggaagcgga tggcggtcag cgccggacgc ggcggcgcac cgctgtcatc 2220 cagcacctgg cgcgtcgacg cgtacacgcg ccggtagtgg ccgccctccg gatggggggc 2280 aaggcccaat gttcgaatca gcgcggcggc ggttggatgc atgcacgcat gctaggccac 2340 acaccgccgc cgtgcatcac gccagctgtt tgcccgcacg caggcaggtg cggaagaaca 2400 ccagcagatc gcggccgcct cgacgctctc ccttatgcga ctcctgcatt aggaagcagc 2460 ccagtagtag gttgaggccg ttgagcaccg ccgccgcaag gaatggtgca tgcaaggaga 2520 tggcgcccaa cagtcccccg gccacggggc ctgccaccat acccacgccg aaacaagcgc 2580 tcatgagccc gaagtggcga gcccgatctt ccccatcggt gatgtcggcg atataggcgc 2640 cagcaaccgc acctgtggcg ccggtgatgc cggccacgat gcgtccggcg tacaagatcc 2700 acaggacggg tgtggtcgcc atgatcgcgt agtcgatagt ggctccaagt agcgaagcga 2760 gcaggactgg gcggcggcca aagcggtcgg acagtgctcc gagaacgggt gcgcatagaa 2820 attgcatcaa cgcatatagc gctagcagca cgccatagtg actggcgatg ctgtcggaat 2880 ggacgatatc ccgcaagagg cccggcagta ccggcataac caagcctatg cctacagcat 2940 ccagggtgac ggtgccgagg atgacgatga gcgcattgtt agatttcata cacggtgcct 3000 gactgcgtta gcaatttaac tgtgataaac taccgcatta aagccgagcg atgataagct 3060 gtcaaacatg agatccgata aatcgattga tagatttaaa taagaactgc agaagctagc 3120 ttagatgctc gtgaaattga cgtgggcgct ttgcagggcc gtcttaatgg cgttggtgtc 3180 cacgaggatc gagtcgggtg cggaaaacgg acggttcttg ttggtgaaat cgctgttacc 3240 aatgtacagc gattccttgt tacgcagcgc ctggatgtgc cagcgggacc acgaatccca 3300 atacttctgg cgatccggcg agataccttg gctggtgtag ccggtcgtcg ggctgttcat 3360 caacgagtcg gtgcggtgcg agcccagcgt cagcggcaac ttgatccgat gcaccgtgga 3420 atcgccgaag atcagcttca gacgcgcgat aaattcgcta tccgcacccg ttttcacaca 3480 atcccagaca ccggccttct gcaagacgtc ggcacggcga aacaggagcg acgacggatt 3540 cagacgcttc aaggggtaca ctgcgcgggc atagaaaata ccgttgtctt gcaggcgcac 3600 ccagtccgag atggagcaga tgagcttcgg attgagcaac aagggggaga tttggcggaa 3660 cagcttttcc ggatggctcc agtcatccga atcgtggcag gtgacgaact cgcccttcgc 3720 ttggatcaag ccgatacgct tcgcggcata ggtgccgaca ttctgcggca ggctaatgat 3780 cttgatgcgc gtgtctttga gggcgagccg ctggagacga aacagggtgt catcggtgct 3840 cgcgtcatcc acaatgatca gctcgaagga acggtaggtc tgattgagga gcgaaatcac 3900 cgcattttcc acgcggcgac ccgtattata ggtggtcatc aggatggaga tcaacggccc 3960 cgtctgggcc gggtacggga tgctggtgat gatgttgcac ggggagagcg gggagctgtt 4020 gtccgtcaag gccacggggc tgaggccgaa gtatttatag tattcattca gccgattcag 4080 gctaatttcg gcggtttcgc ggaaggcgtt attttgcagc agcaggatat ccgggctata 4140 gacgatatcg gatgcgtcga tctgggcgag ggtcgagatg gccttttggg tcaggccgat 4200 ccggagttgc agtgcggtat acaggtccag cgggcagttg tccacgttgt ccaacaggct 4260 caggctaaag gtcggcgagt aggacgccag ggttttcgcc agttccactt tctgatgggt 4320 atcggtgaac tcgtccttga actccatcag cagctcgggc gtcaggctga tgtcgccgca 4380 ggcgattttt gcgatcttga ttgccagttt gcagcgccaa tcggacgggg tatccgtcaa 4440 gttatgcagc gaccagtaca tattcagacg atacatcgcg aggatgcgtt tcgactgcca 4500 gaaccggcaa tcatcctgga tggccgcgag cgcgtggacg tagcggctct ttttgagcag 4560 ccacaagaat ttgagattat tgaacattta ttaacctcct gctagcaact taagttacga 4620 atcgacgccg aacaggtcgc gggtgtagac tttctccgag acatcttcca gttcgctggt 4680 gcggcgattc gccacaatga catcgacgcg ctccttaaag gaattgatgt cgcgctcgac 4740 gtaggaaccg aagaagtagg gttctttcag gaccggctcg tacaccacaa tctcgatacc 4800 cttggccttc aaacgtttca tgaccccctg gatgctgctg gcccggaaat tgtcgctacc 4860 cgccttcatg atcaggcgat agataccgac cactttgggc ttacgggaca ggatgtcctc 4920 ggccacgaag tccttacggg tcgtattcgc atccacgatg gcctggatca ggttttgcgg 4980 gacgtcgcga taattggcca acagctgctt cgtatccttc ggcagacagt aaccgccgta 5040 gccgaaggac gggttgttgt aatgttgacc aatgcgcgga tcgagggaga cgccttcgat 5100 gatttgtttg gtatccaggc cgtgcacgct cgcgtaggtg tccagctcgt taaagtacgc 5160 gatacgcatc gccagatacg tgttcgcgaa cagtttgatg gcttctgcct cgggcgaatc 5220 cgtcagcagg atcggaatat cctttttgat ggcaccttcc gacaggagtt cggcgaactt 5280 ccgtgcgcgt tccgacgatt cgcccacgac aatgcggctc ggatagagat tatcatacag 5340 ggctttgcct tcgcgcagga actccgggga aaagatgata ttattcgtgt tcagatcgcg 5400 cttcaggcgt tcggtgaacc cgacggggac ggtggatttg ataatgatgg tcgcgttcgg 5460 gttaatggac agcacgtcac acgcgacgct ttcgacgctc agggtatcaa agttgttatt 5520 aatcggatca tagttcgtcg gggtggcgat gatcacgtag tctgcatcgc gatatgcctc 5580 gtatttttcc gtcgtcgcgt agaggttcag cttacgattg gagagaaact tctggatttc 5640 cgggtcgcaa atcggcgaga ttttcttgtt aatgagctgg accttcttcg ggtcgatgtc 5700 cagggcgatg atgtcgtgtt tttgggagag gaggatcgca atgctgatac ccacatagcc 5760 gacgccggcc acggcaattt tcatttatta acctccttaa gtgaattcaa actagtttac 5820 aagtcgtttt cgatcttctc ccaggtatat ttgcgacatt cattcaagtt ggtcagcggc 5880 gagtatttgt actttttgat accgaggcgc gacaggcttt cgttcaccac cttgaaatgg 5940 ttttcctttt ggatgtccag tttcttgatc gacgtgttct cgccgtgcag gacacggttg 6000 tagcaaatct tattgatatg cttaaacggg ccgacttcgc tgagtttcaa atacatatcg 6060 taatccaccg cattgctgat gctctcgttg aagccttcgg tgaggttcca tgcacgcgcc 6120 gtgaacatac ggaagtggtg gcagatcatc gcgctcgtga gcttttcgcg gctgtaaatc 6180 ggccagttgt agccattgct aatcaagtta ccttcacgat caatattgcg attggtggtg 6240 tacacgcagg cgaggctcag gtctttgcga aattcatcca gacacagttc cacggcatcg 6300 ggctccagga aatcatcgga atccagctgc ccgatgtaga aaccccggca caggcggact 6360 gcggtattcg aggcggagcc gatgcctttg tttttctggc tgatgaaacg gacgcgcggg 6420 tggtttgcgt aatgttcttg caggatgcgc agcgtatcat cggtgctccc gtcatcgcag 6480 atgcagacct ccagatcggt gatcgtttgg ttcagtgccg attcgacgca gcgcacgata 6540 tatttgctgc aattatacgc ggggatgtag atgctcacca ggggcacacg tttcagggtg 6600 gcgctctcga ttttctcctt cttgcgataa aagtagggca ccttctgctg caacagctgg 6660 acggtaatgt ttttacctgc cgcgcgatcg gtttcgttct ccttaccggg cggttcctga 6720 tgatatgcca tcgcgccttc cacgctacgg aaataacaac cctcgcggta cagccgatag 6780 ccgaactcat tatcctcacc gccccaatgc gtgaactctt cgtcaaacca acccgcgcga 6840 aacagccact tctttgcaaa cgccacattg ccaccgctaa agaaccggaa cggggtgttg 6900 cacaggcgca gattgtcggt attcttgaaa tgttcgatgc gccaatcgac ggatttgttc 6960 tgctcgacct tgcctgcgac ctgattattg gtaataatct ccgggatttc attgatcagg 7020 cttttctggg acaaaaagtc cagataggta tgcttcgacg tgtcgatgta tttacgcggg 7080 ccaatcagtg ccacgttatc atccacggcc aggagttcca tataggactg cacccacaac 7140 gggttcggcg ccatatcgca gtccaagatc gccacgtagt tgtatttcgc tgcccgcagg 7200 cccaggttcc gcacggcgca cagctggtag ccgtagtctt tctggcggac gtatttgatg 7260 ttcagcaacg actcgaactc gcggacgatc tcttcgatgt tttccttgga accgtcatcc 7320 gcgacgatga cctcatagtc ataaatcgtt ttctgattgc agaggcaggc cagggtgatc 7380 gccaggattt tggcgcgatt gtacgtcgga atcacgatgg acaggccgtc gatgatcagt 7440 tgcttgcgcg gataatcatc cagttcttta cgtttccctg cccagacgta gtcgttcgtg 7500 ctttccggca gcggcggcaa ggtcaggtcg ctcggccaat ccagcggaat gggttcgact 7560 tctttcaatt cggcgcgctc ggatttcttt gcggtaattt cccgatattt gctaatgatt 7620 tcattctttt ccacctcatt cagcgagatc gcctttgcat tgctgcacat aattttggtt 7680 gccgcgtcga tatcaatgac cgctttccga ttcagcttgt ccacttcttc gctcagattc 7740 agggcggttt ggcacagctt gatattggct tccacccagc tcacatcata gatttccgcc 7800 actttttcaa acagggagag ggcttggcgg tagttcttat tcttatacag attgattgcc 7860 tggttcaaaa tgctcattta ttaacctcct actagtgaat tttcgaatta cttaccgcag 7920 tacttgacac ccacctggga attgtttttg gtgcgtttga attggcggat ggtacggtag 7980 atgctaaagg gcaggctgat cagaccgagc ggaaaattgt tcttattgat gatgagcttg 8040 cccagctgat agctcaggtg tttcttgacc cgttcggctt cgtgtttatc cgcgtacagg 8100 aagatgctcg gcaggctcac ttggtactcc gaatcatatt tcttcttcca ggtccgccat 8160 tcgctgatca acgcaaacgg aatcgagatc agaccgagga acgtcttgga gcggctcacc 8220 atcaccgcac ccaggcggta gccgatatct tgcttgatgc gttcggccgc accatacagc 8280 tccggcagtt gtttcttttc gagacgttga ttgtcgatga agtactgttc gagcttttgc 8340 tgcaccagat gcagctgatt gagcagcaat tctttttcgc acgacagctt ttcgaggcgc 8400 tgttgttgca gttcattttt gttctgttcc tttttcagca gggactcgaa gttctcgatc 8460 gcgcactcca gttcctggac ctggatggtt ttgtttttaa tgatcagatc atactggatc 8520 agttcttcct tgctatccga cagctctttc agaatggctt gataggcgtt cagctgtttg 8580 gacgtgtgca gttcgttgtc cagaatgatc tttttgctgc tctggtacag accgttcacg 8640 atatcgaggg tgatctggcg ttgtttaatg aacgtctccc aaataaagga cggcttatag 8700 ttttccttct ccagcacccg caagggggtg ttggcgttcg attgcaattc aaagtacagt 8760 tccttgcaat cgggatagtc gttcaggacg ttgaagatca agtactcctc cgtctcgctt 8820 tgcttgaaaa tgatatcccc ggtcccgatg tcaataccgc tgagggacat gatctcctga 8880 tgttcttttt ccagcgtaat ggaggcttcg gcggtcttaa agtcattcac gctctgctcc 8940 agcgagtggt tgatggtatt ggagaacgac aacccgaatt tcagtttcag tttgtgttgc 9000 agttgctgga tgcagtcctc ggcgttgcgc ttcacctgtt cgctcgacac cagcaggcac 9060 cgaccccggt tgttgaggaa gaagtgcagc aaggcggtgt tgtatgccag ccagtttttg 9120 atcagatgct ccgaggtata gttgctggag atgttctggt ccgagaagta gttcgtcagg 9180 atgcttttgg ggtggtcgta gatgaggata aaggtgatgt tctcatccac cgatttccaa 9240 tattccaacg tgtgaattgc gttggggtcg ctccaaccgc acagtttctg gttcaggttg 9300 gacagcatca gatccaatgc gataccgttc cagacggtgc tcacatggag cggttcaaag 9360 tcggcggaat cggtcaccgt atagatgtcc ggcgactggt acgccttccg cagcgtctgg 9420 gtgatgtcct ggggcgagag gttctcacgt ttggacgggc acagggagtt catgccgcgc 9480 tgatgcagga gttcttccac gatttggtag ttgctgctcg gatggcccac gatcaccagg 9540 cggttcattt attaacctcc tttcgaaaat gaacggtccg ttaaatatag ccattcggat 9600 tcttcatctg ccagcgccag gcgtcctcca gcatggtttc gagttcccgc ttggctttcc 9660 agttcagata tttgttggcc ttttcggggg aggaccagct ctccgcgata tcaccgtcac 9720 ggcggctcac gatttcatac ggaatccgca cgccggaaat cttttcaaag gtggacacca 9780 gttccagcac cgaataacct ttacccgtgc ccaaattaaa gacgtggtag ttggtgttat 9840 tgtcgcggaa gagataggac agcgctgcga cgtgcccttc ggccaggtcc atcacatgga 9900 tatagtcacg gacccccgtg ccgtctttgg tgggataatc accaccgaac accatcagtt 9960 tttccagttt ccccatcgcg acctgcaaga tgtacggcac caagttggag gggatgtctg 10020 ccgggctttc accaatcata ccggattcgt gggcgcccgt cggattaaag tagcgcaagc 10080 agaggaaatt cgtgtcggag tatttcttgg cgatgtcgcg gatcatcagc tccgagatgt 10140 acttggacgt accatacgga ttcagcgtgc caccaatatg gcagtcttcg gtgacgggca 10200 tgatcttgct ttccccatac accgtcgccg acgagctaaa gatgaagttg gcgacgtcgt 10260 tcttgatggc gcaattgatg agttgcaggg tgccgctcac gttgttgtca tagtagaaga 10320 tgggcttgat caggctttct gcgaccgatt tcgcacctgc aaagtgcatg atgcagtcga 10380 atttgtgttt cttcaggatc tggttcactt ccttctcgtt gttgatattg agttcgtaga 10440 acgtgacttt cttctttgcg atcagctcaa tgcgacggat gctttcgcag ctgctgttga 10500 tgagattgtc aatgatgacg acattgtagc ctttgttcag caggcagagc gacgtgtggc 10560 tgccgatgta gcctgcaccg ccggtgacca ggatgttcat ttattaacct cctcggtccg 10620 aattaaccta ggttatgagg tcagcattgc ttcttcacgc ggtgttaatt aagtaatcga 10680 tagtgattta aatatgcaag atctagttac ctgcaggcgc gccgcggccg ccaagacggt 10740 attcgggctg caccgtggac attgccagcg ggtccggatg cggcagcgaa gacgccatct 10800 ccgggccggt gctgcaagcg cccagcgaca tcgagcagag cagagccagg ctgaggcctt 10860 ggcagagtcg tccgatcagt ttcttcatgc gtgtagctgg ctgcctctgt tgggtgggac 10920 aggacctcgc gcagcattca accggctcag gcgccagcac gaacgtacga caggaagttg 10980 catcccgacg cgtgccggga ccaacgttga atcgcgtgtt gcagtgcact atggcataga 11040 acgaacacat cgcaaggcac aacacgccat ttttttgacg gcgttggcct attgattcaa 11100 gttcgtcgcc tcgacgttaa gagaacgtga cctgggtcgt cattctcagc atacgaactc 11160 tagcgtttcc gggcacttac ggacgcctgc tgatcccgac ttgtagcagc ctgaaccgcg 11220 aaataattgc gtacaggact tgcatatgcc gccttgcaat atgccgttgc gcatagtggc 11280 atagcctgga atgccatcga actgacatgt tgcgacgcaa caaaaaggcc cacgtcttgc 11340 gacgtaggcc tgttgtttgg tcggggtagc cggattcgaa ccgacgacca ctagtccccc 11400 agactagtgc gctaccaggc tgcgctatac cccgaagatg ttgcgtcccg ccctgaggcg 11460 gcctgcgatt atagcggctt tatgcggcgc tttcctagcg tcgcagcagc tgcaggactt 11520 cttcaagctc catgcgcacc tgcttgatga tctgattgct cagcgctgac tcgctcttgg 11580 ccccatcccc ttcaagacgc agacgcgcgc ccccgatggt gtaaccctgc tcgtacagca 11640 ggccacgaat ctgccgcacc atcagcacat cgtgccgctg gtagtagcgt cggttgccgc 11700 gccgcttgac tggctccagg ctcggaaatt cggtttccca atagcgcagc acgtgcggct 11760 tgacgtcgca cagctcgctc acctcaccga tggtgaagta gcgcttggcc ggaatcggcg 11820 gtagctcgcg attactgccc ggatccagca taagcctcca cccgttcctt gagtttctgg 11880 ccggggcgga aggtcaccac cgtcctggcc gagatcggaa tttcctcacc ggtcttggga 11940 ttgcgaccgg gccgttggtt cttgcgccgc agatcgaagt tgccgaagcc cgacaacttc 12000 acctgacggc cctgctccag tgcatcgcgc agcacatcga aaaacgcgtc gacgaattcc 12060 ttcgcctcac gcttgttcag gccgacttcg tcgaacagac gctcggccat ctccgctttc 12120 gtcaatgcca tgccaatccc ctgttaccgc cagatctgaa ttcagctgta caattggtac 12180 catggatgca tatggcggcc gggccctacg tacgcgtgtt aaccggtgag ctcactagag 12240 gatccagccg accaggcttt ccacgcccgc gtgccgctcc atgtcgttcg cgcggttctc 12300 ggaaacgcgc tgccgcgttt cgtgattgtc acgctcaagc ccgtagtccc gttcgagcgt 12360 cgcgcagagg tcagcgaggg cgcggtaggc ccgatacggc tcatggatgg tgtttcgggt 12420 cgggtgaatc ttgttgatgg cgatatggat gtgcaggttg tcggtgtcgt gatgcacggc 12480 actgacgcgc tgatgctcgg cgaagccaag cccagcgcag atgcggtcct caatcgcgcg 12540 caacgtctcc gcgtcgggct tctctcccgc gcggaagcta accagcaggt gataggtctt 12600 gtcggcctcg gaacgggtgt tgccgtgctg ggtcgccatc acctcggcca tgacagcggg 12660 cagggtgttt gcctcgcagt tcgtgacgcg cacgtgaccc aggcgctcgg tcttgccttg 12720 ctcgtcggtg atgtacttca ccagctccgc gaagtcgctc ttcttgatgg agcgcatggg 12780 gacgtgcttg gcaatcacgc gcaccccccg gccgttttag cggctaaaaa agtcatggct 12840 ctgccctcgg gcggaccacg cccatcatga ccttgccaag ctcgtcctgc ttctcttcga 12900 tcttcgccag cagggcgagg atcgtggcat caccgaaccg cgccgtgcgc gggtcgtcgg 12960 tgagccagag tttcagcagg ccgcccaggc ggcccaggtc gccattgatg cgggccagct 13020 cgcggacgtg ctcatagtcc acgacgcccg tgattttgta gccctggccg acggccagca 13080 ggtaggccga caggctcatg ccggccgccg ccgccttttc ctcaatcgct cttcgttcgt 13140 ctggaaggca gtacaccttg ataggtgggc tgcccttcct ggttggcttg gtttcatcag 13200 ccatccgctt gccctcatct gttacgccgg cggtagccgg ccagcctcgc agagcaggat 13260 tcccgttgag caccgccagg tgcgaataag ggacagtgaa gaaggaacac ccgctcgcgg 13320 gtgggcctac ttcacctatc ctgcccggct gacgccgttg gatacaccaa ggaaagtcta 13380 cacgaaccct ttggcaaaat cctgtatatc gtgcgaaaaa ggatggatat accgaaaaaa 13440 tcgctataat gaccccgaag cagggttatg cagcggaaaa gcgctgcttc cctgctgttt 13500 tgtggaatat ctaccgactg gaaacaggca aatgcaggaa attactgaac tgaggggaca 13560 ggcgagagac gatgccaaag agctacaccg acgagctggc cgagtgggtt gaatcccgcg 13620 cggccaagaa gcgccggcgt gatgaggctg cggttgcgtt cctggcggtg agggcggatg 13680 tcgaggcggc gttagcgtcc ggctatgcgc tcgtcaccat ttgggagcac atgcgggaaa 13740 cggggaaggt caagttctcc tacgagacgt tccgctcgca cgccaggcgg cacatcaagg 13800 ccaagcccgc cgatgtgccc gcaccgcagg ccaaggctgc ggaacccgcg ccggcaccca 13860 agacgccgga gccacggcgg ccgaagcagg ggggcaaggc tgaaaagccg gcccccgctg 13920 cggccccgac cggcttcacc ttcaacccaa caccggacaa aaaggatccc caattctcat 13980 gtttgacagc ttatcatcga taagctttaa tgcggtagtt tatcacagtt aaattgctaa 14040 cgcagtcagg caccgtgtat gaaatctaac aatgcgctca tcgtcatcct cggcaccgtc 14100 accctggatg ctgtaggcat aggcttggtt atgccggtac tgccgggcct cttgcgggat 14160 atcgtccatt ccgacagcat cgccagtcac tatggcgtgc tgctagcgct atatgcgttg 14220 atgcaatttc tatgcgcacc cgttctcgga gcactgtccg accgctttgg ccgccgccca 14280 gtcctgctcg cttcgctact tggagccact atcgactacg cgatcatggc gaccacaccc 14340 gtcctgtgga tcctctacgc cggacgcatc gtggccggca tcaccggcgc cacaggtgcg 14400 gttgctggcg cctatatcgc cgacatcacc gatggggaag atcgggctcg ccacttcggg 14460 ctcatgagcg cttgtttcgg cgtgggtatg gtggcaggcc ccgtggccgg gggactgttg 14520 ggcgccatct ccttgcatgc accattcctt gcggcggcgg tgctcaacgg cctcaaccta 14580 ctactgggct gcttcctaat gcaggagtcg cataagggag agcgtcgacc gatgcccttg 14640 agagccttca acccagtcag ctccttccgg tgggcgcggg gcatgactat cgtcgccgca 14700 cttatgactg tcttctttat catgcaactc gtaggacagg tgccggcagc gctctgggtc 14760 attttcggcg aggaccgctt tcgctggagc gcgacgatga tcggcctgtc gcttgcggta 14820 ttcggaatct tgcacgccct cgctcaagcc ttcgtcactg gtcccgccac caaacgtttc 14880 ggcgagaagc aggccattat cgccggcatg gcggccgacg cgctgggcta cgtcttgctg 14940 gcgttcgcga cgcgaggctg gatggccttc cccattatga ttcttctcgc ttccggcggc 15000 atcgggatgc ccgcgttgca ggccatgctg tccaggcagg tagatgacga ccatcaggga 15060 cagcttcaag gatcgctcgc ggctcttacc agcctaactt cgatcactgg accgctgatc 15120 gtcacggcga tttatgccgc ctcggcgagc acatggaacg ggttggcatg gattgtaggc 15180 gccgccctat accttgtctg cctccccgcg ttgcgtcgcg gtgcatggag ccgggccacc 15240 tcgacctgaa tggaagccgg cggcacctcg ctaacggatt caccactcca agaattggag 15300 ccaatcaatt cttgcggaga actgtgaatg cgcaaaccaa cccttggcag aacatatcca 15360 tcgcgtccgc catctccagc agccgcacgc ggcgcatctc gggcagcgtt gggtcctggc 15420 cacgggtgcg catgatcgtg ctcctgtcgt tgaggacccg gctaggctgg cggggttgcc 15480 ttactggtta gcagaatgaa tcaccgatac gcgagcgaac gtgaagcgac tgctgctgca 15540 aaacgtctgc gacctgagca acaacatgaa tggtcttcgg tttccgtgtt tcgtaaagtc 15600 tggaaacgcg gaagtcagcg ctcttccgct tcctcgctca ctgactcgct gcgctcggtc 15660 gttcggctgc ggcgagcggt atcagctcac tcaaaggcgg taatacggtt atccacagaa 15720 tcaggggata acgcaggaaa gaacatgtga gcaaaaggcc agcaaaaggc caggaaccgt 15780 aaaaaggccg cgttgctggc gtttttccat aggctccgcc cccctgacga gcatcacaaa 15840 aatcgacgct caagtcagag gtggcgaaac ccgacaggac tataaagata ccaggcgttt 15900 ccccctggaa gctccctcgt gcgctctcct gttccgaccc tgccgcttac cggatacctg 15960 tccgcctttc tcccttcggg aagcgtggcg ctttctcata gctcacgctg taggtatctc 16020 agttcggtgt aggtcgttcg ctccaagctg ggctgtgtgc acgaaccccc cgttcagccc 16080 gaccgctgcg ccttatccgg taactatcgt cttgagtcca acccggtaag acacgactta 16140 tcgccactgg cagcagccac tggtaacagg attagcagag cgaggtatgt aggcggtgct 16200 acagagttct tgaagtggtg gcctaactac ggctacacta gaaggacagt atttggtatc 16260 tgcgctctgc tgaagccagt taccttcgga aaaagagttg gtagctcttg atccggcaaa 16320 caaaccaccg ctggtagcgg tggttttttt gtttgcaagc agcagattac gcgcagaaaa 16380 aaaggatctc aagaagatcc tttgatcttt tctacggggt ctgacgctca gtggaacgaa 16440 aactcacgtt aagggatttt ggtcatgaga ttatcaaaaa ggatcttcac ctagatcctt 16500 ttaaattaaa aatgaagttt taaatcaatc taaagtatat atgagtaaac ttggtctgac 16560 ag 16562 <210> 146 <211> 16769 <212> DNA <213> Artificial Sequence <220> <223> synthetic plasmid pKM011 <400> 146 ttaccaatgc ttaatcagtg aggcacctat ctcagcgatc tgtctatttc gttcatccat 60 agttgcctga ctccccgtcg tgtagataac tacgatacgg gagggcttac catctggccc 120 cagtgctgca atgataccgc gagacccacg ctcaccggct ccagatttat cagcaataaa 180 ccagccagcc ggaagggccg agcgcagaag tggtcctgca actttatccg cctccatcca 240 gtctattaat tgttgccggg aagctagagt aagtagttcg ccagttaata gtttgcgcaa 300 cgttgttgcc attgctacag gcatcgtggt gtcacgctcg tcgtttggta tggcttcatt 360 cagctccggt tcccaacgat caaggcgagt tacatgatcc cccatgttgt gcaaaaaagc 420 ggttagctcc ttcggtcctc cgatcgttgt cagaagtaag ttggccgcag tgttatcact 480 catggttatg gcagcactgc ataattctct tactgtcatg ccatccgtaa gatgcttttc 540 tgtgactggt gagtactcaa ccaagtcatt ctgagaatag tgtatgcggc gaccgagttg 600 ctcttgcccg gcgtcaatac gggataatac cgcgccacat agcagaactt taaaagtgct 660 catcattgga aaacgttctt cggggcgaaa actctcaagg atcttaccgc tgttgagatc 720 cagttcgatg taacccactc gtgcacccaa ctgatcttca gcatctttta ctttcaccag 780 cgtttctggg tgagcaaaaa caggaaggca aaatgccgca aaaaagggaa taagggcgac 840 acggaaatgt tgaatactca tactcttcct ttttcaatat tattgaagca tttatcaggg 900 ttattgtctc atgagcggat acatatttga atgtatttag aaaaataaac aaataggggt 960 tccgcgcaca tttccccgaa aagtgccacc tgacgtctag atctcctacc gaccaggcat 1020 tggcgcgttc caccatcgtc ggcaaatcgc gttcgacagt caccagaatg ctgcgaaagc 1080 acgcagtgtc gtccataccg cccgcacgga aatccttgat cgcctgccgc gggttgtcga 1140 tcttgtattc gagcgtggtc gaggtcggct tgataccggc gcgcttggca gcgcgctcca 1200 ccaccgacca gatcaccggc gagcgggcca ggccagagcg tttgagcgca gcctgataca 1260 actcgccggc agccagcatc ggccgcttgc gctccacgcc acggtcgcgc cccatgtaac 1320 gcgccttggc aacggtccag cgcgcataca actcaggcgg cagcacatcg cgcagctcac 1380 gcccgtcttc gttcttcatc gccttcatcg ccgcgggcat cagggccaat ttgccgaaca 1440 tgccaacgtc ggcatccacc tgcaccatcg gcgccatcag cacctgctgc gattggccga 1500 tgatggtttc gacctcggtc gcttgccact ccaggtcctt cggcaacggt gacaacgtgc 1560 ccaggatcca cagcacgtgg tcgcccttgc tgaccttcca caggccgggg ccgggttgct 1620 gcccgcgcac caccatggct tccagatcga ccaccgttgg cggcgctgcc ggcgcctgta 1680 cggccacctc gacggcacac gccagcatcg gtgccaacaa cgacaccaac gcgattcctg 1740 cccgccacac cgcccccctg cgctgcatca cgtaccgcct cccggttgga acgcggacac 1800 tacgcgaacg cgggcccgca cgcgttaggg aagcgttggc ggctccggcg cggcgccttc 1860 ggcaaccaac gcggccagct gtgccgccag cggcgagccg tcttcgagca gcgcgaaacc 1920 ttcccagaca aaccctggcg aaaccgtgca gcccaccagg gtgaagtccc ccagcgagcg 1980 cgccgcctgc cagcagccgg ccggcaccac gtgcatggcg tcgccgcgct ctgcggcgtc 2040 cagcacttcg cgccgcaact gcccgctcgc ttcgtcgaag atcagcaact ccagcggcgc 2100 accttgctgc cagtgccagc actcctcggc atccacccga tgccagcgac tggcttcgcc 2160 tgcgcacaac aggaagcgga tggcggtcag cgccggacgc ggcggcgcac cgctgtcatc 2220 cagcacctgg cgcgtcgacg cgtacacgcg ccggtagtgg ccgccctccg gatggggggc 2280 aaggcccaat gttcgaatca gcgcggcggc ggttggatgc atgcacgcat gctaggccac 2340 acaccgccgc cgtgcatcac gccagctgtt tgcccgcacg caggcaggtg cggaagaaca 2400 ccagcagatc gcggccgcct cgacgctctc ccttatgcga ctcctgcatt aggaagcagc 2460 ccagtagtag gttgaggccg ttgagcaccg ccgccgcaag gaatggtgca tgcaaggaga 2520 tggcgcccaa cagtcccccg gccacggggc ctgccaccat acccacgccg aaacaagcgc 2580 tcatgagccc gaagtggcga gcccgatctt ccccatcggt gatgtcggcg atataggcgc 2640 cagcaaccgc acctgtggcg ccggtgatgc cggccacgat gcgtccggcg tacaagatcc 2700 acaggacggg tgtggtcgcc atgatcgcgt agtcgatagt ggctccaagt agcgaagcga 2760 gcaggactgg gcggcggcca aagcggtcgg acagtgctcc gagaacgggt gcgcatagaa 2820 attgcatcaa cgcatatagc gctagcagca cgccatagtg actggcgatg ctgtcggaat 2880 ggacgatatc ccgcaagagg cccggcagta ccggcataac caagcctatg cctacagcat 2940 ccagggtgac ggtgccgagg atgacgatga gcgcattgtt agatttcata cacggtgcct 3000 gactgcgtta gcaatttaac tgtgataaac taccgcatta aagccgagcg atgataagct 3060 gtcaaacatg agatccgata aatcgattga tagatttaaa taagaactgc agaagctagc 3120 ttagatgctc gtgaaattga cgtgggcgct ttgcagggcc gtcttaatgg cgttggtgtc 3180 cacgaggatc gagtcgggtg cggaaaacgg acggttcttg ttggtgaaat cgctgttacc 3240 aatgtacagc gattccttgt tacgcagcgc ctggatgtgc cagcgggacc acgaatccca 3300 atacttctgg cgatccggcg agataccttg gctggtgtag ccggtcgtcg ggctgttcat 3360 caacgagtcg gtgcggtgcg agcccagcgt cagcggcaac ttgatccgat gcaccgtgga 3420 atcgccgaag atcagcttca gacgcgcgat aaattcgcta tccgcacccg ttttcacaca 3480 atcccagaca ccggccttct gcaagacgtc ggcacggcga aacaggagcg acgacggatt 3540 cagacgcttc aaggggtaca ctgcgcgggc atagaaaata ccgttgtctt gcaggcgcac 3600 ccagtccgag atggagcaga tgagcttcgg attgagcaac aagggggaga tttggcggaa 3660 cagcttttcc ggatggctcc agtcatccga atcgtggcag gtgacgaact cgcccttcgc 3720 ttggatcaag ccgatacgct tcgcggcata ggtgccgaca ttctgcggca ggctaatgat 3780 cttgatgcgc gtgtctttga gggcgagccg ctggagacga aacagggtgt catcggtgct 3840 cgcgtcatcc acaatgatca gctcgaagga acggtaggtc tgattgagga gcgaaatcac 3900 cgcattttcc acgcggcgac ccgtattata ggtggtcatc aggatggaga tcaacggccc 3960 cgtctgggcc gggtacggga tgctggtgat gatgttgcac ggggagagcg gggagctgtt 4020 gtccgtcaag gccacggggc tgaggccgaa gtatttatag tattcattca gccgattcag 4080 gctaatttcg gcggtttcgc ggaaggcgtt attttgcagc agcaggatat ccgggctata 4140 gacgatatcg gatgcgtcga tctgggcgag ggtcgagatg gccttttggg tcaggccgat 4200 ccggagttgc agtgcggtat acaggtccag cgggcagttg tccacgttgt ccaacaggct 4260 caggctaaag gtcggcgagt aggacgccag ggttttcgcc agttccactt tctgatgggt 4320 atcggtgaac tcgtccttga actccatcag cagctcgggc gtcaggctga tgtcgccgca 4380 ggcgattttt gcgatcttga ttgccagttt gcagcgccaa tcggacgggg tatccgtcaa 4440 gttatgcagc gaccagtaca tattcagacg atacatcgcg aggatgcgtt tcgactgcca 4500 gaaccggcaa tcatcctgga tggccgcgag cgcgtggacg tagcggctct ttttgagcag 4560 ccacaagaat ttgagattat tgaacattta ttaacctcct gctagcaact taagttacga 4620 atcgacgccg aacaggtcgc gggtgtagac tttctccgag acatcttcca gttcgctggt 4680 gcggcgattc gccacaatga catcgacgcg ctccttaaag gaattgatgt cgcgctcgac 4740 gtaggaaccg aagaagtagg gttctttcag gaccggctcg tacaccacaa tctcgatacc 4800 cttggccttc aaacgtttca tgaccccctg gatgctgctg gcccggaaat tgtcgctacc 4860 cgccttcatg atcaggcgat agataccgac cactttgggc ttacgggaca ggatgtcctc 4920 ggccacgaag tccttacggg tcgtattcgc atccacgatg gcctggatca ggttttgcgg 4980 gacgtcgcga taattggcca acagctgctt cgtatccttc ggcagacagt aaccgccgta 5040 gccgaaggac gggttgttgt aatgttgacc aatgcgcgga tcgagggaga cgccttcgat 5100 gatttgtttg gtatccaggc cgtgcacgct cgcgtaggtg tccagctcgt taaagtacgc 5160 gatacgcatc gccagatacg tgttcgcgaa cagtttgatg gcttctgcct cgggcgaatc 5220 cgtcagcagg atcggaatat cctttttgat ggcaccttcc gacaggagtt cggcgaactt 5280 ccgtgcgcgt tccgacgatt cgcccacgac aatgcggctc ggatagagat tatcatacag 5340 ggctttgcct tcgcgcagga actccgggga aaagatgata ttattcgtgt tcagatcgcg 5400 cttcaggcgt tcggtgaacc cgacggggac ggtggatttg ataatgatgg tcgcgttcgg 5460 gttaatggac agcacgtcac acgcgacgct ttcgacgctc agggtatcaa agttgttatt 5520 aatcggatca tagttcgtcg gggtggcgat gatcacgtag tctgcatcgc gatatgcctc 5580 gtatttttcc gtcgtcgcgt agaggttcag cttacgattg gagagaaact tctggatttc 5640 cgggtcgcaa atcggcgaga ttttcttgtt aatgagctgg accttcttcg ggtcgatgtc 5700 cagggcgatg atgtcgtgtt tttgggagag gaggatcgca atgctgatac ccacatagcc 5760 gacgccggcc acggcaattt tcatttatta acctccttaa gtgaattcaa actagtttac 5820 aagtcgtttt cgatcttctc ccaggtatat ttgcgacatt cattcaagtt ggtcagcggc 5880 gagtatttgt actttttgat accgaggcgc gacaggcttt cgttcaccac cttgaaatgg 5940 ttttcctttt ggatgtccag tttcttgatc gacgtgttct cgccgtgcag gacacggttg 6000 tagcaaatct tattgatatg cttaaacggg ccgacttcgc tgagtttcaa atacatatcg 6060 taatccaccg cattgctgat gctctcgttg aagccttcgg tgaggttcca tgcacgcgcc 6120 gtgaacatac ggaagtggtg gcagatcatc gcgctcgtga gcttttcgcg gctgtaaatc 6180 ggccagttgt agccattgct aatcaagtta ccttcacgat caatattgcg attggtggtg 6240 tacacgcagg cgaggctcag gtctttgcga aattcatcca gacacagttc cacggcatcg 6300 ggctccagga aatcatcgga atccagctgc ccgatgtaga aaccccggca caggcggact 6360 gcggtattcg aggcggagcc gatgcctttg tttttctggc tgatgaaacg gacgcgcggg 6420 tggtttgcgt aatgttcttg caggatgcgc agcgtatcat cggtgctccc gtcatcgcag 6480 atgcagacct ccagatcggt gatcgtttgg ttcagtgccg attcgacgca gcgcacgata 6540 tatttgctgc aattatacgc ggggatgtag atgctcacca ggggcacacg tttcagggtg 6600 gcgctctcga ttttctcctt cttgcgataa aagtagggca ccttctgctg caacagctgg 6660 acggtaatgt ttttacctgc cgcgcgatcg gtttcgttct ccttaccggg cggttcctga 6720 tgatatgcca tcgcgccttc cacgctacgg aaataacaac cctcgcggta cagccgatag 6780 ccgaactcat tatcctcacc gccccaatgc gtgaactctt cgtcaaacca acccgcgcga 6840 aacagccact tctttgcaaa cgccacattg ccaccgctaa agaaccggaa cggggtgttg 6900 cacaggcgca gattgtcggt attcttgaaa tgttcgatgc gccaatcgac ggatttgttc 6960 tgctcgacct tgcctgcgac ctgattattg gtaataatct ccgggatttc attgatcagg 7020 cttttctggg acaaaaagtc cagataggta tgcttcgacg tgtcgatgta tttacgcggg 7080 ccaatcagtg ccacgttatc atccacggcc aggagttcca tataggactg cacccacaac 7140 gggttcggcg ccatatcgca gtccaagatc gccacgtagt tgtatttcgc tgcccgcagg 7200 cccaggttcc gcacggcgca cagctggtag ccgtagtctt tctggcggac gtatttgatg 7260 ttcagcaacg actcgaactc gcggacgatc tcttcgatgt tttccttgga accgtcatcc 7320 gcgacgatga cctcatagtc ataaatcgtt ttctgattgc agaggcaggc cagggtgatc 7380 gccaggattt tggcgcgatt gtacgtcgga atcacgatgg acaggccgtc gatgatcagt 7440 tgcttgcgcg gataatcatc cagttcttta cgtttccctg cccagacgta gtcgttcgtg 7500 ctttccggca gcggcggcaa ggtcaggtcg ctcggccaat ccagcggaat gggttcgact 7560 tctttcaatt cggcgcgctc ggatttcttt gcggtaattt cccgatattt gctaatgatt 7620 tcattctttt ccacctcatt cagcgagatc gcctttgcat tgctgcacat aattttggtt 7680 gccgcgtcga tatcaatgac cgctttccga ttcagcttgt ccacttcttc gctcagattc 7740 agggcggttt ggcacagctt gatattggct tccacccagc tcacatcata gatttccgcc 7800 actttttcaa acagggagag ggcttggcgg tagttcttat tcttatacag attgattgcc 7860 tggttcaaaa tgctcattta ttaacctcct actagtgaat tttcgaatta cttaccgcag 7920 tacttgacac ccacctggga attgtttttg gtgcgtttga attggcggat ggtacggtag 7980 atgctaaagg gcaggctgat cagaccgagc ggaaaattgt tcttattgat gatgagcttg 8040 cccagctgat agctcaggtg tttcttgacc cgttcggctt cgtgtttatc cgcgtacagg 8100 aagatgctcg gcaggctcac ttggtactcc gaatcatatt tcttcttcca ggtccgccat 8160 tcgctgatca acgcaaacgg aatcgagatc agaccgagga acgtcttgga gcggctcacc 8220 atcaccgcac ccaggcggta gccgatatct tgcttgatgc gttcggccgc accatacagc 8280 tccggcagtt gtttcttttc gagacgttga ttgtcgatga agtactgttc gagcttttgc 8340 tgcaccagat gcagctgatt gagcagcaat tctttttcgc acgacagctt ttcgaggcgc 8400 tgttgttgca gttcattttt gttctgttcc tttttcagca gggactcgaa gttctcgatc 8460 gcgcactcca gttcctggac ctggatggtt ttgtttttaa tgatcagatc atactggatc 8520 agttcttcct tgctatccga cagctctttc agaatggctt gataggcgtt cagctgtttg 8580 gacgtgtgca gttcgttgtc cagaatgatc tttttgctgc tctggtacag accgttcacg 8640 atatcgaggg tgatctggcg ttgtttaatg aacgtctccc aaataaagga cggcttatag 8700 ttttccttct ccagcacccg caagggggtg ttggcgttcg attgcaattc aaagtacagt 8760 tccttgcaat cgggatagtc gttcaggacg ttgaagatca agtactcctc cgtctcgctt 8820 tgcttgaaaa tgatatcccc ggtcccgatg tcaataccgc tgagggacat gatctcctga 8880 tgttcttttt ccagcgtaat ggaggcttcg gcggtcttaa agtcattcac gctctgctcc 8940 agcgagtggt tgatggtatt ggagaacgac aacccgaatt tcagtttcag tttgtgttgc 9000 agttgctgga tgcagtcctc ggcgttgcgc ttcacctgtt cgctcgacac cagcaggcac 9060 cgaccccggt tgttgaggaa gaagtgcagc aaggcggtgt tgtatgccag ccagtttttg 9120 atcagatgct ccgaggtata gttgctggag atgttctggt ccgagaagta gttcgtcagg 9180 atgcttttgg ggtggtcgta gatgaggata aaggtgatgt tctcatccac cgatttccaa 9240 tattccaacg tgtgaattgc gttggggtcg ctccaaccgc acagtttctg gttcaggttg 9300 gacagcatca gatccaatgc gataccgttc cagacggtgc tcacatggag cggttcaaag 9360 tcggcggaat cggtcaccgt atagatgtcc ggcgactggt acgccttccg cagcgtctgg 9420 gtgatgtcct ggggcgagag gttctcacgt ttggacgggc acagggagtt catgccgcgc 9480 tgatgcagga gttcttccac gatttggtag ttgctgctcg gatggcccac gatcaccagg 9540 cggttcattt attaacctcc tttcgaaaat gaacggtccg ttaaatatag ccattcggat 9600 tcttcatctg ccagcgccag gcgtcctcca gcatggtttc gagttcccgc ttggctttcc 9660 agttcagata tttgttggcc ttttcggggg aggaccagct ctccgcgata tcaccgtcac 9720 ggcggctcac gatttcatac ggaatccgca cgccggaaat cttttcaaag gtggacacca 9780 gttccagcac cgaataacct ttacccgtgc ccaaattaaa gacgtggtag ttggtgttat 9840 tgtcgcggaa gagataggac agcgctgcga cgtgcccttc ggccaggtcc atcacatgga 9900 tatagtcacg gacccccgtg ccgtctttgg tgggataatc accaccgaac accatcagtt 9960 tttccagttt ccccatcgcg acctgcaaga tgtacggcac caagttggag gggatgtctg 10020 ccgggctttc accaatcata ccggattcgt gggcgcccgt cggattaaag tagcgcaagc 10080 agaggaaatt cgtgtcggag tatttcttgg cgatgtcgcg gatcatcagc tccgagatgt 10140 acttggacgt accatacgga ttcagcgtgc caccaatatg gcagtcttcg gtgacgggca 10200 tgatcttgct ttccccatac accgtcgccg acgagctaaa gatgaagttg gcgacgtcgt 10260 tcttgatggc gcaattgatg agttgcaggg tgccgctcac gttgttgtca tagtagaaga 10320 tgggcttgat caggctttct gcgaccgatt tcgcacctgc aaagtgcatg atgcagtcga 10380 atttgtgttt cttcaggatc tggttcactt ccttctcgtt gttgatattg agttcgtaga 10440 acgtgacttt cttctttgcg atcagctcaa tgcgacggat gctttcgcag ctgctgttga 10500 tgagattgtc aatgatgacg acattgtagc ctttgttcag caggcagagc gacgtgtggc 10560 tgccgatgta gcctgcaccg ccggtgacca ggatgttcat ttattaacct cctcggtccg 10620 aattaaccta ggttatgagg tcagcattgc ttcttcacgc ggtgttaatt aagtaatcga 10680 tagtgattta aatatgcaag atctagttac ctgcaggatt attgtttctg ttgcataaag 10740 cctaaggggt aggcctttct agagatagcc attttttgca ctcctgtatc cgcttcttgc 10800 aaggctggac ttatccctat caaaccggac actgcaggct gacaagcttt cattacatat 10860 gaagagtttg tagaaacgca aaaaggccat ccgtcaggat ggccttctaa gaaggctcga 10920 gtggcgcgcc gcggccgcca agacggtatt cgggctgcac cgtggacatt gccagcgggt 10980 ccggatgcgg cagcgaagac gccatctccg ggccggtgct gcaagcgccc agcgacatcg 11040 agcagagcag agccaggctg aggccttggc agagtcgtcc gatcagtttc ttcatgcgtg 11100 tagctggctg cctctgttgg gtgggacagg acctcgcgca gcattcaacc ggctcaggcg 11160 ccagcacgaa cgtacgacag gaagttgcat cccgacgcgt gccgggacca acgttgaatc 11220 gcgtgttgca gtgcactatg gcatagaacg aacacatcgc aaggcacaac acgccatttt 11280 tttgacggcg ttggcctatt gattcaagtt cgtcgcctcg acgttaagag aacgtgacct 11340 gggtcgtcat tctcagcata cgaactctag cgtttccggg cacttacgga cgcctgctga 11400 tcccgacttg tagcagcctg aaccgcgaaa taattgcgta caggacttgc atatgccgcc 11460 ttgcaatatg ccgttgcgca tagtggcata gcctggaatg ccatcgaact gacatgttgc 11520 gacgcaacaa aaaggcccac gtcttgcgac gtaggcctgt tgtttggtcg gggtagccgg 11580 attcgaaccg acgaccacta gtcccccaga ctagtgcgct accaggctgc gctatacccc 11640 gaagatgttg cgtcccgccc tgaggcggcc tgcgattata gcggctttat gcggcgcttt 11700 cctagcgtcg cagcagctgc aggacttctt caagctccat gcgcacctgc ttgatgatct 11760 gattgctcag cgctgactcg ctcttggccc catccccttc aagacgcaga cgcgcgcccc 11820 cgatggtgta accctgctcg tacagcaggc cacgaatctg ccgcaccatc agcacatcgt 11880 gccgctggta gtagcgtcgg ttgccgcgcc gcttgactgg ctccaggctc ggaaattcgg 11940 tttcccaata gcgcagcacg tgcggcttga cgtcgcacag ctcgctcacc tcaccgatgg 12000 tgaagtagcg cttggccgga atcggcggta gctcgcgatt actgcccgga tccagcataa 12060 gcctccaccc gttccttgag tttctggccg gggcggaagg tcaccaccgt cctggccgag 12120 atcggaattt cctcaccggt cttgggattg cgaccgggcc gttggttctt gcgccgcaga 12180 tcgaagttgc cgaagcccga caacttcacc tgacggccct gctccagtgc atcgcgcagc 12240 acatcgaaaa acgcgtcgac gaattccttc gcctcacgct tgttcaggcc gacttcgtcg 12300 aacagacgct cggccatctc cgctttcgtc aatgccatgc caatcccctg ttaccgccag 12360 atctgaattc agctgtacaa ttggtaccat ggatgcatat ggcggccggg ccctacgtac 12420 gcgtgttaac cggtgagctc actagaggat ccagccgacc aggctttcca cgcccgcgtg 12480 ccgctccatg tcgttcgcgc ggttctcgga aacgcgctgc cgcgtttcgt gattgtcacg 12540 ctcaagcccg tagtcccgtt cgagcgtcgc gcagaggtca gcgagggcgc ggtaggcccg 12600 atacggctca tggatggtgt ttcgggtcgg gtgaatcttg ttgatggcga tatggatgtg 12660 caggttgtcg gtgtcgtgat gcacggcact gacgcgctga tgctcggcga agccaagccc 12720 agcgcagatg cggtcctcaa tcgcgcgcaa cgtctccgcg tcgggcttct ctcccgcgcg 12780 gaagctaacc agcaggtgat aggtcttgtc ggcctcggaa cgggtgttgc cgtgctgggt 12840 cgccatcacc tcggccatga cagcgggcag ggtgtttgcc tcgcagttcg tgacgcgcac 12900 gtgacccagg cgctcggtct tgccttgctc gtcggtgatg tacttcacca gctccgcgaa 12960 gtcgctcttc ttgatggagc gcatggggac gtgcttggca atcacgcgca ccccccggcc 13020 gttttagcgg ctaaaaaagt catggctctg ccctcgggcg gaccacgccc atcatgacct 13080 tgccaagctc gtcctgcttc tcttcgatct tcgccagcag ggcgaggatc gtggcatcac 13140 cgaaccgcgc cgtgcgcggg tcgtcggtga gccagagttt cagcaggccg cccaggcggc 13200 ccaggtcgcc attgatgcgg gccagctcgc ggacgtgctc atagtccacg acgcccgtga 13260 ttttgtagcc ctggccgacg gccagcaggt aggccgacag gctcatgccg gccgccgccg 13320 ccttttcctc aatcgctctt cgttcgtctg gaaggcagta caccttgata ggtgggctgc 13380 ccttcctggt tggcttggtt tcatcagcca tccgcttgcc ctcatctgtt acgccggcgg 13440 tagccggcca gcctcgcaga gcaggattcc cgttgagcac cgccaggtgc gaataaggga 13500 cagtgaagaa ggaacacccg ctcgcgggtg ggcctacttc acctatcctg cccggctgac 13560 gccgttggat acaccaagga aagtctacac gaaccctttg gcaaaatcct gtatatcgtg 13620 cgaaaaagga tggatatacc gaaaaaatcg ctataatgac cccgaagcag ggttatgcag 13680 cggaaaagcg ctgcttccct gctgttttgt ggaatatcta ccgactggaa acaggcaaat 13740 gcaggaaatt actgaactga ggggacaggc gagagacgat gccaaagagc tacaccgacg 13800 agctggccga gtgggttgaa tcccgcgcgg ccaagaagcg ccggcgtgat gaggctgcgg 13860 ttgcgttcct ggcggtgagg gcggatgtcg aggcggcgtt agcgtccggc tatgcgctcg 13920 tcaccatttg ggagcacatg cgggaaacgg ggaaggtcaa gttctcctac gagacgttcc 13980 gctcgcacgc caggcggcac atcaaggcca agcccgccga tgtgcccgca ccgcaggcca 14040 aggctgcgga acccgcgccg gcacccaaga cgccggagcc acggcggccg aagcaggggg 14100 gcaaggctga aaagccggcc cccgctgcgg ccccgaccgg cttcaccttc aacccaacac 14160 cggacaaaaa ggatccccaa ttctcatgtt tgacagctta tcatcgataa gctttaatgc 14220 ggtagtttat cacagttaaa ttgctaacgc agtcaggcac cgtgtatgaa atctaacaat 14280 gcgctcatcg tcatcctcgg caccgtcacc ctggatgctg taggcatagg cttggttatg 14340 ccggtactgc cgggcctctt gcgggatatc gtccattccg acagcatcgc cagtcactat 14400 ggcgtgctgc tagcgctata tgcgttgatg caatttctat gcgcacccgt tctcggagca 14460 ctgtccgacc gctttggccg ccgcccagtc ctgctcgctt cgctacttgg agccactatc 14520 gactacgcga tcatggcgac cacacccgtc ctgtggatcc tctacgccgg acgcatcgtg 14580 gccggcatca ccggcgccac aggtgcggtt gctggcgcct atatcgccga catcaccgat 14640 ggggaagatc gggctcgcca cttcgggctc atgagcgctt gtttcggcgt gggtatggtg 14700 gcaggccccg tggccggggg actgttgggc gccatctcct tgcatgcacc attccttgcg 14760 gcggcggtgc tcaacggcct caacctacta ctgggctgct tcctaatgca ggagtcgcat 14820 aagggagagc gtcgaccgat gcccttgaga gccttcaacc cagtcagctc cttccggtgg 14880 gcgcggggca tgactatcgt cgccgcactt atgactgtct tctttatcat gcaactcgta 14940 ggacaggtgc cggcagcgct ctgggtcatt ttcggcgagg accgctttcg ctggagcgcg 15000 acgatgatcg gcctgtcgct tgcggtattc ggaatcttgc acgccctcgc tcaagccttc 15060 gtcactggtc ccgccaccaa acgtttcggc gagaagcagg ccattatcgc cggcatggcg 15120 gccgacgcgc tgggctacgt cttgctggcg ttcgcgacgc gaggctggat ggccttcccc 15180 attatgattc ttctcgcttc cggcggcatc gggatgcccg cgttgcaggc catgctgtcc 15240 aggcaggtag atgacgacca tcagggacag cttcaaggat cgctcgcggc tcttaccagc 15300 ctaacttcga tcactggacc gctgatcgtc acggcgattt atgccgcctc ggcgagcaca 15360 tggaacgggt tggcatggat tgtaggcgcc gccctatacc ttgtctgcct ccccgcgttg 15420 cgtcgcggtg catggagccg ggccacctcg acctgaatgg aagccggcgg cacctcgcta 15480 acggattcac cactccaaga attggagcca atcaattctt gcggagaact gtgaatgcgc 15540 aaaccaaccc ttggcagaac atatccatcg cgtccgccat ctccagcagc cgcacgcggc 15600 gcatctcggg cagcgttggg tcctggccac gggtgcgcat gatcgtgctc ctgtcgttga 15660 ggacccggct aggctggcgg ggttgcctta ctggttagca gaatgaatca ccgatacgcg 15720 agcgaacgtg aagcgactgc tgctgcaaaa cgtctgcgac ctgagcaaca acatgaatgg 15780 tcttcggttt ccgtgtttcg taaagtctgg aaacgcggaa gtcagcgctc ttccgcttcc 15840 tcgctcactg actcgctgcg ctcggtcgtt cggctgcggc gagcggtatc agctcactca 15900 aaggcggtaa tacggttatc cacagaatca ggggataacg caggaaagaa catgtgagca 15960 aaaggccagc aaaaggccag gaaccgtaaa aaggccgcgt tgctggcgtt tttccatagg 16020 ctccgccccc ctgacgagca tcacaaaaat cgacgctcaa gtcagaggtg gcgaaacccg 16080 acaggactat aaagatacca ggcgtttccc cctggaagct ccctcgtgcg ctctcctgtt 16140 ccgaccctgc cgcttaccgg atacctgtcc gcctttctcc cttcgggaag cgtggcgctt 16200 tctcatagct cacgctgtag gtatctcagt tcggtgtagg tcgttcgctc caagctgggc 16260 tgtgtgcacg aaccccccgt tcagcccgac cgctgcgcct tatccggtaa ctatcgtctt 16320 gagtccaacc cggtaagaca cgacttatcg ccactggcag cagccactgg taacaggatt 16380 agcagagcga ggtatgtagg cggtgctaca gagttcttga agtggtggcc taactacggc 16440 tacactagaa ggacagtatt tggtatctgc gctctgctga agccagttac cttcggaaaa 16500 agagttggta gctcttgatc cggcaaacaa accaccgctg gtagcggtgg tttttttgtt 16560 tgcaagcagc agattacgcg cagaaaaaaa ggatctcaag aagatccttt gatcttttct 16620 acggggtctg acgctcagtg gaacgaaaac tcacgttaag ggattttggt catgagatta 16680 tcaaaaagga tcttcaccta gatcctttta aattaaaaat gaagttttaa atcaatctaa 16740 agtatatatg agtaaacttg gtctgacag 16769 <210> 147 <211> 26002 <212> DNA <213> Artificial Sequence <220> <223> synthetic plasmid pKM012 <400> 147 ttaccaatgc ttaatcagtg aggcacctat ctcagcgatc tgtctatttc gttcatccat 60 agttgcctga ctccccgtcg tgtagataac tacgatacgg gagggcttac catctggccc 120 cagtgctgca atgataccgc gagacccacg ctcaccggct ccagatttat cagcaataaa 180 ccagccagcc ggaagggccg agcgcagaag tggtcctgca actttatccg cctccatcca 240 gtctattaat tgttgccggg aagctagagt aagtagttcg ccagttaata gtttgcgcaa 300 cgttgttgcc attgctacag gcatcgtggt gtcacgctcg tcgtttggta tggcttcatt 360 cagctccggt tcccaacgat caaggcgagt tacatgatcc cccatgttgt gcaaaaaagc 420 ggttagctcc ttcggtcctc cgatcgttgt cagaagtaag ttggccgcag tgttatcact 480 catggttatg gcagcactgc ataattctct tactgtcatg ccatccgtaa gatgcttttc 540 tgtgactggt gagtactcaa ccaagtcatt ctgagaatag tgtatgcggc gaccgagttg 600 ctcttgcccg gcgtcaatac gggataatac cgcgccacat agcagaactt taaaagtgct 660 catcattgga aaacgttctt cggggcgaaa actctcaagg atcttaccgc tgttgagatc 720 cagttcgatg taacccactc gtgcacccaa ctgatcttca gcatctttta ctttcaccag 780 cgtttctggg tgagcaaaaa caggaaggca aaatgccgca aaaaagggaa taagggcgac 840 acggaaatgt tgaatactca tactcttcct ttttcaatat tattgaagca tttatcaggg 900 ttattgtctc atgagcggat acatatttga atgtatttag aaaaataaac aaataggggt 960 tccgcgcaca tttccccgaa aagtgccacc tgacgtctag atctcctacc gaccaggcat 1020 tggcgcgttc caccatcgtc ggcaaatcgc gttcgacagt caccagaatg ctgcgaaagc 1080 acgcagtgtc gtccataccg cccgcacgga aatccttgat cgcctgccgc gggttgtcga 1140 tcttgtattc gagcgtggtc gaggtcggct tgataccggc gcgcttggca gcgcgctcca 1200 ccaccgacca gatcaccggc gagcgggcca ggccagagcg tttgagcgca gcctgataca 1260 actcgccggc agccagcatc ggccgcttgc gctccacgcc acggtcgcgc cccatgtaac 1320 gcgccttggc aacggtccag cgcgcataca actcaggcgg cagcacatcg cgcagctcac 1380 gcccgtcttc gttcttcatc gccttcatcg ccgcgggcat cagggccaat ttgccgaaca 1440 tgccaacgtc ggcatccacc tgcaccatcg gcgccatcag cacctgctgc gattggccga 1500 tgatggtttc gacctcggtc gcttgccact ccaggtcctt cggcaacggt gacaacgtgc 1560 ccaggatcca cagcacgtgg tcgcccttgc tgaccttcca caggccgggg ccgggttgct 1620 gcccgcgcac caccatggct tccagatcga ccaccgttgg cggcgctgcc ggcgcctgta 1680 cggccacctc gacggcacac gccagcatcg gtgccaacaa cgacaccaac gcgattcctg 1740 cccgccacac cgcccccctg cgctgcatca cgtaccgcct cccggttgga acgcggacac 1800 tacgcgaacg cgggcccgca cgcgttaggg aagcgttggc ggctccggcg cggcgccttc 1860 ggcaaccaac gcggccagct gtgccgccag cggcgagccg tcttcgagca gcgcgaaacc 1920 ttcccagaca aaccctggcg aaaccgtgca gcccaccagg gtgaagtccc ccagcgagcg 1980 cgccgcctgc cagcagccgg ccggcaccac gtgcatggcg tcgccgcgct ctgcggcgtc 2040 cagcacttcg cgccgcaact gcccgctcgc ttcgtcgaag atcagcaact ccagcggcgc 2100 accttgctgc cagtgccagc actcctcggc atccacccga tgccagcgac tggcttcgcc 2160 tgcgcacaac aggaagcgga tggcggtcag cgccggacgc ggcggcgcac cgctgtcatc 2220 cagcacctgg cgcgtcgacg cgtacacgcg ccggtagtgg ccgccctccg gatggggggc 2280 aaggcccaat gttcgaatca gcgcggcggc ggttggatgc atgcacgcat gctaggccac 2340 acaccgccgc cgtgcatcac gccagctgtt tgcccgcacg caggcaggtg cggaagaaca 2400 ccagcagatc gcggccgcct cgacgctctc ccttatgcga ctcctgcatt aggaagcagc 2460 ccagtagtag gttgaggccg ttgagcaccg ccgccgcaag gaatggtgca tgcaaggaga 2520 tggcgcccaa cagtcccccg gccacggggc ctgccaccat acccacgccg aaacaagcgc 2580 tcatgagccc gaagtggcga gcccgatctt ccccatcggt gatgtcggcg atataggcgc 2640 cagcaaccgc acctgtggcg ccggtgatgc cggccacgat gcgtccggcg tacaagatcc 2700 acaggacggg tgtggtcgcc atgatcgcgt agtcgatagt ggctccaagt agcgaagcga 2760 gcaggactgg gcggcggcca aagcggtcgg acagtgctcc gagaacgggt gcgcatagaa 2820 attgcatcaa cgcatatagc gctagcagca cgccatagtg actggcgatg ctgtcggaat 2880 ggacgatatc ccgcaagagg cccggcagta ccggcataac caagcctatg cctacagcat 2940 ccagggtgac ggtgccgagg atgacgatga gcgcattgtt agatttcata cacggtgcct 3000 gactgcgtta gcaatttaac tgtgataaac taccgcatta aagccgagcg atgataagct 3060 gtcaaacatg agatccgata aatcgattga tagatttaaa taagaactgc agaagctagc 3120 ttagatgctc gtgaaattga cgtgggcgct ttgcagggcc gtcttaatgg cgttggtgtc 3180 cacgaggatc gagtcgggtg cggaaaacgg acggttcttg ttggtgaaat cgctgttacc 3240 aatgtacagc gattccttgt tacgcagcgc ctggatgtgc cagcgggacc acgaatccca 3300 atacttctgg cgatccggcg agataccttg gctggtgtag ccggtcgtcg ggctgttcat 3360 caacgagtcg gtgcggtgcg agcccagcgt cagcggcaac ttgatccgat gcaccgtgga 3420 atcgccgaag atcagcttca gacgcgcgat aaattcgcta tccgcacccg ttttcacaca 3480 atcccagaca ccggccttct gcaagacgtc ggcacggcga aacaggagcg acgacggatt 3540 cagacgcttc aaggggtaca ctgcgcgggc atagaaaata ccgttgtctt gcaggcgcac 3600 ccagtccgag atggagcaga tgagcttcgg attgagcaac aagggggaga tttggcggaa 3660 cagcttttcc ggatggctcc agtcatccga atcgtggcag gtgacgaact cgcccttcgc 3720 ttggatcaag ccgatacgct tcgcggcata ggtgccgaca ttctgcggca ggctaatgat 3780 cttgatgcgc gtgtctttga gggcgagccg ctggagacga aacagggtgt catcggtgct 3840 cgcgtcatcc acaatgatca gctcgaagga acggtaggtc tgattgagga gcgaaatcac 3900 cgcattttcc acgcggcgac ccgtattata ggtggtcatc aggatggaga tcaacggccc 3960 cgtctgggcc gggtacggga tgctggtgat gatgttgcac ggggagagcg gggagctgtt 4020 gtccgtcaag gccacggggc tgaggccgaa gtatttatag tattcattca gccgattcag 4080 gctaatttcg gcggtttcgc ggaaggcgtt attttgcagc agcaggatat ccgggctata 4140 gacgatatcg gatgcgtcga tctgggcgag ggtcgagatg gccttttggg tcaggccgat 4200 ccggagttgc agtgcggtat acaggtccag cgggcagttg tccacgttgt ccaacaggct 4260 caggctaaag gtcggcgagt aggacgccag ggttttcgcc agttccactt tctgatgggt 4320 atcggtgaac tcgtccttga actccatcag cagctcgggc gtcaggctga tgtcgccgca 4380 ggcgattttt gcgatcttga ttgccagttt gcagcgccaa tcggacgggg tatccgtcaa 4440 gttatgcagc gaccagtaca tattcagacg atacatcgcg aggatgcgtt tcgactgcca 4500 gaaccggcaa tcatcctgga tggccgcgag cgcgtggacg tagcggctct ttttgagcag 4560 ccacaagaat ttgagattat tgaacattta ttaacctcct gctagcaact taagttacga 4620 atcgacgccg aacaggtcgc gggtgtagac tttctccgag acatcttcca gttcgctggt 4680 gcggcgattc gccacaatga catcgacgcg ctccttaaag gaattgatgt cgcgctcgac 4740 gtaggaaccg aagaagtagg gttctttcag gaccggctcg tacaccacaa tctcgatacc 4800 cttggccttc aaacgtttca tgaccccctg gatgctgctg gcccggaaat tgtcgctacc 4860 cgccttcatg atcaggcgat agataccgac cactttgggc ttacgggaca ggatgtcctc 4920 ggccacgaag tccttacggg tcgtattcgc atccacgatg gcctggatca ggttttgcgg 4980 gacgtcgcga taattggcca acagctgctt cgtatccttc ggcagacagt aaccgccgta 5040 gccgaaggac gggttgttgt aatgttgacc aatgcgcgga tcgagggaga cgccttcgat 5100 gatttgtttg gtatccaggc cgtgcacgct cgcgtaggtg tccagctcgt taaagtacgc 5160 gatacgcatc gccagatacg tgttcgcgaa cagtttgatg gcttctgcct cgggcgaatc 5220 cgtcagcagg atcggaatat cctttttgat ggcaccttcc gacaggagtt cggcgaactt 5280 ccgtgcgcgt tccgacgatt cgcccacgac aatgcggctc ggatagagat tatcatacag 5340 ggctttgcct tcgcgcagga actccgggga aaagatgata ttattcgtgt tcagatcgcg 5400 cttcaggcgt tcggtgaacc cgacggggac ggtggatttg ataatgatgg tcgcgttcgg 5460 gttaatggac agcacgtcac acgcgacgct ttcgacgctc agggtatcaa agttgttatt 5520 aatcggatca tagttcgtcg gggtggcgat gatcacgtag tctgcatcgc gatatgcctc 5580 gtatttttcc gtcgtcgcgt agaggttcag cttacgattg gagagaaact tctggatttc 5640 cgggtcgcaa atcggcgaga ttttcttgtt aatgagctgg accttcttcg ggtcgatgtc 5700 cagggcgatg atgtcgtgtt tttgggagag gaggatcgca atgctgatac ccacatagcc 5760 gacgccggcc acggcaattt tcatttatta acctccttaa gtgaattcaa actagtttac 5820 aagtcgtttt cgatcttctc ccaggtatat ttgcgacatt cattcaagtt ggtcagcggc 5880 gagtatttgt actttttgat accgaggcgc gacaggcttt cgttcaccac cttgaaatgg 5940 ttttcctttt ggatgtccag tttcttgatc gacgtgttct cgccgtgcag gacacggttg 6000 tagcaaatct tattgatatg cttaaacggg ccgacttcgc tgagtttcaa atacatatcg 6060 taatccaccg cattgctgat gctctcgttg aagccttcgg tgaggttcca tgcacgcgcc 6120 gtgaacatac ggaagtggtg gcagatcatc gcgctcgtga gcttttcgcg gctgtaaatc 6180 ggccagttgt agccattgct aatcaagtta ccttcacgat caatattgcg attggtggtg 6240 tacacgcagg cgaggctcag gtctttgcga aattcatcca gacacagttc cacggcatcg 6300 ggctccagga aatcatcgga atccagctgc ccgatgtaga aaccccggca caggcggact 6360 gcggtattcg aggcggagcc gatgcctttg tttttctggc tgatgaaacg gacgcgcggg 6420 tggtttgcgt aatgttcttg caggatgcgc agcgtatcat cggtgctccc gtcatcgcag 6480 atgcagacct ccagatcggt gatcgtttgg ttcagtgccg attcgacgca gcgcacgata 6540 tatttgctgc aattatacgc ggggatgtag atgctcacca ggggcacacg tttcagggtg 6600 gcgctctcga ttttctcctt cttgcgataa aagtagggca ccttctgctg caacagctgg 6660 acggtaatgt ttttacctgc cgcgcgatcg gtttcgttct ccttaccggg cggttcctga 6720 tgatatgcca tcgcgccttc cacgctacgg aaataacaac cctcgcggta cagccgatag 6780 ccgaactcat tatcctcacc gccccaatgc gtgaactctt cgtcaaacca acccgcgcga 6840 aacagccact tctttgcaaa cgccacattg ccaccgctaa agaaccggaa cggggtgttg 6900 cacaggcgca gattgtcggt attcttgaaa tgttcgatgc gccaatcgac ggatttgttc 6960 tgctcgacct tgcctgcgac ctgattattg gtaataatct ccgggatttc attgatcagg 7020 cttttctggg acaaaaagtc cagataggta tgcttcgacg tgtcgatgta tttacgcggg 7080 ccaatcagtg ccacgttatc atccacggcc aggagttcca tataggactg cacccacaac 7140 gggttcggcg ccatatcgca gtccaagatc gccacgtagt tgtatttcgc tgcccgcagg 7200 cccaggttcc gcacggcgca cagctggtag ccgtagtctt tctggcggac gtatttgatg 7260 ttcagcaacg actcgaactc gcggacgatc tcttcgatgt tttccttgga accgtcatcc 7320 gcgacgatga cctcatagtc ataaatcgtt ttctgattgc agaggcaggc cagggtgatc 7380 gccaggattt tggcgcgatt gtacgtcgga atcacgatgg acaggccgtc gatgatcagt 7440 tgcttgcgcg gataatcatc cagttcttta cgtttccctg cccagacgta gtcgttcgtg 7500 ctttccggca gcggcggcaa ggtcaggtcg ctcggccaat ccagcggaat gggttcgact 7560 tctttcaatt cggcgcgctc ggatttcttt gcggtaattt cccgatattt gctaatgatt 7620 tcattctttt ccacctcatt cagcgagatc gcctttgcat tgctgcacat aattttggtt 7680 gccgcgtcga tatcaatgac cgctttccga ttcagcttgt ccacttcttc gctcagattc 7740 agggcggttt ggcacagctt gatattggct tccacccagc tcacatcata gatttccgcc 7800 actttttcaa acagggagag ggcttggcgg tagttcttat tcttatacag attgattgcc 7860 tggttcaaaa tgctcattta ttaacctcct actagtgaat tttcgaatta cttaccgcag 7920 tacttgacac ccacctggga attgtttttg gtgcgtttga attggcggat ggtacggtag 7980 atgctaaagg gcaggctgat cagaccgagc ggaaaattgt tcttattgat gatgagcttg 8040 cccagctgat agctcaggtg tttcttgacc cgttcggctt cgtgtttatc cgcgtacagg 8100 aagatgctcg gcaggctcac ttggtactcc gaatcatatt tcttcttcca ggtccgccat 8160 tcgctgatca acgcaaacgg aatcgagatc agaccgagga acgtcttgga gcggctcacc 8220 atcaccgcac ccaggcggta gccgatatct tgcttgatgc gttcggccgc accatacagc 8280 tccggcagtt gtttcttttc gagacgttga ttgtcgatga agtactgttc gagcttttgc 8340 tgcaccagat gcagctgatt gagcagcaat tctttttcgc acgacagctt ttcgaggcgc 8400 tgttgttgca gttcattttt gttctgttcc tttttcagca gggactcgaa gttctcgatc 8460 gcgcactcca gttcctggac ctggatggtt ttgtttttaa tgatcagatc atactggatc 8520 agttcttcct tgctatccga cagctctttc agaatggctt gataggcgtt cagctgtttg 8580 gacgtgtgca gttcgttgtc cagaatgatc tttttgctgc tctggtacag accgttcacg 8640 atatcgaggg tgatctggcg ttgtttaatg aacgtctccc aaataaagga cggcttatag 8700 ttttccttct ccagcacccg caagggggtg ttggcgttcg attgcaattc aaagtacagt 8760 tccttgcaat cgggatagtc gttcaggacg ttgaagatca agtactcctc cgtctcgctt 8820 tgcttgaaaa tgatatcccc ggtcccgatg tcaataccgc tgagggacat gatctcctga 8880 tgttcttttt ccagcgtaat ggaggcttcg gcggtcttaa agtcattcac gctctgctcc 8940 agcgagtggt tgatggtatt ggagaacgac aacccgaatt tcagtttcag tttgtgttgc 9000 agttgctgga tgcagtcctc ggcgttgcgc ttcacctgtt cgctcgacac cagcaggcac 9060 cgaccccggt tgttgaggaa gaagtgcagc aaggcggtgt tgtatgccag ccagtttttg 9120 atcagatgct ccgaggtata gttgctggag atgttctggt ccgagaagta gttcgtcagg 9180 atgcttttgg ggtggtcgta gatgaggata aaggtgatgt tctcatccac cgatttccaa 9240 tattccaacg tgtgaattgc gttggggtcg ctccaaccgc acagtttctg gttcaggttg 9300 gacagcatca gatccaatgc gataccgttc cagacggtgc tcacatggag cggttcaaag 9360 tcggcggaat cggtcaccgt atagatgtcc ggcgactggt acgccttccg cagcgtctgg 9420 gtgatgtcct ggggcgagag gttctcacgt ttggacgggc acagggagtt catgccgcgc 9480 tgatgcagga gttcttccac gatttggtag ttgctgctcg gatggcccac gatcaccagg 9540 cggttcattt attaacctcc tttcgaaaat gaacggtccg ttaaatatag ccattcggat 9600 tcttcatctg ccagcgccag gcgtcctcca gcatggtttc gagttcccgc ttggctttcc 9660 agttcagata tttgttggcc ttttcggggg aggaccagct ctccgcgata tcaccgtcac 9720 ggcggctcac gatttcatac ggaatccgca cgccggaaat cttttcaaag gtggacacca 9780 gttccagcac cgaataacct ttacccgtgc ccaaattaaa gacgtggtag ttggtgttat 9840 tgtcgcggaa gagataggac agcgctgcga cgtgcccttc ggccaggtcc atcacatgga 9900 tatagtcacg gacccccgtg ccgtctttgg tgggataatc accaccgaac accatcagtt 9960 tttccagttt ccccatcgcg acctgcaaga tgtacggcac caagttggag gggatgtctg 10020 ccgggctttc accaatcata ccggattcgt gggcgcccgt cggattaaag tagcgcaagc 10080 agaggaaatt cgtgtcggag tatttcttgg cgatgtcgcg gatcatcagc tccgagatgt 10140 acttggacgt accatacgga ttcagcgtgc caccaatatg gcagtcttcg gtgacgggca 10200 tgatcttgct ttccccatac accgtcgccg acgagctaaa gatgaagttg gcgacgtcgt 10260 tcttgatggc gcaattgatg agttgcaggg tgccgctcac gttgttgtca tagtagaaga 10320 tgggcttgat caggctttct gcgaccgatt tcgcacctgc aaagtgcatg atgcagtcga 10380 atttgtgttt cttcaggatc tggttcactt ccttctcgtt gttgatattg agttcgtaga 10440 acgtgacttt cttctttgcg atcagctcaa tgcgacggat gctttcgcag ctgctgttga 10500 tgagattgtc aatgatgacg acattgtagc ctttgttcag caggcagagc gacgtgtggc 10560 tgccgatgta gcctgcaccg ccggtgacca ggatgttcat ttattaacct cctcggtccg 10620 aattaaccta ggttatgagg tcagcattgc ttcttcacgc gtttagtagt tgttttgttc 10680 ggtgatatat tcttcaatgc cttcttgcac gtcttcatgg aacgacacgg cgttgtcgtc 10740 tttaaacacg attgccacat cgcagaactc tttcaacgag ttcagcgagt gcgacaccat 10800 gaggaaggag ctttccttat gacgctcctt gaagagttgg gcacattttt ccttgaaacg 10860 ggcgtccccc accgccgtca cctcgtccac gatgtagtaa tcgaacttga acgccatgct 10920 caggccgaag ccgaggcggc tgcgcatacc gctcgaatag gtcttgatcg gcatatcaaa 10980 atacttcccc agctccgcga actcttccac aaactcaatc ttttctttca gctcctcctg 11040 cttcgcgtac agccgggcca cgaacttcac gttttcacgc ccggtcaagc tgccctggaa 11100 gccgcctgcc agacccaccg gccacgagat cgttttattc gtgatgattt taccgctatc 11160 cgggcggtcg atgcccccaa tcatgcgcaa cagcgtggat ttacccgccc cattgcgccc 11220 gatgaacgcc acgcttttgc cgctggggat ctcaatgttc aggttcttga agacatagtg 11280 acggcccacc ggggtgcggt agcttttcgt caggttttcg atcttaatca tgaggtcaac 11340 attgcctcct cacgcgtacg gtacagggcc aaaccaataa acagggtcac cagggtgaac 11400 attgccagat aattcaggct gaccccttcg ctgatataac cgggcatcac ggcctcgcgg 11460 ctcagttcga cgacgtgcac caggggattc cacagcaggt acgaccaata ctgcttcgga 11520 atggagtgca gcgggaacat gatgcacgaa ataaagtaca gcggcttcag caagatcggc 11580 aagactttct gcatttcggg gaacgtcttg cccacgacca tgaagatcag gcccacaccg 11640 cacgacagga tgatcaggag gctccaggtg agcacaaatt gcaggaagtt ggtaatctcg 11700 aaatattcgc ccgccatcca gatgatcagc atcaggagga tgtagaccgc cacatagatc 11760 agcgtttcca agagggcgcg tgcaatgatc gtgtcgatcg gcttcacggg ccggtagtta 11820 aacagcccct gattggcttc gatggcgccc acggagcgat tgctgatgct gctgaaaata 11880 aagaacggga tcaggccatt gagcaggaac accgggaagg agatatccgg catggtgcga 11940 tgcatgatat agccaaagat cccgagcaga atcagcagat gtgcgctcgg ttccaggatc 12000 gcccacagat agcccaggcg aaacttgcca aagcgcgtac ggatttcgcg gagaaacagt 12060 gcttcgaccg tcactttctg gacttcaaaa cccgaacgtg ccatttatta acctcctggt 12120 accaatctag attgtttaaa cagatccaat ctagattgtt taaacttctg cagaacacgc 12180 ggtgttaacg tttcttatac ttcttaattt tgttaaagat catttcgccg tagtacaccg 12240 cattgacctg ggtcttcacc agcaagtagc cgcgaaattt cttaaacaac ttcatgttcg 12300 gtttaaagtc ggcttgccag aactgatgca aatgcccctg gtacgtcaga cccttgatat 12360 cgtacaaggc gttgcccatg actttcaggg gcttgttgtg gatcaacgcg gaaatgccgg 12420 ccgtgctatt gatggtgacc accgctttgg cgtggcgcaa cagctccggc atgggcagat 12480 cgtgcacata gatgacacgt tcatccaaac cgtattcctt cgacagacgc ttgatcaacg 12540 ggcggtacag gcggtgcccg cgatccatcg ggtgatgttt gatcaccaga taggactcct 12600 tgggggcctt gcgggaaaag ctgtacatca cttcgttgat gtaatcacgc acatcattat 12660 agttgctatg gttgcggatc tggctgtcgt tgtacacttg caggaccgcc aggtaatagc 12720 gctgatccag ctcgttcatc aggcggggga ggaccttgcg ttgggtgacc ttatacagct 12780 gtttgcgcca gtaggcgcgg acccagcagc gcgcttcata ccacgggctg aacgatttgt 12840 ggtggcgata gcgcggaaat tcgtgacgat agtgccaacc catcaggtaa taccacatgg 12900 cgtggccgat gcgcttcatg gtgctcggtt tcaggttctc gacgtgcggc gtcggcatat 12960 cgggcaattt gcggtaaaag tccggatcgc ggggcaagct gctataggcg ttcacaccgc 13020 cttcttccac ggtgataaat tgcggacgca ggtagccttc ctcgaaggcc agaaaacgaa 13080 tccccttcga cttggcccag cgtttggcct ccttgtgcag caggcggcag tcaccgaaac 13140 acaaaatcgt gtcaaagtca tactgacgat gcaagtcccg cagccaaccg gggaactcct 13200 tcggggtttg gtagtacgcc aggtattggc ggtggcggca gtagaagcga tcaccgccat 13260 taaagacgac gttgaccgcg ttgcgaccga ggctctccaa ccattccgcc acatcgttga 13320 agaacggacc catcggacct tggagcagga ggtacttttt accgctcaac agcaccgtca 13380 gcgcattgcc gtgcatttat taacctccta acacgcggtg ttaagcgttt tcggcgagct 13440 cttaaccaaa gcgcactttg cagaacatga tcaacttgcg atagtagcga atcacacggc 13500 cggctttctt gcgggtgata aagatgggtt tgcggggcgt tttgatcaga tattctgccg 13560 cttcctccac cgtgatcggc tgcaaccgcg tcggatgaat ataggtggga tagacaatca 13620 gggcttgata gatcaggtcg gcgatggtca gccgccgctc gcgacggggg cagtggtgct 13680 catcgacggt caggccccac gaggcgtaga acggcaggcc gtagcagtgc acctgtttac 13740 cgtgcagcaa tgcttcaaag ccgctgaggc tcgtcatcgt gtgcacctcg tccgcacgct 13800 gaatacactg aatgatatcg gcatccagtg cctggtagtc tgcgagttcc gcgatctgtt 13860 ccgccggaat gtcaccctta cggttgccga cgagcacatc ggggtgcggc ttgtagatga 13920 tgtaggcgtg cggattacgt tcccgcacgg tgcgcagcag ctccagattc gacttgatcg 13980 acacggtgcc cgtcttaatc gacgcatcgt cttccacctg gcccggcacc aggatgactt 14040 tcttgtcctt cgcttctgcc gggaggctga aatcggcccc caggttatat ttgctcaatt 14100 tgctttccac cagacgttgg cgcaactttt ccgcgcgcat ctggtgcgcg agggtcagct 14160 ggctgtgatt cagcaggacc tccagttccg acggacgggt ggcatcgtaa tagataccgc 14220 gcttatccag gaccaggctc aacggcggca gcagatcgct ccccaggccg gagctgcgca 14280 ggaagccgtc ttccatgcgc cacagcggca gggatttgcg ctgtgcctcc gcacgccatt 14340 gctgttcgcc tttcacgccc cacacgacgc aggcgcttgc tgcggtacag cgacgggaaa 14400 aggagagacg attcgtggcc gtttgcagga agggcttcag gatcgcgctt ttccacaggg 14460 tcaggcccgg cacccagaga taaccattcc gctgttgcag gtgacgacgt tgcagctgga 14520 gccattggag caccgtgaac agggccgaca cctccccggt ctgcggatca atgtagcggc 14580 aatagcgcag ataggccgct gcgaacagtt cctccagggt ggccgagccg cgacgcgccg 14640 acagcagcgc cgattggggg tggcggtcat cggtgaggcc ccaccctgca taccagggtt 14700 ggccaaagca ggtcacgggc ttaccggcca gcagggcttc aaaaccgtac tgggaggtca 14760 cgacgtacac gcgggacaca tgacgcagca gggactgcgg cgacacgttt tccgcaatca 14820 ggcgcacgcg ctgggtggca cgcaagtccg cgaagtagcc ggtctttttc ccttccagga 14880 catcgggatg cactttgacc cagatttctg cctgcgggtt ttccgccatc gctgcttcca 14940 gcattgcggc gaactcatgg gggcctgcgt tgccgtaggt cacgctcatg tcattgaagg 15000 tctggtccac caccagcacg atgttcgtgc gctcgctttc atccgccacg aacgccggtg 15060 ccaggttgta cttgctcatg tcgcccgtca caatggtgtg catcgcctcg cgcgcctgat 15120 ccgccagggc cgcgttgccg gccttgtcct gcacgagttt ttccagcgcg ctcggtttcg 15180 aggcgtcgta gtaaatgccg cagtcatcca cgacgagcga gaggggcggt tcaccgttca 15240 cgcccaggtc cagcgagcgg acgaaaccat cctccaagcg gatcaccggc ttgcctgcgg 15300 ctttggcgat ggccaccggc tttgcggccg aggggcggtg cccccacacc gcgattgcat 15360 ccacttcctg cgggaccggg cgcagcagcg acagcttttg gcagggctgg gcgaggaatt 15420 tttccaggtg cggaatacgc caaatgccgg ggctataaat gccaatcatg cgttctccgc 15480 gagctcctgc gccatcaggg cccggacctt ctccaagcac gccggggtat cgacgccggg 15540 accggtcgcg gcgacctcga aggtgcgaat gttaatgccc gcgctcatca gccgcagttg 15600 ctccagggat tcggcctgtt cgggcatgga ctccggcaac tggctgtaat tttgcaggac 15660 atcccgccga taggcgtaga tcccgacgtg cttcaggtag cgcgccttct cggcgttgcg 15720 cgggtacgga atgggggagc gggagaaata cagggcgtcc tgccgcgtgt tcaccacgac 15780 cttgacggtg gacggttcgg cggcttctgc cgcgctgatc gcatgacaca gggtcgccac 15840 cggcagcgcc gggtcgtccc gcataccttg cagcagggtt tcgacgtcac gcgggcgaat 15900 catcggctca tccccttgca ggttgatata gatatccgcc tccaccttat gcatgacttc 15960 caccaggcga tcggtgccgc tctcatgatc gttgcgggtc atgatcgctt tgccgccgaa 16020 cgcctggact gcctgctcca cacgcgggtc gtcggttgcg acccacacct ctgccacgcc 16080 tgccacttgc agggcccgtt cgtagacgtg ctggatcatc ggtttcccga cgatatccag 16140 cagcggtttg cccggcagac ggctgctgcc gtagcgtgcc gggatcacaa tcacggcctt 16200 cgacatttat taacctcctc gagttacagc gacagaatca ctttcgcgcc caccgccagt 16260 tggtacagaa tggtgctgat accgcgcgtc acttcgatgt tcttcgactc gtatttcggc 16320 aacaccataa tttcatcacc gggtttcagg gaatcgacgt cttctgcgtt caccgctgcg 16380 ccgttctgac ggatgacgat aatacgggcg ttgccggact tctgggtcag cccaccgcac 16440 ttctcgatgt agtcctcggt cgtcatacct ttctgccacg acaccgcgtt cgggaacagc 16500 acttccccgt ggaccatgac caacgacgtc ttttcgggaa tattgatcac gtcgccgtcc 16560 tccaggagga cggagtcaat gttgctttca ttgaggatca cttcgccctt cggcacgacg 16620 gtgcgggctt tcgcgacgaa gcgggagatc agttgggctt cctgcatacg caggctggcc 16680 tcttccttgg tgctgctctg tgcgctgagg ctggcctctt cgagcttttg cagggacaaa 16740 ttcagcattt ctttctgccg ttgcgcgacg ctcggccgat acaactgcac ggcgttcatc 16800 tgcgacatgg agttcgggcg cactttttcg agcacggccc gcatggtgct accgtagggc 16860 agcaccatgg cgtgttcccc ggaatgtgcg ccttccacac gcacttgaat ggtgcccgca 16920 tagcggtcgg tggagacaat gagggtatca ccgttttgca gcatacgccc cggtgcggac 16980 gagatcggat aatattccga gcgcttctgg aggccctgct tccgcataat cgtgatatgg 17040 gtcgcacccg gtttgggacg tgcccaggac agtgcttcgg tgaccgggat gctcgattcg 17100 cgaaattcaa agtcgtagga attgaacaca tcgccctgca ccgagaacgt atgctggcgc 17160 ggacccacaa tgatcgtatc accgtccgca aactgggaca gccccagttt gccgttgagc 17220 aggaagtcat agaggttgac gttcgagcgc acacgattgc cgcgtttcac gacgatgtcc 17280 acgtagctgc cgcgttccgg gtccacacca cccgccttga tcaggtagtt cagcaggctg 17340 tcggaggtga caccgccgta caggccgggg ttgcggacaa agccggtcac atagaccttg 17400 accggctgcg cctgcaagag cgacgcatag acgttcacgt tgctctggta gacttccttc 17460 accttgctcg tcaccagcgc gttcaactgg gagttcgaca cacctgcgac tttgacgggg 17520 ccgacattcg gcaggaagat gttgcccttc gggtccacct ggagtgcgcc atcgaaggtg 17580 aacgcacccc acaggcggac ctggatggaa tcgccgggat tcaggatgta gtccggattg 17640 aaacccacgg ttgcccccga gtctgcgctc gtaccgttga acagctgcgc cccgaacata 17700 cggctcatca cgaccggggg tgcggggggc ggggtgttat cgaagccgct catgttctgg 17760 gtgtcgcttt tctgcccgtt caggatgccg gtcaacggtg cggcacccgt gaggttcgga 17820 tcggcattaa tgtcgatggt tgcgctcgcc tgtgctgcat ggcacgctgc gatcagcagg 17880 atcgacttaa acagcttcat ttattaacct cctcgagaag tcgacttagt cacggtggtc 17940 ttcaatcacc gccaggagca atttcagggt gccaaagagc aggcaacaca ccagcagcca 18000 acacgcgatc aaatacggga tattcgggaa ggagctttcc tggggcagct gcggggacga 18060 gatcacgctc aggactttca gcttacgggc cgcttcgaca cgggtctttt cgatgctggt 18120 gagcgtgagc ttgtacaact cggtattgaa ctcgaccttg gatttgatct cctcaaaatc 18180 cacggccatg cggttcagtt tatcgccctg gggtgcggta attttcgact tttcttcgtc 18240 gatctgtgcc tggaggctct gaattgcatt gcgggcgctc acgacttggg gcgcatcctc 18300 gcgcaggtac gtgagcaggt tgcgcaggtc ggcttccatc tgaattttct ggcccatcag 18360 cgtattcacc agggtggatg ccgcctgggc ctgtgcctgc gggtccagca cattgttgtt 18420 gtcttggtag gacaacaatt cggctttcga tgcatccagc cgctggcgcg ctttttccat 18480 ttcggtttcc gcaaacgcca attgatcgcg ggcgatacgg tgcgacattt cattgatgaa 18540 ccgctcggat tccttgagca cggtctggtt gaatttcagc gcgaactcgg gcgaaaagcc 18600 ctgggtctgg atgttcagca gcccggtctt gtcgtcgtag ctgacgttga tgcgatcttt 18660 atagtacttc aggaacccct cggcggtttc atccttggac agatggttca ggaagtccag 18720 gcccgaatgg gagaacgctt cgcggaagtt cagctgttta tccagcgcgg ccagcatatc 18780 cgggctgttg atgtattcct tcaggtacag tgcgtcttcg gcggacgacg ggttggaggc 18840 acccaacagc aggccgaagt tcaggctgcc ggagttgaga tcgtcgctgc gcttgatggc 18900 caccttgctt tccgacatat agcggggctg ggagaagatc gccaagtaga tcagcagcac 18960 cgccatgggt gccagaataa tgatttttgc caggtgcttc tgaatatctg ccaggctgat 19020 cgcgctcaga cgcgcacgca tccacgagac ggcgcttttc actttgatca gcatttatta 19080 acctcctgtc gacaacacgt gttaatcgaa aatgcgcacc aacccggtca ccttatttgc 19140 tttgttggtc accagcaggg tcgagacgcg gtgtttctgc atcttctctt ctgcttcgat 19200 gatcatggtg tcttcgggca aggtcagcgg ttcgcgggtc atcatctgtg cggccgttgc 19260 gctcgtcagg ctgtcttctt tctccataaa gcgccgcaga tcgccatcgg tgatgatgcc 19320 tgccagccca ccttccgcat cttcgaccat caccataccc tggcagcccg aggtgatgcg 19380 ctgaatgacc gttttgaagc tggcatcgag ctgcactgcc ggcacatcat gttgcatcac 19440 gtcggcgacg cgggtcagca ggcgccgacc caggctgcca ccggggtggt agcgtgcaaa 19500 gtcattgggc ataaacttac gctggtgaat catcgcgatg gccagcgcgt ccccgatcgc 19560 catcgtgagc gtcgtggagg tggtcggggc gagattgttc gggcacgttt cgttcgccat 19620 gtgcagctcc aggaccgcat ctgcattttt ggccagggtg ctattcccgt tattggtgat 19680 tgcgatgatg cgattgccga agttcttcag gctcggcacc agtttcagga tctcgtccgt 19740 ctcaccgctc gccgaaatca agatgagcag gtcatacggg gtgatcatgc ccagatcacc 19800 atggaacgct tccgccggat gaataaagaa ggagggcgtc ccggtcgagg ccaaggtcgc 19860 cgacatcttg cggcccacat ggccgctttt acccatgccg ctcaggatga cgtgcccttt 19920 acaattcatg atgagattca ggacgcgctg gtactgaccg ctatccagtt gtttggacag 19980 gttttgcagt gccgcgcttt gttcggccag ggtctggcgg acgctcgtaa tcagatacgg 20040 atcaatggtc gaggactggt catccggcaa gtggcgttcg ctcatttatt aacctcctca 20100 cgtgttaatt aagtaatcga tagtgattta aatatgcaag atctagttac ctgcaggcgc 20160 gccgcggccg ccaagacggt attcgggctg caccgtggac attgccagcg ggtccggatg 20220 cggcagcgaa gacgccatct ccgggccggt gctgcaagcg cccagcgaca tcgagcagag 20280 cagagccagg ctgaggcctt ggcagagtcg tccgatcagt ttcttcatgc gtgtagctgg 20340 ctgcctctgt tgggtgggac aggacctcgc gcagcattca accggctcag gcgccagcac 20400 gaacgtacga caggaagttg catcccgacg cgtgccggga ccaacgttga atcgcgtgtt 20460 gcagtgcact atggcataga acgaacacat cgcaaggcac aacacgccat ttttttgacg 20520 gcgttggcct attgattcaa gttcgtcgcc tcgacgttaa gagaacgtga cctgggtcgt 20580 cattctcagc atacgaactc tagcgtttcc gggcacttac ggacgcctgc tgatcccgac 20640 ttgtagcagc ctgaaccgcg aaataattgc gtacaggact tgcatatgcc gccttgcaat 20700 atgccgttgc gcatagtggc atagcctgga atgccatcga actgacatgt tgcgacgcaa 20760 caaaaaggcc cacgtcttgc gacgtaggcc tgttgtttgg tcggggtagc cggattcgaa 20820 ccgacgacca ctagtccccc agactagtgc gctaccaggc tgcgctatac cccgaagatg 20880 ttgcgtcccg ccctgaggcg gcctgcgatt atagcggctt tatgcggcgc tttcctagcg 20940 tcgcagcagc tgcaggactt cttcaagctc catgcgcacc tgcttgatga tctgattgct 21000 cagcgctgac tcgctcttgg ccccatcccc ttcaagacgc agacgcgcgc ccccgatggt 21060 gtaaccctgc tcgtacagca ggccacgaat ctgccgcacc atcagcacat cgtgccgctg 21120 gtagtagcgt cggttgccgc gccgcttgac tggctccagg ctcggaaatt cggtttccca 21180 atagcgcagc acgtgcggct tgacgtcgca cagctcgctc acctcaccga tggtgaagta 21240 gcgcttggcc ggaatcggcg gtagctcgcg attactgccc ggatccagca taagcctcca 21300 cccgttcctt gagtttctgg ccggggcgga aggtcaccac cgtcctggcc gagatcggaa 21360 tttcctcacc ggtcttggga ttgcgaccgg gccgttggtt cttgcgccgc agatcgaagt 21420 tgccgaagcc cgacaacttc acctgacggc cctgctccag tgcatcgcgc agcacatcga 21480 aaaacgcgtc gacgaattcc ttcgcctcac gcttgttcag gccgacttcg tcgaacagac 21540 gctcggccat ctccgctttc gtcaatgcca tgccaatccc ctgttaccgc cagatctgaa 21600 ttcagctgta caattggtac catggatgca tatggcggcc gggccctacg tacgcgtgtt 21660 aaccggtgag ctcactagag gatccagccg accaggcttt ccacgcccgc gtgccgctcc 21720 atgtcgttcg cgcggttctc ggaaacgcgc tgccgcgttt cgtgattgtc acgctcaagc 21780 ccgtagtccc gttcgagcgt cgcgcagagg tcagcgaggg cgcggtaggc ccgatacggc 21840 tcatggatgg tgtttcgggt cgggtgaatc ttgttgatgg cgatatggat gtgcaggttg 21900 tcggtgtcgt gatgcacggc actgacgcgc tgatgctcgg cgaagccaag cccagcgcag 21960 atgcggtcct caatcgcgcg caacgtctcc gcgtcgggct tctctcccgc gcggaagcta 22020 accagcaggt gataggtctt gtcggcctcg gaacgggtgt tgccgtgctg ggtcgccatc 22080 acctcggcca tgacagcggg cagggtgttt gcctcgcagt tcgtgacgcg cacgtgaccc 22140 aggcgctcgg tcttgccttg ctcgtcggtg atgtacttca ccagctccgc gaagtcgctc 22200 ttcttgatgg agcgcatggg gacgtgcttg gcaatcacgc gcaccccccg gccgttttag 22260 cggctaaaaa agtcatggct ctgccctcgg gcggaccacg cccatcatga ccttgccaag 22320 ctcgtcctgc ttctcttcga tcttcgccag cagggcgagg atcgtggcat caccgaaccg 22380 cgccgtgcgc gggtcgtcgg tgagccagag tttcagcagg ccgcccaggc ggcccaggtc 22440 gccattgatg cgggccagct cgcggacgtg ctcatagtcc acgacgcccg tgattttgta 22500 gccctggccg acggccagca ggtaggccga caggctcatg ccggccgccg ccgccttttc 22560 ctcaatcgct cttcgttcgt ctggaaggca gtacaccttg ataggtgggc tgcccttcct 22620 ggttggcttg gtttcatcag ccatccgctt gccctcatct gttacgccgg cggtagccgg 22680 ccagcctcgc agagcaggat tcccgttgag caccgccagg tgcgaataag ggacagtgaa 22740 gaaggaacac ccgctcgcgg gtgggcctac ttcacctatc ctgcccggct gacgccgttg 22800 gatacaccaa ggaaagtcta cacgaaccct ttggcaaaat cctgtatatc gtgcgaaaaa 22860 ggatggatat accgaaaaaa tcgctataat gaccccgaag cagggttatg cagcggaaaa 22920 gcgctgcttc cctgctgttt tgtggaatat ctaccgactg gaaacaggca aatgcaggaa 22980 attactgaac tgaggggaca ggcgagagac gatgccaaag agctacaccg acgagctggc 23040 cgagtgggtt gaatcccgcg cggccaagaa gcgccggcgt gatgaggctg cggttgcgtt 23100 cctggcggtg agggcggatg tcgaggcggc gttagcgtcc ggctatgcgc tcgtcaccat 23160 ttgggagcac atgcgggaaa cggggaaggt caagttctcc tacgagacgt tccgctcgca 23220 cgccaggcgg cacatcaagg ccaagcccgc cgatgtgccc gcaccgcagg ccaaggctgc 23280 ggaacccgcg ccggcaccca agacgccgga gccacggcgg ccgaagcagg ggggcaaggc 23340 tgaaaagccg gcccccgctg cggccccgac cggcttcacc ttcaacccaa caccggacaa 23400 aaaggatccc caattctcat gtttgacagc ttatcatcga taagctttaa tgcggtagtt 23460 tatcacagtt aaattgctaa cgcagtcagg caccgtgtat gaaatctaac aatgcgctca 23520 tcgtcatcct cggcaccgtc accctggatg ctgtaggcat aggcttggtt atgccggtac 23580 tgccgggcct cttgcgggat atcgtccatt ccgacagcat cgccagtcac tatggcgtgc 23640 tgctagcgct atatgcgttg atgcaatttc tatgcgcacc cgttctcgga gcactgtccg 23700 accgctttgg ccgccgccca gtcctgctcg cttcgctact tggagccact atcgactacg 23760 cgatcatggc gaccacaccc gtcctgtgga tcctctacgc cggacgcatc gtggccggca 23820 tcaccggcgc cacaggtgcg gttgctggcg cctatatcgc cgacatcacc gatggggaag 23880 atcgggctcg ccacttcggg ctcatgagcg cttgtttcgg cgtgggtatg gtggcaggcc 23940 ccgtggccgg gggactgttg ggcgccatct ccttgcatgc accattcctt gcggcggcgg 24000 tgctcaacgg cctcaaccta ctactgggct gcttcctaat gcaggagtcg cataagggag 24060 agcgtcgacc gatgcccttg agagccttca acccagtcag ctccttccgg tgggcgcggg 24120 gcatgactat cgtcgccgca cttatgactg tcttctttat catgcaactc gtaggacagg 24180 tgccggcagc gctctgggtc attttcggcg aggaccgctt tcgctggagc gcgacgatga 24240 tcggcctgtc gcttgcggta ttcggaatct tgcacgccct cgctcaagcc ttcgtcactg 24300 gtcccgccac caaacgtttc ggcgagaagc aggccattat cgccggcatg gcggccgacg 24360 cgctgggcta cgtcttgctg gcgttcgcga cgcgaggctg gatggccttc cccattatga 24420 ttcttctcgc ttccggcggc atcgggatgc ccgcgttgca ggccatgctg tccaggcagg 24480 tagatgacga ccatcaggga cagcttcaag gatcgctcgc ggctcttacc agcctaactt 24540 cgatcactgg accgctgatc gtcacggcga tttatgccgc ctcggcgagc acatggaacg 24600 ggttggcatg gattgtaggc gccgccctat accttgtctg cctccccgcg ttgcgtcgcg 24660 gtgcatggag ccgggccacc tcgacctgaa tggaagccgg cggcacctcg ctaacggatt 24720 caccactcca agaattggag ccaatcaatt cttgcggaga actgtgaatg cgcaaaccaa 24780 cccttggcag aacatatcca tcgcgtccgc catctccagc agccgcacgc ggcgcatctc 24840 gggcagcgtt gggtcctggc cacgggtgcg catgatcgtg ctcctgtcgt tgaggacccg 24900 gctaggctgg cggggttgcc ttactggtta gcagaatgaa tcaccgatac gcgagcgaac 24960 gtgaagcgac tgctgctgca aaacgtctgc gacctgagca acaacatgaa tggtcttcgg 25020 tttccgtgtt tcgtaaagtc tggaaacgcg gaagtcagcg ctcttccgct tcctcgctca 25080 ctgactcgct gcgctcggtc gttcggctgc ggcgagcggt atcagctcac tcaaaggcgg 25140 taatacggtt atccacagaa tcaggggata acgcaggaaa gaacatgtga gcaaaaggcc 25200 agcaaaaggc caggaaccgt aaaaaggccg cgttgctggc gtttttccat aggctccgcc 25260 cccctgacga gcatcacaaa aatcgacgct caagtcagag gtggcgaaac ccgacaggac 25320 tataaagata ccaggcgttt ccccctggaa gctccctcgt gcgctctcct gttccgaccc 25380 tgccgcttac cggatacctg tccgcctttc tcccttcggg aagcgtggcg ctttctcata 25440 gctcacgctg taggtatctc agttcggtgt aggtcgttcg ctccaagctg ggctgtgtgc 25500 acgaaccccc cgttcagccc gaccgctgcg ccttatccgg taactatcgt cttgagtcca 25560 acccggtaag acacgactta tcgccactgg cagcagccac tggtaacagg attagcagag 25620 cgaggtatgt aggcggtgct acagagttct tgaagtggtg gcctaactac ggctacacta 25680 gaaggacagt atttggtatc tgcgctctgc tgaagccagt taccttcgga aaaagagttg 25740 gtagctcttg atccggcaaa caaaccaccg ctggtagcgg tggttttttt gtttgcaagc 25800 agcagattac gcgcagaaaa aaaggatctc aagaagatcc tttgatcttt tctacggggt 25860 ctgacgctca gtggaacgaa aactcacgtt aagggatttt ggtcatgaga ttatcaaaaa 25920 ggatcttcac ctagatcctt ttaaattaaa aatgaagttt taaatcaatc taaagtatat 25980 atgagtaaac ttggtctgac ag 26002 <210> 148 <211> 26209 <212> DNA <213> Artificial Sequence <220> <223> synthetic plasmid pKM013 <400> 148 ttaccaatgc ttaatcagtg aggcacctat ctcagcgatc tgtctatttc gttcatccat 60 agttgcctga ctccccgtcg tgtagataac tacgatacgg gagggcttac catctggccc 120 cagtgctgca atgataccgc gagacccacg ctcaccggct ccagatttat cagcaataaa 180 ccagccagcc ggaagggccg agcgcagaag tggtcctgca actttatccg cctccatcca 240 gtctattaat tgttgccggg aagctagagt aagtagttcg ccagttaata gtttgcgcaa 300 cgttgttgcc attgctacag gcatcgtggt gtcacgctcg tcgtttggta tggcttcatt 360 cagctccggt tcccaacgat caaggcgagt tacatgatcc cccatgttgt gcaaaaaagc 420 ggttagctcc ttcggtcctc cgatcgttgt cagaagtaag ttggccgcag tgttatcact 480 catggttatg gcagcactgc ataattctct tactgtcatg ccatccgtaa gatgcttttc 540 tgtgactggt gagtactcaa ccaagtcatt ctgagaatag tgtatgcggc gaccgagttg 600 ctcttgcccg gcgtcaatac gggataatac cgcgccacat agcagaactt taaaagtgct 660 catcattgga aaacgttctt cggggcgaaa actctcaagg atcttaccgc tgttgagatc 720 cagttcgatg taacccactc gtgcacccaa ctgatcttca gcatctttta ctttcaccag 780 cgtttctggg tgagcaaaaa caggaaggca aaatgccgca aaaaagggaa taagggcgac 840 acggaaatgt tgaatactca tactcttcct ttttcaatat tattgaagca tttatcaggg 900 ttattgtctc atgagcggat acatatttga atgtatttag aaaaataaac aaataggggt 960 tccgcgcaca tttccccgaa aagtgccacc tgacgtctag atctcctacc gaccaggcat 1020 tggcgcgttc caccatcgtc ggcaaatcgc gttcgacagt caccagaatg ctgcgaaagc 1080 acgcagtgtc gtccataccg cccgcacgga aatccttgat cgcctgccgc gggttgtcga 1140 tcttgtattc gagcgtggtc gaggtcggct tgataccggc gcgcttggca gcgcgctcca 1200 ccaccgacca gatcaccggc gagcgggcca ggccagagcg tttgagcgca gcctgataca 1260 actcgccggc agccagcatc ggccgcttgc gctccacgcc acggtcgcgc cccatgtaac 1320 gcgccttggc aacggtccag cgcgcataca actcaggcgg cagcacatcg cgcagctcac 1380 gcccgtcttc gttcttcatc gccttcatcg ccgcgggcat cagggccaat ttgccgaaca 1440 tgccaacgtc ggcatccacc tgcaccatcg gcgccatcag cacctgctgc gattggccga 1500 tgatggtttc gacctcggtc gcttgccact ccaggtcctt cggcaacggt gacaacgtgc 1560 ccaggatcca cagcacgtgg tcgcccttgc tgaccttcca caggccgggg ccgggttgct 1620 gcccgcgcac caccatggct tccagatcga ccaccgttgg cggcgctgcc ggcgcctgta 1680 cggccacctc gacggcacac gccagcatcg gtgccaacaa cgacaccaac gcgattcctg 1740 cccgccacac cgcccccctg cgctgcatca cgtaccgcct cccggttgga acgcggacac 1800 tacgcgaacg cgggcccgca cgcgttaggg aagcgttggc ggctccggcg cggcgccttc 1860 ggcaaccaac gcggccagct gtgccgccag cggcgagccg tcttcgagca gcgcgaaacc 1920 ttcccagaca aaccctggcg aaaccgtgca gcccaccagg gtgaagtccc ccagcgagcg 1980 cgccgcctgc cagcagccgg ccggcaccac gtgcatggcg tcgccgcgct ctgcggcgtc 2040 cagcacttcg cgccgcaact gcccgctcgc ttcgtcgaag atcagcaact ccagcggcgc 2100 accttgctgc cagtgccagc actcctcggc atccacccga tgccagcgac tggcttcgcc 2160 tgcgcacaac aggaagcgga tggcggtcag cgccggacgc ggcggcgcac cgctgtcatc 2220 cagcacctgg cgcgtcgacg cgtacacgcg ccggtagtgg ccgccctccg gatggggggc 2280 aaggcccaat gttcgaatca gcgcggcggc ggttggatgc atgcacgcat gctaggccac 2340 acaccgccgc cgtgcatcac gccagctgtt tgcccgcacg caggcaggtg cggaagaaca 2400 ccagcagatc gcggccgcct cgacgctctc ccttatgcga ctcctgcatt aggaagcagc 2460 ccagtagtag gttgaggccg ttgagcaccg ccgccgcaag gaatggtgca tgcaaggaga 2520 tggcgcccaa cagtcccccg gccacggggc ctgccaccat acccacgccg aaacaagcgc 2580 tcatgagccc gaagtggcga gcccgatctt ccccatcggt gatgtcggcg atataggcgc 2640 cagcaaccgc acctgtggcg ccggtgatgc cggccacgat gcgtccggcg tacaagatcc 2700 acaggacggg tgtggtcgcc atgatcgcgt agtcgatagt ggctccaagt agcgaagcga 2760 gcaggactgg gcggcggcca aagcggtcgg acagtgctcc gagaacgggt gcgcatagaa 2820 attgcatcaa cgcatatagc gctagcagca cgccatagtg actggcgatg ctgtcggaat 2880 ggacgatatc ccgcaagagg cccggcagta ccggcataac caagcctatg cctacagcat 2940 ccagggtgac ggtgccgagg atgacgatga gcgcattgtt agatttcata cacggtgcct 3000 gactgcgtta gcaatttaac tgtgataaac taccgcatta aagccgagcg atgataagct 3060 gtcaaacatg agatccgata aatcgattga tagatttaaa taagaactgc agaagctagc 3120 ttagatgctc gtgaaattga cgtgggcgct ttgcagggcc gtcttaatgg cgttggtgtc 3180 cacgaggatc gagtcgggtg cggaaaacgg acggttcttg ttggtgaaat cgctgttacc 3240 aatgtacagc gattccttgt tacgcagcgc ctggatgtgc cagcgggacc acgaatccca 3300 atacttctgg cgatccggcg agataccttg gctggtgtag ccggtcgtcg ggctgttcat 3360 caacgagtcg gtgcggtgcg agcccagcgt cagcggcaac ttgatccgat gcaccgtgga 3420 atcgccgaag atcagcttca gacgcgcgat aaattcgcta tccgcacccg ttttcacaca 3480 atcccagaca ccggccttct gcaagacgtc ggcacggcga aacaggagcg acgacggatt 3540 cagacgcttc aaggggtaca ctgcgcgggc atagaaaata ccgttgtctt gcaggcgcac 3600 ccagtccgag atggagcaga tgagcttcgg attgagcaac aagggggaga tttggcggaa 3660 cagcttttcc ggatggctcc agtcatccga atcgtggcag gtgacgaact cgcccttcgc 3720 ttggatcaag ccgatacgct tcgcggcata ggtgccgaca ttctgcggca ggctaatgat 3780 cttgatgcgc gtgtctttga gggcgagccg ctggagacga aacagggtgt catcggtgct 3840 cgcgtcatcc acaatgatca gctcgaagga acggtaggtc tgattgagga gcgaaatcac 3900 cgcattttcc acgcggcgac ccgtattata ggtggtcatc aggatggaga tcaacggccc 3960 cgtctgggcc gggtacggga tgctggtgat gatgttgcac ggggagagcg gggagctgtt 4020 gtccgtcaag gccacggggc tgaggccgaa gtatttatag tattcattca gccgattcag 4080 gctaatttcg gcggtttcgc ggaaggcgtt attttgcagc agcaggatat ccgggctata 4140 gacgatatcg gatgcgtcga tctgggcgag ggtcgagatg gccttttggg tcaggccgat 4200 ccggagttgc agtgcggtat acaggtccag cgggcagttg tccacgttgt ccaacaggct 4260 caggctaaag gtcggcgagt aggacgccag ggttttcgcc agttccactt tctgatgggt 4320 atcggtgaac tcgtccttga actccatcag cagctcgggc gtcaggctga tgtcgccgca 4380 ggcgattttt gcgatcttga ttgccagttt gcagcgccaa tcggacgggg tatccgtcaa 4440 gttatgcagc gaccagtaca tattcagacg atacatcgcg aggatgcgtt tcgactgcca 4500 gaaccggcaa tcatcctgga tggccgcgag cgcgtggacg tagcggctct ttttgagcag 4560 ccacaagaat ttgagattat tgaacattta ttaacctcct gctagcaact taagttacga 4620 atcgacgccg aacaggtcgc gggtgtagac tttctccgag acatcttcca gttcgctggt 4680 gcggcgattc gccacaatga catcgacgcg ctccttaaag gaattgatgt cgcgctcgac 4740 gtaggaaccg aagaagtagg gttctttcag gaccggctcg tacaccacaa tctcgatacc 4800 cttggccttc aaacgtttca tgaccccctg gatgctgctg gcccggaaat tgtcgctacc 4860 cgccttcatg atcaggcgat agataccgac cactttgggc ttacgggaca ggatgtcctc 4920 ggccacgaag tccttacggg tcgtattcgc atccacgatg gcctggatca ggttttgcgg 4980 gacgtcgcga taattggcca acagctgctt cgtatccttc ggcagacagt aaccgccgta 5040 gccgaaggac gggttgttgt aatgttgacc aatgcgcgga tcgagggaga cgccttcgat 5100 gatttgtttg gtatccaggc cgtgcacgct cgcgtaggtg tccagctcgt taaagtacgc 5160 gatacgcatc gccagatacg tgttcgcgaa cagtttgatg gcttctgcct cgggcgaatc 5220 cgtcagcagg atcggaatat cctttttgat ggcaccttcc gacaggagtt cggcgaactt 5280 ccgtgcgcgt tccgacgatt cgcccacgac aatgcggctc ggatagagat tatcatacag 5340 ggctttgcct tcgcgcagga actccgggga aaagatgata ttattcgtgt tcagatcgcg 5400 cttcaggcgt tcggtgaacc cgacggggac ggtggatttg ataatgatgg tcgcgttcgg 5460 gttaatggac agcacgtcac acgcgacgct ttcgacgctc agggtatcaa agttgttatt 5520 aatcggatca tagttcgtcg gggtggcgat gatcacgtag tctgcatcgc gatatgcctc 5580 gtatttttcc gtcgtcgcgt agaggttcag cttacgattg gagagaaact tctggatttc 5640 cgggtcgcaa atcggcgaga ttttcttgtt aatgagctgg accttcttcg ggtcgatgtc 5700 cagggcgatg atgtcgtgtt tttgggagag gaggatcgca atgctgatac ccacatagcc 5760 gacgccggcc acggcaattt tcatttatta acctccttaa gtgaattcaa actagtttac 5820 aagtcgtttt cgatcttctc ccaggtatat ttgcgacatt cattcaagtt ggtcagcggc 5880 gagtatttgt actttttgat accgaggcgc gacaggcttt cgttcaccac cttgaaatgg 5940 ttttcctttt ggatgtccag tttcttgatc gacgtgttct cgccgtgcag gacacggttg 6000 tagcaaatct tattgatatg cttaaacggg ccgacttcgc tgagtttcaa atacatatcg 6060 taatccaccg cattgctgat gctctcgttg aagccttcgg tgaggttcca tgcacgcgcc 6120 gtgaacatac ggaagtggtg gcagatcatc gcgctcgtga gcttttcgcg gctgtaaatc 6180 ggccagttgt agccattgct aatcaagtta ccttcacgat caatattgcg attggtggtg 6240 tacacgcagg cgaggctcag gtctttgcga aattcatcca gacacagttc cacggcatcg 6300 ggctccagga aatcatcgga atccagctgc ccgatgtaga aaccccggca caggcggact 6360 gcggtattcg aggcggagcc gatgcctttg tttttctggc tgatgaaacg gacgcgcggg 6420 tggtttgcgt aatgttcttg caggatgcgc agcgtatcat cggtgctccc gtcatcgcag 6480 atgcagacct ccagatcggt gatcgtttgg ttcagtgccg attcgacgca gcgcacgata 6540 tatttgctgc aattatacgc ggggatgtag atgctcacca ggggcacacg tttcagggtg 6600 gcgctctcga ttttctcctt cttgcgataa aagtagggca ccttctgctg caacagctgg 6660 acggtaatgt ttttacctgc cgcgcgatcg gtttcgttct ccttaccggg cggttcctga 6720 tgatatgcca tcgcgccttc cacgctacgg aaataacaac cctcgcggta cagccgatag 6780 ccgaactcat tatcctcacc gccccaatgc gtgaactctt cgtcaaacca acccgcgcga 6840 aacagccact tctttgcaaa cgccacattg ccaccgctaa agaaccggaa cggggtgttg 6900 cacaggcgca gattgtcggt attcttgaaa tgttcgatgc gccaatcgac ggatttgttc 6960 tgctcgacct tgcctgcgac ctgattattg gtaataatct ccgggatttc attgatcagg 7020 cttttctggg acaaaaagtc cagataggta tgcttcgacg tgtcgatgta tttacgcggg 7080 ccaatcagtg ccacgttatc atccacggcc aggagttcca tataggactg cacccacaac 7140 gggttcggcg ccatatcgca gtccaagatc gccacgtagt tgtatttcgc tgcccgcagg 7200 cccaggttcc gcacggcgca cagctggtag ccgtagtctt tctggcggac gtatttgatg 7260 ttcagcaacg actcgaactc gcggacgatc tcttcgatgt tttccttgga accgtcatcc 7320 gcgacgatga cctcatagtc ataaatcgtt ttctgattgc agaggcaggc cagggtgatc 7380 gccaggattt tggcgcgatt gtacgtcgga atcacgatgg acaggccgtc gatgatcagt 7440 tgcttgcgcg gataatcatc cagttcttta cgtttccctg cccagacgta gtcgttcgtg 7500 ctttccggca gcggcggcaa ggtcaggtcg ctcggccaat ccagcggaat gggttcgact 7560 tctttcaatt cggcgcgctc ggatttcttt gcggtaattt cccgatattt gctaatgatt 7620 tcattctttt ccacctcatt cagcgagatc gcctttgcat tgctgcacat aattttggtt 7680 gccgcgtcga tatcaatgac cgctttccga ttcagcttgt ccacttcttc gctcagattc 7740 agggcggttt ggcacagctt gatattggct tccacccagc tcacatcata gatttccgcc 7800 actttttcaa acagggagag ggcttggcgg tagttcttat tcttatacag attgattgcc 7860 tggttcaaaa tgctcattta ttaacctcct actagtgaat tttcgaatta cttaccgcag 7920 tacttgacac ccacctggga attgtttttg gtgcgtttga attggcggat ggtacggtag 7980 atgctaaagg gcaggctgat cagaccgagc ggaaaattgt tcttattgat gatgagcttg 8040 cccagctgat agctcaggtg tttcttgacc cgttcggctt cgtgtttatc cgcgtacagg 8100 aagatgctcg gcaggctcac ttggtactcc gaatcatatt tcttcttcca ggtccgccat 8160 tcgctgatca acgcaaacgg aatcgagatc agaccgagga acgtcttgga gcggctcacc 8220 atcaccgcac ccaggcggta gccgatatct tgcttgatgc gttcggccgc accatacagc 8280 tccggcagtt gtttcttttc gagacgttga ttgtcgatga agtactgttc gagcttttgc 8340 tgcaccagat gcagctgatt gagcagcaat tctttttcgc acgacagctt ttcgaggcgc 8400 tgttgttgca gttcattttt gttctgttcc tttttcagca gggactcgaa gttctcgatc 8460 gcgcactcca gttcctggac ctggatggtt ttgtttttaa tgatcagatc atactggatc 8520 agttcttcct tgctatccga cagctctttc agaatggctt gataggcgtt cagctgtttg 8580 gacgtgtgca gttcgttgtc cagaatgatc tttttgctgc tctggtacag accgttcacg 8640 atatcgaggg tgatctggcg ttgtttaatg aacgtctccc aaataaagga cggcttatag 8700 ttttccttct ccagcacccg caagggggtg ttggcgttcg attgcaattc aaagtacagt 8760 tccttgcaat cgggatagtc gttcaggacg ttgaagatca agtactcctc cgtctcgctt 8820 tgcttgaaaa tgatatcccc ggtcccgatg tcaataccgc tgagggacat gatctcctga 8880 tgttcttttt ccagcgtaat ggaggcttcg gcggtcttaa agtcattcac gctctgctcc 8940 agcgagtggt tgatggtatt ggagaacgac aacccgaatt tcagtttcag tttgtgttgc 9000 agttgctgga tgcagtcctc ggcgttgcgc ttcacctgtt cgctcgacac cagcaggcac 9060 cgaccccggt tgttgaggaa gaagtgcagc aaggcggtgt tgtatgccag ccagtttttg 9120 atcagatgct ccgaggtata gttgctggag atgttctggt ccgagaagta gttcgtcagg 9180 atgcttttgg ggtggtcgta gatgaggata aaggtgatgt tctcatccac cgatttccaa 9240 tattccaacg tgtgaattgc gttggggtcg ctccaaccgc acagtttctg gttcaggttg 9300 gacagcatca gatccaatgc gataccgttc cagacggtgc tcacatggag cggttcaaag 9360 tcggcggaat cggtcaccgt atagatgtcc ggcgactggt acgccttccg cagcgtctgg 9420 gtgatgtcct ggggcgagag gttctcacgt ttggacgggc acagggagtt catgccgcgc 9480 tgatgcagga gttcttccac gatttggtag ttgctgctcg gatggcccac gatcaccagg 9540 cggttcattt attaacctcc tttcgaaaat gaacggtccg ttaaatatag ccattcggat 9600 tcttcatctg ccagcgccag gcgtcctcca gcatggtttc gagttcccgc ttggctttcc 9660 agttcagata tttgttggcc ttttcggggg aggaccagct ctccgcgata tcaccgtcac 9720 ggcggctcac gatttcatac ggaatccgca cgccggaaat cttttcaaag gtggacacca 9780 gttccagcac cgaataacct ttacccgtgc ccaaattaaa gacgtggtag ttggtgttat 9840 tgtcgcggaa gagataggac agcgctgcga cgtgcccttc ggccaggtcc atcacatgga 9900 tatagtcacg gacccccgtg ccgtctttgg tgggataatc accaccgaac accatcagtt 9960 tttccagttt ccccatcgcg acctgcaaga tgtacggcac caagttggag gggatgtctg 10020 ccgggctttc accaatcata ccggattcgt gggcgcccgt cggattaaag tagcgcaagc 10080 agaggaaatt cgtgtcggag tatttcttgg cgatgtcgcg gatcatcagc tccgagatgt 10140 acttggacgt accatacgga ttcagcgtgc caccaatatg gcagtcttcg gtgacgggca 10200 tgatcttgct ttccccatac accgtcgccg acgagctaaa gatgaagttg gcgacgtcgt 10260 tcttgatggc gcaattgatg agttgcaggg tgccgctcac gttgttgtca tagtagaaga 10320 tgggcttgat caggctttct gcgaccgatt tcgcacctgc aaagtgcatg atgcagtcga 10380 atttgtgttt cttcaggatc tggttcactt ccttctcgtt gttgatattg agttcgtaga 10440 acgtgacttt cttctttgcg atcagctcaa tgcgacggat gctttcgcag ctgctgttga 10500 tgagattgtc aatgatgacg acattgtagc ctttgttcag caggcagagc gacgtgtggc 10560 tgccgatgta gcctgcaccg ccggtgacca ggatgttcat ttattaacct cctcggtccg 10620 aattaaccta ggttatgagg tcagcattgc ttcttcacgc gtttagtagt tgttttgttc 10680 ggtgatatat tcttcaatgc cttcttgcac gtcttcatgg aacgacacgg cgttgtcgtc 10740 tttaaacacg attgccacat cgcagaactc tttcaacgag ttcagcgagt gcgacaccat 10800 gaggaaggag ctttccttat gacgctcctt gaagagttgg gcacattttt ccttgaaacg 10860 ggcgtccccc accgccgtca cctcgtccac gatgtagtaa tcgaacttga acgccatgct 10920 caggccgaag ccgaggcggc tgcgcatacc gctcgaatag gtcttgatcg gcatatcaaa 10980 atacttcccc agctccgcga actcttccac aaactcaatc ttttctttca gctcctcctg 11040 cttcgcgtac agccgggcca cgaacttcac gttttcacgc ccggtcaagc tgccctggaa 11100 gccgcctgcc agacccaccg gccacgagat cgttttattc gtgatgattt taccgctatc 11160 cgggcggtcg atgcccccaa tcatgcgcaa cagcgtggat ttacccgccc cattgcgccc 11220 gatgaacgcc acgcttttgc cgctggggat ctcaatgttc aggttcttga agacatagtg 11280 acggcccacc ggggtgcggt agcttttcgt caggttttcg atcttaatca tgaggtcaac 11340 attgcctcct cacgcgtacg gtacagggcc aaaccaataa acagggtcac cagggtgaac 11400 attgccagat aattcaggct gaccccttcg ctgatataac cgggcatcac ggcctcgcgg 11460 ctcagttcga cgacgtgcac caggggattc cacagcaggt acgaccaata ctgcttcgga 11520 atggagtgca gcgggaacat gatgcacgaa ataaagtaca gcggcttcag caagatcggc 11580 aagactttct gcatttcggg gaacgtcttg cccacgacca tgaagatcag gcccacaccg 11640 cacgacagga tgatcaggag gctccaggtg agcacaaatt gcaggaagtt ggtaatctcg 11700 aaatattcgc ccgccatcca gatgatcagc atcaggagga tgtagaccgc cacatagatc 11760 agcgtttcca agagggcgcg tgcaatgatc gtgtcgatcg gcttcacggg ccggtagtta 11820 aacagcccct gattggcttc gatggcgccc acggagcgat tgctgatgct gctgaaaata 11880 aagaacggga tcaggccatt gagcaggaac accgggaagg agatatccgg catggtgcga 11940 tgcatgatat agccaaagat cccgagcaga atcagcagat gtgcgctcgg ttccaggatc 12000 gcccacagat agcccaggcg aaacttgcca aagcgcgtac ggatttcgcg gagaaacagt 12060 gcttcgaccg tcactttctg gacttcaaaa cccgaacgtg ccatttatta acctcctggt 12120 accaatctag attgtttaaa cagatccaat ctagattgtt taaacttctg cagaacacgc 12180 ggtgttaacg tttcttatac ttcttaattt tgttaaagat catttcgccg tagtacaccg 12240 cattgacctg ggtcttcacc agcaagtagc cgcgaaattt cttaaacaac ttcatgttcg 12300 gtttaaagtc ggcttgccag aactgatgca aatgcccctg gtacgtcaga cccttgatat 12360 cgtacaaggc gttgcccatg actttcaggg gcttgttgtg gatcaacgcg gaaatgccgg 12420 ccgtgctatt gatggtgacc accgctttgg cgtggcgcaa cagctccggc atgggcagat 12480 cgtgcacata gatgacacgt tcatccaaac cgtattcctt cgacagacgc ttgatcaacg 12540 ggcggtacag gcggtgcccg cgatccatcg ggtgatgttt gatcaccaga taggactcct 12600 tgggggcctt gcgggaaaag ctgtacatca cttcgttgat gtaatcacgc acatcattat 12660 agttgctatg gttgcggatc tggctgtcgt tgtacacttg caggaccgcc aggtaatagc 12720 gctgatccag ctcgttcatc aggcggggga ggaccttgcg ttgggtgacc ttatacagct 12780 gtttgcgcca gtaggcgcgg acccagcagc gcgcttcata ccacgggctg aacgatttgt 12840 ggtggcgata gcgcggaaat tcgtgacgat agtgccaacc catcaggtaa taccacatgg 12900 cgtggccgat gcgcttcatg gtgctcggtt tcaggttctc gacgtgcggc gtcggcatat 12960 cgggcaattt gcggtaaaag tccggatcgc ggggcaagct gctataggcg ttcacaccgc 13020 cttcttccac ggtgataaat tgcggacgca ggtagccttc ctcgaaggcc agaaaacgaa 13080 tccccttcga cttggcccag cgtttggcct ccttgtgcag caggcggcag tcaccgaaac 13140 acaaaatcgt gtcaaagtca tactgacgat gcaagtcccg cagccaaccg gggaactcct 13200 tcggggtttg gtagtacgcc aggtattggc ggtggcggca gtagaagcga tcaccgccat 13260 taaagacgac gttgaccgcg ttgcgaccga ggctctccaa ccattccgcc acatcgttga 13320 agaacggacc catcggacct tggagcagga ggtacttttt accgctcaac agcaccgtca 13380 gcgcattgcc gtgcatttat taacctccta acacgcggtg ttaagcgttt tcggcgagct 13440 cttaaccaaa gcgcactttg cagaacatga tcaacttgcg atagtagcga atcacacggc 13500 cggctttctt gcgggtgata aagatgggtt tgcggggcgt tttgatcaga tattctgccg 13560 cttcctccac cgtgatcggc tgcaaccgcg tcggatgaat ataggtggga tagacaatca 13620 gggcttgata gatcaggtcg gcgatggtca gccgccgctc gcgacggggg cagtggtgct 13680 catcgacggt caggccccac gaggcgtaga acggcaggcc gtagcagtgc acctgtttac 13740 cgtgcagcaa tgcttcaaag ccgctgaggc tcgtcatcgt gtgcacctcg tccgcacgct 13800 gaatacactg aatgatatcg gcatccagtg cctggtagtc tgcgagttcc gcgatctgtt 13860 ccgccggaat gtcaccctta cggttgccga cgagcacatc ggggtgcggc ttgtagatga 13920 tgtaggcgtg cggattacgt tcccgcacgg tgcgcagcag ctccagattc gacttgatcg 13980 acacggtgcc cgtcttaatc gacgcatcgt cttccacctg gcccggcacc aggatgactt 14040 tcttgtcctt cgcttctgcc gggaggctga aatcggcccc caggttatat ttgctcaatt 14100 tgctttccac cagacgttgg cgcaactttt ccgcgcgcat ctggtgcgcg agggtcagct 14160 ggctgtgatt cagcaggacc tccagttccg acggacgggt ggcatcgtaa tagataccgc 14220 gcttatccag gaccaggctc aacggcggca gcagatcgct ccccaggccg gagctgcgca 14280 ggaagccgtc ttccatgcgc cacagcggca gggatttgcg ctgtgcctcc gcacgccatt 14340 gctgttcgcc tttcacgccc cacacgacgc aggcgcttgc tgcggtacag cgacgggaaa 14400 aggagagacg attcgtggcc gtttgcagga agggcttcag gatcgcgctt ttccacaggg 14460 tcaggcccgg cacccagaga taaccattcc gctgttgcag gtgacgacgt tgcagctgga 14520 gccattggag caccgtgaac agggccgaca cctccccggt ctgcggatca atgtagcggc 14580 aatagcgcag ataggccgct gcgaacagtt cctccagggt ggccgagccg cgacgcgccg 14640 acagcagcgc cgattggggg tggcggtcat cggtgaggcc ccaccctgca taccagggtt 14700 ggccaaagca ggtcacgggc ttaccggcca gcagggcttc aaaaccgtac tgggaggtca 14760 cgacgtacac gcgggacaca tgacgcagca gggactgcgg cgacacgttt tccgcaatca 14820 ggcgcacgcg ctgggtggca cgcaagtccg cgaagtagcc ggtctttttc ccttccagga 14880 catcgggatg cactttgacc cagatttctg cctgcgggtt ttccgccatc gctgcttcca 14940 gcattgcggc gaactcatgg gggcctgcgt tgccgtaggt cacgctcatg tcattgaagg 15000 tctggtccac caccagcacg atgttcgtgc gctcgctttc atccgccacg aacgccggtg 15060 ccaggttgta cttgctcatg tcgcccgtca caatggtgtg catcgcctcg cgcgcctgat 15120 ccgccagggc cgcgttgccg gccttgtcct gcacgagttt ttccagcgcg ctcggtttcg 15180 aggcgtcgta gtaaatgccg cagtcatcca cgacgagcga gaggggcggt tcaccgttca 15240 cgcccaggtc cagcgagcgg acgaaaccat cctccaagcg gatcaccggc ttgcctgcgg 15300 ctttggcgat ggccaccggc tttgcggccg aggggcggtg cccccacacc gcgattgcat 15360 ccacttcctg cgggaccggg cgcagcagcg acagcttttg gcagggctgg gcgaggaatt 15420 tttccaggtg cggaatacgc caaatgccgg ggctataaat gccaatcatg cgttctccgc 15480 gagctcctgc gccatcaggg cccggacctt ctccaagcac gccggggtat cgacgccggg 15540 accggtcgcg gcgacctcga aggtgcgaat gttaatgccc gcgctcatca gccgcagttg 15600 ctccagggat tcggcctgtt cgggcatgga ctccggcaac tggctgtaat tttgcaggac 15660 atcccgccga taggcgtaga tcccgacgtg cttcaggtag cgcgccttct cggcgttgcg 15720 cgggtacgga atgggggagc gggagaaata cagggcgtcc tgccgcgtgt tcaccacgac 15780 cttgacggtg gacggttcgg cggcttctgc cgcgctgatc gcatgacaca gggtcgccac 15840 cggcagcgcc gggtcgtccc gcataccttg cagcagggtt tcgacgtcac gcgggcgaat 15900 catcggctca tccccttgca ggttgatata gatatccgcc tccaccttat gcatgacttc 15960 caccaggcga tcggtgccgc tctcatgatc gttgcgggtc atgatcgctt tgccgccgaa 16020 cgcctggact gcctgctcca cacgcgggtc gtcggttgcg acccacacct ctgccacgcc 16080 tgccacttgc agggcccgtt cgtagacgtg ctggatcatc ggtttcccga cgatatccag 16140 cagcggtttg cccggcagac ggctgctgcc gtagcgtgcc gggatcacaa tcacggcctt 16200 cgacatttat taacctcctc gagttacagc gacagaatca ctttcgcgcc caccgccagt 16260 tggtacagaa tggtgctgat accgcgcgtc acttcgatgt tcttcgactc gtatttcggc 16320 aacaccataa tttcatcacc gggtttcagg gaatcgacgt cttctgcgtt caccgctgcg 16380 ccgttctgac ggatgacgat aatacgggcg ttgccggact tctgggtcag cccaccgcac 16440 ttctcgatgt agtcctcggt cgtcatacct ttctgccacg acaccgcgtt cgggaacagc 16500 acttccccgt ggaccatgac caacgacgtc ttttcgggaa tattgatcac gtcgccgtcc 16560 tccaggagga cggagtcaat gttgctttca ttgaggatca cttcgccctt cggcacgacg 16620 gtgcgggctt tcgcgacgaa gcgggagatc agttgggctt cctgcatacg caggctggcc 16680 tcttccttgg tgctgctctg tgcgctgagg ctggcctctt cgagcttttg cagggacaaa 16740 ttcagcattt ctttctgccg ttgcgcgacg ctcggccgat acaactgcac ggcgttcatc 16800 tgcgacatgg agttcgggcg cactttttcg agcacggccc gcatggtgct accgtagggc 16860 agcaccatgg cgtgttcccc ggaatgtgcg ccttccacac gcacttgaat ggtgcccgca 16920 tagcggtcgg tggagacaat gagggtatca ccgttttgca gcatacgccc cggtgcggac 16980 gagatcggat aatattccga gcgcttctgg aggccctgct tccgcataat cgtgatatgg 17040 gtcgcacccg gtttgggacg tgcccaggac agtgcttcgg tgaccgggat gctcgattcg 17100 cgaaattcaa agtcgtagga attgaacaca tcgccctgca ccgagaacgt atgctggcgc 17160 ggacccacaa tgatcgtatc accgtccgca aactgggaca gccccagttt gccgttgagc 17220 aggaagtcat agaggttgac gttcgagcgc acacgattgc cgcgtttcac gacgatgtcc 17280 acgtagctgc cgcgttccgg gtccacacca cccgccttga tcaggtagtt cagcaggctg 17340 tcggaggtga caccgccgta caggccgggg ttgcggacaa agccggtcac atagaccttg 17400 accggctgcg cctgcaagag cgacgcatag acgttcacgt tgctctggta gacttccttc 17460 accttgctcg tcaccagcgc gttcaactgg gagttcgaca cacctgcgac tttgacgggg 17520 ccgacattcg gcaggaagat gttgcccttc gggtccacct ggagtgcgcc atcgaaggtg 17580 aacgcacccc acaggcggac ctggatggaa tcgccgggat tcaggatgta gtccggattg 17640 aaacccacgg ttgcccccga gtctgcgctc gtaccgttga acagctgcgc cccgaacata 17700 cggctcatca cgaccggggg tgcggggggc ggggtgttat cgaagccgct catgttctgg 17760 gtgtcgcttt tctgcccgtt caggatgccg gtcaacggtg cggcacccgt gaggttcgga 17820 tcggcattaa tgtcgatggt tgcgctcgcc tgtgctgcat ggcacgctgc gatcagcagg 17880 atcgacttaa acagcttcat ttattaacct cctcgagaag tcgacttagt cacggtggtc 17940 ttcaatcacc gccaggagca atttcagggt gccaaagagc aggcaacaca ccagcagcca 18000 acacgcgatc aaatacggga tattcgggaa ggagctttcc tggggcagct gcggggacga 18060 gatcacgctc aggactttca gcttacgggc cgcttcgaca cgggtctttt cgatgctggt 18120 gagcgtgagc ttgtacaact cggtattgaa ctcgaccttg gatttgatct cctcaaaatc 18180 cacggccatg cggttcagtt tatcgccctg gggtgcggta attttcgact tttcttcgtc 18240 gatctgtgcc tggaggctct gaattgcatt gcgggcgctc acgacttggg gcgcatcctc 18300 gcgcaggtac gtgagcaggt tgcgcaggtc ggcttccatc tgaattttct ggcccatcag 18360 cgtattcacc agggtggatg ccgcctgggc ctgtgcctgc gggtccagca cattgttgtt 18420 gtcttggtag gacaacaatt cggctttcga tgcatccagc cgctggcgcg ctttttccat 18480 ttcggtttcc gcaaacgcca attgatcgcg ggcgatacgg tgcgacattt cattgatgaa 18540 ccgctcggat tccttgagca cggtctggtt gaatttcagc gcgaactcgg gcgaaaagcc 18600 ctgggtctgg atgttcagca gcccggtctt gtcgtcgtag ctgacgttga tgcgatcttt 18660 atagtacttc aggaacccct cggcggtttc atccttggac agatggttca ggaagtccag 18720 gcccgaatgg gagaacgctt cgcggaagtt cagctgttta tccagcgcgg ccagcatatc 18780 cgggctgttg atgtattcct tcaggtacag tgcgtcttcg gcggacgacg ggttggaggc 18840 acccaacagc aggccgaagt tcaggctgcc ggagttgaga tcgtcgctgc gcttgatggc 18900 caccttgctt tccgacatat agcggggctg ggagaagatc gccaagtaga tcagcagcac 18960 cgccatgggt gccagaataa tgatttttgc caggtgcttc tgaatatctg ccaggctgat 19020 cgcgctcaga cgcgcacgca tccacgagac ggcgcttttc actttgatca gcatttatta 19080 acctcctgtc gacaacacgt gttaatcgaa aatgcgcacc aacccggtca ccttatttgc 19140 tttgttggtc accagcaggg tcgagacgcg gtgtttctgc atcttctctt ctgcttcgat 19200 gatcatggtg tcttcgggca aggtcagcgg ttcgcgggtc atcatctgtg cggccgttgc 19260 gctcgtcagg ctgtcttctt tctccataaa gcgccgcaga tcgccatcgg tgatgatgcc 19320 tgccagccca ccttccgcat cttcgaccat caccataccc tggcagcccg aggtgatgcg 19380 ctgaatgacc gttttgaagc tggcatcgag ctgcactgcc ggcacatcat gttgcatcac 19440 gtcggcgacg cgggtcagca ggcgccgacc caggctgcca ccggggtggt agcgtgcaaa 19500 gtcattgggc ataaacttac gctggtgaat catcgcgatg gccagcgcgt ccccgatcgc 19560 catcgtgagc gtcgtggagg tggtcggggc gagattgttc gggcacgttt cgttcgccat 19620 gtgcagctcc aggaccgcat ctgcattttt ggccagggtg ctattcccgt tattggtgat 19680 tgcgatgatg cgattgccga agttcttcag gctcggcacc agtttcagga tctcgtccgt 19740 ctcaccgctc gccgaaatca agatgagcag gtcatacggg gtgatcatgc ccagatcacc 19800 atggaacgct tccgccggat gaataaagaa ggagggcgtc ccggtcgagg ccaaggtcgc 19860 cgacatcttg cggcccacat ggccgctttt acccatgccg ctcaggatga cgtgcccttt 19920 acaattcatg atgagattca ggacgcgctg gtactgaccg ctatccagtt gtttggacag 19980 gttttgcagt gccgcgcttt gttcggccag ggtctggcgg acgctcgtaa tcagatacgg 20040 atcaatggtc gaggactggt catccggcaa gtggcgttcg ctcatttatt aacctcctca 20100 cgtgttaatt aagtaatcga tagtgattta aatatgcaag atctagttac ctgcaggatt 20160 attgtttctg ttgcataaag cctaaggggt aggcctttct agagatagcc attttttgca 20220 ctcctgtatc cgcttcttgc aaggctggac ttatccctat caaaccggac actgcaggct 20280 gacaagcttt cattacatat gaagagtttg tagaaacgca aaaaggccat ccgtcaggat 20340 ggccttctaa gaaggctcga gtggcgcgcc gcggccgcca agacggtatt cgggctgcac 20400 cgtggacatt gccagcgggt ccggatgcgg cagcgaagac gccatctccg ggccggtgct 20460 gcaagcgccc agcgacatcg agcagagcag agccaggctg aggccttggc agagtcgtcc 20520 gatcagtttc ttcatgcgtg tagctggctg cctctgttgg gtgggacagg acctcgcgca 20580 gcattcaacc ggctcaggcg ccagcacgaa cgtacgacag gaagttgcat cccgacgcgt 20640 gccgggacca acgttgaatc gcgtgttgca gtgcactatg gcatagaacg aacacatcgc 20700 aaggcacaac acgccatttt tttgacggcg ttggcctatt gattcaagtt cgtcgcctcg 20760 acgttaagag aacgtgacct gggtcgtcat tctcagcata cgaactctag cgtttccggg 20820 cacttacgga cgcctgctga tcccgacttg tagcagcctg aaccgcgaaa taattgcgta 20880 caggacttgc atatgccgcc ttgcaatatg ccgttgcgca tagtggcata gcctggaatg 20940 ccatcgaact gacatgttgc gacgcaacaa aaaggcccac gtcttgcgac gtaggcctgt 21000 tgtttggtcg gggtagccgg attcgaaccg acgaccacta gtcccccaga ctagtgcgct 21060 accaggctgc gctatacccc gaagatgttg cgtcccgccc tgaggcggcc tgcgattata 21120 gcggctttat gcggcgcttt cctagcgtcg cagcagctgc aggacttctt caagctccat 21180 gcgcacctgc ttgatgatct gattgctcag cgctgactcg ctcttggccc catccccttc 21240 aagacgcaga cgcgcgcccc cgatggtgta accctgctcg tacagcaggc cacgaatctg 21300 ccgcaccatc agcacatcgt gccgctggta gtagcgtcgg ttgccgcgcc gcttgactgg 21360 ctccaggctc ggaaattcgg tttcccaata gcgcagcacg tgcggcttga cgtcgcacag 21420 ctcgctcacc tcaccgatgg tgaagtagcg cttggccgga atcggcggta gctcgcgatt 21480 actgcccgga tccagcataa gcctccaccc gttccttgag tttctggccg gggcggaagg 21540 tcaccaccgt cctggccgag atcggaattt cctcaccggt cttgggattg cgaccgggcc 21600 gttggttctt gcgccgcaga tcgaagttgc cgaagcccga caacttcacc tgacggccct 21660 gctccagtgc atcgcgcagc acatcgaaaa acgcgtcgac gaattccttc gcctcacgct 21720 tgttcaggcc gacttcgtcg aacagacgct cggccatctc cgctttcgtc aatgccatgc 21780 caatcccctg ttaccgccag atctgaattc agctgtacaa ttggtaccat ggatgcatat 21840 ggcggccggg ccctacgtac gcgtgttaac cggtgagctc actagaggat ccagccgacc 21900 aggctttcca cgcccgcgtg ccgctccatg tcgttcgcgc ggttctcgga aacgcgctgc 21960 cgcgtttcgt gattgtcacg ctcaagcccg tagtcccgtt cgagcgtcgc gcagaggtca 22020 gcgagggcgc ggtaggcccg atacggctca tggatggtgt ttcgggtcgg gtgaatcttg 22080 ttgatggcga tatggatgtg caggttgtcg gtgtcgtgat gcacggcact gacgcgctga 22140 tgctcggcga agccaagccc agcgcagatg cggtcctcaa tcgcgcgcaa cgtctccgcg 22200 tcgggcttct ctcccgcgcg gaagctaacc agcaggtgat aggtcttgtc ggcctcggaa 22260 cgggtgttgc cgtgctgggt cgccatcacc tcggccatga cagcgggcag ggtgtttgcc 22320 tcgcagttcg tgacgcgcac gtgacccagg cgctcggtct tgccttgctc gtcggtgatg 22380 tacttcacca gctccgcgaa gtcgctcttc ttgatggagc gcatggggac gtgcttggca 22440 atcacgcgca ccccccggcc gttttagcgg ctaaaaaagt catggctctg ccctcgggcg 22500 gaccacgccc atcatgacct tgccaagctc gtcctgcttc tcttcgatct tcgccagcag 22560 ggcgaggatc gtggcatcac cgaaccgcgc cgtgcgcggg tcgtcggtga gccagagttt 22620 cagcaggccg cccaggcggc ccaggtcgcc attgatgcgg gccagctcgc ggacgtgctc 22680 atagtccacg acgcccgtga ttttgtagcc ctggccgacg gccagcaggt aggccgacag 22740 gctcatgccg gccgccgccg ccttttcctc aatcgctctt cgttcgtctg gaaggcagta 22800 caccttgata ggtgggctgc ccttcctggt tggcttggtt tcatcagcca tccgcttgcc 22860 ctcatctgtt acgccggcgg tagccggcca gcctcgcaga gcaggattcc cgttgagcac 22920 cgccaggtgc gaataaggga cagtgaagaa ggaacacccg ctcgcgggtg ggcctacttc 22980 acctatcctg cccggctgac gccgttggat acaccaagga aagtctacac gaaccctttg 23040 gcaaaatcct gtatatcgtg cgaaaaagga tggatatacc gaaaaaatcg ctataatgac 23100 cccgaagcag ggttatgcag cggaaaagcg ctgcttccct gctgttttgt ggaatatcta 23160 ccgactggaa acaggcaaat gcaggaaatt actgaactga ggggacaggc gagagacgat 23220 gccaaagagc tacaccgacg agctggccga gtgggttgaa tcccgcgcgg ccaagaagcg 23280 ccggcgtgat gaggctgcgg ttgcgttcct ggcggtgagg gcggatgtcg aggcggcgtt 23340 agcgtccggc tatgcgctcg tcaccatttg ggagcacatg cgggaaacgg ggaaggtcaa 23400 gttctcctac gagacgttcc gctcgcacgc caggcggcac atcaaggcca agcccgccga 23460 tgtgcccgca ccgcaggcca aggctgcgga acccgcgccg gcacccaaga cgccggagcc 23520 acggcggccg aagcaggggg gcaaggctga aaagccggcc cccgctgcgg ccccgaccgg 23580 cttcaccttc aacccaacac cggacaaaaa ggatccccaa ttctcatgtt tgacagctta 23640 tcatcgataa gctttaatgc ggtagtttat cacagttaaa ttgctaacgc agtcaggcac 23700 cgtgtatgaa atctaacaat gcgctcatcg tcatcctcgg caccgtcacc ctggatgctg 23760 taggcatagg cttggttatg ccggtactgc cgggcctctt gcgggatatc gtccattccg 23820 acagcatcgc cagtcactat ggcgtgctgc tagcgctata tgcgttgatg caatttctat 23880 gcgcacccgt tctcggagca ctgtccgacc gctttggccg ccgcccagtc ctgctcgctt 23940 cgctacttgg agccactatc gactacgcga tcatggcgac cacacccgtc ctgtggatcc 24000 tctacgccgg acgcatcgtg gccggcatca ccggcgccac aggtgcggtt gctggcgcct 24060 atatcgccga catcaccgat ggggaagatc gggctcgcca cttcgggctc atgagcgctt 24120 gtttcggcgt gggtatggtg gcaggccccg tggccggggg actgttgggc gccatctcct 24180 tgcatgcacc attccttgcg gcggcggtgc tcaacggcct caacctacta ctgggctgct 24240 tcctaatgca ggagtcgcat aagggagagc gtcgaccgat gcccttgaga gccttcaacc 24300 cagtcagctc cttccggtgg gcgcggggca tgactatcgt cgccgcactt atgactgtct 24360 tctttatcat gcaactcgta ggacaggtgc cggcagcgct ctgggtcatt ttcggcgagg 24420 accgctttcg ctggagcgcg acgatgatcg gcctgtcgct tgcggtattc ggaatcttgc 24480 acgccctcgc tcaagccttc gtcactggtc ccgccaccaa acgtttcggc gagaagcagg 24540 ccattatcgc cggcatggcg gccgacgcgc tgggctacgt cttgctggcg ttcgcgacgc 24600 gaggctggat ggccttcccc attatgattc ttctcgcttc cggcggcatc gggatgcccg 24660 cgttgcaggc catgctgtcc aggcaggtag atgacgacca tcagggacag cttcaaggat 24720 cgctcgcggc tcttaccagc ctaacttcga tcactggacc gctgatcgtc acggcgattt 24780 atgccgcctc ggcgagcaca tggaacgggt tggcatggat tgtaggcgcc gccctatacc 24840 ttgtctgcct ccccgcgttg cgtcgcggtg catggagccg ggccacctcg acctgaatgg 24900 aagccggcgg cacctcgcta acggattcac cactccaaga attggagcca atcaattctt 24960 gcggagaact gtgaatgcgc aaaccaaccc ttggcagaac atatccatcg cgtccgccat 25020 ctccagcagc cgcacgcggc gcatctcggg cagcgttggg tcctggccac gggtgcgcat 25080 gatcgtgctc ctgtcgttga ggacccggct aggctggcgg ggttgcctta ctggttagca 25140 gaatgaatca ccgatacgcg agcgaacgtg aagcgactgc tgctgcaaaa cgtctgcgac 25200 ctgagcaaca acatgaatgg tcttcggttt ccgtgtttcg taaagtctgg aaacgcggaa 25260 gtcagcgctc ttccgcttcc tcgctcactg actcgctgcg ctcggtcgtt cggctgcggc 25320 gagcggtatc agctcactca aaggcggtaa tacggttatc cacagaatca ggggataacg 25380 caggaaagaa catgtgagca aaaggccagc aaaaggccag gaaccgtaaa aaggccgcgt 25440 tgctggcgtt tttccatagg ctccgccccc ctgacgagca tcacaaaaat cgacgctcaa 25500 gtcagaggtg gcgaaacccg acaggactat aaagatacca ggcgtttccc cctggaagct 25560 ccctcgtgcg ctctcctgtt ccgaccctgc cgcttaccgg atacctgtcc gcctttctcc 25620 cttcgggaag cgtggcgctt tctcatagct cacgctgtag gtatctcagt tcggtgtagg 25680 tcgttcgctc caagctgggc tgtgtgcacg aaccccccgt tcagcccgac cgctgcgcct 25740 tatccggtaa ctatcgtctt gagtccaacc cggtaagaca cgacttatcg ccactggcag 25800 cagccactgg taacaggatt agcagagcga ggtatgtagg cggtgctaca gagttcttga 25860 agtggtggcc taactacggc tacactagaa ggacagtatt tggtatctgc gctctgctga 25920 agccagttac cttcggaaaa agagttggta gctcttgatc cggcaaacaa accaccgctg 25980 gtagcggtgg tttttttgtt tgcaagcagc agattacgcg cagaaaaaaa ggatctcaag 26040 aagatccttt gatcttttct acggggtctg acgctcagtg gaacgaaaac tcacgttaag 26100 ggattttggt catgagatta tcaaaaagga tcttcaccta gatcctttta aattaaaaat 26160 gaagttttaa atcaatctaa agtatatatg agtaaacttg gtctgacag 26209 <210> 149 <211> 23013 <212> DNA <213> Artificial Sequence <220> <223> synthetic plasmid pCX096 <400> 149 ctcgggccgt ctcttgggct tgatcggcct tcttgcgcat ctcacgcgct cctgcggcgg 60 cctgtagggc aggctcatac ccctgccgaa ccgcttttgt cagccggtcg gccacggctt 120 ccggcgtctc aacgcgcttt gagattccca gcttttcggc caatccctgc ggtgcatagg 180 cgcgtggctc gaccgcttgc gggctgatgg tgacgtggcc cactggtggc cgctccaggg 240 cctcgtagaa cgcctgaatg cgcgtgtgac gtgccttgct gccctcgatg ccccgttgca 300 gccctagatc ggccacagcg gccgcaaacg tggtctggtc gcgggtcatc tgcgctttgt 360 tgccgatgaa ctccttggcc gacagcctgc cgtcctgcgt cagcggcacc acgaacgcgg 420 tcatgtgcgg gctggtttcg tcacggtgga tgctggccgt cacgatgcga tccgccccgt 480 acttgtccgc cagccacttg tgcgccttct cgaagaacgc cgcctgctgt tcttggctgg 540 ccgacttcca ccattccggg ctggccgtca tgacgtactc gaccgccaac acagcgtcct 600 tgcgccgctt ctctggcagc aactcgcgca gtcggcccat cgcttcatcg gtgctgctgg 660 ccgcccagtg ctcgttctct ggcgtcctgc tggcgtcagc gttgggcgtc tcgcgctcgc 720 ggtaggcgtg cttgagactg gccgccacgt tgcccatttt cgccagcttc ttgcatcgca 780 tgatcgcgta tgccgccatg cctgcccctc ccttttggtg tccaaccggc tcgacggggg 840 cagcgcaagg cggtgcctcc ggcgggccac tcaatgcttg agtatactca ctagactttg 900 cttcgcaaag tcgtgaccgc ctacggcggc tgcggcgccc tacgggcttg ctctccgggc 960 ttcgccctgc gcggtcgctg cgctcccttg ccagcccgtg gatatgtgga cgatggccgc 1020 gagcggccac cggctggctc gcttcgctcg gcccgtggac aaccctgctg gacaagctga 1080 tggacaggct gcgcctgccc acgagcttga ccacagggat tgcccaccgg ctacccagcc 1140 ttcgaccaca tacccaccgg ctccaactgc gcggcctgcg gccttgcccc atcaattttt 1200 ttaattttct ctggggaaaa gcctccggcc tgcggcctgc gcgcttcgct tgccggttgg 1260 acaccaagtg gaaggcgggt caaggctcgc gcagcgaccg cgcagcggct tggccttgac 1320 gcgcctggaa cgacccaagc ctatgcgagt gggggcagtc gaaggcgaag cccgcccgcc 1380 tgccccccga gacctgcaga tccacatcct tgaaggccgc agcgacgagc agaaggaaac 1440 cctcattcgg gaagtcagcg aggccatctc gcgctccctg gatgcgccgc tgaccagcgt 1500 gcgagtgatt atcacggaga tggccaaggg ccacttcggc atcggcggcg aactggccag 1560 caaggtcaga cgctgaagtg gagatgccca agggcacttc gggtcgagga acccgacctg 1620 cattgggacg cggccacgga gagcgcgggc aaacgccggc actatagcca gtggagtttg 1680 taaaacgcta tttcagagct tggagagtgt ctaagaaagc cggggcgatg ccaacccatc 1740 ccttcttcgg ctatgcatcg ttcgtaatca agccacttcc tttttgcatt gacgcagggt 1800 gtcggaaggc aactcgccga acgcgctcct atagttttca gcgaagcgtc ccaaatgtaa 1860 gaagccgtag tctagggcta tctcagttat actacgcaca ttggcactgg gatcgttcaa 1920 gcaggcgcgg atgctttcga gcttgcggtt gcggatgtag ttcttcggcg tggtgccggc 1980 atgcttctcg aacaaattgt agagcgagcg tggactcatc atcgccagct ccgctaaccg 2040 ctcaaggctg atattccgtt tgagattctc ctcaatgaat tgaacgactc gctcgaaaga 2100 cgggttacct ttgctgaaaa tttcacggct gacattgctg cccagcattt cgagcagctt 2160 ggaagcgatg atccccgcat agtgctcttg gacccgaggc atcgactttg tatgttccgc 2220 ttcgtcacaa actaacccga gtagattgat aaagccatcg agttgctgga gattgtgtcg 2280 cgcggcgaaa cggataccct ccctcggctt gtgccaattg ttgtcactgc atgcccgatc 2340 aaggaccact gagggcaatt taacgataaa tttctcgcaa tcttctgaat aggtcaggtc 2400 ggcttggtca tccggattga gcagcaatag ttcgcccggc gcaaaatagt gctcctggcc 2460 atggccacgc cacaggcaat ggcctttgag tattatttgc agatgataac aggtctctaa 2520 tccaggcgag attaccctca cgctaccgcc gtagctgatt cgacacaggt cgaggcatcc 2580 gaagattctg tggtgcagcc tgcctgccgg gcgcccgccc ttgggcaggc gaatagagtg 2640 cgtaccgaca tactggttaa cataatcgga gactgcatag ggctcggcgt ggacgaagat 2700 ctgacttttc tcgttcaata agcaaaaatc catagttcac ggttctctta ttttaatgtg 2760 ggctgcttgg tgtgatgtag aaaggcgcca agtcgatgaa aatgcatctc gacgtgatgc 2820 gtatacgggt tacccccatt gccacgttgc gccatccttt ttgcaatcag tgaccacttt 2880 tccaagcaaa aataacgcca agcagaacga agacgttctt tttaagaagc gagaacacca 2940 gaagttcgtg ctgtcggggc atgcggcgac gaattggcgg ataaagggga tctgcaggtc 3000 ccgagcctca cggcggcgag tgcgggggtt ccaagggggc agcgccacct tgggcaaggc 3060 cgaaggccgc gcagtcgatc aacaagcccc ggaggggcca ctttttgccg gagggggagc 3120 cgcgccgaag gcgtggggga accccgcagg ggtgcccttc tttgggcacc aaagaactag 3180 atatagggcg aaatgcgaaa gacttaaaaa tcaacaactt aaaaaagggg ggtacgcaac 3240 agctcattgc ggcacccccc gcaatagctc attgcgtagg ttaaagaaaa tctgtaattg 3300 actgccactt ttacgcaacg cataattgtt gtcgcgctgc cgaaaagttg cagctgattg 3360 cgcatggtgc cgcaaccgtg cggcacccta ccgcatggag ataagcatgg ccacgcagtc 3420 cagagaaatc ggcattcaag ccaagaacaa gcccggtcac tgggtgcaaa cggaacgcaa 3480 agcgcatgag gcgtgggccg ggcttattgc gaggaaaccc acggcggcaa tgctgctgca 3540 tcacctcgtg gcgcagatgg gccaccagaa cgccgtggtg gtcagccaga agacactttc 3600 caagctcatc ggacgttctt tgcggacggt ccaatacgca gtcaaggact tggtggccga 3660 gcgctggatc tccgtcgtga agctcaacgg ccccggcacc gtgtcggcct acgtggtcaa 3720 tgaccgcgtg gcgtggggcc agccccgcga ccagttgcgc ctgtcggtgt tcagtgccgc 3780 cgtggtggtt gatcacgacg accaggacga atcgctgttg gggcatggcg acctgcgccg 3840 catcccgacc ctgtatccgg gcgagcagca actaccgacc ggccccggcg aggagccgcc 3900 cagccagccc ggcattccgg gcatggaacc agacctgcca gccttgaccg aaacggagga 3960 atgggaacgg cgcgggcagc agcgcctgcc gatgcccgat gagccgtgtt ttctggacga 4020 tggcgagccg ttggagccgc cgacacgggt cacgctgccg cgccggtagc acttgggttg 4080 cgcagcaacc cgtaagtgcg ctgttccaga ctatcggctg tagccgcctc gccgccctat 4140 accttgtctg cctccccgcg ttgcgtcgcg gtgcatggag ccgggccacc tcgacctgaa 4200 tggaagccgg cggcacctcg ctaacggatt caccgttttt atcaggctct gggaggcaga 4260 ataaatgatc atatcgtcaa ttattacctc cacggggaga gcctgagcaa actggcctca 4320 ggcatttgag aagcacacgg tcacactgct tccggtagtc aataaaccgg taaaccagca 4380 atagacataa gcggctattt aacgaccctg ccctgaaccg acgaccgggt cgaatttgct 4440 ttcgactatc ggcgcgccag agctcatcgt taatgtcttc gtgcgccgtc agtcggcgca 4500 cgttttttct ctctggtacc gtgtcactga tctagtcaat tactcgaagt atccacaagt 4560 gaagcatact aagtaatgta caagaatcaa aaaaatcggc tacgcaagtc gcgtagccga 4620 atcatttaag gatccttcca ttcaggtcga ggtggcccgg ctccatgcac cgcgacgcaa 4680 cgcggggagg cagacaaggt atagggcggc gcctacaatc catgccaacc cgttccatgt 4740 gctcgccgag gcggcataaa tcgccgtgac gatcagcggt ccagtgatcg aagttaggct 4800 ggtaagagcc gcgagcgatc cttgaagctg tccctgatgg tcgtcatcta cctgcctgga 4860 cagcatggcc tgcaacgcgg gcatcccgat gccgccggaa gcgagaagaa tcataatggg 4920 gaaggccatc cagcctcgcg tcgcgaacgc cagcaagacg tagcccagcg cgtcggccgc 4980 catgccggcg ataatggcct gcttctcgcc gaaacgtttg gtggcgggac cagtgacgaa 5040 ggcttgagcg agggcgtgca agattccgaa taccgcaagc gacaggccga tcatcgtcgc 5100 gctccagcga aagcggtcct cgccgaaaat gacccagagc gctgccggca cctgtcctac 5160 gagttgcatg ataaagaaga cagtcataag tgcggcgacg atagtcatgc cccgcgccca 5220 ccggaaggag ctgactgggt tgaaggctct caagggcatc ggtcgacgct ctcccttatg 5280 cgactcctgc attaggaagc agcccagtag taggttgagg ccgttgagca ccgccgccgc 5340 aaggaatggt gcatgcaagg agatggcgcc caacagtccc ccggccacgg ggcctgccac 5400 catacccacg ccgaaacaag cgctcatgag cccgaagtgg cgagcccgat cttccccatc 5460 ggtgatgtcg gcgatatagg cgccagcaac cgcacctgtg gcgccggtga tgccggccac 5520 gatgcgtccg gcgtacaaga tccacaggac gggtgtggtc gccatgatcg cgtagtcgat 5580 agtggctcca agtagcgaag cgagcaggac tgggcggcgg ccaaagcggt cggacagtgc 5640 tccgagaacg ggtgcgcata gaaattgcat caacgcatat agcgctagca gcacgccata 5700 gtgactggcg atgctgtcgg aatggacgat atcccgcaag aggcccggca gtaccggcat 5760 aaccaagcct atgcctacag catccagggt gacggtgccg aggatgacga tgagcgcatt 5820 gttagatttc atacacggtg cctgactgcg ttagcaattt aactgtgata aactaccgca 5880 ttaaagccga gcgatgataa gctgtcaaac atgagatcca atctagattg tttaaacttc 5940 tgcagaacac gcggtgttaa cgtttcttat acttcttaat tttgttaaag atcatttcgc 6000 cgtagtacac cgcattgacc tgggtcttca ccagcaagta gccgcgaaat ttcttaaaca 6060 acttcatgtt cggtttaaag tcggcttgcc agaactgatg caaatgcccc tggtacgtca 6120 gacccttgat atcgtacaag gcgttgccca tgactttcag gggcttgttg tggatcaacg 6180 cggaaatgcc ggccgtgcta ttgatggtga ccaccgcttt ggcgtggcgc aacagctccg 6240 gcatgggcag atcgtgcaca tagatgacac gttcatccaa accgtattcc ttcgacagac 6300 gcttgatcaa cgggcggtac aggcggtgcc cgcgatccat cgggtgatgt ttgatcacca 6360 gataggactc cttgggggcc ttgcgggaaa agctgtacat cacttcgttg atgtaatcac 6420 gcacatcatt atagttgcta tggttgcgga tctggctgtc gttgtacact tgcaggaccg 6480 ccaggtaata gcgctgatcc agctcgttca tcaggcgggg gaggaccttg cgttgggtga 6540 ccttatacag ctgtttgcgc cagtaggcgc ggacccagca gcgcgcttca taccacgggc 6600 tgaacgattt gtggtggcga tagcgcggaa attcgtgacg atagtgccaa cccatcaggt 6660 aataccacat ggcgtggccg atgcgcttca tggtgctcgg tttcaggttc tcgacgtgcg 6720 gcgtcggcat atcgggcaat ttgcggtaaa agtccggatc gcggggcaag ctgctatagg 6780 cgttcacacc gccttcttcc acggtgataa attgcggacg caggtagcct tcctcgaagg 6840 ccagaaaacg aatccccttc gacttggccc agcgtttggc ctccttgtgc agcaggcggc 6900 agtcaccgaa acacaaaatc gtgtcaaagt catactgacg atgcaagtcc cgcagccaac 6960 cggggaactc cttcggggtt tggtagtacg ccaggtattg gcggtggcgg cagtagaagc 7020 gatcaccgcc attaaagacg acgttgaccg cgttgcgacc gaggctctcc aaccattccg 7080 ccacatcgtt gaagaacgga cccatcggac cttggagcag gaggtacttt ttaccgctca 7140 acagcaccgt cagcgcattg ccgtgcattt attaacctcc taacacgcgg tgttaagcgt 7200 tttcggcgag ctcttaacca aagcgcactt tgcagaacat gatcaacttg cgatagtagc 7260 gaatcacacg gccggctttc ttgcgggtga taaagatggg tttgcggggc gttttgatca 7320 gatattctgc cgcttcctcc accgtgatcg gctgcaaccg cgtcggatga atataggtgg 7380 gatagacaat cagggcttga tagatcaggt cggcgatggt cagccgccgc tcgcgacggg 7440 ggcagtggtg ctcatcgacg gtcaggcccc acgaggcgta gaacggcagg ccgtagcagt 7500 gcacctgttt accgtgcagc aatgcttcaa agccgctgag gctcgtcatc gtgtgcacct 7560 cgtccgcacg ctgaatacac tgaatgatat cggcatccag tgcctggtag tctgcgagtt 7620 ccgcgatctg ttccgccgga atgtcaccct tacggttgcc gacgagcaca tcggggtgcg 7680 gcttgtagat gatgtaggcg tgcggattac gttcccgcac ggtgcgcagc agctccagat 7740 tcgacttgat cgacacggtg cccgtcttaa tcgacgcatc gtcttccacc tggcccggca 7800 ccaggatgac tttcttgtcc ttcgcttctg ccgggaggct gaaatcggcc cccaggttat 7860 atttgctcaa tttgctttcc accagacgtt ggcgcaactt ttccgcgcgc atctggtgcg 7920 cgagggtcag ctggctgtga ttcagcagga cctccagttc cgacggacgg gtggcatcgt 7980 aatagatacc gcgcttatcc aggaccaggc tcaacggcgg cagcagatcg ctccccaggc 8040 cggagctgcg caggaagccg tcttccatgc gccacagcgg cagggatttg cgctgtgcct 8100 ccgcacgcca ttgctgttcg cctttcacgc cccacacgac gcaggcgctt gctgcggtac 8160 agcgacggga aaaggagaga cgattcgtgg ccgtttgcag gaagggcttc aggatcgcgc 8220 ttttccacag ggtcaggccc ggcacccaga gataaccatt ccgctgttgc aggtgacgac 8280 gttgcagctg gagccattgg agcaccgtga acagggccga cacctccccg gtctgcggat 8340 caatgtagcg gcaatagcgc agataggccg ctgcgaacag ttcctccagg gtggccgagc 8400 cgcgacgcgc cgacagcagc gccgattggg ggtggcggtc atcggtgagg ccccaccctg 8460 cataccaggg ttggccaaag caggtcacgg gcttaccggc cagcagggct tcaaaaccgt 8520 actgggaggt cacgacgtac acgcgggaca catgacgcag cagggactgc ggcgacacgt 8580 tttccgcaat caggcgcacg cgctgggtgg cacgcaagtc cgcgaagtag ccggtctttt 8640 tcccttccag gacatcggga tgcactttga cccagatttc tgcctgcggg ttttccgcca 8700 tcgctgcttc cagcattgcg gcgaactcat gggggcctgc gttgccgtag gtcacgctca 8760 tgtcattgaa ggtctggtcc accaccagca cgatgttcgt gcgctcgctt tcatccgcca 8820 cgaacgccgg tgccaggttg tacttgctca tgtcgcccgt cacaatggtg tgcatcgcct 8880 cgcgcgcctg atccgccagg gccgcgttgc cggccttgtc ctgcacgagt ttttccagcg 8940 cgctcggttt cgaggcgtcg tagtaaatgc cgcagtcatc cacgacgagc gagaggggcg 9000 gttcaccgtt cacgcccagg tccagcgagc ggacgaaacc atcctccaag cggatcaccg 9060 gcttgcctgc ggctttggcg atggccaccg gctttgcggc cgaggggcgg tgcccccaca 9120 ccgcgattgc atccacttcc tgcgggaccg ggcgcagcag cgacagcttt tggcagggct 9180 gggcgaggaa tttttccagg tgcggaatac gccaaatgcc ggggctataa atgccaatca 9240 tgcgttctcc gcgagctcct gcgccatcag ggcccggacc ttctccaagc acgccggggt 9300 atcgacgccg ggaccggtcg cggcgacctc gaaggtgcga atgttaatgc ccgcgctcat 9360 cagccgcagt tgctccaggg attcggcctg ttcgggcatg gactccggca actggctgta 9420 attttgcagg acatcccgcc gataggcgta gatcccgacg tgcttcaggt agcgcgcctt 9480 ctcggcgttg cgcgggtacg gaatggggga gcgggagaaa tacagggcgt cctgccgcgt 9540 gttcaccacg accttgacgg tggacggttc ggcggcttct gccgcgctga tcgcatgaca 9600 cagggtcgcc accggcagcg ccgggtcgtc ccgcatacct tgcagcaggg tttcgacgtc 9660 acgcgggcga atcatcggct catccccttg caggttgata tagatatccg cctccacctt 9720 atgcatgact tccaccaggc gatcggtgcc gctctcatga tcgttgcggg tcatgatcgc 9780 tttgccgccg aacgcctgga ctgcctgctc cacacgcggg tcgtcggttg cgacccacac 9840 ctctgccacg cctgccactt gcagggcccg ttcgtagacg tgctggatca tcggtttccc 9900 gacgatatcc agcagcggtt tgcccggcag acggctgctg ccgtagcgtg ccgggatcac 9960 aatcacggcc ttcgacattt attaacctcc tcgagttaca gcgacagaat cactttcgcg 10020 cccaccgcca gttggtacag aatggtgctg ataccgcgcg tcacttcgat gttcttcgac 10080 tcgtatttcg gcaacaccat aatttcatca ccgggtttca gggaatcgac gtcttctgcg 10140 ttcaccgctg cgccgttctg acggatgacg ataatacggg cgttgccgga cttctgggtc 10200 agcccaccgc acttctcgat gtagtcctcg gtcgtcatac ctttctgcca cgacaccgcg 10260 ttcgggaaca gcacttcccc gtggaccatg accaacgacg tcttttcggg aatattgatc 10320 acgtcgccgt cctccaggag gacggagtca atgttgcttt cattgaggat cacttcgccc 10380 ttcggcacga cggtgcgggc tttcgcgacg aagcgggaga tcagttgggc ttcctgcata 10440 cgcaggctgg cctcttcctt ggtgctgctc tgtgcgctga ggctggcctc ttcgagcttt 10500 tgcagggaca aattcagcat ttctttctgc cgttgcgcga cgctcggccg atacaactgc 10560 acggcgttca tctgcgacat ggagttcggg cgcacttttt cgagcacggc ccgcatggtg 10620 ctaccgtagg gcagcaccat ggcgtgttcc ccggaatgtg cgccttccac acgcacttga 10680 atggtgcccg catagcggtc ggtggagaca atgagggtat caccgttttg cagcatacgc 10740 cccggtgcgg acgagatcgg ataatattcc gagcgcttct ggaggccctg cttccgcata 10800 atcgtgatat gggtcgcacc cggtttggga cgtgcccagg acagtgcttc ggtgaccggg 10860 atgctcgatt cgcgaaattc aaagtcgtag gaattgaaca catcgccctg caccgagaac 10920 gtatgctggc gcggacccac aatgatcgta tcaccgtccg caaactggga cagccccagt 10980 ttgccgttga gcaggaagtc atagaggttg acgttcgagc gcacacgatt gccgcgtttc 11040 acgacgatgt ccacgtagct gccgcgttcc gggtccacac cacccgcctt gatcaggtag 11100 ttcagcaggc tgtcggaggt gacaccgccg tacaggccgg ggttgcggac aaagccggtc 11160 acatagacct tgaccggctg cgcctgcaag agcgacgcat agacgttcac gttgctctgg 11220 tagacttcct tcaccttgct cgtcaccagc gcgttcaact gggagttcga cacacctgcg 11280 actttgacgg ggccgacatt cggcaggaag atgttgccct tcgggtccac ctggagtgcg 11340 ccatcgaagg tgaacgcacc ccacaggcgg acctggatgg aatcgccggg attcaggatg 11400 tagtccggat tgaaacccac ggttgccccc gagtctgcgc tcgtaccgtt gaacagctgc 11460 gccccgaaca tacggctcat cacgaccggg ggtgcggggg gcggggtgtt atcgaagccg 11520 ctcatgttct gggtgtcgct tttctgcccg ttcaggatgc cggtcaacgg tgcggcaccc 11580 gtgaggttcg gatcggcatt aatgtcgatg gttgcgctcg cctgtgctgc atggcacgct 11640 gcgatcagca ggatcgactt aaacagcttc atttattaac ctcctcgaga agtcgactta 11700 gtcacggtgg tcttcaatca ccgccaggag caatttcagg gtgccaaaga gcaggcaaca 11760 caccagcagc caacacgcga tcaaatacgg gatattcggg aaggagcttt cctggggcag 11820 ctgcggggac gagatcacgc tcaggacttt cagcttacgg gccgcttcga cacgggtctt 11880 ttcgatgctg gtgagcgtga gcttgtacaa ctcggtattg aactcgacct tggatttgat 11940 ctcctcaaaa tccacggcca tgcggttcag tttatcgccc tggggtgcgg taattttcga 12000 cttttcttcg tcgatctgtg cctggaggct ctgaattgca ttgcgggcgc tcacgacttg 12060 gggcgcatcc tcgcgcaggt acgtgagcag gttgcgcagg tcggcttcca tctgaatttt 12120 ctggcccatc agcgtattca ccagggtgga tgccgcctgg gcctgtgcct gcgggtccag 12180 cacattgttg ttgtcttggt aggacaacaa ttcggctttc gatgcatcca gccgctggcg 12240 cgctttttcc atttcggttt ccgcaaacgc caattgatcg cgggcgatac ggtgcgacat 12300 ttcattgatg aaccgctcgg attccttgag cacggtctgg ttgaatttca gcgcgaactc 12360 gggcgaaaag ccctgggtct ggatgttcag cagcccggtc ttgtcgtcgt agctgacgtt 12420 gatgcgatct ttatagtact tcaggaaccc ctcggcggtt tcatccttgg acagatggtt 12480 caggaagtcc aggcccgaat gggagaacgc ttcgcggaag ttcagctgtt tatccagcgc 12540 ggccagcata tccgggctgt tgatgtattc cttcaggtac agtgcgtctt cggcggacga 12600 cgggttggag gcacccaaca gcaggccgaa gttcaggctg ccggagttga gatcgtcgct 12660 gcgcttgatg gccaccttgc tttccgacat atagcggggc tgggagaaga tcgccaagta 12720 gatcagcagc accgccatgg gtgccagaat aatgattttt gccaggtgct tctgaatatc 12780 tgccaggctg atcgcgctca gacgcgcacg catccacgag acggcgcttt tcactttgat 12840 cagcatttat taacctcctg tcgacaacac gtgttaatcg aaaatgcgca ccaacccggt 12900 caccttattt gctttgttgg tcaccagcag ggtcgagacg cggtgtttct gcatcttctc 12960 ttctgcttcg atgatcatgg tgtcttcggg caaggtcagc ggttcgcggg tcatcatctg 13020 tgcggccgtt gcgctcgtca ggctgtcttc tttctccata aagcgccgca gatcgccatc 13080 ggtgatgatg cctgccagcc caccttccgc atcttcgacc atcaccatac cctggcagcc 13140 cgaggtgatg cgctgaatga ccgttttgaa gctggcatcg agctgcactg ccggcacatc 13200 atgttgcatc acgtcggcga cgcgggtcag caggcgccga cccaggctgc caccggggtg 13260 gtagcgtgca aagtcattgg gcataaactt acgctggtga atcatcgcga tggccagcgc 13320 gtccccgatc gccatcgtga gcgtcgtgga ggtggtcggg gcgagattgt tcgggcacgt 13380 ttcgttcgcc atgtgcagct ccaggaccgc atctgcattt ttggccaggg tgctattccc 13440 gttattggtg attgcgatga tgcgattgcc gaagttcttc aggctcggca ccagtttcag 13500 gatctcgtcc gtctcaccgc tcgccgaaat caagatgagc aggtcatacg gggtgatcat 13560 gcccagatca ccatggaacg cttccgccgg atgaataaag aaggagggcg tcccggtcga 13620 ggccaaggtc gccgacatct tgcggcccac atggccgctt ttacccatgc cgctcaggat 13680 gacgtgccct ttacaattca tgatgagatt caggacgcgc tggtactgac cgctatccag 13740 ttgtttggac aggttttgca gtgccgcgct ttgttcggcc agggtctggc ggacgctcgt 13800 aatcagatac ggatcaatgg tcgaggactg gtcatccggc aagtggcgtt cgctcattta 13860 ttaacctcct cacgtgttaa ttaatgtttc tgttgcataa agcctaaggg gtaggccttt 13920 ctagagatag ccattttttg cactcctgta tccgcttctt gcaaggctgg acttatccct 13980 atcaaaccgg acactgcatc gattgataga tttaaataag aactgcagaa gctagcttag 14040 atgctcgtga aattgacgtg ggcgctttgc agggccgtct taatggcgtt ggtgtccacg 14100 aggatcgagt cgggtgcgga aaacggacgg ttcttgttgg tgaaatcgct gttaccaatg 14160 tacagcgatt ccttgttacg cagcgcctgg atgtgccagc gggaccacga atcccaatac 14220 ttctggcgat ccggcgagat accttggctg gtgtagccgg tcgtcgggct gttcatcaac 14280 gagtcggtgc ggtgcgagcc cagcgtcagc ggcaacttga tccgatgcac cgtggaatcg 14340 ccgaagatca gcttcagacg cgcgataaat tcgctatccg cacccgtttt cacacaatcc 14400 cagacaccgg ccttctgcaa gacgtcggca cggcgaaaca ggagcgacga cggattcaga 14460 cgcttcaagg ggtacactgc gcgggcatag aaaataccgt tgtcttgcag gcgcacccag 14520 tccgagatgg agcagatgag cttcggattg agcaacaagg gggagatttg gcggaacagc 14580 ttttccggat ggctccagtc atccgaatcg tggcaggtga cgaactcgcc cttcgcttgg 14640 atcaagccga tacgcttcgc ggcataggtg ccgacattct gcggcaggct aatgatcttg 14700 atgcgcgtgt ctttgagggc gagccgctgg agacgaaaca gggtgtcatc ggtgctcgcg 14760 tcatccacaa tgatcagctc gaaggaacgg taggtctgat tgaggagcga aatcaccgca 14820 ttttccacgc ggcgacccgt attataggtg gtcatcagga tggagatcaa cggccccgtc 14880 tgggccgggt acgggatgct ggtgatgatg ttgcacgggg agagcgggga gctgttgtcc 14940 gtcaaggcca cggggctgag gccgaagtat ttatagtatt cattcagccg attcaggcta 15000 atttcggcgg tttcgcggaa ggcgttattt tgcagcagca ggatatccgg gctatagacg 15060 atatcggatg cgtcgatctg ggcgagggtc gagatggcct tttgggtcag gccgatccgg 15120 agttgcagtg cggtatacag gtccagcggg cagttgtcca cgttgtccaa caggctcagg 15180 ctaaaggtcg gcgagtagga cgccagggtt ttcgccagtt ccactttctg atgggtatcg 15240 gtgaactcgt ccttgaactc catcagcagc tcgggcgtca ggctgatgtc gccgcaggcg 15300 atttttgcga tcttgattgc cagtttgcag cgccaatcgg acggggtatc cgtcaagtta 15360 tgcagcgacc agtacatatt cagacgatac atcgcgagga tgcgtttcga ctgccagaac 15420 cggcaatcat cctggatggc cgcgagcgcg tggacgtagc ggctcttttt gagcagccac 15480 aagaatttga gattattgaa catttattaa cctcctgcta gcaacttaag ttacgaatcg 15540 acgccgaaca ggtcgcgggt gtagactttc tccgagacat cttccagttc gctggtgcgg 15600 cgattcgcca caatgacatc gacgcgctcc ttaaaggaat tgatgtcgcg ctcgacgtag 15660 gaaccgaaga agtagggttc tttcaggacc ggctcgtaca ccacaatctc gatacccttg 15720 gccttcaaac gtttcatgac cccctggatg ctgctggccc ggaaattgtc gctacccgcc 15780 ttcatgatca ggcgatagat accgaccact ttgggcttac gggacaggat gtcctcggcc 15840 acgaagtcct tacgggtcgt attcgcatcc acgatggcct ggatcaggtt ttgcgggacg 15900 tcgcgataat tggccaacag ctgcttcgta tccttcggca gacagtaacc gccgtagccg 15960 aaggacgggt tgttgtaatg ttgaccaatg cgcggatcga gggagacgcc ttcgatgatt 16020 tgtttggtat ccaggccgtg cacgctcgcg taggtgtcca gctcgttaaa gtacgcgata 16080 cgcatcgcca gatacgtgtt cgcgaacagt ttgatggctt ctgcctcggg cgaatccgtc 16140 agcaggatcg gaatatcctt tttgatggca ccttccgaca ggagttcggc gaacttccgt 16200 gcgcgttccg acgattcgcc cacgacaatg cggctcggat agagattatc atacagggct 16260 ttgccttcgc gcaggaactc cggggaaaag atgatattat tcgtgttcag atcgcgcttc 16320 aggcgttcgg tgaacccgac ggggacggtg gatttgataa tgatggtcgc gttcgggtta 16380 atggacagca cgtcacacgc gacgctttcg acgctcaggg tatcaaagtt gttattaatc 16440 ggatcatagt tcgtcggggt ggcgatgatc acgtagtctg catcgcgata tgcctcgtat 16500 ttttccgtcg tcgcgtagag gttcagctta cgattggaga gaaacttctg gatttccggg 16560 tcgcaaatcg gcgagatttt cttgttaatg agctggacct tcttcgggtc gatgtccagg 16620 gcgatgatgt cgtgtttttg ggagaggagg atcgcaatgc tgatacccac atagccgacg 16680 ccggccacgg caattttcat ttattaacct ccttaagtga attcaaacta gtttacaagt 16740 cgttttcgat cttctcccag gtatatttgc gacattcatt caagttggtc agcggcgagt 16800 atttgtactt tttgataccg aggcgcgaca ggctttcgtt caccaccttg aaatggtttt 16860 ccttttggat gtccagtttc ttgatcgacg tgttctcgcc gtgcaggaca cggttgtagc 16920 aaatcttatt gatatgctta aacgggccga cttcgctgag tttcaaatac atatcgtaat 16980 ccaccgcatt gctgatgctc tcgttgaagc cttcggtgag gttccatgca cgcgccgtga 17040 acatacggaa gtggtggcag atcatcgcgc tcgtgagctt ttcgcggctg taaatcggcc 17100 agttgtagcc attgctaatc aagttacctt cacgatcaat attgcgattg gtggtgtaca 17160 cgcaggcgag gctcaggtct ttgcgaaatt catccagaca cagttccacg gcatcgggct 17220 ccaggaaatc atcggaatcc agctgcccga tgtagaaacc ccggcacagg cggactgcgg 17280 tattcgaggc ggagccgatg cctttgtttt tctggctgat gaaacggacg cgcgggtggt 17340 ttgcgtaatg ttcttgcagg atgcgcagcg tatcatcggt gctcccgtca tcgcagatgc 17400 agacctccag atcggtgatc gtttggttca gtgccgattc gacgcagcgc acgatatatt 17460 tgctgcaatt atacgcgggg atgtagatgc tcaccagggg cacacgtttc agggtggcgc 17520 tctcgatttt ctccttcttg cgataaaagt agggcacctt ctgctgcaac agctggacgg 17580 taatgttttt acctgccgcg cgatcggttt cgttctcctt accgggcggt tcctgatgat 17640 atgccatcgc gccttccacg ctacggaaat aacaaccctc gcggtacagc cgatagccga 17700 actcattatc ctcaccgccc caatgcgtga actcttcgtc aaaccaaccc gcgcgaaaca 17760 gccacttctt tgcaaacgcc acattgccac cgctaaagaa ccggaacggg gtgttgcaca 17820 ggcgcagatt gtcggtattc ttgaaatgtt cgatgcgcca atcgacggat ttgttctgct 17880 cgaccttgcc tgcgacctga ttattggtaa taatctccgg gatttcattg atcaggcttt 17940 tctgggacaa aaagtccaga taggtatgct tcgacgtgtc gatgtattta cgcgggccaa 18000 tcagtgccac gttatcatcc acggccagga gttccatata ggactgcacc cacaacgggt 18060 tcggcgccat atcgcagtcc aagatcgcca cgtagttgta tttcgctgcc cgcaggccca 18120 ggttccgcac ggcgcacagc tggtagccgt agtctttctg gcggacgtat ttgatgttca 18180 gcaacgactc gaactcgcgg acgatctctt cgatgttttc cttggaaccg tcatccgcga 18240 cgatgacctc atagtcataa atcgttttct gattgcagag gcaggccagg gtgatcgcca 18300 ggattttggc gcgattgtac gtcggaatca cgatggacag gccgtcgatg atcagttgct 18360 tgcgcggata atcatccagt tctttacgtt tccctgccca gacgtagtcg ttcgtgcttt 18420 ccggcagcgg cggcaaggtc aggtcgctcg gccaatccag cggaatgggt tcgacttctt 18480 tcaattcggc gcgctcggat ttctttgcgg taatttcccg atatttgcta atgatttcat 18540 tcttttccac ctcattcagc gagatcgcct ttgcattgct gcacataatt ttggttgccg 18600 cgtcgatatc aatgaccgct ttccgattca gcttgtccac ttcttcgctc agattcaggg 18660 cggtttggca cagcttgata ttggcttcca cccagctcac atcatagatt tccgccactt 18720 tttcaaacag ggagagggct tggcggtagt tcttattctt atacagattg attgcctggt 18780 tcaaaatgct catttattaa cctcctacta gtgaattttc gaattactta ccgcagtact 18840 tgacacccac ctgggaattg tttttggtgc gtttgaattg gcggatggta cggtagatgc 18900 taaagggcag gctgatcaga ccgagcggaa aattgttctt attgatgatg agcttgccca 18960 gctgatagct caggtgtttc ttgacccgtt cggcttcgtg tttatccgcg tacaggaaga 19020 tgctcggcag gctcacttgg tactccgaat catatttctt cttccaggtc cgccattcgc 19080 tgatcaacgc aaacggaatc gagatcagac cgaggaacgt cttggagcgg ctcaccatca 19140 ccgcacccag gcggtagccg atatcttgct tgatgcgttc ggccgcacca tacagctccg 19200 gcagttgttt cttttcgaga cgttgattgt cgatgaagta ctgttcgagc ttttgctgca 19260 ccagatgcag ctgattgagc agcaattctt tttcgcacga cagcttttcg aggcgctgtt 19320 gttgcagttc atttttgttc tgttcctttt tcagcaggga ctcgaagttc tcgatcgcgc 19380 actccagttc ctggacctgg atggttttgt ttttaatgat cagatcatac tggatcagtt 19440 cttccttgct atccgacagc tctttcagaa tggcttgata ggcgttcagc tgtttggacg 19500 tgtgcagttc gttgtccaga atgatctttt tgctgctctg gtacagaccg ttcacgatat 19560 cgagggtgat ctggcgttgt ttaatgaacg tctcccaaat aaaggacggc ttatagtttt 19620 ccttctccag cacccgcaag ggggtgttgg cgttcgattg caattcaaag tacagttcct 19680 tgcaatcggg atagtcgttc aggacgttga agatcaagta ctcctccgtc tcgctttgct 19740 tgaaaatgat atccccggtc ccgatgtcaa taccgctgag ggacatgatc tcctgatgtt 19800 ctttttccag cgtaatggag gcttcggcgg tcttaaagtc attcacgctc tgctccagcg 19860 agtggttgat ggtattggag aacgacaacc cgaatttcag tttcagtttg tgttgcagtt 19920 gctggatgca gtcctcggcg ttgcgcttca cctgttcgct cgacaccagc aggcaccgac 19980 cccggttgtt gaggaagaag tgcagcaagg cggtgttgta tgccagccag tttttgatca 20040 gatgctccga ggtatagttg ctggagatgt tctggtccga gaagtagttc gtcaggatgc 20100 ttttggggtg gtcgtagatg aggataaagg tgatgttctc atccaccgat ttccaatatt 20160 ccaacgtgtg aattgcgttg gggtcgctcc aaccgcacag tttctggttc aggttggaca 20220 gcatcagatc caatgcgata ccgttccaga cggtgctcac atggagcggt tcaaagtcgg 20280 cggaatcggt caccgtatag atgtccggcg actggtacgc cttccgcagc gtctgggtga 20340 tgtcctgggg cgagaggttc tcacgtttgg acgggcacag ggagttcatg ccgcgctgat 20400 gcaggagttc ttccacgatt tggtagttgc tgctcggatg gcccacgatc accaggcggt 20460 tcatttatta acctcctttc gaaaatgaac ggtccgttaa atatagccat tcggattctt 20520 catctgccag cgccaggcgt cctccagcat ggtttcgagt tcccgcttgg ctttccagtt 20580 cagatatttg ttggcctttt cgggggagga ccagctctcc gcgatatcac cgtcacggcg 20640 gctcacgatt tcatacggaa tccgcacgcc ggaaatcttt tcaaaggtgg acaccagttc 20700 cagcaccgaa taacctttac ccgtgcccaa attaaagacg tggtagttgg tgttattgtc 20760 gcggaagaga taggacagcg ctgcgacgtg cccttcggcc aggtccatca catggatata 20820 gtcacggacc cccgtgccgt ctttggtggg ataatcacca ccgaacacca tcagtttttc 20880 cagtttcccc atcgcgacct gcaagatgta cggcaccaag ttggagggga tgtctgccgg 20940 gctttcacca atcataccgg attcgtgggc gcccgtcgga ttaaagtagc gcaagcagag 21000 gaaattcgtg tcggagtatt tcttggcgat gtcgcggatc atcagctccg agatgtactt 21060 ggacgtacca tacggattca gcgtgccacc aatatggcag tcttcggtga cgggcatgat 21120 cttgctttcc ccatacaccg tcgccgacga gctaaagatg aagttggcga cgtcgttctt 21180 gatggcgcaa ttgatgagtt gcagggtgcc gctcacgttg ttgtcatagt agaagatggg 21240 cttgatcagg ctttctgcga ccgatttcgc acctgcaaag tgcatgatgc agtcgaattt 21300 gtgtttcttc aggatctggt tcacttcctt ctcgttgttg atattgagtt cgtagaacgt 21360 gactttcttc tttgcgatca gctcaatgcg acggatgctt tcgcagctgc tgttgatgag 21420 attgtcaatg atgacgacat tgtagccttt gttcagcagg cagagcgacg tgtggctgcc 21480 gatgtagcct gcaccgccgg tgaccaggat gttcatttat taacctcctc ggtccgaatt 21540 aacctaggtt atgaggtcag cattgcttct tcacgcggga ttattgtttc tgttgcataa 21600 agcctaaggg gtaggccttt ctagagatag ccattttttg cactcctgta tccgcttctt 21660 gcaaggctgg acttatccct atcaaaccgg acactgcagg ctgacaagct ttcattacat 21720 atgaagagtt tgtagaaacg caaaaaggcc atccgtcagg atggccttct aagaaggctc 21780 gagtggcgcg cctaagtcga atttctgcca ttcatccgct tattatactt attcaggcgt 21840 agcaccaggc gtttaagggc accaataact gccttaaaaa aattacgccc cgccctgcca 21900 ctcatcgcag tactgttgta attcattaag cattctgccg acatggaagc catcacagac 21960 ggcatgatga acctgaatcg ccagcggcat cagcaccttg tcgccttgcg tataatattt 22020 gcccatggtg aaaacggggg cgaagaagtt gtccatattg gccacgttta aatcaaaact 22080 ggtgaaactc acccagggat tggctgagac gaaaaacata ttctcaataa accctttagg 22140 gaaataggcc aggttttcac cgtaacacgc cacatcttgc gaatatatgt gtagaaactg 22200 ccggaaatcg tcgtggtatt cactccagag cgatgaaaac gtttcagttt gctcatggaa 22260 aacggtgtaa caagggtgaa cactatccca tatcaccagc tcaccgtctt tcattgccat 22320 acggaattcc ggatgagcat tcatcaggcg ggcaagaatg tgaataaagg ccggataaaa 22380 cttgtgctta tttttcttta cggtctttaa aaaggccgta atatccagct gaacggtctg 22440 gttataggta cattgagcaa ctgactgaaa tgcctcaaaa tgttctttac gatgccattg 22500 ggatatatca acggtggtat atccagtgat ttttttctcc attttagctt ccttagctcc 22560 tgaaaatctc gataactcaa aaaatacgcc cggtagtgat cttatttcat tatggtgaaa 22620 gttggaacct cttacgtgcc gatcaacgtc tcattttcgc caaaagttgg cccagggctt 22680 cccggtatca acagggacac caggatttat ttattctgcg aagtgatctt ccgtcacagg 22740 tatttattcg gcgcaaaggg cctcgtgata cgcctatttt tataggttaa tgtcatgata 22800 ataatggttt cttagacgtc aggtggcact tttcggggaa atgtgcgcgc ccgcgttcct 22860 gctggcgctg ggcctgtttc tggcgctgga cttcccgctg ttccgtcagc agcttttcgc 22920 ccacggcctt gatgatcgcg gcggccttgg cctgcatatc ccgattcaac ggccccaggg 22980 cgtccagaac gggcttcagg cgctcccgaa ggt 23013 <210> 150 <211> 16462 <212> DNA <213> Artificial Sequence <220> <223> synthetic plasmid pCX101 <400> 150 ctcgggccgt ctcttgggct tgatcggcct tcttgcgcat ctcacgcgct cctgcggcgg 60 cctgtagggc aggctcatac ccctgccgaa ccgcttttgt cagccggtcg gccacggctt 120 ccggcgtctc aacgcgcttt gagattccca gcttttcggc caatccctgc ggtgcatagg 180 cgcgtggctc gaccgcttgc gggctgatgg tgacgtggcc cactggtggc cgctccaggg 240 cctcgtagaa cgcctgaatg cgcgtgtgac gtgccttgct gccctcgatg ccccgttgca 300 gccctagatc ggccacagcg gccgcaaacg tggtctggtc gcgggtcatc tgcgctttgt 360 tgccgatgaa ctccttggcc gacagcctgc cgtcctgcgt cagcggcacc acgaacgcgg 420 tcatgtgcgg gctggtttcg tcacggtgga tgctggccgt cacgatgcga tccgccccgt 480 acttgtccgc cagccacttg tgcgccttct cgaagaacgc cgcctgctgt tcttggctgg 540 ccgacttcca ccattccggg ctggccgtca tgacgtactc gaccgccaac acagcgtcct 600 tgcgccgctt ctctggcagc aactcgcgca gtcggcccat cgcttcatcg gtgctgctgg 660 ccgcccagtg ctcgttctct ggcgtcctgc tggcgtcagc gttgggcgtc tcgcgctcgc 720 ggtaggcgtg cttgagactg gccgccacgt tgcccatttt cgccagcttc ttgcatcgca 780 tgatcgcgta tgccgccatg cctgcccctc ccttttggtg tccaaccggc tcgacggggg 840 cagcgcaagg cggtgcctcc ggcgggccac tcaatgcttg agtatactca ctagactttg 900 cttcgcaaag tcgtgaccgc ctacggcggc tgcggcgccc tacgggcttg ctctccgggc 960 ttcgccctgc gcggtcgctg cgctcccttg ccagcccgtg gatatgtgga cgatggccgc 1020 gagcggccac cggctggctc gcttcgctcg gcccgtggac aaccctgctg gacaagctga 1080 tggacaggct gcgcctgccc acgagcttga ccacagggat tgcccaccgg ctacccagcc 1140 ttcgaccaca tacccaccgg ctccaactgc gcggcctgcg gccttgcccc atcaattttt 1200 ttaattttct ctggggaaaa gcctccggcc tgcggcctgc gcgcttcgct tgccggttgg 1260 acaccaagtg gaaggcgggt caaggctcgc gcagcgaccg cgcagcggct tggccttgac 1320 gcgcctggaa cgacccaagc ctatgcgagt gggggcagtc gaaggcgaag cccgcccgcc 1380 tgccccccga gacctgcaga tccacatcct tgaaggccgc agcgacgagc agaaggaaac 1440 cctcattcgg gaagtcagcg aggccatctc gcgctccctg gatgcgccgc tgaccagcgt 1500 gcgagtgatt atcacggaga tggccaaggg ccacttcggc atcggcggcg aactggccag 1560 caaggtcaga cgctgaagtg gagatgccca agggcacttc gggtcgagga acccgacctg 1620 cattgggacg cggccacgga gagcgcgggc aaacgccggc actatagcca gtggagtttg 1680 taaaacgcta tttcagagct tggagagtgt ctaagaaagc cggggcgatg ccaacccatc 1740 ccttcttcgg ctatgcatcg ttcgtaatca agccacttcc tttttgcatt gacgcagggt 1800 gtcggaaggc aactcgccga acgcgctcct atagttttca gcgaagcgtc ccaaatgtaa 1860 gaagccgtag tctagggcta tctcagttat actacgcaca ttggcactgg gatcgttcaa 1920 gcaggcgcgg atgctttcga gcttgcggtt gcggatgtag ttcttcggcg tggtgccggc 1980 atgcttctcg aacaaattgt agagcgagcg tggactcatc atcgccagct ccgctaaccg 2040 ctcaaggctg atattccgtt tgagattctc ctcaatgaat tgaacgactc gctcgaaaga 2100 cgggttacct ttgctgaaaa tttcacggct gacattgctg cccagcattt cgagcagctt 2160 ggaagcgatg atccccgcat agtgctcttg gacccgaggc atcgactttg tatgttccgc 2220 ttcgtcacaa actaacccga gtagattgat aaagccatcg agttgctgga gattgtgtcg 2280 cgcggcgaaa cggataccct ccctcggctt gtgccaattg ttgtcactgc atgcccgatc 2340 aaggaccact gagggcaatt taacgataaa tttctcgcaa tcttctgaat aggtcaggtc 2400 ggcttggtca tccggattga gcagcaatag ttcgcccggc gcaaaatagt gctcctggcc 2460 atggccacgc cacaggcaat ggcctttgag tattatttgc agatgataac aggtctctaa 2520 tccaggcgag attaccctca cgctaccgcc gtagctgatt cgacacaggt cgaggcatcc 2580 gaagattctg tggtgcagcc tgcctgccgg gcgcccgccc ttgggcaggc gaatagagtg 2640 cgtaccgaca tactggttaa cataatcgga gactgcatag ggctcggcgt ggacgaagat 2700 ctgacttttc tcgttcaata agcaaaaatc catagttcac ggttctctta ttttaatgtg 2760 ggctgcttgg tgtgatgtag aaaggcgcca agtcgatgaa aatgcatctc gacgtgatgc 2820 gtatacgggt tacccccatt gccacgttgc gccatccttt ttgcaatcag tgaccacttt 2880 tccaagcaaa aataacgcca agcagaacga agacgttctt tttaagaagc gagaacacca 2940 gaagttcgtg ctgtcggggc atgcggcgac gaattggcgg ataaagggga tctgcaggtc 3000 ccgagcctca cggcggcgag tgcgggggtt ccaagggggc agcgccacct tgggcaaggc 3060 cgaaggccgc gcagtcgatc aacaagcccc ggaggggcca ctttttgccg gagggggagc 3120 cgcgccgaag gcgtggggga accccgcagg ggtgcccttc tttgggcacc aaagaactag 3180 atatagggcg aaatgcgaaa gacttaaaaa tcaacaactt aaaaaagggg ggtacgcaac 3240 agctcattgc ggcacccccc gcaatagctc attgcgtagg ttaaagaaaa tctgtaattg 3300 actgccactt ttacgcaacg cataattgtt gtcgcgctgc cgaaaagttg cagctgattg 3360 cgcatggtgc cgcaaccgtg cggcacccta ccgcatggag ataagcatgg ccacgcagtc 3420 cagagaaatc ggcattcaag ccaagaacaa gcccggtcac tgggtgcaaa cggaacgcaa 3480 agcgcatgag gcgtgggccg ggcttattgc gaggaaaccc acggcggcaa tgctgctgca 3540 tcacctcgtg gcgcagatgg gccaccagaa cgccgtggtg gtcagccaga agacactttc 3600 caagctcatc ggacgttctt tgcggacggt ccaatacgca gtcaaggact tggtggccga 3660 gcgctggatc tccgtcgtga agctcaacgg ccccggcacc gtgtcggcct acgtggtcaa 3720 tgaccgcgtg gcgtggggcc agccccgcga ccagttgcgc ctgtcggtgt tcagtgccgc 3780 cgtggtggtt gatcacgacg accaggacga atcgctgttg gggcatggcg acctgcgccg 3840 catcccgacc ctgtatccgg gcgagcagca actaccgacc ggccccggcg aggagccgcc 3900 cagccagccc ggcattccgg gcatggaacc agacctgcca gccttgaccg aaacggagga 3960 atgggaacgg cgcgggcagc agcgcctgcc gatgcccgat gagccgtgtt ttctggacga 4020 tggcgagccg ttggagccgc cgacacgggt cacgctgccg cgccggtagc acttgggttg 4080 cgcagcaacc cgtaagtgcg ctgttccaga ctatcggctg tagccgcctc gccgccctat 4140 accttgtctg cctccccgcg ttgcgtcgcg gtgcatggag ccgggccacc tcgacctgaa 4200 tggaagccgg cggcacctcg ctaacggatt caccgttttt atcaggctct gggaggcaga 4260 ataaatgatc atatcgtcaa ttattacctc cacggggaga gcctgagcaa actggcctca 4320 ggcatttgag aagcacacgg tcacactgct tccggtagtc aataaaccgg taaaccagca 4380 atagacataa gcggctattt aacgaccctg ccctgaaccg acgaccgggt cgaatttgct 4440 ttcgactatc ggcgcgccag agctcatcgt taatgtcttc gtgcgccgtc agtcggcgca 4500 cgttttttct ctctggtacc gtgtcactga tctagtcaat tactcgaagt atccacaagt 4560 gaagcatact aagtaatgta caagaatcaa aaaaatcggc tacgcaagtc gcgtagccga 4620 atcatttaag gatccttcca ttcaggtcga ggtggcccgg ctccatgcac cgcgacgcaa 4680 cgcggggagg cagacaaggt atagggcggc gcctacaatc catgccaacc cgttccatgt 4740 gctcgccgag gcggcataaa tcgccgtgac gatcagcggt ccagtgatcg aagttaggct 4800 ggtaagagcc gcgagcgatc cttgaagctg tccctgatgg tcgtcatcta cctgcctgga 4860 cagcatggcc tgcaacgcgg gcatcccgat gccgccggaa gcgagaagaa tcataatggg 4920 gaaggccatc cagcctcgcg tcgcgaacgc cagcaagacg tagcccagcg cgtcggccgc 4980 catgccggcg ataatggcct gcttctcgcc gaaacgtttg gtggcgggac cagtgacgaa 5040 ggcttgagcg agggcgtgca agattccgaa taccgcaagc gacaggccga tcatcgtcgc 5100 gctccagcga aagcggtcct cgccgaaaat gacccagagc gctgccggca cctgtcctac 5160 gagttgcatg ataaagaaga cagtcataag tgcggcgacg atagtcatgc cccgcgccca 5220 ccggaaggag ctgactgggt tgaaggctct caagggcatc ggtcgacgct ctcccttatg 5280 cgactcctgc attaggaagc agcccagtag taggttgagg ccgttgagca ccgccgccgc 5340 aaggaatggt gcatgcaagg agatggcgcc caacagtccc ccggccacgg ggcctgccac 5400 catacccacg ccgaaacaag cgctcatgag cccgaagtgg cgagcccgat cttccccatc 5460 ggtgatgtcg gcgatatagg cgccagcaac cgcacctgtg gcgccggtga tgccggccac 5520 gatgcgtccg gcgtacaaga tccacaggac gggtgtggtc gccatgatcg cgtagtcgat 5580 agtggctcca agtagcgaag cgagcaggac tgggcggcgg ccaaagcggt cggacagtgc 5640 tccgagaacg ggtgcgcata gaaattgcat caacgcatat agcgctagca gcacgccata 5700 gtgactggcg atgctgtcgg aatggacgat atcccgcaag aggcccggca gtaccggcat 5760 aaccaagcct atgcctacag catccagggt gacggtgccg aggatgacga tgagcgcatt 5820 gttagatttc atacacggtg cctgactgcg ttagcaattt aactgtgata aactaccgca 5880 ttaaagccga gcgatgataa gctgtcaaac atgagatccg ataaatcgat tgatagattt 5940 aaataagaac tgcagaagct agcttagatg ctcgtgaaat tgacgtgggc gctttgcagg 6000 gccgtcttaa tggcgttggt gtccacgagg atcgagtcgg gtgcggaaaa cggacggttc 6060 ttgttggtga aatcgctgtt accaatgtac agcgattcct tgttacgcag cgcctggatg 6120 tgccagcggg accacgaatc ccaatacttc tggcgatccg gcgagatacc ttggctggtg 6180 tagccggtcg tcgggctgtt catcaacgag tcggtgcggt gcgagcccag cgtcagcggc 6240 aacttgatcc gatgcaccgt ggaatcgccg aagatcagct tcagacgcgc gataaattcg 6300 ctatccgcac ccgttttcac acaatcccag acaccggcct tctgcaagac gtcggcacgg 6360 cgaaacagga gcgacgacgg attcagacgc ttcaaggggt acactgcgcg ggcatagaaa 6420 ataccgttgt cttgcaggcg cacccagtcc gagatggagc agatgagctt cggattgagc 6480 aacaaggggg agatttggcg gaacagcttt tccggatggc tccagtcatc cgaatcgtgg 6540 caggtgacga actcgccctt cgcttggatc aagccgatac gcttcgcggc ataggtgccg 6600 acattctgcg gcaggctaat gatcttgatg cgcgtgtctt tgagggcgag ccgctggaga 6660 cgaaacaggg tgtcatcggt gctcgcgtca tccacaatga tcagctcgaa ggaacggtag 6720 gtctgattga ggagcgaaat caccgcattt tccacgcggc gacccgtatt ataggtggtc 6780 atcaggatgg agatcaacgg ccccgtctgg gccgggtacg ggatgctggt gatgatgttg 6840 cacggggaga gcggggagct gttgtccgtc aaggccacgg ggctgaggcc gaagtattta 6900 tagtattcat tcagccgatt caggctaatt tcggcggttt cgcggaaggc gttattttgc 6960 agcagcagga tatccgggct atagacgata tcggatgcgt cgatctgggc gagggtcgag 7020 atggcctttt gggtcaggcc gatccggagt tgcagtgcgg tatacaggtc cagcgggcag 7080 ttgtccacgt tgtccaacag gctcaggcta aaggtcggcg agtaggacgc cagggttttc 7140 gccagttcca ctttctgatg ggtatcggtg aactcgtcct tgaactccat cagcagctcg 7200 ggcgtcaggc tgatgtcgcc gcaggcgatt tttgcgatct tgattgccag tttgcagcgc 7260 caatcggacg gggtatccgt caagttatgc agcgaccagt acatattcag acgatacatc 7320 gcgaggatgc gtttcgactg ccagaaccgg caatcatcct ggatggccgc gagcgcgtgg 7380 acgtagcggc tctttttgag cagccacaag aatttgagat tattgaacat ttattaacct 7440 cctgctagca acttaagtta cgaatcgacg ccgaacaggt cgcgggtgta gactttctcc 7500 gagacatctt ccagttcgct ggtgcggcga ttcgccacaa tgacatcgac gcgctcctta 7560 aaggaattga tgtcgcgctc gacgtaggaa ccgaagaagt agggttcttt caggaccggc 7620 tcgtacacca caatctcgat acccttggcc ttcaaacgtt tcatgacccc ctggatgctg 7680 ctggcccgga aattgtcgct acccgccttc atgatcaggc gatagatacc gaccactttg 7740 ggcttacggg acaggatgtc ctcggccacg aagtccttac gggtcgtatt cgcatccacg 7800 atggcctgga tcaggttttg cgggacgtcg cgataattgg ccaacagctg cttcgtatcc 7860 ttcggcagac agtaaccgcc gtagccgaag gacgggttgt tgtaatgttg accaatgcgc 7920 ggatcgaggg agacgccttc gatgatttgt ttggtatcca ggccgtgcac gctcgcgtag 7980 gtgtccagct cgttaaagta cgcgatacgc atcgccagat acgtgttcgc gaacagtttg 8040 atggcttctg cctcgggcga atccgtcagc aggatcggaa tatccttttt gatggcacct 8100 tccgacagga gttcggcgaa cttccgtgcg cgttccgacg attcgcccac gacaatgcgg 8160 ctcggataga gattatcata cagggctttg ccttcgcgca ggaactccgg ggaaaagatg 8220 atattattcg tgttcagatc gcgcttcagg cgttcggtga acccgacggg gacggtggat 8280 ttgataatga tggtcgcgtt cgggttaatg gacagcacgt cacacgcgac gctttcgacg 8340 ctcagggtat caaagttgtt attaatcgga tcatagttcg tcggggtggc gatgatcacg 8400 tagtctgcat cgcgatatgc ctcgtatttt tccgtcgtcg cgtagaggtt cagcttacga 8460 ttggagagaa acttctggat ttccgggtcg caaatcggcg agattttctt gttaatgagc 8520 tggaccttct tcgggtcgat gtccagggcg atgatgtcgt gtttttggga gaggaggatc 8580 gcaatgctga tacccacata gccgacgccg gccacggcaa ttttcattta ttaacctcct 8640 taagtgaatt caaactagtt tacaagtcgt tttcgatctt ctcccaggta tatttgcgac 8700 attcattcaa gttggtcagc ggcgagtatt tgtacttttt gataccgagg cgcgacaggc 8760 tttcgttcac caccttgaaa tggttttcct tttggatgtc cagtttcttg atcgacgtgt 8820 tctcgccgtg caggacacgg ttgtagcaaa tcttattgat atgcttaaac gggccgactt 8880 cgctgagttt caaatacata tcgtaatcca ccgcattgct gatgctctcg ttgaagcctt 8940 cggtgaggtt ccatgcacgc gccgtgaaca tacggaagtg gtggcagatc atcgcgctcg 9000 tgagcttttc gcggctgtaa atcggccagt tgtagccatt gctaatcaag ttaccttcac 9060 gatcaatatt gcgattggtg gtgtacacgc aggcgaggct caggtctttg cgaaattcat 9120 ccagacacag ttccacggca tcgggctcca ggaaatcatc ggaatccagc tgcccgatgt 9180 agaaaccccg gcacaggcgg actgcggtat tcgaggcgga gccgatgcct ttgtttttct 9240 ggctgatgaa acggacgcgc gggtggtttg cgtaatgttc ttgcaggatg cgcagcgtat 9300 catcggtgct cccgtcatcg cagatgcaga cctccagatc ggtgatcgtt tggttcagtg 9360 ccgattcgac gcagcgcacg atatatttgc tgcaattata cgcggggatg tagatgctca 9420 ccaggggcac acgtttcagg gtggcgctct cgattttctc cttcttgcga taaaagtagg 9480 gcaccttctg ctgcaacagc tggacggtaa tgtttttacc tgccgcgcga tcggtttcgt 9540 tctccttacc gggcggttcc tgatgatatg ccatcgcgcc ttccacgcta cggaaataac 9600 aaccctcgcg gtacagccga tagccgaact cattatcctc accgccccaa tgcgtgaact 9660 cttcgtcaaa ccaacccgcg cgaaacagcc acttctttgc aaacgccaca ttgccaccgc 9720 taaagaaccg gaacggggtg ttgcacaggc gcagattgtc ggtattcttg aaatgttcga 9780 tgcgccaatc gacggatttg ttctgctcga ccttgcctgc gacctgatta ttggtaataa 9840 tctccgggat ttcattgatc aggcttttct gggacaaaaa gtccagatag gtatgcttcg 9900 acgtgtcgat gtatttacgc gggccaatca gtgccacgtt atcatccacg gccaggagtt 9960 ccatatagga ctgcacccac aacgggttcg gcgccatatc gcagtccaag atcgccacgt 10020 agttgtattt cgctgcccgc aggcccaggt tccgcacggc gcacagctgg tagccgtagt 10080 ctttctggcg gacgtatttg atgttcagca acgactcgaa ctcgcggacg atctcttcga 10140 tgttttcctt ggaaccgtca tccgcgacga tgacctcata gtcataaatc gttttctgat 10200 tgcagaggca ggccagggtg atcgccagga ttttggcgcg attgtacgtc ggaatcacga 10260 tggacaggcc gtcgatgatc agttgcttgc gcggataatc atccagttct ttacgtttcc 10320 ctgcccagac gtagtcgttc gtgctttccg gcagcggcgg caaggtcagg tcgctcggcc 10380 aatccagcgg aatgggttcg acttctttca attcggcgcg ctcggatttc tttgcggtaa 10440 tttcccgata tttgctaatg atttcattct tttccacctc attcagcgag atcgcctttg 10500 cattgctgca cataattttg gttgccgcgt cgatatcaat gaccgctttc cgattcagct 10560 tgtccacttc ttcgctcaga ttcagggcgg tttggcacag cttgatattg gcttccaccc 10620 agctcacatc atagatttcc gccacttttt caaacaggga gagggcttgg cggtagttct 10680 tattcttata cagattgatt gcctggttca aaatgctcat ttattaacct cctactagtg 10740 aattttcgaa ttacttaccg cagtacttga cacccacctg ggaattgttt ttggtgcgtt 10800 tgaattggcg gatggtacgg tagatgctaa agggcaggct gatcagaccg agcggaaaat 10860 tgttcttatt gatgatgagc ttgcccagct gatagctcag gtgtttcttg acccgttcgg 10920 cttcgtgttt atccgcgtac aggaagatgc tcggcaggct cacttggtac tccgaatcat 10980 atttcttctt ccaggtccgc cattcgctga tcaacgcaaa cggaatcgag atcagaccga 11040 ggaacgtctt ggagcggctc accatcaccg cacccaggcg gtagccgata tcttgcttga 11100 tgcgttcggc cgcaccatac agctccggca gttgtttctt ttcgagacgt tgattgtcga 11160 tgaagtactg ttcgagcttt tgctgcacca gatgcagctg attgagcagc aattcttttt 11220 cgcacgacag cttttcgagg cgctgttgtt gcagttcatt tttgttctgt tcctttttca 11280 gcagggactc gaagttctcg atcgcgcact ccagttcctg gacctggatg gttttgtttt 11340 taatgatcag atcatactgg atcagttctt ccttgctatc cgacagctct ttcagaatgg 11400 cttgataggc gttcagctgt ttggacgtgt gcagttcgtt gtccagaatg atctttttgc 11460 tgctctggta cagaccgttc acgatatcga gggtgatctg gcgttgttta atgaacgtct 11520 cccaaataaa ggacggctta tagttttcct tctccagcac ccgcaagggg gtgttggcgt 11580 tcgattgcaa ttcaaagtac agttccttgc aatcgggata gtcgttcagg acgttgaaga 11640 tcaagtactc ctccgtctcg ctttgcttga aaatgatatc cccggtcccg atgtcaatac 11700 cgctgaggga catgatctcc tgatgttctt tttccagcgt aatggaggct tcggcggtct 11760 taaagtcatt cacgctctgc tccagcgagt ggttgatggt attggagaac gacaacccga 11820 atttcagttt cagtttgtgt tgcagttgct ggatgcagtc ctcggcgttg cgcttcacct 11880 gttcgctcga caccagcagg caccgacccc ggttgttgag gaagaagtgc agcaaggcgg 11940 tgttgtatgc cagccagttt ttgatcagat gctccgaggt atagttgctg gagatgttct 12000 ggtccgagaa gtagttcgtc aggatgcttt tggggtggtc gtagatgagg ataaaggtga 12060 tgttctcatc caccgatttc caatattcca acgtgtgaat tgcgttgggg tcgctccaac 12120 cgcacagttt ctggttcagg ttggacagca tcagatccaa tgcgataccg ttccagacgg 12180 tgctcacatg gagcggttca aagtcggcgg aatcggtcac cgtatagatg tccggcgact 12240 ggtacgcctt ccgcagcgtc tgggtgatgt cctggggcga gaggttctca cgtttggacg 12300 ggcacaggga gttcatgccg cgctgatgca ggagttcttc cacgatttgg tagttgctgc 12360 tcggatggcc cacgatcacc aggcggttca tttattaacc tcctttcgaa aatgaacggt 12420 ccgttaaata tagccattcg gattcttcat ctgccagcgc caggcgtcct ccagcatggt 12480 ttcgagttcc cgcttggctt tccagttcag atatttgttg gccttttcgg gggaggacca 12540 gctctccgcg atatcaccgt cacggcggct cacgatttca tacggaatcc gcacgccgga 12600 aatcttttca aaggtggaca ccagttccag caccgaataa cctttacccg tgcccaaatt 12660 aaagacgtgg tagttggtgt tattgtcgcg gaagagatag gacagcgctg cgacgtgccc 12720 ttcggccagg tccatcacat ggatatagtc acggaccccc gtgccgtctt tggtgggata 12780 atcaccaccg aacaccatca gtttttccag tttccccatc gcgacctgca agatgtacgg 12840 caccaagttg gaggggatgt ctgccgggct ttcaccaatc ataccggatt cgtgggcgcc 12900 cgtcggatta aagtagcgca agcagaggaa attcgtgtcg gagtatttct tggcgatgtc 12960 gcggatcatc agctccgaga tgtacttgga cgtaccatac ggattcagcg tgccaccaat 13020 atggcagtct tcggtgacgg gcatgatctt gctttcccca tacaccgtcg ccgacgagct 13080 aaagatgaag ttggcgacgt cgttcttgat ggcgcaattg atgagttgca gggtgccgct 13140 cacgttgttg tcatagtaga agatgggctt gatcaggctt tctgcgaccg atttcgcacc 13200 tgcaaagtgc atgatgcagt cgaatttgtg tttcttcagg atctggttca cttccttctc 13260 gttgttgata ttgagttcgt agaacgtgac tttcttcttt gcgatcagct caatgcgacg 13320 gatgctttcg cagctgctgt tgatgagatt gtcaatgatg acgacattgt agcctttgtt 13380 cagcaggcag agcgacgtgt ggctgccgat gtagcctgca ccgccggtga ccaggatgtt 13440 catttattaa cctcctcggt ccgaattaac ctaggttatg aggtcagcat tgcttcttca 13500 cgcgtttagt agttgttttg ttcggtgata tattcttcaa tgccttcttg cacgtcttca 13560 tggaacgaca cggcgttgtc gtctttaaac acgattgcca catcgcagaa ctctttcaac 13620 gagttcagcg agtgcgacac catgaggaag gagctttcct tatgacgctc cttgaagagt 13680 tgggcacatt tttccttgaa acgggcgtcc cccaccgccg tcacctcgtc cacgatgtag 13740 taatcgaact tgaacgccat gctcaggccg aagccgaggc ggctgcgcat accgctcgaa 13800 taggtcttga tcggcatatc aaaatacttc cccagctccg cgaactcttc cacaaactca 13860 atcttttctt tcagctcctc ctgcttcgcg tacagccggg ccacgaactt cacgttttca 13920 cgcccggtca agctgccctg gaagccgcct gccagaccca ccggccacga gatcgtttta 13980 ttcgtgatga ttttaccgct atccgggcgg tcgatgcccc caatcatgcg caacagcgtg 14040 gatttacccg ccccattgcg cccgatgaac gccacgcttt tgccgctggg gatctcaatg 14100 ttcaggttct tgaagacata gtgacggccc accggggtgc ggtagctttt cgtcaggttt 14160 tcgatcttaa tcatgaggtc aacattgcct cctcacgcgt acggtacagg gccaaaccaa 14220 taaacagggt caccagggtg aacattgcca gataattcag gctgacccct tcgctgatat 14280 aaccgggcat cacggcctcg cggctcagtt cgacgacgtg caccagggga ttccacagca 14340 ggtacgacca atactgcttc ggaatggagt gcagcgggaa catgatgcac gaaataaagt 14400 acagcggctt cagcaagatc ggcaagactt tctgcatttc ggggaacgtc ttgcccacga 14460 ccatgaagat caggcccaca ccgcacgaca ggatgatcag gaggctccag gtgagcacaa 14520 attgcaggaa gttggtaatc tcgaaatatt cgcccgccat ccagatgatc agcatcagga 14580 ggatgtagac cgccacatag atcagcgttt ccaagagggc gcgtgcaatg atcgtgtcga 14640 tcggcttcac gggccggtag ttaaacagcc cctgattggc ttcgatggcg cccacggagc 14700 gattgctgat gctgctgaaa ataaagaacg ggatcaggcc attgagcagg aacaccggga 14760 aggagatatc cggcatggtg cgatgcatga tatagccaaa gatcccgagc agaatcagca 14820 gatgtgcgct cggttccagg atcgcccaca gatagcccag gcgaaacttg ccaaagcgcg 14880 tacggatttc gcggagaaac agtgcttcga ccgtcacttt ctggacttca aaacccgaac 14940 gtgccattta ttaacctcct ggtaccaatc tagattgttt taagtaatcg atagtgattt 15000 aaatatgcaa gatctagtta cctgcaggat tattgtttct gttgcataaa gcctaagggg 15060 taggcctttc tagagatagc cattttttgc actcctgtat ccgcttcttg caaggctgga 15120 cttatcccta tcaaaccgga cactgcaggc tgacaagctt tcattacata tgaagagttt 15180 gtagaaacgc aaaaaggcca tccgtcagga tggccttcta agaaggctcg agtggcgcgc 15240 ctaagtcgaa tttctgccat tcatccgctt attatactta ttcaggcgta gcaccaggcg 15300 tttaagggca ccaataactg ccttaaaaaa attacgcccc gccctgccac tcatcgcagt 15360 actgttgtaa ttcattaagc attctgccga catggaagcc atcacagacg gcatgatgaa 15420 cctgaatcgc cagcggcatc agcaccttgt cgccttgcgt ataatatttg cccatggtga 15480 aaacgggggc gaagaagttg tccatattgg ccacgtttaa atcaaaactg gtgaaactca 15540 cccagggatt ggctgagacg aaaaacatat tctcaataaa ccctttaggg aaataggcca 15600 ggttttcacc gtaacacgcc acatcttgcg aatatatgtg tagaaactgc cggaaatcgt 15660 cgtggtattc actccagagc gatgaaaacg tttcagtttg ctcatggaaa acggtgtaac 15720 aagggtgaac actatcccat atcaccagct caccgtcttt cattgccata cggaattccg 15780 gatgagcatt catcaggcgg gcaagaatgt gaataaaggc cggataaaac ttgtgcttat 15840 ttttctttac ggtctttaaa aaggccgtaa tatccagctg aacggtctgg ttataggtac 15900 attgagcaac tgactgaaat gcctcaaaat gttctttacg atgccattgg gatatatcaa 15960 cggtggtata tccagtgatt tttttctcca ttttagcttc cttagctcct gaaaatctcg 16020 ataactcaaa aaatacgccc ggtagtgatc ttatttcatt atggtgaaag ttggaacctc 16080 ttacgtgccg atcaacgtct cattttcgcc aaaagttggc ccagggcttc ccggtatcaa 16140 cagggacacc aggatttatt tattctgcga agtgatcttc cgtcacaggt atttattcgg 16200 cgcaaagggc ctcgtgatac gcctattttt ataggttaat gtcatgataa taatggtttc 16260 ttagacgtca ggtggcactt ttcggggaaa tgtgcgcgcc cgcgttcctg ctggcgctgg 16320 gcctgtttct ggcgctggac ttcccgctgt tccgtcagca gcttttcgcc cacggccttg 16380 atgatcgcgg cggccttggc ctgcatatcc cgattcaacg gccccagggc gtccagaacg 16440 ggcttcaggc gctcccgaag gt 16462 <210> 151 <211> 13809 <212> DNA <213> Artificial Sequence <220> <223> synthetic plasmid pCX081 <400> 151 ctcgggccgt ctcttgggct tgatcggcct tcttgcgcat ctcacgcgct cctgcggcgg 60 cctgtagggc aggctcatac ccctgccgaa ccgcttttgt cagccggtcg gccacggctt 120 ccggcgtctc aacgcgcttt gagattccca gcttttcggc caatccctgc ggtgcatagg 180 cgcgtggctc gaccgcttgc gggctgatgg tgacgtggcc cactggtggc cgctccaggg 240 cctcgtagaa cgcctgaatg cgcgtgtgac gtgccttgct gccctcgatg ccccgttgca 300 gccctagatc ggccacagcg gccgcaaacg tggtctggtc gcgggtcatc tgcgctttgt 360 tgccgatgaa ctccttggcc gacagcctgc cgtcctgcgt cagcggcacc acgaacgcgg 420 tcatgtgcgg gctggtttcg tcacggtgga tgctggccgt cacgatgcga tccgccccgt 480 acttgtccgc cagccacttg tgcgccttct cgaagaacgc cgcctgctgt tcttggctgg 540 ccgacttcca ccattccggg ctggccgtca tgacgtactc gaccgccaac acagcgtcct 600 tgcgccgctt ctctggcagc aactcgcgca gtcggcccat cgcttcatcg gtgctgctgg 660 ccgcccagtg ctcgttctct ggcgtcctgc tggcgtcagc gttgggcgtc tcgcgctcgc 720 ggtaggcgtg cttgagactg gccgccacgt tgcccatttt cgccagcttc ttgcatcgca 780 tgatcgcgta tgccgccatg cctgcccctc ccttttggtg tccaaccggc tcgacggggg 840 cagcgcaagg cggtgcctcc ggcgggccac tcaatgcttg agtatactca ctagactttg 900 cttcgcaaag tcgtgaccgc ctacggcggc tgcggcgccc tacgggcttg ctctccgggc 960 ttcgccctgc gcggtcgctg cgctcccttg ccagcccgtg gatatgtgga cgatggccgc 1020 gagcggccac cggctggctc gcttcgctcg gcccgtggac aaccctgctg gacaagctga 1080 tggacaggct gcgcctgccc acgagcttga ccacagggat tgcccaccgg ctacccagcc 1140 ttcgaccaca tacccaccgg ctccaactgc gcggcctgcg gccttgcccc atcaattttt 1200 ttaattttct ctggggaaaa gcctccggcc tgcggcctgc gcgcttcgct tgccggttgg 1260 acaccaagtg gaaggcgggt caaggctcgc gcagcgaccg cgcagcggct tggccttgac 1320 gcgcctggaa cgacccaagc ctatgcgagt gggggcagtc gaaggcgaag cccgcccgcc 1380 tgccccccga gacctgcaga tccacatcct tgaaggccgc agcgacgagc agaaggaaac 1440 cctcattcgg gaagtcagcg aggccatctc gcgctccctg gatgcgccgc tgaccagcgt 1500 gcgagtgatt atcacggaga tggccaaggg ccacttcggc atcggcggcg aactggccag 1560 caaggtcaga cgctgaagtg gagatgccca agggcacttc gggtcgagga acccgacctg 1620 cattgggacg cggccacgga gagcgcgggc aaacgccggc actatagcca gtggagtttg 1680 taaaacgcta tttcagagct tggagagtgt ctaagaaagc cggggcgatg ccaacccatc 1740 ccttcttcgg ctatgcatcg ttcgtaatca agccacttcc tttttgcatt gacgcagggt 1800 gtcggaaggc aactcgccga acgcgctcct atagttttca gcgaagcgtc ccaaatgtaa 1860 gaagccgtag tctagggcta tctcagttat actacgcaca ttggcactgg gatcgttcaa 1920 gcaggcgcgg atgctttcga gcttgcggtt gcggatgtag ttcttcggcg tggtgccggc 1980 atgcttctcg aacaaattgt agagcgagcg tggactcatc atcgccagct ccgctaaccg 2040 ctcaaggctg atattccgtt tgagattctc ctcaatgaat tgaacgactc gctcgaaaga 2100 cgggttacct ttgctgaaaa tttcacggct gacattgctg cccagcattt cgagcagctt 2160 ggaagcgatg atccccgcat agtgctcttg gacccgaggc atcgactttg tatgttccgc 2220 ttcgtcacaa actaacccga gtagattgat aaagccatcg agttgctgga gattgtgtcg 2280 cgcggcgaaa cggataccct ccctcggctt gtgccaattg ttgtcactgc atgcccgatc 2340 aaggaccact gagggcaatt taacgataaa tttctcgcaa tcttctgaat aggtcaggtc 2400 ggcttggtca tccggattga gcagcaatag ttcgcccggc gcaaaatagt gctcctggcc 2460 atggccacgc cacaggcaat ggcctttgag tattatttgc agatgataac aggtctctaa 2520 tccaggcgag attaccctca cgctaccgcc gtagctgatt cgacacaggt cgaggcatcc 2580 gaagattctg tggtgcagcc tgcctgccgg gcgcccgccc ttgggcaggc gaatagagtg 2640 cgtaccgaca tactggttaa cataatcgga gactgcatag ggctcggcgt ggacgaagat 2700 ctgacttttc tcgttcaata agcaaaaatc catagttcac ggttctctta ttttaatgtg 2760 ggctgcttgg tgtgatgtag aaaggcgcca agtcgatgaa aatgcatctc gacgtgatgc 2820 gtatacgggt tacccccatt gccacgttgc gccatccttt ttgcaatcag tgaccacttt 2880 tccaagcaaa aataacgcca agcagaacga agacgttctt tttaagaagc gagaacacca 2940 gaagttcgtg ctgtcggggc atgcggcgac gaattggcgg ataaagggga tctgcaggtc 3000 ccgagcctca cggcggcgag tgcgggggtt ccaagggggc agcgccacct tgggcaaggc 3060 cgaaggccgc gcagtcgatc aacaagcccc ggaggggcca ctttttgccg gagggggagc 3120 cgcgccgaag gcgtggggga accccgcagg ggtgcccttc tttgggcacc aaagaactag 3180 atatagggcg aaatgcgaaa gacttaaaaa tcaacaactt aaaaaagggg ggtacgcaac 3240 agctcattgc ggcacccccc gcaatagctc attgcgtagg ttaaagaaaa tctgtaattg 3300 actgccactt ttacgcaacg cataattgtt gtcgcgctgc cgaaaagttg cagctgattg 3360 cgcatggtgc cgcaaccgtg cggcacccta ccgcatggag ataagcatgg ccacgcagtc 3420 cagagaaatc ggcattcaag ccaagaacaa gcccggtcac tgggtgcaaa cggaacgcaa 3480 agcgcatgag gcgtgggccg ggcttattgc gaggaaaccc acggcggcaa tgctgctgca 3540 tcacctcgtg gcgcagatgg gccaccagaa cgccgtggtg gtcagccaga agacactttc 3600 caagctcatc ggacgttctt tgcggacggt ccaatacgca gtcaaggact tggtggccga 3660 gcgctggatc tccgtcgtga agctcaacgg ccccggcacc gtgtcggcct acgtggtcaa 3720 tgaccgcgtg gcgtggggcc agccccgcga ccagttgcgc ctgtcggtgt tcagtgccgc 3780 cgtggtggtt gatcacgacg accaggacga atcgctgttg gggcatggcg acctgcgccg 3840 catcccgacc ctgtatccgg gcgagcagca actaccgacc ggccccggcg aggagccgcc 3900 cagccagccc ggcattccgg gcatggaacc agacctgcca gccttgaccg aaacggagga 3960 atgggaacgg cgcgggcagc agcgcctgcc gatgcccgat gagccgtgtt ttctggacga 4020 tggcgagccg ttggagccgc cgacacgggt cacgctgccg cgccggtagc acttgggttg 4080 cgcagcaacc cgtaagtgcg ctgttccaga ctatcggctg tagccgcctc gccgccctat 4140 accttgtctg cctccccgcg ttgcgtcgcg gtgcatggag ccgggccacc tcgacctgaa 4200 tggaagccgg cggcacctcg ctaacggatt caccgttttt atcaggctct gggaggcaga 4260 ataaatgatc atatcgtcaa ttattacctc cacggggaga gcctgagcaa actggcctca 4320 ggcatttgag aagcacacgg tcacactgct tccggtagtc aataaaccgg taaaccagca 4380 atagacataa gcggctattt aacgaccctg ccctgaaccg acgaccgggt cgaatttgct 4440 ttcgactatc ggcgcgccag agctcatcgt taatgtcttc gtgcgccgtc agtcggcgca 4500 cgttttttct ctctggtacc gtgtcactga tctagtcaat tactcgaagt atccacaagt 4560 gaagcatact aagtaatgta caagaatcaa aaaaatcggc tacgcaagtc gcgtagccga 4620 atcatttaag gatccttcca ttcaggtcga ggtggcccgg ctccatgcac cgcgacgcaa 4680 cgcggggagg cagacaaggt atagggcggc gcctacaatc catgccaacc cgttccatgt 4740 gctcgccgag gcggcataaa tcgccgtgac gatcagcggt ccagtgatcg aagttaggct 4800 ggtaagagcc gcgagcgatc cttgaagctg tccctgatgg tcgtcatcta cctgcctgga 4860 cagcatggcc tgcaacgcgg gcatcccgat gccgccggaa gcgagaagaa tcataatggg 4920 gaaggccatc cagcctcgcg tcgcgaacgc cagcaagacg tagcccagcg cgtcggccgc 4980 catgccggcg ataatggcct gcttctcgcc gaaacgtttg gtggcgggac cagtgacgaa 5040 ggcttgagcg agggcgtgca agattccgaa taccgcaagc gacaggccga tcatcgtcgc 5100 gctccagcga aagcggtcct cgccgaaaat gacccagagc gctgccggca cctgtcctac 5160 gagttgcatg ataaagaaga cagtcataag tgcggcgacg atagtcatgc cccgcgccca 5220 ccggaaggag ctgactgggt tgaaggctct caagggcatc ggtcgacgct ctcccttatg 5280 cgactcctgc attaggaagc agcccagtag taggttgagg ccgttgagca ccgccgccgc 5340 aaggaatggt gcatgcaagg agatggcgcc caacagtccc ccggccacgg ggcctgccac 5400 catacccacg ccgaaacaag cgctcatgag cccgaagtgg cgagcccgat cttccccatc 5460 ggtgatgtcg gcgatatagg cgccagcaac cgcacctgtg gcgccggtga tgccggccac 5520 gatgcgtccg gcgtacaaga tccacaggac gggtgtggtc gccatgatcg cgtagtcgat 5580 agtggctcca agtagcgaag cgagcaggac tgggcggcgg ccaaagcggt cggacagtgc 5640 tccgagaacg ggtgcgcata gaaattgcat caacgcatat agcgctagca gcacgccata 5700 gtgactggcg atgctgtcgg aatggacgat atcccgcaag aggcccggca gtaccggcat 5760 aaccaagcct atgcctacag catccagggt gacggtgccg aggatgacga tgagcgcatt 5820 gttagatttc atacacggtg cctgactgcg ttagcaattt aactgtgata aactaccgca 5880 ttaaagccga gcgatgataa gctgtcaaac atgagatccg ataaatcgat tgatagattt 5940 aaataagaac tgcagaagct agcttagatg ctcgtgaaat tgacgtgggc gctttgcagg 6000 gccgtcttaa tggcgttggt gtccacgagg atcgagtcgg gtgcggaaaa cggacggttc 6060 ttgttggtga aatcgctgtt accaatgtac agcgattcct tgttacgcag cgcctggatg 6120 tgccagcggg accacgaatc ccaatacttc tggcgatccg gcgagatacc ttggctggtg 6180 tagccggtcg tcgggctgtt catcaacgag tcggtgcggt gcgagcccag cgtcagcggc 6240 aacttgatcc gatgcaccgt ggaatcgccg aagatcagct tcagacgcgc gataaattcg 6300 ctatccgcac ccgttttcac acaatcccag acaccggcct tctgcaagac gtcggcacgg 6360 cgaaacagga gcgacgacgg attcagacgc ttcaaggggt acactgcgcg ggcatagaaa 6420 ataccgttgt cttgcaggcg cacccagtcc gagatggagc agatgagctt cggattgagc 6480 aacaaggggg agatttggcg gaacagcttt tccggatggc tccagtcatc cgaatcgtgg 6540 caggtgacga actcgccctt cgcttggatc aagccgatac gcttcgcggc ataggtgccg 6600 acattctgcg gcaggctaat gatcttgatg cgcgtgtctt tgagggcgag ccgctggaga 6660 cgaaacaggg tgtcatcggt gctcgcgtca tccacaatga tcagctcgaa ggaacggtag 6720 gtctgattga ggagcgaaat caccgcattt tccacgcggc gacccgtatt ataggtggtc 6780 atcaggatgg agatcaacgg ccccgtctgg gccgggtacg ggatgctggt gatgatgttg 6840 cacggggaga gcggggagct gttgtccgtc aaggccacgg ggctgaggcc gaagtattta 6900 tagtattcat tcagccgatt caggctaatt tcggcggttt cgcggaaggc gttattttgc 6960 agcagcagga tatccgggct atagacgata tcggatgcgt cgatctgggc gagggtcgag 7020 atggcctttt gggtcaggcc gatccggagt tgcagtgcgg tatacaggtc cagcgggcag 7080 ttgtccacgt tgtccaacag gctcaggcta aaggtcggcg agtaggacgc cagggttttc 7140 gccagttcca ctttctgatg ggtatcggtg aactcgtcct tgaactccat cagcagctcg 7200 ggcgtcaggc tgatgtcgcc gcaggcgatt tttgcgatct tgattgccag tttgcagcgc 7260 caatcggacg gggtatccgt caagttatgc agcgaccagt acatattcag acgatacatc 7320 gcgaggatgc gtttcgactg ccagaaccgg caatcatcct ggatggccgc gagcgcgtgg 7380 acgtagcggc tctttttgag cagccacaag aatttgagat tattgaacat ttattaacct 7440 cctgctagca acttaagtga attcaaacta gtttacaagt cgttttcgat cttctcccag 7500 gtatatttgc gacattcatt caagttggtc agcggcgagt atttgtactt tttgataccg 7560 aggcgcgaca ggctttcgtt caccaccttg aaatggtttt ccttttggat gtccagtttc 7620 ttgatcgacg tgttctcgcc gtgcaggaca cggttgtagc aaatcttatt gatatgctta 7680 aacgggccga cttcgctgag tttcaaatac atatcgtaat ccaccgcatt gctgatgctc 7740 tcgttgaagc cttcggtgag gttccatgca cgcgccgtga acatacggaa gtggtggcag 7800 atcatcgcgc tcgtgagctt ttcgcggctg taaatcggcc agttgtagcc attgctaatc 7860 aagttacctt cacgatcaat attgcgattg gtggtgtaca cgcaggcgag gctcaggtct 7920 ttgcgaaatt catccagaca cagttccacg gcatcgggct ccaggaaatc atcggaatcc 7980 agctgcccga tgtagaaacc ccggcacagg cggactgcgg tattcgaggc ggagccgatg 8040 cctttgtttt tctggctgat gaaacggacg cgcgggtggt ttgcgtaatg ttcttgcagg 8100 atgcgcagcg tatcatcggt gctcccgtca tcgcagatgc agacctccag atcggtgatc 8160 gtttggttca gtgccgattc gacgcagcgc acgatatatt tgctgcaatt atacgcgggg 8220 atgtagatgc tcaccagggg cacacgtttc agggtggcgc tctcgatttt ctccttcttg 8280 cgataaaagt agggcacctt ctgctgcaac agctggacgg taatgttttt acctgccgcg 8340 cgatcggttt cgttctcctt accgggcggt tcctgatgat atgccatcgc gccttccacg 8400 ctacggaaat aacaaccctc gcggtacagc cgatagccga actcattatc ctcaccgccc 8460 caatgcgtga actcttcgtc aaaccaaccc gcgcgaaaca gccacttctt tgcaaacgcc 8520 acattgccac cgctaaagaa ccggaacggg gtgttgcaca ggcgcagatt gtcggtattc 8580 ttgaaatgtt cgatgcgcca atcgacggat ttgttctgct cgaccttgcc tgcgacctga 8640 ttattggtaa taatctccgg gatttcattg atcaggcttt tctgggacaa aaagtccaga 8700 taggtatgct tcgacgtgtc gatgtattta cgcgggccaa tcagtgccac gttatcatcc 8760 acggccagga gttccatata ggactgcacc cacaacgggt tcggcgccat atcgcagtcc 8820 aagatcgcca cgtagttgta tttcgctgcc cgcaggccca ggttccgcac ggcgcacagc 8880 tggtagccgt agtctttctg gcggacgtat ttgatgttca gcaacgactc gaactcgcgg 8940 acgatctctt cgatgttttc cttggaaccg tcatccgcga cgatgacctc atagtcataa 9000 atcgttttct gattgcagag gcaggccagg gtgatcgcca ggattttggc gcgattgtac 9060 gtcggaatca cgatggacag gccgtcgatg atcagttgct tgcgcggata atcatccagt 9120 tctttacgtt tccctgccca gacgtagtcg ttcgtgcttt ccggcagcgg cggcaaggtc 9180 aggtcgctcg gccaatccag cggaatgggt tcgacttctt tcaattcggc gcgctcggat 9240 ttctttgcgg taatttcccg atatttgcta atgatttcat tcttttccac ctcattcagc 9300 gagatcgcct ttgcattgct gcacataatt ttggttgccg cgtcgatatc aatgaccgct 9360 ttccgattca gcttgtccac ttcttcgctc agattcaggg cggtttggca cagcttgata 9420 ttggcttcca cccagctcac atcatagatt tccgccactt tttcaaacag ggagagggct 9480 tggcggtagt tcttattctt atacagattg attgcctggt tcaaaatgct catttattaa 9540 cctcctacta gtgaattttc gaattactta ccgcagtact tgacacccac ctgggaattg 9600 tttttggtgc gtttgaattg gcggatggta cggtagatgc taaagggcag gctgatcaga 9660 ccgagcggaa aattgttctt attgatgatg agcttgccca gctgatagct caggtgtttc 9720 ttgacccgtt cggcttcgtg tttatccgcg tacaggaaga tgctcggcag gctcacttgg 9780 tactccgaat catatttctt cttccaggtc cgccattcgc tgatcaacgc aaacggaatc 9840 gagatcagac cgaggaacgt cttggagcgg ctcaccatca ccgcacccag gcggtagccg 9900 atatcttgct tgatgcgttc ggccgcacca tacagctccg gcagttgttt cttttcgaga 9960 cgttgattgt cgatgaagta ctgttcgagc ttttgctgca ccagatgcag ctgattgagc 10020 agcaattctt tttcgcacga cagcttttcg aggcgctgtt gttgcagttc atttttgttc 10080 tgttcctttt tcagcaggga ctcgaagttc tcgatcgcgc actccagttc ctggacctgg 10140 atggttttgt ttttaatgat cagatcatac tggatcagtt cttccttgct atccgacagc 10200 tctttcagaa tggcttgata ggcgttcagc tgtttggacg tgtgcagttc gttgtccaga 10260 atgatctttt tgctgctctg gtacagaccg ttcacgatat cgagggtgat ctggcgttgt 10320 ttaatgaacg tctcccaaat aaaggacggc ttatagtttt ccttctccag cacccgcaag 10380 ggggtgttgg cgttcgattg caattcaaag tacagttcct tgcaatcggg atagtcgttc 10440 aggacgttga agatcaagta ctcctccgtc tcgctttgct tgaaaatgat atccccggtc 10500 ccgatgtcaa taccgctgag ggacatgatc tcctgatgtt ctttttccag cgtaatggag 10560 gcttcggcgg tcttaaagtc attcacgctc tgctccagcg agtggttgat ggtattggag 10620 aacgacaacc cgaatttcag tttcagtttg tgttgcagtt gctggatgca gtcctcggcg 10680 ttgcgcttca cctgttcgct cgacaccagc aggcaccgac cccggttgtt gaggaagaag 10740 tgcagcaagg cggtgttgta tgccagccag tttttgatca gatgctccga ggtatagttg 10800 ctggagatgt tctggtccga gaagtagttc gtcaggatgc ttttggggtg gtcgtagatg 10860 aggataaagg tgatgttctc atccaccgat ttccaatatt ccaacgtgtg aattgcgttg 10920 gggtcgctcc aaccgcacag tttctggttc aggttggaca gcatcagatc caatgcgata 10980 ccgttccaga cggtgctcac atggagcggt tcaaagtcgg cggaatcggt caccgtatag 11040 atgtccggcg actggtacgc cttccgcagc gtctgggtga tgtcctgggg cgagaggttc 11100 tcacgtttgg acgggcacag ggagttcatg ccgcgctgat gcaggagttc ttccacgatt 11160 tggtagttgc tgctcggatg gcccacgatc accaggcggt tcatttatta acctcctttc 11220 gaaaatgaac ggtccgttaa atatagccat tcggattctt catctgccag cgccaggcgt 11280 cctccagcat ggtttcgagt tcccgcttgg ctttccagtt cagatatttg ttggcctttt 11340 cgggggagga ccagctctcc gcgatatcac cgtcacggcg gctcacgatt tcatacggaa 11400 tccgcacgcc ggaaatcttt tcaaaggtgg acaccagttc cagcaccgaa taacctttac 11460 ccgtgcccaa attaaagacg tggtagttgg tgttattgtc gcggaagaga taggacagcg 11520 ctgcgacgtg cccttcggcc aggtccatca catggatata gtcacggacc cccgtgccgt 11580 ctttggtggg ataatcacca ccgaacacca tcagtttttc cagtttcccc atcgcgacct 11640 gcaagatgta cggcaccaag ttggagggga tgtctgccgg gctttcacca atcataccgg 11700 attcgtgggc gcccgtcgga ttaaagtagc gcaagcagag gaaattcgtg tcggagtatt 11760 tcttggcgat gtcgcggatc atcagctccg agatgtactt ggacgtacca tacggattca 11820 gcgtgccacc aatatggcag tcttcggtga cgggcatgat cttgctttcc ccatacaccg 11880 tcgccgacga gctaaagatg aagttggcga cgtcgttctt gatggcgcaa ttgatgagtt 11940 gcagggtgcc gctcacgttg ttgtcatagt agaagatggg cttgatcagg ctttctgcga 12000 ccgatttcgc acctgcaaag tgcatgatgc agtcgaattt gtgtttcttc aggatctggt 12060 tcacttcctt ctcgttgttg atattgagtt cgtagaacgt gactttcttc tttgcgatca 12120 gctcaatgcg acggatgctt tcgcagctgc tgttgatgag attgtcaatg atgacgacat 12180 tgtagccttt gttcagcagg cagagcgacg tgtggctgcc gatgtagcct gcaccgccgg 12240 tgaccaggat gttcatttat taacctcctc ggtccgaatt aacctaggtt atgaggtcag 12300 cattgcttct tcacgcggtg ttaattaagt aatcgatagt gatttaaata tgcaagatct 12360 agttacctgc aggattattg tttctgttgc ataaagccta aggggtaggc ctttctagag 12420 atagccattt tttgcactcc tgtatccgct tcttgcaagg ctggacttat ccctatcaaa 12480 ccggacactg caggctgaca agctttcatt acatatgaag agtttgtaga aacgcaaaaa 12540 ggccatccgt caggatggcc ttctaagaag gctcgagtgg cgcgcctaag tcgaatttct 12600 gccattcatc cgcttattat cacttattca ggcgtagcaa ccaggcgttt aagggcacca 12660 ataactgcct taaaaaaatt acgccccgcc ctgccactca tcgcagtact gttgtaattc 12720 attaagcatt ctgccgacat ggaagccatc acaaacggca tgatgaacct gaatcgccag 12780 cggcatcagc accttgtcgc cttgcgtata atatttgccc atggtgaaaa cgggggcgaa 12840 gaagttgtcc atattggcca cgtttaaatc aaaactggtg aaactcaccc agggattggc 12900 tgagacgaaa aacatattct caataaaccc tttagggaaa taggccaggt tttcaccgta 12960 acacgccaca tcttgcgaat atatgtgtag aaactgccgg aaatcgtcgt ggtattcact 13020 ccagagcgat gaaaacgttt cagtttgctc atggaaaacg gtgtaacaag ggtgaacact 13080 atcccatatc accagctcac cgtctttcat tgccatacgg aattccggat gagcattcat 13140 caggcgggca agaatgtgaa taaaggccgg ataaaacttg tgcttatttt tctttacggt 13200 ctttaaaaag gccgtaatat ccagctgaac ggtctggtta taggtacatt gagcaactga 13260 ctgaaatgcc tcaaaatgtt ctttacgatg ccattgggat atatcaacgg tggtatatcc 13320 agtgattttt ttctccattt tagcttcctt agctcctgaa aatctcgata actcaaaaaa 13380 tacgcccggt agtgatctta tttcattatg gtgaaagttg gaacctctta cgtgccgatc 13440 aacgtctcat tttcgccaaa agttggccca gggcttcccg gtatcaacag ggacaccagg 13500 atttatttat tctgcgaagt gatcttccgt cacaggtatt tattcggcgc aaagggcctc 13560 gtgatacgcc tatttttata ggttaatgtc atgataataa tggtttctta gacgtcaggt 13620 ggcacttttc ggggaaatgt gcgcgcccgc gttcctgctg gcgctgggcc tgtttctggc 13680 gctggacttc ccgctgttcc gtcagcagct tttcgcccac ggccttgatg atcgcggcgg 13740 ccttggcctg catatcccga ttcaacggcc ccagggcgtc cagaacgggc ttcaggcgct 13800 cccgaaggt 13809 <210> 152 <211> 13956 <212> DNA <213> Artificial Sequence <220> <223> synthetic plasmid pCX082 <400> 152 ctcgggccgt ctcttgggct tgatcggcct tcttgcgcat ctcacgcgct cctgcggcgg 60 cctgtagggc aggctcatac ccctgccgaa ccgcttttgt cagccggtcg gccacggctt 120 ccggcgtctc aacgcgcttt gagattccca gcttttcggc caatccctgc ggtgcatagg 180 cgcgtggctc gaccgcttgc gggctgatgg tgacgtggcc cactggtggc cgctccaggg 240 cctcgtagaa cgcctgaatg cgcgtgtgac gtgccttgct gccctcgatg ccccgttgca 300 gccctagatc ggccacagcg gccgcaaacg tggtctggtc gcgggtcatc tgcgctttgt 360 tgccgatgaa ctccttggcc gacagcctgc cgtcctgcgt cagcggcacc acgaacgcgg 420 tcatgtgcgg gctggtttcg tcacggtgga tgctggccgt cacgatgcga tccgccccgt 480 acttgtccgc cagccacttg tgcgccttct cgaagaacgc cgcctgctgt tcttggctgg 540 ccgacttcca ccattccggg ctggccgtca tgacgtactc gaccgccaac acagcgtcct 600 tgcgccgctt ctctggcagc aactcgcgca gtcggcccat cgcttcatcg gtgctgctgg 660 ccgcccagtg ctcgttctct ggcgtcctgc tggcgtcagc gttgggcgtc tcgcgctcgc 720 ggtaggcgtg cttgagactg gccgccacgt tgcccatttt cgccagcttc ttgcatcgca 780 tgatcgcgta tgccgccatg cctgcccctc ccttttggtg tccaaccggc tcgacggggg 840 cagcgcaagg cggtgcctcc ggcgggccac tcaatgcttg agtatactca ctagactttg 900 cttcgcaaag tcgtgaccgc ctacggcggc tgcggcgccc tacgggcttg ctctccgggc 960 ttcgccctgc gcggtcgctg cgctcccttg ccagcccgtg gatatgtgga cgatggccgc 1020 gagcggccac cggctggctc gcttcgctcg gcccgtggac aaccctgctg gacaagctga 1080 tggacaggct gcgcctgccc acgagcttga ccacagggat tgcccaccgg ctacccagcc 1140 ttcgaccaca tacccaccgg ctccaactgc gcggcctgcg gccttgcccc atcaattttt 1200 ttaattttct ctggggaaaa gcctccggcc tgcggcctgc gcgcttcgct tgccggttgg 1260 acaccaagtg gaaggcgggt caaggctcgc gcagcgaccg cgcagcggct tggccttgac 1320 gcgcctggaa cgacccaagc ctatgcgagt gggggcagtc gaaggcgaag cccgcccgcc 1380 tgccccccga gacctgcaga tccacatcct tgaaggccgc agcgacgagc agaaggaaac 1440 cctcattcgg gaagtcagcg aggccatctc gcgctccctg gatgcgccgc tgaccagcgt 1500 gcgagtgatt atcacggaga tggccaaggg ccacttcggc atcggcggcg aactggccag 1560 caaggtcaga cgctgaagtg gagatgccca agggcacttc gggtcgagga acccgacctg 1620 cattgggacg cggccacgga gagcgcgggc aaacgccggc actatagcca gtggagtttg 1680 taaaacgcta tttcagagct tggagagtgt ctaagaaagc cggggcgatg ccaacccatc 1740 ccttcttcgg ctatgcatcg ttcgtaatca agccacttcc tttttgcatt gacgcagggt 1800 gtcggaaggc aactcgccga acgcgctcct atagttttca gcgaagcgtc ccaaatgtaa 1860 gaagccgtag tctagggcta tctcagttat actacgcaca ttggcactgg gatcgttcaa 1920 gcaggcgcgg atgctttcga gcttgcggtt gcggatgtag ttcttcggcg tggtgccggc 1980 atgcttctcg aacaaattgt agagcgagcg tggactcatc atcgccagct ccgctaaccg 2040 ctcaaggctg atattccgtt tgagattctc ctcaatgaat tgaacgactc gctcgaaaga 2100 cgggttacct ttgctgaaaa tttcacggct gacattgctg cccagcattt cgagcagctt 2160 ggaagcgatg atccccgcat agtgctcttg gacccgaggc atcgactttg tatgttccgc 2220 ttcgtcacaa actaacccga gtagattgat aaagccatcg agttgctgga gattgtgtcg 2280 cgcggcgaaa cggataccct ccctcggctt gtgccaattg ttgtcactgc atgcccgatc 2340 aaggaccact gagggcaatt taacgataaa tttctcgcaa tcttctgaat aggtcaggtc 2400 ggcttggtca tccggattga gcagcaatag ttcgcccggc gcaaaatagt gctcctggcc 2460 atggccacgc cacaggcaat ggcctttgag tattatttgc agatgataac aggtctctaa 2520 tccaggcgag attaccctca cgctaccgcc gtagctgatt cgacacaggt cgaggcatcc 2580 gaagattctg tggtgcagcc tgcctgccgg gcgcccgccc ttgggcaggc gaatagagtg 2640 cgtaccgaca tactggttaa cataatcgga gactgcatag ggctcggcgt ggacgaagat 2700 ctgacttttc tcgttcaata agcaaaaatc catagttcac ggttctctta ttttaatgtg 2760 ggctgcttgg tgtgatgtag aaaggcgcca agtcgatgaa aatgcatctc gacgtgatgc 2820 gtatacgggt tacccccatt gccacgttgc gccatccttt ttgcaatcag tgaccacttt 2880 tccaagcaaa aataacgcca agcagaacga agacgttctt tttaagaagc gagaacacca 2940 gaagttcgtg ctgtcggggc atgcggcgac gaattggcgg ataaagggga tctgcaggtc 3000 ccgagcctca cggcggcgag tgcgggggtt ccaagggggc agcgccacct tgggcaaggc 3060 cgaaggccgc gcagtcgatc aacaagcccc ggaggggcca ctttttgccg gagggggagc 3120 cgcgccgaag gcgtggggga accccgcagg ggtgcccttc tttgggcacc aaagaactag 3180 atatagggcg aaatgcgaaa gacttaaaaa tcaacaactt aaaaaagggg ggtacgcaac 3240 agctcattgc ggcacccccc gcaatagctc attgcgtagg ttaaagaaaa tctgtaattg 3300 actgccactt ttacgcaacg cataattgtt gtcgcgctgc cgaaaagttg cagctgattg 3360 cgcatggtgc cgcaaccgtg cggcacccta ccgcatggag ataagcatgg ccacgcagtc 3420 cagagaaatc ggcattcaag ccaagaacaa gcccggtcac tgggtgcaaa cggaacgcaa 3480 agcgcatgag gcgtgggccg ggcttattgc gaggaaaccc acggcggcaa tgctgctgca 3540 tcacctcgtg gcgcagatgg gccaccagaa cgccgtggtg gtcagccaga agacactttc 3600 caagctcatc ggacgttctt tgcggacggt ccaatacgca gtcaaggact tggtggccga 3660 gcgctggatc tccgtcgtga agctcaacgg ccccggcacc gtgtcggcct acgtggtcaa 3720 tgaccgcgtg gcgtggggcc agccccgcga ccagttgcgc ctgtcggtgt tcagtgccgc 3780 cgtggtggtt gatcacgacg accaggacga atcgctgttg gggcatggcg acctgcgccg 3840 catcccgacc ctgtatccgg gcgagcagca actaccgacc ggccccggcg aggagccgcc 3900 cagccagccc ggcattccgg gcatggaacc agacctgcca gccttgaccg aaacggagga 3960 atgggaacgg cgcgggcagc agcgcctgcc gatgcccgat gagccgtgtt ttctggacga 4020 tggcgagccg ttggagccgc cgacacgggt cacgctgccg cgccggtagc acttgggttg 4080 cgcagcaacc cgtaagtgcg ctgttccaga ctatcggctg tagccgcctc gccgccctat 4140 accttgtctg cctccccgcg ttgcgtcgcg gtgcatggag ccgggccacc tcgacctgaa 4200 tggaagccgg cggcacctcg ctaacggatt caccgttttt atcaggctct gggaggcaga 4260 ataaatgatc atatcgtcaa ttattacctc cacggggaga gcctgagcaa actggcctca 4320 ggcatttgag aagcacacgg tcacactgct tccggtagtc aataaaccgg taaaccagca 4380 atagacataa gcggctattt aacgaccctg ccctgaaccg acgaccgggt cgaatttgct 4440 ttcgactatc ggcgcgccag agctcatcgt taatgtcttc gtgcgccgtc agtcggcgca 4500 cgttttttct ctctggtacc gtgtcactga tctagtcaat tactcgaagt atccacaagt 4560 gaagcatact aagtaatgta caagaatcaa aaaaatcggc tacgcaagtc gcgtagccga 4620 atcatttaag gatccttcca ttcaggtcga ggtggcccgg ctccatgcac cgcgacgcaa 4680 cgcggggagg cagacaaggt atagggcggc gcctacaatc catgccaacc cgttccatgt 4740 gctcgccgag gcggcataaa tcgccgtgac gatcagcggt ccagtgatcg aagttaggct 4800 ggtaagagcc gcgagcgatc cttgaagctg tccctgatgg tcgtcatcta cctgcctgga 4860 cagcatggcc tgcaacgcgg gcatcccgat gccgccggaa gcgagaagaa tcataatggg 4920 gaaggccatc cagcctcgcg tcgcgaacgc cagcaagacg tagcccagcg cgtcggccgc 4980 catgccggcg ataatggcct gcttctcgcc gaaacgtttg gtggcgggac cagtgacgaa 5040 ggcttgagcg agggcgtgca agattccgaa taccgcaagc gacaggccga tcatcgtcgc 5100 gctccagcga aagcggtcct cgccgaaaat gacccagagc gctgccggca cctgtcctac 5160 gagttgcatg ataaagaaga cagtcataag tgcggcgacg atagtcatgc cccgcgccca 5220 ccggaaggag ctgactgggt tgaaggctct caagggcatc ggtcgacgct ctcccttatg 5280 cgactcctgc attaggaagc agcccagtag taggttgagg ccgttgagca ccgccgccgc 5340 aaggaatggt gcatgcaagg agatggcgcc caacagtccc ccggccacgg ggcctgccac 5400 catacccacg ccgaaacaag cgctcatgag cccgaagtgg cgagcccgat cttccccatc 5460 ggtgatgtcg gcgatatagg cgccagcaac cgcacctgtg gcgccggtga tgccggccac 5520 gatgcgtccg gcgtacaaga tccacaggac gggtgtggtc gccatgatcg cgtagtcgat 5580 agtggctcca agtagcgaag cgagcaggac tgggcggcgg ccaaagcggt cggacagtgc 5640 tccgagaacg ggtgcgcata gaaattgcat caacgcatat agcgctagca gcacgccata 5700 gtgactggcg atgctgtcgg aatggacgat atcccgcaag aggcccggca gtaccggcat 5760 aaccaagcct atgcctacag catccagggt gacggtgccg aggatgacga tgagcgcatt 5820 gttagatttc atacacggtg cctgactgcg ttagcaattt aactgtgata aactaccgca 5880 ttaaagccga gcgatgataa gctgtcaaac atgagatccg ataaatcgat tgatagattt 5940 aaataagaac tgcagaagct agcttagatg ctcgtgaaat tgacgtgggc gctttgcagg 6000 gccgtcttaa tggcgttggt gtccacgagg atcgagtcgg gtgcggaaaa cggacggttc 6060 ttgttggtga aatcgctgtt accaatgtac agcgattcct tgttacgcag cgcctggatg 6120 tgccagcggg accacgaatc ccaatacttc tggcgatccg gcgagatacc ttggctggtg 6180 tagccggtcg tcgggctgtt catcaacgag tcggtgcggt gcgagcccag cgtcagcggc 6240 aacttgatcc gatgcaccgt ggaatcgccg aagatcagct tcagacgcgc gataaattcg 6300 ctatccgcac ccgttttcac acaatcccag acaccggcct tctgcaagac gtcggcacgg 6360 cgaaacagga gcgacgacgg attcagacgc ttcaaggggt acactgcgcg ggcatagaaa 6420 ataccgttgt cttgcaggcg cacccagtcc gagatggagc agatgagctt cggattgagc 6480 aacaaggggg agatttggcg gaacagcttt tccggatggc tccagtcatc cgaatcgtgg 6540 caggtgacga actcgccctt cgcttggatc aagccgatac gcttcgcggc ataggtgccg 6600 acattctgcg gcaggctaat gatcttgatg cgcgtgtctt tgagggcgag ccgctggaga 6660 cgaaacaggg tgtcatcggt gctcgcgtca tccacaatga tcagctcgaa ggaacggtag 6720 gtctgattga ggagcgaaat caccgcattt tccacgcggc gacccgtatt ataggtggtc 6780 atcaggatgg agatcaacgg ccccgtctgg gccgggtacg ggatgctggt gatgatgttg 6840 cacggggaga gcggggagct gttgtccgtc aaggccacgg ggctgaggcc gaagtattta 6900 tagtattcat tcagccgatt caggctaatt tcggcggttt cgcggaaggc gttattttgc 6960 agcagcagga tatccgggct atagacgata tcggatgcgt cgatctgggc gagggtcgag 7020 atggcctttt gggtcaggcc gatccggagt tgcagtgcgg tatacaggtc cagcgggcag 7080 ttgtccacgt tgtccaacag gctcaggcta aaggtcggcg agtaggacgc cagggttttc 7140 gccagttcca ctttctgatg ggtatcggtg aactcgtcct tgaactccat cagcagctcg 7200 ggcgtcaggc tgatgtcgcc gcaggcgatt tttgcgatct tgattgccag tttgcagcgc 7260 caatcggacg gggtatccgt caagttatgc agcgaccagt acatattcag acgatacatc 7320 gcgaggatgc gtttcgactg ccagaaccgg caatcatcct ggatggccgc gagcgcgtgg 7380 acgtagcggc tctttttgag cagccacaag aatttgagat tattgaacat ttattaacct 7440 cctgctagca acttaagtta cgaatcgacg ccgaacaggt cgcgggtgta gactttctcc 7500 gagacatctt ccagttcgct ggtgcggcga ttcgccacaa tgacatcgac gcgctcctta 7560 aaggaattga tgtcgcgctc gacgtaggaa ccgaagaagt agggttcttt caggaccggc 7620 tcgtacacca caatctcgat acccttggcc ttcaaacgtt tcatgacccc ctggatgctg 7680 ctggcccgga aattgtcgct acccgccttc atgatcaggc gatagatacc gaccactttg 7740 ggcttacggg acaggatgtc ctcggccacg aagtccttac gggtcgtatt cgcatccacg 7800 atggcctgga tcaggttttg cgggacgtcg cgataattgg ccaacagctg cttcgtatcc 7860 ttcggcagac agtaaccgcc gtagccgaag gacgggttgt tgtaatgttg accaatgcgc 7920 ggatcgaggg agacgccttc gatgatttgt ttggtatcca ggccgtgcac gctcgcgtag 7980 gtgtccagct cgttaaagta cgcgatacgc atcgccagat acgtgttcgc gaacagtttg 8040 atggcttctg cctcgggcga atccgtcagc aggatcggaa tatccttttt gatggcacct 8100 tccgacagga gttcggcgaa cttccgtgcg cgttccgacg attcgcccac gacaatgcgg 8160 ctcggataga gattatcata cagggctttg ccttcgcgca ggaactccgg ggaaaagatg 8220 atattattcg tgttcagatc gcgcttcagg cgttcggtga acccgacggg gacggtggat 8280 ttgataatga tggtcgcgtt cgggttaatg gacagcacgt cacacgcgac gctttcgacg 8340 ctcagggtat caaagttgtt attaatcgga tcatagttcg tcggggtggc gatgatcacg 8400 tagtctgcat cgcgatatgc ctcgtatttt tccgtcgtcg cgtagaggtt cagcttacga 8460 ttggagagaa acttctggat ttccgggtcg caaatcggcg agattttctt gttaatgagc 8520 tggaccttct tcgggtcgat gtccagggcg atgatgtcgt gtttttggga gaggaggatc 8580 gcaatgctga tacccacata gccgacgccg gccacggcaa ttttcattta ttaacctcct 8640 taagtgaatt caaactagtt tacaagtcgt tttcgatctt ctcccaggta tatttgcgac 8700 attcattcaa gttggtcagc ggcgagtatt tgtacttttt gataccgagg cgcgacaggc 8760 tttcgttcac caccttgaaa tggttttcct tttggatgtc cagtttcttg atcgacgtgt 8820 tctcgccgtg caggacacgg ttgtagcaaa tcttattgat atgcttaaac gggccgactt 8880 cgctgagttt caaatacata tcgtaatcca ccgcattgct gatgctctcg ttgaagcctt 8940 cggtgaggtt ccatgcacgc gccgtgaaca tacggaagtg gtggcagatc atcgcgctcg 9000 tgagcttttc gcggctgtaa atcggccagt tgtagccatt gctaatcaag ttaccttcac 9060 gatcaatatt gcgattggtg gtgtacacgc aggcgaggct caggtctttg cgaaattcat 9120 ccagacacag ttccacggca tcgggctcca ggaaatcatc ggaatccagc tgcccgatgt 9180 agaaaccccg gcacaggcgg actgcggtat tcgaggcgga gccgatgcct ttgtttttct 9240 ggctgatgaa acggacgcgc gggtggtttg cgtaatgttc ttgcaggatg cgcagcgtat 9300 catcggtgct cccgtcatcg cagatgcaga cctccagatc ggtgatcgtt tggttcagtg 9360 ccgattcgac gcagcgcacg atatatttgc tgcaattata cgcggggatg tagatgctca 9420 ccaggggcac acgtttcagg gtggcgctct cgattttctc cttcttgcga taaaagtagg 9480 gcaccttctg ctgcaacagc tggacggtaa tgtttttacc tgccgcgcga tcggtttcgt 9540 tctccttacc gggcggttcc tgatgatatg ccatcgcgcc ttccacgcta cggaaataac 9600 aaccctcgcg gtacagccga tagccgaact cattatcctc accgccccaa tgcgtgaact 9660 cttcgtcaaa ccaacccgcg cgaaacagcc acttctttgc aaacgccaca ttgccaccgc 9720 taaagaaccg gaacggggtg ttgcacaggc gcagattgtc ggtattcttg aaatgttcga 9780 tgcgccaatc gacggatttg ttctgctcga ccttgcctgc gacctgatta ttggtaataa 9840 tctccgggat ttcattgatc aggcttttct gggacaaaaa gtccagatag gtatgcttcg 9900 acgtgtcgat gtatttacgc gggccaatca gtgccacgtt atcatccacg gccaggagtt 9960 ccatatagga ctgcacccac aacgggttcg gcgccatatc gcagtccaag atcgccacgt 10020 agttgtattt cgctgcccgc aggcccaggt tccgcacggc gcacagctgg tagccgtagt 10080 ctttctggcg gacgtatttg atgttcagca acgactcgaa ctcgcggacg atctcttcga 10140 tgttttcctt ggaaccgtca tccgcgacga tgacctcata gtcataaatc gttttctgat 10200 tgcagaggca ggccagggtg atcgccagga ttttggcgcg attgtacgtc ggaatcacga 10260 tggacaggcc gtcgatgatc agttgcttgc gcggataatc atccagttct ttacgtttcc 10320 ctgcccagac gtagtcgttc gtgctttccg gcagcggcgg caaggtcagg tcgctcggcc 10380 aatccagcgg aatgggttcg acttctttca attcggcgcg ctcggatttc tttgcggtaa 10440 tttcccgata tttgctaatg atttcattct tttccacctc attcagcgag atcgcctttg 10500 cattgctgca cataattttg gttgccgcgt cgatatcaat gaccgctttc cgattcagct 10560 tgtccacttc ttcgctcaga ttcagggcgg tttggcacag cttgatattg gcttccaccc 10620 agctcacatc atagatttcc gccacttttt caaacaggga gagggcttgg cggtagttct 10680 tattcttata cagattgatt gcctggttca aaatgctcat ttattaacct cctactagtg 10740 aattttcgaa ttacttaccg cagtacttga cacccacctg ggaattgttt ttggtgcgtt 10800 tgaattggcg gatggtacgg tagatgctaa agggcaggct gatcagaccg agcggaaaat 10860 tgttcttatt gatgatgagc ttgcccagct gatagctcag gtgtttcttg acccgttcgg 10920 cttcgtgttt atccgcgtac aggaagatgc tcggcaggct cacttggtac tccgaatcat 10980 atttcttctt ccaggtccgc cattcgctga tcaacgcaaa cggaatcgag atcagaccga 11040 ggaacgtctt ggagcggctc accatcaccg cacccaggcg gtagccgata tcttgcttga 11100 tgcgttcggc cgcaccatac agctccggca gttgtttctt ttcgagacgt tgattgtcga 11160 tgaagtactg ttcgagcttt tgctgcacca gatgcagctg attgagcagc aattcttttt 11220 cgcacgacag cttttcgagg cgctgttgtt gcagttcatt tttgttctgt tcctttttca 11280 gcagggactc gaagttctcg atcgcgcact ccagttcctg gacctggatg gttttgtttt 11340 taatgatcag atcatactgg atcagttctt ccttgctatc cgacagctct ttcagaatgg 11400 cttgataggc gttcagctgt ttggacgtgt gcagttcgtt gtccagaatg atctttttgc 11460 tgctctggta cagaccgttc acgatatcga gggtgatctg gcgttgttta atgaacgtct 11520 cccaaataaa ggacggctta tagttttcct tctccagcac ccgcaagggg gtgttggcgt 11580 tcgattgcaa ttcaaagtac agttccttgc aatcgggata gtcgttcagg acgttgaaga 11640 tcaagtactc ctccgtctcg ctttgcttga aaatgatatc cccggtcccg atgtcaatac 11700 cgctgaggga catgatctcc tgatgttctt tttccagcgt aatggaggct tcggcggtct 11760 taaagtcatt cacgctctgc tccagcgagt ggttgatggt attggagaac gacaacccga 11820 atttcagttt cagtttgtgt tgcagttgct ggatgcagtc ctcggcgttg cgcttcacct 11880 gttcgctcga caccagcagg caccgacccc ggttgttgag gaagaagtgc agcaaggcgg 11940 tgttgtatgc cagccagttt ttgatcagat gctccgaggt atagttgctg gagatgttct 12000 ggtccgagaa gtagttcgtc aggatgcttt tggggtggtc gtagatgagg ataaaggtga 12060 tgttctcatc caccgatttc caatattcca acgtgtgaat tgcgttgggg tcgctccaac 12120 cgcacagttt ctggttcagg ttggacagca tcagatccaa tgcgataccg ttccagacgg 12180 tgctcacatg gagcggttca aagtcggcgg aatcggtcac cgtatagatg tccggcgact 12240 ggtacgcctt ccgcagcgtc tgggtgatgt cctggggcga gaggttctca cgtttggacg 12300 ggcacaggga gttcatgccg cgctgatgca ggagttcttc cacgatttgg tagttgctgc 12360 tcggatggcc cacgatcacc aggcggttca tttattaacc tcctttcgaa aatgaacggt 12420 ccgaattaac ctaggttatg aggtcagcat tgcttcttca cgcggtgtta attaagtaat 12480 cgatagtgat ttaaatatgc aagatctagt tacctgcagg attattgttt ctgttgcata 12540 aagcctaagg ggtaggcctt tctagagata gccatttttt gcactcctgt atccgcttct 12600 tgcaaggctg gacttatccc tatcaaaccg gacactgcag gctgacaagc tttcattaca 12660 tatgaagagt ttgtagaaac gcaaaaaggc catccgtcag gatggccttc taagaaggct 12720 cgagtggcgc gcctaagtcg aatttctgcc attcatccgc ttattatcac ttattcaggc 12780 gtagcaacca ggcgtttaag ggcaccaata actgccttaa aaaaattacg ccccgccctg 12840 ccactcatcg cagtactgtt gtaattcatt aagcattctg ccgacatgga agccatcaca 12900 aacggcatga tgaacctgaa tcgccagcgg catcagcacc ttgtcgcctt gcgtataata 12960 tttgcccatg gtgaaaacgg gggcgaagaa gttgtccata ttggccacgt ttaaatcaaa 13020 actggtgaaa ctcacccagg gattggctga gacgaaaaac atattctcaa taaacccttt 13080 agggaaatag gccaggtttt caccgtaaca cgccacatct tgcgaatata tgtgtagaaa 13140 ctgccggaaa tcgtcgtggt attcactcca gagcgatgaa aacgtttcag tttgctcatg 13200 gaaaacggtg taacaagggt gaacactatc ccatatcacc agctcaccgt ctttcattgc 13260 catacggaat tccggatgag cattcatcag gcgggcaaga atgtgaataa aggccggata 13320 aaacttgtgc ttatttttct ttacggtctt taaaaaggcc gtaatatcca gctgaacggt 13380 ctggttatag gtacattgag caactgactg aaatgcctca aaatgttctt tacgatgcca 13440 ttgggatata tcaacggtgg tatatccagt gatttttttc tccattttag cttccttagc 13500 tcctgaaaat ctcgataact caaaaaatac gcccggtagt gatcttattt cattatggtg 13560 aaagttggaa cctcttacgt gccgatcaac gtctcatttt cgccaaaagt tggcccaggg 13620 cttcccggta tcaacaggga caccaggatt tatttattct gcgaagtgat cttccgtcac 13680 aggtatttat tcggcgcaaa gggcctcgtg atacgcctat ttttataggt taatgtcatg 13740 ataataatgg tttcttagac gtcaggtggc acttttcggg gaaatgtgcg cgcccgcgtt 13800 cctgctggcg ctgggcctgt ttctggcgct ggacttcccg ctgttccgtc agcagctttt 13860 cgcccacggc cttgatgatc gcggcggcct tggcctgcat atcccgattc aacggcccca 13920 gggcgtccag aacgggcttc aggcgctccc gaaggt 13956 <210> 153 <211> 12916 <212> DNA <213> Artificial Sequence <220> <223> synthetic plasmid pCX075 <400> 153 ctcgggccgt ctcttgggct tgatcggcct tcttgcgcat ctcacgcgct cctgcggcgg 60 cctgtagggc aggctcatac ccctgccgaa ccgcttttgt cagccggtcg gccacggctt 120 ccggcgtctc aacgcgcttt gagattccca gcttttcggc caatccctgc ggtgcatagg 180 cgcgtggctc gaccgcttgc gggctgatgg tgacgtggcc cactggtggc cgctccaggg 240 cctcgtagaa cgcctgaatg cgcgtgtgac gtgccttgct gccctcgatg ccccgttgca 300 gccctagatc ggccacagcg gccgcaaacg tggtctggtc gcgggtcatc tgcgctttgt 360 tgccgatgaa ctccttggcc gacagcctgc cgtcctgcgt cagcggcacc acgaacgcgg 420 tcatgtgcgg gctggtttcg tcacggtgga tgctggccgt cacgatgcga tccgccccgt 480 acttgtccgc cagccacttg tgcgccttct cgaagaacgc cgcctgctgt tcttggctgg 540 ccgacttcca ccattccggg ctggccgtca tgacgtactc gaccgccaac acagcgtcct 600 tgcgccgctt ctctggcagc aactcgcgca gtcggcccat cgcttcatcg gtgctgctgg 660 ccgcccagtg ctcgttctct ggcgtcctgc tggcgtcagc gttgggcgtc tcgcgctcgc 720 ggtaggcgtg cttgagactg gccgccacgt tgcccatttt cgccagcttc ttgcatcgca 780 tgatcgcgta tgccgccatg cctgcccctc ccttttggtg tccaaccggc tcgacggggg 840 cagcgcaagg cggtgcctcc ggcgggccac tcaatgcttg agtatactca ctagactttg 900 cttcgcaaag tcgtgaccgc ctacggcggc tgcggcgccc tacgggcttg ctctccgggc 960 ttcgccctgc gcggtcgctg cgctcccttg ccagcccgtg gatatgtgga cgatggccgc 1020 gagcggccac cggctggctc gcttcgctcg gcccgtggac aaccctgctg gacaagctga 1080 tggacaggct gcgcctgccc acgagcttga ccacagggat tgcccaccgg ctacccagcc 1140 ttcgaccaca tacccaccgg ctccaactgc gcggcctgcg gccttgcccc atcaattttt 1200 ttaattttct ctggggaaaa gcctccggcc tgcggcctgc gcgcttcgct tgccggttgg 1260 acaccaagtg gaaggcgggt caaggctcgc gcagcgaccg cgcagcggct tggccttgac 1320 gcgcctggaa cgacccaagc ctatgcgagt gggggcagtc gaaggcgaag cccgcccgcc 1380 tgccccccga gacctgcaga tccacatcct tgaaggccgc agcgacgagc agaaggaaac 1440 cctcattcgg gaagtcagcg aggccatctc gcgctccctg gatgcgccgc tgaccagcgt 1500 gcgagtgatt atcacggaga tggccaaggg ccacttcggc atcggcggcg aactggccag 1560 caaggtcaga cgctgaagtg gagatgccca agggcacttc gggtcgagga acccgacctg 1620 cattgggacg cggccacgga gagcgcgggc aaacgccggc actatagcca gtggagtttg 1680 taaaacgcta tttcagagct tggagagtgt ctaagaaagc cggggcgatg ccaacccatc 1740 ccttcttcgg ctatgcatcg ttcgtaatca agccacttcc tttttgcatt gacgcagggt 1800 gtcggaaggc aactcgccga acgcgctcct atagttttca gcgaagcgtc ccaaatgtaa 1860 gaagccgtag tctagggcta tctcagttat actacgcaca ttggcactgg gatcgttcaa 1920 gcaggcgcgg atgctttcga gcttgcggtt gcggatgtag ttcttcggcg tggtgccggc 1980 atgcttctcg aacaaattgt agagcgagcg tggactcatc atcgccagct ccgctaaccg 2040 ctcaaggctg atattccgtt tgagattctc ctcaatgaat tgaacgactc gctcgaaaga 2100 cgggttacct ttgctgaaaa tttcacggct gacattgctg cccagcattt cgagcagctt 2160 ggaagcgatg atccccgcat agtgctcttg gacccgaggc atcgactttg tatgttccgc 2220 ttcgtcacaa actaacccga gtagattgat aaagccatcg agttgctgga gattgtgtcg 2280 cgcggcgaaa cggataccct ccctcggctt gtgccaattg ttgtcactgc atgcccgatc 2340 aaggaccact gagggcaatt taacgataaa tttctcgcaa tcttctgaat aggtcaggtc 2400 ggcttggtca tccggattga gcagcaatag ttcgcccggc gcaaaatagt gctcctggcc 2460 atggccacgc cacaggcaat ggcctttgag tattatttgc agatgataac aggtctctaa 2520 tccaggcgag attaccctca cgctaccgcc gtagctgatt cgacacaggt cgaggcatcc 2580 gaagattctg tggtgcagcc tgcctgccgg gcgcccgccc ttgggcaggc gaatagagtg 2640 cgtaccgaca tactggttaa cataatcgga gactgcatag ggctcggcgt ggacgaagat 2700 ctgacttttc tcgttcaata agcaaaaatc catagttcac ggttctctta ttttaatgtg 2760 ggctgcttgg tgtgatgtag aaaggcgcca agtcgatgaa aatgcatctc gacgtgatgc 2820 gtatacgggt tacccccatt gccacgttgc gccatccttt ttgcaatcag tgaccacttt 2880 tccaagcaaa aataacgcca agcagaacga agacgttctt tttaagaagc gagaacacca 2940 gaagttcgtg ctgtcggggc atgcggcgac gaattggcgg ataaagggga tctgcaggtc 3000 ccgagcctca cggcggcgag tgcgggggtt ccaagggggc agcgccacct tgggcaaggc 3060 cgaaggccgc gcagtcgatc aacaagcccc ggaggggcca ctttttgccg gagggggagc 3120 cgcgccgaag gcgtggggga accccgcagg ggtgcccttc tttgggcacc aaagaactag 3180 atatagggcg aaatgcgaaa gacttaaaaa tcaacaactt aaaaaagggg ggtacgcaac 3240 agctcattgc ggcacccccc gcaatagctc attgcgtagg ttaaagaaaa tctgtaattg 3300 actgccactt ttacgcaacg cataattgtt gtcgcgctgc cgaaaagttg cagctgattg 3360 cgcatggtgc cgcaaccgtg cggcacccta ccgcatggag ataagcatgg ccacgcagtc 3420 cagagaaatc ggcattcaag ccaagaacaa gcccggtcac tgggtgcaaa cggaacgcaa 3480 agcgcatgag gcgtgggccg ggcttattgc gaggaaaccc acggcggcaa tgctgctgca 3540 tcacctcgtg gcgcagatgg gccaccagaa cgccgtggtg gtcagccaga agacactttc 3600 caagctcatc ggacgttctt tgcggacggt ccaatacgca gtcaaggact tggtggccga 3660 gcgctggatc tccgtcgtga agctcaacgg ccccggcacc gtgtcggcct acgtggtcaa 3720 tgaccgcgtg gcgtggggcc agccccgcga ccagttgcgc ctgtcggtgt tcagtgccgc 3780 cgtggtggtt gatcacgacg accaggacga atcgctgttg gggcatggcg acctgcgccg 3840 catcccgacc ctgtatccgg gcgagcagca actaccgacc ggccccggcg aggagccgcc 3900 cagccagccc ggcattccgg gcatggaacc agacctgcca gccttgaccg aaacggagga 3960 atgggaacgg cgcgggcagc agcgcctgcc gatgcccgat gagccgtgtt ttctggacga 4020 tggcgagccg ttggagccgc cgacacgggt cacgctgccg cgccggtagc acttgggttg 4080 cgcagcaacc cgtaagtgcg ctgttccaga ctatcggctg tagccgcctc gccgccctat 4140 accttgtctg cctccccgcg ttgcgtcgcg gtgcatggag ccgggccacc tcgacctgaa 4200 tggaagccgg cggcacctcg ctaacggatt caccgttttt atcaggctct gggaggcaga 4260 ataaatgatc atatcgtcaa ttattacctc cacggggaga gcctgagcaa actggcctca 4320 ggcatttgag aagcacacgg tcacactgct tccggtagtc aataaaccgg taaaccagca 4380 atagacataa gcggctattt aacgaccctg ccctgaaccg acgaccgggt cgaatttgct 4440 ttcgactatc ggcgcgccag agctcatcgt taatgtcttc gtgcgccgtc agtcggcgca 4500 cgttttttct ctctggtacc gtgtcactga tctagtcaat tactcgaagt atccacaagt 4560 gaagcatact aagtaatgta caagaatcaa aaaaatcggc tacgcaagtc gcgtagccga 4620 atcatttaag gatccttcca ttcaggtcga ggtggcccgg ctccatgcac cgcgacgcaa 4680 cgcggggagg cagacaaggt atagggcggc gcctacaatc catgccaacc cgttccatgt 4740 gctcgccgag gcggcataaa tcgccgtgac gatcagcggt ccagtgatcg aagttaggct 4800 ggtaagagcc gcgagcgatc cttgaagctg tccctgatgg tcgtcatcta cctgcctgga 4860 cagcatggcc tgcaacgcgg gcatcccgat gccgccggaa gcgagaagaa tcataatggg 4920 gaaggccatc cagcctcgcg tcgcgaacgc cagcaagacg tagcccagcg cgtcggccgc 4980 catgccggcg ataatggcct gcttctcgcc gaaacgtttg gtggcgggac cagtgacgaa 5040 ggcttgagcg agggcgtgca agattccgaa taccgcaagc gacaggccga tcatcgtcgc 5100 gctccagcga aagcggtcct cgccgaaaat gacccagagc gctgccggca cctgtcctac 5160 gagttgcatg ataaagaaga cagtcataag tgcggcgacg atagtcatgc cccgcgccca 5220 ccggaaggag ctgactgggt tgaaggctct caagggcatc ggtcgacgct ctcccttatg 5280 cgactcctgc attaggaagc agcccagtag taggttgagg ccgttgagca ccgccgccgc 5340 aaggaatggt gcatgcaagg agatggcgcc caacagtccc ccggccacgg ggcctgccac 5400 catacccacg ccgaaacaag cgctcatgag cccgaagtgg cgagcccgat cttccccatc 5460 ggtgatgtcg gcgatatagg cgccagcaac cgcacctgtg gcgccggtga tgccggccac 5520 gatgcgtccg gcgtacaaga tccacaggac gggtgtggtc gccatgatcg cgtagtcgat 5580 agtggctcca agtagcgaag cgagcaggac tgggcggcgg ccaaagcggt cggacagtgc 5640 tccgagaacg ggtgcgcata gaaattgcat caacgcatat agcgctagca gcacgccata 5700 gtgactggcg atgctgtcgg aatggacgat atcccgcaag aggcccggca gtaccggcat 5760 aaccaagcct atgcctacag catccagggt gacggtgccg aggatgacga tgagcgcatt 5820 gttagatttc atacacggtg cctgactgcg ttagcaattt aactgtgata aactaccgca 5880 ttaaagccga gcgatgataa gctgtcaaac atgagatccg ataaatcgat tgatagattt 5940 aaataagaac tgcagaagct agcttagatg ctcgtgaaat tgacgtgggc gctttgcagg 6000 gccgtcttaa tggcgttggt gtccacgagg atcgagtcgg gtgcggaaaa cggacggttc 6060 ttgttggtga aatcgctgtt accaatgtac agcgattcct tgttacgcag cgcctggatg 6120 tgccagcggg accacgaatc ccaatacttc tggcgatccg gcgagatacc ttggctggtg 6180 tagccggtcg tcgggctgtt catcaacgag tcggtgcggt gcgagcccag cgtcagcggc 6240 aacttgatcc gatgcaccgt ggaatcgccg aagatcagct tcagacgcgc gataaattcg 6300 ctatccgcac ccgttttcac acaatcccag acaccggcct tctgcaagac gtcggcacgg 6360 cgaaacagga gcgacgacgg attcagacgc ttcaaggggt acactgcgcg ggcatagaaa 6420 ataccgttgt cttgcaggcg cacccagtcc gagatggagc agatgagctt cggattgagc 6480 aacaaggggg agatttggcg gaacagcttt tccggatggc tccagtcatc cgaatcgtgg 6540 caggtgacga actcgccctt cgcttggatc aagccgatac gcttcgcggc ataggtgccg 6600 acattctgcg gcaggctaat gatcttgatg cgcgtgtctt tgagggcgag ccgctggaga 6660 cgaaacaggg tgtcatcggt gctcgcgtca tccacaatga tcagctcgaa ggaacggtag 6720 gtctgattga ggagcgaaat caccgcattt tccacgcggc gacccgtatt ataggtggtc 6780 atcaggatgg agatcaacgg ccccgtctgg gccgggtacg ggatgctggt gatgatgttg 6840 cacggggaga gcggggagct gttgtccgtc aaggccacgg ggctgaggcc gaagtattta 6900 tagtattcat tcagccgatt caggctaatt tcggcggttt cgcggaaggc gttattttgc 6960 agcagcagga tatccgggct atagacgata tcggatgcgt cgatctgggc gagggtcgag 7020 atggcctttt gggtcaggcc gatccggagt tgcagtgcgg tatacaggtc cagcgggcag 7080 ttgtccacgt tgtccaacag gctcaggcta aaggtcggcg agtaggacgc cagggttttc 7140 gccagttcca ctttctgatg ggtatcggtg aactcgtcct tgaactccat cagcagctcg 7200 ggcgtcaggc tgatgtcgcc gcaggcgatt tttgcgatct tgattgccag tttgcagcgc 7260 caatcggacg gggtatccgt caagttatgc agcgaccagt acatattcag acgatacatc 7320 gcgaggatgc gtttcgactg ccagaaccgg caatcatcct ggatggccgc gagcgcgtgg 7380 acgtagcggc tctttttgag cagccacaag aatttgagat tattgaacat ttattaacct 7440 cctgctagca acttaagtta cgaatcgacg ccgaacaggt cgcgggtgta gactttctcc 7500 gagacatctt ccagttcgct ggtgcggcga ttcgccacaa tgacatcgac gcgctcctta 7560 aaggaattga tgtcgcgctc gacgtaggaa ccgaagaagt agggttcttt caggaccggc 7620 tcgtacacca caatctcgat acccttggcc ttcaaacgtt tcatgacccc ctggatgctg 7680 ctggcccgga aattgtcgct acccgccttc atgatcaggc gatagatacc gaccactttg 7740 ggcttacggg acaggatgtc ctcggccacg aagtccttac gggtcgtatt cgcatccacg 7800 atggcctgga tcaggttttg cgggacgtcg cgataattgg ccaacagctg cttcgtatcc 7860 ttcggcagac agtaaccgcc gtagccgaag gacgggttgt tgtaatgttg accaatgcgc 7920 ggatcgaggg agacgccttc gatgatttgt ttggtatcca ggccgtgcac gctcgcgtag 7980 gtgtccagct cgttaaagta cgcgatacgc atcgccagat acgtgttcgc gaacagtttg 8040 atggcttctg cctcgggcga atccgtcagc aggatcggaa tatccttttt gatggcacct 8100 tccgacagga gttcggcgaa cttccgtgcg cgttccgacg attcgcccac gacaatgcgg 8160 ctcggataga gattatcata cagggctttg ccttcgcgca ggaactccgg ggaaaagatg 8220 atattattcg tgttcagatc gcgcttcagg cgttcggtga acccgacggg gacggtggat 8280 ttgataatga tggtcgcgtt cgggttaatg gacagcacgt cacacgcgac gctttcgacg 8340 ctcagggtat caaagttgtt attaatcgga tcatagttcg tcggggtggc gatgatcacg 8400 tagtctgcat cgcgatatgc ctcgtatttt tccgtcgtcg cgtagaggtt cagcttacga 8460 ttggagagaa acttctggat ttccgggtcg caaatcggcg agattttctt gttaatgagc 8520 tggaccttct tcgggtcgat gtccagggcg atgatgtcgt gtttttggga gaggaggatc 8580 gcaatgctga tacccacata gccgacgccg gccacggcaa ttttcattta ttaacctcct 8640 taagtgaatt caaactagtg aattttcgaa ttacttaccg cagtacttga cacccacctg 8700 ggaattgttt ttggtgcgtt tgaattggcg gatggtacgg tagatgctaa agggcaggct 8760 gatcagaccg agcggaaaat tgttcttatt gatgatgagc ttgcccagct gatagctcag 8820 gtgtttcttg acccgttcgg cttcgtgttt atccgcgtac aggaagatgc tcggcaggct 8880 cacttggtac tccgaatcat atttcttctt ccaggtccgc cattcgctga tcaacgcaaa 8940 cggaatcgag atcagaccga ggaacgtctt ggagcggctc accatcaccg cacccaggcg 9000 gtagccgata tcttgcttga tgcgttcggc cgcaccatac agctccggca gttgtttctt 9060 ttcgagacgt tgattgtcga tgaagtactg ttcgagcttt tgctgcacca gatgcagctg 9120 attgagcagc aattcttttt cgcacgacag cttttcgagg cgctgttgtt gcagttcatt 9180 tttgttctgt tcctttttca gcagggactc gaagttctcg atcgcgcact ccagttcctg 9240 gacctggatg gttttgtttt taatgatcag atcatactgg atcagttctt ccttgctatc 9300 cgacagctct ttcagaatgg cttgataggc gttcagctgt ttggacgtgt gcagttcgtt 9360 gtccagaatg atctttttgc tgctctggta cagaccgttc acgatatcga gggtgatctg 9420 gcgttgttta atgaacgtct cccaaataaa ggacggctta tagttttcct tctccagcac 9480 ccgcaagggg gtgttggcgt tcgattgcaa ttcaaagtac agttccttgc aatcgggata 9540 gtcgttcagg acgttgaaga tcaagtactc ctccgtctcg ctttgcttga aaatgatatc 9600 cccggtcccg atgtcaatac cgctgaggga catgatctcc tgatgttctt tttccagcgt 9660 aatggaggct tcggcggtct taaagtcatt cacgctctgc tccagcgagt ggttgatggt 9720 attggagaac gacaacccga atttcagttt cagtttgtgt tgcagttgct ggatgcagtc 9780 ctcggcgttg cgcttcacct gttcgctcga caccagcagg caccgacccc ggttgttgag 9840 gaagaagtgc agcaaggcgg tgttgtatgc cagccagttt ttgatcagat gctccgaggt 9900 atagttgctg gagatgttct ggtccgagaa gtagttcgtc aggatgcttt tggggtggtc 9960 gtagatgagg ataaaggtga tgttctcatc caccgatttc caatattcca acgtgtgaat 10020 tgcgttgggg tcgctccaac cgcacagttt ctggttcagg ttggacagca tcagatccaa 10080 tgcgataccg ttccagacgg tgctcacatg gagcggttca aagtcggcgg aatcggtcac 10140 cgtatagatg tccggcgact ggtacgcctt ccgcagcgtc tgggtgatgt cctggggcga 10200 gaggttctca cgtttggacg ggcacaggga gttcatgccg cgctgatgca ggagttcttc 10260 cacgatttgg tagttgctgc tcggatggcc cacgatcacc aggcggttca tttattaacc 10320 tcctttcgaa aatgaacggt ccgttaaata tagccattcg gattcttcat ctgccagcgc 10380 caggcgtcct ccagcatggt ttcgagttcc cgcttggctt tccagttcag atatttgttg 10440 gccttttcgg gggaggacca gctctccgcg atatcaccgt cacggcggct cacgatttca 10500 tacggaatcc gcacgccgga aatcttttca aaggtggaca ccagttccag caccgaataa 10560 cctttacccg tgcccaaatt aaagacgtgg tagttggtgt tattgtcgcg gaagagatag 10620 gacagcgctg cgacgtgccc ttcggccagg tccatcacat ggatatagtc acggaccccc 10680 gtgccgtctt tggtgggata atcaccaccg aacaccatca gtttttccag tttccccatc 10740 gcgacctgca agatgtacgg caccaagttg gaggggatgt ctgccgggct ttcaccaatc 10800 ataccggatt cgtgggcgcc cgtcggatta aagtagcgca agcagaggaa attcgtgtcg 10860 gagtatttct tggcgatgtc gcggatcatc agctccgaga tgtacttgga cgtaccatac 10920 ggattcagcg tgccaccaat atggcagtct tcggtgacgg gcatgatctt gctttcccca 10980 tacaccgtcg ccgacgagct aaagatgaag ttggcgacgt cgttcttgat ggcgcaattg 11040 atgagttgca gggtgccgct cacgttgttg tcatagtaga agatgggctt gatcaggctt 11100 tctgcgaccg atttcgcacc tgcaaagtgc atgatgcagt cgaatttgtg tttcttcagg 11160 atctggttca cttccttctc gttgttgata ttgagttcgt agaacgtgac tttcttcttt 11220 gcgatcagct caatgcgacg gatgctttcg cagctgctgt tgatgagatt gtcaatgatg 11280 acgacattgt agcctttgtt cagcaggcag agcgacgtgt ggctgccgat gtagcctgca 11340 ccgccggtga ccaggatgtt catttattaa cctcctcggt ccgaattaac ctaggttatg 11400 aggtcagcat tgcttcttca cgcggtgtta attaagtaat cgatagtgat ttaaatatgc 11460 aagatctagt tacctgcagg attattgttt ctgttgcata aagcctaagg ggtaggcctt 11520 tctagagata gccatttttt gcactcctgt atccgcttct tgcaaggctg gacttatccc 11580 tatcaaaccg gacactgcag gctgacaagc tttcattaca tatgaagagt ttgtagaaac 11640 gcaaaaaggc catccgtcag gatggccttc taagaaggct cgagtggcgc gcctaagtcg 11700 aatttctgcc attcatccgc ttattatcac ttattcaggc gtagcaacca ggcgtttaag 11760 ggcaccaata actgccttaa aaaaattacg ccccgccctg ccactcatcg cagtactgtt 11820 gtaattcatt aagcattctg ccgacatgga agccatcaca aacggcatga tgaacctgaa 11880 tcgccagcgg catcagcacc ttgtcgcctt gcgtataata tttgcccatg gtgaaaacgg 11940 gggcgaagaa gttgtccata ttggccacgt ttaaatcaaa actggtgaaa ctcacccagg 12000 gattggctga gacgaaaaac atattctcaa taaacccttt agggaaatag gccaggtttt 12060 caccgtaaca cgccacatct tgcgaatata tgtgtagaaa ctgccggaaa tcgtcgtggt 12120 attcactcca gagcgatgaa aacgtttcag tttgctcatg gaaaacggtg taacaagggt 12180 gaacactatc ccatatcacc agctcaccgt ctttcattgc catacggaat tccggatgag 12240 cattcatcag gcgggcaaga atgtgaataa aggccggata aaacttgtgc ttatttttct 12300 ttacggtctt taaaaaggcc gtaatatcca gctgaacggt ctggttatag gtacattgag 12360 caactgactg aaatgcctca aaatgttctt tacgatgcca ttgggatata tcaacggtgg 12420 tatatccagt gatttttttc tccattttag cttccttagc tcctgaaaat ctcgataact 12480 caaaaaatac gcccggtagt gatcttattt cattatggtg aaagttggaa cctcttacgt 12540 gccgatcaac gtctcatttt cgccaaaagt tggcccaggg cttcccggta tcaacaggga 12600 caccaggatt tatttattct gcgaagtgat cttccgtcac aggtatttat tcggcgcaaa 12660 gggcctcgtg atacgcctat ttttataggt taatgtcatg ataataatgg tttcttagac 12720 gtcaggtggc acttttcggg gaaatgtgcg cgcccgcgtt cctgctggcg ctgggcctgt 12780 ttctggcgct ggacttcccg ctgttccgtc agcagctttt cgcccacggc cttgatgatc 12840 gcggcggcct tggcctgcat atcccgattc aacggcccca gggcgtccag aacgggcttc 12900 aggcgctccc gaaggt 12916 <210> 154 <211> 13510 <212> DNA <213> Artificial Sequence <220> <223> synthetic plasmid pCX092 <400> 154 ctcgggccgt ctcttgggct tgatcggcct tcttgcgcat ctcacgcgct cctgcggcgg 60 cctgtagggc aggctcatac ccctgccgaa ccgcttttgt cagccggtcg gccacggctt 120 ccggcgtctc aacgcgcttt gagattccca gcttttcggc caatccctgc ggtgcatagg 180 cgcgtggctc gaccgcttgc gggctgatgg tgacgtggcc cactggtggc cgctccaggg 240 cctcgtagaa cgcctgaatg cgcgtgtgac gtgccttgct gccctcgatg ccccgttgca 300 gccctagatc ggccacagcg gccgcaaacg tggtctggtc gcgggtcatc tgcgctttgt 360 tgccgatgaa ctccttggcc gacagcctgc cgtcctgcgt cagcggcacc acgaacgcgg 420 tcatgtgcgg gctggtttcg tcacggtgga tgctggccgt cacgatgcga tccgccccgt 480 acttgtccgc cagccacttg tgcgccttct cgaagaacgc cgcctgctgt tcttggctgg 540 ccgacttcca ccattccggg ctggccgtca tgacgtactc gaccgccaac acagcgtcct 600 tgcgccgctt ctctggcagc aactcgcgca gtcggcccat cgcttcatcg gtgctgctgg 660 ccgcccagtg ctcgttctct ggcgtcctgc tggcgtcagc gttgggcgtc tcgcgctcgc 720 ggtaggcgtg cttgagactg gccgccacgt tgcccatttt cgccagcttc ttgcatcgca 780 tgatcgcgta tgccgccatg cctgcccctc ccttttggtg tccaaccggc tcgacggggg 840 cagcgcaagg cggtgcctcc ggcgggccac tcaatgcttg agtatactca ctagactttg 900 cttcgcaaag tcgtgaccgc ctacggcggc tgcggcgccc tacgggcttg ctctccgggc 960 ttcgccctgc gcggtcgctg cgctcccttg ccagcccgtg gatatgtgga cgatggccgc 1020 gagcggccac cggctggctc gcttcgctcg gcccgtggac aaccctgctg gacaagctga 1080 tggacaggct gcgcctgccc acgagcttga ccacagggat tgcccaccgg ctacccagcc 1140 ttcgaccaca tacccaccgg ctccaactgc gcggcctgcg gccttgcccc atcaattttt 1200 ttaattttct ctggggaaaa gcctccggcc tgcggcctgc gcgcttcgct tgccggttgg 1260 acaccaagtg gaaggcgggt caaggctcgc gcagcgaccg cgcagcggct tggccttgac 1320 gcgcctggaa cgacccaagc ctatgcgagt gggggcagtc gaaggcgaag cccgcccgcc 1380 tgccccccga gacctgcaga tccacatcct tgaaggccgc agcgacgagc agaaggaaac 1440 cctcattcgg gaagtcagcg aggccatctc gcgctccctg gatgcgccgc tgaccagcgt 1500 gcgagtgatt atcacggaga tggccaaggg ccacttcggc atcggcggcg aactggccag 1560 caaggtcaga cgctgaagtg gagatgccca agggcacttc gggtcgagga acccgacctg 1620 cattgggacg cggccacgga gagcgcgggc aaacgccggc actatagcca gtggagtttg 1680 taaaacgcta tttcagagct tggagagtgt ctaagaaagc cggggcgatg ccaacccatc 1740 ccttcttcgg ctatgcatcg ttcgtaatca agccacttcc tttttgcatt gacgcagggt 1800 gtcggaaggc aactcgccga acgcgctcct atagttttca gcgaagcgtc ccaaatgtaa 1860 gaagccgtag tctagggcta tctcagttat actacgcaca ttggcactgg gatcgttcaa 1920 gcaggcgcgg atgctttcga gcttgcggtt gcggatgtag ttcttcggcg tggtgccggc 1980 atgcttctcg aacaaattgt agagcgagcg tggactcatc atcgccagct ccgctaaccg 2040 ctcaaggctg atattccgtt tgagattctc ctcaatgaat tgaacgactc gctcgaaaga 2100 cgggttacct ttgctgaaaa tttcacggct gacattgctg cccagcattt cgagcagctt 2160 ggaagcgatg atccccgcat agtgctcttg gacccgaggc atcgactttg tatgttccgc 2220 ttcgtcacaa actaacccga gtagattgat aaagccatcg agttgctgga gattgtgtcg 2280 cgcggcgaaa cggataccct ccctcggctt gtgccaattg ttgtcactgc atgcccgatc 2340 aaggaccact gagggcaatt taacgataaa tttctcgcaa tcttctgaat aggtcaggtc 2400 ggcttggtca tccggattga gcagcaatag ttcgcccggc gcaaaatagt gctcctggcc 2460 atggccacgc cacaggcaat ggcctttgag tattatttgc agatgataac aggtctctaa 2520 tccaggcgag attaccctca cgctaccgcc gtagctgatt cgacacaggt cgaggcatcc 2580 gaagattctg tggtgcagcc tgcctgccgg gcgcccgccc ttgggcaggc gaatagagtg 2640 cgtaccgaca tactggttaa cataatcgga gactgcatag ggctcggcgt ggacgaagat 2700 ctgacttttc tcgttcaata agcaaaaatc catagttcac ggttctctta ttttaatgtg 2760 ggctgcttgg tgtgatgtag aaaggcgcca agtcgatgaa aatgcatctc gacgtgatgc 2820 gtatacgggt tacccccatt gccacgttgc gccatccttt ttgcaatcag tgaccacttt 2880 tccaagcaaa aataacgcca agcagaacga agacgttctt tttaagaagc gagaacacca 2940 gaagttcgtg ctgtcggggc atgcggcgac gaattggcgg ataaagggga tctgcaggtc 3000 ccgagcctca cggcggcgag tgcgggggtt ccaagggggc agcgccacct tgggcaaggc 3060 cgaaggccgc gcagtcgatc aacaagcccc ggaggggcca ctttttgccg gagggggagc 3120 cgcgccgaag gcgtggggga accccgcagg ggtgcccttc tttgggcacc aaagaactag 3180 atatagggcg aaatgcgaaa gacttaaaaa tcaacaactt aaaaaagggg ggtacgcaac 3240 agctcattgc ggcacccccc gcaatagctc attgcgtagg ttaaagaaaa tctgtaattg 3300 actgccactt ttacgcaacg cataattgtt gtcgcgctgc cgaaaagttg cagctgattg 3360 cgcatggtgc cgcaaccgtg cggcacccta ccgcatggag ataagcatgg ccacgcagtc 3420 cagagaaatc ggcattcaag ccaagaacaa gcccggtcac tgggtgcaaa cggaacgcaa 3480 agcgcatgag gcgtgggccg ggcttattgc gaggaaaccc acggcggcaa tgctgctgca 3540 tcacctcgtg gcgcagatgg gccaccagaa cgccgtggtg gtcagccaga agacactttc 3600 caagctcatc ggacgttctt tgcggacggt ccaatacgca gtcaaggact tggtggccga 3660 gcgctggatc tccgtcgtga agctcaacgg ccccggcacc gtgtcggcct acgtggtcaa 3720 tgaccgcgtg gcgtggggcc agccccgcga ccagttgcgc ctgtcggtgt tcagtgccgc 3780 cgtggtggtt gatcacgacg accaggacga atcgctgttg gggcatggcg acctgcgccg 3840 catcccgacc ctgtatccgg gcgagcagca actaccgacc ggccccggcg aggagccgcc 3900 cagccagccc ggcattccgg gcatggaacc agacctgcca gccttgaccg aaacggagga 3960 atgggaacgg cgcgggcagc agcgcctgcc gatgcccgat gagccgtgtt ttctggacga 4020 tggcgagccg ttggagccgc cgacacgggt cacgctgccg cgccggtagc acttgggttg 4080 cgcagcaacc cgtaagtgcg ctgttccaga ctatcggctg tagccgcctc gccgccctat 4140 accttgtctg cctccccgcg ttgcgtcgcg gtgcatggag ccgggccacc tcgacctgaa 4200 tggaagccgg cggcacctcg ctaacggatt caccgttttt atcaggctct gggaggcaga 4260 ataaatgatc atatcgtcaa ttattacctc cacggggaga gcctgagcaa actggcctca 4320 ggcatttgag aagcacacgg tcacactgct tccggtagtc aataaaccgg taaaccagca 4380 atagacataa gcggctattt aacgaccctg ccctgaaccg acgaccgggt cgaatttgct 4440 ttcgactatc ggcgcgccag agctcatcgt taatgtcttc gtgcgccgtc agtcggcgca 4500 cgttttttct ctctggtacc gtgtcactga tctagtcaat tactcgaagt atccacaagt 4560 gaagcatact aagtaatgta caagaatcaa aaaaatcggc tacgcaagtc gcgtagccga 4620 atcatttaag gatccttcca ttcaggtcga ggtggcccgg ctccatgcac cgcgacgcaa 4680 cgcggggagg cagacaaggt atagggcggc gcctacaatc catgccaacc cgttccatgt 4740 gctcgccgag gcggcataaa tcgccgtgac gatcagcggt ccagtgatcg aagttaggct 4800 ggtaagagcc gcgagcgatc cttgaagctg tccctgatgg tcgtcatcta cctgcctgga 4860 cagcatggcc tgcaacgcgg gcatcccgat gccgccggaa gcgagaagaa tcataatggg 4920 gaaggccatc cagcctcgcg tcgcgaacgc cagcaagacg tagcccagcg cgtcggccgc 4980 catgccggcg ataatggcct gcttctcgcc gaaacgtttg gtggcgggac cagtgacgaa 5040 ggcttgagcg agggcgtgca agattccgaa taccgcaagc gacaggccga tcatcgtcgc 5100 gctccagcga aagcggtcct cgccgaaaat gacccagagc gctgccggca cctgtcctac 5160 gagttgcatg ataaagaaga cagtcataag tgcggcgacg atagtcatgc cccgcgccca 5220 ccggaaggag ctgactgggt tgaaggctct caagggcatc ggtcgacgct ctcccttatg 5280 cgactcctgc attaggaagc agcccagtag taggttgagg ccgttgagca ccgccgccgc 5340 aaggaatggt gcatgcaagg agatggcgcc caacagtccc ccggccacgg ggcctgccac 5400 catacccacg ccgaaacaag cgctcatgag cccgaagtgg cgagcccgat cttccccatc 5460 ggtgatgtcg gcgatatagg cgccagcaac cgcacctgtg gcgccggtga tgccggccac 5520 gatgcgtccg gcgtacaaga tccacaggac gggtgtggtc gccatgatcg cgtagtcgat 5580 agtggctcca agtagcgaag cgagcaggac tgggcggcgg ccaaagcggt cggacagtgc 5640 tccgagaacg ggtgcgcata gaaattgcat caacgcatat agcgctagca gcacgccata 5700 gtgactggcg atgctgtcgg aatggacgat atcccgcaag aggcccggca gtaccggcat 5760 aaccaagcct atgcctacag catccagggt gacggtgccg aggatgacga tgagcgcatt 5820 gttagatttc atacacggtg cctgactgcg ttagcaattt aactgtgata aactaccgca 5880 ttaaagccga gcgatgataa gctgtcaaac atgagatccg ataaatcgat tgatagattt 5940 aaataagaac tgcagaagct agcaacttaa gttacgaatc gacgccgaac aggtcgcggg 6000 tgtagacttt ctccgagaca tcttccagtt cgctggtgcg gcgattcgcc acaatgacat 6060 cgacgcgctc cttaaaggaa ttgatgtcgc gctcgacgta ggaaccgaag aagtagggtt 6120 ctttcaggac cggctcgtac accacaatct cgataccctt ggccttcaaa cgtttcatga 6180 ccccctggat gctgctggcc cggaaattgt cgctacccgc cttcatgatc aggcgataga 6240 taccgaccac tttgggctta cgggacagga tgtcctcggc cacgaagtcc ttacgggtcg 6300 tattcgcatc cacgatggcc tggatcaggt tttgcgggac gtcgcgataa ttggccaaca 6360 gctgcttcgt atccttcggc agacagtaac cgccgtagcc gaaggacggg ttgttgtaat 6420 gttgaccaat gcgcggatcg agggagacgc cttcgatgat ttgtttggta tccaggccgt 6480 gcacgctcgc gtaggtgtcc agctcgttaa agtacgcgat acgcatcgcc agatacgtgt 6540 tcgcgaacag tttgatggct tctgcctcgg gcgaatccgt cagcaggatc ggaatatcct 6600 ttttgatggc accttccgac aggagttcgg cgaacttccg tgcgcgttcc gacgattcgc 6660 ccacgacaat gcggctcgga tagagattat catacagggc tttgccttcg cgcaggaact 6720 ccggggaaaa gatgatatta ttcgtgttca gatcgcgctt caggcgttcg gtgaacccga 6780 cggggacggt ggatttgata atgatggtcg cgttcgggtt aatggacagc acgtcacacg 6840 cgacgctttc gacgctcagg gtatcaaagt tgttattaat cggatcatag ttcgtcgggg 6900 tggcgatgat cacgtagtct gcatcgcgat atgcctcgta tttttccgtc gtcgcgtaga 6960 ggttcagctt acgattggag agaaacttct ggatttccgg gtcgcaaatc ggcgagattt 7020 tcttgttaat gagctggacc ttcttcgggt cgatgtccag ggcgatgatg tcgtgttttt 7080 gggagaggag gatcgcaatg ctgataccca catagccgac gccggccacg gcaattttca 7140 tttattaacc tccttaagtg aattcaaact agtttacaag tcgttttcga tcttctccca 7200 ggtatatttg cgacattcat tcaagttggt cagcggcgag tatttgtact ttttgatacc 7260 gaggcgcgac aggctttcgt tcaccacctt gaaatggttt tccttttgga tgtccagttt 7320 cttgatcgac gtgttctcgc cgtgcaggac acggttgtag caaatcttat tgatatgctt 7380 aaacgggccg acttcgctga gtttcaaata catatcgtaa tccaccgcat tgctgatgct 7440 ctcgttgaag ccttcggtga ggttccatgc acgcgccgtg aacatacgga agtggtggca 7500 gatcatcgcg ctcgtgagct tttcgcggct gtaaatcggc cagttgtagc cattgctaat 7560 caagttacct tcacgatcaa tattgcgatt ggtggtgtac acgcaggcga ggctcaggtc 7620 tttgcgaaat tcatccagac acagttccac ggcatcgggc tccaggaaat catcggaatc 7680 cagctgcccg atgtagaaac cccggcacag gcggactgcg gtattcgagg cggagccgat 7740 gcctttgttt ttctggctga tgaaacggac gcgcgggtgg tttgcgtaat gttcttgcag 7800 gatgcgcagc gtatcatcgg tgctcccgtc atcgcagatg cagacctcca gatcggtgat 7860 cgtttggttc agtgccgatt cgacgcagcg cacgatatat ttgctgcaat tatacgcggg 7920 gatgtagatg ctcaccaggg gcacacgttt cagggtggcg ctctcgattt tctccttctt 7980 gcgataaaag tagggcacct tctgctgcaa cagctggacg gtaatgtttt tacctgccgc 8040 gcgatcggtt tcgttctcct taccgggcgg ttcctgatga tatgccatcg cgccttccac 8100 gctacggaaa taacaaccct cgcggtacag ccgatagccg aactcattat cctcaccgcc 8160 ccaatgcgtg aactcttcgt caaaccaacc cgcgcgaaac agccacttct ttgcaaacgc 8220 cacattgcca ccgctaaaga accggaacgg ggtgttgcac aggcgcagat tgtcggtatt 8280 cttgaaatgt tcgatgcgcc aatcgacgga tttgttctgc tcgaccttgc ctgcgacctg 8340 attattggta ataatctccg ggatttcatt gatcaggctt ttctgggaca aaaagtccag 8400 ataggtatgc ttcgacgtgt cgatgtattt acgcgggcca atcagtgcca cgttatcatc 8460 cacggccagg agttccatat aggactgcac ccacaacggg ttcggcgcca tatcgcagtc 8520 caagatcgcc acgtagttgt atttcgctgc ccgcaggccc aggttccgca cggcgcacag 8580 ctggtagccg tagtctttct ggcggacgta tttgatgttc agcaacgact cgaactcgcg 8640 gacgatctct tcgatgtttt ccttggaacc gtcatccgcg acgatgacct catagtcata 8700 aatcgttttc tgattgcaga ggcaggccag ggtgatcgcc aggattttgg cgcgattgta 8760 cgtcggaatc acgatggaca ggccgtcgat gatcagttgc ttgcgcggat aatcatccag 8820 ttctttacgt ttccctgccc agacgtagtc gttcgtgctt tccggcagcg gcggcaaggt 8880 caggtcgctc ggccaatcca gcggaatggg ttcgacttct ttcaattcgg cgcgctcgga 8940 tttctttgcg gtaatttccc gatatttgct aatgatttca ttcttttcca cctcattcag 9000 cgagatcgcc tttgcattgc tgcacataat tttggttgcc gcgtcgatat caatgaccgc 9060 tttccgattc agcttgtcca cttcttcgct cagattcagg gcggtttggc acagcttgat 9120 attggcttcc acccagctca catcatagat ttccgccact ttttcaaaca gggagagggc 9180 ttggcggtag ttcttattct tatacagatt gattgcctgg ttcaaaatgc tcatttatta 9240 acctcctact agtgaatttt cgaattactt accgcagtac ttgacaccca cctgggaatt 9300 gtttttggtg cgtttgaatt ggcggatggt acggtagatg ctaaagggca ggctgatcag 9360 accgagcgga aaattgttct tattgatgat gagcttgccc agctgatagc tcaggtgttt 9420 cttgacccgt tcggcttcgt gtttatccgc gtacaggaag atgctcggca ggctcacttg 9480 gtactccgaa tcatatttct tcttccaggt ccgccattcg ctgatcaacg caaacggaat 9540 cgagatcaga ccgaggaacg tcttggagcg gctcaccatc accgcaccca ggcggtagcc 9600 gatatcttgc ttgatgcgtt cggccgcacc atacagctcc ggcagttgtt tcttttcgag 9660 acgttgattg tcgatgaagt actgttcgag cttttgctgc accagatgca gctgattgag 9720 cagcaattct ttttcgcacg acagcttttc gaggcgctgt tgttgcagtt catttttgtt 9780 ctgttccttt ttcagcaggg actcgaagtt ctcgatcgcg cactccagtt cctggacctg 9840 gatggttttg tttttaatga tcagatcata ctggatcagt tcttccttgc tatccgacag 9900 ctctttcaga atggcttgat aggcgttcag ctgtttggac gtgtgcagtt cgttgtccag 9960 aatgatcttt ttgctgctct ggtacagacc gttcacgata tcgagggtga tctggcgttg 10020 tttaatgaac gtctcccaaa taaaggacgg cttatagttt tccttctcca gcacccgcaa 10080 gggggtgttg gcgttcgatt gcaattcaaa gtacagttcc ttgcaatcgg gatagtcgtt 10140 caggacgttg aagatcaagt actcctccgt ctcgctttgc ttgaaaatga tatccccggt 10200 cccgatgtca ataccgctga gggacatgat ctcctgatgt tctttttcca gcgtaatgga 10260 ggcttcggcg gtcttaaagt cattcacgct ctgctccagc gagtggttga tggtattgga 10320 gaacgacaac ccgaatttca gtttcagttt gtgttgcagt tgctggatgc agtcctcggc 10380 gttgcgcttc acctgttcgc tcgacaccag caggcaccga ccccggttgt tgaggaagaa 10440 gtgcagcaag gcggtgttgt atgccagcca gtttttgatc agatgctccg aggtatagtt 10500 gctggagatg ttctggtccg agaagtagtt cgtcaggatg cttttggggt ggtcgtagat 10560 gaggataaag gtgatgttct catccaccga tttccaatat tccaacgtgt gaattgcgtt 10620 ggggtcgctc caaccgcaca gtttctggtt caggttggac agcatcagat ccaatgcgat 10680 accgttccag acggtgctca catggagcgg ttcaaagtcg gcggaatcgg tcaccgtata 10740 gatgtccggc gactggtacg ccttccgcag cgtctgggtg atgtcctggg gcgagaggtt 10800 ctcacgtttg gacgggcaca gggagttcat gccgcgctga tgcaggagtt cttccacgat 10860 ttggtagttg ctgctcggat ggcccacgat caccaggcgg ttcatttatt aacctccttt 10920 cgaaaatgaa cggtccgtta aatatagcca ttcggattct tcatctgcca gcgccaggcg 10980 tcctccagca tggtttcgag ttcccgcttg gctttccagt tcagatattt gttggccttt 11040 tcgggggagg accagctctc cgcgatatca ccgtcacggc ggctcacgat ttcatacgga 11100 atccgcacgc cggaaatctt ttcaaaggtg gacaccagtt ccagcaccga ataaccttta 11160 cccgtgccca aattaaagac gtggtagttg gtgttattgt cgcggaagag ataggacagc 11220 gctgcgacgt gcccttcggc caggtccatc acatggatat agtcacggac ccccgtgccg 11280 tctttggtgg gataatcacc accgaacacc atcagttttt ccagtttccc catcgcgacc 11340 tgcaagatgt acggcaccaa gttggagggg atgtctgccg ggctttcacc aatcataccg 11400 gattcgtggg cgcccgtcgg attaaagtag cgcaagcaga ggaaattcgt gtcggagtat 11460 ttcttggcga tgtcgcggat catcagctcc gagatgtact tggacgtacc atacggattc 11520 agcgtgccac caatatggca gtcttcggtg acgggcatga tcttgctttc cccatacacc 11580 gtcgccgacg agctaaagat gaagttggcg acgtcgttct tgatggcgca attgatgagt 11640 tgcagggtgc cgctcacgtt gttgtcatag tagaagatgg gcttgatcag gctttctgcg 11700 accgatttcg cacctgcaaa gtgcatgatg cagtcgaatt tgtgtttctt caggatctgg 11760 ttcacttcct tctcgttgtt gatattgagt tcgtagaacg tgactttctt ctttgcgatc 11820 agctcaatgc gacggatgct ttcgcagctg ctgttgatga gattgtcaat gatgacgaca 11880 ttgtagcctt tgttcagcag gcagagcgac gtgtggctgc cgatgtagcc tgcaccgccg 11940 gtgaccagga tgttcattta ttaacctcct cggtccgaat taacctaggt tatgaggtca 12000 gcattgcttc ttcacgcggt gttaattaag taatcgatag tgatttaaat atgcaagatc 12060 tagttacctg caggattatt gtttctgttg cataaagcct aaggggtagg cctttctaga 12120 gatagccatt ttttgcactc ctgtatccgc ttcttgcaag gctggactta tccctatcaa 12180 accggacact gcaggctgac aagctttcat tacatatgaa gagtttgtag aaacgcaaaa 12240 aggccatccg tcaggatggc cttctaagaa ggctcgagtg gcgcgcctaa gtcgaatttc 12300 tgccattcat ccgcttatta tcacttattc aggcgtagca accaggcgtt taagggcacc 12360 aataactgcc ttaaaaaaat tacgccccgc cctgccactc atcgcagtac tgttgtaatt 12420 cattaagcat tctgccgaca tggaagccat cacaaacggc atgatgaacc tgaatcgcca 12480 gcggcatcag caccttgtcg ccttgcgtat aatatttgcc catggtgaaa acgggggcga 12540 agaagttgtc catattggcc acgtttaaat caaaactggt gaaactcacc cagggattgg 12600 ctgagacgaa aaacatattc tcaataaacc ctttagggaa ataggccagg ttttcaccgt 12660 aacacgccac atcttgcgaa tatatgtgta gaaactgccg gaaatcgtcg tggtattcac 12720 tccagagcga tgaaaacgtt tcagtttgct catggaaaac ggtgtaacaa gggtgaacac 12780 tatcccatat caccagctca ccgtctttca ttgccatacg gaattccgga tgagcattca 12840 tcaggcgggc aagaatgtga ataaaggccg gataaaactt gtgcttattt ttctttacgg 12900 tctttaaaaa ggccgtaata tccagctgaa cggtctggtt ataggtacat tgagcaactg 12960 actgaaatgc ctcaaaatgt tctttacgat gccattggga tatatcaacg gtggtatatc 13020 cagtgatttt tttctccatt ttagcttcct tagctcctga aaatctcgat aactcaaaaa 13080 atacgcccgg tagtgatctt atttcattat ggtgaaagtt ggaacctctt acgtgccgat 13140 caacgtctca ttttcgccaa aagttggccc agggcttccc ggtatcaaca gggacaccag 13200 gatttattta ttctgcgaag tgatcttccg tcacaggtat ttattcggcg caaagggcct 13260 cgtgatacgc ctatttttat aggttaatgt catgataata atggtttctt agacgtcagg 13320 tggcactttt cggggaaatg tgcgcgcccg cgttcctgct ggcgctgggc ctgtttctgg 13380 cgctggactt cccgctgttc cgtcagcagc ttttcgccca cggccttgat gatcgcggcg 13440 gccttggcct gcatatcccg attcaacggc cccagggcgt ccagaacggg cttcaggcgc 13500 tcccgaaggt 13510 <210> 155 <211> 56 <212> DNA <213> Artificial Sequence <220> <223> synthetic primer DHD266c <400> 155 tagcggccgc atactcgagc atggcgcgcc taacgtcgac taagatctct aagctt 56 <210> 156 <211> 56 <212> DNA <213> Artificial Sequence <220> <223> synthetic primer DHD267c <400> 156 cgaagcttag agatcttagt cgacgttagg cgcgccatgc tcgagtatgc ggccgc 56 <210> 157 <211> 5243 <212> DNA <213> Artificial Sequence <220> <223> synthetic plasmid pMAK705pI <400> 157 gatccccgac agtaagacgg gtaagcctgt tgatgatacc gctgccttac tgggtgcatt 60 agccagtctg aatgacctgt cacgggataa tccgaagtgg tcagactgga aaatcagagg 120 gcaggaactg ctgaacagca aaaagtcaga tagcaccaca tagcagaccc gccataaaac 180 gccctgagaa gcccgtgacg ggcttttctt gtattatggg tagtttcctt gcatgaatcc 240 ataaaaggcg cctgtagtgc catttacccc cattcactgc cagagccgtg agcgcagcga 300 actgaatgtc acgaaaaaga cagcgactca ggtgcctgat ggtcggagac aaaaggaata 360 ttcagcgatt tgcccgagct tgcgagggtg ctacttaagc ctttagggtt ttaaggtctg 420 ttttgtagag gagcaaacag cgtttgcgac atccttttgt aatactgcgg aactgactaa 480 agtagtgagt tatacacagg gctgggatct attcttttta tcttttttta ttctttcttt 540 attctataaa ttataaccac ttgaatataa acaaaaaaaa cacacaaagg tctagcggaa 600 tttacagagg gtctagcaga atttacaagt tttccagcaa aggtctagca gaatttacag 660 atacccacaa ctcaaaggaa aaggactagt aattatcatt gactagccca tctcaattgg 720 tatagtgatt aaaatcacct agaccaattg agatgtatgt ctgaattagt tgttttcaaa 780 gcaaatgaac tagcgattag tcgctatgac ttaacggagc atgaaaccaa gctaatttta 840 tgctgtgtgg cactactcaa ccccacgatt gaaaacccta caaggaaaga acggacggta 900 tcgttcactt ataaccaata cgttcagatg atgaacatca gtagggaaaa tgcttatggt 960 gtattagcta aagcaaccag agagctgatg acgagaactg tggaaatcag gaatcctttg 1020 gttaaaggct ttgagatttt ccagtggaca aactatgcca agttctcaag cgaaaaatta 1080 gaattagttt ttagtgaaga gatattgcct tatcttttcc agttaaaaaa attcataaaa 1140 tataatctgg aacatgttaa gtcttttgaa aacaaatact ctatgaggat ttatgagtgg 1200 ttattaaaag aactaacaca aaagaaaact cacaaggcaa atatagagat tagccttgat 1260 gaatttaagt tcatgttaat gcttgaaaat aactaccatg agtttaaaag gcttaaccaa 1320 tgggttttga aaccaataag taaagattta aacacttaca gcaatatgaa attggtggtt 1380 gataagcgag gccgcccgac tgatacgttg attttccaag ttgaactaga tagacaaatg 1440 gatctcgtaa ccgaacttga gaacaaccag ataaaaatga atggtgacaa aataccaaca 1500 accattacat cagattccta cctacataac ggactaagaa aaacactaca cgatgcttta 1560 actgcaaaaa ttcagctcac cagttttgag gcaaaatttt tgagtgacat gcaaagtaag 1620 tatgatctca atggttcgtt ctcatggctc acgcaaaaac aacgaaccac actagagaac 1680 atactggcta aatacggaag gatctgaggt tcttatggct cttgtatcta tcagtgaagc 1740 atcaagacta acaaacaaaa gtagaacaac tgttcaccgt tacatatcaa agggaaaact 1800 gtccatatgc acagatgaaa acggtgtaaa aaagatagat acatcagagc ttttacgagt 1860 ttttggtgca tttaaagctg ttcaccatga acagatcgac aatgtaacag atgaacagca 1920 tgtaacacct aatagaacag gtgaaaccag taaaacaaag caactagaac atgaaattga 1980 acacctgaga caacttgtta cagctcaaca gtcacacata gacagcctga aacaggcgat 2040 gctgcttatc gaatcaaagc tgccgacaac acgggagcca gtgacgcctc ccgtggggaa 2100 aaaatcatgg caattctgga agaaatagcg ctttcagccg gcaaaccggc tgaagccgga 2160 tctgcgattc tgataacaaa ctagcaacac cagaacagcc cgtttgcggg cagcaaaacc 2220 cgtacttttg gacgttccgg cggttttttg tggcgagtgg tgttcgggcg gtgcgcgcaa 2280 gatccattat gttaaacggg cgagtttaca tctcaaaacc gcccgcttaa caccatcaga 2340 aatcctcagc gcgattttaa gcaccaaccc ccccccgtaa cacccaaatc catactgaaa 2400 gtggctttgt tgaataaatc gaacttttgc tgagttgaag gatcagatca cgcatcctcc 2460 cgacaacaca gaccattccg tggcaaagca aaagttcaga atcaccaact ggtccaccta 2520 caacaaagct ctcatcaacc gtggctccct cactttctgg ctggatgatg aggcgattca 2580 ggcctggtat gagtcggcaa caccttcatc acgaggaagg ccccagcgct attctgatct 2640 cgccatcacc accgttctgg tgattaaacg cgtattccgg ctgaccctgc gggctgcgca 2700 gggttttatt gattccattt ttgccctgat gaacgttccg ttgcgctgcc cggattacac 2760 cagtgtcagt aagcgggcaa agtcggttaa tgtcagtttc aaaacgtcca cccggggtga 2820 aatcgcacac ctggtgattg attccaccgg gctgaaggtc tttggtgaag gcgaatggaa 2880 agtcagaaag cacggcaaag agcgccgtcg tatctggcga aagttgcatc ttgctgtggg 2940 gatcaacacg ggataatacc gcgccacata gcagaacttt aaaagtgctc atcattggaa 3000 aacgttcttc ggggcgaaaa ctctcaagga tcttaccgct gttgagatcc agttcgatgt 3060 aacccactcg tgcacccaac tgatcttcag catcttttac tttcaccagc gtttctgggt 3120 gagcaaaaac aggaaggcaa aatgccgcaa aaaagggaat aagggcgaca cggaaatgtt 3180 gaatactcat actcttcctt tttcaatatt attgaagcat ttatcagggt tattgtctca 3240 tgagcggata catatttgaa tgtatttaga aaaataaaca aataggggtt ccgcgcacat 3300 ttccccgaaa agtgccacct gacgtctaag aaaccattat tatcatgaca ttaacctata 3360 aaaataggcg tatcacgagg ccctttcgtc ttcgaataaa tacctgtgac ggaagatcac 3420 ttcgcagaat aaataaatcc tggtgtccct gttgataccg ggaagccctg ggccaacttt 3480 tggcgaaaat gagacgttga tcggcacgta agaggttcca actttcacca taatgaaata 3540 agatcactac cgggcgtatt ttttgagtta tcgagatttt caggagctaa ggaagctaaa 3600 atggagaaaa aaatcactgg atataccacc gttgatatat cccaatggca tcgtaaagaa 3660 cattttgagg catttcagtc agttgctcaa tgtacctata accagaccgt tcagctggat 3720 attacggcct ttttaaagac cgtaaagaaa aataagcaca agttttatcc ggcctttatt 3780 cacattcttg cccgcctgat gaatgctcat ccggaattcc gtatggcaat gaaagacggt 3840 gagctggtga tatgggatag tgttcaccct tgttacaccg ttttccatga gcaaactgaa 3900 acgttttcat cgctctggag tgaataccac gacgatttcc ggcagtttct acacatatat 3960 tcgcaagatg tggcgtgtta cggtgaaaac ctggcctatt tccctaaagg gtttattgag 4020 aatatgtttt tcgtctcagc caatccctgg gtgagtttca ccagttttga tttaaacgtg 4080 gccaatatgg acaacttctt cgcccccgtt ttcaccatgg gcaaatatta tacgcaaggc 4140 gacaaggtgc tgatgccgct ggcgattcag gttcatcatg ccgtttgtga tggcttccat 4200 gtcggcagaa tgcttaatga attacaacag tactgcgatg agtggcaggg cggggcgtaa 4260 tttttttaag gcagttattg gtgcccttaa acgcctggtt gctacgcctg aataagtgat 4320 aataagcgga tgaatggcag aaattcgaaa gcaaattcga cccggtcgtc ggttcagggc 4380 agggtcgtta aatagccgct tatgtctatt gctggtttac cggtttattg actaccggaa 4440 gcagtgtgac cgtgtgcttc tcaaatgcct gaggccagtt tgctcaggct ctccccgtgg 4500 aggtaataat tgacgatatg atcatttatt ctgcctccca gagcctgata aaaacggtga 4560 atccgttagc gaggtgccgc cggcttccat tcaggtcgag gtggcccggc tccatgcacc 4620 gcgacgcaac gcggggaggc agacaaggta tagggcggcg cctacaatcc atgccaaccc 4680 gttccatgtg ctcgccgagg cggcataaat cgccgtgacg atcagcggtc caatgatcga 4740 agttaggctg gtaagagccg cgagcgatcc ttgaagctgt ccctgatggt cgtcatctac 4800 ctgcctggac agcatggcct gcaacgcggg catcccgatg ccgccggaag cgagaagaat 4860 cataatgggg aaggccatcc agcctcgcgt cgcgaacgcc agcaagacgt agcccagcgc 4920 gtcggccgcc atgccggcga taatggcctg cttctcgccg aaacgtttgg tggcgggacc 4980 agtgacgaag gcttgagcga gggcgtgcaa gattccgaat accgcaagcg acaggccatg 5040 tttgacagct tatcatcgaa gcttagagat cttagtcgac gttaggcgcg ccatgctcga 5100 gtatgcggcc gctaatgaat cggccaacgc gcggggagag gcggtttgcg tattggcacc 5160 attccttgcg gcggcggtgc tcaacggcct caacctacta ctgggctgct tcctaatgca 5220 ggagtcgcat aagggagagc gtc 5243 <210> 158 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> synthetic primer DHD280c <400> 158 catatggcgg ccgctaataa gcaga 25 <210> 159 <211> 58 <212> DNA <213> Artificial Sequence <220> <223> synthetic primer DHD281c <400> 159 ttagatctta gtcgacgtta ggcgcgccat gctcgagtaa tggtattgac cagcatgg 58 <210> 160 <211> 55 <212> DNA <213> Artificial Sequence <220> <223> synthetic primer DHD283 <400> 160 cgagcatggc gcgcctaacg tcgactaaga tctaagagct gttcctgagt gaagc 55 <210> 161 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> synthetic primer DHD285 <400> 161 ttcgaaaagc ttttcgcaat gtaaccagcc ag 32 <210> 162 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> synthetic primer DHD268c <400> 162 catatggcgg ccgctaataa acgggttgtt actcgctcac 40 <210> 163 <211> 57 <212> DNA <213> Artificial Sequence <220> <223> synthetic primer DHD269c <400> 163 ttagatctta gtcgacgtta ggcgcgccat gctcgagctt catccaccac atacagg 57 <210> 164 <211> 57 <212> DNA <213> Artificial Sequence <220> <223> synthetic primer DHD271 <400> 164 ctcgagcatg gcgcgcctaa cgtcgactaa gatctaagtg ccaatgaatc gtctgac 57 <210> 165 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> synthetic primer DHD273 <400> 165 ttcgaaaagc tttccatttc gctggtggtc ag 32 <210> 166 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> synthetic primer DHD274c <400> 166 catatggcgg ccgctaataa attccaacag ggtggttacc 40 <210> 167 <211> 58 <212> DNA <213> Artificial Sequence <220> <223> synthetic primer DHD275c <400> 167 ttagatctta gtcgacgtta ggcgcgccat gctcgagcag tacagcaagg atagaacc 58 <210> 168 <211> 57 <212> DNA <213> Artificial Sequence <220> <223> synthetic primer DHD277 <400> 168 ctcgagcatg gcgcgcctaa cgtcgactaa gatctaagcg atgacaccaa aaggtgc 57 <210> 169 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> synthetic primer DHD279 <400> 169 ttcgaaaagc ttagactcac ccagataagt cg 32 <210> 170 <211> 14823 <212> DNA <213> Artificial Sequence <220> <223> synthetic plasmid pBR1102 <400> 170 gatccccgac agtaagacgg gtaagcctgt tgatgatacc gctgccttac tgggtgcatt 60 agccagtctg aatgacctgt cacgggataa tccgaagtgg tcagactgga aaatcagagg 120 gcaggaactg ctgaacagca aaaagtcaga tagcaccaca tagcagaccc gccataaaac 180 gccctgagaa gcccgtgacg ggcttttctt gtattatggg tagtttcctt gcatgaatcc 240 ataaaaggcg cctgtagtgc catttacccc cattcactgc cagagccgtg agcgcagcga 300 actgaatgtc acgaaaaaga cagcgactca ggtgcctgat ggtcggagac aaaaggaata 360 ttcagcgatt tgcccgagct tgcgagggtg ctacttaagc ctttagggtt ttaaggtctg 420 ttttgtagag gagcaaacag cgtttgcgac atccttttgt aatactgcgg aactgactaa 480 agtagtgagt tatacacagg gctgggatct attcttttta tcttttttta ttctttcttt 540 attctataaa ttataaccac ttgaatataa acaaaaaaaa cacacaaagg tctagcggaa 600 tttacagagg gtctagcaga atttacaagt tttccagcaa aggtctagca gaatttacag 660 atacccacaa ctcaaaggaa aaggactagt aattatcatt gactagccca tctcaattgg 720 tatagtgatt aaaatcacct agaccaattg agatgtatgt ctgaattagt tgttttcaaa 780 gcaaatgaac tagcgattag tcgctatgac ttaacggagc atgaaaccaa gctaatttta 840 tgctgtgtgg cactactcaa ccccacgatt gaaaacccta caaggaaaga acggacggta 900 tcgttcactt ataaccaata cgttcagatg atgaacatca gtagggaaaa tgcttatggt 960 gtattagcta aagcaaccag agagctgatg acgagaactg tggaaatcag gaatcctttg 1020 gttaaaggct ttgagatttt ccagtggaca aactatgcca agttctcaag cgaaaaatta 1080 gaattagttt ttagtgaaga gatattgcct tatcttttcc agttaaaaaa attcataaaa 1140 tataatctgg aacatgttaa gtcttttgaa aacaaatact ctatgaggat ttatgagtgg 1200 ttattaaaag aactaacaca aaagaaaact cacaaggcaa atatagagat tagccttgat 1260 gaatttaagt tcatgttaat gcttgaaaat aactaccatg agtttaaaag gcttaaccaa 1320 tgggttttga aaccaataag taaagattta aacacttaca gcaatatgaa attggtggtt 1380 gataagcgag gccgcccgac tgatacgttg attttccaag ttgaactaga tagacaaatg 1440 gatctcgtaa ccgaacttga gaacaaccag ataaaaatga atggtgacaa aataccaaca 1500 accattacat cagattccta cctacataac ggactaagaa aaacactaca cgatgcttta 1560 actgcaaaaa ttcagctcac cagttttgag gcaaaatttt tgagtgacat gcaaagtaag 1620 tatgatctca atggttcgtt ctcatggctc acgcaaaaac aacgaaccac actagagaac 1680 atactggcta aatacggaag gatctgaggt tcttatggct cttgtatcta tcagtgaagc 1740 atcaagacta acaaacaaaa gtagaacaac tgttcaccgt tacatatcaa agggaaaact 1800 gtccatatgc acagatgaaa acggtgtaaa aaagatagat acatcagagc ttttacgagt 1860 ttttggtgca tttaaagctg ttcaccatga acagatcgac aatgtaacag atgaacagca 1920 tgtaacacct aatagaacag gtgaaaccag taaaacaaag caactagaac atgaaattga 1980 acacctgaga caacttgtta cagctcaaca gtcacacata gacagcctga aacaggcgat 2040 gctgcttatc gaatcaaagc tgccgacaac acgggagcca gtgacgcctc ccgtggggaa 2100 aaaatcatgg caattctgga agaaatagcg ctttcagccg gcaaaccggc tgaagccgga 2160 tctgcgattc tgataacaaa ctagcaacac cagaacagcc cgtttgcggg cagcaaaacc 2220 cgtacttttg gacgttccgg cggttttttg tggcgagtgg tgttcgggcg gtgcgcgcaa 2280 gatccattat gttaaacggg cgagtttaca tctcaaaacc gcccgcttaa caccatcaga 2340 aatcctcagc gcgattttaa gcaccaaccc ccccccgtaa cacccaaatc catactgaaa 2400 gtggctttgt tgaataaatc gaacttttgc tgagttgaag gatcagatca cgcatcctcc 2460 cgacaacaca gaccattccg tggcaaagca aaagttcaga atcaccaact ggtccaccta 2520 caacaaagct ctcatcaacc gtggctccct cactttctgg ctggatgatg aggcgattca 2580 ggcctggtat gagtcggcaa caccttcatc acgaggaagg ccccagcgct attctgatct 2640 cgccatcacc accgttctgg tgattaaacg cgtattccgg ctgaccctgc gggctgcgca 2700 gggttttatt gattccattt ttgccctgat gaacgttccg ttgcgctgcc cggattacac 2760 cagtgtcagt aagcgggcaa agtcggttaa tgtcagtttc aaaacgtcca cccggggtga 2820 aatcgcacac ctggtgattg attccaccgg gctgaaggtc tttggtgaag gcgaatggaa 2880 agtcagaaag cacggcaaag agcgccgtcg tatctggcga aagttgcatc ttgctgtggg 2940 gatcaacacg ggataatacc gcgccacata gcagaacttt aaaagtgctc atcattggaa 3000 aacgttcttc ggggcgaaaa ctctcaagga tcttaccgct gttgagatcc agttcgatgt 3060 aacccactcg tgcacccaac tgatcttcag catcttttac tttcaccagc gtttctgggt 3120 gagcaaaaac aggaaggcaa aatgccgcaa aaaagggaat aagggcgaca cggaaatgtt 3180 gaatactcat actcttcctt tttcaatatt attgaagcat ttatcagggt tattgtctca 3240 tgagcggata catatttgaa tgtatttaga aaaataaaca aataggggtt ccgcgcacat 3300 ttccccgaaa agtgccacct gacgtctaag aaaccattat tatcatgaca ttaacctata 3360 aaaataggcg tatcacgagg ccctttcgtc ttcgaataaa tacctgtgac ggaagatcac 3420 ttcgcagaat aaataaatcc tggtgtccct gttgataccg ggaagccctg ggccaacttt 3480 tggcgaaaat gagacgttga tcggcacgta agaggttcca actttcacca taatgaaata 3540 agatcactac cgggcgtatt ttttgagtta tcgagatttt caggagctaa ggaagctaaa 3600 atggagaaaa aaatcactgg atataccacc gttgatatat cccaatggca tcgtaaagaa 3660 cattttgagg catttcagtc agttgctcaa tgtacctata accagaccgt tcagctggat 3720 attacggcct ttttaaagac cgtaaagaaa aataagcaca agttttatcc ggcctttatt 3780 cacattcttg cccgcctgat gaatgctcat ccggaattcc gtatggcaat gaaagacggt 3840 gagctggtga tatgggatag tgttcaccct tgttacaccg ttttccatga gcaaactgaa 3900 acgttttcat cgctctggag tgaataccac gacgatttcc ggcagtttct acacatatat 3960 tcgcaagatg tggcgtgtta cggtgaaaac ctggcctatt tccctaaagg gtttattgag 4020 aatatgtttt tcgtctcagc caatccctgg gtgagtttca ccagttttga tttaaacgtg 4080 gccaatatgg acaacttctt cgcccccgtt ttcaccatgg gcaaatatta tacgcaaggc 4140 gacaaggtgc tgatgccgct ggcgattcag gttcatcatg ccgtttgtga tggcttccat 4200 gtcggcagaa tgcttaatga attacaacag tactgcgatg agtggcaggg cggggcgtaa 4260 tttttttaag gcagttattg gtgcccttaa acgcctggtt gctacgcctg aataagtgat 4320 aataagcgga tgaatggcag aaattcgaaa gcaaattcga cccggtcgtc ggttcagggc 4380 agggtcgtta aatagccgct tatgtctatt gctggtttac cggtttattg actaccggaa 4440 gcagtgtgac cgtgtgcttc tcaaatgcct gaggccagtt tgctcaggct ctccccgtgg 4500 aggtaataat tgacgatatg atcatttatt ctgcctccca gagcctgata aaaacggtga 4560 atccgttagc gaggtgccgc cggcttccat tcaggtcgag gtggcccggc tccatgcacc 4620 gcgacgcaac gcggggaggc agacaaggta tagggcggcg cctacaatcc atgccaaccc 4680 gttccatgtg ctcgccgagg cggcataaat cgccgtgacg atcagcggtc caatgatcga 4740 agttaggctg gtaagagccg cgagcgatcc ttgaagctgt ccctgatggt cgtcatctac 4800 ctgcctggac agcatggcct gcaacgcggg catcccgatg ccgccggaag cgagaagaat 4860 cataatgggg aaggccatcc agcctcgcgt cgcgaacgcc agcaagacgt agcccagcgc 4920 gtcggccgcc atgccggcga taatggcctg cttctcgccg aaacgtttgg tggcgggacc 4980 agtgacgaag gcttgagcga gggcgtgcaa gattccgaat accgcaagcg acaggccatg 5040 tttgacagct tatcatcgaa gcttttcgca atgtaaccag ccaggaagcc cgcaataata 5100 ccaccaatga agccagaacc ggtgctgacc gccagcatac cgccaatcag acccggagtg 5160 aggcccggac gatcggcaat ggaaaaggca atataacctg ccagtaccgg caccatcagc 5220 gcaaaggctg aaccaccacc aatctgcatc agcgccgcag ccaacgtacc cggctcttta 5280 aacgcttcga taccaaaagc aaaagaaagc gcgatacaca gaccacctgc aacgaccatc 5340 ggcagcatgt aagaaacgcc cgtcagcaag tgacggtatg cgcctgcact ctctttctta 5400 ctttcagtgg tcgccgtttg agctttgccc gccggttcat acggcgttgc ttcagcaacc 5460 gctttatcca gttcctgcgc ggttttcttc agcgccagac cggtagaggt acgatacatc 5520 ggtttaccag caaatttcgc cagatccact tcgatatctg ccgccacaat caccagatcc 5580 gctgctgcga cttcttcggg agtgattgca ttacccgcgc caacagaacc acgggtttca 5640 actttcaccc accagccacg ttttttcgct tcggtttcaa tggcttcagc cgccataaag 5700 gtgtgtgcta cgccagtcgg gcaagcagtc accgcaacta cgcgtttcgg accgctggcg 5760 gcaactggtg ctgtcgcagc gaccggcgca gtgtaaggtt tcgcatggcc tttggcttca 5820 ctcaggaaca gctcttagat cttagtcgac gttaggcgcg ccagagctca tcgttaatgt 5880 cttcgtgcgc cgtcagtcgg cgcacgtttt ttctctctgg taccgtgtca ctgatctagt 5940 caattactcg aagtatccac aagtgaagca tactaagtaa tgtacaagaa tcaaaaaaat 6000 cggctacgca agtcgcgtag ccgaatcatt taaggatcca gtgtaatcga ttgatagatt 6060 taaataagaa ctgcagaagc tagcttagat gctcgtgaaa ttgacgtggg cgctttgcag 6120 ggccgtctta atggcgttgg tgtccacgag gatcgagtcg ggtgcggaaa acggacggtt 6180 cttgttggtg aaatcgctgt taccaatgta cagcgattcc ttgttacgca gcgcctggat 6240 gtgccagcgg gaccacgaat cccaatactt ctggcgatcc ggcgagatac cttggctggt 6300 gtagccggtc gtcgggctgt tcatcaacga gtcggtgcgg tgcgagccca gcgtcagcgg 6360 caacttgatc cgatgcaccg tggaatcgcc gaagatcagc ttcagacgcg cgataaattc 6420 gctatccgca cccgttttca cacaatccca gacaccggcc ttctgcaaga cgtcggcacg 6480 gcgaaacagg agcgacgacg gattcagacg cttcaagggg tacactgcgc gggcatagaa 6540 aataccgttg tcttgcaggc gcacccagtc cgagatggag cagatgagct tcggattgag 6600 caacaagggg gagatttggc ggaacagctt ttccggatgg ctccagtcat ccgaatcgtg 6660 gcaggtgacg aactcgccct tcgcttggat caagccgata cgcttcgcgg cataggtgcc 6720 gacattctgc ggcaggctaa tgatcttgat gcgcgtgtct ttgagggcga gccgctggag 6780 acgaaacagg gtgtcatcgg tgctcgcgtc atccacaatg atcagctcga aggaacggta 6840 ggtctgattg aggagcgaaa tcaccgcatt ttccacgcgg cgacccgtat tataggtggt 6900 catcaggatg gagatcaacg gccccgtctg ggccgggtac gggatgctgg tgatgatgtt 6960 gcacggggag agcggggagc tgttgtccgt caaggccacg gggctgaggc cgaagtattt 7020 atagtattca ttcagccgat tcaggctaat ttcggcggtt tcgcggaagg cgttattttg 7080 cagcagcagg atatccgggc tatagacgat atcggatgcg tcgatctggg cgagggtcga 7140 gatggccttt tgggtcaggc cgatccggag ttgcagtgcg gtatacaggt ccagcgggca 7200 gttgtccacg ttgtccaaca ggctcaggct aaaggtcggc gagtaggacg ccagggtttt 7260 cgccagttcc actttctgat gggtatcggt gaactcgtcc ttgaactcca tcagcagctc 7320 gggcgtcagg ctgatgtcgc cgcaggcgat ttttgcgatc ttgattgcca gtttgcagcg 7380 ccaatcggac ggggtatccg tcaagttatg cagcgaccag tacatattca gacgatacat 7440 cgcgaggatg cgtttcgact gccagaaccg gcaatcatcc tggatggccg cgagcgcgtg 7500 gacgtagcgg ctctttttga gcagccacaa gaatttgaga ttattgaaca tttattaacc 7560 tcctgctagc aacttaagtt acgaatcgac gccgaacagg tcgcgggtgt agactttctc 7620 cgagacatct tccagttcgc tggtgcggcg attcgccaca atgacatcga cgcgctcctt 7680 aaaggaattg atgtcgcgct cgacgtagga accgaagaag tagggttctt tcaggaccgg 7740 ctcgtacacc acaatctcga tacccttggc cttcaaacgt ttcatgaccc cctggatgct 7800 gctggcccgg aaattgtcgc tacccgcctt catgatcagg cgatagatac cgaccacttt 7860 gggcttacgg gacaggatgt cctcggccac gaagtcctta cgggtcgtat tcgcatccac 7920 gatggcctgg atcaggtttt gcgggacgtc gcgataattg gccaacagct gcttcgtatc 7980 cttcggcaga cagtaaccgc cgtagccgaa ggacgggttg ttgtaatgtt gaccaatgcg 8040 cggatcgagg gagacgcctt cgatgatttg tttggtatcc aggccgtgca cgctcgcgta 8100 ggtgtccagc tcgttaaagt acgcgatacg catcgccaga tacgtgttcg cgaacagttt 8160 gatggcttct gcctcgggcg aatccgtcag caggatcgga atatcctttt tgatggcacc 8220 ttccgacagg agttcggcga acttccgtgc gcgttccgac gattcgccca cgacaatgcg 8280 gctcggatag agattatcat acagggcttt gccttcgcgc aggaactccg gggaaaagat 8340 gatattattc gtgttcagat cgcgcttcag gcgttcggtg aacccgacgg ggacggtgga 8400 tttgataatg atggtcgcgt tcgggttaat ggacagcacg tcacacgcga cgctttcgac 8460 gctcagggta tcaaagttgt tattaatcgg atcatagttc gtcggggtgg cgatgatcac 8520 gtagtctgca tcgcgatatg cctcgtattt ttccgtcgtc gcgtagaggt tcagcttacg 8580 attggagaga aacttctgga tttccgggtc gcaaatcggc gagattttct tgttaatgag 8640 ctggaccttc ttcgggtcga tgtccagggc gatgatgtcg tgtttttggg agaggaggat 8700 cgcaatgctg atacccacat agccgacgcc ggccacggca attttcattt attaacctcc 8760 ttaagtgaat tcaaactagt ttacaagtcg ttttcgatct tctcccaggt atatttgcga 8820 cattcattca agttggtcag cggcgagtat ttgtactttt tgataccgag gcgcgacagg 8880 ctttcgttca ccaccttgaa atggttttcc ttttggatgt ccagtttctt gatcgacgtg 8940 ttctcgccgt gcaggacacg gttgtagcaa atcttattga tatgcttaaa cgggccgact 9000 tcgctgagtt tcaaatacat atcgtaatcc accgcattgc tgatgctctc gttgaagcct 9060 tcggtgaggt tccatgcacg cgccgtgaac atacggaagt ggtggcagat catcgcgctc 9120 gtgagctttt cgcggctgta aatcggccag ttgtagccat tgctaatcaa gttaccttca 9180 cgatcaatat tgcgattggt ggtgtacacg caggcgaggc tcaggtcttt gcgaaattca 9240 tccagacaca gttccacggc atcgggctcc aggaaatcat cggaatccag ctgcccgatg 9300 tagaaacccc ggcacaggcg gactgcggta ttcgaggcgg agccgatgcc tttgtttttc 9360 tggctgatga aacggacgcg cgggtggttt gcgtaatgtt cttgcaggat gcgcagcgta 9420 tcatcggtgc tcccgtcatc gcagatgcag acctccagat cggtgatcgt ttggttcagt 9480 gccgattcga cgcagcgcac gatatatttg ctgcaattat acgcggggat gtagatgctc 9540 accaggggca cacgtttcag ggtggcgctc tcgattttct ccttcttgcg ataaaagtag 9600 ggcaccttct gctgcaacag ctggacggta atgtttttac ctgccgcgcg atcggtttcg 9660 ttctccttac cgggcggttc ctgatgatat gccatcgcgc cttccacgct acggaaataa 9720 caaccctcgc ggtacagccg atagccgaac tcattatcct caccgcccca atgcgtgaac 9780 tcttcgtcaa accaacccgc gcgaaacagc cacttctttg caaacgccac attgccaccg 9840 ctaaagaacc ggaacggggt gttgcacagg cgcagattgt cggtattctt gaaatgttcg 9900 atgcgccaat cgacggattt gttctgctcg accttgcctg cgacctgatt attggtaata 9960 atctccggga tttcattgat caggcttttc tgggacaaaa agtccagata ggtatgcttc 10020 gacgtgtcga tgtatttacg cgggccaatc agtgccacgt tatcatccac ggccaggagt 10080 tccatatagg actgcaccca caacgggttc ggcgccatat cgcagtccaa gatcgccacg 10140 tagttgtatt tcgctgcccg caggcccagg ttccgcacgg cgcacagctg gtagccgtag 10200 tctttctggc ggacgtattt gatgttcagc aacgactcga actcgcggac gatctcttcg 10260 atgttttcct tggaaccgtc atccgcgacg atgacctcat agtcataaat cgttttctga 10320 ttgcagaggc aggccagggt gatcgccagg attttggcgc gattgtacgt cggaatcacg 10380 atggacaggc cgtcgatgat cagttgcttg cgcggataat catccagttc tttacgtttc 10440 cctgcccaga cgtagtcgtt cgtgctttcc ggcagcggcg gcaaggtcag gtcgctcggc 10500 caatccagcg gaatgggttc gacttctttc aattcggcgc gctcggattt ctttgcggta 10560 atttcccgat atttgctaat gatttcattc ttttccacct cattcagcga gatcgccttt 10620 gcattgctgc acataatttt ggttgccgcg tcgatatcaa tgaccgcttt ccgattcagc 10680 ttgtccactt cttcgctcag attcagggcg gtttggcaca gcttgatatt ggcttccacc 10740 cagctcacat catagatttc cgccactttt tcaaacaggg agagggcttg gcggtagttc 10800 ttattcttat acagattgat tgcctggttc aaaatgctca tttattaacc tcctactagt 10860 gaattttcga attacttacc gcagtacttg acacccacct gggaattgtt tttggtgcgt 10920 ttgaattggc ggatggtacg gtagatgcta aagggcaggc tgatcagacc gagcggaaaa 10980 ttgttcttat tgatgatgag cttgcccagc tgatagctca ggtgtttctt gacccgttcg 11040 gcttcgtgtt tatccgcgta caggaagatg ctcggcaggc tcacttggta ctccgaatca 11100 tatttcttct tccaggtccg ccattcgctg atcaacgcaa acggaatcga gatcagaccg 11160 aggaacgtct tggagcggct caccatcacc gcacccaggc ggtagccgat atcttgcttg 11220 atgcgttcgg ccgcaccata cagctccggc agttgtttct tttcgagacg ttgattgtcg 11280 atgaagtact gttcgagctt ttgctgcacc agatgcagct gattgagcag caattctttt 11340 tcgcacgaca gcttttcgag gcgctgttgt tgcagttcat ttttgttctg ttcctttttc 11400 agcagggact cgaagttctc gatcgcgcac tccagttcct ggacctggat ggttttgttt 11460 ttaatgatca gatcatactg gatcagttct tccttgctat ccgacagctc tttcagaatg 11520 gcttgatagg cgttcagctg tttggacgtg tgcagttcgt tgtccagaat gatctttttg 11580 ctgctctggt acagaccgtt cacgatatcg agggtgatct ggcgttgttt aatgaacgtc 11640 tcccaaataa aggacggctt atagttttcc ttctccagca cccgcaaggg ggtgttggcg 11700 ttcgattgca attcaaagta cagttccttg caatcgggat agtcgttcag gacgttgaag 11760 atcaagtact cctccgtctc gctttgcttg aaaatgatat ccccggtccc gatgtcaata 11820 ccgctgaggg acatgatctc ctgatgttct ttttccagcg taatggaggc ttcggcggtc 11880 ttaaagtcat tcacgctctg ctccagcgag tggttgatgg tattggagaa cgacaacccg 11940 aatttcagtt tcagtttgtg ttgcagttgc tggatgcagt cctcggcgtt gcgcttcacc 12000 tgttcgctcg acaccagcag gcaccgaccc cggttgttga ggaagaagtg cagcaaggcg 12060 gtgttgtatg ccagccagtt tttgatcaga tgctccgagg tatagttgct ggagatgttc 12120 tggtccgaga agtagttcgt caggatgctt ttggggtggt cgtagatgag gataaaggtg 12180 atgttctcat ccaccgattt ccaatattcc aacgtgtgaa ttgcgttggg gtcgctccaa 12240 ccgcacagtt tctggttcag gttggacagc atcagatcca atgcgatacc gttccagacg 12300 gtgctcacat ggagcggttc aaagtcggcg gaatcggtca ccgtatagat gtccggcgac 12360 tggtacgcct tccgcagcgt ctgggtgatg tcctggggcg agaggttctc acgtttggac 12420 gggcacaggg agttcatgcc gcgctgatgc aggagttctt ccacgatttg gtagttgctg 12480 ctcggatggc ccacgatcac caggcggttc atttattaac ctcctttcga aaatgaacgg 12540 tccgttaaat atagccattc ggattcttca tctgccagcg ccaggcgtcc tccagcatgg 12600 tttcgagttc ccgcttggct ttccagttca gatatttgtt ggccttttcg ggggaggacc 12660 agctctccgc gatatcaccg tcacggcggc tcacgatttc atacggaatc cgcacgccgg 12720 aaatcttttc aaaggtggac accagttcca gcaccgaata acctttaccc gtgcccaaat 12780 taaagacgtg gtagttggtg ttattgtcgc ggaagagata ggacagcgct gcgacgtgcc 12840 cttcggccag gtccatcaca tggatatagt cacggacccc cgtgccgtct ttggtgggat 12900 aatcaccacc gaacaccatc agtttttcca gtttccccat cgcgacctgc aagatgtacg 12960 gcaccaagtt ggaggggatg tctgccgggc tttcaccaat cataccggat tcgtgggcgc 13020 ccgtcggatt aaagtagcgc aagcagagga aattcgtgtc ggagtatttc ttggcgatgt 13080 cgcggatcat cagctccgag atgtacttgg acgtaccata cggattcagc gtgccaccaa 13140 tatggcagtc ttcggtgacg ggcatgatct tgctttcccc atacaccgtc gccgacgagc 13200 taaagatgaa gttggcgacg tcgttcttga tggcgcaatt gatgagttgc agggtgccgc 13260 tcacgttgtt gtcatagtag aagatgggct tgatcaggct ttctgcgacc gatttcgcac 13320 ctgcaaagtg catgatgcag tcgaatttgt gtttcttcag gatctggttc acttccttct 13380 cgttgttgat attgagttcg tagaacgtga ctttcttctt tgcgatcagc tcaatgcgac 13440 ggatgctttc gcagctgctg ttgatgagat tgtcaatgat gacgacattg tagcctttgt 13500 tcagcaggca gagcgacgtg tggctgccga tgtagcctgc accgccggtg accaggatgt 13560 tcatttatta acctcctcgg tccgaattaa cctaggttat gaggtcagca ttgcttcttc 13620 acgcggtgtt aattaataga cctgcaggat tattgtttct gttgcataaa gcctaagggg 13680 taggcctttc tagagatagc cattttttgc actcctgtat ccgcttcttg caaggctgga 13740 cttatcccta tcaaaccgga cactgcaggc tgacaagctt tcattacata tgaagagttt 13800 gtagaaacgc aaaaaggcca tccgtcagga tggccttcta agaaggctcg agtaatggta 13860 ttgaccagca tggtacctgg acgagcatgc aggccgtgtt cattgcgcac cacaaactcc 13920 gcgcttaaca cgtcgtcggt cggcgcatca tcgctggtca gcagcgccag caacgttgcc 13980 gcatccgctt tcagcaagcg gtcagcttta ttgtcgagca ataaatcagc gagacgctta 14040 agaaccgcga tgggctgatc gtcattcatc gccacactca ccagcatggc tgccgtttcg 14100 ccgtccacat caaaagcatt tgccgcacgg cttaccgcaa tcgcgctacg cagattgcct 14160 tcggcgctat cgctcagcca gataccctgt ccgagattca gcggttgttc attgatggct 14220 ttggtgacga aagtggcgtc aactgccccc gcctctttca gacgcgcagc gttcagcgcc 14280 tgaagagtca gcagatcgct ggcgacgata tccagtgtca gcatttcgtt gtcgagcttc 14340 agctgctcac tctgcttttc gcccatcagt aatgcgcgaa gttcttctgc tgttgttgct 14400 gacttcagtt gttcagcaac ggaatcatcg ctcagtacgt gggtcagctg gcgtagcagg 14460 cccagatgtt catccgagct ggcagcaata ccgattgcca cgtacgctac ctgaccgtca 14520 ccccaggtga cgccttccgg gaactgaaat acctgaacgc cggttttcag cacctgatcg 14580 cgggtgtcgg tagtgccgtg tggaatagca ataccattgc cgaggaacgt tgaggtttgc 14640 tgttcgcgcg ccagcatgcc attgacgtag ccttctgctt attagcggcc gctaatgaat 14700 cggccaacgc gcggggagag gcggtttgcg tattggcacc attccttgcg gcggcggtgc 14760 tcaacggcct caacctacta ctgggctgct tcctaatgca ggagtcgcat aagggagagc 14820 gtc 14823 <210> 171 <211> 15084 <212> DNA <213> Artificial Sequence <220> <223> synthetic plasmid pBR1100 <400> 171 gatccccgac agtaagacgg gtaagcctgt tgatgatacc gctgccttac tgggtgcatt 60 agccagtctg aatgacctgt cacgggataa tccgaagtgg tcagactgga aaatcagagg 120 gcaggaactg ctgaacagca aaaagtcaga tagcaccaca tagcagaccc gccataaaac 180 gccctgagaa gcccgtgacg ggcttttctt gtattatggg tagtttcctt gcatgaatcc 240 ataaaaggcg cctgtagtgc catttacccc cattcactgc cagagccgtg agcgcagcga 300 actgaatgtc acgaaaaaga cagcgactca ggtgcctgat ggtcggagac aaaaggaata 360 ttcagcgatt tgcccgagct tgcgagggtg ctacttaagc ctttagggtt ttaaggtctg 420 ttttgtagag gagcaaacag cgtttgcgac atccttttgt aatactgcgg aactgactaa 480 agtagtgagt tatacacagg gctgggatct attcttttta tcttttttta ttctttcttt 540 attctataaa ttataaccac ttgaatataa acaaaaaaaa cacacaaagg tctagcggaa 600 tttacagagg gtctagcaga atttacaagt tttccagcaa aggtctagca gaatttacag 660 atacccacaa ctcaaaggaa aaggactagt aattatcatt gactagccca tctcaattgg 720 tatagtgatt aaaatcacct agaccaattg agatgtatgt ctgaattagt tgttttcaaa 780 gcaaatgaac tagcgattag tcgctatgac ttaacggagc atgaaaccaa gctaatttta 840 tgctgtgtgg cactactcaa ccccacgatt gaaaacccta caaggaaaga acggacggta 900 tcgttcactt ataaccaata cgttcagatg atgaacatca gtagggaaaa tgcttatggt 960 gtattagcta aagcaaccag agagctgatg acgagaactg tggaaatcag gaatcctttg 1020 gttaaaggct ttgagatttt ccagtggaca aactatgcca agttctcaag cgaaaaatta 1080 gaattagttt ttagtgaaga gatattgcct tatcttttcc agttaaaaaa attcataaaa 1140 tataatctgg aacatgttaa gtcttttgaa aacaaatact ctatgaggat ttatgagtgg 1200 ttattaaaag aactaacaca aaagaaaact cacaaggcaa atatagagat tagccttgat 1260 gaatttaagt tcatgttaat gcttgaaaat aactaccatg agtttaaaag gcttaaccaa 1320 tgggttttga aaccaataag taaagattta aacacttaca gcaatatgaa attggtggtt 1380 gataagcgag gccgcccgac tgatacgttg attttccaag ttgaactaga tagacaaatg 1440 gatctcgtaa ccgaacttga gaacaaccag ataaaaatga atggtgacaa aataccaaca 1500 accattacat cagattccta cctacataac ggactaagaa aaacactaca cgatgcttta 1560 actgcaaaaa ttcagctcac cagttttgag gcaaaatttt tgagtgacat gcaaagtaag 1620 tatgatctca atggttcgtt ctcatggctc acgcaaaaac aacgaaccac actagagaac 1680 atactggcta aatacggaag gatctgaggt tcttatggct cttgtatcta tcagtgaagc 1740 atcaagacta acaaacaaaa gtagaacaac tgttcaccgt tacatatcaa agggaaaact 1800 gtccatatgc acagatgaaa acggtgtaaa aaagatagat acatcagagc ttttacgagt 1860 ttttggtgca tttaaagctg ttcaccatga acagatcgac aatgtaacag atgaacagca 1920 tgtaacacct aatagaacag gtgaaaccag taaaacaaag caactagaac atgaaattga 1980 acacctgaga caacttgtta cagctcaaca gtcacacata gacagcctga aacaggcgat 2040 gctgcttatc gaatcaaagc tgccgacaac acgggagcca gtgacgcctc ccgtggggaa 2100 aaaatcatgg caattctgga agaaatagcg ctttcagccg gcaaaccggc tgaagccgga 2160 tctgcgattc tgataacaaa ctagcaacac cagaacagcc cgtttgcggg cagcaaaacc 2220 cgtacttttg gacgttccgg cggttttttg tggcgagtgg tgttcgggcg gtgcgcgcaa 2280 gatccattat gttaaacggg cgagtttaca tctcaaaacc gcccgcttaa caccatcaga 2340 aatcctcagc gcgattttaa gcaccaaccc ccccccgtaa cacccaaatc catactgaaa 2400 gtggctttgt tgaataaatc gaacttttgc tgagttgaag gatcagatca cgcatcctcc 2460 cgacaacaca gaccattccg tggcaaagca aaagttcaga atcaccaact ggtccaccta 2520 caacaaagct ctcatcaacc gtggctccct cactttctgg ctggatgatg aggcgattca 2580 ggcctggtat gagtcggcaa caccttcatc acgaggaagg ccccagcgct attctgatct 2640 cgccatcacc accgttctgg tgattaaacg cgtattccgg ctgaccctgc gggctgcgca 2700 gggttttatt gattccattt ttgccctgat gaacgttccg ttgcgctgcc cggattacac 2760 cagtgtcagt aagcgggcaa agtcggttaa tgtcagtttc aaaacgtcca cccggggtga 2820 aatcgcacac ctggtgattg attccaccgg gctgaaggtc tttggtgaag gcgaatggaa 2880 agtcagaaag cacggcaaag agcgccgtcg tatctggcga aagttgcatc ttgctgtggg 2940 gatcaacacg ggataatacc gcgccacata gcagaacttt aaaagtgctc atcattggaa 3000 aacgttcttc ggggcgaaaa ctctcaagga tcttaccgct gttgagatcc agttcgatgt 3060 aacccactcg tgcacccaac tgatcttcag catcttttac tttcaccagc gtttctgggt 3120 gagcaaaaac aggaaggcaa aatgccgcaa aaaagggaat aagggcgaca cggaaatgtt 3180 gaatactcat actcttcctt tttcaatatt attgaagcat ttatcagggt tattgtctca 3240 tgagcggata catatttgaa tgtatttaga aaaataaaca aataggggtt ccgcgcacat 3300 ttccccgaaa agtgccacct gacgtctaag aaaccattat tatcatgaca ttaacctata 3360 aaaataggcg tatcacgagg ccctttcgtc ttcgaataaa tacctgtgac ggaagatcac 3420 ttcgcagaat aaataaatcc tggtgtccct gttgataccg ggaagccctg ggccaacttt 3480 tggcgaaaat gagacgttga tcggcacgta agaggttcca actttcacca taatgaaata 3540 agatcactac cgggcgtatt ttttgagtta tcgagatttt caggagctaa ggaagctaaa 3600 atggagaaaa aaatcactgg atataccacc gttgatatat cccaatggca tcgtaaagaa 3660 cattttgagg catttcagtc agttgctcaa tgtacctata accagaccgt tcagctggat 3720 attacggcct ttttaaagac cgtaaagaaa aataagcaca agttttatcc ggcctttatt 3780 cacattcttg cccgcctgat gaatgctcat ccggaattcc gtatggcaat gaaagacggt 3840 gagctggtga tatgggatag tgttcaccct tgttacaccg ttttccatga gcaaactgaa 3900 acgttttcat cgctctggag tgaataccac gacgatttcc ggcagtttct acacatatat 3960 tcgcaagatg tggcgtgtta cggtgaaaac ctggcctatt tccctaaagg gtttattgag 4020 aatatgtttt tcgtctcagc caatccctgg gtgagtttca ccagttttga tttaaacgtg 4080 gccaatatgg acaacttctt cgcccccgtt ttcaccatgg gcaaatatta tacgcaaggc 4140 gacaaggtgc tgatgccgct ggcgattcag gttcatcatg ccgtttgtga tggcttccat 4200 gtcggcagaa tgcttaatga attacaacag tactgcgatg agtggcaggg cggggcgtaa 4260 tttttttaag gcagttattg gtgcccttaa acgcctggtt gctacgcctg aataagtgat 4320 aataagcgga tgaatggcag aaattcgaaa gcaaattcga cccggtcgtc ggttcagggc 4380 agggtcgtta aatagccgct tatgtctatt gctggtttac cggtttattg actaccggaa 4440 gcagtgtgac cgtgtgcttc tcaaatgcct gaggccagtt tgctcaggct ctccccgtgg 4500 aggtaataat tgacgatatg atcatttatt ctgcctccca gagcctgata aaaacggtga 4560 atccgttagc gaggtgccgc cggcttccat tcaggtcgag gtggcccggc tccatgcacc 4620 gcgacgcaac gcggggaggc agacaaggta tagggcggcg cctacaatcc atgccaaccc 4680 gttccatgtg ctcgccgagg cggcataaat cgccgtgacg atcagcggtc caatgatcga 4740 agttaggctg gtaagagccg cgagcgatcc ttgaagctgt ccctgatggt cgtcatctac 4800 ctgcctggac agcatggcct gcaacgcggg catcccgatg ccgccggaag cgagaagaat 4860 cataatgggg aaggccatcc agcctcgcgt cgcgaacgcc agcaagacgt agcccagcgc 4920 gtcggccgcc atgccggcga taatggcctg cttctcgccg aaacgtttgg tggcgggacc 4980 agtgacgaag gcttgagcga gggcgtgcaa gattccgaat accgcaagcg acaggccatg 5040 tttgacagct tatcatcgaa gctttccatt tcgctggtgg tcagatgcgg gatggcgtgg 5100 gacgcggcgg ggagcgtcac actgaggttt tccgccagac gccactgctg ccaggcgctg 5160 atgtgcccgg cttctgacca tgcggtcgcg ttcggttgca ctacgcgtac tgtgagccag 5220 agttgcccgg cgctctccgg ctgcggtagt tcaggcagtt caatcaactg tttaccttgt 5280 ggagcgacat ccagaggcac ttcaccgctt gccagcggct taccatccag cgccaccatc 5340 cagtgcagga gctcgttatc gctatgacgg aacaggtatt cgctggtcac ttcgatggtt 5400 tgcccggata aacggaactg gaaaaactgc tgctggtgtt ttgcttccgt cagcgctgga 5460 tgcggcgtgc ggtcggcaaa gaccagaccg ttcatacaga actggcgatc gttcggcgta 5520 tcgccaaaat caccgccgta agccgaccac gggttgccgt tttcatcata tttaatcagc 5580 gactgatcca cccagtccca gacgaagccg ccctgtaaac ggggatactg acgaaacgcc 5640 tgccagtatt tagcgaaacc gccaagactg ttacccatcg cgtgggcgta ttcgcaaagg 5700 atcagcgggc gcgtctctcc aggtagcgaa agccattttt tgatggacca tttcggcaca 5760 gccgggaagg gctggtcttc atccacgcgc gcgtacatcg ggcaaataat atcggtggcc 5820 gtggtgtcgg ctccgccgcc ttcatactgc accgggcggg aaggatcgac agatttgatc 5880 cagcgataca gcgcgtcgtg attagcgccg tggcctgatt cattccccag cgaccagatg 5940 atcacactcg ggtgattacg atcgcgctgc accattcgcg ttacgcgttc gctcatcgcc 6000 ggtagccagc gcggatcatc ggtcagacga ttcattggca cttagatctt agtcgacgtt 6060 aggcgcgcca gagctcatcg ttaatgtctt cgtgcgccgt cagtcggcgc acgttttttc 6120 tctctggtac cgtgtcactg atctagtcaa ttactcgaag tatccacaag tgaagcatac 6180 taagtaatgt acaagaatca aaaaaatcgg ctacgcaagt cgcgtagccg aatcatttaa 6240 ggatccagtg taatcgattg atagatttaa ataagaactg cagaagctag cttagatgct 6300 cgtgaaattg acgtgggcgc tttgcagggc cgtcttaatg gcgttggtgt ccacgaggat 6360 cgagtcgggt gcggaaaacg gacggttctt gttggtgaaa tcgctgttac caatgtacag 6420 cgattccttg ttacgcagcg cctggatgtg ccagcgggac cacgaatccc aatacttctg 6480 gcgatccggc gagatacctt ggctggtgta gccggtcgtc gggctgttca tcaacgagtc 6540 ggtgcggtgc gagcccagcg tcagcggcaa cttgatccga tgcaccgtgg aatcgccgaa 6600 gatcagcttc agacgcgcga taaattcgct atccgcaccc gttttcacac aatcccagac 6660 accggccttc tgcaagacgt cggcacggcg aaacaggagc gacgacggat tcagacgctt 6720 caaggggtac actgcgcggg catagaaaat accgttgtct tgcaggcgca cccagtccga 6780 gatggagcag atgagcttcg gattgagcaa caagggggag atttggcgga acagcttttc 6840 cggatggctc cagtcatccg aatcgtggca ggtgacgaac tcgcccttcg cttggatcaa 6900 gccgatacgc ttcgcggcat aggtgccgac attctgcggc aggctaatga tcttgatgcg 6960 cgtgtctttg agggcgagcc gctggagacg aaacagggtg tcatcggtgc tcgcgtcatc 7020 cacaatgatc agctcgaagg aacggtaggt ctgattgagg agcgaaatca ccgcattttc 7080 cacgcggcga cccgtattat aggtggtcat caggatggag atcaacggcc ccgtctgggc 7140 cgggtacggg atgctggtga tgatgttgca cggggagagc ggggagctgt tgtccgtcaa 7200 ggccacgggg ctgaggccga agtatttata gtattcattc agccgattca ggctaatttc 7260 ggcggtttcg cggaaggcgt tattttgcag cagcaggata tccgggctat agacgatatc 7320 ggatgcgtcg atctgggcga gggtcgagat ggccttttgg gtcaggccga tccggagttg 7380 cagtgcggta tacaggtcca gcgggcagtt gtccacgttg tccaacaggc tcaggctaaa 7440 ggtcggcgag taggacgcca gggttttcgc cagttccact ttctgatggg tatcggtgaa 7500 ctcgtccttg aactccatca gcagctcggg cgtcaggctg atgtcgccgc aggcgatttt 7560 tgcgatcttg attgccagtt tgcagcgcca atcggacggg gtatccgtca agttatgcag 7620 cgaccagtac atattcagac gatacatcgc gaggatgcgt ttcgactgcc agaaccggca 7680 atcatcctgg atggccgcga gcgcgtggac gtagcggctc tttttgagca gccacaagaa 7740 tttgagatta ttgaacattt attaacctcc tgctagcaac ttaagttacg aatcgacgcc 7800 gaacaggtcg cgggtgtaga ctttctccga gacatcttcc agttcgctgg tgcggcgatt 7860 cgccacaatg acatcgacgc gctccttaaa ggaattgatg tcgcgctcga cgtaggaacc 7920 gaagaagtag ggttctttca ggaccggctc gtacaccaca atctcgatac ccttggcctt 7980 caaacgtttc atgaccccct ggatgctgct ggcccggaaa ttgtcgctac ccgccttcat 8040 gatcaggcga tagataccga ccactttggg cttacgggac aggatgtcct cggccacgaa 8100 gtccttacgg gtcgtattcg catccacgat ggcctggatc aggttttgcg ggacgtcgcg 8160 ataattggcc aacagctgct tcgtatcctt cggcagacag taaccgccgt agccgaagga 8220 cgggttgttg taatgttgac caatgcgcgg atcgagggag acgccttcga tgatttgttt 8280 ggtatccagg ccgtgcacgc tcgcgtaggt gtccagctcg ttaaagtacg cgatacgcat 8340 cgccagatac gtgttcgcga acagtttgat ggcttctgcc tcgggcgaat ccgtcagcag 8400 gatcggaata tcctttttga tggcaccttc cgacaggagt tcggcgaact tccgtgcgcg 8460 ttccgacgat tcgcccacga caatgcggct cggatagaga ttatcataca gggctttgcc 8520 ttcgcgcagg aactccgggg aaaagatgat attattcgtg ttcagatcgc gcttcaggcg 8580 ttcggtgaac ccgacgggga cggtggattt gataatgatg gtcgcgttcg ggttaatgga 8640 cagcacgtca cacgcgacgc tttcgacgct cagggtatca aagttgttat taatcggatc 8700 atagttcgtc ggggtggcga tgatcacgta gtctgcatcg cgatatgcct cgtatttttc 8760 cgtcgtcgcg tagaggttca gcttacgatt ggagagaaac ttctggattt ccgggtcgca 8820 aatcggcgag attttcttgt taatgagctg gaccttcttc gggtcgatgt ccagggcgat 8880 gatgtcgtgt ttttgggaga ggaggatcgc aatgctgata cccacatagc cgacgccggc 8940 cacggcaatt ttcatttatt aacctcctta agtgaattca aactagttta caagtcgttt 9000 tcgatcttct cccaggtata tttgcgacat tcattcaagt tggtcagcgg cgagtatttg 9060 tactttttga taccgaggcg cgacaggctt tcgttcacca ccttgaaatg gttttccttt 9120 tggatgtcca gtttcttgat cgacgtgttc tcgccgtgca ggacacggtt gtagcaaatc 9180 ttattgatat gcttaaacgg gccgacttcg ctgagtttca aatacatatc gtaatccacc 9240 gcattgctga tgctctcgtt gaagccttcg gtgaggttcc atgcacgcgc cgtgaacata 9300 cggaagtggt ggcagatcat cgcgctcgtg agcttttcgc ggctgtaaat cggccagttg 9360 tagccattgc taatcaagtt accttcacga tcaatattgc gattggtggt gtacacgcag 9420 gcgaggctca ggtctttgcg aaattcatcc agacacagtt ccacggcatc gggctccagg 9480 aaatcatcgg aatccagctg cccgatgtag aaaccccggc acaggcggac tgcggtattc 9540 gaggcggagc cgatgccttt gtttttctgg ctgatgaaac ggacgcgcgg gtggtttgcg 9600 taatgttctt gcaggatgcg cagcgtatca tcggtgctcc cgtcatcgca gatgcagacc 9660 tccagatcgg tgatcgtttg gttcagtgcc gattcgacgc agcgcacgat atatttgctg 9720 caattatacg cggggatgta gatgctcacc aggggcacac gtttcagggt ggcgctctcg 9780 attttctcct tcttgcgata aaagtagggc accttctgct gcaacagctg gacggtaatg 9840 tttttacctg ccgcgcgatc ggtttcgttc tccttaccgg gcggttcctg atgatatgcc 9900 atcgcgcctt ccacgctacg gaaataacaa ccctcgcggt acagccgata gccgaactca 9960 ttatcctcac cgccccaatg cgtgaactct tcgtcaaacc aacccgcgcg aaacagccac 10020 ttctttgcaa acgccacatt gccaccgcta aagaaccgga acggggtgtt gcacaggcgc 10080 agattgtcgg tattcttgaa atgttcgatg cgccaatcga cggatttgtt ctgctcgacc 10140 ttgcctgcga cctgattatt ggtaataatc tccgggattt cattgatcag gcttttctgg 10200 gacaaaaagt ccagataggt atgcttcgac gtgtcgatgt atttacgcgg gccaatcagt 10260 gccacgttat catccacggc caggagttcc atataggact gcacccacaa cgggttcggc 10320 gccatatcgc agtccaagat cgccacgtag ttgtatttcg ctgcccgcag gcccaggttc 10380 cgcacggcgc acagctggta gccgtagtct ttctggcgga cgtatttgat gttcagcaac 10440 gactcgaact cgcggacgat ctcttcgatg ttttccttgg aaccgtcatc cgcgacgatg 10500 acctcatagt cataaatcgt tttctgattg cagaggcagg ccagggtgat cgccaggatt 10560 ttggcgcgat tgtacgtcgg aatcacgatg gacaggccgt cgatgatcag ttgcttgcgc 10620 ggataatcat ccagttcttt acgtttccct gcccagacgt agtcgttcgt gctttccggc 10680 agcggcggca aggtcaggtc gctcggccaa tccagcggaa tgggttcgac ttctttcaat 10740 tcggcgcgct cggatttctt tgcggtaatt tcccgatatt tgctaatgat ttcattcttt 10800 tccacctcat tcagcgagat cgcctttgca ttgctgcaca taattttggt tgccgcgtcg 10860 atatcaatga ccgctttccg attcagcttg tccacttctt cgctcagatt cagggcggtt 10920 tggcacagct tgatattggc ttccacccag ctcacatcat agatttccgc cactttttca 10980 aacagggaga gggcttggcg gtagttctta ttcttataca gattgattgc ctggttcaaa 11040 atgctcattt attaacctcc tactagtgaa ttttcgaatt acttaccgca gtacttgaca 11100 cccacctggg aattgttttt ggtgcgtttg aattggcgga tggtacggta gatgctaaag 11160 ggcaggctga tcagaccgag cggaaaattg ttcttattga tgatgagctt gcccagctga 11220 tagctcaggt gtttcttgac ccgttcggct tcgtgtttat ccgcgtacag gaagatgctc 11280 ggcaggctca cttggtactc cgaatcatat ttcttcttcc aggtccgcca ttcgctgatc 11340 aacgcaaacg gaatcgagat cagaccgagg aacgtcttgg agcggctcac catcaccgca 11400 cccaggcggt agccgatatc ttgcttgatg cgttcggccg caccatacag ctccggcagt 11460 tgtttctttt cgagacgttg attgtcgatg aagtactgtt cgagcttttg ctgcaccaga 11520 tgcagctgat tgagcagcaa ttctttttcg cacgacagct tttcgaggcg ctgttgttgc 11580 agttcatttt tgttctgttc ctttttcagc agggactcga agttctcgat cgcgcactcc 11640 agttcctgga cctggatggt tttgttttta atgatcagat catactggat cagttcttcc 11700 ttgctatccg acagctcttt cagaatggct tgataggcgt tcagctgttt ggacgtgtgc 11760 agttcgttgt ccagaatgat ctttttgctg ctctggtaca gaccgttcac gatatcgagg 11820 gtgatctggc gttgtttaat gaacgtctcc caaataaagg acggcttata gttttccttc 11880 tccagcaccc gcaagggggt gttggcgttc gattgcaatt caaagtacag ttccttgcaa 11940 tcgggatagt cgttcaggac gttgaagatc aagtactcct ccgtctcgct ttgcttgaaa 12000 atgatatccc cggtcccgat gtcaataccg ctgagggaca tgatctcctg atgttctttt 12060 tccagcgtaa tggaggcttc ggcggtctta aagtcattca cgctctgctc cagcgagtgg 12120 ttgatggtat tggagaacga caacccgaat ttcagtttca gtttgtgttg cagttgctgg 12180 atgcagtcct cggcgttgcg cttcacctgt tcgctcgaca ccagcaggca ccgaccccgg 12240 ttgttgagga agaagtgcag caaggcggtg ttgtatgcca gccagttttt gatcagatgc 12300 tccgaggtat agttgctgga gatgttctgg tccgagaagt agttcgtcag gatgcttttg 12360 gggtggtcgt agatgaggat aaaggtgatg ttctcatcca ccgatttcca atattccaac 12420 gtgtgaattg cgttggggtc gctccaaccg cacagtttct ggttcaggtt ggacagcatc 12480 agatccaatg cgataccgtt ccagacggtg ctcacatgga gcggttcaaa gtcggcggaa 12540 tcggtcaccg tatagatgtc cggcgactgg tacgccttcc gcagcgtctg ggtgatgtcc 12600 tggggcgaga ggttctcacg tttggacggg cacagggagt tcatgccgcg ctgatgcagg 12660 agttcttcca cgatttggta gttgctgctc ggatggccca cgatcaccag gcggttcatt 12720 tattaacctc ctttcgaaaa tgaacggtcc gttaaatata gccattcgga ttcttcatct 12780 gccagcgcca ggcgtcctcc agcatggttt cgagttcccg cttggctttc cagttcagat 12840 atttgttggc cttttcgggg gaggaccagc tctccgcgat atcaccgtca cggcggctca 12900 cgatttcata cggaatccgc acgccggaaa tcttttcaaa ggtggacacc agttccagca 12960 ccgaataacc tttacccgtg cccaaattaa agacgtggta gttggtgtta ttgtcgcgga 13020 agagatagga cagcgctgcg acgtgccctt cggccaggtc catcacatgg atatagtcac 13080 ggacccccgt gccgtctttg gtgggataat caccaccgaa caccatcagt ttttccagtt 13140 tccccatcgc gacctgcaag atgtacggca ccaagttgga ggggatgtct gccgggcttt 13200 caccaatcat accggattcg tgggcgcccg tcggattaaa gtagcgcaag cagaggaaat 13260 tcgtgtcgga gtatttcttg gcgatgtcgc ggatcatcag ctccgagatg tacttggacg 13320 taccatacgg attcagcgtg ccaccaatat ggcagtcttc ggtgacgggc atgatcttgc 13380 tttccccata caccgtcgcc gacgagctaa agatgaagtt ggcgacgtcg ttcttgatgg 13440 cgcaattgat gagttgcagg gtgccgctca cgttgttgtc atagtagaag atgggcttga 13500 tcaggctttc tgcgaccgat ttcgcacctg caaagtgcat gatgcagtcg aatttgtgtt 13560 tcttcaggat ctggttcact tccttctcgt tgttgatatt gagttcgtag aacgtgactt 13620 tcttctttgc gatcagctca atgcgacgga tgctttcgca gctgctgttg atgagattgt 13680 caatgatgac gacattgtag cctttgttca gcaggcagag cgacgtgtgg ctgccgatgt 13740 agcctgcacc gccggtgacc aggatgttca tttattaacc tcctcggtcc gaattaacct 13800 aggttatgag gtcagcattg cttcttcacg cggtgttaat taatagacct gcaggattat 13860 tgtttctgtt gcataaagcc taaggggtag gcctttctag agatagccat tttttgcact 13920 cctgtatccg cttcttgcaa ggctggactt atccctatca aaccggacac tgcaggctga 13980 caagctttca ttacatatga agagtttgta gaaacgcaaa aaggccatcc gtcaggatgg 14040 ccttctaaga aggctcgagc ttcatccacc acatacaggc cgtagcggtc gcacagcgtg 14100 taccacagcg gatggttcgg ataatgcgaa cagcgcacgg cgttaaagtt gttctgcttc 14160 atcagcagga tatcctgcac catcgtctgc tcatccatga cctgaccatg cagaggatga 14220 tgctcgtgac ggttaacgcc tcgaatcagc aacggcttgc cgttcagcag cagcagacca 14280 ttttcaatcc gcacctcgcg gaaaccgaca tcgcaggctt ctgcttcaat cagcgtgccg 14340 tcggcggtgt gcagttcaac caccgcacga tagagattcg ggatttcggc gctccacagt 14400 ttcgggtttt cgacgttcag acgtagtgtg acgcgatcgg cataaccacc acgctcatcg 14460 ataatttcac cgccgaaagg cgcggtgccg ctggcgacct gcgtttcacc ctgccataaa 14520 gaaactgtta cccgtaggta gtcacgcaac tcgccgcaca tctgaacttc agcctccagt 14580 acagcgcggc tgaaatcatc attaaagcga gtggcaacat ggaaatcgct gatttgtgta 14640 gtcggtttat gcagcaacga gacgtcacgg aaaatgccgc tcatccgcca catatcctga 14700 tcttccagat aactgccgtc actccagcgc agcaccatca ccgcgaggcg gttttctccg 14760 gcgcgtaaaa atgcgctcag gtcaaattca gacggcaaac gactgtcctg gccgtaaccg 14820 acccagcgcc cgttgcacca cagatgaaac gccgagttaa cgccatcaaa aataattcgc 14880 gtctggcctt cctgtagcca gctttcatca acattaaatg tgagcgagta acaacccgtt 14940 tattagcggc cgctaatgaa tcggccaacg cgcggggaga ggcggtttgc gtattggcac 15000 cattccttgc ggcggcggtg ctcaacggcc tcaacctact actgggctgc ttcctaatgc 15060 aggagtcgca taagggagag cgtc 15084 <210> 172 <211> 14763 <212> DNA <213> Artificial Sequence <220> <223> synthetic plasmid pBR1101 <400> 172 gatccccgac agtaagacgg gtaagcctgt tgatgatacc gctgccttac tgggtgcatt 60 agccagtctg aatgacctgt cacgggataa tccgaagtgg tcagactgga aaatcagagg 120 gcaggaactg ctgaacagca aaaagtcaga tagcaccaca tagcagaccc gccataaaac 180 gccctgagaa gcccgtgacg ggcttttctt gtattatggg tagtttcctt gcatgaatcc 240 ataaaaggcg cctgtagtgc catttacccc cattcactgc cagagccgtg agcgcagcga 300 actgaatgtc acgaaaaaga cagcgactca ggtgcctgat ggtcggagac aaaaggaata 360 ttcagcgatt tgcccgagct tgcgagggtg ctacttaagc ctttagggtt ttaaggtctg 420 ttttgtagag gagcaaacag cgtttgcgac atccttttgt aatactgcgg aactgactaa 480 agtagtgagt tatacacagg gctgggatct attcttttta tcttttttta ttctttcttt 540 attctataaa ttataaccac ttgaatataa acaaaaaaaa cacacaaagg tctagcggaa 600 tttacagagg gtctagcaga atttacaagt tttccagcaa aggtctagca gaatttacag 660 atacccacaa ctcaaaggaa aaggactagt aattatcatt gactagccca tctcaattgg 720 tatagtgatt aaaatcacct agaccaattg agatgtatgt ctgaattagt tgttttcaaa 780 gcaaatgaac tagcgattag tcgctatgac ttaacggagc atgaaaccaa gctaatttta 840 tgctgtgtgg cactactcaa ccccacgatt gaaaacccta caaggaaaga acggacggta 900 tcgttcactt ataaccaata cgttcagatg atgaacatca gtagggaaaa tgcttatggt 960 gtattagcta aagcaaccag agagctgatg acgagaactg tggaaatcag gaatcctttg 1020 gttaaaggct ttgagatttt ccagtggaca aactatgcca agttctcaag cgaaaaatta 1080 gaattagttt ttagtgaaga gatattgcct tatcttttcc agttaaaaaa attcataaaa 1140 tataatctgg aacatgttaa gtcttttgaa aacaaatact ctatgaggat ttatgagtgg 1200 ttattaaaag aactaacaca aaagaaaact cacaaggcaa atatagagat tagccttgat 1260 gaatttaagt tcatgttaat gcttgaaaat aactaccatg agtttaaaag gcttaaccaa 1320 tgggttttga aaccaataag taaagattta aacacttaca gcaatatgaa attggtggtt 1380 gataagcgag gccgcccgac tgatacgttg attttccaag ttgaactaga tagacaaatg 1440 gatctcgtaa ccgaacttga gaacaaccag ataaaaatga atggtgacaa aataccaaca 1500 accattacat cagattccta cctacataac ggactaagaa aaacactaca cgatgcttta 1560 actgcaaaaa ttcagctcac cagttttgag gcaaaatttt tgagtgacat gcaaagtaag 1620 tatgatctca atggttcgtt ctcatggctc acgcaaaaac aacgaaccac actagagaac 1680 atactggcta aatacggaag gatctgaggt tcttatggct cttgtatcta tcagtgaagc 1740 atcaagacta acaaacaaaa gtagaacaac tgttcaccgt tacatatcaa agggaaaact 1800 gtccatatgc acagatgaaa acggtgtaaa aaagatagat acatcagagc ttttacgagt 1860 ttttggtgca tttaaagctg ttcaccatga acagatcgac aatgtaacag atgaacagca 1920 tgtaacacct aatagaacag gtgaaaccag taaaacaaag caactagaac atgaaattga 1980 acacctgaga caacttgtta cagctcaaca gtcacacata gacagcctga aacaggcgat 2040 gctgcttatc gaatcaaagc tgccgacaac acgggagcca gtgacgcctc ccgtggggaa 2100 aaaatcatgg caattctgga agaaatagcg ctttcagccg gcaaaccggc tgaagccgga 2160 tctgcgattc tgataacaaa ctagcaacac cagaacagcc cgtttgcggg cagcaaaacc 2220 cgtacttttg gacgttccgg cggttttttg tggcgagtgg tgttcgggcg gtgcgcgcaa 2280 gatccattat gttaaacggg cgagtttaca tctcaaaacc gcccgcttaa caccatcaga 2340 aatcctcagc gcgattttaa gcaccaaccc ccccccgtaa cacccaaatc catactgaaa 2400 gtggctttgt tgaataaatc gaacttttgc tgagttgaag gatcagatca cgcatcctcc 2460 cgacaacaca gaccattccg tggcaaagca aaagttcaga atcaccaact ggtccaccta 2520 caacaaagct ctcatcaacc gtggctccct cactttctgg ctggatgatg aggcgattca 2580 ggcctggtat gagtcggcaa caccttcatc acgaggaagg ccccagcgct attctgatct 2640 cgccatcacc accgttctgg tgattaaacg cgtattccgg ctgaccctgc gggctgcgca 2700 gggttttatt gattccattt ttgccctgat gaacgttccg ttgcgctgcc cggattacac 2760 cagtgtcagt aagcgggcaa agtcggttaa tgtcagtttc aaaacgtcca cccggggtga 2820 aatcgcacac ctggtgattg attccaccgg gctgaaggtc tttggtgaag gcgaatggaa 2880 agtcagaaag cacggcaaag agcgccgtcg tatctggcga aagttgcatc ttgctgtggg 2940 gatcaacacg ggataatacc gcgccacata gcagaacttt aaaagtgctc atcattggaa 3000 aacgttcttc ggggcgaaaa ctctcaagga tcttaccgct gttgagatcc agttcgatgt 3060 aacccactcg tgcacccaac tgatcttcag catcttttac tttcaccagc gtttctgggt 3120 gagcaaaaac aggaaggcaa aatgccgcaa aaaagggaat aagggcgaca cggaaatgtt 3180 gaatactcat actcttcctt tttcaatatt attgaagcat ttatcagggt tattgtctca 3240 tgagcggata catatttgaa tgtatttaga aaaataaaca aataggggtt ccgcgcacat 3300 ttccccgaaa agtgccacct gacgtctaag aaaccattat tatcatgaca ttaacctata 3360 aaaataggcg tatcacgagg ccctttcgtc ttcgaataaa tacctgtgac ggaagatcac 3420 ttcgcagaat aaataaatcc tggtgtccct gttgataccg ggaagccctg ggccaacttt 3480 tggcgaaaat gagacgttga tcggcacgta agaggttcca actttcacca taatgaaata 3540 agatcactac cgggcgtatt ttttgagtta tcgagatttt caggagctaa ggaagctaaa 3600 atggagaaaa aaatcactgg atataccacc gttgatatat cccaatggca tcgtaaagaa 3660 cattttgagg catttcagtc agttgctcaa tgtacctata accagaccgt tcagctggat 3720 attacggcct ttttaaagac cgtaaagaaa aataagcaca agttttatcc ggcctttatt 3780 cacattcttg cccgcctgat gaatgctcat ccggaattcc gtatggcaat gaaagacggt 3840 gagctggtga tatgggatag tgttcaccct tgttacaccg ttttccatga gcaaactgaa 3900 acgttttcat cgctctggag tgaataccac gacgatttcc ggcagtttct acacatatat 3960 tcgcaagatg tggcgtgtta cggtgaaaac ctggcctatt tccctaaagg gtttattgag 4020 aatatgtttt tcgtctcagc caatccctgg gtgagtttca ccagttttga tttaaacgtg 4080 gccaatatgg acaacttctt cgcccccgtt ttcaccatgg gcaaatatta tacgcaaggc 4140 gacaaggtgc tgatgccgct ggcgattcag gttcatcatg ccgtttgtga tggcttccat 4200 gtcggcagaa tgcttaatga attacaacag tactgcgatg agtggcaggg cggggcgtaa 4260 tttttttaag gcagttattg gtgcccttaa acgcctggtt gctacgcctg aataagtgat 4320 aataagcgga tgaatggcag aaattcgaaa gcaaattcga cccggtcgtc ggttcagggc 4380 agggtcgtta aatagccgct tatgtctatt gctggtttac cggtttattg actaccggaa 4440 gcagtgtgac cgtgtgcttc tcaaatgcct gaggccagtt tgctcaggct ctccccgtgg 4500 aggtaataat tgacgatatg atcatttatt ctgcctccca gagcctgata aaaacggtga 4560 atccgttagc gaggtgccgc cggcttccat tcaggtcgag gtggcccggc tccatgcacc 4620 gcgacgcaac gcggggaggc agacaaggta tagggcggcg cctacaatcc atgccaaccc 4680 gttccatgtg ctcgccgagg cggcataaat cgccgtgacg atcagcggtc caatgatcga 4740 agttaggctg gtaagagccg cgagcgatcc ttgaagctgt ccctgatggt cgtcatctac 4800 ctgcctggac agcatggcct gcaacgcggg catcccgatg ccgccggaag cgagaagaat 4860 cataatgggg aaggccatcc agcctcgcgt cgcgaacgcc agcaagacgt agcccagcgc 4920 gtcggccgcc atgccggcga taatggcctg cttctcgccg aaacgtttgg tggcgggacc 4980 agtgacgaag gcttgagcga gggcgtgcaa gattccgaat accgcaagcg acaggccatg 5040 tttgacagct tatcatcgaa gcttagactc acccagataa gtcggggtca gtttttcacg 5100 atccagcatc gcctgaacgt attccggctc aacgtaaccg cctttcacca gctgctcgcc 5160 agcaaaacga atcgcttctt ctttggttgc cgctttgcga ccgaggaaga tgttctccgc 5220 gcctagcttg aacaggttag cactggaatc gtcaaagctg tctttcaggc tgtcttttac 5280 tttctcttcg tttgccgtgt ggcgttgggc agcaaccaga cgttcggtca ggctggtgta 5340 caggccgctg tcgaggaagt tggtcagcga aatatgctgt gcctgcggaa cctggcgcat 5400 agcgcgttcg gtcaggtcac ggtgagtgat gacgaggtcc acatctggcg gcaggttgtt 5460 gatcgcgctg ttagtaacag aaatctgcga cagacctgca tcctgaattt tcttacgcag 5520 aacgcctgcg cccatcgcac tggaacccat accggcgtca caggcaacga tgattttacg 5580 tacgtggctc aggtcgttag tcacatcgcc agcagacagc ggagatgcgc ctttagactc 5640 agctttcatg tcctgcatac gacgagttgc tgcttcaata tcatcttctt ctttcacttt 5700 gctggttttc agcaaaatag cagagacaac gaaggagaca gccatcgccg cacacacacc 5760 cgcgatgtta gcgaagtaag caccttttgg tgtcatcgct tagatcttag tcgacgttag 5820 gcgcgccaga gctcatcgtt aatgtcttcg tgcgccgtca gtcggcgcac gttttttctc 5880 tctggtaccg tgtcactgat ctagtcaatt actcgaagta tccacaagtg aagcatacta 5940 agtaatgtac aagaatcaaa aaaatcggct acgcaagtcg cgtagccgaa tcatttaagg 6000 atccagtgta atcgattgat agatttaaat aagaactgca gaagctagct tagatgctcg 6060 tgaaattgac gtgggcgctt tgcagggccg tcttaatggc gttggtgtcc acgaggatcg 6120 agtcgggtgc ggaaaacgga cggttcttgt tggtgaaatc gctgttacca atgtacagcg 6180 attccttgtt acgcagcgcc tggatgtgcc agcgggacca cgaatcccaa tacttctggc 6240 gatccggcga gataccttgg ctggtgtagc cggtcgtcgg gctgttcatc aacgagtcgg 6300 tgcggtgcga gcccagcgtc agcggcaact tgatccgatg caccgtggaa tcgccgaaga 6360 tcagcttcag acgcgcgata aattcgctat ccgcacccgt tttcacacaa tcccagacac 6420 cggccttctg caagacgtcg gcacggcgaa acaggagcga cgacggattc agacgcttca 6480 aggggtacac tgcgcgggca tagaaaatac cgttgtcttg caggcgcacc cagtccgaga 6540 tggagcagat gagcttcgga ttgagcaaca agggggagat ttggcggaac agcttttccg 6600 gatggctcca gtcatccgaa tcgtggcagg tgacgaactc gcccttcgct tggatcaagc 6660 cgatacgctt cgcggcatag gtgccgacat tctgcggcag gctaatgatc ttgatgcgcg 6720 tgtctttgag ggcgagccgc tggagacgaa acagggtgtc atcggtgctc gcgtcatcca 6780 caatgatcag ctcgaaggaa cggtaggtct gattgaggag cgaaatcacc gcattttcca 6840 cgcggcgacc cgtattatag gtggtcatca ggatggagat caacggcccc gtctgggccg 6900 ggtacgggat gctggtgatg atgttgcacg gggagagcgg ggagctgttg tccgtcaagg 6960 ccacggggct gaggccgaag tatttatagt attcattcag ccgattcagg ctaatttcgg 7020 cggtttcgcg gaaggcgtta ttttgcagca gcaggatatc cgggctatag acgatatcgg 7080 atgcgtcgat ctgggcgagg gtcgagatgg ccttttgggt caggccgatc cggagttgca 7140 gtgcggtata caggtccagc gggcagttgt ccacgttgtc caacaggctc aggctaaagg 7200 tcggcgagta ggacgccagg gttttcgcca gttccacttt ctgatgggta tcggtgaact 7260 cgtccttgaa ctccatcagc agctcgggcg tcaggctgat gtcgccgcag gcgatttttg 7320 cgatcttgat tgccagtttg cagcgccaat cggacggggt atccgtcaag ttatgcagcg 7380 accagtacat attcagacga tacatcgcga ggatgcgttt cgactgccag aaccggcaat 7440 catcctggat ggccgcgagc gcgtggacgt agcggctctt tttgagcagc cacaagaatt 7500 tgagattatt gaacatttat taacctcctg ctagcaactt aagttacgaa tcgacgccga 7560 acaggtcgcg ggtgtagact ttctccgaga catcttccag ttcgctggtg cggcgattcg 7620 ccacaatgac atcgacgcgc tccttaaagg aattgatgtc gcgctcgacg taggaaccga 7680 agaagtaggg ttctttcagg accggctcgt acaccacaat ctcgataccc ttggccttca 7740 aacgtttcat gaccccctgg atgctgctgg cccggaaatt gtcgctaccc gccttcatga 7800 tcaggcgata gataccgacc actttgggct tacgggacag gatgtcctcg gccacgaagt 7860 ccttacgggt cgtattcgca tccacgatgg cctggatcag gttttgcggg acgtcgcgat 7920 aattggccaa cagctgcttc gtatccttcg gcagacagta accgccgtag ccgaaggacg 7980 ggttgttgta atgttgacca atgcgcggat cgagggagac gccttcgatg atttgtttgg 8040 tatccaggcc gtgcacgctc gcgtaggtgt ccagctcgtt aaagtacgcg atacgcatcg 8100 ccagatacgt gttcgcgaac agtttgatgg cttctgcctc gggcgaatcc gtcagcagga 8160 tcggaatatc ctttttgatg gcaccttccg acaggagttc ggcgaacttc cgtgcgcgtt 8220 ccgacgattc gcccacgaca atgcggctcg gatagagatt atcatacagg gctttgcctt 8280 cgcgcaggaa ctccggggaa aagatgatat tattcgtgtt cagatcgcgc ttcaggcgtt 8340 cggtgaaccc gacggggacg gtggatttga taatgatggt cgcgttcggg ttaatggaca 8400 gcacgtcaca cgcgacgctt tcgacgctca gggtatcaaa gttgttatta atcggatcat 8460 agttcgtcgg ggtggcgatg atcacgtagt ctgcatcgcg atatgcctcg tatttttccg 8520 tcgtcgcgta gaggttcagc ttacgattgg agagaaactt ctggatttcc gggtcgcaaa 8580 tcggcgagat tttcttgtta atgagctgga ccttcttcgg gtcgatgtcc agggcgatga 8640 tgtcgtgttt ttgggagagg aggatcgcaa tgctgatacc cacatagccg acgccggcca 8700 cggcaatttt catttattaa cctccttaag tgaattcaaa ctagtttaca agtcgttttc 8760 gatcttctcc caggtatatt tgcgacattc attcaagttg gtcagcggcg agtatttgta 8820 ctttttgata ccgaggcgcg acaggctttc gttcaccacc ttgaaatggt tttccttttg 8880 gatgtccagt ttcttgatcg acgtgttctc gccgtgcagg acacggttgt agcaaatctt 8940 attgatatgc ttaaacgggc cgacttcgct gagtttcaaa tacatatcgt aatccaccgc 9000 attgctgatg ctctcgttga agccttcggt gaggttccat gcacgcgccg tgaacatacg 9060 gaagtggtgg cagatcatcg cgctcgtgag cttttcgcgg ctgtaaatcg gccagttgta 9120 gccattgcta atcaagttac cttcacgatc aatattgcga ttggtggtgt acacgcaggc 9180 gaggctcagg tctttgcgaa attcatccag acacagttcc acggcatcgg gctccaggaa 9240 atcatcggaa tccagctgcc cgatgtagaa accccggcac aggcggactg cggtattcga 9300 ggcggagccg atgcctttgt ttttctggct gatgaaacgg acgcgcgggt ggtttgcgta 9360 atgttcttgc aggatgcgca gcgtatcatc ggtgctcccg tcatcgcaga tgcagacctc 9420 cagatcggtg atcgtttggt tcagtgccga ttcgacgcag cgcacgatat atttgctgca 9480 attatacgcg gggatgtaga tgctcaccag gggcacacgt ttcagggtgg cgctctcgat 9540 tttctccttc ttgcgataaa agtagggcac cttctgctgc aacagctgga cggtaatgtt 9600 tttacctgcc gcgcgatcgg tttcgttctc cttaccgggc ggttcctgat gatatgccat 9660 cgcgccttcc acgctacgga aataacaacc ctcgcggtac agccgatagc cgaactcatt 9720 atcctcaccg ccccaatgcg tgaactcttc gtcaaaccaa cccgcgcgaa acagccactt 9780 ctttgcaaac gccacattgc caccgctaaa gaaccggaac ggggtgttgc acaggcgcag 9840 attgtcggta ttcttgaaat gttcgatgcg ccaatcgacg gatttgttct gctcgacctt 9900 gcctgcgacc tgattattgg taataatctc cgggatttca ttgatcaggc ttttctggga 9960 caaaaagtcc agataggtat gcttcgacgt gtcgatgtat ttacgcgggc caatcagtgc 10020 cacgttatca tccacggcca ggagttccat ataggactgc acccacaacg ggttcggcgc 10080 catatcgcag tccaagatcg ccacgtagtt gtatttcgct gcccgcaggc ccaggttccg 10140 cacggcgcac agctggtagc cgtagtcttt ctggcggacg tatttgatgt tcagcaacga 10200 ctcgaactcg cggacgatct cttcgatgtt ttccttggaa ccgtcatccg cgacgatgac 10260 ctcatagtca taaatcgttt tctgattgca gaggcaggcc agggtgatcg ccaggatttt 10320 ggcgcgattg tacgtcggaa tcacgatgga caggccgtcg atgatcagtt gcttgcgcgg 10380 ataatcatcc agttctttac gtttccctgc ccagacgtag tcgttcgtgc tttccggcag 10440 cggcggcaag gtcaggtcgc tcggccaatc cagcggaatg ggttcgactt ctttcaattc 10500 ggcgcgctcg gatttctttg cggtaatttc ccgatatttg ctaatgattt cattcttttc 10560 cacctcattc agcgagatcg cctttgcatt gctgcacata attttggttg ccgcgtcgat 10620 atcaatgacc gctttccgat tcagcttgtc cacttcttcg ctcagattca gggcggtttg 10680 gcacagcttg atattggctt ccacccagct cacatcatag atttccgcca ctttttcaaa 10740 cagggagagg gcttggcggt agttcttatt cttatacaga ttgattgcct ggttcaaaat 10800 gctcatttat taacctccta ctagtgaatt ttcgaattac ttaccgcagt acttgacacc 10860 cacctgggaa ttgtttttgg tgcgtttgaa ttggcggatg gtacggtaga tgctaaaggg 10920 caggctgatc agaccgagcg gaaaattgtt cttattgatg atgagcttgc ccagctgata 10980 gctcaggtgt ttcttgaccc gttcggcttc gtgtttatcc gcgtacagga agatgctcgg 11040 caggctcact tggtactccg aatcatattt cttcttccag gtccgccatt cgctgatcaa 11100 cgcaaacgga atcgagatca gaccgaggaa cgtcttggag cggctcacca tcaccgcacc 11160 caggcggtag ccgatatctt gcttgatgcg ttcggccgca ccatacagct ccggcagttg 11220 tttcttttcg agacgttgat tgtcgatgaa gtactgttcg agcttttgct gcaccagatg 11280 cagctgattg agcagcaatt ctttttcgca cgacagcttt tcgaggcgct gttgttgcag 11340 ttcatttttg ttctgttcct ttttcagcag ggactcgaag ttctcgatcg cgcactccag 11400 ttcctggacc tggatggttt tgtttttaat gatcagatca tactggatca gttcttcctt 11460 gctatccgac agctctttca gaatggcttg ataggcgttc agctgtttgg acgtgtgcag 11520 ttcgttgtcc agaatgatct ttttgctgct ctggtacaga ccgttcacga tatcgagggt 11580 gatctggcgt tgtttaatga acgtctccca aataaaggac ggcttatagt tttccttctc 11640 cagcacccgc aagggggtgt tggcgttcga ttgcaattca aagtacagtt ccttgcaatc 11700 gggatagtcg ttcaggacgt tgaagatcaa gtactcctcc gtctcgcttt gcttgaaaat 11760 gatatccccg gtcccgatgt caataccgct gagggacatg atctcctgat gttctttttc 11820 cagcgtaatg gaggcttcgg cggtcttaaa gtcattcacg ctctgctcca gcgagtggtt 11880 gatggtattg gagaacgaca acccgaattt cagtttcagt ttgtgttgca gttgctggat 11940 gcagtcctcg gcgttgcgct tcacctgttc gctcgacacc agcaggcacc gaccccggtt 12000 gttgaggaag aagtgcagca aggcggtgtt gtatgccagc cagtttttga tcagatgctc 12060 cgaggtatag ttgctggaga tgttctggtc cgagaagtag ttcgtcagga tgcttttggg 12120 gtggtcgtag atgaggataa aggtgatgtt ctcatccacc gatttccaat attccaacgt 12180 gtgaattgcg ttggggtcgc tccaaccgca cagtttctgg ttcaggttgg acagcatcag 12240 atccaatgcg ataccgttcc agacggtgct cacatggagc ggttcaaagt cggcggaatc 12300 ggtcaccgta tagatgtccg gcgactggta cgccttccgc agcgtctggg tgatgtcctg 12360 gggcgagagg ttctcacgtt tggacgggca cagggagttc atgccgcgct gatgcaggag 12420 ttcttccacg atttggtagt tgctgctcgg atggcccacg atcaccaggc ggttcattta 12480 ttaacctcct ttcgaaaatg aacggtccgt taaatatagc cattcggatt cttcatctgc 12540 cagcgccagg cgtcctccag catggtttcg agttcccgct tggctttcca gttcagatat 12600 ttgttggcct tttcggggga ggaccagctc tccgcgatat caccgtcacg gcggctcacg 12660 atttcatacg gaatccgcac gccggaaatc ttttcaaagg tggacaccag ttccagcacc 12720 gaataacctt tacccgtgcc caaattaaag acgtggtagt tggtgttatt gtcgcggaag 12780 agataggaca gcgctgcgac gtgcccttcg gccaggtcca tcacatggat atagtcacgg 12840 acccccgtgc cgtctttggt gggataatca ccaccgaaca ccatcagttt ttccagtttc 12900 cccatcgcga cctgcaagat gtacggcacc aagttggagg ggatgtctgc cgggctttca 12960 ccaatcatac cggattcgtg ggcgcccgtc ggattaaagt agcgcaagca gaggaaattc 13020 gtgtcggagt atttcttggc gatgtcgcgg atcatcagct ccgagatgta cttggacgta 13080 ccatacggat tcagcgtgcc accaatatgg cagtcttcgg tgacgggcat gatcttgctt 13140 tccccataca ccgtcgccga cgagctaaag atgaagttgg cgacgtcgtt cttgatggcg 13200 caattgatga gttgcagggt gccgctcacg ttgttgtcat agtagaagat gggcttgatc 13260 aggctttctg cgaccgattt cgcacctgca aagtgcatga tgcagtcgaa tttgtgtttc 13320 ttcaggatct ggttcacttc cttctcgttg ttgatattga gttcgtagaa cgtgactttc 13380 ttctttgcga tcagctcaat gcgacggatg ctttcgcagc tgctgttgat gagattgtca 13440 atgatgacga cattgtagcc tttgttcagc aggcagagcg acgtgtggct gccgatgtag 13500 cctgcaccgc cggtgaccag gatgttcatt tattaacctc ctcggtccga attaacctag 13560 gttatgaggt cagcattgct tcttcacgcg gtgttaatta atagacctgc aggattattg 13620 tttctgttgc ataaagccta aggggtaggc ctttctagag atagccattt tttgcactcc 13680 tgtatccgct tcttgcaagg ctggacttat ccctatcaaa ccggacactg caggctgaca 13740 agctttcatt acatatgaag agtttgtaga aacgcaaaaa ggccatccgt caggatggcc 13800 ttctaagaag gctcgagcag tacagcaagg atagaacccg gagatgccgg agaaaccaga 13860 ccaccgccca ggatagtcag cgtgaacacg ccagtcatac cgccgaggat gactgcgagg 13920 atcagacgcg gattcatcag cacatacggg aagtagattt cgtggatacc ccccaggaag 13980 tggatgattg ccgcaccgcc cgcagactgt ttagcgctac cacgaccaaa gaacatgtac 14040 gccagcagca cgcccatacc tggacctggg ttagcttcaa tcaggaagaa gattgattta 14100 cccagttcat gggactgctg aatacccagc ggcgagaaga taccgtggtt aatggcgttg 14160 ttgaggaaca ggattttcgc cggttcaaca aagatagacg ccagcggcag catgtcatgg 14220 acaaccatga agttaacgcc cgcagccagc attttggaca gggcttcaac aatcgggcca 14280 atgccgagga atgccagaat agcgaggatc atcccgatga tgcctgcgga gaagttattc 14340 accagcatct caaaaccgga tttgatctta ccgtctaccc agcggtcgaa gtgcttaatg 14400 caccagccgc ccagcggacc tgcaatcata gaaccgagga acatcggcat gtctgcgccg 14460 acgataacgc ccatggtggt gatggcaccg actacgccgc cacgttcgcc gcctaccagc 14520 ttaccaccgg tataaccgat cagcagcggc aggagataag tgatcatcgg cccgaccagc 14580 ttcgccagcg tctcgttcgg taaccaccct gttggaattt attagcggcc gctaatgaat 14640 cggccaacgc gcggggagag gcggtttgcg tattggcacc attccttgcg gcggcggtgc 14700 tcaacggcct caacctacta ctgggctgct tcctaatgca ggagtcgcat aagggagagc 14760 gtc 14763 <210> 173 <211> 29 <212> DNA <213> Artificial Sequence <220> <223> synthetic primer BLR513 <400> 173 tcatcaagct tgtccggaag tgatgaccc 29 <210> 174 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> synthetic primer BLR516 <400> 174 gtagcctcga gcatggtggc gttgtcgatg 30 <210> 175 <211> 5859 <212> DNA <213> Artificial Sequence <220> <223> synthetic plasmid pBR1103 <400> 175 gatccccgac agtaagacgg gtaagcctgt tgatgatacc gctgccttac tgggtgcatt 60 agccagtctg aatgacctgt cacgggataa tccgaagtgg tcagactgga aaatcagagg 120 gcaggaactg ctgaacagca aaaagtcaga tagcaccaca tagcagaccc gccataaaac 180 gccctgagaa gcccgtgacg ggcttttctt gtattatggg tagtttcctt gcatgaatcc 240 ataaaaggcg cctgtagtgc catttacccc cattcactgc cagagccgtg agcgcagcga 300 actgaatgtc acgaaaaaga cagcgactca ggtgcctgat ggtcggagac aaaaggaata 360 ttcagcgatt tgcccgagct tgcgagggtg ctacttaagc ctttagggtt ttaaggtctg 420 ttttgtagag gagcaaacag cgtttgcgac atccttttgt aatactgcgg aactgactaa 480 agtagtgagt tatacacagg gctgggatct attcttttta tcttttttta ttctttcttt 540 attctataaa ttataaccac ttgaatataa acaaaaaaaa cacacaaagg tctagcggaa 600 tttacagagg gtctagcaga atttacaagt tttccagcaa aggtctagca gaatttacag 660 atacccacaa ctcaaaggaa aaggactagt aattatcatt gactagccca tctcaattgg 720 tatagtgatt aaaatcacct agaccaattg agatgtatgt ctgaattagt tgttttcaaa 780 gcaaatgaac tagcgattag tcgctatgac ttaacggagc atgaaaccaa gctaatttta 840 tgctgtgtgg cactactcaa ccccacgatt gaaaacccta caaggaaaga acggacggta 900 tcgttcactt ataaccaata cgttcagatg atgaacatca gtagggaaaa tgcttatggt 960 gtattagcta aagcaaccag agagctgatg acgagaactg tggaaatcag gaatcctttg 1020 gttaaaggct ttgagatttt ccagtggaca aactatgcca agttctcaag cgaaaaatta 1080 gaattagttt ttagtgaaga gatattgcct tatcttttcc agttaaaaaa attcataaaa 1140 tataatctgg aacatgttaa gtcttttgaa aacaaatact ctatgaggat ttatgagtgg 1200 ttattaaaag aactaacaca aaagaaaact cacaaggcaa atatagagat tagccttgat 1260 gaatttaagt tcatgttaat gcttgaaaat aactaccatg agtttaaaag gcttaaccaa 1320 tgggttttga aaccaataag taaagattta aacacttaca gcaatatgaa attggtggtt 1380 gataagcgag gccgcccgac tgatacgttg attttccaag ttgaactaga tagacaaatg 1440 gatctcgtaa ccgaacttga gaacaaccag ataaaaatga atggtgacaa aataccaaca 1500 accattacat cagattccta cctacataac ggactaagaa aaacactaca cgatgcttta 1560 actgcaaaaa ttcagctcac cagttttgag gcaaaatttt tgagtgacat gcaaagtaag 1620 tatgatctca atggttcgtt ctcatggctc acgcaaaaac aacgaaccac actagagaac 1680 atactggcta aatacggaag gatctgaggt tcttatggct cttgtatcta tcagtgaagc 1740 atcaagacta acaaacaaaa gtagaacaac tgttcaccgt tacatatcaa agggaaaact 1800 gtccatatgc acagatgaaa acggtgtaaa aaagatagat acatcagagc ttttacgagt 1860 ttttggtgca tttaaagctg ttcaccatga acagatcgac aatgtaacag atgaacagca 1920 tgtaacacct aatagaacag gtgaaaccag taaaacaaag caactagaac atgaaattga 1980 acacctgaga caacttgtta cagctcaaca gtcacacata gacagcctga aacaggcgat 2040 gctgcttatc gaatcaaagc tgccgacaac acgggagcca gtgacgcctc ccgtggggaa 2100 aaaatcatgg caattctgga agaaatagcg ctttcagccg gcaaaccggc tgaagccgga 2160 tctgcgattc tgataacaaa ctagcaacac cagaacagcc cgtttgcggg cagcaaaacc 2220 cgtacttttg gacgttccgg cggttttttg tggcgagtgg tgttcgggcg gtgcgcgcaa 2280 gatccattat gttaaacggg cgagtttaca tctcaaaacc gcccgcttaa caccatcaga 2340 aatcctcagc gcgattttaa gcaccaaccc ccccccgtaa cacccaaatc catactgaaa 2400 gtggctttgt tgaataaatc gaacttttgc tgagttgaag gatcagatca cgcatcctcc 2460 cgacaacaca gaccattccg tggcaaagca aaagttcaga atcaccaact ggtccaccta 2520 caacaaagct ctcatcaacc gtggctccct cactttctgg ctggatgatg aggcgattca 2580 ggcctggtat gagtcggcaa caccttcatc acgaggaagg ccccagcgct attctgatct 2640 cgccatcacc accgttctgg tgattaaacg cgtattccgg ctgaccctgc gggctgcgca 2700 gggttttatt gattccattt ttgccctgat gaacgttccg ttgcgctgcc cggattacac 2760 cagtgtcagt aagcgggcaa agtcggttaa tgtcagtttc aaaacgtcca cccggggtga 2820 aatcgcacac ctggtgattg attccaccgg gctgaaggtc tttggtgaag gcgaatggaa 2880 agtcagaaag cacggcaaag agcgccgtcg tatctggcga aagttgcatc ttgctgtggg 2940 gatcaacacg ggataatacc gcgccacata gcagaacttt aaaagtgctc atcattggaa 3000 aacgttcttc ggggcgaaaa ctctcaagga tcttaccgct gttgagatcc agttcgatgt 3060 aacccactcg tgcacccaac tgatcttcag catcttttac tttcaccagc gtttctgggt 3120 gagcaaaaac aggaaggcaa aatgccgcaa aaaagggaat aagggcgaca cggaaatgtt 3180 gaatactcat actcttcctt tttcaatatt attgaagcat ttatcagggt tattgtctca 3240 tgagcggata catatttgaa tgtatttaga aaaataaaca aataggggtt ccgcgcacat 3300 ttccccgaaa agtgccacct gacgtctaag aaaccattat tatcatgaca ttaacctata 3360 aaaataggcg tatcacgagg ccctttcgtc ttcgaataaa tacctgtgac ggaagatcac 3420 ttcgcagaat aaataaatcc tggtgtccct gttgataccg ggaagccctg ggccaacttt 3480 tggcgaaaat gagacgttga tcggcacgta agaggttcca actttcacca taatgaaata 3540 agatcactac cgggcgtatt ttttgagtta tcgagatttt caggagctaa ggaagctaaa 3600 atggagaaaa aaatcactgg atataccacc gttgatatat cccaatggca tcgtaaagaa 3660 cattttgagg catttcagtc agttgctcaa tgtacctata accagaccgt tcagctggat 3720 attacggcct ttttaaagac cgtaaagaaa aataagcaca agttttatcc ggcctttatt 3780 cacattcttg cccgcctgat gaatgctcat ccggaattcc gtatggcaat gaaagacggt 3840 gagctggtga tatgggatag tgttcaccct tgttacaccg ttttccatga gcaaactgaa 3900 acgttttcat cgctctggag tgaataccac gacgatttcc ggcagtttct acacatatat 3960 tcgcaagatg tggcgtgtta cggtgaaaac ctggcctatt tccctaaagg gtttattgag 4020 aatatgtttt tcgtctcagc caatccctgg gtgagtttca ccagttttga tttaaacgtg 4080 gccaatatgg acaacttctt cgcccccgtt ttcaccatgg gcaaatatta tacgcaaggc 4140 gacaaggtgc tgatgccgct ggcgattcag gttcatcatg ccgtttgtga tggcttccat 4200 gtcggcagaa tgcttaatga attacaacag tactgcgatg agtggcaggg cggggcgtaa 4260 tttttttaag gcagttattg gtgcccttaa acgcctggtt gctacgcctg aataagtgat 4320 aataagcgga tgaatggcag aaattcgaaa gcaaattcga cccggtcgtc ggttcagggc 4380 agggtcgtta aatagccgct tatgtctatt gctggtttac cggtttattg actaccggaa 4440 gcagtgtgac cgtgtgcttc tcaaatgcct gaggccagtt tgctcaggct ctccccgtgg 4500 aggtaataat tgacgatatg atcatttatt ctgcctccca gagcctgata aaaacggtga 4560 atccgttagc gaggtgccgc cggcttccat tcaggtcgag gtggcccggc tccatgcacc 4620 gcgacgcaac gcggggaggc agacaaggta tagggcggcg cctacaatcc atgccaaccc 4680 gttccatgtg ctcgccgagg cggcataaat cgccgtgacg atcagcggtc caatgatcga 4740 agttaggctg gtaagagccg cgagcgatcc ttgaagctgt ccctgatggt cgtcatctac 4800 ctgcctggac agcatggcct gcaacgcggg catcccgatg ccgccggaag cgagaagaat 4860 cataatgggg aaggccatcc agcctcgcgt cgcgaacgcc agcaagacgt agcccagcgc 4920 gtcggccgcc atgccggcga taatggcctg cttctcgccg aaacgtttgg tggcgggacc 4980 agtgacgaag gcttgagcga gggcgtgcaa gattccgaat accgcaagcg acaggccatg 5040 tttgacagct tatcatcgaa gcttgtccgg aagtgatgac ccaggcgctg aaagtgctgg 5100 atgccgtgcg caaccgcttt gcgatgcgca tcaccaccag ccattacgat gtaggcggcg 5160 cagccattga taaccacggg caaccactgc cgcctgcgac ggttgaaggt tgtgagcaag 5220 ccgatgccgt gctgtttggc tcggtaggcg gcccgaagtg ggaacattta ccaccagacc 5280 agcaaccaga acgcggcgcg ctgctgcctc tgcgtaagca cttcaaatta ttcagcaacc 5340 tgcgcccggc aaaactgtat caggggctgg aagcattctg tccgctgcgt gcagacattg 5400 ccgcaaacgg cttcgacatc ctgtgtgtgc gcgaactgac cggcggcatc tatttcggtc 5460 agccaaaagg ccgcgaaggt agcggacaat atgaaaaagc ctttgatacc gaggtgtatc 5520 accgttttga gatcgaacgt atcgcccgca tcgcgtttga atctgctcgc aagcgtcgcc 5580 acaaagtgac gtcgatcgat aaagccaacg tgctgcaatc ctctatttta tggcgggaga 5640 tcgttaacga gatcgccacg gaatacccgg atgtcgaact ggcgcatatg tacatcgaca 5700 acgccaccat gctcgagtat gcggccgcta atgaatcggc caacgcgcgg ggagaggcgg 5760 tttgcgtatt ggcaccattc cttgcggcgg cggtgctcaa cggcctcaac ctactactgg 5820 gctgcttcct aatgcaggag tcgcataagg gagagcgtc 5859

Claims (64)

  1. kfoA 유전자, kfoC 유전자 및 kfoF 유전자를 포함하되, kfoD, orf3(kfoI), kfoE 및 orf1(kfoH) 중 하나 이상의 기능성 유전자를 함유하지 않고, 비-병원성 박테리아 숙주 세포에서 콘드로이틴을 생산하기에 적합한 작제물(construct).
  2. 제1항에 있어서,
    kfoG 유전자, kfoB 유전자 또는 이들의 조합을 추가로 포함하는 작제물.
  3. 제1항에 있어서,
    콘드로이틴이 프럭토실화되지 않은(non-fructosylated), 작제물.
  4. 제1항에 있어서,
    kpsF 유전자, kpsE 유전자, kpsD 유전자, kpsU 유전자, kpsC 유전자 및 kpsS 유전자를 추가로 포함하는 작제물.
  5. 제4항에 있어서,
    kpsM 유전자 및 kpsT 유전자를 추가로 포함하는 작제물.
  6. 제4항에 있어서,
    콘드로이틴이 숙주 세포로부터 분비되는, 작제물.
  7. 제1항에 있어서,
    kpsM, kpsT, kpsE, kpsD, kpsC 및 kpsS 중 하나 이상의 기능성 유전자를 또한 함유하지 않는 작제물.
  8. 제7항에 있어서,
    콘드로이틴이 숙주 세포로부터 분비되지 않는, 작제물.
  9. 제1항에 있어서,
    하나 이상의 유전자가 박테리아 숙주 세포에서의 최적의 코돈 사용빈도(codon usage)를 위해 변형되는, 작제물.
  10. 제1항에 있어서,
    K4 유전자 클러스터를 포함하는 작제물.
  11. 제1항에 따른 작제물을 포함하는 비-병원성 박테리아 숙주 세포.
  12. 제11항에 있어서,
    에스케리키아(Escherichia), 슈도모나스(Pseudomonas), 잔토모나스(Xanthomonas), 메틸로모나스(Methylomonas), 아시네토박터(Acinetobacter) 및 스핑고모나스(Sphingomonas)로 이루어진 군으로부터 선택되는 비-병원성 유기체이거나 이로부터 유도되는 비-병원성 박테리아 숙주 세포.
  13. 제12항에 있어서,
    MSC279, MSC280, MSC315, MSC316, MSC317, MSC319, MSC322, MSC323, MSC324, MSC325, MSC326, MSC328, MSC346, MSC347, MSC348, MSC350, MSC356, MSC359, MSC392, MSC402, MSC403, MSC404, MSC405, MSC410, MSC411, MSC436, MSC437, MSC438, MSC439, MSC458, MSC459, MSC460, MSC461, MSC466, MSC467, MSC469, MSC480, MSC494, MSC498, MSC499, MSC500, MSC510, MSC511, MSC522, MSC526, MSC537, MSC551, MSC561, MSC562, MSC563, MSC564, MSC566, MSC567, MSC619, MSC625, MSC627, MSC640, MSC641, MSC643, MSC646, MSC650, MSC656, MSC657, MSC658, MSC659, MSC660, MSC669, MSC670, MSC671, MSC672, MSC673, MSC674, MSC675, MSC676, MSC677, MSC678, MSC679, MSC680, MSC681, MSC682, MSC683, MSC684, MSC687, MSC688, MSC689, MSC690, MSC691, MSC692, MSC693, MSC694, MSC700, MSC701, MSC702, MSC722, MSC723 및 MSC724로 이루어진 군으로부터 선택되는 박테리아 균주인 비-병원성 박테리아 숙주 세포.
  14. 제1항에 따른 작제물을 포함하는 비-병원성 박테리아 숙주 세포의 생산 방법으로서, 상기 작제물을 비-병원성 박테리아 숙주 세포에 전달하는 단계를 포함하는, 생산 방법.
  15. 프럭토실화되지 않은 콘드로이틴을 생산할 수 있고 kfoA 유전자, kfoC 유전자 및 kfoF 유전자를 포함하는 박테리아 세포의 생산 방법으로서, 세포에서 kfoD, orf3(kfoI), kfoE, orf1(kfoH) 및 이들의 조합으로 이루어진 군으로부터 선택되는 유전자를 불활성화시키는 단계를 포함하는 생산 방법.
  16. kfoA 유전자, kfoC 유전자 및 kfoF 유전자를 포함하되, kfoD, orf3(kfoI), kfoE 및 orf1(kfoH) 중 하나 이상의 기능성 유전자를 함유하지 않고, 콘드로이틴을 생산할 수 있는 재조합 박테리아 세포.
  17. 제16항에 있어서,
    kfoA 유전자, kfoC 유전자, kfoF 유전자 또는 이들의 조합이 Pm, Plac, Ptrp, Ptac, λpL, PT7, PphoA, ParaC, PxapA, Pcad 및 PrecA로 이루어진 군으로부터 선택되는 프로모터로부터 발현되는, 재조합 박테리아 세포.
  18. kfoA 유전자, kfoC 유전자 및 kfoF 유전자를 포함하고, 유전적으로 변형되어 kfoD, orf3(kfoI), kfoE 및 orf1(kfoH) 중 하나 이상의 유전자를 결실시키거나 불활성화시키고, 콘드로이틴을 생산할 수 있는 유전적으로 변형된 미생물.
  19. 콘드로이틴의 생산에 충분한 발효 조건하에서 제16항에 따른 재조합 박테리아 세포를 배양하는 단계를 포함하는, 콘드로이틴의 생산 방법.
  20. 콘드로이틴의 생산에 충분한 발효 조건하에서 제18항에 따른 유전적으로 변형된 미생물을 배양하는 단계를 포함하는, 콘드로이틴의 생산 방법.
  21. 콘드로이틴의 생산에 충분한 발효 조건하에서 제1항에 따른 작제물을 포함하는 비-병원성 박테리아 숙주 세포를 배양하는 단계를 포함하는, 콘드로이틴의 생산 방법.
  22. 제21항에 있어서,
    작제물의 유전자가 박테리아 숙주 세포의 염색체 내로 통합되는, 생산 방법.
  23. 제22항에 있어서,
    작제물의 유전자의 2개 이상의 카피가 박테리아 숙주 세포의 염색체 내로 통합되는, 생산 방법.
  24. 제19항 내지 제21항 중 어느 한 항에 있어서,
    콘드로이틴이 프럭토실화되지 않은, 생산 방법.
  25. (a) 제19항 내지 제21항 중 어느 한 항에 따른 생산 방법에 의해 콘드로이틴을 생산하는 단계; 및
    (b) 콘드로이틴을 황산화시키는 단계
    를 포함하는, 콘드로이틴 설페이트의 생산 방법.
  26. 제25항에 있어서,
    황산화시키는 단계가 설퍼트라이옥사이드-트라이에틸아민 복합체 또는 클로로설폰산을 포름아미드 내의 콘드로이틴과 혼합하는 것을 포함하는, 생산 방법.
  27. 삭제
  28. 삭제
  29. 삭제
  30. 삭제
  31. 삭제
  32. 삭제
  33. 삭제
  34. 삭제
  35. 삭제
  36. 삭제
  37. 삭제
  38. 삭제
  39. 삭제
  40. 삭제
  41. 삭제
  42. 삭제
  43. 삭제
  44. 삭제
  45. 삭제
  46. 삭제
  47. 삭제
  48. 삭제
  49. 삭제
  50. 삭제
  51. 삭제
  52. 삭제
  53. 삭제
  54. 삭제
  55. 삭제
  56. 삭제
  57. 삭제
  58. 삭제
  59. 삭제
  60. 삭제
  61. 삭제
  62. 삭제
  63. 삭제
  64. 삭제
KR1020127025916A 2010-03-01 2011-03-01 콘드로이틴의 박테리아 생산을 위한 조성물 및 방법 KR101848102B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US30940710P 2010-03-01 2010-03-01
US61/309,407 2010-03-01
PCT/US2011/026748 WO2011109438A1 (en) 2010-03-01 2011-03-01 Compositions and methods for bacterial production of chondroitin

Publications (2)

Publication Number Publication Date
KR20130055571A KR20130055571A (ko) 2013-05-28
KR101848102B1 true KR101848102B1 (ko) 2018-04-11

Family

ID=44542545

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020127025916A KR101848102B1 (ko) 2010-03-01 2011-03-01 콘드로이틴의 박테리아 생산을 위한 조성물 및 방법

Country Status (8)

Country Link
US (2) US8697398B2 (ko)
EP (1) EP2542686B1 (ko)
JP (1) JP5875531B2 (ko)
KR (1) KR101848102B1 (ko)
CN (1) CN102869782B (ko)
BR (1) BR112012021995A8 (ko)
ES (1) ES2661593T3 (ko)
WO (1) WO2011109438A1 (ko)

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
BR112012021995A8 (pt) 2010-03-01 2018-01-02 Dsm Ip Assets Bv Composição,célula hospedeira bacteriana não patogênica, método para a produção de um sulfato de condroitina,condroitina, composição e anticorpo ou fragmento de anticorpo
WO2012004063A1 (en) * 2010-07-09 2012-01-12 Gnosis S.P.A. Biotechnological production of chondroitin
US9040257B2 (en) * 2012-05-17 2015-05-26 Toyobo Co., Ltd. Basidiomycetous yeast mutant
ITMI20120896A1 (it) 2012-05-23 2013-11-24 Bongulielmi Reto Condroitina per uso in medicina
ITMI20121316A1 (it) * 2012-07-27 2014-01-28 Altergon Sa Complessi di condroitina ad assorbimento transcutaneo
EP2919806A4 (en) * 2012-11-16 2016-06-22 Jackson H M Found Military Med PEPTIDES GONORRHEA MOTHER AND VACCINES
US20150247174A1 (en) * 2012-12-28 2015-09-03 Anhui Huaheng Bioengineering Co., Ltd, Engineering bacteria for producing dl-alanine and method for producing dl-alanine by using engineering bacteria
US10196625B2 (en) 2013-09-30 2019-02-05 Seikagaku Corporation Method for improving blood persistence of protein
FR3016637B1 (fr) * 2014-01-23 2020-11-27 Centre Nat Rech Scient Procede de production in vivo de glycosaminoglycane
US9616114B1 (en) 2014-09-18 2017-04-11 David Gordon Bermudes Modified bacteria having improved pharmacokinetics and tumor colonization enhancing antitumor activity
EP3050973A1 (en) * 2015-01-30 2016-08-03 Jennewein Biotechnologie GmbH Fermentation process for producing monosaccharides in free form from nucleotide-activated sugars
CN107406525B (zh) 2015-03-31 2020-06-12 生化学工业株式会社 糖胺聚糖的硫酸化方法
US11180535B1 (en) 2016-12-07 2021-11-23 David Gordon Bermudes Saccharide binding, tumor penetration, and cytotoxic antitumor chimeric peptides from therapeutic bacteria
US11129906B1 (en) 2016-12-07 2021-09-28 David Gordon Bermudes Chimeric protein toxins for expression by therapeutic bacteria
IT202000013633A1 (it) * 2020-06-08 2021-12-08 Vivatis Pharma Gmbh Processo di estrazione di una condroitina solfato da un fungo, una condroitina solfato di origine vegetale e suo uso
EP4067487A1 (en) 2021-04-01 2022-10-05 Givaudan SA Chondroitin-producing recombinant cell

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030104601A1 (en) 1999-04-01 2003-06-05 Deangelis Paul L. Chondroitin synthase gene and methods of making and using same
EP1129209B1 (en) 1998-11-11 2009-01-21 The Board Of Regents Of The University Of Oklahoma Polymer grafting by polysaccharide synthases
US20060105431A1 (en) 1998-11-11 2006-05-18 Deangelis Paul L Polymer grafting by polysaccharide synthases using artificial sugar acceptors
US6235510B1 (en) 1999-08-18 2001-05-22 Smithkline Beecham Corporation ppGaNTase-T6
CA2392463C (en) 1999-11-25 2009-10-20 Yamasa Corporation Novel use of uridine diphosphate glucose 4-epimerase
DE10019881A1 (de) * 2000-04-20 2001-11-15 Gerhard Miksch Verfahren zur Überexpression und extrazellulären Produktion bakterieller Phytasen in Escherichia coli
EP1470235A4 (en) 2001-07-13 2008-05-21 Univ Oklahoma GLYCOSAMINOGLYCAN POLYMERS AND METHODS OF PREPARING AND USING THE SAME
JP4702819B2 (ja) 2001-08-01 2011-06-15 生化学工業株式会社 コンドロイチン合成酵素
JP4101548B2 (ja) 2001-08-10 2008-06-18 生化学工業株式会社 コンドロイチン合成酵素及びそれをコードするdna
ATE388233T1 (de) 2002-05-31 2008-03-15 Seikagaku Kogyo Co Ltd Chondroitinsynthetase und das enzym codierende nukleinsäure
AU2003241687A1 (en) 2002-05-31 2003-12-19 Amersham Biosciences K.K. Chondroitin synthetase and dna coding for the enzyme
AU2005287397A1 (en) 2004-06-30 2006-03-30 Paul L. Deangelis Methods of selectively treating diseases with specific glycosaminoglycan polymers
ES2299284B1 (es) * 2004-11-04 2009-04-16 Universidad Pablo De Olavide Control de la expresion genica mediante el uso de un atenuador de la transcripcion.
US20080219960A1 (en) 2004-12-16 2008-09-11 Masja Nathalie Nierop Groot Novel Efficient Production Process for Capsular Polysaccharides of Pathogenic Grampositive Bacteria by Heterologous Expression and Secretion of Complex Polysaccharides in Non-Pathogenic, Non-Invasive Gram-Positive Bacteria
EP1888763B1 (en) * 2005-06-06 2015-08-12 Pfenex Inc. Mannitol induced promoter systems in bacterial host cells
US8067204B2 (en) 2005-12-15 2011-11-29 Seikagaku Corporation Long-chain chondroitin sugar chain and method for producing the same and method for promoting synthesis of chondroitin
EP2690178B1 (en) 2006-10-03 2021-12-22 The Board Of Regents Of The University Of Oklahoma Targeted glycosaminoglycan polymers by polymer grafting and methods of making and using same
KR101548139B1 (ko) 2007-04-24 2015-08-28 세이가가쿠 고교 가부시키가이샤 콘드로이틴 생산 세균 및 콘드로이틴 생산 방법
BR112012021995A8 (pt) 2010-03-01 2018-01-02 Dsm Ip Assets Bv Composição,célula hospedeira bacteriana não patogênica, método para a produção de um sulfato de condroitina,condroitina, composição e anticorpo ou fragmento de anticorpo
WO2012004063A1 (en) 2010-07-09 2012-01-12 Gnosis S.P.A. Biotechnological production of chondroitin

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Ninomiya 등. THE JOURNAL OF BIOLOGICAL CHEMISTRY. Vol. 277, No. 24, 페이지 21567-21575 (2002.04.09.)*

Also Published As

Publication number Publication date
US8697398B2 (en) 2014-04-15
KR20130055571A (ko) 2013-05-28
EP2542686A1 (en) 2013-01-09
JP5875531B2 (ja) 2016-03-02
EP2542686A4 (en) 2014-03-26
US20140296505A1 (en) 2014-10-02
ES2661593T3 (es) 2018-04-02
BR112012021995A8 (pt) 2018-01-02
US9175293B2 (en) 2015-11-03
BR112012021995A2 (pt) 2015-10-06
JP2013520995A (ja) 2013-06-10
CN102869782B (zh) 2015-11-25
WO2011109438A1 (en) 2011-09-09
US20110244520A1 (en) 2011-10-06
CN102869782A (zh) 2013-01-09
EP2542686B1 (en) 2018-01-03

Similar Documents

Publication Publication Date Title
KR101848102B1 (ko) 콘드로이틴의 박테리아 생산을 위한 조성물 및 방법
AU2020244599B2 (en) Compositions comprising bacterial strains
KR102563191B1 (ko) 비피도박테리움 애니멀리스 ssp. 락티스를 이용한 암 치료 조성물 및 방법
AU2018203835B2 (en) Recombinant dna constructs and methods for modulating expression of a target gene
KR102644935B1 (ko) 항-PD1/PD-L1/PD-L2 항체에 대한 반응성의 마커로서의 미생물총 조성물, 및 항-PD1/PD-L1/PD-L2 Ab-기반 치료의 효능을 개선하기 위한 미생물 조정제의 용도
AU2020227049A1 (en) Fast diagnosis and personalized treatments for acne
CN101365788B (zh) Δ-9延伸酶及其在制备多不饱和脂肪酸中的用途
CN100558896C (zh) 双岐杆菌的基因组
KR20140015136A (ko) 3-히드록시프로피온산 및 다른 생성물의 제조 방법
KR20120136349A (ko) 고가의 화학적 생성물의 미생물 생산, 및 관련 조성물, 방법 및 시스템
KR20130117753A (ko) 포스포케톨라아제를 포함하는 재조합 숙주 세포
KR20130027063A (ko) Fe-s 클러스터 요구성 단백질의 활성 향상
KR20070086634A (ko) 공업적으로 유용한 미생물
CN113227364A (zh) 用于产生熊去氧胆酸及其前体的细胞和方法
KR20220012327A (ko) 피토칸나비노이드 및 피토칸나비노이드 전구체의 생산을 위한 방법 및 세포
CN116249779A (zh) 免疫刺激细菌递送平台及其用于递送治疗产物的用途
AU2016295177A1 (en) Genetic testing for predicting resistance of serratia species against antimicrobial agents
KR20230111189A (ko) 재프로그램 가능한 iscb 뉴클레아제 및 이의 용도
KR20210097723A (ko) 발효에 의한 1,5-디아미노펜탄의 생산을 위한 조작된 생합성 경로
KR20230127308A (ko) 신규 핵산-가이드 뉴클레아제
CN107208149A (zh) 结直肠癌相关疾病的生物标志物
KR20220116504A (ko) 정밀 화학물의 제조에서 공시 수율, 탄소-전환-효율 및 탄소 기질 적응성의 증가
KR101561591B1 (ko) 지질 분해효소 LipT를 생산하는 신규한 내냉성 슈도모나스 만델리 JR-1 균주 및 그 유전체의 염기서열
CN112384624A (zh) 用于对阿克曼菌进行基因操纵的系统和方法
KR102125235B1 (ko) 닭 대장균 예방 및 치료를 위한 신규 박테리오파지 및 이를 이용한 항균조성물

Legal Events

Date Code Title Description
N231 Notification of change of applicant
E902 Notification of reason for refusal
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant