KR102003911B1 - 마이코스포린 유사 아미노산을 생산하는 미생물 및 이를 이용한 마이코스포린 유사 아미노산의 생산방법 - Google Patents

마이코스포린 유사 아미노산을 생산하는 미생물 및 이를 이용한 마이코스포린 유사 아미노산의 생산방법 Download PDF

Info

Publication number
KR102003911B1
KR102003911B1 KR1020180022185A KR20180022185A KR102003911B1 KR 102003911 B1 KR102003911 B1 KR 102003911B1 KR 1020180022185 A KR1020180022185 A KR 1020180022185A KR 20180022185 A KR20180022185 A KR 20180022185A KR 102003911 B1 KR102003911 B1 KR 102003911B1
Authority
KR
South Korea
Prior art keywords
leu
ala
val
gly
glu
Prior art date
Application number
KR1020180022185A
Other languages
English (en)
Inventor
김솔
석종철
이규성
장재우
Original Assignee
씨제이제일제당 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority to KR1020180022185A priority Critical patent/KR102003911B1/ko
Application filed by 씨제이제일제당 주식회사 filed Critical 씨제이제일제당 주식회사
Priority to SG11202008002PA priority patent/SG11202008002PA/en
Priority to CA3091909A priority patent/CA3091909C/en
Priority to AU2019224876A priority patent/AU2019224876B2/en
Priority to MYPI2020004306A priority patent/MY196701A/en
Priority to MX2020008809A priority patent/MX2020008809A/es
Priority to US16/971,209 priority patent/US20210230610A1/en
Priority to CN201980024017.1A priority patent/CN112292452B/zh
Priority to RU2020127822A priority patent/RU2757424C1/ru
Priority to EP19757526.9A priority patent/EP3754024B1/en
Priority to PCT/KR2019/002242 priority patent/WO2019164351A1/ko
Priority to JP2020544220A priority patent/JP7015933B2/ja
Priority to BR112020017078-0A priority patent/BR112020017078B1/pt
Application granted granted Critical
Publication of KR102003911B1 publication Critical patent/KR102003911B1/ko
Priority to PH12020551274A priority patent/PH12020551274A1/en

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/70Vectors or expression systems specially adapted for E. coli
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/52Genes encoding for enzymes or proenzymes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/74Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora
    • C12N15/77Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora for Corynebacterium; for Brevibacterium
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/80Vectors or expression systems specially adapted for eukaryotic hosts for fungi
    • C12N15/81Vectors or expression systems specially adapted for eukaryotic hosts for fungi for yeasts
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/1022Transferases (2.) transferring aldehyde or ketonic groups (2.2)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/1085Transferases (2.) transferring alkyl or aryl groups other than methyl groups (2.5)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/12Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
    • C12N9/1294Phosphotransferases with paired acceptors (2.7.9)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P13/00Preparation of nitrogen-containing organic compounds
    • C12P13/04Alpha- or beta- amino acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y202/00Transferases transferring aldehyde or ketonic groups (2.2)
    • C12Y202/01Transketolases and transaldolases (2.2.1)
    • C12Y202/01001Transketolase (2.2.1.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y205/00Transferases transferring alkyl or aryl groups, other than methyl groups (2.5)
    • C12Y205/01Transferases transferring alkyl or aryl groups, other than methyl groups (2.5) transferring alkyl or aryl groups, other than methyl groups (2.5.1)
    • C12Y205/010543-Deoxy-7-phosphoheptulonate synthase (2.5.1.54)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y207/00Transferases transferring phosphorus-containing groups (2.7)
    • C12Y207/09Phosphotransferases with paired acceptors (2.7.9)
    • C12Y207/09002Pyruvate, water dikinase (2.7.9.2)

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Medicinal Chemistry (AREA)
  • Mycology (AREA)
  • General Chemical & Material Sciences (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)

Abstract

본원은 마이코스포린 유사 아미노산을 생산하는 미생물 및 상기 미생물을 이용한 마이코스포린 유사 아미노산의 생산방법에 관한 것이다.
본원의 미생물은 마이코스포린 유사 아미노산의 생산능이 향상되어, 마이코스포린 유사 아미노산을 생산하는 데 효율적으로 사용될 수 있다.

Description

마이코스포린 유사 아미노산을 생산하는 미생물 및 이를 이용한 마이코스포린 유사 아미노산의 생산방법 {A microorganism for producing a Mycosporine-like amino acid and a method for preparing a Mycosporine-like amino acid using the same}
본원은 마이코스포린 유사 아미노산을 생산하는 미생물 및 상기 미생물을 이용한 마이코스포린 유사 아미노산의 생산방법에 관한 것이다.
태양으로부터 방출되는 자외선은 UV A(자외선 A, 약 320-400nm의 영역), UV B(자외선 B, 약 290-320nm의 영역) 및 UV C(자외선 C, 약 100~280 nm의 영역)으로 구성되어 있다. 자외선 A는 진피층까지 침투하여 주로 색소 침착 및 피부노화를 유발하고, 광 과민성 피부병 발생에 관여하며, 자외선 B는 고 에너지 광선으로 표피와 진피 상부에 침투하여 일광화상, 색소침착 및 피부암 발생에 관여한다고 알려져 있다.
이러한 부작용을 막기 위해 자외선을 차단하려는 시도가 있어왔다. 자외선 차단제의 종류로는 화학적 자외선 차단제(Chemical sunscreen agent)와 물리적 자외선차단제(Physical sunscreen agent)가 있는데, 화학적 자외선 차단제는 주로 자외선의 흡수를 통해서, 물리적 자외선 차단제는 반사 및 산란을 통해 자외선의 침투를 막는다.
화학적 자외선 차단제에 포함되는 성분으로는, 자외선 B를 주로 흡수하는 PABA, PABA 에스테르s(Amyl dimethyl PABA, octyl dimethyl PABA), 시나메이트(Cinnamates: Cinoxate), 살리실레이트 (Salicylate: Homomenthyl salicylate), 캄퍼(Camphor) 등과, 자외선 A를 주로 흡수하는 벤조페논(Benzophenone: Oxybenzone, Dioxybenzone, Suliso benzene), 디벤조일 메탄(Dibenzoyl methane), 안트라닐레이트(Anthranilate) 등이 알려져 있다. 이러한 화학적 자외선 차단제들은 자외선을 흡수하여 차단하는 효과를 얻을 수 있으나, 이들 중 일부는 피부나 눈에 자극을 줄 수 있고, 특히, PABA, PABA 에스테르, 벤조페논, 시나메이트 등은 접촉성 피부염을 초래할 수 있다고 알려져있다. 또한, 다른 일부는 피부의 광 과민성 반응을 유발할 수 있는 등의 문제점이 보고되어 있는 바, 일부 국가들에서는 화학적 자외선 차단제들의 사용을 제한하거나, 그 사용량을 제한하고 있다.
물리적 자외선 차단제에 포함되는 성분으로는, 이산화티탄 (Titanium dioxide), 탈크 (Talc; Magnesium silicate), 산화 마그네슘 (Magnesium oxide), 산화 아연 (Zinc oxide), 카올린 (Kaolin) 등이 알려져 있다. 이들은 접촉성 피부염과 같은 부작용이 없고, 물에 잘 지워지지 않는 장점이 있는 반면, 원하는 제형을 실현하면서 유효한 함유량을 유지하기 어렵고, 피부에 도포 시 백탁 현상 등이 나타나는 단점이 있다.
마이코스포린 유사 아미노산 (Mycosporine-like amino acids: MAAs)은 자연 생물체에 존재하는 물질로, UVA, UVB를 효과적으로 흡수하는 것으로 알려져 있다. MAAs는 자연계에 35종 이상이 존재한다고 알려져 있다(Mar. Biol., 1991, 108: 157-166; Planta Med., 2015, 81: 813-820). 최근에는 다양한 당이 붙은 형태의 MAAs가 미세조류에 존재하며, 항산화 기능이 탁월하다고 보고되었다 (Journal of Photochemistry and Photobiology, 2015, 142: 154-168). 또한, MAAs는 자외선 차단능뿐만 아니라, 산화, 삼투 및 열 스트레스에 대한 저항성 등을 부여한다고 알려져 있다 (Comp. Biochem. Physiol.C Toxicol. Pharmacol., 2007, 146: 60-78; J. Photochem. Photobiol. B., 2007, 89: 29-35).
하지만, 미세조류 내에서 생산되는 MAAs의 양은 수 ㎍ 수준으로 매우 낮고, 미세조류를 배양하여 MAAs를 분리, 추출, 정제하는 조건들이 복잡하여 MAAs 소재를 대량생산하기 어려운 문제가 있다.
이러한 배경 하에, 본 발명자들은 미생물에서 MAAs의 생산을 증가시키기 위해 예의 노력한 결과, MAAs를 생산하는 미생물에서 2-dehydro-3-deoxyphosphoheptonate aldolase, phosphoenolpyruvate synthetase 및 transketolase 단백질의 활성을 강화시키는 다방면의 연구를 통하여 MAAs의 생산이 증가됨을 확인함으로써 본 발명을 완성하였다.
Comp. Biochem. Physiol. B 1995, 112: 105-114. FEMS Microbiol Lett. 2007, 269: 1-10. Ann. Rev. Physiol. 2002, 64: 223-262. Mar. Biol. 1991, 108: 157-166. Journal of Photochemistry and Photobiology B: Biology. 2015, 142: 154-168 Biol. Rev. 1999, 74: 311-345. Mol. Biol. Evol. 2006, 23: 1437-1443. Science, 2010, 329: 1653-1656. Genomics 2010, 95: 120-128. Geomicrobiol. J. 1997. 14: 231-241. Comp. Biochem. Physiol. C Toxicol. Pharmacol. 2007. 146: 60-78. Can. J. Bot. 2003. 81: 131-138. J. Photochem. Photobiol. B. 2007, 89: 29-35. J. Bacteriol. 2011. 193(21): 5923-5928. Planta Med. 2015. 81: 813-820 ACS Appl. Mater. Interfaces. 2015. 7: 16558-16564 Appl Environ Microbiol. 2016, 82(20): 6167-6173 ChemBioChem. 2015, 16: 320-327 Methods Mol Biol. 2013, 1073: 43-7 Nature Review, 2011, 9: 791-802
본원의 하나의 목적은 2-디하이드로-3-데옥시포스포헵토네이트 알돌라제 (2-dehydro-3-deoxyphosphoheptonate aldolase), 포스포에놀피루베이트 신테타제 (phosphoenolpyruvate synthetase), 트랜스케톨라제 (transketolase)로 이루어진 군으로부터 선택되는 하나 이상의 단백질 활성이 강화된, 마이코스포린 유사 아미노산을 생산하는 미생물을 제공하는 것이다.
본원의 다른 목적은 상기 미생물을 배지에서 배양하는 단계; 및 상기 배양된 미생물 또는 배지로부터 마이코스포린 유사 아미노산을 회수하는 단계를 포함하는, 마이코스포린 유사 아미노산의 생산방법을 제공하는 것이다.
이하에서는, 본원을 더욱 상세히 설명한다.
한편, 본원에서 개시되는 각각의 설명 및 실시형태는 각각의 다른 설명 및 실시 형태에도 적용될 수 있다. 즉, 본원에서 개시된 다양한 요소들의 모든 조합이 본 발명의 범주에 속한다. 또한, 하기 기술되는 구체적인 서술에 의하여 본 발명의 범주가 제한된다고 할 수 없다. 또한, 당해 기술분야의 통상의 지식을 가진 자는 통상의 실험만을 사용하여 본 출원에 기재된 본 발명의 특정 양태에 대한 다수의 등가물을 인지하거나 확인할 수 있다. 또한, 이러한 등가물은 본 발명에 포함되는 것으로 의도된다.
상기 목적을 달성하기 위한 본 출원의 하나의 양태는, 2-디하이드로-3-데옥시포스포헵토네이트 알돌라제 (2-dehydro-3-deoxyphosphoheptonate aldolase), 포스포에놀피루베이트 신테타제 (phosphoenolpyruvate synthetase) 및 트랜스케톨라제 (transketolase)로 이루어진 군으로부터 선택되는 하나 이상의 단백질 활성이 강화된, 마이코스포린 유사 아미노산을 생산하는 미생물을 제공한다.
본원에서 용어, “2-디하이드로-3-데옥시포스포헵토네이트 알돌라제(2-dehydro-3-deoxyphosphoheptonate aldolase)”는 하기 반응식의 가역 반응을 촉매하는 효소를 의미하며, 구체적으로, 3-디옥시-아라비노-헵툴로소네이트-7-포스페이트(3-deoxy-D-arabino-heptulosonate-7-phosphate, DAHP)를 합성하는 효소를 의미할 수 있으나, 이에 제한되지 않는다.
[반응식]
Figure 112018019301625-pat00001
본원에서, 2-디하이드로-3-데옥시포스포헵토네이트 알돌라제는 3-데옥시-D-아라비노-헵툴로소네이트-7-포스페이트(DAHP) 신타제와 혼용된다.
본원에서 용어, "포스포에놀피루베이트 신테타제(phosphoenolpyruvate synthetase)"는 하기 반응식의 가역 반응을 촉매하는 효소를 의미하며, 구체적으로, 포스포에놀피루베이트를 합성하는 효소를 의미할 수 있으나, 이에 제한되지 않는다.
[반응식]
Figure 112018019301625-pat00002
본원에서 용어, "트랜스케톨라제(transketolase)"는 하기 반응식의 가역 반응을 촉매하는 효소를 의미한다.
[반응식]
Figure 112018019301625-pat00003
또는
Figure 112018019301625-pat00004
상기 2-디하이드로-3-데옥시포스포헵토네이트 알돌라제, 포스포에놀피루베이트 신테타제, 트랜스케톨라제의 유전적 정보는 공지의 데이터 베이스에서 얻을 수 있으며, 그 예로 미국 국립생물정보센터 (National Center for Biotechnology Information; NCBI)의 GenBank 등이 있으나, 이에 제한되지 않는다.
상기 2-디하이드로-3-데옥시포스포헵토네이트 알돌라제, 포스포에놀피루베이트 신테타제, 트랜스케톨라제는 미생물의 종 또는 미생물에 따라 활성을 나타내는 단백질의 아미노산 서열에 차이가 존재하는 경우가 있기 때문에, 그 유래나 서열에 한정되지 않는다.
구체적으로, 상기 2-디하이드로-3-데옥시포스포헵토네이트 알돌라제는 서열번호 2, 37 또는 124의 아미노산 서열을 포함하는 단백질일 수 있고, 상기 포스포에놀피루베이트 신테타제는 서열번호 19 또는 98의 아미노산 서열을 포함하는 단백질일 수 있고, 트랜스케톨라제는 서열번호 24, 96 또는 123의 아미노산 서열을 포함하는 단백질일 수 있으나, 이에 제한되는 것은 아니다. 본원에서 "아미노산 서열을 포함하는 단백질"은 "아미노산 서열을 가지는 단백질", 또는 "아미노산 서열로 구성되는 단백질"이라는 표현과 혼용되어 사용될 수 있다.
또한, 본원에서 상기 효소들은 각각의 효소와 동일하거나 상응하는 생물학적 활성을 가지는 한, 기재된 서열번호뿐만 아니라, 상기 아미노산 서열과 80% 이상, 85% 이상, 90% 이상, 91% 이상, 92% 이상, 93% 이상, 94% 이상, 95% 이상, 96% 이상, 97% 이상, 98% 이상, 99% 이상의 상동성을 나타내는 단백질을 포함할 수 있다.
또한 상기 서열과 상동성을 가지는 서열로서 실질적으로 기재된 서열번호의 효소 단백질과 동일하거나 상응하는 생물학적 활성을 가지는 아미노산 서열이라면, 일부 서열이 결실, 변형, 치환 또는 부가된 아미노산 서열을 가지는 경우도 역시 본 출원의 범주에 포함됨은 자명하다.
본원에 사용된 용어 "상동성"은 주어진 아미노산 서열 또는 뉴클레오티드 서열과 일치하는 정도를 의미하며 백분율로 표시될 수 있다. 본 명세서에서, 주어진 아미노산 서열 또는 뉴클레오티드 서열과 동일하거나 유사한 활성을 가지는 그의 상동성 서열이 "% 상동성"으로 표시된다. 예를 들면, 점수(score), 동일성(identity) 및 유사도(similarity) 등의 매개 변수(parameter)들을 계산하는 표준 소프트웨어, 구체적으로 BLAST 2.0을 이용하거나, 정의된 엄격한 조건(stringent condition)하에서 썼던 혼성화 실험에 의해 서열을 비교함으로써 확인할 수 있으며, 정의되는 적절한 혼성화 조건은 해당 기술 범위 내이고, 당업자에게 잘 알려진 방법(예컨대, J. Sambrook et al., Molecular Cloning, A Laboratory Manual, 2nd Edition, Cold Spring Harbor Laboratory press, Cold Spring Harbor,New York, 1989; F.M. Ausubel et al., Current Protocols in Molecular Biology, John Wiley & Sons, Inc., New York)으로 결정될 수 있다. 상기에서 용어 "엄격한 조건"이란 폴리뉴클레오티드 간의 특이적 혼성화를 가능하게 하는 조건을 의미한다. 예를 들어, 이러한 조건은 문헌 (예컨대, J. Sambrook et al., 상동)에 구체적으로 기재되어 있다.
본원의 2-디하이드로-3-데옥시포스포헵토네이트 알돌라제, 포스포에놀피루베이트 신테타제, 트랜스케톨라제는 상기 각각의 효소와 동일하거나 상응하는 생물학적 활성을 가지는 한, 기재된 서열번호의 아미노산 서열 또는 상기 서열과 80% 이상, 85% 이상, 90% 이상, 91% 이상, 92% 이상, 93% 이상, 94% 이상, 95% 이상, 96% 이상, 97% 이상, 98% 이상, 99% 이상의 상동성을 나타내는 단백질을 코딩하는 폴리뉴클레오티드를 포함할 수 있다.
또한, 상기 효소들을 코딩하는 폴리뉴클레오티드는 코돈의 축퇴성(degeneracy)으로 인하여 상기 단백질을 발현시키고자 하는 생물에서 선호되는 코돈을 고려하여, 코딩영역으로부터 발현되는 단백질의 아미노산 서열을 변화시키지 않는 범위 내에서 코딩영역에 다양한 변형이 이루어질 수 있다. 따라서, 상기 폴리뉴클레오티드는 각 효소 단백질을 코딩하는 폴리뉴클레오티드 서열이면 제한 없이 포함될 수 있다.
또한, 공지의 유전자 서열로부터 조제될 수 있는 프로브, 예를 들면, 상기 폴리뉴클레오티드 서열의 전체 또는 일부에 대한 상보 서열과 엄격한 조건 하에 하이브리드화하여, 상기 2-디하이드로-3-데옥시포스포헵토네이트 알돌라제, 포스포에놀피루베이트 신테타제, 트랜스케톨라제 효소 단백질의 활성을 가지는 단백질을 암호화하는 서열이라면 제한 없이 포함될 수 있다.
상기 “엄격한 조건”이란 폴리뉴클레오티드 간의 특이적 혼성화를 가능하게 하는 조건을 의미한다. 이러한 조건은 문헌 (예컨대, J. Sambrook et al., 상동)에 구체적으로 기재되어 있다. 예를 들어, 상동성이 높은 유전자끼리, 40% 이상, 구체적으로는 90% 이상, 보다 구체적으로는 95% 이상, 더욱 구체적으로는 97% 이상, 특히 구체적으로는 99% 이상의 상동성을 갖는 유전자끼리 하이브리드화하고, 그보다 상동성이 낮은 유전자끼리 하이브리드화하지 않는 조건, 또는 통상의 써던 하이브리드화의 세척 조건인 60℃, 1XSSC, 0.1% SDS, 구체적으로는 60℃, 0.1XSSC, 0.1% SDS, 보다 구체적으로는 68℃, 0.1XSSC, 0.1% SDS에 상당하는 염 농도 및 온도에서, 1회, 구체적으로는 2회 내지 3회 세정하는 조건을 열거할 수 있다.
혼성화는 비록 혼성화의 엄격도에 따라 염기 간의 미스매치 (mismatch)가 가능할지라도, 두 개의 폴리뉴클레오티드가 상보적 서열을 가질 것을 요구한다. 용어, “상보적”은 서로 혼성화가 가능한 뉴클레오티드 염기 간의 관계를 기술하는데 사용된다. 예를 들면, DNA에 관하여, 아데노신은 티민에 상보적이며 시토신은 구아닌에 상보적이다. 따라서, 본 출원은 또한 실질적으로 유사한 폴리뉴클레오티드 서열뿐만 아니라 전체 서열에 상보적인 단리된 폴리뉴클레오티드 단편을 포함할 수 있다.
구체적으로, 상동성을 가지는 폴리뉴클레오티드는 55 ℃의 Tm 값에서 혼성화 단계를 포함하는 혼성화 조건을 사용하고 상술한 조건을 사용하여 탐지할 수 있다. 또한, 상기 Tm 값은 60 ℃, 63 ℃ 또는 65 ℃일 수 있으나, 이에 제한되는 것은 아니고 그 목적에 따라 당업자에 의해 적절히 조절될 수 있다.
폴리뉴클레오티드를 혼성화하는 적절한 엄격도는 폴리뉴클레오티드의 길이 및 상보성 정도에 의존하고 변수는 해당기술분야에 잘 알려져 있다(Sambrook et al., supra, 9.50-9.51, 11.7-11.8 참조).본원에서 용어, “활성의 강화”는 효소 단백질의 활성이 도입되거나, 미생물이 가진 내재적 활성 또는 변형 전 활성에 비하여 활성이 향상된 것을 의미한다. 상기 활성의 “도입”은, 미생물이 본래 가지고 있지 않았던 특정 단백질의 활성이 자연적 혹은 인위적으로 나타나게 되는 것을 의미한다. 구체적으로 효소 단백질의 활성이 강화된 미생물은, 천연의 야생형 미생물 또는 비변형 미생물에 비해서 효소단백질의 활성이 향상된 미생물을 의미한다. 상기 활성 강화는 예를 들어, 외래의 2-디하이드로-3-데옥시포스포헵토네이트 알돌라제, 포스포에놀피루베이트 신테타제, 및/또는 트랜스케톨라제를 도입하여 강화하는 것; 또는 내재적 2-디하이드로-3-데옥시포스포헵토네이트 알돌라제, 포스포에놀피루베이트 신테타제 및/또는 트랜스케톨라제의 활성을 강화하는 것을 모두 포함할 수 있다. 구체적으로, 본원에서 활성 강화의 방법으로는,
1) 상기 효소들을 암호화하는 폴리뉴클레오티드의 카피수 증가,
2) 상기 폴리뉴클레오티드의 발현이 증가하도록 발현조절 서열의 변형,
3) 상기 효소들의 활성이 강화되도록 염색체 상의 폴리뉴클레오티드 서열의 형, 또는
4) 이의 조합에 의해 강화되도록 변형하는 방법 등에 의하여 수행될 수 있으나, 이에 제한되지 않는다.
상기 1) 폴리뉴클레오티드의 카피수 증가는, 특별히 이에 제한되지 않으나, 벡터에 작동 가능하게 연결된 형태로 수행되거나, 숙주세포 내의 염색체 내로 삽입됨으로써 수행될 수 있다. 또한 카피수 증가의 한 양태로, 효소의 활성을 나타내는 외래 폴리뉴클레오티드 또는 상기 폴리뉴클레오티드의 코돈 최적화된 변이형 폴리뉴클레오티드를 숙주세포 내로 도입하여 수행될 수 있다. 상기 외래 폴리뉴클레오티드는 상기 효소와 동일/유사한 활성을 나타내는 한 그 유래나 서열에 제한 없이 사용될 수 있다. 상기 도입은 공지된 형질전환 방법을 당업자가 적절히 선택하여 수행될 수 있으며, 숙주 세포 내에서 상기 도입된 폴리뉴클레오티드가 발현됨으로써 효소가 생성되어 그 활성이 증가될 수 있다.
다음으로, 2) 폴리뉴클레오티드의 발현이 증가하도록 발현조절 서열의 변형은, 특별히 이에 제한되지 않으나, 상기 발현조절 서열의 활성을 더욱 강화하도록 핵산 서열을 결실, 삽입, 비보전적 또는 보전적 치환 또는 이들의 조합으로 서열상의 변이를 유도하여 수행하거나, 더욱 강한 활성을 가지는 핵산 서열로 교체함에 의하여 수행될 수 있다. 상기 발현조절 서열은, 특별히 이에 제한되지 않으나 프로모터, 오퍼레이터 서열, 리보좀 결합 부위를 코딩하는 서열, 전사 및 해독의 종결을 조절하는 서열 등을 포함할 수 있다.
구체적으로, 폴리뉴클레오티드 발현 단위의 상부에는 본래의 프로모터 대신 강력한 이종 프로모터가 연결될 수 있는데, 상기 강력한 프로모터의 예로는 CJ7 프로모터, lysCP1 프로모터, EF-Tu 프로모터, groEL 프로모터, aceA 혹은 aceB 프로모터 등이 있다. 더욱 구체적으로는 코리네박테리움 속 유래 프로모터인 lysCP1 프로모터(WO2009/096689), CJ7 프로모터(WO2006/065095), SPL프로모터(KR 10-1783170 B), 혹은 o2 프로모터(KR 10-1632642 B)와 작동 가능하게 연결되어, 상기 효소를 코딩하는 폴리뉴클레오티드의 발현율을 향상시킬 수 있으나, 이에 한정되지 않는다.
아울러, 3) 염색체 상의 폴리뉴클레오티드 서열의 변형은, 특별히 이에 제한되지 않으나, 상기 폴리뉴클레오티드 서열의 활성을 더욱 강화하도록 핵산 서열을 결실, 삽입, 비보전적 또는 보전적 치환 또는 이들의 조합으로 발현조절 서열상의 변이를 유도하여 수행하거나, 더욱 강한 활성을 갖도록 개량된 폴리뉴클레오티드 서열로 교체함에 의하여 수행될 수 있다.
마지막으로, 4) 상기 1) 내지 3)의 조합에 의해 강화되도록 변형하는 방법은, 상기 효소를 암호화하는 폴리뉴클레오티드의 카피수 증가, 이의 발현이 증가하도록 발현조절 서열의 변형, 염색체 상의 상기 폴리뉴클레오티드 서열의 변형 및 상기 효소의 활성을 나타내는 외래 폴리뉴클레오티드 또는 이의 코돈 최적화된 변이형 폴리뉴클레오티드의 변형 중 1 이상의 방법을 함께 적용하여 수행될 수 있다.
상기 폴리뉴클레오티드는 기능을 할 수 있는 폴리뉴클레오티드 집합체인 경우 유전자로 기재될 수 있다. 본원에서 폴리뉴클레오티드와 유전자는 혼용될 수 있으며, 폴리뉴클레오티드 서열과 뉴클레오티드 서열은 혼용될 수 있다.
본원에서 사용된 용어 “벡터”는 적합한 숙주 내에서 목적 단백질을 발현시킬 수 있도록 적합한 조절 서열에 작동 가능하게 연결된 상기 목적 단백질을 코딩하는 폴리뉴클레오티드의 염기서열을 함유하는 DNA 제조물을 의미한다. 상기 조절 서열은 전사를 개시할 수 있는 프로모터, 그러한 전사를 조절하기 위한 임의의 오퍼레이터 서열, 적합한 mRNA 리보좀 결합부위를 코딩하는 서열, 및 전사 및 해독의 종결을 조절하는 서열을 포함할 수 있다. 벡터는 적당한 숙주세포 내로 형질 전환된 후, 숙주 게놈과 무관하게 복제되거나 기능할 수 있으며, 게놈 그 자체에 통합될 수 있다.
본원에서 사용되는 벡터는 숙주세포 내에서 복제 가능한 것이면 특별히 한정되지 않으며, 당업계에 알려진 임의의 벡터를 이용할 수 있다. 통상 사용되는 벡터의 예로는 천연 상태이거나 재조합된 상태의 플라스미드, 코스미드, 바이러스 및 박테리오파지를 들 수 있다. 예를 들어, 파지 벡터 또는 코스미드 벡터로서 pWE15, M13, MBL3, MBL4, IXII, ASHII, APII, t10, t11, Charon4A, 및 Charon21A 등을 사용할 수 있으며, 플라스미드 벡터로서 pBR계, pUC계, pBluescriptII계, pGEM계, pTZ계, pCL계 및 pET계 등을 사용할 수 있다. 구체적으로는 pDZ, pACYC177, pACYC184, pCL, pECCG117, pUC19, pBR322, pMW118, pCC1BAC, pSKH, pRS-413, pRS-414, pRS-415 벡터 등을 사용할 수 있으나, 이에 제한되지 않는다.
본원에서 사용 가능한 벡터는 특별히 제한되는 것이 아니며 공지된 발현 벡터를 사용할 수 있다. 또한, 세포 내 염색체 삽입용 벡터를 통해 염색체 내에 목적 단백질을 코딩하는 폴리뉴클레오티드를 삽입시킬 수 있다. 상기 폴리뉴클레오티드의 염색체 내로의 삽입은 당업계에 알려진 임의의 방법, 예를 들면, 상동재조합에 의하여 이루어질 수 있으나, 이에 한정되지는 않는다. 상기 염색체 삽입 여부를 확인하기 위한 선별 마커(selection marker)를 추가로 포함할 수 있다. 선별 마커는 벡터로 형질 전환된 세포를 선별, 즉 목적 핵산 분자의 삽입 여부를 확인하기 위한것으로, 약물 내성, 영양 요구성, 세포 독성제에 대한 내성 또는 표면 단백질의 발현과 같은 선택가능 표현형을 부여하는 마커들이 사용될 수 있다. 선택제(selective agent)가 처리된 환경에서는 선별 마커를 발현하는 세포만 생존하거나 다른 표현 형질을 나타내므로, 형질 전환된 세포를 선별할 수 있다.
본원에서 사용된 용어 "형질 전환"은 표적 단백질을 코딩하는 폴리뉴클레오티드를 포함하는 벡터를 숙주세포 내에 도입하여 숙주세포 내에서 상기 폴리뉴클레오티드가 코딩하는 단백질이 발현할 수 있도록 하는 것을 의미한다. 형질 전환된 폴리뉴클레오티드는 숙주세포 내에서 발현될 수 있기만 한다면, 숙주세포의 염색체 내에 삽입되어 위치하거나 염색체 외에 위치하거나 상관없이 이들 모두를 포함할 수 있다. 또한, 상기 폴리뉴클레오티드는 표적 단백질을 코딩하는 DNA 및 RNA를 포함한다. 상기 폴리뉴클레오티드는 숙주세포 내로 도입되어 발현될 수 있는 것이면, 어떠한 형태로 도입되는 것이든 상관없다. 예를 들면, 상기 폴리뉴클레오티드는 자체적으로 발현되는데 필요한 모든 요소를 포함하는 유전자 구조체인 발현 카세트(expression cassette)의 형태로 숙주세포에 도입될 수 있다. 상기 발현 카세트는 통상 상기 폴리뉴클레오티드에 작동 가능하게 연결되어 있는 프로모터(promoter), 전사 종결신호, 리보좀 결합부위 및 번역 종결신호를 포함할 수 있다. 상기 발현 카세트는 자체 복제가 가능한 발현 벡터 형태일 수 있다. 또한, 상기 폴리뉴클레오티드는 그 자체의 형태로 숙주세포에 도입되어 숙주세포에서 발현에 필요한 서열과 작동 가능하게 연결되어 있는 것일 수도 있으며, 이에 한정되지않는다. 상기 형질전환 하는 방법은 핵산을 세포 내로 도입하는 어떤 방법도 포함되며, 숙주세포에 따라 당 분야에서 공지된 바와 같이 적합한 표준 기술을 선택하여 수행할 수 있다. 예를 들어, 전기천공법(electroporation), 인산칼슘(CaPO4) 침전, 염화칼슘(CaCl2) 침전, 미세주입법(microinjection), 폴리에틸렌글리콜(PEG)법, EAE-덱스트란법, 양이온 리포좀법, 및 초산 리튬-DMSO법 등이 있으나, 이에 제한되지 않는다.
또한, 상기에서 용어 "작동 가능하게 연결"된 것이란 본 출원의 목적 단백질을 코딩하는 폴리뉴클레오티드의 전사를 개시 및 매개하도록 하는 프로모터 서열과 상기 폴리뉴클레오티드 서열이 기능적으로 연결되어 있는 것을 의미한다. 작동 가능한 연결은 당업계의 공지된 유전자 재조합 기술을 이용하여 제조할 수 있으며, 부위-특이적 DNA 절단 및 연결은 당업계의 절단 및 연결 효소 등을 사용하여 제작할 수 있으나, 이에 제한되지 않는다.
본원의 미생물은 추가적으로 3-디하이드로퀴네이트 디히드라타제(3-dehydroquinate dehydratase) 단백질 활성이 불활성화될 수 있다.
본원에서 용어, "3-디하이드로퀴네이트 디히드라타제(3-dehydroquinate dehydratase)"는 하기 반응식의 가역 반응을 촉매하는 효소를 의미하며, 구체적으로, 3-디하이드로퀴네이트(3-dehydroquinate)를 3-디하이드로시키메이트(3-dehydroshikimate)로 전환할 수 있으나, 이에 제한되지 않는다.
[반응식]
Figure 112018019301625-pat00005
3-디하이드로퀴네이트 디히드라타제는 미생물의 종 또는 미생물에 따라 활성을 나타내는 단백질의 아미노산 서열에 차이가 존재하는 경우가 있기 때문에, 그 유래나 서열에 한정되지않는다. 구체적으로 상기 서열번호 90의 아미노산 서열을 포함하는 단백질일 수 있으나, 이에 제한되지 않는다. 또한, 서열번호 90의 아미노산 서열 또는 이와 적어도 80%, 90%, 95%, 96%, 97%, 98%, 또는 99%의 상동성을 가지는 아미노산 서열을 포함할 수 있다. 또한, 이러한 상동성을 가지며 상기 단백질과 동일하거나 상응하는 생물학적 활성을 가지는 아미노산 서열이라면, 일부 서열이 결실, 변형, 치환 또는 부가된 아미노산 서열을 가지는 경우도 역시 본원의 범주에 포함됨은 자명하다.
본원의 용어 "불활성화"는 본래 미생물이 가진 효소 단백질의 내재적 활성 또는 변형 전 활성에 비하여 그 활성이 약화되는 경우; 단백질이 전혀 발현이 되지않는 경우; 또는 발현이 되더라도 그 활성이 없는 경우를 의미한다. 상기 불활성화는 효소를 코딩하는 폴리뉴클레오티드의 변이 등으로 효소 자체의 활성이 본래 미생물이 가지고 있는 효소의 활성에 비해 약화하거나 제거된 경우; 효소를 코딩하는 유전자의 발현 저해 또는 번역(translation) 저해 등으로 세포 내에서 전체적인 효소 활성 정도가 천연형 미생물에 비하여 낮거나 제거된 경우; 효소를 코딩하는 유전자의 일부 또는 전체가 결실된 경우; 및 이들의 조합 역시 포함하는 개념으로, 이에 한정되지는 않는다. 즉 효소 단백질의 활성이 불활성화된 미생물은, 천연의 야생형 미생물 또는 비변형 미생물에 비해서 효소단백질의 활성이 낮거나 또는 제거된 미생물을 의미한다.
상기 효소 활성의 불활성화는, 당해 분야에 잘 알려진 다양한 방법의 적용으로 달성될 수 있다. 상기 방법의 예로, 1) 상기 효소를 코딩하는 염색체상의 유전자의 전체 또는 일부를 결실시키는 방법; 2) 상기 단백질을 코딩하는 염색체상의 유전자의 발현이 감소하도록 발현조절 서열의 변형, 3) 상기 단백질의 활성이 제거 또는 약화되도록 단백질을 코딩하는 염색체 상의 유전자 서열의 변형, 4) 상기 단백질을 코딩하는 염색체상의 유전자의 전사체에 상보적으로 결합하는 안티센스 올리고뉴클레오티드(예컨대, 안티센스 RNA)의 도입; 5) 상기 단백질을 코딩하는 염색체상의 유전자의 사인-달가르노(Shine-Dalgarno) 서열 앞단에 사인-달가르노 서열과 상보적인 서열을 부가하여 2차 구조물을 형성시켜 리보솜(ribosome)의 부착을 불가능하게 만드는 방법; 6) 상기 단백질을 코딩하는 폴리뉴클레오티드 서열의 ORF(open reading frame)의 3' 말단에 반대 방향으로 전사되는 프로모터를 부가하는 방법(Reverse transcription engineering, RTE) 등이 있으며, 이들의 조합으로도 달성할 수 있으나, 이에, 특별히 제한되는 것은 아니다.
상기 효소를 코딩하는 염색체상의 유전자의 일부 또는 전체를 결실하는 방법은, 미생물 내 염색체 삽입용 벡터를 통해 염색체 내 내재적 목적 단백질을 코딩하는 폴리뉴클레오티드를 일부 뉴클레오티드 서열이 결실된 폴리뉴클레오티드 또는 마커 유전자로 교체함으로써 수행될 수 있다. 이러한 폴리뉴클레오티드의 일부 또는 전체를 결실하는 방법의 일례로 상동 재조합에 의하여 폴리뉴클레오티드를 결실시키는 방법을 사용할 수 있으나, 이에 한정되지는 않는다.
상기 발현 조절 서열을 변형하는 방법은 상기 발현 조절 서열의 활성을 더욱 약화하도록 핵산 서열을 결실, 삽입, 비보전적 또는 보전적 치환 또는 이들의 조합으로 발현 조절 서열상의 변이를 유도하여 수행하거나, 더욱 약한 활성을 갖는 핵산 서열로 교체함으로써 수행할 수 있다. 상기 발현 조절서열에는 프로모터, 오퍼레이터 서열, 리보좀 결합부위를 코딩하는 서열, 및 전사와 해독의 종결을 조절하는 서열을 포함하나, 이에 한정되는 것은 아니다.
상기 염색체상의 유전자 서열을 변형하는 방법은 상기 효소의 활성을 더욱 약화하도록 유전자 서열을 결실, 삽입, 비보전적 또는 보전적 치환 또는 이들의 조합으로 서열상의 변이를 유도하여 수행하거나, 더욱 약한 활성을 갖도록 개량된 유전자 서열 또는 활성이 없도록 개량된 유전자 서열로 교체함으로써 수행할 수 있으나, 이에 한정되는 것은 아니다.
상기에서 "일부"란, 폴리뉴클레오티드의 종류에 따라서 상이하지만, 구체적으로는 1 내지 300개, 더욱 구체적으로는 1 내지 100개, 보다 더욱 구체적으로는 1 내지 50개일 수 있으나, 특별히 이에 제한되는 것은 아니다.
본원의 미생물은 추가적으로 3-디하이드로퀴네이트 신타제(3-dehydroquinate synthase) 단백질의 활성이 비변형 미생물에 비해 강화될 수 있다.
상기 3-디하이드로퀴네이트 신타제(3-dehydroquinate synthase)는 하기 반응식의 가역 반응을 촉매하는 효소를 의미하며, 구체적으로 3-디하이드로퀴네이트(3-dehydroquinate, 3-DHQ)를 합성할 수 있으나, 이에 제한되지 않는다.
[반응식]
Figure 112018019301625-pat00006
본원에서 용어, "마이코스포린 유사 아미노산(mycosporine-like amino acids; MAAs)"은 자외선을 흡수하는 고리형 화합물을 의미한다. 본원에서 마이코스포린 유사 아미노산은 자외선을 흡수할 수 있는 한 제한이 없으나, 구체적으로, 사이클로헥세논(cyclohexanone) 또는 사이클로헥센이민(cyclohexenimine)의 중심 링을 가지는 화합물; 또는 상기 중심 링에 아미노산 등의 다양한 물질이 결합된 화합물일 수 있으며, 더욱 구체적으로, 마이코스포린-2-글라이신 (Mycosporine-2-glycine), 팰라이티놀 (Palythinol), 팰라이텐산 (Palythenic acid), 데옥시가두솔(deoxygadusol), 마이코스포린-메틸아민-트레오닌 (Mycosporine-methylaminethreonine), 마이코스포린-글라이신-발린 (Mycosporine-glycine-valine), 팰라이틴(Palythine), 아스테리나-330 (Asterina-330), 시노린 (Shinorine), 포르피라-334(Porphyra-334), 유하로테스-362(Euhalothece-362), 마이코스포린-글라이신(Mycosporine-glycine), 마이코스포린-오르니틴 (Mycosporine-ornithine), 마이코스포린-라이신 (Mycosporine-lysine), 마이코스포린-글루탐산-글라이신(Mycosporine-glutamic acid-glycine), 마이코스포린-메틸아민-세린(Mycosporine-methylamine-serine), 마이코스포린-타우린(Mycosporine-taurine), 팰라이텐(Palythene), 팰라이텐-세린(Palythine-serine), 팰라이텐-세린-설페이트(Palythine-serine-sulfate), 팰라이티놀(Palythinol), 우수지렌(Usujirene) 또는 이들의 조합일 수 있다.
본원에서 마이코스포린 유사 아미노산은 MAA 및 MAAs와 혼용될 수 있다.
본원에서 용어, "마이코스포린 유사 아미노산을 생산하는 미생물"은 마이코스포린 유사 아미노산의 생합성에 관여하는 효소의 유전자 또는 상기 유전자들의 클러스터를 포함하는 미생물을 의미할 수 있고 또는 상기 클러스터가 도입 또는 강화된 미생물을 의미할 수 있다. 또한, 본원에서 용어, "마이코스포린 유사 아미노산 생합성 유전자 클러스터"는 마이코스포린 유사 아미노산 생합성에 관여하는 효소를 코딩하는 유전자 그룹을 의미하는 것일 수 있다. 구체적으로는 마이코스포린 유사 아미노산 생합성 유전자, 마이코스포린 유사 아미노산에 추가적인 아미노산 잔기를 부착하는 활성을 가진 효소의 유전자, 또는 상기 유전자들의 클러스터를 포함할 수 있다. 상기 마이코스포린 유사 아미노산 생합성 유전자는 이를 포함하는 미생물이 마이코스포린 유사 아미노산을 생산할 수 있는 한, 미생물의 외래 및/또는 내재적인 유전자를 모두 포함한다. 상기 외래 유전자는 동종 및/또는 이종일 수 있다.
상기 마이코스포린 유사 아미노산 생합성 유전자는, 이를 포함하는 미생물이 마이코스포린 유사 아미노산 생합성에 관여하는 효소를 생산하고 결과적으로 마이코스포린 유사 아미노산을 생산할 수 있는 한, 상기 유전자들의 유래 미생물 종에는 제한이 없으나, 구체적으로, 남세균(cyanobacteria)인 아나바에나 바리아빌리스(Anabaena variabilis), 노스톡 펀티포르메(Nostoc punctiforme), 노두라리아 스푸미게나(Nodularia spumigena), 시아노테스 속 PCC 7424(Cyanothece sp. PCC 7424), 라인비아 속 PCC 8106(Lyngbya sp . PCC 8106), 마이크로카이스티스 아에루기노사(Microcystis aeruginosa), 마이크로코레우스 크토노플라스테스(Microcoleus chthonoplastes), 시아노테스 속 ATCC 51142(Cyanothece sp . ATCC 51142), 크로코스파에라 와트소니(Crocosphaera watsonii), 시아노테스 속 CCY 0110(Cyanothece sp . CCY 0110), 시린드로스페르멈 스태그날 속 PCC 7417 (cylindrospermum stagnale sp,PCC 7417), 아파노테스 할로피티카 (Aphanothece halophytica) 또는 트리코데스미운 에리트라에움(Trichodesmium erythraeum)이거나, 또는 균류(fungi)인 마그나포르테 오르지아에(Magnaporthe orzyae), 피레노포라 트리티씨-레펜티스(Pyrenophora tritici-repentis), 아스퍼질러스 클라바투스(Aspergillus clavatus), 넥트리아 헤마토코카(Nectria haematococca), 아스퍼질러스 니두란스(Aspergillus nidulans), 지베렐라 제아에(Gibberella zeae), 베르티씰리움 알보-아트룸(Verticillium albo-atrum), 보트리오티니아 푸케리아나(Botryotinia fuckeliana), 파에오스파에리아 노도룸(Phaeosphaeria nodorum)이거나, 또는 네마토르텔라 벡텐시스(Nematostella vectensis), 헤테로카프사 트리퀘트라(Heterocapsa triquetra), 옥시리스 마리나(Oxyrrhis marina), 칼로디니움 미크룸(Karlodinium micrum), 악티노신네마 미룸(Actinosynnema mirum) 등일 수 있으나, 이에 제한되지 않는다.
일 실시예에 따르면, 본 출원의 마이코스포린 유사 아미노산을 생산하는 미생물은, 마이코스포린 유사 아미노산 생합성 유전자 또는 이의 클러스터를 포함한다. 구체적으로, 상기 미생물은 마이코스포린 유사 아미노산 생합성 유전자 클러스터가 도입되거나 또는 상기 유전자에 의해 코딩되는 단백질의 활성이 내재적 활성 또는 변형 전 활성에 비하여 향상될 수 있으나, 이에 제한되는 것은 아니다.
또한, 상기 마이코스포린 유사 아미노산 생합성 유전자는 미생물이 마이코스포린 유사 아미노산을 생산할 수 있는 한 효소 명칭이나 유래 미생물에 제한 되지 않으나, 2-디메틸 4-데옥시가두솔 신타제(2-demetyl 4-deoxygadusol synthase), O-메틸트랜스퍼라제(O-methyltransferase), 및 C-N 리가제(C-N ligase)로 이루어지는 군으로부터 선택되는 하나 이상, 구체적으로, 1이상, 2이상, 3이상, 또는 모든 효소 단백질; 또는 이와 동일 및/또는 유사한 활성을 가진 효소 단백질을 코딩하는 유전자를 포함할 수 있다.
예를 들면, 상기 2-디메틸 4-데옥시가두솔 신타제(2-demetyl 4-deoxygadusol synthase)는 세도헵툴로스-7-포스파이트 (sedoheptulose-7-phosphate)를 2-디메틸-4-데옥시가두솔 (2-demethyl-4-deoxygadusol)로 변환하는 효소이다. 상기 O-메틸트랜스퍼라제(O-methyltransferase)는, 2-디메틸-4-데옥시가두솔 (2-demethyl-4-deoxygadusol)을 4-데옥시가두솔 (4-deoxygadusol)로 변환하는 효소이고, 상기 4-데옥시가두솔 (4-deoxygadusol)의 글라이실레이션(glycylation)은 상기 C-N 리가제(C-N ligase)에 의해 촉매된다.
또한, 상기 마이코스포린 유사 아미노산을 생산하는 미생물은, 마이코스포린 유사 아미노산에 추가적인 아미노산 잔기를 부착하는 활성을 가진 효소의 유전자 또는 상기 유전자들의 클러스터를 포함할 수 있다. 상기 유전자 또는 상기 유전자들의 클러스터는, 마이코스포린 유사 아미노산을 생산하는 미생물이 두 개 이상의 아미노산 잔기가 부착된 마이코스포린 유사 아미노산을 생산할 수 있는 한 효소 명칭이나 유래 미생물에 제한되지 않으나, 구체적으로 논-리보좀 펩티드 신테타제 (nonribosomal peptide synthetase: NRPS), 논-리보좀 펩티드 신테타제 유사 효소(non-ribosomal peptide synthetase-like enzyme: NRPS-like enzyme) 및 D-알라닌 D-알라닌 리가제 (D-Ala D-Ala ligase: DDL) 로 이루어진 군으로부터 선택되는 하나 이상, 구체적으로, 1이상, 2이상, 3이상, 또는 모든 효소 단백질; 또는 이와 동일 및/또는 유사한 활성을 가진 효소 단백질을 코딩하는 유전자를 포함할 수 있다.
일부 마이코스포린 유사 아미노산은, 마이코스포린-글라이신에 두 번째 아미노산 잔기를 포함한다. 상기 논-리보좀 펩티드 신테타제, 논-리보좀 펩티드 신테타제 유사 효소 및 D-알라닌 D-알라닌 리가제로 이루어지는 군으로부터 선택되는 하나 이상의 효소는, 마이코스포린-글라이신에 두 번째 아미노산 잔기를 부착시킬 수 있다.
일 실시예에 따르면, 마이코스포린 유사 아미노산을 생산하는 미생물은, 논-리보좀 펩티드 신테타제, 논-리보좀 펩티드 신테타제 유사 효소 및 D-알라닌 D-알라닌 리가제와 같이, 마이코스포린-글라이신에 두 번째 아미노산을 부착시킬 수 있는 활성을 가진 효소라면, 효소 명칭이나 유래 미생물 종에 제한 없이 포함할 수 있다.
예를 들면, 아나바에나 바리아빌리스(Anabaena variabilis) 내 논-리보좀 펩티드 신테타제 유사 효소 (Ava_3855) 또는 노스톡 펀티포르메(Nostoc punctiforme) 내 D-알라닌 D-알라닌 리가제 (NpF5597)은 마이코스포린-글라이신에 세린 잔기를 부착시켜 시노린을 형성시킬 수 있다. 또 다른 예시로, 마이코스포린-2-글라이신은, 아파노테스 할로피티카 (Aphanothece halophytica) 내 D-알라닌 D-알라닌 리가제 호몰로그 (Ap_3855)에 의한 두 번째 글라이신 잔기의 부착으로 형성될 수 있다. 유사하게, 악티노신네마 미룸(Actinosynnema mirum)에서는, D-알라닌 D-알라닌 리가제에 의하여 세린 또는 알라닌이 부착되어 시노린 또는 마이코스포린-글라이신-알라닌이 형성될 수 있다. 본 출원의 일 실시예에 따른 미생물은, 전술된 효소 또는 이와 동일 및/또는 유사한 활성을 가진 효소들 중에서 목적하는 마이코스포린 유사 아미노산 생산에 적합한 것들을 선택하여 포함할 수 있다.
본 발명에서 사용될 수 있는, 상기 2-디메틸 4-데옥시가두솔 신타제, O-메틸트랜스퍼라제, C-N 리가제, 논-리보좀 펩티드 신테타제, 논-리보좀 펩티드 신테타제 유사 효소 및/또는 D-알라닌 D-알라닌 리가제는, 유래되는 미생물 종에 한정되지 않고, 동일 및/또는 유사한 기능과 역할을 수행하는 효소로 알려진 것이면 제한 되지 않으며, 이들 간의 상동성 수치 범위 또한 제한되지 않는다. 예를 들면, 시린드로스페르멈 스태그날 PCC 7417 (C. stagnale PCC 7417)의 MylA, MylB, MylD, MylE 및 MylC는, 아나바에나 바리아빌리스 (Anabaena variabilis) 및 노스톡 펀티포르메 (Nostoc punctiforme) 유래의 2-디메틸 4-데옥시가두솔 신타제, O-메틸트랜스퍼라제, C-N 리가제, 및 D-알라닌 D-알라닌 리가제에 상응하고 (homologous), 이들 사이의 유사도는 약 61 내지 88% 이다(Appl Environ Microbiol, 2016, 82(20), 6167-6173; J Bacteriol, 2011, 193(21), 5923-5928). 즉, 본 발명에서 사용될 수 있는 효소는, 동일 및/또는 유사한 기능 및 효과를 나타내는 것으로 알려진 것이라면 유래되는 미생물 종이나 서열 상동성에 크게 제한되지 않는다. 또한, 상기 선행 기술문헌에 기재된 비특허문헌은 전체로써 본원의 참조로 포함된다.
또한, 마이코스포린 유사 아미노산 생합성 유전자는 서열번호 115, 116, 117, 118, 119, 120, 121, 또는 122의 아미노산 서열을 포함하는 단백질을 코딩하는 폴리뉴클레오티드일 수 있으나, 이에 제한되지 않는다.
또한, 마이코스포린 유사 아미노산 생합성 유전자는 서열번호 115, 116, 117, 118, 119, 120, 121, 또는 122의 아미노산 서열과 50%, 60%, 또는 70% 이상, 구체적으로는 80% 이상, 더욱 구체적으로는 90% 이상, 더더욱 구체적으로는 95%이상, 보다 더욱 구체적으로는 99% 이상의 상동성을 갖는 아미노산 서열을 포함하는 단백질을 코딩하는 뉴클레오티드 서열을 포함할 수 있고, 미생물이 마이코스포린 유사 아미노산을 생산할 수 있는 한 상기 상동성을 벗어난 단백질을 코딩하는 뉴클레오티드 서열도 제한 없이 포함할 수 있다. 구체적으로, 마이코스포린 유사 아미노산 생합성 유전자는 서열번호 102, 103, 104, 105, 106, 107, 108, 또는 109의 뉴클레오티드 서열을 포함할 수 있으나, 이에 제한되지 않는다.
또한, 상기 서열과 상동성을 가지는 서열로서 실질적으로 기재된 서열번호의 단백질과 동일하거나 상응하는 생물학적 활성을 가지는 아미노산 서열이라면, 일부 서열이 결실, 변형, 치환 또는 부가된 아미노산 서열을 가지는 경우도 역시 본원의 범주에 포함됨은 자명하다.
또한, 상기 뉴클레오티드 서열은 코돈의 축퇴성(degeneracy)으로 인하여 상기 단백질을 발현시키고자 하는 생물에서 선호되는 코돈을 고려하여, 코딩영역으로부터 발현되는 단백질의 아미노산 서열을 변화시키지 않는 범위 내에서 코딩영역에 다양한 변형이 이루어질 수 있다. 따라서, 상기 마이코스포린 유사 아미노산 생합성 유전자는 마이코스포린 유사 아미노산 생합성에 관여하는 단백질을 코딩하는 뉴클레오티드 서열이면 본원에 제한없이 포함될 수 있다.
또는, 공지의 유전자 서열로부터 조제될 수 있는 프로브, 예를 들면, 상기 뉴클레오티드 서열의 전체 또는 일부에 대한 상보 서열과 엄격한 조건 하에 하이브리드화하여, 마이코스포린 유사 아미노산 생합성에 관여하는 단백질을 암호화하는 서열이라면 본원에 제한 없이 포함될 수 있다.
일 실시예에 따르면, 마이코스포린 유사 아미노산을 생산하는 미생물은, 서로 유래가 다른 마이코스포린 유사 아미노산 생합성 유전자들을 포함할 수 있다.
본원에서 단백질의 활성 강화 및/또는 유전자의 도입은 순서에 상관없이 동시, 순차, 역순으로 수행될 수 있다.
상기 마이코스포린 유사 아미노산을 생산하는 미생물은 마이코스포린 유사 아미노산 생합성 유전자 클러스터를 포함하여 마이코스포린 유사 아미노산을 생산할 수 있고, 추가적으로, 2-디하이드로-3-데옥시포스포헵토네이트 알돌라제, 포스포에놀피루베이트 신테타제 및 트랜스케톨라제로 이루어진 군으로부터 선택되는 하나 이상의 단백질의 활성을 강화시킴으로써, 마이코스포린 유사 아미노산의 생산능을 증가시킨 미생물일 수 있다. 또한, 본원의 미생물은 2-디하이드로-3-데옥시포스포헵토네이트 알돌라제, 포스포에놀피루베이트 신테타제 및 트랜스케톨라제로 이루어진 군으로부터 선택되는 하나 이상의 단백질의 활성을 강화시킴으로써, 마이코스포린 유사 아미노산의 생산능을 증가시킨 미생물인 한 제한이 없으나, 구체적으로, 코리네박테리움 속 미생물, 에스케리키아 속 미생물, 또는 효모일 수 있다.
상기 코리네박테리움 속 미생물은 구체적으로, 코리네박테리움 글루타미쿰(Corynebacterium glutamicum), 코리네박테리움 암모니아게네스(Corynebacterium ammoniagenes), 브레비박테리움 락토퍼멘텀 (Brevibacterium lactofermentum), 브레비박테리움 플라범(Brevibacterium flavum), 코리네박테리움 써모아미노게네스(Corynebacterium thermoaminogenes), 코리네박테리움 에피션스(Corynebacterium efficiens) 등일 수 있으며, 더욱 구체적으로는, 코리네박테리움 글루타미쿰일 수 있으나, 이에 제한되지 않는다.
상기 에스케리키아 속 미생물은 구체적으로, 에스케리키아 알베르티(Escherichia albertii), 에스케리키아 콜라이(Escherichia coli), 에스케리키아 페르구소니(Escherichia fergusonii), 에스케리키아 헤르마니(Escherichia hermannii), 에스케리키아 불네리스(Escherichia vulneris)등일 수 있으며, 더욱 구체적으로는, 에스케리키아 콜라이일 수 있으나, 이에 제한되지 않는다.
상기 효모는 상기 효모는 구체적으로, 자낭균문(Ascomycota)인 사카로미케스아문(Saccharomycotina), 외자낭균아문(Taphrinomycotina), 또는 담자균문(Basidiomycota)인 담자균아문(Agaricomycotina), 녹균아문(Pucciniomycotina)등에 속하는 미생물일 수 있으며, 더욱 구체적으로 사카로마이세스(Saccharomyces) 속 미생물, 쉬조사카로미세스(Schizosaccharomyces) 속 미생물, 파피아(Phaffia) 속 미생물, 클루이베로미세스(Kluyveromyces) 속 미생물, 피키아(Pichia) 속 미생물, 칸디다(Candida) 속 미생물일 수 있다. 보다 더욱 구체적으로는, 사카로마이세스 세레비지에(Saccharomyces cerevisiae)일 수 있으나, 이에 제한되지 않는다.
본원의 다른 하나의 양태는 본원의 미생물을 배지에서 배양하는 단계; 및 상기 배양된 미생물 또는 배지로부터 마이코스포린 유사 아미노산을 회수하는 단계를 포함하는, 마이코스포린 유사 아미노산의 생산방법을 제공한다.
상기 "미생물"및 "마이코스포린 유사 아미노산"은 전술한 바와 같다.
본원에서 "배양"은 상기 미생물을 적당히 조절된 환경 조건에서 생육시키는 것을 의미한다. 본원의 배양과정은 당업계에 알려진 적당한 배지와 배양조건에 따라 이루어질 수 있다. 이러한 배양 과정은 선택되는 미생물에 따라 당업자가 용이하게 조정하여 사용할 수 있다. 상기 미생물을 배양하는 단계는, 특별히 이에 제한되지 않으나, 공지된 회분식 배양방법, 연속식 배양방법, 유가식 배양방법 등에 의해 수행될 수 있다. 본원의 미생물의 배양에 사용되는 배지 및 기타 배양 조건은 통상의 미생물의 배양에 사용되는 배지라면 특별한 제한 없이 어느 것이나 사용할 수 있으나, 구체적으로는 본원의 미생물을 적당한 탄소원, 질소원, 인원, 무기화합물, 아미노산 및/또는 비타민 등을 함유한 통상의 배지 내에서 호기성 조건 하에서 온도, pH 등을 조절하면서 배양할 수 있다. 구체적으로, 염기성 화합물(예: 수산화나트륨, 수산화칼륨 또는 암모니아) 또는 산성 화합물(예: 인산 또는 황산)을 사용하여 적정 pH(예컨대, pH 5 내지 9, 구체적으로는 pH 6 내지 8, 가장 구체적으로는 pH 6.8)를 조절할 수 있으나, 이에 제한 되는 것은 아니다. 또한, 배양물의 호기상태를 유지하기 위하여, 배양물 내로 산소 또는 산소 함유 기체를 주입하거나, 혐기 및 미호기 상태를 유지하기 위해 기체의 주입 없이 혹은 질소, 수소 또는 이산화탄소 가스를 주입할 수 있으나, 이에 제한 되는 것은 아니다. 또한, 배양온도는 20 내지 45, 구체적으로는 25 내지 40 를 유지할 수 있고, 약 10 내지 160 시간 동안 배양할 수 있으나, 이에 제한 되는 것은 아니다. 또한, 배양 중에는 지방산 폴리글리콜 에스테르와 같은 소포제를 사용하여 기포 생성을 억제할 수 있으나, 이에 제한 되는 것은 아니다.
아울러, 사용되는 배양용 배지는 탄소 공급원으로는 당 및 탄수화물 (예: 글
루코오스, 슈크로오스, 락토오스, 프럭토오스, 말토오스, 몰라세, 전분 및 셀룰로오스), 유지 및 지방 (예: 대두유, 해바라기씨유, 땅콩유 및 코코넛유), 지방산 (예: 팔미트산, 스테아르산 및 리놀레산), 알코올 (예: 글리세롤 및 에탄올) 및 유기산 (예: 아세트산) 등을 개별적으로 사용하거나 또는 혼합하여 사용할 수 있으나, 이에 제한되지 않는다. 질소 공급원으로는 질소-함유 유기 화합물 (예: 펩톤, 효모 추출액, 육즙, 맥아 추출액, 옥수수 침지액, 대두 박분 및 우레아), 또는 무기 화합물 (예: 황산암모늄, 염화암모늄, 인산암모늄, 탄산암모늄 및 질산암모늄) 등을 개별적으로 사용하거나 또는 혼합하여 사용할 수 있으나, 이에 제한되지 않는다. 인 공급원으로 인산 이수소칼륨, 인산수소이칼륨, 이에 상응하는 나트륨 함유염 등을 개별적으로 사용하거나 또는 혼합하여 사용할 수 있으나, 이에 제한되지 않는다. 또한, 배지에는 기타 금속염 (예: 황산마그네슘 또는 황산철), 아미노산 및 비타민과 같은 필수성장-촉진 물질을 포함할 수 있다.
상기 배양에 의하여 생산된 MAAs는 배지 중으로 분비되거나 세포 내에 잔류할 수 있다.
본원에서 용어, "배지"는 본원의 미생물을 배양할 배양배지 및/또는 배양한 다음 수득한 산물을 의미한다. 상기 배지는 미생물을 포함하는 형태 및 상기 미생물을 포함하는 배양액에서 원심분리, 여과 등으로 미생물을 제거한 형태도 모두 포함하는 개념이다.
본원의 상기 배양 단계에서 생산된 MAAs를 회수하는 단계는 배양방법에 따라 당해 분야에 공지된 적합한 방법을 이용하여 배양액으로부터 목적하는 MAAs를 수집할 수 있다. 예를 들어, 원심분리, 여과, 음이온 교환 크로마토그래피, 결정화 및 HPLC 등이 사용될 수 있으며, 당해 분야에 공지된 적합한 방법을 이용하여 배양된 미생물 또는 배지로부터 목적하는 MAAs를 회수할 수 있다. 상기 MAAs를 회수하는 단계는 분리 공정 및/또는 정제 단계를 추가적으로 포함할 수 있다.
본원의 미생물은 마이코스포린 유사 아미노산의 생산능이 향상되어, 마이코스포린 유사 아미노산을 생산하는 데 효율적으로 사용될 수 있다.
이하 본 출원을 실시예에 의해 보다 상세하게 설명한다. 그러나 이들 실시예는 본 출원을 예시적으로 설명하기 위한 것으로, 본 출원의 범위가 이들 실시예에 의해 제한되는 것은 아니다.
<대장균 기반 MAAs 생산 재조합 미생물 제작 및 이를 이용한 MAAs 생산>
실시예 1: 2 - 디하이드로 -3- 데옥시포스포헵토네이트 알돌라제(2-dehydro-3-deoxyphosphoheptonate aldolase ) 활성 강화 균주 제작
미생물의 MAAs 생산능을 증가시키기 위하여, 2-디하이드로-3-데옥시포스포헵토네이트 알돌라제의 활성이 강화된 대장균을 제작하였다. 구체적으로, 대장균 W3110을 기반균주로 하여 aroG(2-디하이드로-3-데옥시포스포헵토네이트 알돌라제; 서열번호 1 및 2) 유전자를 추가로 도입하였다. 플라스미드의 제작에 사용된 주형 및 프라이머는 하기 [표 1]과 같다.
Figure 112018019301625-pat00007
상기 주형 및 프라이머를 사용하여 PCR을 통해 유전자 단편을 증폭한 후, fhuA arm 1과 fhuA arm 2 유전자 단편을 BamH1-Spe1 제한효소로 절단한 pSKH 벡터 (PCT/KR2007/006933)에 상기 증폭된 단편을 In-FusionR HD cloning kit(clontech)를 이용하여 결합(ligation) 하였고, 제조된 벡터는 pSKH-ㅿfhuA로 명명하였다. 상기 fhuA 유전자 결손으로 인해 대장균의 파지감염이 억제된다.
Pn_aroG 유전자 단편은 Spe1-EcoRV 제한효소로 절단한 pSKH-ㅿfhuA 벡터에 In-FusionR HD cloning kit(clontech)를 이용하여 결합(ligation)하였고, 강화된 프로모터로 알려진 Ptrc와 Pcj1 유전자 단편은 Spe1-Nde1 제한효소로 절단하고 aroG 유전자 단편은 Nde1-EcoRV 제한효소로 절단한 다음, Ptrc와 aroG 유전자 단편 또는 Pcj1(대한민국 등록특허 제10-620092호)와 aroG 유전자 단편을 각각 Spe1-EcoRV 제한효소로 절단한 pSKH-ㅿfhuA 벡터에 In-FusionR HD cloning kit(clontech)를 이용하여 결합(ligation) 하였다. 제조된 벡터는 각각 pSKH-ㅿfhuA-Pn-aroG , pSKH-ㅿfhuA-Ptrc-aroG, pSKH-ㅿfhuA-Pcj1-aroG로 명명하였다.
상기 벡터는 시퀀싱을 통하여 클로닝 여부와 벡터의 유전자 서열을 확인한 후, 야생형 대장균 W3110 균주에 전기천공법으로 형질전환 시켰다. 형질 전환된 유전자는 1차 재조합(교차)에 의해 염색체에 도입된 후, 2차 재조합(교차)을 통해 염색체로부터 플라스미드 부위의 절제(excision)가 일어났다. 상기 2차 재조합이 완료된 대장균 형질전환 주들을 대상으로 서열번호 14(정방향) 및 8(역방향)의 프라이머를 사용한 PCR을 통해 aroG 유전자 도입을 확인하였다.
실시예 2: 미세조류 유래 시노린 생합성 유전자를 과발현하는 벡터 제작
A. variabilis 기반 시노린 생합성 유전자 클러스터는 2-디메틸 4-데옥시가두솔 신테이즈(2-demetyl 4-deoxygadusol synthase), O-메틸트랜스퍼라제(O-methyltransferase), C-N 라이게이즈(C-N ligase), 및 논-리보좀 펩티드 신테이즈(non-ribosomal peptide synthetase)를 암호화 하는 4개의 유전자(Ava_ABCD)로 이루어져 있으며, A. variabilis ATCC29413 게놈 DNA를 이용하여 시노린 생합성 유전자 클러스터를 동정하였다. pECCG117_Pcj1_GFP_terminator 벡터를 이용하여, A. variabilis ATCC29413 로부터 유래한 시노린 생합성 유전자를 포함하는 벡터를 제작하였다. 시노린 생합성 유전자 발현 벡터의 명칭과 벡터를 제작하기 위해 사용한 각각의 주형 및 프라이머는 하기 [표 2]와 같다.
Figure 112018019301625-pat00008
상기 주형과 프라이머를 이용하여 유전자 단편을 수득한 후, 각각의 유전자 단편은 EcoRV-XbaI 제한효소를 처리한 pECCG 117_Pcj1_GFP_terminator 벡터에 In-FusionR HD cloning kit(clontech)를 이용하여 결합(ligation)되었다. 제조된 벡터는 pECCG117_Pcj1_Ava_ABCD으로 명명하였고, 시퀀싱을 통하여 클로닝 여부와 벡터의 유전자 서열을 확인되었다. Ava_ABCD의 뉴클레오타이드 서열은 서열번호 17에 명시하였다.
실시예 3: 2 - 디하이드로 -3- 데옥시포스포헵토네이트 알돌라제 활성 강화 균주의 시노린 생산능 평가
실시예 1에서 제작된 aroG 유전자 강화 균주 및 야생형 W3110 균주에 실시예 2에서 제작된 pECCG117_Pcj1_Ava_ABCD 플라스미드를 각각 전기천공법을 통해 도입한 후, LB 고체 배지에 도말하였다. 상기 균주를 37℃ 배양기에서 밤새 배양한 후, 25 mL 역가 배지[배지 조성: 포도당 40 g/L, KH2PO4 0.3 g/L, K2HPO4 0.6 g/L, (NH4)2SO4 15 g/L, MgSO47H2O 1 g/L, NaCl 2.5 g/L, Sodium citrate 1.2 g/L, 효모 추출물 2.5 g/L, 탄산칼슘 40 g/L: pH7.0]에 한 백금이 씩 접종한 다음, 이를 37℃, 200 rpm의 배양기에서 48시간 배양하였으며, HPLC(waters社)를 이용한 이의 분석 결과를 [표 3]에 나타내었다. 
Figure 112018019301625-pat00009
상기 [표 3]에 나타낸 바와 같이, 유전자 aroG가 강화된 균주(W3110ㅿfhuA::Pn-aroG/pECCG117_Pcj1_Ava_ABCD)에서 생산된 시노린 농도는 대조군 대비 약 20% 증가하였다. 특히, 프로모터를 강화하여 유전자 aroG가 강화된 균주(W3110ㅿfhuA::Ptrc-aroG/pECCG117_Pcj1_Ava_ABCD,W3110ㅿfhuA::Pcj1-aroG/ pECCG117_Pcj1_Ava_ABCD)의 경우는 69%, 94% 증가하였다.
실시예 4: 포스포에놀피루베이트 신테타제 ( phosphoenolpyruvate synthetase )의 활성 강화 균주 제작
미생물의 MAAs 생산능을 증가시키기 위하여, 포스포에놀피루베이트 신테타제 의 활성이 강화된 대장균을 제작하였다. 구체적으로, 대장균 W3110을 기반균주로하여 pps(포스포에놀피루베이트 신테타제; 서열번호 18 및 19)유전자를 추가로 도입하였다. 플라스미드의 제작에 사용된 주형 및 프라이머는 하기 [표 4]과 같다.
Figure 112018019301625-pat00010
상기 주형 및 프라이머를 사용하여 PCR을 통해 유전자 단편을 증폭한 후, Pn_pps 유전자 단편은 Spe1-EcoRV 제한효소로 절단한 pSKH-ㅿfhuA 벡터에 In-FusionR HD cloning kit(clontech)를 이용하여 결합(ligation) 하였고, 실시예 1에서 제작된 Ptrc와 Pcj1 유전자 단편은 Spe1-Nde1 제한효소로 절단하고 pps 유전자 단편은 Nde1-EcoRV 제한효소로 절단한 다음, Ptrc와 pps 유전자 단편 또는 Pcj1와 pps 유전자 단편을 각각 Spe1-EcoRV 제한효소로 절단한 pSKH-ㅿfhuA 벡터에 In-FusionR HD cloning kit(clontech)를 이용하여 결합(ligation)하였다. 제조된 벡터는 각각 pSKH-ㅿfhuA-Pn-pps, pSKH-ㅿfhuA-Ptrc-pps, pSKH-ㅿfhuA-Pcj1-pps로 명명하였다.
상기 벡터는 시퀀싱을 통하여 클로닝 여부와 벡터의 유전자 서열을 확인한 후, 야생형 대장균 W3110 균주에 전기천공법으로 형질전환시켰다. 형질전환된 유전자는 1차 재조합(교차)에 의해 염색체에 도입된 후, 2차 재조합(교차)을 통해 염색체로부터 플라스미드 부위의 절제(excision)가 일어났다. 상기 2차 재조합이 완료된 대장균 형질전환 주들을 대상으로 서열번호 14(정방향) 및 21(역방향)의 프라이머를 사용한 PCR을 통해 pps 유전자 도입을 확인하였다.
실시예 5: 포스포에놀피루베이트 신테타제 활성 강화 균주의 시노린 생산능 평가
실시예 4에서 제작된 pps 유전자 도입 균주 및 야생형 W3110 균주에 실시예 2에서 제작된 pECCG117_Pcj1_Ava_ABCD 플라스미드를 각각 전기천공법을 통해 도입한 후, LB 고체 배지에 도말하였다. 상기 균주를 37℃ 배양기에서 밤새 배양한 후, 상기 실시예 3의 25mL 역가 배지에 한 백금이 씩 접종한 다음, 이를 37℃, 200 rpm의 배양기에서 48시간 배양하였으며, 이의 결과를 [표 5]에 나타내었다.
Figure 112018019301625-pat00011
상기 [표 5]에 나타낸 바와 같이, 유전자 pps가 강화된 균주에서 생산된 시노린 농도는 41% 증가하였으며, 강한 프로모터로 치환함으로써 이의 활성을 강화시킨 경우는 대조군 대비 최대 60% 증가하였다.
실시예 6: 트랜스케톨라제 ( transketolase I/II)의 활성 강화 균주 제작
미생물의 MAAs 생산능을 증가시키기 위하여, 트랜스케톨라제의 활성이 강화된 대장균을 제작하였다. 구체적으로, 대장균 W3110을 기반균주로하여 tktA (트랜스케톨라제; 서열번호 23 및 24) 유전자를 추가로 도입하였다. 플라스미드의 제작에 사용된 주형 및 프라이머는 하기 [표 6]과 같다.
Figure 112018019301625-pat00012
상기 주형 및 프라이머를 사용하여 PCR을 통해 유전자 단편을 증폭한 후, Pn_tktA 유전자 단편은 Spe1-EcoRV 제한효소로 절단한 pSKH-ㅿfhuA 벡터에 In-FusionR HD cloning kit(clontech)를 이용하여 결합(ligation) 하였고, 실시예 1에서 제작된 Ptrc와 Pcj1 유전자 단편은 Spe1, Nde1 제한효소로 절단하고 tktA 유전자 단편은 Nde1-EcoRV 제한효소로 절단한 다음, Ptrc와 tktA 유전자 단편 또는 Pcj1와 tktA 유전자 단편을 각각 Spe1-EcoRV 제한효소로 절단한 pSKH-ㅿfhuA 벡터에 In-FusionR HD cloning kit(clontech)를 이용하여 결합(ligation)하였다. 제조된 벡터는 각각 pSKH-ㅿfhuA-Pn-tktA , pSKH-ㅿfhuA-Ptrc-tktA , pSKH-ㅿfhuA-Pcj1-tktA 로 명명하였다.
상기 벡터는 시퀀싱을 통하여 클로닝 여부와 벡터의 유전자 서열을 확인한 후, 야생형 대장균 W3110 균주에 전기천공법으로 형질전환 시켰다. 형질 전환된 유전자는 1차 재조합(교차)에 의해 염색체에 도입된 후, 2차 재조합(교차)을 통해 염색체로부터 플라스미드 부위의 절제(excision)가 일어났다. 상기 2차 재조합이 완료된 대장균 형질전환 주들을 대상으로 서열번호 14(정방향) 및 26(역방향)의 프라이머를 사용한 PCR을 통해 tktA 유전자 도입을 확인하였다.
실시예 7: 트랜스케톨라제의 활성 강화 균주의 시노린 생산능 평가
실시예 6에서 제작된 tktA 유전자 도입 균주 및 야생형 W3110 균주에 실시예 2에서 제작된 pECCG117_Pcj1_Ava_ABCD 플라스미드를 각각 전기천공법을 통해 도입한 후, LB 고체 배지에 도말하였다. 상기 균주를 37℃ 배양기에서 밤새 배양한 후, 상기 실시예 3의 25mL 역가 배지에 한 백금이 씩 접종한 다음, 이를 37℃, 200 rpm의 배양기에서 48시간 배양하였으며, 이의 결과를 [표 7]에 나타내었다. 
Figure 112018019301625-pat00013
상기 [표 7]에 나타낸 바와 같이, 유전자 tktA가 강화된 균주에서 생산된 시노린 농도는 4.5% 증가하였으며, 강한 프로모터로 치환하여 이의 활성을 강화한 경우는 대조군 대비 최대 32% 증가하였다.
실시예 8: 2 - 디하이드로 -3- 데옥시포스포헵토네이트 알돌라제 / 포스포에놀피루베이트 신테타제 / 트랜스케톨라제의 활성 강화 균주 제작
미생물의 MAAs 생산능을 증가시키기 위하여, 2-디하이드로-3-데옥시포스포헵토네이트 알돌라제/ 포스포에놀피루베이트 신테타제/트랜스케톨라제 의 활성이 강화된 대장균을 제작하였다. 구체적으로, 대장균 W3110을 기반균주로하여 aroG, pps, tktA 유전자를 추가로 도입하였다. 플라스미드의 제작에 사용된 주형 및 프라이머는 하기 [표 8]과 같다.
Figure 112018019301625-pat00014
상기 주형 및 프라이머를 사용하여 PCR을 통해 유전자 단편을 증폭한 후, Spe1-EcoRV 제한효소로 절단한 pSKH-ㅿfhuA 벡터에 In-FusionR HD cloning kit(clontech)를 이용하여 결합(ligation) 하였다. 제조된 벡터는 pSKH-ㅿfhuA-Pcj1-aroG-Pcj1-ppsA-Pcj1-tktA로 명명하였다.
상기 벡터는 시퀀싱을 통하여 클로닝 여부와 벡터의 유전자 서열을 확인한 후, 야생형 대장균 W3110 균주에 전기천공법으로 형질전환 시켰다. 형질전환된 유전자는 1차 재조합(교차)에 의해 염색체에 도입된 후, 2차 재조합(교차)을 통해 염색체로부터 플라스미드 부위의 절제(excision)가 일어났다. 상기 2차 재조합이 완료된 대장균 형질전환 주들을 대상으로 서열번호 14(정방향) 및 26(역방향)의 프라이머를 사용한 PCR을 통해 aroG, pps, tktA 유전자 도입을 확인하였다.
실시예 9: 2 - 디하이드로 -3- 데옥시포스포헵토네이트 알돌라제 / 포스포에놀피루 베이트 신테타제 / 트랜스케톨라제의 활성 강화 균주의 시노린 생산능 평가
실시예 8에서 제작된 aroG, pps, tktA 유전자 도입 균주 및 야생형 W3110 균주에 실시예 2에서 제작된 pECCG117 Pcj1_Ava_ABCD 플라스미드를 전기천공법을 통해 도입한 후, LB 고체 배지에 도말하였다. 상기 균주를 37℃ 배양기에서 밤새 배양한 후, 상기 실시예 3의 25mL 역가 배지에 한 백금이 씩 접종한 다음, 이를 37℃, 200rpm의 배양기에서 48시간 배양하였으며, 이의 결과를 [표 9]에 나타내었다.
Figure 112018019301625-pat00015
상기 [표 9]에 나타낸 바와 같이, 유전자 3종(aroG, pps, tktA)이 조합되어 강화된 균주에서 생산된 시노린 농도는 대조군 대비 267% 증가하였다. 이는 각 유전자의 프로모터를 강한 프로모터로 치환하여 얻은 최대 증가량의 합보다 예상치 못한 수준으로 향상된 결과이다. 즉, 상기 aroG, pps, tktA 3종의 유전자가 조합되는 경우, 보다 높은 농도의 시노린 생산이 가능함을 확인하였다.
실시예 10: 3 - 디하이드로퀴네이트 디히드라타제 (3- dehydroquinate dehydratase)가 불활성된 균주 제작
미생물의 MMAs 생산능을 증가시키기 위하여, 3-디하이드로퀴네이트 디히드라타제(aroD)가 불활성된 균주를 제작하였다.
구체적으로, 유전자 삽입 마커로 pKD3의 클로람페니콜(chloramphenicol) 내성 유전자가 사용되었으며, aroD 유전자 일부분과 pKD3 플라스미드의 클로람페니콜 내성 유전자를 포함하는 aroD 결손 카세트는 서열번호 32(정방향) 및 33(역방향)의 프라이머를 이용하여 PCR을 통해 제작되었다. 야생형 대장균 W3110 및 실시예 8에서 제작한 aroG, ppstktA 유전자 도입 균주에 람다 레드 재조합효소 유전자를 포함하는 pKD46 플라스미드를 형질전환하고, 아라비노스(arabinose)를 이용하여 해당 유전자의 발현을 유도하여 컴피턴트 세포를 제작하였다. 상기 컴피턴트 세포에 aroD 결손 카세트를 전기천공법을 이용하여 도입한 후, 클로람페니콜이 30mg/L 포함된 LB 고체 배지에 도말하였다. 이렇게 얻어진 균주를 서열번호 34(정방향) 및 35(역방향)의 프라이머를 이용하여 PCR하였고, 1300bp 증폭된 단편의 관찰을 통해 aroD 유전자 결손을 확인하였다.
실시예 11: 3 - 디하이드로퀴네이트 디히드라타제가 불활성된 균주의 시노린 생산능 평가
실시예 10에서 제작된 aroD 유전자가 결손된 균주에 실시예 2에서 제작된 pECCG117 Pcj1_Ava_ABCD 플라스미드를 전기천공법을 통해 도입한 후, LB 고체 배지에 도말하였다. 상기 균주를 37℃ 배양기에서 밤새 배양한 후, 상기 실시예 3의 25mL 역가 배지에 한 백금이 씩 접종한 다음, 이를 37℃, 200rpm의 배양기에서 48시간 배양하였으며, 이의 결과를 [표 10]에 나타내었다. 
Figure 112018019301625-pat00016
상기 [표 10]에 나타낸 것과 같이, aroG, pps, tktA가 강화된 시노린 생산균주 대비, 추가적으로 aroD가 결손된 균주는 시노린의 농도가 66% 증가하였다. 상기 aroG, pps, tktA가 강화된 균주 W3110ㅿfhuA::Pcj1-aroG-Pcj1-pps-Pcj1-tktA / pECCG117_PCJ1_Ava_ABCD 균주를 CB06-0020으로 명명하였고, 부다페스트 조약하에 2018년 2월 14일자로 한국미생물보존센터(Korean Culture Center of Microorganisms, KCCM)에 기탁하여 기탁번호 KCCM12224P를 부여받았다.
< 코리네박테리움 글루타미쿰 기반 MAAs 생산 재조합 미생물 제작 및 이를 이용한 MAAs 생산>
실시예 12: 2 - 디하이드로 -3- 데옥시포스포헵토네이트 알돌라제 활성 강화 벡터 제작 및 시노린 생산능 평가
미생물의 MAAs 생산능을 증가시키기 위하여, 2-디하이드로-3-데옥시포스포헵토네이트 알돌라제의 활성이 강화된 코리네박테리움속 미생물을 제작하였다. 구체적으로, 코리네박테리움 글루타미쿰 ATCC13032를 기반균주로하여, aroG (2-디하이드로-3-데옥시포스포헵토네이트 알돌라제; 서열번호 36 및 37)유전자를 추가로 도입하였다. 플라스미드의 제작에 사용된 주형 및 프라이머는 하기 [표 11]과 같다.
Figure 112018019301625-pat00017
상기 주형과 프라이머를 이용하여 유전자 단편을 수득한 후, 각각의 유전자 단편은 EcoRV/ XbaI 제한효소로 처리한 pECCG 117, pECCG 117_Pcj7_GFP_terminator(대한민국 등록특허 제10-620092호, p117-cj7-gfp) 벡터에 In-FusionR HD cloning kit (clontech)을 이용하여 결합(ligation)되었다. 제조된 벡터는 각각 pECCG117_Pn_cgl aroG, pECCG117_Pcj7_cgl aroG 로 명명하였다. 상기 벡터들은 시퀀싱을 통하여 클로닝 여부와 벡터의 유전자 서열을 확인하였다.
먼저, 코리네박테리움 속 미생물은 시노린을 생산하지 못하므로, 시노린 생합성경로를 도입한 균주를 제작하였다. 구체적으로, pECCG117_Ptrc_Ava_ABCD를 주형으로 하고 서열번호 42(정방향)과 43(역방향)의 프라이머 쌍을 이용하여 Ava_ABCD를 PCR하였다. 약 7kb의 PCR 단편을, NdeI 제한효소 처리한 pDZTn 벡터(국제공개특허 WO 2009-125992A)에 In-FusionR HD cloning kit(clontech)를 이용하여 결합(ligation)하여 pDZTn_Ava_ABCD를 제작하였다. 그 뒤 서열번호 44(정방향)과 45(역방향)의 프라이머 쌍으로 O2 프로모터(대한민국 등록특허 제10-1632642호) 단편을 PCR 하였고, pDZTn_Ava_ABCD를 NdeI 제한효소 처리한 벡터에 In-FusionR HD cloning kit(clontech)를 이용하여 결합(ligation)하여 pDZTn_PO2_Ava_ABCD를 제작하였다.
상기의 재조합 플라스미드를 야생의 코리네박테리움 글루타미쿰 ATCC13032에 전기천공법으로 형질전환시켜(van der Rest et al. 1999), 상기 플라스미드를 1차 재조합(교차)에 의해 염색체에 도입한 후, 2차 재조합(교차)을 통해 염색체로부터 플라스미드를 절제(excision)하였다.
상기 2차 재조합이 완료된 코리네박테리움 글루타미쿰 형질전환주들을 대상으로 각 유전자 특이적 프라이머 (gene-specific primer) 쌍인 서열번호 42 및 43을 사용한 PCR을 통해 Ava_ABCD 유전자의 도입을 확인하였다. 제조된 균주는 코리네박테리움 글루타미쿰 13032 △N1021_PO2_Ava_ABCD로 명명하였다.
상기 코리네박테리움 글루타미쿰 13032 △N1021_PO2_Ava_ABCD 균주에 각각 pECCG117_Pn_cgl aroG, pECCG117_Pcj7_cgl aroG 벡터를 전기천공법으로 형질 전환시켰다.
상기 제작된 균주 및 대조군이 되는 코리네박테리움 글루타미쿰 ATCC13032(c.gl 13032)을 카나마이신(Kanamycin) 포함 BHIS 고체 배지에서 밤새 배양하였으며, 상기 균주들을 25 mL 역가 배지 [배지 조성: 포도당 40 g/L, KH2PO4 1 g/L, (NH4)2SO4 10 g/L, MgSO47H2O 5g/L, NaCl 5 g/L, 효모 추출물 5 g/L, 탄산칼슘 30 g/L: pH7.0]에 한 백금이 씩 접종한 다음, 이를 37℃, 200 rpm의 배양기에서 48 시간 배양하였으며, 이의 결과를 [표 12]에 나타내었다. 
Figure 112018019301625-pat00018
위의 [표 12]에서 보는 것처럼 시노린 생합성 유전자를 포함하는 균주에 aroG 발현양을 증가시켰을 경우, 시노린의 농도가 39% 증가 되었다. 특히 프로모터를 강화한 경우 시노린의 농도는 80%까지 향상될 수 있음을 확인하였다.
실시예 13: 포스포에놀피루베이트 신테타제 / 트랜스케톨라제 활성 강화 벡터 제작 및 시노린 생산능 평가
미생물의 MAAs 생산능을 증가시키기 위하여, tkt 또는 pps의 활성이 강화된 코리네박테리움 글루타미쿰을 제작하였다. 구체적으로, 코리네박테리움 글루타미쿰 ATCC13032를 기반균주로 하여 tkt(트랜스케톨라제; 서열번호 95 및 96) 또는 pps(포스포에놀피루베이트 신테타제; 서열번호 97 및 98) 유전자를 추가로 도입하였다. 플라스미드의 제작에 사용된 주형 및 프라이머는 하기 [표 13]과 같다.
Figure 112018019301625-pat00019
주형과 프라이머 조합을 맞추어 PCR기법을 통해 얻은 유전자 단편과 EcoRV/ XbaI 제한효소 처리한 pECCG117, pECCG117_Ptrc_GFP_terminator 및 pECCG 117_Pcj7_GFP_terminator 벡터를 In-FusionR HD cloning kit(clontech)를 이용하여 결합(ligation)하여 제작 하였다. 제조된 벡터는 각각 pECCG117- Pn-tkt/pECCG117-Pcj7-tkt 및 pECCG117- Ptrc-pps/pECCG117-Pcj7-pps 로 명명하였다. 상기 벡터들은 시퀀싱을 통하여 클로닝 여부와 벡터의 유전자 서열을 확인한 후, 코리네박테리움 글루타미쿰 13032 △N1021_PO2_Ava_ABCD 균주에 전기 천공법으로 형질 전환 시켰다. 제작된 Kanamycin 포함 BHIS 고체 배지에서 밤새 배양한 균주를 상기 실시예 12의 25 mL 역가 배지에 한 백금이 씩 접종한 다음, 이를 37℃, 200 rpm의 배양기에서 48시간 배양하였으며, 이의 결과를 [표 14]에 나타내었다.
Figure 112018019301625-pat00020
상기 [표 14]에 나타낸 바와 같이, 유전자 tkt, pps를 강화시킬 경우 시노린 생산이 각각 최대 57% 또는 72% 향상되는 것을 확인할 수 있었다.
실시예 14: 2 - 디하이드로 -3- 데옥시포스포헵토네이트 알돌라제 / 포스포에놀피루베이트 신테타제/트랜스케톨라제의 활성 강화 균주 제작 및 평가
미생물의 MAAs 생산능을 증가시키기 위하여 aroG, pps tkt의 활성이 강화된 코리네박테리움 글루타미쿰을 제작하였으며, 보다 높은 MAAs 생산량을 확인하기 위하여, 추가적으로 3-디하이드로퀴네이트 디히드라타제(aroD)도 불활성화 시켰다. 구체적으로는, aroG, pps, tktA 유전자의 강화를 위해 pDZ-ㅿaroD-Pcj7-aroG-Pcj7-pps-Pcj7-tktA 플라스미드를 제작하였다. 상기 pDZ-ㅿaroD-Pcj7-aroG-Pcj7-pps-Pcj7-tktA 플라스미드의 제작에 사용된 주형 및 프라이머는 하기 [표 15]와 같다.
Figure 112018019301625-pat00021
우선, 코리네박테리움 글루타미쿰의 aroD 유전자(서열번호 89 및 90) 결실 균주를 제작하기 위하여 aroD의 개방 해독틀(open reading frame)이 내부적으로 결실된 pDZ-ΔaroD 플라스미드를 제작하였다. 상기 pDZ-ΔaroD의 내부적 유전자 소실은 코리네박테리움 글루타미쿰 ATCC 13032 게놈 DNA를 주형으로 서열번호 91과 92 및 서열번호 93과 94의 정방향과 역방향 프라이머 쌍으로 교차 PCR을 하여 생성된 유전자 단편을 pDZ 벡터에 도입하여 제작하였다.
다음으로, 상기 표 15의 주형 및 프라이머를 사용하여 aroG, pps, 그리고 tkt 각각의 유전자 단편을 PCR을 통해 증폭한 후, SpeI 제한효소로 절단한 pDZ-ㅿaroD 벡터에 각각 도입하였다. 상기 벡터 2종은 시퀀싱을 통하여 클로닝 여부와 벡터의 유전자 서열을 확인한 후, 코리네박테리움 글루타미쿰 13032 △N1021_PO2_Ava_ABCD 균주에 전기 천공법으로 형질 전환 시켰다. 제작된 Kanamycin 포함 BHIS 고체 배지에서 밤새 배양한 균주를 상기 실시예 12의 25 mL 역가 배지에 한 백금이 씩 접종한 다음, 이를 37℃, 200rpm의 배양기에서 48시간 배양하였으며, 이의 결과를 [표 16]에 나타내었다.
Figure 112018019301625-pat00022
상기 [표 16]에 나타낸 바와 같이, 유전자 3종 (aroG, pps, tktA)이 강화된 균주에서 생산된 시노린 농도는 대조군 대비 약 25% 증가하였다. 이로부터 aroD 결손을 통해 시노린 생산능을 높인 균주에서도, 상기 3종의 유전자 조합시에는 높은 농도로 시노린을 생산할 수 있음을 확인하였다. 또한, 상기 3종의 유전자의 강화가 조합된 균주에 추가로 aroD 유전자를 불활성화 하는 경우, 보다 높은 농도로 시노린을 생산할 수 있음을 해석할 수 있다.
<Yeast 기반 MAAs 생산 재조합 미생물 제작 및 이를 이용한 MAAs 생산>
실시예 15: 시노린을 생산하는 사카로마이세스 세레비지에 (S. cerevisiae) 주 제작
사카로마이세스 세레비지에(S. cerevisiae)를 시노린 생산 균주로 사용하기 위하여 A. variabilis ATCC29413 유래의 시노린 생합성 유전자를 yeast 발현용 벡터에 도입하였다. pRS-413 벡터에 GPD 프로모터를 사용하여 Ava_A와 Ava_B 유전자를 삽입하였다. 구체적으로, pGPD-Ava_A, pGPD-Ava_B 부위를 overlapping PCR을 사용하여 연결한 후, 벡터와 PCR product를 제한효소 BamH I, Sal I으로 처리한 후, T4 리가아제를 사용하여 연결하여, pRS-413-pGPD-Ava_A-pGPD-Ava_B 벡터를 제작하였다.
다음으로 pRS-414 벡터에 GPD 프로모터를 사용하여 Ava_C와 Ava_D 유전자를 삽입하였다. 구체적으로, pGPD-Ava_C, pGPD-Ava_D 부위를 overlapping PCR을 사용하여 연결한 후, 벡터와 PCR product를 제한효소 BamH I, Sal I으로 처리한 후, T4 리가아제를 사용하여 연결하여, pRS-414-pGPD-Ava_C-pGPD-Ava_D 벡터를 제작하였다. 벡터 제작에 사용한 프라이머와 주형 DNA는 하기 [표 17]에 나타내었다.
Figure 112018019301625-pat00023
pRS-413-pGPD-Ava_A-pGPD-Ava_B 벡터와 pRS-414-pGPD-Ava_C-pGPD-Ava_D 벡터를 사카로마이세스 세레비지에 CEN.PK-1D(S. cerevisiae CEN.PK-1D)에 리튬 아세테이트 형질전환법을 통하여 도입한 후, 시노린 생산 여부를 확인하였다. auxotrophic marker인 Trp, His가 제외된 SC (synthetic complete) 고체 배지에 도말한 후 30℃ 배양기에서 밤새 배양하였다. Trp, His가 제외된 SC (synthetic complete) 고체 배지에서 밤새 배양한 균주를 하기 [표 18]의 25 mL 역가 배지에 한 백금이 씩 접종한 다음, 이를 30℃, 150rpm의 배양기에서 24시간 배양하였으며, 이의 결과를 [표 19]에 나타내었다.
Figure 112018019301625-pat00024
Figure 112018019301625-pat00025
실험 결과, 시노린을 생산하지 않는 야생형 사카로마이세스 세레비지에균주에 시노린 생합성 유전자를 도입한 결과, 331mg/l의 시노린을 생산함을 확인하였다.
실시예 16: 사카로마이세스 세레비지에 TKL1 ( 트랜스케톨라제 ) 강화를 통한 시노린 생산량 증대
MAAs 생산능을 증가시키기 위하여 TKL1의 활성이 강화된 사카로마이세스 세레비지에 균주를 제작하였다. 이를 위해, pRS-415-pGPD, pRS-415-pADH, pRS-415-pTEF 벡터에 TKL1 유전자를(서열번호 110 및 123) 클로닝하여 TKL1 유전자의 발현을 강화하였다.
상기 pRS-415-pGPD 벡터에 포함된 GPD 프로모터는 글리세르알데하이드-3-포스페이트 디하이드로제나제(GAPDH: Glyceraldehyde-3-phosphate dehydrogenase), isozyme 3(TDH3) 유전자의 프로모터로, THD3 유전자 ORF의 개시 코돈으로부터 -674bp 내지 -1bp 서열을 포함한다.
상기 pRS-415-pADH 벡터에 포함된 ADH 프로모터는 알코올 디하이드로제나제(ADH1: Alcohol dehydrogenase) 유전자의 프로모터로, ADH1 유전자 ORF의 개시 코돈으로부터 -1500bp 내지 -1bp 서열을 포함한다.
상기 pRS-415-pTEF 벡터에 포함된 TEF 프로모터는 번역 신장 인자(TEF1: Translational elongation factor EF-1 alpha) 유전자의 프로모터로, TEF1 유전자 ORF의 개시 코돈으로부터 -500bp 내지 -1bp 서열을 포함한다.
구체적으로, 하기 [표 20]의 프라이머를 사용하여 TKL1 유전자를 PCR 한 후, PCR product와 pRS-415-pGPD, pRS-415-pADH, pRS-415-pTEF 벡터를 제한효소 BamH I과 Sal I으로 처리한 후, T4 리가아제를 사용하여 연결하여, pRS-415-pGPD-TKL1, pRS-415-pADH-TKL1, pRS-415-pTEF-TKL1 벡터를 제작하였다.
Figure 112018019301625-pat00026
다음으로 실시예 15에서 제작한 시노린 생합성 플라스미드를 pRS-415-pGPD-TKL1, pRS-415-pADH-TKL1, pRS-415-pTEF-TKL1 와 함께 사카로마이세스 세레비지에 CEN.PK-1D 균주에 도입하여, Trp, Ura, His가 제외된 SC (synthetic complete) 고체 배지에 도말한 후 30℃ 배양기에서 밤새 배양하였다. Trp, Ura, His가 제외된 SC (synthetic complete) 고체 배지에서 밤새 배양한 균주를 25 mL 역가 배지에 한 백금이 씩 접종한 다음, 이를 30℃, 150rpm의 배양기에서 24시간 배양하였으며, 이의 결과를 하기의 [표 21]에 나타내었다.
Figure 112018019301625-pat00027
상기 [표 21]에 나타낸 바와 같이, GPD 프로모터를 사용하여 TKL1 유전자의 발현을 강화한 균주에서 WT 대비 시노린 생산량이 증가함을 확인 하였다. 또한 프로모터의 세기가 증가할 수록(pGPD>pTEF>pADH) 시노린 생산량이 증가함을 추가적으로 확인 하였다.
실시예 17: 사카로마이세스 세레비지에 ARO4 (3- 데옥시 -D- 아라비노 - 헵툴로 소네이트-7-포스페이트(DAHP)신타제) 강화를 통한 시노린 생산량 증대
MAAs 생산능을 증가시키기 위하여 ARO4의 활성이 강화된 사카로마이세스 세레비지에 균주를 제작하였다. 이를 위해, pRS-415-pGPD, pRS-415-pADH, pRS-415-pTEF 벡터에 ARO4 유전자를(서열번호 111 및 124) 클로닝하여 ARO4 유전자의 발현을 강화하는 전략을 사용하였다. 구체적으로, [표 22]의 프라이머를 사용하여 ARO4 유전자를 PCR 한 후, ARO4 PCR product와 pRS-415-pGPD, pRS-415-pADH, pRS-415-pTEF 벡터를 제한효소 BamH I과 Sal I으로 처리한 후, T4 리가아제를 사용하여 연결하여, pRS-415-pGPD-ARO4, pRS-415-pADH-ARO4, pRS-415-pTEF-ARO4 벡터를 제작하였다.
Figure 112018019301625-pat00028
다음으로 실시예 15에서 제작한 시노린 생합성 플라스미드를 pRS-415-pGPD-ARO4, pRS-415-pADH-ARO4, pRS-415-pTEF-ARO4 와 함께 사카로마이세스 세레비지 CEN.PK-1D균주에 도입하여, Trp, Ura, His가 제외된 SC (synthetic complete) 고체 배지에 도말한 후 30℃ 배양기에서 밤새 배양하였다. Trp, Ura, His가 제외된 SC(synthetic complete) 고체 배지에서 밤새 배양한 균주를 25mL 역가 배지에 한 백금이 씩 접종한 다음, 이를 30℃, 150 rpm의 배양기에서 24시간 배양하였으며, 이의 결과를 [표 23]에 나타내었다.
Figure 112018019301625-pat00029
상기 [표 23]에 나타낸 바와 같이, GPD 프로모터를 사용하여 ARO4 유전자의 발현을 강화한 균주에서 WT 대비 시노린 생산량이 187% 증가함을 확인 하였다.
실시예 18: 사카로마이세스 세레비지에 pps ( 포스포에놀피루베이트 신테타 제) 강화를 통한 시노린 생산량 증대
MAAs 생산능을 향상 시키기 위해 pps의 활성이 강화된 사카로마이세스 세레비지에 균주를 제작하였다. 이를 위해, pRS-415-pGPD, pRS-415-pADH, pRS-415-pTEF 벡터에 대장균의 pps 유전자를 클로닝하여 pps 유전자의 발현을 강화하는 전략을 사용하였다.
구체적으로, [표 24]의 프라이머를 사용하여 pps 유전자를 PCR 한 후, pps PCR product와 pRS-415-pGPD, pRS-415-pADH, pRS-415-pTEF 벡터를 제한효소 BamH I과 Sal I으로 처리한 후, T4 리가아제를 사용하여 연결하여, pRS-415-pGPD-pps, pRS-415-pADH-pps, pRS-415-pTEF-pps 벡터를 제작하였다.
Figure 112018019301625-pat00030
다음으로 실시예 15에서 제작한 시노린 생합성 플라스미드를 pRS-415-pGPD- pps, pRS-415-pADH-pps, pRS-415-pTEF-pps 와 함께 사카로마이세스 세레비지에 CEN.PK-1D 균주에 도입하여, Trp, Ura, His가 제외된 SC (synthetic complete) 고체 배지에 도말한 후 30℃ 배양기에서 밤새 배양하였다. Trp, Ura, His가 제외된 SC(synthetic complete) 고체 배지에서 밤새 배양한 균주를 25 mL 역가 배지에 한 백금이 씩 접종한 다음, 이를 30℃, 150rpm의 배양기에서 24시간 배양하였으며, 이의 결과를 [표 25]에 나타내었다.
Figure 112018019301625-pat00031
상기 [표 25]에 나타낸 바와 같이 pps 유전자를 과발현한 균주에서 WT 대비 시노린 생산량이 70% 증가함을 확인 하였다. 또한 프로모터의 세기가 증가할 수록(pGPD>pTEF>pADH) 시노린 생산량이 증가함을 추가적으로 확인하였다.
실시예 19: 사카로마이세스 세레비지에 균주에서 TKL1 강화, ARO4 강화, pps 유전자 도입을 통한 시노린 생산량 증대
실시예 16, 17 및 18의 결과를 토대로 사카로마이세스 세레비지에 에서 시노린 생합성에 영향을 주는 유효 인자로 TKL1 , ARO4 , pps(E. coli ) 유전자를 선정하고, 이 3가지 유전자의 동시 강화를 통하여 시노린 생합성을 증대시키고자 하였다. 유효 유전자 3종을 도입하기 위하여 pRS-415-pGPD-TKL1-pGPD-ARO4, pRS-416-pGPD-pps 벡터를 제작하였다. 구체적으로, pGPD-TKL1, pGPD-ARO4 부위를 overlapping PCR을 사용하여 연결한 후, 벡터와 PCR product를 제한 효소 BamH I, Sal I으로 처리한 후, T4 리가아제를 사용하여 연결하여, pRS-415-pGPD-TKL1-pGPD-ARO4 벡터를 제작하였다.
다음으로 대장균 유래의 pps 유전자를 PCR 한 후, pps PCR product와 pRS-416-pGPD 벡터를 제한 효소 BamH I과 Sal I으로 처리한 후, T4 리가아제를 사용하여 연결하여, pRS-416-pGPD-pps 벡터를 제작하였다. 벡터 제작에 사용한 프라이머와 주형 DNA는 [표 26]에 나타내었다.
Figure 112018019301625-pat00032
다음으로 실시예 15에서 제작한 시노린 생합성 플라스미드를 pRS-415-pGPD-TKL1-pGPD-ARO4, pRS-416-pGPD-pps 벡터와 함께 사카로마이세스 세레비지에 CEN.PK-1D 균주에 도입하여, Leu, Trp, Ura, His가 제외된 SC (synthetic complete) 고체 배지에 도말한 후 30℃ 배양기에서 밤새 배양하였다. Leu, Trp, Ura, His가 제외된 SC (synthetic complete) 고체 배지에서 밤새 배양한 균주를 25 mL 역가 배지에 한 백금이 씩 접종한 다음, 이를 30℃, 150 rpm의 배양기에서 24시간 배양하였으며, 이의 결과를 [표 27]에 나타내었다. 
Figure 112018019301625-pat00033
상기 [표 27]에 나타낸 바와 같이, 유효 유전자 3종(pps, TKL1, ARO4 ) 과발현된 균주에서 WT 대비 시노린 생산량이 230% 로 획기적으로 증가함을 확인하였다.
본 명세서는 본 발명의 기술 분야에서 통상의 지식을 가진 자이면 충분히 인식하고 유추할 수 있는 내용은 그 상세한 기재를 생략하였으며, 본 명세서에 기재된 구체적인 예시들 이외에 본 발명의 기술적 사상이나 필수적 구성을 변경하지 않는 범위 내에서 보다 다양한 변형이 가능하다. 따라서 본 발명은 본 명세서에서 구체적으로 설명하고 예시한 것과 다른 방식으로 실시될 수 있으며, 이는 본 발명의 기술 분야에 통상의 지식을 가진 자이면 이해할 수 있는 사항이다.
한국미생물보존센터 KCCM12224P 20180214
<110> CJ CheilJedang Corporation <120> A microorganism for producing a Mycosporine-like amino acid and a method for preparing a Mycosporine-like amino acid using the same <130> KPA171169-KR <160> 124 <170> KoPatentIn 3.0 <210> 1 <211> 1053 <212> DNA <213> Escherichia coli W3110 <400> 1 atgaattatc agaacgacga tttacgcatc aaagaaatca aagagttact tcctcctgtc 60 gcattgctgg aaaaattccc cgctactgaa aatgccgcga atacggttgc ccatgcccga 120 aaagcgatcc ataagatcct gaaaggtaat gatgatcgcc tgttggttgt gattggccca 180 tgctcaattc atgatcctgt cgcggcaaaa gagtatgcca ctcgcttgct ggcgctgcgt 240 gaagagctga aagatgagct ggaaatcgta atgcgcgtct attttgaaaa gccgcgtacc 300 acggtgggct ggaaagggct gattaacgat ccgcatatgg ataatagctt ccagatcaac 360 gacggtctgc gtatagcccg taaattgctg cttgatatta acgacagcgg tctgccagcg 420 gcaggtgagt ttctcgatat gatcacccca caatatctcg ctgacctgat gagctggggc 480 gcaattggcg cacgtaccac cgaatcgcag gtgcaccgcg aactggcatc agggctttct 540 tgtccggtcg gcttcaaaaa tggcaccgac ggtacgatta aagtggctat cgatgccatt 600 aatgccgccg gtgcgccgca ctgcttcctg tccgtaacga aatgggggca ttcggcgatt 660 gtgaatacca gcggtaacgg cgattgccat atcattctgc gcggcggtaa agagcctaac 720 tacagcgcga agcacgttgc tgaagtgaaa gaagggctga acaaagcagg cctgccagca 780 caggtgatga tcgatttcag ccatgctaac tcgtccaaac aattcaaaaa gcagatggat 840 gtttgtgctg acgtttgcca gcagattgcc ggtggcgaaa aggccattat tggcgtgatg 900 gtggaaagcc atctggtgga aggcaatcag agcctcgaga gcggggagcc gctggcctac 960 ggtaagagca tcaccgatgc ctgcatcggc tgggaagata ccgatgctct gttacgtcaa 1020 ctggcgaatg cagtaaaagc gcgtcgcggg taa 1053 <210> 2 <211> 350 <212> PRT <213> Escherichia coli W3110 <400> 2 Met Asn Tyr Gln Asn Asp Asp Leu Arg Ile Lys Glu Ile Lys Glu Leu 1 5 10 15 Leu Pro Pro Val Ala Leu Leu Glu Lys Phe Pro Ala Thr Glu Asn Ala 20 25 30 Ala Asn Thr Val Ala His Ala Arg Lys Ala Ile His Lys Ile Leu Lys 35 40 45 Gly Asn Asp Asp Arg Leu Leu Val Val Ile Gly Pro Cys Ser Ile His 50 55 60 Asp Pro Val Ala Ala Lys Glu Tyr Ala Thr Arg Leu Leu Ala Leu Arg 65 70 75 80 Glu Glu Leu Lys Asp Glu Leu Glu Ile Val Met Arg Val Tyr Phe Glu 85 90 95 Lys Pro Arg Thr Thr Val Gly Trp Lys Gly Leu Ile Asn Asp Pro His 100 105 110 Met Asp Asn Ser Phe Gln Ile Asn Asp Gly Leu Arg Ile Ala Arg Lys 115 120 125 Leu Leu Leu Asp Ile Asn Asp Ser Gly Leu Pro Ala Ala Gly Glu Phe 130 135 140 Leu Asp Met Ile Thr Pro Gln Tyr Leu Ala Asp Leu Met Ser Trp Gly 145 150 155 160 Ala Ile Gly Ala Arg Thr Thr Glu Ser Gln Val His Arg Glu Leu Ala 165 170 175 Ser Gly Leu Ser Cys Pro Val Gly Phe Lys Asn Gly Thr Asp Gly Thr 180 185 190 Ile Lys Val Ala Ile Asp Ala Ile Asn Ala Ala Gly Ala Pro His Cys 195 200 205 Phe Leu Ser Val Thr Lys Trp Gly His Ser Ala Ile Val Asn Thr Ser 210 215 220 Gly Asn Gly Asp Cys His Ile Ile Leu Arg Gly Gly Lys Glu Pro Asn 225 230 235 240 Tyr Ser Ala Lys His Val Ala Glu Val Lys Glu Gly Leu Asn Lys Ala 245 250 255 Gly Leu Pro Ala Gln Val Met Ile Asp Phe Ser His Ala Asn Ser Ser 260 265 270 Lys Gln Phe Lys Lys Gln Met Asp Val Cys Ala Asp Val Cys Gln Gln 275 280 285 Ile Ala Gly Gly Glu Lys Ala Ile Ile Gly Val Met Val Glu Ser His 290 295 300 Leu Val Glu Gly Asn Gln Ser Leu Glu Ser Gly Glu Pro Leu Ala Tyr 305 310 315 320 Gly Lys Ser Ile Thr Asp Ala Cys Ile Gly Trp Glu Asp Thr Asp Ala 325 330 335 Leu Leu Arg Gln Leu Ala Asn Ala Val Lys Ala Arg Arg Gly 340 345 350 <210> 3 <211> 49 <212> DNA <213> Artificial Sequence <220> <223> fhuA arm 1_F <400> 3 ccaagcgacg cccaacctgc catcatggcg cgttccaaaa ctgctcagc 49 <210> 4 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> fhuA arm 1_R <400> 4 tatcctcgag actagtgagc tcctttcagc ggttcggtgg 40 <210> 5 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> fhuA arm 2_F <400> 5 ctagtctcga ggatatcgac cacaccctgc tgaccggtgt 40 <210> 6 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> fhuA arm 2_R <400> 6 atagaatacc aattggcatg ctttttagaa acggaaggtt gcggttgc 48 <210> 7 <211> 34 <212> DNA <213> Artificial Sequence <220> <223> Pn_aroG_F <400> 7 aaaggagctc actagtagga tgctcctgtt atgg 34 <210> 8 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> Pn_aroG_R <400> 8 cagggtgtgg tcgatatctt acccgcgacg cgcttt 36 <210> 9 <211> 34 <212> DNA <213> Artificial Sequence <220> <223> Ptrc_F <400> 9 aaaggagctc actagtccgc ttgctgcaac tctc 34 <210> 10 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> Ptrc_R <400> 10 tggacgatac tcatatgttt cctgtgtgaa attgttatcc 40 <210> 11 <211> 35 <212> DNA <213> Artificial Sequence <220> <223> Pcj1_F <400> 11 aaaggagctc actagtaccg cgggcttatt ccatt 35 <210> 12 <211> 41 <212> DNA <213> Artificial Sequence <220> <223> Pcj1_R <400> 12 atctatagtc tgcatatgtt aatctcctag attgggtttc a 41 <210> 13 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> aroG_F <400> 13 taggagatta acatatgaat tatcagaacg ac 32 <210> 14 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> certification primer <400> 14 ggaacgctca gattgcgt 18 <210> 15 <211> 45 <212> DNA <213> Artificial Sequence <220> <223> Ava_ABCD_F <400> 15 acaatttcac acaggaaaga tatcatgagt atcgtccaag caaag 45 <210> 16 <211> 45 <212> DNA <213> Artificial Sequence <220> <223> Ava_ABCD_R <400> 16 ctcatccgcc aaaacagctc tagattatga attattttcc agaca 45 <210> 17 <211> 6461 <212> DNA <213> Anabaena variabilis ATCC29413 <400> 17 atgagtatcg tccaagcaaa gtttgaagct aaggaaacat cttttcatgt agaaggttac 60 gaaaagattg agtatgattt ggtgtatgta gatggtattt ttgaaatcca gaattctgca 120 ctagcagatg tatatcaagg ttttggacga tgcttggcga ttgtagatgc taacgtcagt 180 cggttgtatg gtaatcaaat tcaggcatat ttccagtatt atggtataga actgaggcta 240 tttcctatta ccattactga accagataag actattcaaa ctttcgagag agttatagat 300 gtctttgcag atttcaaatt agtccgcaaa gaaccagtat tagtcgtggg tggcggttta 360 attacagatg ttgtcggctt tgcttgttct acatatcgtc gcagcagcaa ttacatccgc 420 attcctacta cattgattgg attaattgat gccagtgtag caattaaggt agcagttaat 480 catcgcaaac tgaaaaaccg tttgggtgct tatcatgctt ctcgcaaagt atttttagat 540 ttctccttgt tgcgtactct ccctacagac caagtacgta acgggatggc ggaattggta 600 aaaatcgctg tagtagcgca tcaagaagtt tttgaattgt tggagaagta cggcgaagaa 660 ttactacgta ctcattttgg caatatagat gcaactccag agattaaaga aatagcccat 720 cgtttgactt acaaagctat ccataagatg ttggaattgg aagttcccaa cctgcatgag 780 ttagacctag atagggtgat tgcttacggt cacacttgga gtcccacctt ggaacttgcg 840 cctcgtctac ccatgttcca cggacacgcc gttaatgtag atatggcttt ctcggcaacg 900 atcgccgccc gtagaggata tattacaatt gcagaacgcg atcgtatttt aggattaatg 960 agtcgcgttg gtctatccct cgaccatccc atgttggata tagatatttt gtggcgtggt 1020 actgaatcta tcacattaac tcgtgatggt ttgttaagag ctgctatgcc aaaacccatt 1080 ggtgattgtg tcttcgtcaa tgacctgaca agagaagaat tagcagccgc attagctgac 1140 cacaaagaac tttgtaccag ttatccccgt ggtggtgaag gtgtggatgt gtatcccgtt 1200 tatcaaaaag aattaatcgg gagtgttaaa taatgacttt tttgaattca aaatgcaaaa 1260 tactccacgg atacactgcg cgagcgcggt agcatttctg ttcgcggagc gtcccgtagg 1320 gaaagagaag gctacgcaaa taatcggaca ctaattgtct ttaattttga attttgaatt 1380 ttgaattttg aattggagcg aagcgacttg acaaatgtga ttgtccaacc aacagctaga 1440 cctgttacac cattgggaat tttaaccaag cagttagaag ccatagtcca agaggttaag 1500 caacatccag atttacctgg ggaattgata gcaaacatcc atcaggcttg gcgtttagcc 1560 gcaggtatag acccttattt ggaagaatgc accactccag aatctcctga actcgctgca 1620 ttggcaaaaa ccacagccac cgaagcctgg ggagaacact tccacggagg tacaaccgtc 1680 cgtcctctag aacaagagat gctttctggt catatcgaag gacaaacctt aaagatgttt 1740 gttcacatga ccaaagctaa aaaagtctta gaaattggga tgtttaccgg ttattcggcg 1800 ctggcgatgg cggaagcatt accagaggat ggactgcttg tggcttgtga agttgaccct 1860 tacgcggcgg aaattggaca gaaagccttt caacaatctc cccacggtgg aaagattcgt 1920 gtggaattgg atgcagcctt agcaactctt gataagttag cagaagctgg ggagtctttt 1980 gacttggtat ttatcgacgc agataaaaaa gagtatgtag cctattttca caagttgcta 2040 ggtagcagtt tgttagcacc agatggcttt atttgtgtag ataacacctt attacaaggg 2100 gaagtttatc taccagcaga ggaacgtagc gtcaatggtg aagcgatcgc gcaatttaat 2160 catacagtag ctatagaccc ccgtgtagaa caggttttgt tgccgttgcg agatggttta 2220 acaattatcc gcagaataca accttaattg tccaatcgac tatggcacaa tcccttcccc 2280 tttcttccgc acctgctaca ccgtctcttc cttcccagac gaaaatagcc gcaattatcc 2340 aaaatatctg cactttggct ttgttattac tagcattgcc cattaatgcc accattgttt 2400 ttatatcctt gttagtcttc cgaccgcaaa aggtcaaagc agcaaacccc caaaccattc 2460 ttatcagtgg cggtaagatg accaaagctt tacaactagc aaggtcattc cacgcggctg 2520 gacatagagt tgtcttggtg gaaacccata aatactggtt gactggtcat cgtttttccc 2580 aagcagtgga taagttttac acagtccccg caccccagga caatccccaa gcttacattc 2640 aggctttggt agatatcgtc aaacaagaaa acatcgatgt ttatattccc gtcaccagtc 2700 cagtgggtag ctactacgac tcattagcca aaccagagtt atcccattat tgcgaagtgt 2760 ttcactttga cgcagatatt acccaaatgt tggatgataa atttgcgttg acacaaaaag 2820 cgcgatcgct tggtttatca gtacccaaat cctttaaaat tacctcacca gaacaagtca 2880 tcaacttcga tttttctgga gagacacgta aatacatcct caaaagcatt ccctacgact 2940 cagtgcggcg gttggactta accaaactcc cctgtgctac tccagaggaa acagcagcat 3000 tcgtcagaag tttgccaatt actcccgaaa aaccgtggat tatgcaggaa tttatccccg 3060 gtaaggaatt ctgcacccat agcaccgttc ggaatgggga actcagactg cattgctgtt 3120 gcgaatcttc agccttccaa gttaattatg agaatgtaaa taacccgcaa attaccgaat 3180 gggtacagca ttttgtcaag gaactgaaac tgacaggaca gatttccttt gactttatcc 3240 aagccgaaga cggaacagtt tacgccatcg agtgtaaccc ccgcacacat tcagcaatta 3300 ccacatttta cgaccacccc caggtagcag aagcgtactt gagtcaagca ccgacgactg 3360 aaaccataca accactaacg acaagcaagc ctacctattg gacttatcac gaagtttggc 3420 gtttaactgg tatccgttct ttcacccagt tgcaaagatg gctggggaat atttggcgcg 3480 ggactgatgc gatttatcag ccagatgacc ccttaccgtt tttgatggta catcattggc 3540 aaattcccct actgttattg aataatttgc gtcgtcttaa aggttggacg cggatagatt 3600 tcaatattgg gaagttggtg gaattggggg gagattagtt tttaaacgca gagggacgct 3660 gaggttagcg cagcgaaaag ttctggagga gggtttccct ccgtaggaaa cttttcaaga 3720 gagagggacg cggagtgtgt tttctctgcg tctctgcgtg agaaattttt tattattgag 3780 caaagttaga agatatgcag actatagatt ttaatattcg taagttactt gtagagtgga 3840 acgcgaccca cagagattat gatctttccc agagtttaca tgaactaatt gtagctcaag 3900 tagaacgaac acctgaggcg atcgctgtca cctttgacaa gcaacaacta acttatcaag 3960 aactaaatca taaagcaaac cagctaggac attatttaca aacattagga gtccagccag 4020 aaaccctggt aggcgtttgt ttagaacgtt ccttagaaat ggttatctgt cttttaggaa 4080 tcctcaaagc tgggggtgct tatgttccta ttgaccctga atatcctcaa gaacgcatag 4140 cttatatgct agaagattct caggtgaagg tactactaac tcaagaaaaa ttactcaatc 4200 aaattcccca ccatcaagca caaactatct gtgtagatag ggaatgggag aaaatttcca 4260 cacaagctaa taccaatccc aaaagtaata taaaaacgga taatcttgct tatgtaattt 4320 acacctctgg ttccactggt aaaccaaaag gtgcaatgaa cacccacaaa ggtatctgta 4380 atcgcttatt gtggatgcag gaagcttatc aaatcgattc cacagatagc attttacaaa 4440 aaaccccctt tagttttgat gtttccgttt gggagttctt ttggacttta ttaactggcg 4500 cacgtttggt aatagccaaa ccaggcggac ataaagatag tgcttacctc atcgatttaa 4560 ttactcaaga acaaatcact acgttgcatt ttgtcccctc aatgctgcaa gtgtttttac 4620 aaaatcgcca tgtaagcaaa tgcagctctc taaaaagagt tatttgtagc ggtgaagctt 4680 tatctataga tttacaaaat agatttttcc agcatttgca atgtgaatta cataacctct 4740 atggcccgac agaagcagca attgatgtca cattttggca atgtagaaaa gatagtaatt 4800 taaagagtgt acctattggt cgtcccattg ctaatactca aatttatatt cttgatgccg 4860 atttacaacc agtaaatatt ggtgtcactg gtgaaattta tattggtggt gtaggggttg 4920 ctcgtggtta tttgaataaa gaagaattga ccaaagaaaa atttattatt aatccctttc 4980 ccaattctga gtttaagcga ctttataaaa caggtgattt agctcgttat ttacccgatg 5040 gaaatattga atatcttggt agaacagatt atcaagtaaa aattcggggt tatagaattg 5100 aaattggcga gattgaaaat gttttatctt cacacccaca agtcagagaa gctgtagtca 5160 tagcgcggga tgataacgct caagaaaaac aaatcatcgc ttatattacc tataactcca 5220 tcaaacctca gcttgataat ctgcgtgatt tcctaaaagc aaggctacct gattttatga 5280 ttccagccgc ttttgtgatg ctggagcatc ttcctttaac tcccagtggt aaagtagacc 5340 gtaaggcatt acctaagcct gatttattta attatagtga acataattcc tatgtagcgc 5400 ctcggaatga agttgaagaa aaattagtac aaatctggtc gaatattctg catttaccta 5460 aagtaggtgt gacagaaaac tttttcgcta ttggtggtaa ttccctcaaa gctctacatt 5520 taatttctca aattgaagag ttatttgcta aagagatatc cttagcaaca cttttaacaa 5580 atccagtaat tgcagattta gccaaggtta ttcaagcaaa caaccaaatc cataattcac 5640 ccctagttcc aattcaacca caaggtaagc agcagccttt cttttgtata catcctgctg 5700 gtggtcatgt tttatgctat tttaaactcg cacaatatat aggaactgac caaccatttt 5760 atggcttaca agctcaagga ttttatggag atgaagcacc cttgacgcga gttgaagata 5820 tggctagtct ctacgtcaaa actattagag aatttcaacc ccaagggcct tatcgtgtcg 5880 gggggtggtc atttggtgga gtcgtagctt atgaagtagc acagcagtta catagacaag 5940 gacaagaagt atctttacta gcaatattag attcttacgt accgattctg ctggataaac 6000 aaaaacccat tgatgacgtt tatttagttg gtgttctctc cagagttttt ggcggtatgt 6060 ttggtcaaga taatctagtc acacctgaag aaatagaaaa tttaactgta gaagaaaaaa 6120 ttaattacat cattgataaa gcacggagcg ctagaatatt cccgcctggt gtagaacgtc 6180 aaaataatcg ccgtattctt gatgttttgg tgggaacttt aaaagcaact tattcctata 6240 taagacaacc atatccagga aaagtcactg tatttcgagc cagggaaaaa catattatgg 6300 ctcctgaccc gaccttagtt tgggtagaat tattttctgt aatggcggct caagaaatta 6360 agattattga tgtccctgga aaccattatt cgtttgttct agaaccccat gtacaggttt 6420 tagcacagcg tttacaagat tgtctggaaa ataattcata a 6461 <210> 18 <211> 2379 <212> DNA <213> Escherichia coli W3110 <400> 18 atgtccaaca atggctcgtc accgctggtg ctttggtata accaactcgg catgaatgat 60 gtagacaggg ttgggggcaa aaatgcctcc ctgggtgaaa tgattactaa tctttccgga 120 atgggtgttt ccgttccgaa tggtttcgcc acaaccgccg acgcgtttaa ccagtttctg 180 gaccaaagcg gcgtaaacca gcgcatttat gaactgctgg ataaaacgga tattgacgat 240 gttactcagc ttgcgaaagc gggcgcgcaa atccgccagt ggattatcga cactcccttc 300 cagcctgagc tggaaaacgc catccgcgaa gcctatgcac agctttccgc cgatgacgaa 360 aacgcctctt ttgcggtgcg ctcctccgcc accgcagaag atatgccgga cgcttctttt 420 gccggtcagc aggaaacctt cctcaacgtt cagggttttg acgccgttct cgtggcagtg 480 aaacatgtat ttgcttctct gtttaacgat cgcgccatct cttatcgtgt gcaccagggt 540 tacgatcacc gtggtgtggc gctctccgcc ggtgttcaac ggatggtgcg ctctgacctc 600 gcatcatctg gcgtgatgtt ctccattgat accgaatccg gctttgacca ggtggtgttt 660 atcacttccg catggggcct tggtgagatg gtcgtgcagg gtgcggttaa cccggatgag 720 ttttacgtgc ataaaccgac actggcggcg aatcgcccgg ctatcgtgcg ccgcaccatg 780 gggtcgaaaa aaatccgcat ggtttacgcg ccgacccagg agcacggcaa gcaggttaaa 840 atcgaagacg taccgcagga acagcgtgac atcttctcgc tgaccaacga agaagtgcag 900 gaactggcaa aacaggccgt acaaattgag aaacactacg gtcgcccgat ggatattgag 960 tgggcgaaag atggccacac cggtaaactg ttcattgtgc aggcgcgtcc ggaaaccgtg 1020 cgctcacgcg gtcaggtcat ggagcgttat acgctgcatt cacagggtaa gattatcgcc 1080 gaaggccgtg ctatcggtca tcgcatcggt gcgggtccgg tgaaagtcat ccatgacatc 1140 agcgaaatga accgcatcga acctggcgac gtgctggtta ctgacatgac cgacccggac 1200 tgggaaccga tcatgaagaa agcatctgcc atcgtcacca accgtggcgg tcgtacctgt 1260 cacgcggcga tcatcgctcg tgaactgggc attccggcgg tagtgggctg tggagatgca 1320 acagaacgga tgaaagacgg tgagaacgtc actgtttctt gtgccgaagg tgataccggt 1380 tacgtctatg cggagttgct ggaatttagc gtgaaaagct ccagcgtaga aacgatgccg 1440 gatctgccgt tgaaagtgat gatgaacgtc ggtaacccgg accgtgcttt cgacttcgcc 1500 tgcctaccga acgaaggcgt gggccttgcg cgtctggaat ttatcatcaa ccgtatgatt 1560 ggcgtccacc cacgcgcact gcttgagttt gacgatcagg aaccgcagtt gcaaaacgaa 1620 atccgcgaga tgatgaaagg ttttgattct ccgcgtgaat tttacgttgg tcgtctgact 1680 gaagggatcg cgacgctggg tgccgcgttt tatccgaagc gcgtcattgt ccgtctctct 1740 gattttaaat cgaacgaata tgccaacctg gtcggtggtg agcgttacga gccagatgaa 1800 gagaacccga tgctcggctt ccgtggcgcg ggccgctatg tttccgacag cttccgcgac 1860 tgtttcgcgc tggagtgtga agcagtgaaa cgtgtgcgca acgacatggg actgaccaac 1920 gttgagatca tgatcccgtt cgtgcgtacc gtagatcagg cgaaagcggt ggttgaagaa 1980 ctggcgcgtc aggggctgaa acgtggcgag aacgggctga aaatcatcat gatgtgtgaa 2040 atcccgtcca acgccttgct ggccgagcag ttcctcgaat atttcgacgg cttctcaatt 2100 ggctcaaacg atatgacgca gctggcgctc ggtctggacc gtgactccgg cgtggtgtct 2160 gaattgttcg atgagcgcaa cgatgcggtg aaagcactgc tgtcgatggc tatccgtgcc 2220 gcgaagaaac agggcaaata tgtcgggatt tgcggtcagg gtccgtccga ccacgaagac 2280 tttgccgcat ggttgatgga agaggggatc gatagcctgt ctctgaaccc ggacaccgtg 2340 gtgcaaacct ggttaagcct ggctgaactg aagaaataa 2379 <210> 19 <211> 792 <212> PRT <213> Escherichia coli W3110 <400> 19 Met Ser Asn Asn Gly Ser Ser Pro Leu Val Leu Trp Tyr Asn Gln Leu 1 5 10 15 Gly Met Asn Asp Val Asp Arg Val Gly Gly Lys Asn Ala Ser Leu Gly 20 25 30 Glu Met Ile Thr Asn Leu Ser Gly Met Gly Val Ser Val Pro Asn Gly 35 40 45 Phe Ala Thr Thr Ala Asp Ala Phe Asn Gln Phe Leu Asp Gln Ser Gly 50 55 60 Val Asn Gln Arg Ile Tyr Glu Leu Leu Asp Lys Thr Asp Ile Asp Asp 65 70 75 80 Val Thr Gln Leu Ala Lys Ala Gly Ala Gln Ile Arg Gln Trp Ile Ile 85 90 95 Asp Thr Pro Phe Gln Pro Glu Leu Glu Asn Ala Ile Arg Glu Ala Tyr 100 105 110 Ala Gln Leu Ser Ala Asp Asp Glu Asn Ala Ser Phe Ala Val Arg Ser 115 120 125 Ser Ala Thr Ala Glu Asp Met Pro Asp Ala Ser Phe Ala Gly Gln Gln 130 135 140 Glu Thr Phe Leu Asn Val Gln Gly Phe Asp Ala Val Leu Val Ala Val 145 150 155 160 Lys His Val Phe Ala Ser Leu Phe Asn Asp Arg Ala Ile Ser Tyr Arg 165 170 175 Val His Gln Gly Tyr Asp His Arg Gly Val Ala Leu Ser Ala Gly Val 180 185 190 Gln Arg Met Val Arg Ser Asp Leu Ala Ser Ser Gly Val Met Phe Ser 195 200 205 Ile Asp Thr Glu Ser Gly Phe Asp Gln Val Val Phe Ile Thr Ser Ala 210 215 220 Trp Gly Leu Gly Glu Met Val Val Gln Gly Ala Val Asn Pro Asp Glu 225 230 235 240 Phe Tyr Val His Lys Pro Thr Leu Ala Ala Asn Arg Pro Ala Ile Val 245 250 255 Arg Arg Thr Met Gly Ser Lys Lys Ile Arg Met Val Tyr Ala Pro Thr 260 265 270 Gln Glu His Gly Lys Gln Val Lys Ile Glu Asp Val Pro Gln Glu Gln 275 280 285 Arg Asp Ile Phe Ser Leu Thr Asn Glu Glu Val Gln Glu Leu Ala Lys 290 295 300 Gln Ala Val Gln Ile Glu Lys His Tyr Gly Arg Pro Met Asp Ile Glu 305 310 315 320 Trp Ala Lys Asp Gly His Thr Gly Lys Leu Phe Ile Val Gln Ala Arg 325 330 335 Pro Glu Thr Val Arg Ser Arg Gly Gln Val Met Glu Arg Tyr Thr Leu 340 345 350 His Ser Gln Gly Lys Ile Ile Ala Glu Gly Arg Ala Ile Gly His Arg 355 360 365 Ile Gly Ala Gly Pro Val Lys Val Ile His Asp Ile Ser Glu Met Asn 370 375 380 Arg Ile Glu Pro Gly Asp Val Leu Val Thr Asp Met Thr Asp Pro Asp 385 390 395 400 Trp Glu Pro Ile Met Lys Lys Ala Ser Ala Ile Val Thr Asn Arg Gly 405 410 415 Gly Arg Thr Cys His Ala Ala Ile Ile Ala Arg Glu Leu Gly Ile Pro 420 425 430 Ala Val Val Gly Cys Gly Asp Ala Thr Glu Arg Met Lys Asp Gly Glu 435 440 445 Asn Val Thr Val Ser Cys Ala Glu Gly Asp Thr Gly Tyr Val Tyr Ala 450 455 460 Glu Leu Leu Glu Phe Ser Val Lys Ser Ser Ser Val Glu Thr Met Pro 465 470 475 480 Asp Leu Pro Leu Lys Val Met Met Asn Val Gly Asn Pro Asp Arg Ala 485 490 495 Phe Asp Phe Ala Cys Leu Pro Asn Glu Gly Val Gly Leu Ala Arg Leu 500 505 510 Glu Phe Ile Ile Asn Arg Met Ile Gly Val His Pro Arg Ala Leu Leu 515 520 525 Glu Phe Asp Asp Gln Glu Pro Gln Leu Gln Asn Glu Ile Arg Glu Met 530 535 540 Met Lys Gly Phe Asp Ser Pro Arg Glu Phe Tyr Val Gly Arg Leu Thr 545 550 555 560 Glu Gly Ile Ala Thr Leu Gly Ala Ala Phe Tyr Pro Lys Arg Val Ile 565 570 575 Val Arg Leu Ser Asp Phe Lys Ser Asn Glu Tyr Ala Asn Leu Val Gly 580 585 590 Gly Glu Arg Tyr Glu Pro Asp Glu Glu Asn Pro Met Leu Gly Phe Arg 595 600 605 Gly Ala Gly Arg Tyr Val Ser Asp Ser Phe Arg Asp Cys Phe Ala Leu 610 615 620 Glu Cys Glu Ala Val Lys Arg Val Arg Asn Asp Met Gly Leu Thr Asn 625 630 635 640 Val Glu Ile Met Ile Pro Phe Val Arg Thr Val Asp Gln Ala Lys Ala 645 650 655 Val Val Glu Glu Leu Ala Arg Gln Gly Leu Lys Arg Gly Glu Asn Gly 660 665 670 Leu Lys Ile Ile Met Met Cys Glu Ile Pro Ser Asn Ala Leu Leu Ala 675 680 685 Glu Gln Phe Leu Glu Tyr Phe Asp Gly Phe Ser Ile Gly Ser Asn Asp 690 695 700 Met Thr Gln Leu Ala Leu Gly Leu Asp Arg Asp Ser Gly Val Val Ser 705 710 715 720 Glu Leu Phe Asp Glu Arg Asn Asp Ala Val Lys Ala Leu Leu Ser Met 725 730 735 Ala Ile Arg Ala Ala Lys Lys Gln Gly Lys Tyr Val Gly Ile Cys Gly 740 745 750 Gln Gly Pro Ser Asp His Glu Asp Phe Ala Ala Trp Leu Met Glu Glu 755 760 765 Gly Ile Asp Ser Leu Ser Leu Asn Pro Asp Thr Val Val Gln Thr Trp 770 775 780 Leu Ser Leu Ala Glu Leu Lys Lys 785 790 <210> 20 <211> 34 <212> DNA <213> Artificial Sequence <220> <223> Pn-pps_F <400> 20 aaaggagctc actagttttg ttcttcccgt gatg 34 <210> 21 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> Pn-pps_R <400> 21 cagggtgtgg tcgatatctt atttcttcag ttcagc 36 <210> 22 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> pps_F <400> 22 taggagatta acatatgtcc aacaatggct cg 32 <210> 23 <211> 1992 <212> DNA <213> Escherichia coli W3110 <400> 23 atgtcctcac gtaaagagct tgccaatgct attcgtgcgc tgagcatgga cgcagtacag 60 aaagccaaat ccggtcaccc gggtgcccct atgggtatgg ctgacattgc cgaagtcctg 120 tggcgtgatt tcctgaaaca caacccgcag aatccgtcct gggctgaccg tgaccgcttc 180 gtgctgtcca acggccacgg ctccatgctg atctacagcc tgctgcacct caccggttac 240 gatctgccga tggaagaact gaaaaacttc cgtcagctgc actctaaaac tccgggtcac 300 ccggaagtgg gttacaccgc tggtgtggaa accaccaccg gtccgctggg tcagggtatt 360 gccaacgcag tcggtatggc gattgcagaa aaaacgctgg cggcgcagtt taaccgtccg 420 ggccacgaca ttgtcgacca ctacacctac gccttcatgg gcgacggctg catgatggaa 480 ggcatctccc acgaagtttg ctctctggcg ggtacgctga agctgggtaa actgattgca 540 ttctacgatg acaacggtat ttctatcgat ggtcacgttg aaggctggtt caccgacgac 600 accgcaatgc gtttcgaagc ttacggctgg cacgttattc gcgacatcga cggtcatgac 660 gcggcatcta tcaaacgcgc agtagaagaa gcgcgcgcag tgactgacaa accttccctg 720 ctgatgtgca aaaccatcat cggtttcggt tccccgaaca aagccggtac ccacgactcc 780 cacggtgcgc cgctgggcga cgctgaaatt gccctgaccc gcgaacaact gggctggaaa 840 tatgcgccgt tcgaaatccc gtctgaaatc tatgctcagt gggatgcgaa agaagcaggc 900 caggcgaaag aatccgcatg gaacgagaaa ttcgctgctt acgcgaaagc ttatccgcag 960 gaagccgctg aatttacccg ccgtatgaaa ggcgaaatgc cgtctgactt cgacgctaaa 1020 gcgaaagagt tcatcgctaa actgcaggct aatccggcga aaatcgccag ccgtaaagcg 1080 tctcagaatg ctatcgaagc gttcggtccg ctgttgccgg aattcctcgg cggttctgct 1140 gacctggcgc cgtctaacct gaccctgtgg tctggttcta aagcaatcaa cgaagatgct 1200 gcgggtaact acatccacta cggtgttcgc gagttcggta tgaccgcgat tgctaacggt 1260 atctccctgc acggtggctt cctgccgtac acctccacct tcctgatgtt cgtggaatac 1320 gcacgtaacg ccgtacgtat ggctgcgctg atgaaacagc gtcaggtgat ggtttacacc 1380 cacgactcca tcggtctggg cgaagacggc ccgactcacc agccggttga gcaggtcgct 1440 tctctgcgcg taaccccgaa catgtctaca tggcgtccgt gtgaccaggt tgaatccgcg 1500 gtcgcgtgga aatacggtgt tgagcgtcag gacggcccga ccgcactgat cctctcccgt 1560 cagaacctgg cgcagcagga acgaactgaa gagcaactgg caaacatcgc gcgcggtggt 1620 tatgtgctga aagactgcgc cggtcagccg gaactgattt tcatcgctac cggttcagaa 1680 gttgaactgg ctgttgctgc ctacgaaaaa ctgactgccg aaggcgtgaa agcgcgcgtg 1740 gtgtccatgc cgtctaccga cgcatttgac aagcaggatg ctgcttaccg tgaatccgta 1800 ctgccgaaag cggttactgc acgcgttgct gtagaagcgg gtattgctga ctactggtac 1860 aagtatgttg gcctgaacgg tgctatcgtc ggtatgacca ccttcggtga atctgctccg 1920 gcagagctgc tgtttgaaga gttcggcttc actgttgata acgttgttgc gaaagcaaaa 1980 gaactgctgt aa 1992 <210> 24 <211> 663 <212> PRT <213> Escherichia coli W3110 <400> 24 Met Ser Ser Arg Lys Glu Leu Ala Asn Ala Ile Arg Ala Leu Ser Met 1 5 10 15 Asp Ala Val Gln Lys Ala Lys Ser Gly His Pro Gly Ala Pro Met Gly 20 25 30 Met Ala Asp Ile Ala Glu Val Leu Trp Arg Asp Phe Leu Lys His Asn 35 40 45 Pro Gln Asn Pro Ser Trp Ala Asp Arg Asp Arg Phe Val Leu Ser Asn 50 55 60 Gly His Gly Ser Met Leu Ile Tyr Ser Leu Leu His Leu Thr Gly Tyr 65 70 75 80 Asp Leu Pro Met Glu Glu Leu Lys Asn Phe Arg Gln Leu His Ser Lys 85 90 95 Thr Pro Gly His Pro Glu Val Gly Tyr Thr Ala Gly Val Glu Thr Thr 100 105 110 Thr Gly Pro Leu Gly Gln Gly Ile Ala Asn Ala Val Gly Met Ala Ile 115 120 125 Ala Glu Lys Thr Leu Ala Ala Gln Phe Asn Arg Pro Gly His Asp Ile 130 135 140 Val Asp His Tyr Thr Tyr Ala Phe Met Gly Asp Gly Cys Met Met Glu 145 150 155 160 Gly Ile Ser His Glu Val Cys Ser Leu Ala Gly Thr Leu Lys Leu Gly 165 170 175 Lys Leu Ile Ala Phe Tyr Asp Asp Asn Gly Ile Ser Ile Asp Gly His 180 185 190 Val Glu Gly Trp Phe Thr Asp Asp Thr Ala Met Arg Phe Glu Ala Tyr 195 200 205 Gly Trp His Val Ile Arg Asp Ile Asp Gly His Asp Ala Ala Ser Ile 210 215 220 Lys Arg Ala Val Glu Glu Ala Arg Ala Val Thr Asp Lys Pro Ser Leu 225 230 235 240 Leu Met Cys Lys Thr Ile Ile Gly Phe Gly Ser Pro Asn Lys Ala Gly 245 250 255 Thr His Asp Ser His Gly Ala Pro Leu Gly Asp Ala Glu Ile Ala Leu 260 265 270 Thr Arg Glu Gln Leu Gly Trp Lys Tyr Ala Pro Phe Glu Ile Pro Ser 275 280 285 Glu Ile Tyr Ala Gln Trp Asp Ala Lys Glu Ala Gly Gln Ala Lys Glu 290 295 300 Ser Ala Trp Asn Glu Lys Phe Ala Ala Tyr Ala Lys Ala Tyr Pro Gln 305 310 315 320 Glu Ala Ala Glu Phe Thr Arg Arg Met Lys Gly Glu Met Pro Ser Asp 325 330 335 Phe Asp Ala Lys Ala Lys Glu Phe Ile Ala Lys Leu Gln Ala Asn Pro 340 345 350 Ala Lys Ile Ala Ser Arg Lys Ala Ser Gln Asn Ala Ile Glu Ala Phe 355 360 365 Gly Pro Leu Leu Pro Glu Phe Leu Gly Gly Ser Ala Asp Leu Ala Pro 370 375 380 Ser Asn Leu Thr Leu Trp Ser Gly Ser Lys Ala Ile Asn Glu Asp Ala 385 390 395 400 Ala Gly Asn Tyr Ile His Tyr Gly Val Arg Glu Phe Gly Met Thr Ala 405 410 415 Ile Ala Asn Gly Ile Ser Leu His Gly Gly Phe Leu Pro Tyr Thr Ser 420 425 430 Thr Phe Leu Met Phe Val Glu Tyr Ala Arg Asn Ala Val Arg Met Ala 435 440 445 Ala Leu Met Lys Gln Arg Gln Val Met Val Tyr Thr His Asp Ser Ile 450 455 460 Gly Leu Gly Glu Asp Gly Pro Thr His Gln Pro Val Glu Gln Val Ala 465 470 475 480 Ser Leu Arg Val Thr Pro Asn Met Ser Thr Trp Arg Pro Cys Asp Gln 485 490 495 Val Glu Ser Ala Val Ala Trp Lys Tyr Gly Val Glu Arg Gln Asp Gly 500 505 510 Pro Thr Ala Leu Ile Leu Ser Arg Gln Asn Leu Ala Gln Gln Glu Arg 515 520 525 Thr Glu Glu Gln Leu Ala Asn Ile Ala Arg Gly Gly Tyr Val Leu Lys 530 535 540 Asp Cys Ala Gly Gln Pro Glu Leu Ile Phe Ile Ala Thr Gly Ser Glu 545 550 555 560 Val Glu Leu Ala Val Ala Ala Tyr Glu Lys Leu Thr Ala Glu Gly Val 565 570 575 Lys Ala Arg Val Val Ser Met Pro Ser Thr Asp Ala Phe Asp Lys Gln 580 585 590 Asp Ala Ala Tyr Arg Glu Ser Val Leu Pro Lys Ala Val Thr Ala Arg 595 600 605 Val Ala Val Glu Ala Gly Ile Ala Asp Tyr Trp Tyr Lys Tyr Val Gly 610 615 620 Leu Asn Gly Ala Ile Val Gly Met Thr Thr Phe Gly Glu Ser Ala Pro 625 630 635 640 Ala Glu Leu Leu Phe Glu Glu Phe Gly Phe Thr Val Asp Asn Val Val 645 650 655 Ala Lys Ala Lys Glu Leu Leu 660 <210> 25 <211> 34 <212> DNA <213> Artificial Sequence <220> <223> Pn-tktA_F <400> 25 aaaggagctc actagtgttt tctcttccgc acaa 34 <210> 26 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> Pn-tktA_R <400> 26 cagggtgtgg tcgatatctt acagcagttc ttttgc 36 <210> 27 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> tktA_F <400> 27 taggagatta acatatgtcc tcacgtaaag ag 32 <210> 28 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> Pcj1-aroG_R <400> 28 cccgcggttt acccgcgacg cgcttt 26 <210> 29 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> Pcj1-pps_F <400> 29 gcgggtaaac cgcgggctta ttccat 26 <210> 30 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> Pcj1-pps_R <400> 30 cccgcggttt atttcttcag ttcagc 26 <210> 31 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> Pcj1-tktA_F <400> 31 agaaataaac cgcgggctta ttccat 26 <210> 32 <211> 71 <212> DNA <213> Artificial Sequence <220> <223> aroD deletion cassette_F <400> 32 tcatggggtt cggtgcctga caggctgacc gcgtgcagaa agggtaaaaa gctggagctg 60 cttcgaagtt c 71 <210> 33 <211> 79 <212> DNA <213> Artificial Sequence <220> <223> aroD deletion cassette_R <400> 33 atatattttt tagttcggcg gggagggtgt tcccgccgaa atattattgc gccatggtcc 60 atatgaatat cctccttag 79 <210> 34 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> aroD deletion_F <400> 34 caaagatttc cctctggaat atg 23 <210> 35 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> aroD deletion_R <400> 35 cagatgtgat tttccctacg c 21 <210> 36 <211> 1389 <212> DNA <213> Corynebacterium glutamicum ATCC13032 <400> 36 gtgagttgga cagttgatat ccctaaagaa gttctccctg atttgccacc attgccagaa 60 ggcatgcagc agcagttcga ggacaccatt tcccgtgacg ctaagcagca acctacgtgg 120 gatcgtgcac aggcagaaaa cgtgcgcaag atccttgagt cggttcctcc aatcgttgtt 180 gcccctgagg tacttgagct gaagcagaag cttgctgatg ttgccaacgg taaggccttc 240 ctcttgcagg gtggtgactg tgcggaaact ttcgagtcaa acactgagcc gcacattcgc 300 gccaacgtaa agactctgct gcagatggca gttgttttga cctacggtgc atccactcct 360 gtgatcaaga tggctcgtat tgctggtcag tacgcaaagc ctcgctcttc tgatctggat 420 ggaaatggtc tgccaaacta ccgtggcgat atcgtcaacg gtgtggaggc aaccccagag 480 gctcgtcgcc acgatcctgc ccgcatgatc cgtgcttacg ctaacgcttc tgctgcgatg 540 aacttggtgc gcgcgctcac cagctctggc accgctgatc tttaccgtct cagcgagtgg 600 aaccgcgagt tcgttgcgaa ctccccagct ggtgcacgct acgaggctct tgctcgtgag 660 atcgactccg gtctgcgctt catggaagca tgtggcgtgt ccgatgagtc cctgcgtgct 720 gcagatatct actgctccca cgaggctttg ctggtggatt acgagcgttc catgctgcgt 780 cttgcaaccg atgaggaagg caacgaggaa ctttacgatc tttcagctca ccagctgtgg 840 atcggcgagc gcacccgtgg catggatgat ttccatgtga acttcgcatc catgatctct 900 aacccaatcg gcatcaagat tggtcctggt atcacccctg aagaggctgt tgcatacgct 960 gacaagctcg atccgaactt cgagcctggc cgtttgacca tcgttgctcg catgggccac 1020 gacaaggttc gctccgtact tcctggtgtt atccaggctg ttgaggcatc cggacacaag 1080 gttatttggc agtccgatcc gatgcacggc aacactttca ccgcatccaa tggctacaag 1140 acccgtcact tcgacaaggt tatcgatgag gtccagggct tcttcgaggt ccaccgcgca 1200 ttgggcaccc acccaggcgg aatccacatt gagttcactg gtgaagatgt caccgagtgc 1260 ctcggtggcg ctgaagacat caccgatgtt gatctgccag gccgctacga gtccgcatgc 1320 gatcctcgcc tgaacactca gcagtctttg gagttggctt tcctcgttgc agaaatgctg 1380 cgtaactaa 1389 <210> 37 <211> 462 <212> PRT <213> Corynebacterium glutamicum ATCC13032 <400> 37 Met Ser Trp Thr Val Asp Ile Pro Lys Glu Val Leu Pro Asp Leu Pro 1 5 10 15 Pro Leu Pro Glu Gly Met Gln Gln Gln Phe Glu Asp Thr Ile Ser Arg 20 25 30 Asp Ala Lys Gln Gln Pro Thr Trp Asp Arg Ala Gln Ala Glu Asn Val 35 40 45 Arg Lys Ile Leu Glu Ser Val Pro Pro Ile Val Val Ala Pro Glu Val 50 55 60 Leu Glu Leu Lys Gln Lys Leu Ala Asp Val Ala Asn Gly Lys Ala Phe 65 70 75 80 Leu Leu Gln Gly Gly Asp Cys Ala Glu Thr Phe Glu Ser Asn Thr Glu 85 90 95 Pro His Ile Arg Ala Asn Val Lys Thr Leu Leu Gln Met Ala Val Val 100 105 110 Leu Thr Tyr Gly Ala Ser Thr Pro Val Ile Lys Met Ala Arg Ile Ala 115 120 125 Gly Gln Tyr Ala Lys Pro Arg Ser Ser Asp Leu Asp Gly Asn Gly Leu 130 135 140 Pro Asn Tyr Arg Gly Asp Ile Val Asn Gly Val Glu Ala Thr Pro Glu 145 150 155 160 Ala Arg Arg His Asp Pro Ala Arg Met Ile Arg Ala Tyr Ala Asn Ala 165 170 175 Ser Ala Ala Met Asn Leu Val Arg Ala Leu Thr Ser Ser Gly Thr Ala 180 185 190 Asp Leu Tyr Arg Leu Ser Glu Trp Asn Arg Glu Phe Val Ala Asn Ser 195 200 205 Pro Ala Gly Ala Arg Tyr Glu Ala Leu Ala Arg Glu Ile Asp Ser Gly 210 215 220 Leu Arg Phe Met Glu Ala Cys Gly Val Ser Asp Glu Ser Leu Arg Ala 225 230 235 240 Ala Asp Ile Tyr Cys Ser His Glu Ala Leu Leu Val Asp Tyr Glu Arg 245 250 255 Ser Met Leu Arg Leu Ala Thr Asp Glu Glu Gly Asn Glu Glu Leu Tyr 260 265 270 Asp Leu Ser Ala His Gln Leu Trp Ile Gly Glu Arg Thr Arg Gly Met 275 280 285 Asp Asp Phe His Val Asn Phe Ala Ser Met Ile Ser Asn Pro Ile Gly 290 295 300 Ile Lys Ile Gly Pro Gly Ile Thr Pro Glu Glu Ala Val Ala Tyr Ala 305 310 315 320 Asp Lys Leu Asp Pro Asn Phe Glu Pro Gly Arg Leu Thr Ile Val Ala 325 330 335 Arg Met Gly His Asp Lys Val Arg Ser Val Leu Pro Gly Val Ile Gln 340 345 350 Ala Val Glu Ala Ser Gly His Lys Val Ile Trp Gln Ser Asp Pro Met 355 360 365 His Gly Asn Thr Phe Thr Ala Ser Asn Gly Tyr Lys Thr Arg His Phe 370 375 380 Asp Lys Val Ile Asp Glu Val Gln Gly Phe Phe Glu Val His Arg Ala 385 390 395 400 Leu Gly Thr His Pro Gly Gly Ile His Ile Glu Phe Thr Gly Glu Asp 405 410 415 Val Thr Glu Cys Leu Gly Gly Ala Glu Asp Ile Thr Asp Val Asp Leu 420 425 430 Pro Gly Arg Tyr Glu Ser Ala Cys Asp Pro Arg Leu Asn Thr Gln Gln 435 440 445 Ser Leu Glu Leu Ala Phe Leu Val Ala Glu Met Leu Arg Asn 450 455 460 <210> 38 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> Pn-cgl aroG_F <400> 38 ggtatcgata agcttgattc gatctgctcc cattcc 36 <210> 39 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> Pn-cgl aroG_R <400> 39 cggtggcggc cgctctagtt agttacgcag catttc 36 <210> 40 <211> 39 <212> DNA <213> Artificial Sequence <220> <223> Pcj7-cgl aroG_F <400> 40 cgaaaggaaa cactcgatgt gagttggaca gttgatatc 39 <210> 41 <211> 37 <212> DNA <213> Artificial Sequence <220> <223> Pcj7-cgl aroG_R <400> 41 ccgccaaaac agctctagtt tagttacgca gcatttc 37 <210> 42 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> Ava_ABCD_F <400> 42 ccaaacacca acaaaaggct ctacccatat gatgagtatc gtccaagcaa agtttgaagc 60 60 <210> 43 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> Ava_ABCD_R <400> 43 agagggtgac gctagtcaga actagtttat gaattatttt ccagacaatc ttgtaaacgc 60 60 <210> 44 <211> 54 <212> DNA <213> Artificial Sequence <220> <223> O2 promoter_F <400> 44 ccaaacacca acaaaaggct ctacccatat gcaataatcg tgaattttgg cagc 54 <210> 45 <211> 53 <212> DNA <213> Artificial Sequence <220> <223> O2 promoter_R <400> 45 caaactttgc ttggacgata ctcattgttt tgatctcctc caataatcta tgc 53 <210> 46 <211> 37 <212> DNA <213> Artificial Sequence <220> <223> Pn-cgl tkt_F <400> 46 ggtatcgata agcttgataa gattgatcac acctttg 37 <210> 47 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> Pn-cgl tkt_R <400> 47 cggtggcggc cgctctagtt aaccgttaat ggagtc 36 <210> 48 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> Pcj7-cgl tkt_F <400> 48 cgaaaggaaa cactcgattt gaccaccttg acgctg 36 <210> 49 <211> 37 <212> DNA <213> Artificial Sequence <220> <223> Pcj7-cgl tkt_R <400> 49 ccgccaaaac agctctagtt taaccgttaa tggagtc 37 <210> 50 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> Ptrc-cgl pps_F <400> 50 tcacacagga aagatatcat gaccaacagt ttgaac 36 <210> 51 <211> 39 <212> DNA <213> Artificial Sequence <220> <223> Ptrc-cgl pps_R <400> 51 ccgccaaaac agctctagtt tacttcgtgc cggtcattg 39 <210> 52 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> Pcj7-cgl pps_F <400> 52 cgaaaggaaa cactcgatat gaccaacagt ttgaac 36 <210> 53 <211> 37 <212> DNA <213> Artificial Sequence <220> <223> Pcj7-aroG_F <400> 53 ttagaaatgg aacctaaaag aaacatccca gcgctac 37 <210> 54 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> Pcj7-aroG_R <400> 54 tagcgctggg atgtttcttt agttacgcag catttc 36 <210> 55 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> Pcj7-tkt_F <400> 55 gaaatgctgc gtaactaaag aaacatccca gcgcta 36 <210> 56 <211> 37 <212> DNA <213> Artificial Sequence <220> <223> Pcj7-tkt_R <400> 56 gtagcgctgg gatgtttctt taaccgttaa tggagtc 37 <210> 57 <211> 37 <212> DNA <213> Artificial Sequence <220> <223> Pcj7-pps_F <400> 57 gactccatta acggttaaag aaacatccca gcgctac 37 <210> 58 <211> 39 <212> DNA <213> Artificial Sequence <220> <223> Pcj7-pps_R <400> 58 ggagaatact gtcgttcatt tacttcgtgc cggtcattg 39 <210> 59 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> pGPD_F <400> 59 ggatccacag tttattcctg gcatcc 26 <210> 60 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> pGPD_R <400> 60 tttgcttgga cgatactcat ttgtttgttt atgtgtgttt 40 <210> 61 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> Ava_A_F <400> 61 aaacacacat aaacaaacaa atgagtatcg tccaagcaaa 40 <210> 62 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> Ava_A_R <400> 62 ggatgccagg aataaactgt ttatttaaca ctcccgatta 40 <210> 63 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> pGPD_F <400> 63 taatcgggag tgttaaataa acagtttatt cctggcatcc 40 <210> 64 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> pGPD_R <400> 64 tggacaatca catttgtcaa ttgtttgttt atgtgtgttt 40 <210> 65 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> Ava_B_F <400> 65 aaacacacat aaacaaacaa ttgacaaatg tgattgtcca 40 <210> 66 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> Ava_B_R <400> 66 gtcgacttaa ggttgtattc tgcgga 26 <210> 67 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> pGPD_F <400> 67 ggatccacag tttattcctg gcatcc 26 <210> 68 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> pGPD_R <400> 68 aaagagattg attgtgccat ttgtttgttt atgtgtgttt 40 <210> 69 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> Ava_C_F <400> 69 aaacacacat aaacaaacaa atggcacaat caatctcttt 40 <210> 70 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> Ava_C_R <400> 70 ggatgccagg aataaactgt ttagtcgccc cctaattcca 40 <210> 71 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> pGPD_F <400> 71 tggaattagg gggcgactaa acagtttatt cctggcatcc 40 <210> 72 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> pGPD_R <400> 72 aggatattaa gtactggcat ttgtttgttt atgtgtgttt 40 <210> 73 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> Ava_D_F <400> 73 aaacacacat aaacaaacaa atgccagtac ttaatatcct 40 <210> 74 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> Ava_D_R <400> 74 gtcgactcaa ttttgtaaca cctttt 26 <210> 75 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> TKL1_F <400> 75 ggatccatga ctcaattcac tgacat 26 <210> 76 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> TKL1_R <400> 76 gtcgacttag aaagcttttt tcaaag 26 <210> 77 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> ARO4_F <400> 77 ggatccatga gtgaatctcc aatgtt 26 <210> 78 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> ARO4_R <400> 78 gtcgacctat ttcttgttaa cttctc 26 <210> 79 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> pps_F <400> 79 ggatccatgt ccaacaatgg ctcgtc 26 <210> 80 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> pps_R <400> 80 gtcgacttat ttcttcagtt cagcca 26 <210> 81 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> pGPD_F <400> 81 ggatccacag tttattcctg gcatcc 26 <210> 82 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> pGPD_R <400> 82 atgtcagtga attgagtcat ttgtttgttt atgtgtgttt 40 <210> 83 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> TKL1_F <400> 83 aaacacacat aaacaaacaa atgactcaat tcactgacat 40 <210> 84 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> TKL1_R <400> 84 ggatgccagg aataaactgt ttagaaagct tttttcaaag 40 <210> 85 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> pGPD_F <400> 85 ctttgaaaaa agctttctaa acagtttatt cctggcatcc 40 <210> 86 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> pGPD_R <400> 86 aacattggag attcactcat ttgtttgttt atgtgtgttt 40 <210> 87 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> ARO4_F <400> 87 aaacacacat aaacaaacaa atgagtgaat ctccaatgtt 40 <210> 88 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> ARO4_R <400> 88 gtcgacctat ttcttgttaa cttctc 26 <210> 89 <211> 438 <212> DNA <213> Corynebacterium glutamicum ATCC13032 <400> 89 atgcctggaa aaattctcct cctcaacggc ccaaacctga acatgctggg caaacgcgag 60 cctgacattt acggacacga caccttggaa gacgtcgtcg cgctggcaac cgctgaggct 120 gcgaagcacg gccttgaggt tgaggcgctg cagagcaatc acgaaggtga gctaatcgat 180 gcgctgcaca acgctcgcgg cacccacatc ggttgcgtga ttaaccccgg cggcctgact 240 cacacttcgg tggcgctttt ggatgctgtg aaggcgtctg agcttcctac cgttgaggtg 300 cacatttcca atccgcatgc ccgtgaagag ttccgccacc attcttacat ttccctcgcc 360 gcggtctccg ttatcgctgg cgctggcatc cagggttacc gtttcgcggt cgatatcctg 420 gcaaatctca aaaagtag 438 <210> 90 <211> 145 <212> PRT <213> Corynebacterium glutamicum ATCC13032 <400> 90 Met Pro Gly Lys Ile Leu Leu Leu Asn Gly Pro Asn Leu Asn Met Leu 1 5 10 15 Gly Lys Arg Glu Pro Asp Ile Tyr Gly His Asp Thr Leu Glu Asp Val 20 25 30 Val Ala Leu Ala Thr Ala Glu Ala Ala Lys His Gly Leu Glu Val Glu 35 40 45 Ala Leu Gln Ser Asn His Glu Gly Glu Leu Ile Asp Ala Leu His Asn 50 55 60 Ala Arg Gly Thr His Ile Gly Cys Val Ile Asn Pro Gly Gly Leu Thr 65 70 75 80 His Thr Ser Val Ala Leu Leu Asp Ala Val Lys Ala Ser Glu Leu Pro 85 90 95 Thr Val Glu Val His Ile Ser Asn Pro His Ala Arg Glu Glu Phe Arg 100 105 110 His His Ser Tyr Ile Ser Leu Ala Ala Val Ser Val Ile Ala Gly Ala 115 120 125 Gly Ile Gln Gly Tyr Arg Phe Ala Val Asp Ile Leu Ala Asn Leu Lys 130 135 140 Lys 145 <210> 91 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> aroD_F <400> 91 gatcggatcc cactggacgt ttgggtgaga cc 32 <210> 92 <211> 37 <212> DNA <213> Artificial Sequence <220> <223> aroD_R <400> 92 gatcggatcc actagtttta ggttccattt ctaattg 37 <210> 93 <211> 29 <212> DNA <213> Artificial Sequence <220> <223> aroD_F <400> 93 gatcactagt atgaacgaca gtattctcc 29 <210> 94 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> aroD_D <400> 94 gatcaagctt gttacatcct gacgttgtgg 30 <210> 95 <211> 2103 <212> DNA <213> Corynebacterium glutamicum ATCC13032 <400> 95 ttgaccacct tgacgctgtc acctgaactt caggcgctca ctgtacgcaa ttacccctct 60 gattggtccg atgtggacac caaggctgta gacactgttc gtgtcctcgc tgcagacgct 120 gtagaaaact gtggctccgg ccacccaggc accgcaatga gcctggctcc ccttgcatac 180 accttgtacc agcgggttat gaacgtagat ccacaggaca ccaactgggc aggccgtgac 240 cgcttcgttc tttcttgtgg ccactcctct ttgacccagt acatccagct ttacttgggt 300 ggattcggcc ttgagatgga tgacctgaag gctctgcgca cctgggattc cttgacccca 360 ggacaccctg agtaccgcca caccaagggc gttgagatca ccactggccc tcttggccag 420 ggtcttgcat ctgcagttgg tatggccatg gctgctcgtc gtgagcgtgg cctattcgac 480 ccaaccgctg ctgagggcga atccccattc gaccaccaca tctacgtcat tgcttctgat 540 ggtgacctgc aggaaggtgt cacctctgag gcatcctcca tcgctggcac ccagcagctg 600 ggcaacctca tcgtgttctg ggatgacaac cgcatctcca tcgaagacaa cactgagatc 660 gctttcaacg aggacgttgt tgctcgttac aaggcttacg gctggcagac cattgaggtt 720 gaggctggcg aggacgttgc agcaatcgaa gctgcagtgg ctgaggctaa gaaggacacc 780 aagcgaccta ccttcatccg cgttcgcacc atcatcggct tcccagctcc aactatgatg 840 aacaccggtg ctgtgcacgg tgctgctctt ggcgcagctg aggttgcagc aaccaagact 900 gagcttggat tcgatcctga ggctcacttc gcgatcgacg atgaggttat cgctcacacc 960 cgctccctcg cagagcgcgc tgcacagaag aaggctgcat ggcaggtcaa gttcgatgag 1020 tgggcagctg ccaaccctga gaacaaggct ctgttcgatc gcctgaactc ccgtgagctt 1080 ccagcgggct acgctgacga gctcccaaca tgggatgcag atgagaaggg cgtcgcaact 1140 cgtaaggctt ccgaggctgc acttcaggca ctgggcaaga cccttcctga gctgtggggc 1200 ggttccgctg acctcgcagg ttccaacaac accgtgatca agggctcccc ttccttcggc 1260 cctgagtcca tctccaccga gacctggtct gctgagcctt acggccgtaa cctgcacttc 1320 ggtatccgtg agcacgctat gggatccatc ctcaacggca tttccctcca cggtggcacc 1380 cgcccatacg gcggaacctt cctcatcttc tccgactaca tgcgtcctgc agttcgtctt 1440 gcagctctca tggagaccga cgcttactac gtctggaccc acgactccat cggtctgggc 1500 gaagatggcc caacccacca gcctgttgaa accttggctg cactgcgcgc catcccaggt 1560 ctgtccgtcc tgcgtcctgc agatgcgaac gagaccgccc aggcttgggc tgcagcactt 1620 gagtacaagg aaggccctaa gggtcttgca ctgacccgcc agaacgttcc tgttctggaa 1680 ggcaccaagg agaaggctgc tgaaggcgtt cgccgcggtg gctacgtcct ggttgagggt 1740 tccaaggaaa ccccagatgt gatcctcatg ggctccggct ccgaggttca gcttgcagtt 1800 aacgctgcga aggctctgga agctgagggc gttgcagctc gcgttgtttc cgttccttgc 1860 atggattggt tccaggagca ggacgcagag tacatcgagt ccgttctgcc tgcagctgtg 1920 accgctcgtg tgtctgttga agctggcatc gcaatgcctt ggtaccgctt cttgggcacc 1980 cagggccgtg ctgtctccct tgagcacttc ggtgcttctg cggattacca gaccctgttt 2040 gagaagttcg gcatcaccac cgatgcagtc gtggcagcgg ccaaggactc cattaacggt 2100 taa 2103 <210> 96 <211> 700 <212> PRT <213> Corynebacterium glutamicum ATCC13032 <400> 96 Met Thr Thr Leu Thr Leu Ser Pro Glu Leu Gln Ala Leu Thr Val Arg 1 5 10 15 Asn Tyr Pro Ser Asp Trp Ser Asp Val Asp Thr Lys Ala Val Asp Thr 20 25 30 Val Arg Val Leu Ala Ala Asp Ala Val Glu Asn Cys Gly Ser Gly His 35 40 45 Pro Gly Thr Ala Met Ser Leu Ala Pro Leu Ala Tyr Thr Leu Tyr Gln 50 55 60 Arg Val Met Asn Val Asp Pro Gln Asp Thr Asn Trp Ala Gly Arg Asp 65 70 75 80 Arg Phe Val Leu Ser Cys Gly His Ser Ser Leu Thr Gln Tyr Ile Gln 85 90 95 Leu Tyr Leu Gly Gly Phe Gly Leu Glu Met Asp Asp Leu Lys Ala Leu 100 105 110 Arg Thr Trp Asp Ser Leu Thr Pro Gly His Pro Glu Tyr Arg His Thr 115 120 125 Lys Gly Val Glu Ile Thr Thr Gly Pro Leu Gly Gln Gly Leu Ala Ser 130 135 140 Ala Val Gly Met Ala Met Ala Ala Arg Arg Glu Arg Gly Leu Phe Asp 145 150 155 160 Pro Thr Ala Ala Glu Gly Glu Ser Pro Phe Asp His His Ile Tyr Val 165 170 175 Ile Ala Ser Asp Gly Asp Leu Gln Glu Gly Val Thr Ser Glu Ala Ser 180 185 190 Ser Ile Ala Gly Thr Gln Gln Leu Gly Asn Leu Ile Val Phe Trp Asp 195 200 205 Asp Asn Arg Ile Ser Ile Glu Asp Asn Thr Glu Ile Ala Phe Asn Glu 210 215 220 Asp Val Val Ala Arg Tyr Lys Ala Tyr Gly Trp Gln Thr Ile Glu Val 225 230 235 240 Glu Ala Gly Glu Asp Val Ala Ala Ile Glu Ala Ala Val Ala Glu Ala 245 250 255 Lys Lys Asp Thr Lys Arg Pro Thr Phe Ile Arg Val Arg Thr Ile Ile 260 265 270 Gly Phe Pro Ala Pro Thr Met Met Asn Thr Gly Ala Val His Gly Ala 275 280 285 Ala Leu Gly Ala Ala Glu Val Ala Ala Thr Lys Thr Glu Leu Gly Phe 290 295 300 Asp Pro Glu Ala His Phe Ala Ile Asp Asp Glu Val Ile Ala His Thr 305 310 315 320 Arg Ser Leu Ala Glu Arg Ala Ala Gln Lys Lys Ala Ala Trp Gln Val 325 330 335 Lys Phe Asp Glu Trp Ala Ala Ala Asn Pro Glu Asn Lys Ala Leu Phe 340 345 350 Asp Arg Leu Asn Ser Arg Glu Leu Pro Ala Gly Tyr Ala Asp Glu Leu 355 360 365 Pro Thr Trp Asp Ala Asp Glu Lys Gly Val Ala Thr Arg Lys Ala Ser 370 375 380 Glu Ala Ala Leu Gln Ala Leu Gly Lys Thr Leu Pro Glu Leu Trp Gly 385 390 395 400 Gly Ser Ala Asp Leu Ala Gly Ser Asn Asn Thr Val Ile Lys Gly Ser 405 410 415 Pro Ser Phe Gly Pro Glu Ser Ile Ser Thr Glu Thr Trp Ser Ala Glu 420 425 430 Pro Tyr Gly Arg Asn Leu His Phe Gly Ile Arg Glu His Ala Met Gly 435 440 445 Ser Ile Leu Asn Gly Ile Ser Leu His Gly Gly Thr Arg Pro Tyr Gly 450 455 460 Gly Thr Phe Leu Ile Phe Ser Asp Tyr Met Arg Pro Ala Val Arg Leu 465 470 475 480 Ala Ala Leu Met Glu Thr Asp Ala Tyr Tyr Val Trp Thr His Asp Ser 485 490 495 Ile Gly Leu Gly Glu Asp Gly Pro Thr His Gln Pro Val Glu Thr Leu 500 505 510 Ala Ala Leu Arg Ala Ile Pro Gly Leu Ser Val Leu Arg Pro Ala Asp 515 520 525 Ala Asn Glu Thr Ala Gln Ala Trp Ala Ala Ala Leu Glu Tyr Lys Glu 530 535 540 Gly Pro Lys Gly Leu Ala Leu Thr Arg Gln Asn Val Pro Val Leu Glu 545 550 555 560 Gly Thr Lys Glu Lys Ala Ala Glu Gly Val Arg Arg Gly Gly Tyr Val 565 570 575 Leu Val Glu Gly Ser Lys Glu Thr Pro Asp Val Ile Leu Met Gly Ser 580 585 590 Gly Ser Glu Val Gln Leu Ala Val Asn Ala Ala Lys Ala Leu Glu Ala 595 600 605 Glu Gly Val Ala Ala Arg Val Val Ser Val Pro Cys Met Asp Trp Phe 610 615 620 Gln Glu Gln Asp Ala Glu Tyr Ile Glu Ser Val Leu Pro Ala Ala Val 625 630 635 640 Thr Ala Arg Val Ser Val Glu Ala Gly Ile Ala Met Pro Trp Tyr Arg 645 650 655 Phe Leu Gly Thr Gln Gly Arg Ala Val Ser Leu Glu His Phe Gly Ala 660 665 670 Ser Ala Asp Tyr Gln Thr Leu Phe Glu Lys Phe Gly Ile Thr Thr Asp 675 680 685 Ala Val Val Ala Ala Ala Lys Asp Ser Ile Asn Gly 690 695 700 <210> 97 <211> 1095 <212> DNA <213> Corynebacterium glutamicum ATCC13032 <400> 97 atgaccaaca gtttgaacat cccgtttgtc cagcgcttcg atgaaggcct ggatcctgtt 60 ctagaagtac tcggtggcaa gggcgcttca ctagtcacca tgacagatgc tggaatgccc 120 gttccacctg gatttgtggt cactactgcc agctttgatg aattcatccg tgaagcaggg 180 gttgctgaac acatcgataa attcctaaac gatctcgatg cagaagatgt taaggaagtg 240 gatcgagttt ctgcgatcat ccgcgatgag ctgtgcagtc ttgacgttcc agagaatgct 300 cgtttcgcag tgcaccaggc ttatcgcgat ctcatggaac gatgcggtgg cgacgtcccg 360 gttgctgtcc ggtcatcggc cactgccgaa gatctgcccg atgcttcctt cgcagggcaa 420 caggacacct atctgtggca agtcggtttg agcgctgtca ctgaacacat ccgtaaatgc 480 tgggcttcgc tgttcacttc ccgtgccatt atctaccgtc tgaaaaacaa catccccaat 540 gagggcctct ccatggcggt agttgttcaa aaaatggtca actctcgtgt cgcaggcgtg 600 gcaatcacta tgaatccttc caacggcgac cgctcgaaga tcaccatcga ttcctcatgg 660 ggtgttggtg aaatggtggt ctcaggtgaa gtgacaccag acaatatctt gctggacaag 720 atcacgctgc aggttgtctc cgaacacatt ggaagcaaac acgctgaact catccccgat 780 gccaccagtg gaagcctcgt ggaaaagccc gttgatgaag aacgcgcaaa ccgccgcagt 840 ctgactgatg aggaaatgct cgctgtggca caaatggcta agcgtgcaga aaaacactac 900 aagtgcccac aagatatcga atgggcgctg gacgctgatc tgccagatgg agaaaacctt 960 ctgttattgc aatcccgccc ggaaactatc cactccaacg gtgtgaagaa ggaaacccca 1020 actccgcagg ctgccaaaac cataggcacc ttcgatttca gctcaatcac cgtcgcaatg 1080 accggcacga agtaa 1095 <210> 98 <211> 364 <212> PRT <213> Corynebacterium glutamicum ATCC13032 <400> 98 Met Thr Asn Ser Leu Asn Ile Pro Phe Val Gln Arg Phe Asp Glu Gly 1 5 10 15 Leu Asp Pro Val Leu Glu Val Leu Gly Gly Lys Gly Ala Ser Leu Val 20 25 30 Thr Met Thr Asp Ala Gly Met Pro Val Pro Pro Gly Phe Val Val Thr 35 40 45 Thr Ala Ser Phe Asp Glu Phe Ile Arg Glu Ala Gly Val Ala Glu His 50 55 60 Ile Asp Lys Phe Leu Asn Asp Leu Asp Ala Glu Asp Val Lys Glu Val 65 70 75 80 Asp Arg Val Ser Ala Ile Ile Arg Asp Glu Leu Cys Ser Leu Asp Val 85 90 95 Pro Glu Asn Ala Arg Phe Ala Val His Gln Ala Tyr Arg Asp Leu Met 100 105 110 Glu Arg Cys Gly Gly Asp Val Pro Val Ala Val Arg Ser Ser Ala Thr 115 120 125 Ala Glu Asp Leu Pro Asp Ala Ser Phe Ala Gly Gln Gln Asp Thr Tyr 130 135 140 Leu Trp Gln Val Gly Leu Ser Ala Val Thr Glu His Ile Arg Lys Cys 145 150 155 160 Trp Ala Ser Leu Phe Thr Ser Arg Ala Ile Ile Tyr Arg Leu Lys Asn 165 170 175 Asn Ile Pro Asn Glu Gly Leu Ser Met Ala Val Val Val Gln Lys Met 180 185 190 Val Asn Ser Arg Val Ala Gly Val Ala Ile Thr Met Asn Pro Ser Asn 195 200 205 Gly Asp Arg Ser Lys Ile Thr Ile Asp Ser Ser Trp Gly Val Gly Glu 210 215 220 Met Val Val Ser Gly Glu Val Thr Pro Asp Asn Ile Leu Leu Asp Lys 225 230 235 240 Ile Thr Leu Gln Val Val Ser Glu His Ile Gly Ser Lys His Ala Glu 245 250 255 Leu Ile Pro Asp Ala Thr Ser Gly Ser Leu Val Glu Lys Pro Val Asp 260 265 270 Glu Glu Arg Ala Asn Arg Arg Ser Leu Thr Asp Glu Glu Met Leu Ala 275 280 285 Val Ala Gln Met Ala Lys Arg Ala Glu Lys His Tyr Lys Cys Pro Gln 290 295 300 Asp Ile Glu Trp Ala Leu Asp Ala Asp Leu Pro Asp Gly Glu Asn Leu 305 310 315 320 Leu Leu Leu Gln Ser Arg Pro Glu Thr Ile His Ser Asn Gly Val Lys 325 330 335 Lys Glu Thr Pro Thr Pro Gln Ala Ala Lys Thr Ile Gly Thr Phe Asp 340 345 350 Phe Ser Ser Ile Thr Val Ala Met Thr Gly Thr Lys 355 360 <210> 99 <211> 3926 <212> DNA <213> Saccharomyces cerevisiae <400> 99 ttggtcatgc ttatgaagct atactaaccc cacaagcatt acatggtgaa tgtgtgtcca 60 ttggtatggt taaagaggcg gaattatccc gttatttcgg tattctctcc cctacccaag 120 ttgcacgtct atccaagatt ttggttgcct acgggttgcc tgtttcgcct gatgagaaat 180 ggtttaaaga gctaacctta cataagaaaa caccattgga tatcttattg aagaaaatga 240 gtattgacaa gaaaaacgag ggttccaaaa agaaggtggt cattttagaa agtattggta 300 agtgctatgg tgactccgct caatttgtta gcgatgaaga cctgagattt attctaacag 360 atgaaaccct cgtttacccc ttcaaggaca tccctgctga tcaacagaaa gttgttatcc 420 cccctggttc taagtccatc tccaatcgtg ctttaattct tgctgccctc ggtgaaggtc 480 aatgtaaaat caagaactta ttacattctg atgatactaa acatatgtta accgctgttc 540 atgaattgaa aggtgctacg atatcatggg aagataatgg tgagacggta gtggtggaag 600 gacatggtgg ttccacattg tcagcttgtg ctgacccctt atatctaggt aatgcaggta 660 ctgcatctag atttttgact tccttggctg ccttggtcaa ttctacttca agccaaaagt 720 atatcgtttt aactggtaac gcaagaatgc aacaaagacc aattgctcct ttggtcgatt 780 ctttgcgtgc taatggtact aaaattgagt acttgaataa tgaaggttcc ctgccaatca 840 aagtttatac tgattcggta ttcaaaggtg gtagaattga attagctgct acagtttctt 900 ctcagtacgt atcctctatc ttgatgtgtg ccccatacgc tgaagaacct gtaactttgg 960 ctcttgttgg tggtaagcca atctctaaat tgtacgtcga tatgacaata aaaatgatgg 1020 aaaaattcgg tatcaatgtt gaaacttcta ctacagaacc ttacacttat tatattccaa 1080 agggacatta tattaaccca tcagaatacg tcattgaaag tgatgcctca agtgctacat 1140 acccattggc cttcgccgca atgactggta ctaccgtaac ggttccaaac attggttttg 1200 agtcgttaca aggtgatgcc agatttgcaa gagatgtctt gaaacctatg ggttgtaaaa 1260 taactcaaac ggcaacttca actactgttt cgggtcctcc tgtaggtact ttaaagccat 1320 taaaacatgt tgatatggag ccaatgactg atgcgttctt aactgcatgt gttgttgccg 1380 ctatttcgca cgacagtgat ccaaattctg caaatacaac caccattgaa ggtattgcaa 1440 accagcgtgt caaagagtgt aacagaattt tggccatggc tacagagctc gccaaatttg 1500 gcgtcaaaac tacagaatta ccagatggta ttcaagtcca tggtttaaac tcgataaaag 1560 atttgaaggt tccttccgac tcttctggac ctgtcggtgt atgcacatat gatgatcatc 1620 gtgtggccat gagtttctcg cttcttgcag gaatggtaaa ttctcaaaat gaacgtgacg 1680 aagttgctaa tcctgtaaga atacttgaaa gacattgtac tggtaaaacc tggcctggct 1740 ggtgggatgt gttacattcc gaactaggtg ccaaattaga tggtgcagaa cctttagagt 1800 gcacatccaa aaagaactca aagaaaagcg ttgtcattat tggcatgaga gcagctggca 1860 aaactactat aagtaaatgg tgcgcatccg ctctgggtta caaattagtt gacctagacg 1920 agctgtttga gcaacagcat aacaatcaaa gtgttaaaca atttgttgtg gagaacggtt 1980 gggagaagtt ccgtgaggaa gaaacaagaa ttttcaagga agttattcaa aattacggcg 2040 atgatggata tgttttctca acaggtggcg gtattgttga aagcgctgag tctagaaaag 2100 ccttaaaaga ttttgcctca tcaggtggat acgttttaca cttacatagg gatattgagg 2160 agacaattgt ctttttacaa agtgatcctt caagacctgc ctatgtggaa gaaattcgtg 2220 aagtttggaa cagaagggag gggtggtata aagaatgctc aaatttctct ttctttgctc 2280 ctcattgctc cgcagaagct gagttccaag ctctaagaag atcgtttagt aagtacattg 2340 caaccattac aggtgtcaga gaaatagaaa ttccaagcgg aagatctgcc tttgtgtgtt 2400 taacctttga tgacttaact gaacaaactg agaatttgac tccaatctgt tatggttgtg 2460 aggctgtaga ggtcagagta gaccatttgg ctaattactc tgctgatttc gtgagtaaac 2520 agttatctat attgcgtaaa gccactgaca gtattcctat catttttact gtgcgaacca 2580 tgaagcaagg tggcaacttt cctgatgaag agttcaaaac cttgagagag ctatacgata 2640 ttgccttgaa gaatggtgtt gaattccttg acttagaact aactttacct actgatatcc 2700 aatatgaggt tattaacaaa aggggcaaca ccaagatcat tggttcccat catgacttcc 2760 aaggattata ctcctgggac gacgctgaat gggaaaacag attcaatcaa gcgttaactc 2820 ttgatgtgga tgttgtaaaa tttgtgggta cggctgttaa tttcgaagat aatttgagac 2880 tggaacactt tagggataca cacaagaata agcctttaat tgcagttaat atgacttcta 2940 aaggtagcat ttctcgtgtt ttgaataatg ttttaacacc tgtgacatca gatttattgc 3000 ctaactccgc tgcccctggc caattgacag tagcacaaat taacaagatg tatacatcta 3060 tgggaggtat cgagcctaag gaactgtttg ttgttggaaa gccaattggc cactctagat 3120 cgccaatttt acataacact ggctatgaaa ttttaggttt acctcacaag ttcgataaat 3180 ttgaaactga atccgcacaa ttggtgaaag aaaaactttt ggacggaaac aagaactttg 3240 gcggtgctgc agtcacaatt cctctgaaat tagatataat gcagtacatg gatgaattga 3300 ctgatgctgc taaagttatt ggtgctgtaa acacagttat accattgggt aacaagaagt 3360 ttaagggtga taataccgac tggttaggta tccgtaatgc cttaattaac aatggcgttc 3420 ccgaatatgt tggtcatacc gctggtttgg ttatcggtgc aggtggcact tctagagccg 3480 ccctttacgc cttgcacagt ttaggttgca aaaagatctt cataatcaac aggacaactt 3540 cgaaattgaa gccattaata gagtcacttc catctgaatt caacattatt ggaatagagt 3600 ccactaaatc tatagaagag attaaggaac acgttggcgt tgctgtcagc tgtgtaccag 3660 ccgacaaacc attagatgac gaacttttaa gtaagctgga gagattcctt gtgaaaggtg 3720 cccatgctgc ttttgtacca accttattgg aagccgcata caaaccaagc gttactcccg 3780 ttatgacaat ttcacaagac aaatatcaat ggcacgttgt ccctggatca caaatgttag 3840 tacaccaagg tgtagctcag tttgaaaagt ggacaggatt caagggccct ttcaaggcca 3900 tttttgatgc cgttacgaaa gagtag 3926 <210> 100 <211> 2247 <212> DNA <213> Anabaena variabilis ATCC29413 <400> 100 atgagtatcg tccaagcaaa gtttgaagct aaggaaacat cttttcatgt agaaggttac 60 gaaaagattg agtatgattt ggtgtatgta gatggtattt ttgaaatcca gaattctgca 120 ctagcagatg tatatcaagg ttttggacga tgcttggcga ttgtagatgc taacgtcagt 180 cggttgtatg gtaatcaaat tcaggcatat ttccagtatt atggtataga actgaggcta 240 tttcctatta ccattactga accagataag actattcaaa ctttcgagag agttatagat 300 gtctttgcag atttcaaatt agtccgcaaa gaaccagtat tagtcgtggg tggcggttta 360 attacagatg ttgtcggctt tgcttgttct acatatcgtc gcagcagcaa ttacatccgc 420 attcctacta cattgattgg attaattgat gccagtgtag caattaaggt agcagttaat 480 catcgcaaac tgaaaaaccg tttgggtgct tatcatgctt ctcgcaaagt atttttagat 540 ttctccttgt tgcgtactct ccctacagac caagtacgta acgggatggc ggaattggta 600 aaaatcgctg tagtagcgca tcaagaagtt tttgaattgt tggagaagta cggcgaagaa 660 ttactacgta ctcattttgg caatatagat gcaactccag agattaaaga aatagcccat 720 cgtttgactt acaaagctat ccataagatg ttggaattgg aagttcccaa cctgcatgag 780 ttagacctag atagggtgat tgcttacggt cacacttgga gtcccacctt ggaacttgcg 840 cctcgtctac ccatgttcca cggacacgcc gttaatgtag atatggcttt ctcggcaacg 900 atcgccgccc gtagaggata tattacaatt gcagaacgcg atcgtatttt aggattaatg 960 agtcgcgttg gtctatccct cgaccatccc atgttggata tagatatttt gtggcgtggt 1020 actgaatcta tcacattaac tcgtgatggt ttgttaagag ctgctatgcc aaaacccatt 1080 ggtgattgtg tcttcgtcaa tgacctgaca agagaagaat tagcagccgc attagctgac 1140 cacaaagaac tttgtaccag ttatccccgt ggtggtgaag gtgtggatgt gtatcccgtt 1200 tatcaaaaag aattaatcgg gagtgttaaa taatgacttt tttgaattca aaatgcaaaa 1260 tactccacgg atacactgcg cgagcgcggt agcatttctg ttcgcggagc gtcccgtagg 1320 gaaagagaag gctacgcaaa taatcggaca ctaattgtct ttaattttga attttgaatt 1380 ttgaattttg aattggagcg aagcgacttg acaaatgtga ttgtccaacc aacagctaga 1440 cctgttacac cattgggaat tttaaccaag cagttagaag ccatagtcca agaggttaag 1500 caacatccag atttacctgg ggaattgata gcaaacatcc atcaggcttg gcgtttagcc 1560 gcaggtatag acccttattt ggaagaatgc accactccag aatctcctga actcgctgca 1620 ttggcaaaaa ccacagccac cgaagcctgg ggagaacact tccacggagg tacaaccgtc 1680 cgtcctctag aacaagagat gctttctggt catatcgaag gacaaacctt aaagatgttt 1740 gttcacatga ccaaagctaa aaaagtctta gaaattggga tgtttaccgg ttattcggcg 1800 ctggcgatgg cggaagcatt accagaggat ggactgcttg tggcttgtga agttgaccct 1860 tacgcggcgg aaattggaca gaaagccttt caacaatctc cccacggtgg aaagattcgt 1920 gtggaattgg atgcagcctt agcaactctt gataagttag cagaagctgg ggagtctttt 1980 gacttggtat ttatcgacgc agataaaaaa gagtatgtag cctattttca caagttgcta 2040 ggtagcagtt tgttagcacc agatggcttt atttgtgtag ataacacctt attacaaggg 2100 gaagtttatc taccagcaga ggaacgtagc gtcaatggtg aagcgatcgc gcaatttaat 2160 catacagtag ctatagaccc ccgtgtagaa caggttttgt tgccgttgcg agatggttta 2220 acaattatcc gcagaataca accttaa 2247 <210> 101 <211> 3532 <212> DNA <213> Anabaena variabilis ATCC29413 <400> 101 tccagaattc tgcactagca gatgtatatc aaggttttgg acgatgcttg gcgattgtag 60 atgctaacgt cagtcggttg tatggtaatc aaattcaggc atatttccag tattatggta 120 tagaactgag gctatttcct attaccatta ctgaaccaga taagactatt caaactttcg 180 agagagttat agatgtcttt gcagatttca aattagtccg caaagaacca gtattagtcg 240 tgggtggcgg tttaattaca gatgttgtcg gctttgcttg ttctacatat cgtcgcagca 300 gcaattacat ccgcattcct actacattga ttggattaat tgatgccagt gtagcaatta 360 aggtagcagt taatcatcgc aaactgaaaa accgtttggg tgcttatcat gcttctcgca 420 aagtattttt agatttctcc ttgttgcgta ctctccctac agaccaagta cgtaacggga 480 tggcggaatt ggtaaaaatc gctgtagtag cgcatcaaga agtttttgaa ttgttggaga 540 agtacggcga agaattacta cgtactcatt ttggcaatat agatgcaact ccagagatta 600 aagaaatagc ccatcgtttg acttacaaag ctatccataa gatgttggaa ttggaagttc 660 ccaacctgca tgagttagac ctagataggg tgattgctta cggtcacact tggagtccca 720 ccttggaact tgcgcctcgt ctacccatgt tccacggaca cgccgttaat gtagatatgg 780 ctttctcggc aacgatcgcc gcccgtagag gatatattac aattgcagaa cgcgatcgta 840 ttttaggatt aatgagtcgc gttggtctat ccctcgacca tcccatgttg gatatagata 900 ttttgtggcg tggtactgaa tctatcacat taactcgtga tggtttgtta agagctgcta 960 tgccaaaacc cattggtgat tgtgtcttcg tcaatgacct gacaagagaa gaattagcag 1020 ccgcattagc tgaccacaaa gaactttgta ccagttatcc ccgtggtggt gaaggtgtgg 1080 atgtgtatcc cgtttatcaa aaagaattaa tcgggagtgt taaataatga cttttttgaa 1140 ttcaaaatgc aaaatactcc acggatacac tgcgcgagcg cggtagcatt tctgttcgcg 1200 gagcgtcccg tagggaaaga gaaggctacg caaataatcg gacactaatt gtctttaatt 1260 ttgaattttg aattttgaat tttgaattgg agcgaagcga cttgacaaat gtgattgtcc 1320 aaccaacagc tagacctgtt acaccattgg gaattttaac caagcagtta gaagccatag 1380 tccaagaggt taagcaacat ccagatttac ctggggaatt gatagcaaac atccatcagg 1440 cttggcgttt agccgcaggt atagaccctt atttggaaga atgcaccact ccagaatctc 1500 ctgaactcgc tgcattggca aaaaccacag ccaccgaagc ctggggagaa cacttccacg 1560 gaggtacaac cgtccgtcct ctagaacaag agatgctttc tggtcatatc gaaggacaaa 1620 ccttaaagat gtttgttcac atgaccaaag ctaaaaaagt cttagaaatt gggatgttta 1680 ccggttattc ggcgctggcg atggcggaag cattaccaga ggatggactg cttgtggctt 1740 gtgaagttga cccttacgcg gcggaaattg gacagaaagc ctttcaacaa tctccccacg 1800 gtggaaagat tcgtgtggaa ttggatgcag ccttagcaac tcttgataag ttagcagaag 1860 ctggggagtc ttttgacttg gtatttatcg acgcagataa aaaagagtat gtagcctatt 1920 ttcacaagtt gctaggtagc agtttgttag caccagatgg ctttatttgt gtagataaca 1980 ccttattaca aggggaagtt tatctaccag cagaggaacg tagcgtcaat ggtgaagcga 2040 tcgcgcaatt taatcataca gtagctatag acccccgtgt agaacaggtt ttgttgccgt 2100 tgcgagatgg tttaacaatt atccgcagaa tacaacctta attgtccaat cgactatggc 2160 acaatccctt cccctttctt ccgcacctgc tacaccgtct cttccttccc agacgaaaat 2220 agccgcaatt atccaaaata tctgcacttt ggctttgtta ttactagcat tgcccattaa 2280 tgccaccatt gtttttatat ccttgttagt cttccgaccg caaaaggtca aagcagcaaa 2340 cccccaaacc attcttatca gtggcggtaa gatgaccaaa gctttacaac tagcaaggtc 2400 attccacgcg gctggacata gagttgtctt ggtggaaacc cataaatact ggttgactgg 2460 tcatcgtttt tcccaagcag tggataagtt ttacacagtc cccgcacccc aggacaatcc 2520 ccaagcttac attcaggctt tggtagatat cgtcaaacaa gaaaacatcg atgtttatat 2580 tcccgtcacc agtccagtgg gtagctacta cgactcatta gccaaaccag agttatccca 2640 ttattgcgaa gtgtttcact ttgacgcaga tattacccaa atgttggatg ataaatttgc 2700 gttgacacaa aaagcgcgat cgcttggttt atcagtaccc aaatccttta aaattacctc 2760 accagaacaa gtcatcaact tcgatttttc tggagagaca cgtaaataca tcctcaaaag 2820 cattccctac gactcagtgc ggcggttgga cttaaccaaa ctcccctgtg ctactccaga 2880 ggaaacagca gcattcgtca gaagtttgcc aattactccc gaaaaaccgt ggattatgca 2940 ggaatttatc cccggtaagg aattctgcac ccatagcacc gttcggaatg gggaactcag 3000 actgcattgc tgttgcgaat cttcagcctt ccaagttaat tatgagaatg taaataaccc 3060 gcaaattacc gaatgggtac agcattttgt caaggaactg aaactgacag gacagatttc 3120 ctttgacttt atccaagccg aagacggaac agtttacgcc atcgagtgta acccccgcac 3180 acattcagca attaccacat tttacgacca cccccaggta gcagaagcgt acttgagtca 3240 agcaccgacg actgaaacca tacaaccact aacgacaagc aagcctacct attggactta 3300 tcacgaagtt tggcgtttaa ctggtatccg ttctttcacc cagttgcaaa gatggctggg 3360 gaatatttgg cgcgggactg atgcgattta tcagccagat gaccccttac cgtttttgat 3420 ggtacatcat tggcaaattc ccctactgtt attgaataat ttgcgtcgtc ttaaaggttg 3480 gacgcggata gatttcaata ttgggaagtt ggtggaattg gggggagatt ag 3532 <210> 102 <211> 1233 <212> DNA <213> Anabaena variabilis ATCC29413 <400> 102 atgagtatcg tccaagcaaa gtttgaagct aaggaaacat cttttcatgt agaaggttac 60 gaaaagattg agtatgattt ggtgtatgta gatggtattt ttgaaatcca gaattctgca 120 ctagcagatg tatatcaagg ttttggacga tgcttggcga ttgtagatgc taacgtcagt 180 cggttgtatg gtaatcaaat tcaggcatat ttccagtatt atggtataga actgaggcta 240 tttcctatta ccattactga accagataag actattcaaa ctttcgagag agttatagat 300 gtctttgcag atttcaaatt agtccgcaaa gaaccagtat tagtcgtggg tggcggttta 360 attacagatg ttgtcggctt tgcttgttct acatatcgtc gcagcagcaa ttacatccgc 420 attcctacta cattgattgg attaattgat gccagtgtag caattaaggt agcagttaat 480 catcgcaaac tgaaaaaccg tttgggtgct tatcatgctt ctcgcaaagt atttttagat 540 ttctccttgt tgcgtactct ccctacagac caagtacgta acgggatggc ggaattggta 600 aaaatcgctg tagtagcgca tcaagaagtt tttgaattgt tggagaagta cggcgaagaa 660 ttactacgta ctcattttgg caatatagat gcaactccag agattaaaga aatagcccat 720 cgtttgactt acaaagctat ccataagatg ttggaattgg aagttcccaa cctgcatgag 780 ttagacctag atagggtgat tgcttacggt cacacttgga gtcccacctt ggaacttgcg 840 cctcgtctac ccatgttcca cggacacgcc gttaatgtag atatggcttt ctcggcaacg 900 atcgccgccc gtagaggata tattacaatt gcagaacgcg atcgtatttt aggattaatg 960 agtcgcgttg gtctatccct cgaccatccc atgttggata tagatatttt gtggcgtggt 1020 actgaatcta tcacattaac tcgtgatggt ttgttaagag ctgctatgcc aaaacccatt 1080 ggtgattgtg tcttcgtcaa tgacctgaca agagaagaat tagcagccgc attagctgac 1140 cacaaagaac tttgtaccag ttatccccgt ggtggtgaag gtgtggatgt gtatcccgtt 1200 tatcaaaaag aattaatcgg gagtgttaaa taa 1233 <210> 103 <211> 840 <212> DNA <213> Anabaena variabilis ATCC29413 <400> 103 ttgacaaatg tgattgtcca accaacagct agacctgtta caccattggg aattttaacc 60 aagcagttag aagccatagt ccaagaggtt aagcaacatc cagatttacc tggggaattg 120 atagcaaaca tccatcaggc ttggcgttta gccgcaggta tagaccctta tttggaagaa 180 tgcaccactc cagaatctcc tgaactcgct gcattggcaa aaaccacagc caccgaagcc 240 tggggagaac acttccacgg aggtacaacc gtccgtcctc tagaacaaga gatgctttct 300 ggtcatatcg aaggacaaac cttaaagatg tttgttcaca tgaccaaagc taaaaaagtc 360 ttagaaattg ggatgtttac cggttattcg gcgctggcga tggcggaagc attaccagag 420 gatggactgc ttgtggcttg tgaagttgac ccttacgcgg cggaaattgg acagaaagcc 480 tttcaacaat ctccccacgg tggaaagatt cgtgtggaat tggatgcagc cttagcaact 540 cttgataagt tagcagaagc tggggagtct tttgacttgg tatttatcga cgcagataaa 600 aaagagtatg tagcctattt tcacaagttg ctaggtagca gtttgttagc accagatggc 660 tttatttgtg tagataacac cttattacaa ggggaagttt atctaccagc agaggaacgt 720 agcgtcaatg gtgaagcgat cgcgcaattt aatcatacag tagctataga cccccgtgta 780 gaacaggttt tgttgccgtt gcgagatggt ttaacaatta tccgcagaat acaaccttaa 840 840 <210> 104 <211> 1377 <212> DNA <213> Anabaena variabilis ATCC29413 <400> 104 atggcacaat cccttcccct ttcttccgca cctgctacac cgtctcttcc ttcccagacg 60 aaaatagccg caattatcca aaatatctgc actttggctt tgttattact agcattgccc 120 attaatgcca ccattgtttt tatatccttg ttagtcttcc gaccgcaaaa ggtcaaagca 180 gcaaaccccc aaaccattct tatcagtggc ggtaagatga ccaaagcttt acaactagca 240 aggtcattcc acgcggctgg acatagagtt gtcttggtgg aaacccataa atactggttg 300 actggtcatc gtttttccca agcagtggat aagttttaca cagtccccgc accccaggac 360 aatccccaag cttacattca ggctttggta gatatcgtca aacaagaaaa catcgatgtt 420 tatattcccg tcaccagtcc agtgggtagc tactacgact cattagccaa accagagtta 480 tcccattatt gcgaagtgtt tcactttgac gcagatatta cccaaatgtt ggatgataaa 540 tttgcgttga cacaaaaagc gcgatcgctt ggtttatcag tacccaaatc ctttaaaatt 600 acctcaccag aacaagtcat caacttcgat ttttctggag agacacgtaa atacatcctc 660 aaaagcattc cctacgactc agtgcggcgg ttggacttaa ccaaactccc ctgtgctact 720 ccagaggaaa cagcagcatt cgtcagaagt ttgccaatta ctcccgaaaa accgtggatt 780 atgcaggaat ttatccccgg taaggaattc tgcacccata gcaccgttcg gaatggggaa 840 ctcagactgc attgctgttg cgaatcttca gccttccaag ttaattatga gaatgtaaat 900 aacccgcaaa ttaccgaatg ggtacagcat tttgtcaagg aactgaaact gacaggacag 960 atttcctttg actttatcca agccgaagac ggaacagttt acgccatcga gtgtaacccc 1020 cgcacacatt cagcaattac cacattttac gaccaccccc aggtagcaga agcgtacttg 1080 agtcaagcac cgacgactga aaccatacaa ccactaacga caagcaagcc tacctattgg 1140 acttatcacg aagtttggcg tttaactggt atccgttctt tcacccagtt gcaaagatgg 1200 ctggggaata tttggcgcgg gactgatgcg atttatcagc cagatgaccc cttaccgttt 1260 ttgatggtac atcattggca aattccccta ctgttattga ataatttgcg tcgtcttaaa 1320 ggttggacgc ggatagattt caatattggg aagttggtgg aattgggggg agattag 1377 <210> 105 <211> 2358 <212> DNA <213> Anabaena variabilis ATCC29413 <400> 105 gttcctattg accctgaata tcctcaagaa cgcatagctt atatgctaga agattctcag 60 gtgaaggtac tactaactca agaaaaatta ctcaatcaaa ttccccacca tcaagcacaa 120 actatctgtg tagataggga atgggagaaa atttccacac aagctaatac caatcccaaa 180 agtaatataa aaacggataa tcttgcttat gtaatttaca cctctggttc cactggtaaa 240 ccaaaaggtg caatgaacac ccacaaaggt atctgtaatc gcttattgtg gatgcaggaa 300 gcttatcaaa tcgattccac agatagcatt ttacaaaaaa ccccctttag ttttgatgtt 360 tccgtttggg agttcttttg gactttatta actggcgcac gtttggtaat agccaaacca 420 ggcggacata aagatagtgc ttacctcatc gatttaatta ctcaagaaca aatcactacg 480 ttgcattttg tcccctcaat gctgcaagtg tttttacaaa atcgccatgt aagcaaatgc 540 agctctctaa aaagagttat ttgtagcggt gaagctttat ctatagattt acaaaataga 600 tttttccagc atttgcaatg tgaattacat aacctctatg gcccgacaga agcagcaatt 660 gatgtcacat tttggcaatg tagaaaagat agtaatttaa agagtgtacc tattggtcgt 720 cccattgcta atactcaaat ttatattctt gatgccgatt tacaaccagt aaatattggt 780 gtcactggtg aaatttatat tggtggtgta ggggttgctc gtggttattt gaataaagaa 840 gaattgacca aagaaaaatt tattattaat ccctttccca attctgagtt taagcgactt 900 tataaaacag gtgatttagc tcgttattta cccgatggaa atattgaata tcttggtaga 960 acagattatc aagtaaaaat tcggggttat agaattgaaa ttggcgagat tgaaaatgtt 1020 ttatcttcac acccacaagt cagagaagct gtagtcatag cgcgggatga taacgctcaa 1080 gaaaaacaaa tcatcgctta tattacctat aactccatca aacctcagct tgataatctg 1140 cgtgatttcc taaaagcaag gctacctgat tttatgattc cagccgcttt tgtgatgctg 1200 gagcatcttc ctttaactcc cagtggtaaa gtagaccgta aggcattacc taagcctgat 1260 ttatttaatt atagtgaaca taattcctat gtagcgcctc ggaatgaagt tgaagaaaaa 1320 ttagtacaaa tctggtcgaa tattctgcat ttacctaaag taggtgtgac agaaaacttt 1380 ttcgctattg gtggtaattc cctcaaagct ctacatttaa tttctcaaat tgaagagtta 1440 tttgctaaag agatatcctt agcaacactt ttaacaaatc cagtaattgc agatttagcc 1500 aaggttattc aagcaaacaa ccaaatccat aattcacccc tagttccaat tcaaccacaa 1560 ggtaagcagc agcctttctt ttgtatacat cctgctggtg gtcatgtttt atgctatttt 1620 aaactcgcac aatatatagg aactgaccaa ccattttatg gcttacaagc tcaaggattt 1680 tatggagatg aagcaccctt gacgcgagtt gaagatatgg ctagtctcta cgtcaaaact 1740 attagagaat ttcaacccca agggccttat cgtgtcgggg ggtggtcatt tggtggagtc 1800 gtagcttatg aagtagcaca gcagttacat agacaaggac aagaagtatc tttactagca 1860 atattagatt cttacgtacc gattctgctg gataaacaaa aacccattga tgacgtttat 1920 ttagttggtg ttctctccag agtttttggc ggtatgtttg gtcaagataa tctagtcaca 1980 cctgaagaaa tagaaaattt aactgtagaa gaaaaaatta attacatcat tgataaagca 2040 cggagcgcta gaatattccc gcctggtgta gaacgtcaaa ataatcgccg tattcttgat 2100 gttttggtgg gaactttaaa agcaacttat tcctatataa gacaaccata tccaggaaaa 2160 gtcactgtat ttcgagccag ggaaaaacat attatggctc ctgacccgac cttagtttgg 2220 gtagaattat tttctgtaat ggcggctcaa gaaattaaga ttattgatgt ccctggaaac 2280 cattattcgt ttgttctaga accccatgta caggttttag cacagcgttt acaagattgt 2340 ctggaaaata attcataa 2358 <210> 106 <211> 1233 <212> DNA <213> Nostoc punctiforme ATCC29133 <400> 106 atgagtaatg ttcaagcatc gtttgaagca acggaagctg aattccgcgt ggaaggttac 60 gaaaaaattg agtttagtct tgtctatgta aatggtgcat ttgatatcag taacagagaa 120 attgcagaca gctatgagaa gtttggccgt tgtctgactg tgattgatgc taatgtcaac 180 agattatatg gcaagcaaat caagtcatat tttagacact atggtattga tctgaccgta 240 gttcccattg tgattactga gcctactaaa acccttgcaa cctttgagaa aattgttgat 300 gctttttctg actttggttt aatccgcaag gaaccagtat tagtagtggg tggtggttta 360 accactgatg tagctgggtt tgcgtgtgct gcttaccgtc gtaagagtaa ctatattcgg 420 gttccgacaa cgctgattgg tctgattgat gcaggtgtag cgattaaggt tgcagtcaac 480 catcgcaagt taaaaaatcg cttgggtgca tatcatgctc ctttgaaagt catcctcgat 540 ttctccttct tgcaaacatt accaacggct caagttcgta atgggatggc agagttggtc 600 aaaattgctg ttgtggcgaa ctctgaagtc tttgaattgt tgtatgaata tggcgaagag 660 ttgctttcca ctcactttgg atatgtgaat ggtacaaagg aactgaaagc gatcgcacat 720 aaactcaatt acgaggcaat aaaaactatg ctggagttgg aaactccaaa cttgcatgag 780 ttagacctcg atcgcgtcat tgcctacggt cacacttgga gtccgacctt agaattagct 840 ccgatgatac cgttgtttca cggtcatgcc gtcaatatag acatggcttt gtctgcaact 900 attgcggcaa gacgtggcta cattacatca ggagaacgcg atcgcatttt gagcttgatg 960 agtcgtatag gtttatcaat cgatcatcct ctactagatg gcgatttgct ctggtatgct 1020 acccaatcta ttagcttgac gcgagacggg aaacaacgcg cagctatgcc taaacccatt 1080 ggtgagtgct tctttgtcaa cgatttcacc cgtgaagaac tagatgcagc tttagctgaa 1140 cacaaacgtc tgtgtgctac ataccctcgt ggtggagatg gcattgacgc ttacatagaa 1200 actcaagaag aatccaaact attgggagtg tga 1233 <210> 107 <211> 834 <212> DNA <213> Nostoc punctiforme ATCC29133 <400> 107 atgaccagta ttttaggacg agataccgca agaccaataa cgccacatag cattctggta 60 gcacagctac aaaaaaccct cagaatggca gaggaaagta atattccttc agagatactg 120 acttctctgc gccaagggtt gcaattagca gcaggtttag atccctatct ggatgattgc 180 actacccctg aatcgaccgc attgacagca ctagcgcaga agacaagcat tgaagactgg 240 agtaaacgct tcagtgatgg tgaaacagtg cgtcaattag agcaagaaat gctctcagga 300 catcttgaag gacaaacact aaagatgttt gtgcatatca ctaaggctaa aagcatccta 360 gaagtgggaa tgttcacagg atattcagct ttggcaatgg cagaggcgtt accagatgat 420 gggcgactga ttgcttgtga agtagactcc tatgtggccg agtttgctca aacttgcttt 480 caagagtctc cccacggccg caagattgtt gtagaagtgg cacctgcact agagacgctg 540 cacaagctgg tggctaaaaa agaatccttt gatctgatct tcattgatgc ggataaaaag 600 gagtatatag aatacttcca aattatcttg gatagccatt tactagctcc cgacggatta 660 atctgtgtag ataatacttt gttgcaagga caagtttacc tgccatcaga acagcgtaca 720 gccaatggtg aagcgatcgc tcaattcaac cgcattgtcg ccgcagatcc tcgtgtagag 780 caagttctgt tacccatacg agatggtata accctgatta gacgcttggt ataa 834 <210> 108 <211> 1086 <212> DNA <213> Nostoc punctiforme ATCC29133 <400> 108 tactggttat cagggcatag attctcaaat tctgtgagtc gtttttatac agttcctgca 60 ccacaagacg acccagaagg ctatacccaa gcgctattgg aaattgtcaa acgagagaag 120 attgacgttt atgtacccgt atgcagccct gtagctagtt attacgactc tttggcaaag 180 tctgcactat cagaatattg tgaggttttt cactttgatg ctgatataac caagatgctg 240 gatgataaat ttgcctttac cgatcgggcg cgatcgcttg gtttatcagc cccgaaatct 300 tttaaaatta ccgatcctga acaagttatc aacttcgatt ttagtaaaga gacgcgcaaa 360 tatattctta agagtatttc ttacgactca gttcgccgct taaatttaac caaacttcct 420 tgtgataccc cagaagagac agcagcgttt gtcaagagtt tacccatcag cccagaaaaa 480 ccttggatta tgcaagaatt tattcctggg aaagaattat gcacccatag cacagtccga 540 gacggcgaat taaggttgca ttgctgttca aattcttcag cgtttcagat taactatgaa 600 aatgtcgaaa atccccaaat tcaagaatgg gtacaacatt tcgtcaaaag tttacggctg 660 actggacaaa tatctcttga ctttatccaa gctgaagatg gtacagctta tgccattgaa 720 tgtaatcctc gcacccattc ggcgatcaca atgttctaca atcacccagg tgttgcagaa 780 gcctatcttg gtaaaactcc tctagctgca cctttggaac ctcttgcaga tagcaagccc 840 acttactgga tatatcacga aatctggcga ttgactggga ttcgctctgg acaacaatta 900 caaacttggt ttgggagatt agtcagaggt acagatgcca tttatcgcct ggacgatccg 960 ataccatttt taactttgca ccattggcag attactttac ttttgctaca aaatttgcaa 1020 cgactcaaag gttgggtaaa gatcgatttt aatatcggta aactcgtgga attagggggc 1080 gactaa 1086 <210> 109 <211> 1047 <212> DNA <213> Nostoc punctiforme ATCC29133 <400> 109 atgccagtac ttaatatcct tcatttagtt gggtctgcac acgataagtt ttactgtgat 60 ttatcacgtc tttatgccca agactgttta gctgcaacag cagatccatc gctttataac 120 tttcaaattg catatatcac acccgatcgg cagtggcgat ttcctgactc tctcagtcga 180 gaagatattg ctcttaccaa accgattcct gtgtttgatg ccatacaatt tctaacaggc 240 caaaacattg acatgatgtt accacaaatg ttttgtattc ctggaatgac tcagtaccgt 300 gccctattcg atctgctcaa gatcccttat ataggaaata ccccagatat tatggcgatc 360 gcggcccaca aagccagagc caaagcaatt gtcgaagcag caggggtaaa agtgcctcgt 420 ggagaattgc ttcgccaagg agatattcca acaattacac ctccagcagt cgtcaaacct 480 gtaagttctg acaactcttt aggagtagtc ttagttaaag atgtgactga atatgatgct 540 gccttaaaga aagcatttga atatgcttcg gaggtcatcg tagaagcatt catcgaactt 600 ggtcgagaag tcagatgcgg catcattgta aaagacggtg agctaatagg tttacccctt 660 gaagagtatc tggtagaccc acacgataaa cctatccgta actatgctga taaactccaa 720 caaactgacg atggcgactt gcatttgact gctaaagata atatcaaggc ttggatttta 780 gaccctaacg acccaatcac ccaaaaggtt cagcaagtgg ctaaaaggtg tcatcaggct 840 ttgggttgtc gccactacag tttatttgac ttccgaatcg atccaaaggg acaaccttgg 900 ttcttagaag ctggattata ttgttctttt gcccccaaaa gtgtgatttc ttctatggcg 960 aaagcagccg gaatccctct aaatgattta ttaataaccg ctattaatga aacattgggt 1020 agtaataaaa aggtgttaca aaattga 1047 <210> 110 <211> 1626 <212> DNA <213> Saccharomyces cerevisiae CEN.PK-1D <400> 110 aacaagccgg gctttacctt gtctgacaac tacacctatg ttttcttggg tgacggttgt 60 ttgcaagaag gtatttcttc agaagcttcc tccttggctg gtcatttgaa attgggtaac 120 ttgattgcca tctacgatga caacaagatc actatcgatg gtgctaccag tatctcattc 180 gatgaagatg ttgctaagag atacgaagcc tacggttggg aagttttgta cgtagaaaat 240 ggtaacgaag atctagccgg tattgccaag gctattgctc aagctaagtt atccaaggac 300 aaaccaactt tgatcaaaat gaccacaacc attggttacg gttccttgca tgccggctct 360 cactctgtgc acggtgcccc attgaaagca gatgatgtta aacaactaaa gagcaaattc 420 ggtttcaacc cagacaagtc ctttgttgtt ccacaagaag tttacgacca ctaccaaaag 480 acaattttaa agccaggtgt cgaagccaac aacaagtgga acaagttgtt cagcgaatac 540 caaaagaaat tcccagaatt aggtgctgaa ttggctagaa gattgagcgg ccaactaccc 600 gcaaattggg aatctaagtt gccaacttac accgccaagg actctgccgt ggccactaga 660 aaattatcag aaactgttct tgaggatgtt tacaatcaat tgccagagtt gattggtggt 720 tctgccgatt taacaccttc taacttgacc agatggaagg aagcccttga cttccaacct 780 ccttcttccg gttcaggtaa ctactctggt agatacatta ggtacggtat tagagaacac 840 gctatgggtg ccataatgaa cggtatttca gctttcggtg ccaactacaa accatacggt 900 ggtactttct tgaacttcgt ttcttatgct gctggtgccg ttagattgtc cgctttgtct 960 ggccacccag ttatttgggt tgctacacat gactctatcg gtgtcggtga agatggtcca 1020 acacatcaac ctattgaaac tttagcacac ttcagatccc taccaaacat tcaagtttgg 1080 agaccagctg atggtaacga agtttctgcc gcctacaaga actctttaga atccaagcat 1140 actccaagta tcattgcttt gtccagacaa aacttgccac aattggaagg tagctctatt 1200 gaaagcgctt ctaagggtgg ttacgtacta caagatgttg ctaacccaga tattatttta 1260 gtggctactg gttccgaagt gtctttgagt gttgaagctg ctaagacttt ggccgcaaag 1320 aacatcaagg ctcgtgttgt ttctctacca gatttcttca cttttgacaa acaaccccta 1380 gaatacagac tatcagtctt accagacaac gttccaatca tgtctgttga agttttggct 1440 accacatgtt ggggcaaata cgctcatcaa tccttcggta ttgacagatt tggtgcctcc 1500 ggtaaggcac cagaagtctt caagttcttc ggtttcaccc cagaaggtgt tgctgaaaga 1560 gctcaaaaga ccattgcatt ctataagggt gacaagctaa tttctccttt gaaaaaagct 1620 ttctaa 1626 <210> 111 <211> 1113 <212> DNA <213> Saccharomyces cerevisiae CEN.PK-1D <400> 111 atgagtgaat ctccaatgtt cgctgccaac ggcatgccaa aggtaaatca aggtgctgaa 60 gaagatgtca gaattttagg ttacgaccca ttagcttctc cagctctcct tcaagtgcaa 120 atcccagcca caccaacttc tttggaaact gccaagagag gtagaagaga agctatagat 180 attattaccg gtaaagacga cagagttctt gtcattgtcg gtccttgttc catccatgat 240 ctagaagccg ctcaagaata cgctttgaga ttaaagaaat tgtcagatga attaaaaggt 300 gatttatcca tcattatgag agcatacttg gagaagccaa gaacaaccgt cggctggaaa 360 ggtctaatta atgaccctga tgttaacaac actttcaaca tcaacaaggg tttgcaatcc 420 gctagacaat tgtttgtcaa cttgacaaat atcggtttgc caattggttc tgaaatgctt 480 gataccattt ctcctcaata cttggctgat ttggtctcct tcggtgccat tggtgccaga 540 accaccgaat ctcaactgca cagagaattg gcctccggtt tgtctttccc agttggtttc 600 aagaacggta ccgatggtac cttaaatgtt gctgtggatg cttgtcaagc cgctgctcat 660 tctcaccatt tcatgggtgt tactaagcat ggtgttgctg ctatcaccac tactaagggt 720 aacgaacact gcttcgttat tctaagaggt ggtaaaaagg gtaccaacta cgacgctaag 780 tccgttgcag aagctaaggc tcaattgcct gccggttcca acggtctaat gattgactac 840 tctcacggta actccaataa ggatttcaga aaccaaccaa aggtcaatga cgttgtttgt 900 gagcaaatcg ctaacggtga aaacgccatt accggtgtca tgattgaatc aaacatcaac 960 gaaggtaacc aaggcatccc agccgaaggt aaagccggct tgaaatatgg tgtttccatc 1020 actgatgctt gtataggttg ggaaactact gaagacgtct tgaggaaatt ggctgctgct 1080 gtcagacaaa gaagagaagt taacaagaaa tag 1113 <210> 112 <211> 1588 <212> PRT <213> Saccharomyces cerevisiae <400> 112 Met Val Gln Leu Ala Lys Val Pro Ile Leu Gly Asn Asp Ile Ile His 1 5 10 15 Val Gly Tyr Asn Ile His Asp His Leu Val Glu Thr Ile Ile Lys His 20 25 30 Cys Pro Ser Ser Thr Tyr Val Ile Cys Asn Asp Thr Asn Leu Ser Lys 35 40 45 Val Pro Tyr Tyr Gln Gln Leu Val Leu Glu Phe Lys Ala Ser Leu Pro 50 55 60 Glu Gly Ser Arg Leu Leu Thr Tyr Val Val Lys Pro Gly Glu Thr Ser 65 70 75 80 Lys Ser Arg Glu Thr Lys Ala Gln Leu Glu Asp Tyr Leu Leu Val Glu 85 90 95 Gly Cys Thr Arg Asp Thr Val Met Val Ala Ile Gly Gly Gly Val Ile 100 105 110 Gly Asp Met Ile Gly Phe Val Ala Ser Thr Phe Met Arg Gly Val Arg 115 120 125 Val Val Gln Val Pro Thr Ser Leu Leu Ala Met Val Asp Ser Ser Ile 130 135 140 Gly Gly Lys Thr Ala Ile Asp Thr Pro Leu Gly Lys Asn Phe Ile Gly 145 150 155 160 Ala Phe Trp Gln Pro Lys Phe Val Leu Val Asp Ile Lys Trp Leu Glu 165 170 175 Thr Leu Ala Lys Arg Glu Phe Ile Asn Gly Met Ala Glu Val Ile Lys 180 185 190 Thr Ala Cys Ile Trp Asn Ala Asp Glu Phe Thr Arg Leu Glu Ser Asn 195 200 205 Ala Ser Leu Phe Leu Asn Val Val Asn Gly Ala Lys Asn Val Lys Val 210 215 220 Thr Asn Gln Leu Thr Asn Glu Ile Asp Glu Ile Ser Asn Thr Asp Ile 225 230 235 240 Glu Ala Met Leu Asp His Thr Tyr Lys Leu Val Leu Glu Ser Ile Lys 245 250 255 Val Lys Ala Glu Val Val Ser Ser Asp Glu Arg Glu Ser Ser Leu Arg 260 265 270 Asn Leu Leu Asn Phe Gly His Ser Ile Gly His Ala Tyr Glu Ala Ile 275 280 285 Leu Thr Pro Gln Ala Leu His Gly Glu Cys Val Ser Ile Gly Met Val 290 295 300 Lys Glu Ala Glu Leu Ser Arg Tyr Phe Gly Ile Leu Ser Pro Thr Gln 305 310 315 320 Val Ala Arg Leu Ser Lys Ile Leu Val Ala Tyr Gly Leu Pro Val Ser 325 330 335 Pro Asp Glu Lys Trp Phe Lys Glu Leu Thr Leu His Lys Lys Thr Pro 340 345 350 Leu Asp Ile Leu Leu Lys Lys Met Ser Ile Asp Lys Lys Asn Glu Gly 355 360 365 Ser Lys Lys Lys Val Val Ile Leu Glu Ser Ile Gly Lys Cys Tyr Gly 370 375 380 Asp Ser Ala Gln Phe Val Ser Asp Glu Asp Leu Arg Phe Ile Leu Thr 385 390 395 400 Asp Glu Thr Leu Val Tyr Pro Phe Lys Asp Ile Pro Ala Asp Gln Gln 405 410 415 Lys Val Val Ile Pro Pro Gly Ser Lys Ser Ile Ser Asn Arg Ala Leu 420 425 430 Ile Leu Ala Ala Leu Gly Glu Gly Gln Cys Lys Ile Lys Asn Leu Leu 435 440 445 His Ser Asp Asp Thr Lys His Met Leu Thr Ala Val His Glu Leu Lys 450 455 460 Gly Ala Thr Ile Ser Trp Glu Asp Asn Gly Glu Thr Val Val Val Glu 465 470 475 480 Gly His Gly Gly Ser Thr Leu Ser Ala Cys Ala Asp Pro Leu Tyr Leu 485 490 495 Gly Asn Ala Gly Thr Ala Ser Arg Phe Leu Thr Ser Leu Ala Ala Leu 500 505 510 Val Asn Ser Thr Ser Ser Gln Lys Tyr Ile Val Leu Thr Gly Asn Ala 515 520 525 Arg Met Gln Gln Arg Pro Ile Ala Pro Leu Val Asp Ser Leu Arg Ala 530 535 540 Asn Gly Thr Lys Ile Glu Tyr Leu Asn Asn Glu Gly Ser Leu Pro Ile 545 550 555 560 Lys Val Tyr Thr Asp Ser Val Phe Lys Gly Gly Arg Ile Glu Leu Ala 565 570 575 Ala Thr Val Ser Ser Gln Tyr Val Ser Ser Ile Leu Met Cys Ala Pro 580 585 590 Tyr Ala Glu Glu Pro Val Thr Leu Ala Leu Val Gly Gly Lys Pro Ile 595 600 605 Ser Lys Leu Tyr Val Asp Met Thr Ile Lys Met Met Glu Lys Phe Gly 610 615 620 Ile Asn Val Glu Thr Ser Thr Thr Glu Pro Tyr Thr Tyr Tyr Ile Pro 625 630 635 640 Lys Gly His Tyr Ile Asn Pro Ser Glu Tyr Val Ile Glu Ser Asp Ala 645 650 655 Ser Ser Ala Thr Tyr Pro Leu Ala Phe Ala Ala Met Thr Gly Thr Thr 660 665 670 Val Thr Val Pro Asn Ile Gly Phe Glu Ser Leu Gln Gly Asp Ala Arg 675 680 685 Phe Ala Arg Asp Val Leu Lys Pro Met Gly Cys Lys Ile Thr Gln Thr 690 695 700 Ala Thr Ser Thr Thr Val Ser Gly Pro Pro Val Gly Thr Leu Lys Pro 705 710 715 720 Leu Lys His Val Asp Met Glu Pro Met Thr Asp Ala Phe Leu Thr Ala 725 730 735 Cys Val Val Ala Ala Ile Ser His Asp Ser Asp Pro Asn Ser Ala Asn 740 745 750 Thr Thr Thr Ile Glu Gly Ile Ala Asn Gln Arg Val Lys Glu Cys Asn 755 760 765 Arg Ile Leu Ala Met Ala Thr Glu Leu Ala Lys Phe Gly Val Lys Thr 770 775 780 Thr Glu Leu Pro Asp Gly Ile Gln Val His Gly Leu Asn Ser Ile Lys 785 790 795 800 Asp Leu Lys Val Pro Ser Asp Ser Ser Gly Pro Val Gly Val Cys Thr 805 810 815 Tyr Asp Asp His Arg Val Ala Met Ser Phe Ser Leu Leu Ala Gly Met 820 825 830 Val Asn Ser Gln Asn Glu Arg Asp Glu Val Ala Asn Pro Val Arg Ile 835 840 845 Leu Glu Arg His Cys Thr Gly Lys Thr Trp Pro Gly Trp Trp Asp Val 850 855 860 Leu His Ser Glu Leu Gly Ala Lys Leu Asp Gly Ala Glu Pro Leu Glu 865 870 875 880 Cys Thr Ser Lys Lys Asn Ser Lys Lys Ser Val Val Ile Ile Gly Met 885 890 895 Arg Ala Ala Gly Lys Thr Thr Ile Ser Lys Trp Cys Ala Ser Ala Leu 900 905 910 Gly Tyr Lys Leu Val Asp Leu Asp Glu Leu Phe Glu Gln Gln His Asn 915 920 925 Asn Gln Ser Val Lys Gln Phe Val Val Glu Asn Gly Trp Glu Lys Phe 930 935 940 Arg Glu Glu Glu Thr Arg Ile Phe Lys Glu Val Ile Gln Asn Tyr Gly 945 950 955 960 Asp Asp Gly Tyr Val Phe Ser Thr Gly Gly Gly Ile Val Glu Ser Ala 965 970 975 Glu Ser Arg Lys Ala Leu Lys Asp Phe Ala Ser Ser Gly Gly Tyr Val 980 985 990 Leu His Leu His Arg Asp Ile Glu Glu Thr Ile Val Phe Leu Gln Ser 995 1000 1005 Asp Pro Ser Arg Pro Ala Tyr Val Glu Glu Ile Arg Glu Val Trp Asn 1010 1015 1020 Arg Arg Glu Gly Trp Tyr Lys Glu Cys Ser Asn Phe Ser Phe Phe Ala 1025 1030 1035 1040 Pro His Cys Ser Ala Glu Ala Glu Phe Gln Ala Leu Arg Arg Ser Phe 1045 1050 1055 Ser Lys Tyr Ile Ala Thr Ile Thr Gly Val Arg Glu Ile Glu Ile Pro 1060 1065 1070 Ser Gly Arg Ser Ala Phe Val Cys Leu Thr Phe Asp Asp Leu Thr Glu 1075 1080 1085 Gln Thr Glu Asn Leu Thr Pro Ile Cys Tyr Gly Cys Glu Ala Val Glu 1090 1095 1100 Val Arg Val Asp His Leu Ala Asn Tyr Ser Ala Asp Phe Val Ser Lys 1105 1110 1115 1120 Gln Leu Ser Ile Leu Arg Lys Ala Thr Asp Ser Ile Pro Ile Ile Phe 1125 1130 1135 Thr Val Arg Thr Met Lys Gln Gly Gly Asn Phe Pro Asp Glu Glu Phe 1140 1145 1150 Lys Thr Leu Arg Glu Leu Tyr Asp Ile Ala Leu Lys Asn Gly Val Glu 1155 1160 1165 Phe Leu Asp Leu Glu Leu Thr Leu Pro Thr Asp Ile Gln Tyr Glu Val 1170 1175 1180 Ile Asn Lys Arg Gly Asn Thr Lys Ile Ile Gly Ser His His Asp Phe 1185 1190 1195 1200 Gln Gly Leu Tyr Ser Trp Asp Asp Ala Glu Trp Glu Asn Arg Phe Asn 1205 1210 1215 Gln Ala Leu Thr Leu Asp Val Asp Val Val Lys Phe Val Gly Thr Ala 1220 1225 1230 Val Asn Phe Glu Asp Asn Leu Arg Leu Glu His Phe Arg Asp Thr His 1235 1240 1245 Lys Asn Lys Pro Leu Ile Ala Val Asn Met Thr Ser Lys Gly Ser Ile 1250 1255 1260 Ser Arg Val Leu Asn Asn Val Leu Thr Pro Val Thr Ser Asp Leu Leu 1265 1270 1275 1280 Pro Asn Ser Ala Ala Pro Gly Gln Leu Thr Val Ala Gln Ile Asn Lys 1285 1290 1295 Met Tyr Thr Ser Met Gly Gly Ile Glu Pro Lys Glu Leu Phe Val Val 1300 1305 1310 Gly Lys Pro Ile Gly His Ser Arg Ser Pro Ile Leu His Asn Thr Gly 1315 1320 1325 Tyr Glu Ile Leu Gly Leu Pro His Lys Phe Asp Lys Phe Glu Thr Glu 1330 1335 1340 Ser Ala Gln Leu Val Lys Glu Lys Leu Leu Asp Gly Asn Lys Asn Phe 1345 1350 1355 1360 Gly Gly Ala Ala Val Thr Ile Pro Leu Lys Leu Asp Ile Met Gln Tyr 1365 1370 1375 Met Asp Glu Leu Thr Asp Ala Ala Lys Val Ile Gly Ala Val Asn Thr 1380 1385 1390 Val Ile Pro Leu Gly Asn Lys Lys Phe Lys Gly Asp Asn Thr Asp Trp 1395 1400 1405 Leu Gly Ile Arg Asn Ala Leu Ile Asn Asn Gly Val Pro Glu Tyr Val 1410 1415 1420 Gly His Thr Ala Gly Leu Val Ile Gly Ala Gly Gly Thr Ser Arg Ala 1425 1430 1435 1440 Ala Leu Tyr Ala Leu His Ser Leu Gly Cys Lys Lys Ile Phe Ile Ile 1445 1450 1455 Asn Arg Thr Thr Ser Lys Leu Lys Pro Leu Ile Glu Ser Leu Pro Ser 1460 1465 1470 Glu Phe Asn Ile Ile Gly Ile Glu Ser Thr Lys Ser Ile Glu Glu Ile 1475 1480 1485 Lys Glu His Val Gly Val Ala Val Ser Cys Val Pro Ala Asp Lys Pro 1490 1495 1500 Leu Asp Asp Glu Leu Leu Ser Lys Leu Glu Arg Phe Leu Val Lys Gly 1505 1510 1515 1520 Ala His Ala Ala Phe Val Pro Thr Leu Leu Glu Ala Ala Tyr Lys Pro 1525 1530 1535 Ser Val Thr Pro Val Met Thr Ile Ser Gln Asp Lys Tyr Gln Trp His 1540 1545 1550 Val Val Pro Gly Ser Gln Met Leu Val His Gln Gly Val Ala Gln Phe 1555 1560 1565 Glu Lys Trp Thr Gly Phe Lys Gly Pro Phe Lys Ala Ile Phe Asp Ala 1570 1575 1580 Val Thr Lys Glu 1585 <210> 113 <211> 820 <212> PRT <213> Anabaena variabilis ATCC29413 <400> 113 Met Ser Ile Val Gln Ala Lys Phe Glu Ala Lys Glu Thr Ser Phe His 1 5 10 15 Val Glu Gly Tyr Glu Lys Ile Glu Tyr Asp Leu Val Tyr Val Asp Gly 20 25 30 Ile Phe Glu Ile Gln Asn Ser Ala Leu Ala Asp Val Tyr Gln Gly Phe 35 40 45 Gly Arg Cys Leu Ala Ile Val Asp Ala Asn Val Ser Arg Leu Tyr Gly 50 55 60 Asn Gln Ile Gln Ala Tyr Phe Gln Tyr Tyr Gly Ile Glu Leu Arg Leu 65 70 75 80 Phe Pro Ile Thr Ile Thr Glu Pro Asp Lys Thr Ile Gln Thr Phe Glu 85 90 95 Arg Val Ile Asp Val Phe Ala Asp Phe Lys Leu Val Arg Lys Glu Pro 100 105 110 Val Leu Val Val Gly Gly Gly Leu Ile Thr Asp Val Val Gly Phe Ala 115 120 125 Cys Ser Thr Tyr Arg Arg Ser Ser Asn Tyr Ile Arg Ile Pro Thr Thr 130 135 140 Leu Ile Gly Leu Ile Asp Ala Ser Val Ala Ile Lys Val Ala Val Asn 145 150 155 160 His Arg Lys Leu Lys Asn Arg Leu Gly Ala Tyr His Ala Ser Arg Lys 165 170 175 Val Phe Leu Asp Phe Ser Leu Leu Arg Thr Leu Pro Thr Asp Gln Val 180 185 190 Arg Asn Gly Met Ala Glu Leu Val Lys Ile Ala Val Val Ala His Gln 195 200 205 Glu Val Phe Glu Leu Leu Glu Lys Tyr Gly Glu Glu Leu Leu Arg Thr 210 215 220 His Phe Gly Asn Ile Asp Ala Thr Pro Glu Ile Lys Glu Ile Ala His 225 230 235 240 Arg Leu Thr Tyr Lys Ala Ile His Lys Met Leu Glu Leu Glu Val Pro 245 250 255 Asn Leu His Glu Leu Asp Leu Asp Arg Val Ile Ala Tyr Gly His Thr 260 265 270 Trp Ser Pro Thr Leu Glu Leu Ala Pro Arg Leu Pro Met Phe His Gly 275 280 285 His Ala Val Asn Val Asp Met Ala Phe Ser Ala Thr Ile Ala Ala Arg 290 295 300 Arg Gly Tyr Ile Thr Ile Ala Glu Arg Asp Arg Ile Leu Gly Leu Met 305 310 315 320 Ser Arg Val Gly Leu Ser Leu Asp His Pro Met Leu Asp Ile Asp Ile 325 330 335 Leu Trp Arg Gly Thr Glu Ser Ile Thr Leu Thr Arg Asp Gly Leu Leu 340 345 350 Arg Ala Ala Met Pro Lys Pro Ile Gly Asp Cys Val Phe Val Asn Asp 355 360 365 Leu Thr Arg Glu Glu Leu Ala Ala Ala Leu Ala Asp His Lys Glu Leu 370 375 380 Cys Thr Ser Tyr Pro Arg Gly Gly Glu Gly Val Asp Val Tyr Pro Val 385 390 395 400 Tyr Gln Lys Glu Leu Ile Gly Ser Val Lys Met Ser Ile Val Gln Ala 405 410 415 Lys Phe Glu Ala Lys Glu Thr Ser Phe His Val Glu Gly Tyr Glu Lys 420 425 430 Ile Glu Tyr Asp Leu Val Tyr Val Asp Gly Ile Phe Glu Ile Gln Asn 435 440 445 Ser Ala Leu Ala Asp Val Tyr Gln Gly Phe Gly Arg Cys Leu Ala Ile 450 455 460 Val Asp Ala Asn Val Ser Arg Leu Tyr Gly Asn Gln Ile Gln Ala Tyr 465 470 475 480 Phe Gln Tyr Tyr Gly Ile Glu Leu Arg Leu Phe Pro Ile Thr Ile Thr 485 490 495 Glu Pro Asp Lys Thr Ile Gln Thr Phe Glu Arg Val Ile Asp Val Phe 500 505 510 Ala Asp Phe Lys Leu Val Arg Lys Glu Pro Val Leu Val Val Gly Gly 515 520 525 Gly Leu Ile Thr Asp Val Val Gly Phe Ala Cys Ser Thr Tyr Arg Arg 530 535 540 Ser Ser Asn Tyr Ile Arg Ile Pro Thr Thr Leu Ile Gly Leu Ile Asp 545 550 555 560 Ala Ser Val Ala Ile Lys Val Ala Val Asn His Arg Lys Leu Lys Asn 565 570 575 Arg Leu Gly Ala Tyr His Ala Ser Arg Lys Val Phe Leu Asp Phe Ser 580 585 590 Leu Leu Arg Thr Leu Pro Thr Asp Gln Val Arg Asn Gly Met Ala Glu 595 600 605 Leu Val Lys Ile Ala Val Val Ala His Gln Glu Val Phe Glu Leu Leu 610 615 620 Glu Lys Tyr Gly Glu Glu Leu Leu Arg Thr His Phe Gly Asn Ile Asp 625 630 635 640 Ala Thr Pro Glu Ile Lys Glu Ile Ala His Arg Leu Thr Tyr Lys Ala 645 650 655 Ile His Lys Met Leu Glu Leu Glu Val Pro Asn Leu His Glu Leu Asp 660 665 670 Leu Asp Arg Val Ile Ala Tyr Gly His Thr Trp Ser Pro Thr Leu Glu 675 680 685 Leu Ala Pro Arg Leu Pro Met Phe His Gly His Ala Val Asn Val Asp 690 695 700 Met Ala Phe Ser Ala Thr Ile Ala Ala Arg Arg Gly Tyr Ile Thr Ile 705 710 715 720 Ala Glu Arg Asp Arg Ile Leu Gly Leu Met Ser Arg Val Gly Leu Ser 725 730 735 Leu Asp His Pro Met Leu Asp Ile Asp Ile Leu Trp Arg Gly Thr Glu 740 745 750 Ser Ile Thr Leu Thr Arg Asp Gly Leu Leu Arg Ala Ala Met Pro Lys 755 760 765 Pro Ile Gly Asp Cys Val Phe Val Asn Asp Leu Thr Arg Glu Glu Leu 770 775 780 Ala Ala Ala Leu Ala Asp His Lys Glu Leu Cys Thr Ser Tyr Pro Arg 785 790 795 800 Gly Gly Glu Gly Val Asp Val Tyr Pro Val Tyr Gln Lys Glu Leu Ile 805 810 815 Gly Ser Val Lys 820 <210> 114 <211> 1099 <212> PRT <213> Anabaena variabilis ATCC29413 <400> 114 Met Ser Ile Val Gln Ala Lys Phe Glu Ala Lys Glu Thr Ser Phe His 1 5 10 15 Val Glu Gly Tyr Glu Lys Ile Glu Tyr Asp Leu Val Tyr Val Asp Gly 20 25 30 Ile Phe Glu Ile Gln Asn Ser Ala Leu Ala Asp Val Tyr Gln Gly Phe 35 40 45 Gly Arg Cys Leu Ala Ile Val Asp Ala Asn Val Ser Arg Leu Tyr Gly 50 55 60 Asn Gln Ile Gln Ala Tyr Phe Gln Tyr Tyr Gly Ile Glu Leu Arg Leu 65 70 75 80 Phe Pro Ile Thr Ile Thr Glu Pro Asp Lys Thr Ile Gln Thr Phe Glu 85 90 95 Arg Val Ile Asp Val Phe Ala Asp Phe Lys Leu Val Arg Lys Glu Pro 100 105 110 Val Leu Val Val Gly Gly Gly Leu Ile Thr Asp Val Val Gly Phe Ala 115 120 125 Cys Ser Thr Tyr Arg Arg Ser Ser Asn Tyr Ile Arg Ile Pro Thr Thr 130 135 140 Leu Ile Gly Leu Ile Asp Ala Ser Val Ala Ile Lys Val Ala Val Asn 145 150 155 160 His Arg Lys Leu Lys Asn Arg Leu Gly Ala Tyr His Ala Ser Arg Lys 165 170 175 Val Phe Leu Asp Phe Ser Leu Leu Arg Thr Leu Pro Thr Asp Gln Val 180 185 190 Arg Asn Gly Met Ala Glu Leu Val Lys Ile Ala Val Val Ala His Gln 195 200 205 Glu Val Phe Glu Leu Leu Glu Lys Tyr Gly Glu Glu Leu Leu Arg Thr 210 215 220 His Phe Gly Asn Ile Asp Ala Thr Pro Glu Ile Lys Glu Ile Ala His 225 230 235 240 Arg Leu Thr Tyr Lys Ala Ile His Lys Met Leu Glu Leu Glu Val Pro 245 250 255 Asn Leu His Glu Leu Asp Leu Asp Arg Val Ile Ala Tyr Gly His Thr 260 265 270 Trp Ser Pro Thr Leu Glu Leu Ala Pro Arg Leu Pro Met Phe His Gly 275 280 285 His Ala Val Asn Val Asp Met Ala Phe Ser Ala Thr Ile Ala Ala Arg 290 295 300 Arg Gly Tyr Ile Thr Ile Ala Glu Arg Asp Arg Ile Leu Gly Leu Met 305 310 315 320 Ser Arg Val Gly Leu Ser Leu Asp His Pro Met Leu Asp Ile Asp Ile 325 330 335 Leu Trp Arg Gly Thr Glu Ser Ile Thr Leu Thr Arg Asp Gly Leu Leu 340 345 350 Arg Ala Ala Met Pro Lys Pro Ile Gly Asp Cys Val Phe Val Asn Asp 355 360 365 Leu Thr Arg Glu Glu Leu Ala Ala Ala Leu Ala Asp His Lys Glu Leu 370 375 380 Cys Thr Ser Tyr Pro Arg Gly Gly Glu Gly Val Asp Val Tyr Pro Val 385 390 395 400 Tyr Gln Lys Glu Leu Ile Gly Ser Val Lys Met Ser Ile Val Gln Ala 405 410 415 Lys Phe Glu Ala Lys Glu Thr Ser Phe His Val Glu Gly Tyr Glu Lys 420 425 430 Ile Glu Tyr Asp Leu Val Tyr Val Asp Gly Ile Phe Glu Ile Gln Asn 435 440 445 Ser Ala Leu Ala Asp Val Tyr Gln Gly Phe Gly Arg Cys Leu Ala Ile 450 455 460 Val Asp Ala Asn Val Ser Arg Leu Tyr Gly Asn Gln Ile Gln Ala Tyr 465 470 475 480 Phe Gln Tyr Tyr Gly Ile Glu Leu Arg Leu Phe Pro Ile Thr Ile Thr 485 490 495 Glu Pro Asp Lys Thr Ile Gln Thr Phe Glu Arg Val Ile Asp Val Phe 500 505 510 Ala Asp Phe Lys Leu Val Arg Lys Glu Pro Val Leu Val Val Gly Gly 515 520 525 Gly Leu Ile Thr Asp Val Val Gly Phe Ala Cys Ser Thr Tyr Arg Arg 530 535 540 Ser Ser Asn Tyr Ile Arg Ile Pro Thr Thr Leu Ile Gly Leu Ile Asp 545 550 555 560 Ala Ser Val Ala Ile Lys Val Ala Val Asn His Arg Lys Leu Lys Asn 565 570 575 Arg Leu Gly Ala Tyr His Ala Ser Arg Lys Val Phe Leu Asp Phe Ser 580 585 590 Leu Leu Arg Thr Leu Pro Thr Asp Gln Val Arg Asn Gly Met Ala Glu 595 600 605 Leu Val Lys Ile Ala Val Val Ala His Gln Glu Val Phe Glu Leu Leu 610 615 620 Glu Lys Tyr Gly Glu Glu Leu Leu Arg Thr His Phe Gly Asn Ile Asp 625 630 635 640 Ala Thr Pro Glu Ile Lys Glu Ile Ala His Arg Leu Thr Tyr Lys Ala 645 650 655 Ile His Lys Met Leu Glu Leu Glu Val Pro Asn Leu His Glu Leu Asp 660 665 670 Leu Asp Arg Val Ile Ala Tyr Gly His Thr Trp Ser Pro Thr Leu Glu 675 680 685 Leu Ala Pro Arg Leu Pro Met Phe His Gly His Ala Val Asn Val Asp 690 695 700 Met Ala Phe Ser Ala Thr Ile Ala Ala Arg Arg Gly Tyr Ile Thr Ile 705 710 715 720 Ala Glu Arg Asp Arg Ile Leu Gly Leu Met Ser Arg Val Gly Leu Ser 725 730 735 Leu Asp His Pro Met Leu Asp Ile Asp Ile Leu Trp Arg Gly Thr Glu 740 745 750 Ser Ile Thr Leu Thr Arg Asp Gly Leu Leu Arg Ala Ala Met Pro Lys 755 760 765 Pro Ile Gly Asp Cys Val Phe Val Asn Asp Leu Thr Arg Glu Glu Leu 770 775 780 Ala Ala Ala Leu Ala Asp His Lys Glu Leu Cys Thr Ser Tyr Pro Arg 785 790 795 800 Gly Gly Glu Gly Val Asp Val Tyr Pro Val Tyr Gln Lys Glu Leu Ile 805 810 815 Gly Ser Val Lys Met Thr Asn Val Ile Val Gln Pro Thr Ala Arg Pro 820 825 830 Val Thr Pro Leu Gly Ile Leu Thr Lys Gln Leu Glu Ala Ile Val Gln 835 840 845 Glu Val Lys Gln His Pro Asp Leu Pro Gly Glu Leu Ile Ala Asn Ile 850 855 860 His Gln Ala Trp Arg Leu Ala Ala Gly Ile Asp Pro Tyr Leu Glu Glu 865 870 875 880 Cys Thr Thr Pro Glu Ser Pro Glu Leu Ala Ala Leu Ala Lys Thr Thr 885 890 895 Ala Thr Glu Ala Trp Gly Glu His Phe His Gly Gly Thr Thr Val Arg 900 905 910 Pro Leu Glu Gln Glu Met Leu Ser Gly His Ile Glu Gly Gln Thr Leu 915 920 925 Lys Met Phe Val His Met Thr Lys Ala Lys Lys Val Leu Glu Ile Gly 930 935 940 Met Phe Thr Gly Tyr Ser Ala Leu Ala Met Ala Glu Ala Leu Pro Glu 945 950 955 960 Asp Gly Leu Leu Val Ala Cys Glu Val Asp Pro Tyr Ala Ala Glu Ile 965 970 975 Gly Gln Lys Ala Phe Gln Gln Ser Pro His Gly Gly Lys Ile Arg Val 980 985 990 Glu Leu Asp Ala Ala Leu Ala Thr Leu Asp Lys Leu Ala Glu Ala Gly 995 1000 1005 Glu Ser Phe Asp Leu Val Phe Ile Asp Ala Asp Lys Lys Glu Tyr Val 1010 1015 1020 Ala Tyr Phe His Lys Leu Leu Gly Ser Ser Leu Leu Ala Pro Asp Gly 1025 1030 1035 1040 Phe Ile Cys Val Asp Asn Thr Leu Leu Gln Gly Glu Val Tyr Leu Pro 1045 1050 1055 Ala Glu Glu Arg Ser Val Asn Gly Glu Ala Ile Ala Gln Phe Asn His 1060 1065 1070 Thr Val Ala Ile Asp Pro Arg Val Glu Gln Val Leu Leu Pro Leu Arg 1075 1080 1085 Asp Gly Leu Thr Ile Ile Arg Arg Ile Gln Pro 1090 1095 <210> 115 <211> 410 <212> PRT <213> Anabaena variabilis ATCC29413 <400> 115 Met Ser Ile Val Gln Ala Lys Phe Glu Ala Lys Glu Thr Ser Phe His 1 5 10 15 Val Glu Gly Tyr Glu Lys Ile Glu Tyr Asp Leu Val Tyr Val Asp Gly 20 25 30 Ile Phe Glu Ile Gln Asn Ser Ala Leu Ala Asp Val Tyr Gln Gly Phe 35 40 45 Gly Arg Cys Leu Ala Ile Val Asp Ala Asn Val Ser Arg Leu Tyr Gly 50 55 60 Asn Gln Ile Gln Ala Tyr Phe Gln Tyr Tyr Gly Ile Glu Leu Arg Leu 65 70 75 80 Phe Pro Ile Thr Ile Thr Glu Pro Asp Lys Thr Ile Gln Thr Phe Glu 85 90 95 Arg Val Ile Asp Val Phe Ala Asp Phe Lys Leu Val Arg Lys Glu Pro 100 105 110 Val Leu Val Val Gly Gly Gly Leu Ile Thr Asp Val Val Gly Phe Ala 115 120 125 Cys Ser Thr Tyr Arg Arg Ser Ser Asn Tyr Ile Arg Ile Pro Thr Thr 130 135 140 Leu Ile Gly Leu Ile Asp Ala Ser Val Ala Ile Lys Val Ala Val Asn 145 150 155 160 His Arg Lys Leu Lys Asn Arg Leu Gly Ala Tyr His Ala Ser Arg Lys 165 170 175 Val Phe Leu Asp Phe Ser Leu Leu Arg Thr Leu Pro Thr Asp Gln Val 180 185 190 Arg Asn Gly Met Ala Glu Leu Val Lys Ile Ala Val Val Ala His Gln 195 200 205 Glu Val Phe Glu Leu Leu Glu Lys Tyr Gly Glu Glu Leu Leu Arg Thr 210 215 220 His Phe Gly Asn Ile Asp Ala Thr Pro Glu Ile Lys Glu Ile Ala His 225 230 235 240 Arg Leu Thr Tyr Lys Ala Ile His Lys Met Leu Glu Leu Glu Val Pro 245 250 255 Asn Leu His Glu Leu Asp Leu Asp Arg Val Ile Ala Tyr Gly His Thr 260 265 270 Trp Ser Pro Thr Leu Glu Leu Ala Pro Arg Leu Pro Met Phe His Gly 275 280 285 His Ala Val Asn Val Asp Met Ala Phe Ser Ala Thr Ile Ala Ala Arg 290 295 300 Arg Gly Tyr Ile Thr Ile Ala Glu Arg Asp Arg Ile Leu Gly Leu Met 305 310 315 320 Ser Arg Val Gly Leu Ser Leu Asp His Pro Met Leu Asp Ile Asp Ile 325 330 335 Leu Trp Arg Gly Thr Glu Ser Ile Thr Leu Thr Arg Asp Gly Leu Leu 340 345 350 Arg Ala Ala Met Pro Lys Pro Ile Gly Asp Cys Val Phe Val Asn Asp 355 360 365 Leu Thr Arg Glu Glu Leu Ala Ala Ala Leu Ala Asp His Lys Glu Leu 370 375 380 Cys Thr Ser Tyr Pro Arg Gly Gly Glu Gly Val Asp Val Tyr Pro Val 385 390 395 400 Tyr Gln Lys Glu Leu Ile Gly Ser Val Lys 405 410 <210> 116 <211> 410 <212> PRT <213> Anabaena variabilis ATCC29413 <400> 116 Met Ser Ile Val Gln Ala Lys Phe Glu Ala Lys Glu Thr Ser Phe His 1 5 10 15 Val Glu Gly Tyr Glu Lys Ile Glu Tyr Asp Leu Val Tyr Val Asp Gly 20 25 30 Ile Phe Glu Ile Gln Asn Ser Ala Leu Ala Asp Val Tyr Gln Gly Phe 35 40 45 Gly Arg Cys Leu Ala Ile Val Asp Ala Asn Val Ser Arg Leu Tyr Gly 50 55 60 Asn Gln Ile Gln Ala Tyr Phe Gln Tyr Tyr Gly Ile Glu Leu Arg Leu 65 70 75 80 Phe Pro Ile Thr Ile Thr Glu Pro Asp Lys Thr Ile Gln Thr Phe Glu 85 90 95 Arg Val Ile Asp Val Phe Ala Asp Phe Lys Leu Val Arg Lys Glu Pro 100 105 110 Val Leu Val Val Gly Gly Gly Leu Ile Thr Asp Val Val Gly Phe Ala 115 120 125 Cys Ser Thr Tyr Arg Arg Ser Ser Asn Tyr Ile Arg Ile Pro Thr Thr 130 135 140 Leu Ile Gly Leu Ile Asp Ala Ser Val Ala Ile Lys Val Ala Val Asn 145 150 155 160 His Arg Lys Leu Lys Asn Arg Leu Gly Ala Tyr His Ala Ser Arg Lys 165 170 175 Val Phe Leu Asp Phe Ser Leu Leu Arg Thr Leu Pro Thr Asp Gln Val 180 185 190 Arg Asn Gly Met Ala Glu Leu Val Lys Ile Ala Val Val Ala His Gln 195 200 205 Glu Val Phe Glu Leu Leu Glu Lys Tyr Gly Glu Glu Leu Leu Arg Thr 210 215 220 His Phe Gly Asn Ile Asp Ala Thr Pro Glu Ile Lys Glu Ile Ala His 225 230 235 240 Arg Leu Thr Tyr Lys Ala Ile His Lys Met Leu Glu Leu Glu Val Pro 245 250 255 Asn Leu His Glu Leu Asp Leu Asp Arg Val Ile Ala Tyr Gly His Thr 260 265 270 Trp Ser Pro Thr Leu Glu Leu Ala Pro Arg Leu Pro Met Phe His Gly 275 280 285 His Ala Val Asn Val Asp Met Ala Phe Ser Ala Thr Ile Ala Ala Arg 290 295 300 Arg Gly Tyr Ile Thr Ile Ala Glu Arg Asp Arg Ile Leu Gly Leu Met 305 310 315 320 Ser Arg Val Gly Leu Ser Leu Asp His Pro Met Leu Asp Ile Asp Ile 325 330 335 Leu Trp Arg Gly Thr Glu Ser Ile Thr Leu Thr Arg Asp Gly Leu Leu 340 345 350 Arg Ala Ala Met Pro Lys Pro Ile Gly Asp Cys Val Phe Val Asn Asp 355 360 365 Leu Thr Arg Glu Glu Leu Ala Ala Ala Leu Ala Asp His Lys Glu Leu 370 375 380 Cys Thr Ser Tyr Pro Arg Gly Gly Glu Gly Val Asp Val Tyr Pro Val 385 390 395 400 Tyr Gln Lys Glu Leu Ile Gly Ser Val Lys 405 410 <210> 117 <211> 279 <212> PRT <213> Anabaena variabilis ATCC29413 <400> 117 Met Thr Asn Val Ile Val Gln Pro Thr Ala Arg Pro Val Thr Pro Leu 1 5 10 15 Gly Ile Leu Thr Lys Gln Leu Glu Ala Ile Val Gln Glu Val Lys Gln 20 25 30 His Pro Asp Leu Pro Gly Glu Leu Ile Ala Asn Ile His Gln Ala Trp 35 40 45 Arg Leu Ala Ala Gly Ile Asp Pro Tyr Leu Glu Glu Cys Thr Thr Pro 50 55 60 Glu Ser Pro Glu Leu Ala Ala Leu Ala Lys Thr Thr Ala Thr Glu Ala 65 70 75 80 Trp Gly Glu His Phe His Gly Gly Thr Thr Val Arg Pro Leu Glu Gln 85 90 95 Glu Met Leu Ser Gly His Ile Glu Gly Gln Thr Leu Lys Met Phe Val 100 105 110 His Met Thr Lys Ala Lys Lys Val Leu Glu Ile Gly Met Phe Thr Gly 115 120 125 Tyr Ser Ala Leu Ala Met Ala Glu Ala Leu Pro Glu Asp Gly Leu Leu 130 135 140 Val Ala Cys Glu Val Asp Pro Tyr Ala Ala Glu Ile Gly Gln Lys Ala 145 150 155 160 Phe Gln Gln Ser Pro His Gly Gly Lys Ile Arg Val Glu Leu Asp Ala 165 170 175 Ala Leu Ala Thr Leu Asp Lys Leu Ala Glu Ala Gly Glu Ser Phe Asp 180 185 190 Leu Val Phe Ile Asp Ala Asp Lys Lys Glu Tyr Val Ala Tyr Phe His 195 200 205 Lys Leu Leu Gly Ser Ser Leu Leu Ala Pro Asp Gly Phe Ile Cys Val 210 215 220 Asp Asn Thr Leu Leu Gln Gly Glu Val Tyr Leu Pro Ala Glu Glu Arg 225 230 235 240 Ser Val Asn Gly Glu Ala Ile Ala Gln Phe Asn His Thr Val Ala Ile 245 250 255 Asp Pro Arg Val Glu Gln Val Leu Leu Pro Leu Arg Asp Gly Leu Thr 260 265 270 Ile Ile Arg Arg Ile Gln Pro 275 <210> 118 <211> 888 <212> PRT <213> Anabaena variabilis ATCC29413 <400> 118 Met Gln Thr Ile Asp Phe Asn Ile Arg Lys Leu Leu Val Glu Trp Asn 1 5 10 15 Ala Thr His Arg Asp Tyr Asp Leu Ser Gln Ser Leu His Glu Leu Ile 20 25 30 Val Ala Gln Val Glu Arg Thr Pro Glu Ala Ile Ala Val Thr Phe Asp 35 40 45 Lys Gln Gln Leu Thr Tyr Gln Glu Leu Asn His Lys Ala Asn Gln Leu 50 55 60 Gly His Tyr Leu Gln Thr Leu Gly Val Gln Pro Glu Thr Leu Val Gly 65 70 75 80 Val Cys Leu Glu Arg Ser Leu Glu Met Val Ile Cys Leu Leu Gly Ile 85 90 95 Leu Lys Ala Gly Gly Ala Tyr Val Pro Ile Asp Pro Glu Tyr Pro Gln 100 105 110 Glu Arg Ile Ala Tyr Met Leu Glu Asp Ser Gln Val Lys Val Leu Leu 115 120 125 Thr Gln Glu Lys Leu Leu Asn Gln Ile Pro His His Gln Ala Gln Thr 130 135 140 Ile Cys Val Asp Arg Glu Trp Glu Lys Ile Ser Thr Gln Ala Asn Thr 145 150 155 160 Asn Pro Lys Ser Asn Ile Lys Thr Asp Asn Leu Ala Tyr Val Ile Tyr 165 170 175 Thr Ser Gly Ser Thr Gly Lys Pro Lys Gly Ala Met Asn Thr His Lys 180 185 190 Gly Ile Cys Asn Arg Leu Leu Trp Met Gln Glu Ala Tyr Gln Ile Asp 195 200 205 Ser Thr Asp Ser Ile Leu Gln Lys Thr Pro Phe Ser Phe Asp Val Ser 210 215 220 Val Trp Glu Phe Phe Trp Thr Leu Leu Thr Gly Ala Arg Leu Val Ile 225 230 235 240 Ala Lys Pro Gly Gly His Lys Asp Ser Ala Tyr Leu Ile Asp Leu Ile 245 250 255 Thr Gln Glu Gln Ile Thr Thr Leu His Phe Val Pro Ser Met Leu Gln 260 265 270 Val Phe Leu Gln Asn Arg His Val Ser Lys Cys Ser Ser Leu Lys Arg 275 280 285 Val Ile Cys Ser Gly Glu Ala Leu Ser Ile Asp Leu Gln Asn Arg Phe 290 295 300 Phe Gln His Leu Gln Cys Glu Leu His Asn Leu Tyr Gly Pro Thr Glu 305 310 315 320 Ala Ala Ile Asp Val Thr Phe Trp Gln Cys Arg Lys Asp Ser Asn Leu 325 330 335 Lys Ser Val Pro Ile Gly Arg Pro Ile Ala Asn Thr Gln Ile Tyr Ile 340 345 350 Leu Asp Ala Asp Leu Gln Pro Val Asn Ile Gly Val Thr Gly Glu Ile 355 360 365 Tyr Ile Gly Gly Val Gly Val Ala Arg Gly Tyr Leu Asn Lys Glu Glu 370 375 380 Leu Thr Lys Glu Lys Phe Ile Ile Asn Pro Phe Pro Asn Ser Glu Phe 385 390 395 400 Lys Arg Leu Tyr Lys Thr Gly Asp Leu Ala Arg Tyr Leu Pro Asp Gly 405 410 415 Asn Ile Glu Tyr Leu Gly Arg Thr Asp Tyr Gln Val Lys Ile Arg Gly 420 425 430 Tyr Arg Ile Glu Ile Gly Glu Ile Glu Asn Val Leu Ser Ser His Pro 435 440 445 Gln Val Arg Glu Ala Val Val Ile Ala Arg Asp Asp Asn Ala Gln Glu 450 455 460 Lys Gln Ile Ile Ala Tyr Ile Thr Tyr Asn Ser Ile Lys Pro Gln Leu 465 470 475 480 Asp Asn Leu Arg Asp Phe Leu Lys Ala Arg Leu Pro Asp Phe Met Ile 485 490 495 Pro Ala Ala Phe Val Met Leu Glu His Leu Pro Leu Thr Pro Ser Gly 500 505 510 Lys Val Asp Arg Lys Ala Leu Pro Lys Pro Asp Leu Phe Asn Tyr Ser 515 520 525 Glu His Asn Ser Tyr Val Ala Pro Arg Asn Glu Val Glu Glu Lys Leu 530 535 540 Val Gln Ile Trp Ser Asn Ile Leu His Leu Pro Lys Val Gly Val Thr 545 550 555 560 Glu Asn Phe Phe Ala Ile Gly Gly Asn Ser Leu Lys Ala Leu His Leu 565 570 575 Ile Ser Gln Ile Glu Glu Leu Phe Ala Lys Glu Ile Ser Leu Ala Thr 580 585 590 Leu Leu Thr Asn Pro Val Ile Ala Asp Leu Ala Lys Val Ile Gln Ala 595 600 605 Asn Asn Gln Ile His Asn Ser Pro Leu Val Pro Ile Gln Pro Gln Gly 610 615 620 Lys Gln Gln Pro Phe Phe Cys Ile His Pro Ala Gly Gly His Val Leu 625 630 635 640 Cys Tyr Phe Lys Leu Ala Gln Tyr Ile Gly Thr Asp Gln Pro Phe Tyr 645 650 655 Gly Leu Gln Ala Gln Gly Phe Tyr Gly Asp Glu Ala Pro Leu Thr Arg 660 665 670 Val Glu Asp Met Ala Ser Leu Tyr Val Lys Thr Ile Arg Glu Phe Gln 675 680 685 Pro Gln Gly Pro Tyr Arg Val Gly Gly Trp Ser Phe Gly Gly Val Val 690 695 700 Ala Tyr Glu Val Ala Gln Gln Leu His Arg Gln Gly Gln Glu Val Ser 705 710 715 720 Leu Leu Ala Ile Leu Asp Ser Tyr Val Pro Ile Leu Leu Asp Lys Gln 725 730 735 Lys Pro Ile Asp Asp Val Tyr Leu Val Gly Val Leu Ser Arg Val Phe 740 745 750 Gly Gly Met Phe Gly Gln Asp Asn Leu Val Thr Pro Glu Glu Ile Glu 755 760 765 Asn Leu Thr Val Glu Glu Lys Ile Asn Tyr Ile Ile Asp Lys Ala Arg 770 775 780 Ser Ala Arg Ile Phe Pro Pro Gly Val Glu Arg Gln Asn Asn Arg Arg 785 790 795 800 Ile Leu Asp Val Leu Val Gly Thr Leu Lys Ala Thr Tyr Ser Tyr Ile 805 810 815 Arg Gln Pro Tyr Pro Gly Lys Val Thr Val Phe Arg Ala Arg Glu Lys 820 825 830 His Ile Met Ala Pro Asp Pro Thr Leu Val Trp Val Glu Leu Phe Ser 835 840 845 Val Met Ala Ala Gln Glu Ile Lys Ile Ile Asp Val Pro Gly Asn His 850 855 860 Tyr Ser Phe Val Leu Glu Pro His Val Gln Val Leu Ala Gln Arg Leu 865 870 875 880 Gln Asp Cys Leu Glu Asn Asn Ser 885 <210> 119 <211> 410 <212> PRT <213> Nostoc punctiforme ATCC 29133 <400> 119 Met Ser Asn Val Gln Ala Ser Phe Glu Ala Thr Glu Ala Glu Phe Arg 1 5 10 15 Val Glu Gly Tyr Glu Lys Ile Glu Phe Ser Leu Val Tyr Val Asn Gly 20 25 30 Ala Phe Asp Ile Ser Asn Arg Glu Ile Ala Asp Ser Tyr Glu Lys Phe 35 40 45 Gly Arg Cys Leu Thr Val Ile Asp Ala Asn Val Asn Arg Leu Tyr Gly 50 55 60 Lys Gln Ile Lys Ser Tyr Phe Arg His Tyr Gly Ile Asp Leu Thr Val 65 70 75 80 Val Pro Ile Val Ile Thr Glu Pro Thr Lys Thr Leu Ala Thr Phe Glu 85 90 95 Lys Ile Val Asp Ala Phe Ser Asp Phe Gly Leu Ile Arg Lys Glu Pro 100 105 110 Val Leu Val Val Gly Gly Gly Leu Thr Thr Asp Val Ala Gly Phe Ala 115 120 125 Cys Ala Ala Tyr Arg Arg Lys Ser Asn Tyr Ile Arg Val Pro Thr Thr 130 135 140 Leu Ile Gly Leu Ile Asp Ala Gly Val Ala Ile Lys Val Ala Val Asn 145 150 155 160 His Arg Lys Leu Lys Asn Arg Leu Gly Ala Tyr His Ala Pro Leu Lys 165 170 175 Val Ile Leu Asp Phe Ser Phe Leu Gln Thr Leu Pro Thr Ala Gln Val 180 185 190 Arg Asn Gly Met Ala Glu Leu Val Lys Ile Ala Val Val Ala Asn Ser 195 200 205 Glu Val Phe Glu Leu Leu Tyr Glu Tyr Gly Glu Glu Leu Leu Ser Thr 210 215 220 His Phe Gly Tyr Val Asn Gly Thr Lys Glu Leu Lys Ala Ile Ala His 225 230 235 240 Lys Leu Asn Tyr Glu Ala Ile Lys Thr Met Leu Glu Leu Glu Thr Pro 245 250 255 Asn Leu His Glu Leu Asp Leu Asp Arg Val Ile Ala Tyr Gly His Thr 260 265 270 Trp Ser Pro Thr Leu Glu Leu Ala Pro Met Ile Pro Leu Phe His Gly 275 280 285 His Ala Val Asn Ile Asp Met Ala Leu Ser Ala Thr Ile Ala Ala Arg 290 295 300 Arg Gly Tyr Ile Thr Ser Gly Glu Arg Asp Arg Ile Leu Ser Leu Met 305 310 315 320 Ser Arg Ile Gly Leu Ser Ile Asp His Pro Leu Leu Asp Gly Asp Leu 325 330 335 Leu Trp Tyr Ala Thr Gln Ser Ile Ser Leu Thr Arg Asp Gly Lys Gln 340 345 350 Arg Ala Ala Met Pro Lys Pro Ile Gly Glu Cys Phe Phe Val Asn Asp 355 360 365 Phe Thr Arg Glu Glu Leu Asp Ala Ala Leu Ala Glu His Lys Arg Leu 370 375 380 Cys Ala Thr Tyr Pro Arg Gly Gly Asp Gly Ile Asp Ala Tyr Ile Glu 385 390 395 400 Thr Gln Glu Glu Ser Lys Leu Leu Gly Val 405 410 <210> 120 <211> 277 <212> PRT <213> Nostoc punctiforme ATCC 29133 <400> 120 Met Thr Ser Ile Leu Gly Arg Asp Thr Ala Arg Pro Ile Thr Pro His 1 5 10 15 Ser Ile Leu Val Ala Gln Leu Gln Lys Thr Leu Arg Met Ala Glu Glu 20 25 30 Ser Asn Ile Pro Ser Glu Ile Leu Thr Ser Leu Arg Gln Gly Leu Gln 35 40 45 Leu Ala Ala Gly Leu Asp Pro Tyr Leu Asp Asp Cys Thr Thr Pro Glu 50 55 60 Ser Thr Ala Leu Thr Ala Leu Ala Gln Lys Thr Ser Ile Glu Asp Trp 65 70 75 80 Ser Lys Arg Phe Ser Asp Gly Glu Thr Val Arg Gln Leu Glu Gln Glu 85 90 95 Met Leu Ser Gly His Leu Glu Gly Gln Thr Leu Lys Met Phe Val His 100 105 110 Ile Thr Lys Ala Lys Ser Ile Leu Glu Val Gly Met Phe Thr Gly Tyr 115 120 125 Ser Ala Leu Ala Met Ala Glu Ala Leu Pro Asp Asp Gly Arg Leu Ile 130 135 140 Ala Cys Glu Val Asp Ser Tyr Val Ala Glu Phe Ala Gln Thr Cys Phe 145 150 155 160 Gln Glu Ser Pro His Gly Arg Lys Ile Val Val Glu Val Ala Pro Ala 165 170 175 Leu Glu Thr Leu His Lys Leu Val Ala Lys Lys Glu Ser Phe Asp Leu 180 185 190 Ile Phe Ile Asp Ala Asp Lys Lys Glu Tyr Ile Glu Tyr Phe Gln Ile 195 200 205 Ile Leu Asp Ser His Leu Leu Ala Pro Asp Gly Leu Ile Cys Val Asp 210 215 220 Asn Thr Leu Leu Gln Gly Gln Val Tyr Leu Pro Ser Glu Gln Arg Thr 225 230 235 240 Ala Asn Gly Glu Ala Ile Ala Gln Phe Asn Arg Ile Val Ala Ala Asp 245 250 255 Pro Arg Val Glu Gln Val Leu Leu Pro Ile Arg Asp Gly Ile Thr Leu 260 265 270 Ile Arg Arg Leu Val 275 <210> 121 <211> 461 <212> PRT <213> Nostoc punctiforme ATCC 29133 <400> 121 Met Ala Gln Ser Ile Ser Leu Ser Leu Pro Gln Ser Thr Thr Pro Ser 1 5 10 15 Lys Gly Val Arg Leu Lys Ile Ala Ala Leu Leu Lys Thr Ile Gly Thr 20 25 30 Leu Ile Leu Leu Leu Ile Ala Leu Pro Leu Asn Ala Leu Ile Val Leu 35 40 45 Ile Ser Leu Met Cys Arg Pro Phe Thr Lys Lys Pro Ala Val Ala Thr 50 55 60 His Pro Gln Asn Ile Leu Val Ser Gly Gly Lys Met Thr Lys Ala Leu 65 70 75 80 Gln Leu Ala Arg Ser Phe His Ala Ala Gly His Arg Val Ile Leu Ile 85 90 95 Glu Gly His Lys Tyr Trp Leu Ser Gly His Arg Phe Ser Asn Ser Val 100 105 110 Ser Arg Phe Tyr Thr Val Pro Ala Pro Gln Asp Asp Pro Glu Gly Tyr 115 120 125 Thr Gln Ala Leu Leu Glu Ile Val Lys Arg Glu Lys Ile Asp Val Tyr 130 135 140 Val Pro Val Cys Ser Pro Val Ala Ser Tyr Tyr Asp Ser Leu Ala Lys 145 150 155 160 Ser Ala Leu Ser Glu Tyr Cys Glu Val Phe His Phe Asp Ala Asp Ile 165 170 175 Thr Lys Met Leu Asp Asp Lys Phe Ala Phe Thr Asp Arg Ala Arg Ser 180 185 190 Leu Gly Leu Ser Ala Pro Lys Ser Phe Lys Ile Thr Asp Pro Glu Gln 195 200 205 Val Ile Asn Phe Asp Phe Ser Lys Glu Thr Arg Lys Tyr Ile Leu Lys 210 215 220 Ser Ile Ser Tyr Asp Ser Val Arg Arg Leu Asn Leu Thr Lys Leu Pro 225 230 235 240 Cys Asp Thr Pro Glu Glu Thr Ala Ala Phe Val Lys Ser Leu Pro Ile 245 250 255 Ser Pro Glu Lys Pro Trp Ile Met Gln Glu Phe Ile Pro Gly Lys Glu 260 265 270 Leu Cys Thr His Ser Thr Val Arg Asp Gly Glu Leu Arg Leu His Cys 275 280 285 Cys Ser Asn Ser Ser Ala Phe Gln Ile Asn Tyr Glu Asn Val Glu Asn 290 295 300 Pro Gln Ile Gln Glu Trp Val Gln His Phe Val Lys Ser Leu Arg Leu 305 310 315 320 Thr Gly Gln Ile Ser Leu Asp Phe Ile Gln Ala Glu Asp Gly Thr Ala 325 330 335 Tyr Ala Ile Glu Cys Asn Pro Arg Thr His Ser Ala Ile Thr Met Phe 340 345 350 Tyr Asn His Pro Gly Val Ala Glu Ala Tyr Leu Gly Lys Thr Pro Leu 355 360 365 Ala Ala Pro Leu Glu Pro Leu Ala Asp Ser Lys Pro Thr Tyr Trp Ile 370 375 380 Tyr His Glu Ile Trp Arg Leu Thr Gly Ile Arg Ser Gly Gln Gln Leu 385 390 395 400 Gln Thr Trp Phe Gly Arg Leu Val Arg Gly Thr Asp Ala Ile Tyr Arg 405 410 415 Leu Asp Asp Pro Ile Pro Phe Leu Thr Leu His His Trp Gln Ile Thr 420 425 430 Leu Leu Leu Leu Gln Asn Leu Gln Arg Leu Lys Gly Trp Val Lys Ile 435 440 445 Asp Phe Asn Ile Gly Lys Leu Val Glu Leu Gly Gly Asp 450 455 460 <210> 122 <211> 348 <212> PRT <213> Nostoc punctiforme ATCC 29133 <400> 122 Met Pro Val Leu Asn Ile Leu His Leu Val Gly Ser Ala His Asp Lys 1 5 10 15 Phe Tyr Cys Asp Leu Ser Arg Leu Tyr Ala Gln Asp Cys Leu Ala Ala 20 25 30 Thr Ala Asp Pro Ser Leu Tyr Asn Phe Gln Ile Ala Tyr Ile Thr Pro 35 40 45 Asp Arg Gln Trp Arg Phe Pro Asp Ser Leu Ser Arg Glu Asp Ile Ala 50 55 60 Leu Thr Lys Pro Ile Pro Val Phe Asp Ala Ile Gln Phe Leu Thr Gly 65 70 75 80 Gln Asn Ile Asp Met Met Leu Pro Gln Met Phe Cys Ile Pro Gly Met 85 90 95 Thr Gln Tyr Arg Ala Leu Phe Asp Leu Leu Lys Ile Pro Tyr Ile Gly 100 105 110 Asn Thr Pro Asp Ile Met Ala Ile Ala Ala His Lys Ala Arg Ala Lys 115 120 125 Ala Ile Val Glu Ala Ala Gly Val Lys Val Pro Arg Gly Glu Leu Leu 130 135 140 Arg Gln Gly Asp Ile Pro Thr Ile Thr Pro Pro Ala Val Val Lys Pro 145 150 155 160 Val Ser Ser Asp Asn Ser Leu Gly Val Val Leu Val Lys Asp Val Thr 165 170 175 Glu Tyr Asp Ala Ala Leu Lys Lys Ala Phe Glu Tyr Ala Ser Glu Val 180 185 190 Ile Val Glu Ala Phe Ile Glu Leu Gly Arg Glu Val Arg Cys Gly Ile 195 200 205 Ile Val Lys Asp Gly Glu Leu Ile Gly Leu Pro Leu Glu Glu Tyr Leu 210 215 220 Val Asp Pro His Asp Lys Pro Ile Arg Asn Tyr Ala Asp Lys Leu Gln 225 230 235 240 Gln Thr Asp Asp Gly Asp Leu His Leu Thr Ala Lys Asp Asn Ile Lys 245 250 255 Ala Trp Ile Leu Asp Pro Asn Asp Pro Ile Thr Gln Lys Val Gln Gln 260 265 270 Val Ala Lys Arg Cys His Gln Ala Leu Gly Cys Arg His Tyr Ser Leu 275 280 285 Phe Asp Phe Arg Ile Asp Pro Lys Gly Gln Pro Trp Phe Leu Glu Ala 290 295 300 Gly Leu Tyr Cys Ser Phe Ala Pro Lys Ser Val Ile Ser Ser Met Ala 305 310 315 320 Lys Ala Ala Gly Ile Pro Leu Asn Asp Leu Leu Ile Thr Ala Ile Asn 325 330 335 Glu Thr Leu Gly Ser Asn Lys Lys Val Leu Gln Asn 340 345 <210> 123 <211> 680 <212> PRT <213> Saccharomyces cerevisiae CEN.PK-1D <400> 123 Met Thr Gln Phe Thr Asp Ile Asp Lys Leu Ala Val Ser Thr Ile Arg 1 5 10 15 Ile Leu Ala Val Asp Thr Val Ser Lys Ala Asn Ser Gly His Pro Gly 20 25 30 Ala Pro Leu Gly Met Ala Pro Ala Ala His Val Leu Trp Ser Gln Met 35 40 45 Arg Met Asn Pro Thr Asn Pro Asp Trp Ile Asn Arg Asp Arg Phe Val 50 55 60 Leu Ser Asn Gly His Ala Val Ala Leu Leu Tyr Ser Met Leu His Leu 65 70 75 80 Thr Gly Tyr Asp Leu Ser Ile Glu Asp Leu Lys Gln Phe Arg Gln Leu 85 90 95 Gly Ser Arg Thr Pro Gly His Pro Glu Phe Glu Leu Pro Gly Val Glu 100 105 110 Val Thr Thr Gly Pro Leu Gly Gln Gly Ile Ser Asn Ala Val Gly Met 115 120 125 Ala Met Ala Gln Ala Asn Leu Ala Ala Thr Tyr Asn Lys Pro Gly Phe 130 135 140 Thr Leu Ser Asp Asn Tyr Thr Tyr Val Phe Leu Gly Asp Gly Cys Leu 145 150 155 160 Gln Glu Gly Ile Ser Ser Glu Ala Ser Ser Leu Ala Gly His Leu Lys 165 170 175 Leu Gly Asn Leu Ile Ala Ile Tyr Asp Asp Asn Lys Ile Thr Ile Asp 180 185 190 Gly Ala Thr Ser Ile Ser Phe Asp Glu Asp Val Ala Lys Arg Tyr Glu 195 200 205 Ala Tyr Gly Trp Glu Val Leu Tyr Val Glu Asn Gly Asn Glu Asp Leu 210 215 220 Ala Gly Ile Ala Lys Ala Ile Ala Gln Ala Lys Leu Ser Lys Asp Lys 225 230 235 240 Pro Thr Leu Ile Lys Met Thr Thr Thr Ile Gly Tyr Gly Ser Leu His 245 250 255 Ala Gly Ser His Ser Val His Gly Ala Pro Leu Lys Ala Asp Asp Val 260 265 270 Lys Gln Leu Lys Ser Lys Phe Gly Phe Asn Pro Asp Lys Ser Phe Val 275 280 285 Val Pro Gln Glu Val Tyr Asp His Tyr Gln Lys Thr Ile Leu Lys Pro 290 295 300 Gly Val Glu Ala Asn Asn Lys Trp Asn Lys Leu Phe Ser Glu Tyr Gln 305 310 315 320 Lys Lys Phe Pro Glu Leu Gly Ala Glu Leu Ala Arg Arg Leu Ser Gly 325 330 335 Gln Leu Pro Ala Asn Trp Glu Ser Lys Leu Pro Thr Tyr Thr Ala Lys 340 345 350 Asp Ser Ala Val Ala Thr Arg Lys Leu Ser Glu Thr Val Leu Glu Asp 355 360 365 Val Tyr Asn Gln Leu Pro Glu Leu Ile Gly Gly Ser Ala Asp Leu Thr 370 375 380 Pro Ser Asn Leu Thr Arg Trp Lys Glu Ala Leu Asp Phe Gln Pro Pro 385 390 395 400 Ser Ser Gly Ser Gly Asn Tyr Ser Gly Arg Tyr Ile Arg Tyr Gly Ile 405 410 415 Arg Glu His Ala Met Gly Ala Ile Met Asn Gly Ile Ser Ala Phe Gly 420 425 430 Ala Asn Tyr Lys Pro Tyr Gly Gly Thr Phe Leu Asn Phe Val Ser Tyr 435 440 445 Ala Ala Gly Ala Val Arg Leu Ser Ala Leu Ser Gly His Pro Val Ile 450 455 460 Trp Val Ala Thr His Asp Ser Ile Gly Val Gly Glu Asp Gly Pro Thr 465 470 475 480 His Gln Pro Ile Glu Thr Leu Ala His Phe Arg Ser Leu Pro Asn Ile 485 490 495 Gln Val Trp Arg Pro Ala Asp Gly Asn Glu Val Ser Ala Ala Tyr Lys 500 505 510 Asn Ser Leu Glu Ser Lys His Thr Pro Ser Ile Ile Ala Leu Ser Arg 515 520 525 Gln Asn Leu Pro Gln Leu Glu Gly Ser Ser Ile Glu Ser Ala Ser Lys 530 535 540 Gly Gly Tyr Val Leu Gln Asp Val Ala Asn Pro Asp Ile Ile Leu Val 545 550 555 560 Ala Thr Gly Ser Glu Val Ser Leu Ser Val Glu Ala Ala Lys Thr Leu 565 570 575 Ala Ala Lys Asn Ile Lys Ala Arg Val Val Ser Leu Pro Asp Phe Phe 580 585 590 Thr Phe Asp Lys Gln Pro Leu Glu Tyr Arg Leu Ser Val Leu Pro Asp 595 600 605 Asn Val Pro Ile Met Ser Val Glu Val Leu Ala Thr Thr Cys Trp Gly 610 615 620 Lys Tyr Ala His Gln Ser Phe Gly Ile Asp Arg Phe Gly Ala Ser Gly 625 630 635 640 Lys Ala Pro Glu Val Phe Lys Phe Phe Gly Phe Thr Pro Glu Gly Val 645 650 655 Ala Glu Arg Ala Gln Lys Thr Ile Ala Phe Tyr Lys Gly Asp Lys Leu 660 665 670 Ile Ser Pro Leu Lys Lys Ala Phe 675 680 <210> 124 <211> 370 <212> PRT <213> Saccharomyces cerevisiae CEN.PK-1D <400> 124 Met Ser Glu Ser Pro Met Phe Ala Ala Asn Gly Met Pro Lys Val Asn 1 5 10 15 Gln Gly Ala Glu Glu Asp Val Arg Ile Leu Gly Tyr Asp Pro Leu Ala 20 25 30 Ser Pro Ala Leu Leu Gln Val Gln Ile Pro Ala Thr Pro Thr Ser Leu 35 40 45 Glu Thr Ala Lys Arg Gly Arg Arg Glu Ala Ile Asp Ile Ile Thr Gly 50 55 60 Lys Asp Asp Arg Val Leu Val Ile Val Gly Pro Cys Ser Ile His Asp 65 70 75 80 Leu Glu Ala Ala Gln Glu Tyr Ala Leu Arg Leu Lys Lys Leu Ser Asp 85 90 95 Glu Leu Lys Gly Asp Leu Ser Ile Ile Met Arg Ala Tyr Leu Glu Lys 100 105 110 Pro Arg Thr Thr Val Gly Trp Lys Gly Leu Ile Asn Asp Pro Asp Val 115 120 125 Asn Asn Thr Phe Asn Ile Asn Lys Gly Leu Gln Ser Ala Arg Gln Leu 130 135 140 Phe Val Asn Leu Thr Asn Ile Gly Leu Pro Ile Gly Ser Glu Met Leu 145 150 155 160 Asp Thr Ile Ser Pro Gln Tyr Leu Ala Asp Leu Val Ser Phe Gly Ala 165 170 175 Ile Gly Ala Arg Thr Thr Glu Ser Gln Leu His Arg Glu Leu Ala Ser 180 185 190 Gly Leu Ser Phe Pro Val Gly Phe Lys Asn Gly Thr Asp Gly Thr Leu 195 200 205 Asn Val Ala Val Asp Ala Cys Gln Ala Ala Ala His Ser His His Phe 210 215 220 Met Gly Val Thr Lys His Gly Val Ala Ala Ile Thr Thr Thr Lys Gly 225 230 235 240 Asn Glu His Cys Phe Val Ile Leu Arg Gly Gly Lys Lys Gly Thr Asn 245 250 255 Tyr Asp Ala Lys Ser Val Ala Glu Ala Lys Ala Gln Leu Pro Ala Gly 260 265 270 Ser Asn Gly Leu Met Ile Asp Tyr Ser His Gly Asn Ser Asn Lys Asp 275 280 285 Phe Arg Asn Gln Pro Lys Val Asn Asp Val Val Cys Glu Gln Ile Ala 290 295 300 Asn Gly Glu Asn Ala Ile Thr Gly Val Met Ile Glu Ser Asn Ile Asn 305 310 315 320 Glu Gly Asn Gln Gly Ile Pro Ala Glu Gly Lys Ala Gly Leu Lys Tyr 325 330 335 Gly Val Ser Ile Thr Asp Ala Cys Ile Gly Trp Glu Thr Thr Glu Asp 340 345 350 Val Leu Arg Lys Leu Ala Ala Ala Val Arg Gln Arg Arg Glu Val Asn 355 360 365 Lys Lys 370

Claims (7)

  1. 2-디하이드로-3-데옥시포스포헵토네이트 알돌라제 (2-dehydro-3-deoxyphosphoheptonate aldolase), 포스포에놀피루베이트 신테타제 (phosphoenolpyruvate synthetase) 및 트랜스케톨라제 (transketolase)로 이루어진 군으로부터 선택되는 하나 이상의 단백질 활성이 강화된, 마이코스포린 유사 아미노산을 생산하는 미생물로서,
    상기 미생물은 마이코스포린 유사 아미노산 생합성 유전자 클러스터를 추가적으로 포함하고,
    상기 마이코스포린 유사 아미노산은 사이클로헥세논(cyclohexanone) 또는 사이클로헥센이민(cyclohexenimine)의 중심 링을 가지는 화합물인, 미생물.
  2. 삭제
  3. 제1항에 있어서, 상기 마이코스포린 유사 아미노산 생합성 유전자 클러스터는 2-디메틸 4-데옥시가두솔 신타제 (2-demetyl 4-deoxygadusol synthase), O-메틸트랜스퍼라제 (O-methyltransferase) 및 C-N 리가제 (C-N ligase)로 이루어지는 군으로부터 선택되는 하나 이상의 단백질을 코딩하는 유전자를 포함하는, 마이코스포린 유사 아미노산을 생산하는 미생물.
  4. 제1항에 있어서, 상기 마이코스포린 유사 아미노산 생합성 유전자 클러스터는 논-리보좀 펩티드 신테타제 (non-ribosomal peptide synthetase), 논-리보좀 펩티드 신테타제 유사 효소 (non-ribosomal peptide synthetase-like enzyme: NRPS-like enzyme) 및 D-알라닌 D-알라닌 리가제 (D-Ala D-Ala ligase)로 이루어진 군으로부터 선택되는 하나 이상의 단백질을 코딩하는 유전자를 포함하는, 마이코스포린 유사 아미노산을 생산하는 미생물.
  5. 제1항에 있어서, 상기 미생물은, 코리네박테리움 속 미생물, 에스케리키아 속 미생물 또는 효모인, 마이코스포린 유사 아미노산을 생산하는 미생물.
  6. 제1항에 있어서, 상기 마이코스포린 유사 아미노산은, 마이코스포린-2-글라이신 (Mycosporine-2-glycine), 팰라이티놀 (Palythinol), 팰라이텐산 (Palythenic acid), 데옥시가두솔 (deoxygadusol), 마이코스포린-메틸아민-트레오닌 (Mycosporine-methylamine-threonine), 마이코스포린-글라이신-발린 (Mycosporine-glycine-valine), 팰라이틴 (Palythine), 아스테리나-330 (Asterina-330), 시노린 (Shinorine), 포르피라-334 (Porphyra-334), 유하로테스-362 (Euhalothece-362), 마이코스포린-글라이신 (Mycosporine-glycine), 마이코스포린-오르니틴 (Mycosporine-ornithine), 마이코스포린-라이신 (Mycosporine-lysine), 마이코스포린-글루탐산-글라이신 (Mycosporine-glutamic acid-glycine), 마이코스포린-메틸아민-세린 (Mycosporine-methylamine-serine), 마이코스포린-타우린 (Mycosporine-taurine), 팰라이텐 (Palythene), 팰라이텐-세린 (Palythine-serine), 팰라이텐-세린-설페이트 (Palythine-serine-sulfate), 팰라이티놀(Palythinol), 및 우수지렌 (Usujirene)으로 이루어진 군으로부터 선택되는 하나 이상인, 마이코스포린 유사 아미노산을 생산하는 미생물.
  7. 제1항, 제3항 내지 제6항 중 어느 한 항의 미생물을 배지에서 배양하는 단계; 및
    상기 배양된 미생물 또는 배지로부터 마이코스포린 유사 아미노산을 회수하는 단계를 포함하는, 마이코스포린 유사 아미노산의 생산방법.
KR1020180022185A 2018-02-23 2018-02-23 마이코스포린 유사 아미노산을 생산하는 미생물 및 이를 이용한 마이코스포린 유사 아미노산의 생산방법 KR102003911B1 (ko)

Priority Applications (14)

Application Number Priority Date Filing Date Title
KR1020180022185A KR102003911B1 (ko) 2018-02-23 2018-02-23 마이코스포린 유사 아미노산을 생산하는 미생물 및 이를 이용한 마이코스포린 유사 아미노산의 생산방법
RU2020127822A RU2757424C1 (ru) 2018-02-23 2019-02-22 Микроорганизм, продуцирующий микоспорин-подобную аминокислоту, и способ получения микоспорин-подобной аминокислоты с его использованием
AU2019224876A AU2019224876B2 (en) 2018-02-23 2019-02-22 A Microorganism Producing Mycosporine-Like Amino Acid And A Method For Producing A Mycrosporine-Like Amino Acid Using The Same
MYPI2020004306A MY196701A (en) 2018-02-23 2019-02-22 A Microorganism Producing a Mycosporine-Like Amino Acid and a Method for Producing a Mycosporine-Like Amino Acid Using The Same
MX2020008809A MX2020008809A (es) 2018-02-23 2019-02-22 Un microorganismo que produce un aminoácido similar a la micosporina y un procedimiento de producción de un aminoácido similar a la micosporina mediante el uso del mismo.
US16/971,209 US20210230610A1 (en) 2018-02-23 2019-02-22 A microorganism producing a mycosporine-like amino acid and a method for producing a mycosporine-like amino acid using the same
SG11202008002PA SG11202008002PA (en) 2018-02-23 2019-02-22 A microorganism producing a mycosporine-like amino acid and a method for producing a mycosporine-like amino acid using the same
CA3091909A CA3091909C (en) 2018-02-23 2019-02-22 A microorganism producing a mycosporine-like amino acid and a method for producing a mycosporine-like amino acid using the same
EP19757526.9A EP3754024B1 (en) 2018-02-23 2019-02-22 A microorganism producing a mycosporine-like amino acid and a method for producing a mycosporine-like amino acid using the same
PCT/KR2019/002242 WO2019164351A1 (ko) 2018-02-23 2019-02-22 마이코스포린 유사 아미노산을 생산하는 미생물 및 이를 이용한 마이코스포린 유사 아미노산의 생산방법
JP2020544220A JP7015933B2 (ja) 2018-02-23 2019-02-22 マイコスポリン様アミノ酸を生産する微生物及びそれを用いたマイコスポリン様アミノ酸の生産方法
BR112020017078-0A BR112020017078B1 (pt) 2018-02-23 2019-02-22 Microrganismo que produz um aminoácido semelhante à micosporina e método para produzir um aminoácido semelhante à micosporina usando o mesmo
CN201980024017.1A CN112292452B (zh) 2018-02-23 2019-02-22 生产霉孢菌素样氨基酸的微生物及利用其生产霉孢菌素样氨基酸的方法
PH12020551274A PH12020551274A1 (en) 2018-02-23 2020-08-19 Mycosporine-like amino acid-producing microorganism and method for production of mycosporine-like amino acids by using same

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020180022185A KR102003911B1 (ko) 2018-02-23 2018-02-23 마이코스포린 유사 아미노산을 생산하는 미생물 및 이를 이용한 마이코스포린 유사 아미노산의 생산방법

Publications (1)

Publication Number Publication Date
KR102003911B1 true KR102003911B1 (ko) 2019-07-25

Family

ID=67468720

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020180022185A KR102003911B1 (ko) 2018-02-23 2018-02-23 마이코스포린 유사 아미노산을 생산하는 미생물 및 이를 이용한 마이코스포린 유사 아미노산의 생산방법

Country Status (14)

Country Link
US (1) US20210230610A1 (ko)
EP (1) EP3754024B1 (ko)
JP (1) JP7015933B2 (ko)
KR (1) KR102003911B1 (ko)
CN (1) CN112292452B (ko)
AU (1) AU2019224876B2 (ko)
BR (1) BR112020017078B1 (ko)
CA (1) CA3091909C (ko)
MX (1) MX2020008809A (ko)
MY (1) MY196701A (ko)
PH (1) PH12020551274A1 (ko)
RU (1) RU2757424C1 (ko)
SG (1) SG11202008002PA (ko)
WO (1) WO2019164351A1 (ko)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021133101A3 (ko) * 2019-12-24 2021-08-19 씨제이제일제당 (주) 마이코스포린 유사 아미노산을 생산하는 미생물 및 이를 이용한 마이코스포린 유사 아미노산의 생산방법
KR102548752B1 (ko) * 2022-09-28 2023-07-03 큐티스바이오 주식회사 마이코스포린 유사 아미노산 생산능을 갖는 미생물 및 이를 이용한 마이코스포린 유사 아미노산의 생산 방법

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101911186B1 (ko) * 2017-08-16 2018-10-25 씨제이제일제당 (주) 마이코스포린 유사 아미노산을 생산하는 미생물 및 이를 이용한 마이코스포린 유사 아미노산의 생산방법
CN114657162B (zh) * 2022-03-04 2023-06-16 华南理工大学 一种具有血管内皮细胞保护功能的抗氧化五肽及其应用
CN115851807B (zh) * 2022-10-10 2024-04-30 深圳市灵蛛科技有限公司 一种重组生物体及生产多种类环孢素氨基酸的方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0663011A1 (en) * 1992-09-30 1995-07-19 Purdue Research Foundation Synthesis of quinic acid from glucose
KR101911186B1 (ko) * 2017-08-16 2018-10-25 씨제이제일제당 (주) 마이코스포린 유사 아미노산을 생산하는 미생물 및 이를 이용한 마이코스포린 유사 아미노산의 생산방법

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
PL1664318T3 (pl) * 2004-01-30 2010-03-31 Ajinomoto Kk Mikroorganizm wytwarzający L-aminokwas i sposób wytwarzania L-aminokwasu
KR100620092B1 (ko) 2004-12-16 2006-09-08 씨제이 주식회사 코리네박테리움 속 세포로부터 유래된 신규한 프로모터서열, 그를 포함하는 발현 카세트 및 벡터, 상기 벡터를포함하는 숙주 세포 및 그를 이용하여 유전자를 발현하는방법
CN101478980B (zh) * 2006-06-27 2013-03-20 营养技术责任有限公司 用于治疗神经性、神经变性和情绪障碍的水华束丝藻制剂、提取物及其纯化的组分
KR100930203B1 (ko) 2008-01-28 2009-12-07 씨제이제일제당 (주) 개량된 프로모터 및 이를 이용한 l-라이신의 생산 방법
KR101126041B1 (ko) 2008-04-10 2012-03-19 씨제이제일제당 (주) 트랜스포존을 이용한 형질전환용 벡터, 상기 벡터로형질전환된 미생물 및 이를 이용한 l-라이신 생산방법
KR102092422B1 (ko) * 2012-01-30 2020-03-24 피티티 글로벌 케미컬 퍼블릭 컴퍼니 리미티드 유전자 조작된 미생물로부터 뮤콘산의 생산
JP2015174427A (ja) * 2014-03-18 2015-10-05 セイコーエプソン株式会社 三次元造形物製造装置、三次元造形物の製造方法および三次元造形物
EP3144392B1 (en) * 2014-05-13 2019-07-10 The Kitasato Institute Method for producing mycosporine-like amino acid using microbes
KR101632642B1 (ko) 2015-01-29 2016-06-22 씨제이제일제당 주식회사 신규한 프로모터 및 그의 용도
KR101833895B1 (ko) * 2016-01-29 2018-03-05 주식회사 바이오에프디엔씨 미코스포린―유사 아미노산을 함유한 창상 치유용 피부 외용제 조성물 및 그 제조방법
ES2907694T3 (es) 2016-08-31 2022-04-26 Cj Cheiljedang Corp Nuevo promotor y uso del mismo

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0663011A1 (en) * 1992-09-30 1995-07-19 Purdue Research Foundation Synthesis of quinic acid from glucose
KR101911186B1 (ko) * 2017-08-16 2018-10-25 씨제이제일제당 (주) 마이코스포린 유사 아미노산을 생산하는 미생물 및 이를 이용한 마이코스포린 유사 아미노산의 생산방법

Non-Patent Citations (22)

* Cited by examiner, † Cited by third party
Title
ACS Appl. Mater. Interfaces. 2015. 7: 16558-16564
Ann. Rev. Physiol. 2002, 64: 223-262.
Appl Environ Microbiol. 2016, 82(20): 6167-6173
Biol. Rev. 1999, 74: 311-345.
Can. J. Bot. 2003. 81: 131-138.
ChemBioChem. 2015, 16: 320-327
Comp. Biochem. Physiol. B 1995, 112: 105-114.
Comp. Biochem. Physiol. C Toxicol. Pharmacol. 2007. 146: 60-78.
FEMS Microbiol Lett. 2007, 269: 1-10.
Genomics 2010, 95: 120-128.
Geomicrobiol. J. 1997. 14: 231-241.
J. Bacteriol. 2011. 193(21): 5923-5928.
J. Photochem. Photobiol. B. 2007, 89: 29-35.
Journal of Photochemistry and Photobiology B: Biology. 2015, 142: 154-168
Mar. Biol. 1991, 108: 157-166.
Methods Mol Biol. 2013, 1073: 43-7
Mol. Biol. Evol. 2006, 23: 1437-1443.
Nature Review, 2011, 9: 791-802
Planta Med. 2015. 81: 813-820
Science, 2010, 329: 1653-1656.
논문1:NAT REV MICROBIOL. 2011 *
논문2:BIOTECHNOL BIOENG. 1995 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021133101A3 (ko) * 2019-12-24 2021-08-19 씨제이제일제당 (주) 마이코스포린 유사 아미노산을 생산하는 미생물 및 이를 이용한 마이코스포린 유사 아미노산의 생산방법
KR102548752B1 (ko) * 2022-09-28 2023-07-03 큐티스바이오 주식회사 마이코스포린 유사 아미노산 생산능을 갖는 미생물 및 이를 이용한 마이코스포린 유사 아미노산의 생산 방법
WO2024071491A1 (ko) * 2022-09-28 2024-04-04 큐티스바이오 주식회사 마이코스포린 유사 아미노산 생산능을 갖는 미생물 및 이를 이용한 마이코스포린 유사 아미노산의 생산 방법

Also Published As

Publication number Publication date
SG11202008002PA (en) 2020-09-29
CN112292452A (zh) 2021-01-29
JP7015933B2 (ja) 2022-02-03
RU2757424C1 (ru) 2021-10-15
CA3091909A1 (en) 2019-08-29
US20210230610A1 (en) 2021-07-29
PH12020551274A1 (en) 2021-05-31
EP3754024A1 (en) 2020-12-23
EP3754024A4 (en) 2021-01-13
AU2019224876A1 (en) 2020-09-17
AU2019224876B2 (en) 2022-10-13
JP2021514621A (ja) 2021-06-17
BR112020017078A2 (pt) 2020-12-22
BR112020017078B1 (pt) 2024-01-09
CN112292452B (zh) 2024-02-06
CA3091909C (en) 2023-07-11
EP3754024B1 (en) 2022-07-27
MX2020008809A (es) 2020-12-11
MY196701A (en) 2023-04-30
WO2019164351A1 (ko) 2019-08-29

Similar Documents

Publication Publication Date Title
KR102003911B1 (ko) 마이코스포린 유사 아미노산을 생산하는 미생물 및 이를 이용한 마이코스포린 유사 아미노산의 생산방법
RU2770464C1 (ru) Новая аденилосукцинат-синтетаза и способ получения нуклеотидов пурина с ее использованием
DK2588616T3 (en) PROCEDURE FOR MAKING A RELATIONSHIP OF INTEREST
CN111527211B (zh) 生产霉孢菌素样氨基酸的微生物及利用其生产霉孢菌素样氨基酸的方法
CN108559747A (zh) 新型启动子及其应用
RU2745157C1 (ru) Дрожжи, продуцирующие эктоин
KR101704212B1 (ko) 젖산을 생산하는 미생물 및 이를 이용한 젖산 제조 방법
AU784466B2 (en) Cyclic depsipeptide synthases, genes thereof and mass production system of cyclic depsipeptide
CN111295446A (zh) 引入高活性苹果酸脱氢酶用以生产琥珀酸的突变型微生物及使用其生产琥珀酸的方法
KR102233376B1 (ko) 메조 디아미노피멜레이트 디하이드로게네이즈 변이형 폴리펩타이드 및 이를 이용한 l-쓰레오닌 생산방법
AU2020426558A1 (en) Novel Modified Polypeptide With Attenuated Activity Of Citrate Synthase And Method For Producing L-Amino Acid Using The Same
KR20220101509A (ko) GlxR 단백질 변이체 또는 이를 이용한 쓰레오닌 생산방법
KR20160139817A (ko) 락테이트 데히드로게나제 변이체를 스크리닝하는 방법, 락테이트 데히드로게나제 변이체, 상기 변이체를 포함하는 폴리뉴클레오티드, 벡터, 미생물, 및 상기 미생물을 이용하여 락테이트를 생산하는 방법
CN112639117A (zh) 谷胱甘肽的制造方法
RU2805253C1 (ru) Новый модифицированный полипептид с ослабленной активностью цитратсинтазы и способ получения L-аминокислоты с его использованием
KR102495918B1 (ko) aroG 알돌라아제 (Phospho-2-dehydro-3-deoxyheptonate aldolase) 변이체 및 이를 이용한 분지쇄 아미노산 생산 방법
BR112020003064B1 (pt) Micro-organismo modificado para produzir um aminoácido semelhante a micosporina e método para produzir um aminoácido semelhante a micosporina
KR20180010382A (ko) 아실전이효소의 활성을 갖는 미생물 및 이의 용도
KR20120096684A (ko) 고광학순도의 젖산 생산용 형질전환체 및 이를 이용한 젖산 생산 방법

Legal Events

Date Code Title Description
E701 Decision to grant or registration of patent right
GRNT Written decision to grant