KR20170018051A - 테르펜 또는 테르페노이드의 생산 방법 - Google Patents

테르펜 또는 테르페노이드의 생산 방법 Download PDF

Info

Publication number
KR20170018051A
KR20170018051A KR1020177001110A KR20177001110A KR20170018051A KR 20170018051 A KR20170018051 A KR 20170018051A KR 1020177001110 A KR1020177001110 A KR 1020177001110A KR 20177001110 A KR20177001110 A KR 20177001110A KR 20170018051 A KR20170018051 A KR 20170018051A
Authority
KR
South Korea
Prior art keywords
ala
leu
val
gly
arg
Prior art date
Application number
KR1020177001110A
Other languages
English (en)
Inventor
니꼴라 샤보
상드라 꺄스땅
삘립쁘 보샤르
쟝-뽈 레오네띠
Original Assignee
데이노브
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 데이노브 filed Critical 데이노브
Publication of KR20170018051A publication Critical patent/KR20170018051A/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P23/00Preparation of compounds containing a cyclohexene ring having an unsaturated side chain containing at least ten carbon atoms bound by conjugated double bonds, e.g. carotenes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N1/00Microorganisms, e.g. protozoa; Compositions thereof; Processes of propagating, maintaining or preserving microorganisms or compositions thereof; Processes of preparing or isolating a composition containing a microorganism; Culture media therefor
    • C12N1/20Bacteria; Culture media therefor
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/52Genes encoding for enzymes or proenzymes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/67General methods for enhancing the expression
    • C12N15/69Increasing the copy number of the vector
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/1022Transferases (2.) transferring aldehyde or ketonic groups (2.2)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P5/00Preparation of hydrocarbons or halogenated hydrocarbons
    • C12P5/007Preparation of hydrocarbons or halogenated hydrocarbons containing one or more isoprene units, i.e. terpenes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y205/00Transferases transferring alkyl or aryl groups, other than methyl groups (2.5)
    • C12Y205/01Transferases transferring alkyl or aryl groups, other than methyl groups (2.5) transferring alkyl or aryl groups, other than methyl groups (2.5.1)
    • C12Y205/01001Dimethylallyltranstransferase (2.5.1.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y205/00Transferases transferring alkyl or aryl groups, other than methyl groups (2.5)
    • C12Y205/01Transferases transferring alkyl or aryl groups, other than methyl groups (2.5) transferring alkyl or aryl groups, other than methyl groups (2.5.1)
    • C12Y205/0101(2E,6E)-Farnesyl diphosphate synthase (2.5.1.10), i.e. geranyltranstransferase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y301/00Hydrolases acting on ester bonds (3.1)
    • C12Y301/07Diphosphoric monoester hydrolases (3.1.7)
    • C12Y301/07003Monoterpenyl-diphosphatase (3.1.7.3)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y402/00Carbon-oxygen lyases (4.2)
    • C12Y402/03Carbon-oxygen lyases (4.2) acting on phosphates (4.2.3)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y503/00Intramolecular oxidoreductases (5.3)
    • C12Y503/03Intramolecular oxidoreductases (5.3) transposing C=C bonds (5.3.3)
    • C12Y503/03002Isopentenyl-diphosphate DELTA-isomerase (5.3.3.2)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y505/00Intramolecular lyases (5.5)
    • C12Y505/01Intramolecular lyases (5.5.1)
    • C12Y505/01019Lycopene beta-cyclase (5.5.1.19)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y202/00Transferases transferring aldehyde or ketonic groups (2.2)
    • C12Y202/01Transketolases and transaldolases (2.2.1)
    • C12Y202/010071-Deoxy-D-xylulose-5-phosphate synthase (2.2.1.7)

Landscapes

  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Genetics & Genomics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Biotechnology (AREA)
  • Microbiology (AREA)
  • Biomedical Technology (AREA)
  • General Chemical & Material Sciences (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Molecular Biology (AREA)
  • Medicinal Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Tropical Medicine & Parasitology (AREA)
  • Virology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)

Abstract

본 발명은 향상된 2-C-메틸-D-에리트리톨 4-포스페이트/1-데옥시-D-크실룰로즈 5-포스페이트(MEP/DXP) 경로를 나타내는 재조합 데이노코쿠스 박테리아, 및 테르펜 또는 테르페노이드 화합물을 생산하기 위한 이의 용도에 관한 것이다.

Description

테르펜 또는 테르페노이드의 생산 방법{METHOD OF PRODUCING TERPENES OR TERPENOIDS}
본 발명은 미생물학 분야에 관한 것이다. 보다 특히, 본 발명은 유전적으로 변형된 박테리아에서 이소프레노이드 화합물의 생산 분야에 관한 것이다.
테르펜 또는 테르페노이드로도 언급되는 이소프레노이드는 천연 생성물의 가장 다양한 부류이다. 모노테르펜, 세스퀴테르펜, 디테르펜 및 트리테르펜을 함유하는 이소프레노이드 뿐만 아니라 카로테노이드는 예를 들면, 약제, 기능식품, 풍미제, 향수, 화장품, 착색제 및 농약에서 발견되기 때문에, 다수의 산업적 적용의 대상이다.
이소프레노이드 화합물의 큰 다양성에도 불구하고, 모두는 일반적인 C-5 전구체, 이소펜테닐 피로포스페이트(IPP)로부터 생합성된다. 당해 전구체는 IPP 및 이의 이성질체 디메틸알릴 피로포스페이트(DMAPP)를 생성하는 메발로네이트 경로(MEV) 또는 비-메발로네이트 경로(또는 2-C-메틸-D-에리트리톨 4-포스페이트/1-데옥시-D-크실룰로즈 5-포스페이트(MEP/DXP) 경로)를 통해 합성될 수 있다. 이후에, DMAPP 및 IPP는 농축되어 게라닐 디포스페이트(GPP)를 생성하며, 이는 IPP와 함께 파르네실 디포스페이트(FPP)로 추가로 전환된다. FPP는 IPP와 함께 추가로 농축되어 게라닐게라닐 디포스페이트(GGPP)를 형성한다. GPP, FPP 및 GGPP는 모노테르펜, 세스퀴테르펜, 디테르펜, 트리테르펜 및 카로테노이드의 전구체이다.
현재, 이소프레노이드는 식물로부터 주로 추출되거나 화학 합성에 의해 생산되지만 낮은 수율 및 고 생산 비용으로 곤란을 겪고 있다.
미생물의 대사 엔지니어링은 저렴한 탄소원으로부터 다량의 이소프레노이드의 경제적인 생산을 위한 대안의 및 촉망되는 시도를 제공한다. 이와 관련하여, 다수의 이소프레노이드가 매우 용이하게 유전적으로 조작될 수 있어 숙주 세포로서 흔히 사용되어 온 재조합 미생물인, E. coliS. cerevisiae에 의해 이미 생산되어 왔다. 예를 들면, 리모넨은 미송(grand fir)으로부터 GPP 신타제 유전자 및 스피아민트로부터(-)-리모넨 신타제 유전자를 발현시키는 재조합 E.coli로부터 생산되었거나(Carter et al., 2003), 리날룰(linalool) 생산은 클라르키아 브레웨리(Clarkia breweri)로부터 (S)-리날룰 신타제 유전자를 발현하는 재조합체 S. cerevisiae에서 수득되었다(Herrero et al., 2008).
이소프레노이드를 생산하기 위해 미생물을 가공하는 것이 매우 촉망된다는 것이 밝혀져 있지만, 이소프레노이드의 총 양은 이소프레노이드 전구체, 예를 들면, IPP 및 DMAPP의 유용성에 의해 제한된다는 것이 추정되어 왔다. 따라서, 이소프레노이드 전구체의 증가 된 공급물을 가공하는 것이 생산을 증가시키는데 필수적이다. 하지만, 복합체 MEP 경로의 유전적 조작은 특히 IPP 또는 DMAPP와 같은 독성 대사물질 중간체의 축적(예를 들면, Sivy et al., 2011), 또는 세포로부터 피루베이트의 고갈로 유발된 숙주에서 물질대사의 부담(Brown et al., 2010)으로 인하여, 세포 성장률 및 이소프렌 생산에 영향을 미칠 수 있다.
발명의 요약
제1 국면에서, 본 발명은 이소프레노이드를 과생산하는 데이노코쿠스(Deinococcus) 박테리아를 제공하며, 이때 MEP 경로는 IPP 및 DMAPP에 대한 탄소 플럭스(carbon flux)를 증가시키기 위하여 성공적으로 가공(engineered)되어 왔다.
본 발명은 향상된 2-C-메틸-D-에리트리톨 4-포스페이트/1-데옥시-D-크실룰로즈 5-포스페이트(MEP/DXP) 경로를 나타내는 재조합 데이노코쿠스 박테리아, 특히 DXP 신타제(DXS), DXP 리덕토이소머라제(DXR), IspD, IspE, IspF, IspG, IspH 및 IPP 이소머라제 활성(IDI)으로 이루어진 그룹으로부터 선택된 적어도 하나의 효소 활성이 증가된 박테리아에 관한 것이다. 바람직하게는, 상기 적어도 하나의 효소 활성은 천연의, 동종(homologous) 또는 이종(heterologous) dxs , dxr , ispD , ispE , ispF , ispG , ispH idi 유전자로 이루어진 그룹으로부터 선택된 적어도 하나의 유전자의 과발현에 의해 증가 된다.
바람직하게는, 본 발명의 재조합 박테리아는 일반적으로 DXS 활성 및/또는 IDI 활성을 증가시키도록 유전적으로 변형된다. 특히, 상기 재조합 박테리아는 천연의, 동종 또는 이종 idi 유전자를 과발현하고/하거나 천연의, 동종 또는 이종 dxs 유전자를 과발현할 수 있다.
본 발명의 박테리아는 증가된 FPP 신타제 활성을 추가로 나타낼 수 있다. 바람직하게는, 상기 증가는 천연의, 동종 또는 이종 ispA 유전자의 과발현에 기인한다.
바람직하게는, ipsA 유전자는,
a) 서열 번호 47의 아미노산 서열의 모든 부분 또는 활성 부분을 포함하는 폴리펩타이드;
b) 서열 번호 47에 대해 적어도 60, 65, 70, 75, 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98 또는 99% 서열 상동성을 갖는 아미노산 서열을 갖는 폴리펩타이드;
c) 서열 번호 46에 대해 적어도 60, 65, 70, 75, 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98 또는 99% 서열 상동성을 갖는 뉴클레오타이드 서열에 의해 암호화된 폴리펩타이드; 또는
d) (i) 서열 번호 46에 설정된 핵산 서열, (ii) 이의 상보성 쇄, 또는 (iii) (i) 또는 (ii)의 서브서열(subsequence)과 중간/높은 스트링전시(stringency), 바람직하게는 높거나 매우 높은 조건, 하에서 하이브리드화할 수 있는 핵산 서열에 의해 암호화된 폴리펩타이드
로 이루어진 그룹으로부터 선택된 폴리펩타이드를 암호화한다.
바람직하게는, FPP 신타제는 또한 디메틸알릴트랜스퍼라제 활성 및/또는 게라닐게라닐 디포스페이트 신타제 활성, 보다 바람직하게는 디메틸알릴트랜스퍼라제 활성 및 게라닐게라닐 디포스페이트 신타제 활성을 더 나타낸다.
본 발명의 박테리아(bacterium)은 또한 서열 번호 52의 222번 위치에 상응하는 위치에서 아스파라긴 및/또는 서열 번호 52의 244번 위치에 상응하는 위치에서 시스테인을 포함하는 돌연변이된 DXP 신타제, 바람직하게는 서열 번호 52의 244번 위치에 상응하는 위치에서 시스테인을 포함하는 돌연변이된 DXP 신타제를 포함하는 돌연변이된 DXP 신타제를 더 포함할 수 있다. 특히, 재조합 데이노코쿠스(Deinococcus) 박테리아는 디. 라디오푸그난스(D. radiopugnans)로부터의 DXP 신타제의 R244C 돌연변이를 암호화하는 유전자(서열 번호 8), 디. 윤웨이엔시스(D. yunweiensis)로부터의 DXP 신타제의 R238C 돌연변이를 암호화하는 유전자(서열 번호 14), 및/또는 디. 게오테르말리스(D. geiothermalis)로부터의 DXP 신타제의 R241C 돌연변이를 암호화하는 유전자(서열 번호 56)를 발현할 수 있다. 바람직하게는 재조합 데이노코쿠스 박테리아는 증진된(돌연변이된) DXS 효소를 발현하며 천연의, 동종 또는 이종 idi 유전자를 과발현한다.
바람직하게는, 본 발명의 박테리아는 이종 테르펜 신타제를 암호화하는 유전자를 추가로 포함한다.
이종 테르펜 신타제는, 바람직하게는 게라니올 신타제, 3S-리날룰 신타제, 미르센 신타제, R-리날룰 신타제, 1,8 시네올 신타제, 4S-리모넨 신타제, R-리모넨 신타제, (-)-α-피넨 신타제, (-)-β-피넨 신타제, (-)-엔도-펜콜 신타제 및 (-)-α-테르펜 신타제로 이루어진 그룹으로부터 선택되는, 모노테르펜 신타제일 수 있다. 보다 바람직하게는, 이종 테르펜 신타제는 게라니올 신타제, 신네올 신타제, 리모넨 신타제 또는 리날룰 신타제이다.
상기 이종 테르펜 신타제는, 또한, 바람직하게는 (+)-에피-알파-비스알볼올 신타제, 게르마크렌 A 신타제, (E,E)-게르마크렌 B 신타제, 게르마크렌 C 신타제, (-)-게르마크렌 D 신타제, 발렌센 신타제, (3S, 6E)-네롤리돌 신타제, 에피-세드롤 신타제, 파트코울롤 신타제, 산탈렌 신타제 및 δ-카디넨 신타제로 이루어진 그룹으로부터 선택된, 세스퀴테르펜 신타제일 수 있다. 보다 바람직하게는, 이종 세스퀴테르펜 신타제는 (+)-에피-알파-비스알볼올 신타제이다.
본 발명의 박테리아는 또한 감소되거나 억제된 라이코펜 베타-사이클라제 활성을 나타낼 수 있다.
제2 국면에서, 본 발명은 FPP 신타제 활성이 증가 된 재조합 데이노코쿠스 박테리아에 관한 것이다. 바람직하게는, 상기 FPP 신타제 활성은 천연의, 동종 또는 이종 ispA 유전자의 과발현에 의해 증가 된다. 바람직하게는, ipsA 유전자는:
a) 서열 번호 47의 아미노산 서열 모두 또는 이의 활성 부분을 포함하는 폴리펩타이드;
b) 서열 번호 47에 대해 적어도 60, 65, 70, 75, 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98 또는 99% 서열 상동성을 갖는 아미노산 서열을 갖는 폴리펩타이드;
c) 서열 번호 46에 대해 적어도 60, 65, 70, 75, 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98 또는 99% 서열 상동성을 갖는 뉴클레오타이드 서열에 의해 암호화된 폴리펩타이드; 또는
d) (i) 서열 번호 46에 설정된 핵산 서열, (ii) 이의 상보성 서열, 또는 (iii) (i) 또는 (ii)의 서브서열(subsequence)과 중간/높은 스트링전시, 바람직하게는 높거나 매우 높은 조건하에서 하이브리드화할 수 있는 핵산 서열에 의해 암호화된 폴리펩타이드
로 이루어진 그룹으로부터 선택된 폴리펩타이드를 암호화한다.
바람직하게는, FPP 신타제는 디메틸알릴트랜스퍼라제 활성 및/또는 게라닐게라닐 디포스페이트 신타제 활성, 보다 바람직하게는 디메틸알릴트랜스퍼라제 활성 및 게라닐게라닐 디포스페이트 신타제 활성을 더 나타낸다.
제3 국면에서, 본 발명은, 서열 번호 52의 222번 위치에 상응하는 위치에서의 아스파라긴 및/또는 서열 번호 52의 244번 위치에 상응하는 위치에서의 시스테인을 포함하는 돌연변이 된 DXP 신타제, 바람직하게는 서열 번호 52의 244번 위치에 상응하는 위치에서 시스테인을 포함하는 돌연변이 된 DXP 신타제를 포함하는 재조합 데이노코쿠스 박테리아에 관한 것이다. 특히, 재조합 데이노코쿠스 박테리아는 디. 라디오푸그난스(D. radiopugnans)로부터의 DXP 신타제의 R244C 돌연변이를 암호화하는 유전자(서열 번호 8), 디. 윤웨이엔시스(D. yunweiensis)로부터의 DXP 신타제의 R238C 돌연변이를 암호화하는 유전자(서열 번호 14), 및/또는 디. 게오테르말리스(D. geothermalis)로부터의 DXP 신타제의 R241C 돌연변이를 암호화하는 유전자(서열 번호 56)를 발현할 수 있다.
제4 국면에서, 본 발명은 이종 테르펜 신타제, 바람직하게는 게라니올 신타제 또는 (+)-에피-알파-비스알볼올 신타제를 암호화하는 유전자를 발현하는 재조합 데이노코쿠스 박테리아에 관한 것이다.
제5 국면에서, 본 발명은 내인성 라이코펜 베타-사이클라제 활성이 감소되거나 억제되는 재조합 데이노코쿠스 박테리아에 관한 것이다.
추가의 국면에서, 본 발명은 이소프레노이드, 바람직하게는 모노테르펜, 디테르펜, 트리테르펜, 세스퀴테르펜 또는 카로테노이드, 보다 바람직하게는 세스퀴테르펜 또는 카로테노이드를 생산하기 위한 본 발명의 재조합 데이노코쿠스 박테리아의 용도에 관한 것이다. 하나의 구현예에서, 이소프레노이드는 게라니올, 게란산 및/또는 라이코펜이다. 특정의 구현예에서, 이소프레노이드는 카로테노이드, 바람직하게는 라이코펜, 또는 라이코펜으로부터 유도된 다른 카로테노이드 화합물, 특히 디이녹산틴(deinoxanthione)이다. 본 발명은, 또한, (i) 이소프레노이드를 생산하기에 적합한 조건하에서 본 발명에 따른 재조합 데이노코쿠스 박테리아를 배양하여 이소프레노이드를 생산하는 단계, 및 임의로 (ii) 이소프레노이드를 회수하는 단계,를 포함하는, 이소프레노이드를 생산하는 방법에 관한 것이다. 바람직하게는, 이소프레노이드는 모노테르펜, 디테르펜, 트리테르펜, 세스퀴테르펜 또는 카로테노이드, 보다 바람직하게는 세스퀴테르펜 또는 카로테노이드이다. 일 구현예에서, 이소프레노이드는 게라니올, 게란산 및 라이코펜으로 이루어진 그룹으로부터 선택된다.
다른 국면에서, 본 발명은 게라닐 에스테르를 생산하기 위한 본 발명의 재조합 데이노코쿠스 박테리아의 용도에 관한 것이다. 본 발명은 또한 (i) 게라니올 및/또는 게란산을 생산하기에 적합한 조건하에서 본 발명에 따른 재조합 데이노코쿠스 박테리아를 배양하는 단계, (ii) 게라니올 및/또는 게란산을 회수하는 단계, 및 (iii) 게라니올 및/또는 게란산을 게라닐 에스테르로 전환시키는 단계, 및 임의로 (iv) 게라닐 에스테르를 회수하는 단계를 포함하는, 게라닐 에스테르를 생산하기 위한 방법에 관한 것이다. 바람직하게는, 게라닐 에스테르는 게라닐 이소부티레이트 또는 트랜스-게라닐 아세테이트이다.
다른 국면에서, 본 발명은 다마스콘, 다마스세논 및/또는 이오논을 생산하기 위한 본 발명의 재조합 데이노코쿠스 박테리아의 용도에 관한 것이다. 본 발명은 또한 (i) 게라니올 및/또는 게란산을 생산하기에 적합한 조건 하에서 본 발명에 따른 재조합 데이노코쿠스 박테리아를 배양하는 단계, (ii) 게라니올 및/또는 게란산을 회수하는 단계, 및 (iii) 게라니올 및/또는 게란산을 다마스콘, 다마스세논 및/또는 이오논으로 전환시키는 단계, 및 임의로 (iv) 다마스콘, 다마스세논 및/또는 이오논을 회수하는 단계를 포함하여, 다마스콘, 다마스세논 및/또는 이오논을 생산하는 방법에 관한 것이다.
발명의 상세한 설명
전술된 바와 같이, 본 발명은 이소프레노이드의 증진된 생산을 나타내기 위해 유전적으로 변형된 데이노코쿠스 박테리아에 관한 것이다.
특히, 본 출원은 데이노코쿠스 박테리아의 MEP 경로가 IPP 및 DMAPP에 대한 탄소 플럭스(carbon flux)를 증가시킬 수 있도록 가공될 (engineered) 수 있음을 보여준다. 실제로, 본 발명자들은 복수의 속도-제한 효소(rate-limiting enzyme)를 확인하였고 이들 효소가 유전적으로 가공되거나 과발현될 수 있음을 입증하였다. 이들은 이러한 재조합 박테리아에서 이소프레노이드 생산이 유의적으로 증가하였음을 확인하였다.
또한, 본 발명자들은 본원에서 데이노코쿠스 박테리아에서 이소프레노이드의 생산을 조절하여 목적한 화합물의 생산 및/또는 축적을 촉진할 수 있음을 입증하였다. 이와 관련하여, 이들은 FPP 신타제를 확인하고 과발현하였으며 이러한 과발현이 디테르펜, 트리테르펜, 세스퀴테르펜, 및 카로테노이드와 같은 10개 이상의 C-탄소 원자를 갖는 이소프레노이드의 생산을 촉진함을 입증하였다. 이들은 또한 내인성 라이코펜 베타-사이클라제가 라이코펜의 과발현을 유도함을 입증하였다.
최종적으로, 본 출원은, 데이노코쿠스 박테리아, 및 특히 상기 기술한 바와 같은 재조합 데이노코쿠스 박테리아를 효율적으로 사용하여, 이종 테르펜 신타제의 발현을 통한 이종 이소프레노이드 화합물을 생산할 수 있음을 보여준다.
정의
본 발명의 내용에서, 용어 "데이노코쿠스(Deinococcus)"는 데이노코쿠스의 야생형 또는 천연 변이체 균주, 예를 들면, 가속화된 진화, 돌연변이유발, DNA-셔플링 기술(DNA-shuffling technology)에 의해 수득 된 균주, 또는 진핵, 원핵 및/또는 합성 핵산(들)의 삽입에 의해 수득 된 재조합 균주를 포함한다. 데이노코쿠스 박테리아는 데이노코쿠스 속의 임의의 박테리아, 예를 들면, 디. 게오테르말리스, 디. 셀룰롤리시티쿠스(D. cellulolysiticus), 디. 라디오두란스, 디. 프로테올라이티쿠스(D. proteolyticus), 디. 라디오푸그난스, 디. 라디오필루스(D. radiophilus), 디. 그란디스(D. grandis), 디. 인디쿠스(D. indicus), 디. 프리겐스(D. frigens), 디. 삭시콜라(D. saxicola), 디. 마리코펜시스(D. maricopensis), 디. 마르모리스(D. marmoris), 디. 데세르티(D. deserti), 디. 무라이(D. murrayi), 디. 아에리우스(D. aerius), 디. 아에롤라투스(D. aerolatus), 디. 아에로필루스(D. aerophilus), 디. 아에테리우스(D. aetherius), 디. 알피니툰드라에(D. alpinitundrae), 디. 알티투디니스(D. altitudinis), 디. 안타르티쿠스(D. antarticus), 디. 아파켄시스(D. apachensis), 디. 아쿠아티쿠스(D. aquaticus), 디. 아쿠아틸리스(D. aquatilis), 디. 아퀴라디오콜라(D. aquiradiocola), 디. 아퀴비부스(D. aquivivus), 디. 카에니(D. caeni), 디. 시트리(D. citri), 디. 클라우디오니스(D. claudionis), 디. 다에제오넨시스(D. daejeonensis), 디. 데폴리메란스(D. depolymerans), 디. 엔클렌시스(D. enclensis), 디. 피쿠스(D. ficus), 디. 고비엔시스(D. gobiensis), 디. 구안그리엔시스(D. guangriensis), 디. 구이헤멘시스(D. guilhemensis), 디. 호호카멘시스(D. hohokamensis), 디. 호피엔시스(D. hopiensis), 디. 후미(D. humi), 디. 미사센시스(D. misasensis), 디. 나바조넨시스(D. navajonensis), 디. 파라고넨시스(D. papagonensis), 디. 페라리딜리토리스(D. peraridilitoris), 디. 포에니시스(D. phoenicis), 디. 피멘시스(D. pimensis), 디. 피스시스(D. piscis), 디. 푸니세우스(D. puniceus), 디. 라디오몰리스(D. radiomollis), 디. 라디오레시스텐스(D. radioresistens), 디. 라디오톨레란스(D. radiotolerans), 디. 레티쿨리테르미티스(D. reticulitermitis), 디. 로세우스(D. roseus), 디. 사라리엔스(D. sahariens), 디. 솔리(D. soli), 디. 소노렌시스(D. sonorensis), 디. 스웬시스(D. swuensis), 디. 울루무퀴엔시스(D. wulumuqiensis), 디. 크시베리엔시스(D. xibeiensis), 디. 크신지안겐시스(D. xinjiangensis), 디. 야바파이엔시스(D. yavapaiensis) 또는 디. 윤웨이엔시스 박테리아, 또는 이의 임의의 조합을 나타낼 수 있으나, 이에 한정되지 않는다. 바람직하게는, 용어 "데이노코쿠스"는 디. 게오테르말리스, 디. 라디오쿠그난서, 디. 윤웨이엔시스 및 디. 무라이를 말한다. 일부 구현예에서, 용어 "데이노코쿠스"는 바람직하게는 디. 그란디스, 디. 라디오두란스, 디. 라이오푸그난스, 디. 윤웨이엔시스 및 디. 아퀴아티쿠스로부터 선택된 중온성 데이노코쿠스 박테리아를 말한다. 일부 다른 구현예에서, 용어 "데이노코쿠스"는 바람직하게는 디. 게오테르말리스, 디. 무라이이 및 디. 마리코펜시스로부터 선택된 내열성 데이노코쿠스 박테리아를 말한다. 바람직한 구현예에서, 용어 "데이노코쿠스"는 디. 게오테르말리스, 디. 무라이이, 디. 마리코펜시스, 디. 그란디스, 디. 라디오두란스, 디. 라디오푸그난스, 디. 윤웨이엔시스 및 디. 아쿠아티쿠스로부터 선택된 내열성 데이노코쿠스 박테리아를 말한다. 보다 바람직하게는, 용어 "데이노코쿠스"는 디. 게오테르말리스를 말한다.
용어 "재조합 박테리아(recombinant bacterium)" 또는 "유전적으로 변형된 박테리아(genetically modified bacterium)"은 천연에서 발견되지 않고 유전 성분의 결실, 삽입 또는 변형의 결과로서 변형된 게놈을 함유하는 박테리아를 나타낸다. 따라서, "재조합 핵산(recombinant nucleic acid)"은 가공되어 야생형 박테리아 에서는 자체로 발견되지 않는 핵산을 나타낸다.
용어 "유전자"는 단백질을 암호화하는 임의의 핵산도 나타낸다. 용어 유전자는 DNA, 예를 들면, cDNA 또는 gDNA, 및 또한 RNA를 포함한다. 상기 유전자는 예를 들면, 재조합, 효소 및/또는 화학 기술에 의해 우선 제조될 수 있으며, 후속적으로 숙주 세포 또는 시험관내(in vitro) 시스템에서 복제된다. 유전자는 전형적으로 목적한 단백질을 암호화하는 개방 판독 프레임을 포함한다. 유전자는 전사 종결인자 또는 시그날 펩타이드와 같은 추가의 서열을 함유할 수 있다.
용어 "발현 카세트"는 암호화 영역, 즉, 유전자, 및 작동적으로 연결된, 즉 하나 이상의 조절 서열을 포함하는 조절 영역를 포함하는 핵산 작제물을 나타낸다. 바람직하게는, 조절 서열은 데이노코쿠스 숙주 세포에 적합하다.
본원에 사용된 것으로서, 용어 "발현 벡터"는 발현 카세트(expression cassette)를 포함하는 DNA 또는 RNA 분자를 의미한다. 바람직하게는, 상기 발현 벡터는 선형 또는 환형 이본쇄 DNA 분자이다.
용어 "작동적으로 연결된(operably linked)"은, 조절 서열이 암호화 서열에 대해 적절한 위치에 위치함으로써, 조절 서열이 암호화 서열의 발현을 지시하는 구조를 의미한다.
용어 "조절 서열(control sequence)"은 유전자의 발현에 필수적인 핵산 서열을 의미한다. 조절 서열은 천연, 동종 또는 이종일 수 있다. 당해 분야의 숙련가에게 잘-알려지고 현재 사용되는 조절 서열이 바람직할 것이다. 이러한 조절 서열은 리더(leader), 폴리아데닐화 서열, 프로펩타이드 서열, 프로모터, 시그날 펩타이드 서열(signal peptide sequence), 및 전사 터미네이터를 포함하나, 이에 한정되지 않는다. 바람직하게는, 조절 서열은 프로모터 및 전사 터미네이터를 포함한다.
본원에 사용된 것으로서, 용어 "천연의(native)"는 변형되지 않은 데이노코쿠스 박테리아로부터 또는 동일한 종의 데이노코쿠스 박테리아로부터의 유전 성분 또는 단백질을 말한다. 용어 "동종(homologous)"은 재조합 데이노코쿠스 박테리아 이외의 다른 종의 데이노코쿠스 박테리아로부터의 유전 성분 또는 단백질을 말한다. 용어 "이종(heterologous)"은 박테리아, 미생물, 식물, 바이러스 등과 같은 비 데이노코쿠스 기원의 유전 성분 또는 단백질을 말한다. 용어 "천연의", "동종" 또는 "이종"은 야생형 또는 돌연변이 된 유전 성분 또는 단백질을 말할 수 있다. 일부 구현예에서, 이들 용어는 본 발명의 재조합 박테리아 내에 도입되거나 발현되기 전에 예를 들면, 돌연변이유발에 의해 변형되어 예를 들면 암호화된 단백질의 1개 또는 복수의 특성(예를 들면, 향상된 활성, 안전성 등)이 개선된다.
본원에 사용된 것으로서, 용어 "과발현(overexpression)", "향상된 발현(enhanced expression)" 및 "발현을 증가시키는(increase expression)"은 상호교환적으로 사용되며 유전자 또는 효소의 발현이 변형되지 않은 박테리아, 예를 들면, 유전적으로 변형되지 않는 야생형 박테리아 또는 상응하는 박테리아과 비교하여 증가되어 MEP/DXP 경로를 향상시킴을 의미한다. 효소의 증가된 발현은 일반적으로 상기 효소를 암호화하는 유전자의 발현을 증가시킴으로써 수득된다. 유전자 또는 효소, 즉, 동종 또는 이종 유전자 또는 효소가 본 발명의 박테리아에 천연적으로 존재하지 않는 구현예에서, 용어 "과발현" 및 '발현"은 상호교환적으로 사용될 수 있다.
본원에 사용된 것으로서, 용어 "MEP 경로", "MEP/DXP 경로", "비-메발로네이트 경로" 또는 "2-C-메틸-D-에리트리톨 4-포스페이트/1-데옥시-D-크실룰로즈 5-포스페이트 경로"는 피루베이트 및 D-글리세르알데하이드 3-포스페이트의 1-데옥시-D-크실룰로즈 5-포스페이트(DXP)로의 농축(condensation)으로부터 IPP 및 DMAPP의 형성을 가져오는 생합성 경로를 말한다. 당해 경로는 다음의 효소를 포함한다: 1-데옥시-D-크실룰로즈 5-포스페이트 신타제(EC 2.2.1.7), 1-데옥시-D-크실룰로즈 5-포스페이트 리덕토이소머라제(EC 1.1.1.267), 2-C-메틸-D-에리트리톨 4-포스페이트 사이티딜릴트랜스퍼라제(EC 2.7.7.60), 4-디포스포사이티딜-2-C-메틸-D-에리트리톨 키나제(EC 2.7.1.148), 2-C-메틸-D-에리트리톨 2,4-사이클로디포스페이트 신타제(EC 4.6.1.12), 4-하이드록시-3-메틸부트-2-엔-1-일 디포스페이트 신타제(EC 1.17.7.1), 4-하이드록시-3-메틸부트-2-에닐 디포스페이트 리덕타제(EC 1.17.1.2), 및 이소펜테닐-디포스페이트 델타-이소머라제(EC 5.3.3.2).
용어 "이소프레노이드(isoprenoid)," "이소프레노이드 화합물(isoprenoid compound)" "테르펜(terpene)", "테르펜 화합물(terpene compound)", "테르페노이드(terpenoid)" 및 "테르페노이드 화합물(terpenoid compound)"은 본원에서 상호교환적으로 사용되며, IPP로부터 기원할 수 있는 임의의 화합물을 말한다. 이소프레노이드에 존재하는 C-원자의 수는 5에 의해(예를 들면, C5, C10, C15, C20, C25, C30 및 C40), 전형적으로 박테리아일하게 다양할 수 있다. 불균일한 이소프레노이드 및 폴리테르펜이 보고되어 있으며, 또한 "이소프레노이드"의 정의에 포함된다. 이소프레노이드 화합물은 모노테르펜, 디테르펜, 트리테르펜, 세스퀴테르펜, 및 카로테노이드를 포함하나, 이에 한정되지 않는다.
용어 테르펜 신타제(terpene synthase)는 하나 또는 복수의 전구체로부터, 특히 게라닐 디포스페이트(GPP), 파르네실 디포스페이트(FPP), 게라닐게라닐 디포스페이트(GGPP), 및 이들 2개 이상의 임의의 조합으로부터 모노테르펜, 세스퀴테르펜, 디테르펜, 트리테르펜 또는 카로테노이드와 같은 이소프레노이드 화합물을 합성할 수 있는 효소, 복합체, 및/또는 그룹을 포함한다. 이러한 테르펜 신타제의 예는 모노테르펜 신타제, 디테르펜 신타제, 및 세스퀴테르펜 신타제를 포함하나, 이에 한정되지 않는다.
용어 "피로포스페이트(pyrophosphate)"는 본원에서 "디포스페이트"와 상호교환적으로 사용된다.
용어 "DXS", "DXP 신타제" 또는 "DXPS"는 피루베이트 및 D-글리세르알데하이드 3-포스페이트의 축합의 1-데옥시-D-크실룰로즈 5-포스페이트(DXP)로의 촉매하는 dxs 유전자에 의해 암호화된 효소 1-데옥시-D-크실룰로즈 5- 포스페이트 신타제(EC 2.2.1.7)를 말한다. 유전자 생성물, "DXP 신타제", "DXS" 또는 "DXPS"의 명칭은 본 출원에서 상호교환적으로 사용된다. DXP 신타제 활성은 문헌(Lois et al.(1998))에 기술된 바와 같이 방사선표지된 기질을 사용하거나 또는 숙련가에게 공지된 임의의 다른 방법에 의해 측정될 수 있다.
용어 "DXP 리덕토이소머라제(reductoisomerase)" 또는 "IspC" 또는 "DXR"은 DXP의 2-C-메틸-D-에리트리톨-4-포스페이트(MEP)로의 동시 환원 및 이성체화를 촉매하는 dxr 또는 ispC 유전자에 의해 암호화된 효소 1-데옥시-D-크실룰로즈 5-포스페이트 리덕토이소머라제(EC 1.1.1.267)를 말한다. 유전자의 명칭, dxr 또는 ispC는 본 출원에서 상호교환적으로 사용된다. 유전자 생성물의 명칭, DXP 리덕토이소머라제 또는 IspC는 본 출원에서 상호교환적으로 사용된다.
용어 "MCT" 또는 "IspD" 또는 "CMS"는 CTP(사이티딘 트리포스페이트) 및 2-C-메틸-D-에리트리톨 4-포스페이트(MEP)로부터 4-디포스포사이티딜-2-C-메틸-D-에리트리톨(또한 4-(사이티딜 5'-디포스포)-2-C-메틸-D-에리트리톨(CDP-ME)로 명명됨)의 형성을 촉매하는 ispD 유전자에 의해 암호화된 효소 2-C-메틸-D-에리트리톨 4-포스페이트 사이티딜릴트랜스퍼라제(EC 2.7.7.60)를 말한다. 유전자 생성물의 명칭, MCT, CMS 또는 IspD는 본 출원에서 상호교환적으로 사용된다.
용어 "CMK" 또는 "IspE"는 4-디포스포사이티딜-2C-메틸-D-에리트리톨(CDP-ME)의 4-디포스포사이티딜-2C-메틸-D-에리트리톨-2-포스페이트(또한 4-(사이티딘 5'-디포스포)-2-C-메틸-D-에리트리톨 2-포스페이트(CDP-MEP))로의 ATP-의존성 포스포릴화를 촉매하는 ispE 유전자에 의해 암호화된, 또한 4-(사이티딘 5'-디포스포)-2-C-메틸-D-에리트리톨 키나제(EC 2.7.1.148)로 명명된 효소 4-디포스포사이티딜-2-C-메틸-D-에리트리톨 키나제를 말한다. 유전자 생성물, CMK 또는 IspE의 명칭은 본 출원에서 상호교환적으로 사용된다.
용어 "IspF", "MECDP-신타제", "MECPP-신타제" 또는 "MECPS" 또는 "MCS"는 사이티딘 5-모노포스페이트(CMP)의 방출과 함께 4-디포스포사이티딜-2-C-메틸-D-에리트리톨 2-포스페이트(CDP-MEP)의 2-C-메틸-D-에리트리톨 2,4-사이클로디포스페이트(ME-CPP 또는 cMEPP)로의 전환을 촉매하는 ispF 유전자에 의해 암호화된 효소 2-C-메틸-D-에리트리톨 2,4-사이클로디포스페이트 신타제(EC 4.6.1.12)를 말한다. 유전자 생성물, IspF, MECDP-신타제, MECPP-신타제, MCS 또는 MECPS의 명칭은 본 출원에서 상호교환적으로 사용된다.
용어 "IspG" 또는 "HDS"는 2C-메틸-D-에리트리톨 2,4-사이클로디포스페이트(cMEPP)의 1-하이드록시-2-메틸-2-(E)-부테닐 4-디포스페이트(HMBPP)로의 전환에 관여하는 ispG 유전자에 의해 암호화된 효소 4-하이드록시-3-메틸부트-2-엔-1-일 디포스페이트 신타제(EC 1.17.7.1)를 말한다.
용어 "IspH" 또는 "IDS"는 또한 1-하이드록시-2-메틸-2-(E)-부테닐 4-디포스페이트(HMBPP)를 이소펜테닐 디포스페이트(IPP) 및 디메틸알릴 디포스페이트(DMAPP)로 전환시키는 ispH 유전자에 의해 암호화된 하이드록시메틸부테닐 피로포스페이트 리덕타제(EC 1.17.1.2)로 명명된, 효소 4-하이드록시-3-메틸부트-2-에닐 디포스페이트 리덕타제를 말한다.
용어 "IDI", "IPP 이소머라제" 또는 "이소펜테닐 포스페이트 이소머라제"는 호모알릴성 기질 이소펜테닐(IPP)의 이의 알릴성 이성체, 디메틸알릴 디포스페이트(DMAPP)로의 1,3-알릴성 재배열을 촉매하는 fni 또는 idi 유전자에 의해 암호화된 효소 이소펜테닐-디포스페이트 델타-이소머라제(EC 5.3.3.2)를 말한다. 유전자, fni 또는 idi의 명칭은 본 출원에서 상호교환적으로 사용된다.
용어 "메발로네이트 경로" 또는 "MEV 경로"는 아세틸-CoA를 IPP로 전환시키는 생합성 경로를 말하기 위해 본원에서 사용된다. 메발로네이트 경로는: (a) 아세틸-CoA의 2개 분자를 아세틸-CoA C-아세틸트랜스퍼라제(EC 2.3.1.9)의 작용에 의해 아세토아세틸-CoA로 농축시키는 단계; (b) 아세토아세틸-CoA를 아세틸-CoA와 축합시켜 하이드록시메틸글루타릴-CoA 신타제(EC 2.3.3.10)의 작용에 의해 하이드록시메틸글루타릴-Co효소A(HMG-CoA)를 형성시키는 단계; (c) HMG-CoA를 하이드록시메틸글루타릴-CoA 리덕타제(NADPH)(EC 1.1.1.34)의 작용에 의해 메발로네이트로 전환시키는 단계; (d) 메발로네이트를 메발로네이트 키나제(EC 2.7.1.36)의 작용에 의해 메발로네이트 5-포스페이트로 포스포릴화시키는 단계; (e) 메발로네이트 5-포스페이트를 포스포메발로네이트 키나제(EC 2.7.4.2)의 작용에 의해 메발로네이트 5-피로포스페이트로 전환시키는 단계; 및 (f) 메발로네이트 5-피로포스페이트를 디포스포메발로네이트 데카복실라제(EC 4.1.1.33)의 작용에 의해 이소펜테닐 피로포스페이트로 전환시키는 단계를 촉매하는 효소를 포함한다.
용어 "IspA", "FDPS", "FPPS" 또는 "FPP 신타제"는 이소펜테닐 피로포스페이트(IPP)와 알릴성 피로포스페이트, 디메틸알릴 피로포스페이트(DMAPP), 및 이어서 수득되는 게라닐피로포스페이트(GPP)를 최종 생성물인 파르네실 피로포스페이트(FPP)로의 연속적인 축합을 촉매하는 ispA 유전자에 의해 암호화된 효소 파르네실 디포스페이트 신타제(EC 2.5.1.10, 2.5.1.1)를 말한다. 임의로, 및 바람직한 구현예에서, 당해 효소는 또한 게라닐게라닐 디포스페이트 신타제 활성(2.5.1.29)을 나타낼 수 있다. 유전자 생성물, IspA, FDPS, FPPS 또는 FPP 신타제의 명칭은 본 출원에서 상호교환적으로 사용된다.
용어 "이소프렌 신타제"는 디메틸알릴 디포스페이트(EC 4.2.3.27)로부터 이소프렌의 형성을 촉매하는 효소를 말한다.
유기체에 따라서, 상기 확인된 효소의 학명 및 암호화된 유전자는 다양할 수 있다. 그러나, 명확성을 보장하기 위해, 본 명세서에서, 이들 용어는 효소 또는 유전자의 기원으로부터 독립적으로 사용된다.
본원에 사용된 것으로서, 용어 효소의 "활성"은 이의 작용을 말하며 본 발명의 내용에서 효소에 의해 촉매된 반응을 나타낸다. 효소 활성은 숙련가에게 공지된 임의의 방법으로도 측정될 수 있다.
본원에 사용된 것으로서, 용어 효소의 "증가된 활성" 또는 "향상된 활성" 또는 "증진된 활성"은 증가된 특이적인 효소 활성, 기질에 대한 증가된 특이성, 증가된 단백질 또는 RNA 안전성 및/또는 효소의 증가된 세포내 농도를 말한다. 바람직하게는, 증가된 활성은 상기 효소를 암호화는 유전자를 과발현시킴으로써 수득된 효소의 증가된 세포내 농도이다.
본원에 사용된 것으로서, 용어 "아포카로테노이드"는 카로테노이드 절단 디옥시게나제(CCD)에 의해 촉매된 산화성 절단에 의해 카로테노이드로부터 기원한 유기 화합물을 말한다. 아포카로테노이드 중 일부는 식용 식물에서 색상, 풍미, 및 방향(aroma)의 필수적이고 가치있는 성분이다. 아포카로테노이드의 예는 베타-이오논, 알파-이오논, 게라닐아세톤, 슈도이오논 및 베타-다마스세논을 포함하나, 이에 한정되지 않는다.
본원에 사용된 것으로서, 용어 "서열 상동성" 또는 "상동성"은 2개의 폴리펩타이드 서열의 정렬로부터 위치내 일치(동일한 아미노산 잔기)의 수(%)를 말한다. 서열 상동성은 서열 갭(sequence gap)을 최소화하면서, 오버랩(overlap)을 극대화하고 확인하기 위해 정렬되는 경우 서열을 비교함으로써 측정된다. 특히, 서열 상동성은 2개의 서열의 길이에 따라서, 다수의 수학적인 전반적인 또는 국소 알고리즘을 사용하여 측정할 수 있다. 유사한 길이의 서열은 바람직하게는 전체 길이에 걸쳐 최적으로 서열을 정렬하는 전반적인 정렬 알고리즘(예를 들면, Needleman and Wunsch algorithm; Needleman and Wunsch, 1970)을 사용하여 정렬되지만, 실질적으로 상이한 길이의 서열은 바람직하게는 국소 정렬 알고리즘(예를 들면, Smith and Waterman algorithm(Smith and Waterman, 1981) 또는 알츠출(Altschul) 알고리즘(Altschul et al., 1997; Altschul et al., 2005))을 사용하여 정렬한다. 아미노산 서열 상동성 퍼센트를 측정하는 목적을 위한 정렬은 당해 분야의 기술내에 있는 다양한 방법, 예를 들면, http://blast.ncbi.nlm.nih.gov/ 또는 http://www.ebi.ac.uk/Tools/emboss/와 같은 인터넷 웹사이트에서 이용가능한 공공 이용가능한 컴퓨터 소프트웨어를 사용하여 달성할 수 있다. 당해 분야의 숙련가는 비교하는 서열의 전체 길이에 걸쳐 최대 정렬을 달성하는데 요구되는 임의의 알고리즘도 포함하는, 알고리즘을 측정하기 위한 적절한 매개변수를 측정할 수 있다. 본원의 목적을 위해, 아미노산 서열 상동성% 값은 Needleman-Wunsch 알고리즘을 사용하여 2개의 서열의 최적의 전반적인 정렬을 생성하는 쌍식 서열 정렬 프로그램(pair wise sequence alignment program) EMBOSS Needle을 사용하여 생성된 값을 말하며, 여기서 모든 조사 매개변수는 디폴트 값(default value), 즉, 분류 매트릭스 = BLOSUM62, 갭 오픈(Gap open) = 10, 갭 확장(Gap extend) = 0.5, 말단 갭 패널티(End gap penalty) = 거짓, 말단 갭 오픈(End gap open) = 10 및 말단 갭 확장(End gap extend) = 0.5로 설정된다.
MEP 경로의 유전적 가공
MEP 경로에 관여하는 효소 중에서, 본 발명자들은 속도-제한 효소를 확인하고 이들의 과발현이 이소프레노이드 생산에 있어서 유의적인 증가를 생성함을 입증하였다.
따라서, 제1 국면에서, 본 발명은 향상된 2-C-메틸-D-에리트리톨 4-포스페이트/1-데옥시-D-크실룰로즈 5-포스페이트(MEP/DXP) 경로를 나타내는 재조합 데이노코쿠스 박테리아, 즉, 변형되지 않은 데이노코쿠스 박테리아과 비교하여 IPP 및 DMAPP로의 증가된 탄소 플럭스를 갖도록 유전적으로 변형된 데이노코쿠스 박테리아에 관한 것이다.
본 발명의 재조합 데이노코쿠스 박테리아에서, DXS, DXR, IspD, IspE, IspF, IspG, IspH 및 IPP 이소머라제로 이루어진 그룹으로부터 선택된 적어도 하나의 효소의 활성은 변형되지 않은 박테리아과 비교하여 증가된다. 바람직하게는, 이들 활성 중 적어도 2개, 3개, 4개, 5개, 6개 또는 7개가 증가된다. 보다 바람직하게는, 이들 활성 모두가 증가된다.
이들 효소의 활성은 이들의 암호화 유전자의 과발현으로 인해 증가될 수 있다. 따라서, 일 구현예에서, dxs, dxr, ispD, ispE, ispF, ispG, ispH a및 idi 유전자로 이루어진 그룹으로부터 선택된 적어도 하나의 유전자가 과발현된다. 바람직하게는, 이들 유전자의 적어도 2개, 3개, 4개, 5개, 6개 또는 7개가 위에서 언급한 바와 같다. 보다 바람직하게는, 이들 유전자 모두가 과발현된다.
유전자의 발현을 증가시키기 위하여, 숙련가는 상응하는 전령 RNA를 안정화시키거나 리보소옴 결합 부위(Ribosome Binding Site: RBS) 서열 및 이들을 둘러싸고 있는 서열을 변형시키는 요소를 사용하여, 유전자의 고 수준의 발현을 유도하는 프로모터, 즉, 강력한 프로모터를 사용하여 박테리아내에서 유전자의 카피 수를 증가시키는 것과 같은 임의의 공지된 기술을 사용할 수 있다.
일 구현예에서, 상기 과발현은 박테리아내에서 유전자의 카피 수를 증가시킴으로써 수득된다. 1개 또는 수개의 유전자의 카피를 유전자 치환을 포함하는, 당해 분야의 숙련가에게 공지된, 재조합의 방법으로 게놈내에 도입할 수 있다. 바람직하게는, 상기 유전자를 포함하는 발현 카세트는 게놈내로 통합된다.
또한, 상기 유전자는 목적한 유전자를 지닌 발현 카세트를 포함하는 발현 벡터, 바람직하게는 플라스미드에 의해 운반될 수 있다. 상기 발현 벡터는 복제 기원의 특성에 따라서 박테리아내에 1 내지 5개, 20개, 100개 또는 500개의 카피로 존재할 수 있다.
다른 구현예에서, 상기 유전자의 과발현은 유전자의 고 수준의 발현을 유도하는 프로모터를 사용함으로써 수득된다. 예를 들면, 내인성 유전자의 프로모터는 강력한 프로모터, 즉, 고 수준의 발현을 유도하는 프로모터로 대체될 수 있다. 본 발명에 사용되기에 적합한 프로모터는 숙련가에게 공지되어 있으며 구성적이거나 유도성이며, 천연의, 동종 또는 이종일 수 있다.
본 발명에 유용한 발현 카세트는 상기 유전자의 발현을 지시하는, 전형적으로 전사 프로모터 및 전사 터미네이터를 포함하는, 하나 이상의 조절 서열에 작동적으로 연결된 dxs, dxr, ispD, ispE, ispF, ispG, ispH idi 유전자로 이루어진 그룹으로부터 선택된 적어도 하나의 유전자를 포함한다. 바람직하게는, 각각의 발현 카세트는 하나 이상의 조절 서열에 작동적으로 연결된 단지 하나의 유전자를 포함한다. 이 경우에, 수개의 유전자가 과발현되는 경우, 수개의 발현 카세트가 사용되며, 이들 각각은 단지 하나의 유전자를 포함한다. 또한, 본 발명에 유용한 발현 카세트는 (i) dxs, dxr, ispD, ispE, ispF, ispG, ispH idi 유전자로부터 선택된 적어도 2개의 유전자, 또는 (ii) dxs, dxr, ispD, ispE, ispF, ispG, ispH idi 유전자로부터 선택된 적어도 하나의 유전자, 및 적어도 다른 유전자, 예를 들면, 테르펜 신타제 또는 FPP 신타제를 암호화하는 유전자를 포함하는 오페론을 포함할 수 있다.
조절 서열은 숙주 세포에 의해 인식되는 프로모터를 포함할 수 있다. 당해 프로모터는 효소의 발현을 매개하는 전사 조절 서열을 함유한다. 상기 프로모터는 데이노코쿠스 박테리아 속에서 전사 활성을 나타내는 임의의 폴리뉴클레오타이드일 수 있다. 상기 프로모터는 천연의, 동종 또는 이종 프로모터일 수 있다. 바람직한 프로모터는 천연 또는 동종이다. 이와 관련하여, 다양한 프로모터가 연구되어 왔으며 데이노코쿠스 박테리아에서 유전자 발현을 위해 사용된다. 적합한 프로모터의 예는 해독 연장 인자 Tu 유전자 tufA(DR0309) 및 tufB(DR2050)로부터의 PtufA 및 PtufB 프로모터, pI3에 위치하는 resU 유전자의 프로모터, groESL 오페론의 프로모터 영역 PgroESL(Lecointe et al, 2004; Meima et al, 2001), 또는 이러한 프로모터의 유도체를 포함한다. 바람직하게는, 상기 프로모터는 강력한 구성적(constitutive) 프로모터이다.
조절 서열은 또한 전사 터미네이터일 수 있으며, 이는 데이노코쿠스 박테리아에 의해 인식되어 전사를 종결한다. 터미네이터는 유전자의 3'-말단에 작동적으로(operably) 연결된다. 예를 들면, Lecointe et al(2004)에 기술된 터미네이터 term116과 같은 데이노코쿠스 박테리아에서 작용성인 임의의 터미네이터도 본 발명에 사용될 수 있다.
임의로, 상기 발현 카세트는 또한 재조합 박테리아의 용이한 선택을 허용하는 선택가능한 마커를 포함할 수 있다. 일반적으로, 선택가능한 마커는 항생제 내성을 암호화하거나 자가 영양을 부여하는 유전자이다.
특정의 구현예에서, 본 발명의 재조합 데이노코쿠스 박테리아는: 강력한 구성적 프로모터에 작동적으로 연결된 dxs 유전자를 포함하는 발현 카세트; 강력한 구성적 프로모터에 작동적으로 연결된 dxr 유전자를 포함하는 발현 카세트; 강력한 구성적 프로모터에 작동적으로 연결된 ispD 유전자를 포함하는 발현 카세트; 강력한 구성적 프로모터에 작동적으로 연결된 ispE 유전자를 포함하는 발현 카세트; 강력한 구성적 프로모터에 작동적으로 연결된 ispF 유전자포함하는 발현 카세트; 강력한 구성적 프로모터에 작동적으로 연결된 ispG 유전자를 포함하는 발현 카세트; 강력한 구성적 프로모터에 작동적으로 연결된 ispH 유전자를 포함하는 발현 카세트; 및/또는 강력한 구성적 프로모터에 작동적으로 연결된 idi 유전자를 포함하는 발현 카세트를 포함한다.
이들 발현 카세트는 박테리아의 게놈내로 통합될 수 있고/있거나 발현 벡터내로 에피소말(episomal) 형태로 유지될 수 있다. 바람직하게는, 발현 카세트는 박테리아의 게놈내로 통합될 수 있다. 본 발명의 박테리아는 (i) dxs(a), dxr(b), ispD(c), ispE(d), ispF(e), ispG(f), ispH(g) 또는 idi(h) 유전자; (ii) 다음의 2개의 유전자의 조합 중의 하나: a, b; a, c; a, d; a, e; a, f; a, g; a, h; b, c; b, d; b, e; b, f; b, g; b, h; c, d; c, e; c, f; c, g; c, h; d, e; d, f; d, g; d, h; e, f; e, g; e, h; f, g; f, h 및 g, h; (iii) 다음의 3개의 유전자의 조합 중의 하나: a, b, c; a, b, d; a, b, e; a, b, f; a, b, g; a, b, h; a, c, d; a, c, e; a, c, f; a, c, g; a, c, h; a, d, e; a, d, f; a, d, g; a, d, h; a, e, f; a, e, g; a, e, h; a, f, g; a, f, h; a, g, h; b, c, d; b, c, e; b, c, f; b, c, g; b, c, h; b, d, e; b, d, f; b, d, g; b, d, h; b, e, f; b, e, g; b, e, h; b, f, g; b, f, h; b, g, h; c, d, e; c, d, f; c, d, g; c, d, h; c, e, f; c, e, g; c, e, h; c, f, g; c, f, h; c, g, h; d, e, f; d, e, g; d, e, h; d, f, g; d, f, h; d, g, h; e, f, g; e, f, h; e, g, h; 및 f, g, h; (iv) 다음의 4개의 유전자의 조합 중의 하나: a, b, c, d; a, b, c, e; a, b, c, f; a, b, c, g; a, b, c, h; a, b, d, e; a, b, d, f; a, b, d, g; a, b, d, h; a, b, e, f; a, b, e, g; a, b, e, h; a, b, f, g; a, b, f, h; a, b, g, h; a, c, d, e; a, c, d, f; a, c, d, g; a, c, d, h; a, c, e, f; a, c, e, g; a, c, e, h; a, c, f, g; a, c, f, h; a, c, g, h; a, d, e, f; a, d, e, g; a, d, e, h; a, d, f, g; a, d, f, h; a, d, g, h; a, e, f, g; a, e, f, h; a, e, g, h; a, f, g, h; b, c, d, e; b, c, d, f; b, c, d, g; b, c, d, h; b, c, e, f; b, c, e, g; b, c, e, h; b, c, f, g; b, c, f, h; b, c, g, h; b, d, e, f; b, d, e, g; b, d, e, h; b, d, f, g; b, d, f, h; b, d, g, h; b, e, f, g; b, e, f, h; b, e, g, h; b, f, g, h; c, d, e, f; c, d, e, g; c, d, e, h; c, d, f, g; c, d, f, h; c, d, g, h; c, e, f, g; c, e, f, h; c, e, g, h; c, f, g, h; d, e, f, g; d, e, f, h; d, e, g, h; d, f, g, h; 및 e, f, g, h; (v) 다음의 5개의 유전자의 조합 중의 하나: a, b, c, d, e; a, b, c, d, f; a, b, c, d, g; a, b, c, d, h; a, b, c, e, f; a, b, c, e, g; a, b, c, e, h; a, b, c, f, g; a, b, c, f, h; a, b, c, g, h; a, b, d, e, f; a, b, d, e, g; a, b, d, e, h; a, b, d, f, g; a, b, d, f, h; a, b, d, g, h; a, b, e, f, g; a, b, e, f, h; a, b, e, g, h; a, b, f, g, h; a, c, d, e, f; a, c, d, e, g; a, c, d, e, h; a, c, d, f, g; a, c, d, f, h; a, c, d, g, h; a, c, e, f, g; a, c, e, f, h; a, c, e, g, h; a, c, f, g, h; a, d, e, f, g; a, d, e, f, h; a, d, e, g, h; a, d, f, g, h; a, e, f, g, h; b, c, d, e, f; b, c, d, e, g; b, c, d, e, h; b, c, d, f, g; b, c, d, f, h; b, c, d, g, h; b, c, e, f, g; b, c, e, f, h; b, c, e, g, h; b, c, f, g, h; b, d, e, f, g; b, d, e, f, h; b, d, e, g, h; b, d, f, g, h; b, e, f, g, h; c, d, e, f, g; c, d, e, f, h; c, d, e, g, h; c, d, f, g, h; c, e, f, g, h; 및 d, e, f, g, h; (vi) 다음의 6개의 유전자의 조합 중의 하나: a, b, c, d, e, f; a, b, c, d, e, g; a, b, c, d, e, h; a, b, c, d, f, g; a, b, c, d, f, h; a, b, c, d, g, h; a, b, c, e, f, g; a, b, c, e, f, h; a, b, c, e, g, h; a, b, c, f, g, h; a, b, d, e, f, g; a, b, d, e, f, h; a, b, d, e, g, h; a, b, d, f, g, h; a, b, e, f, g, h; a, c, d, e, f, g; a, c, d, e, f, h; a, c, d, e, g, h; a, c, d, f, g, h; a, c, e, f, g, h; a, d, e, f, g, h; b, c, d, e, f, g; b, c, d, e, f, h; b, c, d, e, g, h; b, c, d, f, g, h; b, c, e, f, g, h; b, d, e, f, g, h; 및 c, d, e, f, g, h; (vii) 다음의 7개의 유전자의 조합 중의 하나: a, b, c, d, e, f, g; a, b, c, d, e, f, h; a, b, c, d, e, g, h; a, b, c, d, f, g, h; a, b, c, e, f, g, h; a, b, d, e, f, g, h; a, c, d, e, f, g, h; 및 b, c, d, e, f, g, h, 또는 (viii) 8개의 유전자의 조합을 과발현할 수 있다.
일 구현예에서, 박테리아는 적어도 ispG 유전자 및 임의로 하나 또는 수개의 dxs, dxr , ispD , ispE , ispF , ispH idi 유전자를 과발현한다.
과발현된 유전자는 천연의, 동종 또는 이종 유전자일 수 있다.
dxs 유전자는 1-데옥시크실룰로즈 5-포스페이트 신타제를 암호화하는 임의의 유전자, 바람직하게는 박테리아 유전자일 수 있다.
바람직한 구현예에서, dxs 유전자는 데이노코쿠스 박테리아로부터 기원한다. 특히, dxs 유전자는 디. 게오테르말리스(서열 번호 1; UniProt 수탁 번호: Q1IZP0), 디. 윤웨이엔시스(서열 번호 3), 디. 아파첸시스(D. apachencis)(NCBI 수탁 번호: WP_01958600.1), 디. 포에니시스(GenBank: EYB66726.1; NCBI 수탁 번호: WP_034360373.1; UniProt 수탁 번호: A0A016QL59), 디. 데세르티(NCBI 수탁 번호: WP_012692944.1; GenBank: ACO45821.1; UniProt 수탁 번호: C1D1U7), 디. 아쿠아틸리스(NCBI 수탁 번호: WP_026298749.1 또는 WP_019009670.1), 디. 울루무퀴엔시스(WP_017869298.1), 디. 라디오두란스(UniProt 수탁 번호: Q9RUB5; NCBI 수탁 번호: WP_010888114.1), 디. 고비엔시스(D. gobiensis)(NCBI 수탁 번호: WP_014684923.1; GenBank: AFD25440.1; UniProt 수탁 번호: H8GUB6), 디. 아종(D. sp.) 2009(WP_022801808.1), 디. 마리코펜시스(NCBI 수탁 번호: WP_013557350.1; UniProt 수탁 번호: E8U9V6), 디. 페라리딜리토리스(NCBI 수탁 번호: WP_015234295.1; UniProt 수탁 번호: K9ZXR0), 디. 프로테올라이티쿠스(NCBI 수탁 번호: WP_013614954.1; UniProt 수탁 번호: F0RNL9), 디. 라디오푸그난스(서열 번호 52; 서열 번호 59로 설정된 단백질을 암호화하는 서열), 디. 무라이이(D.murrayi)(NCBI 수탁 번호: WP_027461316.1), 디. 스웬시스(UniProt 수탁 번호: A0A0A7KK27; NCBI 수탁 번호: WP_039686512.1), 디. 솔리스(D. solis)(NCBI 수탁 번호: WP_046842902.1) 및 디. 피쿠스(D. ficus)(NCBI 수탁 번호: WP_027461725.1)로부터 기원한 dxs 유전자로 이루어진 그룹으로부터 선택될 수 있다. 바람직하게는, dxs 유전자는 디. 게오테르말리스, 디. 윤웨이엔시스, 디. 아파첸시스, 디. 포엔시스, 디. 데세르티, 디. 아쿠아틸리스, 디. 울루무퀴엔시스, 디. 라디오두란스, 디. 고비엔시스(D. gobiensis), 디. 아종(D. sp.) 2009, 디. 마리코펜시스, 디. 페라리딜리토리스, 디. 프로테올라이티쿠스 및 디. 라디오푸그난스로부터의 dxs 유전자로 이루어진 그룹으로부터 선택된다. 보다 바람직하게는, dxs 유전자는 디. 게오테르말리스, 디. 윤웨이엔시스 또는 디. 라디오푸그난스로부터, 및 심지어 보다 바람직하게는 디. 윤웨이엔시스 또는 디. 라디오푸그난스로부터 기원한다. 바람직하게는 상기 유전자들에 의해 암호화된 폴리펩타이드 중의 어느 것, 바람직하게는 서열 번호 2, 4 또는 52, 보다 바람직하게는 서열 번호 2 또는 4의 폴리펩타이드에 대해 적어도 70, 바람직하게는 80%, 보다 바람직하게는 90% 서열 상동성을 갖는 데이노코쿠스 박테리아로부터의 임의의 폴리펩타이드로도 사용될 수 있다.
dxr 유전자는 1-데옥시-D-크실룰로즈 5-포스페이트 리덕토이소머라제를 암호화하는 임의의 유전자, 바람직하게는 박테리아 유전자일 수 있다. 바람직한 구현예에서, dxr 유전자는 데이노코쿠스 박테리아로부터 기원한다. 특히, dxr 유전자는 디. 게오테르말리스(서열 번호 34; UniProt 수탁 번호: Q1IZJ1), 디. 윤웨이엔시스(서열 번호 36), 디. 아파첸시스(디. 아파첸시스)(NCBI 수탁 번호: WP_019584825.1), 디. 고비엔시스(NCBI 수탁 번호: WP_014685255.1; UniProt 수탁 번호: H8GWW6), 디. 포에니시스(UniProt 수탁 번호: A0A016QKH6; GenBank: EYB66645.1), 디. 라디오두란스(NCBI 수탁 번호: WP_10888147.1; UniProt 수탁 번호: Q9RU84), 디. 울루무퀴엔시스(NCBI 수탁 번호: WP_017869266.1), 디. 데세르티(디. 데세르티)(NCBI 수탁 번호: WP_012693383.1; UniProt 수탁 번호: C1CVP3), 디. 아종 2009(WP_022802132.1), 디. 아쿠아틸리스(WP_019009458.1), 디. 마리코펜시스(NCBI 수탁 번호: WP_013557781.1; UniProt 수탁 번호: E8UB38), 디. 프로테올라이티쿠스(NCBI 수탁 번호: WP_013614140.1; UniProt 수탁 번호: F0RJQ5), 디. 페라리딜리토리스(NCBI 수탁 번호: WP_015237162.1; UniProt 수탁 번호: L0A5Z1), 디. 스웬시스(UniProt 수탁 번호: A0A0A7KF77; GenBank: AIZ44760.1), 디. 솔리스(D. solis)(WP_046842669.1), 디. 마르모리스(디. 마르모리스)(WP_029481040.1), 디. 피쿠스(D. ficus)(WP_027462584.1), 디.라디오푸그난스(서열 번호 61) 및 디. 무라이이(WP_027460916.1)로부터의 dxr 유전자로 이루어진 그룹으로부터 선택될 수 있다. 바람직하게는, dxr 유전자는 디. 게오테르말리스, 디. 윤웨이엔시스, 디. 아파첸시스, 디. 고비엔시스, 디. 포에니시스, 디. 라디오두란스, 디. 울루퀴엔시스, 디. 데세르티, 디. 아종 2009, 디. 아쿠아틸리스, 디. 마리코펜시스, 디. 프로테올라이티쿠스 및 디. 페라리딜리토리스로부터의 dxr 유전자로 이루어진 그룹으로부터 선택될 수 있다. 보다 바람직하게는, dxr 유전자는 디. 윤웨이엔시스로부터 기원한다. 바람직하게는 이들 유전자에 의해 암호화된 폴리펩타이드중 어느 것, 바람직하게는 서열 번호 35 또는 37의 폴리펩타이드에 대해 적어도 70, 바람직하게는 80%, 보다 바람직하게는 90% 서열 상동성을 지닌 데이노코쿠스 박테리아로부터의 임의의 폴리펩타이드를 사용할 수 있다.
ispD 유전자는 2-C-메틸-D-에리트리톨 4-포스페이트 사이티딜릴트랜스퍼라제를 암호화하는 임의의 유전자, 바람직하게는 박테리아 유전자일 수 있다. 바람직한 구현예에서, ispD 유전자는 데이노코쿠스 박테리아로부터 기원한다. 특히, ispD 유전자는 디. 게오테르말리스(서열 번호 17; UniProt 수탁 번호: Q1J200), 디. 윤웨이엔시스(서열 번호 19), 디. 아파첸시스(NCBI 수탁 번호: WP_019587161.1), 디. 포에니시스(EYB69514.1; UniProt 수탁 번호: A0A016QUR2), 디. 데세르티(WP_012691946.1; UniProt 수탁 번호: C1CXL7), 디. 울루무퀴엔시스(WP_017871568.1), 디. 라디오두란스(WP_010889228.1; UniProt 수탁 번호: Q9RR90), 디. 아종 2009(WP_022800717.1), 디. 페라리딜리토리스(WP_015236716.1; UniProt 수탁 번호: L0A4P7), 디. 아쿠아틸리스(WP_019010949.1 또는 WP_026298972.1), 디. 마리코펜시(WP_013556207.1; UniProt 수탁 번호: E8U6L3), 디.프로테올라이티쿠스(WP_013615367.1 또는 WP_041222801.1; GenBank: ADY26759.1; UniProt 수탁 번호: F0RKP7), 디. 고비엔시스(D. gobiensis)(WP_014686200.1; GenBank: AFD26720.1; UniProt 수탁 번호: H8GV45), 디. 마르모리스(WP_029480451.1), 디. 솔리(D. soli)(AKH17101.1), 디. 스웬시스(UniProt 수탁 번호: A0A0A7KL82), D. misasensis(WP_034344339.1), 디. 라디오푸그난스(서열 번호 63) 및 디. 무라이이(GenBank: ACO44823.1; WP_027460458.1)로부터 기원한 ispD 유전자로 이루어진 그룹으로부터 선택될 수 있다. 바람직하게는, ispD 유전자는 디. 게오테르말리스, 디. 윤웨이엔시스, 디. 아파첸시스, 디. 포에니시스, 디. 데세르티, 디. 울루무퀴엔시스, 디. 라디오두란스, 디. 아종 2009, 디. 페라리딜리토리스, 디. 아쿠아틸리스, 디. 마리코펜시스, 디.프로테올라이티쿠스 및 디. 고비엔시스로부터의 ispD 유전자로 이루어진 그룹으로부터 선택된다. 보다 바람직하게는, ispD 유전자는 디. 윤웨이엔시스로부터 기원한다. 바람직하게는 상기 유전자에 의해 암호화된 임의의 폴리펩타이드, 바람직하게는 서열 번호 18 또는 20의 폴리펩타이드 중 어느 것에 대해 적어도 70, 바람직하게는 80%, 보다 바람직하게는 90% 서열 상동성을 지닌 데이노코쿠스 박테리아로부터의 임의의 폴리펩타이드도 사용될 수 있다.
ispE 유전자는 4-디포스포사이티딜-2-C-메틸-D-에리트리톨 키나제를 암호화하는 임의의 유전자, 바람직하게는 박테리아 유전자일 수 있다. 바람직한 구현예에서, ispE 유전자는 데이노코쿠스 박테리아로부터 기원한다. 특히, ispE 유전자는 디. 게오테르말리스(서열 번호 38; UniProt 수탁 번호: Q1J201; NCBI 수탁 번호: WP_011529330.1), 디. 윤웨이엔시스(서열 번호 40), 디. 포에니시스(NCBI 수탁 번호: EYB69513.1; UniProt 수탁 번호: A0A016QTX2), 디. 아파첸시스(WP_019587162.1), 디. 아쿠아틸리스(WP_019009083.1), 디. 마리코펜시스(WP_013556206.1; UniProt 수탁 번호: E8U6L2; GenBank: ADV66701.1), 디. 데세르티(WP_012691947.1; UniProt 수탁 번호: C1CXL8), 디. 아종 2009(WP_022800716.1), 디.프로테올라이티쿠스(WP_013615364.1; UniProt 수탁 번호: F0RKH7), 디. 울루무퀴엔시스(WP_017871569.1) 디. 페라리딜리토리스(WP_015236715.1 또는 WP_022800716.1; UniProt 수탁 번호: L0A3E0), 디. 고비엔시스(WP_014686199.1; UniProt 수탁 번호: H8GV44), 디. 라디오두란스(WP_10889229.1; UniProt 수탁 번호: Q9RR89), 디. 스웬시스(A0A0A7KGN1; GenBank: AIZ45322.1), 디. 솔리(AKH17102.1), 디. 라디오푸그난스(서열 번호 65) 및 디. 마르모리스(WP_029480453.1)로부터의 ispE 유전자로 이루어진 그룹으로부터 선택될 수 있다. 바람직하게는, ispE 유전자는 디. 게오테르말리스, 디. 윤웨이엔시스, 디. 포에니시스, 디. 아파첸시스, 디. 아쿠아틸리스, 디. 마리코펜시스, 디. 데세르티, 디. 아종 2009, 디.프로테올라이티쿠스, 디. 울루무퀴엔시스, 디. 페라리딜리토리스, 디. 고비엔시스 및 디. 라디오두란스로터의 ispE 유전자로 이루어진 그룹으로부터 선택된다. 보다 바람직하게는, ispE 유전자는 디. 윤웨이엔시스로부터 기원한다. 바람직하게는 이들 유전자에 의해 암호화된 폴리펩타이드 중 어느 것, 바람직하게는 서열 번호 39 또는 41의 폴리펩타이드에 대해 에 대해 적어도 70, 바람직하게는 80%, 보다 바람직하게는 90%의 서열 상동성을 지닌 임의의 폴리펩타이드도 사용될 수 있다.
ispF 유전자는 2-C-메틸-D-에리트리톨 2,4-사이클로디포스페이트 신타제를 암호화하는 임의의 유전자, 바람직하게는 박테리아 유전자일 수 있다. 바람직한 구현예에서, ispF 유전자는 데이노코쿠스 박테리아로부터 기원한다. 특히 ispF 유전자는 디. 게오테르말리스(서열 번호 21; UniProt 수탁 번호: Q1J2A8; WP_011529223.1), 디. 윤웨이엔시스(서열 번호 23), 디. 포에니시스(NCBI 수탁 번호: EYB69383.1, WP_034353365.1; UniProt 수탁 번호: A0A016QTI4), 디. 아파첸시스(WP_019587119.1), 디. 아종 2009(WP_022800431.1), 디. 울루무퀴엔시스(WP_017871252.1), 디. 마리코펜시스(WP_013558001.1; UniProt 수탁 번호: E8UBQ8), 디. 데세르티(WP_012692194.1; UniProt 수탁 번호: C1CZ33), 디. 아쿠아틸리스(WP_019009115.1), 디. 라디오두란스(WP_010886876.1 UniProt 수탁 번호: Q9RXS6), 디.프로테올라이티쿠스(WP_013615320.1; UniProt 수탁 번호: F0RKD3), 디. 고비엔시스(WP_014686259.1; UniProt 수탁 번호: H8GVA4), 디. 페라리딜리토리스(WP_015234905.1), 디. 스웬시스(A0A0A7KKV6), 디. 라디오푸그난스(서열 번호 67) 및 디. 무라이이(WP_027461473.1)로부터의 ispF 유전자로 이루어진 그룹으로부터 선택될 수 있다. 바람직하게는, ispF 유전자는 디. 게오테르말리스, 디. 윤웨이엔시스, 디. 포에니시스, 디. 아파첸시스, 디. 아종 2009, 디. 울루무퀴엔시스, 디. 마리코펜시스, 디. 데세르티, 디. 아쿠아틸리스, 디. 라디오두란스, 디.프로테올라이티쿠스, 디. 고비엔시스 및 디. 페라리딜리토리스로부터의 ispF 유전자로 이루어진 그룹으로부터 선택될 수 있다. 보다 바람직하게는, ispF 유전자는 디. 윤웨이엔시스로부터 기원한다. 바람직하게는 상기 유전자에 의해 암호화된 폴리펩타이드 중 어느 것, 바람직하게는 서열 번호 22 또는 24의 폴리펩타이드에 대해 적어도 70, 바람직하게는 80%, 보다 바람직하게는 90%의 서열 상동성을 지닌 데이노코쿠스 박테리아를 사용할 수 있다.
ispG 유전자는 4-하이드록시-3-메틸부트-2-엔-1-일 디포스페이트 신타제를 암호화하는 임의의 유전자, 바람직하게는 박테리아 유전자일 수 있다. 바람직한 구현예에서, ispG 유전자는 데이노코쿠스 박테리아로부터 기원한다. 특히 ispG 유전자는 디. 게오테르말리스(서열 번호 25), 디. 윤웨이엔시스(서열 번호 27), 디. 아파첸시스(NCBI 수탁 번호: WP_019584739.1 또는 WP_040382265.1), 디. 포에니시스(EYB67750.1), 디. 아쿠아틸리스(WP_019008200.1), 이. 아종 2009(WP_022801633.1), 디. 고비엔시스(WP_014684632.1), 디. 라디오두란스(WP_010887031.1), 디. 울루무퀴엔시스(WP_017871942.1), 디. 데세르티(WP_012693251.1), 디.프로테올라이티쿠스(WP_013615171.1), 디. 마리코펜시스(WP_013556907.1; EYB67750.1), 디. 페라리딜리토리스(WP_015237094.1), 디. 라디오푸그난스(서열 번호 69) 및 디. 무라이이(WP_027460867.1)로부터의 ispG 유전자로 이루어진 그룹으로부터 선택된다. 바람직하게는, ispG 유전자는 디. 게오테르말리스, 디. 윤웨이엔시스, 디. 아파첸시스, 디. 포에니시스, 디. 아쿠아틸리스, 디. 아종 2009, 디. 고비엔시스, 디. 라디오두란스, 디. 울루무퀴엔시스, 디. 데세르티, 디.프로테올라이티쿠스, 디. 마리코펜시스 및 디. 페라리딜리토리스로부터의 ispG 유전자로 이루어진 그룹으로부터 선택될 수 있다. 보다 바람직하게는, ispG 유전자는 디. 윤웨이엔시스로부터 선택된다. 바람직하게는 상기 유전자에 의해 암호화된 폴리펩타이드 중의 어느 것, 바람직하게는 서열 번호 26 또는 28의 폴리펩타이드에 대해 적어도 70, 바람직하게는 80%, 보다 바람직하게는 90%의 서열 상동성을 지닌 데이노코쿠스 박테리아로부터의 임의의 폴리펩타이드도 사용될 수 있다.
ispH 유전자는 4-하이드록시-3-메틸부트-2-에닐 디포스페이트 리덕타제를 암호화하는 임의의 유전자, 바람직하게는 박테리아 유전자일 수 있다. 바람직한 구현예에서, ispH 유전자는 데이노코쿠스 박테리아로부터 기원한다. 특히 ispH 유전자는 디. 게오테르말리스(서열 번호 42), 디. 윤웨이엔시스(서열 번호 44), 디. 포에니시스(NCBI 수탁 번호: EYB6823.1; WP_034356434.1), 디. 아파첸시스(WP_019585890.1), 디. 아종 2009(WP_022801928.1), 디. 고비엔시스(WP_014685178.1), 디. 아쿠아틸리스(WP_019007893.1), 디. 라디오두란스(WP_10888795.1), 디. 데세르티(WP_012693059.1; 유전자Bank: ACO45936.1), 디. 페라리딜리토리스(WP_015236935.1), 디.프로테올라이티쿠스(WP_013614360.1), 디. 마리코펜시스(WP_013557691.1), 디. 라디오푸그난스(서열 번호 71) 및 디. 울루무퀴엔시스(WP_017869851.1)로부터의 ispH 유전자로 이루어진 그룹으로부터 선택될 수 있다. 바람직하게는, ispH 유전자는 디. 게오테르말리스, 디. 윤웨이엔시스, 디. 아파첸시스, 디. 포에니시스, 디. 아쿠아틸리스, 디. 아종 2009, 디. 고비엔시스, 디. 라디오두란스, 디. 울루무퀴엔시스, 디. 데세르티, 디.프로테올라이티쿠스, 디. 마리코펜시스 및 디. 페라리딜리토리스로부터의 ispH 유전자로 이루어진 그룹으로부터 선택된다. 보다 바람직하게는, ispH 유전자는 디. 윤웨이엔시스로부터 선택된다. 바람직하게는 상기 폴리펩타이드 중 어느 것, 바람직하게는 서열 번호 43 또는 45의 폴리펩타이드에 대해 적어도 70, 바람직하게는 80%, 보다 바람직하게는 90%의 서열 상동성을 지닌 데이노코쿠스 박테리아로부터의 임의의 폴리펩타이드도 사용할 수 있다.
idi 유전자는 이소펜테닐-디포스페이트 델타-이소머라제를 암호화하는 임의의 유전자, 바람직하게는 박테리아 유전자일 수 있다. 바람직한 구현예에서, idi 유전자는 데이노코쿠스 박테리아로부터 기원한다. 특히 idi 유전자는 디. 게오테르말리스(서열 번호 29), 디. 윤웨이엔시스(서열 번호 31), 디. 아파첸시스(NCBI 수탁 번호: WP_019585561.1), 디. 포에니시스(EYB67918.1), 디. 아쿠아틸리스(WP_019010639.1 또는 WP_040380849.1), 디. 아종 2009(WP_022802239.1), 디. 데세르티(WP_012692934.1), 디. 라디오두란스(Q9RVE2.3), 디. 마리코펜시스(WP_013556085.1) 디. 울루무퀴엔시스(WP_017870894.1), 디. 고비엔시스(WP_014685602.1 또는 WP_043802116.1), 디. 라디오푸그난스(서열 번호 73) 및 디. 페라리딜리토리스(WP_015236653.1)로부터의 idi 유전자로 이루어진 그룹으로부터 선택될 수 있다. 바람직하게는, idi 유전자는 디. 게오테르말리스, 디. 윤웨이엔시스, 디. 아파첸시스, 디. 포에니시스, 디. 아쿠아틸리스, 디. 아종 2009, 디. 고비엔시스, 디. 라디오두란스, 디. 울루무퀴엔시스, 디. 데세르티, 디. 마리코펜시스 및 디. 페라리딜리토리스로부터의 idi 유전자로부터 선택된다. 보다 바람직하게는, idi 유전자는 디. 윤웨이엔시스로부터 기원한다. 바람직하게는 상기 유전자에 의해 암호화된 폴리펩타이드 중 어느 것, 바람직하게는 서열 번호 30 또는 32의 폴리펩타이드에 대해 적어도 70, 바람직하게는 80%, 보다 바람직하게는 90%의 서열 상동성을 지닌 데이노코쿠스 박테리아로부터의 임의의 폴리펩타이드도 사용될 수 있다.
바람직한 구현예에서, 박테리아는 DXS 및 IDI 암호화 유전자를 과발현한다. 바람직하게는, 위에서 언급한 바와 같이 DXS는 하기 기술된 바와 같은 증진된 DXS 효소이다.
증진된 MEP 효소
본 발명에 사용된 dxs, drx, ispD, ispE, ispF, ispG, ispH idi 유전자는 또한 증진된 효소, 즉, 야생형 효소의 아미노산 서열과 비교하여 이들의 서열내에 적어도 하나의 돌연변이를 소유한 효소를 암호화할 수 있으며, 상기 돌연변이는 이들의 활성의 증가를 가져온다. 이러한 증진된 효소는 숙련가에게 공지된 임의의 기술에 따라 수득될 수 있다. 특히, 증진된 DXP 신타제, 보다 특히 증진된 데이노코쿠스 DXP 신타제는 특허원 제WO 2012/052171호에 개시된 기술에 따라 수득될 수 있다.
따라서, 일 구현예에서, 재조합 데이노코쿠스 박테리아는 DXP 신타제를 돌연변이시킴으로써 서열 번호 52의 244번 위치에 상응하는 위치(또는 서열 번호 4의 238번 위치에 상응하는 위치 또는 서열 번호; 2의 241번 위치에 상응하는 위치)에서 아스파라긴 및/또는 서열 번호 52의 244번 위치에 상응하는 위치(또는 서열 번호 4의 238번 위치에 상응하는 위치 또는 서열 번호 2의 241번 위치에 상응하는 위치)에서 시스테인을 수득함으로써 수득된, 증진된 DXP 신타제, 바람직하게는 증진된 데이노코쿠스 DXP 신타제를 암호화하는 dxs 유전자를 포함한다. 바람직하게는, 재조합 데이노코쿠스 박테리아는 DXP 신타제를 돌연변이시켜 서열 번호 52의 244번 위치에 상응하는 위치(또는 서열 번호 4의 238번 위치에 상응하는 위치 또는 서열 번호 2의 241번 위치에 상응하는 위치)에서 시스테인을 수득함으로써 수득된, 증진된 DXP 신타제를 암호화는 dxs 유전자를 포함한다.
222 또는 244번 위치에 상응하는 잔기를 확인하기 위한 방법은 숙련가에게 잘 공지되어 있으며 특허원 제WO 2012/052171호에 상세히 설명되어 있다. 특히, 이들 잔기는 ClustalW, MUSCLE와 같은 서열 정렬 컴퓨터 프로그램 또는 Needleman 및 Wunsch 알고리즘을 사용하는 프로그램을 사용하여 확인할 수 있다.
바람직한 구현예에서, 재조합 데이노코쿠스 박테리아는 다음의 치환을 갖는 디. 라디오푸그난스로부터의 증진된 DXP 신타제를 암호화하는 유전자를 포함한다: K222N(서열 번호 6), R244C(서열 번호 8) 또는 K222N/R244C(서열 번호 10). 이들 효소를 암호화하는 유전자의 서열은 각각 서열 번호 5, 7 및 9에 나타나 있다. 보다 바람직하게는, 재조합 데이노코쿠스 박테리아는 디. 라디오푸그난스로부터의 DXP 신타제의 R244C 돌연변이를 암호화하는 유전자(서열 번호 8)를 포함한다.
다른 바람직한 구현예에서, 재조합 데이노코쿠스 박테리아는 다음의 치환을 갖는 디. 윤웨이엔시스로부터의 증진된 DXP 신타제를 암호화하는 유전자를 포함한다: K216N(서열 번호 12), R238C(서열 번호 14) 또는 K216N/R238C(서열 번호 16). 이들 효소를 암호화하는 유전자의 서열은 각각 서열 번호 11, 13 및 15에 나타나 있다. 보다 바람직하게는, 재조합 데이노코쿠스 박테리아는 디. 윤웨이엔시스로부터의 증진된 DXP 신타제의 R238C 돌연변이를 암호화하는 유전자(서열 번호 14)를 포함한다.
추가의 바람직한 구현예에서, 재조합 데이노코쿠스 박테리아는 다음의 치환을 갖는 디. 게오테르말리스로부터의 증진된 DXP 신타제를 암호화하는 유전자(서열 번호 2)를 포함한다: K219N(서열 번호 54), R241C(서열 번호 56) 또는 K219N/R241C(서열 번호 58). 보다 바람직하게는, 재조합 데이노코쿠스 박테리아는 디. 게오테르말리스로부터의 DXP 신타제의 R241C 돌연변이를 암호화하는 유전자를 포함한다.
증진된 DXP 신타제를 암호화하는 유전자는 재조합 박테리아 속에서 과발현될 수 있다. 바람직하게는, 상기 유전자는 구성적 또는 유도성 프로모터의 조절 하에, 보다 바람직하게는 강력한 구성적 프로모터의 조절 하에서 박테리아의 게놈 내에 통합된다. 상기 유전자는 내인성 dxs 유전자를 대체할 수 있거나 dxs 유전자의 카피 수를 증가시키기 위해 다른 위치에 통합될 수 있다.
따라서, 다른 국면에서, 본 발명은 서열 번호 52의 222번 위치에 상응하는 위치에서 아스파라긴 및/또는 서열 번호 52의 244번 위치에 상응하는 위치에서 시스테인을 포함하는 증진된(또는 돌연변이된) DXP 신타제, 바람직하게는 증진된 데이노코쿠스 DXP 신타제를 포함하는 재조합 데이노코쿠스 박테리아에 관한 것이다. 바람직하게는, 재조합 데이노코쿠스 박테리아는 서열 번호 52의 244번 위치에 상응하는 위치에서 시스테인을 포함하는 증진된(또는 돌연변이된) DXP 신타제를 포함한다. 상기 상응하는 위치는 잘-공지된 정렬 알고리즘을 사용하여 숙련가에 의해 용이하게 확인될 수 있다. 특히, 증진된 DXP 신타제는 상기 개시된 증진된 DXS 중의 어느 것일 수 있다.
임의로, dxs, dxr, ispD, ispE, ispF, ispG, ispH idi로 이루어진 그룹으로부터 선택된 적어도 하나의 유전자가 과발현된다. 바람직하게는, 적어도 IDI 암호화 유전자가 과발현된다. 보다 바람직하게는, 적어도 하나의 dxs 유전자 및 하나의 idi 유전자가 과발현된다.
본 발명의 다른 국면에 대해 본원에 기술된 모든 구현예는 당해 국면에 또한 포함된다. 특히, 재조합 데이노코쿠스 박테리아는 (i) 상기 기술된 바와 같이 향상된 MEP 경로, (ii) 이종 MEV 경로, (iii) FPP 신타제 활성의 증가, (iv) 라이코펜 베타-사이클라제의 불활성화 및/또는 (v) 본원에 기술된 바와 같은 이종 테르펜 또는 이소프렌 신타제의 발현을 추가로 나타낼 수 있다.
이종 MEV 경로
다른 국면에서, 본 발명의 재조합 데이노코쿠스 박테리아는 이종 MEV 경로를 포함하는데, 즉, 하이드록시메틸글루타릴-CoA 신타제(EC 2.3.3.10), 하이드록시메틸글루타릴-CoA 리덕타제(NADPH)(EC 1.1.1.34), 메발로네이트 키나제(EC 2.7.1.36), 포스포메발로네이트 키나제(EC 2.7.4.2), 및 디포스포메발로네이트 디카복실라제(EC 4.1.1.33)를 암호화하는 이종 유전자를 발현한다.
바람직하게는, 이종 유전자는 식물, 박테리아 또는 효모, 보다 바람직하게는 사카로마이세스 세레비지아에(Saccharomyces cerevisiae)로부터의 효소를 암호화한다. 특정의 구현예에서, 재조합 데이노코쿠스 박테리아는 사카로마이세스 세레비지아에 하이드록시메틸글루타릴-CoA 신타제(Uniprot/Swissprot: P54839), 하이드록시메틸글루타릴-CoA 리덕타제(NADPH)(Uniprot/Swissprot: P12683), 메발로네이트 키나제(Genbank: NP_013935.1), 포스포메발로네이트 키나제(Genbank: NP_013947.1), 및 디포스포메발로네이트 데카복실라제(Genbank: CAA66158.1)를 암호화하는 유전자를 포함한다.
데이노코쿠스 박테리아는 내인성 아세틸-CoA C-아세틸트랜스퍼라제 활성을 나타낸다. 그러나, 일부 구현예에서, 재조합 데이노코쿠스 박테리아는 아세틸-CoA C-아세틸트랜스퍼라제를 암호화하는 이종 유전자를 추가로 포함할 수 있다. 당해 유전자는 내인성 유전자를 대체할 수 있거나 다른 위치에서 통합되어 당해 유전자의 카피 수를 증가시킬 수 있다. 당해 이종 유전자는 식물, 박테리아 또는 효모로부터 기원할 수 있다. 바람직한 구현예에서, 재조합 데이노코쿠스 박테리아는 사카로마이세스 세레비지아에 아세틸-CoA C-아세틸트랜스퍼라제(Genbank: NP_015297.1)를 암호화하는 유전자를 추가로 포함한다.
본 발명의 다른 국면을 위해 본원에 기술된 모든 구현예는 또한 당해 국면에 포함된다. 특히, 재조합 데이노코쿠스 박테리아는 (i) 임의로 증진된 DXP 신타제와 함께, 상기 기술된 바와 같은 향상된 MEP 경로, (ii) FPP 신타제 활성의 증가, (iii) 라이코펜 베타-사이클라제의 불활성화 및/또는 (iv) 본원에 기술된 바와 같은 이종 테르펜 또는 이소프렌 신타제의 발현을 나타낼 수 있다.
이종 테르펜 신타제
본 출원은 또한 데이노코쿠스 박테리아, 및 특히 상기 기술된 바와 같은 재조합 데이노코쿠스 박테리아가 이종 테르펜 신타제의 발현을 통해 이종 이소프레노이드 화합물을 생산하는데 효율적으로 사용될 수 있음을 입증한다. 따라서, 추가의 국면에서, 본 발명은 이종 테르펜 신타제를 암호화하는 유전자를 포함하는 재조합 데이노코쿠스 박테리아에 관한 것이다.
본 발명의 다른 국면에 대해 본원에 기술된 모든 구현예가 또한 당해 국면에 포함된다. 특히, 재조합 데이노코쿠스 박테리아는 (i) 임의로 증진된 DXP 신타제와 함께, 위에서 기술된 바와 같은 향상된 MEP 경로, (ii) 이종 MEV 경로, (iii) FPP 신타제 활성의 증가, (iv) 라이코펜 베타-사이클라제의 불활성화 및/또는 (v) 본원에 기술된 바와 같은 이종 이소프렌 신타제의 발현을 추가로 나타낼 수 있다.
바람직하게는, 이종 테르펜 신타제는 모노테르펜 신타제, 디테르펜 신타제, 트리테르펜 신타제 및 세스퀴테르펜 신타제, 보다 바람직하게는 모노테르펜 및 세스퀴테르펜 신타제로 이루어진 그룹으로부터 선택된다. 재조합 데이노코쿠스 박테리아는 1개 또는 수개의 이종 테르펜 신타제, 특히 1개 또는 수개의 모노테르펜 신타제 및/또는 1개 또는 수개의 세스퀴테르펜 신타제를 발현할 수 있다.
각각의 이종 테르펜 신타제는 바람직하게는 상기 효소를 암호화하는 유전자를 포함하는, 상기 기술된 바와 같은 발현 카세트로부터 발현되고 박테리아의 게놈내로 통합된다. 바람직하게는, 상기 유전자는 구성적 프로모터, 보다 바람직하게는 강력한 구성적 프로모터의 조절하에 있다.
이종 모노테르펜 신타제
특정의 구현예에서, 본 발명의 재조합 박테리아는 이종 모노테르펜 신타제의 발현을 통해 변형되어 모노테르펜 또는 모노테르페노이드를 생산하는 데이노코쿠스 박테리아이다. 본 발명의 재조합 데이노코쿠스 박테리아에서 발현될 수 있는 모노테르펜 신타제의 예는 게라니올 신타제(EC 3.1.7.3), 3S-리날룰 신타제(EC 4.2.3.25) 및 R-리날룰 신타제(EC 4.2.3.26), 1,8-시네올 신타제(EC 4.2.3.108), 미르센 신타제(EC 4.2.3.15), 4S-리모넨 신타제(EC 4.2.3.16), R-리모넨 신타제(EC 4.2.3.20), α-피넨 신타제(EC 4.2.3.119), β-피넨 신타제(EC 4.2.3.120),(-)-엔도-펜콜 신타제(EC 4.2.3.10), 및 (-)-α-테르피네올 신타제(EC 4.2.3.111)와 같은 리날룰 신타제, 및 이의 임의의 조합을 포함하나, 이에 한정되지 않는다.
일 구현예에서, 본 발명의 재조합 박테리아는 이종 게라니올 신타제, 즉, 게라닐 디포스페이트로부터 게라니올의 형성을 촉매하는 효소를 암호화하는 유전자를 포함한다. 이종 게라니올 신타제의 예는 옥시뭄 바실리쿰(서열 번호 49; GenBank 수탁 번호: AAR11765, Zhou et al., 2013; Liu et al., 2013; Lijima et al., 2004), 발레리아나 오피시날리스(Valeriana officinalis)(AHE41084, Dong et al., 2013), 리피아 둘시스(Lippia dulcis)(Dong et al., 2013), 페릴라 시트리오도라(Perilla citriodora)(AAY88965; Sugiura et al., 2011), 페릴라 프루테스센스(Perilla frutescens)(ABB30218; Sharkey et al., 2005), 페릴라 세토옌시스(Perilla setoyensis)(ACN42010.1), 신나모뭄 테누이필룸(Cinnamomum tenuipilum)(CAD29734), 파일라 둘시스(Phyla dulcis)(ADK62524.1), 올레아 유로파에아(Olea europaea)(AFI47926.1), 비티스 비니페라(Vitis vinifera)(ADR74217), 시서 아리에티눔(Cicer arietinum)(XP_004487383.1), 피크로리타 쿠르로아(Picrorhiza kurrooa)(AHX97739.1), 시트루스 잠브히리(Citrus jambhiri)(BAM29049.1), 신나모뭄 테누이필레(Cinnamomum tenuipile)(CAD29734.2; Yang et al., 2005) 및 카타란투스 로세우스(Catharanthus roseus)(AFD64744.1)로부터의 게라니올 신타제를 포함하나, 이에 한정되지 않는다. 게라니올 신타제 활성을 나타내고 이들 효소들 중 어느 것에 대해 적어도 70%, 80%, 바람직하게는 90%의 서열 상동성을 지닌 임의의 폴리펩타이드도 증가된 촉매 활성, 기질에 대한 특이성, 및/또는 안전성을 갖는 이들 효소의 변이체에서 사용될 수 있다. 특정의 구현예에서, 이종 게라니올 신타제는 옥시뭄 바실리쿰, 발레리아나 오피시날리스, 리피아 둘시스, 올레아 유로파에아, 비티스 비니페라시서 아리에티눔 및 카타란투스로세우스로부터의 게라니올 신타제로 이루어진 그룹으로부터 선택된다. 보다 바람직하게는, 이종 게라니올 신타제는 옥시뭄 바실리쿰(서열 번호 49), 시서 아리에티눔 또는 파일라 둘시스의 게라니올 신타제이다. 심지어 보다 바람직하게는, 게라니올 신타제는 옥시뭄 바실리쿰의 게라니올 신타제이다. 당해 게라니올 신타제를 암호화하는 유전자의 뉴클레오타이드 서열은 서열 번호 48에 설정된 바와 같을 수 있다.
임의로, 이종 게라니올 신타제를 암호화하는 유전자를 포함하는 재조합 박테리아는 또한 게라니올의 시트로넬롤(EC 1.6.99.1)로의 환원을 촉매하는 게라니올 리덕타제를 포함한다. 이종 게라니올 리덕타제의 예는 S. cerevisiae(Q03558.3)로부터의 구황색 효소 2(OYE2) 및 식물 헤베아 브라실리엔시스(Hevea brasiliensis)로부터의 동족체, 12-옥소파이토디에노에이트 리덕타제(OPR), HbOPR(DQ004685.1)를 포함하나, 이에 한정되지 않는다.
다른 구현예에서, 본 발명의 재조합 박테리아는 이종 리날룰 신타제를 암호화하는 유전자를 포함한다. 리날룰 신타제는 3S-리날룰 신타제, 즉, 게라닐 디포스페이트로부터 S-리날룰의 형성을 촉매하는 효소, 또는 R-리날룰 신타제, 즉, 게라닐 디포스페이트로부터 R-리날룰의 형성을 촉매하는 효소일 수 있다. 이종 리날룰 신타제의 예는 스트렙토마이세스 클라불리게루스(Nakano et al., 2011), 레몬 미르틀(Lemon Myrtle)(Sugiura et al., 2011), 페릴라 시트리오도라(GenBank 수탁 번호 AHY39266.1; Sugiura et al., 2011), 마이주스 시트레이트(Myzus citrate)(Sugiura et al., 2011), 클라키아 브레웨리(클라르키아 브레웨리)(AAD19838; AAD19840; AAC49395, Rico et al., 2010; Herreo et al., 2008; Dudareva et al., 1996; Pichersky et al., 1995), 클라키아 콘신나(Clarkia concinna)(AAD19839), 라반둘라 안구스티볼리아(Lavandula angustivolia)(ABB73045.1; Landmann et al., 2007) 비티스 비니페라(Martin et al., 2010), 아라비돕시스 라이레이타 아종 라이라타(Arabidopsis lyrata subsp. lyrata)(EFH62782.1; XP_002886523.1), 오리자 사티바(Oryza sativa)(EU596453), 세레우스 페루비아누스(Cereus peruvianus)(Sitrit et al., 2004), 멘타 시트라타(Mentha citrata)(AAL99381; Crowell et al., 2002), 아르테미시아 안누아(Artemisia annua)(AAF13357; AAF13356; Jia et al., 1999), 옥시뭄 바실리쿰(AAV63789; Lijima et al., 2004), 아라비돕시스 탈리아나(Arabidopsis thaliana)(AAO85533; Chen et al., 2003), 프라가리아 아나나싸(Fragaria ananassa)(CAD57081; CAD57106; Aharoni et al., 2004), 메디카고 트룬카툴라(Medicago truncatula)(XP_003593502.1), 안티리눔 마주스(Antirrhinum majus)(ABR24418), 라이코페르시콘 에스쿨렌툼(Lycopersicon esculentum)(AAX69063), 피세아 아비에스(Picea abies)(AAS47693), 페릴라 프루테스센스 변종 히르텔라(Perilla frutescens var. hirtella)(ACN42011; Masumoto et al., 2010), 코리안드룸 사티붐(Coriandrum sativum)(AHC54051; Galata et al., 2014), 신나모뭄 오스모플로에움(Cinnamomum osmophloeum)(AFQ20812.1), 테오브로마 카카오(Theobroma cacao)(EOY20311.1), 모루스 노타빌리스(Morus notabilis)(EXC23176.1) 및 코페아 아라비카(Coffea Arabica)(Del Terra et al., 2013)로부터의 리날룰 신타제를 포함하나, 이에 한정되지 않는다. 리날룰 신타제 활성을 나타내고 이들 효소들 중 어느 것, 특히 증가된 효소 활성, 기질에 대한 특이성, 및/또는 안전성을 지닌 이들 효소의 변이체에 대해서 적어도 70%, 80%, 바람직하게는 90%의 서열 상동성을 지닌 임의의 폴리펩타이드도 사용될 수 있다. 특정의 구현예에서, 이종 리날룰 신타제는 클라키아 콘신나, 메디카고 트룬카툴라페릴라 프루테스센스 변종 히르텔라코리안드룸 사티붐, 라반둘라 안구스티볼리아, 클라르키아 브레웨리, 신나모뭄 오스모플로에움, 테오브로마 카카오, 모루스 노타빌리스, 및 코페아 아라비카로부터의 리날룰 신타제로 이루어진 그룹으로부터 선택된다. 보다 바람직하게는, 이종 리날룰 신타제는 페릴라 프루테스센스 또는 클라르키아 브레웨리, 심지어 보다 바람직하게는 페릴라 프루테스센스의 리날룰 신타제이다.
일 구현예에서, 본 발명의 재조합 박테리아는 이종 마이르센 신타제, 즉, 게라닐 디포스페이트로부터 마이르센의 형성을 촉매하는 효소를 암호화하는 유전자를 포함한다. 이종 마이르센 신타제의 예는 아비에스 그란디스(Abies grandis)(GenBank 수탁 번호: AAB71084), 안티르히눔안티리눔 마주스(AAO41727; AAO41726), 아라비돕시스 탈리아나(NP_189209; AAG09310), 라이코페르시콘 에스쿨렌툼(AAX69064), 옥시뭄 바실리쿰(AAV63791), 페릴라 프루테스센스(AAF76186), 피세아 아비에스(AAS47696), 모루스 노타빌리스(EXB97316.1), 메디카고 트룬카툴(AES67305.1) 및 쿠에르쿠스 일렉스(Quercus ilex)(CAC41012)로부터의 마이르센 신타제를 포함하나, 이에 한정되지 않는다. 마이르센 신타제 활성을 나타내고 이들 효소, 특히 증가된 촉매 활성, 기질에 대한 특이성, 및/또는 안전성을 갖는 이들 효소의 변이체에 대해 적어도 70%, 80%, 바람직하게는 90%의 서열 상동성을 갖는 임의의 폴리펩타이드도 사용될 수 있다. 특정의 구현예에서, 이종 리날룰 신타제는 아비에스 그란디스로부터의 마이르센 신타제, 피세아 아비에스, 모루스 노타빌리스 및 메디카고 트룬카툴로 이루어진 그룹으로부터 선택된다.
다른 구현예에서, 본 발명의 재조합 박테리아는 이종 리모넨 신타제를 암호화하는 유전자를 포함한다. 리모넨 신타제는 4S-리모넨 신타제, 즉, 게라닐 디포스페이트로부터 (-)-S-리모넨의 형성을 촉매하는 효소, 또는 R-리모넨 신타제, 즉, 게라닐 디포스페이트로부터 (+)-R-리모넨의 형성을 촉매하는 효소일 수 있다. 이종 리모넨 신타제의 예는 멘타 스피카타(Mentha spicata)(GenBank 수탁 번호: AAC37366), 멘타 롱기폴리아(Mentha longifolia)(AAD50304.1), 아비에스 그란디스(AAB70907; AAF61455), 아가스타케 루고사(Agastache rugosa)(AAL17636), 칸나비스 사티바(Cannabis sativa)(ABI21837), 시트루스 리몬(Citrus limon)(AAM53944; AAM53946), 시트루스 운쉬우(Citrus unshiu)(BAD27256; BAD27257), 라반둘라 안구스티볼리아(ABB73044), 페릴라 프루테스센스(AAG31438), 피세아 아비에스(AAS47694), 피세아 시트켄시스(Picea sitchensis)(ABA86248) 및 스키조네페타 테누이폴리아(Schizonepeta tenuifolia)(AAG01140)로부터의 리모넨 신타제를 포함하나, 이에 한정되지 않는다. 리모넨 신타제 활성을 나타내고 이들 효소 중 어느 것, 특히 증가된 촉매 활성, 기질에 대한 특이성, 및/또는 안전성을 갖는 이들 효소의 변이체에 대해 적어도 70%, 80%, 바람직하게는 90% 서열 상동성을 갖는 임의의 폴리펩타이드도 사용될 수 있다. 특정의 구현예에서, 이종 리모넨 신타제는 멘타 스피카타(Mentha spicata) 또는 멘타 롱기폴리아(Mentha longifolia), 바람직하게는 멘타 롱기폴리아로부터 기원한다.
다른 구현예에서, 본 발명의 재조합 박테리아는 이종 시네올 신타제를 암호화하는 유전자를 포함한다. 이종 시네올 신타제의 예는 스트렙토마이세스 클라불리게루스(GenBank: EDY47508.1; Nakano et al., 2011), 솔라눔 라이코페르시쿰(Solanum lycopersicum)(GenBank: AEM05857.1), 로스마리누스 오피시날리스(Rosmarinus officinalis)(GenBank: AFZ41794.1), 살비아 프루티코사(Salvia fruticosa)(ABH07677.1) 및 아라비돕시스 탈리아나(AEE77075.1; AEE77074.1)로부터의 시네올 신타제를 포함하나, 이에 한정되지 않는다. 시네올 신타제 활성을 나타내고 이들 효소, 특히 증가된 촉매 활성, 기질에 대한 특이성, 및/또는 안전성을 갖는 이들 효소의 변이체 중 어느 것에 대해 적어도 70%, 80%, 바람직하게는 90%의 서열 상동성을 갖는 임의의 폴리펩타이드도 사용될 수 있다. 특정의 구현예에서, 이종 시네올 신타제는 스트렙토마이세스 클라불리게루스로부터 기원한다.
임의로, 이종 리모넨 신타제를 포함하는 본 발명의 재조합 박테리아는 또한 (i) S-리모넨을 (-)-카르본으로, (ii) S-리모넨을 메톤, 멘톨, 네오멘톨 또는 이소멘톨로, 또는 (iii) R-리모넨을 (+) 카르본으로 전환시키는 경로에 속하는 1개 또는 수개의 추가의 효소를 포함할 수 있다. 따라서, 특정의 구현예에서, 재조합 데이노코쿠스 박테리아는 (i) (S)-리모넨 6-모노옥시게나제(EC 1.14.13.48) 및 카르베올 데하이드로게나제(EC1.1.1.243); (ii) (S)-리모넨 3-모노옥시게나제(EC1.14.13.47), 이소피페리텐올 데하이드로게나제(EC 1.1.1.223), (-)-이소피페리테논 리덕타제(EC1.3.1.82),(+)-시스-이소풀레곤 이소머라제, (+)-풀레곤 리덕타제(EC 1.3.1.81), (-)-멘톨 데하이드로게나제(EC 1.1.1.207) 및 (+)-네오멘톨 데하이드로게나제(EC 1.1.1.208); 및 (iii) (R)-리모넨 6-모노옥시게나제(EC 1.14.13.80) 및 (+)-트랜스-카르베올 데하이드로게나제(EC 1.1.1.243)로 이루어진 그룹으로부터 선택된 이종 리모넨 신타제 및 1개 또는 수개의 이종 효소를 발현한다.
다른 구현예에서, 본 발명의 재조합 박테리아는 이종 피넨 신타제를 암호화하는 유전자를 포함한다. 피넨 신타제는 α-피넨 신타제, 즉, 게라닐 디포스페이트로부터 α-피넨의 형성을 촉매하는 효소, 또는 β-피넨 신타제, 즉, 게라닐 디포스페이트로부터 β-피넨의 형성을 촉매하는 효소일 수 있다. 이종 피넨 신타제의 예는 아비에스 그란디스(GenBank 수탁 번호: AAB71085), 아르테미시아 안누아(Artemisia annua)(AAK58723), 칸나비스 사티바(ABI21838), 시트루스 리몬(Citrus limon)(AAM53945), 시트루스 운쉬우(BAD27256), 프라가리아 베스카(CAD57092), 피세아 아비에스(AAS47692), 피세아 시트켄시스(AAP72020) 및 슈도트수가 멘지에시이(Pseudotsuga menziesii)(AAX07267)로부터의 피넨 신타제를 포함하나, 이에 한정되지 않는다. 피넨 신타제 활성을 나타내고 상기 효소들 중 어느 것, 특히 증가된 촉매 활성, 기질에 대한 특이성, 및/또는 안전성을 갖는 상기 효소의 변이체에 대해 적어도 70%, 80%, 바람직하게는 90%의 서열 상동성을 갖는 임의의 폴리펩타이드도 사용될 수 있다.
일 구현예에서, 본 발명의 재조합 박테리아는 이종(-)-엔도-펜콜 신타제, 즉, 게라닐 디포스페이트로부터 펜콜의 형성을 촉매하는 효소를 암호화하는 유전자를 포함한다. 이종(-)-엔도-펜콜 신타제의 예는 옥시뭄 바실리쿰(GenBank 수탁 번호: AAV63790)로부터의 (-)-엔도-펜콜 신타제를 포함하나, 이에 한정되지 않는다. 엔도-펜콜 신타제 활성을 나타내고 상기 효소, 특히 증가된 촉매 활성, 기질에 대한 특이성, 및/또는 안전성을 갖는 상기 효소의 변이체에 대해 적어도 70%, 80%, 바람직하게는 90%의 서열 상동성을 갖는 임의의 폴리펩타이드도 사용될 수 있다.
일 구현예에서, 본 발명의 재조합 박테리아는 이종(-)-α-테르피네올 신타제, 즉, 게라닐 디포스페이트로부터 α-테르피네올의 형성을 촉매하는 효소를 암호화하는 유전자를 포함한다. 이종(-)-α-테르피네올 신타제의 예는 비티스 비니페라(GenBank 수탁 번호: AAS79351; AAS79352), 제아 마이스(Zea mays)(AAL59230; ABR09292), 산탈룸 알붐(Santalum album)(ACF24767), 피누스 타데아(Pinus tadea)(AAO61227) 및 마그놀리아 그란디플로라(Magnolia grandiflora)(ACC66282)로부터의 (-)-α-테르피네올 신타제를 포함하나, 이에 한정되지 않는다. α-테르피네올 신타제 활성을 나타내고 상기 효소, 특히 증가된 촉매 활성, 기질에 대한 특이성, 및/또는 안전성을 갖는 상기 효소의 변이체에 대해 적어도 70%, 80%, 바람직하게는 90%의 서열 상동성을 갖는 임의의 폴리펩타이드도 사용될 수 있다. 특정의 구현예에서, (-)α-테르피네올 신타제는 비티스 비니페라로부터 기원한다.
이종 세스퀴테르펜 신타제
일 구현예에서, 본 발명의 재조합 박테리아는 이종 세스퀴테르펜 신타제의 발현을 통해 세스퀴테르페노이드를 생산하도록 변형된 데이노코쿠스 박테리아이다. 본 발명의 재조합 데이노코쿠스 박테리아에서 발현될 수 있는 세스퀴테르펜 신타제의 예는 (+)-에피-알파-비스아볼롤 신타제(EC 4.2.3.138), 게르마크렌 A 신타제(EC 4.2.3.23),(E,E)-게르마크렌 B 신타제(EC 4.2.3.71), 게르마크렌 C 신타제(EC 4.2.3.60),(-)-게르마크렌 D 신타제(EC 4.2.3.75), 발렌센 신타제(EC 4.2.3.73),(3S, 6E)-네롤리돌 신타제(EC 4.2.3.48), 에피-세드롤 신타제(EC 4.2.3.39), 파트코울올 신타제(EC 4.2.3.70), 산탈렌 신타제(EC 4.2.3.50) 및 δ-카디넨 신타제(EC 4.2.3.13)를 포함하나, 이에 한정되지 않는다.
일 구현예에서, 본 발명의 재조합 박테리아는 이종(+)-에피-알파-비스알볼올 신타제, 즉, (2E,6E)-파르네실 디포스페이트로부터 (+)-에피-알파-비스알볼올의 형성을 촉매하는 효소를 암호화하는 유전자를 포함한다. (+)-에피-알파-비스알볼올 신타제의 예는 스트렙토마이세스 시트리콜로르(Streptomyces citricolor)(GenBank 수탁 번호: BAL14867.1; Nakano et al., 2011) 및 파일라 둘시스(Attia et al., 2012)로부터의 (+)-에피-알파-비스알볼올 신타제를 포함하나, 이에 한정되지 않는다. (+)-에피-알파-비스알볼올 신타제 활성을 나타내고 상기 효소, 특히 증가된 촉매 활성, 기질에 대한 특이성, 및/또는 안전성을 갖는 상기 효소의 변이체에 대해 적어도 70%, 80%, 바람직하게는 90%의 서열 상동성을 갖는 임의의 폴리펩타이드도 사용될 수 있다. 특정의 구현예에서, (+)-에피-알파-비스알볼올 신타제는 스트렙토마이세스 시트리콜로르로부터 기원한다.
일 구현예에서, 본 발명의 재조합 박테리아는 이종 게르마크렌 A 신타제, 즉, 파르네실 디포스페이트(FPP)의 세스퀴테르펜 게르마크렌 A로의 폐환화를 촉매하는 효소를 암호화하는 유전자를 포함한다. 이종 게르마크렌 A 신타제의 예는 아르테미시아 안누아(Artemisia annua)(GenBank 수탁 번호: ABE03980), 시코리움 인타이부스(Cichorium intybus)(AAM21658; AAM21659), 익세리스 덴타테(Ixeris dentate)(AAL92481), 락투카 사티바(lactuca sativa)(AAM11626); AAM11627), 포고스테몬 카블린(Pogostemon cablin)(AAS86321) 및 솔리다고 카나덴시스(Solidago Canadensis)(CAC36896)로부터의 게르마크렌 A 신타제를 포함하나, 이에 한정되지 않는다. 게르마크렌 A 신타제 활성을 나타내고 당해 효소, 특히 증가된 촉매 활성, 기질에 대한 특이성, 및/또는 안전성을 갖는 상기 효소의 변이체에 대해 적어도 80%, 바람직하게는 90%의 서열 상동성을 갖는 임의의 폴리펩타이드도 사용될 수 있다. 특수한 구현에에서, 게르마크렌 A 신타제는 아르테미시아 안누아 및 솔리다고 카나덴시스로부터 선택된다.
일 구현예에서, 본 발명의 재조합 박테리아는 이종 게르마크렌 B 신타제, 즉, 파르네실 디포스페이트(FPP의 세스퀴테르펜 게르마크렌 B로의 폐환화(cyclizaion)를 촉매하는 효소를 암호화하는 유전자를 포함한다. 이종 게르마크렌 B 신타제의 예는 라이코페르시콘 히르수툼(Lycopersicon hirsutum)(GenBank 수탁 번호: AAG41891)으로부터의 게르마크렌 B 신타제를 포함하나, 이에 한정되지 않는다. 게르마크렌 B 신타제 활성을 나타내고 상기 효소, 특히 증가된 촉매 활성, 기질에 대한 특이성, 및/또는 안전성을 갖는 상기 효소의 변이체에 대해 적어도 70%, 80%, 바람직하게는 90%의 서열 상동성을 갖는 임의의 폴리펩타이드도 사용될 수 있다.
일 구현예에서, 본 발명의 재조합 박테리아는 이종 게르마크렌 C 신타제, 즉, 파르네실 디포스페이트(FPP)의 세스퀴테르펜 게르마크렌 C로의 폐환화를 촉매하는 효소를 암호화하는 유전자를 포함한다. 이종 게르마크렌 C 신타제의 예는 라이코페르시콘 에스쿨렌툼(GenBank 수탁 번호: AAC39432)으로부터의 게르마크렌 C 신타제를 포함하나, 이에 한정되지 않는다. 게르마크렌 B 신타제 활성을 나타내고 상기 효소, 특히 증가된 촉매 활성, 기질에 대한 특이성, 및/또는 안전성을 갖는 상기 효소의 변이체에 대해 적어도 70%, 80%, 바람직하게는 90%의 서열 상동성을 갖는 임의의 폴리펩타이드도 사용될 수 있다.
일 구현예에서, 본 발명의 재조합 박테리아는 이종 게르마크렌 D 신타제, 즉, 파르네실 디포스페이트(FPP)의 세스퀴테르펜 게르마크렌 D로의 폐환화를 촉매하는 효소를 암호화하는 유전자를 포함한다. 이종 게르마크렌 D 신타제의 예는 라이코페르시콘 시르수툼(GenBank 수탁 번호: AAG41892), 옥시뭄 바실리쿰(AAV63786), 포고스테몬 카블린(Pogostemon cablin)(AAS86320, AAS86322), 포풀루스 트리코카르파 엑스 포풀루스 델토이데스(Populus trichocarpa x Populus deltoides)(AAR99061), 솔리다고 카나덴시스(Solidago Canadensis)(AAR31144, AAR31145), 비티스 비니페라(AAS66357) 및 진기베르 오피시날레(Zingiber officinale)(AAX40665)으로부터의 게르마크렌 D 신타제를 포함하나, 이에 한정되지 않는다. 게르마크렌 D 신타제 활성을 나타내고 상기 효소, 특히 증가된 촉매 활성, 기질에 대한 특이성, 및/또는 안전성을 갖는 상기 효소의 변이체에 대해 적어도 70%, 80%, 바람직하게는 90%의 서열 상동성을 갖는 임의의 폴리펩타이드도 사용될 수 있다.
일 구현예에서, 본 발명의 재조합 박테리아는 이종 발렌센 신타제, 즉, 파르네실 디포스페이트(FPP)로부터 발렌센의 형성을 촉매하는 효소를 암호화하는 유전자를 포함한다. 이종 발렌센 신타제의 예는 비티스 비니페라(UniProt 수탁 번호 Q6Q3H2) 및 시트루스 시넨시스(Citrus sinensis)(Q71MJ3)로부터의 발렌센 신타제를 포함하나, 이에 한정되지 않는다. 발렌센 신타제 활성을 나타내고 상기 효소 중 어느 것, 특히 증가된 촉매 활성, 기질에 대한 특이성, 및/또는 안전성을 갖는 상기 효소의 변이체에 대해 적어도 70%, 80%, 바람직하게는 90%의 서열 상동성을 갖는 임의의 폴리펩타이드도 사용될 수 있다.
일 구현예에서, 본 발명의 재조합 박테리아는 이종 파트코울올 신타제, 즉, 파르네실 디포스페이트(FPP)로부터 파트코울올의 형성을 촉매하는 효소를 암호화하는 유전자를 포함한다. 이종 파트코울올 신타제의 예는 알파- 및 베타-파트코울렌, 알파-불네센, 세이콜렌, 포고스톨 및 알파-구이아엔을 포함하는 추가의 세스퀴테르펜을 생산하는 포고스테몬 카블린(UniProt 수탁 번호 Q49SP3)을 포함하나, 이에 한정되지 않는다. 파트코울올 신타제 활성을 나타내고 상기 효소, 특히 증가된 촉매 활성, 기질에 대한 특이성, 및/또는 안전성을 갖는 변이체에 대해 적어도 70%, 80%, 바람직하게는 90%의 서열 상동성을 갖는 임의의 폴리펩타이드도 사용될 수 있다.
일 구현예에서, 본 발명의 재조합 박테리아는 이종 에피-세드롤 신타제, 즉, 파르네실 디포스페이트 또는 게라닐 디포스페이트로부터 8-에피-세드롤의 형성을 촉매하는 효소를 암호화하는 유전자를 포함한다. 이종 에피-세드롤 신타제는 아르테미시아 안누아(Genbank 수탁 번호: AAF80333, CAC08805)로부터의 에피-세드롤 신타제를 포함하나, 이에 한정되지 않는다. 에피-세드롤 신타제 활성을 나타내고 상기 효소 중 어느 것, 특히 증가된 촉매 활성, 기질에 대한 특이성, 및/또는 안전성을 가진 변이체에 대해 적어도 70%, 80%, 바람직하게는 90%의 서열 상동성을 지닌 임의의 폴리펩타이드도 사용될 수 있다.
일 구현예에서, 본 발명의 재조합 박테리아는 이종(3S, 6E)-네롤리돌 신타제, 즉, 파르네실 디포스페이트를 네롤리돌로 전환시키는 효소를 암호화하는 유전자를 포함한다. 이종 네롤리돌 신타제의 예는 셀라기넬라 모엘렌도르피이(Selaginella moellendorffii)(Uniprot 수탁 번호 D8RNZ9), 포풀루스 트리코카르파(Populus trichocarpa)(F8TWD1), 메디카고 트룬카툴(Q5UB06), 프라가리아 엑스 아나나싸(P0CV94) 및 제아 마이스(Degenhardt and Gershenzon, 2000)로부터의 네롤리돌 신타제를 포함하나, 이에 한정되지 않는다. 네롤리돌 신타제 활성을 나타내고 상기 효소 중 어느 것, 특히 증가된 촉매 활성, 기질에 대한 특이성, 및/또는 안전성을 갖는 상기 효소의 변이체에 대해 적어도 70%, 80%, 바람직하게는 90%의 서열 상동성을 갖는 임의의 폴리펩타이드도 사용될 수 있다. 특정의 구현예에서, 이종 네롤리돌 신타제는 프라가리아 엑스 아나나싸로부터 선택된다.
일 구현예에서, 본 발명의 재조합 박테리아는 이종 산탈렌 신타제, 즉, 파르네실 디포스페이트로부터 알파-산탈렌, 베타-산탈렌, 에피-베타-산탈렌, 엔도-베타-베르가모텐 및/또는 엑소-알파-베르가모텐의 형성을 촉매하는 효소를 암호화하는 유전자를 포함한다. 이종 산탈렌 신타제의예는 살라눔 하브로카이테스(Solanum habrochaites)(Uniprot: B8XA41), 산탈룸 스피카툼(Santalum spicatum)(Uniprot: E3W202), 산탈룸 아우스트로칼레도니쿰(Santalum austrocaledonicum)(Uniprot: E3W203), 산탈룸 스피카툼(Santalum spicatum)(Uniprot: E3W204)으로부터의 산탈렌 신타제를 포함하나, 이에 한정되지 않는다. 산탈렌 신타제 활성을 나타내고 상기 효소 중 어느 것, 특히 증가된 촉매 활성, 기질에 대한 특이성, 및/또는 안전성을 갖는 상기 효소의 변이체에 대해 적어도 70%, 80%, 바람직하게는 90%의 서열 상동성을 갖는 임의의 폴리펩타이드도 사용될 수 있다.
일 구현예에서, 본 발명의 재조합 박테리아는 δ-카디넨 신타제, 즉, 트랜스, 트랜스-파르네실 디포스페이트(FPP)의 (+)-델타 카디넨으로의 폐환화를 촉매하는 효소를 암호화하는 유전자를 포함한다. 이종 δ-카디넨 신타제의 예는 고씨피움 히르수툼(Gossypium hirsutum)(GenBank 수탁 번호: AAF74977, AAC12784), 고시피움 아르보레툼(Gossypium arboretum)(GenBank 수탁 번호 CAA65289, Uniprot Q39761) 및 헬리안투스 안누우스(Helianthus annuus)(Q4U3F6)로부터의 δ-카디넨 신타제를 포함하나, 이에 한정되지 않는다. δ-카디넨 신타제 활성을 나타내고 상기 효소 중 어느 것, 특히 증가된 촉매 활성, 기질에 대한 특이성, 및/또는 안전성을 갖는 상기 효소의 변이체에 대해 적어도 70%, 80%, 바람직하게는 90%의 서열 상동성을 갖는 임의의 폴리펩타이드도 사용될 수 있다. 특정의 구현예에서, 이종 δ-카디넨 신타제카디넨 신타제는 고씨피움 아르보레툼으로부터 선택된다.
이종 이소프렌 신타제
다른 국면에서, 본 발명은 이종 이소프렌 신타제를 암호화하는 유전자를 포함하는 재조합 데이노코쿠스 박테리아에 관한 것이다.
본 발명의 다른 국면에 대한 본원에 기술된 모든 구현예는 당해 국면에 또한 포함된다. 특히, 재조합 데이노코쿠스 박테리아는 또한 (i) 임의로 증진된 DXP 신타제와 함께, 위에서 기술된 바와 같은 향상된 MEP 경로, (ii) 이종 MEV 경로, (iii) FPP 신타제 활성의 증가, (iv) 라이코펜 베타-사이클라제의 불활성화 및/또는 (v) 본원에 기술된 바와 같은 이종 테르펜 신타제의 발현을 나타낼 수 있다.
바람직한 구현예에서, 이종 이소프렌 신타제를 암호화하는 유전자를 포함하는 재조합 데이노코쿠스 박테리아는 dxs, dxr, ispD, ispE, ispF ispG로 이루어진 그룹으로부터 선택된 적어도 하나의 유전자를 과발현하며, 바람직하게는 dxs, dxr, ispD, ispE, ispF ispG 유전자를 과발현한다.
이종 이소프렌 신타제는 디메틸알릴 디포스페이트로부터 이소프렌의 형성을 촉매하는 임의의 효소일 수 있다. 이소프렌 신타제의 예는 바실루스 서브틸리스(Bacillus subtilis)(Hess et al. 2013), 포풀루스 알바(Populus alba)(Lv et al. 2013; Yang et al. 2012; Uniprot: Q50L36), 포풀루스 트레물로이데스(Populus tremuloides)(Uniprot: Q7XAS7), 푸에라리아 몬타나(Pueraria montana)(Whited et al., 2010; Miller et al., 2001; Sharkey et al., 2005) 및 퀘르쿠스 로부르(Quercus robur)(Lehning et al., 1999)로부터의 이소프렌 신타제를 포함하나, 이에 한정되지 않는다.
파르네실 디포스페이트 신타제
또한, 본원의 발명자들은 데이노코쿠스 박테리아에서 이소프레노이드의 생산을 조절하여 목적한 화합물의 생산 및/또는 축적을 촉진할 수 있음을 입증하였다. 이와 관련하여, 이들은 파르네실 디포스페이트 신타제 활성(EC 2.5.1.10), 디메틸알릴 트랜스트랜스퍼라제 활성(EC 2.5.1.1) 및 게라닐게라닐 디포스페이트 신타제 활성(EC 2.5.1.29)을 나타내는 데이노코쿠스 게오테르말리스(Deinococcus geothermalis)의 효소를 확인하고 당해 효소의 과발현이 모노테르펜의 손상에 대해 디테르펜, 트리테르펜, 세스퀴테르펜, 및 카로테노이드와 같은 10개 이상의 C-원자를 갖는 이소프레노이드의 생산을 촉진함을 관찰하였다.
따라서, 추가의 국면에서, 본 발명은 파르네실 디포스페이트 신타제 활성을 갖는 분리된 폴리펩타이드에 관한 것이며, 당해 폴리펩타이드는
a) 서열 번호 47의 아미노산 서열의 모두 또는 활성 부분을 포함하는 폴리펩타이드;
b) 서열 번호 47에 대해 적어도 60, 65, 70, 75, 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98 또는 99% 서열 상동성, 바람직하게는 서열 번호 47에 대해 적어도 70, 75, 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98 또는 99% 서열 상동성을 갖는 아미노산을 갖는 폴리펩타이드;
c) 서열 번호 46에 대해 적어도 60, 65, 70, 75, 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98 또는 99% 서열 상동성, 바람직하게는 서열 번호 46에 대해 적어도 70, 75, 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98 또는 99% 서열 상동성을 갖는 뉴클레오타이드 서열에 의해 암호화된 폴리펩타이드; 또는
d) 중간/높은 스트링전시, 바람직하게는 높거나 매우 높은 스트링전시 하에서 (i) 서열 번호 46에 설정된 핵산 서열, (ii) 이의 상보성 쇄, 또는 (iii) (i) 또는 (ii)의 서브서열과 하이브리드화할 수 있는 핵산 서열에 의해 암호화된 폴리펩타이드로 이루어진 그룹으로부터 선택된다.
바람직하게는, 본 발명의 폴리펩타이드는 또한 디메틸알릴트랜스트랜스퍼라제(EC 2.5.1.1) 및/또는 게라닐게라닐 디포스페이트 신타제(EC 2.5.1.29) 활성, 보다 바람직하게는 디메틸알릴트랜스트랜스퍼라제 및 게라닐게라닐 디포스페이트 신타제 활성을 나타낸다.
뉴클레오타이드 프로브(probe)와 동종 DNA 또는 RNA 서열 사이의 하이브리드화를 측정하기에 적합한 실험 조건은 DNA 단편 또는 RNA를 함유하는 필터를 예비침지(presoaking)시켜 5xSSC(10분 동안 염화나트륨/시트르산나트륨), 및 5xSSC, 5x덴하르트 용액(Denhardt's solution), 0.5% SDS 및 100㎍/ml의 변성된 초음파처리된 연어 정자 DNA의 용액 속에서 상기 여과기의 예비하이브리드화에 이어서, 10ng/ml 농도의 무작위-프라이밍된(random-primed) 32P-dCTP-표지된(특이적인 활성 >1x109 cpm/㎍) 프로브를 함유하는 동일한 용액 속에서 12시간 동안 약 45℃에서 하이브리드화함을 포함한다(Feinberg and Vogelstein, 1983). 다양한 스트링전시 조건을 위해 여과기를 이후 30분 동안 2xSSC, 0.5% SDS 및 적어도 55℃(약한 스트링전시), 보다 바람직하게는 적어도 60℃(중간 스트링전시), 여전히 보다 바람직하게는 적어도 65℃(중간/강한 스트링전시), 심지어 보다 바람직하게는 적어도 70℃(높은 스트링전시), 및 심지어 보다 바람직하게는 적어도 75℃(매우 높은 스트링전시)에서 2회 세척한다.
본 발명은 또한 본 발명의 폴리펩타이드를 암호화하는 핵산에 관한 것이다. 핵산은 DNA(cDNA 또는 gDNA), RNA, 또는 2개의 혼합물일 수 있다. 이는 일본쇄 형태(single stranded form) 또는 이본쇄 형태(duplex form) 또는 둘의 혼합물일 수 있다. 이는 예를 들면, 변형된 결합, 변형된 푸린 또는 피리미딘 염기, 또는 변형된 당을 포함하는 변형된 뉴클레오타이드일 수 있다. 이는 화학적 합성, 재조합, 및 돌연변이유발을 포함하는, 당해 분야의 숙련가에게 공지된 임의의 방법으로도 제조할 수 있다. 본 발명에 따른 핵산은 본 발명에 따른 폴리펩타이드의 서열로부터 유추될 수 있으며 코돈(codon) 용도는 상기 핵산이 전사되는 숙주 세포에 따라 채택될 수 있다. 이들 단계는 당해 분야의 숙련가에게 공지된 방법에 따라 수행될 수 있으며 이의 일부는 참조 매뉴얼(Sambrook et al.(Sambrook et al., 2001)에 기술되어 있다.
본 발명은 또한 조절 서열과 혼용성인 조건 하에서 적합한 숙주 세포내에서 상기 핵산의 발현을 지시하는 하나 이상의 조절 서열에 작동적으로 연결된, 본 발명에 따른 폴리펩타이드를 암호화하는 핵산을 포함하는 발현 카세트에 관한 것이다.
상기 조절 서열은 숙주 세포에 의해 인식된 프로모터를 포함할 수 있다. 프로모터는 상기 효소의 발현을 매개하는 전사 조절 서열을 함유한다. 상기 프로모터는 데이노코쿠스 박테리아에서 전사 활성을 나타내는 임의의 폴리뉴클레오타이드, 특히 야생형이거나, 돌연변이되거나, 변성되거나 합성의 프로모터일 수 있다. 프로모터는 천연의, 동종의 또는 이종의 프로모터일 수 있다. 바람직한 프로모터는 천연 또는 동종이다. 이와 관련하여, 다양한 프로모터를 연구하였으며 데이노코쿠스 박테리아에서 유전자 발현을 위해 사용하였다. 적합한 프로모터의 예는 해독 연장 인자 Tu 유전자 tufA(DR0309) 및 tufB(DR2050)로부터의 PtufA 및 PtufB 프로모터, pI3에 위치한 resU 유전자의 프로모터, groESL 오페론의 프로모터 영역 PgroESL(Lecointe et al, 2004; Meima et al, 2001), 또는 이러한 프로모터의 유도체를 포함한다.
조절 서열은 또한 전사 터미네이터일 수 있으며, 이는 데이노코쿠스 박테리아에 의해 인식되어 전사를 종결한다. 터미네이터는 유전자의 3'-말단에 작동적으로 연결된다. 데이노코쿠스 박테리아내에서 작용성인 임의의 터미네이터도 본 발명에서 사용될 수 있다(Lecointe et al, 2004).
임의로, 발현 카세트는 재조합 박테리아의 용이한 선택을 허용하는 선택가능한 마커를 포함할 수 있다. 전형적으로, 선택가능한 마커는 항생제 내성을 암호화하거나 자가영양을 부여하는 유전자이다.
본 발명은 또한 본 발명에 따른 핵산 또는 발현 카세트를 포함하는 발현 벡터에 관한 것이다. 상기 발현 벡터는 숙주 세포, 바람직하게는 데이노코쿠스 숙주 세포를 형질전환시키고 상기 세포내에서 본 발명의 핵산을 발현시키는데 사용될 수 있다. 벡터의 선택은 전형적으로 상기 벡터와 상기 벡터가 도입되는 숙주 세포의 혼용성에 의존한다. 벡터는 자가 복제하는 벡터, 즉, 염색체외 실체(extra-chromosomal entity)로서 존재하며, 이의 복제가 염색체 복제와는 독립적인 벡터, 예를 들면, 플라스미드, 염색체외 성분, 미니-염색체(mini-chromosome), 또는 인공 염색체일 수 있다. 벡터는 자가-복제를 보증하는 임의의 수단도 함유할 수 있다. 또한, 벡터는 숙주 세포내로 도입되는 경우 게놈내로 통합되어 이것이 통합된 염색체(들)과 함께 복제하는 것일 수 있다.
벡터는 바람직하게는 벡터를 포함하는 숙주 세포의 용이한 선택을 허용하는 하나 이상의 선택가능한 마커를 포함한다. 선택가능한 마커는 이의 생성물이 살생물제 또는 바이러스 내성, 중금속에 대한 내성, 자가영양에 대한 원영양체 등을 제공하는 유전자이다.
벡터는 바람직하게는 상기 벡터의 숙주 세포의 게놈내로의 통합 또는 게놈과 독립적으로 세포내에서 상기 벡터의 자가 복제를 허용하는 요소를 포함한다. 숙주 세포 게놈내로 통합되는 경우, 게놈내로 서열의 통합은 동종 또는 비-동종 재조합에 의존할 수 있다. 한편, 벡터는 정밀한 위치에서 숙주 세포의 게놈내로 동종 재조합에 의한 통합을 지시하기 위한 추가의 폴리뉴클레오타이드를 함유할 수 있다. 이들 추가의 폴리뉴클레오타이드는 숙주 세포의 게놈내에서 표적 서열과 동종인 임의의 세포일 수 있다. 한편, 벡터는 비-동종 재조합에 의해 숙주 세포의 게놈내로 통합될 수 있다.
자가 재복제의 경우, 벡터는 벡터가 문제의 숙주 세포내에서 자가 복제하도록 할 수 있는 복제 오리진(origin of replication)을 추가로 포함할 수 있다. 복제 오리진은 세포내에서 작용하는 자가 복제를 매개하는 임의의 플라스미드 레플리케이터(plasmid replicator)일 수 있다. 용어 "복제 오리진" 또는 "플라스미드 레플리케이터"는 생체내(in vivo)에서 플라스미드 또는 벡터가 복제할 수 있도록 하는 폴리뉴클레오타이드를 의미한다.
발현이 바람직한 숙주 세포에 따라 이들 요소를 선택하는 방법은 당해 분야의 숙련가에게 잘 공지되어 있다. 벡터는 당해 분야의 숙련가에게 잘 공지된, 분자 생물학의 전통적인 기술에 의해 작제될 수 있다.
본 발명은 또한 세포, 바람직하게는 데이노코쿠스 박테리아를 형질전환, 형질감염 또는 형질유도하기 위한 본 발명에 따른 핵산, 발현 카세트 또는 발현 벡터의 용도에 관한 것이다. 본 발명은 또한 본 발명에 따른 핵산, 카세트 또는 발현 벡터를 포함하는 숙주 세포, 바람직하게는 데이노코쿠스 박테리아에 관한 것이다.
숙주 세포는 일시적으로 또는 안정한 방식으로 형질전환되거나, 형질감염되거나 형질유도될 수 있다. 본 발명의 발현 카세트 또는 벡터는 숙주 세포내로 도입되어 카세트 또는 벡터가 앞서 기술된 바와 같이 염색체 통합체로서 또는 자가-복제하는 염색체외 벡터로서 유지되도록 한다. 용어 "숙주 세포"는 또한 복제 동안 발생하는 돌연변이로 인하여 모 숙주 세포와는 동일하지 않는 모 숙주 세포의 임의의 후대도 포함한다.
본 발명에 따른 핵산, 발현 카세트 또는 발현 벡터는 전기천공(electroporation), 접합, 형질유도, 상보체 세포 형질전환, 원형질 형질전환, 원형질 융합, 바이오리스틱(biolistic) "유전자 총" 형질전환, PEG-매개된 형질전환, 지질-보조된 형질전환 또는 형질감염, 화학적으로 매개된 형질감염, 아세트산리튬-매개된 형질전환, 리포좀-매개된 형질전환과 같이, 당해 분야의 숙련가에게 공지된 임의의 방법에 의해서도 숙주 세포내로 도입될 수 있다.
임의로, 본 발명의 핵산, 카세트 또는 벡터의 하나 이상의 카피를 숙주 세포내로 삽입할 수 있다.
위에서 언급한 바와 같이, 본 발명자들은 FPP 신타제의 과발현이 모노테르펜의 손상에 대해 디테르펜, 트리테르펜, 세스퀴테르펜, 및 카로테노이드와 같은 10개 이상의 C-원자를 갖는 이소프레노이드의 생산을 촉진함을 관찰하였다.
따라서, 본 발명은 또한 재조합 데이노코쿠스 박테리아에 관한 것이며, 여기서 FPP 신타제 활성은 증가되어 있다. 바람직하게는, FPP 신타제 활성은 FPP 신타제를 암호화하는 천연의, 동종 또는 이종 유전자, 즉, ispA 유전자의 과발현에 의해 증가되어 있다. 유전자 과발현은 위에서 기술한 바와 같이 수득될 수 있다.
과발현된 FPP 신타제는 임의의 이종 FPP 신타제일 수 있다. 이종 FPP 신타제의 예는 사카로마이세스 세레비지아에(Uniprot Q12051)로부터 또는 E.coli(Uniprot P22939)로부터의 FPP 신타제를 포함하나, 이에 한정되지 않는다. 특수한 구현에에서, 본 발명의 재조합 박테리아는 E.coli로부터의 FPP 신타제를 발현한다.
바람직한 구현예에서, 과발현된 FPP 신타제는 데이노코쿠스 박테리아로부터 기원한다. 특히, 과발현된 FPP 신타제는 위에서 기술한 바와 같고 파르네실 디포스페이트 신타제 활성, 바람직하게는 파르네실 디포스페이트 신타제, 디메틸알릴트랜스트랜스퍼라제 및 게라닐게라닐 디포스페이트 신타제 활성을 갖는 본 발명의 폴리펩타이드이다. 바람직하게는, 과발현된 FPP 신타제는 디. 게오테르말리스로부터의 FPP 신타제, 특히 서열 번호 47에 설정된 아미노산 서열 모두 또는 이의 일부를 갖는 FPP 신타제이다.
또한, 파르네실 디포스페이트 신타제, 디메틸알릴트랜스트랜스퍼라제 및 게라닐게라닐 디포스페이트 신타제 활성은 별도의 폴리펩타이드에 의해 수반될 수 있으며 증가된 활성은 별도의 암호화된 유전자의 과발현으로부터 생성될 수 있다.
본 발명자들은, 서열 번호 47에 설정된 FPP 신타제에서 K170G 치환이 GPP에 대한 탄소 플럭스의 재지시 및 따라서 모노테르펜의 생산을 유도함을 입증하였다. 실제로, FPPS에서 K170G 돌연변이는 모노테르펜 생합성에 대한 GPP 방출을 허용한다(Blanchard and Karst, 1993; Fischer et.al, 2011). 따라서, 게라니올과 같은 모노테르펜의 생산이 바람직한 경우, 내인성 FPP 신타제를 K170G 돌연변이로 대체할 수 있다. 본 출원에서, 다음의 기술을 사용하여 치환을 지정한다: K170G는 서열 번호 47의 170번 위치에서의 아미노산(라이신, K)이 글리신(G)으로 변화됨을 나타낸다.
따라서, 본 발명은 또한 서열 번호 47에서 170번 위치에 상응하는 위치에서 라이신 잔기가 글리신(상기 상응하는 위치는 잘 알려진 정렬 알고리즘을 사용하여 숙련가에 의해 용이하게 확인될 수 있다)으로 치환된 본 발명의 폴리펩타이드, 상기 폴리펩타이드를 암호화하는 핵산, 상기 핵산을 포함하는 발현 카세트 또는 벡터 및 상기 돌연변이된 FPP 신타제를 발현하는 재조합 데이노코쿠스 박테리아에 관한 것이다. 바람직하게는, 상기 재조합 박테리아는 또한 이종 테르펜 신타제, 바람직하게는 모노테르펜 신타제를 발현한다. 상기 재조합체는 바람직하게는 모노테르펜을 생산하는데 사용된다.
본 발명의 다른 국면을 위해 본원에 기술된 모든 구현예는 당해 국면에 또한 포함된다. 특히, 재조합 데이노코쿠스 박테리아는 (i) 임의로 향상된 DXP 신타제와 함께 위에서 기술한 바와 같은 향상된 MEP 경로, (ii) 이종 MEV 경로, (iii) 라이코펜 베타-사이클라제의 불활성 및/또는 (iv) 본원에 기술된 바와 같은 이종 테르펜 또는 이소프렌 신타제의 발현을 추가로 나타낼 수 있다.
내인성 라이코펜 베타-사이클라제의 불활성화
본 발명자들은 또한 내인성 라이코펜 베타-사이클라제의 불활성화가 라이코펜의 과생산/축적을 유도함을 입증하였다.
따라서, 다른 국면에서, 본 발명은 재조합 데이노코쿠스 박테리아에 관한 것이며, 여기서 내인성 라이코펜 베타-사이클라제 활성이 감소되거나 억제되어 있다.
라이코펜 베타-사이클라제(EC 5.5.1.19)는 라이코펜으로부터 베타-카로텐으로의 반응을 중간 감마-카로텐을 경유해서 촉매한다. 라이코펜 베타-사이클라제의 예는 서열 번호 51에 설정된 아미노산 서열을 갖는 디. 게오테르말리스, 디. 포에니시스(Genbank 수탁 번호: EYB66908), 디. 아파첸시스(WP_019585057), 디. 아쿠아틸리스(WP_019008078), D. gobiensis(WP_014685779), 디. 울루무퀴엔시스(WP_017870547), 디. 마리코펜시스(WP_013556733) 및 디. 라디오두란스(WP_010887447)의 라이코펜 베타-사이클라제를 포함하나, 이에 한정되지 않는다.
라이코펜 베타-사이클라제를 암호화하는 유전자는 디. 게오테르말리스의 라이코펜 베타-사이클라제를 암호화하는 핵산(서열 번호 50)과의 상동성을 기준으로 용이하게 확인할 수 있다.
라이코펜 베타-사이클라제 활성은 숙련가에게 공지된 임의의 방법을 사용하여 감소시키거나 억제할 수 있다. 바람직하게는, 라이코펜 베타-사이클라제를 암호화하는 유전자는 예를 들면, 상기 유전자 전부 또는 일부의 결실에 의해, 비센스 코돈(nonsense codon), 프레임쉬프트(frameshift)를 유도하는 유전자 또는 돌연변이를 도입시킴에 의해 숙련가에게 공지된 임의의 방법으로도 불활성화된다. 바람직한 구현예에서, 라이코펜 베타-사이클라제를 암호화하는 유전자는 결실된다.
특정의 구현예에서, 파이토엔 신타제(EC 2.5.1.32) 및 파이토엔 데사투라제(EC 1.3.99.28)를 암호화하는 유전자는 과발현되어 라이코펜 생산을 증가시킨다. 유전자는 천연, 동종 또는 이종 유전자, 바람직하게는 천연 또는 동종 유전자일 수 있다.
다른 특정의 구현예에서, 감소되거나 억제된 라이코펜 베타-사이클라제 활성을 가지고, 임의로 파이토엔 신타제 및 파이토엔 데사투라제를 암호화하는 유전자를 과발현하는 재조합 박테리아는 라이코펜으로부터 아포카로테노이드의 형성을 촉매하는 이종 카로테노이드 절단 디옥시게나제(CCD)를 암호화하는 유전자를 추가로 포함한다.
다른 특정의 구현예에서, 감소되거나 억제된 라이코펜 베타-사이클라제 활성을 가지고, 임의로 파이토엔 신타제 및 파이토엔 데사투라제를 암호화하는 유전자를 과발현하는 재조합 박테리아는 또한 라이코펜으로부터 δ-카로텐의 형성을 촉매하는 이종 라이코펜 엡실론 사이클라제(EC 5.5.1.18)를 암호화하는 유전자 및 임의로 δ-카로텐으로부터 아포카로테노이드의 형성을 촉매하는 이종의 카로테노이드 절단 디옥시게나제(CCD)를 암호화하는 유전자를 포함한다.
카로테노이드 절단 디옥시게나제의 예는 문헌(Auldridge et al.(2006))에 개시된 CCD, 예를 들면, 아라비돕시스 탈리아나, 루부스 이다에우스(Rubus idaeus)제아 마이스(Zea mais)로부터의 CCD를 포함하나, 이에 한정되지 않는다.
본 발명의 다른 국면을 위해 본원에 기술된 모든 구현예는 본 국면에 또한 포함된다. 특히, 재조합 데이노코쿠스 박테리아는 또한 (i) FPP 신타제 활성의 증가 및 (ii) 임의로 위에서 기술된 바와 같은 증진된 DXP 신타제와 함께, 상기 기술된 바와 같은 향상된 MEP 경로, (iii) 이종 MEV 경로 및/또는 (iv) 위에서 기술된 바와 같은 이종 테르펜 또는 이소프렌 신타제의 발현을 나타낼 수 있다.
이소프레노이드 화합물의 생산 방법
추가의 국면에서, 본 발명은 테르펜 또는 테르페노이드 화합물을 생산하기 위한 위에서 기술된 바와 같은 재조합 데이노코쿠스 박테리아의 용도에 관한 것이다. 본 발명은 또한 (i) 본 발명에 따른 재조합 데이노코쿠스 박테리아를 테르펜 또는 테르페노이드를 생산하기에 적합한 조건하에서 배양하는 단계 및 임의로 (ii) 테르펜 또는 테르페노이드를 회수하는 단계를 포함하는, 테르펜 또는 테르페노이드의 생산 방법에 관한 것이다.
테르펜 또는 테르페노이드 화합물은 위에서 기술된 바와 같은 재조합 데이노코쿠스 박테리아에 의해 생산된 임의의 테르펜 또는 테르페노이드 화합물일 수 있다.
일 구현예에서, 본 발명의 재조합 데이노코쿠스 박테리아는 카로테노이드 화합물(C40)과 같이 10개 이상의 C-원자를 갖는 이소프레노이드를 생산하는데 사용된다. 특히, 본 발명은 (i) 본 발명에 따른 재조합 데이노코쿠스 박테리아를 카로테노이드 화합물을 생산하기에 적합한 조건하에서 배양하는 단계 및 임의로 (ii) 카로테노이드 화합물을 회수하는 단계를 포함하는, 카로테노이드 화합물의 생산 방법에 관한 것이다. 카로테노이드 화합물은 라이코펜 또는 라이코펜으로부터 유도된 다른 어느 카로테노이드 화합물, 바람직하게는 디이녹산틴일 수 있다. 특정의 구현예에서, 재조합 데이노코쿠스 박테리아는 FPP 신타제, 바람직하게는 데이노코쿠스 FPP 신타제 및 보다 바람직하게는 상기 기술된 바와 같은 본 발명의 FPP 신타제를 과발현한다.
일 구현예에서, 재조합 데이노코쿠스 박테리아는 위에서 기술한 바와 같은 이종 테르펜 신타제를 포함하며 게라니올, (+)-리날룰, (-)-리날룰, S-리모넨, R-리모넨, α-피넨, β-피넨, 펜콜, 테르피네올, (-)-카르본, (+)-(S)-카르본, 멘톤, 이소멘톤, 멘톨, 노에멘톨, (S,E)-네롤리돌, 8-에피-세드롤, 비스알볼올, 게르마크렌 A, 게르마크렌 B, 게르마크렌 C, 게르마크렌 D, 발렌센, 파트코울올, 산탈렌 및 δ-카디넨으로 이루어진 그룹으로부터 선택된 테르펜 또는 테르페노이드 화합물을 생산할 수 있다.
상기 방법은 또한 테르펜 또는 테르페노이드를 테르펜 유도체, 예를 들면, 마이르센으로부터 수득된 마이르세놀 및 디하이드로마이르세닐 아세테이트; 펜콜로부터 수득된 펜칠 및 보르네올 유도체; 발렌센 또는 (-)-베타-피넨으로부터 수득된누트카톤; 리날릴 포르메이트, 리날릴 아세테이트, 리날릴 프로피오네이트, 리날릴 부티레이트, 리날릴 이소부티레이트 및 란반줄릴 아세테이트와 같이 리날룰로부터 수득된 리날릴 및 라반둘릴 에스테르; 시트로넬릴 포르메이트, 시트로넬릴 아세테이트, 시트로넬릴 프로피오네이트, 시트로넬릴 이소부티레이트, 시트로넬릴 이소발러레이트, 시트로넬릴 티글레이트, 시트로넬산 니트릴(또는 시트로넬릴 니트릴)과 같은 시트로넬롤로부터 수득된 시트로넬릴 및 디하이드로미르세닐 에스테르; 게라닐 포르메이트, 게라닐 아세테이트, 게라닐 프로피오네이트, 게라닐 이소부티레이트, 네릴 아세테이트, 메틸 게라네이트(또는 게란산 메틸 에스테르) 및 게란산 니트릴(또는 게라노니트릴)과 같은 게라니올로부터 수득된 게라닐 에스테르를 포함할 수 있다. 바람직하게는, 테르펜 유도체는 테르펜 에스테르, 보다 바람직하게는 게라닐 에스테르이다.
테르펜 또는 테르페노이드로부터 테르펜 유도체를 수득하는 방법은 숙련가에게 잘 공지되어 있다. 예를 들면, 이러한 방법은 문헌(Common Fragrance and Flavor Materials: Preparation, Properties and Uses, 5th ed. H. Surburg and J. Panten, John Wiley & Sons, 2006)에 개시되어 있다.
테르펜 또는 테르페노이드를 생산하기에 적합한 조건은 본 발명에 사용된 데이노코쿠스 박테리아에 따라 숙련가에 의해 용이하게 측정될 수 있다. 특히, 탄소원은 크실로즈 및 아라비노즈와 같은 C5 당, 글루코즈, 셀로비오즈, 사카로즈 및 전분과 같은 C6 당으로 이루어진 그룹으로부터 선택될 수 있다. 데이노코쿠스 박테리아가 셀룰로즈분해 또는 크실라놀분해 활성을 나타내는 경우, 보다 복합한 탄소원, 예를 들면, 셀룰로즈성 또는 리그노셀룰로즈성 생물량(biomass)을 사용할 수 있다. 온도 조건을 또한 중온성 또는 호열성 데이노코쿠스 박테리아의 사용에 따라 채택할 수 있다.
다른 국면에서, 본 발명은 (i) 본 발명에 따른 재조합 데이노코쿠스 박테리아를 테르펜 또는 테르페노이드를 생산하기에 적합한 조건 하에서 배양하는 단계 및 임의로 상기 테르펜 또는 테르페노이드를 회수하는 단계, 및 (iii) 상기 테르펜 또는 테르페노이드를 테르펜 유도체로 전환시키는 단계, 및 임의로 (iv) 상기 테르펜 유도체를 회수하는 단계를 포함하여, 테르펜 유도체, 특히 위에서 기술된 바와 같은 테르펜 유도체를 생산하는 방법에 관한 것이다. 단계 (iii)은 화학적 또는 효소적 전환일 수 있다.
바람직하게는, 테르펜 또는 테르페노이드는 게라니올 및/또는 게란산이고 테르펜 유도체는 게라닐 에스테르이다.
본 발명자들은, 변형되지 않은 데이노코쿠스 박테리아가 게라니올을 게라니알 및 게란산으로 전환시킬 수 있음을 발견하였다. 따라서, 특정의 구현예에서, 본 발명은 게라니올, 게라니알 및/또는 게란산을 생산하기 위한 본 발명의 재조합 데이노코쿠스 박테리아의 용도에 관한 것이다. 본 발명은 또한 (i) 본 발명에 따른 재조합 데이노코쿠스 박테리아를 게라니올, 게라니알 및/또는 게란산을 생산하기에 적합한 조건 하에서 배양하는 단계 및 임의로 (ii) 게라니올, 게라니알 및/또는 게란산을 회수하는 단계를 포함하여, 게라니올, 게라니알 및/또는 게란산을 생산하는 방법에 관한 것이다.
바람직하게는, 재조합 데이노코쿠스 박테리아는 이종 게라니올 신타제를 암호화하는 유전자를 포함하며, 임의로 증진된 DXP 신타제와 함께, 향상된 MEP 경로 및/또는 상기 개시된 바와 같은 이종 MEV 경로를 포함한다.
다른 국면에서, 본 발명은 또한 (i) 데이노코쿠스 박테리아, 바람직하게는 본 발명의 재조합 데이노코쿠스 박테리아 또는 이의 추출물을 게라니올과 접촉시키는 단계, 및 임의로 (ii) 게라니알 및/또는 게란산을 회수하는 단계를 포함하여, 게라니알 및/또는 게란산을 생산하는 방법에 관한 것이다.
다른 특수 국면에서, 본 발명은 게라닐 에스테르를 생산하기 위한 본 발명의 재조합 데이노코쿠스 박테리아의 용도에 관한 것이다. 본 발명은 또한 (i) 본 발명에 따른 재조합 데이노코쿠스 박테리아를 게라니올, 게라니알 및/또는 게란산을 생산하는데 적합한 조건하에서 배양하는 단계, 임의로 (ii) 게라니올, 게라니알 및/또는 게란산을 회수하는 단계, 및 (iii) 게라니올, 게라니알 및/또는 게란산을 게라닐 에스테르로 전환시키는 단계, 및 임의로 (iv) 게라닐 에스테르를 회수하는 단계를 포함하여, 게라닐 에스테르를 생산하는 방법에 관한 것이다. 단계 (iii)은 화학적 또는 효소적 전환일 수 있다.
바람직하게는, 재조합 데이노코쿠스 박테리아는 이종 게라니올 신타제를 암호화하는 유전자를 포함하며, 임의로 향상된 MEP 경로 및/또는 위에서 개시한 바와 같은 이종 MEV 경로와 함께, 증진된 DXP 신타제를 임의로 나타낸다.
바람직하게는, 게라닐 에스테르는 메틸 게라네이트, 게라닐 포르메이트, 게라닐 아세테이트, 게라닐 프로피오네이트, 게라닐 이소부티레이트, 트랜스-게라닐 아세테이트 또는 네릴 아세테이트이다. 이들 에스테르는 게라니올, 게라니알 및/또는 게란산으로부터 숙련가에게 공지된 임의의 방법에 의해서도 생산될 수 있다.
다른 국면에서, 본 발명은 아포카로테노이드를 생산하기 위한 본 발명의 재조합 데이노코쿠스 박테리아의 용도에 관한 것이다. 바람직하게는, 아포카로테노이드는 다마스콘, 다마스세논 및 이오논으로 이루어진 그룹으로부터 선택된다. 다마스콘, 다마스세논 및 이오논의 예는 δ-다마스세논, 트랜스-δ-다마스세논, γ-다마스콘, α-다마스콘, 트랜스-α-다마스콘, 시스-α-다마스콘, 시스-베타-다마스콘, 트랜스-베타-다마스콘, 델타-다마스콘, 트랜스,트랜스-델타-다마스콘, 트랜스-(2,4,4-트리메틸-2-사이클로헥세닐)-2-부테논, 1-(2,4,4-트리메틸-2-사이클로헥센-1-일)-2-부텐-1-온, 1-(2,4,4-트리메틸-1-사이클로헥세닐)-2-부테논, 1-(2,2-디메틸-6-메틸렌사이클로헥실)-2-부텐-1-온, 알파-이오논, 베타-이오논 및 슈도-이오논을 포함하나, 이에 한정되지 않는다.
따라서, 본 발명은 (i) 본 발명에 따른 재조합 데이노코쿠스 박테리아를 게라니올, 게라니알 및/또는 게란산을 생산하기에 적합한 조건 하에서 배양하는 단계, 임의로 (ii) 게라니올, 게라니알 및/또는 게란산을 회수하는 단계, 및 (iii) 게라니올, 게라니알 및/또는 게란산을 상기 아포카로테노이드로 전환시키는 단계, 및 임의로 (iv) 상기 아포카로테노이드를 회수하는 단계를 포함하여, 아포카로테노이드, 즉, 다마스콘, 다마스세논 및/또는 이오논을 생산하는 방법에 관한 것이다.
게라니올, 게라니알 및/또는 게란산의 다마스콘, 다마스세논 및/또는 이오논으로의 전환은 게라니올, 게라니알 및/또는 게란산의 게라닐 에스테르, 바람직하게는 메틸 게라네이트로의 중간 전환을 포함할 수 있다.
바람직하게는, 재조합 데이노코쿠스 박테리아는 이종 게라니올 신타제를 암호화하는 유전자를 포함하며, 임의로 증진된 DXP 신타제와 함께 향상된 MEP 경로 및/또는 위에 개시된 바와 같은 이종 MEV 경로를 나타낸다. 게라니올, 게라니알 및/또는 게란산을 다마스콘, 다마스세논 및/또는 이오논으로 전환시키는 방법은 숙련가에게 잘 공지되어 있다.
본 발명은 (i) 본 발명에 따른 재조합 데이노코쿠스 박테리아를 상기 아포카로테노이드를 생산하기에 적합한 조건 하에서 배양하는 단계, 및 임의로 (ii) 상기 아포카로테노이드를 회수하는 단계를 포함하는, 아포카로테노이드의 생산 방법에 관한 것이다.
바람직하게는, 재조합 데이노코쿠스 박테리아는 위에서 기술한 바와 같은 재조합체이며, 여기서 상기 라이코펜 베타-사이클라제를 암호화하는 유전자는 불활성화되어 있고 이종 카로테노이드 절단 디옥시게나제(CCD)를 암호화하는 유전자를 추가로 포함한다. 상기 재조합체는 이종 라이코펜 엡실론 사이클라제를 암호화하는 유전자를 추가로 포함할 수 있다. 임의로, 파이토엔 신타제 및 파이토엔 데사투라제를 암호화하는 유전자가 또한 과발현될 수 있다. 상기 재조합 데이노코쿠스 박테리아는, 임의로 증진된 DXP 신타제와 함께, 향상된 MEP 경로, 및/또는 이종 MEV 경로 및/또는 위에 개시된 바와 같은 FPP 신타제의 과발현을 추가로 나타낸다.
본 발명은 또한 (i) 본 발명에 따른 재조합 데이노코쿠스 박테리아를 β-카로텐을 생산하기에 적합한 조건 하에서 배양하는 단계, (ii) β-카로텐을 회수하는 단계, 및 (iii) β-카로텐을 상기 아포카로테노이드으로 전환시키는 단계, 및 임의로 (iv) 상기 아포카로테노이드를 회수하는 단계를 포함하여, 아포카로테노이드를 생산하는 방법에 관한 것이다.
β-카로텐의 상기 아포카로테노이드, 예를 들면, 다마스콘, 다마스세논, 슈도이오논 및/또는 이오논으로의 전환은 화학적 또는 효소적 전환일 수 있으며 숙련가에게 잘 공지되어 있다.
바람직하게는, 재조합 데이노코쿠스 박테리아는, 임의로 증진된 DXP 신타제 및/또는 이종 MEV 경로 및/또는 FPP 신타제의 과발현과 함께, 향상된 MEP 경로를 나타내는 위에서 기술한 바와 같은 재조합체이다. 임의로, 파이토엔 신타제 및 파이토엔 데사투라제를 암호화하는 유전자가 또한 과발현될 수 있다.
본 발명은 또한 (i) 청구항 13에 따른 재조합 데이노코쿠스 박테리아를 라이코펜, α-, β-, 및/또는 γ-카로텐을 생산하기에 적합한 조건하에서 배양하는 단계, (ii) 임의로 라이코펜, α-, β-, 및/또는 γ-카로텐을 회수하는 단계, 및 (iii) 라이코펜, α-, β-, 및/또는 γ-카로텐을 아포카로테노이드로 화학적으로 또는 효소적으로 전환시키는 단계, 및 임의로 (iv) 아포카로테노이드를 회수하는 단계를 포함하여, 아포카로테노이드를 생산하는 방법에 관한 것이다.
바람직하게는, 재조합 데이노코쿠스 박테리아는 위에서 기술한 바와 같은 재조합체, 특히 이종 CDD를 암호화하는 유전자를 포함하는 재조합체이다. 상기 재조합체는 임의로 증진된 DXP 신타제 및/또는 이종 MEV 경로 및/또는 FPP 신타제의 과발현과 함께, 향상된 MEP 경로를 추가로 나타낼 수 있다. 임의로, 파이토엔 신타제 및 파이토엔 데사투라제를 암호화하는 유전자를 또한 과발현시킬 수 있다.
본 발명의 추가의 국면 및 장점은 다음의 실시예에서 기술될 것이며, 이는 예증하는 것으로 및 제한하지 않는 것으로 간주되어야 한다.
도 1: 옥시뭄 바실리쿰(Ocimum basilicum) GES를 발현하는 재조합 디. 게오테르말리스(D. geothermalis) 박테리아를 포함하는 배양물의 24시간에서의 추출의 GCMS 분석.
2: 옥시뭄 바실리쿰 GES를 발현하는 재조합 디. 게오테르말리스 박테리아를 포함하는 배양물의 48시간에서의 추출의 GCMS 분석.
3: 옥시뭄 바실리쿰 GES를 발현하는 재조합 디. 게오테르말리스 박테리아를 포함하는 배양물의 72시간에서의 추출의 GCMS 분석.
4: 시판되는 게라니올(geraniol)의 보유 시간(retention time).
5: 시판되는 게란산(geranic acid)의 보유 시간.
6: 디. 게오테르말리스 WT, crtlm 유전자가 녹아웃(knockout)된 재조합 디. 게오테르말리스 박테리아, 및 라이코펜 표준물의 아세톤 추출 흡광도의 차이(difference).
도 7: FPP 신타제의 과발현의 존재 및 부재하의 crtlm 유전자가 녹아웃(knockout)된 재조합 디. 게오테르말리스 박테리아의 라이코펜(lycopene) 생산.
도 8: FPP 신타제의 과발현의 존재 및 부재하에 옥시뭄 바실리쿰의 GES를 발현하는 재조합 디. 게오테르말리스 박테리아의 게라니올(geraniol) 생산.
도 9: 옥시뭄 바실리쿰의 GES를 발현하고 디. 윤웨이엔시스 DXS, DXR, IspD, IspE, IspF, IspG, IspH 또는 IDI를 과발현하는 재조합 디. 게오테르말리스의 게라니올 생산.
도 10: 옥시뭄 바실리쿰의 GES 및 디. 윤웨이엔시스로부터의 야생형 DXS 효소 또는 디. 윤웨이엔시스로부터의 돌연변이 R238C를 발현하는 재조합 디. 게오테르말리스 박테리아의 게라니올 생산.
도 11: 옥시뭄 바실리쿰의 GES 및 디. 라디오푸그난스 또는 돌연변이 R244C로부터의 야생형 DXS 효소를 발현하는재조합 디. 게오테르말리스 박테리아의 게라니올 생산.
도 12: 옥시뭄 바실리쿰의 GES 및 디. 게오테르말리스 FPPS의 K170G 돌연변이를 발현하는 재조합 디. 게오테르말리스 박테리아의 게라니올 생산.
도 13: 옥시뭄 바실리쿰의 GES 및 돌연변이된 DXS를 발현하고 디. 윤웨이엔시스로부터 DXR, IspD, IspE, IspF, IspG, IspH 또는 IDI를 과발현하는 재조합 디. 게오테르말리스 박테리아의 게라니올 생산.
도 14: 스트렙토마이세스 시트리콜로르(Streptomyces citricolor)로부터 (+)-에피-알파-비스알볼올 신타제를 발현하는 재조합 디. 게오테르말리스 박테리아의 비스아볼롤(bisalbolol) 생산. 야생형 박테리아는 비스알볼올을 생산하지 않음(데이타 미제시).
도 15: 디. 윤웨이엔시스로부터의 과발현 돌연변이 DXS 및 IDI의 존재 및 부재하에서 crtlm 유전자가 녹아웃된 재조합 디. 게오테르말리스 박테리아의 라이코펜(카로테노이드)의 생산.
도 16: 내인성 FPP 신타제의 과발현의 존재 또는 부재하에서 파일라 둘시스(Phyla dulcis) 또는 시서 아리에티눔(Cicer arietinum)의 GES를 발현하는 재조합 디. 게오테르말리스 박테리아의 게라니올(geraniol) 생산.
17: 350nm 내지 600nm의 흡광도를 측정하고 야생형 박테리아 및 FPPS를 과발현하는 박테리아에 대한 무수 세포 중량(Dry cell weight: DCW)에 의해 상기 흡광도를 표준화함으로써 수득되는 디이녹산틴의 스펙트럼. 회식 스펙트럼은 디이녹산틴 표준물 (디. 라디오두란스로부터 추출된 정제 디이녹산틴)에 상응함.
도 18: 야생형 디. 게오테르말리스 박테리아 및 내인성 FPPS를 과발현하는 디. 게오테르말리스 박테리아의 배양물의 사진.
도 19: 스트렙토마이세스 클라불리게루스(Streptomyces clavuligerus)로부터의 1,8 신네올 신타제 유전자를 발현하는 재조합 디. 게오테르말리스 박테리아의 시네올 생산. 신네올은 화살표로 표시됨. 야생형 박테리아는 신네올을 생산하지 않음(데이타 미제시).
도 20: 멘타 롱기폴리아(Mentha longifolia)로부터의 레모넨 신타제 유전자를 발현하는 재조합 디. 게오테르말리스 박테리아의 레모넨 생산. 리모넨은 화살표로 표시됨. 야생형 박테리아는 리모넨을 생산하지 않음(데이타 미제시).
도 21: 페릴라 프루테스센스(페릴라 프루테스센스)의 리날룰 신타제를 발현하는 재조합 디. 게오테르말리스 박테리아의 리날룰 생산 (mg/L). 야생형 박테리아는 리날룰(linalool)을 생산하지 않음(데이타 미제시).
실시예
실시예 1: 게라니올 및 게란산의 생산
데이노코쿠스 게오테르말리스(Deinococcus geothermalis) 균주를 유전적으로 가공하여 게라니올 및 게란산을 생산하였다. 옥시뭄 바실리쿰으로부터의 게라니올 신타제(GES)를 암호화하는 이종 유전자를 포스포트랜스아세틸라제(pta) 유전자를 대체하는 염색체내로 삽입하였다. GES 유전자의 발현은 강한 구성적 프로모터의 조절하에 있었다.
종균 배양(seed culture)을 위하여, 개개의 콜로니(colony)를 집어서 주요 탄소원으로서 2% 글루코즈를 함유하는 25ml의 CMG2% 배지(펩톤 2g/L; 효모 추출물 5g/L; 글루코즈 55mM(20g/L); MOPS 산 40mM; NH4Cl 20mM; NaOH 10mM; KOH 10mM; CaCl2.2H2O 0.5μM; Na2SO4.10H2O 0.276mM; MgCl2.6H2O 0.528mM;(NH4)6(Mo7)O24.4H2O 3nM; H3BO3 0.4μM; CoCl2.6H2O 30nM; CuSO4.5H2O 10nM; MnCl2 0.25μM; ZnSO4.7H2O 10nM; D-바이오틴 1μg/L; 니아신(니코틴산) 1μg/L; B6 비타민 1μg/L; B1 비타민; FeCl3 20μM; 시트르산나트륨.2H2O 20μM; K2HPO4 5,7mM) 속에 접종하고, 37℃ 및 250rpm에서 밤새 배양하였다. 성장의 로그 상(log phase)으로부터의 종자를 이후에 25ml의 동일한 새로운 배지에 600nm(OD600)에서의 초기 광학 밀도 0.4에서 접종하였다. 당해 2번째 종균 배양물을 37℃ 및 250rpm에서 밤새 배양하였다.
게라니올 생산을 위한 배양물을 37℃ 및 250rpm에서 48시간 동안 25ml의 광물 규정 배지(mineral define medium) (NH4)2SO4 < 100mM; NaH2PO4.H2O  < 10mM; KCl < 10mM; Na2SO4 < 10mM; 시트르산 < 30mM; MgCl2.6H2O  < 10mM; CaCl2.2H2O < 10mM; ZnCl2 < 50mg/L; FeSO4.7H2O <50mg/L; MnCl2.4H2O  <50mg/L; CuSO4 < 50mg/L; CoCl2.6H2O  < 50mg/L; H3BO3 < 5mg/L; MES < 200mM;(NH4)6Mo7O24.4H2O < 0,5mM; 글루코즈 < 30g/L (166mM) 내로 600nm(OD600)에서의 초기 광학 밀도 0.4에서 접종한 성장의 로그 상으로부터 수행하였다.
24시간의 배양 후, 게라니올을 생산하였다(역가(titer): 2.01mg/L; 1.5mg/g DCW(무수 세포 중량); 0.6mg/g의 글루코즈)(도 1). 48시간의 배양 후 게라니올을 생산하고(역가: 3.9mg/L; 0.5mg/g DCW; 0.3mg/g의 글루코즈) 게란산을 검출하였다(도 2). 72시간의 배양 후, 약간의 게라니올이 남아있으며 게란산의 주요 피크가 존재하였다(도 3). 추출은 0.5mL의 에틸 아세테이트를 1mL의 배양물과 혼합하여 수행하고 원심분리로 분리하였다. 에틸 아세테이트 상을 GC-질량 분광법(GC-MS)으로 분석하였다.
따라서, 게라니올의 생산을 확인하고 질량 분광기 GC로 정량화하였다. 검출기로서 질량 분광기가 장착된 가스 크로마토그래피를 GC-MS[Agilent 7890A/5975, 컬럼: 0.25mM > 30m, 0.25μm(HP-5MS 초 불활성)]를 사용하여 수행하였다. GCMS 분석은 전자-충격(EI) 방식(70 eV) 하에 수행하였다. 1μL의 추출물을 펄스화된 분열이 없는 방식(splitless mode)으로 주입하였다(0.75분까지 50 psi). 스캔 범위는 50 내지 250 m/z를 포함하였다. 데이타를 Xcalibur 시스템을 사용하여 진행시켰다. 확인은 NIST 라이브러리를 사용하여 수행하였다. 게라니올의 표준 곡선(도 4)은 상기 기술된 바와 동일한 방법을 사용하여 제작하였다.
게란산의 생산을 고압 액체 크로마토그래피 상에서 확인하고 정량화하였다. HPLC를 Agilent C18 포로쉘 컬럼(EC-C18) 4.6*150mm-2.7μm 및 이동 상 아세토니트릴/물(0.1% 포름산)을 사용하여 수행하였다. 10μL의 추출물을 주입하였다. 게란산의 표준 곡선(도 5)을 위에서 기술한 바와 동일한 방법을 사용하여 제작하였다.
실시예 2: 라이코펜의 생산
데이노코쿠스 게오테르말리스 균주를 유전적으로 가공하여 라이코펜을 생산하였다. 야생형 박테리아는 MEP 경로를 통해 라이코펜을 합성하기 위한 관련 유전자를 포함한다. 라이코펜을 생산하는 재조합체 디. 게오테르말리스는 카로테노이드 경로 중의 일부를 파괴함으로써 수득하였는데, 즉, 라이코펜 베타-사이클라제(EC 5.5.1.19)(crtlm) 유전자를 녹아웃(knockout) 시켰다. 수득되는 작제물을 서열분석으로 점검하였다.
종균 배양물을 제조하기 위해, 개개의 콜로니를 집어서 주요 탄소원으로서 2% 글루코즈를 함유하는 25ml의 CMG2% 배지(펩톤 2g/L; 효모 추출물 5g/L; 글루코즈 55mM(20g/L); MOPS 산 40mM; NH4Cl 20mM; NaOH 10mM; KOH 10mM; CaCl2.2H2O 0,5μM; Na2SO4.10H2O 0.276mM; MgCl2.6H2O 0.528mM;(NH4)6(Mo7)O24.4H2O 3nM; H3BO3 0.4μM; CoCl2.6H2O 30nM; CuSO4.5H2O 10nM; MnCl2 0.25μM; ZnSO4.7H2O 10nM; D-바이오틴 1μg/L; 니아신(니코틴산) 1μg/L; B6 비타민 1μg/L; B1 비타민; FeCl3 20μM; 시트르산나트륨.2H2O 20μM; K2HPO4 5,7mM)에 접종하고 37℃ 및 250rpm에서 밤새 배양하였다. 성장의 로그 상으로부터의 종균을 이후에 25ml의 동일한 신선한 배지내로 600nm(OD600)에서의 초기 광학 밀도 0.4에서 접종하였다. 당해 제2 종균 배양물을 37℃ 또는 45℃ 및 250rpm에서 밤새 배양하였다.
라이코펜 생산을 위한 배양을 37℃ 또는 45℃ 및 250rpm에서 48시간 동안 25ml의 광물 정의 배지(NH4)2SO4 < 100mM; NaH2PO4.H2O < 10mM; KCl < 10mM; Na2SO4 < 10mM; 시트르산 < 30mM; MgCl2.6H2O < 10mM; CaCl2.2H2O < 10mM; ZnCl2 < 50mg/L; FeSO4.7H2O <50mg/L; MnCl2.4H2O <50mg/L; CuSO4 < 50mg/L; CoCl2.6H2O < 50mg/L; H3BO3 < 5mg/L; MES < 200mM;(NH4)6Mo7O24.4H2O < 0,5mM; 글루코즈 < 30g/L(166mM)내로 600nm(OD600)에서의 초기 광학 밀도 10에서 접종된 성장의 로그 상으로부터 수행하였다.
24시간 배양 후, 라이코펜 생산 균주는 OD600에서의 값이 31이었다. 라이코펜은 4.2mg/L의 역가, 0.5mg/g DCW(무수 세포 중량) 및 0.3mg/g의 글루코즈로 생산되었다. 1mL의 배양물을 원심분리하고 라이코펜 추출을 0.9mL의 아세톤과 펠렛을 혼합하여 수행하였다. 아세톤 상을 OD 472nm에서의 흡광도로 분석하였다(도 6). 최종적으로 라이코펜 농도를 라이코펜 표준물의 희석에 의해 측정하였다.
실시예 3 : FPP 신타제의 과발현
데이노코쿠스 게오테르말리스로부터의 파르네실 피로포스페이트 신타제(FPPS) 유전자(서열 번호 46)를 실시예 1의 옥시뭄 바실리쿰의 GES를 발현하는 재조합체 디. 게오테르말리스 및 실시예 2의 라이코펜을 생산하는 재조합체 디. 게노테르말리스의 게놈내로 강력한 구성적 프로모터의 조절하에서 삽입하였다. 수득되는 작제물을 서열분석으로 분석하였다.
종균 배양물을 제조하기 위하여, 개개의 콜로니를 집어올려 주요 탄소원으로서 2% 글루코즈를 함유하는 25ml의 CMG2% 배지(펩톤 2g/L; 효모 추출물 5g/L; 글루코즈 55mM(20g/L); MOPS 산 40mM; NH4Cl 20mM; NaOH 10mM; KOH 10mM; CaCl2.2H2O 0,5μM; Na2SO4.10H2O 0.276mM; MgCl2.6H2O 0.528mM;(NH4)6(Mo7)O24.4H2O 3nM; H3BO3 0.4μM; CoCl2.6H2O 30nM; CuSO4.5H2O 10nM; MnCl2 0.25μM; ZnSO4.7H2O 10nM; D-바이오틴 1μg/L; 니아신(니코틴산) 1μg/L; B6 비타민 1μg/L; B1 비타민; FeCl3 20μM; 시트르산나트륨.2H2O 20μM; K2HPO4 5,7mM)에 접종하고 37℃ 및 250rpm에서 밤새 배양하였다. 이후에, 성장의 로그 상으로부터의 종균을 25ml의 동일한 신선한 배지내로 600nm(OD600)에서의 초기 광학 밀도 0.4에서 접종하였다. 당해 제2의 종균 배양물을 37℃ 및 250rpm에서 밤새 배양하였다.
게라니올 생산을 위한 배양물을 37℃ 또는 45℃ 및 250rpm에서 24시간 및 48시간 동안 25ml의 광물 정의 배지(NH4)2SO4 < 100mM; NaH2PO4.H2O  < 10mM; KCl < 10mM; Na2SO4 < 10mM; 시트르산 < 30mM; MgCl2.6H2O  < 10mM; CaCl2.2H2O < 10mM; ZnCl2 < 50mg/L; FeSO4.7H2O <50mg/L; MnCl2.4H2O  <50mg/L; CuSO4 < 50mg/L; CoCl2.6H2O  < 50mg/L; H3BO3 < 5mg/L; MES < 200mM;(NH4)6Mo7O24.4H2O < 0,5mM; 글루코즈 < 30g/L (166mM)내로 600nm(OD600)에서의 초기 광학 밀도 0.4에서 접종된 성장의 로그 상으로부터 수행하였다.
라이코펜 생산을 위한 배양을 위에서 기술한 바와 동일한 프로토콜에 따라 수행하였다. 차이는 600nm(OD600)에서의 초기 광학 밀도가 10이라는 것이다.
본 발명자들은 FPP 신타제의 과발현이 라이코펜 생산에 있어서 유의적인 증가를 생성하였음을 관찰하였다(도 7). 대조적으로, 게라니올 생산은 현저히 감소하였다(도 8).
실시예 4 : MEP 효소의 과발현
데이노코쿠스 윤우이엔시스로부터의 1-데옥시-D-크실룰로즈 5-포스페이트 신타제(DXS) 유전자(서열 번호 3), 1-데옥시-D-크실룰로즈 5-포스페이트 리덕토이소머라제(DXR) 유전자(서열 번호 36), 2-C-메틸-D-에리트리톨-4-포스페이트 사이티딜트랜스퍼라제(IspD) 유전자(서열 번호 19), 4-디포스포사이티딜-2-C-메틸-D-에리트리톨 키나제(IspE) 유전자(서열 번호 40), 2-C-메틸-D-에리트리톨-2,4-사이클로디포스페이트 신타제(IspF) 유전자(서열 번호 23),(E)-4-하이드록시-3-메틸부트-2-에닐-디포스페이트 신타제(IspG) 유전자(서열 번호 27), 4-하이드록시-3-메틸부트-2-에닐 디포스페이트 리덕타제(IspH) 유전자(서열 번호 44) 또는 4-하이드록시-3-메틸부트-2-에닐-디포스페이트리덕타제(IDI) 유전자(서열 번호 31)를 실시예 1에서 기술한 바와 같이 옥시뭄 바실리쿰의 GES를 발현하는 재조합 디. 게오테르말리스 박테리아의 염색체 내로 강력한 구성적 프로모터의 조절 하에 삽입하였다. 수득되는 작제물을 서열분석으로 점검하였다.
종균 배양물을 제조하기 위하여, 개개 콜로니를 집어서 주요 탄소원으로서 2% 글루코즈를 함유하는 25ml의 CMG2% 배지(펩톤 2g/L; 효모 추출물 5g/L; 글루코즈 55mM(20g/L); MOPS 산 40mM; NH4Cl 20mM; NaOH 10mM; KOH 10mM; CaCl2.2H2O 0,5μM; Na2SO4.10H2O 0.276mM; MgCl2.6H2O 0.528mM;(NH4)6(Mo7)O24.4H2O 3nM; H3BO3 0.4μM; CoCl2.6H2O 30nM; CuSO4.5H2O 10nM; MnCl2 0.25μM; ZnSO4.7H2O 10nM; D-바이오틴 1μg/L; 니아신(니코틴산) 1μg/L; B6 비타민 1μg/L; B1 비타민; FeCl3 20μM; 시트르산나트륨.2H2O 20μM; K2HPO4 5,7mM)에 접종하고, 37℃ 및 250rpm에서 밤새 배양하였다. 이후에, 성장의 로그 상으로부터의 종균을 25ml의 동일한 신선한 배지내로 600nM(OD600)에서의 초기 광학 밀도 0.4에서 접종하였다. 당해 제2의 종균 배양물을 37℃ 및 250rpm에서 밤새 배양하였다.
게라니올 생산을 위한 배양을 37℃ 및 250rpm에서 48시간 동안 25ml의 광물 정의 배지(NH4)2SO4 < 100mM; NaH2PO4.H2O  < 10mM; KCl < 10mM; Na2SO4 < 10mM; 시트르산 < 30mM; MgCl2.6H2O  < 10mM; CaCl2.2H2O < 10mM; ZnCl2 < 50mg/L; FeSO4.7H2O <50mg/L; MnCl2.4H2O  <50mg/L; CuSO4 < 50mg/L; CoCl2.6H2O  < 50mg/L; H3BO3 < 5mg/L; MES < 200mM;(NH4)6Mo7O24.4H2O < 0,5mM; 글루코즈 < 30g/L (166mM)내로 600nM(OD600)의 초기 광학 밀도 0.4에서의 접종된 성장의 로그 상으로부터 수행하였다.
본 발명자들은, 적어도 하나의 MEP 효소의 과발현이 이소프레노이드 생산을 위한 마커로서 본원에 사용된 게라니올 생산에 있어서 유의적인 증가를 생성하였음을 관찰하였다(도 9).
실시예 5 : 데이노코쿠스 윤웨이엔시스로부터의 증진된 DXS 효소
데이노코쿠스 윤웨이엔시스로부터의 1-데옥시-D-크실룰로즈 5-포스페이트 신타제(DXS) 유전자(서열 번호 3)를 강한 구성적 프로모터의 조절하에 실시예 1에 기술된 바와 같은 옥시뭄 바실리쿰의 GES를 발현하는 재조합 디. 게오테르말리스 박테리아의 내인성 dxs 유전자를 대체하는, 염색체 내로 삽입하였다. 부위 지시된 돌연변이유발을 실현하여 R238C 돌연변이(서열 번호 13 및 14)를 수득하였다. 수득되는 작제물(construct)을 서열분석으로 점검하였다.
종균 배양물을 제조하기 위하여, 개개 콜로니를 집어서 주요 탄소원으로서 2% 글루코즈를 함유하는 25ml의 CMG2% 배지(펩톤 2g/L; 효모 추출물 5g/L; 글루코즈 55mM(20g/L); MOPS 산 40mM; NH4Cl 20mM; NaOH 10mM; KOH 10mM; CaCl2.2H2O 0,5μM; Na2SO4.10H2O 0.276mM; MgCl2.6H2O 0.528mM;(NH4)6(Mo7)O24.4H2O 3nM; H3BO3 0.4μM; CoCl2.6H2O 30nM; CuSO4.5H2O 10nM; MnCl2 0.25μM; ZnSO4.7H2O 10nM; D-바이오틴 1μg/L; 니아신(니코틴산) 1μg/L; B6 비타민 1μg/L; B1 비타민; FeCl3 20μM; 시트르산나트륨.2H2O 20μM; K2HPO4 5,7mM)내로 접종하고 37℃ 및 250rpm에서 밤새 배양하였다. 이후에, 성장의 로그 상으로부터의 종균을 25ml의 동일한 신선한 배지내로 600nM(OD600)에서의 초기 광학 밀도 0.4에서 접종하였다. 당해 제2의 종균 배양물을 37℃ 및 250rpm에서 밤새 배양하였다.
게라니올 생산을 위한 배양을 37℃ 및 250rpm에서 48시간 동안 25ml의 광물 정의 배지(NH4)2SO4 < 100mM; NaH2PO4.H2O  < 10mM; KCl < 10mM; Na2SO4 < 10mM; 시트르산 < 30mM; MgCl2.6H2O  < 10mM; CaCl2.2H2O < 10mM; ZnCl2 < 50mg/L; FeSO4.7H2O <50mg/L; MnCl2.4H2O  <50mg/L; CuSO4 < 50mg/L; CoCl2.6H2O  < 50mg/L; H3BO3 < 5mg/L; MES < 200mM;(NH4)6Mo7O24.4H2O < 0,5mM; 글루코즈 < 30g/L (166mM)내로 600nM(OD600)에서의 초기 광학 밀도 0.4에서 접종한 성장의 로그 상으로부터 수행하였다.
도 10에 나타낸 바와 같이, 돌연변이 R238C의 도입에 의한 DXS의 증진은 이소프레노이드 생산을 위한 마커로서 본원에 사용된 게라니올 생산의 현저한 증가를 생성한다.
실시예 6 : 데이노코쿠스 라디오푸그난스로부터의 증진된 DXS 효소
데이노코쿠스 라디오푸그난스로부터의 1-데옥시-D-크실룰로즈 5-포스페이트 신타제(DXS)를 암호화하는 유전자(서열 번호 52) 또는 상기 효소의 R244C 돌연변이를 암호화하는 유전자(서열 번호 8)를 실시예 1에 기술된 바와 같이 옥시뭄 바실리쿰의 GES를 발현하는 재조합 디. 게오테르말리스 박테리아의 내인성 dxs 유전자를 대체하는 염색체내로 강한 구성적 프로모터의 조절하에서 삽입하였다. 수득되는 작제물을 서열분석으로 점검하였다. 게라니올 생산을 위한 종균 배양 및 배양을 실시예 5에 설명한 바와 같이 수행하였다.
도 11에 나타낸 바와 같이, 돌연변이 R244C의 도입에 의한 데이노코쿠스 라디오푸그난스로부터의 DXS의 증진은 이소프레노이드 생산을 위한 마커로서 본원에 사용된 게라니올 생산의 현저한 증가를 생성한다.
실시예 7 : 디. 게오테르말리스 파르네실 피로포스페이트 신타제의 K170G 돌연변이
디. 게오테르말리스 파르네실 피로포스페이트 신타제(FPPS) 유전자 또는 부위 지시된 돌연변이유발에 의해 수득된 상기 효소의 K170G 돌연변이를 암호화하는 유전자를 실시에 1에 기술된 바와 같은 옥시뭄 바실리쿰의 GES를 발현하는 재조합 디. 게오테르말리스 박테리아내에 FPPS를 암호화하는 내인성 유전자를 대체하는 염색체내로 삽입하였다. 디. 게오테르말리스 FPPS 유전자의 야생형 및 돌연변이된 버젼 둘 다는 구성적 프로모터의 조절하에 있었다. 수득되는 작제물을 서열분석으로 점검하였다. 게라니올 생산을 위한 종균 배양 및 배양을 실시예 5에 기술된 바와 같이 수행하였다.
도 12에 나타낸 바와 같이, 디. 게오테르말리스 FPPS의 돌연변이 K170G는 GPP를 통한 탄소 플럭스의 방향 변경(redirection) 및 게라니올 생산에 있어서 유의적인 증가를 생성하였다.
실시예 8 : 증진된 DXS 효소와 함께 MEP 효소의 과발현
데이노코쿠스 윤웨이넨시스의 DXS 효소의 R238C 돌연변이를 암호화하는 유전자를 구성적 프로모터의 조절하에 실시예 1의 옥시뭄 바실리쿰의 GES를 발현하는 재조합체 디. 게오테르말리스의 아밀라제(amy) 유전자를 대체하는 염색체 내로 삽입하였다. 디. 게오테르말리스 파르네실 피로포스페이트 신타제(FPPS) 유전자의 K170G 돌연변이를 암호화하는 유전자를 또한 내인성 ispA 유전자를 대체하는 염색체 내로 삽입하였다. FDPS 유전자의 과발현은 구성적 프로모터의 조절하에 있었다. 수득되는 작제물을 서열분석으로 점검하였다.
데이노코쿠스 윤웨이엔시스로부터의 다음의 MEP 경로 유전자 각각은 디. 게오테르말리스 FDPS(K170G 돌연변이) 및 디. 윤웨이엔시스 DXS(R238C 돌연변이): dxr 유전자(서열 번호 36), ispD 유전자(서열 번호 19), ispE 유전자(서열 번호 40), ispF 유전자(서열 번호 23), ispG 유전자(서열 번호 27) 및 idi 유전자(서열 번호 31)를 발현하는 디. 게오테르말리스 균주내 강한 구성적 프로모터의 조절하에 발현시켰다. 수득되는 작제물을 서열분석으로 점검하였다. 게라니올 생산을 위한 종균 배양 및 배양을 실시예 5에 기술된 바와 같이 수행하였다.
도 13에 나타낸 바와 같이, 돌연변이된 DXS 및 IDI의 과발현은 다른 조합과 비교하여 게라니올 생산의 현저한 증가를 생성하였다.
실시예 9 : 비스알볼올의 생산
데이노코쿠스 게오테르말리스 균주를 유전적으로 가공하여 비스알볼올을 생산하였다. 스트렙토마이세스 시트리콜로르로부터의 (+)-에피-알파-비스알볼올 신타제를 암호화하는 이종 유전자를 포스포트랜스아세틸라제(pta) 유전자대신 염색체내로 삽입하였다. 에피-알파-비스알볼올 신타제 유전자의 발현은 구성적 프로모터의 조절하에 있었다.
종균 배양물을 제조하기 위하여, 개개의 콜로니를 집어서 주요 탄소원으로서 2% 글로코즈를 함유하는 25ml의 CMG2% 배지(펩톤 2g/L; 효모 추출물 5g/L; 글루코즈 55mM(20g/L); MOPS acid 40mM; NH4Cl 20mM; NaOH 10mM; KOH 10mM; CaCl2.2H2O 0,5μM; Na2SO4.10H2O 0.276mM; MgCl2.6H2O 0.528mM;(NH4)6(Mo7)O24.4H2O 3nM; H3BO3 0.4μM; CoCl2.6H2O 30nM; CuSO4.5H2O 10nM; MnCl2 0.25μM; ZnSO4.7H2O 10nM; D-바이오틴 1μg/L; 니아신(니코틴산) 1μg/L; B6 비타민 1μg/L; B1 비타민; FeCl3 20μM; 시트르산나트륨.2H2O 20μM; K2HPO4 5,7mM)에 접종하고, 37℃ 및 250rpm에서 밤새 배양하였다. 이후에, 성장의 로그 상으로부터의 종균을 25ml의 동일한 배지에 600nM(OD600)에서의 초기 광학 밀도 0.4에서 접종하였다. 당해 제2 종균 배양물을 37℃ 및 250rpm에서 밤새 배양하였다. 비스알볼올 생산을 위한 배양을 37℃ 및 250rpm에서 48시간 동안 25ml의 광물 규정 배지(NH4)2SO4 < 100mM; NaH2PO4.H2O  < 10mM; KCl < 10mM; Na2SO4 < 10mM; 시트르산 < 30mM; MgCl2.6H2O  < 10mM; CaCl2.2H2O < 10mM; ZnCl2 < 50mg/L; FeSO4.7H2O <50mg/L; MnCl2.4H2O  <50mg/L; CuSO4 < 50mg/L; CoCl2.6H2O  < 50mg/L; H3BO3 < 5mg/L; MES < 200mM;(NH4)6Mo7O24.4H2O < 0,5mM; 글루코즈 < 30g/L (166mM)내로 600nm(OD600)에서의 광학 밀도 0.4에서 접종한 성장의 로그 상으로부터 수행하였다.
비스알볼올의 생산을 게라니올에 대해 실시예 1에서 기술한 바와 같이 질량 분광기 GC에서 확인하고 정량화하였다.
도 14에 나타낸 바와 같이, 디. 게오테르말리스내에서 스트렙토마이세스 시트리콜로르로부터의 비스알볼올 신타제의 발현은 비스알볼올 생산(3.6mg/L)을 가져왔다.
실시예 10 : 라이코펜의 증진된 생산
데이노코쿠스 게오테르말리스 균주를 유전적으로 가공하여 실시예 2에서 앞서 기술한 바와 같이 라이코펜을 생산하였다. 디. 윤웨이넨시스의 DXS 효소의 R238C 돌연변이를 암호화하는 유전자 및 디. 윤웨이엔시스의 IDI를 암호화하는 유전자를 균주 디. 게오테르말리스 crtlm-의 염색체내로 구성적 프로모터의 조절하에서 도입하였다. 라이코펜 생산을 위한 종균 배양 및 배양을 실시예 2에 기술된 바와 같이 수행하였다.
도 15에 나타낸 바와 같이, 라이코펜 생산은 균주 디. 게오테르말리스 crtlm-가 IDI 및 돌연변이 DXS를 과발현하는 경우 2배 더 높다.
실시예 11 : 디. 게오테르말리스내에서 상이한 기원의 GES의 발현
데이노코쿠스 게오테르말리스 균주를 파일라 둘시스 또는 시서 아리에티눔으로부터 게라니올 신타제(GES)를 암호화하는 이종 유전자를 포스포트랜스아세틸라제(pta) 유전자를 대체하는 염색체 내로 삽입함으로써 실시예 1에 기술된 바와 같이 유전적으로 가공하였다. GES 유전자의 발현은 강한 구성적 프로모터의 조절하에 있었다. 수득되는 작제물을 서열분석으로 점검하였다. 게라니올 생산을 위한 종균 배양 및 배양을 실시예 1에 기술된 바와 같이 수행하였다.
도 16에 나타낸 바와 같이, 파일라 둘시스 또는 시서 아리에티눔의 GES의 발현은 게라니올을 생산하였다.
실시예 12 : 카로테노이드 생산
강한 프로모터의 조절하에서 데이노코쿠스 게오테르말리스로부터의 파르네실 피로포스페이트 신타제(FPPS) 유전자(서열 번호 46)를 포함하는 발현 카세트를 디. 게오테르말리스 균주의 게놈내로 삽입하였다. 수득되는 작제물을 서열분석에 의해 점검하였다.
종균 배양물을 제조하기 위하여, 개개 콜로니를 집어서 주요 탄소원으로서 2% 글루코즈를 함유하는 25ml의 CMG2% 배지(펩톤 2g/L; 효모 추출물 5g/L; 글루코즈 55mM(20g/L); MOPS 산 40mM; NH4Cl 20mM; NaOH 10mM; KOH 10mM; CaCl2.2H2O 0,5μM; Na2SO4.10H2O 0.276mM; MgCl2.6H2O 0.528mM;(NH4)6(Mo7)O24.4H2O 3nM; H3BO3 0.4μM; CoCl2.6H2O 30nM; CuSO4.5H2O 10nM; MnCl2 0.25μM; ZnSO4.7H2O 10nM; D-바이오틴 1μg/L; 니아신(니코틴산) 1μg/L; B6 비타민 1μg/L; B1 비타민; FeCl3 20μM; 시트르산나트륨.2H2O 20μM; K2HPO4 5,7mM)에 접종하고 45℃ 및 250rpm에서 밤새 배양하였다. 이후에, 성장의 로그 상으로부터의 종균을 25ml의 동일한 신선한 배지에 600nM(OD600)에서의 초기 광학 밀도 0.4에서 접종하였다. 당해 제2 종균 배양물을 45℃ 및 250rpm에서 밤새 배양하였다.
카로테노이드 생산을 위한 배양을 45℃ 및 250rpm에서 48시간 동안 25ml의 광물 규정 배지(NH4)2SO4 < 100mM; NaH2PO4.H2O < 10mM; KCl < 10mM; Na2SO4 < 10mM; 시트르산 < 30mM; MgCl2.6H2O < 10mM; CaCl2.2H2O < 10mM; ZnCl2 < 50mg/L; FeSO4.7H2O <50mg/L; MnCl2.4H2O <50mg/L; CuSO4 < 50mg/L; CoCl2.6H2O < 50mg/L; H3BO3 < 5mg/L; MES < 200mM;(NH4)6Mo7O24.4H2O < 0,5mM; 글루코즈 < 30g/L(166mM)내로 600nM(OD600)에서의 초기 광학 밀도 0.4에서 접종된 성장의 로그 상으로부터 수행하였다.
25mL의 배양물을 원심분리하고 카로테노이드 추출을 25mL의 에탄올과 펠렛을 혼합함으로써 수행하였다. 디이녹산틴의 스펙트럼은 350nm 내지 600nm의 흡광도를 측정함으로써 수득하고, 디이녹산틴 표준물(디. 라디오두란스로부터 추출된 정제된 디이녹산틴)에 상응하는 회색 스펙트럼인 무수 세포 중량(DCW)으로 표준화하였다(도 17).
도 17 및 18에 나타낸 바와 같이, 디. 게오테르말리스의 내인성 파르네실 피로포스페이트 신타제(FPPS)의 과발현은 야생형 균주(WT)와 비교하여 2배까지 디이녹산틴 생산의 현저한 증가를 생성하였다. 이러한 증가된 디이녹산틴 생산은 야생형 균주와 비교하여 FPPS를 과발현하는 디. 게오테르말리스의 진한 분홍색과 관련되었다(도 18).
실시예 13 : 시네올의 생산
데이노코쿠스 게오테르말리스 균주를 유전적으로 가공하여 시네올을 생산하였다. 스트렙토마이세스 클라불리게루스로부터 1,8 시네올 신타제(CnsA)를 암호화하는 이종 유전자를 포스포트랜스아세틸라제(pta) 유전자를 대체하는 염색체 내로 삽입하였다. 1,8 시네올 신타제 유전자의 발현은 구성적 프로모터의 조절하에 있었다. 파르네실 피로포스페이트 신타제(FPPS) 유전자의 디. 게오테르말리스 K170G 돌연변이를 내인성 fdps를 대체하는 염색체 내로 삽입하였다. FDPS 유전자의 과발현은 구성적 프로모터의 조절하에 있다. 수득되는 작제물은 서열분석으로 점검하였다. 시네올 생산을 위한 종균 배양 및 배양은 실시예 1에 상세히 기술된 바와 같이 수행하였다. 24시간 또는 48시간의 성장 후, 1mL의 배양물을 0.5mL의 에틸 아세테이트로 추출하였다. 유기 상을 GCMS로 분석하였다. 시네올의 생산을 게라니올에 대해 실시예 1에 상세히 기술된 바와 같이 질량 분광기 GC에서 확인하고 정량화하였다.
도 19에 나타낸 바와 같이, 1,8 시네올 신타제의 삽입은 재조합체 디. 게오테르말리스에 의해 시네올 생산을 가져왔다.
실시예 14 : 리모넨의 생산
데이노코쿠스 게오테르말리스 균주를 유전적으로 가공하여 리모넨을 생산하였다. 리모넨 신타제(LS; GenBank: AAD50304.1) 유전자를 암호화하는 이종 유전자는 멘타 롱기폴리아로부터 기원한다. GFP에 융합된 엠. 롱기폴리아 LS cDNA를 포스포트랜스아세틸라제(pta) 유전자를 대체하는 염색체 내로 삽입하였다. LS 유전자의 과발현은 구성적 프로모터의 조절하에 있었다. 파르네실 피로포스페이트 신타제(FPPS) 유전자의 디. 게오테르말리스 K170G 돌연변이를 내인성 fdps를 대체하는 염색체 내로 삽입하였다. FDPS 유전자의 과발현은 구성적 프로모터의 조절하에 있었다. 수득되는 작제물은 서열분석으로 점검하였다. 리모넨 생산을 위한 종균 배양 및 배양을 실시예 1에 상세히 기술된 바와 같이 수행하였다. 24시간 또는 48시간의 성장 후, 1mL의 배양물을 0.5mL의 에틸 아세테이트로 추출하였다. 유기 상을 GCMS로 분석하였다. 리모넨의 생산을 게라니올에 대해 실시예 1에 상세히 기술된 바와 같이 질량 분광기 GC에서 확인하고 정량화하였다.
도 20에 나타낸 바와 같이, 리모넨 신타제의 삽입은 재조합체 디. 게오테르말리스에 의한 리모넨의 생산을 가져왔다.
실시예 15 : 리날룰의 생산
데이노코쿠스 게오테르말리스 균주을 유전적으로 가공하여 리날룰을 생산하였다. 리날룰 신타제(LIS) 유전자를 암호화하는 이종 유전자는 페릴라 프루테스센스로부터 기원한다. GFP에 융합된 LIS cDNA를 포스포트랜스아세틸라제(pta) 유전자를 대체하는 염색체 내로 삽입하였다. LIS 유전자의 과발현은 구성적 프로모터의 조절하에 있었다. 파르네실 피로포스페이트 신타제(FPPS) 유전자의 디. 게오테르말리스 K170G 돌연변이를 내인성 fdps를 대체하는 염색체 내로 삽입하였다. FDPS 유전자의 과발현은 구성적 프로모터의 조절하에 있었다. 수득되는 작제물은 서열분석으로 점검하였다. 리날룰 생산을 위한 종균 배양 및 배양을 실시예 1에 기술된 바와 같이 수행하였다. 리날룰의 생산을 게라니올에 대해 실시예 1에 상세히 기술된 바와 같이 질량 분광기 GC에서 확인하고 정량화하였다.
도 21에 나타낸 바와 같이, 리날룰 신타제의 삽입은 재조합체 디. 게오테르말리스에 의한 리날룰 생산을 가져왔다.
참고문헌(REFERENCES)
Attia et al. Arch Biochem Biophys. 2012 Nov 1;527(1):37-44
Blanchard and Karst, Gene. 1993 Mar 30;125(2):185-9.
Brown et al. J. Bacteriol. 2010 vol. 192, no 9, 2424-2433
Carter et al., Phytochemistry, 2003, 64:425-433
Degenhardt and Gershenzon. Planta. 2000 Apr;210(5):815-22.
Del Terra et al. Phytochemistry. 2013 May;89:6-14.
Herrero et al. Metab Eng 2008, 10:78-86
Lecointe, et al. 2004. Mol Microbiol 53: 1721-1730.
Lois et al. PNAS, USA 1998;95:2105-2110.
Martin et al. BMC Plant Biol. 2010 Oct 21;10:226.
Meima et al. 2001. J Bacteriol 183: 3169-3175.
Sivy et al. Biosci Biotechnol Biochem. 2011;75(12):2376-83
Aharoni et al., 2004. The Plant cell, 16(11), pp.3110-31.
Chen et al, 2003. The Plant Cell, 15(2), pp.481-494.
Crowell et al., 2002. Archives of biochemistry and biophysics, 405(1), pp.112-21.
Dong et al., 2013. Metabolic engineering, 20C, pp.198-211.
Dudareva et al., 1996. The Plant cell, 8(7), pp.1137-48.
Feinberg and Vogelstein, 1983, Anal. Biochem. 132:6-13
Fischer et al., 2011. Biotechnology and Bioengineering, Vol. 108, No. 8, pp.1883-1892.
Galata et al., Phytochemistry 102, 64-73(2014)
Herrero et al 2008. Metabolic engineering, 10(2), pp.78-86.
Hess et al., 2013. PloS one, 8(6), p.e66104.
Iijima, et al., 2004. Plant physiology, 136(3), pp.3724-36.
Iijima, et al, 2004. Plant. 134(January), pp.370-379.
Jia, et al., 1999. Archives of biochemistry and biophysics, 372(1), pp.143-9.
Landmann, et al., 2007. Archives of biochemistry and biophysics, 465(2), pp.417-29.
Lehning, et al 1999. Plant, Cell & Environment. Volume 22, Issue 5, pages 495-504
Liu, J. et al., 2013. Journal of biotechnology, 168(4), pp.446-451.
Lv, et al., 2013. Applied microbiology and biotechnology, 97(6), pp.2357-65.
Masumoto et al., Phytochemistry 71(10), 1068-1075(2010)
Miller, et al, 2001. Planta, 213(3), pp.483-487.
Nakano, et al, 2011. ChemBioChem, 12(16), pp.2403-7.
Nakano, et al, ChemBioChem 2011, 12, 1988-1991
Nakano, et al, 2011. Chembiochem. Oct 17;12(15):2271-5.
Pichersky et al, 1995. Archives of biochemistry and biophysics, 316(2), pp.803-807.
Rico, et al, 2010. Applied and environmental microbiology, 76(19), pp.6449-54.
Sharkey et al, 2005. Plant Physiol. 137(2), pp.700-12.
Sitrit et al., 2004. Plant Science, 167(6), pp.1257-1262.
Sugiura, et al., 2011. Bioscience, Biotechnology, and Biochemistry, 75(7), pp.1245-1248.
Whited et al. Ind Biotechnol 2010;6:152-63.
Yang, et al., 2012. Bioresource Technology, 104(C), pp.642-647.
Yang, et al., 2012. PloS one, 7(4), p.e33509.
Yang, et al., 2005. Phytochemistry, 66(3), pp.285-93.
Zhou, et al., 2013. Journal of biotechnology, 169, pp.42-50.
SEQUENCE LISTING <110> Deinove <120> Method of producing terpenes or terpenoids <130> IP20163073FR <160> 73 <170> KopatentIn 2.0 <210> 1 <211> 1902 <212> DNA <213> Deinococcus geothermalis <400> 1 atgagtgagc caactgccaa cctccagcct gccagccgca ccccgctgct ggaccgggtg 60 aatggcccgg aagacctcaa acggctcgga cgcgaccagc taccccagct cgctgccgaa 120 ctgcgcgagg agatcgtgcg ggtctgctcg gtaggggggt tacatctcgc cagctctctg 180 ggcgcgaccg acctaatcgt ggcgctacat tacgtgctgc attcgccgcg cgaccgcatt 240 ctgttcgacg tggggcatca ggcctacgcc cacaagatgc tcacgggccg ccgccacctg 300 atgcacaccg tcaagaagga gggcgggctg tcgggcttca ccaaggtgag cgagtccgaa 360 cacgacgcca tcacggtggg ccatgccagc acctccctcg ccaatgcgct gggcatggcg 420 cttgcacggg acgctttggg acaggattac aaggtggctg ccgtgatcgg ggacggctcg 480 ctgacgggcg gcatggcgct ggcggcgctg aataccatcg gggacctggg gcggcgaatg 540 ctcattgtgc ttaacgacaa cgagatgagc atcagcgaga acgtgggggc catcaaccgc 600 ttcatgcggg gtctccaggt gcagaagtgg ttccaggagg gcgaggaagc cgggaaaaag 660 gccgtgcagg cggtcagcaa gccgctcgcc aacttgatga gccgcgccaa gagttccacg 720 cggcactttt tcgatcccgc cagtgtcaat ccctttgccg cgatgggcgt gcgctatgtg 780 ggaccggtgg acggccacaa cgtgcaggaa ttggtgtggc tgatcgagcg gctggtcgac 840 ctcgatgggc cgaccattct gcacgtcgtc accaaaaagg gcaagggcct gagctacgcc 900 gaggccgacc cgatcaaatg gcatggcccg ggcaagtttg acccggcgac gggtgagtcg 960 gtgcccagca atgcctactc gtggagcagc gcctttggag acgcggtgac cgagcttgca 1020 cggctggacc cccgtacctt tgtgatcacg cccgcgatgc gcgagggcag cggcctggtg 1080 cgctacagcc aggttcaccc ccaccgttac ctggatgtcg gtatcgcgga ggacgtggcc 1140 gtcaccacgg ccgccggaat ggcgcttcag gggatgcggc ccatcgtggc gatctactcc 1200 actttcctgc aacgcgccta cgatcaggtg ctgcacgacg tcgccatcga gaatctgaac 1260 gtgaccttcg ccatcgaccg tgggggcatc gtgggcgcag acggagccac ccacaacggc 1320 gtcttcgacc tgagttacct gcgctcgatt ccgaatgtcg gcattggcct gccgaaggac 1380 gccgccgagc tgcgcgggat gctgaagtat gcccaggagc atgctggccc cttcgccatc 1440 cgctatccgc gcggcaacgt ggaacgcgtg ccggaaggca cctggccgga gctgaggtgg 1500 ggcacctggg aacgcttgca agacggcgac gacgtggtga ttctggcggg aggcaaggcg 1560 ctggagtacg cgctgaaggc cgcccgcgac ctccccggcg tgggcgtggt gaatgcccgt 1620 ttcgtgaagc cgctcgacca agggatgctg cgcgaggtgg cgaccaaagc ccgcgcactg 1680 gtcacggtgg aggacaacac ggtcgtcggt gggttcggaa gtgccgtcct ggaagccctc 1740 agcgcgctgg ggctgagaac cccggtgcgg gttctcggca tccccgacgc gtttcaggat 1800 cacgcgaccg tagagagcgt gcatgcccgt gcggggattg acgcgcctgc catccgcacg 1860 gtcctggccg aacttggcgt ggacgtgccg ctggaggtct ag 1902 <210> 2 <211> 633 <212> PRT <213> Deinococcus geothermalis <400> 2 Met Ser Glu Pro Thr Ala Asn Leu Gln Pro Ala Ser Arg Thr Pro Leu 1 5 10 15 Leu Asp Arg Val Asn Gly Pro Glu Asp Leu Lys Arg Leu Gly Arg Asp 20 25 30 Gln Leu Pro Gln Leu Ala Ala Glu Leu Arg Glu Glu Ile Val Arg Val 35 40 45 Cys Ser Val Gly Gly Leu His Leu Ala Ser Ser Leu Gly Ala Thr Asp 50 55 60 Leu Ile Val Ala Leu His Tyr Val Leu His Ser Pro Arg Asp Arg Ile 65 70 75 80 Leu Phe Asp Val Gly His Gln Ala Tyr Ala His Lys Met Leu Thr Gly 85 90 95 Arg Arg His Leu Met His Thr Val Lys Lys Glu Gly Gly Leu Ser Gly 100 105 110 Phe Thr Lys Val Ser Glu Ser Glu His Asp Ala Ile Thr Val Gly His 115 120 125 Ala Ser Thr Ser Leu Ala Asn Ala Leu Gly Met Ala Leu Ala Arg Asp 130 135 140 Ala Leu Gly Gln Asp Tyr Lys Val Ala Ala Val Ile Gly Asp Gly Ser 145 150 155 160 Leu Thr Gly Gly Met Ala Leu Ala Ala Leu Asn Thr Ile Gly Asp Leu 165 170 175 Gly Arg Arg Met Leu Ile Val Leu Asn Asp Asn Glu Met Ser Ile Ser 180 185 190 Glu Asn Val Gly Ala Ile Asn Arg Phe Met Arg Gly Leu Gln Val Gln 195 200 205 Lys Trp Phe Gln Glu Gly Glu Glu Ala Gly Lys Lys Ala Val Gln Ala 210 215 220 Val Ser Lys Pro Leu Ala Asn Leu Met Ser Arg Ala Lys Ser Ser Thr 225 230 235 240 Arg His Phe Phe Asp Pro Ala Ser Val Asn Pro Phe Ala Ala Met Gly 245 250 255 Val Arg Tyr Val Gly Pro Val Asp Gly His Asn Val Gln Glu Leu Val 260 265 270 Trp Leu Ile Glu Arg Leu Val Asp Leu Asp Gly Pro Thr Ile Leu His 275 280 285 Val Val Thr Lys Lys Gly Lys Gly Leu Ser Tyr Ala Glu Ala Asp Pro 290 295 300 Ile Lys Trp His Gly Pro Gly Lys Phe Asp Pro Ala Thr Gly Glu Ser 305 310 315 320 Val Pro Ser Asn Ala Tyr Ser Trp Ser Ser Ala Phe Gly Asp Ala Val 325 330 335 Thr Glu Leu Ala Arg Leu Asp Pro Arg Thr Phe Val Ile Thr Pro Ala 340 345 350 Met Arg Glu Gly Ser Gly Leu Val Arg Tyr Ser Gln Val His Pro His 355 360 365 Arg Tyr Leu Asp Val Gly Ile Ala Glu Asp Val Ala Val Thr Thr Ala 370 375 380 Ala Gly Met Ala Leu Gln Gly Met Arg Pro Ile Val Ala Ile Tyr Ser 385 390 395 400 Thr Phe Leu Gln Arg Ala Tyr Asp Gln Val Leu His Asp Val Ala Ile 405 410 415 Glu Asn Leu Asn Val Thr Phe Ala Ile Asp Arg Gly Gly Ile Val Gly 420 425 430 Ala Asp Gly Ala Thr His Asn Gly Val Phe Asp Leu Ser Tyr Leu Arg 435 440 445 Ser Ile Pro Asn Val Gly Ile Gly Leu Pro Lys Asp Ala Ala Glu Leu 450 455 460 Arg Gly Met Leu Lys Tyr Ala Gln Glu His Ala Gly Pro Phe Ala Ile 465 470 475 480 Arg Tyr Pro Arg Gly Asn Val Glu Arg Val Pro Glu Gly Thr Trp Pro 485 490 495 Glu Leu Arg Trp Gly Thr Trp Glu Arg Leu Gln Asp Gly Asp Asp Val 500 505 510 Val Ile Leu Ala Gly Gly Lys Ala Leu Glu Tyr Ala Leu Lys Ala Ala 515 520 525 Arg Asp Leu Pro Gly Val Gly Val Val Asn Ala Arg Phe Val Lys Pro 530 535 540 Leu Asp Gln Gly Met Leu Arg Glu Val Ala Thr Lys Ala Arg Ala Leu 545 550 555 560 Val Thr Val Glu Asp Asn Thr Val Val Gly Gly Phe Gly Ser Ala Val 565 570 575 Leu Glu Ala Leu Ser Ala Leu Gly Leu Arg Thr Pro Val Arg Val Leu 580 585 590 Gly Ile Pro Asp Ala Phe Gln Asp His Ala Thr Val Glu Ser Val His 595 600 605 Ala Arg Ala Gly Ile Asp Ala Pro Ala Ile Arg Thr Val Leu Ala Glu 610 615 620 Leu Gly Val Asp Val Pro Leu Glu Val 625 630 <210> 3 <211> 1893 <212> DNA <213> Deinococcus yunweiensis <400> 3 atgacatcca gcgacctcgt ccccgttccg cagcgcctgc tcgacgcggt gaactcgccg 60 gacgacctca agaccctgaa gcgcgagcag ctgccgcagg tggcgcagga actccgcgac 120 gagatcgtgc gggtgtgctc ggtgggtggc ctgcacctgg cgtcctcgct gggcgcgacc 180 gacgtgatcg tggcgctgca ctacgtcctg aactcgccgc gtgaccggat tctgttcgat 240 gtgggtcacc aggcctacgc gcacaagatg ctcaccggcc gccgcgagca gatggtcagc 300 gtgaagaagg agggcgggct ctcgggcttc accaaggtca gcgagtcgcc gcacgacgcg 360 atcacggtgg ggcacgccag taccagcctg gcaaacgcgc tgggcatggc gatggcacgg 420 gacgccctgg ggcaggatta ccacgtggcc gccgtgatcg gtgacggcag cctgaccggc 480 ggcatggccc tggccgccct aaacaccatc ggggacacgc agcgcaagat gctgatcgtc 540 ctgaacgaca acgagatgag catctccgag aacgtggggg ccatgaacaa gttcatgcgt 600 ggcctccagg tgcagaagtg gttccaggag ggcgagggcg cgggcaagaa ggccatgcag 660 gcggtcagcc gcccgctcgc caacttcatg agccgcgcca agagcagcac ccggcatttc 720 ttcgaccccg ccagcgtgaa tccctttgcc accatgggcg tgcgttatgt ggggccagtc 780 gacggacaca acgtgcagga actcgtgtgg ctgctcgaac gcctcgtgga actcgacggg 840 ccgacgatcc tgcatgtggt gaccaagaag ggcaagggcc tgagctacgc cgaggccgat 900 ccgatctact ggcacggccc cggcaagttc gacccggaga ccggggactt cgtgcccagc 960 aatgcgtact cgtggagcaa cgccttcgga gacgccgtca cggagctggc gaaagccgat 1020 ccccgcacct tcgtgatcac ccccgccatg cgcgagggca gcgggctggt cggctacagc 1080 aaggcccatc cgcaccgcta tctggacgtc ggcatcgccg aggaggtcgc tgtgacggcc 1140 gccgccggca tggccctcca ggggctgcgg cccgtcgtgg cgatctactc caccttcctg 1200 caacgcgcct acgaccaggt gctgcacgac gtcgccattg agcacttgaa cgtcaccttc 1260 gctattgacc gggccgggat cgtcggcgcg gacggggcca cccacaacgg cgtcttcgac 1320 ctgagcttcc tgcgctcgat cccaggtgtg cggatcggcc tgcccaagga cgcgaccgag 1380 ctgcgtggca tgctgaagta cgcccaggag caccccggcc ccttcgccat ccgctatccg 1440 cgtggcacca ccgagcgcgt gccagagggc acctggccca ccctggcgtg gggcacgtgg 1500 gagcgcgtga agtccggcga cgacgtggtc atcctggcgg gtggcaaggg cctggagtat 1560 gcccagaagg ccgccgccga cctgcccggc gtgggtgtcg tgaacgcccg tttcgtcaag 1620 ccgcttgacg acgccatgct gcgagaggtg gccggcagtg ctcgcgctat cgtcaccgtc 1680 gaggacaaca ccgtcgtcgg gggatttggc agcgccgtgc tggaggccct gaacgcctgg 1740 ggcctgaccg tgcccgtgcg cgtgctgggc atcccggacg aattccagga acacgccacc 1800 gtggacagcg tgcatgcccg cgccggcatc gacgctcccg ctatccgcac ggtgctggcc 1860 gagcttgggg tggacgtgcc gctgggcgtg taa 1893 <210> 4 <211> 630 <212> PRT <213> Deinococcus yunweiensis <400> 4 Met Thr Ser Ser Asp Leu Val Pro Val Pro Gln Arg Leu Leu Asp Ala 1 5 10 15 Val Asn Ser Pro Asp Asp Leu Lys Thr Leu Lys Arg Glu Gln Leu Pro 20 25 30 Gln Val Ala Gln Glu Leu Arg Asp Glu Ile Val Arg Val Cys Ser Val 35 40 45 Gly Gly Leu His Leu Ala Ser Ser Leu Gly Ala Thr Asp Val Ile Val 50 55 60 Ala Leu His Tyr Val Leu Asn Ser Pro Arg Asp Arg Ile Leu Phe Asp 65 70 75 80 Val Gly His Gln Ala Tyr Ala His Lys Met Leu Thr Gly Arg Arg Glu 85 90 95 Gln Met Val Ser Val Lys Lys Glu Gly Gly Leu Ser Gly Phe Thr Lys 100 105 110 Val Ser Glu Ser Pro His Asp Ala Ile Thr Val Gly His Ala Ser Thr 115 120 125 Ser Leu Ala Asn Ala Leu Gly Met Ala Met Ala Arg Asp Ala Leu Gly 130 135 140 Gln Asp Tyr His Val Ala Ala Val Ile Gly Asp Gly Ser Leu Thr Gly 145 150 155 160 Gly Met Ala Leu Ala Ala Leu Asn Thr Ile Gly Asp Thr Gln Arg Lys 165 170 175 Met Leu Ile Val Leu Asn Asp Asn Glu Met Ser Ile Ser Glu Asn Val 180 185 190 Gly Ala Met Asn Lys Phe Met Arg Gly Leu Gln Val Gln Lys Trp Phe 195 200 205 Gln Glu Gly Glu Gly Ala Gly Lys Lys Ala Met Gln Ala Val Ser Arg 210 215 220 Pro Leu Ala Asn Phe Met Ser Arg Ala Lys Ser Ser Thr Arg His Phe 225 230 235 240 Phe Asp Pro Ala Ser Val Asn Pro Phe Ala Thr Met Gly Val Arg Tyr 245 250 255 Val Gly Pro Val Asp Gly His Asn Val Gln Glu Leu Val Trp Leu Leu 260 265 270 Glu Arg Leu Val Glu Leu Asp Gly Pro Thr Ile Leu His Val Val Thr 275 280 285 Lys Lys Gly Lys Gly Leu Ser Tyr Ala Glu Ala Asp Pro Ile Tyr Trp 290 295 300 His Gly Pro Gly Lys Phe Asp Pro Glu Thr Gly Asp Phe Val Pro Ser 305 310 315 320 Asn Ala Tyr Ser Trp Ser Asn Ala Phe Gly Asp Ala Val Thr Glu Leu 325 330 335 Ala Lys Ala Asp Pro Arg Thr Phe Val Ile Thr Pro Ala Met Arg Glu 340 345 350 Gly Ser Gly Leu Val Gly Tyr Ser Lys Ala His Pro His Arg Tyr Leu 355 360 365 Asp Val Gly Ile Ala Glu Glu Val Ala Val Thr Ala Ala Ala Gly Met 370 375 380 Ala Leu Gln Gly Leu Arg Pro Val Val Ala Ile Tyr Ser Thr Phe Leu 385 390 395 400 Gln Arg Ala Tyr Asp Gln Val Leu His Asp Val Ala Ile Glu His Leu 405 410 415 Asn Val Thr Phe Ala Ile Asp Arg Ala Gly Ile Val Gly Ala Asp Gly 420 425 430 Ala Thr His Asn Gly Val Phe Asp Leu Ser Phe Leu Arg Ser Ile Pro 435 440 445 Gly Val Arg Ile Gly Leu Pro Lys Asp Ala Thr Glu Leu Arg Gly Met 450 455 460 Leu Lys Tyr Ala Gln Glu His Pro Gly Pro Phe Ala Ile Arg Tyr Pro 465 470 475 480 Arg Gly Thr Thr Glu Arg Val Pro Glu Gly Thr Trp Pro Thr Leu Ala 485 490 495 Trp Gly Thr Trp Glu Arg Val Lys Ser Gly Asp Asp Val Val Ile Leu 500 505 510 Ala Gly Gly Lys Gly Leu Glu Tyr Ala Gln Lys Ala Ala Ala Asp Leu 515 520 525 Pro Gly Val Gly Val Val Asn Ala Arg Phe Val Lys Pro Leu Asp Asp 530 535 540 Ala Met Leu Arg Glu Val Ala Gly Ser Ala Arg Ala Ile Val Thr Val 545 550 555 560 Glu Asp Asn Thr Val Val Gly Gly Phe Gly Ser Ala Val Leu Glu Ala 565 570 575 Leu Asn Ala Trp Gly Leu Thr Val Pro Val Arg Val Leu Gly Ile Pro 580 585 590 Asp Glu Phe Gln Glu His Ala Thr Val Asp Ser Val His Ala Arg Ala 595 600 605 Gly Ile Asp Ala Pro Ala Ile Arg Thr Val Leu Ala Glu Leu Gly Val 610 615 620 Asp Val Pro Leu Gly Val 625 630 <210> 5 <211> 1908 <212> DNA <213> Deinococcus radiopugnans <400> 5 atgaccgaca tcaaaaaggc tgatgggctg cacctcgggc acaagggcac gccgctgctg 60 gaccgcattg ccggcccggc tgacctcaag aagctctcgc gcgatcagtt gcccgagctg 120 agccaggaac tgcgcgacga gatcgtgcgg gtctgctcgg tgggtgggct gcatctggcg 180 tcctcgctgg gggccaccga cctgatcgtg gcgctgcatt acgtgctgaa cagtccgcgt 240 gaccggattc tcttcgacgt gggtcaccag gcctacgccc acaagatgct gaccgggcgg 300 cgggagcaga tgcacaccgt caagaaggaa ggtgggctga gcggctttac caaggtcagc 360 gagtccgaac acgacgccat taccgtgggc cacgccagca ccagcctggc gaacgcgctg 420 ggcatggcga tggcgagaga cgcgctgggc caggactatc aggtggccgc cgtgatcggc 480 gacggctcgc tgaccggcgg gatggcgctg gccgccctga acaccatcgg tgacctgcgc 540 cgcaagatgc tgatcgtcct gaacgacaac gagatgagca tttccgagaa cgtgggcgcg 600 atcaacaagt tcatgcgcgg cctgcaggtc cagaagtggt ttcaggaggg cgagggagcc 660 gggaacaagg cggtgcagtc cctgagcaag ccgctggccg atttcatgag ccgtgccaag 720 agcagcaccc gccacttctt cgatccggcc agcgtcaatc ccttcgccat gatgggcgtg 780 cgttatgtcg gcccggtcga cggccacaac gtccaggaac tggtgtggct gatggaacgg 840 ctggtggacc tggacggccc cacgatcctg catgtcgtga cccgcaaggg caagggcctg 900 agctacgccg aggccgaccc gatctactgg cacggtcccg gtcaatttga cccggacacc 960 ggggatttca aggccagcag cgcgtactcg tggagcgccg cgttcggcga cgccgtgacc 1020 gaactggcca aacgcgatcc gcgtactttc gtgatcaccc cggccatgcg cgagggcagc 1080 gggctggtgg gctacagccg ggcgcacccg caccgttacc tggacgtggg catcgccgag 1140 gacgtggccg tgaccactgc cgccggcatg gcgttgcagg gcctgcggcc catcgtggcg 1200 atctactcca ccttcctgca acgcgcctac gatcaggtgt tgcacgacgt cgccatcgag 1260 aacctgaacg tcaccttcgc catcgaccgc gccgggatcg tgggggccga cggctcgacg 1320 cacaacggcg tgttcgacct gagctacctg cgcagcattc ccaacgtgcg gatcggcctg 1380 ccgaaggacg cccacgagat gcgcggcatg ctgaagtacg cgcaggagca cgacggtccc 1440 ttcgccatcc gttacccgcg cggcaacacg gtcaaggtgc cggaaggcac gtggcccacg 1500 ctggaatggg gcacgtggga gcgcgtcaag gaaggctccg acgccgtgat cctggccggc 1560 ggcaaggcgc tggaatacgc gcaggcggcg gcggcggacc tgcccggcgt cggtgtggtg 1620 aacgcccgtt tcgtcaagcc gctggacctg aacatgctgc gcgagctggc cggcagcgcc 1680 cgcacaatca tcaccgtgga ggacaacacg ctggtgggcg gcttcggcag cgccgtgttg 1740 gaggccctga acagcatggg cttaaaggtg cccgtgcgga cgctgggcat tccggacgag 1800 ttccaggacc acgccaccgc cgagagcgtc cacgcccgcg ccggcatcga tgcccaggcg 1860 atccgcaccg tgctggccga gcttggggtg gatgtgcctc tgggcgtc 1908 <210> 6 <211> 636 <212> PRT <213> Deinococcus radiopugnans <400> 6 Met Thr Asp Ile Lys Lys Ala Asp Gly Leu His Leu Gly His Lys Gly 1 5 10 15 Thr Pro Leu Leu Asp Arg Ile Ala Gly Pro Ala Asp Leu Lys Lys Leu 20 25 30 Ser Arg Asp Gln Leu Pro Glu Leu Ser Gln Glu Leu Arg Asp Glu Ile 35 40 45 Val Arg Val Cys Ser Val Gly Gly Leu His Leu Ala Ser Ser Leu Gly 50 55 60 Ala Thr Asp Leu Ile Val Ala Leu His Tyr Val Leu Asn Ser Pro Arg 65 70 75 80 Asp Arg Ile Leu Phe Asp Val Gly His Gln Ala Tyr Ala His Lys Met 85 90 95 Leu Thr Gly Arg Arg Glu Gln Met His Thr Val Lys Lys Glu Gly Gly 100 105 110 Leu Ser Gly Phe Thr Lys Val Ser Glu Ser Glu His Asp Ala Ile Thr 115 120 125 Val Gly His Ala Ser Thr Ser Leu Ala Asn Ala Leu Gly Met Ala Met 130 135 140 Ala Arg Asp Ala Leu Gly Gln Asp Tyr Gln Val Ala Ala Val Ile Gly 145 150 155 160 Asp Gly Ser Leu Thr Gly Gly Met Ala Leu Ala Ala Leu Asn Thr Ile 165 170 175 Gly Asp Leu Arg Arg Lys Met Leu Ile Val Leu Asn Asp Asn Glu Met 180 185 190 Ser Ile Ser Glu Asn Val Gly Ala Ile Asn Lys Phe Met Arg Gly Leu 195 200 205 Gln Val Gln Lys Trp Phe Gln Glu Gly Glu Gly Ala Gly Asn Lys Ala 210 215 220 Val Gln Ser Leu Ser Lys Pro Leu Ala Asp Phe Met Ser Arg Ala Lys 225 230 235 240 Ser Ser Thr Arg His Phe Phe Asp Pro Ala Ser Val Asn Pro Phe Ala 245 250 255 Met Met Gly Val Arg Tyr Val Gly Pro Val Asp Gly His Asn Val Gln 260 265 270 Glu Leu Val Trp Leu Met Glu Arg Leu Val Asp Leu Asp Gly Pro Thr 275 280 285 Ile Leu His Val Val Thr Arg Lys Gly Lys Gly Leu Ser Tyr Ala Glu 290 295 300 Ala Asp Pro Ile Tyr Trp His Gly Pro Gly Gln Phe Asp Pro Asp Thr 305 310 315 320 Gly Asp Phe Lys Ala Ser Ser Ala Tyr Ser Trp Ser Ala Ala Phe Gly 325 330 335 Asp Ala Val Thr Glu Leu Ala Lys Arg Asp Pro Arg Thr Phe Val Ile 340 345 350 Thr Pro Ala Met Arg Glu Gly Ser Gly Leu Val Gly Tyr Ser Arg Ala 355 360 365 His Pro His Arg Tyr Leu Asp Val Gly Ile Ala Glu Asp Val Ala Val 370 375 380 Thr Thr Ala Ala Gly Met Ala Leu Gln Gly Leu Arg Pro Ile Val Ala 385 390 395 400 Ile Tyr Ser Thr Phe Leu Gln Arg Ala Tyr Asp Gln Val Leu His Asp 405 410 415 Val Ala Ile Glu Asn Leu Asn Val Thr Phe Ala Ile Asp Arg Ala Gly 420 425 430 Ile Val Gly Ala Asp Gly Ser Thr His Asn Gly Val Phe Asp Leu Ser 435 440 445 Tyr Leu Arg Ser Ile Pro Asn Val Arg Ile Gly Leu Pro Lys Asp Ala 450 455 460 His Glu Met Arg Gly Met Leu Lys Tyr Ala Gln Glu His Asp Gly Pro 465 470 475 480 Phe Ala Ile Arg Tyr Pro Arg Gly Asn Thr Val Lys Val Pro Glu Gly 485 490 495 Thr Trp Pro Thr Leu Glu Trp Gly Thr Trp Glu Arg Val Lys Glu Gly 500 505 510 Ser Asp Ala Val Ile Leu Ala Gly Gly Lys Ala Leu Glu Tyr Ala Gln 515 520 525 Ala Ala Ala Ala Asp Leu Pro Gly Val Gly Val Val Asn Ala Arg Phe 530 535 540 Val Lys Pro Leu Asp Leu Asn Met Leu Arg Glu Leu Ala Gly Ser Ala 545 550 555 560 Arg Thr Ile Ile Thr Val Glu Asp Asn Thr Leu Val Gly Gly Phe Gly 565 570 575 Ser Ala Val Leu Glu Ala Leu Asn Ser Met Gly Leu Lys Val Pro Val 580 585 590 Arg Thr Leu Gly Ile Pro Asp Glu Phe Gln Asp His Ala Thr Ala Glu 595 600 605 Ser Val His Ala Arg Ala Gly Ile Asp Ala Gln Ala Ile Arg Thr Val 610 615 620 Leu Ala Glu Leu Gly Val Asp Val Pro Leu Gly Val 625 630 635 <210> 7 <211> 1908 <212> DNA <213> Deinococcus radiopugnans <400> 7 atgaccgaca tcaaaaaggc tgatgggctg cacctcgggc acaagggcac gccgctgctg 60 gaccgcattg ccggcccggc tgacctcaag aagctctcgc gcgatcagtt gcccgagctg 120 agccaggaac tgcgcgacga gatcgtgcgg gtctgctcgg tgggtgggct gcatctggcg 180 tcctcgctgg gggccaccga cctgatcgtg gcgctgcatt acgtgctgaa cagtccgcgt 240 gaccggattc tcttcgacgt gggtcaccag gcctacgccc acaagatgct gaccgggcgg 300 cgggagcaga tgcacaccgt caagaaggaa ggtgggctga gcggctttac caaggtcagc 360 gagtccgaac acgacgccat taccgtgggc cacgccagca ccagcctggc gaacgcgctg 420 ggcatggcga tggcgagaga cgcgctgggc caggactatc aggtggccgc cgtgatcggc 480 gacggctcgc tgaccggcgg gatggcgctg gccgccctga acaccatcgg tgacctgcgc 540 cgcaagatgc tgatcgtcct gaacgacaac gagatgagca tttccgagaa cgtgggcgcg 600 atcaacaagt tcatgcgcgg cctgcaggtc cagaagtggt ttcaggaggg cgagggagcc 660 gggaaaaagg cggtgcagtc cctgagcaag ccgctggccg atttcatgag ccgtgccaag 720 agcagcacct gccacttctt cgatccggcc agcgtcaatc ccttcgccat gatgggcgtg 780 cgttatgtcg gcccggtcga cggccacaac gtccaggaac tggtgtggct gatggaacgg 840 ctggtggacc tggacggccc cacgatcctg catgtcgtga cccgcaaggg caagggcctg 900 agctacgccg aggccgaccc gatctactgg cacggtcccg gtcaatttga cccggacacc 960 ggggatttca aggccagcag cgcgtactcg tggagcgccg cgttcggcga cgccgtgacc 1020 gaactggcca aacgcgatcc gcgtactttc gtgatcaccc cggccatgcg cgagggcagc 1080 gggctggtgg gctacagccg ggcgcacccg caccgttacc tggacgtggg catcgccgag 1140 gacgtggccg tgaccactgc cgccggcatg gcgttgcagg gcctgcggcc catcgtggcg 1200 atctactcca ccttcctgca acgcgcctac gatcaggtgt tgcacgacgt cgccatcgag 1260 aacctgaacg tcaccttcgc catcgaccgc gccgggatcg tgggggccga cggctcgacg 1320 cacaacggcg tgttcgacct gagctacctg cgcagcattc ccaacgtgcg gatcggcctg 1380 ccgaaggacg cccacgagat gcgcggcatg ctgaagtacg cgcaggagca cgacggtccc 1440 ttcgccatcc gttacccgcg cggcaacacg gtcaaggtgc cggaaggcac gtggcccacg 1500 ctggaatggg gcacgtggga gcgcgtcaag gaaggctccg acgccgtgat cctggccggc 1560 ggcaaggcgc tggaatacgc gcaggcggcg gcggcggacc tgcccggcgt cggtgtggtg 1620 aacgcccgtt tcgtcaagcc gctggacctg aacatgctgc gcgagctggc cggcagcgcc 1680 cgcacaatca tcaccgtgga ggacaacacg ctggtgggcg gcttcggcag cgccgtgttg 1740 gaggccctga acagcatggg cttaaaggtg cccgtgcgga cgctgggcat tccggacgag 1800 ttccaggacc acgccaccgc cgagagcgtc cacgcccgcg ccggcatcga tgcccaggcg 1860 atccgcaccg tgctggccga gcttggggtg gatgtgcctc tgggcgtc 1908 <210> 8 <211> 636 <212> PRT <213> Deinococcus radiopugnans <400> 8 Met Thr Asp Ile Lys Lys Ala Asp Gly Leu His Leu Gly His Lys Gly 1 5 10 15 Thr Pro Leu Leu Asp Arg Ile Ala Gly Pro Ala Asp Leu Lys Lys Leu 20 25 30 Ser Arg Asp Gln Leu Pro Glu Leu Ser Gln Glu Leu Arg Asp Glu Ile 35 40 45 Val Arg Val Cys Ser Val Gly Gly Leu His Leu Ala Ser Ser Leu Gly 50 55 60 Ala Thr Asp Leu Ile Val Ala Leu His Tyr Val Leu Asn Ser Pro Arg 65 70 75 80 Asp Arg Ile Leu Phe Asp Val Gly His Gln Ala Tyr Ala His Lys Met 85 90 95 Leu Thr Gly Arg Arg Glu Gln Met His Thr Val Lys Lys Glu Gly Gly 100 105 110 Leu Ser Gly Phe Thr Lys Val Ser Glu Ser Glu His Asp Ala Ile Thr 115 120 125 Val Gly His Ala Ser Thr Ser Leu Ala Asn Ala Leu Gly Met Ala Met 130 135 140 Ala Arg Asp Ala Leu Gly Gln Asp Tyr Gln Val Ala Ala Val Ile Gly 145 150 155 160 Asp Gly Ser Leu Thr Gly Gly Met Ala Leu Ala Ala Leu Asn Thr Ile 165 170 175 Gly Asp Leu Arg Arg Lys Met Leu Ile Val Leu Asn Asp Asn Glu Met 180 185 190 Ser Ile Ser Glu Asn Val Gly Ala Ile Asn Lys Phe Met Arg Gly Leu 195 200 205 Gln Val Gln Lys Trp Phe Gln Glu Gly Glu Gly Ala Gly Lys Lys Ala 210 215 220 Val Gln Ser Leu Ser Lys Pro Leu Ala Asp Phe Met Ser Arg Ala Lys 225 230 235 240 Ser Ser Thr Cys His Phe Phe Asp Pro Ala Ser Val Asn Pro Phe Ala 245 250 255 Met Met Gly Val Arg Tyr Val Gly Pro Val Asp Gly His Asn Val Gln 260 265 270 Glu Leu Val Trp Leu Met Glu Arg Leu Val Asp Leu Asp Gly Pro Thr 275 280 285 Ile Leu His Val Val Thr Arg Lys Gly Lys Gly Leu Ser Tyr Ala Glu 290 295 300 Ala Asp Pro Ile Tyr Trp His Gly Pro Gly Gln Phe Asp Pro Asp Thr 305 310 315 320 Gly Asp Phe Lys Ala Ser Ser Ala Tyr Ser Trp Ser Ala Ala Phe Gly 325 330 335 Asp Ala Val Thr Glu Leu Ala Lys Arg Asp Pro Arg Thr Phe Val Ile 340 345 350 Thr Pro Ala Met Arg Glu Gly Ser Gly Leu Val Gly Tyr Ser Arg Ala 355 360 365 His Pro His Arg Tyr Leu Asp Val Gly Ile Ala Glu Asp Val Ala Val 370 375 380 Thr Thr Ala Ala Gly Met Ala Leu Gln Gly Leu Arg Pro Ile Val Ala 385 390 395 400 Ile Tyr Ser Thr Phe Leu Gln Arg Ala Tyr Asp Gln Val Leu His Asp 405 410 415 Val Ala Ile Glu Asn Leu Asn Val Thr Phe Ala Ile Asp Arg Ala Gly 420 425 430 Ile Val Gly Ala Asp Gly Ser Thr His Asn Gly Val Phe Asp Leu Ser 435 440 445 Tyr Leu Arg Ser Ile Pro Asn Val Arg Ile Gly Leu Pro Lys Asp Ala 450 455 460 His Glu Met Arg Gly Met Leu Lys Tyr Ala Gln Glu His Asp Gly Pro 465 470 475 480 Phe Ala Ile Arg Tyr Pro Arg Gly Asn Thr Val Lys Val Pro Glu Gly 485 490 495 Thr Trp Pro Thr Leu Glu Trp Gly Thr Trp Glu Arg Val Lys Glu Gly 500 505 510 Ser Asp Ala Val Ile Leu Ala Gly Gly Lys Ala Leu Glu Tyr Ala Gln 515 520 525 Ala Ala Ala Ala Asp Leu Pro Gly Val Gly Val Val Asn Ala Arg Phe 530 535 540 Val Lys Pro Leu Asp Leu Asn Met Leu Arg Glu Leu Ala Gly Ser Ala 545 550 555 560 Arg Thr Ile Ile Thr Val Glu Asp Asn Thr Leu Val Gly Gly Phe Gly 565 570 575 Ser Ala Val Leu Glu Ala Leu Asn Ser Met Gly Leu Lys Val Pro Val 580 585 590 Arg Thr Leu Gly Ile Pro Asp Glu Phe Gln Asp His Ala Thr Ala Glu 595 600 605 Ser Val His Ala Arg Ala Gly Ile Asp Ala Gln Ala Ile Arg Thr Val 610 615 620 Leu Ala Glu Leu Gly Val Asp Val Pro Leu Gly Val 625 630 635 <210> 9 <211> 1908 <212> DNA <213> Deinococcus radiopugnans <400> 9 atgaccgaca tcaaaaaggc tgatgggctg cacctcgggc acaagggcac gccgctgctg 60 gaccgcattg ccggcccggc tgacctcaag aagctctcgc gcgatcagtt gcccgagctg 120 agccaggaac tgcgcgacga gatcgtgcgg gtctgctcgg tgggtgggct gcatctggcg 180 tcctcgctgg gggccaccga cctgatcgtg gcgctgcatt acgtgctgaa cagtccgcgt 240 gaccggattc tcttcgacgt gggtcaccag gcctacgccc acaagatgct gaccgggcgg 300 cgggagcaga tgcacaccgt caagaaggaa ggtgggctga gcggctttac caaggtcagc 360 gagtccgaac acgacgccat taccgtgggc cacgccagca ccagcctggc gaacgcgctg 420 ggcatggcga tggcgagaga cgcgctgggc caggactatc aggtggccgc cgtgatcggc 480 gacggctcgc tgaccggcgg gatggcgctg gccgccctga acaccatcgg tgacctgcgc 540 cgcaagatgc tgatcgtcct gaacgacaac gagatgagca tttccgagaa cgtgggcgcg 600 atcaacaagt tcatgcgcgg cctgcaggtc cagaagtggt ttcaggaggg cgagggagcc 660 gggaacaagg cggtgcagtc cctgagcaag ccgctggccg atttcatgag ccgtgccaag 720 agcagcacct gccacttctt cgatccggcc agcgtcaatc ccttcgccat gatgggcgtg 780 cgttatgtcg gcccggtcga cggccacaac gtccaggaac tggtgtggct gatggaacgg 840 ctggtggacc tggacggccc cacgatcctg catgtcgtga cccgcaaggg caagggcctg 900 agctacgccg aggccgaccc gatctactgg cacggtcccg gtcaatttga cccggacacc 960 ggggatttca aggccagcag cgcgtactcg tggagcgccg cgttcggcga cgccgtgacc 1020 gaactggcca aacgcgatcc gcgtactttc gtgatcaccc cggccatgcg cgagggcagc 1080 gggctggtgg gctacagccg ggcgcacccg caccgttacc tggacgtggg catcgccgag 1140 gacgtggccg tgaccactgc cgccggcatg gcgttgcagg gcctgcggcc catcgtggcg 1200 atctactcca ccttcctgca acgcgcctac gatcaggtgt tgcacgacgt cgccatcgag 1260 aacctgaacg tcaccttcgc catcgaccgc gccgggatcg tgggggccga cggctcgacg 1320 cacaacggcg tgttcgacct gagctacctg cgcagcattc ccaacgtgcg gatcggcctg 1380 ccgaaggacg cccacgagat gcgcggcatg ctgaagtacg cgcaggagca cgacggtccc 1440 ttcgccatcc gttacccgcg cggcaacacg gtcaaggtgc cggaaggcac gtggcccacg 1500 ctggaatggg gcacgtggga gcgcgtcaag gaaggctccg acgccgtgat cctggccggc 1560 ggcaaggcgc tggaatacgc gcaggcggcg gcggcggacc tgcccggcgt cggtgtggtg 1620 aacgcccgtt tcgtcaagcc gctggacctg aacatgctgc gcgagctggc cggcagcgcc 1680 cgcacaatca tcaccgtgga ggacaacacg ctggtgggcg gcttcggcag cgccgtgttg 1740 gaggccctga acagcatggg cttaaaggtg cccgtgcgga cgctgggcat tccggacgag 1800 ttccaggacc acgccaccgc cgagagcgtc cacgcccgcg ccggcatcga tgcccaggcg 1860 atccgcaccg tgctggccga gcttggggtg gatgtgcctc tgggcgtc 1908 <210> 10 <211> 636 <212> PRT <213> Deinococcus radiopugnans <400> 10 Met Thr Asp Ile Lys Lys Ala Asp Gly Leu His Leu Gly His Lys Gly 1 5 10 15 Thr Pro Leu Leu Asp Arg Ile Ala Gly Pro Ala Asp Leu Lys Lys Leu 20 25 30 Ser Arg Asp Gln Leu Pro Glu Leu Ser Gln Glu Leu Arg Asp Glu Ile 35 40 45 Val Arg Val Cys Ser Val Gly Gly Leu His Leu Ala Ser Ser Leu Gly 50 55 60 Ala Thr Asp Leu Ile Val Ala Leu His Tyr Val Leu Asn Ser Pro Arg 65 70 75 80 Asp Arg Ile Leu Phe Asp Val Gly His Gln Ala Tyr Ala His Lys Met 85 90 95 Leu Thr Gly Arg Arg Glu Gln Met His Thr Val Lys Lys Glu Gly Gly 100 105 110 Leu Ser Gly Phe Thr Lys Val Ser Glu Ser Glu His Asp Ala Ile Thr 115 120 125 Val Gly His Ala Ser Thr Ser Leu Ala Asn Ala Leu Gly Met Ala Met 130 135 140 Ala Arg Asp Ala Leu Gly Gln Asp Tyr Gln Val Ala Ala Val Ile Gly 145 150 155 160 Asp Gly Ser Leu Thr Gly Gly Met Ala Leu Ala Ala Leu Asn Thr Ile 165 170 175 Gly Asp Leu Arg Arg Lys Met Leu Ile Val Leu Asn Asp Asn Glu Met 180 185 190 Ser Ile Ser Glu Asn Val Gly Ala Ile Asn Lys Phe Met Arg Gly Leu 195 200 205 Gln Val Gln Lys Trp Phe Gln Glu Gly Glu Gly Ala Gly Asn Lys Ala 210 215 220 Val Gln Ser Leu Ser Lys Pro Leu Ala Asp Phe Met Ser Arg Ala Lys 225 230 235 240 Ser Ser Thr Cys His Phe Phe Asp Pro Ala Ser Val Asn Pro Phe Ala 245 250 255 Met Met Gly Val Arg Tyr Val Gly Pro Val Asp Gly His Asn Val Gln 260 265 270 Glu Leu Val Trp Leu Met Glu Arg Leu Val Asp Leu Asp Gly Pro Thr 275 280 285 Ile Leu His Val Val Thr Arg Lys Gly Lys Gly Leu Ser Tyr Ala Glu 290 295 300 Ala Asp Pro Ile Tyr Trp His Gly Pro Gly Gln Phe Asp Pro Asp Thr 305 310 315 320 Gly Asp Phe Lys Ala Ser Ser Ala Tyr Ser Trp Ser Ala Ala Phe Gly 325 330 335 Asp Ala Val Thr Glu Leu Ala Lys Arg Asp Pro Arg Thr Phe Val Ile 340 345 350 Thr Pro Ala Met Arg Glu Gly Ser Gly Leu Val Gly Tyr Ser Arg Ala 355 360 365 His Pro His Arg Tyr Leu Asp Val Gly Ile Ala Glu Asp Val Ala Val 370 375 380 Thr Thr Ala Ala Gly Met Ala Leu Gln Gly Leu Arg Pro Ile Val Ala 385 390 395 400 Ile Tyr Ser Thr Phe Leu Gln Arg Ala Tyr Asp Gln Val Leu His Asp 405 410 415 Val Ala Ile Glu Asn Leu Asn Val Thr Phe Ala Ile Asp Arg Ala Gly 420 425 430 Ile Val Gly Ala Asp Gly Ser Thr His Asn Gly Val Phe Asp Leu Ser 435 440 445 Tyr Leu Arg Ser Ile Pro Asn Val Arg Ile Gly Leu Pro Lys Asp Ala 450 455 460 His Glu Met Arg Gly Met Leu Lys Tyr Ala Gln Glu His Asp Gly Pro 465 470 475 480 Phe Ala Ile Arg Tyr Pro Arg Gly Asn Thr Val Lys Val Pro Glu Gly 485 490 495 Thr Trp Pro Thr Leu Glu Trp Gly Thr Trp Glu Arg Val Lys Glu Gly 500 505 510 Ser Asp Ala Val Ile Leu Ala Gly Gly Lys Ala Leu Glu Tyr Ala Gln 515 520 525 Ala Ala Ala Ala Asp Leu Pro Gly Val Gly Val Val Asn Ala Arg Phe 530 535 540 Val Lys Pro Leu Asp Leu Asn Met Leu Arg Glu Leu Ala Gly Ser Ala 545 550 555 560 Arg Thr Ile Ile Thr Val Glu Asp Asn Thr Leu Val Gly Gly Phe Gly 565 570 575 Ser Ala Val Leu Glu Ala Leu Asn Ser Met Gly Leu Lys Val Pro Val 580 585 590 Arg Thr Leu Gly Ile Pro Asp Glu Phe Gln Asp His Ala Thr Ala Glu 595 600 605 Ser Val His Ala Arg Ala Gly Ile Asp Ala Gln Ala Ile Arg Thr Val 610 615 620 Leu Ala Glu Leu Gly Val Asp Val Pro Leu Gly Val 625 630 635 <210> 11 <211> 1893 <212> DNA <213> Deinococcus yunweiensis <400> 11 atgacatcca gcgacctcgt ccccgttccg cagcgcctgc tcgacgcggt gaactcgccg 60 gacgacctca agaccctgaa gcgcgagcag ctgccgcagg tggcgcagga actccgcgac 120 gagatcgtgc gggtgtgctc ggtgggtggc ctgcacctgg cgtcctcgct gggcgcgacc 180 gacgtgatcg tggcgctgca ctacgtcctg aactcgccgc gtgaccggat tctgttcgat 240 gtgggtcacc aggcctacgc gcacaagatg ctcaccggcc gccgcgagca gatggtcagc 300 gtgaagaagg agggcgggct ctcgggcttc accaaggtca gcgagtcgcc gcacgacgcg 360 atcacggtgg ggcacgccag taccagcctg gcaaacgcgc tgggcatggc gatggcacgg 420 gacgccctgg ggcaggatta ccacgtggcc gccgtgatcg gtgacggcag cctgaccggc 480 ggcatggccc tggccgccct aaacaccatc ggggacacgc agcgcaagat gctgatcgtc 540 ctgaacgaca acgagatgag catctccgag aacgtggggg ccatgaacaa gttcatgcgt 600 ggcctccagg tgcagaagtg gttccaggag ggcgagggcg cgggcaacaa ggccatgcag 660 gcggtcagcc gcccgctcgc caacttcatg agccgcgcca agagcagcac ccggcatttc 720 ttcgaccccg ccagcgtgaa tccctttgcc accatgggcg tgcgttatgt ggggccagtc 780 gacggacaca acgtgcagga actcgtgtgg ctgctcgaac gcctcgtgga actcgacggg 840 ccgacgatcc tgcatgtggt gaccaagaag ggcaagggcc tgagctacgc cgaggccgat 900 ccgatctact ggcacggccc cggcaagttc gacccggaga ccggggactt cgtgcccagc 960 aatgcgtact cgtggagcaa cgccttcgga gacgccgtca cggagctggc gaaagccgat 1020 ccccgcacct tcgtgatcac ccccgccatg cgcgagggca gcgggctggt cggctacagc 1080 aaggcccatc cgcaccgcta tctggacgtc ggcatcgccg aggaggtcgc tgtgacggcc 1140 gccgccggca tggccctcca ggggctgcgg cccgtcgtgg cgatctactc caccttcctg 1200 caacgcgcct acgaccaggt gctgcacgac gtcgccattg agcacttgaa cgtcaccttc 1260 gctattgacc gggccgggat cgtcggcgcg gacggggcca cccacaacgg cgtcttcgac 1320 ctgagcttcc tgcgctcgat cccaggtgtg cggatcggcc tgcccaagga cgcgaccgag 1380 ctgcgtggca tgctgaagta cgcccaggag caccccggcc ccttcgccat ccgctatccg 1440 cgtggcacca ccgagcgcgt gccagagggc acctggccca ccctggcgtg gggcacgtgg 1500 gagcgcgtga agtccggcga cgacgtggtc atcctggcgg gtggcaaggg cctggagtat 1560 gcccagaagg ccgccgccga cctgcccggc gtgggtgtcg tgaacgcccg tttcgtcaag 1620 ccgcttgacg acgccatgct gcgagaggtg gccggcagtg ctcgcgctat cgtcaccgtc 1680 gaggacaaca ccgtcgtcgg gggatttggc agcgccgtgc tggaggccct gaacgcctgg 1740 ggcctgaccg tgcccgtgcg cgtgctgggc atcccggacg aattccagga acacgccacc 1800 gtggacagcg tgcatgcccg cgccggcatc gacgctcccg ctatccgcac ggtgctggcc 1860 gagcttgggg tggacgtgcc gctgggcgtg taa 1893 <210> 12 <211> 630 <212> PRT <213> Deinococcus yunweiensis <400> 12 Met Thr Ser Ser Asp Leu Val Pro Val Pro Gln Arg Leu Leu Asp Ala 1 5 10 15 Val Asn Ser Pro Asp Asp Leu Lys Thr Leu Lys Arg Glu Gln Leu Pro 20 25 30 Gln Val Ala Gln Glu Leu Arg Asp Glu Ile Val Arg Val Cys Ser Val 35 40 45 Gly Gly Leu His Leu Ala Ser Ser Leu Gly Ala Thr Asp Val Ile Val 50 55 60 Ala Leu His Tyr Val Leu Asn Ser Pro Arg Asp Arg Ile Leu Phe Asp 65 70 75 80 Val Gly His Gln Ala Tyr Ala His Lys Met Leu Thr Gly Arg Arg Glu 85 90 95 Gln Met Val Ser Val Lys Lys Glu Gly Gly Leu Ser Gly Phe Thr Lys 100 105 110 Val Ser Glu Ser Pro His Asp Ala Ile Thr Val Gly His Ala Ser Thr 115 120 125 Ser Leu Ala Asn Ala Leu Gly Met Ala Met Ala Arg Asp Ala Leu Gly 130 135 140 Gln Asp Tyr His Val Ala Ala Val Ile Gly Asp Gly Ser Leu Thr Gly 145 150 155 160 Gly Met Ala Leu Ala Ala Leu Asn Thr Ile Gly Asp Thr Gln Arg Lys 165 170 175 Met Leu Ile Val Leu Asn Asp Asn Glu Met Ser Ile Ser Glu Asn Val 180 185 190 Gly Ala Met Asn Lys Phe Met Arg Gly Leu Gln Val Gln Lys Trp Phe 195 200 205 Gln Glu Gly Glu Gly Ala Gly Asn Lys Ala Met Gln Ala Val Ser Arg 210 215 220 Pro Leu Ala Asn Phe Met Ser Arg Ala Lys Ser Ser Thr Arg His Phe 225 230 235 240 Phe Asp Pro Ala Ser Val Asn Pro Phe Ala Thr Met Gly Val Arg Tyr 245 250 255 Val Gly Pro Val Asp Gly His Asn Val Gln Glu Leu Val Trp Leu Leu 260 265 270 Glu Arg Leu Val Glu Leu Asp Gly Pro Thr Ile Leu His Val Val Thr 275 280 285 Lys Lys Gly Lys Gly Leu Ser Tyr Ala Glu Ala Asp Pro Ile Tyr Trp 290 295 300 His Gly Pro Gly Lys Phe Asp Pro Glu Thr Gly Asp Phe Val Pro Ser 305 310 315 320 Asn Ala Tyr Ser Trp Ser Asn Ala Phe Gly Asp Ala Val Thr Glu Leu 325 330 335 Ala Lys Ala Asp Pro Arg Thr Phe Val Ile Thr Pro Ala Met Arg Glu 340 345 350 Gly Ser Gly Leu Val Gly Tyr Ser Lys Ala His Pro His Arg Tyr Leu 355 360 365 Asp Val Gly Ile Ala Glu Glu Val Ala Val Thr Ala Ala Ala Gly Met 370 375 380 Ala Leu Gln Gly Leu Arg Pro Val Val Ala Ile Tyr Ser Thr Phe Leu 385 390 395 400 Gln Arg Ala Tyr Asp Gln Val Leu His Asp Val Ala Ile Glu His Leu 405 410 415 Asn Val Thr Phe Ala Ile Asp Arg Ala Gly Ile Val Gly Ala Asp Gly 420 425 430 Ala Thr His Asn Gly Val Phe Asp Leu Ser Phe Leu Arg Ser Ile Pro 435 440 445 Gly Val Arg Ile Gly Leu Pro Lys Asp Ala Thr Glu Leu Arg Gly Met 450 455 460 Leu Lys Tyr Ala Gln Glu His Pro Gly Pro Phe Ala Ile Arg Tyr Pro 465 470 475 480 Arg Gly Thr Thr Glu Arg Val Pro Glu Gly Thr Trp Pro Thr Leu Ala 485 490 495 Trp Gly Thr Trp Glu Arg Val Lys Ser Gly Asp Asp Val Val Ile Leu 500 505 510 Ala Gly Gly Lys Gly Leu Glu Tyr Ala Gln Lys Ala Ala Ala Asp Leu 515 520 525 Pro Gly Val Gly Val Val Asn Ala Arg Phe Val Lys Pro Leu Asp Asp 530 535 540 Ala Met Leu Arg Glu Val Ala Gly Ser Ala Arg Ala Ile Val Thr Val 545 550 555 560 Glu Asp Asn Thr Val Val Gly Gly Phe Gly Ser Ala Val Leu Glu Ala 565 570 575 Leu Asn Ala Trp Gly Leu Thr Val Pro Val Arg Val Leu Gly Ile Pro 580 585 590 Asp Glu Phe Gln Glu His Ala Thr Val Asp Ser Val His Ala Arg Ala 595 600 605 Gly Ile Asp Ala Pro Ala Ile Arg Thr Val Leu Ala Glu Leu Gly Val 610 615 620 Asp Val Pro Leu Gly Val 625 630 <210> 13 <211> 1893 <212> DNA <213> Deinococcus yunweiensis <400> 13 atgacatcca gcgacctcgt ccccgttccg cagcgcctgc tcgacgcggt gaactcgccg 60 gacgacctca agaccctgaa gcgcgagcag ctgccgcagg tggcgcagga actccgcgac 120 gagatcgtgc gggtgtgctc ggtgggtggc ctgcacctgg cgtcctcgct gggcgcgacc 180 gacgtgatcg tggcgctgca ctacgtcctg aactcgccgc gtgaccggat tctgttcgat 240 gtgggtcacc aggcctacgc gcacaagatg ctcaccggcc gccgcgagca gatggtcagc 300 gtgaagaagg agggcgggct ctcgggcttc accaaggtca gcgagtcgcc gcacgacgcg 360 atcacggtgg ggcacgccag taccagcctg gcaaacgcgc tgggcatggc gatggcacgg 420 gacgccctgg ggcaggatta ccacgtggcc gccgtgatcg gtgacggcag cctgaccggc 480 ggcatggccc tggccgccct aaacaccatc ggggacacgc agcgcaagat gctgatcgtc 540 ctgaacgaca acgagatgag catctccgag aacgtggggg ccatgaacaa gttcatgcgt 600 ggcctccagg tgcagaagtg gttccaggag ggcgagggcg cgggcaagaa ggccatgcag 660 gcggtcagcc gcccgctcgc caacttcatg agccgcgcca agagcagcac ctgccatttc 720 ttcgaccccg ccagcgtgaa tccctttgcc accatgggcg tgcgttatgt ggggccagtc 780 gacggacaca acgtgcagga actcgtgtgg ctgctcgaac gcctcgtgga actcgacggg 840 ccgacgatcc tgcatgtggt gaccaagaag ggcaagggcc tgagctacgc cgaggccgat 900 ccgatctact ggcacggccc cggcaagttc gacccggaga ccggggactt cgtgcccagc 960 aatgcgtact cgtggagcaa cgccttcgga gacgccgtca cggagctggc gaaagccgat 1020 ccccgcacct tcgtgatcac ccccgccatg cgcgagggca gcgggctggt cggctacagc 1080 aaggcccatc cgcaccgcta tctggacgtc ggcatcgccg aggaggtcgc tgtgacggcc 1140 gccgccggca tggccctcca ggggctgcgg cccgtcgtgg cgatctactc caccttcctg 1200 caacgcgcct acgaccaggt gctgcacgac gtcgccattg agcacttgaa cgtcaccttc 1260 gctattgacc gggccgggat cgtcggcgcg gacggggcca cccacaacgg cgtcttcgac 1320 ctgagcttcc tgcgctcgat cccaggtgtg cggatcggcc tgcccaagga cgcgaccgag 1380 ctgcgtggca tgctgaagta cgcccaggag caccccggcc ccttcgccat ccgctatccg 1440 cgtggcacca ccgagcgcgt gccagagggc acctggccca ccctggcgtg gggcacgtgg 1500 gagcgcgtga agtccggcga cgacgtggtc atcctggcgg gtggcaaggg cctggagtat 1560 gcccagaagg ccgccgccga cctgcccggc gtgggtgtcg tgaacgcccg tttcgtcaag 1620 ccgcttgacg acgccatgct gcgagaggtg gccggcagtg ctcgcgctat cgtcaccgtc 1680 gaggacaaca ccgtcgtcgg gggatttggc agcgccgtgc tggaggccct gaacgcctgg 1740 ggcctgaccg tgcccgtgcg cgtgctgggc atcccggacg aattccagga acacgccacc 1800 gtggacagcg tgcatgcccg cgccggcatc gacgctcccg ctatccgcac ggtgctggcc 1860 gagcttgggg tggacgtgcc gctgggcgtg taa 1893 <210> 14 <211> 630 <212> PRT <213> Deinococcus yunweiensis <400> 14 Met Thr Ser Ser Asp Leu Val Pro Val Pro Gln Arg Leu Leu Asp Ala 1 5 10 15 Val Asn Ser Pro Asp Asp Leu Lys Thr Leu Lys Arg Glu Gln Leu Pro 20 25 30 Gln Val Ala Gln Glu Leu Arg Asp Glu Ile Val Arg Val Cys Ser Val 35 40 45 Gly Gly Leu His Leu Ala Ser Ser Leu Gly Ala Thr Asp Val Ile Val 50 55 60 Ala Leu His Tyr Val Leu Asn Ser Pro Arg Asp Arg Ile Leu Phe Asp 65 70 75 80 Val Gly His Gln Ala Tyr Ala His Lys Met Leu Thr Gly Arg Arg Glu 85 90 95 Gln Met Val Ser Val Lys Lys Glu Gly Gly Leu Ser Gly Phe Thr Lys 100 105 110 Val Ser Glu Ser Pro His Asp Ala Ile Thr Val Gly His Ala Ser Thr 115 120 125 Ser Leu Ala Asn Ala Leu Gly Met Ala Met Ala Arg Asp Ala Leu Gly 130 135 140 Gln Asp Tyr His Val Ala Ala Val Ile Gly Asp Gly Ser Leu Thr Gly 145 150 155 160 Gly Met Ala Leu Ala Ala Leu Asn Thr Ile Gly Asp Thr Gln Arg Lys 165 170 175 Met Leu Ile Val Leu Asn Asp Asn Glu Met Ser Ile Ser Glu Asn Val 180 185 190 Gly Ala Met Asn Lys Phe Met Arg Gly Leu Gln Val Gln Lys Trp Phe 195 200 205 Gln Glu Gly Glu Gly Ala Gly Lys Lys Ala Met Gln Ala Val Ser Arg 210 215 220 Pro Leu Ala Asn Phe Met Ser Arg Ala Lys Ser Ser Thr Cys His Phe 225 230 235 240 Phe Asp Pro Ala Ser Val Asn Pro Phe Ala Thr Met Gly Val Arg Tyr 245 250 255 Val Gly Pro Val Asp Gly His Asn Val Gln Glu Leu Val Trp Leu Leu 260 265 270 Glu Arg Leu Val Glu Leu Asp Gly Pro Thr Ile Leu His Val Val Thr 275 280 285 Lys Lys Gly Lys Gly Leu Ser Tyr Ala Glu Ala Asp Pro Ile Tyr Trp 290 295 300 His Gly Pro Gly Lys Phe Asp Pro Glu Thr Gly Asp Phe Val Pro Ser 305 310 315 320 Asn Ala Tyr Ser Trp Ser Asn Ala Phe Gly Asp Ala Val Thr Glu Leu 325 330 335 Ala Lys Ala Asp Pro Arg Thr Phe Val Ile Thr Pro Ala Met Arg Glu 340 345 350 Gly Ser Gly Leu Val Gly Tyr Ser Lys Ala His Pro His Arg Tyr Leu 355 360 365 Asp Val Gly Ile Ala Glu Glu Val Ala Val Thr Ala Ala Ala Gly Met 370 375 380 Ala Leu Gln Gly Leu Arg Pro Val Val Ala Ile Tyr Ser Thr Phe Leu 385 390 395 400 Gln Arg Ala Tyr Asp Gln Val Leu His Asp Val Ala Ile Glu His Leu 405 410 415 Asn Val Thr Phe Ala Ile Asp Arg Ala Gly Ile Val Gly Ala Asp Gly 420 425 430 Ala Thr His Asn Gly Val Phe Asp Leu Ser Phe Leu Arg Ser Ile Pro 435 440 445 Gly Val Arg Ile Gly Leu Pro Lys Asp Ala Thr Glu Leu Arg Gly Met 450 455 460 Leu Lys Tyr Ala Gln Glu His Pro Gly Pro Phe Ala Ile Arg Tyr Pro 465 470 475 480 Arg Gly Thr Thr Glu Arg Val Pro Glu Gly Thr Trp Pro Thr Leu Ala 485 490 495 Trp Gly Thr Trp Glu Arg Val Lys Ser Gly Asp Asp Val Val Ile Leu 500 505 510 Ala Gly Gly Lys Gly Leu Glu Tyr Ala Gln Lys Ala Ala Ala Asp Leu 515 520 525 Pro Gly Val Gly Val Val Asn Ala Arg Phe Val Lys Pro Leu Asp Asp 530 535 540 Ala Met Leu Arg Glu Val Ala Gly Ser Ala Arg Ala Ile Val Thr Val 545 550 555 560 Glu Asp Asn Thr Val Val Gly Gly Phe Gly Ser Ala Val Leu Glu Ala 565 570 575 Leu Asn Ala Trp Gly Leu Thr Val Pro Val Arg Val Leu Gly Ile Pro 580 585 590 Asp Glu Phe Gln Glu His Ala Thr Val Asp Ser Val His Ala Arg Ala 595 600 605 Gly Ile Asp Ala Pro Ala Ile Arg Thr Val Leu Ala Glu Leu Gly Val 610 615 620 Asp Val Pro Leu Gly Val 625 630 <210> 15 <211> 1893 <212> DNA <213> Deinococcus yunweiensis <400> 15 atgacatcca gcgacctcgt ccccgttccg cagcgcctgc tcgacgcggt gaactcgccg 60 gacgacctca agaccctgaa gcgcgagcag ctgccgcagg tggcgcagga actccgcgac 120 gagatcgtgc gggtgtgctc ggtgggtggc ctgcacctgg cgtcctcgct gggcgcgacc 180 gacgtgatcg tggcgctgca ctacgtcctg aactcgccgc gtgaccggat tctgttcgat 240 gtgggtcacc aggcctacgc gcacaagatg ctcaccggcc gccgcgagca gatggtcagc 300 gtgaagaagg agggcgggct ctcgggcttc accaaggtca gcgagtcgcc gcacgacgcg 360 atcacggtgg ggcacgccag taccagcctg gcaaacgcgc tgggcatggc gatggcacgg 420 gacgccctgg ggcaggatta ccacgtggcc gccgtgatcg gtgacggcag cctgaccggc 480 ggcatggccc tggccgccct aaacaccatc ggggacacgc agcgcaagat gctgatcgtc 540 ctgaacgaca acgagatgag catctccgag aacgtggggg ccatgaacaa gttcatgcgt 600 ggcctccagg tgcagaagtg gttccaggag ggcgagggcg cgggcaacaa ggccatgcag 660 gcggtcagcc gcccgctcgc caacttcatg agccgcgcca agagcagcac ctgccatttc 720 ttcgaccccg ccagcgtgaa tccctttgcc accatgggcg tgcgttatgt ggggccagtc 780 gacggacaca acgtgcagga actcgtgtgg ctgctcgaac gcctcgtgga actcgacggg 840 ccgacgatcc tgcatgtggt gaccaagaag ggcaagggcc tgagctacgc cgaggccgat 900 ccgatctact ggcacggccc cggcaagttc gacccggaga ccggggactt cgtgcccagc 960 aatgcgtact cgtggagcaa cgccttcgga gacgccgtca cggagctggc gaaagccgat 1020 ccccgcacct tcgtgatcac ccccgccatg cgcgagggca gcgggctggt cggctacagc 1080 aaggcccatc cgcaccgcta tctggacgtc ggcatcgccg aggaggtcgc tgtgacggcc 1140 gccgccggca tggccctcca ggggctgcgg cccgtcgtgg cgatctactc caccttcctg 1200 caacgcgcct acgaccaggt gctgcacgac gtcgccattg agcacttgaa cgtcaccttc 1260 gctattgacc gggccgggat cgtcggcgcg gacggggcca cccacaacgg cgtcttcgac 1320 ctgagcttcc tgcgctcgat cccaggtgtg cggatcggcc tgcccaagga cgcgaccgag 1380 ctgcgtggca tgctgaagta cgcccaggag caccccggcc ccttcgccat ccgctatccg 1440 cgtggcacca ccgagcgcgt gccagagggc acctggccca ccctggcgtg gggcacgtgg 1500 gagcgcgtga agtccggcga cgacgtggtc atcctggcgg gtggcaaggg cctggagtat 1560 gcccagaagg ccgccgccga cctgcccggc gtgggtgtcg tgaacgcccg tttcgtcaag 1620 ccgcttgacg acgccatgct gcgagaggtg gccggcagtg ctcgcgctat cgtcaccgtc 1680 gaggacaaca ccgtcgtcgg gggatttggc agcgccgtgc tggaggccct gaacgcctgg 1740 ggcctgaccg tgcccgtgcg cgtgctgggc atcccggacg aattccagga acacgccacc 1800 gtggacagcg tgcatgcccg cgccggcatc gacgctcccg ctatccgcac ggtgctggcc 1860 gagcttgggg tggacgtgcc gctgggcgtg taa 1893 <210> 16 <211> 630 <212> PRT <213> Deinococcus yunweiensis <400> 16 Met Thr Ser Ser Asp Leu Val Pro Val Pro Gln Arg Leu Leu Asp Ala 1 5 10 15 Val Asn Ser Pro Asp Asp Leu Lys Thr Leu Lys Arg Glu Gln Leu Pro 20 25 30 Gln Val Ala Gln Glu Leu Arg Asp Glu Ile Val Arg Val Cys Ser Val 35 40 45 Gly Gly Leu His Leu Ala Ser Ser Leu Gly Ala Thr Asp Val Ile Val 50 55 60 Ala Leu His Tyr Val Leu Asn Ser Pro Arg Asp Arg Ile Leu Phe Asp 65 70 75 80 Val Gly His Gln Ala Tyr Ala His Lys Met Leu Thr Gly Arg Arg Glu 85 90 95 Gln Met Val Ser Val Lys Lys Glu Gly Gly Leu Ser Gly Phe Thr Lys 100 105 110 Val Ser Glu Ser Pro His Asp Ala Ile Thr Val Gly His Ala Ser Thr 115 120 125 Ser Leu Ala Asn Ala Leu Gly Met Ala Met Ala Arg Asp Ala Leu Gly 130 135 140 Gln Asp Tyr His Val Ala Ala Val Ile Gly Asp Gly Ser Leu Thr Gly 145 150 155 160 Gly Met Ala Leu Ala Ala Leu Asn Thr Ile Gly Asp Thr Gln Arg Lys 165 170 175 Met Leu Ile Val Leu Asn Asp Asn Glu Met Ser Ile Ser Glu Asn Val 180 185 190 Gly Ala Met Asn Lys Phe Met Arg Gly Leu Gln Val Gln Lys Trp Phe 195 200 205 Gln Glu Gly Glu Gly Ala Gly Asn Lys Ala Met Gln Ala Val Ser Arg 210 215 220 Pro Leu Ala Asn Phe Met Ser Arg Ala Lys Ser Ser Thr Cys His Phe 225 230 235 240 Phe Asp Pro Ala Ser Val Asn Pro Phe Ala Thr Met Gly Val Arg Tyr 245 250 255 Val Gly Pro Val Asp Gly His Asn Val Gln Glu Leu Val Trp Leu Leu 260 265 270 Glu Arg Leu Val Glu Leu Asp Gly Pro Thr Ile Leu His Val Val Thr 275 280 285 Lys Lys Gly Lys Gly Leu Ser Tyr Ala Glu Ala Asp Pro Ile Tyr Trp 290 295 300 His Gly Pro Gly Lys Phe Asp Pro Glu Thr Gly Asp Phe Val Pro Ser 305 310 315 320 Asn Ala Tyr Ser Trp Ser Asn Ala Phe Gly Asp Ala Val Thr Glu Leu 325 330 335 Ala Lys Ala Asp Pro Arg Thr Phe Val Ile Thr Pro Ala Met Arg Glu 340 345 350 Gly Ser Gly Leu Val Gly Tyr Ser Lys Ala His Pro His Arg Tyr Leu 355 360 365 Asp Val Gly Ile Ala Glu Glu Val Ala Val Thr Ala Ala Ala Gly Met 370 375 380 Ala Leu Gln Gly Leu Arg Pro Val Val Ala Ile Tyr Ser Thr Phe Leu 385 390 395 400 Gln Arg Ala Tyr Asp Gln Val Leu His Asp Val Ala Ile Glu His Leu 405 410 415 Asn Val Thr Phe Ala Ile Asp Arg Ala Gly Ile Val Gly Ala Asp Gly 420 425 430 Ala Thr His Asn Gly Val Phe Asp Leu Ser Phe Leu Arg Ser Ile Pro 435 440 445 Gly Val Arg Ile Gly Leu Pro Lys Asp Ala Thr Glu Leu Arg Gly Met 450 455 460 Leu Lys Tyr Ala Gln Glu His Pro Gly Pro Phe Ala Ile Arg Tyr Pro 465 470 475 480 Arg Gly Thr Thr Glu Arg Val Pro Glu Gly Thr Trp Pro Thr Leu Ala 485 490 495 Trp Gly Thr Trp Glu Arg Val Lys Ser Gly Asp Asp Val Val Ile Leu 500 505 510 Ala Gly Gly Lys Gly Leu Glu Tyr Ala Gln Lys Ala Ala Ala Asp Leu 515 520 525 Pro Gly Val Gly Val Val Asn Ala Arg Phe Val Lys Pro Leu Asp Asp 530 535 540 Ala Met Leu Arg Glu Val Ala Gly Ser Ala Arg Ala Ile Val Thr Val 545 550 555 560 Glu Asp Asn Thr Val Val Gly Gly Phe Gly Ser Ala Val Leu Glu Ala 565 570 575 Leu Asn Ala Trp Gly Leu Thr Val Pro Val Arg Val Leu Gly Ile Pro 580 585 590 Asp Glu Phe Gln Glu His Ala Thr Val Asp Ser Val His Ala Arg Ala 595 600 605 Gly Ile Asp Ala Pro Ala Ile Arg Thr Val Leu Ala Glu Leu Gly Val 610 615 620 Asp Val Pro Leu Gly Val 625 630 <210> 17 <211> 684 <212> DNA <213> Deinococcus geothermalis <400> 17 gtgaccagcg tctgcttcct ggccggccgc accgccgccc tgattcccgc tgccgggtcc 60 ggcacccgcc tgggccgcgg gcccaaggcc tttgtcgagg tggcgggcca aagcctcctg 120 gcacgcagcg tggctgccct tgcgccctgg gtggacgaag tgctcgtggc gctgccggag 180 ggcttccctc ttccgccggg ccttcccgcg caggctatcc tgggcggcac gacccggcag 240 gagagcgtgt ggcggctgct gcacgcgacc acagcggacg tggtgctcgt ccacgacgcg 300 gcgcggccct tcctgccggg ggcggtggtc acggcgctcc ttgaggccgt gtccgagacc 360 ggcgccgcca ccgccgccct gccggtggcc gacaccctgg tgcgaggcga gcggggcagg 420 tgggcggacc tcgtcccgcg cgaggacctc tgggctgtgc agacgccgca aggtttccgc 480 cgtgcgttgc tgctgcgggc acacgcagcg gcgcgggcgg agggcttcgg cgccacagac 540 gacgcaggcc tgatcgcgcg gctgggcctc ccggtgaggc tggtgcctgg cgacgcccgg 600 ctcttcaagg tcaccactcc cggcgacctt gcgcttgcgc aggcggtggc ggcagtgtgg 660 gatgctacgt gtgatgcccc ctga 684 <210> 18 <211> 227 <212> PRT <213> Deinococcus geothermalis <400> 18 Val Thr Ser Val Cys Phe Leu Ala Gly Arg Thr Ala Ala Leu Ile Pro 1 5 10 15 Ala Ala Gly Ser Gly Thr Arg Leu Gly Arg Gly Pro Lys Ala Phe Val 20 25 30 Glu Val Ala Gly Gln Ser Leu Leu Ala Arg Ser Val Ala Ala Leu Ala 35 40 45 Pro Trp Val Asp Glu Val Leu Val Ala Leu Pro Glu Gly Phe Pro Leu 50 55 60 Pro Pro Gly Leu Pro Ala Gln Ala Ile Leu Gly Gly Thr Thr Arg Gln 65 70 75 80 Glu Ser Val Trp Arg Leu Leu His Ala Thr Thr Ala Asp Val Val Leu 85 90 95 Val His Asp Ala Ala Arg Pro Phe Leu Pro Gly Ala Val Val Thr Ala 100 105 110 Leu Leu Glu Ala Val Ser Glu Thr Gly Ala Ala Thr Ala Ala Leu Pro 115 120 125 Val Ala Asp Thr Leu Val Arg Gly Glu Arg Gly Arg Trp Ala Asp Leu 130 135 140 Val Pro Arg Glu Asp Leu Trp Ala Val Gln Thr Pro Gln Gly Phe Arg 145 150 155 160 Arg Ala Leu Leu Leu Arg Ala His Ala Ala Ala Arg Ala Glu Gly Phe 165 170 175 Gly Ala Thr Asp Asp Ala Gly Leu Ile Ala Arg Leu Gly Leu Pro Val 180 185 190 Arg Leu Val Pro Gly Asp Ala Arg Leu Phe Lys Val Thr Thr Pro Gly 195 200 205 Asp Leu Ala Leu Ala Gln Ala Val Ala Ala Val Trp Asp Ala Thr Cys 210 215 220 Asp Ala Pro 225 <210> 19 <211> 699 <212> DNA <213> Deinococcus yunweiensis <400> 19 gtgagcggtt cgtcctccac cgactccacc gacaccgccg cggcgctgat tcccgccgcc 60 ggggcgggca cgcgtctggg tctggggccg aaggcttacc tgagtgtgaa cggccgcagc 120 ctgctgcgtc gcagtatcga cgcactgctc ccgcacgtgg acgaggtgat cgtggccctg 180 cccgccggcc tgccgcccag cgctggatca gagctggcgg acgtccgggt gatcgtgggc 240 ggcgcgacgc ggcaggacac ggtgtatgcc ctgttgcagg ccacggcggc ccgccacgtc 300 ctgatccacg atgccgcccg gcccttcctg ggggccgcga ccatccacgc cctgctggcc 360 gccgtgcgcg agactggagc cgcgaccgcc gcgctgccgg tggccgacac cctggtgagg 420 gccacgccgg gtggcgagtg gctccagggc gtgccccgcg atcacctgtg ggccgtgcag 480 accccccagg cgttccggcg gctggagctg ctggccgcgc acgagcaggc ccgcgccgac 540 ggccacgccg ccaccgacga cgcgggcctg ctcgcccggc aggggcatcc ggtgcggctg 600 gtgcccggcg acgcccggct gttcaaggtg accacgcccg ccgacctgcc cctggctcag 660 gcggttgccc gggtgtggga tgctgatgac catgcctga 699 <210> 20 <211> 232 <212> PRT <213> Deinococcus yunweiensis <400> 20 Val Ser Gly Ser Ser Ser Thr Asp Ser Thr Asp Thr Ala Ala Ala Leu 1 5 10 15 Ile Pro Ala Ala Gly Ala Gly Thr Arg Leu Gly Leu Gly Pro Lys Ala 20 25 30 Tyr Leu Ser Val Asn Gly Arg Ser Leu Leu Arg Arg Ser Ile Asp Ala 35 40 45 Leu Leu Pro His Val Asp Glu Val Ile Val Ala Leu Pro Ala Gly Leu 50 55 60 Pro Pro Ser Ala Gly Ser Glu Leu Ala Asp Val Arg Val Ile Val Gly 65 70 75 80 Gly Ala Thr Arg Gln Asp Thr Val Tyr Ala Leu Leu Gln Ala Thr Ala 85 90 95 Ala Arg His Val Leu Ile His Asp Ala Ala Arg Pro Phe Leu Gly Ala 100 105 110 Ala Thr Ile His Ala Leu Leu Ala Ala Val Arg Glu Thr Gly Ala Ala 115 120 125 Thr Ala Ala Leu Pro Val Ala Asp Thr Leu Val Arg Ala Thr Pro Gly 130 135 140 Gly Glu Trp Leu Gln Gly Val Pro Arg Asp His Leu Trp Ala Val Gln 145 150 155 160 Thr Pro Gln Ala Phe Arg Arg Leu Glu Leu Leu Ala Ala His Glu Gln 165 170 175 Ala Arg Ala Asp Gly His Ala Ala Thr Asp Asp Ala Gly Leu Leu Ala 180 185 190 Arg Gln Gly His Pro Val Arg Leu Val Pro Gly Asp Ala Arg Leu Phe 195 200 205 Lys Val Thr Thr Pro Ala Asp Leu Pro Leu Ala Gln Ala Val Ala Arg 210 215 220 Val Trp Asp Ala Asp Asp His Ala 225 230 <210> 21 <211> 492 <212> DNA <213> Deinococcus geothermalis <400> 21 atgacccctt cccccctccc ctaccgcatc ggctacggag aagacgcgca ccgcctgacc 60 gaggggcgag cgttggtgct gggcggcgta cctatccccc acgccgaacg cggcgcggtc 120 gcgcacagtg acggggacgc cgtgctgcac gcgctggctg acgcgctgct ttcgggcatg 180 agcctgggcg acatcgggca gtattacccc gacaccgacc ctgcccacgc ggggctggac 240 tcgcgggtga ttctggccga cagcctggcg ctggtgcgcg agtggaagta cgttccggca 300 aacgtcgcgc tggtgatcac cctcgaccgc cccaaattgg ggccgctgcg cgccgacatc 360 gcccgcaacg tggctgccct gctgggcctg aatgaaacgg aggtaggggt gagcttcaag 420 acctccgagg gcctggcgcc tgagcatgtg caggtacggg tcacggtgct gctgcggcgg 480 gtggaggggt ga 492 <210> 22 <211> 163 <212> PRT <213> Deinococcus geothermalis <400> 22 Met Thr Pro Ser Pro Leu Pro Tyr Arg Ile Gly Tyr Gly Glu Asp Ala 1 5 10 15 His Arg Leu Thr Glu Gly Arg Ala Leu Val Leu Gly Gly Val Pro Ile 20 25 30 Pro His Ala Glu Arg Gly Ala Val Ala His Ser Asp Gly Asp Ala Val 35 40 45 Leu His Ala Leu Ala Asp Ala Leu Leu Ser Gly Met Ser Leu Gly Asp 50 55 60 Ile Gly Gln Tyr Tyr Pro Asp Thr Asp Pro Ala His Ala Gly Leu Asp 65 70 75 80 Ser Arg Val Ile Leu Ala Asp Ser Leu Ala Leu Val Arg Glu Trp Lys 85 90 95 Tyr Val Pro Ala Asn Val Ala Leu Val Ile Thr Leu Asp Arg Pro Lys 100 105 110 Leu Gly Pro Leu Arg Ala Asp Ile Ala Arg Asn Val Ala Ala Leu Leu 115 120 125 Gly Leu Asn Glu Thr Glu Val Gly Val Ser Phe Lys Thr Ser Glu Gly 130 135 140 Leu Ala Pro Glu His Val Gln Val Arg Val Thr Val Leu Leu Arg Arg 145 150 155 160 Val Glu Gly <210> 23 <211> 495 <212> DNA <213> Deinococcus yunweiensis <400> 23 atggttccca cccttcccta ccgcatcggc tacggcgagg acgcccaccg gctggaggcc 60 gggcggcccc tgatcctggg cggcgtgccc gtgccggagt ccccccacgg cgcggtggcc 120 cacagcgacg gcgacgccgt gctgcacgcg gtcgcggacg cgctgctgtc ggggctggcg 180 ctgggcgata tcgggcagta cttccccgac acggccgccg agtggcacgg cctggactcg 240 cgggtgatcg tggcgcgggc gctggagctg gtgcgggaac gcggctacgg accggtcaat 300 gtggctctgg tggtcacgct ggatcgcccg aagctggggc cgctgcgggc cgacattgcc 360 cgcagcgtgg cggccctgct gaccctgccg gacaccgagg tcggcgtgag cttcaagacc 420 tccgagggcc tggcccccgc ccacgtgcag gtgcgcgtga cagccctgct ggcccggacg 480 gagaccgccg ggtga 495 <210> 24 <211> 164 <212> PRT <213> Deinococcus yunweiensis <400> 24 Met Val Pro Thr Leu Pro Tyr Arg Ile Gly Tyr Gly Glu Asp Ala His 1 5 10 15 Arg Leu Glu Ala Gly Arg Pro Leu Ile Leu Gly Gly Val Pro Val Pro 20 25 30 Glu Ser Pro His Gly Ala Val Ala His Ser Asp Gly Asp Ala Val Leu 35 40 45 His Ala Val Ala Asp Ala Leu Leu Ser Gly Leu Ala Leu Gly Asp Ile 50 55 60 Gly Gln Tyr Phe Pro Asp Thr Ala Ala Glu Trp His Gly Leu Asp Ser 65 70 75 80 Arg Val Ile Val Ala Arg Ala Leu Glu Leu Val Arg Glu Arg Gly Tyr 85 90 95 Gly Pro Val Asn Val Ala Leu Val Val Thr Leu Asp Arg Pro Lys Leu 100 105 110 Gly Pro Leu Arg Ala Asp Ile Ala Arg Ser Val Ala Ala Leu Leu Thr 115 120 125 Leu Pro Asp Thr Glu Val Gly Val Ser Phe Lys Thr Ser Glu Gly Leu 130 135 140 Ala Pro Ala His Val Gln Val Arg Val Thr Ala Leu Leu Ala Arg Thr 145 150 155 160 Glu Thr Ala Gly <210> 25 <211> 1275 <212> DNA <213> Deinococcus geothermalis <400> 25 atgcccccgc ccgtccgcgt aaactggccg cgtatgagga ccacgcgccg tcagaccgtg 60 accacctggg tcgggaatgt tcctgtgggg agtgcgcacc ccattgtcgt gcagtccatg 120 acgaataccg acaccgcgaa tgctgaggca accgcccttc aggttgcgca gcttgcgcgg 180 gccgggtcgg agattgtgcg tgtgaccgtc aatacccgcg aggccgccgc cgcccttccc 240 gaaatcgtgg cccgcctgca cgacttgggt ttggatgtgc ccctggtggg ggatttccac 300 tacaacggcc atctcctgct gcgcgagtat cccgagacgg cgcggctgct cgccaagtac 360 cgcatcaacc ccggcaatgt gggtgctggg cagcaccacg acgccaactt cgctaccatg 420 atcgaggttg ccaaggaatt cggtaaaccg gttcgcatcg gcgtgaactg gggcagcctc 480 gaccagcagg tgctcgcccg gttgatggac gagaacgccc ggcggggcag ccccaagtcc 540 ggcaccgacg tgatgatcga cgcgatggtc accagcgccc tggaaagcgc cgcgtacgcc 600 gaggggctgg gcctcccgca cgacaagatc atcatctcgg tcaaggtcag ctccgctccc 660 gaactgtggc aggtgtaccg tcagctcgcg ccgctgtgcg actatcccct ccacctcggc 720 ctgaccgaag cggggatggg catgaagggc atggtggcgt ccagcgtggc cctcgctccc 780 ctgctcagcg aggggatcgg ggacaccatc cgcgtttccc tgacccctga acccggcgcc 840 ccccgcaagc tggaggtgga ggtcgcgcaa cagattctcc agagcctggg cctccggcag 900 tttctcccgc aggtcacctc ctgtcccggc tgcgggcgca ccacctccac cttctttcag 960 gaactcgccc gcaagattca ggactacatc cgtgacgcga tgcccgaatg gaaggcgaag 1020 tatcccggtg tcgaggacat gcaggtcgcc gtgatgggct gcatcgtcaa tggccccggc 1080 gagagcaagc acgccaacat cggcatctcg ctgcccggca ccggcgaaga cccccgcgca 1140 cccgtctacc aagacggcaa gctgctgacc accctgagag gcccgcgcat tgccgaggac 1200 tttcaggaat tgcttgaaaa gtacgtggaa gaacgctatg gacacaaatc cgcccacaca 1260 acagtccagg agtga 1275 <210> 26 <211> 424 <212> PRT <213> Deinococcus geothermalis <400> 26 Met Pro Pro Pro Val Arg Val Asn Trp Pro Arg Met Arg Thr Thr Arg 1 5 10 15 Arg Gln Thr Val Thr Thr Trp Val Gly Asn Val Pro Val Gly Ser Ala 20 25 30 His Pro Ile Val Val Gln Ser Met Thr Asn Thr Asp Thr Ala Asn Ala 35 40 45 Glu Ala Thr Ala Leu Gln Val Ala Gln Leu Ala Arg Ala Gly Ser Glu 50 55 60 Ile Val Arg Val Thr Val Asn Thr Arg Glu Ala Ala Ala Ala Leu Pro 65 70 75 80 Glu Ile Val Ala Arg Leu His Asp Leu Gly Leu Asp Val Pro Leu Val 85 90 95 Gly Asp Phe His Tyr Asn Gly His Leu Leu Leu Arg Glu Tyr Pro Glu 100 105 110 Thr Ala Arg Leu Leu Ala Lys Tyr Arg Ile Asn Pro Gly Asn Val Gly 115 120 125 Ala Gly Gln His His Asp Ala Asn Phe Ala Thr Met Ile Glu Val Ala 130 135 140 Lys Glu Phe Gly Lys Pro Val Arg Ile Gly Val Asn Trp Gly Ser Leu 145 150 155 160 Asp Gln Gln Val Leu Ala Arg Leu Met Asp Glu Asn Ala Arg Arg Gly 165 170 175 Ser Pro Lys Ser Gly Thr Asp Val Met Ile Asp Ala Met Val Thr Ser 180 185 190 Ala Leu Glu Ser Ala Ala Tyr Ala Glu Gly Leu Gly Leu Pro His Asp 195 200 205 Lys Ile Ile Ile Ser Val Lys Val Ser Ser Ala Pro Glu Leu Trp Gln 210 215 220 Val Tyr Arg Gln Leu Ala Pro Leu Cys Asp Tyr Pro Leu His Leu Gly 225 230 235 240 Leu Thr Glu Ala Gly Met Gly Met Lys Gly Met Val Ala Ser Ser Val 245 250 255 Ala Leu Ala Pro Leu Leu Ser Glu Gly Ile Gly Asp Thr Ile Arg Val 260 265 270 Ser Leu Thr Pro Glu Pro Gly Ala Pro Arg Lys Leu Glu Val Glu Val 275 280 285 Ala Gln Gln Ile Leu Gln Ser Leu Gly Leu Arg Gln Phe Leu Pro Gln 290 295 300 Val Thr Ser Cys Pro Gly Cys Gly Arg Thr Thr Ser Thr Phe Phe Gln 305 310 315 320 Glu Leu Ala Arg Lys Ile Gln Asp Tyr Ile Arg Asp Ala Met Pro Glu 325 330 335 Trp Lys Ala Lys Tyr Pro Gly Val Glu Asp Met Gln Val Ala Val Met 340 345 350 Gly Cys Ile Val Asn Gly Pro Gly Glu Ser Lys His Ala Asn Ile Gly 355 360 365 Ile Ser Leu Pro Gly Thr Gly Glu Asp Pro Arg Ala Pro Val Tyr Gln 370 375 380 Asp Gly Lys Leu Leu Thr Thr Leu Arg Gly Pro Arg Ile Ala Glu Asp 385 390 395 400 Phe Gln Glu Leu Leu Glu Lys Tyr Val Glu Glu Arg Tyr Gly His Lys 405 410 415 Ser Ala His Thr Thr Val Gln Glu 420 <210> 27 <211> 1263 <212> DNA <213> Deinococcus yunweiensis <400> 27 ctggaatggc ggaagttcca gatgacgacc cgccggcaga ccgtgaccgt ggacgtgggc 60 ggcgtgccca tcggcagcgc ccaccccatc gtcgtgcaga gcatgaccaa caccgacacc 120 gccgacgccg agggcaccgc gatccagatc gcgcaactgg cccgcgctgg cagcgagatc 180 gtgcgcgtca ctgtgaacac ccgtgaggca gccgccgcca tccccgagat cgtcgcccgg 240 ctcgccgagg tcggcctgag cgttcccatc gtcggggact tccactacaa cggacacatc 300 ctgctgcgtg aatttcctga gacggcgcgg ctgctcgcca agtaccgcat caaccccggc 360 aatgtcggcg cgggccagca ccacgacgcg aacttcgcca ccatgatcga agtcgccaag 420 gagtacgaca agccggtgcg gatcggtgtg aactggggca gtctggatca gcaggtgctc 480 gcccgcctga tggacgagaa cgcggcggcg ggcagcccca agagcgggac cgacgtcatg 540 atcgacgcga tggtcgtgtc ggcgctggaa tcagccgcgt atgccgagga actgggcctg 600 gcgcacgaca agatcctgat ctcagtgaag gtgagcagcg ctcccgaact gtggcaggtc 660 taccggcaac tcgcgccgct gtgcgactac cccctgcacc tgggcctgac cgaggctggt 720 atgggcatga aaggcatcgt ggcgtcgtcc gtggccctgg ctccgctgct caccgagggc 780 atcggcgaca ccatccgcgt gagcctgacc ccggaaccgg gcgcgagccg caagctggag 840 gtcgaggtcg cacagcagat gctccagagc ctggggctgc gccagtttct cccgcaggtc 900 accagttgcc ccggctgtgg gcgcaccacc agtgtgttct ttcaggaact ggcgcagaag 960 attcaggact acatacgcga cacgatgccg gactggaaac agaagtaccc cggtgtcgag 1020 gacatgcagg tcgccgtgat gggctgcatc gtgaacggcc ccggtgagag caagcacgcc 1080 aacatcggca tttctctgcc cggcactggg gaagaccccc gcgccccggt gtatcaggac 1140 ggcaagctgc tgacgaccct cagaggcccc cggatcgccg aggacttcca ggccctgatg 1200 gagaagtacg tcgaggaacg gtacgggcac gccgcgcagg ccccggcgtc aacgctggtc 1260 taa 1263 <210> 28 <211> 420 <212> PRT <213> Deinococcus yunweiensis <400> 28 Leu Glu Trp Arg Lys Phe Gln Met Thr Thr Arg Arg Gln Thr Val Thr 1 5 10 15 Val Asp Val Gly Gly Val Pro Ile Gly Ser Ala His Pro Ile Val Val 20 25 30 Gln Ser Met Thr Asn Thr Asp Thr Ala Asp Ala Glu Gly Thr Ala Ile 35 40 45 Gln Ile Ala Gln Leu Ala Arg Ala Gly Ser Glu Ile Val Arg Val Thr 50 55 60 Val Asn Thr Arg Glu Ala Ala Ala Ala Ile Pro Glu Ile Val Ala Arg 65 70 75 80 Leu Ala Glu Val Gly Leu Ser Val Pro Ile Val Gly Asp Phe His Tyr 85 90 95 Asn Gly His Ile Leu Leu Arg Glu Phe Pro Glu Thr Ala Arg Leu Leu 100 105 110 Ala Lys Tyr Arg Ile Asn Pro Gly Asn Val Gly Ala Gly Gln His His 115 120 125 Asp Ala Asn Phe Ala Thr Met Ile Glu Val Ala Lys Glu Tyr Asp Lys 130 135 140 Pro Val Arg Ile Gly Val Asn Trp Gly Ser Leu Asp Gln Gln Val Leu 145 150 155 160 Ala Arg Leu Met Asp Glu Asn Ala Ala Ala Gly Ser Pro Lys Ser Gly 165 170 175 Thr Asp Val Met Ile Asp Ala Met Val Val Ser Ala Leu Glu Ser Ala 180 185 190 Ala Tyr Ala Glu Glu Leu Gly Leu Ala His Asp Lys Ile Leu Ile Ser 195 200 205 Val Lys Val Ser Ser Ala Pro Glu Leu Trp Gln Val Tyr Arg Gln Leu 210 215 220 Ala Pro Leu Cys Asp Tyr Pro Leu His Leu Gly Leu Thr Glu Ala Gly 225 230 235 240 Met Gly Met Lys Gly Ile Val Ala Ser Ser Val Ala Leu Ala Pro Leu 245 250 255 Leu Thr Glu Gly Ile Gly Asp Thr Ile Arg Val Ser Leu Thr Pro Glu 260 265 270 Pro Gly Ala Ser Arg Lys Leu Glu Val Glu Val Ala Gln Gln Met Leu 275 280 285 Gln Ser Leu Gly Leu Arg Gln Phe Leu Pro Gln Val Thr Ser Cys Pro 290 295 300 Gly Cys Gly Arg Thr Thr Ser Val Phe Phe Gln Glu Leu Ala Gln Lys 305 310 315 320 Ile Gln Asp Tyr Ile Arg Asp Thr Met Pro Asp Trp Lys Gln Lys Tyr 325 330 335 Pro Gly Val Glu Asp Met Gln Val Ala Val Met Gly Cys Ile Val Asn 340 345 350 Gly Pro Gly Glu Ser Lys His Ala Asn Ile Gly Ile Ser Leu Pro Gly 355 360 365 Thr Gly Glu Asp Pro Arg Ala Pro Val Tyr Gln Asp Gly Lys Leu Leu 370 375 380 Thr Thr Leu Arg Gly Pro Arg Ile Ala Glu Asp Phe Gln Ala Leu Met 385 390 395 400 Glu Lys Tyr Val Glu Glu Arg Tyr Gly His Ala Ala Gln Ala Pro Ala 405 410 415 Ser Thr Leu Val 420 <210> 29 <211> 1041 <212> DNA <213> Deinococcus geothermalis <400> 29 gtgaccgacc ccgacccgaa cgctgccgcg cccacaggcc tcccggcacg caagctgcgg 60 catcttgaag cctgtctgcg cccggaaagt cagtacatgg gcgtgactac cgggctggag 120 cgggtgccct ggccttaccg ggcgctccca gagctggacc tggaggcggt ggacctcacg 180 acgaccttcc tgggtcggag actgcgtgcc ccggtgttga ttggagcgat gacgggaggc 240 gcgcagcggg cggaggtcat caatcgcaac ctcgccaccg ccgcggagcg gttgggcatc 300 gggatgatgt tggggtcaca gcgagtgatg ctggagcgcc ctgaagcagc ggtcagcttt 360 cgcgtgcgcg acgtggcccc cggtgtactg ctgctgggaa atctcggagc ggcacagttt 420 ctgctggggt acggcgtgtc cgaggccgag cgggcggtgc gggcggtgga ggcagacggc 480 ctcgccatcc atctcaaccc gctgcaagaa gccatgcagg ccggtgggga cacgcgctgg 540 cgaggtctcg cggcgcggct ggccgaggtg gtgcccgctc tgccttttcc ggtgattctc 600 aaggaggtgg ggcatggcct ggatccggcc actgtgcaga ccgtggccac ggcggggttt 660 gcggcgctgg acgtggcggg cgcgggcggt acgagttggg cgcgggttga gcaactggtg 720 cgctacggcg ccgttctcgc gccggacctg tgcgaagtgg gactgcccac cgcaccggcc 780 atcgtggagg cgcgccgggc agctcccgga acacccctga tcgcctccgg gggcatccgc 840 accggtttgg acgcagcgcg tgccctggcc ctcggcgcgc aggtggtggc ggtggctcgg 900 cctctcctcg ctcccgcgct ggagagtgcg gcggcggtag aggcgtggct tgcgcggttc 960 attcacgagc tgcgggtggc gctgtttgtg ggcggcttca ggagtgtgga ggcggtgcgg 1020 ggccggctcg agctggtttg a 1041 <210> 30 <211> 346 <212> PRT <213> Deinococcus geothermalis <400> 30 Val Thr Asp Pro Asp Pro Asn Ala Ala Ala Pro Thr Gly Leu Pro Ala 1 5 10 15 Arg Lys Leu Arg His Leu Glu Ala Cys Leu Arg Pro Glu Ser Gln Tyr 20 25 30 Met Gly Val Thr Thr Gly Leu Glu Arg Val Pro Trp Pro Tyr Arg Ala 35 40 45 Leu Pro Glu Leu Asp Leu Glu Ala Val Asp Leu Thr Thr Thr Phe Leu 50 55 60 Gly Arg Arg Leu Arg Ala Pro Val Leu Ile Gly Ala Met Thr Gly Gly 65 70 75 80 Ala Gln Arg Ala Glu Val Ile Asn Arg Asn Leu Ala Thr Ala Ala Glu 85 90 95 Arg Leu Gly Ile Gly Met Met Leu Gly Ser Gln Arg Val Met Leu Glu 100 105 110 Arg Pro Glu Ala Ala Val Ser Phe Arg Val Arg Asp Val Ala Pro Gly 115 120 125 Val Leu Leu Leu Gly Asn Leu Gly Ala Ala Gln Phe Leu Leu Gly Tyr 130 135 140 Gly Val Ser Glu Ala Glu Arg Ala Val Arg Ala Val Glu Ala Asp Gly 145 150 155 160 Leu Ala Ile His Leu Asn Pro Leu Gln Glu Ala Met Gln Ala Gly Gly 165 170 175 Asp Thr Arg Trp Arg Gly Leu Ala Ala Arg Leu Ala Glu Val Val Pro 180 185 190 Ala Leu Pro Phe Pro Val Ile Leu Lys Glu Val Gly His Gly Leu Asp 195 200 205 Pro Ala Thr Val Gln Thr Val Ala Thr Ala Gly Phe Ala Ala Leu Asp 210 215 220 Val Ala Gly Ala Gly Gly Thr Ser Trp Ala Arg Val Glu Gln Leu Val 225 230 235 240 Arg Tyr Gly Ala Val Leu Ala Pro Asp Leu Cys Glu Val Gly Leu Pro 245 250 255 Thr Ala Pro Ala Ile Val Glu Ala Arg Arg Ala Ala Pro Gly Thr Pro 260 265 270 Leu Ile Ala Ser Gly Gly Ile Arg Thr Gly Leu Asp Ala Ala Arg Ala 275 280 285 Leu Ala Leu Gly Ala Gln Val Val Ala Val Ala Arg Pro Leu Leu Ala 290 295 300 Pro Ala Leu Glu Ser Ala Ala Ala Val Glu Ala Trp Leu Ala Arg Phe 305 310 315 320 Ile His Glu Leu Arg Val Ala Leu Phe Val Gly Gly Phe Arg Ser Val 325 330 335 Glu Ala Val Arg Gly Arg Leu Glu Leu Val 340 345 <210> 31 <211> 1053 <212> DNA <213> Deinococcus yunweiensis <400> 31 gtggacgact cgacgagcgg catccaggca cgcaagatgc accatctcca agcgtgtctg 60 gagccgcaca gccagtacca gacggtcacg accggcctgg acgcggtgcc ctggccgtac 120 cgggcgctgc ccgaggtcga tctgccggcc gtacagctcc agacaagctt cctgggtcgc 180 cggctggccg cccccgtgct gatcggtgcc atgaccggcg gggccgagcg ggcacggatc 240 atcaaccgca atctggcgat ggctgcgcag cgcctgggca tcggcatgat gctcggctcg 300 cagcgcgtca tgctggagcg cccggaggtg accgagacct tccgcgtgcg cgatgtggcc 360 ccggacatcc tgctcgtcgg gaatctgggg gcggcgcagt tcggcctggg ctacggcgcg 420 gccgaggcgc tccgcgccgt acagcagatc gacgccgacg ccctggcgat tcatgccaat 480 ccccttcagg aagccatgca ggctgggggg gacacgcgct ggcggggcct gctggaacgc 540 ctgtcggacg tggtaccagc gctgccgttc ccgacgatcc tgaaggaagt cggacatggg 600 ctggatgtcc acaccgccca cgcggcggcc gacctgggct tcacggcgct ggatgtggcc 660 ggggccggtg gcacgagctg ggcgcgggtg gagcagctcg tccgctacgg cacggtgcgc 720 tcgccggccc tgtgtgagct gggcatcccg accgcgcggg ccctgcggga cgtgcggggc 780 gccctgcccg gcatgccgct ggtcgcgtcc gggggcatcc gcaccggcct ggacgccgcc 840 cgtgccctgg cgctgggggc gcaggtggtc gccattgccc ggcccctgct ggaaccggca 900 ttggacggcc cggacgcggc cgaggcgtgg ctcgcggcct tcatccacga cctgcggatc 960 gcgctgtttg tcggtggcta cgacagtgtg gacgaggtgc gcccggcgct ggactggccg 1020 ctggtgtcgg gggctgtcag ctctgggctg tga 1053 <210> 32 <211> 350 <212> PRT <213> Deinococcus yunweiensis <400> 32 Val Asp Asp Ser Thr Ser Gly Ile Gln Ala Arg Lys Met His His Leu 1 5 10 15 Gln Ala Cys Leu Glu Pro His Ser Gln Tyr Gln Thr Val Thr Thr Gly 20 25 30 Leu Asp Ala Val Pro Trp Pro Tyr Arg Ala Leu Pro Glu Val Asp Leu 35 40 45 Pro Ala Val Gln Leu Gln Thr Ser Phe Leu Gly Arg Arg Leu Ala Ala 50 55 60 Pro Val Leu Ile Gly Ala Met Thr Gly Gly Ala Glu Arg Ala Arg Ile 65 70 75 80 Ile Asn Arg Asn Leu Ala Met Ala Ala Gln Arg Leu Gly Ile Gly Met 85 90 95 Met Leu Gly Ser Gln Arg Val Met Leu Glu Arg Pro Glu Val Thr Glu 100 105 110 Thr Phe Arg Val Arg Asp Val Ala Pro Asp Ile Leu Leu Val Gly Asn 115 120 125 Leu Gly Ala Ala Gln Phe Gly Leu Gly Tyr Gly Ala Ala Glu Ala Leu 130 135 140 Arg Ala Val Gln Gln Ile Asp Ala Asp Ala Leu Ala Ile His Ala Asn 145 150 155 160 Pro Leu Gln Glu Ala Met Gln Ala Gly Gly Asp Thr Arg Trp Arg Gly 165 170 175 Leu Leu Glu Arg Leu Ser Asp Val Val Pro Ala Leu Pro Phe Pro Thr 180 185 190 Ile Leu Lys Glu Val Gly His Gly Leu Asp Val His Thr Ala His Ala 195 200 205 Ala Ala Asp Leu Gly Phe Thr Ala Leu Asp Val Ala Gly Ala Gly Gly 210 215 220 Thr Ser Trp Ala Arg Val Glu Gln Leu Val Arg Tyr Gly Thr Val Arg 225 230 235 240 Ser Pro Ala Leu Cys Glu Leu Gly Ile Pro Thr Ala Arg Ala Leu Arg 245 250 255 Asp Val Arg Gly Ala Leu Pro Gly Met Pro Leu Val Ala Ser Gly Gly 260 265 270 Ile Arg Thr Gly Leu Asp Ala Ala Arg Ala Leu Ala Leu Gly Ala Gln 275 280 285 Val Val Ala Ile Ala Arg Pro Leu Leu Glu Pro Ala Leu Asp Gly Pro 290 295 300 Asp Ala Ala Glu Ala Trp Leu Ala Ala Phe Ile His Asp Leu Arg Ile 305 310 315 320 Ala Leu Phe Val Gly Gly Tyr Asp Ser Val Asp Glu Val Arg Pro Ala 325 330 335 Leu Asp Trp Pro Leu Val Ser Gly Ala Val Ser Ser Gly Leu 340 345 350 <210> 33 <211> 10 <212> DNA <213> Artificial Sequence <220> <223> none <220> <221> misc_feature <222> (1)..(10) <223> n is a, c, g, or t <400> 33 nnnnnnnnnn 10 <210> 34 <211> 1164 <212> DNA <213> Deinococcus geothermalis <400> 34 atgaagctga cggttctggg cagtacgggc agtatcggca cgcaggcgct ggaggtggcg 60 cgggaacgcg gctgggagat cggggcgctc gccgcagggc gcaatctcga cctgctggaa 120 gcgcaggtac gggcgttcca gccgcaggtg gtgagtgtgg cggcggaggt gtacgcgcag 180 gcgcggcagc ggctgtccgg cgtgcgggtg atcgcggacc ccacggaggc ggcggcgctg 240 cccgcagacg tggtcgtcaa cgcgatgagc ggactggttg ggttggcgcc cacgcgggca 300 gcactggaag ctgggcaagc tctggccctg gcgacaaaag aggccatggt cacggcagcg 360 cacctgatgt gggaggccgc agccagcggc ggcggctgcc tcgtaccggt cgattcggaa 420 cacaccggca tgtaccagtg cctgaccggc gaggacctcg cggatgtagc cgaactgatt 480 ctgacggcct cgggtggccc cttttgtgac ggcccggcgg acttgagcgg cgtgacgccg 540 gcccaggccc tgaagcatcc ctcgtggaag atgggaccga aggtaacgct ggattccgcc 600 accctgatga acaaggggct ggaggtgatg gagtgcgctt ccctctacgg cttgcccctc 660 tcgcaggtga gcgtcgtcgt gcatccgcag agcatcgtcc acgcggcggt ccgcttccgc 720 gacggcagcc tgaagggaca gttcggaccg accgacatgc gcctggcgat tgcctacgcg 780 atcgacgccg cgccgaccgg aatgcgccgc cccggtgacg tacgcggggc gcggcgcggg 840 cccgaggtgg ccgagcactt gggctggccg ctgcagggga gctgggagtt ccgcgcaccg 900 gacgtggccc gctttccctg cctggatctg gcctaccgcg caggacaggc gggcggcctc 960 ctcccgacag ccctgaacgc ggcggatgag gtggccgtgg aagcctttct ggacggaaga 1020 atcggcttta tggacatccc gcggctgatc gaacgcgtgc tggacgagac gcctgccgga 1080 gcgctgacct gggagacgct gctggagaca gacgcctggg cgcgggcgcg ggcccaggaa 1140 ctgacggtgg gggtacgggc gtga 1164 <210> 35 <211> 387 <212> PRT <213> Deinococcus geothermalis <400> 35 Met Lys Leu Thr Val Leu Gly Ser Thr Gly Ser Ile Gly Thr Gln Ala 1 5 10 15 Leu Glu Val Ala Arg Glu Arg Gly Trp Glu Ile Gly Ala Leu Ala Ala 20 25 30 Gly Arg Asn Leu Asp Leu Leu Glu Ala Gln Val Arg Ala Phe Gln Pro 35 40 45 Gln Val Val Ser Val Ala Ala Glu Val Tyr Ala Gln Ala Arg Gln Arg 50 55 60 Leu Ser Gly Val Arg Val Ile Ala Asp Pro Thr Glu Ala Ala Ala Leu 65 70 75 80 Pro Ala Asp Val Val Val Asn Ala Met Ser Gly Leu Val Gly Leu Ala 85 90 95 Pro Thr Arg Ala Ala Leu Glu Ala Gly Gln Ala Leu Ala Leu Ala Thr 100 105 110 Lys Glu Ala Met Val Thr Ala Ala His Leu Met Trp Glu Ala Ala Ala 115 120 125 Ser Gly Gly Gly Cys Leu Val Pro Val Asp Ser Glu His Thr Gly Met 130 135 140 Tyr Gln Cys Leu Thr Gly Glu Asp Leu Ala Asp Val Ala Glu Leu Ile 145 150 155 160 Leu Thr Ala Ser Gly Gly Pro Phe Cys Asp Gly Pro Ala Asp Leu Ser 165 170 175 Gly Val Thr Pro Ala Gln Ala Leu Lys His Pro Ser Trp Lys Met Gly 180 185 190 Pro Lys Val Thr Leu Asp Ser Ala Thr Leu Met Asn Lys Gly Leu Glu 195 200 205 Val Met Glu Cys Ala Ser Leu Tyr Gly Leu Pro Leu Ser Gln Val Ser 210 215 220 Val Val Val His Pro Gln Ser Ile Val His Ala Ala Val Arg Phe Arg 225 230 235 240 Asp Gly Ser Leu Lys Gly Gln Phe Gly Pro Thr Asp Met Arg Leu Ala 245 250 255 Ile Ala Tyr Ala Ile Asp Ala Ala Pro Thr Gly Met Arg Arg Pro Gly 260 265 270 Asp Val Arg Gly Ala Arg Arg Gly Pro Glu Val Ala Glu His Leu Gly 275 280 285 Trp Pro Leu Gln Gly Ser Trp Glu Phe Arg Ala Pro Asp Val Ala Arg 290 295 300 Phe Pro Cys Leu Asp Leu Ala Tyr Arg Ala Gly Gln Ala Gly Gly Leu 305 310 315 320 Leu Pro Thr Ala Leu Asn Ala Ala Asp Glu Val Ala Val Glu Ala Phe 325 330 335 Leu Asp Gly Arg Ile Gly Phe Met Asp Ile Pro Arg Leu Ile Glu Arg 340 345 350 Val Leu Asp Glu Thr Pro Ala Gly Ala Leu Thr Trp Glu Thr Leu Leu 355 360 365 Glu Thr Asp Ala Trp Ala Arg Ala Arg Ala Gln Glu Leu Thr Val Gly 370 375 380 Val Arg Ala 385 <210> 36 <211> 1161 <212> DNA <213> Deinococcus yunweiensis <400> 36 atgaaggtca cggttctggg cagtacgggc agtatcggca cgcaggcgct cgacgtcgtg 60 cgggaacgcg gctggagcgt gggcacgctc gcggccgggc gcaatctgga tctgctggcg 120 atccaggtgc gcgagttcca gccggacgtc gtgagcgtgg acgccagcgt ctatgctgcc 180 gcccgcgacc ttctgccaca tctgacggtg attgccgatg ccgccgaggc ctctgcccgg 240 cccgccgacg tggtcgtgaa cgccatgagc ggcctgatcg ggcttgagcc gacccgtacg 300 gcgctcctgg ccggacaggc cgtggcgctg gcgaccaagg aggccatggt cacggctgcg 360 cacctgatgt gggacgccgc cgcagcgggt gggggccgcg tcgtgccggt cgattccgag 420 cacaccggcg tgtaccagtg cctgaccggc gagcacatgg gcgacgtggc cgaggtgatc 480 ctgaccgcgt ccggtggccc cttccgggac ggcccggccg acctgtcgcg cgtcacggcc 540 gcgcaggcgc tcaggcaccc gtcgtggacg atggggccga aggtgaccat cgattcctcg 600 accctgatga acaaggggct ggaggtcatg gagtgcgcca gcctgtacgg gctgcccatg 660 actcaggtgg gcgtggtcat tcatccacag agcctgatgc acgcggcggt gcgcttccgc 720 gacggcagcc tgaaggcgca gtttggcccg accgacatgc gcctgccgat cgcctacgcc 780 atggacgcgg cgcccaccgg catgacccgc cccggcgacg tgcggggagc gcggcgcggg 840 ccggaggtcg ccgggcacgc gtcatggccc ctgcgcggcg aatggcagtt ccgcgagccc 900 gatctggagc gctttccctg cctggccctg gcgtaccgcg ccggcaccgg gggcggcctg 960 ctgccggtgg ccctgaacgc cgctgatgaa gtggcggtgg acgccttcct ggccgggcga 1020 attggctacc tggacatccc ccgcgtgatc gggggtgtgc tggacgacac cccggccggt 1080 gacctgacgt gggacacgct gcacgccacc gacacctggg cacgcacccg tgcgagtgaa 1140 ctgtgcgggg tgaccgcgtg a 1161 <210> 37 <211> 386 <212> PRT <213> Deinococcus yunweiensis <400> 37 Met Lys Val Thr Val Leu Gly Ser Thr Gly Ser Ile Gly Thr Gln Ala 1 5 10 15 Leu Asp Val Val Arg Glu Arg Gly Trp Ser Val Gly Thr Leu Ala Ala 20 25 30 Gly Arg Asn Leu Asp Leu Leu Ala Ile Gln Val Arg Glu Phe Gln Pro 35 40 45 Asp Val Val Ser Val Asp Ala Ser Val Tyr Ala Ala Ala Arg Asp Leu 50 55 60 Leu Pro His Leu Thr Val Ile Ala Asp Ala Ala Glu Ala Ser Ala Arg 65 70 75 80 Pro Ala Asp Val Val Val Asn Ala Met Ser Gly Leu Ile Gly Leu Glu 85 90 95 Pro Thr Arg Thr Ala Leu Leu Ala Gly Gln Ala Val Ala Leu Ala Thr 100 105 110 Lys Glu Ala Met Val Thr Ala Ala His Leu Met Trp Asp Ala Ala Ala 115 120 125 Ala Gly Gly Gly Arg Val Val Pro Val Asp Ser Glu His Thr Gly Val 130 135 140 Tyr Gln Cys Leu Thr Gly Glu His Met Gly Asp Val Ala Glu Val Ile 145 150 155 160 Leu Thr Ala Ser Gly Gly Pro Phe Arg Asp Gly Pro Ala Asp Leu Ser 165 170 175 Arg Val Thr Ala Ala Gln Ala Leu Arg His Pro Ser Trp Thr Met Gly 180 185 190 Pro Lys Val Thr Ile Asp Ser Ser Thr Leu Met Asn Lys Gly Leu Glu 195 200 205 Val Met Glu Cys Ala Ser Leu Tyr Gly Leu Pro Met Thr Gln Val Gly 210 215 220 Val Val Ile His Pro Gln Ser Leu Met His Ala Ala Val Arg Phe Arg 225 230 235 240 Asp Gly Ser Leu Lys Ala Gln Phe Gly Pro Thr Asp Met Arg Leu Pro 245 250 255 Ile Ala Tyr Ala Met Asp Ala Ala Pro Thr Gly Met Thr Arg Pro Gly 260 265 270 Asp Val Arg Gly Ala Arg Arg Gly Pro Glu Val Ala Gly His Ala Ser 275 280 285 Trp Pro Leu Arg Gly Glu Trp Gln Phe Arg Glu Pro Asp Leu Glu Arg 290 295 300 Phe Pro Cys Leu Ala Leu Ala Tyr Arg Ala Gly Thr Gly Gly Gly Leu 305 310 315 320 Leu Pro Val Ala Leu Asn Ala Ala Asp Glu Val Ala Val Asp Ala Phe 325 330 335 Leu Ala Gly Arg Ile Gly Tyr Leu Asp Ile Pro Arg Val Ile Gly Gly 340 345 350 Val Leu Asp Asp Thr Pro Ala Gly Asp Leu Thr Trp Asp Thr Leu His 355 360 365 Ala Thr Asp Thr Trp Ala Arg Thr Arg Ala Ser Glu Leu Cys Gly Val 370 375 380 Thr Ala 385 <210> 38 <211> 873 <212> DNA <213> Deinococcus geothermalis <400> 38 atgcccctgg atcccctcac cctgcgtccc ctccacccga gcgaaaccgc cacctatctc 60 gcccctgcca aggtcaatct gggtctcagc gtgcgcggcc tgcgcacaga cggctaccac 120 gaactgcact ccgtcatggt gccgctggtt gtgggagacg aactcgagat cgcagcggcc 180 gacacgctga ccctgcgggt ggagggggca gcattgccca ccgatgagcg caacctggtc 240 taccgggccg cgcgggcgta tctggacgcg gccagggtca gcggcggcgc catgatcacc 300 ctgcgcaagc ggctgcccct ggcttctggc ctgggcggcg gcagcagcga tgcggccacc 360 acattgatgg cactggcgcg gctgttccct gctcctgtga acctcccggc gctggccctc 420 acgctgggtg cagatgtgcc gtttttcctg ctcggccagg cggcgctggc gcagggggtc 480 ggggaagtgc tcacgccgct gccggtgccg caagtgccgc tggtgctggt caatccgggg 540 gtagaggtca gcgcccgcga cgcctatgcc tggctggatg aggaggaagc cttcacgccg 600 ccgctcgatg tggagggcct gctggccgcc ctcaccgccc agcacgagct gcccaccttc 660 aatgctctcc agggcccggt cgccgcgcgc cacgcgccca tccaagctgc cctggccgcc 720 ctctcgagcg caggcctgcg ttcgccgctg atgagcggct caggagcgac ctgttttgcc 780 ctggccgcga gtgacgctca ggcacacgct gctgcgcagg cgctgcaggc acagcacccg 840 gcgtggtggg tggtggcgac gaggacgctg tag 873 <210> 39 <211> 290 <212> PRT <213> Deinococcus geothermalis <400> 39 Met Pro Leu Asp Pro Leu Thr Leu Arg Pro Leu His Pro Ser Glu Thr 1 5 10 15 Ala Thr Tyr Leu Ala Pro Ala Lys Val Asn Leu Gly Leu Ser Val Arg 20 25 30 Gly Leu Arg Thr Asp Gly Tyr His Glu Leu His Ser Val Met Val Pro 35 40 45 Leu Val Val Gly Asp Glu Leu Glu Ile Ala Ala Ala Asp Thr Leu Thr 50 55 60 Leu Arg Val Glu Gly Ala Ala Leu Pro Thr Asp Glu Arg Asn Leu Val 65 70 75 80 Tyr Arg Ala Ala Arg Ala Tyr Leu Asp Ala Ala Arg Val Ser Gly Gly 85 90 95 Ala Met Ile Thr Leu Arg Lys Arg Leu Pro Leu Ala Ser Gly Leu Gly 100 105 110 Gly Gly Ser Ser Asp Ala Ala Thr Thr Leu Met Ala Leu Ala Arg Leu 115 120 125 Phe Pro Ala Pro Val Asn Leu Pro Ala Leu Ala Leu Thr Leu Gly Ala 130 135 140 Asp Val Pro Phe Phe Leu Leu Gly Gln Ala Ala Leu Ala Gln Gly Val 145 150 155 160 Gly Glu Val Leu Thr Pro Leu Pro Val Pro Gln Val Pro Leu Val Leu 165 170 175 Val Asn Pro Gly Val Glu Val Ser Ala Arg Asp Ala Tyr Ala Trp Leu 180 185 190 Asp Glu Glu Glu Ala Phe Thr Pro Pro Leu Asp Val Glu Gly Leu Leu 195 200 205 Ala Ala Leu Thr Ala Gln His Glu Leu Pro Thr Phe Asn Ala Leu Gln 210 215 220 Gly Pro Val Ala Ala Arg His Ala Pro Ile Gln Ala Ala Leu Ala Ala 225 230 235 240 Leu Ser Ser Ala Gly Leu Arg Ser Pro Leu Met Ser Gly Ser Gly Ala 245 250 255 Thr Cys Phe Ala Leu Ala Ala Ser Asp Ala Gln Ala His Ala Ala Ala 260 265 270 Gln Ala Leu Gln Ala Gln His Pro Ala Trp Trp Val Val Ala Thr Arg 275 280 285 Thr Leu 290 <210> 40 <211> 858 <212> DNA <213> Deinococcus yunweiensis <400> 40 atgaccatgc ctgacacgct cccccctggc agcaccacgt acttcgcccc cgcgaaggtc 60 aacctgggcc tgagcgtgcg tgccccacgg gccgacggct accacgacct gcacaccctg 120 atggtgccgc tcgcagtcgg cgacgacctg agtgtcgctc cggccgacgc cctgactgtg 180 gaggtgcgcg gagccgacct gcccaccgac tcgcgcaatc tggtgtcccg cgccgcccgt 240 gcgtatctgg acgccgccgg caccgatcag ggcgcccacc tgatcctgca caagcggttg 300 cccatcgcca gcgggcttgg tgggggcagc agcgacgccg cgaccaccct gatggccctg 360 gcccgcctgt acccggctgg cctcgacctg catgccctgg cgcgtgtgct gggagccgac 420 gtgcccttct tcctgctggg ccgggcggcc gtggccgagg gcaccggcga gatcctgacg 480 ccgctgccgg taccgcgcac gcccctggtg ctggtcaatc ccggcgtgga ggtcagtgcc 540 cgcgacgcct atcactggct ggacgccgag gagaccttca ccgcgccgct ggacatcgac 600 gcggtgctgg cgaccctggc cgacggccgc ccggtgccgt acctcaatgc gctgcaaggc 660 cccgtcgccg cccggcacgt gcccatccag gaggcgctcc aggccctgtc ggacgctgga 720 ctgcgttccc cgctgatgag cggctcgggc agcacgtgtt ttgccctggc cggcagcgag 780 gatcacgccc atacctgcgc cgaggccatg gctgtccggt acccgcagtg gtgggtacag 840 gccaccagca cgctctga 858 <210> 41 <211> 285 <212> PRT <213> Deinococcus yunweiensis <400> 41 Met Thr Met Pro Asp Thr Leu Pro Pro Gly Ser Thr Thr Tyr Phe Ala 1 5 10 15 Pro Ala Lys Val Asn Leu Gly Leu Ser Val Arg Ala Pro Arg Ala Asp 20 25 30 Gly Tyr His Asp Leu His Thr Leu Met Val Pro Leu Ala Val Gly Asp 35 40 45 Asp Leu Ser Val Ala Pro Ala Asp Ala Leu Thr Val Glu Val Arg Gly 50 55 60 Ala Asp Leu Pro Thr Asp Ser Arg Asn Leu Val Ser Arg Ala Ala Arg 65 70 75 80 Ala Tyr Leu Asp Ala Ala Gly Thr Asp Gln Gly Ala His Leu Ile Leu 85 90 95 His Lys Arg Leu Pro Ile Ala Ser Gly Leu Gly Gly Gly Ser Ser Asp 100 105 110 Ala Ala Thr Thr Leu Met Ala Leu Ala Arg Leu Tyr Pro Ala Gly Leu 115 120 125 Asp Leu His Ala Leu Ala Arg Val Leu Gly Ala Asp Val Pro Phe Phe 130 135 140 Leu Leu Gly Arg Ala Ala Val Ala Glu Gly Thr Gly Glu Ile Leu Thr 145 150 155 160 Pro Leu Pro Val Pro Arg Thr Pro Leu Val Leu Val Asn Pro Gly Val 165 170 175 Glu Val Ser Ala Arg Asp Ala Tyr His Trp Leu Asp Ala Glu Glu Thr 180 185 190 Phe Thr Ala Pro Leu Asp Ile Asp Ala Val Leu Ala Thr Leu Ala Asp 195 200 205 Gly Arg Pro Val Pro Tyr Leu Asn Ala Leu Gln Gly Pro Val Ala Ala 210 215 220 Arg His Val Pro Ile Gln Glu Ala Leu Gln Ala Leu Ser Asp Ala Gly 225 230 235 240 Leu Arg Ser Pro Leu Met Ser Gly Ser Gly Ser Thr Cys Phe Ala Leu 245 250 255 Ala Gly Ser Glu Asp His Ala His Thr Cys Ala Glu Ala Met Ala Val 260 265 270 Arg Tyr Pro Gln Trp Trp Val Gln Ala Thr Ser Thr Leu 275 280 285 <210> 42 <211> 996 <212> DNA <213> Deinococcus geothermalis <400> 42 atggttgaac ggattcatct tgccaagccg cgcggcttct gcgcgggcgt ggtgatggcc 60 atccaggcgg tcgaaaaagc cgctcgtacc gaagaccgtc ccgtgacggt ctatcattcc 120 attgtccaca accacaccgt tgtcgagcgg ttggaacagg aacatggcgt gcagtttgtg 180 gagagcctgg acgatctaac agccctcccg aacggcagcg agacggtgat ctttagcgct 240 cacggcatca gcccagcggt gcgcgagcgg gcgcgggcct tgggcgtgag caccatcgac 300 gcaacctgtc cgctggtgac caaggtccac accgaggcga aaaagtacgc tcgcgagggc 360 tataccatcc tgctgatcgg ggacagcgcg cggcaccagg aagtcatcgg cacacgcggc 420 gaggcccccg aacagaccat cgtggtgggc gtactgggca aaacgggaga aggactacac 480 gacccccata ccgtcgaagt acctgatccc gagcgggtgg tggtcctcac gcagacgacc 540 ctcagtgtgg acgatacccg ccgcaccatc gacatcctga aaacccgctt tccgaagctg 600 gtgattccac ccagcgaaga tctctgctac gccaccaaga accgccagga ggccgtcaag 660 gcgatcgctc cacaggtcga cgcttttctg gtgctgacca gcactcattc cagcaacggg 720 atgcgcctgc tggaactcgc ccgcgacctg tgcggccggg ccgagcgcct ggaaactgct 780 gccgacctcg cgcacctcga tctgaccggc gtgcgctcgc tgggcatcac cagtgcagcc 840 agcacacccg atgatctcgt ccagaaagtg gtcgcccact tccgccggct caatccgaac 900 cttgaagtca tcgaggaagg cgagtgggaa aacatcgagt tccgcgaacc taaaaagatc 960 gggccggggc aggccctccc ccggacaacg cagtag 996 <210> 43 <211> 331 <212> PRT <213> Deinococcus geothermalis <400> 43 Met Val Glu Arg Ile His Leu Ala Lys Pro Arg Gly Phe Cys Ala Gly 1 5 10 15 Val Val Met Ala Ile Gln Ala Val Glu Lys Ala Ala Arg Thr Glu Asp 20 25 30 Arg Pro Val Thr Val Tyr His Ser Ile Val His Asn His Thr Val Val 35 40 45 Glu Arg Leu Glu Gln Glu His Gly Val Gln Phe Val Glu Ser Leu Asp 50 55 60 Asp Leu Thr Ala Leu Pro Asn Gly Ser Glu Thr Val Ile Phe Ser Ala 65 70 75 80 His Gly Ile Ser Pro Ala Val Arg Glu Arg Ala Arg Ala Leu Gly Val 85 90 95 Ser Thr Ile Asp Ala Thr Cys Pro Leu Val Thr Lys Val His Thr Glu 100 105 110 Ala Lys Lys Tyr Ala Arg Glu Gly Tyr Thr Ile Leu Leu Ile Gly Asp 115 120 125 Ser Ala Arg His Gln Glu Val Ile Gly Thr Arg Gly Glu Ala Pro Glu 130 135 140 Gln Thr Ile Val Val Gly Val Leu Gly Lys Thr Gly Glu Gly Leu His 145 150 155 160 Asp Pro His Thr Val Glu Val Pro Asp Pro Glu Arg Val Val Val Leu 165 170 175 Thr Gln Thr Thr Leu Ser Val Asp Asp Thr Arg Arg Thr Ile Asp Ile 180 185 190 Leu Lys Thr Arg Phe Pro Lys Leu Val Ile Pro Pro Ser Glu Asp Leu 195 200 205 Cys Tyr Ala Thr Lys Asn Arg Gln Glu Ala Val Lys Ala Ile Ala Pro 210 215 220 Gln Val Asp Ala Phe Leu Val Leu Thr Ser Thr His Ser Ser Asn Gly 225 230 235 240 Met Arg Leu Leu Glu Leu Ala Arg Asp Leu Cys Gly Arg Ala Glu Arg 245 250 255 Leu Glu Thr Ala Ala Asp Leu Ala His Leu Asp Leu Thr Gly Val Arg 260 265 270 Ser Leu Gly Ile Thr Ser Ala Ala Ser Thr Pro Asp Asp Leu Val Gln 275 280 285 Lys Val Val Ala His Phe Arg Arg Leu Asn Pro Asn Leu Glu Val Ile 290 295 300 Glu Glu Gly Glu Trp Glu Asn Ile Glu Phe Arg Glu Pro Lys Lys Ile 305 310 315 320 Gly Pro Gly Gln Ala Leu Pro Arg Thr Thr Gln 325 330 <210> 44 <211> 1002 <212> DNA <213> Deinococcus yunweiensis <400> 44 atgaccatga ttgaacgcgt gttcctggcc cggccccgtg ggttctgcgc gggggtcgtc 60 atggcgatcc aggcggtcga gcgggctgcc gtgaccgagg agcggccggt gacggtgtac 120 cactccatcg tccacaacca cacggtcgtc gagcggctgt cggcagccca cggagtgcat 180 ttcgtcgagg atctggacgc ggtcgaggcg ctgccccagg gcggcgagac cgtcgtgttc 240 agtgcccacg gcatcagccc gacggtgcgc gagcgggcac gctcactcgg gctggcgacc 300 atcgacgcga cctgcccgct ggtcacgaag gtgcacacag aggccaagaa atacgcccgt 360 gagggctaca cgatcctgct gatcggggac agcgcacggc atcaggaggt catcggcacg 420 cggggtgagg ccccggacag caccattctg gtgggcgtgc tcggcaagac cggcgagggc 480 ctgcacgacc cccacaccgt cgaggtgccc gatccgcaga agctggtcgt gctgacccag 540 acgaccctga gcgtggacga cacgcggcgc accgtggaca tcctgaaggc ccggttcccg 600 gcgctggtgg tgccgcccag cgaggatctg tgctacgcca ccaaaaaccg ccaggacgcc 660 gtgaaagcca tcgcgccgca ggtggacgcc ttcctggtac tcaccagcac gcattccagc 720 aacggcatgc gcctgctgga actggctgcc gagacctgcg gacgctcgga gcggctggag 780 acggtggccg acctggccgg cattgacctg agcggcgtgc gcagtgtggg gatcacgtcg 840 gccgcgagca caccggacga tctggtgcag gcggtcgtgg cccacttcca gatgctgaac 900 ccggccctgg cggtcatcga ggagggcgag tgggaggaca tcgagttccg cgagccgaag 960 aagatcctgc cgggtgacgc cctgccgcgc acgatgcagt ga 1002 <210> 45 <211> 333 <212> PRT <213> Deinococcus yunweiensis <400> 45 Met Thr Met Ile Glu Arg Val Phe Leu Ala Arg Pro Arg Gly Phe Cys 1 5 10 15 Ala Gly Val Val Met Ala Ile Gln Ala Val Glu Arg Ala Ala Val Thr 20 25 30 Glu Glu Arg Pro Val Thr Val Tyr His Ser Ile Val His Asn His Thr 35 40 45 Val Val Glu Arg Leu Ser Ala Ala His Gly Val His Phe Val Glu Asp 50 55 60 Leu Asp Ala Val Glu Ala Leu Pro Gln Gly Gly Glu Thr Val Val Phe 65 70 75 80 Ser Ala His Gly Ile Ser Pro Thr Val Arg Glu Arg Ala Arg Ser Leu 85 90 95 Gly Leu Ala Thr Ile Asp Ala Thr Cys Pro Leu Val Thr Lys Val His 100 105 110 Thr Glu Ala Lys Lys Tyr Ala Arg Glu Gly Tyr Thr Ile Leu Leu Ile 115 120 125 Gly Asp Ser Ala Arg His Gln Glu Val Ile Gly Thr Arg Gly Glu Ala 130 135 140 Pro Asp Ser Thr Ile Leu Val Gly Val Leu Gly Lys Thr Gly Glu Gly 145 150 155 160 Leu His Asp Pro His Thr Val Glu Val Pro Asp Pro Gln Lys Leu Val 165 170 175 Val Leu Thr Gln Thr Thr Leu Ser Val Asp Asp Thr Arg Arg Thr Val 180 185 190 Asp Ile Leu Lys Ala Arg Phe Pro Ala Leu Val Val Pro Pro Ser Glu 195 200 205 Asp Leu Cys Tyr Ala Thr Lys Asn Arg Gln Asp Ala Val Lys Ala Ile 210 215 220 Ala Pro Gln Val Asp Ala Phe Leu Val Leu Thr Ser Thr His Ser Ser 225 230 235 240 Asn Gly Met Arg Leu Leu Glu Leu Ala Ala Glu Thr Cys Gly Arg Ser 245 250 255 Glu Arg Leu Glu Thr Val Ala Asp Leu Ala Gly Ile Asp Leu Ser Gly 260 265 270 Val Arg Ser Val Gly Ile Thr Ser Ala Ala Ser Thr Pro Asp Asp Leu 275 280 285 Val Gln Ala Val Val Ala His Phe Gln Met Leu Asn Pro Ala Leu Ala 290 295 300 Val Ile Glu Glu Gly Glu Trp Glu Asp Ile Glu Phe Arg Glu Pro Lys 305 310 315 320 Lys Ile Leu Pro Gly Asp Ala Leu Pro Arg Thr Met Gln 325 330 <210> 46 <211> 990 <212> DNA <213> Deinococcus geothermalis <400> 46 atgcaccccg acctgctccc ccgcgtgctg tctctgcttc ccaaccgcgg tgaccgcccg 60 gaactgcgcg ccttctccgc catgctgcgc gactatcccg agcgcggcgg aaagggcatc 120 cgctcggaac tgctgctcgc cagtgcccgc gcccatggcg ccttgcccag cacttcagcc 180 tgggaaggag cgctgtggct cgcggcgggc ctggaactgt tccagaattg ggtgctgatc 240 cacgacgaca tcgaggatga ctcggaggag cgccggggca ggcccgcgct gcaccgcctg 300 tacggcgtgc cggtagccat caatgtgggt gacgccctcc acgcctcgat gtgggccgcc 360 gtccaccgcg cgggggtgcc gggcggcctg gaagaattcc tgaacatggt ctggcgcacg 420 gcggagggcc agcacctcga tctcacctgg gtgcaggagc gcagctggaa cctgggcgaa 480 gccgactatc tggcgatggt gcgcctgaaa acggccctgt acacggtggt ggtgccgctg 540 cggctcgggg cactcgccgc cggagtgctc ccggacgagc gctttacggc agcgggcgaa 600 gccctgggcg cggccttcca aattcgcgac gacgtgctga acctggccgg ggatcccgcg 660 aagtacggca aggagatcgg cggcgacctc tgggagggca aacgcacctt gattgtgctg 720 cactggctcg cccacgcgcc ggaggagcag cggcaggtct ttctggaaca gatgcgccgg 780 gaccgagcgg acaaggacgc cgccgccatc gcagccatcc accgctggct gctggagagc 840 ggcagcgttc agtacgccca ggcctacgcc gacacacagg cccgcgaagg cctcgcccgc 900 ctgaccgagg cgctggagaa cgcacccgac ccgcaggcgg cgcgggcact cctggcccag 960 ttgcgggggc tggcgacgcg cgaagcgtag 990 <210> 47 <211> 329 <212> PRT <213> Deinococcus geothermalis <400> 47 Met His Pro Asp Leu Leu Pro Arg Val Leu Ser Leu Leu Pro Asn Arg 1 5 10 15 Gly Asp Arg Pro Glu Leu Arg Ala Phe Ser Ala Met Leu Arg Asp Tyr 20 25 30 Pro Glu Arg Gly Gly Lys Gly Ile Arg Ser Glu Leu Leu Leu Ala Ser 35 40 45 Ala Arg Ala His Gly Ala Leu Pro Ser Thr Ser Ala Trp Glu Gly Ala 50 55 60 Leu Trp Leu Ala Ala Gly Leu Glu Leu Phe Gln Asn Trp Val Leu Ile 65 70 75 80 His Asp Asp Ile Glu Asp Asp Ser Glu Glu Arg Arg Gly Arg Pro Ala 85 90 95 Leu His Arg Leu Tyr Gly Val Pro Val Ala Ile Asn Val Gly Asp Ala 100 105 110 Leu His Ala Ser Met Trp Ala Ala Val His Arg Ala Gly Val Pro Gly 115 120 125 Gly Leu Glu Glu Phe Leu Asn Met Val Trp Arg Thr Ala Glu Gly Gln 130 135 140 His Leu Asp Leu Thr Trp Val Gln Glu Arg Ser Trp Asn Leu Gly Glu 145 150 155 160 Ala Asp Tyr Leu Ala Met Val Arg Leu Lys Thr Ala Leu Tyr Thr Val 165 170 175 Val Val Pro Leu Arg Leu Gly Ala Leu Ala Ala Gly Val Leu Pro Asp 180 185 190 Glu Arg Phe Thr Ala Ala Gly Glu Ala Leu Gly Ala Ala Phe Gln Ile 195 200 205 Arg Asp Asp Val Leu Asn Leu Ala Gly Asp Pro Ala Lys Tyr Gly Lys 210 215 220 Glu Ile Gly Gly Asp Leu Trp Glu Gly Lys Arg Thr Leu Ile Val Leu 225 230 235 240 His Trp Leu Ala His Ala Pro Glu Glu Gln Arg Gln Val Phe Leu Glu 245 250 255 Gln Met Arg Arg Asp Arg Ala Asp Lys Asp Ala Ala Ala Ile Ala Ala 260 265 270 Ile His Arg Trp Leu Leu Glu Ser Gly Ser Val Gln Tyr Ala Gln Ala 275 280 285 Tyr Ala Asp Thr Gln Ala Arg Glu Gly Leu Ala Arg Leu Thr Glu Ala 290 295 300 Leu Glu Asn Ala Pro Asp Pro Gln Ala Ala Arg Ala Leu Leu Ala Gln 305 310 315 320 Leu Arg Gly Leu Ala Thr Arg Glu Ala 325 <210> 48 <211> 1704 <212> DNA <213> Ocimum basilicum <400> 48 atgtcttgtg cacggatcac cgtaacattg ccgtatcgct ccgcaaaaac atcaattcaa 60 cggggaatta cgcattaccc cgcccttata cgcccacgct tctctgcttg cacgcctttg 120 gcatcggcga tgcctctaag ttcaactcct ctcatcaacg gggataactc tcagcgtaaa 180 aacacacgtc aacacatgga ggagagcagc agcaagagga gagaatatct gctggaggaa 240 acgacgcgaa aactgcagag aaacgacacc gaatcggtgg agaaactcaa gcttatcgac 300 aacatccaac agttgggaat cggctactat tttgaggacg ccatcaacgc cgtactccgc 360 tcgcctttct ccaccggaga agaagacctc ttcaccgctg ctctgcgctt ccgcttgctc 420 cgccacaacg gcatcgaaat cagccctgaa atattcctaa aattcaagga cgagagggga 480 aaattcgacg aatcggacac gctagggtta ctgagcttgt acgaagcgtc aaatttgggg 540 gttgcaggag aagaaatatt ggaggaggct atggagtttg cggaggctcg cctgagacgg 600 tcgctgtcag agccggcggc gccgcttcat ggtgaggtgg cgcaagcgct agatgtgccg 660 aggcatctga gaatggcgag gttggaagcg agacgattca tcgagcagta tggtaaacag 720 agcgatcatg atggagatct tttggagctg gcaattttgg attataatca agttcaggct 780 caacaccaat ccgaactcac tgaaataatc aggtggtgga aggagctcgg tttggtggat 840 aagttgagtt ttgggcgaga cagaccattg gagtgctttt tgtggaccgt ggggctcctc 900 ccagagccca agtattcgag cgttagaata gagttggcga aagccatctc tattctctta 960 gtgatcgatg atattttcga tacctatgga gagatggatg acctcatcct cttcaccgat 1020 gcaattcgaa gatgggatct tgaagcaatg gaggggctcc ctgagtacat gaaaatatgc 1080 tacatggcgt tgtacaatac caccaatgaa gtatgctaca aagtgctcag ggatactgga 1140 cggattgtcc tccttaacct caaatctacg tggatagaca tgattgaagg tttcatggag 1200 gaagcaaaat ggttcaatgg tggaagtgca ccaaaattgg aagagtatat agagaatgga 1260 gtgtccacgg caggagcata catggctttt gcacacatct tctttctcat aggagaaggt 1320 gttacacacc aaaattccca actcttcacc caaaaaccct accccaaggt cttctccgcc 1380 gccggccgca ttcttcgcct ctgggatgat ctcggaaccg ccaaggaaga gcaagagcga 1440 ggagatctgg cttcgtgcgt gcagttattt atgaaagaga agtcgttgac ggaagaggag 1500 gcaagaagtc gcattttgga agagataaaa ggattatgga gggatctgaa tggggaactg 1560 gtctacaaca agaatttgcc gttatccata atcaaagtcg cacttaacat ggcgagagct 1620 tctcaagttg tgtacaagca cgatcaagac acttattttt caagcgtaga caattatgtg 1680 gatgccctct tcttcactca ataa 1704 <210> 49 <211> 567 <212> PRT <213> Ocimum basilicum <400> 49 Met Ser Cys Ala Arg Ile Thr Val Thr Leu Pro Tyr Arg Ser Ala Lys 1 5 10 15 Thr Ser Ile Gln Arg Gly Ile Thr His Tyr Pro Ala Leu Ile Arg Pro 20 25 30 Arg Phe Ser Ala Cys Thr Pro Leu Ala Ser Ala Met Pro Leu Ser Ser 35 40 45 Thr Pro Leu Ile Asn Gly Asp Asn Ser Gln Arg Lys Asn Thr Arg Gln 50 55 60 His Met Glu Glu Ser Ser Ser Lys Arg Arg Glu Tyr Leu Leu Glu Glu 65 70 75 80 Thr Thr Arg Lys Leu Gln Arg Asn Asp Thr Glu Ser Val Glu Lys Leu 85 90 95 Lys Leu Ile Asp Asn Ile Gln Gln Leu Gly Ile Gly Tyr Tyr Phe Glu 100 105 110 Asp Ala Ile Asn Ala Val Leu Arg Ser Pro Phe Ser Thr Gly Glu Glu 115 120 125 Asp Leu Phe Thr Ala Ala Leu Arg Phe Arg Leu Leu Arg His Asn Gly 130 135 140 Ile Glu Ile Ser Pro Glu Ile Phe Leu Lys Phe Lys Asp Glu Arg Gly 145 150 155 160 Lys Phe Asp Glu Ser Asp Thr Leu Gly Leu Leu Ser Leu Tyr Glu Ala 165 170 175 Ser Asn Leu Gly Val Ala Gly Glu Glu Ile Leu Glu Glu Ala Met Glu 180 185 190 Phe Ala Glu Ala Arg Leu Arg Arg Ser Leu Ser Glu Pro Ala Ala Pro 195 200 205 Leu His Gly Glu Val Ala Gln Ala Leu Asp Val Pro Arg His Leu Arg 210 215 220 Met Ala Arg Leu Glu Ala Arg Arg Phe Ile Glu Gln Tyr Gly Lys Gln 225 230 235 240 Ser Asp His Asp Gly Asp Leu Leu Glu Leu Ala Ile Leu Asp Tyr Asn 245 250 255 Gln Val Gln Ala Gln His Gln Ser Glu Leu Thr Glu Ile Ile Arg Trp 260 265 270 Trp Lys Glu Leu Gly Leu Val Asp Lys Leu Ser Phe Gly Arg Asp Arg 275 280 285 Pro Leu Glu Cys Phe Leu Trp Thr Val Gly Leu Leu Pro Glu Pro Lys 290 295 300 Tyr Ser Ser Val Arg Ile Glu Leu Ala Lys Ala Ile Ser Ile Leu Leu 305 310 315 320 Val Ile Asp Asp Ile Phe Asp Thr Tyr Gly Glu Met Asp Asp Leu Ile 325 330 335 Leu Phe Thr Asp Ala Ile Arg Arg Trp Asp Leu Glu Ala Met Glu Gly 340 345 350 Leu Pro Glu Tyr Met Lys Ile Cys Tyr Met Ala Leu Tyr Asn Thr Thr 355 360 365 Asn Glu Val Cys Tyr Lys Val Leu Arg Asp Thr Gly Arg Ile Val Leu 370 375 380 Leu Asn Leu Lys Ser Thr Trp Ile Asp Met Ile Glu Gly Phe Met Glu 385 390 395 400 Glu Ala Lys Trp Phe Asn Gly Gly Ser Ala Pro Lys Leu Glu Glu Tyr 405 410 415 Ile Glu Asn Gly Val Ser Thr Ala Gly Ala Tyr Met Ala Phe Ala His 420 425 430 Ile Phe Phe Leu Ile Gly Glu Gly Val Thr His Gln Asn Ser Gln Leu 435 440 445 Phe Thr Gln Lys Pro Tyr Pro Lys Val Phe Ser Ala Ala Gly Arg Ile 450 455 460 Leu Arg Leu Trp Asp Asp Leu Gly Thr Ala Lys Glu Glu Gln Glu Arg 465 470 475 480 Gly Asp Leu Ala Ser Cys Val Gln Leu Phe Met Lys Glu Lys Ser Leu 485 490 495 Thr Glu Glu Glu Ala Arg Ser Arg Ile Leu Glu Glu Ile Lys Gly Leu 500 505 510 Trp Arg Asp Leu Asn Gly Glu Leu Val Tyr Asn Lys Asn Leu Pro Leu 515 520 525 Ser Ile Ile Lys Val Ala Leu Asn Met Ala Arg Ala Ser Gln Val Val 530 535 540 Tyr Lys His Asp Gln Asp Thr Tyr Phe Ser Ser Val Asp Asn Tyr Val 545 550 555 560 Asp Ala Leu Phe Phe Thr Gln 565 <210> 50 <211> 1239 <212> DNA <213> Deinococcus geothermalis <400> 50 atgcctgccg cgccccccgt gaccgatgcc ctggtggttg ggggcggccc agcaggtttg 60 gcgttatccg ccgaactcgc ggcgtgtggc ctgcgggtgc ggctgatcgc tccccacccg 120 ccccggccct ttccggcgac ctacggcgcg tggctggagg aactccccgt ctggacccgt 180 gcctgctgcg ccgacgtgtg gaccgacgtg cgcgcctatt tggatgaacg ccccacgccg 240 ctgctgcgcc catatgtccg gctcgacaat gcccggttgc tggacaccct gctgacccgt 300 gctggaaacg gcctaacctg gaccgttggc agcgtgtgcg ccgcctcacg ggtcggggag 360 gggtgggagg ttcaggggac gcacggcgaa atctggcgcg cccacctggt cgtggacgcg 420 gcgggacaca cgggcagcct gagctgtccc cagcatctgg gcggtccggc tctccagacg 480 gcagttggcc tggtcgcaca cttcgacacg ccaccggtgc cgcctggctc cgccgtgtgg 540 atggattacc gcagctccca cctcgcgcct gccgacctgc acgcggcgcc caccttcctc 600 tacgccctgc atctgggcgg ttcccgctac ctggtggagg aaacgagcct ggtcgctcgg 660 cccgggctgt cccgtccgct gcttgagcaa aggctgcgcg ctcgcctcgc cgcgcaggga 720 acgcttcctc gtgaggtcga gcgggaggaa tgggtcgcct ttcccatgaa cgtgtcggcg 780 cccggccccg gaccggtgct ggccttcggg tcggcggcgg gtctggtgca tccggtgagc 840 gggtttcagg tggcgggggc actcggcgac gcgccgaaag tcgcgcgggc ggtggcgatg 900 gcgctcgctg cgggcagtcc ggaggccgcc gtgcaggccg ggtggcaggc cctctggcct 960 cccgaacgcc gggcggcgcg tgaggtcgcc ctgctggggc tggacgcgct gctggcactc 1020 ccgggcgatc agctcccggc cttcttcgcg gcctttttcc agctgcctgc ccgcgagtgg 1080 cgggcgtttt tggcccccca cacgggcgcc ggaaggctgg cccgcgtcat gctgcggcta 1140 tttgcccagg tgcccggccc ggttcgcgcg tccctggccc gtgccgcgct cgcccagagc 1200 catgtgagcg cgcaggcgct gcgagctgcc ctcggatga 1239 <210> 51 <211> 412 <212> PRT <213> Deinococcus geothermalis <400> 51 Met Pro Ala Ala Pro Pro Val Thr Asp Ala Leu Val Val Gly Gly Gly 1 5 10 15 Pro Ala Gly Leu Ala Leu Ser Ala Glu Leu Ala Ala Cys Gly Leu Arg 20 25 30 Val Arg Leu Ile Ala Pro His Pro Pro Arg Pro Phe Pro Ala Thr Tyr 35 40 45 Gly Ala Trp Leu Glu Glu Leu Pro Val Trp Thr Arg Ala Cys Cys Ala 50 55 60 Asp Val Trp Thr Asp Val Arg Ala Tyr Leu Asp Glu Arg Pro Thr Pro 65 70 75 80 Leu Leu Arg Pro Tyr Val Arg Leu Asp Asn Ala Arg Leu Leu Asp Thr 85 90 95 Leu Leu Thr Arg Ala Gly Asn Gly Leu Thr Trp Thr Val Gly Ser Val 100 105 110 Cys Ala Ala Ser Arg Val Gly Glu Gly Trp Glu Val Gln Gly Thr His 115 120 125 Gly Glu Ile Trp Arg Ala His Leu Val Val Asp Ala Ala Gly His Thr 130 135 140 Gly Ser Leu Ser Cys Pro Gln His Leu Gly Gly Pro Ala Leu Gln Thr 145 150 155 160 Ala Val Gly Leu Val Ala His Phe Asp Thr Pro Pro Val Pro Pro Gly 165 170 175 Ser Ala Val Trp Met Asp Tyr Arg Ser Ser His Leu Ala Pro Ala Asp 180 185 190 Leu His Ala Ala Pro Thr Phe Leu Tyr Ala Leu His Leu Gly Gly Ser 195 200 205 Arg Tyr Leu Val Glu Glu Thr Ser Leu Val Ala Arg Pro Gly Leu Ser 210 215 220 Arg Pro Leu Leu Glu Gln Arg Leu Arg Ala Arg Leu Ala Ala Gln Gly 225 230 235 240 Thr Leu Pro Arg Glu Val Glu Arg Glu Glu Trp Val Ala Phe Pro Met 245 250 255 Asn Val Ser Ala Pro Gly Pro Gly Pro Val Leu Ala Phe Gly Ser Ala 260 265 270 Ala Gly Leu Val His Pro Val Ser Gly Phe Gln Val Ala Gly Ala Leu 275 280 285 Gly Asp Ala Pro Lys Val Ala Arg Ala Val Ala Met Ala Leu Ala Ala 290 295 300 Gly Ser Pro Glu Ala Ala Val Gln Ala Gly Trp Gln Ala Leu Trp Pro 305 310 315 320 Pro Glu Arg Arg Ala Ala Arg Glu Val Ala Leu Leu Gly Leu Asp Ala 325 330 335 Leu Leu Ala Leu Pro Gly Asp Gln Leu Pro Ala Phe Phe Ala Ala Phe 340 345 350 Phe Gln Leu Pro Ala Arg Glu Trp Arg Ala Phe Leu Ala Pro His Thr 355 360 365 Gly Ala Gly Arg Leu Ala Arg Val Met Leu Arg Leu Phe Ala Gln Val 370 375 380 Pro Gly Pro Val Arg Ala Ser Leu Ala Arg Ala Ala Leu Ala Gln Ser 385 390 395 400 His Val Ser Ala Gln Ala Leu Arg Ala Ala Leu Gly 405 410 <210> 52 <211> 636 <212> PRT <213> Deinococcus radiopugnans <400> 52 Met Thr Asp Ile Lys Lys Ala Asp Gly Leu His Leu Gly His Lys Gly 1 5 10 15 Thr Pro Leu Leu Asp Arg Ile Ala Gly Pro Ala Asp Leu Lys Lys Leu 20 25 30 Ser Arg Asp Gln Leu Pro Glu Leu Ser Gln Glu Leu Arg Asp Glu Ile 35 40 45 Val Arg Val Cys Ser Val Gly Gly Leu His Leu Ala Ser Ser Leu Gly 50 55 60 Ala Thr Asp Leu Ile Val Ala Leu His Tyr Val Leu Asn Ser Pro Arg 65 70 75 80 Asp Arg Ile Leu Phe Asp Val Gly His Gln Ala Tyr Ala His Lys Met 85 90 95 Leu Thr Gly Arg Arg Glu Gln Met His Thr Val Lys Lys Glu Gly Gly 100 105 110 Leu Ser Gly Phe Thr Lys Val Ser Glu Ser Glu His Asp Ala Ile Thr 115 120 125 Val Gly His Ala Ser Thr Ser Leu Ala Asn Ala Leu Gly Met Ala Met 130 135 140 Ala Arg Asp Ala Leu Gly Gln Asp Tyr Gln Val Ala Ala Val Ile Gly 145 150 155 160 Asp Gly Ser Leu Thr Gly Gly Met Ala Leu Ala Ala Leu Asn Thr Ile 165 170 175 Gly Asp Leu Arg Arg Lys Met Leu Ile Val Leu Asn Asp Asn Glu Met 180 185 190 Ser Ile Ser Glu Asn Val Gly Ala Ile Asn Lys Phe Met Arg Gly Leu 195 200 205 Gln Val Gln Lys Trp Phe Gln Glu Gly Glu Gly Ala Gly Lys Lys Ala 210 215 220 Val Gln Ser Leu Ser Lys Pro Leu Ala Asp Phe Met Ser Arg Ala Lys 225 230 235 240 Ser Ser Thr Arg His Phe Phe Asp Pro Ala Ser Val Asn Pro Phe Ala 245 250 255 Met Met Gly Val Arg Tyr Val Gly Pro Val Asp Gly His Asn Val Gln 260 265 270 Glu Leu Val Trp Leu Met Glu Arg Leu Val Asp Leu Asp Gly Pro Thr 275 280 285 Ile Leu His Val Val Thr Arg Lys Gly Lys Gly Leu Ser Tyr Ala Glu 290 295 300 Ala Asp Pro Ile Tyr Trp His Gly Pro Gly Gln Phe Asp Pro Asp Thr 305 310 315 320 Gly Asp Phe Lys Ala Ser Ser Ala Tyr Ser Trp Ser Ala Ala Phe Gly 325 330 335 Asp Ala Val Thr Glu Leu Ala Lys Arg Asp Pro Arg Thr Phe Val Ile 340 345 350 Thr Pro Ala Met Arg Glu Gly Ser Gly Leu Val Gly Tyr Ser Arg Ala 355 360 365 His Pro His Arg Tyr Leu Asp Val Gly Ile Ala Glu Asp Val Ala Val 370 375 380 Thr Thr Ala Ala Gly Met Ala Leu Gln Gly Leu Arg Pro Ile Val Ala 385 390 395 400 Ile Tyr Ser Thr Phe Leu Gln Arg Ala Tyr Asp Gln Val Leu His Asp 405 410 415 Val Ala Ile Glu Asn Leu Asn Val Thr Phe Ala Ile Asp Arg Ala Gly 420 425 430 Ile Val Gly Ala Asp Gly Ser Thr His Asn Gly Val Phe Asp Leu Ser 435 440 445 Tyr Leu Arg Ser Ile Pro Asn Val Arg Ile Gly Leu Pro Lys Asp Ala 450 455 460 His Glu Met Arg Gly Met Leu Lys Tyr Ala Gln Glu His Asp Gly Pro 465 470 475 480 Phe Ala Ile Arg Tyr Pro Arg Gly Asn Thr Val Lys Val Pro Glu Gly 485 490 495 Thr Trp Pro Thr Leu Glu Trp Gly Thr Trp Glu Arg Val Lys Glu Gly 500 505 510 Ser Asp Ala Val Ile Leu Ala Gly Gly Lys Ala Leu Glu Tyr Ala Gln 515 520 525 Ala Ala Ala Ala Asp Leu Pro Gly Val Gly Val Val Asn Ala Arg Phe 530 535 540 Val Lys Pro Leu Asp Leu Asn Met Leu Arg Glu Leu Ala Gly Ser Ala 545 550 555 560 Arg Thr Ile Ile Thr Val Glu Asp Asn Thr Leu Val Gly Gly Phe Gly 565 570 575 Ser Ala Val Leu Glu Ala Leu Asn Ser Met Gly Leu Lys Val Pro Val 580 585 590 Arg Thr Leu Gly Ile Pro Asp Glu Phe Gln Asp His Ala Thr Ala Glu 595 600 605 Ser Val His Ala Arg Ala Gly Ile Asp Ala Gln Ala Ile Arg Thr Val 610 615 620 Leu Ala Glu Leu Gly Val Asp Val Pro Leu Gly Val 625 630 635 <210> 53 <211> 1902 <212> DNA <213> Artificial Sequence <220> <223> K219N mutant of the DXP synthase from D. geothermalis <400> 53 atgagtgagc caactgccaa cctccagcct gccagccgca ccccgctgct ggaccgggtg 60 aatggcccgg aagacctcaa acggctcgga cgcgaccagc taccccagct cgctgccgaa 120 ctgcgcgagg agatcgtgcg ggtctgctcg gtaggggggt tacatctcgc cagctctctg 180 ggcgcgaccg acctaatcgt ggcgctacat tacgtgctgc attcgccgcg cgaccgcatt 240 ctgttcgacg tggggcatca ggcctacgcc cacaagatgc tcacgggccg ccgccacctg 300 atgcacaccg tcaagaagga gggcgggctg tcgggcttca ccaaggtgag cgagtccgaa 360 cacgacgcca tcacggtggg ccatgccagc acctccctcg ccaatgcgct gggcatggcg 420 cttgcacggg acgctttggg acaggattac aaggtggctg ccgtgatcgg ggacggctcg 480 ctgacgggcg gcatggcgct ggcggcgctg aataccatcg gggacctggg gcggcgaatg 540 ctcattgtgc ttaacgacaa cgagatgagc atcagcgaga acgtgggggc catcaaccgc 600 ttcatgcggg gtctccaggt gcagaagtgg ttccaggagg gcgaggaagc cgggaacaag 660 gccgtgcagg cggtcagcaa gccgctcgcc aacttgatga gccgcgccaa gagttccacg 720 cggcactttt tcgatcccgc cagtgtcaat ccctttgccg cgatgggcgt gcgctatgtg 780 ggaccggtgg acggccacaa cgtgcaggaa ttggtgtggc tgatcgagcg gctggtcgac 840 ctcgatgggc cgaccattct gcacgtcgtc accaaaaagg gcaagggcct gagctacgcc 900 gaggccgacc cgatcaaatg gcatggcccg ggcaagtttg acccggcgac gggtgagtcg 960 gtgcccagca atgcctactc gtggagcagc gcctttggag acgcggtgac cgagcttgca 1020 cggctggacc cccgtacctt tgtgatcacg cccgcgatgc gcgagggcag cggcctggtg 1080 cgctacagcc aggttcaccc ccaccgttac ctggatgtcg gtatcgcgga ggacgtggcc 1140 gtcaccacgg ccgccggaat ggcgcttcag gggatgcggc ccatcgtggc gatctactcc 1200 actttcctgc aacgcgccta cgatcaggtg ctgcacgacg tcgccatcga gaatctgaac 1260 gtgaccttcg ccatcgaccg tgggggcatc gtgggcgcag acggagccac ccacaacggc 1320 gtcttcgacc tgagttacct gcgctcgatt ccgaatgtcg gcattggcct gccgaaggac 1380 gccgccgagc tgcgcgggat gctgaagtat gcccaggagc atgctggccc cttcgccatc 1440 cgctatccgc gcggcaacgt ggaacgcgtg ccggaaggca cctggccgga gctgaggtgg 1500 ggcacctggg aacgcttgca agacggcgac gacgtggtga ttctggcggg aggcaaggcg 1560 ctggagtacg cgctgaaggc cgcccgcgac ctccccggcg tgggcgtggt gaatgcccgt 1620 ttcgtgaagc cgctcgacca agggatgctg cgcgaggtgg cgaccaaagc ccgcgcactg 1680 gtcacggtgg aggacaacac ggtcgtcggt gggttcggaa gtgccgtcct ggaagccctc 1740 agcgcgctgg ggctgagaac cccggtgcgg gttctcggca tccccgacgc gtttcaggat 1800 cacgcgaccg tagagagcgt gcatgcccgt gcggggattg acgcgcctgc catccgcacg 1860 gtcctggccg aacttggcgt ggacgtgccg ctggaggtct ag 1902 <210> 54 <211> 633 <212> PRT <213> Artificial Sequence <220> <223> K219N mutant of the DXP synthase from D. geothermalis <400> 54 Met Ser Glu Pro Thr Ala Asn Leu Gln Pro Ala Ser Arg Thr Pro Leu 1 5 10 15 Leu Asp Arg Val Asn Gly Pro Glu Asp Leu Lys Arg Leu Gly Arg Asp 20 25 30 Gln Leu Pro Gln Leu Ala Ala Glu Leu Arg Glu Glu Ile Val Arg Val 35 40 45 Cys Ser Val Gly Gly Leu His Leu Ala Ser Ser Leu Gly Ala Thr Asp 50 55 60 Leu Ile Val Ala Leu His Tyr Val Leu His Ser Pro Arg Asp Arg Ile 65 70 75 80 Leu Phe Asp Val Gly His Gln Ala Tyr Ala His Lys Met Leu Thr Gly 85 90 95 Arg Arg His Leu Met His Thr Val Lys Lys Glu Gly Gly Leu Ser Gly 100 105 110 Phe Thr Lys Val Ser Glu Ser Glu His Asp Ala Ile Thr Val Gly His 115 120 125 Ala Ser Thr Ser Leu Ala Asn Ala Leu Gly Met Ala Leu Ala Arg Asp 130 135 140 Ala Leu Gly Gln Asp Tyr Lys Val Ala Ala Val Ile Gly Asp Gly Ser 145 150 155 160 Leu Thr Gly Gly Met Ala Leu Ala Ala Leu Asn Thr Ile Gly Asp Leu 165 170 175 Gly Arg Arg Met Leu Ile Val Leu Asn Asp Asn Glu Met Ser Ile Ser 180 185 190 Glu Asn Val Gly Ala Ile Asn Arg Phe Met Arg Gly Leu Gln Val Gln 195 200 205 Lys Trp Phe Gln Glu Gly Glu Glu Ala Gly Asn Lys Ala Val Gln Ala 210 215 220 Val Ser Lys Pro Leu Ala Asn Leu Met Ser Arg Ala Lys Ser Ser Thr 225 230 235 240 Arg His Phe Phe Asp Pro Ala Ser Val Asn Pro Phe Ala Ala Met Gly 245 250 255 Val Arg Tyr Val Gly Pro Val Asp Gly His Asn Val Gln Glu Leu Val 260 265 270 Trp Leu Ile Glu Arg Leu Val Asp Leu Asp Gly Pro Thr Ile Leu His 275 280 285 Val Val Thr Lys Lys Gly Lys Gly Leu Ser Tyr Ala Glu Ala Asp Pro 290 295 300 Ile Lys Trp His Gly Pro Gly Lys Phe Asp Pro Ala Thr Gly Glu Ser 305 310 315 320 Val Pro Ser Asn Ala Tyr Ser Trp Ser Ser Ala Phe Gly Asp Ala Val 325 330 335 Thr Glu Leu Ala Arg Leu Asp Pro Arg Thr Phe Val Ile Thr Pro Ala 340 345 350 Met Arg Glu Gly Ser Gly Leu Val Arg Tyr Ser Gln Val His Pro His 355 360 365 Arg Tyr Leu Asp Val Gly Ile Ala Glu Asp Val Ala Val Thr Thr Ala 370 375 380 Ala Gly Met Ala Leu Gln Gly Met Arg Pro Ile Val Ala Ile Tyr Ser 385 390 395 400 Thr Phe Leu Gln Arg Ala Tyr Asp Gln Val Leu His Asp Val Ala Ile 405 410 415 Glu Asn Leu Asn Val Thr Phe Ala Ile Asp Arg Gly Gly Ile Val Gly 420 425 430 Ala Asp Gly Ala Thr His Asn Gly Val Phe Asp Leu Ser Tyr Leu Arg 435 440 445 Ser Ile Pro Asn Val Gly Ile Gly Leu Pro Lys Asp Ala Ala Glu Leu 450 455 460 Arg Gly Met Leu Lys Tyr Ala Gln Glu His Ala Gly Pro Phe Ala Ile 465 470 475 480 Arg Tyr Pro Arg Gly Asn Val Glu Arg Val Pro Glu Gly Thr Trp Pro 485 490 495 Glu Leu Arg Trp Gly Thr Trp Glu Arg Leu Gln Asp Gly Asp Asp Val 500 505 510 Val Ile Leu Ala Gly Gly Lys Ala Leu Glu Tyr Ala Leu Lys Ala Ala 515 520 525 Arg Asp Leu Pro Gly Val Gly Val Val Asn Ala Arg Phe Val Lys Pro 530 535 540 Leu Asp Gln Gly Met Leu Arg Glu Val Ala Thr Lys Ala Arg Ala Leu 545 550 555 560 Val Thr Val Glu Asp Asn Thr Val Val Gly Gly Phe Gly Ser Ala Val 565 570 575 Leu Glu Ala Leu Ser Ala Leu Gly Leu Arg Thr Pro Val Arg Val Leu 580 585 590 Gly Ile Pro Asp Ala Phe Gln Asp His Ala Thr Val Glu Ser Val His 595 600 605 Ala Arg Ala Gly Ile Asp Ala Pro Ala Ile Arg Thr Val Leu Ala Glu 610 615 620 Leu Gly Val Asp Val Pro Leu Glu Val 625 630 <210> 55 <211> 1902 <212> DNA <213> Artificial Sequence <220> <223> R241C mutant of the DXP synthase from D. geothermalis <400> 55 atgagtgagc caactgccaa cctccagcct gccagccgca ccccgctgct ggaccgggtg 60 aatggcccgg aagacctcaa acggctcgga cgcgaccagc taccccagct cgctgccgaa 120 ctgcgcgagg agatcgtgcg ggtctgctcg gtaggggggt tacatctcgc cagctctctg 180 ggcgcgaccg acctaatcgt ggcgctacat tacgtgctgc attcgccgcg cgaccgcatt 240 ctgttcgacg tggggcatca ggcctacgcc cacaagatgc tcacgggccg ccgccacctg 300 atgcacaccg tcaagaagga gggcgggctg tcgggcttca ccaaggtgag cgagtccgaa 360 cacgacgcca tcacggtggg ccatgccagc acctccctcg ccaatgcgct gggcatggcg 420 cttgcacggg acgctttggg acaggattac aaggtggctg ccgtgatcgg ggacggctcg 480 ctgacgggcg gcatggcgct ggcggcgctg aataccatcg gggacctggg gcggcgaatg 540 ctcattgtgc ttaacgacaa cgagatgagc atcagcgaga acgtgggggc catcaaccgc 600 ttcatgcggg gtctccaggt gcagaagtgg ttccaggagg gcgaggaagc cgggaaaaag 660 gccgtgcagg cggtcagcaa gccgctcgcc aacttgatga gccgcgccaa gagttccacg 720 tgccactttt tcgatcccgc cagtgtcaat ccctttgccg cgatgggcgt gcgctatgtg 780 ggaccggtgg acggccacaa cgtgcaggaa ttggtgtggc tgatcgagcg gctggtcgac 840 ctcgatgggc cgaccattct gcacgtcgtc accaaaaagg gcaagggcct gagctacgcc 900 gaggccgacc cgatcaaatg gcatggcccg ggcaagtttg acccggcgac gggtgagtcg 960 gtgcccagca atgcctactc gtggagcagc gcctttggag acgcggtgac cgagcttgca 1020 cggctggacc cccgtacctt tgtgatcacg cccgcgatgc gcgagggcag cggcctggtg 1080 cgctacagcc aggttcaccc ccaccgttac ctggatgtcg gtatcgcgga ggacgtggcc 1140 gtcaccacgg ccgccggaat ggcgcttcag gggatgcggc ccatcgtggc gatctactcc 1200 actttcctgc aacgcgccta cgatcaggtg ctgcacgacg tcgccatcga gaatctgaac 1260 gtgaccttcg ccatcgaccg tgggggcatc gtgggcgcag acggagccac ccacaacggc 1320 gtcttcgacc tgagttacct gcgctcgatt ccgaatgtcg gcattggcct gccgaaggac 1380 gccgccgagc tgcgcgggat gctgaagtat gcccaggagc atgctggccc cttcgccatc 1440 cgctatccgc gcggcaacgt ggaacgcgtg ccggaaggca cctggccgga gctgaggtgg 1500 ggcacctggg aacgcttgca agacggcgac gacgtggtga ttctggcggg aggcaaggcg 1560 ctggagtacg cgctgaaggc cgcccgcgac ctccccggcg tgggcgtggt gaatgcccgt 1620 ttcgtgaagc cgctcgacca agggatgctg cgcgaggtgg cgaccaaagc ccgcgcactg 1680 gtcacggtgg aggacaacac ggtcgtcggt gggttcggaa gtgccgtcct ggaagccctc 1740 agcgcgctgg ggctgagaac cccggtgcgg gttctcggca tccccgacgc gtttcaggat 1800 cacgcgaccg tagagagcgt gcatgcccgt gcggggattg acgcgcctgc catccgcacg 1860 gtcctggccg aacttggcgt ggacgtgccg ctggaggtct ag 1902 <210> 56 <211> 633 <212> PRT <213> Artificial Sequence <220> <223> R241C mutant of the DXP synthase from D. geothermalis <400> 56 Met Ser Glu Pro Thr Ala Asn Leu Gln Pro Ala Ser Arg Thr Pro Leu 1 5 10 15 Leu Asp Arg Val Asn Gly Pro Glu Asp Leu Lys Arg Leu Gly Arg Asp 20 25 30 Gln Leu Pro Gln Leu Ala Ala Glu Leu Arg Glu Glu Ile Val Arg Val 35 40 45 Cys Ser Val Gly Gly Leu His Leu Ala Ser Ser Leu Gly Ala Thr Asp 50 55 60 Leu Ile Val Ala Leu His Tyr Val Leu His Ser Pro Arg Asp Arg Ile 65 70 75 80 Leu Phe Asp Val Gly His Gln Ala Tyr Ala His Lys Met Leu Thr Gly 85 90 95 Arg Arg His Leu Met His Thr Val Lys Lys Glu Gly Gly Leu Ser Gly 100 105 110 Phe Thr Lys Val Ser Glu Ser Glu His Asp Ala Ile Thr Val Gly His 115 120 125 Ala Ser Thr Ser Leu Ala Asn Ala Leu Gly Met Ala Leu Ala Arg Asp 130 135 140 Ala Leu Gly Gln Asp Tyr Lys Val Ala Ala Val Ile Gly Asp Gly Ser 145 150 155 160 Leu Thr Gly Gly Met Ala Leu Ala Ala Leu Asn Thr Ile Gly Asp Leu 165 170 175 Gly Arg Arg Met Leu Ile Val Leu Asn Asp Asn Glu Met Ser Ile Ser 180 185 190 Glu Asn Val Gly Ala Ile Asn Arg Phe Met Arg Gly Leu Gln Val Gln 195 200 205 Lys Trp Phe Gln Glu Gly Glu Glu Ala Gly Lys Lys Ala Val Gln Ala 210 215 220 Val Ser Lys Pro Leu Ala Asn Leu Met Ser Arg Ala Lys Ser Ser Thr 225 230 235 240 Cys His Phe Phe Asp Pro Ala Ser Val Asn Pro Phe Ala Ala Met Gly 245 250 255 Val Arg Tyr Val Gly Pro Val Asp Gly His Asn Val Gln Glu Leu Val 260 265 270 Trp Leu Ile Glu Arg Leu Val Asp Leu Asp Gly Pro Thr Ile Leu His 275 280 285 Val Val Thr Lys Lys Gly Lys Gly Leu Ser Tyr Ala Glu Ala Asp Pro 290 295 300 Ile Lys Trp His Gly Pro Gly Lys Phe Asp Pro Ala Thr Gly Glu Ser 305 310 315 320 Val Pro Ser Asn Ala Tyr Ser Trp Ser Ser Ala Phe Gly Asp Ala Val 325 330 335 Thr Glu Leu Ala Arg Leu Asp Pro Arg Thr Phe Val Ile Thr Pro Ala 340 345 350 Met Arg Glu Gly Ser Gly Leu Val Arg Tyr Ser Gln Val His Pro His 355 360 365 Arg Tyr Leu Asp Val Gly Ile Ala Glu Asp Val Ala Val Thr Thr Ala 370 375 380 Ala Gly Met Ala Leu Gln Gly Met Arg Pro Ile Val Ala Ile Tyr Ser 385 390 395 400 Thr Phe Leu Gln Arg Ala Tyr Asp Gln Val Leu His Asp Val Ala Ile 405 410 415 Glu Asn Leu Asn Val Thr Phe Ala Ile Asp Arg Gly Gly Ile Val Gly 420 425 430 Ala Asp Gly Ala Thr His Asn Gly Val Phe Asp Leu Ser Tyr Leu Arg 435 440 445 Ser Ile Pro Asn Val Gly Ile Gly Leu Pro Lys Asp Ala Ala Glu Leu 450 455 460 Arg Gly Met Leu Lys Tyr Ala Gln Glu His Ala Gly Pro Phe Ala Ile 465 470 475 480 Arg Tyr Pro Arg Gly Asn Val Glu Arg Val Pro Glu Gly Thr Trp Pro 485 490 495 Glu Leu Arg Trp Gly Thr Trp Glu Arg Leu Gln Asp Gly Asp Asp Val 500 505 510 Val Ile Leu Ala Gly Gly Lys Ala Leu Glu Tyr Ala Leu Lys Ala Ala 515 520 525 Arg Asp Leu Pro Gly Val Gly Val Val Asn Ala Arg Phe Val Lys Pro 530 535 540 Leu Asp Gln Gly Met Leu Arg Glu Val Ala Thr Lys Ala Arg Ala Leu 545 550 555 560 Val Thr Val Glu Asp Asn Thr Val Val Gly Gly Phe Gly Ser Ala Val 565 570 575 Leu Glu Ala Leu Ser Ala Leu Gly Leu Arg Thr Pro Val Arg Val Leu 580 585 590 Gly Ile Pro Asp Ala Phe Gln Asp His Ala Thr Val Glu Ser Val His 595 600 605 Ala Arg Ala Gly Ile Asp Ala Pro Ala Ile Arg Thr Val Leu Ala Glu 610 615 620 Leu Gly Val Asp Val Pro Leu Glu Val 625 630 <210> 57 <211> 1902 <212> DNA <213> Artificial Sequence <220> <223> K219N/R241C mutant of the DXP synthase from D. geothermalis <400> 57 atgagtgagc caactgccaa cctccagcct gccagccgca ccccgctgct ggaccgggtg 60 aatggcccgg aagacctcaa acggctcgga cgcgaccagc taccccagct cgctgccgaa 120 ctgcgcgagg agatcgtgcg ggtctgctcg gtaggggggt tacatctcgc cagctctctg 180 ggcgcgaccg acctaatcgt ggcgctacat tacgtgctgc attcgccgcg cgaccgcatt 240 ctgttcgacg tggggcatca ggcctacgcc cacaagatgc tcacgggccg ccgccacctg 300 atgcacaccg tcaagaagga gggcgggctg tcgggcttca ccaaggtgag cgagtccgaa 360 cacgacgcca tcacggtggg ccatgccagc acctccctcg ccaatgcgct gggcatggcg 420 cttgcacggg acgctttggg acaggattac aaggtggctg ccgtgatcgg ggacggctcg 480 ctgacgggcg gcatggcgct ggcggcgctg aataccatcg gggacctggg gcggcgaatg 540 ctcattgtgc ttaacgacaa cgagatgagc atcagcgaga acgtgggggc catcaaccgc 600 ttcatgcggg gtctccaggt gcagaagtgg ttccaggagg gcgaggaagc cgggaacaag 660 gccgtgcagg cggtcagcaa gccgctcgcc aacttgatga gccgcgccaa gagttccacg 720 tgccactttt tcgatcccgc cagtgtcaat ccctttgccg cgatgggcgt gcgctatgtg 780 ggaccggtgg acggccacaa cgtgcaggaa ttggtgtggc tgatcgagcg gctggtcgac 840 ctcgatgggc cgaccattct gcacgtcgtc accaaaaagg gcaagggcct gagctacgcc 900 gaggccgacc cgatcaaatg gcatggcccg ggcaagtttg acccggcgac gggtgagtcg 960 gtgcccagca atgcctactc gtggagcagc gcctttggag acgcggtgac cgagcttgca 1020 cggctggacc cccgtacctt tgtgatcacg cccgcgatgc gcgagggcag cggcctggtg 1080 cgctacagcc aggttcaccc ccaccgttac ctggatgtcg gtatcgcgga ggacgtggcc 1140 gtcaccacgg ccgccggaat ggcgcttcag gggatgcggc ccatcgtggc gatctactcc 1200 actttcctgc aacgcgccta cgatcaggtg ctgcacgacg tcgccatcga gaatctgaac 1260 gtgaccttcg ccatcgaccg tgggggcatc gtgggcgcag acggagccac ccacaacggc 1320 gtcttcgacc tgagttacct gcgctcgatt ccgaatgtcg gcattggcct gccgaaggac 1380 gccgccgagc tgcgcgggat gctgaagtat gcccaggagc atgctggccc cttcgccatc 1440 cgctatccgc gcggcaacgt ggaacgcgtg ccggaaggca cctggccgga gctgaggtgg 1500 ggcacctggg aacgcttgca agacggcgac gacgtggtga ttctggcggg aggcaaggcg 1560 ctggagtacg cgctgaaggc cgcccgcgac ctccccggcg tgggcgtggt gaatgcccgt 1620 ttcgtgaagc cgctcgacca agggatgctg cgcgaggtgg cgaccaaagc ccgcgcactg 1680 gtcacggtgg aggacaacac ggtcgtcggt gggttcggaa gtgccgtcct ggaagccctc 1740 agcgcgctgg ggctgagaac cccggtgcgg gttctcggca tccccgacgc gtttcaggat 1800 cacgcgaccg tagagagcgt gcatgcccgt gcggggattg acgcgcctgc catccgcacg 1860 gtcctggccg aacttggcgt ggacgtgccg ctggaggtct ag 1902 <210> 58 <211> 633 <212> PRT <213> Artificial Sequence <220> <223> K219N/R241C mutant of the DXP synthase from D. geothermalis <400> 58 Met Ser Glu Pro Thr Ala Asn Leu Gln Pro Ala Ser Arg Thr Pro Leu 1 5 10 15 Leu Asp Arg Val Asn Gly Pro Glu Asp Leu Lys Arg Leu Gly Arg Asp 20 25 30 Gln Leu Pro Gln Leu Ala Ala Glu Leu Arg Glu Glu Ile Val Arg Val 35 40 45 Cys Ser Val Gly Gly Leu His Leu Ala Ser Ser Leu Gly Ala Thr Asp 50 55 60 Leu Ile Val Ala Leu His Tyr Val Leu His Ser Pro Arg Asp Arg Ile 65 70 75 80 Leu Phe Asp Val Gly His Gln Ala Tyr Ala His Lys Met Leu Thr Gly 85 90 95 Arg Arg His Leu Met His Thr Val Lys Lys Glu Gly Gly Leu Ser Gly 100 105 110 Phe Thr Lys Val Ser Glu Ser Glu His Asp Ala Ile Thr Val Gly His 115 120 125 Ala Ser Thr Ser Leu Ala Asn Ala Leu Gly Met Ala Leu Ala Arg Asp 130 135 140 Ala Leu Gly Gln Asp Tyr Lys Val Ala Ala Val Ile Gly Asp Gly Ser 145 150 155 160 Leu Thr Gly Gly Met Ala Leu Ala Ala Leu Asn Thr Ile Gly Asp Leu 165 170 175 Gly Arg Arg Met Leu Ile Val Leu Asn Asp Asn Glu Met Ser Ile Ser 180 185 190 Glu Asn Val Gly Ala Ile Asn Arg Phe Met Arg Gly Leu Gln Val Gln 195 200 205 Lys Trp Phe Gln Glu Gly Glu Glu Ala Gly Asn Lys Ala Val Gln Ala 210 215 220 Val Ser Lys Pro Leu Ala Asn Leu Met Ser Arg Ala Lys Ser Ser Thr 225 230 235 240 Cys His Phe Phe Asp Pro Ala Ser Val Asn Pro Phe Ala Ala Met Gly 245 250 255 Val Arg Tyr Val Gly Pro Val Asp Gly His Asn Val Gln Glu Leu Val 260 265 270 Trp Leu Ile Glu Arg Leu Val Asp Leu Asp Gly Pro Thr Ile Leu His 275 280 285 Val Val Thr Lys Lys Gly Lys Gly Leu Ser Tyr Ala Glu Ala Asp Pro 290 295 300 Ile Lys Trp His Gly Pro Gly Lys Phe Asp Pro Ala Thr Gly Glu Ser 305 310 315 320 Val Pro Ser Asn Ala Tyr Ser Trp Ser Ser Ala Phe Gly Asp Ala Val 325 330 335 Thr Glu Leu Ala Arg Leu Asp Pro Arg Thr Phe Val Ile Thr Pro Ala 340 345 350 Met Arg Glu Gly Ser Gly Leu Val Arg Tyr Ser Gln Val His Pro His 355 360 365 Arg Tyr Leu Asp Val Gly Ile Ala Glu Asp Val Ala Val Thr Thr Ala 370 375 380 Ala Gly Met Ala Leu Gln Gly Met Arg Pro Ile Val Ala Ile Tyr Ser 385 390 395 400 Thr Phe Leu Gln Arg Ala Tyr Asp Gln Val Leu His Asp Val Ala Ile 405 410 415 Glu Asn Leu Asn Val Thr Phe Ala Ile Asp Arg Gly Gly Ile Val Gly 420 425 430 Ala Asp Gly Ala Thr His Asn Gly Val Phe Asp Leu Ser Tyr Leu Arg 435 440 445 Ser Ile Pro Asn Val Gly Ile Gly Leu Pro Lys Asp Ala Ala Glu Leu 450 455 460 Arg Gly Met Leu Lys Tyr Ala Gln Glu His Ala Gly Pro Phe Ala Ile 465 470 475 480 Arg Tyr Pro Arg Gly Asn Val Glu Arg Val Pro Glu Gly Thr Trp Pro 485 490 495 Glu Leu Arg Trp Gly Thr Trp Glu Arg Leu Gln Asp Gly Asp Asp Val 500 505 510 Val Ile Leu Ala Gly Gly Lys Ala Leu Glu Tyr Ala Leu Lys Ala Ala 515 520 525 Arg Asp Leu Pro Gly Val Gly Val Val Asn Ala Arg Phe Val Lys Pro 530 535 540 Leu Asp Gln Gly Met Leu Arg Glu Val Ala Thr Lys Ala Arg Ala Leu 545 550 555 560 Val Thr Val Glu Asp Asn Thr Val Val Gly Gly Phe Gly Ser Ala Val 565 570 575 Leu Glu Ala Leu Ser Ala Leu Gly Leu Arg Thr Pro Val Arg Val Leu 580 585 590 Gly Ile Pro Asp Ala Phe Gln Asp His Ala Thr Val Glu Ser Val His 595 600 605 Ala Arg Ala Gly Ile Asp Ala Pro Ala Ile Arg Thr Val Leu Ala Glu 610 615 620 Leu Gly Val Asp Val Pro Leu Glu Val 625 630 <210> 59 <211> 1911 <212> DNA <213> Deinococcus radiopugnans <400> 59 ttgaccgaca tcaaaaaggc tgatgggctg cacctcgggc acaagggcac gccgctgctg 60 gaccgcattg ccggcccggc tgacctcaag aagctctcgc gcgatcagtt gcccgagctg 120 agccaggaac tgcgcgacga gatcgtgcgg gtctgctcgg tgggtgggct gcatctggcg 180 tcctcgctgg gggccaccga cctgatcgtg gcgctgcatt acgtgctgaa cagtccgcgt 240 gaccggattc tcttcgacgt gggtcaccag gcctacgccc acaagatgct gaccgggcgg 300 cgggagcaga tgcacaccgt caagaaggaa ggtgggctga gcggctttac caaggtcagc 360 gagtccgaac acgacgccat taccgtgggc cacgccagca ccagcctggc gaacgcgctg 420 ggcatggcga tggcgagaga cgcgctgggc caggactatc aggtggccgc cgtgatcggc 480 gacggctcgc tgaccggcgg gatggcgctg gccgccctga acaccatcgg tgacctgcgc 540 cgcaagatgc tgatcgtcct gaacgacaac gagatgagca tttccgagaa cgtgggcgcg 600 atcaacaagt tcatgcgcgg cctgcaggtc cagaagtggt ttcaggaggg cgagggagcc 660 gggaaaaagg cggtgcagtc cctgagcaag ccgctggccg atttcatgag ccgtgccaag 720 agcagcaccc gccacttctt cgatccggcc agcgtcaatc ccttcgccat gatgggcgtg 780 cgttatgtcg gcccggtcga cggccacaac gtccaggaac tggtgtggct gatggaacgg 840 ctggtggacc tggacggccc cacgatcctg catgtcgtga cccgcaaggg caagggcctg 900 agctacgccg aggccgaccc gatctactgg cacggtcccg gtcaatttga cccggacacc 960 ggggatttca aggccagcag cgcgtactcg tggagcgccg cgttcggcga cgccgtgacc 1020 gaactggcca aacgcgatcc gcgtactttc gtgatcaccc cggccatgcg cgagggcagc 1080 gggctggtgg gctacagccg ggcgcacccg caccgttacc tggacgtggg catcgccgag 1140 gacgtggccg tgaccactgc cgccggcatg gcgttgcagg gcctgcggcc catcgtggcg 1200 atctactcca ccttcctgca acgcgcctac gatcaggtgt tgcacgacgt cgccatcgag 1260 aacctgaacg tcaccttcgc catcgaccgc gccgggatcg tgggggccga cggctcgacg 1320 cacaacggcg tgttcgacct gagctacctg cgcagcattc ccaacgtgcg gatcggcctg 1380 ccgaaggacg cccacgagat gcgcggcatg ctgaagtacg cgcaggagca cgacggtccc 1440 ttcgccatcc gttacccgcg cggcaacacg gtcaaggtgc cggaaggcac gtggcccacg 1500 ctggaatggg gcacgtggga gcgcgtcaag gaaggctccg acgccgtgat cctggccggc 1560 ggcaaggcgc tggaatacgc gcaggcggcg gcggcggacc tgcccggcgt cggtgtggtg 1620 aacgcccgtt tcgtcaagcc gctggacctg aacatgctgc gcgagctggc cggcagcgcc 1680 cgcacaatca tcaccgtgga ggacaacacg ctggtgggcg gcttcggcag cgccgtgttg 1740 gaggccctga acagcatggg cttaaaggtg cccgtgcgga cgctgggcat tccggacgag 1800 ttccaggacc acgccaccgc cgagagcgtc cacgcccgcg ccggcatcga tgcccaggcg 1860 atccgcaccg tgctggccga gcttggggtg gatgtgcctc tgggcgtctg a 1911 <210> 60 <211> 1146 <212> DNA <213> Deinococcus radiopugnans <400> 60 ttgggcagca cgggcagcat cggcacgcag gcgctggatg tggcgcgcga gcgtggctac 60 acggtgacgg cgctggccgc cgggcgcaac ctggcgctgt tgcagcagca ggtgcgtgag 120 tttcgcccgg cgctggtcag cgtggagccg gcggtgtacg ccgaggccaa ggcgctgctg 180 cccggcaccc gcgtaaccgc ccacgtcagc gaggtggcgg ccctgaaagc tgatgtggtg 240 gtcaacgcca tgagcggttt aatcgggctg gcccccaccc gcgccgcact tcaggcgggt 300 caggcggtgg cgctggcgac gaaggaggcg atggtcacgg cggcgggcct gatctgggag 360 gcggcctcgg cgggcggcgg gcgcgtggtc ccggtggact ccgaacacac cggcgtcttc 420 cagtgcctga ccggcgagga catggcggac gtggccgaag tgatcctgac cgcctccggc 480 ggccccttcc gcgacggccc cgccgatctg ggcggggtga cgcccgcgca ggcgctgaag 540 cacccgtcgt ggagcatggg gccgaaggtg accatcgaca gcgccaccct gatgaacaag 600 gggctggagg tcatggagtg cgccagcctg tacggcctgc cgctgtctgg ggtgggcgtg 660 gtggtccacc cgcagagcct gatccacgcg gcggtgcgct tccgcgacgg cagcctcaag 720 gcgcagttcg gccccaccga catgcgcctg ccgattgcct acgccatcga cgccgcgccc 780 accggcatgc agcgccccgg cgacgtgcgg ggtgccagac gcgggccgga ggtggccggg 840 cacctgtcct ggccgatgcg gggcatgtgg gagttccgcg agcccgattt tgaccgcttt 900 ccctgcctgg gcctggccta ccgcgccgga gaggcgggcg gtctgctgcc ggtggccctg 960 aacgcggcgg acgaggtggc agtggaggcg ttcctggccg ggcaactgcc gttcatgggt 1020 atccccaggc tgctggagcg ggtgctggac gagacgccgg cgggcgccct gagctgggac 1080 acgctggacg agaccgacgc ctgggcacgc gtgcgggcct gggaactggt ggggatgcgg 1140 gcgtga 1146 <210> 61 <211> 381 <212> PRT <213> Deinococcus radiopugnans <400> 61 Leu Gly Ser Thr Gly Ser Ile Gly Thr Gln Ala Leu Asp Val Ala Arg 1 5 10 15 Glu Arg Gly Tyr Thr Val Thr Ala Leu Ala Ala Gly Arg Asn Leu Ala 20 25 30 Leu Leu Gln Gln Gln Val Arg Glu Phe Arg Pro Ala Leu Val Ser Val 35 40 45 Glu Pro Ala Val Tyr Ala Glu Ala Lys Ala Leu Leu Pro Gly Thr Arg 50 55 60 Val Thr Ala His Val Ser Glu Val Ala Ala Leu Lys Ala Asp Val Val 65 70 75 80 Val Asn Ala Met Ser Gly Leu Ile Gly Leu Ala Pro Thr Arg Ala Ala 85 90 95 Leu Gln Ala Gly Gln Ala Val Ala Leu Ala Thr Lys Glu Ala Met Val 100 105 110 Thr Ala Ala Gly Leu Ile Trp Glu Ala Ala Ser Ala Gly Gly Gly Arg 115 120 125 Val Val Pro Val Asp Ser Glu His Thr Gly Val Phe Gln Cys Leu Thr 130 135 140 Gly Glu Asp Met Ala Asp Val Ala Glu Val Ile Leu Thr Ala Ser Gly 145 150 155 160 Gly Pro Phe Arg Asp Gly Pro Ala Asp Leu Gly Gly Val Thr Pro Ala 165 170 175 Gln Ala Leu Lys His Pro Ser Trp Ser Met Gly Pro Lys Val Thr Ile 180 185 190 Asp Ser Ala Thr Leu Met Asn Lys Gly Leu Glu Val Met Glu Cys Ala 195 200 205 Ser Leu Tyr Gly Leu Pro Leu Ser Gly Val Gly Val Val Val His Pro 210 215 220 Gln Ser Leu Ile His Ala Ala Val Arg Phe Arg Asp Gly Ser Leu Lys 225 230 235 240 Ala Gln Phe Gly Pro Thr Asp Met Arg Leu Pro Ile Ala Tyr Ala Ile 245 250 255 Asp Ala Ala Pro Thr Gly Met Gln Arg Pro Gly Asp Val Arg Gly Ala 260 265 270 Arg Arg Gly Pro Glu Val Ala Gly His Leu Ser Trp Pro Met Arg Gly 275 280 285 Met Trp Glu Phe Arg Glu Pro Asp Phe Asp Arg Phe Pro Cys Leu Gly 290 295 300 Leu Ala Tyr Arg Ala Gly Glu Ala Gly Gly Leu Leu Pro Val Ala Leu 305 310 315 320 Asn Ala Ala Asp Glu Val Ala Val Glu Ala Phe Leu Ala Gly Gln Leu 325 330 335 Pro Phe Met Gly Ile Pro Arg Leu Leu Glu Arg Val Leu Asp Glu Thr 340 345 350 Pro Ala Gly Ala Leu Ser Trp Asp Thr Leu Asp Glu Thr Asp Ala Trp 355 360 365 Ala Arg Val Arg Ala Trp Glu Leu Val Gly Met Arg Ala 370 375 380 <210> 62 <211> 699 <212> DNA <213> Deinococcus radiopugnans <400> 62 atgagcggcg cctgcctgct gtccggcacc acggcggcgc tgattcccgc cgccggcagc 60 ggcacccgcc tgggcctggg ccacaaggcg ttcgtgacgg tgggcggcct gtccctgctg 120 gcccgcagcg tcgccgccct ggccccgcac gtggacgagg tgctggtggc cctgccggac 180 ggcttggagc ttcccctggg gatcaaggcc cgcgcgattg tcggcggcca gacccgccag 240 gacagcgtgc gccgcctgct gcgcgcgacg gtggccgata ccgtgctggt tcacgacgcg 300 gcgcggcctt tcctgagtgc cgacatcgtc ctcacgctgc tggaggccgt ggcggaaacg 360 ggggcggcga cggtggccct gcccgtcgcc gacacgctgg tgggggcaga cgcaggcgag 420 atgtggggag cggccgtctc ccgcgagggg ctgtggtcgg tgcagacgcc gcagggcttc 480 cgccgcgaac ggctgctgcg ggcgcacgcg caggcggccg ccgacggaca cgtcgccacc 540 gacgacgcgg gcctgatcgc gcggcagggc ggcgcagtgc ggctggtgcg cggcgacacc 600 cggctgttca aggtgaccac ccccggcgac ctggcgctgg cccaggcgct ggctccggtg 660 tgggacgcgc agatgagcgg gggcggcggc ccggtatga 699 <210> 63 <211> 232 <212> PRT <213> Deinococcus radiopugnans <400> 63 Met Ser Gly Ala Cys Leu Leu Ser Gly Thr Thr Ala Ala Leu Ile Pro 1 5 10 15 Ala Ala Gly Ser Gly Thr Arg Leu Gly Leu Gly His Lys Ala Phe Val 20 25 30 Thr Val Gly Gly Leu Ser Leu Leu Ala Arg Ser Val Ala Ala Leu Ala 35 40 45 Pro His Val Asp Glu Val Leu Val Ala Leu Pro Asp Gly Leu Glu Leu 50 55 60 Pro Leu Gly Ile Lys Ala Arg Ala Ile Val Gly Gly Gln Thr Arg Gln 65 70 75 80 Asp Ser Val Arg Arg Leu Leu Arg Ala Thr Val Ala Asp Thr Val Leu 85 90 95 Val His Asp Ala Ala Arg Pro Phe Leu Ser Ala Asp Ile Val Leu Thr 100 105 110 Leu Leu Glu Ala Val Ala Glu Thr Gly Ala Ala Thr Val Ala Leu Pro 115 120 125 Val Ala Asp Thr Leu Val Gly Ala Asp Ala Gly Glu Met Trp Gly Ala 130 135 140 Ala Val Ser Arg Glu Gly Leu Trp Ser Val Gln Thr Pro Gln Gly Phe 145 150 155 160 Arg Arg Glu Arg Leu Leu Arg Ala His Ala Gln Ala Ala Ala Asp Gly 165 170 175 His Val Ala Thr Asp Asp Ala Gly Leu Ile Ala Arg Gln Gly Gly Ala 180 185 190 Val Arg Leu Val Arg Gly Asp Thr Arg Leu Phe Lys Val Thr Thr Pro 195 200 205 Gly Asp Leu Ala Leu Ala Gln Ala Leu Ala Pro Val Trp Asp Ala Gln 210 215 220 Met Ser Gly Gly Gly Gly Pro Val 225 230 <210> 64 <211> 867 <212> DNA <213> Deinococcus radiopugnans <400> 64 atgctggggg gcgtgagcct ccgcaccccc accctgtccc gcaagaccta tctggccccg 60 gccaaggtca atctcggcct gagcgtgcgt gacctgcggg cggatggcta ccacgaactg 120 cacacgctga tggtgctgct ttcggtgggg gatgagctgg agattggccc ggcagccacc 180 ctgaccctgg aggtcagcgg ttcagacctg cctgccgatg aacgcaatct ggtgtaccgc 240 gccgcccgcg cctacctgga cgcggcgggg gtgggggagg gtgcgttcat caccctgcac 300 aagcgtctgc cgctggcctc cgggctgggc ggcggcagca gcgacgcggc caccaccctg 360 atggccctgg cgcggctgta cccgtcgcag gtgtcgctgc ccgaactggc gctgagcctg 420 ggcgcggacg tgcccttctt tctgctgggc caggccgccg ccgccgaggg cgtgggcgaa 480 ctgctggtgc cggtgccggt gccgcgcact gcgctggtgc tggtcaatcc gggcgtggag 540 gtcagcgccc gcgacgccta cgcgtggctg gacgacgagg aagcctttac cccggccctg 600 gacgtgggcg cgatcctggc cgcactgggt ggcgagcggg ccgtgcccta ccacaacgcc 660 ctgcaggact gtgtcagtgc ccgccacgcc cccatccgcg aagctctggc cgcgctgggg 720 gcggcgggtc tacgctcccc cctgatgagc ggttcgggca gcacctgctt cgcgctggcc 780 gccaatgatg ggcaggctta cgacgccgca cgggccattg ccgccgccca tccggagtgg 840 tgggtccagg cggcccagac gttgtaa 867 <210> 65 <211> 288 <212> PRT <213> Deinococcus radiopugnans <400> 65 Met Leu Gly Gly Val Ser Leu Arg Thr Pro Thr Leu Ser Arg Lys Thr 1 5 10 15 Tyr Leu Ala Pro Ala Lys Val Asn Leu Gly Leu Ser Val Arg Asp Leu 20 25 30 Arg Ala Asp Gly Tyr His Glu Leu His Thr Leu Met Val Leu Leu Ser 35 40 45 Val Gly Asp Glu Leu Glu Ile Gly Pro Ala Ala Thr Leu Thr Leu Glu 50 55 60 Val Ser Gly Ser Asp Leu Pro Ala Asp Glu Arg Asn Leu Val Tyr Arg 65 70 75 80 Ala Ala Arg Ala Tyr Leu Asp Ala Ala Gly Val Gly Glu Gly Ala Phe 85 90 95 Ile Thr Leu His Lys Arg Leu Pro Leu Ala Ser Gly Leu Gly Gly Gly 100 105 110 Ser Ser Asp Ala Ala Thr Thr Leu Met Ala Leu Ala Arg Leu Tyr Pro 115 120 125 Ser Gln Val Ser Leu Pro Glu Leu Ala Leu Ser Leu Gly Ala Asp Val 130 135 140 Pro Phe Phe Leu Leu Gly Gln Ala Ala Ala Ala Glu Gly Val Gly Glu 145 150 155 160 Leu Leu Val Pro Val Pro Val Pro Arg Thr Ala Leu Val Leu Val Asn 165 170 175 Pro Gly Val Glu Val Ser Ala Arg Asp Ala Tyr Ala Trp Leu Asp Asp 180 185 190 Glu Glu Ala Phe Thr Pro Ala Leu Asp Val Gly Ala Ile Leu Ala Ala 195 200 205 Leu Gly Gly Glu Arg Ala Val Pro Tyr His Asn Ala Leu Gln Asp Cys 210 215 220 Val Ser Ala Arg His Ala Pro Ile Arg Glu Ala Leu Ala Ala Leu Gly 225 230 235 240 Ala Ala Gly Leu Arg Ser Pro Leu Met Ser Gly Ser Gly Ser Thr Cys 245 250 255 Phe Ala Leu Ala Ala Asn Asp Gly Gln Ala Tyr Asp Ala Ala Arg Ala 260 265 270 Ile Ala Ala Ala His Pro Glu Trp Trp Val Gln Ala Ala Gln Thr Leu 275 280 285 <210> 66 <211> 474 <212> DNA <213> Deinococcus radiopugnans <400> 66 gtggttcgcg tcggttacgg cgaggacgcc caccgactgg cggccggtca ttccctgatt 60 ctaggaggca ttgctgtacc ggacgctgcg ctggggaccg tggcccacag tgacggcgac 120 gccgtgctgc acgcggtggc agacgcgctg ctctcagggg tggcgctggg tgatatcggc 180 gactattttc ccgacaccga tccgctgtgg gctgggctgg attcacgcgc gatcctgggg 240 cgggtgctgg aactggtccg cgagcgcgga tataccccgg tcaacattgc cctggtggtg 300 acgatggaca agccccggct ggggccgctg cgcgcccaga ttgcccgcaa cgtggccgcc 360 ctgctgggcc tgagtgaaag cgaggtgggg gtcagcttca agacctccga ggggctggcc 420 ccggcccatg ttcagacgcg cgtgaccgcg ctgctcacgc agttgcagga ctga 474 <210> 67 <211> 157 <212> PRT <213> Deinococcus radiopugnans <400> 67 Val Val Arg Val Gly Tyr Gly Glu Asp Ala His Arg Leu Ala Ala Gly 1 5 10 15 His Ser Leu Ile Leu Gly Gly Ile Ala Val Pro Asp Ala Ala Leu Gly 20 25 30 Thr Val Ala His Ser Asp Gly Asp Ala Val Leu His Ala Val Ala Asp 35 40 45 Ala Leu Leu Ser Gly Val Ala Leu Gly Asp Ile Gly Asp Tyr Phe Pro 50 55 60 Asp Thr Asp Pro Leu Trp Ala Gly Leu Asp Ser Arg Ala Ile Leu Gly 65 70 75 80 Arg Val Leu Glu Leu Val Arg Glu Arg Gly Tyr Thr Pro Val Asn Ile 85 90 95 Ala Leu Val Val Thr Met Asp Lys Pro Arg Leu Gly Pro Leu Arg Ala 100 105 110 Gln Ile Ala Arg Asn Val Ala Ala Leu Leu Gly Leu Ser Glu Ser Glu 115 120 125 Val Gly Val Ser Phe Lys Thr Ser Glu Gly Leu Ala Pro Ala His Val 130 135 140 Gln Thr Arg Val Thr Ala Leu Leu Thr Gln Leu Gln Asp 145 150 155 <210> 68 <211> 1227 <212> DNA <213> Deinococcus radiopugnans <400> 68 atgatccccc gtcgtcagac cgtcaccgcc aacgtgggag gcgtgttaat cggcagcgcc 60 caccccgtcg tcgtgcagag catgaccaac accgacacgg ccaacgccga ggccaccgcc 120 attcaggtgg cgcaactggc ccgtgcgggc agcgaactgg tgcgcgtgac cgtcaacacc 180 cgcgaggccg ccgccgctgt gcccgaactg attgcccggc tggaggaggt gggcctgagc 240 gtgcccatcg tgggcgactt ccactacaac ggccacatcc tgctgcgcga gtttcccgaa 300 acggcccgtc tgctcgccaa gtaccgcatc aatcccggca acgtgggggc cgggcagcac 360 cacgacgcca acttcgccac catgattgag gtggccaaag agttcgacaa acccgtccgc 420 atcggcgtga actggggcag cctggatcag caggtgcttg cgcggctgat ggacgccaac 480 gccgcgaagg gcagccccaa atccggcact gacgtgatga tcgacgcgat ggtggtctcc 540 gcgctggaaa gtgccgccta cgccgaggag ctggggctgg cccacgacaa gatcctgatc 600 tcggtcaagg tgtccagcgc gcccgaactg tggcaggtgt accgccaact ggccgcccag 660 tgtgactacc cgctgcacct gggcctgacc gaggcgggca tgggcatgaa aggcatcgtg 720 gcctcatcgg tggccctcgc cccgctgctg accgagggca tcggcgacac catccgcgtg 780 tccctgaccc ccgaacccgg cgcctcgcgc aagctggagg tggaggtggc gcagcagatt 840 ctgcaaagcc tgggcatccg ccagttcgcg ccgcaggtca ccagttgccc cggctgcggg 900 cgcaccacgt ccattttctt tcaggaattg gcgcagaaga tccaggacta catccgcgac 960 accatgcccg actggaaggt caagtatccg ggggtggagg acatgcaggt ggccgtgatg 1020 ggctgcatcg tcaacggccc tggcgagagc aagcacgcca atatcgggat ttccctgccc 1080 ggcacggggg aagacccgcg cgccccggtg taccaggacg gcaaactgct gaccaccctg 1140 aaaggcccgc gcattgccga ggagtttcaa gaattgctgg aagcgtacgt agagcggcgg 1200 tatggagaag aacctgtttc gagctga 1227 <210> 69 <211> 408 <212> PRT <213> Deinococcus radiopugnans <400> 69 Met Ile Pro Arg Arg Gln Thr Val Thr Ala Asn Val Gly Gly Val Leu 1 5 10 15 Ile Gly Ser Ala His Pro Val Val Val Gln Ser Met Thr Asn Thr Asp 20 25 30 Thr Ala Asn Ala Glu Ala Thr Ala Ile Gln Val Ala Gln Leu Ala Arg 35 40 45 Ala Gly Ser Glu Leu Val Arg Val Thr Val Asn Thr Arg Glu Ala Ala 50 55 60 Ala Ala Val Pro Glu Leu Ile Ala Arg Leu Glu Glu Val Gly Leu Ser 65 70 75 80 Val Pro Ile Val Gly Asp Phe His Tyr Asn Gly His Ile Leu Leu Arg 85 90 95 Glu Phe Pro Glu Thr Ala Arg Leu Leu Ala Lys Tyr Arg Ile Asn Pro 100 105 110 Gly Asn Val Gly Ala Gly Gln His His Asp Ala Asn Phe Ala Thr Met 115 120 125 Ile Glu Val Ala Lys Glu Phe Asp Lys Pro Val Arg Ile Gly Val Asn 130 135 140 Trp Gly Ser Leu Asp Gln Gln Val Leu Ala Arg Leu Met Asp Ala Asn 145 150 155 160 Ala Ala Lys Gly Ser Pro Lys Ser Gly Thr Asp Val Met Ile Asp Ala 165 170 175 Met Val Val Ser Ala Leu Glu Ser Ala Ala Tyr Ala Glu Glu Leu Gly 180 185 190 Leu Ala His Asp Lys Ile Leu Ile Ser Val Lys Val Ser Ser Ala Pro 195 200 205 Glu Leu Trp Gln Val Tyr Arg Gln Leu Ala Ala Gln Cys Asp Tyr Pro 210 215 220 Leu His Leu Gly Leu Thr Glu Ala Gly Met Gly Met Lys Gly Ile Val 225 230 235 240 Ala Ser Ser Val Ala Leu Ala Pro Leu Leu Thr Glu Gly Ile Gly Asp 245 250 255 Thr Ile Arg Val Ser Leu Thr Pro Glu Pro Gly Ala Ser Arg Lys Leu 260 265 270 Glu Val Glu Val Ala Gln Gln Ile Leu Gln Ser Leu Gly Ile Arg Gln 275 280 285 Phe Ala Pro Gln Val Thr Ser Cys Pro Gly Cys Gly Arg Thr Thr Ser 290 295 300 Ile Phe Phe Gln Glu Leu Ala Gln Lys Ile Gln Asp Tyr Ile Arg Asp 305 310 315 320 Thr Met Pro Asp Trp Lys Val Lys Tyr Pro Gly Val Glu Asp Met Gln 325 330 335 Val Ala Val Met Gly Cys Ile Val Asn Gly Pro Gly Glu Ser Lys His 340 345 350 Ala Asn Ile Gly Ile Ser Leu Pro Gly Thr Gly Glu Asp Pro Arg Ala 355 360 365 Pro Val Tyr Gln Asp Gly Lys Leu Leu Thr Thr Leu Lys Gly Pro Arg 370 375 380 Ile Ala Glu Glu Phe Gln Glu Leu Leu Glu Ala Tyr Val Glu Arg Arg 385 390 395 400 Tyr Gly Glu Glu Pro Val Ser Ser 405 <210> 70 <211> 996 <212> DNA <213> Deinococcus radiopugnans <400> 70 atggttgagc gcctgtatct ggccaagccg cgaggcttct gcgcgggcgt ggtcatggcc 60 atcggcgccg tggagcgcgc cgcgcagacc gaggacaaac ccgtcaccgt ctaccactcg 120 attgtccaca accacaccgt ggtggaccgg ctggcccgag atcacagcgt gcatttcgtg 180 gagaatctgg acgacgtgga agctttgccg gggggcggcg acaccgtggt gttctccgcg 240 cacggcatca gcccgctggt gcgcgaacgg gcgcgggcgc tggggttgag taccatcgac 300 gccacctgcc cgctggtcac caaggtccac accgaggcca agaagtacgc ccgcgagggc 360 cacaccatcc tgctgatcgg cgacagcgcc cagcatcagg aggtgatcgg cacgcgcggc 420 gaggccccgg accacaccat tctggtgggc gtgctgggca agagcggtga ggggctgcac 480 gacccgcaca cggtcacggt gccggacccc gaaaagttgg tggtcctgac ccagacgacc 540 ctgagcgtgg acgacacgcg gcgcacggtg gacattctca aggcccgctt tccgaagctg 600 atcgtgccgc ccagcgagga cctgtgctac gccaccaaga accgccagga cgccgtgaaa 660 gccatcgcgc ccaacgtgga cgcctttctg gtcctgacca gcacccactc cagcaacggc 720 atgcgcctgc tggaactggc cgccgagacg tgtgggcggg ccgagcgcct ggaaaacgca 780 gatgatctgg cgggccttga tctgggcggc gtgaaggcca tcggcatcac cagcgcggcc 840 agcacccccg acgatctggt gcaggccgtg gtggcccatt tccgcgccct gaacccgggg 900 ttgcaggtga tcgaggaggg cgagtgggag aacatcgagt tccgcgagcc gaagaagatt 960 ctgccgggtc agcctttgcc gcgcacgatg ggctga 996 <210> 71 <211> 331 <212> PRT <213> Deinococcus radiopugnans <400> 71 Met Val Glu Arg Leu Tyr Leu Ala Lys Pro Arg Gly Phe Cys Ala Gly 1 5 10 15 Val Val Met Ala Ile Gly Ala Val Glu Arg Ala Ala Gln Thr Glu Asp 20 25 30 Lys Pro Val Thr Val Tyr His Ser Ile Val His Asn His Thr Val Val 35 40 45 Asp Arg Leu Ala Arg Asp His Ser Val His Phe Val Glu Asn Leu Asp 50 55 60 Asp Val Glu Ala Leu Pro Gly Gly Gly Asp Thr Val Val Phe Ser Ala 65 70 75 80 His Gly Ile Ser Pro Leu Val Arg Glu Arg Ala Arg Ala Leu Gly Leu 85 90 95 Ser Thr Ile Asp Ala Thr Cys Pro Leu Val Thr Lys Val His Thr Glu 100 105 110 Ala Lys Lys Tyr Ala Arg Glu Gly His Thr Ile Leu Leu Ile Gly Asp 115 120 125 Ser Ala Gln His Gln Glu Val Ile Gly Thr Arg Gly Glu Ala Pro Asp 130 135 140 His Thr Ile Leu Val Gly Val Leu Gly Lys Ser Gly Glu Gly Leu His 145 150 155 160 Asp Pro His Thr Val Thr Val Pro Asp Pro Glu Lys Leu Val Val Leu 165 170 175 Thr Gln Thr Thr Leu Ser Val Asp Asp Thr Arg Arg Thr Val Asp Ile 180 185 190 Leu Lys Ala Arg Phe Pro Lys Leu Ile Val Pro Pro Ser Glu Asp Leu 195 200 205 Cys Tyr Ala Thr Lys Asn Arg Gln Asp Ala Val Lys Ala Ile Ala Pro 210 215 220 Asn Val Asp Ala Phe Leu Val Leu Thr Ser Thr His Ser Ser Asn Gly 225 230 235 240 Met Arg Leu Leu Glu Leu Ala Ala Glu Thr Cys Gly Arg Ala Glu Arg 245 250 255 Leu Glu Asn Ala Asp Asp Leu Ala Gly Leu Asp Leu Gly Gly Val Lys 260 265 270 Ala Ile Gly Ile Thr Ser Ala Ala Ser Thr Pro Asp Asp Leu Val Gln 275 280 285 Ala Val Val Ala His Phe Arg Ala Leu Asn Pro Gly Leu Gln Val Ile 290 295 300 Glu Glu Gly Glu Trp Glu Asn Ile Glu Phe Arg Glu Pro Lys Lys Ile 305 310 315 320 Leu Pro Gly Gln Pro Leu Pro Arg Thr Met Gly 325 330 <210> 72 <211> 504 <212> DNA <213> Deinococcus radiopugnans <400> 72 atggtgcagg ctctggaatg gctcgatctg gtagacgaga atgatcaggt ggtcggccag 60 atcacccgtg acgacgcctg ggcacagcgg cgggcagtgc ggatggtcaa cgcctttctg 120 gtcaaccggc gcggtgagct gtggattccg cgccgcaccg cctccaaacg gatgtttccc 180 aactgtctga atatgagcgt gggaggccac gtcgaacgcg gcgaaaccta tctcagcgcc 240 ttcaagcgcg agacgcacga ggaactgaat ctgaacgtgg acgcgctgga ctggcggaaa 300 atcgccgcct tttcgccgtt cgagacggga ctgagcagct tcatgcgcgt ctatgagatc 360 aggactgacg ccgcgcacga cttcaattcc gccgacttca gcgaggcgtg gtggctgacg 420 cccgccgaac tgctggactg gattgaggcg ggcgaaccgg ccaagggtga tctggccgag 480 ctggtgcggc ggtgctttcc atga 504 <210> 73 <211> 167 <212> PRT <213> Deinococcus radiopugnans <400> 73 Met Val Gln Ala Leu Glu Trp Leu Asp Leu Val Asp Glu Asn Asp Gln 1 5 10 15 Val Val Gly Gln Ile Thr Arg Asp Asp Ala Trp Ala Gln Arg Arg Ala 20 25 30 Val Arg Met Val Asn Ala Phe Leu Val Asn Arg Arg Gly Glu Leu Trp 35 40 45 Ile Pro Arg Arg Thr Ala Ser Lys Arg Met Phe Pro Asn Cys Leu Asn 50 55 60 Met Ser Val Gly Gly His Val Glu Arg Gly Glu Thr Tyr Leu Ser Ala 65 70 75 80 Phe Lys Arg Glu Thr His Glu Glu Leu Asn Leu Asn Val Asp Ala Leu 85 90 95 Asp Trp Arg Lys Ile Ala Ala Phe Ser Pro Phe Glu Thr Gly Leu Ser 100 105 110 Ser Phe Met Arg Val Tyr Glu Ile Arg Thr Asp Ala Ala His Asp Phe 115 120 125 Asn Ser Ala Asp Phe Ser Glu Ala Trp Trp Leu Thr Pro Ala Glu Leu 130 135 140 Leu Asp Trp Ile Glu Ala Gly Glu Pro Ala Lys Gly Asp Leu Ala Glu 145 150 155 160 Leu Val Arg Arg Cys Phe Pro 165

Claims (22)

  1. 하기를 포함하는, 테르펜 또는 테르페노이드를 생산하는 방법:
    (i) 1-데옥시크실룰로즈 5-포스페이트 신타제(Deoxyxylulose-5-phosphate synthase: DXS) 활성 및/또는 이소펜테닐 피로포스파타제 이소머라제(isopentenyl pyrophosphatase(IPP) isomerase) 활성을 증가시키도록 유전적으로 변형된 재조합 데이노코쿠스 박테리아(recombinant Deinococcus bacterium)를 테르펜 또는 테르페노이드를 생산하는데 적합한 조건하에서 배양하는 단계, 및 임의로 (ii) 테르펜 또는 테르페노이드를 회수하는 단계.
  2. 제1항에 있어서,
    재조합 데이노코쿠스 박테리아가 천연의, 동종 또는 이종 idi 유전자를 과발현하는, 방법.
  3. 제1항 또는 제2항에 있어서,
    재조합 데이노코쿠스 박테리아가 천연의, 동종 또는 이종 dxs 유전자를 과발현하는, 방법.
  4. 제1항 내지 제3항 중 어느 한 항에 있어서,
    재조합 데이노코쿠스 박테리아가 증진된 DXS 효소를 발현하는 방법.
  5. 제4항에 있어서,
    증진된 DXS 효소가 서열 번호 52의 244번 위치에 상응하는 위치에서 시스테인을 포함하는 돌연변이 DXS인 방법.
  6. 제4항에 있어서,
    재조합 데이노코쿠스 박테리아가 디. 라디오푸그난스(D. radiopugnans)로부터의 DXP 신타제의 R244C 돌연변이를 암호화하는 유전자(서열 번호 8), 디. 윤웨이엔시스(D. yunweiensis)로부터의 DXP 신타제의 R238C 돌연변이를 암호화하는 유전자(서열 번호 14), 또는 디. 게오테르말리스(D. geothermalis)로부터의 DXP 신타제의 R241C 돌연변이를 암호화하는 유전자(서열 번호 56)를 발현하는, 방법.
  7. 제1항 내지 제6항 중 어느 한 항에 있어서,
    재조합 데이노코쿠스 박테리아가 증진된 DXS 효소를 발현하고 천연의, 동종 또는 이종 idi 유전자를 과발현하는, 방법.
  8. 제1항 내지 제7항 중 어느 한 항에 있어서,
    재조합 데이노코쿠스 박테리아가 FPP 신타제를 암호화하는 천연의, 동종 또는 이종 유전자를 과발현하는, 방법.
  9. 제8항에 있어서,
    FPP 신타제를 암호화하는 유전자가:
    a) 서열 번호 47의 아미노산 서열의 전부 또는 이의 활성 부분을 포함하는 폴리펩타이드;
    b) 서열 번호 47에 대해 적어도 60, 65, 70, 75, 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98 또는 99% 서열 상동성을 갖는 아미노산 서열을 갖는 폴리펩타이드;
    c) 서열 번호 46에 대해 적어도 60, 65, 70, 75, 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98 또는 99% 서열 상동성을 갖는 뉴클레오타이드 서열에 의해 암호화된 폴리펩타이드; 또는
    d) (i) 서열 번호 46에서 설정된 핵산 서열, (ii) 이의 상보성 쇄(strand), 또는 (iii) (i) 또는 (ii)의 서브서열(subsequence)과, 중간/높은 스트링전시(stringency), 바람직하게는 높거나 매우 높은 조건, 하에서, 하이브리드화할 수 있는 핵산 서열에 의해 암호화된 폴리펩타이드
    로 이루어진 그룹으로부터 선택된 폴리펩타이드를 암호화하는, 방법.
  10. 제8항 또는 제9항에 있어서,
    FPP 신타제가 디메틸알릴트랜스퍼라제(dimethylallyltransferase) 활성 및/또는 게라닐게라닐 디포스페이트 신타제(geranylgeranyl diphosphate synthase) 활성을 추가로 나타내는, 방법.
  11. 제1항 내지 제10항 중 어느 한 항에 있어서,
    재조합 데이노코쿠스 박테리아 내에서, 천연의, 동종 또는 이종 dxr , ispD , ispE , ispF, ispG ispH 유전자로 이루어진 그룹으로부터 선택된 적어도 하나의 유전자가 과발현되는, 방법.
  12. 제1항 내지 제11항 중 어느 한 항에 있어서,
    재조합 데이노코쿠스 박테리아가 이종 테르펜 신타제를 암호화하는 유전자를 추가로 포함하는, 방법.
  13. 제12항에 있어서,
    이종 테르펜 신타제가 모노테르펜 신타제, 디테르펜 신타제, 트리테르펜 신타제 및 세스퀴테르펜 신타제로 이루어진 그룹으로부터 선택되는, 방법.
  14. 제12항 또는 제13항에 있어서,
    이종 테르펜 신타제가 모노테르펜 신타제, 바람직하게는 게라니올 신타제(geraniol synthase), 시네올 신타제(cineole synthase), 리모넨 신타제(limonene synthase), 또는 리날룰 신타제(linalool synthase)인, 방법.
  15. 제12항 또는 제13항에 있어서,
    이종 테르펜 신타제가 세스퀴테르펜 신타제, 바람직하게는 (+)-에피-알파-비스알볼올 신타제(epi-alpha-bisabolol synthase)인, 방법.
  16. 제1항 내지 제15항 중 어느 한 항에 있어서,
    재조합 데이노코쿠스 박테리아 내에서, 라이코펜 베타-사이클라제(lycopene beta-cyclase)를 암호화하는 유전자가 불활성화되는, 방법.
  17. 제1항 내지 제16항 중 어느 한 항에 있어서,
    테르펜 또는 테르페노이드가 모노테르펜, 디테르펜, 트리테르펜, 세스퀴테르펜 및 카로테노이드로부터 선택되는, 방법.
  18. 제1항 내지 제17항 중 어느 한 항에 있어서,
    테르펜 또는 테르페노이드가 세스퀴테르펜인, 방법.
  19. 제1항 내지 제17항 중 어느 한 항에 있어서,
    테르펜 또는 테르페노이드가 카로테노이드인, 방법.
  20. 제19항에 있어서,
    카로테노이드가 라이코펜 또는 라이코펜으로부터 유도된 임의의 다른 카로테노이드 화합물인, 방법.
  21. 제19항 또는 제20항에 있어서,
    카로테노이드가 디이녹산틴(deinoxanthine)인, 방법.
  22. 제1항 내지 제16항 중 어느 한 항에서 정의된 바와 같은, 재조합 데이노코쿠스 박테리아.
KR1020177001110A 2014-06-13 2015-06-15 테르펜 또는 테르페노이드의 생산 방법 KR20170018051A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP14305907.9 2014-06-13
EP14305907 2014-06-13
PCT/EP2015/063335 WO2015189428A1 (en) 2014-06-13 2015-06-15 Method of producing terpenes or terpenoids

Publications (1)

Publication Number Publication Date
KR20170018051A true KR20170018051A (ko) 2017-02-15

Family

ID=51033096

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020177001110A KR20170018051A (ko) 2014-06-13 2015-06-15 테르펜 또는 테르페노이드의 생산 방법

Country Status (8)

Country Link
US (2) US10900060B2 (ko)
EP (1) EP3155103A1 (ko)
JP (2) JP6983512B2 (ko)
KR (1) KR20170018051A (ko)
CN (1) CN106574289A (ko)
CA (1) CA2950992A1 (ko)
IL (1) IL249119B (ko)
WO (1) WO2015189428A1 (ko)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20170139959A (ko) * 2016-06-10 2017-12-20 경상대학교산학협력단 터펜 알코올 또는 그 유도체의 제조 방법
KR102214150B1 (ko) * 2020-09-04 2021-02-08 주식회사 라비오 데이노잔틴 발효추출물의 제조방법 및 데이노잔틴 발효추출물을 포함하는 화장료 조성물

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3259359B1 (en) 2015-02-16 2020-11-18 Deinove L-arabinose assimilation pathway and uses thereof
JP6357186B2 (ja) * 2016-03-31 2018-07-11 Jxtgエネルギー株式会社 カロテノイドの製造方法
CA3046436A1 (en) * 2016-12-16 2018-06-21 Deinove Methods of producing phytoene
CN110869500B (zh) 2017-01-26 2023-10-27 马努斯生物合成股份有限公司 用于萜类化合物产物的微生物生产的代谢工程化
GB201701548D0 (en) * 2017-01-31 2017-03-15 Univ Manchester Process for producing monoterpenes
US10662442B2 (en) * 2017-02-03 2020-05-26 Manus Bio Inc. Metabolic engineering for microbial production of terpenoid products
CN107937431A (zh) * 2017-10-28 2018-04-20 国际竹藤中心 一种提高酿酒酵母合成芳樟醇能力的方法
KR20200095534A (ko) 2017-12-07 2020-08-10 지머젠 인코포레이티드 발효에 의한 (6e)-8-히드록시제라니올의 제조를 위해 조작된 생합성 경로
JP2021506316A (ja) 2017-12-21 2021-02-22 ザイマージェン インコーポレイテッド ネペタラクトールオキシドレダクターゼ、ネペタラクトールシンターゼ、及びネペタラクトンを産生する能力がある微生物
GB2612522B (en) * 2018-07-06 2023-08-02 The Regents Of The Univ Of Colorado A Body Corporate Existing Under The Laws Of The State Of Colorad Genetically encoded system for constructing and detecting biologically active agents
CN109913380B (zh) * 2019-03-25 2021-12-10 南京工业大学 生产(-)-α-红没药醇的重组解脂耶氏酵母菌及其构建方法和应用
EP3792353A1 (en) 2019-09-13 2021-03-17 CRAG - Centre de Recerca en Agrigenomica CSIC-IRTA-UB-UAB Artificial chromoplast biogenesis
WO2021151891A1 (en) 2020-01-27 2021-08-05 Deinove Novel phytoene desaturase variants to produce neurosporene and/or zeta-carotene
CN111411101B (zh) * 2020-05-15 2022-05-10 扬州大学 芳樟醇合成酶突变体、重组表达载体及芳樟醇生产工程菌
CN113249282B (zh) * 2021-04-23 2023-06-20 大连大学 一种产β-榄香烯重组菌及其构建方法和用途
WO2023060351A1 (en) * 2021-10-13 2023-04-20 The University Of Western Ontario Genetic engineering with deinococcus radiodurans
WO2024011263A2 (en) * 2022-07-08 2024-01-11 Cibus Us Llc Producing sesquiterpenes and other terpenes using plant-based biomasses

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1900304A (zh) * 1999-07-27 2007-01-24 食品工业发展研究所 代谢控制的工程化
US20040219629A1 (en) 2002-12-19 2004-11-04 Qiong Cheng Increasing carotenoid production in bacteria via chromosomal integration
US7098000B2 (en) * 2003-06-04 2006-08-29 E. I. Du Pont De Nemoure And Company Method for production of C30-aldehyde carotenoids
MX284139B (es) * 2006-05-26 2011-02-18 Amyris Biotechnologies Inc Produccion de isoprenoides.
CA2652801C (en) * 2006-05-26 2018-05-22 Amyris Biotechnologies, Inc. Apparatus for making bio-organic compounds
EP2444415A1 (en) * 2010-10-20 2012-04-25 Genoplante-Valor 1-Deoxy-D-xylulose 5-phosphate synthase alleles responsible for enhanced terpene biosynthesis

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20170139959A (ko) * 2016-06-10 2017-12-20 경상대학교산학협력단 터펜 알코올 또는 그 유도체의 제조 방법
KR102214150B1 (ko) * 2020-09-04 2021-02-08 주식회사 라비오 데이노잔틴 발효추출물의 제조방법 및 데이노잔틴 발효추출물을 포함하는 화장료 조성물
WO2022050559A1 (ko) * 2020-09-04 2022-03-10 주식회사 라비오 데이노잔틴 발효추출물의 제조방법 및 데이노잔틴 발효추출물을 포함하는 화장료 조성물

Also Published As

Publication number Publication date
WO2015189428A1 (en) 2015-12-17
US20170121749A1 (en) 2017-05-04
IL249119A0 (en) 2017-01-31
IL249119B (en) 2021-03-25
US20210147895A1 (en) 2021-05-20
US10900060B2 (en) 2021-01-26
EP3155103A1 (en) 2017-04-19
JP6983512B2 (ja) 2021-12-17
CN106574289A (zh) 2017-04-19
JP2020114230A (ja) 2020-07-30
JP2017517263A (ja) 2017-06-29
CA2950992A1 (en) 2015-12-17

Similar Documents

Publication Publication Date Title
KR20170018051A (ko) 테르펜 또는 테르페노이드의 생산 방법
US11952608B2 (en) Methods for production of oxygenated terpenes
JP7061145B2 (ja) レバウディオサイドdおよびレバウディオサイドmの改良された産生方法
CN110869500B (zh) 用于萜类化合物产物的微生物生产的代谢工程化
Agger et al. Diversity of sesquiterpene synthases in the basidiomycete Coprinus cinereus
CN110869487B (zh) 用于萜类化合物产物的微生物生产的代谢工程化
KR20140057322A (ko) 스테비올 글리코시드의 재조합 생산
TW201412988A (zh) 使用dxp及mva途徑之改良之異戊二烯製造
Günnewich et al. A diterpene synthase from the clary sage Salvia sclarea catalyzes the cyclization of geranylgeranyl diphosphate to (8R)-hydroxy-copalyl diphosphate
JP2022500018A (ja) ロタンドンの微生物生成
KR102469382B1 (ko) 패추롤 및 엘레몰, 및 바람직하게는 또한 포고스톨을 생성하는 테르펜 신타아제
Ghimire et al. Activation of cryptic hop genes from Streptomyces peucetius ATCC 27952 involved in hopanoid biosynthesis
WO2022240995A1 (en) Enzymes, host cells, and methods for production of rotundone and other terpenoids
KR20190097093A (ko) 피토엔의 생산 방법
CA3134729A1 (en) Kaurenoic acid 13-hydroxylase (kah) variants and uses thereof
Chappell et al. Sesquiterpene Synthase Gene and Protein

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E601 Decision to refuse application