KR20220110413A - 신규한 단백질 변이체 및 이를 이용한 l-라이신 생산 방법 - Google Patents

신규한 단백질 변이체 및 이를 이용한 l-라이신 생산 방법 Download PDF

Info

Publication number
KR20220110413A
KR20220110413A KR1020210013694A KR20210013694A KR20220110413A KR 20220110413 A KR20220110413 A KR 20220110413A KR 1020210013694 A KR1020210013694 A KR 1020210013694A KR 20210013694 A KR20210013694 A KR 20210013694A KR 20220110413 A KR20220110413 A KR 20220110413A
Authority
KR
South Korea
Prior art keywords
ala
leu
gly
val
glu
Prior art date
Application number
KR1020210013694A
Other languages
English (en)
Inventor
권나라
Original Assignee
씨제이제일제당 (주)
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 씨제이제일제당 (주) filed Critical 씨제이제일제당 (주)
Priority to KR1020210013694A priority Critical patent/KR20220110413A/ko
Priority to PCT/KR2021/003261 priority patent/WO2022163904A1/ko
Priority to PCT/KR2021/007122 priority patent/WO2022163951A1/ko
Publication of KR20220110413A publication Critical patent/KR20220110413A/ko

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/195Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
    • C07K14/34Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria from Corynebacterium (G)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/74Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora
    • C12N15/77Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora for Corynebacterium; for Brevibacterium
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/0004Oxidoreductases (1.)
    • C12N9/0006Oxidoreductases (1.) acting on CH-OH groups as donors (1.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/0004Oxidoreductases (1.)
    • C12N9/0051Oxidoreductases (1.) acting on a sulfur group of donors (1.8)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/1025Acyltransferases (2.3)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/1085Transferases (2.) transferring alkyl or aryl groups other than methyl groups (2.5)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/1096Transferases (2.) transferring nitrogenous groups (2.6)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/12Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
    • C12N9/1241Nucleotidyltransferases (2.7.7)
    • C12N9/1252DNA-directed DNA polymerase (2.7.7.7), i.e. DNA replicase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P13/00Preparation of nitrogen-containing organic compounds
    • C12P13/04Alpha- or beta- amino acids
    • C12P13/08Lysine; Diaminopimelic acid; Threonine; Valine
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y101/00Oxidoreductases acting on the CH-OH group of donors (1.1)
    • C12Y101/01Oxidoreductases acting on the CH-OH group of donors (1.1) with NAD+ or NADP+ as acceptor (1.1.1)
    • C12Y101/01037Malate dehydrogenase (1.1.1.37)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y108/00Oxidoreductases acting on sulfur groups as donors (1.8)
    • C12Y108/01Oxidoreductases acting on sulfur groups as donors (1.8) with NAD+ or NADP+ as acceptor (1.8.1)
    • C12Y108/01015Mycothione reductase (1.8.1.15)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y203/00Acyltransferases (2.3)
    • C12Y203/03Acyl groups converted into alkyl on transfer (2.3.3)
    • C12Y203/03001Citrate (Si)-synthase (2.3.3.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y205/00Transferases transferring alkyl or aryl groups, other than methyl groups (2.5)
    • C12Y205/01Transferases transferring alkyl or aryl groups, other than methyl groups (2.5) transferring alkyl or aryl groups, other than methyl groups (2.5.1)
    • C12Y205/010543-Deoxy-7-phosphoheptulonate synthase (2.5.1.54)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y206/00Transferases transferring nitrogenous groups (2.6)
    • C12Y206/01Transaminases (2.6.1)
    • C12Y206/01017Succinyldiaminopimelate transaminase (2.6.1.17)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y207/00Transferases transferring phosphorus-containing groups (2.7)
    • C12Y207/07Nucleotidyltransferases (2.7.7)
    • C12Y207/07007DNA-directed DNA polymerase (2.7.7.7), i.e. DNA replicase

Landscapes

  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Biotechnology (AREA)
  • Biomedical Technology (AREA)
  • Microbiology (AREA)
  • Medicinal Chemistry (AREA)
  • Biophysics (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Enzymes And Modification Thereof (AREA)

Abstract

본 출원은 신규한 단백질 변이체, 상기 변이체를 포함하는 코리네박테리움 글루타미쿰 균주 및 상기 균주를 이용한 L-라이신 생산 방법에 관한 것이다.

Description

신규한 단백질 변이체 및 이를 이용한 L-라이신 생산 방법{Novel protein variant and a method for producing L-lysine using the same}
본 출원은 신규한 단백질 변이체, 상기 변이체를 포함하는 코리네박테리움 글루타미쿰 균주 및 상기 균주를 이용한 L- 라이신 생산 방법에 관한 것이다.
L-아미노산 및 기타 유용물질을 생산하기 위하여, 고효율 생산 미생물 및 발효공정기술 개발을 위한 다양한 연구들이 수행되고 있다. 예를 들어, L-라이신 생합성에 관여하는 효소를 코딩하는 유전자의 발현을 증가시키거나 또는 생합성에 불필요한 유전자를 제거하는 것과 같은 목적 물질 특이적 접근 방법이 주로 이용되고 있다(WO2008-082181 A1).
다만, L-라이신의 수요 증가에 따라 효과적인 L-라이신의 생산능 증가를 위한 연구가 여전히 필요한 실정이다.
본 출원의 하나의 목적은 하기 (1) 내지 (13)으로 이루어지는 군에서 선택되는 단백질 변이체를 제공하는 것이다:
(1) 서열번호 3의 220번째 위치에 상응하는 아미노산인 페닐알라닌이 시스테인으로 치환된, 서열번호 1로 기재된 아미노산 서열로 이루어진 내재성 막 수송 단백질 변이체;
(2) 서열번호 7의 43번째 위치에 상응하는 아미노산인 프롤린이 류신으로 치환된, 서열번호 5로 기재된 아미노산 서열로 이루어진 DNA 중합효소 Ⅲ 감마 및 타우 서브유닛 변이체;
(3) 서열번호 11의 33번째 위치에 상응하는 아미노산인 시스테인이 세린으로 치환된, 서열번호 9로 기재된 아미노산 서열로 이루어진 단백질 변이체;
(4) 서열번호 15의 210번째 위치에 상응하는 아미노산인 아스파라긴이 아스파르트산으로 치환된, 서열번호 13로 기재된 아미노산 서열로 이루어진 전사 안티터미네이션 단백질 변이체;
(5) 서열번호 19의 199번째 위치에 상응하는 아미노산인 발린이 메티오닌으로 치환된, 서열번호 17로 기재된 아미노산 서열로 이루어진 ABC 트랜스포터 ATP-결합 단백질 변이체;
(6) 서열번호 23의 272번째 위치에 상응하는 아미노산인 트레오닌이 이소류신으로 치환된, 서열번호 21로 기재된 아미노산 서열로 이루어진 말레이트 디하이드로게나제 변이체;
(7) 서열번호 27의 304번째 위치에 상응하는 아미노산인 아르기닌이 글루타민으로 치환된, 서열번호 25로 기재된 아미노산 서열로 이루어진 프리모솜 조립 단백질 변이체;
(8) 서열번호 31의 169번째 위치에 상응하는 아미노산인 알라닌이 발린으로 치환된, 서열번호 29로 기재된 아미노산 서열로 이루어진 타입 II 시트레이트 신타아제 변이체;
(9) 서열번호 35의 294번째 위치에 상응하는 아미노산인 글루탐산이 라이신으로 치환된, 서열번호 33로 기재된 아미노산 서열로 이루어진 막 단백질 변이체;
(10) 서열번호 39의 358번째 위치에 상응하는 아미노산인 프롤린이 세린으로 치환된, 서열번호 37로 기재된 아미노산 서열로 이루어진 미코티온 리덕타제 변이체;
(11) 서열번호 43의 130번째 위치에 상응하는 아미노산인 글리신이 아스파르트산으로 치환된, 서열번호 41로 기재된 아미노산 서열로 이루어진 Co/Zn/Cd 유출 시스템 컴포넌트 변이체;
(12) 서열번호 47의 382번째 위치에 상응하는 아미노산인 글리신이 시스테인으로 치환된, 서열번호 45으로 기재된 아미노산 서열로 이루어진 DAHP 신타아제 변이체; 및
(13) 서열번호 51의 209번째 위치에 상응하는 아미노산인 프롤린이 류신으로 치환된, 서열번호 49로 기재된 아미노산 서열로 이루어진 N-숙시닐디아미노피멜레이트 아미노트랜스퍼라제 변이체.
본 출원의 다른 하나의 목적은 본 출원의 변이체를 코딩하는 폴리뉴클레오티드를 제공하는 것이다.
본 출원의 또 다른 하나의 목적은 하기 (a) 및 (b)의 단백질 변이체 또는 상기 변이체(하기 (a) 및/또는 (b)의 단백질 변이체)를 코딩하는 폴리뉴클레오티드를 포함하고, L-라이신 생산능을 가진, 코리네박테리움 글루타미쿰(Corynebacterium glutamicum) 균주를 제공하는 것이다:
(a) 서열번호 51의 209번째 위치에 상응하는 아미노산인 프롤린이 류신으로 치환된, 서열번호 49로 기재된 아미노산 서열로 이루어진 N-숙시닐디아미노피멜레이트 아미노트랜스퍼라제 변이체 및
(b) 하기 (1) 내지 (12)로 이루어지는 군에서 선택된 1종 이상의 단백질 변이체:
(1) 서열번호 3의 220번째 위치에 상응하는 아미노산인 페닐알라닌이 시스테인으로 치환된, 서열번호 1로 기재된 아미노산 서열로 이루어진 내재성 막 수송 단백질 변이체;
(2) 서열번호 7의 43번째 위치에 상응하는 아미노산인 프롤린이 류신으로 치환된, 서열번호 5로 기재된 아미노산 서열로 이루어진 DNA 중합효소 Ⅲ 감마 및 타우 서브유닛 변이체;
(3) 서열번호 11의 33번째 위치에 상응하는 아미노산인 시스테인이 세린으로 치환된, 서열번호 9로 기재된 아미노산 서열로 이루어진 단백질 변이체;
(4) 서열번호 15의 210번째 위치에 상응하는 아미노산인 아스파라긴이 아스파르트산으로 치환된, 서열번호 13로 기재된 아미노산 서열로 이루어진 전사 안티터미네이션 단백질 변이체;
(5) 서열번호 19의 199번째 위치에 상응하는 아미노산인 발린이 메티오닌으로 치환된, 서열번호 17로 기재된 아미노산 서열로 이루어진 ABC 트랜스포터 ATP-결합 단백질 변이체;
(6) 서열번호 23의 272번째 위치에 상응하는 아미노산인 트레오닌이 이소류신으로 치환된, 서열번호 21로 기재된 아미노산 서열로 이루어진 말레이트 디하이드로게나제 변이체;
(7) 서열번호 27의 304번째 위치에 상응하는 아미노산인 아르기닌이 글루타민으로 치환된, 서열번호 25로 기재된 아미노산 서열로 이루어진 프리모솜 조립 단백질 변이체;
(8) 서열번호 31의 169번째 위치에 상응하는 아미노산인 알라닌이 발린으로 치환된, 서열번호 29로 기재된 아미노산 서열로 이루어진 타입 II 시트레이트 신타아제 변이체;
(9) 서열번호 35의 294번째 위치에 상응하는 아미노산인 글루탐산이 라이신으로 치환된, 서열번호 33로 기재된 아미노산 서열로 이루어진 막 단백질 변이체;
(10) 서열번호 39의 358번째 위치에 상응하는 아미노산인 프롤린이 세린으로 치환된, 서열번호 37로 기재된 아미노산 서열로 이루어진 미코티온 리덕타제 변이체;
(11) 서열번호 43의 130번째 위치에 상응하는 아미노산인 글리신이 아스파르트산으로 치환된, 서열번호 41로 기재된 아미노산 서열로 이루어진 Co/Zn/Cd 유출 시스템 컴포넌트 변이체; 및
(12) 서열번호 47의 382번째 위치에 상응하는 아미노산인 글리신이 시스테인으로 치환된, 서열번호 45으로 기재된 아미노산 서열로 이루어진 DAHP 신타아제 변이체.
본 출원의 또 다른 하나의 목적은 본 출원의 코리네박테리움 글루타미쿰 균주를 배지에서 배양하는 단계를 포함하는, L-라이신 생산 방법을 제공하는 것이다.
이를 구체적으로 설명하면 다음과 같다. 한편, 본 출원에서 개시된 각각의 설명 및 실시형태는 각각의 다른 설명 및 실시 형태에도 적용될 수 있다. 즉, 본 출원에서 개시된 다양한 요소들의 모든 조합이 본 출원의 범주에 속한다. 또한, 하기 기술된 구체적인 서술에 의하여 본 출원의 범주가 제한된다고 볼 수 없다. 또한, 본 명세서 전체에 걸쳐 다수의 논문 및 특허문헌이 참조되고 그 인용이 표시되어 있다. 인용된 논문 및 특허문헌의 개시 내용은 그 전체로서 본 명세서에 참조로 삽입되어 본 발명이 속하는 기술 분야의 수준 및 본 발명의 내용이 보다 명확하게 설명된다.
본 출원의 하나의 양태는 본 출원의 하나의 목적은 하기 (1) 내지 (13)으로 이루어지는 군에서 선택되는 단백질 변이체를 제공하는 것이다:
(1) 서열번호 3의 220번째 위치에 상응하는 아미노산인 페닐알라닌이 시스테인으로 치환된, 서열번호 1로 기재된 아미노산 서열로 이루어진 내재성 막 수송 단백질 변이체;
(2) 서열번호 7의 43번째 위치에 상응하는 아미노산인 프롤린이 류신으로 치환된, 서열번호 5로 기재된 아미노산 서열로 이루어진 DNA 중합효소 Ⅲ 감마 및 타우 서브유닛 변이체;
(3) 서열번호 11의 33번째 위치에 상응하는 아미노산인 시스테인이 세린으로 치환된, 서열번호 9로 기재된 아미노산 서열로 이루어진 단백질 변이체;
(4) 서열번호 15의 210번째 위치에 상응하는 아미노산인 아스파라긴이 아스파르트산으로 치환된, 서열번호 13로 기재된 아미노산 서열로 이루어진 전사 안티터미네이션 단백질 변이체;
(5) 서열번호 19의 199번째 위치에 상응하는 아미노산인 발린이 메티오닌으로 치환된, 서열번호 17로 기재된 아미노산 서열로 이루어진 ABC 트랜스포터 ATP-결합 단백질 변이체;
(6) 서열번호 23의 272번째 위치에 상응하는 아미노산인 트레오닌이 이소류신으로 치환된, 서열번호 21로 기재된 아미노산 서열로 이루어진 말레이트 디하이드로게나제 변이체;
(7) 서열번호 27의 304번째 위치에 상응하는 아미노산인 아르기닌이 글루타민으로 치환된, 서열번호 25로 기재된 아미노산 서열로 이루어진 프리모솜 조립 단백질 변이체;
(8) 서열번호 31의 169번째 위치에 상응하는 아미노산인 알라닌이 발린으로 치환된, 서열번호 29로 기재된 아미노산 서열로 이루어진 타입 II 시트레이트 신타아제 변이체;
(9) 서열번호 35의 294번째 위치에 상응하는 아미노산인 글루탐산이 라이신으로 치환된, 서열번호 33로 기재된 아미노산 서열로 이루어진 막 단백질 변이체;
(10) 서열번호 39의 358번째 위치에 상응하는 아미노산인 프롤린이 세린으로 치환된, 서열번호 37로 기재된 아미노산 서열로 이루어진 미코티온 리덕타제 변이체;
(11) 서열번호 43의 130번째 위치에 상응하는 아미노산인 글리신이 아스파르트산으로 치환된, 서열번호 41로 기재된 아미노산 서열로 이루어진 Co/Zn/Cd 유출 시스템 컴포넌트 변이체;
(12) 서열번호 47의 382번째 위치에 상응하는 아미노산인 글리신이 시스테인으로 치환된, 서열번호 45으로 기재된 아미노산 서열로 이루어진 DAHP 신타아제 변이체; 및
(13) 서열번호 51의 209번째 위치에 상응하는 아미노산인 프롤린이 류신으로 치환된, 서열번호 49로 기재된 아미노산 서열로 이루어진 N-숙시닐디아미노피멜레이트 아미노트랜스퍼라제 변이체.
본 출원의 변이체는 서열번호 1, 5, 9, 13, 17, 21, 25, 29, 33, 37, 41, 45, 또는 49으로 이루어지는 군에서 선택된 서열번호로 기재된 아미노산 서열을 가지거나 포함하거나, 상기 아미노산 서열로 필수적으로 이루어질(essentially consisting of) 수 있다.
또한, 본 출원의 변이체는 상기 서열번호 1, 5, 9, 13, 17, 21, 25, 29, 33, 37, 41, 45, 또는 48로 기재된 아미노산 서열에서 각각 서열번호 3, 7, 11, 15, 19, 23, 27, 31, 35, 39, 43, 47, 또는 51의 아미노산 서열을 기준으로 각각 220번, 43번, 33번, 210번, 199번, 272번, 304번, 169번, 294번, 358번, 130번, 382번, 또는 209번 위치에 상응하는 아미노산은 시스테인, 류신, 세린, 아스파르트산, 메티오닌, 이소류신, 글루타민, 발린, 라이신, 세린, 아스파르트산, 시스테인, 또는 류신이고, 상기 서열번호 1, 5, 9, 13, 17, 21, 25, 29, 33, 37, 41, 45, 또는 49으로 이루어지는 군에서 선택된 서열번호로 기재된 아미노산 서열과 적어도 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, 99.5%, 99.7% 또는 99.9% 이상의 상동성 또는 동일성을 가지는 아미노산 서열을 포함할 수 있다. 본 출원의 변이체의 각 아미노산 서열, 위치, 및 위치에 상응하는 아미노산 종류에 대한 대응관계를 하기 표 1에 나타내었다. 또한, 이러한 상동성 또는 동일성을 가지며 본 출원의 변이체에 상응하는 효능을 나타내는 아미노산 서열이라면, 일부 서열이 결실, 변형, 치환, 보존적 치환 또는 부가된 아미노산 서열을 갖는 변이체도 본 출원의 범위 내에 포함됨은 자명하다.
  아미노산 서열 위치를 카운팅하기 위해 기준이 되는 아미노산 서열 위치 아미노산 종류
1 서열번호 1 서열번호 3 220 시스테인
2 서열번호 5 서열번호 7 43 류신
3 서열번호 9 서열번호 11 33 세린
4 서열번호 13 서열번호 15 210 아스파르트산
5 서열번호 17 서열번호 19 199 메티오닌
6 서열번호 21 서열번호 23 272 이소류신
7 서열번호 25 서열번호 27 304 글루타민
8 서열번호 29 서열번호 31 169 발린
9 서열번호 33 서열번호 35 294 라이신
10 서열번호 37 서열번호 39 358 세린
11 서열번호 41 서열번호 43 130 아스파르트산
12 서열번호 45 서열번호 47 382 시스테인
13 서열번호 49 서열번호 51 209 류신
예를 들어, 상기 아미노산 서열 N-말단, C-말단 그리고/또는 내부에 본 출원의 변이체의 기능을 변경하지 않는 서열 추가 또는 결실, 자연적으로 발생할 수 있는 돌연변이, 잠재성 돌연변이 (silent mutation) 또는 보존적 치환을 가지는 경우이다.
상기 “보존적 치환(conservative substitution)”은 한 아미노산을 유사한 구조적 및/또는 화학적 성질을 갖는 또 다른 아미노산으로 치환시키는 것을 의미한다. 이러한 아미노산 치환은 일반적으로 잔기의 극성, 전하, 용해도, 소수성, 친수성 및/또는 양친매성(amphipathic nature)에서의 유사성에 근거하여 발생할 수 있다. 통상적으로, 보존적 치환은 단백질 또는 폴리펩티드의 활성에 거의 영향을 미치지 않거나 또는 영향을 미치지 않을 수 있다.
본 출원에서 용어, "변이체(variant)"는 하나 이상의 아미노산이 보존적 치환(conservative substitution) 및/또는 변형(modification)되어 상기 변이체의 변이 전 아미노산 서열과 상이하나 기능(functions) 또는 특성(properties)이 유지되는 폴리펩티드를 지칭한다. 이러한 변이체는 일반적으로 상기 폴리펩티드의 아미노산 서열 중 하나 이상의 아미노산을 변형하고, 상기 변형된 폴리펩티드의 특성을 평가하여 동정(identify)될 수 있다. 즉, 변이체의 능력은 변이 전 폴리펩티드에 비하여 증가되거나, 변하지 않거나, 또는 감소될 수 있다. 또한, 일부 변이체는 N-말단 리더 서열 또는 막전이 도메인(transmembrane domain)과 같은 하나 이상의 부분이 제거된 변이체를 포함할 수 있다. 다른 변이체는 성숙 단백질(mature protein)의 N- 및/또는 C-말단으로부터 일부분이 제거된 변이체를 포함할 수 있다. 상기 용어 “변이체”는 변이형, 변형, 변이형 폴리펩티드, 변이된 단백질, 변이 및 변이체 등의 용어(영문 표현으로는 modification, modified polypeptide, modified protein, mutant, mutein, divergent 등)가 혼용되어 사용될 수 있으며, 변이된 의미로 사용되는 용어라면 이에 제한되지 않는다. 본 출원의 목적상 상기 변이체는 서열번호 3, 7, 11, 15, 19, 23, 27, 31, 35, 39, 43, 47, 또는 51의 아미노산 서열의 220번째, 43번째, 33번째, 210번째, 199번째, 272번째, 304번째, 169번째, 294번째, 358번째, 130번째, 382번째, 또는 209번째 위치에 각각 상응하는 아미노산인 페닐알라닌, 프롤린, 시스테인, 아스파라긴, 발린, 트레오닌, 아르기닌, 알라닌, 글루탐산, 프롤린, 글리신, 글리신, 또는 프롤린이 시스테인, 류신, 세린, 아스파르트산, 메티오닌, 이소류신, 글루타민, 발린, 라이신, 세린, 아스파르트산, 시스테인, 또는 류신으로 각각 치환된, 서열번호 1, 5, 9, 13, 17, 21, 25, 29, 33, 37, 41, 45, 또는 49로 기재된 아미노산 서열을 포함하는 폴리펩티드일 수 있다. 본 출원의 변이체의 각 아미노산 서열, 변이 위치, 위치에 상응하는 치환 전 아미노산, 및 치환 후 아미노산 종류에 대한 대응관계를 하기 표 2에 나타내었다.
  아미노산 서열 위치를 카운팅하기 위해 기준이 되는 아미노산 서열 변이 위치 치환 전 아미노산 종류 치환된 아미노산 종류
1 서열번호 1 서열번호 3 220 페닐알라닌 시스테인
2 서열번호 5 서열번호 7 43 프롤린 류신
3 서열번호 9 서열번호 11 33 시스테인 세린
4 서열번호 13 서열번호 15 210 아스파라긴 아스파르트산
5 서열번호 17 서열번호 19 199 발린 메티오닌
6 서열번호 21 서열번호 23 272 트레오닌 이소류신
7 서열번호 25 서열번호 27 304 아르기닌 글루타민
8 서열번호 29 서열번호 31 169 알라닌 발린
9 서열번호 33 서열번호 35 294 글루탐산 라이신
10 서열번호 37 서열번호 39 358 프롤린 세린
11 서열번호 41 서열번호 43 130 글리신 아스파르트산
12 서열번호 45 서열번호 47 382 글리신 시스테인
13 서열번호 49 서열번호 51 209 프롤린 류신
또한, 변이체는 폴리펩티드의 특성과 2차 구조에 최소한의 영향을 갖는 아미노산들의 결실 또는 부가를 포함할 수 있다. 예를 들면 변이체의 N-말단에는 번역-동시에(co-translationally) 또는 번역-후에(post-translationally) 단백질의 이동(translocation)에 관여하는 시그널(또는 리더) 서열이 컨쥬게이트 될 수 있다. 또한 상기 변이체는 확인, 정제, 또는 합성할 수 있도록 다른 서열 또는 링커와 컨쥬게이트 될 수 있다.
본 출원의 단백질의 변이체를 포함하는, 코리네박테리움 글루타미쿰 균주를 배양하는 경우, 기존 비변형 폴리펩티드를 갖는 미생물에 비해 고수율의 L-라이신 생산이 가능하다.
본 출원에서 용어, ‘상동성 (homology)’ 또는 ‘동일성 (identity)’은 두 개의 주어진 아미노산 서열 또는 염기 서열 상호간 유사한 정도를 의미하며 백분율로 표시될 수 있다. 용어 상동성 및 동일성은 종종 상호교환적으로 이용될 수 있다.
보존된(conserved) 폴리뉴클레오티드 또는 폴리펩티드의 서열 상동성 또는 동일성은 표준 배열 알고리즘에 의해 결정되며, 사용되는 프로그램에 의해 확립된 디폴트 갭 페널티가 함께 이용될 수 있다. 실질적으로, 상동성을 갖거나(homologous) 또는 동일한(identical) 서열은 일반적으로 서열 전체 또는 일부분과 중간 또는 높은 엄격한 조건(stringent conditions)에서 하이브리드할 수 있다. 하이브리드화는 폴리뉴클레오티드에서 일반 코돈 또는 코돈 축퇴성을 고려한 코돈을 함유하는 폴리뉴클레오티드와의 하이브리드화 역시 포함됨이 자명하다.
임의의 두 폴리뉴클레오티드 또는 폴리펩티드 서열이 상동성, 유사성 또는 동일성을 갖는지 여부는, 예를 들어, Pearson et al (1988) [Proc. Natl. Acad. Sci. USA 85]: 2444에서와 같은 디폴트 파라미터를 이용하여 "FASTA" 프로그램과 같은 공지의 컴퓨터 알고리즘을 이용하여 결정될 수 있다. 또는, EMBOSS 패키지의 니들만 프로그램(EMBOSS: The European Molecular Biology Open Software Suite, Rice et al., 2000, Trends Genet. 16: 276-277)(버전 5.0.0 또는 이후 버전)에서 수행되는 바와 같은, 니들만-운치(Needleman-Wunsch) 알고리즘(Needleman and Wunsch, 1970, J. Mol. Biol. 48: 443-453)이 사용되어 결정될 수 있다(GCG 프로그램 패키지 (Devereux, J., et al, Nucleic Acids Research 12: 387 (1984)), BLASTP, BLASTN, FASTA (Atschul, [S.] [F.,] [ET AL, J MOLEC BIOL 215]: 403 (1990); Guide to Huge Computers, Martin J. Bishop, [ED.,] Academic Press, San Diego,1994, 및 [CARILLO ETA/.](1988) SIAM J Applied Math 48: 1073을 포함한다). 예를 들어, 국립 생물공학 정보 데이터베이스 센터의 BLAST, 또는 ClustalW를 이용하여 상동성, 유사성 또는 동일성을 결정할 수 있다.
폴리뉴클레오티드 또는 폴리펩티드의 상동성, 유사성 또는 동일성은, 예를 들어, Smith and Waterman, Adv. Appl. Math (1981) 2:482 에 공지된 대로, 예를 들면, Needleman et al. (1970), J Mol Biol. 48:443과 같은 GAP 컴퓨터 프로그램을 이용하여 서열 정보를 비교함으로써 결정될 수 있다. 요약하면, GAP 프로그램은 두 서열 중 더 짧은 것에서의 기호의 전체 수로, 유사한 배열된 기호(즉, 뉴클레오티드 또는 아미노산)의 수를 나눈 값으로 정의할 수 있다. GAP 프로그램을 위한 디폴트 파라미터는 (1) 이진법 비교 매트릭스(동일성을 위해 1 그리고 비-동일성을 위해 0의 값을 함유함) 및 Schwartz and Dayhoff, eds., Atlas Of Protein Sequence And Structure, National Biomedical Research Foundation, pp. 353-358 (1979)에 의해 개시된 대로, Gribskov et al(1986) Nucl. Acids Res. 14: 6745의 가중된 비교 매트릭스 (또는 EDNAFULL (NCBI NUC4.4의 EMBOSS 버전) 치환 매트릭스); (2) 각 갭을 위한 3.0의 페널티 및 각 갭에서 각 기호를 위한 추가의 0.10 페널티 (또는 갭 개방 패널티 10, 갭 연장 패널티 0.5); 및 (3) 말단 갭을 위한 무 페널티를 포함할 수 있다.
본 출원의 일 예로, 본 출원의 변이체는 내재성 막 수송 단백질(integral membrane transport protein); DNA 중합효소 Ⅲ 감마 및 타우 서브유닛(DNA polymerase Ⅲ subunits gamma and tau); 서열번호 11의 아미노산 서열을 포함하는 폴리펩티드 및/또는 NCgl3069 유전자에 의해 코딩되는 단백질; 전사 안티터미네이션 단백질 (Transcription antitermination protein); ABC 트랜스포터 ATP-결합 단백질(ABC transporter ATP-binding protein); 말레이트 디하이드로게나제(malate dehydrogenase); 프리모솜 조립 단백질(primosome assembly protein); 타입 II 시트레이트 신타아제(type II citrate synthase); 막 단백질 (membrane protein, TerC); 미코티온 리덕타제(mycothione reductase); Co/Zn/Cd 유출 시스템 컴포넌트(Co/Zn/Cd efflux system component); DAHP 신타아제(3-deoxy-D-arabinoheptulosonate-7-phosphate synthase; DAHP synthase); 및/또는 N-숙시닐디아미노피멜레이트 아미노트랜스퍼라제(N-succinyldiaminopimelate aminotransferase)의 활성을 가질 수 있다.
본 출원에서 용어, "내재성 막 수송 단백질(integral membrane transport protein)”는 생물학적 막(biological membrane)을 가로지르는 다른 단백질과 같은 거대분자(macromolecules), 소분자(small molecules), 및 이온(ions)의 이동에 관여하는, 생물학적 막에 부착되는 막 단백질이다. 구체적으로, 본 출원의 내재성 막 수송 단백질은 integral membrane transport protein로 혼용하여 사용될 수 있다. 본 출원에서 상기 내재성 막 수송 단백질은 공지의 데이터 베이스인 NCBI의 GenBank에서 그 서열을 얻을 수 있고, 예를 들면 GenBank Accession No. YP_227155.1, WP_011015489.1 일 수 있다. 구체적으로 NCgl2816 유전자에 의해 코딩되는 내재성 막 수송 단백질 활성을 갖는 폴리펩티드일 수 있으나, 이에 제한되지 않는다.
본 출원에서 용어, "DNA 중합효소 Ⅲ 감마 및 타우 서브유닛(DNA polymerase Ⅲ subunits gamma and tau)”는 DNA 복제를 담당하는 주요 효소로서, DNA 중합효소 Ⅲ 타우 (tau) 서브유닛은 코어 (알파(alpha), 엡실론(epsilon), 및 세타(theta) 사슬로 구성됨)와 결합하여 코어를 이합체화시키는 역할을 하고, DNA 중합효소 Ⅲ 감마 서브유닛은 베타 서브유닛을 지연 가닥 (lagging strand)에 얻는 클램프 로더 역할을 하는 폴리펩티드이다. 구체적으로, 본 출원의 DNA 중합효소 Ⅲ 감마 및 타우 서브유닛은 DNA polymerase Ⅲ gamma and tau subunits, 또는 DNA polymerase Ⅲ subunit gamma/tau로 혼용하여 사용될 수 있다. 본 출원에서 상기 DNA 중합효소 Ⅲ 감마 및 타우 서브유닛은 공지의 데이터 베이스인 NCBI의 GenBank에서 그 서열을 얻을 수 있고, 예를 들면 GenBank Accession No. YP_224542.1, WP_011013499.1일 수 있다. 구체적으로 dnaZX 유전자 (또는 NCgl0239 유전자)에 의해 코딩되는 DNA 중합효소 Ⅲ 감마 및 타우 서브유닛 활성을 갖는 폴리펩티드일 수 있으나, 이에 제한되지 않는다.
본 출원에서 용어, "전사 안티터미네이션 단백질(transcription antitermination protein)"는 전사 복합체(transcription complex)이며, 종결 인자(termination factor) Rho 및 RNA 중합효소와 상호작용할 수 있으며, 전사 종결 및/또는 항-종결에 관여하는 전사 신장 인자(transcriptional elongation factor)인 폴리펩티드이다. 구체적으로, 본 출원의 전사 안티터미네이션 단백질은 transcription termination/antitermination protein, NusG 단백질, 또는 NusG 로 혼용하여 사용될 수 있다. 본 출원에서 상기 전사 안티터미네이션 단백질 는 공지의 데이터 베이스인 NCBI의 GenBank에서 그 서열을 얻을 수 있고, 예를 들면 GenBank Accession No. WP_011013678.1, YP_224775.1일 수 있다. 구체적으로 nusG 유전자 (또는 NCgl0458 유전자)에 의해 코딩되는 전사 안티터미네이션 단백질 활성을 갖는 폴리펩티드일 수 있으나, 이에 제한되지 않는다.
본 출원에서 용어, "ABC 트랜스포터 ATP-결합 단백질(ABC transporter ATP-binding protein)"는 막관통단백질로 ATP를 가수분해한 에너지를 사용하여 다양한 기질을 막을 넘기며 이동시키고/이동시키거나, 수송과 관련이 없는 DNA, RNA의 수리와 같은 생물학적인 기능을 하는 폴리펩티드이다. 구체적으로, 본 출원의 ABC 트랜스포터 ATP-결합 단백질은 ABC transporter ATP-binding protein로 혼용하여 사용될 수 있다. 본 출원에서 상기 ABC 트랜스포터 ATP-결합 단백질은 공지의 데이터 베이스인 NCBI의 GenBank에서 그 서열을 얻을 수 있고, 예를 들면 GenBank Accession No. WP_011013802.1, YP_224957.1일 수 있다. 구체적으로 NCgl0636 유전자에 의해 코딩되는 ABC 트랜스포터 ATP-결합 단백질 활성을 갖는 폴리펩티드일 수 있으나, 이에 제한되지 않는다.
본 출원에서 용어, " N-숙시닐디아미노피멜레이트 아미노트랜스퍼라제”는 L-glutamate 및 N-succinyl-2-amino-6-ketopimelate를 기질로 하여, 2-oxoglutarate 및 N-succinyl-L,L-2,6-diaminopimelate을 생산하는 라이신 생합성 경로에 관여하는 효소이다. 구체적으로, 본 출원의 N-숙시닐디아미노피멜레이트 아미노트랜스퍼라제는 N-succinyldiaminopimelate aminotransferase로 혼용하여 사용될 수 있다. 본 출원에서 상기 N-숙시닐디아미노피멜레이트 아미노트랜스퍼라제는 공지의 데이터 베이스인 NCBI의 GenBank에서 그 서열을 얻을 수 있고, 예를 들면 GenBank Accession No. WP_011014123.1, YP_225395.1 일 수 있다. 구체적으로 NCgl1058 유전자 (또는 dapC 유전자)에 의해 코딩되는 N-숙시닐디아미노피멜레이트 아미노트랜스퍼라제 활성을 갖는 폴리펩티드일 수 있으나, 이에 제한되지 않는다.
본 출원에서 용어, "말레이트 디하이드로게나제”는 말레이트(malate, 말산)을 옥살아세트산으로 산화시키고, 이 과정에서 NAD+를 NADH로 환원시키는 반응을 가역적으로 촉매하는 효소이다. 구체적으로, 본 출원의 말레이트 디하이드로게나제는 malate dehydrogenase, MDH, 또는 말산 탈수소효소로 혼용하여 사용될 수 있다. 본 출원에서 상기 말레이트 디하이드로게나제는 공지의 데이터 베이스인 NCBI의 GenBank에서 그 서열을 얻을 수 있고, 예를 들면 GenBank Accession No. WP_011015079.1, YP_226625.1 일 수 있다. 구체적으로 NCgl2297 유전자 (또는 mdh 유전자)에 의해 코딩되는 말레이트 디하이드로게나제 활성을 갖는 폴리펩티드일 수 있으나, 이에 제한되지 않는다.
본 출원에서 용어, "프리모솜 조립 단백질”은 헬리카제(helicase) 활성을 가지는 단백질로 DNA replication 과정에 관여하는 단백질을 의미한다. 구체적으로, 본 출원의 프리모솜 조립 단백질은 primosome assembly protein, PriA 단백질, PriA, 또는 primosomal protein N'로 혼용하여 사용될 수 있다. 본 출원에서 상기 프리모솜 조립 단백질은 공지의 데이터 베이스인 NCBI의 GenBank에서 그 서열을 얻을 수 있고, 예를 들면 GenBank Accession No. WP_011014474.1, YP_225886.1 일 수 있다. 구체적으로 NCgl1540 유전자 (또는 priA 유전자)에 의해 코딩되는 프리모솜 조립 단백질 활성을 갖는 폴리펩티드일 수 있으나, 이에 제한되지 않는다.
본 출원의 타입 II 시트레이트 신타아제는 integral type II citrate synthase, 시트레이트 신타아제, 또는 citrate synthase로 혼용하여 사용될 수 있다. 본 출원에서 상기 타입 II 시트레이트 신타아제는공지의 데이터 베이스인 NCBI의 GenBank에서 그 서열을 얻을 수 있고, 예를 들면 GenBank Accession No. YP_225121.1, WP_011013914.1 일 수 있다. 구체적으로 gltA 유전자(또는 NCgl0795 유전자)에 의해 코딩되는 타입 II 시트레이트 신타아제 활성을 갖는 폴리펩티드일 수 있으나, 이에 제한되지 않는다.
본 출원의 막 단백질은 멤브레인 단백질, membrane protein, TerC, 또는 TerC 단백질로 혼용하여 사용될 수 있다. 본 출원에서 상기 막 단백질은 공지의 데이터 베이스인 NCBI의 GenBank에서 그 서열을 얻을 수 있고, 예를 들면 GenBank Accession No. YP_226209.1, WP_011014789.1 일 수 있다. 구체적으로 terC 유전자(또는 NCgl1892 유전자)에 의해 코딩되는 막 단백질 활성을 갖는 폴리펩티드일 수 있으나, 이에 제한되지 않는다.
본 출원의 미코티온 리덕타제는 미코티온 환원효소, 또는 mycothione reductase로 혼용하여 사용될 수 있다. 본 출원에서 상기 미코티온 리덕타제는 공지의 데이터 베이스인 NCBI의 GenBank에서 그 서열을 얻을 수 있고, 예를 들면 GenBank Accession No. YP_226245.1, WP_011014816.1 일 수 있다. 구체적으로 mtr 유전자(또는 NCgl1928 유전자)에 의해 코딩되는 미코티온 리덕타제 활성을 갖는 폴리펩티드일 수 있으나, 이에 제한되지 않는다.
본 출원의 Co/Zn/Cd 유출 시스템 컴포넌트는 Co/Zn/Cd efflux system component로 혼용하여 사용될 수 있다. 본 출원에서 상기 Co/Zn/Cd 유출 시스템 컴포넌트는 공지의 데이터 베이스인 NCBI의 GenBank에서 그 서열을 얻을 수 있고, 예를 들면 GenBank Accession No. YP_226309.1, WP_011014862.1일 수 있다. 구체적으로 NCgl1992 유전자에 의해 코딩되는 Co/Zn/Cd 유출 시스템 컴포넌트 활성을 갖는 폴리펩티드일 수 있으나, 이에 제한되지 않는다.
본 출원의 DAHP 신타아제는 3-디옥시-D-아라비노헵툴로손산 7-인산 생성효소, 3-디옥시-D-아라비노헵툴로손산 7-인산 신타아제, 3-deoxy-D-arabinoheptulosonate-7-phosphate synthase, 또는 DAHP synthase로 혼용하여 사용될 수 있다. 본 출원에서 상기 DAHP 신타아제는 공지의 데이터 베이스인 NCBI의 GenBank에서 그 서열을 얻을 수 있고, 예를 들면 GenBank Accession No. YP_226420.1, WP_011014936.1 일 수 있다. 구체적으로 aroG 유전자(또는 NCgl2098 유전자)에 의해 코딩되는 DAHP 신타아제 활성을 갖는 폴리펩티드일 수 있으나, 이에 제한되지 않는다.
본 출원의 일 예로, 본 출원의 변이체는 야생형 폴리펩티드에 비해 L-라이신 생산능이 증가되도록 하는 활성을 가질 수 있다.
상기 내재성 막 수송 단백질; DNA 중합효소 Ⅲ 감마 및 타우 서브유닛; NCgl3069 유전자에 의해 코딩되는 단백질; 전사 안티터미네이션 단백질; ABC 트랜스포터 ATP-결합 단백질; 말레이트 디하이드로게나제; 프리모솜 조립 단백질; 타입 II 시트레이트 신타아제; 막 단백질; 미코티온 리덕타제; Co/Zn/Cd 유출 시스템 컴포넌트; DAHP 신타아제; 및/또는 N-숙시닐디아미노피멜레이트 아미노트랜스퍼라제의 야생형 폴리펩티드의 아미노산 서열 및 이를 코딩하는 핵산 서열의 일 예를 하기 표 3에 기재하였다.
단백질 아미노산 서열 단백질을 코딩하는 핵산 서열
내재성 막 수송 단백질 서열번호 3 서열번호 4
DNA 중합효소 Ⅲ 감마 및 타우 서브유닛 서열번호 7 서열번호 8
NCgl3069 유전자에 의해 코딩되는 단백질 서열번호 11 서열번호 12
전사 안티터미네이션 단백질 서열번호 15 서열번호 16
ABC 트랜스포터 ATP-결합 단백질 서열번호 19 서열번호 20
말레이트 디하이드로게나제 서열번호 23 서열번호 24
프리모솜 조립 단백질 서열번호 27 서열번호 28
타입 II 시트레이트 신타아제 서열번호 31 서열번호 32
막 단백질 서열번호 35 서열번호 36
미코티온 리덕타제 서열번호 39 서열번호 40
Co/Zn/Cd 유출 시스템 컴포넌트 서열번호 43 서열번호 44
DAHP 신타아제 서열번호 47 서열번호 48
N-숙시닐디아미노피멜레이트 아미노트랜스퍼라제 서열번호 51 서열번호 52
본 출원에서 용어, "상응하는(corresponding to)"은, 폴리펩티드에서 열거되는 위치의 아미노산 잔기이거나, 또는 폴리펩티드에서 열거되는 잔기와 유사하거나 동일하거나 상동한 아미노산 잔기를 지칭한다. 상응하는 위치의 아미노산을 확인하는 것은 특정 서열을 참조하는 서열의 특정 아미노산을 결정하는 것일 수 있다. 본 출원에 사용된 "상응 영역"은 일반적으로 관련 단백질 또는 참조 (reference) 단백질에서의 유사하거나 대응되는 위치를 지칭한다.
예를 들어, 임의의 아미노산 서열을 서열번호 3, 7, 11, 15, 19, 23, 27, 31, 35, 39, 43, 47, 또는 51과 정렬(align)하고, 이를 토대로 상기 아미노산 서열의 각 아미노산 잔기는 서열번호 3, 7, 11, 15, 19, 23, 27, 31, 35, 39, 43, 47, 또는 51의 아미노산 잔기와 상응하는 아미노산 잔기의 숫자 위치를 참조하여 넘버링 할 수 있다. 예를 들어, 본 출원에 기재된 것과 같은 서열 정렬 알고리즘은, 쿼리 시퀀스("참조 서열"이라고도 함)와 비교하여 아미노산의 위치, 또는 치환, 삽입 또는 결실 등의 변형이 발생하는 위치를 확인할 수 있다.
이러한 정렬에는 예를 들어 Needleman-Wunsch 알고리즘 (Needleman 및 Wunsch, 1970, J. Mol. Biol. 48: 443-453), EMBOSS 패키지의 Needle 프로그램 (EMBOSS: The European Molecular Biology Open Software Suite, Rice et al., 2000), Trends Genet. 16: 276-277) 등을 이용할 수 있으나, 이에 제한되지 않고 당업계에 알려진 서열 정렬 프로그램, 쌍 서열(pairwise sequence) 비교 알고리즘 등을 적절히 사용할 수 있다.
본 출원의 다른 하나의 양태는 본 출원의 변이체를 코딩하는 폴리뉴클레오티드를 제공하는 것이다.
본 출원에서 용어, "폴리뉴클레오티드"는 뉴클레오티드 단위체(monomer)가 공유결합에 의해 길게 사슬모양으로 이어진 뉴클레오티드의 중합체(polymer)로 일정한 길이 이상의 DNA 또는 RNA 가닥으로서, 보다 구체적으로는 상기 변이체를 코딩하는 폴리뉴클레오티드 단편을 의미한다.
본 출원의 변이체를 코딩하는 폴리뉴클레오티드는 서열번호 1, 5, 9, 13, 17, 21, 25, 29, 33, 37, 41, 45, 또는 49으로 기재된 아미노산 서열을 코딩하는 염기서열을 포함할 수 있다. 본 출원의 일 예로, 본 출원의 폴리뉴클레오티드는 서열번호 2, 6, 10, 14, 18, 22, 26, 30, 34, 38, 42, 46, 또는 50의 서열을 가지거나 포함할 수 있다. 또한, 본 출원의 폴리뉴클레오티드는 서열번호 2, 6, 10, 14, 18, 22, 26, 30, 34, 38, 42, 46, 또는 50의 서열로 이루어지거나, 필수적으로 구성될 수 있다. 또 다른 예에서, 본 출원의 폴리뉴클레오티드는 상기 서열번호 2, 6, 10, 14, 18, 22, 26, 30, 34, 38, 42, 46, 또는 50로 기재된 핵산 서열에서 각각 서열번호 4, 8, 12, 16, 20, 24, 28, 32, 36, 40, 44, 48, 또는 52의 핵산 서열을 기준으로 659번, 128번, 97번, 628번, 595번, 815번, 911번, 506번, 880번, 1072번, 389번, 1144번, 또는 626번 위치에 각각 상응하는 염기는 G, T, A, G, A, T, A, T, A, T, A, T, 또는 T 이고, 상기 서열번호 2, 6, 10, 14, 18, 22, 26, 30, 34, 38, 42, 46, 또는 50으로 기재된 핵산 서열과 적어도 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, 99.5%, 99.7% 또는 99.9% 이상의 상동성 또는 동일성을 가지는 핵산 서열을 포함할 수 있다. 또한, 이러한 상동성 또는 동일성을 가지며 본 출원의 변이체에 상응하는 효능을 나타내는 폴리펩티드나 단백질을 암호화하는 서열이라면, 일부 서열이 결실, 변형, 치환, 보존적 치환 또는 부가된 핵산 서열을 갖는 폴리뉴클레오티드도 본 출원의 범위 내에 포함됨은 자명하다. 본 출원의 폴리뉴클레오티드의 각 핵산 서열, 위치, 및 위치에 상응하는 염기 종류에 대한 대응관계를 하기 표 4 에 나타내었다.
  핵산 서열 위치를 카운팅하기 위해 기준이 되는 핵산 서열 위치 염기 종류
1 서열번호 2 서열번호 4 659 G
2 서열번호 6 서열번호 8 128 T
3 서열번호 10 서열번호 12 97 A
4 서열번호 14 서열번호 16 628 G
5 서열번호 18 서열번호 20 595 A
6 서열번호 22 서열번호 24 815 T
7 서열번호 26 서열번호 28 911 A
8 서열번호 30 서열번호 32 506 T
9 서열번호 34 서열번호 36 880 A
10 서열번호 38 서열번호 40 1072 T
11 서열번호 42 서열번호 44 389 A
12 서열번호 46 서열번호 48 1144 T
13 서열번호 50 서열번호 52 626 T
본 출원의 폴리뉴클레오티드는 코돈의 축퇴성(degeneracy) 또는 본 출원의 변이체를 발현시키고자 하는 생물에서 선호되는 코돈을 고려하여, 본 출원의 변이체의 아미노산 서열을 변화시키지 않는 범위 내에서 코딩 영역에 다양한 변형이 이루어질 수 있다. 구체적으로, 본 출원의 폴리뉴클레오티드는 서열번호 2, 6, 10, 14, 18, 22, 26, 30, 34, 38, 42, 46, 또는 50의 서열과 상동성 또는 동일성이 70% 이상, 75% 이상, 80% 이상, 85% 이상, 90% 이상, 95% 이상, 96% 이상, 97% 이상, 98% 이상, 및 100% 미만인 염기서열을 가지거나 포함하거나, 또는 서열번호 2, 6, 10, 14, 18, 22, 26, 30, 34, 38, 42, 46, 또는 50의 서열과 상동성 또는 동일성이 70% 이상, 75% 이상, 80% 이상, 85% 이상, 90% 이상, 95% 이상, 96% 이상, 97% 이상, 98% 이상, 및 100% 미만인 염기서열로 이루어지거나 필수적으로 이루어질 수 있으나, 이에 제한되지 않는다. 이때, 상기 상동성 또는 동일성을 갖는 서열에서, 서열번호 1, 5, 9, 13, 17, 21, 25, 29, 33, 37, 41, 45, 또는 49의 220번, 43번, 33번, 210번, 199번, 272번, 304번, 169번, 294번, 358번, 130번, 382번, 또는 209번 위치에 각각 상응하는 아미노산을 코딩하는 코돈은, 각각 시스테인, 류신, 세린, 아스파르트산, 메티오닌, 이소류신, 글루타민, 발린, 라이신, 세린, 아스파르트산, 시스테인, 또는 류신을 코딩하는 코돈 중 하나일 수 있다.
또한, 본 출원의 폴리뉴클레오티드는 공지의 유전자 서열로부터 제조될 수 있는 프로브, 예를 들면, 본 출원의 폴리뉴클레오티드 서열의 전체 또는 일부에 대한 상보 서열과 엄격한 조건 하에 하이브리드화할 수 있는 서열이라면 제한없이 포함될 수 있다. 상기 “엄격한 조건(stringent condition)”이란 폴리뉴클레오티드 간의 특이적 혼성화를 가능하게 하는 조건을 의미한다. 이러한 조건은 문헌(J. Sambrook et al.,Molecular Cloning, A Laboratory Manual, 2nd Edition, Cold Spring Harbor Laboratory press, Cold Spring Harbor, New York, 1989; F.M. Ausubel et al.,Current Protocols in Molecular Biology, John Wiley & Sons, Inc., New York, 9.50-9.51, 11.7-11.8 참조)에 구체적으로 기재되어 있다. 예를 들어, 상동성 또는 동일성이 높은 폴리뉴클레오티드끼리, 70% 이상, 75% 이상, 80% 이상, 85% 이상, 90% 이상, 95% 이상, 96% 이상, 97% 이상, 98% 이상, 또는 99% 이상의 상동성 또는 동일성을 갖는 폴리뉴클레오티드끼리 하이브리드화하고, 그보다 상동성 또는 동일성이 낮은 폴리뉴클레오티드끼리 하이브리드화하지 않는 조건, 또는 통상의 써던 하이브리드화(southern hybridization)의 세척 조건인 60℃, 1×SSC, 0.1% SDS, 구체적으로 60℃, 0.1×SSC, 0.1% SDS, 보다 구체적으로 68℃, 0.1×SSC, 0.1% SDS에 상당하는 염 농도 및 온도에서, 1회, 구체적으로 2회 내지 3회 세정하는 조건을 열거할 수 있다.
혼성화는 비록 혼성화의 엄격도에 따라 염기 간의 미스매치(mismatch)가 가능할지라도, 두 개의 핵산이 상보적 서열을 가질 것을 요구한다. 용어, “상보적”은 서로 혼성화가 가능한 뉴클레오티드 염기 간의 관계를 기술하는데 사용된다. 예를 들면, DNA에 관하여, 아데닌은 티민에 상보적이며 시토신은 구아닌에 상보적이다. 따라서, 본 출원의 폴리뉴클레오티드는 또한 실질적으로 유사한 핵산 서열뿐만 아니라 전체 서열에 상보적인 단리된 핵산 단편을 포함할 수 있다.
구체적으로, 본 출원의 폴리뉴클레오티드와 상동성 또는 동일성을 가지는 폴리뉴클레오티드는 55 ℃의 Tm 값에서 혼성화 단계를 포함하는 혼성화 조건을 사용하고 상술한 조건을 사용하여 탐지할 수 있다. 또한, 상기 Tm 값은 60 ℃, 63 ℃ 또는 65 ℃일 수 있으나, 이에 제한되는 것은 아니고 그 목적에 따라 당업자에 의해 적절히 조절될 수 있다.
상기 폴리뉴클레오티드를 혼성화하는 적절한 엄격도는 폴리뉴클레오티드의 길이 및 상보성 정도에 의존하고 변수는 해당기술분야에 잘 알려져 있다(예컨대, J.Sambrook et al.,Molecular Cloning, A Laboratory Manual, 2nd Edition, Cold Spring Harbor Laboratory press, Cold Spring Harbor, New York, 1989; F.M. Ausubel et al.,Current Protocols in Molecular Biology, John Wiley & Sons, Inc., New York, 9.50-9.51, 11.7-11.8 참조).
본 출원의 또 다른 하나의 양태는 본 출원의 폴리뉴클레오티드를 포함하는 벡터를 제공하는 것이다. 상기 벡터는 상기 폴리뉴클레오티드를 숙주세포에서 발현시키기 위한 발현 벡터일 수 있으나, 이에 제한되지 않는다.
본 출원에서 "벡터"는 적합한 숙주 내에서 목적 폴리펩티드를 발현시킬 수 있도록 적합한 발현조절영역(또는 발현조절서열)에 작동 가능하게 연결된 상기 목적 폴리펩티드를 코딩하는 폴리뉴클레오티드의 염기서열을 포함하는 DNA 제조물을 포함할 수 있다. 상기 발현조절영역은 전사를 개시할 수 있는 프로모터, 그러한 전사를 조절하기 위한 임의의 오퍼레이터 서열, 적합한 mRNA 리보좀 결합부위를 코딩하는 서열, 및 전사 및 해독의 종결을 조절하는 서열을 포함할 수 있다. 벡터는 적당한 숙주세포 내로 형질전환된 후, 숙주 게놈과 무관하게 복제되거나 기능할 수 있으며, 게놈 그 자체에 통합될 수 있다.
본 출원에서 사용되는 벡터는 특별히 한정되지 않으며, 당업계에 알려진 임의의 벡터를 이용할 수 있다. 통상 사용되는 벡터의 예로는 천연 상태이거나 재조합된 상태의 플라스미드, 코스미드, 바이러스 및 박테리오파지를 들 수 있다. 예를 들어, 파지 벡터 또는 코스미드 벡터로서 pWE15, M13, MBL3, MBL4, IXII, ASHII, APII, t10, t11, Charon4A, 및 Charon21A 등을 사용할 수 있으며, 플라스미드 벡터로서 pDZ계, pBR계, pUC계, pBluescriptII계, pGEM계, pTZ계, pCL계 및 pET계 등을 사용할 수 있다. 구체적으로는 pDZ, pDC, pDCM2, pACYC177, pACYC184, pCL, pECCG117, pUC19, pBR322, pMW118, pCC1BAC 벡터 등을 사용할 수 있다.
일례로 세포 내 염색체 삽입용 벡터를 통해 목적 폴리펩티드를 코딩하는 폴리뉴클레오티드를 염색체 내로 삽입할 수 있다. 상기 폴리뉴클레오티드의 염색체 내로의 삽입은 당업계에 알려진 임의의 방법, 예를 들면, 상동재조합(homologous recombination)에 의하여 이루어질 수 있으나, 이에 한정되지는 않는다. 상기 염색체 삽입 여부를 확인하기 위한 선별 마커(selection marker)를 추가로 포함할 수 있다. 상기 선별 마커는 벡터로 형질전환된 세포를 선별, 즉 목적 핵산 분자의 삽입 여부를 확인하기 위한 것으로, 약물 내성, 영양 요구성, 세포 독성제에 대한 내성 또는 표면 폴리펩티드의 발현과 같은 선택가능 표현형을 부여하는 마커들이 사용될 수 있다. 선택제(selective agent)가 처리된 환경에서는 선별 마커를 발현하는 세포만 생존하거나 다른 표현 형질을 나타내므로, 형질전환된 세포를 선별할 수 있다.
본 출원에서 용어 "형질전환"은 표적 폴리펩티드를 코딩하는 폴리뉴클레오티드를 포함하는 벡터를 숙주세포 혹은 미생물 내에 도입하여 숙주세포 내에서 상기 폴리뉴클레오티드가 코딩하는 폴리펩티드가 발현할 수 있도록 하는 것을 의미한다. 형질전환된 폴리뉴클레오티드는 숙주세포 내에서 발현될 수 있기만 한다면, 숙주세포의 염색체 내에 삽입되어 위치하거나 염색체 외에 위치하거나 상관없이 이들 모두를 포함할 수 있다. 또한, 상기 폴리뉴클레오티드는 목적 폴리펩티드를 코딩하는 DNA 및/또는 RNA를 포함한다. 상기 폴리뉴클레오티드는 숙주세포 내로 도입되어 발현될 수 있는 것이면, 어떠한 형태로도 도입될 수 있다. 예를 들면, 상기 폴리뉴클레오티드는 자체적으로 발현되는데 필요한 모든 요소를 포함하는 유전자 구조체인 발현 카세트(expression cassette)의 형태로 숙주세포에 도입될 수 있다. 상기 발현 카세트는 통상 상기 폴리뉴클레오티드에 작동 가능하게 연결되어 있는 프로모터(promoter), 전사 종결신호, 리보좀 결합부위 및 번역 종결신호를 포함할 수 있다. 상기 발현 카세트는 자체 복제가 가능한 발현 벡터 형태일 수 있다. 또한, 상기 폴리뉴클레오티드는 그 자체의 형태로 숙주세포에 도입되어 숙주세포에서 발현에 필요한 서열과 작동 가능하게 연결되어 있는 것일 수도 있으며, 이에 제한되지 않는다.
또한, 상기에서 용어 "작동 가능하게 연결"된 것이란 본 출원의 목적 변이체를 코딩하는 폴리뉴클레오티드의 전사를 개시 및 매개하도록 하는 프로모터 서열과 상기 폴리뉴클레오티드 서열이 기능적으로 연결되어 있는 것을 의미한다.
본 출원의 또 다른 하나의 양태는 본 출원의 변이체 또는 본 출원의 폴리뉴클레오티드를 포함하는, 코리네박테리움 글루타미쿰(Corynebacterium glutamicum) 균주를 제공하는 것이다.
일 예는 하기 (a) 및 (b)의 단백질 변이체 또는 상기 변이체를 코딩하는 폴리뉴클레오티드(예를 들면, 상기 (a) 변이체를 코딩하는 폴리펩티드, 상기 (b) 변이체를 코딩하는 폴리펩티드, 및/또는 상기 (a)와 (b)를 코딩하는 폴리펩티드)를 포함하는, 코리네박테리움 글루타미쿰(Corynebacterium glutamicum) 균주를 제공할 수 있다:
(a) 서열번호 51의 209번째 위치에 상응하는 아미노산인 프롤린이 류신으로 치환된, 서열번호 49로 기재된 아미노산 서열로 이루어진 N-숙시닐디아미노피멜레이트 아미노트랜스퍼라제 변이체 및
(b) 하기 (1) 내지 (12)로 이루어지는 군에서 선택된 1종 이상의 단백질 변이체:
(1) 서열번호 3의 220번째 위치에 상응하는 아미노산인 페닐알라닌이 시스테인으로 치환된, 서열번호 1로 기재된 아미노산 서열로 이루어진 내재성 막 수송 단백질 변이체;
(2) 서열번호 7의 43번째 위치에 상응하는 아미노산인 프롤린이 류신으로 치환된, 서열번호 5로 기재된 아미노산 서열로 이루어진 DNA 중합효소 Ⅲ 감마 및 타우 서브유닛 변이체;
(3) 서열번호 11의 33번째 위치에 상응하는 아미노산인 시스테인이 세린으로 치환된, 서열번호 9로 기재된 아미노산 서열로 이루어진 단백질 변이체;
(4) 서열번호 15의 210번째 위치에 상응하는 아미노산인 아스파라긴이 아스파르트산으로 치환된, 서열번호 13로 기재된 아미노산 서열로 이루어진 전사 안티터미네이션 단백질 변이체;
(5) 서열번호 19의 199번째 위치에 상응하는 아미노산인 발린이 메티오닌으로 치환된, 서열번호 17로 기재된 아미노산 서열로 이루어진 ABC 트랜스포터 ATP-결합 단백질 변이체;
(6) 서열번호 23의 272번째 위치에 상응하는 아미노산인 트레오닌이 이소류신으로 치환된, 서열번호 21로 기재된 아미노산 서열로 이루어진 말레이트 디하이드로게나제 변이체;
(7) 서열번호 27의 304번째 위치에 상응하는 아미노산인 아르기닌이 글루타민으로 치환된, 서열번호 25로 기재된 아미노산 서열로 이루어진 프리모솜 조립 단백질 변이체;
(8) 서열번호 31의 169번째 위치에 상응하는 아미노산인 알라닌이 발린으로 치환된, 서열번호 29로 기재된 아미노산 서열로 이루어진 타입 II 시트레이트 신타아제 변이체;
(9) 서열번호 35의 294번째 위치에 상응하는 아미노산인 글루탐산이 라이신으로 치환된, 서열번호 33로 기재된 아미노산 서열로 이루어진 막 단백질 변이체;
(10) 서열번호 39의 358번째 위치에 상응하는 아미노산인 프롤린이 세린으로 치환된, 서열번호 37로 기재된 아미노산 서열로 이루어진 미코티온 리덕타제 변이체;
(11) 서열번호 43의 130번째 위치에 상응하는 아미노산인 글리신이 아스파르트산으로 치환된, 서열번호 41로 기재된 아미노산 서열로 이루어진 Co/Zn/Cd 유출 시스템 컴포넌트 변이체; 및
(12) 서열번호 47의 382번째 위치에 상응하는 아미노산인 글리신이 시스테인으로 치환된, 서열번호 45으로 기재된 아미노산 서열로 이루어진 DAHP 신타아제 변이체.
본 출원의 균주는 본 출원의 변이형 폴리펩티드(예를 들면, 상기 (a) 및 (b)의 변이체), 상기 폴리펩티드를 암호화하는 폴리뉴클레오티드(예를 들면, 상기 (a) 변이체를 코딩하는 폴리펩티드, 상기 (b) 변이체를 코딩하는 폴리펩티드, 및/또는 상기 (a)와 (b)를 코딩하는 폴리펩티드), 또는 본 출원의 폴리뉴클레오티드를 포함하는 벡터(예를 들면, 상기 (a) 및/또는 (b)를 코딩하는 폴리뉴클레오티드를 포함하는 벡터; 및/또는 상기 (a) 변이체를 포함하는 폴리펩티드를 포함하는 벡터와 상기 (b) 변이체를 포함하는 벡터)를 포함할 수 있다.
본 출원에서 용어, "균주(또는, 미생물)"는 야생형 미생물이나 자연적 또는 인위적으로 유전적 변형이 일어난 미생물을 모두 포함하며, 외부 유전자가 삽입되거나 내재적 유전자의 활성이 강화되거나 불활성화되는 등의 원인으로 인해서 특정 기작이 약화되거나 강화된 미생물로서, 목적하는 폴리펩티드, 단백질 또는 산물의 생산을 위하여 유전적 변형(modification)을 포함하는 미생물일 수 있다.
본 출원의 균주는 본 출원의 변이체(예를 들면, 상기 (a) 및 (b)의 변이체), 본 출원의 폴리뉴클레오티드(예를 들면, 상기 (a) 변이체를 코딩하는 폴리펩티드, 상기 (b) 변이체를 코딩하는 폴리펩티드, 및/또는 상기 (a)와 (b)를 코딩하는 폴리펩티드) 및 본 출원의 폴리뉴클레오티드를 포함하는 벡터(예를 들면, 상기 (a) 및/또는 (b)를 코딩하는 폴리뉴클레오티드를 포함하는 벡터; 및/또는 상기 (a) 변이체를 포함하는 폴리펩티드를 포함하는 벡터와 상기 (b) 변이체를 포함하는 벡터) 중 어느 하나 이상을 포함하는 균주; 본 출원의 변이체 또는 본 출원의 폴리뉴클레오티드를 발현하도록 변형된 균주; 본 출원의 변이체, 또는 본 출원의 폴리뉴클레오티드를 발현하는 균주 (예컨대, 재조합 균주); 또는 본 출원의 변이체 활성을 갖는 균주 (예컨대, 재조합 균주)일 수 있으나, 이에 제한되지 않는다.
본 출원의 균주는 L-라이신 생산능을 가진 균주일 수 있다.
본 출원의 균주는 자연적으로 (i) 내재성 막 수송 단백질(integral membrane transport protein); (ⅱ) DNA 중합효소 Ⅲ 감마 및 타우 서브유닛 (DNA polymerase Ⅲ subunits gamma and tau); (ⅲ) 서열번호 11의 아미노산 서열을 포함하는 폴리펩티드 및/또는 NCgl3069 유전자에 의해 코딩되는 단백질; (ⅳ) 전사 안티터미네이션 단백질(Transcription antitermination protein); (ⅴ) ABC 트랜스포터 ATP-결합 단백질(ABC transporter ATP-binding protein); (ⅵ) 말레이트 디하이드로게나제(malate dehydrogenase); (ⅶ) 프리모솜 조립 단백질(primosome assembly protein); (ⅷ) 타입 II 시트레이트 신타아제(type II citrate synthase); (ⅸ) 막 단백질 (membrane protein, TerC); (x) 미코티온 리덕타제(mycothione reductase); (xi) Co/Zn/Cd 유출 시스템 컴포넌트(Co/Zn/Cd efflux system component); (xii) DAHP 신타아제(3-deoxy-D-arabinoheptulosonate-7-phosphate synthase; DAHP synthase); 및/또는 (xiii) N-숙시닐디아미노피멜레이트 아미노트랜스퍼라제(N-succinyldiaminopimelate aminotransferase)의 활성 및/또는 L-라이신 생산능을 가지고 있는 미생물, 또는 상기 (i) 내지 (xiii)로 이루어지는 군에서 선택되는 1종 이상의 단백질의 활성 및/또는 L-라이신 생산능이 없는 모균주에 본 출원의 변이체 (예를 들면, 상기 (a) 및 (b)의 변이체) 또는 이를 코딩하는 폴리뉴클레오티드 (또는 상기 폴리뉴클레오티드를 포함하는 벡터)가 도입되거나 및/또는 L-라이신 생산능이 부여된 미생물일 수 있으나 이에 제한되지 않는다.
일 예로, 본 출원의 균주는 본 출원의 폴리뉴클레오티드 또는 본 출원의 변이체(예를 들면, 상기 (a) 및 (b)의 변이체)를 코딩하는 폴리뉴클레오티드를 포함하는 벡터로 형질전환되어, 본 출원의 변이체를 발현하는 세포 또는 미생물로서, 본 출원의 목적상 본 출원의 균주는 본 출원의 변이체를 포함하여 L-라이신을 생산할 수 있는 미생물을 모두 포함할 수 있다. 예를 들어, 본 출원의 균주는 천연의 야생형 미생물 또는 L-라이신을 생산하는 미생물에 본 출원의 변이체를 코딩하는 폴리뉴클레오티드(예를 들면, 상기 (a) 변이체를 코딩하는 폴리펩티드, 상기 (b) 변이체를 코딩하는 폴리펩티드, 및/또는 상기 (a)와 (b)를 코딩하는 폴리펩티드)가 도입됨으로써 단백질 변이체가 발현되어, L-라이신 생산능이 증가된 재조합 균주일 수 있다. 일 예에서, 본 출원의 균주는 단백질 변이체 또는 상기 변이체를 코딩하는 폴리뉴클레오티드를 포함하지 않는 균주(예를 들면, 코리네박테리움 글루타미쿰)과 비교하여, L-라이신 생산능이 증가된 재조합 균주일 수 있다. 상기 L-아미노산 생산능이 증가된 재조합 균주는, 천연의 야생형 미생물 또는 상기 (i) 내지 (xiii)로 이루어지는 군에서 선택되는 1종 이상의 단백질이 비변형된 미생물 (즉, 상기 (i) 내지 (xiii)로 이루어지는 군에서 선택되는 1종 이상의 야생형 단백질을 발현하는 미생물; 예를 들면 서열번호 3, 7, 11, 15, 19, 23, 27, 31, 35, 39, 43, 47, 또는 51의 폴리펩티드 및/또는 이를 코딩하는 폴리뉴클레오티드를 포함하는 미생물)에 비하여 L-라이신 생산능이 증가된 미생물일 수 있으나, 이에 제한되는 것은 아니다. 그 예로, 상기 L-라이신 생산능의 증가 여부를 비교하는 대상 균주인, 비변형 미생물은 ATCC13032 균주 및/또는 코리네박테리움 글루타미쿰 CJ3P(US 9556463 B2; 문헌 전체가 본 명세서에 참조로서 포함됨)일 수 있으나, 이에 제한되지 않는다.
일 예로, 상기 생산능이 증가된 재조합 균주는 변이 전 모균주 또는 비변형 미생물에 비하여, L-라이신 생산능이 약 1% 이상, 약 2.5% 이상, 약 5% 이상, 약 6% 이상, 약 7% 이상, 약 8% 이상, 약 9% 이상, 약 10% 이상, 약 10.5% 이상, 약 11% 이상, 약 11.5%이상, 약 12% 이상, 약 12.5% 이상, 약 13% 이상, 약 13.5% 이상, 약 14% 이상, 약 14.5% 이상, 약 15% 이상, 약 15.5% 이상, 약 16% 이상, 약 16.5% 이상, 약 17% 이상, 약 17.5% 이상, 약 18% 이상, 약 18.5% 이상, 약 19% 이상, 약 19.5% 이상, 약 20% 이상, 약 20.5% 이상, 약 21% 이상, 약 21.5% 이상, 약 22% 이상, 약 22.5% 이상, 약 23% 이상, 약 23.5% 이상, 약 24% 이상, 약 24.5% 이상, 약 25% 이상, 약 25.5% 이상, 약 26% 이상, 약 26.5% 이상, 약 27% 이상, 약 27.5% 이상, 약 28% 이상, 약 28.5% 이상, 약 29% 이상, 약 29.5% 이상, 약 30% 이상, 약 31% 이상, 약 32% 이상, 약 33% 이상, 약 34% 이상, 또는 약 35% 이상 (상한값은 특별한 제한은 없으며, 예컨대, 약 200% 이하, 약 150% 이하, 약 100% 이하, 약 50% 이하, 약 45% 이하, 약 40% 이하, 또는 약 35% 이하일 수 있음) 증가된 것일 수 있다. 다른 예에서, 상기 생산능이 증가된 재조합 균주는 변이 전 모균주 또는 비변형 미생물에 비하여, L-라이신 생산능이 약 1.1배 이상, 약 1.12배 이상, 약 1.13배 이상, 1.15배 이상, 1.16배 이상, 1.17배 이상, 1.18배 이상, 1.19배 이상, 약 1.2 배 이상, 1.25배 이상, 또는 약 1.3배 이상 (상한값은 특별한 제한은 없으며, 예컨대, 약 10배 이하, 약 5배 이하, 약 3배 이하, 또는 약 2배 이하일 수 있음) 증가된 것일 수 있다. 상기 용어 “약(about)”은 ±0.5, ±0.4, ±0.3, ±0.2, ±0.1 등을 모두 포함하는 범위로, 약 이란 용어 뒤에 나오는 수치와 동등하거나 유사한 범위의 수치를 모두 포함하나, 이에 제한되지 않는다.
본 출원에서 용어, "비변형 미생물"은 미생물에 자연적으로 발생할 수 있는 돌연변이를 포함하는 균주를 제외하는 것이 아니며, 야생형 균주 또는 천연형 균주 자체이거나, 자연적 또는 인위적 요인에 의한 유전적 변이로 형질이 변화되기 전 균주를 의미할 수 있다. 예를 들어, 상기 비변형 미생물은 본 명세서에 기재된 전사 안티터미네이션 단백질 변이체가 도입되지 않거나 도입되기 전의 균주를 의미할 수 있다. 상기 "비변형 미생물"은 “변형 전 균주”, “변형 전 미생물”, “비변이 균주”, “비변형 균주”, “비변이 미생물” 또는 “기준 미생물”과 혼용될 수 있다.
본 출원의 또 다른 일 예로, 본 출원의 미생물은 코리네박테리움 글루타미쿰(Corynebacterium glutamicum), 코리네박테리움 크루디락티스(Corynebacterium crudilactis), 코리네박테리움 데세르티(Corynebacterium deserti), 코리네박테리움 이피시엔스(Corynebacterium efficiens), 코리네박테리움 칼루내(Corynebacterium callunae), 코리네박테리움 스테셔니스(Corynebacterium stationis), 코리네박테리움 싱굴라레(Corynebacterium singulare), 코리네박테리움 할로톨레란스(Corynebacterium halotolerans), 코리네박테리움 스트리아툼(Corynebacterium striatum), 코리네박테리움 암모니아게네스(Corynebacterium ammoniagenes), 코리네박테리움 폴루티솔리(Corynebacterium pollutisoli), 코리네박테리움 이미탄스(Corynebacterium imitans), 코리네박테리움 테스투디노리스(Corynebacterium testudinoris) 또는 코리네박테리움 플라베스센스(Corynebacterium flavescens)일 수 있다.
본 출원에서 용어, 폴리펩티드의 “약화”는 내재적 활성에 비하여 활성이 감소되거나 또는 활성이 없는 것을 모두 포함하는 개념이다. 상기 약화는 불활성화(inactivation), 결핍(deficiency), 하향조절(down-regulation), 감소(decrease), 저하(reduce), 감쇠(attenuation) 등의 용어와 혼용될 수 있다.
상기 약화는 상기 폴리펩티드를 코딩하는 폴리뉴클레오티드의 변이 등으로 폴리펩티드 자체의 활성이 본래 미생물이 가지고 있는 폴리펩티드의 활성에 비해 감소 또는 제거된 경우, 이를 코딩하는 폴리뉴클레오티드의 유전자의 발현 저해 또는 폴리펩티드로의 번역(translation) 저해 등으로 세포 내에서 전체적인 폴리펩티드 활성 정도 및/또는 농도(발현량)가 천연형 균주에 비하여 낮은 경우, 상기 폴리뉴클레오티드의 발현이 전혀 이루어지지 않은 경우, 및/또는 폴리뉴클레오티드의 발현이 되더라도 폴리펩티드의 활성이 없는 경우 역시 포함할 수 있다. 상기 “내재적 활성”은 자연적 또는 인위적 요인에 의한 유전적 변이로 형질이 변화하는 경우, 형질 변화 전 모균주, 야생형 또는 비변형 미생물이 본래 가지고 있던 특정 폴리펩티드의 활성을 의미한다. 이는 “변형 전 활성”과 혼용되어 사용될 수 있다. 폴리펩티드의 활성이 내재적 활성에 비하여 “불활성화, 결핍, 감소, 하향조절, 저하, 감쇠”한다는 것은, 형질 변화 전 모균주 또는 비변형 미생물이 본래 가지고 있던 특정 폴리펩티드의 활성에 비하여 낮아진 것을 의미한다.
이러한 폴리펩티드의 활성의 약화는, 당업계에 알려진 임의의 방법에 의하여 수행될 수 있으나 이로 제한되는 것은 아니며, 당해 분야에 잘 알려진 다양한 방법의 적용으로 달성될 수 있다(예컨대, Nakashima N et al., Bacterial cellular engineering by genome editing and gene silencing. Int J Mol Sci. 2014;15(2):2773-2793, Sambrook et al. Molecular Cloning 2012 등).
구체적으로, 본 출원의 폴리펩티드의 약화는
1) 폴리펩티드를 코딩하는 유전자 전체 또는 일부의 결손;
2) 폴리펩티드를 코딩하는 유전자의 발현이 감소하도록 발현조절영역(또는 발현조절서열)의 변형;
3) 폴리펩티드의 활성이 제거 또는 약화되도록 상기 폴리펩티드를 구성하는 아미노산 서열의 변형(예컨대, 아미노산 서열 상의 1 이상의 아미노산의 삭제/치환/부가);
4) 폴리펩티드의 활성이 제거 또는 약화되도록 상기 폴리펩티드를 코딩하는 유전자 서열의 변형 (예를 들어, 폴리펩티드의 활성이 제거 또는 약화되도록 변형된 폴리펩티드를 코딩하도록 상기 폴리펩티드 유전자의 핵산염기 서열 상의 1 이상의 핵산염기의 삭제/치환/부가);
5) 폴리펩티드를 코딩하는 유전자 전사체의 개시코돈 또는 5'-UTR 지역을 코딩하는 염기서열의 변형;
6) 폴리펩티드를 코딩하는 상기 유전자의 전사체에 상보적으로 결합하는 안티센스 올리고뉴클레오티드(예컨대, 안티센스 RNA)의 도입;
7) 리보솜(ribosome)의 부착이 불가능한 2차 구조물을 형성시키기 위하여 폴리펩티드를 코딩하는 유전자의 사인-달가르노(Shine-Dalgarno) 서열 앞단에 사인-달가르노 서열과 상보적인 서열의 부가;
8) 폴리펩티드를 코딩하는 유전자 서열의 ORF(open reading frame)의 3' 말단에 반대 방향으로 전사되는 프로모터의 부가(Reverse transcription engineering, RTE); 또는
9) 상기 1) 내지 8) 중 선택된 2 이상의 조합일 수 있으나, 이에, 특별히 제한되는 것은 아니다.
예컨대,
상기 1) 폴리펩티드를 코딩하는 상기 유전자 일부 또는 전체의 결손은, 염색체 내 내재적 목적 폴리펩티드를 코딩하는 폴리뉴클레오티드 전체의 제거, 일부 뉴클레오티드가 결실된 폴리뉴클레오티드로의 교체 또는 마커 유전자로 교체일 수 있다.
또한, 상기 2) 발현조절영역(또는 발현조절서열)의 변형은, 결실, 삽입, 비보존적 또는 보존적 치환 또는 이들의 조합으로 발현조절영역(또는 발현조절서열) 상의 변이 발생, 또는 더욱 약한 활성을 갖는 서열로의 교체일 수 있다. 상기 발현조절영역에는 프로모터, 오퍼레이터 서열, 리보좀 결합부위를 코딩하는 서열, 및 전사와 해독의 종결을 조절하는 서열을 포함하나, 이에 한정되는 것은 아니다.
또한, 상기 3) 폴리펩티드를 코딩하는 유전자 전사체의 개시코돈 또는 5'-UTR 지역을 코딩하는 염기서열 변형은, 예를 들면, 내재적 개시코돈에 비해 폴리펩티드 발현율이 더 낮은 다른 개시코돈을 코딩하는 염기서열로 치환하는 것일 수 있으나, 이에 제한되지 않는다.
또한, 상기 4) 및 5)의 아미노산 서열 또는 폴리뉴클레오티드 서열의 변형은 폴리펩티드의 활성을 약화하도록 상기 폴리펩티드의 아미노산 서열 또는 상기 폴리펩티드를 코딩하는 폴리뉴클레오티드 서열을 결실, 삽입, 비보존적 또는 보존적 치환 또는 이들의 조합으로 서열상의 변이 발생, 또는 더욱 약한 활성을 갖도록 개량된 아미노산 서열 또는 폴리뉴클레오티드 서열 또는 활성이 없도록 개량된 아미노산 서열 또는 폴리뉴클레오티드 서열로의 교체일 수 있으나, 이에 한정되는 것은 아니다. 예를 들면, 폴리뉴클레오티드 서열 내 변이를 도입하여 종결 코돈을 형성시킴으로써, 유전자의 발현을 저해하거나 약화시킬 수 있으나, 이에 제한되지 않는다.
상기 6) 폴리펩티드를 코딩하는 상기 유전자의 전사체에 상보적으로 결합하는 안티센스 올리고뉴클레오티드(예컨대, 안티센스 RNA)의 도입은 예를 들어 문헌 [Weintraub, H. et al., Antisense-RNA as a molecular tool for genetic analysis, Reviews - Trends in Genetics, Vol. 1(1) 1986]을 참고할 수 있다.
상기 7) 리보솜(ribosome)의 부착이 불가능한 2차 구조물을 형성시키기 위하여 폴리펩티드를 코딩하는 유전자의 사인-달가르노(Shine-Dalgarno) 서열 앞단에 사인-달가르노 서열과 상보적인 서열의 부가는 mRNA 번역을 불가능하게 하거나 속도를 저하시키는 것일 수 있다.
상기 8) 폴리펩티드를 코딩하는 유전자서열의 ORF(open reading frame)의 3' 말단에 반대 방향으로 전사되는 프로모터의 부가(Reverse transcription engineering, RTE)는 상기 폴리펩티드를 코딩하는 유전자의 전사체에 상보적인 안티센스 뉴클레오티드를 만들어 활성을 약화하는 것일 수 있다.
본 출원에서 용어, 폴리펩티드 활성의 “강화”는, 폴리펩티드의 활성이 내재적 활성에 비하여 증가되는 것을 의미한다. 상기 강화는 활성화(activation), 상향조절(up-regulation), 과발현(overexpression), 증가(increase) 등의 용어와 혼용될 수 있다. 여기서 활성화, 강화, 상향조절, 과발현, 증가는 본래 가지고 있지 않았던 활성을 나타내게 되는 것, 또는 내재적 활성 또는 변형 전 활성에 비하여 향상된 활성을 나타내게 되는 것을 모두 포함할 수 있다. 상기 “내재적 활성”은 자연적 또는 인위적 요인에 의한 유전적 변이로 형질이 변화하는 경우, 형질 변화 전 모균주 또는 비변형 미생물이 본래 가지고 있던 특정 폴리펩티드의 활성을 의미한다. 이는 “변형 전 활성”과 혼용되어 사용될 수 있다. 폴리펩티드의 활성이 내재적 활성에 비하여 “강화”, “상향조절”, “과발현” 또는 “증가”한다는 것은, 형질 변화 전 모균주 또는 비변형 미생물이 본래 가지고 있던 특정 폴리펩티드의 활성 및/또는 농도(발현량)에 비하여 향상된 것을 의미한다.
상기 강화는 외래의 폴리펩티드를 도입하거나, 내재적인 폴리펩티드의 활성 강화 및/또는 농도(발현량)를 통해 달성할 수 있다. 상기 폴리펩티드의 활성의 강화 여부는 해당 폴리펩티드의 활성 정도, 발현량 또는 해당 폴리펩티드로부터 배출되는 산물의 양의 증가로부터 확인할 수 있다.
상기 폴리펩티드의 활성의 강화는 당해 분야에 잘 알려진 다양한 방법의 적용이 가능하며, 목적 폴리펩티드의 활성을 변형전 미생물보다 강화시킬 수 있는 한, 제한되지 않는다. 구체적으로, 분자생물학의 일상적 방법인 당업계의 통상의 기술자에게 잘 알려진 유전자 공학 및/또는 단백질 공학을 이용한 것일 수 있으나, 이로 제한되지 않는다(예컨대, Sitnicka et al. Functional Analysis of Genes. Advances in Cell Biology. 2010, Vol. 2. 1-16, Sambrook et al. Molecular Cloning 2012 등).
구체적으로, 본 출원의 폴리펩티드의 강화는
1) 폴리펩티드를 코딩하는 폴리뉴클레오티드의 세포 내 카피수 증가;
2) 폴리펩티드를 코딩하는 염색체상의 유전자 발현조절영역을 활성이 강력한 서열로 교체;
3) 폴리펩티드를 코딩하는 유전자 전사체의 개시코돈 또는 5'-UTR 지역을 코딩하는 염기서열의 변형;
4) 폴리펩티드 활성이 강화되도록 상기 폴리펩티드의 아미노산 서열의 변형;
5) 폴리펩티드 활성이 강화도록 상기 폴리펩티드를 코딩하는 폴리뉴클레오티드 서열의 변형 (예를 들어, 폴리펩티드의 활성이 강화되도록 변형된 폴리펩티드를 코딩하도록 상기 폴리펩티드 유전자의 폴리뉴클레오티드 서열의 변형);
6) 폴리펩티드의 활성을 나타내는 외래 폴리펩티드 또는 이를 코딩하는 외래 폴리뉴클레오티드의 도입;
7) 폴리펩티드를 암호화하는 폴리뉴클레오티드의 코돈 최적화;
8) 폴리펩티드의 삼차구조를 분석하여 노출 부위를 선택하여 변형하거나 화학적으로 수식; 또는
9) 상기 1) 내지 8) 중 선택된 2 이상의 조합일 수 있으나, 이에, 특별히 제한되는 것은 아니다.
보다 구체적으로,
상기 1) 폴리펩티드를 코딩하는 폴리뉴클레오티드의 세포 내 카피수 증가는, 해당 폴리펩티드를 코딩하는 폴리뉴클레오티드가 작동가능하게 연결된, 숙주와 무관하게 복제되고 기능할 수 있는 벡터의 숙주세포 내로의 도입에 의해 달성되는 것일 수 있다. 또는, 해당 폴리펩티드를 코딩하는 폴리뉴클레오티드가 숙주세포 내의 염색체 내에 1 카피 또는 2 카피 이상 도입에 의해 달성되는 것일 수 있다. 상기 염색체 내에 도입은 숙주세포 내의 염색체 내로 상기 폴리뉴클레오티드를 삽입시킬 수 있는 벡터가 숙주세포 내에 도입됨으로써 수행될 수 있으나, 이에 제한되지 않는다. 상기 벡터는 전술한 바와 같다.
상기 2) 폴리펩티드를 코딩하는 염색체상의 유전자 발현조절영역(또는 발현조절서열)을 활성이 강력한 서열로 교체는, 예를 들면, 상기 발현조절영역의 활성을 더욱 강화하도록 결실, 삽입, 비보존적 또는 보존적 치환 또는 이들의 조합으로 서열상의 변이 발생, 또는 더욱 강한 활성을 가지는 서열로의 교체일 수 있다. 상기 발현조절영역은, 특별히 이에 제한되지 않으나 프로모터, 오퍼레이터 서열, 리보좀 결합 부위를 코딩하는 서열, 그리고 전사 및 해독의 종결을 조절하는 서열 등을 포함할 수 있다. 일 예로, 본래의 프로모터를 강력한 프로모터로 교체시키는 것일 수 있으나, 이에 제한되지 않는다.
공지된 강력한 프로모터의 예에는 CJ1 내지 CJ7 프로모터(미국등록특허 US 7662943 B2), lac 프로모터, trp 프로모터, trc 프로모터, tac 프로모터, 람다 파아지 PR 프로모터, PL 프로모터, tet 프로모터, gapA 프로모터, SPL7 프로모터, SPL13(sm3) 프로모터(미국등록특허 US 10584338 B2), O2 프로모터(미국등록특허 US 10273491 B2), tkt 프로모터, yccA 프로모터 등이 있으나, 이에 제한되지 않는다.
상기 3) 폴리펩티드를 코딩하는 유전자 전사체의 개시코돈 또는 5'-UTR 지역을 코딩하는 염기서열 변형은, 예를 들면, 내재적 개시코돈에 비해 폴리펩티드 발현율이 더 높은 다른 개시코돈을 코딩하는 염기 서열로 치환하는 것일 수 있으나, 이에 제한되지 않는다.
상기 4) 및 5)의 아미노산 서열 또는 폴리뉴클레오티드 서열의 변형은, 폴리펩티드의 활성을 강화하도록 상기 폴리펩티드의 아미노산 서열 또는 상기 폴리펩티드를 코딩하는 폴리뉴클레오티드 서열을 결실, 삽입, 비보존적 또는 보존적 치환 또는 이들의 조합으로 서열상의 변이 발생, 또는 더욱 강한 활성을 갖도록 개량된 아미노산 서열 또는 폴리뉴클레오티드 서열 또는 활성이 증가하도록 개량된 아미노산 서열 또는 폴리뉴클레오티드 서열로의 교체일 수 있으나, 이에 한정되는 것은 아니다. 상기 교체는 구체적으로 상동재조합에 의하여 폴리뉴클레오티드를 염색체내로 삽입함으로써 수행될 수 있으나, 이에 제한되지 않는다. 이때 사용되는 벡터는 염색체 삽입 여부를 확인하기 위한 선별 마커 (selection marker)를 추가로 포함할 수 있다. 상기 선별 마커는 전술한 바와 같다.
상기 6) 폴리펩티드의 활성을 나타내는 외래 폴리뉴클레오티드의 도입은, 상기 폴리펩티드와 동일/유사한 활성을 나타내는 폴리펩티드를 코딩하는 외래 폴리뉴클레오티드의 숙주세포 내 도입일 수 있다. 상기 외래 폴리뉴클레오티드는 상기 폴리펩티드와 동일/유사한 활성을 나타내는 한 그 유래나 서열에 제한이 없다. 상기 도입에 이용되는 방법은 공지된 형질전환 방법을 당업자가 적절히 선택하여 수행될 수 있으며, 숙주 세포 내에서 상기 도입된 폴리뉴클레오티드가 발현됨으로써 폴리펩티드가 생성되어 그 활성이 증가될 수 있다.
상기 7) 폴리펩티드를 암호화하는 폴리뉴클레오티드의 코돈 최적화는, 내재 폴리뉴클레오티드가 숙주세포 내에서 전사 또는 번역이 증가하도록 코돈 최적화한 것이거나, 또는 외래 폴리뉴클레오티드가 숙주세포 내에서 최적화된 전사, 번역이 이루어지도록 이의 코돈을 최적화한 것일 수 있다.
상기 8) 폴리펩티드의 삼차구조를 분석하여 노출 부위를 선택하여 변형하거나 화학적으로 수식하는 것은, 예를 들어 분석하고자 하는 폴리펩티드의 서열정보를 기지 단백질들의 서열정보가 저장된 데이터베이스와 비교함으로써 서열의 유사성 정도에 따라 주형 단백질 후보를 결정하고 이를 토대로 구조를 확인하여, 변형하거나 화학적으로 수식할 노출 부위를 선택하여 변형 또는 수식하는 것일 수 있다.
이와 같은 폴리펩티드 활성의 강화는, 상응하는 폴리펩티드의 활성 또는 농도 발현량이 야생형이나 변형 전 미생물 균주에서 발현된 폴리펩티드의 활성 또는 농도를 기준으로 하여 증가되거나, 해당 폴리펩티드로부터 생산되는 산물의 양의 증가되는 것일 수 있으나, 이에 제한되는 것은 아니다.
본 출원의 미생물에서 폴리뉴클레오티드의 일부 또는 전체의 변형(예컨대, 상술한 단백질 변이체를 코딩하기 위한 변형)은 (a) 미생물 내 염색체 삽입용 벡터를 이용한 상동 재조합 또는 유전자가위 (engineered nuclease, e.g., CRISPR-Cas9)을 이용한 유전체 교정 및/또는 (b) 자외선 및 방사선 등과 같은 빛 및/또는 화학물질 처리에 의해 유도될 수 있으나 이에 제한되지 않는다. 상기 유전자 일부 또는 전체의 변형 방법에는 DNA 재조합 기술에 의한 방법이 포함될 수 있다. 예를 들면, 목적 유전자와 상동성이 있는 뉴클레오티드 서열을 포함하는 뉴클레오티드 서열 또는 벡터를 상기 미생물에 주입하여 상동 재조합(homologous recombination)이 일어나게 함으로써 유전자 일부 또는 전체의 결손이 이루어질 수 있다. 상기 주입되는 뉴클레오티드 서열 또는 벡터는 우성 선별 마커를 포함할 수 있으나, 이에 제한되는 것은 아니다.
본 출원의 미생물에서, 변이체, 폴리뉴클레오티드 및 L-라이신 등은 상기 다른 양태에서 기재한 바와 같다.
본 출원의 또 다른 하나의 양태는 본 출원의 변이체(예를 들면, 상기 (a) 및 (b)의 단백질 변이체) 또는 본 출원의 폴리뉴클레오티드(예를 들면, 상기 (a) 변이체를 코딩하는 폴리펩티드, 상기 (b) 변이체를 코딩하는 폴리펩티드, 및/또는 상기 (a)와 (b)를 코딩하는 폴리펩티드)를 포함하는 코리네박테리움 글루타미쿰 균주를 배지에서 배양하는 단계를 포함하는, L-아미노산 생산방법을 제공한다.
일 예에서, 본 출원의 코리네박테리움 글루타미쿰 균주를 배지에서 배양하는 단계를 포함하는, L-아미노산 생산방법을 제공할 수 있다.
본 출원의 L-아미노산 생산방법은 본 출원의 코리네박테리움 글루타미쿰 (또는 본 출원의 변이체 또는 본 출원의 폴리뉴클레오티드 또는 본 출원의 벡터를 포함하는 코리네박테리움 글루타미쿰) 균주를 배지에서 배양하는 단계를 포함할 수 있다.
더불어, 본 출원의 L-아미노산은 L- 라이신일 수 있다.
본 출원에서, 용어 "배양"은 본 출원의 코리네박테리움 글루타미쿰 균주를 적당히 조절된 환경 조건에서 생육시키는 것을 의미한다. 본 출원의 배양과정은 당업계에 알려진 적당한 배지와 배양조건에 따라 이루어질 수 있다. 이러한 배양 과정은 선택되는 균주에 따라 당업자가 용이하게 조정하여 사용할 수 있다. 구체적으로 상기 배양은 회분식, 연속식 및/또는 유가식일 수 있으나, 이에 제한되는 것은 아니다.
본 출원에서 용어, "배지"는 본 출원의 코리네박테리움 글루타미쿰 균주를 배양하기 위해 필요로 하는 영양물질을 주성분으로 혼합한 물질을 의미하며, 생존 및 발육에 불가결한 물을 비롯하여 영양물질 및 발육인자 등을 공급한다. 구체적으로, 본 출원의 코리네박테리움 글루타미쿰 균주의 배양에 사용되는 배지 및 기타 배양 조건은 통상의 미생물의 배양에 사용되는 배지라면 특별한 제한 없이 어느 것이나 사용할 수 있으나, 본 출원의 코리네박테리움 글루타미쿰 균주를 적당한 탄소원, 질소원, 인원, 무기화합물, 아미노산 및/또는 비타민 등을 함유한 통상의 배지 내에서 호기성 조건 하에서 온도, pH 등을 조절하면서 배양할 수 있다.
구체적으로, 코리네박테리움 속 균주에 대한 배양 배지는 문헌["Manual of Methods for General Bacteriology" by the American Society for Bacteriology (Washington D.C., USA, 1981)]에서 찾아 볼 수 있다.
본 출원에서 상기 탄소원으로는 글루코오스, 사카로오스, 락토오스, 프룩토오스, 수크로오스, 말토오스 등과 같은 탄수화물; 만니톨, 소르비톨 등과 같은 당 알코올, 피루브산, 락트산, 시트르산 등과 같은 유기산; 글루탐산, 메티오닌, 라이신 등과 같은 아미노산 등이 포함될 수 있다. 또한, 전분 가수분해물, 당밀, 블랙스트랩 당밀, 쌀겨울, 카사버, 사탕수수 찌꺼기 및 옥수수 침지액 같은 천연의 유기 영양원을 사용할 수 있으며, 구체적으로는 글루코오스 및 살균된 전처리 당밀(즉, 환원당으로 전환된 당밀) 등과 같은 탄수화물이 사용될 수 있으며, 그 외의 적정량의 탄소원을 제한 없이 다양하게 이용할 수 있다. 이들 탄소원은 단독으로 사용되거나 2 종 이상이 조합되어 사용될 수 있으며, 이에 한정되는 것은 아니다.
상기 질소원으로는 암모니아, 황산암모늄, 염화암모늄, 초산암모늄, 인산암모늄, 탄산안모늄, 질산암모늄 등과 같은 무기질소원; 글루탐산, 메티오닌, 글루타민 등과 같은 아미노산, 펩톤, NZ-아민, 육류 추출물, 효모 추출물, 맥아 추출물, 옥수수 침지액, 카세인 가수분해물, 어류 또는 그의 분해생성물, 탈지 대두 케이크 또는 그의 분해 생성물 등과 같은 유기 질소원이 사용될 수 있다. 이들 질소원은 단독으로 사용되거나 2 종 이상이 조합되어 사용될 수 있으며, 이에 한정되는 것은 아니다.
상기 인원으로는 인산 제1칼륨, 인산 제2칼륨, 또는 이에 대응되는 소디움-함유 염 등이 포함될 수 있다. 무기화합물로는 염화나트륨, 염화칼슘, 염화철, 황산마그네슘, 황산철, 황산망간, 탄산칼슘 등이 사용될 수 있으며, 그 외에 아미노산, 비타민 및/또는 적절한 전구체 등이 포함될 수 있다. 이들 구성성분 또는 전구체는 배지에 회분식 또는 연속식으로 첨가될 수 있다. 그러나, 이에 한정되는 것은 아니다.
또한, 본 출원의 코리네박테리움 글루타미쿰 균주의 배양 중에 수산화암모늄, 수산화칼륨, 암모니아, 인산, 황산 등과 같은 화합물을 배지에 적절한 방식으로 첨가하여, 배지의 pH를 조정할 수 있다. 또한, 배양 중에는 지방산 폴리글리콜 에스테르와 같은 소포제를 사용하여 기포 생성을 억제할 수 있다. 또한, 배지의 호기 상태를 유지하기 위하여, 배지 내로 산소 또는 산소 함유 기체를 주입하거나 혐기 및 미호기 상태를 유지하기 위해 기체의 주입 없이 혹은 질소, 수소 또는 이산화탄소 가스를 주입할 수 있으며, 이에 한정되는 것은 아니다.
본 출원의 배양에서 배양온도는 20 내지 45℃ 구체적으로는 25 내지 40℃ 를 유지할 수 있고, 약 10 내지 160 시간 동안 배양할 수 있으나, 이에 한정되는 것은 아니다.
본 출원의 배양에 의하여 생산된 L-아미노산은 배지 중으로 분비되거나 세포 내에 잔류할 수 있다.
본 출원의 L-아미노산 생산방법은, 본 출원의 코리네박테리움 글루타미쿰 균주를 준비하는 단계, 상기 균주를 배양하기 위한 배지를 준비하는 단계, 또는 이들의 조합(순서에 무관, in any order)을, 예를 들어, 상기 배양하는 단계 이전에, 추가로 포함할 수 있다.
본 출원의 L-아미노산 생산방법은, 상기 배양에 따른 배지(배양이 수행된 배지) 또는 코리네박테리움 글루타미쿰 균주로부터 L-아미노산을 회수하는 단계를 추가로 포함할 수 있다. 상기 회수하는 단계는 상기 배양하는 단계 이후에 추가로 포함될 수 있다.
상기 회수는 본 출원의 미생물의 배양 방법, 예를 들어 회분식, 연속식 또는 유가식 배양 방법 등에 따라 당해 기술 분야에 공지된 적합한 방법을 이용하여 목적하는 L-아미노산을 수집(collect)하는 것일 수 있다. 예를 들어, 원심분리, 여과, 결정화 단백질 침전제에 의한 처리(염석법), 추출, 초음파 파쇄, 한외여과, 투석법, 분자체 크로마토그래피(겔여과), 흡착크로마토그래피, 이온교환 크로마토그래피, 친화도 크로마토그래피 등의 각종 크로마토그래피, HPLC 또는 이들의 방법을 조합하여 사용될 수 있으며, 당해 분야에 공지된 적합한 방법을 이용하여 배지 또는 미생물로부터 목적하는 L-아미노산을 회수할 수 있다.
또한, 본 출원의 L-아미노산 생산방법은, 추가적으로 정제 단계를 포함할 수 있다. 상기 정제는 당해 기술분야에 공지된 적합한 방법을 이용하여, 수행할 수 있다. 일 예에서, 본 출원의 L-아미노산 생산방법이 회수 단계와 정제 단계를 모두 포함하는 경우, 상기 회수 단계와 정제 단계는 순서에 상관없이 연속적 또는 비연속적으로 수행되거나, 동시에 또는 하나의 단계로 통합되어 수행될 수 있으나, 이에 제한되는 것은 아니다.
본 출원의 방법에서, 변이체, 폴리뉴클레오티드, 벡터 및 균주 등은 상기 다른 양태에서 기재한 바와 같다.
본 출원의 또 다른 하나의 양태는 본 출원의 변이체(예를 들면, 상기 (a) 및 (b)의 변이체), 상기 변이체를 코딩하는 폴리뉴클레오타이드(예를 들면, 상기 (a) 변이체를 코딩하는 폴리펩티드, 상기 (b) 변이체를 코딩하는 폴리펩티드, 및/또는 상기 (a)와 (b)를 코딩하는 폴리펩티드), 상기 폴리뉴클레오타이드를 포함하는 벡터(예를 들면, 상기 (a) 및/또는 (b)를 코딩하는 폴리뉴클레오티드를 포함하는 벡터; 및/또는 상기 (a) 변이체를 포함하는 폴리펩티드를 포함하는 벡터와 상기 (b) 변이체를 포함하는 벡터) 또는 본 출원의 폴리뉴클레오티드를 포함하는 코리네박테리움 글루타미쿰 균주; 이를 배양한 배지; 또는 이들 중 2 이상의 조합을 포함하는 L-아미노산 생산용 조성물을 제공하는 것이다.
본 출원의 조성물은 아미노산 생산용 조성물에 통상 사용되는 임의의 적합한 부형제를 추가로 포함할 수 있으며, 이러한 부형제는, 예를 들어 보존제, 습윤제, 분산제, 현탁화제, 완충제, 안정화제 또는 등장화제 등일 수 있으나, 이에 한정되는 것은 아니다.
본 출원의 조성물에서, 변이체, 폴리뉴클레오티드, 벡터, 균주, 배지 및 L-아미노산 등은 상기 다른 양태에서 기재한 바와 같다.
<110> CJ CheilJedang Corporation <120> Novel protein variant and a method for producing L-lysine using the same <130> DPP20210469KR <160> 52 <170> koPatentIn 3.0 <210> 1 <211> 433 <212> PRT <213> Artificial Sequence <220> <223> (F220C)_integral membrane transport protein <400> 1 Met Thr Thr Ala Val Asp Gln Asn Ser Pro Pro Lys Gln Gln Leu Asn 1 5 10 15 Lys Arg Val Leu Leu Gly Ser Leu Ser Gly Ser Val Ile Glu Trp Phe 20 25 30 Asp Phe Leu Val Tyr Gly Thr Val Ala Ala Leu Val Phe Asn Lys Met 35 40 45 Tyr Phe Pro Ser Gly Asn Glu Phe Leu Ser Thr Ile Leu Ala Tyr Ala 50 55 60 Ser Phe Ser Leu Thr Phe Phe Phe Arg Pro Ile Gly Gly Val Ile Phe 65 70 75 80 Ala His Ile Gly Asp Arg Ile Gly Arg Lys Lys Thr Leu Phe Ile Thr 85 90 95 Leu Met Leu Met Gly Gly Gly Thr Val Ala Ile Gly Leu Leu Pro Asp 100 105 110 Tyr Asn Ala Ile Gly Ile Trp Ala Pro Ile Leu Leu Met Phe Leu Arg 115 120 125 Ile Leu Gln Gly Ile Gly Ile Gly Gly Glu Trp Gly Gly Ala Leu Leu 130 135 140 Leu Ala Tyr Glu Tyr Ala Pro Lys Lys Gln Arg Gly Leu Tyr Gly Ala 145 150 155 160 Val Pro Gln Met Gly Ile Ser Leu Gly Met Leu Leu Ala Ala Gly Val 165 170 175 Ile Ser Leu Leu Thr Leu Met Pro Glu Asp Gln Phe Leu Thr Trp Gly 180 185 190 Trp Arg Ile Pro Phe Val Gly Ser Ile Leu Leu Val Phe Ile Gly Leu 195 200 205 Phe Ile Arg Asn Gly Leu Asp Glu Thr Pro Glu Cys Lys Arg Ile Arg 210 215 220 Asp Ser Gly Gln Gln Val Lys Met Pro Leu Lys Glu Val Leu Thr Lys 225 230 235 240 Tyr Trp Pro Ala Val Leu Val Ser Ile Gly Ala Lys Ala Ala Glu Thr 245 250 255 Gly Pro Phe Tyr Ile Phe Gly Thr Tyr Ile Val Ala Tyr Ala Thr Asn 260 265 270 Phe Leu Asn Ile Arg Asp Asn Ile Val Leu Leu Ala Val Ala Cys Ala 275 280 285 Ala Leu Val Ala Thr Ile Trp Met Pro Leu Phe Gly Ser Phe Ser Asp 290 295 300 Arg Val Asn Arg Ala Val Leu Tyr Arg Ile Cys Ala Ser Ala Thr Ile 305 310 315 320 Val Leu Ile Val Pro Tyr Tyr Leu Val Leu Asn Thr Gly Glu Ile Trp 325 330 335 Ala Leu Phe Ile Thr Thr Val Ile Gly Phe Gly Ile Leu Trp Gly Ser 340 345 350 Val Asn Ala Ile Leu Gly Thr Val Ile Ala Glu Asn Phe Ala Pro Glu 355 360 365 Val Arg Tyr Thr Gly Ala Thr Leu Gly Tyr Gln Val Gly Ala Ala Leu 370 375 380 Phe Gly Gly Thr Ala Pro Ile Ile Ala Ala Trp Leu Phe Glu Ile Ser 385 390 395 400 Gly Gly Gln Trp Trp Pro Ile Ala Val Tyr Val Ala Ala Cys Cys Leu 405 410 415 Leu Ser Val Ile Ala Ser Phe Phe Ile Gln Arg Val Ala His Gln Glu 420 425 430 Asn <210> 2 <211> 1302 <212> DNA <213> Artificial Sequence <220> <223> (F220C)_NCgl2816 <400> 2 atgacaaccg cagtagatca aaactcaccg cccaagcagc aactcaacaa gcgcgtcctg 60 ctgggcagct tgagtggcag cgttatcgaa tggttcgact tcctggttta cggaaccgtc 120 gccgcgctgg tcttcaacaa gatgtacttc cccagcggca acgagttcct ctccacaatc 180 ctggcgtacg catccttctc cctgaccttc ttcttccgcc ccattggtgg cgtcatcttc 240 gcccacatcg gcgaccgcat tgggcgtaag aagaccctgt tcatcacctt gatgctcatg 300 ggtggcggca ccgtcgccat tggtttgctg cccgactaca acgccatcgg catttgggca 360 ccaatccttc tgatgttcct ccgcattttg cagggcatcg gaattggcgg cgaatggggt 420 ggcgcactgc tcctggcata cgaatacgct ccaaagaagc agcgtgggct ctacggcgca 480 gttcctcaaa tgggcatttc cctgggcatg ctgcttgcag ctggcgtgat ctctctgctc 540 accctcatgc cggaagatca gttcctcacc tggggctggc gcatcccatt cgtcggatcc 600 atcctcctag tgttcatcgg cctgttcatc cgaaacggcc ttgatgaaac ccccgagtgc 660 aagcgtatcc gcgattccgg ccagcaggta aagatgcctc tgaaggaagt tctgaccaag 720 tactggccag ccgttctggt ctccatcggc gcaaaagctg ccgagaccgg ccccttctac 780 atcttcggca cctacatcgt tgcttacgca accaacttcc tgaacatccg cgacaacatt 840 gtccttctgg cagttgcttg cgccgccctc gttgccacca tctggatgcc actgttcgga 900 tccttctccg accgcgtcaa ccgtgcagtg ctctacagga tctgtgcatc cgcaaccatc 960 gtgctgattg tcccttacta cttggtcctc aacaccggcg aaatttgggc actgtttatc 1020 actaccgtga ttggcttcgg catcctctgg ggtagcgtca acgcaatcct cggaaccgtc 1080 atcgcagaaa acttcgcacc tgaggtccgc tacaccggcg ctaccctggg ttaccaagtc 1140 ggagcagcac tcttcggcgg taccgcaccc attatcgcag catggctgtt cgaaatctcc 1200 ggcggacaat ggtggccaat cgccgtctac gtcgctgcat gttgccttct ctctgtgatc 1260 gcctcgttct tcatccaacg cgtcgcgcac caagagaact aa 1302 <210> 3 <211> 433 <212> PRT <213> Artificial Sequence <220> <223> (WT)_integral membrane transport protein <400> 3 Met Thr Thr Ala Val Asp Gln Asn Ser Pro Pro Lys Gln Gln Leu Asn 1 5 10 15 Lys Arg Val Leu Leu Gly Ser Leu Ser Gly Ser Val Ile Glu Trp Phe 20 25 30 Asp Phe Leu Val Tyr Gly Thr Val Ala Ala Leu Val Phe Asn Lys Met 35 40 45 Tyr Phe Pro Ser Gly Asn Glu Phe Leu Ser Thr Ile Leu Ala Tyr Ala 50 55 60 Ser Phe Ser Leu Thr Phe Phe Phe Arg Pro Ile Gly Gly Val Ile Phe 65 70 75 80 Ala His Ile Gly Asp Arg Ile Gly Arg Lys Lys Thr Leu Phe Ile Thr 85 90 95 Leu Met Leu Met Gly Gly Gly Thr Val Ala Ile Gly Leu Leu Pro Asp 100 105 110 Tyr Asn Ala Ile Gly Ile Trp Ala Pro Ile Leu Leu Met Phe Leu Arg 115 120 125 Ile Leu Gln Gly Ile Gly Ile Gly Gly Glu Trp Gly Gly Ala Leu Leu 130 135 140 Leu Ala Tyr Glu Tyr Ala Pro Lys Lys Gln Arg Gly Leu Tyr Gly Ala 145 150 155 160 Val Pro Gln Met Gly Ile Ser Leu Gly Met Leu Leu Ala Ala Gly Val 165 170 175 Ile Ser Leu Leu Thr Leu Met Pro Glu Asp Gln Phe Leu Thr Trp Gly 180 185 190 Trp Arg Ile Pro Phe Val Gly Ser Ile Leu Leu Val Phe Ile Gly Leu 195 200 205 Phe Ile Arg Asn Gly Leu Asp Glu Thr Pro Glu Phe Lys Arg Ile Arg 210 215 220 Asp Ser Gly Gln Gln Val Lys Met Pro Leu Lys Glu Val Leu Thr Lys 225 230 235 240 Tyr Trp Pro Ala Val Leu Val Ser Ile Gly Ala Lys Ala Ala Glu Thr 245 250 255 Gly Pro Phe Tyr Ile Phe Gly Thr Tyr Ile Val Ala Tyr Ala Thr Asn 260 265 270 Phe Leu Asn Ile Arg Asp Asn Ile Val Leu Leu Ala Val Ala Cys Ala 275 280 285 Ala Leu Val Ala Thr Ile Trp Met Pro Leu Phe Gly Ser Phe Ser Asp 290 295 300 Arg Val Asn Arg Ala Val Leu Tyr Arg Ile Cys Ala Ser Ala Thr Ile 305 310 315 320 Val Leu Ile Val Pro Tyr Tyr Leu Val Leu Asn Thr Gly Glu Ile Trp 325 330 335 Ala Leu Phe Ile Thr Thr Val Ile Gly Phe Gly Ile Leu Trp Gly Ser 340 345 350 Val Asn Ala Ile Leu Gly Thr Val Ile Ala Glu Asn Phe Ala Pro Glu 355 360 365 Val Arg Tyr Thr Gly Ala Thr Leu Gly Tyr Gln Val Gly Ala Ala Leu 370 375 380 Phe Gly Gly Thr Ala Pro Ile Ile Ala Ala Trp Leu Phe Glu Ile Ser 385 390 395 400 Gly Gly Gln Trp Trp Pro Ile Ala Val Tyr Val Ala Ala Cys Cys Leu 405 410 415 Leu Ser Val Ile Ala Ser Phe Phe Ile Gln Arg Val Ala His Gln Glu 420 425 430 Asn <210> 4 <211> 1302 <212> DNA <213> Artificial Sequence <220> <223> (WT)_NCgl2816 <400> 4 atgacaaccg cagtagatca aaactcaccg cccaagcagc aactcaacaa gcgcgtcctg 60 ctgggcagct tgagtggcag cgttatcgaa tggttcgact tcctggttta cggaaccgtc 120 gccgcgctgg tcttcaacaa gatgtacttc cccagcggca acgagttcct ctccacaatc 180 ctggcgtacg catccttctc cctgaccttc ttcttccgcc ccattggtgg cgtcatcttc 240 gcccacatcg gcgaccgcat tgggcgtaag aagaccctgt tcatcacctt gatgctcatg 300 ggtggcggca ccgtcgccat tggtttgctg cccgactaca acgccatcgg catttgggca 360 ccaatccttc tgatgttcct ccgcattttg cagggcatcg gaattggcgg cgaatggggt 420 ggcgcactgc tcctggcata cgaatacgct ccaaagaagc agcgtgggct ctacggcgca 480 gttcctcaaa tgggcatttc cctgggcatg ctgcttgcag ctggcgtgat ctctctgctc 540 accctcatgc cggaagatca gttcctcacc tggggctggc gcatcccatt cgtcggatcc 600 atcctcctag tgttcatcgg cctgttcatc cgaaacggcc ttgatgaaac ccccgagttc 660 aagcgtatcc gcgattccgg ccagcaggta aagatgcctc tgaaggaagt tctgaccaag 720 tactggccag ccgttctggt ctccatcggc gcaaaagctg ccgagaccgg ccccttctac 780 atcttcggca cctacatcgt tgcttacgca accaacttcc tgaacatccg cgacaacatt 840 gtccttctgg cagttgcttg cgccgccctc gttgccacca tctggatgcc actgttcgga 900 tccttctccg accgcgtcaa ccgtgcagtg ctctacagga tctgtgcatc cgcaaccatc 960 gtgctgattg tcccttacta cttggtcctc aacaccggcg aaatttgggc actgtttatc 1020 actaccgtga ttggcttcgg catcctctgg ggtagcgtca acgcaatcct cggaaccgtc 1080 atcgcagaaa acttcgcacc tgaggtccgc tacaccggcg ctaccctggg ttaccaagtc 1140 ggagcagcac tcttcggcgg taccgcaccc attatcgcag catggctgtt cgaaatctcc 1200 ggcggacaat ggtggccaat cgccgtctac gtcgctgcat gttgccttct ctctgtgatc 1260 gcctcgttct tcatccaacg cgtcgcgcac caagagaact aa 1302 <210> 5 <211> 775 <212> PRT <213> Artificial Sequence <220> <223> (P43L)_DNA polymerase III subunits gamma and tau <400> 5 Met Ala Leu Tyr Ser Lys Tyr Arg Pro Ala Ser Phe Gly Glu Leu Val 1 5 10 15 Gly Gln Ser Gln Val Thr Asp Pro Leu Ser Ala Ala Leu Asp Ser Gly 20 25 30 Arg Ile Asn His Ala Tyr Leu Phe Ser Gly Leu Arg Gly Cys Gly Lys 35 40 45 Thr Ser Ser Ala Arg Ile Leu Ala Arg Ser Leu Asn Cys Val Glu Gly 50 55 60 Pro Thr Ser Thr Pro Cys Gly Val Cys Asn Ser Cys Val Ala Leu Ala 65 70 75 80 Pro Gly Gly Pro Gly Thr Leu Asp Val Thr Glu Leu Asp Ala Ala Ser 85 90 95 Asn Asn Gly Val Asp Asp Met Arg Glu Leu Arg Glu Arg Ala Asn Tyr 100 105 110 Ala Pro Ala Glu Ser Arg Tyr Arg Val Phe Ile Ile Asp Glu Ala His 115 120 125 Met Ile Ser Thr Gln Gly Phe Asn Ala Leu Leu Lys Ile Val Glu Glu 130 135 140 Pro Pro Ala His Leu Ile Phe Ile Phe Ala Thr Thr Glu Pro Asp Lys 145 150 155 160 Met Ile Gly Thr Ile Arg Ser Arg Thr His Asn Tyr Pro Phe Arg Leu 165 170 175 Leu Thr Pro Gly Asp Met Arg Lys Val Leu Lys Asn Ala Val Asp Gly 180 185 190 Glu Gly Val His Val Asp Asp Ser Val Tyr Pro Leu Val Ile Arg Ala 195 200 205 Gly Gly Gly Ser Pro Arg Asp Ser Leu Ser Ile Leu Asp Gln Leu Ile 210 215 220 Ala Gly Ser Gly Pro Glu Gly Leu Thr Tyr Glu Arg Ala Leu Pro Leu 225 230 235 240 Leu Gly Val Thr Ser Phe Thr Leu Ile Asp Asp Ser Ile His Ala Leu 245 250 255 Ala Ser Lys Asp Asn Ala Ser Met Phe Thr Thr Ile Asp Asn Val Ile 260 265 270 Glu Glu Gly Leu Glu Pro Arg Arg Phe Thr Ile Asp Leu Leu Asp Arg 275 280 285 Leu Arg Asp Leu Met Val Leu Gln Ala Val Pro Glu Ala Leu Asn Leu 290 295 300 Gly Leu Val Asp Ala Pro Thr Asp Arg Ala Asp Ala Leu Ile Glu Gln 305 310 315 320 Ser Thr Leu Phe Lys Gly Asn Glu Leu Ala Asn Leu Ala Ser Met Val 325 330 335 Asn Ser Gly Leu Asp Asp Met Arg Gly Ala Thr Ser Pro Arg Leu Leu 340 345 350 Leu Glu Ile Leu Cys Ala Arg Leu Leu Leu Ala Ser Asn Thr Val Ala 355 360 365 Gly Pro Ala Val Ser Ser Ser Thr Asp Ala Ala Pro Ala Ala Thr Pro 370 375 380 Gly Gly Leu Thr Gly Ile Ala Ala Ala Arg Ala Lys Ala Arg Glu Tyr 385 390 395 400 Gly Gln Lys Lys Ala Ala Pro Ala Pro Ala Pro Thr Pro Ala Pro Glu 405 410 415 Pro Val Arg Glu Gln Ser Leu Ala Pro Thr Pro Glu Pro Thr Pro Ala 420 425 430 Ala Glu Pro Thr Ser Gln Pro Ala Pro Glu Pro Glu Pro Ala Arg Glu 435 440 445 Pro Val Val Glu Val Arg Glu Ala Ser Val Glu Lys Gln Pro Ala Ser 450 455 460 Ser Asp Pro Leu Glu Thr Ile Arg Ser Arg Trp Ser Glu Leu Arg Asn 465 470 475 480 Ile Val Glu Lys Gln Ser Val Arg Thr Ser Ile Met Leu Thr Glu Ala 485 490 495 Arg Val Leu Gly Leu Arg Gly Asp Thr Leu Val Leu Gly His Ser Thr 500 505 510 Gly Ala Leu Ala Ala Arg Leu Asn Ala Ala Asp His Asn Gly Ile Leu 515 520 525 Val Lys Val Leu Ala Glu Glu Thr Gly Leu Gln Leu Lys Val Glu Cys 530 535 540 Ile Val Gly Thr Asn Pro Ala Glu Ala Gly Phe Thr Ala Gln Pro Ala 545 550 555 560 Val Gln Lys Ser Thr Trp Asn Pro Asn Tyr Asp Ser Lys Pro Ala Thr 565 570 575 Pro Ser Ala Pro Ala Gln Pro Gln Thr Pro Lys Gln Glu Ser Val Pro 580 585 590 Thr Glu Pro Glu Glu Pro Glu Ser Ser Ala Glu Thr Ser Gly Trp Gly 595 600 605 Gln Pro Val Lys Ile Gly Gly Pro Ala Pro Glu Ala Gln Thr Pro Thr 610 615 620 Pro Pro Pro Ala Pro Val Val Pro Ala Thr Pro Ala Ala Pro Ala Ala 625 630 635 640 Gly Ala Ala Lys Pro Ala Trp Lys Glu Arg Val Glu Gln Ala Ala Ala 645 650 655 Asn Ala Ala Gln Gln Arg Gln His Arg Gln Gly Ser Ser Glu Pro Phe 660 665 670 Glu Arg Gly Val Pro Leu Pro Pro Glu Pro Asp Leu Pro Pro Asp Pro 675 680 685 Tyr Gly Tyr Pro Ala Asp Glu Gly Phe Pro Glu Arg Asn Gln Gly Phe 690 695 700 Gln Gln Gln Pro Ala Pro Pro Val Glu Gln Pro Ala Pro Glu Pro Ala 705 710 715 720 Thr Glu Pro Val Pro Ala Val Ala Pro Glu Pro Glu Val Ser Gln Leu 725 730 735 Ser Glu Glu Glu Gln Leu Ile Arg Glu Ala Asp Glu Glu Pro Gly Glu 740 745 750 Met Asp Arg Arg Asp Ala Lys Thr Ile Ala Met Glu Leu Leu Ala Gln 755 760 765 Glu Leu Gly Ala Lys Pro Leu 770 775 <210> 6 <211> 2328 <212> DNA <213> Artificial Sequence <220> <223> (P43L)_dnaZX <400> 6 gtggctttgt atagcaagta tcgaccggca agttttggtg aactagttgg gcagtcgcaa 60 gtgactgacc ctctgtccgc agctttggat agcgggcgca tcaaccatgc gtaccttttt 120 tcgggtctgc gtggttgtgg caagacgtcg tcggcacgca tccttgcccg gtccctcaac 180 tgcgtggaag gcccaacttc cacgccgtgt ggggtgtgta attcttgcgt agcgctggcc 240 ccgggtggcc ctggaaccct tgatgtaaca gagctcgacg ccgcgagtaa caatggtgtc 300 gatgacatgc gtgaactgcg cgaacgcgcg aactacgccc cggcggaatc tcgctaccgc 360 gtgttcatca ttgacgaagc ccacatgatc agtacccaag gcttcaacgc cttgctgaaa 420 atcgttgaag agccaccagc gcacctgatt ttcatcttcg ccaccaccga gccggacaaa 480 atgatcggta cgatccgttc ccgcacgcac aattacccat tccgcctgct caccccaggg 540 gatatgcgca aagtgctgaa aaatgcggtc gatggcgaag gcgtccacgt cgacgattcc 600 gtttacccac tggtcatccg cgccggcggc ggcagccccc gcgacagcct ctccatcctc 660 gaccagctca tcgccggctc gggcccggag ggcttgacat atgagcgcgc cttgccgctg 720 ctcggtgtca caagcttcac gcttatcgac gattcgatcc atgcccttgc atctaaagac 780 aacgcaagca tgttcaccac gatcgataac gtcatcgaag aaggcctcga accgcgacgc 840 ttcacgatcg acctcctcga ccgcctccgc gacttgatgg tcctccaagc cgtcccagaa 900 gcactaaacc tcgggcttgt cgacgccccc accgaccgcg ccgacgccct aatcgaacaa 960 tccaccctgt tcaaaggcaa cgagctcgcc aacctagcct ccatggtgaa ctccggactc 1020 gacgacatgc gtggtgccac ctcaccgcgc ctccttctgg aaatcctctg cgcccgactg 1080 ctcctggcaa gcaataccgt ggcaggtcca gcggtcagta gttcgactga cgctgcgcct 1140 gcagctactc cgggtggtct cactggtatt gctgctgccc gcgcgaaagc acgggagtat 1200 ggacagaaga aggcagctcc agctcctgca ccaactcctg cgcccgagcc agtgcgcgaa 1260 cagtctcttg caccaacgcc tgaaccaacg ccagcggctg aacctacatc tcagcccgcg 1320 ccggaaccgg aacccgccag ggaaccagtg gtggaagtgc gggaggcgag cgtcgaaaag 1380 cagcctgcaa gcagtgatcc cctcgaaacc attcgaagcc gctggtcaga gctgcgcaac 1440 atcgtggaaa aacaaagtgt gcgcacctca atcatgctga ccgaagcgcg agttttggga 1500 ctgcgaggcg ataccctcgt gctcggtcac agcaccgggg cgttggctgc gcgtttgaac 1560 gctgctgatc acaacggaat tttggtcaag gtgttggctg aggaaactgg tctgcagctc 1620 aaggtcgaat gcattgtggg cacgaaccca gccgaagctg gatttaccgc ccagcctgct 1680 gtgcaaaaga gcacgtggaa ccccaactac gactccaaac cagccactcc aagtgcgcct 1740 gcgcagcctc agacgcctaa gcaagaatcc gtgcccaccg agccagagga gcctgagagt 1800 tcggctgaaa cttcgggatg ggggcaaccg gtaaaaatcg gtgggccagc acctgaggca 1860 cagactccaa cgcctccgcc tgctccggtg gttccggcta ctcctgctgc tccggctgcg 1920 ggtgctgcga aaccagcgtg gaaggaacgc gtcgaacaag ccgcggcaaa tgcagcgcaa 1980 caacgtcagc atcgccaggg cagctccgag cccttcgagc ggggtgttcc gctgccacca 2040 gaacctgacc tgccaccgga cccctatgga tacccagctg acgagggttt ccccgaacga 2100 aaccaagggt tccagcaaca gccagcgcct cccgttgagc aaccagctcc tgagcctgcg 2160 acggagccag ttccagcagt tgcgcctgag ccggaggtca gccagctatc tgaagaagag 2220 cagctgatcc gcgaagcaga cgaagagcca ggtgaaatgg atcgtcgtga tgcgaaaacc 2280 atcgcgatgg aactgcttgc tcaggaactc ggcgcgaaac ctttgtaa 2328 <210> 7 <211> 775 <212> PRT <213> Artificial Sequence <220> <223> (WT)_DNA polymerase III subunits gamma and tau <400> 7 Met Ala Leu Tyr Ser Lys Tyr Arg Pro Ala Ser Phe Gly Glu Leu Val 1 5 10 15 Gly Gln Ser Gln Val Thr Asp Pro Leu Ser Ala Ala Leu Asp Ser Gly 20 25 30 Arg Ile Asn His Ala Tyr Leu Phe Ser Gly Pro Arg Gly Cys Gly Lys 35 40 45 Thr Ser Ser Ala Arg Ile Leu Ala Arg Ser Leu Asn Cys Val Glu Gly 50 55 60 Pro Thr Ser Thr Pro Cys Gly Val Cys Asn Ser Cys Val Ala Leu Ala 65 70 75 80 Pro Gly Gly Pro Gly Thr Leu Asp Val Thr Glu Leu Asp Ala Ala Ser 85 90 95 Asn Asn Gly Val Asp Asp Met Arg Glu Leu Arg Glu Arg Ala Asn Tyr 100 105 110 Ala Pro Ala Glu Ser Arg Tyr Arg Val Phe Ile Ile Asp Glu Ala His 115 120 125 Met Ile Ser Thr Gln Gly Phe Asn Ala Leu Leu Lys Ile Val Glu Glu 130 135 140 Pro Pro Ala His Leu Ile Phe Ile Phe Ala Thr Thr Glu Pro Asp Lys 145 150 155 160 Met Ile Gly Thr Ile Arg Ser Arg Thr His Asn Tyr Pro Phe Arg Leu 165 170 175 Leu Thr Pro Gly Asp Met Arg Lys Val Leu Lys Asn Ala Val Asp Gly 180 185 190 Glu Gly Val His Val Asp Asp Ser Val Tyr Pro Leu Val Ile Arg Ala 195 200 205 Gly Gly Gly Ser Pro Arg Asp Ser Leu Ser Ile Leu Asp Gln Leu Ile 210 215 220 Ala Gly Ser Gly Pro Glu Gly Leu Thr Tyr Glu Arg Ala Leu Pro Leu 225 230 235 240 Leu Gly Val Thr Ser Phe Thr Leu Ile Asp Asp Ser Ile His Ala Leu 245 250 255 Ala Ser Lys Asp Asn Ala Ser Met Phe Thr Thr Ile Asp Asn Val Ile 260 265 270 Glu Glu Gly Leu Glu Pro Arg Arg Phe Thr Ile Asp Leu Leu Asp Arg 275 280 285 Leu Arg Asp Leu Met Val Leu Gln Ala Val Pro Glu Ala Leu Asn Leu 290 295 300 Gly Leu Val Asp Ala Pro Thr Asp Arg Ala Asp Ala Leu Ile Glu Gln 305 310 315 320 Ser Thr Leu Phe Lys Gly Asn Glu Leu Ala Asn Leu Ala Ser Met Val 325 330 335 Asn Ser Gly Leu Asp Asp Met Arg Gly Ala Thr Ser Pro Arg Leu Leu 340 345 350 Leu Glu Ile Leu Cys Ala Arg Leu Leu Leu Ala Ser Asn Thr Val Ala 355 360 365 Gly Pro Ala Val Ser Ser Ser Thr Asp Ala Ala Pro Ala Ala Thr Pro 370 375 380 Gly Gly Leu Thr Gly Ile Ala Ala Ala Arg Ala Lys Ala Arg Glu Tyr 385 390 395 400 Gly Gln Lys Lys Ala Ala Pro Ala Pro Ala Pro Thr Pro Ala Pro Glu 405 410 415 Pro Val Arg Glu Gln Ser Leu Ala Pro Thr Pro Glu Pro Thr Pro Ala 420 425 430 Ala Glu Pro Thr Ser Gln Pro Ala Pro Glu Pro Glu Pro Ala Arg Glu 435 440 445 Pro Val Val Glu Val Arg Glu Ala Ser Val Glu Lys Gln Pro Ala Ser 450 455 460 Ser Asp Pro Leu Glu Thr Ile Arg Ser Arg Trp Ser Glu Leu Arg Asn 465 470 475 480 Ile Val Glu Lys Gln Ser Val Arg Thr Ser Ile Met Leu Thr Glu Ala 485 490 495 Arg Val Leu Gly Leu Arg Gly Asp Thr Leu Val Leu Gly His Ser Thr 500 505 510 Gly Ala Leu Ala Ala Arg Leu Asn Ala Ala Asp His Asn Gly Ile Leu 515 520 525 Val Lys Val Leu Ala Glu Glu Thr Gly Leu Gln Leu Lys Val Glu Cys 530 535 540 Ile Val Gly Thr Asn Pro Ala Glu Ala Gly Phe Thr Ala Gln Pro Ala 545 550 555 560 Val Gln Lys Ser Thr Trp Asn Pro Asn Tyr Asp Ser Lys Pro Ala Thr 565 570 575 Pro Ser Ala Pro Ala Gln Pro Gln Thr Pro Lys Gln Glu Ser Val Pro 580 585 590 Thr Glu Pro Glu Glu Pro Glu Ser Ser Ala Glu Thr Ser Gly Trp Gly 595 600 605 Gln Pro Val Lys Ile Gly Gly Pro Ala Pro Glu Ala Gln Thr Pro Thr 610 615 620 Pro Pro Pro Ala Pro Val Val Pro Ala Thr Pro Ala Ala Pro Ala Ala 625 630 635 640 Gly Ala Ala Lys Pro Ala Trp Lys Glu Arg Val Glu Gln Ala Ala Ala 645 650 655 Asn Ala Ala Gln Gln Arg Gln His Arg Gln Gly Ser Ser Glu Pro Phe 660 665 670 Glu Arg Gly Val Pro Leu Pro Pro Glu Pro Asp Leu Pro Pro Asp Pro 675 680 685 Tyr Gly Tyr Pro Ala Asp Glu Gly Phe Pro Glu Arg Asn Gln Gly Phe 690 695 700 Gln Gln Gln Pro Ala Pro Pro Val Glu Gln Pro Ala Pro Glu Pro Ala 705 710 715 720 Thr Glu Pro Val Pro Ala Val Ala Pro Glu Pro Glu Val Ser Gln Leu 725 730 735 Ser Glu Glu Glu Gln Leu Ile Arg Glu Ala Asp Glu Glu Pro Gly Glu 740 745 750 Met Asp Arg Arg Asp Ala Lys Thr Ile Ala Met Glu Leu Leu Ala Gln 755 760 765 Glu Leu Gly Ala Lys Pro Leu 770 775 <210> 8 <211> 2328 <212> DNA <213> Artificial Sequence <220> <223> (WT)_dnaZX <400> 8 gtggctttgt atagcaagta tcgaccggca agttttggtg aactagttgg gcagtcgcaa 60 gtgactgacc ctctgtccgc agctttggat agcgggcgca tcaaccatgc gtaccttttt 120 tcgggtccgc gtggttgtgg caagacgtcg tcggcacgca tccttgcccg gtccctcaac 180 tgcgtggaag gcccaacttc cacgccgtgt ggggtgtgta attcttgcgt agcgctggcc 240 ccgggtggcc ctggaaccct tgatgtaaca gagctcgacg ccgcgagtaa caatggtgtc 300 gatgacatgc gtgaactgcg cgaacgcgcg aactacgccc cggcggaatc tcgctaccgc 360 gtgttcatca ttgacgaagc ccacatgatc agtacccaag gcttcaacgc cttgctgaaa 420 atcgttgaag agccaccagc gcacctgatt ttcatcttcg ccaccaccga gccggacaaa 480 atgatcggta cgatccgttc ccgcacgcac aattacccat tccgcctgct caccccaggg 540 gatatgcgca aagtgctgaa aaatgcggtc gatggcgaag gcgtccacgt cgacgattcc 600 gtttacccac tggtcatccg cgccggcggc ggcagccccc gcgacagcct ctccatcctc 660 gaccagctca tcgccggctc gggcccggag ggcttgacat atgagcgcgc cttgccgctg 720 ctcggtgtca caagcttcac gcttatcgac gattcgatcc atgcccttgc atctaaagac 780 aacgcaagca tgttcaccac gatcgataac gtcatcgaag aaggcctcga accgcgacgc 840 ttcacgatcg acctcctcga ccgcctccgc gacttgatgg tcctccaagc cgtcccagaa 900 gcactaaacc tcgggcttgt cgacgccccc accgaccgcg ccgacgccct aatcgaacaa 960 tccaccctgt tcaaaggcaa cgagctcgcc aacctagcct ccatggtgaa ctccggactc 1020 gacgacatgc gtggtgccac ctcaccgcgc ctccttctgg aaatcctctg cgcccgactg 1080 ctcctggcaa gcaataccgt ggcaggtcca gcggtcagta gttcgactga cgctgcgcct 1140 gcagctactc cgggtggtct cactggtatt gctgctgccc gcgcgaaagc acgggagtat 1200 ggacagaaga aggcagctcc agctcctgca ccaactcctg cgcccgagcc agtgcgcgaa 1260 cagtctcttg caccaacgcc tgaaccaacg ccagcggctg aacctacatc tcagcccgcg 1320 ccggaaccgg aacccgccag ggaaccagtg gtggaagtgc gggaggcgag cgtcgaaaag 1380 cagcctgcaa gcagtgatcc cctcgaaacc attcgaagcc gctggtcaga gctgcgcaac 1440 atcgtggaaa aacaaagtgt gcgcacctca atcatgctga ccgaagcgcg agttttggga 1500 ctgcgaggcg ataccctcgt gctcggtcac agcaccgggg cgttggctgc gcgtttgaac 1560 gctgctgatc acaacggaat tttggtcaag gtgttggctg aggaaactgg tctgcagctc 1620 aaggtcgaat gcattgtggg cacgaaccca gccgaagctg gatttaccgc ccagcctgct 1680 gtgcaaaaga gcacgtggaa ccccaactac gactccaaac cagccactcc aagtgcgcct 1740 gcgcagcctc agacgcctaa gcaagaatcc gtgcccaccg agccagagga gcctgagagt 1800 tcggctgaaa cttcgggatg ggggcaaccg gtaaaaatcg gtgggccagc acctgaggca 1860 cagactccaa cgcctccgcc tgctccggtg gttccggcta ctcctgctgc tccggctgcg 1920 ggtgctgcga aaccagcgtg gaaggaacgc gtcgaacaag ccgcggcaaa tgcagcgcaa 1980 caacgtcagc atcgccaggg cagctccgag cccttcgagc ggggtgttcc gctgccacca 2040 gaacctgacc tgccaccgga cccctatgga tacccagctg acgagggttt ccccgaacga 2100 aaccaagggt tccagcaaca gccagcgcct cccgttgagc aaccagctcc tgagcctgcg 2160 acggagccag ttccagcagt tgcgcctgag ccggaggtca gccagctatc tgaagaagag 2220 cagctgatcc gcgaagcaga cgaagagcca ggtgaaatgg atcgtcgtga tgcgaaaacc 2280 atcgcgatgg aactgcttgc tcaggaactc ggcgcgaaac ctttgtaa 2328 <210> 9 <211> 38 <212> PRT <213> Artificial Sequence <220> <223> (C33S)_NCgl3069_amino acid <400> 9 Met Ala Val Ala Lys Asp Val Leu Ser Phe Ser Arg Pro Ile Pro Ala 1 5 10 15 Leu His Ala Ile Ile Gly Ala Leu Gly Trp Phe Gly Met Phe Ala Val 20 25 30 Ser Leu Trp Ser Thr Leu 35 <210> 10 <211> 117 <212> DNA <213> Artificial Sequence <220> <223> (C33S)_NCgl3069_nucleic acid <400> 10 gtggctgtcg caaaagacgt gcttagtttt tcacgaccca ttcccgcact tcacgccatc 60 atcggcgcgc ttggatggtt tggaatgttc gcagttagtc tgtggagcac gctgtaa 117 <210> 11 <211> 38 <212> PRT <213> Artificial Sequence <220> <223> (WT)_NCgl3069_amino acid <400> 11 Met Ala Val Ala Lys Asp Val Leu Ser Phe Ser Arg Pro Ile Pro Ala 1 5 10 15 Leu His Ala Ile Ile Gly Ala Leu Gly Trp Phe Gly Met Phe Ala Val 20 25 30 Cys Leu Trp Ser Thr Leu 35 <210> 12 <211> 117 <212> DNA <213> Artificial Sequence <220> <223> (WT)_NCgl3069_nucleic acid <400> 12 gtggctgtcg caaaagacgt gcttagtttt tcacgaccca ttcccgcact tcacgccatc 60 atcggcgcgc ttggatggtt tggaatgttc gcagtttgtc tgtggagcac gctgtaa 117 <210> 13 <211> 318 <212> PRT <213> Artificial Sequence <220> <223> (N210D)_NusG <400> 13 Met Ser Asp Glu Asn Ile Asn Glu Phe Glu Gln Asp Glu Asp Leu Asn 1 5 10 15 Phe Gly Ala Ser Phe Ser Asp Glu Phe Ala Asp Asp Asp Phe Asp Ala 20 25 30 Glu Ala Asp Val Glu Ala Asp Ala Ala Ala Glu Ala Ser Ala Leu Glu 35 40 45 Ala Glu Gln Asp Leu Glu Glu Glu Thr Leu Asp Ala Pro Glu Glu Ala 50 55 60 Ala Glu Glu Ala Pro Ala Ala Ala Glu Ser Glu Ala Pro Val Glu Glu 65 70 75 80 Asp Glu Glu Ala Asp Ser Leu Ala Gln Ala Ala Ala Ala Leu Gly Asp 85 90 95 Thr Asp Glu Gln Asp Ala Asp Ala Glu Tyr Lys Ala Arg Leu Arg Lys 100 105 110 Phe Thr Arg Glu Leu Lys Lys Gln Pro Gly Val Trp Tyr Ile Ile Gln 115 120 125 Cys Tyr Ser Gly Tyr Glu Asn Lys Val Lys Ala Asn Leu Asp Met Arg 130 135 140 Ala Gln Thr Leu Glu Val Glu Asp Asp Ile Phe Glu Val Val Val Pro 145 150 155 160 Ile Glu Gln Val Thr Glu Ile Arg Asp Gly Lys Arg Lys Leu Val Lys 165 170 175 Arg Lys Leu Leu Pro Gly Tyr Val Leu Val Arg Met Asp Met Asn Asp 180 185 190 Arg Val Trp Ser Val Val Arg Asp Thr Pro Gly Val Thr Ser Phe Val 195 200 205 Gly Asp Glu Gly Asn Ala Thr Pro Val Lys His Arg Asp Val Ala Lys 210 215 220 Phe Leu Met Pro Gln Glu Gln Ala Val Val Thr Gly Glu Ala Ala Ala 225 230 235 240 Ala Ala Ala Glu Gly Glu Gln Val Val Ala Met Pro Thr Asp Thr Lys 245 250 255 Lys Pro Gln Val Ala Val Asp Phe Thr Val Gly Glu Ala Val Thr Ile 260 265 270 Leu Thr Gly Ala Phe Ala Ser Val Ser Ala Thr Ile Ser Ser Ile Asp 275 280 285 Pro Glu Leu Gln Lys Leu Glu Val Leu Val Ser Ile Phe Gly Arg Glu 290 295 300 Thr Pro Val Asp Leu Ser Phe Asp Gln Val Glu Lys Val Ser 305 310 315 <210> 14 <211> 957 <212> DNA <213> Artificial Sequence <220> <223> (N210D)_nusG <400> 14 atgagcgatg agaacattaa cgagtttgag caggacgagg atctgaactt cggcgcgagc 60 tttagtgatg aattcgcaga tgacgatttc gatgcagaag cagacgtaga agcagatgct 120 gctgcagagg cctctgccct ggaagctgag caggatctgg aagaagagac cctagatgct 180 ccagaagaag ccgcagaaga agctcctgct gctgcagagt ccgaagctcc agtagaagag 240 gacgaagagg ctgacagcct tgctcaggcg gctgctgcac ttggtgacac cgatgagcag 300 gacgcggatg cagagtacaa ggctcgtctg cgtaagttca ctcgtgagct gaagaagcag 360 cctggtgttt ggtacatcat tcagtgctac tccggctacg agaacaaggt gaaggcgaac 420 cttgacatgc gtgctcagac ccttgaggtt gaggatgaca tctttgaggt tgttgttcct 480 atcgagcagg tcactgagat ccgtgatggt aagcgcaagc tggttaagcg taagttgctg 540 ccgggctacg ttttggtccg catggacatg aatgaccgcg tgtggtctgt tgttcgcgat 600 acacctggtg tgaccagctt tgtgggtgac gagggcaatg caactcctgt gaagcaccgc 660 gatgttgcga agttcttgat gcctcaggag caggctgttg tcaccggtga ggctgctgct 720 gcggctgccg agggtgagca ggttgtggct atgcctaccg ataccaagaa gcctcaggtt 780 gctgtggact tcactgttgg tgaggctgtg accattctga ctggtgcttt cgcttctgtt 840 tctgcaacga tttcttctat cgatcctgag ctgcagaagc tggaagtttt ggtgtccatc 900 tttggtcgtg aaactcctgt tgatctcagc ttcgaccagg ttgagaaggt tagctag 957 <210> 15 <211> 318 <212> PRT <213> Artificial Sequence <220> <223> (WT)_NusG <400> 15 Met Ser Asp Glu Asn Ile Asn Glu Phe Glu Gln Asp Glu Asp Leu Asn 1 5 10 15 Phe Gly Ala Ser Phe Ser Asp Glu Phe Ala Asp Asp Asp Phe Asp Ala 20 25 30 Glu Ala Asp Val Glu Ala Asp Ala Ala Ala Glu Ala Ser Ala Leu Glu 35 40 45 Ala Glu Gln Asp Leu Glu Glu Glu Thr Leu Asp Ala Pro Glu Glu Ala 50 55 60 Ala Glu Glu Ala Pro Ala Ala Ala Glu Ser Glu Ala Pro Val Glu Glu 65 70 75 80 Asp Glu Glu Ala Asp Ser Leu Ala Gln Ala Ala Ala Ala Leu Gly Asp 85 90 95 Thr Asp Glu Gln Asp Ala Asp Ala Glu Tyr Lys Ala Arg Leu Arg Lys 100 105 110 Phe Thr Arg Glu Leu Lys Lys Gln Pro Gly Val Trp Tyr Ile Ile Gln 115 120 125 Cys Tyr Ser Gly Tyr Glu Asn Lys Val Lys Ala Asn Leu Asp Met Arg 130 135 140 Ala Gln Thr Leu Glu Val Glu Asp Asp Ile Phe Glu Val Val Val Pro 145 150 155 160 Ile Glu Gln Val Thr Glu Ile Arg Asp Gly Lys Arg Lys Leu Val Lys 165 170 175 Arg Lys Leu Leu Pro Gly Tyr Val Leu Val Arg Met Asp Met Asn Asp 180 185 190 Arg Val Trp Ser Val Val Arg Asp Thr Pro Gly Val Thr Ser Phe Val 195 200 205 Gly Asn Glu Gly Asn Ala Thr Pro Val Lys His Arg Asp Val Ala Lys 210 215 220 Phe Leu Met Pro Gln Glu Gln Ala Val Val Thr Gly Glu Ala Ala Ala 225 230 235 240 Ala Ala Ala Glu Gly Glu Gln Val Val Ala Met Pro Thr Asp Thr Lys 245 250 255 Lys Pro Gln Val Ala Val Asp Phe Thr Val Gly Glu Ala Val Thr Ile 260 265 270 Leu Thr Gly Ala Phe Ala Ser Val Ser Ala Thr Ile Ser Ser Ile Asp 275 280 285 Pro Glu Leu Gln Lys Leu Glu Val Leu Val Ser Ile Phe Gly Arg Glu 290 295 300 Thr Pro Val Asp Leu Ser Phe Asp Gln Val Glu Lys Val Ser 305 310 315 <210> 16 <211> 957 <212> DNA <213> Artificial Sequence <220> <223> (WT)_nusG <400> 16 atgagcgatg agaacattaa cgagtttgag caggacgagg atctgaactt cggcgcgagc 60 tttagtgatg aattcgcaga tgacgatttc gatgcagaag cagacgtaga agcagatgct 120 gctgcagagg cctctgccct ggaagctgag caggatctgg aagaagagac cctagatgct 180 ccagaagaag ccgcagaaga agctcctgct gctgcagagt ccgaagctcc agtagaagag 240 gacgaagagg ctgacagcct tgctcaggcg gctgctgcac ttggtgacac cgatgagcag 300 gacgcggatg cagagtacaa ggctcgtctg cgtaagttca ctcgtgagct gaagaagcag 360 cctggtgttt ggtacatcat tcagtgctac tccggctacg agaacaaggt gaaggcgaac 420 cttgacatgc gtgctcagac ccttgaggtt gaggatgaca tctttgaggt tgttgttcct 480 atcgagcagg tcactgagat ccgtgatggt aagcgcaagc tggttaagcg taagttgctg 540 ccgggctacg ttttggtccg catggacatg aatgaccgcg tgtggtctgt tgttcgcgat 600 acacctggtg tgaccagctt tgtgggtaac gagggcaatg caactcctgt gaagcaccgc 660 gatgttgcga agttcttgat gcctcaggag caggctgttg tcaccggtga ggctgctgct 720 gcggctgccg agggtgagca ggttgtggct atgcctaccg ataccaagaa gcctcaggtt 780 gctgtggact tcactgttgg tgaggctgtg accattctga ctggtgcttt cgcttctgtt 840 tctgcaacga tttcttctat cgatcctgag ctgcagaagc tggaagtttt ggtgtccatc 900 tttggtcgtg aaactcctgt tgatctcagc ttcgaccagg ttgagaaggt tagctag 957 <210> 17 <211> 269 <212> PRT <213> Artificial Sequence <220> <223> (V199M)_ABC transporter ATP-binding protein <400> 17 Met Thr Thr Asn His Gln Leu Ser Ala Glu Glu Ile Ser Leu Ala Tyr 1 5 10 15 Gly Glu Arg Thr Ile Ile Asp Ser Leu Ser Val Asp Ile Val Pro Gly 20 25 30 Lys Ile Thr Ser Ile Val Gly Pro Asn Gly Cys Gly Lys Ser Thr Leu 35 40 45 Leu Arg Ala Phe Ala Arg Leu Leu Lys Pro Ser Ala Gly Gln Ala Leu 50 55 60 Ile Asp Ala His Pro Leu Pro Ser Leu Pro Gly Lys Glu Leu Ala Arg 65 70 75 80 Met Leu Gly Leu Leu Pro Gln Ser Pro Thr Ala Pro Glu Gly Ile Val 85 90 95 Val Ala Asp Leu Val Gly Arg Gly Arg His Pro His Gln Gly Leu Met 100 105 110 Gly Arg Trp Ser Thr Arg Asp Tyr Glu Val Val Ala Gln Ala Leu Glu 115 120 125 Met Thr Asn Thr Thr Glu Leu Ala Glu Arg Pro Ile Asp Glu Leu Ser 130 135 140 Gly Gly Gln Arg Gln Arg Val Trp Ile Ala Met Ala Leu Ala Gln Glu 145 150 155 160 Thr Asp Ile Leu Leu Leu Asp Glu Pro Thr Thr Tyr Leu Asp Ile Ala 165 170 175 Asn Gln Leu Glu Val Leu Asp Leu Leu Thr Asp Leu Asn His Asn His 180 185 190 Gly Thr Thr Ile Val Met Met Leu His Glu Leu Gly Leu Ala Ala Arg 195 200 205 Tyr Ser Asp His Leu Ile Ala Met Asn Ala Gly Lys Ile Tyr Ala Gln 210 215 220 Gly Thr Pro Thr Asn Val Ile Thr Glu Thr Met Met Ser Glu Val Phe 225 230 235 240 His Thr Asp Ala Arg Ile Ile Ala Asp Pro Val Ser Gly Ala Pro Leu 245 250 255 Val Met Pro Met Gly Arg His His Ile Thr Ala Leu His 260 265 <210> 18 <211> 810 <212> DNA <213> Artificial Sequence <220> <223> (V199M)_NCgl0636 <400> 18 gtgaccacca accatcaact atccgccgaa gaaatttccc tggcgtacgg cgagcgcacc 60 atcatcgatt cgctcagcgt cgacatcgtc cccggcaaaa tcacctccat cgtcggcccc 120 aacggatgcg gcaaatcaac gctgctgcgc gcctttgcgc gcctccttaa acctagcgcc 180 gggcaagcgc ttatcgacgc ccaccccctt ccttcactgc caggcaaaga actagctcgc 240 atgctcgggc tgttaccgca atcccccacc gcacctgaag gcatcgtcgt cgccgacctc 300 gtgggccgcg gccgccaccc ccaccaagga ctcatgggca gatggtccac acgcgactac 360 gaagtagtgg cccaagcatt ggaaatgacc aacaccaccg agcttgccga acgccccatc 420 gacgaactct ccggcggcca acgccaacgc gtctggatcg ccatggccct tgcccaagaa 480 acagacatcc tgcttcttga tgaacccacc acctacctcg acatcgccaa ccagctcgaa 540 gtgcttgatc tcctcactga cctcaaccac aaccacggca ccaccatcgt catgatgctc 600 cacgaattgg gacttgccgc acgttactct gaccacctca tcgccatgaa cgccggaaaa 660 atctacgccc aaggcacccc caccaacgtc atcaccgaaa ccatgatgag cgaggtcttc 720 cacaccgacg cccgcattat cgccgaccca gtctccggcg caccactggt catgcccatg 780 ggacgacacc acatcaccgc acttcactag 810 <210> 19 <211> 269 <212> PRT <213> Artificial Sequence <220> <223> (WT)_ABC transporter ATP-binding protein <400> 19 Met Thr Thr Asn His Gln Leu Ser Ala Glu Glu Ile Ser Leu Ala Tyr 1 5 10 15 Gly Glu Arg Thr Ile Ile Asp Ser Leu Ser Val Asp Ile Val Pro Gly 20 25 30 Lys Ile Thr Ser Ile Val Gly Pro Asn Gly Cys Gly Lys Ser Thr Leu 35 40 45 Leu Arg Ala Phe Ala Arg Leu Leu Lys Pro Ser Ala Gly Gln Ala Leu 50 55 60 Ile Asp Ala His Pro Leu Pro Ser Leu Pro Gly Lys Glu Leu Ala Arg 65 70 75 80 Met Leu Gly Leu Leu Pro Gln Ser Pro Thr Ala Pro Glu Gly Ile Val 85 90 95 Val Ala Asp Leu Val Gly Arg Gly Arg His Pro His Gln Gly Leu Met 100 105 110 Gly Arg Trp Ser Thr Arg Asp Tyr Glu Val Val Ala Gln Ala Leu Glu 115 120 125 Met Thr Asn Thr Thr Glu Leu Ala Glu Arg Pro Ile Asp Glu Leu Ser 130 135 140 Gly Gly Gln Arg Gln Arg Val Trp Ile Ala Met Ala Leu Ala Gln Glu 145 150 155 160 Thr Asp Ile Leu Leu Leu Asp Glu Pro Thr Thr Tyr Leu Asp Ile Ala 165 170 175 Asn Gln Leu Glu Val Leu Asp Leu Leu Thr Asp Leu Asn His Asn His 180 185 190 Gly Thr Thr Ile Val Met Val Leu His Glu Leu Gly Leu Ala Ala Arg 195 200 205 Tyr Ser Asp His Leu Ile Ala Met Asn Ala Gly Lys Ile Tyr Ala Gln 210 215 220 Gly Thr Pro Thr Asn Val Ile Thr Glu Thr Met Met Ser Glu Val Phe 225 230 235 240 His Thr Asp Ala Arg Ile Ile Ala Asp Pro Val Ser Gly Ala Pro Leu 245 250 255 Val Met Pro Met Gly Arg His His Ile Thr Ala Leu His 260 265 <210> 20 <211> 810 <212> DNA <213> Artificial Sequence <220> <223> (WT)_NCgl0636 <400> 20 gtgaccacca accatcaact atccgccgaa gaaatttccc tggcgtacgg cgagcgcacc 60 atcatcgatt cgctcagcgt cgacatcgtc cccggcaaaa tcacctccat cgtcggcccc 120 aacggatgcg gcaaatcaac gctgctgcgc gcctttgcgc gcctccttaa acctagcgcc 180 gggcaagcgc ttatcgacgc ccaccccctt ccttcactgc caggcaaaga actagctcgc 240 atgctcgggc tgttaccgca atcccccacc gcacctgaag gcatcgtcgt cgccgacctc 300 gtgggccgcg gccgccaccc ccaccaagga ctcatgggca gatggtccac acgcgactac 360 gaagtagtgg cccaagcatt ggaaatgacc aacaccaccg agcttgccga acgccccatc 420 gacgaactct ccggcggcca acgccaacgc gtctggatcg ccatggccct tgcccaagaa 480 acagacatcc tgcttcttga tgaacccacc acctacctcg acatcgccaa ccagctcgaa 540 gtgcttgatc tcctcactga cctcaaccac aaccacggca ccaccatcgt catggtgctc 600 cacgaattgg gacttgccgc acgttactct gaccacctca tcgccatgaa cgccggaaaa 660 atctacgccc aaggcacccc caccaacgtc atcaccgaaa ccatgatgag cgaggtcttc 720 cacaccgacg cccgcattat cgccgaccca gtctccggcg caccactggt catgcccatg 780 ggacgacacc acatcaccgc acttcactag 810 <210> 21 <211> 328 <212> PRT <213> Artificial Sequence <220> <223> (T272I)_Malate dehydrogenase <400> 21 Met Asn Ser Pro Gln Asn Val Ser Thr Lys Lys Val Thr Val Thr Gly 1 5 10 15 Ala Ala Gly Gln Ile Ser Tyr Ser Leu Leu Trp Arg Ile Ala Asn Gly 20 25 30 Glu Val Phe Gly Thr Asp Thr Pro Val Glu Leu Lys Leu Leu Glu Ile 35 40 45 Pro Gln Ala Leu Gly Gly Ala Glu Gly Val Ala Met Glu Leu Leu Asp 50 55 60 Ser Ala Phe Pro Leu Leu Arg Asn Ile Thr Ile Thr Ala Asp Ala Asn 65 70 75 80 Glu Ala Phe Asp Gly Ala Asn Ala Ala Phe Leu Val Gly Ala Lys Pro 85 90 95 Arg Gly Lys Gly Glu Glu Arg Ala Asp Leu Leu Ala Asn Asn Gly Lys 100 105 110 Ile Phe Gly Pro Gln Gly Lys Ala Ile Asn Asp Asn Ala Ala Asp Asp 115 120 125 Ile Arg Val Leu Val Val Gly Asn Pro Ala Asn Thr Asn Ala Leu Ile 130 135 140 Ala Ser Ala Ala Ala Pro Asp Val Pro Ala Ser Arg Phe Asn Ala Met 145 150 155 160 Met Arg Leu Asp His Asn Arg Ala Ile Ser Gln Leu Ala Thr Lys Leu 165 170 175 Gly Arg Gly Ser Ala Glu Phe Asn Asn Ile Val Val Trp Gly Asn His 180 185 190 Ser Ala Thr Gln Phe Pro Asp Ile Thr Tyr Ala Thr Val Gly Gly Glu 195 200 205 Lys Val Thr Asp Leu Val Asp His Asp Trp Tyr Val Glu Glu Phe Ile 210 215 220 Pro Arg Val Ala Asn Arg Gly Ala Glu Ile Ile Glu Val Arg Gly Lys 225 230 235 240 Ser Ser Ala Ala Ser Ala Ala Ser Ser Ala Ile Asp His Met Arg Asp 245 250 255 Trp Val Gln Gly Thr Glu Ala Trp Ser Ser Ala Ala Ile Pro Ser Ile 260 265 270 Gly Ala Tyr Gly Ile Pro Glu Gly Ile Phe Val Gly Leu Pro Thr Val 275 280 285 Ser Arg Asn Gly Glu Trp Glu Ile Val Glu Gly Leu Glu Ile Ser Asp 290 295 300 Phe Gln Arg Ala Arg Ile Asp Ala Asn Ala Gln Glu Leu Gln Ala Glu 305 310 315 320 Arg Glu Ala Val Arg Asp Leu Leu 325 <210> 22 <211> 987 <212> DNA <213> Artificial Sequence <220> <223> (T272I)_NCgl2297 <400> 22 atgaattccc cgcagaacgt ctccaccaag aaggtcaccg tcaccggcgc agctggtcaa 60 atctcttatt cactgttgtg gcgcatcgcc aacggtgaag tattcggcac cgacacccct 120 gtagaactga aacttctgga gatccctcag gctcttggcg gggcagaggg tgtggctatg 180 gaacttctgg attctgcctt ccccctcctg cgaaacatca ccatcaccgc ggatgccaat 240 gaggcattcg acggcgctaa tgcggcgttt ttggtcggtg cgaagcctcg cggaaaaggc 300 gaagagcgcg cagatttgct ggctaacaac ggcaagattt tcggacctca aggtaaagct 360 atcaatgaca acgccgcaga tgacattcgt gtcctagttg ttggaaaccc agcgaacacc 420 aacgcgttga ttgcttcagc tgcggcccca gatgttccag catcccgctt caacgcaatg 480 atgcgccttg atcacaaccg tgcgatctcc cagctggcca ccaagcttgg ccgtggatct 540 gcggaattta acaacattgt ggtctgggga aatcactccg caacccagtt cccagacatc 600 acctacgcaa ccgttggtgg agaaaaggtc actgacctgg ttgatcacga ttggtatgtg 660 gaggagttca ttcctcgcgt ggctaaccgt ggcgctgaaa tcattgaggt ccgtggaaag 720 tcttctgcag cttctgcagc atcctctgcg attgatcaca tgcgcgattg ggtacagggc 780 accgaggcgt ggtcctctgc ggcaattcct tccatcggtg catacggcat tcctgagggc 840 atttttgtcg gtctgccaac cgtatcccgc aacggtgagt gggaaatcgt tgaaggcctg 900 gagatttccg atttccagcg cgcccgcatc gacgcgaatg ctcaggaatt gcaggccgag 960 cgcgaggcag tgcgcgactt gctctaa 987 <210> 23 <211> 328 <212> PRT <213> Artificial Sequence <220> <223> (WT)_Malate dehydrogenase <400> 23 Met Asn Ser Pro Gln Asn Val Ser Thr Lys Lys Val Thr Val Thr Gly 1 5 10 15 Ala Ala Gly Gln Ile Ser Tyr Ser Leu Leu Trp Arg Ile Ala Asn Gly 20 25 30 Glu Val Phe Gly Thr Asp Thr Pro Val Glu Leu Lys Leu Leu Glu Ile 35 40 45 Pro Gln Ala Leu Gly Gly Ala Glu Gly Val Ala Met Glu Leu Leu Asp 50 55 60 Ser Ala Phe Pro Leu Leu Arg Asn Ile Thr Ile Thr Ala Asp Ala Asn 65 70 75 80 Glu Ala Phe Asp Gly Ala Asn Ala Ala Phe Leu Val Gly Ala Lys Pro 85 90 95 Arg Gly Lys Gly Glu Glu Arg Ala Asp Leu Leu Ala Asn Asn Gly Lys 100 105 110 Ile Phe Gly Pro Gln Gly Lys Ala Ile Asn Asp Asn Ala Ala Asp Asp 115 120 125 Ile Arg Val Leu Val Val Gly Asn Pro Ala Asn Thr Asn Ala Leu Ile 130 135 140 Ala Ser Ala Ala Ala Pro Asp Val Pro Ala Ser Arg Phe Asn Ala Met 145 150 155 160 Met Arg Leu Asp His Asn Arg Ala Ile Ser Gln Leu Ala Thr Lys Leu 165 170 175 Gly Arg Gly Ser Ala Glu Phe Asn Asn Ile Val Val Trp Gly Asn His 180 185 190 Ser Ala Thr Gln Phe Pro Asp Ile Thr Tyr Ala Thr Val Gly Gly Glu 195 200 205 Lys Val Thr Asp Leu Val Asp His Asp Trp Tyr Val Glu Glu Phe Ile 210 215 220 Pro Arg Val Ala Asn Arg Gly Ala Glu Ile Ile Glu Val Arg Gly Lys 225 230 235 240 Ser Ser Ala Ala Ser Ala Ala Ser Ser Ala Ile Asp His Met Arg Asp 245 250 255 Trp Val Gln Gly Thr Glu Ala Trp Ser Ser Ala Ala Ile Pro Ser Thr 260 265 270 Gly Ala Tyr Gly Ile Pro Glu Gly Ile Phe Val Gly Leu Pro Thr Val 275 280 285 Ser Arg Asn Gly Glu Trp Glu Ile Val Glu Gly Leu Glu Ile Ser Asp 290 295 300 Phe Gln Arg Ala Arg Ile Asp Ala Asn Ala Gln Glu Leu Gln Ala Glu 305 310 315 320 Arg Glu Ala Val Arg Asp Leu Leu 325 <210> 24 <211> 987 <212> DNA <213> Artificial Sequence <220> <223> (WT)_NCgl2297 <400> 24 atgaattccc cgcagaacgt ctccaccaag aaggtcaccg tcaccggcgc agctggtcaa 60 atctcttatt cactgttgtg gcgcatcgcc aacggtgaag tattcggcac cgacacccct 120 gtagaactga aacttctgga gatccctcag gctcttggcg gggcagaggg tgtggctatg 180 gaacttctgg attctgcctt ccccctcctg cgaaacatca ccatcaccgc ggatgccaat 240 gaggcattcg acggcgctaa tgcggcgttt ttggtcggtg cgaagcctcg cggaaaaggc 300 gaagagcgcg cagatttgct ggctaacaac ggcaagattt tcggacctca aggtaaagct 360 atcaatgaca acgccgcaga tgacattcgt gtcctagttg ttggaaaccc agcgaacacc 420 aacgcgttga ttgcttcagc tgcggcccca gatgttccag catcccgctt caacgcaatg 480 atgcgccttg atcacaaccg tgcgatctcc cagctggcca ccaagcttgg ccgtggatct 540 gcggaattta acaacattgt ggtctgggga aatcactccg caacccagtt cccagacatc 600 acctacgcaa ccgttggtgg agaaaaggtc actgacctgg ttgatcacga ttggtatgtg 660 gaggagttca ttcctcgcgt ggctaaccgt ggcgctgaaa tcattgaggt ccgtggaaag 720 tcttctgcag cttctgcagc atcctctgcg attgatcaca tgcgcgattg ggtacagggc 780 accgaggcgt ggtcctctgc ggcaattcct tccaccggtg catacggcat tcctgagggc 840 atttttgtcg gtctgccaac cgtatcccgc aacggtgagt gggaaatcgt tgaaggcctg 900 gagatttccg atttccagcg cgcccgcatc gacgcgaatg ctcaggaatt gcaggccgag 960 cgcgaggcag tgcgcgactt gctctaa 987 <210> 25 <211> 688 <212> PRT <213> Artificial Sequence <220> <223> (R304Q)_primosome assembly protein <400> 25 Met Ala Lys Thr Arg Val Pro Ala Pro Glu Lys Ser Val Ala Arg Val 1 5 10 15 Leu Pro Leu Leu Gly Leu Pro His Leu Asp Arg Leu Phe Asp Tyr Arg 20 25 30 Ile Ser Glu Asp Gln His Asp Asp Val Gln Pro Gly Val Arg Val Arg 35 40 45 Val Arg Phe Gly Gly Arg Leu Val Asp Ala Ile Val Met Ser Arg Thr 50 55 60 Ala Gln Thr Ser His Glu Gly Lys Leu Met Trp Leu Asp Arg Val Ile 65 70 75 80 Ser Pro Ile Val Val Tyr Pro Pro Gln Thr Ala Lys Leu Ile Glu Gln 85 90 95 Leu Ser Asp Arg Tyr Gly Gly Val Arg Ser Asp Leu Ile Arg Ser Ala 100 105 110 Leu Pro Ala Arg His Ala Gly Ala Glu Glu Ala Asp Thr Ser Thr Ser 115 120 125 Trp Glu Ser Leu Gly Glu Val Lys Glu Pro Asp Leu Ser Ser Trp Ser 130 135 140 Ala Tyr Gln His Gly Gln Ser Phe Val Asp Ala Val Leu Ala Gly Thr 145 150 155 160 Thr Ala Arg Ala Ser Trp Gln Ile Ala Pro Gly Asp Asp Trp Ala Leu 165 170 175 Ala Leu Ala Ser Leu Ala Val Lys Val Val Lys Asp Gly Gly Gly Ala 180 185 190 Leu Leu Val Val Pro Asp Gln Arg Asp Leu Asp Arg Leu Glu Ala Ala 195 200 205 Leu Arg Gly Leu Val Ala Ala Lys Gln Ile Thr Val Leu Asn Ser Gly 210 215 220 Leu Gly Pro Gln Ala Arg Tyr Arg Arg Phe Leu Ser Val Leu Ser Gly 225 230 235 240 Gln Gly Arg Leu Ile Ile Gly Thr Arg Ser Ala Ala Phe Ala Pro Val 245 250 255 Lys Asp Leu Lys Leu Ala Val Ile Leu Asn Asp Gly Asp Asp Asn Leu 260 265 270 Val Asp Pro Arg Ala Pro Tyr Ala His Ala Arg Glu Val Leu Thr Thr 275 280 285 Arg Ser Ser Leu Glu Ala Ser Ser Leu Ile Ile Ala Gly His Ala Gln 290 295 300 Thr Ala Glu Thr Gln Leu Leu Val Glu Ser Gly Trp Met His Asn Leu 305 310 315 320 Ile Ala Pro Arg Asp Thr Ile Arg Thr Arg Met Pro Arg Ile Gln Ala 325 330 335 Val Gly Asp Ser Asp Phe Gln Met Glu Arg Asp Pro Met Ala Arg Ser 340 345 350 Ala Arg Leu Pro Gly Ile Ala Phe His Ala Val Arg Ser Ala Leu Glu 355 360 365 Arg Asp Gln Pro Ala Leu Ile Gln Val Pro Arg Lys Gly Tyr Val Pro 370 375 380 Thr Leu Ala Cys Gly Asn Cys Arg Thr Pro Ala Arg Cys Arg His Cys 385 390 395 400 Asn Gly Pro Val Gly Leu Pro Gln Gly Ser Ser Asp Leu Ala Gly Val 405 410 415 Pro Thr Cys Arg Trp Cys Gly Arg Pro Asp Ser Arg Phe Lys Cys Gln 420 425 430 Asn Cys Gly Ser Pro Lys Leu Arg Ala Val Val Leu Gly Thr Glu Arg 435 440 445 Thr Ala Glu Glu Leu Gly Arg Ala Phe Pro Ser Val Arg Val Ile Thr 450 455 460 Ser Gly Gly Asn Lys Val Val Asp Ser Val Glu Asn Arg Ala Ser Ile 465 470 475 480 Val Val Ser Thr Pro Gly Ala Glu Pro Phe Val Ala Asn Ser Pro Glu 485 490 495 Arg Pro Glu Lys Ser Glu Lys Pro Glu His Lys Gly Ala Tyr Gly Ala 500 505 510 Leu Leu Leu Leu Asp Thr Trp Ala Leu Met Gly Arg Gln Asp Leu Arg 515 520 525 Ala Met Glu Asp Ala Leu His Lys Trp Ala Ala Ala Ala Thr Leu Val 530 535 540 His Ser His Leu His Gln Gly Gln Val Ile Val Val Ala Asp Pro Ser 545 550 555 560 Phe Pro Ala Val Gln Ser Leu Ile Arg Trp Asp Met Ala Gly Ala Ala 565 570 575 Ala Gln Glu Leu Ala Ser Arg Arg Glu Val Met Phe Pro Pro Ser Val 580 585 590 His Met Ala Ala Ile Asp Gly Ala Thr Ala Ala Leu Glu Ser Phe Leu 595 600 605 Asp Leu Ala Glu Leu Pro Asp His Ala Glu Val Leu Gly Pro Val Asp 610 615 620 Leu Pro Pro Gly Val Ser Leu Pro Gly Glu Tyr Asp Glu Gln Arg Phe 625 630 635 640 Gly Pro Pro Gln Arg Leu Leu Ile Arg Thr Pro Leu Gly Pro Arg Ser 645 650 655 Glu Leu Gly Arg Ala Leu Arg Ser Ala Gln Val Ala Arg Ala Val Arg 660 665 670 Lys Asn Asp Leu Pro Leu Arg Ile Gln Met Asp Pro Ile His Ile Gly 675 680 685 <210> 26 <211> 2067 <212> DNA <213> Artificial Sequence <220> <223> (R304Q)_NCgl1540 <400> 26 atggcaaaaa cccgcgtccc cgctcctgaa aagtcggtgg cgcgggtttt acctcttttg 60 gggttacctc acctggatcg actgtttgat taccgcatca gcgaagacca acacgatgat 120 gtgcaacctg gcgtgcgggt gcgcgtgcgt tttggtggac gtttagttga tgccatcgtg 180 atgtcacgca ccgcgcaaac ctcgcacgag ggaaagctga tgtggctgga tcgggtgatt 240 tcgccgatcg tggtgtatcc acctcaaaca gcaaagctaa ttgagcaact cagtgatcgc 300 tatggcgggg tacgttcgga tctcatccgt tcggcgctac cggcgcggca tgctggggca 360 gaagaggcag atacctccac gtcgtgggag tcattgggtg aggttaaaga acccgattta 420 tcgtcgtggt ctgcgtatca gcatggtcaa tcatttgttg acgccgtctt ggcgggaaca 480 actgcgcggg cgtcatggca gattgctccc ggagatgatt gggcgctggc tttggcttct 540 ttggcggtca aggttgtcaa agacggcggc ggagcgcttc tcgtagtgcc tgatcagcgc 600 gatctcgacc gcttggaagc tgcgcttcga ggtttggttg cggcgaaaca aatcactgtg 660 cttaattcag gtcttggtcc gcaggcacga tatcggcgtt tcctatcggt actcagtggg 720 cagggacgac tgattattgg aaccagaagt gccgcttttg cacccgtgaa ggatctgaaa 780 ctggccgtca ttttaaatga tggcgacgac aacctcgttg atcctagagc gccctatgcc 840 cacgccaggg aagtgctgac cacgcgttcc agtttggaag caagctcctt gattattgcg 900 ggacatgcgc agaccgcgga aacccaattg ctggtggaat cgggatggat gcacaatctc 960 atcgcaccga gggataccat tcgcactagg atgccgcgta ttcaggcagt gggcgattcc 1020 gatttccaga tggaacgcga tccaatggcc cgatcagcgc ggctgcctgg cattgcgttt 1080 catgcggtgc gcagcgcctt agaacgtgat caaccagcgc ttatccaggt accaaggaaa 1140 ggctacgtgc caaccttggc gtgtggaaac tgccgcaccc cagcgcggtg ccggcactgt 1200 aatgggcctg tgggacttcc ccagggaagc tctgatctag cgggagtgcc cacttgccga 1260 tggtgcggac gccctgattc gcggtttaag tgccaaaact gcggctctcc aaaactgcgt 1320 gctgtggtgc tgggaacgga acgcacagca gaagaactgg gccgcgcgtt cccgtctgtg 1380 cgggtaatta cctctggtgg caacaaggtg gtggattcgg tggaaaaccg agccagcatt 1440 gtggtgtcca cgccaggtgc agaacctttt gtggccaact cgccggagag accagagaaa 1500 tcggagaaac cagagcacaa gggcgcttac ggtgccttgt tattgctgga tacctgggcg 1560 ttgatgggtc ggcaagatct gcgcgccatg gaggacgcgc tgcacaagtg ggcagcggcg 1620 gccacgctgg tgcattctca tctgcaccag ggtcaagtca tcgtggttgc agatccatcg 1680 tttcctgctg tgcaatcgtt gattcggtgg gatatggcag gtgctgcagc gcaagagttg 1740 gctagccgac gcgaggttat gttcccgcct tctgtacaca tggcagcaat cgatggggct 1800 accgctgcat tggaaagttt cttggatttg gcggagcttc ccgatcatgc tgaagtcctc 1860 ggccctgttg atctgccacc gggtgtgagt ttgcctggtg aatatgatga gcagcgcttt 1920 ggtccgccgc agcgccttct catcagaact ccattgggac cgcggtctga gttgggtaga 1980 gcgctgcgct cagcccaggt ggcgcgtgcg gtgaggaaga atgatttgcc gttgcgtatt 2040 cagatggatc cgattcacat cggataa 2067 <210> 27 <211> 688 <212> PRT <213> Artificial Sequence <220> <223> (WT)_primosome assembly protein <400> 27 Met Ala Lys Thr Arg Val Pro Ala Pro Glu Lys Ser Val Ala Arg Val 1 5 10 15 Leu Pro Leu Leu Gly Leu Pro His Leu Asp Arg Leu Phe Asp Tyr Arg 20 25 30 Ile Ser Glu Asp Gln His Asp Asp Val Gln Pro Gly Val Arg Val Arg 35 40 45 Val Arg Phe Gly Gly Arg Leu Val Asp Ala Ile Val Met Ser Arg Thr 50 55 60 Ala Gln Thr Ser His Glu Gly Lys Leu Met Trp Leu Asp Arg Val Ile 65 70 75 80 Ser Pro Ile Val Val Tyr Pro Pro Gln Thr Ala Lys Leu Ile Glu Gln 85 90 95 Leu Ser Asp Arg Tyr Gly Gly Val Arg Ser Asp Leu Ile Arg Ser Ala 100 105 110 Leu Pro Ala Arg His Ala Gly Ala Glu Glu Ala Asp Thr Ser Thr Ser 115 120 125 Trp Glu Ser Leu Gly Glu Val Lys Glu Pro Asp Leu Ser Ser Trp Ser 130 135 140 Ala Tyr Gln His Gly Gln Ser Phe Val Asp Ala Val Leu Ala Gly Thr 145 150 155 160 Thr Ala Arg Ala Ser Trp Gln Ile Ala Pro Gly Asp Asp Trp Ala Leu 165 170 175 Ala Leu Ala Ser Leu Ala Val Lys Val Val Lys Asp Gly Gly Gly Ala 180 185 190 Leu Leu Val Val Pro Asp Gln Arg Asp Leu Asp Arg Leu Glu Ala Ala 195 200 205 Leu Arg Gly Leu Val Ala Ala Lys Gln Ile Thr Val Leu Asn Ser Gly 210 215 220 Leu Gly Pro Gln Ala Arg Tyr Arg Arg Phe Leu Ser Val Leu Ser Gly 225 230 235 240 Gln Gly Arg Leu Ile Ile Gly Thr Arg Ser Ala Ala Phe Ala Pro Val 245 250 255 Lys Asp Leu Lys Leu Ala Val Ile Leu Asn Asp Gly Asp Asp Asn Leu 260 265 270 Val Asp Pro Arg Ala Pro Tyr Ala His Ala Arg Glu Val Leu Thr Thr 275 280 285 Arg Ser Ser Leu Glu Ala Ser Ser Leu Ile Ile Ala Gly His Ala Arg 290 295 300 Thr Ala Glu Thr Gln Leu Leu Val Glu Ser Gly Trp Met His Asn Leu 305 310 315 320 Ile Ala Pro Arg Asp Thr Ile Arg Thr Arg Met Pro Arg Ile Gln Ala 325 330 335 Val Gly Asp Ser Asp Phe Gln Met Glu Arg Asp Pro Met Ala Arg Ser 340 345 350 Ala Arg Leu Pro Gly Ile Ala Phe His Ala Val Arg Ser Ala Leu Glu 355 360 365 Arg Asp Gln Pro Ala Leu Ile Gln Val Pro Arg Lys Gly Tyr Val Pro 370 375 380 Thr Leu Ala Cys Gly Asn Cys Arg Thr Pro Ala Arg Cys Arg His Cys 385 390 395 400 Asn Gly Pro Val Gly Leu Pro Gln Gly Ser Ser Asp Leu Ala Gly Val 405 410 415 Pro Thr Cys Arg Trp Cys Gly Arg Pro Asp Ser Arg Phe Lys Cys Gln 420 425 430 Asn Cys Gly Ser Pro Lys Leu Arg Ala Val Val Leu Gly Thr Glu Arg 435 440 445 Thr Ala Glu Glu Leu Gly Arg Ala Phe Pro Ser Val Arg Val Ile Thr 450 455 460 Ser Gly Gly Asn Lys Val Val Asp Ser Val Glu Asn Arg Ala Ser Ile 465 470 475 480 Val Val Ser Thr Pro Gly Ala Glu Pro Phe Val Ala Asn Ser Pro Glu 485 490 495 Arg Pro Glu Lys Ser Glu Lys Pro Glu His Lys Gly Ala Tyr Gly Ala 500 505 510 Leu Leu Leu Leu Asp Thr Trp Ala Leu Met Gly Arg Gln Asp Leu Arg 515 520 525 Ala Met Glu Asp Ala Leu His Lys Trp Ala Ala Ala Ala Thr Leu Val 530 535 540 His Ser His Leu His Gln Gly Gln Val Ile Val Val Ala Asp Pro Ser 545 550 555 560 Phe Pro Ala Val Gln Ser Leu Ile Arg Trp Asp Met Ala Gly Ala Ala 565 570 575 Ala Gln Glu Leu Ala Ser Arg Arg Glu Val Met Phe Pro Pro Ser Val 580 585 590 His Met Ala Ala Ile Asp Gly Ala Thr Ala Ala Leu Glu Ser Phe Leu 595 600 605 Asp Leu Ala Glu Leu Pro Asp His Ala Glu Val Leu Gly Pro Val Asp 610 615 620 Leu Pro Pro Gly Val Ser Leu Pro Gly Glu Tyr Asp Glu Gln Arg Phe 625 630 635 640 Gly Pro Pro Gln Arg Leu Leu Ile Arg Thr Pro Leu Gly Pro Arg Ser 645 650 655 Glu Leu Gly Arg Ala Leu Arg Ser Ala Gln Val Ala Arg Ala Val Arg 660 665 670 Lys Asn Asp Leu Pro Leu Arg Ile Gln Met Asp Pro Ile His Ile Gly 675 680 685 <210> 28 <211> 2067 <212> DNA <213> Artificial Sequence <220> <223> (WT)_NCgl1540 <400> 28 atggcaaaaa cccgcgtccc cgctcctgaa aagtcggtgg cgcgggtttt acctcttttg 60 gggttacctc acctggatcg actgtttgat taccgcatca gcgaagacca acacgatgat 120 gtgcaacctg gcgtgcgggt gcgcgtgcgt tttggtggac gtttagttga tgccatcgtg 180 atgtcacgca ccgcgcaaac ctcgcacgag ggaaagctga tgtggctgga tcgggtgatt 240 tcgccgatcg tggtgtatcc acctcaaaca gcaaagctaa ttgagcaact cagtgatcgc 300 tatggcgggg tacgttcgga tctcatccgt tcggcgctac cggcgcggca tgctggggca 360 gaagaggcag atacctccac gtcgtgggag tcattgggtg aggttaaaga acccgattta 420 tcgtcgtggt ctgcgtatca gcatggtcaa tcatttgttg acgccgtctt ggcgggaaca 480 actgcgcggg cgtcatggca gattgctccc ggagatgatt gggcgctggc tttggcttct 540 ttggcggtca aggttgtcaa agacggcggc ggagcgcttc tcgtagtgcc tgatcagcgc 600 gatctcgacc gcttggaagc tgcgcttcga ggtttggttg cggcgaaaca aatcactgtg 660 cttaattcag gtcttggtcc gcaggcacga tatcggcgtt tcctatcggt actcagtggg 720 cagggacgac tgattattgg aaccagaagt gccgcttttg cacccgtgaa ggatctgaaa 780 ctggccgtca ttttaaatga tggcgacgac aacctcgttg atcctagagc gccctatgcc 840 cacgccaggg aagtgctgac cacgcgttcc agtttggaag caagctcctt gattattgcg 900 ggacatgcgc ggaccgcgga aacccaattg ctggtggaat cgggatggat gcacaatctc 960 atcgcaccga gggataccat tcgcactagg atgccgcgta ttcaggcagt gggcgattcc 1020 gatttccaga tggaacgcga tccaatggcc cgatcagcgc ggctgcctgg cattgcgttt 1080 catgcggtgc gcagcgcctt agaacgtgat caaccagcgc ttatccaggt accaaggaaa 1140 ggctacgtgc caaccttggc gtgtggaaac tgccgcaccc cagcgcggtg ccggcactgt 1200 aatgggcctg tgggacttcc ccagggaagc tctgatctag cgggagtgcc cacttgccga 1260 tggtgcggac gccctgattc gcggtttaag tgccaaaact gcggctctcc aaaactgcgt 1320 gctgtggtgc tgggaacgga acgcacagca gaagaactgg gccgcgcgtt cccgtctgtg 1380 cgggtaatta cctctggtgg caacaaggtg gtggattcgg tggaaaaccg agccagcatt 1440 gtggtgtcca cgccaggtgc agaacctttt gtggccaact cgccggagag accagagaaa 1500 tcggagaaac cagagcacaa gggcgcttac ggtgccttgt tattgctgga tacctgggcg 1560 ttgatgggtc ggcaagatct gcgcgccatg gaggacgcgc tgcacaagtg ggcagcggcg 1620 gccacgctgg tgcattctca tctgcaccag ggtcaagtca tcgtggttgc agatccatcg 1680 tttcctgctg tgcaatcgtt gattcggtgg gatatggcag gtgctgcagc gcaagagttg 1740 gctagccgac gcgaggttat gttcccgcct tctgtacaca tggcagcaat cgatggggct 1800 accgctgcat tggaaagttt cttggatttg gcggagcttc ccgatcatgc tgaagtcctc 1860 ggccctgttg atctgccacc gggtgtgagt ttgcctggtg aatatgatga gcagcgcttt 1920 ggtccgccgc agcgccttct catcagaact ccattgggac cgcggtctga gttgggtaga 1980 gcgctgcgct cagcccaggt ggcgcgtgcg gtgaggaaga atgatttgcc gttgcgtatt 2040 cagatggatc cgattcacat cggataa 2067 <210> 29 <211> 437 <212> PRT <213> Artificial Sequence <220> <223> (A169V)_type II citrate synthase <400> 29 Met Phe Glu Arg Asp Ile Val Ala Thr Asp Asn Asn Lys Ala Val Leu 1 5 10 15 His Tyr Pro Gly Gly Glu Phe Glu Met Asp Ile Ile Glu Ala Ser Glu 20 25 30 Gly Asn Asn Gly Val Val Leu Gly Lys Met Leu Ser Glu Thr Gly Leu 35 40 45 Ile Thr Phe Asp Pro Gly Tyr Val Ser Thr Gly Ser Thr Glu Ser Lys 50 55 60 Ile Thr Tyr Ile Asp Gly Asp Ala Gly Ile Leu Arg Tyr Arg Gly Tyr 65 70 75 80 Asp Ile Ala Asp Leu Ala Glu Asn Ala Thr Phe Asn Glu Val Ser Tyr 85 90 95 Leu Leu Ile Asn Gly Glu Leu Pro Thr Pro Asp Glu Leu His Lys Phe 100 105 110 Asn Asp Glu Ile Arg His His Thr Leu Leu Asp Glu Asp Phe Lys Ser 115 120 125 Gln Phe Asn Val Phe Pro Arg Asp Ala His Pro Met Ala Thr Leu Ala 130 135 140 Ser Ser Val Asn Ile Leu Ser Thr Tyr Tyr Gln Asp Gln Leu Asn Pro 145 150 155 160 Leu Asp Glu Ala Gln Leu Asp Lys Val Thr Val Arg Leu Met Ala Lys 165 170 175 Val Pro Met Leu Ala Ala Tyr Ala His Arg Ala Arg Lys Gly Ala Pro 180 185 190 Tyr Met Tyr Pro Asp Asn Ser Leu Asn Ala Arg Glu Asn Phe Leu Arg 195 200 205 Met Met Phe Gly Tyr Pro Thr Glu Pro Tyr Glu Ile Asp Pro Ile Met 210 215 220 Val Lys Ala Leu Asp Lys Leu Leu Ile Leu His Ala Asp His Glu Gln 225 230 235 240 Asn Cys Ser Thr Ser Thr Val Arg Met Ile Gly Ser Ala Gln Ala Asn 245 250 255 Met Phe Val Ser Ile Ala Gly Gly Ile Asn Ala Leu Ser Gly Pro Leu 260 265 270 His Gly Gly Ala Asn Gln Ala Val Leu Glu Met Leu Glu Asp Ile Lys 275 280 285 Ser Asn His Gly Gly Asp Ala Thr Glu Phe Met Asn Lys Val Lys Asn 290 295 300 Lys Glu Asp Gly Val Arg Leu Met Gly Phe Gly His Arg Val Tyr Lys 305 310 315 320 Asn Tyr Asp Pro Arg Ala Ala Ile Val Lys Glu Thr Ala His Glu Ile 325 330 335 Leu Glu His Leu Gly Gly Asp Asp Leu Leu Asp Leu Ala Ile Lys Leu 340 345 350 Glu Glu Ile Ala Leu Ala Asp Asp Tyr Phe Ile Ser Arg Lys Leu Tyr 355 360 365 Pro Asn Val Asp Phe Tyr Thr Gly Leu Ile Tyr Arg Ala Met Gly Phe 370 375 380 Pro Thr Asp Phe Phe Thr Val Leu Phe Ala Ile Gly Arg Leu Pro Gly 385 390 395 400 Trp Ile Ala His Tyr Arg Glu Gln Leu Gly Ala Ala Gly Asn Lys Ile 405 410 415 Asn Arg Pro Arg Gln Val Tyr Thr Gly Asn Glu Ser Arg Lys Leu Val 420 425 430 Pro Arg Glu Glu Arg 435 <210> 30 <211> 1314 <212> DNA <213> Artificial Sequence <220> <223> (A169V)_gltA <400> 30 atgtttgaaa gggatatcgt ggctactgat aacaacaagg ctgtcctgca ctaccccggt 60 ggcgagttcg aaatggacat catcgaggct tctgagggta acaacggtgt tgtcctgggc 120 aagatgctgt ctgagactgg actgatcact tttgacccag gttatgtgag cactggctcc 180 accgagtcga agatcaccta catcgatggc gatgcgggaa tcctgcgtta ccgcggctat 240 gacatcgctg atctggctga gaatgccacc ttcaacgagg tttcttacct acttatcaac 300 ggtgagctac caaccccaga tgagcttcac aagtttaacg acgagattcg ccaccacacc 360 cttctggacg aggacttcaa gtcccagttc aacgtgttcc cacgcgacgc tcacccaatg 420 gcaaccttgg cttcctcggt taacattttg tctacctact accaggacca gctgaaccca 480 ctcgatgagg cacagcttga taaggtaacc gttcgcctca tggcaaaggt tccaatgctg 540 gctgcgtacg cacaccgcgc acgcaagggt gctccttaca tgtacccaga caactccctc 600 aatgcgcgtg agaacttcct gcgcatgatg ttcggttacc caaccgagcc atacgagatc 660 gacccaatca tggtcaaggc tctggacaag ctgctcatcc tgcacgctga ccacgagcag 720 aactgctcca cctccaccgt tcgtatgatc ggttccgcac aggccaacat gtttgtctcc 780 atcgctggtg gcatcaacgc tctgtccggc ccactgcacg gtggcgcaaa ccaggctgtt 840 ctggagatgc tcgaagacat caagagcaac cacggtggcg acgcaaccga gttcatgaac 900 aaggtcaaga acaaggaaga cggcgtccgc ctcatgggct tcggacaccg cgtttacaag 960 aactacgatc cacgtgcagc aatcgtcaag gagaccgcac acgagatcct cgagcacctc 1020 ggtggcgacg atcttctgga tctggcaatc aagctggaag aaattgcact ggctgatgat 1080 tacttcatct cccgcaagct ctacccgaac gtagacttct acaccggcct gatctaccgc 1140 gcaatgggct tcccaactga cttcttcacc gtattgttcg caatcggtcg tctgccagga 1200 tggatcgctc actaccgcga gcagctcggt gcagcaggca acaagatcaa ccgcccacgc 1260 caggtctaca ccggcaacga atcccgcaag ttggttcctc gcgaggagcg ctaa 1314 <210> 31 <211> 437 <212> PRT <213> Artificial Sequence <220> <223> (WT)_type II citrate synthase <400> 31 Met Phe Glu Arg Asp Ile Val Ala Thr Asp Asn Asn Lys Ala Val Leu 1 5 10 15 His Tyr Pro Gly Gly Glu Phe Glu Met Asp Ile Ile Glu Ala Ser Glu 20 25 30 Gly Asn Asn Gly Val Val Leu Gly Lys Met Leu Ser Glu Thr Gly Leu 35 40 45 Ile Thr Phe Asp Pro Gly Tyr Val Ser Thr Gly Ser Thr Glu Ser Lys 50 55 60 Ile Thr Tyr Ile Asp Gly Asp Ala Gly Ile Leu Arg Tyr Arg Gly Tyr 65 70 75 80 Asp Ile Ala Asp Leu Ala Glu Asn Ala Thr Phe Asn Glu Val Ser Tyr 85 90 95 Leu Leu Ile Asn Gly Glu Leu Pro Thr Pro Asp Glu Leu His Lys Phe 100 105 110 Asn Asp Glu Ile Arg His His Thr Leu Leu Asp Glu Asp Phe Lys Ser 115 120 125 Gln Phe Asn Val Phe Pro Arg Asp Ala His Pro Met Ala Thr Leu Ala 130 135 140 Ser Ser Val Asn Ile Leu Ser Thr Tyr Tyr Gln Asp Gln Leu Asn Pro 145 150 155 160 Leu Asp Glu Ala Gln Leu Asp Lys Ala Thr Val Arg Leu Met Ala Lys 165 170 175 Val Pro Met Leu Ala Ala Tyr Ala His Arg Ala Arg Lys Gly Ala Pro 180 185 190 Tyr Met Tyr Pro Asp Asn Ser Leu Asn Ala Arg Glu Asn Phe Leu Arg 195 200 205 Met Met Phe Gly Tyr Pro Thr Glu Pro Tyr Glu Ile Asp Pro Ile Met 210 215 220 Val Lys Ala Leu Asp Lys Leu Leu Ile Leu His Ala Asp His Glu Gln 225 230 235 240 Asn Cys Ser Thr Ser Thr Val Arg Met Ile Gly Ser Ala Gln Ala Asn 245 250 255 Met Phe Val Ser Ile Ala Gly Gly Ile Asn Ala Leu Ser Gly Pro Leu 260 265 270 His Gly Gly Ala Asn Gln Ala Val Leu Glu Met Leu Glu Asp Ile Lys 275 280 285 Ser Asn His Gly Gly Asp Ala Thr Glu Phe Met Asn Lys Val Lys Asn 290 295 300 Lys Glu Asp Gly Val Arg Leu Met Gly Phe Gly His Arg Val Tyr Lys 305 310 315 320 Asn Tyr Asp Pro Arg Ala Ala Ile Val Lys Glu Thr Ala His Glu Ile 325 330 335 Leu Glu His Leu Gly Gly Asp Asp Leu Leu Asp Leu Ala Ile Lys Leu 340 345 350 Glu Glu Ile Ala Leu Ala Asp Asp Tyr Phe Ile Ser Arg Lys Leu Tyr 355 360 365 Pro Asn Val Asp Phe Tyr Thr Gly Leu Ile Tyr Arg Ala Met Gly Phe 370 375 380 Pro Thr Asp Phe Phe Thr Val Leu Phe Ala Ile Gly Arg Leu Pro Gly 385 390 395 400 Trp Ile Ala His Tyr Arg Glu Gln Leu Gly Ala Ala Gly Asn Lys Ile 405 410 415 Asn Arg Pro Arg Gln Val Tyr Thr Gly Asn Glu Ser Arg Lys Leu Val 420 425 430 Pro Arg Glu Glu Arg 435 <210> 32 <211> 1314 <212> DNA <213> Artificial Sequence <220> <223> (WT)_gltA <400> 32 atgtttgaaa gggatatcgt ggctactgat aacaacaagg ctgtcctgca ctaccccggt 60 ggcgagttcg aaatggacat catcgaggct tctgagggta acaacggtgt tgtcctgggc 120 aagatgctgt ctgagactgg actgatcact tttgacccag gttatgtgag cactggctcc 180 accgagtcga agatcaccta catcgatggc gatgcgggaa tcctgcgtta ccgcggctat 240 gacatcgctg atctggctga gaatgccacc ttcaacgagg tttcttacct acttatcaac 300 ggtgagctac caaccccaga tgagcttcac aagtttaacg acgagattcg ccaccacacc 360 cttctggacg aggacttcaa gtcccagttc aacgtgttcc cacgcgacgc tcacccaatg 420 gcaaccttgg cttcctcggt taacattttg tctacctact accaggacca gctgaaccca 480 ctcgatgagg cacagcttga taaggcaacc gttcgcctca tggcaaaggt tccaatgctg 540 gctgcgtacg cacaccgcgc acgcaagggt gctccttaca tgtacccaga caactccctc 600 aatgcgcgtg agaacttcct gcgcatgatg ttcggttacc caaccgagcc atacgagatc 660 gacccaatca tggtcaaggc tctggacaag ctgctcatcc tgcacgctga ccacgagcag 720 aactgctcca cctccaccgt tcgtatgatc ggttccgcac aggccaacat gtttgtctcc 780 atcgctggtg gcatcaacgc tctgtccggc ccactgcacg gtggcgcaaa ccaggctgtt 840 ctggagatgc tcgaagacat caagagcaac cacggtggcg acgcaaccga gttcatgaac 900 aaggtcaaga acaaggaaga cggcgtccgc ctcatgggct tcggacaccg cgtttacaag 960 aactacgatc cacgtgcagc aatcgtcaag gagaccgcac acgagatcct cgagcacctc 1020 ggtggcgacg atcttctgga tctggcaatc aagctggaag aaattgcact ggctgatgat 1080 tacttcatct cccgcaagct ctacccgaac gtagacttct acaccggcct gatctaccgc 1140 gcaatgggct tcccaactga cttcttcacc gtattgttcg caatcggtcg tctgccagga 1200 tggatcgctc actaccgcga gcagctcggt gcagcaggca acaagatcaa ccgcccacgc 1260 caggtctaca ccggcaacga atcccgcaag ttggttcctc gcgaggagcg ctaa 1314 <210> 33 <211> 369 <212> PRT <213> Artificial Sequence <220> <223> (E294K)_TerC <400> 33 Met Glu Val Asn Leu Ala Thr Trp Leu Ile Thr Ile Ala Val Ile Ala 1 5 10 15 Gly Phe Phe Ile Phe Asp Phe Tyr Ser His Val Arg Thr Pro His Glu 20 25 30 Pro Thr Ile Lys Glu Ser Ala Trp Trp Ser Leu Phe Tyr Val Ala Leu 35 40 45 Ala Cys Val Phe Gly Val Phe Leu Trp Phe Ala Trp Gly Glu Pro Gly 50 55 60 Asn Pro His Gln His Gly Ile Glu Phe Phe Thr Gly Tyr Val Thr Glu 65 70 75 80 Lys Ala Leu Ser Val Asp Asn Leu Phe Ile Phe Ala Leu Ile Met Gly 85 90 95 Ser Phe Lys Ile Pro Arg Lys Tyr Gln Gln Lys Val Leu Leu Ile Gly 100 105 110 Ile Ala Leu Ala Leu Val Phe Arg Leu Ala Phe Ile Leu Ala Gly Ala 115 120 125 Ala Val Ile Glu Ala Trp Ser Asp Val Phe Tyr Ile Phe Ser Ile Trp 130 135 140 Leu Ile Tyr Thr Ala Val Lys Leu Leu Trp Asp Glu Val Arg Asp Thr 145 150 155 160 Pro Glu Thr Asp Pro Asn Asp Met Phe Ile Ile Lys Ala Leu Arg Lys 165 170 175 Val Ile Pro Val Thr Glu Gly Tyr His Gly Asp Lys Leu Thr His Arg 180 185 190 Phe Gly Gly Lys Leu His Leu Thr Pro Leu Phe Val Ala Leu Val Ser 195 200 205 Ile Gly Met Val Asp Leu Met Phe Ala Leu Asp Ser Ile Pro Ala Ile 210 215 220 Tyr Gly Ile Thr Thr Glu Pro Tyr Ile Val Phe Thr Thr Asn Ala Phe 225 230 235 240 Ala Leu Leu Gly Leu Arg Gln Met Tyr Phe Leu Leu Asp Gly Leu Leu 245 250 255 Asp Arg Leu Val Tyr Leu Pro Tyr Gly Leu Gly Leu Ile Leu Leu Phe 260 265 270 Ile Gly Ala Lys Leu Gly Leu His Ala Leu His Glu Asn Asn Leu Pro 275 280 285 Phe Ile Asn Gly Gly Lys Asn Val Ser Val Pro Glu Val Ser Thr Val 290 295 300 Phe Ser Leu Val Phe Ile Ile Gly Val Leu Thr Ile Thr Val Ile Ala 305 310 315 320 Ser Ile Ile Lys Asn Lys Arg Asp Glu Asn Gln Gly Gly Ile Pro Pro 325 330 335 Lys Trp Asn Ala Ala Lys Tyr Glu Gly Asp Asn Trp Glu Thr Gly Glu 340 345 350 Glu Pro Glu Thr Gly Ser Ala Thr Val Thr Asp Ile Ser Ser Glu Lys 355 360 365 Lys <210> 34 <211> 1110 <212> DNA <213> Artificial Sequence <220> <223> (E294K)_terC <400> 34 atggaagtaa acttagccac atggctaatc actatcgcag tgattgctgg cttcttcatt 60 ttcgatttct attcccacgt ccgcacccca cacgagccca ctatcaaaga atccgcatgg 120 tggagcctct tctacgtagc cctcgcctgt gttttcggcg tgttcctctg gtttgcttgg 180 ggcgagccag gtaacccaca ccagcacggc attgagttct tcaccggtta cgtgacagag 240 aaggcgttga gtgttgataa cctcttcatc ttcgcgctga tcatgggttc tttcaagatt 300 cctcgcaagt accagcagaa ggttctgctc atcggtatcg cgctggcact ggtcttccgc 360 ctggcattca tcctcgcagg tgctgcagtt atcgaagcct ggtccgatgt cttctacatc 420 ttctccatct ggctgatcta caccgctgtg aagctcctgt gggacgaagt tcgagacacc 480 cctgagaccg acccgaacga catgttcatc attaaggcgc tgcgcaaggt cattccggtt 540 actgagggct accacggcga caagctcact caccgcttcg gaggcaagct gcacctgacc 600 ccactgttcg ttgcacttgt atccatcggc atggttgacc tgatgttcgc actggactct 660 atcccagcga tttacggcat caccacggag ccttacatcg tgttcaccac taacgcattc 720 gccctgctgg gtctgcgcca aatgtacttc ctgcttgacg gcctgcttga ccgcctggtc 780 tacctgcctt atggcttggg tcttatcctg ctgttcattg gtgcaaagct tggtctgcat 840 gcactgcacg aaaacaacct gccattcatc aacggtggta aaaacgtctc cgtacctgag 900 gtttccaccg tgttctcctt ggtcttcatc attggtgtcc tgacaatcac cgtcatcgca 960 tccatcatca agaacaaacg cgacgaaaac cagggcggta ttccaccaaa gtggaacgct 1020 gcaaagtatg agggcgacaa ctgggagacc ggtgaggagc ctgaaaccgg atccgccacc 1080 gttaccgata tctcctcaga gaagaagtaa 1110 <210> 35 <211> 369 <212> PRT <213> Artificial Sequence <220> <223> (WT)_TerC <400> 35 Met Glu Val Asn Leu Ala Thr Trp Leu Ile Thr Ile Ala Val Ile Ala 1 5 10 15 Gly Phe Phe Ile Phe Asp Phe Tyr Ser His Val Arg Thr Pro His Glu 20 25 30 Pro Thr Ile Lys Glu Ser Ala Trp Trp Ser Leu Phe Tyr Val Ala Leu 35 40 45 Ala Cys Val Phe Gly Val Phe Leu Trp Phe Ala Trp Gly Glu Pro Gly 50 55 60 Asn Pro His Gln His Gly Ile Glu Phe Phe Thr Gly Tyr Val Thr Glu 65 70 75 80 Lys Ala Leu Ser Val Asp Asn Leu Phe Ile Phe Ala Leu Ile Met Gly 85 90 95 Ser Phe Lys Ile Pro Arg Lys Tyr Gln Gln Lys Val Leu Leu Ile Gly 100 105 110 Ile Ala Leu Ala Leu Val Phe Arg Leu Ala Phe Ile Leu Ala Gly Ala 115 120 125 Ala Val Ile Glu Ala Trp Ser Asp Val Phe Tyr Ile Phe Ser Ile Trp 130 135 140 Leu Ile Tyr Thr Ala Val Lys Leu Leu Trp Asp Glu Val Arg Asp Thr 145 150 155 160 Pro Glu Thr Asp Pro Asn Asp Met Phe Ile Ile Lys Ala Leu Arg Lys 165 170 175 Val Ile Pro Val Thr Glu Gly Tyr His Gly Asp Lys Leu Thr His Arg 180 185 190 Phe Gly Gly Lys Leu His Leu Thr Pro Leu Phe Val Ala Leu Val Ser 195 200 205 Ile Gly Met Val Asp Leu Met Phe Ala Leu Asp Ser Ile Pro Ala Ile 210 215 220 Tyr Gly Ile Thr Thr Glu Pro Tyr Ile Val Phe Thr Thr Asn Ala Phe 225 230 235 240 Ala Leu Leu Gly Leu Arg Gln Met Tyr Phe Leu Leu Asp Gly Leu Leu 245 250 255 Asp Arg Leu Val Tyr Leu Pro Tyr Gly Leu Gly Leu Ile Leu Leu Phe 260 265 270 Ile Gly Ala Lys Leu Gly Leu His Ala Leu His Glu Asn Asn Leu Pro 275 280 285 Phe Ile Asn Gly Gly Glu Asn Val Ser Val Pro Glu Val Ser Thr Val 290 295 300 Phe Ser Leu Val Phe Ile Ile Gly Val Leu Thr Ile Thr Val Ile Ala 305 310 315 320 Ser Ile Ile Lys Asn Lys Arg Asp Glu Asn Gln Gly Gly Ile Pro Pro 325 330 335 Lys Trp Asn Ala Ala Lys Tyr Glu Gly Asp Asn Trp Glu Thr Gly Glu 340 345 350 Glu Pro Glu Thr Gly Ser Ala Thr Val Thr Asp Ile Ser Ser Glu Lys 355 360 365 Lys <210> 36 <211> 1110 <212> DNA <213> Artificial Sequence <220> <223> (WT)_terC <400> 36 atggaagtaa acttagccac atggctaatc actatcgcag tgattgctgg cttcttcatt 60 ttcgatttct attcccacgt ccgcacccca cacgagccca ctatcaaaga atccgcatgg 120 tggagcctct tctacgtagc cctcgcctgt gttttcggcg tgttcctctg gtttgcttgg 180 ggcgagccag gtaacccaca ccagcacggc attgagttct tcaccggtta cgtgacagag 240 aaggcgttga gtgttgataa cctcttcatc ttcgcgctga tcatgggttc tttcaagatt 300 cctcgcaagt accagcagaa ggttctgctc atcggtatcg cgctggcact ggtcttccgc 360 ctggcattca tcctcgcagg tgctgcagtt atcgaagcct ggtccgatgt cttctacatc 420 ttctccatct ggctgatcta caccgctgtg aagctcctgt gggacgaagt tcgagacacc 480 cctgagaccg acccgaacga catgttcatc attaaggcgc tgcgcaaggt cattccggtt 540 actgagggct accacggcga caagctcact caccgcttcg gaggcaagct gcacctgacc 600 ccactgttcg ttgcacttgt atccatcggc atggttgacc tgatgttcgc actggactct 660 atcccagcga tttacggcat caccacggag ccttacatcg tgttcaccac taacgcattc 720 gccctgctgg gtctgcgcca aatgtacttc ctgcttgacg gcctgcttga ccgcctggtc 780 tacctgcctt atggcttggg tcttatcctg ctgttcattg gtgcaaagct tggtctgcat 840 gcactgcacg aaaacaacct gccattcatc aacggtggtg aaaacgtctc cgtacctgag 900 gtttccaccg tgttctcctt ggtcttcatc attggtgtcc tgacaatcac cgtcatcgca 960 tccatcatca agaacaaacg cgacgaaaac cagggcggta ttccaccaaa gtggaacgct 1020 gcaaagtatg agggcgacaa ctgggagacc ggtgaggagc ctgaaaccgg atccgccacc 1080 gttaccgata tctcctcaga gaagaagtaa 1110 <210> 37 <211> 465 <212> PRT <213> Artificial Sequence <220> <223> (P358S)_mycothione reductase <400> 37 Met Ser Glu Gln Pro Ala Ser Ile Lys His Tyr Asp Leu Ile Ile Ile 1 5 10 15 Gly Thr Gly Ser Gly Asn Ser Ile Pro Gly Pro Glu Phe Asp Asp Lys 20 25 30 Ser Ile Ala Ile Val Glu Lys Gly Ala Phe Gly Gly Thr Cys Leu Asn 35 40 45 Val Gly Cys Ile Pro Thr Lys Met Tyr Val Tyr Ala Ala Asp Ile Ala 50 55 60 Gln Glu Ile Gln Glu Ser Ala Arg Leu Gly Ile Asp Ala Thr Val Asn 65 70 75 80 Ser Val Asp Trp Pro Ser Ile Val Ser Arg Val Phe Asp Lys Arg Ile 85 90 95 Asp Leu Ile Ala Gln Gly Gly Glu Ala Tyr Arg Arg Gly Pro Glu Thr 100 105 110 Pro Asn Ile Asp Val Tyr Asp Met His Ala Ser Phe Val Asp Ser Lys 115 120 125 Thr Ile Ser Thr Gly Ile Ala Gly Gln Glu Gln Leu Ile Ser Gly Thr 130 135 140 Asp Ile Val Ile Ala Thr Gly Ser Arg Pro Tyr Ile Pro Glu Ala Ile 145 150 155 160 Ala Glu Ser Gly Ala Arg Tyr Tyr Thr Asn Glu Asp Ile Met Arg Leu 165 170 175 Ala Gln Gln Pro Glu Ser Leu Val Ile Val Gly Gly Gly Phe Ile Ala 180 185 190 Leu Glu Phe Ala His Val Phe Glu Ala Leu Gly Thr Lys Val Thr Ile 195 200 205 Leu Asn Arg Ser Asp Val Leu Leu Arg Glu Ala Asp Ala Asp Ile Ser 210 215 220 Ala Lys Ile Leu Glu Leu Ser Lys Lys Arg Phe Asp Val Arg Leu Ser 225 230 235 240 Thr Ala Val Thr Ala Val His Asn Lys Ala Asp Gly Gly Val Lys Ile 245 250 255 Ser Thr Asp Thr Gly Asp Asp Ile Glu Ala Asp Ile Leu Leu Val Ala 260 265 270 Thr Gly Arg Thr Pro Asn Gly Asn Gln Met Asn Leu Asp Ala Ala Gly 275 280 285 Ile Glu Met Asn Gly Arg Ser Ile Lys Val Asp Glu Phe Gly Arg Thr 290 295 300 Ser Val Glu Gly Val Trp Ala Leu Gly Asp Val Ser Ser Pro Tyr Lys 305 310 315 320 Leu Lys His Val Ala Asn Ala Glu Met Arg Ala Ile Lys His Asn Leu 325 330 335 Ala Asn Pro Asn Asp Leu Gln Lys Met Pro His Asp Phe Val Pro Ser 340 345 350 Ala Val Phe Thr Asn Ser Gln Ile Ser Gln Val Gly Met Thr Glu Gln 355 360 365 Glu Ala Arg Glu Ala Gly Leu Asp Ile Thr Val Lys Ile Gln Asn Tyr 370 375 380 Ser Asp Val Ala Tyr Gly Trp Ala Met Glu Asp Lys Asp Gly Phe Val 385 390 395 400 Lys Leu Ile Ala Asp Lys Asp Thr Gly Lys Leu Val Gly Ala His Ile 405 410 415 Ile Gly Ala Gln Ala Ser Thr Leu Ile Gln Gln Leu Ile Thr Val Met 420 425 430 Ala Phe Gly Ile Asp Ala Arg Glu Ala Ala Thr Lys Gln Tyr Trp Ile 435 440 445 His Pro Ala Leu Pro Glu Val Ile Glu Asn Ala Leu Leu Gly Leu Glu 450 455 460 Phe 465 <210> 38 <211> 1398 <212> DNA <213> Artificial Sequence <220> <223> (P358S)_mtr <400> 38 atgtctgagc agccagcttc cattaagcat tatgacctca tcatcattgg taccggctct 60 ggaaactcca ttcctggacc agagtttgat gataaatcaa ttgccatcgt ggaaaagggt 120 gctttcggcg gaacttgcct caatgtgggc tgcatcccta ccaagatgta cgtttacgct 180 gcggatatcg ctcaagaaat tcaggagtct gctcgcctgg gtatcgatgc gacggtcaac 240 agcgtggatt ggccttccat cgtcagccgc gttttcgaca agcgcatcga cctcatcgcg 300 caaggcggcg aggcttatcg acgtggcccc gaaactccaa acatcgatgt gtatgacatg 360 cacgcatcgt ttgttgattc caagacaatc tccactggta ttgccggcca agaacagctg 420 atcagcggta ctgacattgt aatcgcaacc ggctcccgcc cttacatccc tgaagctatt 480 gcagagtccg gcgcacgcta ctacaccaac gaagacatca tgcgcctggc acagcagcct 540 gaatctttgg tgattgttgg tggcggtttc atcgctttgg aatttgctca cgtttttgaa 600 gcgcttggca ccaaggtcac catcctcaac cgctctgacg tgctgctgcg cgaggcagat 660 gcagacatct ccgcgaaaat cctcgagctt tccaaaaagc gtttcgacgt ccgcctcagc 720 actgcggtca ccgcagtaca caacaaggcc gacggcggcg tgaagatctc caccgacacc 780 ggcgacgaca tcgaggcaga tattttgctc gttgccactg gtcgcacccc taacggcaac 840 caaatgaact tggacgccgc aggcatcgag atgaacggtc gttccatcaa ggttgatgaa 900 ttcggtcgca ccagtgttga aggcgtgtgg gcgcttggcg atgtctcctc cccttacaag 960 ctcaagcacg tagccaatgc ggaaatgcga gcaatcaagc acaaccttgc caaccctaat 1020 gacctgcaga agatgccaca tgatttcgtg ccatcagctg ttttcaccaa ctctcagatc 1080 tcgcaggtcg gcatgactga gcaggaggcg cgtgaagctg gcctcgacat cactgtgaag 1140 atccagaact actctgatgt ggcttatggc tgggccatgg aagataagga tggattcgtt 1200 aagctcattg ccgataagga caccggcaag ttggtcggcg cgcacatcat tggtgctcaa 1260 gcctcaacac tgatccagca actgatcact gtcatggcat ttggaatcga tgcacgagaa 1320 gctgcaacca agcagtactg gattcaccct gctcttccag aagtcatcga aaacgctctt 1380 ctggggctag agttttag 1398 <210> 39 <211> 465 <212> PRT <213> Artificial Sequence <220> <223> (WT)_mycothione reductase <400> 39 Met Ser Glu Gln Pro Ala Ser Ile Lys His Tyr Asp Leu Ile Ile Ile 1 5 10 15 Gly Thr Gly Ser Gly Asn Ser Ile Pro Gly Pro Glu Phe Asp Asp Lys 20 25 30 Ser Ile Ala Ile Val Glu Lys Gly Ala Phe Gly Gly Thr Cys Leu Asn 35 40 45 Val Gly Cys Ile Pro Thr Lys Met Tyr Val Tyr Ala Ala Asp Ile Ala 50 55 60 Gln Glu Ile Gln Glu Ser Ala Arg Leu Gly Ile Asp Ala Thr Val Asn 65 70 75 80 Ser Val Asp Trp Pro Ser Ile Val Ser Arg Val Phe Asp Lys Arg Ile 85 90 95 Asp Leu Ile Ala Gln Gly Gly Glu Ala Tyr Arg Arg Gly Pro Glu Thr 100 105 110 Pro Asn Ile Asp Val Tyr Asp Met His Ala Ser Phe Val Asp Ser Lys 115 120 125 Thr Ile Ser Thr Gly Ile Ala Gly Gln Glu Gln Leu Ile Ser Gly Thr 130 135 140 Asp Ile Val Ile Ala Thr Gly Ser Arg Pro Tyr Ile Pro Glu Ala Ile 145 150 155 160 Ala Glu Ser Gly Ala Arg Tyr Tyr Thr Asn Glu Asp Ile Met Arg Leu 165 170 175 Ala Gln Gln Pro Glu Ser Leu Val Ile Val Gly Gly Gly Phe Ile Ala 180 185 190 Leu Glu Phe Ala His Val Phe Glu Ala Leu Gly Thr Lys Val Thr Ile 195 200 205 Leu Asn Arg Ser Asp Val Leu Leu Arg Glu Ala Asp Ala Asp Ile Ser 210 215 220 Ala Lys Ile Leu Glu Leu Ser Lys Lys Arg Phe Asp Val Arg Leu Ser 225 230 235 240 Thr Ala Val Thr Ala Val His Asn Lys Ala Asp Gly Gly Val Lys Ile 245 250 255 Ser Thr Asp Thr Gly Asp Asp Ile Glu Ala Asp Ile Leu Leu Val Ala 260 265 270 Thr Gly Arg Thr Pro Asn Gly Asn Gln Met Asn Leu Asp Ala Ala Gly 275 280 285 Ile Glu Met Asn Gly Arg Ser Ile Lys Val Asp Glu Phe Gly Arg Thr 290 295 300 Ser Val Glu Gly Val Trp Ala Leu Gly Asp Val Ser Ser Pro Tyr Lys 305 310 315 320 Leu Lys His Val Ala Asn Ala Glu Met Arg Ala Ile Lys His Asn Leu 325 330 335 Ala Asn Pro Asn Asp Leu Gln Lys Met Pro His Asp Phe Val Pro Ser 340 345 350 Ala Val Phe Thr Asn Pro Gln Ile Ser Gln Val Gly Met Thr Glu Gln 355 360 365 Glu Ala Arg Glu Ala Gly Leu Asp Ile Thr Val Lys Ile Gln Asn Tyr 370 375 380 Ser Asp Val Ala Tyr Gly Trp Ala Met Glu Asp Lys Asp Gly Phe Val 385 390 395 400 Lys Leu Ile Ala Asp Lys Asp Thr Gly Lys Leu Val Gly Ala His Ile 405 410 415 Ile Gly Ala Gln Ala Ser Thr Leu Ile Gln Gln Leu Ile Thr Val Met 420 425 430 Ala Phe Gly Ile Asp Ala Arg Glu Ala Ala Thr Lys Gln Tyr Trp Ile 435 440 445 His Pro Ala Leu Pro Glu Val Ile Glu Asn Ala Leu Leu Gly Leu Glu 450 455 460 Phe 465 <210> 40 <211> 1398 <212> DNA <213> Artificial Sequence <220> <223> (WT)_mtr <400> 40 atgtctgagc agccagcttc cattaagcat tatgacctca tcatcattgg taccggctct 60 ggaaactcca ttcctggacc agagtttgat gataaatcaa ttgccatcgt ggaaaagggt 120 gctttcggcg gaacttgcct caatgtgggc tgcatcccta ccaagatgta cgtttacgct 180 gcggatatcg ctcaagaaat tcaggagtct gctcgcctgg gtatcgatgc gacggtcaac 240 agcgtggatt ggccttccat cgtcagccgc gttttcgaca agcgcatcga cctcatcgcg 300 caaggcggcg aggcttatcg acgtggcccc gaaactccaa acatcgatgt gtatgacatg 360 cacgcatcgt ttgttgattc caagacaatc tccactggta ttgccggcca agaacagctg 420 atcagcggta ctgacattgt aatcgcaacc ggctcccgcc cttacatccc tgaagctatt 480 gcagagtccg gcgcacgcta ctacaccaac gaagacatca tgcgcctggc acagcagcct 540 gaatctttgg tgattgttgg tggcggtttc atcgctttgg aatttgctca cgtttttgaa 600 gcgcttggca ccaaggtcac catcctcaac cgctctgacg tgctgctgcg cgaggcagat 660 gcagacatct ccgcgaaaat cctcgagctt tccaaaaagc gtttcgacgt ccgcctcagc 720 actgcggtca ccgcagtaca caacaaggcc gacggcggcg tgaagatctc caccgacacc 780 ggcgacgaca tcgaggcaga tattttgctc gttgccactg gtcgcacccc taacggcaac 840 caaatgaact tggacgccgc aggcatcgag atgaacggtc gttccatcaa ggttgatgaa 900 ttcggtcgca ccagtgttga aggcgtgtgg gcgcttggcg atgtctcctc cccttacaag 960 ctcaagcacg tagccaatgc ggaaatgcga gcaatcaagc acaaccttgc caaccctaat 1020 gacctgcaga agatgccaca tgatttcgtg ccatcagctg ttttcaccaa ccctcagatc 1080 tcgcaggtcg gcatgactga gcaggaggcg cgtgaagctg gcctcgacat cactgtgaag 1140 atccagaact actctgatgt ggcttatggc tgggccatgg aagataagga tggattcgtt 1200 aagctcattg ccgataagga caccggcaag ttggtcggcg cgcacatcat tggtgctcaa 1260 gcctcaacac tgatccagca actgatcact gtcatggcat ttggaatcga tgcacgagaa 1320 gctgcaacca agcagtactg gattcaccct gctcttccag aagtcatcga aaacgctctt 1380 ctggggctag agttttag 1398 <210> 41 <211> 205 <212> PRT <213> Artificial Sequence <220> <223> (G130D)_Co/Zn/Cd efflux system component <400> 41 Met Ser Glu Ala Phe Asp Ala Thr Lys Val Arg Lys Ala Val Leu Thr 1 5 10 15 Val Ala Leu Leu Asn Phe Ala Tyr Phe Phe Val Glu Phe Phe Ile Ala 20 25 30 Leu Ser Ala Gly Ser Val Ser Leu Leu Ala Asp Ser Val Asp Phe Leu 35 40 45 Glu Asp Thr Ser Ile Asn Leu Leu Ile Phe Ile Ala Leu Gly Trp Pro 50 55 60 Leu Ala Arg Arg Ala Val Met Gly Lys Leu Met Ala Ile Val Ile Leu 65 70 75 80 Ala Pro Ala Ala Phe Ala Ala Trp Ala Ala Ile Gln Arg Phe Ser Ala 85 90 95 Pro Gln Ala Pro Glu Val Phe Pro Ile Ile Val Ala Ser Leu Gly Ala 100 105 110 Val Val Ile Asn Gly Ala Ser Ala Ile Ile Ile Ser Arg Val Arg Gln 115 120 125 His Asp Gly Ser Leu Gly Gln Ala Ala Phe Leu Ser Ala Arg Asn Asp 130 135 140 Val Leu Ile Asn Ile Ala Ile Ile Met Met Ala Leu Ile Thr Ala Trp 145 150 155 160 Thr Thr Ser Gly Trp Pro Asp Leu Ile Leu Gly Cys Phe Ile Ile Leu 165 170 175 Leu Ala Leu His Ala Ala His Glu Val Trp Glu Val Ser Glu Glu Glu 180 185 190 Arg Leu Ala Ser Lys Ala Leu Ala Gly Glu Ala Ile Asp 195 200 205 <210> 42 <211> 618 <212> DNA <213> Artificial Sequence <220> <223> (G130D)_N1992 <400> 42 atgagcgaag cttttgatgc aaccaaagtg cgcaaagctg tgctcaccgt cgcgctgctt 60 aacttcgctt atttctttgt agaattcttt attgcattaa gcgcaggctc cgtttctcta 120 ctggctgaca gtgtcgattt tcttgaagac acctccatca acctgctcat tttcattgcc 180 ctaggatggc cgttggcgag gcgcgcagtg atgggcaaac ttatggcgat tgtgattctt 240 gcacctgctg cttttgctgc gtgggcagcg attcaacggt tttccgcacc gcaagcgccc 300 gaagtgtttc cgatcatcgt cgcttctctg ggcgccgtcg tgatcaacgg cgcgagtgcc 360 atcattattt ctcgagtgcg acaacatgat ggctcgcttg gccaagctgc cttcctatcc 420 gcccgaaatg acgtcctgat caacattgcc atcatcatga tggccttaat taccgcatgg 480 acgacgtctg gatggccaga tttgatccta ggttgtttca tcattctgct cgcactgcac 540 gccgctcacg aggtgtggga agtcagtgag gaagaacgcc tcgcctccaa agcccttgct 600 ggggaagcca tcgattag 618 <210> 43 <211> 205 <212> PRT <213> Artificial Sequence <220> <223> (WT)_Co/Zn/Cd efflux system component <400> 43 Met Ser Glu Ala Phe Asp Ala Thr Lys Val Arg Lys Ala Val Leu Thr 1 5 10 15 Val Ala Leu Leu Asn Phe Ala Tyr Phe Phe Val Glu Phe Phe Ile Ala 20 25 30 Leu Ser Ala Gly Ser Val Ser Leu Leu Ala Asp Ser Val Asp Phe Leu 35 40 45 Glu Asp Thr Ser Ile Asn Leu Leu Ile Phe Ile Ala Leu Gly Trp Pro 50 55 60 Leu Ala Arg Arg Ala Val Met Gly Lys Leu Met Ala Ile Val Ile Leu 65 70 75 80 Ala Pro Ala Ala Phe Ala Ala Trp Ala Ala Ile Gln Arg Phe Ser Ala 85 90 95 Pro Gln Ala Pro Glu Val Phe Pro Ile Ile Val Ala Ser Leu Gly Ala 100 105 110 Val Val Ile Asn Gly Ala Ser Ala Ile Ile Ile Ser Arg Val Arg Gln 115 120 125 His Gly Gly Ser Leu Gly Gln Ala Ala Phe Leu Ser Ala Arg Asn Asp 130 135 140 Val Leu Ile Asn Ile Ala Ile Ile Met Met Ala Leu Ile Thr Ala Trp 145 150 155 160 Thr Thr Ser Gly Trp Pro Asp Leu Ile Leu Gly Cys Phe Ile Ile Leu 165 170 175 Leu Ala Leu His Ala Ala His Glu Val Trp Glu Val Ser Glu Glu Glu 180 185 190 Arg Leu Ala Ser Lys Ala Leu Ala Gly Glu Ala Ile Asp 195 200 205 <210> 44 <211> 618 <212> DNA <213> Artificial Sequence <220> <223> (WT)_N1992 <400> 44 atgagcgaag cttttgatgc aaccaaagtg cgcaaagctg tgctcaccgt cgcgctgctt 60 aacttcgctt atttctttgt agaattcttt attgcattaa gcgcaggctc cgtttctcta 120 ctggctgaca gtgtcgattt tcttgaagac acctccatca acctgctcat tttcattgcc 180 ctaggatggc cgttggcgag gcgcgcagtg atgggcaaac ttatggcgat tgtgattctt 240 gcacctgctg cttttgctgc gtgggcagcg attcaacggt tttccgcacc gcaagcgccc 300 gaagtgtttc cgatcatcgt cgcttctctg ggcgccgtcg tgatcaacgg cgcgagtgcc 360 atcattattt ctcgagtgcg acaacatggt ggctcgcttg gccaagctgc cttcctatcc 420 gcccgaaatg acgtcctgat caacattgcc atcatcatga tggccttaat taccgcatgg 480 acgacgtctg gatggccaga tttgatccta ggttgtttca tcattctgct cgcactgcac 540 gccgctcacg aggtgtggga agtcagtgag gaagaacgcc tcgcctccaa agcccttgct 600 ggggaagcca tcgattag 618 <210> 45 <211> 466 <212> PRT <213> Artificial Sequence <220> <223> (G382C)_3-deoxy-D-arabinoheptulosonate-7-phosphate synthase <400> 45 Met Asn Arg Gly Val Ser Trp Thr Val Asp Ile Pro Lys Glu Val Leu 1 5 10 15 Pro Asp Leu Pro Pro Leu Pro Glu Gly Met Gln Gln Gln Phe Glu Asp 20 25 30 Thr Ile Ser Arg Asp Ala Lys Gln Gln Pro Thr Trp Asp Arg Ala Gln 35 40 45 Ala Glu Asn Val Arg Lys Ile Leu Glu Ser Val Pro Pro Ile Val Val 50 55 60 Ala Pro Glu Val Leu Glu Leu Lys Gln Lys Leu Ala Asp Val Ala Asn 65 70 75 80 Gly Lys Ala Phe Leu Leu Gln Gly Gly Asp Cys Ala Glu Thr Phe Glu 85 90 95 Ser Asn Thr Glu Pro His Ile Arg Ala Asn Val Lys Thr Leu Leu Gln 100 105 110 Met Ala Val Val Leu Thr Tyr Gly Ala Ser Thr Pro Val Ile Lys Met 115 120 125 Ala Arg Ile Ala Gly Gln Tyr Ala Lys Pro Arg Ser Ser Asp Leu Asp 130 135 140 Gly Asn Gly Leu Pro Asn Tyr Arg Gly Asp Ile Val Asn Gly Val Glu 145 150 155 160 Ala Thr Pro Glu Ala Arg Arg His Asp Pro Ala Arg Met Ile Arg Ala 165 170 175 Tyr Ala Asn Ala Ser Ala Ala Met Asn Leu Val Arg Ala Leu Thr Ser 180 185 190 Ser Gly Thr Ala Asp Leu Tyr Arg Leu Ser Glu Trp Asn Arg Glu Phe 195 200 205 Val Ala Asn Ser Pro Ala Gly Ala Arg Tyr Glu Ala Leu Ala Arg Glu 210 215 220 Ile Asp Ser Gly Leu Arg Phe Met Glu Ala Cys Gly Val Ser Asp Glu 225 230 235 240 Ser Leu Arg Ala Ala Asp Ile Tyr Cys Ser His Glu Ala Leu Leu Val 245 250 255 Asp Tyr Glu Arg Ser Met Leu Arg Leu Ala Thr Asp Glu Glu Gly Asn 260 265 270 Glu Glu Leu Tyr Asp Leu Ser Ala His Gln Leu Trp Ile Gly Glu Arg 275 280 285 Thr Arg Gly Met Asp Asp Phe His Val Asn Phe Ala Ser Met Ile Ser 290 295 300 Asn Pro Ile Gly Ile Lys Ile Gly Pro Gly Ile Thr Pro Glu Glu Ala 305 310 315 320 Val Ala Tyr Ala Asp Lys Leu Asp Pro Asn Phe Glu Pro Gly Arg Leu 325 330 335 Thr Ile Val Ala Arg Met Gly His Asp Lys Val Arg Ser Val Leu Pro 340 345 350 Gly Val Ile Gln Ala Val Glu Ala Ser Gly His Lys Val Ile Trp Gln 355 360 365 Ser Asp Pro Met His Gly Asn Thr Phe Thr Ala Ser Asn Cys Tyr Lys 370 375 380 Thr Arg His Phe Asp Lys Val Ile Asp Glu Val Gln Gly Phe Phe Glu 385 390 395 400 Val His Arg Ala Leu Gly Thr His Pro Gly Gly Ile His Ile Glu Phe 405 410 415 Thr Gly Glu Asp Val Thr Glu Cys Leu Gly Gly Ala Glu Asp Ile Thr 420 425 430 Asp Val Asp Leu Pro Gly Arg Tyr Glu Ser Ala Cys Asp Pro Arg Leu 435 440 445 Asn Thr Gln Gln Ser Leu Glu Leu Ala Phe Leu Val Ala Glu Met Leu 450 455 460 Arg Asn 465 <210> 46 <211> 1401 <212> DNA <213> Artificial Sequence <220> <223> (G382C)_aroG <400> 46 atgaataggg gtgtgagttg gacagttgat atccctaaag aagttctccc tgatttgcca 60 ccattgccag aaggcatgca gcagcagttc gaggacacca tttcccgtga cgctaagcag 120 caacctacgt gggatcgtgc acaggcagaa aacgtgcgca agatccttga gtcggttcct 180 ccaatcgttg ttgcccctga ggtacttgag ctgaagcaga agcttgctga tgttgccaac 240 ggtaaggcct tcctcttgca gggtggtgac tgtgcggaaa ctttcgagtc aaacactgag 300 ccgcacattc gcgccaacgt aaagactctg ctgcagatgg cagttgtttt gacctacggt 360 gcatccactc ctgtgatcaa gatggctcgt attgctggtc agtacgcaaa gcctcgctct 420 tctgatctgg atggaaatgg tctgccaaac taccgtggcg atatcgtcaa cggtgtggag 480 gcaaccccag aggctcgtcg ccacgatcct gcccgcatga tccgtgctta cgctaacgct 540 tctgctgcga tgaacttggt gcgcgcgctc accagctctg gcaccgctga tctttaccgt 600 ctcagcgagt ggaaccgcga gttcgttgcg aactccccag ctggtgcacg ctacgaggct 660 cttgctcgtg agatcgactc cggtctgcgc ttcatggaag catgtggcgt gtccgatgag 720 tccctgcgtg ctgcagatat ctactgctcc cacgaggctt tgctggtgga ttacgagcgt 780 tccatgctgc gtcttgcaac cgatgaggaa ggcaacgagg aactttacga tctttcagct 840 caccagctgt ggatcggcga gcgcacccgt ggcatggatg atttccatgt gaacttcgca 900 tccatgatct ctaacccaat cggcatcaag attggtcctg gtatcacccc tgaagaggct 960 gttgcatacg ctgacaagct cgatccgaac ttcgagcctg gccgtttgac catcgttgct 1020 cgcatgggcc acgacaaggt tcgctccgta cttcctggtg ttatccaggc tgttgaggca 1080 tccggacaca aggttatttg gcagtccgat ccgatgcacg gcaacacttt caccgcatcc 1140 aattgctaca agacccgtca cttcgacaag gttatcgatg aggtccaggg cttcttcgag 1200 gtccaccgcg cattgggcac ccacccaggc ggaatccaca ttgagttcac tggtgaagat 1260 gtcaccgagt gcctcggtgg cgctgaagac atcaccgatg ttgatctgcc aggccgctac 1320 gagtccgcat gcgatcctcg cctgaacact cagcagtctt tggagttggc tttcctcgtt 1380 gcagaaatgc tgcgtaacta a 1401 <210> 47 <211> 466 <212> PRT <213> Artificial Sequence <220> <223> (WT)_3-deoxy-D-arabinoheptulosonate-7-phosphate synthase <400> 47 Met Asn Arg Gly Val Ser Trp Thr Val Asp Ile Pro Lys Glu Val Leu 1 5 10 15 Pro Asp Leu Pro Pro Leu Pro Glu Gly Met Gln Gln Gln Phe Glu Asp 20 25 30 Thr Ile Ser Arg Asp Ala Lys Gln Gln Pro Thr Trp Asp Arg Ala Gln 35 40 45 Ala Glu Asn Val Arg Lys Ile Leu Glu Ser Val Pro Pro Ile Val Val 50 55 60 Ala Pro Glu Val Leu Glu Leu Lys Gln Lys Leu Ala Asp Val Ala Asn 65 70 75 80 Gly Lys Ala Phe Leu Leu Gln Gly Gly Asp Cys Ala Glu Thr Phe Glu 85 90 95 Ser Asn Thr Glu Pro His Ile Arg Ala Asn Val Lys Thr Leu Leu Gln 100 105 110 Met Ala Val Val Leu Thr Tyr Gly Ala Ser Thr Pro Val Ile Lys Met 115 120 125 Ala Arg Ile Ala Gly Gln Tyr Ala Lys Pro Arg Ser Ser Asp Leu Asp 130 135 140 Gly Asn Gly Leu Pro Asn Tyr Arg Gly Asp Ile Val Asn Gly Val Glu 145 150 155 160 Ala Thr Pro Glu Ala Arg Arg His Asp Pro Ala Arg Met Ile Arg Ala 165 170 175 Tyr Ala Asn Ala Ser Ala Ala Met Asn Leu Val Arg Ala Leu Thr Ser 180 185 190 Ser Gly Thr Ala Asp Leu Tyr Arg Leu Ser Glu Trp Asn Arg Glu Phe 195 200 205 Val Ala Asn Ser Pro Ala Gly Ala Arg Tyr Glu Ala Leu Ala Arg Glu 210 215 220 Ile Asp Ser Gly Leu Arg Phe Met Glu Ala Cys Gly Val Ser Asp Glu 225 230 235 240 Ser Leu Arg Ala Ala Asp Ile Tyr Cys Ser His Glu Ala Leu Leu Val 245 250 255 Asp Tyr Glu Arg Ser Met Leu Arg Leu Ala Thr Asp Glu Glu Gly Asn 260 265 270 Glu Glu Leu Tyr Asp Leu Ser Ala His Gln Leu Trp Ile Gly Glu Arg 275 280 285 Thr Arg Gly Met Asp Asp Phe His Val Asn Phe Ala Ser Met Ile Ser 290 295 300 Asn Pro Ile Gly Ile Lys Ile Gly Pro Gly Ile Thr Pro Glu Glu Ala 305 310 315 320 Val Ala Tyr Ala Asp Lys Leu Asp Pro Asn Phe Glu Pro Gly Arg Leu 325 330 335 Thr Ile Val Ala Arg Met Gly His Asp Lys Val Arg Ser Val Leu Pro 340 345 350 Gly Val Ile Gln Ala Val Glu Ala Ser Gly His Lys Val Ile Trp Gln 355 360 365 Ser Asp Pro Met His Gly Asn Thr Phe Thr Ala Ser Asn Gly Tyr Lys 370 375 380 Thr Arg His Phe Asp Lys Val Ile Asp Glu Val Gln Gly Phe Phe Glu 385 390 395 400 Val His Arg Ala Leu Gly Thr His Pro Gly Gly Ile His Ile Glu Phe 405 410 415 Thr Gly Glu Asp Val Thr Glu Cys Leu Gly Gly Ala Glu Asp Ile Thr 420 425 430 Asp Val Asp Leu Pro Gly Arg Tyr Glu Ser Ala Cys Asp Pro Arg Leu 435 440 445 Asn Thr Gln Gln Ser Leu Glu Leu Ala Phe Leu Val Ala Glu Met Leu 450 455 460 Arg Asn 465 <210> 48 <211> 1401 <212> DNA <213> Artificial Sequence <220> <223> (WT)_aroG <400> 48 atgaataggg gtgtgagttg gacagttgat atccctaaag aagttctccc tgatttgcca 60 ccattgccag aaggcatgca gcagcagttc gaggacacca tttcccgtga cgctaagcag 120 caacctacgt gggatcgtgc acaggcagaa aacgtgcgca agatccttga gtcggttcct 180 ccaatcgttg ttgcccctga ggtacttgag ctgaagcaga agcttgctga tgttgccaac 240 ggtaaggcct tcctcttgca gggtggtgac tgtgcggaaa ctttcgagtc aaacactgag 300 ccgcacattc gcgccaacgt aaagactctg ctgcagatgg cagttgtttt gacctacggt 360 gcatccactc ctgtgatcaa gatggctcgt attgctggtc agtacgcaaa gcctcgctct 420 tctgatctgg atggaaatgg tctgccaaac taccgtggcg atatcgtcaa cggtgtggag 480 gcaaccccag aggctcgtcg ccacgatcct gcccgcatga tccgtgctta cgctaacgct 540 tctgctgcga tgaacttggt gcgcgcgctc accagctctg gcaccgctga tctttaccgt 600 ctcagcgagt ggaaccgcga gttcgttgcg aactccccag ctggtgcacg ctacgaggct 660 cttgctcgtg agatcgactc cggtctgcgc ttcatggaag catgtggcgt gtccgatgag 720 tccctgcgtg ctgcagatat ctactgctcc cacgaggctt tgctggtgga ttacgagcgt 780 tccatgctgc gtcttgcaac cgatgaggaa ggcaacgagg aactttacga tctttcagct 840 caccagctgt ggatcggcga gcgcacccgt ggcatggatg atttccatgt gaacttcgca 900 tccatgatct ctaacccaat cggcatcaag attggtcctg gtatcacccc tgaagaggct 960 gttgcatacg ctgacaagct cgatccgaac ttcgagcctg gccgtttgac catcgttgct 1020 cgcatgggcc acgacaaggt tcgctccgta cttcctggtg ttatccaggc tgttgaggca 1080 tccggacaca aggttatttg gcagtccgat ccgatgcacg gcaacacttt caccgcatcc 1140 aatggctaca agacccgtca cttcgacaag gttatcgatg aggtccaggg cttcttcgag 1200 gtccaccgcg cattgggcac ccacccaggc ggaatccaca ttgagttcac tggtgaagat 1260 gtcaccgagt gcctcggtgg cgctgaagac atcaccgatg ttgatctgcc aggccgctac 1320 gagtccgcat gcgatcctcg cctgaacact cagcagtctt tggagttggc tttcctcgtt 1380 gcagaaatgc tgcgtaacta a 1401 <210> 49 <211> 367 <212> PRT <213> Artificial Sequence <220> <223> (P209L)_N-succinyldiaminopimelate aminotransferase <400> 49 Met Thr Ser Arg Thr Pro Leu Val Ser Val Leu Pro Asp Phe Pro Trp 1 5 10 15 Asp Ser Leu Ala Ser Ala Lys Ala Lys Ala Ala Ser His Pro Asp Gly 20 25 30 Ile Val Asn Leu Ser Val Gly Thr Pro Val Asp Pro Val Ala Pro Ser 35 40 45 Ile Gln Ile Ala Leu Ala Glu Ala Ala Gly Phe Ser Gly Tyr Pro Gln 50 55 60 Thr Ile Gly Thr Pro Glu Leu Arg Ala Ala Ile Arg Gly Ala Leu Glu 65 70 75 80 Arg Arg Tyr Asn Met Thr Lys Leu Val Asp Ala Ser Leu Leu Pro Val 85 90 95 Val Gly Thr Lys Glu Ala Ile Ala Leu Leu Pro Phe Ala Leu Gly Ile 100 105 110 Ser Gly Thr Val Val Ile Pro Glu Ile Ala Tyr Pro Thr Tyr Glu Val 115 120 125 Ala Val Val Ala Ala Gly Cys Thr Val Leu Arg Ser Asp Ser Leu Phe 130 135 140 Lys Leu Gly Pro Gln Ile Pro Ser Met Met Phe Ile Asn Ser Pro Ser 145 150 155 160 Asn Pro Thr Gly Lys Val Leu Gly Ile Pro His Leu Arg Lys Val Val 165 170 175 Lys Trp Ala Gln Glu Asn Asn Val Ile Leu Ala Ala Asp Glu Cys Tyr 180 185 190 Leu Gly Leu Gly Trp Asp Asp Glu Asn Pro Pro Ile Ser Ile Leu Asp 195 200 205 Leu Arg Val Cys Asp Gly Asp His Thr Asn Leu Ile Ala Ile His Ser 210 215 220 Leu Ser Lys Thr Ser Asn Leu Ala Ser Tyr Arg Ala Gly Tyr Leu Val 225 230 235 240 Gly Asp Pro Ala Leu Ile Gly Glu Leu Thr Glu Val Arg Lys Asn Leu 245 250 255 Gly Leu Met Val Pro Phe Pro Ile Gln Gln Ala Met Ile Ala Ala Leu 260 265 270 Asn Asp Asp Asp Gln Glu Ala Gly Gln Lys Leu Thr Tyr Ala Ile Arg 275 280 285 Arg Ala Lys Leu Met Arg Ala Leu Leu Glu Ser Gly Phe Gln Val Asp 290 295 300 Asn Ser Glu Ala Gly Leu Tyr Leu Trp Ala Thr Arg Glu Glu Pro Cys 305 310 315 320 Arg Asp Thr Val Asp Trp Phe Ala Glu Arg Gly Ile Leu Val Ala Pro 325 330 335 Gly Asp Phe Tyr Gly Pro Arg Gly Ala Gln His Val Arg Val Ala Met 340 345 350 Thr Glu Thr Asp Glu Arg Val Asp Ala Phe Val Ser Arg Leu Ser 355 360 365 <210> 50 <211> 1104 <212> DNA <213> Artificial Sequence <220> <223> (P209L)_NCgl1058 <400> 50 atgacctctc gcaccccgct tgtttctgtt cttcctgatt ttccgtggga ttcgctcgct 60 tccgcaaaag ccaaagctgc gtctcacccg gatgggatcg tgaatctttc tgttggcact 120 ccggttgatc cggtcgcgcc cagcattcag atcgcgttgg cagaagcagc ggggttttcg 180 ggttaccctc aaaccatcgg caccccggaa ctccgcgcag ccatcagggg cgcgcttgag 240 cggcgctaca acatgacaaa gcttgtcgac gcctccctcc tccccgtcgt gggtaccaag 300 gaggcaattg cccttcttcc attcgcgttg ggtatttccg gcaccgttgt catcccagag 360 attgcgtacc caacctacga agtcgctgtc gtggccgcag gatgcaccgt gttgcgttct 420 gattcgctgt ttaagctcgg cccgcagatc ccgtcgatga tgtttatcaa ctcaccatcc 480 aaccccacag gcaaggttct gggcatccca cacttgcgca aggttgtgaa gtgggcgcag 540 gaaaacaacg tgatcctcgc agctgatgaa tgctacttgg gtcttggctg ggacgatgaa 600 aacccaccga tctcaatttt ggatctacgt gtctgcgatg gcgaccacac caacttgatc 660 gccattcact cgctgtctaa aacctcaaac ctcgcttctt accgcgcagg ttacctcgtt 720 ggcgatccag cgctgattgg tgaactcacg gaagtccgta agaacttggg tctcatggtt 780 cctttcccaa tccagcaggc catgatcgca gccctcaacg acgatgacca agaggcaggg 840 cagaagctca cctacgcgat tcgtcgagca aaactcatgc gcgccctgtt ggaatccggc 900 tttcaggtag ataattctga agcgggtctg tacctctggg cgacgcgtga agaaccttgc 960 cgtgacactg tcgattggtt cgctgagcgt ggcattctcg ttgccccagg agacttctat 1020 ggccctcgcg gagcgcagca tgtgcgtgtg gcgatgaccg aaaccgacga gcgcgtcgac 1080 gcctttgttt ctcgcctgag ctaa 1104 <210> 51 <211> 367 <212> PRT <213> Artificial Sequence <220> <223> (WT)_N-succinyldiaminopimelate aminotransferase <400> 51 Met Thr Ser Arg Thr Pro Leu Val Ser Val Leu Pro Asp Phe Pro Trp 1 5 10 15 Asp Ser Leu Ala Ser Ala Lys Ala Lys Ala Ala Ser His Pro Asp Gly 20 25 30 Ile Val Asn Leu Ser Val Gly Thr Pro Val Asp Pro Val Ala Pro Ser 35 40 45 Ile Gln Ile Ala Leu Ala Glu Ala Ala Gly Phe Ser Gly Tyr Pro Gln 50 55 60 Thr Ile Gly Thr Pro Glu Leu Arg Ala Ala Ile Arg Gly Ala Leu Glu 65 70 75 80 Arg Arg Tyr Asn Met Thr Lys Leu Val Asp Ala Ser Leu Leu Pro Val 85 90 95 Val Gly Thr Lys Glu Ala Ile Ala Leu Leu Pro Phe Ala Leu Gly Ile 100 105 110 Ser Gly Thr Val Val Ile Pro Glu Ile Ala Tyr Pro Thr Tyr Glu Val 115 120 125 Ala Val Val Ala Ala Gly Cys Thr Val Leu Arg Ser Asp Ser Leu Phe 130 135 140 Lys Leu Gly Pro Gln Ile Pro Ser Met Met Phe Ile Asn Ser Pro Ser 145 150 155 160 Asn Pro Thr Gly Lys Val Leu Gly Ile Pro His Leu Arg Lys Val Val 165 170 175 Lys Trp Ala Gln Glu Asn Asn Val Ile Leu Ala Ala Asp Glu Cys Tyr 180 185 190 Leu Gly Leu Gly Trp Asp Asp Glu Asn Pro Pro Ile Ser Ile Leu Asp 195 200 205 Pro Arg Val Cys Asp Gly Asp His Thr Asn Leu Ile Ala Ile His Ser 210 215 220 Leu Ser Lys Thr Ser Asn Leu Ala Ser Tyr Arg Ala Gly Tyr Leu Val 225 230 235 240 Gly Asp Pro Ala Leu Ile Gly Glu Leu Thr Glu Val Arg Lys Asn Leu 245 250 255 Gly Leu Met Val Pro Phe Pro Ile Gln Gln Ala Met Ile Ala Ala Leu 260 265 270 Asn Asp Asp Asp Gln Glu Ala Gly Gln Lys Leu Thr Tyr Ala Ile Arg 275 280 285 Arg Ala Lys Leu Met Arg Ala Leu Leu Glu Ser Gly Phe Gln Val Asp 290 295 300 Asn Ser Glu Ala Gly Leu Tyr Leu Trp Ala Thr Arg Glu Glu Pro Cys 305 310 315 320 Arg Asp Thr Val Asp Trp Phe Ala Glu Arg Gly Ile Leu Val Ala Pro 325 330 335 Gly Asp Phe Tyr Gly Pro Arg Gly Ala Gln His Val Arg Val Ala Met 340 345 350 Thr Glu Thr Asp Glu Arg Val Asp Ala Phe Val Ser Arg Leu Ser 355 360 365 <210> 52 <211> 1104 <212> DNA <213> Artificial Sequence <220> <223> (WT)_NCgl1058 <400> 52 atgacctctc gcaccccgct tgtttctgtt cttcctgatt ttccgtggga ttcgctcgct 60 tccgcaaaag ccaaagctgc gtctcacccg gatgggatcg tgaatctttc tgttggcact 120 ccggttgatc cggtcgcgcc cagcattcag atcgcgttgg cagaagcagc ggggttttcg 180 ggttaccctc aaaccatcgg caccccggaa ctccgcgcag ccatcagggg cgcgcttgag 240 cggcgctaca acatgacaaa gcttgtcgac gcctccctcc tccccgtcgt gggtaccaag 300 gaggcaattg cccttcttcc attcgcgttg ggtatttccg gcaccgttgt catcccagag 360 attgcgtacc caacctacga agtcgctgtc gtggccgcag gatgcaccgt gttgcgttct 420 gattcgctgt ttaagctcgg cccgcagatc ccgtcgatga tgtttatcaa ctcaccatcc 480 aaccccacag gcaaggttct gggcatccca cacttgcgca aggttgtgaa gtgggcgcag 540 gaaaacaacg tgatcctcgc agctgatgaa tgctacttgg gtcttggctg ggacgatgaa 600 aacccaccga tctcaatttt ggatccacgt gtctgcgatg gcgaccacac caacttgatc 660 gccattcact cgctgtctaa aacctcaaac ctcgcttctt accgcgcagg ttacctcgtt 720 ggcgatccag cgctgattgg tgaactcacg gaagtccgta agaacttggg tctcatggtt 780 cctttcccaa tccagcaggc catgatcgca gccctcaacg acgatgacca agaggcaggg 840 cagaagctca cctacgcgat tcgtcgagca aaactcatgc gcgccctgtt ggaatccggc 900 tttcaggtag ataattctga agcgggtctg tacctctggg cgacgcgtga agaaccttgc 960 cgtgacactg tcgattggtt cgctgagcgt ggcattctcg ttgccccagg agacttctat 1020 ggccctcgcg gagcgcagca tgtgcgtgtg gcgatgaccg aaaccgacga gcgcgtcgac 1080 gcctttgttt ctcgcctgag ctaa 1104

Claims (5)

  1. 하기 (1) 내지 (13)으로 이루어지는 군에서 선택되는 단백질 변이체:
    (1) 서열번호 3의 220번째 위치에 상응하는 아미노산인 페닐알라닌이 시스테인으로 치환된, 서열번호 1로 기재된 아미노산 서열로 이루어진 내재성 막 수송 단백질 변이체;
    (2) 서열번호 7의 43번째 위치에 상응하는 아미노산인 프롤린이 류신으로 치환된, 서열번호 5로 기재된 아미노산 서열로 이루어진 DNA 중합효소 Ⅲ 감마 및 타우 서브유닛 변이체;
    (3) 서열번호 11의 33번째 위치에 상응하는 아미노산인 시스테인이 세린으로 치환된, 서열번호 9로 기재된 아미노산 서열로 이루어진 단백질 변이체;
    (4) 서열번호 15의 210번째 위치에 상응하는 아미노산인 아스파라긴이 아스파르트산으로 치환된, 서열번호 13로 기재된 아미노산 서열로 이루어진 전사 안티터미네이션 단백질 변이체;
    (5) 서열번호 19의 199번째 위치에 상응하는 아미노산인 발린이 메티오닌으로 치환된, 서열번호 17로 기재된 아미노산 서열로 이루어진 ABC 트랜스포터 ATP-결합 단백질 변이체;
    (6) 서열번호 23의 272번째 위치에 상응하는 아미노산인 트레오닌이 이소류신으로 치환된, 서열번호 21로 기재된 아미노산 서열로 이루어진 말레이트 디하이드로게나제 변이체;
    (7) 서열번호 27의 304번째 위치에 상응하는 아미노산인 아르기닌이 글루타민으로 치환된, 서열번호 25로 기재된 아미노산 서열로 이루어진 프리모솜 조립 단백질 변이체;
    (8) 서열번호 31의 169번째 위치에 상응하는 아미노산인 알라닌이 발린으로 치환된, 서열번호 29로 기재된 아미노산 서열로 이루어진 타입 II 시트레이트 신타아제 변이체;
    (9) 서열번호 35의 294번째 위치에 상응하는 아미노산인 글루탐산이 라이신으로 치환된, 서열번호 33로 기재된 아미노산 서열로 이루어진 막 단백질 변이체;
    (10) 서열번호 39의 358번째 위치에 상응하는 아미노산인 프롤린이 세린으로 치환된, 서열번호 37로 기재된 아미노산 서열로 이루어진 미코티온 리덕타제 변이체;
    (11) 서열번호 43의 130번째 위치에 상응하는 아미노산인 글리신이 아스파르트산으로 치환된, 서열번호 41로 기재된 아미노산 서열로 이루어진 Co/Zn/Cd 유출 시스템 컴포넌트 변이체;
    (12) 서열번호 47의 382번째 위치에 상응하는 아미노산인 글리신이 시스테인으로 치환된, 서열번호 45으로 기재된 아미노산 서열로 이루어진 DAHP 신타아제 변이체; 및
    (13) 서열번호 51의 209번째 위치에 상응하는 아미노산인 프롤린이 류신으로 치환된, 서열번호 49로 기재된 아미노산 서열로 이루어진 N-숙시닐디아미노피멜레이트 아미노트랜스퍼라제 변이체.
  2. 제1항의 변이체를 코딩하는 폴리뉴클레오티드.
  3. 하기 (a) 및 (b)의 단백질 변이체 또는 상기 변이체를 코딩하는 폴리뉴클레오티드를 포함하는, 코리네박테리움 글루타미쿰 균주:
    (a) 서열번호 51의 209번째 위치에 상응하는 아미노산인 프롤린이 류신으로 치환된, 서열번호 49로 기재된 아미노산 서열로 이루어진 N-숙시닐디아미노피멜레이트 아미노트랜스퍼라제 변이체 및
    (b) 하기 (1) 내지 (12)로 이루어지는 군에서 선택된 1종 이상의 단백질 변이체:
    (1) 서열번호 3의 220번째 위치에 상응하는 아미노산인 페닐알라닌이 시스테인으로 치환된, 서열번호 1로 기재된 아미노산 서열로 이루어진 내재성 막 수송 단백질 변이체;
    (2) 서열번호 7의 43번째 위치에 상응하는 아미노산인 프롤린이 류신으로 치환된, 서열번호 5로 기재된 아미노산 서열로 이루어진 DNA 중합효소 Ⅲ 감마 및 타우 서브유닛 변이체;
    (3) 서열번호 11의 33번째 위치에 상응하는 아미노산인 시스테인이 세린으로 치환된, 서열번호 9로 기재된 아미노산 서열로 이루어진 단백질 변이체;
    (4) 서열번호 15의 210번째 위치에 상응하는 아미노산인 아스파라긴이 아스파르트산으로 치환된, 서열번호 13로 기재된 아미노산 서열로 이루어진 전사 안티터미네이션 단백질 변이체;
    (5) 서열번호 19의 199번째 위치에 상응하는 아미노산인 발린이 메티오닌으로 치환된, 서열번호 17로 기재된 아미노산 서열로 이루어진 ABC 트랜스포터 ATP-결합 단백질 변이체;
    (6) 서열번호 23의 272번째 위치에 상응하는 아미노산인 트레오닌이 이소류신으로 치환된, 서열번호 21로 기재된 아미노산 서열로 이루어진 말레이트 디하이드로게나제 변이체;
    (7) 서열번호 27의 304번째 위치에 상응하는 아미노산인 아르기닌이 글루타민으로 치환된, 서열번호 25로 기재된 아미노산 서열로 이루어진 프리모솜 조립 단백질 변이체;
    (8) 서열번호 31의 169번째 위치에 상응하는 아미노산인 알라닌이 발린으로 치환된, 서열번호 29로 기재된 아미노산 서열로 이루어진 타입 II 시트레이트 신타아제 변이체;
    (9) 서열번호 35의 294번째 위치에 상응하는 아미노산인 글루탐산이 라이신으로 치환된, 서열번호 33로 기재된 아미노산 서열로 이루어진 막 단백질 변이체;
    (10) 서열번호 39의 358번째 위치에 상응하는 아미노산인 프롤린이 세린으로 치환된, 서열번호 37로 기재된 아미노산 서열로 이루어진 미코티온 리덕타제 변이체;
    (11) 서열번호 43의 130번째 위치에 상응하는 아미노산인 글리신이 아스파르트산으로 치환된, 서열번호 41로 기재된 아미노산 서열로 이루어진 Co/Zn/Cd 유출 시스템 컴포넌트 변이체; 및
    (12) 서열번호 47의 382번째 위치에 상응하는 아미노산인 글리신이 시스테인으로 치환된, 서열번호 45으로 기재된 아미노산 서열로 이루어진 DAHP 신타아제 변이체.
  4. 제3항에 있어서, 상기 단백질 변이체 또는 상기 변이체를 코딩하는 폴리뉴클레오티드를 포함하지 않는 코리네박테리움 글루타미쿰과 비교하여 L-라이신 생산능이 증가된, 균주.
  5. 제3항 또는 제4항의 코리네박테리움 글루타미쿰 균주를 배지에서 배양하는 단계를 포함하는, L-라이신 생산 방법.
KR1020210013694A 2021-01-29 2021-01-29 신규한 단백질 변이체 및 이를 이용한 l-라이신 생산 방법 KR20220110413A (ko)

Priority Applications (3)

Application Number Priority Date Filing Date Title
KR1020210013694A KR20220110413A (ko) 2021-01-29 2021-01-29 신규한 단백질 변이체 및 이를 이용한 l-라이신 생산 방법
PCT/KR2021/003261 WO2022163904A1 (ko) 2021-01-29 2021-03-16 신규한 단백질 변이체 및 이를 이용한 l-라이신 생산 방법
PCT/KR2021/007122 WO2022163951A1 (ko) 2021-01-29 2021-06-08 신규한 단백질 변이체 및 이를 이용한 l-라이신 생산 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020210013694A KR20220110413A (ko) 2021-01-29 2021-01-29 신규한 단백질 변이체 및 이를 이용한 l-라이신 생산 방법

Publications (1)

Publication Number Publication Date
KR20220110413A true KR20220110413A (ko) 2022-08-08

Family

ID=82845338

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020210013694A KR20220110413A (ko) 2021-01-29 2021-01-29 신규한 단백질 변이체 및 이를 이용한 l-라이신 생산 방법

Country Status (1)

Country Link
KR (1) KR20220110413A (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP4333107A1 (en) 2022-08-31 2024-03-06 LG Energy Solution, Ltd. Positive electrode material for lithium-sulfur battery and lithium-sulfur battery comprising the same

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP4333107A1 (en) 2022-08-31 2024-03-06 LG Energy Solution, Ltd. Positive electrode material for lithium-sulfur battery and lithium-sulfur battery comprising the same

Similar Documents

Publication Publication Date Title
KR102277407B1 (ko) 신규한 글루타메이트 합성 효소 서브 유니트 알파 변이체 및 이를 이용한 l-글루탐산 생산 방법
KR102284730B1 (ko) 신규한 수용성 피리딘 뉴클레오티드 트랜스수소효소 변이체 및 이를 이용한 l-트립토판 생산 방법
KR102274484B1 (ko) 신규한 f0f1 atp 합성효소 서브유닛 알파 변이체 및 이를 이용한 xmp 또는 gmp 생산 방법
KR102273639B1 (ko) 신규한 이중기능성 메틸렌테트라히드로폴레이트 탈수소효소/메테닐테트라하이드로폴레이트 사이클로하이드롤라아제 변이체 및 이를 이용한 xmp 또는 gmp 생산 방법
KR102273638B1 (ko) 신규한 포스포글리세린산 디하이드로게나제 변이체 및 이를 이용한 xmp 또는 gmp 생산 방법
KR102279696B1 (ko) 신규한 l-세린 암모니아 분해 효소 변이체 및 이를 이용한 xmp 또는 gmp 생산 방법
KR102284731B1 (ko) 신규한 아이소시트르산 디하이드로게네이즈 키나아제/포스파타제 효소 변이체 및 이를 이용한 l-트립토판 생산 방법
KR102277408B1 (ko) 신규한 포르메이트 의존성 포스포리보실글리신아미드 포밀 전이효소 변이체 및 이를 이용한 imp 생산 방법
KR20220110413A (ko) 신규한 단백질 변이체 및 이를 이용한 l-라이신 생산 방법
KR102273640B1 (ko) 신규한 f0f1 atp 합성효소 서브유닛 감마 변이체 및 이를 이용한 xmp 또는 gmp 생산 방법
KR20220110412A (ko) 신규한 단백질 변이체 및 이를 이용한 l-라이신 생산 방법
KR102306010B1 (ko) 신규한 분지쇄아미노산 투과효소 변이체 및 이를 이용한 l-발린 생산 방법
KR102284725B1 (ko) 신규한 페로체라테이즈 변이체 및 이를 이용한 l-트립토판 생산 방법
KR102277409B1 (ko) 신규한 2중기능성 포스포리보실아미노이미다졸카르복사미드 포밀트랜스퍼라아제/imp 사이클로하이드롤라아제 변이체 및 이를 이용한 imp 생산 방법
KR102267931B1 (ko) 신규한 5-(카르복시아미노)이미다졸리보뉴클레오티드합성효소 변이체 및 이를 이용한 imp 생산 방법
KR102287111B1 (ko) 신규한 데옥시구아노신트리포스페이트 트리포스포하이드로레이즈 변이체 및 이를 이용한 l-트립토판 생산 방법
KR102287114B1 (ko) 신규한 사이토신 퍼미에이즈 변이체 및 이를 이용한 l-트립토판 생산 방법
KR102287112B1 (ko) 신규한 쿠퍼익스포팅 P-type 에이티피에이즈 A 변이체 및 이를 이용한 L-트립토판 생산 방법
KR20220127078A (ko) 신규한 시트레이트 신타아제 변이체 및 이를 이용한 l-발린 생산 방법
KR102277031B1 (ko) 신규한 타입 ii 시트레이트 신타아제 변이체 및 이를 이용한 l-라이신 생산 방법
KR102281369B1 (ko) 신규한 디히드로리포일 아세틸기전이효소 변이체 및 이를 이용한 l-발린 생산 방법
KR102306009B1 (ko) 신규한 WhiB 계열 전사 조절자 WhcA 변이체 및 이를 이용한 L-발린 생산 방법
KR102314884B1 (ko) 신규한 세포분해 막단백질 변이체 및 이를 이용한 l-라이신 생산 방법
KR102284728B1 (ko) 신규한 H(+)/Cl(-) 익스체인지 트랜스포터 변이체 및 이를 이용한 L-트립토판 생산 방법
KR102338875B1 (ko) 신규한 당 인산염 이성질화효소/에피머레이즈 변이체 및 이를 이용한 l-라이신 생산 방법