KR102525072B1

KR102525072B1 - 신규한 시트레이트 신타아제 변이체 및 이를 이용한 l-아미노산 생산 방법

Info

Publication number: KR102525072B1
Application number: KR1020210031641A
Authority: KR
Inventors: 장진숙; 김주연; 김선혜; 최선형; 윤병훈; 김형준; 조승현; 이재민; 김서윤; 이임상
Original assignee: 씨제이제일제당 주식회사
Priority date: 2021-03-10
Filing date: 2021-03-10
Publication date: 2023-04-24
Also published as: EP4282959A1; BR112023017369A2; KR20220127077A; US20240182872A1; CN117500920A; JP2024507936A; CA3210256A1; MX2023010437A; WO2022191635A1

Abstract

본 출원은 신규한 시트레이트 신타아제(Citrate synthase) 변이체, 상기 변이체를 포함하는 미생물 및 상기 미생물을 이용한 L-아미노산 생산 방법에 관한 것이다.

Description

신규한 시트레이트 신타아제 변이체 및 이를 이용한 L-아미노산 생산 방법{Novel citrate synthase variant and a method for producing L-amino acid using the same}

L-아미노산 및 기타 유용물질을 생산하기 위하여, 고효율 생산 미생물 및 발효공정기술 개발을 위한 다양한 연구들이 수행되고 있다. 예를 들어, L-발린 생합성에 관여하는 효소를 코딩하는 유전자의 발현을 증가시키거나 또는 생합성에 불필요한 유전자를 제거하는 것과 같은 목적 물질 특이적 접근 방법이 주로 이용되고 있다(US 8465962 B2, KR 10-2153534 B1).

한편, 시트레이트 신타아제(Citrate synthase; CS)는 미생물의 해당과정에서 생성되는 아세틸 코에이와 옥살로아세테이트를 중합하여 시트레이트를 생성하는 효소이며, 또한 TCA 경로로의 탄소유입을 결정하는 중요한 효소이다.

시트레이트 신타아제를 코딩하는 gltA 유전자 결손에 따른 L-리신 생산 균주의 phenotype 변화에 관한 내용은 선행문헌에 보고되어 있다 (Ooyen et al., Biotechnol. Bioeng., 109(8):2070-2081, 2012). 그러나 gltA 유전자 결손 균주의 경우 균주의 생장이 저해될 뿐만 아니라, 당 소모속도가 대폭 감소되어 단위시간당 리신 생산량이 낮은 단점이 있다. 따라서, 효과적인 L-아미노산의 생산능 증가 및 균주의 생장을 함께 고려한 연구가 여전히 필요한 실정이다.

본 출원의 하나의 목적은 서열번호 1의 아미노산 서열의 415번째 위치에 상응하는 아미노산인 리신이 히스티딘으로 치환된, 시트레이트 신타아제 변이체를 제공하는 것이다.

본 출원의 다른 목적은 본 출원의 변이체를 코딩하는 폴리뉴클레오티드를 제공하는 것이다.

본 출원의 다른 목적은 본 출원의 변이체 또는 상기 변이체를 코딩하는 폴리뉴클레오티드를 포함하는, 코리네박테리움 속 미생물을 제공하는 것이다.

본 출원의 또 다른 목적은 본 출원의 미생물을 이용하여 L-아미노산을 생산하는 방법을 제공하는 것이다.

본 출원의 또 다른 목적은 본 출원의 미생물; 본 출원의 미생물을 배양한 배지; 또는 이들의 조합을 포함하는 L-아미노산 생산용 조성물을 제공하는 것이다.

이를 구체적으로 설명하면 다음과 같다. 한편, 본 출원에서 개시된 각각의 설명 및 실시형태는 각각의 다른 설명 및 실시 형태에도 적용될 수 있다. 즉, 본 출원에서 개시된 다양한 요소들의 모든 조합이 본 출원의 범주에 속한다. 또한, 하기 기술된 구체적인 서술에 의하여 본 출원의 범주가 제한된다고 볼 수 없다. 또한, 본 명세서 전체에 걸쳐 다수의 논문 및 특허문헌이 참조되고 그 인용이 표시되어 있다. 인용된 논문 및 특허문헌의 개시 내용은 그 전체로서 본 명세서에 참조로 삽입되어 본 발명이 속하는 기술 분야의 수준 및 본 발명의 내용이 보다 명확하게 설명된다.

본 출원의 하나의 양태는 서열번호 1의 아미노산 서열의 415번째 위치에 상응하는 아미노산인 리신이 히스티딘으로 치환된, 시트레이트 신타아제 변이체를 제공하는 것이다.

본 출원의 변이체는 상기 서열번호 1로 기재된 아미노산 서열에서 서열번호 1의 아미노산 서열을 기준으로 415번 위치에 상응하는 아미노산은 히스티딘(Histidine)이고, 상기 서열번호 1로 기재된 아미노산 서열과 적어도 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, 99.5%, 99.7% 또는 99.9% 이상의 상동성 또는 동일성을 가지는 변이체일 수 있다. 예컨대, 본 출원의 변이체는 상기 서열번호 1로 기재된 아미노산 서열에서 서열번호 1의 아미노산 서열을 기준으로 415번 위치에 상응하는 아미노산은 히스티딘이고, 상기 서열번호 1로 기재된 아미노산 서열과 적어도 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, 99.5%, 99.7% 또는 99.9% 이상의 상동성 또는 동일성을 가지는 아미노산 서열을 가지거나 포함할 수 있으며, 또는 상기의 아미노산 서열로 이루어지거나 필수적으로 이루어질 수 있다. 또한, 이러한 상동성 또는 동일성을 가지며 본 출원의 변이체에 상응하는 효능을 나타내는 아미노산 서열이라면, 일부 서열이 결실, 변형, 치환, 보존적 치환 또는 부가된 아미노산 서열을 갖는 변이체도 본 출원의 범위 내에 포함됨은 자명하다.

예를 들어, 상기 아미노산 서열 N-말단, C-말단 그리고/또는 내부에 본 출원의 변이체의 기능을 변경하지 않는 서열 추가 또는 결실, 자연적으로 발생할 수 있는 돌연변이, 잠재성 돌연변이 (silent mutation) 또는 보존적 치환을 가지는 경우이다.

상기 "보존적 치환(conservative substitution)"은 한 아미노산을 유사한 구조적 및/또는 화학적 성질을 갖는 또 다른 아미노산으로 치환시키는 것을 의미한다. 이러한 아미노산 치환은 일반적으로 잔기의 극성, 전하, 용해도, 소수성, 친수성 및/또는 양친매성(amphipathic nature)에서의 유사성에 근거하여 발생할 수 있다. 통상적으로, 보존적 치환은 단백질 또는 폴리펩티드의 활성에 거의 영향을 미치지 않거나 또는 영향을 미치지 않을 수 있다.

본 출원에서 용어, "변이체(variant)"는 하나 이상의 아미노산이 보존적 치환(conservative substitution) 및/또는 변형(modification)되어 상기 변이체의 변이 전 아미노산 서열과 상이하나 기능(functions) 또는 특성(properties)이 유지되는 폴리펩티드를 지칭한다. 이러한 변이체는 일반적으로 상기 폴리펩티드의 아미노산 서열 중 하나 이상의 아미노산을 변형하고, 상기 변형된 폴리펩티드의 특성을 평가하여 동정(identify)될 수 있다. 즉, 변이체의 능력은 변이 전 폴리펩티드에 비하여 증가되거나, 변하지 않거나, 또는 감소될 수 있다. 또한, 일부 변이체는 N-말단 리더 서열 또는 막전이 도메인(transmembrane domain)과 같은 하나 이상의 부분이 제거된 변이체를 포함할 수 있다. 다른 변이체는 성숙 단백질(mature protein)의 N- 및/또는 C-말단으로부터 일부분이 제거된 변이체를 포함할 수 있다. 상기 용어 "변이체"는 변이형, 변형, 변이형 폴리펩티드, 변이된 단백질, 변이 및 변이체 등의 용어(영문 표현으로는 modification, modified polypeptide, modified protein, mutant, mutein, divergent 등)가 혼용되어 사용될 수 있으며, 변이된 의미로 사용되는 용어라면 이에 제한되지 않는다. 본 출원의 목적상 상기 변이체는 서열번호 1의 아미노산 서열의 415번째 위치에 상응하는 아미노산인 리신(Lysine, Lys, K)이 히스티딘(Histidine, His, H)으로 치환된 변이체일 수 있다.

또한, 변이체는 폴리펩티드의 특성과 2차 구조에 최소한의 영향을 갖는 아미노산들의 결실 또는 부가를 포함할 수 있다. 예를 들면 변이체의 N-말단에는 번역-동시에(co-translationally) 또는 번역-후에(post-translationally) 단백질의 이동(translocation)에 관여하는 시그널(또는 리더) 서열이 컨쥬게이트 될 수 있다. 또한 상기 변이체는 확인, 정제, 또는 합성할 수 있도록 다른 서열 또는 링커와 컨쥬게이트 될 수 있다.

본 출원에서 용어, '상동성 (homology)' 또는 '동일성 (identity)'은 두 개의 주어진 아미노산 서열 또는 염기 서열 상호간 유사한 정도를 의미하며 백분율로 표시될 수 있다. 용어 상동성 및 동일성은 종종 상호교환적으로 이용될 수 있다.

보존된(conserved) 폴리뉴클레오티드 또는 폴리펩티드의 서열 상동성 또는 동일성은 표준 배열 알고리즘에 의해 결정되며, 사용되는 프로그램에 의해 확립된 디폴트 갭 페널티가 함께 이용될 수 있다. 실질적으로, 상동성을 갖거나(homologous) 또는 동일한(identical) 서열은 일반적으로 서열 전체 또는 일부분과 중간 또는 높은 엄격한 조건(stringent conditions)에서 하이브리드할 수 있다. 하이브리드화는 폴리뉴클레오티드에서 일반 코돈 또는 코돈 축퇴성을 고려한 코돈을 함유하는 폴리뉴클레오티드와의 하이브리드화 역시 포함됨이 자명하다.

임의의 두 폴리뉴클레오티드 또는 폴리펩티드 서열이 상동성, 유사성 또는 동일성을 갖는지 여부는, 예를 들어, Pearson et al (1988) [Proc. Natl. Acad. Sci. USA 85]: 2444에서와 같은 디폴트 파라미터를 이용하여 "FASTA" 프로그램과 같은 공지의 컴퓨터 알고리즘을 이용하여 결정될 수 있다. 또는, EMBOSS 패키지의 니들만 프로그램(EMBOSS: The European Molecular Biology Open Software Suite, Rice et al., 2000, Trends Genet. 16: 276-277)(버전 5.0.0 또는 이후 버전)에서 수행되는 바와 같은, 니들만-운치(Needleman-Wunsch) 알고리즘(Needleman and Wunsch, 1970, J. Mol. Biol. 48: 443-453)이 사용되어 결정될 수 있다(GCG 프로그램 패키지 (Devereux, J., et al, Nucleic Acids Research 12: 387 (1984)), BLASTP, BLASTN, FASTA (Atschul, [S.] [F.,] [ET AL, J MOLEC BIOL 215]: 403 (1990); Guide to Huge Computers, Martin J. Bishop, [ED.,] Academic Press, San Diego,1994, 및 [CARILLO ETA/.](1988) SIAM J Applied Math 48: 1073을 포함한다). 예를 들어, 국립 생물공학 정보 데이터베이스 센터의 BLAST, 또는 ClustalW를 이용하여 상동성, 유사성 또는 동일성을 결정할 수 있다.

폴리뉴클레오티드 또는 폴리펩티드의 상동성, 유사성 또는 동일성은, 예를 들어, Smith and Waterman, Adv. Appl. Math (1981) 2:482 에 공지된 대로, 예를 들면, Needleman et al. (1970), J Mol Biol. 48:443과 같은 GAP 컴퓨터 프로그램을 이용하여 서열 정보를 비교함으로써 결정될 수 있다. 요약하면, GAP 프로그램은 두 서열 중 더 짧은 것에서의 기호의 전체 수로, 유사한 배열된 기호(즉, 뉴클레오티드 또는 아미노산)의 수를 나눈 값으로 정의할 수 있다. GAP 프로그램을 위한 디폴트 파라미터는 (1) 이진법 비교 매트릭스(동일성을 위해 1 그리고 비-동일성을 위해 0의 값을 함유함) 및 Schwartz and Dayhoff, eds., Atlas Of Protein Sequence And Structure, National Biomedical Research Foundation, pp. 353-358 (1979)에 의해 개시된 대로, Gribskov et al(1986) Nucl. Acids Res. 14: 6745의 가중된 비교 매트릭스 (또는 EDNAFULL (NCBI NUC4.4의 EMBOSS 버전) 치환 매트릭스); (2) 각 갭을 위한 3.0의 페널티 및 각 갭에서 각 기호를 위한 추가의 0.10 페널티 (또는 갭 개방 패널티 10, 갭 연장 패널티 0.5); 및 (3) 말단 갭을 위한 무 페널티를 포함할 수 있다.

본 출원에서 용어, "상응하는(corresponding to)"은, 폴리펩티드에서 열거되는 위치의 아미노산 잔기이거나, 또는 폴리펩티드에서 열거되는 잔기와 유사하거나 동일하거나 상동한 아미노산 잔기를 지칭한다. 상응하는 위치의 아미노산을 확인하는 것은 특정 서열을 참조하는 서열의 특정 아미노산을 결정하는 것일 수 있다. 본 출원에 사용된 "상응 영역"은 일반적으로 관련 단백질 또는 참조 (reference) 단백질에서의 유사하거나 대응되는 위치를 지칭한다.

예를 들어, 임의의 아미노산 서열을 서열번호 1과 정렬(align)하고, 이를 토대로 상기 아미노산 서열의 각 아미노산 잔기는 서열번호 1의 아미노산 잔기와 상응하는 아미노산 잔기의 숫자 위치를 참조하여 넘버링 할 수 있다. 예를 들어, 본 출원에 기재된 것과 같은 서열 정렬 알고리즘은, 쿼리 시퀀스("참조 서열"이라고도 함)와 비교하여 아미노산의 위치, 또는 치환, 삽입 또는 결실 등의 변형이 발생하는 위치를 확인할 수 있다.

이러한 정렬에는 예를 들어 Needleman-Wunsch 알고리즘 (Needleman 및 Wunsch, 1970, J. Mol. Biol. 48: 443-453), EMBOSS 패키지의 Needle 프로그램 (EMBOSS: The European Molecular Biology Open Software Suite, Rice et al., 2000), Trends Genet. 16: 276-277) 등을 이용할 수 있으나, 이에 제한되지 않고 당업계에 알려진 서열 정렬 프로그램, 쌍 서열(pairwise sequence) 비교 알고리즘 등을 적절히 사용할 수 있다.

본 출원에서 용어, "시트레이트 신타아제(Citrate synthase)"는 미생물의 해당과정에서 생성되는 아세틸 코에이와 옥살로아세테이트를 중합하여 시트레이트를 생성하는 효소이다. 또한, 상기 효소는 아세틸 코에이와 4-탄소 옥살로아세테이트의 분자로부터의 2-탄소 아세테이트 잔기의 축합 반응을 촉매하여 6-탄소 옥살로아세테이트를 형성할 수 있다. 본 출원의 용어 "시트레이트 신타아제"는 시트레이트 합성효소, CS, GltA 단백질 또는 GltA로 혼용하여 사용될 수 있다. 본 출원에서 상기 GltA는 공지의 데이터 베이스인 NCBI의 GenBank에서 그 서열을 얻을 수 있다. 더불어, 상기 GltA는 gltA 유전자에 의해 코딩되는 시트레이트 신타아제 활성을 갖는 폴리펩타이드일 수 있으나, 이에 제한되지 않는다.

본 출원의 변이체는 야생형 폴리펩티드에 비해 L-아미노산 생산능이 증가되도록 하는 활성을 가질 수 있다.

본 출원의 변이체는 서열번호 3의 아미노산 서열로 기재된 폴리펩티드를 포함할 수 있다. 상기 서열번호 3의 아미노산 서열은 서열번호 1로 기재된 아미노산 서열의 N-말단으로부터 362번 위치 내지 415번 위치의 아미노산 서열에서 415번째 위치에 상응하는 리신이 히스티딘으로 치환된 아미노산 서열일 수 있다.

본 출원의 변이체는 하기의 일반식 1의 아미노산 서열을 포함할 수 있다:

[일반식 1]

X₁N HGGDATX₂FMN KVKNKEDGVR LMGFGHRVYK NYDPRAAIVK ETAHEILEHL GGDDLLDLAI KLEEIALADD X₃FISRKLYPN VDFYTGLIYR AMGFPTDFFT VLFAIGRLPG WIAHYREQLG AAGNH (서열번호 51);

여기서 상기 일반식 1의 X₁은 아스파라긴 또는 세린이고,

X₂는 알라닌 또는 글루탐산이고,

X₃은 티로신 또는 시스테인.

본 출원의 변이체는 서열번호 8, 10 또는 12의 아미노산 서열과 90% 이상의 서열 동일성을 가질 수 있다. 또한, 본 출원의 변이체는 서열번호 8, 10 또는 12의 아미노산 서열과 90% 이상의 서열 동일성을 가지는 아미노산 서열을 포함하거나, 상기 아미노산 서열로 이루어지거나 필수적으로 이루어질 수 있다. 일 예로, 본 출원의 변이체는 서열번호 8, 10 또는 12의 아미노산 서열과 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 99.5%, 또는 99.7% 이상의 서열 동일성을 가지거나, 상기 서열 동일성을 가지는 아미노산 서열을 포함하거나, 상기 서열 동일성을 가지는 아미노산 서열로 이루어지거나 필수적으로 이루어질 수 있다.

본 출원의 다른 하나의 양태는 본 출원의 변이체를 코딩하는 폴리뉴클레오티드를 제공하는 것이다.

본 출원에서 용어, "폴리뉴클레오티드"는 뉴클레오티드 단위체(monomer)가 공유결합에 의해 길게 사슬모양으로 이어진 뉴클레오티드의 중합체(polymer)로 일정한 길이 이상의 DNA 또는 RNA 가닥으로서, 보다 구체적으로는 상기 변이체를 코딩하는 폴리뉴클레오티드 단편을 의미한다.

본 출원의 폴리뉴클레오티드는 서열번호 2의 핵산염기 서열을 기준으로 1243번에서 1245번 위치에 상응하는 염기는 CAC이고, 상기 서열번호 2로 기재된 핵산염기 서열과 적어도 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, 99.5%, 99.7%, 또는 99.9% 이상, 100% 미만의 상동성 또는 동일성을 가지는 핵산염기 서열로 기재된 폴리뉴클레오티드를 포함할 수 있다. 또한, 이러한 상동성 또는 동일성을 가지며 본 출원의 변이체에 상응하는 효능을 나타내는 폴리펩티드나 단백질을 암호화하는 서열이라면, 일부 서열이 결실, 변형, 치환, 보존적 치환 또는 부가된 핵산염기 서열로 기재된 폴리뉴클레오티드도 본 출원의 범위 내에 포함됨은 자명하다.

본 출원의 폴리뉴클레오티드는 코돈의 축퇴성(degeneracy) 또는 본 출원의 변이체를 발현시키고자 하는 생물에서 선호되는 코돈을 고려하여, 본 출원의 변이체의 아미노산 서열을 변화시키지 않는 범위 내에서 코딩 영역에 다양한 변형이 이루어질 수 있다. 이때, 상기 상동성 또는 동일성을 갖는 서열에서, 서열번호 1의 415번째 위치에 상응하는 아미노산을 코딩하는 코돈은, 히스티딘을 코딩하는 코돈 중 하나일 수 있다.

또한, 본 출원의 폴리뉴클레오티드는 공지의 유전자 서열로부터 제조될 수 있는 프로브, 예를 들면, 본 출원의 폴리뉴클레오티드 서열의 전체 또는 일부에 대한 상보 서열과 엄격한 조건 하에 하이브리드화할 수 있는 서열이라면 제한없이 포함될 수 있다. 상기 "엄격한 조건(stringent condition)"이란 폴리뉴클레오티드 간의 특이적 혼성화를 가능하게 하는 조건을 의미한다. 이러한 조건은 문헌(J. Sambrook et al.,Molecular Cloning, A Laboratory Manual, 2nd Edition, Cold Spring Harbor Laboratory press, Cold Spring Harbor, New York, 1989; F.M. Ausubel et al.,Current Protocols in Molecular Biology, John Wiley & Sons, Inc., New York, 9.50-9.51, 11.7-11.8 참조)에 구체적으로 기재되어 있다. 예를 들어, 상동성 또는 동일성이 높은 폴리뉴클레오티드끼리, 70% 이상, 75% 이상, 80% 이상, 85% 이상, 90% 이상, 95% 이상, 96% 이상, 97% 이상, 98% 이상, 또는 99% 이상의 상동성 또는 동일성을 갖는 폴리뉴클레오티드끼리 하이브리드화하고, 그보다 상동성 또는 동일성이 낮은 폴리뉴클레오티드끼리 하이브리드화하지 않는 조건, 또는 통상의 써던 하이브리드화(southern hybridization)의 세척 조건인 60℃, 1ХSSC, 0.1% SDS, 구체적으로 60℃, 0.1ХSSC, 0.1% SDS, 보다 구체적으로 68℃, 0.1ХSSC, 0.1% SDS에 상당하는 염 농도 및 온도에서, 1회, 구체적으로 2회 내지 3회 세정하는 조건을 열거할 수 있다.

혼성화는 비록 혼성화의 엄격도에 따라 염기 간의 미스매치(mismatch)가 가능할지라도, 두 개의 핵산이 상보적 서열을 가질 것을 요구한다. 용어, "상보적"은 서로 혼성화가 가능한 뉴클레오티드 염기 간의 관계를 기술하는데 사용된다. 예를 들면, DNA에 관하여, 아데닌은 티민에 상보적이며 시토신은 구아닌에 상보적이다. 따라서, 본 출원의 폴리뉴클레오티드는 또한 실질적으로 유사한 핵산염기 서열뿐만 아니라 전체 서열에 상보적인 단리된 핵산 단편을 포함할 수 있다.

구체적으로, 본 출원의 폴리뉴클레오티드와 상동성 또는 동일성을 가지는 폴리뉴클레오티드는 55 ℃의 Tm 값에서 혼성화 단계를 포함하는 혼성화 조건을 사용하고 상술한 조건을 사용하여 탐지할 수 있다. 또한, 상기 Tm 값은 60℃, 63℃ 또는 65℃일 수 있으나, 이에 제한되는 것은 아니고 그 목적에 따라 당업자에 의해 적절히 조절될 수 있다.

상기 폴리뉴클레오티드를 혼성화하는 적절한 엄격도는 폴리뉴클레오티드의 길이 및 상보성 정도에 의존하고 변수는 해당기술분야에 잘 알려져 있다(예컨대, J. Sambrook et al., 상동).

일 예로, 본 출원의 폴리뉴클레오티드는 서열번호 9, 11 또는 13의 핵산염기 서열을 기준으로 1084번 내지 1245번 위치의 핵산염기 서열로 기재된 폴리뉴클레오티드, 또는 서열번호 9, 11, 13 또는 15의 핵산염기 서열로 기재된 폴리뉴클레오티드를 포함할 수 있다.

본 출원의 폴리뉴클레오티드에서, 상기 변이체는 상기 다른 양태에서 기재한 바와 같다.

본 출원의 또 다른 하나의 양태는 본 출원의 폴리뉴클레오티드를 포함하는 벡터를 제공하는 것이다. 상기 벡터는 상기 폴리뉴클레오티드를 숙주세포에서 발현시키기 위한 발현 벡터일 수 있으나, 이에 제한되지 않는다.

본 출원 벡터는 적합한 숙주 내에서 목적 폴리펩티드를 발현시킬 수 있도록 적합한 발현조절영역(또는 발현조절서열)에 작동 가능하게 연결된 상기 목적 폴리펩티드를 코딩하는 폴리뉴클레오티드의 염기서열을 포함하는 DNA 제조물을 포함할 수 있다. 상기 발현조절영역은 전사를 개시할 수 있는 프로모터, 그러한 전사를 조절하기 위한 임의의 오퍼레이터 서열, 적합한 mRNA 리보좀 결합부위를 코딩하는 서열, 및 전사 및 해독의 종결을 조절하는 서열을 포함할 수 있다. 벡터는 적당한 숙주세포 내로 형질전환된 후, 숙주 게놈과 무관하게 복제되거나 기능할 수 있으며, 게놈 그 자체에 통합될 수 있다.

본 출원에서 사용되는 벡터는 특별히 한정되지 않으며, 당업계에 알려진 임의의 벡터를 이용할 수 있다. 통상 사용되는 벡터의 예로는 천연 상태이거나 재조합된 상태의 플라스미드, 코스미드, 바이러스 및 박테리오파지를 들 수 있다. 예를 들어, 파지 벡터 또는 코스미드 벡터로서 pWE15, M13, MBL3, MBL4, IXII, ASHII, APII, t10, t11, Charon4A, 및 Charon21A 등을 사용할 수 있으며, 플라스미드 벡터로서 pDZ계, pBR계, pUC계, pBluescriptII계, pGEM계, pTZ계, pCL계 및 pET계 등을 사용할 수 있다. 구체적으로는 pDZ, pDC, pDCM2, pACYC177, pACYC184, pCL, pECCG117(Biotechnology letters vol 13, No. 10, p. 721-726(1991), 대한민국 등록특허 제 10-1992-0007401), pUC19, pBR322, pMW118, pCC1BAC 벡터 등을 사용할 수 있다.

일례로 세포 내 염색체 삽입용 벡터를 통해 목적 폴리펩티드를 코딩하는 폴리뉴클레오티드를 염색체 내로 삽입할 수 있다. 상기 폴리뉴클레오티드의 염색체 내로의 삽입은 당업계에 알려진 임의의 방법, 예를 들면, 상동재조합(homologous recombination)에 의하여 이루어질 수 있으나, 이에 한정되지는 않는다. 상기 염색체 삽입 여부를 확인하기 위한 선별 마커(selection marker)를 추가로 포함할 수 있다. 상기 선별 마커는 벡터로 형질전환된 세포를 선별, 즉 목적 핵산 분자의 삽입 여부를 확인하기 위한 것으로, 약물 내성, 영양 요구성, 세포 독성제에 대한 내성 또는 표면 폴리펩티드의 발현과 같은 선택가능 표현형을 부여하는 마커들이 사용될 수 있다. 선택제(selective agent)가 처리된 환경에서는 선별 마커를 발현하는 세포만 생존하거나 다른 표현 형질을 나타내므로, 형질전환된 세포를 선별할 수 있다.

본 출원에서 용어 "형질전환"은 표적 폴리펩티드를 코딩하는 폴리뉴클레오티드를 포함하는 벡터를 숙주세포 혹은 미생물 내에 도입하여 숙주세포 내에서 상기 폴리뉴클레오티드가 코딩하는 폴리펩티드가 발현할 수 있도록 하는 것을 의미한다. 형질전환된 폴리뉴클레오티드는 숙주세포 내에서 발현될 수 있기만 한다면, 숙주세포의 염색체 내에 삽입되어 위치하거나 염색체 외에 위치하거나 상관없이 이들 모두를 포함할 수 있다. 또한, 상기 폴리뉴클레오티드는 목적 폴리펩티드를 코딩하는 DNA 및/또는 RNA를 포함한다. 상기 폴리뉴클레오티드는 숙주세포 내로 도입되어 발현될 수 있는 것이면, 어떠한 형태로도 도입될 수 있다. 예를 들면, 상기 폴리뉴클레오티드는 자체적으로 발현되는데 필요한 모든 요소를 포함하는 유전자 구조체인 발현 카세트(expression cassette)의 형태로 숙주세포에 도입될 수 있다. 상기 발현 카세트는 통상 상기 폴리뉴클레오티드에 작동 가능하게 연결되어 있는 프로모터(promoter), 전사 종결신호, 리보좀 결합부위 및 번역 종결신호를 포함할 수 있다. 상기 발현 카세트는 자체 복제가 가능한 발현 벡터 형태일 수 있다. 또한, 상기 폴리뉴클레오티드는 그 자체의 형태로 숙주세포에 도입되어 숙주세포에서 발현에 필요한 서열과 작동 가능하게 연결되어 있는 것일 수도 있으며, 이에 제한되지 않는다.

또한, 상기에서 용어 "작동 가능하게 연결"된 것이란 본 출원의 목적 변이체를 코딩하는 폴리뉴클레오티드의 전사를 개시 및 매개하도록 하는 프로모터 서열과 상기 폴리뉴클레오티드 서열이 기능적으로 연결되어 있는 것을 의미한다.

본 출원의 벡터에서, 변이체 및 폴리뉴클레오티드는 상기 다른 양태에서 기재한 바와 같다.

본 출원의 또 다른 하나의 양태는 본 출원의 변이체 또는 본 출원의 폴리뉴클레오티드를 포함하는, 코리네박테리움 속(The genus of Corynebacterium) 미생물을 제공하는 것이다.

본 출원의 미생물은 본 출원의 변이체, 상기 변이체를 암호화하는 폴리뉴클레오티드, 또는 본 출원의 폴리뉴클레오티드를 포함하는 벡터를 포함할 수 있다.

본 출원에서 용어, "미생물(또는, 균주)"는 야생형 미생물이나 자연적 또는 인위적으로 유전적 변형이 일어난 미생물을 모두 포함하며, 외부 유전자가 삽입되거나 내재적 유전자의 활성이 강화되거나 불활성화되는 등의 원인으로 인해서 특정 기작이 약화되거나 강화된 미생물로서, 목적하는 폴리펩티드, 단백질 또는 산물의 생산을 위하여 유전적 변형(modification)을 포함하는 미생물일 수 있다.

본 출원의 미생물은 본 출원의 변이체, 본 출원의 폴리뉴클레오티드 및 본 출원의 폴리뉴클레오티드를 포함하는 벡터 중 어느 하나 이상을 포함하는 미생물; 본 출원의 변이체 또는 본 출원의 폴리뉴클레오티드를 발현하도록 변형된 미생물; 본 출원의 변이체 또는 본 출원의 폴리뉴클레오티드를 발현하는 미생물 (예컨대, 재조합 균주); 또는 본 출원의 변이체 활성을 갖는 미생물 (예컨대, 재조합 균주)일 수 있으나, 이에 제한되지 않는다.

본 출원의 미생물은 L-아미노산 생산능을 가지는 균주일 수 있다. 구체적으로, 본 출원의 미생물에서 상기 L-아미노산 생산능은 L-발린 또는 O-아세틸-L-호모세린 생산능일 수 있다.

본 출원의 미생물은 자연적으로 GltA 또는 L-아미노산 생산능을 가지고 있는 미생물, 또는 GltA 또는 L-아미노산 생산능이 없는 모균주에 본 출원의 변이체 또는 이를 코딩하는 폴리뉴클레오티드 (또는 상기 폴리뉴클레오티드를 포함하는 벡터)가 도입되거나 및/또는 GltA 또는 L-아미노산 생산능이 부여된 미생물일 수 있으나 이에 제한되지 않는다.

일 예로, 본 출원의 미생물은 본 출원의 폴리뉴클레오티드 또는 본 출원의 폴리뉴클레오티드를 포함하는 벡터로 형질전환되어, 본 출원의 변이체를 발현하는 세포 또는 미생물로서, 본 출원의 목적상 본 출원의 미생물은 본 출원의 변이체를 포함하여 L-아미노산을 생산할 수 있는 미생물을 모두 포함할 수 있다. 예를 들어, 본 출원의 균주는 천연의 야생형 미생물 또는 L-아미노산을 생산하는 미생물에 본 출원의 변이체를 코딩하는 폴리뉴클레오티드가 도입됨으로써 L-아미노산 생산능이 증가된 재조합 균주일 수 있다. 상기 L-아미노산 생산능이 증가된 재조합 균주는, 천연의 야생형 미생물 또는 시트레이트 신타아제 비변형 미생물 (즉, 야생형 (서열번호 1) 단백질을 발현하는 미생물 또는 본 출원의 변이체를 발현하지 않는 미생물)에 비하여 L-아미노산 생산능이 증가된 미생물일 수 있으나, 이에 제한되는 것은 아니다. 그 예로, 상기 L-아미노산 생산능의 증가 여부를 비교하는 대상 균주인, 시트레이트 신타아제 비변형 미생물은 ATCC14067 균주, ATCC13032 균주, ATCC13869 균주, 코리네박테리움 글루타미쿰 CJ7V 균주, 코리네박테리움 글루타미쿰 CJ8V 균주 또는 CA08-0072 균주일 수 있으나, 이에 제한되지 않는다.

일 예로, 상기 생산능이 증가된 재조합 균주는 변이 전 모균주 또는 비변형 미생물에 비하여, L-아미노산 생산능이 약 1% 이상, 5% 이상, 7% 이상, 약 10% 이상, 약 20% 이상, 또는 약 30% 이상 (상한값은 특별한 제한은 없으며, 예컨대, 약 200% 이하, 약 150% 이하, 약 100% 이하, 약 50% 이하, 약 45% 이하, 약 40% 이하 또는 약 30% 이하일 수 있음) 증가된 것일 수 있으나, 변이 전 모균주 또는 비변형 미생물의 생산능에 비해 +값의 증가량을 갖는 한, 이에 제한되지 않는다. 다른 예에서, 상기 생산능이 증가된 재조합 균주는 변이 전 모균주 또는 비변형 미생물에 비하여, L-발린 생산능이 약 1.01배 이상, 약 1.05 배 이상, 약 1.07배 이상, 약 1.1배 이상, 약 1.2배 이상 또는 약 1.3배 이상 (상한값은 특별한 제한은 없으며, 예컨대, 약 10배 이하, 약 5배 이하, 약 3배 이하, 또는 약 2배 이하일 수 있음) 증가된 것일 수 있다.

상기 용어 “약(about)”은 ±0.5, ±0.4, ±0.3, ±0.2, ±0.1 등을 모두 포함하는 범위로, 약 이란 용어 뒤에 나오는 수치와 동등하거나 유사한 범위의 수치를 모두 포함하나, 이에 제한되지 않는다.

본 출원에서 용어, "비변형 미생물"은 미생물에 자연적으로 발생할 수 있는 돌연변이를 포함하는 균주를 제외하는 것이 아니며, 야생형 균주 또는 천연형 균주 자체이거나, 자연적 또는 인위적 요인에 의한 유전적 변이로 형질이 변화되기 전 균주를 의미할 수 있다. 예를 들어, 상기 비변형 미생물은 본 명세서에 기재된 단백질 변이체가 도입되지 않거나 도입되기 전의 균주를 의미할 수 있다. 상기 "비변형 미생물"은 "변형 전 균주", "변형 전 미생물", "비변이 균주", "비변형 균주", "비변이 미생물" 또는 "기준 미생물"과 혼용될 수 있다.

본 출원의 또 다른 일 예로, 본 출원의 미생물은 코리네박테리움 글루타미쿰(Corynebacterium glutamicum), 코리네박테리움 크루디락티스(Corynebacterium crudilactis), 코리네박테리움 데세르티(Corynebacterium deserti), 코리네박테리움 이피시엔스(Corynebacterium efficiens), 코리네박테리움 칼루내(Corynebacterium callunae), 코리네박테리움 스테셔니스(Corynebacterium stationis), 코리네박테리움 싱굴라레(Corynebacterium singulare), 코리네박테리움 할로톨레란스(Corynebacterium halotolerans), 코리네박테리움 스트리아툼(Corynebacterium striatum), 코리네박테리움 암모니아게네스(Corynebacterium ammoniagenes), 코리네박테리움 폴루티솔리(Corynebacterium pollutisoli), 코리네박테리움 이미탄스(Corynebacterium imitans), 코리네박테리움 테스투디노리스(Corynebacterium testudinoris), 또는 코리네박테리움 플라베스센스(Corynebacterium flavescens)일 수 있다.

본 출원의 미생물은 NCgl2335 단백질이 추가적으로 약화된 미생물일 수 있다. 또한, 본 출원의 미생물은 아세토락테이트 신타아제 아이소자임 1 서브 유닛(Acetolactate synthase isozyme 1 small subunit, IlvN), L-메티오닌/분지쇄 아미노산 배출자(L-methionine/branched-chain amino acid exporter, YjeH) 로 이루어진 군으로부터 선택되는 단백질의 활성이 추가적으로 강화된 미생물일 수 있다.

구체적으로, 본 출원의 L-발린을 생산하는 미생물은 추가적으로 IlvN 활성 강화 및/또는 NCgl2335 약화된 미생물일 수 있다. 또한, 본 출원의 O-아세틸-L-호모세린을 생산하는 미생물은 추가적으로 YjeH(L-methionine/branched-chain amino acid exporter) 활성 강화된 미생물일 수 있다.

본 출원에서 용어, 폴리펩티드의 "약화"는 내재적 활성에 비하여 활성이 감소되거나 또는 활성이 없는 것을 모두 포함하는 개념이다. 상기 약화는 불활성화(inactivation), 결핍(deficiency), 하향조절(down-regulation), 감소(decrease), 저하(reduce), 감쇠(attenuation) 등의 용어와 혼용될 수 있다.

상기 약화는 상기 폴리펩티드를 코딩하는 폴리뉴클레오티드의 변이 등으로 폴리펩티드 자체의 활성이 본래 미생물이 가지고 있는 폴리펩티드의 활성에 비해 감소 또는 제거된 경우, 이를 코딩하는 폴리뉴클레오티드의 유전자의 발현 저해 또는 폴리펩티드로의 번역(translation) 저해 등으로 세포 내에서 전체적인 폴리펩티드 활성 정도 및/또는 농도(발현량)가 천연형 균주에 비하여 낮은 경우, 상기 폴리뉴클레오티드의 발현이 전혀 이루어지지 않은 경우, 및/또는 폴리뉴클레오티드의 발현이 되더라도 폴리펩티드의 활성이 없는 경우 역시 포함할 수 있다. 상기 "내재적 활성"은 자연적 또는 인위적 요인에 의한 유전적 변이로 형질이 변화하는 경우, 형질 변화 전 모균주, 야생형 또는 비변형 미생물이 본래 가지고 있던 특정 폴리펩티드의 활성을 의미한다. 이는 "변형 전 활성"과 혼용되어 사용될 수 있다. 폴리펩티드의 활성이 내재적 활성에 비하여 "불활성화, 결핍, 감소, 하향조절, 저하, 감쇠"한다는 것은, 형질 변화 전 모균주 또는 비변형 미생물이 본래 가지고 있던 특정 폴리펩티드의 활성에 비하여 낮아진 것을 의미한다.

이러한 폴리펩티드의 활성의 약화는, 당업계에 알려진 임의의 방법에 의하여 수행될 수 있으나 이로 제한되는 것은 아니며, 당해 분야에 잘 알려진 다양한 방법의 적용으로 달성될 수 있다(예컨대, Nakashima N et al., Bacterial cellular engineering by genome editing and gene silencing. Int J Mol Sci. 2014;15(2):2773-2793, Sambrook et al. Molecular Cloning 2012 등).

구체적으로, 본 출원의 폴리펩티드의 약화는

1) 폴리펩티드를 코딩하는 유전자 전체 또는 일부의 결손;

2) 폴리펩티드를 코딩하는 유전자의 발현이 감소하도록 발현조절영역(또는 발현조절서열)의 변형;

3) 폴리펩티드의 활성이 제거 또는 약화되도록 상기 폴리펩티드를 구성하는 아미노산 서열의 변형(예컨대, 아미노산 서열 상의 1 이상의 아미노산의 삭제/치환/부가);

4) 폴리펩티드의 활성이 제거 또는 약화되도록 상기 폴리펩티드를 코딩하는 유전자 서열의 변형 (예를 들어, 폴리펩티드의 활성이 제거 또는 약화되도록 변형된 폴리펩티드를 코딩하도록 상기 폴리펩티드 유전자의 핵산염기 서열 상의 1 이상의 핵산염기의 삭제/치환/부가);

5) 폴리펩티드를 코딩하는 유전자 전사체의 개시코돈 또는 5'-UTR 지역을 코딩하는 염기서열의 변형;

6) 폴리펩티드를 코딩하는 상기 유전자의 전사체에 상보적으로 결합하는 안티센스 올리고뉴클레오티드(예컨대, 안티센스 RNA)의 도입;

7) 리보솜(ribosome)의 부착이 불가능한 2차 구조물을 형성시키기 위하여 폴리펩티드를 코딩하는 유전자의 사인-달가르노(Shine-Dalgarno) 서열 앞단에 사인-달가르노 서열과 상보적인 서열의 부가;

8) 폴리펩티드를 코딩하는 유전자 서열의 ORF(open reading frame)의 3' 말단에 반대 방향으로 전사되는 프로모터의 부가(Reverse transcription engineering, RTE); 또는

9) 상기 1) 내지 8) 중 선택된 2 이상의 조합일 수 있으나, 이에, 특별히 제한되는 것은 아니다.

예컨대,

상기 1) 폴리펩티드를 코딩하는 상기 유전자 일부 또는 전체의 결손은, 염색체 내 내재적 목적 폴리펩티드를 코딩하는 폴리뉴클레오티드 전체의 제거, 일부 뉴클레오티드가 결실된 폴리뉴클레오티드로의 교체 또는 마커 유전자로 교체일 수 있다.

또한, 상기 2) 발현조절영역(또는 발현조절서열)의 변형은, 결실, 삽입, 비보존적 또는 보존적 치환 또는 이들의 조합으로 발현조절영역(또는 발현조절서열) 상의 변이 발생, 또는 더욱 약한 활성을 갖는 서열로의 교체일 수 있다. 상기 발현조절영역에는 프로모터, 오퍼레이터 서열, 리보좀 결합부위를 코딩하는 서열, 및 전사와 해독의 종결을 조절하는 서열을 포함하나, 이에 한정되는 것은 아니다.

또한, 상기 3) 폴리펩티드를 코딩하는 유전자 전사체의 개시코돈 또는 5'-UTR 지역을 코딩하는 염기서열 변형은, 예를 들면, 내재적 개시코돈에 비해 폴리펩티드 발현율이 더 낮은 다른 개시코돈을 코딩하는 염기서열로 치환하는 것일 수 있으나, 이에 제한되지 않는다.

또한, 상기 4) 및 5)의 아미노산 서열 또는 폴리뉴클레오티드 서열의 변형은 폴리펩티드의 활성을 약화하도록 상기 폴리펩티드의 아미노산 서열 또는 상기 폴리펩티드를 코딩하는 폴리뉴클레오티드 서열을 결실, 삽입, 비보존적 또는 보존적 치환 또는 이들의 조합으로 서열상의 변이 발생, 또는 더욱 약한 활성을 갖도록 개량된 아미노산 서열 또는 폴리뉴클레오티드 서열 또는 활성이 없도록 개량된 아미노산 서열 또는 폴리뉴클레오티드 서열로의 교체일 수 있으나, 이에 한정되는 것은 아니다. 예를 들면, 폴리뉴클레오티드 서열 내 변이를 도입하여 종결 코돈을 형성시킴으로써, 유전자의 발현을 저해하거나 약화시킬 수 있으나, 이에 제한되지 않는다.

상기 6) 폴리펩티드를 코딩하는 상기 유전자의 전사체에 상보적으로 결합하는 안티센스 올리고뉴클레오티드(예컨대, 안티센스 RNA)의 도입은 예를 들어 문헌 [Weintraub, H. et al., Antisense-RNA as a molecular tool for genetic analysis, Reviews - Trends in Genetics, Vol. 1(1) 1986]을 참고할 수 있다.

상기 7) 리보솜(ribosome)의 부착이 불가능한 2차 구조물을 형성시키기 위하여 폴리펩티드를 코딩하는 유전자의 사인-달가르노(Shine-Dalgarno) 서열 앞단에 사인-달가르노 서열과 상보적인 서열의 부가는 mRNA 번역을 불가능하게 하거나 속도를 저하시키는 것일 수 있다.

상기 8) 폴리펩티드를 코딩하는 유전자서열의 ORF(open reading frame)의 3' 말단에 반대 방향으로 전사되는 프로모터의 부가(Reverse transcription engineering, RTE)는 상기 폴리펩티드를 코딩하는 유전자의 전사체에 상보적인 안티센스 뉴클레오티드를 만들어 활성을 약화하는 것일 수 있다.

본 출원에서 용어, 폴리펩티드 활성의 "강화"는, 폴리펩티드의 활성이 내재적 활성에 비하여 증가되는 것을 의미한다. 상기 강화는 활성화(activation), 상향조절(up-regulation), 과발현(overexpression), 증가(increase) 등의 용어와 혼용될 수 있다. 여기서 활성화, 강화, 상향조절, 과발현, 증가는 본래 가지고 있지 않았던 활성을 나타내게 되는 것, 또는 내재적 활성 또는 변형 전 활성에 비하여 향상된 활성을 나타내게 되는 것을 모두 포함할 수 있다. 상기 “내재적 활성"은 자연적 또는 인위적 요인에 의한 유전적 변이로 형질이 변화하는 경우, 형질 변화 전 모균주 또는 비변형 미생물이 본래 가지고 있던 특정 폴리펩티드의 활성을 의미한다. 이는 "변형 전 활성"과 혼용되어 사용될 수 있다. 폴리펩티드의 활성이 내재적 활성에 비하여 "강화", "상향조절", "과발현" 또는 "증가"한다는 것은, 형질 변화 전 모균주 또는 비변형 미생물이 본래 가지고 있던 특정 폴리펩티드의 활성 및/또는 농도(발현량)에 비하여 향상된 것을 의미한다.

상기 강화는 외래의 폴리펩티드를 도입하거나, 내재적인 폴리펩티드의 활성 강화 및/또는 농도(발현량)를 통해 달성할 수 있다. 상기 폴리펩티드의 활성의 강화 여부는 해당 폴리펩티드의 활성 정도, 발현량 또는 해당 폴리펩티드로부터 배출되는 산물의 양의 증가로부터 확인할 수 있다.

상기 폴리펩티드의 활성의 강화는 당해 분야에 잘 알려진 다양한 방법의 적용이 가능하며, 목적 폴리펩티드의 활성을 변형전 미생물보다 강화시킬 수 있는 한, 제한되지 않는다. 구체적으로, 분자생물학의 일상적 방법인 당업계의 통상의 기술자에게 잘 알려진 유전자 공학 및/또는 단백질 공학을 이용한 것일 수 있으나, 이로 제한되지 않는다(예컨대, Sitnicka et al. Functional Analysis of Genes. Advances in Cell Biology. 2010, Vol. 2. 1-16, Sambrook et al. Molecular Cloning 2012 등).

구체적으로, 본 출원의 폴리펩티드의 강화는

1) 폴리펩티드를 코딩하는 폴리뉴클레오티드의 세포 내 카피수 증가;

2) 폴리펩티드를 코딩하는 염색체상의 유전자 발현조절영역을 활성이 강력한 서열로 교체;

3) 폴리펩티드를 코딩하는 유전자 전사체의 개시코돈 또는 5'-UTR 지역을 코딩하는 염기서열의 변형;

4) 폴리펩티드 활성이 강화되도록 상기 폴리펩티드의 아미노산 서열의 변형;

5) 폴리펩티드 활성이 강화도록 상기 폴리펩티드를 코딩하는 폴리뉴클레오티드 서열의 변형 (예를 들어, 폴리펩티드의 활성이 강화되도록 변형된 폴리펩티드를 코딩하도록 상기 폴리펩티드 유전자의 폴리뉴클레오티드 서열의 변형);

6) 폴리펩티드의 활성을 나타내는 외래 폴리펩티드 또는 이를 코딩하는 외래 폴리뉴클레오티드의 도입;

7) 폴리펩티드를 암호화하는 폴리뉴클레오티드의 코돈 최적화;

8) 폴리펩티드의 삼차구조를 분석하여 노출 부위를 선택하여 변형하거나 화학적으로 수식; 또는

보다 구체적으로,

상기 1) 폴리펩티드를 코딩하는 폴리뉴클레오티드의 세포 내 카피수 증가는, 해당 폴리펩티드를 코딩하는 폴리뉴클레오티드가 작동가능하게 연결된, 숙주와 무관하게 복제되고 기능할 수 있는 벡터의 숙주세포 내로의 도입에 의해 달성되는 것일 수 있다. 또는, 해당 폴리펩티드를 코딩하는 폴리뉴클레오티드가 숙주세포 내의 염색체 내에 1 카피 또는 2 카피 이상 도입에 의해 달성되는 것일 수 있다. 상기 염색체 내에 도입은 숙주세포 내의 염색체 내로 상기 폴리뉴클레오티드를 삽입시킬 수 있는 벡터가 숙주세포 내에 도입됨으로써 수행될 수 있으나, 이에 제한되지 않는다. 상기 벡터는 전술한 바와 같다.

상기 2) 폴리펩티드를 코딩하는 염색체상의 유전자 발현조절영역(또는 발현조절서열)을 활성이 강력한 서열로 교체는, 예를 들면, 상기 발현조절영역의 활성을 더욱 강화하도록 결실, 삽입, 비보존적 또는 보존적 치환 또는 이들의 조합으로 서열상의 변이 발생, 또는 더욱 강한 활성을 가지는 서열로의 교체일 수 있다. 상기 발현조절영역은, 특별히 이에 제한되지 않으나 프로모터, 오퍼레이터 서열, 리보좀 결합 부위를 코딩하는 서열, 그리고 전사 및 해독의 종결을 조절하는 서열 등을 포함할 수 있다. 일 예로, 본래의 프로모터를 강력한 프로모터로 교체시키는 것일 수 있으나, 이에 제한되지 않는다.

공지된 강력한 프로모터의 예에는 CJ1 내지 CJ7 프로모터(미국등록특허 US 7662943 B2), lac 프로모터, trp 프로모터, trc 프로모터, tac 프로모터, 람다 파아지 PR 프로모터, PL 프로모터, tet 프로모터, gapA 프로모터, SPL7 프로모터, SPL13(sm3) 프로모터(미국등록특허 US 10584338 B2), O2 프로모터(미국등록특허 US 10273491 B2), tkt 프로모터, yccA 프로모터 등이 있으나, 이에 제한되지 않는다.

상기 3) 폴리펩티드를 코딩하는 유전자 전사체의 개시코돈 또는 5'-UTR 지역을 코딩하는 염기서열 변형은, 예를 들면, 내재적 개시코돈에 비해 폴리펩티드 발현율이 더 높은 다른 개시코돈을 코딩하는 염기 서열로 치환하는 것일 수 있으나, 이에 제한되지 않는다.

상기 4) 및 5)의 아미노산 서열 또는 폴리뉴클레오티드 서열의 변형은, 폴리펩티드의 활성을 강화하도록 상기 폴리펩티드의 아미노산 서열 또는 상기 폴리펩티드를 코딩하는 폴리뉴클레오티드 서열을 결실, 삽입, 비보존적 또는 보존적 치환 또는 이들의 조합으로 서열상의 변이 발생, 또는 더욱 강한 활성을 갖도록 개량된 아미노산 서열 또는 폴리뉴클레오티드 서열 또는 활성이 증가하도록 개량된 아미노산 서열 또는 폴리뉴클레오티드 서열로의 교체일 수 있으나, 이에 한정되는 것은 아니다. 상기 교체는 구체적으로 상동재조합에 의하여 폴리뉴클레오티드를 염색체내로 삽입함으로써 수행될 수 있으나, 이에 제한되지 않는다. 이때 사용되는 벡터는 염색체 삽입 여부를 확인하기 위한 선별 마커 (selection marker)를 추가로 포함할 수 있다. 상기 선별 마커는 전술한 바와 같다.

상기 6) 폴리펩티드의 활성을 나타내는 외래 폴리뉴클레오티드의 도입은, 상기 폴리펩티드와 동일/유사한 활성을 나타내는 폴리펩티드를 코딩하는 외래 폴리뉴클레오티드의 숙주세포 내 도입일 수 있다. 상기 외래 폴리뉴클레오티드는 상기 폴리펩티드와 동일/유사한 활성을 나타내는 한 그 유래나 서열에 제한이 없다. 상기 도입에 이용되는 방법은 공지된 형질전환 방법을 당업자가 적절히 선택하여 수행될 수 있으며, 숙주 세포 내에서 상기 도입된 폴리뉴클레오티드가 발현됨으로써 폴리펩티드가 생성되어 그 활성이 증가될 수 있다.

상기 7) 폴리펩티드를 암호화하는 폴리뉴클레오티드의 코돈 최적화는, 내재 폴리뉴클레오티드가 숙주세포 내에서 전사 또는 번역이 증가하도록 코돈 최적화한 것이거나, 또는 외래 폴리뉴클레오티드가 숙주세포 내에서 최적화된 전사, 번역이 이루어지도록 이의 코돈을 최적화한 것일 수 있다.

상기 8) 폴리펩티드의 삼차구조를 분석하여 노출 부위를 선택하여 변형하거나 화학적으로 수식하는 것은, 예를 들어 분석하고자 하는 폴리펩티드의 서열정보를 기지 단백질들의 서열정보가 저장된 데이터베이스와 비교함으로써 서열의 유사성 정도에 따라 주형 단백질 후보를 결정하고 이를 토대로 구조를 확인하여, 변형하거나 화학적으로 수식할 노출 부위를 선택하여 변형 또는 수식하는 것일 수 있다.

이와 같은 폴리펩티드 활성의 강화는, 상응하는 폴리펩티드의 활성 또는 농도 발현량이 야생형이나 변형 전 미생물 균주에서 발현된 폴리펩티드의 활성 또는 농도를 기준으로 하여 증가되거나, 해당 폴리펩티드로부터 생산되는 산물의 양의 증가되는 것일 수 있으나, 이에 제한되는 것은 아니다.

본 출원의 미생물에서 폴리뉴클레오티드의 일부 또는 전체의 변형 (예컨대, 상술한 단백질 변이체를 코딩하기 위한 변형)은 (a) 미생물 내 염색체 삽입용 벡터를 이용한 상동 재조합 또는 유전자가위 (engineered nuclease, e.g., CRISPR-Cas9)을 이용한 유전체 교정 및/또는 (b) 자외선 및 방사선 등과 같은 빛 및/또는 화학물질 처리에 의해 유도될 수 있으나 이에 제한되지 않는다. 상기 유전자 일부 또는 전체의 변형 방법에는 DNA 재조합 기술에 의한 방법이 포함될 수 있다. 예를 들면, 목적 유전자와 상동성이 있는 뉴클레오티드 서열을 포함하는 뉴클레오티드 서열 또는 벡터를 상기 미생물에 주입하여 상동 재조합(homologous recombination)이 일어나게 함으로써 유전자 일부 또는 전체의 결손이 이루어질 수 있다. 상기 주입되는 뉴클레오티드 서열 또는 벡터는 우성 선별 마커를 포함할 수 있으나, 이에 제한되는 것은 아니다.

보다 구체적으로, 본 출원의 L-발린을 생산하는 미생물은 서열번호 27의 아미노산 서열로 기재된 폴리펩티드 및/또는 서열번호 28의 핵산염기 서열로 기재된 폴리뉴클레오티드를 포함하는 미생물일 수 있다. 더불어, 본 출원의 O-아세틸-L-호모세린을 생산하는 미생물은 서열번호 47의 아미노산 서열로 기재된 폴리펩티드 포함 및/또는 서열번호 48의 핵산염기 서열로 기재된 폴리뉴클레오티드 포함; 서열번호 37의 아미노산 서열로 기재된 폴리펩티드불활성 및/또는 서열번호 38의 핵산염기 서열로 기재된 폴리뉴클레오티드 결손;으로 이루어진 군으로부터 선택되는 변이를 포함하는 미생물일 수 있다.

본 출원의 미생물에서, 변이체 및 폴리뉴클레오티드 등은 상기 다른 양태에서 기재한 바와 같다.

본 출원의 또 다른 하나의 양태는 본 출원의 변이체 또는 본 출원의 폴리뉴클레오티드를 포함하는 코리네박테리움 속 미생물을 배지에서 배양하는 단계를 포함하는, L-아미노산 생산방법을 제공한다.

본 출원의 L-아미노산 생산방법은 본 출원의 변이체 또는 본 출원의 폴리뉴클레오티드 또는 본 출원의 벡터를 포함하는 코리네박테리움 글루타미쿰 균주를 배지에서 배양하는 단계를 포함할 수 있다.

더불어, 본 출원의 L-아미노산 생산방법에서, 상기 L-아미노산은 L-발린, O-아세틸-L-호모세린 또는 L-메티오닌일 수 있다.

본 출원에서, 용어 "배양"은 본 출원의 코리네박테리움 속 미생물을 적당히 조절된 환경 조건에서 생육시키는 것을 의미한다. 본 출원의 배양과정은 당업계에 알려진 적당한 배지와 배양조건에 따라 이루어질 수 있다. 이러한 배양 과정은 선택되는 균주에 따라 당업자가 용이하게 조정하여 사용할 수 있다. 구체적으로 상기 배양은 회분식, 연속식 및/또는 유가식일 수 있으나, 이에 제한되는 것은 아니다.

본 출원에서 용어, "배지"는 본 출원의 코리네박테리움 속 미생물을 배양하기 위해 필요로 하는 영양물질을 주성분으로 혼합한 물질을 의미하며, 생존 및 발육에 불가결한 물을 비롯하여 영양물질 및 발육인자 등을 공급한다. 구체적으로, 본 출원의 코리네박테리움 속 미생물의 배양에 사용되는 배지 및 기타 배양 조건은 통상의 미생물의 배양에 사용되는 배지라면 특별한 제한 없이 어느 것이나 사용할 수 있으나, 본 출원의 코리네박테리움 속 미생물을 적당한 탄소원, 질소원, 인원, 무기화합물, 아미노산 및/또는 비타민 등을 함유한 통상의 배지 내에서 호기성 조건 하에서 온도, pH 등을 조절하면서 배양할 수 있다.

구체적으로, 코리네박테리움 속 미생물에 대한 배양 배지는 문헌["Manual of Methods for General Bacteriology" by the American Society for Bacteriology (Washington D.C., USA, 1981)]에서 찾아 볼 수 있다.

본 출원에서 상기 탄소원으로는 글루코오스, 사카로오스, 락토오스, 프룩토오스, 수크로오스, 말토오스 등과 같은 탄수화물; 만니톨, 소르비톨 등과 같은 당 알코올, 피루브산, 락트산, 시트르산 등과 같은 유기산; 글루탐산, 메티오닌, 리신 등과 같은 아미노산 등이 포함될 수 있다. 또한, 전분 가수분해물, 당밀, 블랙스트랩 당밀, 쌀겨울, 카사버, 사탕수수 찌꺼기 및 옥수수 침지액 같은 천연의 유기 영양원을 사용할 수 있으며, 구체적으로는 글루코오스 및 살균된 전처리 당밀(즉, 환원당으로 전환된 당밀) 등과 같은 탄수화물이 사용될 수 있으며, 그 외의 적정량의 탄소원을 제한 없이 다양하게 이용할 수 있다. 이들 탄소원은 단독으로 사용되거나 2 종 이상이 조합되어 사용될 수 있으며, 이에 한정되는 것은 아니다.

상기 질소원으로는 암모니아, 황산암모늄, 염화암모늄, 초산암모늄, 인산암모늄, 탄산안모늄, 질산암모늄 등과 같은 무기질소원; 글루탐산, 메티오닌, 글루타민 등과 같은 아미노산, 펩톤, NZ-아민, 육류 추출물, 효모 추출물, 맥아 추출물, 옥수수 침지액, 카세인 가수분해물, 어류 또는 그의 분해생성물, 탈지 대두 케이크 또는 그의 분해 생성물 등과 같은 유기 질소원이 사용될 수 있다. 이들 질소원은 단독으로 사용되거나 2 종 이상이 조합되어 사용될 수 있으며, 이에 한정되는 것은 아니다.

상기 인원으로는 인산 제1칼륨, 인산 제2칼륨, 또는 이에 대응되는 소디움-함유 염 등이 포함될 수 있다. 무기화합물로는 염화나트륨, 염화칼슘, 염화철, 황산마그네슘, 황산철, 황산망간, 탄산칼슘 등이 사용될 수 있으며, 그 외에 아미노산, 비타민 및/또는 적절한 전구체 등이 포함될 수 있다. 이들 구성성분 또는 전구체는 배지에 회분식 또는 연속식으로 첨가될 수 있다. 그러나, 이에 한정되는 것은 아니다.

또한, 본 출원의 코리네박테리움 글루타미쿰 균주의 배양 중에 수산화암모늄, 수산화칼륨, 암모니아, 인산, 황산 등과 같은 화합물을 배지에 적절한 방식으로 첨가하여, 배지의 pH를 조정할 수 있다. 또한, 배양 중에는 지방산 폴리글리콜 에스테르와 같은 소포제를 사용하여 기포 생성을 억제할 수 있다. 또한, 배지의 호기 상태를 유지하기 위하여, 배지 내로 산소 또는 산소 함유 기체를 주입하거나 혐기 및 미호기 상태를 유지하기 위해 기체의 주입 없이 혹은 질소, 수소 또는 이산화탄소 가스를 주입할 수 있으며, 이에 한정되는 것은 아니다.

본 출원의 배양에서 배양온도는 20 내지 45℃, 구체적으로는 25 내지 40℃를 유지할 수 있고, 약 10 내지 160 시간 동안 배양할 수 있으나, 이에 한정되는 것은 아니다.

본 출원의 배양에 의하여 생산된 L-아미노산은 배지 중으로 분비되거나 세포 내에 잔류할 수 있다.

본 출원의 L-아미노산 생산방법은, 본 출원의 코리네박테리움 속 미생물을 준비하는 단계, 상기 미생물을 배양하기 위한 배지를 준비하는 단계, 또는 이들의 조합(순서에 무관, in any order)을, 예를 들어, 상기 배양하는 단계 이전에, 추가로 포함할 수 있다.

본 출원의 L-아미노산 생산방법은, 상기 배양에 따른 배지(배양이 수행된 배지) 또는 본 출원의 코리네박테리움 속 미생물로부터 L-아미노산을 회수하는 단계를 추가로 포함할 수 있다. 상기 회수하는 단계는 상기 배양하는 단계 이후에 추가로 포함될 수 있다.

상기 회수는 본 출원의 미생물의 배양 방법, 예를 들어 회분식, 연속식 또는 유가식 배양 방법 등에 따라 당해 기술 분야에 공지된 적합한 방법을 이용하여 목적하는 L-아미노산을 수집(collect)하는 것일 수 있다. 예를 들어, 원심분리, 여과, 결정화 단백질 침전제에 의한 처리(염석법), 추출, 초음파 파쇄, 한외여과, 투석법, 분자체 크로마토그래피(겔여과), 흡착크로마토그래피, 이온교환 크로마토그래피, 친화도 크로마토그래피 등의 각종 크로마토그래피, HPLC 또는 이들의 방법을 조합하여 사용될 수 있으며, 당해 분야에 공지된 적합한 방법을 이용하여 배지 또는 미생물로부터 목적하는 L-아미노산을 회수할 수 있다.

또한, 본 출원의 L-아미노산 생산방법은, 추가적으로 정제 단계를 포함할 수 있다. 상기 정제는 당해 기술분야에 공지된 적합한 방법을 이용하여, 수행할 수 있다. 일 예에서, 본 출원의 L-아미노산 생산방법이 회수 단계와 정제 단계를 모두 포함하는 경우, 상기 회수 단계와 정제 단계는 순서에 상관없이 연속적 또는 비연속적으로 수행되거나, 동시에 또는 하나의 단계로 통합되어 수행될 수 있으나, 이에 제한되는 것은 아니다.

더불어, 본 출원의 L-메티오닌 생산방법은, 상기 O-아세틸-L-호모세린을 L-메티오닌으로 전환하는 단계를 추가로 포함할 수 있다. 본 출원의 L-메티오닌 생산방법에 있어서, 상기 전환하는 단계는 상기 배양하는 단계 또는 상기 회수하는 단계 이후에 추가로 포함될 수 있다. 상기 전환하는 단계는 당해 기술 분야에 공지된 적합한 방법을 이용하여 수행할 수 있다(US 8426171 B2). 일 구현예로, 본 출원의 L-메티오닌 생산방법은 O-아세틸-L-호모세린, 메틸 머캅탄 및 O-아세틸 호모세린 설피드릴라아제(Oacetylhomoserine sulfhydrylase) 또는 시스타티오닌-γ-신타아제 (cystathionine gamma-synthase) 또는 O-숙시닐 호모세린 설프히드릴라아제(O-succinyl homoserine sulfhydrylase)를 접촉시켜 L-메티오닌을 생산하는 단계를 포함할 수 있다.

본 출원의 방법에서, 변이체, 폴리뉴클레오티드, 벡터 및 미생물 등은 상기 다른 양태에서 기재한 바와 같다.

본 출원의 또 다른 하나의 양태는 본 출원의 변이체, 본 출원의 변이체를 코딩하는 폴리뉴클레오타이드 또는 본 출원의 폴리뉴클레오타이드를 포함하는 벡터를 포함하는 코리네박테리움 속 미생물; 이를 배양한 배지; 또는 이들의 조합을 포함하는 L-아미노산 생산용 조성물을 제공하는 것이다.

본 출원의 조성물은 아미노산 생산용 조성물에 통상 사용되는 임의의 적합한 부형제를 추가로 포함할 수 있으며, 이러한 부형제는, 예를 들어 보존제, 습윤제, 분산제, 현탁화제, 완충제, 안정화제 또는 등장화제 등일 수 있으나, 이에 한정되는 것은 아니다.

본 출원의 L-아미노산 생산용 조성물에서, 상기 L-아미노산은 L-발린, O-아세틸-L-호모세린 또는 L-메티오닌일 수 있다.

본 출원의 조성물에서, 변이체, 폴리뉴클레오티드, 벡터, 균주 및 배지 등은 상기 다른 양태에서 기재한 바와 같다.

본 출원의 시트레이트 신타아제 변이체를 이용하는 경우, 고수율의 L-아미노산 생산이 가능하다.

이하 본 출원을 실시예에 의해 보다 상세하게 설명한다. 그러나 하기 실시예는 본 출원을 예시하기 위한 바람직한 실시양태에 불과한 것이며 따라서, 본 출원의 권리범위를 이에 한정하는 것으로 의도되지는 않는다. 한편, 본 명세서에 기재되지 않은 기술적인 사항들은 본 출원의 기술 분야 또는 유사 기술 분야에서 숙련된 통상의 기술자이면 충분히 이해하고 용이하게 실시할 수 있다.

실시예 1: 시트레이트 신타아제(GltA) 변이체 벡터 제작

본 발명자들은 GltA의 415번째 아미노산 잔기를 아세틸 coA(acetyl-coA) 결합 위치로 발굴하였으며, 이를 다른 아미노산으로 치환하였을시 아세틸 coA의 Km값이 높아지면서 시트레이트 신타아제 활성이 약화될 것으로 예측하였다.

이에, 상기 GltA의 415번째 아미노산인 리신을 다른 아미노산으로 치환하는 벡터를 제작하였다. 구체적으로, 415번째 아미노산인 리신을 히스티딘(K415H), 트립토판(K415W) 그리고 글리신(K415G)으로 치환하기 위해 변이가 포함된 벡터를 제작하였다.

야생형 코리네박테리움 글루타미쿰 ATCC14067의 gDNA(genomic DNA)를 주형으로 서열번호 15 및 17의 프라이머 쌍과 서열번호 16 및 18의 프라이머 쌍을, 서열번호 15 및 20의 프라이머 쌍과 서열번호 18 및 19의 프라이머 쌍을, 서열번호 15 및 22 의 프라이머 쌍과 서열번호 18 및 21의 프라이머 쌍을 이용하여 각각 PCR을 수행하였다. 상기에서 얻어진 여섯 개의 단편 중 두 단편의 혼합물을 주형으로 서열번호 15 및 서열번호 18의 프라이머 쌍을 이용하여 다시 오버랩핑(overlapping) PCR을 수행하여 3개의 단편을 각각 수득하였다. PCR은 94℃에서 5분간 변성 후, 94℃에서 30초, 55℃에서 30초, 72℃에서 1분 30초를 30회 반복한 후, 72℃에서 5분간 수행하였다. pDCM2 벡터(서열번호 14, 대한민국 공개번호 제10-2020-0136813호) 는 smaI을 처리하고 상기에서 수득한 3개의 PCR 산물을 각각 퓨전 클로닝하였다. 퓨전 클로닝은 In-Fusion® HD 클로닝 키트(Clontech)를 사용하였다. 클로닝 결과로 얻은 플라스미드를 각각 pDCM2-gltA(K415H), pDCM2-gltA(K415W), pDCM2-gltA(K415G)라 명명하였다. 본 실시예에서 사용한 프라이머의 서열은 하기 표 1에 기재하였다.

서열번호	프라이머	서열
15	프라이머 1	TCGAGCTCGGTACCC CCGTTCGTATGATCGGTTCCGCACAGGCC
16	프라이머 2	GTGCAGCAGGCAAC CAC ATCAACCGCCCACG
17	프라이머 3	CGTGGGCGGTTGAT GTG GTTGCCTGCTGCAC
18	프라이머 4	CTCTAGAGGATCCCC GCCGTAAGCAGCCTCTGGTGGAATGGTCAGC
19	프라이머 5	GTGCAGCAGGCAAC TGG ATCAACCGCCCACG
20	프라이머 6	CGTGGGCGGTTGAT CCA GTTGCCTGCTGCAC
21	프라이머 7	GTGCAGCAGGCAAC GGC ATCAACCGCCCACG
22	프라이머 8	CGTGGGCGGTTGAT GCC GTTGCCTGCTGCAC

실시예 2: L-발린 생산 균주에 GltA 변이체 도입 및 평가

2-1. L-발린 생산 기반 균주 제작 및 평가

야생주 코리네박테리움 글루타미쿰 ATCC14067과 ATCC13869의 아세토락테이트 신타아제 아이소자임 1 서브 유닛(Acetolactate synthase isozyme 1 small subunit, IlvN)에 각각 1종의 변이[ilvN(A42V); Biotechnology and Bioprocess Engineering, June 2014, Volume 19, Issue 3, pp 456-467](서열번호 27)를 도입하여 L-발린 생산능이 향상된 균주를 제작하였다(KR 10-1947945 B1).

구체적으로, 야생형 코리네박테리움 글루타미쿰 ATCC14067의 gDNA(genomic DNA)를 주형으로 서열번호 29 및 31 의 프라이머 쌍과 서열번호 30 및 32의 프라이머 쌍을 이용하여 각각 PCR을 수행하였다. 상기에서 얻어진 두 단편의 혼합물을 주형으로 서열번호 29 및 서열번호 32의 프라이머 쌍을 이용하여 다시 오버랩핑(overlapping) PCR을 수행하여 3개의 단편을 각각 수득하였다. PCR은 94℃에서 5분간 변성 후, 94℃에서 30초, 55℃에서 30초, 72℃에서 1분 30초를 30회 반복한 후, 72℃에서 5분간 수행하였다. pDCM2 벡터는 smaI을 처리하고 상기에서 수득한 3개의 PCR 산물을 각각 퓨전 클로닝하였다. 클로닝 결과로 얻은 플라스미드를 각각 pDCM2-ilvN(A42V)라 명명하였다. 상기 pDCM2-ilvN(A42V)를 야생형인 코리네박테리움 글루타미쿰 ATCC14067과 ATCC13869 균주에 각각 형질전환시켜 염색체 상에서 상동성 재조합을 유도하였다(van der Rest et al., Appl Microbiol Biotechnol 52:541-545, 1999). 상동성 서열의 재조합에 의해 염색체 상에 벡터가 삽입된 균주는 카나마이신(kanamycin) 25㎎/L를 함유한 배지에서 선별하였다. 선별된 코리네박테리움 글루타미쿰 형질 전환주를 대상으로 서열번호 33 및 34의 프라이머 쌍을 이용한 PCR을 통하여 유전자 단편을 증폭한 뒤, 유전자 서열 분석을 통하여 변이가 제대로 도입되었음을 확인하였다. 상기 재조합 균주를 코리네박테리움 글루타미쿰 CJ7V 및 CJ8V라고 각각 명명하였다. 본 실시예에서 사용한 프라이머의 서열은 하기 표 2에 기재하였다.

서열번호	서열명	서열
29	프라이머 11	TCGAGCTCGGTACCCC CGCGTCACCAAAGCGGA
30	프라이머 12	GTCCCTCGTGTCTGTAAAGACCGAAACACT
31	프라이머 13	AGTGTTTCGGTCTTTACAGACACGAGGGAC
32	프라이머 14	CTCTAGAGGATCCCC TTAGATCTTGGCCGGAGCCA
33	프라이머 15	CCGCGTCACCAAAGCGGA
34	프라이머 16	TTAGATCTTGGCCGGAGCCA

이후, 야생주 코리네박테리움 글루타미쿰 ATCC14067과 ATCC13869 균주, 상기에서 제작한 CJ7V 및 CJ8V 균주들을 대상으로 발효 역가 실험을 실시하였다. 영양배지에서 계대 배양된 각 균주들을 생산 배지 25 ㎖을 함유하는 250 ㎖ 코너-바플 플라스크에 접종하고, 30℃에서 72시간 동안, 200rpm에서 진탕 배양하였다. 이후, HPLC를 이용하여 L-발린의 농도를 분석하여 하기 표 3에 나타내었다.

<영양배지 (pH 7.2)>

포도당 10g, 육즙 5g, 폴리펩톤 10g, 염화나트륨 2.5g, 효모엑기스 5g, 한천 20g, 유레아 2g (증류수 1리터 기준)

<생산배지 (pH 7.0)>

포도당 100 g, 황산암모늄 40 g, 대두단백질 2.5 g, 옥수수침지고형분(Corn Steep Solids) 5 g, 요소 3 g, 제2인산칼륨 1 g, 황산마그네슘7수염 0.5 g, 바이오틴 100 ㎍, 티아민-HCl 1 ㎎, 판토텐산칼슘 2 ㎎, 니코틴아마이드 3 ㎎, 탄산칼슘 30 g (증류수 1리터 기준)

L-발린 생산 기반균주 CJ7V 및 CJ8V의 L-발린 생산능

균주	L-발린(g/L)
ATCC14067	1.5
CJ7V(ilvN(A42V))	2.2
ATCC13869	1.0
CJ8V(ilvN(A42V))	1.9

상기의 결과에서 보듯이, 야생형 코리네박테리움 글루타미쿰 ATCC14067 및 13869 균주와 대비하여 ilvN(A42V)유전자 변이가 도입된 CJ7V 및 CJ8V 균주에서 L-발린 생산능이 증가된 것을 확인하였다.

2-2. L-발린 생산 균주에 GltA 약화 변이체(K415H, K415W, K415G) 도입 및 평가

L-발린 생산 균주에 GltA 변이체를 도입하여 L-발린 생산능을 평가하였다. 실시예 1에서 제작한 pDCM2-gltA(K415H), pDCM2-gltA(K415W), pDCM2-gltA(K415G) 벡터를 염색체 상에서의 상동 재조합에 의해 L-발린 생산 균주인 CJ7V, CJ8V 및 CA08-0072(KCCM11201P, US 8465962 B2)에 각각 형질 전환시켰다. 상동성 서열의 재조합에 의해 염색체 상에 벡터가 삽입된 균주는 카나마이신 25㎎/L를 함유한 배지에서 선별하였다.

이후 2차 재조합이 완료된 상기 코리네박테리움 글루타미쿰 형질 전환주를 대상으로 서열번호 23 및 24의 프라이머 쌍(표 4)을 이용한 PCR을 통하여 유전자 단편을 증폭한 뒤, 유전자 서열 분석을 통하여 변이 삽입 균주를 확인하였다. 상기 재조합 균주를 코리네박테리움 글루타미쿰 하기와 같이 명명하여 실시예 2-1과 동일한 방법으로 역가 평가하여 하기 표 5에 나타내었다.

서열번호	서열명	서열
23	프라이머 9	CCGTTCGTATGATCGGTTCCGCACAGGCC
24	프라이머 10	GCCGTAAGCAGCCTCTGGTGGAATGGTCAGC

균주	OD600	L-발린(g/L)
CJ7V	77	2.2
CJ7V:gltA(K415H)	75	2.5
CJ7V:gltA(K415W)	47	1.2
CJ7V:gltA(K415G)	42	1.0
CJ8V	89	1.9
CJ8V:gltA(K415H)	89	2.1
CJ8V:gltA(K415W)	50	1.0
CJ8V:gltA(K415G)	49	1.0
CA08-0072	62	2.6
CA08-0072:gltA(K415H)	60	2.9
CA08-0072:gltA(K415W)	35	1.8
CA08-0072:gltA(K415G)	30	1.7

상기의 결과에서 보듯이, K415H 변이체의 경우 생육의 저하 없이 L-발린 생산능이 증가하는 것을 확인하였다.

상기 CA08-0072:gltA(K415H)는 CA08-1688로 명명하였으며, 부다페스트조약 하의 수탁기관인 한국미생물보존센터에 2020년 9월 28일자로 기탁하여 수탁번호 KCCM12795P를 부여받았다.

실시예 3: O-아세틸-L-호모세린 생산 강화 균주 제작 및 O-아세틸-L-호모세린 생산능 평가

3-1 외래 막단백질 변이형 YjeH 도입 균주 제작

코리네박테리움 글루타미쿰 ATCC13032에 도입되는, 외래 막단백질이자 O-아세틸 호모세린 배출 단백질인 YjeH 변이체의 유효성을 판단하기 위하여, YjeH 변이체(서열번호 47)를 코딩하는 유전자(서열번호 48)를 포함하는 염색체 도입 벡터를 제작하였다.

구체적으로, 유전자전위효소(transposase) 결손 벡터를 제작하기 위해, 유전자전위효소를 코딩하는 유전자(서열번호 38, 유전자번호 NCgl2335) 위치를 중심으로 5' 상단 부위를 증폭하기 위한 프라이머 쌍(서열번호 39 및 40) 과 3' 하단 부위를 증폭하기 위한 프라이머 쌍(서열번호 41 및 42)을 고안하였다. 서열번호 39 및 42의 프라이머 쌍은 각 말단에 XbaI 제한 효소 부위를 삽입하였고, 서열번호 40 및 41의 프라이머 쌍은 서로 교차되도록 고안하였으며 이 부위에 제한효소 SmaI 서열이 위치하도록 하였다. 프라이머 서열은 하기 표 6에 기재하였다.

서열번호	서열명	서열
서열번호 39	Tn_5 F	tgaattcgagctcggtacccCACCGACGCGCATCTGCCT
서열번호 40	Tn_5 R	GGTGTGGTGACTTTCAGCAGTTCCCGGGGGGGAGGAGGCATGTGGTGTTG
서열번호 41	Tn_3 F	CAACACCACATGCCTCCTCCCCCCCGGGAACTGCTGAAAGTCACCACACC
서열번호 42	Tn_3 R	gtcgactctagaggatccccCTCCCAAACCATTGAGGAATGG

ATCC13032 야생형(WT)의 염색체를 주형으로 하여 서열번호 39 및 40의 프라이머 쌍과 서열번호 41 및 42의 프라이머 쌍을 이용하여 PCR을 수행하였다. PCR 조건은 95℃에서 5분간 변성 후, 95℃에서 30초 변성, 55℃에서 30초 어닐링, 72℃에서 30초 중합을 30회 반복한 후, 72℃에서 7분간 중합반응을 수행하였다. 그 결과 NCgl2335 유전자의 결손 부위를 중심으로 5' 상단 부위의 851 bp DNA 단편과 3' 하단 부위의 847 bp의 DNA 단편을 수득하였다.

증폭된 두 가지의 DNA 절편을 주형으로 하여, 서열번호 39 및 42의 프라이머 쌍을 이용하여 PCR을 수행하였다. PCR 조건은 95℃에서 5분간 변성 후, 95℃에서 30초 변성, 55℃에서 30초 어닐링, 72℃에서 90초 중합을 30회 반복한 후, 72℃에서 7분간 중합반응을 수행하였다. 그 결과, 유전자전위효소를 코딩하는 유전자(서열번호 38, 유전자번호 NCgl2335)를 결손할 수 있는 부위를 포함하는 1648 bp의 DNA 단편이 증폭되었다.

수득한 PCR 산물을 SmaI 제한효소 처리한 pDCM2 벡터와 인퓨전 HD 클로닝 키트를 사용하여 퓨전 클로닝하였다. 클로닝된 벡터를 대장균 DH5α에 형질전환하고 형질전환된 대장균을 카나마이신 25mg/L이 포함된 LB 고체배지에 도말하였다. PCR을 통해 상기 목적한 유전자가 삽입된 플라스미드로 형질전환된 콜로니를 선별한 후 플라스미드 추출법을 이용하여 플라스미드를 획득하였고, 최종적으로 NCgl2335 결손 카세트가 클로닝된 pDCM2-△NCgl2335 재조합 벡터를 제작하였다.

O-아세틸 호모세린 배출 단백질의 유효성을 판단하기 위하여 대장균 유래의 YjeH 변이체를 코딩하는 유전자(서열번호 48) 포함하는 염색체 도입 벡터를 제작하였다. 이를 위해 CJ7 프로모터 (US 7662943 B2)를 이용하여 yjeH 유전자를 발현하는 벡터를 제작하였다. CJ7 프로모터 부위를 증폭하기 위한 프라이머 쌍(서열번호 43 및 44)과 대장균의 yjeH 부위를 증폭하기 위한 프라이머 쌍(서열번호 45 및 46)을 고안하였다. 프라이머 서열은 하기 표 7에 기재하였다.

서열번호	서열명	서열
서열번호 43	CJ7_yjeH F	ACACCACATGCCTCCTCcccAGAAACATCCCAGCGCTAC
서열번호 44	CJ7_yjeH R	AGTTCTTGTTTGAGTCCACTCATAGTGTTTCCTTTCGTTGGGT
서열번호 45	yjeH F	ACCCAACGAAAGGAAACACTATGAGTGGACTCAAACAAGAACTG
서열번호 46	yjeH R	GACTTTCAGCAGTTcccgggTTATGTGGTTATGCCATTTTCCGG

pECCG117-PCJ7-gfp(US 7662943 B2, p117-Pcj7-gfp)을 주형으로 하여 서열번호 43 및 서열번호 44, 야생형 대장균의 염색체를 주형으로 하여 서열번호 45 및 46의 프라이머 쌍을 이용하여 각각 PCR을 수행하였다. PCR 조건은 95℃에서 5분간 변성 후, 95℃에서 30초 변성, 55℃에서 30초 어닐링, 72℃에서 90초 중합을 30회 반복한 후, 72℃에서 7분간 중합반응을 수행하였다. 그 결과 CJ7 프로모터 부위의 360bp DNA 단편과 대장균의 yjeH 유전자 부위의 1297bp의 DNA 단편을 수득하였다.

증폭된 두 가지의 DNA 절편을 주형으로 하여, 서열번호 43 및 서열번호 46 프라이머로 PCR을 수행하였다. PCR 조건은 95℃에서 5분간 변성 후, 95℃에서 30초 변성, 55℃에서 30초 어닐링, 72℃에서 90초 중합을 30회 반복한 후, 72℃에서 7분간 중합반응을 수행하였다. 그 결과, CJ7 프로모터와 yjeH 유전자가 도입된 부위를 포함하는 1614bp의 DNA 단편이 증폭되었다.

상기 PCR을 통하여 획득한 유전자 결손 DNA 단편에 제한효소 SmaI 처리된 pDCM2-△NCgl2335 벡터에 인퓨전 HD 클로닝 키트를 이용하여 클로닝하였고 pDCM2-△NCgl2335::PCJ7-yjeH(eco,WT) 재조합 벡터를 제작하였다.

또한, 변이형 yjeH(eco, F351L) 유전자를 도입하기 위한 재조합 벡터를 제작하고자 하였다.

구체적으로는 pDCM2-△NCgl2335::PCJ7-yjeH(eco,WT) 플라스미드를 주형으로 하고 서열번호 49 및 서열번호 50의 프라이머를 이용하여, YjeH 아미노산 서열의 351번째 아미노산인 페닐알라닌을 류신으로 치환하였다(F351L). 제작된 변이 YjeH(F351L)를 코딩하는 유전자를 포함하는 플라스미드를 pDCM2-△NCgl2335::PCJ7-yjeH(eco,F351L)로 명명하였다. 프라이머 서열은 하기 표 8에 기재하였다.

서열번호	서열명	서열
서열번호 49	F351L F	CAATGGCATCCTTATTATGATTT
서열번호 50	F351L R	AAATCATAATAAGGATGCCATTG

제작된 pDCM2-△NCgl2335, pDCM2-△NCgl2335::PCJ7-yjeH(eco,F351L)를 ATCC13032 균주에 전기펄스법으로 형질전환하고, 2차 교차 과정을 거쳐 염색체 상에서 NCgl2335 유전자가 결손된 ATCC13032 △NCgl2335, ATCC13032 △NCgl2335::PCJ7-yjeH(eco,F351L)을 수득하였다. NCgl2335 유전자 결손 및 YjeH 변이체를 코딩하는 유전자의 삽입 여부는 서열번호 39 및 42의 프라이머 쌍을 이용한 PCR 후 ATCC13032와 비교하여 최종 확인하였다.

3-2. O-아세틸 호모세린 생산능 평가

실시예 3-1에서 제작된 ATCC13032 △NCgl2335, ATCC13032 △NCgl2335::PCJ7-yjeH(eco,F351L)와 야생형 균주인 ATCC13032의 O-아세틸 호모세린(O-AH; O-Acetyl Homoserine) 생산능을 비교하고자 아래와 같은 방법으로 배양하여 배양액 중 O-아세틸 호모세린을 분석하였다.

하기의 O-아세틸 호모세린 생산배지 25 ㎖을 함유하는 250 ㎖ 코너-바플 플라스크에 균주를 1백금이 접종하고, 33℃에서 20 시간 동안, 200 rpm으로 진탕 배양하였다. HPLC를 이용하여 O-아세틸 호모세린 농도를 분석하였으며, 분석된 농도는 표 9와 같았다.

O-아세틸 호모세린 생산배지 (pH 7.2)

포도당 30 g, KH₂PO₄ 2 g, 요소(Urea) 3 g, (NH₄)₂SO₄ 40 g, 펩톤(Peptone) 2.5 g, CSL(Corn steep liquor, Sigma) 5 g(10 ml), MgSO₄.7H₂O 0.5 g, CaCO₃ 20 g (증류수 1 리터 기준)

균주명	O-아세틸 호모세린(g/L)
ATCC13032	0.3
ATCC13032 △NCgl2335	0.3
ATCC13032 △NCgl2335::PCJ7-yjeH(eco,F351L)	1.0

그 결과, 상기 표 9와 같이 대조군 균주인 ATCC13032를 배양 시 O-아세틸-L-호모세린이 0.3g/L로 축적되며 유전자전위효소인 NCgl2335 유전자를 결손하여도 O-아세틸-L-호모세린 생산에는 영향이 없는 것을 확인하였다. 특히, 변이형 yjeH 유전자를 발현시켰을 경우 1.0 g/L 수준으로 축적되었음을 확인하였다.

3-3. O-아세틸-L-호모세린 생산 균주에 GltA 변이체(K415H) 도입 및 평가

실시예 3-2의 O-아세틸-L-호모세린 생산균주에 GltA 변이체를 도입하여 O-아세틸-L-호모세린 생산능을 평가하였다. 실시예 1에서 제작한 pDCM2-gltA(K415H) 벡터를 염색체 상에서의 상동 재조합에 의해 야생형 균주인 ATCC13032, ATCC13032 ΔNCgl2335와 O-아세틸-L-호모세린 생산 균주인 ATCC13032 △NCgl2335::PCJ7-yjeH(eco,F351L)에 각각 형질 전환시켰다. 상동성 서열의 재조합에 의해 염색체 상에 벡터가 삽입된 균주는 카나마이신 25㎎/L를 함유한 배지에서 선별하였다.

이후 2차 재조합이 완료된 상기 코리네박테리움 글루타미쿰 형질 전환주를 대상으로 서열번호 23 및 24의 프라이머 쌍을 이용한 PCR을 통하여 유전자 단편을 증폭한 뒤, 유전자 서열 분석을 통하여 gltA(K415H) 변이 삽입 균주를 확인하였다. 상기 재조합 균주를 코리네박테리움 글루타미쿰 하기와 같이 명명하여 실시예 3-2과 동일한 방법으로 역가 평가하고 하기 표 10에 나타내었다.

균주	O-AH (g/L)
ATCC13032	0.3
ATCC13032 gltA(K415H)	0.4
ATCC13032 △NCgl2335	0.3
ATCC13032 △NCgl2335 gltA(K415H)	0.4
ATCC13032 △NCgl2335::PCJ7-yjeH(eco,F351L)	1.0
ATCC13032 △NCgl2335::PCJ7-yjeH(eco,F351L) gltA(K415H)	1.3

상기의 결과에서 보듯이, GltA K415H 변이체를 도입한 균주 모두 이를 도입하지 않은 모균주보다 O-아세틸-L-호모세린 생산능이 증가하는 것을 확인하였다.

상기 ATCC13032 △NCgl2335::PCJ7-yjeH(eco,F351L) gltA(K415H)는 CM04-1006으로 명명하였으며, 부다페스트조약 하의 수탁기관인 한국미생물보존센터에 2020년 10월 21일자로 기탁하여 수탁번호 KCCM12809P를 부여받았다.

이상의 설명으로부터, 본 출원이 속하는 기술분야의 당업자는 본 출원이 그 기술적 사상이나 필수적 특징을 변경하지 않고서 다른 구체적인 형태로 실시될 수 있다는 것을 이해할 수 있을 것이다. 이와 관련하여, 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며 한정적인 것이 아닌 것으로 이해해야만 한다. 본 출원의 범위는 상기 상세한 설명보다는 후술하는 특허 청구범위의 의미 및 범위 그리고 그 등가 개념으로부터 도출되는 모든 변경 또는 변형된 형태가 본 출원의 범위에 포함되는 것으로 해석되어야 한다.

한국미생물보존센터(국외)

KCCM12795P

20200928

한국미생물보존센터(국외)

KCCM12809P

20201021

<110> CJ CheilJedang Corporation <120> Novel citrate synthase variant and a method for producing L-amino acid using the same <130> KPA200881-KR <160> 51 <170> KoPatentIn 3.0 <210> 1 <211> 437 <212> PRT <213> Unknown <220> <223> ATCC 14067 GltA AA <400> 1 Met Phe Glu Arg Asp Ile Val Ala Thr Asp Asn Asn Lys Ala Val Leu 1 5 10 15 His Tyr Pro Gly Gly Glu Phe Glu Met Asp Ile Ile Glu Ala Ser Glu 20 25 30 Gly Asn Asn Gly Val Val Leu Gly Lys Met Leu Ser Glu Thr Gly Leu 35 40 45 Ile Thr Phe Asp Pro Gly Tyr Val Ser Thr Gly Ser Thr Glu Ser Lys 50 55 60 Ile Thr Tyr Ile Asp Gly Asp Ala Gly Ile Leu Arg Tyr Arg Gly Tyr 65 70 75 80 Asp Ile Ala Asp Leu Ala Glu Asn Ala Thr Phe Asn Glu Val Ser Tyr 85 90 95 Leu Leu Ile Asn Gly Glu Leu Pro Thr Pro Asp Glu Leu His Lys Phe 100 105 110 Asn Asp Glu Ile Arg His His Thr Leu Leu Asp Glu Asp Phe Lys Ser 115 120 125 Gln Phe Asn Val Phe Pro Arg Asp Ala His Pro Met Ala Thr Leu Ala 130 135 140 Ser Ser Val Asn Ile Leu Ser Thr Tyr Tyr Gln Asp Gln Leu Asn Pro 145 150 155 160 Leu Asp Glu Ala Gln Leu Asp Lys Ala Thr Val Arg Leu Met Ala Lys 165 170 175 Val Pro Met Leu Ala Ala Tyr Ala His Arg Ala Arg Lys Gly Ala Pro 180 185 190 Tyr Met Tyr Pro Asp Asn Ser Leu Asn Ala Arg Glu Asn Phe Leu Arg 195 200 205 Met Met Phe Gly Tyr Pro Thr Glu Pro Tyr Glu Ile Asp Pro Ile Met 210 215 220 Val Lys Ala Leu Asp Lys Leu Leu Ile Leu His Ala Asp His Glu Gln 225 230 235 240 Asn Cys Ser Thr Ser Thr Val Arg Met Ile Gly Ser Ala Gln Ala Asn 245 250 255 Met Phe Val Ser Ile Ala Gly Gly Ile Asn Ala Leu Ser Gly Pro Leu 260 265 270 His Gly Gly Ala Asn Gln Ala Val Leu Glu Met Leu Glu Asp Ile Lys 275 280 285 Asn Asn His Gly Gly Asp Ala Thr Ala Phe Met Asn Lys Val Lys Asn 290 295 300 Lys Glu Asp Gly Val Arg Leu Met Gly Phe Gly His Arg Val Tyr Lys 305 310 315 320 Asn Tyr Asp Pro Arg Ala Ala Ile Val Lys Glu Thr Ala His Glu Ile 325 330 335 Leu Glu His Leu Gly Gly Asp Asp Leu Leu Asp Leu Ala Ile Lys Leu 340 345 350 Glu Glu Ile Ala Leu Ala Asp Asp Tyr Phe Ile Ser Arg Lys Leu Tyr 355 360 365 Pro Asn Val Asp Phe Tyr Thr Gly Leu Ile Tyr Arg Ala Met Gly Phe 370 375 380 Pro Thr Asp Phe Phe Thr Val Leu Phe Ala Ile Gly Arg Leu Pro Gly 385 390 395 400 Trp Ile Ala His Tyr Arg Glu Gln Leu Gly Ala Ala Gly Asn Lys Ile 405 410 415 Asn Arg Pro Arg Gln Val Tyr Thr Gly Asn Glu Ser Arg Lys Leu Val 420 425 430 Pro Arg Glu Glu Arg 435 <210> 2 <211> 1314 <212> DNA <213> Unknown <220> <223> ATCC 14067 GltA NT <400> 2 atgtttgaaa gggatatcgt ggctactgat aacaacaagg ctgtcctgca ctaccccggt 60 ggcgagttcg aaatggacat catcgaggct tctgagggta acaacggtgt tgtcctgggc 120 aagatgctgt ctgagactgg actgatcact tttgacccag gttatgtgag cactggctcc 180 accgagtcga agatcaccta catcgatggc gatgcgggaa tcctgcgtta ccgcggctat 240 gacatcgctg atctggctga gaatgccacc ttcaacgagg tttcttacct acttatcaac 300 ggtgagctac caaccccaga tgagcttcac aagtttaacg acgagattcg ccaccacacc 360 cttctggacg aggacttcaa gtcccagttc aacgtgttcc cacgcgacgc tcacccaatg 420 gcaaccttgg cttcctcggt taacattttg tctacctact accaggatca gctgaaccca 480 ctcgatgagg cacagcttga taaggcaacc gttcgcctca tggcaaaggt tccaatgctg 540 gctgcgtacg cacaccgcgc acgcaagggt gctccttaca tgtacccaga caactccctc 600 aacgcgcgtg agaacttcct gcgcatgatg ttcggttacc caactgagcc atacgagatc 660 gacccaatca tggtcaaggc tctggacaag ctgctcatcc tgcacgctga ccacgagcag 720 aactgctcca cctccaccgt tcgtatgatc ggttccgcac aggccaacat gtttgtctcc 780 atcgctggtg gcatcaacgc tctgtccggc ccactgcacg gtggcgcaaa ccaggctgtt 840 ctggagatgc tcgaagacat caagaacaac cacggtggcg acgcaaccgc gttcatgaac 900 aaggtcaaga acaaggaaga cggcgtccgc ctcatgggct tcggacaccg cgtttacaag 960 aattacgatc cacgtgcagc aatcgtcaag gagaccgcac acgagatcct cgagcacctc 1020 ggtggcgacg atcttctgga tctggcaatc aagctggaag aaattgcact ggctgatgat 1080 tacttcatct cccgcaagct ctacccgaac gtagacttct acaccggcct gatctaccgc 1140 gcaatgggct tcccaactga cttcttcacc gtattgttcg caatcggtcg tctgccagga 1200 tggatcgctc actaccgcga gcagctcggt gcagcaggca acaagatcaa ccgcccacgc 1260 caggtctaca ccggcaacga atcccgcaag ttggttcctc gcgaggagcg ctaa 1314 <210> 3 <211> 54 <212> PRT <213> Unknown <220> <223> ATCC 14067 GltA K415H 362~415 AA <400> 3 Phe Ile Ser Arg Lys Leu Tyr Pro Asn Val Asp Phe Tyr Thr Gly Leu 1 5 10 15 Ile Tyr Arg Ala Met Gly Phe Pro Thr Asp Phe Phe Thr Val Leu Phe 20 25 30 Ala Ile Gly Arg Leu Pro Gly Trp Ile Ala His Tyr Arg Glu Gln Leu 35 40 45 Gly Ala Ala Gly Asn His 50 <210> 4 <211> 437 <212> PRT <213> Unknown <220> <223> ATCC 13032 GltA AA <400> 4 Met Phe Glu Arg Asp Ile Val Ala Thr Asp Asn Asn Lys Ala Val Leu 1 5 10 15 His Tyr Pro Gly Gly Glu Phe Glu Met Asp Ile Ile Glu Ala Ser Glu 20 25 30 Gly Asn Asn Gly Val Val Leu Gly Lys Met Leu Ser Glu Thr Gly Leu 35 40 45 Ile Thr Phe Asp Pro Gly Tyr Val Ser Thr Gly Ser Thr Glu Ser Lys 50 55 60 Ile Thr Tyr Ile Asp Gly Asp Ala Gly Ile Leu Arg Tyr Arg Gly Tyr 65 70 75 80 Asp Ile Ala Asp Leu Ala Glu Asn Ala Thr Phe Asn Glu Val Ser Tyr 85 90 95 Leu Leu Ile Asn Gly Glu Leu Pro Thr Pro Asp Glu Leu His Lys Phe 100 105 110 Asn Asp Glu Ile Arg His His Thr Leu Leu Asp Glu Asp Phe Lys Ser 115 120 125 Gln Phe Asn Val Phe Pro Arg Asp Ala His Pro Met Ala Thr Leu Ala 130 135 140 Ser Ser Val Asn Ile Leu Ser Thr Tyr Tyr Gln Asp Gln Leu Asn Pro 145 150 155 160 Leu Asp Glu Ala Gln Leu Asp Lys Ala Thr Val Arg Leu Met Ala Lys 165 170 175 Val Pro Met Leu Ala Ala Tyr Ala His Arg Ala Arg Lys Gly Ala Pro 180 185 190 Tyr Met Tyr Pro Asp Asn Ser Leu Asn Ala Arg Glu Asn Phe Leu Arg 195 200 205 Met Met Phe Gly Tyr Pro Thr Glu Pro Tyr Glu Ile Asp Pro Ile Met 210 215 220 Val Lys Ala Leu Asp Lys Leu Leu Ile Leu His Ala Asp His Glu Gln 225 230 235 240 Asn Cys Ser Thr Ser Thr Val Arg Met Ile Gly Ser Ala Gln Ala Asn 245 250 255 Met Phe Val Ser Ile Ala Gly Gly Ile Asn Ala Leu Ser Gly Pro Leu 260 265 270 His Gly Gly Ala Asn Gln Ala Val Leu Glu Met Leu Glu Asp Ile Lys 275 280 285 Ser Asn His Gly Gly Asp Ala Thr Glu Phe Met Asn Lys Val Lys Asn 290 295 300 Lys Glu Asp Gly Val Arg Leu Met Gly Phe Gly His Arg Val Tyr Lys 305 310 315 320 Asn Tyr Asp Pro Arg Ala Ala Ile Val Lys Glu Thr Ala His Glu Ile 325 330 335 Leu Glu His Leu Gly Gly Asp Asp Leu Leu Asp Leu Ala Ile Lys Leu 340 345 350 Glu Glu Ile Ala Leu Ala Asp Asp Tyr Phe Ile Ser Arg Lys Leu Tyr 355 360 365 Pro Asn Val Asp Phe Tyr Thr Gly Leu Ile Tyr Arg Ala Met Gly Phe 370 375 380 Pro Thr Asp Phe Phe Thr Val Leu Phe Ala Ile Gly Arg Leu Pro Gly 385 390 395 400 Trp Ile Ala His Tyr Arg Glu Gln Leu Gly Ala Ala Gly Asn Lys Ile 405 410 415 Asn Arg Pro Arg Gln Val Tyr Thr Gly Asn Glu Ser Arg Lys Leu Val 420 425 430 Pro Arg Glu Glu Arg 435 <210> 5 <211> 1314 <212> DNA <213> Unknown <220> <223> ATCC13032 GltA NT <400> 5 atgtttgaaa gggatatcgt ggctactgat aacaacaagg ctgtcctgca ctaccccggt 60 ggcgagttcg aaatggacat catcgaggct tctgagggta acaacggtgt tgtcctgggc 120 aagatgctgt ctgagactgg actgatcact tttgacccag gttatgtgag cactggctcc 180 accgagtcga agatcaccta catcgatggc gatgcgggaa tcctgcgtta ccgcggctat 240 gacatcgctg atctggctga gaatgccacc ttcaacgagg tttcttacct acttatcaac 300 ggtgagctac caaccccaga tgagcttcac aagtttaacg acgagattcg ccaccacacc 360 cttctggacg aggacttcaa gtcccagttc aacgtgttcc cacgcgacgc tcacccaatg 420 gcaaccttgg cttcctcggt taacattttg tctacctact accaggacca gctgaaccca 480 ctcgatgagg cacagcttga taaggcaacc gttcgcctca tggcaaaggt tccaatgctg 540 gctgcgtacg cacaccgcgc acgcaagggt gctccttaca tgtacccaga caactccctc 600 aatgcgcgtg agaacttcct gcgcatgatg ttcggttacc caaccgagcc atacgagatc 660 gacccaatca tggtcaaggc tctggacaag ctgctcatcc tgcacgctga ccacgagcag 720 aactgctcca cctccaccgt tcgtatgatc ggttccgcac aggccaacat gtttgtctcc 780 atcgctggtg gcatcaacgc tctgtccggc ccactgcacg gtggcgcaaa ccaggctgtt 840 ctggagatgc tcgaagacat caagagcaac cacggtggcg acgcaaccga gttcatgaac 900 aaggtcaaga acaaggaaga cggcgtccgc ctcatgggct tcggacaccg cgtttacaag 960 aactacgatc cacgtgcagc aatcgtcaag gagaccgcac acgagatcct cgagcacctc 1020 ggtggcgacg atcttctgga tctggcaatc aagctggaag aaattgcact ggctgatgat 1080 tacttcatct cccgcaagct ctacccgaac gtagacttct acaccggcct gatctaccgc 1140 gcaatgggct tcccaactga cttcttcacc gtattgttcg caatcggtcg tctgccagga 1200 tggatcgctc actaccgcga gcagctcggt gcagcaggca acaagatcaa ccgcccacgc 1260 caggtctaca ccggcaacga atcccgcaag ttggttcctc gcgaggagcg ctaa 1314 <210> 6 <211> 437 <212> PRT <213> Unknown <220> <223> ATCC13869 GltA AA <400> 6 Met Phe Glu Arg Asp Ile Val Ala Thr Asp Asn Asn Lys Ala Val Leu 1 5 10 15 His Tyr Pro Gly Gly Glu Phe Glu Met Asp Ile Ile Glu Ala Ser Glu 20 25 30 Gly Asn Asn Gly Val Val Leu Gly Lys Met Leu Ser Glu Thr Gly Leu 35 40 45 Ile Thr Phe Asp Pro Gly Tyr Val Ser Thr Gly Ser Thr Glu Ser Lys 50 55 60 Ile Thr Tyr Ile Asp Gly Asp Ala Gly Ile Leu Arg Tyr Arg Gly Tyr 65 70 75 80 Asp Ile Ala Asp Leu Ala Glu Asn Ala Thr Phe Asn Glu Val Ser Tyr 85 90 95 Leu Leu Ile Asn Gly Glu Leu Pro Thr Pro Asp Glu Leu His Lys Phe 100 105 110 Asn Asp Glu Ile Arg His His Thr Leu Leu Asp Glu Asp Phe Lys Ser 115 120 125 Gln Phe Asn Val Phe Pro Arg Asp Ala His Pro Met Ala Thr Leu Ala 130 135 140 Ser Ser Val Asn Ile Leu Ser Thr Tyr Tyr Gln Asp Gln Leu Asn Pro 145 150 155 160 Leu Asp Glu Ala Gln Leu Asp Lys Ala Thr Val Arg Leu Met Ala Lys 165 170 175 Val Pro Met Leu Ala Ala Tyr Ala His Arg Ala Arg Lys Gly Ala Pro 180 185 190 Tyr Met Tyr Pro Asp Asn Ser Leu Asn Ala Arg Glu Asn Phe Leu Arg 195 200 205 Met Met Phe Gly Tyr Pro Thr Glu Pro Tyr Glu Ile Asp Pro Ile Met 210 215 220 Val Lys Ala Leu Asp Lys Leu Leu Ile Leu His Ala Asp His Glu Gln 225 230 235 240 Asn Cys Ser Thr Ser Thr Val Arg Met Ile Gly Ser Ala Gln Ala Asn 245 250 255 Met Phe Val Ser Ile Ala Gly Gly Ile Asn Ala Leu Ser Gly Pro Leu 260 265 270 His Gly Gly Ala Asn Gln Ala Val Leu Glu Met Leu Glu Asp Ile Lys 275 280 285 Asn Asn His Gly Gly Asp Ala Thr Ala Phe Met Asn Lys Val Lys Asn 290 295 300 Lys Glu Asp Gly Val Arg Leu Met Gly Phe Gly His Arg Val Tyr Lys 305 310 315 320 Asn Tyr Asp Pro Arg Ala Ala Ile Val Lys Glu Thr Ala His Glu Ile 325 330 335 Leu Glu His Leu Gly Gly Asp Asp Leu Leu Asp Leu Ala Ile Lys Leu 340 345 350 Glu Glu Ile Ala Leu Ala Asp Asp Cys Phe Ile Ser Arg Lys Leu Tyr 355 360 365 Pro Asn Val Asp Phe Tyr Thr Gly Leu Ile Tyr Arg Ala Met Gly Phe 370 375 380 Pro Thr Asp Phe Phe Thr Val Leu Phe Ala Ile Gly Arg Leu Pro Gly 385 390 395 400 Trp Ile Ala His Tyr Arg Glu Gln Leu Gly Ala Ala Gly Asn Lys Ile 405 410 415 Asn Arg Pro Arg Gln Val Tyr Thr Gly Lys Glu Ser Arg Lys Leu Val 420 425 430 Pro Arg Glu Glu Arg 435 <210> 7 <211> 1314 <212> DNA <213> Unknown <220> <223> ATCC13869 GltA NT <400> 7 atgtttgaaa gggatatcgt ggctactgat aacaacaagg ctgtcctgca ctaccccggt 60 ggcgagttcg aaatggacat catcgaggct tctgagggta acaacggtgt tgtcctgggc 120 aagatgctgt ctgagactgg actgatcact tttgacccag gttatgtgag cactggctcc 180 accgagtcga agatcaccta catcgatggc gatgcgggaa tcctgcgtta ccgcggctat 240 gacatcgctg atctggctga gaatgccacc ttcaacgagg tttcttacct acttatcaac 300 ggtgagctac caaccccaga tgagcttcac aagtttaacg acgagattcg ccaccacacc 360 cttctggacg aggacttcaa gtcccagttc aacgtgttcc cacgcgacgc tcacccaatg 420 gcaaccttgg cttcctcggt taacattttg tctacctact accaggatca gctgaaccca 480 ctcgatgagg cacagcttga taaggcaacc gttcgcctca tggcaaaggt tccaatgctg 540 gctgcgtacg cacaccgcgc acgcaagggt gctccttaca tgtacccaga caactccctc 600 aacgcgcgtg agaacttcct gcgcatgatg ttcggttacc caaccgagcc atacgagatc 660 gacccaatca tggtcaaggc tctggacaag ctgctcatcc tgcacgctga ccacgagcag 720 aactgctcca cctccaccgt tcgtatgatc ggttccgcac aggccaacat gtttgtctcc 780 atcgctggtg gcatcaacgc tctgtccggc ccactgcacg gtggcgcaaa ccaggctgtt 840 ctggagatgc tcgaagacat caagaacaac cacggtggcg acgcaaccgc gttcatgaac 900 aaggtcaaga acaaggaaga cggcgtccgc ctcatgggct tcggacaccg cgtttacaag 960 aactacgatc cacgtgcagc aatcgtcaag gagaccgcac acgagatcct cgagcacctc 1020 ggtggcgacg atcttctgga tctggcaatc aagctggaag aaattgcact ggctgatgat 1080 tgcttcatct cccgcaagct ctacccgaac gtagacttct acaccggcct gatctaccgc 1140 gcaatgggct tcccaactga cttcttcacc gtattgttcg caatcggtcg tctgccagga 1200 tggatcgctc actaccgcga gcagctcggt gcagcaggca acaagatcaa ccgcccacgc 1260 caggtctaca ccggcaagga atcccgcaag ttggttcctc gcgaggagcg ctaa 1314 <210> 8 <211> 437 <212> PRT <213> Artificial Sequence <220> <223> ATCC 14067 GltA K415H AA <400> 8 Met Phe Glu Arg Asp Ile Val Ala Thr Asp Asn Asn Lys Ala Val Leu 1 5 10 15 His Tyr Pro Gly Gly Glu Phe Glu Met Asp Ile Ile Glu Ala Ser Glu 20 25 30 Gly Asn Asn Gly Val Val Leu Gly Lys Met Leu Ser Glu Thr Gly Leu 35 40 45 Ile Thr Phe Asp Pro Gly Tyr Val Ser Thr Gly Ser Thr Glu Ser Lys 50 55 60 Ile Thr Tyr Ile Asp Gly Asp Ala Gly Ile Leu Arg Tyr Arg Gly Tyr 65 70 75 80 Asp Ile Ala Asp Leu Ala Glu Asn Ala Thr Phe Asn Glu Val Ser Tyr 85 90 95 Leu Leu Ile Asn Gly Glu Leu Pro Thr Pro Asp Glu Leu His Lys Phe 100 105 110 Asn Asp Glu Ile Arg His His Thr Leu Leu Asp Glu Asp Phe Lys Ser 115 120 125 Gln Phe Asn Val Phe Pro Arg Asp Ala His Pro Met Ala Thr Leu Ala 130 135 140 Ser Ser Val Asn Ile Leu Ser Thr Tyr Tyr Gln Asp Gln Leu Asn Pro 145 150 155 160 Leu Asp Glu Ala Gln Leu Asp Lys Ala Thr Val Arg Leu Met Ala Lys 165 170 175 Val Pro Met Leu Ala Ala Tyr Ala His Arg Ala Arg Lys Gly Ala Pro 180 185 190 Tyr Met Tyr Pro Asp Asn Ser Leu Asn Ala Arg Glu Asn Phe Leu Arg 195 200 205 Met Met Phe Gly Tyr Pro Thr Glu Pro Tyr Glu Ile Asp Pro Ile Met 210 215 220 Val Lys Ala Leu Asp Lys Leu Leu Ile Leu His Ala Asp His Glu Gln 225 230 235 240 Asn Cys Ser Thr Ser Thr Val Arg Met Ile Gly Ser Ala Gln Ala Asn 245 250 255 Met Phe Val Ser Ile Ala Gly Gly Ile Asn Ala Leu Ser Gly Pro Leu 260 265 270 His Gly Gly Ala Asn Gln Ala Val Leu Glu Met Leu Glu Asp Ile Lys 275 280 285 Asn Asn His Gly Gly Asp Ala Thr Ala Phe Met Asn Lys Val Lys Asn 290 295 300 Lys Glu Asp Gly Val Arg Leu Met Gly Phe Gly His Arg Val Tyr Lys 305 310 315 320 Asn Tyr Asp Pro Arg Ala Ala Ile Val Lys Glu Thr Ala His Glu Ile 325 330 335 Leu Glu His Leu Gly Gly Asp Asp Leu Leu Asp Leu Ala Ile Lys Leu 340 345 350 Glu Glu Ile Ala Leu Ala Asp Asp Tyr Phe Ile Ser Arg Lys Leu Tyr 355 360 365 Pro Asn Val Asp Phe Tyr Thr Gly Leu Ile Tyr Arg Ala Met Gly Phe 370 375 380 Pro Thr Asp Phe Phe Thr Val Leu Phe Ala Ile Gly Arg Leu Pro Gly 385 390 395 400 Trp Ile Ala His Tyr Arg Glu Gln Leu Gly Ala Ala Gly Asn His Ile 405 410 415 Asn Arg Pro Arg Gln Val Tyr Thr Gly Asn Glu Ser Arg Lys Leu Val 420 425 430 Pro Arg Glu Glu Arg 435 <210> 9 <211> 1314 <212> DNA <213> Artificial Sequence <220> <223> ATCC 14067 GltA K415H NT <400> 9 atgtttgaaa gggatatcgt ggctactgat aacaacaagg ctgtcctgca ctaccccggt 60 ggcgagttcg aaatggacat catcgaggct tctgagggta acaacggtgt tgtcctgggc 120 aagatgctgt ctgagactgg actgatcact tttgacccag gttatgtgag cactggctcc 180 accgagtcga agatcaccta catcgatggc gatgcgggaa tcctgcgtta ccgcggctat 240 gacatcgctg atctggctga gaatgccacc ttcaacgagg tttcttacct acttatcaac 300 ggtgagctac caaccccaga tgagcttcac aagtttaacg acgagattcg ccaccacacc 360 cttctggacg aggacttcaa gtcccagttc aacgtgttcc cacgcgacgc tcacccaatg 420 gcaaccttgg cttcctcggt taacattttg tctacctact accaggatca gctgaaccca 480 ctcgatgagg cacagcttga taaggcaacc gttcgcctca tggcaaaggt tccaatgctg 540 gctgcgtacg cacaccgcgc acgcaagggt gctccttaca tgtacccaga caactccctc 600 aacgcgcgtg agaacttcct gcgcatgatg ttcggttacc caactgagcc atacgagatc 660 gacccaatca tggtcaaggc tctggacaag ctgctcatcc tgcacgctga ccacgagcag 720 aactgctcca cctccaccgt tcgtatgatc ggttccgcac aggccaacat gtttgtctcc 780 atcgctggtg gcatcaacgc tctgtccggc ccactgcacg gtggcgcaaa ccaggctgtt 840 ctggagatgc tcgaagacat caagaacaac cacggtggcg acgcaaccgc gttcatgaac 900 aaggtcaaga acaaggaaga cggcgtccgc ctcatgggct tcggacaccg cgtttacaag 960 aattacgatc cacgtgcagc aatcgtcaag gagaccgcac acgagatcct cgagcacctc 1020 ggtggcgacg atcttctgga tctggcaatc aagctggaag aaattgcact ggctgatgat 1080 tacttcatct cccgcaagct ctacccgaac gtagacttct acaccggcct gatctaccgc 1140 gcaatgggct tcccaactga cttcttcacc gtattgttcg caatcggtcg tctgccagga 1200 tggatcgctc actaccgcga gcagctcggt gcagcaggca accacatcaa ccgcccacgc 1260 caggtctaca ccggcaacga atcccgcaag ttggttcctc gcgaggagcg ctaa 1314 <210> 10 <211> 437 <212> PRT <213> Artificial Sequence <220> <223> ATCC13032 GltA K415H AA <400> 10 Met Phe Glu Arg Asp Ile Val Ala Thr Asp Asn Asn Lys Ala Val Leu 1 5 10 15 His Tyr Pro Gly Gly Glu Phe Glu Met Asp Ile Ile Glu Ala Ser Glu 20 25 30 Gly Asn Asn Gly Val Val Leu Gly Lys Met Leu Ser Glu Thr Gly Leu 35 40 45 Ile Thr Phe Asp Pro Gly Tyr Val Ser Thr Gly Ser Thr Glu Ser Lys 50 55 60 Ile Thr Tyr Ile Asp Gly Asp Ala Gly Ile Leu Arg Tyr Arg Gly Tyr 65 70 75 80 Asp Ile Ala Asp Leu Ala Glu Asn Ala Thr Phe Asn Glu Val Ser Tyr 85 90 95 Leu Leu Ile Asn Gly Glu Leu Pro Thr Pro Asp Glu Leu His Lys Phe 100 105 110 Asn Asp Glu Ile Arg His His Thr Leu Leu Asp Glu Asp Phe Lys Ser 115 120 125 Gln Phe Asn Val Phe Pro Arg Asp Ala His Pro Met Ala Thr Leu Ala 130 135 140 Ser Ser Val Asn Ile Leu Ser Thr Tyr Tyr Gln Asp Gln Leu Asn Pro 145 150 155 160 Leu Asp Glu Ala Gln Leu Asp Lys Ala Thr Val Arg Leu Met Ala Lys 165 170 175 Val Pro Met Leu Ala Ala Tyr Ala His Arg Ala Arg Lys Gly Ala Pro 180 185 190 Tyr Met Tyr Pro Asp Asn Ser Leu Asn Ala Arg Glu Asn Phe Leu Arg 195 200 205 Met Met Phe Gly Tyr Pro Thr Glu Pro Tyr Glu Ile Asp Pro Ile Met 210 215 220 Val Lys Ala Leu Asp Lys Leu Leu Ile Leu His Ala Asp His Glu Gln 225 230 235 240 Asn Cys Ser Thr Ser Thr Val Arg Met Ile Gly Ser Ala Gln Ala Asn 245 250 255 Met Phe Val Ser Ile Ala Gly Gly Ile Asn Ala Leu Ser Gly Pro Leu 260 265 270 His Gly Gly Ala Asn Gln Ala Val Leu Glu Met Leu Glu Asp Ile Lys 275 280 285 Ser Asn His Gly Gly Asp Ala Thr Glu Phe Met Asn Lys Val Lys Asn 290 295 300 Lys Glu Asp Gly Val Arg Leu Met Gly Phe Gly His Arg Val Tyr Lys 305 310 315 320 Asn Tyr Asp Pro Arg Ala Ala Ile Val Lys Glu Thr Ala His Glu Ile 325 330 335 Leu Glu His Leu Gly Gly Asp Asp Leu Leu Asp Leu Ala Ile Lys Leu 340 345 350 Glu Glu Ile Ala Leu Ala Asp Asp Tyr Phe Ile Ser Arg Lys Leu Tyr 355 360 365 Pro Asn Val Asp Phe Tyr Thr Gly Leu Ile Tyr Arg Ala Met Gly Phe 370 375 380 Pro Thr Asp Phe Phe Thr Val Leu Phe Ala Ile Gly Arg Leu Pro Gly 385 390 395 400 Trp Ile Ala His Tyr Arg Glu Gln Leu Gly Ala Ala Gly Asn His Ile 405 410 415 Asn Arg Pro Arg Gln Val Tyr Thr Gly Asn Glu Ser Arg Lys Leu Val 420 425 430 Pro Arg Glu Glu Arg 435 <210> 11 <211> 1314 <212> DNA <213> Artificial Sequence <220> <223> ATCC13032 GltA K415H NT <400> 11 atgtttgaaa gggatatcgt ggctactgat aacaacaagg ctgtcctgca ctaccccggt 60 ggcgagttcg aaatggacat catcgaggct tctgagggta acaacggtgt tgtcctgggc 120 aagatgctgt ctgagactgg actgatcact tttgacccag gttatgtgag cactggctcc 180 accgagtcga agatcaccta catcgatggc gatgcgggaa tcctgcgtta ccgcggctat 240 gacatcgctg atctggctga gaatgccacc ttcaacgagg tttcttacct acttatcaac 300 ggtgagctac caaccccaga tgagcttcac aagtttaacg acgagattcg ccaccacacc 360 cttctggacg aggacttcaa gtcccagttc aacgtgttcc cacgcgacgc tcacccaatg 420 gcaaccttgg cttcctcggt taacattttg tctacctact accaggacca gctgaaccca 480 ctcgatgagg cacagcttga taaggcaacc gttcgcctca tggcaaaggt tccaatgctg 540 gctgcgtacg cacaccgcgc acgcaagggt gctccttaca tgtacccaga caactccctc 600 aatgcgcgtg agaacttcct gcgcatgatg ttcggttacc caaccgagcc atacgagatc 660 gacccaatca tggtcaaggc tctggacaag ctgctcatcc tgcacgctga ccacgagcag 720 aactgctcca cctccaccgt tcgtatgatc ggttccgcac aggccaacat gtttgtctcc 780 atcgctggtg gcatcaacgc tctgtccggc ccactgcacg gtggcgcaaa ccaggctgtt 840 ctggagatgc tcgaagacat caagagcaac cacggtggcg acgcaaccga gttcatgaac 900 aaggtcaaga acaaggaaga cggcgtccgc ctcatgggct tcggacaccg cgtttacaag 960 aactacgatc cacgtgcagc aatcgtcaag gagaccgcac acgagatcct cgagcacctc 1020 ggtggcgacg atcttctgga tctggcaatc aagctggaag aaattgcact ggctgatgat 1080 tacttcatct cccgcaagct ctacccgaac gtagacttct acaccggcct gatctaccgc 1140 gcaatgggct tcccaactga cttcttcacc gtattgttcg caatcggtcg tctgccagga 1200 tggatcgctc actaccgcga gcagctcggt gcagcaggca accacatcaa ccgcccacgc 1260 caggtctaca ccggcaacga atcccgcaag ttggttcctc gcgaggagcg ctaa 1314 <210> 12 <211> 437 <212> PRT <213> Artificial Sequence <220> <223> ATCC13869 GltA K415H AA <400> 12 Met Phe Glu Arg Asp Ile Val Ala Thr Asp Asn Asn Lys Ala Val Leu 1 5 10 15 His Tyr Pro Gly Gly Glu Phe Glu Met Asp Ile Ile Glu Ala Ser Glu 20 25 30 Gly Asn Asn Gly Val Val Leu Gly Lys Met Leu Ser Glu Thr Gly Leu 35 40 45 Ile Thr Phe Asp Pro Gly Tyr Val Ser Thr Gly Ser Thr Glu Ser Lys 50 55 60 Ile Thr Tyr Ile Asp Gly Asp Ala Gly Ile Leu Arg Tyr Arg Gly Tyr 65 70 75 80 Asp Ile Ala Asp Leu Ala Glu Asn Ala Thr Phe Asn Glu Val Ser Tyr 85 90 95 Leu Leu Ile Asn Gly Glu Leu Pro Thr Pro Asp Glu Leu His Lys Phe 100 105 110 Asn Asp Glu Ile Arg His His Thr Leu Leu Asp Glu Asp Phe Lys Ser 115 120 125 Gln Phe Asn Val Phe Pro Arg Asp Ala His Pro Met Ala Thr Leu Ala 130 135 140 Ser Ser Val Asn Ile Leu Ser Thr Tyr Tyr Gln Asp Gln Leu Asn Pro 145 150 155 160 Leu Asp Glu Ala Gln Leu Asp Lys Ala Thr Val Arg Leu Met Ala Lys 165 170 175 Val Pro Met Leu Ala Ala Tyr Ala His Arg Ala Arg Lys Gly Ala Pro 180 185 190 Tyr Met Tyr Pro Asp Asn Ser Leu Asn Ala Arg Glu Asn Phe Leu Arg 195 200 205 Met Met Phe Gly Tyr Pro Thr Glu Pro Tyr Glu Ile Asp Pro Ile Met 210 215 220 Val Lys Ala Leu Asp Lys Leu Leu Ile Leu His Ala Asp His Glu Gln 225 230 235 240 Asn Cys Ser Thr Ser Thr Val Arg Met Ile Gly Ser Ala Gln Ala Asn 245 250 255 Met Phe Val Ser Ile Ala Gly Gly Ile Asn Ala Leu Ser Gly Pro Leu 260 265 270 His Gly Gly Ala Asn Gln Ala Val Leu Glu Met Leu Glu Asp Ile Lys 275 280 285 Asn Asn His Gly Gly Asp Ala Thr Ala Phe Met Asn Lys Val Lys Asn 290 295 300 Lys Glu Asp Gly Val Arg Leu Met Gly Phe Gly His Arg Val Tyr Lys 305 310 315 320 Asn Tyr Asp Pro Arg Ala Ala Ile Val Lys Glu Thr Ala His Glu Ile 325 330 335 Leu Glu His Leu Gly Gly Asp Asp Leu Leu Asp Leu Ala Ile Lys Leu 340 345 350 Glu Glu Ile Ala Leu Ala Asp Asp Cys Phe Ile Ser Arg Lys Leu Tyr 355 360 365 Pro Asn Val Asp Phe Tyr Thr Gly Leu Ile Tyr Arg Ala Met Gly Phe 370 375 380 Pro Thr Asp Phe Phe Thr Val Leu Phe Ala Ile Gly Arg Leu Pro Gly 385 390 395 400 Trp Ile Ala His Tyr Arg Glu Gln Leu Gly Ala Ala Gly Asn His Ile 405 410 415 Asn Arg Pro Arg Gln Val Tyr Thr Gly Lys Glu Ser Arg Lys Leu Val 420 425 430 Pro Arg Glu Glu Arg 435 <210> 13 <211> 1314 <212> DNA <213> Artificial Sequence <220> <223> ATCC13869 GltA K415H NT <400> 13 atgtttgaaa gggatatcgt ggctactgat aacaacaagg ctgtcctgca ctaccccggt 60 ggcgagttcg aaatggacat catcgaggct tctgagggta acaacggtgt tgtcctgggc 120 aagatgctgt ctgagactgg actgatcact tttgacccag gttatgtgag cactggctcc 180 accgagtcga agatcaccta catcgatggc gatgcgggaa tcctgcgtta ccgcggctat 240 gacatcgctg atctggctga gaatgccacc ttcaacgagg tttcttacct acttatcaac 300 ggtgagctac caaccccaga tgagcttcac aagtttaacg acgagattcg ccaccacacc 360 cttctggacg aggacttcaa gtcccagttc aacgtgttcc cacgcgacgc tcacccaatg 420 gcaaccttgg cttcctcggt taacattttg tctacctact accaggatca gctgaaccca 480 ctcgatgagg cacagcttga taaggcaacc gttcgcctca tggcaaaggt tccaatgctg 540 gctgcgtacg cacaccgcgc acgcaagggt gctccttaca tgtacccaga caactccctc 600 aacgcgcgtg agaacttcct gcgcatgatg ttcggttacc caaccgagcc atacgagatc 660 gacccaatca tggtcaaggc tctggacaag ctgctcatcc tgcacgctga ccacgagcag 720 aactgctcca cctccaccgt tcgtatgatc ggttccgcac aggccaacat gtttgtctcc 780 atcgctggtg gcatcaacgc tctgtccggc ccactgcacg gtggcgcaaa ccaggctgtt 840 ctggagatgc tcgaagacat caagaacaac cacggtggcg acgcaaccgc gttcatgaac 900 aaggtcaaga acaaggaaga cggcgtccgc ctcatgggct tcggacaccg cgtttacaag 960 aactacgatc cacgtgcagc aatcgtcaag gagaccgcac acgagatcct cgagcacctc 1020 ggtggcgacg atcttctgga tctggcaatc aagctggaag aaattgcact ggctgatgat 1080 tgcttcatct cccgcaagct ctacccgaac gtagacttct acaccggcct gatctaccgc 1140 gcaatgggct tcccaactga cttcttcacc gtattgttcg caatcggtcg tctgccagga 1200 tggatcgctc actaccgcga gcagctcggt gcagcaggca accacatcaa ccgcccacgc 1260 caggtctaca ccggcaagga atcccgcaag ttggttcctc gcgaggagcg ctaa 1314 <210> 14 <211> 5803 <212> DNA <213> Artificial Sequence <220> <223> pDCM2 <400> 14 gttcgcttgc tgtccataaa accgcccagt ctagctatcg ccatgtaagc ccactgcaag 60 ctacctgctt tctctttgcg cttgcgtttt cccttgtcca gatagcccag tagctgacat 120 tcatccgggg tcagcaccgt ttctgcggac tggctttcta cgtgttccgc ttcctttagc 180 agcccttgcg ccctgagtgc ttgcggcagc gtgaagctag cttttatcgc cattcgccat 240 tcaggctgcg caactgttgg gaagggcgat cggtgcgggc ctcttcgcta ttacgccagc 300 tggcgaaagg gggatgtgct gcaaggcgat taagttgggt aacgccaggg ttttcccagt 360 cacgacgttg taaaacgacg gccagtgaat tcgagctcgg tacccgggga tcctctagag 420 tcgacctgca ggcatgcaag cttggcgtaa tcatggtcat agctgtttcc tgtgtgaaat 480 tgttatccgc tcacaattcc acacaacata cgagccggaa gcataaagtg taaagcctgg 540 ggtgcctaat gagtgagcta actcacatta attgcgttgc gctcactgcc cgctttccag 600 tcgggaaacc tgtcgtgcca gctgcattaa tgaatcggcc aacgcgcggg gagaggcggt 660 ttgcgtattg ggcgctcttc cgcttcctcg ctcactgact cgctgcgctc ggtcgttcgg 720 ctgcggcgag cggtatcagc tcactcaaag gcggtaatac ggttatccac agaatcaggg 780 gataacgcag gaaagaacat gtgagcaaaa ggccagcaaa aggccaggaa ccgtaaaaag 840 gccgcgttgc tggcgttttt ccataggctc cgcccccctg acgagcatca caaaaatcga 900 cgctcaagtc agaggtggcg aaacccgaca ggactataaa gataccaggc gtttccccct 960 ggaagctccc tcgtgcgctc tcctgttccg accctgccgc ttaccggata cctgtccgcc 1020 tttctccctt cgggaagcgt ggcgctttct caatgctcac gctgtaggta tctcagttcg 1080 gtgtaggtcg ttcgctccaa gctgggctgt gtgcacgaac cccccgttca gcccgaccgc 1140 tgcgccttat ccggtaacta tcgtcttgag tccaacccgg taagacacga cttatcgcca 1200 ctggcagcag ccactggtaa caggattagc agagcgaggt atgtaggcgg tgctacagag 1260 ttcttgaagt ggtggcctaa ctacggctac actagaagga cagtatttgg tatctgcgct 1320 ctgctgaagc cagttacctt cggaaaaaga gttggtagct cttgatccgg caaacaaacc 1380 accgctggta gcggtggttt ttttgtttgc aagcagcaga ttacgcgcag aaaaaaagga 1440 tctcaagaag atcctttgat cttttctacg gggtctgacg ctcagtggaa cgaaaactca 1500 cgttaaggga ttttggtcat gagattatca aaaaggatct tcacctagat ccttttgggg 1560 tgggcgaaga actccagcat gagatccccg cgctggagga tcatccagcc ctgatagaaa 1620 cagaagccac tggagcacct caaaaacacc atcatacact aaatcagtaa gttggcagca 1680 tcacccgacg cactttgcgc cgaataaata cctgtgacgg aagatcactt cgcagaataa 1740 ataaatcctg gtgtccctgt tgataccggg aagccctggg ccaacttttg gcgaaaatga 1800 gacgttgatc ggcacgtaag aggttccaac tttcaccata atgaaataag atcactaccg 1860 ggcgtatttt ttgagttatc gagattttca ggagctgata gaaacagaag ccactggagc 1920 acctcaaaaa caccatcata cactaaatca gtaagttggc agcatcaccc gacgcacttt 1980 gcgccgaata aatacctgtg acggaagatc acttcgcaga ataaataaat cctggtgtcc 2040 ctgttgatac cgggaagccc tgggccaact tttggcgaaa atgagacgtt gatcggcacg 2100 taagaggttc caactttcac cataatgaaa taagatcact accgggcgta ttttttgagt 2160 tatcgagatt ttcaggagct ctttggcatc gtctctcgcc tgtcccctca gttcagtaat 2220 ttcctgcatt tgcctgtttc cagtcggtag atattccaca aaacagcagg gaagcagcgc 2280 ttttccgctg cataaccctg cttcggggtc attatagcga ttttttcggt atatccatcc 2340 tttttcgcac gatatacagg attttgccaa agggttcgtg tagactttcc ttggtgtatc 2400 caacggcgtc agccgggcag gataggtgaa gtaggcccac ccgcgagcgg gtgttccttc 2460 ttcactgtcc cttattcgca cctggcggtg ctcaacggga atcctgctct gcgaggctgg 2520 ccggctaccg ccggcgtaac agatgagggc aagcggatgg ctgatgaaac caagccaacc 2580 aggaagggca gcccacctat caaggtgtac tgccttccag acgaacgaag agcgattgag 2640 gaaaaggcgg cggcggccgg catgagcctg tcggcctacc tgctggccgt cggccagggc 2700 tacaaaatca cgggcgtcgt ggactatgag cacgtccgcg agggcgtccc ggaaaacgat 2760 tccgaagccc aacctttcat agaaggcggc ggtggaatcg aaatctcgtg atggcaggtt 2820 gggcgtcgct tggtcggtca tttcgaaaaa ggttaggaat acggttagcc atttgcctgc 2880 ttttatatag ttcantatgg gattcacctt tatgttgata agaaataaaa gaaaatgcca 2940 ataggatatc ggcattttct tttgcgtttt tatttgttaa ctgttaattg tccttgttca 3000 aggatgctgt ctttgacaac agatgttttc ttgcctttga tgttcagcag gaagctcggc 3060 gcaaacgttg attgtttgtc tgcgtagaat cctctgtttg tcatatagct tgtaatcacg 3120 acattgtttc ctttcgcttg aggtacagcg aagtgtgagt aagtaaaggt tacatcgtta 3180 ggcggatcaa gatccatttt taacacaagg ccagttttgt tcagcggctt gtatgggcca 3240 gttaaagaat tagaaacata accaagcatg taaatatcgt tagacgtaat gccgtcaatc 3300 gtcatttttg atccgcggga gtcagtgaac aggtaccatt tgccgttcat tttaaagacg 3360 ttcgcgcgtt caatttcatc tgttactgtg ttagatgcaa tcagcggttt catcactttt 3420 ttcagtgtgt aatcatcgtt tagctcaatc ataccgagag cgccgtttgc taactcagcc 3480 gtgcgttttt tatcgctttg cagaagtttt tgactttctt gacggaagaa tgatgtgctt 3540 ttgccatagt atgctttgtt aaataaagat tcttcgcctt ggtagccatc ttcagttcca 3600 gtgtttgctt caaatactaa gtatttgtgg cctttatctt ctacgtagtg aggatctctc 3660 agcgtatggt tgtcgcctga gctgtagttg ccttcatcga tgaactgctg tacattttga 3720 tacgtttttc cgtcaccgtc aaagattgat ttataatcct ctacaccgtt gatgttcaaa 3780 gagctgtctg atgctgatac gttaacttgt gcagttgtca gtgtttgttt gccgtaatgt 3840 ttaccggaga aatcagtgta gaataaacgg atttttccgt cagatgtaaa tgtggctgaa 3900 cctgaccatt cttgtgtttg gtcttttagg atagaatcat ttgcatcgaa tttgtcgctg 3960 tctttaaaga cgcggccagc gtttttccag ctgtcaatag aagtttcgcc gactttttga 4020 tagaacatgt aaatcgatgt gtcatccgca tttttaggat ctccggctaa tgcaaagacg 4080 atgtggtagc cgtgatagtt tgcgacagtg ccgtcagcgt tttgtaatgg ccagctgtcc 4140 caaacgtcca ggccttttgc agaagagata tttttaattg tggacgaatc aaattcagaa 4200 acttgatatt tttcattttt ttgctgttca gggatttgca gcatatcatg gcgtgtaata 4260 tgggaaatgc cgtatgtttc cttatatggc ttttggttcg tttctttcgc aaacgcttga 4320 gttgcgcctc ctgccagcag tgcggtagta aaggttaata ctgttgcttg ttttgcaaac 4380 tttttgatgt tcatcgttca tgtctccttt tttatgtact gtgttagcgg tctgcttctt 4440 ccagccctcc tgtttgaaga tggcaagtta gttacgcaca ataaaaaaag acctaaaata 4500 tgtaaggggt gacgccaaag tatacacttt gccctttaca cattttaggt cttgcctgct 4560 ttatcagtaa caaacccgcg cgatttactt ttcgacctca ttctattaga ctctcgtttg 4620 gattgcaact ggtctatttt cctcttttgt ttgatagaaa atcataaaag gatttgcaga 4680 ctacgggcct aaagaactaa aaaatctatc tgtttctttt cattctctgt attttttata 4740 gtttctgttg catgggcata aagttgcctt tttaatcaca attcagaaaa tatcataata 4800 tctcatttca ctaaataata gtgaacggca ggtatatgtg atgggttaaa aaggatcacc 4860 ccagagtccc gctcagaaga actcgtcaag aaggcgatag aaggcgatgc gctgcgaatc 4920 gggagcggcg ataccgtaaa gcacgaggaa gcggtcagcc cattcgccgc caagctcttc 4980 agcaatatca cgggtagcca acgctatgtc ctgatagcgg tccgccacac ccagccggcc 5040 acagtcgatg aatccagaaa agcggccatt ttccaccatg atattcggca agcaggcatc 5100 gccatgggtc acgacgagat cctcgccgtc gggcatccgc gccttgagcc tggcgaacag 5160 ttcggctggc gcgagcccct gatgctcttc gtccagatca tcctgatcga caagaccggc 5220 ttccatccga gtacgtgctc gctcgatgcg atgtttcgct tggtggtcga atgggcaggt 5280 agccggatca agcgtatgca gccgccgcat tgcatcagcc atgatggata ctttctcggc 5340 aggagcaagg tgagatgaca ggagatcctg ccccggcact tcgcccaata gcagccagtc 5400 ccttcccgct tcagtgacaa cgtcgagaca gctgcgcaag gaacgcccgt cgtggccagc 5460 cacgatagcc gcgctgcctc gtcttggagt tcattcaggg caccggacag gtcggtcttg 5520 acaaaaagaa ccgggcgccc ctgcgctgac agccggaaca cggcggcatc agagcagccg 5580 attgtctgtt gtgcccagtc atagccgaat agcctctcca cccaagcggc cggagaacct 5640 gcgtgcaatc catcttgttc aatcatgcga aacgatcctc atcctgtctc ttgatcagat 5700 cttgatcccc tgcgccatca gatccttggc ggcaagaaag ccatccagtt tactttgcag 5760 ggcttcccaa ccttaccaga gggcgcccca gctggcaatt ccg 5803 <210> 15 <211> 44 <212> DNA <213> Artificial Sequence <220> <223> primer 1 <400> 15 tcgagctcgg tacccccgtt cgtatgatcg gttccgcaca ggcc 44 <210> 16 <211> 31 <212> DNA <213> Artificial Sequence <220> <223> primer 2 <400> 16 gtgcagcagg caaccacatc aaccgcccac g 31 <210> 17 <211> 31 <212> DNA <213> Artificial Sequence <220> <223> primer 3 <400> 17 cgtgggcggt tgatgtggtt gcctgctgca c 31 <210> 18 <211> 46 <212> DNA <213> Artificial Sequence <220> <223> primer 4 <400> 18 ctctagagga tccccgccgt aagcagcctc tggtggaatg gtcagc 46 <210> 19 <211> 31 <212> DNA <213> Artificial Sequence <220> <223> primer 5 <400> 19 gtgcagcagg caactggatc aaccgcccac g 31 <210> 20 <211> 31 <212> DNA <213> Artificial Sequence <220> <223> primer 6 <400> 20 cgtgggcggt tgatccagtt gcctgctgca c 31 <210> 21 <211> 31 <212> DNA <213> Artificial Sequence <220> <223> primer 7 <400> 21 gtgcagcagg caacggcatc aaccgcccac g 31 <210> 22 <211> 31 <212> DNA <213> Artificial Sequence <220> <223> primer 8 <400> 22 cgtgggcggt tgatgccgtt gcctgctgca c 31 <210> 23 <211> 29 <212> DNA <213> Artificial Sequence <220> <223> primer 9 <400> 23 ccgttcgtat gatcggttcc gcacaggcc 29 <210> 24 <211> 31 <212> DNA <213> Artificial Sequence <220> <223> primer 10 <400> 24 gccgtaagca gcctctggtg gaatggtcag c 31 <210> 25 <211> 172 <212> PRT <213> Unknown <220> <223> IlvN AA <400> 25 Met Ala Asn Ser Asp Val Thr Arg His Ile Leu Ser Val Leu Val Gln 1 5 10 15 Asp Val Asp Gly Ile Ile Ser Arg Val Ser Gly Met Phe Thr Arg Arg 20 25 30 Ala Phe Asn Leu Val Ser Leu Val Ser Ala Lys Thr Glu Thr Leu Gly 35 40 45 Ile Asn Arg Ile Thr Val Val Val Asp Ala Asp Glu Leu Asn Ile Glu 50 55 60 Gln Ile Thr Lys Gln Leu Asn Lys Leu Ile Pro Val Leu Lys Val Val 65 70 75 80 Arg Leu Asp Glu Glu Thr Thr Ile Ala Arg Ala Ile Met Leu Val Lys 85 90 95 Val Ser Ala Asp Ser Thr Asn Arg Pro Gln Ile Val Asp Ala Ala Asn 100 105 110 Ile Phe Arg Ala Arg Val Val Asp Val Ala Pro Asp Ser Val Val Ile 115 120 125 Glu Ser Thr Gly Thr Pro Gly Lys Leu Arg Ala Leu Leu Asp Val Met 130 135 140 Glu Pro Phe Gly Ile Arg Glu Leu Ile Gln Ser Gly Gln Ile Ala Leu 145 150 155 160 Asn Arg Gly Pro Lys Thr Met Ala Pro Ala Lys Ile 165 170 <210> 26 <211> 520 <212> DNA <213> Unknown <220> <223> IlvN NT <400> 26 atggctaatt ctgacgtcac ccgccacatc ctgtccgtac tcgttcagga cgtagacgga 60 atcatttccc gcgtatcagg tatgttcacc cgacgcgcat tcaacctcgt gtccctcgtg 120 tctgcaaaga ccgaaacact cggcatcaac cgcatcacgg ttgttgtcga cgccgacgag 180 ctcaacattg agcagatcac caagcagctc aacaagctga tccccgtgct caaagtcgtg 240 cgacttgatg aagagaccac catcgcccgc gcaatcatgc tggttaaggt ctctgcggat 300 agcaccaacc gtccgcagat cgtcgacgcc gcgaacatct tccgcgcccg agtcgtcgac 360 gtggctccag actctgtggt tattgaatcc acaggcaccc caggcaagct ccgcgcactg 420 cttgatgtga tggaaccatt cggaatccgc gaactgatcc aatccggaca gattgcactc 480 aaccgcggtc cgaagaccat ggctccggcc aagatctaaa 520 <210> 27 <211> 172 <212> PRT <213> Artificial Sequence <220> <223> IlvN A42V AA <400> 27 Met Ala Asn Ser Asp Val Thr Arg His Ile Leu Ser Val Leu Val Gln 1 5 10 15 Asp Val Asp Gly Ile Ile Ser Arg Val Ser Gly Met Phe Thr Arg Arg 20 25 30 Ala Phe Asn Leu Val Ser Leu Val Ser Val Lys Thr Glu Thr Leu Gly 35 40 45 Ile Asn Arg Ile Thr Val Val Val Asp Ala Asp Glu Leu Asn Ile Glu 50 55 60 Gln Ile Thr Lys Gln Leu Asn Lys Leu Ile Pro Val Leu Lys Val Val 65 70 75 80 Arg Leu Asp Glu Glu Thr Thr Ile Ala Arg Ala Ile Met Leu Val Lys 85 90 95 Val Ser Ala Asp Ser Thr Asn Arg Pro Gln Ile Val Asp Ala Ala Asn 100 105 110 Ile Phe Arg Ala Arg Val Val Asp Val Ala Pro Asp Ser Val Val Ile 115 120 125 Glu Ser Thr Gly Thr Pro Gly Lys Leu Arg Ala Leu Leu Asp Val Met 130 135 140 Glu Pro Phe Gly Ile Arg Glu Leu Ile Gln Ser Gly Gln Ile Ala Leu 145 150 155 160 Asn Arg Gly Pro Lys Thr Met Ala Pro Ala Lys Ile 165 170 <210> 28 <211> 519 <212> DNA <213> Artificial Sequence <220> <223> IlvN A42V NT <400> 28 atggctaatt ctgacgtcac ccgccacatc ctgtccgtac tcgttcagga cgtagacgga 60 atcatttccc gcgtatcagg tatgttcacc cgacgcgcat tcaacctcgt gtccctcgtg 120 tctgtaaaga ccgaaacact cggcatcaac cgcatcacgg ttgttgtcga cgccgacgag 180 ctcaacattg agcagatcac caagcagctc aacaagctga tccccgtgct caaagtcgtg 240 cgacttgatg aagagaccac catcgcccgc gcaatcatgc tggttaaggt ctctgcggat 300 agcaccaacc gtccgcagat cgtcgacgcc gcgaacatct tccgcgcccg agtcgtcgac 360 gtggctccag actctgtggt tattgaatcc acaggcaccc caggcaagct ccgcgcactg 420 cttgatgtga tggaaccatt cggaatccgc gaactgatcc aatccggaca gattgcactc 480 aaccgcggtc cgaagaccat ggctccggcc aagatctaa 519 <210> 29 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> primer 11 <400> 29 tcgagctcgg tacccccgcg tcaccaaagc gga 33 <210> 30 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> primer 12 <400> 30 gtccctcgtg tctgtaaaga ccgaaacact 30 <210> 31 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> primer 13 <400> 31 agtgtttcgg tctttacaga cacgagggac 30 <210> 32 <211> 35 <212> DNA <213> Artificial Sequence <220> <223> primer 14 <400> 32 ctctagagga tccccttaga tcttggccgg agcca 35 <210> 33 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> primer 15 <400> 33 ccgcgtcacc aaagcgga 18 <210> 34 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> primer 16 <400> 34 ttagatcttg gccggagcca 20 <210> 35 <211> 418 <212> PRT <213> Unknown <220> <223> YjeH AA <400> 35 Met Ser Gly Leu Lys Gln Glu Leu Gly Leu Ala Gln Gly Ile Gly Leu 1 5 10 15 Leu Ser Thr Ser Leu Leu Gly Thr Gly Val Phe Ala Val Pro Ala Leu 20 25 30 Ala Ala Leu Val Ala Gly Asn Asn Ser Leu Trp Ala Trp Pro Val Leu 35 40 45 Ile Ile Leu Val Phe Pro Ile Ala Ile Val Phe Ala Ile Leu Gly Arg 50 55 60 His Tyr Pro Ser Ala Gly Gly Val Ala His Phe Val Gly Met Ala Phe 65 70 75 80 Gly Ser Arg Leu Glu Arg Val Thr Gly Trp Leu Phe Leu Ser Val Ile 85 90 95 Pro Val Gly Leu Pro Ala Ala Leu Gln Ile Ala Ala Gly Phe Gly Gln 100 105 110 Ala Met Phe Gly Trp His Ser Trp Gln Leu Leu Leu Ala Glu Leu Gly 115 120 125 Thr Leu Ala Leu Val Trp Tyr Ile Gly Thr Arg Gly Ala Ser Ser Ser 130 135 140 Ala Asn Leu Gln Thr Val Ile Ala Gly Leu Ile Val Ala Leu Ile Val 145 150 155 160 Ala Ile Trp Trp Ala Gly Asp Ile Lys Pro Ala Asn Ile Pro Phe Pro 165 170 175 Ala Pro Gly Asn Ile Glu Leu Thr Gly Leu Phe Ala Ala Leu Ser Val 180 185 190 Met Phe Trp Cys Phe Val Gly Leu Glu Ala Phe Ala His Leu Ala Ser 195 200 205 Glu Phe Lys Asn Pro Glu Arg Asp Phe Pro Arg Ala Leu Met Ile Gly 210 215 220 Leu Leu Leu Ala Gly Leu Val Tyr Trp Gly Cys Thr Val Val Val Leu 225 230 235 240 His Phe Asp Ala Tyr Gly Glu Lys Met Ala Ala Ala Ala Ser Leu Pro 245 250 255 Lys Ile Val Val Gln Leu Phe Gly Val Gly Ala Leu Trp Ile Ala Cys 260 265 270 Val Ile Gly Tyr Leu Ala Cys Phe Ala Ser Leu Asn Ile Tyr Ile Gln 275 280 285 Ser Phe Ala Arg Leu Val Trp Ser Gln Ala Gln His Asn Pro Asp His 290 295 300 Tyr Leu Ala Arg Leu Ser Ser Arg His Ile Pro Asn Asn Ala Leu Asn 305 310 315 320 Ala Val Leu Gly Cys Cys Val Val Ser Thr Leu Val Ile His Ala Leu 325 330 335 Glu Ile Asn Leu Asp Ala Leu Ile Ile Tyr Ala Asn Gly Ile Phe Ile 340 345 350 Met Ile Tyr Leu Leu Cys Met Leu Ala Gly Cys Lys Leu Leu Gln Gly 355 360 365 Arg Tyr Arg Leu Leu Ala Val Val Gly Gly Leu Leu Cys Val Leu Leu 370 375 380 Leu Ala Met Val Gly Trp Lys Ser Leu Tyr Ala Leu Ile Met Leu Ala 385 390 395 400 Gly Leu Trp Leu Leu Leu Pro Lys Arg Lys Thr Pro Glu Asn Gly Ile 405 410 415 Thr Thr <210> 36 <211> 1257 <212> DNA <213> Unknown <220> <223> YjeH NT <400> 36 atgagtggac tcaaacaaga actggggctg gcccagggca ttggcctgct atcgacgtca 60 ttattaggca ctggcgtgtt tgccgttcct gcgttagctg cgctggtagc gggcaataac 120 agcctgtggg cgtggcccgt tttgattatc ttagtgttcc cgattgcgat tgtgtttgcg 180 attctgggtc gccactatcc cagcgcaggc ggcgtcgcgc acttcgtcgg tatggcgttt 240 ggttcgcggc ttgagcgagt caccggctgg ctgtttttat cggtcattcc cgtgggtttg 300 cctgccgcac tacaaattgc cgccgggttc ggccaggcga tgtttggctg gcatagctgg 360 caactgttgt tggcagaact cggtacgctg gcgctggtgt ggtatatcgg tactcgcggt 420 gccagttcca gtgctaatct acaaaccgtt attgccggac ttatcgtcgc gctgattgtc 480 gctatctggt gggcgggcga tatcaaacct gcgaatatcc cctttccggc acctggtaat 540 atcgaactta ccgggttatt tgctgcgtta tcagtgatgt tctggtgttt tgtcggtctg 600 gaggcatttg cccatctcgc ctcggaattt aaaaatccag agcgtgattt tcctcgtgct 660 ttgatgattg gtctgctgct ggcaggatta gtctactggg gctgtacggt agtcgtctta 720 cacttcgacg cctatggtga aaaaatggcg gcggcagcat cgcttccaaa aattgtagtg 780 cagttgttcg gtgtaggagc gttatggatt gcctgcgtga ttggctatct ggcctgcttt 840 gccagtctca acatttatat acagagcttc gcccgcctgg tctggtcgca ggcgcaacat 900 aatcctgacc actacctggc acgcctctct tctcgccata tcccgaataa tgccctcaat 960 gcggtgctcg gctgctgtgt ggtgagcact ttggtgattc atgctttaga gatcaatctg 1020 gacgctctta ttatttatgc caatggcatc tttattatga tttatctgtt atgcatgctg 1080 gcaggctgta aattattgca aggacgttat cgactactgg cggtggttgg cgggctgtta 1140 tgcgttctgt tactggcaat ggtcggctgg aaaagtctct atgcgctgat catgctggcg 1200 gggttatggc tgttgctgcc aaaacgaaaa acgccggaaa atggcataac cacataa 1257 <210> 37 <211> 88 <212> PRT <213> Unknown <220> <223> NCgl2335 AA <400> 37 Met Ala Tyr Thr Phe Asp His Val Val Ala Trp Arg Trp Cys Thr Lys 1 5 10 15 Glu Asp Ala Tyr Asn Tyr Thr His Leu Phe Asp Gln Leu Gln Pro Pro 20 25 30 Leu Ile Val Thr Thr Asp Gly Gln Lys Arg Arg Thr Gln Ser His His 35 40 45 His Asp Leu Ala Asp Asn Glu Asn Pro Thr Leu Pro Arg Pro Arg Gln 50 55 60 Thr Gln Arg Pro Lys Thr Arg His Pro Lys Thr Arg Ala Glu Leu Ala 65 70 75 80 Glu Lys His Ser Gly Val Ser Pro 85 <210> 38 <211> 267 <212> DNA <213> Unknown <220> <223> NCgl2335 NT <400> 38 gtggcctaca ccttcgacca cgtcgtcgcc tggcgctggt gcaccaaaga agacgcctac 60 aactacaccc acctcttcga tcaactccaa ccacccttaa tcgtgaccac cgacggacaa 120 aaaaggcgca ctcaaagcca tcaccacgac ctggccgaca acgaaaatcc aacgctgcct 180 cgtccacgtc aaacgcaacg tccaaaaaca cgtcacccta agacccgtgc tgagctcgcc 240 gaaaagcact ccggggtctc tccttga 267 <210> 39 <211> 39 <212> DNA <213> Artificial Sequence <220> <223> Tn_5 F <400> 39 tgaattcgag ctcggtaccc caccgacgcg catctgcct 39 <210> 40 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Tn_5 R <400> 40 ggtgtggtga ctttcagcag ttcccggggg ggaggaggca tgtggtgttg 50 <210> 41 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Tn_3 F <400> 41 caacaccaca tgcctcctcc cccccgggaa ctgctgaaag tcaccacacc 50 <210> 42 <211> 42 <212> DNA <213> Artificial Sequence <220> <223> Tn_3 R <400> 42 gtcgactcta gaggatcccc ctcccaaacc attgaggaat gg 42 <210> 43 <211> 39 <212> DNA <213> Artificial Sequence <220> <223> CJ7_yjeH F <400> 43 acaccacatg cctcctcccc agaaacatcc cagcgctac 39 <210> 44 <211> 43 <212> DNA <213> Artificial Sequence <220> <223> CJ7_yjeH R <400> 44 agttcttgtt tgagtccact catagtgttt cctttcgttg ggt 43 <210> 45 <211> 44 <212> DNA <213> Artificial Sequence <220> <223> yjeH F <400> 45 acccaacgaa aggaaacact atgagtggac tcaaacaaga actg 44 <210> 46 <211> 44 <212> DNA <213> Artificial Sequence <220> <223> yjeH R <400> 46 gactttcagc agttcccggg ttatgtggtt atgccatttt ccgg 44 <210> 47 <211> 418 <212> PRT <213> Artificial Sequence <220> <223> yjeH F351L AA <400> 47 Met Ser Gly Leu Lys Gln Glu Leu Gly Leu Ala Gln Gly Ile Gly Leu 1 5 10 15 Leu Ser Thr Ser Leu Leu Gly Thr Gly Val Phe Ala Val Pro Ala Leu 20 25 30 Ala Ala Leu Val Ala Gly Asn Asn Ser Leu Trp Ala Trp Pro Val Leu 35 40 45 Ile Ile Leu Val Phe Pro Ile Ala Ile Val Phe Ala Ile Leu Gly Arg 50 55 60 His Tyr Pro Ser Ala Gly Gly Val Ala His Phe Val Gly Met Ala Phe 65 70 75 80 Gly Ser Arg Leu Glu Arg Val Thr Gly Trp Leu Phe Leu Ser Val Ile 85 90 95 Pro Val Gly Leu Pro Ala Ala Leu Gln Ile Ala Ala Gly Phe Gly Gln 100 105 110 Ala Met Phe Gly Trp His Ser Trp Gln Leu Leu Leu Ala Glu Leu Gly 115 120 125 Thr Leu Ala Leu Val Trp Tyr Ile Gly Thr Arg Gly Ala Ser Ser Ser 130 135 140 Ala Asn Leu Gln Thr Val Ile Ala Gly Leu Ile Val Ala Leu Ile Val 145 150 155 160 Ala Ile Trp Trp Ala Gly Asp Ile Lys Pro Ala Asn Ile Pro Phe Pro 165 170 175 Ala Pro Gly Asn Ile Glu Leu Thr Gly Leu Phe Ala Ala Leu Ser Val 180 185 190 Met Phe Trp Cys Phe Val Gly Leu Glu Ala Phe Ala His Leu Ala Ser 195 200 205 Glu Phe Lys Asn Pro Glu Arg Asp Phe Pro Arg Ala Leu Met Ile Gly 210 215 220 Leu Leu Leu Ala Gly Leu Val Tyr Trp Gly Cys Thr Val Val Val Leu 225 230 235 240 His Phe Asp Ala Tyr Gly Glu Lys Met Ala Ala Ala Ala Ser Leu Pro 245 250 255 Lys Ile Val Val Gln Leu Phe Gly Val Gly Ala Leu Trp Ile Ala Cys 260 265 270 Val Ile Gly Tyr Leu Ala Cys Phe Ala Ser Leu Asn Ile Tyr Ile Gln 275 280 285 Ser Phe Ala Arg Leu Val Trp Ser Gln Ala Gln His Asn Pro Asp His 290 295 300 Tyr Leu Ala Arg Leu Ser Ser Arg His Ile Pro Asn Asn Ala Leu Asn 305 310 315 320 Ala Val Leu Gly Cys Cys Val Val Ser Thr Leu Val Ile His Ala Leu 325 330 335 Glu Ile Asn Leu Asp Ala Leu Ile Ile Tyr Ala Asn Gly Ile Leu Ile 340 345 350 Met Ile Tyr Leu Leu Cys Met Leu Ala Gly Cys Lys Leu Leu Gln Gly 355 360 365 Arg Tyr Arg Leu Leu Ala Val Val Gly Gly Leu Leu Cys Val Leu Leu 370 375 380 Leu Ala Met Val Gly Trp Lys Ser Leu Tyr Ala Leu Ile Met Leu Ala 385 390 395 400 Gly Leu Trp Leu Leu Leu Pro Lys Arg Lys Thr Pro Glu Asn Gly Ile 405 410 415 Thr Thr <210> 48 <211> 1257 <212> DNA <213> Artificial Sequence <220> <223> yjeH F351L NT <400> 48 atgagtggac tcaaacaaga actggggctg gcccagggca ttggcctgct atcgacgtca 60 ttattaggca ctggcgtgtt tgccgttcct gcgttagctg cgctggtagc gggcaataac 120 agcctgtggg cgtggcccgt tttgattatc ttagtgttcc cgattgcgat tgtgtttgcg 180 attctgggtc gccactatcc cagcgcaggc ggcgtcgcgc acttcgtcgg tatggcgttt 240 ggttcgcggc ttgagcgagt caccggctgg ctgaatttat cggtcattcc cgtgggtttg 300 cctgccgcac tacaaattgc cgccgggttc ggccaggcga tgtttggctg gcatagctgg 360 caactgttgt tggcagaact cggtacgctg gcgctggtgt ggtatatcgg tactcgcggt 420 gccagttcca gtgctaatct acaaaccgtt attgccggac ttatcgtcgc gctgattgtc 480 gctatctggt gggcgggcga tatcaaacct gcgaatatcc cctttccggc acctggtaat 540 atcgaactta ccgggttatt tgctgcgtta tcagtgatgt tctggtgttt tgtcggtctg 600 gaggcatttg cccatctcgc ctcggaattt aaaaatccag agcgtgattt tcctcgtgct 660 ttgatgattg gtctgctgct ggcaggatta gtctactggg gctgtacggt agtcgtctta 720 cacttcgacg cctatggtga aaaaatggcg gcggcagcat cgcttccaaa aattgtagtg 780 cagttgttcg gtgtaggagc gttatggatt gcctgcgtga ttggctatct ggcctgcttt 840 gccagtctca acatttatat acagagcttc gcccgcctgg tctggtcgca ggcgcaacat 900 aatcctgacc actacctggc acgcctctct tctcgccata tcccgaataa tgccctcaat 960 gcggtgctcg gctgctgtgt ggtgagcact ttggtgattc atgctttaga gatcaatctg 1020 gacgctctta ttatttatgc caatggcatc cttattatga tttatctgtt atgcatgctg 1080 gcaggctgta aattattgca aggacgttat cgactactgg cggtggttgg cgggctgtta 1140 tgcgttctgt tactggcaat ggtcggctgg aaaagtctct atgcgctgat catgctggcg 1200 gggttatggc tgttgctgcc aaaacgaaaa acgccggaaa atggcataac cacataa 1257 <210> 49 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> F351L F <400> 49 caatggcatc cttattatga ttt 23 <210> 50 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> F351L R <400> 50 aaatcataat aaggatgcca ttg 23 <210> 51 <211> 127 <212> PRT <213> Artificial Sequence <220> <223> General formula 1(GltA 289~415) <220> <221> MISC_FEATURE <222> (1) <223> Xaa is N or S. <220> <221> MISC_FEATURE <222> (9) <223> Xaa is A or E. <220> <221> MISC_FEATURE <222> (73) <223> Xaa is Y or C. <400> 51 Xaa Asn His Gly Gly Asp Ala Thr Xaa Phe Met Asn Lys Val Lys Asn 1 5 10 15 Lys Glu Asp Gly Val Arg Leu Met Gly Phe Gly His Arg Val Tyr Lys 20 25 30 Asn Tyr Asp Pro Arg Ala Ala Ile Val Lys Glu Thr Ala His Glu Ile 35 40 45 Leu Glu His Leu Gly Gly Asp Asp Leu Leu Asp Leu Ala Ile Lys Leu 50 55 60 Glu Glu Ile Ala Leu Ala Asp Asp Xaa Phe Ile Ser Arg Lys Leu Tyr 65 70 75 80 Pro Asn Val Asp Phe Tyr Thr Gly Leu Ile Tyr Arg Ala Met Gly Phe 85 90 95 Pro Thr Asp Phe Phe Thr Val Leu Phe Ala Ile Gly Arg Leu Pro Gly 100 105 110 Trp Ile Ala His Tyr Arg Glu Gln Leu Gly Ala Ala Gly Asn His 115 120 125

Claims

서열번호 1의 아미노산 서열의 415번째 위치에 상응하는 아미노산인 리신이 히스티딘으로 치환된, 시트레이트 신타아제 변이체.
제1항에 있어서, 상기 변이체는 서열번호 3의 아미노산 서열로 기재된 폴리펩티드를 포함하는, 변이체.
제1항에 있어서, 상기 변이체는 하기의 일반식 1의 아미노산 서열로 기재된 폴리펩티드를 포함하는, 변이체:
[일반식 1]
X₁N HGGDATX₂FMN KVKNKEDGVR LMGFGHRVYK NYDPRAAIVK ETAHEILEHL GGDDLLDLAI KLEEIALADD X₃FISRKLYPN VDFYTGLIYR AMGFPTDFFT VLFAIGRLPG WIAHYREQLG AAGNH (서열번호 51);
여기서 상기 일반식 1의 X₁은 아스파라긴 또는 세린이고,
X₂는 알라닌 또는 글루탐산이고,
X₃은 티로신 또는 시스테인.
제1항에 있어서, 상기 변이체는 서열번호 8, 10 또는 12의 아미노산 서열과 99% 이상의 서열 동일성을 가진, 변이체.
제1항 내지 제4항 중 어느 한 항의 변이체를 코딩하는 폴리뉴클레오티드.
서열번호 1의 아미노산 서열의 415번째 위치에 상응하는 아미노산인 리신이 히스티딘으로 치환된 시트레이트 신타아제 변이체 또는 상기 변이체를 코딩하는 폴리뉴클레오티드를 포함하는, 코리네박테리움 속 미생물.
제6항에 있어서, 상기 미생물은 L-발린 또는 O-아세틸-L-호모세린 생산능을 가지는, 미생물.
제6항에 있어서, 상기 미생물은 코리네박테리움 글루타미쿰인, 미생물.
서열번호 1의 아미노산 서열의 415번째 위치에 상응하는 아미노산인 리신이 히스티딘으로 치환된 시트레이트 신타아제 변이체 또는 상기 변이체를 코딩하는 폴리뉴클레오티드를 포함하는 코리네박테리움 속 미생물을 배지에서 배양하는 단계를 포함하는, L-아미노산 생산 방법.
제9항에 있어서, 상기 방법은 배양된 배지 또는 미생물에서 L-아미노산을 회수하는 단계를 추가로 포함하는, L-아미노산 생산 방법.
제9항에 있어서, 상기 L-아미노산은 L-발린, O-아세틸-L-호모세린 또는 L-메티오닌인, L-아미노산 생산 방법.