KR20220107795A

KR20220107795A - aroG 알돌라아제 (Phospho-2-dehydro-3-deoxyheptonate aldolase) 변이체 및 이를 이용한 분지쇄 아미노산 생산 방법

Info

Publication number: KR20220107795A
Application number: KR1020210010911A
Authority: KR
Inventors: 이하윤; 김주은; 이지혜; 이희석; 김경림
Original assignee: 씨제이제일제당 (주)
Priority date: 2021-01-26
Filing date: 2021-01-26
Publication date: 2022-08-02
Also published as: CN116867895A; WO2022163981A1; MX2023007935A; EP4249593A1; CA3205759A1; KR102495918B1; US20240093163A1; JP2024502989A; AU2021423180A1; AR124413A1

Abstract

본 출원은 aroG 알돌라아제 (Phospho-2-dehydro-3-deoxyheptonate aldolase) 변이체, 이를 포함하는 미생물 및 이를 이용한 아미노산 생산 방법에 관한 것이다.

Description

aroG 알돌라아제 (Phospho-2-dehydro-3-deoxyheptonate aldolase) 변이체 및 이를 이용한 분지쇄 아미노산 생산 방법{Phospho-2-dehydro-3-deoxyheptonate aldolase variant and method for producing branched amino acid using the same}

본 출원은 aroG 알돌라아제 (Phospho-2-dehydro-3-deoxyheptonate aldolase) 변이체 및 이를 이용한 분지쇄 아미노산 생산 방법에 관한 것이다.

L-아미노산은 단백질의 기본 구성단위로서, 약품 원료와 식품첨가제, 동물 사료, 영양제, 살충제, 살균제 등의 중요 소재로 사용된다. 따라서 아미노산을 산업적으로 생산하는 것은 경제적으로 중요한 산업 공정이 되어 왔다.

아미노산을 효율적으로 생산하기 위한 다양한 연구, 예를 들어, 아미노산 고효율 생산 미생물이나 발효공정 기술을 개발하기 위한 노력이 이루어지고 있다. 구체적으로, 코리네박테리움 속 균주에서 아미노산 생합성에 관여하는 효소를 암호화하는 유전자의 발현을 증가시키거나 또는 아미노산 생합성에 불필요한 유전자를 제거하는 것과 같은 목적 물질 특이적인 접근 방법이 개발되었고(US 9109242 B2), 이러한 방법 이외에 아미노산 생산에 관여하지 않는 유전자를 제거하는 방법, 아미노산 생산에 있어 구체적으로 기능이 알려지지 않은 유전자를 제거하는 방법 또한 활용되고 있다.

한편 아미노산 중, 분지쇄 아미노산(branched-chain amino acid)은 발린, 류신, 이소류신의 3종을 지칭하며, 주로 근육에서 대사되어 활동 시에 에너지원으로 사용된다고 알려져 있다. 분지쇄 아미노산이 활동 시 근육 유지 및 증량에 중요한 역할을 한다고 알려지면서 그 사용량이 증가하고 있다. 그러나 분지쇄 아미노산 생합성 경로에서는 부산물이 다량 생성되게 되므로, 분지쇄 아미노산을 고수율, 고순도로 생산하기 위해서는 부산물의 생성량을 저감시키는 것이 중요하다.

이러한 배경 하에, 본 발명자들은 종래에 비해 수율이 우수하고 부산물 생산량이 적은 분지쇄 아미노산 생산방법 개발을 위해 예의 노력한 결과, 발린, 류신, 이소류신 생산능을 증가시키는 aroG 알돌라아제 (Phospho-2-dehydro-3-deoxyheptonate aldolase) 변이체를 발굴하여 본 출원을 완성하였다.

본 출원의 목적은 서열번호 1의 아미노산 서열에서 N-말단으로부터 217번, 310번, 403번 및 462번 위치에 상응하는 아미노산 중 어느 하나 이상의 아미노산이 다른 아미노산으로 치환된, aroG 알돌라아제 (Phospho-2-dehydro-3-deoxyheptonate aldolase) 변이체를 제공하는 것이다.

본 출원의 다른 목적은 상기 변이체를 코딩하는 폴리뉴클레오티드 및 이를 포함하는 벡터를 제공하는 것이다.

본 출원의 또 다른 목적은 상기 변이체, 폴리뉴클레오티드 및 벡터 중 하나 이상을 포함하는 코리네박테리움 속 미생물을 제공하는 것이다.

본 출원의 또 다른 목적은 상기 미생물을 배지에서 배양하는 단계를 포함하는, 분지쇄 아미노산 생산 방법을 제공하는 것이다.

이를 구체적으로 설명하면 다음과 같다. 한편, 본 출원에서 개시된 각각의 설명 및 실시형태는 각각의 다른 설명 및 실시 형태에도 적용될 수 있다. 즉, 본 출원에서 개시된 다양한 요소들의 모든 조합이 본 출원의 범주에 속한다. 또한, 하기 기술된 구체적인 서술에 의하여 본 출원의 범주가 제한된다고 볼 수 없다.

또한, 당해 기술분야의 통상의 지식을 가진 자는 통상의 실험만을 사용하여 본 출원에 기재된 본 출원의 특정 양태에 대한 다수의 등가물을 인지하거나 확인할 수 있다. 또한, 이러한 등가물은 본 출원에 포함되는 것으로 의도된다.

본 출원의 하나의 양태는 서열번호 1의 아미노산 서열에서 N-말단으로부터 217번, 310번, 403번 및 462번 위치에 상응하는 아미노산 중 어느 하나 이상의 아미노산이 다른 아미노산으로 치환된, aroG 알돌라아제 (Phospho-2-dehydro-3-deoxyheptonate aldolase) 변이체를 제공한다.

상기 aroG 알돌라아제 변이체는, aroG 알돌라아제 활성을 갖는 폴리펩티드 또는 aroG 알돌라아제에서, 서열번호 1의 aroG 알돌라아제의 N-말단으로부터 217번, 310번, 403번 및 462번 위치에 상응하는 아미노산 중 어느 하나 이상의 아미노산이 다른 아미노산으로 치환된 변이체를 의미한다.

본 출원에서, "aroG 알돌라아제"는 다음의 반응을 촉매할 수 있는 효소이다.

phosphoenolpyruvate + D-erythrose 4-phosphate + H2O ↔ 3-deoxy-D-arabino-hept-2-ulosonate 7-phosphate + phosphate

본 출원의 aroG 알돌라아제는 본 출원에서 제공하는 aroG 알돌라아제 변이체를 제조하기 위해 변형이 가해지는 aroG 알돌라아제 또는 aroG 알돌라아제 활성을 갖는 폴리펩티드일 수 있다. 구체적으로, 자연적으로 발생하는 폴리펩티드 또는 야생형 폴리펩티드일 수 있고, 이의 성숙 폴리펩티드일 수 있으며, 이의 변이체 또는 기능적 단편을 포함할 수 있으나 본 출원의 aroG 알돌라아제 변이체의 모체(parent)가 될 수 있는 한 제한 없이 포함된다.

본 출원에서 상기 aroG 알돌라아제는 이에 제한되지는 않으나, 서열번호 1의 폴리펩티드일 수 있다. 일 구현예로, 서열번호 1의 폴리펩티드와 약 60%, 70%, 75%. 80%. 85%, 90%, 95%, 96%, 97%, 98% 또는 99% 이상의 서열 동일성을 갖는 폴리펩티드일 수 있으며, 서열번호 1의 아미노산 서열로 이루어진 폴리펩티드와 동일 혹은 상응하는 활성을 가지는 경우라면 제한 없이 aroG 알돌라아제 범위에 포함된다.

본 출원의 aroG 알돌라아제는 공지의 데이터 베이스인 NCBI의 GenBank에서 그 서열을 얻을 수 있다. 구체적으로 aroG 유전자에 의해 코딩되는 폴리펩티드일 수 있으나, 이에 제한되지 않는다.

본 출원에서, "변이체"는 하나 이상의 아미노산이 보존적 치환(conservative substitution) 및/또는 변형(modification)되어 상기 변이체의 변이 전 아미노산 서열과 상이하나 기능(functions) 또는 특성(properties)이 유지되는 폴리펩티드를 지칭한다. 이러한 변이체는 일반적으로 상기 폴리펩티드의 아미노산 서열 중 하나 이상의 아미노산을 변형하고, 상기 변형된 폴리펩티드의 특성을 평가하여 동정(identify)될 수 있다. 즉, 변이체의 능력은 변이 전 폴리펩티드에 비하여 증가되거나, 변하지 않거나, 또는 감소될 수 있다. 또한, 일부 변이체는 N-말단 리더 서열 또는 막전이 도메인(transmembrane domain)과 같은 하나 이상의 부분이 제거된 변이체를 포함할 수 있다. 다른 변이체는 성숙 단백질(mature protein)의 N- 및/또는 C-말단으로부터 일부분이 제거된 변이체를 포함할 수 있다. 상기 용어 "변이체"는 변이형, 변형, 변이형 폴리펩티드, 변이된 단백질, 변이 및 변이체 등의 용어(영문 표현으로는 modification, modified polypeptide, modified protein, mutant, mutein, divergent 등)가 혼용되어 사용될 수 있으며, 변이된 의미로 사용되는 용어라면 이에 제한되지 않는다.

또한, 변이체는 폴리펩티드의 특성과 2차 구조에 최소한의 영향을 갖는 아미노산들의 결실 또는 부가를 포함할 수 있다. 예를 들면 변이체의 N-말단에는 번역-동시에(co-translationally) 또는 번역-후에(post-translationally) 단백질의 이동(translocation)에 관여하는 시그널(또는 리더) 서열이 컨쥬게이트 될 수 있다. 또한 상기 변이체는 확인, 정제, 또는 합성할 수 있도록 다른 서열 또는 링커와 컨쥬게이트 될 수 있다.

본 출원에서 제공하는 변이체는 서열번호 1의 아미노산 서열에서 N-말단으로부터 217번, 310번, 403번 및 462번 위치에 상응하는 아미노산 중 어느 하나 이상의 아미노산이 다른 아미노산으로 치환된 aroG 알돌라아제 변이체일 수 있다. 그 예로, 상기 위치 중 2 이상, 3 이상, 또는 4개의 아미노산 전부가 치환된 것일 수 있다. 그러나 이에 제한되지 않는다.

상기 서열번호 1의 아미노산 서열에서 N-말단으로부터 217번 위치에 상응하는 아미노산은 아르기닌이거나; 310번 아미노산에 상응하는 아미노산은 라이신이거나; 403번 아미노산에 상응하는 아미노산은 아르기닌이거나; 및/또는 462번 아미노산에 상응하는 아미노산은 글루탐산 일 수 있다.

본 출원에서 제공하는 변이체는, 서열번호 1의 아미노산 서열에서 N-말단으로부터 217번 위치에 상응하는 아미노산이 아르기닌 외의 아미노산으로 치환; 310번 아미노산에 상응하는 아미노산이 라이신 외의 아미노산으로 치환; 403번 아미노산에 상응하는 아미노산이 아르기닌 외의 아미노산으로 치환; 및 462번 아미노산에 상응하는 아미노산이 글루탐산 외의 아미노산으로 치환되는 것 중 1 이상의 치환을 포함할 수 있으나 이에 제한되지 않는다.

상기 "다른 아미노산"은 치환 전 아미노산과 치환 전의 아미노산과 다른 아미노산이면 제한되지 않는다. 한편, 본 출원에서 '특정 아미노산이 치환되었다'고 표현하는 경우, 다른 아미노산으로 치환되었다고 별도로 표기하지 않더라도 치환 전의 아미노산과 다른 아미노산으로 치환되는 것임은 자명하다.

일 구현예로 본 출원의 변이체는 참조(reference) 단백질인 서열번호 1의 아미노산 서열에서 217번, 310번, 403번 및 462번 위치에 상응하는 아미노산 중 어느 하나 이상의 아미노산이 소수성(hydrophobic) 아미노산 또는 지방족(Aliphatic) 아미노산 중 치환 전 아미노산과 다른 아미노산으로 치환된 변이체일 수 있다.

구체적으로 상기 변이체는 서열번호 1의 아미노산 서열에서 217번, 310번, 403번 및 462번 위치에 상응하는 아미노산 중 어느 하나 이상의 아미노산이 소수성(비극성) 아미노산 또는 지방족 아미노산 중 하나의 아미노산으로 치환된 변이체일 수 있다. 상기 지방족 아미노산은 예를 들어, 글리신, 알라닌, 발린, 류신, 및 이소류신으로 이루어지는 군에서 선택되는 아미노산일 수 있으나, 이에 제한되지 않는다. 상기 소수성(비극성) 아미노산은 예를 들어, 글리신, 메티오닌, 알라닌, 발린, 류신, 이소류신, 프롤린, 페닐알라닌, 티로신, 및 트립토판으로 이루어지는 군에서 선택되는 아미노산일 수 있으나, 이에 제한되지 않는다.

일 구현예로 본 출원의 변이체는 서열번호 1의 아미노산 서열에서 217번, 310번, 403번 및 462번 위치에 상응하는 아미노산 중 어느 하나 이상의 아미노산이 크기(size)가 작은 아미노산 중 치환 전 아미노산과 다른 아미노산으로 치환된 변이체일 수 있으나, 이에 제한되지 않는다.

본 출원에서 용어 "크기가 작은 아미노산"은 20종 아미노산 중 상대적으로 크기가 작은 아미노산인 글리신, 알라닌, 세린, 트레오닌, 시스테인, 발린, 류신, 이소류신, 프롤린, 및 아스파라긴을 포함하는 것으로, 구체적으로는 글리신, 알라닌, 세린, 트레오닌, 시스테인, 발린, 류신, 이소류신 및 프롤린을 의미할 수 있으나, 이에 제한되지 않으며, 보다 구체적으로는 글리신, 알라닌, 발린, 류신, 이소류신, 세린, 및 트레오닌을 의미하는 것일 수 있으나 이에 제한되지 않는다.

보다 구체적으로, 본 출원의 변이체에서 다른 아미노산으로의 치환은 알라닌으로의 치환일 수 있으나, 이에 제한되지 않는다.

본 출원에서, 용어 "상응하는(corresponding to)"은, 폴리펩티드에서 열거되는 위치의 아미노산 잔기이거나, 또는 폴리펩티드에서 열거되는 잔기와 유사하거나 동일하거나 상동한 아미노산 잔기를 지칭한다. 상응하는 위치의 아미노산을 확인하는 것은 특정 서열을 참조하는 서열의 특정 아미노산을 결정하는 것일 수 있다. 본 출원에 사용된 "상응 영역"은 일반적으로 관련 단백질 또는 참조 (reference) 단백질에서의 유사하거나 대응되는 위치를 지칭한다.

예를 들어, 임의의 아미노산 서열을 서열번호 1과 정렬(align)하고, 이를 토대로 상기 아미노산 서열의 각 아미노산 잔기는 서열번호 1의 아미노산 잔기와 상응하는 아미노산 잔기의 숫자 위치를 참조하여 넘버링 할 수 있다. 예를 들어, 본 출원에 기재된 것과 같은 서열 정렬 알고리즘은, 쿼리 시퀀스("참조 서열"이라고도 함)와 비교하여 아미노산의 위치, 또는 치환, 삽입 또는 결실 등의 변형이 발생하는 위치를 확인할 수 있다.

이러한 정렬에는 예를 들어 Needleman-Wunsch 알고리즘 (Needleman 및 Wunsch, 1970, J. Mol. Biol. 48: 443-453), EMBOSS 패키지의 Needle 프로그램 (EMBOSS: The European Molecular Biology Open Software Suite, Rice et al., 2000), Trends Genet. 16: 276-277) 등을 이용할 수 있으나, 이에 제한되지 않고 당업계에 알려진 서열 정렬 프로그램, 쌍 서열(pairwise sequence) 비교 알고리즘 등을 적절히 사용할 수 있다.

일 구현예로, 본 출원의 변이체는 서열번호 1의 폴리펩티드와 약 60%, 70%, 75%. 80%. 85%, 90%, 95%, 96%, 97%, 98% 또는 99% 이상의 서열 동일성을 가지고, 서열번호 1의 217번, 310번, 403번 및 462번 위치에 상응하는 아미노산 중 어느 하나 이상의 아미노산이 다른 아미노산으로 치환된 것일 수 있다.

일 구현예로, 본 출원의 변이체는 서열번호 3, 서열번호 5, 서열번호 7, 서열번호 9, 서열번호 23 또는 서열번호 25으로 기재된 아미노산 서열과 적어도 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, 99.5%, 99.7% 또는 99.9% 이상의 상동성 또는 동일성을 가지는 아미노산 서열을 포함할 수 있다.

구체적으로, 본 출원의 변이체는 서열번호 3, 서열번호 5, 서열번호 7, 서열번호 9, 서열번호 23 또는 서열번호 25으로 기재된 아미노산 서열을 가지거나(having), 포함하거나(comprising), 이루어지거나(consisting of), 상기 아미노산 서열로 필수적으로 이루어질(essentially consisting of) 수 있다.

일 구현예로, 본 출원의 변이체는 서열번호 1의 아미노산 서열을 기준으로 217번, 310번, 403번 및 462번 위치에 상응하는 아미노산 중 어느 하나 이상의 아미노산이 알라닌이고, 상기 서열번호 3, 서열번호 5, 서열번호 7, 서열번호 9, 서열번호 23 또는 서열번호 25으로 기재된 아미노산 서열과 적어도 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, 99.5%, 99.7% 또는 99.9% 이상의 상동성 또는 동일성을 가지는 아미노산 서열을 포함할 수 있다. 또한, 이러한 상동성 또는 동일성을 가지며 본 출원의 변이체에 상응하는 효능을 나타내는 아미노산 서열이라면, 일부 서열이 결실, 변형, 치환, 보존적 치환 또는 부가된 아미노산 서열을 갖는 변이체도 본 출원의 범위 내에 포함됨은 자명하다.

예를 들어, 상기 아미노산 서열 N-말단, C-말단 그리고/또는 내부에 본 출원의 변이체의 기능을 변경하지 않는 서열 추가 또는 결실, 자연적으로 발생할 수 있는 돌연변이, 잠재성 돌연변이 (silent mutation) 또는 보존적 치환을 가지는 경우이다.

상기 "보존적 치환(conservative substitution)"은 한 아미노산을 유사한 구조적 및/또는 화학적 성질을 갖는 또 다른 아미노산으로 치환시키는 것을 의미한다. 이러한 아미노산 치환은 일반적으로 잔기의 극성, 전하, 용해도, 소수성, 친수성 및/또는 양친매성(amphipathic nature)에서의 유사성에 근거하여 발생할 수 있다. 통상적으로, 보존적 치환은 단백질 또는 폴리펩티드의 활성에 거의 영향을 미치지 않거나 또는 영향을 미치지 않을 수 있다.

본 출원에서 용어, '상동성 (homology)' 또는 '동일성 (identity)'은 두 개의 주어진 아미노산 서열 또는 염기 서열 상호간 유사한 정도를 의미하며 백분율로 표시될 수 있다. 용어 상동성 및 동일성은 종종 상호교환적으로 이용될 수 있다.

보존된(conserved) 폴리뉴클레오티드 또는 폴리펩티드의 서열 상동성 또는 동일성은 표준 배열 알고리즘에 의해 결정되며, 사용되는 프로그램에 의해 확립된 디폴트 갭 페널티가 함께 이용될 수 있다. 실질적으로, 상동성을 갖거나(homologous) 또는 동일한(identical) 서열은 일반적으로 서열 전체 또는 일부분과 중간 또는 높은 엄격한 조건(stringent conditions)에서 하이브리드할 수 있다. 하이브리드화는 폴리뉴클레오티드에서 일반 코돈 또는 코돈 축퇴성을 고려한 코돈을 함유하는 폴리뉴클레오티드와의 하이브리드화 역시 포함됨이 자명하다.

임의의 두 폴리뉴클레오티드 또는 폴리펩티드 서열이 상동성, 유사성 또는 동일성을 갖는지 여부는, 예를 들어, Pearson et al (1988) [Proc. Natl. Acad. Sci. USA 85]: 2444에서와 같은 디폴트 파라미터를 이용하여 "FASTA" 프로그램과 같은 공지의 컴퓨터 알고리즘을 이용하여 결정될 수 있다. 또는, EMBOSS 패키지의 니들만 프로그램(EMBOSS: The European Molecular Biology Open Software Suite, Rice et al., 2000, Trends Genet. 16: 276-277)(버전 5.0.0 또는 이후 버전)에서 수행되는 바와 같은, 니들만-운치(Needleman-Wunsch) 알고리즘(Needleman and Wunsch, 1970, J. Mol. Biol. 48: 443-453)이 사용되어 결정될 수 있다(GCG 프로그램 패키지 (Devereux, J., et al, Nucleic Acids Research 12: 387 (1984)), BLASTP, BLASTN, FASTA (Atschul, [S.] [F.,] [ET AL, J MOLEC BIOL 215]: 403 (1990); Guide to Huge Computers, Martin J. Bishop, [ED.,] Academic Press, San Diego,1994, 및 [CARILLO ETA/.](1988) SIAM J Applied Math 48: 1073을 포함한다). 예를 들어, 국립 생물공학 정보 데이터베이스 센터의 BLAST, 또는 ClustalW를 이용하여 상동성, 유사성 또는 동일성을 결정할 수 있다.

폴리뉴클레오티드 또는 폴리펩티드의 상동성, 유사성 또는 동일성은, 예를 들어, Smith and Waterman, Adv. Appl. Math (1981) 2:482 에 공지된 대로, 예를 들면, Needleman et al. (1970), J Mol Biol. 48:443과 같은 GAP 컴퓨터 프로그램을 이용하여 서열 정보를 비교함으로써 결정될 수 있다. 요약하면, GAP 프로그램은 두 서열 중 더 짧은 것에서의 기호의 전체 수로, 유사한 배열된 기호(즉, 뉴클레오티드 또는 아미노산)의 수를 나눈 값으로 정의할 수 있다. GAP 프로그램을 위한 디폴트 파라미터는 (1) 이진법 비교 매트릭스(동일성을 위해 1 그리고 비-동일성을 위해 0의 값을 함유함) 및 Schwartz and Dayhoff, eds., Atlas Of Protein Sequence And Structure, National Biomedical Research Foundation, pp. 353-358 (1979)에 의해 개시된 대로, Gribskov et al(1986) Nucl. Acids Res. 14: 6745의 가중된 비교 매트릭스 (또는 EDNAFULL (NCBI NUC4.4의 EMBOSS 버전) 치환 매트릭스); (2) 각 갭을 위한 3.0의 페널티 및 각 갭에서 각 기호를 위한 추가의 0.10 페널티 (또는 갭 개방 패널티 10, 갭 연장 패널티 0.5); 및 (3) 말단 갭을 위한 무 페널티를 포함할 수 있다.

일 구현예로, 본 출원의 변이체는 aroG 알돌라아제 활성을 가질 수 있다. 일 구현예로, 본 출원의 변이체는 야생형 혹은 비변이 aroG 알돌라아제에 비해, 분지쇄 아미노산 생산능이 증가하도록 하는 활성을 가질 수 있다. 일 구현예로, 본 출원의 변이체는 야생형 혹은 비변이 aroG 알돌라아제에 비해, 분지쇄 아미노산 생산경로의 부산물 생산수준이 감소하도록 하는 활성을 가질 수 있다. 일 구현예로, 본 출원의 변이체는 야생형 혹은 비변이 aroG 알돌라아제에 비해, 약화된 활성을 가지는 것일 수 있다. 그러나 이에 제한되지 않는다.

본 출원의 다른 하나의 양태는 본 출원의 변이체를 코딩하는 폴리뉴클레오티드를 제공한다.

본 출원에서 용어, "폴리뉴클레오티드"는 뉴클레오티드 단위체(monomer)가 공유결합에 의해 길게 사슬모양으로 이어진 뉴클레오티드의 중합체(polymer)로 일정한 길이 이상의 DNA 또는 RNA 가닥으로서, 보다 구체적으로는 상기 변이체를 코딩하는 폴리뉴클레오티드 단편을 의미한다.

본 출원의 변이체를 코딩하는 폴리뉴클레오티드는 서열번호 3, 서열번호 5, 서열번호 7, 서열번호 9, 서열번호 23 또는 서열번호 25으로 기재된 아미노산 서열을 코딩하는 염기서열을 포함할 수 있다. 본 출원의 일 예로, 본 출원의 폴리뉴클레오티드는 서열번호 4, 서열번호 6, 서열번호 8, 서열번호 10, 서열번호 24 또는 서열번호 26의 서열을 가지거나 포함할 수 있다. 또한, 본 출원의 폴리뉴클레오티드는 서열번호 4, 서열번호 6, 서열번호 8, 서열번호 10, 서열번호 24, 또는 서열번호 26의 서열로 이루어지거나, 필수적으로 구성될 수 있다.

본 출원의 폴리뉴클레오티드는 코돈의 축퇴성(degeneracy) 또는 본 출원의 변이체를 발현시키고자 하는 생물에서 선호되는 코돈을 고려하여, 본 출원의 변이체의 아미노산 서열을 변화시키지 않는 범위 내에서 코딩 영역에 다양한 변형이 이루어질 수 있다. 구체적으로, 본 출원의 폴리뉴클레오티드는 서열번호 4, 서열번호 6, 서열번호 8, 서열번호 10, 서열번호 24, 또는 서열번호 26의 서열과 상동성 또는 동일성이 70% 이상, 75% 이상, 80% 이상, 85% 이상, 90% 이상, 95% 이상, 96% 이상, 97% 이상, 98% 이상, 및 100% 미만인 염기서열을 가지거나 포함하거나, 또는 서열번호 4, 서열번호 6, 서열번호 8, 서열번호 10, 서열번호 24 또는 서열번호 26의 서열과 상동성 또는 동일성이 70% 이상, 75% 이상, 80% 이상, 85% 이상, 90% 이상, 95% 이상, 96% 이상, 97% 이상, 98% 이상, 및 100% 미만인 염기서열로 이루어지거나 필수적으로 이루어질 수 있으나, 이에 제한되지 않는다.

이때, 상기 상동성 또는 동일성을 갖는 서열에서, 서열번호 4, 서열번호 6, 서열번호 8, 서열번호 10, 서열번호 24 또는 서열번호 26의 217번, 310번, 403번 및 462번 위치에 상응하는 아미노산을 코딩하는 코돈은, 알라닌을 코딩하는 코돈 중 하나일 수 있다.

또한, 본 출원의 폴리뉴클레오티드는 공지의 유전자 서열로부터 제조될 수 있는 프로브, 예를 들면, 본 출원의 폴리뉴클레오티드 서열의 전체 또는 일부에 대한 상보 서열과 엄격한 조건 하에 하이드리드화할 수 있는 서열이라면 제한없이 포함될 수 있다. 상기 "엄격한 조건(stringent condition)"이란 폴리뉴클레오티드 간의 특이적 혼성화를 가능하게 하는 조건을 의미한다. 이러한 조건은 문헌(J. Sambrook et al.,Molecular Cloning, A Laboratory Manual, 2nd Edition, Cold Spring Harbor Laboratory press, Cold Spring Harbor, New York, 1989; F.M. Ausubel et al.,Current Protocols in Molecular Biology, John Wiley & Sons, Inc., New York, 9.50-9.51, 11.7-11.8 참조)에 구체적으로 기재되어 있다. 예를 들어, 상동성 또는 동일성이 높은 폴리뉴클레오티드끼리, 70% 이상, 75% 이상, 80% 이상, 85% 이상, 90% 이상, 95% 이상, 96% 이상, 97% 이상, 98% 이상, 또는 99% 이상의 상동성 또는 동일성을 갖는 폴리뉴클레오티드끼리 하이브리드화하고, 그보다 상동성 또는 동일성이 낮은 폴리뉴클레오티드끼리 하이브리드화하지 않는 조건, 또는 통상의 써던 하이브리드화(southern hybridization)의 세척 조건인 60℃, 1ХSSC, 0.1% SDS, 구체적으로 60℃, 0.1ХSSC, 0.1% SDS, 보다 구체적으로 68℃, 0.1ХSSC, 0.1% SDS에 상당하는 염 농도 및 온도에서, 1회, 구체적으로 2회 내지 3회 세정하는 조건을 열거할 수 있다.

혼성화는 비록 혼성화의 엄격도에 따라 염기 간의 미스매치(mismatch)가 가능할지라도, 두 개의 핵산이 상보적 서열을 가질 것을 요구한다. 용어, "상보적"은 서로 혼성화가 가능한 뉴클레오티드 염기 간의 관계를 기술하는데 사용된다. 예를 들면, DNA에 관하여, 아데닌은 티민에 상보적이며 시토신은 구아닌에 상보적이다. 따라서, 본 출원의 폴리뉴클레오티드는 또한 실질적으로 유사한 핵산 서열뿐만 아니라 전체 서열에 상보적인 단리된 핵산 단편을 포함할 수 있다.

구체적으로, 본 출원의 폴리뉴클레오티드와 상동성 또는 동일성을 가지는 폴리뉴클레오티드는 55 ℃의 Tm 값에서 혼성화 단계를 포함하는 혼성화 조건을 사용하고 상술한 조건을 사용하여 탐지할 수 있다. 또한, 상기 Tm 값은 60 ℃, 63 ℃ 또는 65 ℃일 수 있으나, 이에 제한되는 것은 아니고 그 목적에 따라 당업자에 의해 적절히 조절될 수 있다.

상기 폴리뉴클레오티드를 혼성화하는 적절한 엄격도는 폴리뉴클레오티드의 길이 및 상보성 정도에 의존하고 변수는 해당기술분야에 잘 알려져 있다(예컨대, J. Sambrook et al., 상동).

본 출원의 또 다른 하나의 양태는 본 출원의 폴리뉴클레오티드를 포함하는 벡터를 제공하는 것이다. 상기 벡터는 상기 폴리뉴클레오티드를 숙주세포에서 발현시키기 위한 발현 벡터일 수 있으나, 이에 제한되지 않는다.

본 출원의 "벡터"는 적합한 숙주 내에서 목적 폴리펩티드를 발현시킬 수 있도록 적합한 발현조절영역(또는 발현조절서열)에 작동 가능하게 연결된 상기 목적 폴리펩티드를 코딩하는 폴리뉴클레오티드의 염기서열을 포함하는 DNA 제조물을 포함할 수 있다. 상기 발현조절영역은 전사를 개시할 수 있는 프로모터, 그러한 전사를 조절하기 위한 임의의 오퍼레이터 서열, 적합한 mRNA 리보좀 결합부위를 코딩하는 서열, 및 전사 및 해독의 종결을 조절하는 서열을 포함할 수 있다. 벡터는 적당한 숙주세포 내로 형질전환된 후, 숙주 게놈과 무관하게 복제되거나 기능할 수 있으며, 게놈 그 자체에 통합될 수 있다.

본 출원에서 사용되는 벡터는 특별히 한정되지 않으며, 당업계에 알려진 임의의 벡터를 이용할 수 있다. 통상 사용되는 벡터의 예로는 천연 상태이거나 재조합된 상태의 플라스미드, 코스미드, 바이러스 및 박테리오파지를 들 수 있다. 예를 들어, 파지 벡터 또는 코스미드 벡터로서 pWE15, M13, MBL3, MBL4, IXII, ASHII, APII, t10, t11, Charon4A, 및 Charon21A 등을 사용할 수 있으며, 플라스미드 벡터로서 pDC계, pBR계, pUC계, pBluescriptII계, pGEM계, pTZ계, pCL계 및 pET계 등을 사용할 수 있다. 구체적으로는 pDC, pDCM2, pACYC177, pACYC184, pCL, pECCG117, pUC19, pBR322, pMW118, pCC1BAC 벡터 등을 사용할 수 있다.

일례로 세포 내 염색체 삽입용 벡터를 통해 목적 폴리펩티드를 코딩하는 폴리뉴클레오티드를 염색체 내로 삽입할 수 있다. 상기 폴리뉴클레오티드의 염색체 내로의 삽입은 당업계에 알려진 임의의 방법, 예를 들면, 상동재조합(homologous recombination)에 의하여 이루어질 수 있으나, 이에 한정되지는 않는다. 상기 염색체 삽입 여부를 확인하기 위한 선별 마커(selection marker)를 추가로 포함할 수 있다. 상기 선별 마커는 벡터로 형질전환된 세포를 선별, 즉 목적 핵산 분자의 삽입 여부를 확인하기 위한 것으로, 약물 내성, 영양 요구성, 세포 독성제에 대한 내성 또는 표면 폴리펩티드의 발현과 같은 선택가능 표현형을 부여하는 마커들이 사용될 수 있다. 선택제(selective agent)가 처리된 환경에서는 선별 마커를 발현하는 세포만 생존하거나 다른 표현 형질을 나타내므로, 형질전환된 세포를 선별할 수 있다.

본 출원에서 용어 "형질전환"은 표적 폴리펩티드를 코딩하는 폴리뉴클레오티드를 포함하는 벡터를 숙주세포 혹은 미생물 내에 도입하여 숙주세포 내에서 상기 폴리뉴클레오티드가 코딩하는 폴리펩티드가 발현할 수 있도록 하는 것을 의미한다. 형질전환된 폴리뉴클레오티드는 숙주세포 내에서 발현될 수 있기만 한다면, 숙주세포의 염색체 내에 삽입되어 위치하거나 염색체 외에 위치하거나 상관없이 이들 모두를 포함할 수 있다. 또한, 상기 폴리뉴클레오티드는 목적 폴리펩티드를 코딩하는 DNA 및/또는 RNA를 포함한다. 상기 폴리뉴클레오티드는 숙주세포 내로 도입되어 발현될 수 있는 것이면, 어떠한 형태로도 도입될 수 있다. 예를 들면, 상기 폴리뉴클레오티드는 자체적으로 발현되는데 필요한 모든 요소를 포함하는 유전자 구조체인 발현 카세트(expression cassette)의 형태로 숙주세포에 도입될 수 있다. 상기 발현 카세트는 통상 상기 폴리뉴클레오티드에 작동 가능하게 연결되어 있는 프로모터(promoter), 전사 종결신호, 리보좀 결합부위 및 번역 종결신호를 포함할 수 있다. 상기 발현 카세트는 자체 복제가 가능한 발현 벡터 형태일 수 있다. 또한, 상기 폴리뉴클레오티드는 그 자체의 형태로 숙주세포에 도입되어 숙주세포에서 발현에 필요한 서열과 작동 가능하게 연결되어 있는 것일 수도 있으며, 이에 제한되지 않는다.

또한, 상기에서 용어 "작동 가능하게 연결"된 것이란 본 출원의 목적 변이체를 코딩하는 폴리뉴클레오티드의 전사를 개시 및 매개하도록 하는 프로모터 서열과 상기 폴리뉴클레오티드 서열이 기능적으로 연결되어 있는 것을 의미한다.

본 출원의 또 다른 하나의 양태는 본 출원의 변이체, 본 출원의 폴리뉴클레오티드 및 본 출원의 벡터를 포함하는, 코리네박테리움 속 미생물을 제공한다.

본 출원의 미생물은 본 출원의 변이형 폴리펩티드, 상기 폴리펩티드를 암호화하는 폴리뉴클레오티드, 또는 본 출원의 폴리뉴클레오티드를 포함하는 벡터를 포함할 수 있다.

본 출원에서 용어, "미생물" 또는 "균주"는 야생형 미생물이나 자연적 또는 인위적으로 유전적 변형이 일어난 미생물을 모두 포함하며, 외부 유전자가 삽입되거나 내재적 유전자의 활성이 강화되거나 불활성화되는 등의 원인으로 인해서 특정 기작이 약화되거나 강화된 미생물로서, 목적하는 폴리펩티드, 단백질 또는 산물의 생산을 위하여 유전적 변형(modification)을 포함하는 미생물일 수 있다.

본 출원의 균주는 본 출원의 변이체, 본 출원의 폴리뉴클레오티드 및 본 출원의 폴리뉴클레오티드를 포함하는 벡터 중 어느 하나 이상을 포함하는 균주; 본 출원의 변이체 또는 본 출원의 폴리뉴클레오티드를 발현하도록 변형된 균주; 본 출원의 변이체, 또는 본 출원의 폴리뉴클레오티드를 발현하는 균주 (예컨대, 재조합 균주); 또는 본 출원의 변이체 활성을 갖는 균주 (예컨대, 재조합 균주)일 수 있으나, 이에 제한되지 않는다.

본 출원의 균주는 분지쇄 아미노산 생산능을 가진 균주일 수 있다.

본 출원의 균주는 자연적으로 aroG 알돌라아제 또는 분지쇄 아미노산 생산능을 가지고 있는 미생물, 또는 aroG 알돌라아제 또는 분지쇄 아미노산 생산능이 없는 모균주에 본 출원의 변이체 또는 이를 코딩하는 폴리뉴클레오티드 (또는 상기 폴리뉴클레오티드를 포함하는 벡터)가 도입되거나 및/또는 분지쇄 아미노산 생산능이 부여된 미생물일 수 있으나 이에 제한되지 않는다.

일 예로, 본 출원의 균주는 본 출원의 폴리뉴클레오티드 또는 본 출원의 변이체를 코딩하는 폴리뉴클레오티드를 포함하는 벡터로 형질전환되어, 본 출원의 변이체를 발현하는 세포 또는 미생물로서, 본 출원의 목적상 본 출원의 균주는 본 출원의 변이체를 포함하여 분지쇄 아미노산을 생산할 수 있는 미생물을 모두 포함할 수 있다. 예를 들어, 본 출원의 균주는 천연의 야생형 미생물 또는 분지쇄 아미노산을 생산하는 미생물에 본 출원의 변이체를 코딩하는 폴리뉴클레오티드가 도입됨으로써 aroG 알돌라아제 변이체가 발현되어, 분지쇄 아미노산 생산능이 증가된 재조합 균주일 수 있다. 상기 분지쇄 아미노산 생산능이 증가된 재조합 균주는, 천연의 야생형 미생물 또는 aroG 알돌라아제 비변형 미생물 (즉, 야생형 aroG 알돌라아제를 발현하는 미생물)에 비하여 분지쇄 아미노산 생산능이 증가된 미생물일 수 있으나, 이에 제한되는 것은 아니다.

일 예로, 상기 분지쇄 아미노산 생산능의 증가 여부를 비교하는 대상 균주인, aroG 알돌라아제 비변형 미생물은 코리네박테리움 글루타미쿰 ATCC13032 균주 일 수 있다. 다른 예로, 상기 분지쇄 아미노산 생산능의 증가 여부를 비교하는 대상 균주인, aroG 알돌라아제 비변형 미생물은 CJL-8109, KCCM12739P(CA10-3101), KCCM11201P 일 수 있으나, 이에 제한되지 않는다.

일 예로, 상기 재조합 균주는 변이 전 모균주 또는 비변형 미생물의 분지쇄 아미노산 생산능에 비하여 약 1% 이상, 구체적으로는 약 3%, 약 5% 이상 높아진 것일 수 있으나, 변이 전 모균주 또는 비변형 미생물의 생산능에 비해 +값의 증가량을 갖는 한, 이에 제한되지 않는다.

다른 예로, 상기 재조합 균주는 변이 전 모균주 또는 비변형 미생물에 비하여 분지쇄 아미노산 생산 경로에서 생성되는 부산물의 생산량이 약 50% 이하, 구체적으로는 약 30% 이하, 약 10% 이하로 낮아진 것일 수 있고, 또는 부산물이 생산되지 않는 것일 수 있으나, 이에 제한되지 않는다.

상기 용어 "약(about)"은 ±0.5, ±0.4, ±0.3, ±0.2, ±0.1 등을 모두 포함하는 범위로, 약 이란 용어 뒤에 나오는 수치와 동등하거나 유사한 범위의 수치를 모두 포함하나, 이에 제한되지 않는다.

본 출원에서 "분지쇄 아미노산" 은 곁사슬에 분지알킬기가 있는 아미노산을 말하며, 발린, 류신 및 이소류신을 포함한다. 구체적으로, 본 출원에서 상기 분지쇄 아미노산은 L-분지쇄 아미노산일 수 있고, 상기 L-분지쇄 아미노산은 L-발린, L-류신 및 L-이소류신 중에서 선택되는 1 이상 일 수 있으나, 이에 제한되는 것은 아니다.

본 출원에서 분지쇄 아미노산 생산 경로에서 생성되는 부산물은, 분지쇄 아미노산 이외의 물질을 의미하며, 구체적으로는 방향족(aromatic) 아미노산, 보다 구체적으로는 L-타이로신 및 L-페닐알라닌 중에서 선택되는 1 이상일 수 있다. 그러나 이에 제한되지 않는다.

본 출원에서 용어, "비변형 미생물"은 미생물에 자연적으로 발생할 수 있는 돌연변이를 포함하는 균주를 제외하는 것이 아니며, 야생형 균주 또는 천연형 균주 자체이거나, 자연적 또는 인위적 요인에 의한 유전적 변이로 형질이 변화되기 전 균주를 의미할 수 있다. 예를 들어, 상기 비변형 미생물은 본 출원의 aroG 알돌라아제 변이체가 도입되지 않거나 도입되기 전의 균주를 의미할 수 있다. 상기 "비변형 미생물"은 "변형 전 균주", "변형 전 미생물", "비변이 균주", "비변형 균주", "비변이 미생물" 또는 "기준 미생물"과 혼용될 수 있다.

일 구현예로, 본 출원의 미생물은 코리네박테리움 스테이셔니스(Corynebacterium stationis), 코리네박테리움 크루디락티스(Corynebacterium crudilactis), 코리네박테리움 데세르티(Corynebacterium deserti), 코리네박테리움 이피시엔스(Corynebacterium efficiens), 코리네박테리움 칼루내(Corynebacterium callunae), 코리네박테리움 글루타미쿰(Corynebacterium glutamicum), 코리네박테리움 싱굴라레(Corynebacterium singulare), 코리네박테리움 할로톨레란스(Corynebacterium halotolerans), 코리네박테리움 스트리아툼(Corynebacterium striatum), 코리네박테리움 암모니아게네스(Corynebacterium ammoniagenes), 코리네박테리움 폴루티솔리(Corynebacterium pollutisoli), 코리네박테리움 이미탄스(Corynebacterium imitans), 코리네박테리움 테스투디노리스(Corynebacterium testudinoris) 또는 코리네박테리움 플라베스센스(Corynebacterium flavescens)일 수 있다.

본 출원의 미생물은 분지쇄 아미노산 생산능을 증가하도록 하는 변이를 추가로 더 포함할 수 있다.

일 구현예로, 본 출원의 미생물은 이소프로필말레이트 신타제, 호모세린 디하이드로게나제, 쓰레오닌 디하이드라타제, 분지쇄 아미노산 아미노트랜스퍼라제, 시트레이트 신타아제 중 하나 이상의 활성 변경을 포함할 수 있다.

일 구현예로, 본 출원의 미생물은 이소프로필말레이트 신타제(isopropylmalate synthase), 분지쇄 아미노산 아미노트랜스퍼라제(branched amino acid aminotransferase), 호모세린 디하이드로게나제(homoserine dehydrogenase), 및 쓰레오닌 디하이드라타제(threonine dehydratase) 중 하나 이상의 활성이 추가적으로 강화된 미생물일 수 있다.

일 구현예로, 본 출원의 미생물은 시트레이트 신타아제(citrate synthase) 의 활성이 추가적으로 약화된 미생물일 수 있다.

그러나 전술한 내용에 제한되지 않고, 생산하고자 하는 분지쇄 아미노산에 따라 당업자는 미생물이 포함하는 추가적인 변형을 적절히 선택할 수 있다.

본 출원에서 용어, 폴리펩티드 활성의 "강화"는, 폴리펩티드의 활성이 내재적 활성에 비하여 증가되는 것을 의미한다. 상기 강화는 활성화(activation), 상향조절(up-regulation), 과발현(overexpression), 증가(increase) 등의 용어와 혼용될 수 있다. 여기서 활성화, 강화, 상향조절, 과발현, 증가는 본래 가지고 있지 않았던 활성을 나타내게 되는 것, 또는 내재적 활성 또는 변형 전 활성에 비하여 향상된 활성을 나타내게 되는 것을 모두 포함할 수 있다. 상기 “내재적 활성"은 자연적 또는 인위적 요인에 의한 유전적 변이로 형질이 변화하는 경우, 형질 변화 전 모균주 또는 비변형 미생물이 본래 가지고 있던 특정 폴리펩티드의 활성을 의미한다. 이는 "변형 전 활성"과 혼용되어 사용될 수 있다. 폴리펩티드의 활성이 내재적 활성에 비하여 "강화", "상향조절", "과발현" 또는 "증가"한다는 것은, 형질 변화 전 모균주 또는 비변형 미생물이 본래 가지고 있던 특정 폴리펩티드의 활성 및/또는 농도(발현량)에 비하여 향상된 것을 의미한다.

상기 강화는 외래의 폴리펩티드를 도입하거나, 내재적인 폴리펩티드의 활성 강화 및/또는 농도(발현량)를 통해 달성할 수 있다. 상기 폴리펩티드의 활성의 강화 여부는 해당 폴리펩티드의 활성 정도, 발현량 또는 해당 폴리펩티드로부터 배출되는 산물의 양의 증가로부터 확인할 수 있다.

상기 폴리펩티드의 활성의 강화는 당해 분야에 잘 알려진 다양한 방법의 적용이 가능하며, 목적 폴리펩티드의 활성을 변형전 미생물보다 강화시킬 수 있는 한, 제한되지 않는다. 구체적으로, 분자생물학의 일상적 방법인 당업계의 통상의 기술자에게 잘 알려진 유전자 공학 및/또는 단백질 공학을 이용한 것일 수 있으나, 이로 제한되지 않는다(예컨대, Sitnicka et al. Functional Analysis of Genes. Advances in Cell Biology. 2010, Vol. 2. 1-16, Sambrook et al. Molecular Cloning 2012 등).

구체적으로, 본 출원의 폴리펩티드의 강화는

1) 폴리펩티드를 코딩하는 폴리뉴클레오티드의 세포 내 카피수 증가;

2) 폴리펩티드를 코딩하는 염색체상의 유전자 발현조절영역을 활성이 강력한 서열로 교체;

3) 폴리펩티드를 코딩하는 유전자 전사체의 개시코돈 또는 5'-UTR 지역을 코딩하는 염기서열의 변형;

4) 폴리펩티드 활성이 강화되도록 상기 폴리펩티드의 아미노산 서열의 변형;

5) 폴리펩티드 활성이 강화도록 상기 폴리펩티드를 코딩하는 폴리뉴클레오티드 서열의 변형 (예를 들어, 폴리펩티드의 활성이 강화되도록 변형된 폴리펩티드를 코딩하도록 상기 폴리펩티드 유전자의 폴리뉴클레오티드 서열의 변형);

6) 폴리펩티드의 활성을 나타내는 외래 폴리펩티드 또는 이를 코딩하는 외래 폴리뉴클레오티드의 도입;

7) 폴리펩티드를 암호화하는 폴리뉴클레오티드의 코돈 최적화;

8) 폴리펩티드의 삼차구조를 분석하여 노출 부위를 선택하여 변형하거나 화학적으로 수식; 또는

9) 상기 1) 내지 8) 중 선택된 2 이상의 조합일 수 있으나, 이에, 특별히 제한되는 것은 아니다.

보다 구체적으로,

상기 1) 폴리펩티드를 코딩하는 폴리뉴클레오티드의 세포 내 카피수 증가는, 해당 폴리펩티드를 코딩하는 폴리뉴클레오티드가 작동가능하게 연결된, 숙주와 무관하게 복제되고 기능할 수 있는 벡터의 숙주세포 내로의 도입에 의해 달성되는 것일 수 있다. 또는, 해당 폴리펩티드를 코딩하는 폴리뉴클레오티드가 숙주세포 내의 염색체 내에 1 카피 또는 2 카피 이상 도입에 의해 달성되는 것일 수 있다. 상기 염색체 내에 도입은 숙주세포 내의 염색체 내로 상기 폴리뉴클레오티드를 삽입시킬 수 있는 벡터가 숙주세포 내에 도입됨으로써 수행될 수 있으나, 이에 제한되지 않는다. 상기 벡터는 전술한 바와 같다.

상기 2) 폴리펩티드를 코딩하는 염색체상의 유전자 발현조절영역(또는 발현조절서열)을 활성이 강력한 서열로 교체는, 예를 들면, 상기 발현조절영역의 활성을 더욱 강화하도록 결실, 삽입, 비보존적 또는 보존적 치환 또는 이들의 조합으로 서열상의 변이 발생, 또는 더욱 강한 활성을 가지는 서열로의 교체일 수 있다. 상기 발현조절영역은, 특별히 이에 제한되지 않으나 프로모터, 오퍼레이터 서열, 리보좀 결합 부위를 코딩하는 서열, 그리고 전사 및 해독의 종결을 조절하는 서열 등을 포함할 수 있다. 일 예로, 본래의 프로모터를 강력한 프로모터로 교체시키는 것일 수 있으나, 이에 제한되지 않는다.

공지된 강력한 프로모터의 예에는 cj1 내지 cj7 프로모터(미국등록특허 US 7662943 B2), lac 프로모터, trp 프로모터, trc 프로모터, tac 프로모터, 람다 파아지 PR 프로모터, PL 프로모터, tet 프로모터, gapA 프로모터, SPL7 프로모터, SPL13(sm3) 프로모터(미국등록특허 US 10584338 B2), O2 프로모터(미국등록특허 US 10273491 B2), tkt 프로모터, yccA 프로모터 등이 있으나, 이에 제한되지 않는다.

상기 3) 폴리펩티드를 코딩하는 유전자 전사체의 개시코돈 또는 5'-UTR 지역을 코딩하는 염기서열 변형은, 예를 들면, 내재적 개시코돈에 비해 폴리펩티드 발현율이 더 높은 다른 개시코돈을 코딩하는 염기 서열로 치환하는 것일 수 있으나, 이에 제한되지 않는다.

상기 4) 및 5)의 아미노산 서열 또는 폴리뉴클레오티드 서열의 변형은, 폴리펩티드의 활성을 강화하도록 상기 폴리펩티드의 아미노산 서열 또는 상기 폴리펩티드를 코딩하는 폴리뉴클레오티드 서열을 결실, 삽입, 비보존적 또는 보존적 치환 또는 이들의 조합으로 서열상의 변이 발생, 또는 더욱 강한 활성을 갖도록 개량된 아미노산 서열 또는 폴리뉴클레오티드 서열 또는 활성이 증가하도록 개량된 아미노산 서열 또는 폴리뉴클레오티드 서열로의 교체일 수 있으나, 이에 한정되는 것은 아니다. 상기 교체는 구체적으로 상동재조합에 의하여 폴리뉴클레오티드를 염색체내로 삽입함으로써 수행될 수 있으나, 이에 제한되지 않는다. 이때 사용되는 벡터는 염색체 삽입 여부를 확인하기 위한 선별 마커 (selection marker)를 추가로 포함할 수 있다. 상기 선별 마커는 전술한 바와 같다.

상기 6) 폴리펩티드의 활성을 나타내는 외래 폴리뉴클레오티드의 도입은, 상기 폴리펩티드와 동일/유사한 활성을 나타내는 폴리펩티드를 코딩하는 외래 폴리뉴클레오티드의 숙주세포 내 도입일 수 있다. 상기 외래 폴리뉴클레오티드는 상기 폴리펩티드와 동일/유사한 활성을 나타내는 한 그 유래나 서열에 제한이 없다. 상기 도입에 이용되는 방법은 공지된 형질전환 방법을 당업자가 적절히 선택하여 수행될 수 있으며, 숙주 세포 내에서 상기 도입된 폴리뉴클레오티드가 발현됨으로써 폴리펩티드가 생성되어 그 활성이 증가될 수 있다.

상기 7) 폴리펩티드를 암호화하는 폴리뉴클레오티드의 코돈 최적화는, 내재 폴리뉴클레오티드가 숙주세포 내에서 전사 또는 번역이 증가하도록 코돈 최적화한 것이거나, 또는 외래 폴리뉴클레오티드가 숙주세포 내에서 최적화된 전사, 번역이 이루어지도록 이의 코돈을 최적화한 것일 수 있다.

상기 8) 폴리펩티드의 삼차구조를 분석하여 노출 부위를 선택하여 변형하거나 화학적으로 수식하는 것은, 예를 들어 분석하고자 하는 폴리펩티드의 서열정보를 기지 단백질들의 서열정보가 저장된 데이터베이스와 비교함으로써 서열의 유사성 정도에 따라 주형 단백질 후보를 결정하고 이를 토대로 구조를 확인하여, 변형하거나 화학적으로 수식할 노출 부위를 선택하여 변형 또는 수식하는 것일 수 있다.

이와 같은 폴리펩티드 활성의 강화는, 상응하는 폴리펩티드의 활성 또는 농도 발현량가 야생형이나 변형 전 미생물 균주에서 발현된 폴리펩티드의 활성 또는 농도를 기준으로 하여 증가되거나, 해당 폴리펩티드로부터 생산되는 산물의 양의 증가되는 것일 수 있으나, 이에 제한되는 것은 아니다.

본 출원의 미생물에서 폴리뉴클레오티드의 일부 또는 전체의 변형은 (a) 미생물 내 염색체 삽입용 벡터를 이용한 상동 재조합 또는 유전자가위 (engineered nuclease, e.g., CRISPR-Cas9)을 이용한 유전체 교정 및/또는 (b) 자외선 및 방사선 등과 같은 빛 및/또는 화학물질 처리에 의해 유도될 수 있으나 이에 제한되지 않는다. 상기 유전자 일부 또는 전체의 변형 방법에는 DNA 재조합 기술에 의한 방법이 포함될 수 있다. 예를 들면, 목적 유전자와 상동성이 있는 뉴클레오티드 서열을 포함하는 뉴클레오티드 서열 또는 벡터를 상기 미생물에 주입하여 상동 재조합(homologous recombination)이 일어나게 함으로써 유전자 일부 또는 전체의 결손이 이루어질 수 있다. 상기 주입되는 뉴클레오티드 서열 또는 벡터는 우성 선별 마커를 포함할 수 있으나, 이에 제한되는 것은 아니다.

본 출원에서 용어, 폴리펩티드 활성의 "약화" 는 내재적 활성에 비하여 활성이 감소되거나 또는 활성이 없는 것을 모두 포함하는 개념이다. 상기 약화는 불활성화(inactivation), 결핍(deficiency), 하향조절(down-regulation), 감소(decrease), 저하(reduce), 감쇠(attenuation) 등의 용어와 혼용될 수 있다.

상기 약화는 상기 폴리펩티드를 코딩하는 폴리뉴클레오티드의 변이 등으로 폴리펩티드 자체의 활성이 본래 미생물이 가지고 있는 폴리펩티드의 활성에 비해 감소 또는 제거된 경우, 이를 코딩하는 폴리뉴클레오티드의 유전자의 발현 저해 또는 폴리펩티드로의 번역(translation) 저해 등으로 세포 내에서 전체적인 폴리펩티드 활성 정도 및/또는 농도(발현량)가 천연형 균주에 비하여 낮은 경우, 상기 폴리뉴클레오티드의 발현이 전혀 이루어지지 않은 경우, 및/또는 폴리뉴클레오티드의 발현이 되더라도 폴리펩티드의 활성이 없는 경우 역시 포함할 수 있다. 상기 "내재적 활성"은 자연적 또는 인위적 요인에 의한 유전적 변이로 형질이 변화하는 경우, 형질 변화 전 모균주, 야생형 또는 비변형 미생물이 본래 가지고 있던 특정 폴리펩티드의 활성을 의미한다. 이는 "변형 전 활성"과 혼용되어 사용될 수 있다. 폴리펩티드의 활성이 내재적 활성에 비하여 "불활성화, 결핍, 감소, 하향조절, 저하, 감쇠"한다는 것은, 형질 변화 전 모균주 또는 비변형 미생물이 본래 가지고 있던 특정 폴리펩티드의 활성에 비하여 낮아진 것을 의미한다.

이러한 폴리펩티드의 활성의 약화는, 당업계에 알려진 임의의 방법에 의하여 수행될 수 있으나 이로 제한되는 것은 아니며, 당해 분야에 잘 알려진 다양한 방법의 적용으로 달성될 수 있다(예컨대, Nakashima N et al., Bacterial cellular engineering by genome editing and gene silencing. Int J Mol Sci. 2014;15(2):2773-2793, Sambrook et al. Molecular Cloning 2012 등).

구체적으로, 본 출원의 폴리펩티드의 약화는

1) 폴리펩티드를 코딩하는 유전자 전체 또는 일부의 결손;

2) 폴리펩티드를 코딩하는 유전자의 발현이 감소하도록 발현조절영역(또는 발현조절서열)의 변형;

3) 폴리펩티드의 활성이 제거 또는 약화되도록 상기 폴리펩티드를 구성하는 아미노산 서열의 변형(예컨대, 아미노산 서열 상의 1 이상의 아미노산의 삭제/치환/부가);

4) 폴리펩티드의 활성이 제거 또는 약화되도록 상기 폴리펩티드를 코딩하는 유전자 서열의 변형 (예를 들어, 폴리펩티드의 활성이 제거 또는 약화되도록 변형된 폴리펩티드를 코딩하도록 상기 폴리펩티드 유전자의 핵산염기 서열 상의 1 이상의 핵산염기의 삭제/치환/부가);

5) 폴리펩티드를 코딩하는 유전자 전사체의 개시코돈 또는 5'-UTR 지역을 코딩하는 염기서열의 변형;

6) 폴리펩티드를 코딩하는 상기 유전자의 전사체에 상보적으로 결합하는 안티센스 올리고뉴클레오티드(예컨대, 안티센스 RNA)의 도입;

7) 리보솜(ribosome)의 부착이 불가능한 2차 구조물을 형성시키기 위하여 폴리펩티드를 코딩하는 유전자의 사인-달가르노(Shine-Dalgarno) 서열 앞단에 사인-달가르노 서열과 상보적인 서열의 부가;

8) 폴리펩티드를 코딩하는 유전자 서열의 ORF(open reading frame)의 3' 말단에 반대 방향으로 전사되는 프로모터의 부가(Reverse transcription engineering, RTE); 또는

예컨대,

상기 1) 폴리펩티드를 코딩하는 상기 유전자 일부 또는 전체의 결손은, 염색체 내 내재적 목적 폴리펩티드를 코딩하는 폴리뉴클레오티드 전체의 제거, 일부 뉴클레오티드가 결실된 폴리뉴클레오티드로의 교체 또는 마커 유전자로 교체일 수 있다.

또한, 상기 2) 발현조절영역(또는 발현조절서열)의 변형은, 결실, 삽입, 비보존적 또는 보존적 치환 또는 이들의 조합으로 발현조절영역(또는 발현조절서열) 상의 변이 발생, 또는 더욱 약한 활성을 갖는 서열로의 교체일 수 있다. 상기 발현조절영역에는 프로모터, 오퍼레이터 서열, 리보좀 결합부위를 코딩하는 서열, 및 전사와 해독의 종결을 조절하는 서열을 포함하나, 이에 한정되는 것은 아니다.

또한, 상기 3) 폴리펩티드를 코딩하는 유전자 전사체의 개시코돈 또는 5'-UTR 지역을 코딩하는 염기서열 변형은, 예를 들면, 내재적 개시코돈에 비해 폴리펩티드 발현율이 더 낮은 다른 개시코돈을 코딩하는 염기서열로 치환하는 것일 수 있으나, 이에 제한되지 않는다.

또한, 상기 4) 및 5)의 아미노산 서열 또는 폴리뉴클레오티드 서열의 변형은 폴리펩티드의 활성을 약화하도록 상기 폴리펩티드의 아미노산 서열 또는 상기 폴리펩티드를 코딩하는 폴리뉴클레오티드 서열을 결실, 삽입, 비보존적 또는 보존적 치환 또는 이들의 조합으로 서열상의 변이 발생, 또는 더욱 약한 활성을 갖도록 개량된 아미노산 서열 또는 폴리뉴클레오티드 서열 또는 활성이 없도록 개량된 아미노산 서열 또는 폴리뉴클레오티드 서열로의 교체일 수 있으나, 이에 한정되는 것은 아니다. 예를 들면, 폴리뉴클레오티드 서열 내 변이를 도입하여 종결 코돈을 형성시킴으로써, 유전자의 발현을 저해하거나 약화시킬 수 있으나, 이에 제한되지 않는다.

상기 6) 폴리펩티드를 코딩하는 상기 유전자의 전사체에 상보적으로 결합하는 안티센스 올리고뉴클레오티드(예컨대, 안티센스 RNA)의 도입은 예를 들어 문헌 [Weintraub, H. et al., Antisense-RNA as a molecular tool for genetic analysis, Reviews - Trends in Genetics, Vol. 1(1) 1986]을 참고할 수 있다.

상기 7) 리보솜(ribosome)의 부착이 불가능한 2차 구조물을 형성시키기 위하여 폴리펩티드를 코딩하는 유전자의 사인-달가르노(Shine-Dalgarno) 서열 앞단에 사인-달가르노 서열과 상보적인 서열의 부가는 mRNA 번역을 불가능하게 하거나 속도를 저하시키는 것일 수 있다.

상기 8) 폴리펩티드를 코딩하는 유전자서열의 ORF(open reading frame)의 3' 말단에 반대 방향으로 전사되는 프로모터의 부가(Reverse transcription engineering, RTE)는 상기 폴리펩티드를 코딩하는 유전자의 전사체에 상보적인 안티센스 뉴클레오티드를 만들어 활성을 약화하는 것일 수 있다.

본 출원의 미생물에서, 변이체, 폴리뉴클레오티드, 벡터 및 분지쇄 아미노산에 대해서는 다른 양태에서 기재한 바와 같다.

본 출원의 다른 하나의 양태는 본 출원의 코리네박테리움 속 미생물을 배지에서 배양하는 단계를 포함하는, 분지쇄 아미노산 생산 방법을 제공한다.

본 출원에서, 용어 "배양"은 본 출원의 코리네박테리움 속 미생물을 적당히 조절된 환경 조건에서 생육시키는 것을 의미한다. 본 출원의 배양과정은 당업계에 알려진 적당한 배지와 배양조건에 따라 이루어질 수 있다. 이러한 배양 과정은 선택되는 균주에 따라 당업자가 용이하게 조정하여 사용할 수 있다. 구체적으로 상기 배양은 회분식, 연속식 및/또는 유가식일 수 있으나, 이에 제한되는 것은 아니다.

본 출원에서 용어, "배지"는 본 출원의 코리네박테리움 속 미생물을 배양하기 위해 필요로 하는 영양물질을 주성분으로 혼합한 물질을 의미하며, 생존 및 발육에 불가결한 물을 비롯하여 영양물질 및 발육인자 등을 공급한다. 구체적으로, 본 출원의 코리네박테리움 속 미생물의 배양에 사용되는 배지 및 기타 배양 조건은 통상의 미생물의 배양에 사용되는 배지라면 특별한 제한 없이 어느 것이나 사용할 수 있으나, 본 출원의 코리네박테리움 속 미생물을 적당한 탄소원, 질소원, 인원, 무기화합물, 아미노산 및/또는 비타민 등을 함유한 통상의 배지 내에서 호기성 조건 하에서 온도, pH 등을 조절하면서 배양할 수 있다.

구체적으로, 코리네박테리움 속 미생물에 대한 배양 배지는 문헌["Manual of Methods for General Bacteriology" by the American Society for Bacteriology (Washington D.C., USA, 1981)]에서 찾아 볼 수 있다.

본 출원에서 상기 탄소원으로는 글루코오스, 사카로오스, 락토오스, 프룩토오스, 수크로오스, 말토오스 등과 같은 탄수화물; 만니톨, 소르비톨 등과 같은 당 알코올, 피루브산, 락트산, 시트르산 등과 같은 유기산; 글루탐산, 메티오닌, 리신 등과 같은 아미노산 등이 포함될 수 있다. 또한, 전분 가수분해물, 당밀, 블랙스트랩 당밀, 쌀겨울, 카사버, 사탕수수 찌꺼기 및 옥수수 침지액 같은 천연의 유기 영양원을 사용할 수 있으며, 구체적으로는 글루코오스 및 살균된 전처리 당밀(즉, 환원당으로 전환된 당밀) 등과 같은 탄수화물이 사용될 수 있으며, 그 외의 적정량의 탄소원을 제한 없이 다양하게 이용할 수 있다. 이들 탄소원은 단독으로 사용되거나 2 종 이상이 조합되어 사용될 수 있으며, 이에 한정되는 것은 아니다.

상기 질소원으로는 암모니아, 황산암모늄, 염화암모늄, 초산암모늄, 인산암모늄, 탄산안모늄, 질산암모늄 등과 같은 무기질소원; 글루탐산, 메티오닌, 글루타민 등과 같은 아미노산, 펩톤, NZ-아민, 육류 추출물, 효모 추출물, 맥아 추출물, 옥수수 침지액, 카세인 가수분해물, 어류 또는 그의 분해생성물, 탈지 대두 케이크 또는 그의 분해 생성물 등과 같은 유기 질소원이 사용될 수 있다. 이들 질소원은 단독으로 사용되거나 2 종 이상이 조합되어 사용될 수 있으며, 이에 한정되는 것은 아니다.

상기 인원으로는 인산 제1칼륨, 인산 제2칼륨, 또는 이에 대응되는 소디움-함유 염 등이 포함될 수 있다. 무기화합물로는 염화나트륨, 염화칼슘, 염화철, 황산마그네슘, 황산철, 황산망간, 탄산칼슘 등이 사용될 수 있으며, 그 외에 아미노산, 비타민 및/또는 적절한 전구체 등이 포함될 수 있다. 이들 구성성분 또는 전구체는 배지에 회분식 또는 연속식으로 첨가될 수 있다. 그러나, 이에 한정되는 것은 아니다.

또한, 본 출원의 코리네박테리움 속 미생물의 배양 중에 수산화암모늄, 수산화칼륨, 암모니아, 인산, 황산 등과 같은 화합물을 배지에 적절한 방식으로 첨가하여, 배지의 pH를 조정할 수 있다. 또한, 배양 중에는 지방산 폴리글리콜 에스테르와 같은 소포제를 사용하여 기포 생성을 억제할 수 있다. 또한, 배지의 호기 상태를 유지하기 위하여, 배지 내로 산소 또는 산소 함유 기체를 주입하거나 혐기 및 미호기 상태를 유지하기 위해 기체의 주입 없이 혹은 질소, 수소 또는 이산화탄소 가스를 주입할 수 있으며, 이에 한정되는 것은 아니다.

본 출원의 배양에서 배양온도는 20 내지 45℃, 구체적으로는 25 내지 40℃를 유지할 수 있고, 약 10 내지 160 시간 동안 배양할 수 있으나, 이에 한정되는 것은 아니다.

본 출원의 배양에 의하여 생산된 분지쇄 아미노산은 배지 중으로 분비되거나 세포 내에 잔류할 수 있다.

본 출원의 분지쇄 아미노산 생산방법은, 본 출원의 코리네박테리움 속 미생물을 준비하는 단계, 상기 균주를 배양하기 위한 배지를 준비하는 단계, 또는 이들의 조합(순서에 무관, in any order)을, 예를 들어, 상기 배양하는 단계 이전에, 추가로 포함할 수 있다.

본 출원의 분지쇄 아미노산 생산방법은, 상기 배양에 따른 배지(배양이 수행된 배지) 또는 본 출원의 코리네박테리움 속 미생물로부터 분지쇄 아미노산을 회수하는 단계를 추가로 포함할 수 있다. 상기 회수하는 단계는 상기 배양하는 단계 이후에 추가로 포함될 수 있다.

상기 회수는 본 출원의 미생물의 배양 방법, 예를 들어 회분식, 연속식 또는 유가식 배양 방법 등에 따라 당해 기술 분야에 공지된 적합한 방법을 이용하여 목적하는 분지쇄 아미노산을 수집(collect)하는 것일 수 있다. 예를 들어, 원심분리, 여과, 결정화 단백질 침전제에 의한 처리(염석법), 추출, 초음파 파쇄, 한외여과, 투석법, 분자체 크로마토그래피(겔여과), 흡착크로마토그래피, 이온교환 크로마토그래피, 친화도 크로마토그래피 등의 각종 크로마토그래피, HPLC 또는 이들의 방법을 조합하여 사용될 수 있으며, 당해 분야에 공지된 적합한 방법을 이용하여 배지 또는 미생물로부터 목적하는 분지쇄 아미노산을 회수할 수 있다.

또한, 본 출원의 분지쇄 아미노산 생산방법은, 추가적으로 정제 단계를 포함할 수 있다. 상기 정제는 당해 기술분야에 공지된 적합한 방법을 이용하여, 수행할 수 있다. 일 예에서, 본 출원의 분지쇄 아미노산 생산방법이 회수 단계와 정제 단계를 모두 포함하는 경우, 상기 회수 단계와 정제 단계는 순서에 상관없이 이시적(또는 연속적)으로 수행되거나, 동시에 또는 하나의 단계로 통합되어 수행될 수 있으나, 이에 제한되는 것은 아니다.

본 출원의 방법에서, 변이체, 폴리뉴클레오티드, 벡터 및 미생물 등은 상기 다른 양태에서 기재한 바와 같다.

본 출원의 또 다른 하나의 양태는 본 출원의 변이체, 상기 변이체를 코딩하는 폴리뉴클레오타이드, 상기 폴리뉴클레오타이드를 포함하는 벡터 또는 본 출원의 폴리뉴클레오티드를 포함하는 코리네박테리움 속 미생물; 이를 배양한 배지; 또는 이들 중 2 이상의 조합을 포함하는 분지쇄 아미노산 생산용 조성물을 제공하는 것이다.

본 출원의 조성물은 분지쇄 아미노산 생산용 조성물에 통상 사용되는 임의의 적합한 부형제를 추가로 포함할 수 있으며, 이러한 부형제는, 예를 들어 보존제, 습윤제, 분산제, 현탁화제, 완충제, 안정화제 또는 등장화제 등일 수 있으나, 이에 한정되는 것은 아니다.

본 출원의 조성물에서, 변이체, 폴리뉴클레오티드, 벡터, 균주, 배지 및 분지쇄 아미노산 등은 상기 다른 양태에서 기재한 바와 같다.

본 출원의 또 다른 하나의 양태는 본 출원의 aroG 알돌라아제 변이체; 상기 aroG 알돌라아제 변이체를 코딩하는 폴리뉴클레오티드; 및 상기 폴리뉴클레오티드를 포함하는 벡터 중 1 이상을 포함하는 미생물의, 분지쇄 아미노산 생산 용도를 제공한다.

본 출원의 용도에서, 변이체, 폴리뉴클레오티드, 벡터 및 미생물 등은 상기 다른 양태에서 기재한 바와 같다.

본 출원의 aroG 알돌라아제 변이체를 이용하는 경우, 이를 이용하지 않는 경우에 비해 부산물 생산량이 저감되며 고수율의 분지쇄 아미노산 생산이 가능하다.

이하 본 출원을 실시예 및 실험예를 통하여 보다 상세하게 설명한다. 그러나 이들 실시예 및 실험예는 본 출원을 예시적으로 설명하기 위한 것으로 본 출원의 범위가 이들 실시예 및 실험예에 한정되는 것은 아니다.

이하 본 출원을 실시 예에 의해 보다 상세하게 설명한다. 그러나 이들 실시 예는 본 출원을 예시적으로 설명하기 위한 것으로, 본 출원의 범위가 이들 실시 예에 의해 제한되는 것은 아니며, 본 출원이 속하는 기술분야에서 통상의 지식을 가진 자에게 있어 명백할 것이다.

실시예 1: aroG 알돌라아제 변이 발굴

실시예 1-1. aroG 알돌라아제를 포함하는 벡터 제작

Phospho-2-dehydro-3-deoxyheptonate aldolase의 활성을 가지는 aroG 알돌라아제 변이 라이브러리를 제작하기 위해 우선 aroG 알돌라아제를 포함하는 재조합 벡터를 제작하였다. 아생형 코리네박테리움 글루타미쿰 (Corynebacterium glutamicum) 유래의 aroG 알돌라아제 (서열번호 1, KEGG ID: NCgl2098)을 암호화하는 aroG 유전자 (서열번호 2)를 증폭하기 위하여, 코리네박테리움 글루타미쿰 (Corynebacterium glutamicum) ATCC13032 야생주의 염색체를 주형으로 서열번호 11및 12의 프라이머를 94 ℃에서 1 분간 변성, 58 ℃에서 30 초간 결합, 72 ℃에서 1 분간 Pfu DNA 중합효소로 중합하는 조건을 25 회 반복하는 PCR방법을 을 수행하였다. 사용한 프라이머의 구체적인 서열은 표 1에 기재하였다. 상기 증폭산물을 TOPO Cloning Kit (Invitrogen)를 이용하여 대장균 벡터 pCR2.1에 클로닝하여 'pCR- aroG'를 얻었다.

서열번호	서열(5'->3')
서열번호 11	TGATGCGCGTCATAATTTAG
서열번호 12	CTCATCTCTGACTGGACGTG

실시예 1-2. aroG 알돌라아제 변이 라이브러리 제작

상기 실시 예 1-1에서 제작된 벡터를 기반으로 error-prone PCR kit (clontech Diversify® PCR Random Mutagenesis Kit)를 이용하여 aroG 알돌라아제 변이 라이브러리를 제작하였다. 1000bp 당 0 내지 3개의 변이가 발생할 수 있는 조건에서, 서열번호 11 및 서열번호 12를 프라이머로 하여 PCR 반응을 수행하였다. 구체적으로, 94℃에서 30초 동안 프리-히팅(pre-heating) 후, 94℃에서 30초, 68℃에서 1분 30초의 과정을 25회(cycle) 반복하여 PCR 반응을 수행하였다. 이 때 얻어진 PCR 산물을 megaprimer (50~125ng) 로 하여 95℃에서 50초, 60℃에서 50초, 68 ℃에서 12분의 과정을 25회 반복 수행한 후 DpnI 처리하여, 대장균 DH5α에 열 충격방법을 통해 형질 전환하여 카나마이신 (25 mg/L) 이 포함된 LB 고체배지에 도말 하였다. 형질전환 된 콜로니 20종을 선별한 후 플라스미드를 획득하여 염기서열을 분석한 결과 2 mutations/kb 빈도로 서로 다른 위치에 변이가 도입된 것을 확인하였다. 약 20,000개의 형질전환 된 대장균 콜로니를 취하여 플라스미드를 추출하였고, 이를 'pTOPO-aroG-library' 로 명명하였다.

실시예 2: 제작한 라이브러리 평가 및 변이체 선별

실시예 2-1. L-류신 생산량이 증가된 변이 균주 선별

상기 실시예 1-2에서 제작된 pTOPO-aroG-library를 야생형 코리네박테리움 글루타미쿰 (Corynebacterium glutamicum) ATCC13032 에 전기천공법으로 형질 전환한 후, 카나마이신 25mg/L를 함유한 영양배지(표 2)에 도말하여 변이 유전자가 삽입된 균주 10,000개의 콜로니를 선별하였다. 선별된 각 콜로니를 ATCC13032/pTOPO_aroG(mt)1부터 ATCC13032/ pTOPO_aroG(mt) 10,000 로 명명하였다.

확보된 10,000개의 콜로니 중 L-류신 생산이 늘어나며 방향족 아미노산 중 L-타이로신 및 L-페닐알라닌이 감소되는 콜로니를 확인하기 위해 각각의 콜로니에 대해 하기와 같은 방법으로 발효 역가 평가를 진행하였다.

배지 종류	성분
생산배지	포도당 100g, (NH₄)₂SO₄ 40g, 대두 단백질(Soy Protein) 2.5g, 옥수수 침지 고형분(Corn Steep Solids) 5 g, 요소 3g, KH₂PO₄ 1g, MgSO₄·7H₂O 0.5g, 바이오틴 100㎍, 티아민 염산염 1,000㎍, 칼슘-판토텐산 2000㎍, 니코틴아미드 3,000㎍, CaCO₃ 30g; (증류수 1리터 기준), pH 7.0
영양배지	포도당 10g, 육즙 5g, 폴리펩톤 10g, 염화나트륨 2.5g, 효모엑기스 5g, 한천 20g, 유레아 2g (증류수 1리터 기준)

가압 살균한 생산배지 (표2) 25 ㎖에 25 ug/ml의 카나마이신을 함유하는 250 ㎖ 코너-바풀 플라스크에 각 콜로니를 백금이를 이용하여 접종한 후, 30 ℃에서 60 시간 동안 200 rpm으로 진탕 배양하였다. 배양 종료 후 고속 액체 크로마토그래피 (HPLC, SHIMAZDU LC20A)를 이용한 방법에 의해 L-류신 및 방향제 아미노산 중 L-타이로신 및 L-페닐알라닌을 측정하였다.

확보된 10,000개의 콜로니 중 야생형 코리네박테리움 글루타미쿰 균주(ATCC13032) 대비 L-류신 생산능이 가장 향상된 균주 (ATCC13032 /pTOPO_aroG(mt)2256, ATCC13032/pTOPO_aroG(mt)6531, ATCC13032 /pTOPO_aroG(mt)8316, ATCC13032/pTOPO_aroG(mt)9426 4종을 선별하였다. 선별된 균주에서 생산된 L-류신(Leu), L-타이로신(Tyr), L-페닐알라닌(Phe)의 농도는 아래 표 3와 같다.

균주명	Leu (g/L)	Tyr (g/L)	Phe (g/L)
ATCC13032	0.87	1.28	1.87
ATCC13032/pTOPO_aroG (mt)2256	1.25	0.43	0.57
ATCC13032/pTOPO_aroG (mt)6531	1.23	0.15	0.19
ATCC13032/pTOPO_aroG (mt)8316	1.31	0.54	0.63
ATCC13032/pTOPO_aroG (mt)9426	1.27	0.31	0.34

상기 표 3에 나타난 바와 같이, aroG 유전자에 변이가 있는 코리네박테리움 글루타미쿰 ATCC13032/pTOPO_aroG(mt)2256은 모균주인 코리네박테리움 글루타미쿰 ATCC13032에 비해 L-류신 생산능이 약 1.4배 향상됨을 확인하였다. ATCC13032 /pTOPO_aroG(mt)6531, ATCC13032 /pTOPO_aroG(mt)8316, ATCC13032 /pTOPO_aroG(mt)9426은 모균주 대비 L-류신 생산량이 각각 약 1.4배 향상됨을 확인하였다. ATCC13032/pTOPO_aroG(mt)2256, ATCC13032/pTOPO_aroG(mt)6531, ATCC13032/pTOPO_aroG(mt)8316, ATCC13032/pTOPO_aroG(mt)9426 4종 모두 L-타이로신이 2.4배 내지 8.5배, L-페닐알라닌이 3배 내지 10배 감소됨을 확인하였다.

실시예 2-2. L-류신 생산량 증가 및 방향제 아미노산 생산량 감소된 변이 균주의 변이 확인

선별된 변이 균주 4종의 aroG 유전자 변이를 확인하기 위하여, 표 1에 기재된 서열번호 11과 서열번호 12의 프라이머를 이용하여 각 변이 균주의 DNA를 주형으로 하여 94℃에서 5분간 변성 후, 94℃에서 30초, 55℃에서 30초, 72℃에서 1분 30초를 30회 반복한 후, 72℃에서 5분의 조건으로 PCR을 수행하고 DNA시퀀싱을 진행하였다.

시퀀싱 결과, ATCC13032/pTOPO_aroG (mt)2256 균주는 aroG 유전자의 649번째, 650번째, 651번째 뉴클레오티드인 CGC가 GCG로 치환되어 있음을 확인하였다. 이는 aroG 알돌라아제의 217번째 아미노산인 아르기닌이 알라닌으로 치환된 변이체(이하, R217A)를 암호화할 수 있음을 의미한다. aroG 알돌라아제 변이체 (R217A)의 아미노산 서열 및 이를 암호화하는 aroG 알돌라아제 변이체의 염기서열은 서열번호 3 및 4와 같다.

또한 ATCC13032/pTOPO_aroG(mt)6531 균주는 aroG 유전자의 928번째, 929번째 뉴클레오티드인 AA가 GC로 치환되어 있음을 확인하였다. 이는 aroG 알돌라아제의 310번째 아미노산인 라이신이 알라닌으로 치환된 변이체(이하, K310A)를 암호화할 수 있음을 의미한다. aroG 알돌라아제 변이체 (K310A)의 아미노산 서열 및 이를 암호화하는 aroG 알돌라아제 변이체의 염기서열은 서열번호 5 및 6과 같다.

ATCC13032/pTOPO_aroG(mt)8316 균주는 aroG 유전자의 1207번째-1209번째 뉴클레오티드인 CGC가 GCG로 치환되어 있음을 확인하였다. 이는 aroG 알돌라아제의 403번째 아미노산인 아르기닌이 알라닌으로 치환된 변이체(이하, R403A)를 암호화할 수 있음을 의미한다. aroG 알돌라아제 변이체 (R403A)의 아미노산 서열 및 이를 암호화하는 aroG 알돌라아제 변이체의 염기서열은 서열번호 7 및 8과 같다.

ATCC13032/pTOPO_aroG(mt)9426 균주는 DAHP 유전자의 1385번째-1386번째 뉴클레오티드인 AA가 CG로 치환되어 있음을 확인하였다. 이는 aroG 알돌라아제의 462번째 아미노산인 글루타메이트가 알라닌으로 치환된 변이체(이하, E462A)를 암호화할 수 있음을 의미한다. aroG 알돌라아제 변이체 (E462A)의 아미노산 서열 및 이를 암호화하는 aroG 알돌라아제 변이체의 염기서열은 서열번호 9 및 10와 같다.

따라서, 이하 실시예에서는, 상기 변이(R217A, K310A, R403A, E462A)가 코리네 박테리움 속 미생물의 L-류신 및 방향족 아미노산 생산에 영향을 미치는지 확인하고자 하였다.

실시예 3: 선별된 변이 균주의 L-류신, L-타이로신, L-페닐알라닌 생산능 확인

실시예 3-1. aroG 알돌라아제 변이를 포함하는 삽입 벡터 제작

상기 실시 예 2에서 선별된 변이를 균주 내로 도입하기 위해 삽입용 벡터를 제작하고자 하였다. aroG (R217A, K310A, R403A, E462A) 변이 도입용 벡터 제작은 위치 지정 돌연변이 생성 (Site directed mutagenesis) 방법을 사용하였다. 코리네박테리움 글루타미쿰 ATCC13032 야생형의 염색체를 주형으로 R217A 변이를 생성하기 위해 서열번호 13 및 14의 프라이머, 서열번호 15 및 16의 프라이머 쌍을 이용하였고, K310A 변이를 생성하기 위해 서열번호 13 및 17의 프라이머, 서열번호 15 및 18의 프라이머 쌍을 이용하였고 PCR을 수행하였다. R403A 변이를 생성하기 위해 서열번호 13 및 19의 프라이머, 서열번호 15 및 20의 프라이머 쌍을 이용하였고, E462A 변이를 생성하기 위해 서열번호 13 및 21의 프라이머, 서열번호 15 및 22의 프라이머 쌍을 이용하였고 PCR을 수행하였다. 구체적으로, 94℃에서 5분간 변성 후에 94℃에서 30초, 55℃에서 30초, 72℃에서 1분 30초를 30회 반복한 후, 72℃에서 5분의 조건으로 PCR을 수행하였다. 사용한 프라이머의 구체적인 서열은 표 4에 기재하였다.

서열번호	서열(5'->3')
서열번호 13	GTGAATTCGAGCTCGGTACCCAGTTGAATGCTACCAACTTG
서열번호 14	CACGAGCAAGAGCCTCGTAcgcTGCACCAGCTGGG
서열번호 15	GGTCGACTCTAGAGGATCCCCGCTGTTATTACTGTGCCTG
서열번호 16	GAACTCCCCAGCTGGTGCAgcgTACGAGGCTCTTGCTCG
서열번호 17	GGGTGATACCAGGACCAATcgcGATGCCGATTGGGTTAG
서열번호 18	CTCTAACCCAATCGGCATCgcgATTGGTCCTGGTATCAC
서열번호 19	CTGGGTGGGTGCCCAATGCcgcGTGGACCTCGAAGAAG
서열번호 20	GGGCTTCTTCGAGGTCCACgcgGCATTGGGCACCCAC
서열번호 21	AAGCTTAGTTACGCAGCATcgcTGCAACGAGGAAAGCC
서열번호 22	GTTGGCTTTCCTCGTTGCAgcgATGCTGCGTAACTAAGC

그 결과 얻어진 PCR 산물을 SmaI 제한효소로 절단시킨 선상의 pDCM2 벡터(한국공개특허 KR 10-2020-0136813 A)와 In-Fusion 효소를 이용해 DNA 단편 간의 말단 15 base의 상동서열을 fusion 시켜 클로닝하여 aroG의 아미노산을 치환하는 벡터 'pDCM2-aroG(R217A)', 'pDCM2-aroG (K310A)', 'pDCM2-aroG(R403A)', 및 'pDCM2-aroG(E462A)'를 제작하였다. 또한 변이체를 조합하여 진행하여 이에 따라 aroG의 217번, 310번, 403번 및 462번 아미노산을 치환하는 벡터 'pDCM2-aroG (R217A, K310A, E462A)', 'pDCM2-aroG (R217A, K310A, R403A, E462A)'를 제작하였다. aroG 알돌라아제 변이체 (R217A, K310A, E462A) 의 아미노산 서열 및 이를 암호화하는 aroG 알돌라아제 변이체의 염기서열은 서열번호 23 및 24 와 같다. 또한 aroG 알돌라아제 변이체 (R217A, K310A, R403A, E462A)의 아미노산 서열 및 이를 암호화하는 aroG 알돌라아제 변이체의 염기서열은 서열번호 25 및 26와 같다.

실시예 3-2. ATCC13032 균주 내 변이체 도입 및 평가

상기 실시예 3-1에서 제작한 pDCM2- aroG (R217A), pDCM2- aroG (K310A), pDCM2- aroG (R403A), pDCM2- aroG (E462A), pDCM2- aroG (R217A, K310A, E462A), pDCM2- aroG (R217A, K310A, R403A, E462A)벡터를 ATCC13032에 전기천공법으로 형질전환하고 상동성 서열의 재조합에 의해 염색체 상에 벡터가 삽입된 균주는 카나마이신(kanamycin) 25 mg/L를 함유한 배지에서 선별하였다. 선별된 1차 균주는 다시 2차 교차(cross-over)를 거쳐, 목표 유전자의 변이가 도입된 균주를 선정하였다. 최종적으로 형질전환된 균주의 aroG 유전자 변이 도입의 여부는 표1에 기재된 서열번호 11와 서열번호 12의 프라이머를 이용하여 PCR을 수행한 후 염기서열을 분석함으로써 균주 내 변이가 도입 되었음을 확인하였다. 제작된 균주는 총 5종이며, ATCC13032 _aroG_R217A, ATCC13032 _aroG_K310A, ATCC13032 _aroG_R403A, ATCC13032 _aroG_E462A, ATCC13032 _aroG_(R217A, K310A, E462A), ATCC13032 _aroG_(R217A, K310A, R403A, E462A)로 명명하였다.

상기 제작된 총 6종의 균주 L-류신 및 방향족 아미노산 생산능을 평가하기 위해 플라스크 발효 역가 평가를 진행하였다. 각각의 생산배지 25 ㎖을 함유하는 250 ㎖ 코너-바풀 플라스크에 모균주인 코리네박테리움 글루타미쿰 ATCC13032 및 상기 제작한 ATCC13032 _aroG_R217A, ATCC13032 _aroG_K310A, ATCC13032 _aroG_R403A, ATCC13032 _aroG_E462A, ATCC13032 _aroG_(R217A, K310A, E462A), ATCC13032 _aroG_(R217A, K310A, R403A, E462A)을 각각 1백금이 접종한 후, 30 ℃에서 60 시간 동안 200 rpm으로 진탕 배양하여 L-류신을 생산하였다. 배양종료 후 HPLC로 L-류신, L-타이로신 및 L-페닐알라닌의 생산량을 측정하였다. 실험한 각 균주에 대한 배양액 중의 류신 농도는 아래 표 5와 같다.

균주명	Leu (g/L)	Tyr (g/L)	Phe (g/L)
ATCC13032	0.87	1.28	1.87
ATCC13032 _aroG_R217A	1.17	0.41	0.54
ATCC13032 _aroG_K310A	1.19	0.15	0.13
ATCC13032 _aroG_R403A	1.25	0.48	0.65
ATCC13032 _aroG_E462A	1.27	0.28	0.32
ATCC13032 _aroG_(R217A, K310A, E462A)	1.35	0.32	0.25
ATCC13032 _aroG_(R217A, K310A, R403A, E462A)	1.30	0.28	0.30

상기 표 5에 나타난 바와 같이, ATCC13032 _aroG_R217A, ATCC13032 _aroG_K310A, ATCC13032 _aroG_R403A, ATCC13032 _aroG_E462A, ATCC13032 _aroG_(R217A, K310A, E462A), ATCC13032 _aroG_(R217A, K310A, R403A, E462A)는 모균주인 코리네박테리움 글루타미쿰 ATCC13032 에 비해 L-류신의 수율이 약 1.35 배 내지 1.55배 향상됨을 확인하였다. 또한 L-타이로신의 수율이 2.5배 내지 8.5배 감소되었으며 L-페닐알라닌이 약 3.5배 내지 14배 감소 됨을 확인하였다.

실시예 4: 류신 생산주에서 aroG 선별 변이의 류신 및 타이로신, 페닐알라닌 생산능 확인

코리네박테리움 속 야생형의 균주는 류신을 생산하더라도 아주 극미량이 생산될 뿐이다. 이에 ATCC13032 유래의 류신 생산 균주를 제작하고, 선별한 변이를 도입하여 류신 및 타이로신, 페닐알라닌 생산능을 확인 하는 실험을 진행하였다. 구체적인 실험은 다음과 같다.

실시예 4-1. L-류신 생산주 CJL-8109 균주 제작

고농도의 L-류신 생산을 위한 균주로서 (1) leuA 유전자의 1673 번째 뉴클레오티드인 G가 A로 치환되어 LeuA 단백질의 558 번째 아미노산인 아르기닌이 히스티딘으로 치환되는 변이(R558H)와 (2) leuA 유전자의 1682 번째, 1683 번째 뉴클레오티드인 GC가 AT로 치환되어 561 번째 아미노산인 글리신이 아스파르트산으로 치환되는 변이(G561D)와 (3) leuA 유전자의 739번째, 740번째 뉴클레오티드인 CC 가 TG 로 치환되어 247번째 아미노산인 프롤린이 시스테인으로 치환되는 변이 (P247C) 를 포함하는 ATCC13032 유래의 균주를 제조하였다.

구체적으로 상기의 leuA 유전자 변이를 포함하는 pDCM2-leuA(P247C, R558H, G561D) 벡터를 코리네박테리움 글루타미쿰 ATCC13032 에 전기천공법으로 형질전환하고 카나마이신(kanamycin) 25 mg/L를 함유한 배지에서 상동성 서열의 재조합에 의해 염색체 상에 벡터가 삽입된 균주를 선별하였다. 선별된 1차 균주는 다시 2차 교차(cross-over)를 거쳐, leuA 유전자의 변이가 도입된 균주를 선정하였다. 최종적으로 형질전환된 균주의 변이 도입 여부는 표 6의 서열번호 27와 서열번호 28의 프라이머를 이용하여 PCR(94℃ 5분 후, 94℃ 30초/55℃ 30초/72℃ 90초 30회 반복, 72℃ 5분)을 수행하고 염기서열을 분석하여 P247C, R558H, G561D 변이가 도입된 것을 확인하였다. pDCM2-leuA(P247C, R558H, G561D) 벡터로 형질전환된 ATCC13032_leuA_(P247C, R558H, G561D) 균주를 ‘CJL-8105’으로 명명하였다.

서열번호	서열(5'->3')
27	TATGCTTCACCACATGACTTC
28	AAATCATTTGAGAAAACTCGAGG

제작한 CJL-8105 균주에 L-류신 생산능을 높여주기 위해 분지쇄 아미노산 아미노트랜스퍼라제 (branched-chain amino acid aminotransferase)를 코딩하는 유전자인 ilvE 변이체 (V156A)가 도입된 균주를 제작하였다. (대한민국 등록특허 KR 10-2143964 B1). 구체적으로 상기의 ilvE 유전자 변이를 포함하는 pDCM2-ilvE(V156A) 벡터를 코리네박테리움 글루타미쿰 CJL-8105에 전기천공법으로 형질전환하고 카나마이신(kanamycin) 25 mg/L를 함유한 배지에서 상동성 서열의 재조합에 의해 염색체 상에 벡터가 삽입된 균주를 선별하였다. 선별된 1차 균주는 다시 2차 교차(cross-over)를 거쳐, ilvE 유전자의 변이가 도입된 균주를 선정하였다. 최종적으로 형질전환된 균주의 변이 도입 여부는 표 7의 서열번호 29와 서열번호 30의 프라이머를 이용하여 PCR(94℃ 5분 후, 94℃ 30초/55℃ 30초/72℃ 90초 30회 반복, 72℃ 5분)을 수행하고 염기서열을 분석하여 V156A 변이가 도입된 것을 확인하였다. pDCM2-ilvE(V156A) 벡터로 형질전환된 균주를 ‘CJL-8108’로 명명하였다.

서열번호	서열(5'->3')
29	GTCACCCGATCGTCTGAAG
30	GTCTTAAAACCGGTTGAT

제작한 CJL-8108 균주에 L-류신 생산능을 높여주기 위해 시트레이트 신타아제 (Citrate Synthase) 활성을 약화시킨 gltA 변이체 (M312I; 서열번호 41)가 도입된 균주를 제작하였다. 구체적으로 상기의 gltA 유전자 변이를 포함하는 pDCM2-gltA(M312I) 벡터를 코리네박테리움 글루타미쿰 CJL-8108에 전기천공법으로 형질전환하고 카나마이신(kanamycin) 25 mg/L를 함유한 배지에서 상동성 서열의 재조합에 의해 염색체 상에 벡터가 삽입된 균주를 선별하였다. 선별된 1차 균주는 다시 2차 교차(cross-over)를 거쳐, gltA 유전자의 변이가 도입된 균주를 선정하였다. 최종적으로 형질전환된 균주의 변이 도입 여부는 표 8의 서열번호 31와 서열번호 32의 프라이머를 이용하여 PCR(94℃ 5분 후, 94℃ 30초/55℃ 30초/72℃ 90초 30회 반복, 72℃ 5분)을 수행하고 염기서열을 분석하여 M312I 변이가 도입된 것을 확인하였다. pDCM2-gltA(M312I) 벡터로 형질전환된 균주를 ‘CJL-8109’로 명명하였다.

서열번호	서열(5'->3')
31	CAATGCTGGCTGCGTACGC
32	CTCCTCGCGAGGAACCAACT

실시예 4-2. CJL-8109 균주 내 aroG 알돌라아제 변이체 도입 및 평가

류신 생산 균주인 CJL-8109을 상기 실시예 3-1에서 제작한 pDCM2-aroG(R217A), pDCM2-aroG(K310A), pDCM2-aroG(R403A), pDCM2-aroG(E462A), pDCM2-aroG(R217A, K310A, E462A), pDCM2-aroG(R217A, K310A, R403A, E462A)벡터로 형질전환하고 상동성 서열의 재조합에 의해 염색체 상에 벡터가 삽입된 균주는 카나마이신 25mg/L를 함유한 배지에서 선별하였다. 선별된 1차 균주는 다시 2차 교차(cross-over)를 거쳐, 목표 유전자의 변이가 도입된 균주를 선정하였다. 최종적으로 형질 전환된 균주의 aroG 유전자 변이 도입의 여부는 서열번호 11과 서열번호 12의 프라이머를 이용하여 PCR을 수행한 후 염기서열을 분석함으로써 균주 내 aroG 알돌라아제 변이가 도입 되었음을 확인하였다. 제작된 CJL-8109_aroG_R217A를 CJL-8110로, CJL-8109_aroG_K310A를 CJL-8111, CJL-8109_aroG_R403A를 CJL-8112, CJL-8109_aroG_E462A를 CJL-8113, CJL-8109_aroG_(R217A, K310A, E462A)를 CA13-8114로, CJL-8109_aroG_(R217A, K310A, R403A, E462A)를 CJL-8115로 명명하였다.

상기 제작된 CJL-8110, CJL-8111, CJL-8112, CJL-8113, CA13-8114, CJL-8115 및 ATCC13032, CJL-8109 균주의 류신 생산능을 평가하였다. 실시예 2와 같은 방식으로 플라스크 배양을 진행하였고 배양 종료 후 HPLC를 이용한 방법에 의해 류신 및 방향족 아미노산 생산량을 측정하였으며, 배양 결과는 하기 표 9과 같다.

균주명	Leu (g/L)	Tyr (g/L)	Phe (g/L)
ATCC13032	0.87	1.28	1.87
CJL-8109	2.77	1.08	1.57
CJL8109_aroG_R217A : CJL-8110	3.55	0.31	0.49
CJL8109_aroG_K310A : CJL-8111	3.36	0.12	0.10
CJL8109_aroG_R403A : CJL-8112	3.65	0.35	0.56
CJL8109_aroG_E462A : CJL-8113	3.78	0.21	0.25
CJL8109_aroG_(R217A, K310A, E462A) : CA13-8114	3.85	0.19	0.22
CJL-8109_aroG_(R217A, K310A, R403A, E462A) : CJL-8115	3.80	0.19	0.23

상기 표 9 에 나타난 바와 같이, aroG 유전자에 R217A, K310A, R403A, E462A 변이가 추가로 있는 L-류신 생산균주 코리네박테리움 글루타미쿰 CJL-8110, CJL-8111, CJL-8112, CJL-8113, CA13-8114, CJL-8115은 모균주인 코리네박테리움 글루타미쿰 ATCC13032에 비해 L-류신 생산능이 약 4 내지 5 배 향상됨을 확인하였다. 또한 L-류신 생산균주 코리네박테리움 글루타미쿰 CJL-8110, CJL-8111, CJL-8112, CJL-8113, CA13-8114, CJL-8115은 모균주인 코리네박테리움 글루타미쿰 CJL-8109에 비해 L-류신 생산능이 약 1.2 내지 1.6 배 향상되었으며 L-타이로신 및 L-페닐알라닌이 약 10배 내지 20배 감소됨을 확인하였다.

상기 결과를 통해 aroG 알돌라아제의 아미노산 서열 중 217번째, 310번째, 403번째, 462번째 위치의 아미노산이 L-류신 생산 및 방향족 아미노산인 L-타이로신 및 L- 페닐알라닌 생산에 중요한 위치임을 확인할 수 있다.

상기 제작한 균주 CA13-8114는 2021.01.18일자로 부다페스트 조약하의 국제기탁기관인 한국미생물보존센터(KCCM)에 국제기탁하여 KCCM12931P로 기탁번호를 부여받았다.

실시예 5. 이소류신 생산주에서 aroG 선별 변이의 류신 및 타이로신, 페닐알라닌 생산능 확인

류신과 대표적인 분지쇄 아미노산인 이소류신에 대하여도 선별된 변이가 효과를 나타내는지를 확인하고자 코리네박테리움 속 이소류신 생산 균주에 도입하여 이소류신 생산능을 확인 하는 실험을 진행하였다. 구체적인 실험은 다음과 같다.

실시예 5-1. L-이소류신 생산주 CA10-3101 균주 제작

야생형 코리네박테리움 글루타미쿰 ATCC13032 로부터 L-이소류신 생산 균주를 개발하였다. 구체적으로, 생합성 경로에서 이소류신의 전구체인 쓰레오닌의 피드백 저해 해소를 위해 호모세린 디하이드로게나제를 코딩하는 유전자인 hom의 407번째 아미노산인 아르기닌(Arginine)을 히스티딘(Histidine)으로 치환하였다 (US 2020-0340022 A1). 구체적으로, hom(R407H) 변이가 도입된 균주들을 제작하기 위해 코리네박테리움 글루타미쿰 ATCC13032의 염색체를 주형으로 하여 서열번호 33 및 서열번호 34 혹은 서열번호 35 및 서열번호 36의 프라이머를 이용하여 PCR을 각각 수행하였다. 여기에서 사용된 프라이머 서열은 하기 표 10와 같다.

서열번호	서열(5'->3')
33	TCGAGCTCGGTACCCCGCTTTTGCACTCATCGAGC
34	CACGATCAGATGTGCATCATCAT
35	ATGATGATGCACATCTGATCGTG
36	CTCTAGAGGATCCCCGAGCATCTTCCAAAACCTTG

PCR 반응을 위한 중합효소로는 PfuUltraTM 고-신뢰 DNA 폴리머라제(Stratagene)를 사용하였으며, PCR 조건은 변성 95℃, 30초; 어닐링 55℃, 30초; 및 중합반응 72℃, 1분을 28회 반복하였다. 그 결과, hom 유전자의 변이를 중심으로 5' 상단 부위의 1000 bp DNA 단편과 3' 하단 부위의 1000 bp의 DNA 단편을 각각 수득하였다. 증폭된 두 가지의 DNA 절편을 주형으로 하여, 서열번호 34 및 서열번호 35의 프라이머로 PCR을 수행하였다. PCR 조건은 95℃에서 5분간 변성 후, 95℃ 30초 변성, 55℃ 30초 어닐링, 72℃ 2분 중합을 28회 반복한 후, 72℃에서 5분간 중합반응을 수행하였다.

그 결과, 407번째 아르기닌이 히스티딘으로 치환된 호모세린 디하이드로게나제 변이체를 코딩하는 hom 유전자의 변이를 포함하는 2 kb의 DNA 단편이 증폭되었다. 증폭 산물을 PCR 정제 키트(PCR Purification kit, QUIAGEN)를 사용하여 정제하여 벡터 제작을 위한 삽입 DNA 단편으로 사용하였다. 정제한 증폭 산물을 제한효소 smaI으로 처리한 후, 65℃에서 20분간 열처리한 pDCM2 벡터와 상기 증폭 산물인 삽입 DNA 단편의 몰농도(M) 비율이 1:2가 되도록 하고, 인퓨전 클로닝 키트(Infusion Cloning Kit, TaKaRa)를 사용하여 제공된 매뉴얼에 따라 클로닝함으로써 hom(R407H) 변이를 염색체상에 도입하기 위한 벡터 pDCM2-R407H를 제작하였다.

제작된 벡터를 전기천공법으로 코리네박테리움 글루타미쿰 ATCC13032에 형질전환하고, 2차 교차 과정을 거쳐 염색체 상에서 hom(R407H) 변이를 포함하는 균주를 얻었으며, 이를 코리네박테리움 글루타미쿰 ATCC13032 hom(R407H)로 명명하였다.

제작한 ATCC13032 hom(R407H) 균주에 L-이소류신에 피드백 해제와 활성을 높여주기 위해 L-쓰레오닌 디하이드라타아제를 코딩하는 유전자인 ilvA 변이체(T381A, F383A)가 도입된 균주를 제작하였다. 더 구체적으로, ilvA(T381A, F383A) 변이가 도입된 균주들을 제작하기 위해 코리네박테리움 글루타미쿰 ATCC13032의 염색체를 주형으로 하여 서열번호 37 및 서열번호 38 혹은 서열번호 39 및 서열번호 40의 프라이머를 이용하여 PCR을 각각 수행하였다. 여기에서 사용된 프라이머 서열은 하기 표 11와 같다.

서열번호	서열 (5'→ 3')
37	TCGAGCTCGGTACCCATGAGTGAAACATACGTGTC
38	GCGCTTGAGGTACTCtgcCAGCGcGATGTCATCATCCGG
39	CCGGATGATGACATCgCGCTGgcaGAGTACCTCAAGCGC
40	CTCTAGAGGATCCCCCGTCACCGACACCTCCACA

PCR 반응을 위한 중합효소로는 PfuUltraTM 고-신뢰 DNA 폴리머라제(Stratagene)를 사용하였으며, PCR 조건은 변성 95℃, 30초; 어닐링 55℃, 30초; 및 중합반응 72℃, 1분을 28회 반복하였다. 그 결과, ilvA 유전자의 변이를 중심으로 5' 상단 부위의 1126 bp DNA 단편과 3' 하단 부위의 286 bp의 DNA 단편을 각각 수득하였다. 증폭된 두 가지의 DNA 절편을 주형으로 하여, 서열번호 37 및 서열번호 40의 프라이머로 PCR을 수행하였다. PCR 조건은 95℃에서 5분간 변성 후, 95℃ 30초 변성, 55℃ 30초 어닐링, 72℃ 2분 중합을 28회 반복한 후, 72℃에서 5분간 중합반응을 수행하였다.

그 결과, 381번째 쓰레오닌이 알라닌으로, 383번째 페닐알라닌이 알라닌으로 치환된 쓰레오닌 디하이드라타제 변이체를 코딩하는 ilvA 유전자의 변이를 포함하는 1.4 kb의 DNA 단편이 증폭되었다. 증폭 산물을 PCR 정제 키트(PCR Purification kit, QAIGEN)를 사용하여 정제하여 벡터 제작을 위한 삽입 DNA 단편으로 사용하였다. 정제한 증폭 산물을 제한효소 smaI으로 처리한 후, 65℃에서 20분간 열처리한 pDCM2 벡터와 상기 증폭 산물인 삽입 DNA 단편의 몰농도(M) 비율이 1:2가 되도록 하고, 인퓨전 클로닝 키트(Infusion Cloning Kit, TaKaRa)를 사용하여 제공된 매뉴얼에 따라 클로닝함으로써 ilvA(T381A, F383A) 변이를 염색체상에 도입하기 위한 벡터 pDCM2- ilvA(T381A, F383A) 를 제작하였다. 제작된 벡터를 전기천공법으로 코리네박테리움 글루타미쿰 ATCC13032 hom(R407H) 에 형질전환하고, 2차 교차 과정을 거쳐 염색체 상에서 ilvA(T381A, F383A) 변이를 포함하는 균주를 얻었으며, 이를 코리네박테리움 글루타미쿰 CA10-3101이라 명명하였다.

실시예 5-2. CA10-3101 균주 내 aroG 알돌라아제 변이체 도입 및 평가

L-이소류신 생산 균주인 CA10-3101을 상기 실시예 3-1에서 제작한 pDCM2-aroG (R217A), pDCM2-aroG(K310A), pDCM2-aroG(R403A), pDCM2-aroG(E462A), pDCM2-aroG(R217A, K310A, E462A), pDCM2-aroG(R217A, K310A, R403A, E462A)벡터로 형질전환하고 상동성 서열의 재조합에 의해 염색체 상에 벡터가 삽입된 균주는 카나마이신 25mg/L를 함유한 배지에서 선별하였다. 선별된 1차 균주는 다시 2차 교차(cross-over)를 거쳐, 목표 유전자의 변이가 도입된 균주를 선정하였다. 최종적으로 형질 전환된 균주의 aroG 유전자 변이 도입의 여부는 서열번호 11과 서열번호 12의 프라이머를 이용하여 PCR을 수행한 후 염기서열을 분석함으로써 균주 내 aroG 알돌라아제에 변이가 도입 되었음을 확인하였다.

제작된 균주를 CA10-3101_aroG_R217A, CA10-3101_aroG_K310A, CA10-3101_aroG_R403A, CA10-3101_aroG_E462A, CA10-3101_aroG_(R217A, K310A, E462A), CA10-3101_aroG_(R217A, K310A, R403A, E462A)로 명명하였다.

상기 제작된 CA10-3101_aroG_R217A, CA10-3101_aroG_K310A, CA10-3101_aroG_R403A, CA10-3101_aroG_E462A, CA10-3101_aroG_(R217A, K310A, E462A), CA10-3101_aroG_(R217A, K310A, R403A, E462A)및 ATCC13032, CA10-3101 균주의 L-이소류신 생산능을 평가하였다. 이소류신 생산배지 25 ㎖을 함유하는 250 ㎖ 코너-바풀 플라스크에 모균주 및 상기 aroG 알돌라아제 변이주를 접종한 후, 32℃에서 60시간동안 200 rpm으로 진탕 배양하여 L-이소류신을 제조하였다.

본 실시예 에서 사용한 생산배지의 조성은 하기와 같다.

<생산배지>

포도당 10%, 효모추출물 0.2%, 황산암모늄 1.6%, 제1인산칼륨 0.1%, 황산마그네슘7수염 0.1%, 황산철7수염 10mg/ℓ, 황산망간1수염 10 mg/ℓ, 비오틴 200 ㎍/ℓ, pH 7.2

배양종료 후, 액체고속크로마토그래피(HPLC)를 이용하여 L-이소류신 및 부산물의 생산량을 측정하였고, 실험한 각 균주에 대한 배양액 중의 L-이소류신과 부산물의 농도는 하기 표 12에 나타내었다.

	L-이소류신농도(g/L)	L-Tyr 농도 (g/L)	L-Phe 농도 (g/L)
ATCC13032	0.0	1.2	1.5
CA10-3101(모균주)	2.2	0.3	0.6
CA10-3101_aroG_R217A	2.5	0.0	0.1
CA10-3101_aroG_K310A	2.3	0.0	0.0
CA10-3101_aroG_R403A	2.5	0.0	0.1
CA10-3101_aroG_E462A	2.6	0.0	0.0
CA10-3101_aroG_(R217A, K310A, E462A)	2.6	0.0	0.0
CA10-3101_aroG_(R217A, K310A, R403A, E462A)	2.7	0.0	0.0

상기 표 12에 나타난 바와 같이, aroG 유전자에 R217A, K310A, R403A, E462A 변이가 추가로 있는 L-이소류신 생산균주는 모균주인 코리네 글루타미쿰 CA10-3101에 비해 L-이소류신 생산능이 약 1.1 내지 1.2 배 향상되었으며 L-타이로신 및 L-페닐알라닌이 감소됨을 확인하였다.

상기 결과를 통해 aroG 알돌라아제의 아미노산 서열 중 217번째, 310번째, 403번째, 462번째 위치의 아미노산이 L-이소류신 생산 및 방향족 아미노산인 L-타이로신 및 L- 페닐알라닌 생산에 중요한 위치임을 확인할 수 있다

실시예 6: 발린 생산주에서 aroG 선별 변이의 발린 생산능 확인

류신과 같은 대표적인 분지쇄 아미노산 L-발린에 대하여도 선별된 변이가 효과를 나타내는지를 확인하고자 코리네박테리움 속 발린 생산 균주 KCCM11201P에서도 선별한 변이를 도입하여 발린 생산능을 확인 하는 실험을 진행하였다. 구체적인 실험은 다음과 같다.

실시예 6-1. KCCM11201P 균주 내 aroG 알돌라아제 변이체 도입 및 평가

해당 변이가 발린 생산능 증가에 효과가 있는지를 확인하기 위하여 L-발린 생산 균주인 코리네박테리움 글루타미쿰 KCCM11201P(US 8465962 B2) 균주를 이용하였다. 발린 생산 균주인 KCCM11201P를 상기 실시예 3-1에서 제작한 pDCM2-aroG (R217A), pDCM2-aroG(K310A), pDCM2-aroG(R403A), pDCM2-aroG(E462A), pDCM2-aroG(R217A, K310A, E462A), pDCM2-aroG(R217A, K310A, R403A, E462A)벡터로 형질전환하고 상동성 서열의 재조합에 의해 염색체 상에 벡터가 삽입된 균주는 카나마이신 25 mg/L를 함유한 배지에서 선별하였다. 선별된 1차 균주는 다시 2차 교차(cross-over)를 거쳐, 목표 유전자의 변이가 도입된 균주를 선정하였다. 최종적으로 형질 전환된 균주의 aroG 유전자 변이 도입의 여부는 서열번호 11과 서열번호 12의 프라이머를 이용하여 PCR을 수행한 후 염기서열을 분석함으로써 균주 내 aroG 알돌라아제 변이가 도입 되었음을 확인하였다. 제작된 균주를 KCCM11201P -aroG(R217A), KCCM11201P - aroG(K310A), KCCM11201P - aroG(R403A), KCCM11201P - aroG(E462A), KCCM11201P - aroG(R217A, K310A, E462A) 및 KCCM11201P - aroG(R217A, K310A, R403A, E462A)로 각각 명명하였다.

상기 제작된 KCCM11201P -aroG(R217A), KCCM11201P - aroG(K310A), KCCM11201P - aroG (R403A), KCCM11201P - aroG (E462A), KCCM11201P - aroG(R217A, K310A, E462A) 및 KCCM11201P - aroG(R217A, K310A, R403A, E462A)균주의 발린 생산능을 평가하였다. 실시예 2와 같은 방식으로 플라스크 배양을 진행하였고 배양 종료 후 HPLC를 이용한 방법에 의해 발린 생산량을 측정하였으며, 배양 결과는 하기 표 13와 같다.

균주명	Val (g/L)	Tyr (mg/L)	Phe (mg/L)
KCCM11201P	2.60	58.25	146.62
KCCM11201P - aroG(R217A)	2.67	16.72	45.76
KCCM11201P - aroG (K310A)	2.81	6.47	9.34
KCCM11201P - aroG (R403A)	2.74	18.88	52.30
KCCM11201P - aroG (E462A)	2.84	11.33	23.35
KCCM11201P - aroG(R217A, K310A, E462A)	2.85	10.25	21.34
KCCM11201P - aroG(R217A, K310A, R403A, E462A)	2.89	10.25	20.55

상기 표 13에 나타난 바와 같이, aroG 유전자에 R217A, K310A, R403A, E462A 변이가 추가로 있는 L-발린 생산균주 코리네박테리움 글루타미쿰 KCCM11201P -aroG (R217A), KCCM11201P - aroG (K310A), KCCM11201P - aroG (R403A), KCCM11201P - aroG (E462A), KCCM11201P - aroG(R217A, K310A, E462A) 및 KCCM11201P - aroG (R217A, K310A, R403A, E462A)은 모균주인 코리네박테리움 글루타미쿰 KCCM11201P에 비해 발린 생산능이 최대 1.11 배 향상되었으며 L-타이로신 및 L-페닐알라닌이 약 10배 내지 20배 감소됨을 확인하였다.

상기 결과를 통해 aroG 알돌라아제의 아미노산 서열 중 217번째, 310번째, 403번째, 462번째 위치의 아미노산이 L-발린 생산 및 방향족 아미노산인 L-타이로신 및 L- 페닐알라닌 생산에 중요한 위치임을 확인할 수 있다.

참고예 1: gltA(M312I) 변이의 류신 생산에 대한 효과 확인

참고예 1-1. gltA 변이를 포함하는 삽입 벡터 제작

gltA(M312I; 서열번호 41) 변이 도입용 벡터 제작은 위치 지정 돌연변이 생성(Site directed mutagenesis) 방법을 사용하였다.

코리네박테리움 글루타미쿰 야생형의 염색체를 주형으로 서열번호 43 및 44의 프라이머 쌍, 서열번호 45 및 46의 프라이머 쌍을 이용하여 PCR을 수행하였다. PCR은 94℃에서 5분간 변성 후, 94℃에서 30초, 55℃에서 30초, 72℃에서 1분 30초를 30회 반복한 후, 72℃에서 5분간 중합반응을 수행하였다. 그 결과 얻어진 유전자 단편을 SmaI 제한효소로 절단시킨 선상의 pDCM2 벡터와 인퓨전(In-Fusion) 효소를 이용해 DNA 단편간의 말단 15개 염기의 상동서열을 결합시켜 클로닝하여 312번째 아미노산인 메티오닌을 이소류신으로 치환하는 벡터 pDCM2-gltA(M312I)를 제작하였다.

서열번호	프라이머	서열(5'->3')
43	gltA M312I Up F	GTGAATTCGAGCTCGGTACCCGCGGGAATCCTGCGTTACCGC
44	gltA M312I Up R	TGTAAACGCGGTGTCCGAAGCCGATGAGGCGGACGCCGTCTT
45	gltA M312I Down F	AAGACGGCGTCCGCCTCATCGGCTTCGGACACCGCGTTTACA
46	gltA M312I Down R	GGTCGACTCTAGAGGATCCCCTTAGCGCTCCTCGCGAGGAAC

참고예 1-2. ATCC13032 균주 내 변이체 도입 및 평가

상기 참고예 1-1에서 제작한 pDCM2-gltA(M312I)벡터를 야생형 ATCC13032에 형질전환하고 상동성 서열의 재조합에 의해 염색체 상에 벡터가 삽입된 균주는 카나마이신 25mg/L를 함유한 배지에서 선별하였다. 선별된 1차 균주는 다시 2차 교차(cross-over)를 거쳐, 목표 유전자의 변이가 도입된 균주를 선정하였다. 최종 형질전환된 균주의 gltA 유전자 변이 도입의 여부는 서열번호 31 및 서열번호 32(실시예 4-1, 표 8)의 프라이머를 이용하여 PCR을 수행한 후 염기서열을 분석함으로써 균주 내 변이(서열번호 42)가 도입되었음을 확인하였다. 제작된 균주는 ATCC13032_gltA_M312I로 명명하였다.

상기 제작된 ATCC13032_gltA_M312I 균주의 류신 생산능을 평가하기 위해 플라스크 발효역가 평가를 진행하였다. 생산배지를 각각 25 ㎖ 함유하는 250 ㎖ 코너-바풀 플라스크에 모균주인 코리네박테리움 글루타미쿰 ATCC13032 및 상기 제작한 ATCC13032_gltA_M312I을 각각 1백금이 접종한 후, 30℃에서 60 시간 동안 200 rpm으로 진탕 배양하여 류신을 생산하였다. 배양종료 후 HPLC로 류신의 생산량을 측정하였다. 실험한 각 균주에 대한 배양액 중의 류신 농도는 하기 표 15과 같다.

- 생산배지: 포도당 100 g, (NH₄)₂SO₄ 40 g, 대두 단백질(Soy Protein) 2.5 g, 옥수수 침지고형분(Corn Steep Solids) 5 g, 요소 3 g, KH₂PO₄ 1 g, MgSO₄·7H₂O 0.5 g, 바이오틴 100 ㎍, 티아민 염산염 1,000 ㎍, 칼슘-판토텐산 2000 ㎍, 니코틴아미드 3,000 ㎍, CaCO₃ 30 g (증류수 1리터 기준), pH 7.0

균주명	류신 (g/L)
ATCC13032	0.87
ATCC13032_gltA_M312I	1.25

이로부터 gltA의 M312I 치환이 류신 생산증가에 유효한 변이임을 확인하였다.

참고예 2: ilvA(T381A, F383A) 변이의 이소류신 생산에 대한 효과 확인

참고예 2-1: pECCG117-ilvA(F383A) 제작

쓰레오닌 디하이드라타제(서열번호 47)를 코딩하는 유전자인 ilvA(서열번호 48)를 증폭하기 위하여, 기보고된 F383A 변이가 도입된 ilvA 서열(World J Microbiol Biotechnol (2015) 31:1369-1377)에 근거하여 프로모터 부위(개시코돈 상단 약 300bp)로부터 터미네이터 부위(종결코돈 하단 약 100bp)까지 증폭하기 위한 프라이머(서열번호 49 및 서열번호 50)의 양 말단에 BamHI 제한 효소 부위를 삽입하였다. 또한, ilvA에 F383A 변이를 도입하기 위한 프라이머(서열번호 51 및 서열번호 52)를 사용하였다. 여기에서 사용된 프라이머 서열은 하기 표 16과 같다.

서열번호	명칭	서열
49	primer1	ggatccGACTGAGCCTGGGCAACTGG
50	primer2	ggatccCCGTCACCGACACCTCCACA
51	primer3	ACATCACGCTGgcaGAGTACCTCAA
52	primer4	TTGAGGTACTCtgcCAGCGTGATGT

야생형 코리네박테리움 글루타미쿰(wild type Corynebacterium glutamicum) ATCC 13032의 염색체를 주형으로 하여 서열번호 49 및 서열번호 52, 서열번호 50 및 서열번호 51의 프라이머를 이용하여 PCR을 수행하였다. PCR 조건은 95℃에서 5분간 변성 후, 95℃ 30초 변성, 55℃ 30초 어닐링, 72℃ 90초 중합을 30회 반복한 후, 72℃에서 5분간 중합반응을 수행하였다.

그 결과, ilvA 유전자의 변이를 중심으로 5' 상단 부위의 1460 bp의 DNA 단편과 3' 하단 부위의 276 bp DNA 단편을 수득하였다.

증폭된 두 가지의 DNA 절편을 주형으로 하여, 서열번호 49 및 서열번호 50의 프라이머로 PCR을 수행하였다.

그 결과, 383번째 페닐알라닌이 알라닌으로 치환된 ilvA 변이를 포함하는 1531 bp의 DNA 단편이 증폭되었다. pECCG117(대한민국 등록특허 제10-0057684호) 벡터와 ilvA DNA 단편을 제한 효소 BamHI으로 처리하고, DNA 접합 효소를 이용하여 연결한 후, 클로닝함으로써 플라스미드를 획득하였고 이를 pECCG117-ilvA(F383A)라 명명하였다.

참고예 2-2: pECCG117-ilvA(F383A)에 무작위 변이 추가 도입

L-쓰레오닌 디하이드라타제를 코딩하는 유전자의 변이체를 얻기 위해 무작위 돌연변이 키트(random mutagenesis kit, Agilent Technologies, 미국)를 이용하여 ilvA 변이체 유전자 플라스미드를 제조하였다. 참고예 2-1의 ilvA(F383A) 염색체를 주형으로 하여 서열번호 49 및 서열번호 50의 프라이머를 이용하여 PCR을 수행하였다. PCR 조건은 95℃에서 2분간 변성 후, 95℃ 30초 변성, 55℃ 30초 어닐링, 72℃ 90초 중합을 30회 반복한 후, 72℃에서 10분간 중합반응을 수행하였다.

그 결과, 383번째 페닐알라닌이 알라닌으로 치환된 변이 외에 추가적인 무작위 변이를 가진 L-쓰레오닌 디하이드라타제를 암호화할 수 있는 ilvA 변이체인 1531 bp의 DNA 단편이 증폭되었다. pECCG117 벡터와 ilvA 변이체 DNA 단편을 제한 효소 BamHI으로 처리하고, DNA 접합 효소를 이용하여 연결한 후, 클로닝함으로써 플라스미드군을 획득하였다.

참고예 2-3: CJILE-301 균주 제작

코리네박테리움 글루타미쿰 ATCC13032 hom(R407H) 균주에 pECCG117-ilvA(F383A)를 도입하였고, 제작한 플라스미드를 도입한 균주는 ATCC 13032 hom(R407H)/pECCG117-ilvA(F383A)로 명명하였다. 또한 참고예 2-2에서 얻어진 변이체 플라스미드군을 코리네박테리움 글루타미쿰 ATCC 13032 hom(R407H) 균주에 도입하였고, 최소배지에 도말하여 사멸율을 구해본 결과 사멸율은 70 %였으며 생존한 세포들을 종배지에 접종 배양, 최종적으로 ATCC13032 hom(R407H)/pECCG117-ilvA(F383A) 대조군보다 우수한 이소류신 생산능을 나타내는 변이주를 선별하여 코리네박테리움 글루타미쿰 CJILE-301(Corynebacterium glutamicum, CJILE-301)로 명명하였다.

CJILE-301균주로부터 플라스미드를 분리하여 ilvA 유전자를 시퀀싱 한 결과, ilvA 유전자의 1141번째 염기서열이 A에서 G로 치환되어 ilvA 단백질의 383번째 F가 A로 치환된 변이 외에 추가로 381번째 T가 A로 치환된 변이 단백질을 암호화할 수 있음을 확인하였으며 이는 서열번호 54으로 나타내었다.

참고예 2-4: ilvA 변이체(T381A, F383A) 도입

ilvA 변이체(T381A, F383A)를 야생형 균주로 도입하기 위하여 서열번호 49 및 서열번호 52 (실시예 5-1, 표 16)의 프라이머를 제작하였다.

ilvA 변이체(T381A, F383A)가 도입된 균주를 제작하기 위해 CJILE-301 균주로부터 추출한 플라스미드 DNA를 주형으로 서열번호 49 및 서열번호 52의 프라이머를 사용하여 PCR을 수행하였다.

PCR 반응을 위한 중합효소로는 PfuUltraTM 고-신뢰 DNA 폴리머라제(Stratagene)를 사용하였으며, PCR 조건은 변성 95℃, 30초; 어닐링 55℃, 30초; 및 중합반응 72℃, 2분을 28회 반복하였다.

그 결과, 1311bp인 ilvA 유전자의 약 100bp 터미네이터 부위를 포함한 1411bp의 유전자 단편을 각각 수득하였다.

증폭 산물을 PCR 정제 키트를 사용하여 정제하고, 벡터 제작을 위한 삽입 DNA 단편으로 사용하였다. 정제한 증폭 산물을 제한효소 smaI으로 처리한 후, 65℃에서 20분간 열처리한 pDCM2벡터와 상기 증폭 산물인 삽입 DNA 단편의 몰농도(M) 비율이 1:2가 되도록 하고 인퓨전 클로닝 키트를 사용하여 제공된 매뉴얼에 따라 클로닝함으로써 T381A, F383A 변이를 염색체상에 도입하기 위한 벡터 pDCM2-T381A_F383A를 제작하였다.

제작된 벡터를 전기천공법에 의해 코리네박테리움 글루타미쿰 ATCC13032 hom(R407H)에 형질전환하고, 2차 교차 과정을 거쳐 염색체 상에서 ilvA(T381A, F383A; 서열번호 53) 변이를 포함하는 균주를 얻었으며, 이를 CA10-3101으로 명명하였다.

상기 균주 CA10-3101은 2020년 5월 27일자로 부다페스트 조약하의 국제기탁기관인 한국미생물보존센터(KCCM)에 국제기탁하여 KCCM12739P로 기탁번호를 부여받았다.

상기 KCCM12739P 균주를 이소류신 생산배지 25 ㎖을 함유하는 250 ㎖ 코너-바풀 플라스크에 접종한 후, 32℃에서 60시간 동안 200 rpm으로 진탕 배양하여 L-이소류신을 제조하였다. 사용한 생산배지의 조성은 하기와 같다.

<생산배지>

포도당 10%, 효모추출물 0.2%, 황산암모늄 1.6%, 제1인산칼륨 0.1%, 황산마그네슘7수염 0.1%, 황산철7수염 10mg/L, 황산망간1수염 10 mg/L, 비오틴 200 ㎍/L, pH 7.2

배양종료 후, 고성능액체크로마토그래피(high-performance liquid chromatography, HPLC)를 이용하여 배양액 중의 L-이소류신과 L-쓰레오닌 농도를 측정하고, 그 결과를 하기 표 17에 나타내었다.

균주명	L-이소류신 (g/L)	L-쓰레오닌(g/L)
ATCC 13032 hom(R407H)	0.0	3.8
ATCC 13032 hom(R407H) ilvA(WT)	0.0	3.7
CA10-3101(ATCC 13032 hom(R407H) ilvA(T381A, F383A))	3.3	0.0

상기 표 17에 나타난 바와 같이, 모균주인 코리네박테리움 글루타미쿰 ATCC 13032 hom(R407H)은 L-이소류신을 생산하지 못하였으나 ATCC 13032 hom(R407H) ilvA(T381A, F383A) 변이주는 3.9 g/L의 농도로 L-이소류신을 생산하여, 모균주에 비해 L-이소류신 생산성이 현저하게 증가한 것을 확인하였다.

이로부터 ilvA(T381A, F383A) 변이가 이소류신 생산증가에 유효한 변이임을 확인하였다.

참고예 3: leuA(P247C, R558H, G561D)의 류신 생산에 대한 효과 확인

참고예 3-1. CJL-8100 균주 제작

KR 10-2018-0077008 A 에 공지된 leuA 유전자 변이를 포함하는 pDCM2-leuA(R558H, G561D) 벡터를 코리네박테리움 글루타미쿰 ATCC13032에 전기천공법으로 형질전환하고 카나마이신(kanamycin) 25 mg/L를 함유한 배지에서 상동성 서열의 재조합에 의해 염색체 상에 벡터가 삽입된 균주를 선별하였다. 선별된 1차 균주는 다시 2차 교차(cross-over)를 거쳐, leuA 유전자의 변이가 도입된 균주를 선정하였다. 최종적으로 형질전환된 균주의 변이 도입 여부는 서열번호 55와 서열번호 56의 프라이머를 이용하여 PCR(94℃ 5분 후, 94℃ 30초/55℃ 30초/72℃ 90초 30회 반복, 72℃ 5분)을 수행하고 염기서열을 분석하여 R558H, G561D 변이가 도입된 것을 확인하였다. pDCM2-leuA(R558H, G561D) 벡터로 형질전환된 ATCC13032_leuA_(R558H, G561D) 균주를 ‘CJL-8100’으로 명명하였다.

이하 참고예 3에서 사용한 프라이머 서열을 표 18에 나타내었다.

서열번호	서열(5'->3')
서열번호 55	AACACGACCGGCATCCCGTCGC
서열번호 56	AAATCATTTGAGAAAACTCGAGG
서열번호 57	GTGAATTCGAGCTCGGTACCCAAATCATTTGAGAAAACTCGAGGC
서열번호 58	GGTGATCATCTCAACGGTGGAACACAGGTTGATGATCATTGGGTT
서열번호 59	AACCCAATGATCATCAACCTGTGTTCCACCGTTGAGATGATCACC
서열번호 60	GGTCGACTCTAGAGGATCCCCAAGAAGGCAACATCGGACAGC
서열번호 61	ATCCATTCAATGGAGTCTGCG

참고예 3-2. leuA 변이를 포함하는 삽입 벡터 제작

LeuA에 2개의 변이(R558H, G561D)가 도입된 L-류신 생산 균주인 CJL-8100에 P247C 변이를 도입하기 위한 벡터를 제작하였다.

CJL-8100 균주의 염색체를 주형으로 서열번호 57 및 58의 프라이머, 서열번호 59 및 60의 프라이머 쌍을 이용하여 PCR을 수행하였다. PCR은 94℃에서 5분간 변성 후, 94℃에서 30초, 55℃에서 30초, 72℃에서 1분 30초를 30회 반복한 후, 72℃에서 5분간 중합반응을 수행하였다. 그 결과 얻어진 PCR 산물을 SmaI 제한효소로 절단시킨 선상의 pDCM2 벡터와 In-Fusion 효소를 이용해 DNA 단편 간의 말단 15 base의 상동서열을 fusion 시켜 클로닝하여, 야생형 균주의 LeuA 아미노산 서열에서 558 번째 아미노산인 아르기닌이 히스티딘으로 치환되고, 561 번째 아미노산인 글리신이 아스파르트산으로 치환된 LeuA 변이체를 암호화하는 leuA변이를 포함하고, LeuA의 247 번째 아미노산인 프롤린(Pro)을 시스테인(Cys)으로 치환하는 벡터 pDCM2-leuA(P247C, R558H, G561D)를 제작하였다.

참고예 3-3. CJL-8100 균주 내 LeuA 변이체(P247C) 도입 및 평가

L-류신 생산 균주인 CJL-8100을 상기 참고예 3-2에서 제작한 pDCM2-leuA(P247C, R558H, G561D) 벡터로 형질전환하고 상동성 서열의 재조합에 의해 염색체 상에 벡터가 삽입된 균주는 카나마이신(kanamycin) 25 mg/L를 함유한 배지에서 선별하였다. 선별된 1차 균주는 다시 2차 교차(cross-over)를 거쳐, 목표 유전자의 변이가 도입된 균주를 선정하였다. 최종적으로 형질전환된 균주의 leuA유전자 변이 도입의 여부는 서열번호 55과 서열번호 61의 프라이머를 이용하여 PCR(94℃ 5분 후, 94℃ 30초/55℃ 30초/72℃ 90초 30회반복, 72℃ 5분)을 수행한 후 염기서열을 분석하였다. 염기서열 분석 결과, 균주 염색체 내leuA 유전자의 1673 번째 뉴클레오티드인 G가 A로 치환되고, 1682 번째, 1683 번째 뉴클레오티드인 GC가 AT로 치환되었으며, 739번째, 740번째 뉴클레오티드인 CC가 TG로 치환되어 LeuA 단백질의 558 번째 아미노산인 아르기닌이 히스티딘으로 치환되고, 561 번째 아미노산인 글리신이 아스파르트산으로 치환되고, 247 번째 아미노산인 프롤린(Pro)이 시스테인(Cys)으로 치환된 LeuA 변이체(P247C, R558H, G561D)를 암호화하는 leuA 변이가 균주 내에 도입된 것을 확인하였다.

제작된 CJL8100_leuA_P247C 를 'CA13-8105'로 명명하고 부다페스트 조약 하의 국제기탁기관인 한국미생물보존센터(Korean Culture Center of Microorganisms, KCCM)에 2020년 4월 29일자로 기탁하여 기탁번호 KCCM12709P를 부여 받았다.

상기 총 3종의 변이를 포함하는 LeuA 변이체(P247C, R558H, G561D)의 아미노산 서열 및 이를 암호화하는 leuA 변이체의 염기 서열은 각각 서열번호 62 및 서열번호 63과 같다.

ATCC13032, 제작된 CJL-8100, 및 CA13-8105 균주의 L-류신의 생산능을 평가하였다. 구체적으로, 실시예 2-1과 같은 방식으로 플라스크 배양을 진행하였고, 배양 종료 후 HPLC를 이용하여, 모균주 및 변이 균주의 L-류신 생산량을 측정하여 그 결과를 표 19에 기재하였다.

균주명	L-류신 (g/L)
ATCC13032	0.87
ATCC13032_leuA_(R558H, G561D) : CJL-8100	2.71
CJL8100_leuA_P247C: CA13-8105	3.52

상기 표 19에 나타난 바와 같이, L-류신 생산 균주인 코리네박테리움 글루타미쿰 CJL8100은 모균주인 ATCC13032에 비해 L-류신 생산능이 약 130 % 향상되었다. CJL8100 균주 내 leuA_P247C 변이를 추가적으로 도입한 CA13-8105 균주는 모균주인 CJL8100 대비 L-류신 생산능이 약 150 % 향상되었다.

이로부터 leuA(R558H, G561D, P247C) 변이가 류신 생산 증가에 유효한 변이임을 확인하였다.

이상의 설명으로부터, 본 출원이 속하는 기술분야의 당업자는 본 출원이 그 기술적 사상이나 필수적 특징을 변경하지 않고서 다른 구체적인 형태로 실시될 수 있다는 것을 이해할 수 있을 것이다. 이와 관련하여, 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며 한정적인 것이 아닌 것으로 이해해야만 한다. 본 출원의 범위는 상기 상세한 설명보다는 후술하는 특허 청구범위의 의미 및 범위 그리고 그 등가 개념으로부터 도출되는 모든 변경 또는 변형된 형태가 본 출원의 범위에 포함되는 것으로 해석되어야 한다.

한국미생물보존센터(국외)

KCCM12739P

20200527

한국미생물보존센터(국외)

KCCM12709P

20200429

한국미생물보존센터(국외)

KCCM12931P

20210118

<110> CJ CheilJedang Corporation <120> Phospho-2-dehydro-3-deoxyheptonate aldolase variant and method for producing branched amino acid using the same <130> KPA201438-KR <160> 63 <170> KoPatentIn 3.0 <210> 1 <211> 466 <212> PRT <213> Unknown <220> <223> aroG_WT <400> 1 Met Asn Arg Gly Val Ser Trp Thr Val Asp Ile Pro Lys Glu Val Leu 1 5 10 15 Pro Asp Leu Pro Pro Leu Pro Glu Gly Met Gln Gln Gln Phe Glu Asp 20 25 30 Thr Ile Ser Arg Asp Ala Lys Gln Gln Pro Thr Trp Asp Arg Ala Gln 35 40 45 Ala Glu Asn Val Arg Lys Ile Leu Glu Ser Val Pro Pro Ile Val Val 50 55 60 Ala Pro Glu Val Leu Glu Leu Lys Gln Lys Leu Ala Asp Val Ala Asn 65 70 75 80 Gly Lys Ala Phe Leu Leu Gln Gly Gly Asp Cys Ala Glu Thr Phe Glu 85 90 95 Ser Asn Thr Glu Pro His Ile Arg Ala Asn Val Lys Thr Leu Leu Gln 100 105 110 Met Ala Val Val Leu Thr Tyr Gly Ala Ser Thr Pro Val Ile Lys Met 115 120 125 Ala Arg Ile Ala Gly Gln Tyr Ala Lys Pro Arg Ser Ser Asp Leu Asp 130 135 140 Gly Asn Gly Leu Pro Asn Tyr Arg Gly Asp Ile Val Asn Gly Val Glu 145 150 155 160 Ala Thr Pro Glu Ala Arg Arg His Asp Pro Ala Arg Met Ile Arg Ala 165 170 175 Tyr Ala Asn Ala Ser Ala Ala Met Asn Leu Val Arg Ala Leu Thr Ser 180 185 190 Ser Gly Thr Ala Asp Leu Tyr Arg Leu Ser Glu Trp Asn Arg Glu Phe 195 200 205 Val Ala Asn Ser Pro Ala Gly Ala Arg Tyr Glu Ala Leu Ala Arg Glu 210 215 220 Ile Asp Ser Gly Leu Arg Phe Met Glu Ala Cys Gly Val Ser Asp Glu 225 230 235 240 Ser Leu Arg Ala Ala Asp Ile Tyr Cys Ser His Glu Ala Leu Leu Val 245 250 255 Asp Tyr Glu Arg Ser Met Leu Arg Leu Ala Thr Asp Glu Glu Gly Asn 260 265 270 Glu Glu Leu Tyr Asp Leu Ser Ala His Gln Leu Trp Ile Gly Glu Arg 275 280 285 Thr Arg Gly Met Asp Asp Phe His Val Asn Phe Ala Ser Met Ile Ser 290 295 300 Asn Pro Ile Gly Ile Lys Ile Gly Pro Gly Ile Thr Pro Glu Glu Ala 305 310 315 320 Val Ala Tyr Ala Asp Lys Leu Asp Pro Asn Phe Glu Pro Gly Arg Leu 325 330 335 Thr Ile Val Ala Arg Met Gly His Asp Lys Val Arg Ser Val Leu Pro 340 345 350 Gly Val Ile Gln Ala Val Glu Ala Ser Gly His Lys Val Ile Trp Gln 355 360 365 Ser Asp Pro Met His Gly Asn Thr Phe Thr Ala Ser Asn Gly Tyr Lys 370 375 380 Thr Arg His Phe Asp Lys Val Ile Asp Glu Val Gln Gly Phe Phe Glu 385 390 395 400 Val His Arg Ala Leu Gly Thr His Pro Gly Gly Ile His Ile Glu Phe 405 410 415 Thr Gly Glu Asp Val Thr Glu Cys Leu Gly Gly Ala Glu Asp Ile Thr 420 425 430 Asp Val Asp Leu Pro Gly Arg Tyr Glu Ser Ala Cys Asp Pro Arg Leu 435 440 445 Asn Thr Gln Gln Ser Leu Glu Leu Ala Phe Leu Val Ala Glu Met Leu 450 455 460 Arg Asn 465 <210> 2 <211> 1401 <212> DNA <213> Unknown <220> <223> aroG_WT <400> 2 atgaataggg gtgtgagttg gacagttgat atccctaaag aagttctccc tgatttgcca 60 ccattgccag aaggcatgca gcagcagttc gaggacacca tttcccgtga cgctaagcag 120 caacctacgt gggatcgtgc acaggcagaa aacgtgcgca agatccttga gtcggttcct 180 ccaatcgttg ttgcccctga ggtacttgag ctgaagcaga agcttgctga tgttgccaac 240 ggtaaggcct tcctcttgca gggtggtgac tgtgcggaaa ctttcgagtc aaacactgag 300 ccgcacattc gcgccaacgt aaagactctg ctgcagatgg cagttgtttt gacctacggt 360 gcatccactc ctgtgatcaa gatggctcgt attgctggtc agtacgcaaa gcctcgctct 420 tctgatctgg atggaaatgg tctgccaaac taccgtggcg atatcgtcaa cggtgtggag 480 gcaaccccag aggctcgtcg ccacgatcct gcccgcatga tccgtgctta cgctaacgct 540 tctgctgcga tgaacttggt gcgcgcgctc accagctctg gcaccgctga tctttaccgt 600 ctcagcgagt ggaaccgcga gttcgttgcg aactccccag ctggtgcacg ctacgaggct 660 cttgctcgtg agatcgactc cggtctgcgc ttcatggaag catgtggcgt gtccgatgag 720 tccctgcgtg ctgcagatat ctactgctcc cacgaggctt tgctggtgga ttacgagcgt 780 tccatgctgc gtcttgcaac cgatgaggaa ggcaacgagg aactttacga tctttcagct 840 caccagctgt ggatcggcga gcgcacccgt ggcatggatg atttccatgt gaacttcgca 900 tccatgatct ctaacccaat cggcatcaag attggtcctg gtatcacccc tgaagaggct 960 gttgcatacg ctgacaagct cgatccgaac ttcgagcctg gccgtttgac catcgttgct 1020 cgcatgggcc acgacaaggt tcgctccgta cttcctggtg ttatccaggc tgttgaggca 1080 tccggacaca aggttatttg gcagtccgat ccgatgcacg gcaacacttt caccgcatcc 1140 aatggctaca agacccgtca cttcgacaag gttatcgatg aggtccaggg cttcttcgag 1200 gtccaccgcg cattgggcac ccacccaggc ggaatccaca ttgagttcac tggtgaagat 1260 gtcaccgagt gcctcggtgg cgctgaagac atcaccgatg ttgatctgcc aggccgctac 1320 gagtccgcat gcgatcctcg cctgaacact cagcagtctt tggagttggc tttcctcgtt 1380 gcagaaatgc tgcgtaacta a 1401 <210> 3 <211> 466 <212> PRT <213> Artificial Sequence <220> <223> aroG_R217A <400> 3 Met Asn Arg Gly Val Ser Trp Thr Val Asp Ile Pro Lys Glu Val Leu 1 5 10 15 Pro Asp Leu Pro Pro Leu Pro Glu Gly Met Gln Gln Gln Phe Glu Asp 20 25 30 Thr Ile Ser Arg Asp Ala Lys Gln Gln Pro Thr Trp Asp Arg Ala Gln 35 40 45 Ala Glu Asn Val Arg Lys Ile Leu Glu Ser Val Pro Pro Ile Val Val 50 55 60 Ala Pro Glu Val Leu Glu Leu Lys Gln Lys Leu Ala Asp Val Ala Asn 65 70 75 80 Gly Lys Ala Phe Leu Leu Gln Gly Gly Asp Cys Ala Glu Thr Phe Glu 85 90 95 Ser Asn Thr Glu Pro His Ile Arg Ala Asn Val Lys Thr Leu Leu Gln 100 105 110 Met Ala Val Val Leu Thr Tyr Gly Ala Ser Thr Pro Val Ile Lys Met 115 120 125 Ala Arg Ile Ala Gly Gln Tyr Ala Lys Pro Arg Ser Ser Asp Leu Asp 130 135 140 Gly Asn Gly Leu Pro Asn Tyr Arg Gly Asp Ile Val Asn Gly Val Glu 145 150 155 160 Ala Thr Pro Glu Ala Arg Arg His Asp Pro Ala Arg Met Ile Arg Ala 165 170 175 Tyr Ala Asn Ala Ser Ala Ala Met Asn Leu Val Arg Ala Leu Thr Ser 180 185 190 Ser Gly Thr Ala Asp Leu Tyr Arg Leu Ser Glu Trp Asn Arg Glu Phe 195 200 205 Val Ala Asn Ser Pro Ala Gly Ala Ala Tyr Glu Ala Leu Ala Arg Glu 210 215 220 Ile Asp Ser Gly Leu Arg Phe Met Glu Ala Cys Gly Val Ser Asp Glu 225 230 235 240 Ser Leu Arg Ala Ala Asp Ile Tyr Cys Ser His Glu Ala Leu Leu Val 245 250 255 Asp Tyr Glu Arg Ser Met Leu Arg Leu Ala Thr Asp Glu Glu Gly Asn 260 265 270 Glu Glu Leu Tyr Asp Leu Ser Ala His Gln Leu Trp Ile Gly Glu Arg 275 280 285 Thr Arg Gly Met Asp Asp Phe His Val Asn Phe Ala Ser Met Ile Ser 290 295 300 Asn Pro Ile Gly Ile Lys Ile Gly Pro Gly Ile Thr Pro Glu Glu Ala 305 310 315 320 Val Ala Tyr Ala Asp Lys Leu Asp Pro Asn Phe Glu Pro Gly Arg Leu 325 330 335 Thr Ile Val Ala Arg Met Gly His Asp Lys Val Arg Ser Val Leu Pro 340 345 350 Gly Val Ile Gln Ala Val Glu Ala Ser Gly His Lys Val Ile Trp Gln 355 360 365 Ser Asp Pro Met His Gly Asn Thr Phe Thr Ala Ser Asn Gly Tyr Lys 370 375 380 Thr Arg His Phe Asp Lys Val Ile Asp Glu Val Gln Gly Phe Phe Glu 385 390 395 400 Val His Arg Ala Leu Gly Thr His Pro Gly Gly Ile His Ile Glu Phe 405 410 415 Thr Gly Glu Asp Val Thr Glu Cys Leu Gly Gly Ala Glu Asp Ile Thr 420 425 430 Asp Val Asp Leu Pro Gly Arg Tyr Glu Ser Ala Cys Asp Pro Arg Leu 435 440 445 Asn Thr Gln Gln Ser Leu Glu Leu Ala Phe Leu Val Ala Glu Met Leu 450 455 460 Arg Asn 465 <210> 4 <211> 1401 <212> DNA <213> Artificial Sequence <220> <223> aroG_R217A_nt <400> 4 atgaataggg gtgtgagttg gacagttgat atccctaaag aagttctccc tgatttgcca 60 ccattgccag aaggcatgca gcagcagttc gaggacacca tttcccgtga cgctaagcag 120 caacctacgt gggatcgtgc acaggcagaa aacgtgcgca agatccttga gtcggttcct 180 ccaatcgttg ttgcccctga ggtacttgag ctgaagcaga agcttgctga tgttgccaac 240 ggtaaggcct tcctcttgca gggtggtgac tgtgcggaaa ctttcgagtc aaacactgag 300 ccgcacattc gcgccaacgt aaagactctg ctgcagatgg cagttgtttt gacctacggt 360 gcatccactc ctgtgatcaa gatggctcgt attgctggtc agtacgcaaa gcctcgctct 420 tctgatctgg atggaaatgg tctgccaaac taccgtggcg atatcgtcaa cggtgtggag 480 gcaaccccag aggctcgtcg ccacgatcct gcccgcatga tccgtgctta cgctaacgct 540 tctgctgcga tgaacttggt gcgcgcgctc accagctctg gcaccgctga tctttaccgt 600 ctcagcgagt ggaaccgcga gttcgttgcg aactccccag ctggtgcagc gtacgaggct 660 cttgctcgtg agatcgactc cggtctgcgc ttcatggaag catgtggcgt gtccgatgag 720 tccctgcgtg ctgcagatat ctactgctcc cacgaggctt tgctggtgga ttacgagcgt 780 tccatgctgc gtcttgcaac cgatgaggaa ggcaacgagg aactttacga tctttcagct 840 caccagctgt ggatcggcga gcgcacccgt ggcatggatg atttccatgt gaacttcgca 900 tccatgatct ctaacccaat cggcatcaag attggtcctg gtatcacccc tgaagaggct 960 gttgcatacg ctgacaagct cgatccgaac ttcgagcctg gccgtttgac catcgttgct 1020 cgcatgggcc acgacaaggt tcgctccgta cttcctggtg ttatccaggc tgttgaggca 1080 tccggacaca aggttatttg gcagtccgat ccgatgcacg gcaacacttt caccgcatcc 1140 aatggctaca agacccgtca cttcgacaag gttatcgatg aggtccaggg cttcttcgag 1200 gtccaccgcg cattgggcac ccacccaggc ggaatccaca ttgagttcac tggtgaagat 1260 gtcaccgagt gcctcggtgg cgctgaagac atcaccgatg ttgatctgcc aggccgctac 1320 gagtccgcat gcgatcctcg cctgaacact cagcagtctt tggagttggc tttcctcgtt 1380 gcagaaatgc tgcgtaacta a 1401 <210> 5 <211> 466 <212> PRT <213> Artificial Sequence <220> <223> aroG_K310A <400> 5 Met Asn Arg Gly Val Ser Trp Thr Val Asp Ile Pro Lys Glu Val Leu 1 5 10 15 Pro Asp Leu Pro Pro Leu Pro Glu Gly Met Gln Gln Gln Phe Glu Asp 20 25 30 Thr Ile Ser Arg Asp Ala Lys Gln Gln Pro Thr Trp Asp Arg Ala Gln 35 40 45 Ala Glu Asn Val Arg Lys Ile Leu Glu Ser Val Pro Pro Ile Val Val 50 55 60 Ala Pro Glu Val Leu Glu Leu Lys Gln Lys Leu Ala Asp Val Ala Asn 65 70 75 80 Gly Lys Ala Phe Leu Leu Gln Gly Gly Asp Cys Ala Glu Thr Phe Glu 85 90 95 Ser Asn Thr Glu Pro His Ile Arg Ala Asn Val Lys Thr Leu Leu Gln 100 105 110 Met Ala Val Val Leu Thr Tyr Gly Ala Ser Thr Pro Val Ile Lys Met 115 120 125 Ala Arg Ile Ala Gly Gln Tyr Ala Lys Pro Arg Ser Ser Asp Leu Asp 130 135 140 Gly Asn Gly Leu Pro Asn Tyr Arg Gly Asp Ile Val Asn Gly Val Glu 145 150 155 160 Ala Thr Pro Glu Ala Arg Arg His Asp Pro Ala Arg Met Ile Arg Ala 165 170 175 Tyr Ala Asn Ala Ser Ala Ala Met Asn Leu Val Arg Ala Leu Thr Ser 180 185 190 Ser Gly Thr Ala Asp Leu Tyr Arg Leu Ser Glu Trp Asn Arg Glu Phe 195 200 205 Val Ala Asn Ser Pro Ala Gly Ala Arg Tyr Glu Ala Leu Ala Arg Glu 210 215 220 Ile Asp Ser Gly Leu Arg Phe Met Glu Ala Cys Gly Val Ser Asp Glu 225 230 235 240 Ser Leu Arg Ala Ala Asp Ile Tyr Cys Ser His Glu Ala Leu Leu Val 245 250 255 Asp Tyr Glu Arg Ser Met Leu Arg Leu Ala Thr Asp Glu Glu Gly Asn 260 265 270 Glu Glu Leu Tyr Asp Leu Ser Ala His Gln Leu Trp Ile Gly Glu Arg 275 280 285 Thr Arg Gly Met Asp Asp Phe His Val Asn Phe Ala Ser Met Ile Ser 290 295 300 Asn Pro Ile Gly Ile Ala Ile Gly Pro Gly Ile Thr Pro Glu Glu Ala 305 310 315 320 Val Ala Tyr Ala Asp Lys Leu Asp Pro Asn Phe Glu Pro Gly Arg Leu 325 330 335 Thr Ile Val Ala Arg Met Gly His Asp Lys Val Arg Ser Val Leu Pro 340 345 350 Gly Val Ile Gln Ala Val Glu Ala Ser Gly His Lys Val Ile Trp Gln 355 360 365 Ser Asp Pro Met His Gly Asn Thr Phe Thr Ala Ser Asn Gly Tyr Lys 370 375 380 Thr Arg His Phe Asp Lys Val Ile Asp Glu Val Gln Gly Phe Phe Glu 385 390 395 400 Val His Arg Ala Leu Gly Thr His Pro Gly Gly Ile His Ile Glu Phe 405 410 415 Thr Gly Glu Asp Val Thr Glu Cys Leu Gly Gly Ala Glu Asp Ile Thr 420 425 430 Asp Val Asp Leu Pro Gly Arg Tyr Glu Ser Ala Cys Asp Pro Arg Leu 435 440 445 Asn Thr Gln Gln Ser Leu Glu Leu Ala Phe Leu Val Ala Glu Met Leu 450 455 460 Arg Asn 465 <210> 6 <211> 1401 <212> DNA <213> Artificial Sequence <220> <223> aroG_K310A_nt <400> 6 atgaataggg gtgtgagttg gacagttgat atccctaaag aagttctccc tgatttgcca 60 ccattgccag aaggcatgca gcagcagttc gaggacacca tttcccgtga cgctaagcag 120 caacctacgt gggatcgtgc acaggcagaa aacgtgcgca agatccttga gtcggttcct 180 ccaatcgttg ttgcccctga ggtacttgag ctgaagcaga agcttgctga tgttgccaac 240 ggtaaggcct tcctcttgca gggtggtgac tgtgcggaaa ctttcgagtc aaacactgag 300 ccgcacattc gcgccaacgt aaagactctg ctgcagatgg cagttgtttt gacctacggt 360 gcatccactc ctgtgatcaa gatggctcgt attgctggtc agtacgcaaa gcctcgctct 420 tctgatctgg atggaaatgg tctgccaaac taccgtggcg atatcgtcaa cggtgtggag 480 gcaaccccag aggctcgtcg ccacgatcct gcccgcatga tccgtgctta cgctaacgct 540 tctgctgcga tgaacttggt gcgcgcgctc accagctctg gcaccgctga tctttaccgt 600 ctcagcgagt ggaaccgcga gttcgttgcg aactccccag ctggtgcacg ctacgaggct 660 cttgctcgtg agatcgactc cggtctgcgc ttcatggaag catgtggcgt gtccgatgag 720 tccctgcgtg ctgcagatat ctactgctcc cacgaggctt tgctggtgga ttacgagcgt 780 tccatgctgc gtcttgcaac cgatgaggaa ggcaacgagg aactttacga tctttcagct 840 caccagctgt ggatcggcga gcgcacccgt ggcatggatg atttccatgt gaacttcgca 900 tccatgatct ctaacccaat cggcatcgcg attggtcctg gtatcacccc tgaagaggct 960 gttgcatacg ctgacaagct cgatccgaac ttcgagcctg gccgtttgac catcgttgct 1020 cgcatgggcc acgacaaggt tcgctccgta cttcctggtg ttatccaggc tgttgaggca 1080 tccggacaca aggttatttg gcagtccgat ccgatgcacg gcaacacttt caccgcatcc 1140 aatggctaca agacccgtca cttcgacaag gttatcgatg aggtccaggg cttcttcgag 1200 gtccaccgcg cattgggcac ccacccaggc ggaatccaca ttgagttcac tggtgaagat 1260 gtcaccgagt gcctcggtgg cgctgaagac atcaccgatg ttgatctgcc aggccgctac 1320 gagtccgcat gcgatcctcg cctgaacact cagcagtctt tggagttggc tttcctcgtt 1380 gcagaaatgc tgcgtaacta a 1401 <210> 7 <211> 466 <212> PRT <213> Artificial Sequence <220> <223> aroG_R403A <400> 7 Met Asn Arg Gly Val Ser Trp Thr Val Asp Ile Pro Lys Glu Val Leu 1 5 10 15 Pro Asp Leu Pro Pro Leu Pro Glu Gly Met Gln Gln Gln Phe Glu Asp 20 25 30 Thr Ile Ser Arg Asp Ala Lys Gln Gln Pro Thr Trp Asp Arg Ala Gln 35 40 45 Ala Glu Asn Val Arg Lys Ile Leu Glu Ser Val Pro Pro Ile Val Val 50 55 60 Ala Pro Glu Val Leu Glu Leu Lys Gln Lys Leu Ala Asp Val Ala Asn 65 70 75 80 Gly Lys Ala Phe Leu Leu Gln Gly Gly Asp Cys Ala Glu Thr Phe Glu 85 90 95 Ser Asn Thr Glu Pro His Ile Arg Ala Asn Val Lys Thr Leu Leu Gln 100 105 110 Met Ala Val Val Leu Thr Tyr Gly Ala Ser Thr Pro Val Ile Lys Met 115 120 125 Ala Arg Ile Ala Gly Gln Tyr Ala Lys Pro Arg Ser Ser Asp Leu Asp 130 135 140 Gly Asn Gly Leu Pro Asn Tyr Arg Gly Asp Ile Val Asn Gly Val Glu 145 150 155 160 Ala Thr Pro Glu Ala Arg Arg His Asp Pro Ala Arg Met Ile Arg Ala 165 170 175 Tyr Ala Asn Ala Ser Ala Ala Met Asn Leu Val Arg Ala Leu Thr Ser 180 185 190 Ser Gly Thr Ala Asp Leu Tyr Arg Leu Ser Glu Trp Asn Arg Glu Phe 195 200 205 Val Ala Asn Ser Pro Ala Gly Ala Arg Tyr Glu Ala Leu Ala Arg Glu 210 215 220 Ile Asp Ser Gly Leu Arg Phe Met Glu Ala Cys Gly Val Ser Asp Glu 225 230 235 240 Ser Leu Arg Ala Ala Asp Ile Tyr Cys Ser His Glu Ala Leu Leu Val 245 250 255 Asp Tyr Glu Arg Ser Met Leu Arg Leu Ala Thr Asp Glu Glu Gly Asn 260 265 270 Glu Glu Leu Tyr Asp Leu Ser Ala His Gln Leu Trp Ile Gly Glu Arg 275 280 285 Thr Arg Gly Met Asp Asp Phe His Val Asn Phe Ala Ser Met Ile Ser 290 295 300 Asn Pro Ile Gly Ile Lys Ile Gly Pro Gly Ile Thr Pro Glu Glu Ala 305 310 315 320 Val Ala Tyr Ala Asp Lys Leu Asp Pro Asn Phe Glu Pro Gly Arg Leu 325 330 335 Thr Ile Val Ala Arg Met Gly His Asp Lys Val Arg Ser Val Leu Pro 340 345 350 Gly Val Ile Gln Ala Val Glu Ala Ser Gly His Lys Val Ile Trp Gln 355 360 365 Ser Asp Pro Met His Gly Asn Thr Phe Thr Ala Ser Asn Gly Tyr Lys 370 375 380 Thr Arg His Phe Asp Lys Val Ile Asp Glu Val Gln Gly Phe Phe Glu 385 390 395 400 Val His Ala Ala Leu Gly Thr His Pro Gly Gly Ile His Ile Glu Phe 405 410 415 Thr Gly Glu Asp Val Thr Glu Cys Leu Gly Gly Ala Glu Asp Ile Thr 420 425 430 Asp Val Asp Leu Pro Gly Arg Tyr Glu Ser Ala Cys Asp Pro Arg Leu 435 440 445 Asn Thr Gln Gln Ser Leu Glu Leu Ala Phe Leu Val Ala Glu Met Leu 450 455 460 Arg Asn 465 <210> 8 <211> 1401 <212> DNA <213> Artificial Sequence <220> <223> aroG_R403A_nt <400> 8 atgaataggg gtgtgagttg gacagttgat atccctaaag aagttctccc tgatttgcca 60 ccattgccag aaggcatgca gcagcagttc gaggacacca tttcccgtga cgctaagcag 120 caacctacgt gggatcgtgc acaggcagaa aacgtgcgca agatccttga gtcggttcct 180 ccaatcgttg ttgcccctga ggtacttgag ctgaagcaga agcttgctga tgttgccaac 240 ggtaaggcct tcctcttgca gggtggtgac tgtgcggaaa ctttcgagtc aaacactgag 300 ccgcacattc gcgccaacgt aaagactctg ctgcagatgg cagttgtttt gacctacggt 360 gcatccactc ctgtgatcaa gatggctcgt attgctggtc agtacgcaaa gcctcgctct 420 tctgatctgg atggaaatgg tctgccaaac taccgtggcg atatcgtcaa cggtgtggag 480 gcaaccccag aggctcgtcg ccacgatcct gcccgcatga tccgtgctta cgctaacgct 540 tctgctgcga tgaacttggt gcgcgcgctc accagctctg gcaccgctga tctttaccgt 600 ctcagcgagt ggaaccgcga gttcgttgcg aactccccag ctggtgcacg ctacgaggct 660 cttgctcgtg agatcgactc cggtctgcgc ttcatggaag catgtggcgt gtccgatgag 720 tccctgcgtg ctgcagatat ctactgctcc cacgaggctt tgctggtgga ttacgagcgt 780 tccatgctgc gtcttgcaac cgatgaggaa ggcaacgagg aactttacga tctttcagct 840 caccagctgt ggatcggcga gcgcacccgt ggcatggatg atttccatgt gaacttcgca 900 tccatgatct ctaacccaat cggcatcaag attggtcctg gtatcacccc tgaagaggct 960 gttgcatacg ctgacaagct cgatccgaac ttcgagcctg gccgtttgac catcgttgct 1020 cgcatgggcc acgacaaggt tcgctccgta cttcctggtg ttatccaggc tgttgaggca 1080 tccggacaca aggttatttg gcagtccgat ccgatgcacg gcaacacttt caccgcatcc 1140 aatggctaca agacccgtca cttcgacaag gttatcgatg aggtccaggg cttcttcgag 1200 gtccacgcgg cattgggcac ccacccaggc ggaatccaca ttgagttcac tggtgaagat 1260 gtcaccgagt gcctcggtgg cgctgaagac atcaccgatg ttgatctgcc aggccgctac 1320 gagtccgcat gcgatcctcg cctgaacact cagcagtctt tggagttggc tttcctcgtt 1380 gcagaaatgc tgcgtaacta a 1401 <210> 9 <211> 466 <212> PRT <213> Artificial Sequence <220> <223> aroG_E462A <400> 9 Met Asn Arg Gly Val Ser Trp Thr Val Asp Ile Pro Lys Glu Val Leu 1 5 10 15 Pro Asp Leu Pro Pro Leu Pro Glu Gly Met Gln Gln Gln Phe Glu Asp 20 25 30 Thr Ile Ser Arg Asp Ala Lys Gln Gln Pro Thr Trp Asp Arg Ala Gln 35 40 45 Ala Glu Asn Val Arg Lys Ile Leu Glu Ser Val Pro Pro Ile Val Val 50 55 60 Ala Pro Glu Val Leu Glu Leu Lys Gln Lys Leu Ala Asp Val Ala Asn 65 70 75 80 Gly Lys Ala Phe Leu Leu Gln Gly Gly Asp Cys Ala Glu Thr Phe Glu 85 90 95 Ser Asn Thr Glu Pro His Ile Arg Ala Asn Val Lys Thr Leu Leu Gln 100 105 110 Met Ala Val Val Leu Thr Tyr Gly Ala Ser Thr Pro Val Ile Lys Met 115 120 125 Ala Arg Ile Ala Gly Gln Tyr Ala Lys Pro Arg Ser Ser Asp Leu Asp 130 135 140 Gly Asn Gly Leu Pro Asn Tyr Arg Gly Asp Ile Val Asn Gly Val Glu 145 150 155 160 Ala Thr Pro Glu Ala Arg Arg His Asp Pro Ala Arg Met Ile Arg Ala 165 170 175 Tyr Ala Asn Ala Ser Ala Ala Met Asn Leu Val Arg Ala Leu Thr Ser 180 185 190 Ser Gly Thr Ala Asp Leu Tyr Arg Leu Ser Glu Trp Asn Arg Glu Phe 195 200 205 Val Ala Asn Ser Pro Ala Gly Ala Arg Tyr Glu Ala Leu Ala Arg Glu 210 215 220 Ile Asp Ser Gly Leu Arg Phe Met Glu Ala Cys Gly Val Ser Asp Glu 225 230 235 240 Ser Leu Arg Ala Ala Asp Ile Tyr Cys Ser His Glu Ala Leu Leu Val 245 250 255 Asp Tyr Glu Arg Ser Met Leu Arg Leu Ala Thr Asp Glu Glu Gly Asn 260 265 270 Glu Glu Leu Tyr Asp Leu Ser Ala His Gln Leu Trp Ile Gly Glu Arg 275 280 285 Thr Arg Gly Met Asp Asp Phe His Val Asn Phe Ala Ser Met Ile Ser 290 295 300 Asn Pro Ile Gly Ile Lys Ile Gly Pro Gly Ile Thr Pro Glu Glu Ala 305 310 315 320 Val Ala Tyr Ala Asp Lys Leu Asp Pro Asn Phe Glu Pro Gly Arg Leu 325 330 335 Thr Ile Val Ala Arg Met Gly His Asp Lys Val Arg Ser Val Leu Pro 340 345 350 Gly Val Ile Gln Ala Val Glu Ala Ser Gly His Lys Val Ile Trp Gln 355 360 365 Ser Asp Pro Met His Gly Asn Thr Phe Thr Ala Ser Asn Gly Tyr Lys 370 375 380 Thr Arg His Phe Asp Lys Val Ile Asp Glu Val Gln Gly Phe Phe Glu 385 390 395 400 Val His Arg Ala Leu Gly Thr His Pro Gly Gly Ile His Ile Glu Phe 405 410 415 Thr Gly Glu Asp Val Thr Glu Cys Leu Gly Gly Ala Glu Asp Ile Thr 420 425 430 Asp Val Asp Leu Pro Gly Arg Tyr Glu Ser Ala Cys Asp Pro Arg Leu 435 440 445 Asn Thr Gln Gln Ser Leu Glu Leu Ala Phe Leu Val Ala Ala Met Leu 450 455 460 Arg Asn 465 <210> 10 <211> 1401 <212> DNA <213> Artificial Sequence <220> <223> aroG_E462A_nt <400> 10 atgaataggg gtgtgagttg gacagttgat atccctaaag aagttctccc tgatttgcca 60 ccattgccag aaggcatgca gcagcagttc gaggacacca tttcccgtga cgctaagcag 120 caacctacgt gggatcgtgc acaggcagaa aacgtgcgca agatccttga gtcggttcct 180 ccaatcgttg ttgcccctga ggtacttgag ctgaagcaga agcttgctga tgttgccaac 240 ggtaaggcct tcctcttgca gggtggtgac tgtgcggaaa ctttcgagtc aaacactgag 300 ccgcacattc gcgccaacgt aaagactctg ctgcagatgg cagttgtttt gacctacggt 360 gcatccactc ctgtgatcaa gatggctcgt attgctggtc agtacgcaaa gcctcgctct 420 tctgatctgg atggaaatgg tctgccaaac taccgtggcg atatcgtcaa cggtgtggag 480 gcaaccccag aggctcgtcg ccacgatcct gcccgcatga tccgtgctta cgctaacgct 540 tctgctgcga tgaacttggt gcgcgcgctc accagctctg gcaccgctga tctttaccgt 600 ctcagcgagt ggaaccgcga gttcgttgcg aactccccag ctggtgcacg ctacgaggct 660 cttgctcgtg agatcgactc cggtctgcgc ttcatggaag catgtggcgt gtccgatgag 720 tccctgcgtg ctgcagatat ctactgctcc cacgaggctt tgctggtgga ttacgagcgt 780 tccatgctgc gtcttgcaac cgatgaggaa ggcaacgagg aactttacga tctttcagct 840 caccagctgt ggatcggcga gcgcacccgt ggcatggatg atttccatgt gaacttcgca 900 tccatgatct ctaacccaat cggcatcaag attggtcctg gtatcacccc tgaagaggct 960 gttgcatacg ctgacaagct cgatccgaac ttcgagcctg gccgtttgac catcgttgct 1020 cgcatgggcc acgacaaggt tcgctccgta cttcctggtg ttatccaggc tgttgaggca 1080 tccggacaca aggttatttg gcagtccgat ccgatgcacg gcaacacttt caccgcatcc 1140 aatggctaca agacccgtca cttcgacaag gttatcgatg aggtccaggg cttcttcgag 1200 gtccaccgcg cattgggcac ccacccaggc ggaatccaca ttgagttcac tggtgaagat 1260 gtcaccgagt gcctcggtgg cgctgaagac atcaccgatg ttgatctgcc aggccgctac 1320 gagtccgcat gcgatcctcg cctgaacact cagcagtctt tggagttggc tttcctcgtt 1380 gcagcgatgc tgcgtaacta a 1401 <210> 11 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 11 tgatgcgcgt cataatttag 20 <210> 12 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 12 ctcatctctg actggacgtg 20 <210> 13 <211> 41 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 13 gtgaattcga gctcggtacc cagttgaatg ctaccaactt g 41 <210> 14 <211> 35 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 14 cacgagcaag agcctcgtac gctgcaccag ctggg 35 <210> 15 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 15 ggtcgactct agaggatccc cgctgttatt actgtgcctg 40 <210> 16 <211> 39 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 16 gaactcccca gctggtgcag cgtacgaggc tcttgctcg 39 <210> 17 <211> 39 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 17 gggtgatacc aggaccaatc gcgatgccga ttgggttag 39 <210> 18 <211> 39 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 18 ctctaaccca atcggcatcg cgattggtcc tggtatcac 39 <210> 19 <211> 38 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 19 ctgggtgggt gcccaatgcc gcgtggacct cgaagaag 38 <210> 20 <211> 37 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 20 gggcttcttc gaggtccacg cggcattggg cacccac 37 <210> 21 <211> 38 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 21 aagcttagtt acgcagcatc gctgcaacga ggaaagcc 38 <210> 22 <211> 39 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 22 gttggctttc ctcgttgcag cgatgctgcg taactaagc 39 <210> 23 <211> 466 <212> PRT <213> Artificial Sequence <220> <223> aroG_R217A+K310A+E462A <400> 23 Met Asn Arg Gly Val Ser Trp Thr Val Asp Ile Pro Lys Glu Val Leu 1 5 10 15 Pro Asp Leu Pro Pro Leu Pro Glu Gly Met Gln Gln Gln Phe Glu Asp 20 25 30 Thr Ile Ser Arg Asp Ala Lys Gln Gln Pro Thr Trp Asp Arg Ala Gln 35 40 45 Ala Glu Asn Val Arg Lys Ile Leu Glu Ser Val Pro Pro Ile Val Val 50 55 60 Ala Pro Glu Val Leu Glu Leu Lys Gln Lys Leu Ala Asp Val Ala Asn 65 70 75 80 Gly Lys Ala Phe Leu Leu Gln Gly Gly Asp Cys Ala Glu Thr Phe Glu 85 90 95 Ser Asn Thr Glu Pro His Ile Arg Ala Asn Val Lys Thr Leu Leu Gln 100 105 110 Met Ala Val Val Leu Thr Tyr Gly Ala Ser Thr Pro Val Ile Lys Met 115 120 125 Ala Arg Ile Ala Gly Gln Tyr Ala Lys Pro Arg Ser Ser Asp Leu Asp 130 135 140 Gly Asn Gly Leu Pro Asn Tyr Arg Gly Asp Ile Val Asn Gly Val Glu 145 150 155 160 Ala Thr Pro Glu Ala Arg Arg His Asp Pro Ala Arg Met Ile Arg Ala 165 170 175 Tyr Ala Asn Ala Ser Ala Ala Met Asn Leu Val Arg Ala Leu Thr Ser 180 185 190 Ser Gly Thr Ala Asp Leu Tyr Arg Leu Ser Glu Trp Asn Arg Glu Phe 195 200 205 Val Ala Asn Ser Pro Ala Gly Ala Ala Tyr Glu Ala Leu Ala Arg Glu 210 215 220 Ile Asp Ser Gly Leu Arg Phe Met Glu Ala Cys Gly Val Ser Asp Glu 225 230 235 240 Ser Leu Arg Ala Ala Asp Ile Tyr Cys Ser His Glu Ala Leu Leu Val 245 250 255 Asp Tyr Glu Arg Ser Met Leu Arg Leu Ala Thr Asp Glu Glu Gly Asn 260 265 270 Glu Glu Leu Tyr Asp Leu Ser Ala His Gln Leu Trp Ile Gly Glu Arg 275 280 285 Thr Arg Gly Met Asp Asp Phe His Val Asn Phe Ala Ser Met Ile Ser 290 295 300 Asn Pro Ile Gly Ile Ala Ile Gly Pro Gly Ile Thr Pro Glu Glu Ala 305 310 315 320 Val Ala Tyr Ala Asp Lys Leu Asp Pro Asn Phe Glu Pro Gly Arg Leu 325 330 335 Thr Ile Val Ala Arg Met Gly His Asp Lys Val Arg Ser Val Leu Pro 340 345 350 Gly Val Ile Gln Ala Val Glu Ala Ser Gly His Lys Val Ile Trp Gln 355 360 365 Ser Asp Pro Met His Gly Asn Thr Phe Thr Ala Ser Asn Gly Tyr Lys 370 375 380 Thr Arg His Phe Asp Lys Val Ile Asp Glu Val Gln Gly Phe Phe Glu 385 390 395 400 Val His Arg Ala Leu Gly Thr His Pro Gly Gly Ile His Ile Glu Phe 405 410 415 Thr Gly Glu Asp Val Thr Glu Cys Leu Gly Gly Ala Glu Asp Ile Thr 420 425 430 Asp Val Asp Leu Pro Gly Arg Tyr Glu Ser Ala Cys Asp Pro Arg Leu 435 440 445 Asn Thr Gln Gln Ser Leu Glu Leu Ala Phe Leu Val Ala Ala Met Leu 450 455 460 Arg Asn 465 <210> 24 <211> 1401 <212> DNA <213> Artificial Sequence <220> <223> aroG_R217A+K310A+E462A_nt <400> 24 atgaataggg gtgtgagttg gacagttgat atccctaaag aagttctccc tgatttgcca 60 ccattgccag aaggcatgca gcagcagttc gaggacacca tttcccgtga cgctaagcag 120 caacctacgt gggatcgtgc acaggcagaa aacgtgcgca agatccttga gtcggttcct 180 ccaatcgttg ttgcccctga ggtacttgag ctgaagcaga agcttgctga tgttgccaac 240 ggtaaggcct tcctcttgca gggtggtgac tgtgcggaaa ctttcgagtc aaacactgag 300 ccgcacattc gcgccaacgt aaagactctg ctgcagatgg cagttgtttt gacctacggt 360 gcatccactc ctgtgatcaa gatggctcgt attgctggtc agtacgcaaa gcctcgctct 420 tctgatctgg atggaaatgg tctgccaaac taccgtggcg atatcgtcaa cggtgtggag 480 gcaaccccag aggctcgtcg ccacgatcct gcccgcatga tccgtgctta cgctaacgct 540 tctgctgcga tgaacttggt gcgcgcgctc accagctctg gcaccgctga tctttaccgt 600 ctcagcgagt ggaaccgcga gttcgttgcg aactccccag ctggtgcagc gtacgaggct 660 cttgctcgtg agatcgactc cggtctgcgc ttcatggaag catgtggcgt gtccgatgag 720 tccctgcgtg ctgcagatat ctactgctcc cacgaggctt tgctggtgga ttacgagcgt 780 tccatgctgc gtcttgcaac cgatgaggaa ggcaacgagg aactttacga tctttcagct 840 caccagctgt ggatcggcga gcgcacccgt ggcatggatg atttccatgt gaacttcgca 900 tccatgatct ctaacccaat cggcatcgcg attggtcctg gtatcacccc tgaagaggct 960 gttgcatacg ctgacaagct cgatccgaac ttcgagcctg gccgtttgac catcgttgct 1020 cgcatgggcc acgacaaggt tcgctccgta cttcctggtg ttatccaggc tgttgaggca 1080 tccggacaca aggttatttg gcagtccgat ccgatgcacg gcaacacttt caccgcatcc 1140 aatggctaca agacccgtca cttcgacaag gttatcgatg aggtccaggg cttcttcgag 1200 gtccaccgcg cattgggcac ccacccaggc ggaatccaca ttgagttcac tggtgaagat 1260 gtcaccgagt gcctcggtgg cgctgaagac atcaccgatg ttgatctgcc aggccgctac 1320 gagtccgcat gcgatcctcg cctgaacact cagcagtctt tggagttggc tttcctcgtt 1380 gcagcgatgc tgcgtaacta a 1401 <210> 25 <211> 466 <212> PRT <213> Artificial Sequence <220> <223> aroG_R217A+K310A+R403A+E462A <400> 25 Met Asn Arg Gly Val Ser Trp Thr Val Asp Ile Pro Lys Glu Val Leu 1 5 10 15 Pro Asp Leu Pro Pro Leu Pro Glu Gly Met Gln Gln Gln Phe Glu Asp 20 25 30 Thr Ile Ser Arg Asp Ala Lys Gln Gln Pro Thr Trp Asp Arg Ala Gln 35 40 45 Ala Glu Asn Val Arg Lys Ile Leu Glu Ser Val Pro Pro Ile Val Val 50 55 60 Ala Pro Glu Val Leu Glu Leu Lys Gln Lys Leu Ala Asp Val Ala Asn 65 70 75 80 Gly Lys Ala Phe Leu Leu Gln Gly Gly Asp Cys Ala Glu Thr Phe Glu 85 90 95 Ser Asn Thr Glu Pro His Ile Arg Ala Asn Val Lys Thr Leu Leu Gln 100 105 110 Met Ala Val Val Leu Thr Tyr Gly Ala Ser Thr Pro Val Ile Lys Met 115 120 125 Ala Arg Ile Ala Gly Gln Tyr Ala Lys Pro Arg Ser Ser Asp Leu Asp 130 135 140 Gly Asn Gly Leu Pro Asn Tyr Arg Gly Asp Ile Val Asn Gly Val Glu 145 150 155 160 Ala Thr Pro Glu Ala Arg Arg His Asp Pro Ala Arg Met Ile Arg Ala 165 170 175 Tyr Ala Asn Ala Ser Ala Ala Met Asn Leu Val Arg Ala Leu Thr Ser 180 185 190 Ser Gly Thr Ala Asp Leu Tyr Arg Leu Ser Glu Trp Asn Arg Glu Phe 195 200 205 Val Ala Asn Ser Pro Ala Gly Ala Ala Tyr Glu Ala Leu Ala Arg Glu 210 215 220 Ile Asp Ser Gly Leu Arg Phe Met Glu Ala Cys Gly Val Ser Asp Glu 225 230 235 240 Ser Leu Arg Ala Ala Asp Ile Tyr Cys Ser His Glu Ala Leu Leu Val 245 250 255 Asp Tyr Glu Arg Ser Met Leu Arg Leu Ala Thr Asp Glu Glu Gly Asn 260 265 270 Glu Glu Leu Tyr Asp Leu Ser Ala His Gln Leu Trp Ile Gly Glu Arg 275 280 285 Thr Arg Gly Met Asp Asp Phe His Val Asn Phe Ala Ser Met Ile Ser 290 295 300 Asn Pro Ile Gly Ile Ala Ile Gly Pro Gly Ile Thr Pro Glu Glu Ala 305 310 315 320 Val Ala Tyr Ala Asp Lys Leu Asp Pro Asn Phe Glu Pro Gly Arg Leu 325 330 335 Thr Ile Val Ala Arg Met Gly His Asp Lys Val Arg Ser Val Leu Pro 340 345 350 Gly Val Ile Gln Ala Val Glu Ala Ser Gly His Lys Val Ile Trp Gln 355 360 365 Ser Asp Pro Met His Gly Asn Thr Phe Thr Ala Ser Asn Gly Tyr Lys 370 375 380 Thr Arg His Phe Asp Lys Val Ile Asp Glu Val Gln Gly Phe Phe Glu 385 390 395 400 Val His Ala Ala Leu Gly Thr His Pro Gly Gly Ile His Ile Glu Phe 405 410 415 Thr Gly Glu Asp Val Thr Glu Cys Leu Gly Gly Ala Glu Asp Ile Thr 420 425 430 Asp Val Asp Leu Pro Gly Arg Tyr Glu Ser Ala Cys Asp Pro Arg Leu 435 440 445 Asn Thr Gln Gln Ser Leu Glu Leu Ala Phe Leu Val Ala Ala Met Leu 450 455 460 Arg Asn 465 <210> 26 <211> 1401 <212> DNA <213> Artificial Sequence <220> <223> aroG_R217A+K310A+R403A+E462A_nt <400> 26 atgaataggg gtgtgagttg gacagttgat atccctaaag aagttctccc tgatttgcca 60 ccattgccag aaggcatgca gcagcagttc gaggacacca tttcccgtga cgctaagcag 120 caacctacgt gggatcgtgc acaggcagaa aacgtgcgca agatccttga gtcggttcct 180 ccaatcgttg ttgcccctga ggtacttgag ctgaagcaga agcttgctga tgttgccaac 240 ggtaaggcct tcctcttgca gggtggtgac tgtgcggaaa ctttcgagtc aaacactgag 300 ccgcacattc gcgccaacgt aaagactctg ctgcagatgg cagttgtttt gacctacggt 360 gcatccactc ctgtgatcaa gatggctcgt attgctggtc agtacgcaaa gcctcgctct 420 tctgatctgg atggaaatgg tctgccaaac taccgtggcg atatcgtcaa cggtgtggag 480 gcaaccccag aggctcgtcg ccacgatcct gcccgcatga tccgtgctta cgctaacgct 540 tctgctgcga tgaacttggt gcgcgcgctc accagctctg gcaccgctga tctttaccgt 600 ctcagcgagt ggaaccgcga gttcgttgcg aactccccag ctggtgcagc gtacgaggct 660 cttgctcgtg agatcgactc cggtctgcgc ttcatggaag catgtggcgt gtccgatgag 720 tccctgcgtg ctgcagatat ctactgctcc cacgaggctt tgctggtgga ttacgagcgt 780 tccatgctgc gtcttgcaac cgatgaggaa ggcaacgagg aactttacga tctttcagct 840 caccagctgt ggatcggcga gcgcacccgt ggcatggatg atttccatgt gaacttcgca 900 tccatgatct ctaacccaat cggcatcgcg attggtcctg gtatcacccc tgaagaggct 960 gttgcatacg ctgacaagct cgatccgaac ttcgagcctg gccgtttgac catcgttgct 1020 cgcatgggcc acgacaaggt tcgctccgta cttcctggtg ttatccaggc tgttgaggca 1080 tccggacaca aggttatttg gcagtccgat ccgatgcacg gcaacacttt caccgcatcc 1140 aatggctaca agacccgtca cttcgacaag gttatcgatg aggtccaggg cttcttcgag 1200 gtccacgcgg cattgggcac ccacccaggc ggaatccaca ttgagttcac tggtgaagat 1260 gtcaccgagt gcctcggtgg cgctgaagac atcaccgatg ttgatctgcc aggccgctac 1320 gagtccgcat gcgatcctcg cctgaacact cagcagtctt tggagttggc tttcctcgtt 1380 gcagcgatgc tgcgtaacta a 1401 <210> 27 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 27 tatgcttcac cacatgactt c 21 <210> 28 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 28 aaatcatttg agaaaactcg agg 23 <210> 29 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 29 gtcacccgat cgtctgaag 19 <210> 30 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 30 gtcttaaaac cggttgat 18 <210> 31 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 31 caatgctggc tgcgtacgc 19 <210> 32 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 32 ctcctcgcga ggaaccaact 20 <210> 33 <211> 35 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 33 tcgagctcgg taccccgctt ttgcactcat cgagc 35 <210> 34 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 34 cacgatcaga tgtgcatcat cat 23 <210> 35 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 35 atgatgatgc acatctgatc gtg 23 <210> 36 <211> 35 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 36 ctctagagga tccccgagca tcttccaaaa ccttg 35 <210> 37 <211> 35 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 37 tcgagctcgg tacccatgag tgaaacatac gtgtc 35 <210> 38 <211> 39 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 38 gcgcttgagg tactctgcca gcgcgatgtc atcatccgg 39 <210> 39 <211> 39 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 39 ccggatgatg acatcgcgct ggcagagtac ctcaagcgc 39 <210> 40 <211> 34 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 40 ctctagagga tcccccgtca ccgacacctc caca 34 <210> 41 <211> 437 <212> PRT <213> Artificial Sequence <220> <223> gltA_M312I <400> 41 Met Phe Glu Arg Asp Ile Val Ala Thr Asp Asn Asn Lys Ala Val Leu 1 5 10 15 His Tyr Pro Gly Gly Glu Phe Glu Met Asp Ile Ile Glu Ala Ser Glu 20 25 30 Gly Asn Asn Gly Val Val Leu Gly Lys Met Leu Ser Glu Thr Gly Leu 35 40 45 Ile Thr Phe Asp Pro Gly Tyr Val Ser Thr Gly Ser Thr Glu Ser Lys 50 55 60 Ile Thr Tyr Ile Asp Gly Asp Ala Gly Ile Leu Arg Tyr Arg Gly Tyr 65 70 75 80 Asp Ile Ala Asp Leu Ala Glu Asn Ala Thr Phe Asn Glu Val Ser Tyr 85 90 95 Leu Leu Ile Asn Gly Glu Leu Pro Thr Pro Asp Glu Leu His Lys Phe 100 105 110 Asn Asp Glu Ile Arg His His Thr Leu Leu Asp Glu Asp Phe Lys Ser 115 120 125 Gln Phe Asn Val Phe Pro Arg Asp Ala His Pro Met Ala Thr Leu Ala 130 135 140 Ser Ser Val Asn Ile Leu Ser Thr Tyr Tyr Gln Asp Gln Leu Asn Pro 145 150 155 160 Leu Asp Glu Ala Gln Leu Asp Lys Ala Thr Val Arg Leu Met Ala Lys 165 170 175 Val Pro Met Leu Ala Ala Tyr Ala His Arg Ala Arg Lys Gly Ala Pro 180 185 190 Tyr Met Tyr Pro Asp Asn Ser Leu Asn Ala Arg Glu Asn Phe Leu Arg 195 200 205 Met Met Phe Gly Tyr Pro Thr Glu Pro Tyr Glu Ile Asp Pro Ile Met 210 215 220 Val Lys Ala Leu Asp Lys Leu Leu Ile Leu His Ala Asp His Glu Gln 225 230 235 240 Asn Cys Ser Thr Ser Thr Val Arg Met Ile Gly Ser Ala Gln Ala Asn 245 250 255 Met Phe Val Ser Ile Ala Gly Gly Ile Asn Ala Leu Ser Gly Pro Leu 260 265 270 His Gly Gly Ala Asn Gln Ala Val Leu Glu Met Leu Glu Asp Ile Lys 275 280 285 Ser Asn His Gly Gly Asp Ala Thr Glu Phe Met Asn Lys Val Lys Asn 290 295 300 Lys Glu Asp Gly Val Arg Leu Ile Gly Phe Gly His Arg Val Tyr Lys 305 310 315 320 Asn Tyr Asp Pro Arg Ala Ala Ile Val Lys Glu Thr Ala His Glu Ile 325 330 335 Leu Glu His Leu Gly Gly Asp Asp Leu Leu Asp Leu Ala Ile Lys Leu 340 345 350 Glu Glu Ile Ala Leu Ala Asp Asp Tyr Phe Ile Ser Arg Lys Leu Tyr 355 360 365 Pro Asn Val Asp Phe Tyr Thr Gly Leu Ile Tyr Arg Ala Met Gly Phe 370 375 380 Pro Thr Asp Phe Phe Thr Val Leu Phe Ala Ile Gly Arg Leu Pro Gly 385 390 395 400 Trp Ile Ala His Tyr Arg Glu Gln Leu Gly Ala Ala Gly Asn Lys Ile 405 410 415 Asn Arg Pro Arg Gln Val Tyr Thr Gly Asn Glu Ser Arg Lys Leu Val 420 425 430 Pro Arg Glu Glu Arg 435 <210> 42 <211> 1314 <212> DNA <213> Artificial Sequence <220> <223> gltA_M312I_nt <400> 42 atgtttgaaa gggatatcgt ggctactgat aacaacaagg ctgtcctgca ctaccccggt 60 ggcgagttcg aaatggacat catcgaggct tctgagggta acaacggtgt tgtcctgggc 120 aagatgctgt ctgagactgg actgatcact tttgacccag gttatgtgag cactggctcc 180 accgagtcga agatcaccta catcgatggc gatgcgggaa tcctgcgtta ccgcggctat 240 gacatcgctg atctggctga gaatgccacc ttcaacgagg tttcttacct acttatcaac 300 ggtgagctac caaccccaga tgagcttcac aagtttaacg acgagattcg ccaccacacc 360 cttctggacg aggacttcaa gtcccagttc aacgtgttcc cacgcgacgc tcacccaatg 420 gcaaccttgg cttcctcggt taacattttg tctacctact accaggacca gctgaaccca 480 ctcgatgagg cacagcttga taaggcaacc gttcgcctca tggcaaaggt tccaatgctg 540 gctgcgtacg cacaccgcgc acgcaagggt gctccttaca tgtacccaga caactccctc 600 aatgcgcgtg agaacttcct gcgcatgatg ttcggttacc caaccgagcc atacgagatc 660 gacccaatca tggtcaaggc tctggacaag ctgctcatcc tgcacgctga ccacgagcag 720 aactgctcca cctccaccgt tcgtatgatc ggttccgcac aggccaacat gtttgtctcc 780 atcgctggtg gcatcaacgc tctgtccggc ccactgcacg gtggcgcaaa ccaggctgtt 840 ctggagatgc tcgaagacat caagagcaac cacggtggcg acgcaaccga gttcatgaac 900 aaggtcaaga acaaggaaga cggcgtccgc ctcatcggct tcggacaccg cgtttacaag 960 aactacgatc cacgtgcagc aatcgtcaag gagaccgcac acgagatcct cgagcacctc 1020 ggtggcgacg atcttctgga tctggcaatc aagctggaag aaattgcact ggctgatgat 1080 tacttcatct cccgcaagct ctacccgaac gtagacttct acaccggcct gatctaccgc 1140 gcaatgggct tcccaactga cttcttcacc gtattgttcg caatcggtcg tctgccagga 1200 tggatcgctc actaccgcga gcagctcggt gcagcaggca acaagatcaa ccgcccacgc 1260 caggtctaca ccggcaacga atcccgcaag ttggttcctc gcgaggagcg ctaa 1314 <210> 43 <211> 42 <212> DNA <213> Artificial Sequence <220> <223> gltA M312I Up F <400> 43 gtgaattcga gctcggtacc cgcgggaatc ctgcgttacc gc 42 <210> 44 <211> 42 <212> DNA <213> Artificial Sequence <220> <223> gltA M312I Up R <400> 44 tgtaaacgcg gtgtccgaag ccgatgaggc ggacgccgtc tt 42 <210> 45 <211> 42 <212> DNA <213> Artificial Sequence <220> <223> gltA M312I Down F <400> 45 aagacggcgt ccgcctcatc ggcttcggac accgcgttta ca 42 <210> 46 <211> 42 <212> DNA <213> Artificial Sequence <220> <223> gltA M312I Down R <400> 46 ggtcgactct agaggatccc cttagcgctc ctcgcgagga ac 42 <210> 47 <211> 436 <212> PRT <213> Unknown <220> <223> ilvA_WT <400> 47 Met Ser Glu Thr Tyr Val Ser Glu Lys Ser Pro Gly Val Met Ala Ser 1 5 10 15 Gly Ala Glu Leu Ile Arg Ala Ala Asp Ile Gln Thr Ala Gln Ala Arg 20 25 30 Ile Ser Ser Val Ile Ala Pro Thr Pro Leu Gln Tyr Cys Pro Arg Leu 35 40 45 Ser Glu Glu Thr Gly Ala Glu Ile Tyr Leu Lys Arg Glu Asp Leu Gln 50 55 60 Asp Val Arg Ser Tyr Lys Ile Arg Gly Ala Leu Asn Ser Gly Ala Gln 65 70 75 80 Leu Thr Gln Glu Gln Arg Asp Ala Gly Ile Val Ala Ala Ser Ala Gly 85 90 95 Asn His Ala Gln Gly Val Ala Tyr Val Cys Lys Ser Leu Gly Val Gln 100 105 110 Gly Arg Ile Tyr Val Pro Val Gln Thr Pro Lys Gln Lys Arg Asp Arg 115 120 125 Ile Met Val His Gly Gly Glu Phe Val Ser Leu Val Val Thr Gly Asn 130 135 140 Asn Phe Asp Glu Ala Ser Ala Ala Ala His Glu Asp Ala Glu Arg Thr 145 150 155 160 Gly Ala Thr Leu Ile Glu Pro Phe Asp Ala Arg Asn Thr Val Ile Gly 165 170 175 Gln Gly Thr Val Ala Ala Glu Ile Leu Ser Gln Leu Thr Ser Met Gly 180 185 190 Lys Ser Ala Asp His Val Met Val Pro Val Gly Gly Gly Gly Leu Leu 195 200 205 Ala Gly Val Val Ser Tyr Met Ala Asp Met Ala Pro Arg Thr Ala Ile 210 215 220 Val Gly Ile Glu Pro Ala Gly Ala Ala Ser Met Gln Ala Ala Leu His 225 230 235 240 Asn Gly Gly Pro Ile Thr Leu Glu Thr Val Asp Pro Phe Val Asp Gly 245 250 255 Ala Ala Val Lys Arg Val Gly Asp Leu Asn Tyr Thr Ile Val Glu Lys 260 265 270 Asn Gln Gly Arg Val His Met Met Ser Ala Thr Glu Gly Ala Val Cys 275 280 285 Thr Glu Met Leu Asp Leu Tyr Gln Asn Glu Gly Ile Ile Ala Glu Pro 290 295 300 Ala Gly Ala Leu Ser Ile Ala Gly Leu Lys Glu Met Ser Phe Ala Pro 305 310 315 320 Gly Ser Val Val Val Cys Ile Ile Ser Gly Gly Asn Asn Asp Val Leu 325 330 335 Arg Tyr Ala Glu Ile Ala Glu Arg Ser Leu Val His Arg Gly Leu Lys 340 345 350 His Tyr Phe Leu Val Asn Phe Pro Gln Lys Pro Gly Gln Leu Arg His 355 360 365 Phe Leu Glu Asp Ile Leu Gly Pro Asp Asp Asp Ile Thr Leu Phe Glu 370 375 380 Tyr Leu Lys Arg Asn Asn Arg Glu Thr Gly Thr Ala Leu Val Gly Ile 385 390 395 400 His Leu Ser Glu Ala Ser Gly Leu Asp Ser Leu Leu Glu Arg Met Glu 405 410 415 Glu Ser Ala Ile Asp Ser Arg Arg Leu Glu Pro Gly Thr Pro Glu Tyr 420 425 430 Glu Tyr Leu Thr 435 <210> 48 <211> 1311 <212> DNA <213> Unknown <220> <223> ilvA_WT_nt <400> 48 atgagtgaaa catacgtgtc tgagaaaagt ccaggagtga tggctagcgg agcggagctg 60 attcgtgccg ccgacattca aacggcgcag gcacgaattt cctccgtcat tgcaccaact 120 ccattgcagt attgccctcg tctttctgag gaaaccggag cggaaatcta ccttaagcgt 180 gaggatctgc aggatgttcg ttcctacaag atccgcggtg cgctgaactc tggagcgcag 240 ctcacccaag agcagcgcga tgcaggtatc gttgccgcat ctgcaggtaa ccatgcccag 300 ggcgtggcct atgtgtgcaa gtccttgggc gttcagggac gcatctatgt tcctgtgcag 360 actccaaagc aaaagcgtga ccgcatcatg gttcacggcg gagagtttgt ctccttggtg 420 gtcactggca ataacttcga cgaagcatcg gctgcagcgc atgaagatgc agagcgcacc 480 ggcgcaacgc tgatcgagcc tttcgatgct cgcaacaccg tcatcggtca gggcaccgtg 540 gctgctgaga tcttgtcgca gctgacttcc atgggcaaga gtgcagatca cgtgatggtt 600 ccagtcggcg gtggcggact tcttgcaggt gtggtcagct acatggctga tatggcacct 660 cgcactgcga tcgttggtat cgaaccagcg ggagcagcat ccatgcaggc tgcattgcac 720 aatggtggac caatcacttt ggagactgtt gatccctttg tggacggcgc agcagtcaaa 780 cgtgtcggag atctcaacta caccatcgtg gagaagaacc agggtcgcgt gcacatgatg 840 agcgcgaccg agggcgctgt gtgtactgag atgctcgatc tttaccaaaa cgaaggcatc 900 atcgcggagc ctgctggcgc gctgtctatc gctgggttga aggaaatgtc ctttgcacct 960 ggttctgtcg tggtgtgcat catctctggt ggcaacaacg atgtgctgcg ttatgcggaa 1020 atcgctgagc gctccttggt gcaccgcggt ttgaagcact acttcttggt gaacttcccg 1080 caaaagcctg gtcagttgcg tcacttcctg gaagatatcc tgggaccgga tgatgacatc 1140 acgctgtttg agtacctcaa gcgcaacaac cgtgagaccg gtactgcgtt ggtgggtatt 1200 cacttgagtg aagcatcagg attggattct ttgctggaac gtatggagga atcggcaatt 1260 gattcccgtc gcctcgagcc gggcacccct gagtacgaat acttgaccta a 1311 <210> 49 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 49 ggatccgact gagcctgggc aactgg 26 <210> 50 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 50 ggatccccgt caccgacacc tccaca 26 <210> 51 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 51 acatcacgct ggcagagtac ctcaa 25 <210> 52 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 52 ttgaggtact ctgccagcgt gatgt 25 <210> 53 <211> 436 <212> PRT <213> Artificial Sequence <220> <223> ilvA_T381A+F383A <400> 53 Met Ser Glu Thr Tyr Val Ser Glu Lys Ser Pro Gly Val Met Ala Ser 1 5 10 15 Gly Ala Glu Leu Ile Arg Ala Ala Asp Ile Gln Thr Ala Gln Ala Arg 20 25 30 Ile Ser Ser Val Ile Ala Pro Thr Pro Leu Gln Tyr Cys Pro Arg Leu 35 40 45 Ser Glu Glu Thr Gly Ala Glu Ile Tyr Leu Lys Arg Glu Asp Leu Gln 50 55 60 Asp Val Arg Ser Tyr Lys Ile Arg Gly Ala Leu Asn Ser Gly Ala Gln 65 70 75 80 Leu Thr Gln Glu Gln Arg Asp Ala Gly Ile Val Ala Ala Ser Ala Gly 85 90 95 Asn His Ala Gln Gly Val Ala Tyr Val Cys Lys Ser Leu Gly Val Gln 100 105 110 Gly Arg Ile Tyr Val Pro Val Gln Thr Pro Lys Gln Lys Arg Asp Arg 115 120 125 Ile Met Val His Gly Gly Glu Phe Val Ser Leu Val Val Thr Gly Asn 130 135 140 Asn Phe Asp Glu Ala Ser Ala Ala Ala His Glu Asp Ala Glu Arg Thr 145 150 155 160 Gly Ala Thr Leu Ile Glu Pro Phe Asp Ala Arg Asn Thr Val Ile Gly 165 170 175 Gln Gly Thr Val Ala Ala Glu Ile Leu Ser Gln Leu Thr Ser Met Gly 180 185 190 Lys Ser Ala Asp His Val Met Val Pro Val Gly Gly Gly Gly Leu Leu 195 200 205 Ala Gly Val Val Ser Tyr Met Ala Asp Met Ala Pro Arg Thr Ala Ile 210 215 220 Val Gly Ile Glu Pro Ala Gly Ala Ala Ser Met Gln Ala Ala Leu His 225 230 235 240 Asn Gly Gly Pro Ile Thr Leu Glu Thr Val Asp Pro Phe Val Asp Gly 245 250 255 Ala Ala Val Lys Arg Val Gly Asp Leu Asn Tyr Thr Ile Val Glu Lys 260 265 270 Asn Gln Gly Arg Val His Met Met Ser Ala Thr Glu Gly Ala Val Cys 275 280 285 Thr Glu Met Leu Asp Leu Tyr Gln Asn Glu Gly Ile Ile Ala Glu Pro 290 295 300 Ala Gly Ala Leu Ser Ile Ala Gly Leu Lys Glu Met Ser Phe Ala Pro 305 310 315 320 Gly Ser Val Val Val Cys Ile Ile Ser Gly Gly Asn Asn Asp Val Leu 325 330 335 Arg Tyr Ala Glu Ile Ala Glu Arg Ser Leu Val His Arg Gly Leu Lys 340 345 350 His Tyr Phe Leu Val Asn Phe Pro Gln Lys Pro Gly Gln Leu Arg His 355 360 365 Phe Leu Glu Asp Ile Leu Gly Pro Asp Asp Asp Ile Ala Leu Ala Glu 370 375 380 Tyr Leu Lys Arg Asn Asn Arg Glu Thr Gly Thr Ala Leu Val Gly Ile 385 390 395 400 His Leu Ser Glu Ala Ser Gly Leu Asp Ser Leu Leu Glu Arg Met Glu 405 410 415 Glu Ser Ala Ile Asp Ser Arg Arg Leu Glu Pro Gly Thr Pro Glu Tyr 420 425 430 Glu Tyr Leu Thr 435 <210> 54 <211> 1311 <212> DNA <213> Artificial Sequence <220> <223> ilvA_T381A+F383A_nt <400> 54 atgagtgaaa catacgtgtc tgagaaaagt ccaggagtga tggctagcgg agcggagctg 60 attcgtgccg ccgacattca aacggcgcag gcacgaattt cctccgtcat tgcaccaact 120 ccattgcagt attgccctcg tctttctgag gaaaccggag cggaaatcta ccttaagcgt 180 gaggatctgc aggatgttcg ttcctacaag atccgcggtg cgctgaactc tggagcgcag 240 ctcacccaag agcagcgcga tgcaggtatc gttgccgcat ctgcaggtaa ccatgcccag 300 ggcgtggcct atgtgtgcaa gtccttgggc gttcagggac gcatctatgt tcctgtgcag 360 actccaaagc aaaagcgtga ccgcatcatg gttcacggcg gagagtttgt ctccttggtg 420 gtcactggca ataacttcga cgaagcatcg gctgcagcgc atgaagatgc agagcgcacc 480 ggcgcaacgc tgatcgagcc tttcgatgct cgcaacaccg tcatcggtca gggcaccgtg 540 gctgctgaga tcttgtcgca gctgacttcc atgggcaaga gtgcagatca cgtgatggtt 600 ccagtcggcg gtggcggact tcttgcaggt gtggtcagct acatggctga tatggcacct 660 cgcactgcga tcgttggtat cgaaccagcg ggagcagcat ccatgcaggc tgcattgcac 720 aatggtggac caatcacttt ggagactgtt gatccctttg tggacggcgc agcagtcaaa 780 cgtgtcggag atctcaacta caccatcgtg gagaagaacc agggtcgcgt gcacatgatg 840 agcgcgaccg agggcgctgt gtgtactgag atgctcgatc tttaccaaaa cgaaggcatc 900 atcgcggagc ctgctggcgc gctgtctatc gctgggttga aggaaatgtc ctttgcacct 960 ggttctgtcg tggtgtgcat catctctggt ggcaacaacg atgtgctgcg ttatgcggaa 1020 atcgctgagc gctccttggt gcaccgcggt ttgaagcact acttcttggt gaacttcccg 1080 caaaagcctg gtcagttgcg tcacttcctg gaagatatcc tgggaccgga tgatgacatc 1140 gcgctggcag agtacctcaa gcgcaacaac cgtgagaccg gtactgcgtt ggtgggtatt 1200 cacttgagtg aagcatcagg attggattct ttgctggaac gtatggagga atcggcaatt 1260 gattcccgtc gcctcgagcc gggcacccct gagtacgaat acttgaccta a 1311 <210> 55 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 55 aacacgaccg gcatcccgtc gc 22 <210> 56 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 56 aaatcatttg agaaaactcg agg 23 <210> 57 <211> 45 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 57 gtgaattcga gctcggtacc caaatcattt gagaaaactc gaggc 45 <210> 58 <211> 45 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 58 ggtgatcatc tcaacggtgg aacacaggtt gatgatcatt gggtt 45 <210> 59 <211> 45 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 59 aacccaatga tcatcaacct gtgttccacc gttgagatga tcacc 45 <210> 60 <211> 42 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 60 ggtcgactct agaggatccc caagaaggca acatcggaca gc 42 <210> 61 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 61 atccattcaa tggagtctgc g 21 <210> 62 <211> 616 <212> PRT <213> Artificial Sequence <220> <223> leuA_P247C+R558H+G561D <400> 62 Met Ser Pro Asn Asp Ala Phe Ile Ser Ala Pro Ala Lys Ile Glu Thr 1 5 10 15 Pro Val Gly Pro Arg Asn Glu Gly Gln Pro Ala Trp Asn Lys Gln Arg 20 25 30 Gly Ser Ser Met Pro Val Asn Arg Tyr Met Pro Phe Glu Val Glu Val 35 40 45 Glu Asp Ile Ser Leu Pro Asp Arg Thr Trp Pro Asp Lys Lys Ile Thr 50 55 60 Val Ala Pro Gln Trp Cys Ala Val Asp Leu Arg Asp Gly Asn Gln Ala 65 70 75 80 Leu Ile Asp Pro Met Ser Pro Glu Arg Lys Arg Arg Met Phe Glu Leu 85 90 95 Leu Val Gln Met Gly Phe Lys Glu Ile Glu Val Gly Phe Pro Ser Ala 100 105 110 Ser Gln Thr Asp Phe Asp Phe Val Arg Glu Ile Ile Glu Lys Gly Met 115 120 125 Ile Pro Asp Asp Val Thr Ile Gln Val Leu Val Gln Ala Arg Glu His 130 135 140 Leu Ile Arg Arg Thr Phe Glu Ala Cys Glu Gly Ala Lys Asn Val Ile 145 150 155 160 Val His Phe Tyr Asn Ser Thr Ser Ile Leu Gln Arg Asn Val Val Phe 165 170 175 Arg Met Asp Lys Val Gln Val Lys Lys Leu Ala Thr Asp Ala Ala Glu 180 185 190 Leu Ile Lys Thr Ile Ala Gln Asp Tyr Pro Asp Thr Asn Trp Arg Trp 195 200 205 Gln Tyr Ser Pro Glu Ser Phe Thr Gly Thr Glu Val Glu Tyr Ala Lys 210 215 220 Glu Val Val Asp Ala Val Val Glu Val Met Asp Pro Thr Pro Glu Asn 225 230 235 240 Pro Met Ile Ile Asn Leu Cys Ser Thr Val Glu Met Ile Thr Pro Asn 245 250 255 Val Tyr Ala Asp Ser Ile Glu Trp Met His Arg Asn Leu Asn Arg Arg 260 265 270 Asp Ser Ile Ile Leu Ser Leu His Pro His Asn Asp Arg Gly Thr Gly 275 280 285 Val Gly Ala Ala Glu Leu Gly Tyr Met Ala Gly Ala Asp Arg Ile Glu 290 295 300 Gly Cys Leu Phe Gly Asn Gly Glu Arg Thr Gly Asn Val Cys Leu Val 305 310 315 320 Thr Leu Ala Leu Asn Met Leu Thr Gln Gly Val Asp Pro Gln Leu Asp 325 330 335 Phe Thr Asp Ile Arg Gln Ile Arg Ser Thr Val Glu Tyr Cys Asn Gln 340 345 350 Leu Arg Val Pro Glu Arg His Pro Tyr Gly Gly Asp Leu Val Phe Thr 355 360 365 Ala Phe Ser Gly Ser His Gln Asp Ala Val Asn Lys Gly Leu Asp Ala 370 375 380 Met Ala Ala Lys Val Gln Pro Gly Ala Ser Ser Thr Glu Val Ser Trp 385 390 395 400 Glu Gln Leu Arg Asp Thr Glu Trp Glu Val Pro Tyr Leu Pro Ile Asp 405 410 415 Pro Lys Asp Val Gly Arg Asp Tyr Glu Ala Val Ile Arg Val Asn Ser 420 425 430 Gln Ser Gly Lys Gly Gly Val Ala Tyr Ile Met Lys Thr Asp His Gly 435 440 445 Leu Gln Ile Pro Arg Ser Met Gln Val Glu Phe Ser Thr Val Val Gln 450 455 460 Asn Val Thr Asp Ala Glu Gly Gly Glu Val Asn Ser Lys Ala Met Trp 465 470 475 480 Asp Ile Phe Ala Thr Glu Tyr Leu Glu Arg Thr Ala Pro Val Glu Gln 485 490 495 Ile Ala Leu Arg Val Glu Asn Ala Gln Thr Glu Asn Glu Asp Ala Ser 500 505 510 Ile Thr Ala Glu Leu Ile His Asn Gly Lys Asp Val Thr Val Asp Gly 515 520 525 Arg Gly Asn Gly Pro Leu Ala Ala Tyr Ala Asn Ala Leu Glu Lys Leu 530 535 540 Gly Ile Asp Val Glu Ile Gln Glu Tyr Asn Gln His Ala His Thr Ser 545 550 555 560 Asp Asp Asp Ala Glu Ala Ala Ala Tyr Val Leu Ala Glu Val Asn Gly 565 570 575 Arg Lys Val Trp Gly Val Gly Ile Ala Gly Ser Ile Thr Tyr Ala Ser 580 585 590 Leu Lys Ala Val Thr Ser Ala Val Asn Arg Ala Leu Asp Val Asn His 595 600 605 Glu Ala Val Leu Ala Gly Gly Val 610 615 <210> 63 <211> 1851 <212> DNA <213> Artificial Sequence <220> <223> leuA_P247C+R558H+G561D_nt <400> 63 atgtctccta acgatgcatt catctccgca cctgccaaga tcgaaacccc agttgggcct 60 cgcaacgaag gccagccagc atggaataag cagcgtggct cctcaatgcc agttaaccgc 120 tacatgcctt tcgaggttga ggtagaagat atttctctgc cggaccgcac ttggccagat 180 aaaaaaatca ccgttgcacc tcagtggtgt gctgttgacc tgcgtgacgg caaccaggct 240 ctgattgatc cgatgtctcc tgagcgtaag cgccgcatgt ttgagctgct ggttcagatg 300 ggcttcaaag aaatcgaggt cggtttccct tcagcttccc agactgattt tgatttcgtt 360 cgtgagatca tcgaaaaggg catgatccct gacgatgtca ccattcaggt tctggttcag 420 gctcgtgagc acctgattcg ccgtactttt gaagcttgcg aaggcgcaaa aaacgttatc 480 gtgcacttct acaactccac ctccatcctg cagcgcaacg tggtgttccg catggacaag 540 gtgcaggtga agaagctggc taccgatgcc gctgaactaa tcaagaccat cgctcaggat 600 tacccagaca ccaactggcg ctggcagtac tcccctgagt ccttcaccgg cactgaggtt 660 gagtacgcca aggaagttgt ggacgcagtt gttgaggtca tggatccaac tcctgagaac 720 ccaatgatca tcaacctgtg ttccaccgtt gagatgatca cccctaacgt ttacgcagac 780 tccattgaat ggatgcaccg caatctaaac cgtcgtgatt ccattatcct gtccctgcac 840 ccgcacaatg accgtggcac cggcgttggc gcagctgagc tgggctacat ggctggcgct 900 gaccgcatcg aaggctgcct gttcggcaac ggcgagcgca ccggcaacgt ctgcctggtc 960 accctggcac tgaacatgct gacccagggc gttgaccctc agctggactt caccgatata 1020 cgccagatcc gcagcaccgt tgaatactgc aaccagctgc gcgttcctga gcgccaccca 1080 tacggcggtg acctggtctt caccgctttc tccggttccc accaggacgc tgtgaacaag 1140 ggtctggacg ccatggctgc caaggttcag ccaggtgcta gctccactga agtttcttgg 1200 gagcagctgc gcgacaccga atgggaggtt ccttacctgc ctatcgatcc aaaggatgtc 1260 ggtcgcgact acgaggctgt tatccgcgtg aactcccagt ccggcaaggg cggcgttgct 1320 tacatcatga agaccgatca cggtctgcag atccctcgct ccatgcaggt tgagttctcc 1380 accgttgtcc agaacgtcac cgacgctgag ggcggcgagg tcaactccaa ggcaatgtgg 1440 gatatcttcg ccaccgagta cctggagcgc accgcaccag ttgagcagat cgcgctgcgc 1500 gtcgagaacg ctcagaccga aaacgaggat gcatccatca ccgccgagct catccacaac 1560 ggcaaggacg tcaccgtcga tggccgcggc aacggcccac tggccgctta cgccaacgcg 1620 ctggagaagc tgggcatcga cgttgagatc caggaataca accagcacgc ccacacctcg 1680 gatgacgatg cagaagcagc cgcctacgtg ctggctgagg tcaacggccg caaggtctgg 1740 ggcgtcggca tcgctggctc catcacctac gcttcgctga aggcagtgac ctccgccgta 1800 aaccgcgcgc tggacgtcaa ccacgaggca gtcctggctg gcggcgttta a 1851

Claims

서열번호 1의 아미노산 서열에서 N-말단으로부터 217번, 310번, 403번 및 462번 위치에 상응하는 아미노산 중 어느 하나 이상의 아미노산이 다른 아미노산으로 치환된, aroG 알돌라아제 (Phospho-2-dehydro-3-deoxyheptonate aldolase) 변이체.
제1항에 있어서, 상기 변이체는 서열번호 1의 아미노산 서열에서 N-말단으로부터 217번 위치에 상응하는 아미노산이 아르기닌 외의 아미노산으로 치환; 310번 아미노산에 상응하는 아미노산이 라이신 외의 아미노산으로 치환; 403번 아미노산에 상응하는 아미노산이 아르기닌 외의 아미노산으로 치환; 및 462번 아미노산에 상응하는 아미노산이 글루탐산 외의 아미노산으로 치환 중 1 이상의 치환을 포함하는, aroG 알돌라아제 (Phospho-2-dehydro-3-deoxyheptonate aldolase) 변이체.
제1항에 있어서, 상기 다른 아미노산으로의 치환은 비극성(nonpolar) 아미노산 또는 크기가 작은 아미노산으로의 치환인 것인, aroG 알돌라아제 변이체.
제1항에 있어서, 상기 다른 아미노산은 알라닌(Ala)인 것인, aroG 알돌라아제 변이체.
제1항에 있어서, 상기 aroG 알돌라아제 변이체는 서열번호 3, 서열번호 5, 서열번호 7, 서열번호 9, 서열번호 23 또는 서열번호 25와 99% 이상 상동성 또는 동일성을 갖는 것인, aroG 알돌라아제 변이체.
제1항에 있어서, 상기 aroG 알돌라아제 변이체는 서열번호 1의 aroG 알돌라아제 변이체에 비해 약화된 활성을 갖는 것인, aroG 알돌라아제 변이체.
제1항 내지 제6항 중 어느 한 항의 aroG 알돌라아제 변이체를 코딩하는 폴리뉴클레오티드.
제7항의 폴리뉴클레오티드를 포함하는 벡터.
제1항 내지 제6항 중 어느 한 항의 aroG 알돌라아제 변이체; 상기 aroG 알돌라아제 변이체를 코딩하는 폴리뉴클레오티드; 및 상기 폴리뉴클레오티드를 포함하는 벡터 중 1 이상을 포함하는 코리네박테리움 속 미생물.
제9항에 있어서, 상기 미생물은 코리네박테리움 글루타미쿰인 것인, 미생물.
제9항의 미생물을 배지에서 배양하는 단계를 포함하는, 분지쇄 아미노산 생산 방법.
제11항에 있어서, 상기 방법은 분지쇄 아미노산을 미생물 또는 배지로부터 회수하는 단계를 더 포함하는, 분지쇄 아미노산 생산 방법.
제11항에 있어서, 상기 분지쇄 아미노산은 L-류신, L-이소류신 및 L-발린 중 선택되는 1 이상인 것인, 분지쇄 아미노산 생산 방법.