KR20220034218A

KR20220034218A - 대장균 기반 재조합 균주 및 이의 구축 방법과 응용

Info

Publication number: KR20220034218A
Application number: KR1020227005071A
Authority: KR
Inventors: 에잉 웨이; 강 멩; 휴이핑 지아; 시아오항 가오; 펭용 마; 시아오군 저우; 청구앙 자오; 리펭 양; 호유보 수
Original assignee: 헤이룽지앙 에펜 바이오테크 컴퍼니 리미티드
Priority date: 2019-08-28
Filing date: 2020-08-27
Publication date: 2022-03-17
Also published as: JP2022547010A; EP4253569A3; EP3992293A4; JP7471395B2; WO2021037166A1; EP3992293A1; US20220324919A1; BR112022002535A2; EP4253569A2

Abstract

대장균 균주 K12 또는 이의 유도체 균주를 기반으로 부위 특이적 돌연변이 후의 재조합 균주 및 이의 구축 방법과 응용을 제공한다. 상기 재조합 균주는 kdtA 유전자, spoT 유전자 또는 yebN 유전자에 대해 부위 특이적 돌연변이를 거친 것이며, 돌연변이되지 않은 야생형 균주에 비해 더 높은 농도의 L-트레오닌을 생산할 수 있다.

Description

대장균 기반 재조합 균주 및 이의 구축 방법과 응용

관련 출원의 상호 참조

본 발명은 2019년 09월 27일 중국 국가지식재산권국에 제출한 특허 출원 번호가 2019109262958인 선행 출원의 우선권, 2019년 08월 28일 중국 국가지식재산권국에 제출한 특허 출원 번호가 2019108046792인 선행 출원의 우선권, 및 2019년 08월 28일 중국 국가지식재산권국에 제출한 특허 출원 번호가 2019108046881인 선행 출원의 우선권을 주장하는 바, 상기 선행 출원의 전문은 참조로서 본 발명에 인용된다.

본 발명은 유전자 공학 및 미생물 기술 분야에 속하며, 구체적으로 kdtA 유전자에 의해 변형된 재조합 균주 및 이의 구축 방법과 응용에 관한 것이다.

L-트레오닌은 8가지 필수 아미노산 중 하나로, 인간과 동물이 스스로 합성할 수 없는 아미노산이다. L-트레오닌은 곡물의 흡수를 강화하고 체내 대사 균형을 조절하며 신체의 성장과 발달을 촉진할 수 있고, 사료, 의약 및 식품 산업에 널리 사용된다.

현재, L-트레오닌의 생산은 주로 화학적 합성법, 단백질 가수분해법 및 미생물 발효법이 있으며, 여기서 미생물 발효법은 생산 비용이 낮고 생산 강도가 높으며 환경 오염이 적기 때문에, 현재 L-트레오닌의 공업적 생산에 가장 널리 사용되는 방법이다. 다양한 박테리아가 L-트레오닌의 미생물 발효 생산에 사용될 수 있는데, 예를 들어 대장균, 코리네박테리움(Corynebacterium), 세라티아(Serratia) 등 야생형 유도에 의해 획득된 돌연변이 균주를 생산 균주로 사용할 수 있다. 구체적인 구현예로는 항 아미노산 유사체 돌연변이 균주 또는 메티오닌(methionine), 트레오닌(threonine), 이소류신(isoleucine)과 같은 다양한 영양 요구체를 포함한다. 그러나, 전통적인 돌연변이 육종은 랜덤 돌연변이로 인해 균주의 성장이 느리고 더 많은 부산물을 생성하여 높은 수율의 균주를 획득하기 어렵다. 따라서, 대사 공학 수단을 사용하여 재조합 대장균을 구축하는 것은 L-트레오닌을 생산하는 효과적인 경로이다. 현재, 발현 플라스미드에 의해 매개되는 아미노산 합성 경로 및 경쟁 경로에서 핵심적 효소 유전자의 과발현 또는 약화를 이용하는 것은 대장균의 유전자 변형을 위한 주요 수단이다. 그러나, 고수율로 L-트레오닌을 보다 경제적으로 생산하기 위한 방법의 개발이 여전히 필요하다.

대장균은 외인성 유전자 발현의 숙주로서, 유전적 배경이 명확하고 기술 조작과 배양 조건이 간단하며 대규모 발효가 경제적이고 유전공학 전문가들의 높은 평가를 받고 있다. 대장균의 게놈 DNA는 핵양체 중의 고리형 분자로, 동시에 다수의 고리형 플라스미드 DNA가 있을 수 있다. 대장균 세포의 핵양체에는 1개의 DNA 분자가 있고, 길이는 약 4700000개의 염기쌍이며, DNA 분자에는 약 4400개의 유전자가 분포되어 있고, 각 유전자의 평균 길이는 약 1000개의 염기쌍이다. 분자생물학에서 일반적으로 사용되는 대장균 균주는 소수 예를 제외하고 DNA 재조합 실험에 사용되는 대부분 균주는 대장균 균주 K12 및 이의 유도체이다.

본 발명은 대장균 균주 K12 또는 이의 유도체 기반의 재조합 균주, 이의 재조합 구축 방법 및 아미노산의 발효 및 생산에서의 응용을 제공한다.

본 발명은 E.coli K12 균주 및 이의 유도체 균주(예를 들면 MG1655, W3110 등) 중의 야생형 kdtA 유전자(ORF 서열은 Genbank 수탁 번호 CP032667.1 중의 서열 73556-74833으로 표시된 바와 같음), 야생형 spoT 유전자(ORF 서열은 Genbank 수탁 번호 AP009048.1 중의 서열3815907-3818015로 표시된 바와 같음), 및 야생형 yebN 유전자(ORF 서열은 Genbank 수탁 번호 AP009048.1 중의 서열1907402-1907968로 표시된 바와 같음)에 착안하여, 상기 유전자의 부위 특이적 돌연변이 후 획득된 돌연변이 유전자 및 상기 유전자를 포함하는 재조합 균주가 L-트레오닌의 생산에 사용될 수 있고, 획득된 균주가 돌연변이되지 않은 야생형 균주에 비해 L-트레오닌의 수율을 크게 증가시킬 수 있으며, 균주의 안정성이 우수하여 L-트레오닌 생산 균주로서 생산 비용을 절감할 수 있다는 것을 발견하였다.

상기 발명을 기반으로, 본 발명은 아래와 같은 세 부분의 기술적 해결수단을 제공한다.

제1 부분은 뉴클레오티드 서열로, 상기 뉴클레오티드 서열은 서열번호 1로 표시되는 야생형 kdtA 유전자 코딩 서열 82번째 염기의 돌연변이에 의해 형성된 서열을 포함한다.

본 발명에 따르면, 상기 돌연변이는 해당 부위의 염기/뉴클레오티드의 변화를 의미하고, 상기 돌연변이 방법은 돌연변이 유발, PCR 부위 특이적 돌연변이 및/또는 상동재조합 방법 중 적어도 하나로부터 선택될 수 있다.

본 발명에 따르면, 상기 돌연변이는 서열번호 1의 82번째 염기가 구아닌(G)에서 아데닌(A)으로의 돌연변이이고; 구체적으로, 상기 돌연변이된 뉴클레오티드 서열은 서열번호 2로 표시된 바와 같다.

본 발명은 또한 상기와 같은 뉴클레오티드 서열에 의해 코딩된 재조합 단백질을 제공한다.

본 발명에 따른 재조합 단백질은 서열번호 4로 표시되는 아미노산 서열을 포함한다.

본 발명은 또한 상기 뉴클레오티드 서열 또는 재조합 단백질을 포함하는 재조합 벡터를 제공한다.

본 발명에 따른 재조합 벡터는 상기 뉴클레오티드 서열을 플라스미드에 도입하여 구축된 것이고, 하나의 실시형태로서, 상기 플라스미드는 pKOV 플라스미드이다. 구체적으로, 상기 뉴클레오티드 서열 및 상기 플라스미드를 엔도뉴클레아제로 절단하여 상보적인 접착성 말단을 형성할 수 있고, 양자를 연결하여 재조합 벡터로 구축할 수 있다.

본 발명은 또한 코딩 서열에 점돌연변이가 있는 kdtA 유전자 코딩 뉴클레오티드 서열을 포함하는 재조합 균주를 제공한다.

본 발명에 따른 재조합 균주는 상기와 같은 뉴클레오티드 서열을 포함한다.

본 발명의 일 실시형태로서, 상기 재조합 균주는 서열번호 2로 표시되는 뉴클레오티드 서열을 포함한다.

본 발명의 일 실시형태로서, 상기 재조합 균주는 서열번호 4로 표시되는 아미노산 서열을 포함한다.

본 발명에 따른 재조합 균주는 상기 재조합 벡터를 숙주 균주에 도입하여 재조합으로 형성된 것이고; 상기 숙주 균주는 특별히 한정되지 않으며, 본 기술분야에서 공지된 kdtA 유전자를 보유하는 L-트레오닌 생산 균주로부터 선택될 수 있고, 예를 들어 대장균 중 적어도 하나로부터 선택될 수 있다. 본 발명의 일 실시형태로서, 상기 숙주 균주는 E.coli K12(W3110) 균주, E.coli CGMCC 7.232 균주이다.

본 발명에 따른 재조합 균주는 pKOV 플라스미드를 벡터로 한다.

본 발명에 따른 재조합 균주는 다른 변형을 더 포함하거나 포함하지 않을 수 있다.

본 발명은 또한 서열번호 1로 표시되는 야생형 kdtA 유전자 코딩 영역의 뉴클레오티드 서열을 변형하여 82번째 염기를 돌연변이시켜, 돌연변이 kdtA 코딩 유전자를 포함하는 L-트레오닌 생산 재조합 균주를 획득하는 단계를 포함하는 재조합 균주의 구축 방법을 제공한다.

본 발명에 따른 구축 방법에서, 상기 변형은 돌연변이 유발, PCR 부위 특이적 돌연변이 및/또는 상동재조합 방법 중 적어도 하나를 포함한다.

본 발명에 따른 구축 방법에서, 상기 돌연변이는 서열번호 1의 82번째 구아닌(G)이 아데닌(A)으로 돌연변이된 것을 의미하고; 구체적으로, 상기 돌연변이된 뉴클레오티드 서열은 서열번호 2로 표시된 바와 같다.

또한, 상기 구축 방법은,

(1) 서열번호 1로 표시되는 야생형 kdtA 유전자 오픈 리딩 프레임 영역의 뉴클레오티드 서열을 변형하여 82번째 염기를 돌연변이시켜, 돌연변이된 kdtA 유전자 오픈 리딩 프레임 영역의 뉴클레오티드 서열을 획득하는 단계;

(2) 상기 돌연변이된 뉴클레오티드 서열과 플라스미드를 연결하여 재조합 벡터를 구축하는 단계; 및

(3) 상기 재조합 벡터를 숙주 균주에 도입하여 점돌연변이를 포함하는 상기 L-트레오닌 생산 재조합 균주를 획득하는 단계를 포함한다.

본 발명에 따른 구축 방법에서, 상기 단계 (1)은, 점돌연변이된 kdtA 유전자 코딩 영역의 구축, 즉 kdtA 유전자 코딩 서열에 따라 kdtA 유전자 코딩 영역 단편을 증폭하는 2쌍의 프라이머를 합성하고, PCR 부위 특이적 돌연변이 방법을 통해 야생형 kdtA 유전자 코딩 영역(서열번호 1)에 점돌연변이를 도입하여, 점돌연변이된 kdtA 유전자 코딩 영역 뉴클레오티드 서열(서열번호 2)을 획득하며, kdtA ^(G82A)로 기록하는 단계를 포함한다.

본 발명의 일 실시형태에서, 상기 단계 (1)에서 상기 프라이머는 하기와 같다.

P1: 5' CGGGATCCACCAGTGAACCGCCAACA 3'(서열번호 5)

P2: 5' TGCGCGGACGTAAGACTC 3'(서열번호 6)

P3: 5' GAGTCTTACGTCCGCGCA 3'(서열번호 7)

P4: 5' AAGGAAAAAAGCGGCCGCTTCCCGCACCTTTATTG 3'(서열번호 8)

본 발명의 일 실시형태에서, 상기 단계 (1)은, E.coli K12를 주형으로 하고, 각각 프라이머 P1/P2 및 P3/P4로 PCR 증폭을 수행하여, kdtA 유전자 코딩 영역을 포함하는 927 bp 및 695 bp 크기의 DNA 단편(kdtA Up 및 kdtA Down) 2개를 획득하는 단계; 및 상기 2개의 DNA 단편을 아가로스 겔 전기영동으로 분리 및 정제한 다음, 상기 2개의 DNA 단편을 주형으로 하고 P1 및 P4를 프라이머로 하며, 오버랩 PCR(Overlap PCR) 증폭을 통해 kdtA^G82A-Up-Down을 획득하는 단계를 포함한다.

본 발명의 일 실시형태에서, 상기 kdtA^G82A-Up-Down 뉴클레오티드 서열의 크기는 1622 bp이다.

본 발명의 일 실시형태에서, 상기 PCR 증폭은 94℃에서 30 s 동안 변성하고 52℃에서 30 s 동안 어닐링하며 72℃에서 30 s(30 주기) 동안 연장하는 방식으로 수행된다.

본 발명의 일 실시형태에서, 상기 오버랩 PCR 증폭은 94℃에서 30 s 동안 변성하고 52℃에서 30 s 동안 어닐링하며 72℃에서 60 s(30 주기) 동안 연장하는 방식으로 수행된다.

본 발명에 따른 구축 방법에서, 상기 단계 (2)는, 재조합 벡터의 구축, 즉 상기 kdtA ^(G82A)-Up-Down 단편을 아가로스 겔 전기영동으로 분리 및 정제한 다음, 이와 pKOⅤ 플라스미드를 각각 BamH I/Not I로 이중 절단하고, 절단된 kdtA ^(G82A)-Up-Down 단편과 pKOⅤ 플라스미드를 아가로스 겔 전기영동으로 분리 및 정제하고 연결하여, 재조합 벡터 pKOⅤ-kdtA ^(G82A)를 획득하는 단계를 포함한다.

본 발명에 따른 구축 방법에서, 상기 단계 (3)은, 재조합 균주의 구축, 즉 재조합 벡터 pKOⅤ-kdtA ^(G82A)를 숙주 균주로 형질전환하여 재조합 균주를 획득하는 단계를 포함한다.

본 발명의 일 실시형태에서, 상기 단계 (3)의 형질전환은 전기 형질전환 방법이고; 예시적으로, 상기 단계 (3)에서 재조합 벡터를 상기 숙주 균주로 형질전환하는 것이다.

본 발명에 따른 구축 방법에서, 또한 재조합 균주를 스크리닝하는 단계를 더 포함하고; 예시적으로, 클로람페니콜(Chloramphenicol) 배지를 사용하여 스크리닝한다.

본 발명은 또한 상기와 같은 구축 방법에 의해 획득된 재조합 균주를 제공한다.

본 발명은 또한 L-트레오닌의 제조 또는 L-트레오닌의 발효량 증가에서 상기 재조합 균주의 응용을 제공한다.

L-트레오닌의 제조에서 본 발명에 따른 재조합 균주의 응용은 상기 재조합 균주로 발효하여 L-트레오닌을 제조 및 획득하는 것을 포함한다.

제2 부분에서, 본 발명은 뉴클레오티드 서열을 제공하고, 상기 뉴클레오티드 서열은 서열번호 13으로 표시되는 spoT 유전자 코딩 서열 520번째 염기의 돌연변이에 의해 형성된 서열을 포함한다.

본 발명에 따르면, 상기 돌연변이는 서열번호 13의 520번째 염기가 구아닌(G)에서 티민(T)으로의 돌연변이이고; 구체적으로, 상기 돌연변이된 뉴클레오티드 서열은 서열번호 14로 표시된 바와 같다.

본 발명은 상기와 같은 뉴클레오티드 서열에 의해 코딩된 재조합 단백질을 제공한다.

본 발명에 따른 재조합 단백질은 서열번호 16으로 표시되는 아미노산 서열을 포함하고; 구체적으로, 상기 재조합 단백질은 서열번호 15로 표시되는 아미노산 서열의 174번째 글리신이 시스테인으로 치환된 것을 포함한다.

본 발명은 상기 뉴클레오티드 서열 또는 재조합 단백질을 포함하는 재조합 벡터를 제공한다.

본 발명은 또한 코딩 서열에 점돌연변이가 있는 spoT 유전자 코딩 뉴클레오티드 서열을 포함하는 재조합 균주를 제공하고, 예를 들어 서열번호 13으로 표시되는 spoT 유전자 코딩 뉴클레오티드 서열 520번째 염기에는 점돌연변이가 존재한다.

본 발명에 따른 재조합 균주에서, 상기 서열번호 13의 520번째 염기는 구아닌(G)에서 티민(T)으로 돌연변이된다.

본 발명의 일 실시형태로서, 상기 재조합 균주는 서열번호 14로 표시되는 뉴클레오티드 서열을 포함한다.

본 발명의 일 실시형태로서, 상기 재조합 균주는 서열번호 16으로 표시되는 아미노산 서열을 포함한다.

본 발명에 따른 재조합 균주는 상기 재조합 벡터를 숙주 균주에 도입하여 재조합으로 형성된 것이고; 상기 숙주 균주는 특별히 한정되지 않으며, 본 기술분야에서 공지된 spoT 유전자를 보유하는 L-트레오닌 생산 균주로부터 선택될 수 있고, 예를 들어 대장균으로부터 선택될 수 있다. 본 발명의 일 실시형태로서, 상기 숙주 균주는 E.coli K12(W3110) 균주, E.coli CGMCC 7.232 균주이다.

본 발명은 서열번호 13으로 표시되는 spoT 유전자 코딩 영역의 뉴클레오티드 서열을 변형하여 520번째 염기를 돌연변이시켜, 돌연변이 spoT 코딩 유전자를 포함하는 재조합 균주를 획득하는 단계를 포함하는 재조합 균주의 구축 방법을 제공한다.

본 발명에 따른 구축 방법에서, 상기 돌연변이는 서열번호 13의 520번째 염기가 구아닌(G)에서 티민(T)으로의 돌연변이인 것을 의미하고; 구체적으로, 돌연변이된 뉴클레오티드 서열은 서열번호 14로 표시된 바와 같다.

또한, 상기 구축 방법은,

(1) 서열번호 13으로 표시되는 야생형 spoT 유전자 오픈 리딩 프레임 영역의 뉴클레오티드 서열을 변형하여 520번째 염기를 돌연변이시켜, 돌연변이된 뉴클레오티드 서열을 획득하는 단계;

(3) 상기 재조합 벡터를 숙주 균주에 도입하여 점돌연변이를 포함하는 상기 재조합 균주를 획득하는 단계를 포함한다.

본 발명에 따른 구축 방법에서, 상기 단계 (1)은, 점돌연변이된 spoT 유전자 코딩 영역의 구축, 즉 spoT 유전자 코딩 서열에 따라 spoT 유전자 코딩 영역 단편을 증폭하는 2쌍의 프라이머를 합성하고, PCR 부위 특이적 돌연변이 방법을 통해 야생형 spoT 유전자 코딩 영역(서열번호 13)에 점돌연변이를 도입하여, 점돌연변이된 spoT 유전자 코딩 영역 뉴클레오티드 서열(서열번호 14)을 획득하며, spoT ^(G520T)로 기록하는 단계를 포함한다.

P1: 5' CGGGATCCGAACAGCAAGAGCAGGAAGC 3'(서열번호 17)

P2: 5' TGTGGTGGATACATAAACG 3'(서열번호 18)

P3: 5' GCACCGTTTATGTATCCACC 3'(서열번호 19)

P4: 5' AAGGAAAAAAGCGGCCGCACGACAAAGTTCAGCCAAGC 3'(서열번호 20)

본 발명의 일 실시형태에서, 상기 단계 (1)은, E.coli K12를 주형으로 하고, 각각 프라이머 P1 및 P2와 P3 및 P4로 PCR 증폭을 수행하여, 점돌연변이된 spoT 유전자 코딩 영역을 포함하는 620 bp 및 880 bp 크기의 DNA 단편(spoT ^(G520T)-Up 및 spoT ^(G520T)-Down 단편) 2개를 획득하는 단계; 및 상기 2개의 DNA 단편을 아가로스 겔 전기영동으로 분리 및 정제한 다음, 상기 2개의 DNA 단편을 주형으로 하고 P1 및 P4를 프라이머로 하며, 오버랩 PCR(Overlap PCR) 증폭을 통해 spoT ^(G520T)-Up-Down 단편을 획득하는 단계를 포함한다.

본 발명의 일 실시형태에서, 상기 spoT ^(G520T)-Up-Down 단편 뉴클레오티드 서열의 크기는 1500 bp이다.

본 발명에 따른 구축 방법에서, 상기 단계 (2)는, 재조합 벡터의 구축, 즉 상기 spoT ^(G520T)-Up-Down 단편을 아가로스 겔 전기영동으로 분리 및 정제한 다음, 이와 pKOⅤ 플라스미드를 각각 BamH I/Not I로 이중 절단하고, 절단된 spoT ^(G520T) -Up-Down 단편과 pKOⅤ 플라스미드를 아가로스 겔 전기영동으로 분리 및 정제하고 연결하여, 재조합 벡터 pKOV-spoT ^(G520T)를 획득하는 단계를 포함한다.

본 발명에 따른 구축 방법에서, 상기 단계 (3)은, 재조합 균주의 구축, 즉 재조합 벡터 pKOV-spoT ^(G520T)를 숙주 균주에 도입하여 재조합 균주를 획득하는 단계를 포함한다.

본 발명의 일 실시형태에서, 상기 단계 (3)의 도입은 전기 형질전환 방법이다.

본 발명에 따른 구축 방법에서, 또한 재조합 균주를 스크리닝하는 단계를 더 포함하고; 예시적으로, 클로람페니콜 함유 배지를 사용하여 스크리닝한다.

본 발명은 L-트레오닌의 제조에서 상기와 같은 재조합 균주의 응용을 제공한다.

L-트레오닌의 제조에서 본 발명에 따른 뉴클레오티드 서열, 재조합 단백질, 재조합 벡터, 재조합 균주의 응용은 상기 재조합 균주로 발효하여 L-트레오닌을 제조 및 획득하는 것을 포함한다.

제3 부분에서, 본 발명은 서열번호 23으로 표시되는 야생형 yebN 유전자 코딩 서열 74번째 염기의 돌연변이에 의해 형성된 뉴클레오티드 서열을 포함하는 뉴클레오티드 서열을 제공한다.

본 발명에 따르면, 상기 돌연변이는 서열번호 23의 74번째 염기가 구아닌(G)에서 아데닌(A)으로의 돌연변이이고; 구체적으로, 상기 뉴클레오티드 서열은 서열번호 24로 표시된 바와 같다. 상기 돌연변이는 해당 부위의 염기/뉴클레오티드의 변화를 의미하고, 상기 돌연변이 방법은 돌연변이 유발, PCR 부위 특이적 돌연변이 및/또는 상동재조합 방법 중 적어도 하나로부터 선택될 수 있다.

본 발명에 따른 재조합 단백질은 서열번호 26으로 표시되는 아미노산 서열을 포함하고; 구체적으로, 상기 재조합 단백질은 서열번호 25로 표시되는 아미노산 서열의 25번째 글리신이 아스파르트산으로 치환된 것을 포함한다.

본 발명은 또한 코딩 서열에 점돌연변이가 있는 yebN 유전자 코딩 뉴클레오티드 서열을 포함하는 재조합 균주를 제공하고, 예를 들어 서열번호 23의 74번째 염기에는 점돌연변이가 존재한다.

본 발명에 따른 재조합 균주에서, 상기 yebN 유전자 코딩 뉴클레오티드 서열은 서열번호 23의 74번째 염기가 구아닌(G)에서 아데닌(A)으로의 돌연변이를 포함한다.

본 발명의 일 실시형태로서, 상기 재조합 균주는 서열번호 24로 표시되는 뉴클레오티드 서열을 포함한다.

본 발명의 일 실시형태로서, 상기 재조합 균주는 서열번호 26으로 표시되는 아미노산 서열을 포함한다.

본 발명에 따른 재조합 균주는 상기 재조합 벡터를 숙주 균주에 도입하여 재조합으로 형성된 것이고; 상기 숙주 균주는 특별히 한정되지 않으며, 본 기술분야에서 공지된 yebN 유전자를 보유하는 L-트레오닌 생산 균주로부터 선택될 수 있고, 예를 들어 대장균으로부터 선택될 수 있다. 본 발명의 일 실시형태로서, 상기 숙주 균주는 E.coli K12, 이의 유도체 균주 E.coli K12(W3110) 균주 또는 E.coli CGMCC 7.232 균주이다.

본 발명은 서열번호 23으로 표시되는 야생형 yebN 유전자 코딩 영역의 뉴클레오티드 서열을 변형하여 74번째 염기를 돌연변이시켜, 돌연변이 yebN 코딩 유전자를 포함하는 재조합 균주를 획득하는 단계를 포함하는 재조합 균주의 구축 방법을 제공한다.

본 발명에 따른 구축 방법에서, 상기 돌연변이는 서열번호 23의 74번째 염기가 구아닌(G)에서 아데닌(A)으로의 돌연변이인 것을 의미하고; 구체적으로, 상기 돌연변이된 뉴클레오티드 서열은 서열번호 14로 표시된 바와 같다.

또한, 상기 구축 방법은,

(1) 서열번호 23으로 표시되는 야생형 yebN 유전자 오픈 리딩 프레임 영역의 뉴클레오티드 서열을 변형하여 74번째 염기를 돌연변이시켜, 돌연변이된 yebN 유전자 오픈 리딩 프레임 영역의 뉴클레오티드 서열을 획득하는 단계;

본 발명에 따른 구축 방법에서, 상기 단계 (1)은, 점돌연변이된 yebN 유전자 코딩 영역의 구축, 즉 yebN 유전자 코딩 서열에 따라 yebN 유전자 코딩 영역 단편을 증폭하는 2쌍의 프라이머를 합성하고, PCR 부위 특이적 돌연변이 방법을 통해 야생형 yebN 유전자 코딩 영역(서열번호 23)에 점돌연변이를 도입하여, 점돌연변이된 yebN 유전자 코딩 영역 뉴클레오티드 서열(서열번호 24)을 획득하며, yebN ^(G74A)으로 기록하는 단계를 포함한다.

P1: 5' CGGGATCCCTTCGCCAATGTCTGGATTG 3'(서열번호 27)

P2: 5' ATGGAGGGTGGCATCTTTAC 3'(서열번호 28)

P3: 5' TGCATCAATCGGTAAAGATG 3'(서열번호 29)

P4: 5' AAGGAAAAAAGCGGCCGCCAACTCCGCACTCTGCTGTA 3'(서열번호 30)

본 발명의 일 실시형태에서, 상기 단계 (1)은, E.coli K12를 주형으로 하고, 각각 프라이머 P1 및 P2와 P3 및 P4로 PCR 증폭을 수행하여, 점돌연변이된 yebN 유전자 코딩 영역을 포함하는 690 bp 및 700 bp 크기의 DNA 단편(yebN ^(G74A)-Up 및 yebN ^(G74A)-Down 단편) 2개를 획득하는 단계; 및 상기 2개의 DNA 단편을 아가로스 겔 전기영동으로 분리 및 정제한 다음, 상기 2개의 DNA 단편을 주형으로 하고 P1 및 P4를 프라이머로 하며, 오버랩 PCR(Overlap PCR) 증폭을 통해 yebN ^(G74A)-Up-Down 단편을 획득하는 단계를 포함한다.

본 발명의 일 실시형태에서, 상기 yebN ^(G74A)-Up-Down 단편 뉴클레오티드 서열의 크기는 1340 bp이다.

본 발명에 따른 구축 방법에서, 상기 단계 (2)는, 재조합 벡터의 구축, 즉 상기 yebN ^(G74A)-Up-Down 단편을 아가로스 겔 전기영동으로 분리 및 정제한 다음, 이와 pKOⅤ 플라스미드를 각각 BamH I/Not I로 이중 절단하고, 절단된 yebN ^(G74A) -Up-Down 단편과 pKOⅤ 플라스미드를 아가로스 겔 전기영동으로 분리 및 정제하고 연결하여, 재조합 벡터 pKOV-yebN ^(G74A)을 획득하는 단계를 포함한다.

본 발명에 따른 구축 방법에서, 상기 단계 (3)은, 재조합 균주의 구축, 즉 재조합 벡터 pKOV-yebN ^(G74A)을 숙주 균주에 도입하여 재조합 균주를 획득하는 단계를 포함한다.

본 발명은 L-트레오닌의 제조에서 상기와 같은 뉴클레오티드 서열, 재조합 단백질, 재조합 벡터, 재조합 균주의 응용을 제공한다.

이하, 본 발명의 실시예에 대한 설명을 통해 본 발명의 상술한 특징 및 장점 또는 다른 특징 및 장점을 보다 더 상세하게 해석하고 설명할 것이다. 이해해야 할 것은, 하기 실시예는 본 발명의 기술적 해결수단을 예시적으로 설명하기 위한 것이며, 청구범위 및 등가물에 의해 한정되는 본 발명의 보호범위를 한정하기 위한 것이 아니다.

다른 설명이 없는 한, 본문 중의 재료 및 시약은 모두 시중에 판매되고 있는 제품이거나 또는 당업자가 선행 기술에 따라 제조될 수 있는 것이다.

실시예 1

(1) kdtA 유전자 코딩 영역의 부위 특이적 돌연변이(G82A) 플라스미드 pKOⅤ-kdtA ^(G82A)의 구축

(야생형 코딩 단백질에 대응되는 아미노산 서열에서 서열번호 3의 28번째 알라닌은 트레오닌으로 치환(A28T), 서열번호 4로 표시된 바와 같음)

3-데옥시 D-만노스-술팜산(3-deoxy D-mannose-sulfamic acid) 전이효소는 kdtA 유전자에 의해 코딩되고, E.coli K12 균주 및 이의 유도체 균주(예를 들면, MG1655 등)에서 야생형 kdtA 유전자 ORF 서열은 Genbank 수탁 번호 CP032667.1 중 서열 73556-74833으로 표시된 바와 같다. 상기 서열에 따라 kdtA를 증폭하는 2쌍의 프라이머를 설계 및 합성하고, 출발 균주에서 kdtA 유전자 코딩 영역 서열 82번째 염기 G를 A로 변경하는 벡터를 구축하였다. 프라이머의 설계는 하기와 같다(상하이 invitrogen에서 합성).

P1: 5' CGGGATCCACCAGTGAACCGCCAACA 3'(서열번호 5)

P2: 5' TGCGCGGACGTAAGACTC 3'(서열번호 6)

P3: 5' GAGTCTTACGTCCGCGCA 3'(서열번호 7)

P4: 5' AAGGAAAAAAGCGGCCGCTTCCCGCACCTTTATTG 3'(서열번호 8)

구축 방법은 다음과 같다. 야생형 균주 E.coli K12 게놈을 주형으로 하고, 각각 프라이머 P1 및 P2와 P3 및 P4로 PCR 증폭을 수행하여, 점돌연변이를 포함하는 927 bp 및 695 bp 길이의 DNA 단편(kdtA ^(G82A)-Up 및 kdtA ^(G82A)-Down 단편) 2개를 획득하였다. PCR은 94℃에서 30 s 동안 변성하고 52℃에서 30 s 동안 어닐링하며 72℃에서 30 s(30 주기) 동안 연장하는 방식으로 수행되었다. 상기 2개의 DNA 단편을 아가로스 겔 전기영동으로 분리 및 정제한 다음, 정제된 2개의 DNA 단편을 주형으로 하고 P1 및 P4를 프라이머로 하며, Overlap PCR을 통해 약 1622 bp 길이의 단편(kdtA ^(G82A)-Up-Down 단편)을 증폭하였다. Overlap PCR은 94℃에서 30 s 동안 변성하고 52℃에서 30 s 동안 어닐링하며 72℃에서 60 s(30 주기) 동안 연장하는 방식으로 수행되었다. 상기 kdtA ^(G82A)-Up-Down 단편을 아가로스 겔 전기영동으로 분리 및 정제한 다음, 이와 pKOⅤ 플라스미드(Addgene에서 구입)를 각각 BamH I/Not I로 이중 절단하고, 절단된 kdtA ^(G82A)-Up-Down 단편과 pKOⅤ 플라스미드를 아가로스 겔 전기영동으로 분리 및 정제하고 연결하여, 벡터 pKOⅤ-kdtA ^(G82A)를 획득하였다. 벡터 pKOⅤ-kdtA ^(G82A)를 시퀀싱 회사에 보내어 시퀀싱 및 동정을 진행하였고, 시퀀싱 결과는 서열번호 11과 같으며, 정확한 점돌연변이(kdtA ^(G82A))를 포함하는 벡터 pKOⅤ-kdtA ^(G82A)를 비축하였다.

(2) 점돌연변이 유전자 kdtA ^(G82A)를 포함하는 조작된 균주의 구축

야생형 대장균 균주 E.coli K12(W3110) 및 L-트레오닌 생산이 높은 균주 E.coli CGMCC 7.232(China General Microbiological Culture Collection Center에 수탁)는 모두 염색체에 야생형 kdtA 유전자를 보유한다. 구축된 플라스미드 pKOⅤ-kdtA ^(G82A)를 E.coli K12(W3110) 및 E.coli CGMCC 7.232로 각각 형질전환시키고, 대립유전자의 치환을 통해 이 두 균주의 염색체에 있는 kdtA 유전자 서열의 82번째 염기 G를 A로 변경하였다. 구체적인 과정은 다음과 같다. 플라스미드 pKOⅤ-kdtA ^(G82A)를 전기천공법으로 숙주균의 컴피턴트 세포로 형질전환시킨 후 0.5 mL의 SOC 액체 배지를 첨가하고; 30℃, 100 rpm의 진탕기에서 2 h 동안 소생시키며; 100 μL의 배양액을 취하여 클로람페니콜 함량이 34 mg/mL인 LB 고체 배지에 코팅하고 30℃에서 18 h 동안 배양하며; 성장한 단클론 집락을 선택하여 10 mL의 LB 액체 배지에 접종하고 37℃, 200 rpm에서 8 h 동안 배양하며; 100 μL의 배양액을 취하여 클로람페니콜 함량이 34 mg/mL인 LB 고체 배지에 코팅하고 42℃에서 12 h 동안 배양하며; 1 ~ 5개의 단일 집락을 선택하여 1 mL의 LB 액체 배지에 접종하고 37℃, 200 rpm에서 4 h 동안 배양하며; 100 μL의 배양액을 취하여 10% 자당 함유 LB 고체 배지에 코팅하고 30℃에서 24 h 동안 배양하며; 단클론을 선택하고 LB 고체 배지 및 클로람페니콜 함량이 34 mg/mL인 LB 고체 배지에 일대일로 대응되게 스트리킹하며; LB 고체 배지에서 성장시키고, 동시에 클로람페니콜 함량이 34 mg/mL인 LB 고체 배지에서 성장할 수 없는 해당 균주를 PCR 증폭 및 동정하였다. PCR 증폭은 하기와 같은 프라이머(상하이 invitrogen에서 합성)를 사용하였다.

P5: 5' CTTCCCGAAAGCCGATTG 3'(서열번호 9)

P6: 5' ACAAAATATACTTTAATC 3'(서열번호 10)

상기 PCR 증폭 산물에 대해 SSCP(외가닥구조다형성, Single-Strand Conformation Polymorphism) 전기영동을 수행하고, 플라스미드 pKOⅤ-kdtA ^(G82A) 증폭 단편을 양성 대조군으로, 야생형 대장균 증폭 단편을 음성 대조군으로, 물을 블랭크 대조군으로 사용하였다. SSCP 전기영동에서 길이가 동일하나 서열 배열이 상이한 단쇄 올리고뉴클레오티드 사슬은 아이스 배스에서 형성된 공간 구조가 상이하고, 전기영동시 이동 속도도 차이가 있다. 따라서, 단편 전기영동 위치는 음성 대조군 단편 위치와 일치하지 않고, 양성 대조군 단편 위치와 일치한 균주는 대립유전자 대체가 성공적인 균주이다. 대립유전자 대체가 성공적인 균주를 주형으로 하고, 프라이머 P5 및 P6을 사용하여 PCR로 다시 타깃 단편을 증폭시키고 타깃 단편을 pMD19-T 벡터에 연결시켜 시퀀싱하였다. 시퀀싱 결과의 서열 비교를 통해 kdtA 유전자 코딩 영역 서열 82번째 염기 G가 A로 변경된 재조합체는 변형이 성공적인 균주이고, 시퀀싱 결과는 서열번호 12와 같다. E.coli K12(W3110)에서 유래된 재조합체를 YPThr07로 명명하고, E.coli CGMCC 7.232에서 유래된 재조합체를 YPThr08로 명명하였다.

(3) 트레오닌 발효 실험

E.coli K12(W3110) 균주, E.coli CGMCC 7.232 균주 및 돌연변이 균주 YPThr07, YPThr08을 25 mL의 표 1에 따른 액체 배지에 각각 접종하고 37℃, 200 rpm에서 12 h 동안 배양하였다. 그 다음, 각 균주의 배양물을 1 mL 취하여 25 mL의 표 1에 따른 액체 배지에 각각 접종하고 37℃, 200 rpm에서 36 h 동안 발효 배양하였다. HPLC로 L-트레오닌의 함량을 측정하고, 각 균주를 3개의 평행선으로 만들어 평균값을 계산하며, 검출 결과는 표 2와 같다.

[표 1]

[표 2]

표 2의 결과에 나타낸 바와 같이, L-트레오닌의 생산이 높거나 낮은 원시 균주에 관계없이, kdtA 유전자의 아미노산 서열 28번째 알라닌이 트레오닌으로 치환된 후 모두 L-트레오닌 수율의 향상에 도움이 된다.

실시예 2

(1) spoT 유전자 코딩 영역 부위 특이적 돌연변이(G520T)(코딩 단백질에 대응되는 아미노산 서열에서 서열번호 15의 174번째 글리신이 시스테인으로 치환(G174C), 서열번호 16)를 위한 플라스미드 pKOV-spoT ^(G520T)의 구축

SPOT 효소는 spoT 유전자에 의해 코딩되고, E.coli K12 균주 및 이의 유도체 균주(예를 들면, W3110 등)에서 야생형 spoT 유전자 ORF 서열은 Genbank 수탁 번호 AP009048.1 중 서열 3815907-3818015로 표시된 바와 같다. 상기 서열에 따라 spoT를 증폭하는 2쌍의 프라이머를 설계 및 합성하고, 출발 균주에서 spoT 유전자 코딩 영역 서열 520번째 염기 G를 T로 변경하는 벡터를 구축하였다. 프라이머의 설계는 하기와 같다(상하이 invitrogen에서 합성).

P1: 5' CGGGATCCGAACAGCAAGAGCAGGAAGC 3'(밑줄 친 부분은 제한효소인식부위 BamH I임)(서열번호 17)

P2: 5' TGTGGTGGATACATAAACG 3'(서열번호 18)

P3: 5' GCACCGTTTATGTATCCACC 3'(서열번호 19)

P4: 5' AAGGAAAAAAGCGGCCGCACGACAAAGTTCAGCCAAGC 3'(밑줄 친 부분은 제한효소인식부위 Not I임)(서열번호 20).

구축 방법은 다음과 같다. 야생형 균주 E.coli K12 게놈을 주형으로 하고, 각각 프라이머 P1 및 P2와 P3 및 P4로 PCR 증폭을 수행하여, 점돌연변이를 포함하는 620 bp 및 880 bp 길이의 DNA 단편(spoT ^(G520T)-Up 및 spoT ^(G520T)-Down 단편) 2개를 획득하였다. PCR 시스템: 10×Ex Taq 버퍼 5 μL, dNTP 혼합물(각 2.5 mM) 4 μL, Mg²⁺(25 mM) 4 μL, 프라이머(10 pM) 각 2 μL, Ex Taq(5 U/μL) 0.25 μL, 전체 부피 50 μL; 상기 PCR은 94℃에서 30 s 동안 변성하고 52℃에서 30 s 동안 어닐링하며 72℃에서 30 s(30 주기) 동안 연장하는 방식으로 수행되었다. 상기 2개의 DNA 단편을 아가로스 겔 전기영동으로 분리 및 정제한 다음, 정제된 2개의 DNA 단편을 주형으로 하고 P1 및 P4를 프라이머로 하며, Overlap PCR을 통해 약 1500 bp 길이의 단편(spoT ^(G520T)-Up-Down 단편)을 증폭하였다. PCR 시스템: 10×Ex Taq 버퍼 5 μL, dNTP 혼합물(각 2.5 mM) 4 μL, Mg²(25 mM) 4 μL, 프라이머(10 pM) 각 2 μL, Ex Taq(5 U/μL) 0.25 μL, 전체 부피 50 μL; 상기 Overlap PCR은 94℃에서 30 s 동안 변성하고 52℃에서 30 s 동안 어닐링하며 72℃에서 60 s(30 주기) 동안 연장하는 방식으로 수행되었다. 상기 spoT ^(G520T)-Up-Down 단편을 아가로스 겔 전기영동으로 분리 및 정제한 다음, 이와 pKOⅤ 플라스미드(Addgene에서 구입)를 각각 BamH I/Not I로 이중 절단하고, 절단된 spoT ^(G520T)-Up-Down 단편과 pKOⅤ 플라스미드를 아가로스 겔 전기영동으로 분리 및 정제하고 DNA 리가아제를 통해 연결하여, 벡터 pKOV-spoT ^(G520T)를 획득하였다. 벡터 pKOV-spoT ^(G520T)를 시퀀싱 회사에 보내어 시퀀싱 및 동정을 진행하였고, 정확한 점돌연변이(spoT ^(G520T))를 포함하는 벡터 pKOV-spoT ^(G520T)를 비축하였다.

(2) 점돌연변이 유전자 spoT ^(G520T)를 포함하는 조작된 균주의 구축

야생형 대장균 균주 E.coli K12(W3110) 및 L-트레오닌 생산이 높은 균주 E.coli CGMCC 7.232(China General Microbiological Culture Collection Center에 수탁)는 모두 염색체에 야생형 spoT 유전자를 보유한다. 구축된 플라스미드 pKOV-spoT ^(G520T)를 E.coli K12(W3110) 및 E.coli CGMCC 7.232로 각각 형질전환시키고, 대립유전자의 치환을 통해 이 두 균주의 염색체에 있는 spoT 유전자 서열의 520번째 염기 G를 T로 변경하였다. 구체적인 과정은 다음과 같다. 플라스미드 pKOV-spoT ^(G520T)를 전기천공법으로 숙주균의 컴피턴트 세포로 형질전환시킨 후 0.5 mL의 SOC 액체 배지를 첨가하고; 30℃, 100 rpm의 진탕기에서 2 h 동안 소생시키며; 100 μL의 배양액을 취하여 클로람페니콜 함량이 34 μg/mL인 LB 고체 배지에 코팅하고 30℃에서 18 h 동안 배양하며; 성장한 단클론 집락을 선택하여 10 mL의 LB 액체 배지에 접종하고 37℃, 200 rpm에서 8 h 동안 배양하며; 100 μL의 배양액을 취하여 클로람페니콜 함량이 34 μg/mL인 LB 고체 배지에 코팅하고 42℃에서 12 h 동안 배양하며; 1 ~ 5개의 단일 집락을 선택하여 1 mL의 LB 액체 배지에 접종하고 37℃, 200 rpm에서 4 h 동안 배양하며; 100 μL의 배양액을 취하여 10% 자당 함유 LB 고체 배지에 코팅하고 30℃에서 24 h 동안 배양하며; 단클론을 선택하고 LB 고체 배지 및 클로람페니콜 함량이 34 μg/mL인 LB 고체 배지에 일대일로 대응되게 스트리킹하며; LB 고체 배지에서 성장시키고, 동시에 클로람페니콜 함량이 34 μg/mL인 LB 고체 배지에서 성장할 수 없는 해당 균주를 PCR 증폭 및 동정하였다. PCR 증폭은 하기와 같은 프라이머(상하이 invitrogen에서 합성)를 사용하였다.

P5: 5' ctttcgcaagatgattatgg 3'(서열번호 21)

P6: 5' cacggtattcccgcttcctg 3'(서열번호 22)

상기 PCR 시스템: 10×Ex Taq 버퍼 5 μL, dNTP 혼합물(각 2.5 mM) 4 μL, Mg²⁺(25 mM) 4 μL, 프라이머(10 pM) 각 2 μL, Ex Taq(5 U/μL) 0.25 μL, 전체 부피 50 μL; 상기 PCR 증폭은 다음과 방식으로 수행되었다. 94℃에서 5 min 동안 초기 변성하고, (94℃에서 30 s 동안 변성, 52℃에서 30 s 동안 어닐링, 72℃에서 90 s 동안 연장, 30 주기), 72℃에서 10 min 동안 과도 연장하며, PCR 증폭 산물에 대해 SSCP(외가닥구조다형성, Single-Strand Conformation Polymorphism) 전기영동을 수행하고, 플라스미드 pKOV-spoT ^(G520T) 증폭 단편을 양성 대조군으로, 야생형 대장균 증폭 단편을 음성 대조군으로, 물을 블랭크 대조군으로 사용하였다. SSCP 전기영동에서 길이가 동일하나 서열 배열이 상이한 단쇄 올리고뉴클레오티드 사슬은 아이스 배스에서 형성된 공간 구조가 상이하고, 전기영동시 이동 속도도 차이가 있다. 따라서, 단편 전기영동 위치는 음성 대조군 단편 위치와 일치하지 않고, 양성 대조군 단편 위치와 일치한 균주는 대립유전자 대체가 성공적인 균주이다. 대립유전자 대체가 성공적인 균주를 주형으로 하고, 프라이머 P5 및 P6을 사용하여 PCR로 다시 타깃 단편을 증폭시키고 타깃 단편을 pMD19-T 벡터에 연결시켜 시퀀싱하였다. 시퀀싱 결과의 서열 비교를 통해 spoT 유전자 코딩 영역 서열 520번째 염기 G가 T로 변경된 재조합체는 변형이 성공적인 균주이다. E.coli K12(W3110)에서 유래된 재조합체를 YPThr03으로 명명하고, E.coli CGMCC 7.232에서 유래된 재조합체를 YPThr04로 명명하였다.

(3) 트레오닌 발효 실험

E.coli K12(W3110) 균주, E.coli CGMCC 7.232 균주 및 돌연변이 균주 YPThr03, YPThr04를 25 mL의 표 1에 따른 액체 배지에 각각 접종하고 37℃, 200 rpm에서 12 h 동안 배양하였다. 그 다음, 각 균주의 배양물을 1 mL 취하여 25 mL의 표 1에 따른 액체 배지에 각각 접종하고 37℃, 200 rpm에서 36 h 동안 발효 배양하였다. HPLC로 L-트레오닌의 함량을 측정하고, 각 균주를 3개의 평행선으로 만들어 평균값을 계산하며, 검출 결과는 표 2와 같다.

[표 1]

[표 2]

트레오닌 발효 실험 결과

표 2의 결과에 나타낸 바와 같이, L-트레오닌의 생산이 높거나 낮은 원시 균주에 관계없이, spoT 유전자의 아미노산 서열 174번째 글리신이 시스테인으로 치환된 후 모두 L-트레오닌 수율의 향상에 도움이 된다.

실시예 3

(1) yebN 유전자 코딩 영역 부위 특이적 돌연변이(G74A)(코딩 단백질에 대응되는 아미노산 서열에서 서열번호 25의 25번째 글리신이 아스파르트산으로 치환(G25D), 치환 후 서열번호 26으로 표시된 바와 같음)를 위한 플라스미드 pKOV-yebN ^(G74A)의 구축

YEBN 효소는 yebN 유전자에 의해 코딩되고, E.coli K12 균주 및 이의 유도체 균주(예를 들면, W3110 등)에서 야생형 yebN 유전자 ORF 서열은 Genbank 수탁 번호 AP009048.1 중 서열 1907402-1907968로 표시된 바와 같다. 상기 서열에 따라 yebN을 증폭하는 2쌍의 프라이머를 설계 및 합성하고, 출발 균주에서 yebN 유전자 코딩 영역 서열 74번째 염기 G를 A로 변경하는 벡터를 구축하였다. 프라이머의 설계는 하기와 같다(상하이 invitrogen에서 합성).

P1: 5' CGGGATCCCTTCGCCAATGTCTGGATTG 3'(밑줄 친 부분은 제한효소인식부위 BamH I임)(서열번호 27)

P2: 5' ATGGAGGGTGGCATCTTTAC 3'(서열번호 28)

P3: 5' TGCATCAATCGGTAAAGATG　 3'(서열번호 29)

P4: 5' AAGGAAAAAAGCGGCCGCCAACTCCGCACTCTGCTGTA 3'(밑줄 친 부분은 제한효소인식부위 Not I임)(서열번호 30)

구축 방법은 다음과 같다. 야생형 균주 E.coli K12 게놈을 주형으로 하고, 각각 프라이머 P1 및 P2와 P3 및 P4로 PCR 증폭을 수행하여, 점돌연변이를 포함하는 690 bp 및 700 bp 길이의 DNA 단편(yebN ^(G74A)-Up 및 yebN ^(G74A)-Down 단편) 2개를 획득하였다. PCR 시스템: 10×Ex Taq 버퍼 5 μL, dNTP 혼합물(각 2.5 mM) 4 μL, Mg²⁺(25 mM) 4 μL, 프라이머(10 pM) 각 2 μL, Ex Taq(5 U/μL) 0.25 μL, 전체 부피 50 μL; 상기 PCR은 94℃에서 30 s 동안 변성하고 52℃에서 30 s 동안 어닐링하며 72℃에서 30 s(30 주기) 동안 연장하는 방식으로 수행되었다. 상기 2개의 DNA 단편을 아가로스 겔 전기영동으로 분리 및 정제한 다음, 정제된 2개의 DNA 단편을 주형으로 하고 P1 및 P4를 프라이머로 하며, Overlap PCR을 통해 약 1340 bp 길이의 단편(yebN ^(G74A)-Up-Down 단편)을 증폭하였다.

PCR 시스템: 10×Ex Taq 버퍼 5 μL, dNTP 혼합물(각 2.5 mM) 4 μL, Mg²(25 mM) 4 μL, 프라이머(10 pM) 각 2 μL, Ex Taq(5 U/μL) 0.25 μL, 전체 부피 50 μL; 상기 Overlap PCR은 94℃에서 30 s 동안 변성하고 52℃에서 30 s 동안 어닐링하며 72℃에서 60 s(30 주기) 동안 연장하는 방식으로 수행되었다.

상기 yebN ^(G74A)-Up-Down 단편을 아가로스 겔 전기영동으로 분리 및 정제한 다음, 이와 pKOⅤ 플라스미드(Addgene에서 구입)를 각각 BamH I/Not I로 이중 절단하고, 절단된 yebN ^(G74A)-Up-Down 단편과 pKOⅤ 플라스미드를 아가로스 겔 전기영동으로 분리 및 정제하고 연결하여, 벡터 pKOV-yebN ^(G74A)을 획득하였다. 벡터 pKOV-yebN ^(G74A)을 시퀀싱 회사에 보내어 시퀀싱 및 동정을 진행하였고, 정확한 점돌연변이(yebN ^(G74A))를 포함하는 벡터 pKOV-yebN ^(G74A)을 비축하였다.

(2) 점돌연변이 유전자 yebN ^(G74A)를 포함하는 조작된 균주의 구축

야생형 대장균 균주 E.coli K12(W3110) 및 L-트레오닌 생산이 높은 균주 E.coli CGMCC 7.232(China General Microbiological Culture Collection Center에 수탁)는 모두 염색체에 야생형 yebN 유전자를 보유한다. 구축된 플라스미드 pKOV-yebN ^(G74A)을 E.coli K12(W3110) 및 E.coli CGMCC 7.232로 각각 형질전환시키고, 대립유전자의 치환을 통해 이 두 균주의 염색체에 있는 yebN 유전자 서열의 74번째 염기 G를 A로 변경하였다.

구체적인 과정은 다음과 같다. 플라스미드 pKOV-yebN ^(G74A)을 전기천공법으로 숙주균의 컴피턴트 세포로 형질전환시킨 후 0.5 mL의 SOC 액체 배지를 첨가하고; 30℃, 100 rpm의 진탕기에서 2 h 동안 소생시키며; 100 μL의 배양액을 취하여 클로람페니콜 함량이 34 μg/mL인 LB 고체 배지에 코팅하고 30℃에서 18 h 동안 배양하며; 성장한 단클론 집락을 선택하여 10 mL의 LB 액체 배지에 접종하고 37℃, 200 rpm에서 8 h 동안 배양하며; 100 μL의 배양액을 취하여 클로람페니콜 함량이 34 μg/mL인 LB 고체 배지에 코팅하고 42℃에서 12 h 동안 배양하며; 1 ~ 5개의 단일 집락을 선택하여 1 mL의 LB 액체 배지에 접종하고 37℃, 200 rpm에서 4 h 동안 배양하며; 100 μL의 배양액을 취하여 10% 자당 함유 LB 고체 배지에 코팅하고 30℃에서 24 h 동안 배양하며; 단클론을 선택하고 LB 고체 배지 및 클로람페니콜 함량이 34 μg/mL인 LB 고체 배지에 일대일로 대응되게 스트리킹하며; LB 고체 배지에서 성장시키고, 동시에 클로람페니콜 함량이 34 μg/mL인 LB 고체 배지에서 성장할 수 없는 해당 균주를 PCR 증폭 및 동정하였다. PCR 증폭은 하기와 같은 프라이머(상하이 invitrogen에서 합성)를 사용하였다.

P5: 5' CCATCACGGCTTGTTGTTC 3'(서열번호 31)

P6: 5' ACGAAAACCCTCAATAATC 3'(서열번호 32)

상기 PCR 시스템: 10×Ex Taq 버퍼 5 μL, dNTP 혼합물(각 2.5 mM) 4 μL, Mg²⁺(25 mM) 4 μL, 프라이머(10 pM) 각 2 μL, Ex Taq(5 U/μL) 0.25 μL, 전체 부피 50 μL; 상기 PCR 증폭은 다음과 방식으로 수행되었다. 94℃에서 5 min 동안 초기 변성하고, (94℃에서 30 s 동안 변성, 52℃에서 30 s 동안 어닐링, 72℃에서 90 s 동안 연장, 30 주기), 72℃에서 10 min 동안 과도 연장하며, PCR 증폭 산물에 대해 SSCP(외가닥구조다형성, Single-Strand Conformation Polymorphism) 전기영동을 수행하고, 플라스미드 pKOV-yebN ^(G74A) 증폭 단편을 양성 대조군으로, 야생형 대장균 증폭 단편을 음성 대조군으로, 물을 블랭크 대조군으로 사용하였다. SSCP 전기영동에서 길이가 동일하나 서열 배열이 상이한 단쇄 올리고뉴클레오티드 사슬은 아이스 배스에서 형성된 공간 구조가 상이하고, 전기영동시 이동 속도도 차이가 있다. 따라서, 단편 전기영동 위치는 음성 대조군 단편 위치와 일치하지 않고, 양성 대조군 단편 위치와 일치한 균주는 대립유전자 대체가 성공적인 균주이다. 대립유전자 대체가 성공적인 균주를 주형으로 하고, 프라이머 P5 및 P6을 사용하여 PCR로 다시 타깃 단편을 증폭시키고 타깃 단편을 pMD19-T 벡터에 연결시켜 시퀀싱하였다. 시퀀싱 결과의 서열 비교를 통해 yebN 유전자 코딩 영역 서열 74번째 염기 G가 T로 변경된 재조합체는 변형이 성공적인 균주이다. E.coli K12(W3110)에서 유래된 재조합체를 YPThr05로 명명하고, E.coli CGMCC 7.232에서 유래된 재조합체를 YPThr06으로 명명하였다.

(3) 트레오닌 발효 실험

E.coli K12(W3110) 균주, E.coli CGMCC 7.232 균주 및 돌연변이 균주 YPThr05, YPThr06을 25 mL의 표 1에 따른 액체 배지에 각각 접종하고 37℃, 200 rpm에서 12 h 동안 배양하였다. 그 다음, 각 균주의 배양물을 1 mL 취하여 25 mL의 표 1에 따른 액체 배지에 각각 접종하고 37℃, 200 rpm에서 36 h 동안 발효 배양하였다. HPLC로 L-트레오닌의 함량을 측정하고, 각 균주를 3개의 평행선으로 만들어 평균값을 계산하며, 검출 결과는 표 2와 같다.

[표 1]

배지 배합

[표 2]

트레오닌 발효 실험 결과

표 2의 결과에 나타낸 바와 같이, L-트레오닌의 생산이 높거나 낮은 원시 균주에 관계없이, yebN 유전자의 아미노산 서열 25번째 글리신이 아스파르트산으로 치환된 후 모두 L-트레오닌 수율의 향상에 도움이 된다.

이상, 본 발명의 실시형태에 대해 설명하였다. 그러나, 본 발명은 상기 실시형태에 한정되지 않는다. 본 발명의 사상과 원리 내에 이루어진 그 어떠한 수정, 등가 대체, 개선 등도 모두 본 발명의 보호범위에 포함되어야 한다.

<110> HEILONGJIANG EPPEN BIOTECH CO., LTD. <120> ESCHERICHIA COLI-BASED RECOMBINANT STRAIN, CONSTRUCTION METHOD THEREFOR AND USE THEREOF <130> CPWO20110939 <160> 32 <170> SIPOSequenceListing 1.0 <210> 1 <211> 1278 <212> DNA <213> Escherichia coli <400> 1 atgctcgaat tgctttacac cgcccttctc taccttattc agccgctgat ctggatacgg 60 ctctgggtgc gcggacgtaa ggctccggcc tatcgaaaac gctggggtga acgttacggt 120 ttttaccgcc atccgctaaa accaggcggc attatgctgc actccgtctc cgtcggtgaa 180 actctggcgg caatcccgtt ggtgcgcgcg ctgcgtcatc gttatcctga tttaccgatt 240 accgtaacaa ccatgacgcc aaccggttcg gagcgcgtac aatcggcttt cgggaaggat 300 gttcagcacg tttatctgcc gtatgatctg cccgatgcac tcaaccgttt cctgaataaa 360 gtcgacccta aactggtgtt gattatggaa accgaactat ggcctaacct gattgcggcg 420 ctacataaac gtaaaattcc gctggtgatc gctaacgcgc gactctctgc ccgctcggcc 480 gcaggttatg ccaaactggg taaattcgtc cgtcgcttgc tgcgtcgtat tacgctgatt 540 gctgcgcaaa atgaagaaga tggtgcacgt tttgtggcgc tgggcgcaaa aaataatcag 600 gtgaccgtta ccggtagcct gaaattcgat atttctgtaa cgccgcagtt ggctgctaaa 660 gccgtgacgc tgcgccgcca gtgggcacca caccgcccgg tatggattgc caccagcact 720 cacgaaggcg aagagagtgt ggtgatcgcc gcacatcagg cattgttaca gcaattcccg 780 aatttattgc tcatcctggt accccgtcat ccggaacgct tcccggatgc gattaacctt 840 gtccgccagg ctggactaag ctatatcaca cgctcttcag gggaagtccc ctccaccagc 900 acgcaggttg tggttggcga tacgatgggc gagttgatgt tactgtatgg cattgccgat 960 ctcgcctttg ttggcggttc actggttgaa cgtggtgggc ataatccgct ggaagctgcc 1020 gcacacgcta ttccggtatt gatggggccg catactttta actttaaaga catttgcgcg 1080 cggctggagc aggcaagcgg gctgattacc gttaccgatg ccactacgct tgcaaaagag 1140 gtttcctctt tactcaccga cgccgattac cgtagtttct atggccgtca tgccgttgaa 1200 gtactgtatc aaaaccaggg cgcgctacag cgtctgcttc aactgctgga accttacctg 1260 ccaccgaaaa cgcattga 1278 <210> 2 <211> 1278 <212> DNA <213> Artificial Sequence <220> <223> Artificial Sequence <400> 2 atgctcgaat tgctttacac cgcccttctc taccttattc agccgctgat ctggatacgg 60 ctctgggtgc gcggacgtaa gactccggcc tatcgaaaac gctggggtga acgttacggt 120 ttttaccgcc atccgctaaa accaggcggc attatgctgc actccgtctc cgtcggtgaa 180 actctggcgg caatcccgtt ggtgcgcgcg ctgcgtcatc gttatcctga tttaccgatt 240 accgtaacaa ccatgacgcc aaccggttcg gagcgcgtac aatcggcttt cgggaaggat 300 gttcagcacg tttatctgcc gtatgatctg cccgatgcac tcaaccgttt cctgaataaa 360 gtcgacccta aactggtgtt gattatggaa accgaactat ggcctaacct gattgcggcg 420 ctacataaac gtaaaattcc gctggtgatc gctaacgcgc gactctctgc ccgctcggcc 480 gcaggttatg ccaaactggg taaattcgtc cgtcgcttgc tgcgtcgtat tacgctgatt 540 gctgcgcaaa atgaagaaga tggtgcacgt tttgtggcgc tgggcgcaaa aaataatcag 600 gtgaccgtta ccggtagcct gaaattcgat atttctgtaa cgccgcagtt ggctgctaaa 660 gccgtgacgc tgcgccgcca gtgggcacca caccgcccgg tatggattgc caccagcact 720 cacgaaggcg aagagagtgt ggtgatcgcc gcacatcagg cattgttaca gcaattcccg 780 aatttattgc tcatcctggt accccgtcat ccggaacgct tcccggatgc gattaacctt 840 gtccgccagg ctggactaag ctatatcaca cgctcttcag gggaagtccc ctccaccagc 900 acgcaggttg tggttggcga tacgatgggc gagttgatgt tactgtatgg cattgccgat 960 ctcgcctttg ttggcggttc actggttgaa cgtggtgggc ataatccgct ggaagctgcc 1020 gcacacgcta ttccggtatt gatggggccg catactttta actttaaaga catttgcgcg 1080 cggctggagc aggcaagcgg gctgattacc gttaccgatg ccactacgct tgcaaaagag 1140 gtttcctctt tactcaccga cgccgattac cgtagtttct atggccgtca tgccgttgaa 1200 gtactgtatc aaaaccaggg cgcgctacag cgtctgcttc aactgctgga accttacctg 1260 ccaccgaaaa cgcattga 1278 <210> 3 <211> 425 <212> PRT <213> Escherichia coli <400> 3 Met Leu Glu Leu Leu Tyr Thr Ala Leu Leu Tyr Leu Ile Gln Pro Leu 1 5 10 15 Ile Trp Ile Arg Leu Trp Val Arg Gly Arg Lys Ala Pro Ala Tyr Arg 20 25 30 Lys Arg Trp Gly Glu Arg Tyr Gly Phe Tyr Arg His Pro Leu Lys Pro 35 40 45 Gly Gly Ile Met Leu His Ser Val Ser Val Gly Glu Thr Leu Ala Ala 50 55 60 Ile Pro Leu Val Arg Ala Leu Arg His Arg Tyr Pro Asp Leu Pro Ile 65 70 75 80 Thr Val Thr Thr Met Thr Pro Thr Gly Ser Glu Arg Val Gln Ser Ala 85 90 95 Phe Gly Lys Asp Val Gln His Val Tyr Leu Pro Tyr Asp Leu Pro Asp 100 105 110 Ala Leu Asn Arg Phe Leu Asn Lys Val Asp Pro Lys Leu Val Leu Ile 115 120 125 Met Glu Thr Glu Leu Trp Pro Asn Leu Ile Ala Ala Leu His Lys Arg 130 135 140 Lys Ile Pro Leu Val Ile Ala Asn Ala Arg Leu Ser Ala Arg Ser Ala 145 150 155 160 Ala Gly Tyr Ala Lys Leu Gly Lys Phe Val Arg Arg Leu Leu Arg Arg 165 170 175 Ile Thr Leu Ile Ala Ala Gln Asn Glu Glu Asp Gly Ala Arg Phe Val 180 185 190 Ala Leu Gly Ala Lys Asn Asn Gln Val Thr Val Thr Gly Ser Leu Lys 195 200 205 Phe Asp Ile Ser Val Thr Pro Gln Leu Ala Ala Lys Ala Val Thr Leu 210 215 220 Arg Arg Gln Trp Ala Pro His Arg Pro Val Trp Ile Ala Thr Ser Thr 225 230 235 240 His Glu Gly Glu Glu Ser Val Val Ile Ala Ala His Gln Ala Leu Leu 245 250 255 Gln Gln Phe Pro Asn Leu Leu Leu Ile Leu Val Pro Arg His Pro Glu 260 265 270 Arg Phe Pro Asp Ala Ile Asn Leu Val Arg Gln Ala Gly Leu Ser Tyr 275 280 285 Ile Thr Arg Ser Ser Gly Glu Val Pro Ser Thr Ser Thr Gln Val Val 290 295 300 Val Gly Asp Thr Met Gly Glu Leu Met Leu Leu Tyr Gly Ile Ala Asp 305 310 315 320 Leu Ala Phe Val Gly Gly Ser Leu Val Glu Arg Gly Gly His Asn Pro 325 330 335 Leu Glu Ala Ala Ala His Ala Ile Pro Val Leu Met Gly Pro His Thr 340 345 350 Phe Asn Phe Lys Asp Ile Cys Ala Arg Leu Glu Gln Ala Ser Gly Leu 355 360 365 Ile Thr Val Thr Asp Ala Thr Thr Leu Ala Lys Glu Val Ser Ser Leu 370 375 380 Leu Thr Asp Ala Asp Tyr Arg Ser Phe Tyr Gly Arg His Ala Val Glu 385 390 395 400 Val Leu Tyr Gln Asn Gln Gly Ala Leu Gln Arg Leu Leu Gln Leu Leu 405 410 415 Glu Pro Tyr Leu Pro Pro Lys Thr His 420 425 <210> 4 <211> 425 <212> PRT <213> Artificial Sequence <220> <223> Artificial Sequence <400> 4 Met Leu Glu Leu Leu Tyr Thr Ala Leu Leu Tyr Leu Ile Gln Pro Leu 1 5 10 15 Ile Trp Ile Arg Leu Trp Val Arg Gly Arg Lys Thr Pro Ala Tyr Arg 20 25 30 Lys Arg Trp Gly Glu Arg Tyr Gly Phe Tyr Arg His Pro Leu Lys Pro 35 40 45 Gly Gly Ile Met Leu His Ser Val Ser Val Gly Glu Thr Leu Ala Ala 50 55 60 Ile Pro Leu Val Arg Ala Leu Arg His Arg Tyr Pro Asp Leu Pro Ile 65 70 75 80 Thr Val Thr Thr Met Thr Pro Thr Gly Ser Glu Arg Val Gln Ser Ala 85 90 95 Phe Gly Lys Asp Val Gln His Val Tyr Leu Pro Tyr Asp Leu Pro Asp 100 105 110 Ala Leu Asn Arg Phe Leu Asn Lys Val Asp Pro Lys Leu Val Leu Ile 115 120 125 Met Glu Thr Glu Leu Trp Pro Asn Leu Ile Ala Ala Leu His Lys Arg 130 135 140 Lys Ile Pro Leu Val Ile Ala Asn Ala Arg Leu Ser Ala Arg Ser Ala 145 150 155 160 Ala Gly Tyr Ala Lys Leu Gly Lys Phe Val Arg Arg Leu Leu Arg Arg 165 170 175 Ile Thr Leu Ile Ala Ala Gln Asn Glu Glu Asp Gly Ala Arg Phe Val 180 185 190 Ala Leu Gly Ala Lys Asn Asn Gln Val Thr Val Thr Gly Ser Leu Lys 195 200 205 Phe Asp Ile Ser Val Thr Pro Gln Leu Ala Ala Lys Ala Val Thr Leu 210 215 220 Arg Arg Gln Trp Ala Pro His Arg Pro Val Trp Ile Ala Thr Ser Thr 225 230 235 240 His Glu Gly Glu Glu Ser Val Val Ile Ala Ala His Gln Ala Leu Leu 245 250 255 Gln Gln Phe Pro Asn Leu Leu Leu Ile Leu Val Pro Arg His Pro Glu 260 265 270 Arg Phe Pro Asp Ala Ile Asn Leu Val Arg Gln Ala Gly Leu Ser Tyr 275 280 285 Ile Thr Arg Ser Ser Gly Glu Val Pro Ser Thr Ser Thr Gln Val Val 290 295 300 Val Gly Asp Thr Met Gly Glu Leu Met Leu Leu Tyr Gly Ile Ala Asp 305 310 315 320 Leu Ala Phe Val Gly Gly Ser Leu Val Glu Arg Gly Gly His Asn Pro 325 330 335 Leu Glu Ala Ala Ala His Ala Ile Pro Val Leu Met Gly Pro His Thr 340 345 350 Phe Asn Phe Lys Asp Ile Cys Ala Arg Leu Glu Gln Ala Ser Gly Leu 355 360 365 Ile Thr Val Thr Asp Ala Thr Thr Leu Ala Lys Glu Val Ser Ser Leu 370 375 380 Leu Thr Asp Ala Asp Tyr Arg Ser Phe Tyr Gly Arg His Ala Val Glu 385 390 395 400 Val Leu Tyr Gln Asn Gln Gly Ala Leu Gln Arg Leu Leu Gln Leu Leu 405 410 415 Glu Pro Tyr Leu Pro Pro Lys Thr His 420 425 <210> 5 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> Artificial Sequence <400> 5 cgggatccac cagtgaaccg ccaaca 26 <210> 6 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Artificial Sequence <400> 6 tgcgcggacg taagactc 18 <210> 7 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Artificial Sequence <400> 7 gagtcttacg tccgcgca 18 <210> 8 <211> 35 <212> DNA <213> Artificial Sequence <220> <223> Artificial Sequence <400> 8 aaggaaaaaa gcggccgctt cccgcacctt tattg 35 <210> 9 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Artificial Sequence <400> 9 cttcccgaaa gccgattg 18 <210> 10 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Artificial Sequence <400> 10 acaaaatata ctttaatc 18 <210> 11 <211> 1596 <212> DNA <213> Artificial Sequence <220> <223> Artificial Sequence <400> 11 accagtgaac cgccaacaaa ggcgagatcg gcaatgccat acagtaacat caactcgccc 60 atcgtatcgc caaccacaac ctgcgtgctg gtggagggga cttcccctga agagcgtgtg 120 atatagctta gtccagcctg gcggacaagg ttaatcgcat ccgggaagcg ttccggatga 180 cggggtacca ggatgagcaa taaattcggg aattgctgta acaatgcctg atgtgcggcg 240 atcaccacac tctcttcgcc ttcgtgagtg ctggtggcaa tccataccgg gcggtgtggt 300 gcccactggc ggcgcagcgt cacggcttta gcagccaact gcggcgttac agaaatatcg 360 aatttcaggc taccggtaac ggtcacctga ttattttttg cgcccagcgc cacaaaacgt 420 gcaccatctt cttcattttg cgcagcaatc agcgtaatac gacgcagcaa gcgacggacg 480 aatttaccca gtttggcata acctgcggcc gagcgggcag agagtcgcgc gttagcgatc 540 accagcggaa ttttacgttt atgtagcgcc gcaatcaggt taggccatag ttcggtttcc 600 ataatcaaca ccagtttagg gtcgacttta ttcaggaaac ggttgagtgc atcgggcaga 660 tcatacggca gataaacgtg ctgaacatcc ttcccgaaag ccgattgtac gcgctccgaa 720 ccggttggcg tcatggttgt tacggtaatc ggtaaatcag gataacgatg acgcagcgcg 780 cgcaccaacg ggattgccgc cagagtttca ccgacggaga cggagtgcag cataatgccg 840 cctggtttta gcggatggcg gtaaaaaccg taacgttcac cccagcgttt tcgataggcc 900 ggagacttac gtccgcgcac ccagagccgt atccagatca gcggctgaat aaggtagaga 960 agggcggtgt aaagcaattc gagcatagta aatagctgac ttatggatgt gctggggatt 1020 ctatgtattt agctgtggct ttaccattac ttttcccgtt tttgacttaa atagcttcag 1080 tttggtctga tctgccgcta catcttcatt ttttttgtat ttttatgcga ttcattgaaa 1140 ctcggcccca ttttcaaatc tacataggcc gtactgacat tatcgaaatg ctatttttta 1200 tctatttgat ttttatgatt aaagtatatt ttgtgtataa aaatcattcg ggtcggattg 1260 ctgcgaaaga aatgatacac tagcacgtca aagtaagtgc gttatcagta ttcaggtagc 1320 tgttgagcct ggggcggtag cgtgcttttt tctgcttaac ttaaccagac aatcacacaa 1380 aagagtcgct agtggaaaag ccatttcgaa aaatcctggt cataaagatg cgatatcatg 1440 gggatatgtt attaactact cctgtcatca gtacgctcaa gcagaattat cctgatgcaa 1500 aaatcgatat gctgctttat caggacacca tccctatttt gtctgaaaac ccggaaatta 1560 atgcgctcta tgggataagc aataaaggtg cgggaa 1596 <210> 12 <211> 544 <212> DNA <213> Artificial Sequence <220> <223> Artificial Sequence <400> 12 cttcccgaaa gccgattgta cgcgctccga accggttggc gtcatggttg ttacggtaat 60 cggtaaatca ggataacgat gacgcagcgc gcgcaccaac gggattgccg ccagagtttc 120 accgacggag acggagtgca gcataatgcc gcctggtttt agcggatggc ggtaaaaacc 180 gtaacgttca ccccagcgtt ttcgataggc cggagactta cgtccgcgca cccagagccg 240 tatccagatc agcggctgaa taaggtagag aagggcggtg taaagcaatt cgagcatagt 300 aaatagctga cttatggatg tgctggggat tctatgtatt tagctgtggc tttaccatta 360 cttttcccgt ttttgactta aatagcttca gtttggtctg atctgccgct acatcttcat 420 tttttttgta tttttatgcg attcattgaa actcggcccc attttcaaat ctacataggc 480 cgtactgaca ttatcgaaat gctatttttt atctatttga tttttatgat taaagtatat 540 tttg 544 <210> 13 <211> 2109 <212> DNA <213> Escherichia coli <400> 13 atgtatctgt ttgaaagcct gaatcaactg attcaaacct acctgccgga agaccaaatc 60 aagcgtctgc ggcaggcgta tctcgttgca cgtgatgctc acgaggggca aacacgttca 120 agcggtgaac cctatatcac gcacccggta gcggttgcct gcattctggc cgagatgaaa 180 ctcgactatg aaacgctgat ggcggcgctg ctgcatgacg tgattgaaga tactcccgcc 240 acctaccagg atatggaaca gctttttggt aaaagcgtcg ccgagctggt agagggggtg 300 tcgaaacttg ataaactcaa gttccgcgat aagaaagagg cgcaggccga aaactttcgc 360 aagatgatta tggcgatggt gcaggatatc cgcgtcatcc tcatcaaact tgccgaccgt 420 acccacaaca tgcgcacgct gggctcactt cgcccggaca aacgtcgccg catcgcccgt 480 gaaactctcg aaatttatag cccgctggcg caccgtttag gtatccacca cattaaaacc 540 gaactcgaag agctgggttt tgaggcgctg tatcccaacc gttatcgcgt aatcaaagaa 600 gtggtgaaag ccgcgcgcgg caaccgtaaa gagatgatcc agaagattct ttctgaaatc 660 gaagggcgtt tgcaggaagc gggaataccg tgccgcgtca gtggtcgcga gaagcatctt 720 tattcgattt actgcaaaat ggtgctcaaa gagcagcgtt ttcactcgat catggacatc 780 tacgctttcc gcgtgatcgt caatgattct gacacctgtt atcgcgtgct gggccagatg 840 cacagcctgt acaagccgcg tccgggccgc gtgaaagact atatcgccat tccaaaagcg 900 aacggctatc agtctttgca cacctcgatg atcggcccgc acggtgtgcc ggttgaggtc 960 cagatccgta ccgaagatat ggaccagatg gcggagatgg gtgttgccgc gcactgggct 1020 tataaagagc acggcgaaac cagtactacc gcacaaatcc gcgcccagcg ctggatgcaa 1080 agcctgctgg agctgcaaca gagcgccggt agttcgtttg aatttatcga gagcgttaaa 1140 tccgatctct tcccggatga gatttacgtt ttcacaccgg aagggcgcat tgtcgagctg 1200 cctgccggtg caacgcccgt cgacttcgct tatgcagtgc ataccgatat cggtcatgcc 1260 tgcgtgggcg cacgcgttga ccgccagcct tacccgctgt cgcagccgct taccagcggt 1320 caaaccgttg aaatcattac cgctccgggc gctcgcccga atgccgcttg gctgaacttt 1380 gtcgttagct cgaaagcgcg cgccaaaatt cgtcagttgc tgaaaaacct caagcgtgat 1440 gattctgtaa gcctgggccg tcgtctgctc aaccatgctt tgggtggtag ccgtaagctg 1500 aatgaaatcc cgcaggaaaa tattcagcgc gagctggatc gcatgaagct ggcaacgctt 1560 gacgatctgc tggcagaaat cggacttggt aacgcaatga gcgtggtggt cgcgaaaaat 1620 ctgcaacatg gggacgcctc cattccaccg gcaacccaaa gccacggaca tctgcccatt 1680 aaaggtgccg atggcgtgct gatcaccttt gcgaaatgct gccgccctat tcctggcgac 1740 ccgattatcg cccacgtcag ccccggtaaa ggtctggtga tccaccatga atcctgccgt 1800 aatatccgtg gctaccagaa agagccagag aagtttatgg ctgtggaatg ggataaagag 1860 acggcgcagg agttcatcac cgaaatcaag gtggagatgt tcaatcatca gggtgcgctg 1920 gcaaacctga cggcggcaat taacaccacg acttcgaata ttcaaagttt gaatacggaa 1980 gagaaagatg gtcgcgtcta cagcgccttt attcgtctga ccgctcgtga ccgtgtgcat 2040 ctggcgaata tcatgcgcaa aatccgcgtg atgccagacg tgattaaagt cacccgaaac 2100 cgaaattaa 2109 <210> 14 <211> 2109 <212> DNA <213> Artificial Sequence <220> <223> Artificial Sequence <400> 14 atgtatctgt ttgaaagcct gaatcaactg attcaaacct acctgccgga agaccaaatc 60 aagcgtctgc ggcaggcgta tctcgttgca cgtgatgctc acgaggggca aacacgttca 120 agcggtgaac cctatatcac gcacccggta gcggttgcct gcattctggc cgagatgaaa 180 ctcgactatg aaacgctgat ggcggcgctg ctgcatgacg tgattgaaga tactcccgcc 240 acctaccagg atatggaaca gctttttggt aaaagcgtcg ccgagctggt agagggggtg 300 tcgaaacttg ataaactcaa gttccgcgat aagaaagagg cgcaggccga aaactttcgc 360 aagatgatta tggcgatggt gcaggatatc cgcgtcatcc tcatcaaact tgccgaccgt 420 acccacaaca tgcgcacgct gggctcactt cgcccggaca aacgtcgccg catcgcccgt 480 gaaactctcg aaatttatag cccgctggcg caccgtttat gtatccacca cattaaaacc 540 gaactcgaag agctgggttt tgaggcgctg tatcccaacc gttatcgcgt aatcaaagaa 600 gtggtgaaag ccgcgcgcgg caaccgtaaa gagatgatcc agaagattct ttctgaaatc 660 gaagggcgtt tgcaggaagc gggaataccg tgccgcgtca gtggtcgcga gaagcatctt 720 tattcgattt actgcaaaat ggtgctcaaa gagcagcgtt ttcactcgat catggacatc 780 tacgctttcc gcgtgatcgt caatgattct gacacctgtt atcgcgtgct gggccagatg 840 cacagcctgt acaagccgcg tccgggccgc gtgaaagact atatcgccat tccaaaagcg 900 aacggctatc agtctttgca cacctcgatg atcggcccgc acggtgtgcc ggttgaggtc 960 cagatccgta ccgaagatat ggaccagatg gcggagatgg gtgttgccgc gcactgggct 1020 tataaagagc acggcgaaac cagtactacc gcacaaatcc gcgcccagcg ctggatgcaa 1080 agcctgctgg agctgcaaca gagcgccggt agttcgtttg aatttatcga gagcgttaaa 1140 tccgatctct tcccggatga gatttacgtt ttcacaccgg aagggcgcat tgtcgagctg 1200 cctgccggtg caacgcccgt cgacttcgct tatgcagtgc ataccgatat cggtcatgcc 1260 tgcgtgggcg cacgcgttga ccgccagcct tacccgctgt cgcagccgct taccagcggt 1320 caaaccgttg aaatcattac cgctccgggc gctcgcccga atgccgcttg gctgaacttt 1380 gtcgttagct cgaaagcgcg cgccaaaatt cgtcagttgc tgaaaaacct caagcgtgat 1440 gattctgtaa gcctgggccg tcgtctgctc aaccatgctt tgggtggtag ccgtaagctg 1500 aatgaaatcc cgcaggaaaa tattcagcgc gagctggatc gcatgaagct ggcaacgctt 1560 gacgatctgc tggcagaaat cggacttggt aacgcaatga gcgtggtggt cgcgaaaaat 1620 ctgcaacatg gggacgcctc cattccaccg gcaacccaaa gccacggaca tctgcccatt 1680 aaaggtgccg atggcgtgct gatcaccttt gcgaaatgct gccgccctat tcctggcgac 1740 ccgattatcg cccacgtcag ccccggtaaa ggtctggtga tccaccatga atcctgccgt 1800 aatatccgtg gctaccagaa agagccagag aagtttatgg ctgtggaatg ggataaagag 1860 acggcgcagg agttcatcac cgaaatcaag gtggagatgt tcaatcatca gggtgcgctg 1920 gcaaacctga cggcggcaat taacaccacg acttcgaata ttcaaagttt gaatacggaa 1980 gagaaagatg gtcgcgtcta cagcgccttt attcgtctga ccgctcgtga ccgtgtgcat 2040 ctggcgaata tcatgcgcaa aatccgcgtg atgccagacg tgattaaagt cacccgaaac 2100 cgaaattaa 2109 <210> 15 <211> 702 <212> PRT <213> Escherichia coli <400> 15 Met Tyr Leu Phe Glu Ser Leu Asn Gln Leu Ile Gln Thr Tyr Leu Pro 1 5 10 15 Glu Asp Gln Ile Lys Arg Leu Arg Gln Ala Tyr Leu Val Ala Arg Asp 20 25 30 Ala His Glu Gly Gln Thr Arg Ser Ser Gly Glu Pro Tyr Ile Thr His 35 40 45 Pro Val Ala Val Ala Cys Ile Leu Ala Glu Met Lys Leu Asp Tyr Glu 50 55 60 Thr Leu Met Ala Ala Leu Leu His Asp Val Ile Glu Asp Thr Pro Ala 65 70 75 80 Thr Tyr Gln Asp Met Glu Gln Leu Phe Gly Lys Ser Val Ala Glu Leu 85 90 95 Val Glu Gly Val Ser Lys Leu Asp Lys Leu Lys Phe Arg Asp Lys Lys 100 105 110 Glu Ala Gln Ala Glu Asn Phe Arg Lys Met Ile Met Ala Met Val Gln 115 120 125 Asp Ile Arg Val Ile Leu Ile Lys Leu Ala Asp Arg Thr His Asn Met 130 135 140 Arg Thr Leu Gly Ser Leu Arg Pro Asp Lys Arg Arg Arg Ile Ala Arg 145 150 155 160 Glu Thr Leu Glu Ile Tyr Ser Pro Leu Ala His Arg Leu Gly Ile His 165 170 175 His Ile Lys Thr Glu Leu Glu Glu Leu Gly Phe Glu Ala Leu Tyr Pro 180 185 190 Asn Arg Tyr Arg Val Ile Lys Glu Val Val Lys Ala Ala Arg Gly Asn 195 200 205 Arg Lys Glu Met Ile Gln Lys Ile Leu Ser Glu Ile Glu Gly Arg Leu 210 215 220 Gln Glu Ala Gly Ile Pro Cys Arg Val Ser Gly Arg Glu Lys His Leu 225 230 235 240 Tyr Ser Ile Tyr Cys Lys Met Val Leu Lys Glu Gln Arg Phe His Ser 245 250 255 Ile Met Asp Ile Tyr Ala Phe Arg Val Ile Val Asn Asp Ser Asp Thr 260 265 270 Cys Tyr Arg Val Leu Gly Gln Met His Ser Leu Tyr Lys Pro Arg Pro 275 280 285 Gly Arg Val Lys Asp Tyr Ile Ala Ile Pro Lys Ala Asn Gly Tyr Gln 290 295 300 Ser Leu His Thr Ser Met Ile Gly Pro His Gly Val Pro Val Glu Val 305 310 315 320 Gln Ile Arg Thr Glu Asp Met Asp Gln Met Ala Glu Met Gly Val Ala 325 330 335 Ala His Trp Ala Tyr Lys Glu His Gly Glu Thr Ser Thr Thr Ala Gln 340 345 350 Ile Arg Ala Gln Arg Trp Met Gln Ser Leu Leu Glu Leu Gln Gln Ser 355 360 365 Ala Gly Ser Ser Phe Glu Phe Ile Glu Ser Val Lys Ser Asp Leu Phe 370 375 380 Pro Asp Glu Ile Tyr Val Phe Thr Pro Glu Gly Arg Ile Val Glu Leu 385 390 395 400 Pro Ala Gly Ala Thr Pro Val Asp Phe Ala Tyr Ala Val His Thr Asp 405 410 415 Ile Gly His Ala Cys Val Gly Ala Arg Val Asp Arg Gln Pro Tyr Pro 420 425 430 Leu Ser Gln Pro Leu Thr Ser Gly Gln Thr Val Glu Ile Ile Thr Ala 435 440 445 Pro Gly Ala Arg Pro Asn Ala Ala Trp Leu Asn Phe Val Val Ser Ser 450 455 460 Lys Ala Arg Ala Lys Ile Arg Gln Leu Leu Lys Asn Leu Lys Arg Asp 465 470 475 480 Asp Ser Val Ser Leu Gly Arg Arg Leu Leu Asn His Ala Leu Gly Gly 485 490 495 Ser Arg Lys Leu Asn Glu Ile Pro Gln Glu Asn Ile Gln Arg Glu Leu 500 505 510 Asp Arg Met Lys Leu Ala Thr Leu Asp Asp Leu Leu Ala Glu Ile Gly 515 520 525 Leu Gly Asn Ala Met Ser Val Val Val Ala Lys Asn Leu Gln His Gly 530 535 540 Asp Ala Ser Ile Pro Pro Ala Thr Gln Ser His Gly His Leu Pro Ile 545 550 555 560 Lys Gly Ala Asp Gly Val Leu Ile Thr Phe Ala Lys Cys Cys Arg Pro 565 570 575 Ile Pro Gly Asp Pro Ile Ile Ala His Val Ser Pro Gly Lys Gly Leu 580 585 590 Val Ile His His Glu Ser Cys Arg Asn Ile Arg Gly Tyr Gln Lys Glu 595 600 605 Pro Glu Lys Phe Met Ala Val Glu Trp Asp Lys Glu Thr Ala Gln Glu 610 615 620 Phe Ile Thr Glu Ile Lys Val Glu Met Phe Asn His Gln Gly Ala Leu 625 630 635 640 Ala Asn Leu Thr Ala Ala Ile Asn Thr Thr Thr Ser Asn Ile Gln Ser 645 650 655 Leu Asn Thr Glu Glu Lys Asp Gly Arg Val Tyr Ser Ala Phe Ile Arg 660 665 670 Leu Thr Ala Arg Asp Arg Val His Leu Ala Asn Ile Met Arg Lys Ile 675 680 685 Arg Val Met Pro Asp Val Ile Lys Val Thr Arg Asn Arg Asn 690 695 700 <210> 16 <211> 702 <212> PRT <213> Escherichia coli <400> 16 Met Tyr Leu Phe Glu Ser Leu Asn Gln Leu Ile Gln Thr Tyr Leu Pro 1 5 10 15 Glu Asp Gln Ile Lys Arg Leu Arg Gln Ala Tyr Leu Val Ala Arg Asp 20 25 30 Ala His Glu Gly Gln Thr Arg Ser Ser Gly Glu Pro Tyr Ile Thr His 35 40 45 Pro Val Ala Val Ala Cys Ile Leu Ala Glu Met Lys Leu Asp Tyr Glu 50 55 60 Thr Leu Met Ala Ala Leu Leu His Asp Val Ile Glu Asp Thr Pro Ala 65 70 75 80 Thr Tyr Gln Asp Met Glu Gln Leu Phe Gly Lys Ser Val Ala Glu Leu 85 90 95 Val Glu Gly Val Ser Lys Leu Asp Lys Leu Lys Phe Arg Asp Lys Lys 100 105 110 Glu Ala Gln Ala Glu Asn Phe Arg Lys Met Ile Met Ala Met Val Gln 115 120 125 Asp Ile Arg Val Ile Leu Ile Lys Leu Ala Asp Arg Thr His Asn Met 130 135 140 Arg Thr Leu Gly Ser Leu Arg Pro Asp Lys Arg Arg Arg Ile Ala Arg 145 150 155 160 Glu Thr Leu Glu Ile Tyr Ser Pro Leu Ala His Arg Leu Cys Ile His 165 170 175 His Ile Lys Thr Glu Leu Glu Glu Leu Gly Phe Glu Ala Leu Tyr Pro 180 185 190 Asn Arg Tyr Arg Val Ile Lys Glu Val Val Lys Ala Ala Arg Gly Asn 195 200 205 Arg Lys Glu Met Ile Gln Lys Ile Leu Ser Glu Ile Glu Gly Arg Leu 210 215 220 Gln Glu Ala Gly Ile Pro Cys Arg Val Ser Gly Arg Glu Lys His Leu 225 230 235 240 Tyr Ser Ile Tyr Cys Lys Met Val Leu Lys Glu Gln Arg Phe His Ser 245 250 255 Ile Met Asp Ile Tyr Ala Phe Arg Val Ile Val Asn Asp Ser Asp Thr 260 265 270 Cys Tyr Arg Val Leu Gly Gln Met His Ser Leu Tyr Lys Pro Arg Pro 275 280 285 Gly Arg Val Lys Asp Tyr Ile Ala Ile Pro Lys Ala Asn Gly Tyr Gln 290 295 300 Ser Leu His Thr Ser Met Ile Gly Pro His Gly Val Pro Val Glu Val 305 310 315 320 Gln Ile Arg Thr Glu Asp Met Asp Gln Met Ala Glu Met Gly Val Ala 325 330 335 Ala His Trp Ala Tyr Lys Glu His Gly Glu Thr Ser Thr Thr Ala Gln 340 345 350 Ile Arg Ala Gln Arg Trp Met Gln Ser Leu Leu Glu Leu Gln Gln Ser 355 360 365 Ala Gly Ser Ser Phe Glu Phe Ile Glu Ser Val Lys Ser Asp Leu Phe 370 375 380 Pro Asp Glu Ile Tyr Val Phe Thr Pro Glu Gly Arg Ile Val Glu Leu 385 390 395 400 Pro Ala Gly Ala Thr Pro Val Asp Phe Ala Tyr Ala Val His Thr Asp 405 410 415 Ile Gly His Ala Cys Val Gly Ala Arg Val Asp Arg Gln Pro Tyr Pro 420 425 430 Leu Ser Gln Pro Leu Thr Ser Gly Gln Thr Val Glu Ile Ile Thr Ala 435 440 445 Pro Gly Ala Arg Pro Asn Ala Ala Trp Leu Asn Phe Val Val Ser Ser 450 455 460 Lys Ala Arg Ala Lys Ile Arg Gln Leu Leu Lys Asn Leu Lys Arg Asp 465 470 475 480 Asp Ser Val Ser Leu Gly Arg Arg Leu Leu Asn His Ala Leu Gly Gly 485 490 495 Ser Arg Lys Leu Asn Glu Ile Pro Gln Glu Asn Ile Gln Arg Glu Leu 500 505 510 Asp Arg Met Lys Leu Ala Thr Leu Asp Asp Leu Leu Ala Glu Ile Gly 515 520 525 Leu Gly Asn Ala Met Ser Val Val Val Ala Lys Asn Leu Gln His Gly 530 535 540 Asp Ala Ser Ile Pro Pro Ala Thr Gln Ser His Gly His Leu Pro Ile 545 550 555 560 Lys Gly Ala Asp Gly Val Leu Ile Thr Phe Ala Lys Cys Cys Arg Pro 565 570 575 Ile Pro Gly Asp Pro Ile Ile Ala His Val Ser Pro Gly Lys Gly Leu 580 585 590 Val Ile His His Glu Ser Cys Arg Asn Ile Arg Gly Tyr Gln Lys Glu 595 600 605 Pro Glu Lys Phe Met Ala Val Glu Trp Asp Lys Glu Thr Ala Gln Glu 610 615 620 Phe Ile Thr Glu Ile Lys Val Glu Met Phe Asn His Gln Gly Ala Leu 625 630 635 640 Ala Asn Leu Thr Ala Ala Ile Asn Thr Thr Thr Ser Asn Ile Gln Ser 645 650 655 Leu Asn Thr Glu Glu Lys Asp Gly Arg Val Tyr Ser Ala Phe Ile Arg 660 665 670 Leu Thr Ala Arg Asp Arg Val His Leu Ala Asn Ile Met Arg Lys Ile 675 680 685 Arg Val Met Pro Asp Val Ile Lys Val Thr Arg Asn Arg Asn 690 695 700 <210> 17 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Artificial Sequence <400> 17 cgggatccga acagcaagag caggaagc 28 <210> 18 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Artificial Sequence <400> 18 tgtggtggat acataaacg 19 <210> 19 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Artificial Sequence <400> 19 gcaccgttta tgtatccacc 20 <210> 20 <211> 38 <212> DNA <213> Artificial Sequence <220> <223> Artificial Sequence <400> 20 aaggaaaaaa gcggccgcac gacaaagttc agccaagc 38 <210> 21 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Artificial Sequence <400> 21 ctttcgcaag atgattatgg 20 <210> 22 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Artificial Sequence <400> 22 cacggtattc ccgcttcctg 20 <210> 23 <211> 567 <212> DNA <213> Escherichia coli <400> 23 atgaatatca ctgctactgt tcttcttgcg tttggtatgt cgatggatgc atttgctgca 60 tcaatcggta aaggtgccac cctccataaa ccgaaatttt ctgaagcatt gcgaaccggc 120 cttatttttg gtgccgtcga aaccctgacg ccgctgatcg gctggggaat gggcatgtta 180 gccagccggt ttgtccttga atggaaccac tggattgcgt ttgtgctgct gatattcctc 240 ggcgggcgaa tgattattga gggttttcgt ggcgcagatg atgaagatga agagccgcgc 300 cgtcgacacg gtttctggct actggtaacc accgcgattg ccaccagcct ggatgccatg 360 gctgtgggtg ttggtcttgc tttcctgcag gtcaacatta tcgcgaccgc attggccatt 420 ggttgtgcaa ccttgattat gtcaacatta gggatgatgg ttggtcgctt tatcggctca 480 attattggga aaaaagcgga aattctcggc gggctggtgc tgatcggcat cggcgtccag 540 atcctctgga cgcacttcca cggttaa 567 <210> 24 <211> 567 <212> DNA <213> Artificial Sequence <220> <223> Artificial Sequence <400> 24 atgaatatca ctgctactgt tcttcttgcg tttggtatgt cgatggatgc atttgctgca 60 tcaatcggta aagatgccac cctccataaa ccgaaatttt ctgaagcatt gcgaaccggc 120 cttatttttg gtgccgtcga aaccctgacg ccgctgatcg gctggggaat gggcatgtta 180 gccagccggt ttgtccttga atggaaccac tggattgcgt ttgtgctgct gatattcctc 240 ggcgggcgaa tgattattga gggttttcgt ggcgcagatg atgaagatga agagccgcgc 300 cgtcgacacg gtttctggct actggtaacc accgcgattg ccaccagcct ggatgccatg 360 gctgtgggtg ttggtcttgc tttcctgcag gtcaacatta tcgcgaccgc attggccatt 420 ggttgtgcaa ccttgattat gtcaacatta gggatgatgg ttggtcgctt tatcggctca 480 attattggga aaaaagcgga aattctcggc gggctggtgc tgatcggcat cggcgtccag 540 atcctctgga cgcacttcca cggttaa 567 <210> 25 <211> 188 <212> PRT <213> Escherichia coli <400> 25 Met Asn Ile Thr Ala Thr Val Leu Leu Ala Phe Gly Met Ser Met Asp 1 5 10 15 Ala Phe Ala Ala Ser Ile Gly Lys Gly Ala Thr Leu His Lys Pro Lys 20 25 30 Phe Ser Glu Ala Leu Arg Thr Gly Leu Ile Phe Gly Ala Val Glu Thr 35 40 45 Leu Thr Pro Leu Ile Gly Trp Gly Met Gly Met Leu Ala Ser Arg Phe 50 55 60 Val Leu Glu Trp Asn His Trp Ile Ala Phe Val Leu Leu Ile Phe Leu 65 70 75 80 Gly Gly Arg Met Ile Ile Glu Gly Phe Arg Gly Ala Asp Asp Glu Asp 85 90 95 Glu Glu Pro Arg Arg Arg His Gly Phe Trp Leu Leu Val Thr Thr Ala 100 105 110 Ile Ala Thr Ser Leu Asp Ala Met Ala Val Gly Val Gly Leu Ala Phe 115 120 125 Leu Gln Val Asn Ile Ile Ala Thr Ala Leu Ala Ile Gly Cys Ala Thr 130 135 140 Leu Ile Met Ser Thr Leu Gly Met Met Val Gly Arg Phe Ile Gly Ser 145 150 155 160 Ile Ile Gly Lys Lys Ala Glu Ile Leu Gly Gly Leu Val Leu Ile Gly 165 170 175 Ile Gly Val Gln Ile Leu Trp Thr His Phe His Gly 180 185 <210> 26 <211> 188 <212> PRT <213> Artificial Sequence <220> <223> Artificial Sequence <400> 26 Met Asn Ile Thr Ala Thr Val Leu Leu Ala Phe Gly Met Ser Met Asp 1 5 10 15 Ala Phe Ala Ala Ser Ile Gly Lys Asp Ala Thr Leu His Lys Pro Lys 20 25 30 Phe Ser Glu Ala Leu Arg Thr Gly Leu Ile Phe Gly Ala Val Glu Thr 35 40 45 Leu Thr Pro Leu Ile Gly Trp Gly Met Gly Met Leu Ala Ser Arg Phe 50 55 60 Val Leu Glu Trp Asn His Trp Ile Ala Phe Val Leu Leu Ile Phe Leu 65 70 75 80 Gly Gly Arg Met Ile Ile Glu Gly Phe Arg Gly Ala Asp Asp Glu Asp 85 90 95 Glu Glu Pro Arg Arg Arg His Gly Phe Trp Leu Leu Val Thr Thr Ala 100 105 110 Ile Ala Thr Ser Leu Asp Ala Met Ala Val Gly Val Gly Leu Ala Phe 115 120 125 Leu Gln Val Asn Ile Ile Ala Thr Ala Leu Ala Ile Gly Cys Ala Thr 130 135 140 Leu Ile Met Ser Thr Leu Gly Met Met Val Gly Arg Phe Ile Gly Ser 145 150 155 160 Ile Ile Gly Lys Lys Ala Glu Ile Leu Gly Gly Leu Val Leu Ile Gly 165 170 175 Ile Gly Val Gln Ile Leu Trp Thr His Phe His Gly 180 185 <210> 27 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Artificial Sequence <400> 27 cgggatccct tcgccaatgt ctggattg 28 <210> 28 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Artificial Sequence <400> 28 atggagggtg gcatctttac 20 <210> 29 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Artificial Sequence <400> 29 tgcatcaatc ggtaaagatg 20 <210> 30 <211> 38 <212> DNA <213> Artificial Sequence <220> <223> Artificial Sequence <400> 30 aaggaaaaaa gcggccgcca actccgcact ctgctgta 38 <210> 31 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Artificial Sequence <400> 31 ccatcacggc ttgttgttc 19 <210> 32 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Artificial Sequence <400> 32 acgaaaaccc tcaataatc 19

Claims

뉴클레오티드 서열로서,
i. 서열번호 1로 표시되는 야생형 kdtA 유전자 코딩 서열 82번째 염기의 돌연변이에 의해 형성된 서열; 또는
ii. 서열번호 13으로 표시되는 spoT 유전자 코딩 서열 520번째 염기의 돌연변이에 의해 형성된 서열; 또는
iii. 서열번호 23으로 표시되는 야생형 yebN 유전자 코딩 서열 74번째 염기의 돌연변이에 의해 형성된 뉴클레오티드 서열로부터 선택되는 서열을 포함하는, 뉴클레오티드 서열.
제1항에 있어서,
i. 상기 돌연변이는 서열번호 1의 82번째 염기가 구아닌(G)에서 아데닌(A)으로의 돌연변이이거나; 또는
ii. 상기 돌연변이는 서열번호 13의 520번째 염기가 구아닌(G)에서 티민(T)으로의 돌연변이거나; 또는
iii. 상기 돌연변이는 서열번호 23의 74번째 염기가 구아닌(G)에서 아데닌(A)으로의 돌연변이인 것으로부터 선택되는 서열을 포함하는, 뉴클레오티드 서열.
제1항에 있어서,
상기 돌연변이된 뉴클레오티드 서열은,
i. 서열번호 2로 표시되는 서열; 또는
ii. 서열번호 14로 표시되는 서열; 또는
iii. 서열번호 24로 표시되는 서열로부터 선택되는, 뉴클레오티드 서열.
재조합 단백질로서,
제1항에 따른 뉴클레오티드 서열에 의해 코딩되고,
바람직하게는, 이의 아미노산 서열은 서열번호 4로 표시되거나; 또는
아미노산 서열은 서열번호 16으로 표시되거나; 또는
아미노산 서열은 서열번호 26으로 표시되는, 재조합 단백질.
재조합 벡터로서,
제1항에 따른 뉴클레오티드 서열을 포함하는, 재조합 벡터.
제5항에 있어서,
상기 재조합 벡터는 상기 뉴클레오티드 서열을 플라스미드에 도입하여 구축된 것인, 재조합 벡터.
재조합 균주로서.
제1항에 따른 뉴클레오티드 서열을 포함하는, 재조합 균주.
제7항에 있어서,
상기 재조합 균주는 제5항에 따른 재조합 벡터를 숙주 균주에 도입하여 재조합으로 형성된 것이고; 상기 숙주 균주는 대장균으로부터 선택되며; 예를 들어, 상기 숙주 균주는 E.coli K12, 이의 유도체 균주 E.coli K12(W3110) 또는 E.coli CGMCC 7.232 균주인, 재조합 균주.
제7항에 따른 재조합 균주의 구축 방법으로서,
(1) 서열번호 1 또는 서열번호 13 또는 서열번호 23으로 표시되는 야생형 유전자의 뉴클레오티드 서열을 변형하여, 서열번호 2 또는 서열번호 14 또는 서열번호 24로 표시되는 돌연변이된 뉴클레오티드 서열을 획득하는 단계;
(2) 상기 돌연변이된 뉴클레오티드 서열과 플라스미드를 연결하여 재조합 벡터를 구축하되, 바람직하게 상기 플라스미드는 pKOV 플라스미드인 단계; 및
(3) 상기 재조합 벡터를 숙주 균주에 도입하여 상기 재조합 균주를 획득하는 단계를 포함하는, 재조합 균주의 구축 방법.
L-트레오닌의 발효 및 제조에서 제1항에 따른 뉴클레오티드 서열, 제4항에 따른 재조합 단백질, 제5항에 따른 재조합 벡터 또는 제7항에 따른 재조합 균주의 응용.