KR20240000169A

KR20240000169A - L-히스티딘 배출 단백질 및 이를 이용한 l-히스티딘 생산 방법

Info

Publication number: KR20240000169A
Application number: KR1020220076773A
Authority: KR
Inventors: 허란; 서창일; 정기용
Original assignee: 씨제이제일제당 (주)
Priority date: 2022-06-23
Filing date: 2022-06-23
Publication date: 2024-01-02
Also published as: WO2023249421A1

Abstract

본 출원은 L-히스티딘 배출능을 갖는 히스티딘 배출 단백질 또는 이의 변이체를 발굴하고, 이를 L-히스티딘의 생산능을 가지는 미생물에서 발현시킨 결과, L-히스티딘 생산량을 획기적으로 향상시킬 수 있다.

Description

L-히스티딘 배출 단백질 및 이를 이용한 L-히스티딘 생산 방법{L-Histidine Export Protein and Method of Producing L-Histidine Using the Same}

히스티딘 배출 활성을 갖는 신규 단백질, 상기 단백질이 발현되도록 변형된 L-히스티딘 생산 미생물, 및 상기 미생물을 이용하여 L-히스티딘을 생산하는 방법에 관한 것이다.

L-히스티딘은 20개의 표준 아미노산들 가운데 하나의 아미노산으로, 영양학적인 관점에서 볼 때 성인에게는 많은 양이 요구되지 않지만, 성장기 어린이들에게는 해당하는 필수 아미노산으로 분류된다. 또한, L-히스티딘은 항산화와 면역 조절 등 중요한 생리적 과정에 관여하여 위장 궤양 치료제, 순환기계 치료제의 원료 및 아미노산 수액 제제 등 의학 산업에 사용된다.

L-히스티딘은 특히 헤모글로빈에 많이 들어 있어서, 혈분을 원료로 하는 단백질 가수 분해 추출법을 통해 주로 생산된다. 그러나, 이러한 방법은 낮은 효율과 환경 오염 등의 단점을 지니고 있다. 반면, 미생물 발효법을 통하여 L-히스티딘을 생산하는 것은 가능하나, 대규모 공업화는 아직 이루어지지 않았다. 이는 L-히스티딘의 생합성이 뉴클레오타이드 합성 전구체인 포스포리보실 피로인산 (PRPP)과 경쟁 관계를 가지며, 고 에너지를 요구하는 복잡한 생합성 과정 및 조절 메커니즘을 가지고 있기 때문이다.

다른 종류의 아미노산의 배출능을 갖는 단백질의 발현 및/또는 기능이 강화되면 해당 아미노산의 생산이 증가되는 예는 알려져 있으나, L-히스티딘 특이적 배출능을 갖는 단백질에 대한 선행 연구는 거의 진행된 바 없다.

이러한 배경하에서, 히스티딘 특이적 배출능을 갖는 단백질의 발굴 및 이를 이용한 히스티딘 생산 기술의 개발이 요구된다.

본 출원의 목적은 (1) 서열번호 43의 아미노산 서열의 72번째 아미노산 잔기에 상응하는 아미노산이 다른 아미노산으로 치환되거나,

(2) 서열번호 43의 아미노산 서열의 124번째 잔기에 상응하는 아미노산이 다른 아미노산으로 치환되거나,

(3) 상기 (1) 및 (2)가 모두 치환된, 변이형 L-히스티딘 배출 단백질을 제공하는 것이다.

본 출원의 다른 목적은 상기 단백질 또는 상기 단백질을 암호화하는 폴리뉴클레오타이드를 포함하는 미생물을 제공하는 것이다.

본 출원의 또 다른 목적은 상기 단백질, 상기 단백질을 암호화하는 폴리뉴클레오타이드, 또는 상기 미생물을 포함하는 L-히스티딘 생산용 조성물을 제공하는 것이다.

본 출원의 또 다른 목적은, 상기 미생물을 배지에서 배양하는 단계를 포함하는, L-히스티딘 생산 방법을 제공하는 것이다.

본 출원은 L-히스티딘 배출능을 갖는 히스티딘 배출 단백질의 변이체를 발굴하고, 이를 L-히스티딘의 생산능을 가지는 미생물에서 발현시킨 결과, L-히스티딘 생산량을 획기적으로 향상시킬 수 있음을 제안한다.

본 명세서에서, 헬코바실러스 마시리엔시스 (Helcobacillus massiliensis) 유래의 AzlC 계열 ABC 수송체 투과효소 (AzlC family ABC transporter permease)를 발현하는 미생물이 L-히스티딘 생산능이 우수함을 확인하고, 상기 AzlC 계열 ABC 수송체 투과효소의 특정 위치에 아미노산 치환 변이가 도입되는 경우, L-히스티딘 생산능이 보다 증가하는 것을 확인하였다.

단백질, 폴리뉴클레오타이드, 및 재조합 벡터

일 양상은 L-히스티딘 배출 활성을 갖는 변이형 단백질(또는 폴리펩타이드)을 제공한다. 상기 단백질은 L-히스티딘 특이적 배출능을 갖는 단백질일 수 있다. 본 명세서에서, 상기 변이형 단백질은 변이형 L-히스티딘 배출 단백질로 표현될 수 있다. 상기 변이형 단백질은 AzlC 계열 ABC 수송체 투과 활성을 가지는 것일 수 있다.

일 예에서 상기 변이형 단백질은 야생형 L-히스티딘 배출 단백질 (예컨대, AzlD 도메인-함유 단백질 (AzlD domain-containing protein), 또는 AzlC 계열 ABC 수송체 투과효소 단백질 (AzlC family ABC transporter permease) 등)과 동등하거나 보다 강화된 L-히스티딘 배출 활성을 가지는 것일 수 있다. 상기 AzlD 도메인-함유 단백질 또는 AzlC 계열 ABC 수송체 투과효소 단백질은 헬코바실러스 마시리엔시스 (Helcobacillus massiliensis) 유래의 것일 수 있다. 본 명세서에서, 헬코바실러스 마시리엔시스 유래의 AzlD 도메인-함유 단백질은 HmaE 단백질 (또는 HmaE), 헬코바실러스 마시리엔시스 유래의 AzlC 계열 ABC 수송체 투과효소 단백질은 HmaF 단백질 (또는 HmaF)로 기재될 수 있다.

일 예에서, 상기 변이형 단백질 (예컨대, AzlD 도메인-함유 단백질의 변이형 단백질, 구체적으로 헬코바실러스 마시리엔시스 유래의 AzlD 도메인-함유 단백질의 변이형 단백질)은 AzlC 계열 ABC 수송체 투과효소 단백질과 동일한 오페론 유전자에서 함께 발현되는 것일 수 있다. 일 예에서, 상기 변이형 단백질은 상기 AzlC 계열 ABC 수송체 투과효소 단백질과 결합하여 L-히스티딘 배출 활성을 갖는 것일 수 있다.

일 예에서 상기 변이형 단백질은 헬코바실러스 마시리엔시스 (Helcobacillus massiliensis) 유래의 AzlC 계열 ABC 수송체 투과효소 단백질의 변이형 단백질일 수 있다.

상기 변이형 단백질은, 헬코바실러스 마시리엔시스 유래의 야생형 AzlC 계열 ABC 수송체 투과효소 단백질의 하나 이상의 아미노산 잔기가 치환, 결실, 또는 삽입된 변이가 도입된 변이형 단백질일 수 있다.

상기 헬코바실러스 마시리엔시스 유래의 야생형 AzlC 계열 ABC 수송체 투과효소 단백질은 서열번호 43의 아미노산 서열(WP_055090792.1)을 포함하거나 상기 서열로 이루어지는 것일 수 있다.

일 예에서, 상기 변이형 단백질은 서열번호 43의 아미노산 서열에서 N-말단으로부터 (1) 72번째 잔기에 상응하는 아미노산이 다른 아미노산으로 치환되거나,

(2) 124번째 잔기에 상응하는 아미노산이 다른 아미노산으로 치환되거나, 또는

(3) 상기 (1) 및 (2)가 모두 치환된 아미노산 서열을 포함하는 것일 수 있다.

상기와 같이 아미노산 서열에서 N-말단으로부터 아미노산을 계수하는 것은, 개시코돈으로부터 번역된 메티오닌(Met, M)을 1번째 아미노산으로 하여 계수하는 것을 의미할 수 있다.

일 예에서, 상기 변이형 단백질은 서열번호 43의 아미노산 서열에서 N-말단으로부터 (1) 72번째 잔기에 상응하는 아미노산이 다른 아미노산, 즉 원래의 아미노산과 상이한 아미노산으로서, 류신(Leu, L), 아르기닌(Arg, R), 히스티딘(His, H), 리신(Lys, K), 아스파르트산(Asp, D), 글루탐산(Glu, E), 세린(Ser, S), 트레오닌(Thr, T), 아스파라긴(Asn, N), 글루타민(Gln, Q), 시스테인(Cys, C), 글리신(Gly, G), 프롤린(Pro, P), 알라닌(Ala, A), 발린(Val, V), 메티오닌(Met, M), 페닐알라닌(Phe, F), 타이로신(Tyr, Y), 또는 트립토판(Trp, W)으로 치환된 서열을 포함하거나,

(2) 124번째 잔기에 상응하는 아미노산이 다른 아미노산, 즉 원래의 아미노산과 상이한 아미노산으로서, 발린, 아르기닌, 히스티딘, 리신, 아스파르트산, 글루탐산, 세린, 트레오닌, 아스파라긴, 글루타민, 시스테인, 글리신, 프롤린, 알라닌, 류신, 메티오닌, 페닐알라닌, 타이로신, 또는 트립토판으로 치환된 서열을 포함하거나,

(3) 상기 (1) 및 (2)가 모두 치환된 서열을 포함하는 것일 수 있다.

일 예에서, 상기 변이형 단백질은 서열번호 43의 아미노산 서열에서 N-말단으로부터 (1) 72번째 잔기에 상응하는 아미노산이 류신, 글리신, 프롤린, 알라닌, 발린, 또는 메티오닌으로 치환되거나;

(2) 124번째 잔기에 상응하는 아미노산이 발린, 글리신, 프롤린, 알라닌, 류신, 또는 메티오닌으로 치환되거나; 또는

일 구체예에서, 상기 변이형 단백질은 서열번호 43의 아미노산 서열에서 N-말단으로부터 72번째 잔기에 상응하는 아미노산이 류신으로 치환되고, 124번째 잔기에 상응하는 아미노산이 발린으로 치환된 것일 수 있다. 상기 변이형 단백질 중 서열번호 43의 N-말단으로부터 72번째 및/또는 124번째 아미노산 잔기에 상응하는 아미노산을 제외한 일부 아미노산 서열이 결실, 변형, 치환 또는 부가되더라도 AzlC 계열 ABC 수송체 투과효소 활성을 나타내는 한 본 출원의 변이형 단백질에 포함될 수 있음은 자명하다.

또한, 일 예에서 상기 변이형 단백질은 서열번호 43로 기재되는 아미노산 서열과 적어도 60% 이상, 65% 이상, 70% 이상, 75% 이상, 80% 이상, 85% 이상, 90% 이상, 91% 이상, 92% 이상, 93% 이상, 94% 이상, 95% 이상, 96% 이상, 97% 이상, 98% 이상, 99% 이상, 또는 99.5% 이상의 서열 상동성 또는 서열 동일성을 가지는 아미노산 서열에서, 서열번호 43의 아미노산 서열에서 N-말단으로부터 (1) 72번째 잔기에 상응하는 아미노산이 다른 아미노산으로 치환되거나, (2) 124번째 잔기에 상응하는 아미노산이 다른 아미노산으로 치환되거나, 또는 (3) 상기 (1) 및 (2)가 모두 치환된 폴리펩타이드를 포함할 수 있다. 즉 서열번호 43의 아미노산 서열에서 N-말단으로부터 72번째 및/또는 124번째 잔기에 상응하는 위치에서 다른 아미노산으로의 치환을 포함하고 서열번호 43의 아미노산 서열과 적어도 60% 이상, 65% 이상, 70% 이상, 75% 이상, 80% 이상, 85% 이상, 90% 이상, 91% 이상, 92% 이상, 93% 이상, 94% 이상, 95% 이상, 96% 이상, 97% 이상, 98% 이상, 99% 이상, 또는 99.5% 이상의 서열 상동성 또는 서열 동일성을 가지며 AzlC 계열 ABC 수송체 투과효소 활성을 가지는 폴리펩타이드는 본 출원의 변이형 단백질에 포함될 수 있다.

일 구체예에서 상기 변이형 단백질은 서열번호 56의 아미노산 서열을 포함하거나 상기 서열로 이루어지는 것일 수 있으나 이에 제한되는 것은 아니다. 상기 서열번호 56의 아미노산 서열로 이루어진 변이형 단백질에서 서열번호 56의 아미노산 서열에서 N-말단으로부터 72번째 및/또는 124번째 잔기에 상응하는 아미노산을 제외한 일부 아미노산 서열이 결실, 변형, 치환 또는 부가되더라도 AzlC 계열 ABC 수송체 투과효소 활성을 나타내는 한 본 출원의 변이형 단백질에 포함될 수 있음은 자명하다. 또한 일 예에서 상기 변이형 단백질은 서열번호 56의 아미노산 서열에서 N-말단으로부터 72번째 및/또는 124번째 잔기에 상응하는 아미노산은 고정되고, 서열번호 56의 아미노산 서열과 적어도 60% 이상, 65% 이상, 70% 이상, 75% 이상, 80% 이상, 85% 이상, 90% 이상, 91% 이상, 92% 이상, 93% 이상, 94% 이상, 95% 이상, 96% 이상, 97% 이상, 98% 이상, 99% 이상, 또는 99.5% 이상의 서열 상동성 또는 서열 동일성을 가지는 폴리펩타이드를 포함할 수 있다. 즉, 서열번호 56의 아미노산 서열에서 N-말단으로부터 72번째 및/또는 124번째 잔기에 상응하는 아미노산이 다른 아미노산으로 치환되고, 서열번호 56의 아미노산 서열과 적어도 60% 이상, 65% 이상, 70% 이상, 75% 이상, 80% 이상, 85% 이상, 90% 이상, 91% 이상, 92% 이상, 93% 이상, 94% 이상, 95% 이상, 96% 이상, 97% 이상, 98% 이상, 99% 이상, 또는 99.5% 이상의 상동성 또는 동일성을 가지는, AzlC 계열 ABC 수송체 투과효소 활성을 가지는 폴리펩타이드는 본 출원의 변이형 단백질 포함될 수 있다.

일 예에서, 상기 변이형 단백질은 야생형 단백질 (예컨대, 야생형 AzlD 도메인-함유 단백질)보다 L-히스티딘 배출 활성이 보다 강화된 것일 수 있다. 일 예에서, 상기 변이형 단백질은 야생형 AzlC 계열 ABC 수송체 투과효소 단백질과 함께 발현되는 경우, L-히스티딘 배출 활성이 보다 강화될 수 있다.

상기 야생형 L-히스티딘 배출 단백질은 서열번호 43 (헬코바실러스 마시리엔시스 유래의 야생형 AzlC 계열 ABC 수송체 투과효소 단백질), 서열번호 44 (헬코바실러스 마시리엔시스 유래의 야생형 AzlD 도메인-함유 단백질) 또는 이들의 조합과 60% 이상의 서열 상동성을 갖는 단백질일 수 있다. 예컨대, 일 구체예에서, 상기 야생형 L-히스티딘 배출 단백질은 서열번호 43, 44, 또는 이의 조합과 60% 이상, 65% 이상, 70% 이상, 75% 이상, 80% 이상, 85% 이상, 90% 이상, 91% 이상, 92% 이상, 93% 이상, 94% 이상, 95% 이상, 96% 이상, 97% 이상, 98% 이상, 99% 이상, 또는 99.5% 이상의 상동성을 갖는 것일 수 있다. 상기 서열번호 43으로 표현되는 단백질은 서열번호 45의 핵산서열에 의하여 암호화되고, 서열번호 44로 표현되는 단백질은 서열번호 46의 핵산서열에 의하여 암호화되거나, 서열번호 43 및/또는 서열번호 44으로 표현되는 단백질은 서열번호 47 핵산서열 (서열번호 45의 3' 말단과 서열번호 46의 5' 말단의 중복 부위에서 융합된 오페론 서열임)에 의하여 암호화되는 것일 수 있다.

다른 양상은, 상기 변이형 단백질을 암호화하는 (코딩하는) 폴리뉴클레오타이드를 제공한다.

본 출원에서 용어, "폴리뉴클레오타이드"는 뉴클레오타이드 단위체(monomer)가 공유결합에 의해 길게 사슬모양으로 이어진 뉴클레오타이드의 중합체(polymer)로 일정한 길이 이상의 DNA 또는 RNA 가닥으로서, 보다 구체적으로는 상기 변이형 폴리펩타이드를 코딩하는 폴리뉴클레오타이드 단편을 의미한다.

본 출원의 변이형 단백질을 코딩하는 폴리뉴클레오타이드는 서열번호 56의 아미노산 서열을 코딩하는 염기서열을 포함할 수 있다.

본 명세서에서, 폴리뉴클레오타이드("유전자"와 혼용될 수 있음) 또는 폴리펩타이드("단백질"과 혼용될 수 있음)가 "특정 핵산 서열 또는 아미노산 서열을 포함한다, 특정 핵산 서열 또는 아미노산 서열로 이루어진다, 또는 특정 핵산 서열 또는 아미노산 서열로 표현된다" 함은 상기 폴리뉴클레오타이드 또는 폴리펩타이드가 상기 특정 핵산 서열 또는 아미노산 서열을 필수적으로 포함하는 것을 의미할 수 있으며, 상기 폴리뉴클레오타이드 또는 폴리펩타이드의 본래의 기능 및/또는 목적하는 기능을 유지하는 범위에서 상기 특정 핵산 서열 또는 아미노산 서열에 변이(결실, 치환, 변형, 및/또는 부가)가 가해진 "실질적으로 동등한 서열"을 포함하는 것(또는 상기 변이를 배제하지 않는 것)으로 해석될 수 있다.

일 예에서, 본 명세서에서 제공되는 핵산 서열 또는 아미노산 서열은 이들의 본래의 기능 또는 목적하는 기능을 유지하는 범위에서 통상적인 돌연변이 유발법, 예를 들면 방향성 진화법(direct evolution) 및/또는 부위특이적 돌연변이법(site-directed mutagenesis) 등에 의하여 변형된 것을 포함할 수 있다. 일 예에서, 폴리뉴클레오타이드 또는 폴리펩타이드가 "특정 핵산 서열 또는 아미노산 서열을 포함한다 또는 특정 핵산 서열 또는 아미노산 서열로 이루어진다" 함은 상기 폴리뉴클레오타이드 또는 폴리펩타이드가 (i) 상기 특정 핵산 서열 또는 아미노산 서열을 필수적으로 포함하거나, 또는 (ii) 상기 특정 핵산 서열 또는 아미노산 서열과 60% 이상, 65% 이상, 70% 이상, 75% 이상, 80% 이상, 85% 이상, 90% 이상, 91% 이상, 92% 이상, 93% 이상, 94% 이상, 95% 이상, 96% 이상, 97% 이상, 98% 이상, 99% 이상, 또는 99.5% 이상의 상동성을 갖는 아미노산 서열로 이루어지거나 이를 필수적으로 포함하고 본래의 기능 및/또는 목적하는 기능을 유지하는 것을 의미할 수 있다. 본 명세서에서, 상기 목적하는 기능은 미생물의 L-히스티딘 배출 활성 및/또는 L-히스티딘 생산능을 부여하거나, 증가시키는 기능을 의미할 수 있다.

본 명세서에 기재된 핵산 서열은 코돈의 축퇴성(degeneracy)으로 인하여 상기 단백질을 발현시키고자 하는 미생물에서 선호되는 코돈을 고려하여, 코딩영역으로부터 발현되는 단백질의 아미노산 서열 및/또는 기능을 변화시키지 않는 범위 내에서 코딩영역에 다양한 변형이 이루어질 수 있다.

본 명세서에서, 용어 "상동성(identity)"은 주어진 핵산 서열 또는 아미노산 서열과 일치하는 정도를 의미하며 백분율(%)로 표시될 수 있다. 핵산 서열에 대한 상동성의 경우, 예를 들면, 문헌에 의한 알고리즘 BLAST(참조: Karlin 및 Altschul, Pro. Natl. Acad. Sci. USA, 90, 5873, 1993)나 Pearson에 의한 FASTA(참조: Methods Enzymol., 183, 63, 1990)를 사용하여 결정할 수 있다. 이러한 알고리즘 BLAST에 기초하여, BLASTN이나 BLASTX라고 불리는 프로그램이 개발되어 있다(참조: http://www.ncbi.nlm.nih.gov).

일 예에서, 본 명세서에 제공되는 특정 핵산 서열을 포함하는 폴리뉴클레오타이드는 상기 특정 핵산 서열 또는 이와 실질적으로 동등한 핵산 서열뿐만 아니라, 상기 특정 핵산 서열에 상보적인 핵산 서열을 포함하는 폴리뉴클레오타이드 단편을 포함하는 것으로 해석될 수 있다. 구체적으로, 상기 상보성을 가지는 폴리뉴클레오타이드는 목적에 따라 당업자에 의해 적절히 조절 가능한 Tm 값, 예컨대, 55℃, 60℃, 63℃ 또는 65℃의 Tm 값에서 혼성화하고, 후술하는 조건에서 분석할 수 있다: 이러한 조건은 공지의 문헌에 구체적으로 기재되어 있다. 예를 들어, 60% 이상, 65% 이상, 70% 이상, 75% 이상, 80% 이상, 85% 이상, 90% 이상, 91% 이상, 92% 이상, 93% 이상, 94% 이상, 95% 이상, 96% 이상, 97% 이상, 98% 이상, 99% 이상, 또는 99.5% 이상의 높은 상보성을 갖는 유전자끼리 혼성화하고, 그보다 낮은 상보성을 갖는 유전자끼리는 혼성화하지 않는 조건, 또는 통상의 써던 하이브리드화의 세척 조건인 60℃, 1x SSC(saline-sodium citrate buffer), 및 0.1%(w/v) SDS (Sodium Dodecyl Sulfate); 60℃, 0.1x SSC, 및 0.1% SDS; 또는 68℃, 0.1x SSC, 및 0.1% SDS에 상당하는 염 농도 및 온도에서, 1회, 구체적으로는 2회 내지 3회 세척하는 조건을 열거할 수 있으나, 이에 제한되는 것은 아니다. 혼성화에는 두 개의 뉴클레오타이드가 상보적 서열을 가질 것이 요구되거나, 혼성화의 엄격도에 따라 염기 간의 미스매치(mismatch)가 허용될 수 있다. 상기 용어 "상보적"은 서로 혼성화가 가능한 뉴클레오타이드 염기 간의 관계를 기술하기 위하여 사용될 수 있다. 예를 들면, DNA의 경우, 아데닌은 티민에 상보적이며 시토신은 구아닌에 상보적이다. 폴리뉴클레오타이드를 혼성화하는 적절한 엄격도는 폴리뉴클레오타이드의 길이 및 상보성 정도에 의존하고, 이는 관련 기술분야에 잘 알려져 있다 (Sambrook et al., supra,9.50-9.51, 11.7-11.8 참조).

상기 폴리뉴클레오타이드 또는 벡터의 도입은 공지된 형질전환 방법을 당업자가 적절히 선택하여 수행될 수 있다. 본 명세서에서, 용어 "형질전환"은 특정 폴리뉴클레오타이드 또는 이를 포함하는 벡터를 숙주 세포 내로 도입하는 과정으로 형질전환된 폴리뉴클레오타이드는 숙주 세포 내에서 염색체 내에 삽입되어 위치하거나 염색체 외에 위치할 수 있다. 일 예로 형질전환은 표적 단백질(외래 단백질)을 암호화하는 폴리뉴클레오타이드나 이를 포함하는 벡터를 숙주 세포 내에 도입하여 숙주세포 내에서 상기 폴리뉴클레오타이드가 암호화하는 단백질이 발현할 수 있도록 하는 것일 수 있다. 또한, 상기 폴리뉴클레오타이드는 표적 단백질을 코딩하는 DNA 및/또는 RNA를 포함할 수 있다. 상기 폴리뉴클레오타이드는 숙주 세포 내로 도입되어 발현될 수 있는 것이면, 그 도입되는 형태는 제한이 없다. 예를 들면, 상기 폴리뉴클레오타이드는 자체적으로 발현되는데 필요한 모든 요소를 포함하는 유전자 구조체인 발현 카세트 (expression cassette)의 형태로 숙주 세포에 도입될 수 있다. 상기 발현 카세트는 통상 상기 폴리뉴클레오타이드에 작동 가능하게 연결되어 있는 프로모터 (promoter), 전사 종결신호, 리보좀 결합부위 및/또는 번역 종결신호 등의 발현 조절 요소를 포함할 수 있다. 상기 발현 카세트는 자체 복제가 가능한 발현 벡터 형태일 수 있다. 또한, 상기 폴리뉴클레오타이드는 그 자체의 형태로 숙주세포에 도입되어 숙주세포에서 발현에 필요한 서열과 작동 가능하게 연결되어 있는 것일 수도 있다. 상기에서 용어 "작동 가능하게 연결"된 것이란 발현조절 요소가 목적 단백질(외래 단백질)을 암호화하는 폴리뉴클레오타이드의 전사 조절 (예, 전사 개시)를 수행할 수 있도록 발현조절 요소 (예, 프로모터)와 폴리뉴클레오타이드가 기능적으로 연결되어 있는 것을 의미할 수 있다. 작동 가능한 연결은 당업계의 공지된 유전자 재조합 기술을 이용하여 수행할 수 있으며, 예컨대, 통상적인 부위-특이적 DNA 절단 및 연결에 의하여 수행될 수 있으나, 이에 제한되지 않는다.

상기 폴리뉴클레오타이드를 숙주 세포에 형질전환 하는 방법은 핵산을 세포(미생물) 내로 도입하는 어떠한 방법으로도 수행 가능하며, 숙주 세포에 따라 당 분야에서 공지된 형질전환 기술을 적절히 선택하여 수행할 수 있다. 상기 공지된 형질전환 방법으로 전기천공법 (electroporation), 인산칼슘 (CaPO4) 침전법, 염화칼슘 (CaCl2) 침전법, 미세주입법 (microinjection), 폴리에틸렌글리콜 (PEG) 침전법(polyethylene glycol-mediated uptake), DEAE-덱스트란법, 양이온 리포좀법, 리포펙션(lipofection), 초산 리튬-DMSO법 등이 예시될 수 있으나, 이에 제한되는 것은 아니다.

상기 폴리뉴클레오타이드의 숙주 세포 유전체 (염색체) 내 도입 (삽입)은 공지된 방법을 당업자가 적절히 선택하여 수행될 수 있으며, 예컨대, RNA-가이드 엔도뉴클레아제 시스템 (RNA-guided endonuclease system 또는 CRISPR system; 예컨대, (a) RNA-가이드 엔도뉴클레아제(예, Cas9 단백질 등), 이의 암호화 유전자, 또는 상기 유전자를 포함하는 벡터; 및 (b) 가이드 RNA (예, single guide RNA (sgRNA) 등), 이의 암호화 DNA, 또는 상기 DNA를 포함하는 벡터를 포함하는 혼합물(예컨대, RNA-가이드 엔도뉴클레아제 단백질과 가이드 RNA의 혼합물 등), 복합체 (예컨대, 리보핵산 융합단백질 (RNP), 재조합 벡터 (예컨대, RNA-가이드 엔도뉴클레아제 암호화 유전자 및 가이드 RNA 암호화 DNA를 함께 포함하는 벡터 등) 등으로 이루어진 군에서 선택된 하나 이상)을 사용하여 수행될 수 있으나, 이에 제한되는 것은 아니다.

다른 양상은, 상기 폴리뉴클레오타이드를 포함하는 재조합 벡터를 제공한다. 상기 재조합 벡터는 상기 폴리펩타이드의 발현 벡터로서 사용될 수 있다. 상기 재조합 벡터는 상기 폴리뉴클레오타이드를 숙주세포의 유전체에 삽입 또는 숙주 세포 유전체의 대응 유전자를 대체하기 위한 것일 수 있다.

본 명세서에서, 용어 "벡터"는 적합한 숙주 내에서 목적 단백질을 발현시킬 수 있도록 적합한 조절 서열에 작동 가능하게 연결된 상기 목적 단백질을 암호화하는 폴리뉴클레오타이드의 염기서열을 함유하는 DNA 제조물을 의미한다. 상기 조절 서열은 전사를 개시할 수 있는 프로모터, 전사를 조절하기 위한 임의의 오퍼레이터 서열, 적합한 mRNA 리보좀 결합부위를 암호화하는 서열, 및/또는 전사 및/또는 해독의 종결을 조절하는 서열을 포함할 수 있다. 벡터는 적당한 숙주 세포 내로 형질전환된 후, 숙주 세포의 게놈(유전체)과 무관하게 발현되거나, 숙주 세포의 게놈 내에 통합될 수 있다.

본 명세서에서 사용가능한 벡터는 숙주 세포 내에서 복제 가능한 것이면 특별히 한정되지 않으며, 통상 사용되는 모든 벡터들 중에서 선택될 수 있다. 통상 사용되는 벡터의 예로는 천연 상태이거나 재조합된 상태의 플라스미드, 코스미드, 바이러스, 박테리오파지 등을 들 수 있다. 예를 들어, 상기 벡터로서, 파지 벡터 또는 코스미드 벡터로서 pWE15, M13, MBL3, MBL4, IXII, ASHII, APII, t10, t11, Charon4A, 및 Charon21A 등을 사용할 수 있으며, 플라스미드 벡터로서 pBR계, pUC계, pBluescriptII계, pGEM계, pTZ계, pCL계 및 pET계 등을 사용할 수 있다. 구체적으로는 pDZ, pACYC177, pACYC184, pCL, pECCG117, pUC19, pBR322, pMW118, pCC1BAC 벡터 등을 예시할 수 있으나, 이에 제한되지 않는다.

본 명세서에서 사용 가능한 벡터는 공지된 발현 벡터 및/또는 폴리뉴클레오타이드의 숙주 세포 염색체 내 삽입용 벡터일 수 있다. 상기 폴리뉴클레오타이드의 숙주 세포 염색체 내 삽입은 당업계에 알려진 임의의 방법, 예를 들면, 상동재조합 또는 CRISPR 시스템에 의하여 이루어질 수 있으나, 이에 한정되지는 않는다. 상기 벡터는 상기 염색체 내 삽입 여부를 확인하기 위한 선별 마커(selection marker)를 추가로 포함할 수 있다. 상기 선별 마커는 벡터로 형질전환된 세포를 선별, 즉, 상기 폴리뉴클레오타이드의 삽입 여부를 확인하기 위한 것으로, 약물 내성, 영양 요구성, 세포 독성제에 대한 내성 또는 표면 단백질의 발현과 같은 선택가능 표현형을 부여하는 유전자들 중에서 선택되어 사용될 수 있다. 선택제(selective agent)가 처리된 환경에서는 선별 마커를 발현하는 세포만 생존하거나 다른 표현 형질을 나타내므로, 형질전환된 세포를 선별할 수 있다.

미생물

다른 양상은, 상기 변이형 단백질, 상기 변이형 단백질을 암호화하는 폴리뉴클레오타이드, 및 상기 폴리뉴클레오타이드를 포함하는 재조합 벡터로 이루어진 군에서 선택된 하나 이상(1종, 2종, 또는 3종 모두)를 포함하는 미생물을 제공한다. 상기 미생물은 L-히스티딘 배출 활성 및/또는 L-히스티딘 생산능을 가지는 것일 수 있다. 상기 미생물은 L-히스티딘 배출 활성 및/또는 L-히스티딘 생산능이 상기 변이형 단백질, 상기 변이형 단백질을 암호화하는 폴리뉴클레오타이드, 및 상기 폴리뉴클레오타이드를 포함하는 재조합 벡터로 이루어지는 군에서 선택된 1종 이상을 포함하지 않는 미생물과 비교하여 강화된(또는 증가된, 향상된) 것일 수 있다.

상기 변이형 단백질은 외래의 것일 수 있다. 본 명세서에서 "외래의 것"은 미생물 내재적으로 존재하는 것이 아니라, 상기 미생물과 다른 종으로부터 유래한 것을 의미하는 것일 수 있다.

본 명세서에서, "L-히스티딘 배출 활성 및/또는 L-히스티딘 생산능이 강화된 미생물"은 앞서 설명한 변이형 단백질을 발현하도록 조작(변이)됨으로써, L-히스티딘 배출 활성 및/또는 L-히스티딘 생산능이 없던 미생물이 L-히스티딘 배출 활성 및/또는 L-히스티딘 생산능을 갖게 되거나, 본래의 L-히스티딘 배출 활성 및/또는 L-히스티딘 생산능보다 높은 L-히스티딘 배출 활성 및/또는 L-히스티딘 생산능을 갖게된 것일 수 있다.

본 명세서에서 "미생물"은 단세포 박테리아를 포괄하는 것으로, "세포"와 혼용될 수 있다.

본 출원에서 용어, "미생물(또는, 균주)"는 야생형 미생물이나 자연적 또는 인위적으로 유전적 변형이 일어난 미생물을 모두 포함하며, 외부 유전자가 삽입되거나 내재적 유전자의 활성이 강화되거나 불활성화되는 등의 원인으로 인해서 특정 기작이 약화되거나 강화된 미생물로서, 목적하는 폴리펩타이드, 단백질 또는 산물(예컨대, L-히스티딘)의 생산을 위하여 유전적 변형(modification)을 포함하는 미생물일 수 있다.

본 출원의 미생물은 L-히스티딘 배출 단백질 또는 이를 코딩하는 폴리뉴클레오타이드의 활성이 강화되도록 벡터를 통해 유전적으로 변형된 미생물(예컨대, 재조합 미생물)일 수 있으나, 이에 제한되지 않는다. 상기 벡터는 전술한 바와 같다.

본 명세서에서, 상기 변이형 단백질을 발현하도록 변이되기 전의 미생물을 상기 변이된 미생물과 구별하기 위하여, "모균주 (parent microorganism or parent strain) 또는 숙주 세포 (host cell)"로 표현될 수 있다.

상기 미생물(또는 균주, 재조합 세포)이 L-히스티딘 배출 활성 및/또는 L-히스티딘 생산능을 갖거나, L-히스티딘 배출 활성 및/또는 L-히스티딘 생산능이 강화된다는 것은, L-히스티딘 배출 활성 및/또는 L-히스티딘 생산능이 없는 비변형 미생물, 재조합 전의 세포, 모균주, 및/또는 야생형 균주와는 달리 L-히스티딘 배출 활성 및/또는 L-히스티딘 생산능이 부여된 것이거나, 비변형 미생물, 재조합 전의 세포, 모균주, 및/또는 야생형 균주와 비교하여 L-히스티딘 배출 활성 및/또는 L-히스티딘 생산능이 향상된 것을 의미할 수 있다.

본 출원의 미생물은 본 출원의 변이형 단백질, 본 출원의 변이형 단백질을 암호화하는 폴리뉴클레오타이드 및 본 출원의 폴리뉴클레오타이드를 포함하는 벡터 중 어느 하나 이상을 포함하는 미생물; 본 출원의 변이형 단백질 또는 본 출원의 폴리뉴클레오타이드를 발현하도록 변형된 미생물; 본 출원의 변이형 단백질, 또는 본 출원의 폴리뉴클레오타이드를 발현하는 미생물 (예컨대, 재조합 균주); 또는 본 출원의 변이형 단백질 활성을 갖는 미생물 (예컨대, 재조합 균주)일 수 있으나, 이에 제한되지 않는다.

일 예에서, 상기 미생물은 코리네박테리움 속 (the genus Corynebacterium) 미생물, 에세리키아 속 (Escherichia) 미생물 등으로 이루어진 군에서 선택된 1종 이상일 수 있다. 상기 코리네박테리움 속 미생물은 코리네박테리움 글루타미쿰 (Corynebacterium glutamicum), 코리네박테리움 암모니아게네스 (Corynebacterium ammoniagenes), 브레비박테리움 락토퍼멘텀 (Brevibacterium lactofermentum), 브레비박테리움 플라범 (Brevibacterium flavum), 코리네박테리움 써모아미노게네스 (Corynebacterium thermoaminogenes), 코리네박테리움 에피션스 (Corynebacterium efficiens) 등을 포함할 수 있으나, 반드시 이에 한정되는 것은 아니다. 보다 더욱 구체적으로는, 상기 코리네박테리움 속 미생물은 코리네박테리움 글루타미쿰 (Corynebacterium glutamicum)일 수 있다. 상기 에세리키아 속 균주는 대장균 (Escherichia coli)일 수 있다.

상기 미생물은 변이형 단백질, 상기 변이형 단백질을 암호화하는 폴리뉴클레오타이드, 및 상기 폴리뉴클레오타이드를 포함하는 재조합 벡터로 이루어진 군에서 선택된 하나 이상(1종, 2종, 또는 3종 모두)을 포함하는 것일 수 있다. 일 예에서, 상기 변이형 단백질을 발현하도록 하는 변이는 앞서 설명한 변이형 단백질을 암호화하는 폴리뉴클레오타이드, 또는 이를 포함하는 재조합 벡터를 도입하는 것에 의하여 수행되거나, 또는 인공 돌연변이 (예컨대, Error-prone PCR 등) 등에 의하여 수행되는 것일 수 있다. 이와 같이 모균주에 도입되는 변이형 단백질을 암호화하는 폴리뉴클레오타이드는 모균주 내재의 AzlC 계열 ABC 수송체 투과효소 암호화 유전자를 대체하거나 이에 더하여 추가로 포함되는 것일 수 있다.

일 예에서, 상기 미생물은, 상기 변이형 단백질을 야생형 AzlC 계열 ABC 수송체 투과효소 단백질과 함께 포함하는 경우, L-히스티딘 배출 활성 및/또는 L-히스티딘 생산능이 보다 강화될 수 있다.

일 예에서, 상기 L-히스티딘 배출 활성 및/또는 L-히스티딘 생산능이 강화된 미생물은 변이 전 모균주, 비변형 미생물, 야생형 L-히스티딘 배출 단백질을 포함하는 미생물과 비교하여 L-히스티딘 생산능이 약 10% 이상, 15% 이상, 20% 이상, 30% 이상, 40% 이상, 50% 이상, 60% 이상, 70% 이상, 또는 80% 이상 증가된 것일 수 있으나 이에 제한되는 것은 아니다.

다른 예에서, 상기 L-히스티딘 배출 활성 및/또는 L-히스티딘 생산능이 강화된 미생물은 변이 전 모균주, 비변형 미생물, 야생형 L-히스티딘 배출 단백질을 포함하는 미생물과 비교하여 L-히스티딘 생산능이 약 1 g/L 이상, 1.5 g/L 이상, 2 g/L 이상, 2.5 g/L 이상, 3 g/L 이상, 3.5 g/L 이상, 또는 4 g/L 이상 증가된 것일 수 있으나 이에 제한되는 것은 아니다.

상기 용어 “약(about)”은 ±0.5, ±0.4, ±0.3, ±0.2, ±0.1 등을 모두 포함하는 범위로, 약 이란 용어 뒤에 나오는 수치와 동등하거나 유사한 범위의 수치를 모두 포함하나, 이에 제한되지 않는다.

다른 양상은, 상기 변이형 단백질, 상기 폴리뉴클레오타이드, 상기 재조합 벡터, 또는 상기 미생물을 포함하는 L-히스티딘 생산용 조성물을 제공한다.

다른 양상은, 상기 미생물을 배지에서 배양하는 단계를 포함하는, L-히스티딘 생산(제조) 방법을 제공한다. 상기 제조 방법은 상기 배양하는 단계 이후에, 배양된 미생물, 배지, 또는 이들 모두로부터 L-히스티딘을 회수하는 단계를 추가로 포함할 수 있다.

다른 양상은, 미생물의 L-히스티딘 배출 활성 및/또는 L-히스티딘 생산능을 강화시키는 단계를 포함하는, 상기 미생물의 L-히스티딘 배출 활성 및/또는 L-히스티딘 생산능을 증가시키는 방법, 또는 상기 미생물에 L-히스티딘 배출 활성 및/또는 L-히스티딘 생산능을 부여하는 방법을 제공한다.

상기 변이를 도입하는 단계는 변이형 단백질을 암호화하는 폴리뉴클레오타이드 또는 상기 폴리뉴클레오타이드를 포함하는 재조합 벡터를 미생물에 도입(형질전환)시키는 단계를 포함하거나, 인공적으로 돌연변이를 발생시키는 단계 (예컨대, Error-prone PCR 등)를 포함할 수 있다.

다른 예는 상기 L-히스티딘 배출 활성 및/또는 L-히스티딘 생산능이 강화된 미생물을 배지에서 배양하는 단계를 포함하는, L-히스티딘 생산 방법을 제공한다. 상기 방법은 상기 배양하는 단계 이후에, 상기 배양된 미생물, 배지, 또는 이들 모두로부터 L-히스티딘을 회수하는 단계를 추가로 포함할 수 있다.

상기 방법에 있어서, 상기 미생물을 배양하는 단계는, 특별히 이에 제한되지 않으나, 공지된 회분식 배양방법, 연속식 배양방법, 유가식 배양방법 등에 의해 수행될 수 있다. 이때, 배양조건은, 특별히 이에 제한되지 않으나, 염기성 화합물 (예: 수산화나트륨, 수산화칼륨 또는 암모니아) 또는 산성 화합물 (예: 인산 또는 황산)을 사용하여 적정 pH (예컨대, pH 5 내지 9, 구체적으로는 pH 6 내지 8)를 조절할 수 있고, 산소 또는 산소-함유 가스 혼합물을 배양물에 도입시켜 호기성 조건을 유지할 수 있다. 배양온도는 20 내지 45℃, 또는 25 내지 40℃를 유지할 수 있고, 약 10 내지 160 시간 동안 배양할 수 있으나, 이에 제한되는 것은 아니다. 상기 배양에 의하여 생산된 L-히스티딘은 배지 중으로 분비되거나 세포 내에 잔류할 수 있다.

상기 배양에 사용 가능한 배지는 탄소 공급원으로 당 및 탄수화물 (예: 글루코오스, 슈크로오스, 락토오스, 프럭토오스, 말토오스, 몰라세, 전분 및 셀룰로오스), 유지 및 지방 (예: 대두유, 해바라기씨유, 땅콩유 및 코코넛유), 지방산 (예: 팔미트산, 스테아르산 및 리놀레산), 알코올 (예: 글리세롤 및 에탄올), 유기산 (예: 아세트산) 등으로 이루어진 군에서 선택된 1종 이상을 개별적으로 사용하거나 또는 2종 이상을 혼합하여 사용할 수 있으나, 이에 제한되지 않는다. 질소 공급원으로는 질소-함유 유기 화합물 (예: 펩톤, 효모 추출액, 육즙, 맥아 추출액, 옥수수 침지액, 대두 박분 및 우레아), 무기 화합물 (예: 황산암모늄, 염화암모늄, 인산암모늄, 탄산암모늄 및 질산암모늄) 등으로 이루어진 군에서 선택된 1종 이상을 개별적으로 사용하거나 또는 2종 이상을 혼합하여 사용할 수 있으나, 이에 제한되지 않는다. 인 공급원으로 인산이수소칼륨, 인산수소이칼륨, 이에 상응하는 나트륨 함유 염 등으로 이루어진 군에서 선택된 1종 이상을 개별적으로 사용하거나 또는 2종 이상을 혼합하여 사용할 수 있으나, 이에 제한되지 않는다. 또한, 상기 배지는 기타 금속염 (예: 황산마그네슘 또는 황산철), 아미노산, 및/또는 비타민 등과 같은 필수성장-촉진 물질을 포함할 수 있다.

상기 L-히스티딘을 회수하는 단계는 배양방법에 따라 당해 분야에 공지된 적합한 방법을 이용하여 배지, 배양액, 또는 미생물로부터 목적하는 아미노산을 수집하는 것일 수 있다. 예를 들어, 상기 회수하는 단계는 원심분리, 여과, 음이온 교환 크로마토그래피, 결정화, HPLC 등에서 선택된 하나 이상의 방법으로 수행될 수 있다. 상기 L-히스티딘을 회수하는 방법은, 그 이전, 동시, 또는 그 이후에, 정제단계를 추가적으로 포함할 수 있다.

이하 본 발명을 다음의 실시예에 의하여 보다 구체적으로 설명하고자 한다. 그러나 이들은 본 발명을 예시하기 위한 것일 뿐이며, 본 발명의 범위가 이들 실시예에 의하여 제한되는 것은 아니다.

실시예 1. 외래 히스티딘 배출 유전자 탐색 및 후보 선별

L-히스티딘 특이 배출능을 갖는 단백질 후보를 선별하기 위하여 분류별 아미노산(염기 아미노산: L-라이신(L-lys), 방향족 아미노산: 트립토판(Trp), 곁가지 아미노산: 이소류신(Ile))에 대한 배출 단백질(LysE(Arch Microbiol 180: 155-160), Wex(대한민국 등록특허 제10-1968317호), BrnFE(Arch Microbiol 180: 155-160))의 아미노산 서열을 query 서열로 하고, NCBI와 Kegg database를 기반으로 PSI-BLAST 탐색 결과, L-히스티딘을 배출할 가능성이 있는 막단백질로 예측되는 후보 유전자들과 이를 보유하는 미생물을 선정하였다.

이 중 생산 균주에 적용 가능한 정도의 생물 안전도 (Biosafety level)와 확보 가능성을 고려하여, 아래 표 1 과 같이 LysE 기반 1종, Wex 기반 3종, BrnFE 기반 2종의 단백질, 이를 암호화하는 유전자, 및 이를 포함하는 미생물을 선정하였다:

L-히스티딘 배출자 후보 list

	No.	균 주	Protein Ref Seq.	gDNA Ref Seq.	생물 안전도	아미노산 서열	핵산 서열
Wex 기반	1	Herbaspirillum aquaticum (KCTC42001)	WP_088757482.1	NZ_NJGV01000035.1	1	서열번호 1	서열번호 2
	2	Cupriavidus pinatubonensis (KCTC22125)	WP_041680244.1	CP000091.1	1	서열번호 3	서열번호 4
	3	Kluyvera cryocrescens(KCTC2580)	WP_052283291.1	NZ_LGHZ01000014.1	1	서열번호 5	서열번호 6
LysE 기반	4	Corynebacterium stationis (ATCC6872)	WP_066837457.1	CP014279.1	1	서열번호 7	서열번호 8
BrnFE 기반	5	Leucobacter salsicius (KCTC19904)	WP_026139602.1	NZ_AOCN01000022.1	1	서열번호 9	서열번호 11
	5	Leucobacter salsicius (KCTC19904)	WP_083879221.1	NZ_AOCN01000022.1	1	서열번호 10	서열번호 11
	6	Dermabacter vaginalis (KCTC39585)	WP_065248528.1 (DvaF)	NZ_CP012117.1	1	서열번호 12	서열번호 14
			WP_065248527.1(DvaE)			서열번호 13	서열번호 15
			DvaFE			서열번호 12 및 13	서열번호 16 (DvaFE 오페론)

(상기 표 1에서, 생물안전도는 미국의 Centers for Disease Control and Prevention에서 정의한 미생물 병원성 지표 (level 1~4)에 따른 것임 (level이 낮을수록 안전함)

실시예 2. 외래 L-히스티딘 배출 유전자 후보 도입 벡터 및 이를 도입한 재조합 코리네박테리움 속 균주 제작

상기 실시예 1에서 선정한 외래 L-히스티딘 배출 유전자 후보 6종을 코리네박테리움 속 균주에 도입하기 위한 벡터 6종을 제작하였다.

실시예 2-1. 타겟 유전자 삽입용 벡터 pDZΔN2131 제작

외래 L-히스티딘 배출 유전자 후보들을 도입하기 위하여, 코리네박테리움 글루타미쿰의 트렌스포존을 코딩하는 유전자 중 NCgl2131 유전자를 삽입 site로 사용하였다(Journal of Biotechnology 104, 5-25 Jorn Kalinowski et al, 2003). 또한 외래 L-히스티딘 배출 유전자 후보들이 코리네박테리움 유래 gapA 유전자의 프로모터(이하, PgapA, 서열번호 17) 하에서 발현되도록 설계하였다.

NCgl2131 유전자를 배출자 유전자들로 치환하기 위하여 NCgl2131 결손 및 타겟 유전자 삽입 벡터를 제작하였다. 벡터를 제작하기 위해, 코리네박테리움 글루타미쿰 균주 ATCC13032의 염색체를 주형으로 하여 서열번호 18 과 서열번호 19, 서열번호 20과 서열번호 21의 프라이머 쌍을 각각 이용하여 PCR을 각각 수행하였다. PCR 반응을 위한 중합효소로는 PfuUltraTM 고-신뢰 DNA 폴리머라제(Stratagene)를 사용하였으며, PCR 조건은 다음과 같이 하였다: 변성 95℃, 30초; 어닐링 55℃, 30초; 및 중합반응 72℃, 2분을 28회 반복한 후, 72℃에서 5분간 중합반응을 수행한 결과 각각 531bp의 del-N2131L(서열번호 22)와 555bp의 del-N2131R(서열번호 23)의 DNA 단편을 수득하였다. 수득한 DNA 산물을 QIAGEN사의 PCR Purification kit를 사용하여 정제한 후 pDZ 벡터(대한민국 등록특허 제10-0924065호)와 다카라(TaKaRa)의 Infusion Cloning Kit를 사용하여 클로닝하여, NCgl2131유전자결손 및 타겟 유전자 삽입용 벡터 pDZΔN2131을 제작하였다.

실시예 2-2. 외래 L-히스티딘 배출 유전자 후보 도입 벡터 6종 제작

Herbaspirillum aquaticum 유래 단백질(이하, Haq, 서열번호 1)를 코딩하는 유전자(이하, haq, 서열번호 2)의 염기서열 정보를 미국보건원 진뱅크(NIH GenBank)로부터 획득하였다. haq를 증폭시키기 위하여 Herbaspirillum aquaticum 균주(KCTC42001)의 염색체 DNA를 주형으로 하여 서열번호 24와 서열번호 25의 프라이머 쌍을 이용하여 PCR을 수행하였다. PCR 반응을 위한 중합효소로는 PfuUltraTM 고-신뢰 DNA 폴리머라제(Stratagene)를 사용하였으며, PCR 조건은 다음과 같이 하였다: 변성 95℃, 30초; 어닐링 55℃, 30초; 및 중합반응 72℃, 2분을 28회 반복한 후, 72℃에서 5분간 중합반응을 수행한 결과 945bp의 haq (서열번호 2)를 포함한 977bp의 haq 단편을 수득하였다. haq와 연결 가능한 PgapA 단편을 수득하기 위하여, ATCC13032의 염색체를 주형으로 하여 서열번호 26과 서열번호 27의 프라이머 쌍을 이용하여 PCR을 수행하였다. PCR 반응을 위한 중합효소로는 PfuUltraTM 고-신뢰 DNA 폴리머라제(Stratagene)를 사용하였으며, PCR 조건은 다음과 같이 하였다: 변성 95℃, 30초; 어닐링 55℃, 30초; 및 중합반응 72℃, 1분을 28회 반복한 후, 72℃에서 5분간 중합반응을 수행한 결과 409bp의 PgapA(서열번호 17)를 포함한 441bp의 PgapA 단편을 수득하였다. 상기 수득된 haq 단편과 PgapA 단편, 그리고 ScaI 제한효소로 절단된 pDZΔN2131 벡터를 깁슨 어셈블리 (DG Gibson et al., NATURE METHODS, VOL.6 NO.5, MAY 2009, NEBuilder HiFi DNA Assembly Master Mix) 방법을 이용하여 클로닝하여, 재조합 플라스미드를 획득하였으며, 이를 pDZΔN2131-PgapA-Haq로 명명하였다.

Cupriavidus pinatubonensis 유래 단백질(이하, Cpi, 서열번호 3)를 코딩하는 유전자(이하, cpi, 서열번호 4)의 염기서열 정보를 미국보건원 진뱅크(NIH GenBank)로부터 획득하였다. Cupriavidus pinatubonensis 유래 cpi를 증폭시키기 위하여, Cupriavidus pinatubonensis 균주(KCTC22125)의 염색체 DNA를 주형으로 하여 서열번호 28와 서열번호 29의 프라이머 쌍을 이용하여 PCR을 수행하였다. PCR 반응을 위한 중합효소로는 PfuUltraTM 고-신뢰 DNA 폴리머라제(Stratagene)를 사용하였으며, PCR 조건은 다음과 같이 하였다: 변성 95℃, 30초; 어닐링 55℃, 30초; 및 중합반응 72℃, 2분을 28회 반복한 후, 72℃에서 5분간 중합반응을 수행. 그 결과 945bp의 cpi(서열번호 4)를 포함한 977bp의 cpi 단편을 수득하였다. cpi와 연결 가능한 PgapA 단편을 수득하기 위하여, ATCC13032의 염색체를 주형으로 하여 서열번호 26과 서열번호 30의 프라이머 쌍을 이용하여 PCR을 수행하였다. PCR 반응을 위한 중합효소로는 PfuUltraTM 고-신뢰 DNA 폴리머라제(Stratagene)를 사용하였으며, PCR 조건은 다음과 같이 하였다: 변성 95℃, 30초; 어닐링 55℃, 30초; 및 중합반응 72℃, 1분을 28회 반복한 후, 72℃에서 5분간 중합반응을 수행한 결과 409bp의 PgapA(서열번호 17)를 포함한 441bp의 PgapA 단편을 수득하였다. 상기 수득된 cpi 단편과 PgapA 단편, 그리고 ScaI 제한효소로 절단된 pDZΔN2131 벡터를 깁슨 어셈블리 방법을 이용하여 클로닝하여, 재조합 플라스미드를 획득하였으며, 이를 pDZΔN2131-PgapA-Cpi로 명명하였다.

Kluyvera cryocrescens 유래 단백질(이하, Kcr, 서열번호 5)를 코딩하는 유전자(이하, kcr, 서열번호 6)의 염기서열 정보를 미국보건원 진뱅크(NIH GenBank)로부터 획득하였다. Kluyvera cryocrescens 유래 kcr를 증폭시키기 위하여, Kluyvera cryocrescens 균주(KCTC2580)의 염색체 DNA를 주형으로 하여 서열번호 31와 서열번호 32의 프라이머 쌍을 이용하여 PCR을 수행하였다. PCR 반응을 위한 중합효소로는 PfuUltraTM 고-신뢰 DNA 폴리머라제(Stratagene)를 사용하였으며, PCR 조건은 다음과 같이 하였다: 변성 95℃, 30초; 어닐링 55℃, 30초; 및 중합반응 72℃, 2분을 28회 반복한 후, 72℃에서 5분간 중합반응을 수행한 결과 882bp의 kcr(서열번호 6)를 포함한 914bp의 kcr단편을 수득하였다. kcr와 연결 가능한 PgapA 단편을 수득하기 위하여, ATCC13032의 염색체를 주형으로 서열번호 26과 서열번호 33의 프라이머 쌍을 이용하여 PCR을 수행하였다. PCR 반응을 위한 중합효소로는 PfuUltraTM 고-신뢰 DNA 폴리머라제(Stratagene)를 사용하였으며, PCR 조건은 다음과 같이 하였다: 변성 95℃, 30초; 어닐링 55℃, 30초; 및 중합반응 72℃, 1분을 28회 반복한 후, 72℃에서 5분간 중합반응을 수행. 그 결과 409bp의 PgapA(서열번호 17)를 포함한 441bp의 PgapA 단편을 수득하였다. 상기 수득된 kcr 단편과 PgapA 단편, 그리고 ScaI 제한효소로 절단된 pDZΔN2131 벡터를 깁슨 어셈블리 방법을 이용하여 클로닝하여, 재조합 플라스미드를 획득하였으며, 이를 pDZΔN2131-PgapA-Kcr로 명명하였다.

Corynebacterium stationis 유래 단백질(이하, Cst, 서열번호 7)를 코딩하는 유전자(이하, cst, 서열번호 8)의 염기서열 정보를 미국보건원 진뱅크(NIH GenBank)로부터 획득하였다. Corynebacterium stationis 유래 cst를 증폭시키기 위하여, Corynebacterium stationis 균주(ATCC6872)의 염색체 DNA를 주형으로 하여 서열번호 34와 서열번호 35의 프라이머 쌍을 이용하여 PCR을 수행하였다. PCR 반응을 위한 중합효소로는 PfuUltraTM 고-신뢰 DNA 폴리머라제(Stratagene)를 사용하였으며, PCR 조건은 다음과 같이 하였다: 변성 95℃, 30초; 어닐링 55℃, 30초; 및 중합반응 72℃, 2분을 28회 반복한 후, 72℃에서 5분간 중합반응을 수행한 결과 717bp의 cst (서열번호 8)를 포함한 749bp의 cst 단편을 수득하였다. cst 와 연결 가능한 PgapA 단편을 수득하기 위하여, ATCC13032의 염색체를 주형으로 서열번호 26과 서열번호 36의 프라이머 쌍을 이용하여 PCR을 수행하였다. PCR 반응을 위한 중합효소로는 PfuUltraTM 고-신뢰 DNA 폴리머라제(Stratagene)를 사용하였으며, PCR 조건은 다음과 같이 하였다: 변성 95℃, 30초; 어닐링 55℃, 30초; 및 중합반응 72℃, 1분을 28회 반복한 후, 72℃에서 5분간 중합반응을 수행하였다. 그 결과 409bp의 PgapA(서열번호 17)를 포함한 441bp의 PgapA 단편을 수득하였다. 수득된 cst 단편과 PgapA 단편, 그리고 ScaI 제한효소로 절단된 pDZΔN2131 벡터를 깁슨 어셈블리 방법을 이용하여 클로닝하여, 재조합 플라스미드를 획득하였으며, 이를 pDZΔN2131-PgapA-Cst로 명명하였다.

Leucobacter salsicius 유래 단백질(이하, LsaFE, 서열번호 9, 10)를 코딩하는 오페론(이하, lsa, 서열번호 11)의 염기서열 정보를 미국보건원 진뱅크(NIH GenBank)로부터 획득하였다. Leucobacter salsicius 유래 lsa 를 증폭시키기 위하여 Leucobacter salsicius 균주(KCTC19904)의 염색체 DNA를 주형으로 하여 서열번호 37와 서열번호 38의 프라이머 쌍을 이용하여 PCR을 수행하였다. PCR 반응을 위한 중합효소로는 PfuUltraTM 고-신뢰 DNA 폴리머라제(Stratagene)를 사용하였으며, PCR 조건은 다음과 같이 하였다: 변성 95℃, 30초; 어닐링 55℃, 30초; 및 중합반응 72℃, 2분을 28회 반복한 후, 72℃에서 5분간 중합반응을 수행한 결과 1048bp의 lsa (서열번호 11)를 포함한 1080bp의 lsa 단편을 수득하였다. lsa 와 연결 가능한 PgapA 단편을 수득하기 위하여, ATCC13032의 염색체를 주형으로 서열번호 26과 서열번호 39의 프라이머 쌍을 이용하여 PCR을 수행하였다. PCR 반응을 위한 중합효소로는 PfuUltraTM 고-신뢰 DNA 폴리머라제(Stratagene)를 사용하였으며, PCR 조건은 다음과 같이 하였다: 변성 95℃, 30초; 어닐링 55℃, 30초; 및 중합반응 72℃, 1분을 28회 반복한 후, 72℃에서 5분간 중합반응을 수행한 결과 409bp의 PgapA(서열번호 17)를 포함한 441bp의 PgapA 단편을 수득하였다. 수득된 lsa 단편과 PgapA 단편, 그리고 ScaI 제한효소로 절단된 pDZΔN2131 벡터를 깁슨 어셈블리 방법을 이용하여 클로닝하여, 재조합 플라스미드를 획득하였으며, 이를 pDZΔN2131-PgapA-Lsa로 명명하였다.

Dermabacter vaginalis 유래 단백질(이하, DvaFE, 서열번호 12, 13)를 코딩하는 오페론(이하, dva, 서열번호 16)의 염기서열 정보를 미국보건원 진뱅크(NIH GenBank)로부터 획득하였다. Dermabacter vaginalis 유래 dva 를 증폭시키기 위하여, Dermabacter vaginalis 균주(KCTC39585)의 염색체 DNA를 주형으로 하여 서열번호 40와 서열번호 41의 프라이머 쌍을 이용하여 PCR을 수행하였다. PCR 반응을 위한 중합효소로는 PfuUltraTM 고-신뢰 DNA 폴리머라제(Stratagene)를 사용하였으며, PCR 조건은 다음과 같이 하였다: 변성 95℃, 30초; 어닐링 55℃, 30초; 및 중합반응 72℃, 2분을 28회 반복한 후, 72℃에서 5분간 중합반응을 수행한 결과 1081bp의 dva (서열번호 16)를 포함한 1113bp의 dva 단편을 수득하였다. dva 와 연결 가능한 PgapA 단편을 수득하기 위하여, ATCC13032의 염색체를 주형으로 서열번호 26과 서열번호 42의 프라이머 쌍을 이용하여 PCR을 수행하였다. PCR 반응을 위한 중합효소로는 PfuUltraTM 고-신뢰 DNA 폴리머라제(Stratagene)를 사용하였으며, PCR 조건은 다음과 같이 하였다: 변성 95℃, 30초; 어닐링 55℃, 30초; 및 중합반응 72℃, 1분을 28회 반복한 후, 72℃에서 5분간 중합반응을 수행한 결과 409bp의 PgapA(서열번호 17)를 포함한 441bp의 PgapA 단편을 수득하였다. 수득된 dva 단편과 PgapA 단편, 그리고 ScaI 제한효소로 절단된 pDZΔN2131 벡터를 깁슨 어셈블리 방법을 이용하여 클로닝하여 재조합 플라스미드를 획득하였으며, 이를 pDZΔN2131-PgapA-Dva로 명명하였다.

실시예 2-3. 재조합 코리네박테리움 속 균주 제작

상기 외래 L-히스티딘 배출 유전자 후보들의 L-히스티딘 배출능을 확인하기 위하여, 상기 제작된 NCgl2131 결손 벡터(pDZΔN2131), 외래 L-히스티딘 배출 유전자 후보 도입 벡터 6종(pDZΔN2131-PgapA-Haq, pDZΔN2131-PgapA-Cpi, pDZΔN2131-PgapA-Kcr, pDZΔN2131-PgapA-Cst, pDZΔN2131-PgapA-Lsa, pDZΔN2131-PgapA-Dva)을 각각 코리네박테리움 글루타미쿰 ATCC13032 균주에 도입하였다. 보다 구체적으로, 상기 벡터들을 각각 ATCC13032 균주에 전기천공법으로 형질전환하고, 2차 교차 과정을 거쳐 염색체 상의 NCgl2131 유전자가 결손 되거나 L-히스티딘 배출유전자 후보로 치환되어 있는 7종의 재조합 균주를 제작하였으며, 이들을 각각 ATCC13032ΔN2131 (N2131 유전자 결손), ATCC13032ΔN2131::Haq (N2131 유전자가 haq로 치환), ATCC13032ΔN2131::Cpi (N2131 유전자가 cpi로 치환), ATCC13032ΔN2131::Kcr (N2131 유전자가 kcr로 치환), ATCC13032ΔN2131::Cst (N2131 유전자가 cst로 치환), ATCC13032ΔN2131::Lsa (N2131 유전자가 lsa로 치환), 및 ATCC13032ΔN2131::Dva (N2131 유전자가 dva로 치환)로 명명하였다.

실시예 3. 외래 L-히스티딘 배출 유전자 후보 도입 코리네박테리움 속 균주들의 MIC 측정

상기 실시예 2에서 제작된 7종의 재조합 코리네박테리움 글루타미쿰 균주 (ATCC13032ΔN2131, ATCC13032ΔN2131::Haq, ATCC13032ΔN2131::Cpi, ATCC13032ΔN2131::Kcr, ATCC13032ΔN2131::Cst, ATCC13032ΔN2131::Lsa, 및 ATCC13032ΔN2131::Dva)들의 L-히스티딘 배출능 활성의 보유여부 확인을 위하여, L-히스티딘을 이용한 최소저지농도 (minimum inhibitory concentration, MIC) 실험을 수행하였다. 7종의 균주들을 최소 액체 배지에 30℃에서 24시간 동안 배양한 후, 1 X 10³과 1 X 10⁴ 개의 세포로 희석하여 L-히스티딘이 첨가된 최소 고체 배지에서 스포팅 (spotting) 배양하였다. 상기 사용된 최소 고체 배지 조성은 다음과 같다:

최소 배지 (pH 7.2)

포도당 10 g, KH₂PO₄ 1 g, K₂HPO₄ 2 g, MgSO₄ 7H₂O 0.4 g, 요소 2 g, (NH₄)₂SO₄ 5 g, NaCl 0.5 g, 니코틴아미드 5 ㎍, 칼슘-판토텐산 0.1 ㎍, 비오틴 0.2 ㎍, 티아민 HCl 3 ㎍, Trace elements solution* 1ml (증류수 1 리터 기준), Agar 20 g

*Trace elements solution

Na₂B₄O₇ 10H₂O 0.09 g, (NH₄)₆Mo₇O₂₇ 4H₂O 0.04 g, ZnSO₄ 7H₂O 0.01 g, CuSO₄ 5H₂O 0.27 g, MnCl₂ 4H₂O 0.01 g, FeCl₃ 6H₂O 1 g, CaCl₂ 0.01 g (증류수 1 리터 기준)

최소저지농도 실험을 위해, 1 g/L의 L-히스티딘을 최소 고체 배지에 첨가하였고, 48시간 후 세포의 성장을 관찰하여, 그 결과를 하기의 표 2에 나타내었다:

L-히스티딘이 포함된 최소배지에서 외래 L-히스티딘 배출 유전자 후보 도입 코리네박티리움 속 균주들의 성장 정도

균주	L-히스티딘 미포함 최소배지	L-히스티딘 1 g/L 포함 최소배지
ATCC13032ΔN2131	++++	+
ATCC13032ΔN2131::Haq	++++	+
ATCC13032ΔN2131::Cpi	++++	+
ATCC13032ΔN2131::Kcr	++++	+
ATCC13032ΔN2131::Cst	++++	+
ATCC13032ΔN2131::Lsa	++++	+
ATCC13032ΔN2131::Dva	++	+++

(표 2에서, + 개수는 균주들의 상대적 성장 정도를 나타내는 것으로, 각각 다음을 나타냄:+ : single colony는 형성되지 못하나 heavy(single colony로 성장되지 못하고 뭉쳐서 자라는 형태)는 형성됨;

++ : heavy 형성되고 single colony 5개 미만 형성됨;

+++ : heavy 형성되고 single colony 50개 미만 형성됨;

++++ : heavy가 single colony 구분되지 않게 형성됨)

상기 표 2에 나타난 바와 같이, ATCC13032ΔN2131::Dva 균주를 제외한 모든 균주가 L-히스티딘 미포함 최소배지에서 원활히 성장하였다. 그러나 L-히스티딘이 1g/L 포함된 최소배지에서는 대부분의 L-히스티딘 배출 후보 유전자들이 도입된 균주들의 성장이 미미했으며, Dermabacter vaginalis 유래 유전자가 도입된 ATCC13032ΔN2131::Dva 균주만 ATCC13032ΔN2131 대비 월등한 성장을 보였다. 이는, 도입된 Dermabacter vaginalis 유래 단백질이 최소저지농도 이상의 L-히스티딘 포함 배지에서도 L-히스티딘 배출능을 가질 수 있음을 보여준다.

이로부터 Dermabacter vaginalis 유래 단백질 Dva를 코리네박테리움 균주에 최소저지농도 이상의 L-히스티딘에 대한 내성을 부여하며 L-히스티딘 특이 배출능을 갖는 단백질로 선택하였다.

실시예 4. 코리네박테리움 유래 L-히스티딘 생산 균주(KCCM 80179) 기반 Dermabacter vaginalis 유래 유전자( dva) 도입 균주 제작 및 L-히스티딘 생산능 평가

Dermabacter vaginalis 유래 단백질 Dva의 L-히스티딘 배출능을 확인하기 위하여, Dermabacter vaginalis 유래 유전자 dva를 L-히스티딘 생산균주 KCCM 80179(대한민국 공개특허 제10-2019-0065984호) 균주에 도입하였다.

이를 위하여, 실시예 2에서 제작된 벡터 pDZΔN2131, 및 pDZΔN2131-PgapA-Dva를 각각 KCCM80179 균주에 전기천공법으로 형질전환하고, 2차 교차 과정을 거쳐 염색체 상의 NCgl2131 유전자가 결손 되거나 L-히스티딘 배출 유전자 후보 (dva)로 치환되어 있는 균주 2종을 제작하였으며, 이를 각각 KCCM 80179ΔN2131 (NCgl2131 유전자가 결손) 및 KCCM 80179ΔN2131-PgapA-Dva (NCgl2131 유전자가 dva로 치환)으로 명명하였다.

상기 제작된 KCCM 80179ΔN2131 및 KCCM 80179ΔN2131-PgapA-Dva 균주의 L-히스티딘 생산능을 확인하기 위하여, 다음과 같은 방법으로 배양하였다: KCCM 80179ΔN2131 및 KCCM 80179ΔN2131-PgapA-Dva 균주를 활성화 배지에서 16시간 동안 배양한 후, 종 배지 25 ㎖을 함유하는 250 ㎖ 코너-바플 플라스크에 각 균주들을 접종하고, 30 ℃에서 20 시간 동안, 200 rpm으로 진탕 배양하였다. 그런 다음, 생산 배지 25 ㎖을 함유하는 250 ㎖ 코너-바플 플라스크에 1 ㎖의 종 배양액을 접종하고 30 ℃에서 48시간 동안, 200 rpm에서 진탕 배양하였다. 상기 배양에 사용된 배지 조성은 다음과 같다:

<활성화 배지>

육즙 1%(w/v), 폴리펩톤 1%(w/v), 소듐클로라이드 0.5%(w/v), 효모엑기스 1%(w/v), 한천 2%(w/v), pH 7.2

<종 배지>

포도당 5%(w/v), 박토펩톤 1%(w/v), 소듐클로라이드 0.25%(w/v), 효모엑기스 1%(w/v), 요소 0.4%(w/v), pH 7.2

<생산 배지>

포도당 10%(w/v), 황산암모늄 2%(w/v), 제1인산칼륨 0.1%(w/v), 황산마그네슘7수염 0.05%(w/v), CSL(옥수수 침지액) 2.0%(w/v), 비오틴 200 ㎍/L, 탄산칼슘, pH 7.2,

배양 종료 후, HPLC에 의해 L-히스티딘 생산량 (배지 내 히스티딘 함량)을 측정하여, 그 결과를 다음의 표 3에 나타내었다:

KCCM 80179 유래 Dermabacter vaginalis 유래 유전자 도입 균주의 L-히스티딘 생산량

	Cell OD ₆₀₀	사용한 포도당 (g/L)	히스티딘 생산량 (g/L)
KCCM 80179	51.4	100	14.1
KCCM 80179ΔN2131	51.6	100	13.9
KCCM 80179ΔN2131-PgapA-Dva	42.6	100	17.1

상기 표 3에 나타난 바와 같이, NCgl2131 결손 균주는 모균주인 KCCM 80179 균주와 동등 정도의 L-히스티딘 생산능을 가지는 반면, Dermabacter vaginalis 유래 유전자가 도입된 KCCM 80179ΔN2131-PgapA-Dva 균주는 NCgl2131 결손 균주 및 모균주인 KCCM 80179 균주 대비 L-히스티딘 생산능이 각각 23% 및 21% 이상 증가됨을 확인하였다.

상기 실시예 3 및 4의 결과를 통해, Dermabacter vaginalis 유래 유전자 도입을 통해 최소저해농도 이상의 L-히스티딘 농도에 대한 내성이 증가될 뿐만 아니라, L-히스티딘 생산능도 크게 증가됨을 확인하였다. 이러한 결과는 Dermabacter vaginalis 유래 단백질이 L-히스티딘을 특이적으로 배출할 수 있는 L-히스티딘 배출 단백질임을 입증한다.

실시예 5. Dermabacter vaginalis 유래 L-히스티딘 배출자 유사 단백질 추가 확보

상기 실시예 3과 4에서 Dermabacter vaginalis 유래 단백질의 L-히스티딘 배출능을 확인하였으므로, 상기 단백질과 아미노산 서열 상동성이 높은 유사 단백질을 추가로 확보하기 위하여, DvaFE 중 DvaF의 서열(서열번호 12)을 query로 이용하여 BLAST 탐색을 수행하였다 (표 4 참조).

상기 BLAST 탐색 결과를 바탕으로 60% 이상의 서열 상동성을 나타내고 Dermabacter 속에 속하지 않는 L-히스티딘 배출자 후보 1종을 추가로 선정하여, 다음의 표 5에 나타내었다:

L-히스티딘 배출자 추가 후보 리스트

No.	균 주	Protein Ref Seq.	gDNA Ref Seq.	생물 안전도	단백질 서열	유전자 서열
7	Helcobacillus massiliensis	WP_055090792.1 (HmaF)	NZ_CYUG01000017.1	2	서열번호 43	서열번호 45
		WP_055090293.1 (HmaE)			서열번호 44	서열번호 46
		HmaFE			서열번호 43 및 44	서열번호 47(HmaFE 오페론)

실시예 6. 추가 외래 L-히스티딘 배출 유전자 후보 도입 벡터 제작

상기 실시예 5에서 추가 선정된 L-히스티딘 배출 유전자 후보 2종을 코리네박테리움 속 균주에 도입하기 위한 벡터를 제작하였다. 실시예 2와 동일하게 NCgl2131 유전자를 결손 site로, PgapA를 프로모터로 사용하였다.

Helcobacillus massiliensis 유래 단백질(이하, HmaFE, 서열번호 43, 44)을 코딩하는 오페론(이하, hma, 서열번호 47)의 염기서열 정보를 미국보건원 진뱅크(NIH GenBank)로부터 획득하였다. haq DNA를 수득하기 위하여 Bionics 사(社)의 진합성 서비스를 이용하여 DNA를 합성하였다. 합성된 DNA를 증폭하기 위하여 서열번호 48와 서열번호 49의 프라이머 쌍을 이용하여 PCR을 수행하였다. PCR 반응을 위한 중합효소로는 PfuUltraTM 고-신뢰 DNA 폴리머라제(Stratagene)를 사용하였으며, PCR 조건은 다음과 같이 하였다: 변성 95℃, 30초; 어닐링 55℃, 30초; 및 중합반응 72℃, 2분을 28회 반복한 후, 72℃에서 5분간 중합반응을 수행. 그 결과 1081bp의 hma (서열번호 47)를 포함한 1113bp의 hma 단편을 수득하였다. hma 와 연결 가능한 PgapA 단편을 수득하기 위하여, ATCC13032의 염색체를 주형으로 서열번호 26과 서열번호 50의 프라이머 쌍을 이용하여 PCR을 수행하였다. PCR 반응을 위한 중합효소로는 PfuUltraTM 고-신뢰 DNA 폴리머라제(Stratagene)를 사용하였으며, PCR 조건은 다음과 같이 하였다: 변성 95℃, 30초; 어닐링 55℃, 30초; 및 중합반응 72℃, 1분을 28회 반복한 후, 72℃에서 5분간 중합반응을 수행. 그 결과 409bp의 PgapA(서열번호 17)를 포함한 441bp의 PgapA 단편을 수득하였다. 수득된 hma 단편과 PgapA 단편, 그리고 ScaI 제한효소로 절단된 pDZΔN2131 벡터를 깁슨 어셈블리 방법을 이용하여 클로닝하여, 재조합 플라스미드를 획득하였으며, 이를 pDZΔN2131-PgapA-Hma로 명명하였다.

실시예 7. L-히스티딘 생산 균주(KCCM 80179) 기반 Helcobacillus massiliensis 유래 유전자 도입( hma ) 균주 제작 및 L-히스티딘 생산능 평가

Helcobacillus massiliensis 유래 단백질 Hma의 L-히스티딘 배출능을 확인하기 위하여 L-히스티딘 생산균주 KCCM 80179 균주에 도입하였다.

이를 위해 실시예 6에서 제작된 벡터 pDZΔN2131-PgapA-Hma를 KCCM80179 균주에 전기천공법으로 형질전환하고, 2차 교차 과정을 거쳐 염색체 상의 NCgl2131 유전자가 L-히스티딘 배출유전자 후보로 치환되어 있는 균주를 제작하였으며, 이를 KCCM 80179ΔN2131-PgapA-Hma (NCgl2131 유전자가 hma로 치환)으로 명명하였다.

상기 제작된 KCCM 80179ΔN2131-PgapA-Hma 균주의 L-히스티딘 생산능을 확인하기 위하여, 상기 균주를 실시예 4에서 수행한 방법으로 배양하고 L-히스티딘 생산량을 측정하였다. 대조군으로 실시예 4에서 제작된 KCCM 80179ΔN2131 균주와 KCCM 80179ΔN2131-PgapA-Dva 균주에 대하여 동일한 방법으로 배양 및 L-히스티딘 생산량(배지 내 히스티딘 함량) 측정을 수행하였다. 상기 얻어진 결과를 표 6에 나타내었다.

KCCM 80179 유래 Helcobacillus massiliensis 유래 유전자 도입 균주의 L-히스티딘 생산량

	OD	사용한 포도당 (g/L)	히스티딘 생산량 (g/L)
KCCM 80179	50.3	100	14.0
KCCM 80179ΔN2131	51.5	100	13.9
KCCM 80179ΔN2131-PgapA-Dva	40.8	100	17.3
KCCM 80179ΔN2131-PgapA-Hma	43.1	100	16.6

표 6에 나타난 바와 같이, KCCM 80179ΔN2131-PgapA-Hma 균주는 NCgl2131 결손 균주(KCCM 80179ΔN2131) 및 모균주인 KCCM 80179 균주 대비 L-히스티딘 생산량이 각각 19%, 19% 증가하였다. 이러한 결과는 Helcobacillus massiliensis 유래 단백질도 L-히스티딘을 특이적으로 배출할 수 있는 L-히스티딘 배출자로 선별될 수 있음을 보여준다.

실시예 8: 인공돌연변이법을 이용한 Hma 변이 라이브러리 제작

L-히스티딘 배출능이 증가된 변이형 Hma를 획득하기 위하여 1차 crossover용 변이 단백질 발현 벡터 라이브러리를 제작하였다. 이를 위하여 상기 제작된 pDZ ΔN2131-PgapA-Hma를 주형으로 하여 서열번호 48와 서열번호 49의 프라이머 쌍을 이용한 Error-prone PCR법으로 염기치환변이가 무작위적으로 도입된 hma 오페론들을 획득하였다. Error-prone PCR은 GenemorphII Random Mutagenesis Kit(Stratagene)을 사용하여 증폭된 유전자 단편 내에 변이가 1kb당 0 내지 3.5개가 도입되는 조건으로 PCR 수행하였으며, PCR 조건은 변성 96℃, 30초; 어닐링 53℃, 30초; 및 중합반응 72℃, 2분을 30회 반복하였다. hma와 연결 가능한 PgapA 단편을 수득하기 위하여, ATCC13032의 염색체를 주형으로 하여 서열번호 26과 서열번호 50의 프라이머 쌍을 이용하여 PCR을 수행하였다. PCR 반응을 위한 중합효소로는 PfuUltraTM 고-신뢰 DNA 폴리머라제(Stratagene)를 사용하였으며, PCR 조건은 다음과 같이 하였다: 변성 95℃, 30초; 어닐링 55℃, 30초; 및 중합반응 72℃, 1분을 28회 반복한 후, 72℃에서 5분간 중합반응을 수행하여 PgapA 단편을 수득하였다. 상기 수득된 돌연변이 hma 오페론들과 PgapA 단편, 그리고 ScaI 제한효소로 절단된 pDZΔN2131 벡터를 깁슨 어셈블리 (DG Gibson et al., NATURE METHODS, VOL.6 NO.5, MAY 2009, NEBuilder HiFi DNA Assembly Master Mix) 방법을 이용하여 클로닝하였고, DH5α에 형질전환하여 카나마이신(25mg/L)이 포함된 LB 고체배지에 도말하였다. 형질전환된 콜로니 20종을 선별한 후 플라스미드를 획득하여 염기서열을 분석한 결과 평균 2 mutations/kb 빈도로 서로 다른 위치에 변이가 도입된 것을 확인하였다. 약 10,000개의 형질전환된 대장균 콜로니를 취하여 플라스미드를 추출하였고, 이를 pDZΔN2131-PgapA-Hma(mt) 라이브러리로 명명하였다.

실시예 9: Hma 인공돌연변이 라이브러리 도입 및 L-히스티딘 생산능 증가 균주 선별

상기 제작된 ATCC13032ΔN2131 균주를 모균주로 하여 상기 제작된 pDZΔN2131-PgapA-Hma(mt) 라이브러리를 상동염색체 재조합에 의해 형질전환하고 카나마이신(25mg/L)이 포함된 복합평판배지에 도말하여 약 7000개의 콜로니를 확보하였으며, 각 콜로니를 ATCC13032ΔN2131-PgapA-Hma(mt)-1 부터 ATCC13032ΔN2131-PgapA-Hma(mt)-7000까지로 명명하였다.

<복합평판배지 (pH 7.0)>

포도당 10g, Peptone 10g, Beef extract 5g, Yeast extract 5g, Brain Heart Infusion 18.5g, NaCl 2.5g, Urea 2g, Sorbitiol 91g, Agar 20g(증류수 1 리터 기준)

확보된 7000개의 콜로니를 상기 실시예 3에서 수행한 L-히스티딘에 대한 최소저지농도 (minimum inhibitory concentration, MIC) 실험을 수행하였다. 효율적인 스크리닝을 위하여 3g의 L-히스티딘을 포함하는 액체 최소배지를 기반으로 수행하였다. colony를 바로 액체 최소배지 300ul에 접종하여 96-딥 웰 플레이트에서 32˚C, 1000rpm으로 약 18시간 동안 배양한 후 OD600 값을 측정하여 성장이 우수한 colony를 선별하였다. 대조군으로는 상기 제작된 ATCC13032ΔN2131 균주와 ATCC13032ΔN2131::Hma 균주를 사용하였으며 1차 실험을 통하여 251개를 선별하고, 재반복 실험을 통해서 36개의 colony를 선별하였으며, 사용된 배지 성분은 하기와 같다.

액체 최소 배지 (pH 7.2)

포도당 10g, KH₂PO₄ 1 g, K₂HPO₄ 2 g, MgSO₄ 7H₂O 0.4 g, 요소 2 g, (NH₄)₂SO₄ 5 g, NaCl 0.5 g, 니코틴아미드 5 ㎍, 칼슘-판토텐산 0.1 ㎍, 비오틴 0.2 ㎍, 티아민 HCl 3 ㎍, Trace elements solution* 1ml (증류수 1 리터 기준)

*Trace elements solution

최소저지농도 실험을 위해, 3 g/L의 L-히스티딘을 배지에 첨가하여 18hr 배양함

상기 선별된 36개의 colony를 실시예 3에서 수행한 방법으로 고체 배지 기반 스크리닝을 수행하여 L-히스티딘 배출능이 증가된 6종의 colony를 최종 스크리닝 하였으며, 그 결과를 하기의 표 7에 나타내었다:

L-히스티딘이 포함된 최소배지에서 변이 도입 균주들의 성장 정도

균주	L-히스티딘 미포함 최소배지	L-히스티딘 1 g/L 포함 최소배지
ATCC13032ΔN2131	++++	+
ATCC13032ΔN2131::Hma	++++	+++
ATCC13032ΔN2131-PgapA-Hma(mt)-1216	++++	++++
ATCC13032ΔN2131-PgapA-Hma(mt)-2305	++++	++++
ATCC13032ΔN2131-PgapA-Hma(mt)-3411	++++	++++
ATCC13032ΔN2131-PgapA-Hma(mt)-4426	++++	++++
ATCC13032ΔN2131-PgapA-Hma(mt)-5714	++++	++++
ATCC13032ΔN2131-PgapA-Hma(mt)-6718	++++	++++

(표 7에서, + 개수는 균주들의 상대적 성장 정도를 나타내는 것으로, 각각 다음을 나타냄:+ : single colony는 형성되지 못하나 heavy(single colony로 성장되지 못하고 뭉쳐서 자라는 형태)는 형성됨;

++ : heavy 형성되고 single colony 5개 미만 형성됨;

+++ : heavy 형성되고 single colony 50개 미만 형성됨;

++++ : heavy가 single colony 구분되지 않게 형성됨)

상기 표 7에 나타난 바와 같이, NCgl2131 결손 균주(ATCC13032ΔN2131)는 L-히스티딘 1 g/L 포함 최소배지에서 원활하게 성장하지 못하였으나, Helcobacillus massiliensis 유래 유전자가 도입된 ATCC13032ΔN2131::Hma 균주는 원활하게 성장하였고 고체 배지 기반 스크리닝을 수행하여 L-히스티딘 배출능이 증가된 6종의 균주(ATCC13032ΔN2131-PgapA-Hma(mt)-1216, ATCC13032ΔN2131-PgapA-Hma(mt)-2305, ATCC13032ΔN2131-PgapA-Hma(mt)-3411, ATCC13032ΔN2131-PgapA-Hma(mt)-4426, ATCC13032ΔN2131-PgapA-Hma(mt)-5714, 및 ATCC13032ΔN2131-PgapA-Hma(mt)-6718 균주)는 히스티딘 1 g/L 포함 최소배지에서 보다 높은 성장 정도를 확인하였다.

실시예 10. 코리네박테리움 유래 L-히스티딘 생산 균주(KCCM 80179) 기반 선별 라이브러리 도입균주 제작 및 L-히스티딘 생산능 평가

실시예 9에서 선별된 colony 6종이 포함하고 있는 변이형 hma를 L-히스티딘 생산균주에 도입하기 위한 벡터를 제작하였다. 이를 위하여 ATCC13032ΔN2131-PgapA-Hma(mt)-1216, ATCC13032ΔN2131-PgapA-Hma(mt)-2305, ATCC13032ΔN2131-PgapA-Hma(mt)-3411, ATCC13032ΔN2131-PgapA-Hma(mt)-4426, ATCC13032ΔN2131-PgapA-Hma(mt)-5714, ATCC13032ΔN2131-PgapA-Hma(mt)-6718의 염색체 DNA를 주형으로 하여 서열번호 48와 서열번호 49의 프라이머 쌍을 이용한 PCR을 수행하여 변이형 hma종을 획득하였다. PCR 조건은 변성 96℃, 30초; 어닐링 53℃, 30초; 및 중합반응 72℃, 2분을 30회 반복하였다. 변이형 hma과 연결 가능한 PgapA 단편을 수득하기 위하여, ATCC13032의 염색체를 주형으로 하여 서열번호 26과 서열번호 50의 프라이머 쌍을 이용하여 PCR을 수행하였다. PCR 반응을 위한 중합효소로는 PfuUltraTM 고-신뢰 DNA 폴리머라제(Stratagene)를 사용하였으며, PCR 조건은 다음과 같이 하였다: 변성 95℃, 30초; 어닐링 55℃, 30초; 및 중합반응 72℃, 1분을 28회 반복한 후, 72℃에서 5분간 중합반응을 수행하여 PgapA 단편을 수득하였다. 상기 수득된 돌연변이 hma 6종 단편과 PgapA 단편, 그리고 ScaI 제한효소로 절단된 pDZΔN2131 벡터를 깁슨 어셈블리 방법을 이용하여 클로닝하여 재조합 플라스미드를 획득하였으며, 이를 유래 라이브러리 colony에 따라 pDZΔN2131-PgapA-Hma(mt)-1216, pDZΔN2131-PgapA-Hma(mt)-2315, pDZΔN2131- PgapA-Hma(mt)-3411, pDZΔN2131-PgapA-Hma(mt)-4426, pDZΔN2131-PgapA-Hma(mt)-5714, pDZΔN2131-PgapA-Hma(mt)-6718으로 명명하였다.

이후 제작된 벡터를 KCCM 80179 균주에 전기천공법으로 형질전환하고, 2차 교차 과정을 거쳐 변이 hma 6종이 각각 도입된 균주 6종을 제작하였으며, 이를 각각 KCCM80179ΔN2131-PgapA-Hma(mt)-1216, KCCM80179ΔN2131-PgapA-Hma(mt)-2315, KCCM80179ΔN2131-PgapA-Hma(mt)-3411, KCCM80179ΔN2131-PgapA-Hma(mt)-4426, KCCM80179ΔN2131-PgapA-Hma(mt)-5714, KCCM80179ΔN2131-PgapA-Hma(mt)-6718으로 명명하였다.

상기 제작된 균주 6 종의 L-히스티딘 생산능을 확인하기 위하여, 상기 실시예 7에서 제작된 KCCM 80179ΔN2131-PgapA-Hma 균주를 대조군으로 사용하여 실시예 4와 같은 방법으로 측정하였으며, 그 결과를 표 8에 나타내었다:

KCCM 80179 유래 변이 hma 도입 균주 6종의 L-히스티딘 생산량

	Cell OD ₆₀₀	사용한 포도당 (g/L)	히스티딘 생산량 (g/L)
KCCM 80179	51.0	100	13.9
KCCM 80179ΔN2131	51.1	100	14.0
KCCM 80179ΔN2131-PgapA-Hma	43.5	100	16.5
KCCM 80179ΔN2131-PgapA-Hma(mt)-1216	50.1	100	15.1
KCCM 80179ΔN2131-PgapA-Hma(mt)-2315	45.8	100	16.2
KCCM80179ΔN2131-PgapA-Hma(mt)-3411	40.1	100	16.4
KCCM80179ΔN2131-PgapA-Hma(mt)-4426	44.0	100	16.2
KCCM80179ΔN2131-PgapA-Hma(mt)-5714	41.5	100	17.1
KCCM80179ΔN2131-PgapA-Hma(mt)-6718	40.7	100	18.5

상기 표 8에 나타난 바와 같이, NCgl2131 결손 균주(KCCM 80179ΔN2131)는 모균주인 KCCM 80179 균주와 동등 정도의 L-히스티딘 생산능을 가지는 반면, Helcobacillus massiliensis 유래 유전자가 도입된 ATCC13032ΔN2131::Hma 균주는 NCgl2131 결손 균주 및 모균주인 KCCM 80179 균주 대비 L-히스티딘 생산능이 증가하였다.

변이 hma 6종이 각각 도입된 6종의 균주는 NCgl2131 결손 균주 및 모균주인 KCCM 80179 균주 대비 KCCM 80179ΔN2131-PgapA-Hma 균주와 동등하거나 그 이상의 수준으로 L-히스티딘 생산능이 증가하였으며, 특히 KCCM80179ΔN2131-PgapA-Hma(mt)-5714 및 KCCM80179ΔN2131-PgapA-Hma(mt)-6718 균주는 L-히스티딘 생산능이 야생형 hma가 도입된 KCCM 80179ΔN2131-PgapA-Hma 대비 각각 3.6%, 12.1% 증가함을 확인하였다.

실시예 11. L-히스티딘 생산능 증가 변이형 Hma 유전자 변이 확인

상기 실시예 10에서 L-히스티딘 생산능 증가 효과가 확인된 KCCM80179ΔN2131-PgapA-Hma(mt)-6718 균주의 Hma에 도입된 변이를 확인하기 위하여 Hma 변이체의 염기서열을 분석하였다. 염기서열을 결정하기 위해 KCCM80179ΔN2131-PgapA-Hma(mt)-6718 균주의 gDNA를 주형으로 서열번호 18 및 서열번호 21의 프라이머 쌍을 사용하여 PCR을 수행하였다. 염기서열 분석을 통하여 변이형 hma 오페론의 염기서열 및 HmaF 또는 HmaE의 단백질 서열을 확인하고 서열번호 43 또는 서열번호 44의 아미노산 서열과 비교하였으며, 이를 통해 확인된 변이형 HmaFE의 아미노산 서열의 변이 정보를 표 9에 나타내었다.

KCCM80179ΔN2131-PgapA-Hma(mt)-6718 균주 HmaF, HmaE 변이

균주	HmaF (서열번호 43)	HmaE (서열번호 44)
KCCM80179ΔN2131-PgapA-Hma(mt)-6718	I72L, I124V	변이 X

시퀀스 확인 결과, KCCM80179ΔN2131-PgapA-Hma(mt)-6718 균주에 도입된 변이형 HmaFE는 HmaF에 I72L(서열번호 43의 72번째 이소류신(Ile, I)이 류신(Leu, L)으로 변이), I124V(서열번호 43의 124번째 이소류신(Ile, I)이 발린(Val, V)으로 변이) 변이가 도입되어 L-히스티딘 배출능이 증가된 변이형 배출자임을 확인하였다.

상기 결과를 통해, Helcobacillus massiliensis 유래 변이형 배출자 도입을 통해 야생형 대비 최소저해농도 이상의 L-히스티딘 농도에 대한 내성이 증가될 뿐만 아니라, L-히스티딘 생산능도 크게 증가됨을 확인하였다. 이러한 결과는 선별된 Helcobacillus massiliensis 유래 변이 단백질이 L-히스티딘을 특이적으로 배출할 수 있는 변이형 L-히스티딘 배출 단백질임을 입증한다.

실시예 12. L-히스티딘 생산 균주(CA14-737) 기반 Helcobacillus massiliensis 유래 변이 유전자 도입 균주 제작 및 L-히스티딘 생산능 평가

상기 Helcobacillus massiliensis 유래 단백질 Hma 변이체의 L-히스티딘 배출능을 다시 한번 확인하기 위하여, 야생형의 코리네박테리움 글루타미쿰 ATCC13032 유래로 L-히스티딘에 의한 피드백 제한 해소 HisG 폴리펩티드 변이 도입, L-히스티딘 생합성 유전자가 강화된 L-히스티딘 생산균주 CA14-737(KCCM 12411P, 대한민국 공개특허 제10-2019-0065984호) 균주에 도입하였다.

이를 위해 실시예 2와 10에서 제작된 벡터 3종(pDZΔN2131, pDZΔN2131-PgapA-Hma, pDZΔN2131-PgapA-Hma(mt)-6718)을 각각 CA14-737 균주에 전기천공법으로 형질전환하고, 2차 교차 과정을 거쳐 염색체 상의 NCgl2131 유전자가 결손되거나 L-히스티딘 배출유전자로 치환되어 있는 균주 3종을 제작하였으며, 이를 각각 CA14-737ΔN2131, CA14-737ΔN2131-PgapA-Hma, CA14-737ΔN2131-PgapA-Hma(mt)-6718으로 명명하였다.

상기 제작된 CA14-737ΔN2131, CA14-737ΔN2131-PgapA-Hma, CA14-737ΔN2131-PgapA-Hma(mt)-6718 균주의 L-히스티딘 생산능을 확인하기 위하여, 실시예 4에서 수행한 방법으로 배양하고 L-히스티딘 생산량(배지 내 히스티딘 함량)을 측정하여, 그 결과를 다음의 표 10에 나타내었다:

CA14-737 유래 Helcobacillus massiliensis 유래 야생형 유전자 및 변이체 도입 균주의 L-히스티딘 생산량

	OD	사용한 포도당 (g/L)	히스티딘 생산량 (g/L)
CA14-737	90.3	100	4.1
CA14-737ΔN2131	90.5	100	4.0
CA14-737ΔN2131-PgapA-Hma	71.1	100	6.3
CA14-737ΔN2131-PgapA-Hma(mt)-6718	61.5	100	7.3

표 10에 나타난 바와 같이, Helcobacillus massiliensis 유래 유전자가 도입된 CA14-737ΔN2131-PgapA-Hma 균주는 NCgl2131 결손 균주(CA14-737ΔN2131) 및 모균주인 CA14-737 균주 대비 L-히스티딘 생산량이 54% 증가하였고, 변이형 hma가 도입된 CA14-737ΔN2131-PgapA-Hma(mt)-6718 균주는 78% 증가하였다.

이를 통해 Helcobacillus massiliensis 유래 야생형 및 변이형 단백질 모두 L-히스티딘을 특이적으로 배출할 수 있으며, 선별된 변이형 단백질의 경우 야생형 단백질보다 더 높은 배출능을 갖는 L-히스티딘 배출자임을 다시 한번 확인하였다.

실시예 13. Helcobacillus massiliensis 유래 야생형 유전자 및 변이체 대장균 발현용 벡터 제작

상기 Helcobacillus massiliensis 유래 단백질 Hma 및 변이체의 L-히스티딘 배출능을 다양한 균주에 확인하기 위하여 대장균에서 야생형 Hma 및 Hma 변이체를 각각 발현시킬 수 있는 벡터를 제작하였다. 각각의 유전자는 대장균 발현 벡터인 pCC1BAC(이하, pBAC, Epicenter corp.)에 클로닝 되었으며, 외래 L-히스티딘 배출 유전자 후보들이 대장균 균주 MG1655 유래 yccA 유전자의 프로모터(이하. PyccA, 서열번호 51) 하에서 발현되도록 설계하였다.

Helcobacillus massiliensis 유래 단백질 Hma 및 변이형 유전자 단편을 확보하기 위하여 ATCC13032ΔN2131-PgapA-Hma 및 ATCC13032Δ N2131-PgapA-Hma(mt)-6718의 염색체 DNA를 주형으로 하여 서열번호 52와 서열번호 53의 프라이머 쌍을 이용한 각각 PCR을 수행하여 야생형 및 변이형 hma DNA 단편을 획득하였다. PCR 조건은 변성 96℃, 30초; 어닐링 53℃, 30초; 및 중합반응 72℃, 2분을 30회 반복하였다. PyccA 단편을 수득하기 위하여, MG1655의 염색체를 주형으로 하여 서열번호 54과 서열번호 55의 프라이머 쌍을 이용하여 PCR을 수행하였다. PCR 반응을 위한 중합효소로는 PfuUltraTM 고-신뢰 DNA 폴리머라제(Stratagene)를 사용하였으며, PCR 조건은 다음과 같이 하였다: 변성 95℃, 30초; 어닐링 55℃, 30초; 및 중합반응 72℃, 1분을 28회 반복한 후, 72℃에서 5분간 중합반응을 수행하여 PyccA 단편을 수득하였다. 상기 수득된 야생형 및 돌연변이 hma 단편과 PyccA 단편, 그리고 EcoRI 제한효소로 절단된 pBAC 벡터를 깁슨 어셈블리 방법을 이용하여 클로닝하여 재조합 플라스미드를 획득하였으며, 이를 pBAC-PyccA-Hma, pBAC-PyccA-Hma(mt)-6718으로 명명하였다.

실시예 14. 대장균 유래 L-히스티딘 생산 균주 기반 Helcobacillus massiliensis 유래 Hma 야생형 유전자 및 변이체 도입 균주 제작 및 L-히스티딘 생산능 평가

대장균 유래 L-히스티딘 생산 균주를 기반으로 Helcobacillus massiliensis 유래 단백질 Hma 변이체의 L-히스티딘 배출능을 확인하기 위하여, 실시예 13에서 제작된 벡터 2종과 pBAC 벡터를 기 보고된 유전자형(purR 결손, hisL 결손, hisGr; The directed modification of Escherichia coli MG1655 to obtain histidine-producing mutants; Applied Biochemistry and Microbiology, 2013, Vol. 49, No. 2, pp. 130-135)을 갖는 CA14-9003e 균주 (MG1655+ hisGr hisL'_Δ ΔpurR)에 도입한 균주 3종을 제작하였으며, 이를 각각 CA14-9003e/pBAC, CA14-9003e/pBAC-PyccA-Hma, CA14-9003e/pBAC-PyccA-Hma(mt)-6718으로 명명하였다.

상기 제작된 CA14-9003e/pBAC, CA14-9003e/pBAC-PyccA-Hma, CA14-9003e/pBAC-PyccA-Hma(mt)-6718 균주의 L-히스티딘 생산능을 확인하기 위하여, 다음과 같은 방법으로 배양하였다. 균주들을 LB 고체 배지(클로람페니콜 25㎍/ml 포함)에서 16시간 동안 배양한 후, LB 액체 배지 25 ㎖을 함유하는 250 ㎖ 코너-바플 플라스크에 각 균주들을 접종하고, 37 ℃에서 20 시간 동안, 200 rpm으로 진탕 배양하였다. 그런 다음, 대장균 생산 배지(Applied Biochemistry and Microbiology, 2013, Vol. 49, No. 2, pp. 130-135) 25 ㎖을 함유하는 250 ㎖ 코너-바플 플라스크에 1 ㎖의 종 배양액을 접종하고 37 ℃에서 48시간 동안, 200 rpm에서 진탕 배양하였다. 상기 배양에 사용된 배지는 다음과 같다:

<대장균 생산배지>

포도당 4%(w/v), 효모추출액 0.2%(w/v), 황산암모늄 1.6%(w/v), 제2인산칼륨3수염 0.06%(w/v), 황산철7수염 0.0005%(w/v), 황산마그네슘 5수염 0.0005%(w/v), 탄산칼슘, pH 7.2,

배양 종료 후 HPLC에 의해 L-히스티딘 생산량(배지 내 히스티딘 함량)을 측정하여 그 결과를 다음의 표 11에 나타내었다

CA14-9003e 유래 Helcobacillus massiliensis 유래 야생형 및 변이체 도입 균주의 L-히스티딘 생산량

	OD	사용한 포도당 (g/L)	히스티딘 생산량 (g/L)
CA14-9003e/pBAC	24.5	40	2.9
CA14-9003e/pBAC-PyccA-Hma	17.1	40	3.7
CA14-9003e/pBAC-PyccA-Hma(mt)-6718	14.5	40	4.8

표 11에 나타난 바와 같이, 변이형 Hma가 도입된 CA14-9003e/pBAC-PyccA-Hma(mt)-6718 균주는 야생형 Hma 도입주 CA14-9003e/pBAC-PyccA-Hma 균주 대비 L-히스티딘 생산능이 30% 증가됨을 확인하였다.

상기 결과를 통해, Helcobacillus massiliensis 유래 L-히스티딘 배출자 변이체를 코리네박테리움 속 균주 이외의 미생물에 도입시에도 세포 밖으로의 L-히스티딘 배출능이 크게 증가됨을 확인하였다.

이상의 설명으로부터, 본 발명이 속하는 기술분야의 당업자는 본 발명이 그 기술적 사상이나 필수적 특징을 변경하지 않고서 다른 구체적인 형태로 실시될 수 있다는 것을 이해할 수 있을 것이다. 이와 관련하여, 이상에서 기술한 실시 예들은 모든 면에서 예시적인 것이며 한정적인 것이 아닌 것으로서 이해해야만 한다. 본 발명의 범위는 상기 상세한 설명보다는 후술하는 특허 청구범위의 의미 및 범위 그리고 그 등가 개념으로부터 도출되는 모든 변경 또는 변형된 형태가 본 발명의 범위에 포함되는 것으로 해석되어야 한다.

<110> CJ CheilJedang Corporation <120> L-Histidine Export Protein and Method of Producing L-Histidine Using the Same <130> DPP20213974KR <160> 56 <170> koPatentIn 3.0 <210> 1 <211> 314 <212> PRT <213> Artificial Sequence <220> <223> synthetic_Haq protein <400> 1 Met Lys Ser Lys Asn Ala Thr Leu Val Gly Leu Ser Ala Val Val Leu 1 5 10 15 Trp Ser Ala Ile Val Gly Leu Ile Arg Gly Val Ser Glu His Leu Gly 20 25 30 Ala Thr Gly Gly Ala Ala Ala Ile Tyr Thr Val Ala Ser Leu Ile Leu 35 40 45 Leu Val Ser Val Gly Phe Pro Arg Leu Ala Ser Phe Pro Arg Arg Tyr 50 55 60 Leu Leu Trp Gly Ser Val Leu Phe Val Ala Tyr Glu Leu Cys Leu Ser 65 70 75 80 Leu Ser Ile Gly Tyr Ala His Thr Gly Arg Gln Ala Ile Glu Val Gly 85 90 95 Met Val Asn Tyr Leu Trp Pro Thr Phe Thr Leu Val Ala Ala Ile Leu 100 105 110 Phe Gly Gly Gln Arg Ala Thr Leu Leu Val Val Pro Gly Phe Ile Leu 115 120 125 Ser Met Leu Gly Ile Cys Trp Val Leu Gly Gly Asp Gln Gly Leu Asp 130 135 140 Pro Ser Gly Met Leu Ala Asn Ile Arg Asp Asn Pro Leu Ser Tyr Gly 145 150 155 160 Leu Ala Phe Ile Gly Ala Leu Ile Trp Ala Ala Tyr Cys Thr Val Thr 165 170 175 Thr Arg Ile Ala Gln Gly Gln Asn Gly Val Thr Pro Phe Phe Met Leu 180 185 190 Val Ala Leu Ala Leu Trp Val Lys Val Leu Leu Gly Gly His Val Ala 195 200 205 Glu Leu Ser Phe Ser Val Pro Ala Leu Val Tyr Leu Val Leu Ala Ala 210 215 220 Ala Ala Met Gly Leu Gly Tyr Ala Ala Trp Asn Val Gly Ile Leu His 225 230 235 240 Gly Asn Val Thr Val Leu Ala Gly Ala Ser Tyr Phe Ile Pro Val Phe 245 250 255 Ser Ser Ala Leu Ser Ala Leu Leu Leu Arg Ala Pro Leu Pro Thr Ser 260 265 270 Phe Trp Val Gly Ala Ala Leu Val Cys Ala Gly Ser Ile Leu Cys Trp 275 280 285 Arg Ala Thr Arg Ser Leu Asp Leu Ser Lys Glu Pro Ala Ala Arg Ala 290 295 300 Ala Arg Pro Glu Gly Pro Pro Gln Asn Gln 305 310 <210> 2 <211> 945 <212> DNA <213> Artificial Sequence <220> <223> synthetic_Haq gene encoding Haq protein <400> 2 atgaagagca agaacgcaac cctggtcgga ttgagcgcgg tggtactgtg gagtgccatc 60 gtgggcctga tccgtggcgt gagcgagcat ctcggagcca ccggcggggc ggcggccatt 120 tacacggtgg cttcgctgat cctgctggtg tcggtgggat tcccgcgcct ggcgagtttc 180 ccgcgcaggt atctgctatg gggcagcgtg ctgttcgtgg cttatgaatt gtgcctgtcg 240 ctctcgatcg gttatgccca taccggccgc caggccatcg aagtcggcat ggtcaattac 300 ctctggccga ccttcaccct ggtggcggcc atcctcttcg gaggccagcg cgccacgctg 360 ctggtggtgc caggcttcat cctttccatg ctgggcatct gctgggtgct cgggggcgac 420 caggggctgg atccttccgg catgctggcc aatatccgtg acaatccgct gagctacggc 480 ctggccttca tcggggcctt gatctgggcg gcctactgca ccgtgactac ccgcatcgcc 540 caaggccaga acggggtgac gcctttcttc atgctggtgg cattggcatt gtgggtgaag 600 gtgctgctgg gcgggcatgt ggctgaacta tccttcagtg tgcccgcact ggtctacctg 660 gtgctggctg cggcggcgat ggggctgggc tatgcggcct ggaacgtggg catcctgcat 720 ggcaatgtga cagtgctggc cggtgcctcg tatttcatcc cggtcttttc ttcggccttg 780 tcggccttgc tgctacgtgc gccgctgccc acctcgttct gggtgggcgc tgcgctggtg 840 tgcgccgggt cgatcctgtg ctggcgggct acccgcagcc tggatttgtc aaaagaacct 900 gcagcgcggg cggcacgtcc cgaaggccca cctcagaacc aatag 945 <210> 3 <211> 312 <212> PRT <213> Artificial Sequence <220> <223> synthetic_Cpi protein <400> 3 Met Gln Ser Thr Arg Lys Ala Thr Leu Ile Gly Leu Ile Ala Ile Leu 1 5 10 15 Leu Trp Ser Ser Ile Val Gly Leu Ile Arg Gly Val Ser Glu Ser Leu 20 25 30 Gly Ala Thr Gly Gly Ala Ala Met Met Tyr Ser Val Ala Ser Val Leu 35 40 45 Leu Met Leu Thr Val Gly Phe Val Arg Leu Arg Glu Phe Pro Arg Arg 50 55 60 Tyr Leu Val Trp Gly Ser Ile Leu Phe Val Ser Tyr Glu Leu Cys Leu 65 70 75 80 Ser Leu Ser Ile Gly Tyr Ser His Ser Gly Arg Gln Ala Ile Glu Val 85 90 95 Gly Met Val Asn Tyr Leu Trp Pro Ser Phe Thr Met Leu Cys Ala Ile 100 105 110 Ala Phe Asn Lys Gln Lys Ala Asn Val Leu Ile Val Pro Gly Phe Leu 115 120 125 Ile Ala Ile Leu Gly Ile Cys Leu Val Leu Gly Gly Glu Gln Gly Leu 130 135 140 Asp Val Ala Gly Met Val Ala Asn Val Arg Asp Asn Pro Leu Ser Tyr 145 150 155 160 Gly Leu Ala Leu Ala Gly Ala Leu Ile Trp Ala Ala Tyr Cys Thr Val 165 170 175 Thr Asn Arg Ile Ala Gly Gly Asn Asn Gly Val Thr Leu Phe Phe Met 180 185 190 Leu Thr Ala Met Ala Leu Trp Ile Lys Tyr Phe Thr Gly Asp His Ala 195 200 205 Pro Met Ala Phe Thr Tyr His Ala Val Ile Tyr Leu Ala Leu Ala Ala 210 215 220 Ser Ala Met Gly Phe Gly Tyr Pro Ala Trp Asn Val Gly Ile Leu His 225 230 235 240 Gly Asn Val Thr Val Leu Ala Gly Ala Ser Tyr Phe Ile Pro Val Ile 245 250 255 Ser Ala Ala Leu Ala Gly Leu Leu Leu His Ile Pro Leu Ser Leu Ala 260 265 270 Phe Trp Lys Gly Ala Ser Leu Val Cys Ala Gly Ser Val Leu Cys Trp 275 280 285 Leu Ala Thr Arg Ala Arg Lys Val Ala Ala Thr Pro Asp Arg Ala Pro 290 295 300 Val Arg Asp Arg Val Trp Lys Gln 305 310 <210> 4 <211> 939 <212> DNA <213> Artificial Sequence <220> <223> synthetic_Cpi gene encoding Cpi protein <400> 4 atgcaaagca cgcgtaaggc cacgttgatc gggctcattg cgatcctgtt gtggagttcc 60 atcgtcggcc tgatccgcgg cgtcagtgaa agcctcggcg cgaccggtgg cgccgccatg 120 atgtactcgg ttgcctccgt cctgcttatg ctgacggttg gcttcgtgcg tctgcgcgaa 180 tttccgcggc gctatctggt ctggggcagc atcctgttcg tctcctacga actgtgcctg 240 tcgctgtcca tcggctattc gcacagcggc aggcaggcga tcgaggtggg gatggtcaat 300 tacctctggc cgtctttcac catgttgtgc gccatcgcct tcaacaagca gaaggcgaac 360 gttctgatcg tgccgggctt cctgattgcg atcctgggta tctgcctggt gctgggcggc 420 gagcagggtc tggatgttgc aggcatggtg gccaatgtca gggacaatcc gctcagctac 480 ggcctcgctt tagcgggcgc gctgatctgg gcggcctatt gcaccgtgac caacaggatt 540 gccggcggca acaacggcgt cacgctgttt ttcatgctca ccgcaatggc gctgtggatc 600 aagtacttca ccggcgacca tgcgccgatg gctttcacat accacgccgt catctacctg 660 gcactggcag cgtcggcgat gggcttcggc tacccggcgt ggaacgtggg catcctgcac 720 ggcaacgtaa cggtgcttgc cggcgcgtcg tatttcatcc ctgtgatttc agccgcactg 780 gctggcttgc tcttgcatat accgctttcg ctggcgttct ggaaaggcgc gtcgctggta 840 tgcgcggggt ccgtgctgtg ctggttggcg acgcgcgcgc gcaaggtggc tgcaacgccc 900 gaccgtgctc cggtccgcga ccgtgtctgg aagcaatga 939 <210> 5 <211> 293 <212> PRT <213> Artificial Sequence <220> <223> synthetic_Kcr protein <400> 5 Met Asp Lys Lys Arg Ala Thr Leu Ile Gly Phe Ser Ala Ile Ile Leu 1 5 10 15 Trp Ser Thr Met Val Gly Leu Ile Arg Gly Val Ser Glu Gly Leu Gly 20 25 30 Pro Val Gly Gly Ala Ala Met Ile Tyr Ser Leu Ser Gly Leu Leu Leu 35 40 45 Ile Phe Thr Val Gly Phe Pro Gln Leu Arg Gln Ile Pro Pro Arg Tyr 50 55 60 Leu Leu Val Gly Ser Leu Phe Phe Val Ser Tyr Glu Met Cys Leu Ala 65 70 75 80 Leu Ser Leu Gly Tyr Ala Gly Thr Arg Gln Gln Ala Ile Glu Val Gly 85 90 95 Met Val Asn Tyr Leu Trp Pro Ser Leu Thr Ile Leu Phe Ala Ile Ile 100 105 110 Phe Asn Gly Gln Lys Thr Thr Trp Leu Val Ile Pro Gly Leu Leu Leu 115 120 125 Ser Ile Val Gly Val Thr Trp Val Leu Gly Gly Glu His Gly Leu Asp 130 135 140 Leu Ala Glu Ile Arg Ser Asn Val Ile Ser Ser Pro Leu Ser Tyr Ile 145 150 155 160 Leu Ala Phe Val Gly Ala Phe Ile Trp Ala Ala Tyr Cys Thr Val Thr 165 170 175 Ala Lys Tyr Ala Lys Gly Lys Asn Gly Ile Thr Leu Phe Val Leu Phe 180 185 190 Thr Ala Leu Ala Leu Trp Val Lys Phe Leu Met Ser Glu Gln Pro Pro 195 200 205 Met Ile Phe Ser Trp Pro Val Val Ile Lys Leu Val Thr Cys Ala Leu 210 215 220 Ala Leu Gly Phe Ala Tyr Ala Ala Trp Asn Val Gly Ile Leu His Gly 225 230 235 240 Asn Val Ser Leu Leu Ala Ala Ala Ser Tyr Phe Thr Pro Val Leu Ser 245 250 255 Ser Ala Leu Ala Ala Phe Leu Leu Ser Ala Ala Leu Ser Trp Ser Phe 260 265 270 Trp Gln Gly Ala Ala Met Val Cys Gly Gly Ser Leu Leu Cys Trp Tyr 275 280 285 Ala Thr Arg Arg Pro 290 <210> 6 <211> 371 <212> DNA <213> Artificial Sequence <220> <223> synthetic_Kcr gene encoding Kcr protein <400> 6 atggataaga aaagagcgac gctcattgga tttagcgcca ttattttgtg gagtacgatg 60 gtgggtctga ttcgcggcgt aagcgaaggg ctcggcccgg tgggcggagc cgcaatgatt 120 tacagcctca gcggcctgct gctgattttt accgttggct tcccacaatt gcgccaaatt 180 ccaccgcgct atttgctggt aggtagcctg ttttttgtca gctacgaaat gtgcctcgcg 240 ctctcattag gctatgccgg cactcgccaa caggccatcg aagtcggcat ggtgaattat 300 ctctggccta gcctgacgat tttatttgcg attatcttta atggtcaaaa aaccacctgg 360 ctggttatcc c 371 <210> 7 <211> 238 <212> PRT <213> Artificial Sequence <220> <223> synthetic_Cst protein <400> 7 Met Ser Thr Leu Ser Ile Leu Ile Ala Gly Phe Ala Leu Gly Leu Ser 1 5 10 15 Leu Ile Val Ala Ile Gly Pro Gln Asn Ala Leu Leu Ile Lys Gln Gly 20 25 30 Ile Lys Arg Glu His Val Trp Val Val Ile Ala Ile Cys Ala Val Ser 35 40 45 Asp Ile Ile Leu Ile Ser Gly Gly Thr Ala Gly Val Gly Tyr Leu Val 50 55 60 Glu Thr Phe Pro Thr Ala Leu Val Val Leu Lys Tyr Leu Gly Ala Ile 65 70 75 80 Tyr Leu Ala Tyr Phe Thr Tyr Leu Cys Phe Arg Asp Ala Leu Arg Asp 85 90 95 Lys Val Glu Thr Leu Ser Pro Ala Gln Ile Glu Pro Asn Lys Thr Gln 100 105 110 Gln Ile Asp Ala Phe Asp Gly Gly Asp Leu Gly Gly Ser Ser Val Asp 115 120 125 Thr Arg Arg Arg Thr Thr Arg Leu Arg Gln Gln Val Arg Gln Ser Thr 130 135 140 Trp Val Lys Pro Ala Leu Ala Thr Leu Ala Ile Cys Trp Leu Asn Pro 145 150 155 160 Ala Ala Tyr Val Asp Val Leu Val Met Ile Gly Gly Leu Ala Asn Gln 165 170 175 Tyr Gly Glu Thr Gly Arg Trp Phe Phe Ala Ala Gly Ala Ile Ala Ala 180 185 190 Ser Met Leu Trp Phe Pro Ser Val Gly Leu Ala Ala Ala Lys Phe Ser 195 200 205 His Val Leu Ser Arg Pro Ala Val Trp Arg Gly Ile Asn Phe Gly Ile 210 215 220 Gly Cys Ile Met Ala Leu Leu Thr Ile Lys Leu Leu Leu Thr 225 230 235 <210> 8 <211> 717 <212> DNA <213> Artificial Sequence <220> <223> synthetic_Cst gene encoding Cst protein <400> 8 atgtcaacgc tgtctatcct catcgccggt ttcgcactag ggctctcact tatcgtagcg 60 attggcccgc aaaatgctct gctgatcaaa cagggcatta aacgcgagca cgtgtgggta 120 gtcattgcga tttgcgcggt gtccgacatt attttgatta gcggtggcac cgcgggggtg 180 ggctatctgg tggagacttt cccgaccgca ctggtggtgc tgaagtatct gggcgcgatt 240 tatctggctt actttactta tctgtgcttt cgcgatgcgt tgcgcgacaa ggttgaaact 300 ctctcccctg cgcagatcga gccgaataag acgcagcaga tcgatgcatt cgatggcggc 360 gacttgggcg gttcttctgt tgatacccgg cggcgcacca cgcgtctgcg ccagcaagta 420 cgccaatcga cctgggtgaa gccagctctt gcgaccttgg cgatttgctg gctgaacccg 480 gcagcttatg tcgatgtgct ggtaatgatt ggcggacttg ccaaccaata cggcgaaacc 540 ggccgatggt tttttgctgc cggtgccatt gcagcgagca tgctgtggtt tcccagcgtt 600 ggtcttgctg ccgcgaagtt ctcgcacgta ctttcgcgcc ctgcggtatg gcgcggcatc 660 aacttcggca ttggctgcat catggcgctg ctgaccatta agctgctgtt gacctag 717 <210> 9 <211> 242 <212> PRT <213> Artificial Sequence <220> <223> synthetic_LsaF protein <400> 9 Met Ser Pro Ser His Asp Pro Leu Pro Arg Arg Ala Gly Ala Ala Ala 1 5 10 15 Gly Leu Arg Asp Ser Leu Gly Val Gly Leu Gly Ile Phe Pro Leu Gly 20 25 30 Ile Ala Leu Gly Ile Leu Val Ile Gln Ala Gly Leu Pro Trp Trp Leu 35 40 45 Ala Pro Ala Leu Ser Ile Gly Ile Phe Ala Gly Ser Val Glu Leu Leu 50 55 60 Leu Val Ser Met Leu Ala Ala Ala Thr Pro Leu Val Thr Ile Ala Ala 65 70 75 80 Thr Val Phe Ala Val Asn Phe Arg His Val Phe Tyr Ala Phe Ser Phe 85 90 95 Pro Leu Ser Arg Val Arg Pro Gly Leu Pro Arg Ala Tyr Ser Ile Tyr 100 105 110 Ala Met Ile Asp Glu Ala Tyr Ala Thr Tyr Val Leu Met Asp Pro Asp 115 120 125 Arg Leu Ser Ser Ala Arg Met Val Thr Gly Gln Leu Ala Met Gln Leu 130 135 140 Tyr Trp Val Leu Gly Gly Phe Val Gly Ile Met Ile Ala Asn Val Leu 145 150 155 160 Pro Ala Pro Ile Glu Gly Phe Glu Phe Ala Leu Val Ala Leu Phe Val 165 170 175 Val Met Ser Met Asp Ala Ile Arg Gly Lys Arg Glu Leu Pro Ser Ala 180 185 190 Leu Leu Ala Cys Leu Ala Val Thr Val Ala Ile Leu Val Ala Gly Asp 195 200 205 Asn Ala Leu Leu Val Ala Leu Ala Leu Tyr Ser Gly Leu Leu Gly Leu 210 215 220 Arg Tyr Phe Leu Thr Lys Arg Thr Thr Asp Thr Ala Glu Glu Gly Glu 225 230 235 240 Arg Ala <210> 10 <211> 140 <212> PRT <213> Artificial Sequence <220> <223> synthetic_LsaE protein <400> 10 Met Arg Cys Trp Ser Arg Leu Arg Cys Thr Pro Gly Tyr Trp Gly Cys 1 5 10 15 Ala Ile Ser Ser Pro Ser Glu Pro Arg Thr Leu Arg Arg Arg Ala Ser 20 25 30 Val Pro Ser Thr Glu Tyr Leu Ile Ala Gly Val Val Val Ala Gly Leu 35 40 45 Ile Thr Leu Ala Leu Arg Ala Leu Pro Phe Ala Ala Leu Lys Pro Leu 50 55 60 Arg Lys Ser Lys Leu Val Gln Ala Leu Gly Arg Trp Met Pro Ala Gly 65 70 75 80 Ile Leu Val Ile Leu Ala Val Val Val Leu Arg Asp Gln Leu Ile Ser 85 90 95 Gln Gln Gly Arg Val Trp Pro Val Leu Val Ala Thr Ala Ile Thr Ala 100 105 110 Leu Ala His Leu Leu Ser Lys Arg Arg Ala Leu Val Ser Ile Ala Ala 115 120 125 Gly Thr Ala Cys Tyr Val Leu Leu Leu Asn Phe Phe 130 135 140 <210> 11 <211> 1048 <212> DNA <213> Artificial Sequence <220> <223> synthetic_Isa gene <400> 11 atgtctccgt cacacgatcc tttaccgcgc cgcgcgggcg ccgcggccgg ccttcgagat 60 tctctcgggg tcggcctcgg cattttcccc ttgggcattg ccctcggaat tcttgtcatt 120 caggcgggac ttccctggtg gctcgccccg gccctctcga ttggtatctt cgcgggatct 180 gtcgagctgc tcctggtcag catgctcgcc gccgcgactc cgctcgtgac gatcgccgcg 240 accgtgttcg ccgtgaactt tcggcacgta ttctacgcgt tctcgtttcc gctttcgcgg 300 gtgcgaccgg gtctaccccg ggcgtactcc atctacgcaa tgatcgacga ggcctacgcc 360 acctatgtgc tgatggatcc ggatcgcctg agctcagccc gcatggtaac cggccagctc 420 gcgatgcagc tctattgggt gctcggcggc ttcgtcggca tcatgattgc gaacgtgctc 480 cctgccccca ttgagggctt tgagtttgca ctcgtggcgc tcttcgtggt gatgtcgatg 540 gatgcgattc gcggcaagcg cgagctccca tcggccttgc tggcttgcct cgctgtcacg 600 gttgcaatac tggtcgctgg cgacaatgcg ctgctggtcg cgcttgcgct gtactccggg 660 ctactggggc tgcgctattt cctcaccaag cgaaccacgg acactgcgga ggagggcgag 720 cgtgcctagc accgaatatc taatcgcggg cgtcgtcgtc gcgggcctca tcaccctggc 780 gctgcgcgca ctcccgtttg cggcgctcaa accgctgcgc aaatctaagc tcgtgcaggc 840 gctcgggcgc tggatgcccg ctggcatcct cgttatcctc gccgtcgtcg tactgcgcga 900 tcagctcata tcgcagcagg gccgggtgtg gccggtgctc gtcgcgaccg cgatcacggc 960 cctcgctcac ttgctctcaa agcgacgcgc gctcgtgagc atcgcggctg gcaccgcctg 1020 ctacgtgctg ctgctcaact ttttctag 1048 <210> 12 <211> 251 <212> PRT <213> Artificial Sequence <220> <223> synthetic_DvaF protein <400> 12 Met Ser Val Glu Ala Gln Pro Gly Ala Asn Asp Arg Pro Tyr Ser Val 1 5 10 15 Arg His Glu Ile Thr Gln Gly Ala Leu Leu Ile Leu Pro Ala Gly Leu 20 25 30 Gly Met Ile Pro Ile Gly Ile Ala Phe Gly Leu Leu Val Val Gln Ser 35 40 45 Gly Leu Pro Trp Trp Met Ala Pro Ala Leu Ser Phe Phe Ala Tyr Ala 50 55 60 Gly Ser Leu Glu Leu Leu Leu Ile Thr Leu Ile Thr Ser Leu Thr Pro 65 70 75 80 Leu Val Thr Ile Ala Ala Ala Ser Phe Phe Val Asn Phe Arg His Val 85 90 95 Phe Tyr Ala Phe Asn Phe Pro Leu Lys Val Val Thr Asn Pro Phe Leu 100 105 110 Lys Phe Tyr Ala Met Tyr Ser Leu Thr Asp Glu Ile Phe Ala Val Thr 115 120 125 Val Ala Asn Pro Lys Gly Trp Thr Gln Pro Arg Val Ile Ser Ala Gly 130 135 140 Ala Val Leu Gln Ile Cys Trp Val Gly Gly Gly Leu Met Gly Val Leu 145 150 155 160 Leu Ser Ser Phe Ile Pro Phe Gln Ile Arg Gly Leu Ser Phe Ala Leu 165 170 175 Cys Ala Leu Phe Ile Thr Leu Thr Leu Asp Ala Cys Arg Thr Lys Gln 180 185 190 Glu Ile Pro Ser Leu Leu Leu Gly Ala Ala Ala Phe Gly Phe Ala Leu 195 200 205 Leu Leu Leu Pro Ser Gln Pro Ile Phe Ala Ala Met Ile Gly Phe Val 210 215 220 Ala Thr Leu Ala Ala Arg Tyr Thr Ile Ala Val Arg Leu Thr Arg Pro 225 230 235 240 Leu Pro Ala Glu Met Glu Ser Asp Asp Ala Ala 245 250 <210> 13 <211> 111 <212> PRT <213> Artificial Sequence <220> <223> synthetic_DvaE protein <400> 13 Met Gln Leu Asp Ile Pro Phe Trp Tyr Leu Ala Ser Val Leu Leu Ile 1 5 10 15 Ala Phe Ala Val Thr Phe Thr Leu Arg Ala Leu Pro Phe Ala Ile Leu 20 25 30 Glu Pro Leu Arg Lys Ser Gln Phe Val Arg Val Met Ala Val Trp Met 35 40 45 Pro Ala Gly Ile Leu Val Ile Leu Ala Leu Ala Thr Phe Lys Ser Thr 50 55 60 Leu Ala Glu Glu Pro Gly Gly Leu Val His Leu Leu Ile Ala Ser Gly 65 70 75 80 Val Thr Ile Ala Val His Leu Phe Gly Gly Arg Arg Thr Leu Val Ser 85 90 95 Val Ala Ala Gly Thr Leu Ala Phe Val Leu Leu Val Asn Phe Phe 100 105 110 <210> 14 <211> 756 <212> DNA <213> Artificial Sequence <220> <223> synthetic_DvaF gene encoding DvaF protein <400> 14 atgagcgttg aggcgcagcc tggcgcaaac gaccgaccct atagcgtgcg ccacgagatc 60 acgcagggcg cactcctgat tctccccgca gggctcggaa tgattccgat cggcattgcc 120 ttcggcctgc ttgtggtgca atcggggctc ccgtggtgga tggcacccgc cctttcgttc 180 ttcgcgtacg cgggctcact cgagcttctg ctcatcacgc tcatcacgtc gcttacgccg 240 cttgtaacga tcgctgcggc atcgttcttc gtgaacttcc gccacgtgtt ctacgcgttt 300 aatttcccgc tcaaggtcgt cacgaacccg ttcttgaagt tctacgcgat gtactccctc 360 accgacgaga tcttcgcggt aacggttgcc aatccaaagg ggtggacgca gccgcgcgtg 420 atctcggcag gggccgtact ccagatctgc tgggtgggtg gcggcctcat gggggtactg 480 ctctcgagct tcatcccctt ccagatccgc ggcctgagtt tcgcgctgtg cgccctgttc 540 atcacgctga ccctcgatgc gtgccgcacg aaacaggaga tcccgtcact tctcctcggt 600 gctgccgcct tcggtttcgc gctccttttg ctcccgagcc agccgatctt cgccgcgatg 660 attggcttcg tggcgaccct cgccgcgcgc tacacgatcg ccgtgcgcct cacgaggcca 720 ctcccggcag agatggagag cgacgatgca gcttga 756 <210> 15 <211> 335 <212> DNA <213> Artificial Sequence <220> <223> synthetic_DvaE gene encoding DvaE protein <400> 15 atgcagcttg acatcccctt ctggtatctc gcctcggttc tcctcatcgc cttcgccgtg 60 accttcacgc tgcgcgcgct cccgttcgcg attctcgaac cactgcgcaa atcgcaattc 120 gtgcgcgtca tggccgtgtg gatgcccgcg ggcatcctcg tgatcctcgc gctcgcgacc 180 tttaagagca ccctcgccga ggaacccggt ggtctcgttc acctgctgat cgcctcagga 240 gtcacgattg ccgtgcacct cttcggtggt cgccgcaccc tcgtgagcgt cgccgcgggc 300 accctcgcct tcgtgctgct cgtgaacttt ttcta 335 <210> 16 <211> 1081 <212> DNA <213> Artificial Sequence <220> <223> synthetic_DvaFE gene <400> 16 atgagcgttg aggcgcagcc tggcgcaaac gaccgaccct atagcgtgcg ccacgagatc 60 acgcagggcg cactcctgat tctccccgca gggctcggaa tgattccgat cggcattgcc 120 ttcggcctgc ttgtggtgca atcggggctc ccgtggtgga tggcacccgc cctttcgttc 180 ttcgcgtacg cgggctcact cgagcttctg ctcatcacgc tcatcacgtc gcttacgccg 240 cttgtaacga tcgctgcggc atcgttcttc gtgaacttcc gccacgtgtt ctacgcgttt 300 aatttcccgc tcaaggtcgt cacgaacccg ttcttgaagt tctacgcgat gtactccctc 360 accgacgaga tcttcgcggt aacggttgcc aatccaaagg ggtggacgca gccgcgcgtg 420 atctcggcag gggccgtact ccagatctgc tgggtgggtg gcggcctcat gggggtactg 480 ctctcgagct tcatcccctt ccagatccgc ggcctgagtt tcgcgctgtg cgccctgttc 540 atcacgctga ccctcgatgc gtgccgcacg aaacaggaga tcccgtcact tctcctcggt 600 gctgccgcct tcggtttcgc gctccttttg ctcccgagcc agccgatctt cgccgcgatg 660 attggcttcg tggcgaccct cgccgcgcgc tacacgatcg ccgtgcgcct cacgaggcca 720 ctcccggcag agatggagag cgacgatgca gcttgacatc cccttctggt atctcgcctc 780 ggttctcctc atcgccttcg ccgtgacctt cacgctgcgc gcgctcccgt tcgcgattct 840 cgaaccactg cgcaaatcgc aattcgtgcg cgtcatggcc gtgtggatgc ccgcgggcat 900 cctcgtgatc ctcgcgctcg cgacctttaa gagcaccctc gccgaggaac ccggtggtct 960 cgttcacctg ctgatcgcct caggagtcac gattgccgtg cacctcttcg gtggtcgccg 1020 caccctcgtg agcgtcgccg cgggcaccct cgccttcgtg ctgctcgtga actttttcta 1080 a 1081 <210> 17 <211> 409 <212> DNA <213> Artificial Sequence <220> <223> synthetic_PgapA <400> 17 tctgagactt taatttgtgg attcacgggg gtgtaatgta gttcataatt aaccccattc 60 gggggagcag atcgtagtgc gaacgatttc aggttcgttc cctgcaaaaa ctatttagcg 120 caagtgttgg aaatgccccc gtttggggtc aatgtccatt tttgaatgtg tctgtatgat 180 tttgcatctg ctgcgaaatc tttgtttccc cgctaaagtt gaggacaggt tgacacggag 240 ttgactcgac gaattatcca atgtgagtag gtttggtgcg tgagttggaa aaattcgcca 300 tactcgccct tgggttctgt cagctcaaga attcttgagt gaccgatgct ctgattgacc 360 taactgcttg acacattgca tttcctacaa tctttagagg agacacaac 409 <210> 18 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> synthetic_primer <400> 18 gtacccgggg atcctctaga caaagccgaa gagaagttgg 40 <210> 19 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> synthetic_primer <400> 19 gcatagagta ctcggcgccc ataaatttca 30 <210> 20 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> synthetic_primer <400> 20 gcgccgagta ctctatgccg agaagttgaa 30 <210> 21 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> synthetic_primer <400> 21 gcctgcaggt cgactctaga ctgggcatca cactattttt 40 <210> 22 <211> 531 <212> DNA <213> Artificial Sequence <220> <223> synthetic_del-N2131L <400> 22 gtacccgggg atcctctaga caaagccgaa gagaagttgg cttgacggac ccgaaattcc 60 agctgatttt gacgatcctg atgcacccgg caggtggcct ggcgaaaagt tggggcttcc 120 tcaagaaggg gccggctctc tgtcctcagt ggctcgtcgt atcggcgggg tctgcgtgga 180 ctggggtgtt tcctgggtta ttgctattgt gctgtccaat ttcacggatg tgctgggcga 240 tgtagcgaca tccacgctca ttattttcgt gatcctgggt tggcttaccg gttggatctt 300 tgctcgcacc ccaggtcatg ccgtgtttgg catgggcctt gcgcgtgtgg atgcagagga 360 acgtgtgggc tggtggcgtg cgctggttcg cccactgctg acgatcttga ttctgcctgc 420 cgtgatggtg gatgctgacg gccgtgggct ccacgacaag gcaacgggaa ctgcagttat 480 ccgcgggtaa tttgtcttga gtgaaattta tgggcgccga gtactctatg c 531 <210> 23 <211> 555 <212> DNA <213> Artificial Sequence <220> <223> synthetic_del-N2131R <400> 23 gcgccgagta ctctatgccg agaagttgaa cagcaatctt gcagcaactc ctcagtattc 60 acaccagccc caatggacac aaaaacatca gccccagaat cgcccctaag ggcctcaaat 120 acacgatctg gaccaactag tcatcgggaa aacccaaccc cttaaatcgc cttctgcgct 180 taaggggtca atgctagata agtaggaaca acaacgtttg ggcggccagg atctttgcga 240 tcatcgccag cggatacaca gaggtataac ccatggcagg gagctcgttg cgggaggcat 300 ctgacacata actcagcaca gcagggtggg tttgcgtacc ggcgaggatg ccagcggttt 360 caccgaaggg gattttcatc agtttgtggc caacgaacag caccgtgatg gagatgaaca 420 aagtgagcag cgcaccgaag ccgatgatgg tgagtgattg ggggtcgctg atcgctgatc 480 gaaatcctgc gcccgctgag gtaccgatgg cagccaaaaa tagtgtgatg cccagtctag 540 agtcgacctg caggc 555 <210> 24 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> synthetic_Haq-F <400> 24 aggagacaca acatgaagag caagaacgca 30 <210> 25 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> synthetic_Haq-R <400> 25 tcaacttctc ggcatagagt ctattggttc tgaggtgggc 40 <210> 26 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> synthetic_PgapA-F <400> 26 gaaatttatg ggcgccgagt tctgagactt taatttgtgg 40 <210> 27 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> synthetic_PgapA-R <400> 27 cttgctcttc atgttgtgtc tcctctaaag 30 <210> 28 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> synthetic_Cpi-F <400> 28 aggagacaca acatgcaaag cacgcgtaag 30 <210> 29 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> synthetic_Cpi-R <400> 29 tcaacttctc ggcatagagt tcattgcttc cagacacggt 40 <210> 30 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> synthetic_PgapA-R <400> 30 cgtgctttgc atgttgtgtc tcctctaaag 30 <210> 31 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> synthetic_Kcr-F <400> 31 aggagacaca acatggataa gaaaagagcg 30 <210> 32 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> synthetic_Kcr-R <400> 32 tcaacttctc ggcatagagt ttagggacgg cgggtggcgt 40 <210> 33 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> synthetic_PgapA-R <400> 33 tttcttatcc atgttgtgtc tcctctaaag 30 <210> 34 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> synthetic_Cst-F <400> 34 aggagacaca acatgtcaac gctgtctatc 30 <210> 35 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> synthetic_Cst-R <400> 35 tcaacttctc ggcatagagt ctaggtcaac agcagcttaa 40 <210> 36 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> synthetic_PgapA-R <400> 36 cagcgttgac atgttgtgtc tcctctaaag 30 <210> 37 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> synthetic_Isa-F <400> 37 aggagacaca acatgtctcc gtcacacgat 30 <210> 38 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> synthetic_Isa-R <400> 38 tcaacttctc ggcatagagt ctagaaaaag ttgagcagca 40 <210> 39 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> synthetic_PgapA-R <400> 39 tgacggagac atgttgtgtc tcctctaaag 30 <210> 40 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> synthetic_Dva-F <400> 40 aggagacaca acatgagcgt tgaggcgcag 30 <210> 41 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> synthetic_Dva-R <400> 41 tcaacttctc ggcatagagt ttagaaaaag ttcacgagca 40 <210> 42 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> synthetic_PgapA-R <400> 42 ctcaacgctc atgttgtgtc tcctctaaag 30 <210> 43 <211> 251 <212> PRT <213> Artificial Sequence <220> <223> synthetic_HmaF protein <400> 43 Met Ser Val Ala Ala Gln Pro Ser Ala His Glu His Pro Tyr Ser Val 1 5 10 15 Arg His Glu Ile Thr Gln Gly Ala Leu Leu Ile Leu Pro Ala Gly Leu 20 25 30 Gly Met Ile Pro Ile Gly Ile Ala Phe Gly Leu Leu Val Val Gln Ser 35 40 45 Gly Leu Pro Trp Trp Met Ala Pro Ala Leu Ser Phe Phe Ala Tyr Ala 50 55 60 Gly Ser Leu Glu Leu Leu Leu Ile Thr Leu Ile Thr Ser Leu Thr Pro 65 70 75 80 Leu Val Thr Ile Ala Ala Ala Ser Phe Phe Val Asn Phe Arg His Val 85 90 95 Phe Tyr Ala Phe Asn Phe Pro Leu Lys Val Val Lys Asn Pro Phe Leu 100 105 110 Lys Phe Tyr Ala Met Tyr Ser Leu Thr Asp Glu Ile Phe Ala Val Thr 115 120 125 Val Ala His Pro Lys Gly Trp Thr Gln Pro Arg Val Ile Ser Ala Gly 130 135 140 Ala Val Leu Gln Ile Cys Trp Val Gly Gly Gly Leu Met Gly Val Leu 145 150 155 160 Leu Ser Ser Phe Ile Pro Phe Gln Ile Arg Gly Leu Ser Phe Ala Leu 165 170 175 Cys Ala Leu Phe Ile Thr Leu Thr Leu Asp Ala Cys Arg Thr Lys Gln 180 185 190 Glu Leu Pro Ser Leu Val Leu Gly Ala Ala Ala Phe Gly Leu Ala Leu 195 200 205 Leu Leu Met Pro Gly Gln Pro Ile Phe Ala Ala Met Ile Gly Phe Val 210 215 220 Ala Thr Leu Ala Ala Arg Tyr Thr Ile Ala Val Arg Leu Thr Arg Pro 225 230 235 240 Leu Pro Ala Glu Met Glu Gly Asp Asp Ala Ala 245 250 <210> 44 <211> 111 <212> PRT <213> Artificial Sequence <220> <223> synthetic_HmaE protein <400> 44 Met Gln Leu Asp Ile Pro Phe Trp Tyr Leu Ala Ser Val Leu Leu Ile 1 5 10 15 Ala Phe Ala Val Thr Phe Thr Leu Arg Ala Leu Pro Phe Ala Ile Leu 20 25 30 Glu Pro Leu Arg Lys Ser Gln Phe Val Arg Val Met Ala Val Trp Met 35 40 45 Pro Ala Gly Ile Leu Val Ile Leu Ala Leu Ala Thr Phe Lys Ser Thr 50 55 60 Leu Ala Glu Glu Pro Gly Ser Val Ile His Leu Leu Ile Ala Ser Ala 65 70 75 80 Val Thr Ile Ala Val His Leu Leu Phe Gly Arg Arg Thr Leu Val Ser 85 90 95 Val Ala Ala Gly Thr Leu Ala Phe Val Leu Leu Val Asn Phe Phe 100 105 110 <210> 45 <211> 756 <212> DNA <213> Artificial Sequence <220> <223> synthetic_HmaF gene encoding hmaF protein <400> 45 atgagcgttg cggcgcagcc tagcgcacat gagcatccct attcggtgcg ccatgaaatc 60 acgcaggggg cgctcttgat tctccccgcg ggcctcggca tgatcccgat tggcatcgct 120 tttggccttc ttgttgtgca gtccggactt ccgtggtgga tggcacccgc cctctcattc 180 ttcgcgtacg cgggctcgct cgagcttttg ctcatcacac tcatcacatc gctcacgccg 240 ctcgtgacga tcgctgcggc atcgttcttc gtgaacttcc gccacgtgtt ttacgcgttc 300 aacttcccgc tcaaggtcgt gaagaacccg tttttgaagt tctacgcgat gtactcgctt 360 accgacgaga tcttcgcggt gacggtcgcg cacccgaagg ggtggacgca gccacgcgtc 420 atctccgcgg gcgccgtact ccagatctgc tgggtgggag gcggcctcat gggcgtgctc 480 ctctcgagtt tcattccctt ccagatccgc ggtttgagct tcgccctgtg cgcgcttttc 540 atcaccctga ctctcgatgc gtgccgcacg aagcaagaac ttccgtcgct agttctcggc 600 gccgcggcct tcggtctcgc cctgctcctc atgcccgggc agccgatctt tgccgcgatg 660 atcggcttcg ttgcaacgct cgccgcgcgg tacacgatcg ccgtgcgcct tacgaggccg 720 ctaccggcgg aaatggaggg cgacgatgca gcttga 756 <210> 46 <211> 336 <212> DNA <213> Artificial Sequence <220> <223> synthetic_HmaE gene encoding HmaE protein <400> 46 atgcagcttg acatcccctt ctggtacctt gcctcggttc tcctcattgc cttcgccgtc 60 acctttacgc tgcgcgcgct cccgttcgcg atcctcgaac cgctgcgcaa atcccagttc 120 gtgcgcgtca tggccgtgtg gatgcccgcg ggcatcctcg tcattctcgc gctcgcgacc 180 ttcaaaagca ccctcgctga ggaacccggc agcgtcattc atttgctcat tgcctcggcc 240 gtcacgatcg ctgtgcatct tctctttggg cgccgaaccc tcgtgagtgt cgccgcgggt 300 accctcgcct tcgtgctcct cgtgaacttc ttctaa 336 <210> 47 <211> 1081 <212> DNA <213> Artificial Sequence <220> <223> synthetic_HmaFE gene encoding HmaFE protein <400> 47 atgagcgttg cggcgcagcc tagcgcacat gagcatccct attcggtgcg ccatgaaatc 60 acgcaggggg cgctcttgat tctccccgcg ggcctcggca tgatcccgat tggcatcgct 120 tttggccttc ttgttgtgca gtccggactt ccgtggtgga tggcacccgc cctctcattc 180 ttcgcgtacg cgggctcgct cgagcttttg ctcatcacac tcatcacatc gctcacgccg 240 ctcgtgacga tcgctgcggc atcgttcttc gtgaacttcc gccacgtgtt ttacgcgttc 300 aacttcccgc tcaaggtcgt gaagaacccg tttttgaagt tctacgcgat gtactcgctt 360 accgacgaga tcttcgcggt gacggtcgcg cacccgaagg ggtggacgca gccacgcgtc 420 atctccgcgg gcgccgtact ccagatctgc tgggtgggag gcggcctcat gggcgtgctc 480 ctctcgagtt tcattccctt ccagatccgc ggtttgagct tcgccctgtg cgcgcttttc 540 atcaccctga ctctcgatgc gtgccgcacg aagcaagaac ttccgtcgct agttctcggc 600 gccgcggcct tcggtctcgc cctgctcctc atgcccgggc agccgatctt tgccgcgatg 660 atcggcttcg ttgcaacgct cgccgcgcgg tacacgatcg ccgtgcgcct tacgaggccg 720 ctaccggcgg aaatggaggg cgacgatgca gcttgacatc cccttctggt accttgcctc 780 ggttctcctc attgccttcg ccgtcacctt tacgctgcgc gcgctcccgt tcgcgatcct 840 cgaaccgctg cgcaaatccc agttcgtgcg cgtcatggcc gtgtggatgc ccgcgggcat 900 cctcgtcatt ctcgcgctcg cgaccttcaa aagcaccctc gctgaggaac ccggcagcgt 960 cattcatttg ctcattgcct cggccgtcac gatcgctgtg catcttctct ttgggcgccg 1020 aaccctcgtg agtgtcgccg cgggtaccct cgccttcgtg ctcctcgtga acttcttcta 1080 a 1081 <210> 48 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> synthetic_hma-F <400> 48 aggagacaca acatgagcgt tgcggcgcag 30 <210> 49 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> synthetic_hma-R <400> 49 tcaacttctc ggcatagagt ttagaagaag ttcacgagga 40 <210> 50 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> synthetic_PgapA-R <400> 50 cgcaacgctc atgttgtgtc tcctctaaag 30 <210> 51 <211> 100 <212> DNA <213> Artificial Sequence <220> <223> synthetic_PyccA <400> 51 ttccagatca aatgcgtaaa gatgggtaaa acttctgggt gcccttacgc attatcatta 60 tgctgcttaa ttaattacat ctgtcataga gagtgactca 100 <210> 52 <211> 38 <212> DNA <213> Artificial Sequence <220> <223> synthetic_dva-F <400> 52 ctgtcataga gagtgactca atgagcgttg cggcgcag 38 <210> 53 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> synthetic_dva-R <400> 53 cgggtaccga gctcgaattc ttagaagaag ttcacgagga 40 <210> 54 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> synthetic_PyccA-F <400> 54 actcactata gggcgaattc ttccagatca aatgcgtaaa 40 <210> 55 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> synthetic_PyccA-R <400> 55 tgagtcactc tctatgacag atgtaattaa 30 <210> 56 <211> 251 <212> PRT <213> Artificial Sequence <220> <223> synthetic_HmaF protein (I72L, I124V var.) <400> 56 Met Ser Val Ala Ala Gln Pro Ser Ala His Glu His Pro Tyr Ser Val 1 5 10 15 Arg His Glu Ile Thr Gln Gly Ala Leu Leu Ile Leu Pro Ala Gly Leu 20 25 30 Gly Met Ile Pro Ile Gly Ile Ala Phe Gly Leu Leu Val Val Gln Ser 35 40 45 Gly Leu Pro Trp Trp Met Ala Pro Ala Leu Ser Phe Phe Ala Tyr Ala 50 55 60 Gly Ser Leu Glu Leu Leu Leu Leu Thr Leu Ile Thr Ser Leu Thr Pro 65 70 75 80 Leu Val Thr Ile Ala Ala Ala Ser Phe Phe Val Asn Phe Arg His Val 85 90 95 Phe Tyr Ala Phe Asn Phe Pro Leu Lys Val Val Lys Asn Pro Phe Leu 100 105 110 Lys Phe Tyr Ala Met Tyr Ser Leu Thr Asp Glu Val Phe Ala Val Thr 115 120 125 Val Ala His Pro Lys Gly Trp Thr Gln Pro Arg Val Ile Ser Ala Gly 130 135 140 Ala Val Leu Gln Ile Cys Trp Val Gly Gly Gly Leu Met Gly Val Leu 145 150 155 160 Leu Ser Ser Phe Ile Pro Phe Gln Ile Arg Gly Leu Ser Phe Ala Leu 165 170 175 Cys Ala Leu Phe Ile Thr Leu Thr Leu Asp Ala Cys Arg Thr Lys Gln 180 185 190 Glu Leu Pro Ser Leu Val Leu Gly Ala Ala Ala Phe Gly Leu Ala Leu 195 200 205 Leu Leu Met Pro Gly Gln Pro Ile Phe Ala Ala Met Ile Gly Phe Val 210 215 220 Ala Thr Leu Ala Ala Arg Tyr Thr Ile Ala Val Arg Leu Thr Arg Pro 225 230 235 240 Leu Pro Ala Glu Met Glu Gly Asp Asp Ala Ala 245 250

Claims

(1) 서열번호 43의 아미노산 서열의 72번째 아미노산 잔기에 상응하는 아미노산이 다른 아미노산으로 치환되거나,
(2) 서열번호 43의 아미노산 서열의 124번째 잔기에 상응하는 아미노산이 다른 아미노산으로 치환되거나, 또는
(3) 상기 (1) 및 (2)가 모두 치환된,
변이형 L-히스티딘 배출 단백질.
제1항에 있어서,
(1) 서열번호 43의 아미노산 서열의 72번째 아미노산 잔기에 상응하는 아미노산이 류신, 글리신, 프롤린, 알라닌, 발린 또는 메티오닌으로 치환되거나,
(2) 서열번호 43의 아미노산 서열의 124번째 잔기에 상응하는 아미노산이 발린, 글리신, 프롤린, 알라닌, 류신 또는 메티오닌으로 치환되거나, 또는,
(3) 상기 (1) 및 (2)가 모두 치환된, 단백질.
제1항에 있어서, 상기 단백질은 서열번호 56의 아미노산 서열과 99% 이상의 서열 상동성을 가지는 것인, 단백질.
제1항 내지 제3항 중 어느 한 항의 단백질을 암호화하는 폴리뉴클레오타이드.
제1항 내지 제3항 중 어느 한 항의 단백질 또는 상기 단백질을 암호화하는 폴리뉴클레오타이드를 포함하는, 미생물.
제5항에 있어서, 상기 미생물은 L-히스티딘 생산능을 갖는 것인, 미생물.
제5항에 있어서, 상기 미생물은 코리네박테리움 속 또는 에스케리키아 속인, 미생물.
제7항에 있어서, 상기 미생물은 코리네박테리움 글루타미쿰 또는 에스케리키아 콜라이인, 미생물.
제1항 내지 제3항 중 어느 한 항의 단백질,
상기 단백질을 암호화하는 폴리뉴클레오타이드, 또는
상기 폴리뉴클레오타이드를 포함하는 재조합 미생물을 포함하는, L-히스티딘 생산용 조성물.
제1항 내지 제3항 중 어느 한 항의 단백질 또는 상기 단백질을 암호화하는 폴리뉴클레오타이드를 포함하는 미생물을 배지에서 배양하는 단계를 포함하는, L-히스티딘 생산 방법.
제10항에 있어서, 상기 배양하는 단계 이후에, 배양된 미생물 또는 배지로부터 L-히스티딘을 회수하는 단계를 추가로 포함하는, L-히스티딘 생산 방법.