KR20230149787A

KR20230149787A - L-히스티딘 배출 단백질 및 이를 이용한 l-히스티딘 생산 방법

Info

Publication number: KR20230149787A
Application number: KR1020230139885A
Authority: KR
Inventors: 허란; 서창일; 정기용; 임수빈
Original assignee: 씨제이제일제당 (주)
Priority date: 2020-12-24
Filing date: 2023-10-18
Publication date: 2023-10-27
Also published as: CN116615548A; AU2021409842A1; KR20220092182A; EP4269597A1; WO2022139523A1; JP2023540292A; CA3197710A1

Abstract

히스티딘 배출 활성을 갖는 신규 단백질, 상기 단백질이 발현되도록 변형된 L-히스티딘 생산 미생물, 및 상기 미생물을 이용하여 L-히스티딘을 생산하는 방법이 제공된다.

Description

L-히스티딘 배출 단백질 및 이를 이용한 L-히스티딘 생산 방법{L-Histidine Export Protein and Method of Producing L-Histidine Using the Same}

히스티딘 배출 활성을 갖는 신규 단백질, 상기 단백질이 발현되도록 변형된 L-히스티딘 생산 미생물, 및 상기 미생물을 이용하여 L-히스티딘을 생산하는 방법에 관한 것이다.

L-히스티딘은 20개의 표준 아미노산들 가운데 하나의 아미노산으로, 영양학적인 관점에서 볼 때 성인에게는 많은 양이 요구되지 않지만, 성장기 어린이들에게는 해당하는 필수 아미노산으로 분류된다. 또한, L-히스티딘은 항산화와 면역 조절 등 중요한 생리적 과정에 관여하여 위장 궤양 치료제, 순환기계 치료제의 원료 및 아미노산 수액 제제 등 의학 산업에 사용된다.

L-히스티딘은 특히 헤모글로빈에 많이 들어 있어서, 주로 혈분을 원료로 하는 단백질 가수 분해 추출법을 통해 주로 생산된다. 그러나, 이러한 방법은 낮은 효율과 환경 오염 등의 단점을 지니고 있다. 반면, 미생물 발효법을 통하여 L-히스티딘을 생산하는 것은 가능하나, 대규모 공업화는 아직 이루어지지 않았다. 이는 L-히스티딘의 생합성이 뉴클레오티드 합성 전구체인 포스포리보실 피로인산 (PRPP)과 경쟁 관계를 가지며, 고 에너지를 요구하는 복잡한 생합성 과정 및 조절 메커니즘을 가지고 있기 때문이다.

다른 종류의 아미노산의 배출능을 갖는 단백질의 발현 및/또는 기능이 강화되면 해당 아미노산의 생산이 증가되는 예는 알려져 있으나, L-히스티딘 특이적 배출능을 갖는 단백질에 대한 선행 연구는 거의 진행된 바 없다.

이러한 배경하에서, 히스티딘 특이적 배출능을 갖는 단백질의 발굴 및 이를 이용한 히스티딘 생산 기술의 개발이 요구된다.

본 명세서에서는 L-히스티딘 배출능을 갖는 히스티딘 배출 단백질을 발굴하고, 이를 L-히스티딘의 생산능을 가지는 미생물에서 발현시킨 결과, L-히스티딘 생산량이 획기적으로 향상시킬 수 있음을 제안한다.

일 예는 L-히스티딘 배출 활성을 갖는 단백질을 제공한다. 상기 단백질은 L-히스티딘 특이적 배출능을 갖는 단백질일 수 있다.

다른 예는 상기 L-히스티딘 배출 단백질을 발현하는, L-히스티딘 생산 미생물을 제공한다.

다른 예는 상기 미생물을 배지에서 배양하는 단계를 포함하는, L-히스티딘 생산 방법을 제공한다.

본 명세서에서는 L-히스티딘 배출능을 갖는 히스티딘 배출 단백질을 발굴하고, 이를 L-히스티딘의 생산능을 가지는 미생물에서 도입시켜 L-히스티딘 생산량이 획기적으로 향상된 재조합 미생물 및 이를 이용한 L-히스티딘 생산 기술을 제공한다.

이하, 보다 상세히 설명한다.

일 예는 L-히스티딘 배출 활성을 갖는 단백질을 제공한다. 상기 단백질은 L-히스티딘 특이적 배출능을 갖는 단백질일 수 있다. 본 명세서에서, 상기 단백질은 L-히스티딘 배출 단백질로 표현될 수 있다. 일 예에서, 상기 L-히스티딘 배출 단백질은 코리네박테리움 속 및/또는 에스케리키아 속 미생물에서 L-히스티딘 배출능을 갖는 것일 수 있으며, 이 때 상기 L-히스티딘 배출 단백질은 코리네박테리움 속 및/또는 에스케리키아 속에 속하지 않는 미생물, 예컨대, 더마박터 속 (예, Dermabacter vaginalis 등), 헬코바실러스 속 (예, Helcobacillus massiliensis 등) 미코박테리움 속 (예, Mycobacterium abscessus subsp.abscessus 등) 등으로 이루어진 군에서 선택된 1종 이상의 미생물 유래의 단백질일 수 있다.

일 예에서, 상기 L-히스티딘 배출 단백질은 서열번호 12, 서열번호 13 또는 이들의 조합과 60% 이상의 서열 상동성을 갖는 단백질일 수 있다. 예컨대, 일 구체예에서, 상기 L-히스티딘 배출 단백질은 서열번호 12, 13, 또는 이의 조합과 60% 이상, 65% 이상, 70% 이상, 75% 이상, 80% 이상, 85% 이상, 90% 이상, 91% 이상, 92% 이상, 93% 이상, 94% 이상, 95% 이상, 96% 이상, 97% 이상, 98% 이상, 99% 이상, 또는 99.5% 이상의 상동성을 갖는 것일 수 있다.

일 구체예에서, 상기 L-히스티딘 배출 단백질은 다음 중에서 선택된 아미노산 서열을 포함하거나 상기 서열로 이루어지는 단백질로 이루어진 군에서 선택된 1종 이상, 예컨대, 1종, 2종 또는 3종일 수 있다:

서열번호 12, 서열번호 13, 또는 이의 조합;

서열번호 41, 서열번호 42, 또는 이의 조합; 및

서열번호 44, 서열번호 45, 또는 이의 조합.

상기 서열번호 12로 표현되는 단백질은 서열번호 64의 핵산서열에 의하여 암호화되고, 서열번호 13로 표현되는 단백질은 서열번호 65의 핵산서열에 의하여 암호화되거나, 서열번호 12 및/또는 서열번호 13으로 표현되는 단백질은 서열번호 14의 핵산서열 (서열번호 64의 3' 말단과 서열번호 65의 5' 말단의 중복 부위에서 융합된 오페론 서열임)에 의하여 암호화되는 것일 수 있다.

상기 서열번호 41로 표현되는 단백질은 서열번호 66의 핵산서열에 의하여 암호화되고, 서열번호 42로 표현되는 단백질은 서열번호 67의 핵산서열에 의하여 암호화되거나, 서열번호 41 및/또는 서열번호 42로 표현되는 단백질은 서열번호 43의 핵산서열(서열번호 66의 3' 말단과 서열번호 67의 5' 말단의 중복 부위에서 융합된 오페론 서열임)에 의하여 암호화되는 것일 수 있다.

상기 서열번호 44로 표현되는 단백질은 서열번호 68의 핵산서열에 의하여 암호화되고, 서열번호 45로 표현되는 단백질은 서열번호 69의 핵산서열에 의하여 암호화되거나, 서열번호 44 및/또는 서열번호 45로 표현되는 단백질은 서열번호 46의 핵산서열(서열번호 68의 3' 말단과 서열번호 69의 5' 말단의 중복 부위에서 융합된 오페론 서열임)에 의하여 암호화되는 것일 수 있다.

다른 예는 L-히스티딘 배출 단백질을 발현하도록 변형된, L-히스티딘 생산 미생물을 제공한다. 상기 L-히스티딘 배출 단백질은 앞서 설명한 바와 같다. 상기 L-히스티딘 배출 단백질은 상기 L-히스티딘 생산 미생물에 대하여 외래의 단백질, 예컨대, 상기 미생물과 이종의 미생물 유래의 단백질일 수 있다.

본 명세서에서, 용어 "L-히스티딘 생산 미생물"은,

L-히스티딘 생산능을 갖는 미생물이 상기 L-히스티딘 배출 단백질을 발현하도록 변형, 예컨대, 1) 상기 L-히스티딘 배출 단백질을 추가로 발현하거나 2) 내재적 L-히스티딘 배출 단백질을 대체하여 발현하도록 변형됨으로써, 비변형 미생물 대비 증가된 L-히스티딘 생산능을 갖는 경우, 및/또는

L-히스티딘 생산능을 갖지 않는 미생물이 상기 L-히스티딘 배출 단백질을 발현하도록 변형됨으로써 L-아미노산 생산능을 갖게 되는 경우

를 의미하기 위하여 사용될 수 있다.

본 명세서에서 "미생물"은 단세포 박테리아를 포괄하는 것으로, "세포"와 혼용될 수 있다.

본 명세서에서, 상기 비변형 미생물은 L-히스티딘 배출 단백질을 발현하도록 변형되어 L-히스티딘 생산능이 증가되거나 L-히스티딘 생산능이 부여된 "L-히스티딘 생산 미생물"과 구별하기 위하여 사용되는 것으로, 상기 L-히스티딘 배출 단백질을 발현하도록 변형되기 전의 미생물 또는 상기 L-히스티딘 배출 단백질을 발현하도록 변형되지 않은 미생물을 의미하는 것일 수 있고, 숙주 미생물로도 표현될 수 있다.

상기 미생물은 자연적으로 L-히스티딘 생산능을 가지는 미생물 또는 L-히스티딘 생산능이 없거나 현저히 적은 균주에 변이가 도입되어 L-히스티딘 생산능을 가질 수 있는 모든 그람양성 세균, 예컨대 코리네박테리움 속 (the genus　Corynebacterium) 미생물 및 에스케리키아 속 (the genus Escherichia) 미생물로 이루어진 군에서 선택된 1종 이상일 수 있다. 상기 코리네박테리움 속 미생물은 코리네박테리움 글루타미쿰 (Corynebacterium　glutamicum), 코리네박테리움 암모니아게네스 (Corynebacterium ammoniagenes), 브레비박테리움 락토퍼멘텀 (Brevibacterium lactofermentum), 브레비박테리움 플라범 (Brevibacterium flavum), 코리네박테리움 써모아미노게네스 (Corynebacterium　thermoaminogenes), 코리네박테리움 에피션스 (Corynebacterium　efficiens) 등을 포함할 수 있으나, 이에 한정되는 것은 아니다. 예컨대, 상기 코리네박테리움 속 미생물은 코리네박테리움 글루타미쿰 (Corynebacterium　glutamicum)일 수 있다.

일 예에서, 상기 L-히스티딘 배출 단백질을 발현하도록 변형된 L-히스티딘 생산 미생물은, 상기 L-히스티딘 배출 단백질, 예컨대 외래의 L-히스티딘 배출 단백질을 발현하도록 변형되지 않은 동종의 비변형 미생물과 비교하여, L-히스티딘 생산능이 증가된 것일 수 있다. 일 구체예에서, 상기 L-히스티딘 배출 단백질을 발현하도록 변형된 L-히스티딘 생산 미생물은, 비변형 미생물과 비교하여, L-히스티딘 생산량 (예컨대, 배지 내 함량)이 5%(w/v) 이상, 10%(w/v) 이상, 12.5%(w/v) 이상, 15%(w/v) 이상, 17.5%(w/v) 이상, 또는 20%(w/v) 이상 증가한 것일 수 있다 (상기 L-히스티딘 생산 증가율의 상한값은, 이에 제한되지 않지만, 100%(w/v), 90%(w/v), 80%(w/v), 75%(w/v), 70%(w/v), 65%(w/v), 60%(w/v), 55%(w/v), 또는 50%(w/v)일 수 있다). 상기 L-히스티딘 배출 단백질을 발현하도록 변형된 L-히스티딘 생산 미생물과 비변형 미생물과의 L-히스티딘 생산량 비교는, 기질 (예컨대, 포도당 등의 당)이 서로 동일한 양으로 사용된 경우를 기준으로 수행되는 것일 수 있으며, 예컨대, 기질 (예컨대, 포도당 등의 당) 단위량 (1g, 10g, 또는 100g 등) 기준 배지 내 L-히스티딘 함량을 비교한 것일 수 있다.

본 명세서에서, 용어 "L-히스티딘 배출 단백질을 발현하도록 변형"은 미생물에서 외래의 L-히스티딘 배출 단백질이 발현되도록 하는 모든 조작을 의미할 수 있으며, 예컨대, 미생물에 외래의 L-히스티딘 배출 단백질을 암호화하는 유전자를 도입 또는 상기 미생물을 외래의 L-히스티딘 배출 단백질을 암호화하는 유전자로 형질전환시키는 것을 의미할 수 있다.

본 명세서에서, 폴리뉴클레오타이드("유전자 "와 혼용될 수 있음) 또는 폴리펩타이드("단백질"과 혼용될 수 있음)가 "특정 핵산 서열 또는 아미노산 서열을 포함한다, 특정 핵산 서열 또는 아미노산 서열로 이루어진다, 또는 특정 핵산 서열 또는 아미노산 서열로 표현된다" 함은 등가적 의미로 상호 혼용 가능한 표현으로, 상기 폴리뉴클레오타이드 또는 폴리펩타이드가 상기 특정 핵산 서열 또는 아미노산 서열을 필수적으로 포함하여 이루어진 것을 의미할 수 있으며, 상기 폴리뉴클레오타이드 또는 폴리펩타이드의 본래의 기능 및/또는 목적하는 기능을 유지하는 범위에서 상기 특정 핵산 서열 또는 아미노산 서열에 변이(결실, 치환, 변형, 및/또는 부가)가 가해진 "실질적으로 동등한 서열"을 포함하는 것(또는 상기 변이가 도입된 것을 배제하지 않는 것)으로 해석될 수 있다.

일 예에서, 본 명세서에서 제공되는 핵산 서열 또는 아미노산 서열은 이들의 본래의 기능 또는 목적하는 기능을 유지하는 범위에서 통상적인 돌연변이 유발법, 예를 들면 방향성 진화법(direct evolution) 및/또는 부위특이적 돌연변이법(site-directed mutagenesis) 등에 의하여 변형된 것을 포함할 수 있다. 일 예에서, 폴리뉴클레오타이드 또는 폴리펩타이드가 "특정 핵산 서열 또는 아미노산 서열을 포함한다" 함은 상기 폴리뉴클레오타이드 또는 폴리펩타이드가 (i) 상기 특정 핵산 서열 또는 아미노산 서열로 이루어지거나 또는 이를 필수적으로 포함하거나, 또는 (ii) 상기 특정 핵산 서열 또는 아미노산 서열과 60% 이상, 65% 이상, 70% 이상, 75% 이상, 80% 이상, 85% 이상, 90% 이상, 91% 이상, 92% 이상, 93% 이상, 94% 이상, 95% 이상, 96% 이상, 97% 이상, 98% 이상, 99% 이상, 99.5% 이상, 또는 99.9% 이상 (예컨대, 60% 내지 99.5%, 70% 내지 99.5%, 80% 내지 99.5%, 85% 내지 99.5%, 90% 내지 99.5%, 91% 내지 99.5%, 92% 내지 99.5%, 93% 내지 99.5%, 94% 내지 99.5%, 95% 내지 99.5%, 96% 내지 99.5%, 97% 내지 99.5%, 98% 내지 99.5%, 또는 99% 내지 99.5%)의 상동성을 갖는 핵산 서열 또는 아미노산 서열로 이루어지거나 이를 필수적으로 포함하고, 본래의 기능 및/또는 목적하는 기능을 유지하는 것을 의미할 수 있다. 본 명세서에서, 상기 본래의 기능은, L-히스티딘 배출 기능 (아미노산 서열의 경우), 또는 L-히스티딘 배출 기능을 갖는 단백질을 암호화하는 기능 (핵산 서열의 경우)일 수 있고, 상기 목적하는 기능은 미생물의 L-히스티딘 생산능을 증가시키거나 부여하는 기능을 의미할 수 있다.

본 명세서에 기재된 핵산 서열은 코돈의 축퇴성(degeneracy)으로 인하여 상기 단백질(L-히스티딘 배출 단백질)을 발현시키고자 하는 미생물에서 선호되는 코돈을 고려하여, 코딩영역으로부터 발현되는 단백질의 아미노산 서열 및/또는 기능을 변화시키지 않는 범위 내에서 코딩영역에 다양한 변형이 이루어질 수 있다.

본 출원에서 용어, ‘상동성 (homology)’ 또는 ‘동일성 (identity)’은 두 개의 주어진 아미노산 서열 또는 염기 서열과 관련된 정도를 의미하며 백분율로 표시될 수 있다. 용어 상동성 및 동일성은 종종 상호교환적으로 이용될 수 있다.

보존된(conserved) 폴리뉴클레오티드 또는 폴리펩티드의 서열 상동성 또는 동일성은 표준 배열 알고리즘에 의해 결정되며, 사용되는 프로그램에 의해 확립된 디폴트 갭 페널티가 함께 이용될 수 있다. 실질적으로, 상동성을 갖거나(homologous) 또는 동일한(identical) 서열은 일반적으로 서열 전체 또는 전체-길이의 적어도 약 50%, 60%, 70%, 80% 또는 90%를 따라 중간 또는 높은 엄격한 조건(stringent conditions)에서 하이브리드할 수 있다. 하이브리드화는 폴리뉴클레오티드에서 일반 코돈 또는 코돈 축퇴성을 고려한 코돈을 함유하는 폴리뉴클레오티드 역시 포함됨이 자명하다.

임의의 두 폴리뉴클레오티드 또는 폴리펩티드 서열이 상동성, 유사성 또는 동일성을 갖는지 여부는, 예를 들어, Pearson et al (1988) [Proc. Natl. Acad. Sci. USA 85]: 2444에서와 같은 디폴트 파라미터를 이용하여 "FASTA" 프로그램과 같은 공지의 컴퓨터 알고리즘을 이용하여 결정될 수 있다. 또는, EMBOSS 패키지의 니들만 프로그램(EMBOSS: The European Molecular Biology Open Software Suite, Rice et al., 2000, Trends Genet. 16: 276-277)(버전 5.0.0 또는 이후 버전)에서 수행되는 바와 같은, 니들만-운치(Needleman-Wunsch) 알고리즘(Needleman and Wunsch, 1970, J. Mol. Biol. 48: 443-453)이 사용되어 결정될 수 있다(GCG 프로그램 패키지 (Devereux, J., et al, Nucleic Acids Research 12: 387 (1984)), BLASTP, BLASTN, FASTA (Atschul, [S.] [F.,] [ET AL, J MOLEC BIOL 215]: 403 (1990); Guide to Huge Computers, Martin J. Bishop, [ED.,] Academic Press, San Diego,1994, 및 [CARILLO ETA/.](1988) SIAM J Applied Math 48: 1073을 포함한다). 예를 들어, 국립 생물공학 정보 데이터베이스 센터의 BLAST, 또는 ClustalW를 이용하여 상동성, 유사성 또는 동일성을 결정할 수 있다.

폴리뉴클레오티드 또는 폴리펩티드의 상동성, 유사성 또는 동일성은, 예를 들어, Smith and Waterman, Adv. Appl. Math (1981) 2:482 에 공지된 대로, 예를 들면, Needleman et al. (1970), J Mol Biol. 48:443과 같은 GAP 컴퓨터 프로그램을 이용하여 서열 정보를 비교함으로써 결정될 수 있다. 요약하면, GAP 프로그램은 두 서열 중 더 짧은 것에서의 기호의 전체 수로, 유사한 배열된 기호(즉, 뉴클레오티드 또는 아미노산)의 수를 나눈 값으로 정의할 수 있다. GAP 프로그램을 위한 디폴트 파라미터는 (1) 이진법 비교 매트릭스(동일성을 위해 1 그리고 비-동일성을 위해 0의 값을 함유함) 및 Schwartz and Dayhoff, eds., Atlas Of Protein Sequence And Structure, National Biomedical Research Foundation, pp. 353-358 (1979)에 의해 개시된 대로, Gribskov et al(1986) Nucl. Acids Res. 14: 6745의 가중된 비교 매트릭스 (또는 EDNAFULL (NCBI NUC4.4의 EMBOSS 버전) 치환 매트릭스); (2) 각 갭을 위한 3.0의 페널티 및 각 갭에서 각 기호를 위한 추가의 0.10 페널티 (또는 갭 개방 패널티 10, 갭 연장 패널티 0.5); 및 (3) 말단 갭을 위한 무 페널티를 포함할 수 있다.

또한, 임의의 두 폴리뉴클레오티드 또는 폴리펩티드 서열이 상동성, 유사성 또는 동일성을 갖는지 여부는 정의된 엄격한 조건하에서 써던 혼성화 실험에 의해 서열을 비교함으로써 확인할 수 있으며, 정의되는 적절한 혼성화 조건은 해당 기술 범위 내이고, 당업자에게 잘 알려진 방법(예컨대, J. Sambrook et al., Molecular Cloning, A Laboratory Manual, 2nd Edition, Cold Spring Harbor Laboratory press, Cold Spring Harbor, New York, 1989; F.M. Ausubel et al., Current Protocols in Molecular Biology, John Wiley & Sons, Inc., New York)으로 결정될 수 있다.

상기 L-히스티딘 배출 단백질을 암호화하는 유전자를 도입 또는 형질전환은 통상의 발현 벡터를 사용한 공지된 형질전환 방법을 당업자가 적절히 선택하여 수행될 수 있다. 본 명세서에서, 용어 "형질전환"은 표적 단백질(L-히스티딘 배출 단백질)을 암호화하는 폴리뉴클레오타이드를 포함하는 발현 벡터를 숙주 미생물 내에 도입하여 숙주세포 내에서 상기 폴리뉴클레오타이드가 암호화하는 단백질이 발현할 수 있도록 하는 것을 의미한다. 형질전환된 폴리뉴클레오타이드는 숙주 미생물 내에서 발현될 수 있기만 한다면, 숙주 미생물의 염색체 내에 삽입되어 위치하거나 및/또는 염색체 외에 위치할 수 있다. 상기 폴리뉴클레오타이드는 숙주 미생물 내로 도입되어 발현될 수 있는 것이면, 그 도입되는 형태는 제한이 없다. 예를 들면, 상기 폴리뉴클레오타이드는 자체적으로 발현되는데 필요한 모든 요소를 포함하는 유전자 구조체인 발현 카세트 (expression cassette)의 형태로 숙주 미생물에 도입될 수 있다. 상기 발현 카세트는 통상 상기 폴리뉴클레오타이드에 작동 가능하게 연결되어 있는 프로모터 (promoter), 전사 종결신호, 리보좀 결합부위 및/또는 번역 종결신호 등의 발현 조절 요소를 포함할 수 있다. 상기 발현 카세트는 자체 복제가 가능한 발현 벡터 형태일 수 있다. 또한, 상기 폴리뉴클레오타이드는 그 자체의 형태로 숙주세포에 도입되어 숙주세포에서 발현에 필요한 서열과 작동 가능하게 연결되어 있는 것일 수도 있다. 상기에서 용어 "작동 가능하게 연결"된 것이란 발현조절 요소가 목적 단백질(L-히스티딘 배출 단백질)을 암호화하는 폴리뉴클레오타이드의 전사 조절 (예, 전사 개시)를 수행할 수 있도록 발현조절 요소 (예, 프로모터)와 폴리뉴클레오타이드가 기능적으로 연결되어 있는 것을 의미할 수 있다. 작동 가능한 연결은 당업계의 공지된 유전자 재조합 기술을 이용하여 수행할 수 있으며, 예컨대, 통상적인 부위-특이적 DNA 절단 및 연결에 의하여 수행될 수 있으나, 이에 제한되지 않는다.

상기 폴리뉴클레오타이드를 숙주 미생물에 형질전환 하는 방법은 핵산을 세포(미생물) 내로 도입하는 어떠한 방법으로도 수행 가능하며, 숙주 미생물에 따라 당 분야에서 공지된 형질전환 기술을 적절히 선택하여 수행할 수 있다. 상기 공지된 형질전환 방법으로 전기천공법 (electroporation), 인산칼슘 (CaPO₄) 침전법, 염화칼슘 (CaCl₂) 침전법, 미세주입법 (microinjection), 폴리에틸렌글리콜 (PEG) 침전법(polyethylene glycol-mediated uptake), DEAE-덱스트란법, 양이온 리포좀법, 리포펙션(lipofection), 초산 리튬-DMSO법 등이 예시될 수 있으나, 이에 제한되는 것은 아니다.

상기 유전자의 숙주 세포 유전체 (염색체) 내 삽입은 공지된 방법을 당업자가 적절히 선택하여 수행될 수 있으며, 예컨대, RNA-가이드 엔도뉴클레아제 시스템 (RNA-guided endonuclease system; 예컨대, (a) RNA-가이드 엔도뉴클레아제(예, Cas9 단백질 등), 이의 암호화 유전자, 또는 상기 유전자를 포함하는 벡터; 및 (b) 가이드 RNA (예, single guide RNA (sgRNA) 등), 이의 암호화 DNA, 또는 상기 DNA를 포함하는 벡터를 포함하는 혼합물(예컨대, RNA-가이드 엔도뉴클레아제 단백질과 가이드 RNA의 혼합물 등), 복합체 (예컨대, 리보핵산 융합단백질 (RNP), 재조합 벡터 (예컨대, RNA-가이드 엔도뉴클레아제 암호화 유전자 및 가이드 RNA 암호화 DNA를 포함하는 함께 포함하는 벡터 등) 등으로 이루어진 군에서 선택된 하나 이상)을 사용하여 수행될 수 있으나, 이에 제한되는 것은 아니다.

다른 예는 상기 L-히스티딘 배출 단백질을 암호화하는 핵산 분자를 제공한다. 일 예에서, 상기 핵산 분자는 서열번호 64 및/또는 서열번호 65, 또는 서열번호 14; 서열번호 66 및/또는 서열번호 67, 또는 서열번호 43; 또는 서열번호 68 및/또는 서열번호 69, 또는 서열번호 46의 핵산 서열을 포함하거나 상기 서열로 이루어지는 핵산 분자일 수 있다.

다른 예는 상기 핵산 분자를 포함하는 재조합 벡터 (발현 벡터)를 제공한다.

다른 예는 상기 핵산 분자 또는 재조합 벡터를 포함하는 재조합 세포를 제공한다.

일 예는 L-히스티딘 배출 단백질을 암호화하는 핵산 분자, 상기 핵산 분자를 포함하는 재조합 벡터, 또는 상기 핵산 분자 또는 상기 재조합 벡터를 포함하는 세포를 포함하는, L-히스티딘 생산용 조성물, L-히스티딘 생산 증가용 조성물, 또는 L-히스티딘 생산 미생물 제조용 조성물을 제공한다.

다른 예는 미생물을 L-히스티딘 배출 단백질을 발현하도록 변형시키는 단계를 포함하는, L-히스티딘 생산 미생물 제조 방법, 또는 상기 미생물의 L-히스티딘 생산능 증진 및/또는 부여 방법을 제공한다. 상기 미생물을 L-히스티딘 배출 단백질을 발현하도록 변형시키는 단계는 상기 미생물에 L-히스티딘 배출 단백질을 암호화하는 유전자를 도입하거나, 상기 미생물을 L-히스티딘 배출 단백질을 암호화하는 유전자로 형질전환시키는 것에 의하여 수행될 수 있다.

상기 L-히스티딘 배출 단백질, 이를 암호화하는 유전자, 및 미생물은 앞서 설명한 바와 같다.

본 명세서에서, 용어 "벡터"는 적합한 숙주 내에서 목적 단백질을 발현시킬 수 있도록 적합한 조절 서열에 작동 가능하게 연결된 상기 목적 단백질을 암호화하는 폴리뉴클레오타이드의 염기서열을 함유하는 DNA 제조물을 의미한다. 상기 조절 서열은 전사를 개시할 수 있는 프로모터, 전사를 조절하기 위한 임의의 오퍼레이터 서열, 적합한 mRNA 리보좀 결합부위를 암호화하는 서열, 및/또는 전사 및/또는 해독의 종결을 조절하는 서열을 포함할 수 있다. 벡터는 적당한 숙주 미생물 내로 형질전환된 후, 숙주 미생물의 게놈(유전체)과 무관하게 발현되거나, 숙주 미생물의 게놈 내에 통합될 수 있다.

본 명세서에서 사용가능한 벡터는 숙주 세포 내에서 복제 가능한 것이면 특별히 한정되지 않으며, 통상 사용되는 모든 벡터들 중에서 선택될 수 있다. 통상 사용되는 벡터의 예로는 천연 상태이거나 재조합된 상태의 플라스미드, 코스미드, 바이러스, 박테리오파지 등을 들 수 있다. 예를 들어, 상기 벡터로서, 파지 벡터 또는 코스미드 벡터로서 pWE15, M13, MBL3, MBL4, IXII, ASHII, APII, t10, t11, Charon4A, 및 Charon21A 등을 사용할 수 있으며, 플라스미드 벡터로서 pBR계, pUC계, pBluescriptII계, pGEM계, pTZ계, pCL계 및 pET계 등을 사용할 수 있다. 구체적으로는　pDZ, pACYC177, pACYC184, pCL, pECCG117, pUC19, pBR322, pMW118, pCC1BAC 벡터 등을 예시할 수 있으나, 이에 제한되지 않는다.

본 명세서에서 사용 가능한 벡터는 공지된 발현 벡터 및/또는 폴리뉴클레오타이드의 숙주 세포 염색체 내 삽입용 벡터일 수 있다. 상기 폴리뉴클레오타이드의 숙주 세포 염색체 내 삽입은 당업계에 알려진 임의의 방법, 예를 들면, 상동재조합에 의하여 이루어질 수 있으나, 이에 한정되지는 않는다. 상기 벡터는 상기 염색체 내 삽입 여부를 확인하기 위한 선별 마커(selection marker)를 추가로 포함할 수 있다. 상기 선별 마커는 벡터로 형질전환된 세포를 선별, 즉, 상기 폴리뉴클레오타이드의 삽입 여부를 확인하기 위한 것으로, 약물 내성, 영양 요구성, 세포 독성제에 대한 내성 또는 표면 단백질의 발현과 같은 선택가능 표현형을 부여하는 유전자들 중에서 선택되어 사용될 수 있다. 선택제(selective agent)가 처리된 환경에서는 선별 마커를 발현하는 세포만 생존하거나 다른 표현 형질을 나타내므로, 형질전환된 세포를 선별할 수 있다.

다른 예는 상기 L-히스티딘 생산 미생물을 배지에서 배양하는 단계를 포함하는, L-히스티딘의 생산 방법을 제공한다. 상기 방법은, 상기 배양하는 단계 이후에, 상기 배양된 미생물, 배지, 또는 이들 모두로부터 L-히스티딘을 회수하는 단계를 추가로 포함할 수 있다.

　상기 방법에 있어서, 상기 미생물을 배양하는 단계는, 특별히 이에 제한되지 않으나, 공지된 회분식 배양방법, 연속식 배양방법, 유가식 배양방법 등에 의해 수행될 수 있다. 이때, 배양조건은, 특별히 이에 제한되지 않으나, 염기성 화합물 (예: 수산화나트륨, 수산화칼륨 또는 암모니아) 또는 산성 화합물 (예: 인산 또는 황산)을 사용하여 적정 pH (예컨대, pH 5 내지 9, 구체적으로는 pH 6 내지 8, 가장 구체적으로는 pH 6.8)를 조절할 수 있고, 산소 또는 산소-함유 가스 혼합물을 배양물에 도입시켜 호기성 조건을 유지할 수 있다. 배양온도는 20 내지 45℃, 또는 25 내지 40℃를 유지할 수 있고, 약 10 내지 약 160 시간, 약 10 시간 내지 96시간, 약 10 시간 내지 48시간, 또는 약 10 시간 내지 36시간 동안 배양할 수 있으나, 이에 제한 되는 것은 아니다. 상기 배양에 의하여 생산된 L-히스티딘은　배지　중으로 분비되거나 세포 내에 잔류할 수 있다.

상기 배양에 사용 가능한 배지는 탄소 공급원으로 당 및 탄수화물 (예: 글루코오스, 슈크로오스, 락토오스, 프럭토오스, 말토오스, 몰라세, 전분 및 셀룰로오스), 유지 및 지방 (예: 대두유, 해바라기씨유, 땅콩유 및 코코넛유), 지방산 (예: 팔미트산, 스테아르산 및 리놀레산), 알코올 (예: 글리세롤 및 에탄올), 유기산 (예: 아세트산) 등으로 이루어진 군에서 선택된 1종 이상을 개별적으로 사용하거나 또는 2종 이상을 혼합하여 사용할 수 있으나, 이에 제한되지 않는다. 질소 공급원으로는 질소-함유 유기 화합물 (예: 펩톤, 효모 추출액, 육즙, 맥아 추출액, 옥수수 침지액, 대두박분 및 우레아), 무기 화합물 (예: 황산암모늄, 염화암모늄, 인산암모늄, 탄산암모늄 및 질산암모늄) 등으로 이루어진 군에서 선택된 1종 이상을 개별적으로 사용하거나 또는 2종 이상을 혼합하여 사용할 수 있으나, 이에 제한되지 않는다. 인 공급원으로 인산이수소칼륨, 인산수소이칼륨, 이에 상응하는 나트륨 함유 염 등으로 이루어진 군에서 선택된 1종 이상을 개별적으로 사용하거나 또는 2종 이상을 혼합하여 사용할 수 있으나, 이에 제한되지 않는다. 또한,　상기 배지는 기타 금속염 (예: 황산마그네슘 또는 황산철), 아미노산, 및/또는 비타민 등과 같은 필수성장-촉진 물질을 포함할 수 있다.

상기 L-히스티딘을 회수하는 단계는 배양방법에 따라 당해 분야에 공지된 적합한 방법을 이용하여 배지, 배양액, 또는 미생물로부터 목적하는 아미노산을 수집하는 것일 수 있다. 예를 들어, 상기 회수하는 단계는 원심분리, 여과, 음이온 교환 크로마토그래피, 결정화, HPLC 등에서 선택된 하나 이상의 방법으로 수행될 수 있다. 상기 L-히스티딘을 회수하는 방법은, 상기 회수하는 단계 이전, 동시, 또는 이후에, 정제단계를 추가적으로 포함할 수 있다.

본 명세서에서 제공되는 L-히스티딘 배출 유전자를 L-히스티딘 생산능을 가지는 미생물에 발현시킴으로써, 상기 유전자가 발현되지 않은 모균주에 비하여, L-히스티딘 생산량이 획기적으로 향상시킬 수 있어서, L-히스티딘을 보다 효과적으로 생산할 수 있을뿐 아니라, L-히스티딘의 산업적 규모의 대규모 생산에 기여할 수 있다.

이하 본 출원을 실시예를 통하여 보다 상세하게 설명한다. 그러나 이들 실시예는 본 출원을 예시적으로 설명하기 위한 것으로 본 출원의 범위가 이들 실시예에 한정되는 것은 아니다.

실시예 1. 외래 히스티딘 배출 유전자 탐색 및 후보 선별

L-히스티딘은 아미노산 분류 중 주로 염기(Basic) 아미노산으로 분류되나 방향족(Aromatic) 아미노산 또는 곁가지(Branched chain) 아미노산으로 분류되기도 한다. L-히스티딘 특이 배출능을 갖는 단백질 후보를 선별하기 위하여 각 분류별 아미노산(염기 아미노산: L-라이신, 방향족 아미노산: Trp, 곁가지 아미노산: 이소류신)에 대한 배출 단백질(LysE(Arch Microbiol 180: 155-160), Wex(대한민국 등록특허 제10-1968317호), BrnFE(Arch Microbiol 180: 155-160))의 아미노산 서열을 query 서열로 하고, NCBI와 Kegg database를 기반으로 PSI-BLAST 탐색 결과, L-히스티딘을 배출할 가능성이 있는 막단백질로 예측되는 후보 유전자들과 이를 보유하는 미생물을 선정하였다.

이 중 생산 균주에 적용 가능한 정도의 생물 안전도 (Biosafety level)와 확보 가능성을 고려하여, 아래 표 1 과 같이 LysE 기반 1종, Wex 기반 3종, BrnFE기반 2종의 단백질, 이를 암호화하는 유전자, 및 이를 포함하는 미생물을 선정하였다:

L-히스티딘 배출자 후보 list

	No.	균 주	Protein Ref Seq.	gDNA Ref Seq.	생물 안전도	아미노산 서열	핵산 서열
Wex 기반	1	Herbaspirillum aquaticum (KCTC42001)	WP_088757482.1	NZ_NJGV01000035.1	1	서열번호 1	서열번호 2
	2	Cupriavidus pinatubonensis (KCTC22125)	WP_041680244.1	CP000091.1	1	서열번호 3	서열번호 4
	3	Kluyvera cryocrescens(KCTC2580)	WP_052283291.1	NZ_LGHZ01000014.1	1	서열번호 5	서열번호 6
LysE 기반	4	Corynebacterium stationis (ATCC6872)	WP_066837457.1	CP014279.1	1	서열번호 7	서열번호 8
BrnFE 기반	5	Leucobacter salsicius (KCTC19904)	WP_026139602.1	NZ_AOCN01000022.1	1	서열번호 9	서열번호 11
	5	Leucobacter salsicius (KCTC19904)	WP_083879221.1	NZ_AOCN01000022.1	1	서열번호 10	서열번호 11
	6	Dermabacter vaginalis (KCTC39585)	WP_065248528.1 (DvaF)	NZ_CP012117.1	1	서열번호 12	서열번호 64
			WP_065248527.1(DvaE)			서열번호 13	서열번호 65
			DvaFE			서열번호 12 및 13	서열번호 14 (DvaFE 오페론)

(상기 표 1에서, 생물안전도는 미국의 Centers for Disease Control and Prevention에서 정의한 미생물 병원성 지표 (level 1~4)에 따른 것임 (level이 낮을수록 안전함)

실시예 2. 외래 L-히스티딘 배출 유전자 후보 도입 벡터 및 이를 도입한 재조합 코리네박테리움 속 균주 제작

상기 실시예 1에서 선정한 외래 L-히스티딘 배출 유전자 후보 6종을 코리네박테리움 속 균주에 도입하기 위한 벡터 6종을 제작하였다.

외래 L-히스티딘 배출 유전자 후보들을 도입하기 위하여, 코리네박테리움 글루타미쿰의 트렌스포존을 코딩하는 유전자 중 NCgl2131 유전자를 삽입 site로 사용하였다(Journal of Biotechnology 104, 5-25 Jorn Kalinowski et al, 2003). 또한 외래 L-히스티딘 배출 유전자 후보들이 코리네박테리움 유래 gapA 유전자의 프로모터(이하, PgapA, 서열번호 15) 하에서 발현되도록 설계하였다.

NCgl2131 유전자를 배출자 유전자들로 치환하기 위하여 NCgl2131 결손 및 타겟 유전자 삽입 벡터를 제작하였다. 벡터를 제작하기 위해, 코리네박테리움 글루타미쿰 균주 ATCC13032의 염색체를 주형으로 하여 서열번호 16 과 서열번호 17, 서열번호 18과 서열번호 19의 프라이머 쌍을 각각 이용하여 PCR을 각각 수행하였다. PCR 반응을 위한 중합효소로는 PfuUltraTM 고-신뢰 DNA 폴리머라제(Stratagene)를 사용하였으며, PCR 조건은 다음과 같이 하였다: 변성 95℃, 30초; 어닐링 55℃, 30초; 및 중합반응 72℃, 2분을 28회 반복한 후, 72℃에서 5분간 중합반응을 수행. 그 결과 각각 531bp의 del-N2131L(서열번호 20)와 555bp의 del-N2131R(서열번호 21)의 DNA 단편을 수득하였다. 수득한 DNA 산물을 QIAGEN사의 PCR Purification kit를 사용하여 정제한 후 pDZ 벡터(대한민국 등록특허 제10-0924065호)와 다카라(TaKaRa)의 Infusion Cloning Kit를 사용하여 클로닝하여, NCgl2131유전자결손 및 타겟 유전자 삽입용 벡터 pDZΔN2131을 제작하였다.

Herbaspirillum aquaticum 유래 단백질(이하, Haq, 서열번호 1)를 코딩하는 유전자(이하, haq, 서열번호 2)의 염기서열 정보를 미국보건원 진뱅크(NIH GenBank)로부터 획득하였다. haq를 증폭시키기 위하여 Herbaspirillum aquaticum 균주(KCTC42001)의 염색체 DNA를 주형으로 하여 서열번호 22와 서열번호 23의 프라이머 쌍을 이용하여 PCR을 수행하였다. PCR 반응을 위한 중합효소로는 PfuUltraTM 고-신뢰 DNA 폴리머라제(Stratagene)를 사용하였으며, PCR 조건은 다음과 같이 하였다: 변성 95℃, 30초; 어닐링 55℃, 30초; 및 중합반응 72℃, 2분을 28회 반복한 후, 72℃에서 5분간 중합반응을 수행. 그 결과 945bp의 haq (서열번호 2)를 포함한 977bp의 haq 단편을 수득하였다. haq와 연결 가능한 PgapA 단편을 수득하기 위하여, ATCC13032의 염색체를 주형으로 하여 서열번호 24과 서열번호 25의 프라이머 쌍을 이용하여 PCR을 수행하였다. PCR 반응을 위한 중합효소로는 PfuUltraTM 고-신뢰 DNA 폴리머라제(Stratagene)를 사용하였으며, PCR 조건은 다음과 같이 하였다: 변성 95℃, 30초; 어닐링 55℃, 30초; 및 중합반응 72℃, 1분을 28회 반복한 후, 72℃에서 5분간 중합반응을 수행. 그 결과 409bp의 PgapA(서열번호 15)를 포함한 441bp의 PgapA 단편을 수득하였다. 상기 수득된 haq 단편과 PgapA 단편, 그리고 ScaI 제한효소로 절단된 pDZΔN2131 벡터를 깁슨 어셈블리 (DG Gibson et al., NATURE METHODS, VOL.6 NO.5, MAY 2009, NEBuilder HiFi DNA Assembly Master Mix) 방법을 이용하여 클로닝하여, 재조합 플라스미드를 획득하였으며, 이를 pDZΔN2131-PgapA-Haq로 명명하였다.

Cupriavidus pinatubonensis 유래 단백질(이하, Cpi, 서열번호 3)를 코딩하는 유전자(이하, cpi, 서열번호 4)의 염기서열 정보를 미국보건원 진뱅크(NIH GenBank)로부터 획득하였다. Cupriavidus pinatubonensis 유래 cpi를 증폭시키기 위하여, Cupriavidus pinatubonensis 균주(KCTC22125)의 염색체 DNA를 주형으로 하여 서열번호 24와 서열번호 25의 프라이머 쌍을 이용하여 PCR을 수행하였다. PCR 반응을 위한 중합효소로는 PfuUltraTM 고-신뢰 DNA 폴리머라제(Stratagene)를 사용하였으며, PCR 조건은 다음과 같이 하였다: 변성 95℃, 30초; 어닐링 55℃, 30초; 및 중합반응 72℃, 2분을 28회 반복한 후, 72℃에서 5분간 중합반응을 수행. 그 결과 945bp의 cpi(서열번호 4)를 포함한 977bp의 cpi 단편을 수득하였다. cpi와 연결 가능한 PgapA 단편을 수득하기 위하여, ATCC13032의 염색체를 주형으로 하여 서열번호 22과 서열번호 26의 프라이머 쌍을 이용하여 PCR을 수행하였다. PCR 반응을 위한 중합효소로는 PfuUltraTM 고-신뢰 DNA 폴리머라제(Stratagene)를 사용하였으며, PCR 조건은 다음과 같이 하였다: 변성 95℃, 30초; 어닐링 55℃, 30초; 및 중합반응 72℃, 1분을 28회 반복한 후, 72℃에서 5분간 중합반응을 수행. 그 결과 409bp의 PgapA(서열번호 15)를 포함한 441bp의 PgapA 단편을 수득하였다. 상기 수득된 cpi 편과 PgapA 단편, 그리고 ScaI 제한효소로 절단된 pDZΔN2131 벡터를 깁슨 어셈블리 방법을 이용하여 클로닝하여, 재조합 플라스미드를 획득하였으며, 이를 pDZΔN2131-PgapA-Cpi로 명명하였다.

Kluyvera cryocrescens 유래 단백질(이하, Kcr, 서열번호 5)를 코딩하는 유전자(이하, kcr, 서열번호 6)의 염기서열 정보를 미국보건원 진뱅크(NIH GenBank)로부터 획득하였다. Kluyvera cryocrescens 유래 kcr를 증폭시키기 위하여, Kluyvera cryocrescens 균주(KCTC2580)의 염색체 DNA를 주형으로 하여 서열번호 29와 서열번호 30의 프라이머 쌍을 이용하여 PCR을 수행하였다. PCR 반응을 위한 중합효소로는 PfuUltraTM 고-신뢰 DNA 폴리머라제(Stratagene)를 사용하였으며, PCR 조건은 다음과 같이 하였다: 변성 95℃, 30초; 어닐링 55℃, 30초; 및 중합반응 72℃, 2분을 28회 반복한 후, 72℃에서 5분간 중합반응을 수행. 그 결과 882bp의 kcr(서열번호 6)를 포함한 914bp의 kcr단편을 수득하였다. kcr와 연결 가능한 PgapA 단편을 수득하기 위하여, ATCC13032의 염색체를 주형으로 서열번호 24과 서열번호 31의 프라이머 쌍을 이용하여 PCR을 수행하였다. PCR 반응을 위한 중합효소로는 PfuUltraTM 고-신뢰 DNA 폴리머라제(Stratagene)를 사용하였으며, PCR 조건은 다음과 같이 하였다: 변성 95℃, 30초; 어닐링 55℃, 30초; 및 중합반응 72℃, 1분을 28회 반복한 후, 72℃에서 5분간 중합반응을 수행. 그 결과 409bp의 PgapA(서열번호 15)를 포함한 441bp의 PgapA 단편을 수득하였다. 상기 수득된 kcr 단편과 PgapA 단편, 그리고 ScaI 제한효소로 절단된 pDZΔN2131 벡터를 깁슨 어셈블리 방법을 이용하여 클로닝하여, 재조합 플라스미드를 획득하였으며, 이를 pDZΔN2131-PgapA-Kcr로 명명하였다.

Corynebacterium stationis 유래 단백질(이하, Cst, 서열번호 7)를 코딩하는 유전자(이하, cst, 서열번호 8)의 염기서열 정보를 미국보건원 진뱅크(NIH GenBank)로부터 획득하였다. Corynebacterium stationis 유래 cst를 증폭시키기 위하여, Corynebacterium stationis 균주(ATCC6872)의 염색체 DNA를 주형으로 하여 서열번호 32와 서열번호 33의 프라이머 쌍을 이용하여 PCR을 수행하였다. PCR 반응을 위한 중합효소로는 PfuUltraTM 고-신뢰 DNA 폴리머라제(Stratagene)를 사용하였으며, PCR 조건은 다음과 같이 하였다: 변성 95℃, 30초; 어닐링 55℃, 30초; 및 중합반응 72℃, 2분을 28회 반복한 후, 72℃에서 5분간 중합반응을 수행. 그 결과 717bp의 cst (서열번호 8)를 포함한 749bp의 cst 단편을 수득하였다. cst 와 연결 가능한 PgapA 단편을 수득하기 위하여, ATCC13032의 염색체를 주형으로 서열번호 24과 서열번호 34의 프라이머 쌍을 이용하여 PCR을 수행하였다. PCR 반응을 위한 중합효소로는 PfuUltraTM 고-신뢰 DNA 폴리머라제(Stratagene)를 사용하였으며, PCR 조건은 다음과 같이 하였다: 변성 95℃, 30초; 어닐링 55℃, 30초; 및 중합반응 72℃, 1분을 28회 반복한 후, 72℃에서 5분간 중합반응을 수행하였다. 그 결과 409bp의 PgapA(서열번호 15)를 포함한 441bp의 PgapA 단편을 수득하였다. 수득된 cst 단편과 PgapA 단편, 그리고 ScaI 제한효소로 절단된 pDZΔN2131 벡터를 깁슨 어셈블리 방법을 이용하여 클로닝하여, 재조합 플라스미드를 획득하였으며, 이를 pDZΔN2131-PgapA-Cst로 명명하였다.

Leucobacter salsicius 유래 단백질(이하, LsaFE, 서열번호 9, 10)를 코딩하는 오페론(이하, lsa, 서열번호 11)의 염기서열 정보를 미국보건원 진뱅크(NIH GenBank)로부터 획득하였다. Leucobacter salsicius 유래 lsa 를 증폭시키기 위하여 Leucobacter salsicius 균주(KCTC19904)의 염색체 DNA를 주형으로 하여 서열번호 35와 서열번호 36의 프라이머 쌍을 이용하여 PCR을 수행하였다. PCR 반응을 위한 중합효소로는 PfuUltraTM 고-신뢰 DNA 폴리머라제(Stratagene)를 사용하였으며, PCR 조건은 다음과 같이 하였다: 변성 95℃, 30초; 어닐링 55℃, 30초; 및 중합반응 72℃, 2분을 28회 반복한 후, 72℃에서 5분간 중합반응을 수행. 그 결과 1048bp의 lsa (서열번호 11)를 포함한 1080bp의 lsa 단편을 수득하였다. lsa 와 연결 가능한 PgapA 단편을 수득하기 위하여, ATCC13032의 염색체를 주형으로 서열번호 24과 서열번호 37의 프라이머 쌍을 이용하여 PCR을 수행하였다. PCR 반응을 위한 중합효소로는 PfuUltraTM 고-신뢰 DNA 폴리머라제(Stratagene)를 사용하였으며, PCR 조건은 다음과 같이 하였다: 변성 95℃, 30초; 어닐링 55℃, 30초; 및 중합반응 72℃, 1분을 28회 반복한 후, 72℃에서 5분간 중합반응을 수행. 그 결과 409bp의 PgapA(서열번호 15)를 포함한 441bp의 PgapA 단편을 수득하였다. 수득된 lsa 단편과 PgapA 단편, 그리고 ScaI 제한효소로 절단된 pDZΔN2131 벡터를 깁슨 어셈블리 방법을 이용하여 클로닝하여, 재조합 플라스미드를 획득하였으며, 이를 pDZΔN2131-PgapA-Lsa로 명명하였다.

Dermabacter vaginalis 유래 단백질(이하, DvaFE, 서열번호 12, 13)를 코딩하는 오페론(이하, dva, 서열번호 14)의 염기서열 정보를 미국보건원 진뱅크(NIH GenBank)로부터 획득하였다. Dermabacter vaginalis 유래 dva 를 증폭시키기 위하여, Dermabacter vaginalis 균주(KCTC39585)의 염색체 DNA를 주형으로 하여 서열번호 38와 서열번호 39의 프라이머 쌍을 이용하여 PCR을 수행하였다. PCR 반응을 위한 중합효소로는 PfuUltraTM 고-신뢰 DNA 폴리머라제(Stratagene)를 사용하였으며, PCR 조건은 다음과 같이 하였다: 변성 95℃, 30초; 어닐링 55℃, 30초; 및 중합반응 72℃, 2분을 28회 반복한 후, 72℃에서 5분간 중합반응을 수행. 그 결과 1081bp의 dva (서열번호 14)를 포함한 1113bp의 dva 단편을 수득하였다. dva 와 연결 가능한 PgapA 단편을 수득하기 위하여, ATCC13032의 염색체를 주형으로 서열번호 24과 서열번호 40의 프라이머 쌍을 이용하여 PCR을 수행하였다. PCR 반응을 위한 중합효소로는 PfuUltraTM 고-신뢰 DNA 폴리머라제(Stratagene)를 사용하였으며, PCR 조건은 다음과 같이 하였다: 변성 95℃, 30초; 어닐링 55℃, 30초; 및 중합반응 72℃, 1분을 28회 반복한 후, 72℃에서 5분간 중합반응을 수행. 그 결과 409bp의 PgapA(서열번호 15)를 포함한 441bp의 PgapA 단편을 수득하였다. 수득된 dva 단편과 PgapA 단편, 그리고 ScaI 제한효소로 절단된 pDZΔN2131 벡터를 깁슨 어셈블리 방법을 이용하여 클로닝하여, 재조합 플라스미드를 획득하였으며, 이를 pDZΔN2131-PgapA-Dva로 명명하였다.

상기 외래 L-히스티딘 배출 유전자 후보들의 L-히스티딘 배출능을 확인하기 위하여, 상기 제작된 NCgl2131 결손 벡터(pDZΔN2131), 외래 L-히스티딘 배출 유전자 후보 도입 벡터 6종(pDZΔN2131-PgapA-Haq, pDZΔN2131-PgapA-Cpi, pDZΔN2131-PgapA-Kcr, pDZΔN2131-PgapA-Cst, pDZΔN2131-PgapA-Lsa, pDZΔN2131-PgapA-Dva)을 각각 코리네박테리움 글루타미쿰 ATCC13032 균주에 도입하였다. 보다 구체적으로, 상기 벡터들을 각각 ATCC13032 균주에 전기천공법으로 형질전환하고, 2차 교차 과정을 거쳐 염색체 상의 NCgl2131 유전자가 결손 되거나 L-히스티딘 배출유전자 후보로 치환되어 있는 7종의 재조합 균주를 제작하였으며, 이들을 각각 ATCC13032ΔN2131 (N2131 유전자 결손), ATCC13032ΔN2131::Haq (N2131 유전자가 haq로 치환), ATCC13032ΔN2131::Cpi (N2131 유전자가 cpi로 치환), ATCC13032ΔN2131::Kcr (N2131 유전자가 kcr로 치환), ATCC13032ΔN2131::Cst (N2131 유전자가 cst로 치환), ATCC13032ΔN2131::Lsa (N2131 유전자가 lsa로 치환), 및 ATCC13032ΔN2131::Dva (N2131 유전자가 dva로 치환)로 명명하였다.

실시예 3. 외래 L-히스티딘 배출 유전자 후보 도입 코리네박티리움 속 균주들의 MIC 측정

상기 실시예 2에서 제작된 7종의 재조합 코리네박테리움 글루타미쿰 균주 (ATCC13032ΔN2131, ATCC13032ΔN2131::Haq, ATCC13032ΔN2131::Cpi, ATCC13032ΔN2131::Kcr, ATCC13032ΔN2131::Cst, ATCC13032ΔN2131::Lsa, 및 ATCC13032ΔN2131::Dva)들의 L-히스티딘 배출능 활성의 보유여부 확인을 위하여, L-히스티딘을 이용한 최소저지농도 (minimum inhibitory concentration, MIC) 실험을 수행하였다. 7종의 균주들을 최소 액체 배지에 30℃에서 24시간 동안 배양한 후, 1 X 10³과 1 X 10⁴ 개의 세포로 희석하여 L-히스티딘이 첨가된 최소 고체 배지에서 스포팅 (spotting) 배양하였다. 상기 사용된 최소 고체 배지 조성은 다음과 같다:

최소 배지 (pH 7.2)

포도당 10g, KH₂PO₄ 1 g, K₂HPO₄ 2 g, MgSO₄ 7H₂O 0.4 g, 요소 2 g, (NH₄)₂SO₄ 5 g, NaCl 0.5 g, 니코틴아미드 5 ㎍, 칼슘-판토텐산 0.1 ㎍, 바이오틴 0.2 ㎍, 티아민 HCl 3 ㎍, Trace elements solution* 1ml (증류수 1 리터 기준), 20g Agar

*Trace elements solution

Na₂B₄O₇ 10H₂O 0.09 g, (NH₄)₆Mo₇O₂₇ 4H₂O 0.04 g, ZnSO₄ 7H₂O 0.01 g, CuSO₄ 5H₂O 0.27 g, MnCl₂ 4H₂O 0.01 g, FeCl₃ 6H₂O 1 g, CaCl₂ 0.01 g (증류수 1 리터 기준)

최소저지농도 실험을 위해, 1 g/L의 L-히스티딘을 최소 고체 배지에 첨가하였고, 48시간 후 세포의 성장을 관찰하여, 그 결과를 하기의 표 2에 나타내었다:

L-히스티딘이 포함된 최소배지에서 외래 L-히스티딘 배출 유전자 후보 도입 코리네박티리움 속 균주들의 성장 정도

균주	L-히스티딘 미포함 최소배지	L-히스티딘 1 g/L 포함 최소배지
ATCC13032ΔN2131	++++	+
ATCC13032ΔN2131::Haq	++++	+
ATCC13032ΔN2131::Cpi	++++	+
ATCC13032ΔN2131::Kcr	++++	+
ATCC13032ΔN2131::Cst	++++	+
ATCC13032ΔN2131::Lsa	++++	+
ATCC13032ΔN2131::Dva	++	+++

(표 2에서, + 개수는 균주들의 상대적 성장 정도를 나타내는 것으로, 각각 다음을 나타냄:+ : single colony는 형성되지 못하나 heavy(single colony로 성장되지 못하고 뭉쳐서 자라는 형태)는 형성됨;

++ : heavy 형성되고 single colony 5개 미만 형성됨;

+++ : heavy 형성되고 single colony 50개 미만 형성됨;

++++ : heavy가 single colony 구분되지 않게 형성됨)

표 2에 나타난 바와 같이, ATCC13032ΔN2131::Dva 균주를 제외한 모든 균주가 L-히스티딘 미포함 최소배지에서 원활히 성장하였다. 그러나 L-히스티딘이 1g/L 포함된 최소배지에서는 대부분의 L-히스티딘 배출 후보 유전자들이 도입된 균주들의 성장이 미미했으며, Dermabacter vaginalis 유래 유전자가 도입된 ATCC13032ΔN2131::Dva 균주만 ATCC13032ΔN2131 대비 월등한 성장을 보였다. 이는, 도입된 Dermabacter vaginalis 유래 단백질이 최소저지농도 이상의 L-히스티딘 포함 배지에서도 L-히스티딘 배출능을 가질 수 있음을 보여준다.

이로부터 Dermabacter vaginalis 유래 단백질 Dva를 코리네박테리움 균주에 최소저지농도 이상의 L-히스티딘에 대한 내성을 부여하며 L-히스티딘 특이 배출능을 갖는 단백질로 선택하였다.

실시예 4. 코리네박테리움 유래 L-히스티딘 생산 균주 KCCM 80179 기반 Dermabacter vaginalis 유래 유전자 도입 균주 제작 및 L-히스티딘 생산능 평가

Dermabacter vaginalis 유래 단백질 Dva의 L-히스티딘 배출능을 확인하기 위하여, Dermabacter vaginalis 유래 유전자 dva를 L-히스티딘 생산균주 KCCM 80179(대한민국 출원특허 제10-2019-004693414-682호) 균주에 도입하였다.

이를 위하여, 실시예 2에서 제작된 벡터 pDZΔN2131, 및 pDZΔN2131-PgapA-Dva를 각각 KCCM80179 균주에 전기천공법으로 형질전환하고, 2차 교차 과정을 거쳐 염색체 상의 NCgl2131 유전자가 결손 되거나 L-히스티딘 배출 유전자 후보 (dva)로 치환되어 있는 균주 2종을 제작하였으며, 이를 각각 KCCM 80179ΔN2131 (NCgl2131 유전자가 결손) 및 KCCM 80179ΔN2131-PgapA-Dva (NCgl2131 유전자가 dva로 치환)으로 명명하였다.

상기 제작된 KCCM 80179ΔN2131 및 KCCM 80179ΔN2131-PgapA-Dva 균주의 L-히스티딘 생산능을 확인하기 위하여, 다음과 같은 방법으로 배양하였다: KCCM 80179ΔN2131 및 KCCM 80179ΔN2131-PgapA-Dva 균주를 활성화 배지에서 16시간 동안 배양한 후, 종 배지 25 ㎖을 함유하는 250 ㎖ 코너-바플 플라스크에 각 균주들을 접종하고, 30 ℃에서 20 시간 동안, 200 rpm으로 진탕 배양하였다. 그런 다음, 생산 배지 25 ㎖을 함유하는 250 ㎖ 코너-바플 플라스크에 1 ㎖의 종 배양액을 접종하고 30 ℃에서 48시간 동안, 200 rpm에서 진탕 배양하였다. 상기 배양에 사용된 배지 조성은 다음과 같다:

<활성화 배지>

육즙 1%(w/v), 폴리펩톤 1%(w/v), 소듐클로라이드 0.5%(w/v), 효모엑기스 1%(w/v), 한천 2%(w/v), pH 7.2

<종 배지>

포도당 5%(w/v), 박토펩톤 1%(w/v), 소듐클로라이드 0.25%(w/v), 효모엑기스 1%(w/v), 요소 0.4%(w/v), pH 7.2

<생산 배지>

포도당 10%(w/v), 황산암모늄 2%(w/v), 제1인산칼륨 0.1%(w/v), 황산마그네슘7수염 0.05%(w/v), CSL(옥수수 침지액) 2.0%(w/v), 비오틴 200 ㎍/L, 탄산칼슘, pH 7.2,

배양 종료 후, HPLC에 의해 L-히스티딘 생산량 (배지 내 히스티딘 함량)을 측정하여, 그 결과를 다음의 표 3에 나타내었다:

KCCM 80179 유래 Dermabacter vaginalis 유래 유전자 도입 균주의 L-히스티딘 생산량

	Cell OD ₆₀₀	사용한 포도당 (g/L)	히스티딘 생산량 (g/L)
KCCM 80179	51.4	100	14.1
KCCM 80179ΔN2131	51.6	100	13.9
KCCM 80179ΔN2131-PgapA-Dva	42.6	100	17.1

표 3에 나타난 바와 같이, NCgl2131 결손 균주는 모균주인 KCCM 80179 균주와 동등 정도의 L-히스티딘 생산능을 가지는 반면, Dermabacter vaginalis 유래 유전자가 도입된 KCCM 80179ΔN2131-PgapA-Dva 균주는 NCgl2131 결손 균주 및 모균주인 KCCM 80179 균주 대비 L-히스티딘 생산능이 각각 23% 및 21% 이상 증가됨을 확인하였다. 상기 실시예 3 및 4의 결과를 통해, Dermabacter vaginalis 유래 유전자 도입을 통해 최소저해농도 이상의 L-히스티딘 농도에 대한 내성이 증가될 뿐만 아니라, L-히스티딘 생산능도 크게 증가됨을 확인하였다. 이러한 결과는 Dermabacter vaginalis 유래 단백질이 L-히스티딘을 특이적으로 배출할 수 있는 L-히스티딘 배출 단백질임을 입증한다.

실시예 5. Dermabacter vaginalis 유래 L-히스티딘 배출자 유사 단백질 추가 확보

상기 실시예 3과 4에서 Dermabacter vaginalis 유래 단백질의 L-히스티딘 배출능을 확인하였으므로, 상기 단백질과 아미노산 서열 상동성이 높은 유사 단백질을 추가로 확보하기 위하여, DvaFE 중 DvaF의 서열(서열번호 12)을 query로 이용하여 BLAST 탐색을 수행하였다 (표 4 참조).

상기 BLAST 탐색 결과, 60% 이상의 서열 상동성을 나타내고 Dermabacter 속에 속하지 않는 L-히스티딘 배출자 후보 2종을 추가로 선정하여, 다음의 표 5에 나타내었다:

L-히스티딘 배출자 추가 후보 리스트

	No.	균 주	Protein Ref Seq.	gDNA Ref Seq.	생물 안전도	단백질 서열	유전자 서열
DvaFE 기반	7	Helcobacillus massiliensis	WP_055090792.1 (HmaF)	NZ_CYUG01000017.1	2	서열번호 41 (서열번호 12와 95% 상동성 가짐)	서열번호 66
			WP_055090293.1 (HmaE)			서열번호 42 (서열번호 13과 95% 상동성 가짐)	서열번호 67
			HmaFE			서열번호 41 및 42	서열번호 43 (HmaFE 오페론)
	8	Mycobacterium abscessus subsp.abscessus	SHX01622.1 (MabF)	FSEE01000013.1	1	서열번호 44 (서열번호 12와 98% 상동성 가짐)	서열번호 68
			SHX01653.1 (MabE)			서열번호 45(서열번호 13과 99% 상동성 가짐)	서열번호 69
			MabFE			서열번호 44 및 45	서열번호 46 (MabFE 오페론)

실시예 6. 추가 외래 L-히스티딘 배출 유전자 후보 도입 벡터 제작

상기 실시예 5에서 추가 선정된 L-히스티딘 배출 유전자 후보 2종을 코리네 박테리움 속 균주에 도입하기 위한 벡터 2종을 제작하였다. 실시예 2와 동일하게 NCgl2131 유전자를 결손 site로, PgapA를 프로모터로 사용하였다.

Helcobacillus massiliensis 유래 단백질(이하, HmaFE, 서열번호 41, 42)을 코딩하는 오페론(이하, hma, 서열번호 43)의 염기서열 정보를 미국보건원 진뱅크(NIH GenBank)로부터 획득하였다. haq DNA를 수득하기 위하여 Bionics 사(社)의 진합성 서비스를 이용하여 DNA를 합성하였다. 합성된 DNA를 증폭하기 서열번호 47와 서열번호 48의 프라이머 쌍을 이용하여 PCR을 수행하였다. PCR 반응을 위한 중합효소로는 PfuUltraTM 고-신뢰 DNA 폴리머라제(Stratagene)를 사용하였으며, PCR 조건은 다음과 같이 하였다: 변성 95℃, 30초; 어닐링 55℃, 30초; 및 중합반응 72℃, 2분을 28회 반복한 후, 72℃에서 5분간 중합반응을 수행. 그 결과 1081bp의 hma (서열번호 43)를 포함한 1113bp의 hma 단편을 수득하였다. hma 와 연결 가능한 PgapA 단편을 수득하기 위하여, ATCC13032의 염색체를 주형으로 서열번호 24과 서열번호 49의 프라이머 쌍을 이용하여 PCR을 수행하였다. PCR 반응을 위한 중합효소로는 PfuUltraTM 고-신뢰 DNA 폴리머라제(Stratagene)를 사용하였으며, PCR 조건은 다음과 같이 하였다: 변성 95℃, 30초; 어닐링 55℃, 30초; 및 중합반응 72℃, 1분을 28회 반복한 후, 72℃에서 5분간 중합반응을 수행. 그 결과 409bp의 PgapA(서열번호 15)를 포함한 441bp의 PgapA 단편을 수득하였다. 수득된 hma 단편과 PgapA 단편, 그리고 ScaI 제한효소로 절단된 pDZΔN2131 벡터를 깁슨 어셈블리 방법을 이용하여 클로닝하여, 재조합 플라스미드를 획득하였으며, 이를 pDZΔN2131-PgapA-Hma로 명명하였다.

Mycobacterium abscessus subsp.abscessus 유래 단백질(이하, MabFE, 서열번호 44, 45)을 코딩하는 오페론(이하, mab, 서열번호 46)의 염기서열 정보를 미국보건원 진뱅크(NIH GenBank)로부터 획득하였다. mab DNA를 수득하기 위하여 Bionics 사(社)의 진합성 서비스를 이용하여 DNA를 합성하였다. 합성된 DNA를 증폭하기 서열번호 50와 서열번호 51의 프라이머 쌍을 이용하여 PCR을 수행하였다. PCR 반응을 위한 중합효소로는 PfuUltraTM 고-신뢰 DNA 폴리머라제(Stratagene)를 사용하였으며, PCR 조건은 다음과 같이 하였다: 변성 95℃, 30초; 어닐링 55℃, 30초; 및 중합반응 72℃, 2분을 28회 반복한 후, 72℃에서 5분간 중합반응을 수행. 그 결과 1081bp의 mab(서열번호 46)를 포함한 1113bp의 mab 단편을 수득하였다. mab 와 연결 가능한 PgapA 단편을 수득하기 위하여, ATCC13032의 염색체를 주형으로 서열번호 24과 서열번호 52의 프라이머 쌍을 이용하여 PCR을 수행하였다. PCR 반응을 위한 중합효소로는 PfuUltraTM 고-신뢰 DNA 폴리머라제(Stratagene)를 사용하였으며, PCR 조건은 다음과 같이 하였다: 변성 95℃, 30초; 어닐링 55℃, 30초; 및 중합반응 72℃, 1분을 28회 반복한 후, 72℃에서 5분간 중합반응을 수행. 그 결과 409bp의 PgapA(서열번호 15)를 포함한 441bp의 PgapA 단편을 수득하였다. 수득된 mab 단편과 PgapA 단편, 그리고 ScaI 제한효소로 절단된 pDZΔN2131 벡터를 깁슨 어셈블리 방법을 이용하여 클로닝하여, 재조합 플라스미드를 획득하였으며, 이를 pDZΔN2131-PgapA-Mab로 명명하였다.

실시예 7. L-히스티딘 생산 균주 KCCM 80179 기반 Helcobacillus massiliensis 유래, Mycobacterium abscessus subsp.abscessus 유래 유전자 도입 균주 제작 및 L-히스티딘 생산능 평가

Helcobacillus massiliensis 유래 단백질 Hma 및 Mycobacterium abscessus subsp.abscessus 유래 단백질 Mab가 L-히스티딘 배출능을 갖는지 확인하기 위하여, hma와 mab를 각각 L-히스티딘 생산균주 KCCM 80179 균주에 도입하였다.

이를 위해 실시예 6에서 제작된 벡터 pDZΔN2131-PgapA-Hma 및 pDZΔN2131-PgapA-Mab를 각각 KCCM80179 균주에 전기천공법으로 형질전환하고, 2차 교차 과정을 거쳐 염색체 상의 NCgl2131 유전자가 L-히스티딘 배출유전자 후보로 치환되어 있는 균주 2종을 제작하였으며, 이를 각각 KCCM 80179ΔN2131-PgapA-Hma (NCgl2131 유전자가 hma로 치환) 및 KCCM 80179ΔN2131-PgapA-Mab (NCgl2131 유전자가 mab로 치환)으로 명명하였다.

상기 제작된 KCCM 80179ΔN2131-PgapA-Hma 및 KCCM 80179ΔN2131-PgapA-Mab 균주의 L-히스티딘 생산능을 확인하기 위하여, 상기 균주를 실시예 4에서 수행한 방법으로 배양하고 L-히스티딘 생산량을 측정하였다. 대조군으로 실시예 4에서 제작된 KCCM 80179ΔN2131 균주와 KCCM 80179ΔN2131-PgapA-Dva 균주에 대하여 동일한 방법으로 배양 및 L-히스티딘 생산량(배지 내 히스티딘 함량) 측정을 수행하였다. 상기 얻어진 결과를 표 6에 나타내었다.

KCCM 80179 유래 Helcobacillus massiliensis 유래 유전자 또는 Mycobacterium abscessus subsp.abscessus 유래 유전자 도입 균주의 L-히스티딘 생산량

	OD	사용한 포도당 (g/L)	히스티딘 생산량 (g/L)
KCCM 80179	51.1	100	14.1
KCCM 80179ΔN2131	50.5	100	13.9
KCCM 80179ΔN2131-PgapA-Dva	41.6	100	17.1
KCCM 80179ΔN2131-PgapA-Hma	42.8	100	16.4
KCCM 80179ΔN2131-PgapA-Mab	44.1	100	16.1

표 6에 나타난 바와 같이, KCCM 80179ΔN2131-PgapA-Hma 균주 및 KCCM 80179ΔN2131-PgapA-Mab 균주는 모균주인 KCCM 80179 균주 대비 L-히스티딘 생산량이 각각 18% 및 15.8% 증가하였다. 이러한 결과는 Helcobacillus massiliensis 유래 단백질과 Mycobacterium abscessus subsp.abscessus 유래 단백질도 L-히스티딘을 특이적으로 배출할 수 있는 L-히스티딘 배출자로 선별될 수 있음을 보여준다.

실시예 8. L-히스티딘 생산 균주 CA14-737 기반 Dermabacter vaginalis 유래 , Helcobacillus massiliensis 유래, Mycobacterium abscessus subsp . abscessus 유래 유전자 도입 균주 제작 및 L-히스티딘 생산능 평가

상기 Dermabacter vaginalis 유래 단백질 Dva, Helcobacillus massiliensis 유래 단백질 Hma, 및 Mycobacterium abscessus subsp.abscessus 유래 단백질 Mab의 L-히스티딘 배출능을 다시 한번 확인하기 위하여, 야생형의 코리네박테리움 글루타미쿰 ATCC13032 유래로 L-히스티딘에 의한 피드백 제한 해소 HisG 폴리펩티드 변이 도입, L-히스티딘 생합성 유전자가 강화된 L-히스티딘 생산균주 CA14-737(대한민국 출원특허 제10-2019-004693414-682호) 균주에 도입하였다.

이를 위해 실시예 2와 6에서 제작된 벡터 4종(pDZΔN2131, pDZΔN2131-PgapA-Dva, pDZΔN2131-PgapA-Hma, pDZΔN2131-PgapA-Mab)을 각각 CA14-737 균주에 전기천공법으로 형질전환하고, 2차 교차 과정을 거쳐 염색체 상의 NCgl2131 유전자가 결손되거나 L-히스티딘 배출유전자 후보로 치환되어 있는 균주 4종을 제작하였으며, 이를 각각 CA14-737ΔN2131, CA14-737ΔN2131-PgapA-Dva, CA14-737ΔN2131-PgapA-Hma, 및 CA14-737ΔN2131-PgapA-Mab으로 명명하였다.

상기 제작된 CA14-737ΔN2131, CA14-737ΔN2131-PgapA-Dva, CA14-737ΔN2131-PgapA-Hma, CA14-737ΔN2131-PgapA-Mab 균주의 L-히스티딘 생산능을 확인하기 위하여, 실시예 4에서 수행한 방법으로 배양하고 L-히스티딘 생산량(배지 내 히스티딘 함량)을 측정하여, 그 결과를 다음의 표 7에 나타내었다:

CA14-737 유래 Dermabacter vaginalis 유래 유전자, Helcobacillus massiliensis 유래 유전자, Mycobacterium abscessus subsp.abscessus 유래 유전자 도입 균주의 L-히스티딘 생산량

	OD	사용한 포도당 (g/L)	히스티딘 생산량 (g/L)
CA14-737	89.6	100	4.0
CA14-737ΔN2131	90.1	100	4.1
CA14-737ΔN2131-PgapA-Dva	71.8	100	6.5
CA14-737ΔN2131-PgapA-Hma	73.8	100	5.9
CA14-737ΔN2131-PgapA-Mab	70.1	100	6.1

표 7에 나타난 바와 같이, Dermabacter vaginalis 유래 유전자가 도입된 CA14-737ΔN2131-PgapA-Dva 균주는 모균주인 CA14-737 균주 대비 L-히스티딘 생산량이 62.5% 증가하였고, Helcobacillus massiliensis 유래 유전자가 도입된 CA14-737ΔN2131-PgapA-Hma 균주는 47.5% 증가 하였으며, Mycobacterium abscessus subsp.abscessus 유래 유전자가 도입된 CA14-737ΔN2131-PgapA-Mab 균주는 52.5% 증가하였다. 이를 통해 Dermabacter vaginalis 유래 단백질, Helcobacillus massiliensis 유래 단백질, 및 Mycobacterium abscessus subsp.abscessus 유래 단백질 모두 L-히스티딘을 특이적으로 배출할 수 있는 L-히스티딘 배출자임을 다시 한번 확인하였다.상기 제작된 재조합 균주들 중에서, CA14-737ΔN2131-PgapA-Dva 균주 (Corynebacterium glutamicum CA14-0875)를 2020년09월21일자로 대한민국 서울시 서대문구에 소재하는 부다페스트 조약하의 국제기탁기관인 한국미생물보존센터(KCCM)에 국제 기탁하여 KCCM12793P로 기탁번호를 부여받았다.

실시예 9. Dermabacter vaginalis 유래 , Helcobacillus massiliensis 유래, Mycobacterium abscessus subsp.abscessus 유래 단백질 대장균 발현용 벡터 제작

상기 선별된 L-히스티딘 배출자가 다양한 균주에서 L-히스티딘 생산능을 나타내는지 확인하였다. 이를 위하여, 대장균에서 Dermabacter vaginalis 유래, Helcobacillus massiliensis 유래, Mycobacterium abscessus subsp.abscessus 유래 단백질을 각각 발현시킬 수 있는 벡터를 제작하였다. 각각의 유전자는 대장균 발현 벡터인 pCC1BAC(이하, pBAC, Epicenter corp.)에 클로닝 되었으며, 대장균 균주 MG1655의 yccA 프로모터(이하, PyccA, 서열번호 53) 하에서 발현시켰다.

Dermabacter vaginalis 유래 dva를 증폭하기 위하여 Dermabacter vaginalis 균주의 염색체 DNA를 주형으로 하여 서열번호 54와 서열번호 55의 프라이머 쌍을 이용하여 PCR을 수행하였다. PCR 반응을 위한 중합효소로는 PfuUltraTM 고-신뢰 DNA 폴리머라제(Stratagene)를 사용하였으며, PCR 조건은 다음과 같이 하였다: 변성 95℃, 30초; 어닐링 55℃, 30초; 및 중합반응 72℃, 2분을 28회 반복한 후, 72℃에서 5분간 중합반응을 수행. 그 결과 1081bp의 dva (서열번호 10)를 포함한 1113bp의 dva 단편을 수득하였다. dva 와 연결 가능한 PyccA 단편을 수득하기 위하여 서열번호 MG1655의 염색체를 주형으로 56과 서열번호 57의 프라이머 쌍을 이용하여 PCR을 수행하였다. PCR 반응을 위한 중합효소로는 PfuUltraTM 고-신뢰 DNA 폴리머라제(Stratagene)를 사용하였으며, PCR 조건은 다음과 같이 하였다: 변성 95℃, 30초; 어닐링 55℃, 30초; 및 중합반응 72℃, 1분을 28회 반복한 후, 72℃에서 5분간 중합반응을 수행. 그 결과 100bp의 PyccA(서열번호 53)를 포함한 132bp의 PyccA 단편을 수득하였다. 수득된 dva 단편과 PyccA 단편, 그리고 EcoRI 제한효소로 절단된 pBAC 벡터를 깁슨 어셈블리 방법을 이용하여 클로닝하여, 재조합 플라스미드를 획득하였으며, 이를 pBAC-PyccA-Dva로 명명하였다.

Helcobacillus massiliensis 유래 hma를 증폭하기 위하여, 실시예 6에서 제작한 pDZΔN2131-PgapA-Hma 벡터 DNA를 주형으로 하여 서열번호 58와 서열번호 59의 프라이머 쌍을 이용하여 PCR을 수행하였다. PCR 반응을 위한 중합효소로는 PfuUltraTM 고-신뢰 DNA 폴리머라제(Stratagene)를 사용하였으며, PCR 조건은 다음과 같이 하였다: 변성 95℃, 30초; 어닐링 55℃, 30초; 및 중합반응 72℃, 2분을 28회 반복한 후, 72℃에서 5분간 중합반응을 수행. 그 결과 1081bp의 hma (서열번호 43)를 포함한 1113bp의 hma 단편을 수득하였다. hma 와 연결 가능한 PyccA 단편을 수득하기 위하여 MG1655의 염색체를 주형으로 서열번호 56과 서열번호 60의 프라이머 쌍을 이용하여 PCR을 수행하였다. PCR 반응을 위한 중합효소로는 PfuUltraTM 고-신뢰 DNA 폴리머라제(Stratagene)를 사용하였으며, PCR 조건은 다음과 같이 하였다: 변성 95℃, 30초; 어닐링 55℃, 30초; 및 중합반응 72℃, 1분을 28회 반복한 후, 72℃에서 5분간 중합반응을 수행. 그 결과 100bp의 PyccA(서열번호 53)를 포함한 132bp의 PyccA 단편을 수득하였다. 수득된 hma 단편과 PyccA 단편, 그리고 EcoRI 제한효소로 절단된 pBAC 벡터를 깁슨 어셈블리 방법을 이용하여 클로닝하여, 재조합 플라스미드를 획득하였으며, 이를 pBAC-PyccA-Hma로 명명하였다.

Mycobacterium abscessus subsp.abscessus 유래 mab를 증폭하기 위하여, 실시예 6에서 제작한 pDZΔN2131-PgapA-Mab 벡터 DNA를 주형으로 하여 서열번호 61와 서열번호 62의 프라이머 쌍을 이용하여 PCR을 수행하였다. PCR 반응을 위한 중합효소로는 PfuUltraTM 고-신뢰 DNA 폴리머라제(Stratagene)를 사용하였으며, PCR 조건은 다음과 같이 하였다: 변성 95℃, 30초; 어닐링 55℃, 30초; 및 중합반응 72℃, 2분을 28회 반복한 후, 72℃에서 5분간 중합반응을 수행. 그 결과 1081bp의 mab (서열번호 46)를 포함한 1113bp의 mab 단편을 수득하였다. mab 와 연결 가능한 PyccA 단편을 수득하기 위하여, MG1655의 염색체를 주형으로 서열번호 56과 서열번호 63의 프라이머 쌍을 이용하여 PCR을 수행하였다. PCR 반응을 위한 중합효소로는 PfuUltraTM 고-신뢰 DNA 폴리머라제(Stratagene)를 사용하였으며, PCR 조건은 다음과 같이 하였다: 변성 95℃, 30초; 어닐링 55℃, 30초; 및 중합반응 72℃, 1분을 28회 반복한 후, 72℃에서 5분간 중합반응을 수행. 그 결과 100bp의 PyccA(서열번호 53)를 포함한 132bp의 PyccA 단편을 수득하였다. 수득된 mab 단편과 PyccA 단편, 그리고 EcoRI 제한효소로 절단된 pBAC 벡터를 깁슨 어셈블리 방법을 이용하여 클로닝하여, 재조합 플라스미드를 획득하였으며, 이를 pBAC-PyccA-Mab로 명명하였다.

실시예 10. 대장균 유래 L-히스티딘 생산 균주 기반 Dermabacter vaginalis 유래 유전자 도입 균주 제작 및 L-히스티딘 생산능 평가

대장균 유래 L-히스티딘 생산 균주를 기반으로 새로운 히스티딘 배출자 3종(Dva, Hma, Mab)의 L-히스티딘 배출능을 확인하기 위하여, 상기 제작된 벡터 3종을 기 보고된 유전자형(purR 결손, hisL 결손, hisG^r;The directed modification of Escherichia coli MG1655 to obtain histidine-producing mutants; Applied Biochemistry and Microbiology, 2013, Vol. 49, No. 2, pp. 130-135)을 갖는 CA14-9003e 균주 (MG1655⁺ hisG^r hisL'_Δ ΔpurR)에 도입하였다. 이를 위하여 상기 실시예 9에서 제작된 벡터 3종(pBAC-PyccA-Dva, pBAC-PyccA-Hma, pBAC-PyccA-Mab)와 pBAC 벡터를 각각 도입하여, CA14-9003e/pBAC, CA14-9003e/pBAC-PyccA-Dva, CA14-9003e/pBAC-PyccA-Hma, 및 CA14-9003e/pBAC-PyccA-Mab 균주를 제작하였다.

제작된 CA14-9003e/pBAC, CA14-9003e/pBAC-PyccA-Dva, CA14-9003e/pBAC-PyccA-Hma, CA14-9003e/pBAC-PyccA-Mab 균주의 L-히스티딘 생산능을 확인하기 위하여, 다음과 같은 방법으로 배양하였다. 균주들을 LB 고체 배지(클로람페니콜 25㎍/ml 포함)에서 16시간 동안 배양한 후, LB 액체 배지 25 ㎖을 함유하는 250 ㎖ 코너-바플 플라스크에 각 균주들을 접종하고, 37 ℃에서 20 시간 동안, 200 rpm으로 진탕 배양하였다. 그런 다음, 대장균 생산 배지(Applied Biochemistry and Microbiology, 2013, Vol. 49, No. 2, pp. 130-135) 25 ㎖을 함유하는 250 ㎖ 코너-바플 플라스크에 1 ㎖의 종 배양액을 접종하고 37 ℃에서 48시간 동안, 200 rpm에서 진탕 배양하였다. 상기 배양에 사용된 배지는 다음과 같다:

<대장균 생산배지>

포도당 4%(w/v), 효모추출액 0.2%(w/v), 황산암모늄 1.6%(w/v), 제2인산칼륨3수염 0.06%(w/v), 황산철7수염 0.0005%(w/v), 황산마그네슘 5수염 0.0005%(w/v), 탄산칼슘, pH 7.2,

배양 종료 후 HPLC에 의해 L-히스티딘 생산량(배지 내 히스티딘 함량)을 측정하여 그 결과를 다음의 표 8에 나타내었다

CA14-9003e 유래 Dermabacter vaginalis 유래 유전자, Helcobacillus massiliensis 유래 유전자, Mycobacterium abscessus subsp.abscessus 유래 유전자 도입 균주의 L-히스티딘 생산량

	OD	사용한 포도당 (g/L)	히스티딘 생산량 (g/L)
CA14-9003e/pBAC	23.6	40	3.2
CA14-9003e/pBAC-PgapA-Dva	17.6	40	4.2
CA14-9003e/pBAC-PgapA-Hma	18.7	40	3.9
CA14-9003e/pBAC-PgapA-Mab	18.9	40	3.8

표 8에 나타난 바와 같이, Dermabacter vaginalis 유래 유전자가 도입된 CA14-9003e/pBAC-PgapA-Dva 균주는 모균주인 CA14-9003e/pBAC 균주 대비 L-히스티딘 생산량이 62.5% 증가하였고, Helcobacillus massiliensis 유래 유전자가 도입된 CA14-9003e/pBAC-PgapA-Hma 균주는 21.9% 증가 하였으며, Mycobacterium abscessus subsp.abscessus 유래 유전자가 도입된 CA14-9003e/pBAC-PgapA-Mab 균주는 18.8% 증가하였다. 이를 통해 Dermabacter vaginalis 유래 단백질, Helcobacillus massiliensis 유래 단백질, Mycobacterium abscessus subsp.abscessus 유래 단백질 모두 대장균 L-히스티딘 생산 균주에서도 L-히스티딘을 특이적 배출자로 작동함을 확인하였다.

상기 결과를 통해, Dermabacter vaginalis 유래 단백질과의 상동성이 60% 이상인 단백질을 미생물에 도입시 L-히스티딘을 특이적으로 세포 밖으로 배출하는 배출자로써 작동함을 확인하였다.

이상, 본 명세서에서 개시되는 각각의 설명 및 실시형태는 각각의 다른 설명 및 실시 형태에도 적용될 수 있다. 본 명세서에서 개시된 다양한 요소들의 가능한 모든 조합이 본 명세서에서 제안되는 발명의 범주에 속한다. 또한, 하기 기술되는 구체적인 서술에 의하여 본 명세서의 발명의 범주가 제한된다고 할 수 없으며, 당해 기술분야의 통상의 지식을 가진 자가 본 명세서에 기재된 특정 양태에 대한 다수의 등가물을 인지하거나 확인할 수 있는 한, 이러한 등가물은 본 명세서에서 제안되는 발명에 포함되는 것으로 의도된다.

한국미생물보존센터

KCCM12793P

20200921

<110> CJ CheilJedang Corporation <120> L-Histidine Export Protein and Method of Producing L-Histidine Using the Same <130> DPP20194587KR <160> 69 <170> koPatentIn 3.0 <210> 1 <211> 314 <212> PRT <213> Artificial Sequence <220> <223> Haq protein <400> 1 Met Lys Ser Lys Asn Ala Thr Leu Val Gly Leu Ser Ala Val Val Leu 1 5 10 15 Trp Ser Ala Ile Val Gly Leu Ile Arg Gly Val Ser Glu His Leu Gly 20 25 30 Ala Thr Gly Gly Ala Ala Ala Ile Tyr Thr Val Ala Ser Leu Ile Leu 35 40 45 Leu Val Ser Val Gly Phe Pro Arg Leu Ala Ser Phe Pro Arg Arg Tyr 50 55 60 Leu Leu Trp Gly Ser Val Leu Phe Val Ala Tyr Glu Leu Cys Leu Ser 65 70 75 80 Leu Ser Ile Gly Tyr Ala His Thr Gly Arg Gln Ala Ile Glu Val Gly 85 90 95 Met Val Asn Tyr Leu Trp Pro Thr Phe Thr Leu Val Ala Ala Ile Leu 100 105 110 Phe Gly Gly Gln Arg Ala Thr Leu Leu Val Val Pro Gly Phe Ile Leu 115 120 125 Ser Met Leu Gly Ile Cys Trp Val Leu Gly Gly Asp Gln Gly Leu Asp 130 135 140 Pro Ser Gly Met Leu Ala Asn Ile Arg Asp Asn Pro Leu Ser Tyr Gly 145 150 155 160 Leu Ala Phe Ile Gly Ala Leu Ile Trp Ala Ala Tyr Cys Thr Val Thr 165 170 175 Thr Arg Ile Ala Gln Gly Gln Asn Gly Val Thr Pro Phe Phe Met Leu 180 185 190 Val Ala Leu Ala Leu Trp Val Lys Val Leu Leu Gly Gly His Val Ala 195 200 205 Glu Leu Ser Phe Ser Val Pro Ala Leu Val Tyr Leu Val Leu Ala Ala 210 215 220 Ala Ala Met Gly Leu Gly Tyr Ala Ala Trp Asn Val Gly Ile Leu His 225 230 235 240 Gly Asn Val Thr Val Leu Ala Gly Ala Ser Tyr Phe Ile Pro Val Phe 245 250 255 Ser Ser Ala Leu Ser Ala Leu Leu Leu Arg Ala Pro Leu Pro Thr Ser 260 265 270 Phe Trp Val Gly Ala Ala Leu Val Cys Ala Gly Ser Ile Leu Cys Trp 275 280 285 Arg Ala Thr Arg Ser Leu Asp Leu Ser Lys Glu Pro Ala Ala Arg Ala 290 295 300 Ala Arg Pro Glu Gly Pro Pro Gln Asn Gln 305 310 <210> 2 <211> 945 <212> DNA <213> Artificial Sequence <220> <223> haq gene <400> 2 atgaagagca agaacgcaac cctggtcgga ttgagcgcgg tggtactgtg gagtgccatc 60 gtgggcctga tccgtggcgt gagcgagcat ctcggagcca ccggcggggc ggcggccatt 120 tacacggtgg cttcgctgat cctgctggtg tcggtgggat tcccgcgcct ggcgagtttc 180 ccgcgcaggt atctgctatg gggcagcgtg ctgttcgtgg cttatgaatt gtgcctgtcg 240 ctctcgatcg gttatgccca taccggccgc caggccatcg aagtcggcat ggtcaattac 300 ctctggccga ccttcaccct ggtggcggcc atcctcttcg gaggccagcg cgccacgctg 360 ctggtggtgc caggcttcat cctttccatg ctgggcatct gctgggtgct cgggggcgac 420 caggggctgg atccttccgg catgctggcc aatatccgtg acaatccgct gagctacggc 480 ctggccttca tcggggcctt gatctgggcg gcctactgca ccgtgactac ccgcatcgcc 540 caaggccaga acggggtgac gcctttcttc atgctggtgg cattggcatt gtgggtgaag 600 gtgctgctgg gcgggcatgt ggctgaacta tccttcagtg tgcccgcact ggtctacctg 660 gtgctggctg cggcggcgat ggggctgggc tatgcggcct ggaacgtggg catcctgcat 720 ggcaatgtga cagtgctggc cggtgcctcg tatttcatcc cggtcttttc ttcggccttg 780 tcggccttgc tgctacgtgc gccgctgccc acctcgttct gggtgggcgc tgcgctggtg 840 tgcgccgggt cgatcctgtg ctggcgggct acccgcagcc tggatttgtc aaaagaacct 900 gcagcgcggg cggcacgtcc cgaaggccca cctcagaacc aatag 945 <210> 3 <211> 312 <212> PRT <213> Artificial Sequence <220> <223> Cpi protein <400> 3 Met Gln Ser Thr Arg Lys Ala Thr Leu Ile Gly Leu Ile Ala Ile Leu 1 5 10 15 Leu Trp Ser Ser Ile Val Gly Leu Ile Arg Gly Val Ser Glu Ser Leu 20 25 30 Gly Ala Thr Gly Gly Ala Ala Met Met Tyr Ser Val Ala Ser Val Leu 35 40 45 Leu Met Leu Thr Val Gly Phe Val Arg Leu Arg Glu Phe Pro Arg Arg 50 55 60 Tyr Leu Val Trp Gly Ser Ile Leu Phe Val Ser Tyr Glu Leu Cys Leu 65 70 75 80 Ser Leu Ser Ile Gly Tyr Ser His Ser Gly Arg Gln Ala Ile Glu Val 85 90 95 Gly Met Val Asn Tyr Leu Trp Pro Ser Phe Thr Met Leu Cys Ala Ile 100 105 110 Ala Phe Asn Lys Gln Lys Ala Asn Val Leu Ile Val Pro Gly Phe Leu 115 120 125 Ile Ala Ile Leu Gly Ile Cys Leu Val Leu Gly Gly Glu Gln Gly Leu 130 135 140 Asp Val Ala Gly Met Val Ala Asn Val Arg Asp Asn Pro Leu Ser Tyr 145 150 155 160 Gly Leu Ala Leu Ala Gly Ala Leu Ile Trp Ala Ala Tyr Cys Thr Val 165 170 175 Thr Asn Arg Ile Ala Gly Gly Asn Asn Gly Val Thr Leu Phe Phe Met 180 185 190 Leu Thr Ala Met Ala Leu Trp Ile Lys Tyr Phe Thr Gly Asp His Ala 195 200 205 Pro Met Ala Phe Thr Tyr His Ala Val Ile Tyr Leu Ala Leu Ala Ala 210 215 220 Ser Ala Met Gly Phe Gly Tyr Pro Ala Trp Asn Val Gly Ile Leu His 225 230 235 240 Gly Asn Val Thr Val Leu Ala Gly Ala Ser Tyr Phe Ile Pro Val Ile 245 250 255 Ser Ala Ala Leu Ala Gly Leu Leu Leu His Ile Pro Leu Ser Leu Ala 260 265 270 Phe Trp Lys Gly Ala Ser Leu Val Cys Ala Gly Ser Val Leu Cys Trp 275 280 285 Leu Ala Thr Arg Ala Arg Lys Val Ala Ala Thr Pro Asp Arg Ala Pro 290 295 300 Val Arg Asp Arg Val Trp Lys Gln 305 310 <210> 4 <211> 939 <212> DNA <213> Artificial Sequence <220> <223> cpi gene <400> 4 atgcaaagca cgcgtaaggc cacgttgatc gggctcattg cgatcctgtt gtggagttcc 60 atcgtcggcc tgatccgcgg cgtcagtgaa agcctcggcg cgaccggtgg cgccgccatg 120 atgtactcgg ttgcctccgt cctgcttatg ctgacggttg gcttcgtgcg tctgcgcgaa 180 tttccgcggc gctatctggt ctggggcagc atcctgttcg tctcctacga actgtgcctg 240 tcgctgtcca tcggctattc gcacagcggc aggcaggcga tcgaggtggg gatggtcaat 300 tacctctggc cgtctttcac catgttgtgc gccatcgcct tcaacaagca gaaggcgaac 360 gttctgatcg tgccgggctt cctgattgcg atcctgggta tctgcctggt gctgggcggc 420 gagcagggtc tggatgttgc aggcatggtg gccaatgtca gggacaatcc gctcagctac 480 ggcctcgctt tagcgggcgc gctgatctgg gcggcctatt gcaccgtgac caacaggatt 540 gccggcggca acaacggcgt cacgctgttt ttcatgctca ccgcaatggc gctgtggatc 600 aagtacttca ccggcgacca tgcgccgatg gctttcacat accacgccgt catctacctg 660 gcactggcag cgtcggcgat gggcttcggc tacccggcgt ggaacgtggg catcctgcac 720 ggcaacgtaa cggtgcttgc cggcgcgtcg tatttcatcc ctgtgatttc agccgcactg 780 gctggcttgc tcttgcatat accgctttcg ctggcgttct ggaaaggcgc gtcgctggta 840 tgcgcggggt ccgtgctgtg ctggttggcg acgcgcgcgc gcaaggtggc tgcaacgccc 900 gaccgtgctc cggtccgcga ccgtgtctgg aagcaatga 939 <210> 5 <211> 293 <212> PRT <213> Artificial Sequence <220> <223> Kcr protein <400> 5 Met Asp Lys Lys Arg Ala Thr Leu Ile Gly Phe Ser Ala Ile Ile Leu 1 5 10 15 Trp Ser Thr Met Val Gly Leu Ile Arg Gly Val Ser Glu Gly Leu Gly 20 25 30 Pro Val Gly Gly Ala Ala Met Ile Tyr Ser Leu Ser Gly Leu Leu Leu 35 40 45 Ile Phe Thr Val Gly Phe Pro Gln Leu Arg Gln Ile Pro Pro Arg Tyr 50 55 60 Leu Leu Val Gly Ser Leu Phe Phe Val Ser Tyr Glu Met Cys Leu Ala 65 70 75 80 Leu Ser Leu Gly Tyr Ala Gly Thr Arg Gln Gln Ala Ile Glu Val Gly 85 90 95 Met Val Asn Tyr Leu Trp Pro Ser Leu Thr Ile Leu Phe Ala Ile Ile 100 105 110 Phe Asn Gly Gln Lys Thr Thr Trp Leu Val Ile Pro Gly Leu Leu Leu 115 120 125 Ser Ile Val Gly Val Thr Trp Val Leu Gly Gly Glu His Gly Leu Asp 130 135 140 Leu Ala Glu Ile Arg Ser Asn Val Ile Ser Ser Pro Leu Ser Tyr Ile 145 150 155 160 Leu Ala Phe Val Gly Ala Phe Ile Trp Ala Ala Tyr Cys Thr Val Thr 165 170 175 Ala Lys Tyr Ala Lys Gly Lys Asn Gly Ile Thr Leu Phe Val Leu Phe 180 185 190 Thr Ala Leu Ala Leu Trp Val Lys Phe Leu Met Ser Glu Gln Pro Pro 195 200 205 Met Ile Phe Ser Trp Pro Val Val Ile Lys Leu Val Thr Cys Ala Leu 210 215 220 Ala Leu Gly Phe Ala Tyr Ala Ala Trp Asn Val Gly Ile Leu His Gly 225 230 235 240 Asn Val Ser Leu Leu Ala Ala Ala Ser Tyr Phe Thr Pro Val Leu Ser 245 250 255 Ser Ala Leu Ala Ala Phe Leu Leu Ser Ala Ala Leu Ser Trp Ser Phe 260 265 270 Trp Gln Gly Ala Ala Met Val Cys Gly Gly Ser Leu Leu Cys Trp Tyr 275 280 285 Ala Thr Arg Arg Pro 290 <210> 6 <211> 371 <212> DNA <213> Artificial Sequence <220> <223> kcr gene <400> 6 atggataaga aaagagcgac gctcattgga tttagcgcca ttattttgtg gagtacgatg 60 gtgggtctga ttcgcggcgt aagcgaaggg ctcggcccgg tgggcggagc cgcaatgatt 120 tacagcctca gcggcctgct gctgattttt accgttggct tcccacaatt gcgccaaatt 180 ccaccgcgct atttgctggt aggtagcctg ttttttgtca gctacgaaat gtgcctcgcg 240 ctctcattag gctatgccgg cactcgccaa caggccatcg aagtcggcat ggtgaattat 300 ctctggccta gcctgacgat tttatttgcg attatcttta atggtcaaaa aaccacctgg 360 ctggttatcc c 371 <210> 7 <211> 238 <212> PRT <213> Artificial Sequence <220> <223> Cst protein <400> 7 Met Ser Thr Leu Ser Ile Leu Ile Ala Gly Phe Ala Leu Gly Leu Ser 1 5 10 15 Leu Ile Val Ala Ile Gly Pro Gln Asn Ala Leu Leu Ile Lys Gln Gly 20 25 30 Ile Lys Arg Glu His Val Trp Val Val Ile Ala Ile Cys Ala Val Ser 35 40 45 Asp Ile Ile Leu Ile Ser Gly Gly Thr Ala Gly Val Gly Tyr Leu Val 50 55 60 Glu Thr Phe Pro Thr Ala Leu Val Val Leu Lys Tyr Leu Gly Ala Ile 65 70 75 80 Tyr Leu Ala Tyr Phe Thr Tyr Leu Cys Phe Arg Asp Ala Leu Arg Asp 85 90 95 Lys Val Glu Thr Leu Ser Pro Ala Gln Ile Glu Pro Asn Lys Thr Gln 100 105 110 Gln Ile Asp Ala Phe Asp Gly Gly Asp Leu Gly Gly Ser Ser Val Asp 115 120 125 Thr Arg Arg Arg Thr Thr Arg Leu Arg Gln Gln Val Arg Gln Ser Thr 130 135 140 Trp Val Lys Pro Ala Leu Ala Thr Leu Ala Ile Cys Trp Leu Asn Pro 145 150 155 160 Ala Ala Tyr Val Asp Val Leu Val Met Ile Gly Gly Leu Ala Asn Gln 165 170 175 Tyr Gly Glu Thr Gly Arg Trp Phe Phe Ala Ala Gly Ala Ile Ala Ala 180 185 190 Ser Met Leu Trp Phe Pro Ser Val Gly Leu Ala Ala Ala Lys Phe Ser 195 200 205 His Val Leu Ser Arg Pro Ala Val Trp Arg Gly Ile Asn Phe Gly Ile 210 215 220 Gly Cys Ile Met Ala Leu Leu Thr Ile Lys Leu Leu Leu Thr 225 230 235 <210> 8 <211> 717 <212> DNA <213> Artificial Sequence <220> <223> cst gene <400> 8 atgtcaacgc tgtctatcct catcgccggt ttcgcactag ggctctcact tatcgtagcg 60 attggcccgc aaaatgctct gctgatcaaa cagggcatta aacgcgagca cgtgtgggta 120 gtcattgcga tttgcgcggt gtccgacatt attttgatta gcggtggcac cgcgggggtg 180 ggctatctgg tggagacttt cccgaccgca ctggtggtgc tgaagtatct gggcgcgatt 240 tatctggctt actttactta tctgtgcttt cgcgatgcgt tgcgcgacaa ggttgaaact 300 ctctcccctg cgcagatcga gccgaataag acgcagcaga tcgatgcatt cgatggcggc 360 gacttgggcg gttcttctgt tgatacccgg cggcgcacca cgcgtctgcg ccagcaagta 420 cgccaatcga cctgggtgaa gccagctctt gcgaccttgg cgatttgctg gctgaacccg 480 gcagcttatg tcgatgtgct ggtaatgatt ggcggacttg ccaaccaata cggcgaaacc 540 ggccgatggt tttttgctgc cggtgccatt gcagcgagca tgctgtggtt tcccagcgtt 600 ggtcttgctg ccgcgaagtt ctcgcacgta ctttcgcgcc ctgcggtatg gcgcggcatc 660 aacttcggca ttggctgcat catggcgctg ctgaccatta agctgctgtt gacctag 717 <210> 9 <211> 242 <212> PRT <213> Artificial Sequence <220> <223> LsaF protein <400> 9 Met Ser Pro Ser His Asp Pro Leu Pro Arg Arg Ala Gly Ala Ala Ala 1 5 10 15 Gly Leu Arg Asp Ser Leu Gly Val Gly Leu Gly Ile Phe Pro Leu Gly 20 25 30 Ile Ala Leu Gly Ile Leu Val Ile Gln Ala Gly Leu Pro Trp Trp Leu 35 40 45 Ala Pro Ala Leu Ser Ile Gly Ile Phe Ala Gly Ser Val Glu Leu Leu 50 55 60 Leu Val Ser Met Leu Ala Ala Ala Thr Pro Leu Val Thr Ile Ala Ala 65 70 75 80 Thr Val Phe Ala Val Asn Phe Arg His Val Phe Tyr Ala Phe Ser Phe 85 90 95 Pro Leu Ser Arg Val Arg Pro Gly Leu Pro Arg Ala Tyr Ser Ile Tyr 100 105 110 Ala Met Ile Asp Glu Ala Tyr Ala Thr Tyr Val Leu Met Asp Pro Asp 115 120 125 Arg Leu Ser Ser Ala Arg Met Val Thr Gly Gln Leu Ala Met Gln Leu 130 135 140 Tyr Trp Val Leu Gly Gly Phe Val Gly Ile Met Ile Ala Asn Val Leu 145 150 155 160 Pro Ala Pro Ile Glu Gly Phe Glu Phe Ala Leu Val Ala Leu Phe Val 165 170 175 Val Met Ser Met Asp Ala Ile Arg Gly Lys Arg Glu Leu Pro Ser Ala 180 185 190 Leu Leu Ala Cys Leu Ala Val Thr Val Ala Ile Leu Val Ala Gly Asp 195 200 205 Asn Ala Leu Leu Val Ala Leu Ala Leu Tyr Ser Gly Leu Leu Gly Leu 210 215 220 Arg Tyr Phe Leu Thr Lys Arg Thr Thr Asp Thr Ala Glu Glu Gly Glu 225 230 235 240 Arg Ala <210> 10 <211> 140 <212> PRT <213> Artificial Sequence <220> <223> LsaE protein <400> 10 Met Arg Cys Trp Ser Arg Leu Arg Cys Thr Pro Gly Tyr Trp Gly Cys 1 5 10 15 Ala Ile Ser Ser Pro Ser Glu Pro Arg Thr Leu Arg Arg Arg Ala Ser 20 25 30 Val Pro Ser Thr Glu Tyr Leu Ile Ala Gly Val Val Val Ala Gly Leu 35 40 45 Ile Thr Leu Ala Leu Arg Ala Leu Pro Phe Ala Ala Leu Lys Pro Leu 50 55 60 Arg Lys Ser Lys Leu Val Gln Ala Leu Gly Arg Trp Met Pro Ala Gly 65 70 75 80 Ile Leu Val Ile Leu Ala Val Val Val Leu Arg Asp Gln Leu Ile Ser 85 90 95 Gln Gln Gly Arg Val Trp Pro Val Leu Val Ala Thr Ala Ile Thr Ala 100 105 110 Leu Ala His Leu Leu Ser Lys Arg Arg Ala Leu Val Ser Ile Ala Ala 115 120 125 Gly Thr Ala Cys Tyr Val Leu Leu Leu Asn Phe Phe 130 135 140 <210> 11 <211> 1048 <212> DNA <213> Artificial Sequence <220> <223> lsa gene <400> 11 atgtctccgt cacacgatcc tttaccgcgc cgcgcgggcg ccgcggccgg ccttcgagat 60 tctctcgggg tcggcctcgg cattttcccc ttgggcattg ccctcggaat tcttgtcatt 120 caggcgggac ttccctggtg gctcgccccg gccctctcga ttggtatctt cgcgggatct 180 gtcgagctgc tcctggtcag catgctcgcc gccgcgactc cgctcgtgac gatcgccgcg 240 accgtgttcg ccgtgaactt tcggcacgta ttctacgcgt tctcgtttcc gctttcgcgg 300 gtgcgaccgg gtctaccccg ggcgtactcc atctacgcaa tgatcgacga ggcctacgcc 360 acctatgtgc tgatggatcc ggatcgcctg agctcagccc gcatggtaac cggccagctc 420 gcgatgcagc tctattgggt gctcggcggc ttcgtcggca tcatgattgc gaacgtgctc 480 cctgccccca ttgagggctt tgagtttgca ctcgtggcgc tcttcgtggt gatgtcgatg 540 gatgcgattc gcggcaagcg cgagctccca tcggccttgc tggcttgcct cgctgtcacg 600 gttgcaatac tggtcgctgg cgacaatgcg ctgctggtcg cgcttgcgct gtactccggg 660 ctactggggc tgcgctattt cctcaccaag cgaaccacgg acactgcgga ggagggcgag 720 cgtgcctagc accgaatatc taatcgcggg cgtcgtcgtc gcgggcctca tcaccctggc 780 gctgcgcgca ctcccgtttg cggcgctcaa accgctgcgc aaatctaagc tcgtgcaggc 840 gctcgggcgc tggatgcccg ctggcatcct cgttatcctc gccgtcgtcg tactgcgcga 900 tcagctcata tcgcagcagg gccgggtgtg gccggtgctc gtcgcgaccg cgatcacggc 960 cctcgctcac ttgctctcaa agcgacgcgc gctcgtgagc atcgcggctg gcaccgcctg 1020 ctacgtgctg ctgctcaact ttttctag 1048 <210> 12 <211> 251 <212> PRT <213> Artificial Sequence <220> <223> DvaF protein <400> 12 Met Ser Val Glu Ala Gln Pro Gly Ala Asn Asp Arg Pro Tyr Ser Val 1 5 10 15 Arg His Glu Ile Thr Gln Gly Ala Leu Leu Ile Leu Pro Ala Gly Leu 20 25 30 Gly Met Ile Pro Ile Gly Ile Ala Phe Gly Leu Leu Val Val Gln Ser 35 40 45 Gly Leu Pro Trp Trp Met Ala Pro Ala Leu Ser Phe Phe Ala Tyr Ala 50 55 60 Gly Ser Leu Glu Leu Leu Leu Ile Thr Leu Ile Thr Ser Leu Thr Pro 65 70 75 80 Leu Val Thr Ile Ala Ala Ala Ser Phe Phe Val Asn Phe Arg His Val 85 90 95 Phe Tyr Ala Phe Asn Phe Pro Leu Lys Val Val Thr Asn Pro Phe Leu 100 105 110 Lys Phe Tyr Ala Met Tyr Ser Leu Thr Asp Glu Ile Phe Ala Val Thr 115 120 125 Val Ala Asn Pro Lys Gly Trp Thr Gln Pro Arg Val Ile Ser Ala Gly 130 135 140 Ala Val Leu Gln Ile Cys Trp Val Gly Gly Gly Leu Met Gly Val Leu 145 150 155 160 Leu Ser Ser Phe Ile Pro Phe Gln Ile Arg Gly Leu Ser Phe Ala Leu 165 170 175 Cys Ala Leu Phe Ile Thr Leu Thr Leu Asp Ala Cys Arg Thr Lys Gln 180 185 190 Glu Ile Pro Ser Leu Leu Leu Gly Ala Ala Ala Phe Gly Phe Ala Leu 195 200 205 Leu Leu Leu Pro Ser Gln Pro Ile Phe Ala Ala Met Ile Gly Phe Val 210 215 220 Ala Thr Leu Ala Ala Arg Tyr Thr Ile Ala Val Arg Leu Thr Arg Pro 225 230 235 240 Leu Pro Ala Glu Met Glu Ser Asp Asp Ala Ala 245 250 <210> 13 <211> 111 <212> PRT <213> Artificial Sequence <220> <223> DvaE protein <400> 13 Met Gln Leu Asp Ile Pro Phe Trp Tyr Leu Ala Ser Val Leu Leu Ile 1 5 10 15 Ala Phe Ala Val Thr Phe Thr Leu Arg Ala Leu Pro Phe Ala Ile Leu 20 25 30 Glu Pro Leu Arg Lys Ser Gln Phe Val Arg Val Met Ala Val Trp Met 35 40 45 Pro Ala Gly Ile Leu Val Ile Leu Ala Leu Ala Thr Phe Lys Ser Thr 50 55 60 Leu Ala Glu Glu Pro Gly Gly Leu Val His Leu Leu Ile Ala Ser Gly 65 70 75 80 Val Thr Ile Ala Val His Leu Phe Gly Gly Arg Arg Thr Leu Val Ser 85 90 95 Val Ala Ala Gly Thr Leu Ala Phe Val Leu Leu Val Asn Phe Phe 100 105 110 <210> 14 <211> 1081 <212> DNA <213> Artificial Sequence <220> <223> dvaFE gene <400> 14 atgagcgttg aggcgcagcc tggcgcaaac gaccgaccct atagcgtgcg ccacgagatc 60 acgcagggcg cactcctgat tctccccgca gggctcggaa tgattccgat cggcattgcc 120 ttcggcctgc ttgtggtgca atcggggctc ccgtggtgga tggcacccgc cctttcgttc 180 ttcgcgtacg cgggctcact cgagcttctg ctcatcacgc tcatcacgtc gcttacgccg 240 cttgtaacga tcgctgcggc atcgttcttc gtgaacttcc gccacgtgtt ctacgcgttt 300 aatttcccgc tcaaggtcgt cacgaacccg ttcttgaagt tctacgcgat gtactccctc 360 accgacgaga tcttcgcggt aacggttgcc aatccaaagg ggtggacgca gccgcgcgtg 420 atctcggcag gggccgtact ccagatctgc tgggtgggtg gcggcctcat gggggtactg 480 ctctcgagct tcatcccctt ccagatccgc ggcctgagtt tcgcgctgtg cgccctgttc 540 atcacgctga ccctcgatgc gtgccgcacg aaacaggaga tcccgtcact tctcctcggt 600 gctgccgcct tcggtttcgc gctccttttg ctcccgagcc agccgatctt cgccgcgatg 660 attggcttcg tggcgaccct cgccgcgcgc tacacgatcg ccgtgcgcct cacgaggcca 720 ctcccggcag agatggagag cgacgatgca gcttgacatc cccttctggt atctcgcctc 780 ggttctcctc atcgccttcg ccgtgacctt cacgctgcgc gcgctcccgt tcgcgattct 840 cgaaccactg cgcaaatcgc aattcgtgcg cgtcatggcc gtgtggatgc ccgcgggcat 900 cctcgtgatc ctcgcgctcg cgacctttaa gagcaccctc gccgaggaac ccggtggtct 960 cgttcacctg ctgatcgcct caggagtcac gattgccgtg cacctcttcg gtggtcgccg 1020 caccctcgtg agcgtcgccg cgggcaccct cgccttcgtg ctgctcgtga actttttcta 1080 a 1081 <210> 15 <211> 409 <212> DNA <213> Artificial Sequence <220> <223> PgapA <400> 15 tctgagactt taatttgtgg attcacgggg gtgtaatgta gttcataatt aaccccattc 60 gggggagcag atcgtagtgc gaacgatttc aggttcgttc cctgcaaaaa ctatttagcg 120 caagtgttgg aaatgccccc gtttggggtc aatgtccatt tttgaatgtg tctgtatgat 180 tttgcatctg ctgcgaaatc tttgtttccc cgctaaagtt gaggacaggt tgacacggag 240 ttgactcgac gaattatcca atgtgagtag gtttggtgcg tgagttggaa aaattcgcca 300 tactcgccct tgggttctgt cagctcaaga attcttgagt gaccgatgct ctgattgacc 360 taactgcttg acacattgca tttcctacaa tctttagagg agacacaac 409 <210> 16 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 16 gtacccgggg atcctctaga caaagccgaa gagaagttgg 40 <210> 17 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 17 gcatagagta ctcggcgccc ataaatttca 30 <210> 18 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 18 gcgccgagta ctctatgccg agaagttgaa 30 <210> 19 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 19 gcctgcaggt cgactctaga ctgggcatca cactattttt 40 <210> 20 <211> 531 <212> DNA <213> Artificial Sequence <220> <223> del-N2131L <400> 20 gtacccgggg atcctctaga caaagccgaa gagaagttgg cttgacggac ccgaaattcc 60 agctgatttt gacgatcctg atgcacccgg caggtggcct ggcgaaaagt tggggcttcc 120 tcaagaaggg gccggctctc tgtcctcagt ggctcgtcgt atcggcgggg tctgcgtgga 180 ctggggtgtt tcctgggtta ttgctattgt gctgtccaat ttcacggatg tgctgggcga 240 tgtagcgaca tccacgctca ttattttcgt gatcctgggt tggcttaccg gttggatctt 300 tgctcgcacc ccaggtcatg ccgtgtttgg catgggcctt gcgcgtgtgg atgcagagga 360 acgtgtgggc tggtggcgtg cgctggttcg cccactgctg acgatcttga ttctgcctgc 420 cgtgatggtg gatgctgacg gccgtgggct ccacgacaag gcaacgggaa ctgcagttat 480 ccgcgggtaa tttgtcttga gtgaaattta tgggcgccga gtactctatg c 531 <210> 21 <211> 555 <212> DNA <213> Artificial Sequence <220> <223> del-N2131R <400> 21 gcgccgagta ctctatgccg agaagttgaa cagcaatctt gcagcaactc ctcagtattc 60 acaccagccc caatggacac aaaaacatca gccccagaat cgcccctaag ggcctcaaat 120 acacgatctg gaccaactag tcatcgggaa aacccaaccc cttaaatcgc cttctgcgct 180 taaggggtca atgctagata agtaggaaca acaacgtttg ggcggccagg atctttgcga 240 tcatcgccag cggatacaca gaggtataac ccatggcagg gagctcgttg cgggaggcat 300 ctgacacata actcagcaca gcagggtggg tttgcgtacc ggcgaggatg ccagcggttt 360 caccgaaggg gattttcatc agtttgtggc caacgaacag caccgtgatg gagatgaaca 420 aagtgagcag cgcaccgaag ccgatgatgg tgagtgattg ggggtcgctg atcgctgatc 480 gaaatcctgc gcccgctgag gtaccgatgg cagccaaaaa tagtgtgatg cccagtctag 540 agtcgacctg caggc 555 <210> 22 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 22 aggagacaca acatgaagag caagaacgca 30 <210> 23 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 23 tcaacttctc ggcatagagt ctattggttc tgaggtgggc 40 <210> 24 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 24 gaaatttatg ggcgccgagt tctgagactt taatttgtgg 40 <210> 25 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 25 cttgctcttc atgttgtgtc tcctctaaag 30 <210> 26 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 26 aggagacaca acatgcaaag cacgcgtaag 30 <210> 27 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 27 tcaacttctc ggcatagagt tcattgcttc cagacacggt 40 <210> 28 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 28 cgtgctttgc atgttgtgtc tcctctaaag 30 <210> 29 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 29 aggagacaca acatggataa gaaaagagcg 30 <210> 30 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 30 tcaacttctc ggcatagagt ttagggacgg cgggtggcgt 40 <210> 31 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 31 tttcttatcc atgttgtgtc tcctctaaag 30 <210> 32 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 32 aggagacaca acatgtcaac gctgtctatc 30 <210> 33 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 33 tcaacttctc ggcatagagt ctaggtcaac agcagcttaa 40 <210> 34 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 34 cagcgttgac atgttgtgtc tcctctaaag 30 <210> 35 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 35 aggagacaca acatgtctcc gtcacacgat 30 <210> 36 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 36 tcaacttctc ggcatagagt ctagaaaaag ttgagcagca 40 <210> 37 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 37 tgacggagac atgttgtgtc tcctctaaag 30 <210> 38 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 38 aggagacaca acatgagcgt tgaggcgcag 30 <210> 39 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 39 tcaacttctc ggcatagagt ttagaaaaag ttcacgagca 40 <210> 40 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 40 ctcaacgctc atgttgtgtc tcctctaaag 30 <210> 41 <211> 251 <212> PRT <213> Artificial Sequence <220> <223> HmaF protein <400> 41 Met Ser Val Ala Ala Gln Pro Ser Ala His Glu His Pro Tyr Ser Val 1 5 10 15 Arg His Glu Ile Thr Gln Gly Ala Leu Leu Ile Leu Pro Ala Gly Leu 20 25 30 Gly Met Ile Pro Ile Gly Ile Ala Phe Gly Leu Leu Val Val Gln Ser 35 40 45 Gly Leu Pro Trp Trp Met Ala Pro Ala Leu Ser Phe Phe Ala Tyr Ala 50 55 60 Gly Ser Leu Glu Leu Leu Leu Ile Thr Leu Ile Thr Ser Leu Thr Pro 65 70 75 80 Leu Val Thr Ile Ala Ala Ala Ser Phe Phe Val Asn Phe Arg His Val 85 90 95 Phe Tyr Ala Phe Asn Phe Pro Leu Lys Val Val Lys Asn Pro Phe Leu 100 105 110 Lys Phe Tyr Ala Met Tyr Ser Leu Thr Asp Glu Ile Phe Ala Val Thr 115 120 125 Val Ala His Pro Lys Gly Trp Thr Gln Pro Arg Val Ile Ser Ala Gly 130 135 140 Ala Val Leu Gln Ile Cys Trp Val Gly Gly Gly Leu Met Gly Val Leu 145 150 155 160 Leu Ser Ser Phe Ile Pro Phe Gln Ile Arg Gly Leu Ser Phe Ala Leu 165 170 175 Cys Ala Leu Phe Ile Thr Leu Thr Leu Asp Ala Cys Arg Thr Lys Gln 180 185 190 Glu Leu Pro Ser Leu Val Leu Gly Ala Ala Ala Phe Gly Leu Ala Leu 195 200 205 Leu Leu Met Pro Gly Gln Pro Ile Phe Ala Ala Met Ile Gly Phe Val 210 215 220 Ala Thr Leu Ala Ala Arg Tyr Thr Ile Ala Val Arg Leu Thr Arg Pro 225 230 235 240 Leu Pro Ala Glu Met Glu Gly Asp Asp Ala Ala 245 250 <210> 42 <211> 111 <212> PRT <213> Artificial Sequence <220> <223> HmaE protein <400> 42 Met Gln Leu Asp Ile Pro Phe Trp Tyr Leu Ala Ser Val Leu Leu Ile 1 5 10 15 Ala Phe Ala Val Thr Phe Thr Leu Arg Ala Leu Pro Phe Ala Ile Leu 20 25 30 Glu Pro Leu Arg Lys Ser Gln Phe Val Arg Val Met Ala Val Trp Met 35 40 45 Pro Ala Gly Ile Leu Val Ile Leu Ala Leu Ala Thr Phe Lys Ser Thr 50 55 60 Leu Ala Glu Glu Pro Gly Ser Val Ile His Leu Leu Ile Ala Ser Ala 65 70 75 80 Val Thr Ile Ala Val His Leu Leu Phe Gly Arg Arg Thr Leu Val Ser 85 90 95 Val Ala Ala Gly Thr Leu Ala Phe Val Leu Leu Val Asn Phe Phe 100 105 110 <210> 43 <211> 1081 <212> DNA <213> Artificial Sequence <220> <223> hmaFE gene <400> 43 atgagcgttg cggcgcagcc tagcgcacat gagcatccct attcggtgcg ccatgaaatc 60 acgcaggggg cgctcttgat tctccccgcg ggcctcggca tgatcccgat tggcatcgct 120 tttggccttc ttgttgtgca gtccggactt ccgtggtgga tggcacccgc cctctcattc 180 ttcgcgtacg cgggctcgct cgagcttttg ctcatcacac tcatcacatc gctcacgccg 240 ctcgtgacga tcgctgcggc atcgttcttc gtgaacttcc gccacgtgtt ttacgcgttc 300 aacttcccgc tcaaggtcgt gaagaacccg tttttgaagt tctacgcgat gtactcgctt 360 accgacgaga tcttcgcggt gacggtcgcg cacccgaagg ggtggacgca gccacgcgtc 420 atctccgcgg gcgccgtact ccagatctgc tgggtgggag gcggcctcat gggcgtgctc 480 ctctcgagtt tcattccctt ccagatccgc ggtttgagct tcgccctgtg cgcgcttttc 540 atcaccctga ctctcgatgc gtgccgcacg aagcaagaac ttccgtcgct agttctcggc 600 gccgcggcct tcggtctcgc cctgctcctc atgcccgggc agccgatctt tgccgcgatg 660 atcggcttcg ttgcaacgct cgccgcgcgg tacacgatcg ccgtgcgcct tacgaggccg 720 ctaccggcgg aaatggaggg cgacgatgca gcttgacatc cccttctggt accttgcctc 780 ggttctcctc attgccttcg ccgtcacctt tacgctgcgc gcgctcccgt tcgcgatcct 840 cgaaccgctg cgcaaatccc agttcgtgcg cgtcatggcc gtgtggatgc ccgcgggcat 900 cctcgtcatt ctcgcgctcg cgaccttcaa aagcaccctc gctgaggaac ccggcagcgt 960 cattcatttg ctcattgcct cggccgtcac gatcgctgtg catcttctct ttgggcgccg 1020 aaccctcgtg agtgtcgccg cgggtaccct cgccttcgtg ctcctcgtga acttcttcta 1080 a 1081 <210> 44 <211> 251 <212> PRT <213> Artificial Sequence <220> <223> MabF protien <400> 44 Met Ser Val Glu Ala Gln Pro Gly Ala His Glu Arg Pro Tyr Ser Val 1 5 10 15 Arg His Glu Ile Thr Gln Gly Ala Leu Leu Ile Leu Pro Ala Gly Leu 20 25 30 Gly Met Ile Pro Ile Gly Ile Ala Phe Gly Leu Leu Val Val Gln Ser 35 40 45 Gly Leu Pro Trp Trp Met Ala Pro Ala Leu Ser Phe Phe Ala Tyr Ala 50 55 60 Gly Ser Leu Glu Leu Leu Leu Ile Thr Leu Ile Thr Ser Leu Thr Pro 65 70 75 80 Leu Val Thr Ile Ala Ala Ala Ser Phe Phe Val Asn Phe Arg His Val 85 90 95 Phe Tyr Ala Phe Asn Phe Pro Leu Lys Val Val Lys Asn Pro Phe Leu 100 105 110 Lys Phe Tyr Ala Met Tyr Ser Leu Thr Asp Glu Ile Phe Ala Val Thr 115 120 125 Val Ala Asn Pro Lys Gly Trp Thr Gln Pro Arg Val Ile Ser Ala Gly 130 135 140 Ala Val Leu Gln Ile Cys Trp Val Gly Gly Gly Leu Met Gly Val Leu 145 150 155 160 Leu Ser Ser Phe Ile Pro Phe Gln Ile Arg Gly Leu Ser Phe Ala Leu 165 170 175 Cys Ala Leu Phe Ile Thr Leu Thr Leu Asp Ala Cys Arg Thr Lys Gln 180 185 190 Glu Ile Pro Ser Leu Leu Leu Gly Ala Ala Ala Phe Gly Leu Ala Leu 195 200 205 Leu Leu Leu Pro Ser Gln Pro Ile Phe Ala Ala Met Ile Gly Phe Val 210 215 220 Ala Thr Leu Ala Ala Arg Tyr Thr Ile Ala Val Arg Leu Thr Arg Pro 225 230 235 240 Leu Pro Ala Glu Met Glu Ser Asp Asp Ala Ala 245 250 <210> 45 <211> 111 <212> PRT <213> Artificial Sequence <220> <223> MabE protein <400> 45 Met Gln Leu Asp Ile Pro Phe Trp Tyr Leu Ala Ser Val Leu Leu Ile 1 5 10 15 Ala Phe Ala Val Thr Phe Thr Leu Arg Ala Leu Pro Phe Ala Ile Leu 20 25 30 Glu Pro Leu Arg Lys Ser Gln Phe Val Arg Val Met Ala Val Trp Met 35 40 45 Pro Ala Gly Ile Leu Val Ile Leu Ala Leu Ala Thr Phe Lys Ser Thr 50 55 60 Leu Ala Glu Glu Pro Gly Gly Leu Val His Leu Leu Ile Ala Ser Ala 65 70 75 80 Val Thr Ile Ala Val His Leu Phe Gly Gly Arg Arg Thr Leu Val Ser 85 90 95 Val Ala Ala Gly Thr Leu Ala Phe Val Leu Leu Val Asn Phe Phe 100 105 110 <210> 46 <211> 1081 <212> DNA <213> Artificial Sequence <220> <223> mabFE gene <400> 46 atgagcgttg aggcgcagcc tggcgcacac gagcgaccct actcggtgcg ccacgaaatc 60 acgcagggcg cgctcctgat tctccccgca ggtctcggca tgatcccgat cggtatcgcc 120 ttcggcctgc ttgtggtgca gtcggggctc ccgtggtgga tggcgcccgc cctctcgttt 180 ttcgcgtacg cgggctcact cgagcttctg ctcatcacgc tcatcacgtc gcttacccca 240 ctggtgacga tcgcggcggc atcgttcttc gtgaacttcc gccacgtgtt ctacgcgttc 300 aactttccac tcaaggtcgt gaagaacccg tttttgaagt tctacgcgat gtattcgctg 360 accgacgaaa tcttcgcggt cacggtcgcg aacccaaagg ggtggaccca gccgcgcgtg 420 atctcggcag gggccgtact ccagatctgc tgggtgggtg gcggcctcat gggggtactg 480 ctctcgagct tcatcccctt ccagatccgc ggcctgagtt tcgcgctgtg cgccctgttc 540 atcacgctga ccctcgatgc gtgccgcaca aaacaggaga tcccgtcact tctcctcggc 600 gctgccgcct tcggcctcgc gcttcttttg ctcccgagcc agccgatctt cgcggcgatg 660 attggcttcg ttgcgaccct cgcggctcgc tacacgatcg ccgtacgcct cacgaggcca 720 ctcccggcag agatggagag cgacgatgca gcttgacatc cccttctggt acctcgcctc 780 ggttctcctc atcgccttcg ccgttacttt tacgctgcgc gcgctcccgt tcgcgatcct 840 cgaaccactg cgcaaatcgc aattcgtgcg cgtcatggcc gtgtggatgc ccgcgggcat 900 cctcgtcatt ctggcgctcg cgaccttcaa gagcaccctc gccgaggaac ccggtggtct 960 cgttcacctg ctgatcgcct cagccgtcac gatcgccgtg cacctcttcg gtggtcgccg 1020 aaccctcgtg agcgtcgccg cgggcaccct cgccttcgtg ctgctcgtga acttcttcta 1080 a 1081 <210> 47 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 47 aggagacaca acatgagcgt tgcggcgcag 30 <210> 48 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 48 tcaacttctc ggcatagagt ttagaagaag ttcacgagga 40 <210> 49 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 49 cgcaacgctc atgttgtgtc tcctctaaag 30 <210> 50 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 50 aggagacaca acatgagcgt tgaggcgcag 30 <210> 51 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 51 tcaacttctc ggcatagagt ttagaagaag ttcacgagca 40 <210> 52 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 52 ctcaacgctc atgttgtgtc tcctctaaag 30 <210> 53 <211> 100 <212> DNA <213> Artificial Sequence <220> <223> PyccA <400> 53 ttccagatca aatgcgtaaa gatgggtaaa acttctgggt gcccttacgc attatcatta 60 tgctgcttaa ttaattacat ctgtcataga gagtgactca 100 <210> 54 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 54 gagagtgact caatgagcgt tgaggcgcag 30 <210> 55 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 55 cgggtaccga gctcgaattc ttagaaaaag ttcacgagca 40 <210> 56 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 56 actcactata gggcgaattc ttccagatca aatgcgtaaa 40 <210> 57 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 57 ctcaacgctc attgagtcac tctctatgac 30 <210> 58 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 58 gagagtgact caatgagcgt tgcggcgcag 30 <210> 59 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 59 cgggtaccga gctcgaattc ttagaagaag ttcacgagga 40 <210> 60 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 60 cgcaacgctc attgagtcac tctctatgac 30 <210> 61 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 61 gagagtgact caatgagcgt tgaggcgcag 30 <210> 62 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 62 cgggtaccga gctcgaattc ttagaagaag ttcacgagca 40 <210> 63 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 63 ctcaacgctc attgagtcac tctctatgac 30 <210> 64 <211> 756 <212> DNA <213> Artificial Sequence <220> <223> dvaF gene <400> 64 atgagcgttg aggcgcagcc tggcgcaaac gaccgaccct atagcgtgcg ccacgagatc 60 acgcagggcg cactcctgat tctccccgca gggctcggaa tgattccgat cggcattgcc 120 ttcggcctgc ttgtggtgca atcggggctc ccgtggtgga tggcacccgc cctttcgttc 180 ttcgcgtacg cgggctcact cgagcttctg ctcatcacgc tcatcacgtc gcttacgccg 240 cttgtaacga tcgctgcggc atcgttcttc gtgaacttcc gccacgtgtt ctacgcgttt 300 aatttcccgc tcaaggtcgt cacgaacccg ttcttgaagt tctacgcgat gtactccctc 360 accgacgaga tcttcgcggt aacggttgcc aatccaaagg ggtggacgca gccgcgcgtg 420 atctcggcag gggccgtact ccagatctgc tgggtgggtg gcggcctcat gggggtactg 480 ctctcgagct tcatcccctt ccagatccgc ggcctgagtt tcgcgctgtg cgccctgttc 540 atcacgctga ccctcgatgc gtgccgcacg aaacaggaga tcccgtcact tctcctcggt 600 gctgccgcct tcggtttcgc gctccttttg ctcccgagcc agccgatctt cgccgcgatg 660 attggcttcg tggcgaccct cgccgcgcgc tacacgatcg ccgtgcgcct cacgaggcca 720 ctcccggcag agatggagag cgacgatgca gcttga 756 <210> 65 <211> 335 <212> DNA <213> Artificial Sequence <220> <223> dvaE gene <400> 65 atgcagcttg acatcccctt ctggtatctc gcctcggttc tcctcatcgc cttcgccgtg 60 accttcacgc tgcgcgcgct cccgttcgcg attctcgaac cactgcgcaa atcgcaattc 120 gtgcgcgtca tggccgtgtg gatgcccgcg ggcatcctcg tgatcctcgc gctcgcgacc 180 tttaagagca ccctcgccga ggaacccggt ggtctcgttc acctgctgat cgcctcagga 240 gtcacgattg ccgtgcacct cttcggtggt cgccgcaccc tcgtgagcgt cgccgcgggc 300 accctcgcct tcgtgctgct cgtgaacttt ttcta 335 <210> 66 <211> 756 <212> DNA <213> Artificial Sequence <220> <223> hmaF gene <400> 66 atgagcgttg cggcgcagcc tagcgcacat gagcatccct attcggtgcg ccatgaaatc 60 acgcaggggg cgctcttgat tctccccgcg ggcctcggca tgatcccgat tggcatcgct 120 tttggccttc ttgttgtgca gtccggactt ccgtggtgga tggcacccgc cctctcattc 180 ttcgcgtacg cgggctcgct cgagcttttg ctcatcacac tcatcacatc gctcacgccg 240 ctcgtgacga tcgctgcggc atcgttcttc gtgaacttcc gccacgtgtt ttacgcgttc 300 aacttcccgc tcaaggtcgt gaagaacccg tttttgaagt tctacgcgat gtactcgctt 360 accgacgaga tcttcgcggt gacggtcgcg cacccgaagg ggtggacgca gccacgcgtc 420 atctccgcgg gcgccgtact ccagatctgc tgggtgggag gcggcctcat gggcgtgctc 480 ctctcgagtt tcattccctt ccagatccgc ggtttgagct tcgccctgtg cgcgcttttc 540 atcaccctga ctctcgatgc gtgccgcacg aagcaagaac ttccgtcgct agttctcggc 600 gccgcggcct tcggtctcgc cctgctcctc atgcccgggc agccgatctt tgccgcgatg 660 atcggcttcg ttgcaacgct cgccgcgcgg tacacgatcg ccgtgcgcct tacgaggccg 720 ctaccggcgg aaatggaggg cgacgatgca gcttga 756 <210> 67 <211> 336 <212> DNA <213> Artificial Sequence <220> <223> hmaE gene <400> 67 atgcagcttg acatcccctt ctggtacctt gcctcggttc tcctcattgc cttcgccgtc 60 acctttacgc tgcgcgcgct cccgttcgcg atcctcgaac cgctgcgcaa atcccagttc 120 gtgcgcgtca tggccgtgtg gatgcccgcg ggcatcctcg tcattctcgc gctcgcgacc 180 ttcaaaagca ccctcgctga ggaacccggc agcgtcattc atttgctcat tgcctcggcc 240 gtcacgatcg ctgtgcatct tctctttggg cgccgaaccc tcgtgagtgt cgccgcgggt 300 accctcgcct tcgtgctcct cgtgaacttc ttctaa 336 <210> 68 <211> 756 <212> DNA <213> Artificial Sequence <220> <223> mabF gene <400> 68 atgagcgttg aggcgcagcc tggcgcacac gagcgaccct actcggtgcg ccacgaaatc 60 acgcagggcg cgctcctgat tctccccgca ggtctcggca tgatcccgat cggtatcgcc 120 ttcggcctgc ttgtggtgca gtcggggctc ccgtggtgga tggcgcccgc cctctcgttt 180 ttcgcgtacg cgggctcact cgagcttctg ctcatcacgc tcatcacgtc gcttacccca 240 ctggtgacga tcgcggcggc atcgttcttc gtgaacttcc gccacgtgtt ctacgcgttc 300 aactttccac tcaaggtcgt gaagaacccg tttttgaagt tctacgcgat gtattcgctg 360 accgacgaaa tcttcgcggt cacggtcgcg aacccaaagg ggtggaccca gccgcgcgtg 420 atctcggcag gggccgtact ccagatctgc tgggtgggtg gcggcctcat gggggtactg 480 ctctcgagct tcatcccctt ccagatccgc ggcctgagtt tcgcgctgtg cgccctgttc 540 atcacgctga ccctcgatgc gtgccgcaca aaacaggaga tcccgtcact tctcctcggc 600 gctgccgcct tcggcctcgc gcttcttttg ctcccgagcc agccgatctt cgcggcgatg 660 attggcttcg ttgcgaccct cgcggctcgc tacacgatcg ccgtacgcct cacgaggcca 720 ctcccggcag agatggagag cgacgatgca gcttga 756 <210> 69 <211> 336 <212> DNA <213> Artificial Sequence <220> <223> mabE gene <400> 69 atgcagcttg acatcccctt ctggtacctc gcctcggttc tcctcatcgc cttcgccgtt 60 acttttacgc tgcgcgcgct cccgttcgcg atcctcgaac cactgcgcaa atcgcaattc 120 gtgcgcgtca tggccgtgtg gatgcccgcg ggcatcctcg tcattctggc gctcgcgacc 180 ttcaagagca ccctcgccga ggaacccggt ggtctcgttc acctgctgat cgcctcagcc 240 gtcacgatcg ccgtgcacct cttcggtggt cgccgaaccc tcgtgagcgt cgccgcgggc 300 accctcgcct tcgtgctgct cgtgaacttc ttctaa 336

Claims

서열번호 12 및 서열번호 13과 95% 이상의 서열 상동성을 가지고 L-히스티딘 배출능을 갖는 L-히스티딘 배출 단백질을 발현하도록 변형되고,
상기 L-히스티딘 배출 단백질을 발현하도록 변형되지 않은 비변형 미생물과 비교하여 L-히스티딘 생산능이 증가된,
L-히스티딘 생산 미생물.
제1항에 있어서, 상기 단백질은 외래의 단백질인, L-히스티딘 생산 미생물.
제1항에 있어서, 상기 변형은 상기 서열번호 12 및 서열번호 13과 95% 이상의 서열 상동성을 가지고 L-히스티딘 배출능을 갖는 L-히스티딘 배출 단백질의 아미노산 서열을 암호화하는 유전자의 도입에 의한 것인, L-히스티딘 생산 미생물.
제1항에 있어서, 상기 단백질은 서열번호 12 및 13, 서열번호 41 및 42, 또는 서열번호 44 및 45의 아미노산 서열로 표현되는 것인, L-히스티딘을 생산하는 미생물.
제4항에 있어서, 상기 변형은 서열번호 12 및 13, 서열번호 41 및 42, 또는 서열번호 44 및 45의 아미노산 서열을 암호화하는 유전자의 도입에 의한 것인, L-히스티딘 생산 미생물.
제1항 내지 제5항 중 어느 한 항에 있어서, 상기 미생물은 코리네박테리움 속 또는 에스케리키아 속인, L-히스티딘 생산 미생물.
제6항에 있어서, 상기 미생물은 코리네박테리움 글루타미쿰 또는 에스케리키아 콜라이인, L-히스티딘 생산 미생물.
서열번호 12 및 서열번호 13과 95% 이상의 서열 상동성을 가지고 L-히스티딘 배출능을 갖는 L-히스티딘 배출 단백질,
상기 L-히스티딘 배출 단백질을 암호화하는 유전자,
상기 유전자를 포함하는 재조합 벡터, 또는
상기 유전자 또는 상기 재조합 벡터를 포함하는 재조합 미생물
을 포함하는, L-히스티딘 생산용 조성물.
제8항에 있어서, 상기 단백질은 서열번호 12 및 13, 서열번호 41 및 42, 또는 서열번호 44 및 45의 아미노산 서열로 표현되는 것인, L-히스티딘 생산용 조성물.
제8항 또는 제9항에 있어서, 상기 미생물은 코리네박테리움 속 또는 에스케리키아 속인, L-히스티딘 생산용 조성물.
제10항에 있어서, 상기 미생물은 코리네박테리움 글루타미쿰 또는 에스케리키아 콜라이인, L-히스티딘 생산용 조성물.
제1항 내지 제5항 중 어느 한 항의 L-히스티딘 생산 미생물을 배지에서 배양하는 단계를 포함하는, L-히스티딘 생산 방법.
제12항에 있어서, 상기 배양하는 단계 이후에, 배양된 미생물 또는 배지로부터 L-히스티딘을 회수하는 단계를 추가로 포함하는, L-히스티딘 생산 방법.
제12항에 있어서, 상기 미생물은 코리네박테리움 속 또는 에스케리키아 속인, L-히스티딘 생산 방법.
제14항에 있어서, 상기 미생물은 코리네박테리움 글루타미쿰 또는 에스케리키아 콜라이인, L-히스티딘 생산 방법.