KR20230025010A

KR20230025010A - 개선된 시스테인 생산 균주

Info

Publication number: KR20230025010A
Application number: KR1020237001935A
Authority: KR
Inventors: 루페르트 팔러; 요한나 코흐
Original assignee: 와커 헤미 아게
Priority date: 2020-06-26
Filing date: 2020-06-26
Publication date: 2023-02-21
Also published as: EP4172310A1; WO2021259491A1; CN116018400A; JP2023532871A; US20230265473A1

Abstract

본 발명은 KEGG 데이터베이스의 번호 EC 2.7.9.2로 표시된 효소 부류의 상대적 효소 활성이 비활성화되거나, 또는 야생형 효소의 특이적 활성에 기초하여, 감소되며, KEGG 데이터베이스의 번호 EC 2.7.9.2로 표시된 효소 부류가 야생형 효소 활성을 갖는 미생물 균주와 비교하여 증가된 양의 L-시스테인을 형성하고, 이 효소 활성을 코딩하는 유전자가 ppsA로 표시되는 것을 특징으로 하는, L-시스테인의 발효 생산에 적합한 미생물 균주에 관한 것이다. 본 발명은 또한 이들 미생물 세포를 사용하여 L-시스테인을 생산하는 방법을 제공한다.

Description

개선된 시스테인 생산 균주

본 발명은 KEGG 데이터베이스의 번호 EC 2.7.9.2에 의해 식별되는 효소 부류의 상대적 효소 활성이 비활성화되거나 또는 야생형 효소의 특이적 활성에 비해 감소되며, KEGG 데이터베이스의 번호 EC 2.7.9.2에 의해 식별되는 효소 부류의 야생형 효소 활성을 갖는 미생물 균주와 비교하여 증가된 양의 L-시스테인을 형성하고, 상기 효소 활성을 코딩하는 유전자가 ppsA에 의해 식별되는 것을 특징으로 하는, L-시스테인의 발효 생산에 적합한 미생물 균주에 관한 것이다. 또한, 본 발명은 이들 미생물 세포를 사용하여 L-시스테인을 생산하는 공정을 제공한다.

Cys 또는 C로 약칭되는 시스테인은 측쇄 -CH₂-SH를 갖는 α-아미노산이다. 자연적으로 발생하는 거울상이성질체 형태가 L-시스테인이고 이것만이 단백질생성 아미노산이기 때문에, 용어 시스테인이 기술(descriptor) 없이 사용될 때 의미하는 것은 본 발명의 맥락에서 L-시스테인이다. 설프하이드릴 기의 산화는 함께 디설파이드 결합을 형성하는 2개의 시스테인 잔기를 초래할 수 있고, 결과적으로 동일한 설명이 적용되는 시스틴을 형성하며, 즉 기술이 없는 경우 본 발명에서 의미하는 것은 L-거울상이성질체(또는 L-시스틴, 또는 (R,R)-3,3'-디티오비스(2-아미노프로피온산))이다. L-시스테인은 아미노산 메티오닌으로부터 형성될 수 있으므로, 인간에게 준필수 아미노산이다.

모든 유기체에서, 시스테인은 황 대사에서 중요한 위치를 차지하며, 단백질, 글루타티온, 비오틴, 리포산, 티아민, 타우린, 메티오닌 및 다른 황 함유 대사 산물의 합성에 사용된다. 또한, L-시스테인은 조효소 A(coenzyme A)의 생합성을 위한 전구체로서 역할을 한다.

시스테인의 생합성은 박테리아, 특히 엔테로박테리아(enterobacteria)에서 상세히 연구되었다. 시스테인 생합성의 요약은 문헌[Wada and Takagi, Appl. Microbiol. Biotechnol. (2006) 73: 48-54]에서 찾을 수 있다.

아미노산 L-시스테인은 경제적으로 중요하다. 그것은, 예를 들어 식품 첨가제로서(특히 제빵 산업에서), 화장품 원료로서, 그리고 활성 약제학적 성분(특히 N-아세틸시스테인 및 S-카르복시메틸시스테인)의 생산을 위한 출발 물질로서 사용된다.

머리카락, 강모(bristle), 뿔, 발굽 및 깃털과 같은 케라틴 함유 물질로부터 추출에 의하거나 또는 전구체의 효소적 전환을 통한 생물변형에 의한 시스테인의 고전적인 제조 외에도, 시스테인의 발효 생산을 위한 공정이 또한 있다. 미생물을 이용한 시스테인의 발효 제조에 관한 선행 기술은, 예를 들어 EP 0 858 510 B1, EP 0 885 962 B1, EP 1 382 684 B1, EP 1 220 940 B2, EP 1 769 080 B1 및 EP 2 138 585 B1에 개시되어 있다. 사용되는 박테리아 숙주 유기체는 코리네박테리움(Corynebacterium) 속의 균주 및 엔테로박테리아과(Enterobacteriaceae family)의 구성원, 예를 들어 에셰리키아 콜리(Escherichia co1i) 또는 판토에아 아나나티스(Pantoea ananatis)를 포함한다.

미생물 균주에서 시스테인 생산을 개선하기 위해 다양한 방법이 이용가능하다. 돌연변이 및 선택에 의해 개선된 시스테인 생산자를 얻는 고전적인 접근법 외에도, 균주들이 또한 시스테인의 효과적인 과잉생산을 달성하기 위해 특이적으로 유전적으로 변형되었다.

예를 들어, 시스테인에 의한 감소된 피드백 억제를 갖는 세린 O-아세틸트랜스퍼라제를 코딩하는 cysE 대립유전자의 도입은 시스테인 생산의 증가로 이어졌다(EP 0 858 510 B1; Nakamori et al., Appl. Env. Microbiol. (1998) 64: 1607-1611). 피드백 저항성 CysE 효소는 시스테인의 직접 전구체인 O-아세틸-L-세린의 형성을 세포 내의 시스테인 수준으로부터 크게 분리시킨다.

O-아세틸-L-세린은 L-세린과 아세틸-CoA로부터 형성된다. 따라서, 시스테인 생산을 위해 충분한 양의 L-세린을 제공하는 것이 매우 중요하다. 이는 L-세린에 의한 감소된 피드백 억제성을 갖는 3-포스포글리세레이트 데하이드로게나제를 코딩하는 serA 대립유전자를 도입함으로써 달성될 수 있다. 결과적으로, L-세린의 생합성 전구체인 3-하이드록시피루베이트의 형성은 세포 내의 L-세린 수준으로부터 크게 분리된다. 이러한 SerA 효소의 예는 EP 0 620 853 B1 및 EP 1 496 111 B1에 기재되어 있다. 대안적으로, 문헌[Bell et al., Eur. J. Biochem. (2002) 269: 4176-4184]은 효소 활성을 탈조절하기 위한 serA 유전자의 변형을 개시한다.

또한, 발효시 시스테인 수율은, 예를 들어 트립토파나제 TnaA 또는 시스타티오닌 β-리아제 MalY 또는 MetC와 같은 시스테인 분해 효소를 코딩하는 유전자를 약화시키거나 파괴시킴으로써 증가될 수 있다고 알려져 있다(EP 1 571 223 B1).

세포 밖으로 시스테인의 수송을 증가시키는 것은 배지 중의 생성물 수율을 증가시키는 또 다른 방법이다. 이것은 소위 유출 유전자(efflux gene)를 과발현시킴으로써 달성될 수 있다. 상기 유전자는 세포 밖으로 시스테인의 이출을 매개하는 막 결합 단백질을 코딩한다.

시스테인을 내보내기 위한 다양한 유출 유전자가 설명되었다(EP 0 885 962 B1, EP 1 382 684 B1). 세포 밖으로 발효 배지 내로의 시스테인의 이출은 몇 가지 장점이 있다:

1) L-시스테인은 세포내 반응 평형으로부터 지속적으로 제거되며, 그 결과 세포 내의 이 아미노산 수준이 낮게 유지되고 L-시스테인에 의한 민감한 효소의 피드백 억제가 중지된다:

(1) L-시스테인(세포내) <-> L-시스테인(배지)

2) 배지 내로 분비된 L-시스테인은 산화되어 배양 동안 배지 내로 도입된 산소의 존재 하에 디설파이드 L-시스틴을 형성한다(EP 0 885 962 B1).

(2) 2 L-시스테인 + 1/2 O₂ -> L-시스틴 + H₂O

중성 pH의 수용액 중의 L-시스틴의 용해도가 시스테인에 비해 매우 낮기 때문에, 디설파이드는 이미 저농도에서 침전되어 백색 침전물을 형성한다:

(3) L-시스틴(용해) -> L-시스틴(침전)

L-시스틴의 침전은 배지에 용해된 생성물의 수준을 낮추어, (1)의 반응 평형과 (2)의 반응 평형을 생성물 쪽으로 끌어당긴다.

3) 생성물이 세포내에 축적되고 세포 파괴가 먼저 요구되는 경우보다 아미노산이 발효 배지로부터 직접 수득될 수 있는 경우에, 생성물을 정제하는 것은 훨씬 덜 복잡하다.

시스테인 생산 균주의 유전적 변형 외에도, 발효 공정, 즉 세포가 배양되는 방법의 최적화는 또한 효율적인 생산 공정의 개발에 중요한 역할을 한다. 다양한 배양 매개변수, 예를 들어, 탄소 및 에너지원의 성질 및 계량, 온도, 산소의 공급(EP 2 707 492 B1), 배양 배지의 pH 및 조성은 시스테인의 발효 생산에서 생성물 수율 및/또는 생성물 스펙트럼에 영향을 미칠 수 있다.

원료 및 에너지 비용이 지속적으로 상승하고 있으므로, 공정의 경제성을 개선하기 위해 시스테인 생산에서 생성물 수율을 증가시킬 필요성이 지속적으로 존재한다.

본 발명의 목적은 선행 기술의 공지된 균주와 비교하여 발효에서 L-시스테인 또는 L-시스틴의 더 높은 수율이 달성될 수 있는, 시스테인의 발효 생산을 위한 미생물 균주를 제공하는 것이다.

상기 목적은 KEGG 데이터베이스의 번호 EC 2.7.9.2에 의해 식별되는 효소 부류의 상대적 효소 활성이 비활성화되거나 또는 야생형 효소의 특이적 활성에 비해 감소되며, KEGG 데이터베이스의 번호 EC 2.7.9.2에 의해 식별되는 효소 부류의 야생형 효소 활성을 갖는 미생물 균주와 비교하여 증가된 양의 L-시스테인을 형성하고, 상기 효소 활성을 코딩하는 유전자가 ppsA에 의해 식별되는 것을 특징으로 하는, L-시스테인의 발효 생산에 적합한 미생물 균주에 의해 달성된다.

KEGG 데이터베이스의 번호 EC 2.7.9.2에 의해 식별되는 효소 부류의 효소 활성은 다음 식에 따른 가역적인 반응으로 포스포에놀피루베이트로부터 피루베이트를 생산할 수 있는 것으로 정의된다:

(4) 포스포에놀피루베이트 + 포스페이트 + AMP <-> 피루베이트 + H₂O + ATP

(AMP: 아데노신 모노포스페이트; ATP: 아데노신 트리포스페이트)

따라서, 이러한 효소 활성은 포스포에놀피루베이트 합성효소(PEP 합성효소, EC 2.7.9.2) 또는 동의어로 피루베이트-H₂O 디키나제로서 지칭된다. 이 단백질을 코딩하는 유전자는 본 발명의 맥락에서 ppsA로 약칭된다.

효소 활성의 검출(효소 분석, PEP 합성효소 분석):

미생물 균주의 PEP 합성효소 활성은 액체 배지 중의 배양물로부터 세포를 펠렛화하고, 상기 세포를 세척하고, 예를 들어 FastPrep-24™ 5G 세포 균질화기(MP Biomedicals)의 도움으로 세포 추출물을 제조함으로써 결정될 수 있다. 추출물의 단백질 함량은, 예를 들어 "Qubit^® 단백질 분석 키트"(Thermo Fisher Scientific)에 의해 결정될 수 있다.

PEP 합성효소 효소 활성은, 예를 들어 "말라카이트 그린 포스페이트 분석 키트"(Sigma Aldrich)의 도움으로 식 (4)에 따른 피루베이트와 ATP의 반응으로부터 포스페이트의 화학량론적 생산에 의해 측정될 수 있다. 대안적으로, AMP 또는 포스포에놀피루베이트의 화학량론적 생산 또는 피루베이트 또는 ATP의 화학량론적 소모가 또한 결정될 수 있다(식 4 참조). 피루베이트의 ATP 의존적 소모를 통해 PEP 합성효소 효소 활성을 결정하기 위한 분석은, 예를 들어 문헌[Berman and Cohn, J. Biol. Chem. (1970) 245: 5309-5318]에 기재되어 있다. 포스포에놀피루베이트의 ATP 의존적 형성에 대한 분석이 마찬가지로 문헌[Berman and Cohn, J. Biol. Chem. (1970) 245: 5309-5318]에 기재되어 있다.

특이적 효소 활성은 효소 활성을 임의의 추가 정제 또는 처리 없이 세포 추출물의 총 단백질 1 mg을 기반으로 함으로써 계산된다(U/mg 단백질). 상이한 PEP 합성효소의 비교가 세포 추출물이 동일한 방식으로 제조될 것을 요구한다는 것을 명심해야 한다. 전술한 바와 같이, 세포 추출물은, 예를 들어 FastPrep-24™5G 세포 균질화기(MP Biomedicals)의 도움으로 제조될 수 있다.

대안적으로, 상이한 효소는 또한 동일한 방식으로 각각 정제된 효소 1 mg에 대한 특이적 활성을 기반으로 함으로써 비교될 수 있다(U/mg 정제된 단백질). PEP 합성효소를 정제하고 정제된 단백질의 특이적 활성을 결정하기 위한 방법은, 예를 들어 문헌[Berman and Cohn, J. Biol. Chem. (1970) 245: 5309-5318]에 기재되어 있다. 상대적인 효소 활성은 PEP 합성효소를 코딩하는 유전자와 관련하여 Wt 대립유전자를 보유하는 미생물 균주의 PEP 합성효소 분석에서 결정된 특이적 효소 활성을 100%로 설정함으로써 결정될 수 있다. 샘플의 특이적 효소 활성에 대한 PEP 합성효소 분석에서 측정된 값은 Wt 효소를 갖는 이 균주와 관련하여 백분율로서 지정된다.

오픈 리딩 프레임(ORF, cds 또는 코딩 서열과 동의어)은 시작 코돈으로 시작하여 정지 코돈으로 끝나고 단백질의 아미노산 서열을 코딩하는 DNA 또는 RNA의 영역을 지칭한다. ORF는 또한 코딩 영역 또는 구조 유전자로 지칭된다.

유전자는 생물학적 활성 RNA를 생산하기 위한 모든 기본 정보를 함유하는 DNA의 부분을 지칭한다. 유전자는 전사에 의해 단일 가닥 RNA 사본이 생산되는 DNA의 부분 및 또한 이러한 복제 공정의 조절에 관여하는 발현 신호를 함유한다. 발현 신호는 예를 들어 적어도 하나의 프로모터, 전사 개시, 번역 개시, 및 리보솜 결합 부위를 포함한다. 또한, 종결자 및 하나 이상의 오퍼레이터가 발현 신호로서 가능하다.

본 발명의 맥락에서, 단백질, 예를 들어 PpsA는 대문자로 시작하는 반면, 상기 단백질을 코딩하는 서열(cds)은 소문자(예를 들어, ppsA)에 의해 식별된다.

따라서, E. 콜리 ppsA는 서열번호: 1의 뉴클레오타이드 333-2711에 명시된 E. 콜리로부터의 ppsA 유전자의 cds를 지칭한다. E. 콜리 PpsA는 상기 cds(E. 콜리 ppsA)에 의해 코딩되고 서열번호: 2에 명시된 단백질을 지칭한다. 상기 단백질은 포스포에놀피루베이트 합성효소이다.

P. 아나나티스 ppsA는 서열번호: 3의 뉴클레오타이드 417-2801에 명시된 바와 같은 P. 아나나티스로부터의 ppsA 유전자의 cds를 지칭한다. P. 아나나티스 PpsA는 상기 cds(P. 아나나티스 ppsA)에 의해 코딩되고 서열번호: 4에 명시된 단백질을 지칭한다.

약어 WT(Wt)는 야생형을 지칭한다. 야생형 유전자는 진화를 통해 자연적으로 발생하고 야생형 게놈에 존재하는 유전자의 형태를 지칭한다. Wt 유전자의 DNA 서열은 NCBI와 같은 데이터베이스에서 공개적으로 접근가능하다.

대립유전자는 돌연변이에 의해, 즉 DNA의 뉴클레오타이드 서열에 대한 변화에 의해, 서로 전환될 수 있는 유전자의 상태를 정의한다. 미생물에서 자연적으로 발생하는 유전자는 야생형 대립유전자로 지칭되고, 이로부터 유래된 변이체는 유전자의 돌연변이된 대립유전자로 지칭된다.

상동성 유전자 또는 상동성 서열은 DNA의 상기 유전자 또는 부분의 DNA 서열들이 적어도 80% 동일하고, 바람직하게는 적어도 90% 동일하고, 특히 바람직하게는 적어도 95% 동일한 것을 의미하는 것으로 이해되어야 한다.

DNA 동일성의 정도는 http://blast.ncbi.nlm.nih.gov/에서 찾을 수 있고 blastn 알고리즘을 기반으로 하는 "nucleotide blast" 프로그램에 의해 결정된다. 기본 매개변수는 둘 이상의 뉴클레오타이드 서열의 정렬을 위한 알고리즘 매개변수로서 사용되었다. 기본 일반 매개변수는 최대 표적 서열 = 100; 짧은 쿼리 = "짧은 입력 서열에 대한 매개변수 자동 조정"; 예상 임계값 = 10; 단어 크기 = 28; 짧은 입력 서열에 대한 매개변수 자동 조정 = 0이다. 상응하는 기본 스코어링 매개변수는 매치/미스매치 스코어 = 1,-2; 갭 비용 = 선형이다.

단백질 서열은 http://blast.ncbi.nlm.nih.gov/에서 "protein blast" 프로그램을 사용하여 비교된다. 이 프로그램은 blastp 알고리즘을 사용한다. 기본 매개변수는 둘 이상의 단백질 서열의 정렬을 위한 알고리즘 매개변수로서 사용되었다. 기본 일반 매개변수는 최대 표적 서열 = 100; 짧은 쿼리 = "짧은 입력 서열에 대한 매개변수 자동 조정"; 예상 임계값 = 10; 단어 크기 = 3; 짧은 입력 서열에 대한 매개변수 자동 조정 = 0이다. 기본 스코어링 매개변수는 매트릭스 = BLOSUM62; 갭 비용 = 존재: 11 확장: 1; 구성 조정 = 조건부 구성 스코어 매트릭스 조정이다.

본 발명에 따른 미생물에서, KEGG 데이터베이스의 번호 EC 2.7.9.2에 의해 식별되는 효소 부류의 상대적 효소 활성은 비활성화되거나 야생형 효소의 특이적 활성에 비해 바람직하게는 적어도 10%, 특히 바람직하게는 적어도 25%, 특히 바람직하게는 적어도 60% 및 구체적으로 바람직하게는 적어도 70% 감소된다. 적어도 10%(또는 25%/60%/70%) 감소되는 ppsA 유전자에 의해 코딩되는 효소의 효소 활성은 또한 최대 90%(또는 75%/40%/30%)의 잔류 활성으로 지칭된다.

바람직한 구현예에서, 미생물 균주는 KEGG 데이터베이스의 번호 EC 2.7.9.2에 의해 식별되는 효소 부류의 임의의 효소 활성을 더 이상 갖지 않는 것을 특징으로 하며, 즉, KEGG 데이터베이스의 번호 EC 2.7.9.2에 의해 식별되는 효소 부류의 상대적 효소 활성은 야생형 효소의 특이적 활성에 비해 100% 감소된다.

본 발명의 맥락에서, "(상응하는) 야생형 효소에 비해/와 비교하여/와 관련하여"는 미생물로부터의 유전자의 비돌연변이 형태에 의해, 즉 진화를 통해 자연적으로 발생하고 상기 미생물의 야생형 게놈에 존재하는 유전자에 의해 코딩되는 단백질의 활성과의 비교를 의미한다.

L-시스테인의 발효 생산에 적합한 미생물 균주는 시스테인, 시스틴 또는 그로부터 유래된 유도체의 합성을 야기하는 탈조절된 생합성 대사 경로(상동 또는 이종)를 함유하는 모든 미생물을 포함한다. 이러한 균주는, 예를 들어 EP 0 885 962 B1, EP 1 382 684 B1, EP 1 220 940 B2, EP 1 769 080 B1 및 EP 2 138 585 B1에 개시되어 있다.

L-시스테인의 발효 생산에 적합한 미생물은 바람직하게는 하기 변형 중 하나를 갖는 것을 특징으로 한다:

a) 미생물 균주는 상응하는 야생형 효소(예를 들어, EP 1 950 287 B1에 기재된 바와 같음)와 비교하여 적어도 2배 감소되는 L-세린에 의한 피드백 억제를 갖는 변형된 3-포스포글리세레이트 데하이드로게나제(serA)에 의해 구별된다.

상응하는 야생형 효소와 비교하여, 3-포스포글리세레이트 데하이드로게나제(serA)의 특히 바람직한 변이체는 적어도 5배, 특히 바람직하게는 적어도 10배, 및 더욱 바람직한 구현예에서, 적어도 50배로 감소되는 L-세린에 의한 피드백 억제를 갖는다.

b) 미생물 균주는 상응하는 야생형 효소와 비교하여, 적어도 2배로 감소되는 시스테인에 의한 피드백 억제를 갖는 세린 O-아세틸트랜스퍼라제(cysE)를 함유한다(예를 들어, EP 0 858 510 B1 또는 Nakamori et al., Appl. Env. Microbiol. (1998) 64: 1607-1611에 기재된 바와 같음).

상응하는 야생형 효소와 비교하여, 세린 O-아세틸트랜스퍼라제(cysE)의 특히 바람직한 변이체는 적어도 5배, 특히 바람직하게는 적어도 10배, 더욱 바람직한 구현예에서, 적어도 50배로 감소되는 시스테인에 의한 피드백 억제를 갖는다.

c) 미생물 균주는 상응하는 야생형 세포와 비교하여 유출 유전자의 과발현으로 인해 적어도 2배로 증가되는 세포 밖으로의 시스테인의 이출을 나타낸다.

야생형 세포와 비교하여, 유출 유전자의 과발현은 바람직하게는 적어도 5배, 특히 바람직하게는 적어도 10배 및 특히 바람직하게는 적어도 20배로 증가되는 세포 밖으로의 시스테인의 이출을 야기한다.

유출 유전자는 바람직하게는 E. 콜리로부터의 ydeD(EP 0 885 962 B1 참조), yfiK(EP 1 382 684 B1 참조), cydDC(W0 2004/113373 A1 참조), bcr(US 2005-221453 AA 참조) 및 emrAB(US 2005-221453 AA 참조) 또는 상이한 미생물로부터의 상응하는 상동성 유전자로 이루어진 군으로부터 유래된다.

이러한 균주는, 예를 들어 EP 0 858 510 B1 및 EP 0 885 962 B1로부터 공지되어 있다.

더욱이, L-시스테인의 발효 생산에 적합한 미생물 균주는 바람직하게는 세포가 야생형 세포와 비교하여 이러한 효소 활성의 최대 50%만을 함유할 정도로 적어도 하나의 시스테인 분해 효소가 약화되는 것을 특징으로 한다. 시스테인 분해 효소는 바람직하게는 트립토파나제(TnaA) 및 시스타티오닌 β-리아제(MalY, MetC)로 이루어진 군으로부터 유래된다.

이전 단락에 기술된 L-시스테인의 발효 생산에 적합한 미생물 균주는, 시스테인 대사에 관해 탈조절되지 않고 KEGG 데이터베이스의 번호 EC 2.7.9.2에 의해 식별되는 효소 부류의 야생형 효소 활성을 갖는 미생물 균주와 비교하여 증가된 양의 L-시스테인을 형성하는 방식으로 이들의 시스테인 대사에 관해 탈조절된다. 시스테인 대사에 관해 탈조절되지 않고 KEGG 데이터베이스의 번호 EC 2.7.9.2에 의해 식별되는 효소 부류의 야생형 효소 활성을 갖는 미생물 균주의 세포에서, 배양물 내의 L-시스테인의 양은 약 0 g/l이므로(표 2 참조), 증가된 양은 배양 24시간 후 배양물에서 측정된 0.05 g/l L-시스테인을 초과하는 임의의 양을 의미한다.

바람직하게는, 미생물 균주는 상기 미생물 균주가 엔테로박테리아과 또는 코리네박테리아과(Corynebacteriaceae family)로부터의 균주, 특히 바람직하게는 엔테로박테리아과로부터의 균주인 것을 특징으로 한다. 이러한 균주는 그 중에서도 예를 들어 DSMZ-독일 생물자원센터(German Collection of Microbial and Cell Cultures GmbH(Braunschweig))로부터 상업적으로 이용가능하다.

바람직하게는, 미생물 균주는 에셰리키아 콜리, 판토에아 아나나티스 및 코리네박테리움 글루타미쿰으로 이루어진 군으로부터 선택되고, 특히 바람직하게는 에셰리키아 콜리 및 판토에아 아나나티스로 이루어진 군으로부터 선택된다. 특히 바람직하게는, 미생물 균주는 종 에셰리키아 콜리의 균주이다.

특히 바람직하게는, E. 콜리 균주는 E. 콜리 K12, 특히 바람직하게는 E. 콜리 K12 W3110으로부터 선택된다. 이러한 균주는 그 중에서도 예를 들어 DSMZ-독일 생물자원센터(German Collection of Microbial and Cell Cultures GmbH(Braunschweig))로부터 상업적으로 이용가능하며, E. 콜리 K12 W3110 DSM 5911(id. ATCC 27325) 및 판토에아 아나나티스 DSM 30070(id. ATCC 11530)을 포함한다. PpsA는 바람직하게는 서열번호: 2를 갖는 E. 콜리로부터의 PpsA 또는 서열번호: 4를 갖는 P. 아나나티스로부터의 PpsA이다.

바람직하게는, 미생물 균주는 ppsA 유전자 내에 적어도 하나의 돌연변이를 함유하는 것을 특징으로 한다. 동시에, 균주는 또한 본 바람직한 구현예에서 야생형 세포와 비교하여 증가된 양의 L-시스테인을 형성한다. 바람직하게는, ppsA 유전자에서의 유전적 변형은 상기 유전자에 의해 발현되는 단백질이 야생형 효소의 특이적 활성에 비해 KEGG 데이터베이스의 번호 EC 2.7.9.2에 의해 식별되는 효소 부류의 감소된 상대적 효소 활성을 갖거나 이러한 효소 활성을 갖지 않도록 유발한다.

더욱이, 본 발명에 따른 생산 균주는 시스테인 생산의 추가 개선을 위해 더 최적화될 수 있다.

최적화는, 예를 들어, 생산 특성을 개선시키기에 적합한 하나 이상의 유전자를 추가적으로 발현시킴으로써 유전적으로 달성될 수 있다. 상기 유전자는 그 자체로 공지된 방식으로 별개의 유전자 작제물로서 또는 조합하여 발현 단위로서(소위 오페론으로서) 생산 균주에서 발현될 수 있다.

또한, 생산 균주는 ppsA 유전자 이외에 이의 유전자 산물이 시스테인 생산에 악영향을 미치는 추가의 유전자를 비활성화시킴으로써 최적화될 수 있다.

그러나, 최적화는 또한 돌연변이유발 및 개선된 시스테인 생산을 갖는 균주의 선택에 의해 그 자체로 공지된 방식으로도 가능하다.

본 발명의 맥락에서, ppsA 유전자에서의 유전적 변형은

a) ppsA 유전자의 코딩 서열이 부분적으로 또는 완전히 결실되거나,

b) ppsA 유전자의 코딩 서열이 하나 이상의 삽입 또는 5' 및/또는 3' 신장에 의해 변형되거나,

c) ppsA 구조 유전자가 약화된 효소 활성을 갖거나 완전히 비활성인 발현된 포스포에놀피루베이트 합성효소를 초래하는, 하나 이상의 돌연변이, 특히 점 돌연변이를 함유하거나,

d) ppsA 구조 유전자가 ppsA 발현의 강력한 약화 또는 완전한 억제 또는 mRNA 안정성의 감소를 초래하는, 하나 이상의 돌연변이, 특히 점 돌연변이를 함유하거나, 또는

e) ppsA 유전자의 발현 또는 ppsA mRNA의 번역이 5' 및/또는 3' 비코딩 ppsA 서열(프로모터, 5'-UTR, 샤인-달가르노 서열 및/또는 종결자)에 대한 유전적 변형으로 인해 약화되거나 완전히 억제되고

이러한 서열에 의해 발현된 단백질이 야생형 효소의 특이적 활성에 비해 감소된 상대적 PEP 합성효소 활성을 갖는다는 것을 의미하는 것으로서 정의된다.

본 발명의 맥락에서, a) 내지 e)에 열거된 ppsA 유전자 내의 유전적 변형의 임의의 조합이 또한 가능하다. 따라서, 요약하면, 본 발명의 맥락에서 더 적은 PpsA 단백질이 형성되거나 전혀 형성되지 않고/않거나 발현된 PpsA 단백질이 덜 활성이거나 비활성일 수 있다.

대안적인 접근법에서, 당업자에게 공지된 소위 "안티센스 RNA" 전략에 의해 유전자 전사 수준에서 ppsA 효소 활성을 약화시키거나 완전히 비활성화시키는 것도 가능하다. 또한 화학적 억제제이거나 단백질 억제제인 억제제를 첨가함으로써 ppsA 효소 활성이 약화되거나 완전히 비활성화되는 것을 생각할 수 있다.

바람직하게는, 본 발명에 따른 균주에서 ppsA 유전자를 변형시키는 것은 ppsA 구조 유전자의 완전 또는 부분적 결실, 효소 활성의 약화 또는 효소 비활성화를 유발하는 방식의 ppsA 구조 유전자의 돌연변이, 또는 ppsA 구조 유전자 및/또는이의 전사되지 않거나 번역되지 않은 유전자 영역의 돌연변이를 포함하며, 여기서 유전자 영역은 ppsA 유전자의 발현 또는 번역의 약화 또는 완전한 억제 또는 ppsA mRNA의 안정성의 감소를 유발하는 방식으로, 발현을 조절하고 5' 및 3' 측면에 있다.

특히 바람직하게는, 본 발명에 따른 균주에서 ppsA 유전자의 비활성화는 ppsA cds(즉, E. 콜리의 ppsA cds의 경우, 서열번호: 1의 뉴클레오타이드 333-2711, 또는 P. 아나나티스의 ppsA cds의 경우, 서열번호: 3의 뉴클레오타이드 417- 2801)의 완전 또는 부분적 결실에 의해 또는 효소 활성의 약화 또는 효소 비활성화 또는 mRNA 안정성의 감소를 유발하는 방식으로 ppsA 구조 유전자의 돌연변이에 의해 유발된다.

바람직한 구현예에서, 미생물 균주는 돌연변이된 유전자가 에셰리키아 콜리로부터의 ppsA 유전자, 판토에아 아나나티스로부터의 ppsA 유전자, 및 이들 유전자와 상동성인 유전자로 이루어진 군으로부터 선택되는 것을 특징으로 한다. E. 콜리로부터의 ppsA 유전자는 유전자 ID 946209로 NCBI 유전자 데이터베이스 내의 항목에 개시되어 있고, P. 아나나티스로부터의 ppsA 유전자는 유전자 ID 11796889로 NCBI 유전자 데이터베이스의 항목에 개시되어 있다. 용어 "상동성 유전자"에 대해, 상기 주어진 정의가 적용된다. 특히 바람직하게는, 돌연변이된 ppsA 유전자는 E. 콜리로부터의 ppsA 유전자이다. 추가적으로 바람직한 구현예에서, 상기 cds는 서열번호: 1 뉴클레오타이드 333-2711(서열번호: 2를 갖는 단백질을 코딩함)에 개시된 E. 콜리로부터의 ppsA 유전자의 cds 또는 서열번호: 3 뉴클레오타이드 417-2801(서열번호: 4를 갖는 단백질을 코딩함)에 개시된 판토에아 아나나티스로부터의 ppsA 유전자의 cds이다.

바람직한 구현예에서, 미생물 균주는 ppsA 유전자의 코딩 DNA 서열이 서열번호: 5 또는 그와 상동성인 서열, 특히 바람직하게는 서열번호: 5인 것을 특징으로 한다. 용어 "상동 서열"에 대해서는, 상기 주어진 정의가 적용된다.

이 경우, 서열번호: 1에 명시된 DNA 서열에서의 돌연변이는 서열번호: 2에 명시된 WT 단백질 서열에서의 3개의 아미노산의 돌연변이, 즉, 서열번호: 6에 개시된 바와 같은 아미노산 서열을 갖는 ppsA-MHI 단백질을 코딩하는, 서열번호: 5에서와 같은 DNA 서열을 갖는 ppsA-MHI 유전자에 따라, 메티오닌으로 돌연변이된 위치 126에서의 발린(V126M), 히스티딘으로 돌연변이된 위치 427에서의 아르기닌(R427H) 및 이소류신으로 돌연변이된 위치 434에서의 발린(V434I)를 초래한다.

ppsA 유전자를 비활성화시키고 돌연변이시키기 위한 다양한 방법이 당업자에게 공지되어 있다. 가장 간단한 경우에, 모 균주는 공지된 방식으로(예컨대, N-메틸-N'-니트로-N-니트로소구아니딘과 같은 돌연변이유발 화학물질에 의해 화학적으로 또는 UV 조사에 의해 물리적으로) 돌연변이유발될 수 있고, 돌연변이는 게놈 DNA에서 무작위로 생성된 다음, 원하는 ppsA 돌연변이체는, 예를 들어, 돌연변이체가 효소 활성에 기초한 색 반응의 부재에 의해 또는 결함이 있는 ppsA 유전자의 검출을 통한 유전적 수단에 의해 각각 단수화된 후, 생성된 다수의 돌연변이체로부터 선택된다.

복잡한 무작위 돌연변이유발 및 원하는 ppsA 돌연변이체의 선택과 대조적으로, ppsA 유전자는 비교적 간단한 방식으로, 예를 들어 상동 재조합의 공지된 메커니즘에 의해 표적화된 비활성화를 거칠 수 있다. 상동 재조합에 의한 표적화된 유전자 비활성화를 위한 클로닝 시스템은 당업자에게 공지되어 있고, 예를 들어, Gene Bridges GmbH로부터의 Red^®/ET^® 기술에 기초한 "Quick and Easy E. coli Gene Deletion Kit"의 사용자 매뉴얼에 개시된 바와 같이 상업적으로 이용가능하다("Technical Protocol, Quick & Easy E. coli Gene Deletion Kit, by Red^®/ET^® Recombination, Cat. No. K006, Version 2.3, June 2012" 및 그 안에 인용된 참고문헌 참조).

선행 기술에 따르면, ppsA 유전자 또는 상기 유전자의 일부는 단리될 수 있고, 외래 DNA가 ppsA 유전자 내로 클로닝되어 ppsA 유전자의 단백질 한정 오픈 리딩 프레임을 방해할 수 있다. 따라서 ppsA 유전자의 표적화된 비활성화에 적합한 DNA 작제물은 게놈 ppsA 유전자와 상동성인 DNA의 5' 부분, 이후에 외래 DNA를 포함하는 유전자 세그먼트, 이후에 게놈 ppsA 유전자와 다시 상동성인 DNA의 3' 부분으로 구성될 수 있다.

따라서 상동 재조합을 위한 ppsA 유전자 내의 가능한 영역은 포스포에놀피루베이트 합성효소를 코딩하는 영역만을 포함하는 것은 아닐 수 있다. 가능한 영역은 또한 ppsA 유전자에 측접하는 DNA 서열, 즉 코딩 영역의 시작 전의 5' 영역(유전자 전사 프로모터, 예를 들어 서열번호: 1에서의 뉴클레오타이드 1 - 332, 또는 서열번호: 3에서의 뉴클레오타이드 1-416) 및 코딩 영역의 말단 이후의 3' 영역(유전자 전사 종결자, 예를 들어 서열번호: 1에서의 뉴클레오타이드 2712 - 3000, 또는 서열번호: 3에서의 뉴클레오타이드 2802 - 3062)에 있는 DNA 서열을 포함할 수 있고, 상동 재조합에 의한 이의 변형은 코딩 영역의 변형과 마찬가지로 ppsA 유전자의 비활성화를 야기할 수 있다.

외래 DNA는 바람직하게는 선별 마커 발현 카세트이다. 그것은 실제 선별 마커 유전자에 기능적으로 연결된 유전자 전사 프로모터, 선택적으로 이후의 유전자 전사 종결자로 구성된다. 이 경우, 선별 마커는 또한 ppsA 유전자의 5' 및 3' 측접 상동성 서열을 함유한다.

바람직하게는, 선별 마커는 각각 적어도 30 뉴클레오타이드, 특히 바람직하게는 적어도 50 뉴클레오타이드의 길이를 갖는 ppsA 유전자의 5' 및 3' 측접 상동성 서열을 함유한다.

따라서, ppsA 유전자를 비활성화시키기 위한 DNA 작제물은, 5' 말단으로부터 시작하여, ppsA 유전자에 상동성인 서열, 이후에 예를 들어 항생제 내성 유전자의 부류로부터 선택된 선별 마커의 발현 카세트, 및 이후에 ppsA 유전자에 상동성인 추가의 서열로 구성될 수 있다.

바람직한 구현예에서, ppsA 유전자를 비활성화시키기 위한 DNA 작제물은, 5' 말단으로부터 시작하여, 적어도 30개 뉴클레오타이드 길이, 특히 바람직하게는 적어도 50개 뉴클레오타이드 길이의 ppsA 유전자와 상동성인 서열, 이후에 항생제 내성 유전자의 부류로부터 선택되는 선별 마커의 발현 카세트, 및 이후에 적어도 30개 뉴클레오타이드 길이, 특히 바람직하게는 적어도 50개 뉴클레오타이드 길이의 ppsA 유전자와 상동성인 추가의 서열로 구성된다.

선별 마커 유전자는 일반적으로 그 유전자 생성물이 원래의 부모 균주가 성장할 수 없는 선택적 조건 하에서 부모 균주가 성장할 수 있도록 하는 유전자이다.

바람직한 선별 마커 유전자는 항생제 내성 유전자, 예를 들어 암피실린 내성 유전자, 테트라사이클린 내성 유전자, 카나마이신 내성 유전자, 클로람페니콜 내성 유전자 또는 네오마이신 내성 유전자의 군으로부터 선택된다. 다른 바람직한 선별 마커 유전자는 대사 결함을 갖는 모 균주(예컨대, 아미노산 영양요구체)가 상기 선별 마커 유전자의 발현에 의한 대사 결함의 보정의 결과로서 선택적 조건 하에서 성장할 수 있게 한다. 마지막으로, 또 다른 가능성은 이의 유전자 생성물이 모 균주에 대해 본질적으로 독성이 있는 화합물을 화학적으로 변경하여 상기 화합물을 비활성화시키는 선별 마커 유전자이다(예컨대, 많은 미생물에 독성인 화합물 아세트아미드를 무독성 생성물 아세테이트 및 암모니아로 분리하는, 효소 아세트아미다아제의 유전자).

암피실린 내성 유전자, 테트라사이클린 내성 유전자, 카나마이신 내성 유전자 및 클로람페니콜 내성 유전자가 선별 마커 유전자 중에서 특히 바람직하다. 테트라사이클린 내성 유전자 및 카나마이신 내성 유전자가 특히 바람직하다.

표적 유전자 비활성화 외에도 게놈으로부터 선별 마커를 제거하여 이중 및 다중 돌연변이체를 생산할 수 있게 하는 옵션을 제공하는 상동 재조합을 기반으로 하는 시스템도 있다. 이러한 시스템은, 예를 들어, Gene Bridges GmbH의 Red^®/ET^® 기술을 기반으로 하는 "Quick and Easy E. coli Gene Deletion Kit"로 상업적으로 이용가능한 소위 람다 레드 기술이다("Technical Protocol, Quick & Easy E. coli Gene Deletion Kit, by Red^®/ET^® Recombination, Cat. No K006, Version 2.3, June 2012" 및 그 안에 인용된 참고문헌 참조).

비활성화된 ppsA 유전자를 갖는 본 발명에 따른 균주의 예는 실시예에 개시되어 있는 균주 E. 콜리 W3110-△ppsA 및 P. 아나나티스-△ppsA::kan이다. 두 균주는 그들의 ppsA 유전자가 상동 재조합에 의해 비활성화된 것을 특징으로 한다.

상동 재조합에 기초한 표적화된 유전자 비활성화를 위한 또 다른 이러한 시스템은 당업자에게 공지되어 있고 실시예 3에 기술되어 있으며 람다 레드 재조합과 역선택 스크리닝의 조합에 기초하는 유전자 비활성화 또는 유전자 변형을 위한 방법이다. 상기 시스템은, 예를 들어, 문헌[Sun et al., Appl. Env. Microbiol. (2008) 74: 4241-4245]에 기재되어 있다. 예를 들어, 5' 말단으로부터 시작하여, ppsA 유전자에 상동성인 서열, 이후에 a) 항생제 내성 유전자의 부류로부터 선택된 선별 마커의 발현 카세트 및 b) 효소 레반수크라제를 코딩하는 sacB 유전자의 발현 카세트로 구성되는, 임의의 순서의 2개의 발현 카세트, 및 마지막으로 이후에 ppsA 유전자와 상동성인 추가 서열로 구성되는, ppsA 유전자를 비활성화시키기 위한 DNA 작제물이 사용된다.

1단계에서, DNA 작제물이 생산 균주 내로 형질전환되고 항생제 내성 클론이 단리된다. 수득된 클론은 이들이 공동통합된 sacB 유전자로 인해 수크로스 상에서 성장할 수 없다는 사실에 의해 구별된다. 2개의 마커 유전자는 2단계에서 적합한 DNA 단편이 상동 재조합에 의해 2개의 마커 유전자를 대체한다는 점에서 역선택의 원리에 의해 제거될 수 있다. 그 다음, 이 단계에서 수득된 클론은 수크로스 상에서 성장하는 능력을 회복한 다음 항생제에 대한 이들의 민감성을 회복한다. 이 방법은 실시예 3에서 E. 콜리의 ppsA WT 유전자(서열번호: 1)를 하기 기재된 삼중 돌연변이 PPSA-MHI(서열번호: 5)로 교환하기 위해 사용된다.

E. 콜리 균주 W3110-ppsA-MHI는 ppsA 유전자의 코딩 서열의 돌연변이로 인해 약화된 PpsA 효소 활성을 갖는 본 발명에 따른 균주의 일 예로서 실시예에 개시되어 있다. W3110-ppsA-MHI는 PpsA 삼중 돌연변이체 PpsA-V126M-R427H-V434I(ppsA-MHI)의 cds를 포함한다. ppsA-MHI의 돌연변이된 유전자의 cds는 DNA 서열 서열번호: 5에 상응하며 서열번호: 6의 서열을 갖는 PpsA 단백질을 코딩한다. PpsA-MHI는 서열번호: 6의 서열을 갖는 단백질이, 서열번호: 2에 명시된 WT 서열과 비교하여, 아미노산 서열에서의 하기 변화를 함유하는 것을 특징으로 한다: 위치 126에서의 발린은 메티오닌으로 돌연변이되고(V126M), 위치 427에서의 아르기닌은 히스티딘으로 돌연변이되며(R427H), 위치 434에서의 발린은 이소류신으로 돌연변이된다(V434I).

이러한 돌연변이로 인해, PpsA-MHI 단백질은 특정 야생형 효소 활성과 비교하여 26.8%의 상대적 효소 활성만을 가지고 있었다(실시예 5, 표 1 참조).

E. 콜리 ppsA 유전자의 경우, cds에서의 돌연변이 중 적어도 하나가 서열번호: 2에서의 아미노산 서열에서 하기 변화: 위치 126에서의 발린, 위치 427에서의 아르기닌 및/또는 위치 434에서의 발린 중 적어도 하나를 야기하는 것이 바람직하며, 상기 3개의 아미노산 중 임의의 것은 임의의 다른 아미노산으로 교환될 수 있다.

서열번호: 2에 명시된 WT 단백질의 아미노산 서열 내의 3개의 아미노산의 동시 돌연변이를 야기하는 돌연변이가 특히 바람직하다.

본 발명에 따른 ppsA-MHI 유전자에서의 돌연변이는 그 자체로 공지된 방식으로, 예를 들어 Agilent의 "QuickChange II Site-Directed Mutagenesis Kit"에 대한 사용자 매뉴얼에 개시된 바와 같이, 예를 들어 상업적으로 이용가능한 클로닝 키트를 사용하는 소위 "부위 지향적" 돌연변이유발에 의해 ppsA WT 유전자 내로 도입된다. 대안적으로, 본 발명에 따른 ppsA-MHI 유전자는 또한 DNA 합성에 의해 공지된 방식으로 생산될 수 있다.

예를 들어, E. 콜리 ppsA-MHI 삼중 돌연변이체와 같이 효소 활성의 약화를 유발하는 방식의 ppsA 구조 유전자의 돌연변이를 특징으로 하는 본 발명에 따른 균주는, 실시예에 개시된 바와 같이, 람다 레드 재조합과 유전적 변형을 위한 역선택 스크리닝과의 상기 기재된 조합을 사용하여 생산될 수 있다(예를 들어, Sun et al., Appl. Env. Microbiol. (2008) 74: 4241-4245 참조).

특히 바람직한 균주는 E. 콜리 W3110 △ppsA(실시예 1에 기재됨) 및 E. 콜리 W3110 ppsA-MHI(실시예 3에 기재됨)이다 .

본 발명은 본 발명에 따른 미생물 세포가 사용되는 것을 특징으로 하는, L-시스테인을 생산하기 위한 발효 공정을 추가로 제공한다.

형성되는 본 발명에 따른 공정의 주요 생성물은 L-시스테인이며, 이로부터 화합물 L-시스틴 및 티아졸리딘이 형성될 수 있다. L-시스틴과 티아졸리딘은 발효 중에 형성되어 배양 상청액과 침전물 모두에서 축적된다. 티아졸리딘은 시스테인 생산의 부산물로서 형성될 수 있는 피루베이트 및 시스테인의 부가물인 2-메틸-2,4-티아졸리딘디카르복실산이다(EP 0 885 962 B1).

본 발명의 맥락에서, 총 시스테인의 수율은 생산된 시스테인, 시스틴 및 티아졸리딘의 총합으로서 정의된다. 이는 실시예 7에 기재된 바와 같이 전체 배양물로부터 결정된다. 그것은, 예를 들어, Gaitonde(Gaitonde, M. K. (1967) Biochem. J. 104, 627-633)에 의한 비색 분석으로 정량화될 수 있다.

선행 기술은 아미노산, 특히 시스테인의 생산이 포스포에놀피루베이트 합성효소 효소 활성을 약화시키거나 비활성화시킴으로써 개선될 수 있는 임의의 공정 또는 생산 균주를 개시하지 않는다.

본 출원의 실시예에 나타낸 바와 같이, 시스테인 생산에 적합한 미생물 균주에서 ppsA 효소 활성의 약화 또는 비활성화는 총 시스테인의 수율, 즉 발효 공정에서 생산된 시스테인, 시스틴 및 및 티아졸리딘의 총합을 유의하게 증가시킨다. 선행 기술로부터, 이것은 전혀 예상치 못한 것이었다.

실시예 7의 표 4에 요약된 바와 같이, 상응하는 야생형 균주와 비교하여 E. 콜리 W3110의 ppsA 돌연변이체의 발효에서 유의하게 더 높은 시스테인 수율이 달성되었다는 것은 놀라운 일이었다. 선행 기술과는 반대로 그리고 당업자에게 예상외로, 포스포에놀피루베이트 합성효소 활성의 약화 또는 비활성화는 개선된 시스테인 생산 균주를 초래하였다.

시스테인 생산 균주를 개선하기 위한 이러한 신규하고 진보적인 수단은 실시예 6의 표 2 및 표 3에 요약된 결과에 의해 확인되었으며, 여기서 에셰리키아 콜리에서 약화된 효소 활성을 갖는 PpsA 효소를 초래하는 ppsA 유전자의 비활성화, 또는 돌연변이된 ppsA 및 판토에아 아나나티스에서 ppsA 유전자의 비활성화는 이미 진탕 플라스크에서의 배양에서 개선된 시스테인 수율을 야기하였다.

따라서, 당업자에게, 포스포에놀피루베이트 합성효소 활성의 약화 또는 비활성화는 다른 시스테인 생산 균주에서 시스테인 생산을 개선하기 위한 신규한 유용한 수단이다.

따라서, 본 발명에 따르며 시스테인 생산에 적합한 미생물 균주에서, 생산 균주에서 ppsA 유전자에 의해 코딩되는 단백질의 효소 활성은 약화되거나 완전히 억제되며, 동시에 시스테인 생산은 증가된다. 실시예 7은 시스테인 생산이 가능하고 Wt 효소 대신 감소된 PpsA 효소 활성을 갖는 ppsA 돌연변이체 ppsA-MHI를 코딩하는 균주가 ppsA WT 유전자를 함유하는 균주보다 발효에서 유의하게 높은 시스테인 수율을 달성한다는 것을 입증한다.

문제의 발효 과정에서, 형성되는 것은 본 발명에 따른 생산 균주의 바이오매스뿐만 아니라, 시스테인 및 이의 산화 생성물 시스틴이다. 바이오매스와 시스테인의 형성은 일시적으로 상관될 수 있거나, 또는 바이오매스와 시스테인은 시간이 지남에 따라 상호 분리된 방식으로 형성될 수 있다. 배양은 당업자에게 익숙한 방식으로 수행된다. 이를 위해, 배양은 쉐이크 플라스크(실험실 규모)에서 또는 발효(생산 규모)에 의해 수행될 수 있다.

1 L 초과의 발효 부피를 갖는 발효에 의한 생산 규모 공정이 바람직하며, 10 L 초과의 생산 규모가 바람직하고, 1000 L 초과의 생산 규모가 특히 바람직하며, 10,000 L 초과의 발효 부피가 특히 바람직하다.

배양 배지는 미생물 배양의 실시로부터 당업자에게 익숙하다. 이들은 전형적으로 탄소원, 질소원, 및 첨가제, 예컨대 비타민, 염 및 미량 원소, 및 세포 성장 및 시스테인 생산을 최적화하는 황 공급원으로 구성된다.

탄소원은 시스테인 생성물의 형성을 위해 생산 균주에 의해 사용될 수 있는 것이다. 이들은 예를 들어 글루코스, 만노스, 프럭토스 또는 갈락토스와 같은 C6 당(헥소스) 및 예를 들어 자일로스, 아라비노스 또는 리보스와 같은 C5 당(펜토스)을 포함하는 모든 형태의 단당류를 포함한다.

그러나, 본 발명에 따른 생산 방법은 또한 이당류, 특히 수크로스, 락토스, 말토스 또는 셀로비오스의 형태의 모든 탄소원을 포함한다.

더욱이, 본 발명에 따른 생산 공정은 또한 2개 초과의 당 단위를 갖는 고급 당류, 글리코사이드 또는 탄수화물 형태의 모든 탄소원, 예를 들어 말토덱스트린, 전분, 셀룰로스, 헤미셀룰로스, 펙틴 또는 가수분해에 의해 (효소적 또는 화학적으로) 방출되는 단당류 또는 올리고머를 포함한다. 고급 탄소원의 가수분해는 본 발명에 따른 생산 공정의 상류일 수 있거나, 또는 본 발명에 따른 생산 공정 동안 원위치에서 일어날 수 있다.

당 또는 탄수화물 이외의 다른 이용가능한 탄소원은 아세트산(또는 그로부터 유래된 아세테이트 염), 에탄올, 글리세롤, 시트르산(및 그의 염) 또는 피루베이트(및 그의 염)이다. 그러나, 이산화탄소 또는 일산화탄소와 같은 기체 탄소원도 생각할 수 있다.

본 발명에 따른 생산 공정과 관련하여 탄소원은 분리된 순수한 물질 또는 경제적 효율을 증가시키기 위해 가수분해물로서 식물성 원료의 화학적 또는 효소적 소화에 의해 수득될 수 있는 바와 같이 추가의 정제 없이 개별 탄소원의 혼합물을 포함한다. 이들은, 예를 들어, 전분(글루코스 단당류), 사탕무(글루코스, 프럭토스 및 아라비노스 단당류), 사탕수수(수크로스 이당류), 펙틴(갈락투론산 단당류) 또는 리그노셀룰로오스(셀룰로스로부터의 글루코스 단당류, 헤미셀룰로오스로부터의 자일로스, 아라비노스, 만노스 및 갈락토스 단당류, 및 비탄수화물 리그닌)의 가수분해물을 포함한다. 또한, 식물성 원료의 소화로부터의 폐기물, 예를 들어 당밀(사탕무) 또는 바가스(사탕수수)가 또한 탄소원으로 사용될 수 있다.

생산 균주를 배양하기 위한 바람직한 탄소원은 글루코스, 프럭토스, 수크로스, 만노스, 자일로스, 아라비노스, 및 전분, 리그노셀룰로오스, 사탕수수 또는 사탕무로부터 수득될 수 있는 식물성 가수분해물이다.

특히 바람직한 탄소원은 단리된 형태 또는 식물성 가수분해물의 구성성분으로서 글루코스 및 수크로스이다.

특히 바람직한 탄소원은 글루코스이다.

질소원은 바이오매스의 형성을 위해 생산 균주에 의해 사용될 수 있는 것들이다. 이들은 기체 형태 또는 NH₄OH와 같은 수용액 중의 암모니아, 또는 이의 염, 예를 들어 암모늄 설페이트, 암모늄 클로라이드, 암모늄 포스페이트, 암모늄 아세테이트 또는 암모늄 니트레이트를 포함한다. 더욱이, 적합한 질소원은 공지된 니트레이트 염, 예를 들어, KNO₃, NaNO₃, 암모늄 니트레이트, Ca(NO₃)₂, Mg(NO₃)₂ 및 다른 질소원, 예컨대, 우레아이다. 질소원은 또한 아미노산의 복합 혼합물, 예를 들어 효모 추출물, 프로테오스 펩톤, 맥아 추출물, 대두 펩톤, 카사미노산, 옥수수 침지액(액체 또는 소위 CSD로서 건조됨) 및 또한 NZ 아민 및 효모 질소 염기를 포함한다.

배치(batch) 형태의 1회 첨가로서 또는 연속 공급물로서 황 공급원의 계량된 첨가가 시스테인 및 시스테인 유도체의 효율적인 생산에 필요하다. 연속적인 계량 첨가는 순수한 공급 용액으로서 또는 예를 들어 글루코스와 같은 추가 공급 구성요소와의 혼합물로 달성될 수 있다.

적합한 황 공급원은 설페이트, 설파이트, 디티오나이트, 티오설페이트 또는 설파이드의 염이며, 이는 주어진 안정성에서 각각의 산을 사용하는 것도 생각할 수 있다.

바람직한 황 공급원은 설페이트, 설파이트, 티오설페이트 및 설파이드의 염이다.

특히 바람직한 황 공급원은 설페이트 및 티오설페이트의 염이다.

특히 바람직한 것은 티오설페이트 염, 예를 들어 나트륨 티오설페이트 및 암모늄 티오설페이트이다.

배양은 소위 배치 모드로 수행될 수 있으며, 이는 생산 균주의 스타터 배양물로 배양 배지의 접종 후 영양소 공급원의 추가 공급 없는 세포 성장을 포함한다.

배양은 또한 소위 유가 방식으로 수행될 수 있으며, 이는 이의 소모를 보상하기 위해 배치 모드로 성장의 초기 단계 후에 영양소 공급원(공급물)의 추가 공급을 포함한다. 공급물은 탄소원, 질소원, 황 공급원, 생산에 중요한 하나 이상의 비타민 또는 미량 원소, 또는 전술한 것들의 조합으로 구성될 수 있다. 공급물 구성요소는 혼합물로서 함께 또는 개별 공급 섹션에서 별도로 계량될 수 있다. 또한, 시스테인 생산을 특이적으로 증가시키는 첨가제와 마찬가지로, 다른 배지 성분이 또한 공급물에 첨가될 수 있다. 공급물은 연속적으로 또는 부분적으로(불연속적으로) 공급될 수 있거나, 또는 연속적 및 불연속적 공급물의 조합으로 공급될 수 있다. 유가 방식의 배양이 바람직하다.

공급물 중의 바람직한 탄소원은 글루코스, 수크로스, 및 글루코스 또는 수크로스 함유 식물성 가수분해물, 및 임의의 혼합 비율의 바람직한 탄소원의 혼합물이다.

공급물에서 특히 바람직한 탄소원은 글루코스이다.

바람직하게는, 배양물의 탄소원은 생산 단계 동안 발효기 내의 탄소원의 함량이 10 g/L를 초과하지 않도록 계량된다. 2 g/L의 최대 농도가 바람직하고 0.5 g/L의 최대 농도가 특히 바람직하며, 0.1 g/L의 최대 농도가 특히 바람직하다.

공급물 중의 바람직한 질소원은 기체 형태 또는 NH₄OH와 같은 수용액 중의 암모니아, 및 그의 염 암모늄 설페이트, 암모늄 포스페이트, 암모늄 아세테이트 및 암모늄 클로라이드, 및 추가적으로 우레아, KNO₃, NaNO₃ 및 암모늄 니트레이트, 효모 추출물, 프로테오스 펩톤, 맥아 추출물, 대두 펩톤, 카사미노산, 옥수수 침지액 및 또한 NZ 아민 및 효모 질소 염기이다.

공급물 중의 특히 바람직한 질소원은 암모니아 또는 암모늄 염, 우레아, 효모 추출물, 대두 펩톤, 맥아 추출물 또는 옥수수 침지액(액체 또는 건조 형태)이다.

공급물 중의 바람직한 황 공급원은 설페이트, 설파이트, 티오설페이트 및 설파이드의 염이다.

공급물 중의 특히 바람직한 황 공급원은 설페이트 및 티오설페이트의 염이다.

공급물 중의 황 공급원으로서 특히 바람직한 것은 티오설페이트 염, 예를 들어 나트륨 티오설페이트 및 암모늄 티오설페이트이다.

추가의 배지 첨가제로서, 원소 인, 염소, 나트륨, 마그네슘, 질소, 칼륨, 칼슘, 철의 염 및 미량으로(즉, μM 농도로) 원소 몰리브덴, 붕소, 코발트, 망간, 아연, 구리 및 니켈의 염이 첨가될 수 있다. 또한, 유기산(예컨대, 아세테이트, 시트레이트), 아미노산(예컨대, 이소류신) 및 비타민(예컨대, 비타민 Bl, 비타민 B6)이 배지에 첨가될 수 있다.

배양은 생산 균주의 성장 및 시스테인 생산을 촉진하는 pH 및 온도 조건 하에서 수행된다. 유용한 pH 범위는 pH 5 내지 pH 9 범위이다. pH 5.5 내지 pH 8의 pH 범위가 바람직하다. pH 6.0 내지 pH 7.5의 pH 범위가 특히 바람직하다.

생산 균주의 성장에 바람직한 온도 범위는 20℃ 내지 40℃이다. 온도 범위는 특히 바람직하게는 25℃ 내지 37℃이고, 특히 바람직하게는 28℃ 내지 34℃이다.

생산 균주의 성장은 선택적으로 산소 공급 없이(혐기성 배양) 또는 산소 공급과 함께(호기성 배양) 발생할 수 있다. 산소를 이용한 호기성 배양이 바람직하다.

시스테인 생산을 위한 본 발명에 따른 균주의 호기성 배양의 경우, 산소 함량에 대해 적어도 10%(v/v), 바람직하게는 적어도 20%(v/v) 및 특히 바람직하게는 적어도 30%(v/v)의 포화가 설정된다. 선행 기술에 따르면, 배양물 중의 산소 포화는 기체 공급 및 교반 속도의 조합을 통해 자동으로 조절된다.

산소 공급은 압축 공기 또는 순수한 산소의 도입에 의해 보장된다. 압축 공기의 도입에 의한 호기성 배양이 바람직하다. 호기성 배양에서 압축 공기 공급의 유용한 범위는 0.05 vvm 내지 10 vvm이다(vvm: 분당 발효 부피 리터당 압축 공기 리터로 지정된 발효 배치 내로의 압축 공기의 도입). 0.2 vvm 내지 8 vvm의 압축 공기의 도입이 바람직하고, 0.4 내지 6 vvm의 압축 공기의 도입이 특히 바람직하며 0.8 내지 5 vvm의 압축 공기의 도입이 특히 바람직하다.

최대 교반 속도는 2500 rpm, 바람직하게는 2000 rpm 및 특히 바람직하게는 1800 rpm이다.

배양 시간은 10시간 내지 200시간이다. 20시간 내지 120시간의 배양 시간이 바람직하다. 30시간 내지 100시간의 배양 시간이 특히 바람직하다.

전술한 방법에 의해 수득된 배양 배치는 배양 상층액에 용해된 형태로, 또는 침전된 형태의 시스틴으로서 산화된 시스테인을 함유한다. 배양 배치에 함유된 시스테인 또는 시스틴은 추가 작업 없이 직접 추가로 사용될 수 있거나 배양 배치로부터 단리될 수 있다.

바람직하게는, 상기 공정은 형성된 시스테인이 단리되는 것을 특징으로 한다. 그 자체로 공지된 공정 단계가 시스테인 및 시스틴을 단리하는 데 이용가능하며, 이는 원심분리, 경사분리, 무기산을 이용한 미정제 생성물의 용해, 여과, 추출, 크로마토그래피 또는 결정화, 또는 침전을 포함한다. 상기 공정 단계는 원하는 순도로 시스테인을 단리하기 위해 임의의 형태로 조합될 수 있다. 원하는 순도의 정도는 추가 사용에 따라 달라진다.

작업에 의해 수득된 시스틴은 추가 사용을 위해 시스테인으로 환원될 수 있다. 전기화학적 공정에서 L-시스틴을 L-시스테인으로 환원시키는 공정이 EP 0 235 908에 개시되어 있다.

분광 광도법, NMR, 기체 크로마토그래피, HPLC, 질량 분광법, 중량측정법, 또는 이들 분석 방법의 조합을 포함하여, 시스테인 또는 시스틴 생성물을 확인하고, 정량화하고, 순도의 정도를 결정하기 위한 다양한 분석 방법이 이용가능하다.

본 발명은 또한 화합물의 발효 생산을 위한 개선된 미생물 균주를 생산하는데 사용될 수 있으며, 이의 생합성은 3-포스포글리세레이트로부터 시작하여 L-세린을 통해 L-시스테인 및 L-시스틴으로 이어진다. 이것은 또한 포스포세린, O-아세틸세린, N-아세틸세린 및 L-시스테인과 피루베이트의 축합 생성물인 티아졸리딘을 포함한, L-세린 및 L-시스테인의 유도체의 발효 생산을 위한 미생물 균주를 포함한다.

도면은 실시예에서 사용된 플라스미드를 보여준다.
도 1은 실시예 1 및 실시예 2에서 사용된 3.4 kb 벡터 pKD13을 나타낸다.
도 2는 실시예 1 및 실시예 3에서 사용된 6.3 kb 벡터 pKD46을 나타낸다.
도 3은 실시예 3에서 사용된 5 kb 벡터 pKan-SacB를 나타낸다.
도 4는 실시예 4에서 사용된 4.2 kb 벡터 pACYC184를 나타낸다.

본 발명은 하기 실시예에 의해 제한되지 않고 이에 의해 추가로 예시될 것이다:

실시예 1: 에셰리키아 콜리에서 ppsA 결실 돌연변이체의 생산

유전자 분리 및 균주 개발에 사용된 모 균주는 에셰리키아 콜리 K12 W3110(DSMZ-독일 생물자원센터 GmbH로부터 균주 번호 DSM 5911하에 상업적으로 이용가능함)이었다 .

유전자 비활성화의 표적은 E. 콜리로부터의 ppsA 유전자의 코딩 서열이었다. E. 콜리 K12로부터의 ppsA 유전자의 DNA 서열(Genbank GeneID: 946209)은 서열번호: 1에 개시되어 있다. 뉴클레오타이드 333-2711(E. 콜리 ppsA에 의해 식별됨)은 서열번호: 2(E. 콜리 PpsA)에 개시된 아미노산 서열을 갖는 포스포에놀피루베이트 합성효소 단백질을 코딩한다.

E. 콜리 ppsA 유전자를 하기에 상세히 설명된 바와 같이 Gene Bridges GmbH의 Red^®/ET^® 기술을 사용하여 비활성화시켰다("Quick and Easy E. coli Gene Deletion Kit"의 사용자 매뉴얼에 설명되어 있음, "Technical Protocol, Quick & Easy E. coli Gene Deletion Kit, by Red^®/ET^® Recombination, Cat. No. K006, Version 2.3, June 2012" 및 그 안에 인용된 참고문헌, 예컨대 Datsenko and Wanner, Proc. Natl. Acad. Sci. USA 97 (2000): 6640-6645 참조). 이를 위해, 플라스미드 pKD13, pKD46 및 pCP20을 사용하였다:

- 3.4 kb 플라스미드 pKD13(도 1)은 수탁번호 AY048744.1 하에 "GenBank" 유전자 데이터베이스에 개시되어 있다.

- 6.3 kb 플라스미드 pKD46(도 2)은 수탁번호 AY048746.1 하에 "GenBank" 유전자 데이터베이스에 개시되어 있다.

- 9.4 kb 플라스미드 pCP20은 문헌[Cherepanov and Wackernagel, Gene 158 (1995): 9-14]에 개시되어 있다.

람다 레드 시스템을 사용한 상동 재조합에 의해 E. 콜리 W3110에서 ppsA 유전자를 비활성화시키기 위해, 하기 단계를 수행하였다:

1. E. 콜리 W3110을 플라스미드 pKD46(소위 "레드 재조합효소" 플라스미드, 도 2)으로 형질전환시키고, 암피실린 내성 클론(W3110 x pKD46으로 지칭됨)을 단리하였다.

2. 이의 비활성화에 적합한 ppsA 특이적 DNA 단편을 플라스미드 pKD13의 DNA(도 1) 및 프라이머 pps-5f(서열번호: 7) 및 pps-6r(서열번호: 8)을 이용한 PCR 반응("Phusion™ High-Fidelity" DNA Polymerase, Thermo Scientific™)에서 생산하였다.

프라이머 pps-5f는 ppsA 유전자의 5' 영역으로부터 30개의 뉴클레오타이드(nt)(서열번호: 1에서 nt 333-362) 및 이에 연결된, 플라스미드 pKD13에 특이적인 20 nt(도 1에서 "pr-1"로 지칭됨)를 함유하였다.

프라이머 pps-6r은 ppsA 유전자의 3' 영역으로부터 30 nt(역상보적 형태로, 서열번호: 1에서 nt 2682-2711) 및 이에 연결된, 플라스미드 pKD13에 특이적인 20 nt(도 1에서 "pr-2"로 지칭됨)를 함유하였다 .

프라이머 pps-5f 및 pps-6r을 사용하여 5' 말단 및 3' 말단 모두에 E. 콜리 W3110으로부터의 ppsA 유전자에 특이적인 DNA의 30 nt 절편을 함유한 1.4 kb PCR 생성물을 생산하기 위해 플라스미드 pKD13의 DNA를 사용하였다. 또한, PCR 생성물은 pKD13에 함유된 카나마이신 내성 유전자의 발현 카세트를 함유하고, 카나마이신 발현 카세트의 5' 및 3' 말단에 측접하여, 항생제 마커 카나마이신의 제거를 위해 이후 작업 단계에서 "FLP 재조합효소"(플라스미드 pCP20에 함유)에 대한 인식 서열로서 사용되었던 DNA의 짧은 절편인 소위 "FRT 직접 반복"(도 1에서 "FRT1" 및 "FRT2"로 지칭됨)을 함유하였다.

3. 1.4 kb PCR 생성물을 단리하고, 잔류 pKD13 플라스미드 DNA를 제거하기 위해 당업자에게 친숙하고 메틸화된 DNA만을 절단하는 제한 엔도뉴클레아제 Dpn I로 처리하였다. PCR 반응으로부터의 비메틸화된 DNA는 분해되지 않는다.

4. ppsA 유전자에 특이적이고 카나마이신 내성 유전자에 대한 발현 카세트를 함유하는 1.4 kb PCR 생성물을 E. 콜리 W3110 x pKD46 내로 형질전환시키고, 카나마이신 내성 클론을 30℃에서 LBkan 플레이트 상에서 단리하였다. LBkan 플레이트는 LB 배지(10 g/L 트립톤, 5 g/L 효모 추출물, 5 g/L NaCl), 1.5% 한천 및 15 mg/L 카나마이신을 함유하였다.

5. 수득된 카나마이신 내성 클론 중 10개를 LBkan 플레이트 상에서 정제하고(즉, 단수화에 의한 클론의 단리), PCR 반응에서 확인하여 카나마이신 내성 카세트가 ppsA 유전자에 정확하게 통합되었는지 여부를 결정하였다.

PCR 반응에 사용된 게놈 DNA("Phusion™ High-Fidelity" DNA Polymerase, Thermo Scientific™)를 Lbkan 배지(10 g/L 트립톤, 5 g/L 효모 추출물, 5 g/L NaCl, 15 mg/L 카나마이신)에서 E. 콜리 W3110의 카나마이신 내성 클론의 배양으로부터의 세포로부터 DNA 분리 키트(Qiagen)를 사용하여 분리하였다. E. 콜리 W3110 야생형 균주의 게놈 DNA를 대조군으로 사용하였다. PCR 반응에 사용된 프라이머는 pps-7f(서열번호: 9) 및 pps-8r(서열번호: 10)이었다. 프라이머 pps-7f는 서열번호: 1로부터 nt 167-188을 함유하였고, 프라이머 pps-8r은 역상보적 형태로 서열번호: 1로부터 nt 2779-2800을 함유하였다.

E. 콜리 W3110 야생형 DNA는 온전한 유전자에 대해 예상된 바와 같이 PCR 반응에서 2630 bp의 DNA 단편을 산출하였다. 대조적으로, 연구 중인 카나마이신 내성 클론은 1.4 kb PCR 생성물이 프라이머 pps-5f 및 pps-6r에 의해 정의된 부위에서 ppsA 유전자에 통합된 경우 예상된 바와 같이 PCR 반응에서 약 1660 bp의 DNA 단편을 산출하였다. 이 결과는 카나마이신 내성 유전자가 ppsA 유전자의 유전자좌에서 성공적으로 통합되었고 이에 따라 ppsA 유전자가 비활성화되었음을 보여주었다. 비활성화된 ppsA 유전자를 포함하는 클론을 선택하여 W3110-△ppsA::kan으로 명명하였다.

6. 카나마이신 선별 마커를 제거하기 위해, W3110-△ppsA::kan을 플라스미드 pCP20으로 형질전환시키고, 형질전환체를 30℃에서 선택하였다. 9.4 kb 벡터 pCP20은 문헌[Cherepanov and Wackernagel (1995), Gene 158: 9-14]에 개시되어 있다. 벡터 pCP20 상에는 FLP 재조합효소의 유전자가 존재한다. FLP 재조합효소는 카나마이신 내성 유전자의 발현 카세트에 측접하는 FRT 서열을 인식하고 카나마이신 발현 카세트를 제거한다. 이를 위해, 30℃에서 수득된 클론을 37℃에서 인큐베이션하였다. 이러한 조건 하에서, FLP 재조합효소의 발현을 유도하고, pCP20 벡터의 복제를 억제시켰다.

이 단계의 결과는 ppsA 유전자가 비활성화되고 카나마이신에 대한 민감성을 회복한(소위 항생제 선별 마커의 "큐어링(curing)") 클론이었다. △ppsA 돌연변이체의 게놈으로부터 카나마이신 카세트를 제거하는 것은 이중 또는 다중 돌연변이체를 생산하기 위한 추가 돌연변이의 도입을 허용한다.

W3110-△ppsA::kan은 pCP20 플라스미드로 처리한 후 카나마이신 민감성을 회복하였고, 이는 다음과 같이 확인되었다.

- LB 및 LBkan 플레이트 상에서 플레이팅함으로써:

LB 플레이트 상에서의 성장은 긍정적이었지만, LBkan 플레이트에서는 성장이 더 이상 관찰되지 않았으며, 이는 게놈으로부터 카나마이신 카세트의 성공적인 제거를 나타내었다.

- PCR 반응에 의해:

이를 위해, 게놈 DNA를 카나마이신 민감성 클론으로부터 단리하고(Qiagen DNA 단리 키트), 프라이머 pps-7f(서열번호: 9) 및 pps-8r(서열번호: 10)을 사용한 PCR 반응("Phusion™ High-Fidelity" DNA Polymerase, Thermo Scientific™)에서 사용하였다. E. 콜리 W3110 야생형 DNA는 온전한 유전자에 대해 예상된 대로 PCR 반응에서 약 2630 bp의 DNA 단편을 산출하였다. 대조적으로, 카나마이신 민감성 클론은 PCR 반응에서 약 300 bp의 DNA 단편을 산출하였으며, 이는 상동 재조합 후에 남아있는 비활성화된 ppsA 유전자의 5' 및 3' 단편의 예상된 크기에 해당하였다.

이 단계로부터 단리된 균주를 E. 콜리 W3110-△ppsA로 명명하였다. 이 균주는 비활성화된 ppsA 유전자를 함유하였다는 사실 및 상기 균주가 항생제 카나마이신에 대한 민감성을 회복하였다는 사실에 의해 구별된다.

실시예 2 : 판토에아 아나나티스에서 ppsA 결실 돌연변이체의 생산

유전자 단리 및 균주 개발에 사용된 모 균주는 판토에아 아나나티스(DSMZ-독일 생물자원센터 GmbH로부터 균주 번호 DSM 30070 하에 상업적으로 이용가능함)였다.

유전자 비활성화의 표적은 판토에아 아나나티스로부터의 ppsA 유전자였다. P. 아나나티스로부터의 ppsA 유전자의 DNA 서열(Genbank GeneID: 31510655)은 서열번호: 3에 개시되어 있다. 뉴클레오타이드 417 - 2801(P. 아나나티스 ppsA에 의해 식별됨)은 서열번호: 4(P. 아나나티스 PpsA)에 개시된 아미노산 서열을 갖는 포스포에놀피루베이트 합성효소 단백질을 코딩한다.

P. 아나나티스 ppsA 유전자를 하기에 상세히 설명된 바와 같이 Gene Bridges GmbH의 Red^®/ET^® 기술을 사용하여 비활성화시켰다("Quick and Easy E. coli Gene Deletion Kit"의 사용자 설명서에 설명되어 있음, "Technical Protocol, Quick & Easy E. coli Gene Deletion Kit, by Red^®/ET^® Recombination, Cat. No. K006, Version 2.3, June 2012" 및 그 안에 인용된 참고문헌, 예컨대 Datsenko and Wanner, Proc. Natl. Acad. Sci. USA 97 (2000): 6640-6645 참조). 이를 위해, 플라스미드 pKD13 및 pRedET를 사용하였다:

- 상업적으로 이용가능한 9.3 kb 플라스미드 pRedET는 "Quick and Easy E. Coli Gene Deletion Kit"의 사용자 매뉴얼("Technical Protocol, Quick & Easy E. Coli Gene Deletion Kit, by Red^®/ET^® Recombination, Cat. No. K006, Version 2.3, June 2012" 참조)에 개시되어 있다.

람다 레드 시스템을 사용한 상동 재조합에 의해 P. 아나나티스에서 ppsA 유전자를 비활성화시키기 위해, 하기 단계를 수행하였다:

1. P. 아나나티스를 플라스미드 pRedET(소위 "레드 재조합효소" 플라스미드)로 형질전환시키고, 테트라사이클린 내성 클론을 단리하였다(P. 아나나티스 x pRedET로 지칭됨).

2. 이의 비활성화에 적합한 ppsA 특이적 DNA 단편을 플라스미드 pKD13의 DNA(도 1) 및 프라이머 ppsapa-3f(서열번호: 11) 및 ppsapa-4r(서열번호: 12)을 이용한 PCR 반응("Phusion™ High-Fidelity" DNA Polymerase, Thermo Scientific™)에서 생산하였다.

프라이머 ppsapa-3f는 ppsA 유전자의 5' 영역으로부터 49 nt(서열번호: 3에서 nt 417-465) 및 이에 연결된, 플라스미드 pKD13에 특이적인 20 nt(도 1에서 "pr-1"로 지칭됨)를 함유하였다.

프라이머 ppsapa-4r은 ppsA 유전자의 3' 영역으로부터 49 nt(역상보적 형태로, 서열번호: 3에서 nt 2753-2801) 및 이에 연결된, 플라스미드 pKD13에 특이적인 20 nt(도 1에서 "pr-2"로 지칭됨)를 함유하였다.

프라이머 ppsapa-3f 및 ppsapa-4r을 사용하여 5' 말단과 3' 말단 모두에 P. 아나나티스로부터의 ppsA 유전자에 특이적인 DNA의 49 nt 부분을 함유한 1.4 kb PCR 생성물을 생산하기 위해 플라스미드 pKD13의 DNA를 사용하였다. 더욱이, PCR 생성물은 pKD13에 함유된 카나마이신 내성 유전자의 발현 카세트를 함유하였고, 카나마이신 발현 카세트의 5' 및 3' 말단에 측접하여, 필요에 따라 ppsA 결실 돌연변이체에서 항생제 마커 카나마이신의 제거를 허용하는 DNA의 짧은 절편인 소위 "FRT 직접 반복"(도 1에서 "FRT1" 및 "FRT2"로 지칭됨)을 함유하였다.

3. 1.4 kb PCR 생성물을 단리하고, 잔류 pKD13 플라스미드 DNA를 제거하기 위해 당업자에게 친숙하고 메틸화된 DNA만을 절단하는 제한 엔도뉴클레아제 Dpn I으로 처리하였다. PCR 반응으로부터 비메틸화된 DNA는 분해되지 않는다.

4. ppsA 유전자에 특이적이고 카나마이신 내성 유전자에 대한 발현 카세트를 함유하는 1.4 kb PCR 생성물을 P. 아나나티스 x pRedET 내로 형질전환시키고, 카나마이신 내성 클론을 30℃에서 LBkan 플레이트 상에서 단리하였다. LBkan 플레이트는 LB 배지(10 g/L 트립톤, 5 g/L 효모 추출물, 5 g/L NaCl), 1.5% 한천 및 15 mg/L 카나마이신을 함유하였다.

5. 카나마이신 내성 클론을 LBkan 플레이트 상에서 정제하고(즉, 단수화에 의한 클론의 단리), PCR 반응에서 확인하여 카나마이신 내성 카세트가 ppsA 유전자에 정확하게 통합되었는지 여부를 결정하였다.

PCR 반응("Phusion™ High-Fidelity" DNA Polymerase, Thermo Scientific™)에 사용된 게놈 DNA를 Lbkan 배지(10 g/L 트립톤, 5 g/L 효모 추출물, 5 g/L NaCl, 15 mg/L 카나마이신)에서 P. 아나나티스의 카나마이신 내성 클론의 배양으로부터의 세포로부터 DNA 단리 키트(Qiagen)를 사용하여 단리하였다. P. 아나나티스 야생형 균주의 게놈 DNA를 대조군으로 사용하였다. PCR 반응에 사용된 프라이머는 ppsapa-1f(서열번호: 13) 및 ppsapa-2r(서열번호: 14)이었다. 프라이머 ppsapa-1f는 서열번호: 3에서 nt 281-302를 함유하였고, 프라이머 ppsapa-2r은 역상보적 형태로 서열번호: 3에서 nt 2901-2922를 함유하였다.

P. 아나나티스 야생형 DNA는 온전한 유전자에 대해 예상된 바와 같이 PCR 반응에서 2640 bp의 DNA 단편을 산출하였다. 대조적으로, 연구 중인 카나마이신 내성 클론은 1.4 kb PCR 생성물이 프라이머 ppsapa-3f(서열번호: 11) 및 ppsapa-4r(서열번호: 12)에 의해 정의된 부위에서 ppsA 유전자에 통합된 경우 예상된 바와 같이, PCR 반응에서 약 1670 bp의 DNA 단편을 산출하였다. 이 결과는 카나마이신 내성 유전자가 ppsA 유전자의 유전자좌에 성공적으로 통합되었고 이에 따라 ppsA 유전자가 비활성화되었음을 보여주었다. 비활성화된 ppsA 유전자를 함유하는 클론을 선택하여 P. 아나나티스-△ppsA::kan으로 명명하였다.

실시예 3: 에셰리키아 콜리 W3110-ppsA-MHI의 생산

효소 활성의 약화를 유발하는 방식의 ppsA 구조 유전자의 돌연변이를 특징으로 하는 에셰리키아 콜리 W3110-ppsA-MHI를 람다 레드의 재조합 및 유전자 변형을 위한 역선택 스크리닝의 당업자에게 공지된 조합을 사용하여 생산하였다(예를 들어, Sun et al., Appl. Env. Microbiol. (2008) 74: 4241-4245 참조). 유전자 ppsA-MHI의 DNA 서열은 서열번호: 5(ppsA-MHI)에 개시되어 있으며, 이는 서열번호: 6(PpsA-MHI)에 명시된 서열을 갖는 단백질을 코딩한다.

절차는 다음과 같았다.

1. ppsA WT 유전자의 부분(서열번호: 1에서 nt 167 내지 nt 2800), 즉 cds 및 또한 5' 및 3' 측접 서열을 포함하는 2.6 kb DNA 단편을 프라이머 pps-7f(서열번호: 9) 및 pps-8r(서열번호: 10)을 사용한 PCR에 의해 E. 콜리 W3110의 게놈 DNA로부터 단리하였다.

2. "부위 지향" 돌연변이유발에 의해 ppsA WT 유전자 내로 돌연변이를 연속적으로 도입함으로써 ppsA WT 유전자로부터 ppsA-MHI를 수득하였다. 이는 사용자 매뉴얼의 지침에 따라 Agilent의 상업적으로 이용가능한 클로닝 키트 "QuickChange II Site-Directed Mutagenesis Kit"를 사용하여 수행되었다.

3. E. 콜리 W3110의 ppsA WT 유전자를 ppsA-MHI로 교환하기 위해, 먼저 수행된 것은 프라이머 pps-9f(서열번호: 15) 및 pps-10r(서열번호: 16)을 사용한 PCR에 의해 플라스미드 pKan-SacB(도 3)로부터 3.2 kb Kan-sacB 카세트를 단리하는 것이었다.

플라스미드 pKan-sacB는 카나마이신(Kan) 내성 유전자 및 효소 레반수크라제를 코딩하는 sacB 유전자 모두에 대한 발현 카세트를 함유한다.

프라이머 pps-9f는 ppsA 유전자의 개시 ATG로부터 시작하는 30 nt(서열번호: 1에서 nt 333-362) 및 이에 연결된, 플라스미드 pKan-SacB에 특이적인 20 nt(도 3에서 "pr-f"로 지칭됨)를 함유하였다.

프라이머 pps-10r은 ppsA 유전자의 정지 코돈으로부터 30 nt(역상보적 형태로, 서열번호: 1에서 nt 2682-2711) 및, 이에 연결된, 플라스미드 pKan-SacB에 특이적인 21 nt(도 3에서 "pr-r"로 지칭됨)를 함유하였다.

4. E. 콜리 W3110 x pKD46(이의 생산을 위해, 실시예 1 참조)을 ppsA 특이적 3.2 kb PCR 생성물로 형질전환시키고, 카나마이신 내성 클론을 단리하였다.

5. 클론을 LBSC 플레이트(10 g/L 트립톤, 5 g/L 효모 추출물, 7% 수크로스, 1.5% 한천 및 15 mg/L 카나마이신)에 시딩하였다.

통합된 sacB 유전자를 함유하는 클론은 수크로스로부터 독성 레반을 생산하였고, 이는 성장 억제를 야기하였다. 이러한 클론을 선택하고, PCR 반응에서 확인하여 Kan-sacB 카세트가 ppsA 유전자에 정확히 통합되었는지 여부를 결정하였다. PCR 반응("Phusion™ High-Fidelity" DNA Polymerase, Thermo Scientific™)에 사용된 게놈 DNA를 Lbkan 배지(10 g/L 트립톤, 5 g/L 효모 추출물, 5 g/L NaCl, 15 mg/L 카나마이신)에서 E. 콜리 W3110의 카나마이신 내성 클론의 배양으로부터의 세포로부터 DNA 단리 키트(Qiagen)를 사용하여 이전에 수득하였다. E. 콜리 W3110 야생형 균주의 게놈 DNA를 대조군으로 사용하였다. PCR 반응에 사용된 프라이머는 pps-7f(서열번호: 9) 및 pps-8r(서열번호: 10)이었다.

E. 콜리 W3110 야생형 DNA는 온전한 유전자에 대해 예상된 바와 같이 PCR 반응에서 2630 bp의 DNA 단편을 산출하였다. 대조적으로, 카나마이신 내성 클론은, 3.2 kb PCR 생성물이 프라이머 pps-9f(서열번호: 15) 및 pps-10r(서열번호: 16)에 의해 정의된 부위에서 ppsA 유전자에 통합된 경우 예상된 바와 같이 PCR 반응에서 약 3400 nt의 DNA 단편을 산출하였다. 이 결과는 Kan-sacB 카세트가 ppsA 유전자의 유전자좌에 성공적으로 통합되었고 이에 따라 ppsA 유전자가 비활성화되었음을 보여주었다. 통합된 Kan-sacB 카세트를 함유하는 클론을 선택하여 W3110-△ppsA::kan-sacB x pKD46으로 명명하였다.

6. 다음 단계에서, Kan-sacB 카세트를 ppsA-MHI 유전자로 교환하였다. 이를 위해, 프라이머 pps-11f(서열번호: 17) 및 pps-12r(서열번호: 18)을 사용한 PCR 반응("Phusion™ High-Fidelity" DNA Polymerase, Thermo Scientific™)에서 단계 2로부터의 ppsA-MHI DNA 단편으로부터 2.5 kb DNA 단편을 증폭시켰다. 프라이머 pps-11f는 서열번호: 1에서 nt 300-319를 함유하였고, 프라이머 pps-12r은 역상보적 형태로 서열번호: 1에서 nt 2743-2763를 함유하였다.

7. 2.5 kb ppsA-MHI 유전자를 E. 콜리 W3110-△ppsA::kan-sacB x pKD46 내로 형질전환시키고, 카나마이신이 없는 LBS 플레이트(10 g/L 트립톤, 5 g/L 효모 추출물, 7% 수크로스, 1.5% 한천) 상에서 클론을 선택하였다. 더 이상 활성 sacB 유전자를 함유하지 않는 클론만이 LBS 플레이트에서 성장할 수 있었다.

더 이상 활성 Kan 유전자를 함유하지 않고 카나마이신의 존재 하에서 이의 성장이 억제된 클론을 선택하기 위해, 이들 클론을 LBkan 플레이트 상에 시딩하였다.

수크로스의 존재 하에서 적극적인 성장을 나타내는 클론 및 카나마이신의 존재 하에서 부정적인 성장을 나타내는 클론을 선택하고 PCR 반응에서 확인하여 Kan-sacB 카세트가 ppsA-MHI 유전자에 의해 정확히 대체되었는지 여부를 결정하였다.

게놈 DNA를 LB 배지(10 g/L 트립톤, 5 g/L 효모 추출물, 5 g/L NaCl)에서의 배양으로부터의 세포로부터 DNA 단리 키트(Qiagen)를 사용하여 수득하였다. E. 콜리 W3110 야생형 균주의 게놈 DNA를 대조군으로 사용하였다. PCR 반응에 사용된 프라이머는 pps-7f(서열번호: 9) 및 pps-8r(서열번호: 10)이었다. 2630 nt의 예상된 크기의 PCR 생성물을 DNA 시퀀싱(Eurofins Genomics)에 의해 분석하였다. 정확하게 통합된 ppsA-MHI 유전자를 함유하는 클론은 서열번호: 5에 개시된 바와 같은 DNA 서열을 산출하였고, 이는 서열번호: 6으로부터의 서열에 상응하는 단백질을 코딩한다. 돌연변이 V126M, R427H 및 V434I를 함유하는 정확한 ppsA-MHI 유전자를 함유하는 클론을 선택하여 E. 콜리 W3110-ppsA-MHI로 명명하였다.

실시예 4: 시스테인 생산 균주의 생성

사용된 시스테인 특이적 생산 플라스미드는 모 벡터 pACYC184(도 4)로부터 유래된 플라스미드 pACYC184-cysEX-GAPDH-ORF306-serA317이었다. pACYC184-cysEX-GAPDH-ORF306-serA317은 EP 0 885 962 B1에 개시된 플라스미드 pACYC184-cysEX-GAPDH-ORF306의 유도체이다. 플라스미드 pACYC184-cysEX-GAPDH-ORF306은 복제 원점 및 테트라사이클린 내성 유전자(모 벡터 pACYC184)뿐만 아니라 시스테인에 의해 감소된 피드백 억제를 갖는 세린 O-아세틸트랜스퍼라제를 코딩하는 cysEX 대립유전자, 및 항시적 GAPDH 프로모터에 의해 그의 발현이 제어되는 유출 유전자 ydeD(ORF306)를 함유한다.

또한, pACYC184-cysEX-GAPDH-ORF306-serA317은 ydeD(ORF306) 유출 유전자 뒤에 클로닝되고 SerA 단백질(총 길이: 410개 아미노산) 중 N-말단 317개 아미노산을 코딩하는 serA317 유전자 단편을 추가로 함유한다. E. 콜리 serA 유전자는 유전자 ID 945258로 "GenBank" 유전자 데이터베이스에 개시되어 있다. serA317은 문헌 [Bell et al., Eur. J. Biochem. (2002) 269: 4176-4184]에 개시되어 있고, 상기 문헌에서 "NSD:317"로 지칭되며, 3-포스포글리세레이트 데하이드로게나제의 세린 피드백 내성 변이체를 코딩한다. serA317의 발현은 serA 프로모터에 의해 제어된다.

균주 E. 콜리 W3110, E. 콜리 W3110-△ppsA, E. 콜리 W3110-ppsA-MHI, P. 아나나티스 및 P. 아나나티스-△ppsA::kan을 각각 플라스미드 pACYC184-cysEX-GAPDH-ORF306-serA317(하기 실시예에서 pCYS로 지칭됨)로 형질전환시켰다. 형질전환을 EP 0 885 962 B1에 기재된 바와 같이 전기천공에 의해 선행 기술에 따라 수행하였다.

플라스미드 보유 형질전환체를 LBtet 한천 플레이트(10 g/L 트립톤, 5 g/L 효모 추출물, 5 g/L NaCl, 1.5% 한천, 15 mg/L 테트라사이클린) 상에서 선택하였다. 선택된 형질전환체를 QIAprep 스핀 플라스미드 키트(Qiagen)에 의한 플라미스드 단리 및 제한 분석에 의해 형질전환된 pCYS 플라스미드에 대해 확인하였다. 정확하게 혼입된 플라스미드 pCYS를 함유하는 형질전환체를 배양하여 ppsA 효소 활성을 확인하고(실시예 5) 시스테인 생산을 확인하였다(실시예 6 및 실시예 7).

실시예 5: ppsA 효소 활성의 결정

결정된 것은 각각 생산 플라스미드 pCYS(실시예 4)로 형질전환된 E. 콜리 균주 W3110, W3110-△ppsA, W3110-ppsA-MHI의 ppsA 효소 활성이었다. 50 ml의 SM1 배지(이의 조성의 경우, 실시예 6 참조)에서 3개의 균주의 쉐이크 플라스크 배양으로부터의 세포를 10분 동안 원심분리하여 펠렛화하고 10 ml의 0.9%(w/v) NaCl로 1회 세척하였다. 세포 펠렛을 10 ml의 분석 완충액(100 mM Tris-HCl, pH 8.0; 10 mM MgCl₂)에서 용해시키고, 세포 추출물을 제조하였다.

MP Biomedicals의 세포 균질화기 FastPrep-24™ 5G를 사용하였다. 이를 위해, 2 x 1 ml의 세포 현탁액을 제조사에 의해 미리 제작되고 유리 비드("용해 매트릭스 B")를 함유하는 1.5 ml 튜브에서 파쇄하였다(간격 사이에 매번 30초 일시 중지와 함께 6000 rpm의 쉐이킹 빈도에서 3 x 20초). 생성된 균질액을 원심분리하고, 상층액을 활성을 결정하기 위한 세포 추출물로서 사용하였다.

추출물의 단백질 함량을 제조업체의 지침에 따라 "Qubit^® Protein Assay Kit"를 사용하여 Thermo Fisher Scientific의 Qubit 3.0 형광계를 사용하여 결정하였다.

ppsA 효소 활성을 결정하기 위해, Sigma Aldrich의 포스페이트 검출 키트 "말라카이트 그린 포스페이트 분석 키트"(카탈로그 번호 MAK307)를 제조사의 지침에 따라 사용하였다. 그 기초는 ppsA 효소 활성에 의해 평형 반응 (4)에서 ATP를 이용하여 피루베이트를 전환시켜 포스포에놀피루베이트를 형성하는 것이다. 이것은 활성을 결정하는 데 사용되는 포스페이트의 화학량론적 양을 생산한다.

- 분석은 1 ml의 분석 완충액(100 mM Tris-HCl, pH 8.0; 10 mM MgCl₂)에 100 μg의 세포 추출물, 4 mM Na 피루베이트 및 4 mM ATP를 함유하였다.

- 다양한 분석을 30℃에서 인큐베이션하였다.

- 인큐베이션 시작 0분, 10분, 20분, 30분 및 60분 후, 각 분석 50 μl를 제거하고, 750 μl의 H₂O에 첨가하고, 마지막으로 "말라카이트 그린 포스페이트 분석 키트"로부터의 시약 200 μl와 혼합하였다.

- 인큐베이션 30분 후, 형성된 포스페이트의 양을 포스페이트 표준 곡선의 도움과 제조업체의 지침에 따라 620 nm에서의 흡광도의 결정에 의해 측광학적으로 결정하였다. 마지막으로, U/ml 추출물 내의 ppsA 효소 활성(1 U = μmol 기질 턴오버/분)을 각 분석으로부터의 샘플링 시간을 기초로 측정된 포스페이트 양으로부터 결정하였다. ppsA 효소 활성을 세포 추출물의 총 단백질 1 mg에 기반함으로써 특이적 ppsA 효소 활성을 계산하였다(U/mg 단백질).

표 1: ppsA 효소 활성의 결정

실시예 6: 쉐이크 플라스크에서 시스테인 생산

쉐이크 플라스크에서 배양하기 위한 예비배양물로서, 15 mg/L 테트라사이클린을 추가로 함유한 3 ml의 LB 배지(10 g/L 트립톤, 5 g/L 효모 추출물, 10 g/L NaCl)에 각 균주를 접종하고 16시간 동안 30℃ 및 135 rpm에서 쉐이커에서 인큐베이션하였다. 연구된 균주는 E. 콜리 W3110, W3110-△ppsA, W3110-ppsA-MHI였으며, 두 번째 실험에서는, 각각 생산 플라스미드 pCYS(실시예 4)로 형질전환된 P. 아나나티스 및 P. 아나나티스-△ppsA::kan이었다.

주 배양: 그 후, 각각의 예비배양물의 일부를 15 g/L 글루코스, 5 mg/L 비타민 B1 및 15 mg/L 테트라사이클린을 함유하는 30 ml의 SM1 배지를 함유하는 300 ml 엘렌마이어 플라스크(배플)로 옮겼다.

SM1 배지의 조성: 12 g/L K₂HPO₄, 3 g/L KH₂PO₄, 5 g/L (NH₄)₂SO₄, 0.3 g/L MgSO₄ x 7 H₂O, 0.015 g/L CaCl₂ x 2 H₂O, 0.002 g/L FeSO₄ x 7 H₂O, 1 g/L Na₃ 시트레이트 x 2 H₂O, 0.1 g/L NaCl; 1 ml/L 미량 원소 용액.

미량 원소 용액의 조성 : 0.15 g/L Na₂MoO₄ x 2 H₂O, 2.5 g/L H₃BO₃, 0.7 g/L CoCl₂ x 6 H₂O, 0.25 g/L CuSO₄ x 5 H₂O, 1.6 g/L MnC1₂ x 4 H₂O, 0.3 g/L ZnSO₄ x 7 H₂O.

주 배양물에 충분한 예비배양물을 접종하여 0.025/ml의 초기 세포 밀도 OD₆₀₀/ml(600 nm에서 측정된 주 배양물의 광학 밀도)를 확립하였다. 이로부터 시작하여, 전체 30 ml 배치를 30℃ 및 135 rpm에서 24시간 동안 배양하였다.

24시간 후, 샘플을 채취하고, 세포 상층액 중의 세포 밀도 OD₆₀₀/ml 및 총 시스테인 함량을 결정하였고, Gaitonde(Gaitonde, M. K. (1967), Biochem. J. 104, 627-633)에 의한 비색 분석을 시스테인의 정량적 결정에 사용하였다. 고산성 반응 조건 하에서, 이 분석은 시스테인과 시스테인 및 피루베이트의 축합 생성물인 EP 0 885 962 B1에 기재된 2-메틸티아졸리딘-2,4-디카르복실산(티아졸리딘)을 구별하지 못한다. 식 (2)에 따라 2개의 시스테인 분자의 산화에 의해 형성된 L-시스틴은 마찬가지로 pH 8.0에서 희석 용액에서 디티오트레이톨로 환원시킴으로써 분석에서 시스테인으로서 검출된다. 결과는 언급된 E. 콜리 균주에 대해 표 2에 보고되어 있고, P. 아나나티스 균주에 대해 표 3에 보고되어 있다.

표 2: 쉐이크 플라스크에서 24시간의 배양 시간 후 세포 밀도 및 총 시스테인 함량

표 3: 쉐이크 플라스크에서 24시간의 배양 시간 후 세포 밀도 및 총 시스테인 함량

실시예 7: 발효기에서 시스테인 생산:

생산 규모의 유가식 발효에서 E. 콜리 W3110 x pCYS, W3110-ppsA-MHI x pCYS 및 W3110-△ppsA x pCYS를 비교하였다.

예비배양물 1:

15 mg/L 테트라사이클린을 함유하는 LB 배지 20 ml에 100 ml 엘렌마이어 플라스크에서 각 균주를 접종하고, 셰이커(150 rpm, 30℃)에서 7시간 동안 인큐베이션하였다.

예비배양물 2:

그 후, 전체 예비배양물 1을 5 g/L 글루코스, 5 mg/L 비타민 B1 및 15 mg/L 테트라사이클린이 보충된 100 ml의 SM1 배지(SM1 배지의 조성에 대해서는, 실시예 6 참조)로 옮겼다.

배양물을 150 rpm에서 17시간 동안 30℃에서 엘렌마이어 플라스크(1 L 부피)에서 진탕시켰다. 이러한 인큐베이션 후, 세포 밀도 OD₆₀₀/ml는 3 내지 5 사이였다.

주 배양:

발효를 Eppendorf의 "DASGIP^® Parallel Bioreactor System for Microbiology" 발효기에서 수행하였다. 1.8 L의 총 부피를 갖는 배양 용기를 사용하였다. 발효 배지(900 ml)는 15 g/L 글루코스, 10 g/L 트립톤(Difco), 5 g/L 효모 추출물(Difco), 5 g/L (NH₄)₂SO₄, 1.5 g/L KH₂PO₄, 0.5 g/L NaC1, 0.3 g/L MgSO₄ x 7 H₂O, 0.015 g/L CaCl₂ x 2 H₂O, 0.075 g/L FeSO₄ x 7 H₂O, 1 g/L Na₃시트레이트 x 2 H₂O 및 1 ml의 미량 원소 용액(실시예 6 참조), 0.005 g/L 비타민 Bl 및 15 mg/L 테트라사이클린을 함유하였다.

발효기 내의 pH를 초기에 25% NH₄OH 용액에서 펌핑하여 6.5로 조정하였다. 발효 동안, pH를 25% NH₄OH로 자동 보정하여 6.5의 값으로 유지시켰다. 접종을 위해, 100 ml의 예비배양물 2를 발효기 용기 내로 펌핑하였다. 따라서 초기 부피는 약 1 L였다. 배양물을 초기에 400 rpm으로 교반하고, 2 vvm(분당 배양 배지 부피당 공기 부피)의 폭기 속도로 멸균 필터를 통해 멸균된 압축 공기로 폭기하였다. 이러한 시작 조건 하에서, 산소 프로브를 접종 전에 100% 포화로 보정하였다.

발효 동안 O₂ 포화를 위한 목표값을 30%로 설정하였다. O₂ 포화가 목표값 아래로 떨어진 후, O₂ 포화를 목표값으로 되돌리기 위해 조절 캐스케이드를 시작하였다. 이것은 먼저 기체 공급을 지속적으로(최대 5 vvm까지) 증가시킨 다음 교반 속도를 지속적으로(최대 1500 rpm까지) 증가시키는 것을 포함하였다.

발효를 30℃의 온도에서 수행하였다. 2시간의 발효 시간 후에, 나트륨 티오설페이트 x 5 H₂O의 멸균된 60%(w/v) 스톡 용액 형태의 황 공급원을 시간당 1.5 ml의 속도로 공급하였다.

발효기 내의 글루코스 함량이 초기 15 g/L에서 약 2 g/L로 떨어지면, 56%(w/w) 글루코스 용액을 지속적으로 계량 주입하였다. 그 이후로 발효기 내의 글루코스 농도가 더 이상 2 g/L를 초과하지 않도록 공급 속도를 조정하였다. 글루코스를 YSI(Yellow Springs, Ohio, USA)의 글루코스 분석기를 사용하여 결정하였다.

발효 시간은 48시간이었다. 그 후, 발효 배치로부터 샘플을 채취하고, 배양 상청액(주로 L-시스테인 및 티아졸리딘) 및 침전물(L-시스틴)에서 L-시스테인 및 그로부터 유도된 유도체의 함량의 개별 결정을 수행하였다. 이를 위해, 각각의 경우에 Gaitonde에 의한 비색 분석을 사용하였다(Gaitonde, M.K. (1967), Biochem. J. 104, 627-633). 침전물에 존재하는 L-시스틴은 동일한 방식으로 정량화하기 전에 먼저 8%(v/v) 염산에 용해되어야 했다. 마지막으로, 시스테인의 총량을 펠렛과 상층액에서의 시스테인의 총합으로서 결정하였다.

표 4에 요약된 바와 같이, 연구된 균주의 세포 밀도 OD₆₀₀/ml은 대조군 균주 W3110 x pCYS에 대해 다소 높았지만 비슷하였다. 대조적으로, 시스테인의 부피 생산량(g/L)은 야생형 ppsA 유전자를 함유하는 대조군 균주 W3110 x pCYS보다 W3110-ppsA-MHI x pCYS 및 W3110-△ppsA x pCYS 모두에서 유의하게 높았다(약 3배배에 의해).

따라서, 제어된 발효 조건 하에서, 생산 규모에 대해 달성된 결과는 ppsA 효소 활성에 대한 활성의 약화 또는 비활성화가 유의하게 개선된 시스테인 생산을 야기하고 따라서 균주를 개선하기 위한 적절한 수단이라는 것이며, 이 결과는 이전에 기술되지 않았고, 또한 선행 기술로 인해 당업자에게 예상치 못한 것이다.

표 4: 발효기에서 24시간의 배양 시간 후 세포 밀도 및 총 시스테인 함량

도면에 사용된 약어:

bla: 암피실린(β-락타마제)에 대한 내성을 부여하는 유전자

rrnB term: 전사를 위한 rrnB 종결자

kanR: 카나마이신에 대한 내성을 부여하는 유전자

ORI: 복제 원점

pr-1: 프라이머를 위한 결합 부위 1

pr-2: 프라이머를 위한 결합 부위 2

FRT1: FLP 재조합효소에 대한 인식 서열 1

FRT2: FLP 재조합효소에 대한 인식 서열 2

araC: araC 유전자(억제자 유전자)

P araC: araC 유전자의 프로모터

P araB: araB 유전자의 프로모터

Gam: 람다 파지 Gam 재조합 유전자

Bet: 람다 파지 Bet 재조합 유전자

Exo: 람다 파지 Exo 재조합 유전자

ORI101: 온도 민감성 복제 원점

RepA: 플라스미드 복제 단백질 A에 대한 유전자

sacB: 레반수크라제 유전자

pr-f: 프라이머를 위한 결합 부위 f(정방향)

pr-r: 프라이머를 위한 결합 부위 r(역방향)

OriC: 복제 원점 C

IHF: DNA 결합 단백질 IHF("통합 숙주 인자")에 대한 결합 부위

CamR: 클로람페니콜에 대한 내성을 부여하는 유전자

TetR: 테트라사이클린에 대한 내성을 부여하는 유전자

P15A ORI: 복제 원점

SEQUENCE LISTING <110> Wacker Chemie AG <120> Improved cysteine-producing strains <130> xxx <160> 18 <170> PatentIn version 3.5 <210> 1 <211> 3000 <212> DNA <213> Escherichia coli <400> 1 tttgttcttc ccgtgatgca gacataattc tatgaaagca taaattaaaa acgcacagaa 60 gcgtagaacg ttatgtctgg tttataaaat gaaccttcaa ttttattttt tatgaaaaca 120 gcatttcatt tttatggttt cgtttatacc gatggtttat gtggaaattg tcgaagagag 180 cagatttgcg caacgctggg atcagtctta aaaagtaaaa aaatatattt gcttgaacga 240 ttcaccgttt ttttcatccg gttaaatatg caaagataaa tgcgcagaaa tgtgtttctc 300 aaaccgttca tttatcacaa aaggattgtt cgatgtccaa caatggctcg tcaccgctgg 360 tgctttggta taaccaactc ggcatgaatg atgtagacag ggttgggggc aaaaatgcct 420 ccctgggtga aatgattact aatctttccg gaatgggtgt ttccgttccg aatggtttcg 480 ccacaaccgc cgacgcgttt aaccagtttc tggaccaaag cggcgtaaac cagcgcattt 540 atgaactgct ggataaaacg gatattgacg atgttactca gcttgcgaaa gcgggcgcgc 600 aaatccgcca gtggattatc gacactccct tccagcctga gctggaaaac gccatccgcg 660 aagcctatgc acagctttcc gccgatgacg aaaacgcctc ttttgcggtg cgctcctccg 720 ccaccgcaga agatatgccg gacgcttctt ttgccggtca gcaggaaacc ttcctcaacg 780 ttcagggttt tgacgccgtt ctcgtggcag tgaaacatgt atttgcttct ctgtttaacg 840 atcgcgccat ctcttatcgt gtgcaccagg gttacgatca ccgtggtgtg gcgctctccg 900 ccggtgttca acggatggtg cgctctgacc tcgcatcatc tggcgtgatg ttctccattg 960 ataccgaatc cggctttgac caggtggtgt ttatcacttc cgcatggggc cttggtgaga 1020 tggtcgtgca gggtgcggtt aacccggatg agttttacgt gcataaaccg acactggcgg 1080 cgaatcgccc ggctatcgtg cgccgcacca tggggtcgaa aaaaatccgc atggtttacg 1140 cgccgaccca ggagcacggc aagcaggtta aaatcgaaga cgtaccgcag gaacagcgtg 1200 acatcttctc gctgaccaac gaagaagtgc aggaactggc aaaacaggcc gtacaaattg 1260 agaaacacta cggtcgcccg atggatattg agtgggcgaa agatggccac accggtaaac 1320 tgttcattgt gcaggcgcgt ccggaaaccg tgcgctcacg cggtcaggtc atggagcgtt 1380 atacgctgca ttcacagggt aagattatcg ccgaaggccg tgctatcggt catcgcatcg 1440 gtgcgggtcc ggtgaaagtc atccatgaca tcagcgaaat gaaccgcatc gaacctggcg 1500 acgtgctggt tactgacatg accgacccgg actgggaacc gatcatgaag aaagcatctg 1560 ccatcgtcac caaccgtggc ggtcgtacct gtcacgcggc gatcatcgct cgtgaactgg 1620 gcattccggc ggtagtgggc tgtggagatg caacagaacg gatgaaagac ggtgagaacg 1680 tcactgtttc ttgtgccgaa ggtgataccg gttacgtcta tgcggagttg ctggaattta 1740 gcgtgaaaag ctccagcgta gaaacgatgc cggatctgcc gttgaaagtg atgatgaacg 1800 tcggtaaccc ggaccgtgct ttcgacttcg cctgcctacc gaacgaaggc gtgggccttg 1860 cgcgtctgga atttatcatc aaccgtatga ttggcgtcca cccacgcgca ctgcttgagt 1920 ttgacgatca ggaaccgcag ttgcaaaacg aaatccgcga gatgatgaaa ggttttgatt 1980 ctccgcgtga attttacgtt ggtcgtctga ctgaagggat cgcgacgctg ggtgccgcgt 2040 tttatccgaa gcgcgtcatt gtccgtctct ctgattttaa atcgaacgaa tatgccaacc 2100 tggtcggtgg tgagcgttac gagccagatg aagagaaccc gatgctcggc ttccgtggcg 2160 cgggccgcta tgtttccgac agcttccgcg actgtttcgc gctggagtgt gaagcagtga 2220 aacgtgtgcg caacgacatg ggactgacca acgttgagat catgatcccg ttcgtgcgta 2280 ccgtagatca ggcgaaagcg gtggttgaag aactggcgcg tcaggggctg aaacgtggcg 2340 agaacgggct gaaaatcatc atgatgtgtg aaatcccgtc caacgccttg ctggccgagc 2400 agttcctcga atatttcgac ggcttctcaa ttggctcaaa cgatatgacg cagctggcgc 2460 tcggtctgga ccgtgactcc ggcgtggtgt ctgaattgtt cgatgagcgc aacgatgcgg 2520 tgaaagcact gctgtcgatg gctatccgtg ccgcgaagaa acagggcaaa tatgtcggga 2580 tttgcggtca gggtccgtcc gaccacgaag actttgccgc atggttgatg gaagagggga 2640 tcgatagcct gtctctgaac ccggacaccg tggtgcaaac ctggttaagc ctggctgaac 2700 tgaagaaata aaataaatcc ccggcggcgt ttagtcgccg gggttatgtg atccccgaag 2760 atgaaactta ttcaatctct tcacagacat cctgcgttaa acgccgcata atatcttttc 2820 ttaacaaaaa cttttgtatt ttacctgagg tagttcgcgg tagtttttcg attaccacga 2880 tatgttcagg atatttatat tttgcgaccc gtttacggct aaaaaaagcc actacctctt 2940 ccagcgataa tgaatgatgc ggcgctttca gcacgacata agcgcatgat cgttcaccta 3000 <210> 2 <211> 792 <212> PRT <213> Escherichia coli <400> 2 Met Ser Asn Asn Gly Ser Ser Pro Leu Val Leu Trp Tyr Asn Gln Leu 1 5 10 15 Gly Met Asn Asp Val Asp Arg Val Gly Gly Lys Asn Ala Ser Leu Gly 20 25 30 Glu Met Ile Thr Asn Leu Ser Gly Met Gly Val Ser Val Pro Asn Gly 35 40 45 Phe Ala Thr Thr Ala Asp Ala Phe Asn Gln Phe Leu Asp Gln Ser Gly 50 55 60 Val Asn Gln Arg Ile Tyr Glu Leu Leu Asp Lys Thr Asp Ile Asp Asp 65 70 75 80 Val Thr Gln Leu Ala Lys Ala Gly Ala Gln Ile Arg Gln Trp Ile Ile 85 90 95 Asp Thr Pro Phe Gln Pro Glu Leu Glu Asn Ala Ile Arg Glu Ala Tyr 100 105 110 Ala Gln Leu Ser Ala Asp Asp Glu Asn Ala Ser Phe Ala Val Arg Ser 115 120 125 Ser Ala Thr Ala Glu Asp Met Pro Asp Ala Ser Phe Ala Gly Gln Gln 130 135 140 Glu Thr Phe Leu Asn Val Gln Gly Phe Asp Ala Val Leu Val Ala Val 145 150 155 160 Lys His Val Phe Ala Ser Leu Phe Asn Asp Arg Ala Ile Ser Tyr Arg 165 170 175 Val His Gln Gly Tyr Asp His Arg Gly Val Ala Leu Ser Ala Gly Val 180 185 190 Gln Arg Met Val Arg Ser Asp Leu Ala Ser Ser Gly Val Met Phe Ser 195 200 205 Ile Asp Thr Glu Ser Gly Phe Asp Gln Val Val Phe Ile Thr Ser Ala 210 215 220 Trp Gly Leu Gly Glu Met Val Val Gln Gly Ala Val Asn Pro Asp Glu 225 230 235 240 Phe Tyr Val His Lys Pro Thr Leu Ala Ala Asn Arg Pro Ala Ile Val 245 250 255 Arg Arg Thr Met Gly Ser Lys Lys Ile Arg Met Val Tyr Ala Pro Thr 260 265 270 Gln Glu His Gly Lys Gln Val Lys Ile Glu Asp Val Pro Gln Glu Gln 275 280 285 Arg Asp Ile Phe Ser Leu Thr Asn Glu Glu Val Gln Glu Leu Ala Lys 290 295 300 Gln Ala Val Gln Ile Glu Lys His Tyr Gly Arg Pro Met Asp Ile Glu 305 310 315 320 Trp Ala Lys Asp Gly His Thr Gly Lys Leu Phe Ile Val Gln Ala Arg 325 330 335 Pro Glu Thr Val Arg Ser Arg Gly Gln Val Met Glu Arg Tyr Thr Leu 340 345 350 His Ser Gln Gly Lys Ile Ile Ala Glu Gly Arg Ala Ile Gly His Arg 355 360 365 Ile Gly Ala Gly Pro Val Lys Val Ile His Asp Ile Ser Glu Met Asn 370 375 380 Arg Ile Glu Pro Gly Asp Val Leu Val Thr Asp Met Thr Asp Pro Asp 385 390 395 400 Trp Glu Pro Ile Met Lys Lys Ala Ser Ala Ile Val Thr Asn Arg Gly 405 410 415 Gly Arg Thr Cys His Ala Ala Ile Ile Ala Arg Glu Leu Gly Ile Pro 420 425 430 Ala Val Val Gly Cys Gly Asp Ala Thr Glu Arg Met Lys Asp Gly Glu 435 440 445 Asn Val Thr Val Ser Cys Ala Glu Gly Asp Thr Gly Tyr Val Tyr Ala 450 455 460 Glu Leu Leu Glu Phe Ser Val Lys Ser Ser Ser Val Glu Thr Met Pro 465 470 475 480 Asp Leu Pro Leu Lys Val Met Met Asn Val Gly Asn Pro Asp Arg Ala 485 490 495 Phe Asp Phe Ala Cys Leu Pro Asn Glu Gly Val Gly Leu Ala Arg Leu 500 505 510 Glu Phe Ile Ile Asn Arg Met Ile Gly Val His Pro Arg Ala Leu Leu 515 520 525 Glu Phe Asp Asp Gln Glu Pro Gln Leu Gln Asn Glu Ile Arg Glu Met 530 535 540 Met Lys Gly Phe Asp Ser Pro Arg Glu Phe Tyr Val Gly Arg Leu Thr 545 550 555 560 Glu Gly Ile Ala Thr Leu Gly Ala Ala Phe Tyr Pro Lys Arg Val Ile 565 570 575 Val Arg Leu Ser Asp Phe Lys Ser Asn Glu Tyr Ala Asn Leu Val Gly 580 585 590 Gly Glu Arg Tyr Glu Pro Asp Glu Glu Asn Pro Met Leu Gly Phe Arg 595 600 605 Gly Ala Gly Arg Tyr Val Ser Asp Ser Phe Arg Asp Cys Phe Ala Leu 610 615 620 Glu Cys Glu Ala Val Lys Arg Val Arg Asn Asp Met Gly Leu Thr Asn 625 630 635 640 Val Glu Ile Met Ile Pro Phe Val Arg Thr Val Asp Gln Ala Lys Ala 645 650 655 Val Val Glu Glu Leu Ala Arg Gln Gly Leu Lys Arg Gly Glu Asn Gly 660 665 670 Leu Lys Ile Ile Met Met Cys Glu Ile Pro Ser Asn Ala Leu Leu Ala 675 680 685 Glu Gln Phe Leu Glu Tyr Phe Asp Gly Phe Ser Ile Gly Ser Asn Asp 690 695 700 Met Thr Gln Leu Ala Leu Gly Leu Asp Arg Asp Ser Gly Val Val Ser 705 710 715 720 Glu Leu Phe Asp Glu Arg Asn Asp Ala Val Lys Ala Leu Leu Ser Met 725 730 735 Ala Ile Arg Ala Ala Lys Lys Gln Gly Lys Tyr Val Gly Ile Cys Gly 740 745 750 Gln Gly Pro Ser Asp His Glu Asp Phe Ala Ala Trp Leu Met Glu Glu 755 760 765 Gly Ile Asp Ser Leu Ser Leu Asn Pro Asp Thr Val Val Gln Thr Trp 770 775 780 Leu Ser Leu Ala Glu Leu Lys Lys 785 790 <210> 3 <211> 3062 <212> DNA <213> Pantoea ananatis <400> 3 aagtcgtgcc tcgggcaggg aagtcgtaaa aacaagtgag ataatataag catgccttca 60 ggggcaagtg tagtctgggg catcgtttcc ctctcgcttt tgcatcatga cgtcacctgt 120 tcactctttt ttgcgccatt aaaaccgcct caggtgacag acaacgcctg tgtttgttgc 180 gcaacaaaaa cgccgcataa caggcagtaa aaaaaataat gagctaatta tcagcgtatt 240 agcaaaaaat aagggccttg cgcaacgctg aaaaaaacca ggcgcaattc tgaaactgtg 300 tctgagaatc tgctttaacg attcaacaga tcgtgtttaa tcagacgtta tgccaggctg 360 gatttgttaa tagcaggatt ttccatgtgc ccattcatta ataaaggatc agttcaatgt 420 ccaataaagg cgaacagccg ttagtacttt ggtacaacca gcttggcatg catgatgttg 480 atcgggtggg aggcaaaaat gcttctctgg gtgagatgat taccaatttg tcatctctgg 540 gcgtgtccgt tcccaacggt tttgcgacca cctcctgggc ctttaatcag tttcttgagc 600 agagcggtct gaaccagcgt atttatgctt tgctggatga caccaatatt gatgatgtgg 660 atcaactggc gaaggcgggt aagcagatac gccagtgggt agtcgaaacc ccgttccagc 720 ctgaactgga agccgcgatt ctttcggcct atgagcagct ctctgccgac gatgctgagg 780 catccttcgc cgtgcgctca tccgccaccg ccgaagatat gcctgacgcg tcctttgccg 840 gccagcagga aactttcctg aacgtgcagg gcatcgagtc agtcatggtg gcagtgaaac 900 acgtttatgc ctcactgttt aacgatcgcg ccatctccta tcgcgtccat cagggttacg 960 accatcgcgg cgtggcgctg tcggcgggga ttcagcgcat ggtgcgatcc gatctggcgt 1020 cctcaggggt catgttcacc attgataccg aatcgggctt tgatcaggtg gtgttcatta 1080 ccgccgcgtt gggcctgggt gaaatggtgg tacagggcgc ggtgaacccg gacgagtttt 1140 atgtgcacaa gccgacgctg gccgcgaaac gtcccgctat cgttcgccgc aacatgggct 1200 cgaaaaaggt gcggatggtt tacgccgact cgcgtgaaca tggcgagcag gtgcgcatcg 1260 aagatgtggc ggaagccgag cgcgatcgtt tctgtctgag cgatgccgaa gtggaggcgt 1320 tggcccatca ggcggtactg attgagcaac actacaagcg cccgatggat attgagtggg 1380 ccaaagacgg ccacaccggg aagttattta ttgtccaggc gcgccctgaa accgtgcgat 1440 ccaacggtca ggtcatggag cgttacagcc tgcagggaca gggcaaggtg gtgattgaag 1500 gccgtgcgat tggtcaccgc atcggcgccg gtaccgtcaa ggtcattcac gatatcagcg 1560 aaatgaaccg catcgaaaaa ggtgacgtgc tggtgaccga tatgaccgat cccgactggg 1620 aaccgatcat gaaaaaagcc tccgccattg tgacgaaccg cggcggccgt acctgccatg 1680 ccgcgattat cgcgcgtgag ctgggcatcc cggcggtggt tggctgtggc gatgccaccg 1740 agcggctgaa agagggacat accgttaccg tatcctgtgc tgagggcgat accggctatg 1800 tctacgatga actgctcgac ttcgacgtca ccagttcgca ggttgatacc atgccggacc 1860 tgccgcttaa aatcatgatg aacgtgggca acccggatcg cgcgttcgat ttcgcctgtt 1920 tgccaaacga aggggttggt ctggcgcggc tggaatttat tatcaaccgc atgatcggcg 1980 tgcatccaaa agcgttgctg gagttcgatc agcaaacccc tgaactgcag aagcagattc 2040 gtcagatgat gaaaggtttt gacgatccgg ttgagtttta catcgcccgt ctgaccgaag 2100 ggatcgcgac gctgggcgcg gcgttcgcgc cgaagcgcgt tattgtccgc ctgtcggatt 2160 ttaaaacgaa cgaatatgcc aatctggtgg gtggagaacg ttacgaaccc gaagaggaaa 2220 acccgatgct ggggttccgt ggcgcaggcc gctatgtctc cgagagtttc cgcgactgtt 2280 tcgcgctgga gtgcgaagcg gtgaagcgcg tacgcaacga gatggggctg accaacgtgg 2340 aaatcatggt gccctttgtg cgtacggtcg atcaggctca ggcggtggta gaggaattgg 2400 gtcgccaggg actgaagcgc ggcgagaacg ggctcaaggt cattatgatg tgtgaaatcc 2460 cctcgaatgc cctgctggcc gagcagtttt tacaacactt tgacggtttc tccatcggct 2520 ctaatgatat gactcagctg gcgctggggc tggatcgcga ctccggcgtg gtatctgcct 2580 tgtttgatga gcgtaatgag gcggtcaaag cgctgctgtc catggcgatt caggcggcga 2640 aaaaacaggg caaatacgta ggaatatgcg gtcaggggcc gtcagatcat caggatttcg 2700 cggcctggtt gatggagcag ggcatcgaca gtctgtctct gaatccggac accgtggtgg 2760 aaacctggtt aagcctggcg gcgctaaaca aacccgcctg aggtgatgga taacctccga 2820 tgccagaagg ccagcgcaag ctggcttttt tttttgtctt tttgacaggc aaaaaaaagc 2880 ccatcacagg ggatgggcaa agactacaca cagcaattct ttacgctact caggggaaat 2940 tagggcgttt agaaatcagt aacttgattt ccaacatagg aaacatggta ttcacacggc 3000 tcgctggcgt ctttaagaat cctcttatta gtttaaagga aataatattt tgacggctag 3060 gg 3062 <210> 4 <211> 794 <212> PRT <213> Pantoea ananatis <400> 4 Met Ser Asn Lys Gly Glu Gln Pro Leu Val Leu Trp Tyr Asn Gln Leu 1 5 10 15 Gly Met His Asp Val Asp Arg Val Gly Gly Lys Asn Ala Ser Leu Gly 20 25 30 Glu Met Ile Thr Asn Leu Ser Ser Leu Gly Val Ser Val Pro Asn Gly 35 40 45 Phe Ala Thr Thr Ser Trp Ala Phe Asn Gln Phe Leu Glu Gln Ser Gly 50 55 60 Leu Asn Gln Arg Ile Tyr Ala Leu Leu Asp Asp Thr Asn Ile Asp Asp 65 70 75 80 Val Asp Gln Leu Ala Lys Ala Gly Lys Gln Ile Arg Gln Trp Val Val 85 90 95 Glu Thr Pro Phe Gln Pro Glu Leu Glu Ala Ala Ile Leu Ser Ala Tyr 100 105 110 Glu Gln Leu Ser Ala Asp Asp Ala Glu Ala Ser Phe Ala Val Arg Ser 115 120 125 Ser Ala Thr Ala Glu Asp Met Pro Asp Ala Ser Phe Ala Gly Gln Gln 130 135 140 Glu Thr Phe Leu Asn Val Gln Gly Ile Glu Ser Val Met Val Ala Val 145 150 155 160 Lys His Val Tyr Ala Ser Leu Phe Asn Asp Arg Ala Ile Ser Tyr Arg 165 170 175 Val His Gln Gly Tyr Asp His Arg Gly Val Ala Leu Ser Ala Gly Ile 180 185 190 Gln Arg Met Val Arg Ser Asp Leu Ala Ser Ser Gly Val Met Phe Thr 195 200 205 Ile Asp Thr Glu Ser Gly Phe Asp Gln Val Val Phe Ile Thr Ala Ala 210 215 220 Leu Gly Leu Gly Glu Met Val Val Gln Gly Ala Val Asn Pro Asp Glu 225 230 235 240 Phe Tyr Val His Lys Pro Thr Leu Ala Ala Lys Arg Pro Ala Ile Val 245 250 255 Arg Arg Asn Met Gly Ser Lys Lys Val Arg Met Val Tyr Ala Asp Ser 260 265 270 Arg Glu His Gly Glu Gln Val Arg Ile Glu Asp Val Ala Glu Ala Glu 275 280 285 Arg Asp Arg Phe Cys Leu Ser Asp Ala Glu Val Glu Ala Leu Ala His 290 295 300 Gln Ala Val Leu Ile Glu Gln His Tyr Lys Arg Pro Met Asp Ile Glu 305 310 315 320 Trp Ala Lys Asp Gly His Thr Gly Lys Leu Phe Ile Val Gln Ala Arg 325 330 335 Pro Glu Thr Val Arg Ser Asn Gly Gln Val Met Glu Arg Tyr Ser Leu 340 345 350 Gln Gly Gln Gly Lys Val Val Ile Glu Gly Arg Ala Ile Gly His Arg 355 360 365 Ile Gly Ala Gly Thr Val Lys Val Ile His Asp Ile Ser Glu Met Asn 370 375 380 Arg Ile Glu Lys Gly Asp Val Leu Val Thr Asp Met Thr Asp Pro Asp 385 390 395 400 Trp Glu Pro Ile Met Lys Lys Ala Ser Ala Ile Val Thr Asn Arg Gly 405 410 415 Gly Arg Thr Cys His Ala Ala Ile Ile Ala Arg Glu Leu Gly Ile Pro 420 425 430 Ala Val Val Gly Cys Gly Asp Ala Thr Glu Arg Leu Lys Glu Gly His 435 440 445 Thr Val Thr Val Ser Cys Ala Glu Gly Asp Thr Gly Tyr Val Tyr Asp 450 455 460 Glu Leu Leu Asp Phe Asp Val Thr Ser Ser Gln Val Asp Thr Met Pro 465 470 475 480 Asp Leu Pro Leu Lys Ile Met Met Asn Val Gly Asn Pro Asp Arg Ala 485 490 495 Phe Asp Phe Ala Cys Leu Pro Asn Glu Gly Val Gly Leu Ala Arg Leu 500 505 510 Glu Phe Ile Ile Asn Arg Met Ile Gly Val His Pro Lys Ala Leu Leu 515 520 525 Glu Phe Asp Gln Gln Thr Pro Glu Leu Gln Lys Gln Ile Arg Gln Met 530 535 540 Met Lys Gly Phe Asp Asp Pro Val Glu Phe Tyr Ile Ala Arg Leu Thr 545 550 555 560 Glu Gly Ile Ala Thr Leu Gly Ala Ala Phe Ala Pro Lys Arg Val Ile 565 570 575 Val Arg Leu Ser Asp Phe Lys Thr Asn Glu Tyr Ala Asn Leu Val Gly 580 585 590 Gly Glu Arg Tyr Glu Pro Glu Glu Glu Asn Pro Met Leu Gly Phe Arg 595 600 605 Gly Ala Gly Arg Tyr Val Ser Glu Ser Phe Arg Asp Cys Phe Ala Leu 610 615 620 Glu Cys Glu Ala Val Lys Arg Val Arg Asn Glu Met Gly Leu Thr Asn 625 630 635 640 Val Glu Ile Met Val Pro Phe Val Arg Thr Val Asp Gln Ala Gln Ala 645 650 655 Val Val Glu Glu Leu Gly Arg Gln Gly Leu Lys Arg Gly Glu Asn Gly 660 665 670 Leu Lys Val Ile Met Met Cys Glu Ile Pro Ser Asn Ala Leu Leu Ala 675 680 685 Glu Gln Phe Leu Gln His Phe Asp Gly Phe Ser Ile Gly Ser Asn Asp 690 695 700 Met Thr Gln Leu Ala Leu Gly Leu Asp Arg Asp Ser Gly Val Val Ser 705 710 715 720 Ala Leu Phe Asp Glu Arg Asn Glu Ala Val Lys Ala Leu Leu Ser Met 725 730 735 Ala Ile Gln Ala Ala Lys Lys Gln Gly Lys Tyr Val Gly Ile Cys Gly 740 745 750 Gln Gly Pro Ser Asp His Gln Asp Phe Ala Ala Trp Leu Met Glu Gln 755 760 765 Gly Ile Asp Ser Leu Ser Leu Asn Pro Asp Thr Val Val Glu Thr Trp 770 775 780 Leu Ser Leu Ala Ala Leu Asn Lys Pro Ala 785 790 <210> 5 <211> 2379 <212> DNA <213> Escherichia coli <400> 5 atgtccaaca atggctcgtc accgctggtg ctttggtata accaactcgg catgaatgat 60 gtagacaggg ttgggggcaa aaatgcctcc ctgggtgaaa tgattactaa tctttccgga 120 atgggtgttt ccgttccgaa tggtttcgcc acaaccgccg acgcgtttaa ccagtttctg 180 gaccaaagcg gcgtaaacca gcgcatttat gaactgctgg ataaaacgga tattgacgat 240 gttactcagc ttgcgaaagc gggcgcgcaa atccgccagt ggattatcga cactcccttc 300 cagcctgagc tggaaaacgc catccgcgaa gcctatgcac agctttccgc cgatgacgaa 360 aacgcctctt ttgcgatgcg ctcctccgcc accgcagaag atatgccgga cgcttctttt 420 gccggtcagc aggaaacctt cctcaacgtt cagggttttg acgccgttct cgtggcagtg 480 aaacatgtat ttgcttctct gtttaacgat cgcgccatct cttatcgtgt gcaccagggt 540 tacgatcacc gtggtgtggc gctctccgcc ggtgttcaac ggatggtgcg ctctgacctc 600 gcatcatctg gcgtgatgtt ctccattgat accgaatccg gctttgacca ggtggtgttt 660 atcacttccg catggggcct tggtgagatg gtcgtgcagg gtgcggttaa cccggatgag 720 ttttacgtgc ataaaccgac actggcggcg aatcgcccgg ctatcgtgcg ccgcaccatg 780 gggtcgaaaa aaatccgcat ggtttacgcg ccgacccagg agcacggcaa gcaggttaaa 840 atcgaagacg taccgcagga acagcgtgac atcttctcgc tgaccaacga agaagtgcag 900 gaactggcaa aacaggccgt acaaattgag aaacactacg gtcgcccgat ggatattgag 960 tgggcgaaag atggccacac cggtaaactg ttcattgtgc aggcgcgtcc ggaaaccgtg 1020 cgctcacgcg gtcaggtcat ggagcgttat acgctgcatt cacagggtaa gattatcgcc 1080 gaaggccgtg ctatcggtca tcgcatcggt gcgggtccgg tgaaagtcat ccatgacatc 1140 agcgaaatga accgcatcga acctggcgac gtgctggtta ctgacatgac cgacccggac 1200 tgggaaccga tcatgaagaa agcatctgcc atcgtcacca accgtggcgg tcgtacctgt 1260 cacgcggcga tcatcgctca tgaactgggc attccggcga tagtgggctg tggagatgca 1320 acagaacgga tgaaagacgg tgagaacgtc actgtttctt gtgccgaagg tgataccggt 1380 tacgtctatg cggagttgct ggaatttagc gtgaaaagct ccagcgtaga aacgatgccg 1440 gatctgccgt tgaaagtgat gatgaacgtc ggtaacccgg accgtgcttt cgacttcgcc 1500 tgcctaccga acgaaggcgt gggccttgcg cgtctggaat ttatcatcaa ccgtatgatt 1560 ggcgtccacc cacgcgcact gcttgagttt gacgatcagg aaccgcagtt gcaaaacgaa 1620 atccgcgaga tgatgaaagg ttttgattct ccgcgtgaat tttacgttgg tcgtctgact 1680 gaagggatcg cgacgctggg tgccgcgttt tatccgaagc gcgtcattgt ccgtctctct 1740 gattttaaat cgaacgaata tgccaacctg gtcggtggtg agcgttacga gccagatgaa 1800 gagaacccga tgctcggctt ccgtggcgcg ggccgctatg tttccgacag cttccgcgac 1860 tgtttcgcgc tggagtgtga agcagtgaaa cgtgtgcgca acgacatggg actgaccaac 1920 gttgagatca tgatcccgtt cgtgcgtacc gtagatcagg cgaaagcggt ggttgaagaa 1980 ctggcgcgtc aggggctgaa acgtggcgag aacgggctga aaatcatcat gatgtgtgaa 2040 atcccgtcca acgccttgct ggccgagcag ttcctcgaat atttcgacgg cttctcaatt 2100 ggctcaaacg atatgacgca gctggcgctc ggtctggacc gtgactccgg cgtggtgtct 2160 gaattgttcg atgagcgcaa cgatgcggtg aaagcactgc tgtcgatggc tatccgtgcc 2220 gcgaagaaac agggcaaata tgtcgggatt tgcggtcagg gtccgtccga ccacgaagac 2280 tttgccgcat ggttgatgga agaggggatc gatagcctgt ctctgaaccc ggacaccgtg 2340 gtgcaaacct ggttaagcct ggctgaactg aagaaataa 2379 <210> 6 <211> 792 <212> PRT <213> Escherichia coli <400> 6 Met Ser Asn Asn Gly Ser Ser Pro Leu Val Leu Trp Tyr Asn Gln Leu 1 5 10 15 Gly Met Asn Asp Val Asp Arg Val Gly Gly Lys Asn Ala Ser Leu Gly 20 25 30 Glu Met Ile Thr Asn Leu Ser Gly Met Gly Val Ser Val Pro Asn Gly 35 40 45 Phe Ala Thr Thr Ala Asp Ala Phe Asn Gln Phe Leu Asp Gln Ser Gly 50 55 60 Val Asn Gln Arg Ile Tyr Glu Leu Leu Asp Lys Thr Asp Ile Asp Asp 65 70 75 80 Val Thr Gln Leu Ala Lys Ala Gly Ala Gln Ile Arg Gln Trp Ile Ile 85 90 95 Asp Thr Pro Phe Gln Pro Glu Leu Glu Asn Ala Ile Arg Glu Ala Tyr 100 105 110 Ala Gln Leu Ser Ala Asp Asp Glu Asn Ala Ser Phe Ala Met Arg Ser 115 120 125 Ser Ala Thr Ala Glu Asp Met Pro Asp Ala Ser Phe Ala Gly Gln Gln 130 135 140 Glu Thr Phe Leu Asn Val Gln Gly Phe Asp Ala Val Leu Val Ala Val 145 150 155 160 Lys His Val Phe Ala Ser Leu Phe Asn Asp Arg Ala Ile Ser Tyr Arg 165 170 175 Val His Gln Gly Tyr Asp His Arg Gly Val Ala Leu Ser Ala Gly Val 180 185 190 Gln Arg Met Val Arg Ser Asp Leu Ala Ser Ser Gly Val Met Phe Ser 195 200 205 Ile Asp Thr Glu Ser Gly Phe Asp Gln Val Val Phe Ile Thr Ser Ala 210 215 220 Trp Gly Leu Gly Glu Met Val Val Gln Gly Ala Val Asn Pro Asp Glu 225 230 235 240 Phe Tyr Val His Lys Pro Thr Leu Ala Ala Asn Arg Pro Ala Ile Val 245 250 255 Arg Arg Thr Met Gly Ser Lys Lys Ile Arg Met Val Tyr Ala Pro Thr 260 265 270 Gln Glu His Gly Lys Gln Val Lys Ile Glu Asp Val Pro Gln Glu Gln 275 280 285 Arg Asp Ile Phe Ser Leu Thr Asn Glu Glu Val Gln Glu Leu Ala Lys 290 295 300 Gln Ala Val Gln Ile Glu Lys His Tyr Gly Arg Pro Met Asp Ile Glu 305 310 315 320 Trp Ala Lys Asp Gly His Thr Gly Lys Leu Phe Ile Val Gln Ala Arg 325 330 335 Pro Glu Thr Val Arg Ser Arg Gly Gln Val Met Glu Arg Tyr Thr Leu 340 345 350 His Ser Gln Gly Lys Ile Ile Ala Glu Gly Arg Ala Ile Gly His Arg 355 360 365 Ile Gly Ala Gly Pro Val Lys Val Ile His Asp Ile Ser Glu Met Asn 370 375 380 Arg Ile Glu Pro Gly Asp Val Leu Val Thr Asp Met Thr Asp Pro Asp 385 390 395 400 Trp Glu Pro Ile Met Lys Lys Ala Ser Ala Ile Val Thr Asn Arg Gly 405 410 415 Gly Arg Thr Cys His Ala Ala Ile Ile Ala His Glu Leu Gly Ile Pro 420 425 430 Ala Ile Val Gly Cys Gly Asp Ala Thr Glu Arg Met Lys Asp Gly Glu 435 440 445 Asn Val Thr Val Ser Cys Ala Glu Gly Asp Thr Gly Tyr Val Tyr Ala 450 455 460 Glu Leu Leu Glu Phe Ser Val Lys Ser Ser Ser Val Glu Thr Met Pro 465 470 475 480 Asp Leu Pro Leu Lys Val Met Met Asn Val Gly Asn Pro Asp Arg Ala 485 490 495 Phe Asp Phe Ala Cys Leu Pro Asn Glu Gly Val Gly Leu Ala Arg Leu 500 505 510 Glu Phe Ile Ile Asn Arg Met Ile Gly Val His Pro Arg Ala Leu Leu 515 520 525 Glu Phe Asp Asp Gln Glu Pro Gln Leu Gln Asn Glu Ile Arg Glu Met 530 535 540 Met Lys Gly Phe Asp Ser Pro Arg Glu Phe Tyr Val Gly Arg Leu Thr 545 550 555 560 Glu Gly Ile Ala Thr Leu Gly Ala Ala Phe Tyr Pro Lys Arg Val Ile 565 570 575 Val Arg Leu Ser Asp Phe Lys Ser Asn Glu Tyr Ala Asn Leu Val Gly 580 585 590 Gly Glu Arg Tyr Glu Pro Asp Glu Glu Asn Pro Met Leu Gly Phe Arg 595 600 605 Gly Ala Gly Arg Tyr Val Ser Asp Ser Phe Arg Asp Cys Phe Ala Leu 610 615 620 Glu Cys Glu Ala Val Lys Arg Val Arg Asn Asp Met Gly Leu Thr Asn 625 630 635 640 Val Glu Ile Met Ile Pro Phe Val Arg Thr Val Asp Gln Ala Lys Ala 645 650 655 Val Val Glu Glu Leu Ala Arg Gln Gly Leu Lys Arg Gly Glu Asn Gly 660 665 670 Leu Lys Ile Ile Met Met Cys Glu Ile Pro Ser Asn Ala Leu Leu Ala 675 680 685 Glu Gln Phe Leu Glu Tyr Phe Asp Gly Phe Ser Ile Gly Ser Asn Asp 690 695 700 Met Thr Gln Leu Ala Leu Gly Leu Asp Arg Asp Ser Gly Val Val Ser 705 710 715 720 Glu Leu Phe Asp Glu Arg Asn Asp Ala Val Lys Ala Leu Leu Ser Met 725 730 735 Ala Ile Arg Ala Ala Lys Lys Gln Gly Lys Tyr Val Gly Ile Cys Gly 740 745 750 Gln Gly Pro Ser Asp His Glu Asp Phe Ala Ala Trp Leu Met Glu Glu 755 760 765 Gly Ile Asp Ser Leu Ser Leu Asn Pro Asp Thr Val Val Gln Thr Trp 770 775 780 Leu Ser Leu Ala Glu Leu Lys Lys 785 790 <210> 7 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 7 atgtccaaca atggctcgtc accgctggtg gtgtaggctg gagctgcttc 50 <210> 8 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 8 ttatttcttc agttcagcca ggcttaacca ctgtcaaaca tgagaattaa 50 <210> 9 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 9 attgtcgaag agagcagatt tg 22 <210> 10 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 10 ttaacgcagg atgtctgtga ag 22 <210> 11 <211> 69 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 11 atgtccaata aaggcgaaca gccgttagta ctttggtaca accagcttgg tgtaggctgg 60 agctgcttc 69 <210> 12 <211> 69 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 12 tcaggcgggt ttgtttagcg ccgccaggct taaccaggtt tccaccacgc tgtcaaacat 60 gagaattaa 69 <210> 13 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 13 ggcgcaattc tgaaactgtg tc 22 <210> 14 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 14 aaagaattgc tgtgtgtagt ct 22 <210> 15 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 15 atgtccaaca atggctcgtc accgctggtg cctcacgctg ccgcaagcac 50 <210> 16 <211> 51 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 16 ttatttcttc agttcagcca ggcttaacca agaacaactg ttcaccgtta g 51 <210> 17 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 17 caaaccgttc atttatcaca 20 <210> 18 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 18 catcttcggg gatcacataa c 21

Claims

- KEGG 데이터베이스의 번호 EC 2.7.9.2에 의해 식별되는 효소 부류의 상대적 효소 활성이 비활성화되거나 또는 야생형 효소의 특이적 활성에 비해 감소되며,
- KEGG 데이터베이스의 번호 EC 2.7.9.2에 의해 식별되는 효소 부류의 야생형 효소 활성을 갖는 미생물 균주와 비교하여 증가된 양의 L-시스테인을 형성하고,
상기 효소 활성을 코딩하는 유전자가 ppsA에 의해 식별되는 것을 특징으로 하는 L-시스테인의 발효 생산에 적합한 미생물 균주.
제1항에 있어서, 미생물 균주는 엔테로박테리아과(Enterobacteriaceae family) 또는 코리네박테리아과(Corynebacteriaceae family)로부터의 균주인 것을 특징으로 하는 미생물 균주.
제1항 또는 제2항에 있어서, 미생물 균주는 에셰리키아 콜리(Escherichia coli), 판토에아 아나나티스(Pantoea ananatis) 및 코리네박테리움 글루타미쿰(Corynebacterium glutamicum)으로 이루어진 군으로부터 선택되는 것을 특징으로 하는 미생물 균주.
제1항 내지 제3항 중 어느 한 항에 있어서, 미생물 균주는 에셰리키아 콜리 및 판토에아 아나나티스로 이루어진 군으로부터 선택되는 것을 특징으로 하는 미생물 균주.
제1항 내지 제4항 중 어느 한 항에 있어서, 미생물 균주는 종 에셰리키아 콜리의 균주인 것을 특징으로 하는 미생물 균주.
제1항 내지 제5항 중 어느 한 항에 있어서, ppsA 유전자 내에 적어도 하나의 돌연변이를 함유하는 것을 특징으로 하는 미생물 균주.
제6항에 있어서, 돌연변이된 유전자는 에셰리키아 콜리로부터의 ppsA 유전자, 판토에아 아나나티스로부터의 ppsA 유전자, 및 이들 유전자와 상동성인 유전자로 이루어진 군으로부터 선택되는 것을 특징으로 하는 미생물 균주.
제6항 또는 제7항에 있어서, ppsA 유전자의 코딩 DNA 서열은 서열번호: 5인 것을 특징으로 하는 미생물 균주.
제1항 내지 제8항 중 어느 한 항에 있어서, 이러한 균주에서, KEGG 데이터베이스의 번호 EC 2.7.9.2에 의해 식별되는 효소 부류의 상대적 효소 활성은 야생형 효소의 특이적 활성에 비해 적어도 25% 감소되는 것을 특징으로 하는 미생물 균주.
제1항 내지 제8항 중 어느 한 항에 있어서, 이러한 균주에서, KEGG 데이터베이스의 번호 EC 2.7.9.2에 의해 식별되는 효소 부류의 상대적 효소 활성은 야생형 효소의 특이적 활성에 비해 적어도 70% 감소되는 것을 특징으로 하는 미생물 균주.
제1항 내지 제8항 중 어느 한 항에 있어서, KEGG 데이터베이스의 번호 EC 2.7.9.2에 의해 식별되는 효소 부류의 효소 활성을 갖지 않는 것을 특징으로 하는 미생물 균주.
제1항 내지 제11항 중 어느 한 항의 미생물 균주가 사용되는 것을 특징으로 하는, L-시스테인을 생산하기 위한 발효 방법.